Codificando indels

Um fato geralmente observado após um alinhamento múltiplo, são as lacunas na matriz já alinhada. Essas lacunas são denominadas indels, que significa uma junção dos sufixos: inserções e deleções. Esses indels podem ser observados apenas nessa etapa, já que apenas através da comparação entre sequências é que podemos reconhecer uma mutação por inserção e deleções. O padrão de indels também pode ser informativos de parentesco. Existem métodos para codificação de indels (SIC, MCIC, 5th state) que também podem ser adicionados na matriz final. O software SeqState Müller (2005) é um programa open-source, eficiente, com interface simples, desenvolvido em Java, que pode ser utilizado para codificação automática de indels a partir dos três métodos.

SIC

Binário

MCIC

Multiestados

Prática

Müller, K. 2005. «SeqState: Primer Design and Sequence Statistics for Phylogenetic DNA Datasets». Applied Bioinformatics 4 (1): 65–69. https://doi.org/10.2165/00822942-200504010-00008.