14 Softwares para análises filogenéticas

Desde 1980, uma série de softwares vem sendo desenvolvidos para rodar análises filogenéticas.

Phylip

Hennig86

NONA

Base atualizada com lista de programas por seções.

14.1 MS-DOS

  • Diversos programas de análises filogenéticas foram desenvolvidos para o ambiente do DOS (Disk Operating System).

  • O prompt de comando do DOS shell é representado por C:\>.

    • A letra C refere-se à unidade de disco;
    • Os dois-pontos e a contra-barra indicam o caminho do diretório-raiz da unidade C.

Seleção do driver

c:

Acessa um diretório a partir do diretório atual:

cd [diretório]

Retorna um diretório:

cd..

Retorna ao diretório-raiz da unidade de disco:

cd/

Acessa um diretório:

cd/[diretório]

Exibe os diretórios e arquivos locais:

dir

…, lado a lado:

dir/w

…, pausadamente:

dir/p

…, lado a lado, pausadamente:

dir/w/p

Mostra todos os arquivos com determinada extensão:

dir *.[extensão]

Mostra os argumentos da função dir:

dir/?

14.2 IQ-TREE

  • O IQ-TREE é um dos programas mais utilizados para condução de análises filogenéticas baseada no método da Máxima verossimilhança.

  • Veja o Manual

  • A primeira versão foi lançada em 2011. O IQ-Tree é o sucessor dos softwares IQPNNI (desde 2004) e do TREE-PUZZLE (desde 1995).

14.2.1 Prática

  • Vamos testar o IQ-TREE utilizando o exemplo embutido no programa:
  1. Coloque os arquivo com a matriz alinhada no mesmo diretório que o programa IQ-Tree. Isso evita que se tenha de especificar o caminho do arquivo a ser lido (input).

  2. Realize uma análise-teste com o exemplo do próprio programa, o arquivo example.phy, mas antes abra-o em um editor de texto plano (como o Bloco de Notas do Windows) para verificar seu conteúdo.

  3. Em seguida, execute os comandos abaixo:

Lista completa de funções do programa

iqtree -h

Inferir a árvore de máxima verossimilhança utilizando o melhor modelo selecionado pelo ModelFinder

iqtree -s example.phy

Executar apenas a busca pelo melhor modelo utilizando o ModelFinder

iqtree -s example.phy -m MF

Executar diferentes métodos para estimação do suporte dos ramos

iqtree -s example.phy -alrt 10000 -bb 10000 -lbp 10000 -abayes


Exemplo com dados particionados (matriz combinada)

Arquivo input

iqtree -spp mimosa.nex

Reescrever os arquivos, apagando os dados previamente gerados

iqtree -spp mimosa.nex -redo

Seleção do terminal externo

iqtree -spp mimosa.nex -redo -o Mimosa_invisa_invisa

Métricas de suporte dos ramos

iqtree -spp mimosa.nex -redo -o invisa_invisa -allnni -alrt 10000 -bb 10000 -lbp 10000 -abayes -bnni

Estabelecendo constraints

iqtree -spp mimosa.nex -redo -o invisa_invisa -g mimosa.constr1

Concatenar arquivos

type mimosa0.nex.treefile mimosa1.nex.treefile mimosa2.nex.treefile mimosa3.nex.treefile > mimosa.treels

Executar os testes de topologia

iqtree -spp mimosa.nex -z mimosa.treels -o invisa_invisa -allnni -alrt 10000 -bb 10000 -abayes -lbp 10000 -bsam GENESITE -zb 10000 -au -zw

14.3 SplitsTree6

14.3.1 Prática

  • O arquivo .splits.nex gerado pelo IQ-TREE pode ser carregado pelo SplitsTree6 (Huson and Bryant, 2005), um programa com interface gráfica com usuário e simples de usar.

  • Diferentemente das árvores filogenéticas, as redes filogenéticas conseguem representar as incongruências e incertezas do conjunto total de árvores obtidas na análise filogenética, e são produzidas a partir de métodos de distância específicos. Trata-se de uma ferramenta exploratória interessante que tem sido utilizada até mesmo fora do campo da biologia comparativa.

14.4 MrBayes

  • A primeira versão do MrBayes (Huelsenbeck and Ronquist, 2001) foi lançada em 2000. Este talvez seja o mais conhecido programa de análise bayesiana para filogenias.

  • O MrBayes possui um console próprio onde são inseridas as linhas de comando.

  • O ideal é manter o arquivo da matriz de dados a ser analisada no mesmo diretório do MrBayes.

14.4.1 Prática 1

  • Abra o MrBayes e execute os comandos abaixo:

    Sobre o programa:

    about

    Citações dos diferentes módulos do programa:

    citations

    Gera um arquivo .txt com a referência completa das funções no diretório Documents:

    manual

    Exibe as principais funções do programa:

    help

  • Com a função “help” os diversos parâmetros são exibidos:

    Exibe explicação e os parâmetros do modelo de verossimilhança:

    help lset

    Exibe explicação e os parâmetros a prioris do modelo filogenético:

    help prset

    Exibe explicação e os parâmetros da análise MCMC:

    help mcmc

    Exibe explicação e os parâmetros da função sump:

    help sump

    Exibe explicação e os parâmetros da função sumt:

    help sumt

  • Execute uma análise filogenética utilizando o exemplo trazido pelo próprio MrBayes, o arquivo primatex.nex:

    Carrega dados do arquivo NEXUS

    execute primates.nex

    Altera o modelo evolutivo para GTR+G+I (Variação na taxa de substituição entre sítios de nucleotídeos proporção de sítios invariáveis)

    lset nst 6 rates=invgamma

    Conferir os parâmetros do modelo

    showmodel

    Para alterar os parâmetros do modelo, use prset, indique o nome do parâmetro, insira o símbolo de igual “=”, e indique o valor

    prset

    Inicia a análise Monte Carlo via cadeias de Markov alterando alguns parâmetros

    mcmc ngen=20000 samplefreq=100 printfreq=100 diagnfreq=1000

    Resume os valores dos parâmetros usando o mesmo burn-in que o diagnóstico no comando “mcmc”

    sump

    Resume as árvores usando o mesmo burn-in que o comando mcmc

    sumt

14.4.2 Prática 2: Modelo de substituição

  • Para especificação do modelo evolutivo, use o comando lset

  • Os parâmetros de modelo mais utilizads são:

    1. número de tipos de substituição
    • 1 = Jukes-Cantor
    • 2 = HKY
    • 6 = GTR
    1. modelo de variação de taxa entre sítios (sites)
    • I = Taxas de sítios invariáveis
    • G = Taxas de distribuição gama entre os sítios
    • I+G = Combinação
  • Para configurar o modelo GTR+G, use:

lset nst=6 rates=gamma

  • Para configurar o modelo GTR+G+I, use:

lset nst=6 rates=invgamma

  • O modelo de GTR+I+G geralmente se ajusta melhor aos dados.

Fonte: http://treethinkers.org/tutorials/mrbayes

  • Na versão mais recente do MrBayes (3.2.2) é possível evitar ter que especificar apenas um esquema de tipos de substituição, permitindo que MrBayes se mova por diferentes esquemas como parte de sua amostragem MCMC. Este procedimento é conhecido como salto reversível MCMC (RJ-MCMC).

  • Para configurar o salto reversível, use o seguinte comando:

lset nst=mixed rates=gamma

  • O salto reversível não está configurado atualmente para diferentes modelos de variação de taxa entre sítios.

14.4.3 Prática 3: Gerando o output

  • Depois de executar uma análise MCMC no MrBayes, certifique-se de que as cadeias de Markov convergiram através do software Tracer.

  • Exclua as amostras influenciadas pelo ponto de partida de uma análise MCMC através de um processo conhecido como descarte do burn-in.

  • A remoção do burn-in é feita especificando um valor para o parâmetro burnin de sump e sumt:

sump burnin=1000


sumt burnin=1000

14.5 Softwares para seleção de modelos evolutivos

14.6 raxmlGUI 2.0 + jModelTest 2

https://antonellilab.github.io/raxmlGUI/

14.6.1 PartitionFinder

PartitionFinder Os principais resultados são gravados no arquivo best_scheme.txt.