Bioinformática - PhyML: alinhamento de sequências nucleotídicas em ambiente paralelo

O PhyML é um software utilizado para se fazer estimativa e probabilidade filogênica em alinhamento de sequências nucleotídicas ou sequências de anino ácido. Atualmente está na versão 3.0, seu desenvolvimento teve participação de diversos cientistas de algumas universidades no mundo.

[ Hits: 25.037 ]

Por: José Cleydson Ferreira da Silva em 27/07/2010


Usando PhyML em linha de comando



Pode-se usar as os parâmetros em linha de comando para iniciar o PhyML, os mesmos conceitos de usabilidade podem ser aplicado em comandos, bastando colocar os parâmetros que caracterizem a necessidade de sua análise. O software pode ser iniciado da seguinte forma:

# ./phyml -i arquivo.phy

O manual pode ser encontrado com o comando ./phyml -h, uma série de parâmetros serão descritos abaixo.

-i ( --input) arquivo de sequência
sequência de nucleotídio ou aminoácido em formato PHYLIP (arquivo.phy)

-d (--datatype) nt
O tipo de dado pode ser nt para nucleotídio e aa para aminoácido

-q (--sequential)
Formato alteração intercalada para sequencial

-n (--multiple) 4
É o número inteiro indicando o numero de conjunto de dados para análise

-b (--bootstrap)

int > 0 : Numero de replicações bootstrap
int = 0 : Aproximação Verosimilhança sem computar valores de bootstrap
int = -1 : Taxa de aproximação de Verosimilhança retornando aLTR
int = -2 - Taxa de aproximação de Verosimilhança retornando métrica Chi2-based, suporte a brunch
int = -3 - Mínimo de métrica Chi2-based e suporte SH-like
int = -4 - Suporte Chi2-based sozinho

-m (--model) HKY85 (default)
Nome do modelo de substituição

Modelo baseado em nucleotídio: HKY85 (default) | JC69 | K80 | F81 | F84 | TN93 | GTR | custom

Modelo baseado em aminoácido: LG (default) WAG | JTT | MtREV | Dayhoff | DCMut | RtREV | CpREV | VT Blosum62 | MtMam | MtArt | HIVw | HIVb | custom

-f e, d, ou "fA fC fG Ft"
Nucleotídio de sequência de aminoácido

-e Sequências Nucleotídicas:
Sequências de Aminoácidos: São estimadas usando Máxima Verosimilhança

Sequência de Aminoácidos:
Aproximação por contagem de diferentes aminoácidos nos dados

-d Sequências Nucleotídicas:
Aproximação por contagem de diferentes aminoácidos nos alinhamento

Sequência de Aminoácidos:
Aproximação usando frequências definidas por modelo de substituição

- "fA fC fG fT"
Válido apenas para modelos de nucleotídios. fA, fC, fG e fT corresponde a A, C, G e T

-t (--ts/tv)
Taxa de transição e transversão. Apenas para sequências de DNA, pode-se fixar um valor positivo (4.0) ou o tipo e obter estimativa de Máxima Verosimilhança.

-v (--pinv)
Proporção de inviabilidade, pode ser definido o valor [0,1]

-c (--nclasses) nb subst cat =1
nb subst cat:
Valor inteiro positivo. Numero de substituição às Categorias.

-a (--alpha) gamma
gamma
Pode ser um valor positivo para o parâmetro gamma. Ou o valor de Máxima Verossimilhança

-s (--search) move
Opção de pesquisa na topologia da árvore. Podem ser:
NNI - Padrão
SPR - mais lento que NNI
BEST - A melhor opção de pesquisa que NNI e SPR

-u (--inputtree) nome da arquivo
O Arquivo precisa ser em formato newick

-o params
params: Parâmetro de otimização

params=tlr
t - Topologia da árvore
l - Comprimento Brunch
r - Parâmetros de substituição de taxas
n - Parâmetro não é otimizado


--rand start
Define o início da árvore aleatória, porém é valido apenas se a pesquisa SPR for realizada.

--n rand starts num
num é o número aleatórios de arvores que serão utilizados, validos para pesquisa SPR

--r seed num
Número de semente usada pelo gerador de números aleatórios

--print site lnl
Imprime em arquivos * phyml lk.txt o valores de Verosimilhança

--print trace
Imprime no arquivo * phyml trace.txt cada exploração filogênica durante o processamento de pesquisa em árvores.

Página anterior     Próxima página

Páginas do artigo
   1. Sumário - Sobre o PhyML
   2. Usando PhyML em linha de comando
   3. Instalando PHYML em ambiente paralelizado
   4. Sobre autor
Outros artigos deste autor

Os novos plugins do Compiz

Como migrar banco de dados MySQL para PostgreSQL

Cairo-Dock - Seu desktop Linux com cara de MAC

Economia e liberdade: o software livre une o útil ao agradável

Compiz - Conhecendo a fundo II

Leitura recomendada

Instalando o serviço de monitoramento Nagios

Compilando e instalando o recordMyDesktop no Linux Slackware

Cafe Con Leche (Gerenciador de Lan House e Cyber Café)

Configurando o CACIC (parte 2) - Atualizado

aMSN 0.98 com suporte a áudio e vídeo, pronto para vídeo e chamada

  
Comentários
[1] Comentário enviado por dailson em 28/07/2010 - 10:54h

Grande Kuruma!!

Parabéns pelo artigo. Apesar de eu não estar familiarizado com coisas como:
probabilidade filogênica
alinhamento de sequências nucleotídicas
sequências de anino ácido

Eu acho que isso irá e muito ajudar a comunidade do software livre.
E mais do que nunca

VIDA LONGA AO SL!!

Dailson Fernandes
http://www.dailson.com.br

[2] Comentário enviado por cleysinhonv em 28/07/2010 - 16:01h

Olá Dailson,

Grande Guerreiro, obrigado pelo incentivo meu camarada. Vou começar uma serie longa desses artigos, estou pensando em enviar um trabalho para o VOL DAY, em Bebedouro-SP, mas estou pensando se poderá ser aceito ou não. Esses artigos com certeza deram muito trabalho para validar a prática. Mas com certeza resolverá a vida dos Biologos e dos Bioinformatas.

Um abraço!


Contribuir com comentário




Patrocínio

Site hospedado pelo provedor HostGator.
Linux banner
Linux banner
Linux banner

Destaques

Artigos

Dicas

Viva o Android

Tópicos

Top 10 do mês

Scripts