Como está evidente nos últimos posts, tenho suado um pouco com a bioinformática. Mas finalmente achei uma ferramenta bem legal e simples de usar para análise de sequências: ESTpiper.
O ESTpiper é uma ferramenta de web para analisar sequências de DNA desde a primeira etapa, base calling, quando se extrai a sequência de nucleotídeos (e valores - scores - de qualidade do sequenciamento) a partir dos cromatogramas, passando pela etapa de trimming (que eles chamam de clearing) e que inclui remoção de trechos de baixa qualidade, de sequências do plasmídio, adaptadores e cauda poli A, indo adiante para a etapa de assembly, anotação e desenho de sondas para microarranjos.
É bem fácil: você envia seus arquivos pelo site (com atenção para os formatos compatíveis), ajusta os parâmetros conforme suas necessidades e você recebe um e-mail com o link para download dos resultados. O mais legal é que é possível submeter várias sequências de uma só vez, bastando compactá-las em formato ZIP, o que já salvou muitas horas de trabalho! Além disso, o ESTpiper usa programas como o Phred (basecalling), Lucy (trimming) e CAP3 (assembly) já amplamente utilizados para estes fins. Enfim, é um meio de usar o que há de melhor mas de um jeito bem "mamão com açúcar".
Eu estou usando o ESTpiper apenas até a etapa de assembly. Para anotação funcional, ainda fico com o Blast2GO, que tem muito mais recursos.
Referência:
Tang Z, Choi J, Hemmerich C, Sarangi A, Colbourne JK, Dong, Q (2009) ESTPiper – a web-based analysis pipeline for expressed sequence tags. BMC Genomics, 10:174.