31 de outubro de 2009

Metagenoma de...cocô humano!




ResearchBlogging.org
Já que tenho que escrever um relatório sobre uma série de artigos para uma disciplina, vou aproveitar para comentar alguns aqui. E este título não é uma piada! Os autores fizeram uma análise metagenômica do intestino distal humano, usando amostras de fezes como fonte de DNA.

A metagenômica consiste em sequenciar o DNA de uma comunidade de microorganismos encontrados em um determinado ambiente. Por exemplo, o solo, a água de um rio ou a água presente nas fontes hidrotermais são exemplos de microambientes que poderiam ser estudados desta forma. Portanto, a metagenômica se dedica a sequenciar, ao mesmo tempo, o DNA de todos os organismos presentes em um microambiente, sem fazer distinções.

Esta abordagem é interessante, pois, é difícil isolar os microorganismos do ambiente e cultivá-los separadamente em laboratório para então estudar seus genomas. Na verdade, a maioria deles não pode ser cultivado em laboratório. E os autores do artigo que comento usaram esta abordagem para estudar os microorganismos presentes no intestino humano, sequenciando o DNA extraído de fezes, que são em grande parte  formadas por bactérias que antes lá estavam.

Bom, mas o que fazer com um monte de sequências que não sabemos nem de que espécies são? Esta é a parte que achei mais interessante no trabalho. Como era de se esperar, eles avaliaram a diversidade de microorganismos presentes nas amostras, mas este não foi o foco do trabalho. Após identificar a função dos genes seqüenciados e de quais vias metabólicas participam, eles se concentraram em fazer uma análise comparativa entre o metabolismo humano e o dos microorganismos presentes no intestino distal.

E eles viram que a variedade de vias metabólicas executadas pelos nossos “microorganismos de estimação” é muito maior que aquela presente no nosso genoma. E o mais importante, que muitas das enzimas destas bactérias exercem funções importantes para o bom funcionamento do nosso organismo. Só para ter uma idéia, o nosso metabolismo não tem a maior parte das enzimas necessárias para degradar certos polissacarídeos de origem vegetal e os autores deste trabalho encontraram ao menos 81 diferentes famílias de enzimas que degradam estes compostos entre os genes dos microorganismos presentes no nosso intestino distal. Também foi visto uma grande diversidade de genes para enzimas relacionadas ao metabolismo de fibras e produção de ácidos graxos de cadeia curta, que representam até 10% das calorias que extraímos da nossa dieta por dia e que sem estas bactérias não seriam aproveitadas pelo nosso organismo. Estes ácidos graxos são a principal fonte de energia para as células do intestino e, portanto, são importantes para o fortalecimento da mucosa intestinal. 

Mas este é um trabalho inicial, onde foram analisadas apenas as fezes de duas pessoas saudáveis, mas que abre as portas para muitas perguntas que poderiam ser respondidas também através da metagenômica. Como de que forma, doenças, a dieta, o consumo de remédios e outros dos nossos hábitos, influenciariam e/ou modificariam o metabolismo microbiano no intestino? 

Este artigo me fez ver, ainda mais, quanta informação pode ser tirada de um punhado de sequências de DNA quando se faz a pergunta certa e se sabe quais ferramentas usar! E ,é claro, acho que ninguém mais verá seus excrementos da mesma forma! Digam "muito obrigado" antes de dar a descarga! 

Gill, S. (2006). Metagenomic Analysis of the Human Distal Gut Microbiome Science, 312 (5778), 1355-1359 DOI: 10.1126/science.1124234

23 de outubro de 2009

"Genes órfãos": os mestres no jogo da evolução




Mangue (Estuário)


ResearchBlogging.org A diversidade biológica é algo impressionante. A quantidade de espécies explorando os mais variados ambientes é imensa. Alguns organismos vivem no fundo do oceano, a milhares de metros de profundidade, na ausência de luz, com poucos nutrientes disponíveis e suportando pressões elevadíssimas. Outros se especializaram em viver dentro de um outro organismo, como as milhares de bactérias que habitam nosso corpo, algumas causando doenças, mas a maioria mantendo conosco uma relação amigável. Outros exemplos incluem espécies que vivem em ambientes de transição entre um rio e o mar, chamados estuários. Ao contrário dos ambientes citados anteriormente, que são extremos, o estuário é um ambiente no qual é difícil de se viver por um motivo diferente: está sempre mudando, pois está sobre a influência das marés. Quando a maré sobe, há uma maior quantidade de água salgada e menor de água doce, proveniente do rio e quando baixa, esse quadro se inverte. Assim,  a quantidade de sal na água varia com a maré,  aumenta e baixa, mas nunca chega ser totalmente doce ou salgada, é algo intermediário, salobra. Além disso, também em função da maré, as margens  ora estão expostas ao ar, ora, alagadas. Mas mesmo sendo um ambiente tão instável nele encontramos plantas, peixes, crustáceos, minhas queridas ostras e ainda muitos outros organismos que de alguma forma lidam com estas variações e ali vivem muito bem.

Diante de toda esta diversidade biológica, de qual citei apenas alguns exemplos, e de adaptações necessárias para ocupar ambientes tão diferentes era de se esperar que as sequências de DNA fossem igualmente diversas. Mas não são. E esse é um dos grandes paradoxos da biologia atual. Espécies completamente diferentes têm muito mais em comum do que se esperava. E muito se tem discutido sobre as origens genéticas da diversidade biológica. No primeiro post que escrevi sobre isso, discuti como os mecanismos de controle de expressão gênica poderiam colaborar com a geração desta diversidade.

No entanto, ironicamente, os biólogos moleculares têm dado muita atenção ao que os organismos têm em comum e pouca ou nenhuma ao que têm de diferente. Como disse no último post, muitos genomas foram ou estão sendo sequenciados. Até então, todos eles apresentam uma proporção de genes (algo em torno de 10-20%) que não se assemelham a nenhum outro gene já descrito, são os chamados "genes órfãos". Pouco se discute sobre o papel destes genes na biologia destes organismos e sobre as suas implicações evolutivas.

Um artigo muito interessante, cuja indicação peguei em um outro blog, discute a questão destes genes que são órfãos apenas da atenção dos biológos moleculares. O artigo discute alguns pontos sobre estes "genes taxonomicamente restritos" (TRGs - Taxonomically Restricted Genes), uma nomeclatura mais cuidadosa que considera a sua distribuição restrita a um táxon. O artigo discute que alguns genes seriam de fato espécie-específicos, enquanto outros estariam presentes também em outras espécies de um mesmo grupo taxonômico, mas tal homologia não teria sido ainda identificada, uma vez que a maioria das espécies não teve ainda seu genoma sequenciado.

Os TRGs estariam relacionados com as "novidades evolutivas" de cada espécie ou grupo, que são algumas das características que os taxonomistas usam para diferenciar uma espécie da outra. Diante de mudanças no ambiente, estes genes podem ter sido críticos, ao conferir alguma vantagem para o organismo explorar aquele novo ambiente e estariam relacionados com adaptações espécie-específicas. Como exemplo são citados alguns TRGs  que já foram associados com os nematocistos, estruturas exclusivas dos cnidários e de grande importância na captura de presas e como mecanismo de defesa.

Portanto, os TRGs junto com os diferentes mecanismos de controle da expressão gênica podem ser a força motora que ao longo da evolução gerou a diversidade biológica que tanto nos impressiona. O grande elefante branco é sabermos quais as funções destes genes, que proteínas eles codificam e a que adaptações estão relacionados. Acredito que muitos deles devem  estar diretamente ligados a forma como os organismos se relacionam e respondem a mudanças no ambiente, processos como  quimiorecepção, processos imunológicos e respostas a condições de estresse.

Por ora, eu só gostaria de saber quais são as funções dos 50% de "genes órfãos" que tenho encontrado nas espécies que estudo, uma das quais habita um ambiente estuarino e que portanto pode ter adaptações interessantes até então ignoradas. Mas que no que depender de mim, estes "genes órfãos" serão "adotados" :)

Leia também: O Jogo da Evolução.

Referência (vale a pena ler!)

Khalturin K, Hemmrich G, Fraune S, Augustin R, & Bosch TC (2009). More than just orphans: are taxonomically-restricted genes important in evolution? Trends in genetics : TIG, 25 (9), 404-13 PMID: 19716618


20 de outubro de 2009

Telefone sem fio


Um problema crescente que acontece quando tentamos identificar a função de um gene me lembrou uma brincadeira de criança: o telefone sem fio! Aquela brincadeira onde as crianças sentam-se uma do lado da outra e a primeira da fila diz uma mensagem (bem baixinho) no ouvido da segunda que deve repetí-la para a terceira até chegar a última que tem que dizer a mensagem em voz alta, que geralmente já está bem diferente da original! É a velha história do "quem conta um conto, aumenta um ponto"! O mesmo tem acontecido com a anotação funcional de genes, o processo de identificação das funções associadas a um gene.


Atualmente, uma quantidade enorme de sequências de DNA está sendo produzida e depositadas nos bancos de dados, que já contém um número absurdo de sequências . Vários genomas já foram concluídos, outros tantos estão em andamento, assim como muitos projetos de sequenciamento de mRNA (cDNA). Isso tudo é muito bom, é claro! Mas um dos principais problemas atuais é lidar com esta quantidade imensa de informação e identificar onde estão os genes e quais as suas funções, como já discuti um pouco aqui.

Quando o sequenciamento de DNA não era ainda um "lugar-comum" e, consequemente, a velocidade com que novas sequências surgiam não era tão grande como hoje, muitos dos genes tinham sua função estudada experimentalmente,de maneira mais minuciosa. Mas em um mundo onde milhares de sequências podem ser produzidas por dia, não é mais possível fazer isso para todas as sequências geradas. 

Como a sequência de DNA determina a sequência de aminoácidos das proteínas e a função destas, em geral, depende da sua sequência, proteínas que tenham a mesma função, também devem ter a mesma sequência! Ou, ao menos, devem ser bem parecidas! E surge a era do "comparar para identificar", pois similaridade pode indicar homologia!Assim, hoje em dia ,quando identificamos uma nova sequência gênica, tentamos achar nos bancos de dados se já existe alguma outra sequência similar com uma função conhecida. O passo crucial é decidir se esta similaridade basta para dizermos que a nossa sequência até então desconhecida deve ter realmente as mesmas funções daquela com que é parecida. Para isso existem critérios, mas nem todos usam os mesmos critérios. Uns são extremamente rígidos enquanto outros deixam a coisa "correr solta". 


E assim começa o problema que chamei de "telefone sem fio":


Um primeiro pesquisador deposita no banco de dados uma sequência X, à qual atribuiu a função Y através de experimentos.

Um segundo pesquisador, com uma nova sequência em mãos (Z), descobre que ela é extremamente similar ao gene X e, então, inclui a nova sequência Z no banco de dados, como um gene de função Y também. 


Um terceiro pesquisador, com mais uma sequência nova (W), descobre que ela tem alguma similaridade com a sequência Z, mas esta similaridade não é tão grande assim, mas se encaixa nos "critérios" frouxos que ele estabeleceu. E ele também atribui à sua sequência W, a função Y, uma anotação possivelmente errada.


Um quarto pesquisador, por tabela, atribui à sua sequência N, extremamente similar a W, a função Y. Apesar de a similaridade ser verdadeira neste caso e de as sequências W e N serem provavelmente de fato homólogas, a função associada à elas é errada. 



 
 Cada cor representa um  nucleotídeo. Notem que os genes X e Z são bem semelhantes, enquanto que os genes Z e W, não, mas mesmo assim foram designados como homólogos e como tendo a mesma função. Os genes W e N são bastante semelhantes e, provavelmente, homólogos, mas não são homólogos de Z e X e, por isso, foram erroneamente identificados com a função Y (a função original de X). Pode parecer complicado, mas é apenas uma cadeia de comparações para ver quem é parecido com quem.


E esse erro vai ser passado para frente. E novos erros podem ser introduzidos nesta cadeia. Quanto mais perto da última "criança da fila", maior a chance de estar inferindo uma função errada.

Este problema tem sido agravado por ferramentas de "anotação eletrônica", usadas para identificar a função de novas sequências através de resultados de similaridade com sequências conhecidas, sem nenhuma avaliação manual feita por um pesquisador que poderia identificar casos onde a associação feita não é verdadeira.


Isso não quer dizer que não devemos lançar mão destas ferramentas. Elas são a única saída quando se tem 100, 1000 e até centenas de milhares de sequências em mãos. Mas temos que ser cuidadosos, não relaxar nossos critérios.

O Blast2GO sobre o qual já tanto falei aqui, mas nunca expliquei bem, é uma ferramenta para a anotação funcional de genes, principalmente de organismos modelo não tradicionais, como a ostra e a vieira que estudo. Como não há projetos genoma para estas espécies e outras  próximas é ainda mais difícil identificar suas sequências e os resutados das buscas por similaridades geralmente indicam sequências de organismos distantes filogeneticamente. Então, o cuidado tem que ser redobrado!

Através do Blast2GO é possível submeter as novas sequências a buscas por similaridade usando o algoritmo BLAST. O programa então identifica quais são as funções associadas às sequências similares, resultantes do BLAST, em diversos bancos de dados: os de termos de ontologia gênica (uma iniciativa bem legal, sobre a qual  um dia, ainda escreverei aqui), o de domínios conservados - regiões das proteínas que são particularmente importantes para alguma função - o banco de dados de enzimas, de vias metabólicas e por aí vai...

E a última etapa do Blast2GO é anotação funcional. Anotar ou não anotar, eis a questão. E neste momento, o blast2go é inovador, com a sua "regra de anotação". Para decidir se cada sequência deve ser associada a uma ou mais funções, o programa usa uma fórmula para determinar a anotação mais específica. Esta fórmula considera não apenas a percentagem de similaridade entre as sequências, como também o código de evidência, que indica de que forma aquela função foi atribuída a sequência similar ("a criança que estava antes na fila") penalizando anotações eletrônicas e dando pontos extras a anotações experimentais. Existindo ainda outras possibilidades de evidência para as quais se pode atribuir diferentes pesos na regra de anotação.


Assim, o Blast2GO nos ajuda a lidar com o problema do telefone sem fio, permitindo que se pese as evidências antes de bater o martelo e concluir a anotação. E é claro, sem perder a praticidade, milhares de sequências podem ser processadas por vez. Mas a regra de anotação é aberta e o pesquisador pode modifica-la de acordo com seus critérios. Então, o bom senso é e sempre será essencial.


--------------------------------------
Para saber mais sobre o Blast2GO: http://www.blast2go.org

Papers:


Stefan Götz, Juan Miguel García-Gómez, Javier Terol, Tim D. Williams, María José Nueda, Montserrat Robles, Manuel Talón, Joaquín Dopazo and Ana Conesa. High-throughput functional annotation and data mining with the Blast2GO suite.Nucleic Acids Res. 2008 June; 36(10): 3420–3435.

Ana Conesa, Stefan Götz, Juan Miguel García-Gómez, Javier Terol, Manuel Talón and Montserrat Robles. Blast2GO: A universal tool for annotation, visualization and analysis in functional genomics research.Bioinformatics 2005 21: 3674-3676


17 de outubro de 2009

Quantos genes você tem?


ResearchBlogging.org
Não necessariamente a mesma quantidade que eu! Nós temos todos os mesmos genes, mas não necessariamente a mesma quantidade deles. E isso pode fazer muita diferença! Deixe-me explicar.

Já sabemos que existem diferenças na sequência de DNA de diferentes pessoas. Afinal de contas, alguns de nós são altos, outros ruivos, outros tem olhos azuis enquanto muitos tem olhos castanhos. Vemos sempre nos telejornais e programas de TV que o DNA pode diferenciar você de qualquer outra pessoa na face da terra com 99,99% de confiabilidade.
Até então, sabíamos que existiam variações pequenas na sequência de DNA, ás vezes, de apenas um nucleotídeo, as "letras" do alfabeto do DNA. Sabíamos que algumas regiões do genoma poderiam estar organizadas de forma diferente em alguns indivíduos e que as pessoas podem possuir um diferente número de cópias de pequenas sequências que se repetem no genoma.
A novidade está em o quanto e como o DNA de diferentes indíviduos se distingue. Quando o projeto genoma humano foi concluído em 2003, acreditava-se que a diferença genética entre os indivíduos fosse algo em torno de 0.1-1%. Agora, a estimativa é que as diferenças cubram 5% do genoma humano. Parece pouco, mas não é, considerando-se que temos 3 bilhões de nucleotídeos constituindo nosso genoma. Mas a que se deve este aumento? A variação no número de cópias de algumas regiões do DNA.
Nós possuímos duas cópias de cada um dos 22 diferentes tipos de cromossomos chamados autossômicos, mais dois cromossomos sexuais: dois cromossomos X, se você for menina ou um cromossomo X e outro Y, se for menino. Portanto, temos 23 pares de cromossomos e a princípio herdamos duas cópias de cada um dos genes do genoma humano.
No entanto, estudos feitos nos últimos anos mostram que é bastante comum pessoas possuirem diferentes números de cópias de trechos do DNA que podem conter nenhum, um ou vários genes conhecidos. Por exemplo, nas populações européias e americanas, pessoas podem ter entre 2 e 15 cópias do gene AMY1 que codifica a amilase salivar, enzima presente na saliva e que digere amido.
Mas quais são as consequências funcionais destas variações? Depende dos genes que temos a mais ou a menos, assim como de onde as cópias extras estão localizadas no genoma, mas isso é assunto para mais um texto. No entanto, cientistas acreditam que estas variações podem aumentar a suscetibilidade dos indivíduos a doenças, como o câncer, algo que tem sido extensivamente estudado. Um exemplo das consequências funcionais deste tipo de variação é o caso do gene CYP2D6 que afeta o metabolismo de aproximidamente 50% das drogas, como analgésicos, antihistamínicos, antipsicóticos, etc, e apresenta uma grande variação de número de cópias entre indíviduos contribuindo em muito para a grande diferença observada entre as pessoas em relação ao metabolismo de tais medicamentos.
Tudo isso reforça o quanto o genoma é dinâmico, o quão pouco ainda o entendemos e que não basta apenas conhecermos a sequência de "letras" do DNA. Mas isso só significa que ainda temos muito a descobrir e muito trabalho a fazer!

Referências:
Wain, L., Armour, J., & Tobin, M. (2009). Genomic copy number variation, human health, and disease The Lancet, 374 (9686), 340-350 DOI: 10.1016/S0140-6736(09)60249-X

Dear, P. (2009). Copy-number variation: the end of the human genome? Trends in Biotechnology, 27 (8), 448-454 DOI: 10.1016/j.tibtech.2009.05.003

8 de outubro de 2009

Quebrem esta corrente!


Odeio correntes de internet. Todas elas. Sempre fico chocada com as inúmeras bobagens que circulam por aí e fico pensando como é possível alguém acreditar nestas coisas. Agora, acabo de receber um e-mail dizendo que se eu encaminhá-lo, o Bill Gates vai me pagar $243,0 para cada vez que o e-mail for novamente encaminhado. No mesmo e-mail, o "depoimento" de várias pessoas jurando de pé junto que é verdade, elas receberam um cheque com alguns milhares de dólares alguns dias depois! Para que trabalhar em um mundo em que para ficar rico basta encaminhar lixo para os amigos, não é mesmo? Mas não é o primeiro e-mail que recebo com este tipo de abobrinha. O que me chamou atenção, foi o que eles usaram nesse e-mail para dar "credibilidade" ao "fato":
"Saiu na revista Época repassem e lucre (sic), não é brincadeira"
"Muito estranho, mas recebi de várias pessoas confiáveis...
E mais, saiu na revista época!"

As pessoas acreditam na revista época (e similares como Veja, Superinteressante, etc). Embora eu não seja fã destas revistas, não estou dizendo que as mesmas só publiquem mentiras (apesar de que, quando publicam sobre ciência, as falhas serem frequentes). O problema é acreditar cegamente no que elas publicam. Falta senso crítico nas pessoas. Muita gente não se interessa por ciência a ponto de procurar por informações na internet e/ou revistas como estas e as poucas que o fazem não o fazem de forma crítica. Em parte, acredito que seja por que a maioria ainda vê a ciência com grande distanciamento, como algo que só os cientistas podem questionar ou criticar. Por isso, penso que um dos principais objetivos da divulgação científica tem que ser incentivar o questionamento e a crítica e ensinar critérios, o que, para mim, estão entre as melhores coisas que a ciência tem a oferecer e que de fato vai ajudar as pessoas a resolverem problemas e tomarem decisões de forma mais embasada no seu cotidiano....

...começando por usar de mais critérios ao escolher que e-mails encaminhar aos amigos! Correntes, não! 

"A ignorância afirma ou nega veementemente, a ciência duvida"
Voltaire

4 de outubro de 2009

Bioinformática: season finale


Como está evidente nos últimos posts, tenho suado um pouco com a bioinformática. Mas finalmente achei uma ferramenta bem legal e simples de usar para análise de sequências: ESTpiper.

O ESTpiper é uma ferramenta de web para analisar sequências de DNA desde a primeira etapa,  base calling, quando se extrai a sequência de nucleotídeos (e valores - scores - de qualidade do sequenciamento) a partir dos cromatogramas, passando pela etapa de trimming (que eles chamam de clearing) e que inclui remoção de trechos de baixa qualidade, de sequências do plasmídio, adaptadores e cauda poli A, indo adiante para a etapa de assembly, anotação e desenho de sondas para microarranjos.

É bem fácil: você envia seus arquivos pelo site (com atenção para os formatos compatíveis), ajusta os parâmetros conforme suas necessidades e você recebe um e-mail com o link para download dos resultados. O mais legal é que é possível submeter várias sequências de uma só vez, bastando compactá-las em formato ZIP, o que já salvou muitas horas de trabalho! Além disso, o ESTpiper usa programas como o Phred (basecalling), Lucy (trimming) e CAP3 (assembly) já amplamente utilizados para estes fins. Enfim, é um meio de usar o que há de melhor mas de um jeito bem "mamão com açúcar".

Eu estou usando o ESTpiper apenas até a etapa de assembly. Para anotação funcional, ainda fico com o Blast2GO, que tem muito mais recursos.

Referência:
Tang Z, Choi J, Hemmerich C, Sarangi A, Colbourne JK, Dong, Q (2009) ESTPiper – a web-based analysis pipeline for expressed sequence tags. BMC Genomics, 10:174.



Bookmark and Share