Mostrando postagens com marcador próxima geração de sequenciamento. Mostrar todas as postagens
Mostrando postagens com marcador próxima geração de sequenciamento. Mostrar todas as postagens

18 de março de 2012

Será o fim de Sanger?



A genética avançou grandes passos no século XX. Foi somente na década de 1920 que foi demonstrado que o DNA é a molécula portadora da informação genética e, menos de 100 anos depois, é impressionante o quanto descobrimos sobre como esta informação é codificada, traduzida, transmitida e regulada.

Como já falei por aqui, um marco importante na história da genética foi a invenção do sequenciamento de DNA em 1977 – um método que levou o nome do seu inventor, Sanger. Mas o reinado absoluto de Sanger começou a ruir na década de 2000, quando surgiu a próxima geração de sequenciadores (Next Generation Sequencing, NGS), baseados em novos e diferentes princípios químicos, como pirosequenciamento, Solid, Illumina e, mais recentemente, Ion Torrent. A grande diferença está na velocidade e capacidade de sequenciamento, muito superiores a tecnologia anterior. O genoma humano que levou 13 anos para ser concluído com o método de Sanger, agora pode ser sequenciado em apenas um dia. Um salto e tanto, não? E quando o céu parecia ser o limite, uma 3ª geração de sequenciadores já começa a surgir no horizonte, com a promissora tecnologia dos nanoporos.

Parece óbvio que chegou a hora de o método de Sanger sair de linha e pendurar suas chuteiras. Os novos sequenciadores irão eventualmente liderar projetos grandes de sequenciamento de genomas e transcriptomas inteiros. É uma questão de dinheiro. O custo por base sequenciada é bem menor nos novos sequenciadores, mas em compensação eles são menos flexíveis quanto à quantidade de bases sequenciadas, ou você sequencia muitos pares de base de uma vez, ou você não sequencia nada. E por isso, acredito que o Sanger irá cada vez mais assumir um papel secundário, sendo utilizado para preencher gaps em genomas ou em projetos pequenos, como para confirmar construções ou a identidade de produtos de PCR.

Mas, por enquanto, o sequenciamento de Sanger ainda é considerado o “padrão ouro” em acurácia. E para realmente se consolidarem no mercado, o custo para a implementação e manutenção das plataformas de NGS precisa se tornar mais acessível e estas novas tecnologias ainda precisam de otimização e, principalmente, mais validação. O tamanho das sequências produzidas precisa aumentar, o que já vem acontecendo de maneira consistente, e também é preciso desenvolver algoritmos mais precisos para inferir a qualidade das leituras (o que varia conforme a técnica), e para montagem e manipulação da grande quantidade de dados produzida.

Chegamos ao ponto de produzir muito, mas muito mais dados do que somos capazes de processar e, principalmente, explorar. E, mais do que produzir sequenciadores mais velozes, agora é mais importante melhorarmos e validarmos os já existentes e, principalmente, pensarmos em como vamos manipular, interpretar e aplicar todos estes dados para transformá-los em informações úteis.

29 de janeiro de 2010

"Eu vejo um novo começo de era"




2010. Estamos fechando a primeira década do milênio. E para a biologia molecular, este começo foi muito bom: cada vez mais aumenta o número de variáveis avaliadas por experimento. Genomas e mais genomas inteiros são seqüenciados, experimentos com milhares de genes e proteínas são feitos. Ao invés de olhar para cada gene separadamente, agora, podemos ver como todos os genes de um organismo se comportam ao mesmo tempo. Estamos na era das ômicas.

A ciência sempre estudou as partes como meio de entender o todo. Mas nem sempre as partes se encaixam ou podem ser corretamente interpretadas quando isoladas. Quando olhamos para o todo, temos a perspectiva correta para colocar todas as peças no lugar e entender todas as conexões da complexa e dinâmica rede de moléculas que regem uma célula.

Mas para olhar para o todo e, de fato, enxergar tudo, ainda é preciso desenvolver meios melhores de manejar e, principalmente, integrar dados heterogêneos derivados do genoma, do transcriptoma, do proteoma, do metaboloma...

Parece um quebra-cabeça infinito!

Enquanto ainda estamos aprendendo a lidar com tanta informação, estão surgindo novas técnicas de sequenciamento de DNA que prometem impulsionar ainda mais este salto, das partes para o todo. Por 30 anos, o método de sequenciamento de DNA de Sanger é usado por toda a comunidade científica. Desde a sua publicação, em 1977, este método foi otimizado e automatizado ao ponto de permitir o sequenciamento de todo o genoma humano, concluído em 2003.

No entanto, em relação ao custo e principalmente a velocidade de produção de sequências, a “próxima geração de sequenciamento” deixa o método Sanger no chinelo. Para se ter uma idéia, em uma única corrida em um destes novos equipamentos, é possível produzir uma quantidade de sequências para a qual seriam necessárias 50 corridas em um equipamento pelo método de Sanger. Um pequeno genoma bacteriano poderia ser seqüenciado em uma única corrida. É um salto tecnológico sem precedentes!

É claro que nem tudo são flores, a maioria destas tecnologias produz sequências tão curtas quanto 20pb, mas outras já chegam a 400pb e, possivelmente, este número ainda deve aumentar. O maior desafio tem sido gerar ferramentas de bionformática para lidar com estes dados, mas esta corrida também já foi lançada.

Estas técnicas já estão sendo aplicadas a diferentes questões, em estudos metagenômicos, no sequenciamento de genomas e transcritptomas, como meio de inferir os níveis de expressão gênica em organismos sem qualquer sequência conhecida e mesmo para estudar o acúmulo de mutações em escala genômica ao longo das gerações de uma linhagem bacteriana. Novamente: é um salto tecnológico sem precedentes!

Para quem se interessar, recomendo a leitura destes dois artigos:


Stephan C Schuster. Next-generation sequencing transforms today's biology. Nature methods 5: 16-18 (2008).