Google anunciou na quarta-feira (28) AlphaGenome, uma nova ferramenta de inteligência artificial voltada para a análise do genoma humano, com foco em compreender como extensas regiões de DNA influenciam a regulação gênica dentro das células. A iniciativa busca ir além de simplesmente ler o código genético, investigando os mecanismos que controlam quando, onde e como os genes são ativados ou silenciados no organismo, explica a Folha de São Paulo.
Durante a apresentação do AlphaGenome na revista Nature, o vice-presidente de pesquisa do Google DeepMind, Pushmeet Kohli, enfatizou que o sequenciamento completo do genoma humano, concluído em 2003, representou apenas o primeiro passo. “Decifrar todo o genoma humano em 2003 nos deu o livro da vida, mas lê-lo ainda é um desafio”, disse ele. Segundo ele, embora o texto genético esteja disponível — consistindo em cerca de 3 bilhões de pares de nucleotídeos —, entender sua “gramática” permanece uma das grandes fronteiras da ciência. “Temos o texto, mas entender a gramática e como ela governa a vida constitui a próxima grande fronteira da pesquisa”, disse Kohli.
Grande parte do DNA humano não codifica diretamente proteínas. Apenas cerca de 2% das sequências desempenham essa função essencial para o funcionamento dos organismos vivos. Os restantes 98% desempenham um papel regulatório complexo, atuando como um maestro que coordena, protege e ajusta a expressão gênica em cada célula. É precisamente nessas regiões que se concentram numerosas variantes associadas a doenças, e é esse território que o AlphaGenome propõe explorar. O novo modelo complementa outras ferramentas desenvolvidas pelo laboratório de inteligência artificial do Google, como AlphaMissense, focada na análise de sequências de DNA codificantes, AlphaProteo, dedicada ao design de proteínas, e AlphaFold, responsável por prever estruturas de proteínas e vencedor do Prêmio Nobel de Química em 2024. No caso do AlphaGenome, a inovação reside em sua capacidade de analisar longas sequências de DNA e prever como cada par de nucleotídeos influencia diferentes processos biológicos dentro da célula.
Baseado em técnicas de aprendizado profundo, o sistema foi treinado com dados de grandes consórcios públicos que realizaram medições experimentais em centenas de tipos de células e tecidos humanos e de camundongos. Essa base permitiu que o modelo aprendesse padrões complexos de regulação gênica e aplicasse esse conhecimento de forma integrada.
Antes do AlphaGenome, já existiam modelos capazes de estudar regiões regulatórias do DNA, mas eles enfrentavam limitações técnicas. Era necessário escolher entre analisar sequências longas com menor precisão ou focar em segmentos menores com resolução mais detalhada. Segundo Žiga Avsec, um dos coautores do projeto, compreender plenamente o ambiente regulatório de um gene requer a análise de sequências que podem chegar a até um milhão de pares de nucleotídeos. A nova ferramenta busca superar esse dilema combinando comprimento e precisão.
Outra característica distintiva do AlphaGenome é sua capacidade de modelar simultaneamente a influência do DNA em 11 processos biológicos distintos. Até agora, os pesquisadores precisavam recorrer a diferentes modelos para obter esse tipo de análise integrada. Para Natasha Latysheva, também coautora do estudo publicado na Nature, a ferramenta representa um avanço significativo. “Ela pode acelerar nossa compreensão do genoma ajudando a mapear a localização de elementos funcionais e determinar seus papéis no nível molecular”, disse ela.
Kohli também destacou o caráter colaborativo do projeto. “Esperamos que os pesquisadores o enriqueçam com mais dados e modalidades”, disse ele. Segundo o Google, o AlphaGenome já foi testado por aproximadamente 3.000 cientistas de 160 países e agora está disponível em código aberto para uso em pesquisas não comerciais. Especialistas externos avaliaram o modelo positivamente, mas com cautela. Ben Lehner, chefe de genômica generativa e sintética no Wellcome Sanger Institute, em Cambridge, afirmou que a ferramenta é muito eficaz, embora ainda tenha limitações. “Identificar com precisão as diferenças em nossos genomas que nos tornam mais ou menos suscetíveis a desenvolver milhares de doenças é um passo crucial para melhores tratamentos”, observou ele. Ao mesmo tempo, ele notou que “modelos de IA são apenas tão bons quanto os dados usados para treiná-los”, enfatizando que muitos conjuntos de dados disponíveis ainda são pequenos e pouco padronizados.
Avaliação semelhante foi feita por Robert Goldstone, chefe de genômica no Francis Crick Institute. Para ele, o AlphaGenome não deve ser visto como uma resposta definitiva para todas as questões da biologia, já que a expressão gênica também depende de fatores ambientais complexos. No entanto, ele considerou a ferramenta essencial para o avanço do campo. Segundo Goldstone, ela permitirá que os cientistas “estudem e simulem de forma programática a base genética de doenças complexas”, expandindo as possibilidades para pesquisa e compreensão do funcionamento do genoma humano.
Fonte: brasil247.com



