A IA de dobramento de proteínas da DeepMind resolve o maior problema da biologia

Prever a estrutura das proteínas é um dos grandes desafios da biologia – DeepMind

A empresa de inteligência artificial DeepMind transformou a biologia ao prever a estrutura de quase todas as proteínas conhecidas pela ciência em apenas 18 meses, um avanço que acelerará o desenvolvimento de medicamentos e revolucionará a ciência básica

A DeepMind previu a estrutura de quase todas as proteínas até agora catalogadas pela ciência, quebrando um dos grandes desafios da biologia em apenas 18 meses, graças a uma inteligência artificial chamada AlphaFold. Pesquisadores dizem que o trabalho já levou a avanços no combate à malária, resistência a antibióticos e resíduos plásticos, e pode acelerar a descoberta de novos medicamentos.

Determinar as formas amassadas de proteínas com base em suas sequências de aminoácidos constituintes tem sido um problema persistente por décadas na biologia. Alguns desses aminoácidos são atraídos por outros, alguns são repelidos pela água e as cadeias formam formas complexas que são difíceis de determinar com precisão.

A empresa de IA DeepMind, com sede no Reino Unido, anunciou pela primeira vez que desenvolveu um método para prever com precisão a estrutura das proteínas dobradas no final de 2020 e, em meados de 2021, revelou que havia mapeado 98,5% das proteínas usadas no corpo humano.

Hoje, a empresa anunciou que está publicando as estruturas de mais de 200 milhões de proteínas – quase todas catalogadas no repositório de pesquisa de proteínas mundialmente reconhecido, UniProt.

A DeepMind trabalhou com o Instituto Europeu de Bioinformática do Laboratório Europeu de Biologia Molecular (EMBL-EBI) para criar um armazenamento pesquisável de todas essas informações que podem ser acessadas de maneira fácil e gratuita por pesquisadores de todo o mundo. Ewan Birney, da EMBL-EBI, chama o AlphaFold Protein Structure Database de “um presente para a humanidade”.

“Como alguém que trabalha com genômica e biologia computacional desde a década de 1990, vi muitos desses momentos em que você pode sentir a paisagem mudando sob você e o fornecimento de novos recursos, e este foi um dos mais rápidos”, ele diz. “Quero dizer, há dois anos, simplesmente não percebemos que isso era viável.”

Já entregando resultados

Demis Hassabis, CEO da DeepMind, diz que o banco de dados torna a descoberta de uma estrutura de proteína – que antes costumava levar anos – “quase tão fácil quanto fazer uma pesquisa no Google”. A DeepMind é de propriedade da Alphabet, empresa controladora do Google.

O arquivo já foi usado por cientistas para avançar em pesquisas em diversas áreas. Matt Higgins, da Universidade de Oxford, e seus colegas estavam pesquisando uma proteína que acreditavam ser a chave para interromper o ciclo de vida do parasita da malária, mas estavam lutando para mapear sua estrutura.

“Um dos métodos experimentais que usamos é a cristalografia de raios X”, diz Higgins. “Fazemos com que as proteínas se formem em treliças, disparamos raios X sobre elas e obtemos informações desses padrões de difração de raios X para ver como é a molécula. Mas nunca conseguimos, apesar de muitos anos de trabalho, ver com detalhes suficientes como é essa molécula.”

Mas quando o AlphaFold foi lançado, deu uma previsão clara da estrutura da proteína que correspondia às informações que os pesquisadores conseguiram obter. Eles agora foram capazes de projetar novas proteínas que esperam que possam servir como uma vacina eficaz contra a malária.

Birley diz que usar cristalografia de raios-X para mapear a estrutura de uma proteína é caro e demorado. “Isso significa que os experimentalistas precisam fazer escolhas sobre o que fazem, e o AlphaFold não teve que fazer escolhas”, diz ele. “Acho que podemos estar confiantes de que há novos experimentos e novos insights devido ao AlphaFold, que afetarão – como esse parasita específico funciona? ou – por que essa doença específica acontece em humanos?, por exemplo”.

Os pesquisadores também usaram o AlphaFold para projetar novas enzimas para quebrar os resíduos plásticos e aprender mais sobre as proteínas que tornam as bactérias resistentes aos antibióticos.

Trabalho ainda sendo feito

Keith Willison, do Imperial College London, diz que o AlphaFold indiscutivelmente “mudou o mundo” da pesquisa biológica, mas que ainda há problemas a serem resolvidos no dobramento de proteínas.

“Assim que o AlphaFold saiu, foi maravilhoso. Você apenas pega suas proteínas favoritas e as procura agora, em vez de ter que fazer cristais”, diz ele. “Fiz a estrutura cristalográfica de um complexo proteico, levei cerca de oito anos. As pessoas estão brincando que os cristalógrafos vão ficar desempregados.”

Mas Willison aponta que o AlphaFold não é capaz de pegar qualquer sequência arbitrária de aminoácidos e modelar exatamente como eles se dobram. Em vez disso, só é capaz de usar partes de proteínas e suas estruturas que foram determinadas experimentalmente para prever como uma nova proteína se dobrará.

Embora a ferramenta seja geralmente extremamente precisa, suas estruturas são sempre previsões, e não resultados explicitamente calculados. O AlphaFold ainda não resolveu as interações complexas entre proteínas, ou mesmo fez um estrago em um pequeno subconjunto de estruturas, conhecidas como proteínas intrinsecamente desordenadas, que parecem ter padrões de dobramento instáveis e imprevisíveis.

“Uma vez que você descobre uma coisa, surgem mais problemas”, diz Willison. “É bastante aterrorizante, na verdade, como a biologia é complicada.”

Tomek Wlodarski, da University College London, diz que o AlphaFold teve um enorme impacto em muitas áreas da biologia, mas que há melhorias a serem feitas na precisão e que desenvolver um modelo de como as proteínas se dobram – não apenas prever sua estrutura final – é um desafio. problema que o DeepMind ainda precisa resolver.

Wlodarski diz que o AlphaFold não é perfeito, embora indique quais partes de uma previsão têm uma alta precisão e em quais são menos confiáveis.

“Introduzimos uma mutação, que sabemos experimentalmente desdobrar completamente a proteína, mas o AlphaFold me deu a mesma estrutura que deu sem essa mutação”, diz ele. “Fiz outro teste: estava removendo resíduos de uma extremidade da proteína, porque sabemos que com nossa proteína, se você cortar nove resíduos de uma das extremidades, ela desdobrará completamente a proteína. E consegui cortar metade da sequência da proteína, e o algoritmo ainda a previu como uma proteína completamente dobrada com exatamente a mesma estrutura. Então existem esses problemas.”

Pushmeet Kohli, que lidera a equipe científica da DeepMind, diz que a empresa ainda não terminou com as proteínas e está trabalhando para melhorar a precisão e os recursos do AlphaFold.

“Conhecemos a estrutura estática das proteínas, mas não é aí que o jogo termina”, diz ele. “Queremos entender como essas proteínas se comportam, qual é sua dinâmica, como elas interagem com outras proteínas. Depois, há a outra área da genômica em que queremos entender como a receita da vida se traduz em quais proteínas são criadas, quando são criadas e o funcionamento de uma célula.”


Publicado em 01/08/2022 07h36

Artigo original: