A empresa DeepMind diz que pode prever a forma de cada proteína do corpo humano

As proteínas são estruturas complexas do corpo. Aqui, as bolhas coloridas e tortuosas representam diferentes proteínas do sistema imunológico na camada externa de uma célula T, um tipo de glóbulo branco que ajuda o corpo a identificar invasores estranhos. (Crédito da imagem: JUAN GAERTNER / SCIENCE PHOTO BIBRARY via Getty Images)

E em 20 outros animais frequentemente estudados pela ciência também.

A empresa de inteligência artificial (A.I.) DeepMind diz que em breve lançará um banco de dados da forma de todas as proteínas conhecidas pela ciência – mais de 100 milhões.

Essa é toda proteína estruturada no corpo humano, bem como em 20 espécies de pesquisa, incluindo leveduras e bactérias E. coli, moscas de frutas e camundongos. Antes do projeto AlphaFold da empresa, que usa inteligência artificial para prever as formas das proteínas, apenas 17% das proteínas do corpo humano tinham suas estruturas identificadas, de acordo com a Technology Review.

“Parece surpreendentemente impressionante”, disse Tom Ellis, biólogo sintético do Imperial College London, à Technology Review.



O dobramento de proteínas é incrivelmente complexo. As proteínas são feitas de longos filamentos de blocos de construção chamados aminoácidos, que se envolvem em formas estranhas e complicadas para formar estruturas funcionais. Desvendar essas estruturas em laboratório leva muito tempo, mas a DeepMind anunciou em dezembro que seu algoritmo AlphaFold pode determinar a forma das proteínas até o átomo em minutos. Até agora, AlphaFold previu 36% das proteínas humanas com precisão de nível atômico, e previu mais da metade com precisão boa o suficiente para iniciar pesquisas sobre as funções das proteínas, de acordo com a empresa. (Cerca de um terço das proteínas no corpo não têm uma estrutura, a menos que se liguem a outra coisa, então DeepMind não pode prever com precisão suas formas.) AlphaFold faz essas previsões usando uma rede neural, um tipo de algoritmo destinado a imitar como o cérebro processa as informações e o que é particularmente bom no reconhecimento de padrões – como sequências específicas de aminoácidos interagem – em grandes quantidades de dados.

As formas previstas ainda precisam ser confirmadas em laboratório, Ellis disse à Technology Review. Se os resultados se mantiverem, eles impulsionarão rapidamente o estudo do proteoma, ou das proteínas em um determinado organismo. Os pesquisadores da DeepMind publicaram seu código-fonte aberto e expuseram o método em dois artigos revisados por pares publicados na Nature na semana passada.

Eles já disponibilizaram cerca de 350.000 estruturas de proteínas gratuitamente no Banco de Dados de Estruturas de Proteínas AlphaFold, de acordo com um anúncio da empresa. Isso inclui cerca de 20.000 proteínas expressas pelo genoma humano. (Quando as proteínas são “expressas”, isso significa que as informações armazenadas no genoma são convertidas em instruções para fazer proteínas, que então desempenham alguma função no corpo.) Nos próximos meses, a empresa planeja adicionar quase todas as proteínas sequenciadas conhecidas por Ciência.

Compreender a estrutura das proteínas pode ajudar os pesquisadores a investigar as causas das doenças e permitir que eles descubram novos medicamentos que desempenharão uma função específica no corpo. De acordo com a DeepMind, os pesquisadores já estão usando as descobertas da AlphaFold para estudar a resistência aos antibióticos, para estudar a biologia do vírus SARS-CoV-2, que causa o COVID-19, e para buscar novas enzimas que possam ser usadas para reciclar plásticos.


Publicado em 02/08/2021 17h45

Artigo original:

Estudo original: