Inteligência artificial dobra moléculas de RNA

Alguns segmentos de uma molécula de RNA (laranja) formam as chamadas estruturas em gancho. Crédito: Vivian Brandenburg

Para a função de muitas biomoléculas, sua estrutura tridimensional é crucial. Os pesquisadores, portanto, não estão apenas interessados na sequência dos blocos de construção individuais das biomoléculas, mas também em sua estrutura espacial. Com a ajuda da inteligência artificial (IA), os bioinformáticos já podem prever com segurança a estrutura tridimensional de uma proteína a partir de sua sequência de aminoácidos. Para moléculas de RNA, no entanto, essa tecnologia ainda está em sua infância. Pesquisadores da Ruhr-Universität Bochum (RUB) descrevem uma maneira de usar a IA para prever com segurança a estrutura de certas moléculas de RNA a partir de sua sequência de nucleotídeos na revista PLOS Computational Biology em 7 de julho de 2022.

Para o trabalho, as equipes lideradas por Vivian Brandenburg e o professor Franz Narberhaus da Cátedra RUB de Biologia de Microrganismos cooperaram com o professor Axel Mosig da Área de Competência de Bioinformática do Centro de Diagnóstico de Proteínas de Bochum.

O ambiente celular deve ser considerado

“O RNA é muitas vezes visto apenas como um mensageiro entre o DNA genômico e as proteínas”, diz Axel Mosig. “Mas muitas moléculas de RNA assumem funções celulares.” Sua estrutura espacial é importante para isso. Regiões semelhantes em uma sequência de nucleotídeos podem se agrupar para formar arranjos tridimensionais.

“Identificar essas auto-semelhanças em uma sequência de RNA é como um quebra-cabeça matemático”, explica Vivian Brandenburg. Existe um modelo biofísico para este quebra-cabeça com algoritmos de previsão correspondentes. No entanto, o modelo não pode levar em conta o ambiente celular do RNA – e isso também influencia o processo de dobramento. “Se o RNA fosse isolado e flutuando em solução aquosa, o modelo poderia prever a estrutura com muita precisão”, diz Brandenburg. Mas uma célula viva contém muitos outros componentes.

É aí que entra a inteligência artificial. A IA pode aprender padrões sutis do ambiente celular com base em estruturas conhecidas. Poderia então incorporar essas descobertas em suas previsões estruturais. Para o processo de aprendizado, no entanto, a IA precisa de dados de treinamento suficientes – e isso realmente falta na prática.

Obtendo dados de treinamento com um truque

Para resolver o problema dos dados de treinamento ausentes, a equipe de Bochum usou um truque: os pesquisadores trabalharam com motivos estruturais de RNA conhecidos. Usando uma espécie de marcha à ré, eles poderiam gerar quase qualquer número de sequências de nucleotídeos a partir dos modelos de energia dessas estruturas que se dobrariam nessas estruturas espaciais. Com a ajuda desse chamado dobramento inverso, os pesquisadores geraram muitos pares de sequências de nucleotídeos e estruturas com as quais puderam treinar a IA.

Novas estruturas previsíveis de forma confiável

Os pesquisadores então confrontaram a IA com uma nova tarefa: ela tinha que prever a estrutura de certas moléculas de RNA bacteriano. Essas moléculas – chamadas de terminadores de transcrição – são importantes sinais de parada na tradução do DNA genômico em bactérias. Muitas vezes, como muitas outras moléculas de RNA com funções celulares importantes, elas estão escondidas no genoma e são difíceis de distinguir de áreas com outras funções.

A inteligência artificial foi capaz de reconhecer e prever de forma confiável a estrutura típica dos terminadores de transcrição, que lembra um grampo de cabelo. A equipe de pesquisa foi capaz de provar isso usando dados experimentais disponíveis publicamente.

“Embora as abordagens de IA sejam agora quase inevitáveis na previsão de estruturas de proteínas, o desenvolvimento de estruturas de RNA está apenas começando”, diz Axel Mosig.


Publicado em 16/07/2022 18h42

Artigo original:

Estudo original: