”ChatGPT for CRISPR” cria novas ferramentas de edição de genes

Um modelo 3D do complexo de edição genética CRISPR-Cas9 de Streptococcus pyogenes. Crédito: Indigo Molecular Images/Science Photo Library

doi.org/10.1101/2024.02.27.582234
Credibilidade: 898
#CRISPR 

Alguns dos editores de genes projetados por IA poderiam ser mais versáteis do que aqueles encontrados na natureza.

Na busca incessante para descobrir sistemas de edição genética CRISPR até então desconhecidos, os pesquisadores vasculharam micróbios em tudo, desde fontes termais e turfeiras até cocô e até iogurte.

Agora, graças aos avanços na inteligência artificial generativa (IA), eles poderão ser capazes de projetar esses sistemas com o apertar de um botão.

Esta semana, os pesquisadores publicaram detalhes de como usaram uma ferramenta de IA generativa chamada modelo de linguagem de proteínas – uma rede neural treinada em milhões de sequências de proteínas – para projetar proteínas de edição de genes CRISPR, e foram então capazes de mostrar que alguns desses sistemas funcionam, conforme esperado no laboratório.

E em fevereiro, outra equipe anunciou que havia desenvolvido um modelo treinado em genomas microbianos e o usou para projetar novos sistemas CRISPR, que são compostos por uma enzima de corte de DNA ou RNA e moléculas de RNA que orientam a tesoura molecular sobre onde corte.

“É realmente apenas arranhar a superfície.

Está a mostrar que é possível conceber estes sistemas complexos com modelos de aprendizagem automática”, afirma Ali Madani, cientista de aprendizagem automática e executivo-chefe da empresa de biotecnologia Profluent, com sede em Berkeley, Califórnia.

A equipe de Madani relatou o que diz ser “a primeira edição bem-sucedida do genoma humano por proteínas projetadas inteiramente com machine learning? em uma pré-impressão de 22 de abril1 em bioRxiv.org (que não foi revisada por pares).

Alan Wong, biólogo sintético da Universidade de Hong Kong, cuja equipe usou o machine learning para otimizar o CRISPR, diz que os sistemas de edição genética que ocorrem naturalmente têm limitações em termos das sequências que podem atingir e do tipo de mudanças que podem fazer.

Para algumas aplicações, portanto, pode ser um desafio encontrar o CRISPR certo.

“Expandir o repertório de editores, usando IA, poderia ajudar”, diz ele.

Treinados em genomas Enquanto chatbots como o ChatGPT são projetados para lidar com a linguagem depois de serem treinados em textos existentes, as IAs que projetam o CRISPR foram treinadas em vastos tesouros de dados biológicos na forma de sequências de proteínas ou genomas.

O objetivo desta etapa de “pré-treinamento? é imbuir os modelos com informações sobre sequências genéticas que ocorrem naturalmente, como quais aminoácidos tendem a andar juntos.

Esta informação pode então ser aplicada a tarefas como a criação de sequências totalmente novas.

A equipe de Madani utilizou anteriormente um modelo de linguagem proteica que desenvolveu, chamado ProGen, para criar novas proteínas antibacterianas.

Para desenvolver novos CRISPRs, a equipe treinou novamente uma versão atualizada do ProGen com exemplos de milhões de sistemas CRISPR diversos, que bactérias e outros micróbios unicelulares chamados archaea usam para afastar vírus.

Como os sistemas de edição genética CRISPR compreendem não apenas proteínas, mas também moléculas de RNA que especificam o seu alvo, a equipe de Madani desenvolveu outro modelo de IA para projetar esses “RNAs guia”.

A equipe então usou a rede neural para projetar milhões de novas sequências de proteínas CRISPR que pertencem a dezenas de famílias diferentes dessas proteínas encontradas na natureza.

Para ver se os CRISPRs projetados por IA eram editores de genes genuínos, a equipe de Madani sintetizou sequências de DNA correspondentes a mais de 200 designs de proteínas pertencentes ao sistema CRISPR-Cas9 que agora é amplamente utilizado em laboratório.

Quando os investigadores inseriram estas sequências – instruções para uma proteína Cas9 e um “ARN guia? – em células humanas, muitos dos editores de genes conseguiram cortar com precisão os alvos pretendidos no genoma.

A proteína Cas9 mais promissora – uma molécula chamada OpenCRISPR-1 – foi tão eficiente no corte de sequências de DNA direcionadas quanto uma enzima bacteriana CRISPR-Cas9 amplamente utilizada, e fez muito menos cortes no lugar errado.

Os pesquisadores também usaram o design do OpenCRISPR-1 para criar um editor de base – uma ferramenta de edição genética de precisão que altera as “letras? individuais do DNA – e descobriram que ele também era tão eficiente quanto outros sistemas de edição de base, bem como menos propenso a erros.

Outra equipe, liderada por Brian Hie, biólogo computacional da Universidade de Stanford, na Califórnia, e pelo bioengenheiro Patrick Hsu, do Arc Institute, em Palo Alto, Califórnia, usou um modelo de IA capaz de gerar sequências de proteínas e RNA.

Este modelo, denominado EVO, foi treinado em 80.000 genomas de bactérias e arquéias, bem como outras sequências microbianas, totalizando 300 bilhões de letras de DNA.

A equipe de Hie e Hsu ainda não testou seus projetos em laboratório.

Mas as estruturas previstas de alguns dos sistemas CRISPR-Cas9 que o grupo projetou se assemelham às das proteínas naturais.

O trabalho foi descrito em um preprint2 publicado em bioRxiv.org e não foi revisado por pares.

Medicina de precisão

“Isso é incrível”, diz Noelia Ferruz Capapey, bióloga computacional do Instituto de Biologia Molecular de Barcelona, na Espanha.

Ela está impressionada com o fato de que os pesquisadores podem usar a molécula OpenCRISPR-1 sem restrições, ao contrário de algumas ferramentas patenteadas de edição de genes.

O modelo ProGen2 e o ‘atlas’ de sequências CRISPR usadas para ajustá-lo também estão disponíveis gratuitamente.

A esperança é que as ferramentas de edição genética projetadas por IA possam ser mais adequadas para aplicações médicas do que os CRISPRs existentes, diz Madani.

A Profluent, acrescenta ele, espera fazer parceria com empresas que estão desenvolvendo terapias de edição genética para testar CRISPRs gerados por IA.

“É realmente necessário precisão e um design personalizado.

E acho que isso não pode ser feito copiando e colando? de sistemas CRISPR que ocorrem naturalmente, diz ele.


Publicado em 09/05/2024 17h25

Artigo original:

Estudo original: