Inteligência artificial detecta uma nova classe de mutações por trás do autismo

Inteligência artificial detecta uma nova classe de mutações por trás do autismo


Genes previstos para serem interrompidos por mutações regulatórias em pessoas com autismo tenderam a estar envolvidos no funcionamento das células cerebrais e caíram em duas categorias. Uma categoria refere-se a sinapses, centros de comunicação entre neurônios e a outra à cromatina, a forma altamente estruturada de DNA e proteínas necessária para a expressão gênica adequada dos cromossomos. Crédito: Laboratório de Troyanskaya
Genes previstos para serem interrompidos por mutações regulatórias em pessoas com autismo tenderam a estar envolvidos no funcionamento das células cerebrais e caíram em duas categorias. Uma categoria refere-se a sinapses, centros de comunicação entre neurônios e a outra à cromatina, a forma altamente estruturada de DNA e proteínas necessária para a expressão gênica adequada dos cromossomos. Crédito: Laboratório de Troyanskaya

Muitas mutações no DNA que contribuem para a doença não estão nos genes atuais, mas sim nos 99% do genoma, antes considerado “lixo”. Embora os cientistas recentemente tenham compreendido que esses vastos trechos de DNA desempenham, de fato, papéis críticos, decifrar esses efeitos em grande escala tem sido impossível até agora.

Usando inteligência artificial, uma equipe liderada pela Universidade de Princeton decodificou o impacto funcional de tais mutações em pessoas com autismo. Os pesquisadores acreditam que este poderoso método é geralmente aplicável para descobrir essas contribuições genéticas para qualquer doença.

Publicando em 27 de maio na revista Nature Genetics, os pesquisadores analisaram os genomas de 1.790 famílias nas quais uma criança tem transtorno do espectro do autismo, mas outros não. O método classificou entre 120.000 mutações para encontrar aquelas que afetam o comportamento de genes em pessoas com autismo. Embora os resultados não revelem causas exatas de casos de autismo, eles revelam milhares de possíveis colaboradores para os pesquisadores estudarem.

Muitas pesquisas anteriores se concentraram na identificação de mutações nos próprios genes. Os genes são essencialmente instruções para produzir as muitas proteínas que constroem e controlam o corpo. Mutações em genes resultam em proteínas mutadas cujas funções são interrompidas. Outros tipos de mutações, no entanto, interrompem a forma como os genes são regulados. Mutações nessas áreas afetam não o que os genes fazem, mas quando e quanto eles fazem.

Até agora, não era possível analisar todo o genoma em busca de fragmentos de DNA que regulam genes e prever como as mutações nesse DNA regulatório podem contribuir para doenças complexas, disseram os pesquisadores. Este estudo é a primeira prova de que mutações no DNA regulador podem causar uma doença complexa.

“Esse método fornece uma estrutura para fazer essa análise com qualquer doença”, disse Olga Troyanskaya, professora de ciência da computação e genômica e uma das autoras sênior do estudo. A abordagem poderia ser particularmente útil para distúrbios neurológicos, câncer, doenças cardíacas e muitas outras condições que iludiram os esforços para identificar as causas genéticas.

“Isso transforma a forma como precisamos pensar sobre as possíveis causas dessas doenças”, disse Troyanskaya, que também é vice-diretora de genômica do Instituto Flatiron da Fundação Simons, em Nova York, onde liderou um grupo de co-autores.

A equipe também incluiu um grupo liderado pelo neurocientista Robert Darnell, da Universidade Rockefeller. Os primeiros autores do estudo são Jian Zhou e Christopher Park, que obtiveram Ph.D em Princeton e agora visitam colaboradores do Instituto Lewis-Sigler para Genômica Integrativa e pesquisadores do Instituto Flatiron, e Chandra Theesfeld, do Instituto Lewis-Sigler, em Princeton. para genômica integrativa.

A maioria das pesquisas anteriores sobre a base genética da doença se concentrou nos 20.000 genes conhecidos e nas seções adjacentes do DNA que regulam esses genes. No entanto, mesmo essa enorme quantidade de informação genética representa apenas pouco mais de 1% dos 3,2 bilhões de pares químicos no genoma humano. Os outros 99% foram convencionalmente considerados “escuros” ou “lixo”, embora pesquisas recentes tenham começado a perturbar essa idéia.

Em sua nova descoberta, a equipe de pesquisa oferece um método para entender essa vasta gama de dados genômicos. O sistema usa uma técnica de inteligência artificial chamada deep learning na qual um algoritmo executa sucessivas camadas de análise para aprender sobre padrões que de outra forma seriam impossíveis de discernir. Nesse caso, o algoritmo ensina a si mesmo como identificar seções de DNA biologicamente relevantes e prevê se esses fragmentos desempenham um papel em qualquer uma das mais de 2.000 interações de proteínas que são conhecidas por afetar a regulação de genes. O sistema também prevê se a interrupção de um único par de unidades de DNA teria um efeito substancial sobre essas interações de proteína.

O algoritmo “desliza ao longo do genoma” analisando cada par de produtos químicos no contexto dos 1.000 pares químicos em torno dele, até que tenha varrido todas as mutações, disse Troyanskaya. O sistema pode, assim, prever o efeito da mutação de cada uma das unidades químicas no genoma inteiro. No final, ele revela uma lista priorizada de seqüências de DNA que provavelmente regulam genes e mutações que provavelmente interferem com essa regulamentação.

Antes dessa conquista computacional, a maneira convencional de coletar essas informações seria um trabalho minucioso de experimentos laboratoriais em cada sequência e cada mutação possível naquela sequência. Esse número de funções e mutações possíveis é grande demais para ser contemplado – uma abordagem experimental exigiria testar cada mutação contra mais de 2.000 tipos de interações de proteínas e repetir essas experiências repetidamente nos tecidos e tipos de células, totalizando centenas de milhões de experimentos. Outros grupos de pesquisa têm procurado acelerar essa descoberta aplicando o aprendizado de máquina em seções específicas do DNA, mas não atingiram a capacidade

olhar para cada unidade de DNA e cada mutação possível e os efeitos em cada uma das mais de 2.000 interações regulatórias em todo o genoma.

“O que nosso jornal realmente permite que você faça é pegar todas essas possibilidades e classificá-las”, disse Park. “Essa priorização em si é muito útil, porque agora você também pode ir em frente e fazer os experimentos apenas nos casos de maior prioridade.”

Por fim, o sistema calibra sua base em mutações causadoras de doenças conhecidas e desenvolve um “escore de impacto da doença”, uma avaliação da probabilidade de uma determinada mutação ter um efeito na doença.

No caso do autismo, os pesquisadores analisaram os genomas de 1.790 famílias com o transtorno do espectro do autismo “simplex”, ou seja, a condição é aparente em uma criança, mas não em outros membros da família. (Esses dados foram extraídos da Coleção Simons Simplex de mais de 2.000 famílias de autistas.) Entre essa amostra, menos de 30% das pessoas afetadas pelo transtorno do espectro do autismo tinham uma causa genética previamente identificada. As novas mutações provavelmente aumentarão significativamente essa fração, disseram os pesquisadores.

A capacidade de prever o efeito funcional de cada mutação foi a principal inovação neste novo estudo. Estudos anteriores haviam encontrado dificuldades em detectar qualquer diferença no número de mutações regulatórias em pessoas com autismo em comparação com pessoas não afetadas. O novo método, no entanto, analisou mutações previstas para ter um alto impacto funcional, e encontrou um número significativamente maior de tais mutações em pessoas afetadas.

Quando os pesquisadores analisaram quais genes foram afetados por essas mutações, eles se mostraram genes fortemente associados às funções cerebrais. Essas mutações recém-descobertas afetaram genes e funções semelhantes às mutações previamente identificadas.

“Agora nós abrimos o campo para entender todos os fatores que podem estar envolvidos no autismo”, disse Theesfeld.

Essa informação também é importante para as famílias e seus médicos para diagnosticar melhor o transtorno e para evitar fazer suposições excessivamente gerais de como o autismo de uma pessoa pode ser classificado com outras pessoas. “Eles dizem que quando você conhece uma pessoa com autismo, você conhece uma pessoa com autismo porque nenhum caso é igual”, disse Theesfeld. “Geneticamente, parece ser o mesmo caminho.”

Com este novo método, a equipe está analisando as causas genéticas de várias formas de câncer, doenças cardíacas e outras desordens.


Artigo original: https://medicalxpress.com/news/2019-05-artificial-intelligence-class-mutations-autism.html