Machine Learning revela ‘genes importantes’ na agricultura e na medicina

Milho (milho) crescendo na estufa Rose Sohn Zegar da NYU no telhado do NYU Center for Genomics & amp; Biologia de sistemas. Crédito: NYU Coruzzi Lab

O Machine Learning pode identificar “genes importantes” que ajudam as safras a crescer com menos fertilizantes, de acordo com um novo estudo publicado na Nature Communications. Ele também pode prever características adicionais em plantas e resultados de doenças em animais, ilustrando suas aplicações além da agricultura.

Usar dados genômicos para prever resultados na agricultura e na medicina é uma promessa e um desafio para a biologia de sistemas. Os pesquisadores têm trabalhado para determinar a melhor forma de usar a vasta quantidade de dados genômicos disponíveis para prever como os organismos respondem às mudanças na nutrição, toxinas e exposição a patógenos – o que, por sua vez, informaria o melhoramento das safras, prognóstico de doenças, epidemiologia e saúde pública. No entanto, prever com precisão esses resultados complexos na agricultura e na medicina a partir de informações em escala de genoma permanece um desafio significativo.

No estudo da Nature Communications, pesquisadores e colaboradores da NYU nos EUA e em Taiwan enfrentaram esse desafio usando Machine Learning, um tipo de inteligência artificial usada para detectar padrões em dados.

“Mostramos que focar em genes cujos padrões de expressão são conservados evolutivamente entre as espécies aumenta nossa capacidade de aprender e prever ‘genes importantes’ para o desempenho de crescimento de culturas básicas, bem como resultados de doenças em animais”, explicou Gloria Coruzzi, Carroll & Milton Petrie Professor no Departamento de Biologia e Centro de Genômica e Biologia de Sistemas da NYU e autor sênior do artigo.

“Nossa abordagem explora a variação natural da expressão de todo o genoma e fenótipos relacionados dentro ou entre as espécies”, acrescentou Chia-Yi Cheng, do Centro de Genômica e Biologia de Sistemas da NYU e da Universidade Nacional de Taiwan, principal autor deste estudo. “Nós mostramos que reduzir nossa entrada genômica para genes cujos padrões de expressão são conservados dentro e entre as espécies é uma maneira biologicamente baseada em reduzir a dimensionalidade dos dados genômicos, o que melhora significativamente a capacidade de nossos modelos de Machine Learning de identificar quais genes são importantes para um traço.”

Milho (milho) crescendo na estufa Rose Sohn Zegar da NYU no telhado do NYU Center for Genomics & amp; Biologia de sistemas. Crédito: NYU Coruzzi Lab

Como prova de conceito, os pesquisadores demonstraram que os genes cuja capacidade de resposta ao nitrogênio são conservados evolutivamente entre duas espécies de plantas diversas – Arabidopsis, uma pequena planta com flores amplamente usada como organismo modelo em biologia vegetal, e variedades de milho, a maior cultura da América – melhorou significativamente a capacidade dos modelos de Machine Learning de prever genes importantes para a eficiência do uso do nitrogênio pelas plantas. O nitrogênio é um nutriente crucial para as plantas e o principal componente do fertilizante; as safras que usam nitrogênio com mais eficiência crescem melhor e requerem menos fertilizantes, o que traz benefícios econômicos e ambientais.

Os pesquisadores conduziram experimentos que validaram oito fatores principais de transcrição como genes importantes para a eficiência do uso do nitrogênio. Eles mostraram que a expressão gênica alterada em Arabidopsis ou milho pode aumentar o crescimento da planta em solos com baixo teor de nitrogênio, que eles testaram em laboratório na NYU e em campos de milho na Universidade de Illinois.

“Agora que podemos prever com mais precisão quais híbridos de milho são melhores no uso de fertilizante de nitrogênio no campo, podemos melhorar rapidamente essa característica. Aumentar a eficiência do uso de nitrogênio no milho e em outras safras oferece três benefícios principais, reduzindo os custos do agricultor, reduzindo a poluição ambiental, e mitigar as emissões de gases de efeito estufa da agricultura “, disse o autor do estudo Stephen Moose, Alexander Professor de Crop Sciences na Universidade de Illinois em Urbana-Champaign.

Além disso, os pesquisadores provaram que essa abordagem de Machine Learning evolutivamente informada pode ser aplicada a outras características e espécies, prevendo características adicionais em plantas, incluindo biomassa e rendimento em Arabidopsis e milho. Eles também mostraram que essa abordagem pode prever genes importantes para a resistência à seca em outra cultura básica, o arroz, bem como resultados de doenças em animais por meio do estudo de modelos de camundongos.

“Porque mostramos que nosso pipeline evolutivamente informado também pode ser aplicado em animais, isso destaca seu potencial para descobrir genes de importância para quaisquer características fisiológicas ou clínicas de interesse em biologia, agricultura ou medicina”, disse Coruzzi.

“Muitos traços importantes de importância agronômica ou clínica são geneticamente complexos e, portanto, é difícil definir seu controle e herança. Nosso sucesso prova que o big data e o pensamento em nível de sistema podem tornar esses desafios notoriamente difíceis tratáveis”, disse o autor do estudo, Ying Li, docente no Departamento de Horticultura e Arquitetura Paisagista da Purdue University.


Publicado em 24/09/2021 20h12

Artigo original:

Estudo original: