Finalmente, o aprendizado de máquina interpreta claramente a regulação de genes

Um modelo termodinâmico matemático para regulação de genes (em cima, à esquerda) é formulado como uma rede neural artificial (RNA) (em baixo, à esquerda). Grandes conjuntos de dados de DNA são alimentados através da nova RNA (direita). O padrão de conexões é apresentado de uma maneira fácil para os biólogos interpretarem. Crédito: Kinney lab / CSHL, 2019

Nesta era de “big data”, a inteligência artificial (IA) tornou-se um aliado valioso para os cientistas. Os algoritmos de aprendizado de máquina, por exemplo, estão ajudando os biólogos a entender o número vertiginoso de sinais moleculares que controlam o funcionamento dos genes. Porém, à medida que novos algoritmos são desenvolvidos para analisar ainda mais dados, eles também se tornam mais complexos e mais difíceis de interpretar. Os biólogos quantitativos Justin B. Kinney e Ammar Tareen têm uma estratégia para projetar algoritmos avançados de aprendizado de máquina que são mais fáceis de entender pelos biólogos.

Os algoritmos são um tipo de rede neural artificial (RNA). Inspiradas na maneira como os neurônios se conectam e se ramificam no cérebro, as RNAs são as bases computacionais para o aprendizado de máquina avançado. E, apesar do nome, as RNAs não são usadas exclusivamente para estudar cérebros.

Biólogos, como Tareen e Kinney, usam RNAs para analisar dados de um método experimental chamado “ensaio de repórter massivamente paralelo” (MPRA), que investiga o DNA. Usando esses dados, os biólogos quantitativos podem produzir RNAs que preveem quais moléculas controlam genes específicos em um processo chamado regulação de genes.

As células não precisam de todas as proteínas o tempo todo. Em vez disso, eles contam com mecanismos moleculares complexos para ativar ou desativar os genes que produzem proteínas, conforme necessário. Quando esses regulamentos falham, geralmente ocorrem desordens e doenças.

“Esse conhecimento mecanicista – entender como algo como a regulação de genes funciona – é muitas vezes a diferença entre ser capaz de desenvolver terapias moleculares contra doenças e não ser capaz”, disse Kinney.

Infelizmente, a maneira como as RNAs padrão são moldadas a partir dos dados do MPRA é muito diferente de como os cientistas fazem perguntas nas ciências da vida. Esse desalinhamento significa que os biólogos têm dificuldade em interpretar como ocorre a regulação dos genes.

O professor assistente Justin Kinney mostra a estrutura relativamente fácil de entender de uma rede neural artificial recém-projetada. Seus resultados foram apresentados oficialmente na 1ª Conferência sobre Aprendizado de Máquina em Biologia Computacional em 13 de dezembro. Crédito: CSHL, 2019

Agora, Kinney e Tareen desenvolveram uma nova abordagem que preenche a lacuna entre ferramentas computacionais e como os biólogos pensam. Eles criaram RNAs personalizadas que refletem matematicamente conceitos comuns em biologia a respeito dos genes e das moléculas que os controlam. Dessa maneira, o par está forçando essencialmente seus algoritmos de aprendizado de máquina a processar dados de uma maneira que um biólogo possa entender.

Kinney explicou que esses esforços destacam como as tecnologias de IA industriais modernas podem ser otimizadas para uso nas ciências da vida. Tendo verificado essa nova estratégia para criar RNAs personalizadas, o laboratório de Kinney a está aplicando na investigação de uma ampla variedade de sistemas biológicos, incluindo os principais circuitos de genes envolvidos em doenças humanas.

Os resultados foram anunciados oficialmente em Vancouver, Canadá, na 1ª Conferência sobre Aprendizado de Máquina em Biologia Computacional, em 13 de dezembro. Eles podem ser vistos como uma pré-impressão no servidor bioRxiv da CSHL.


Publicado em 29/12/2019

Artigo original:

Estudo original:


Achou importante? Compartilhe!



Assine nossa newsletter e fique informado sobre Astrofísica, Biofísica, Geofísica e outras áreas. Preencha seu e-mail no espaço abaixo e clique em “OK”: