Fazendo algoritmos de Inteligência Artificial mostrarem seu trabalho

O Cold Spring Harbor Laboratory Assistant Professor Peter Koo em seu laboratório com o estudante de graduação Shushan Toneyan. A equipe de Koo estuda como a IA de aprendizado de máquina chamada de redes neurais profundas (DNNs) funciona. Ele desenvolveu um novo método para investigar como esses DNNs aprendem e predizem a importância de certos padrões nas sequências de RNA. Crédito: Gina Motisi, 2020 / CSHL

As máquinas de aprendizagem de inteligência artificial (IA) podem ser treinadas para resolver problemas e quebra-cabeças por conta própria, em vez de usar regras que criamos para elas. Mas, muitas vezes, os pesquisadores não sabem quais regras as máquinas fazem para si mesmas. O professor assistente Peter Koo do Cold Spring Harbor Laboratory (CSHL) desenvolveu um novo método que testa um programa de aprendizado de máquina para descobrir quais regras ele aprendeu por conta própria e se são as corretas.

Os cientistas da computação “treinam” uma máquina de IA para fazer previsões apresentando um conjunto de dados. A máquina extrai uma série de regras e operações – um modelo – com base nas informações que encontrou durante o treinamento. Koo diz:

“Se você aprender regras gerais sobre matemática em vez de memorizar as equações, saberá como resolvê-las. Portanto, em vez de apenas memorizar essas equações, esperamos que esses modelos estejam aprendendo a resolvê-las e agora podemos fornecer qualquer equação e vai resolver. ”

Koo desenvolveu um tipo de IA chamado rede neural profunda (DNN) para procurar padrões nas fitas de RNA que aumentam a capacidade de uma proteína se ligar a elas. Koo treinou seu DNN, chamado Residual Bind (RB), com milhares de sequências de RNA combinadas com pontuações de ligação de proteínas, e RB tornou-se bom em prever pontuações para novas sequências de RNA. Mas Koo não sabia se a máquina estava se concentrando em uma sequência curta de letras de RNA – um motivo – que os humanos poderiam esperar, ou alguma outra característica secundária das fitas de RNA que eles poderiam não esperar.

Koo e sua equipe desenvolveram um novo método, denominado Análise de Importância Global, para testar quais regras RB gerou para fazer suas previsões. Ele apresentou à rede treinada um conjunto cuidadosamente projetado de sequências de RNA sintético contendo diferentes combinações de motivos e características que os cientistas pensaram que poderiam influenciar as avaliações de RB.

Eles descobriram que a rede considerava mais do que apenas a grafia de um pequeno motivo. Ele considerou como a fita de RNA pode se dobrar e se ligar a si mesma, a proximidade de um motivo de outro e outras características.

Koo espera testar alguns resultados importantes em um laboratório. Mas, em vez de testar todas as previsões naquele laboratório, o novo método de Koo atua como um laboratório virtual. Os pesquisadores podem projetar e testar milhões de diferentes variáveis computacionalmente, muito mais do que os humanos poderiam testar em um laboratório do mundo real.

“A biologia é superanedótica. Você pode encontrar uma sequência, pode encontrar um padrão, mas não sabe ‘Esse padrão é realmente importante?’ Você tem que fazer esses experimentos de intervenção. Nesse caso, todos os meus experimentos são feitos apenas perguntando à rede neural.”


Publicado em 16/05/2021 15h33

Artigo original:

Estudo original: