Estudo pede cautela ao comparar redes neurais ao cérebro

As redes neurais, um tipo de sistema de computação vagamente modelado na organização do cérebro humano, formam a base de muitos sistemas de inteligência artificial para aplicações como reconhecimento de fala, visão computacional e análise de imagens médicas.

Créditos: Imagem: Christine Daniloff, MIT, imagem de estoque


Sistemas de computação que parecem gerar atividade semelhante ao cérebro podem ser o resultado de pesquisadores que os orientam para um resultado específico.

As redes neurais, um tipo de sistema de computação vagamente modelado na organização do cérebro humano, formam a base de muitos sistemas de inteligência artificial para aplicações como reconhecimento de fala, visão computacional e análise de imagens médicas.

No campo da neurociência, os pesquisadores costumam usar redes neurais para tentar modelar o mesmo tipo de tarefas que o cérebro realiza, na esperança de que os modelos possam sugerir novas hipóteses sobre como o próprio cérebro realiza essas tarefas. No entanto, um grupo de pesquisadores do MIT está pedindo mais cautela ao interpretar esses modelos.

Em uma análise de mais de 11.000 redes neurais que foram treinadas para simular a função de células de grade – componentes-chave do sistema de navegação do cérebro – os pesquisadores descobriram que as redes neurais só produziam atividade semelhante a uma célula de grade quando recebiam restrições muito específicas que não são encontrados em sistemas biológicos.

“O que isso sugere é que, para obter um resultado com células de grade, os pesquisadores treinam os modelos necessários para preparar esses resultados com opções de implementação específicas e biologicamente implausíveis”, diz Rylan Schaeffer, ex-pesquisador sênior do MIT.

Sem essas restrições, a equipe do MIT descobriu que muito poucas redes neurais geraram atividade semelhante a células de grade, sugerindo que esses modelos não geram necessariamente previsões úteis de como o cérebro funciona.

Schaeffer, que agora é estudante de pós-graduação em ciência da computação na Universidade de Stanford, é o principal autor do novo estudo, que será apresentado na Conferência de 2022 sobre Sistemas de Processamento de Informação Neural este mês. Ila Fiete, professora de ciências do cérebro e cognitivas e membro do McGovern Institute for Brain Research do MIT, é a autora sênior do artigo. Mikail Khona, um estudante de pós-graduação do MIT em física, também é autor.

Modelando células de grade

As redes neurais, que os pesquisadores vêm usando há décadas para realizar uma variedade de tarefas computacionais, consistem em milhares ou milhões de unidades de processamento conectadas umas às outras. Cada nó tem conexões de intensidades variadas com outros nós da rede. À medida que a rede analisa grandes quantidades de dados, os pontos fortes dessas conexões mudam à medida que a rede aprende realizando a tarefa desejada.

Neste estudo, os pesquisadores se concentraram em redes neurais que foram desenvolvidas para imitar a função das células da grade do cérebro, encontradas no córtex entorrinal do cérebro de mamíferos. Juntamente com as células de lugar, encontradas no hipocampo, as células da grade formam um circuito cerebral que ajuda os animais a saber onde estão e como navegar para um local diferente.

Demonstrou-se que as células de lugar disparam sempre que um animal está em um local específico, e cada célula de lugar pode responder a mais de um local. As células de grade, por outro lado, funcionam de maneira muito diferente. À medida que um animal se move através de um espaço como uma sala, as células da grade disparam apenas quando o animal está em um dos vértices de uma rede triangular. Diferentes grupos de células de grade criam treliças de dimensões ligeiramente diferentes, que se sobrepõem. Isso permite que as células da grade codifiquem um grande número de posições únicas usando um número relativamente pequeno de células.

Esse tipo de codificação de localização também possibilita prever a próxima localização de um animal com base em um determinado ponto de partida e uma velocidade. Em vários estudos recentes, pesquisadores treinaram redes neurais para realizar essa mesma tarefa, que é conhecida como integração de caminhos.

Para treinar as redes neurais para realizar essa tarefa, os pesquisadores inserem nela um ponto de partida e uma velocidade que varia ao longo do tempo. O modelo essencialmente imita a atividade de um animal vagando por um espaço e calcula as posições atualizadas à medida que se move. À medida que o modelo executa a tarefa, os padrões de atividade de diferentes unidades dentro da rede podem ser medidos. A atividade de cada unidade pode ser representada como um padrão de disparo, semelhante aos padrões de disparo dos neurônios no cérebro.

Em vários estudos anteriores, os pesquisadores relataram que seus modelos produziram unidades com padrões de atividade que imitam de perto os padrões de disparo das células da grade. Esses estudos concluíram que representações semelhantes a células de grade surgiriam naturalmente em qualquer rede neural treinada para realizar a tarefa de integração de caminhos.

No entanto, os pesquisadores do MIT encontraram resultados muito diferentes. Em uma análise de mais de 11.000 redes neurais que eles treinaram na integração de caminhos, eles descobriram que, embora quase 90% deles tenham aprendido a tarefa com sucesso, apenas cerca de 10% dessas redes geraram padrões de atividade que poderiam ser classificados como células de grade. Isso inclui redes nas quais apenas uma única unidade obteve uma pontuação alta na grade.

Os estudos anteriores eram mais propensos a gerar atividade semelhante a uma célula de grade apenas por causa das restrições que os pesquisadores criam nesses modelos, de acordo com a equipe do MIT.

“Estudos anteriores apresentaram essa história de que, se você treinar redes para integrar caminhos, obterá células de grade. O que descobrimos é que, em vez disso, você precisa fazer essa longa sequência de escolhas de parâmetros, que sabemos que são inconsistentes com a biologia e, em uma pequena porção desses parâmetros, você obterá o resultado desejado”, diz Schaeffer.

Mais modelos biológicos

Uma das restrições encontradas em estudos anteriores é que os pesquisadores exigiram que o modelo convertesse a velocidade em uma posição única, relatada por uma unidade de rede que corresponde a uma célula de lugar. Para que isso acontecesse, os pesquisadores também exigiram que cada célula de lugar correspondesse a apenas um local, que não é como as células de lugar biológicas funcionam: estudos mostraram que células de lugar no hipocampo podem responder a até 20 locais diferentes, não apenas um.

Quando a equipe do MIT ajustou os modelos para que as células de lugar fossem mais parecidas com células de lugar biológicas, os modelos ainda eram capazes de realizar a tarefa de integração de caminhos, mas não produziam mais atividades semelhantes a células de grade. A atividade semelhante a uma célula de grade também desapareceu quando os pesquisadores instruíram os modelos a gerar diferentes tipos de saída de localização, como localização em uma grade com eixos X e Y, ou localização como distância e ângulo em relação a um ponto inicial.

“Se a única coisa que você pede a essa rede para fazer a integração de caminhos, e você impõe um conjunto de requisitos muito específicos, não fisiológicos na unidade de leitura, então é possível obter células de grade”, diz Fiete. “Mas se você relaxar qualquer um desses aspectos desta unidade de leitura, isso degradará fortemente a capacidade da rede de produzir células de grade. Na verdade, geralmente não, embora ainda resolvam a tarefa de integração de caminhos.”

Portanto, se os pesquisadores ainda não soubessem da existência das células de grade e orientassem o modelo para produzi-las, seria muito improvável que elas aparecessem como uma consequência natural do treinamento do modelo.

Os pesquisadores dizem que suas descobertas sugerem que mais cautela é necessária ao interpretar modelos de redes neurais do cérebro.

“Quando você usa modelos de deep learning, eles podem ser uma ferramenta poderosa, mas é preciso ser muito cauteloso ao interpretá-los e determinar se eles estão realmente fazendo previsões de novo, ou mesmo esclarecendo o que o cérebro está otimizando.”, diz Fiete.

Kenneth Harris, professor de neurociência quantitativa da University College London, diz esperar que o novo estudo encoraje os neurocientistas a serem mais cuidadosos ao afirmar o que pode ser mostrado por analogias entre redes neurais e o cérebro.

“As redes neurais podem ser uma fonte útil de previsões. Se você quiser aprender como o cérebro resolve uma computação, você pode treinar uma rede para realizá-la e testar a hipótese de que o cérebro funciona da mesma maneira. Se a hipótese for confirmada ou não, você aprenderá alguma coisa”, diz Harris, que não participou do estudo. “Este artigo mostra que a ‘pós-dicção’ é menos poderosa: as redes neurais têm muitos parâmetros, portanto, fazê-las replicar um resultado existente não é tão surpreendente.”

Ao usar esses modelos para fazer previsões sobre como o cérebro funciona, é importante levar em consideração restrições biológicas conhecidas e realistas ao construir os modelos, dizem os pesquisadores do MIT. Eles agora estão trabalhando em modelos de células de grade que esperam gerar previsões mais precisas de como funcionam as células de grade no cérebro.

“Modelos de deep learning nos darão informações sobre o cérebro, mas somente depois que você injetar muito conhecimento biológico no modelo”, diz Khona. “Se você usar as restrições corretas, os modelos podem fornecer uma solução semelhante ao cérebro.”

A pesquisa foi financiada pelo Office of Naval Research, a National Science Foundation, a Simons Foundation através da Simons Collaboration on the Global Brain, e o Howard Hughes Medical Institute através do Faculty Scholars Program. Mikail Khona foi apoiado pela MathWorks Science Fellowship.


Publicado em 05/11/2022 17h54

Artigo original:

Estudo original: