Duas inteligências artificiais conversam uma com a outra

Tarefas e modelos. Crédito: Nature Neuroscience (2024). DOI: 10.1038/s41593-024-01607-5

doi.org/10.1038/s41593-024-01607-5
Credibilidade: 989
#Inteligência Artificial 

Realizar uma nova tarefa com base apenas em instruções verbais ou escritas, e depois descrevê-la a outros para que a possam reproduzir, é uma pedra angular da comunicação humana que ainda resiste à inteligência artificial (IA).

Uma equipe da Universidade de Genebra (UNIGE) conseguiu modelar uma rede neural artificial capaz de realizar esta proeza cognitiva. Depois de aprender e executar uma série de tarefas básicas, esta IA foi capaz de fornecer uma descrição linguística das mesmas a uma IA “irmã”, que por sua vez as executou. Estes resultados prometedores, nomeadamente para a robótica, foram publicados na revista Nature Neuroscience.

A realização de uma nova tarefa sem treino prévio, com base apenas em instruções verbais ou escritas, é uma capacidade humana única. Além disso, depois de aprendermos a tarefa, somos capazes de a descrever para que outra pessoa a possa reproduzir. Esta dupla capacidade distingue-nos de outras espécies que, para aprender uma nova tarefa, necessitam de numerosas tentativas acompanhadas de sinais de reforço positivos ou negativos, sem poderem comunicá-lo aos seus congéneres.

Um subcampo da inteligência artificial (IA) – o processamento da linguagem natural – procura recriar esta faculdade humana, com máquinas que compreendem e respondem a dados vocais ou textuais. Esta técnica baseia-se em redes neurais artificiais, inspiradas nos nossos neurónios biológicos e na forma como estes transmitem sinais elétricos entre si no cérebro. No entanto, os cálculos neurais que permitiriam realizar o feito cognitivo acima descrito são ainda pouco conhecidos.

“Atualmente, os agentes de conversação que utilizam a IA são capazes de integrar informações linguísticas para produzir um texto ou uma imagem. Mas, tanto quanto sabemos, ainda não são capazes de traduzir uma instrução verbal ou escrita numa ação sensório-motora e, muito menos, de a explicar a outra inteligência artificial para que esta a reproduza”, explica Alexandre Pouget, professor catedrático do Departamento de Neurociências de Base da Faculdade de Medicina da UNIGE.

Um cérebro modelo

O investigador e a sua equipe conseguiram desenvolver um modelo neuronal artificial com esta dupla capacidade, embora com treino prévio. “Começámos com um modelo existente de neurónios artificiais, o S-Bert, que tem 300 milhões de neurónios e está pré-treinado para compreender a linguagem. Ligámo-lo a outra rede mais simples, com alguns milhares de neurónios”, explica Reidar Riveland, doutorando do Departamento de Neurociências Básicas da Faculdade de Medicina da UNIGE e primeiro autor do estudo.

Na primeira fase da experiência, os neurocientistas treinaram esta rede para simular a área de Wernicke, a parte do nosso cérebro que nos permite perceber e interpretar a linguagem. Na segunda fase, a rede foi treinada para reproduzir a área de Broca, que, sob a influência da área de Wernicke, é responsável pela produção e articulação das palavras. Todo o processo foi realizado em computadores portáteis convencionais. De seguida, foram transmitidas à IA instruções escritas em inglês.

Por exemplo: apontar para o local – à esquerda ou à direita – onde um estímulo é percepcionado; responder na direção oposta a um estímulo; ou, mais complexo, entre dois estímulos visuais com uma ligeira diferença de contraste, mostrar o mais brilhante. Em seguida, os cientistas avaliaram os resultados do modelo, que simulava a intenção de se mover ou, neste caso, de apontar.

“Uma vez aprendidas estas tarefas, a rede foi capaz de as descrever a uma segunda rede – uma cópia da primeira – para que esta as pudesse reproduzir. Tanto quanto sabemos, é a primeira vez que duas IAs conseguem falar uma com a outra de uma forma puramente linguística”, afirma Alexandre Pouget, que liderou a investigação.

Para os humanóides do futuro

Este modelo abre novos horizontes para a compreensão da interação entre a linguagem e o comportamento. É particularmente promissor para o setor da robótica, onde o desenvolvimento de tecnologias que permitam que as máquinas falem umas com as outras é uma questão fundamental.

“A rede que desenvolvemos é muito pequena. Nada impede agora que se desenvolvam, nesta base, redes muito mais complexas que seriam integradas em robots humanóides capazes de nos compreender, mas também de se compreenderem uns aos outros”, concluem os dois investigadores.

Ilustração do procedimento de formação auto-supervisionada para a rede de produção linguística (azul)


Publicado em 27/03/2024 17h11

Artigo original:

Estudo original: