Estamos prestes a conversar com baleias usando a Inteligência Artificial?

Os pesquisadores esperam decifrar as comunicações dos cachalotes. Foto de Amanda Cotton / Projeto CETI

Um projeto ambicioso tenta interpretar os cliques dos cachalotes com inteligência artificial e, em seguida, responder a eles.

“Eu não sei muito sobre baleias. Nunca vi uma baleia na minha vida “, diz Michael Bronstein. O cientista da computação israelense, que leciona no Imperial College London, na Inglaterra, pode não parecer o candidato ideal para um projeto envolvendo a comunicação de cachalotes. Mas suas habilidades como especialista em aprendizado de máquina podem ser a chave para um empreendimento ambicioso que começou oficialmente em março de 2020: um grupo interdisciplinar de cientistas quer usar inteligência artificial (IA) para decodificar a linguagem desses mamíferos marinhos. Se o Projeto CETI (de Cetacean Translation Initiative) for bem-sucedido, será a primeira vez que realmente entenderemos sobre o que os animais estão conversando – e talvez até possamos ter uma conversa com eles.

Tudo começou em 2017, quando um grupo internacional de cientistas passou um ano junto na Harvard University em Cambridge, Massachusetts, no Radcliffe Fellowship, um programa que promete “uma oportunidade para se afastar das rotinas habituais”. Um dia, Shafi Goldwasser, cientista da computação e especialista em criptografia também de Israel, veio ao escritório de David Gruber, biólogo marinho da City University of New York. Goldwasser, que acabara de ser nomeado o novo diretor do Instituto Simons de Teoria da Computação da Universidade da Califórnia, Berkeley, ouviu uma série de cliques que a lembraram do ruído que um circuito eletrônico defeituoso faz – ou do código Morse. . É assim que cachalotes falam entre si, Gruber disse a ela. “Eu disse:’Talvez devêssemos fazer um projeto em que estejamos traduzindo os sons das baleias em algo que nós, como humanos, possamos entender'”, relata Goldwasser. “Eu realmente disse isso como uma reflexão tardia. Nunca pensei que ele fosse me levar a sério. ”

Mas a irmandade foi uma oportunidade de levar a sério idéias extravagantes. Em um jantar, eles apresentaram a ideia a Bronstein, que estava acompanhando os avanços recentes no processamento de linguagem natural (PNL), um ramo da IA que lida com a análise automatizada da fala escrita e falada – até agora, apenas a linguagem humana. Bronstein estava convencido de que as codas, como são chamadas as breves declarações do cachalote, têm uma estrutura que as empresta a esse tipo de análise. Felizmente, Gruber conhecia um biólogo chamado Shane Gero, que vinha registrando muitas codas de cachalotes nas águas ao redor da ilha caribenha de Dominica desde 2005. Bronstein aplicou alguns algoritmos de aprendizado de máquina aos dados. “Eles pareciam estar funcionando muito bem, pelo menos com algumas tarefas relativamente simples”, diz ele. Mas isso não foi mais do que uma prova de conceito. Para uma análise mais profunda, os algoritmos precisavam de mais contexto e mais dados – milhões de codas de baleia.

Mas os animais têm linguagem? A questão é controversa entre os cientistas há muito tempo. Para muitos, a linguagem é um dos últimos bastiões da exclusividade humana. Os animais se comunicam, mas não falam, disse o biólogo austríaco Konrad Lorenz, um dos pioneiros da ciência do comportamento animal, que escreveu sobre suas próprias comunicações com os animais em seu livro de 1949 King Solomon’s Ring. “Os animais não possuem uma linguagem no verdadeiro sentido da palavra”, escreveu Lorenz.

“Acho que ainda não olhamos de perto o suficiente”, rebate Karsten Brensing, bióloga marinha alemã que escreveu vários livros sobre comunicação animal. Brensing está convencido de que as expressões de muitos animais podem certamente ser chamadas de linguagem. Não se trata apenas de latidos de cães: várias condições devem ser atendidas. “Em primeiro lugar, a linguagem tem semântica. Isso significa que certas vocalizações têm um significado fixo que não muda. ” Os gaios-siberianos, um tipo de pássaro, por exemplo, são conhecidos por terem um vocabulário de cerca de 25 cantos, alguns dos quais têm um significado fixo.

A segunda condição é a gramática: regras de como construir frases. Por muito tempo, os cientistas estavam convencidos de que a comunicação animal carecia de qualquer estrutura de frase. Mas em 2016, pesquisadores japoneses publicaram um estudo na Nature Communications sobre as vocalizações de peitos-grandes. Em certas situações, os pássaros combinam dois chamados diferentes para avisar um ao outro quando um predador se aproxima. Eles também reagiram quando os pesquisadores tocaram essa sequência para eles. No entanto, quando a ordem do chamado foi invertida, os pássaros reagiram muito menos. “Isso é gramática”, diz Brensing.

O terceiro critério: você não chamaria as vocalizações de uma espécie animal de linguagem se fossem completamente inatas. Lorenz acreditava que os animais nascem com um repertório de expressões e não aprendem muito ao longo da vida. “Todas as expressões de emoções animais, por exemplo, a nota ‘Kia’ e ‘Kiaw’ da gralha, não são, portanto, comparáveis à nossa linguagem falada, mas apenas àquelas expressões como bocejar, franzir a testa e sorrir, que são expressas inconscientemente como ações inatas “, escreveu Lorenz.

Diversas espécies animais provaram ser aprendizes vocais – adquirindo novo vocabulário, desenvolvendo dialetos, identificando-se uns aos outros pelo nome. Alguns pássaros até aprendem a imitar toques de celular. Os golfinhos adquirem apitos individuais que usam como identificadores para si mesmos, quase como um nome.

Cachalotes mergulham fundo no oceano e se comunicam por longas distâncias por meio de um sistema de cliques. Foto de Amanda Cotton / Projeto CETI

Os cliques dos cachalotes são candidatos ideais para tentar decodificar seus significados – não apenas porque, ao contrário dos sons contínuos que outras espécies de baleias produzem, eles são fáceis de traduzir em uns e zeros. Os animais mergulham nas profundezas do oceano e se comunicam a grandes distâncias, por isso não podem usar a linguagem corporal e as expressões faciais, que são importantes meios de comunicação para outros animais. “É realista presumir que a comunicação das baleias é principalmente acústica”, diz Bronstein. Os cachalotes têm os maiores cérebros do reino animal, seis vezes o nosso tamanho. Quando dois desses animais conversam um com o outro por um longo período de tempo, não deveríamos nos perguntar se eles têm algo a dizer um ao outro? Eles dão dicas uns aos outros sobre os melhores pesqueiros? As mães baleias trocam histórias sobre a criação de seus filhotes, como suas contrapartes humanas? Vale a pena tentar descobrir, dizem os pesquisadores do CETI.

Aprender uma língua desconhecida é mais fácil se houver algo como a famosa Pedra de Roseta. Esta estela, descoberta em 1799, contém o mesmo texto em três línguas e foi a chave para decifrar os hieróglifos egípcios. Claro, não existe tal coisa para o reino animal. Não temos um dicionário humano-baleia, nem um livro com as regras gramaticais da língua do cachalote.

Mas existem maneiras de contornar isso. Obviamente, as crianças aprendem sua língua nativa sem essas ferramentas, apenas observando a língua falada ao seu redor. Os pesquisadores concluíram que esse tipo de aprendizado é basicamente estatístico: a criança lembra que a palavra cachorro está sendo muito pronunciada quando aquele animal peludo entra na sala, que certas palavras são freqüentemente usadas em conexão com outras, que uma sequência específica de palavras é mais provável do que outro. Nos últimos 10 anos, os métodos de aprendizado de máquina imitaram esse tipo de aprendizado. Os pesquisadores alimentaram grandes redes neurais com enormes quantidades de dados de linguagem. E essas redes podiam encontrar estruturas em linguagens a partir de observações estatísticas, sem nada serem informadas sobre o conteúdo.

Um exemplo são os chamados modelos de linguagem, dos quais o mais conhecido é o GPT-3, desenvolvido pela empresa OpenAI. Modelos de linguagem são máquinas de completar – o GPT-3, por exemplo, recebe o início de uma frase e a completa palavra por palavra, de maneira semelhante às sugestões que os smartphones fazem quando digitamos mensagens de texto, apenas muito mais sofisticadas. Ao processar estatisticamente grandes quantidades de texto extraídas da Internet, os modelos de linguagem não apenas sabem quais palavras aparecem juntas com frequência, mas também aprendem as regras de composição de frases. Eles criam frases que soam corretas e, muitas vezes, de excelente qualidade. Eles são capazes de escrever artigos falsos sobre um determinado assunto, resumir textos jurídicos complexos em termos simples e até mesmo traduzir entre dois idiomas.

Essas proezas têm um preço: grandes quantidades de dados são necessárias. Os programadores treinaram a rede neural do GPT-3 com cerca de 175 bilhões de palavras. Em comparação, o projeto Dominica Sperm Whale Project de Gero coletou menos de 100.000 codas de cachalotes. A primeira tarefa do novo projeto de pesquisa será expandir amplamente essa coleção, com o objetivo de coletar quatro bilhões de palavras – embora ninguém saiba ainda o que é uma “palavra” na linguagem do cachalote.

Se a ideia de Bronstein funcionar, é bastante realista desenvolver um sistema análogo aos modelos de linguagem humana que geram expressões de baleia gramaticalmente corretas. A próxima etapa seria um chatbot interativo que tenta se engajar em um diálogo com baleias de vida livre. Claro, ninguém pode dizer hoje se os animais o aceitariam como um parceiro de conversação. “Talvez eles simplesmente respondessem, ‘Pare de falar esse lixo!'”, Diz Bronstein.

Os pesquisadores esperam que a inteligência artificial (IA) lhes dê a chave para compreender a comunicação dos cachalotes. Ilustração do Projeto CETI

Mas mesmo que a ideia funcione, a desvantagem de todos os modelos de linguagem é que eles não sabem nada sobre o conteúdo da língua em que estão conversando. Seria irônico se os pesquisadores criassem um bot que pudesse conversar fluentemente com uma baleia, mas eles não conseguissem entender uma palavra. É por isso que eles querem anotar as gravações de voz com dados sobre o comportamento das baleias desde o início – onde estavam os animais, quem falou com quem, qual foi a reação? O desafio é encontrar uma maneira automatizada de fazer pelo menos algumas dessas milhões de anotações.

Muita tecnologia ainda precisa ser desenvolvida – sensores para registrar as baleias individualmente e monitorar suas localizações. Esses são necessários para atribuir claramente sons individuais a um animal específico. O Projeto CETI se candidatou com sucesso a cinco anos de financiamento do Audacious Project executado pela TED, a organização da conferência. Várias organizações fazem parte do projeto, incluindo a National Geographic Society e o Laboratório de Ciência da Computação e Inteligência Artificial do Massachusetts Institute of Technology (MIT).

Os pesquisadores do CETI não foram os primeiros a ter a ideia de aplicar técnicas de aprendizado de máquina às linguagens animais. Aza Raskin, ex-físico, designer e empresário que se tornou crítico da tecnologia, teve uma ideia semelhante em 2013, quando ouviu sobre a linguagem complicada dos macacos gelada africanos. Poderíamos aplicar a tecnologia da PNL que foi desenvolvida para processar linguagens humanas em vocalizações de animais? Ele ajudou a fundar o Projeto Espécies da Terra com o objetivo de fazer exatamente isso. Naquela época, a tecnologia estava em sua infância; levou mais quatro anos até que fosse desenvolvido em um método de autoaprendizagem funcional para tradução automática entre idiomas. A técnica de incorporação de palavras coloca todas as palavras de um idioma em uma galáxia multidimensional, onde as palavras frequentemente usadas juntas estão próximas umas das outras e essas conexões são representadas por linhas. Por exemplo, “rei” se refere a “homem”, assim como “rainha” se refere a “mulher”.

Descobriu-se que os mapas de duas línguas humanas podem coincidir, embora nem todas as palavras de uma língua tenham uma contrapartida exata na outra. Hoje, essa técnica permite a tradução entre duas línguas humanas em texto escrito, e em breve poderá ser usada em gravações de áudio sem texto.

Mas é concebível que possamos sobrepor os mapas de uma linguagem humana e de uma linguagem animal? Raskin está convencido de que isso é possível, pelo menos em princípio. “É quase certo que haja algum tipo de conjunto de experiências compartilhadas, especialmente com outros mamíferos. Eles precisam respirar, eles precisam comer, eles choram seus filhotes depois que morrem “, diz ele. Ao mesmo tempo, Raskin acredita, haverá muitas áreas onde os mapas não cabem. “Não sei o que será mais fascinante – as partes em que podemos fazer tradução direta ou as partes em que não há nada que possa ser traduzido diretamente para a experiência humana.” Uma vez que os animais falam por si próprios e podemos ouvir, diz Raskin, poderíamos ter “momentos culturais realmente transformacionais”.

Sem dúvida, a mãe e o filhote de cachalote se comunicam, mas os pesquisadores estão se perguntando o que eles dizem um ao outro. Foto de Amanda Cotton / Projeto CETI

Certamente essas esperanças estão um pouco à frente das pesquisas. Alguns cientistas são muito céticos sobre se a coleta de dados do CETI conterá algo interessante. Steven Pinker, o renomado lingüista e autor do livro The Language Instinct, vê o projeto com bastante ceticismo. “Ficarei curioso para ver o que eles encontram”, ele escreve por e-mail. No entanto, ele tem pouca esperança de que possamos encontrar um conteúdo rico e estrutura nas codas do cachalote. “Suspeito que não será muito além do que já sabemos, ou seja, que são chamadas de assinatura cuja semântica é praticamente restrita a quem são, talvez junto com chamadas emocionais. Se as baleias podiam comunicar mensagens complexas, por que não as vemos usando isso para fazer coisas complexas juntas, como vemos nos humanos? ”

Diana Reiss, pesquisadora do Hunter College, da City University of New York, discorda. “Se as pessoas olhassem para você e para mim agora”, diz ela durante uma entrevista em vídeo, “não estou fazendo muito, nem você, mas estamos comunicando muitas coisas significativas”. Da mesma maneira, ela acha que não sabemos muito sobre o que as baleias podem dizer umas às outras. “Acho que podemos dizer com segurança que estamos em um estado de ignorância neste momento”, diz ela.

Reiss trabalha com golfinhos há anos e usa um teclado subaquático simples para se comunicar com eles. Ela foi cofundadora de um grupo, Interspecies Internet, que explora maneiras de se comunicar efetivamente com os animais. Entre seus cofundadores estão o músico Peter Gabriel; Vinton Cerf, um dos desenvolvedores da internet; e Neil Gershenfeld, diretor do Centro de Bits e Átomos do MIT. Reiss acolhe as ambições do CETI, especialmente sua abordagem interdisciplinar.

Os pesquisadores do CETI admitem que sua busca por significado nas codas das baleias pode não resultar em nada de interessante. “Entendemos que um dos nossos maiores riscos é que as baleias possam ser incrivelmente enfadonhas”, diz Gruber, o líder do programa. “Mas não achamos que seja esse o caso. Em minha experiência como bióloga, sempre que realmente olhei para algo de perto, nunca houve um momento em que eu não estivesse impressionado com os animais. ”

O nome do projeto CETI evoca SETI, a busca por inteligência extraterrestre, que vasculhou o céu em busca de sinais de rádio de civilizações alienígenas desde 1960, até agora sem encontrar uma única mensagem. Como nenhum sinal de ET foi encontrado, Bronstein está convencido de que devemos testar nossas habilidades de decodificação em sinais que podemos detectar aqui na Terra. Em vez de apontar nossas antenas para o espaço, podemos espionar uma cultura no oceano que é pelo menos igualmente estranha para nós. “Acho muito arrogante pensar que o Homo sapiens é a única criatura inteligente e senciente na Terra”, diz Bronstein. “Se descobrirmos que existe uma civilização inteira basicamente sob nosso nariz, talvez isso resulte em alguma mudança na maneira como tratamos nosso meio ambiente. E talvez resulte em mais respeito pelo mundo vivo. ”


Publicado em 28/10/2021 12h41

Artigo original:

Estudo original: