Cientistas desenvolvem Inteligência Artificial capaz de transformar atividade cerebral em texto

Imagem gerada por computador de um cérebro. A equipe descobriu que a precisão do sistema mais recente era muito maior do que as abordagens anteriores. Foto: Jezper / Alamy

Pesquisadores nos EUA rastrearam os dados neurais de pessoas enquanto conversavam

A leitura das mentes acaba de se aproximar da realidade: os cientistas desenvolveram inteligência artificial que pode transformar a atividade cerebral em texto.

Embora o sistema atualmente trabalhe com padrões neurais detectados enquanto alguém está falando em voz alta, os especialistas dizem que isso pode ajudar na comunicação de pacientes incapazes de falar ou digitar, como aqueles com síndrome de bloqueio.

“Ainda não estamos lá, mas achamos que isso poderia ser a base de uma prótese de fala”, disse Joseph Makin, co-autor da pesquisa da Universidade da Califórnia, em São Francisco.

Escrevendo na revista Nature Neuroscience, Makin e colegas revelam como eles desenvolveram seu sistema recrutando quatro participantes que possuíam conjuntos de eletrodos implantados em seu cérebro para monitorar convulsões epilépticas.

Foi solicitado a esses participantes que leiam em voz alta 50 frases definidas várias vezes, incluindo “Tina Turner é uma cantora pop” e “Esses ladrões roubaram 30 jóias”. A equipe rastreou sua atividade neural enquanto eles estavam falando.

Esses dados foram então alimentados em um algoritmo de aprendizado de máquina, um tipo de sistema de inteligência artificial que converteu os dados de atividade cerebral de cada sentença falada em uma sequência de números.

Para garantir que os números se relacionassem apenas aos aspectos da fala, o sistema comparou os sons previstos a partir de pequenos fragmentos dos dados da atividade cerebral com o áudio gravado. A sequência de números foi então inserida em uma segunda parte do sistema que a converteu em uma sequência de palavras.

A princípio, o sistema gerou frases sem sentido. Mas, à medida que o sistema comparava cada sequência de palavras com as frases que foram lidas em voz alta, ele melhorava, aprendendo como a sequência de números se relacionava com as palavras e quais palavras tendem a se seguir.

A equipe testou o sistema, gerando texto escrito apenas a partir da atividade cerebral durante a fala.

O sistema não estava perfeito. Entre seus erros, “Esses músicos se harmonizam maravilhosamente” foi decodificado como “O espinafre era um cantor famoso” e “Um rolo de arame estava perto da parede” tornou-se “Will robin usará um lírio amarelo”.

No entanto, a equipe descobriu que a precisão do novo sistema era muito maior do que as abordagens anteriores. Embora a precisão varie de pessoa para pessoa, para um participante, apenas 3% de cada sentença, em média, precisam ser corrigidos – maior que a taxa de erro de 5% para transcritores humanos profissionais. Mas, o estresse da equipe, diferentemente do último, o algoritmo lida apenas com um pequeno número de sentenças.

“Se você tentar sair das [50 frases usadas], a decodificação ficará muito pior”, disse Makin, acrescentando que o sistema provavelmente depende de uma combinação de aprendizado de frases específicas, identificação de palavras da atividade cerebral e reconhecimento de padrões gerais em inglês. .

A equipe também descobriu que treinar o algoritmo nos dados de um participante significava que eram necessários menos dados de treinamento do usuário final – algo que poderia tornar o treinamento menos oneroso para os pacientes.

Christian Herff, um especialista da Universidade de Maastricht que não participou do estudo, disse que a pesquisa foi empolgante porque o sistema utilizou menos de 40 minutos de dados de treinamento para cada participante e uma coleção limitada de frases, em vez de milhões de horas normalmente necessárias.

“Ao fazer isso, eles atingem níveis de precisão que não foram alcançados até agora”, disse ele.

No entanto, ele observou que o sistema ainda não era utilizável para muitos pacientes gravemente incapacitados, pois dependia da atividade cerebral registrada por pessoas que pronunciavam uma frase em voz alta.

“É claro que essa é uma pesquisa fantástica, mas essas pessoas também podem usar o ‘OK Google'” “, disse ele. “Isso não é tradução do pensamento [mas da atividade cerebral envolvida na fala].”

Herff disse que as pessoas não devem se preocupar com as pessoas que leem seus pensamentos ainda: os eletrodos cerebrais devem ser implantados, enquanto a fala imaginada é muito diferente da voz interior.

Mas Mahnaz Arvaneh, especialista em interfaces cérebro-máquina da Universidade de Sheffield, disse que é importante considerar questões éticas agora. “Ainda estamos muito, muito distantes do ponto em que as máquinas podem ler nossas mentes”, disse ela. “Mas isso não significa que não devemos pensar sobre isso e não devemos planejar.”


Publicado em 03/04/2020 07h24

Artigo original:

Estudo original:


Achou importante? Compartilhe!


Assine nossa newsletter e fique informado sobre Astrofísica, Biofísica, Geofísica e outras áreas. Preencha seu e-mail no espaço abaixo e clique em “OK”: