O grande truque de voz: é IA ou é real?

Uma nova pesquisa revela que, embora as pessoas tenham dificuldade em distinguir entre vozes humanas e vozes geradas por IA, as respostas cerebrais diferem significativamente.

#Inteligência Artificial 

As pessoas presumem que vozes felizes são reais e vozes “neutras? como IA. A investigação mostra que as pessoas têm dificuldade em identificar a IA a partir de vozes humanas, mas as suas atividades cerebrais diferem, sugerindo respostas únicas a cada tipo de voz, o que tem implicações significativas para a tecnologia e a ética.

Reconhecimento de voz por IA

As pessoas não são muito boas em distinguir entre vozes humanas e vozes geradas pela inteligência artificial (IA), mas nossos cérebros respondem de maneira diferente às vozes humanas e à IA.

Isto está de acordo com a pesquisa sendo apresentada em 25 de junho no Fórum da Federação das Sociedades Europeias de Neurociências (FENS) de 2024. O estudo será apresentado pela pesquisadora doutorada Christine Skjegstad, e realizado pela Sra.

Skjegstad e pelo professor Sascha Frühholz, ambos do Departamento de Psicologia da Universidade de Oslo (UiO), Noruega.

Espectrogramas para demonstrar a semelhança entre vozes humanas e de IA. Crédito: Fórum FENS / Christine Skjegstad

Avanços e desafios na tecnologia de voz de IA

Sra.

Skjegstad disse: “Já sabemos que as vozes geradas por IA se tornaram tão avançadas que são quase indistinguíveis das vozes humanas reais.

Agora é possível clonar a voz de uma pessoa em apenas alguns segundos de gravação, e os golpistas têm usado essa tecnologia para imitar um ente querido em perigo e enganar as vítimas para que transfiram dinheiro.

Embora os especialistas em aprendizagem automática tenham desenvolvido soluções tecnológicas para detectar vozes de IA, sabe-se muito menos sobre a resposta do cérebro humano a essas vozes.” A pesquisa envolveu 43 pessoas que foram convidadas a ouvir vozes humanas e geradas por IA expressando cinco emoções diferentes: neutra, raiva, medo, felicidade, prazer.[2] Eles foram solicitados a identificar as vozes como sintéticas ou naturais enquanto seus cérebros eram estudados por meio de ressonância magnética funcional (fMRI).

fMRI é usado para detectar alterações no fluxo sanguíneo dentro do cérebro, indicando quais partes do cérebro estão ativas.

Os participantes também foram solicitados a avaliar as características das vozes que ouviram em termos de naturalidade, confiabilidade e autenticidade.

Desempenho dos participantes na identificação de voz Os participantes identificaram corretamente vozes humanas apenas 56% das vezes e vozes de IA em 50,5% das vezes, o que significa que foram igualmente ruins na identificação de ambos os tipos de vozes.

As pessoas eram mais propensas a identificar corretamente uma voz de IA “neutra? como IA (75% em comparação com 23% que conseguiam identificar corretamente uma voz humana neutra como humana), sugerindo que as pessoas assumem que vozes neutras são mais parecidas com IA.

As vozes femininas neutras em IA foram identificadas corretamente com mais frequência do que as vozes masculinas neutras em IA.

Para vozes humanas felizes, a taxa de identificação correta foi de 78%, em comparação com apenas 32% para vozes felizes de IA, sugerindo que as pessoas associam a felicidade como algo mais humano.

Tanto a IA quanto as vozes humanas neutras foram percebidas como menos naturais, confiáveis e autênticas, enquanto as vozes humanas felizes foram percebidas como mais naturais, confiáveis e autênticas.

Diferenças de resposta cerebral para vozes humanas e de IA

No entanto, observando as imagens do cérebro, os pesquisadores descobriram que as vozes humanas provocaram respostas mais fortes em áreas do cérebro associadas à memória (hipocampo direito) e à empatia (giro frontal inferior direito).

As vozes de IA provocaram respostas mais fortes em áreas relacionadas à detecção de erros (córtex cingulado médio anterior direito) e regulação da atenção (córtex pré-frontal dorsolateral direito).

Sra.Skjegstad disse: “Minha pesquisa indica que não somos muito precisos ao identificar se uma voz é humana ou gerada por IA.

Os participantes também expressaram frequentemente como era difícil para eles diferenciar as vozes.

Isto sugere que a atual tecnologia de voz de IA pode imitar vozes humanas a tal ponto que é difícil para as pessoas diferenciá-las com segurança.

“Os resultados também indicam um viés na percepção em que as vozes neutras eram mais propensas a serem identificadas como geradas por IA e as vozes felizes eram mais propensas a serem identificadas como mais humanas, independentemente de realmente serem.

Esse foi especialmente o caso das vozes femininas neutras de IA, o que pode ocorrer porque estamos familiarizados com assistentes de voz femininas, como Siri e Alexa.

“Embora não sejamos muito bons em identificar vozes humanas a partir de IA, parece haver uma diferença na resposta do cérebro.

As vozes da IA podem provocar maior alerta, enquanto as vozes humanas podem provocar uma sensação de relacionamento.” Os investigadores planeiam agora estudar se os traços de personalidade, por exemplo extroversão ou empatia, tornam as pessoas mais ou menos sensíveis a perceber as diferenças entre as vozes humanas e as da IA.

Opinião de especialistas e implicações mais amplas

O professor Richard Roche é presidente do comitê de comunicação do Fórum FENS e vice-chefe do Departamento de Psicologia da Maynooth University, Maynooth, County Kildare, Irlanda, e não esteve envolvido na pesquisa.

Ele disse: “Investigar as respostas do cérebro às vozes da IA é crucial à medida que esta tecnologia continua avançando.

Esta pesquisa nos ajudará a compreender as potenciais implicações cognitivas e sociais da tecnologia de voz de IA, que pode apoiar políticas e diretrizes éticas.

“Os riscos desta tecnologia ser usada para enganar e enganar as pessoas são óbvios.

No entanto, também existem benefícios potenciais, como o fornecimento de substituições de voz para pessoas que perderam a voz natural.

Vozes de IA também podem ser usadas na terapia para alguns problemas de saúde mental.”


Publicado em 26/06/2024 22h58

Artigo original: