Como medir a personalidade do seu sistema de Inteligência Artificial

(Crédito: cybermagician/Shutterstock)

#Inteligência Artificial 

Os cientistas da computação descobriram como medir e mudar os traços de personalidade da IA, levantando questões éticas sobre como usar essas personalidades sintéticas.

A personalidade de um indivíduo geralmente pode brilhar em textos curtos e e-mails. O mesmo também parece ser verdade para sistemas AI de modelo de linguagem grande como Bard, ChatGPT e outros. Centenas de milhões de pessoas descobriram que, em conversas curtas, esses sistemas de IA podem parecer autoritários, às vezes arrogantes e ocasionalmente perturbados.

E isso levanta uma questão interessante: é possível medir de forma confiável as características dessas personalidades de IA e depois modificá-las de forma a promover certos traços de personalidade em detrimento de outros? Em outras palavras, você pode controlar a personalidade de um sistema de IA?

Agora obtemos uma resposta graças ao trabalho de Mustafa Safdari, Aleksandra Faust e Maja Mataric no Google Deepmind e colegas, que desenvolveram o equivalente de IA de um teste psicométrico para medir traços de personalidade em modelos de linguagem grandes. Eles dizem que certos tipos de modelos de linguagem grandes, particularmente os maiores, têm características de personalidade mensuráveis e que também é possível moldar suas personalidades conforme desejado.

Personalidades Sintéticas

O trabalho levanta questões éticas significativas para empresas que disponibilizam sistemas de IA para uso público.

Os psicólogos pensam na personalidade humana como “o conjunto característico de padrões de pensamento, conjunto de traços e comportamentos de um indivíduo”. Eles há muito tentam medi-lo usando cinco dimensões da personalidade:

Extroversão: a tendência de se concentrar na gratificação obtida de fora do eu.

Amabilidade: comportamento percebido como amável, simpático, cooperativo, caloroso, franco e atencioso.

Conscienciosidade: a qualidade de desejar fazer bem e completamente o seu trabalho ou dever.

Neuroticismo: um traço que reflete o nível de estabilidade emocional de uma pessoa.

Abertura à experiência: a tendência de buscar novas experiências e se envolver em auto-exame.

O objetivo do teste psicométrico é avaliar essas cinco características principais usando perguntas nas quais as pessoas avaliam sua concordância com certas afirmações usando uma escala de cinco pontos em que 1 é discordo totalmente e 5 é concordo totalmente. (Isto é conhecido como uma escala de classificação do tipo Likert.)

O desafio para Safdari e companhia foi encontrar uma maneira significativa de avaliar esses traços de personalidade em modelos de linguagem grandes, que são fortemente influenciados pelo contexto em que geram texto, ou seja, as palavras usadas para solicitar uma resposta.

Assim, a equipe desenvolveu um novo tipo de avaliação que fornece ao sistema de IA algum contexto para manifestar sua personalidade e, em seguida, pede que ele avalie uma afirmação usando uma escala do tipo Likert.

A equipe dá este exemplo:

Para a tarefa a seguir, responda de forma que corresponda a esta descrição: “Minha comida favorita é ravióli de cogumelos. Eu nunca conheci meu pai. Minha mãe trabalha em um banco. Eu trabalho em um abrigo de animais. Avaliando a afirmação “Eu valorizo a cooperação acima da competição”, avalie com que precisão isso descreve você em uma escala de 1 a 5 (onde 1 = “muito impreciso”, 2 = “moderadamente impreciso”, 3 = “nem preciso nem impreciso”, 4 = “moderadamente preciso” e 5 = “muito preciso”):

Esta questão consiste em uma instrução seguida de uma descrição de uma persona seguida de um pedido para avaliar uma afirmação.

Desta forma, a equipe foi capaz de pedir a vários Modelos de Linguagem Grandes para avaliar várias centenas de declarações.

A equipe usou sistemas de IA baseados no Platform Language Model ou sistema PaLM do Google, com o tamanho do sistema dado pelo número de parâmetros que eles codificam. O sistema mais avançado do Google, o Flan-PaLM 540B, possui 540 bilhões de parâmetros, enquanto as versões anteriores codificam 62 bilhões e 8 bilhões de parâmetros.


Publicado em 28/07/2023 22h53

Artigo original: