Habilitando a ‘imaginação’ da inteligência artificial

Uma equipe de pesquisadores da USC está ajudando a IA a imaginar o invisível, uma técnica que também pode levar a uma IA mais justa, novos medicamentos e maior segurança para veículos autônomos.

Imagine um gato laranja. Agora, imagine o mesmo gato, mas com pelo preto como carvão. Agora, imagine o gato pavoneando-se ao longo da Grande Muralha da China. Fazendo isso, uma série rápida de ativações de neurônios em seu cérebro surgirá com variações da imagem apresentada, com base em seu conhecimento prévio do mundo.

Em outras palavras, como humanos, é fácil imaginar um objeto com atributos diferentes. Mas, apesar dos avanços em redes neurais profundas que correspondem ou superam o desempenho humano em certas tarefas, os computadores ainda lutam com a habilidade humana de “imaginação”.

Agora, uma equipe de pesquisa da USC composta pelo professor de ciência da computação Laurent Itti e Ph.D. os alunos Yunhao Ge, Sami Abu-El-Haija e Gan Xin, desenvolveram uma IA que usa recursos humanos para imaginar um objeto nunca antes visto com atributos diferentes. O artigo, intitulado “Zero-Shot Synthesis with Group-Supervised Learning”, foi publicado na Conferência Internacional sobre Representações de Aprendizagem de 2021 em 7 de maio.

“Fomos inspirados pelas capacidades de generalização visual humana para tentar simular a imaginação humana em máquinas”, disse Ge, o principal autor do estudo.

“Os humanos podem separar seu conhecimento aprendido por atributos – por exemplo, forma, pose, posição, cor – e então recombinar para imaginar um novo objeto. Nosso artigo tenta simular esse processo usando redes neurais.”

Problema de generalização da IA

Por exemplo, digamos que você queira criar um sistema de IA que gere imagens de carros. Idealmente, você forneceria ao algoritmo algumas imagens de um carro, e ele seria capaz de gerar muitos tipos de carros – de Porsches a Pontiacs e picapes – em qualquer cor, de vários ângulos.

Este é um dos objetivos longamente buscados da IA: criar modelos que possam extrapolar. Isso significa que, dados alguns exemplos, o modelo deve ser capaz de extrair as regras subjacentes e aplicá-las a uma vasta gama de exemplos novos que não viu antes. Mas as máquinas são mais comumente treinadas em recursos de amostra, pixels por exemplo, sem levar em conta os atributos do objeto.

A ciência da imaginação

Neste novo estudo, os pesquisadores tentam superar essa limitação usando um conceito denominado desemaranhamento. O desemaranhamento pode ser usado para gerar falsificações profundas, por exemplo, ao desemaranhar os movimentos e a identidade do rosto humano. Ao fazer isso, disse Ge, “as pessoas podem sintetizar novas imagens e vídeos que substituem a identidade da pessoa original por outra pessoa, mas mantêm o movimento original”.

Da mesma forma, a nova abordagem pega um grupo de imagens de amostra – em vez de uma amostra por vez, como fizeram os algoritmos tradicionais – e analisa a similaridade entre elas para alcançar algo chamado “aprendizado de representação desemaranhado controlável”.

Em seguida, ele recombina esse conhecimento para alcançar uma “nova síntese de imagem controlável”, ou o que você pode chamar de imaginação. “Por exemplo, tome o filme Transformer como exemplo”, disse Ge, “ele pode assumir a forma de um carro Megatron, a cor e a pose de um carro Bumblebee amarelo e o plano de fundo da Times Square de Nova York. O resultado será um Bumblebee carro Megatron colorido dirigindo na Times Square, mesmo que esta amostra não tenha sido testemunhada durante a sessão de treinamento. ”

Isso é semelhante a como nós, como humanos, extrapolamos: quando um humano vê uma cor de um objeto, podemos aplicá-la facilmente a qualquer outro objeto, substituindo a cor original pela nova. Usando sua técnica, o grupo gerou um novo conjunto de dados contendo 1,56 milhão de imagens que podem auxiliar pesquisas futuras na área.

Compreendendo o mundo

Embora o desemaranhamento não seja uma ideia nova, os pesquisadores dizem que sua estrutura pode ser compatível com quase qualquer tipo de dados ou conhecimento. Isso amplia a oportunidade de aplicativos. Por exemplo, desemaranhar raça e conhecimento relacionado ao gênero para tornar a IA mais justa, removendo atributos sensíveis da equação completamente.

No campo da medicina, poderia ajudar médicos e biólogos a descobrir drogas mais úteis, separando a função do medicamento de outras propriedades e, em seguida, recombinando-as para sintetizar novos medicamentos. Imbuir as máquinas com imaginação também pode ajudar a criar IA mais segura, por exemplo, permitindo que veículos autônomos imaginem e evitem cenários perigosos nunca antes vistos durante o treinamento.

“O aprendizado profundo já demonstrou desempenho insuperável e promessa em muitos domínios, mas muitas vezes isso aconteceu por meio de mimetismo superficial e sem uma compreensão mais profunda dos atributos separados que tornam cada objeto único”, disse Itti. “Esta nova abordagem de desemaranhamento, pela primeira vez, realmente desencadeia um novo senso de imaginação nos sistemas I.A., aproximando-os da compreensão humana do mundo.”

Publicado em 17/07/2021 23h16

Artigo original:

https://techxplore.com/news/2021-07-enabling-artificial-intelligence.html

Estudo original:

https://openreview.net/forum?id=8wqCDnBmnrT