Um novo sistema de Machine Learning ajuda os robôs a entender e realizar certas interações sociais

Credit: CC0 Public Domain

Os robôs podem entregar comida em um campus universitário e acertar um buraco no campo de golfe, mas mesmo o robô mais sofisticado não consegue realizar interações sociais básicas que são críticas para a vida humana cotidiana.

Os pesquisadores do MIT agora incorporaram certas interações sociais em uma estrutura de robótica, permitindo que as máquinas entendam o que significa ajudar ou atrapalhar umas às outras e aprender a realizar esses comportamentos sociais por conta própria. Em um ambiente simulado, um robô observa seu companheiro, adivinha que tarefa deseja realizar e, em seguida, ajuda ou atrapalha esse outro robô com base em seus próprios objetivos.

Os pesquisadores também mostraram que seu modelo cria interações sociais realistas e previsíveis. Quando eles mostraram vídeos desses robôs simulados interagindo uns com os outros para humanos, os espectadores humanos concordaram principalmente com o modelo sobre que tipo de comportamento social estava ocorrendo.

Permitir que robôs exibam habilidades sociais pode levar a interações homem-robô mais suaves e positivas. Por exemplo, um robô em uma casa de repouso pode usar esses recursos para ajudar a criar um ambiente mais atencioso para os idosos. O novo modelo também pode permitir aos cientistas medir as interações sociais quantitativamente, o que pode ajudar os psicólogos a estudar o autismo ou analisar os efeitos dos antidepressivos.

“Os robôs viverão em nosso mundo em breve e eles realmente precisam aprender como se comunicar conosco em termos humanos. Eles precisam entender quando é hora de ajudar e quando é hora de ver o que podem fazer para evitar que algo aconteça. Este é um trabalho muito inicial e mal estamos arranhando a superfície, mas sinto que esta é a primeira tentativa muito séria de compreender o que significa para humanos e máquinas interagirem socialmente “, disse Boris Katz, principal cientista pesquisador e chefe do Grupo InfoLab no Laboratório de Ciência da Computação e Inteligência Artificial (CSAIL) e membro do Centro de Cérebros, Mentes e Máquinas (CBMM).

Juntando-se a Katz no artigo estão o co-autor principal Ravi Tejwani, um assistente de pesquisa no CSAIL; co-autor principal Yen-Ling Kuo, um CSAIL Ph.D. aluna; Tianmin Shu, pós-doutorado no Departamento de Cérebro e Ciências Cognitivas; e o autor sênior Andrei Barbu, um cientista pesquisador no CSAIL e CBMM. A pesquisa será apresentada na Conferência sobre Aprendizagem de Robôs em novembro.

Uma simulação social

Para estudar as interações sociais, os pesquisadores criaram um ambiente simulado onde robôs perseguem objetivos físicos e sociais enquanto se movem em uma grade bidimensional.

Uma meta física está relacionada ao meio ambiente. Por exemplo, o objetivo físico de um robô pode ser navegar até uma árvore em um determinado ponto da grade. Uma meta social envolve adivinhar o que outro robô está tentando fazer e então agir com base nessa estimativa, como ajudar outro robô a regar a árvore.

Os pesquisadores usam seu modelo para especificar quais são os objetivos físicos de um robô, quais são seus objetivos sociais e quanta ênfase ele deve colocar um sobre o outro. O robô é recompensado por ações realizadas que o deixam mais perto de cumprir seus objetivos. Se um robô está tentando ajudar seu companheiro, ele ajusta sua recompensa para corresponder à do outro robô; se está tentando atrapalhar, ajusta sua recompensa para que seja o oposto. O planejador, um algoritmo que decide quais ações o robô deve realizar, usa essa recompensa continuamente atualizada para guiar o robô a realizar uma combinação de objetivos físicos e sociais.

“Abrimos uma nova estrutura matemática para modelar a interação social entre dois agentes. Se você é um robô e deseja ir para o local X, e eu sou outro robô e vejo que você está tentando ir para o local X , Posso cooperar ajudando você a chegar ao local X mais rápido. Isso pode significar mover X para mais perto de você, encontrar outro X melhor ou realizar qualquer ação que você tenha que realizar em X. Nossa formulação permite que o plano descubra o ‘como’; especificamos o ‘o quê’ em termos do que as interações sociais significam matematicamente “, diz Tejwani.

Combinar os objetivos físicos e sociais de um robô é importante para criar interações realistas, uma vez que os humanos que se ajudam têm limites para o quão longe eles irão. Por exemplo, uma pessoa racional provavelmente não entregaria sua carteira a um estranho, diz Barbu.

Os pesquisadores usaram essa estrutura matemática para definir três tipos de robôs. Um robô de nível 0 tem apenas objetivos físicos e não pode raciocinar socialmente. Um robô de nível 1 tem objetivos físicos e sociais, mas assume que todos os outros robôs têm apenas objetivos físicos. Os robôs de nível 1 podem realizar ações com base nos objetivos físicos de outros robôs, como ajudar e atrapalhar. Um robô de nível 2 assume que outros robôs têm objetivos sociais e físicos; esses robôs podem realizar ações mais sofisticadas, como unir-se para ajudar em conjunto.

Avaliando o modelo

Para ver como seu modelo se compara às perspectivas humanas sobre as interações sociais, eles criaram 98 cenários diferentes com robôs nos níveis 0, 1 e 2. Doze humanos assistiram a 196 videoclipes dos robôs interagindo e, em seguida, foram solicitados a estimar o nível físico e social objetivos desses robôs.

Na maioria dos casos, seu modelo concordava com o que os humanos pensavam sobre as interações sociais que estavam ocorrendo em cada quadro.

“Temos esse interesse de longo prazo, tanto para construir modelos computacionais para robôs, mas também para nos aprofundar nos aspectos humanos disso. Queremos descobrir quais recursos desses vídeos os humanos estão usando para entender as interações sociais. Podemos fazer um teste objetivo para sua capacidade de reconhecer interações sociais? Talvez haja uma maneira de ensinar as pessoas a reconhecer essas interações sociais e melhorar suas habilidades. Estamos muito longe disso, mas mesmo ser capaz de medir as interações sociais de forma eficaz já é uma grande passo à frente “, diz Barbu.

Em direção a uma maior sofisticação

Os pesquisadores estão trabalhando no desenvolvimento de um sistema com agentes 3D em um ambiente que permite muitos mais tipos de interação, como a manipulação de objetos domésticos. Eles também estão planejando modificar seu modelo para incluir ambientes onde as ações podem falhar.

Os pesquisadores também desejam incorporar um planejador de robô baseado em rede neural ao modelo, que aprende com a experiência e tem um desempenho mais rápido. Finalmente, eles esperam realizar um experimento para coletar dados sobre os recursos que os humanos usam para determinar se dois robôs estão engajados em uma interação social.

“Esperançosamente, teremos uma referência que permita a todos os pesquisadores trabalhar nessas interações sociais e inspirar os tipos de avanços da ciência e da engenharia que vimos em outras áreas, como reconhecimento de objeto e ação”, diz Barbu.


Publicado em 06/11/2021 17h27

Artigo original:

Estudo original: