Testando um modelo de aprendizado profundo não supervisionado para imitação de movimentos humanos por robôs

Etapas do processo de imitação humano-robô: 1) saídas de estimativa de pose de um vídeo do artista A, uma sequência de posições conjuntas xA, 2) o redirecionamento de movimento traduz as posições conjuntas xA em posições conjuntas xB para o artista B, 3) o controle do robô envia o baixo controle de nível. Crédito: Annabi et al.

doi.org/10.1145/3568294.3580153
Credibilidade: 888
#Robôs 

Robôs que podem imitar de perto as ações e movimentos dos humanos em tempo real podem ser extremamente úteis, pois podem aprender realizando tarefas diárias de maneiras específicas, sem terem que ser extensivamente pré-programados para essas tarefas. Embora as técnicas que permitem a aprendizagem por imitação tenham melhorado consideravelmente nos últimos anos, o seu desempenho é muitas vezes dificultado pela falta de correspondência entre o corpo de um robô e o do seu utilizador humano.

Pesquisadores da U2IS, ENSTA Paris, introduziram recentemente um novo modelo baseado em aprendizagem profunda que poderia melhorar as capacidades de imitação de movimento de sistemas robóticos humanóides. Este modelo, apresentado em um artigo pré-publicado no arXiv, aborda a imitação de movimento em três etapas distintas, projetadas para reduzir os problemas de correspondência entre humanos e robôs relatados no passado.

“Este trabalho de pesquisa em estágio inicial visa melhorar a imitação online de robôs humanos, traduzindo sequências de posições conjuntas do domínio dos movimentos humanos para um domínio de movimentos alcançáveis por um determinado robô, portanto limitado pela sua incorporação”, Louis Annabi, Ziqi Ma , e Sao Mai Nguyen escreveram em seu artigo. “Aproveitando os recursos de generalização dos métodos de deep learning, resolvemos esse problema propondo um modelo de rede neural codificador-decodificador que realiza tradução de domínio para domínio.”

O modelo desenvolvido por Annabi, Ma e Nguyen separa o processo de imitação humano-robô em três etapas principais, a saber, estimativa de pose, redirecionamento de movimento e controle do robô. Em primeiro lugar, utiliza algoritmos de estimativa de pose para prever sequências de posições das articulações do esqueleto que sustentam os movimentos demonstrados por agentes humanos.

Posteriormente, o modelo traduz esta sequência prevista de posições das articulações do esqueleto em posições articulares semelhantes que podem ser realisticamente produzidas pelo corpo do robô. Finalmente, essas sequências traduzidas são utilizadas para planejar os movimentos do robô, resultando teoricamente em movimentos dinâmicos que poderiam ajudar o robô realizando a tarefa em questão.

“Para treinar tal modelo, seria possível usar pares de movimentos humanos e robóticos associados, [embora] esses dados emparelhados sejam extremamente raros na prática e tediosos de coletar”, escreveram os pesquisadores em seu artigo. “Portanto, nos voltamos para métodos de aprendizagem profunda para tradução não pareada de domínio para domínio, que adaptamos para realizar imitação humano-robô.”

Annabi, Ma e Nguyen avaliaram o desempenho de seu modelo em uma série de testes preliminares, comparando-o a um método mais simples para reproduzir orientações conjuntas que não é baseado em deep learning. Seu modelo não alcançou os resultados esperados, sugerindo que os atuais métodos de aprendizagem profunda podem não ser capazes de redirecionar com sucesso os movimentos em tempo real.

Os investigadores planeiam agora realizar mais experiências para identificar potenciais problemas com a sua abordagem, para que possam resolvê-los e adaptar o modelo para melhorar o seu desempenho. As descobertas da equipe até agora sugerem que, embora técnicas de aprendizagem profunda não supervisionadas possam ser usadas para permitir a aprendizagem por imitação em robôs, o seu desempenho ainda não é bom o suficiente para serem implementadas em robôs reais.

“Trabalhos futuros estenderão o estudo atual em três direções: investigar ainda mais a falha do método atual, conforme explicado na última seção, criar um conjunto de dados de movimento emparelhado de imitação humano-humano ou imitação robô-humano, e melhorar o modelo arquitetura para obter previsões de retargeting mais precisas”, concluem os pesquisadores em seu artigo.


Publicado em 17/03/2024 04h56

Artigo original:

Estudo original: