Uma estrutura para navegação interna de robôs entre humanos

(Início) Um cenário de navegação visual autônomo considerado pelos pesquisadores, em um ambiente interno previamente desconhecido com seres humanos, usando imagens RGB monoculares (canto inferior direito). Para ensinar as máquinas a navegar em ambientes internos contendo seres humanos, os pesquisadores criaram o HumANav, um conjunto de dados que permite a renderização foto-realista em ambientes simulados (por exemplo, no canto inferior esquerdo). Crédito: Tolani et al.

Para realizar as tarefas que foram projetadas para concluir, os robôs móveis devem poder navegar pelos ambientes do mundo real com eficiência, evitando humanos ou outros obstáculos ao seu redor. Embora os objetos estáticos sejam tipicamente fáceis para os robôs detectarem e contornarem, evitar os humanos pode ser mais desafiador, pois implica prever seus movimentos futuros e planejar adequadamente.

Pesquisadores da Universidade da Califórnia, Berkeley, desenvolveram recentemente uma nova estrutura que poderia melhorar a navegação de robôs entre humanos em ambientes internos, como escritórios, residências ou museus. Seu modelo, apresentado em um artigo pré-publicado no arXiv, foi treinado em um conjunto de dados recém-compilado de imagens fotorrealistas chamado HumANav.

“Propomos uma nova estrutura para a navegação em torno dos seres humanos que combina a percepção baseada na aprendizagem com o controle ótimo baseado em modelos”, escreveram os pesquisadores em seu artigo.

A nova estrutura desenvolvida por esses pesquisadores, chamada LB-WayPtNav-DH, possui três componentes principais: uma percepção, um planejamento e um módulo de controle. O módulo de percepção é baseado em uma rede neural convolucional (CNN) que foi treinada para mapear a entrada visual do robô em um waypoint (isto é, o próximo estado desejado) usando aprendizado supervisionado.

O waypoint mapeado pela CNN é então alimentado aos módulos de planejamento e controle da estrutura. Combinados, esses dois módulos garantem que o robô se mova para o local de destino com segurança, evitando obstáculos e humanos ao seu redor.

Imagem explicando o que o conjunto de dados HumANav contém e como obtém renderização foto-realista de ambientes internos contendo seres humanos. Crédito: Tolani et al.

Os pesquisadores treinaram sua CNN em imagens incluídas em um conjunto de dados que compilaram, chamado HumANav. O HumANav contém imagens fotorrealistas e renderizadas de ambientes de edifícios simulados nos quais os humanos estão se movendo, adaptados de outro conjunto de dados chamado SURREAL. Essas imagens retratam 6000 malhas humanas texturizadas, organizadas por forma corporal, gênero e velocidade.

“A estrutura proposta aprende a antecipar e reagir ao movimento das pessoas com base apenas em uma imagem RGB monocular, sem prever explicitamente o movimento humano futuro”, escreveram os pesquisadores em seu artigo.

Os pesquisadores avaliaram o LB-WayPtNav-DH em uma série de experimentos, tanto em simulações quanto no mundo real. Em experimentos do mundo real, eles o aplicaram ao Turtlebot 2, um robô móvel de baixo custo com software de código aberto. Os pesquisadores relatam que a estrutura de navegação do robô generaliza bem para edifícios invisíveis, contornando efetivamente os seres humanos em ambientes simulados e no mundo real.

“Nossos experimentos demonstram que a combinação de controle e aprendizado com base em modelo leva a comportamentos de navegação melhores e mais eficientes em dados, em comparação com uma abordagem puramente baseada em aprendizado”, escreveram os pesquisadores em seu artigo.

A nova estrutura poderia finalmente ser aplicada a uma variedade de robôs móveis, melhorando sua navegação em ambientes internos. Até agora, sua abordagem provou um desempenho notavelmente bom, transferindo políticas desenvolvidas em simulação para ambientes do mundo real.

Em seus estudos futuros, os pesquisadores planejam treinar sua estrutura em imagens de ambientes mais complexos ou lotados. Além disso, eles gostariam de ampliar o conjunto de dados de treinamento que compilaram, incluindo um conjunto mais diversificado de imagens.


Publicado em 08/04/2020 06h11

Artigo original:

Estudo original:


Achou importante? Compartilhe!


Assine nossa newsletter e fique informado sobre Astrofísica, Biofísica, Geofísica e outras áreas. Preencha seu e-mail no espaço abaixo e clique em “OK”: