Melhorando a navegação autônoma de robôs móveis em espaços lotados usando pessoas como sensores

Credit: Mun et al.

Uma equipe de pesquisadores da Universidade de Illinois em Urbana-Champaign e da Universidade de Stanford, liderada pela Prof. Katie Driggs-Campbell, desenvolveu recentemente um novo método baseado em aprendizado de reforço profundo que pode melhorar a capacidade de robôs móveis de navegar com segurança em espaços lotados. Seu método, apresentado em um artigo pré-publicado no arXiv, é baseado na ideia de usar pessoas no entorno do robô como indicadores de possíveis obstáculos.

“Nosso artigo se baseia na direção de pesquisa ‘pessoas como sensores’ para mapeamento na presença de oclusões”, disse Masha Itkina, uma das pesquisadoras que realizaram o estudo, ao TechXplore. “O principal insight é que podemos fazer inferências espaciais sobre o ambiente observando comportamentos humanos interativos, tratando as pessoas como sensores. Por exemplo, se observarmos um motorista freando bruscamente, podemos inferir que um pedestre pode ter saído correndo na estrada. na frente desse motorista.”

A ideia de usar pessoas e seus comportamentos interativos para estimar a presença ou ausência de obstáculos obstruídos foi introduzida pela primeira vez por Afolabi et al em 2018, especificamente no contexto de veículos autônomos. Em seu trabalho anterior, Itkina e seus colegas aproveitaram os esforços desse grupo, generalizando a ideia de “pessoas como sensores” para considerar vários motoristas humanos observados, em vez de um único motorista (conforme considerado pela abordagem da equipe de Afolabi).

Para fazer isso, eles desenvolveram um modelo de “sensor” para todos os diferentes motoristas no entorno de um veículo autônomo. Cada um desses modelos mapeou a trajetória do motorista para uma representação da grade de ocupação do ambiente à frente do motorista. Posteriormente, essas estimativas de ocupação foram incorporadas ao mapa do robô autônomo, utilizando técnicas de fusão de sensores.

“Em nosso artigo recente, fechamos o ciclo considerando a inferência de oclusão dentro de um pipeline de aprendizado por reforço”, disse Itkina. “Nosso objetivo foi demonstrar que a inferência de oclusão é benéfica para um planejador de caminho a jusante, particularmente quando a representação espacial está ciente da tarefa. uma política que atinge com sucesso e segurança a meta.”

A maioria dos modelos desenvolvidos anteriormente que veem as pessoas como sensores são projetados especificamente para serem implementados em ambientes urbanos, para aumentar a segurança dos veículos autônomos. O novo modelo, por outro lado, foi projetado para melhorar a capacidade de um robô móvel de navegar em multidões de pessoas.

As tarefas de navegação de multidões são geralmente mais difíceis do que as tarefas de condução urbana para sistemas autônomos, pois os comportamentos humanos em multidões são menos estruturados e, portanto, mais imprevisíveis. Os pesquisadores decidiram abordar essas tarefas usando um modelo de aprendizado de reforço profundo integrado a um espaço latente com reconhecimento de oclusão aprendido por um autoencoder variacional (VAE).

“Primeiro, representamos o ambiente ao redor do robô em um mapa de grade de ocupação local, muito parecido com uma visão panorâmica ou uma imagem de cima para baixo dos obstáculos ao redor do robô”, disse Ye-Ji Mun, o primeiro autor deste estudo, ao TechXplore. “Este mapa de grade de ocupação nos permite capturar comportamentos interativos ricos dentro da área de grade, independentemente do número ou tamanho e forma dos objetos e pessoas.”

O modelo dos pesquisadores inclui um módulo de inferência de oclusão, que foi treinado para extrair comportamentos sociais observados, como desacelerar ou girar para evitar colisões de sequências coletadas de entradas de mapas. Posteriormente, ele usa essas informações para prever onde objetos ou agentes ocluídos podem estar localizados e codifica essa “informação de percepção aumentada” em uma representação latente de baixa dimensão, usando a arquitetura VAE.

“Como nosso módulo de inferência de oclusão é fornecido apenas com observação parcial dos agentes humanos ao redor, também temos um modelo supervisor, cujo vetor latente codifica a localização espacial para os agentes humanos observados e ocluídos durante o treinamento”, explicou Mun. “Ao combinar o espaço latente do nosso módulo de oclusão com o do modelo supervisor, aumentamos a informação perceptiva associando os comportamentos sociais observados com as localizações espaciais dos agentes humanos ocluídos”.

A representação latente com reconhecimento de oclusão resultante é, em última análise, alimentada a uma estrutura de aprendizado de reforço profundo que incentiva o robô a evitar colisões de forma proativa enquanto completa sua missão. Itkina, Mun e seus colegas testaram seu modelo em uma série de experimentos, tanto em ambiente simulado quanto no mundo real, usando o robô móvel Turtlebot 2i.

“Implementamos com sucesso o conceito de ‘pessoas como sensores’ para aumentar a percepção limitada do robô e realizar navegação de multidão com reconhecimento de oclusão”, disse Mun. “Demonstramos que nossa política de reconhecimento de oclusão alcança um desempenho de navegação muito melhor (ou seja, melhor prevenção de colisões e caminhos de navegação mais suaves) do que a navegação de visão limitada e comparável à navegação de visão onisciente. Até onde sabemos, este trabalho é o primeiro a usar inferência de oclusão social para navegação de multidões.”

Em seus testes, Itkina, Mun e seus colegas também descobriram que seu modelo gerou mapas imperfeitos, que não contêm as localizações exatas dos agentes observados e dos agentes estimados. Em vez disso, seu módulo aprende a se concentrar em estimar a localização de ‘agentes críticos’ próximos que podem estar obstruídos e podem bloquear o caminho do robô em direção a um local desejado.

“Esse resultado implica que um mapa completo não é necessariamente um mapa melhor para navegação em um ambiente lotado e parcialmente observável, mas focar em alguns agentes potencialmente perigosos é mais importante”, disse Mun.

As descobertas iniciais reunidas por essa equipe de pesquisadores são altamente promissoras, pois destacam o potencial de seu método para reduzir as colisões de um robô com obstáculos em ambientes lotados. No futuro, seu modelo poderá ser implementado em robôs móveis existentes e recém-desenvolvidos, projetados para navegar em shoppings, aeroportos, escritórios e outros ambientes lotados.

“A principal motivação para este trabalho foi capturar a intuição humana ao navegar em torno de humanos, particularmente em ambientes fechados”, acrescentou Itkina. “Esperamos aprofundar a captura de insights humanos para melhorar as capacidades do robô. Especificamente, estamos interessados em como podemos simultaneamente fazer previsões para o ambiente e inferir oclusões, pois as entradas para ambas as tarefas envolvem observações históricas de comportamentos humanos. Também estamos pensando sobre como essas ideias podem ser transferidas para diferentes configurações, como armazém e robótica assistida.”


Publicado em 06/11/2022 11h04

Artigo original:

Estudo original: