Imitando o olho humano, pesquisadores revolucionam câmeras robóticas

Conceito de arte de visão computacional de olho robótico

doi.org/10.1126/scirobotics.adj8124
Credibilidade: 999
#robótico 

Nova câmera imita os movimentos involuntários do olho humano para criar imagens mais nítidas e precisas para robôs, smartphones e outros dispositivos de captura de imagens

Cientistas da computação inventaram um mecanismo de câmera que melhora a forma como os robôs veem e reagem ao mundo ao seu redor.

Inspirada na forma como o olho humano funciona, a equipe de investigação, liderada pela Universidade de Maryland, desenvolveu um sistema de câmara inovador que imita os pequenos movimentos involuntários usados pelo olho para manter uma visão clara e estável ao longo do tempo.

A prototipagem e teste da câmera pela equipe, chamada Artificial Microsaccade-Enhanced Event Camera (AMI-EV), foi detalhada em um artigo publicado recentemente na revista Science Robotics.

Avanços na tecnologia de câmeras de eventos: As câmeras de eventos são uma tecnologia relativamente nova, melhor no rastreamento de objetos em movimento do que as câmeras tradicionais, mas as câmeras de eventos atuais lutam para capturar imagens nítidas e sem desfoque quando há muito movimento envolvido, – disse o principal autor do artigo, Botao.

Ele, um Ph.D.

em ciência da computação.

estudante da UMD.

É um grande problema porque os robôs e muitas outras tecnologias, como os carros autônomos, dependem de imagens precisas e oportunas para reagir corretamente a um ambiente em mudança.

Então, nos perguntamos: Como os humanos e os animais garantem que sua visão permaneça focada em um objeto em movimento? – [2] Imitando os movimentos do olho humano: Para a equipe de He, a resposta foram microsacadas, movimentos oculares pequenos e rápidos que ocorrem involuntariamente quando um pessoa tenta focar sua visão.

Através desses movimentos mínimos, porém contínuos, o olho humano pode manter o foco em um objeto e em suas texturas visuais, como cor, profundidade e sombras, com precisão ao longo do tempo.

Descobrimos que, assim como nossos olhos precisam desses pequenos movimentos para permanecerem focados, uma câmera poderia usar um princípio semelhante para capturar imagens claras e precisas sem o desfoque causado pelo movimento”, disse ele.

Implementação e testes tecnológicos: A equipe replicou com sucesso microsacadas inserindo um prisma giratório dentro do AMI-EV para redirecionar os feixes de luz capturados pela lente.

O movimento rotacional contínuo do prisma simulou os movimentos que ocorrem naturalmente no olho humano, permitindo que a câmera estabilize as texturas de um objeto gravado, assim como um ser humano faria.

A equipe então desenvolveu um software para compensar o movimento do prisma dentro do AMI-EV para consolidar imagens estáveis das luzes inconstantes.

[3] O co-autor do estudo, Yiannis Aloimonos, professor de ciência da computação na UMD, vê a invenção da equipe como um grande passo em frente no domínio da visão robótica.

Nossos olhos tiram fotos do mundo ao nosso redor e essas imagens são enviadas ao nosso cérebro, onde as imagens são analisadas.

A percepção acontece por meio desse processo e é assim que entendemos o mundo, – explicou Aloimonos, que também é diretor do Laboratório de Visão Computacional do Instituto de Estudos Avançados de Computação da Universidade de Maryland (UMIACS).

Ao trabalhar com robôs, substitua os olhos por uma câmera e o cérebro por um computador.

Câmeras melhores significam melhor percepção e reações para os robôs.- https://youtu.be/v4S-uTZD5qE Impacto potencial em várias indústrias: Os pesquisadores também acreditam que sua inovação pode ter implicações significativas além da robótica e da defesa nacional.

Cientistas que trabalham em indústrias que dependem de captura precisa de imagens e detecção de formas estão constantemente procurando maneiras de melhorar suas câmeras e o AMI-EV pode ser a solução chave para muitos dos problemas que enfrentam.

Com seus recursos exclusivos, os sensores de eventos e o AMI-EV estão preparados para ocupar o centro do palco no mundo dos wearables inteligentes, – disse a cientista pesquisadora Cornelia Fermücler, autora sênior do artigo.

Eles têm vantagens distintas em relação às câmeras clássicas, como desempenho superior em condições extremas de iluminação, baixa latência e baixo consumo de energia.

Esses recursos são ideais para aplicações de realidade virtual, por exemplo, onde uma experiência perfeita e cálculos rápidos de movimentos da cabeça e do corpo são necessários.

– [4] Aprimoramentos no processamento de imagens em tempo real: nos primeiros testes, o AMI-EV foi capaz de capture e exiba movimentos com precisão em uma variedade de contextos, incluindo detecção de pulso humano e identificação de formas em movimento rápido.

Os pesquisadores também descobriram que o AMI-EV pode capturar movimento em dezenas de milhares de quadros por segundo, superando o desempenho da maioria das câmeras comerciais disponíveis, que capturam em média de 30 a 1.000 quadros por segundo.

Esta representação mais suave e realista do movimento pode revelar-se fundamental em qualquer coisa, desde a criação de experiências de realidade aumentada mais imersivas e melhor monitorização de segurança até à melhoria da forma como os astrônomos capturam imagens no espaço.

Conclusão e perspectivas futuras: Nosso novo sistema de câmeras pode resolver muitos problemas específicos, como ajudar um carro autônomo a descobrir o que é humano e o que não é na estrada, – disse Aloimonos.

Como resultado, possui muitas aplicações com as quais grande parte do público em geral já interage, como sistemas de condução autónoma ou mesmo câmaras de smartphones.

Representação de um novo sistema de câmeras de eventos versus sistema de câmeras de eventos padrão. Crédito: Botao He, Yiannis Aloimonos, Cornelia Fermuller, Jingxi Chen, Chahat Deep Singh

Acreditamos que nosso novo sistema de câmeras está abrindo caminho para sistemas mais avançados e capazes que virão.-

Uma demonstração de como as microssacadas neutralizam o desbotamento visual. Após alguns segundos de fixação (olhar fixo) no ponto vermelho nesta imagem estática, os detalhes do fundo desta imagem começam a desaparecer visualmente. Isso ocorre porque as microssacadas foram suprimidas durante esse período e o olho não consegue fornecer estimulação visual eficaz para evitar o desbotamento periférico. Crédito: Laboratório de Visão Computacional UMIACS

Representação de um novo sistema de câmeras de eventos versus sistema de câmeras de eventos padrão. Crédito: Botao He, Yiannis Aloimonos, Cornelia Fermuller, Jingxi Chen, Chahat Deep Singh


Publicado em 26/07/2024 21h36

Artigo original:

Estudo original: