Um novo sistema de rastreamento de movimento 3D em tempo real desenvolvido na Universidade de Michigan combina detectores de luz transparentes com métodos avançados de rede neural para criar um sistema que poderia um dia substituir LiDAR e câmeras em tecnologias autônomas.
Embora a tecnologia ainda esteja em sua infância, as aplicações futuras incluem manufatura automatizada, imagens biomédicas e direção autônoma. Um artigo sobre o sistema foi publicado na Nature Communications.
O sistema de imagem explora as vantagens dos fotodetectores de grafeno transparentes, em nanoescala e altamente sensíveis desenvolvidos por Zhaohui Zhong, professor associado de engenharia elétrica e de computação da U-M e seu grupo. Eles são considerados os primeiros de sua espécie.
“A combinação em profundidade de nanodispositivos de grafeno e algoritmos de aprendizado de máquina pode levar a oportunidades fascinantes tanto na ciência quanto na tecnologia”, disse Dehui Zhang, estudante de doutorado em engenharia elétrica e de computação. “Nosso sistema combina eficiência de energia computacional, velocidade de rastreamento rápido, hardware compacto e um custo mais baixo em comparação com várias outras soluções.”
Os fotodetectores de grafeno neste trabalho foram ajustados para absorver apenas cerca de 10% da luz à qual estão expostos, tornando-os quase transparentes. Como o grafeno é muito sensível à luz, isso é suficiente para gerar imagens que podem ser reconstruídas por meio de imagens computacionais. Os fotodetectores são empilhados um atrás do outro, resultando em um sistema compacto, e cada camada se concentra em um plano focal diferente, o que permite imagens 3D.
Mas a imagem 3D é apenas o começo. A equipe também lidou com o rastreamento de movimento em tempo real, que é fundamental para uma ampla gama de aplicativos robóticos autônomos. Para fazer isso, eles precisavam determinar a posição e a orientação de um objeto que está sendo rastreado. Abordagens típicas envolvem sistemas LiDAR e câmeras de campo de luz, ambos os quais sofrem de limitações significativas, dizem os pesquisadores. Outros usam metamateriais ou câmeras múltiplas. O hardware sozinho não foi suficiente para produzir os resultados desejados.
Eles também precisavam de algoritmos de aprendizado profundo. Ajudando a construir uma ponte entre esses dois mundos estava Zhen Xu, um estudante de doutorado em engenharia elétrica e da computação. Ele construiu a configuração óptica e trabalhou com a equipe para permitir que uma rede neural decifrasse as informações posicionais.
A rede neural é treinada para pesquisar objetos específicos em toda a cena e, em seguida, focar apenas no objeto de interesse – por exemplo, um pedestre no trânsito ou um objeto entrando em sua pista em uma rodovia. A tecnologia funciona particularmente bem para sistemas estáveis, como fabricação automatizada ou projeção de estruturas do corpo humano em 3D para a comunidade médica.
“Leva tempo para treinar sua rede neural”, disse o líder do projeto Ted Norris, professor de engenharia elétrica e da computação. “Mas uma vez feito, está feito. Então, quando uma câmera vê uma determinada cena, ela pode dar uma resposta em milissegundos.”
O estudante de doutorado Zhengyu Huang liderou o projeto do algoritmo para a rede neural. O tipo de algoritmos que a equipe desenvolveu são diferentes dos algoritmos de processamento de sinal tradicionais usados para tecnologias de imagem de longa data, como raios-X e ressonância magnética. E isso é empolgante para o co-líder da equipe Jeffrey Fessler, professor de engenharia elétrica e de computação, especializado em imagens médicas.
“Em meus 30 anos em Michigan, este é o primeiro projeto em que estive envolvido em que a tecnologia está em sua infância”, disse Fessler. “Estamos muito longe de algo que você vai comprar na Best Buy, mas tudo bem. Isso é parte do que torna isso emocionante.”
A equipe demonstrou sucesso rastreando um feixe de luz, bem como uma joaninha real com uma pilha de duas matrizes fotodetectoras de grafeno 4×4 (16 pixels). Eles também provaram que sua técnica é escalonável. Eles acreditam que seriam necessários apenas 4.000 pixels para algumas aplicações práticas e matrizes de 400×600 pixels para muitas outras.
Embora a tecnologia possa ser usada com outros materiais, as vantagens adicionais do grafeno são que ele não requer iluminação artificial e é ecologicamente correto. Será um desafio construir a infraestrutura de manufatura necessária para a produção em massa, mas pode valer a pena, dizem os pesquisadores.
“O grafeno é agora o que o silício era em 1960”, disse Norris. “À medida que continuamos a desenvolver essa tecnologia, ela pode motivar o tipo de investimento que seria necessário para a comercialização.”
O artigo é intitulado “Rastreamento 3D baseado em rede neural com um sistema de imagem de pilha focal transparente de grafeno.”
Publicado em 24/04/2021 18h43
Artigo original: