Redes neurais ópticas convolucionais anunciam uma nova era para imagens de IA

Esquema de dispersão através de múltiplos difusores. Cada difusor pode ser modelado como uma fina camada de espalhamento, com N representando o número de difusores e d representando o espaçamento entre difusores. Crédito: Avanços da Ciência (2024). DOI: 10.1126/sciadv.adn2205

doi.org/10.1126/sciadv.adn2205
Credibilidade: 989
#Redes neurais

As redes neurais convolucionais (CNNs), com suas excepcionais capacidades de reconhecimento de imagem, têm tido um desempenho notável no campo da IA e principalmente em plataformas como ChatGPT. Recentemente, uma equipe de pesquisadores chineses da Universidade de Xangai para Ciência e Tecnologia introduziu com sucesso o conceito de CNNs no campo da óptica e realizou uma rede neural convolucional totalmente óptica, trazendo um progresso revolucionário à tecnologia de imagem de IA.

Liderada pelo Prof.Min Gu e Prof.Qiming Zhang da Escola de Ciência e Tecnologia de Inteligência Artificial (SAIST) da Universidade de Ciência e Tecnologia de Xangai (USST), a equipe de pesquisa desenvolveu uma rede neural óptica convolucional ultrarrápida (ONN), que alcança imagens eficientes e claras de objetos atrás da mídia de dispersão sem depender do efeito de memória óptica.

Esta descoberta foi publicada na revista Science Advances, em um artigo intitulado “Imagem de espalhamento sem memória com redes neurais ópticas convolucionais ultrarrápidas”.

Dr. Yuchao Zhang, pesquisador do SAIST, é o primeiro autor.

Prof.Min Gu e Prof.Qiming Zhang são os autores correspondentes.

O núcleo das CNNs, operações convolucionais, extrai características locais de imagens e constrói representações de características mais complexas e abstratas, camada por camada, avançando enormemente nos campos de processamento de imagens e reconhecimento de padrões.

No entanto, aplicar o conceito de operações de rede de convolução ao campo da óptica enfrenta o desafio de converter sinais eletrônicos em sinais ópticos.

A equipe de pesquisa projetou engenhosamente uma solução totalmente óptica, realizando operações de rede de convolução diretamente no domínio óptico, eliminando o complicado processo de conversão de sinal e alcançando verdadeiras velocidades de computação óptica.

A chave para esta pesquisa é a construção de uma ONN convolucional de múltiplos estágios, composta por múltiplos núcleos paralelos capazes de operar na velocidade da luz, extraindo diretamente características da luz espalhada para rápida reconstrução da imagem.

Este processo não apenas melhora muito a velocidade da imagem, mas também melhora significativamente a qualidade da imagem, tornando possível a imagem em ambientes de dispersão complexos.

Além disso, a velocidade computacional do ONN convolucional atinge 1,57 peta operações por segundo (POPS), fornecendo suporte robusto para imagens dinâmicas em tempo real.

Outro destaque desta pesquisa é sua capacidade multitarefa.

Simplesmente ajustando a estrutura da rede, a mesma ONN convolucional pode realizar uma variedade de diferentes tarefas de processamento de imagem, como classificação e reconstrução, simultaneamente – uma inovação no campo da inteligência artificial óptica.

O professor Qiming Zhang observou: “Esta combinação de flexibilidade e eficiência não apenas ressalta a importância das redes convolucionais na inteligência artificial, mas também abre novos caminhos para a tecnologia de imagem óptica.” O advento desta pesquisa não é apenas um transplante bem-sucedido de redes neurais convolucionais para o campo óptico, mas também um impulso significativo para a tecnologia de imagem de IA.

O professor Min Gu afirmou: “Em um futuro próximo, as redes neurais ópticas convolucionais desempenharão um papel cada vez mais vital na direção autônoma, na visão robótica e nas imagens médicas.”


Publicado em 27/06/2024 21h21

Artigo original:

Estudo original: