Câmera projetada com Inteligência Artificial grava apenas objetos de interesse enquanto ignora outros

Imagem específica de classe de objeto usando uma câmera difrativa. a Ilustração de uma câmera difrativa de três camadas treinada para realizar imagens específicas de classe de objeto com apagamento totalmente óptico instantâneo das outras classes de objetos em seu FOV de saída. b A configuração experimental para o teste de câmera difrativa usando iluminação THz coerente. Crédito: eLight (2022). DOI: 10.1186/s43593-022-00021-3

Na última década, as câmeras digitais foram amplamente adotadas em vários aspectos da nossa sociedade e estão sendo massivamente usadas em telefones celulares, vigilância de segurança, veículos autônomos e reconhecimento facial. Por meio dessas câmeras, enormes quantidades de dados de imagem estão sendo geradas, o que aumenta a preocupação com a proteção da privacidade.

Alguns métodos existentes abordam essas preocupações aplicando algoritmos para ocultar informações confidenciais das imagens adquiridas, como desfoque de imagem ou criptografia. No entanto, esses métodos ainda arriscam a exposição de dados confidenciais porque as imagens brutas já são capturadas antes de serem submetidas ao processamento digital para ocultar ou criptografar as informações confidenciais. Além disso, o cálculo desses algoritmos requer consumo de energia adicional. Outros esforços também foram feitos para buscar soluções para esse problema, usando câmeras personalizadas para diminuir a qualidade da imagem, de modo que informações identificáveis possam ser ocultadas. No entanto, essas abordagens sacrificam a qualidade geral da imagem para todos os objetos de interesse, o que é indesejado, e ainda são vulneráveis a ataques adversários para recuperar as informações confidenciais registradas.

Um novo trabalho de pesquisa publicado na eLight demonstrou um novo paradigma para obter imagens que preservam a privacidade, construindo um tipo fundamentalmente novo de imager projetado pela IA. Em seu artigo, os pesquisadores da UCLA, liderados pelo professor Aydogan Ozcan, apresentaram um design de câmera inteligente que fotografa apenas certos tipos de objetos desejados, enquanto apaga instantaneamente outros tipos de objetos de suas imagens sem exigir nenhum processamento digital.

Este novo design de câmera consiste em sucessivas superfícies transmissivas, cada uma composta por dezenas de milhares de características difrativas na escala do comprimento de onda da luz. A estrutura dessas superfícies transmissivas é otimizada usando aprendizado profundo para modular a fase dos campos ópticos transmitidos de forma que a câmera apenas capture certos tipos/classes de objetos desejados e apague os outros. Após seu design baseado em deep learning (treinamento), as camadas resultantes são fabricadas e montadas em 3D, formando a câmera inteligente. Após sua montagem, quando os objetos de entrada das classes de objetos de destino aparecem na frente dele, eles formam imagens de alta qualidade na saída da câmera – conforme desejado. Em contraste, quando os objetos de entrada na frente da mesma câmera pertencem a outras classes indesejadas, eles são apagados opticamente, formando padrões não informativos e de baixa intensidade semelhantes ao ruído aleatório.

Como as informações características de classes indesejadas de objetos são apagadas de forma totalmente óptica na saída da câmera por meio de difração de luz, essa câmera projetada por IA nunca grava suas imagens diretas. Portanto, a proteção da privacidade é maximizada, pois um ataque adversário que tenha acesso às imagens gravadas desta câmera não pode trazer as informações de volta. Esse recurso também pode reduzir o armazenamento de dados das câmeras e a carga de transmissão, pois as imagens de objetos indesejados não são gravadas.

Para demonstrar experimentalmente essa câmera exclusiva de dados específicos, a equipe de pesquisa da UCLA a projetou para criar imagens específicas e seletivas de apenas uma classe de dígitos manuscritos e fabricou a câmera projetada usando impressão 3D. Esta câmera impressa em 3D foi testada usando ondas terahertz que iluminam dígitos manuscritos. Seguindo os princípios básicos de seu design, a câmera inteligente foi capaz de criar imagens seletivamente dos objetos de entrada apenas se fossem dígitos manuscritos “2”, enquanto apagava instantaneamente todos os outros dígitos manuscritos das imagens de saída, produzindo recursos semelhantes a ruído de baixa intensidade .

Além dos dígitos manuscritos, os pesquisadores da UCLA também demonstraram outra variação do mesmo design de câmera específico de classe ao criar imagens seletivamente de um tipo de produto de moda (por exemplo, calças), enquanto apagava instantaneamente outros produtos de moda da saída da câmera. A equipe de pesquisa testou rigorosamente o design de sua câmera sob condições de iluminação variadas que nunca foram incluídas em seu treinamento e mostrou que essa câmera inteligente é robusta a variações de iluminação.

Além da imagem específica de classe de dados, esse design de câmera baseado em IA também foi usado para construir câmeras de criptografia, fornecendo uma camada adicional de segurança e proteção de privacidade. Essa câmera de criptografia, projetada usando camadas difrativas otimizadas para IA, realiza opticamente uma transformação linear selecionada, exclusivamente para os objetos alvo de interesse. Somente aqueles com acesso à chave de descriptografia (ou seja, a transformação linear inversa neste caso) podem recuperar a imagem original dos objetos de destino. Por outro lado, as informações de outros objetos indesejados são irreversivelmente perdidas, pois a câmera projetada por IA os apaga de forma totalmente óptica na saída. Portanto, mesmo que a chave de descriptografia seja aplicada às imagens gravadas, ela produz recursos semelhantes a ruídos e irreconhecíveis para outras classes de objetos indesejados.

Com exceção da luz de iluminação, esta câmera inteligente não requer nenhuma energia externa para seu cálculo e opera na velocidade da luz. Portanto, é rápido, eficiente em termos de dados e energia, tornando-o especialmente adequado para aplicativos de imagem específicos para tarefas, com reconhecimento de privacidade e com limitação de energia. Os ensinamentos centrais deste projeto de câmera difrativa podem inspirar futuros sistemas de imagem que consomem ordens de magnitude menos computação e energia de transmissão de dados.

Esta pesquisa foi liderada pelo professor Aydogan Ozcan, diretor associado do California NanoSystems Institute (CNSI) e pela Volgenau Chair for Engineering Innovation no departamento de Engenharia Elétrica e de Computação (ECE) da UCLA, juntamente com a professora Mona Jarrahi, a Northrop Grumman Endowed Presidente e diretor do Laboratório de Eletrônica Terahertz da UCLA ECE. Os outros autores deste trabalho incluem os estudantes de pós-graduação Bijie Bai, Yi Luo, Tianyi Gan, Yuhang Li, Yifan Zhao, Deniz Mengu e o pesquisador de pós-doutorado Dr. Jingtian Hu, todos com o departamento de ECE da UCLA.


Publicado em 16/08/2022 11h42

Artigo original:

Estudo original: