Uma solução otimizada para reconhecimento facial

Neurocientistas do Instituto McGovern do MIT descobriram que uma rede computacional treinada para identificar rostos e outros objetos descobre uma estratégia surpreendentemente semelhante ao cérebro para classificá-los todos.

Quando a inteligência artificial é encarregada de identificar visualmente objetos e rostos, ela atribui componentes específicos de sua rede ao reconhecimento facial – assim como o cérebro humano.

O cérebro humano parece se importar muito com rostos. É dedicada uma área específica para identificá-los, e os neurônios de lá são tão bons em seu trabalho que a maioria de nós pode reconhecer prontamente milhares de indivíduos. Com a inteligência artificial, os computadores agora podem reconhecer rostos com eficiência semelhante – e neurocientistas do McGovern Institute for Brain Research do MIT descobriram que uma rede computacional treinada para identificar rostos e outros objetos descobre uma estratégia surpreendentemente semelhante ao cérebro para classificá-los.

A descoberta, relatada em 16 de março na Science Advances, sugere que os milhões de anos de evolução que moldaram os circuitos no cérebro humano otimizaram nosso sistema para reconhecimento facial.

“A solução do cérebro humano é segregar o processamento de rostos do processamento de objetos”, explica Katharina Dobs, que liderou o estudo como pós-doutoranda no laboratório da investigadora de McGovern Nancy Kanwisher, professora Walter A. Rosenblith de neurociência cognitiva no MIT . A rede artificial que ela treinou fez o mesmo. “E essa é a mesma solução que supomos que qualquer sistema treinado para reconhecer rostos e categorizar objetos encontraria”, acrescenta ela.

“Esses dois sistemas completamente diferentes descobriram o que é uma – se não a – boa solução. E isso parece muito profundo”, diz Kanwisher.

Regiões do cérebro funcionalmente específicas

Mais de 20 anos atrás, Kanwisher e seus colegas descobriram um pequeno ponto no lobo temporal do cérebro que responde especificamente aos rostos. Essa região, que eles chamaram de área fusiforme da face, é uma das muitas regiões cerebrais que Kanwisher e outros descobriram que são dedicadas a tarefas específicas, como a detecção de palavras escritas, a percepção de músicas vocais e a compreensão da linguagem.

Kanwisher diz que, ao explorar como o cérebro humano é organizado, sempre teve curiosidade sobre as razões dessa organização. O cérebro realmente precisa de máquinas especiais para reconhecimento facial e outras funções? Por que perguntas? são muito difíceis na ciência?, diz ela. Mas com um tipo sofisticado de aprendizado de máquina chamado rede neural profunda, sua equipe poderia pelo menos descobrir como um sistema diferente lidaria com uma tarefa semelhante.

Dobs, que agora é líder do grupo de pesquisa da Justus Liebig University Giessen, na Alemanha, reuniu centenas de milhares de imagens para treinar uma rede neural profunda no reconhecimento de rostos e objetos. A coleção incluiu os rostos de mais de 1.700 pessoas diferentes e centenas de diferentes tipos de objetos, de cadeiras a cheeseburgers. Todos estes foram apresentados à rede, sem pistas sobre qual era qual. “Nós nunca dissemos ao sistema que alguns deles são rostos e alguns deles são objetos. Portanto, é basicamente apenas uma grande tarefa”, diz Dobs. “Ele precisa reconhecer uma identidade de rosto, assim como uma bicicleta ou uma caneta.”

À medida que o programa aprendeu a identificar os objetos e rostos, ele se organizou em uma rede de processamento de informações com unidades dedicadas especificamente ao reconhecimento de rostos. Assim como o cérebro, essa especialização ocorreu durante os estágios posteriores do processamento da imagem. Tanto no cérebro quanto na rede artificial, os primeiros passos no reconhecimento facial envolvem máquinas de processamento de visão mais gerais, e os estágios finais dependem de componentes dedicados ao rosto.

Não se sabe como a maquinaria de processamento de rosto surge em um cérebro em desenvolvimento, mas com base em suas descobertas, Kanwisher e Dobs dizem que as redes não exigem necessariamente um mecanismo inato de processamento de rosto para adquirir essa especialização. “Não construímos nada de cara em nossa rede”, diz Kanwisher. “As redes conseguiram se segregar sem receber um empurrão específico para o rosto”.

Kanwisher diz que foi emocionante ver a rede neural profunda se segregar em partes separadas para reconhecimento de rosto e objeto. “É isso que estamos vendo no cérebro há 20 anos”, diz ela. “Por que temos um sistema separado para reconhecimento facial no cérebro” Isso me diz que é porque é assim que uma solução otimizada se parece.”

Agora, ela está ansiosa para usar redes neurais profundas para fazer perguntas semelhantes sobre por que outras funções cerebrais são organizadas do jeito que são. “Temos uma nova maneira de perguntar por que o cérebro está organizado do jeito que está”, diz ela. “Quanto da estrutura que vemos no cérebro humano surgirá espontaneamente ao treinar redes para realizar tarefas comparáveis?”


Publicado em 12/04/2022 22h31

Artigo original:

Estudo original: