Rede Neural e Reconhecimento Facial

Three CNN models for facial expression recognition in the wild

Três modelos de rede neural convolucional para reconhecimento da expressão facial na natureza

Dois pesquisadores da Universidade de Energia Elétrica de Xangai desenvolveram e avaliaram recentemente novos modelos de redes neurais para reconhecimento de expressões faciais (FER) na natureza. Seu estudo, publicado na revista Neurocomputing da Elsevier, apresenta três modelos de redes neurais de convolução (Convolutional Neural Networks em inglês – CNNs): uma CNN-Light, uma CNN de duas ramificações e uma CNN pré-treinada.

“Devido à falta de informações sobre faces não frontais, o FER na natureza é um ponto difícil na visão computacional”, disse Qian Yongsheng, um dos pesquisadores que realizou o estudo, à TechXplore. “Os métodos existentes de reconhecimento de expressão facial natural baseados em redes neurais de convolución profunda (CNNs) apresentam vários problemas, incluindo sobreposição, alta complexidade computacional, característica única e amostras limitadas.”

Embora muitos pesquisadores tenham desenvolvido abordagens CNN para FER, até agora, muito poucos deles tentaram determinar que tipo de rede é mais adequado para essa tarefa específica. Consciente dessa lacuna na literatura, Yongsheng e seu colega Shao Jie desenvolveram três CNN diferentes para FER e realizaram uma série de avaliações para identificar seus pontos fortes e fracos.

“Nosso primeiro modelo é um CNN de pouca luz que introduz um módulo separável em profundidade com o módulo de rede residual, reduzindo os parâmetros de rede alterando o método de convolução”, disse Yongsheng. “A segunda é uma CNN de ramificação dupla, que combina recursos globais e características de textura locais, tentando obter recursos mais ricos e compensar a falta de invariância de rotação da convolução. A terceira CNN pré-treinada usa pesos treinados no mesmo grande banco de dados distribuído reciclar em seu próprio banco de dados pequeno, reduzindo o tempo de treinamento e melhorando a taxa de reconhecimento. “

Three CNN models for facial expression recognition in the wild

Os pesquisadores realizaram extensas avaliações de seus modelos de CNN em três conjuntos de dados que são comumente usados ??para FER: os conjuntos de dados públicos CK +, multi-view BU-3DEF e FER2013. Embora os três modelos da CNN apresentassem diferenças de desempenho, todos alcançaram resultados promissores, superando várias abordagens de ponta para a FER.

“Atualmente, os três modelos da CNN são usados ??separadamente”, explicou Yongsheng. “A rede rasa é mais adequada para hardware embarcado. A CNN pré-treinada pode alcançar melhores resultados, mas requer pesos pré-treinados. A rede de ramificação dupla não é muito eficaz. É claro que também se pode tentar usar os três modelos. juntos.”

Em suas avaliações, os pesquisadores observaram que, combinando o módulo de rede residual e o módulo separável em profundidade, como fizeram em seu primeiro modelo de CNN, os parâmetros de rede poderiam ser reduzidos. Isso poderia resolver algumas das deficiências do hardware de computação. Além disso, eles descobriram que o modelo CNN pré-treinado transferiu um grande banco de dados para seu próprio banco de dados e, portanto, poderia ser treinado com amostras limitadas.

Three CNN models for facial expression recognition in the wild

As três CNNs para FER propostas por Yongsheng e Jie poderiam ter inúmeras aplicações, por exemplo, auxiliando no desenvolvimento de robôs que podem identificar as expressões faciais de humanos com quem eles estão interagindo. Os pesquisadores agora planejam fazer ajustes adicionais em seus modelos, a fim de melhorar ainda mais seu desempenho.

“Em nosso trabalho futuro, vamos tentar adicionar diferentes recursos manuais tradicionais para unir a CNN de duas ramificações e mudar o modo de fusão”, disse Yongsheng. “Também usaremos parâmetros de rede de treinamento entre bancos de dados para obter melhores recursos de generalização e adotar uma abordagem de aprendizagem de transferência profunda mais eficaz.”

Artigo original: https://techxplore.com/news/2019-05-convolutional-neural-network-facial-recognition.html