Uma ideia matemática que pode reduzir drasticamente o tamanho do conjunto de dados necessário para treinar sistemas de IA

Credit: CC0 Public Domain

Um par de estatísticos da Universidade de Waterloo propôs uma ideia de processo matemático que pode permitir o ensino de sistemas de IA sem a necessidade de um grande conjunto de dados. Ilia Sucholutsky e Matthias Schonlau escreveram um artigo descrevendo sua ideia e o publicaram no servidor de pré-impressão arXiv.

As aplicações de inteligência artificial (IA) têm sido objeto de muitas pesquisas ultimamente, com o desenvolvimento de redes de aprendizagem profunda, pesquisadores em uma ampla gama de campos começaram a encontrar usos para ela, incluindo a criação de vídeos falsos, aplicativos de jogos de tabuleiro e diagnósticos médicos.

Redes de aprendizado profundo requerem grandes conjuntos de dados para detectar padrões que revelam como realizar uma determinada tarefa, como escolher um determinado rosto em uma multidão. Nesse novo esforço, os pesquisadores se perguntaram se haveria uma maneira de reduzir o tamanho do conjunto de dados. Eles observaram que as crianças só precisam ver algumas fotos de um animal para reconhecer outros exemplos. Sendo estatísticos, eles se perguntavam se haveria uma maneira de usar a matemática para resolver o problema.

Os pesquisadores aproveitaram o trabalho recente de uma equipe do MIT. Eles descobriram que destilar as informações mais pertinentes descrevendo números manuscritos em um conjunto de dados conhecido como MNIST e empacotá-los juntos reduzia muito o número de caracteres que seu sistema de IA precisava para aprender a reconhecer letras em um novo conjunto de dados. A dupla no Canadá observou que o motivo pelo qual o sistema foi capaz de aprender com muito menos dados foi porque ele foi treinado para reconhecer números de uma nova maneira: em vez de apenas mostrar o número 3 mil vezes, eles o treinaram para reconhecer que o a meta era um número que se parecia um pouco (30 por cento) com o dígito 8 e assim por diante com outros dígitos. Eles chamaram essas dicas de rótulos suaves.

Eles então levaram essa ideia adiante, aplicando-a a um tipo de aprendizado de máquina chamado k-vizinho mais próximo (kNN), que lhes permitiu transferir sua ideia para uma abordagem gráfica. E usando essa abordagem, eles foram capazes de aplicar rótulos suaves a conjuntos de dados que descrevem as coordenadas XY em um gráfico. Como resultado, o sistema de IA foi facilmente treinado para colocar pontos em um gráfico no lado correto de uma linha desenhada sem a necessidade de um grande conjunto de dados. Os pesquisadores descrevem sua abordagem como “aprendizado menor que uma tentativa” (LO-shot) e sugerem que pode ser possível expandi-lo para outras áreas, embora reconheçam que ainda há um grande obstáculo a superar. O sistema ainda requer um grande conjunto de dados para iniciar o processo de seleção.


Publicado em 26/10/2020 13h31

Artigo original:

Estudo original:


Achou importante? Compartilhe!


Assine nossa newsletter e fique informado sobre Astrofísica, Biofísica, Geofísica e outras áreas. Preencha seu e-mail no espaço abaixo e clique em “OK”: