Uma técnica de aprendizado profundo para resolver o cubo mágico de Rubik e outros problemas passo a passo

Um diagrama que mostra como os dados que um computador aprende são coletados. O programa começa a partir de um cubo não embaralhado, rotula esse “0”, depois o embaralha uma vez, rotula esse “1” e assim por diante. Em seguida, o programa aprende a anexar esses tipos de rótulos aos cubos que não viu durante o processo de treinamento. Crédito: Colin G. Johnson.

Colin G. Johnson, professor associado da Universidade de Nottingham, desenvolveu recentemente uma técnica de aprendizado profundo que pode aprender a chamada “função de adequação” a partir de um conjunto de soluções de amostra para um problema. Esta técnica, apresentada em um artigo publicado no jornal Wiley’s Expert Systems, foi inicialmente treinada para resolver o cubo de Rubik, o popular quebra-cabeça de combinação 3-D inventado pelo escultor húngaro Ernö Rubik.

“O objetivo do nosso artigo era usar o aprendizado de máquina para aprender a resolver o cubo de Rubik”, disse Colin G. Johnson, um dos pesquisadores que realizou o estudo, ao TechXplore. “O cubo de Rubik é um quebra-cabeça muito complexo, mas qualquer um do vasto número de combinações está no máximo 20 etapas de uma solução. Portanto, a abordagem que adotamos aqui é tentar resolver o problema aprendendo a fazer cada uma dessas etapas individualmente.”

A técnica desenvolvida por Johnson é baseada em duas abordagens principais: aprendizagem gradual e o uso de uma rede neural profunda. Quando aplicada ao cubo de Rubik, a técnica tenta desembaralhá-lo passo a passo, em vez de aprender a resolver o cubo inteiro de uma vez. Em outras palavras, ele tenta deslocar suas partes para conseguir uma configuração mais simples, repetindo esta etapa várias vezes, até que o cubo esteja resolvido.

“Em vez do programa tentar aprender como resolver o cubo inteiro, ele aprende como colocá-lo em uma configuração mais simples, depois assume essa configuração mais simples e assim por diante até que seja resolvido”, explicou Johnson. “Essa estrutura significa que cada etapa da solução é muito mais fácil. Então, primeiro desenvolvi um método que pode estimar o quão desordenado o cubo está, simulando a desordem do cubo milhares de vezes.”

Aiagram mostrando como a técnica de aprendizado profundo desenvolvida pelos pesquisadores resolve o cubo de Rubik. Ele começa com muitas cópias do cubo embaralhado, em seguida, encontra algumas versões simplificadas deles, em seguida, algumas versões simplificadas deles e assim por diante até encontrar uma solução. Em seguida, ele retorna por meio deles para encontrar o caminho da solução. Crédito: Colin G. Johnson.

Depois de estimar o quão confuso é o cubo de Rubik, a técnica criada por Johnson usa uma rede neural profunda para reconhecer um cubo que está a um passo de ser resolvido, a dois passos de ser resolvido, três e assim por diante. Finalmente, ele usa os dados que acumulou para resolver o cubo.

Johnson avaliou a técnica que desenvolveu em uma série de experimentos, comparando-a com uma abordagem desenvolvida anteriormente com base em uma classe de algoritmos chamados de classificadores aleatórios de floresta, com uma abordagem de linha de base baseada na adequação tradicional baseada em erro e com outras técnicas computacionais existentes. Sua técnica de aprendizado profundo se compara favoravelmente com todos esses métodos alternativos, ao mesmo tempo em que destaca as vantagens de lidar com as tarefas passo a passo.

Até agora, Johnson usou apenas essa técnica de aprendizado gradual para resolver o cubo de Rubik, mas também poderia ser aplicada a uma variedade de problemas mais complexos que podem ser resolvidos passo a passo. Em outras palavras, o cubo de Rubik é apenas um exemplo simples do tipo de problema que a técnica pode resolver.

“Pense em um problema como remover o ruído de uma gravação de áudio antiga, como um cilindro de cera ou um disco fonográfico antigo”, disse Johnson. “Precisamos remover diferentes tipos de distorção – eco, estática, velocidades variáveis – mas cada gravação precisa de uma estratégia diferente. Se pudermos aprender a ideia do que é uma ‘gravação limpa”, uma gravação levemente distorcida, um’ um pouco mais gravação distorcida ‘é, então, espero, resolver esse tipo de problema dessa maneira gradual.”

No futuro, a técnica de aprendizagem profunda gradual apresentada no artigo recente de Johnson poderia ser usada para resolver vários outros problemas enraizados na ciência e na engenharia. Por exemplo, pode ser usado para estudar e compreender melhor as maneiras como as proteínas se dobram dentro das células biológicas.


Publicado em 28/02/2021 09h46

Artigo original:

Estudo original: