Uma nova abordagem para resolver problemas de otimização usando máquinas de Boltzmann

Esquerda: Usando lógica digital para fazer a fase direta (verificação) e reversa (solução) da computação. Superior Direita: O amostrador procura probabilisticamente as melhores soluções no espaço. Inferior Direita: Uma aplicação importante é a solução de fatores para semiprimos, um problema no coração da criptografia moderna e geralmente considerado intratável. Crédito: Patel, Canoza & Salahuddin.

Máquinas Ising são arquiteturas de computador não convencionais baseadas em princípios da física, em homenagem ao físico alemão Ernst Ising. Nos últimos anos, descobriu-se que eles são ferramentas particularmente promissoras para resolver problemas de otimização combinatória (CO) e criar modelos artificiais do cérebro.

Uma equipe de pesquisadores do grupo de Sayeef Salahuddin, um distinto professor de EECS da TSMC na Universidade da Califórnia, Berkeley, recentemente explorou o potencial das máquinas de Ising para encontrar soluções para problemas complexos de otimização em grande profundidade. Seu artigo mais recente, publicado na Nature Electronics, apresentou uma nova máquina de Ising composta por muitas máquinas de Boltzmann restritas (RBMs), que alcançaram resultados notáveis em tarefas complexas de otimização combinatória.

“Nos últimos anos, muito trabalho foi feito nas máquinas Ising para acelerar os problemas de otimização, sobre os quais nosso trabalho se baseia”, disse Saavan Patel, o principal autor que realizou o estudo, ao TechXplore. “Os principais objetivos do nosso estudo foram mostrar como o aprendizado de máquina e a aceleração de hardware podem se encaixar na estrutura das máquinas Ising e acelerar os problemas de otimização de uma maneira inspirada na lógica digital”.

Máquinas de Boltzmann restritas (RBMs) são modelos generativos e estocásticos baseados em redes neurais artificiais. Esses modelos podem ser muito bons para capturar correlações complexas e padrões de distribuição em grandes quantidades de dados de entrada.

Os RBMs dependem de ativações binárias, contornando as multiplicações diretas de vetores de matriz que normalmente são as mais exigentes computacionalmente para redes de aprendizado profundo. Em seu estudo, Patel e seus colegas exploraram essa característica única dos modelos para aumentar a velocidade com que sua máquina poderia resolver problemas de otimização.

“Nosso algoritmo funciona usando os princípios básicos da lógica digital de uma nova maneira”, explicou Patel. “Geralmente, as portas digitais funcionam apenas na direção direta, mas usando modelos gráficos probabilísticos e aprendizado de máquina, mostramos maneiras de operá-las no sentido inverso. problema (“Este conjunto de entradas é uma solução válida?” ou “O que é 191 x 223?”), mas como o sistema é reversível, ele também pode responder ao problema reverso muito mais difícil (“Quais são todos os conjuntos de entradas que produzir uma solução válida?” e “O que são A e B tais que A x B = 42593?” ).”

A máquina que eles desenvolveram permitiu que Patel e seus colegas resolvessem uma variedade de problemas de otimização diferentes. Essencialmente, seu circuito funciona avaliando inicialmente diferentes soluções existentes e, em seguida, tentando identificar novas soluções. Em contraste com outras soluções propostas anteriormente, a plataforma dos pesquisadores combina abordagens de mapeamento de problemas, aprendizado de máquina e soluções de hardware.

“Usando nossa abordagem de lógica digital, conseguimos mostrar que poderíamos resolver dois tipos de problemas ‘difíceis'”, disse Patel. “O primeiro é a satisfatibilidade booleana, que forma a espinha dorsal dos problemas de otimização combinatória, e o segundo é o problema de fatoração de inteiros que é a base do algoritmo de criptografia RSA que os computadores modernos utilizam. O objetivo era mostrar que essa ferramenta funciona, e mostramos que poderíamos resolver problemas de fatoração maiores do que os métodos propostos anteriormente.”

Nas avaliações iniciais, a máquina criada por essa equipe de pesquisadores alcançou resultados altamente promissores, resolvendo problemas complexos de otimização combinatória e fatoração de inteiros. Além disso, o hardware de suporte apresentado no artigo pode encontrar soluções para problemas 10.000 vezes mais rápido do que uma CPU convencional.

No futuro, máquinas de Ising como a introduzida por Patel e seus colegas poderiam ser usadas para resolver uma ampla gama de problemas complexos do mundo real com mais rapidez e eficiência, incluindo problemas associados à logística ou fabricação, problemas de roteamento e quebra de criptografia. Em seus próximos estudos, os pesquisadores tentarão aprimorar sua máquina para que ela possa concluir tarefas de otimização cada vez maiores e mais complexas. Além disso, eles gostariam de avaliar seu potencial para resolver outros tipos de problemas.

“Estamos projetando sistemas FPGA maiores e mais eficientes para resolver problemas maiores, assim como ASICs”, acrescentou Patel. “Em termos de novos domínios de problemas, temos investigado mapeamentos para problemas de roteamento (como o problema do caixeiro viajante), problemas de comunicação (como codificação LDPC), problemas quânticos (como encontrar o estado fundamental de sistemas moleculares) e outros problemas de otimização ( por exemplo, soluções para problemas MAX-CUT). Existem muitas novas fronteiras para esses sistemas e estamos ansiosos para explorar novos espaços! Nosso objetivo é sempre resolver problemas mais difíceis, mais rápido e com mais eficiência energética.”



Máquina de Ising

As duas equipes construíram o que se conhece como uma “máquina de Ising”, ou modelo de Ising, em homenagem ao físico alemão Ernst Ising (1900-1998), que idealizou o modelo matemático do magnetismo. A máquina funciona como uma rede reprogramável de ímãs artificiais, na qual cada ímã aponta apenas para cima ou para baixo, ou norte e sul, como um sistema magnético de verdade.

A teoria é que, se as conexões entre a rede de magnetos puder ser programada para representar o problema em questão, a solução pode ser derivada do estado final da máquina, conforme seus componentes se encaminham naturalmente para o estado de mais baixa energia.

As duas equipes trabalharam com o conhecido problema do caixeiro-viajante, que busca encontrar a melhor rota para um vendedor que precise visitar uma série de cidades. Tipicamente intratável pelos computadores tradicionais, esse tipo de problema é importante porque trata não apenas de encontrar as melhores rotas para vendedores ou entregadores, mas também para descobrir como rotear os pacotes de dados pelas redes de computadores de maneira mais eficiente ou como as proteínas se dobram.


Publicado em 29/03/2022 08h47

Artigo original:

Estudo original: