Pesquisadores descobrem uma abordagem mais flexível para Machine Learning

Imagem via Unsplash

Redes neurais “líquidas”, baseadas no sistema nervoso de um verme, podem transformar seus algoritmos subjacentes em tempo real, dando-lhes velocidade e adaptabilidade sem precedentes.

Pesquisadores de inteligência artificial celebraram uma série de sucessos com redes neurais, programas de computador que imitam aproximadamente como nossos cérebros são organizados. Mas, apesar do rápido progresso, as redes neurais permanecem relativamente inflexíveis, com pouca capacidade de mudar rapidamente ou se ajustar a circunstâncias desconhecidas.

Em 2020, dois pesquisadores do Instituto de Tecnologia de Massachusetts lideraram uma equipe que introduziu um novo tipo de rede neural baseada na inteligência da vida real – mas não na nossa. Em vez disso, eles se inspiraram na minúscula lombriga, Caenorhabditis elegans, para produzir o que chamaram de redes neurais líquidas. Depois de um avanço no ano passado, as novas redes podem agora ser versáteis o suficiente para suplantar suas contrapartes tradicionais para certas aplicações.

As redes neurais líquidas oferecem “uma alternativa elegante e compacta”, disse Ken Goldberg, um roboticista da Universidade da Califórnia, em Berkeley. Ele acrescentou que os experimentos já estão mostrando que essas redes podem funcionar com mais rapidez e precisão do que outras chamadas redes neurais de tempo contínuo, que modelam sistemas que variam com o tempo.

Ramin Hasani e Mathias Lechner, as forças motrizes por trás do novo design, perceberam anos atrás que C. elegans poderia ser um organismo ideal para descobrir como criar redes neurais resilientes que podem acomodar surpresas. O alimentador de fundo de um milímetro de comprimento está entre as poucas criaturas com um sistema nervoso totalmente mapeado e é capaz de uma série de comportamentos avançados: mover-se, encontrar comida, dormir, acasalar e até aprender com a experiência. “Ele vive no mundo real, onde a mudança está sempre acontecendo, e pode ter um bom desempenho em quase todas as condições”, disse Lechner.

O respeito pelo verme humilde levou ele e Hasani a suas novas redes líquidas, onde cada neurônio é governado por uma equação que prevê seu comportamento ao longo do tempo. E assim como os neurônios estão ligados uns aos outros, essas equações dependem umas das outras. A rede resolve essencialmente todo esse conjunto de equações vinculadas, permitindo caracterizar o estado do sistema em um determinado momento – um afastamento das redes neurais tradicionais, que apenas fornecem os resultados em determinados momentos no tempo.

“[Eles] só podem dizer o que está acontecendo em um, dois ou três segundos”, disse Lechner. “Mas um modelo de tempo contínuo como o nosso pode descrever o que está acontecendo em 0,53 segundos ou 2,14 segundos ou em qualquer outro momento que você escolher.”

As redes líquidas também diferem na forma como tratam as sinapses, as conexões entre os neurônios artificiais. A força dessas conexões em uma rede neural padrão pode ser expressa por um único número, seu peso. Em redes líquidas, a troca de sinais entre os neurônios é um processo probabilístico regido por uma função “não linear”, o que significa que as respostas às entradas nem sempre são proporcionais. A duplicação da entrada, por exemplo, pode levar a uma mudança muito maior ou menor na saída. Essa variabilidade interna é o motivo pelo qual as redes são chamadas de “líquidas”. A maneira como um neurônio reage pode variar dependendo da entrada que recebe.

Enquanto os algoritmos no centro das redes tradicionais são definidos durante o treinamento, quando esses sistemas são alimentados com resmas de dados para calibrar os melhores valores para seus pesos, as redes neurais líquidas são mais adaptáveis. “Eles são capazes de mudar suas equações subjacentes com base na entrada que observam”, mudando especificamente a rapidez com que os neurônios respondem, disse Daniela Rus, diretora do Laboratório de Ciência da Computação e Inteligência Artificial do MIT.

Um dos primeiros testes para mostrar essa habilidade envolveu a tentativa de dirigir um carro autônomo. Uma rede neural convencional só poderia analisar dados visuais da câmera do carro em intervalos fixos. A rede líquida – composta por 19 neurônios e 253 sinapses (tornando-a minúscula para os padrões de machine learning) – poderia ser muito mais responsiva. “Nosso modelo pode amostrar com mais frequência, por exemplo, quando a estrada é sinuosa”, disse Rus, coautor deste e de vários outros artigos sobre redes líquidas.

O modelo manteve o carro na pista com sucesso, mas tinha uma falha, disse Lechner: “Era muito lento”. O problema surgiu das equações não lineares que representam as sinapses e os neurônios – equações que geralmente não podem ser resolvidas sem cálculos repetidos em um computador, que passa por várias iterações antes de finalmente convergir para uma solução. Esse trabalho é normalmente delegado a pacotes de software dedicados chamados solucionadores, que precisariam ser aplicados separadamente a cada sinapse e neurônio.

Em um artigo no ano passado, a equipe revelou uma nova rede neural líquida que contornou esse gargalo. Essa rede dependia do mesmo tipo de equações, mas o principal avanço foi a descoberta de Hasani de que essas equações não precisavam ser resolvidas por meio de árduos cálculos de computador. Em vez disso, a rede poderia funcionar usando uma solução quase exata, ou de “forma fechada”, que poderia, em princípio, ser trabalhada com lápis e papel. Normalmente, essas equações não lineares não têm soluções de forma fechada, mas Hasani encontrou uma solução aproximada que era boa o suficiente para ser usada.

“Ter uma solução de forma fechada significa que você tem uma equação para a qual pode inserir os valores de seus parâmetros, fazer a matemática básica e obter uma resposta”, disse Rus. “Você obtém uma resposta em um único tiro”, em vez de deixar um computador trabalhar até decidir que está perto o suficiente. Isso reduz o tempo e a energia computacional, acelerando consideravelmente o processo.

“O método deles está superando a concorrência em várias ordens de grandeza sem sacrificar a precisão”, disse Sayan Mitra, cientista da computação da Universidade de Illinois, Urbana-Champaign.

Além de serem mais rápidas, disse Hasani, suas redes mais recentes também são extraordinariamente estáveis, o que significa que o sistema pode lidar com entradas enormes sem enlouquecer. “A principal contribuição aqui é que a estabilidade e outras boas propriedades são inseridas nesses sistemas por sua estrutura pura”, disse Sriram Sankaranarayanan, cientista da computação da Universidade do Colorado, em Boulder. As redes líquidas parecem operar no que ele chamou de “o ponto ideal: elas são complexas o suficiente para permitir que coisas interessantes aconteçam, mas não tão complexas a ponto de levar a um comportamento caótico”.

No momento, o grupo do MIT está testando sua mais recente rede em um drone aéreo autônomo. Embora o drone tenha sido treinado para navegar em uma floresta, eles o mudaram para o ambiente urbano de Cambridge para ver como ele lida com novas condições. Lechner considerou os resultados preliminares encorajadores.

Além de refinar o modelo atual, a equipe também está trabalhando para melhorar a arquitetura de sua rede. O próximo passo, disse Lechner, “é descobrir quantos ou quantos neurônios realmente precisamos para realizar uma determinada tarefa”. O grupo também quer criar uma maneira ideal de conectar neurônios. Atualmente, todo neurônio se conecta a outro neurônio, mas não é assim que funciona em C. elegans, onde as conexões sinápticas são mais seletivas. Por meio de estudos adicionais do sistema de fiação da lombriga, eles esperam determinar quais neurônios em seu sistema devem ser acoplados.

Além de aplicações como direção autônoma e voo, as redes líquidas parecem bem adequadas para a análise de redes de energia elétrica, transações financeiras, clima e outros fenômenos que flutuam ao longo do tempo. Além disso, disse Hasani, a versão mais recente das redes líquidas pode ser usada “para realizar simulações de atividade cerebral em uma escala não realizável antes”.

Mitra está particularmente intrigado com essa possibilidade. “De certa forma, é meio poético, mostrando que esta pesquisa pode estar fechando o círculo”, disse ele. “As redes neurais estão se desenvolvendo a tal ponto que as próprias ideias que extraímos da natureza podem em breve nos ajudar a entender melhor a natureza.”


Publicado em 13/02/2023 05h06

Artigo original: