DeepONet: um modelo baseado em rede neural profunda para aproximar operadores lineares e não lineares

Crédito: Lu et al.

As redes neurais artificiais são conhecidas por serem aproximadores altamente eficientes de funções contínuas, que são funções sem mudanças repentinas nos valores (ou seja, descontinuidades, buracos ou saltos nas representações gráficas). Embora muitos estudos tenham explorado o uso de redes neurais para aproximar funções contínuas, sua capacidade de aproximar operadores não lineares raramente foi investigada até agora.

Pesquisadores da Brown University desenvolveram recentemente o DeepONet, um novo modelo baseado em rede neural que pode aprender operadores lineares e não lineares. Este modelo computacional, apresentado em um artigo publicado na Nature Machine Intelligence, foi inspirado por uma série de estudos anteriores realizados por um grupo de pesquisa da Universidade de Fudan.

George Em Karniadakis, um dos pesquisadores que realizaram o estudo, disse ao TechXplore: “Cerca de cinco anos atrás, enquanto eu estava ensinando cálculo variacional, me perguntei se uma rede neural pode se aproximar de um funcional (sabemos que se aproxima de uma função ). Procurei e não encontrei nada, até que um dia me deparei com um artigo de Chen & Chen publicado em 1993, onde os pesquisadores conseguiram uma aproximação funcional usando uma única camada de neurônios. Eventualmente, também li outro artigo da mesma equipe sobre regressão do operador, que usamos como ponto de partida para o nosso estudo. Desde então, o Prof T Chen entrou em contato comigo por e-mail e me agradeceu por descobrir seus papéis esquecidos. ”

Inspirado pelos artigos de Chen e Chen na Fudan University, Karniadakis decidiu explorar a possibilidade de desenvolver uma rede neural que pudesse aproximar operadores lineares e não lineares. Ele discutiu essa ideia com um de seus Ph.D. alunos, Lu Lu, que começou a desenvolver DeepONet.

Em contraste com as redes neurais convencionais, que aproximam funções, o DeepONet aproxima operadores lineares e não lineares. O modelo compreende duas redes neurais profundas: uma rede que codifica o espaço de função de entrada discreta (ou seja, rede de ramificação) e uma que codifica o domínio das funções de saída (ou seja, rede de tronco). Essencialmente, DeepONet pega funções como entradas, que são objetos dimensionais infinitos, e os mapeia para outras funções no espaço de saída.

Crédito: Lu et al.

“Com as redes neurais padrão, aproximamos funções, que pegam pontos de dados como pontos de entrada e de saída”, disse Karniadakis. “Portanto, o DeepOnet é uma maneira totalmente nova de olhar para as redes neurais, já que suas redes podem representar todos os operadores matemáticos conhecidos, mas também as equações diferenciais em um espaço de saída contínua.”

Uma vez que aprende um determinado operador, DeepONet pode completar operações e fazer previsões mais rápido do que outras redes neurais. Em uma série de avaliações iniciais, Karniadakis e seus colegas descobriram que ele poderia fazer previsões em frações de segundo, mesmo aquelas relacionadas a sistemas muito complexos.

“DeepONet pode ser extremamente útil para veículos autônomos, pois pode fazer previsões em tempo real”, disse Karniadakis. “Também pode ser usado como um bloco de construção para simular gêmeos digitais, sistemas de sistemas e até sistemas dinâmicos sociais complexos. Em outras palavras, as redes que desenvolvemos podem representar sistemas complexos de caixa preta após intenso treinamento off-line.”

Como parte de seu estudo, os pesquisadores investigaram diferentes formulações do espaço de funções de entrada da DeepONet e avaliaram o impacto dessas formulações no erro de generalização para 16 aplicações distintas. Suas descobertas são altamente promissoras, já que seu modelo pode adquirir implicitamente uma variedade de operadores lineares e não lineares.

No futuro, o DeepONet pode ter uma ampla gama de aplicações possíveis. Por exemplo, poderia permitir o desenvolvimento de robôs que podem resolver problemas de cálculo ou resolver equações diferenciais, bem como veículos autônomos mais ágeis e sofisticados.

“Agora estou colaborando com laboratórios do Departamento de Energia e também com muitas indústrias para aplicar DeepONet a aplicações complexas, por exemplo, em hipersônica, em modelagem climática, como aplicações para modelar derretimento de gelo na Antártica e em muitas aplicações de design.”


Publicado em 13/04/2021 09h56

Artigo original:

Estudo original: