Complexidade quântica domada pelo Machine Learning

Este brinquedo funcional descreve dois elétrons compartilhados entre quaisquer dois átomos. O rolamento de esferas representa o arranjo com menor energia; inclinar o modelo muda os átomos.

Cortesia de Aron Cohen


Se os cientistas entendessem exatamente como os elétrons agem nas moléculas, seriam capazes de prever o comportamento de tudo, desde drogas experimentais até supercondutores de alta temperatura. Após décadas de insights baseados em física, os sistemas de inteligência artificial estão dando o próximo passo.

Em 2018, as simulações climáticas foram o terceiro maior uso de ciclos de computação em um dos principais clusters de supercomputação dos EUA. O estudo de quarks e outras partículas subatômicas ficou em segundo lugar.

No topo da lista estava a ideia mais citada nas ciências físicas – embora poucos tenham ouvido falar dela.

“É ridiculamente importante”, disse Kieron Burke, químico teórico da Universidade da Califórnia, Irvine. “É uma das coisas mais importantes da ciência.”

O segredo mais bem guardado da ciência atende pelo nome de teoria do funcional da densidade (DFT), e é o principal método que físicos e químicos usam para entender praticamente qualquer coisa mais complicada do que um átomo de hidrogênio. Durante décadas, os pesquisadores aproveitaram as habilidades da DFT para prever tudo, desde o sabor do café até a consistência do núcleo de Júpiter.

A DFT oferece aos cientistas um poderoso atalho para prever para onde os elétrons irão e, por extensão, como os átomos, moléculas e outros objetos revestidos de elétrons irão agir. Físicos e químicos há muito se valem de profundos conhecimentos físicos para fazer com que suas equações reflitam melhor a intrincada dança comum a todos os elétrons. Mas, recentemente, novas ferramentas projetadas por redes neurais estão rivalizando e, de certa forma, superando seus predecessores artesanais. Alguns pesquisadores agora acreditam que o aprendizado de máquina pode ajudar os pesquisadores a dar passos maiores e mais rápidos em direção a uma equação mestre de elétrons que desvendaria os segredos de novas drogas, supercondutividade e materiais exóticos.

“Esses métodos de aprendizado de máquina”, disse Marivi Fernández-Serra, física de matéria condensada da Stony Brook University, “chegaram onde o campo estava em alguns anos e já o superaram”.

A teoria do funcional da densidade revela como os elétrons agem em moléculas como o 2,3-(S,S)-dimetiloxirano, mostrado aqui.

Sussurradores de elétrons

Conhecer os elétrons é conhecer os átomos, moléculas e materiais que eles compõem. Os físicos entendem completamente os elétrons desde a década de 1920, quando Erwin Schrödinger publicou sua equação homônima. Mas quando se trata de analisar multidões de elétrons, esse entendimento provou ser quase inútil.

O problema é que os elétrons são mais nuvens do que partículas. Eles se espalham pelo espaço, sobrepondo-se e empurrando todos os outros elétrons de várias maneiras. À medida que seu número aumenta, o uso da equação de onda de Schrödinger para explicar o contato constante entre todos os elétrons fica exponencialmente mais difícil.

“Mesmo para algumas partículas”, disse Jeffrey Neaton, físico de matéria condensada da Universidade da Califórnia, Berkeley, “você só precisa de mais espaço em disco do que existe no mundo agora mesmo para gravar essa função de onda em um disco rígido”.

Em 1964, dois físicos encontraram uma solução alternativa. Pierre Hohenberg e Walter Kohn provaram que podiam capturar perfeitamente todos os aspectos de uma molécula misturando seus elétrons em um fluido artificial – um que é mais espesso em alguns pontos e mais fino em outros. A densidade desse suco de elétrons contém todas as informações sobre a função de onda complexa da molécula, eles mostraram, liberando os físicos da tarefa impossível de rastrear os elétrons individualmente.

“Esse é o grande milagre”, disse Douglas Natelson, professor de ciência dos materiais da Rice University.

Os pesquisadores usam ferramentas baseadas na teoria funcional da densidade para prever como os elétrons ao redor dos pares de bases do DNA reagem quando atingidos por um pulso de laser.

O trabalho de Hohenberg e Kohn provou a existência de uma poderosa equação mestra – o funcional da densidade universal. A equação tomaria algum exemplo de uma sopa de elétrons e calcularia sua energia, orientando os físicos para o arranjo mais natural de elétrons (aquele com a menor energia possível). O funcional seria universal no sentido de que poderia, em princípio, descrever qualquer sistema – desde tijolos de silício até moléculas de água.

O único problema era que ninguém tinha ideia de como era a equação.

Logo Kohn e outro físico, Lu Jeu Sham, fizeram uma primeira tentativa de escrever um funcional de densidade prático. Um funcional exato capturando todos os aspectos sutis do comportamento do elétron deveria ser indescritivelmente complicado, então eles o dividem em dois. A primeira metade foi a parte que eles souberam fazer. Fornecia a energia de um grupo de elétrons que podiam sentir uns aos outros apenas em média. Todo o resto – o excesso de energia dos efeitos quânticos bizantinos e interações não locais – foi para a segunda metade: um fator de falsificação conhecido como funcional de troca e correlação.

Eles “reduziram o que não entendemos sobre o funcional a uma pequena parte disso”, disse Neaton.

Nas décadas seguintes, os cientistas construíram o trabalho de Kohn e Sham com maneiras cada vez mais inteligentes de estimar o fator de distorção, e os funcionais de densidade tornaram-se a maneira de fato de entender os elétrons. Os pesquisadores os usam para prever a probabilidade de um átomo agarrar ou liberar um elétron, as maneiras pelas quais as moléculas vibram (informações que o rover Curiosity usa para procurar sinais de vida em Marte), o arranjo dos átomos em treliças de cristal, a velocidade de som em um material, e muito mais. O fluxo interminável de aplicações da teoria rendeu a Kohn um prêmio Nobel em 1998.

A escada funcional

À medida que os pesquisadores pedem mais precisão à DFT, eles tiveram que contar com a ignorância recheada no termo de troca e correlação do funcional, aprimorando os detalhes de seu esboço para alinhá-lo mais ao funcional de densidade universal.

Aron Cohen, um químico teórico da empresa de inteligência artificial DeepMind, está entre os que buscam a mítica equação universal. Para se manter ancorado no cenário abstrato da química quântica teórica, ele mantém um brinquedo de mesa azul impresso em 3D à mão. Parece um biscoito da sorte de plástico, e suas curvas traçam a forma exata de um funcional que é universal, mas apenas para os sistemas mais simples: pode ser usado para revelar qualquer coisa que se queira saber sobre dois elétrons compartilhados entre dois átomos. Ainda assim, isso o lembra que pode existir um funcional que pode lidar com qualquer número de elétrons e átomos. “O que estamos procurando é assim”, disse ele; é apenas muito mais complicado. “É uma coisa real.”

Este brinquedo funcional descreve dois elétrons compartilhados entre quaisquer dois átomos. O rolamento de esferas representa o arranjo com menor energia; inclinar o modelo muda os átomos.

Cortesia de Aron Cohen


Um dos principais objetivos da pesquisa DFT é encontrar aproximações mais precisas desse funcional universal. John Perdew, físico da Temple University e um dos principais desenvolvedores funcionais, há muito liderou esse trabalho. Ele descreve o caminho para o funcional universal como subir os degraus de uma escada. Em cada degrau, os físicos adicionam novos ingredientes ao funcional. O ingrediente mais simples é apenas a espessura do ensopado de elétrons em cada local. No degrau seguinte, o funcional também considera a rapidez com que a espessura muda de um lugar para outro, dando aos pesquisadores uma visão mais ampla e tornando o funcional mais preciso.

Uma parte fundamental da estratégia de Perdew é usar o raciocínio físico para identificar certas propriedades matemáticas que boas aproximações devem obedecer, conhecidas como “restrições exatas”. Degraus mais altos satisfazem mais dessas restrições, e os pesquisadores precisam pesquisar mais para encontrar equações que obedeçam a todas elas.

O grupo de Perdew começou a lidar com funcionais de terceiro degrau, que misturam seis ingredientes, em 1999 e, em 2015, ele lançou um funcional de última geração chamado SCAN. Foi sua oitava tentativa e a primeira a obedecer a todas as 17 restrições conhecidas relevantes no terceiro degrau. Aplicável a moléculas e sólidos, o SCAN provou ser uma das aproximações mais capazes do funcional universal já descoberto.

“Existem possibilidades muito ricas para funcionais de terceiro degrau”, disse Perdew. “Leva tempo para descobrir o que é importante e o que funciona.”

Entre nas máquinas

À medida que Perdew refinava a arte de melhorar os funcionais de densidade com intuição física, uma revolução estava se formando. Poderiam os algoritmos descobrir padrões no comportamento dos elétrons muito sutis para os humanos escreverem matematicamente?

Em 2012, Burke e seus colaboradores fizeram a primeira tentativa moderna de aplicar o aprendizado de máquina a um conjunto de elétrons simplificados. Seu protótipo unidimensional motivou ele e outros grupos a ver se os algoritmos poderiam elevar os pesquisadores ainda mais na escada.

Um avanço ocorreu no início de 2021, quando Burke e colaboradores configuraram uma rede neural para um problema de brinquedo que poderia rastrear erros de densidade e erros de energia de uma maneira que a maioria das tentativas anteriores havia ignorado. “Para obter um funcional que lhe dê densidade e energia, você precisa de uma arquitetura muito flexível”, disse Alexandre Tkatchenko, químico teórico da Universidade de Luxemburgo. “Não é fácil escrever um formulário funcional com a mente.”

Fernández-Serra, em Stony Brook, usou uma estratégia semelhante para projetar uma rede neural que estudaria uma variedade de moléculas e energias e procuraria um funcional de terceiro degrau obedecendo às restrições mais conhecidas, essencialmente usando uma máquina para refazer os passos de Perdew.

O funcional de troca e correlação resultante superou o SCAN na previsão das energias de moléculas desconhecidas em aproximadamente 10%, como ela e Sebastian Dick relataram na Physical Review B no outono de 2021. Mas o ganho modesto sugeriu que o trabalho de Perdew já havia chegado perto de encontrar teto do terceiro degrau.

“A intuição física de alguma forma esgotou quase tudo o que você pode alcançar”, disse Fernández-Serra. “O funcional do Perdew é realmente tão bom quanto você pode obter sem usar o aprendizado de máquina.”

Subir mais alto exigiria entradas mais complicadas – e algoritmos para entendê-las.

A DeepMind escala a escada

Pouco antes da pandemia, pesquisadores da DeepMind, tendo conquistado o jogo de tabuleiro Go, buscavam novos desafios. Eles estavam especialmente interessados em problemas científicos de aprendizado de máquina, e Cohen lançou-lhes o DFT. Ele passou anos estudando funções exatas de sistemas simples, como o que ele mantém em sua mesa. Mas eles não eram nem de longe complexos o suficiente para descrever o mundo real.

“Parecia um longo caminho para chegar a algo que seria útil para a química”, disse ele.

Uma fraqueza no coração da DFT acabou com Cohen em particular. Os funcionais de densidade de corrente geralmente espalham demais os elétrons. O problema é especialmente gritante para sistemas desiguais, onde os elétrons devem se reunir principalmente em uma molécula. DFT tende a espalhar a sopa de elétrons mais uniformemente em ambas as moléculas. Um problema relacionado aparece em reações químicas, quando a DFT fornece energias incorretas para partículas se fundindo e se separando, mesmo para casos tão simples como átomos de hidrogênio. “É esse cavalo de batalha”, disse Cohen, “mas eu sei que tem essas falhas maciças”.

Samuel Velasco/Revista Quanta; fonte: doi: 10.1126/science.abj6511

Para projetar seu funcional de próxima geração, Cohen e a equipe da DeepMind optaram por não se preocupar tanto em satisfazer uma longa lista de princípios físicos. Em vez disso, eles se apoiariam em dados, muitos dados. Eles vasculharam a literatura em busca de bancos de dados de milhares de moléculas com energias conhecidas (calculadas com alto custo usando a equação de Schrödinger ou métodos semelhantes). Então eles foram mais longe, usando supercomputadores para processar as energias de centenas de moléculas adicionais – muitas das quais levaram dias para serem calculadas.

Enquanto a equipe montava uma biblioteca exaustiva de moléculas de exemplo, Cohen e outros químicos decidiram como o funcional deveria ser estruturado.

Eles desembarcaram em uma abordagem tentadoramente versátil. Ao longo de anos de tentativa e erro, os pesquisadores encontraram uma receita especial para estimar parte da troca e correlação funcional. Houve um ponto ideal no desempenho quando 80% da energia para uma peça do funcional foi calculada de uma maneira e 20% de outra. Os pesquisadores há muito suspeitavam que o próximo passo seria deixar a proporção 80/20 variar de ponto a ponto em torno de uma molécula, mas ninguém conseguiu fazer isso totalmente.

Houve “100 artigos, talvez, onde as pessoas brincaram com essa forma, mas não produziram algo que todos pudessem usar”, disse Burke, que introduziu esse tipo de funcional em 1998. “Talvez seja muito difícil para uma pessoa”.

Com seu mar de moléculas de exemplo e a experiência em aprendizado de máquina da equipe DeepMind, a rede neural do grupo foi capaz de treinar um funcional de quarto degrau flexível exatamente desse tipo. Ele pode estimar as energias de uma ampla gama de moléculas melhor do que o SCAN e outros principais concorrentes, em grande parte porque coloca os elétrons com mais precisão e descreve melhor seus spins. O funcional, apelidado de DM21, é o primeiro funcional de uso geral capaz de lidar com a quebra e a formação de ligações químicas. No dia 9 de dezembro, o grupo descreveu seu funcional na Science.

“Este é o primeiro funcional de propósito geral razoável”, disse Burke, que não esteve envolvido. “Se essa coisa for tão boa quanto parece, milhares de pessoas começarão a usá-la dentro de um ano.”

No entanto, Burke adverte que testar totalmente o funcional levará tempo. O campo está repleto de destroços de funcionais que inicialmente pareciam promissores, mas escondiam falhas fatais, e os pesquisadores apenas começaram a separar o DM21.

Um ponto fraco é que o DM21 treinou em moléculas das três primeiras linhas da tabela periódica, onde os dados são mais abundantes. Isso significa que o comportamento do elétron que aprendeu pode não ser transferido para átomos de metal ou materiais sólidos, ambos cruciais para analisar a família de supercondutores de alta temperatura à base de cobre, por exemplo. Os detalhes do funcional universal que representa esses sistemas permanecem, por enquanto, melhor aproximados pelo SCAN e outros funcionais.

“No futuro próximo, não acho que haverá um funcional que fará tudo”, disse Tkatchenko.

Em direção a um funcional universal

O desenvolvimento de novos funcionais como os de Fernández-Serra e DeepMind sugere que o aprendizado de máquina pode ser uma ferramenta poderosa para explorar novas regiões do funcional de densidade universal, particularmente aquelas correspondentes a moléculas e química.

É bom para “realmente ajustar a parte do espaço químico que você deseja abordar e tornar isso funcional o mais eficiente possível”, disse Tkatchenko. “Acho que as técnicas de aprendizado de máquina realmente vieram para ficar.”

Mas se os funcionais químicos aprimorados revelarão características gerais relevantes para tudo, de átomos a materiais, ainda não se sabe. A Perdew, por exemplo, continua a buscar novas qualidades intuitivas que possam refinar ainda mais os funcionais da maneira tradicional. “Provavelmente não dedicarei muito tempo aos esforços de aprendizado de máquina”, disse ele, “porque, embora as máquinas possam aprender, elas ainda não podem nos explicar o que aprenderam”.

Cohen espera que o DM21 tenha vislumbrado características universais que podem se tornar elementos duradouros de aproximações futuras, sejam elas geradas por mentes humanas ou redes neurais.

“O funcional é infinitamente complicado, então fazer qualquer ataque nele é bom”, disse ele. “Idealmente, gostaríamos de unificar todos eles.”


Publicado em 08/02/2022 19h09

Artigo original:

Estudo original: