Estudo: o Machine Learning é uma ferramenta útil para o controle quântico

O gato de Schrödinger ilustra o paradoxo da superposição. Nesse cenário, um gato foi colocado em uma caixa fechada com um frasco de veneno. Depois de um tempo, o gato pode ser considerado simultaneamente vivo e morto. Em analogia à mecânica quântica, isso se refere a uma partícula quântica estar simultaneamente nos dois poços. Se alguém abrisse a caixa completamente, descobriria se o gato está vivo ou morto, então as regras do mundo clássico comum seriam retomadas. No entanto, se alguém abrisse a caixa um pouco, eles poderiam ver apenas uma pequena parte do gato, talvez o rabo, e se eles vissem o rabo se contorcer, eles poderiam assumir, sem certeza, que o gato ainda estava vivo. Isso se refere às medições fracas que a máquina dava aos pesquisadores como pontos de dados. Crédito: Instituto de Ciência e Tecnologia de Okinawa

No mundo cotidiano, podemos realizar medições com precisão quase ilimitada. Mas no mundo quântico – o reino dos átomos, elétrons, fótons e outras partículas minúsculas – isso se torna muito mais difícil. Cada medição feita perturba o objeto e resulta em erros de medição. Na verdade, tudo, desde os instrumentos usados até as propriedades do sistema, pode impactar o resultado, que os cientistas chamam de ruído. Usar medições barulhentas para controlar sistemas quânticos, particularmente em tempo real, é problemático. Portanto, encontrar os meios para o controle baseado em medições precisas é essencial para o uso em tecnologias quânticas, como computadores quânticos poderosos e dispositivos para imagens de saúde.

Agora, um grupo internacional de pesquisadores da Unidade de Máquinas Quânticas da Universidade de Pós-Graduação do Instituto de Ciência e Tecnologia de Okinawa (OIST), no Japão, e da Universidade de Queensland, na Austrália, mostrou, por meio de simulações, que a aprendizagem por reforço, um tipo de Machine Learning, pode ser usado para produzir controle quântico preciso, mesmo com medições ruidosas. Sua pesquisa foi publicada recentemente na Physical Review Letters.

Dr. Sangkha Borah, pós-doutorado dentro da unidade e principal autor do artigo, explicou a ideia usando um exemplo simples. “Imagine uma bola no topo de uma colina. A bola pode rolar facilmente para a esquerda ou para a direita, mas o objetivo é mantê-la no mesmo lugar. Para isso, é preciso ver para que lado ela vai rolar. Se ela estiver inclinada a ir para a esquerda, a força precisa ser aplicada à direita e vice-versa. Agora, imagine que uma máquina está aplicando essa força e, usando o aprendizado por reforço, a máquina pode aprender quanta força aplicar e quando.”

O aprendizado por reforço é frequentemente usado em robótica, onde um robô pode aprender a percorrer uma abordagem de tentativa e erro. Mas tais aplicações no domínio da física quântica são raras. Embora a bola no topo de uma colina seja um exemplo tangível, o sistema que os pesquisadores estavam simulando estava em uma escala muito menor. Em vez de uma bola, o objeto era uma pequena partícula se movendo em um poço duplo que o Dr. Borah e seus colegas estavam tentando controlar usando medições em tempo real.

Um agente de Machine Learning tenta manter uma bola no topo de uma inclinação aplicando a quantidade certa de força. Neste clipe, o agente não teve nenhum treinamento por meio do aprendizado por reforço, então a bola se move de forma irregular. Crédito: Instituto de Ciência e Tecnologia de Okinawa

“O fundo dos dois poços é chamado de estado fundamental quântico”, disse a Dra. Bijita Sarma, pós-doutoranda na unidade e coautora do artigo. “É onde queríamos que a partícula fosse eventualmente localizada. Para isso, precisamos realizar medições continuamente para extrair informações sobre o estado da partícula e, dependendo disso, aplicar alguma força para empurrá-la para o estado fundamental. No entanto, as medições normalmente usadas em a mecânica quântica não nos permite fazer isso. Portanto, precisamos ter uma maneira mais inteligente de controlar o sistema. ”

Curiosamente, quando no estado fundamental, a partícula estará em ambos os poços simultaneamente. Isso é chamado de superposição quântica, e é um estado necessário para o sistema estar, dada sua importância em várias tecnologias quânticas. Para detectar a localização (ou localizações) da partícula no poço, o agente da máquina recebe os registros de medição de medições fracas contínuas em tempo real que ele usa como pontos de dados para aprendizagem. E como isso usava um laço de reforço, qualquer informação que a máquina aprendesse com o sistema seria usada para tornar suas medições futuras mais precisas.

Somando-se a complexidade desse sistema estava o fato de ele ser não linear, o que significa que a mudança em sua saída não estava relacionada às mudanças em sua entrada. Esses sistemas são confusos e caóticos quando comparados aos chamados sistemas lineares. Para tais sistemas não lineares, não existe um método padrão de controle quântico, mas esta pesquisa mostrou que, com o aprendizado por reforço, a máquina pode aprender a controlar o sistema quântico de forma completamente autônoma.

Por tentativa e erro, o agente começa a aprender a controlar a bola e a aplicar a quantidade certa de força para mantê-la no mesmo lugar. Crédito: Instituto de Ciência e Tecnologia de Okinawa

Após 5000 tentativas, o agente aprendeu como aplicar a força necessária para manter a bola na área desejada. Crédito: Instituto de Ciência e Tecnologia de Okinawa

“À medida que avançamos gradualmente em direção a um futuro amplamente dominado pela inteligência artificial, é chegado o momento de explorar a utilidade da inteligência artificial, como o Machine Learning, na resolução de alguns problemas que não podem ser resolvidos por meios convencionais”, concluiu o Dr. Borah. “Isso é especialmente aplicável para controlar a dinâmica de partículas no nível quântico, onde tudo é dramaticamente contra-intuitivo.”

O Prof. Jason Twamley, que lidera a unidade OIST, acrescentou: “Para sistemas não lineares, não há nenhum método conhecido de controle de feedback eficiente. Neste trabalho, mostramos que a aprendizagem por reforço pode realmente ser eficaz para esse controle, o que é incrível e futurista.”


Publicado em 06/11/2021 18h49

Artigo original:

Estudo original: