Uma técnica de Machine Learning que pode aprender equilíbrios locais em jogos de leilão simétricos

Uma ilustração da função de lance de equilíbrio para um leilão de primeiro preço simples para um objeto e uma aproximação ilustrada por meio de pontos. Crédito: Bichler et al.

Nas últimas décadas, os cientistas da computação têm explorado o potencial de aplicar a teoria dos jogos e as ferramentas de inteligência artificial (IA) ao xadrez, jogos de tabuleiro de estratégia abstrata ou outros jogos. Outro uso valioso da teoria dos jogos é nas ciências econômicas, particularmente como uma estrutura para explicar as interações estratégicas nos mercados e os resultados resultantes.

Uma das construções teóricas mais comuns projetadas para permitir a aplicação da teoria dos jogos em economia é a teoria do leilão. A teoria do leilão é uma aplicação da teoria do jogo que descreve especificamente como diferentes licitantes podem agir em mercados de leilão.

Ao aplicar a teoria do leilão a mercados reais ou realistas com vários itens à venda e com interdependências de valor, no entanto, o cálculo de estratégias de lance de equilíbrio para jogos de leilão pode ser desafiador. Na teoria dos jogos, o equilíbrio de Nash Bayesiano (BNE) ocorre quando nenhum jogador (ou licitante) pode melhorar sua estratégia escolhida depois de considerar as escolhas de seu oponente.

O BNE é considerado um resultado estável de um jogo ou leilão e pode servir como uma previsão para o resultado, mas é muito mais difícil de calcular para leilões em comparação com jogos de informação completa finita, como pedra-papel-tesoura. Isso ocorre porque os valores e lances dos oponentes são contínuos.

Estudos anteriores introduziram várias técnicas numéricas que podem ser usadas para aprender o equilíbrio em jogos de leilão. Esses métodos são baseados em cálculos de melhores respostas pontuais no espaço de estratégia ou na resolução iterativa de subjogos. Seu uso era amplamente restrito a leilões simples de objeto único.

Pesquisadores da Universidade Técnica de Munique desenvolveram recentemente uma nova técnica de Machine Learning que pode ser usada para aprender equilíbrios locais em jogos de leilão simétricos. Essa técnica, apresentada em um artigo publicado na Nature Machine Intelligence, funciona representando estratégias como redes neurais e, em seguida, aplicando iteração de política com base na dinâmica de gradiente enquanto um licitante joga contra si mesmo.

“No ano passado, o Prêmio Nobel de Ciências Econômicas foi concedido a Paul Milgrom e Bob Wilson por seu trabalho em teoria e design de leilões”, disse Martin Bichler, um dos pesquisadores que realizou o estudo, à TechXplore. “Os primeiros trabalhos do ganhador do Prêmio Nobel William Vickrey levaram a estratégias de equilíbrio teórico do jogo para leilões simples de objeto único, que são baseadas na solução de equações diferenciais. Infelizmente, leilões de múltiplos objetos mais complexos se tornaram muito desafiadores para resolver e equilibrar as estratégias de lances são conhecidas apenas para casos muito específicos. ”

Bichler e seus colegas têm conduzido pesquisas relacionadas à teoria do leilão e explorado suas aplicações há vários anos. Em seu estudo recente, eles se propuseram especificamente a desenvolver uma técnica baseada em redes neurais artificiais e self-play que pode aprender automaticamente estratégias de lance de equilíbrio em leilões.

“Provamos que nosso método converge com a estratégia de equilíbrio em uma ampla variedade de modelos de leilão com premissas padrão”, disse Bichler. “Isso nos permite desenvolver solucionadores de equilíbrio que calculam estratégias de lance de equilíbrio para vários tipos de modelos de leilão numericamente, o que não foi possível até agora.”

Quando os pesquisadores testaram sua técnica, descobriram que os BNEs por ela aproximados coincidiam com o equilíbrio derivado analiticamente, quando disponível. O erro estimado também foi muito baixo nos casos em que o equilíbrio analítico é desconhecido. No futuro, a ferramenta que desenvolveram pode ser usada para investigar a eficiência dos leilões e determinar quais estratégias de licitação podem surgir em equilíbrio.

Além de sua contribuição significativa para o estudo da teoria do leilão, a técnica criada por Bichler e seus colegas pode ser uma ferramenta de grande valor para os leiloeiros, pois pode ajudá-los a selecionar formatos de leilão e licitantes para desenvolver suas estratégias de licitação. Por exemplo, pode ser útil durante leilões de espectro, que são usados por reguladores em todo o mundo para distribuir os direitos de transmissão de sinais em bandas específicas do espectro eletromagnético para diferentes provedores de rede móvel.

“Primeiro adaptamos o processo de aprendizagem padrão em redes neurais (gradiente descendente) para lidar com as descontinuidades das funções de utilidade em nossos modelos de leilão”, disse Bichler. “Em segundo lugar, poderíamos provar que o método converge para o equilíbrio em leilões com apenas um conjunto moderado de suposições. Isso é interessante porque o aprendizado de equilíbrio desse tipo não converge em geral nos jogos.”

Em seus estudos futuros, Bichler e seus colegas gostariam de testar sua técnica em diferentes cenários e garantir que seja bem generalizada. Além disso, eles planejam desenvolver ferramentas que podem calcular automaticamente os equilíbrios em uma variedade mais ampla de problemas relacionados à teoria dos jogos, indo além dos jogos de leilão simétricos.


Publicado em 15/09/2021 16h01

Artigo original:

Estudo original: