Derrubados, mas não derrotados: robôs aprendem futebol

Crédito: arXiv (2023). DOI: 10.48550/arxiv.2304.13653

#Robótica #Robôs 

Deep Blue contra Kasparov. Watson contra Ken Jennings e Brad Rutter. Deepmind vs. Atari. Alpha Go contra Lee Sedol.

As grandes competições entre máquinas e humanos nas últimas décadas não deixaram dúvidas sobre quem manda.

Todas essas partidas foram disputadas da maneira mais cortês. Todos os desafios envolviam atividades intelectuais.

Mas o que acontecerá quando a IA assumir jogos de contato físico, quando, por exemplo, os robôs se empenharem em empurrar, empurrar ou derrubar os oponentes?

Os pesquisadores da DeepMind abordaram essa questão durante os testes de robôs humanoides treinados para jogar futebol. Nenhum sujeito humano estava envolvido nessas competições, pelo menos ainda não. Mas houve algum jogo duro.

Em um artigo divulgado na semana passada do servidor de pré-impressão arXiv, Tuomas Haarnoja e mais de duas dúzias de colegas relataram seus esforços bem-sucedidos para ensinar habilidades de movimento complexas e estratégia básica de jogo para robôs.

Aprendendo habilidades de futebol ágil para um robô bípede com aprendizado de reforço profundo

Os pesquisadores disseram que vários projetos de outros nos últimos anos envolvendo robôs quadrúpedes produziram resultados impressionantes. Notável entre eles foi o cachorro-robô da Boston Dynamics, Spot, que se destacou em navegar suavemente em ambientes desconhecidos, desestruturados e hostis.

Menos projetos abordaram o movimento bípede. Os pesquisadores dizem que a mobilidade com duas pernas apresenta desafios adicionais em relação à estabilidade e segurança. Quando se trata de esportes, esses desafios são ainda maiores.

“O futebol requer um conjunto diversificado de movimentos altamente ágeis e dinâmicos, incluindo correr, girar, dar passos laterais, chutar, passar, recuperar quedas, interação com objetos e muito mais”, disse Haarnoja.

“Os jogadores também precisam ser capazes de fazer previsões sobre a bola, companheiros de equipe e adversários e adaptar seus movimentos ao contexto do jogo. Os jogadores também precisam coordenar os movimentos em escalas de tempo longas para alcançar um jogo tático e coordenado.”

Visão OP3

A equipe da DeepMind projetou robôs humanóides em miniatura com 20 juntas controláveis e usou o Deep RL (Deep Reinforcement Learning) para ensinar-lhes as habilidades básicas do futebol. Eles se concentraram em habilidades de movimento adaptáveis ao contexto, como “andar, correr, virar, chutar e recuperar-se de quedas”.

Os robôs exibiram “habilidades de movimento robustas e dinâmicas”, disse Haarnoja. O relatório, intitulado “Aprendendo habilidades de futebol ágil para um robô bípede com aprendizado de reforço profundo”, também foi publicado em um blog do Google na semana passada.

O projeto do futebol robótico diferia de muitos projetos semelhantes anteriores, pois focava no emprego de todo o corpo robótico – não apenas mãos ou pés – para se envolver em jogos estratégicos.

“Criar inteligência incorporada geral, ou seja, criar agentes que possam agir no mundo físico com agilidade, destreza e compreensão – como animais ou humanos – é um dos objetivos de longa data de pesquisadores de IA e roboticistas”, disse Haarnoja.

Robustez a empurrões

A publicação do projeto DeepMind gerou muita discussão nas mídias sociais, mas um breve videoclipe chamou a atenção em particular. No clipe, um pesquisador é mostrado empurrando continuamente um robô tentando marcar um gol. O robô procedeu heroicamente a cada vez para se recuperar e voltar a ficar de pé.

Embora claramente feito para testar e melhorar a capacidade do robô de se recuperar de tropeços e outros erros, o “abuso” incitou os usuários do Twitter a responder.

“É difícil não antropomorfizar. Meu cérebro diz, PARE DE SER MAL! Lol”, disse John Weller.

“Em que ponto [os robôs] aprendem que é mais fácil chutar a bola quando um humano não os está constantemente empurrando e então agem para impedir que isso aconteça para que eles possam jogar bola?” perguntou N4GERACS.

OP3 comportamentos de futebol

“Devo dizer, pessoalmente, dada a rapidez com que a IA está se movendo atualmente, eu não seria tão arrogante em empurrar esses robôs”, alertou Jeff Kirsch.

E uma nota de advertência de Jing Lang: “Espero que eles nos perdoem por isso.”

Talvez aqueles enervados pelo empurrão sejam consolados pela sabedoria de um grande atleta de um esporte diferente, o falecido grande rebatedor do beisebol Babe Ruth, que certa vez observou: “Você não pode derrotar a pessoa que não desiste”.


Publicado em 08/05/2023 09h54

Artigo original:

Estudo original: