Inteligência artificial para ajudar veículos autônomos a evitar paradas no sinal vermelho

Crédito: Unsplash/CC0 Public Domain

Ninguém gosta de ficar sentado no sinal vermelho. Mas os cruzamentos sinalizados não são apenas um pequeno incômodo para os motoristas; os veículos consomem combustível e emitem gases de efeito estufa enquanto esperam a mudança de luz.

E se os motoristas pudessem cronometrar suas viagens para chegar ao cruzamento quando o sinal estiver verde? Embora isso possa ser apenas um golpe de sorte para um motorista humano, pode ser alcançado de forma mais consistente por um veículo autônomo que usa inteligência artificial para controlar sua velocidade.

Em um novo estudo, pesquisadores do MIT demonstram uma abordagem de aprendizado de máquina que pode aprender a controlar uma frota de veículos autônomos à medida que se aproximam e viajam por um cruzamento sinalizado de uma maneira que mantém o tráfego fluindo sem problemas.

Usando simulações, eles descobriram que sua abordagem reduz o consumo de combustível e as emissões, melhorando a velocidade média do veículo. A técnica obtém os melhores resultados se todos os carros na estrada forem autônomos, mas mesmo que apenas 25% usem seu algoritmo de controle, ainda leva a benefícios substanciais de combustível e emissões.

“Este é um lugar realmente interessante para intervir. A vida de ninguém é melhor porque eles ficaram presos em um cruzamento. Com muitas outras intervenções sobre mudanças climáticas, há uma diferença de qualidade de vida que é esperada, então há uma barreira Aqui, a barreira é muito menor”, diz a autora sênior Cathy Wu, Professora Assistente de Desenvolvimento de Carreira Gilbert W. Winslow no Departamento de Engenharia Civil e Ambiental e membro do Instituto de Dados, Sistemas e Sociedade ( IDSS) e o Laboratório de Sistemas de Informação e Decisão (LIDS).

O principal autor do estudo é Vindula Jayawardana, estudante de pós-graduação em LIDS e do Departamento de Engenharia Elétrica e Ciência da Computação. A pesquisa será apresentada na Conferência Europeia de Controle.

Complexidades da interseção

Enquanto os humanos podem passar por um sinal verde sem pensar muito, os cruzamentos podem apresentar bilhões de cenários diferentes, dependendo do número de faixas, como os sinais operam, o número de veículos e suas velocidades, a presença de pedestres e ciclistas, etc.

Abordagens típicas para lidar com problemas de controle de interseções usam modelos matemáticos para resolver uma interseção simples e ideal. Isso parece bom no papel, mas provavelmente não vai se sustentar no mundo real, onde os padrões de tráfego costumam ser tão confusos quanto parecem.

Wu e Jayawardana mudaram de marcha e abordaram o problema usando uma técnica sem modelo conhecida como aprendizado por reforço profundo. O aprendizado por reforço é um método de tentativa e erro em que o algoritmo de controle aprende a tomar uma sequência de decisões. É recompensado quando encontra uma boa sequência. Com o aprendizado por reforço profundo, o algoritmo aproveita as suposições aprendidas por uma rede neural para encontrar atalhos para boas sequências, mesmo que existam bilhões de possibilidades.

Isso é útil para resolver um problema de horizonte longo como este; o algoritmo de controle deve emitir mais de 500 instruções de aceleração para um veículo durante um longo período de tempo, explica Wu.

“E temos que acertar a sequência antes de sabermos que fizemos um bom trabalho de mitigar as emissões e chegar ao cruzamento em boa velocidade”, acrescenta ela.

Mas há uma ruga adicional. Os pesquisadores querem que o sistema aprenda uma estratégia que reduza o consumo de combustível e limite o impacto no tempo de viagem. Esses objetivos podem ser conflitantes.

“Para reduzir o tempo de viagem, queremos que o carro ande rápido, mas para reduzir as emissões, queremos que o carro diminua a velocidade ou não se mova. Essas recompensas concorrentes podem ser muito confusas para o agente de aprendizado”, diz Wu.

Embora seja um desafio resolver esse problema em toda a sua generalidade, os pesquisadores empregaram uma solução alternativa usando uma técnica conhecida como modelagem de recompensa. Com a modelagem de recompensas, eles dão ao sistema algum conhecimento de domínio que ele não consegue aprender sozinho. Nesse caso, eles penalizavam o sistema sempre que o veículo parava completamente, para que ele aprendesse a evitar essa ação.

Testes de tráfego

Depois de desenvolver um algoritmo de controle eficaz, eles o avaliaram usando uma plataforma de simulação de tráfego com uma única interseção. O algoritmo de controle é aplicado a uma frota de veículos autônomos conectados, que podem se comunicar com semáforos próximos para receber informações de fase e tempo do sinal e observar seus arredores imediatos. O algoritmo de controle informa a cada veículo como acelerar e desacelerar.

O sistema deles não criava nenhum tráfego de paradas e partidas à medida que os veículos se aproximavam do cruzamento. (Tráfego pára-arranca ocorre quando os carros são forçados a parar completamente devido ao tráfego parado à frente). Nas simulações, mais carros passaram em uma única fase verde, que superou um modelo que simula motoristas humanos. Quando comparado a outros métodos de otimização também projetados para evitar o tráfego de paradas e partidas, sua técnica resultou em maior consumo de combustível e redução de emissões. Se cada veículo na estrada for autônomo, seu sistema de controle pode reduzir o consumo de combustível em 18% e as emissões de dióxido de carbono em 25%, enquanto aumenta a velocidade de viagem em 20%.

“Uma única intervenção com redução de 20 a 25% no combustível ou nas emissões é realmente incrível. Mas o que eu acho interessante, e realmente esperava ver, é essa escala não linear. Se controlarmos apenas 25% dos veículos, isso nos dá 50% dos benefícios em termos de redução de combustível e emissões. Isso significa que não precisamos esperar até chegarmos a veículos 100% autônomos para obter os benefícios dessa abordagem”, diz ela.

Mais adiante, os pesquisadores querem estudar os efeitos da interação entre várias interseções. Eles também planejam explorar como diferentes configurações de interseção (número de faixas, sinais, horários, etc.) podem influenciar o tempo de viagem, as emissões e o consumo de combustível. Além disso, eles pretendem estudar como seu sistema de controle pode impactar a segurança quando veículos autônomos e motoristas humanos compartilham a estrada. Por exemplo, embora os veículos autônomos possam dirigir de maneira diferente dos motoristas humanos, estradas mais lentas e estradas com velocidades mais consistentes podem melhorar a segurança, diz Wu.

Embora esse trabalho ainda esteja em seus estágios iniciais, Wu vê essa abordagem como uma que pode ser implementada de forma mais viável no curto prazo.

“O objetivo deste trabalho é mover a agulha da mobilidade sustentável. Queremos sonhar também, mas esses sistemas são grandes monstros da inércia. Identificar pontos de intervenção que são pequenas mudanças no sistema, mas que têm impacto significativo, é algo que me acorda de manhã”, diz ela.


Publicado em 25/05/2022 00h13

Artigo original:

Estudo original: