A Figura 01 aprendeu fazendo café observando um humano fazer isso e agora pode falar com você como se fosse uma pessoa.
Um robô humanóide autocorretivo que aprendeu fazendo uma xícara de café apenas assistindo a imagens de um humano fazendo isso agora pode responder a perguntas graças à integração com a tecnologia OpenAI.
No novo vídeo promocional, um técnico pede à Figura 01 para realizar uma série de tarefas simples em um ambiente de teste minimalista que lembra uma cozinha.
Ele primeiro pede ao robô algo para comer e recebe uma maçã.
Em seguida, ele pediu à Figura 01 que explicasse por que ela lhe entregou uma maçã enquanto catava algum lixo.
O robô responde a todas as perguntas com uma voz robótica, mas amigável.
A empresa disse em seu vídeo que a conversa é alimentada por uma integração com a tecnologia feita pela OpenAI – nome por trás do ChatGPT.
No entanto, é improvável que a Figura 01 esteja usando o próprio ChatGPT, porque essa ferramenta de IA normalmente não usa palavras de pausa como “um”, o que este robô faz.
Se tudo no vídeo funcionar como afirmado, isso significa um avanço em duas áreas principais da robótica.
Como os especialistas disseram anteriormente ao Live Science, o primeiro avanço é a engenharia mecânica por trás de movimentos hábeis e autocorretivos que as pessoas podem realizar.
Significa motores, atuadores e pinças muito precisos inspirados em articulações ou músculos, bem como o controle motor para manipulá-los para realizar uma tarefa e segurar objetos com delicadeza.
Até mesmo pegar uma xícara – algo em que as pessoas mal pensam conscientemente – utiliza um processamento intensivo integrado para orientar os músculos em uma sequência precisa.
O segundo avanço é o processamento de linguagem natural (PNL) em tempo real, graças à adição do mecanismo OpenAI – que precisa ser tão imediato e responsivo quanto o ChatGPT quando você digita uma consulta nele.
Também precisa de software para traduzir esses dados em áudio ou fala.
A PNL é um campo da ciência da computação que visa dar às máquinas a capacidade de compreender e transmitir a fala.
Publicado em 29/03/2024 21h55
Artigo original: