Um modelo estatístico de status cognitivo para geração de linguagem natural

Crédito: MIRRORLab, mirrorlab.mines.edu/research/

Para que os robôs sejam usados em uma ampla variedade de configurações, eles precisam ser capazes de se comunicar perfeitamente com os seres humanos.

Nos últimos anos, os pesquisadores desenvolveram modelos computacionais cada vez mais avançados que poderiam permitir aos robôs processar a linguagem humana e formular respostas adequadas.

Um aspecto importante da linguagem humana que as máquinas devem adquirir é o uso de pronomes nas frases. De acordo com uma teoria lingüística estabelecida conhecida como “Hierarquia da Dedicação” (GH), os seres humanos escolhem quais pronomes usar com base em suas suposições implícitas sobre os “status cognitivos” que os objetos têm na mente de seus ouvintes. Por exemplo, se um falante assume que seu objeto alvo está “em foco” (que é um status cognitivo) na conversa atual, ele pode optar por usar o pronome “it”.

Pesquisadores do MIRRORLab da Escola de Minas do Colorado apresentaram recentemente dois modelos de status cognitivo em um artigo pré-publicado no arXiv. O primeiro modelo é um modelo teórico de máquina de estado finito, baseado em regras, diretamente informado pela literatura GH, enquanto o segundo modelo é um modelo estatístico probabilístico (Filtro de Status Cognitivo) que prevê o status cognitivo de um objeto sob incerteza.

“Meu orientador, o Dr. Tom Williams, e seus colegas já começaram a trabalhar no uso do conceito de status cognitivo para ajudar a compreensão robótica da linguagem natural (NLU), onde um ouvinte deve identificar o objeto de destino, devido ao seu status cognitivo / informações sobre o formulário de referência. , “Poulomi Pal, um dos pesquisadores que realizou o estudo, disse ao TechXplore. “A principal idéia / objetivo por trás do nosso trabalho recente foi criar um modelo computacional para filtragem de status cognitivo com base na teoria linguística da Hierarquia de Dedicação (GH) para fins de geração de linguagem natural (NLG), mais especificamente, para aprimorar o uso da máquina de pronomes (por exemplo, isso, isso, aquilo etc.) “.

O primeiro modelo apresentado por Pal e seus colegas é um modelo de máquina de estado finito (FSM) que gera o status cognitivo de um objeto com base nas regras estabelecidas na literatura do GH. O segundo modelo apresentado no artigo é um Filtro de Status Cognitivo (CSF) que aprende essas regras automaticamente a partir de dados textuais. Os pesquisadores treinaram e avaliaram seu modelo de LCR nos dados coletados através da plataforma online Amazon Mechanical Turk.

Durante o projeto experimental de seu modelo de LCR, os pesquisadores usaram um subconjunto da tradução inglesa padrão do corpus de descrição de tarefa multimodal OFAI, que é uma coleção de interações multimodais humano-humano e humano-robô. Eles descobriram que o CSF lidava com a incerteza melhor do que o modelo FSM, pois não seguia regras pré-estabelecidas, mas adquiria regras diretamente dos dados que estava analisando.

“Nossos resultados sugerem que o modelo CSF é um pouco melhor que o modelo FSM teórico em termos de precisão na previsão do status cognitivo de um objeto”, disse Pal. “O modelo do LCR pode, portanto, ser preferível ao tentar avaliar o status cognitivo de um objeto (especialmente quando os dados são grandes), em comparação com um modelo teórico baseado em regras, pois ele pode aprender automaticamente as regras a partir dos dados”.

O modelo CSF desenvolvido por Pal e seus colegas poderia ajudar a aprimorar as interações da linguagem natural entre humanos e robôs, melhorando a capacidade deste último de usar pronomes em conversas. No futuro, essas descobertas poderão inspirar outras equipes a desenvolver modelos semelhantes para aplicações em robótica, bem como técnicas análogas enraizadas em outros campos de estudo, como linguística computacional ou psicologia cognitiva.

“Acreditamos que o desenvolvimento de um modelo computacional como o CSF ajudaria no avanço de abordagens cognitivamente informadas em relação à geração e compreensão da linguagem natural”, disse Pal. “Meus planos para pesquisas adicionais incluem o desenvolvimento e a implementação de um modelo de geração de anáfora informado pelo GH, responsável pelo status cognitivo de um objeto que utiliza o modelo do LCR durante a seleção de diferentes formulários de referência para o NLG”.


Publicado em 25/06/2020 21h52

Artigo original:

Estudo original:


Achou importante? Compartilhe!


Assine nossa newsletter e fique informado sobre Astrofísica, Biofísica, Geofísica e outras áreas. Preencha seu e-mail no espaço abaixo e clique em “OK”: