BR102019007765A2 - técnicas de aprendizagem profunda baseadas em agentes conversacionais multi-uso para o processamento de consultas em linguagem natural - Google Patents

técnicas de aprendizagem profunda baseadas em agentes conversacionais multi-uso para o processamento de consultas em linguagem natural Download PDF

Info

Publication number
BR102019007765A2
BR102019007765A2 BR102019007765-4A BR102019007765A BR102019007765A2 BR 102019007765 A2 BR102019007765 A2 BR 102019007765A2 BR 102019007765 A BR102019007765 A BR 102019007765A BR 102019007765 A2 BR102019007765 A2 BR 102019007765A2
Authority
BR
Brazil
Prior art keywords
natural language
queries
agent
multipurpose
responses
Prior art date
Application number
BR102019007765-4A
Other languages
English (en)
Inventor
Chaudhary Ashish
Shroff Gautam
Prasad Singh Mahesh
Patidar Mayur
Sachan Prateek
KHURANA Prerna
Agarwal Puneet
Bansal Rachit
Kumar Rohit
Bisht Vivek
Original Assignee
Tata Consultancy Services Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tata Consultancy Services Ltd filed Critical Tata Consultancy Services Ltd
Publication of BR102019007765A2 publication Critical patent/BR102019007765A2/pt

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Human Computer Interaction (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

patente de invenção: técnicas de aprendizagem profunda baseadas em agentes conversacionais multi-uso para o processamento de consultas em linguagem natural" sistemas e métodos para técnicas de aprendizagem profunda baseadas em agentes conversacionais multiuso para o processamento de consultas em linguagem natural. os sistemas e métodos tradicionais forne-cem sistemas conversacionais para o processamento de consultas em lin-guagem natural, mas não empregam técnicas de aprendizagem profunda e, portanto, não conseguem processar um grande número de intenções. for-mas de concretização da presente divulgação proporcionam para agentes conversacionais multiuso multiuso para técnicas em linguagem natural baseadas na aprendizagem profunda para processar as consultas em lin-guagem natural pela definição e integração lógica de uma pluralidade de componentes compreendendo agentes conversacionais multiuso, pela identificação de um agente apropriado para processar uma ou mais consul-tas em linguagem natural por uma técnica de identificação de intenção de alto nível, pela previsão de uma intenção de usuário provável, classifica-ção da consulta e geração de um conjunto de respostas consultando ou atualizando um ou mais gráficos de conhecimento (322).

Description

CAMPO TÉCNICO [001] A divulgação aqui geralmente se refere a técnicas de aprendizagem profunda baseadas em agentes conversacionais multiuso para o processamento de consultas em linguagem natural e, mais particularmente, a sistemas e métodos para técnicas de aprendizagem profunda baseadas em agentes conversacionais para o processamento de consultas em linguagem natural.
ANTECDEDENTES DA INVENÇÃO [002] O processamento em linguagem natural (NLP) é um sub-campo de inteligência artificial e lingüística. A NLP facilita a resolução dos problemas correspondentes à geração automatizada e compreensão de linguagens humanas naturais. Os sistemas de geração de linguagem natural convertem informação a partir de bases de dados de computador em linguagem humana de sonoridade normal, e sistemas de compreensão de linguagem natural convertem amostras de linguagem humana em representações mais formais que são mais fáceis para programas de computador manipularem. Avanços recentes em processamento de linguagem natural, especialmente na implementação de técnicas de aprendizagem profunda, resultaram na disponibilidade de diversas plataformas para suportar aplicativos baseados em diálogo (por exemplo, API.ai etc.), além de pesquisas para aprender e gerar diálogos significativos para envolver usuários. No entanto, a maioria desses sistemas e métodos tradicionais serve para fins transacionais, tal como a interação com um banco ou realização de reservas de viagens, e / ou pergunta-resposta de finalidade geral.
[003] Espera-se que uma interface de linguagem natural seja fácil de usar e que o usuário possa usá-la sem treinamento. No entanto, na realidade, isso pode não ser o caso. Isso ocorre principalmente porque um sistema de computação reage bem o suficiente apenas para tipos predefinidos de conversas. Outro desafio importante é que, para cada diálogo de usuário diferente, um conjunto diferente de informação pode ser extraído dos enunciados de usuário, por exemplo, obtenção de datas de início / término de empregado ou de licença. Registrar um extrator de informação diferente para cada solicitação é um grande desafio, pois um extrator de informação de propósito geral está longe de ser real, mesmo considerando abordagens avançadas de aprendizagem profunda.
[004] Além disso, as técnicas de aprendizagem de máquina ou de aprendizagem profunda não devem apenas identificar a intenção do usuário, mas também prever se a confiança de um modelo de aprendizagem de máquina na
Petição 870190055890, de 17/06/2019, pág. 80/130 identificação de intenção é alta o suficiente para o sistema de computação acreditar e prosseguir. Finalmente, é preciso muito esforço para criar dados de treinamento para processar consultas em linguagem natural por agentes. Ele pode requerer um número de especialistas do domínio desse (s) agente (s) específico (s). Devido a um número limitado de pessoas que trabalham para criar dados de treinamento inicial, as consultas reais de usuário podem variar a partir daquelas presentes nos dados de treinamento, pois pode haver uma pluralidade de variações de uma sentença que carrega o mesmo significado. Portanto, criar um sistema robusto que forneça uma assistência virtual, quando os dados de treinamento disponíveis forem muito limitados em quantidade, é complicado e desafiador.
SUMÁRIO [005] As formas de concretização da presente divulgação apresentam melhorias tecnológicas como soluções para um ou mais dos problemas técnicos acima mencionados, reconhecidos pelos inventores em sistemas convencionais. Por exemplo, em uma forma de concretização , é proporcionado um método para técnicas de aprendizagem profunda baseado em agentes conversacionais multiuso para processar as consultas em linguagem natural, compreendendo o método: definição de uma pluralidade de componentes compreendendo um Gerenciador de Estado de Diálogo (DSM), um Componente de Identificação de Intenção MultiUso, um gerenciador de agentes, uma pluralidade de agentes primários, uma Estrutura de Diálogo de Ação Intenção (IAD), uma estrutura ConsultaAtualização-Engajamento (QUE), Agente de Linguagem Natural- Atualização de Gráfico de Conhecimento (KGU-NL), um Agente de Engajamento de Gráfico de Conhecimento, uma pluralidade de Agentes Auxiliares e um Agente de Atualização de Gráfico de Conhecimento, em que cada componente dentre a pluralidade de componentes compreende um ou mais agentes conversacionais multiuso; integração lógica, com base em um conjunto de consultas antecipadas de usuário em linguagem natural, a pluralidade de componentes por uma ou mais interfaces de programação de aplicativos (APIs); recepção, pela pluralidade de componentes logicamente integrados, de um conjunto de consultas em linguagem natural a partir de uma pluralidade de fontes; execução, com base no conjunto de consultas em linguagem natural, de uma pluralidade de etapas, em que a pluralidade de etapas compreende: (i) identificação de pelo menos um agente conversacional multiuso entre um ou mais agentes conversacionais multiuso utilizando o DSM, em que o agente conversacional de multi-uso identificado corresponde à estrutura IAD ou à estrutura QUE ; e (ii) previsão, usando uma ou
Petição 870190055890, de 17/06/2019, pág. 81/130 mais técnicas de Aprendizagem Profunda, de uma intenção de usuário em comparação a uma consulta de usuário no conjunto de consultas de linguagem natural não classificadas; execução, com base na intenção de usuário prevista e no agente conversacional multiuso identificado, um de: (i) seleção de um ou mais conjuntos predefinidos de respostas entre uma pluralidade de conjuntos prédefinidos de respostas ou engajamento de um usuário para extrair informações detalhadas ou chamar APIs externas para comunicar informação detalhada a um ou mais serviços externos depois de determinar o agente conversacional multiuso identificado como sendo correspondente à estrutura IAD, em que um ou mais conjuntos de respostas predefinidos e a informação detalhada correspondem ao conjunto de consultas em linguagem natural; ou (ii) classificação de uma consulta entre o conjunto de consultas em linguagem natural para identificar uma ou mais categorias de conversas implementando uma técnica de rede neural recorrente ao determinar o agente conversacional multi-uso identificado como sendo correspondente à estrutura QUE; e execução, com base na consulta classificada, um de : (a) consulta de um ou mais gráficos de conhecimento para gerar um primeiro conjunto de respostas correspondentes ao conjunto de consultas em linguagem natural; ou (b) atualização, pelo Agente KGU-NL, de um ou mais gráficos de conhecimento para gerar um segundo conjunto de respostas correspondentes ao conjunto de consultas em linguagem natural; definição em hierarquia, com base no conjunto de consultas antecipadas de usuário de linguagem natural, da pluralidade de componentes e de um ou mais agentes conversacionais multiuso para processar as consultas em linguagem natural; geração automática, com base em um ou mais conjuntos de dados de treinamento, de uma pluralidade de perguntas recomendadas para um ou mais usuários para facilitar o processamento de consultas em linguagem natural; atualização de um ou mais gráficos de conhecimento pelo Agente de Atualização do Gráfico de Conhecimento com base em um conjunto de informação obtida de um ou mais usuários pelo Agente de Engajamento do Gráfico de Conhecimento e em que o conjunto de informações corresponde ao processamento de consultas em linguagem natural; obtenção do conjunto de informações a partir de um ou mais usuários por meio de um engajamento de usuário proativo ou por uma análise de informação correspondente a um ou mais gráficos de conhecimento pelo Agente de Engajamento de Gráfico de Conhecimento; geração do primeiro conjunto de respostas por: (i) mapeamento de uma ou mais entidades correspondentes a um ou mais gráficos de conhecimento com uma ou mais frases correspondentes à consulta
Petição 870190055890, de 17/06/2019, pág. 82/130 classificada por uma técnica de pesquisa baseada em índice invertido; e (ii) atravessamento, com base no mapeamento, de um ou mais gráficos de conhecimento para gerar o primeiro conjunto de respostas; e geração do segundo conjunto de respostas seja pelo engajamento do usuário para extrair a informação detalhada correspondente ao conjunto de consultas em linguagem natural seja pela execução de um conjunto de comandos por uma interface.
[006] Em outro aspecto, é proporcionado um sistema para técnicas de aprendizagem profunda baseado em agentes conversacionais multiuso para processar as consultas em linguagem natural, compreendendo o método: definição de uma pluralidade de componentes compreendendo um Gerenciador de Estado de Diálogo (DSM), um Componente de Identificação de Intenção Multi-Uso, um gerenciador de agentes, uma pluralidade de agentes primários, uma Estrutura de Diálogo de Ação Intenção (IAD), uma estrutura Consulta-AtualizaçãoEngajamento (QUE), Agente de Linguagem Natural- Atualização de Gráfico de Conhecimento (KGU-NL), um Agente de Engajamento de Gráfico de Conhecimento, uma pluralidade de Agentes Auxiliares e um Agente de Atualização de Gráfico de Conhecimento, em que cada componente dentre a pluralidade de componentes compreende um ou mais agentes conversacionais multiuso; integração lógica, com base em um conjunto de consultas antecipadas de usuário em linguagem natural, a pluralidade de componentes por uma ou mais interfaces de programação de aplicativos (APIs); recepção, pela pluralidade de componentes logicamente integrados, de um conjunto de consultas em linguagem natural a partir de uma pluralidade de fontes; execução, com base no conjunto de consultas em linguagem natural, de uma pluralidade de etapas, em que a pluralidade de etapas compreende: (i) identificação de pelo menos um agente conversacional multiuso entre um ou mais agentes conversacionais multiuso utilizando o DSM, em que o agente conversacional multi-uso identificado corresponde à estrutura IAD ou à estrutura QUE ; e (ii) previsão, usando uma ou mais técnicas de Aprendizagem Profunda, de uma intenção de usuário em comparação a uma consulta de usuário no conjunto de consultas em linguagem natural não classificadas; execução, com base na intenção de usuário prevista e no agente conversacional multiuso identificado, de um de: (i) seleção de um ou mais conjuntos predefinidos de respostas entre uma pluralidade de conjuntos prédefinidos de respostas ou engajamento de um usuário para extrair informação detalhada ou chamada de APIs externas para comunicar a informação detalhada a um ou mais serviços externos depois de determinar o agente conversacional
Petição 870190055890, de 17/06/2019, pág. 83/130 multiuso identificado, como sendo correspondente à estrutura IAD, em que um ou mais conjuntos de respostas predefinidos e a informação detalhada correspondem ao conjunto de consultas em linguagem natural; ou (ii) classificação de uma consulta entre o conjunto de consultas em linguagem natural para identificar uma ou mais categorias de conversas implementando uma técnica de rede neural recorrente ao determinar o agente conversacional multi-uso identificado como sendo correspondente à estrutura QUE; e (iii) execução, com base na consulta classificada, de um de: (a) consulta de um ou mais gráficos de conhecimento para gerar um primeiro conjunto de respostas correspondentes ao conjunto de consultas em linguagem natural; ou (b) atualização, pelo Agente KGU-NL, de um ou mais gráficos de conhecimento para gerar um segundo conjunto de respostas correspondentes ao conjunto de consultas em linguagem natural; definição em hierarquia, com base no conjunto de consultas antecipadas de usuário de linguagem natural, da pluralidade de componentes e de um ou mais agentes conversacionais multiuso para processar as consultas em linguagem natural; geração automática, com base em um ou mais conjuntos de dados de treinamento, de uma pluralidade de perguntas recomendadas para um ou mais usuários para facilitar o processamento de consultas em linguagem natural; atualização de um ou mais gráficos de conhecimento pelo Agente de Atualização do Gráfico de Conhecimento com base em um conjunto de informação obtida de um ou mais usuários pelo Agente de Engajamento do Gráfico de Conhecimento e em que o conjunto de informações corresponde ao processamento de consultas em linguagem natural; obtenção do conjunto de informações a partir de um ou mais usuários por meio de um engajamento de usuário proativo ou por uma análise de informação correspondente a um ou mais gráficos de conhecimento pelo Agente de Engajamento de Gráfico de Conhecimento; geração do primeiro conjunto de respostas por: (i) mapeamento de uma ou mais entidades correspondentes a um ou mais gráficos de conhecimento com uma ou mais frases correspondentes à consulta classificada por uma técnica de pesquisa baseada em índice invertido; e (ii) atravessamento, com base no mapeamento, de um ou mais gráficos de conhecimento para gerar o primeiro conjunto de respostas; e geração do segundo conjunto de respostas seja pelo engajamento do usuário para extrair a informação detalhada correspondente ao conjunto de consultas em linguagem natural seja pela execução de um conjunto de comandos por uma interface.
[007] Em um outro aspecto, é proporcionado um ou mais meios de armazenamento de informação legível por máquina não-transitórios
Petição 870190055890, de 17/06/2019, pág. 84/130 compreendendo uma ou mais instruções, que são executadas por um ou mais processadores de hardware para executar um método para técnicas de aprendizagem profunda baseadas em agentes conversacionais multiuso para processar as consultas em linguagem natural, compreendendo o método: definição de uma pluralidade de componentes compreendendo um Gerenciador de Estado de Diálogo (DSM), um Componente de Identificação de Intenção Multi-Uso, um gerenciador de agentes, uma pluralidade de agentes primários, uma Estrutura de Diálogo de Ação Intenção (IAD), uma estrutura Consulta-AtualizaçãoEngajamento (QUE), Agente de Linguagem Natural- Atualização de Gráfico de Conhecimento (KGU-NL), um Agente de Engajamento de Gráfico de Conhecimento, uma pluralidade de Agentes Auxiliares e um Agente de Atualização de Gráfico de Conhecimento, em que cada componente dentre a pluralidade de componentes compreende um ou mais agentes conversacionais multiuso; integração lógica, com base em um conjunto de consultas antecipadas de usuário em linguagem natural, a pluralidade de componentes por uma ou mais interfaces de programação de aplicativos (APIs); recepção, pela pluralidade de componentes logicamente integrados, de um conjunto de consultas em linguagem natural a partir de uma pluralidade de fontes; execução, com base no conjunto de consultas em linguagem natural, de uma pluralidade de etapas, em que a pluralidade de etapas compreende: (i) identificação de pelo menos um agente conversacional multiuso entre um ou mais agentes conversacionais multiuso utilizando o DSM, em que o agente conversacional de multi-uso identificado corresponde à estrutura IAD ou à estrutura QUE ; e (ii) previsão, usando uma ou mais técnicas de Aprendizagem Profunda, de uma intenção de usuário em comparação a uma consulta de usuário no conjunto de consultas de linguagem natural não classificadas; execução, com base na intenção de usuário prevista e no agente conversacional multiuso identificado, um de: (i) seleção de um ou mais conjuntos predefinidos de respostas entre uma pluralidade de conjuntos prédefinidos de respostas ou engajamento de um usuário para extrair informação detalhada ou chamada de APIs externas para comunicar a informação detalhada a um ou mais serviços externos depois de determinar o agente conversacional multiuso identificado, como sendo correspondente à estrutura IAD, em que um ou mais conjuntos de respostas predefinidos e a informação detalhada correspondem ao conjunto de consultas em linguagem natural; ou (ii) classificação de uma consulta entre o conjunto de consultas em linguagem natural para identificar uma ou mais categorias de conversas implementando uma técnica de rede neural
Petição 870190055890, de 17/06/2019, pág. 85/130 recorrente ao determinar o agente conversacional multi-uso identificado como sendo correspondente à estrutura QUE; e (iii) execução, com base na consulta classificada, de um de: (a) consulta de um ou mais gráficos de conhecimento para gerar um primeiro conjunto de respostas correspondentes ao conjunto de consultas em linguagem natural; ou (b) atualização, pelo Agente KGU-NL, de um ou mais gráficos de conhecimento para gerar um segundo conjunto de respostas correspondentes ao conjunto de consultas em linguagem natural; definição em hierarquia, com base no conjunto de consultas antecipadas de usuário de linguagem natural, da pluralidade de componentes e de um ou mais agentes conversacionais multiuso para processar as consultas em linguagem natural; geração automática, com base em um ou mais conjuntos de dados de treinamento, de uma pluralidade de perguntas recomendadas para um ou mais usuários para facilitar o processamento de consultas em linguagem natural; atualização de um ou mais gráficos de conhecimento pelo Agente de Atualização do Gráfico de Conhecimento com base em um conjunto de informação obtida de um ou mais usuários pelo Agente de Engajamento do Gráfico de Conhecimento e em que o conjunto de informações corresponde ao processamento de consultas em linguagem natural; obtenção do conjunto de informações a partir de um ou mais usuários por meio de um engajamento de usuário proativo ou por uma análise de informação correspondente a um ou mais gráficos de conhecimento pelo Agente de Engajamento de Gráfico de Conhecimento; geração do primeiro conjunto de respostas por: (i) mapeamento de uma ou mais entidades correspondentes a um ou mais gráficos de conhecimento com uma ou mais frases correspondentes à consulta classificada por uma técnica de pesquisa baseada em índice invertido; e (ii) atravessamento, com base no mapeamento, de um ou mais gráficos de conhecimento para gerar o primeiro conjunto de respostas; e geração do segundo conjunto de respostas seja pelo engajamento do usuário para extrair a informação detalhada correspondente ao conjunto de consultas em linguagem natural seja pela execução de um conjunto de comandos por uma interface.
[008] Naturalmente que tanto a descrição geral anterior como a descrição detalhada que se segue são apenas exemplificativas e explicativas e não são restritivas da invenção, como reivindicado.
BREVE DESCRIÇÃO DOS DESENHOS [009] Os desenhos anexos, que são incorporados e fazem parte desta divulgação, ilustram formas de concretização exemplificativas e, juntamente com a descrição, servem para explicar os princípios:
Petição 870190055890, de 17/06/2019, pág. 86/130 [010] A figura 1 ilustra um diagrama de blocos de um sistema para técnicas de aprendizagem profunda com base em agentes conversacionais de propósitos múltiplos para o processamento de consultas em linguagem natural, de acordo com algumas formas de concretização da presente descrição.
[011] A figura 2A a 2C é um diagrama de fluxo que ilustra as etapas envolvidas no processo de técnicas de aprendizagem profunda baseadas em agentes conversacionais multiuso para o processamento de consultas em linguagem natural, de acordo com algumas formas de concretização da presente descrição.
[012] A figura 3 ilustra uma arquitetura técnica que descreve os componentes e o fluxo de um sistema para agentes conversacionais multiuso baseados em técnicas de Aprendizagem Profunda para processar as consultas em linguagem natural, de acordo com algumas formas de realização da presente descrição.
[013] A figura 4 ilustra uma arquitetura funcional de um sistema para técnicas de aprendizagem profunda com base em agentes conversacionais de propósitos múltiplos para o processamento de consultas em linguagem natural, de acordo com algumas formas de concretização da presente descrição.
[014] A figura 5 ilustra uma arquitetura de aprendizagem profunda baseada em uma rede BiLSTM (Bidirecional Long Short Term Memory) (ou classificação BiLSTM), uma camada maxpool e uma função de Divergência Kullback Leibler (SQRD-LKD) de raiz quadrada, de acordo com algumas formas de concretização da presente divulgação.
[015] A figura 6 ilustra um diagrama de exemplo de uma Automação de Estado Finito (FSA) para um diálogo, de acordo com algumas formas de concretização da presente descrição.
[016] A figura 7 ilustra um portal de console de autoatendimento que facilita as técnicas de Aprendizagem Profunda baseadas em agentes conversacionais multi-uso para processar as consultas em linguagem natural, de acordo com algumas de concretização da presente descrição.
[017] A figura 8 ilustra uma arquitetura técnica de um Identificador de Intenção QUE implementado inter alia, para síntese de conhecimento e classificação de BiLSTM, de acordo com algumas formas de concretização da presente descrição.
[018] A figura 9 ilustra uma representação visual de um ou mais gráficos de conhecimento integrados com a arquitetura técnica, de acordo com algumas
Petição 870190055890, de 17/06/2019, pág. 87/130 formas de concretização da presente divulgação.
DESCRIÇÃO DETALHADA [019] Formas de concretização exemplificativas são descritas com referência aos desenhos em anexo. Nas figuras, o (s) dígito (s) mais à esquerda de um número de referência identifica o índice, no qual o número de referência aparece pela primeira vez. Sempre que conveniente, os mesmos números de referência são usados ao longo dos desenhos para se referirem às mesmas partes ou semelhantes. Embora exemplos e características de princípios divulgados sejam aqui descritos, modificações, adaptações e outras implementações são possíveis sem se afastar do espírito e escopo das formas de concretização divulgadas. Pretende-se que a seguinte descrição detalhada seja considerada apenas como exemplificativa, com o verdadeiro escopo e espírito sendo indicado pelas reivindicações a seguir:.
[020] As formas de concretização da presente divulgação fornecem sistemas e métodos para agentes conversacionais multi-uso com base em técnicas de Aprendizagem Profunda para processar consultas em linguagem natural, de acordo com algumas formas de concretização da presente divulgação. Um modelo de processamento de linguagem natural pode ser um sistema de aprendizado de máquina, ou componente dele, usado por um sistema de computador para interagir com linguagens humanas. Por exemplo, um modelo de processamento de linguagem natural pode receber uma consulta como entrada e pode fazer previsões sobre o texto da consulta para ajudar a determinar o que a consulta está solicitando e quais informações ou ações podem ser respostas relevantes para a consulta. O processamento em linguagem natural é desejado porque permite que os usuários falem seu próprio idioma ao formularem sua solicitação de informação, em vez de forçá-los a falar em um formato que uma tecnologia possa entender.
[021] A maioria dos sistemas conversacionais baseados em Inteligência Artificial não emprega algoritmos de aprendizagem profunda e, portanto, incapaz de processar um grande número de Intenções. Além disso, nenhum deles atualmente suporta gráficos de conhecimento ou engajamento proativo dos usuários para a elicitação do conhecimento, como fazemos. Além disso, os atuais sistemas conversacionais baseados em IA não têm a capacidade de hospedar vários agentes de processamento e atendimento diferentes para assistência virtual por meio da persona digital única. Para identificar as intenções, a maioria dos sistemas usa regras que evitamos usando as Redes Neurais de Convolução (CNN), modelos baseados em memória de curto prazo (LSTM) para identificação de Petição 870190055890, de 17/06/2019, pág. 88/130 intenção. Pode ser um desafio para um modelo de ponta-a-ponta servir as consultas de usuários em vários domínios diferentes (por exemplo, licença, seguro etc. em uma organização) e também engajá-los em um diálogo significativo para extrair a informação necessária. Sem uma configuração clara sobre quais informações precisam ser elicitadas no contexto de uma determinada intenção, a realização de uma conversa com o (s) usuário (s) pode ser um desafio.
[022] Portanto, há uma necessidade de uma tecnologia que forneça interações contínuas entre vários componentes probabilísticos de aprendizado de máquina trabalhando em paralelo, treinamento contínuo e lista de trabalho para agentes, engajamento proativo de usuários para síntese de conhecimento, identificação de intenção de alto nível para suportar múltiplos agentes sob mesma persona digital e fornece uma capacidade de criar agentes sem escrever nenhum programa.
[023] Referindo-nos agora aos desenhos, e mais particularmente às figuras 1 a 9, em que caracteres de referência semelhantes denotam características correspondentes consistentemente ao longo das figuras, serão mostradas as formas de concretização preferidas e estas formas de concretização são descritas no contexto do seguinte sistema exemplificativo e / ou método.
[024] A figura 1 ilustra um diagrama de blocos exemplificativo de um sistema 100 para técnicas de aprendizagem profunda com base em agentes conversacionais de propósitos múltiplos para o processamento de consultas em linguagem natural, de acordo com algumas formas de concretização da presente descrição. Em uma forma de concretização, o sistema 100 inclui um ou mais processadores 104, dispositivo (s) de interface de comunicação ou interface (s) de entrada / saída (I / O) 106, e um ou mais dispositivos de armazenamento de dados ou memória 102 acoplados operacionalmente a um ou mais processadores 104. Um ou mais processadores 104 que são processadores de hardware podem ser implementados como um ou mais microprocessadores, microcomputadores, microcontroladores, processadores de sinal digital, unidades centrais de processamento, máquinas de estado, circuitos lógicos e / ou quaisquer dispositivos que manipulem sinais baseados em instruções operacionais. Entre outras capacidades, o (s) processador (es) é/são configurados para buscar e executar instruções legíveis por computador armazenadas na memória. Em uma forma de concretização, o sistema 100 pode ser implementado em uma variedade de sistemas computacionais, tais como computadores laptop, computadores portáteis, dispositivos portáteis, estações de trabalho, computadores mainframe, servidores,
Petição 870190055890, de 17/06/2019, pág. 89/130 uma nuvem de rede e semelhantes.
[025] O (s) dispositivo (s) 106 de interface de I/O pode incluir uma variedade de interfaces de software e hardware, por exemplo, uma interface web, uma interface gráfica de usuário e similares e pode facilitar múltiplas comunicações dentro de uma ampla variedade de redes N / W e tipos de protocolos, incluindo redes com fio, por exemplo, LAN, cabo, etc., e redes sem fio, como WLAN, celular ou satélite. Em uma concretização, os dispositivos de interface de I/O podem incluir uma ou mais portas para conectar um número de dispositivos entre si ou a outro servidor.
[026] A memória 102 pode incluir qualquer meio legível por computador conhecido no estado da técnica incluindo, por exemplo, memória volátil, tal como memória de acesso aleatório estática (SRAM) e memória de acesso aleatório dinâmica (DRAM), e / ou memória não volátil, tal como memória somente leitura (ROM), ROM apagável programável, memórias flash, discos rígidos, discos ópticos e fitas magnéticas.
[027] A figura 2A a 2C, com referência à figuras 1 ilustra um diagrama de blocos exemplificativo de um método para técnicas de aprendizagem profunda com base em agentes conversacionais de propósitos múltiplos para o processamento de consultas em linguagem natural, de acordo com algumas formas de concretização da presente descrição. Em uma forma de concretização o sistema 100 compreende um ou mais dispositivos de armazenamento de dados ou a memória 102 acoplada operacionalmente a um ou mais processadores de hardware 104 e está configurada para armazenar instruções para execução de etapas do método por um ou mais processadores 104. As etapas do método da presente divulgação serão agora explicados com referência aos componentes do sistema 100, como representado na figura 1 e o fluxograma da figura Nas formas de concretização da presente divulgação, os processadores de hardware 104, quando configurados as instruções executam uma ou mais metodologias aqui descritas.
[028] De acordo com uma forma de concretização da presente divulgação, na etapa 201, um ou mais processadores de hardware 104 definem uma pluralidade de componentes compreendendo um Gerenciador de Estado de Diálogo (DSM) 302, um Componente de Identificação de Intenção de Múltiplos Níveis 303 (como uma parte do DSM 302) um Gerenciador de Agentes 304, uma pluralidade de Agentes Primários 306, uma pluralidade de Agentes Auxiliares 319 e um Agente Otimizador de Gráfico de Conhecimento. Em uma forma de concretização, cada componente entre a pluralidade de componentes compreende Petição 870190055890, de 17/06/2019, pág. 90/130 um ou mais agentes conversacionais multiuso. Com relação à figura 3, a pluralidade de componentes definidos pode agora ser considerada em detalhe.
[029] De acordo com uma concretização da presente descrição, o DSM 302 compreende uma ou mais técnicas de Aprendizagem Profunda baseadas em componente de identificação de intenção multi-nível 303. Quando qualquer um de um agente conversacional multiuso entre a pluralidade de componentes precisa entrar em um diálogo de múltiplas voltas iniciado por um ou mais usuários, todos os agentes de conversação multiuso correspondentes a cada um dos componentes entre a pluralidade de componentes se comunicam (via uma ou mais interfaces de programação de aplicativos (APIs)) (não mostradas na figura) com o DSM 302 para continuar encaminhando o diálogo de várias voltas iniciado por um ou mais usuários para o agente de conversação multiuso que precisa inserir o rode o diálogo, até que o agente de conversação multiuso que precisa entrar no diálogo de várias voltas libere o controle novamente para o DSM 302 para decidir o fluxo.
[030] Em uma forma de concretização, o DSM 302 mantém uma pilha, em que a pilha compreende um ou mais ponteiros facilitando interações entre a pluralidade de Agentes Primários 306, a pluralidade de Agentes Auxiliares 319, o Agente Otimizador do Gráfico de Conhecimento e os outros agentes mostrados na figura 3. Em um cenário exemplificativo, referindo-se à figura 3 novamente, um Agente de Seguro de Saúde 310 pode chamar ou interagir com um Agente de Diálogo 320 para certa intenção. A pilha pode persistir em um estado de sessões, uma vez que uma ou mais realiza uma conversa abrangendo vários agentes mencionados na figura 3.
[031] De acordo com uma forma de concretização da presente divulgação, o Componente de Identificação de Intenção Multinível 303 identifica um agente conversacional multiuso com base em uma pluralidade de enunciados de usuário (ou nas consultas em linguagem natural) por um classificador de Aprendizagem Profunda (discutido mais tarde). Se a (s) resposta (s) gerada (s) pelo agente conversacional multiuso apropriado não for apropriada ou conforme as expectativas de um ou mais usuários, o Componente de Identificação de Intenção de Múltiplos Níveis 303 comunica as consultas em linguagem natural à pluralidade de Agentes Primários 306 ou à pluralidade de Agentes Auxiliares 319 e um ou mais agentes conversacionais multiuso correspondendo à pluralidade de Agentes Primários 306 ou à pluralidade de Agentes Auxiliares 319 através dos APIs. Um ou mais agentes conversacionais multiuso retornam o controle para o DSM 302 com resposta (s) apropriada (s) ou com um status em que a consulta pode não ser
Petição 870190055890, de 17/06/2019, pág. 91/130 atendida. As respostas são avaliadas pelo DSM 302 e a melhor resposta é gerada para um ou mais usuários com base na similaridade de consulta-resposta (discutida posteriormente).
[032] De acordo com uma forma de concretização da presente divulgação, a pluralidade definida de componentes compreende ainda um mecanismo de auto-sugestão 305 para gerar automaticamente, com base em um ou mais conjuntos de dados de treinamento, uma pluralidade de perguntas recomendadas para um ou mais usuários para processar as consultas em linguagemn natural. Em uma forma de concretização, a pluralidade de perguntas recomendadas pode ser baseada em uso (s) passado (s) ou consultas podem ser geradas automaticamente para um ou mais usuários. A pluralidade de perguntas recomendadas pode compreender diferentes categorias de questões que podem ser baseadas em um ou mais conjuntos de dados de treinamento.
[033] Em uma forma de concretização, cada um ou mais agentes conversacionais multiusos mantêm um ou mais conjuntos de dados de treinamento e se as consultas em linguagem natural a partir de um ou mais usuários coincidirem com um ou mais conjuntos de dados de treinamento, um ou mais agentes conversacionais multiuso não executam nenhum modelo de aprendizagem de máquina e geram a (s) resposta (s) com base em um ou mais conjuntos de dados de treinamento. Isso garante que as respostas corretas correspondentes às consultas em linguagem natural recebidas sejam geradas por meio de um ou mais conjuntos de dados de treinamento. Em um cenário exemplificativo, a pluralidade de perguntas recomendadas que podem ser geradas automaticamente pode incluir uma pergunta tirada de uma intenção semelhante à pergunta mais recente de um ou mais usuários (por exemplo, pertencentes ao mesmo tipo de licença, como licença por doença) em um ou mais conjuntos de dados de treinamento do agente atual, pergunta da próxima intenção como disponível em um ou mais conjuntos de dados de treinamento e uma pergunta de um ou mais conjuntos de dados de treinamento de um agente escolhido aleatoriamente.
[034] Em uma forma de concretização, o Gerenciador de Agentes 304 fornece um conjunto de comandos para gerir os (s) treinamentos (s) da pluralidade de Agentes Primários 306, da pluralidade de Agentes Auxiliares 319 e um ou mais agentes conversacionais multiuso, ou para observar padrões de utilização, por exemplo, para mostrar estatísticas de uso, registros de usuários, consultas aprovadas/não aprovadas etc., bem como para treinamento contínuo (discutido abaixo). O conjunto de comandos não está sujeito ao Componente de Identificação
Petição 870190055890, de 17/06/2019, pág. 92/130 de Intenção de Múltiplos Níveis 303, e pode ser tratado de maneira diferente pelo
DSM 302.
[035] Quando a (s) resposta (s) correspondente (s) às consultas em linguagem natural por um ou mais usuários não for gerada, um ou mais usuários poderão solicitar respostas alternativas, por exemplo, um comando 'x opt', que retornará a resposta apropriada ( s) na ordem das probabilidades do classificador. Depois disso, um comando como x intenção-id 4 marca a intenção correta. A (s) resposta (s) apropriada (s) gerada (s) com base no conjunto de comandos é adicionada em um ou mais conjuntos de dados de treinamento do respectivo agente e, como resultado, se a mesma consulta for levantada por um ou mais usuários posteriormente, as respostas corretas serão geradas. As funções, uso e implementação de um ou mais agentes conversacionais multiuso, como o agente 316 em linguagem natural -atualização do gráfico de conhecimento (KGUNL), como um agente de licença 309 e como o agente de seguro de saúde 310 foram explicados posteriormente com exemplos de implementações.
[036] Uma melhoria contínua no desempenho de componentes de aprendizagem de máquina pode exigir a obtenção de resposta de um ou mais usuários. A divulgação proposta facilita um mecanismo de Gerenciamento de Resposta (não mostrado na figura) para facilitar. O mecanismo de Gerenciamento de Resposta compreende um ou mais mentores para cada um dos agentes conversacionais multiuso. Quando um ou mais usuários não gostam de resposta (s) correspondentes às consultas em linguagem natural processadas, um fluxo de trabalho pode ser criado, onde o fluxo de trabalho é limpo por um ou mais mentores correspondentes a um agente conversacional multiuso (entre um ou mais agentes conversacionais multiuso) que geraram a (s) resposta (s).
[037] Em uma concretização, um ou mais mentores usam inicialmente um ou mais comandos para treinar o agente conversacional multiuso (que gerou a (s) resposta (s)) antes de limpar o fluxo de trabalho. Se uma ou mais consultas em linguagem natural (entre um conjunto de consultas em linguagem natural) forem comunicadas a um agente errado (entre um ou mais agentes conversacionais multiuso), um ou mais mentores encaminhará o fluxo de trabalho para um conjunto de mentores correspondentes ao DSM 302.
[038] Com base em consultas não atendidas entre uma ou mais consultas em linguagem natural no fluxo de trabalho de um mentor entre o conjunto de mentores correspondentes ao DSM 302, um agente conversacional multiuso apropriado inicia pró-ativamente um diálogo com o mentor (isto é, com o mentor Petição 870190055890, de 17/06/2019, pág. 93/130 entre o conjunto de mentores correspondentes ao DSM 302) e busca orientação sobre como responder às consultas não atendidas da melhor forma. O mecanismo de Gerenciamento de Resposta facilita o treinamento periódico de toda a pluralidade de componentes e um ou mais agentes conversacionais multiuso.
[039] Com relação à figura 4, uma arquitetura funcional de técnicas de Aprendizagem Profundas baseadas em agentes conversacionais multiuso para o processamento de consultas em linguagem natural pode ser referido. Com relação à figura 4 novamente, pode-se observar que três tipos de categorias conversacionais foram marcadas a) conversa conduzida pelo usuário (UDC) para situações em que um ou mais usuários iniciam uma conversa, b) conversa conduzida por agente (ADC), quando um agente entre um ou mais agentes conversacionais multiuso iniciam proativamente a conversa e c) conversa conduzida por modelo (Model Driven Conversation, MDC), quando um modelo de aprendizagem de máquina inicia o diálogo para atualizar seus dados de treinamento.
[040] De acordo com uma forma de concretização da presente divulgação, na etapa 202, um ou mais processadores de hardware 104 integram logicamente, com base em um conjunto de consultas de usuário em linguagem natural antecipadas, a pluralidade de componentes por uma ou mais APIs. Com relação às figuras 3 e 4 novamente, a integração lógica da pluralidade de componentes pode ser referida (através das arquiteturas técnicas e funcionais). O conjunto de consultas antecipadas de usuários em linguagem natural pode variar de uma consulta simples, por exemplo, como você está indo a consultas complexas relacionadas a políticas médicas ou relacionadas à saúde, e consultas muito complexas que variam de questões de pesquisa, pelo mapeamento de consultas de bancos de dados de conhecimento. Além disso, as questões de pesquisa (na forma de qualquer consulta em linguagem natural) podem vir de várias fontes, como uma unidade de pesquisa dentro de uma organização.
[041] A camada inicial é composta por componentes principais, em que os principais componentes são o DSM 302, o Gerenciador de Agentes 304 e o mecanismo de sugestão automática. Embora as funções da pluralidade de componentes tenham sido discutidas acima, é possível novamente referi-las para entender o conceito da integração lógica.
[042] Em uma forma de concretização, o conjunto de consultas em linguagem natural é inicialmente recebido pelo DSM 302 e depois baseado na intenção de cada consulta em linguagem natural entre (o conjunto de consultas em
Petição 870190055890, de 17/06/2019, pág. 94/130 linguagem natural), é então encaminhado pelo Componente de Identificação de Intenção de Múltiplos Níveis 303 para o agente apropriado entre um ou mais agentes conversacionais multiuso para processamento (discutido mais tarde em detalhe mais adiante). O mecanismo de sugestão automática 305 ajuda um ou mais usuários a decidir que tipo de consultas em linguagem natural ou a pluralidade de questões poderá ser levantado. O Gerenciador de Agentes 304 proporciona o conjunto de comandos para gerir a pluralidade de Agentes Primários 306, a pluralidade de Agentes Auxiliares 319 e um ou mais agentes conversacionais multiuso.
[043] Com relação à figura 3 novamente, podemos notar que a camada seguinte compreende a pluralidade de Agentes Primários 306 compreendendo um Agente 307 de Caixa do Chatter Geral , uma estrutura 308 de Diálogo de Ação por Intenção (IAD) e uma estrutura 314 de Consulta-Atualização-Engajamento (QUE). O Agente de Caixa do Chatter Geral 307 corresponde á estrutura IAD 308 e responde aos enunciados gerais, por exemplo, “como você está fazendo”, “o que você faz etc.”? A estrutura IAD 308 é composta por um ou mais agentes conversacionais multiuso para responder a uma ou mais consultas em linguagem natural de um ou mais usuários. Considerando um cenário exemplificativo, referindo-se à figura 3 novamente, um ou mais agentes conversacionais multiuso correspondentes à estrutura IAD 308 compreendem o Agente de Licença 309, o Agente de Seguro Saúde 310, um Agente Médico de Emergência 311, um Agente de Planilha de Horários 312 e um Agente de Viagens 313.
[044] Em uma forma de concretização, um ou mais agentes conversacionais multiuso correspondentes à Estrutura IAD 308 podem desempenhar uma pluralidade de funções. Considerando novamente um cenário exemplificativo, o Agente de Seguro de Saúde 310 pode responder a uma consulta em linguagem natural “ qual é o valor do meu prêmio saúde devido” enquanto o Agente de Licença 309 pode responder a uma consulta em linguagem natural “quantas licenças eu tenho pendente?”. Da mesma forma, o Agente de Planilha de Horários 312 pode responder a consultas em linguagem natural relacionadas com planilha de horários, enquanto o Agente de Viagens 313 pode responder a consultas em linguagem natural relacionadas com viagens. O Agente Médico de Emergência 311 pode auxiliar um ou mais usuários em emergências médicas relacionadas. Podemos notar que as formas de concretização da presente divulgação não restringem a estrutura IAD 308 a um ou mais agentes conversacionais multiuso discutidos acima. A estrutura IAD 308 pode
Petição 870190055890, de 17/06/2019, pág. 95/130 compreender múltiplos agentes conversacionais multiuso (diferentes daqueles discutidos) para executar diferentes tipos de funções.
[045] Em uma forma de concretização, a estrutura QUE 314 compreende um Agente de pergunda-resposta de Gráfico de Conhecimento 315 (KGQA) configurado para responder a consultas em linguagem natural em pesquisa, o Agente 316 de Atualização de Linguagem Natural de Gráfico de Conhecimento (KGU-NL) configurado para síntese de conhecimento e um Agente de Engajamento de Gráfico de Conhecimento 317 para engajar proativamente um ou mais usuários, a fim de obter informações adicionais correspondentes às consultas em linguagem natural de um ou mais usuários. O Agente de Engajamento do Gráfico de Conhecimento 317 engaja um ou mais usuários para diálogo (s) com um ou mais usuários ou pesquisadores e outras partes interessadas relevantes. Conforme acima mencionado, as questões de pesquisa (na forma de qualquer consulta em linguagem natural) podem vir de múltiplas fontes, como uma unidade de pesquisa dentro de uma organização.
[046] Em uma forma de concretização, referindo-se à figura 3 novamente, podemos notar que a pluralidade de agentes auxiliares 319 compreende o Agente de Diálogo 320 para gerenciar todos os diálogos, um agente de atualização de gráfico de conhecimento 321 atualiza um ou mais gráficos de conhecimento 322 e se comunica com um banco de dados de gráfico de conhecimento (agora mostrado no figura). O Banco de Dados do Gráfico de Conhecimento mantém todas as informações relevantes correspondentes a um ou mais gráficos de conhecimento.
[047] Em uma forma de concretização, um ou mais Serviços Externos 318 podem compreender qualquer base de dados ou uma arquitetura ou qualquer outro componente de hardware / software de fonte (s) externa (s) que possam comunicar com a pluralidade de componentes através de uma ou mais APIs. Assim, a pluralidade de componentes e um ou mais agentes conversacionais multiuso foram logicamente integrados e definidos em uma hierarquia baseada no conjunto de consultas antecipadas de usuários de linguagem natural, seu (s) uso (s), funções e outros parâmetros necessários.
[048] A integração técnica da pluralidade de componentes pode agora ser considerada em detalhe. Uma camada de interface de cliente 301 pode ser implementada usando um servlet controlador frontal em JAVA ™ que recebe solicitações de entrada de Transferência de Estado Representacional (REST) de entrada, executa a autenticidade da solicitação e encaminha a solicitação ao DSM 302. A pluralidade de componentes foi implementada em Python usando várias
Petição 870190055890, de 17/06/2019, pág. 96/130 bibliotecas de aprendizado de máquina e de aprendizagem profunda, como Numpy, Scipy, Keras, Tensorflow / Theano etc. A pluralidade de componentes foi implementada como serviços RESTful e formato JavaScript ™ Object Notation (JSON). é usado para troca de mensagens. O estado de sessão do usuário é armazenado em um banco de dados no-sql Redis. Para facilitar um diálogo iniciado pelo sistema, uma fila de perguntas é mantida para cada usuário entre um ou mais usuários no próprio banco de dados Redis, e o Agente de Engajamento do Gráfico de Conhecimento 317 pega essas questões. A integração lógica facilita o rastreamento da (s) interação (ões) de um ou mais usuários com uma persona digital e mantém registros de interação. Os logs de interação são usados para gerar estatísticas de uso de um sistema de computação. Para garantir que o sistema de computação (ou seja, sobre o qual a metodologia proposta foi implementada e testada) permaneça ativo o tempo todo, o mecanismo de inicialização automática foi estabelecido para todos os serviços de restful individuais.
[049] Podemos notar que as formas de concretização da presente divulgação não restringem a integração lógica da pluralidade de componentes aos referidos nas figuras 3 e 4 somente. As formas de concretização da presente divulgação proporcionam a definição e integração lógica de um ou mais novos componentes com base nas consultas em linguagem natural e / ou com base no conjunto de consultas antecipadas em linguagem natural ou com base em quaisquer outros requisitos técnicos / não técnicos.
[050] De acordo com uma forma de concretização da presente divulgação, na etapa 203, um ou mais processadores de hardware 104 recebem, pela implementação da pluralidade de componentes logicamente integrados, o conjunto de consultas em linguagem natural a partir de uma pluralidade de fontes. O conjunto de consultas em linguagem natural pode ser inicialmente recebido pelo DSM 302 (como discutido acima) e então o Componente de Identificação de Intenção de Múltiplos Níveis 303 identifica o agente conversacional multiuso apropriado entre um ou mais agentes conversacionais multiuso para processar o conjunto de consultas em linguagem natural recebidas (discutido em detalhes na etapa 204 (i) abaixo).
[051] Em geral, o conjunto de consultas em linguagem natural pode incluir uma ou mais consultas expressas em inglês ou em qualquer outro idioma falado (ou em qualquer idioma natural) de maneira normal. Por exemplo, qual é o meu prêmio de saúde devido ou qual é o meu saldo de licenças. Uma característica do texto da linguagem natural é normalmente o uso de palavras
Petição 870190055890, de 17/06/2019, pág. 97/130 (referências) que se referem a outras palavras ou a conceitos que aparecem ou estão implícitos em outras partes do texto (antecedentes). O conjunto de consultas em linguagem natural pode ser recebido a partir da pluralidade de fontes para processamento, por exemplo, de um ou mais usuários. Além disso, usando sistemas e processadores de computação modernos, informações de várias fontes podem ser obtidas quase instantaneamente e podem ser levantadas como uma consulta em uma linguagem natural para processamento posterior.
[052] De acordo com uma forma de concretização da presente divulgação, na etapa 204 (i), um ou mais processadores de hardware 104 identificam, com base no conjunto de consultas em linguagem natural recebidas, pelo menos um agente conversacional multiuso entre um ou mais agentes conversacionais multiuso usando o DSM 302, em que o agente conversacional multiuso identificado corresponde a qualquer uma estrutura IAD 308 ou estrutura QUE 314. Na etapa 204 (ii), um ou mais processadores de hardware 104 prevêem, usando uma ou mais técnicas de Aprendizagem Profunda, uma intenção de usuário provável contra uma consulta de usuário entre o conjunto de consultas em linguagem natural não classificadas. Em comparação com os sistemas e métodos tradicionais, que usam uma resposta de voz interativa para responder às consultas em linguagem natural, a divulgação proposta fornece uma técnica de Identificação de Intenção de Alto Nível para identificar um agente conversacional multiuso. As etapas 204 (i) e (ii) podem ser explicadas em detalhe em paralelo através de uma técnica de Identificação de Intenção discutida abaixo.
[053] Identificação de Intenção: Em uma forma de concretização, a estrutura IAD 308 facilita dois tipos de modelos para prever a provável intenção do usuário, um Modelo de Intenção Simples e um Modelo de Intenção Avançado. Os modelos utilizam um ou mais conjuntos de dados de treinamento como uma entrada. Um ou mais conjuntos de dados de treinamento compreendem um conjunto de conjuntos semanticamente semelhantes de consultas e um conjunto de respostas correspondentes aos conjuntos semanticamente semelhantes de consultas. Em uma forma de concretização, os modelos utilizam dados de treinamento representados como Ü={S1,S2 Sí}, que é um conjunto de IDs S/. de intenção. Como mencionado acima, cada IDs sí de intenção compreende o conjunto de consultas semanticamente semelhantes representadas Xí={Xií, %i2, ,Xlm} e o conjunto correspondente de respostas representado Eí={ yií, yi2, ,ylm }, isto é, Si =( Xt, Yt). O objetivo dos modelos é identificar a
Petição 870190055890, de 17/06/2019, pág. 98/130 intenção IDF, ou seja, Si para cada consulta de usuário x. Em uma implementação exemplificativa, referente à Tabela 1, abaixo de um exemplo de um ou mais conjuntos de dados de treinamento.
[054] Modelo de Intenção Simples:
O Modelo de Intenção Simples é implementado quando os dados são limitados em volume e têm baixa similaridade entre ID, ou seja, quando as semelhanças textuais entre uma ou mais consultas em linguagem natural (entre o conjunto de consultas em linguagem natural) pertencentes a qualquer dois intente-IDs diferentes são baixas. Em uma forma de concretização, o volume se refere ao número de intenteIDs e ao número de consultas em um ID de intenção. Um modelo baseado nas semelhanças textuais, ou seja, o Modelo de Intenção Simples é adequado sob tais circunstâncias. Uma técnica SequencerMatcher pode ser implementada para encontrar uma ou mais semelhanças entre um par se as consultas considerarem cada consulta como uma sequência de caracteres, conforme mostrado na equação abaixo. A técnica SequencerMatcher facilita a robustez contra erros ortográficos ao implementar o modelo de intenção simples.
[055] Em uma forma de concretização, para responder a uma consulta do usuário x, a semelhança entre a consulta do usuário x e todas as consultas presentes em D podem ser calculadas e o ID de intenção com a consulta mais semelhante é identificado como Si = argmax si zd sim(x,xij') onde:
= 2 * M/T equation em que M é o número de correspondências e T é o número total de caracteres no x e %ij. Uma vez identificada a intenção sí, uma resposta aleatória do conjunto correspondente de respostas Yí pode ser gerado.
Tabela 1:
Intenção ID Conjuntos de dados de treinamento Ação
1 Posso solicitar licença médica antecipadamente? Resposta pré-definida Y i
1 É possível aplicar licença médica antecipadamente?
1 Eu tenho uma consulta médica amanhã, posso aplicar a licença médica antecipadamente?
2 Dê uma lista de feriados este ano API de chamada para verificar a lista de feriados
Petição 870190055890, de 17/06/2019, pág. 99/130
2 Em quais dias temos um feriado?
[056] Em uma implementação exemplificativa, suponha que uma consulta de usuário seja “Posso solicitar licença médica antecipadamente?” e os conjuntos semanticamente semelhantes de consultas compreendem “É possível aplicar licença médica antecipadamente?” ou “Eu tenho uma consulta médica amanhã, posso aplicar a licença médica antecipadamente?” A intenção provável do usuário ao implementar o Modelo de Intenção Simples pode ser prevista como “licenças por doença” ou “feriado (s)” e o conjunto de respostas correspondentes aos conjuntos semanticamente semelhantes de consultas pode ser gerado como “Por favor, aplique licença por doença em estágio avançado” ou “Por favor, aplique licença (s) por doença em caso de consulta médica”.
[057] Modelo de Intenção Avançada
A divulgação proposta fornece a técnica de Identificação de Intenção de Alto Nível ao determinar o número de intenções a ser alto e muitas palavras são comuns entre uma ou mais consultas em linguagem natural de dois IDs diferentes, por exemplo, “se eu tirar uma licença na próxima sexta e segunda-feira, o final de semana também será contado? ” [058] O modelo de intenção avançada baseia-se em uma memória bidirecional de curto prazo (BiLSTM), que é uma variante de uma rede neural recorrente. Em uma forma de concretização, cada ID de intenção é assumido como uma classe no problema de classificação de múltiplas classes, isto é:
s = argmax P (Si |x)
Si E D [059] De acordo com uma forma de concretização da presente divulgação, cada consulta em linguagem natural pode inicialmente ser representada como uma sequência de incorporação de palavras. A seqüência de incorporação de palavras pode ser obtida usando uma técnica word2vec que representa cada palavra no texto como um vetor para facilitar o processamento por algoritmo (s). Uma sequência de vetores de palavras pode então ser alimentada em uma camada do BiLSTM para obter a representação da consulta em linguagem natural representada como a sequência de incorporação de palavras.
[060] A cada etapa (isto é, a palavra correspondente à expressão do usuário), uma incorporação de palavras pode ser alimentada como uma entrada na Memória de Longo e Curto Prazo (LSTM). Devido à arquitetura bidirecional, a
Petição 870190055890, de 17/06/2019, pág. 100/130 sequência é fornecida como entrada na ordem direta e inversa, o que resulta na retenção do contexto de ambas as direções em cada palavra. Como resultado, estados ocultos podem ser obtidos a partir de uma camada do BiLSTM, que é posteriormente alimentada como uma entrada para a camada maxpool, em que a camada maxpool atua como uma camada de supervisão sobre os estados ocultos.
[061] A camada maxpool extrai recursos semanticamente significativos dos estados ocultos em todas as dimensões. A saída da camada maxpool é retida como incorporação de sentença. Finalmente, a incorporação de sentenças pode ser classificada usando um classificador softmax para obter os IDs de intenção correspondentes. Em uma implementação exemplificativa, com relação à figura 5, uma arquitetura de aprendizagem profunda baseada no BiLSTM, a Divergência Kullback Leibler (SQRD LKD) do maxpool e da raiz quadrada pode ser referida. Não obstante, o modelo de intenção avançado possa determinar intenções para um domínio limitado de consultas, ou seja, somente para dados nos quais eles são treinados. No entanto, o modelo de intenção avançada também pode oferecer suporte a outro domínio de consultas, ou seja, consultas não treinadas.
[062] Em um exemplo de implementação da etapa 204 (i), suponha que uma ou mais consultas em linguagem natural entre o conjunto de consultas em linguagem natural de um ou mais usuários compreendam “se eu tirar uma licença na próxima sexta-feira e segunda-feira, será que o fim de semana também será contado? ”e“ será que os dias sem licença serão contados, se eu tirar uma licença médica entre eles?” Ao implementar a técnica de Identificação de Intenção de Alto Nível, o agente conversacional multiuso pode ser identificado como o Agente de Licença 309, em que o Agente de Licença 309 corresponde à estrutura IAD 308.
[063] Da mesma forma, suponha que uma ou mais consultas em linguagem natural incluam “Mostre-me artigos de aprendizagem profunda em robótica na nuvem”. Ao implementar a técnica de Identificação de Intenção de Alto Nível, o agente conversacional multiuso pode ser identificado como o Agente 315 do KGQA, em que o Agente 315 do KGQA corresponde à estrutura QUE 314.
[064] Em uma implementação exemplificativa da etapa 204 (ii), suponha que uma ou mais consultas em linguagem natural entre o conjunto de consultas em linguagem natural de um ou mais usuários compreendam “o que seria o meu prêmio anual de seguro de saúde?” Ao implementar o Modelo de Intenção de Avanço, as intenções prováveis do usuário que podem ser previstas compreendem uma categoria de questões semanticamente semelhantes, por exemplo, “qual seria
Petição 870190055890, de 17/06/2019, pág. 101/130 o valor do prêmio de seguro de saúde” e “qual seria meu prêmio de seguro?”.
[065] De acordo com uma forma de concretização da presente divulgação, na etapa 205, um ou mais processadores de hardware 104 executam, com base na intenção de usuário provável prevista e no agente conversacional multiuso identificado, qualquer uma das etapas 205 (i) ou 205 ( ii).
[066] Em uma forma de concretização, suponha que para uma ou mais consultas em linguagem natural “se eu tirar uma licença na próxima sexta-feira e segunda-feira, o final de semana também será contado?” As intenções prováveis de usuário previstas compreendem a categoria das perguntas semanticamente similares, por exemplo, o fim de semana também é contado se eu tirar uma folga na sexta-feira e segunda-feira e Se eu pretender tirar uma licença na sexta-feira e segunda-feira, o fim de semana também será incluído?”. O agente conversacional multiuso é identificado como o Agente de Licença 309, em que o Agente de Licença 309 corresponde à estrutura IAD 308. O um ou mais processadores de hardware 104 podem selecionar um ou mais conjuntos predefinidos de respostas entre uma pluralidade de conjuntos de respostas predefinidos ou engajar um usuário para extrair informação detalhada ou chamar APIs externas para comunicar a informação detalhada para um ou mais serviços externos 318 ao determinar o agente conversacional multiuso identificado como correspondendo à estrutura IAD 308, em que o conjunto predefinido de respostas e a informação detalhada correspondem ao conjunto de consultas em linguagem natural.
[067] Em uma forma de concretização, suponha que uma ou mais consultas em linguagem natural incluam “posso aplicar licença por doença antecipadamente”, um ou mais processadores de hardware 104 podem selecionar o conjunto de respostas predefinido como “Sim” e / ou “licenças por doença podem ser aplicadas com antecedência ”. No entanto, se um ou mais usuários fizerem uma consulta se eu tirar uma licença na próxima sexta-feira e segunda-feira, o fim de semana também será contado? e com base nas intenções prováveis previstas do usuário pelos modelos de identificação de intenção descritos acima, as outras perguntas serão identificadas como o fim de semana também é contado se eu tirar uma folga na sexta-feira e segunda-feira e Se eu conseguir uma licença na sextafeira e segunda-feira, o fim de semana também será incluído?”. Tal situação pode exigir informações mais aprofundadas.
[068] Em uma forma de concretização, um início de diálogo pode ser necessário quando uma intenção necessita de informação adicional para selecionar uma resposta apropriada. Suponha que uma ou mais consultas em linguagem natural
Petição 870190055890, de 17/06/2019, pág. 102/130 incluam “licença casual por dois dias”. Em um cenário, tipo de licença, data de início e data de término da licença podem ser necessários. No entanto, um ou mais usuários podem fazer mais perguntas referentes a uma ou mais consultas em linguagem natural diferentes do contexto acima. Em tal cenário, um ou mais processadores de hardware 104 encaminham o controle para o DSM 302, e o DSM 302 toma a decisão de encaminhar uma ou mais consultas em linguagem natural para um agente apropriado (entre um ou mais agentes conversacionais multiuso) e deixar um ou mais usuários continuarem o diálogo ou a conversa.
[069] Com relação à figura 6, pode haver uma Automação de Estado Finito (FSA). Dependendo do estado atual do diálogo, um ou mais usuários podem receber mais informações até que todas as informações relevantes tenham sido obtidas para facilitar a geração de resposta (s) por um ou mais agentes conversacionais multiuso. Se houver necessidade de obter informação para responder a uma ou mais consultas em linguagem natural de um ou mais serviços externos 318, as APIs externas podem ser chamadas para comunicar as informações detalhadas para um ou mais serviços externos.
[070] Com relação à figura 7, pode-se observar que a divulgação proposta fornece um portal de console de autoatendimento em formato de planilha para especificar o FSA para qualquer diálogo exigido na estrutura IAD 308. Em uma coluna Condição (não mostrada na figura), uma condição de qualificação para um estado da FSA pode ser especificada. Da mesma forma, na Próxima resposta (não mostrada na figura), a próxima pergunta a ser feita a um ou mais usuários pode ser especificada. Da mesma forma, em uma coluna de extratores, as APIs de extrator de informações apropriadas, ou seja, IEAPIs, podem ser especificadas. As APIs do IE são usadas para extrair informações apropriadas das respostas obtidas de um ou mais usuários, como Tipo de licença = licença casual de Quero solicitar uma licença casual. Em uma forma de concretização, todas as APIs do IE facilitam a extração de dois tipos extras de informações Ajuda e Nova Consulta.' A estrutura IAD 308 fornece uma biblioteca de extratores de informações, como Extrator de Dados, Extrator de Número, Extrator de Padrão(com base na lista especificada de nomes de entidades), etc. Os extratores customizados também podem ser gravados para outros requisitos onde os acima não são suficientes.
[071] De acordo com uma forma de concretização da presente divulgação, se uma ou mais consultas em linguagem natural compreenderem “Mostre-me artigos de aprendizagem profunda em robótica na nuvem”, “Quantas pessoas trabalham na empresa X em aprendizagem profunda aplicada à genômica (Deep
Petição 870190055890, de 17/06/2019, pág. 103/130
Genomics)” e “Nosso trabalho foi aceito em KDD”. A intenção do usuário provável prevista é a seguinte: Mostre-me artigos de aprendizagem profunda em robótica em nuvem” corresponde a uma questão factual, “Quantas pessoas estão trabalhando na empresa X em aprendizagem profunda aplicada à genômica (Deep Genomics)” corresponde a uma pergunta agregada e “Nosso trabalho foi aceito em KDD” corresponde à atualização de um ou mais mais gráficos de conhecimento 322. Além disso, o agente conversacional multiuso identificado corresponde à estrutura QUE 314, um ou mais processadores de hardware104 classificam a consulta para identificar uma ou mais categorias conversacionais implementando uma técnica de rede neural recorrente. Como discutido acima, o conjunto de consultas em linguagem natural chega à estrutura QUE 314 através do Componente de Identificação de Intenção de Múltiplos Níveis 303 do DSM 302.
[072] A estrutura QUE 314 classifica a consulta com base na (s) enunciação (ões), ou seja, se ela é a Conversa Dirigida pelo Usuário (UDC) para atualizar um ou mais gráficos de conhecimento 322 ou é uma questão agregada, por exemplo: “Quantas pessoas estão trabalhando na empresa X em aprendizagem profunda aplicada à genômica ”ou se é uma solicitação de recuperação de factóide ou uma questão factóide de um ou mais gráficos de conhecimento 322, por exemplo,“ uma organização X tem algum recurso reutilizável de análise avançada de dados de sensor ”ou “Mostre-me artigos de aprendizagem profunda em robótica na nuvem”. Em uma forma de concretização, a classificação pode ser realizada implementando a classificação BiLSTM discutida acima pela implementação de um Identificador de Intenção Consulta-Atualização-Engajamento (QUE) 801. Com relação à figura 8, arquitetura do Identificador de Intenção QUE 801 pode ser referida.
[073] Como discutido acima, um ou mais processadores de hardware 104 classificam a consulta para identificar uma ou mais categorias conversacionais implementando a técnica de rede neural recorrente ao determinar o agente conversacional multiuso identificado para ser correspondente à estrutura QUE 314. Com base na consulta classificada, um ou mais processadores de hardware 104 executam qualquer uma doas etapas 205 (iii) (a) ou 205 (iii) (b)b) . Isso pode agora ser considerado em detalhes.
[074] Com base na consulta classificada, um ou mais processadores de hardware 104 consultam um ou mais gráficos de conhecimento 322 para gerar um primeiro conjunto de respostas correspondendo ao conjunto de consultas em linguagem natural. A etapa de gerar o primeiro conjunto de respostas compreende
Petição 870190055890, de 17/06/2019, pág. 104/130 o mapeamento de uma ou mais entidades correspondentes a um ou mais gráficos de conhecimento 322 com uma ou mais frases correspondentes ao conjunto classificado de consultas em linguagem natural por uma técnica de pesquisa baseada em índice invertido e atravessamento, com base no mapeamento, de um ou mais gráficos de conhecimento 322 para gerar o primeiro conjunto de respostas. O processo de consulta e geração do primeiro conjunto de respostas pode agora ser discutido em detalhes.
[075] Em uma forma de concretização, para responder à questão do factóide, um ou mais processadores de hardware 104 mapeiam inicialmente uma ou mais entidades (por exemplo, a robótica da nuvem na consulta em linguagem natural mostre-me artigos de aprendizagem profunda em robótica da nuvem) correspondente à ou mais gráficos de conhecimento 322 com uma ou mais frases correspondentes ao conjunto classificado de consulta em linguagem natural pela implementação do Agente KGQA 315. Considerando um cenário exemplificativo, uma ou mais frases correspondentes ao conjunto classificado de consultas em linguagem natural “Mostre-me artigos de aprendizagem profunda em robótica na nuvem” e “Quantas pessoas estão trabalhando na empresa X em aprendizagem profunda aplicada à genômica (Deep Genomics)” podem ser “robótica em nuvem” e aprendizagem profunda aplicada à Genômica respectivamente. Isto é realizado através da implementação da técnica de pesquisa baseada em índice invertido.
[076] Utilizando a técnica de pesquisa baseada em índice invertido, um ou mais nós correspondentes a um ou mais gráficos de conhecimento 322 são identificados e tornam-se o ponto de partida do atravessamento de um ou mais gráficos de conhecimento. O Agente 315 do KGQA pode então executar um modelo de classificação baseado em Aprendizagem Profunda para determinar o que é um tipo de entidade de destino correspondente à consulta em linguagem natural classificada. Considerando um cenário exemplificativo, para as consultas classificadas em linguagem natural ““ Uma pesquisa da organização X tem algum recurso reutilizável de análise avançada de dados do sensor ”e“ Mostre-me artigos de aprendizagem profunda em robótica na nuvem ”o tipo de entidade de destino pode ser determinado como“ recurso reutilizável “ e publicações de pesquisa respectivamente. Isso é realizado treinando o modelo de classificação baseado em Aprendizagem Profunda para classificar cada consulta em um número de classes correspondente ao número de tipos de entidade de destino no (s) esquema (s) no Banco de Dados do Gráfico de Conhecimento. Em uma implementação exemplificativa, referindo-se à figura 9, podem ser referidos um ou mais gráficos
Petição 870190055890, de 17/06/2019, pág. 105/130 de conhecimento 322 compreendendo dados de amostra como “Grupo de Sistema de Análise de Dados”, “Central de Trabalho Social” e “Deep PNL” etc. e integrados com a arquitetura técnica (referida na figura 3).
[077] De acordo com uma forma de concretização da presente divulgação, no caso de um ou mais usuários não mencionarem o tipo de questão factóide que necessita de ser recuperada de um ou mais gráficos de conhecimento 322 (por exemplo, “o que estamos fazendo no área de gestão de energia? ”). Nesse caso, pode ser adicionada mais uma classe denominada “não-alvo” no classificador de tipo de entidade de destino. O tipo de entidade de destino torna-se então o ponto final do percurso do gráfico de conhecimento. Caso haja várias vias diferentes em um ou mais gráficos de conhecimento entre os nós iniciais e os nós dos tipos de entidade de destino, a via correta pode ser identificada usando outro modelo de classificação baseado em Aprendizagem Profunda, em que é identificado pelo menos um tipo de relacionamento, que deve estar presente em um ou mais gráficos de conhecimento 322 (não discutido através da divulgação proposta). Uma vez identificada a via, a resposta correspondente pode ser recuperada pelo atravessamento da via.
[078] De acordo com uma forma de concretização da presente divulgação, no caso da questão agregada, a mesma técnica utilizada no caso da questão factóide pode ser implementada, no entanto, em vez de exibir uma lista final de factóides, os factóides podem ser agregados antes da exibição. Em uma forma de concretização, um meta-esquema pode ser criado para o (s) esquema (s), em que o meta-esquema pode compreender dois tipos de entidades, uma entidade tangível (por exemplo, artigos de pesquisa, pesquisadores, recursos reutilizáveis, projetos de pesquisa etc. ) e uma entidade intangível (por exemplo, palavra-chave de tecnologia, palavra-chave de negócios, etc.). Em uma forma de concretização, quando nenhum alvo é dado, o Agente KGQA 315 pode retornar uma contagem de todos os tipos de entidade tangíveis relacionados aos nós iniciais dados na consulta em linguagem natural.
[079] Em uma implementação exemplificativa da etapa 205 (iii) (a), o primeiro conjunto de respostas pode ser gerado como “Existem n1 pesquisador, «1 ativo reutilizável, n3 publicações, n4 projetos de pesquisa em gerenciamento de energia”.
[080] De acordo com uma forma de concretização da presente divulgação, na etapa 205 (iii) (b), após a determinação do agente conversacional multiuso identificado como correspondendo à estrutura QUE 314, um ou mais
Petição 870190055890, de 17/06/2019, pág. 106/130 processadores de hardware 104 atualizam, com base na consulta classificada, uma ou mais consultas de gráficos de conhecimento 322 pela implementação do Agente KGU-NL 316 para gerar um segundo conjunto de respostas correspondentes ao conjunto de consultas em linguagem natural. Um ou mais gráficos de conhecimento 322 são atualizados pelo Agente de Atualização de Gráficos de Conhecimento 321 com base em um conjunto de informações obtidas de um ou mais usuários pelo Agente de Engajamento do Gráfico de Conhecimento 317 e em que o conjunto de informação corresponde ao processamento de consultas em linguagem natural. Além disso, o conjunto de informação é obtido de um ou mais usuários ou por um engajamento de usuário pró-ativo ou por uma análise de informação correspondente a um ou mais gráficos de conhecimento (322) pelo Agente de Engajamento de Gráfico de Conhecimento (317).
[081] Em uma forma de concretização, para atualizar um ou mais gráficos de conhecimento322, a pluralidade de Agentes Auxiliares 319 expõe uma ou mais APIs. O Agente KGU-NL 316 interage com a pluralidade de robôs Auxiliares através da estrutura IAD 308 (como discutido acima). O Identificador de Intenção QUE 801 comunica a (s) declaração (ões) do usuário (por exemplo, “Nosso artigo foi aceito no KDD”) para o Agente KGU-NL 316. Ao receber o (s) enunciado(s) do usuário, o Agente KGU-NL 316 inicia um diálogo com um ou mais usuários para obter mais informações, por exemplo “qual é o título do artigo” e “em qual projeto você escreveu este artigo Assim, a informação detalhada correspondente ao conjunto de consultas em linguagem natural pode ser extraída pelo Agente KGUNL 316.
[082] Em uma forma de concretização, uma interface baseada em comando de atualização de gráfico de conhecimento executa o conjunto de comandos, por exemplo, “x pik KNADIA”, que então exibe uma lista de valores literais associados ao KNADIA (um ativo reutilizável). Da mesma forma, um ou mais usuários podem executar o conjunto de comandos, por exemplo, plataforma x mod 3 para construir agentes conversacionais para atualizar um ou mais gráficos de conhecimento 322.
[083] Em uma implementação exemplificativa da etapa 205 (iii) (b), o segundo conjunto de respostas pode ser gerado como “artigo de Pesquisa X publicado no projeto XYZ atualizado com a aplicação robótica”.
[084] De acordo com uma forma de concretização da presente divulgação, algumas das vantagens técnicas da divulgação proposta podem ser consideradas em detalhe. Em comparação com os sistemas e métodos tradicionais, que usam uma resposta de voz interativa para responder às consultas em linguagem natural, a
Petição 870190055890, de 17/06/2019, pág. 107/130 divulgação proposta fornece uma técnica de Identificação de Intenção de Alto Nível para identificar um agente conversacional multiuso (discutido acima). Além disso, a divulgação proposta prevê a manutenção da consistência, exatidão e autenticidade do conjunto de informações / dados em um ou mais gráficos de conhecimento 322 usando o Agente de Engajamento do Gráfico de Conhecimento 317. Ao atualizar um ou mais gráficos de conhecimento 322, os dados carregados em um ou mais gráficos de conhecimento 322 podem incluir inconsistências ou algumas informações relevantes podem estar faltando, por exemplo, informações sobre um artigo podem estar disponíveis sem uma associação adequada a um projeto em uma organização. A divulgação proposta facilita a obtenção de uma lista de informações faltantes em um ou mais gráficos de conhecimento 322 em relação a um esquema.
[085] Em uma forma de concretização, com base na lista de informações faltantes, um ou mais processadores de hardware 104 geram uma ou mais perguntas em linguagem natural a partir de um conjunto de modelos de acordo com uma entidade e as propriedades ausentes correspondentes. Além disso, a informação/ dados em um ou mais gráficos de conhecimento 322 precisam ser autênticos e devem ser atualizados apenas por usuários autorizados. Por exemplo, uma pergunta sobre um projeto deve ser respondida apenas por um líder de projeto. A entidade de destino, ou seja, o nome de usuário de destino pode ser difícil de ser determinado se o usuário alvo estiver ausente em um ou mais gráficos de conhecimento 322 ou se não houver um líder de projeto. Nesse caso, alguns outros usuários autorizados devem responder a essa pergunta. A divulgação proposta facilita a anotação de cada entidade e propriedade no (s) esquema (s) de um ou mais gráficos de conhecimento.
[086] Em uma forma de concretização, ao obter uma lista de perguntas e usuários de destino para respondê-las, o Agente de Engajamento do Gráfico de Conhecimento 317 engaja um ou mais usuários e faz perguntas em um momento apropriado durante a conversa. Por exemplo, pode-se perguntar a um ou mais usuários Estou ciente de seu artigo recente no KDD, para qual projeto foi feito esse trabalho. Assim, a conversa é uma conversa em tempo real, já que um ou mais usuários podem, a qualquer momento, ignorar a (s) pergunta (s) e fazer outra pergunta, por exemplo: “alguém está trabalhando em aprendizagem profunda em uma organização X?” A pergunta feita por um ou mais usuários é respondida primeiramente. A divulgação proposta também facilita fazer um palpite sobre quem pode responder ao conjunto de consultas em linguagem natural usando a técnica word2vec, caso nenhuma informação esteja disponível em um ou mais gráficos de conhecimento. Uma vez que o palpite seja feito, um ou mais gráficos de
Petição 870190055890, de 17/06/2019, pág. 108/130 conhecimento 322 podem ser atualizados e a (s) resposta (s) adequada (s) de um ou mais gráficos de conhecimento 322 baseados na atualização podem ser comunicados a um ou mais usuários. Desse modo, a síntese do conhecimento é alcançada.
[087] A metodologia proposta prevê uma arquitetura de servidores com hospedagem múltipla, ou seja, as mesmas instâncias da arquitetura (providas na figura 3)pode ser usado para múltiplas personas digitais diferentes em paralelo, referidas como inquilinos. Além disso, todos os agentes conversacionais multiuso verificam ids -inquilino ao receber as consultas em linguagem natural e, em seguida, fazem o carregamento de modelos de aprendizagem de máquina / aprendizagem profunda apropriados para processar as consultas em linguagem natural. O cache de memória também pode ser limpo de uma forma round robin, mantendo assim os modelos usados mais recentemente para eficiência. A divulgação proposta também facilita a criação de novos agentes conversacionais multiuso com base em um ou mais conjuntos de dados de treinamento.
[088] Em uma forma de concretização, a memória 102 pode ser configurada para armazenar quaisquer dados que estejam associados a técnicas conversacionais multiuso com técnicas de Aprendizagem Profunda para processamento de consultas em linguagem natural. Em uma forma de concretização, as informações pertencentes à pluralidade de componentes definidos e logicamente integrados, o conjunto de consultas em linguagem natural recebidas, o agente conversacional multiuso identificado, a intenção de usuário provável prevista, a classificação da consulta e o primeiro conjunto de respostas geradas e o segundo conjunto de respostas geradas etc. são armazenados na memória 102. Além disso, todas as informações (entradas, saídas e assim por diante) referentes a técnicas de Aprendizagem Profunda baseadas em agentes conversacionais para o processamento de consultas em linguagem natural também podem ser armazenadas no banco de dados, como dados históricos, para fins de referência.
[089] A descrição escrita descreve o assunto aqui mencionado para qualquer versado na técnica fazer e usar as formas de concretização. O escopo das formas de concretização da matéria-objeto é definido pelas reivindicações e pode incluir outras modificações que ocorram aos versados na técnica. Pretende-se que tais outras modificações estejam dentro do escopo das reivindicações se elas tiverem elementos similares que não diferem da linguagem literal das reivindicações ou se incluírem elementos equivalentes com diferenças não substanciais da linguagem literal das reivindicações.
Petição 870190055890, de 17/06/2019, pág. 109/130 [090] Naturalmente que o âmbito da proteção é estendido para um tal programa e para além de um meio legível por computador com uma mensagem nele; tais meios de armazenamento legíveis por computador contêm meios de código de programa para implementação de uma ou mais etapas do método, quando o programa é executado em um servidor ou dispositivo móvel ou qualquer dispositivo programável adequado. O dispositivo de hardware pode ser qualquer tipo de dispositivo que pode ser programado incluindo, por exemplo, qualquer tipo de computador como um servidor ou um computador pessoal, ou algo semelhante, ou qualquer combinação deles. O dispositivo pode também incluir meios que podem ser, por exemplo meios de hardware como, por exemplo um circuito integrado específico de aplicação (ASIC), um arranjo de portas programáveis em campo (FPGA) ou uma combinação de meios de hardware e software, por exemplo um ASIC e um FPGA, ou pelo menos um microprocessador e pelo menos uma memória com módulos de software nela localizados. Assim, os meios podem incluir meios de hardware e meios de software. As formas de concretização do método aqui descritas podem ser implementadas em hardware e software. O dispositivo também pode incluir meios de software. Alternativamente, as formas de concretização podem ser implementadas em diferentes dispositivos de hardware, por exemplo usando uma pluralidade de CPUs.
[091] As formas de concretização aqui descritas podem incluir elementos de hardware e software. As formas de concretização que são implementadas em software incluem, mas não estão limitadas a, firmware, software residente, microcódigo, etc. As funções executadas por vários módulos aqui descritos podem ser implementadas em outros módulos ou combinações de outros módulos. Para os fins desta descrição, um meio utilizável por computador ou legível por computador pode ser qualquer aparelho que possa compreender, armazenar, comunicar, propagar ou transportar o programa para uso por ou em conexão com o sistema, aparelho ou dispositivo de execução de instruções.
[092] As etapas ilustradas são estabelecidas para explicar as formas de concretização exemplificativas mostradas, e deve ser antecipado que o desenvolvimento tecnológico em curso irá mudar a maneira pela qual funções particulares são desempenhadas. Estes exemplos são apresentados aqui para fins de ilustração e não de limitação. Além disso, os limites dos blocos de construção funcionais foram arbitrariamente definidos aqui para a conveniência da descrição. Limites alternativos podem ser definidos desde que as funções e relações especificadas sejam apropriadamente executadas. Alternativas (incluindo Petição 870190055890, de 17/06/2019, pág. 110/130 equivalentes, extensões, variações, desvios, etc., daquelas aqui descritas) serão evidentes para os versados na técnica relevante com base nos ensinamentos aqui contidos. Tais alternativas se enquadram dentro do escopo e espírito das formas de concretização divulgadas. Além disso, as palavras “compreendendo”, “tendo”, “contendo” e “incluindo”, e outras formas similares, são concebidas para serem equivalentes em significado e serem abertas terminando em um item ou itens, depois de qualquer uma dessas palavras não implica em ser uma lista exaustiva de tal item ou itens, ou se destina a ser limitada a apenas o item listado ou itens ou itens listados. Também deve ser notado que, como usado aqui e nas reivindicações anexas, as formas singulares “um”, “uma” e “o/a” incluem referências plurais, a menos que o contexto dite claramente o contrário.
[093] Além disso, um ou mais meios de armazenamento legíveis por computador podem ser utilizados na implementação de formas de concretização consistentes com a presente divulgação. Um meio de armazenamento legível por computador refere-se a qualquer tipo de memória física na qual informações ou dados legíveis por um processador podem ser armazenados. Assim, um meio de armazenamento legível por computador pode armazenar instruções para execução por um ou mais processadores, incluindo instruções para fazer com que o (s) processador (es) executem etapas ou estágios consistentes com as formas de concretização descritas aqui. O termo “meio legível por computador” deve ser entendido como incluindo itens tangíveis e excluindo ondas portadoras e sinais transientes, ou seja, não transitórios. Os exemplos incluem memória de acesso aleatório (RAM), memória somente leitura (ROM), memória volátil, memória não volátil, discos rígidos, CD-ROMs, DVDs, pen drives, discos e qualquer outra mídia de armazenamento física conhecida.
[094]Pretende-se que a divulgação e os exemplos sejam considerados apenas exemplificativos, com um âmbito e espírito verdadeiros das formas de concretização descritas, sendo indicado pelas reivindicações seguintes.
Petição 870190055890, de 17/06/2019, pág. 111/130

Claims (15)

REIVINDICAÇÕES:
1. Método de técnicas de aprendizagem profunda baseadas em agentes conversacionais multiuso para o processamento de consultas em linguagem natural, caracterizado pelo fato de que dito método compreender as seguintes etapas implementadas por processador de:
definição, por um ou mais processadores de hardware, de uma pluralidade de componentes compreendendo um Gerenciador de Estado de Diálogo (DSM), um Componente de Identificação de Intenção de Múltiplos Níveis, um Gerenciador de Agentes, uma pluralidade de Agentes Primários, uma estrutura de Diálogo Ação-intenção (IAD) , uma estrutura Consulta-Atualização-Engajamento (QUE), um Agente de Linguagem Natural- Atualização de Gráfico de Conhecimento (KGU-NL), um Agente de Engajamento de Gráfico de Conhecimento, uma pluralidade de Auxiliares e um Agente de Atualização de Gráfico de Conhecimento, onde cada componente entre a pluralidade de componentes compreende um ou mais agentes conversacionais multiuso (201);
Integração logística, com base em um conjunto de consultas antecipadas de usuários de linguagem natural, da pluralidade de componentes por uma ou mais interfaces de programação de aplicativos (APIs) (202);
recepção, pela pluralidade de componentes logicamente integrados, de um conjunto de consultas em linguagem natural de uma pluralidade de fontes (203);
execução, com base no conjunto de consultas em linguagem natural, de uma pluralidade de etapas, em que a pluralidade de etapas compreende (204):
(i) Identificação de pelo menos um agente conversacional multiuso entre um ou mais agentes conversacionais multiuso usando o DSM, em que o agente conversacional multiuso identificado corresponde à Estrutura IAD ou à Estrutura QUE (204 (i));
(ii) Previsão, pelo uso de uma ou mais técnicas de Aprendizagem Profunda, de uma intenção de usuário provável em comparação com uma
Petição 870190055451, de 14/06/2019, pág. 45/62
1/6
REIVINDICAÇÕES
1. Método de técnicas de aprendizagem profunda baseadas em agentes conversacionais multiuso para o processamento de consultas em linguagem natural, o método compreendendo as seguintes etapas implementadas por processador de:
definição, por um ou mais processadores de hardware, de uma pluralidade de componentes compreendendo um Gerenciador de Estado de Diálogo (DSM), um Componente de Identificação de Intenção de Múltiplos Níveis, um Gerenciador de Agentes, uma pluralidade de Agentes Primários, uma estrutura de Diálogo Açãointenção (IAD) , uma estrutura Consulta-Atualização-Engajamento (QUE), um Agente de Linguagem Natural- Atualização de Gráfico de Conhecimento (KGUNL), um Agente de Engajamento de Gráfico de Conhecimento, uma pluralidade de Auxiliares e um Agente de Atualização de Gráfico de Conhecimento, onde cada componente entre a pluralidade de componentes compreende um ou mais agentes conversacionais multiuso (201);
Integração logística, com base em um conjunto de consultas antecipadas de usuários de linguagem natural, da pluralidade de componentes por uma ou mais interfaces de programação de aplicativos (APIs) (202);
recepção, pela pluralidade de componentes logicamente integrados, de um conjunto de consultas em linguagem natural de uma pluralidade de fontes (203);
execução, com base no conjunto de consultas em linguagem natural, de uma pluralidade de etapas, em que a pluralidade de etapas compreende (204):
(i) Identificação de pelo menos um agente conversacional multiuso entre um ou mais agentes conversacionais multiuso usando o DSM, em que o agente conversacional multiuso identificado corresponde à Estrutura IAD ou à Estrutura QUE (204 (i));
(ii) Previsão, pelo uso de uma ou mais técnicas de Aprendizagem Profunda, de uma intenção de usuário provável em comparação com uma consulta de usuário entre o conjunto de consultas em linguagem natural não classificadas (204) (ii);
Petição 870190055890, de 17/06/2019, pág. 112/130 execução, com base na intenção de usuário prevista e no agente de conversação multiuso identificado, de um de (205):
(i) Seleção de um ou mais conjuntos predefinidos de respostas entre uma pluralidade de conjuntos pré-definidos de respostas ou engajamento de um usuário para extrair informação detalhada ou chamada de APIs externas para comunicar a informação detalhada a um ou mais serviços externos após determinar o agente conversacional multi-uso identificado para ser correspondente à estrutura IAD, em que um ou mais conjuntos predefinidos de respostas e a informação detalhada correspondem ao conjunto de consultas em linguagem natural (205 (i)); ou (ii) Classificação de uma consulta entre o conjunto de consultas em linguagem natural para identificar uma ou mais categorias de conversas pela implementação de uma técnica de rede neural recorrente após determinação do agente conversacional multi-uso identificado para ser correspondente à Estrutura QUE (205 (ii));
(iii) execução, com base na consulta classificada, de :
(a) consulta de um ou mais gráficos de conhecimento para gerar um primeiro conjunto de respostas correspondentes ao conjunto de consultas em linguagem natural (205 (iii) (a));
(b) atualização, pelo Agente KGU-NL, de um ou mais gráficos de conhecimento para gerar um segundo conjunto de respostas correspondentes ao conjunto de consultas em linguagem natural (205 (iii) (b).
2. Método de acordo com a reivindicação 1, caraterizado pelo fato de que a integração lógica compreende a definição hierárquica, com base no conjunto de consultas antecipadas de usuário de linguagem natural, da pluralidade de componentes e de um ou mais agentes conversacionais multiuso para processar as consultas em linguagem natural.
2/6 consulta de usuário entre o conjunto de consultas em linguagem natural não classificadas (204) (ii);
execução, com base na intenção de usuário prevista e no agente de conversação multiuso identificado, de um de (205):
(i) Seleção de um ou mais conjuntos predefinidos de respostas entre uma pluralidade de conjuntos pré-definidos de respostas ou engajamento de um usuário para extrair informação detalhada ou chamada de APIs externas para comunicar a informação detalhada a um ou mais serviços externos após determinar o agente conversacional multi-uso identificado para ser correspondente à estrutura IAD, em que um ou mais conjuntos predefinidos de respostas e a informação detalhada correspondem ao conjunto de consultas em linguagem natural (205 (i)); ou (ii) Classificação de uma consulta entre o conjunto de consultas em linguagem natural para identificar uma ou mais categorias de conversas pela implementação de uma técnica de rede neural recorrente após determinação do agente conversacional multi-uso identificado para ser correspondente à Estrutura QUE (205 (ii));
(iii) execução, com base na consulta classificada, de :
(a) consulta de um ou mais gráficos de conhecimento para gerar um primeiro conjunto de respostas correspondentes ao conjunto de consultas em linguagem natural (205 (iii) (a));
(b) atualização, pelo Agente KGU-NL, de um ou mais gráficos de conhecimento para gerar um segundo conjunto de respostas correspondentes ao conjunto de consultas em linguagem natural (205 (iii) (b).
2. Método de acordo com a reivindicação 1, em que a integração lógica compreende a definição hierárquica, com base no conjunto de consultas antecipadas de usuário de linguagem natural, da pluralidade de componentes e de um ou mais agentes conversacionais multiuso para processar as consultas em linguagem natural.
3/6 ou mais usuários a fim de facilitar o processamento de consultas em linguagem natural.
3. Método de acordo com a reivindicação 2, caracterizado pelo fato de que a pluralidade definida de componentes compreende ainda um mecanismo de auto-sugestão para auto-gerar, com base em um ou mais conjuntos de dados de treinamento, uma pluralidade de questões recomendadas para um
Petição 870190055451, de 14/06/2019, pág. 46/62
3. Método de acordo com a reivindicação 2, em que a pluralidade definida de componentes compreende ainda um mecanismo de auto-sugestão para auto-gerar, com base em um ou mais conjuntos de dados de treinamento, uma pluralidade de questões recomendadas para um ou mais usuários a fim de facilitar o processamento de consultas em linguagem natural.
4/6
4. Método de acordo com a reivindicação 3, caracterizado pelo fato de que um ou mais conjuntos de dados de treinamento compreendem um conjunto de conjuntos de consultas semanticamente similares e um conjunto de respostas correspondentes aos conjuntos de consultas semanticamente similares.
4. Método de acordo com a reivindicação 3, em que um ou mais conjuntos de dados de treinamento compreendem um conjunto de conjuntos de consultas
Petição 870190055890, de 17/06/2019, pág. 113/130 semanticamente similares e um conjunto de respostas correspondentes aos conjuntos de consultas semanticamente similares.
5/6 (ii) previsão, usando uma ou mais técnicas de Aprendizagem Profunda, de uma intenção de usuário provável em comparação com uma consulta de usuário entre o conjunto de consultas em linguagem natural não classificada;
execução, com base na intenção de usuário prevista e no agente de conversação multiuso identificado, um de:
(i) seleção de um ou mais conjuntos predefinidos de respostas entre uma pluralidade de conjuntos pré-definidos de respostas ou engajamento de um usuário para extrair informação detalhada ou chamada de APIs externas para comunicar a informação detalhada a um ou mais serviços externos (318) depois de determinar o agente conversacional multiuso identificado corresponde à Estrutura IAD (308), em que um ou mais conjuntos de respostas predefinidos e a informação detalhada correspondem ao conjunto de consultas em linguagem natural; ou (ii) classificação de uma consulta entre o conjunto de consultas em linguagem natural para identificar uma ou mais categorias de conversas pela implementação de uma técnica de rede neural recorrente após determinação do agente conversacional multi-uso identificado para ser correspondente à Estrutura QUE (314); e (iii) execução, com base na consulta classificada, de um de:
(a) consulta de um ou mais gráficos de conhecimento (322) para gerar um primeiro conjunto de respostas correspondentes ao conjunto de consultas em linguagem natural;ou (b) atualização, pelo Agente KGU-NL (316), de um ou mais gráficos de conhecimento (322) para gerar um segundo conjunto de respostas correspondentes ao conjunto de consultas em linguagem natural.
5. Método de acordo com a reivindicação 1, caracterizado pelo fato de que um ou mais gráficos de conhecimento são atualizados pelo Agente de Atualização do Gráfico de Conhecimento com base em um conjunto de informação obtido de um ou mais usuários pelo Agente de Engajamento de Gráfico de Conhecimento e em que o conjunto de informação corresponde ao processamento de consultas em linguagem natural.
5. Método de acordo com a reivindicação 1, em que um ou mais gráficos de conhecimento são atualizados pelo Agente de Atualização do Gráfico de Conhecimento com base em um conjunto de informação obtido de um ou mais usuários pelo Agente de Engajamento de Gráfico de Conhecimento e em que o conjunto de informação corresponde ao processamento de consultas em linguagem natural.
6/6 um mecanismo de auto-sugestão (305) para auto-gerar, com base em um ou mais conjuntos de dados de treinamento, uma pluralidade de questões recomendadas para um ou mais usuários a fim de facilitar o processamento de consultas em linguagem natural.
6. Método de acordo com a reivindicação 5, caracterizado pelo fato de que o conjunto de informação é obtido de um ou mais usuários ou por um engajamento de usuário pró-ativo ou por uma análise de informação correspondente a um ou mais gráficos de conhecimento pelo Agente de Engajamento de Gráfico de Conhecimento..
6. Método de acordo com a reivindicação 5, em que o conjunto de informação é obtido de um ou mais usuários ou por um engajamento de usuário pró-ativo ou por uma análise de informação correspondente a um ou mais gráficos de conhecimento pelo Agente de Engajamento de Gráfico de Conhecimento.
7. Método de acordo com a reivindicação 1, caraterizado pelo fato de que a etapa de geração do primeiro conjunto de respostas compreende:
(i) mapeamento de uma ou mais entidades correspondentes a um ou mais gráficos de conhecimento com uma ou mais frases correspondentes à consulta classificada por uma técnica de pesquisa baseada em índice invertido; e (ii) atravessamento, com base no mapeamento, de um ou mais gráficos de conhecimento para gerar o primeiro conjunto de respostas.
7. Método de acordo com a reivindicação 1, em que a etapa de geração do primeiro conjunto de respostas compreende:
(i) mapeamento de uma ou mais entidades correspondentes a um ou mais gráficos de conhecimento com uma ou mais frases correspondentes à consulta classificada por uma técnica de pesquisa baseada em índice invertido; e (ii) atravessamento, com base no mapeamento, de um ou mais gráficos de conhecimento para gerar o primeiro conjunto de respostas.
8. Método de acordo com a reivindicação 1, caracterizado pelo fato de que o segundo conjunto de respostas é gerado ou por engajamento do usuário para extrair a informação detalhada correspondente ao conjunto de consultas em linguagem natural ou por execução de um conjunto de comandos por uma interface..
Petição 870190055451, de 14/06/2019, pág. 47/62
8. Método de acordo com a reivindicação 1, em que o segundo conjunto de respostas é gerado ou por engajamento do usuário para extrair a informação detalhada correspondente ao conjunto de consultas em linguagem natural ou por execução de um conjunto de comandos por uma interface.
9.Sistema (100) para técnicas de Aprendizagem Profunda baseado em agentes conversacionais multiuso para o processamento de consultas em linguagem natural, caracterizado pelo fato de que o sistema (100) compreende: uma memória (102) que armazena instruções;
uma ou mais interfaces de comunicação (106);
um ou mais processadores de hardware (104) acoplados à memória (102) através de uma ou mais interfaces de comunicação (106), em que um ou mais processadores de hardware (104) são configurados pelas instruções para:
definição de uma pluralidade de componentes compreendendo um Gerenciador de Estado de Diálogo (DSM) (302), um Componente de Identificação de Intenção de Múltiplos Níveis (303), um Gerenciador de Agentes (304), uma pluralidade de Agentes Primários (306), uma Estrutura de Diálogo Intenção-Ação (IAD) (308), uma estrutura de Engajamento de Atualização de Consulta (QUE) (314), um agente de Linguagem Natural de de Atualização de Gráfico de conhecimento (316), um Agente de Engajamento de Gráfico de Conhecimento (317), uma pluralidade de Agentes Auxiliares (319), e um Agente de Atualização de Gráfico de Conhecimento (321), em que cada componente entre a pluralidade de componentes compreende um ou mais agentes conversacionais multiuso.;
integração lógica, com base em um conjunto de consultas antecipadas de usuários de linguagem natural, da pluralidade de componentes por uma ou mais interfaces de programação de aplicativos (APIs);
recepção, pela pluralidade de componentes logicamente integrados, de um conjunto de consultas em linguagem natural de uma pluralidade de fontes;
execução, com base no conjunto de consultas em linguagem natural, de uma pluralidade de etapas, em que a pluralidade de etapas compreende:
(i) identificação de pelo menos um agente conversacional multiuso entre um ou mais agentes conversacionais multiuso utilizando o DSM (302), em que o agente conversacional multiuso identificado corresponde à Estrutura IAD (308) ou à Estrutura QUE (314);
Petição 870190055451, de 14/06/2019, pág. 48/62
9.Sistema (100) para técnicas de Aprendizagem Profunda baseado em agentes conversacionais multiuso para o processamento de consultas em linguagem natural, o sistema (100) compreendendo:
uma memória (102) que armazena instruções;
uma ou mais interfaces de comunicação (106);
Petição 870190055890, de 17/06/2019, pág. 114/130 um ou mais processadores de hardware (104) acoplados à memória (102) através de uma ou mais interfaces de comunicação (106), em que um ou mais processadores de hardware (104) são configurados pelas instruções para:
definição de uma pluralidade de componentes compreendendo um Gerenciador de Estado de Diálogo (DSM) (302), um Componente de Identificação de Intenção de Múltiplos Níveis (303), um Gerenciador de Agentes (304), uma pluralidade de Agentes Primários (306), uma Estrutura de Diálogo Intenção-Ação (IAD) (308), uma estrutura de Engajamento de Atualização de Consulta (QUE) (314), um agente de Linguagem Natural de de Atualização de Gráfico de conhecimento (316), um Agente de Engajamento de Gráfico de Conhecimento (317), uma pluralidade de Agentes Auxiliares (319), e um Agente de Atualização de Gráfico de Conhecimento (321), em que cada componente entre a pluralidade de componentes compreende um ou mais agentes conversacionais multiuso.;
integração lógica, com base em um conjunto de consultas antecipadas de usuários de linguagem natural, da pluralidade de componentes por uma ou mais interfaces de programação de aplicativos (APIs);
recepção, pela pluralidade de componentes logicamente integrados, de um conjunto de consultas em linguagem natural de uma pluralidade de fontes;
execução, com base no conjunto de consultas em linguagem natural, de uma pluralidade de etapas, em que a pluralidade de etapas compreende:
(i) identificação de pelo menos um agente conversacional multiuso entre um ou mais agentes conversacionais multiuso utilizando o DSM (302), em que o agente conversacional multiuso identificado corresponde à Estrutura IAD (308) ou à Estrutura QUE (314);
(ii) previsão, usando uma ou mais técnicas de Aprendizagem Profunda, de uma intenção de usuário provável em comparação com uma consulta de usuário entre o conjunto de consultas em linguagem natural não classificada;
execução, com base na intenção de usuário prevista e no agente de conversação multiuso identificado, um de:
(i) seleção de um ou mais conjuntos predefinidos de respostas entre uma pluralidade de conjuntos pré-definidos de respostas ou engajamento de um usuário
Petição 870190055890, de 17/06/2019, pág. 115/130 para extrair informação detalhada ou chamada de APIs externas para comunicar a informação detalhada a um ou mais serviços externos (318) depois de determinar o agente conversacional multiuso identificado corresponde à Estrutura IAD (308), em que um ou mais conjuntos de respostas predefinidos e a informação detalhada correspondem ao conjunto de consultas em linguagem natural; ou (ii) classificação de uma consulta entre o conjunto de consultas em linguagem natural para identificar uma ou mais categorias de conversas pela implementação de uma técnica de rede neural recorrente após determinação do agente conversacional multi-uso identificado para ser correspondente à Estrutura QUE (314); e (iii) execução, com base na consulta classificada, de um de:
(a) consulta de um ou mais gráficos de conhecimento (322) para gerar um primeiro conjunto de respostas correspondentes ao conjunto de consultas em linguagem natural;ou (b) atualização, pelo Agente KGU-NL (316), de um ou mais gráficos de conhecimento (322) para gerar um segundo conjunto de respostas correspondentes ao conjunto de consultas em linguagem natural.
10. Sistema (100) de acordo com a reivindicação 9, caraterizado pelo fato de que a integração lógica compreende a definição hierárquica, com base no conjunto de consultas antecipadas de usuário de linguagem natural, da pluralidade de componentes e de um ou mais agentes conversacionais multiuso para processar as consultas em linguagem natural..
10. Sistema (100) de acordo com a reivindicação 9, em que a integração lógica compreende a definição hierárquica, com base no conjunto de consultas antecipadas de usuário de linguagem natural, da pluralidade de componentes e de um ou mais agentes conversacionais multiuso para processar as consultas em linguagem natural.
11. Sistema (100) de acordo com a reivindicação 10, caracterizado pelo fato de que a pluralidade definida de componentes compreende ainda
Petição 870190055451, de 14/06/2019, pág. 49/62
11. Sistema (100) de acordo com a reivindicação 10, em que a pluralidade definida de componentes compreende ainda um mecanismo de auto-sugestão (305) para auto-gerar, com base em um ou mais conjuntos de dados de treinamento, uma pluralidade de questões recomendadas para um ou mais usuários a fim de facilitar o processamento de consultas em linguagem natural.
12. Sistema (100) de acordo com a reivindicação 11, caracterizado pelo fato de que um ou mais conjuntos de dados de treinamento compreendem um conjunto de conjuntos de consultas semanticamente similares e um conjunto de respostas correspondentes aos conjuntos de consultas semanticamente similares.
12. Sistema (100) de acordo com a reivindicação 11, em que um ou mais conjuntos de dados de treinamento compreendem um conjunto de conjuntos de consultas semanticamente similares e um conjunto de respostas correspondentes aos conjuntos de consultas semanticamente similares.
13. Sistema (100) de acordo com a reivindicação 9, caracterizado pelo fato de que um ou mais processadores de hardware (104) são configurados para atualizar um ou mais gráficos de conhecimento (322) pela implementação do Agente de Atualização do Gráfico de Conhecimento (321) com base em um conjunto de informações obtido de um ou mais usuários, em que o conjunto de informações corresponde ao processamento de consultas em linguagem natural e em que o conjunto de informações é obtido usando o Agente Engajamento do Gráfico de Conhecimento (317).
13. Sistema (100) de acordo com a reivindicação 9, em que um ou mais processadores de hardware (104) são configurados para atualizar um ou mais
Petição 870190055890, de 17/06/2019, pág. 116/130 gráficos de conhecimento (322) pela implementação do Agente de Atualização do Gráfico de Conhecimento (321) com base em um conjunto de informações obtido de um ou mais usuários, em que o conjunto de informações corresponde ao processamento de consultas em linguagem natural e em que o conjunto de informações é obtido usando o Agente Engajamento do Gráfico de Conhecimento (317).
14. Sistema (100) de acordo com a reivindicação 13, caracterizado pelo fato de que o conjunto de informação é obtido de um ou mais usuários ou por um engajamento de usuário pró-ativo ou por uma análise de informação correspondente a um ou mais gráficos de conhecimento (322) pelo Agente de Engajamento de Gráfico de Conhecimento (317).
14. Sistema (100) de acordo com a reivindicação 13, em que o conjunto de informação é obtido de um ou mais usuários ou por um engajamento de usuário pró-ativo ou por uma análise de informação correspondente a um ou mais gráficos de conhecimento (322) pelo Agente de Engajamento de Gráfico de Conhecimento (317).
15. Sistema (100) de acordo com a reivindicação 9, em que um ou mais processadores de hardware (104) são configurados para gerar o primeiro conjunto de respostas por:
mapeamento de uma ou mais entidades correspondentes a um ou mais gráficos de conhecimento (322) com uma ou mais frases correspondentes à consulta classificada por uma técnica de pesquisa baseada em índice invertido; e (ii) atravessamento, com base no mapeamento, de um ou mais gráficos de conhecimento (322) para gerar o primeiro conjunto de respostas.
16.Sistema de acordo com a reivindicação 9, em que um ou mais processadores (104) são configurados para gerar o segundo conjunto de respostas ou pelo engajamento do usuário para extrair a informação detalhada correspondente ao conjunto de consultas em linguagem natural ou pela execução de um conjunto de comandos por uma interface.
Datado de 16 de abril de 2018........
Amit Koshal
Agente p/Pedidos de Patente
IN-PA-2358
Petição 870190055890, de 17/06/2019, pág. 117/130
15. Sistema (100) de acordo com a reivindicação 9, caracterizado pelo fato de que um ou mais processadores de hardware (104) são configurados para gerar o primeiro conjunto de respostas por:
(i) mapeamento de uma ou mais entidades correspondentes a um ou mais gráficos de conhecimento (322) com uma ou mais frases correspondentes à consulta classificada por uma técnica de pesquisa baseada em índice invertido; e atravessamento, com base no mapeamento, de um ou mais gráficos de conhecimento (322) para gerar o primeiro conjunto de respostas.
BR102019007765-4A 2018-04-16 2019-04-16 técnicas de aprendizagem profunda baseadas em agentes conversacionais multi-uso para o processamento de consultas em linguagem natural BR102019007765A2 (pt)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
IN201821014473 2018-04-16

Publications (1)

Publication Number Publication Date
BR102019007765A2 true BR102019007765A2 (pt) 2019-11-05

Family

ID=66396977

Family Applications (1)

Application Number Title Priority Date Filing Date
BR102019007765-4A BR102019007765A2 (pt) 2018-04-16 2019-04-16 técnicas de aprendizagem profunda baseadas em agentes conversacionais multi-uso para o processamento de consultas em linguagem natural

Country Status (7)

Country Link
US (1) US10891438B2 (pt)
EP (1) EP3557439A1 (pt)
JP (1) JP7033562B2 (pt)
AU (1) AU2019202632B2 (pt)
BR (1) BR102019007765A2 (pt)
CA (1) CA3040373C (pt)
MX (1) MX2019004407A (pt)

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11328203B2 (en) * 2018-07-30 2022-05-10 Salesforce.Com, Inc. Capturing organization specificities with embeddings in a model for a multi-tenant database system
US11107092B2 (en) 2019-01-18 2021-08-31 Sprinklr, Inc. Content insight system
US11880658B2 (en) * 2019-03-25 2024-01-23 Jpmorgan Chase Bank, N.A. Method and system for implementing a natural language interface to data stores using deep learning
US11715467B2 (en) * 2019-04-17 2023-08-01 Tempus Labs, Inc. Collaborative artificial intelligence method and system
US11715134B2 (en) 2019-06-04 2023-08-01 Sprinklr, Inc. Content compliance system
US11170174B2 (en) * 2019-06-11 2021-11-09 Microsoft Technology Licensing, Llc Conversational AI using adaptive dialogs
US11151333B2 (en) 2019-06-11 2021-10-19 Microsoft Technology Licensing Llc Conversational event modeling
KR20190096853A (ko) * 2019-07-30 2019-08-20 엘지전자 주식회사 음성 처리 방법 및 음성 처리 장치
US11144730B2 (en) * 2019-08-08 2021-10-12 Sprinklr, Inc. Modeling end to end dialogues using intent oriented decoding
US10878008B1 (en) * 2019-09-13 2020-12-29 Intuit Inc. User support with integrated conversational user interfaces and social question answering
WO2021096382A2 (ru) * 2019-11-15 2021-05-20 Федеральное Государственное Автономное Образовательное Учреждение Высшего Образования "Московский Физико-Технический Институт" (Национальный Исследовательский Университет) (Мфти) Способ и система управления диалоговым агентом в канале взаимодействия с пользователем
CN110895557B (zh) * 2019-11-27 2022-06-21 广东智媒云图科技股份有限公司 基于神经网络的文本特征判断方法、装置和存储介质
US11223582B2 (en) 2019-12-02 2022-01-11 Capital One Services, Llc Pre-chat intent prediction for dialogue generation
CN111309944B (zh) * 2020-01-20 2023-07-14 同方知网数字出版技术股份有限公司 一种基于图数据库的数字人文搜索方法
CN111414556B (zh) * 2020-02-10 2023-11-21 华北电力大学 一种基于知识图谱的服务发现方法
CN111209412B (zh) * 2020-02-10 2023-05-12 同方知网数字出版技术股份有限公司 一种循环更新迭代的期刊文献知识图谱构建方法
CN111339267A (zh) * 2020-02-17 2020-06-26 京东方科技集团股份有限公司 基于知识图谱的问答方法及系统、计算机设备及介质
CN111309914B (zh) * 2020-03-03 2023-05-09 支付宝(杭州)信息技术有限公司 基于多个模型结果对多轮对话的分类方法和装置
US11651197B2 (en) * 2020-03-04 2023-05-16 International Business Machines Corporation Holistic service advisor system
CN111680207B (zh) * 2020-03-11 2023-08-04 华中科技大学鄂州工业技术研究院 一种用于确定用户搜索意图的方法及装置
CN111414393B (zh) * 2020-03-26 2021-02-23 湖南科创信息技术股份有限公司 一种基于医学知识图谱的语义相似病例检索方法及设备
CN111400480B (zh) * 2020-04-21 2023-05-12 支付宝(杭州)信息技术有限公司 针对多轮对话的用户意图识别方法和装置
KR102420929B1 (ko) * 2020-05-06 2022-07-14 (주)와이즈에이아이 인공지능 기반의 의료 지원 서비스 제공장치 및 방법
CN111785368A (zh) * 2020-06-30 2020-10-16 平安科技(深圳)有限公司 基于医疗知识图谱的分诊方法、装置、设备及存储介质
CN112035511A (zh) * 2020-08-31 2020-12-04 康键信息技术(深圳)有限公司 基于医学知识图谱的目标数据搜索方法及相关设备
US11355118B2 (en) 2020-09-15 2022-06-07 Kyndryl, Inc. Virtual assistants harmonization
WO2022072844A1 (en) * 2020-10-01 2022-04-07 Vishal Misra Systems, methods, and media for formulating database queries from natural language text
CN112231454B (zh) * 2020-10-14 2024-02-09 中国平安人寿保险股份有限公司 提问预测及回答反馈方法、装置、计算机设备及存储介质
EP4227822A4 (en) * 2020-11-13 2023-11-29 Huawei Technologies Co., Ltd. METHOD AND DEVICE FOR INTENTION-KNOWLEDGE ASSOCIATION BETWEEN INTENTION SYSTEMS AND SYSTEM
CN114519134A (zh) * 2020-11-18 2022-05-20 华为技术有限公司 一种意图维持方法及装置
EP4248369A1 (en) * 2020-12-08 2023-09-27 Amazon Technologies, Inc. Using graph queries to obtain results from machine learning models
US11657226B2 (en) * 2020-12-15 2023-05-23 International Business Machines Corporation Detecting and mitigating bias in natural language processing
CN113111242B (zh) * 2021-03-10 2024-05-24 深圳源码教育科技有限公司 基于知识图谱的自适应学习路径推荐方法
US11663421B2 (en) * 2021-04-27 2023-05-30 Jpmorgan Chase Bank, N.A. Systems and methods for intent-based natural language processing
CN113221564B (zh) * 2021-04-29 2024-03-01 北京百度网讯科技有限公司 训练实体识别模型的方法、装置、电子设备和存储介质
CN113918694B (zh) * 2021-10-08 2024-04-16 武汉科技大学 一种面向医疗知识图谱问答的问句解析方法
US20230135625A1 (en) * 2021-10-28 2023-05-04 International Business Machines Corporation Automated generation of dialogue flow from documents
US11922144B1 (en) 2023-03-20 2024-03-05 OpenAI Opco, LLC Schema-based integration of external APIs with natural language applications
KR102613754B1 (ko) * 2023-10-31 2023-12-15 주식회사 로그프레소 언어 모델 기반 시스템 운영 자동화 방법

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020156792A1 (en) * 2000-12-06 2002-10-24 Biosentients, Inc. Intelligent object handling device and method for intelligent object data in heterogeneous data environments with high data density and dynamic application needs
WO2010078614A1 (en) 2009-01-08 2010-07-15 Relevancenow Pty Limited Chatbots
US8676565B2 (en) * 2010-03-26 2014-03-18 Virtuoz Sa Semantic clustering and conversational agents
EP2839391A4 (en) * 2012-04-20 2016-01-27 Maluuba Inc CONVERSATION AGENT
US10019531B2 (en) * 2013-05-19 2018-07-10 Carmel Kent System and method for displaying, connecting and analyzing data in an online collaborative webpage
US9448992B2 (en) * 2013-06-04 2016-09-20 Google Inc. Natural language search results for intent queries
US9189742B2 (en) 2013-11-20 2015-11-17 Justin London Adaptive virtual intelligent agent
EP3480811A1 (en) * 2014-05-30 2019-05-08 Apple Inc. Multi-command single utterance input method
US10418032B1 (en) * 2015-04-10 2019-09-17 Soundhound, Inc. System and methods for a virtual assistant to manage and use context in a natural language dialog
US9875081B2 (en) 2015-09-21 2018-01-23 Amazon Technologies, Inc. Device selection for providing a response
EP4365784A2 (en) * 2016-04-18 2024-05-08 Google LLC Automated assistant invocation of appropriate agent
US20170366479A1 (en) 2016-06-20 2017-12-21 Microsoft Technology Licensing, Llc Communication System
US20180052885A1 (en) * 2016-08-16 2018-02-22 Ebay Inc. Generating next user prompts in an intelligent online personal assistant multi-turn dialog
US10503767B2 (en) * 2016-09-13 2019-12-10 Microsoft Technology Licensing, Llc Computerized natural language query intent dispatching
US10628491B2 (en) * 2016-11-09 2020-04-21 Cognitive Scale, Inc. Cognitive session graphs including blockchains
US10257241B2 (en) * 2016-12-21 2019-04-09 Cisco Technology, Inc. Multimodal stream processing-based cognitive collaboration system
US10878192B2 (en) * 2017-01-06 2020-12-29 Microsoft Technology Licensing, Llc Contextual document recall
WO2018175291A1 (en) * 2017-03-20 2018-09-27 Ebay Inc. Detection of mission change in conversation
US10810371B2 (en) * 2017-04-06 2020-10-20 AIBrain Corporation Adaptive, interactive, and cognitive reasoner of an autonomous robotic system
US10977319B2 (en) * 2017-07-10 2021-04-13 Ebay Inc. Expandable service architecture with configurable dialogue manager
US11216746B2 (en) * 2017-11-28 2022-01-04 Facebook, Inc. Utilizing machine learning and composite utility scores from multiple event categories to improve digital content distribution
US20190213284A1 (en) * 2018-01-11 2019-07-11 International Business Machines Corporation Semantic representation and realization for conversational systems

Also Published As

Publication number Publication date
CA3040373A1 (en) 2019-10-16
JP7033562B2 (ja) 2022-03-10
CA3040373C (en) 2021-05-11
AU2019202632A1 (en) 2019-10-31
MX2019004407A (es) 2019-11-25
US10891438B2 (en) 2021-01-12
JP2019215857A (ja) 2019-12-19
US20190317994A1 (en) 2019-10-17
EP3557439A1 (en) 2019-10-23
AU2019202632B2 (en) 2020-09-10

Similar Documents

Publication Publication Date Title
BR102019007765A2 (pt) técnicas de aprendizagem profunda baseadas em agentes conversacionais multi-uso para o processamento de consultas em linguagem natural
US11816439B2 (en) Multi-turn dialogue response generation with template generation
US10832006B2 (en) Responding to an indirect utterance by a conversational system
US11954613B2 (en) Establishing a logical connection between an indirect utterance and a transaction
US10824658B2 (en) Implicit dialog approach for creating conversational access to web content
US10915588B2 (en) Implicit dialog approach operating a conversational access interface to web content
US11783131B2 (en) Knowledge graph fusion
CN111506714A (zh) 基于知识图嵌入的问题回答
US20220100963A1 (en) Event extraction from documents with co-reference
JP2020091846A (ja) 会話に基づくチケットロギングのためのシステム及び方法
CA3049051C (en) Resolving abstract anaphoric references in conversational systems using hierarchically stacked neural networks
CN106294520B (zh) 使用从文档提取的信息来标识关系
US20220100772A1 (en) Context-sensitive linking of entities to private databases
CN115668220A (zh) 从明确标签和推断标签中联合学习
US20220100967A1 (en) Lifecycle management for customized natural language processing
KR102347020B1 (ko) 인공지능 기반 특성분석을 통한 맞춤형 고객센터 솔루션 제공방법
CN110110053A (zh) 在间接话语和事务之间建立逻辑连接
US20200380036A1 (en) Methods and systems for chaining biographic inputs using artificial intelligence
BR112021012457A2 (pt) Linguagem de solução natural
Singh et al. KNADIA: Enterprise KNowledge assisted DIAlogue systems using deep learning
WO2022072237A1 (en) Lifecycle management for customized natural language processing
US20230409839A1 (en) Preserving text and speech semantics using real-time virtual corpora in live interactive chatbot sessions
US20230111052A1 (en) Self-learning annotations to generate rules to be utilized by rule-based system
US20230177277A1 (en) Contextual dialogue framework over dynamic tables
Pandey Jointly Improving Performance of Human Annotators and Models in Human-In-The-Loop Machine Learning Systems

Legal Events

Date Code Title Description
B03A Publication of a patent application or of a certificate of addition of invention [chapter 3.1 patent gazette]