CN112364147A - 一种基于知识图谱的跨领域多轮对话方法及实现系统 - Google Patents

一种基于知识图谱的跨领域多轮对话方法及实现系统 Download PDF

Info

Publication number
CN112364147A
CN112364147A CN202011382650.9A CN202011382650A CN112364147A CN 112364147 A CN112364147 A CN 112364147A CN 202011382650 A CN202011382650 A CN 202011382650A CN 112364147 A CN112364147 A CN 112364147A
Authority
CN
China
Prior art keywords
information
conversation
module
domain
field
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011382650.9A
Other languages
English (en)
Inventor
骆敏
展华益
王欣
杨兰
蒋伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan Changhong Electric Co Ltd
Original Assignee
Sichuan Changhong Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan Changhong Electric Co Ltd filed Critical Sichuan Changhong Electric Co Ltd
Priority to CN202011382650.9A priority Critical patent/CN112364147A/zh
Publication of CN112364147A publication Critical patent/CN112364147A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Databases & Information Systems (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种基于知识图谱的跨领域多轮对话方法,包括:获取用户的输入对话;结合历史对话信息,识别当轮对话信息;根据历史对话信息和当轮对话信息进行对话跟踪,更新当轮对话状态信息;根据知识图谱和更新后的对话状态信息,对当轮对话的领域和领域信息进行对齐,得到匹配的对话信息根据当轮对话状态信息,进行策略管理;结合当轮对话的策略和对话信息,生成相应的系统回复;将当轮用户的输入对话和系统的回复保存到对话历史中,并将系统的回复返回给用户。本发明的方法能够实现跨领域的多轮对话,引入知识图谱对领域和领域信息进行对齐,并且强化了对话跟踪模块,能够处理信息不匹配以及信息丢失问题。

Description

一种基于知识图谱的跨领域多轮对话方法及实现系统
技术领域
本发明涉及自然语言理解技术领域,特别涉及一种基于知识图谱的跨领域多轮对话方法及实现系统。
背景技术
作为人工智能和自然语言处理领域中一个倍受关注并具有广泛发展前景的研究方向,多轮对话系统应用越来越广,用户通过与多轮对话系统的交互达到问询、操作等目的。绝大多数多轮对话系统是以智能客服机器人的方式实现,并且已经成功应用于电商、金融、电信等领域,如淘宝智能客服;另外很多AI虚拟人物也嵌入了多轮对话系统,如微软小冰。
相关技术中,多轮对话主要分为任务型对话系统和非任务型对话系统。非任务型对话系统针对开放领域,如闲聊;任务型对话通过限定内容的多轮对话,达到完成用户所要求的任务、提供用户所需信息等目的。针对任务型对话系统,主流方法是根据用户输入进行槽填充和意图识别,系统根据槽填充结果获取用户所需信息并进行状态跟踪,通过用户意图与策略管理模块进行系统回复的决策,最后将最终的系统回复返回给用户。其中,意图识别和对话跟踪是多轮对话的两个重要部分,因为随着对话轮次的增加,系统可能会丢失、误判用户意图,其实是当新一轮的用户对话省略、更新、补充关键对话信息地时候,需要对话系统很好的识别用户需求,以及对对话状态的把握。
现有的任务型多轮对话中,单领域的对话系统居多,如公开号为CN109960733A的专利文献中提出了一种端到端的任务型对话系统,该系统中,针对了特定领域,只进行了实体识别,并且直接根据对话历史和识别的实体得到系统回复,容易造成对话信息的不准确与缺失。公开号为CN110111766A的专利文献中提出了一种多领域任务型对话系统、方法和终端,该方法中,直接利用输入的文本数据以及各种中间变量的特征向量通过答复生成程序得到相应的话术模板,最后转换为系统回复,虽然涉及到多领域,但是并没有进行知识对齐,可能会出现领域与其他信息不匹配的情况。
综上所述,现有的任型对话系统普遍存在以下几个问题:
1.绝大多数任务型对话只适用于单领域。
2.跨领域对话系统中,缺少对领域信息的对齐,会出现领域与意图、实体等信息不匹配的情况。
3.对话跟踪模块比较薄弱,只是简单粗暴地直接通过历史对话中获取的信息得到系统回复的话术模板或者回复语句,会出现信息丢失的情况。
发明内容
本发明的目的是克服上述背景技术中不足,提供一种基于知识图谱的跨领域多轮对话方法及实现系统,能够实现跨领域的多轮对话,引入知识图谱对领域和领域信息进行对齐,并且强化了对话跟踪模块,能够处理信息不匹配以及信息丢失问题。
为了达到上述的技术效果,本发明采取以下技术方案:
一种基于知识图谱的跨领域多轮对话方法,包括:
步骤1.获取用户的输入对话;即接收用户当轮的输入对话,并将之交给后续模型处理;
步骤2.结合历史对话信息,识别当轮对话信息,所述当轮对话信息包括当轮对话的领域和领域信息;所述领域信息为用于反应用户需求的信息;
步骤3.根据历史对话信息和当轮对话信息进行对话跟踪,更新当轮对话状态信息;具体包括根据领域和领域信息,先判断当轮信息与历史信息是否有冲突;若没有冲突,则保持当轮信息,更新对话状态,否则通过模型来判断该信息状态更新方式,进行对话状态的更新;
步骤4.根据知识图谱和更新后的对话状态信息,对当轮对话的领域和领域信息进行对齐,得到匹配的对话信息;即根据更新后的信息进行知识库检索,得到检索结果后,根据预先设定好的规则进行对齐;
步骤5.根据当轮对话状态信息,进行策略管理;包括根据预先设定好的规则进行根据对齐后的对话状态信息,得到相应的策略;
步骤6.结合当轮对话的策略和对话信息,生成相应的系统回复;即根据当轮对话的系统决策以及对应的回复模板,生成系统回复;
步骤7.将当轮用户的输入对话和系统的回复保存到对话历史中,并将系统的回复返回给用户。
进一步地,所述步骤2具体包括:
步骤2.1.获取当轮用户的输入对话及至少前一轮的对话历史,作为输入文本;
步骤2.2.将获取到的输入文本分为测试集文本及训练集文本,并对训练集文本进行人工标注得到训练集文本的领域和领域信息;
步骤2.3.构建跨领域的领域识别及领域信息识别模型并通过训练集文本进行模型训练;
步骤2.4.通过训练好的模型对测试集文本进行领域识别以及领域信息识别并获取识别结果。
进一步地,所述领域识别和领域信息识别模型包括词向量模块,领域识别模块,领域信息识别模块,联合训练模块,所述词向量模块用于对输入文本做定长词向量处理;所述领域识别模块由多层神经网络组成,用于进行领域分类及计算相应损失函数;所述领域信息识别模块由双向神经网络层以及序列标注层组成,用于识别领域信,并计算相应的损失函数;所述联合训练模块用于通过所述领域识别模块、领域信息识别模块的损失函数计算整个领域识别和领域信息识别模型的损失函数,并采用动态学习率以及优化的梯度下降法来不断迭代模型参数。
进一步地,所述步骤3具体包括:
步骤3.1.判断当轮对话领域及领域信息与历史对话信息是否有冲突;
步骤3.2.若没有冲突,则保留当轮对话状态信息,并更新当轮状态;否则,根据状态跟踪模型判断更新方式并根据不同的更新方式更新当轮对话状态信息。
进一步地,所述步骤3.1中判断是否有冲突时可根据规则或者模型匹配的方式判断。
进一步地,所述状态跟踪模型包括:词向量模块、状态识别模块及模型训练模块;
所述词向量模块用于对输入文本做定长词向量处理;所述状态识别模块由双向神经网络和单层神经网络组成,用于得到对话状态信息的更新方式,并计算相应的损失函数;所述模型训练模块用于根据所述状态识别模块的损失函数,采用动态学习率以及优化的梯度下降法来不断迭代模型参数。
进一步地,所述步骤4具体包括:
步骤4.1.根据更新后的对话状态信息,在知识图谱中进行链接,并根据链接后的结果进行检索;
步骤4.2.若能检索出结果,则保留检索结果作为对话信息,否则,依次扩大查询范围得到多个查询结果,并根据查询结果依据预先定义的规则进行对齐。
进一步地,所述步骤5具体为根据对齐后的对话状态信息以及预先设定好的规则,直接得到相应的系统策略,具体为根据对话意图或者对话目的或者二者结合的规则生成相应的系统策略。
进一步地,所述步骤6具体为执行当轮对话的系统策略,结合对话信息,使用预先设定好的话术模板得到系统回复。
同时,本发明还公开了一种基于知识图谱的跨领域多轮对话实现系统,包括:用户交互模块、领域及领域信息识别模块、状态更新模块、信息对齐模块、策略管理模块、对话生成模块;
所述用户交互模块用于与用户进行交互,获取每轮用户对话并输入到领域及领域信息识别模块,将对话生成模块返回的结果作为系统回复返回给用户,并保留当轮用户对话和系统对话到对话历史;
所述领域及领域信息识别模块用于根据训练数据训练领域识别和领域信息识别的联合模型,并根据模型识别用户输入对话的领域和领域信息;
所述状态更新模块用于更新当轮对话的状态;
所述信息对齐模块用于根据知识图谱的检索结果对齐当轮对话状态信息;
所述策略管理模块用于根据当轮对话状态信息生成相应的系统策略;
所述对话生成模块用于将系统策略转换为系统动作,并将当轮对话信息状态和意图状态填充到相应的话术模板中,生成系统对话。
本发明与现有技术相比,具有以下的有益效果:
本发明的基于知识图谱的跨领域多轮对话方法及实现系统,能够实现跨领域的多轮对话,并且不需要设置领域参数;强化了对话跟踪模块,尤其是当新一轮的用户对话省略、更新、补充关键对话信息时,可处理信息丢失问题;引入知识图谱对领域和领域信息进行对齐,能够处理信息不匹配的问题。
附图说明
图1是本发明的基于知识图谱的跨领域多轮对话方法的流程示意图。
图2是本发明的基于知识图谱的跨领域多轮对话实现系统的示意图。
具体实施方式
下面结合本发明的实施例对本发明作进一步的阐述和说明。
实施例:
实施例一:
如图1所示,一种基于知识图谱的跨领域多轮对话方法,主要应用于基于知识图谱的跨领域多轮对话领域,通过分析用户的自然语言对话,根据模型算法与相关策略,结合知识图谱,实现与用户的多轮交互,具体实施步骤如下:
步骤1.获取用户的输入对话。
即接收用户当轮的输入对话,并将之交给后续模型处理。
步骤2.结合历史对话信息,识别当轮对话信息,
其中,所述当轮对话信息包括当轮对话的领域和领域信息;所述领域信息为用于反应用户需求的信息,包括对话的意图、实体、目的、实体属性等。
具体的,本实施例中,具体包括:
步骤2.1.获取当轮用户的输入对话及至少前一轮的对话历史,作为输入文本;
步骤2.2.将获取到的输入文本分为测试集文本及训练集文本,并对训练集文本进行人工标注得到训练集文本的领域和领域信息;
步骤2.3.构建跨领域的领域识别及领域信息识别模型并通过训练集文本进行模型训练;
具体的,本实施例中构建的领域识别和领域信息识别模型具体包括词向量模块,领域识别模块,领域信息识别模块,联合训练模块。
其中,所述词向量模块用于对输入文本做定长词向量处理;包括随机初始化词向量及采用预训练的词向量。预训练的词向量包括word2vec词向量,Glove词向量以及在模型中添加BERT、Robert、GPT等大型预训练模型来得到词向量。
所述领域识别模块由多层神经网络组成,用于进行领域分类及计算相应损失函数。具体的,本实施例中为避免领域信息的丢失,具体引入注意力机制得到领域分类结果。
所述领域信息识别模块由双向神经网络层以及序列标注层组成,用于识别领域信,并计算相应的损失函数。其中双向神经网络包括双向循环神经网络(Bi-RNN),双向长短期记忆网络(Bi-LSTM)和双向门循环单元网络(Bi-GRU)等,序列标注层可采用条件随机场(CRF),单层神经网络等。
所述联合训练模块用于通过所述领域识别模块、领域信息识别模块的损失函数计算整个领域识别和领域信息识别模型的损失函数,并采用动态学习率以及优化的梯度下降法来不断迭代模型参数。
步骤2.4.通过训练好的模型对测试集文本进行领域识别以及领域信息识别并获取识别结果。
步骤3.根据历史对话信息和当轮对话信息进行对话跟踪,更新当轮对话状态信息。
具体包括根据领域和领域信息,先判断当轮信息与历史信息是否有冲突;若没有冲突,则保持当轮信息,更新对话状态,否则通过模型来判断该信息状态更新方式,进行对话状态的更新。
本实施例中,具体包括:
步骤3.1.判断当轮对话领域及领域信息与历史对话信息是否有冲突;具体判断是否有冲突时可根据规则或者模型匹配的方式判断。其中,基于规则的判断可直接根据领域以及领域信息与历史对话信息异同的个数进行判断;模型匹配的方式可采用文本相似度等模型判断。
步骤3.2.若没有冲突,则保留当轮对话状态信息,并更新当轮状态;否则,根据状态跟踪模型判断更新方式并根据不同的更新方式更新当轮对话状态信息。
具体的,本实施例中,状态跟踪模型包括:词向量模块、状态识别模块及模型训练模块。
其中,所述词向量模块用于对输入文本做定长词向量处理;包括随机初始化词向量;采用预训练的词向量。预训练的词向量包括word2vec词向量,Glove词向量以及在模型中添加BERT、Robert、GPT等大型预训练模型来得到词向量。
所述状态识别模块由双向神经网络和单层神经网络组成,用于得到对话状态信息的更新方式,并计算相应的损失函数。其中双向神经网络包括双向循环神经网络(Bi-RNN),双向长短期记忆网络(Bi-LSTM)和双向门循环单元网络(Bi-GRU)等。
所述模型训练模块用于根据所述状态识别模块的损失函数,采用动态学习率以及优化的梯度下降法来不断迭代模型参数。
具体的,本实施例中,状态跟踪模型的具体构建方法包括:首先对数据进行标注,得到状态更新方式,包括信息覆盖、信息补充以及信息弃用;将数据输入到状态跟踪模型进行训练。
步骤4.根据知识图谱和更新后的对话状态信息,对当轮对话的领域和领域信息进行对齐,得到匹配的对话信息。
即根据更新后的信息进行知识库检索,得到检索结果后,根据预先设定好的规则进行对齐;本实施例中,具体包括:
步骤4.1.根据更新后的对话状态信息,在知识图谱中进行链接,并根据链接后的结果进行检索。其中,具体的链接方式包括字符串匹配、编辑距离匹配、通过模型匹配等。
步骤4.2.若能检索出结果,则保留检索结果作为对话信息,否则,依次扩大查询范围得到多个查询结果,并根据查询结果依据预先定义的规则进行对齐,如可以直接采用保留查询范围最小的对话信息的规则进行领域和领域信息的对齐。
步骤5.根据当轮对话状态信息,进行策略管理;包括根据预先设定好的规则进行根据对齐后的对话状态信息,得到相应的策略。
具体为根据对齐后的对话状态信息以及预先设定好的规则,直接得到相应的系统策略,具体为根据对话意图或者对话目的或者二者结合的规则生成相应的系统策略。
步骤6.结合当轮对话的策略和对话信息,生成相应的系统回复;即根据当轮对话的系统决策以及对应的回复模板,生成系统回复。
具体为执行当轮对话的系统策略,结合对话信息,使用预先设定好的话术模板得到系统回复。
具体的,以上述步骤得到的对话策略为例,执行对话策略,得到相应的系统动作,如问好、问询、提供信息、结束对话等。根据系统策略和系统动作,预先设定好话术模板,并且根据话术模板格式将当轮对话的信息状态和意图状态填充到模板中,得到完整的系统回复,作为系统对话。
步骤7.将当轮用户的输入对话和系统的回复保存到对话历史中,并将系统的回复返回给用户。
实施例二
一种基于知识图谱的跨领域多轮对话实现系统,如图2所示,包括依次连接的用户交互模块、领域及领域信息识别模块、状态更新模块、信息对齐模块、策略管理模块、对话生成模块。
所述用户交互模块用于与用户进行交互,获取每轮用户对话并输入到领域及领域信息识别模块,将对话生成模块返回的结果作为系统回复返回给用户,并保留当轮用户对话和系统对话到对话历史。
所述领域及领域信息识别模块用于根据训练数据训练领域识别和领域信息识别的联合模型,并根据模型识别用户输入对话的领域和领域信息。
所述状态更新模块用于更新当轮对话的状态;必要时,训练状态跟踪模型,根据模型结果更新当轮对话状态。
所述信息对齐模块用于根据知识图谱的检索结果对齐当轮对话状态信息;
所述策略管理模块用于根据当轮对话状态信息生成相应的系统策略;
所述对话生成模块用于将系统策略转换为系统动作,并将当轮对话信息状态和意图状态填充到相应的话术模板中,生成系统对话。
具体的,本实施例的基于知识图谱的跨领域多轮对话实现系统其具体工作流程即上述实施例一的基于知识图谱的跨领域多轮对话方法流程,其中,用户交互模块可具体实现上述步骤1、步骤7,领域及领域信息识别模块用于具体实现上述步骤2,状态更新模块用于具体实现上述步骤3,信息对齐模块用于具体实现上述步骤4,策略管理模块用于具体实现上述步骤5,对话生成模块用于具体实现上述步骤6,为了避免重复,此处不再赘述。
综上可知,本实施例的基于知识图谱的跨领域多轮对话实现系统,通过与用户进行交互,能够实现跨领域的多轮对话,并且不需要设置领域参数;强化了对话跟踪模块,尤其是当新一轮的用户对话省略、更新、补充关键对话信息时,可处理信息丢失问题;引入知识图谱对领域和领域信息进行对齐,能够处理信息不匹配的问题。
实施例三
本实施例中公开了一种计算机设备,该计算机设备可以是服务器,该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储基于知识图谱的跨领域多轮对话方法中涉及到的数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现基于知识图谱的跨领域多轮对话方法。
在另一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述实施例一中基于知识图谱的跨领域多轮对话方法的步骤,或者,处理器执行计算机程序时实现上述实施例二的基于知识图谱的跨领域多轮对话实现系统的各模块的功能。为避免重复,这里不再赘述。
在另一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述实施例一中基于知识图谱的跨领域多轮对话方法的步骤,或者,处理器执行计算机程序时实现上述实施例二的基于知识图谱的跨领域多轮对话实现系统的各模块的功能。为避免重复,这里不再赘述。
可以理解的是,以上实施方式仅仅是为了说明本发明的原理而采用的示例性实施方式,然而本发明并不局限于此。对于本领域内的普通技术人员而言,在不脱离本发明的精神和实质的情况下,可以做出各种变型和改进,这些变型和改进也视为本发明的保护范围。

Claims (10)

1.一种基于知识图谱的跨领域多轮对话方法,其特征在于,包括:
步骤1.获取用户的输入对话;
步骤2.结合历史对话信息,识别当轮对话信息,所述当轮对话信息包括当轮对话的领域和领域信息;所述领域信息为用于反应用户需求的信息;
步骤3.根据历史对话信息和当轮对话信息进行对话跟踪,更新当轮对话状态信息;
步骤4.根据知识图谱和更新后的对话状态信息,对当轮对话的领域和领域信息进行对齐,得到匹配的对话信息;
步骤5.根据当轮对话状态信息,进行策略管理;
步骤6.结合当轮对话的策略和对话信息,生成相应的系统回复;
步骤7.将当轮用户的输入对话和系统的回复保存到对话历史中,并将系统的回复返回给用户。
2.根据权利要求1所述的一种基于知识图谱的跨领域多轮对话方法,其特征在于,所述步骤2具体包括:
步骤2.1.获取当轮用户的输入对话及至少前一轮的对话历史,作为输入文本;
步骤2.2.将获取到的输入文本分为测试集文本及训练集文本,并对训练集文本进行人工标注得到训练集文本的领域和领域信息;
步骤2.3.构建跨领域的领域识别及领域信息识别模型并通过训练集文本进行模型训练;
步骤2.4.通过训练好的模型对测试集文本进行领域识别以及领域信息识别并获取识别结果。
3.根据权利要求2所述的一种基于知识图谱的跨领域多轮对话方法,其特征在于,所述领域识别和领域信息识别模型包括词向量模块,领域识别模块,领域信息识别模块,联合训练模块,所述词向量模块用于对输入文本做定长词向量处理;所述领域识别模块由多层神经网络组成,用于进行领域分类及计算相应损失函数;所述领域信息识别模块由双向神经网络层以及序列标注层组成,用于识别领域信,并计算相应的损失函数;所述联合训练模块用于通过所述领域识别模块、领域信息识别模块的损失函数计算整个领域识别和领域信息识别模型的损失函数,并采用动态学习率以及优化的梯度下降法来不断迭代模型参数。
4.根据权利要求1所述的一种基于知识图谱的跨领域多轮对话方法,其特征在于,所述步骤3具体包括:
步骤3.1.判断当轮对话领域及领域信息与历史对话信息是否有冲突;
步骤3.2.若没有冲突,则保留当轮对话状态信息,并更新当轮状态;否则,根据状态跟踪模型判断更新方式并根据不同的更新方式更新当轮对话状态信息。
5.根据权利要求4所述的一种基于知识图谱的跨领域多轮对话方法,其特征在于,所述步骤3.1中判断是否有冲突时可根据规则或者模型匹配的方式判断。
6.根据权利要求4所述的一种基于知识图谱的跨领域多轮对话方法,其特征在于,所述状态跟踪模型包括:词向量模块、状态识别模块及模型训练模块;
所述词向量模块用于对输入文本做定长词向量处理;所述状态识别模块由双向神经网络和单层神经网络组成,用于得到对话状态信息的更新方式,并计算相应的损失函数;所述模型训练模块用于根据所述状态识别模块的损失函数,采用动态学习率以及优化的梯度下降法来不断迭代模型参数。
7.根据权利要求1所述的一种基于知识图谱的跨领域多轮对话方法,其特征在于,所述步骤4具体包括:
步骤4.1.根据更新后的对话状态信息,在知识图谱中进行链接,并根据链接后的结果进行检索;
步骤4.2.若能检索出结果,则保留检索结果作为对话信息,否则,依次扩大查询范围得到多个查询结果,并根据查询结果依据预先定义的规则进行对齐。
8.根据权利要求1所述的一种基于知识图谱的跨领域多轮对话方法,其特征在于,所述步骤5具体为根据对齐后的对话状态信息以及预先设定好的规则,直接得到相应的系统策略,具体为根据对话意图或者对话目的或者二者结合的规则生成相应的系统策略。
9.根据权利要求1所述的一种基于知识图谱的跨领域多轮对话方法,其特征在于,所述步骤6具体为执行当轮对话的系统策略,结合对话信息,使用预先设定好的话术模板得到系统回复。
10.一种基于知识图谱的跨领域多轮对话实现系统,其特征在于,包括:
用户交互模块、领域及领域信息识别模块、状态更新模块、信息对齐模块、策略管理模块、对话生成模块;
所述用户交互模块用于与用户进行交互,获取每轮用户对话并输入到领域及领域信息识别模块,将对话生成模块返回的结果作为系统回复返回给用户,并保留当轮用户对话和系统对话到对话历史;
所述领域及领域信息识别模块用于根据训练数据训练领域识别和领域信息识别的联合模型,并根据模型识别用户输入对话的领域和领域信息;
所述状态更新模块用于更新当轮对话的状态;
所述信息对齐模块用于根据知识图谱的检索结果对齐当轮对话状态信息;
所述策略管理模块用于根据当轮对话状态信息生成相应的系统策略;
所述对话生成模块用于将系统策略转换为系统动作,并将当轮对话信息状态和意图状态填充到相应的话术模板中,生成系统对话。
CN202011382650.9A 2020-12-01 2020-12-01 一种基于知识图谱的跨领域多轮对话方法及实现系统 Pending CN112364147A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011382650.9A CN112364147A (zh) 2020-12-01 2020-12-01 一种基于知识图谱的跨领域多轮对话方法及实现系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011382650.9A CN112364147A (zh) 2020-12-01 2020-12-01 一种基于知识图谱的跨领域多轮对话方法及实现系统

Publications (1)

Publication Number Publication Date
CN112364147A true CN112364147A (zh) 2021-02-12

Family

ID=74535783

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011382650.9A Pending CN112364147A (zh) 2020-12-01 2020-12-01 一种基于知识图谱的跨领域多轮对话方法及实现系统

Country Status (1)

Country Link
CN (1) CN112364147A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113095050A (zh) * 2021-04-19 2021-07-09 广东电网有限责任公司 一种智能成票方法、系统、设备及存储介质
CN113505209A (zh) * 2021-07-09 2021-10-15 吉林大学 一种面向汽车领域的智能问答系统
CN113641806A (zh) * 2021-07-28 2021-11-12 北京百度网讯科技有限公司 对话方法、系统、电子设备及存储介质
CN113821620A (zh) * 2021-09-18 2021-12-21 湖北亿咖通科技有限公司 多轮对话任务处理方法、装置及电子设备
CN114297352A (zh) * 2021-11-24 2022-04-08 盛景智能科技(嘉兴)有限公司 对话状态追踪方法、装置、人机对话系统及作业机械
CN116628160A (zh) * 2023-05-24 2023-08-22 中南大学 一种基于多知识库的任务型对话方法、系统及介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109063035A (zh) * 2018-07-16 2018-12-21 哈尔滨工业大学 一种面向出行领域的人机多轮对话方法
CN109616108A (zh) * 2018-11-29 2019-04-12 北京羽扇智信息科技有限公司 多轮对话交互处理方法、装置、电子设备及存储介质
WO2019209501A1 (en) * 2018-04-24 2019-10-31 Microsoft Technology Licensing, Llc Session message processing
CN110442676A (zh) * 2019-07-02 2019-11-12 北京邮电大学 基于多轮对话的专利检索方法及装置
CN111026842A (zh) * 2019-11-29 2020-04-17 微民保险代理有限公司 自然语言处理方法、自然语言处理装置及智能问答系统
CN111159371A (zh) * 2019-12-21 2020-05-15 华南理工大学 一种面向任务型对话系统的对话策略方法
CN111414195A (zh) * 2019-02-03 2020-07-14 北京邮电大学 通用可配置、兼容多模型、领域可迁移的多轮对话系统
CN111475616A (zh) * 2020-03-13 2020-07-31 平安科技(深圳)有限公司 基于对话状态预测的多轮对话方法、装置和计算机设备
CN111651609A (zh) * 2020-04-24 2020-09-11 中国电力科学研究院有限公司 一种融合知识图谱和情感监督的多轮对话方法及系统

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019209501A1 (en) * 2018-04-24 2019-10-31 Microsoft Technology Licensing, Llc Session message processing
CN109063035A (zh) * 2018-07-16 2018-12-21 哈尔滨工业大学 一种面向出行领域的人机多轮对话方法
CN109616108A (zh) * 2018-11-29 2019-04-12 北京羽扇智信息科技有限公司 多轮对话交互处理方法、装置、电子设备及存储介质
CN111414195A (zh) * 2019-02-03 2020-07-14 北京邮电大学 通用可配置、兼容多模型、领域可迁移的多轮对话系统
CN110442676A (zh) * 2019-07-02 2019-11-12 北京邮电大学 基于多轮对话的专利检索方法及装置
CN111026842A (zh) * 2019-11-29 2020-04-17 微民保险代理有限公司 自然语言处理方法、自然语言处理装置及智能问答系统
CN111159371A (zh) * 2019-12-21 2020-05-15 华南理工大学 一种面向任务型对话系统的对话策略方法
CN111475616A (zh) * 2020-03-13 2020-07-31 平安科技(深圳)有限公司 基于对话状态预测的多轮对话方法、装置和计算机设备
CN111651609A (zh) * 2020-04-24 2020-09-11 中国电力科学研究院有限公司 一种融合知识图谱和情感监督的多轮对话方法及系统

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113095050A (zh) * 2021-04-19 2021-07-09 广东电网有限责任公司 一种智能成票方法、系统、设备及存储介质
CN113505209A (zh) * 2021-07-09 2021-10-15 吉林大学 一种面向汽车领域的智能问答系统
CN113641806A (zh) * 2021-07-28 2021-11-12 北京百度网讯科技有限公司 对话方法、系统、电子设备及存储介质
CN113641806B (zh) * 2021-07-28 2023-06-23 北京百度网讯科技有限公司 对话方法、系统、电子设备及存储介质
US12118319B2 (en) 2021-07-28 2024-10-15 Beijing Baidu Netcom Science Technology Co., Ltd. Dialogue state rewriting and reply generating method and system, electronic device and storage medium
CN113821620A (zh) * 2021-09-18 2021-12-21 湖北亿咖通科技有限公司 多轮对话任务处理方法、装置及电子设备
CN113821620B (zh) * 2021-09-18 2023-12-12 亿咖通(湖北)技术有限公司 多轮对话任务处理方法、装置及电子设备
CN114297352A (zh) * 2021-11-24 2022-04-08 盛景智能科技(嘉兴)有限公司 对话状态追踪方法、装置、人机对话系统及作业机械
CN116628160A (zh) * 2023-05-24 2023-08-22 中南大学 一种基于多知识库的任务型对话方法、系统及介质
CN116628160B (zh) * 2023-05-24 2024-04-19 中南大学 一种基于多知识库的任务型对话方法、系统及介质

Similar Documents

Publication Publication Date Title
CN112364147A (zh) 一种基于知识图谱的跨领域多轮对话方法及实现系统
CN110704641B (zh) 一种万级意图分类方法、装置、存储介质及电子设备
CN111026842B (zh) 自然语言处理方法、自然语言处理装置及智能问答系统
CN108334891B (zh) 一种任务型意图分类方法及装置
CN108932342A (zh) 一种语义匹配的方法、模型的学习方法及服务器
CN117521675A (zh) 基于大语言模型的信息处理方法、装置、设备及存储介质
CN111062217B (zh) 语言信息的处理方法、装置、存储介质及电子设备
CN111241245B (zh) 人机交互处理方法、装置及电子设备
US11677861B2 (en) System and method for interoperable communication between entities with different structures
KR102431568B1 (ko) 엔티티 단어 인식 방법 및 장치
CN111639168A (zh) 一种多轮对话的处理方法、装置、电子设备及存储介质
CN114090755B (zh) 基于知识图谱的回复语句确定方法、装置及电子设备
CN113268609A (zh) 基于知识图谱的对话内容推荐方法、装置、设备及介质
CN110060674A (zh) 表格管理方法、装置、终端和存储介质
CN115617972B (zh) 一种机器人对话方法、装置、电子设备及存储介质
CN110874401A (zh) 信息处理方法、模型训练方法、装置、终端及计算设备
CN113239157B (zh) 对话模型的训练方法、装置、设备和存储介质
CN111651572A (zh) 一种多领域任务型对话系统、方法和终端
CN113988071A (zh) 一种基于金融知识图谱的智能对话方法及装置、电子设备
CN111930912A (zh) 对话管理方法及系统、设备和存储介质
CN115827872A (zh) 一种意图识别模型的训练方法、意图识别方法及装置
CN118132762A (zh) 多智能体的智能检索引擎、人机交互系统和方法
CN117829295A (zh) 基于向量检索和大语言模型的任务型对话方法
Armentano et al. Modeling sequences of user actions for statistical goal recognition
CN117575008A (zh) 训练样本生成方法、模型训练方法、知识问答方法及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210212