CN109614468A - 一种自然语言对话系统知识数据调度方法 - Google Patents
一种自然语言对话系统知识数据调度方法 Download PDFInfo
- Publication number
- CN109614468A CN109614468A CN201811453855.4A CN201811453855A CN109614468A CN 109614468 A CN109614468 A CN 109614468A CN 201811453855 A CN201811453855 A CN 201811453855A CN 109614468 A CN109614468 A CN 109614468A
- Authority
- CN
- China
- Prior art keywords
- node
- knowledge data
- natural language
- child node
- dispatching method
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
本发明公开一种自然语言对话系统知识数据调度方法,适合于特定行业知识数据下,通过本方法对数据进行结构化管理与调度,实现特定场景下的上下文关联交互。由于上下文状态可以被所属意图集合节点及同级意图集合节点共用,调度方法考虑到了场景内问题的关联鲁棒性,可以实现较好人机对话体验。该技术适于金融、税务、医疗等行业人机对话设备使用,如服务机器人、智能自助终端等。
Description
技术领域
本发明涉及一种自然语言对话系统知识数据调度方法,属于人工智能、自然语言理解与服务机器人领域。
背景技术
近些年,自然语言理解与对话技术普遍兴起。如何在多轮会话中,取得比较好的客户体验是业界研究的热点。一个完整的人机对话系统涉及到的技术极为广泛,例如计算机科学中的语音技术,自然语言处理,机器学习,规划与推理,知识工程,甚至语言学和认知科学中的许多理论在人机对话中都有所应用。笼统的讲,人机对话可以分为以下四个子问题:自然语言聊天、任务驱动的多轮对话、问答和推荐。
本发明重点解决的是,任务驱动的多轮对话上下文状态存储与调度问题,提出一种自然语言对话系统知识数据调度方法,解决行业应用中特定会话场景下的交互问题,如金融行业关于理财、贷款、存款等多轮问答交互。
发明内容
本发明要解决的技术问题是提供一种自然语言对话系统知识数据调度方法,根据自然语言对话上下文内容关联的特点,基于多维树形网络构建具有语境关联特性的知识数据结构,对话系统根据该结构进行客户期望调度,形成良好的对话体验。
一种自然语言对话系统知识数据调度方法,包括以下步骤:S01)、构建自然语言对话系统知识数据结构,知识数据结构包括一个根节点以及隶属于根节点的多个子节点,每个子节点下又分成多个孙子节点和槽集合,槽集合内为状态变量集合,子节点和孙子节点内为意图集合,孙子节点共享使用同级槽集合内的状态变量,子节点也引用其下属槽集合内的状态变量;S02)、根据对话系统的用户输入调度数据结构,用户输入通过根节点后进行意图集合判断分配,得到问题分词与各子节点之间的匹配度,若匹配度大于设定的阈值则进入子节点,进入子节点以后进行子空间状态变量处理。
进一步的,进入子节点以后如果仍有用户输入,则进行情景上下文关联,首先在该子节点下属的意图集合中寻找与用户输入匹配的孙子节点,寻找过程中,孙子节点的意图集合引用或者更新同级槽集合中的变量值,当客户问题缺省上下文时,子节点引用其下属槽集合中的变量值,如果匹配成功,则进入匹配成功的孙子节点,否则返回上级节点,在上级节点下属的意图集合中寻找匹配的节点,如果上级节点是根节点则结束。
进一步的,子空间状态变量处理的过程为:子节点下属的变量实体与各问题分词进行等价匹配,填充相应的状态变量值,子节点对提取问题中的实体词,将状态更新到槽集合中。
进一步的,等价匹配包括同义词匹配和/或规则描述匹配。
进一步的,意图集合判断分配的过程为:在根节点下属子节点的意图集合范围内,通过重叠分词权重相加或者决策树分类机制计算问题分词与各集合节点分词之间的加权重叠关系,得到匹配度。
进一步的,用户输入通过根节点前首先对用户输入的客户问题进行分词,然后根据系统词库做等价词义转换,最后对根节点进行意图比对判断,大于设定的阈值则透传通过根节点。
进一步的,根节点为虚拟节点,问题分词直接透传通过根节点。
本发明的有益效果:本自然语言对话系统知识数据调度方法适合于特定行业知识数据下,通过本方法对数据进行结构化管理与调度,实现特定场景下的上下文关联交互。由于上下文状态可以被所属意图集合节点及同级意图集合节点共用,调度方法考虑到了场景内问题的关联鲁棒性,可以实现较好人机对话体验。该技术适于金融、税务、医疗等行业人机对话设备使用,如服务机器人、智能自助终端等。
附图说明
图1为自然语言对话系统知识数据结构的原理框图;
图2为知识数据调度方法的流程图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步的说明。
实施例1
本实施例公开一种自然语言对话系统知识数据调度方法,包括以下步骤:
S01)、构建自然语言对话系统知识数据结构,
如图1所示,知识数据结构为树形网络数据结构,包括一个根节点以及隶属于根节点的多个子节点,每个子节点下又分成多个孙子节点和槽集合,槽集合内为状态变量集合,子节点和孙子节点内为意图集合,每个子节点下属的孙子节点共享使用槽集合内的状态变量,子节点也可以引用其下属槽集合内的状态变量;
S02)、根据对话系统的用户输入调度数据结构,用户输入经过问题分词与根节点处理后进行意图集合判断分配,得到问题分词与子节点之间的匹配度,若匹配度大于设定的阈值则进入子节点,进入子节点以后进行子空间状态变量处理。
如图2所示,知识数据调度的具体流程为:
S21)、对用户输入的客户问题进行分词处理,然后根据系统词库做等价词义转换;
S22)、根节点处理,问题分词首先通过根节点进行意图比对判断,本实施汇总,根节点为虚拟节点,问题分词会直接透传通过该节点;
S23)、意图集合判断分配,在同一子节点直接所属的意图集合节点范围内,计算问题分词与各集合节点分词之间的加权重叠关系,可通过重叠分词权重简单相加或者决策树分类机制计算加权重叠关系,得到匹配度,如果匹配度达到一定的阈值,则进入该子节点,否则返回上一级节点;
S24)、子空间状态变量处理,统一子节点下属的变量实体与各问题分词进行等价匹配,等价匹配包括同义词匹配或者规则描述匹配,填充相应的状态变量值,子节点对提取问题中的实体词,将状态更新到槽集合中;
S25)、情景上下文关联,当客户继续问问题,则进行情景上下文关联,首先在该子节点下属的意图集合中寻找匹配的节点,其下属意图集合可以引用/更新其父节点下的槽集合中的变量值;当客户问题缺省上下文时,子节点也可以引用槽集合中已存在的变量值;如果匹配成功,进入该意图集合子节点,否则返回上一级节点;
S26)、本级空间无效返回,当本节点没有匹配的意图集合时,应切换至上级节点,寻找其下属的意图集合节点,如果上级节点为根节点则视为结束,不提供有效答案。
本实施例中,子节点和孙子节点内是意图集合,意图是指客户问题的分类类别,用于将同一问题不同形式的表达用统一的符合表示,意图集合指由一个或多个意图构成的集合,集合意图作为树形网络节点。同一子节点直接所属的意图集合节点是对等切换关系,它们共享使用槽集合内的状态数据。槽集合节点,指存储上下文状态的变量集合,该变量值来自客户说话的内容,如“今天天气怎么样”中的“今天”可以视为变量值。
本发明根据自然语言对话上下文内容关联的特点,基于多维树形网络构建具有语境关联特性的知识数据结构,对话系统根据该结构进行客户期望调度,形成良好的对话体验。
以上描述的仅是本发明的基本原理和优选实施例,本领域技术人员根据本发明做出的改进和替换,属于本发明的保护范围。
Claims (7)
1.一种自然语言对话系统知识数据调度方法,其特征在于:包括以下步骤:S01)、构建自然语言对话系统知识数据结构,知识数据结构包括一个根节点以及隶属于根节点的多个子节点,每个子节点下又分成多个孙子节点和槽集合,槽集合内为状态变量集合,子节点和孙子节点内为意图集合,孙子节点共享使用同级槽集合内的状态变量,子节点也引用其下属槽集合内的状态变量;S02)、根据对话系统的用户输入调度数据结构,用户输入通过根节点后进行意图集合判断分配,得到问题分词与各子节点之间的匹配度,若匹配度大于设定的阈值则进入子节点,进入子节点以后进行子空间状态变量处理。
2.根据权利要求1所述的自然语言对话系统知识数据调度方法,其特征在于:进入子节点以后如果仍有用户输入,则进行情景上下文关联,首先在该子节点下属的意图集合中寻找与用户输入匹配的孙子节点,寻找过程中,孙子节点的意图集合引用或者更新同级槽集合中的变量值,当客户问题缺省上下文时,子节点引用其下属槽集合中的变量值,如果匹配成功,则进入匹配成功的孙子节点,否则返回上级节点,在上级节点下属的意图集合中寻找匹配的节点,如果上级节点是根节点则结束。
3.根据权利要求1所述的自然语言对话系统知识数据调度方法,其特征在于:子空间状态变量处理的过程为:子节点下属的变量实体与各问题分词进行等价匹配,填充相应的状态变量值,子节点对提取问题中的实体词,将状态更新到槽集合中。
4.根据权利要求3所述的自然语言对话系统知识数据调度方法,其特征在于:等价匹配包括同义词匹配和/或规则描述匹配。
5.根据权利要求1所述的自然语言对话系统知识数据调度方法,其特征在于:意图集合判断分配的过程为:在根节点下属子节点的意图集合范围内,通过重叠分词权重相加或者决策树分类机制计算问题分词与各集合节点分词之间的加权重叠关系,得到匹配度。
6.根据权利要求1所述的自然预燃对话系统知识数据调度方法,其特征在于:用户输入通过根节点前首先对用户输入的客户问题进行分词,然后根据系统词库做等价词义转换,最后对根节点进行意图比对判断,大于设定的阈值则透传通过根节点。
7.根据权利要求1或6所述的自然语言对话系统知识数据调度方法,其特征在于:根节点为虚拟节点,问题分词直接透传通过根节点。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811453855.4A CN109614468A (zh) | 2018-11-30 | 2018-11-30 | 一种自然语言对话系统知识数据调度方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811453855.4A CN109614468A (zh) | 2018-11-30 | 2018-11-30 | 一种自然语言对话系统知识数据调度方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109614468A true CN109614468A (zh) | 2019-04-12 |
Family
ID=66006545
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811453855.4A Pending CN109614468A (zh) | 2018-11-30 | 2018-11-30 | 一种自然语言对话系统知识数据调度方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109614468A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104360897A (zh) * | 2014-10-29 | 2015-02-18 | 百度在线网络技术(北京)有限公司 | 对话处理方法和对话管理系统 |
US20170118336A1 (en) * | 2015-10-21 | 2017-04-27 | Genesys Telecommunications Laboratories, Inc. | Dialogue flow optimization and personalization |
CN107169034A (zh) * | 2017-04-19 | 2017-09-15 | 畅捷通信息技术股份有限公司 | 一种多轮人机交互的方法及系统 |
CN108446322A (zh) * | 2018-02-10 | 2018-08-24 | 灯塔财经信息有限公司 | 一种智能问答系统的实现方法和装置 |
-
2018
- 2018-11-30 CN CN201811453855.4A patent/CN109614468A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104360897A (zh) * | 2014-10-29 | 2015-02-18 | 百度在线网络技术(北京)有限公司 | 对话处理方法和对话管理系统 |
US20170118336A1 (en) * | 2015-10-21 | 2017-04-27 | Genesys Telecommunications Laboratories, Inc. | Dialogue flow optimization and personalization |
CN107169034A (zh) * | 2017-04-19 | 2017-09-15 | 畅捷通信息技术股份有限公司 | 一种多轮人机交互的方法及系统 |
CN108446322A (zh) * | 2018-02-10 | 2018-08-24 | 灯塔财经信息有限公司 | 一种智能问答系统的实现方法和装置 |
Non-Patent Citations (1)
Title |
---|
杜晓宇: "基于LSTM的对话状态追踪模型研究与实现", 《中国优秀硕士学位论文全文数据库信息科技辑》 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107357838B (zh) | 基于多任务学习的对话策略在线实现方法 | |
CN109658928B (zh) | 一种家庭服务机器人云端多模态对话方法、装置及系统 | |
CN110704641B (zh) | 一种万级意图分类方法、装置、存储介质及电子设备 | |
CN112487173B (zh) | 人机对话方法、设备和存储介质 | |
CN113962315A (zh) | 模型预训练方法、装置、设备、存储介质以及程序产品 | |
CN111191450B (zh) | 语料清洗方法、语料录入设备及计算机可读存储介质 | |
CN112214604A (zh) | 文本分类模型的训练方法、文本分类方法、装置及设备 | |
CN117077791B (zh) | 一种基于图数据结构的模型推理方法、装置、设备及介质 | |
CN109829036A (zh) | 一种对话管理方法及相关装置 | |
CN110019688A (zh) | 对机器人进行训练的方法 | |
Chen et al. | Policy adaptation for deep reinforcement learning-based dialogue management | |
CN115309877A (zh) | 对话生成方法、对话模型训练方法及装置 | |
CN114548110A (zh) | 语义理解方法、装置、电子设备及存储介质 | |
CN114091472B (zh) | 多标签分类模型的训练方法 | |
CN111651572A (zh) | 一种多领域任务型对话系统、方法和终端 | |
CN110059166A (zh) | 自然智能的自然表达处理方法、回应方法、设备及系统 | |
CN110046232A (zh) | 自然智能的自然表达处理方法、回应方法、设备及系统 | |
CN112786108A (zh) | 分子理解模型的训练方法、装置、设备和介质 | |
CN113641805A (zh) | 结构化问答模型的获取方法、问答方法及对应装置 | |
CN110442693B (zh) | 基于人工智能的回复消息生成方法、装置、服务器及介质 | |
CN115062617A (zh) | 基于提示学习的任务处理方法、装置、设备及介质 | |
CN109614468A (zh) | 一种自然语言对话系统知识数据调度方法 | |
CN115599918B (zh) | 一种基于图增强的互学习文本分类方法及系统 | |
CN116402057A (zh) | 一种基于自然语言的人机交互系统 | |
CN112530415B (zh) | 负向回复识别模型获取及负向回复识别方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20190412 |
|
WD01 | Invention patent application deemed withdrawn after publication |