CN109614468A

CN109614468A - 一种自然语言对话系统知识数据调度方法

Info

Publication number: CN109614468A
Application number: CN201811453855.4A
Authority: CN
Inventors: 朱锦雷; 申冲; 张传锋; 王太浩
Original assignee: Synthesis Electronic Technology Co Ltd
Current assignee: Synthesis Electronic Technology Co Ltd
Priority date: 2018-11-30
Filing date: 2018-11-30
Publication date: 2019-04-12

Abstract

本发明公开一种自然语言对话系统知识数据调度方法，适合于特定行业知识数据下，通过本方法对数据进行结构化管理与调度，实现特定场景下的上下文关联交互。由于上下文状态可以被所属意图集合节点及同级意图集合节点共用，调度方法考虑到了场景内问题的关联鲁棒性，可以实现较好人机对话体验。该技术适于金融、税务、医疗等行业人机对话设备使用，如服务机器人、智能自助终端等。

Description

一种自然语言对话系统知识数据调度方法

技术领域

本发明涉及一种自然语言对话系统知识数据调度方法，属于人工智能、自然语言理解与服务机器人领域。

背景技术

近些年，自然语言理解与对话技术普遍兴起。如何在多轮会话中，取得比较好的客户体验是业界研究的热点。一个完整的人机对话系统涉及到的技术极为广泛，例如计算机科学中的语音技术，自然语言处理，机器学习，规划与推理，知识工程，甚至语言学和认知科学中的许多理论在人机对话中都有所应用。笼统的讲，人机对话可以分为以下四个子问题：自然语言聊天、任务驱动的多轮对话、问答和推荐。

本发明重点解决的是，任务驱动的多轮对话上下文状态存储与调度问题，提出一种自然语言对话系统知识数据调度方法，解决行业应用中特定会话场景下的交互问题，如金融行业关于理财、贷款、存款等多轮问答交互。

发明内容

本发明要解决的技术问题是提供一种自然语言对话系统知识数据调度方法，根据自然语言对话上下文内容关联的特点，基于多维树形网络构建具有语境关联特性的知识数据结构，对话系统根据该结构进行客户期望调度，形成良好的对话体验。

一种自然语言对话系统知识数据调度方法，包括以下步骤：S01）、构建自然语言对话系统知识数据结构，知识数据结构包括一个根节点以及隶属于根节点的多个子节点，每个子节点下又分成多个孙子节点和槽集合，槽集合内为状态变量集合，子节点和孙子节点内为意图集合，孙子节点共享使用同级槽集合内的状态变量，子节点也引用其下属槽集合内的状态变量；S02）、根据对话系统的用户输入调度数据结构，用户输入通过根节点后进行意图集合判断分配，得到问题分词与各子节点之间的匹配度，若匹配度大于设定的阈值则进入子节点，进入子节点以后进行子空间状态变量处理。

进一步的，进入子节点以后如果仍有用户输入，则进行情景上下文关联，首先在该子节点下属的意图集合中寻找与用户输入匹配的孙子节点，寻找过程中，孙子节点的意图集合引用或者更新同级槽集合中的变量值，当客户问题缺省上下文时，子节点引用其下属槽集合中的变量值，如果匹配成功，则进入匹配成功的孙子节点，否则返回上级节点，在上级节点下属的意图集合中寻找匹配的节点，如果上级节点是根节点则结束。

进一步的，子空间状态变量处理的过程为：子节点下属的变量实体与各问题分词进行等价匹配，填充相应的状态变量值，子节点对提取问题中的实体词，将状态更新到槽集合中。

进一步的，等价匹配包括同义词匹配和/或规则描述匹配。

进一步的，意图集合判断分配的过程为：在根节点下属子节点的意图集合范围内，通过重叠分词权重相加或者决策树分类机制计算问题分词与各集合节点分词之间的加权重叠关系，得到匹配度。

进一步的，用户输入通过根节点前首先对用户输入的客户问题进行分词，然后根据系统词库做等价词义转换，最后对根节点进行意图比对判断，大于设定的阈值则透传通过根节点。

进一步的，根节点为虚拟节点，问题分词直接透传通过根节点。

本发明的有益效果：本自然语言对话系统知识数据调度方法适合于特定行业知识数据下，通过本方法对数据进行结构化管理与调度，实现特定场景下的上下文关联交互。由于上下文状态可以被所属意图集合节点及同级意图集合节点共用，调度方法考虑到了场景内问题的关联鲁棒性，可以实现较好人机对话体验。该技术适于金融、税务、医疗等行业人机对话设备使用，如服务机器人、智能自助终端等。

附图说明

图1为自然语言对话系统知识数据结构的原理框图；

图2为知识数据调度方法的流程图。

具体实施方式

下面结合附图和具体实施例对本发明作进一步的说明。

实施例1

本实施例公开一种自然语言对话系统知识数据调度方法，包括以下步骤：

S01）、构建自然语言对话系统知识数据结构，

如图1所示，知识数据结构为树形网络数据结构，包括一个根节点以及隶属于根节点的多个子节点，每个子节点下又分成多个孙子节点和槽集合，槽集合内为状态变量集合，子节点和孙子节点内为意图集合，每个子节点下属的孙子节点共享使用槽集合内的状态变量，子节点也可以引用其下属槽集合内的状态变量；

S02）、根据对话系统的用户输入调度数据结构，用户输入经过问题分词与根节点处理后进行意图集合判断分配，得到问题分词与子节点之间的匹配度，若匹配度大于设定的阈值则进入子节点，进入子节点以后进行子空间状态变量处理。

如图2所示，知识数据调度的具体流程为：

S21）、对用户输入的客户问题进行分词处理，然后根据系统词库做等价词义转换；

S22）、根节点处理，问题分词首先通过根节点进行意图比对判断，本实施汇总，根节点为虚拟节点，问题分词会直接透传通过该节点；

S23）、意图集合判断分配，在同一子节点直接所属的意图集合节点范围内，计算问题分词与各集合节点分词之间的加权重叠关系，可通过重叠分词权重简单相加或者决策树分类机制计算加权重叠关系，得到匹配度，如果匹配度达到一定的阈值，则进入该子节点，否则返回上一级节点；

S24）、子空间状态变量处理，统一子节点下属的变量实体与各问题分词进行等价匹配，等价匹配包括同义词匹配或者规则描述匹配，填充相应的状态变量值，子节点对提取问题中的实体词，将状态更新到槽集合中；

S25）、情景上下文关联，当客户继续问问题，则进行情景上下文关联，首先在该子节点下属的意图集合中寻找匹配的节点，其下属意图集合可以引用/更新其父节点下的槽集合中的变量值；当客户问题缺省上下文时，子节点也可以引用槽集合中已存在的变量值；如果匹配成功，进入该意图集合子节点，否则返回上一级节点；

S26）、本级空间无效返回，当本节点没有匹配的意图集合时，应切换至上级节点，寻找其下属的意图集合节点，如果上级节点为根节点则视为结束，不提供有效答案。

本实施例中，子节点和孙子节点内是意图集合，意图是指客户问题的分类类别，用于将同一问题不同形式的表达用统一的符合表示，意图集合指由一个或多个意图构成的集合，集合意图作为树形网络节点。同一子节点直接所属的意图集合节点是对等切换关系，它们共享使用槽集合内的状态数据。槽集合节点，指存储上下文状态的变量集合，该变量值来自客户说话的内容，如“今天天气怎么样”中的“今天”可以视为变量值。

本发明根据自然语言对话上下文内容关联的特点，基于多维树形网络构建具有语境关联特性的知识数据结构，对话系统根据该结构进行客户期望调度，形成良好的对话体验。

以上描述的仅是本发明的基本原理和优选实施例，本领域技术人员根据本发明做出的改进和替换，属于本发明的保护范围。

Claims

1.一种自然语言对话系统知识数据调度方法，其特征在于：包括以下步骤：S01）、构建自然语言对话系统知识数据结构，知识数据结构包括一个根节点以及隶属于根节点的多个子节点，每个子节点下又分成多个孙子节点和槽集合，槽集合内为状态变量集合，子节点和孙子节点内为意图集合，孙子节点共享使用同级槽集合内的状态变量，子节点也引用其下属槽集合内的状态变量；S02）、根据对话系统的用户输入调度数据结构，用户输入通过根节点后进行意图集合判断分配，得到问题分词与各子节点之间的匹配度，若匹配度大于设定的阈值则进入子节点，进入子节点以后进行子空间状态变量处理。

2.根据权利要求1所述的自然语言对话系统知识数据调度方法，其特征在于：进入子节点以后如果仍有用户输入，则进行情景上下文关联，首先在该子节点下属的意图集合中寻找与用户输入匹配的孙子节点，寻找过程中，孙子节点的意图集合引用或者更新同级槽集合中的变量值，当客户问题缺省上下文时，子节点引用其下属槽集合中的变量值，如果匹配成功，则进入匹配成功的孙子节点，否则返回上级节点，在上级节点下属的意图集合中寻找匹配的节点，如果上级节点是根节点则结束。

3.根据权利要求1所述的自然语言对话系统知识数据调度方法，其特征在于：子空间状态变量处理的过程为：子节点下属的变量实体与各问题分词进行等价匹配，填充相应的状态变量值，子节点对提取问题中的实体词，将状态更新到槽集合中。

4.根据权利要求3所述的自然语言对话系统知识数据调度方法，其特征在于：等价匹配包括同义词匹配和/或规则描述匹配。

5.根据权利要求1所述的自然语言对话系统知识数据调度方法，其特征在于：意图集合判断分配的过程为：在根节点下属子节点的意图集合范围内，通过重叠分词权重相加或者决策树分类机制计算问题分词与各集合节点分词之间的加权重叠关系，得到匹配度。

6.根据权利要求1所述的自然预燃对话系统知识数据调度方法，其特征在于：用户输入通过根节点前首先对用户输入的客户问题进行分词，然后根据系统词库做等价词义转换，最后对根节点进行意图比对判断，大于设定的阈值则透传通过根节点。

7.根据权利要求1或6所述的自然语言对话系统知识数据调度方法，其特征在于：根节点为虚拟节点，问题分词直接透传通过根节点。