CN111026886B

CN111026886B - 一种针对专业场景的多轮对话处理方法

Info

Publication number: CN111026886B
Application number: CN201911362292.2A
Authority: CN
Inventors: 马波涛; 敬龙儿; 朱芝濡; 樊妍睿; 黄梅
Original assignee: Chengdu Aerospace Science And Industry Big Data Research Institute Co ltd
Current assignee: Chengdu Aerospace Science And Industry Big Data Research Institute Co ltd
Priority date: 2019-12-26
Filing date: 2019-12-26
Publication date: 2023-05-02
Anticipated expiration: 2039-12-26
Also published as: CN111026886A

Abstract

本发明涉及人机交互技术领域，其目的在于提供一种针对专业场景的多轮对话处理方法。本发明包括如下步骤：构建知识图谱，知识图谱包括一级节点、二级节点、三级节点和四级节点；基于场景信息实体对应的知识图谱内容生成用于多轮对话的语义槽规则；接收当前问题信息，并识别当前问题信息中的当前多轮对话的场景信息实体；基于当前多轮对话的场景信息实体中的一级节点、二级节点、三级节点和四级节点，在知识图谱内进行子图搜索操作，获取当前场景信息实体对应的知识图谱，然后基于语义槽规则输出引导问答或输出最终的应答回复。本发明解决了结构化数据库数据冗余问题，提升了有效信息检索速度，同时解决单一场景对应单一多轮对话的问题，节约了人力成本。

Description

一种针对专业场景的多轮对话处理方法

技术领域

本发明涉及人机交互技术领域，特别是涉及一种针对专业场景的多轮对话处理方法。

背景技术

现有的多轮对话处理方法主要包括基于规则、检索和生产的方法，在使用现有技术过程中，发明人发现各现有技术中至少存在如下问题：a、基于规则的方法：在基于规则的多轮对话中，需事先定义一组规则模型(如逻辑判断、关键词或词查找或一些更为复杂的分类器)，规则模型基于所设定的规则与从之前对话内容中提取到的信息，对输入问句进行相关评估，并执行相应的操作。这种模式操作较为简单，但对于不同的数据源，其所需要的规则模型往往也不太相同，故其通用性上存在一定的缺陷。b、基于检索的方法：在基于检索的多轮对话中，将当前消息与之前的对话内容作为联合输入，之后一般通过LSTM或RNN结构模型对输入和候选回复进行编码，然后基于所生成的向量进行相似度，最后选择与整个文本最相关的回复语。这种方法能较为准确地进行多轮回复，但其往往需要庞大的语料库和候选回复集，才能保证较好的准确度，而这些数据的收集与标准化需要耗费大量的人力，且在保证精确度的同时又往往会导致回复时延的增大。c、基于生成的方法：在基于生成的多轮对话中，其将当前消息与之前的对话内容作为联合输入，一般先采用RNN或LSTM等层次化结构模型捕捉个体语句以及上下文信息的意义，然后通过encoder-decoder框架算法(如seq2seq)，直接生成相应的回复语句。这种方法不需要事先定义相应的回复文本集，直接生成回复文本，但需要大量的训练数据，模型训练成本较大，并且生成的回复可能与用户期待的回答相去甚远(存在一定的语法错误或回复偏离问题本身)，同时其还存在回复不一致的问题。

发明内容

本发明旨在至少在一定程度上解决上述技术问题，本发明提供了一种针对专业场景的多轮对话处理方法。

本发明采用的技术方案是：

一种针对专业场景的多轮对话处理方法，包括如下步骤：

构建知识图谱，知识图谱包括一级节点、二级节点、三级节点和四级节点；其中，一级节点对应一个专业场景下多轮对话的场景信息实体，二级节点包括各场景信息实体下对应的问题属性，三级节点包括各问题属性下对应的问题实体，四级节点包括各问题实体下对应的应答实体；

基于场景信息实体对应的知识图谱内容生成用于多轮对话的语义槽规则；

接收当前问题信息，并识别当前问题信息中的当前多轮对话的场景信息实体；

基于当前多轮对话的场景信息实体中的一级节点、二级节点、三级节点和四级节点，在知识图谱内进行子图搜索操作，获取当前场景信息实体对应的知识图谱，然后基于语义槽规则输出引导问答或输出最终的应答回复。

优选地，一级节点中包括实体名称、实体ID、实体类别、场景特征向量和语义槽规则五个属性特征；

二级节点中包括实体名称、实体ID和实体类别三个属性特征；

三级节点中包括实体名称、实体ID和实体类别三个属性特征；

四级节点中包括实体名称和实体ID两个属性特征。

进一步优选地，生成用于多轮对话的语义槽规则的具体步骤如下：

锁定一场景信息实体；

获取该场景信息实体下的各问题属性及各问题属性对应的问题实体；

查看是否设定了各问题属性对应的引导问句；

对于设定了引导问句的问题属性，则将设定的引导问句作为默认引导问句；

对于没有设定引导问句的问题属性，则自动生成通用的引导问句；

基于各问题属性、各问题属性对应的问题实体及引导问句，生成语义槽规则。

优选地，识别当前问题信息中的当前多轮对话的场景信息实体，具体步骤如下：

对当前问题信息进行分词操作与实体识别操作，得到当前问题信息中的所有实体信息；

对当前问题信息中的实体信息进行同义词替换操作，形成多个同义实体信息；

基于实体信息与同义实体信息此构建当前场景特征向量；

将当前场景特征向量与知识图谱中的各场景对应的特征向量进行匹配操作，获取当前场景特征向量与知识图谱中的各场景对应的特征向量的匹配评分；

选取知识图谱中评分最高的场景作为当前多轮对话的场景信息实体。

进一步优选地，分词操作采用HanLP分词技术实现。

优选地，进行同义词替换操作后，按照语义槽规则与所得统一的实体信息对语义槽进行更新。

优选地，进行子图搜索操作后，还包括如下步骤：对子图进行初始化操作。

优选地，基于当前多轮对话的场景信息实体节点进行子图搜索操作，获取当前场景信息实体对应的知识图谱，然后基于语义槽规则输出引导问答或输出最终的应答回复中，具体包括以下步骤：

基于当前多轮对话的场景信息实体节点进行子图搜索操作，去除无效节点，获取当前场景的子图；

对子图进行更新，检测更新后的子图中是否存在应答节点；

若更新后的子图不存在应答节点，则回复之前设定的信息未找到时的相关话术，再将子图初始化为当前场景对应的知识图谱；

若更新后的子图中存在应答节点，则再判断应答节点是否只存在一个：

若更新后的子图中只存在一个应答节点，则先判断语义槽是否已补充完整，若语义槽已补充完整，则回复该应答节点内容；若语义槽未补充完整，则先从子图中获取对应的缺失节点信息，再将缺失节点信息与应答节点信息拼接组合后输出最终的应答回复，然后将子图初始化为当前场景对应的知识图谱；

若更新后的子图中存在多个应答节点，则需提取子图中缺失问题类别对应的问题内容节点，并按照所属问题类对问题内容进行规整，再基于这些信息生成相关的引导语与提示信息并输出最终的应答回复。

本发明的有益效果是：

1)知识图谱的设计解决了结构化数据库数据冗余问题，提升了有效信息检索速度；具体地，数据存储采用基于知识图谱的图数据库存储，每一个数据节点都是不同的，避免了专业场景下数据冗余的问题，有效减少了存储资源的损耗，同时配合图数据库的子图搜索方法来不断精简子图，限定搜索范围，有效提升了检索速度，可增强用户体验；

2)解决单一场景对应单一多轮对话的问题，节约了人力成本；具体地，本发明提供了一种针对专业场景下多轮对话的处理方法，其基于专业场景下多轮对话的共性，制定了一套通用的多轮对话处理方法，适用于各种不同专业场景下的多轮对话需求，避免了单一场景需制定特定的多轮对话规则的弊端，有效减少了大量人力成本。

附图说明

图1是本发明的一种针对专业场景的多轮对话处理方法的流程图；

图2是本发明的一种针对专业场景的多轮对话处理方法中知识图谱的存储结构图。

具体实施方式

下面结合附图及具体实施例来对本发明作进一步阐述。在此需要说明的是，对于这些实施例方式的说明虽然是用于帮助理解本发明，但并不构成对本发明的限定。本文公开的特定结构和功能细节仅用于描述本发明的示例实施例。然而，可用很多备选的形式来体现本发明，并且不应当理解为本发明限制在本文阐述的实施例中。

实施例1：

本实施例提供一种针对专业场景的多轮对话处理方法，如图1所示，包括如下步骤：

构建知识图谱，知识图谱包括一级节点、二级节点、三级节点和四级节点；其中，一级节点对应一个专业场景下多轮对话的场景信息实体，二级节点包括各场景信息实体下对应的问题属性，三级节点包括各问题属性下对应的问题实体，四级节点包括各问题实体下对应的应答实体；本实施例中，为充分利用知识图谱对应的图数据库子图搜索的特性来加快检索速度，故采用发散式的数据结构进行数据存储，其中每一个节点称为一个实体，每个实体包含“实体名称”、“实体id”、“实体类别”等多个属性。

具体地，一级节点中包括实体名称、实体ID、实体类别、场景特征向量和语义槽规则五个属性特征；具体地，一级节点至少包含实体名称(即场景名称，如场景A)、实体id(即场景编号，此为知识图谱对应的图数据库自动生成)、实体类别(即实体所属类别，所有场景都对应一个大属性“应用场景(n_scene)”类,即所有场景信息实体的实体类别都为“n_scene”)、场景特征向量(由场景关键词、各问题属性以及其对应权重组成,如“关键词1：权重1，关键词2：权重2，…，关键词k：权重k，问题内容类别1：权重k+1，问题内容类别2：权重k+2，…，问题内容类别n：权重k+n”)和语义槽规则(用于存放场景多轮对话语义槽规则)五个属性特征；

二级节点中包括实体名称、实体ID和实体类别三个属性特征；具体地，总共有n个2级节点，该级节点至少包含实体名称(即问题属性名称，如“问题属性1”)、实体id(即问题属性编号，此为知识图谱对应的图数据库自动生成)、实体类别(问题属性类别，都属于“场景A下问题(n_question)”类，即所有问题属性实体对应实体属性都为“n_question”)三个属性特征；

三级节点中包括实体名称、实体ID和实体类别三个属性特征；具体地，即其包含n组类别的节点，每组类别的节点数由每个问题属性下不同内容的个数决定，每个节点至少包含实体名称(即问题内容，如“内容1.1”)、实体id(即问题内容编号，此为知识图谱对应的图数据库自动生成)、实体类别(问题内容所属类别，如“n_question_1”)三个属性特征；

四级节点中包括实体名称和实体ID两个属性特征。具体地，四级节点总共有m个节点(m为所有应答属性下组合内容的不同条数)，每个节点至少包含实体名称(即应答内容，如“应答属性1：应答1.1&…&应答属性l：应答1.l”)、实体id(应答内容编号，此为知识图谱对应的图数据库自动生成)两个属性特征。基于上述知识存储结构，只需要将结构化的数据稍作转换，就可以得到相应的知识图谱数据。其次，在知识图谱构建完成后，还需要创建相应的同义词库(存放在图数据库或一般结构性数据库中)。

本实施例中的知识图谱的存储结构图如图2所示。

基于场景信息实体对应知识图谱内容与用户预先设定的信息生成用于多轮对话的语义槽规则；多轮对话语义槽即为用于多轮对话时的信息提取基准，其是由各问题属性对应的“问题内容类别”、“问题内容类别编号”、“问题属性名称”和“问题属性引导问句”构成的一个json字符串，其中“引导问句”是指在进行多轮对话时，系统在向用户询问新的问题属性对应内容时，向用户提出的引导性问题，如“请问问题属性1是什么呢？”等。

该步骤中，生成用于多轮对话的语义槽规则的具体步骤如下：

锁定一场景信息实体；

查看是否设定了各问题属性对应的引导问句；对于设定了引导问句的问题属性，则将设定的引导问句作为默认引导问句；对于没有设定引导问句的问题属性，则自动生成通用的引导问句；

具体地，语义槽规则由当前专业场景中包含的所有问题内容所属类别、所有问题属性名称、各问题属性对应的引导问句以及问题序号组成，其中问题序号表示多轮对话中问题的优先级(若不设置，则直接依据用户上传数据表中字段的排列顺序进行赋值)，最后将生成的多轮对话语义槽规则存放到场景节点对应“语义槽规则”属性特征中。

本实施例中，语义槽规则具体如下：{"问题内容类别1":"1_问题属性1名称_引导问句","问题内容类别2":"2_问题属性2名称_引导问句",…,"问题内容类别n":"n_问题属性n名称_引导问句"}。

接收当前问题信息，并识别当前问题信息中的当前多轮对话的场景信息实体；当前用户信息即当前用户通过语音、文字录入等方式输入的问题信息；

该步骤中，识别当前问题信息中的当前多轮对话的场景信息实体，具体步骤如下：

具体地，分词操作采用HanLP分词技术实现。本实施例中，分词操作是基于用户自定义词典并采用最短路分词算法实现的。具体地，在进行分词之前，系统默认已加载到数据库中的各项实体信息(实体名称，实体类别)，并将其以“词”(实体名称)：“词性”(实体类别，若存在一个词对应多个实体类别的情况，则其词性即为“实体类别1&实体类别2&…&实体类别k”)的形式加载到系统中。在进行分词操作后，即可得到相应的词汇信息与对应的词性信息，在提取到相应的“词汇”：“词性”词典后，基于词性分隔符“&”对词性进行分割，即得到“词汇”与其对应的所有“词性”，而定义的词性即为定义的实体类别，即完成了命名实体识别操作。

本发明实施例采用HanLP分词技术对当前问题信息进行分词，其原理是构建一个足够大的包含所有可能出现的词语的词典库，判断待处理的当前问题信息中实体信息对应的字符串是否出现在词典库中，一旦发现则识别出一实体信息，并将该词从当前问题信息中分割出来，直到实体信息被分割完毕。HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。在提供丰富功能的同时，HanLP内部模块坚持低耦合、模型坚持惰性加载、服务坚持静态提供、词典坚持明文发布，使用非常方便，同时自带一些语料处理工具，帮助用户训练自己的语料。但其最大的缺点就是执行的准确率都完全依赖于词典库，需要对词典库进行更新。

对当前问题信息中的实体信息进行同义词替换操作，形成多个同义实体信息；具体地，进行同义词替换操作后，按照语义槽规则与所得统一的实体信息对语义槽对应信息进行更新。

基于实体信息与同义实体信息此构建当前场景特征向量；

基于当前多轮对话的场景信息实体中的一级节点、二级节点、三级节点和四级节点，在知识图谱内进行子图搜索操作，获取当前场景信息实体对应的知识图谱，然后基于语义槽规则输出引导问答或输出最终的应答回复。本实施例中，进行子图搜索操作后，还包括如下步骤：对子图进行初始化操作。

本步骤中，基于当前多轮对话的场景信息实体节点进行子图搜索操作，获取当前场景信息实体对应的知识图谱，然后基于语义槽规则输出引导问答或输出最终的应答回复中，具体包括以下步骤：

对子图进行更新，检测更新后的子图中是否存在应答节点；

若更新后的子图中只存在一个应答节点，则先判断语义槽是否已补充完整，若语义槽已补充完整，则回复该应答节点内容；若语义槽未补充完整，则先从子图中获取对应的缺失节点信息，再将缺失节点信息与应答节点信息拼接组合后输出最终的应答回复给用户，然后将子图初始化为当前场景对应的知识图谱；

若更新后的子图中存在多个应答节点，则需提取子图中缺失问题类别对应的问题内容节点，并按照所属问题类对问题内容进行规整，再基于这些信息生成相关的引导语与提示信息并输出最终的应答回复给用户。

本实施例的有益效果如下：

1)知识图谱的设计解决了结构化数据库数据冗余问题，提升了有效信息检索速度；具体地，数据存储采用基于知识图谱的图数据库存储，每一个数据节点都是不同的，避免了专业场景下数据冗余的问题，有效减少了存储资源的损耗，同时配合图数据库的子图搜索方法来不断精简子图，限定搜索范围，有效提升了检索速度，可增强用户体验。

2)解决单一场景对应单一多轮对话的问题，节约了人力成本；具体地，本实施例提供了一种针对专业场景下多轮对话的处理方法，其基于专业场景下多轮对话的共性，制定了一套通用的多轮对话处理方法，适用于各种不同专业场景下的多轮对话需求，避免了单一场景需制定特定的多轮对话规则的弊端，有效减少了大量人力成本。

以上所描述的多个实施例仅仅是示意性的，若涉及到作为分离部件说明的单元，其可以是或者也可以不是物理上分开的；若涉及到作为单元显示的部件，其可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换。而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

最后应说明的是，本发明不局限于上述可选的实施方式，任何人在本发明的启示下都可得出其他各种形式的产品。上述具体实施方式不应理解成对本发明的保护范围的限制，本发明的保护范围应当以权利要求书中界定的为准，并且说明书可以用于解释权利要求书。

Claims

1.一种针对专业场景的多轮对话处理方法，其特征在于：包括如下步骤：

基于当前多轮对话的场景信息实体中的一级节点、二级节点、三级节点和四级节点，在知识图谱内进行子图搜索操作，获取当前场景信息实体对应的知识图谱，然后基于语义槽规则输出引导问答或输出最终的应答回复；

一级节点中包括实体名称、实体ID、实体类别、场景特征向量和语义槽规则五个属性特征；

四级节点中包括实体名称和实体ID两个属性特征。

2.根据权利要求1所述的一种针对专业场景的多轮对话处理方法，其特征在于：生成用于多轮对话的语义槽规则的具体步骤如下：

锁定一场景信息实体；

查看是否设定了各问题属性对应的引导问句；

3.根据权利要求1所述的一种针对专业场景的多轮对话处理方法，其特征在于：识别当前问题信息中的当前多轮对话的场景信息实体，具体步骤如下：

基于实体信息与同义实体信息此构建当前场景特征向量；

4.根据权利要求3所述的一种针对专业场景的多轮对话处理方法，其特征在于：分词操作采用HanLP分词技术实现。

5.根据权利要求3所述的一种针对专业场景的多轮对话处理方法，其特征在于：进行同义词替换操作后，按照语义槽规则与所得统一的实体信息对语义槽进行更新。

6.根据权利要求1所述的一种针对专业场景的多轮对话处理方法，其特征在于：进行子图搜索操作后，还包括如下步骤：对子图进行初始化操作。

7.根据权利要求1所述的一种针对专业场景的多轮对话处理方法，其特征在于：基于当前多轮对话的场景信息实体节点进行子图搜索操作，获取当前场景信息实体对应的知识图谱，然后基于语义槽规则输出引导问答或输出最终的应答回复中，具体包括以下步骤：

对子图进行更新，检测更新后的子图中是否存在应答节点；