CN111324704A

CN111324704A - 话术知识库构建的方法、装置和客服机器人

Info

Publication number: CN111324704A
Application number: CN201811535761.1A
Authority: CN
Inventors: 林君; 宋凯嵩; 孙常龙; 刘晓钟
Original assignee: Alibaba Group Holding Ltd
Current assignee: Alibaba Group Holding Ltd
Priority date: 2018-12-14
Filing date: 2018-12-14
Publication date: 2020-06-23
Anticipated expiration: 2038-12-14
Also published as: CN111324704B

Abstract

本发明公开了一种话术知识库构建的方法、装置和客服机器人。其中，该方法包括：将获取的对话文本进行结构化，得到第一对象对话结构化类别和第二对象对话结构化类别；获取基于第一对象对话结构化类别和第二对象对话结构化类别生成的对话模式；对对话模式进行筛选，存储筛选后的对话模式。本发明解决了由于相关技术中存在的知识库的更迭需要持续人工维护，导致的维护成本高的技术问题。

Description

话术知识库构建的方法、装置和客服机器人

技术领域

本发明涉及互联网技术领域，具体而言，涉及一种话术知识库构建的方法、装置和客服机器人。

背景技术

基于电商平台上的业务咨询,特别是用户基于商品详情发出的提问,或基于电商平台所提供服务发出的提问,目前普遍是基于人工在线回复,或人工依据预先设置好的答复模板通过设置的客服机器人进行回复，耗费大量人工成本。

相关技术中根据预先设置好的答复模板通过客服机器人进行答复普遍需要构建知识库，而相关技术中知识库构建完全依赖人工或者通过挖掘高频的客户消息辅助人工，初期的人工成本非常高，并且由于知识需要迭代更新，因此需要持续投入人工维护。

针对上述由于相关技术中存在的知识库的更迭需要持续人工维护，导致的维护成本高的问题，目前尚未提出有效的解决方案。

发明内容

本发明实施例提供了一种话术知识库构建的方法、装置和客服机器人，以至少解决由于相关技术中存在的知识库的更迭需要持续人工维护，导致的维护成本高的技术问题。

根据本发明实施例的一个方面，提供了一种话术知识库构建的方法，包括：将对话文本进行结构化处理，得到第一对象对话结构化类别和第二对象对话结构化类别；获取基于第一对象对话结构化类别和第二对象对话结构化类别生成的至少一种对话模式；对至少一种对话模式进行筛选，存储筛选后的对话模式。

可选的，将对话文本进行结构化处理，得到第一对象对话结构化类别和第二对象对话结构化类别包括：将参与对话文本中的对话对象进行划分，得到第一对象和第二对象；依据第一对象和第二对象，对对话文本中的对话内容进行分类，得到第一对象对话内容和第二对象对话内容；分别对第一对象对话内容和第二对象对话内容中的对话内容进行标记，得到结构化的对话文本；依据第一对象和第二对象对结构化的对话文本进行分类，得到第一对象对话结构化类别和第二对象对话结构化类别。

可选的，获取基于第一对象对话结构化类别和第二对象对话结构化类别生成的至少一种对话模式包括：依据第一对象对话结构化类别和第二对象对话结构化类别将对话文本转换为结构化符号序列；对结构化符号序列进行降噪，得到降噪后的结构化符号序列；采用正则表达式对降噪后的结构化符号序列进行知识抽取，得到对话模式。

进一步地,可选的，采用正则表达式对降噪后的结构化符号序列进行知识抽取，得到对话模式包括：将抽取出的知识依据第一预设筛选条件和第二预设筛选条件进行筛选，得到符合第一预设筛选条件和第二预设筛选条件的知识；依据预设映射规则对符合第一预设筛选条件和第二预设筛选条件的知识进行分类，得到对话模式。

可选的，对至少一种对话模式进行筛选，存储筛选后的对话模式包括：去除所有对话模式中的重复项；保存相似度大于预设值的对话模式；存储对话模式。

进一步地,可选的，存储对话模式包括：将对话模式应用于在线答复系统。

根据本发明实施例的另一方面，还提供了一种话术知识库构建的装置，包括：第一获取模块，用于将对话文本进行结构化处理，得到第一对象对话结构化类别和第二对象对话结构化类别；第二获取模块，用于获取基于第一对象对话结构化类别和第二对象对话结构化类别生成的至少一种对话模式；筛选模块，用于对至少一种对话模式进行筛选，存储筛选后的对话模式。

可选的，第一获取模块包括：划分单元，用于将参与对话文本中的对话对象进行划分，得到第一对象和第二对象；分类单元，用于依据第一对象和第二对象，对对话文本中的对话内容进行分类，得到第一对象对话内容和第二对象对话内容；标记单元，用于分别对第一对象对话内容和第二对象对话内容中的对话内容进行标记，得到结构化的对话文本；第一获取单元，用于依据第一对象和第二对象对结构化的对话文本进行分类，得到第一对象对话结构化类别和第二对象对话结构化类别。

可选的，第二获取模块包括：转换单元，用于依据第一对象对话结构化类别和第二对象对话结构化类别将对话文本转换为结构化符号序列；降噪单元，用于对结构化符号序列进行降噪，得到降噪后的结构化符号序列；第二获取单元，用于采用正则表达式对降噪后的结构化符号序列进行知识抽取，得到对话模式。

进一步地，可选的，第二获取单元包括：筛选子单元，用于将抽取出的知识依据第一预设筛选条件和第二预设筛选条件进行筛选，得到符合第一预设筛选条件和第二预设筛选条件的知识；获取子单元，用于依据预设映射规则对符合第一预设筛选条件和第二预设筛选条件的知识进行分类，得到对话模式。

可选的，话术知识库构建的装置应用于在线答复系统。

根据本发明实施例的又一方面，还提供了一种客服机器人，包括：话术知识库，其中，话术知识库将对话文本进行结构化处理，得到第一对象对话结构化类别和第二对象对话结构化类别；获取基于第一对象对话结构化类别和第二对象对话结构化类别生成的至少一种对话模式；对至少一种对话模式进行筛选，存储筛选后的对话模式。

根据本发明实施例的再一方面，还提供了一种存储介质，存储介质包括存储的程序，其中，在程序运行时控制存储介质所在设备执行：将对话文本进行结构化处理，得到第一对象对话结构化类别和第二对象对话结构化类别；获取基于第一对象对话结构化类别和第二对象对话结构化类别生成的至少一种对话模式；对至少一种对话模式进行筛选，存储筛选后的对话模式。

在本发明实施例中，采用系统自动从客服客户原始对话数据中挖掘生成“客户问题-客服回答”格式的知识的方式，通过将对话文本进行结构化处理，得到第一对象对话结构化类别和第二对象对话结构化类别；获取基于第一对象对话结构化类别和第二对象对话结构化类别生成的至少一种对话模式；对至少一种对话模式进行筛选，存储筛选后的对话模式，达到了只需要初期标注一批训练数据，就不再需要人工投入的目的，从而实现了客服话术知识库自动构建方法完全自动化的技术效果，进而解决了由于相关技术中存在的知识库的更迭需要持续人工维护，导致的维护成本高的技术问题。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1是本发明实施例的一种话术知识库构建的方法的计算机终端的硬件结构框图；

图2是根据本发明实施例一的话术知识库构建的方法的流程图；

图3a是根据本发明实施例一的话术知识库构建的方法中客服与客户之间的聊天对话示意图；

图3b是根据本发明实施例一的话术知识库构建的方法中客服与客户之间的聊天对话通过对话结构化模型后的示意图；

图4是根据本发明实施例一的话术知识库构建的方法中对话结构化模型的示意图；

图5a是根据本发明实施例一的话术知识库构建的方法中对话结构化符号序列wwHBDra的示意图；

图5b是根据本发明实施例一的话术知识库构建的方法中对话结构化序列降噪的示意图；

图6是根据本发明实施例一的话术知识库构建的方法中应用于实例场景中的示意图；

图7是根据本发明实施例一的话术知识库构建的方法中的执行流程示意图；

图8是根据本发明实施例二的话术知识库构建的装置的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分的实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。

需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

本申请涉及的技术名词:

对话结构化：预定义好一个对话结构化分类体系，用自然语言处理技术等将客服-客户对话中的每一条消息归类到其中一个类；

话术知识库：存储“客户问-客服答”等固定格式客服话术的知识库。

实施例1

根据本发明实施例，还提供了一种话术知识库构建的方法实施例，需要说明的是，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

本申请实施例一所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。以运行在计算机终端上为例，图1是本发明实施例的一种话术知识库构建的方法的计算机终端的硬件结构框图。如图1所示，计算机终端10可以包括一个或多个(图中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器104、以及用于通信功能的传输模块106。本领域普通技术人员可以理解，图1所示的结构仅为示意，其并不对上述电子装置的结构造成限定。例如，计算机终端10还可包括比图1中所示更多或者更少的组件，或者具有与图1所示不同的配置。

存储器104可用于存储应用软件的软件程序以及模块，如本发明实施例中的话术知识库构建的方法对应的程序指令/模块，处理器102通过运行存储在存储器104内的软件程序以及模块，从而执行各种功能应用以及数据处理，即实现上述的应用程序的话术知识库构建的方法。存储器104可包括高速随机存储器，还可包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器104可进一步包括相对于处理器102远程设置的存储器，这些远程存储器可以通过网络连接至计算机终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端10的通信供应商提供的无线网络。在一个实例中，传输装置106包括一个网络适配器(Network Interface Controller，NIC)，其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中，传输装置106可以为射频(Radio Frequency，RF)模块，其用于通过无线方式与互联网进行通讯。

在上述运行环境下，本申请提供了如图2所示的话术知识库构建的方法。图2是根据本发明实施例一的话术知识库构建的方法的流程图。

步骤S202,将对话文本进行结构化处理，得到第一对象对话结构化类别和第二对象对话结构化类别；

本申请上述步骤S202中,本申请实施例中对话文本可以包括客服与客户之间的聊天对话文本,如图3a所示,图3a是根据本发明实施例一的话术知识库构建的方法中客服与客户之间的聊天对话示意图。

其中,本申请实施例提供的对话文本包括客服与客户之间的聊天对话文本,而得到的第一对象对话结构化类别和第二对象对话结构化类别，基于图3这里第一对象对话结构化类别可以为客户在对话中的结构化类别，第二对象对话结构化类别可以为客服在对话中的结构化类别，最后得到表1中所示的第一对象对话结构化类别和第二对象对话结构化类别：

表1

其中，本申请实施例提供的将获取的对话文本进行结构化，得到第一对象对话结构化类别和第二对象对话结构化类别可以采用深度学习方法实现对话结构化，即，将客服和客户之间的对话进行分词，通过BiLSTM模型处理后的对话及其结构化结果，如图3b所示，图3b是根据本发明实施例一的话术知识库构建的方法中客服与客户之间的聊天对话通过对话结构化模型后的示意图。其中，如图4所示，图4是根据本发明实施例一的话术知识库构建的方法中对话结构化模型的示意图。

步骤S204,获取基于第一对象对话结构化类别和第二对象对话结构化类别生成的至少一种对话模式；

本申请上述步骤S204中,基于步骤S202中的第一对象对话结构化类别和第二对象对话结构化类别，本申请实施例提供的对话模式可以包括：模式一，客户问-客服答，和模式二，客户问-客服反问-客户答-客服答；

如表2所示，表2是客户问客服答的示例：

表2

如表3所示，表3是客户问-客服反问-客户答-客服答的示例：

表3

这里在本申请实施例中将对话表示为结构化符号序列，例如：wwHBDra，如图5a所示，图5a是根据本发明实施例一的话术知识库构建的方法中对话结构化符号序列wwHBDra的示意图。

其次，对其进行降噪处理：去除对话中不重要的内容，例如打招呼，系统响应等，只保留客户问、客服答等关键要素。如图5b所示，图5b是根据本发明实施例一的话术知识库构建的方法中对话结构化序列降噪的示意图，需要说明的是，图5a和图5b中粗线框表示开始，虚线框表示结束。

第三，采用正则表达式对结构化后的对话符号缩写序列进行知识抽取，得到如表4所示的抽取结果；

表4

最后，从抽取出来的知识中，将筛选符合“客户问-客服答”和“客户问-客服反问-客户答-客服答”两类模式的知识，并将每个符号都映射为四类：

1.客户问question

2.客服答answer

3.客服反问request

4.客户回答request-answer

筛选的模式及映射规则如表5所示，得到对话模式：

表5

步骤S206,对至少一种对话模式进行筛选，存储筛选后的对话模式。

本申请上述步骤S206中,基于步骤S204中得到的对话模式，对已经抽取的知识进行清洗，去除重复的知识，使得相似的知识只保留一条。如表6所示，

表6

其中，在本申请实施例中采用基于协同过滤etrec和标签传播算法的密度聚类算法，对客户问进行聚类。完成清洗后的知识可以直接录入知识库，用于问答系统、客服工具等应用。

在本发明实施例中，采用系统自动从客服客户原始对话数据中挖掘生成“客户问题-客服回答”格式的知识的方式，通过将对话文本进行结构化处理，得到第一对象对话结构化类别和第二对象对话结构化类别；获取第一对象对话结构化类别和第二对象对话结构化类别生成的至少一种对话模式；对至少一种对话模式进行筛选，存储筛选后的对话模式，达到了只需要初期标注一批训练数据，就不再需要人工投入的目的，从而实现了客服话术知识库自动构建方法完全自动化的技术效果，进而解决了由于相关技术中存在的知识库的更迭需要持续人工维护，导致的维护成本高的技术问题。

可选的，步骤S202中将对话文本进行结构化处理，得到第一对象对话结构化类别和第二对象对话结构化类别包括：

Step1，将参与对话文本中的对话对象进行划分，得到第一对象和第二对象；

Step2，依据第一对象和第二对象，对对话文本中的对话内容进行分类，得到第一对象对话内容和第二对象对话内容；

Step3，分别对第一对象对话内容和第二对象对话内容中的对话内容进行标记，得到结构化的对话文本；

Step4，依据第一对象和第二对象对结构化的对话文本进行分类，得到第一对象对话结构化类别和第二对象对话结构化类别。

具体的，结合图3所示，本申请实施例提供的话术知识库构建的方法可以适用于客户咨询类应用场景，如图3所示，以应用于支付类场景为例，当客户购买在线互联网理财产品之后，如根据客户需求想要收回理财产品获利和本金时，通过与在线客服沟通，获取有效的回复。

其中，第一对象为图3中的客户，第二对象为图3中的客服，在本申请实施例中通过将客户与客服之间的对话进行分类，然后根据表1得到客服、客户两类结构化类别，即，第一对象对话结构化类别和第二对象对话结构化类别。

需要说明的是，Step2中分别对第一对象对话内容和第二对象对话内容中的对话内容进行标记，得到结构化后的对话文本可以是针对不同答复配置对应的符号。

可选的，步骤S204中获取基于第一对象对话结构化类别和第二对象对话结构化类别生成的至少一种对话模式包括：

Step1，依据第一对象对话结构化类别和第二对象对话结构化类别将对话文本转换为结构化符号序列；

Step2，对结构化符号序列进行降噪，得到降噪后的结构化符号序列；

Step3，采用正则表达式对降噪后的结构化符号序列进行知识抽取，得到对话模式。

进一步地,可选的，步骤S204中Step3中的采用正则表达式对降噪后的结构化符号序列进行知识抽取，得到对话模式包括：将抽取出的知识依据第一预设筛选条件和第二预设筛选条件进行筛选，得到符合第一预设筛选条件和第二预设筛选条件的知识；依据预设映射规则对符合第一预设筛选条件和第二预设筛选条件的知识进行分类，得到对话模式。

具体的，步骤S204中的Step1至Step3，结合图5a和图5b所示，将对话表示为结构化符号序列，例如：wwHBDra；并对其进行降噪处理：去除对话中不重要的内容，例如打招呼，系统响应等，只保留客户问、客服答等关键要素；并通过采用正则表达式对结构化后的对话符号缩写序列进行知识抽取，筛选符合“客户问-客服答”和“客户问-客服反问-客户答-客服答”两类模式的知识，并将每个符号都映射为四类，得到对话模式。

可选的，步骤S206中对至少一种对话模式进行筛选，存储筛选后的对话模式包括：

Step1，去除所有对话模式中的重复项；

Step2，保存相似度大于预设值的对话模式；

Step3，存储对话模式。

进一步地,可选的，步骤S206中Step3中的存储对话模式包括：将对话模式应用于在线答复系统。

具体的，结合步骤S206中的Step1至Step3，由于客户咨询的问题通常呈二八分布，80％的客户咨询的是20％的高频问题，所以需要对已经抽取的知识进行清洗，去除重复的知识，使得相似的知识只保留一条。如图6所示，图6是根据本发明实施例一的话术知识库构建的方法中应用于实例场景中的示意图。

其中，在本申请实施例中相似性计算可以使用其他相似性计算指标如jacard，欧氏距离等，聚类方法也可以使用其他如k-means等，以实现本申请实施例提供的话术知识库构建的方法为准，具体不做限定。

综上，如图7所示，图7是根据本发明实施例一的话术知识库构建的方法中的执行流程示意图。本申请实施例提供的话术知识库构建的方法可以适用于基于对话结构化的客服话术知识库自动构建系统，系统自动从客服客户原始对话数据中挖掘生成“客户问题-客服回答”格式的知识，系统核心是对话结构化、知识抽取和知识清洗方法。

需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明并不受所描述的动作顺序的限制，因为依据本发明，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本发明所必须的。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到根据上述实施例的话术知识库构建的方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，或者网络设备等)执行本发明各个实施例所述的方法。

实施例2

根据本发明实施例，还提供了一种用于实施上述话术知识库构建的方法的装置，如图8所示，图8是根据本发明实施例二的话术知识库构建的装置的结构示意图，该装置包括：

第一获取模块82，用于将对话文本进行结构化处理，得到第一对象对话结构化类别和第二对象对话结构化类别；第二获取模块84，用于获取基于第一对象对话结构化类别和第二对象对话结构化类别生成的至少一种对话模式；筛选模块86，用于对至少一种对话模式进行筛选，存储筛选后的对话模式。

可选的，第一获取模块82包括：划分单元，用于将参与对话文本中的对话对象进行划分，得到第一对象和第二对象；分类单元，用于依据第一对象和第二对象，对对话文本中的对话内容进行分类，得到第一对象对话内容和第二对象对话内容；标记单元，用于分别对第一对象对话内容和第二对象对话内容中的对话内容进行标记，得到结构化的对话文本；第一获取单元，用于依据第一对象和第二对象对结构化的对话文本进行分类，得到第一对象对话结构化类别和第二对象对话结构化类别。

可选的，第二获取模块84包括：转换单元，用于依据第一对象对话结构化类别和第二对象对话结构化类别将对话文本转换为结构化符号序列；降噪单元，用于对结构化符号序列进行降噪，得到降噪后的结构化符号序列；第二获取单元，用于采用正则表达式对降噪后的结构化符号序列进行知识抽取，得到对话模式。

可选的，话术知识库构建的装置应用于在线答复系统。

实施例3

实施例4

根据本发明实施例的又一方面，还提供了一种存储介质，存储介质包括存储的程序，其中，在程序运行时控制存储介质所在设备执行：将对话文本进行结构化处理，得到第一对象对话结构化类别和第二对象对话结构化类别；获取第一对象对话结构化类别和第二对象对话结构化类别生成的至少一种对话模式；对至少一种对话模式进行筛选，存储筛选后的对话模式。

实施例5

本发明的实施例还提供了一种存储介质。可选地，在本实施例中，上述存储介质可以用于保存上述实施例一所提供的话术知识库构建的方法所执行的程序代码。

可选地，在本实施例中，上述存储介质可以位于计算机网络中计算机终端群中的任意一个计算机终端中，或者位于移动终端群中的任意一个移动终端中。

可选地，在本实施例中，存储介质被设置为存储用于执行以下步骤的程序代码：将对话文本进行结构化处理，得到第一对象对话结构化类别和第二对象对话结构化类别；获取基于第一对象对话结构化类别和第二对象对话结构化类别生成的至少一种对话模式；对至少一种对话模式进行筛选，存储筛选后的对话模式。

可选地，在本实施例中，存储介质被设置为存储用于执行以下步骤的程序代码：将对话文本进行结构化处理，得到第一对象对话结构化类别和第二对象对话结构化类别包括：将参与对话文本中的对话对象进行划分，得到第一对象和第二对象；依据第一对象和第二对象，对对话文本中的对话内容进行分类，得到第一对象对话内容和第二对象对话内容；分别对第一对象对话内容和第二对象对话内容中的对话内容进行标记，得到结构化的对话文本；依据第一对象和第二对象对结构化的对话文本进行分类，得到第一对象对话结构化类别和第二对象对话结构化类别。

可选地，在本实施例中，存储介质被设置为存储用于执行以下步骤的程序代码：获取基于第一对象对话结构化类别和第二对象对话结构化类别生成的至少一种对话模式包括：依据第一对象对话结构化类别和第二对象对话结构化类别将对话文本转换为结构化符号序列；对结构化符号序列进行降噪，得到降噪后的结构化符号序列；采用正则表达式对降噪后的结构化符号序列进行知识抽取，得到对话模式。

进一步地,可选地，在本实施例中，存储介质被设置为存储用于执行以下步骤的程序代码：采用正则表达式对降噪后的结构化符号序列进行知识抽取，得到对话模式包括：将抽取出的知识依据第一预设筛选条件和第二预设筛选条件进行筛选，得到符合第一预设筛选条件和第二预设筛选条件的知识；依据预设映射规则对符合第一预设筛选条件和第二预设筛选条件的知识进行分类，得到对话模式。

可选地，在本实施例中，存储介质被设置为存储用于执行以下步骤的程序代码：对至少一种对话模式进行筛选，存储筛选后的对话模式包括：去除所有对话模式中的重复项；保存相似度大于预设值的对话模式；存储对话模式。

进一步地,可选地，在本实施例中，存储介质被设置为存储用于执行以下步骤的程序代码：存储对话模式包括：将对话模式应用于在线答复系统。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

在本发明的上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中，应该理解到，所揭露的技术内容，可通过其它的方式实现。其中，以上所描述的装置实施例仅仅是示意性的，例如所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，单元或模块的间接耦合或通信连接，可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种话术知识库构建的方法，包括：

将对话文本进行结构化处理，得到第一对象对话结构化类别和第二对象对话结构化类别；

获取基于所述第一对象对话结构化类别和所述第二对象对话结构化类别生成的至少一种对话模式；

对所述至少一种对话模式进行筛选，存储筛选后的对话模式。

2.根据权利要求1所述的方法，其中，将对话文本进行结构化处理，得到第一对象对话结构化类别和第二对象对话结构化类别包括：

将参与所述对话文本中的对话对象进行划分，得到第一对象和第二对象；

依据所述第一对象和所述第二对象，对所述对话文本中的对话内容进行分类，得到第一对象对话内容和第二对象对话内容；

分别对所述第一对象对话内容和所述第二对象对话内容中的对话内容进行标记，得到结构化的对话文本；

依据所述第一对象和所述第二对象对所述结构化的对话文本进行分类，得到所述第一对象对话结构化类别和所述第二对象对话结构化类别。

3.根据权利要求1所述的方法，其中，所述获取基于所述第一对象对话结构化类别和所述第二对象对话结构化类别生成的至少一种对话模式包括：

依据所述第一对象对话结构化类别和所述第二对象对话结构化类别将所述对话文本转换为结构化符号序列；

对所述结构化符号序列进行降噪，得到降噪后的结构化符号序列；

采用正则表达式对降噪后的结构化符号序列进行知识抽取，得到所述对话模式。

4.根据权利要求3所述的方法，其中，所述采用正则表达式对降噪后的结构化符号序列进行知识抽取，得到所述对话模式包括：

将抽取出的知识依据第一预设筛选条件和第二预设筛选条件进行筛选，得到符合所述第一预设筛选条件和所述第二预设筛选条件的知识；

依据预设映射规则对所述符合所述第一预设筛选条件和所述第二预设筛选条件的知识进行分类，得到所述对话模式。

5.根据权利要求1所述的方法，其中，对所述至少一种对话模式进行筛选，存储筛选后的对话模式包括：

去除所有所述对话模式中的重复项；

保存相似度大于预设值的对话模式；

存储所述对话模式。

6.根据权利要求5所述的方法，其中，所述存储所述对话模式包括：

将所述对话模式应用于在线答复系统。

7.一种话术知识库构建的装置，包括：

第一获取模块，用于将对话文本进行结构化处理，得到第一对象对话结构化类别和第二对象对话结构化类别；

第二获取模块，用于获取基于所述第一对象对话结构化类别和所述第二对象对话结构化类别生成的至少一种对话模式；

筛选模块，用于对所述至少一种对话模式进行筛选，存储筛选后的对话模式。

8.根据权利要求7所述的装置，其中，第一获取模块包括：

划分单元，用于将参与所述对话文本中的对话对象进行划分，得到第一对象和第二对象；

分类单元，用于依据所述第一对象和所述第二对象，对所述对话文本中的对话内容进行分类，得到第一对象对话内容和第二对象对话内容；

标记单元，用于分别对所述第一对象对话内容和所述第二对象对话内容中的对话内容进行标记，得到结构化的对话文本；

第一获取单元，用于依据所述第一对象和所述第二对象对所述结构化的对话文本进行分类，得到所述第一对象对话结构化类别和所述第二对象对话结构化类别。

9.根据权利要求7所述的装置，其中，所述第二获取模块包括：

转换单元，用于依据所述第一对象对话结构化类别和所述第二对象对话结构化类别将所述对话文本转换为结构化符号序列；

降噪单元，用于对所述结构化符号序列进行降噪，得到降噪后的结构化符号序列；

第二获取单元，用于采用正则表达式对降噪后的结构化符号序列进行知识抽取，得到所述对话模式。

10.根据权利要求9所述的装置，其中，所述第二获取单元包括：

筛选子单元，用于将抽取出的知识依据第一预设筛选条件和第二预设筛选条件进行筛选，得到符合所述第一预设筛选条件和所述第二预设筛选条件的知识；

获取子单元，用于依据预设映射规则对所述符合所述第一预设筛选条件和所述第二预设筛选条件的知识进行分类，得到所述对话模式。

11.根据权利要求7所述的装置，其中，所述话术知识库构建的装置应用于在线答复系统。

12.一种客服机器人，包括：话术知识库，其中，所述话术知识库将对话文本进行结构化处理，得到第一对象对话结构化类别和第二对象对话结构化类别；获取基于所述第一对象对话结构化类别和所述第二对象对话结构化类别生成的至少一种对话模式；对所述至少一种对话模式进行筛选，存储筛选后的对话模式。

13.一种存储介质，所述存储介质包括存储的程序，其中，在所述程序运行时控制所述存储介质所在设备执行：将对话文本进行结构化处理，得到第一对象对话结构化类别和第二对象对话结构化类别；获取基于所述第一对象对话结构化类别和所述第二对象对话结构化类别生成的至少一种对话模式；对所述至少一种对话模式进行筛选，存储筛选后的对话模式。