CN111324704A - 话术知识库构建的方法、装置和客服机器人 - Google Patents

话术知识库构建的方法、装置和客服机器人 Download PDF

Info

Publication number
CN111324704A
CN111324704A CN201811535761.1A CN201811535761A CN111324704A CN 111324704 A CN111324704 A CN 111324704A CN 201811535761 A CN201811535761 A CN 201811535761A CN 111324704 A CN111324704 A CN 111324704A
Authority
CN
China
Prior art keywords
conversation
category
structured
dialog
mode
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811535761.1A
Other languages
English (en)
Other versions
CN111324704B (zh
Inventor
林君
宋凯嵩
孙常龙
刘晓钟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201811535761.1A priority Critical patent/CN111324704B/zh
Publication of CN111324704A publication Critical patent/CN111324704A/zh
Application granted granted Critical
Publication of CN111324704B publication Critical patent/CN111324704B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明公开了一种话术知识库构建的方法、装置和客服机器人。其中,该方法包括:将获取的对话文本进行结构化,得到第一对象对话结构化类别和第二对象对话结构化类别;获取基于第一对象对话结构化类别和第二对象对话结构化类别生成的对话模式;对对话模式进行筛选,存储筛选后的对话模式。本发明解决了由于相关技术中存在的知识库的更迭需要持续人工维护,导致的维护成本高的技术问题。

Description

话术知识库构建的方法、装置和客服机器人
技术领域
本发明涉及互联网技术领域,具体而言,涉及一种话术知识库构建的方法、装置和客服机器人。
背景技术
基于电商平台上的业务咨询,特别是用户基于商品详情发出的提问,或基于电商平台所提供服务发出的提问,目前普遍是基于人工在线回复,或人工依据预先设置好的答复模板通过设置的客服机器人进行回复,耗费大量人工成本。
相关技术中根据预先设置好的答复模板通过客服机器人进行答复普遍需要构建知识库,而相关技术中知识库构建完全依赖人工或者通过挖掘高频的客户消息辅助人工,初期的人工成本非常高,并且由于知识需要迭代更新,因此需要持续投入人工维护。
针对上述由于相关技术中存在的知识库的更迭需要持续人工维护,导致的维护成本高的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种话术知识库构建的方法、装置和客服机器人,以至少解决由于相关技术中存在的知识库的更迭需要持续人工维护,导致的维护成本高的技术问题。
根据本发明实施例的一个方面,提供了一种话术知识库构建的方法,包括:将对话文本进行结构化处理,得到第一对象对话结构化类别和第二对象对话结构化类别;获取基于第一对象对话结构化类别和第二对象对话结构化类别生成的至少一种对话模式;对至少一种对话模式进行筛选,存储筛选后的对话模式。
可选的,将对话文本进行结构化处理,得到第一对象对话结构化类别和第二对象对话结构化类别包括:将参与对话文本中的对话对象进行划分,得到第一对象和第二对象;依据第一对象和第二对象,对对话文本中的对话内容进行分类,得到第一对象对话内容和第二对象对话内容;分别对第一对象对话内容和第二对象对话内容中的对话内容进行标记,得到结构化的对话文本;依据第一对象和第二对象对结构化的对话文本进行分类,得到第一对象对话结构化类别和第二对象对话结构化类别。
可选的,获取基于第一对象对话结构化类别和第二对象对话结构化类别生成的至少一种对话模式包括:依据第一对象对话结构化类别和第二对象对话结构化类别将对话文本转换为结构化符号序列;对结构化符号序列进行降噪,得到降噪后的结构化符号序列;采用正则表达式对降噪后的结构化符号序列进行知识抽取,得到对话模式。
进一步地,可选的,采用正则表达式对降噪后的结构化符号序列进行知识抽取,得到对话模式包括:将抽取出的知识依据第一预设筛选条件和第二预设筛选条件进行筛选,得到符合第一预设筛选条件和第二预设筛选条件的知识;依据预设映射规则对符合第一预设筛选条件和第二预设筛选条件的知识进行分类,得到对话模式。
可选的,对至少一种对话模式进行筛选,存储筛选后的对话模式包括:去除所有对话模式中的重复项;保存相似度大于预设值的对话模式;存储对话模式。
进一步地,可选的,存储对话模式包括:将对话模式应用于在线答复系统。
根据本发明实施例的另一方面,还提供了一种话术知识库构建的装置,包括:第一获取模块,用于将对话文本进行结构化处理,得到第一对象对话结构化类别和第二对象对话结构化类别;第二获取模块,用于获取基于第一对象对话结构化类别和第二对象对话结构化类别生成的至少一种对话模式;筛选模块,用于对至少一种对话模式进行筛选,存储筛选后的对话模式。
可选的,第一获取模块包括:划分单元,用于将参与对话文本中的对话对象进行划分,得到第一对象和第二对象;分类单元,用于依据第一对象和第二对象,对对话文本中的对话内容进行分类,得到第一对象对话内容和第二对象对话内容;标记单元,用于分别对第一对象对话内容和第二对象对话内容中的对话内容进行标记,得到结构化的对话文本;第一获取单元,用于依据第一对象和第二对象对结构化的对话文本进行分类,得到第一对象对话结构化类别和第二对象对话结构化类别。
可选的,第二获取模块包括:转换单元,用于依据第一对象对话结构化类别和第二对象对话结构化类别将对话文本转换为结构化符号序列;降噪单元,用于对结构化符号序列进行降噪,得到降噪后的结构化符号序列;第二获取单元,用于采用正则表达式对降噪后的结构化符号序列进行知识抽取,得到对话模式。
进一步地,可选的,第二获取单元包括:筛选子单元,用于将抽取出的知识依据第一预设筛选条件和第二预设筛选条件进行筛选,得到符合第一预设筛选条件和第二预设筛选条件的知识;获取子单元,用于依据预设映射规则对符合第一预设筛选条件和第二预设筛选条件的知识进行分类,得到对话模式。
可选的,话术知识库构建的装置应用于在线答复系统。
根据本发明实施例的又一方面,还提供了一种客服机器人,包括:话术知识库,其中,话术知识库将对话文本进行结构化处理,得到第一对象对话结构化类别和第二对象对话结构化类别;获取基于第一对象对话结构化类别和第二对象对话结构化类别生成的至少一种对话模式;对至少一种对话模式进行筛选,存储筛选后的对话模式。
根据本发明实施例的再一方面,还提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行:将对话文本进行结构化处理,得到第一对象对话结构化类别和第二对象对话结构化类别;获取基于第一对象对话结构化类别和第二对象对话结构化类别生成的至少一种对话模式;对至少一种对话模式进行筛选,存储筛选后的对话模式。
在本发明实施例中,采用系统自动从客服客户原始对话数据中挖掘生成“客户问题-客服回答”格式的知识的方式,通过将对话文本进行结构化处理,得到第一对象对话结构化类别和第二对象对话结构化类别;获取基于第一对象对话结构化类别和第二对象对话结构化类别生成的至少一种对话模式;对至少一种对话模式进行筛选,存储筛选后的对话模式,达到了只需要初期标注一批训练数据,就不再需要人工投入的目的,从而实现了客服话术知识库自动构建方法完全自动化的技术效果,进而解决了由于相关技术中存在的知识库的更迭需要持续人工维护,导致的维护成本高的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是本发明实施例的一种话术知识库构建的方法的计算机终端的硬件结构框图;
图2是根据本发明实施例一的话术知识库构建的方法的流程图;
图3a是根据本发明实施例一的话术知识库构建的方法中客服与客户之间的聊天对话示意图;
图3b是根据本发明实施例一的话术知识库构建的方法中客服与客户之间的聊天对话通过对话结构化模型后的示意图;
图4是根据本发明实施例一的话术知识库构建的方法中对话结构化模型的示意图;
图5a是根据本发明实施例一的话术知识库构建的方法中对话结构化符号序列wwHBDra的示意图;
图5b是根据本发明实施例一的话术知识库构建的方法中对话结构化序列降噪的示意图;
图6是根据本发明实施例一的话术知识库构建的方法中应用于实例场景中的示意图;
图7是根据本发明实施例一的话术知识库构建的方法中的执行流程示意图;
图8是根据本发明实施例二的话术知识库构建的装置的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本申请涉及的技术名词:
对话结构化:预定义好一个对话结构化分类体系,用自然语言处理技术等将客服-客户对话中的每一条消息归类到其中一个类;
话术知识库:存储“客户问-客服答”等固定格式客服话术的知识库。
实施例1
根据本发明实施例,还提供了一种话术知识库构建的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本申请实施例一所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。以运行在计算机终端上为例,图1是本发明实施例的一种话术知识库构建的方法的计算机终端的硬件结构框图。如图1所示,计算机终端10可以包括一个或多个(图中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器104、以及用于通信功能的传输模块106。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算机终端10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
存储器104可用于存储应用软件的软件程序以及模块,如本发明实施例中的话术知识库构建的方法对应的程序指令/模块,处理器102通过运行存储在存储器104内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的应用程序的话术知识库构建的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端10的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(Network Interface Controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
在上述运行环境下,本申请提供了如图2所示的话术知识库构建的方法。图2是根据本发明实施例一的话术知识库构建的方法的流程图。
步骤S202,将对话文本进行结构化处理,得到第一对象对话结构化类别和第二对象对话结构化类别;
本申请上述步骤S202中,本申请实施例中对话文本可以包括客服与客户之间的聊天对话文本,如图3a所示,图3a是根据本发明实施例一的话术知识库构建的方法中客服与客户之间的聊天对话示意图。
其中,本申请实施例提供的对话文本包括客服与客户之间的聊天对话文本,而得到的第一对象对话结构化类别和第二对象对话结构化类别,基于图3这里第一对象对话结构化类别可以为客户在对话中的结构化类别,第二对象对话结构化类别可以为客服在对话中的结构化类别,最后得到表1中所示的第一对象对话结构化类别和第二对象对话结构化类别:
表1
Figure BDA0001906816920000061
其中,本申请实施例提供的将获取的对话文本进行结构化,得到第一对象对话结构化类别和第二对象对话结构化类别可以采用深度学习方法实现对话结构化,即,将客服和客户之间的对话进行分词,通过BiLSTM模型处理后的对话及其结构化结果,如图3b所示,图3b是根据本发明实施例一的话术知识库构建的方法中客服与客户之间的聊天对话通过对话结构化模型后的示意图。其中,如图4所示,图4是根据本发明实施例一的话术知识库构建的方法中对话结构化模型的示意图。
步骤S204,获取基于第一对象对话结构化类别和第二对象对话结构化类别生成的至少一种对话模式;
本申请上述步骤S204中,基于步骤S202中的第一对象对话结构化类别和第二对象对话结构化类别,本申请实施例提供的对话模式可以包括:模式一,客户问-客服答,和模式二,客户问-客服反问-客户答-客服答;
如表2所示,表2是客户问客服答的示例:
表2
Figure BDA0001906816920000071
如表3所示,表3是客户问-客服反问-客户答-客服答的示例:
表3
Figure BDA0001906816920000072
这里在本申请实施例中将对话表示为结构化符号序列,例如:wwHBDra,如图5a所示,图5a是根据本发明实施例一的话术知识库构建的方法中对话结构化符号序列wwHBDra的示意图。
其次,对其进行降噪处理:去除对话中不重要的内容,例如打招呼,系统响应等,只保留客户问、客服答等关键要素。如图5b所示,图5b是根据本发明实施例一的话术知识库构建的方法中对话结构化序列降噪的示意图,需要说明的是,图5a和图5b中粗线框表示开始,虚线框表示结束。
第三,采用正则表达式对结构化后的对话符号缩写序列进行知识抽取,得到如表4所示的抽取结果;
表4
Figure BDA0001906816920000081
最后,从抽取出来的知识中,将筛选符合“客户问-客服答”和“客户问-客服反问-客户答-客服答”两类模式的知识,并将每个符号都映射为四类:
1.客户问question
2.客服答answer
3.客服反问request
4.客户回答request-answer
筛选的模式及映射规则如表5所示,得到对话模式:
表5
Figure BDA0001906816920000082
步骤S206,对至少一种对话模式进行筛选,存储筛选后的对话模式。
本申请上述步骤S206中,基于步骤S204中得到的对话模式,对已经抽取的知识进行清洗,去除重复的知识,使得相似的知识只保留一条。如表6所示,
表6
Figure BDA0001906816920000091
其中,在本申请实施例中采用基于协同过滤etrec和标签传播算法的密度聚类算法,对客户问进行聚类。完成清洗后的知识可以直接录入知识库,用于问答系统、客服工具等应用。
在本发明实施例中,采用系统自动从客服客户原始对话数据中挖掘生成“客户问题-客服回答”格式的知识的方式,通过将对话文本进行结构化处理,得到第一对象对话结构化类别和第二对象对话结构化类别;获取第一对象对话结构化类别和第二对象对话结构化类别生成的至少一种对话模式;对至少一种对话模式进行筛选,存储筛选后的对话模式,达到了只需要初期标注一批训练数据,就不再需要人工投入的目的,从而实现了客服话术知识库自动构建方法完全自动化的技术效果,进而解决了由于相关技术中存在的知识库的更迭需要持续人工维护,导致的维护成本高的技术问题。
可选的,步骤S202中将对话文本进行结构化处理,得到第一对象对话结构化类别和第二对象对话结构化类别包括:
Step1,将参与对话文本中的对话对象进行划分,得到第一对象和第二对象;
Step2,依据第一对象和第二对象,对对话文本中的对话内容进行分类,得到第一对象对话内容和第二对象对话内容;
Step3,分别对第一对象对话内容和第二对象对话内容中的对话内容进行标记,得到结构化的对话文本;
Step4,依据第一对象和第二对象对结构化的对话文本进行分类,得到第一对象对话结构化类别和第二对象对话结构化类别。
具体的,结合图3所示,本申请实施例提供的话术知识库构建的方法可以适用于客户咨询类应用场景,如图3所示,以应用于支付类场景为例,当客户购买在线互联网理财产品之后,如根据客户需求想要收回理财产品获利和本金时,通过与在线客服沟通,获取有效的回复。
其中,第一对象为图3中的客户,第二对象为图3中的客服,在本申请实施例中通过将客户与客服之间的对话进行分类,然后根据表1得到客服、客户两类结构化类别,即,第一对象对话结构化类别和第二对象对话结构化类别。
需要说明的是,Step2中分别对第一对象对话内容和第二对象对话内容中的对话内容进行标记,得到结构化后的对话文本可以是针对不同答复配置对应的符号。
可选的,步骤S204中获取基于第一对象对话结构化类别和第二对象对话结构化类别生成的至少一种对话模式包括:
Step1,依据第一对象对话结构化类别和第二对象对话结构化类别将对话文本转换为结构化符号序列;
Step2,对结构化符号序列进行降噪,得到降噪后的结构化符号序列;
Step3,采用正则表达式对降噪后的结构化符号序列进行知识抽取,得到对话模式。
进一步地,可选的,步骤S204中Step3中的采用正则表达式对降噪后的结构化符号序列进行知识抽取,得到对话模式包括:将抽取出的知识依据第一预设筛选条件和第二预设筛选条件进行筛选,得到符合第一预设筛选条件和第二预设筛选条件的知识;依据预设映射规则对符合第一预设筛选条件和第二预设筛选条件的知识进行分类,得到对话模式。
具体的,步骤S204中的Step1至Step3,结合图5a和图5b所示,将对话表示为结构化符号序列,例如:wwHBDra;并对其进行降噪处理:去除对话中不重要的内容,例如打招呼,系统响应等,只保留客户问、客服答等关键要素;并通过采用正则表达式对结构化后的对话符号缩写序列进行知识抽取,筛选符合“客户问-客服答”和“客户问-客服反问-客户答-客服答”两类模式的知识,并将每个符号都映射为四类,得到对话模式。
可选的,步骤S206中对至少一种对话模式进行筛选,存储筛选后的对话模式包括:
Step1,去除所有对话模式中的重复项;
Step2,保存相似度大于预设值的对话模式;
Step3,存储对话模式。
进一步地,可选的,步骤S206中Step3中的存储对话模式包括:将对话模式应用于在线答复系统。
具体的,结合步骤S206中的Step1至Step3,由于客户咨询的问题通常呈二八分布,80%的客户咨询的是20%的高频问题,所以需要对已经抽取的知识进行清洗,去除重复的知识,使得相似的知识只保留一条。如图6所示,图6是根据本发明实施例一的话术知识库构建的方法中应用于实例场景中的示意图。
其中,在本申请实施例中相似性计算可以使用其他相似性计算指标如jacard,欧氏距离等,聚类方法也可以使用其他如k-means等,以实现本申请实施例提供的话术知识库构建的方法为准,具体不做限定。
综上,如图7所示,图7是根据本发明实施例一的话术知识库构建的方法中的执行流程示意图。本申请实施例提供的话术知识库构建的方法可以适用于基于对话结构化的客服话术知识库自动构建系统,系统自动从客服客户原始对话数据中挖掘生成“客户问题-客服回答”格式的知识,系统核心是对话结构化、知识抽取和知识清洗方法。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的话术知识库构建的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
实施例2
根据本发明实施例,还提供了一种用于实施上述话术知识库构建的方法的装置,如图8所示,图8是根据本发明实施例二的话术知识库构建的装置的结构示意图,该装置包括:
第一获取模块82,用于将对话文本进行结构化处理,得到第一对象对话结构化类别和第二对象对话结构化类别;第二获取模块84,用于获取基于第一对象对话结构化类别和第二对象对话结构化类别生成的至少一种对话模式;筛选模块86,用于对至少一种对话模式进行筛选,存储筛选后的对话模式。
可选的,第一获取模块82包括:划分单元,用于将参与对话文本中的对话对象进行划分,得到第一对象和第二对象;分类单元,用于依据第一对象和第二对象,对对话文本中的对话内容进行分类,得到第一对象对话内容和第二对象对话内容;标记单元,用于分别对第一对象对话内容和第二对象对话内容中的对话内容进行标记,得到结构化的对话文本;第一获取单元,用于依据第一对象和第二对象对结构化的对话文本进行分类,得到第一对象对话结构化类别和第二对象对话结构化类别。
可选的,第二获取模块84包括:转换单元,用于依据第一对象对话结构化类别和第二对象对话结构化类别将对话文本转换为结构化符号序列;降噪单元,用于对结构化符号序列进行降噪,得到降噪后的结构化符号序列;第二获取单元,用于采用正则表达式对降噪后的结构化符号序列进行知识抽取,得到对话模式。
进一步地,可选的,第二获取单元包括:筛选子单元,用于将抽取出的知识依据第一预设筛选条件和第二预设筛选条件进行筛选,得到符合第一预设筛选条件和第二预设筛选条件的知识;获取子单元,用于依据预设映射规则对符合第一预设筛选条件和第二预设筛选条件的知识进行分类,得到对话模式。
可选的,话术知识库构建的装置应用于在线答复系统。
实施例3
根据本发明实施例的又一方面,还提供了一种客服机器人,包括:话术知识库,其中,话术知识库将对话文本进行结构化处理,得到第一对象对话结构化类别和第二对象对话结构化类别;获取基于第一对象对话结构化类别和第二对象对话结构化类别生成的至少一种对话模式;对至少一种对话模式进行筛选,存储筛选后的对话模式。
实施例4
根据本发明实施例的又一方面,还提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行:将对话文本进行结构化处理,得到第一对象对话结构化类别和第二对象对话结构化类别;获取第一对象对话结构化类别和第二对象对话结构化类别生成的至少一种对话模式;对至少一种对话模式进行筛选,存储筛选后的对话模式。
实施例5
本发明的实施例还提供了一种存储介质。可选地,在本实施例中,上述存储介质可以用于保存上述实施例一所提供的话术知识库构建的方法所执行的程序代码。
可选地,在本实施例中,上述存储介质可以位于计算机网络中计算机终端群中的任意一个计算机终端中,或者位于移动终端群中的任意一个移动终端中。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:将对话文本进行结构化处理,得到第一对象对话结构化类别和第二对象对话结构化类别;获取基于第一对象对话结构化类别和第二对象对话结构化类别生成的至少一种对话模式;对至少一种对话模式进行筛选,存储筛选后的对话模式。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:将对话文本进行结构化处理,得到第一对象对话结构化类别和第二对象对话结构化类别包括:将参与对话文本中的对话对象进行划分,得到第一对象和第二对象;依据第一对象和第二对象,对对话文本中的对话内容进行分类,得到第一对象对话内容和第二对象对话内容;分别对第一对象对话内容和第二对象对话内容中的对话内容进行标记,得到结构化的对话文本;依据第一对象和第二对象对结构化的对话文本进行分类,得到第一对象对话结构化类别和第二对象对话结构化类别。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:获取基于第一对象对话结构化类别和第二对象对话结构化类别生成的至少一种对话模式包括:依据第一对象对话结构化类别和第二对象对话结构化类别将对话文本转换为结构化符号序列;对结构化符号序列进行降噪,得到降噪后的结构化符号序列;采用正则表达式对降噪后的结构化符号序列进行知识抽取,得到对话模式。
进一步地,可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:采用正则表达式对降噪后的结构化符号序列进行知识抽取,得到对话模式包括:将抽取出的知识依据第一预设筛选条件和第二预设筛选条件进行筛选,得到符合第一预设筛选条件和第二预设筛选条件的知识;依据预设映射规则对符合第一预设筛选条件和第二预设筛选条件的知识进行分类,得到对话模式。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:对至少一种对话模式进行筛选,存储筛选后的对话模式包括:去除所有对话模式中的重复项;保存相似度大于预设值的对话模式;存储对话模式。
进一步地,可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:存储对话模式包括:将对话模式应用于在线答复系统。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (13)

1.一种话术知识库构建的方法,包括:
将对话文本进行结构化处理,得到第一对象对话结构化类别和第二对象对话结构化类别;
获取基于所述第一对象对话结构化类别和所述第二对象对话结构化类别生成的至少一种对话模式;
对所述至少一种对话模式进行筛选,存储筛选后的对话模式。
2.根据权利要求1所述的方法,其中,将对话文本进行结构化处理,得到第一对象对话结构化类别和第二对象对话结构化类别包括:
将参与所述对话文本中的对话对象进行划分,得到第一对象和第二对象;
依据所述第一对象和所述第二对象,对所述对话文本中的对话内容进行分类,得到第一对象对话内容和第二对象对话内容;
分别对所述第一对象对话内容和所述第二对象对话内容中的对话内容进行标记,得到结构化的对话文本;
依据所述第一对象和所述第二对象对所述结构化的对话文本进行分类,得到所述第一对象对话结构化类别和所述第二对象对话结构化类别。
3.根据权利要求1所述的方法,其中,所述获取基于所述第一对象对话结构化类别和所述第二对象对话结构化类别生成的至少一种对话模式包括:
依据所述第一对象对话结构化类别和所述第二对象对话结构化类别将所述对话文本转换为结构化符号序列;
对所述结构化符号序列进行降噪,得到降噪后的结构化符号序列;
采用正则表达式对降噪后的结构化符号序列进行知识抽取,得到所述对话模式。
4.根据权利要求3所述的方法,其中,所述采用正则表达式对降噪后的结构化符号序列进行知识抽取,得到所述对话模式包括:
将抽取出的知识依据第一预设筛选条件和第二预设筛选条件进行筛选,得到符合所述第一预设筛选条件和所述第二预设筛选条件的知识;
依据预设映射规则对所述符合所述第一预设筛选条件和所述第二预设筛选条件的知识进行分类,得到所述对话模式。
5.根据权利要求1所述的方法,其中,对所述至少一种对话模式进行筛选,存储筛选后的对话模式包括:
去除所有所述对话模式中的重复项;
保存相似度大于预设值的对话模式;
存储所述对话模式。
6.根据权利要求5所述的方法,其中,所述存储所述对话模式包括:
将所述对话模式应用于在线答复系统。
7.一种话术知识库构建的装置,包括:
第一获取模块,用于将对话文本进行结构化处理,得到第一对象对话结构化类别和第二对象对话结构化类别;
第二获取模块,用于获取基于所述第一对象对话结构化类别和所述第二对象对话结构化类别生成的至少一种对话模式;
筛选模块,用于对所述至少一种对话模式进行筛选,存储筛选后的对话模式。
8.根据权利要求7所述的装置,其中,第一获取模块包括:
划分单元,用于将参与所述对话文本中的对话对象进行划分,得到第一对象和第二对象;
分类单元,用于依据所述第一对象和所述第二对象,对所述对话文本中的对话内容进行分类,得到第一对象对话内容和第二对象对话内容;
标记单元,用于分别对所述第一对象对话内容和所述第二对象对话内容中的对话内容进行标记,得到结构化的对话文本;
第一获取单元,用于依据所述第一对象和所述第二对象对所述结构化的对话文本进行分类,得到所述第一对象对话结构化类别和所述第二对象对话结构化类别。
9.根据权利要求7所述的装置,其中,所述第二获取模块包括:
转换单元,用于依据所述第一对象对话结构化类别和所述第二对象对话结构化类别将所述对话文本转换为结构化符号序列;
降噪单元,用于对所述结构化符号序列进行降噪,得到降噪后的结构化符号序列;
第二获取单元,用于采用正则表达式对降噪后的结构化符号序列进行知识抽取,得到所述对话模式。
10.根据权利要求9所述的装置,其中,所述第二获取单元包括:
筛选子单元,用于将抽取出的知识依据第一预设筛选条件和第二预设筛选条件进行筛选,得到符合所述第一预设筛选条件和所述第二预设筛选条件的知识;
获取子单元,用于依据预设映射规则对所述符合所述第一预设筛选条件和所述第二预设筛选条件的知识进行分类,得到所述对话模式。
11.根据权利要求7所述的装置,其中,所述话术知识库构建的装置应用于在线答复系统。
12.一种客服机器人,包括:话术知识库,其中,所述话术知识库将对话文本进行结构化处理,得到第一对象对话结构化类别和第二对象对话结构化类别;获取基于所述第一对象对话结构化类别和所述第二对象对话结构化类别生成的至少一种对话模式;对所述至少一种对话模式进行筛选,存储筛选后的对话模式。
13.一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行:将对话文本进行结构化处理,得到第一对象对话结构化类别和第二对象对话结构化类别;获取基于所述第一对象对话结构化类别和所述第二对象对话结构化类别生成的至少一种对话模式;对所述至少一种对话模式进行筛选,存储筛选后的对话模式。
CN201811535761.1A 2018-12-14 2018-12-14 话术知识库构建的方法、装置和客服机器人 Active CN111324704B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811535761.1A CN111324704B (zh) 2018-12-14 2018-12-14 话术知识库构建的方法、装置和客服机器人

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811535761.1A CN111324704B (zh) 2018-12-14 2018-12-14 话术知识库构建的方法、装置和客服机器人

Publications (2)

Publication Number Publication Date
CN111324704A true CN111324704A (zh) 2020-06-23
CN111324704B CN111324704B (zh) 2023-05-02

Family

ID=71166926

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811535761.1A Active CN111324704B (zh) 2018-12-14 2018-12-14 话术知识库构建的方法、装置和客服机器人

Country Status (1)

Country Link
CN (1) CN111324704B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112988948A (zh) * 2021-02-05 2021-06-18 支付宝(杭州)信息技术有限公司 业务处理方法以及装置
CN115080720A (zh) * 2022-06-29 2022-09-20 壹沓科技(上海)有限公司 基于rpa及ai的文本处理方法、装置、设备及介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060190537A1 (en) * 2005-02-23 2006-08-24 Morris Robert P Method and system for enabling structured real-time conversations between multiple participants
US7373300B1 (en) * 2002-12-18 2008-05-13 At&T Corp. System and method of providing a spoken dialog interface to a website
JP2010267141A (ja) * 2009-05-15 2010-11-25 Toshiba Corp 文書分類装置およびプログラム
CN102866990A (zh) * 2012-08-20 2013-01-09 北京搜狗信息服务有限公司 一种主题对话方法和装置
WO2015039214A1 (en) * 2013-09-18 2015-03-26 Moldoveanu Mihnea Calin System and method for providing a communication platform with guided dialogical functions
CN106683678A (zh) * 2016-11-30 2017-05-17 厦门快商通科技股份有限公司 一种人工电话客服辅助系统及方法
CN106997375A (zh) * 2017-02-28 2017-08-01 浙江大学 基于深度学习的客服回复推荐方法
CN107133349A (zh) * 2017-05-24 2017-09-05 北京无忧创新科技有限公司 一种对话机器人系统
CN107203563A (zh) * 2016-03-18 2017-09-26 阿里巴巴集团控股有限公司 结构化数据生成方法及装置
CN108829662A (zh) * 2018-05-10 2018-11-16 浙江大学 一种基于条件随机场结构化注意力网络的对话行为识别方法及系统

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7373300B1 (en) * 2002-12-18 2008-05-13 At&T Corp. System and method of providing a spoken dialog interface to a website
US20060190537A1 (en) * 2005-02-23 2006-08-24 Morris Robert P Method and system for enabling structured real-time conversations between multiple participants
JP2010267141A (ja) * 2009-05-15 2010-11-25 Toshiba Corp 文書分類装置およびプログラム
CN102866990A (zh) * 2012-08-20 2013-01-09 北京搜狗信息服务有限公司 一种主题对话方法和装置
WO2015039214A1 (en) * 2013-09-18 2015-03-26 Moldoveanu Mihnea Calin System and method for providing a communication platform with guided dialogical functions
CN107203563A (zh) * 2016-03-18 2017-09-26 阿里巴巴集团控股有限公司 结构化数据生成方法及装置
CN106683678A (zh) * 2016-11-30 2017-05-17 厦门快商通科技股份有限公司 一种人工电话客服辅助系统及方法
CN106997375A (zh) * 2017-02-28 2017-08-01 浙江大学 基于深度学习的客服回复推荐方法
CN107133349A (zh) * 2017-05-24 2017-09-05 北京无忧创新科技有限公司 一种对话机器人系统
CN108829662A (zh) * 2018-05-10 2018-11-16 浙江大学 一种基于条件随机场结构化注意力网络的对话行为识别方法及系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112988948A (zh) * 2021-02-05 2021-06-18 支付宝(杭州)信息技术有限公司 业务处理方法以及装置
CN112988948B (zh) * 2021-02-05 2023-09-19 蚂蚁胜信(上海)信息技术有限公司 业务处理方法以及装置
CN115080720A (zh) * 2022-06-29 2022-09-20 壹沓科技(上海)有限公司 基于rpa及ai的文本处理方法、装置、设备及介质

Also Published As

Publication number Publication date
CN111324704B (zh) 2023-05-02

Similar Documents

Publication Publication Date Title
CN110555095B (zh) 人机对话方法和装置
CN109522556B (zh) 一种意图识别方法及装置
CN110659318B (zh) 基于大数据的策略推送方法、系统及计算机设备
CN105744005A (zh) 客户定位分析方法及服务器
WO2013118143A2 (en) Complete specification
CN113283238B (zh) 文本数据处理的方法和装置、电子设备和存储介质
CN106557954A (zh) 客服营销的方法及装置
CN112434501A (zh) 工单智能生成的方法、装置、电子设备及介质
CN104915359A (zh) 主题标签推荐方法及装置
CN106294676B (zh) 一种电子商务政务系统的数据检索方法
CN111324704B (zh) 话术知识库构建的方法、装置和客服机器人
CN112069315A (zh) 提取文本多维度信息方法、装置、服务器及存储介质
CN111062211A (zh) 信息提取方法、装置、电子设备及存储介质
CN108984777B (zh) 客户服务方法、装置和计算机可读存储介质
CN112765981A (zh) 一种文本信息的生成方法和装置
CN112800209A (zh) 会话语料推荐方法、装置、存储介质和电子设备
CN111666408A (zh) 重要条款筛选与展示的方法及装置
CN111046145A (zh) 交互意图路径的挖掘方法以及装置
CN109993381B (zh) 基于知识图谱的需求管理应用方法、装置、设备及介质
CN114662452A (zh) 去隐私化的文本标签分析方法及装置
CN110046233A (zh) 问题派发方法及装置
CN113257237B (zh) 语音交互的意图识别方法、装置、电子设备及存储介质
EP3962073A1 (en) Online interview method and system
CN114118937A (zh) 基于任务的信息推荐方法、装置、电子设备及存储介质
CN113919367A (zh) 摘要获取方法、装置、设备、介质及产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant