CN109189803A - 问答对构建方法、装置及计算机可读存储介质 - Google Patents
问答对构建方法、装置及计算机可读存储介质 Download PDFInfo
- Publication number
- CN109189803A CN109189803A CN201811029233.9A CN201811029233A CN109189803A CN 109189803 A CN109189803 A CN 109189803A CN 201811029233 A CN201811029233 A CN 201811029233A CN 109189803 A CN109189803 A CN 109189803A
- Authority
- CN
- China
- Prior art keywords
- answer
- question
- target
- pair
- record
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种问答对构建方法,包括:获取人工客服与用户的对话记录,并基于预设规则对所述对话记录进行处理,得到目标对话记录;基于所述目标对话记录确定标准形式问答对,并对所述标准形式问答对进行过滤处理,得到目标问答对;对所述目标问答对进行合并,并输出所述合并后的目标问答对,以供管理员进行审核。本发明还公开了一种问答对构建装置及计算机可读存储介质。本发明提高了问答对构建的效率和准确性。
Description
技术领域
本发明涉及人机交互技术领域,尤其涉及一种问答对构建方法、装置及计算机可读存储介质。
背景技术
现有的问答对知识库由场景、问题以及对应的答案组成,现有知识库的构建主要依赖于传统的人工编辑方式,通过从业务数据中抽取问答对以构建知识库,并采用人工筛选的方式对知识库进行更新,以及采用人工抽查的方式进行维护。因此,现有知识库过度依赖于传统的人工编辑,在知识库构建、更新和维护上都存在很大的缺陷。
发明内容
本发明的主要目的在于提供一种问答对构建方法、装置及计算机可读存储介质,旨在解决现有技术中问答对知识库因过于依赖传统的人工编辑导致的知识库构建、更新及维护存在缺陷的技术问题。
为实现上述目的,本发明提供一种问答对构建方法,所述问答对构建方法包括:
获取人工客服与用户的对话记录,并基于预设规则对所述对话记录进行处理,得到目标对话记录;
基于所述目标对话记录确定标准形式问答对,并对所述标准形式问答对进行过滤处理,得到目标问答对;
对所述目标问答对进行合并,并输出所述合并后的目标问答对,以供管理员进行审核。
可选地,所述对话记录中包括人工客服对话记录和用户对话记录,所述人工客服对话记录和用户对话记录对应有不同的人工客服标识信息和用户标识信息。
可选地,所述基于预设规则对所述对话记录进行处理,得到目标对话记录的步骤包括:
对所述人工客服对话记录和用户对话记录中的欢迎语和结束语进行过滤处理,得到过滤后的对话记录;
将所述用户标识信息相同的对话记录进行合并,得到所述用户标识信息对应的完整对话记录;
基于时间顺序对所述完整对话记录进行重组,得到目标对话记录。
可选地,所述对所述人工客服对话记录和用户对话记录中的欢迎语和结束语进行过滤处理的步骤包括:
获取预设的包含结束语和欢迎语的数据库,并基于所述数据库判断所述人工客服对话记录和用户对话记录中是否包含所述结束语和欢迎语,以便对所述结束语和欢迎语进行过滤。
可选地,所述基于所述目标对话记录确定标准形式问答对的步骤包括:
获取所述目标对话记录中连续的人工客服对话记录和/或用户对话记录,并将所述连续的人工客服对话记录和/或用户对话记录进行合并,得到标准形式问答对,其中,所述标准形式问答对中至少包括一个问题和一个对应的答案。
可选地,所述对所述标准形式问答对进行过滤处理,得到目标问答对的步骤包括:
判断所述标准形式问答对中的问题和答案中是否包含疑问词;
若所述标准形式问答对中的问题中不包含疑问词,和/或所述标准形式问答对中的答案中包含疑问词,则将所述标准形式问答对进行过滤处理;
若所述标准形式问答对中的问题中包含疑问词,且所述标准形式问答对中的答案中不包含疑问词,则将所述标准形式问答对确定为目标问答对。
可选地,所述对所述目标问答对进行合并,并输出所述合并后的目标问答对,以供管理员进行审核的步骤包括:
判断所述目标问答对中是否存在答案相同的问答对;
若是,则将所述答案相同的问答对进行合并,其中,所述合并后的问答对中包含所述相同的答案和所述答案相同的问答对中对应的不同的问题;
输出所述合并后的目标问答对,以供管理员对所述合并后的目标问答对进行审核。
可选地,所述若是,则将所述答案相同的问答对进行合并的步骤之后,还包括:
判断所述答案相同的问答对的个数是否超过预设个数阈值;
若否,则从所述目标问答对中过滤所述答案相同的问答对;
若是,则执行所述输出所述合并后的目标问答对,以供管理员对所述合并后的目标问答对进行审核的步骤。
此外,为实现上述目的,本发明还提供一种问答对构建装置,所述问答对构建装置包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的问答对构建程序,所述问答对构建程序被所述处理器执行时实现如上所述的问答对构建方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有问答对构建程序,所述问答对构建程序被处理器执行时实现如上所述的问答对构建方法的步骤。
本发明提出的一种问答对构建方法,首先获取人工客服与用户的对话记录,并基于预设规则对对话记录进行处理,得到目标对话记录,以便根据该目标对话记录确定标准形式问答对,进一步对标准形式问答对进行过滤处理,得到目标问答对,最后对目标问答对进行合并,并输出合并后的目标问答对,以供管理员对其进行审核。通过本发明提出的问答对构建方法,对人工客服与用户的对话记录进行处理,从中挖掘出精准高效的问答对,减少问答对构建对传统的人工编辑的依赖程度,使得问答对构建更加系统化和规范化,提高了问答对构建的效率和准确性。
附图说明
图1为本发明实施例方案涉及的硬件运行环境的装置结构示意图;
图2为本发明问答对构建方法第一实施例的流程示意图;
图3为本发明问答对构建方法第二实施例的流程示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例的主要解决方案是:获取人工客服与用户的对话记录,并基于预设规则对所述对话记录进行处理,得到目标对话记录;基于所述目标对话记录确定标准形式问答对,并对所述标准形式问答对进行过滤处理,得到目标问答对;对所述目标问答对进行合并,并输出所述合并后的目标问答对,以供管理员进行审核。通过本发明实施例的技术方案,解决了现有技术中知识库因过于依赖传统的人工编辑导致的知识库构建、更新及维护存在缺陷的技术问题。
如图1所示,图1是本发明实施例方案涉及的硬件运行环境的装置结构示意图。
本发明实施例装置可以是PC,也可以是智能手机、平板电脑、便携计算机等具有显示功能的可移动式终端设备。
如图1所示,该装置可以包括:处理器1001,例如CPU,通信总线1002,用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
可选地,装置还可以包括摄像头、RF(Radio Frequency,射频)电路,传感器、音频电路、Wi-Fi模块等等。当然,装置还可配置陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
本领域技术人员可以理解,图1中示出的装置结构并不构成对装置的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及问答对构建程序。
在图1所示的装置中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端(用户端),与客户端进行数据通信;而处理器1001、存储器1005可以设置在问答对构建装置中,所述问答对构建装置通过处理器1001调用存储器1005中存储的问答对构建程序,并执行以下操作:
获取人工客服与用户的对话记录,并基于预设规则对所述对话记录进行处理,得到目标对话记录;
基于所述目标对话记录确定标准形式问答对,并对所述标准形式问答对进行过滤处理,得到目标问答对;
对所述目标问答对进行合并,并输出所述合并后的目标问答对,以供管理员进行审核。
进一步地,处理器1001可以调用存储器1005中存储的问答对构建程序,还执行以下操作:
对所述人工客服对话记录和用户对话记录中的欢迎语和结束语进行过滤处理,得到过滤后的对话记录;
将所述用户标识信息相同的对话记录进行合并,得到所述用户标识信息对应的完整对话记录;
基于时间顺序对所述完整对话记录进行重组,得到目标对话记录。
进一步地,处理器1001可以调用存储器1005中存储的问答对构建程序,还执行以下操作:
获取预设的包含结束语和欢迎语的数据库,并基于所述数据库判断所述人工客服对话记录和用户对话记录中是否包含所述结束语和欢迎语,以便对所述结束语和欢迎语进行过滤。
进一步地,处理器1001可以调用存储器1005中存储的问答对构建程序,还执行以下操作:
获取所述目标对话记录中连续的人工客服对话记录和/或用户对话记录,并将所述连续的人工客服对话记录和/或用户对话记录进行合并,得到标准形式问答对,其中,所述标准形式问答对中至少包括一个问题和一个对应的答案。
进一步地,处理器1001可以调用存储器1005中存储的问答对构建程序,还执行以下操作:
判断所述标准形式问答对中的问题和答案中是否包含疑问词;
若所述标准形式问答对中的问题中不包含疑问词,和/或所述标准形式问答对中的答案中包含疑问词,则将所述标准形式问答对进行过滤处理;
若所述标准形式问答对中的问题中包含疑问词,且所述标准形式问答对中的答案中不包含疑问词,则将所述标准形式问答对确定为目标问答对。
进一步地,处理器1001可以调用存储器1005中存储的问答对构建程序,还执行以下操作:
判断所述目标问答对中是否存在答案相同的问答对;
若是,则将所述答案相同的问答对进行合并,其中,所述合并后的问答对中包含所述相同的答案和所述答案相同的问答对中对应的不同的问题;
输出所述合并后的目标问答对,以供管理员对所述合并后的目标问答对进行审核。
进一步地,处理器1001可以调用存储器1005中存储的问答对构建程序,还执行以下操作:
判断所述答案相同的问答对的个数是否超过预设个数阈值;
若否,则从所述目标问答对中过滤所述答案相同的问答对;
若是,则执行所述输出所述合并后的目标问答对,以供管理员对所述合并后的目标问答对进行审核的步骤。
本实施例提供的方案,首先获取人工客服与用户的对话记录,并基于预设规则对对话记录进行处理,得到目标对话记录,以便根据该目标对话记录确定标准形式问答对,进一步对标准形式问答对进行过滤处理,得到目标问答对,最后对目标问答对进行合并,并输出合并后的目标问答对,以供管理员对其进行审核。通过本发明提出的问答对构建方法,对人工客服与用户的对话记录进行处理,从中挖掘出精准高效的问答对,减少问答对构建对传统的人工编辑的依赖程度,使得问答对构建更加系统化和规范化,提高了问答对构建的效率和准确性。
基于上述硬件结构,提出本发明问答对构建方法实施例。
参照图2,图2为本发明问答对构建方法第一实施例的流程示意图,在该实施例中,所述方法包括:
步骤S10,获取人工客服与用户的对话记录,并基于预设规则对所述对话记录进行处理,得到目标对话记录;
为了解决现有知识库过度依赖于传统的人工编辑,并且在知识库构建、更新和维护上存在缺陷的问题,本发明提出了一种问答对构建方法,通过智能学习技术从人工客服与用户的对话数据中挖掘出精准高效的问答对,以此来构建知识库,知识库管理员不需要完成知识库编辑任务,只用实现最后的知识库审核即可,以此来解决原有知识库构建存在的缺陷。
在本实施例中,首先获取人工客服与用户的原始对话记录,以便从该原始记录中挖掘出问答对。可以理解的是,原始对话记录中包括人工客服的对话记录和用户对话记录,并且该对话记录是以日志的形式进行存储的,所以人工客服对话记录和用户对话记录对应有不同的人工客服标识信息和用户标识信息,在日志记录中是以mainSessionId和childSessionId这两个不同的字段来区分的,其中,childSessionId表示的是人工客服的对话,若childSessionId字段为空,表明当前对话不是由人工客服回复的,mainSessionId对应的则是用户对话,且不同的人工客服和用户对应的childSessionId和mainSessionId不同,以此区分不同的人工客服和用户。
进一步地,获取人工客服与用户的对话记录后,首先基于预设规则对其进行处理,以得到目标对话记录,具体地,所述基于预设规则对所述对话记录进行处理,得到目标对话记录的步骤包括:
步骤a,对所述人工客服对话记录和用户对话记录中的欢迎语和结束语进行过滤处理,得到过滤后的对话记录;
在原始的对话记录中,存在大量的没有实际意义的对话记录,因此需要对其中无意义的对话记录进行过滤处理。首先是对对话记录中的欢迎语和结束语进行过滤处理,例如“尊敬的用户,您好”“感谢”“请为本次服务评分,回复1为非常满意,回复2为满意,回复3为不满意,3#不满意的内容”等内容,均为无意义的对话记录,需对其进行过滤。
具体地,对结束语和欢迎语的过滤,可以通过人工构建一个包含结束语和欢迎语的数据库来实现,在该数据库中记录大量的观察数据,基于数据库来人工客服对话记录和用户对话记录中是否包含有对应的结束语和欢迎语,如果有,则对其进行过滤处理。
步骤b,将所述用户标识信息相同的对话记录进行合并,得到所述用户标识信息对应的完整对话记录;
进一步地,过滤后的对话记录中依旧包括人工客服对话记录和用户对话记录,在本实施例中,每一个用户对应有一个人工客服,因此,对对话记录中用户标识信息相同的,也即同一个用户的所有对话记录进行合并,即可确定该用户所对应的完整的对话记录,该完整的对话记录中包括的是该用户和人工客服之间的所有对话。
步骤c,基于时间顺序对所述完整对话记录进行重组,得到目标对话记录。
由于获取的对话记录中人工客服和用户的对话的顺序是混乱的,进一步地,将按照时间顺序对该完整对话记录中的人工客服对话和用户对话进行重组,以形成基于时间顺序的完整的目标对话记录。可以理解的是,还可以进一步地对该目标对话记录进行过滤处理,例如,若目标对话记录中存在信息不全的对话记录,如存在图片或表情等,则可对其进行过滤处理,以使得目标对话记录更准确。
步骤S20,基于所述目标对话记录确定标准形式问答对,并对所述标准形式问答对进行过滤处理,得到目标问答对;
目标对话记录中包含的是用户和人工客服之间的基于时间顺序的对话,这其中可能出现连续对话记录的情况,例如,用户咨询一个问题,而人工客服基于该问题回答了两次,也即是存在一次用户对话记录和连续两次人工客服对话记录的情况,如Q、A1、A2的形式;或者是用户提出了两个问题,而人工客服只进行了一次回答,如Q1、Q2、A1的形式,此时需要对对话记录中出现的连续的人工客服对话记录和/或用户对话记录进行合并,也就是对上述第一种情况中的A1、A2进行合并,得到标准形式的问答对,即一个问题对应一个答案,如Q1、A1,Q2、A2的形式。
进一步地,对确定的标准形式问答对进行过滤处理,得到目标问答对,具体包括:
判断所述标准形式问答对中的问题和答案中是否包含疑问词;
若所述标准形式问答对中的问题中不包含疑问词,和/或所述标准形式问答对中的答案中包含疑问词,则将所述标准形式问答对进行过滤处理;
若所述标准形式问答对中的问题中包含疑问词,且所述标准形式问答对中的答案中不包含疑问词,则将所述标准形式问答对确定为目标问答对。
对标准形式问答对中的问题和答案中是否包含疑问词进行判断,同时,要求问题中包含疑问词、答案中不包含疑问词的标准形式问答对才是目标问答对,也就是说,要求用户端要提出对应的问题,而人工客服端要解决问题;如果标准形式问答对中的问题中不包含疑问词,和/或标准形式问答对中的答案中包含疑问词,则将该标准形式问答对视为无用问答对,并进行过滤处理。
同样地,对问答对中的问题和答案是否包含疑问词的判断,也可以通过建立包含疑问词的数据库来实现,基于该数据库中的疑问词对标准形式问答对中的问题和答案进行疑问词包含与否的判断,以实现标准形式问答对的过滤。
进一步地,对标准形式问答对进行过滤处理的过程中,还可以过滤其中不包含中文的问答对,或者是问题中只包含疑问词的问答对,或者是回答中只包含无意义停用词的问答对,以提高目标问答对的准确度。
步骤S30,对所述目标问答对进行合并,并输出所述合并后的目标问答对,以供管理员进行审核。
进一步地,为了减少管理员对问答对的审核量,通过对过滤后的目标问答对进行合并处理,以减少最终输出的合并后的目标问答对的数量。具体地,对目标问答对的合并是基于目标问答对中的答案是否相同来实现的。
在本实施例中,首先获取人工客服与用户的对话记录,并基于预设规则对对话记录进行处理,得到目标对话记录,以便根据该目标对话记录确定标准形式问答对,进一步对标准形式问答对进行过滤处理,得到目标问答对,最后对目标问答对进行合并,并输出合并后的目标问答对,以供管理员对其进行审核。通过本发明提出的问答对构建方法,对人工客服与用户的对话记录进行处理,从中挖掘出精准高效的问答对,减少问答对构建对传统的人工编辑的依赖程度,使得问答对构建更加系统化和规范化,提高了问答对构建的效率和准确性。
进一步的,参照图3,基于上述实施例,提出本发明问答对构建方法第二实施例,在本实施例中,所述步骤S30包括:
步骤S31,判断所述目标问答对中是否存在答案相同的问答对;若是,则执行步骤S32;
步骤S32,将所述答案相同的问答对进行合并,其中,所述合并后的问答对中包含所述相同的答案和所述答案相同的问答对中对应的不同的问题;
步骤S33,输出所述合并后的目标问答对,以供管理员对所述合并后的目标问答对进行审核。
在本实施例中,通过对过滤后的目标问答对进行合并处理,减少管理员对问答对的审核量。具体地,目标问答对中对应的问答对的形式都是一个问题仅对应一个答案,首先,对目标问答对中是否存在答案相同的问答对进行判断,例如,存在目标问答对Q1、A和Q2、A,则这两个目标问答对就是答案相同的问答对,即可对这两个问答对进行合并处理,合并后的形式为Q1、Q2、A。当然,目标问答对中答案相同的问答对可以包括多个,只需要将这多个问答对中的问题及该相同的答案合并至同一个问答对中即可,如Q1、Q2、Q3…A,并将合并后的目标问答对输出,以供管理员对问答对进行审核。
进一步地,所述步骤S32之后,还可以包括:
判断所述答案相同的问答对的个数是否超过预设个数阈值;
若否,则从所述目标问答对中过滤所述答案相同的问答对;
若是,则执行所述输出所述合并后的目标问答对,以供管理员对所述合并后的目标问答对进行审核的步骤。
进一步地,可以设置相应的预设个数阈值,对答案相同的问答对的个数是否超过预设个数阈值进行判断,例如,将预设个数阈值设置为3,如果答案相同的问答对的个数只有两个,则可以视为这两个答案相同而问题不同的问答对的实用性较低,可以对其进行过滤处理;如果答案相同的问答对的个数超过了预设个数阈值,则可以对其进行合并、输出,以便进行审核。
在本实施例中,当得到目标问答对后,还可以通过判断目标问答对中是否存在答案相同的问答对,并将答案相同的问答对进行合并,来减少管理员对问答对进行审核的数量,提高了问答对审核效率。
此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有问答对构建程序,所述问答对构建程序被处理器执行时实现如下操作:
获取人工客服与用户的对话记录,并基于预设规则对所述对话记录进行处理,得到目标对话记录;
基于所述目标对话记录确定标准形式问答对,并对所述标准形式问答对进行过滤处理,得到目标问答对;
对所述目标问答对进行合并,并输出所述合并后的目标问答对,以供管理员进行审核。
进一步地,所述问答对构建程序被处理器执行时还实现如下操作:
对所述人工客服对话记录和用户对话记录中的欢迎语和结束语进行过滤处理,得到过滤后的对话记录;
将所述用户标识信息相同的对话记录进行合并,得到所述用户标识信息对应的完整对话记录;
基于时间顺序对所述完整对话记录进行重组,得到目标对话记录。
进一步地,所述问答对构建程序被处理器执行时还实现如下操作:
获取预设的包含结束语和欢迎语的数据库,并基于所述数据库判断所述人工客服对话记录和用户对话记录中是否包含所述结束语和欢迎语,以便对所述结束语和欢迎语进行过滤。
进一步地,所述问答对构建程序被处理器执行时还实现如下操作:
获取所述目标对话记录中连续的人工客服对话记录和/或用户对话记录,并将所述连续的人工客服对话记录和/或用户对话记录进行合并,得到标准形式问答对,其中,所述标准形式问答对中至少包括一个问题和一个对应的答案。
进一步地,所述问答对构建程序被处理器执行时还实现如下操作:
判断所述标准形式问答对中的问题和答案中是否包含疑问词;
若所述标准形式问答对中的问题中不包含疑问词,和/或所述标准形式问答对中的答案中包含疑问词,则将所述标准形式问答对进行过滤处理;
若所述标准形式问答对中的问题中包含疑问词,且所述标准形式问答对中的答案中不包含疑问词,则将所述标准形式问答对确定为目标问答对。
进一步地,所述问答对构建程序被处理器执行时还实现如下操作:
判断所述目标问答对中是否存在答案相同的问答对;
若是,则将所述答案相同的问答对进行合并,其中,所述合并后的问答对中包含所述相同的答案和所述答案相同的问答对中对应的不同的问题;
输出所述合并后的目标问答对,以供管理员对所述合并后的目标问答对进行审核。
进一步地,所述问答对构建程序被处理器执行时还实现如下操作:
判断所述答案相同的问答对的个数是否超过预设个数阈值;
若否,则从所述目标问答对中过滤所述答案相同的问答对;
若是,则执行所述输出所述合并后的目标问答对,以供管理员对所述合并后的目标问答对进行审核的步骤。
本实施例提供的方案,首先获取人工客服与用户的对话记录,并基于预设规则对对话记录进行处理,得到目标对话记录,以便根据该目标对话记录确定标准形式问答对,进一步对标准形式问答对进行过滤处理,得到目标问答对,最后对目标问答对进行合并,并输出合并后的目标问答对,以供管理员对其进行审核。通过本发明提出的问答对构建方法,对人工客服与用户的对话记录进行处理,从中挖掘出精准高效的问答对,减少问答对构建对传统的人工编辑的依赖程度,使得问答对构建更加系统化和规范化,提高了问答对构建的效率和准确性。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种问答对构建方法,其特征在于,所述问答对构建方法包括以下步骤:
获取人工客服与用户的对话记录,并基于预设规则对所述对话记录进行处理,得到目标对话记录;
基于所述目标对话记录确定标准形式问答对,并对所述标准形式问答对进行过滤处理,得到目标问答对;
对所述目标问答对进行合并,并输出所述合并后的目标问答对,以供管理员进行审核。
2.如权利要求1所述的问答对构建方法,其特征在于,所述对话记录中包括人工客服对话记录和用户对话记录,所述人工客服对话记录和用户对话记录对应有不同的人工客服标识信息和用户标识信息。
3.如权利要求2所述的问答对构建方法,其特征在于,所述基于预设规则对所述对话记录进行处理,得到目标对话记录的步骤包括:
对所述人工客服对话记录和用户对话记录中的欢迎语和结束语进行过滤处理,得到过滤后的对话记录;
将所述用户标识信息相同的对话记录进行合并,得到所述用户标识信息对应的完整对话记录;
基于时间顺序对所述完整对话记录进行重组,得到目标对话记录。
4.如权利要求3所述的问答对构建方法,其特征在于,所述对所述人工客服对话记录和用户对话记录中的欢迎语和结束语进行过滤处理的步骤包括:
获取预设的包含结束语和欢迎语的数据库,并基于所述数据库判断所述人工客服对话记录和用户对话记录中是否包含所述结束语和欢迎语,以便对所述结束语和欢迎语进行过滤。
5.如权利要求4所述的问答对构建方法,其特征在于,所述基于所述目标对话记录确定标准形式问答对的步骤包括:
获取所述目标对话记录中连续的人工客服对话记录和/或用户对话记录,并将所述连续的人工客服对话记录和/或用户对话记录进行合并,得到标准形式问答对,其中,所述标准形式问答对中至少包括一个问题和一个对应的答案。
6.如权利要求5所述的问答对构建方法,其特征在于,所述对所述标准形式问答对进行过滤处理,得到目标问答对的步骤包括:
判断所述标准形式问答对中的问题和答案中是否包含疑问词;
若所述标准形式问答对中的问题中不包含疑问词,和/或所述标准形式问答对中的答案中包含疑问词,则将所述标准形式问答对进行过滤处理;
若所述标准形式问答对中的问题中包含疑问词,且所述标准形式问答对中的答案中不包含疑问词,则将所述标准形式问答对确定为目标问答对。
7.如权利要求6所述的问答对构建方法,其特征在于,所述对所述目标问答对进行合并,并输出所述合并后的目标问答对,以供管理员进行审核的步骤包括:
判断所述目标问答对中是否存在答案相同的问答对;
若是,则将所述答案相同的问答对进行合并,其中,所述合并后的问答对中包含所述相同的答案和所述答案相同的问答对中对应的不同的问题;
输出所述合并后的目标问答对,以供管理员对所述合并后的目标问答对进行审核。
8.如权利要求7所述的问答对构建方法,其特征在于,所述若是,则将所述答案相同的问答对进行合并的步骤之后,还包括:
判断所述答案相同的问答对的个数是否超过预设个数阈值;
若否,则从所述目标问答对中过滤所述答案相同的问答对;
若是,则执行所述输出所述合并后的目标问答对,以供管理员对所述合并后的目标问答对进行审核的步骤。
9.一种问答对构建装置,其特征在于,所述问答对构建装置包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的问答对构建程序,所述问答对构建程序被所述处理器执行时实现如权利要求1至8中任一项所述的问答对构建方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有问答对构建程序,所述问答对构建程序被处理器执行时实现如权利要求1至8中任一项所述的问答对构建方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811029233.9A CN109189803A (zh) | 2018-09-03 | 2018-09-03 | 问答对构建方法、装置及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811029233.9A CN109189803A (zh) | 2018-09-03 | 2018-09-03 | 问答对构建方法、装置及计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109189803A true CN109189803A (zh) | 2019-01-11 |
Family
ID=64914713
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811029233.9A Pending CN109189803A (zh) | 2018-09-03 | 2018-09-03 | 问答对构建方法、装置及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109189803A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110955769A (zh) * | 2019-12-17 | 2020-04-03 | 联想(北京)有限公司 | 一种处理流的构建方法和电子设备 |
CN111062612A (zh) * | 2019-12-17 | 2020-04-24 | 联想(北京)有限公司 | 一种辅助处理流的构建方法和电子设备 |
CN113010658A (zh) * | 2021-04-08 | 2021-06-22 | 深圳市一号互联科技有限公司 | 一种智能问答知识库构建方法、系统、终端以及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101599071A (zh) * | 2009-07-10 | 2009-12-09 | 华中科技大学 | 对话文本主题的自动提取方法 |
US20110125734A1 (en) * | 2009-11-23 | 2011-05-26 | International Business Machines Corporation | Questions and answers generation |
CN107066541A (zh) * | 2017-03-13 | 2017-08-18 | 平安科技(深圳)有限公司 | 客服问答数据的处理方法及系统 |
CN108415980A (zh) * | 2018-02-09 | 2018-08-17 | 平安科技(深圳)有限公司 | 问答数据处理方法、电子装置及存储介质 |
-
2018
- 2018-09-03 CN CN201811029233.9A patent/CN109189803A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101599071A (zh) * | 2009-07-10 | 2009-12-09 | 华中科技大学 | 对话文本主题的自动提取方法 |
US20110125734A1 (en) * | 2009-11-23 | 2011-05-26 | International Business Machines Corporation | Questions and answers generation |
CN107066541A (zh) * | 2017-03-13 | 2017-08-18 | 平安科技(深圳)有限公司 | 客服问答数据的处理方法及系统 |
CN108415980A (zh) * | 2018-02-09 | 2018-08-17 | 平安科技(深圳)有限公司 | 问答数据处理方法、电子装置及存储介质 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110955769A (zh) * | 2019-12-17 | 2020-04-03 | 联想(北京)有限公司 | 一种处理流的构建方法和电子设备 |
CN111062612A (zh) * | 2019-12-17 | 2020-04-24 | 联想(北京)有限公司 | 一种辅助处理流的构建方法和电子设备 |
CN111062612B (zh) * | 2019-12-17 | 2022-08-19 | 联想(北京)有限公司 | 一种辅助处理流的构建方法和电子设备 |
CN113010658A (zh) * | 2021-04-08 | 2021-06-22 | 深圳市一号互联科技有限公司 | 一种智能问答知识库构建方法、系统、终端以及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109615116A (zh) | 一种电信诈骗事件检测方法和检测系统 | |
CN109818942A (zh) | 一种基于时序特征的用户帐号异常检测方法及装置 | |
CN109189803A (zh) | 问答对构建方法、装置及计算机可读存储介质 | |
CN105224462B (zh) | 控件元素的识别方法和装置 | |
CN111475694B (zh) | 一种数据处理方法、装置、终端及存储介质 | |
CN107909466A (zh) | 客户关系网络展示方法、装置、设备及可读存储介质 | |
CN103324728B (zh) | 移动终端的应用程序查找方法和装置 | |
CN105825129A (zh) | 一种融合通信中恶意软件鉴别方法和系统 | |
CN106648881A (zh) | 一种游戏数据的分析、处理方法和装置 | |
CN109039812A (zh) | 端口检测方法、系统和计算机可读存储介质 | |
CN109144852A (zh) | 静态代码的扫描方法、装置、计算机设备及存储介质 | |
CN107870859A (zh) | 大批量对比测试方法及系统 | |
CN115687659A (zh) | 基于人工智能的erp信息发布方法及ai系统 | |
CN107577769A (zh) | 一种计量专业数据的挖掘方法及系统 | |
US8538987B1 (en) | Care agent call classification | |
CN112783799B (zh) | 软件守护测试方法及装置 | |
CN116467110A (zh) | 一种平板电脑的损坏检测方法及系统 | |
CN108090033A (zh) | 人名检测方法、装置、计算机可读介质及设备 | |
CN112784185A (zh) | 一种基于信息点的信息管理方法以及相关装置 | |
CN112256836A (zh) | 记录数据的处理方法、装置和服务器 | |
CN114189585A (zh) | 骚扰电话异常检测方法、装置及计算设备 | |
CN106022024B (zh) | 一种基于图像识别实现系统登录的方法和终端 | |
CN111274143A (zh) | 埋点测试方法、装置、设备及存储介质 | |
CN112800005B (zh) | 一种文件系统深度检查方法、系统、终端及存储介质 | |
CN114706960B (zh) | 一种基于云计算的档案信息查验方法及档案查验终端 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190111 |
|
RJ01 | Rejection of invention patent application after publication |