WO2018166115A1

WO2018166115A1 - 客服问答数据的处理方法、电子装置及计算机可读存储介质

Info

Publication number: WO2018166115A1
Application number: PCT/CN2017/091372
Authority: WO
Inventors: 王健宗; 袁威强; 韩茂琨; 肖京
Original assignee: 平安科技（深圳）有限公司
Priority date: 2017-03-13
Filing date: 2017-06-30
Publication date: 2018-09-20
Also published as: CN107066541A

Abstract

一种客服问答数据的处理方法、电子装置及存储介质，所述客服问答数据的处理方法包括：从客服问答数据库获取预存的问答日志，并基于预设时间内客服与客户的问答对应关系对所述问答日志进行分组（S1）；对各分组中的问答日志按照预定的问题与答案的匹配规则进行匹配，以得出待加入至客服知识库中的问题答案对（S2）。上述基于客服问答数据库的问答日志自动匹配得出问题答案对，不需要客服人员进行编写，问题答案对的覆盖面广、构建效率高且更新速度快。

Description

客服问答数据的处理方法、电子装置及计算机可读存储介质

优先权申明

本申请基于巴黎公约申明享有2017年3月13日递交的申请号为CN201710147702.6、名称为“客服问答数据的处理方法及系统”中国专利申请的优先权，该中国专利申请的整体内容以参考的方式结合在本申请中。

技术领域

本发明涉及计算机软件技术领域，尤其涉及一种客服问答数据的处理方法、电子装置及计算机可读存储介质。

背景技术

目前，客服自动问答系统一般是基于问题答案对作为知识库进行设计的，根据用户的问题检索到知识库中最相似的问题，再根据知识库中已有的问题答案对(即问题与答案的映射对)，直接给出回答。在这种系统设计框架下，有三个主要核心：问题理解、检索算法以及知识库构建。对于知识库，传统的构建方法一般是由具备多年专业经验的客服人员人工进行编写，这种构建知识库的方式存在的不足之处为：问题答案对的覆盖面窄、构建效率低且更新速度慢。

发明内容

本发明的目的在于提供一种客服问答数据的处理方法、电子装置及计算机可读存储介质，旨在基于客服问答数据库的问答日志自动匹配得出问题答案对，且问题答案对的覆盖面广、构建效率高且更新速度快。

本发明第一方面提供一种客服问答数据的处理方法，所述客服问答数据的处理方法包括：

S1，从客服问答数据库获取预存的问答日志，并基于预设时间内客服与客户的问答对应关系对所述问答日志进行分组；

S2，对各分组中的问答日志按照预定的问题与答案的匹配规则进行匹配，以得出待加入至客服知识库中的问题答案对。

优选地，所述步骤S1包括：

将预设时间内的同一客户与同一客服的问答日志分为同一分组；或

将预设时间内的同一客户与各客服的问答日志分为同一分组；或

将预设时间内的各客户与同一客服的问答日志分为同一分组。

本发明第二方面提供一种电子装置，包括处理设备、存储设备及客服问答数据的处理系统，该客服问答数据的处理系统存储于该存储设备中，包括至少一个计算机可读指令，该至少一个计算机可读指令可被所述处理设备执行，以实现以下操作：

本发明第三方面提供一种计算机可读存储介质，其上存储有至少一个可被处理设备执行以实现以下操作的计算机可读指令：

本发明的有益效果是：本发明在构建客服知识库时，由客服问答数据的处理系统自动从客服问答数据库中获取问答日志，对问答日志进行分组，使得同一分组中的问答日志具有某些相同的属性，对于每一分组中具有某些相同属性的问答日志按照预定的问题与答案的匹配规则进行匹配，以匹配得出待加入至客服知识库问题答案对，本发明基于客服问答数据库的问答日志自动匹配得出问题答案对，不需要客服人员进行编写，问题答案对的覆盖面广、构建效率高且更新速度快。

附图说明

图1是本发明实现客服问答数据的处理方法的一实施例的应用环境示意图；

图2为本发明客服问答数据的处理方法一实施例的流程示意图；

图3为图2所示步骤S2的细化流程示意图；

图4为本发明客服问答数据的处理系统一实施例的结构示意图；

图5为图4所示匹配模块的结构示意图。

具体实施方式

以下结合附图对本发明的原理和特征进行描述，所举实例只用于解释本发明，并非用于限定本发明的范围。

参阅图1所示，是本发明实现客服问答数据的处理方法的一实施例的应用环境示意图。所述应用环境示意图包括电子装置1、终端设备2。所述电子装置1可以通过网络、近场通信技术等适合的技术与所述终端设备2进行数据交互。

终端设备2包括，但不限于，任何一种可与用户通过键盘、鼠标、遥控器、触摸板或者声控设备等方式进行人机交互的电子产品，例如，个人计算机、平板电脑、智能手机、个人数字助理(Personal Digital Assistant，PDA)，游戏机、交互式网络电视(Internet Protocol Television,IPTV)、智能式穿戴设备等。

电子装置1是一种能够按照事先设定或者存储的指令，自动进行数值计算和/或信息处理的设备。电子装置1可以是计算机、也可以是单个网络服务器、多个网络服务器组成的服务器组或者基于云计算的由大量主机或者网络服务器构成的云，其中云计算是分布式计算的一种，由一群松散耦合的计算机集组成的一个超级虚拟计算机。

在本实施例中，电子装置1包括，但不仅限于，可通过系统总线相互通信连接的存储设备11、处理设备12、及网络接口13。需要指出的是，图1仅示出了具有组件11-13的电子装置1，但是应理解的是，并不要求实施所有示出的组件，可以替代的实施更多或者更少的组件。

其中，存储设备11包括内存及至少一种类型的可读存储介质。内存为电子装置1的运行提供缓存；可读存储介质可为如闪存、硬盘、多媒体卡、卡型存储器等的非易失性存储介质。在一些实施例中，可读存储介质可以是电子装置1的内部存储单元，例如该电子装置1的硬盘；在另一些实施例中，该非易失性存储介质也可以是电子装置1的外部存储设备，例如电子装置1上配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)等。本实施例中，存储设备11的可读存储介质通常用于存储安装于电子装置1的操作系统和各类应用软件，例如本申请一实施例中的客服问答数据的处理系统10的程序代码等。此外，存储设备11还可以用于暂时地存储已经输出或者将要输出的各类数据。

处理设备12在一些实施例中可以包括一个或者多个微处理器、微控制器、数字处理器等。该处理设备12通常用于控制电子装置1的运行，例如执行与终端设备2进行数据交互或者通信相关的控制和处理等。在本实施例中，处理设备12用于运行存储设备11中存储的程序代码或者处理数据，例如运行客服问答数据的处理系统10等。

网络接口13可包括无线网络接口或有线网络接口，该网络接口13通常用于在电子装置1与其他电子设备之间建立通信连接。本实施例中，网络接口13主要用于将电子装置1与一个或多个终端设备2相连，在电子装置1与一个或多个终端设备2之间建立数据传输通道和通信连接。

客服问答数据的处理系统10包括至少一个存储在存储设备11中的计算机可读指令，该至少一个计算机可读指令可被处理设备12执行，以实现本申请各实施例的控件响应区域显示控制方法。如后续所述，该至少一个计算机可读指令依据其各部分所实现的功能不同，可被划为不同的逻辑模块。

在一实施例中，客服问答数据的处理系统10被处理设备12执行时，实现以下操作：从客服问答数据库获取预存的问答日志，并基于预设时间内客服与客户的问答对应关系对所述问答日志进行分组；对各分组中的问答日志按照预定的问题与答案的匹配规则进行匹配，以得出待加入至客服知识库中的问题答案对。

如图2所示，图2为本发明客服问答数据的处理方法一实施例的流程示意图，该客服问答数据的处理方法包括以下步骤：

步骤S1，从客服问答数据库获取预存的问答日志，并基于预设时间内客服与客户的问答对应关系对所述问答日志进行分组；

本实施例中，客服问答数据库中存储有所有的人工客服与客户对话过程中产生的问答日志，客服问答数据的处理系统与客服问答数据库通信连接，能够自动从客服问答数据库中获取问答日志，以进行进一步的处理。

本实施例中，可以实时地从客服问答数据库中获取问答日志，例如实时地获取新增的客服与客户的问答日志；也可以定时地从客服问答数据库中获取问答日志，例如每隔6小时从客服问答数据库中获取问答日志。通过实时或定时地获取客服问答数据库中的问答日志，以获取最新的问答日志。

然后，对获取的问答日志基于预设时间内客服与客户的问答对应关系进行分组，例如，一天内某一客服当天内与k个客户进行问答对话，则将该客服当天内与k个客户进行问答对话对应的问答日志分为一组。对问答日志进行分组的主要目的在于，将具有共同属性的问答日志归为一组，以方便后续进行处理分析。

步骤S2，对各分组中的问答日志按照预定的问题与答案的匹配规则进行匹配，以得出待加入至客服知识库中的问题答案对。

本实施例中，对各分组中的问答日志按照预定的问题与答案的匹配规则进行匹配，例如按照提问的时间及回答的时间的先后顺序先提取出问答日志中的问题语句及回答语句，分析问题语句中的长度及所包括的业务关键词等，分析回答语句的长度及业务关键词是否与问题语句中的业务关键词对应等等，根据上述的分析结果将问题语句及回答语句进行配对；又如，按照提问的时间及回答的时间的先后顺序先提取出问答日志中的问题语句及回答语句，分析问题语句中的业务关键词及对业务关键词进行扩展，分析回答语句是否与该业务关键词对应或者与该业务关键词进行扩展后的词语对应，根据上述的分析结果将问题语句及回答语句进行配对，等等。当然，本实施例按照预定的问题与答案的匹配规则进行匹配不限定上述的这两种方式，其他能够将问题语句及回答语句进行匹配以完成配对的方式也在本实施例的保护范围内。

本实施例中，在将问题语句与回答语句进行匹配以配对出问题答案对之后，将问题答案对加入至客服知识库中，以不断地增加或丰富客服知识库中的知识。

与现有技术相比，本实施例在构建客服知识库时，由客服问答数据的处理系统自动从客服问答数据库中获取问答日志，对问答日志进行分组，使得同一分组中的问答日志具有某些相同的属性，对于每一分组中具有某些相同属性的问答日志按照预定的问题与答案的匹配规则进行匹配，以匹配得出待加入至客服知识库问题答案对，本实施例基于客服问答数据库的问答日志自动匹配得出问题答案对，不需要客服人员进行编写，问题答案对的覆盖面广、构建效率高且更新速度快。

在一优选的实施例中，在上述图2的实施例的基础上，上述步骤S1包括：将同一预设时间内的同一客户与同一客服的问答日志分为同一分组，例如以预设时间(例如一天或者一周)为划分依据，将同一天内的同一客户与同一客服的问答日志分为同一分组，例如问答日志包括：客户A与客服a的问答日志1、客户A与客服a的问答日志2、客户A与客服b的问答日志3、/客服B与客户a的问答日志4、客服B与客户b的问答日志5，则将问答日志1及2分为一组，其他的问答日志3、4及5各自为一组；或

将同一预设时间内的同一客户与各客服的问答日志分为同一分组，例如将上述的问答日志1、2及3分为一组，将问答日志4及5分为一组；或

将预设时间内的各客户与同一客服的问答日志分为同一分组，例如将上述的问答日志1、2及4分为一组，将问答日志3及5分为一组。当然本实施例不限定于上述的分组方式。

本实施例经过分组后的问答日志具有某些相同的属性，例如同一客户可能提问相似的问题，其提问语句具有相似的特点，或者同一客服可能回答类似的问题，其回答语句具有相似的特点，具有相同的属性的问答日志能够为后续进一步的分析提供便利。

在一优选的实施例中，如图3所示，在上述图2的实施例的基础上，上述步骤S2包括：

S21，对每一分组中的问答日志进行数据预处理；

S22，对数据预处理后的问答日志中的客户的问题语句和客服的回答语句按照预设的分析规则进行分析，以分析出待匹配的问题语句与对应的回答语句；

S23，抽取待匹配的问题语句与对应的回答语句，将抽取出的问题语句与对应的回答语句关联为问题答案对并将问题答案对加入至客服知识库中。

本实施例中，对每一分组中的问答日志进行数据预处理，优选地，进行数据预处理包括：将每一分组中的问答日志中的字体统一转换为繁体字或者简体字、将每一分组中的问答日志中的字母统一转换为大写字母或者小写字母、去除问答日志中的特定语句，以及对每一分组中的问答日志中的语句进行分词处理等等。特定语句包括重复的语句、常用寒暄语(例如经常使用的一些礼貌用语“你好”、“谢谢”等)；对问答日志中的语句进行分词处理可以使用以下三大类的分词方法执行：基于字符串匹配的分词方法、基于理解的分词方法和基于统计的分词方法。

然后，对数据预处理后的问答日志中的客户的问题语句和客服的回答语句按照预设的分析规则进行分析，优选地，预设的分析规则包括问题语句的分析规则及回答语句的分析规则，所述问题语句的分析规则为：

计算问题语句的关键指标值S：

S＝S_a+S_b+S_c，

其中，l为问题语句的长度，长度l可以以分词后的词语个数进行度量，即词语个数越多则长度l越大，m为问题语句所含的业务关键词的数目，m越大则关键指标值S越大，n为问题语句的停用词的数目，n越大则关键指标值S越小，问题质量得分越低，a为问题语句的第一长度预设值，b为问题语句的第二长度预设值，长度l在[a，b]之内时，该问题语句的长度适中，问题质量得分高；长度l在[a，b]之外时，相差越多，问题质量得分越低。

若关键指标值S大于预设指标阈值，例如S>0，则保留所述问题语句作为待匹配的问题语句，或者，若关键指标值S小于或者等于预设指标阈值，例如S<0，则去除所述问题语句。

优选地，回答语句的分析规则为：若回答语句不是陈述性语句，则去除该回答语句及其对应的问题语句。

另外，在分析出待匹配的问题语句与对应的回答语句后，在抽取待匹配的问题语句与对应的回答语句时，如果有重复的问题语句与对应的回答语句，则仅抽取重复的问题语句与对应的回答语句中的一个问题语句与对应的回答语句即可；以及，将待匹配的问题语句与对应的回答语句按照其所包含的关键业务词权重由大至小进行排列，抽取队列中关键业务词权重大于某一预设阈值的待匹配的问题语句与对应的回答语句，将所抽取出来的问题语句与对应的回答语句关联为问题答案对，以将问题答案对加入至客服知识库中。

如图4所示，图4为本发明客服问答数据的处理系统10一实施例的结构示意图，该客服问答数据的处理系统10包括：

分组模块101，用于从客服问答数据库获取预存的问答日志，并基于预设时间内客服与客户的问答对应关系对所述问答日志进行分组；

本实施例中，客服问答数据库中存储有所有的人工客服与客户对话过程中产生的问答日志，客服问答数据的处理系统10与客服问答数据库通信连接，客服问答数据的处理系统10能够自动从客服问答数据库中获取问答日志，以进行进一步的处理。

本实施例中，客服问答数据的处理系统10可以实时地从客服问答数据库中获取问答日志，例如实时地获取新增的客服与客户的问答日志；也可以定时地从客服问答数据库中获取问答日志，例如每隔6小时从客服问答数据库中获取问答日志。通过实时或定时地获取客服问答数据库中的问答日志，以获取最新的问答日志。

匹配模块102，用于对各分组中的问答日志按照预定的问题与答案的匹配规则进行匹配，以得出待加入至客服知识库中的问题答案对。

在一优选的实施例中，在上述图4的实施例的基础上，所述分组模块101具体用于将同一预设时间内的同一客户与同一客服的问答日志分为同一分组，例如以预设时间(例如一天或者一周)为划分依据，将同一天内的同一客户与同一客服的问答日志分为同一分组，例如问答日志包括：客户A与客服a的问答日志1、客户A与客服a的问答日志2、客户A与客服b的问答日志3、/客服B与客户a的问答日志4、客服B与客户b的问答日志5，则将问答日志1及2分为一组，其他的问答日志3、4及5各自为一组；或

在一优选的实施例中，如图5所示，在上述图4的实施例的基础上，匹配模块102包括：

预处理单元1021，用于对每一分组中的问答日志进行数据预处理；

分析单元1022，用于对数据预处理后的问答日志中的客户的问题语句和客服的回答语句按照预设的分析规则进行分析，以分析出待匹配的问题语句与对应的回答语句；

关联单元1023，用于抽取待匹配的问题语句与对应的回答语句，将抽取出的问题语句与对应的回答语句关联为问题答案对并将问题答案对加入至客服知识库中。

本实施例中，对每一分组中的问答日志进行数据预处理，优选地，预处理单元1021具体用于将每一分组中的问答日志中的字体统一转换为繁体字或者简体字、将每一分组中的问答日志中的字母统一转换为大写字母或者小写字母、去除问答日志中的特定语句，以及对每一分组中的问答日志中的语句进行分词处理等等。特定语句包括重复的语句、常用寒暄语(例如经常使用的一些礼貌用语“你好”、“谢谢”等)；对问答日志中的语句进行分词处理可以使用以下三大类的分词方法执行：基于字符串匹配的分词方法、基于理解的分词方法和基于统计的分词方法。

计算问题语句的关键指标值S：

S＝S_a+S_b+S_c，

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

一种客服问答数据的处理方法，其特征在于，所述客服问答数据的处理方法包括：

S1，从客服问答数据库获取预存的问答日志，并基于预设时间内客服与客户的问答对应关系对所述问答日志进行分组；

S2，对各分组中的问答日志按照预定的问题与答案的匹配规则进行匹配，以得出待加入至客服知识库中的问题答案对。
根据权利要求1所述的客服问答数据的处理方法，其特征在于，所述步骤S2包括：

S21，对每一分组中的问答日志进行数据预处理；

S22，对数据预处理后的问答日志中的客户的问题语句和客服的回答语句按照预设的分析规则进行分析，以分析出待匹配的问题语句与对应的回答语句；

S23，抽取待匹配的问题语句与对应的回答语句，将抽取出的问题语句与对应的回答语句关联为问题答案对并将问题答案对加入至客服知识库中。
根据权利要求2所述的客服问答数据的处理方法，其特征在于，所述步骤S21包括：

将每一分组中的问答日志中的字体统一转换为繁体字或者简体字、将每一分组中的问答日志中的字母统一转换为大写字母或者小写字母、去除问答日志中的特定语句，以及对每一分组中的问答日志中的语句进行分词处理。
根据权利要求2所述的客服问答数据的处理方法，其特征在于，所述预设的分析规则包括问题语句的分析规则及回答语句的分析规则，所述问题语句的分析规则为：

计算问题语句的关键指标值S：

S＝S_a+S_b+S_c，
其中，l为问题语句的长度，m为问题语句所含的业务关键词的数目，n为问题语句的停用词的数目，a为问题语句的第一长度预设值，b为问题语句的第二长度预设值；

若关键指标值S大于预设指标阈值，则保留所述问题语句作为待匹配的问题语句，或者，若关键指标值S小于或者等于预设指标阈值，则去除所述问题语句；

所述回答语句的分析规则为：若回答语句不是陈述性语句，则去除所述回答语句及其对应的问题语句。
根据权利要求1所述的客服问答数据的处理方法，其特征在于，所述步骤S1包括：

将预设时间内的同一客户与同一客服的问答日志分为同一分组；或

将预设时间内的同一客户与各客服的问答日志分为同一分组；或

将预设时间内的各客户与同一客服的问答日志分为同一分组。
根据权利要求5所述的客服问答数据的处理方法，其特征在于，所述步骤S2包括：

S21，对每一分组中的问答日志进行数据预处理；

S22，对数据预处理后的问答日志中的客户的问题语句和客服的回答语句按照预设的分析规则进行分析，以分析出待匹配的问题语句与对应的回答语句；

S23，抽取待匹配的问题语句与对应的回答语句，将抽取出的问题语句与对应的回答语句关联为问题答案对并将问题答案对加入至客服知识库中。
根据权利要求6所述的客服问答数据的处理方法，其特征在于，所述步骤S21包括：

将每一分组中的问答日志中的字体统一转换为繁体字或者简体字、将每一分组中的问答日志中的字母统一转换为大写字母或者小写字母、去除问答日志中的特定语句，以及对每一分组中的问答日志中的语句进行分词处理。
根据权利要求6所述的客服问答数据的处理方法，其特征在于，所述预设的分析规则包括问题语句的分析规则及回答语句的分析规则，所述问题语句的分析规则为：

计算问题语句的关键指标值S：

S＝S_a+S_b+S_c，
其中，l为问题语句的长度，m为问题语句所含的业务关键词的数目，n为问题语句的停用词的数目，a为问题语句的第一长度预设值，b为问题语句的第二长度预设值；

若关键指标值S大于预设指标阈值，则保留所述问题语句作为待匹配的问题语句，或者，若关键指标值S小于或者等于预设指标阈值，则去除所述问题语句；

所述回答语句的分析规则为：若回答语句不是陈述性语句，则去除所述回答语句及其对应的问题语句。
一种电子装置，包括处理设备、存储设备及客服问答数据的处理系统，该客服问答数据的处理系统存储于该存储设备中，包括至少一个计算机可读指令，该至少一个计算机可读指令可被所述处理设备执行，以实现以下操作：

S1，从客服问答数据库获取预存的问答日志，并基于预设时间内客服与客户的问答对应关系对所述问答日志进行分组；

S2，对各分组中的问答日志按照预定的问题与答案的匹配规则进行匹配，以得出待加入至客服知识库中的问题答案对。
根据权利要求9所述的电子装置，其特征在于，所述步骤S2包括：

S21，对每一分组中的问答日志进行数据预处理；

S22，对数据预处理后的问答日志中的客户的问题语句和客服的回答语句按照预设的分析规则进行分析，以分析出待匹配的问题语句与对应的回答语句；

S23，抽取待匹配的问题语句与对应的回答语句，将抽取出的问题语句与对应的回答语句关联为问题答案对并将问题答案对加入至客服知识库中。
根据权利要求10所述的电子装置，其特征在于，所述步骤S21包括：

将每一分组中的问答日志中的字体统一转换为繁体字或者简体字、将每一分组中的问答日志中的字母统一转换为大写字母或者小写字母、去除问答日志中的特定语句，以及对每一分组中的问答日志中的语句进行分词处理。
根据权利要求10所述的电子装置，其特征在于，所述预设的分析规则包括问题语句的分析规则及回答语句的分析规则，所述问题语句的分析规则为：

计算问题语句的关键指标值S：

S＝S_a+S_b+S_c，
其中，l为问题语句的长度，m为问题语句所含的业务关键词的数目，n为问题语句的停用词的数目，a为问题语句的第一长度预设值，b为问题语句的第二长度预设值；

若关键指标值S大于预设指标阈值，则保留所述问题语句作为待匹配的问题语句，或者，若关键指标值S小于或者等于预设指标阈值，则去除所述问题语句；

所述回答语句的分析规则为：若回答语句不是陈述性语句，则去除所述回答语句及其对应的问题语句。
根据权利要求9所述的电子装置，其特征在于，所述步骤S1包括：

将预设时间内的同一客户与同一客服的问答日志分为同一分组；或

将预设时间内的同一客户与各客服的问答日志分为同一分组；或

将预设时间内的各客户与同一客服的问答日志分为同一分组。
根据权利要求13所述的电子装置，其特征在于，所述步骤S2包括：

S21，对每一分组中的问答日志进行数据预处理；

S22，对数据预处理后的问答日志中的客户的问题语句和客服的回答语句按照预设的分析规则进行分析，以分析出待匹配的问题语句与对应的回答语句；

S23，抽取待匹配的问题语句与对应的回答语句，将抽取出的问题语句与对应的回答语句关联为问题答案对并将问题答案对加入至客服知识库中。
根据权利要求14所述的电子装置，其特征在于，所述步骤S21包括：

将每一分组中的问答日志中的字体统一转换为繁体字或者简体字、将每一分组中的问答日志中的字母统一转换为大写字母或者小写字母、去除问答日志中的特定语句，以及对每一分组中的问答日志中的语句进行分词处理。
根据权利要求14所述的电子装置，其特征在于，所述预设的分析规则包括问题语句的分析规则及回答语句的分析规则，所述问题语句的分析规则为：

计算问题语句的关键指标值S：

S＝S_a+S_b+S_c，
其中，l为问题语句的长度，m为问题语句所含的业务关键词的数目，n为问题语句的停用词的数目，a为问题语句的第一长度预设值，b为问题语句的第二长度预设值；

若关键指标值S大于预设指标阈值，则保留所述问题语句作为待匹配的问题语句，或者，若关键指标值S小于或者等于预设指标阈值，则去除所述问题语句；

所述回答语句的分析规则为：若回答语句不是陈述性语句，则去除所述回答语句及其对应的问题语句。
一种计算机可读存储介质，其上存储有至少一个可被处理设备执行以实现以下操作的计算机可读指令：

S1，从客服问答数据库获取预存的问答日志，并基于预设时间内客服与客户的问答对应关系对所述问答日志进行分组；

S2，对各分组中的问答日志按照预定的问题与答案的匹配规则进行匹配，以得出待加入至客服知识库中的问题答案对。
根据权利要求17所述的存储介质，其特征在于，所述步骤S2包括：

S21，对每一分组中的问答日志进行数据预处理；

S22，对数据预处理后的问答日志中的客户的问题语句和客服的回答语句按照预设的分析规则进行分析，以分析出待匹配的问题语句与对应的回答语句；

S23，抽取待匹配的问题语句与对应的回答语句，将抽取出的问题语句与对应的回答语句关联为问题答案对并将问题答案对加入至客服知识库中。
根据权利要求18所述的存储介质，其特征在于，所述步骤S21包括：

将每一分组中的问答日志中的字体统一转换为繁体字或者简体字、将每一分组中的问答日志中的字母统一转换为大写字母或者小写字母、去除问答日志中的特定语句，以及对每一分组中的问答日志中的语句进行分词处理。
根据权利要求18所述的存储介质，其特征在于，所述预设的分析规则包括问题语句的分析规则及回答语句的分析规则，所述问题语句的分析规则为：

计算问题语句的关键指标值S：

S＝S_a+S_b+S_c，
其中，l为问题语句的长度，m为问题语句所含的业务关键词的数目，n为问题语句的停用词的数目，a为问题语句的第一长度预设值，b为问题语句的第二长度预设值；

若关键指标值S大于预设指标阈值，则保留所述问题语句作为待匹配的问题语句，或者，若关键指标值S小于或者等于预设指标阈值，则去除所述问题语句；

所述回答语句的分析规则为：若回答语句不是陈述性语句，则去除所述回答语句及其对应的问题语句。