CN107562789A - 知识库问题更新方法、客服机器人以及可读存储介质 - Google Patents

知识库问题更新方法、客服机器人以及可读存储介质 Download PDF

Info

Publication number
CN107562789A
CN107562789A CN201710636463.0A CN201710636463A CN107562789A CN 107562789 A CN107562789 A CN 107562789A CN 201710636463 A CN201710636463 A CN 201710636463A CN 107562789 A CN107562789 A CN 107562789A
Authority
CN
China
Prior art keywords
answer
knowledge base
target
similarity
preparatory condition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710636463.0A
Other languages
English (en)
Inventor
卢道和
郑德荣
张超
杨海军
钟伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
WeBank Co Ltd
Original Assignee
WeBank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by WeBank Co Ltd filed Critical WeBank Co Ltd
Priority to CN201710636463.0A priority Critical patent/CN107562789A/zh
Publication of CN107562789A publication Critical patent/CN107562789A/zh
Pending legal-status Critical Current

Links

Abstract

本发明公开了一种知识库问题更新方法、客服机器人以及可读存储介质,该方法包括步骤:当获取到用户输入的第一问题时,获取知识库中已存储的第二问题;根据预设聚类算法对所述第一问题和所述第二问题进行聚类,得到聚类结果;根据所述聚类结果更新所述知识库的问题。本发明实现了客服机器人通过聚类算法的学习功能,根据用户输入的问题自动更新知识库中的问题,扩充了知识库中问题的数量,从而提高了客服机器人回答用户问题的准确率,以及提高了知识库中问题的更新效率。

Description

知识库问题更新方法、客服机器人以及可读存储介质
技术领域
本发明涉及互联网技术领域,尤其涉及一种知识库问题更新方法、客服机器人以及可读存储介质。
背景技术
现有的客服机器人一般是基于知识库的问答系统,在现有的客服机器人中,知识库中的问题和对应的答案都需要提前编辑好,在编辑知识库过程中,需要对客服机器人所服务的产品,以及用户常见问题比较熟悉。但是由于提前编辑好的问题和答案不可能考虑到所有问题,因此为了提高客服机器人回答问题的准确率,需要不断更新客服机器人的知识库。然而目前客服机器人不能自动更新知识库中的问题,只能通过用户手动更新知识库中的问题,由于用户手动更新知识库中的问题费时费力,因此一般都需要间隔很长一段时间才去更新知识库中的问题,且用户在手动更新知识库中的问题的过程中,容易遗漏一些问题,从而导致客服机器人回答用户问题的准确率不高。
发明内容
本发明的主要目的在于提供一种知识库问题更新方法、客服机器人以及可读存储介质,旨在解决现有客服机器人不能自动更新知识库中的问题,从而导致客服机器人回答用户问题的准确率低下的技术问题。
为实现上述目的,本发明提供一种知识库问题更新方法,所述知识库问题更新方法包括步骤:
当获取到用户输入的第一问题时,获取知识库中已存储的第二问题;
根据预设聚类算法对所述第一问题和所述第二问题进行聚类,得到聚类结果;
根据所述聚类结果更新所述知识库的问题。
优选地,所述根据所述聚类结果更新所述知识库的问题的步骤包括:
在所述聚类结果中确定包含所述第二问题的第一类簇集合,以及未包含所述第二问题的第二类簇集合;
在所述第一类簇集合中筛选出与所述知识库中标准问题对应的相似问题;
在所述第二类簇集合中选取新问题,将所述新问题和所述相似问题添加至所述知识库中,以更新所述知识库的问题。
优选地,所述根据预设聚类算法对所述第一问题和所述第二问题进行聚类,得到聚类结果的步骤包括:
根据自组织映射SOM聚类算法确定作为输入源问题的邻接问题集合,得到聚类后的类簇,其中,所述输入源问题包括所述第一问题和所述第二问题;
根据所述类簇再次执行所述SOM聚类算法,并计算执行所述SOM聚类算法的执行次数;
若所述执行次数大于或者等于预设次数,则将最后一次执行所述SOM聚类算法所得类簇作为聚类结果。
优选地,所述根据预设聚类算法对所述第一问题和所述第二问题进行聚类,得到聚类结果的步骤之前,还包括:
在所述知识库中查找与所述第一问题对应的目标答案,并输出所述目标答案;
将所述第一问题和所述目标答案关联记录至日志存储空间中,并确定对应的记录时间,以及当前时间;
若所述记录时间和所述当前时间之间的时间差大于或者等于预设时长,则执行所述根据预设聚类算法对所述第一问题和所述第二问题进行聚类,得到聚类结果的步骤。
优选地,所述在所述知识库中查找与所述第一问题对应的目标答案的步骤包括:
在所述第一问题中提取特征词汇,根据所述特征词汇确定所述第一问题对应的问题类型;
在所述知识库中确定与所述问题类型对应的答案组,其中,所述答案组和所述问题类型一一对应;
判断所述答案组中是否存在满足预设条件的答案;
若所述答案组中存在满足所述预设条件的答案,则在满足所述预设条件的答案选取所述目标答案。
优选地,所述判断所述答案组中是否存在满足预设条件的答案的步骤之后,还包括:
若所述答案组中未存在满足所述预设条件的答案,则获取预存的默认答案,并输出所述默认答案。
优选地,所述判断所述答案组中是否存在满足预设条件的答案的步骤包括:
通过余弦相似度算法计算所述第一问题与所述知识库中同类型问题之间的相似度,其中,每一类型的问题对应着一个答案组;
判断计算所得的相似度中是否存在大于或者等于预设相似度的目标相似度;
若存在所述目标相似度,则确定所述答案组存在满足所述预设条件的答案;
若不存在所述目标相似度,则确定所述答案组中不存在满足所述预设条件的答案。
优选地,所述若所述答案组中存在满足所述预设条件的答案,则在满足所述预设条件的答案选取所述目标答案的步骤包括:
若所述答案组中存在满足所述预设条件的答案,则将所述目标相似度进行排序,确定所述目标相似度中的最大相似度;
将所述最大相似度所对应的答案作为所述目标答案。
此外,为实现上述目的,本发明还提供一种客服机器人,所述客服机器人包括存储器、处理器和存储在所述存储器上并可在所述处理器上运行的知识库问题更新程序,所述知识库问题更新程序被所述处理器执行时实现如上所述的知识库问题更新方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有知识库问题更新程序,所述知识库问题更新程序被处理器执行时实现如上所述的知识库问题更新方法的步骤。
本发明通过当获取到用户输入的第一问题时,获取知识库中已存储的第二问题;根据预设聚类算法对所述第一问题和所述第二问题进行聚类,得到聚类结果;根据所述聚类结果更新所述知识库的问题。实现了客服机器人通过聚类算法的学习功能,根据用户输入的问题自动更新知识库中的问题,扩充了知识库中问题的数量,从而提高了客服机器人回答用户问题的准确率,以及提高了知识库中问题的更新效率。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的系统结构示意图;
图2为本发明知识库问题更新方法第一实施例的流程示意图;
图3为本发明知识库问题更新方法第二实施例的流程示意图;
图4为本发明实施例中在所述知识库中查找与所述第一问题对应的目标答案的一种流程示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例的解决方案主要是:当获取到用户输入的第一问题时,获取知识库中已存储的第二问题;根据预设聚类算法对所述第一问题和所述第二问题进行聚类,得到聚类结果;根据所述聚类结果更新所述知识库的问题。以解决客服机器人不能自动更新知识库中的问题,从而导致客服机器人回答用户问题的准确率低下的问题。
如图1所示,图1是本发明实施例方案涉及的硬件运行环境的系统结构示意图。
本发明实施例客服机器人可以是PC,也可以是智能手机、平板电脑、便携计算机等终端设备。
如图1所示,该客服机器人可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
可选地,客服机器人还可以包括摄像头、RF(Radio Frequency,射频)电路,传感器、音频电路、WiFi模块等等。
本领域技术人员可以理解,图1中示出的客服机器人结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统以及知识库问题更新程序。其中,操作系统是管理和控制客服机器人硬件和软件资源的程序,支持知识库问题更新程序以及其它软件和/或程序的运行。
在图1所示的客服机器人中,网络接口1004主要用于接入网络;用户接口1003主要用于获取用户输入的第一问题。而处理器1001可以用于调用存储器1005中存储的知识库问题更新程序,并执行以下操作:
当获取到用户输入的第一问题时,获取知识库中已存储的第二问题;
根据预设聚类算法对所述第一问题和所述第二问题进行聚类,得到聚类结果;
根据所述聚类结果更新所述知识库的问题。
进一步地,所述根据所述聚类结果更新所述知识库的问题的步骤包括:
在所述聚类结果中确定包含所述第二问题的第一类簇集合,以及未包含所述第二问题的第二类簇集合;
在所述第一类簇集合中筛选出与所述知识库中标准问题对应的相似问题;
在所述第二类簇集合中选取新问题,将所述新问题和所述相似问题添加至所述知识库中,以更新所述知识库的问题。
进一步地,所述根据预设聚类算法对所述第一问题和所述第二问题进行聚类,得到聚类结果的步骤包括:
根据自组织映射SOM聚类算法确定作为输入源问题的邻接问题集合,得到聚类后的类簇,其中,所述输入源问题包括所述第一问题和所述第二问题;
根据所述类簇再次执行所述SOM聚类算法,并计算执行所述SOM聚类算法的执行次数;
若所述执行次数大于或者等于预设次数,则将最后一次执行所述SOM聚类算法所得类簇作为聚类结果。
进一步地,所述根据预设聚类算法对所述第一问题和所述第二问题进行聚类,得到聚类结果的步骤之前,处理器1001还可以用于调用存储器1005中存储的知识库问题更新程序,并执行以下步骤:
在所述知识库中查找与所述第一问题对应的目标答案,并输出所述目标答案;
将所述第一问题和所述目标答案关联记录至日志存储空间中,并确定对应的记录时间,以及当前时间;
若所述记录时间和所述当前时间之间的时间差大于或者等于预设时长,则执行所述根据预设聚类算法对所述第一问题和所述第二问题进行聚类,得到聚类结果的步骤。
进一步地,所述在所述知识库中查找与所述第一问题对应的目标答案的步骤包括:
在所述第一问题中提取特征词汇,根据所述特征词汇确定所述第一问题对应的问题类型;
在所述知识库中确定与所述问题类型对应的答案组,其中,所述答案组和所述问题类型一一对应;
判断所述答案组中是否存在满足预设条件的答案;
若所述答案组中存在满足所述预设条件的答案,则在满足所述预设条件的答案选取所述目标答案。
进一步地,所述判断所述答案组中是否存在满足预设条件的答案的步骤之后,,处理器1001还可以用于调用存储器1005中存储的知识库问题更新程序,并执行以下步骤:
若所述答案组中未存在满足所述预设条件的答案,则获取预存的默认答案,并输出所述默认答案。
进一步地,所述判断所述答案组中是否存在满足预设条件的答案的步骤包括:
通过余弦相似度算法计算所述第一问题与所述知识库中同类型问题之间的相似度,其中,每一类型的问题对应着一个答案组;
判断计算所得的相似度中是否存在大于或者等于预设相似度的目标相似度;
若存在所述目标相似度,则确定所述答案组存在满足所述预设条件的答案;
若不存在所述目标相似度,则确定所述答案组中不存在满足所述预设条件的答案。
进一步地,所述若所述答案组中存在满足所述预设条件的答案,则在满足所述预设条件的答案选取所述目标答案的步骤包括:
若所述答案组中存在满足所述预设条件的答案,则将所述目标相似度进行排序,确定所述目标相似度中的最大相似度;
将所述最大相似度所对应的答案作为所述目标答案。
基于上述的硬件结构,提出知识库问题更新方法的各个实施例。
参照图2,图2为本发明知识库问题更新方法第一实施例的流程示意图。
在本实施例中,提供了知识库问题更新方法的实施例,需要说明的是,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
所述知识库问题更新方法包括:
步骤S10,当获取到用户输入的第一问题时,获取知识库中已存储的第二问题。
当客服机器人获取到用户输入的第一问题时,客服机器人获取其知识库中已存储的第二问题。其中,用户可以文本或者语音的形式在客服机器人中输入第一问题。知识库是预先存储在客服机器人中的,在知识库中,存储有不同的问题,以及与各种问题对应的答案。在本实施例中,知识库中的第二问题和用户输入的第一问题都含有特定的标识信息,通过该标识信息,客服机器人可区分第一问题和第二问题。第一问题和第二问题的标识信息可根据具体需要而设置,如第一问题的标识信息可设置为“0”,第二问题的标识信息可设置为“1”。
步骤S20,根据预设聚类算法对所述第一问题和所述第二问题进行聚类,得到聚类结果。
当客服机器人获取得到第一问题和第二问题时,客服机器人根据预设聚类算法对第一问题和第二问题进行聚类,得到聚类结果。其中,预设聚类算法包括但不限于k-means聚类算法、层次聚类算法、SOM(Self-Organizing Map,自组织映射)聚类算法和FCM(FuzzyC-means,模糊C均值)聚类算法。
进一步地,步骤S20包括:
步骤a,根据自组织映射SOM聚类算法确定作为输入源问题的邻接问题集合,得到聚类后的类簇,其中,所述输入源问题包括所述第一问题和所述第二问题。
步骤b,根据所述类簇再次执行所述SOM聚类算法,并计算执行所述SOM聚类算法的执行次数。
步骤c,若所述执行次数大于或者等于预设次数,则将最后一次执行所述SOM聚类算法所得类簇作为聚类结果。
在本实施例中,以预设聚类算法为SOM聚类算法为例进行说明。SOM聚类算法能够自动找出输入数据之间的相似度。SOM聚类算法的具体过程为:①网络初始化:用随机数设定输入层和映射层之间权值的初始值,其中,随机数的范围为0至1;②输入向量的输入:把输入向量x=(x1,x2,…xn)T输入给输入层;③计算映射层的权值向量和输入向量的距离:在映射层,计算各神经元的权值向量和输入向量的欧氏距离,具体公式为:
其中,wij为输入层的i神经元和映射层的j神经元之间的权值。
④选择与权值向量距离最小的神经元:计算并选择使输入向量和权值向量距离最小的神经元,如dj为最小,把其称为胜出神经元,并记为j*,并确定胜出神经元的邻接神经元集合,其中,邻接神经元集合为与胜出神经元之间距离小于预设阈值的输入向量,预设阈值可根据具体需要而设置。⑤调整权值:胜出神经元和位于其邻接神经元的权值,采用以下公式进行更新:
Δwij=ηh(j,j*)(xi-wij);wij(t+1)=wij(t)+Δwij
η是一个大于0,且小于1的常数;
邻接神经元可通过邻域函数确定,邻域函数为σ2会随着学习的进行而减小,因此h(j,j*)也会随着学习的进行而慢慢变窄。
由邻域函数可知,以胜出神经元为中心设定了一个邻域半径,称为胜出邻域,学习初期,胜出神经元和其附近的神经元全部接近当时的输入向量,形成粗略的映射。随着学习的进行而减小,胜出邻域变窄,胜出神经元附近的神经元数变少。因此,学习方法是一种从粗调整向微调整变化,最终达到预定目标的过程。
在本实施例中,输入向量为输入源问题,即第一问题和第二问题。在将第一问题和第二问题作为输入源问题输入至SOM聚类算法的神经元网络中后,确定胜出问题,以及胜出问题对应的邻接问题,根据胜出问题和邻接问题确定类簇。在SOM聚类算法中,预先设置好了学习的次数,即执行SOM聚类算法的执行次数。每一次执行SOM聚类算法,都是在上一次执行SOM聚类算法所得类簇的基础上进行的。当执行SOM聚类算法的执行次数大于或者等于预设次数时,则结束SOM聚类算法的学习过程,并将最后一次执行SOM聚类算法所得类簇作为聚类结果;当执行SOM聚类算法的执行次数小于执行次数时,则继续执行SOM聚类算法。
步骤S30,根据所述聚类结果更新所述知识库的问题。
当客服机器人得到聚类结果后,根据聚类结果更新知识库中的问题。
进一步地,步骤S30包括:
步骤d,在所述聚类结果中确定包含所述第二问题的第一类簇集合,以及未包含所述第二问题的第二类簇集合。
步骤e,在所述第一类簇集合中筛选出与所述知识库中标准问题对应的相似问题。
步骤f,在所述第二类簇集合中选取新问题,将所述新问题和所述相似问题添加至所述知识库中,以更新所述知识库的问题。
客服机器人根据聚类结果更新知识库问题的具体过程为:客服机器人在聚类结果中确定包含第二问题的类簇,以及未包含第二问题的类簇,将包含第二问题的类簇组合成第一类簇集合,将未包含第二问题的类簇组合成第二类簇集合。其中,客服机器人是根据第二问题的标识信息来确定各个类簇中是否包含第二问题。
当得到第一类簇集合和第二类簇集合后,客服机器人在第一类簇集合中筛选出与知识库中标准问题对应的相似问题,以及在第二类簇集合中选取新问题,并将所选取的新问题,以及所筛选出的相似问题添加至知识库中,以更新知识库中的问题。其中,标准问题为客服机器人的工作人员编辑的,预先存储在知识库中的问题。在具体实施例中,为了能在知识库中快速确定标准问题,可在标准问题中设置一个特定的标识信息,通过该标识信息来确定知识库中的标准问题,如可将该标识信息设置为“A”。
在第一类簇集合中筛选出相似问题的过程可为:计算第一类簇集合中各个问题出现的出现次数,当出现次数大于或者等于设定次数时,则将该问题作为相似问题,当出现次数小于设定次数时,不将该问题作为相似问题;或者计算第一类簇集合中各个问题的完整度,当完整度大于或者等于预设完整度时,则将该问题作为相似问题,当完整度小于预设完整度时,不将该问题作为相似问题;或者同时计算第一类簇集合中各个问题出现的出现次数、以及各个问题的完整度;当出现次数大于或者等于设定次数,以及完整度大于或者等于预设完整度时,将该问题作为相似问题。设定次数和预设完整度可根据具体需要而设置,在此不再赘述。
需要说明的是,可通过计算各个问题与标准问题之间的相似度来确定其完整度,当计算所得的相似度越大时,完整度越高,相似度越小时,完整度越低。在本实施例中,计算第一类簇集合中各个问题的完整度可理解为计算第一类簇集合中各个问题与标准问题之间的相似度,预设完整度可理解为预设相似度。
在第二类簇集合中选取新问题的方法可与在第一类簇集合中筛选出相似问题的方法一致,在此不再赘述。进一步地,也可以由客服机器人对应的工作人员手动在第二类簇集合中选取出新问题。
进一步地,在将所选取的新问题添加至知识库中后,客服机器人修改新问题的标识信息,使添加至知识库中的新问题含有第二问题的标识信息。可以理解的是,新问题为第一问题。
本实施例通过当获取到用户输入的第一问题时,获取知识库中已存储的第二问题;根据预设聚类算法对所述第一问题和所述第二问题进行聚类,得到聚类结果;根据所述聚类结果更新所述知识库的问题。实现了客服机器人通过聚类算法的学习功能,根据用户输入的问题自动更新知识库中的问题,扩充了知识库中问题的数量,从而提高了客服机器人回答用户问题的准确率,以及提高了知识库中问题的更新效率。
进一步地,提出本发明知识库问题更新方法第二实施例。
所述知识库问题更新方法第二实施例与所述知识库问题更新方法第一实施例的区别在于,参照图3,知识库问题更新方法还包括:
步骤S40,在所述知识库中查找与所述第一问题对应的目标答案,并输出所述目标答案。
步骤S50,将所述第一问题和所述目标答案关联记录至日志存储空间中,并确定对应的记录时间,以及当前时间。
当客服机器人获取到用户输入的第一问题时,在知识库中查找与第一问题对应的目标答案,将第一问题和目标答案关联记录至日志存储空间中,以便于客服机器人在需要时,获取用户输入的第一问题,以及对应输出的目标答案。客服机器人输出目标答案的方式包括但不限于语音和文字。
当客服机器人将第一问题和目标答案关联记录在日志存储空间中时,客服机器人确定将第一问题和目标答案关联记录在日志存储空间的记录时间,以及确定当前时间,并计算当前时间和记录时间之间的时间差,判断计算所得的时间差是否大于或者等于预设时长。在本实施例中,预设时长可根据具体需要而设置,如可设置为5天,或者10天。
若所述记录时间和所述当前时间之间的时间差大于或者等于预设时长,则执行步骤S20。
若计算所得的时间差大于或者等于预设时长,客服机器人则根据预设聚类算法对第一问题和第二问题进行聚类,以得到聚类结果。即当计算所得的时间差大于或者等于预设时长时,客服机器人选取第二问题,以及选取在该时间差内所获取的第一问题进行聚类,以得到聚类结果。进一步,若计算所得的时间差小于预设时长,客服机器人则继续监测是否有用户输入问题。
进一步地,客服机器人中设置有计数器。当客服机器人获取到用户输入的一条第一问题时,计数器对应的数值增加一。当客服机器人监测到计数器对应的数值大于或者等于预设数值时,客服机器人根据预设聚类算法对第一问题和第二问题进行聚类,以得到聚类结果。当计数器对应的数值小于预设数值时,客服机器人继续检测是否有用户输入问题。其中,预设数值可根据具体需要而设置,如可以设置为50,或者100等。
进一步地,所述在所述知识库中查找与所述第一问题对应的目标答案的步骤包括:
步骤S41,在所述第一问题中提取特征词汇,根据所述特征词汇确定所述第一问题对应的问题类型。
客服机器人在第一问题中提取特征词汇,根据所提取的特征词汇确定第一问题对应的问题类型。在本实施例中,客服机器人可通过TF-IDF(term frequency–inversedocument frequency)算法提取第一问题的特征词汇。在其它实施例中,也可通过其它提取关键字的算法提取第一问题的特征词汇。当客服机器人提取到特征词汇时,根据特征词汇确定第一问题对应的问题类型。
需要说明的是,在知识库中,将问题进行了分类,知识库中的每一问题都有其对应的问题类型。在本实施例中,问题类型包括产品类型和操作类型,产品类型又可细分为贷款类型、理财类型等;操作类型可细分为开户类型、销户类型等。进一步地,还可将贷款类型分为车贷类型和房贷类型等。每一问题类型都有对应的答案组。在本实施例中,为每一细分的问题类型都设置一个对应的答案组,如车贷类型对应着一个答案组,房贷类型对应着一个答案组。在其它实施例中,也可为贷款类型设置一个对应的答案组,或者为产品类型设置一个对应的答案组。
步骤S42,在所述知识库中确定与所述问题类型对应的答案组,其中,所述答案组和所述问题类型一一对应。
步骤S43,判断所述答案组中是否存在满足预设条件的答案。
步骤S44,若所述答案组中存在满足所述预设条件的答案,则在满足所述预设条件的答案选取所述目标答案。
步骤S45,若所述答案组中未存在满足所述预设条件的答案,则获取预存的默认答案,并输出所述默认答案。
当客服机器人确定第一问题对应的问题类型时,客服机器人在知识库中确定与问题类型对应的答案组。需要说明的是,答案组和问题类型是一一对应的,且答案组和问题类型是关联存储在知识库中。
当确定第一问题对应的答案组后,客服机器人判断答案组中是否存在满足预设条件的答案。若答案组中存在满足预设条件的答案,客服机器人则在满足预设条件的答案中选取目标答案;若答案组中未存在满足预设条件的答案,客服机器人则获取知识库中预先存储的默认答案,并输出该默认答案。该默认答案为表示客服机器人中不存在与第一问题对应的答案。如默认答案可设置为“很抱歉,没有查找到符合要求的答案!”。
进一步地,步骤S43包括:
步骤h,通过余弦相似度算法计算所述第一问题与所述知识库中同类型问题之间的相似度,其中,每一类型的问题对应着一个答案组。
步骤i,判断计算所得的相似度中是否存在大于或者等于预设相似度的目标相似度。
步骤j,若存在所述目标相似度,则确定所述答案组存在满足所述预设条件的答案。
步骤k,若不存在所述目标相似度,则确定所述答案组中不存在满足所述预设条件的答案。
客服机器人判断答案组中是否存在满足预设条件的答案的具体过程为:客服机器人通过余弦相似度算法计算第一问题和知识库中同类型问题之间的相似度,并判断在计算所得的相似度中是否存在大于或者等于预设相似度的目标相似度。其中,每一类型的问题对应着一个答案组。可以理解的是,目标相似度大于或者等于预设相似度;若存在目标相似度,则确定第一问题的同类型问题对应的答案组中存在满足预设条件的答案;若不存在目标相似度,则确定该答案组中不存在满足预设条件的答案。其中,预设相似度可根据具体需要而设置,如可设置为0.7,0.8,或者0.85等。
进一步地,步骤S44包括:
步骤m,若所述答案组中存在满足所述预设条件的答案,则将所述目标相似度进行排序,确定所述目标相似度中的最大相似度。
步骤n,将所述最大相似度所对应的答案作为所述目标答案。
若答案组中存在满足预设条件的答案,客服机器人则将目标相似度按照从大到小,或者从小到大进行排序,确定目标相似度中的最大相似度,将最大相似度所对应的答案作为目标答案。
本实施例当获取到用户输入的问题时,先确定该问题对应的问题类型,以根据问题类型确定答案组,最后在答案组中查找最佳的目标答案,提高了客服机器人在知识库中查找答案的效率,以及确保了客服机器人在知识库中所查找到的答案的准确率。
此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有知识库问题更新程序,所述知识库问题更新程序被处理器执行时实现如下步骤:
当获取到用户输入的第一问题时,获取知识库中已存储的第二问题;
根据预设聚类算法对所述第一问题和所述第二问题进行聚类,得到聚类结果;
根据所述聚类结果更新所述知识库的问题。
进一步地,所述根据所述聚类结果更新所述知识库的问题的步骤包括:
在所述聚类结果中确定包含所述第二问题的第一类簇集合,以及未包含所述第二问题的第二类簇集合;
在所述第一类簇集合中筛选出与所述知识库中标准问题对应的相似问题;
在所述第二类簇集合中选取新问题,将所述新问题和所述相似问题添加至所述知识库中,以更新所述知识库的问题。
进一步地,所述根据预设聚类算法对所述第一问题和所述第二问题进行聚类,得到聚类结果的步骤包括:
根据自组织映射SOM聚类算法确定作为输入源问题的邻接问题集合,得到聚类后的类簇,其中,所述输入源问题包括所述第一问题和所述第二问题;
根据所述类簇再次执行所述SOM聚类算法,并计算执行所述SOM聚类算法的执行次数;
若所述执行次数大于或者等于预设次数,则将最后一次执行所述SOM聚类算法所得类簇作为聚类结果。
进一步地,所述根据预设聚类算法对所述第一问题和所述第二问题进行聚类,得到聚类结果的步骤之前,所述知识库问题更新程序被处理器执行时实现如下步骤:
在所述知识库中查找与所述第一问题对应的目标答案,并输出所述目标答案;
将所述第一问题和所述目标答案关联记录至日志存储空间中,并确定对应的记录时间,以及当前时间;
若所述记录时间和所述当前时间之间的时间差大于或者等于预设时长,则执行所述根据预设聚类算法对所述第一问题和所述第二问题进行聚类,得到聚类结果的步骤。
进一步地,所述在所述知识库中查找与所述第一问题对应的目标答案的步骤包括:
在所述第一问题中提取特征词汇,根据所述特征词汇确定所述第一问题对应的问题类型;
在所述知识库中确定与所述问题类型对应的答案组,其中,所述答案组和所述问题类型一一对应;
判断所述答案组中是否存在满足预设条件的答案;
若所述答案组中存在满足所述预设条件的答案,则在满足所述预设条件的答案选取所述目标答案。
进一步地,所述判断所述答案组中是否存在满足预设条件的答案的步骤之后,所述知识库问题更新程序被处理器执行时实现如下步骤:
若所述答案组中未存在满足所述预设条件的答案,则获取预存的默认答案,并输出所述默认答案。
进一步地,所述判断所述答案组中是否存在满足预设条件的答案的步骤包括:
通过余弦相似度算法计算所述第一问题与所述知识库中同类型问题之间的相似度,其中,每一类型的问题对应着一个答案组;
判断计算所得的相似度中是否存在大于或者等于预设相似度的目标相似度;
若存在所述目标相似度,则确定所述答案组存在满足所述预设条件的答案;
若不存在所述目标相似度,则确定所述答案组中不存在满足所述预设条件的答案。
进一步地,所述若所述答案组中存在满足所述预设条件的答案,则在满足所述预设条件的答案选取所述目标答案的步骤包括:
若所述答案组中存在满足所述预设条件的答案,则将所述目标相似度进行排序,确定所述目标相似度中的最大相似度;
将所述最大相似度所对应的答案作为所述目标答案。
本发明计算机可读存储介质具体实施方式与上述知识库问题更新方法各实施例基本相同,在此不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种知识库问题更新方法,其特征在于,所述知识库问题更新方法包括以下步骤:
当获取到用户输入的第一问题时,获取知识库中已存储的第二问题;
根据预设聚类算法对所述第一问题和所述第二问题进行聚类,得到聚类结果;
根据所述聚类结果更新所述知识库的问题。
2.如权利要求1所述的知识库问题更新方法,其特征在于,所述根据所述聚类结果更新所述知识库的问题的步骤包括:
在所述聚类结果中确定包含所述第二问题的第一类簇集合,以及未包含所述第二问题的第二类簇集合;
在所述第一类簇集合中筛选出与所述知识库中标准问题对应的相似问题;
在所述第二类簇集合中选取新问题,将所述新问题和所述相似问题添加至所述知识库中,以更新所述知识库的问题。
3.如权利要求1所述的知识库问题更新方法,其特征在于,所述根据预设聚类算法对所述第一问题和所述第二问题进行聚类,得到聚类结果的步骤包括:
根据自组织映射SOM聚类算法确定作为输入源问题的邻接问题集合,得到聚类后的类簇,其中,所述输入源问题包括所述第一问题和所述第二问题;
根据所述类簇再次执行所述SOM聚类算法,并计算执行所述SOM聚类算法的执行次数;
若所述执行次数大于或者等于预设次数,则将最后一次执行所述SOM聚类算法所得类簇作为聚类结果。
4.如权利要求1至3任一项所述的知识库问题更新方法,其特征在于,所述根据预设聚类算法对所述第一问题和所述第二问题进行聚类,得到聚类结果的步骤之前,还包括:
在所述知识库中查找与所述第一问题对应的目标答案,并输出所述目标答案;
将所述第一问题和所述目标答案关联记录至日志存储空间中,并确定对应的记录时间,以及当前时间;
若所述记录时间和所述当前时间之间的时间差大于或者等于预设时长,则执行所述根据预设聚类算法对所述第一问题和所述第二问题进行聚类,得到聚类结果的步骤。
5.如权利要求4所述的知识库问题更新方法,其特征在于,所述在所述知识库中查找与所述第一问题对应的目标答案的步骤包括:
在所述第一问题中提取特征词汇,根据所述特征词汇确定所述第一问题对应的问题类型;
在所述知识库中确定与所述问题类型对应的答案组,其中,所述答案组和所述问题类型一一对应;
判断所述答案组中是否存在满足预设条件的答案;
若所述答案组中存在满足所述预设条件的答案,则在满足所述预设条件的答案选取所述目标答案。
6.如权利要求5所述的知识库问题更新方法,其特征在于,所述判断所述答案组中是否存在满足预设条件的答案的步骤之后,还包括:
若所述答案组中未存在满足所述预设条件的答案,则获取预存的默认答案,并输出所述默认答案。
7.如权利要求5所述的知识库问题更新方法,其特征在于,所述判断所述答案组中是否存在满足预设条件的答案的步骤包括:
通过余弦相似度算法计算所述第一问题与所述知识库中同类型问题之间的相似度,其中,每一类型的问题对应着一个答案组;
判断计算所得的相似度中是否存在大于或者等于预设相似度的目标相似度;
若存在所述目标相似度,则确定所述答案组存在满足所述预设条件的答案;
若不存在所述目标相似度,则确定所述答案组中不存在满足所述预设条件的答案。
8.如权利要求7所述的知识库问题更新方法,其特征在于,所述若所述答案组中存在满足所述预设条件的答案,则在满足所述预设条件的答案选取所述目标答案的步骤包括:
若所述答案组中存在满足所述预设条件的答案,则将所述目标相似度进行排序,确定所述目标相似度中的最大相似度;
将所述最大相似度所对应的答案作为所述目标答案。
9.一种客服机器人,其特征在于,所述客服机器人包括存储器、处理器和存储在所述存储器上并可在所述处理器上运行的知识库问题更新程序,所述知识库问题更新程序被所述处理器执行时实现如权利要求1至8中任一项所述的知识库问题更新方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有知识库问题更新程序,所述知识库问题更新程序被处理器执行时实现如权利要求1至8中任一项所述的知识库问题更新方法的步骤。
CN201710636463.0A 2017-07-28 2017-07-28 知识库问题更新方法、客服机器人以及可读存储介质 Pending CN107562789A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710636463.0A CN107562789A (zh) 2017-07-28 2017-07-28 知识库问题更新方法、客服机器人以及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710636463.0A CN107562789A (zh) 2017-07-28 2017-07-28 知识库问题更新方法、客服机器人以及可读存储介质

Publications (1)

Publication Number Publication Date
CN107562789A true CN107562789A (zh) 2018-01-09

Family

ID=60974704

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710636463.0A Pending CN107562789A (zh) 2017-07-28 2017-07-28 知识库问题更新方法、客服机器人以及可读存储介质

Country Status (1)

Country Link
CN (1) CN107562789A (zh)

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108595695A (zh) * 2018-05-08 2018-09-28 和美(深圳)信息技术股份有限公司 数据处理方法、装置、计算机设备和存储介质
CN108763462A (zh) * 2018-05-28 2018-11-06 深圳前海微众银行股份有限公司 平行语句库的更新方法、设备及计算机可读存储介质
CN109033270A (zh) * 2018-07-09 2018-12-18 深圳追科技有限公司 一种基于人工客服日志自动构建客服知识库的方法
CN109635281A (zh) * 2018-11-22 2019-04-16 阿里巴巴集团控股有限公司 业务导图中更新节点的方法和装置
CN109783617A (zh) * 2018-12-11 2019-05-21 平安科技(深圳)有限公司 用于答复问题的模型训练方法、装置、设备及存储介质
CN109918498A (zh) * 2019-01-16 2019-06-21 平安科技(深圳)有限公司 一种问题入库方法和装置
CN109947909A (zh) * 2018-06-19 2019-06-28 平安科技(深圳)有限公司 智能客服应答方法、设备、存储介质及装置
CN110188205A (zh) * 2019-05-08 2019-08-30 三角兽(北京)科技有限公司 一种智能客服系统知识库的更新方法及装置
CN110555101A (zh) * 2019-09-09 2019-12-10 浙江诺诺网络科技有限公司 一种客服知识库更新方法、装置、设备及存储介质
CN110737759A (zh) * 2019-09-06 2020-01-31 中国平安人寿保险股份有限公司 客服机器人的评测方法、装置、计算机设备及存储介质
CN110741362A (zh) * 2018-05-03 2020-01-31 谷歌有限责任公司 音频查询的重叠处理的协调
CN110807087A (zh) * 2019-10-21 2020-02-18 拉扎斯网络科技(上海)有限公司 数据处理方法、装置、可读存储介质和电子设备
CN110909165A (zh) * 2019-11-25 2020-03-24 杭州网易再顾科技有限公司 数据处理方法、装置、介质及电子设备
CN110990546A (zh) * 2019-11-29 2020-04-10 中国银行股份有限公司 智能问答语料库更新方法和装置
CN111340366A (zh) * 2020-02-26 2020-06-26 中国联合网络通信集团有限公司 结构化知识质量提升方法及设备
CN111552789A (zh) * 2020-04-27 2020-08-18 中国银行股份有限公司 一种客服知识库自学习方法及装置
CN112148859A (zh) * 2020-09-27 2020-12-29 深圳壹账通智能科技有限公司 问答知识库管理方法、装置、终端设备及存储介质
WO2021114834A1 (zh) * 2020-06-24 2021-06-17 平安科技(深圳)有限公司 客服问题的更新方法、系统、终端设备及计算机存储介质
CN113051383A (zh) * 2021-04-09 2021-06-29 平安国际智慧城市科技股份有限公司 Faq知识库管理方法、装置、电子设备及存储介质
CN113139040A (zh) * 2021-04-06 2021-07-20 杭州远传新业科技有限公司 基于文本相似度算法的相似问题生成方法、系统、电子装置和存储介质
CN115001751A (zh) * 2022-05-06 2022-09-02 上海增融信息科技有限公司 一种动态验证方法、装置、电子设备及存储介质
CN111552789B (zh) * 2020-04-27 2024-05-10 中国银行股份有限公司 一种客服知识库自学习方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101373532A (zh) * 2008-07-10 2009-02-25 昆明理工大学 旅游领域faq中文问答系统实现方法
CN103810218A (zh) * 2012-11-14 2014-05-21 北京百度网讯科技有限公司 一种基于问题簇的自动问答方法和装置
US20160232222A1 (en) * 2015-02-09 2016-08-11 International Business Machines Corporation Generating Usage Report in a Question Answering System Based on Question Categorization
CN105955965A (zh) * 2016-06-21 2016-09-21 上海智臻智能网络科技股份有限公司 问句信息处理方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101373532A (zh) * 2008-07-10 2009-02-25 昆明理工大学 旅游领域faq中文问答系统实现方法
CN103810218A (zh) * 2012-11-14 2014-05-21 北京百度网讯科技有限公司 一种基于问题簇的自动问答方法和装置
US20160232222A1 (en) * 2015-02-09 2016-08-11 International Business Machines Corporation Generating Usage Report in a Question Answering System Based on Question Categorization
CN105955965A (zh) * 2016-06-21 2016-09-21 上海智臻智能网络科技股份有限公司 问句信息处理方法及装置

Cited By (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110741362B (zh) * 2018-05-03 2024-05-14 谷歌有限责任公司 音频查询的重叠处理的协调
CN110741362A (zh) * 2018-05-03 2020-01-31 谷歌有限责任公司 音频查询的重叠处理的协调
CN108595695A (zh) * 2018-05-08 2018-09-28 和美(深圳)信息技术股份有限公司 数据处理方法、装置、计算机设备和存储介质
CN108595695B (zh) * 2018-05-08 2021-03-16 和美(深圳)信息技术股份有限公司 数据处理方法、装置、计算机设备和存储介质
CN108763462A (zh) * 2018-05-28 2018-11-06 深圳前海微众银行股份有限公司 平行语句库的更新方法、设备及计算机可读存储介质
CN108763462B (zh) * 2018-05-28 2021-11-12 深圳前海微众银行股份有限公司 平行语句库的更新方法、设备及计算机可读存储介质
CN109947909B (zh) * 2018-06-19 2024-03-12 平安科技(深圳)有限公司 智能客服应答方法、设备、存储介质及装置
CN109947909A (zh) * 2018-06-19 2019-06-28 平安科技(深圳)有限公司 智能客服应答方法、设备、存储介质及装置
CN109033270A (zh) * 2018-07-09 2018-12-18 深圳追科技有限公司 一种基于人工客服日志自动构建客服知识库的方法
CN109635281A (zh) * 2018-11-22 2019-04-16 阿里巴巴集团控股有限公司 业务导图中更新节点的方法和装置
CN109635281B (zh) * 2018-11-22 2023-01-31 创新先进技术有限公司 业务导图中更新节点的方法和装置
CN109783617A (zh) * 2018-12-11 2019-05-21 平安科技(深圳)有限公司 用于答复问题的模型训练方法、装置、设备及存储介质
CN109783617B (zh) * 2018-12-11 2024-01-26 平安科技(深圳)有限公司 用于答复问题的模型训练方法、装置、设备及存储介质
CN109918498A (zh) * 2019-01-16 2019-06-21 平安科技(深圳)有限公司 一种问题入库方法和装置
CN109918498B (zh) * 2019-01-16 2023-08-11 平安科技(深圳)有限公司 一种问题入库方法和装置
CN110188205A (zh) * 2019-05-08 2019-08-30 三角兽(北京)科技有限公司 一种智能客服系统知识库的更新方法及装置
CN110737759A (zh) * 2019-09-06 2020-01-31 中国平安人寿保险股份有限公司 客服机器人的评测方法、装置、计算机设备及存储介质
CN110737759B (zh) * 2019-09-06 2023-07-25 中国平安人寿保险股份有限公司 客服机器人的评测方法、装置、计算机设备及存储介质
CN110555101A (zh) * 2019-09-09 2019-12-10 浙江诺诺网络科技有限公司 一种客服知识库更新方法、装置、设备及存储介质
CN110807087A (zh) * 2019-10-21 2020-02-18 拉扎斯网络科技(上海)有限公司 数据处理方法、装置、可读存储介质和电子设备
CN110909165B (zh) * 2019-11-25 2022-09-13 杭州网易再顾科技有限公司 数据处理方法、装置、介质及电子设备
CN110909165A (zh) * 2019-11-25 2020-03-24 杭州网易再顾科技有限公司 数据处理方法、装置、介质及电子设备
CN110990546B (zh) * 2019-11-29 2023-11-17 中国银行股份有限公司 智能问答语料库更新方法和装置
CN110990546A (zh) * 2019-11-29 2020-04-10 中国银行股份有限公司 智能问答语料库更新方法和装置
CN111340366A (zh) * 2020-02-26 2020-06-26 中国联合网络通信集团有限公司 结构化知识质量提升方法及设备
CN111552789B (zh) * 2020-04-27 2024-05-10 中国银行股份有限公司 一种客服知识库自学习方法及装置
CN111552789A (zh) * 2020-04-27 2020-08-18 中国银行股份有限公司 一种客服知识库自学习方法及装置
WO2021114834A1 (zh) * 2020-06-24 2021-06-17 平安科技(深圳)有限公司 客服问题的更新方法、系统、终端设备及计算机存储介质
CN112148859A (zh) * 2020-09-27 2020-12-29 深圳壹账通智能科技有限公司 问答知识库管理方法、装置、终端设备及存储介质
CN113139040A (zh) * 2021-04-06 2021-07-20 杭州远传新业科技有限公司 基于文本相似度算法的相似问题生成方法、系统、电子装置和存储介质
CN113051383A (zh) * 2021-04-09 2021-06-29 平安国际智慧城市科技股份有限公司 Faq知识库管理方法、装置、电子设备及存储介质
CN115001751A (zh) * 2022-05-06 2022-09-02 上海增融信息科技有限公司 一种动态验证方法、装置、电子设备及存储介质
CN115001751B (zh) * 2022-05-06 2024-01-09 上海增融信息科技有限公司 一种动态验证方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN107562789A (zh) 知识库问题更新方法、客服机器人以及可读存储介质
Hoffmann et al. Inferring descriptive and approximate fuzzy rules for credit scoring using evolutionary algorithms
CN110807527B (zh) 一种基于客群筛选的额度调整方法、装置和电子设备
US20160306506A1 (en) Adaptive user interface using machine learning mode
CN107911491A (zh) 信息推荐方法、装置及存储介质、服务器和移动终端
CN108108743A (zh) 异常用户识别方法和用于识别异常用户的装置
CN109858553B (zh) 驾驶状态的监测模型更新方法、更新装置及存储介质
CN111062444B (zh) 信用风险预测方法、系统、终端及存储介质
JP6908302B2 (ja) 学習装置、識別装置及びプログラム
US20200218456A1 (en) Application Management Method, Storage Medium, and Electronic Apparatus
CN110288459A (zh) 贷款预测方法、装置、设备及存储介质
CN111241992B (zh) 人脸识别模型构建方法、识别方法、装置、设备及存储介质
CN111582341B (zh) 用户异常操作预测方法及装置
CN106874355A (zh) 同时融入社交关系和用户相似度的协同过滤方法
CN109903087A (zh) 基于行为特征预测用户属性值的方法、装置及存储介质
CN109155110A (zh) 信息处理装置以及其控制方法、计算机程序
US20180068323A1 (en) Automated method for learning the responsiveness of potential consumers to different stimuli in a marketplace
US20200349416A1 (en) Determining computer-executed ensemble model
CN110288468B (zh) 数据特征挖掘方法、装置、电子设备及存储介质
CN109242089B (zh) 递进监督深度学习神经网络训练方法、系统、介质和设备
EP4116918A1 (en) Matching system, matching method, and matching program
US20230325944A1 (en) Adaptive wellness collaborative media system
CN109947749B (zh) 一种具有遗忘学习能力的智能家居操控行为习惯挖掘方法
CN108629381A (zh) 基于大数据的人群筛选方法及终端设备
CN115587884A (zh) 一种基于改进的极限学习机的用户贷款违约预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180109