CN113868271A

CN113868271A - 智能客服的知识库更新方法、装置、电子设备及存储介质

Info

Publication number: CN113868271A
Application number: CN202111101450.6A
Authority: CN
Inventors: 张烜峰; 陈孝良
Original assignee: Beijing SoundAI Technology Co Ltd
Current assignee: Beijing SoundAI Technology Co Ltd
Priority date: 2021-09-18
Filing date: 2021-09-18
Publication date: 2021-12-31

Abstract

本公开提供了一种智能客服的知识库更新方法、装置、电子设备及存储介质，属于人工智能技术领域。所述方法包括：根据多个录音文件的用户满意状况，筛选出候选录音文件；基于候选录音文件对应的预处理后的文件，获取非正常录音文件；基于非正常录音文件中的目标问题数据生成的更新的问答对，对知识库进行更新。本公开无需完整地播放完录音文件，基于用户对智能客服提供的答案数据的满意情况，筛选候选录音文件，在此基础上通过对候选录音文件进行预处理，从而获取非正常录音文件，采用上述筛选和预处理两个处理过程，大大缩短了非正常录音文件的标注时长，提高了知识库的更新速度。

Description

智能客服的知识库更新方法、装置、电子设备及存储介质

技术领域

本公开涉及人工智能技术领域，特别涉及一种智能客服的知识库更新方法、装置、电子设备及存储介质。

背景技术

随着AI(Artificial Intelligence，人工智能)技术的发展，AI语音助手在日常生活中逐渐普及，人与智能语音的互动正变得越来越简单高效。企业通过使用智能客服来代替人工客服与用户沟通交流，节省了人力成本，提升了企业服务效率。智能客服在工作时先识别出用户的问题数据，然后从知识库存储的问答对中，查询该问题数据对应的答案数据，进而将查询到的答案数据提供给用户。为确保知识库中问答对的全面准确，从而能够更好地服务于用户，需要对智能客服的知识库进行更新。

相关技术主要采用如下方法对智能客服的知识库进行更新：播放智能客服与用户交互过程中所录制的录音文件；在录音文件的播放过程中，由专门的标注人员标注出答案数据需要更新的非正常录音文件；当全部的录音文件播放完成后，获取每个非正常录音文件更新的问答对；基于更新的问答对，对知识库进行更新。

然而，一个录音文件要完整地播放完需要较长时间，而一个标注人员又无法同时聆听多个录音文件，导致非正常录音文件的标注时长较长，进一步导致知识库的更新速度较慢。

发明内容

本公开实施例提供了一种智能客服的知识库更新方法、装置、电子设备及存储介质，能够缩短非正常录音文件的标注时长，提高知识库的更新速度。所述技术方案如下：

第一方面，提供了一种智能客服的知识库更新方法，所述方法包括：

根据多个录音文件的用户反馈数据，确定所述多个录音文件的用户满意状况，所述录音文件为用户与智能客服交互过程中所录制的文件，所述用户满意状况用于反映用户对所述智能客服从知识库中获取的答案数据的满意状况；

根据所述多个录音文件的用户满意状况，从所述多个录音文件中，筛选出至少一个候选录音文件；

对所述至少一个候选录音文件进行预处理，得到至少一个预处理后的文件，所述预处理后的文件为文本文件或者不包括无效语音数据的候选录音文件；

基于所述至少一个预处理后的文件，获取答案数据需要更新的至少一个非正常录音文件；

基于所述至少一个非正常录音文件中的目标问题数据，生成至少一个更新的问答对，所述更新的问答对包括所述目标问题数据和更新的答案数据；

基于所述至少一个更新的问答对，对所述知识库进行更新。

在本公开的另一个实施例中，所述根据多个录音文件的用户反馈数据，确定所述多个录音文件的用户满意状况，包括：

从每个录音文件的用户反馈数据中，获取每个录音文件的评价数据；

当任一录音文件的评价数据指示的评价指标超出预设指标范围，则确定所述录音文件的用户满意状况为不满意。

从每个录音文件的用户反馈数据中，查询每个录音文件的投诉数据；

当查询到任一录音文件的投诉数据，确定所述录音文件的用户满意状况为不满意。

当检测到任一录音文件中用户的交互方式由所述智能客服转人工客服，确定所述录音文件的用户满意状况为不满意。

从每个录音文件的用户反馈数据中，获取人声数据；

对于任一录音文件，根据所述录音文件的人声数据，确定所述录音文件录制过程中用户与所述智能客服的交互情绪；

当所述交互情绪为指定情绪，则确定所述录音文件的用户满意状况为不满意。

在本公开的另一个实施例中，所述根据所述录音文件的人声数据，确定所述录音文件录制过程中用户与所述智能客服的交互情绪，包括：

从所述录音文件的人声数据中，提取目标语音特征；

将所述目标语音特征输入到情绪识别模型中，输出所述录音文件录制过程中用户与所述智能客服的交互情绪，所述情绪识别模型用于基于语音特征识别出用户的情绪。

从所述录音文件的人声数据中，提取指定关键字；

当提取到所述指定关键字，确定所述录音文件录制过程中用户与所述智能客服的交互情绪为指定情绪。

从所述录音文件的人声数据中，获取问题数据的重复次数、预设时间段内接收到用户的语音通话请求的次数中至少一项；

当所述问题数据的重复次数、所述语音通话请求的次数中至少一项达到预设次数，确定所述录音文件录制过程中用户与所述智能客服的交互情绪为指定情绪。

在本公开的另一个实施例中，所述对所述至少一个候选录音文件进行预处理，得到至少一个预处理后的文件，包括：

将每个候选录音文件由语音形式转换为文本形式，得到至少一个预处理后的文件。

将每个候选录音文件进行分段处理，得到多个录音片段；

删除所述多个录音片段中的空白数据、目标答案数据中至少一项，得到预处理后的文件，所述目标答案数据为候选录音文件包含的答案数据的全部或部分。

在本公开的另一个实施例中，所述基于所述至少一个更新的问答对，对所述知识库进行更新，包括：

以所述至少一个更新的问答对中的目标问题数据为聚类中心，对所述知识库中的问题数据进行聚类，得到至少一个问题数据集合；

将每个问题数据集合中的每个问题数据对应的答案数据，更新为相应聚类中心对应的更新的答案数据。

在本公开的另一个实施例中，所述方法还包括：

当检测到与用户的交互方式由所述智能客服转为人工客服，获取所述人工客服提供的人工问答对，所述人工问答对包括所述人工客服需要回答的问题数据和提供的人工答案数据；

基于所述人工问答对，对所述知识库进行更新。

在本公开的另一个实施例中，所述方法还包括：

基于预设筛选条件，从正常录音文件中，筛选出至少一个目标录音文件；

获取对每个目标录音文件中答案数据的校验结果；

基于所述校验结果，对所述知识库进行更新。

第二方面，提供了一种智能客服的知识库更新装置，所述装置包括：

确定模块，用于根据多个录音文件的用户反馈数据，确定所述多个录音文件的用户满意状况，所述录音文件为用户与智能客服交互过程中所录制的文件，所述用户满意状况用于反映用户对所述智能客服从知识库中获取的答案数据的满意状况；

筛选模块，用于根据所述多个录音文件的用户满意状况，从所述多个录音文件中，筛选出至少一个候选录音文件；

预处理模块，用于对所述至少一个候选录音文件进行预处理，得到至少一个预处理后的文件，所述预处理后的文件为文本文件或者不包括无效语音数据的候选录音文件；

获取模块，用于基于所述至少一个预处理后的文件，获取答案数据需要更新的至少一个非正常录音文件；

生成模块，用于基于所述至少一个非正常录音文件中的目标问题数据，生成至少一个更新的问答对，所述更新的问答对包括所述目标问题数据和更新的答案数据；

更新模块，用于基于所述至少一个更新的问答对，对所述知识库进行更新。

在本公开的另一个实施例中，所述确定模块，用于从每个录音文件的用户反馈数据中，获取每个录音文件的评价数据；当任一录音文件的评价数据指示的评价指标超出预设指标范围，则确定所述录音文件的用户满意状况为不满意。

在本公开的另一个实施例中，所述确定模块，用于当检测到任一录音文件中用户的交互方式由所述智能客服转人工客服，确定所述录音文件的用户满意状况为不满意。

在本公开的另一个实施例中，所述确定模块，用于从每个录音文件的用户反馈数据中，查询每个录音文件的投诉数据；当查询到任一录音文件的投诉数据，确定所述录音文件的用户满意状况为不满意。

在本公开的另一个实施例中，所述确定模块，用于从每个录音文件的用户反馈数据中，获取人声数据；对于任一录音文件，根据所述录音文件的人声数据，确定所述录音文件录制过程中用户与所述智能客服的交互情绪；当所述交互情绪为指定情绪，则确定所述录音文件的用户满意状况为不满意。

在本公开的另一个实施例中，所述确定模块，用于从所述录音文件的人声数据中，提取目标语音特征；将所述目标语音特征输入到情绪识别模型中，输出所述录音文件录制过程中用户与所述智能客服的交互情绪，所述情绪识别模型用于基于语音特征识别出用户的情绪。

在本公开的另一个实施例中，所述确定模块，用于从所述录音文件的人声数据中，提取指定关键字；当提取到所述指定关键字，确定所述录音文件录制过程中用户与所述智能客服的交互情绪为指定情绪。

在本公开的另一个实施例中，所述确定模块，用于从所述录音文件的人声数据中，获取问题数据的重复次数、预设时间段内接收到用户的语音通话请求的次数中至少一项；当所述问题数据的重复次数、所述语音通话请求的次数中至少一项达到预设次数，确定所述录音文件录制过程中用户与所述智能客服的交互情绪为指定情绪。

在本公开的另一个实施例中，所述预处理模块，用于将每个候选录音文件由语音形式转换为文本形式，得到至少一个预处理后的文件。

在本公开的另一个实施例中，所述预处理模块，用于将每个候选录音文件进行分段处理，得到多个录音片段；删除所述多个录音片段中的空白数据、目标答案数据中至少一项，得到预处理后的文件，所述目标答案数据为候选录音文件包含的答案数据的全部或部分。

在本公开的另一个实施例中，所述更新模块，用于以所述至少一个更新的问答对中的目标问题数据为聚类中心，对所述知识库中的问题数据进行聚类，得到至少一个问题数据集合；将每个问题数据集合中的每个问题数据对应的答案数据，更新为相应聚类中心对应的更新的答案数据。

在本公开的另一个实施例中，所述获取模块，还用于当检测到与用户的交互方式由所述智能客服转为人工客服，获取所述人工客服提供的人工问答对，所述人工问答对包括所述人工客服需要回答的问题数据和提供的人工答案数据；

所述更新模块，还用于基于所述人工问答对，对所述知识库进行更新。

在本公开的另一个实施例中，所述筛选模块，还用于基于预设筛选条件，从正常录音文件中，筛选出至少一个目标录音文件；

所述获取模块，还用于获取对每个目标录音文件中答案数据的校验结果；

所述更新模块，还用于基于所述校验结果，对所述知识库进行更新。

第三方面，提供了一种电子设备，所述电子设备包括处理器和存储器，所述存储器中存储有至少一条程序代码，所述至少一条程序代码由所述处理器加载并执行，以实现如第一方面所述的智能客服的知识库更新方法。

第四方面，提供了一种计算机可读存储介质，所述存储介质中存储有至少一条程序代码，所述至少一条程序代码由处理器加载并执行，以实现如第一方面所述的智能客服的知识库更新方法。

本公开实施例提供的技术方案带来的有益效果是：

无需完整地播放完录音文件，基于用户对智能客服提供的答案数据的满意情况，筛选候选录音文件，在此基础上通过对候选录音文件进行预处理，将候选录音文件转换为文本形式或者去除候选录音文件中的无效语音数据，使得标注人员能够快速标注出非正常录音文件，大大缩短了非正常录音文件的标注时长，提高了知识库的更新速度。

附图说明

为了更清楚地说明本公开实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本公开实施例提供的一种智能客服的知识库更新方法的流程图；

图2是本公开实施例提供的另一种智能客服的知识库更新方法的流程图；

图3是本公开实施例提供的另一种智能客服的知识库更新装置的结构示意图；

图4示出了本公开一个示例性实施例提供的一种电子设备的结构框图。

具体实施方式

为使本公开的目的、技术方案和优点更加清楚，下面将结合附图对本公开实施方式作进一步地详细描述。

可以理解，本公开实施例所使用的术语“每个”、“多个”及“任一”等，多个包括两个或两个以上，每个是指对应的多个中的每一个，任一是指对应的多个中的任意一个。举例来说，多个词语包括10个词语，而每个词语是指这10个词语中的每一个词语，任一词语是指10个词语中的任意一个词语。

随着人工智能技术的发展，智能客服得到广泛的发展，尤其在物流、酒店、金融、教育、保险、银行、健康、政府等行业中的售后服务、客户筛选、投诉咨询、产品咨询等方面。智能客服是指在大规模知识处理基础上发展起来的一项面向行业的应用，适用于大规模知识处理、自然语言理解、知识管理、自动问答系统、推理等技术行业，智能客服不仅为企业提供了精细粒度知识管理，还为企业和海量用户之间建立了一种基于自然语言的快捷有效的技术手段，同时还能够为企业提供精细化管理所需的统计分析信息。为了更好地为用户服务，智能客服的知识库需要及时进行更新。本公开实施例提供了一种智能客服的知识库更新方法，参见图1，本公开你实施例提供的方法流程包括：

101.根据多个录音文件的用户反馈数据，确定多个录音文件的用户满意状况。

其中，录音文件为用户与智能客服交互过程中所录制的文件，该用户满意状况用于反映用户对智能客服提供的答案数据的满意状况。

102.根据多个录音文件的用户满意状况，从多个录音文件中，筛选出至少一个候选录音文件。

103.对至少一个候选录音文件进行预处理，得到至少一个预处理后的文件。

其中，预处理后的文件为文本文件或者不包括无效语音数据的候选录音文件。

104.基于至少一个预处理后的文件，获取答案数据需要更新的至少一个非正常录音文件。

105.基于至少一个非正常录音文件中的目标问题数据，生成至少一个更新的问答对。

其中，更新的问答对包括目标问题数据和更新的答案数据。

106.基于至少一个更新的问答对，对知识库进行更新。

本公开实施例提供的方法，无需完整地播放完录音文件，基于用户对智能客服提供的答案数据的满意情况，筛选候选录音文件，在此基础上通过对候选录音文件进行预处理，将候选录音文件转换为文本形式或者去除候选录音文件中的无效语音数据，使得标注人员能够快速标注出非正常录音文件，大大缩短了非正常录音文件的标注时长，提高了知识库的更新速度。

在本公开的另一个实施例中，根据多个录音文件的用户反馈数据，确定多个录音文件的用户满意状况，包括：

当任一录音文件的评价数据指示的评价指标超出预设指标范围，则确定录音文件的用户满意状况为不满意。

当查询到任一录音文件的投诉数据，确定录音文件的用户满意状况为不满意。

当检测到任一录音文件中用户的交互方式由智能客服转人工客服，确定录音文件的用户满意状况为不满意。

从每个录音文件的用户反馈数据中，获取人声数据；

对于任一录音文件，根据录音文件的人声数据，确定录音文件录制过程中用户与智能客服的交互情绪；

当交互情绪为指定情绪，则确定录音文件的用户满意状况为不满意。

在本公开的另一个实施例中，根据录音文件的人声数据，确定录音文件录制过程中用户与智能客服的交互情绪，包括：

从录音文件的人声数据中，提取目标语音特征；

将目标语音特征输入到情绪识别模型中，输出录音文件录制过程中用户与智能客服的交互情绪，情绪识别模型用于基于语音特征识别出用户的情绪。

从录音文件的人声数据中，提取指定关键字；

当提取到指定关键字，确定录音文件录制过程中用户与智能客服的交互情绪为指定情绪。

从录音文件的人声数据中，获取问题数据的重复次数、预设时间段内接收到用户的语音通话请求的次数中至少一项；

当问题数据的重复次数、语音通话请求的次数中至少一项达到预设次数，确定录音文件录制过程中用户与智能客服的交互情绪为指定情绪。

在本公开的另一个实施例中，对至少一个候选录音文件进行预处理，得到至少一个预处理后的文件，包括：

将每个候选录音文件进行分段处理，得到多个录音片段；

删除多个录音片段中的空白数据、目标答案数据中至少一项，得到预处理后的文件，该目标答案数据为候选录音文件包含的答案数据的全部或部分。

在本公开的另一个实施例中，基于至少一个更新的问答对，对知识库进行更新，包括：

以至少一个更新的问答对中的目标问题数据为聚类中心，对知识库中的问题数据进行聚类，得到至少一个问题数据集合；

在本公开的另一个实施例中，该方法还包括：

当检测到与用户的交互方式由智能客服转为人工客服，获取人工客服提供的人工问答对，人工问答对包括人工客服需要回答的问题数据和提供的人工答案数据；

基于人工问答对，对知识库进行更新。

在本公开的另一个实施例中，该方法还包括：

获取对每个目标录音文件中答案数据的校验结果；

基于校验结果，对知识库进行更新。

上述所有可选技术方案，可以采用任意结合形成本公开的可选实施例，在此不再一一赘述。

本公开实施例提供了一种智能客服的知识库更新方法，以电子设备执行本公开实施例为例，该电子设备可以为具有一定计算能力的终端，例如，智能手机、平板电脑、笔记本电脑、台式电脑等；该电子设备还可以服务器，该服务器可以为独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统。参见图2，本公开实施例提供的方法流程包括：

201.电子设备根据多个录音文件的用户反馈数据，确定多个录音文件的用户满意状况。

其中，录音文件为用户与智能客服交互过程中所录制的文件，该录音文件包括用户的问题数据、智能客服的答案数据及用户与智能客服的其他交互数据。用户反馈数据包括评价数据、投诉数据等等，该用户反馈数据可在用户与智能客服交互交互过程中生成，也可在用户与智能客服交互后生成。例如，用户与智能客户交互后，电子设备以邮件、短信息、即时消息等形式向用户发送用于对本次交互情况进行评价的请求消息，用户根据本次交互过程中的真实感受，采用相应的形式将用户反馈数据发送至电子设备。评价数据是用户在与智能客服交互完成后，针对本次智能客服提供的答案数据给出的评价，该评价数据包括评价分数、评价等级等。如果采取10分制，则评价分数可以为8分、9分、10分等，如果采取100分制，则评价分数可以为80分、90分、100分等。评价等级包括十分满意、满意、一般、差、较差等多个等级。投诉数据为用户在智能客服提供的答案数据不满意时向后台投诉所生成的数据，该投诉数据可以包括问题数据、智能客服给出的答案数据、不满意的原因等等。用户满意状况用于反应用户对智能客服提供的答案数据的满意状况，该用户满意状况包括满意和不满意两种。

在本公开的另一个实施例中，电子设备根据多个录音文件的用户反馈数据，确定多个录音文件的用户满意状况时，可采用如下方法：

20111.电子设备从每个录音文件的用户反馈数据中，获取每个录音文件的评价数据。

考虑到如果用户反馈数据中的评价分数较高或评价等级较高，大概率智能客服提供的答案数据能够解决用户的问题，用户对智能客服给出的问题的满意度较高，反之，如果用户反馈数据中的评价分数较低或评价等级较低，大概率智能客服提供的答案数据无法解决用户的问题，用户对智能客服给出的问题的满意度较低。鉴于此，电子设备可从每个录音文件的用户反馈数据中，获取评价数，进而基于该评价数据，判断用户对录音文件中智能客服提供的答案数据的满意状况。

20112.当任一录音文件的评价数据指示的评价指标超出预设指标范围，则电子设备确定录音文件的用户满意状况为不满意。

当录音文件的评价数据为评价分数时，该预设指标范围可以为预设分数范围，以采用100制为例，该预设分数范围可以为80分～85分、90分～95分等等。也即是，当该录音文件的评价分数超出预设分数范围，电子设备确定该录音文件的用户满意状况为不满意。当录音文件的评价数据为评价等级，该预设指标范围可以为预设等级范围，也即是，当该录音文件的评价等级超出预设等级范围，则电子设备确定该录音文件的用户满意状况为不满意。本公开实施例提供的方法基于录音文件的评价数据，对录音文件进行初步筛选，筛选出评价分数或评价等级较低的录音文件，进而对所这些录音文件进一步进行核查，缩减了非正常录音文件的标注成本及标注时长。

在本公开的另一个实施例中，电子设备根据多个录音文件的用户反馈数据，确定多个录音文件的用户满意状况时，还可以采用如下方法：

20121.电子设备从每个录音文件的用户反馈数据中，查询每个录音文件的投诉数据。

通常智能客服将答案数据提供给用户后，如果用户对智能客服提供的答案数据不满意，用户有可能会对智能客服进行投诉，但如果用户对智能客服提供的答案数据比较满意，用户大概率不会对智能客服进行投诉，鉴于此，电子设备可通过查询录音文件的用户反馈数据中是否包括投诉数据，来判断录音文件的用户满意状况。

20122.当查询到任一录音文件的投诉数据，电子设备确定录音文件的用户满意状况为不满意。

电子设备查询每个录音文件的用户反馈数据，当从任一录音文件的用户反馈数据中查询到投诉数据，则电子设备确定该录音文件的用户满意状况为不满意。

考虑到用户在获取到不满意的答案数据后不一定每次都会投诉，因此，当电子设备未从该录音文件的用户反馈数据中查询到投诉数据，电子设备并不会确定该录音文件的用户满意状况为满意，而是结合评价数据或者其他数据进一步判断，从而更准确地确定出用户对该答案数据是否满意。

在本公开的另一个实施例中，当用户对智能客服给出的答案数据并不满意时，用户通常会转接到人工客服，由人工客服进行解决。因此，电子设备判断录音文件的用户满意状况时，可检测录音文中用户的交互方式，当检测到录音文件中用户的交互方式由智能客服转人工客服，则可确定该录音文件的用户满意状况为不满意。

在本公开的另一个实施例中，电子设备根据多个录音文件的用户反馈数据，确定多个录音文件的用户满意状况时，还可采用如下方法：

20131.电子设备从每个录音文件的用户反馈数据中，获取人声数据。

在智能客服与用户的交互过程中，针对智能客服给出的每个答案数据，用户通常都会给出一定的语音反馈。电子设备记录用户从开始说话到智能客服开始说话的第一时间段，并记录智能客服从开始说话到用户开始说话的第二时间段。电子设备按照第一时间段指示的时间对录音文件进行切分，得到用户的人声数据，电子设备按照第二时间段指示的时间对录音文件进行切分，得到智能客服的语音数据。

20132.对于任一录音文件，电子设备根据录音文件的人声数据，确定录音文件录制过程中用户与智能客服的交互情绪。

在一种可能的实现方式中，电子设备根据录音文件的人声数据，确定该录音文件录制过程中用户与智能客服的交互情绪时，可采用如下方法：

2013211.电子设备从录音文件的人声数据中，提取目标语音特征。

其中，目标语音特征包括音量特征、语速特征等至少一种。通常用户在生气或者得不到满意答案时，会不自觉的提高音量、加快语速等，以表达自己不耐烦的情绪。鉴于此，电子设备可通过从录音文件的人声数据中提取目标语音特征，来判断用户与智能客服的交互情绪。具体地，电子设备从录音文件的人声数据中，提取目标语音特征时，可先对人声数据进行切分，得到多个人声语音片段，进而从每个人声语音片段中提取目标语音特征。电子设备在对人声数据进行切分时，以人声数据的起始位置为起点，预设时长为时间窗口进行切分，得到多个时长为预设时长的人声语音片段。其中，预设时长可以为1秒、2秒等。

2013212.电子设备将目标语音特征输入到情绪识别模型中，输出录音文件录制过程中用户与智能客服的交互情绪。

其中，情绪识别模型用于基于语音特征识别出用户的情绪。电子设备将提取的目标语音特征依次输入到情绪识别模型中，基于情绪识别模型进行识别，即可输出用户与智能客服的交互情绪。如果输入的多个目标语音特征表现为随着输入时间的增加，音量逐渐增加，或者语速越来越快，则情绪识别模型输出用户与智能客服的交互情绪为指定情绪。该指定情绪包括生气、不满意、不耐烦等消极情绪。

其中，情绪识别模型可根据不同情绪的人声样本数据训练得到。例如，电子设备获取标注不同情绪的人声样本数据，并提取每个人声样本数据的目标语音特征，进而将每个人声样本数据的目标语音特征输入到初始情绪识别模型中，该初始情绪识别模型可以为深度学习模型，且该初始情绪识别模型的模型参数设置有初始值，基于初始情绪识别模型对每个人声样本数据中用户的情绪进行识别，输出每个人声样本数据对应的识别情绪。接着，电子设备将每个人声样本数据对应的识别情绪和标注情绪输入到预先构建的目标损失函数中，输出每个人声样本的目标损失函数值，如果该目标损失函数值不符合预设阈值，则继续调整初始情绪识别模型的模型参数的参数值，直至得到的目标损失函数值符合预设阈值，将符合预设阈值时模型参数的参数值对应的初始情绪识别模型，确定为训练好的情绪识别模型。

在另一种可能的实现方式中，电子设备根据录音文件的人声数据，确定录音文件录制过程中用户与智能客服的交互情绪时，可采用如下方法：

2013221.电子设备从录音文件的人声数据中，提取指定关键字。

其中，指定关键字包括用于表现用户不耐烦的语气词，例如，“咳”、“哎呀”等，还包括直接表现用户情绪的词汇，例如，“讨厌”、“生气”、“不喜欢”、“厌烦”等等，还包括用户的不文明用语，也可以包括一些否定的语句，例如，“你能不能回答我的问题”、“你到底能不能解决”等等。

电子设备将录音文件的人声数据输入到关键字识别模型中进行识别，输出指定关键字。其中，关键字识别模型用于从人声数据中识别出指定关键字。关键字识别模型的识别过程为：将人声数据转换为文本数据，进而遍历该文本数据，当文本数据中包括指定关键字，则输出该指定关键字。电子设备在基于关键字识别模型从人声数据中识别出指定关键字时，可先将人声数据切分为多个人声语音片段，然后将多个人声语音片段依次输入到关键字识别模型中，输出指定关键字。通过对人声数据进行切分，提高了指定关键字的识别速度。

2013222.当提取到指定关键字，电子设备确定录音文件录制过程中用户与智能客服的交互情绪为指定情绪。

当用户生气或得到满意的答案时，可能会说一些表达不耐烦情绪的词汇，电子设备从录音文件的人声数据中，提取指定关键字，如果能够提取到指定关键字，则电子设备可确定录音文件录制过程中用户与智能客服的交互情绪为指定情绪。如果未提取到指定关键字，电子设备需要结合评价数据或者其他数据进一步判断，从而更准确地确定出用户对该问题数据是否满意。

在一种可能的实现方式中，电子设备根据录音文件的人声数据，确定录音文件录制过程中用户与智能客服的交互情绪时，可采用如下方法：

2013231.电子设备从录音文件的人声数据中，获取问题数据的重复次数、预设时间段内接收到用户的语音通话请求的次数中至少一项。

当用户获取的答案并不是自己想要的答案时，用户通常会重复自己的问题，以提示智能客服针对自己的问题给出相应的答案，或者用户在预设时间段内不断地向智能客服发送语音通话请求。鉴于此电子设备可通过获取问题数据的重复次数，或预设时间段内接收到用户的语音通话请求的次数中至少一项，来确定该录音文件录制过程中用户与智能客服的交互情绪。其中，预设时间段可以为3分钟、5分钟等等。

2013232.当问题数据的重复次数、语音通话请求的次数中至少一项达到预设次数，电子设备确定该录音文件录制过程中用户与智能客服的交互情绪为指定情绪。

其中，预设次数可以为2次、3次等等，本公开实施例不对预设次数作具体的限定。当问题数据的重复次数达到预设次数，或者，语音通话请求的次数达到预设次数，或者问题数据的重复和语音通话请求的次数均达到预设次数，电子设备确定该录音文件录制过程中用户与智能客服的交互请求为指定情绪。

20133.当交互情绪为指定情绪，则电子设备确定录音文件的用户满意状况为不满意。

当用户与智能客服的交互情绪为指定情绪，说明本次的交互过程并不愉快，用户的问题大概率并未解决，此时电子设备可以确定该录音文件的用户满意状况为不满意。

需要说明的是，上述以根据评价数据、投诉数据、与用户的交互方式由智能客服切换为人工客服以及用户与智能客服的交互情绪中任一种，确定用户对录音文件的满意状况为例进行说明。在实际应用中，电子设备还可先查询录音文件的用户反馈数据中是否包括投诉数据，如果录音文件的用户反馈数据中包括投诉数据，电子设备直接确定用户对录音文件不满意，如果录音文件的用户反馈数据中不包括投诉数据，电子设备获取评价数据，如果能够获取到评价数据，但评价数据指示的评价指标不在预设指标范围，则确定用户对录音文件不满意；如果未获取到评价数据，电子设备查询录音文件中与用户的交互方式是否为由智能客服切换为人工客服，如果与用户的交互方式为由智能客服切换为人工客服，则确定用户对录音文件不满意；如果未查询到与用户的交互方式为由智能客服切换为人工客服，电子设备从录音文件中提取人声数据，并基于人声数据，确定录音文件录制过程中用户与智能客服的交互情绪，当该交互情绪为指定情绪，则确定对该录音文件不满意。

202.电子设备根据多个录音文件的用户满意状况，从多个录音文件中，筛选出至少一个候选录音文件。

当该录音文件的用户满意状况为不满意，为了更好地为用户服务，电子设备可将该录音文件候选录音文件，从而有针对性地对该候选录音文件进行核查，以提高用户的服务满意度。

203.电子设备对至少一个候选录音文件进行预处理，得到至少一个预处理后的文件。

在一种可能的实现方式中，电子设备可将每个候选录音文件由语音形式转换为文本形式，得到至少一个预处理后的文件。由于人类本身的特性，阅读速度要快于听力速度，电子设备通过将候选录音文件转为文本形式，使得标注人员能够快速标注出答案数据需要更新的非正常录音文件，提高标注人员对候选录音文件的标注速度。

在另一种可能的实现方式中，电子设备可将每个候选录音文件进行分段处理，得到多个录音片段，进而删除多个录音片段中的空白数据、目标答案数据中至少一项，得到预处理后的文件，该目标答案数据为候选录音文件包含的答案数据的全部或部分。由于智能客服回答的问题都具有固定的模板，这些答案数据在实际分析过程中标注人员不需要完整听完即可获知该内容，为了提高标注人员的标注速度，电子设备可以删除部分问题语音数据。考虑到网络时延、智能客服查询答案数据也需要一定的查询时间，而用户针对智能客服给出的答案数据给出反馈也需要一定时间，导致所录制的录音文件中会包括一些空白语音数据，这些数据会延长标注人员的标注时长，为了提高标注人员的标注速度，电子设备可以删除这些空白语音数据。

进一步地，电子设备删除多个录音片段中的空白数据、目标答案数据中至少一项后，还可为剩余的音频片段增加字幕，从而在播放该预处理后的文件时，能够同步显示该预处理的文件对应的字幕，以提高标注人员的标注速度。

204.电子设备基于至少一个预处理后的文件，获取答案数据需要更新的至少一个非正常录音文件。

电子设备将得到的至少一个预处理的文件提供给标注人员进行审核，当标注人员审核出任一预处理后的文件的答案数据不够准确，如果该预处理后的文件为文本文件，则标注人员操作电子设备将该预处理后的文件对应的候选录音文件作为非正常录音文件；如果该预处理后的文件为不包括无效语音数据的候选录音文件，则标注人员操作电子设备将该预处理后的文件作为非正常录音文件。

205.基于至少一个非正常录音文件中的目标问题数据，电子设备生成至少一个更新的问答对。

针对每个非正常录音文件，电子设备从该非正常录音文件中获取目标问题数据，进而通过查询资料或者从其他技术人员处获取该目标问题数据对应的更新的答案数据，从而将该目标问题数据和更新的答案数据组成一个更新的问答对。

206.电子设备基于至少一个更新的问答对，对知识库进行更新。

当获取到至少一个更新的问答对，电子设备可直接存储该至少一个更新的问答对，从而实现对知识库的更新。

在本公开的另一个实施中，电子设备还可以至少一个更新的问答对中的目标问题数据为聚类中心，对知识库中的问题数据进行聚类，得到至少一个问题数据集合，每个问题数据集合包括至少两个问题数据，进而将每个问题数据集合中的每个问题数据对应的答案数据，更新为相应聚类中心对应的更新的答案数据，从而实现知识库中数据的批量更新。

进一步地，为避免电子设备内存储大量冗余数据，以响应服务器的性能，电子设备查询知识库中的冗余数据，并将查询出的冗余数据从知识库中删除。电子设备在查询冗余数据时，可将一个问答对的问题数据与另一个问答对的问题数据进行比较，如果两个问答对的问题数据相同，则保留存储时间较晚的问答对，而将存储时间较早的问答对删除。

207.基于预设筛选条件，电子设备从正常录音文件中，筛选出至少一个目标录音文件。

其中，预设筛选条件包括平均语速超出预设速度范围等，该预设速度范围为大于第一速度小于第二速度的范围，该第一速度可以为20个字/分钟、30个字/分钟等，第二速度可以为40个字/分钟、50个字/分钟等。考虑到正常录音文件的数量较大，为了提高对正常录音文件的校验速度，电子设备可以随机获取出至少一个正常录音文件，或者按照预设比例抽取出至少一个正常录音文件，然后基于预设筛选条件，从获取到的正常录音文件中，筛选出至少一个目标语音文件，进而提供给标注人员进行人工校验，以确保知识库中的数据均为准确的数据，从而提高智能客服的服务质量。

208.电子设备获取对每个目标录音文件中答案数据的校验结果。

标注人员对每个目标录音文件进行校验，对于任一目标录音文件，如果该目标录音文件的答案数据并不准确，标注人员通过查询资料或者从其他技术人员处获取该目标录音文件的问题数据对应的更新的答案数据，并将该更新的答案数据输入到电子设备中，进而触发电子设备基于该目标录音文件中的问题数据和更新的答案数据生成需要更新的校验结果；如果该目标录音文件的答案数据准确，则标注人员将触发电子设备生成无需更新的校验结果。

209.基于校验结果，电子设备对知识库进行更新。

当目标录音文件的校验结果为需要更新的校验结果，电子设备基于更新的答案数据及问题数据对该知识库进行更新；当目标录音文件的校验结果为无需更新的校验结果，则电子设备不会对该知识库进行更新。

在本公开的另一个实施例中，当检测到与用户的交互方式由智能客服转为人工客服，电子设备获取人工客服提供的人工问答对，该人工问答对包括人工客服需要回答的问题数据和提供的人工答案数据等，进而基于人工问答对，对知识库进行更新，从而提高知识库中数据的准精确性，以更好地为用户服务。

需要说明的是，上述以智能客户与用户的交互方式为语音交互为例，当然智能客服与用户还可以采用文本形式进行交互，当采用文本形式进行交互时，在对知识库进行更新时，也可采用上述方式来判断用户对文本文件的用户满意情况，进而基于用户满意情况，从多个文本文件中筛选出候选文本文件，然后对候选文本文件进行预处理，删除模板性的答案数据，进而从预处理后的文件中，标注出非正常文本文件，从而通过对该非文本文件中的答案数据进行更新，以对知识库进行优化。

参见图3，本公开实施例提供了一种智能客服的知识库更新装置，该装置包括：

确定模块301，用于根据多个录音文件的用户反馈数据，确定多个录音文件的用户满意状况，录音文件为用户与智能客服交互过程中所录制的文件，用户满意状况用于反映用户对智能客服从知识库中获取的答案数据的满意状况；

筛选模块302，用于根据多个录音文件的用户满意状况，从多个录音文件中，筛选出至少一个候选录音文件；

预处理模块303，用于对至少一个候选录音文件进行预处理，得到至少一个预处理后的文件，预处理后的文件为文本文件或者不包括无效语音数据的候选录音文件；

获取模块304，用于基于至少一个预处理后的文件，获取答案数据需要更新的至少一个非正常录音文件；

生成模块305，用于基于至少一个非正常录音文件中的目标问题数据，生成至少一个更新的问答对，该更新的问答对包括目标问题数据和更新的答案数据；

更新模块306，用于基于至少一个更新的问答对，对知识库进行更新。

在本公开的另一个实施例中，确定模块301，用于从每个录音文件的用户反馈数据中，获取每个录音文件的评价数据；当任一录音文件的评价数据指示的评价指标超出预设指标范围，则确定录音文件的用户满意状况为不满意。

在本公开的另一个实施例中，确定模块301，用于从每个录音文件的用户反馈数据中，查询每个录音文件的投诉数据；当查询到任一录音文件的投诉数据，确定录音文件的用户满意状况为不满意。

在本公开的另一个实施例中，确定模块301，用于当检测到任一录音文件中用户的交互方式由智能客服转人工客服，确定录音文件的用户满意状况为不满意。

在本公开的另一个实施例中，确定模块301，用于从每个录音文件的用户反馈数据中，获取人声数据；对于任一录音文件，根据录音文件的人声数据，确定录音文件录制过程中用户与智能客服的交互情绪；当交互情绪为指定情绪，则确定录音文件的用户满意状况为不满意。

在本公开的另一个实施例中，确定模块301，用于从录音文件的人声数据中，提取目标语音特征；将目标语音特征输入到情绪识别模型中，输出录音文件录制过程中用户与智能客服的交互情绪，情绪识别模型用于基于语音特征识别出用户的情绪。

在本公开的另一个实施例中，确定模块301，用于从录音文件的人声数据中，提取指定关键字；当提取到指定关键字，确定录音文件录制过程中用户与智能客服的交互情绪为指定情绪。

在本公开的另一个实施例中，确定模块301，用于从录音文件的人声数据中，获取问题数据的重复次数、预设时间段内接收到用户的语音通话请求的次数中至少一项；当问题数据的重复次数、语音通话请求的次数中至少一项达到预设次数，确定录音文件录制过程中用户与智能客服的交互情绪为指定情绪。

在本公开的另一个实施例中，预处理模块303，用于将每个候选录音文件由语音形式转换为文本形式，得到至少一个预处理后的文件。

在本公开的另一个实施例中，预处理模块303，用于将每个候选录音文件进行分段处理，得到多个录音片段；删除多个录音片段中的空白数据、目标答案数据中至少一项，得到预处理后的文件，该目标答案数据为候选录音文件包含的答案数据的全部或部分。

在本公开的另一个实施例中，更新模块306，用于以至少一个更新的问答对中的目标问题数据为聚类中心，对知识库中的问题数据进行聚类，得到至少一个问题数据集合；将每个问题数据集合中的每个问题数据对应的答案数据，更新为相应聚类中心对应的更新的答案数据。

在本公开的另一个实施例中，获取模块304，还用于当检测到与用户的交互方式由智能客服转为人工客服，获取人工客服提供的人工问答对，人工问答对包括人工客服需要回答的问题数据和提供的人工答案数据；

更新模块306，还用于基于人工问答对，对知识库进行更新。

在本公开的另一个实施例中，

筛选模块302，还用于基于预设筛选条件，从正常录音文件中，筛选出至少一个目标录音文件；

获取模块304，还用于获取对每个目标录音文件中答案数据的校验结果；

更新模块306，还用于基于校验结果，对知识库进行更新。

综上所述，本公开实施例提供的装置，无需完整地播放完录音文件，基于用户对智能客服提供的答案数据的满意情况，筛选候选录音文件，在此基础上通过对候选录音文件进行预处理，将候选录音文件转换为文本形式或者去除候选录音文件中的无效语音数据，使得标注人员能够快速标注出非正常录音文件，大大缩短了非正常录音文件的标注时长，提高了知识库的更新速度。

图4示出了本公开一个示例性实施例提供的一种电子设备400的结构框图。通常，设备400包括有：处理器401和存储器402。

处理器401可以包括一个或多个处理核心，比如4核心处理器、8核心处理器等。处理器401可以采用DSP(Digital Signal Processing，数字信号处理)、FPGA(Field－Programmable Gate Array，现场可编程门阵列)、PLA(Programmable Logic Array，可编程逻辑阵列)中的至少一种硬件形式来实现。处理器401也可以包括主处理器和协处理器，主处理器是用于对在唤醒状态下的数据进行处理的处理器，也称CPU(Central ProcessingUnit，中央处理器)；协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中，处理器401可以在集成有GPU(Graphics Processing Unit，图像处理器)，GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中，处理器401还可以包括AI(Artificial Intelligence，人工智能)处理器，该AI处理器用于处理有关机器学习的计算操作。

存储器402可以包括一个或多个计算机可读存储介质，该计算机可读存储介质可以是非暂态的。存储器402还可包括高速随机存取存储器，以及非易失性存储器，比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中，存储器402中的非暂态的计算机可读存储介质用于存储至少一个指令，该至少一个指令用于被处理器401所执行以实现本公开中方法实施例提供的智能客服的知识库更新方法。

在一些实施例中，电子设备400还可选包括有：外围设备接口403和至少一个外围设备。处理器401、存储器402和外围设备接口403之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口403相连。具体地，外围设备包括：电源404。

外围设备接口403可被用于将I/O(Input/Output，输入/输出)相关的至少一个外围设备连接到处理器401和存储器402。在一些实施例中，处理器401、存储器402和外围设备接口403被集成在同一芯片或电路板上；在一些其他实施例中，处理器401、存储器402和外围设备接口403中的任意一个或两个可以在单独的芯片或电路板上实现，本实施例对此不加以限定。

电源404用于为电子设备400中的各个组件进行供电。电源404可以是交流电、直流电、一次性电池或可充电电池。当电源404包括可充电电池时，该可充电电池可以是有线充电电池或无线充电电池。有线充电电池是通过有线线路充电的电池，无线充电电池是通过无线线圈充电的电池。该可充电电池还可以用于支持快充技术。

本领域技术人员可以理解，图4中示出的结构并不构成对电子设备400的限定，可以包括比图示更多或更少的组件，或者组合某些组件，或者采用不同的组件布置。

在示例性实施例中，还提供了一种包括指令的计算机可读存储介质，例如包括指令的存储器，上述指令可由电子设备400的处理器执行以完成上述智能客服的知识库更新方法。可选地，存储介质可以是非临时性计算机可读存储介质，例如，所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

本公开实施例提供的电子设备，无需完整地播放完录音文件，基于用户对智能客服提供的答案数据的满意情况，筛选候选录音文件，在此基础上通过对候选录音文件进行预处理，将候选录音文件转换为文本形式或者去除候选录音文件中的无效语音数据，使得标注人员能够快速标注出非正常录音文件，大大缩短了非正常录音文件的标注时长，提高了知识库的更新速度。

本公开实施例提供了一种计算机可读存储介质，该存储介质中存储有至少一条程序代码，该至少一条程序代码由处理器加载并执行，以实现智能客服的知识库更新方法。

本公开实施例提供的计算机可读存储介质，无需完整地播放完录音文件，基于用户对智能客服提供的答案数据的满意情况，筛选候选录音文件，在此基础上通过对候选录音文件进行预处理，将候选录音文件转换为文本形式或者去除候选录音文件中的无效语音数据，使得标注人员能够快速标注出非正常录音文件，大大缩短了非正常录音文件的标注时长，提高了知识库的更新速度。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本公开的可选实施例，并不用以限制本公开，凡在本公开的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本公开的保护范围之内。

Claims

1.一种智能客服的知识库更新方法，其特征在于，所述方法包括：

基于所述至少一个更新的问答对，对所述知识库进行更新。

2.根据权利要求1所述的方法，其特征在于，所述根据多个录音文件的用户反馈数据，确定所述多个录音文件的用户满意状况，包括：

3.根据权利要求1所述的方法，其特征在于，所述根据多个录音文件的用户反馈数据，确定所述多个录音文件的用户满意状况，包括：

4.根据权利要求1所述的方法，其特征在于，所述根据多个录音文件的用户反馈数据，确定所述多个录音文件的用户满意状况，包括：

5.根据权利要求1所述的方法，其特征在于，所述根据多个录音文件的用户反馈数据，确定所述多个录音文件的用户满意状况，包括：

从每个录音文件的用户反馈数据中，获取人声数据；

6.根据权利要求5所述的方法，其特征在于，所述根据所述录音文件的人声数据，确定所述录音文件录制过程中用户与所述智能客服的交互情绪，包括：

从所述录音文件的人声数据中，提取目标语音特征；

7.根据权利要求5所述的方法，其特征在于，所述根据所述录音文件的人声数据，确定所述录音文件录制过程中用户与所述智能客服的交互情绪，包括：

从所述录音文件的人声数据中，提取指定关键字；

8.根据权利要求5所述的方法，其特征在于，所述根据所述录音文件的人声数据，确定所述录音文件录制过程中用户与所述智能客服的交互情绪，包括：

9.根据权利要求1所述的方法，其特征在于，所述对所述至少一个候选录音文件进行预处理，得到至少一个预处理后的文件，包括：

10.根据权利要求1所述的方法，其特征在于，所述对所述至少一个候选录音文件进行预处理，得到至少一个预处理后的文件，包括：

将每个候选录音文件进行分段处理，得到多个录音片段；

11.根据权利要求1至10中任一项所述的方法，其特征在于，所述基于所述至少一个更新的问答对，对所述知识库进行更新，包括：

12.根据权利要求1至10中任一项所述的方法，其特征在于，所述方法还包括：

基于所述人工问答对，对所述知识库进行更新。

13.根据权利要求1至10中任一项所述的方法，其特征在于，所述方法还包括：

获取对每个目标录音文件中答案数据的校验结果；

基于所述校验结果，对所述知识库进行更新。

14.一种智能客服的知识库更新装置，其特征在于，所述装置包括：

15.一种电子设备，其特征在于，所述电子设备包括处理器和存储器，所述存储器中存储有至少一条程序代码，所述至少一条程序代码由所述处理器加载并执行，以实现如权利要求1至13中任一项所述的智能客服的知识库更新方法。

16.一种计算机可读存储介质，其特征在于，所述存储介质中存储有至少一条程序代码，所述至少一条程序代码由处理器加载并执行，以实现如权利要求1至13中任一项所述的智能客服的知识库更新方法。