CN115514849B

CN115514849B - 一种基于整体语义分析的质检方法、装置、系统及介质

Info

Publication number: CN115514849B
Application number: CN202211461519.0A
Authority: CN
Inventors: 王刚; 曾文佳; 梁鹏斌
Original assignee: Lingxi Beijing Technology Co Ltd
Current assignee: Lingxi Beijing Technology Co Ltd
Priority date: 2022-11-17
Filing date: 2022-11-17
Publication date: 2023-03-10
Anticipated expiration: 2042-11-17
Also published as: CN115514849A

Abstract

本申请实施例提供一种基于整体语义分析的质检方法、装置、系统及介质，该方法包括：获取待质检的通话记录；识别所述通话记录的语义获得多个语义标签，其中，所述多个语义标签用于表征通话双方在通话过程中所表达的信息；根据所述多个语义标签中的至少两个语义标签对所述通话记录进行质检，判断通话是否合规；或者，根据至少一个语义标签和至少一个通话场景对所述通话记录进行质检，判断通话是否合规，其中，所述至少一个通话场景是基于所述多个语义标签确定的。通过本申请的一些实施例能够将通话记录的多个特征进行结合，从整体语义的角度出发，获得准确的质检结果。

Description

一种基于整体语义分析的质检方法、装置、系统及介质

技术领域

本申请实施例涉及语音质检领域，具体涉及一种基于整体语义分析的质检方法、装置、系统及介质。

背景技术

随着人工坐席在各场景（例如，电销场景、客服场景等）下的普及，对于人工坐席通话的规范性显得尤为重要。相关技术中，对于人工坐席与用户之间通话记录的质检方法，通常使用正则表达式查找通话记录中不规范的表达，但是正则表达式只能够查找到预先设定的词语，导致质检结果不准确。

因此，如何提高通话记录质检的准确性成为需要解决的问题。

发明内容

本申请实施例提供一种基于整体语义分析的质检方法、装置、系统及介质，通过本申请的一些实施例至少能够将通话记录的多个特征进行结合，从整体语义的角度出发，获得准确的质检结果。

第一方面，本申请提供了一种基于整体语义分析的质检方法，所述质检方法包括：获取待质检的通话记录；识别所述通话记录的语义获得多个语义标签，其中，所述多个语义标签用于表征通话双方在通话过程中所表达的信息；根据所述多个语义标签中的至少两个语义标签对所述通话记录进行质检，判断通话是否合规；或者，根据至少一个语义标签和至少一个通话场景对所述通话记录进行质检，判断通话是否合规，其中，所述至少一个通话场景是基于所述多个语义标签确定的。

因此，与相关技术中使用正则表达式对通话记录进行质检的方法不同的是，本申请将通话记录中的至少两个语义标签结合或者至少一个语义标签和至少一个通话场景结合，从整体语义理解的角度对通话记录进行质检，从而能够明确通话双方的真实表达含义，进而提高质检的准确率。

结合第一方面，在本申请的一种实施方式中，在所述根据至少一个语义标签和至少一个通话场景对所述通话记录进行质检，判断通话是否合规之前，所述质检方法还包括：将所述多个语义标签中的各语义标签与通话场景对照表进行比对，获得所述至少一个通话场景，其中，所述通话场景对照表用于存储各语义标签与所述通话场景之间的对应关系。

结合第一方面，在本申请的一种实施方式中，在所述根据至少一个语义标签和至少一个通话场景对所述通话记录进行质检，判断通话是否合规之前，所述质检方法还包括：在识别所述通话记录的过程中，若出现通话场景对照表中存在的语义标签的情况下，查找与所述语义标签相对应的目标通话场景；使用所述目标通话场景替换当前通话场景；循环上述步骤，直至所述通话记录识别结束，得到所述至少一个通话场景。

因此，本申请实施例通过将多个语义标签与通话场景对照表进行比对，能够获得通话双方的通话场景，从而能够将语义标签放在通话场景中进行质检。

结合第一方面，在本申请的一种实施方式中，至少两个语义标签包括第一语义标签、第二语义标签和第三语义标签；所述根据所述多个语义标签中的至少两个语义标签对所述通话记录进行质检，判断通话是否合规，包括：确认所述通话记录中预设篇幅内所述第一语义标签与所述第二语义标签同时出现，则判断当前质检项合规；或者，确认所述通话记录中预设篇幅内所述第一语义标签与所述第三语义标签同时出现，则判断当前质检项不合规；在确定所有质检项均合规的情况下，判断所述通话合规。

因此，本申请实施例通过至少两个语义标签进行组合的形式，对通话记录进行质检，能够明确通话双方在预设篇幅内的实际表达含义，从而能够提高质检准确率。

结合第一方面，在本申请的一种实施方式中，所述至少一个语义标签包括第四语义标签和第五语义标签，所述至少一个通话场景包括第一场景；所述根据至少一个语义标签和至少一个通话场景对所述通话记录进行质检，判断通话是否合规，包括：确认所述通话记录中预设篇幅内所述第四语义标签和所述第一场景同时存在，则判断当前质检项合规；或者，确认所述通话记录中预设篇幅内所述第五语义标签和所述第一场景同时存在，则判断当前质检项不合规；在确定所有质检项均合规的情况下，判断所述通话合规。

因此，本申请实施例通过将一个语义标签和一个场景进行通话记录质检，能够从相同表达在不同场景中的语义不同的角度，准确的理解通话双方所能表达的含义。

结合第一方面，在本申请的一种实施方式中，所述识别所述通话记录的语义获得多个语义标签，包括：将所述通话记录分割为多个短句，并且通过滑动预置长度的滑窗限定领域范围，其中，所述预置长度为M个短句，M为大于或等于1的整数；识别所述滑窗各领域范围内M个短句，获得所述多个语义标签。

因此，本申请实施例通过滑窗识别多个语义标签，能够准确的将所有的语义标签均识别到，从而防止语义标签的遗漏。

第二方面，本申请提供了一种基于整体语义分析的质检系统，所述质检系统包括：坐席端，被配置为记录待质检的通话记录，并且发送所述待质检的通话记录；服务器，被配置为获取所述待质检的通话记录，并且根据所述待质检的通话记录执行如第一方面任意实施例所述的方法，判断通话是否合规。

第三方面，本申请提供了一种基于整体语义分析的质检装置，所述质检装置包括：通话记录获取模块，被配置为获取待质检的通话记录；语义标签识别模块，被配置为识别所述通话记录的语义获得多个语义标签，其中，所述多个语义标签用于表征通话双方在通话过程中所表达的信息；通话质检模块，被配置为根据所述多个语义标签中的至少两个语义标签对所述通话记录进行质检，判断通话是否合规；或者，根据至少一个语义标签和至少一个通话场景对所述通话记录进行质检，判断通话是否合规，其中，所述至少一个通话场景是基于所述多个语义标签确定的。

结合第三方面，在本申请的一种实施方式中，所述通话质检模块还被配置为：将所述多个语义标签中的各语义标签与通话场景对照表进行比对，获得所述至少一个通话场景，其中，所述通话场景对照表用于存储各语义标签与所述通话场景之间的对应关系。

结合第三方面，在本申请的一种实施方式中，所述通话质检模块还被配置为：在识别所述通话记录的过程中，若出现通话场景对照表中存在的语义标签的情况下，查找与所述语义标签相对应的目标通话场景；使用所述目标通话场景替换当前通话场景；循环上述步骤，直至所述通话记录识别结束，得到所述至少一个通话场景。

结合第三方面，在本申请的一种实施方式中，至少两个语义标签包括第一语义标签、第二语义标签和第三语义标签；所述通话质检模块还被配置为：确认所述通话记录中预设篇幅内所述第一语义标签与所述第二语义标签同时出现，则判断所述通话合规；或者，确认所述通话记录中预设篇幅内所述第一语义标签与所述第三语义标签同时出现，则判断所述通话不合规。

结合第三方面，在本申请的一种实施方式中，所述至少一个语义标签包括第四语义标签和第五语义标签，所述至少一个通话场景包括第一场景；所述通话质检模块还被配置为：确认所述通话记录中预设篇幅内所述第四语义标签和所述第一场景同时存在，则判断所述通话合规；或者，确认所述通话记录中预设篇幅内所述第五语义标签和所述第一场景同时存在，则判断所述通话不合规。

结合第三方面，在本申请的一种实施方式中，所述语义标签识别模块还被配置为将所述通话记录分割为多个短句，并且通过滑动预置长度的滑窗限定领域范围，其中，所述预置长度为M个短句，M为大于或等于1的整数；识别所述滑窗各领域范围内M个短句，获得所述多个语义标签。

第四方面，本申请提供了一种电子设备，包括：处理器、存储器和总线；所述处理器通过所述总线与所述存储器相连，所述存储器存储有计算机程序，所述计算机程序由所述处理器执行时可实现如第一方面任意实施例所述的方法。

第五方面，本申请提供了一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被执行时可实现如第一方面任意实施例所述的方法。

附图说明

图1为本申请示出的基于整体语义分析的质检系统示意图；

图2为本申请示出的基于整体语义分析的质检方法流程图之一；

图3为本申请示出的基于整体语义分析的质检方法流程图之二；

图4为本申请示出的基于整体语义分析的质检方法流程图之三；

图5为本申请示出的基于整体语义分析的质检装置组成示意图；

图6为本申请示出的电子设备组成示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中附图，对本申请实施例中的技术方案进行清楚、完整的描述，显然，所描述的实施例仅仅是本申请的一部分实施例，而不是全部实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此，以下对附图中提供的本申请的实施例的详情描述并非旨在限制要求保护的本申请的范围，而是仅仅表示本申请的选定实施例。基于本申请的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本申请保护范围。

本申请实施例可以应用于对人工坐席与用户之间的通话记录进行质检的场景，为了改善背景技术中的问题，在本申请的一些实施例中，基于对通话记录整体语义的理解，来对人工坐席与用户之间的通话记录进行质检。例如：在本申请的一些实施例中，根据多个语义标签中的至少两个语义标签对通话记录进行质检，判断通话是否合规；或者，根据至少一个语义标签和至少一个通话场景对通话记录进行质检，判断通话是否合规。

下面结合附图详细描述本申请实施例中的方法步骤。

图1提供了本申请一些实施例中的基于整体语义分析的质检系统示意图，该系统包括坐席端110和服务器120。具体的，坐席端110在人工坐席与用户通话结束之后，生成待质检的通话记录，之后将待质检的通话记录向服务器120发送。服务器120在接收到待质检的通话记录之后，首先，识别通话记录的语义获得多个语义标签，然后，根据多个语义标签中的至少两个语义标签对通话记录进行质检，判断通话是否合规；或者，根据至少一个语义标签和至少一个通话场景对通话记录进行质检，判断通话是否合规。

可以理解的是，坐席端110在生成待质检的通话记录之后，还可以在坐席端110中对待质检的通话记录进行质检，并且显示通话是否合规。

相关技术中，在通话记录质检的过程中，包括如下几种情况：第一种情况，单独语句中存在较为明显的关键词组合。第二种情况，单独语句采用隐含的语义表示，从语义层面上可以体现出表达的含义，但具体语义不能够使用简单的关键词进行表征。第三种情况，需要结合上下文之间的联系，才能够明确沟通双方所表达的含义。但在正常的沟通场景中大部分出现的是上述第二种情况和第三种情况，因此，简单的使用正则表达式来进行质检，虽然质检速度快，但是准确率难以保证。

因此，为了解决上述问题，本申请提供了一种基于整体语义分析的质检方法。

下文将以服务器为例，示例性的阐述本申请一些实施例中由服务器执行的基于整体语义分析的质检方法。

至少为了解决上述问题，如图2所示，本申请一些实施例提供了一种基于整体语义分析的质检方法，该方法包括：

S210，获取待质检的通话记录。

需要说明的是，待质检的通话记录可以是人工坐席与用户之间的通话记录，例如，人工坐席向用户介绍理财产品。待质检的通话记录还可以是人工客服与用户之间的通话记录，例如，人工用户向用户回访产品的使用感受。可以理解的是，待质检的通话记录可以是任何场景下的通话记录，上述两个实施例仅为举例，本申请不限于此。

在本申请的一种实施方式中，待质检的通话记录是由语音转为文本的文本文件。服务器可以获取待质检的语音记录之后将该语音记录转换为待质检的通话记录，还可以直接获取文本类型的待质检的通话记录。

在本申请的一种实施方式中，在S210之前，也就是在进行质检之前，需要预先根据业务场景将可能使用到的语义标签和通话场景设置完成，并且设置在质检过程中使用到的质检项，可以理解的是，质检项是指通话记录中不合规的语义组合。

具体的，如图3所示，在S210之前，首先执行S310从坐席端中获取多个通话记录，然后执行S320基于多个通话记录确定语义标签标准和通话场景标准，最后执行S330确定质检项与语义标签标准和通话场景标准之间的对应关系。

也就是说，多个通话记录为坐席与用户的多个历史通话记录。语义标签标准为当前业务场景中，所有可能出现的语义标签，即坐席或用户所说的一句话的信息，对应的是直接表达的信息。通话场景标准为当前业务场景中，所有可能出现的通话场景，即坐席和用户所处的对话场景，对应的是隐藏的背景信息。其中，一个业务场景对应一组语义标签标准和一组通话场景标准，例如，购物电商平台的业务场景对应一组购物电商平台的语义标签标准和一组购物电商平台的通话场景标准。

直接表达的信息对应的是坐席与用户的语义标签标准，在通话记录中每句话都会有一个想要明确表达的语义信息，例如：坐席介绍产品优点的语义标签、坐席询问用户是否愿意的语义标签、坐席询问用户个人信息的语义标签等。用户表示拒绝的语义标签、用户表示在忙的语义标签、用户询问产品属性的语义标签等，当长时间没有通话的情况下，会对应无通话的语义标签。

隐藏的背景信息对应的是通话场景标准，对话过程中人与人的交流并不会把所有信息都表达出来，会将默认对话双方都知道的事情不表达出来。同样的话术也会因为身处不同的场景从而表达出完全不同语义信息或是遵守不同的规则。例如：坐席：您打开。引导打开短信场景对应的是打开短信。引导打开链接场景对应的是打开链接。当坐席身处于产品介绍场景需要遵守产品介绍场景的话术逻辑、话术要求和质检要求，其中，场景包含产品介绍场景、引导操作场景、邀请添加微信场景等。

质检项是判断通话记录是否合规的条件，需要预先在数据库中进行保存，在质检的过程，通过判断通话记录中语义标签和通话场景触发质检项来确定通话记录不合规。例如，规定一个问答中坐席说明收益的语义标签和承诺收益的语义标签同时出现，则确定通话记录不合规，那么质检项则为坐席说明收益的语义标签和承诺收益的语义标签同时出现。

在本申请的一种实施方式中，在S210之前，还需要训练用于识别多个语义标签的模型。

具体的，该模型的输入是坐席与用户的多条语句，该模型的输出是语义标签标准的列表。可以理解的是，该模型可以使用相关技术中能够识别语义的模型进行训练，例如，预训练模型（Bidirectional Encoder Representation from Transformers，BRET）、聚类模型等。

S220，识别通话记录的语义获得多个语义标签。

需要说明的是，多个语义标签用于表征通话双方在通话过程中所表达的信息。

在本申请的一种实施方式中，由于对话场景中当单独一个语句过长时，所表达的含义必然不只是一个，会是多个语义的相互结合。因此，本申请首先，将通话记录分割为多个短句，并且通过滑动预置长度的滑窗限定领域范围，其中，预置长度为M个短句，M为大于或等于1的整数，然后，识别滑窗各领域范围内M个短句，获得多个语义标签。

具体的，以通话记录中的标点符号（例如，逗号、句号、问号、省略号、感叹号等）为分割依据，将通话记录分割为多个短句，当M取3时，滑窗的预置长度为3个短句，步长可以设置为一个短句，那么，通过滑动滑窗识别当前滑窗中的3个短句对应的语义标签，直至通话记录的篇幅结束，获得多个语义标签。

也就是说，对于语句根据标点符号进行分隔得到多个短句，采用窗口为3个短句，步长为1个短句进行分隔子句，然后子句进行单独识别，最后结果进行整合得到整句的语义标签列表。

在本申请的一种实施方式中，采用无监督聚类算法对通话记录中的单句语句进行聚类，获得多个语义标签。

具体的，采用无监督的聚类算法对通话记录中的大量的对话信息进行聚类处理，坐席与用户的表达语句进行分开处理，得到N个语义标签和N个语义标签中各语义标签所对应的语句。再进行不断的进行筛选、清洗，即筛选掉不重要的语义标签，清洗需要的语义标签中的语句，保证各语义标签所对应的语句语义信息都相同。之后再不断的进行聚类，分类进行语料提纯，获得多个语义标签。

例如，用户表示“我不需要”，那么语义标签为用户表示不需要。用户表示“好，可以”，那么语义标签为用户表示肯定。

S230，根据多个语义标签中的至少两个语义标签对通话记录进行质检，判断通话是否合规；或者，根据至少一个语义标签和至少一个通话场景对通话记录进行质检，判断通话是否合规。

在本申请的一种实施方式中，在S230之前还包括识别通话记录中的至少一个通话场景。具体包括以下两种实施方式：

第一种实施方式为在通话记录的所有语义标签都识别完成之后，再识别至少一个通话场景。具体的，将多个语义标签中的各语义标签与通话场景对照表进行比对，获得至少一个通话场景。

需要说明的是，通话场景对照表用于存储各语义标签与所述通话场景之间的对应关系。

作为本申请一具体实施例，通话记录的原文为“我们的产品真的很实惠，很物超所值，产品参数是”，所对应的语义标签为坐席介绍产品标签，那么，在通话场景对照表中坐席介绍产品标签对应的通话场景为产品介绍场景。

作为本申请另一具体实施例，通话记录的原文为“您打开界面如实将你们的信息填写就行”，所对应的语义标签为坐席引导用户操作填写个人信息，那么，在通话场景对照表中坐席引导用户操作填写个人信息的语义标签对应的通话场景为引导操作场景。

第二种实施方式为在识别通话记录的语义标签的过程中，识别通话场景。具体的，首先，在识别通话记录的过程中，若出现通话场景对照表中存在的语义标签的情况下，查找与语义标签相对应的目标通话场景，然后，使用目标通话场景替换当前通话场景，最后，循环上述步骤，直至通话记录识别结束，得到至少一个通话场景。

也就是说，在识别出当前语句的语义标签之后，直接就在通话场景对照表中查找当前语句的语义标签，得到目标通话场景，并且使用目标通话场景替换当前。可以理解的是，在开始识别语义标签的时候，设置一个初始的通话场景，在识别到其他的通话场景之后，再进行替换。并不是每一个语义标签都能对应一个通话场景，即只有预先设置的特定的语义标签才对应通话场景，当识别到这些特定的语义标签，才触发通话场景的更换。

在本申请的一种实施方式中，还包括根据多个语义标签中的一个语义标签对通话记录进行质检，判断通话是否合规。例如，一个语义标签为坐席态度消极，则说明在该质检项中坐席不符合要求。

在本申请的一种实施方式中，使用至少两个语义标签的组合方式进行质检。具体的，至少两个语义标签包括第一语义标签、第二语义标签和第三语义标签。

作为上述实施例的第一种情况，确认通话记录中预设篇幅内第一语义标签与第二语义标签同时出现，则判断当前质检项合规。

例如，第一语义标签为坐席说明收益，第二语义标签为提示风险，第三语义标签为承诺收益，那么，当坐席说明收益和提示风险同时出现，则说明在第一语义标签与第二语义标签的质检项中坐席符合要求。

作为上述实施例的第二种情况，确认通话记录中预设篇幅内第一语义标签与第三语义标签同时出现，则判断当前质检项不合规。

例如，第一语义标签为坐席说明收益，第二语义标签为提示风险，第三语义标签为承诺收益，那么，当坐席说明收益和承诺收益同时出现，则说明在第一语义标签与第三语义标签的质检项中坐席不符合要求。

需要说明的是，确定所有质检项均合规的情况下，判断通话记录合规。出现任意质检项不合规的情况，判断通话记录不合规。质检项为需要检查的至少两个语义标签的组合，例如，两个语义标签的组合或者三个语义标签的组合。

在本申请的另一种实施方式中，使用至少一个通话场景和至少一个语义标签的组合方式进行质检。至少一个语义标签包括第四语义标签和第五语义标签，至少一个通话场景包括第一场景。

作为上述实施例的第一种情况，确认通话记录中预设篇幅内第四语义标签和第一场景同时存在，则判断当前质检项合规。

例如，第四语义标签为询问用户的真实信息，第五语义标签为询问用户账户余额，第一场景为记录信息场景。当坐席询问用户的真实信息和记录信息场景同时出现，则说明在第四语义标签与第一场景的质检项中坐席符合要求。

作为上述实施例的第二种情况，确认通话记录中预设篇幅内第五语义标签和第一场景同时存在，则判断当前质检项不合规。

例如，第四语义标签为询问用户的真实信息，第五语义标签为询问用户账户余额，第一场景为记录信息场景。当坐席询问用户账户余额和记录信息场景同时出现，则说明在第五语义标签与第一场景的质检项中坐席不符合要求。

在本申请的再一种实施方式中，使用至少一个通话场景和至少一个语义标签的组合方式进行质检。至少一个语义标签包括第四语义标签，至少一个通话场景包括第一场景和第二场景。

例如，第四语义标签为询问用户的真实信息，第一场景为记录信息场景，第二场景为通话开始场景。当坐席询问用户的真实信息和记录信息场景同时出现，则说明在第四语义标签与第一场景的质检项中坐席符合要求。

作为上述实施例的第二种情况，确认通话记录中预设篇幅内第四语义标签和第二场景同时存在，则判断当前质检项不合规。

例如，第四语义标签为询问用户的真实信息，第一场景为记录信息场景，第二场景为通话开始场景。当坐席询问用户的真实信息和通话开始场景同时出现，则说明在第四语义标签与第二场景的质检项中坐席不符合要求。

需要说明的是，确定所有质检项均合规的情况下，判断通话记录合规。出现任意质检项不合规的情况，判断通话记录不合规。质检项为需要检查的至少一个语义标签和至少一个通话场景的组合，例如，一个语义标签和一个通话场景的组合，或者，两个语义标签和一个通话场景的组合。

可以理解的是，预设篇幅可以是用户与坐席的一问一答，也可以是用户与坐席的多轮问答。

作为本申请一具体实施例，如图4所示，首先执行S410从坐席端中获取待质检的通话记录，然后执行S420由上到下按顺序每一句通过滑窗进行识别，得到每一句的语义标签，接着执行S430识别每一句的通话场景，并且获取时序信息，最后执行S440按顺序由上到下判断是否存在触发质检项的标签组合。

例如，根据坐席或用户的语义标签确定当前的场景是产品介绍、引导操作等，例如坐席产品介绍语义标签代表此时双方正处于产品介绍场景。每个质检项都对应的是已经制定好的语义标签和场景组合形式，语义标签和场景组合就相当于人工质检的上下文信息结合。遍历整通对话确定是否出现了某些质检项的语义标签组合形式，从而判定是否触发了质检项。可以理解的是，每一个质检要求都可以转化为语义标签的组合或者语义标签和场景组合。

例如，坐席30秒静音不说话，对应的是30秒内坐席没有说话的语义标签。坐席表示我们本身是有销售指标的。用户询问是否有销售任务，坐席表示肯定，对应的是表示自身有销售任务语义标签。

例如，质检要求为不得说出用户的个人信息，除非用户主动提供，坐席复述，则表述用户个人信息语义标签且之前未出现用户表述用户个人信息语义标签的情况，判断该质检项不符合要求。

例如，质检要求为坐席在产品介绍场景中涉及到具体数值时必须使用免责话术，在引导操作场景和信息填写场景可以不用添加免责话术。那么，当坐席在产品介绍场景中没有使用免责话术，即没有使用免责话术语义标签和产品介绍场景同时出现，则判断该质检项不符合要求。

例如，质检要求为坐席承诺一些原本不存在的权益。那么，当承诺语义标签和不存在的权益的语义标签同时出现，则判断该质检项不符合要求。

例如，质检要求为坐席在销售过程中进行个人信息填写时不能引导用户填写错误的信息。那么，当用户表示随意填写信息是否可以的语义标签，和，坐席表示肯定的语义标签同时出现的情况下，则判断该质检项不符合要求。

因此，本申请在通话记录开始的时候，给出一个在初始场景，并且确定各个质检项的语义标签组合的方案，节省准备时间。有效的解决语义层面的触发质检项行为。当坐席使用隐含的、语义层面上的不同表达方式来触发质检项时有效的识别出来。在识别准确率、召回率上，超过正则表达式实现百分之50%。最终可以将整体的识别准确率提升至90%以上，召回率95%以上。

因此，本申请的关键技术点为：获得一个场景中的语义标签的实现方式。本申请先聚类之后得出基础语义标签，然后再进行人工筛选得出最终语义标签。最后使用模型进行语义标签分类识别。将真实对话从音频转换成标签的集合，长文本的划窗切分并分别进行识别。将真实的质检对话进行对话信息的拆解，从而可以区分出语言信息表达中的显性信息（语义标签）和隐形信息（通话场景）。明确各种语义标签所与通话场景的对应关系，得出通话场景对于语义标签的含义影响，语义标签对于通话场景的切换影响。

上文描述了一种基于整体语义分析的质检方法的具体实施例，下文将描述一种基于整体语义分析的质检装置。

如图5所示，本申请的一些实施例提供一种基于整体语义分析的质检装置500，该装置包括：通话记录获取模块510、语义标签识别模块520和通话质检模块530。

通话记录获取模块510，被配置为获取待质检的通话记录；语义标签识别模块520，被配置为识别所述通话记录的语义获得多个语义标签，其中，所述多个语义标签用于表征通话双方在通话过程中所表达的信息；通话质检模块530，被配置为根据所述多个语义标签中的至少两个语义标签对所述通话记录进行质检，判断通话是否合规；或者，根据至少一个语义标签和至少一个通话场景对所述通话记录进行质检，判断通话是否合规，其中，所述至少一个通话场景是基于所述多个语义标签确定的。

在本申请的一种实施方式中，所述通话质检模块530还被配置为：将所述多个语义标签中的各语义标签与通话场景对照表进行比对，获得所述至少一个通话场景，其中，所述通话场景对照表用于存储各语义标签与所述通话场景之间的对应关系。

在本申请的一种实施方式中，所述通话质检模块530还被配置为：在识别所述通话记录的过程中，若出现通话场景对照表中存在的语义标签的情况下，查找与所述语义标签相对应的目标通话场景；使用所述目标通话场景替换当前通话场景；循环上述步骤，直至所述通话记录识别结束，得到所述至少一个通话场景。

在本申请的一种实施方式中，至少两个语义标签包括第一语义标签、第二语义标签和第三语义标签；所述通话质检模块530还被配置为：确认所述通话记录中预设篇幅内所述第一语义标签与所述第二语义标签同时出现，则判断所述通话合规；或者，确认所述通话记录中预设篇幅内所述第一语义标签与所述第三语义标签同时出现，则判断所述通话不合规。

在本申请的一种实施方式中，所述至少一个语义标签包括第四语义标签和第五语义标签，所述至少一个通话场景包括第一场景；所述通话质检模块530还被配置为：确认所述通话记录中预设篇幅内所述第四语义标签和所述第一场景同时存在，则判断所述通话合规；或者，确认所述通话记录中预设篇幅内所述第五语义标签和所述第一场景同时存在，则判断所述通话不合规。

结合第三方面，在本申请的一种实施方式中，所述语义标签识别模块520还被配置为将所述通话记录分割为多个短句，并且通过滑动预置长度的滑窗限定领域范围，其中，所述预置长度为M个短句，M为大于或等于1的整数；识别所述滑窗各领域范围内M个短句，获得所述多个语义标签。

在本申请实施例中，图5所示模块能够实现图1至图4方法实施例中的各个过程。图5中的各个模块的操作和/或功能，分别为了实现图1至图4中的方法实施例中的相应流程。具体可参见上述方法实施例中的描述，为避免重复，此处适当省略详细描述。

如图6所示，本申请实施例提供一种电子设备600，包括：处理器610、存储器620和总线630，所述处理器通过所述总线与所述存储器相连，所述存储器存储有计算机可读取指令，当所述计算机可读取指令由所述处理器执行时，用于实现如上述所有实施例中任一项所述的方法，具体可参见上述方法实施例中的描述，为避免重复，此处适当省略详细描述。

其中，总线用于实现这些组件直接的连接通信。其中，本申请实施例中处理器可以是一种集成电路芯片，具有信号的处理能力。上述的处理器可以是通用处理器，包括中央处理器（Central Processing Unit，简称CPU）、网络处理器（Network Processor，简称NP）等；还可以是数字信号处理器（DSP）、专用集成电路（ASIC）、现成可编程门阵列（FPGA）或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

存储器可以是，但不限于，随机存取存储器（Random Access Memory，RAM），只读存储器（Read Only Memory，ROM），可编程只读存储器（Programmable Read-Only Memory，PROM），可擦除只读存储器（Erasable Programmable Read-Only Memory，EPROM），电可擦除只读存储器（Electric Erasable Programmable Read-Only Memory，EEPROM）等。存储器中存储有计算机可读取指令，当所述计算机可读取指令由所述处理器执行时，可以执行上述实施例中所述的方法。

可以理解，图6所示的结构仅为示意，还可包括比图6中所示更多或者更少的组件，或者具有与图6所示不同的配置。图6中所示的各组件可以采用硬件、软件或其组合实现。

本申请实施例还提供一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被服务器执行时实现上述所有实施方式中任一所述的方法，具体可参见上述方法实施例中的描述，为避免重复，此处适当省略详细描述。

以上所述仅为本申请的优选实施例而已，并不用于限制本申请，对于本领域的技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步定义和解释。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应所述以权利要求的保护范围为准。

Claims

1.一种基于整体语义分析的质检方法，其特征在于，所述质检方法包括：

获取待质检的通话记录；

识别所述通话记录的语义获得多个语义标签，其中，所述多个语义标签用于表征通话双方在通话过程中所表达的信息；

根据至少一个语义标签和至少一个通话场景对所述通话记录进行质检，判断通话是否合规，其中，所述至少一个通话场景是基于所述多个语义标签确定的；

其中，所述至少一个语义标签包括第四语义标签和第五语义标签，所述至少一个通话场景包括第一场景；

所述根据至少一个语义标签和至少一个通话场景对所述通话记录进行质检，判断通话是否合规，包括：

确认所述通话记录中预设篇幅内所述第四语义标签和所述第一场景同时存在，则判断当前质检项合规；或者，确认所述通话记录中预设篇幅内所述第五语义标签和所述第一场景同时存在，则判断当前质检项不合规；

在确定所有质检项均合规的情况下，判断所述通话合规；

其中，所述至少一个语义标签包括所述第四语义标签，所述至少一个通话场景包括所述第一场景和第二场景；

确认所述通话记录中预设篇幅内所述第四语义标签和所述第一场景同时存在，则判断当前质检项合规；或者，确认所述通话记录中预设篇幅内所述第四语义标签和所述第二场景同时存在，则判断当前质检项不合规。

2.根据权利要求1所述的质检方法，其特征在于，在所述根据至少一个语义标签和至少一个通话场景对所述通话记录进行质检，判断通话是否合规之前，所述质检方法还包括：

将所述多个语义标签中的各语义标签与通话场景对照表进行比对，获得所述至少一个通话场景，其中，所述通话场景对照表用于存储各语义标签与所述通话场景之间的对应关系。

3.根据权利要求1所述的质检方法，其特征在于，在所述根据至少一个语义标签和至少一个通话场景对所述通话记录进行质检，判断通话是否合规之前，所述质检方法还包括：

在识别所述通话记录的过程中，若出现通话场景对照表中存在的语义标签的情况下，查找与所述语义标签相对应的目标通话场景；

使用所述目标通话场景替换当前通话场景；

循环上述步骤，直至所述通话记录识别结束，得到所述至少一个通话场景。

4.根据权利要求1-3任一项所述的质检方法，其特征在于，所述识别所述通话记录的语义获得多个语义标签，包括：

将所述通话记录分割为多个短句，并且通过滑动预置长度的滑窗限定领域范围，其中，所述预置长度为M个短句，M为大于或等于1的整数；

识别所述滑窗各领域范围内M个短句，获得所述多个语义标签。

5.一种基于整体语义分析的质检系统，其特征在于，所述质检系统包括：

坐席端，被配置为记录待质检的通话记录，并且发送所述待质检的通话记录；

服务器，被配置为获取所述待质检的通话记录，并且根据所述待质检的通话记录执行如权利要求1-4任一项所述的方法，判断通话是否合规。

6.一种基于整体语义分析的质检装置，其特征在于，所述质检装置包括：

通话记录获取模块，被配置为获取待质检的通话记录；

语义标签识别模块，被配置为识别所述通话记录的语义获得多个语义标签，其中，所述多个语义标签用于表征通话双方在通话过程中所表达的信息；

通话质检模块，被配置为根据至少一个语义标签和至少一个通话场景对所述通话记录进行质检，判断通话是否合规，其中，所述至少一个通话场景是基于所述多个语义标签确定的；

所述通话质检模块还被配置为：

在确定所有质检项均合规的情况下，判断所述通话合规；

所述通话质检模块还被配置为：

7.一种电子设备，其特征在于，包括：处理器、存储器和总线；

所述处理器通过所述总线与所述存储器相连，所述存储器存储有计算机程序，所述计算机程序由所述处理器执行时可实现如权利要求1-4任一项所述方法。

8.一种计算机可读存储介质，其特征在于，该计算机可读存储介质上存储有计算机程序，该计算机程序被执行时可实现如权利要求1-4任一项所述方法。