CN112069796B

CN112069796B - 一种语音质检方法、装置，电子设备及存储介质

Info

Publication number: CN112069796B
Application number: CN202010920475.8A
Authority: CN
Inventors: 王建辉; 吕超; 杜新凯
Original assignee: Sunshine Insurance Group Co Ltd
Current assignee: Sunshine Insurance Group Co Ltd
Priority date: 2020-09-03
Filing date: 2020-09-03
Publication date: 2023-08-04
Anticipated expiration: 2040-09-03
Also published as: CN112069796A

Abstract

本申请提供一种语音质检方法、装置，电子设备及存储介质。该方法包括：获取规则语句和待质检文本；采用预设分割规则，分别对所述规则语句以及所述待质检文本进行分割；根据预设筛选规则，从所述多个第一文本片段中确定出目标第一文本片段；将所述目标第一文本片段与所述多个候选语句进行预检索；若当前候选语句与所述目标第一文本片段的相似度大于预设阈值时，基于所述目标第一文本片段在所述规则语句中的位置，构建包含所述当前候选语句的多个候选片段；将所述规则语句与所述多个候选片段进行正式检索，获得语音质检结果。通过该方式，提升了语义检索的效率。

Description

一种语音质检方法、装置，电子设备及存储介质

技术领域

本申请涉及数据处理技术领域，具体而言，涉及一种语音质检方法、装置，电子设备及存储介质。

背景技术

语音质检是指对语音内容进行检索和分析，判断语音内容是否包含指定必说内容以及是否没有指定禁说内容。通过质检坐席与客户沟通录音，约束坐席行为符合作业规范，保证上述人员行为符合公司、行业和监管要求。

当需要检索的内容包含数量很多的句子情况下，现有的方案是对需要检索的句子一一进行检索，但是这种方案存在检索速度比较慢的问题。

发明内容

本申请实施例的目的在于提供一种语音质检方法、装置，电子设备及存储介质，以改善“当需要检索的内容包含数量很多的句子情况下，对需要检索的句子一一进行检索存在检索速度比较慢”的问题。

本发明是这样实现的：

第一方面，本申请实施例提供一种语音质检方法，包括：获取规则语句和待质检文本；其中，所述待质检文本是通过对待质检语音进行语音识别后获得的；采用预设分割规则，分别对所述规则语句以及所述待质检文本进行分割，获得所述规则语句经分割后的多个第一文本片段以及所述待质检文本的经分割后的多个第二文本片段；根据预设筛选规则，从所述多个第一文本片段中确定出目标第一文本片段；基于滑窗算法以及所述目标第一文本片段，将所述多个第二文本片段组合成多个候选语句；将所述目标第一文本片段与所述多个候选语句进行预检索；若当前候选语句与所述目标第一文本片段的相似度大于预设阈值时，基于所述目标第一文本片段在所述规则语句中的位置，构建包含所述当前候选语句的多个候选片段；将所述规则语句与所述多个候选片段进行正式检索，获得语音质检结果。

在本申请实施例中，首先在规则语句中先筛选出一个目标第一文本片段与待质检文本分割后的候选语句进行预检索，当预检索有匹配的候选语句后，再基于匹配的候选语句构建候选片段，最后将候选片段与规则语句进行正式检索。通过该方式，使得当规则语句包含多个语句时不需要一一进行检索，仅需筛选出其中一个目标第一文本片段进行预检索，且预检索匹配后再进行正式检索，进而提升了语义检索的效率。

结合上述第一方面提供的技术方案，在一些可能的实现方式中，所述规则语句和所述待质检文本均为携带时间信息的文本；所述采用预设分割规则，分别对所述规则语句以及所述待质检文本进行分割，获得所述规则语句经分割后的多个第一文本片段以及所述待质检文本的经分割后的多个第二文本片段，包括：根据预设符号和所述规则语句携带的时间信息，对所述规则语句进行分割，获取所述规则语句经分割后的多个第一文本片段；根据所述预设符号和所述待质检文本携带的时间信息，对所述待质检文本进行分割，获取所述待质检文本的经分割后的多个第二文本片段。

在本申请实施例中，通过预设符合和文本携带的时间信息二者结合的分割方式对规则语句和待质检文本分割，进一步的提高了分割效果，保证了分割的合理性。

结合上述第一方面提供的技术方案，在一些可能的实现方式中，所述根据预设筛选规则，从所述多个第一文本片段中确定出目标第一文本片段，包括：获取每个所述第一文本片段的文本长度；确定出文本长度最长的第一文本片段，其中，所述文本长度最长的第一文本片段为所述目标第一文本片段。

在本申请实施例中，由于最长的第一文本片段中涵盖的信息量最多，因此将其确定为目标第一文本片段，可以提高后续预检索的有效性。

结合上述第一方面提供的技术方案，在一些可能的实现方式中，所述根据预设筛选规则，从所述多个第一文本片段中确定出目标第一文本片段，包括：将所述多个第一文本片段中的第一个第一文本片段或所述多个第一文本片段中的最后一个第一文本片段确定为所述目标第一文本片段。

在本申请实施例中，由于第一个第一文本片段或最后一个第一文本片段携带信息通常具有较高区分度，因此，将其确定为目标第一文本片段，可以提高后续预检索的有效性。

结合上述第一方面提供的技术方案，在一些可能的实现方式中，所述基于滑窗算法以及所述目标第一文本片段，将所述多个第二文本片段组合成多个候选语句，包括：获取当前滑窗内的所有第二文本片段的总长度；在所述总长度大于等于预设区间的最小值且小于所述预设区间的最大值的情况下，将所述所有第二文本片段组合成一个所述候选语句，并按照预设步长，将所述当前滑窗沿着所述当前滑窗的扩张方向进行扩张，其中，所述预设区间是根据所述目标第一文本片段的长度确定的。

在本申请实施例中，通过获取当前滑窗内的所有第二文本片段的总长度；在总长度大于等于预设区间的最小值且小于预设区间的最大值的情况下，将所有第二文本片段组合成一个所述候选语句，并按照预设步长，将当前滑窗沿着当前滑窗的扩张方向进行扩张。通过该方式，能够准确的获取到所有符合条件的候选语句。

结合上述第一方面提供的技术方案，在一些可能的实现方式中，所述基于所述目标第一文本片段在所述规则语句中的位置，构建包含所述当前候选语句的多个候选片段，包括：确定在所述规则语句中位于所述目标第一文本片段之前的第一文本片段的第一数量，以及确定在所述规则语句中位于所述目标第一文本片段之后的第一文本片段的第二数量；获取在所述待质检文本中位于所述当前候选语句之前的第一数量的多个第二文本片段组成的候选序列，以及获取在所述待质检文本中位于所述当前候选语句之前的第三数量的多个第二文本片段组成的候选序列；其中，所述第三数量与所述第一数量的差值的绝对值小于等于第一预设数量；获取在所述待质检文本中位于所述当前候选语句之后的第二数量的多个第二文本片段组成的候选序列，以及获取在所述待质检文本中位于所述当前候选语句之后的第四数量的多个第二文本片段组成的候选序列；其中，所述第四数量与所述第二数量的差值的绝对值小于等于第二预设数量。基于在所述待质检文本中位于所述当前候选语句之前的多个候选序列以及在所述待质检文本中位于所述当前候选语句之后的多个候选序列，构建包含所述当前候选语句的多个候选片段。

在本申请实施例中，通过构建与规则语句相近长度的候选片段，进而可以提高后续检索的有效性。

结合上述第一方面提供的技术方案，在一些可能的实现方式中，在将所述规则语句与所述多个候选片段进行正式检索时，将所述当前候选语句、所述当前候选语句之前的第一数量的多个第二文本片段组成的候选序列、所述当前候选语句之后的第二数量的多个第二文本片段组成的候选序列三者构建而成的候选片段作为初次与所述规则语句进行正式检索的候选片段。

在本申请实施例中，将当前候选语句、当前候选语句之前的第一数量的多个第二文本片段组成的候选序列、当前候选语句之后的第二数量的多个第二文本片段组成的候选序列三者构建而成的候选片段作为初次与规则语句进行正式检索的候选片段，通过该方式，提高了检索的命中率，进而提高检索效率。

第二方面，本申请实施例提供一种语音质检装置，包括：获取模块，用于获取规则语句和待质检文本；其中，所述待质检文本是通过对待质检语音进行语音识别后获得的；分割模块，用于采用预设分割规则，分别对所述规则语句以及所述待质检文本进行分割，获得所述规则语句经分割后的多个第一文本片段以及所述待质检文本的经分割后的多个第二文本片段；确定模块，用于根据预设筛选规则，从所述多个第一文本片段中确定出目标第一文本片段；组合模块，用于基于滑窗算法以及所述目标第一文本片段，将所述多个第二文本片段组合成多个候选语句；预检索模块，用于将所述目标第一文本片段与所述多个候选语句进行预检索；构建模块，用于若当前候选语句与所述目标第一文本片段的相似度大于预设阈值时，基于所述目标第一文本片段在所述规则语句中的位置，构建包含所述当前候选语句的多个候选片段；质检模块，用于将所述规则语句与所述多个候选片段进行正式检索，获得语音质检结果。

第三方面，本申请实施例提供一种电子设备，包括：处理器和存储器，所述处理器和所述存储器连接；所述存储器用于存储程序；所述处理器用于调用存储在所述存储器中的程序，执行如上述第一方面实施例和/或结合上述第一方面实施例的一些可能的实现方式提供的方法。

第四方面，本申请实施例提供一种存储介质，其上存储有计算机程序，所述计算机程序在被处理器运行时执行如上述第一方面实施例和/或结合上述第一方面实施例的一些可能的实现方式提供的方法。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对本申请实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本申请的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1为本申请实施例提供的一种电子设备的结构示意图。

图2为本申请实施例提供的一种语音质检方法的步骤流程图。

图3为本申请实施例提供的一种构建候选语句的过程的示意图。

图4为本申请实施例提供的一种构建候选片段的方法的步骤流程图。

图5为本申请实施例提供的一种语音质检装置的模块框图。

图标：100-电子设备；10-处理器；11-存储器；12-显示单元；200-语音质检装置；201-获取模块；202-分割模块；203-确定模块；204-组合模块；205-预检索模块；206-构建模块；207-质检模块。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行描述。

在语音质检过程中，当需要检索的内容包含数量很多的句子情况下，现有的方案是对需要检索的句子一一进行检索，但是这种方案存在检索速度比较慢的问题。

鉴于上述问题，本申请发明人经过研究探索，提出以下实施例以解决上述问题。

请参阅图1，图1为本申请实施例提供的一种应用语音质检方法及装置的电子设备100的示意性结构框图。本申请实施例中，电子设备100可以是，但不限于智能手机、平板电脑、个人数字助理(Personal Digital Assistant，PAD)、移动上网设备(Mobile InternetDevice，MID)等。在结构上，电子设备100可以包括处理器10、存储器11以及显示单元12。

处理器10、存储器11和显示单元12直接或间接地电性连接，以实现数据的传输或交互，例如，这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。语音质检装置包括至少一个可以软件或固件(Firmware)的形式存储在存储器11中或固化在电子设备100的操作系统(Operating System，OS)中的软件模块。处理器10用于执行存储器11中存储的可执行模块，例如，语音质检装置所包括的软件功能模块及计算机程序等，以实现语音质检方法。处理器10可以在接收到执行指令后，执行计算机程序。

其中，处理器10可以是一种集成电路芯片，具有信号处理能力。处理器10也可以是通用处理器，例如，可以是数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、分立门或晶体管逻辑器件、分立硬件组件，可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。此外，通用处理器可以是微处理器或者任何常规处理器等。

存储器11可以是，但不限于，随机存取存储器(Random Access Memory，RAM)、只读存储器(Read Only Memory，ROM)、可编程只读存储器(Programmable Read-Only Memory，PROM)、可擦可编程序只读存储器(Erasable Programmable Read-Only Memory，EPROM)，以及电可擦编程只读存储器(Electric Erasable Programmable Read-Only Memory，EEPROM)。存储器11用于存储程序，处理器10在接收到执行指令后，执行该程序。

其中，显示单元12用于实现与用户的交互。显示单元12可以是，但不限于液晶显示器、触控显示器等。

应当理解，图1所示的结构仅为示意，本申请实施例提供的电子设备100还可以具有比图1更少或更多的组件，或是具有与图1所示不同的配置。此外，图1所示的各组件可以通过软件、硬件或其组合实现。

请参阅图2，图2为本申请实施例提供的语音质检方法的流程示意图，该方法应用于图1所示的电子设备100。需要说明的是，本申请实施例提供的语音质检方法不以图2及以下所示的顺序为限制，该方法包括：步骤S101-步骤S107。

步骤S101：获取规则语句和待质检文本；其中，所述待质检文本是通过对待质检语音进行语音识别后获得的。

步骤S102：采用预设分割规则，分别对所述规则语句以及所述待质检文本进行分割，获得所述规则语句经分割后的多个第一文本片段以及所述待质检文本的经分割后的多个第二文本片段。

步骤S103：根据预设筛选规则，从所述多个第一文本片段中确定出目标第一文本片段。

步骤S104：基于滑窗算法以及所述目标第一文本片段，将所述多个第二文本片段组合成多个候选语句。

步骤S105：将所述目标第一文本片段与所述多个候选语句进行预检索。

步骤S106：若当前候选语句与所述目标第一文本片段的相似度大于预设阈值时，基于所述目标第一文本片段在所述规则语句中的位置，构建包含所述当前候选语句的多个候选片段。

步骤S107：将所述规则语句与所述多个候选片段进行正式检索，获得语音质检结果。

下面结合具体的示例对上述方法进行详细说明。

需要解释的是，规则语句包括指定必说内容以及指定禁说内容，规则语句可以是针对坐席方，也可以是针对的客户。下面举例进行说明，规则语句可以是“先生，您好！这里是某某公司，请问有什么可以帮您？”、或“感谢您的来电咨询，请稍后听到提示音后对我的服务做出评价”，以上规则语句针对的是坐席方，用于质检坐席的录音是否符合标准。当然规则语句中也可以是“先生，您好，请您存我的私人电话，以便我帮您解决问题”，该规则语句即为指定的禁说内容，用于质检坐席的录音是否合规。规则语句还可以是“你们的服务质量太差了，我要在媒体上曝光你们”。该规则语句即为针对客户，用于检测录音中是否有客户的投诉内容。在一些情况下，规则语句还可以是一段内容，包括多个句子，比如规则语是由用于解答费用问题的多个标准化语录组成。

上述的待质检文本是通过对待质检语音进行语音识别后获得的。其中，待质检语音即为坐席与客户之间沟通的录音。

在获取到规则语句和待质检文本后，采用预设分割规则，分别对规则语句和待质检文本进行分割，已获得规则语句经分割后的多个第一文本片段以及待质检文本经分割后的多个第二文本片段。需要说明的是，经分割后，文本片段可以包括字、词、短语和句子中的一个或其任意组合。此外，分割后的文本片段的位置还是按照文本的语言顺序进行排列的，并未将其打乱。

可选地，上述的规则语句和待质检文本中均为携带时间信息的文本。相应的，作为一种可选地的分割方式，该分割步骤包括：根据规则语句携带的时间信息，对规则语句进行分割，获取规则语句经分割后的多个第一文本片段；根据待质检文本携带的时间信息，对待质检文本进行分割，获取待质检文本经分割后的多个第二文本片段。

需要解释的是，文本中携带时间信息可以表示文本中每个字对应的时间节点。比如，文本中包括“先生，您好”，“先”字对应的时间节点为13:14:11，“好”字对应的时间节点为13:14:13。作为一种实施方式，根据时间信息的分割方式可以是设置时间间隔，根据时间文本中的每个字的时间节点的间隔对文本内容进行分割，比如时间间隔可以设置为两秒，则“先生，您好”刚好可以分为一个文本片段。作为另一种实施方式，根据时间信息的分割方式还可以是获取相邻两个字对应的时间节点的差值，若差值大于预设时间差值，则将这两个字分割，比如预设差值可以设置为一秒。继续以“先生，您好”为例，“生”与“您”之间由于有停顿，通常情况下，“生”与“您”之间的时间间隔是大于“先”与“生”或“您”与“好”之间的，因此，假设“生”与“您”之间的时间差值大于一秒，“先”与“生”和“您”与“好”之间的时间差值小于一秒，则可将“先生，您好”分割为“先生”和“您好”两个文本片段。对于上述的时间间隔以及时间差值可以根据实际需求而定，比如若是需要将文本划分为很短的文本片段，时间间隔可以是一秒、两秒，时间差值可以是0.1秒、0.2秒；若是需要将文本划分为较长的文本片段是，时间间隔可以是三秒、四秒、五秒，时间差值可以是0.5秒、0.7秒。

文本中携带时间信息还可以表示文本中每个字对应的时间戳，比如录音开始时时间戳为0，“先生，您好”，中的“好”的时间戳为2000，单位毫秒。对此，本申请不作限定。

作为另一种可选地的分割方式，该分割步骤包括：根据预设符号，对规则语句进行分割，获取规则语句经分割后的多个第一文本片段；以及根据预设符号，对待质检文本进行分割，获取待质检文本的经分割后的多个第二文本片段。

需要说明的是，预设符号可以包括“，”、“。”、“！”、“？”、“：”、“～”等文本中常用的字符。也即上述的分割方式是根据文本中的符号进行的分割，依然以“先生，您好”为例，通过上述预设符号的分割，检测到文本中的“，”后，即可将“先生，您好”分割为“先生”和“您好”两个文本片段。其中，预设符号也可以是自定义设置的，比如，若是需要将文本划分为很短的文本片段，可以根据上述的常用的字符进行分割，但是若需要将文本划分为较长的文本片段，可以仅根据“。”、“！”等表示句子结束的字符进行分割。对此，本申请不作限定。

为了进一步的提高分割效果，保证分割的合理性，于本申请实施例中，将上述两种分割方式相结合，也即本申请提供又一种分割方式，包括：根据预设符号和规则语句携带的时间信息，对规则语句进行分割，获取规则语句经分割后的多个第一文本片段；根据预设符号和待质检文本携带的时间信息，对待质检文本进行分割，获取待质检文本的经分割后的多个第二文本片段。

可选的，以分割待质检文本为例，当采用二者相结合的分割方式时，于本申请实施例中，先根据预设符号对待质检文本进行初次分割，获取初次分割后的多个初次分割片段，然后再根据初次分割片段携带的时间信息，对多个初次分割片段进行二次分割，获取二次分割后的多个第二文本片段。相应的，对规则语句的分割方式也等同，为了避免累赘，此处不作重复阐述。

当然，在其他实施例中，也可以是先通过携带的时间信息进行初次分割，再通过预设符号进行二次分割。对此，本申请不作限定。

还需说明的是，本申请实施例中对于分割规则语句和待质检文本的分割顺序不作限定。比如，可以是先对待质检文本进行分割，再对规则语句进行分割；也可以是先对规则语句进行分割，再对待质检文本进行分割。

通过上述步骤将规则语句分割为多个第一文本片段后，根据预设筛选规则，从多个第一文本片段中确定出目标第一文本片段。其中，确定出的目标文本片段为规则语句中最具代表性的第一文本片段。

作为一种可选地筛选方式，该筛选步骤包括：确定出文本长度最长的第一文本片段，其中，所述文本长度最长的第一文本片段为所述目标第一文本片段。

需要说明的是，由于最长的第一文本片段中涵盖的信息量最多，因此将其确定为目标第一文本片段，可以提高后续预检索的有效性。

作为另一种可选的筛选方式，该筛选步骤包括：将多个第一文本片段中的第一个第一文本片段或多个第一文本片段中的最后一个第一文本片段确定为目标第一文本片段。

需要说明的是，由于第一个第一文本片段或最后一个第一文本片段携带信息通常具有较高区分度，因此，将其确定为目标第一文本片段，可以提高后续预检索的有效性。

作为又一种可选的筛选方式，可以预先定义一些关键词，其中，关键词与所需质检的内容有关，然后在第一文本片段中筛选出包含关键词的片段，将其确定为目标第一文本片段。通过该方式，也可以提高后续预检索的有效性。

在实际确定目标第一文本片段的过程中，采用上述何种筛选方式，本申请不作限定。

需要解释的是，滑窗算法是通过限制窗口内所能接收的最大信元数对业务量进行控制。具体的，上述步骤包括：获取当前滑窗内的第二文本片段的总长度；在总长度大于等于预设区间的最小值且小于预设区间的最大值的情况下，将所有第二文本片段组合成一个所述候选语句，并按照预设步长，将当前滑窗沿着当前滑窗的扩张方向进行扩张。其中，预设区间是根据目标第一文本片段的长度确定的。

可选地，预设区间的最小值为第一系数和目标值的乘积值，预设区间的最大值为第二系数和目标值的乘积值。目标值为目标第一文本片段中的字符个数和目标第一文本片段的长度的商值。上述的第一系数的取值范围为[0，1]，第二系数的取值范围[1，99]。上述的预设步长即为以第二文本片段为步长。

为了更好的理解上述过程，下面对通过滑窗算法构建候选语句的过程进行举例说明。

请参阅图3，在得到多个第二文本片段后，以第二文本片段为步长，从左到右(从第一个第二文本片段到第n个第二文本片段，n表示第二文本片段)移动滑窗。具体过程如下：

1.第一个第二文本片段先进入构造滑窗，其长度L₁小于minL(minL表示预设区间的最小值)；滑窗左侧不动，右侧扩大包含第二个第二文本片段。

2.第一个第二文本片段和第二个第二文本片段的长度L₁₊₂大于minL且小于maxL(maxL预设区间的最大值)，也即第一个第二文本片段和第二个第二文本片段的总长度满足大于等于预设区间的最小值且小于预设区间的最大值的条件，因此，将第一个第二文本片段和第二个第二文本片段组合成一个候选语句，编号为D₁。

3.滑窗左侧不动，右侧扩大至包含第三个第二文本片段。由于第一个第二文本片段、第二个第二文本片段、第三个第二文本片段的长度L₁₊₂₊₃大于minL且小于maxL，因此，将三者组成为一个候选语句，编号为D₂。

4.滑窗左侧不动，右侧扩大至包含第四个第二文本片段。由于第一个第二文本片段、第二个第二文本片段、第三个第二文本片段和第四个第二文本片段的长度L_1+2+3+4大于maxL，不符合组成候选语句的条件，因此，进行状态转换。

5.滑窗右侧不动，左侧前进一个第二文本片段，到第二个第二文本片段的位置，此时，滑窗内的片段包括第二个第二文本片段、第三个第二文本片段和第四个第二文本片段。由于第二个第二文本片段、第三个第二文本片段、第四个第二文本片段的长度L₂₊₃₊₄大于minL且小于maxL，因此，将三者组成为一个候选语句，编号为D₃。

6.基于上述过程，再依次滑动至第五个第二文本片段、第六个第二文本片段、第七个第二文本片段、第八个第二文本片段、第九个第二文本片段、第十个第二文本片段……第n个第二文本片段，直至滑窗无法再滑动为止。通过该方式即可获取到所有的候选语句D₁～D_n，n表示候选语句的个数。

在通过上述步骤得到多个候选语句后，依次将目标第一文本片段与候选语句进行预检索。其中，预检索即为获取目标第一文本片段与候选语句的相似度，当相似度超过预设阈值后，则表示在待质检文本中有与规则语句相关联的内容。若当前候选语句与目标第一文本片段的相似度大于预设阈值时，执行步骤S106。若所有候选语句均与目标第一片段的相似度低于预设阈值，则表示在待质检文本中没有与规则语句相关联的内容，则检索终止。

也即，本步骤可以理解为，当在待质检文本中找到与规则语句中的目标第一文本片段相似度超过预设阈值的候选语句后，将候选语句与其周围的语句构建成候选片段，以便后续进行正式检索。

具体的，请参阅图4，基于目标第一文本片段在所述规则语句中的位置，构建包含所述当前候选语句的多个候选片段，包括：步骤S201-步骤S204。

步骤S201：确定在所述规则语句中位于所述目标第一文本片段之前的第一文本片段的第一数量，以及确定在所述规则语句中位于所述目标第一文本片段之后的第一文本片段的第二数量。

假设规则语句Q被分割为了q₁，q₂，q₃……q_m。m表示第一文本片段的数量。假设目标第一文本片段为q_h，也即选择q_h进行了预检索。那么，在目标第一文本片段q_h之前的第一文本片段的数量为h-1，在目标第一文本片段q_h之后的第一文本片段的数量为m-h。具体的，比如规则语句Q被分割为了q₁，q₂，q₃，q₄，q₅，q₆和q₇。目标第一文本片段为q₄，则在目标第一文本片段为q₄之前的第一文本片段数量的为4-1＝3；在目标第一文本片段q₄之后的第一文本片段的数量为7-4＝3。

步骤S202：获取在所述待质检文本中位于所述当前候选语句之前的第一数量的多个第二文本片段组成的候选序列，以及获取在所述待质检文本中位于所述当前候选语句之前的第三数量的多个第二文本片段组成的候选序列；其中，所述第三数量与所述第一数量的差值的绝对值小于等于第一预设数量。

假设待质检文本也被分割为了s₁，s₂，s₃……s_n；n为第二文本片段的数量。假定s_k是与q_h相似度大于预设阈值的候选语句，且分割后的第二文本片段s_k就是构建而成的候选语句。那么，此时获取在第二文本片段s_k之前的第一数量个第二文本片段组成的候选序列以及或者在第二文本片段s_k之前的第三数量的多个第二文本片段组成的候选序列。下面举例进行说明，假设第一预设数量为1，在步骤S201中第一数量为4-1＝3，则此时，获取在第二文本片段s_k之前的3个第二文本片段组成的候选序列、获取在第二文本片段s_k之前的2个第二文本片段组成的候选序列、获取在第二文本片段s_k之前的4个第二文本片段组成的候选序列。上述的4和2即为第三数量，其与第一数量的差值的绝对值小于等于1。

需要说明的是，当候选语句由s_k，s_k-1，s_k+1这三个第二文本片段组成时，以这三个第二文本片段作为一个整体来获取候选序列。

步骤S203：获取在所述待质检文本中位于所述当前候选语句之后的第二数量的多个第二文本片段组成的候选序列，以及获取在所述待质检文本中位于所述当前候选语句之后的第四数量的多个第二文本片段组成的候选序列；其中，所述第四数量与所述第二数量的差值的绝对值小于等于第二预设数量。

需要说明的是，该步骤即为获取在候选语句之后的候选序列，其过程与获取在候选语句之前的候选序列相同，因此，相同部分可以参考步骤S202中的说明，此时不作重复阐述。

步骤S204：基于在所述待质检文本中位于所述当前候选语句之前的多个候选序列以及在所述待质检文本中位于所述当前候选语句之后的多个候选序列，构建包含所述当前候选语句的多个候选片段。

通过上述步骤S202和步骤S203即可获取当前候选语句之前的多个候选序列以及当前候选语句之后的多个候选序列。然后，将当前候选语句之前的多个候选序列与当前候选语句之后的多个候选序列进行组合便可得到多个候选片段。下面举例进行说明，假设在当前候选语句之前有3个候选序列，在当前候选语句之后也有3个候选序列，则一共可以组合成3*3＝9个候选片段。

在获取到多个候选片段后，即可将多个候选片段依次与规则语句进行正式检索，获取候选片段依次与规则语句的相似度，当相似度超过预设阈值后，则表示在待质检文本中检索到了与规则语句相关联的内容。若所有候选片段均与规则语句的相似度低于预设阈值，则表示在待质检文本中未检索到了与规则语句相关联的内容，则检索终止。进而根据检索结果获得语音质检结果。下面对语音之间进行简单说明，比如规则语句是指定必说内容，若在待质检文本中检索到了与规则语句相关联的内容，则加十分，又比如规则语句为客户投诉的内容，若在待质检文本中检索到了与规则语句相关联的内容，则扣十分。具体的，采用何种质检的标准，本申请不作限定。

可选地，在将多个候选片段依次与规则语句进行正式检索时，将当前候选语句、当前候选语句之前的第一数量的多个第二文本片段组成的候选序列、当前候选语句之后的第二数量的多个第二文本片段组成的候选序列三者构建而成的候选片段作为初次与所述规则语句进行正式检索的候选片段。比如，目标第一文本片段为之前的第一文本片段数量的为3；在目标第一文本片段之后的第一文本片段的数量为4。也即，第一数量为3，第二数量为4，因此，此时将当前候选语句、当前候选语句之前的3个第二文本片段组成的候选序列、当前候选语句之后的4个第二文本片段组成的候选序列三者构建而成的候选片段作为初次与所述规则语句进行正式检索的候选片段。通过该方式，提高了检索的命中率，进而提高检索效率。

综上所述，在本申请实施例中，首先在规则语句中先筛选出一个目标第一文本片段与待质检文本分割后的候选语句进行预检索，当预检索有匹配的候选语句后，再基于匹配的候选语句构建候选片段，最后将候选片段与规则语句进行正式检索。通过该方式，使得当规则语句包含多个语句时不需要一一进行检索，仅需筛选出其中一个目标第一文本片段进行预检索，且预检索匹配后再进行正式检索，进而提升了语义检索的效率。

请参阅图5，基于同一发明构思，本申请实施例还提供一种语音质检装置200，包括：获取模块201、分割模块202、确定模块203、组合模块204、预检索模块205、构建模块206以及质检模块207。

获取模块201，用于获取规则语句和待质检文本；其中，所述待质检文本是通过对待质检语音进行语音识别后获得的。

分割模块202，用于采用预设分割规则，分别对所述规则语句以及所述待质检文本进行分割，获得所述规则语句经分割后的多个第一文本片段以及所述待质检文本的经分割后的多个第二文本片段。

确定模块203，用于根据预设筛选规则，从所述多个第一文本片段中确定出目标第一文本片段。

组合模块204，用于基于滑窗算法以及所述目标第一文本片段，将所述多个第二文本片段组合成多个候选语句。

预检索模块205，用于将所述目标第一文本片段与所述多个候选语句进行预检索。

构建模块206，用于若当前候选语句与所述目标第一文本片段的相似度大于预设阈值时，基于所述目标第一文本片段在所述规则语句中的位置，构建包含所述当前候选语句的多个候选片段。

质检模块207，用于将所述规则语句与所述多个候选片段进行正式检索，获得语音质检结果。

可选地，所述规则语句和所述待质检文本均为携带时间信息的文本，所述分割模块202具体用于根据预设符号和所述规则语句携带的时间信息，对所述规则语句进行分割，获取所述规则语句经分割后的多个第一文本片段；根据所述预设符号和所述待质检文本携带的时间信息，对所述待质检文本进行分割，获取所述待质检文本的经分割后的多个第二文本片段。

可选地，确定模块203具体用于获取每个所述第一文本片段的文本长度；确定出文本长度最长的第一文本片段，其中，所述文本长度最长的第一文本片段为所述目标第一文本片段。

可选地，确定模块203具体用于将所述多个第一文本片段中的第一个第一文本片段或所述多个第一文本片段中的最后一个第一文本片段确定为所述目标第一文本片段。

可选地，组合模块204具体用于获取当前滑窗内的所有第二文本片段的总长度；在所述总长度大于等于预设区间的最小值且小于所述预设区间的最大值的情况下，将所述所有第二文本片段组合成一个所述候选语句，并按照预设步长，将所述当前滑窗沿着所述当前滑窗的扩张方向进行扩张，其中，所述预设区间是根据所述目标第一文本片段的长度确定的。

可选地，构建模块206具体用于确定在所述规则语句中位于所述目标第一文本片段之前的第一文本片段的第一数量，以及确定在所述规则语句中位于所述目标第一文本片段之后的第一文本片段的第二数量；获取在所述待质检文本中位于所述当前候选语句之前的第一数量的多个第二文本片段组成的候选序列，以及获取在所述待质检文本中位于所述当前候选语句之前的第三数量的多个第二文本片段组成的候选序列；其中，所述第三数量与所述第一数量的差值的绝对值小于等于第一预设数量；获取在所述待质检文本中位于所述当前候选语句之后的第二数量的多个第二文本片段组成的候选序列，以及获取在所述待质检文本中位于所述当前候选语句之后的第四数量的多个第二文本片段组成的候选序列；其中，所述第四数量与所述第二数量的差值的绝对值小于等于第二预设数量。基于在所述待质检文本中位于所述当前候选语句之前的多个候选序列以及在所述待质检文本中位于所述当前候选语句之后的多个候选序列，构建包含所述当前候选语句的多个候选片段。

可选地，质检模块207具体用于在将所述规则语句与所述多个候选片段进行正式检索时，将所述当前候选语句、所述当前候选语句之前的第一数量的多个第二文本片段组成的候选序列、所述当前候选语句之后的第二数量的多个第二文本片段组成的候选序列三者构建而成的候选片段作为初次与所述规则语句进行正式检索的候选片段。

需要说明的是，由于所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

基于同一发明构思，本申请实施例还提供一种存储介质，其上存储有计算机程序，计算机程序在被运行时执行上述实施例中提供的方法。

该存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。

在本申请所提供的实施例中，应该理解到，所揭露装置和方法，可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，又例如，多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

另外，作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

再者，在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分，也可以是各个模块单独存在，也可以两个或两个以上模块集成形成一个独立的部分。

在本申请中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。

以上所述仅为本申请的实施例而已，并不用于限制本申请的保护范围，对于本领域的技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

1.一种语音质检方法，其特征在于，包括：

获取规则语句和待质检文本；其中，所述待质检文本是通过对待质检语音进行语音识别后获得的；

采用预设分割规则，分别对所述规则语句以及所述待质检文本进行分割，获得所述规则语句经分割后的多个第一文本片段以及所述待质检文本的经分割后的多个第二文本片段；

根据预设筛选规则，从所述多个第一文本片段中确定出目标第一文本片段；

基于滑窗算法以及所述目标第一文本片段，将所述多个第二文本片段组合成多个候选语句；

将所述目标第一文本片段与所述多个候选语句进行预检索；

若当前候选语句与所述目标第一文本片段的相似度大于预设阈值时，基于所述目标第一文本片段在所述规则语句中的位置，构建包含所述当前候选语句的多个候选片段；

将所述规则语句与所述多个候选片段进行正式检索，获得语音质检结果；

其中，所述基于滑窗算法以及所述目标第一文本片段，将所述多个第二文本片段组合成多个候选语句，包括：获取当前滑窗内的所有第二文本片段的总长度；在所述总长度大于等于预设区间的最小值且小于所述预设区间的最大值的情况下，将所述所有第二文本片段组合成一个所述候选语句，并按照预设步长，将所述当前滑窗沿着所述当前滑窗的扩张方向进行扩张，其中，所述预设区间是根据所述目标第一文本片段的长度确定的；

所述基于所述目标第一文本片段在所述规则语句中的位置，构建包含所述当前候选语句的多个候选片段，包括：

确定在所述规则语句中位于所述目标第一文本片段之前的第一文本片段的第一数量，以及确定在所述规则语句中位于所述目标第一文本片段之后的第一文本片段的第二数量；

获取在所述待质检文本中位于所述当前候选语句之前的第一数量的多个第二文本片段组成的候选序列，以及获取在所述待质检文本中位于所述当前候选语句之前的第三数量的多个第二文本片段组成的候选序列；其中，所述第三数量与所述第一数量的差值的绝对值小于等于第一预设数量；

获取在所述待质检文本中位于所述当前候选语句之后的第二数量的多个第二文本片段组成的候选序列，以及获取在所述待质检文本中位于所述当前候选语句之后的第四数量的多个第二文本片段组成的候选序列；其中，所述第四数量与所述第二数量的差值的绝对值小于等于第二预设数量；

基于在所述待质检文本中位于所述当前候选语句之前的多个候选序列以及在所述待质检文本中位于所述当前候选语句之后的多个候选序列，构建包含所述当前候选语句的多个候选片段。

2.根据权利要求1所述的语音质检方法，其特征在于，所述规则语句和所述待质检文本均为携带时间信息的文本；所述采用预设分割规则，分别对所述规则语句以及所述待质检文本进行分割，获得所述规则语句经分割后的多个第一文本片段以及所述待质检文本的经分割后的多个第二文本片段，包括：

根据预设符号和所述规则语句携带的时间信息，对所述规则语句进行分割，获取所述规则语句经分割后的多个第一文本片段；

根据所述预设符号和所述待质检文本携带的时间信息，对所述待质检文本进行分割，获取所述待质检文本的经分割后的多个第二文本片段。

3.根据权利要求1所述的语音质检方法，其特征在于，所述根据预设筛选规则，从所述多个第一文本片段中确定出目标第一文本片段，包括：

将所述多个第一文本片段中的第一个第一文本片段或所述多个第一文本片段中的最后一个第一文本片段确定为所述目标第一文本片段。

4.根据权利要求1所述的语音质检方法，其特征在于，在将所述规则语句与所述多个候选片段进行正式检索时，将所述当前候选语句、所述当前候选语句之前的第一数量的多个第二文本片段组成的候选序列、所述当前候选语句之后的第二数量的多个第二文本片段组成的候选序列三者构建而成的候选片段作为初次与所述规则语句进行正式检索的候选片段。

5.一种语音质检装置，其特征在于，包括：

获取模块，用于获取规则语句和待质检文本；其中，所述待质检文本是通过对待质检语音进行语音识别后获得的；

分割模块，用于采用预设分割规则，分别对所述规则语句以及所述待质检文本进行分割，获得所述规则语句经分割后的多个第一文本片段以及所述待质检文本的经分割后的多个第二文本片段；

确定模块，用于根据预设筛选规则，从所述多个第一文本片段中确定出目标第一文本片段；

组合模块，用于基于滑窗算法以及所述目标第一文本片段，将所述多个第二文本片段组合成多个候选语句；

预检索模块，用于将所述目标第一文本片段与所述多个候选语句进行预检索；

构建模块，用于若当前候选语句与所述目标第一文本片段的相似度大于预设阈值时，基于所述目标第一文本片段在所述规则语句中的位置，构建包含所述当前候选语句的多个候选片段；

质检模块，用于将所述规则语句与所述多个候选片段进行正式检索，获得语音质检结果；

其中，所述组合模块，具体用于获取当前滑窗内的所有第二文本片段的总长度；在所述总长度大于等于预设区间的最小值且小于所述预设区间的最大值的情况下，将所述所有第二文本片段组合成一个所述候选语句，并按照预设步长，将所述当前滑窗沿着所述当前滑窗的扩张方向进行扩张，其中，所述预设区间是根据所述目标第一文本片段的长度确定的；

所述构建模块，具体用于确定在所述规则语句中位于所述目标第一文本片段之前的第一文本片段的第一数量，以及确定在所述规则语句中位于所述目标第一文本片段之后的第一文本片段的第二数量；获取在所述待质检文本中位于所述当前候选语句之前的第一数量的多个第二文本片段组成的候选序列，以及获取在所述待质检文本中位于所述当前候选语句之前的第三数量的多个第二文本片段组成的候选序列；其中，所述第三数量与所述第一数量的差值的绝对值小于等于第一预设数量；获取在所述待质检文本中位于所述当前候选语句之后的第二数量的多个第二文本片段组成的候选序列，以及获取在所述待质检文本中位于所述当前候选语句之后的第四数量的多个第二文本片段组成的候选序列；其中，所述第四数量与所述第二数量的差值的绝对值小于等于第二预设数量；基于在所述待质检文本中位于所述当前候选语句之前的多个候选序列以及在所述待质检文本中位于所述当前候选语句之后的多个候选序列，构建包含所述当前候选语句的多个候选片段。

6.一种电子设备，其特征在于，包括：处理器和存储器；所述处理器和所述存储器连接；

所述存储器用于存储程序；

所述处理器用于运行存储在所述存储器中的程序，执行所述权利要求1-4中任一项所述的方法。

7.一种存储介质，其特征在于，其上存储有计算机程序，所述计算机程序在被处理器运行时执行如权利要求1-4中任一项所述的方法。