CN113596261B

CN113596261B - 一种语音线路检测方法及装置

Info

Publication number: CN113596261B
Application number: CN202110811585.5A
Authority: CN
Inventors: 张冰
Original assignee: Tenth Research Institute Of Telecommunications Technology Co ltd
Current assignee: Tenth Research Institute Of Telecommunications Technology Co ltd
Priority date: 2021-07-19
Filing date: 2021-07-19
Publication date: 2024-01-05
Anticipated expiration: 2041-07-19
Also published as: CN113596261A

Abstract

本发明公开了一种语音线路检测方法及装置，涉及通信技术领域。用以解决现有语音转换或人工抽检导致存在成本较高以及易泄漏信息的问题。包括：获取被抽检线路的语音数据，所述语音数据按照时戳进行装帧并存储至设定文件；根据所述设定文件的名称将同一个语音线路信息确定为成对语音，采用静音检测函数获取成对语音全部静音段的开始时间戳序列和结束时间戳序列，将开始时间戳序列和结束时间戳序列存储为数组序列；从述数组序列中抽取静音间隔序列，静音间隔序列按照最小时间间隔进行离散，得到高低电平话音序列；根据高低电平话音序列，确定同一个语音线路信息所包括的主叫文件和被叫文件相关性系数，根据相关性系数确定被抽检线路的语音质量。

Description

一种语音线路检测方法及装置

技术领域

本发明涉及通信技术领域，更具体的涉及一种语音线路检测方法及装置。

背景技术

目前通话数据仍是电信运营商的核心业务，语音质检大多直接进行人工抽检的方式或者基于语音识别的语音转文字方法进行检查，其中人工抽检存在效率低下，安全性不高，小语种覆盖不全等问题。语音识别方式前期需要做大量的训练和标注问题，并且仅作线路质量抽检存在成本较高和训练预料的安全性问题。

发明内容

本发明实施例提供一种语音线路检测方法及装置，用以解决现有技术语音转换或人工抽检导致存在成本较高以及易泄漏信息的问题。

本发明实施例提供一种语音线路检测方法，包括：

获取被抽检线路的语音数据，所述语音数据按照时戳进行装帧并存储至设定文件，其中，所述设定文件的名称至少包括所述语音数据的语音线路信息和主叫信息或被叫信息；

根据所述设定文件的名称将同一个语音线路信息所包括的主叫文件和被叫文件确定为成对语音，采用静音检测函数获取成对语音在指定信噪比和时间间隔条件下包括的全部静音段的开始时间戳序列和结束时间戳序列，将所述开始时间戳序列和所述结束时间戳序列存储为数组序列；从所述述数组序列中抽取静音间隔序列，所述静音间隔序列按照最小时间间隔进行离散，得到高低电平话音序列；

根据所述高低电平话音序列，确定同一个语音线路信息所包括的主叫文件和被叫文件相关性系数，根据所述相关性系数确定被抽检线路的语音质量。

优选地，所述语音数据对应的语音线路至少包括E1、ATM、IP；

所述语音线路E1路中的语音数据的语音编码为G711；

当所述语音数据的语音编码为非G711格式时，将所述语音数据进行组装成帧并统一转码为G711格式。

优选地，所述采用静音检测函数获取成对语音在指定信噪比和时间间隔条件下包括的全部静音段的开始时间戳序列和结束时间戳序列，将所述开始时间戳序列和所述结束时间戳序列存储为数组序列，具体包括：

采用静音检测函数获取主叫文件指定信噪比和时间间隔条件下包括的全部静音段的主叫开始时间戳序列和主叫结束时间戳序列，将主叫开始时间戳序列和主叫结束时间戳序列存储为主叫数组序列；

采用静音检测函数获取被叫文件指定信噪比和时间间隔条件下包括的全部静音段的被叫开始时间戳序列和被叫结束时间戳序列，将被叫开始时间戳序列和被叫结束时间戳序列存储为被叫数组序列。

优选地，所述从所述述数组序列中抽取静音间隔序列，所述静音间隔序列按照最小时间间隔进行离散，得到高低电平话音序列，具体包括：

根据所述主叫数组序列中包括的主叫开始时间戳序列和主叫结束时间戳序列，将所述主叫开始时间戳序列和主叫结束时间戳序列按照时间顺序进行排序，相邻的主叫开始时间戳序列和主叫结束时间戳序列组成一个主叫静音间隔序列，两个相邻主叫静音间隔序列之间包括一个主叫有音间隔序列；将所述主叫静音间隔序列和所述主叫有音间隔序列依次按照最小时间间隔进行离散，得到主叫高低电平话音序列；

根据所述被叫数组序列中包括的被叫开始时间戳序列和被叫结束时间戳序列，将所述被叫开始时间戳序列和被叫结束时间戳序列按照时间顺序进行排序，相邻的被叫开始时间戳序列和被叫结束时间戳序列组成一个被叫静音间隔序列，两个相邻被叫静音间隔序列之间包括一个被叫有音间隔序列；将所述被叫静音间隔序列和所述被叫有音间隔序列依次按照最小时间间隔进行离散，得到被叫高低电平话音序列。

优选地，所述根据所述高低电平话音序列，确定同一个语音线路信息所包括的主叫文件和被叫文件相关性系数，具体包括：

根据主叫高低电平话音序列和被叫高低电平话音序列，通过公式确定同一个语音线路信息所包括的主叫文件和被叫文件相关性系数：

其中，d_xi表示主叫高低电平话音序列，d_yi表示被叫高低电平话音序列；或者d_xi表示被叫高低电平话音序列，d_yi表示主叫高低电平话音序列；ρ为同一个语音线路信息所包括的主叫文件和被叫文件相关性系数。

优选地，所述根据所述设定文件的名称将同一个语音线路信息所包括的主叫文件和被叫文件确定为成对语音之前，还包括：

若同一个语音线路信息所包括的主叫文件的文件长度与被叫文件的文件长度相差较大，则删除同一个语音线路所包括的主叫文件和被叫文件。

本发明实施例还提供一种语音线路检测装置，包括：

获取单元，用于获取被抽检线路的语音数据，所述语音数据按照时戳进行装帧并存储至设定文件，其中，所述设定文件的名称至少包括所述语音数据的语音线路信息和主叫信息或被叫信息；

得到单元，用于根据所述设定文件的名称将同一个语音线路信息所包括的主叫文件和被叫文件确定为成对语音，采用静音检测函数获取成对语音在指定信噪比和时间间隔条件下包括的全部静音段的开始时间戳序列和结束时间戳序列，将所述开始时间戳序列和所述结束时间戳序列存储为数组序列；从所述述数组序列中抽取静音间隔序列，所述静音间隔序列按照最小时间间隔进行离散，得到高低电平话音序列；

确定单元，用于根据所述高低电平话音序列，确定同一个语音线路信息所包括的主叫文件和被叫文件相关性系数，根据所述相关性系数确定被抽检线路的语音质量。

优选地，所述得到单元具体用于：

优选地，所述确定单元具体用于：

本发明实施例提供一种语音线路检测方法，包括：获取被抽检线路的语音数据，所述语音数据按照时戳进行装帧并存储至设定文件，其中，所述设定文件的名称至少包括所述语音数据的语音线路信息和主叫信息或被叫信息；根据所述设定文件的名称将同一个语音线路信息所包括的主叫文件和被叫文件确定为成对语音，采用静音检测函数获取成对语音在指定信噪比和时间间隔条件下包括的全部静音段的开始时间戳序列和结束时间戳序列，将所述开始时间戳序列和所述结束时间戳序列存储为数组序列；从所述述数组序列中抽取静音间隔序列，所述静音间隔序列按照最小时间间隔进行离散，得到高低电平话音序列；根据所述高低电平话音序列，确定同一个语音线路信息所包括的主叫文件和被叫文件相关性系数，根据所述相关性系数确定被抽检线路的语音质量。该方法通过抽取非语音内容电平形成话音序列，根据成对语音的高低电平话音序列确定主叫和被叫的相关性系数，从而可以确定被抽检线路的语音质量。因不抽取话音内容从而达到语音质量的检查，可以有效的保护通信内容的安全性；再者，该方法为自动线路运维和质量保证提供了高效低成本的方法，解决了现有技术语音转换或人工抽检导致存在成本较高以及易泄漏信息的问题。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种语音线路检测方法流程示意图；

图2为本发明实施例提供的一种语音线路检测装置结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

图1示例性的示出了本发明实施例提供的一种语音线路检测方法流程示意图，该方法包括以下步骤：

步骤101，获取被抽检线路的语音数据，所述语音数据按照时戳进行装帧并存储至设定文件，其中，所述设定文件的名称至少包括所述语音数据的语音线路信息和主叫信息或被叫信息；

步骤102，根据所述设定文件的名称将同一个语音线路信息所包括的主叫文件和被叫文件确定为成对语音，采用静音检测函数获取成对语音在指定信噪比和时间间隔条件下包括的全部静音段的开始时间戳序列和结束时间戳序列，将所述开始时间戳序列和所述结束时间戳序列存储为数组序列；从所述述数组序列中抽取静音间隔序列，所述静音间隔序列按照最小时间间隔进行离散，得到高低电平话音序列；

步骤103，根据所述高低电平话音序列，确定同一个语音线路信息所包括的主叫文件和被叫文件相关性系数，根据所述相关性系数确定被抽检线路的语音质量。

在实际应用中，因需要处理的语音线路涵盖了E1、ATM、IP，而基于各种线路类型的语音编码是不同的，本发明实施例提供的方法主要是针对E1线路的语音采集，因此，若需要处理的语音数据对应的语音线路非E1路中的语音编码G711时，则需要先针对不同传输格式的语音进行组装成帧并统一统一转码为G711格式。

在步骤101中，获取被抽检线路的语音数据，这里的语音数据指代的是E1线路的中的语音编码，其格式为G711。将获取到被抽检线路的语音数据按照时戳进行装帧并存储至设定文件，其中，设定文件命名根据录音指示的E1号和时隙号来定义，设定文件命名的名称至少包括有语音数据的语音线路信息和主叫信息或被叫信息，举例来说，以下为两个设定文件的名称：

tdm204-1A0F3A9A-A482-7E7A-497A-691C00000000-9324N-A

tdm204-1A0F3A9A-A482-7E7A-497A-691C00000000-9325N-B

其中，第一个设定文件的名称和第二个设定文件的名称内下划线部分指示了第N号E1，且第一个设定文件名称中的A表示主叫文件，第二个设定文件名中的B表示被叫文件。后续的处理以该处的标号进行统计和计算。

在步骤102中，对设定文件中包括的内容进行处理，具体的，通过存储的设定文件，根据设定文件的名称，将具有同一个语音线路信息所包括的主叫文件和被叫文件确定为成对语音。

需要说明的是，当将同一个语音线路信息多包括的主叫文件和被叫文件确定为成对语音时，若主叫文件的文件长度的被叫文件的文件长度相差较大时，则可以对这两个文件进行排除过滤，即后续不对这样的文件进行处理。

当确定了成对语音之后，先按照时间较长一方进行对齐处理，然后使用FFmpeg的静音检测函数依次获取成对语音在指定信噪比和时间间隔条件下包括的全部静音段的开始时间戳序列和结束时间戳序列，最后将开始时间戳序列和结束时间戳序列存储为数组序列。

在实际应用中，由于成对语音包括有主叫文件和被叫文件，所以，上述步骤其实是分开执行的，以下详细介绍执行步骤：

1)使用FFmpeg的静音检测函数获取主叫文件指定信噪比和时间间隔条件下包括的全部静音段的主叫开始时间戳序列和主叫结束时间戳序列，将主叫开始时间戳序列和主叫结束时间戳序列存储为主叫数组序列。

根据主叫数组序列中包括的主叫开始时间戳序列和主叫结束时间戳序列，将主叫开始时间戳序列和主叫结束时间戳序列按照时间顺序进行排序，相邻的主叫开始时间戳序列和主叫结束时间戳序列组成一个主叫静音间隔序列，两个相邻主叫静音间隔序列之间包括一个主叫有音间隔序列；将主叫静音间隔序列和主叫有音间隔序列依次按照最小时间间隔进行离散，得到主叫高低电平话音序列；

2)采用静音检测函数获取被叫文件指定信噪比和时间间隔条件下包括的全部静音段的被叫开始时间戳序列和被叫结束时间戳序列，将被叫开始时间戳序列和被叫结束时间戳序列存储为被叫数组序列。

根据被叫数组序列中包括的被叫开始时间戳序列和被叫结束时间戳序列，将被叫开始时间戳序列和被叫结束时间戳序列按照时间顺序进行排序，相邻的被叫开始时间戳序列和被叫结束时间戳序列组成一个被叫静音间隔序列，两个相邻被叫静音间隔序列之间包括一个被叫有音间隔序列；将被叫静音间隔序列和被叫有音间隔序列依次按照最小时间间隔进行离散，得到被叫高低电平话音序列。

举例来说，若将被叫开始时间戳序列和被叫结束时间戳序列按照时间顺序进行排序，则可以依次确定静音间隔序列和有音间隔序列。进一步地，将有音间隔序列按照最小时间间隔(比如0.1秒)离散化成一个序列，将有音的内容抽取为高电平；再者，将无音间隔序列按照最小时间间隔(比如0.1秒)离散化成一个序列，将有音的内容抽取为低电平，最终可以形成一个被叫高低电平话音序列。需要说明的是，在实际应用中，若用1表示高电平时，则用0表示低电平；相应地，若用0表示高电平时，则用1表示低电平。

在步骤103中，根据步骤102确定的主叫高低电平话音序列和被叫高低电平话音序列，可以将上述两个参数输入到相关性系数确定公式内，从而可以得到同一个语音线路信息所包括的主叫文件和被叫文件相关性系数。

具体地，相关性系数可以通过公式(1)确定：

其中，若d_xi表示主叫高低电平话音序列，则d_yi表示被叫高低电平话音序列；或者若d_xi表示被叫高低电平话音序列，则d_yi表示主叫高低电平话音序列；ρ为同一个语音线路信息所包括的主叫文件和被叫文件相关性系数。

在本发明实施例中，ρ的绝对值大小代表了主叫高低电平话音序列和被叫高低电平话音序列的相关程度。通过对计算的ρ按照E1线路分别统计，如果ρ为NaN说明存在计算问题，存入异常通话计数，如果ρ>0.9一般为双静音文件，说明线路配置存在错误不能获取正确的通话，存入异常通话计数，对于其他的ρ一般为正确通话存入良好通话计数。结果以表格形式输出，如下表1所示：

表1

线路编号	良好通话	异常通话	良好率
				N	99	1	99％
M	10	90	10％

进一步地，根据良好线路上所有话音相关性系数作为基准可以判断未知线路的情况。再者，需要说明的是，当上述多个步骤的执行主体为处理器时，则处理器可以将根据相关性系数确定的被抽检线路的语音质量发送至业务处理管理平台。业务处理管理平台对于良好率较低的线路，就可以据此做进一步的排查和确认。

综上所述，本发明实施例提供一种语音线路检测方法，包括：获取被抽检线路的语音数据，所述语音数据按照时戳进行装帧并存储至设定文件，其中，所述设定文件的名称至少包括所述语音数据的语音线路信息和主叫信息或被叫信息；根据所述设定文件的名称将同一个语音线路信息所包括的主叫文件和被叫文件确定为成对语音，采用静音检测函数获取成对语音在指定信噪比和时间间隔条件下包括的全部静音段的开始时间戳序列和结束时间戳序列，将所述开始时间戳序列和所述结束时间戳序列存储为数组序列；从所述述数组序列中抽取静音间隔序列，所述静音间隔序列按照最小时间间隔进行离散，得到高低电平话音序列；根据所述高低电平话音序列，确定同一个语音线路信息所包括的主叫文件和被叫文件相关性系数，根据所述相关性系数确定被抽检线路的语音质量。该方法通过抽取非语音内容电平形成话音序列，根据成对语音的高低电平话音序列确定主叫和被叫的相关性系数，从而可以确定被抽检线路的语音质量。因不抽取话音内容从而达到语音质量的检查，可以有效的保护通信内容的安全性；再者，该方法为自动线路运维和质量保证提供了高效低成本的方法，解决了现有技术语音转换或人工抽检导致存在成本较高以及易泄漏信息的问题。

基于同一发明构思，本发明实施例提供了一种语音线路检测装置，由于该装置解决技术问题的原理与一种语音线路检测方法相似，因此该装置的实施可以参见方法的实施，重复之处不再赘述。

图2为本发明实施例提供的一种语音线路检测装置结构示意图，如图2所示，该装置主要包括获取单元201，得到单元202和确定单元203。

获取单元201，用于获取被抽检线路的语音数据，所述语音数据按照时戳进行装帧并存储至设定文件，其中，所述设定文件的名称至少包括所述语音数据的语音线路信息和主叫信息或被叫信息；

得到单元202，用于根据所述设定文件的名称将同一个语音线路信息所包括的主叫文件和被叫文件确定为成对语音，采用静音检测函数获取成对语音在指定信噪比和时间间隔条件下包括的全部静音段的开始时间戳序列和结束时间戳序列，将所述开始时间戳序列和所述结束时间戳序列存储为数组序列；从所述述数组序列中抽取静音间隔序列，所述静音间隔序列按照最小时间间隔进行离散，得到高低电平话音序列；

确定单元203，用于根据所述高低电平话音序列，确定同一个语音线路信息所包括的主叫文件和被叫文件相关性系数，根据所述相关性系数确定被抽检线路的语音质量。

优选地，所述得到单元202具体用于：

优选地，所述确定单元203具体用于：

应当理解，以上语音线路检测装置包括的单元仅为根据该设备装置实现的功能进行的逻辑划分，实际应用中，可以进行上述单元的叠加或拆分。并且该实施例提供的语音线路检测装置所实现的功能与上述实施例提供的语音线路检测方法一一对应，对于该装置所实现的更为详细的处理流程，在上述方法实施例一中已做详细描述，此处不再详细描述。

尽管已描述了本发明的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种语音线路检测方法，其特征在于，包括：

获取被抽检线路的语音数据，所述语音数据按照时间戳进行装帧并存储至设定文件，其中，所述设定文件的名称至少包括所述语音数据的语音线路信息和主叫信息或被叫信息；

根据所述设定文件的名称将同一个语音线路信息所包括的主叫文件和被叫文件确定为成对语音，采用静音检测函数获取主叫文件指定信噪比和时间间隔条件下包括的全部静音段的主叫开始时间戳序列和主叫结束时间戳序列，将主叫开始时间戳序列和主叫结束时间戳序列存储为主叫数组序列；采用静音检测函数获取被叫文件指定信噪比和时间间隔条件下包括的全部静音段的被叫开始时间戳序列和被叫结束时间戳序列，将被叫开始时间戳序列和被叫结束时间戳序列存储为被叫数组序列；根据所述主叫数组序列中包括的主叫开始时间戳序列和主叫结束时间戳序列，将所述主叫开始时间戳序列和主叫结束时间戳序列按照时间顺序进行排序，相邻的主叫开始时间戳序列和主叫结束时间戳序列组成一个主叫静音间隔序列，两个相邻主叫静音间隔序列之间包括一个主叫有音间隔序列；将所述主叫静音间隔序列和所述主叫有音间隔序列依次按照最小时间间隔进行离散，得到主叫高低电平话音序列；

根据所述被叫数组序列中包括的被叫开始时间戳序列和被叫结束时间戳序列，将所述被叫开始时间戳序列和被叫结束时间戳序列按照时间顺序进行排序，相邻的被叫开始时间戳序列和被叫结束时间戳序列组成一个被叫静音间隔序列，两个相邻被叫静音间隔序列之间包括一个被叫有音间隔序列；将所述被叫静音间隔序列和所述被叫有音间隔序列依次按照最小时间间隔进行离散，得到被叫高低电平话音序列；

2.如权利要求1所述的方法，其特征在于，所述语音数据对应的语音线路至少包括E1、ATM、IP；

所述语音线路E1路中的语音数据的语音编码为G711；

3.如权利要求1所述的方法，其特征在于，所述根据所述设定文件的名称将同一个语音线路信息所包括的主叫文件和被叫文件确定为成对语音之前，还包括：

4.一种语音线路检测装置，其特征在于，包括：

获取单元，用于获取被抽检线路的语音数据，所述语音数据按照时间戳进行装帧并存储至设定文件，其中，所述设定文件的名称至少包括所述语音数据的语音线路信息和主叫信息或被叫信息；

得到单元，用于根据所述设定文件的名称将同一个语音线路信息所包括的主叫文件和被叫文件确定为成对语音，采用静音检测函数获取主叫文件指定信噪比和时间间隔条件下包括的全部静音段的主叫开始时间戳序列和主叫结束时间戳序列，将主叫开始时间戳序列和主叫结束时间戳序列存储为主叫数组序列；采用静音检测函数获取被叫文件指定信噪比和时间间隔条件下包括的全部静音段的被叫开始时间戳序列和被叫结束时间戳序列，将被叫开始时间戳序列和被叫结束时间戳序列存储为被叫数组序列；根据所述主叫数组序列中包括的主叫开始时间戳序列和主叫结束时间戳序列，将所述主叫开始时间戳序列和主叫结束时间戳序列按照时间顺序进行排序，相邻的主叫开始时间戳序列和主叫结束时间戳序列组成一个主叫静音间隔序列，两个相邻主叫静音间隔序列之间包括一个主叫有音间隔序列；将所述主叫静音间隔序列和所述主叫有音间隔序列依次按照最小时间间隔进行离散，得到主叫高低电平话音序列；

确定单元，用于根据主叫高低电平话音序列和被叫高低电平话音序列，通过公式确定同一个语音线路信息所包括的主叫文件和被叫文件相关性系数：