CN113596261B - 一种语音线路检测方法及装置 - Google Patents
一种语音线路检测方法及装置 Download PDFInfo
- Publication number
- CN113596261B CN113596261B CN202110811585.5A CN202110811585A CN113596261B CN 113596261 B CN113596261 B CN 113596261B CN 202110811585 A CN202110811585 A CN 202110811585A CN 113596261 B CN113596261 B CN 113596261B
- Authority
- CN
- China
- Prior art keywords
- sequence
- calling
- called
- time stamp
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 37
- 238000000034 method Methods 0.000 claims abstract description 19
- 238000005070 sampling Methods 0.000 claims abstract description 8
- 238000009432 framing Methods 0.000 claims abstract description 6
- 238000012163 sequencing technique Methods 0.000 claims description 12
- 238000012360 testing method Methods 0.000 claims description 4
- 238000006243 chemical reaction Methods 0.000 abstract description 4
- 238000004891 communication Methods 0.000 abstract description 4
- 238000007689 inspection Methods 0.000 abstract description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000002159 abnormal effect Effects 0.000 description 3
- 230000004075 alteration Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000000275 quality assurance Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/22—Arrangements for supervision, monitoring or testing
- H04M3/2236—Quality of speech transmission monitoring
Abstract
本发明公开了一种语音线路检测方法及装置,涉及通信技术领域。用以解决现有语音转换或人工抽检导致存在成本较高以及易泄漏信息的问题。包括:获取被抽检线路的语音数据,所述语音数据按照时戳进行装帧并存储至设定文件;根据所述设定文件的名称将同一个语音线路信息确定为成对语音,采用静音检测函数获取成对语音全部静音段的开始时间戳序列和结束时间戳序列,将开始时间戳序列和结束时间戳序列存储为数组序列;从述数组序列中抽取静音间隔序列,静音间隔序列按照最小时间间隔进行离散,得到高低电平话音序列;根据高低电平话音序列,确定同一个语音线路信息所包括的主叫文件和被叫文件相关性系数,根据相关性系数确定被抽检线路的语音质量。
Description
技术领域
本发明涉及通信技术领域,更具体的涉及一种语音线路检测方法及装置。
背景技术
目前通话数据仍是电信运营商的核心业务,语音质检大多直接进行人工抽检的方式或者基于语音识别的语音转文字方法进行检查,其中人工抽检存在效率低下,安全性不高,小语种覆盖不全等问题。语音识别方式前期需要做大量的训练和标注问题,并且仅作线路质量抽检存在成本较高和训练预料的安全性问题。
发明内容
本发明实施例提供一种语音线路检测方法及装置,用以解决现有技术语音转换或人工抽检导致存在成本较高以及易泄漏信息的问题。
本发明实施例提供一种语音线路检测方法,包括:
获取被抽检线路的语音数据,所述语音数据按照时戳进行装帧并存储至设定文件,其中,所述设定文件的名称至少包括所述语音数据的语音线路信息和主叫信息或被叫信息;
根据所述设定文件的名称将同一个语音线路信息所包括的主叫文件和被叫文件确定为成对语音,采用静音检测函数获取成对语音在指定信噪比和时间间隔条件下包括的全部静音段的开始时间戳序列和结束时间戳序列,将所述开始时间戳序列和所述结束时间戳序列存储为数组序列;从所述述数组序列中抽取静音间隔序列,所述静音间隔序列按照最小时间间隔进行离散,得到高低电平话音序列;
根据所述高低电平话音序列,确定同一个语音线路信息所包括的主叫文件和被叫文件相关性系数,根据所述相关性系数确定被抽检线路的语音质量。
优选地,所述语音数据对应的语音线路至少包括E1、ATM、IP;
所述语音线路E1路中的语音数据的语音编码为G711;
当所述语音数据的语音编码为非G711格式时,将所述语音数据进行组装成帧并统一转码为G711格式。
优选地,所述采用静音检测函数获取成对语音在指定信噪比和时间间隔条件下包括的全部静音段的开始时间戳序列和结束时间戳序列,将所述开始时间戳序列和所述结束时间戳序列存储为数组序列,具体包括:
采用静音检测函数获取主叫文件指定信噪比和时间间隔条件下包括的全部静音段的主叫开始时间戳序列和主叫结束时间戳序列,将主叫开始时间戳序列和主叫结束时间戳序列存储为主叫数组序列;
采用静音检测函数获取被叫文件指定信噪比和时间间隔条件下包括的全部静音段的被叫开始时间戳序列和被叫结束时间戳序列,将被叫开始时间戳序列和被叫结束时间戳序列存储为被叫数组序列。
优选地,所述从所述述数组序列中抽取静音间隔序列,所述静音间隔序列按照最小时间间隔进行离散,得到高低电平话音序列,具体包括:
根据所述主叫数组序列中包括的主叫开始时间戳序列和主叫结束时间戳序列,将所述主叫开始时间戳序列和主叫结束时间戳序列按照时间顺序进行排序,相邻的主叫开始时间戳序列和主叫结束时间戳序列组成一个主叫静音间隔序列,两个相邻主叫静音间隔序列之间包括一个主叫有音间隔序列;将所述主叫静音间隔序列和所述主叫有音间隔序列依次按照最小时间间隔进行离散,得到主叫高低电平话音序列;
根据所述被叫数组序列中包括的被叫开始时间戳序列和被叫结束时间戳序列,将所述被叫开始时间戳序列和被叫结束时间戳序列按照时间顺序进行排序,相邻的被叫开始时间戳序列和被叫结束时间戳序列组成一个被叫静音间隔序列,两个相邻被叫静音间隔序列之间包括一个被叫有音间隔序列;将所述被叫静音间隔序列和所述被叫有音间隔序列依次按照最小时间间隔进行离散,得到被叫高低电平话音序列。
优选地,所述根据所述高低电平话音序列,确定同一个语音线路信息所包括的主叫文件和被叫文件相关性系数,具体包括:
根据主叫高低电平话音序列和被叫高低电平话音序列,通过公式确定同一个语音线路信息所包括的主叫文件和被叫文件相关性系数:
其中,dxi表示主叫高低电平话音序列,dyi表示被叫高低电平话音序列;或者dxi表示被叫高低电平话音序列,dyi表示主叫高低电平话音序列;ρ为同一个语音线路信息所包括的主叫文件和被叫文件相关性系数。
优选地,所述根据所述设定文件的名称将同一个语音线路信息所包括的主叫文件和被叫文件确定为成对语音之前,还包括:
若同一个语音线路信息所包括的主叫文件的文件长度与被叫文件的文件长度相差较大,则删除同一个语音线路所包括的主叫文件和被叫文件。
本发明实施例还提供一种语音线路检测装置,包括:
获取单元,用于获取被抽检线路的语音数据,所述语音数据按照时戳进行装帧并存储至设定文件,其中,所述设定文件的名称至少包括所述语音数据的语音线路信息和主叫信息或被叫信息;
得到单元,用于根据所述设定文件的名称将同一个语音线路信息所包括的主叫文件和被叫文件确定为成对语音,采用静音检测函数获取成对语音在指定信噪比和时间间隔条件下包括的全部静音段的开始时间戳序列和结束时间戳序列,将所述开始时间戳序列和所述结束时间戳序列存储为数组序列;从所述述数组序列中抽取静音间隔序列,所述静音间隔序列按照最小时间间隔进行离散,得到高低电平话音序列;
确定单元,用于根据所述高低电平话音序列,确定同一个语音线路信息所包括的主叫文件和被叫文件相关性系数,根据所述相关性系数确定被抽检线路的语音质量。
优选地,所述得到单元具体用于:
采用静音检测函数获取主叫文件指定信噪比和时间间隔条件下包括的全部静音段的主叫开始时间戳序列和主叫结束时间戳序列,将主叫开始时间戳序列和主叫结束时间戳序列存储为主叫数组序列;
采用静音检测函数获取被叫文件指定信噪比和时间间隔条件下包括的全部静音段的被叫开始时间戳序列和被叫结束时间戳序列,将被叫开始时间戳序列和被叫结束时间戳序列存储为被叫数组序列。
优选地,所述得到单元具体用于:
根据所述主叫数组序列中包括的主叫开始时间戳序列和主叫结束时间戳序列,将所述主叫开始时间戳序列和主叫结束时间戳序列按照时间顺序进行排序,相邻的主叫开始时间戳序列和主叫结束时间戳序列组成一个主叫静音间隔序列,两个相邻主叫静音间隔序列之间包括一个主叫有音间隔序列;将所述主叫静音间隔序列和所述主叫有音间隔序列依次按照最小时间间隔进行离散,得到主叫高低电平话音序列;
根据所述被叫数组序列中包括的被叫开始时间戳序列和被叫结束时间戳序列,将所述被叫开始时间戳序列和被叫结束时间戳序列按照时间顺序进行排序,相邻的被叫开始时间戳序列和被叫结束时间戳序列组成一个被叫静音间隔序列,两个相邻被叫静音间隔序列之间包括一个被叫有音间隔序列;将所述被叫静音间隔序列和所述被叫有音间隔序列依次按照最小时间间隔进行离散,得到被叫高低电平话音序列。
优选地,所述确定单元具体用于:
根据主叫高低电平话音序列和被叫高低电平话音序列,通过公式确定同一个语音线路信息所包括的主叫文件和被叫文件相关性系数:
其中,dxi表示主叫高低电平话音序列,dyi表示被叫高低电平话音序列;或者dxi表示被叫高低电平话音序列,dyi表示主叫高低电平话音序列;ρ为同一个语音线路信息所包括的主叫文件和被叫文件相关性系数。
本发明实施例提供一种语音线路检测方法,包括:获取被抽检线路的语音数据,所述语音数据按照时戳进行装帧并存储至设定文件,其中,所述设定文件的名称至少包括所述语音数据的语音线路信息和主叫信息或被叫信息;根据所述设定文件的名称将同一个语音线路信息所包括的主叫文件和被叫文件确定为成对语音,采用静音检测函数获取成对语音在指定信噪比和时间间隔条件下包括的全部静音段的开始时间戳序列和结束时间戳序列,将所述开始时间戳序列和所述结束时间戳序列存储为数组序列;从所述述数组序列中抽取静音间隔序列,所述静音间隔序列按照最小时间间隔进行离散,得到高低电平话音序列;根据所述高低电平话音序列,确定同一个语音线路信息所包括的主叫文件和被叫文件相关性系数,根据所述相关性系数确定被抽检线路的语音质量。该方法通过抽取非语音内容电平形成话音序列,根据成对语音的高低电平话音序列确定主叫和被叫的相关性系数,从而可以确定被抽检线路的语音质量。因不抽取话音内容从而达到语音质量的检查,可以有效的保护通信内容的安全性;再者,该方法为自动线路运维和质量保证提供了高效低成本的方法,解决了现有技术语音转换或人工抽检导致存在成本较高以及易泄漏信息的问题。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种语音线路检测方法流程示意图;
图2为本发明实施例提供的一种语音线路检测装置结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1示例性的示出了本发明实施例提供的一种语音线路检测方法流程示意图,该方法包括以下步骤:
步骤101,获取被抽检线路的语音数据,所述语音数据按照时戳进行装帧并存储至设定文件,其中,所述设定文件的名称至少包括所述语音数据的语音线路信息和主叫信息或被叫信息;
步骤102,根据所述设定文件的名称将同一个语音线路信息所包括的主叫文件和被叫文件确定为成对语音,采用静音检测函数获取成对语音在指定信噪比和时间间隔条件下包括的全部静音段的开始时间戳序列和结束时间戳序列,将所述开始时间戳序列和所述结束时间戳序列存储为数组序列;从所述述数组序列中抽取静音间隔序列,所述静音间隔序列按照最小时间间隔进行离散,得到高低电平话音序列;
步骤103,根据所述高低电平话音序列,确定同一个语音线路信息所包括的主叫文件和被叫文件相关性系数,根据所述相关性系数确定被抽检线路的语音质量。
在实际应用中,因需要处理的语音线路涵盖了E1、ATM、IP,而基于各种线路类型的语音编码是不同的,本发明实施例提供的方法主要是针对E1线路的语音采集,因此,若需要处理的语音数据对应的语音线路非E1路中的语音编码G711时,则需要先针对不同传输格式的语音进行组装成帧并统一统一转码为G711格式。
在步骤101中,获取被抽检线路的语音数据,这里的语音数据指代的是E1线路的中的语音编码,其格式为G711。将获取到被抽检线路的语音数据按照时戳进行装帧并存储至设定文件,其中,设定文件命名根据录音指示的E1号和时隙号来定义,设定文件命名的名称至少包括有语音数据的语音线路信息和主叫信息或被叫信息,举例来说,以下为两个设定文件的名称:
tdm204-1A0F3A9A-A482-7E7A-497A-691C00000000-9324N-A
tdm204-1A0F3A9A-A482-7E7A-497A-691C00000000-9325N-B
其中,第一个设定文件的名称和第二个设定文件的名称内下划线部分指示了第N号E1,且第一个设定文件名称中的A表示主叫文件,第二个设定文件名中的B表示被叫文件。后续的处理以该处的标号进行统计和计算。
在步骤102中,对设定文件中包括的内容进行处理,具体的,通过存储的设定文件,根据设定文件的名称,将具有同一个语音线路信息所包括的主叫文件和被叫文件确定为成对语音。
需要说明的是,当将同一个语音线路信息多包括的主叫文件和被叫文件确定为成对语音时,若主叫文件的文件长度的被叫文件的文件长度相差较大时,则可以对这两个文件进行排除过滤,即后续不对这样的文件进行处理。
当确定了成对语音之后,先按照时间较长一方进行对齐处理,然后使用FFmpeg的静音检测函数依次获取成对语音在指定信噪比和时间间隔条件下包括的全部静音段的开始时间戳序列和结束时间戳序列,最后将开始时间戳序列和结束时间戳序列存储为数组序列。
在实际应用中,由于成对语音包括有主叫文件和被叫文件,所以,上述步骤其实是分开执行的,以下详细介绍执行步骤:
1)使用FFmpeg的静音检测函数获取主叫文件指定信噪比和时间间隔条件下包括的全部静音段的主叫开始时间戳序列和主叫结束时间戳序列,将主叫开始时间戳序列和主叫结束时间戳序列存储为主叫数组序列。
根据主叫数组序列中包括的主叫开始时间戳序列和主叫结束时间戳序列,将主叫开始时间戳序列和主叫结束时间戳序列按照时间顺序进行排序,相邻的主叫开始时间戳序列和主叫结束时间戳序列组成一个主叫静音间隔序列,两个相邻主叫静音间隔序列之间包括一个主叫有音间隔序列;将主叫静音间隔序列和主叫有音间隔序列依次按照最小时间间隔进行离散,得到主叫高低电平话音序列;
2)采用静音检测函数获取被叫文件指定信噪比和时间间隔条件下包括的全部静音段的被叫开始时间戳序列和被叫结束时间戳序列,将被叫开始时间戳序列和被叫结束时间戳序列存储为被叫数组序列。
根据被叫数组序列中包括的被叫开始时间戳序列和被叫结束时间戳序列,将被叫开始时间戳序列和被叫结束时间戳序列按照时间顺序进行排序,相邻的被叫开始时间戳序列和被叫结束时间戳序列组成一个被叫静音间隔序列,两个相邻被叫静音间隔序列之间包括一个被叫有音间隔序列;将被叫静音间隔序列和被叫有音间隔序列依次按照最小时间间隔进行离散,得到被叫高低电平话音序列。
举例来说,若将被叫开始时间戳序列和被叫结束时间戳序列按照时间顺序进行排序,则可以依次确定静音间隔序列和有音间隔序列。进一步地,将有音间隔序列按照最小时间间隔(比如0.1秒)离散化成一个序列,将有音的内容抽取为高电平;再者,将无音间隔序列按照最小时间间隔(比如0.1秒)离散化成一个序列,将有音的内容抽取为低电平,最终可以形成一个被叫高低电平话音序列。需要说明的是,在实际应用中,若用1表示高电平时,则用0表示低电平;相应地,若用0表示高电平时,则用1表示低电平。
在步骤103中,根据步骤102确定的主叫高低电平话音序列和被叫高低电平话音序列,可以将上述两个参数输入到相关性系数确定公式内,从而可以得到同一个语音线路信息所包括的主叫文件和被叫文件相关性系数。
具体地,相关性系数可以通过公式(1)确定:
其中,若dxi表示主叫高低电平话音序列,则dyi表示被叫高低电平话音序列;或者若dxi表示被叫高低电平话音序列,则dyi表示主叫高低电平话音序列;ρ为同一个语音线路信息所包括的主叫文件和被叫文件相关性系数。
在本发明实施例中,ρ的绝对值大小代表了主叫高低电平话音序列和被叫高低电平话音序列的相关程度。通过对计算的ρ按照E1线路分别统计,如果ρ为NaN说明存在计算问题,存入异常通话计数,如果ρ>0.9一般为双静音文件,说明线路配置存在错误不能获取正确的通话,存入异常通话计数,对于其他的ρ一般为正确通话存入良好通话计数。结果以表格形式输出,如下表1所示:
表1
线路编号 | 良好通话 | 异常通话 | 良好率 |
N | 99 | 1 | 99% |
M | 10 | 90 | 10% |
进一步地,根据良好线路上所有话音相关性系数作为基准可以判断未知线路的情况。再者,需要说明的是,当上述多个步骤的执行主体为处理器时,则处理器可以将根据相关性系数确定的被抽检线路的语音质量发送至业务处理管理平台。业务处理管理平台对于良好率较低的线路,就可以据此做进一步的排查和确认。
综上所述,本发明实施例提供一种语音线路检测方法,包括:获取被抽检线路的语音数据,所述语音数据按照时戳进行装帧并存储至设定文件,其中,所述设定文件的名称至少包括所述语音数据的语音线路信息和主叫信息或被叫信息;根据所述设定文件的名称将同一个语音线路信息所包括的主叫文件和被叫文件确定为成对语音,采用静音检测函数获取成对语音在指定信噪比和时间间隔条件下包括的全部静音段的开始时间戳序列和结束时间戳序列,将所述开始时间戳序列和所述结束时间戳序列存储为数组序列;从所述述数组序列中抽取静音间隔序列,所述静音间隔序列按照最小时间间隔进行离散,得到高低电平话音序列;根据所述高低电平话音序列,确定同一个语音线路信息所包括的主叫文件和被叫文件相关性系数,根据所述相关性系数确定被抽检线路的语音质量。该方法通过抽取非语音内容电平形成话音序列,根据成对语音的高低电平话音序列确定主叫和被叫的相关性系数,从而可以确定被抽检线路的语音质量。因不抽取话音内容从而达到语音质量的检查,可以有效的保护通信内容的安全性;再者,该方法为自动线路运维和质量保证提供了高效低成本的方法,解决了现有技术语音转换或人工抽检导致存在成本较高以及易泄漏信息的问题。
基于同一发明构思,本发明实施例提供了一种语音线路检测装置,由于该装置解决技术问题的原理与一种语音线路检测方法相似,因此该装置的实施可以参见方法的实施,重复之处不再赘述。
图2为本发明实施例提供的一种语音线路检测装置结构示意图,如图2所示,该装置主要包括获取单元201,得到单元202和确定单元203。
获取单元201,用于获取被抽检线路的语音数据,所述语音数据按照时戳进行装帧并存储至设定文件,其中,所述设定文件的名称至少包括所述语音数据的语音线路信息和主叫信息或被叫信息;
得到单元202,用于根据所述设定文件的名称将同一个语音线路信息所包括的主叫文件和被叫文件确定为成对语音,采用静音检测函数获取成对语音在指定信噪比和时间间隔条件下包括的全部静音段的开始时间戳序列和结束时间戳序列,将所述开始时间戳序列和所述结束时间戳序列存储为数组序列;从所述述数组序列中抽取静音间隔序列,所述静音间隔序列按照最小时间间隔进行离散,得到高低电平话音序列;
确定单元203,用于根据所述高低电平话音序列,确定同一个语音线路信息所包括的主叫文件和被叫文件相关性系数,根据所述相关性系数确定被抽检线路的语音质量。
优选地,所述得到单元202具体用于:
采用静音检测函数获取主叫文件指定信噪比和时间间隔条件下包括的全部静音段的主叫开始时间戳序列和主叫结束时间戳序列,将主叫开始时间戳序列和主叫结束时间戳序列存储为主叫数组序列;
采用静音检测函数获取被叫文件指定信噪比和时间间隔条件下包括的全部静音段的被叫开始时间戳序列和被叫结束时间戳序列,将被叫开始时间戳序列和被叫结束时间戳序列存储为被叫数组序列。
优选地,所述得到单元202具体用于:
根据所述主叫数组序列中包括的主叫开始时间戳序列和主叫结束时间戳序列,将所述主叫开始时间戳序列和主叫结束时间戳序列按照时间顺序进行排序,相邻的主叫开始时间戳序列和主叫结束时间戳序列组成一个主叫静音间隔序列,两个相邻主叫静音间隔序列之间包括一个主叫有音间隔序列;将所述主叫静音间隔序列和所述主叫有音间隔序列依次按照最小时间间隔进行离散,得到主叫高低电平话音序列;
根据所述被叫数组序列中包括的被叫开始时间戳序列和被叫结束时间戳序列,将所述被叫开始时间戳序列和被叫结束时间戳序列按照时间顺序进行排序,相邻的被叫开始时间戳序列和被叫结束时间戳序列组成一个被叫静音间隔序列,两个相邻被叫静音间隔序列之间包括一个被叫有音间隔序列;将所述被叫静音间隔序列和所述被叫有音间隔序列依次按照最小时间间隔进行离散,得到被叫高低电平话音序列。
优选地,所述确定单元203具体用于:
根据主叫高低电平话音序列和被叫高低电平话音序列,通过公式确定同一个语音线路信息所包括的主叫文件和被叫文件相关性系数:
其中,dxi表示主叫高低电平话音序列,dyi表示被叫高低电平话音序列;或者dxi表示被叫高低电平话音序列,dyi表示主叫高低电平话音序列;ρ为同一个语音线路信息所包括的主叫文件和被叫文件相关性系数。
应当理解,以上语音线路检测装置包括的单元仅为根据该设备装置实现的功能进行的逻辑划分,实际应用中,可以进行上述单元的叠加或拆分。并且该实施例提供的语音线路检测装置所实现的功能与上述实施例提供的语音线路检测方法一一对应,对于该装置所实现的更为详细的处理流程,在上述方法实施例一中已做详细描述,此处不再详细描述。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (4)
1.一种语音线路检测方法,其特征在于,包括:
获取被抽检线路的语音数据,所述语音数据按照时间戳进行装帧并存储至设定文件,其中,所述设定文件的名称至少包括所述语音数据的语音线路信息和主叫信息或被叫信息;
根据所述设定文件的名称将同一个语音线路信息所包括的主叫文件和被叫文件确定为成对语音,采用静音检测函数获取主叫文件指定信噪比和时间间隔条件下包括的全部静音段的主叫开始时间戳序列和主叫结束时间戳序列,将主叫开始时间戳序列和主叫结束时间戳序列存储为主叫数组序列;采用静音检测函数获取被叫文件指定信噪比和时间间隔条件下包括的全部静音段的被叫开始时间戳序列和被叫结束时间戳序列,将被叫开始时间戳序列和被叫结束时间戳序列存储为被叫数组序列;根据所述主叫数组序列中包括的主叫开始时间戳序列和主叫结束时间戳序列,将所述主叫开始时间戳序列和主叫结束时间戳序列按照时间顺序进行排序,相邻的主叫开始时间戳序列和主叫结束时间戳序列组成一个主叫静音间隔序列,两个相邻主叫静音间隔序列之间包括一个主叫有音间隔序列;将所述主叫静音间隔序列和所述主叫有音间隔序列依次按照最小时间间隔进行离散,得到主叫高低电平话音序列;
根据所述被叫数组序列中包括的被叫开始时间戳序列和被叫结束时间戳序列,将所述被叫开始时间戳序列和被叫结束时间戳序列按照时间顺序进行排序,相邻的被叫开始时间戳序列和被叫结束时间戳序列组成一个被叫静音间隔序列,两个相邻被叫静音间隔序列之间包括一个被叫有音间隔序列;将所述被叫静音间隔序列和所述被叫有音间隔序列依次按照最小时间间隔进行离散,得到被叫高低电平话音序列;
根据主叫高低电平话音序列和被叫高低电平话音序列,通过公式确定同一个语音线路信息所包括的主叫文件和被叫文件相关性系数:
其中,dxi表示主叫高低电平话音序列,dyi表示被叫高低电平话音序列;或者dxi表示被叫高低电平话音序列,dyi表示主叫高低电平话音序列;ρ为同一个语音线路信息所包括的主叫文件和被叫文件相关性系数。
2.如权利要求1所述的方法,其特征在于,所述语音数据对应的语音线路至少包括E1、ATM、IP;
所述语音线路E1路中的语音数据的语音编码为G711;
当所述语音数据的语音编码为非G711格式时,将所述语音数据进行组装成帧并统一转码为G711格式。
3.如权利要求1所述的方法,其特征在于,所述根据所述设定文件的名称将同一个语音线路信息所包括的主叫文件和被叫文件确定为成对语音之前,还包括:
若同一个语音线路信息所包括的主叫文件的文件长度与被叫文件的文件长度相差较大,则删除同一个语音线路所包括的主叫文件和被叫文件。
4.一种语音线路检测装置,其特征在于,包括:
获取单元,用于获取被抽检线路的语音数据,所述语音数据按照时间戳进行装帧并存储至设定文件,其中,所述设定文件的名称至少包括所述语音数据的语音线路信息和主叫信息或被叫信息;
得到单元,用于根据所述设定文件的名称将同一个语音线路信息所包括的主叫文件和被叫文件确定为成对语音,采用静音检测函数获取主叫文件指定信噪比和时间间隔条件下包括的全部静音段的主叫开始时间戳序列和主叫结束时间戳序列,将主叫开始时间戳序列和主叫结束时间戳序列存储为主叫数组序列;采用静音检测函数获取被叫文件指定信噪比和时间间隔条件下包括的全部静音段的被叫开始时间戳序列和被叫结束时间戳序列,将被叫开始时间戳序列和被叫结束时间戳序列存储为被叫数组序列;根据所述主叫数组序列中包括的主叫开始时间戳序列和主叫结束时间戳序列,将所述主叫开始时间戳序列和主叫结束时间戳序列按照时间顺序进行排序,相邻的主叫开始时间戳序列和主叫结束时间戳序列组成一个主叫静音间隔序列,两个相邻主叫静音间隔序列之间包括一个主叫有音间隔序列;将所述主叫静音间隔序列和所述主叫有音间隔序列依次按照最小时间间隔进行离散,得到主叫高低电平话音序列;
根据所述被叫数组序列中包括的被叫开始时间戳序列和被叫结束时间戳序列,将所述被叫开始时间戳序列和被叫结束时间戳序列按照时间顺序进行排序,相邻的被叫开始时间戳序列和被叫结束时间戳序列组成一个被叫静音间隔序列,两个相邻被叫静音间隔序列之间包括一个被叫有音间隔序列;将所述被叫静音间隔序列和所述被叫有音间隔序列依次按照最小时间间隔进行离散,得到被叫高低电平话音序列;
确定单元,用于根据主叫高低电平话音序列和被叫高低电平话音序列,通过公式确定同一个语音线路信息所包括的主叫文件和被叫文件相关性系数:
其中,dxi表示主叫高低电平话音序列,dyi表示被叫高低电平话音序列;或者dxi表示被叫高低电平话音序列,dyi表示主叫高低电平话音序列;ρ为同一个语音线路信息所包括的主叫文件和被叫文件相关性系数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110811585.5A CN113596261B (zh) | 2021-07-19 | 2021-07-19 | 一种语音线路检测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110811585.5A CN113596261B (zh) | 2021-07-19 | 2021-07-19 | 一种语音线路检测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113596261A CN113596261A (zh) | 2021-11-02 |
CN113596261B true CN113596261B (zh) | 2024-01-05 |
Family
ID=78248454
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110811585.5A Active CN113596261B (zh) | 2021-07-19 | 2021-07-19 | 一种语音线路检测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113596261B (zh) |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6779030B1 (en) * | 1997-10-06 | 2004-08-17 | Worldcom, Inc. | Intelligent network |
CN101221762A (zh) * | 2007-12-06 | 2008-07-16 | 上海大学 | 一种mp3压缩域音频分割方法 |
CN101521898A (zh) * | 2009-01-07 | 2009-09-02 | 陕西三太科技实业有限公司 | 移动通讯网络语音质量评估系统 |
US8537983B1 (en) * | 2013-03-08 | 2013-09-17 | Noble Systems Corporation | Multi-component viewing tool for contact center agents |
CN106157975A (zh) * | 2015-04-27 | 2016-11-23 | 中国移动通信集团公司 | 一种确定语音质量的系统、方法及装置 |
CN107733885A (zh) * | 2017-10-10 | 2018-02-23 | 惠州Tcl移动通信有限公司 | 显示主叫被叫本地时间的方法、移动终端及存储介质 |
CN107846520A (zh) * | 2017-10-26 | 2018-03-27 | 科大讯飞股份有限公司 | 单通检测方法及装置 |
CN108174008A (zh) * | 2017-12-22 | 2018-06-15 | 天津七二通信广播股份有限公司 | 一种用于通信语音传输系统的语音包存储方法 |
CN108962275A (zh) * | 2018-08-01 | 2018-12-07 | 电信科学技术研究院有限公司 | 一种音乐噪声抑制方法及装置 |
CN110430102A (zh) * | 2019-09-02 | 2019-11-08 | 国网江苏省电力有限公司丹阳市供电分公司 | 基于ims的电话录音方法 |
CN111462758A (zh) * | 2020-03-02 | 2020-07-28 | 深圳壹账通智能科技有限公司 | 智能会议角色分类的方法、装置、设备及存储介质 |
CN112995754A (zh) * | 2021-02-26 | 2021-06-18 | 北京奇艺世纪科技有限公司 | 字幕质量检测方法、装置、计算机设备和存储介质 |
-
2021
- 2021-07-19 CN CN202110811585.5A patent/CN113596261B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6779030B1 (en) * | 1997-10-06 | 2004-08-17 | Worldcom, Inc. | Intelligent network |
CN101221762A (zh) * | 2007-12-06 | 2008-07-16 | 上海大学 | 一种mp3压缩域音频分割方法 |
CN101521898A (zh) * | 2009-01-07 | 2009-09-02 | 陕西三太科技实业有限公司 | 移动通讯网络语音质量评估系统 |
US8537983B1 (en) * | 2013-03-08 | 2013-09-17 | Noble Systems Corporation | Multi-component viewing tool for contact center agents |
CN106157975A (zh) * | 2015-04-27 | 2016-11-23 | 中国移动通信集团公司 | 一种确定语音质量的系统、方法及装置 |
CN107733885A (zh) * | 2017-10-10 | 2018-02-23 | 惠州Tcl移动通信有限公司 | 显示主叫被叫本地时间的方法、移动终端及存储介质 |
CN107846520A (zh) * | 2017-10-26 | 2018-03-27 | 科大讯飞股份有限公司 | 单通检测方法及装置 |
CN108174008A (zh) * | 2017-12-22 | 2018-06-15 | 天津七二通信广播股份有限公司 | 一种用于通信语音传输系统的语音包存储方法 |
CN108962275A (zh) * | 2018-08-01 | 2018-12-07 | 电信科学技术研究院有限公司 | 一种音乐噪声抑制方法及装置 |
CN110430102A (zh) * | 2019-09-02 | 2019-11-08 | 国网江苏省电力有限公司丹阳市供电分公司 | 基于ims的电话录音方法 |
CN111462758A (zh) * | 2020-03-02 | 2020-07-28 | 深圳壹账通智能科技有限公司 | 智能会议角色分类的方法、装置、设备及存储介质 |
CN112995754A (zh) * | 2021-02-26 | 2021-06-18 | 北京奇艺世纪科技有限公司 | 字幕质量检测方法、装置、计算机设备和存储介质 |
Non-Patent Citations (3)
Title |
---|
Parcimonious time frequency quantization for phoneme and speaker classification;Fraihat Salam;《IEEE Xplore》;全文 * |
基于VOIP语音业务的音检测算法的研究及其实现;李燕华;《CNKI中国知网》;全文 * |
赵欣.中国优秀硕士学位论文全文数据库.(04),全文. * |
Also Published As
Publication number | Publication date |
---|---|
CN113596261A (zh) | 2021-11-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8929519B2 (en) | Analyzing speech application performance | |
CN110135879B (zh) | 基于自然语言处理的客服质量自动评分方法 | |
US9947320B2 (en) | Script compliance in spoken documents based on number of words between key terms | |
US20170270201A1 (en) | Automated detection and filtering of audio advertisements | |
US20040015350A1 (en) | Determining speech recognition accuracy | |
CN109326305B (zh) | 一种批量测试语音识别和文本合成的方法和测试系统 | |
CN110839112A (zh) | 一种问题语音的检测方法和装置 | |
CN111147669A (zh) | 一种全量实时自动服务质检系统和方法 | |
CN111508527B (zh) | 一种电话应答状态检测方法、装置及服务器 | |
US20030115066A1 (en) | Method of using automated speech recognition (ASR) for web-based voice applications | |
US8949134B2 (en) | Method and apparatus for recording/replaying application execution with recorded voice recognition utterances | |
CN110324566B (zh) | 视频会议中声音延时的测试方法、测试装置和测试设备 | |
CN113596261B (zh) | 一种语音线路检测方法及装置 | |
CN101662780A (zh) | 客服语音自动检测方法及检测系统 | |
CN113782036A (zh) | 音频质量评估方法、装置、电子设备和存储介质 | |
CN111179936B (zh) | 通话录音监控方法 | |
EP0538536A1 (en) | Method for detecting voice presence on a communication line | |
CN112562644A (zh) | 基于人声分离的客服服务质检方法、系统、设备及介质 | |
EP0530645A2 (en) | Telephone signal classification and phone message delivery method and system | |
US20020010576A1 (en) | A method and device for estimating the pitch of a speech signal using a binary signal | |
US7571093B1 (en) | Method of identifying duplicate voice recording | |
CN112908305B (zh) | 一种提升语音识别准确性的方法和设备 | |
CN111354365B (zh) | 一种纯语音数据采样率识别方法、装置、系统 | |
KR100839691B1 (ko) | 톤 검출 방법 및 시스템 | |
CN114121038A (zh) | 音响语音测试方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |