CN104167209B - 一种音频失真的检测方法及装置 - Google Patents

一种音频失真的检测方法及装置 Download PDF

Info

Publication number
CN104167209B
CN104167209B CN201410385151.3A CN201410385151A CN104167209B CN 104167209 B CN104167209 B CN 104167209B CN 201410385151 A CN201410385151 A CN 201410385151A CN 104167209 B CN104167209 B CN 104167209B
Authority
CN
China
Prior art keywords
audio signal
distortion
amplitude
detected
threshold
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410385151.3A
Other languages
English (en)
Other versions
CN104167209A (zh
Inventor
郝红霞
刘晓清
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Huawei Technologies Co Ltd
Original Assignee
Tsinghua University
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University, Huawei Technologies Co Ltd filed Critical Tsinghua University
Priority to CN201410385151.3A priority Critical patent/CN104167209B/zh
Publication of CN104167209A publication Critical patent/CN104167209A/zh
Application granted granted Critical
Publication of CN104167209B publication Critical patent/CN104167209B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Stereophonic System (AREA)

Abstract

本发明公开了一种音频失真的检测方法及装置,用以解决现有技术中存在的运营商难以自动识别海量音频文件中识别出有问题的音频文件、且无法对音频提供商提供的音频进行质量把关,从而导致音频质量降低的问题。该音频失真的检测方法包括:获取待检测音频信号的幅值的均值的第一绝对值,若该第一绝对值大于第一阈值,确定待检测音频信号存在幅值不对称失真或者存在低频噪声失真。

Description

一种音频失真的检测方法及装置
技术领域
本发明涉及音频分析技术领域,尤其涉及一种音频失真的检测方法及装置。
背景技术
目前各个运营商提供的音频分享平台中有着数百万的音频文件,例如:彩铃、振铃及歌曲等等,并且这些音频文件已经被数亿人口使用。然而,在使用过程中,用户会反馈某些音频有失真的问题。但是目前,运营商无法在音频分享平台中数百万的音频文件中识别出有问题的音频文件。
出现以上这个问题主要是因为音频提供商的音频编辑人员的工作失误引起的,并且这个问题是会严重影响用户的体验。
目前音频提供商并不能获知有问题的音频文件,也就无法对有问题的音频文件进行更新,从而导致运营商无法对音频提供商提供的音频文件进行质量把关,因此降低了音频的质量,进而影响了用户的体验。
发明内容
本发明实施例提供一种音频失真的检测方法及装置,用以解决现有技术中存在的运营商无法从海量音频文件中识别出有问题的音频文件、且无法对音频提供商提供的音频文件进行质量把关,从而导致音频质量降低的问题。
第一方面,本发明实施例提供了一种音频信号失真的检测方法,包括:
获取待检测音频信号的幅值的均值的第一绝对值;
若所述第一绝对值大于第一阈值,确定所述待检测音频信号存在幅值不对称失真或者存在低频噪声失真。
结合第一方面,在第一方面的第一种可能的实现方式中,获取待检测音频信号的幅值的均值的第一绝对值后,所述方法还包括:
对所述待检测音频信号进行低频噪声滤除;
获取滤除低频噪声后的音频信号的幅值的均值的第二绝对值,并
按照预定的帧长将经过滤除低频噪声后的音频信号进行分帧处理;
获取分帧后各帧中包含的音频信号的最大幅值及最小幅值;
针对分帧后的每一帧,确定在该帧中获取的最大幅值的绝对值与在该帧中获取的最小幅值的绝对值之差,并针对各帧分别确定的差值求平均值;
确定分别由在每一帧获取的最大幅值构成的最大幅值序列,和分别由在每一帧获取的最小幅值构成的最小幅值序列的相关系数;
确定所述待检测音频信号存在幅值不对称失真或者存在低频噪声失真,包括:
根据所述第二绝对值、所述平均值和所述相关系数,确定所述待检测音频信号具体存在幅值不对称失真或是存在低频噪声失真。
结合第一方面的第一种可能的实现方式,在第一方面的第二种可能的实现方式中,根据所述第二绝对值、平均值及相关系数,确定所述待检测音频信号具体存在幅值不对称失真或是存在低频噪声失真,包括:
若所述第二绝对值大于第一阈值、或者所述第二绝对值不大于第一阈值且所述平均值不小于第二阈值、或者所述第二绝对值不大于第一阈值且所述相关系数不大于第三阈值,则确定所述待检测音频信号存在幅值不对称失真;
若所述第二绝对值不大于第一阈值、且所述平均值小于第二阈值且所述相关系数大于第三阈值,则确定所述待检测音频信号存在低频噪声失真。
结合第一方面和第一方面的第一种至第二种可能的实现方式中的任意一种,在第一方面的第三种可能的实现方式中,所述获取待检测音频信号的幅值的均值的第一绝对值之前,还包括:
获取音频信号文件;
确定播放所述音频信号文件所占用的时长大于预定的时间长度时,将所述音频信号文件进行分段处理,得到各段音频信号分别作为待检测音频信号。
结合第一方面的第三种可能的实现方式,在第一方面的第四种可能的实现方式中,所述方法还包括:
若所述第一绝对值不大于第一阈值,确定所述待检测音频信号不存在幅值不对称失真且不存在低频噪声失真。
结合第一方面的第四种可能的实现方式,在第一方面的第五种可能的实现方式中,所述方法还包括:
针对每一段待检测音频信号,分别执行:
若确定该待检测音频信号存在幅值不对称失真时,为该待检测音频信号标记用于表示幅值不对称失真的第一常数;
若确定该待检测音频信号存在低频噪声失真时,为该待检测音频信号标记用于表示低频噪声失真的第二常数;
若确定该待检测音频信号不存在幅值不对称失真且不存在低频噪声失真时,为该待检测音频信号标记用于表示不存在幅值不对称失真且不存在低频噪声失真的第三常数。
结合第一方面的第五种可能的实现方式,在第一方面的第六种可能的实现方式中,所述方法还包括:
针对获取的音频信号文件分段得到的各段待检测音频信号,确定为各段待检测音频信号分别标记的常数值的平均值;
若确定的平均值大于第一标记阈值,则确定所述音频信号文件存在幅值不对称失真;
若确定的平均值小于第二标记阈值,则确定所述音频信号文件不存在幅值不对称失真且不存在低频噪声失真;
若确定的平均值不小于第二标记阈值且不大于第一标记阈值,则确定所述音频信号文件存在低频噪声失真;
其中,所述第二标记阈值小于第一标记阈值。
第二方面,本发明实施例提供了一种音频信号失真的检测装置,该装置包括:
获取模块:用于获取待检测音频信号的幅值的均值的第一绝对值;
失真确定模块:用于判断出所述获取模块获取的第一绝对值大于第一阈值时,确定所述待检测音频信号存在幅值不对称失真或者存在低频噪声失真。
结合第二方面,在第二方面的第一种可能的实现方式中,所述装置还包括:处理模块,用于在所述获取模块获取待检测音频信号的幅值的均值的第一绝对值后,对所述待检测音频信号进行低频噪声滤除;获取滤除低频噪声后的音频信号的幅值的均值的第二绝对值;并按照预定的帧长将经过滤除低频噪声后的音频信号进行分帧处理,获取分帧后各帧中包含的音频信号的最大幅值及最小幅值,针对分帧后的每一帧,确定在该帧中获取的最大幅值的绝对值与在该帧中获取的最小幅值的绝对值之差,并针对各帧分别确定的差值求平均值;及确定分别由在每一帧获取的最大幅值构成的最大幅值序列,和分别由在每一帧获取的最小幅值构成的最小幅值序列的相关系数;
所述失真确定模块,具体用于根据所述第二绝对值、所述平均值及所述相关系数,确定所述待检测音频信号具体存在幅值不对称失真或是存在低频噪声失真。
结合第二方面的第一种可能的实现方式,在第二方面的第二种可能的实现方式中,所述失真确定模块具体用于:
判断出所述第二绝对值大于第一阈值、或者所述第二绝对值不大于第一阈值且所述平均值不小于第二阈值、或者所述第二绝对值不大于第一阈值且所述相关系数不大于第三阈值时,确定所述待检测音频信号存在幅值不对称失真;
判断出所述第二绝对值不大于第一阈值、且所述平均值小于第二阈值且所述相关系数大于第三阈值,确定所述待检测音频信号存在低频噪声失真。
结合第二方面的第一种至第二种可能的实现方式中的任意一种,在第三方面的第三种可能的实现方式中,所述获取模块还用于:
获取音频信号文件;
所述处理模块,还用于确定播放所述音频信号文件所占用的时长大于预定的时间长度时,将所述音频信号文件进行分段处理,得到各段音频信号分别作为待检测音频信号。
结合第二方面的第三种可能的实现方式,在第二方面的第四种可能的实现方式中,所述失真确定模块,还用于在判断出所述获取模块获取的第一绝对值不大于第一阈值时,确定所述待检测音频信号不存在幅值不对称失真且不存在低频噪声失真。
结合第二方面的第四种可能的实现方式,在第三方面的第五种可能的实现方式中,所述处理模块还用于:
针对每一段待检测音频信号,分别执行:
若确定该待检测音频信号存在幅值不对称失真时,为该待检测音频信号标记用于表示幅值不对称失真的第一常数;
若确定该待检测音频信号存在低频噪声失真时,为该待检测音频信号标记用于表示低频噪声失真的第二常数;
若确定该待检测音频信号不存在幅值不对称失真且不存在低频噪声失真时,为该待检测音频信号标记用于表示不存在幅值不对称失真且不存在低频噪声失真的第三常数。
结合第二方面的第五种可能的实现方式,在第三方面的第六种可能的实现方式中,所述失真确定模块还用于:
针对获取的音频信号文件分段得到的各段待检测音频信号,确定所述处理模块为各段待检测音频信号分别标记的常数值的平均值;
若确定的平均值大于第一标记阈值,则确定所述音频信号文件存在幅值不对称失真;
若确定的平均值小于第二标记阈值,则确定所述音频信号文件不存在幅值不对称失真且不存在低频噪声失真;
若确定的平均值不小于第二标记阈值且不大于第一标记阈值,则确定所述音频信号文件存在低频噪声失真;
其中,所述第二标记阈值小于第一标记阈值。
利用本发明提供的方案,获取待检测的音频信号的幅值的均值的第一绝对值,将第一绝对值与预设的第一阈值进行比较的结果,若大于第一阈值,则确定该待检测音频信号存在幅值不对称失真或者存在低频噪声失真,从而可以将该存在失真的音频文件返给音频提供商,使得音频提供商及时进行更新,进而达到提高音频质量的目的,从而也提高了用户的体验。
附图说明
图1为本发明实施例提供的一种音频失真的检测方法流程图;
图2为本发明实施例提供的另一种音频失真的检测方法流程图;
图3为本发明实施例提供的一种音频失真的检测装置示意图;
图4为本发明实施例提供的又一种音频失真的检测方法流程图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
本发明实施例提供了一种音频失真的检测方法及装置,运营商可以利用该音频失真检测方法和装置来检测用于即将上线的音频文件中的存在问题的音频文件。运营商对上线使用的音频文件有一套管理系统,可以在管理系统中加入本发明实施例提供的音频失真检测装置,实现对所有在管理系统中已存储的音频文件进行自动检测,检测到有问题的音频文件后可以通知审核人员,替换新的音频文件。
本发明实施例提供的方法及装置,还可以对新增加的音频文件进行检测。运营商的音频文件入库时需要人工审核,但随着每日新增音频文件的增多,人工审核量太大,可在管理系统中加入本发明实施例提供的装置,对铃音提供商提供的音频文件进行自动检测,检测通过方可入库和上线使用。利用本发明提供的方法及装置对新增音频文件进行质量把关,有利于音频的质量的提高。
本发明实施例不仅仅适用于上述运营商提供的音频分享平台上的音频文件的失真检测,还适用于各种存在低频噪声失真或者存在幅值不对称失真的音频文件。
本发明实施例适用于各种采样率各种编码格式的音频文件。可以是彩铃、振铃或者歌曲等等音频文件。音频文件的格式可以是mp3、wav、asf、vox等等。
申请人在进行发明的过程中,发现音频分享平台中存在的问题的音频文件主要是由于音频编辑人员在对音频文件进行操作失误导致的,有些音频文件在波形信号中表现为幅值偏移及幅值不对称。
音频信号的幅值偏移主要是由低频噪声的引入造成的。音频信号的幅值不对称主要是由不恰当过滤造成的。
音频信号幅值信号的失真主要表现为:
1、音频信号的包络的上下界不对称,即上包络曲线与下包络曲线的差值较大。
2、上下包络曲线的变化不一致,即上下包络的相关系数降低。
因此,申请人利用以下实施例提供的音频失真检测方法及装置对失真的音频文件进行检测。
实施例一
如图1所示,为本发明实施例一提供的一种音频失真检测方法,该方法包括:
步骤101:获取待检测音频信号的幅值的均值的第一绝对值。
步骤102:若该第一绝对值大于第一阈值,确定待检测音频信号存在幅值不对称失真或者存在低频噪声失真。
可选的,若该第一绝对值不大于第一阈值,确定待检测音频信号不存在幅值不对称失真且不存在低频噪声失真。
具体的,可以将第一阈值设置为0.07,则判断第一绝对值大于0.07时,确定该待检测音频信号存在幅值不对称失真或者存在低频噪声失真。判断第一绝对值不大于0.07时,确定该待检测音频信号不存在幅值不对称失真且不存在低频噪声失真。
利用本发明提供的方案,获取待检测的音频信号的幅值的均值的第一绝对值,将第一绝对值与预设的第一阈值进行比较的结果,若大于第一阈值,则确定该待检测音频信号存在幅值不对称失真或者存在低频噪声失真,从而可以将该失真的音频文件返给音频提供商,使得音频提供商及时进行更新,进而达到提高音频质量的目的,从而也提高了用户的体验。
可选的,在经过步骤101获取待检测音频信号的幅值的均值的第一绝对值后,可以进行确定该待检测音频信号存在幅值不对称失真或者存在低频噪声失真的处理。具体的如图2所示,
步骤201:获取待检测音频信号的幅值的均值的第一绝对值。
步骤202:对待检测音频信号进行低频噪声滤除。
例如:可以采用滤波器滤除50HZ以下的低频信号。由于在原音频文件中可能存在低频噪声,且一般音频信号在50HZ以下的信息能量较少,因此可以滤除50HZ以下的低频信号。
步骤203:获取滤除低频噪声后的音频信号的幅值的均值的第二绝对值,并按照预定的帧长将经过滤除低频噪声后的音频信号进行分帧处理;获取分帧后各帧中包含的音频信号的最大幅值及最小幅值,针对分帧后的每一帧,确定在该帧中获取的最大幅值的绝对值与在该帧中获取的最小幅值的绝对值之差,并针对各帧分别确定的差值求平均值;确定分别由在每一帧获取的最大幅值构成的最大幅值序列,和分别由在每一帧获取的最小幅值构成的最小幅值序列的相关系数。
具体的,为了刻画音频信号的包络曲线,将经过滤除低频噪声后的待检测音频信号按照预定的帧长(例如5ms)进行分帧处理,获取分帧后每帧中包含的音频信号的最大幅值及最小幅值。所有的最大幅值构成了最大幅值序列,其用于刻画待检测音频信号的上包络边界,所有的最小幅值构成了最小幅值序列,其用于刻画待检测音频信号的下包络边界。最大幅值序列为:Ui,i=1,2,…,M,最小幅值序列为:Di,i=1,2,…,M,其中M为帧数。
针对分帧后的每一帧,确定在该帧中获取的最大幅值的绝对值与在该帧中获取的最小幅值的绝对值之差,并针对各帧分别确定的差值求平均值(可以称为幅值差别特征),具体为:
其中,AD为幅值差别特征。
确定最大幅值序列和最小幅值序列的相关系数,具体为:
其中,ρ为音频信号最大幅值序列和最小幅值序列的相关系数,EU为最大幅值序列的平均值,ED为最小幅值序列的平均值。
EU及ED获取方式如下:
其中,相关系数的取值范围为[-1,1]。其含义如下:
1、若取值大于0,则表示正相关,变量与参照量同方向变化;
若取值小于0,则表示负相关,变量与参照两反方向变化。
2、若取值为0,则表示不相关。
3、若取值为1,则表示完全正相关,变量与参照量同方向变化的幅度相同;
若取值为-1,则表示完全负相关,变量与参照量反方向变化的幅度相同。
需要说明的是,通常的音频文件采样率在8khz以上,音频信号的波形包络的上下边界对称,包络上下边界的幅值的绝对值之间差值相对很小,并呈现负相关,最理想的状态是相关系数为-1。
步骤204:若上述第一绝对值大于第一阈值,根据第二绝对值、平均值及相关系数,确定待检测音频信号具体存在幅值不对称失真或是存在低频噪声失真。
具体的,若上述第一绝对值大于第一阈值,根据第二绝对值、平均值及相关系数,确定所述待检测音频信号具体存在幅值不对称失真或是存在低频噪声失真,具体包括:
若满足以下至少一项,确定所述待检测音频信号存在幅值不对称失真;
第一绝对值大于第一阈值且第二绝对值大于第一阈值;
第一绝对值大于第一阈值、且第二绝对值不大于第一阈值且上述平均值(幅值差别特征)不小于第二阈值;
第一绝对值大于第一阈值、且第二绝对值不大于第一阈值且相关系数不大于第三阈值。
若满足以下条件,确定所述待检测音频信号为存在低频噪声失真:
第一绝对值大于第一阈值、且第二绝对值不大于第一阈值、且平均值(幅值差别特征)小于第二阈值、且相关系数大于第三阈值。
可选的,获取待检测音频信号的幅值的均值的第一绝对值之前,包括:
获取音频信号文件;
确定播放所述音频信号文件所占用的时长大于预定的时间长度时,将所述音频信号文件进行分段处理,得到各段音频信号分别作为待检测音频信号,然后针对针对各段待检测音频信号,分别获取各段待检测音频信号的幅值的均值的第一绝对值,然后进行如图2所示的失真检测,若否,对该待检测音频文件不进行分段处理,直接获取待检测音频信号的幅值的均值的第一绝对值,进行如图2所示的失真检测。
经过如图2所示的失真检测后,针对每一段待检测音频信号,分别执行:
若确定该待检测音频信号存在幅值不对称失真,将该段待检测音频信号标记用于表示幅值不对称失真的第一常数;若确定该待检测音频文件为存在低频噪声失真,为该段待检测音频文件标记用于表示低频噪声失真的第二常数;若确定该待检测音频信号不存在幅值不对称失真且不存在低频噪声失真,为该待检测音频信号标记用于表示不存在幅值不对称失真且不存在低频噪声失真的第三常数。其中,可以将待检测音频信号的标记称为幅值状态值。经过上述处理后,确定存在幅值不对称失真的各段待检测音频信号标记为第一常数;确定为存在低频噪声失真的各段待检测音频信号标记为第二常数;将确定为不存在幅值不对称失真且存在低频噪声失真的各段待检测音频信号标记为第三常数。
将存在低频噪声失真、幅值不对称失真、以及不存在以上两种失真的音频文件进行标记,以便于后续查找存在上述两种失真的音频信号文件后进行处理。
针对获取的音频信号文件分段得到的各段待检测音频信号,确定为各段待检测音频信号分别标记的常数值的平均值;
若确定的各段待检测音频信号的标记的常数值的平均值大于第一标记阈值,则确定该音频信号文件存在幅值不对称失真;若确定的各段待检测音频信号的标记的常数值的平均值小于第二标记阈值,则确定该音频信号文件为不存在幅值不对称失真且不存在低频噪声失真;若确定的各段待检测音频信号的标记的常数值的平均值不小于第二标记阈值且不大于第一阈值,则确定该音频信号文件为存在低频噪声失真;该第二标记阈值小于第一标记阈值。
实施例二
本发明实施例还提供了一种提高音频质量的方法,利用上述实施例一所述的方法对待检测音频信号进行检测;若检测结果为该待检测音频信号存在低频噪声失真,对该待检测音频信号进行低频噪声滤除。
运营商在检测到存在低频噪声失真的音频信号后,可以直接对该音频信号进行低频噪声滤除处理,然后再将该音频信号文件进行入库或者上线。当然运营商在检测到存在低频噪声失真的音频信号后,可以将该音频信号反馈给音频信号提供商,音频信号提供商可以对该音频信号进行低频噪声滤除后在发送给运营商。从而提高了音频信号的质量。
实施例三
如图3所示,为本发明实施例三提供的一种音频失真的检测装置,该装置包括:
获取模块301:用于获取待检测音频信号的幅值的均值的第一绝对值;
失真确定模块302:用于判断上述获取模块301获取的第一绝对值大于第一阈值时,确定上述待检测音频信号存在幅值不对称失真或者存在低频噪声失真。
可选的,该音频失真的检测还包括处理模块:
处理模块,用于在获取模块301获取待检测音频信号的幅值的均值的第一绝对值后,对待检测音频信号进行低频噪声滤除处理,获取滤除低频噪声后的音频信号的幅值的均值的第二绝对值;并按照预定的帧长将经过滤除低频噪声后的音频信号进行分帧处理,获取分帧后各帧中包含的音频信号的最大幅值及最小幅值,针对分帧后的每一帧,确定在该帧中获取的最大幅值的绝对值与在该帧中获取的最小幅值的绝对值之差,并针对各帧分别确定的差值求平均值;及确定分别由在每一帧获取的最大幅值构成的最大幅值序列,和分别由在每一帧获取的最小幅值构成的最小幅值序列的相关系数;失真确定模块302根据第二绝对值、平均值及相关系数,确定待检测音频信号具体存在幅值不对称失真或是存在低频噪声失真。
若第一绝对值大于第一阈值时,失真确定模块302用于,根据第二绝对值、平均值及相关系数,确定待检测音频信号具体存在幅值不对称失真或是存在低频噪声失真,具体可以采用如下方式:
判断出第二绝对值大于第一阈值、或者第二绝对值不大于第一阈值且平均值不小于第二阈值、或者第二绝对值不大于第一阈值且相关系数不大于第三阈值时,则确定待检测音频信号存在幅值不对称失真;
判断出第二绝对值不大于第一阈值、且平均值小于第二阈值且相关系数大于第三阈值时,则确定待检测音频信号存在低频噪声失真。
具体的,为了刻画音频信号的包络曲线,将经过滤除低频噪声后的待检测音频信号按照预定的帧长(例如5ms)进行分帧处理,获取分帧后每帧中包含的音频信号的最大幅值及最小幅值。所有的最大幅值构成了最大幅值序列,其用于刻画待检测音频信号的上包络边界,所有的最小幅值构成了最小幅值序列,其用于刻画待检测音频信号的下包络边界。最大幅值序列为:Ui,i=1,2,…,M,最小幅值序列为:Di,i=1,2,…,M,其中M为帧数。
针对分帧后的每一帧,确定在该帧中获取的最大幅值的绝对值与在该帧中获取的最小幅值的绝对值之差,并针对各帧分别确定的差值求平均值(可以称为幅值差别特征),具体为:
其中,AD为幅值差别特征。
确定最大幅值序列和最小幅值序列的相关系数,具体为:
其中,ρ为音频信号最大幅值序列和最小幅值序列的相关系数,EU为最大幅值序列的平均值,ED为最小幅值序列的平均值。
EU及ED获取方式如下:
其中,相关系数的取值范围为[-1,1]。其含义如下:
1、若取值大于0,则表示正相关,变量与参照量同方向变化;
若取值小于0,则表示负相关,变量与参照两反方向变化。
2、若取值为0,则表示不相关。
3、若取值为1,则表示完全正相关,变量与参照量同方向变化的幅度相同;
若取值为-1,则表示完全负相关,变量与参照量反方向变化的幅度相同。
需要说明的是,通常的音频文件采样率在8khz以上,音频信号的波形包络的上下边界对称,包络上下边界的幅值的绝对值之间差值相对很小,并呈现负相关,最理想的状态是相关系数为-1。
可选的,获取模块301具体用于:获取音频信号文件;
处理模块,还用于确定播放音频信号文件所占用的时长大于预定的时间长度时,将该音频信号文件进行分段处理,得到各段音频信号分别作为待检测音频信号。
可选的,失真确定模块302还用于,在判断出所述获取模块301获取的第一绝对值不大于第一阈值,确定待检测音频信号不存在幅值不对称失真且不存在低频噪声失真。
可选的,处理模块还用于:针对每一段待检测音频信号,分别执行:
若确定该待检测音频信号存在幅值不对称失真时,为该待检测音频信号标记用于表示幅值不对称失真的第一常数;
若确定该待检测音频信号存在低频噪声失真时,为该待检测音频信号标记用于表示低频噪声失真的第二常数;
若确定该待检测音频信号不存在幅值不对称失真且不存在低频噪声失真时,为该待检测音频信号标记用于表示不存在幅值不对称失真且不存在低频噪声失真的第三常数。
失真确定模块302还用于:针对获取的音频信号文件分段得到的各段待检测音频信号,确定所述处理模块为各段待检测音频信号分别标记的常数值的平均值;
若确定的各段待检测音频信号标记的常数值的平均值大于第一标记阈值,则确定音频信号文件存在幅值不对称失真;若确定的待检测音频信号文件的各段标记的常数值的平均值小于第二标记阈值,则确定音频信号文件不存在幅值不对称失真且不存在低频噪声失真;若确定的待检测音频信号的各段标记的常数值的平均值不小于第二标记阈值且不大于第一标记阈值,则确定音频信号文件存在低频噪声失真;该第二标记阈值小于第一标记阈值。
实施例四
实施例四提供了一种提高音频质量的装置,该装置包括:实施例三提供的音频信号失真的检测装置,用于对待检测音频信号进行失真检测;
滤波装置,若检测结果为所述待检测音频信号存在低频噪声失真,对待检测音频信号进行低频噪声滤除。
下面结合具体应用场景,对本发明实施例做具体说明。
假设,本发明实施例的待检测音频信号的时间长度为30s,预定的时间段为3s,则对该待检测音频信号的按照预定的时间段进行分段处理,则待检测音频信号被分为10段,每段时间长度为3s。则针对每段进行如下处理(本发明实施例将待检测音频中的每段称为音频信号),如图4所示:
步骤401:获取音频信号的幅值的均值的第一绝对值。执行步骤402。
步骤402:确定该第一绝对值是否大于T1(第一阈值,此处取值为0.07),若是,执行步骤403,若否,执行步骤404。
步骤403:对该音频信号进行低频噪声滤除处理,获取滤除低频噪声后的音频信号幅值的均值的第二绝对值,并按照预定的帧长(此处以5ms为例,则每段音频信号分为6帧)将经过滤除低频噪声后的音频信号进行分帧处理,获取分帧后各帧中包含的音频信号的最大幅值及最小幅值,针对分帧后的每一帧,确定在该帧中获取的最大幅值的绝对值与在该帧中获取的最小幅值的绝对值之差,并针对各帧分别确定的差值求平均值;及确定分别由在每一帧获取的最大幅值构成的最大幅值序列,和分别由在每一帧获取的最小幅值构成的最小幅值序列的相关系数。执行步骤405。
其中,最大幅值序列为:Ui,i=1,2,…,M,最小幅值序列为:Di,i=1,2,…,M,其中M=6。
上述确定最大幅值序列的绝对值和最小幅值序列的绝对值对应帧之差的平均值(可以称为幅值差别特征),具体为:
其中,AD为幅值差别特征。
确定最大幅值序列和最小幅值序列的相关系数,具体为:
其中,ρ为音频信号最大幅值序列和最小幅值序列的相关系数,EU为最大幅值序列的平均值,ED为最小幅值序列的平均值。
EU及ED获取方式如下:
步骤404:确定该音频文件不存在幅值不对称失真且不存在低频噪声失真,该音频信号的幅值状态值设置为0(即将该音频信号标记为0,此处以0为例,可以为其他常数)。
步骤405:确定第二绝对值是否大于T1,若是,执行步骤406,若否,执行步骤407。
步骤406,确定音频信号存在幅值不对称失真,该音频信号的幅值状态值设置为1(此处以1为例)。
步骤407:确定是否同时满足上述平均值(即最大幅值序列和最小幅值序列对应帧之差的平均值)小于T2(第二阈值,此处以T2等于0.1为例)且相关系数(即最大幅值序列和最小幅值序列的相关系数)大于T3(第三阈值,此处以T3等于-0.5为例),若是,执行步骤408,若否(即,满足上述平均值不小于T2或者满足相关系数不大于T3),执行步骤409。
步骤408:确定音频信号存在低频噪声失真,该音频信号的幅值状态值设置为1。
步骤409:确定音频信号存在幅值不对称失真,该音频信号的幅值状态值设置为2。
将每段进行如图4所示方法的处理后,获取待检测音频信号的所有段音频信号的幅值状态值的平均值,若该幅值状态值的平均值大于T4(即第一标记阈值,此处以T4等于1.5为例),则确定该待检测音频文件存在幅值不对称失真;若幅值状态值的平均值小于T5(第二标记阈值,此处以T5等于0.7为例),则确定该音频信号不存在幅值不对称失真且不存在低频噪声失真;若该幅值状态值的平均值不小于T5且不大于T4,确定该待检测音频信号存在低频噪声失真。
针对上述确定的存在低频噪声的音频信号,可以进行低频噪声滤波处理,例如进行50hz以下的音频信号的滤除处理。经过处理后,可以将处理后的音频信号进行上线。当然也可以将存在失真问题的音频信号反馈给提供商,针对存在低频噪声失真的音频信号,提供商可以进行低频噪声滤波处理后,再提供给运营商进行上线处理。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (14)

1.一种音频信号失真的检测方法,其特征在于,包括:
获取待检测音频信号的幅值的均值的第一绝对值;
若所述第一绝对值大于第一阈值,确定所述待检测音频信号存在幅值不对称失真或者存在低频噪声失真。
2.如权利要求1所述的方法,其特征在于,获取待检测音频信号的幅值的均值的第一绝对值后,所述方法还包括:
对所述待检测音频信号进行低频噪声滤除;
获取滤除低频噪声后的音频信号的幅值的均值的第二绝对值,并
按照预定的帧长将经过滤除低频噪声后的音频信号进行分帧处理;
获取分帧后各帧中包含的音频信号的最大幅值及最小幅值;
针对分帧后的每一帧,确定在该帧中获取的最大幅值的绝对值与在该帧中获取的最小幅值的绝对值之差,并针对各帧分别确定的差值求平均值;
确定分别由在每一帧获取的最大幅值构成的最大幅值序列,和分别由在每一帧获取的最小幅值构成的最小幅值序列的相关系数;
确定所述待检测音频信号存在幅值不对称失真或者存在低频噪声失真,包括:
根据所述第二绝对值、所述平均值和所述相关系数,确定所述待检测音频信号具体存在幅值不对称失真或是存在低频噪声失真。
3.如权利要求2所述的方法,其特征在于,根据所述第二绝对值、平均值及相关系数,确定所述待检测音频信号具体存在幅值不对称失真或是存在低频噪声失真,包括:
若所述第二绝对值大于第一阈值、或者所述第二绝对值不大于第一阈值且所述平均值不小于第二阈值、或者所述第二绝对值不大于第一阈值且所述相关系数不大于第三阈值,则确定所述待检测音频信号存在幅值不对称失真;
若所述第二绝对值不大于第一阈值、且所述平均值小于第二阈值且所述相关系数大于第三阈值,则确定所述待检测音频信号存在低频噪声失真。
4.如权利要求1~3任一所述的方法,其特征在于,获取待检测音频信号的幅值的均值的第一绝对值之前,还包括:
获取音频信号文件;
确定播放所述音频信号文件所占用的时长大于预定的时间长度时,将所述音频信号文件进行分段处理,得到各段音频信号分别作为待检测音频信号。
5.如权利要求4所述的方法,其特征在于,所述方法还包括:
若所述第一绝对值不大于第一阈值,确定所述待检测音频信号不存在幅值不对称失真且不存在低频噪声失真。
6.如权利要求5所述的方法,其特征在于,所述方法还包括:
针对每一段待检测音频信号,分别执行:
若确定该待检测音频信号存在幅值不对称失真时,为该待检测音频信号标记用于表示幅值不对称失真的第一常数;
若确定该待检测音频信号存在低频噪声失真时,为该待检测音频信号标记用于表示低频噪声失真的第二常数;
若确定该待检测音频信号不存在幅值不对称失真且不存在低频噪声失真时,为该待检测音频信号标记用于表示不存在幅值不对称失真且不存在低频噪声失真的第三常数。
7.如权利要求6所述的方法,其特征在于,所述方法还包括:
针对获取的音频信号文件分段得到的各段待检测音频信号,确定为各段待检测音频信号分别标记的常数值的平均值;
若确定的平均值大于第一标记阈值,则确定所述音频信号文件存在幅值不对称失真;
若确定的平均值小于第二标记阈值,则确定所述音频信号文件不存在幅值不对称失真且不存在低频噪声失真;
若确定的平均值不小于第二标记阈值且不大于第一标记阈值,则确定所述音频信号文件存在低频噪声失真;
其中,所述第二标记阈值小于第一标记阈值。
8.一种音频信号失真的检测装置,其特征在于,包括:
获取模块,用于获取待检测音频信号的幅值的均值的第一绝对值;
失真确定模块,用于判断出所述获取模块获取的第一绝对值大于第一阈值时,确定所述待检测音频信号存在幅值不对称失真或者存在低频噪声失真。
9.如权利要求8所述的装置,其特征在于,所述装置还包括:
处理模块,用于在所述获取模块获取待检测音频信号的幅值的均值的第一绝对值后,对所述待检测音频信号进行低频噪声滤除;获取滤除低频噪声后的音频信号的幅值的均值的第二绝对值;按照预定的帧长将经过滤除低频噪声后的音频信号进行分帧处理,获取分帧后各帧中包含的音频信号的最大幅值及最小幅值,针对分帧后的每一帧,确定在该帧中获取的最大幅值的绝对值与在该帧中获取的最小幅值的绝对值之差,并针对各帧分别确定的差值求平均值;及确定分别由在每一帧获取的最大幅值构成的最大幅值序列,和分别由在每一帧获取的最小幅值构成的最小幅值序列的相关系数;
所述失真确定模块,具体用于根据所述第二绝对值、所述平均值及所述相关系数,确定所述待检测音频信号具体存在幅值不对称失真或是存在低频噪声失真。
10.如权利要求9所述的装置,其特征在于,所述失真确定模块具体用于:
判断出所述第二绝对值大于第一阈值、或者所述第二绝对值不大于第一阈值且所述平均值不小于第二阈值、或者所述第二绝对值不大于第一阈值且所述相关系数不大于第三阈值时,确定所述待检测音频信号存在幅值不对称失真;
判断出所述第二绝对值不大于第一阈值、且所述平均值小于第二阈值且所述相关系数大于第三阈值时,确定所述待检测音频信号存在低频噪声失真。
11.如权利要求9~10任一项所述的装置,其特征在于,所述获取模块,还用于获取音频信号文件;
所述处理模块,还用于确定播放所述音频信号文件所占用的时长大于预定的时间长度时,将所述音频信号文件进行分段处理,得到各段音频信号分别作为待检测音频信号。
12.如权利要求11所述的装置,其特征在于,所述失真确定模块,还用于在判断出所述获取模块获取的第一绝对值不大于第一阈值时,确定所述待检测音频信号不存在幅值不对称失真且不存在低频噪声失真。
13.如权利要求12所述的装置,其特征在于,所述处理模块还用于:
针对每一段待检测音频信号,分别执行:
若确定该待检测音频信号存在幅值不对称失真时,为该待检测音频信号标记用于表示幅值不对称失真的第一常数;
若确定该待检测音频信号存在低频噪声失真时,为该待检测音频信号标记用于表示低频噪声失真的第二常数;
若确定该待检测音频信号不存在幅值不对称失真且不存在低频噪声失真时,为该待检测音频信号标记用于表示不存在幅值不对称失真且不存在低频噪声失真的第三常数。
14.如权利要求13所述的装置,其特征在于,所述失真确定模块还用于:
针对获取的音频信号文件分段得到的各段待检测音频信号,确定所述处理模块为各段待检测音频信号分别标记的常数值的平均值;
若确定的平均值大于第一标记阈值,则确定所述音频信号文件存在幅值不对称失真;
若确定的平均值小于第二标记阈值,则确定所述音频信号文件不存在幅值不对称失真且不存在低频噪声失真;
若确定的平均值不小于第二标记阈值且不大于第一标记阈值,则确定所述音频信号文件存在低频噪声失真;
其中,所述第二标记阈值小于第一标记阈值。
CN201410385151.3A 2014-08-06 2014-08-06 一种音频失真的检测方法及装置 Active CN104167209B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410385151.3A CN104167209B (zh) 2014-08-06 2014-08-06 一种音频失真的检测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410385151.3A CN104167209B (zh) 2014-08-06 2014-08-06 一种音频失真的检测方法及装置

Publications (2)

Publication Number Publication Date
CN104167209A CN104167209A (zh) 2014-11-26
CN104167209B true CN104167209B (zh) 2017-06-13

Family

ID=51910990

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410385151.3A Active CN104167209B (zh) 2014-08-06 2014-08-06 一种音频失真的检测方法及装置

Country Status (1)

Country Link
CN (1) CN104167209B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105118520B (zh) 2015-07-13 2017-11-10 腾讯科技(深圳)有限公司 一种音频开头爆音的消除方法及装置
CN105306685B (zh) * 2015-09-18 2019-03-01 维沃移动通信有限公司 信号质量的测试方法及移动终端
CN105931647B (zh) * 2016-04-05 2020-01-14 Oppo广东移动通信有限公司 噪声抑制的方法及装置
CN106782613B (zh) * 2016-12-22 2020-01-21 广州酷狗计算机科技有限公司 信号检测方法及装置
CN107452399B (zh) * 2017-09-18 2020-09-15 腾讯音乐娱乐科技(深圳)有限公司 音频特征提取方法及装置
CN109936797B (zh) * 2017-12-15 2024-07-30 深圳市三诺数字科技有限公司 基于人耳仿真结构的音频设备
CN108091352B (zh) * 2017-12-27 2020-10-13 腾讯音乐娱乐科技(深圳)有限公司 一种音频文件处理方法、装置、存储介质及终端设备
CN108389590B (zh) * 2018-02-06 2021-08-03 广东电网有限责任公司惠州供电局 一种时频联合的语音削顶检测方法
CN113132856B (zh) * 2021-03-30 2023-08-18 联想(北京)有限公司 一种音频信号处理方法、电子设备及存储介质
CN113287805A (zh) * 2021-05-27 2021-08-24 郑州大学 一种跌倒防护方法及可穿戴式跌倒防护装置

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2101458A (en) * 1981-06-15 1983-01-12 Israel Electronics Corp Squelch circuitry for receivers
US5586126A (en) * 1993-12-30 1996-12-17 Yoder; John Sample amplitude error detection and correction apparatus and method for use with a low information content signal
CN1675710A (zh) * 2002-08-19 2005-09-28 皇家飞利浦电子股份有限公司 扫描信号中的异常检测
CN101403636A (zh) * 2008-10-21 2009-04-08 杭州电子科技大学 基于音频特征识别的江河涌潮检测方法
CN101902677A (zh) * 2010-06-23 2010-12-01 中兴通讯股份有限公司 音频检测装置及方法
CN102103855A (zh) * 2009-12-16 2011-06-22 北京中星微电子有限公司 一种检测音频片段的方法及装置
EP2355543A2 (en) * 2010-01-28 2011-08-10 Harris Corporation Method to maximize loudspeaker sound pressure level with a high peak to average power ratio audio source
CN102368384A (zh) * 2011-10-19 2012-03-07 福建联迪商用设备有限公司 一种语音模块测试方法及语音模块测试设备
CN102393986A (zh) * 2011-08-11 2012-03-28 重庆市科学技术研究院 基于音频判别的盗伐检测方法、装置及系统
CN102419977A (zh) * 2011-01-14 2012-04-18 展讯通信(上海)有限公司 瞬态音频信号的判别方法
CN102568470A (zh) * 2012-01-11 2012-07-11 广州酷狗计算机科技有限公司 一种音频文件音质识别方法及其系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2873751B1 (fr) * 2004-07-28 2006-09-29 Snecma Moteurs Sa Cone d'entree d'une turbomachine

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2101458A (en) * 1981-06-15 1983-01-12 Israel Electronics Corp Squelch circuitry for receivers
US5586126A (en) * 1993-12-30 1996-12-17 Yoder; John Sample amplitude error detection and correction apparatus and method for use with a low information content signal
CN1675710A (zh) * 2002-08-19 2005-09-28 皇家飞利浦电子股份有限公司 扫描信号中的异常检测
CN101403636A (zh) * 2008-10-21 2009-04-08 杭州电子科技大学 基于音频特征识别的江河涌潮检测方法
CN102103855A (zh) * 2009-12-16 2011-06-22 北京中星微电子有限公司 一种检测音频片段的方法及装置
EP2355543A2 (en) * 2010-01-28 2011-08-10 Harris Corporation Method to maximize loudspeaker sound pressure level with a high peak to average power ratio audio source
CN101902677A (zh) * 2010-06-23 2010-12-01 中兴通讯股份有限公司 音频检测装置及方法
CN102419977A (zh) * 2011-01-14 2012-04-18 展讯通信(上海)有限公司 瞬态音频信号的判别方法
CN102393986A (zh) * 2011-08-11 2012-03-28 重庆市科学技术研究院 基于音频判别的盗伐检测方法、装置及系统
CN102368384A (zh) * 2011-10-19 2012-03-07 福建联迪商用设备有限公司 一种语音模块测试方法及语音模块测试设备
CN102568470A (zh) * 2012-01-11 2012-07-11 广州酷狗计算机科技有限公司 一种音频文件音质识别方法及其系统

Also Published As

Publication number Publication date
CN104167209A (zh) 2014-11-26

Similar Documents

Publication Publication Date Title
CN104167209B (zh) 一种音频失真的检测方法及装置
CN104810025B (zh) 音频相似度检测方法及装置
CN103578468B (zh) 一种语音识别中置信度阈值的调整方法及电子设备
CN1877517A (zh) 用于减少风噪声的音频数据处理装置和方法
CN103700386B (zh) 一种信息处理方法及电子设备
CN109545242A (zh) 一种音频数据处理方法、系统、装置及可读存储介质
CN104410973B (zh) 一种播放录音的诈骗电话识别方法和系统
CN104053120A (zh) 一种立体声音频的处理方法和装置
CN104916292B (zh) 检测音频信号的方法和装置
CN105659631B (zh) 音场测量装置和音场测量方法
CN110728996A (zh) 一种实时语音质检方法、装置、设备及计算机存储介质
CN106356077A (zh) 一种笑声检测方法及装置
CN108021635A (zh) 一种音频相似度的确定方法、装置和存储介质
CN105280196A (zh) 副歌检测方法及系统
CN106531195A (zh) 一种对话冲突检测方法及装置
CN110853677B (zh) 歌曲的鼓声节拍识别方法、装置、终端和非临时性计算机可读存储介质
CN105573104A (zh) 基于改进emd的手表检测降噪方法
CN105227763B (zh) 一种在智能移动设备上实现的乐器音频实时分割方法
CN110324657A (zh) 模型生成、视频处理方法、装置、电子设备及存储介质
EP2328143B1 (en) Human voice distinguishing method and device
CN107799124A (zh) 一种应用于智能语音鼠标的vad检测方法
CN110995914A (zh) 一种双麦克测试方法及装置
CN106371988A (zh) 一种自动化测试界面的方法和装置
CN110060703A (zh) 一种检测并定位语音片段内的平滑处理的方法
CN107027067A (zh) 获取mv视频资源中字幕信息的方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant