CN104200815B - 一种基于相关分析的音频噪声实时检测方法 - Google Patents

一种基于相关分析的音频噪声实时检测方法 Download PDF

Info

Publication number
CN104200815B
CN104200815B CN201410338912.XA CN201410338912A CN104200815B CN 104200815 B CN104200815 B CN 104200815B CN 201410338912 A CN201410338912 A CN 201410338912A CN 104200815 B CN104200815 B CN 104200815B
Authority
CN
China
Prior art keywords
audio
frame
noise
audio frame
correlation analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201410338912.XA
Other languages
English (en)
Other versions
CN104200815A (zh
Inventor
甘涛
何艳敏
黄晓革
兰刚
周南
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN201410338912.XA priority Critical patent/CN104200815B/zh
Publication of CN104200815A publication Critical patent/CN104200815A/zh
Application granted granted Critical
Publication of CN104200815B publication Critical patent/CN104200815B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Monitoring And Testing Of Transmission In General (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)

Abstract

本发明提供一种基于相关分析的音频噪声实时检测方法,用于对音频流进行实时噪声检测,首先接收音频帧,并采用帧计数器对接收到的音频帧进行循环计数;每当帧计数器计数到达Nf后,进行削弱信号成分、相关性分析和噪声判定,同时将帧计数器置零。本发明适用于检测音频中各种类型的噪声,如白噪声、粉红噪声、高频信道噪声等,当信号和噪声同时存在时,也能够检测出信号被噪声所覆盖而导致音频内容模糊不清,无法正常收听的情况;同时,该检测方法算法简单、处理快速,能够广泛应用于音频信号的实时监测,如广播、电视信号监测。

Description

一种基于相关分析的音频噪声实时检测方法
技术领域
本发明属于数字音频处理技术领域,具体地说是一种基于相关分析的音频噪声检测方法,该方法可应用于对音频信号进行自动实时监测。
背景技术
当前,音频广播已成为最为普及的大众宣传和娱乐媒体。由于广播系统本身的复杂性,以及在发射、传输和接收各环节会受到外界因素的影响,广播中时常会出现播出异常或故障。因此,正常安全的播出一直以来都是广播电台业务的一个基本目标,而达到该目标的一个重要手段就是对播出音频的质量进行有效的监控。目前国内电台广播监控已由传统的人工方式过渡到了计算机辅助完成,并初步实现了一些简单异常事件的监测自动化。
在音频质量监测中,噪声检测是一个重要内容,即检测当前播出的音频是否被噪声覆盖或已完全是噪声。与其他电平、相位等信号参数的检测相比,噪声检测更为直接地指示出当前音频是否有异常。一旦检测出是噪声,可以进行及时的报警和排查故障,避免重大播出事故的发生。
目前,在音频噪声相关的报道中,以音频去噪或增强的研究居多。音频去噪或增强以提高信号-噪声比为目标,往往着眼于尽可能地提取信号而抑制噪声,故这类方法一般不能直接用于噪声检测。另外,文献中也报道了对音频及噪声分类识别的研究。分类识别方法一般先提取音频特征,如过零率、音高、梅尔频率倒谱系数(MFCC),线性预测编码(LPC)等,用音频特征去训练一定的数学模型,如高斯混合模型(GMM)、隐马尔科夫(HMM)模型、神经网络(NN)模型等,最后用分类器,如K最邻近结点算法(KNN)和支持向量机(SVM)等进行分类。这些方法一般只针对白噪声,且复杂度比较高。事实上,广播音频噪声涉及的种类很广,除了白噪声外,还有受环境因素影响而出现的各类噪声,如粉红噪声、高频信道噪声等;噪声也不一定单独存在,它可能与信号混合在一起且将信号覆盖,导致音频内容模糊不清,无法正常收听。另外,广播监测应用还有实时性的要求。基于这些考虑,至今文献中尚未见适合于广播电台应用的音频噪声实时检测方法的报道。
发明内容
本发明的目的在于针对背景技术存在的问题,提供一种对音频流的噪声检测方法,本发明的技术方案是:一种基于相关分析的音频噪声实时检测方法,包括如下步骤:
S1.接收音频帧:
S11.接收一帧音频帧,将其样本数据排列成一列矢量;设定初始值为0的帧计数器,每接收一音频帧,帧计数器加1;
S12.计算当前音频帧的帧能量,即计算帧内各音频样本值的平方和。若帧能量小于设定的静音门限,则将该帧各样本值设置为0;否则将各样本值减去样本均值,并对减去均值后的数据作归一化处理;
S13.将处理后的帧数据保存在数据矩阵A中,设A=[a1,a2,a3,…],其中A的每一列ai表示第i帧的数据;
S2.若帧计数器的当前计数值小于Nf(Nf为1秒内音频帧总帧数),则转到步骤S1,接收处理下一音频帧;否则转到步骤S3,同时将帧计数器置零;
S3.削弱信号成分:
S31.对A进行奇异值分解如下:
A=UΣVT (1)
其中U和V分别为左、右奇异向量矩阵,Σ=diag(λ123,…,λn)为对角矩阵,其对角元素λi为的A奇异值,设奇异值从上到下按大小降序排列,即λ1≥λ2≥λ3≥…≥λn
S32.对矩阵Σ,扫描其从λn到λ2的n-1个对角元素,计算每个对角元素与其前一个元素的递减量,若递减量大于1,则提前结束扫描;
S33.扫描结束后,将Σ的对角元素中没有被扫描到的所有元素设置为0;
S34.将Σ带入公式(1)对A进行更新;
S4.相关性分析:
S41.对A中的每个列向量作归一化处理;
S42.从A的第1列到第Nf-1列,计算每一列与其后一列矢量的内积pi(i=1,2,3,…Nf-1);
S43.计算pi的绝对值扫描每个则设置 的最大值;将最终的作为音频帧的相关量保存下来为后续的噪声判定使用;
S5.噪声判定:
设进行判定的音频帧数目为M,M≥Nf,计算当前音频帧及其前M-1帧所对应的相关量的均值和方差;若相关量的均值小于设定的阈值Tmean(0.12≤Tmean≤0.15)且方差小于Tmean的平方,则判定当前信号为噪声,否则为非噪声;
本发明的有益效果:本发明提供一种音频噪声实时检测方法,适用于检测音频中各种类型的噪声,如白噪声、粉红噪声、高频信道噪声等,当信号和噪声同时存在时,也能够检测出信号被噪声所覆盖而导致音频内容模糊不清,无法正常收听的情况;同时,该检测方法算法简单、处理快速,能够广泛应用于音频信号的实时监测,如广播、电视信号监测。
附图说明
图1为本发明方法的流程示意图。
图2为本发明实施例测试音频时域波形图。
图3为本发明实施例中第11~12秒内音频帧相关量分布图。
图4为本发明实施例中各次噪声判定的音频帧相关量均值和方差分布图。
具体实施方式
本实施例以一段实际广播的“天气预报”音频作为输入。该音频段的采样率为48KHz,时间长度为20秒,该段音频包含正常音频和3种不同的噪声,其中前5秒为无广播信号时的白噪声,从第6秒开始为人声加背景音乐的正常音频,持续5秒后,在第11秒受到环境干扰,音频中产生很强的干扰噪声,使得人声内容变得模糊不清,无法正常收听。干扰噪声一直持续到音频段结束,并在第17秒时发生了变化。整个测试音频的时域波形图如图2所示。将音频数据按512个采样点的长度等分为各音频帧,其总帧数为1875帧,下面以第1125帧为例进行说明,在第1124帧处理结束时,帧计数器的计数值为93;对该音频帧进行噪声检测的具体步骤如下:
S1.接收音频帧:
S11.接收第1125帧音频,将其每个样本值转化为0~1间的浮点数(即除以32768)后排列成一列矢量y=(0.1552,0.2177,-0.1027,…,-0.1453)T;帧计数器加1,即计数值由93增至94;
S12.计算y各元素的平方和,得到当前音频帧的能量为16.1403。由于帧能量大于设定的静音门限0.25,将各样本值减去样本均值0.0083,并对减去均值后的数据作归一化处理,得到a94=(0.0366,0.0522,-0.0277,…,-0.0383)T
S13.将a94加入到数据矩阵A中;
S2.判断累计帧数:由于帧计数器的当前计数值94等于1秒时间内的总帧数,则转到步骤S3,同时将帧计数器置零;
S3.削弱信号成分:
S31.对A进行奇异值分解如下:
A=UΣVT (1)
其中U和V分别为左、右奇异向量矩阵,Σ=diag(1.7917,1.6269,1.5953,…,0.4298)为对角矩阵,其对角元素为的A奇异值;
S32.对矩阵Σ,扫描其从最后一个元素0.4298到第二个元素1.6269的93个对角元素,计算每个对角元素相对于其前一个元素的递减量,由于递减量都不大于1,则扫描到第二个元素结束;
S33.将Σ的对角元素中没有被扫描到的第一个元素设置为0;
S34.将改变后的Σ带入公式(1)对A进行更新。
S4.相关性分析:
S41.对A中的每个列向量作归一化处理;
S42.从A的第1列到第93列,计算每一列与其后一列矢量的内积,得到内积p=(0.0552,0.0574,-0.0497,…,0.0076);
S43.计算p的绝对值pa=(0.0552,0.0574,0.0497,…,0.0076),由于pa元素都不为0,则直接将其作为音频帧的相关量保存下来为后续的噪声判定使用;
S5.噪声判定:
S51.设定参与噪声判定的音频帧数目M为2秒时间内的音频总帧数188;图3显示了参与噪声判定的188帧音频帧(从第938帧到当前第1125帧)所对应的相关量分布图,计算得到这188帧音频帧所对应的相关量的均值为0.06和方差为0.0024;
S52.阈值Tmean设定为0.14,由于相关量的均值小于Tmean且方差小于Tmean的平方,则判定当前信号为噪声;
图4显示了整个检测过程中,各次噪声判定计算出的相关量的均值和方差分布图,图中用虚线标出了相应的阈值。表1给出了对实施例音频的检测结果。可见,检测结果是符合实际情况的。
表1 实施例音频的检测结果
时间段 检测结果
1至5秒 噪声
6至10秒 非噪声
11至20秒 噪声
下面对本发明方法的运行速度进行评估。测试的仿真程序是由MATLAB编写的,测试机器为Intel(R)i3处理器,主频为2.53GHz,内存为3GB。对1秒的音频数据,仿真程序平均用0.08秒完成检测,其处理的实时速度比(音频总时间/处理时间)达12.5倍,因而程序能够对不断输入的音频流实时地进行检测;另外本次测试仿真程序采用MATLAB编写,如将程序改用C语言编写,其处理速度还能进一步提高,综上,本发明方法完全能够满足实时应用的需求。

Claims (2)

1.一种基于相关分析的音频噪声实时检测方法,包括以下步骤:
S1.接收音频帧:
S11.接收一帧音频帧,将其样本数据排列成一列矢量;设定初始值为0的帧计数器,每接收一音频帧,帧计数器加1;
S12.计算当前音频帧的帧能量,若帧能量小于设定的静音门限,则将该帧各样本值设置为0;否则将各样本值减去样本均值,并对减去均值后的数据作归一化处理;
S13.将处理后的帧数据保存在数据矩阵A中,设A=[a1,a2,a3,…],其中A的每一列ai表示第i帧的数据;
S2.若帧计数器的当前计数值小于Nf,Nf为1秒内音频帧总帧数,则转到步骤S1,接收处理下一音频帧;否则转到步骤S3,同时将帧计数器置零;
S3.削弱信号成分:
S31.对A进行奇异值分解如下:
A=UΣVT (1)
其中U和V分别为左、右奇异向量矩阵,Σ=diag(λ123,…,λn)为对角矩阵,其对角元素λi为的A奇异值,设奇异值从上到下按大小降序排列,即λ1≥λ2≥λ3≥…≥λn
S32.对矩阵Σ,扫描其从λn到λ2的n-1个对角元素,计算每个对角元素与其前一个元素的递减量,若递减量大于1,则提前结束扫描;
S33.扫描结束后,将Σ的对角元素中没有被扫描到的所有元素设置为0;
S34.将Σ带入公式(1)对A进行更新;
S4.相关性分析:
S41.对A中的每个列向量作归一化处理;
S42.从A的第1列到第Nf-1列,计算每一列与其后一列矢量的内积pi(i=1,2,3,…Nf-1);
S43.计算pi的绝对值扫描每个则设置 的最大值;将最终的作为音频帧的相关量保存下来为后续的噪声判定使用;
S5.噪声判定:
设进行判定的音频帧数目为M,M≥Nf,计算当前音频帧及其前M-1帧所对应的相关量的均值和方差;若相关量的均值小于设定的阈值Tmean且方差小于Tmean的平方,则判定当前信号为噪声,否则为非噪声。
2.按权利要求1所述一种基于相关分析的音频噪声实时检测方法,其特征在于,所述步骤S5噪声判定的阈值Tmean的设定范围为0.12≤Tmean≤0.15。
CN201410338912.XA 2014-07-16 2014-07-16 一种基于相关分析的音频噪声实时检测方法 Expired - Fee Related CN104200815B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410338912.XA CN104200815B (zh) 2014-07-16 2014-07-16 一种基于相关分析的音频噪声实时检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410338912.XA CN104200815B (zh) 2014-07-16 2014-07-16 一种基于相关分析的音频噪声实时检测方法

Publications (2)

Publication Number Publication Date
CN104200815A CN104200815A (zh) 2014-12-10
CN104200815B true CN104200815B (zh) 2017-06-16

Family

ID=52086096

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410338912.XA Expired - Fee Related CN104200815B (zh) 2014-07-16 2014-07-16 一种基于相关分析的音频噪声实时检测方法

Country Status (1)

Country Link
CN (1) CN104200815B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106531180B (zh) * 2016-12-10 2019-09-20 广州酷狗计算机科技有限公司 噪声检测方法及装置
CN107170466B (zh) * 2017-04-14 2020-12-29 中国科学院计算技术研究所 基于音频的拖地声检测方法
CN109410968B (zh) * 2018-11-15 2022-12-09 电子科技大学 一种高效的歌曲中人声起始位置检测方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5930749A (en) * 1996-02-02 1999-07-27 International Business Machines Corporation Monitoring, identification, and selection of audio signal poles with characteristic behaviors, for separation and synthesis of signal contributions
CN1789698A (zh) * 2004-12-14 2006-06-21 株式会社电装 用于内燃机的爆震判断设备
CN101477801A (zh) * 2009-01-22 2009-07-08 东华大学 一种检测和消除数字音频信号中脉冲噪声的方法
CN101877237A (zh) * 2009-04-13 2010-11-03 索尼公司 降噪装置和噪声确定方法
CN102194452A (zh) * 2011-04-14 2011-09-21 西安烽火电子科技有限责任公司 复杂背景噪声中的语音激活检测方法
CN102568469A (zh) * 2011-12-22 2012-07-11 清华大学 G.729a压缩语音流信息隐藏检测装置及检测方法
CN103854662A (zh) * 2014-03-04 2014-06-11 中国人民解放军总参谋部第六十三研究所 基于多域联合估计的自适应语音检测方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5930749A (en) * 1996-02-02 1999-07-27 International Business Machines Corporation Monitoring, identification, and selection of audio signal poles with characteristic behaviors, for separation and synthesis of signal contributions
CN1789698A (zh) * 2004-12-14 2006-06-21 株式会社电装 用于内燃机的爆震判断设备
CN101477801A (zh) * 2009-01-22 2009-07-08 东华大学 一种检测和消除数字音频信号中脉冲噪声的方法
CN101877237A (zh) * 2009-04-13 2010-11-03 索尼公司 降噪装置和噪声确定方法
CN102194452A (zh) * 2011-04-14 2011-09-21 西安烽火电子科技有限责任公司 复杂背景噪声中的语音激活检测方法
CN102568469A (zh) * 2011-12-22 2012-07-11 清华大学 G.729a压缩语音流信息隐藏检测装置及检测方法
CN103854662A (zh) * 2014-03-04 2014-06-11 中国人民解放军总参谋部第六十三研究所 基于多域联合估计的自适应语音检测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"奇异值相减消噪算法";杨乾堂等;《计算机工程与应用·全国第三届信号和智能信息处理与应用学术交流会专刊》;20091101;第4-5页第2.1节.奇异值分解的基本知识 *
"音频监测系统的设计与实现";曹毅;《中国优秀硕士学位论文全文数据库 信息科技辑》;20100923;全文 *

Also Published As

Publication number Publication date
CN104200815A (zh) 2014-12-10

Similar Documents

Publication Publication Date Title
CN107393542B (zh) 一种基于双通道神经网络的鸟类物种识别方法
CN109034046B (zh) 一种基于声学检测的电能表内异物自动识别方法
CN105261359B (zh) 手机麦克风的消噪系统和消噪方法
CN103413547B (zh) 一种室内混响消除的方法
CN104464722B (zh) 基于时域和频域的语音活性检测方法和设备
CN104157295A (zh) 用于检测及抑制瞬态噪声的方法
CN110265065B (zh) 一种构建语音端点检测模型的方法及语音端点检测系统
CN109409308A (zh) 一种基于鸟类鸣声的鸟类物种识别的方法
CN104658543A (zh) 一种室内混响消除的方法
CN104200815B (zh) 一种基于相关分析的音频噪声实时检测方法
CN112329914B (zh) 地埋式变电站的故障诊断方法、装置及电子设备
Roch et al. Compensating for the effects of site and equipment variation on delphinid species identification from their echolocation clicks
KR101250668B1 (ko) Gmm을 이용한 응급 단어 인식 방법
Yousefi et al. Assessing speaker engagement in 2-person debates: Overlap detection in United States Presidential debates.
CN109997186B (zh) 一种用于分类声环境的设备和方法
CN112394324A (zh) 一种基于麦克风阵列的远距离声源定位的方法及系统
Wang et al. Pseudo-determined blind source separation for ad-hoc microphone networks
CN105352541B (zh) 一种基于电网防灾减灾系统的变压器运行辅助监测系统及其监测方法
CN110689905B (zh) 一种用于视频会议系统的语音活动检测系统
CN104200812B (zh) 一种基于稀疏分解的音频噪声实时检测方法
CN113345443A (zh) 基于梅尔频率倒谱系数的海洋哺乳动物发声检测识别方法
Lin et al. A composite objective measure on subjective evaluation of speech enhancement algorithms
Krijnders et al. Tone-fit and MFCC scene classification compared to human recognition
CN114093385A (zh) 一种无人机检测方法及装置
Takahashi et al. On non-reference speech intelligibility estimation using DNN noise reduction

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170616

Termination date: 20200716

CF01 Termination of patent right due to non-payment of annual fee