CN102820035A - 一种对长时变噪声的自适应判决方法 - Google Patents

一种对长时变噪声的自适应判决方法 Download PDF

Info

Publication number
CN102820035A
CN102820035A CN2012103040054A CN201210304005A CN102820035A CN 102820035 A CN102820035 A CN 102820035A CN 2012103040054 A CN2012103040054 A CN 2012103040054A CN 201210304005 A CN201210304005 A CN 201210304005A CN 102820035 A CN102820035 A CN 102820035A
Authority
CN
China
Prior art keywords
frame
noise
self
threshold value
long
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012103040054A
Other languages
English (en)
Inventor
郑朝晖
黄河清
周蕾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
WUXI SIDAWU ELECTRONIC TECHNOLOGY Co Ltd
Original Assignee
WUXI SIDAWU ELECTRONIC TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by WUXI SIDAWU ELECTRONIC TECHNOLOGY Co Ltd filed Critical WUXI SIDAWU ELECTRONIC TECHNOLOGY Co Ltd
Priority to CN2012103040054A priority Critical patent/CN102820035A/zh
Publication of CN102820035A publication Critical patent/CN102820035A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Noise Elimination (AREA)

Abstract

本发明提供一种对长时变噪声的自适应判决方法。该方法利用初始化语音帧计算噪声帧参数集合的特征值与阈值判据,对后续待判决帧的各参数矢量进行计算后对阈值进行比较判决,得出该帧是否为噪声帧,并在反馈环中利用滑动因子对特征值与判决阈值进行自适应更新,构建出高效、稳定的处理模型与算法。

Description

一种对长时变噪声的自适应判决方法
技术领域
本发明涉及语音处理技术,特别涉及一种对具有长时变特性的带噪语音的自适应判决方法。
背景技术
目前的许多语音处理应用中需要对背景噪声做出估计,这种估计必须建立在对输入信号是否为噪声的判决基础上,该判决的准确程度在很大程度上影响着语音处理应用的效果。对噪声判决的普遍方法是采用一种经验性的固定特征值及固定阈值,或采用噪声特征值对阈值进行更新,这些方法都会导致无法适应噪声缓变情况而导致长时间运行后的判决失效。
噪声的平稳性与时间密切相关,短时间内平稳的噪声在较长的时间区间来观察具有时变特性,常用的经验阈值判决算法无法解决噪声的时变特性。另一方面,利用语音激活检测算法中的语音能量、短时平均过零率、自相关性、LPC谱包络进行多判断准则的互相校验与依赖判决,算法复杂而低效。
发明内容
针对现有噪声判决方法的上述缺陷,申请人经过研究改进,提供一种对长时变噪声的自适应判决方法,为具有长时变特性的带噪语音提供了一种自适应、高效的判决机制。
本发明的技术方案如下:
一种对长时变噪声的自适应判决方法,包括以下步骤:
步骤1),选取噪声帧特征参数集合A的特征值C和阈值Cth
步骤2),对10ms带噪语音帧aj计算其特征值Cj
步骤3),计算Cj与C的差异值,并将其与阈值Cth比较做出判决;
步骤4),更新特征值C和阈值Cth
其进一步的技术方案为:所述步骤1)的具体实施步骤为:设定初始化帧数为INIT=128,对各带噪语音帧ai(i=1,2,.....INIT)分别做如下计算:
(1)做256点快速傅里叶FFT变换,得到频域幅度Ai
Ai=∑|Ai(K)|exp(j2πk/N),k=0,1,....,(N/2)-1;
(2)均匀划分为M个子带,计算每个子带的能量:
Bi(s)=∑|Ai(k)|,k=fL(s),....,fH(s),s=0,1,....,M-1;
其中,fL(s)和fH(s)分别为第s个子带的下界和上界,M=32;
定义特征参数集合A={Bi(s)},s=0,1,....,M-1,
定义矢量距离d(Bi,Bj)=∑20I(1g10(Bi(s)/Bj(s))),其中
I(x)=x if(x>0),I(x)=0 if(x<=0),为半波整流;
(3)计算特征值C及阈值Cth
C=E(c),为INIT个初始化帧子带能量矢量Bi的数学期望;
Cth=E(d[Bi,E(c)]),i=1,2,....,INIT,为各初始化帧和特征期望之间偏差的统计平均值。
其进一步的技术方案为:所述步骤2)的具体实施步骤为:对10ms的带噪语音帧aj进行256点的傅里叶FFT变换后,由步骤1)中的Bi(s)计算式算出该待判决帧的子带能量矢量Bj(s);Cj=Bj(s)。
其进一步的技术方案为:所述步骤3)的具体实施步骤为:计算Cj与C的差异值d(cj,c)=d[Bj,E(c)],若d(cj,c)<Cth,则判决该帧为噪声帧。
其进一步的技术方案为:所述步骤4)的具体实施步骤为:若当前判决帧被判定为噪声帧,则采用滑动平均因子对特征值C进行修正:滑动因子
Figure BDA00002050151100022
在0.95至0.98之间取值;
阈值Cth的更新采用边缘检测更新方式,若当前帧的判决结果与上一帧的判决结果异或为真,则按下式更新修正:Cth=θCth+(1-θ)d(cj,c),边缘滑动因子θ在0.95至0.98之间取值。
本发明的有益技术效果是:
本发明对带噪语音构建动态反馈、自适应更新的特征值和判决阈值,从而对噪声帧作出高效、稳定的判决。通过提取一定长度的初始化帧,首先估算出各帧频域子带幅度能量构造特征值矢量的数学望期与判决阈值,然后计算待判决帧特征矢量距离并与判决阈值进行比较判决得出是否为噪声帧。利用快速傅里叶FFT变换,全部在频域完成所有计算与判决,计算量少、效率高,并利用边界滑动因子对特征值与判决阈值进行动态回归,实现长时间的自适应稳定判决输出。
本发明附加的方面和优点将在下面具体实施方式部分的描述中给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
图1是本发明的流程框图。
具体实施方式
下面结合附图对本发明的具体实施方式做进一步说明。
如图1所示,本发明的主要过程步骤包括:
步骤1),选取噪声帧特征参数集合A的特征值C和阈值Cth
步骤2),对10ms带噪语音帧aj计算其特征值Cj
步骤3),计算Cj与C的差异值,并将其与阈值Cth比较做出判决;
步骤4),更新特征值C和阈值Cth
步骤1)的具体实施步骤如下:
设定初始化帧数为INIT=128,对各带噪语音帧ai(i=1,2,.....INIT)分别做如下计算:
(1)做256点快速傅里叶FFT变换,得到频域幅度Ai
Ai=∑|Ai(K)|exp(j2πk/N),k=0,1,....,(N/2)-1。
(2)均匀划分为M个子带,计算每个子带的能量:
Bi(s)=∑|Ai(k)|,k=fL(s),....,fH(s),s=0,1,....,M-1;
其中,fL(s)和fH(s)分别是第s个子带的下界和上界,M=32;
定义特征参数集合A={Bi(s)},s=0,1,....,M-1,
定义矢量距离d(Bi,Bj)=∑20I(1g10(Bi(s)/Bj(s))),其中
I(x)=x if(x>0),I(x)=0 if(x<=0),为半波整流。
(3)计算特征值C及阈值Cth
C=E(c),是INIT个初始化帧子带能量矢量Bi的数学期望。
Cth=E(d[Bi,E(c)]),i=1,2,....,INIT是各初始化帧和特征期望之间偏差的统计平均值。
步骤2)的具体实施步骤如下:
对10ms的带噪语音帧aj进行256点的傅里叶FFT变换后,由步骤1)中的Bi(s)计算式算出该待判决帧的子带能量矢量Bj(s)。
Cj=Bj(s)
步骤3)的具体实施步骤如下:
计算Cj与C的差异值d(cj,c)=d[Bj,E(c)],如果d(cj,c)<Cth,则判决该帧为噪声帧。
步骤4)的具体实施步骤如下:
如果当前判决帧被判定为噪声帧,则采用滑动平均因子对特征值C进行修正,
Figure BDA00002050151100041
滑动因子
Figure BDA00002050151100042
可取值0.95至0.98之间。
阈值Cth的更新采用边缘检测更新方式,即当前帧的判决结果与上一帧的判决结果异或为真,则按下式更新修正:
Cth=θCth+(1-θ)d(cj,c),边缘滑动因子θ可在0.95至0.98间取值。
基于上述步骤,本发明利用语音短时变及噪声的短平稳特性,通过构造高效的计算模型与算法对带噪语音中的噪声帧做出高准确度判决,具有计算快捷、性能稳定的突出特点。
以上所述的仅是本发明的优选实施方式,本发明不限于以上实施例。可以理解,本领域技术人员在不脱离本发明的基本构思的前提下直接导出或联想到的其他改进和变化,均应认为包含在本发明的保护范围之内。

Claims (5)

1.一种对长时变噪声的自适应判决方法,其特征在于包括以下步骤:
步骤1),选取噪声帧特征参数集合A的特征值C和阈值Cth
步骤2),对10ms带噪语音帧aj计算其特征值Cj
步骤3),计算Cj与C的差异值,并将其与阈值Cth比较做出判决;
步骤4),更新特征值C和阈值Cth
2.根据权利要求1所述对长时变噪声的自适应判决方法,其特征在于:所述步骤1)的具体实施步骤为:设定初始化帧数为INIT=128,对各带噪语音帧ai(i=1,2,.....INIT)分别做如下计算:
(1)做256点快速傅里叶FFT变换,得到频域幅度Ai
Ai=∑|Ai(K)|exp(j2πk/N),k=0,1,....,(N/2)-1;
(2)均匀划分为M个子带,计算每个子带的能量:
Bi(s)=∑|Ai(k)|,k=fL(s),....,fH(s),s=0,1,....,M-1;
其中,fL(s)和fH(s)分别为第s个子带的下界和上界,M=32;
定义特征参数集合A={Bi(s)},s=0,1,....,M-1,
定义矢量距离d(Bi,Bj)=∑20I(1g10(Bi(s)/Bj(s))),其中
I(x)=x if(x>0),I(x)=0 if(x<=0),为半波整流;
(3)计算特征值C及阈值Cth
C=E(c),为INIT个初始化帧子带能量矢量Bi的数学期望;
Cth=E(d[Bi,E(c)]),i=1,2,....,INIT,为各初始化帧和特征期望之间偏差的统计平均值。
3.根据权利要求1所述对长时变噪声的自适应判决方法,其特征在于:所述步骤2)的具体实施步骤为:对10ms的带噪语音帧aj进行256点的傅里叶FFT变换后,由步骤1)中的Bi(s)计算式算出该待判决帧的子带能量矢量Bj(s);Cj=Bj(s)。
4.根据权利要求1所述对长时变噪声的自适应判决方法,其特征在于:所述步骤3)的具体实施步骤为:计算Cj与C的差异值d(cj,c)=d[Bj,E(c)],若d(cj,c)<Cth,则判决该帧为噪声帧。
5.根据权利要求1所述对长时变噪声的自适应判决方法,其特征在于:所述步骤4)的具体实施步骤为:若当前判决帧被判定为噪声帧,则采用滑动平均因子对特征值C进行修正:
Figure FDA00002050151000021
滑动因子
Figure FDA00002050151000022
在0.95至0.98之间取值;
阈值Cth的更新采用边缘检测更新方式,若当前帧的判决结果与上一帧的判决结果异或为真,则按下式更新修正:Cth=θCth+(1-θ)d(cj,c),边缘滑动因子θ在0.95至0.98之间取值。
CN2012103040054A 2012-08-23 2012-08-23 一种对长时变噪声的自适应判决方法 Pending CN102820035A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2012103040054A CN102820035A (zh) 2012-08-23 2012-08-23 一种对长时变噪声的自适应判决方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2012103040054A CN102820035A (zh) 2012-08-23 2012-08-23 一种对长时变噪声的自适应判决方法

Publications (1)

Publication Number Publication Date
CN102820035A true CN102820035A (zh) 2012-12-12

Family

ID=47304120

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012103040054A Pending CN102820035A (zh) 2012-08-23 2012-08-23 一种对长时变噪声的自适应判决方法

Country Status (1)

Country Link
CN (1) CN102820035A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103824563A (zh) * 2014-02-21 2014-05-28 深圳市微纳集成电路与系统应用研究院 一种基于模块复用的助听器去噪装置和方法
CN103971698A (zh) * 2013-01-25 2014-08-06 北京千橡网景科技发展有限公司 用于语音实时降噪的方法和设备
CN105723458A (zh) * 2013-09-12 2016-06-29 沙特阿拉伯石油公司 用于滤除噪声和还原声信号遭到衰减的高频分量的动态阈值方法、系统、计算机可读介质和程序代码
CN107359959A (zh) * 2016-05-09 2017-11-17 上海复旦微电子集团股份有限公司 数据帧的起始位置检测方法及接收机
CN110265058A (zh) * 2013-12-19 2019-09-20 瑞典爱立信有限公司 估计音频信号中的背景噪声
CN111739562A (zh) * 2020-07-22 2020-10-02 上海大学 一种基于数据选择性和高斯混合模型的语音活动检测方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1912993A (zh) * 2005-08-08 2007-02-14 中国科学院声学研究所 基于能量及谐波的语音端点检测方法
US20100094625A1 (en) * 2008-10-15 2010-04-15 Qualcomm Incorporated Methods and apparatus for noise estimation
CN101968957A (zh) * 2010-10-28 2011-02-09 哈尔滨工程大学 一种噪声条件下的语音检测方法
WO2011049514A1 (en) * 2009-10-19 2011-04-28 Telefonaktiebolaget Lm Ericsson (Publ) Method and background estimator for voice activity detection
CN102044242A (zh) * 2009-10-15 2011-05-04 华为技术有限公司 语音激活检测方法、装置和电子设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1912993A (zh) * 2005-08-08 2007-02-14 中国科学院声学研究所 基于能量及谐波的语音端点检测方法
US20100094625A1 (en) * 2008-10-15 2010-04-15 Qualcomm Incorporated Methods and apparatus for noise estimation
CN102044242A (zh) * 2009-10-15 2011-05-04 华为技术有限公司 语音激活检测方法、装置和电子设备
WO2011049514A1 (en) * 2009-10-19 2011-04-28 Telefonaktiebolaget Lm Ericsson (Publ) Method and background estimator for voice activity detection
CN101968957A (zh) * 2010-10-28 2011-02-09 哈尔滨工程大学 一种噪声条件下的语音检测方法

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103971698A (zh) * 2013-01-25 2014-08-06 北京千橡网景科技发展有限公司 用于语音实时降噪的方法和设备
CN103971698B (zh) * 2013-01-25 2019-01-11 北京千橡网景科技发展有限公司 用于语音实时降噪的方法和设备
CN105723458A (zh) * 2013-09-12 2016-06-29 沙特阿拉伯石油公司 用于滤除噪声和还原声信号遭到衰减的高频分量的动态阈值方法、系统、计算机可读介质和程序代码
CN105723458B (zh) * 2013-09-12 2019-09-24 沙特阿拉伯石油公司 用于滤除噪声和还原声信号遭到衰减的高频分量的动态阈值方法、系统、计算机可读介质
CN110265058A (zh) * 2013-12-19 2019-09-20 瑞典爱立信有限公司 估计音频信号中的背景噪声
CN110265058B (zh) * 2013-12-19 2023-01-17 瑞典爱立信有限公司 估计音频信号中的背景噪声
CN103824563A (zh) * 2014-02-21 2014-05-28 深圳市微纳集成电路与系统应用研究院 一种基于模块复用的助听器去噪装置和方法
CN107359959A (zh) * 2016-05-09 2017-11-17 上海复旦微电子集团股份有限公司 数据帧的起始位置检测方法及接收机
CN107359959B (zh) * 2016-05-09 2019-12-24 上海复旦微电子集团股份有限公司 数据帧的起始位置检测方法及接收机
CN111739562A (zh) * 2020-07-22 2020-10-02 上海大学 一种基于数据选择性和高斯混合模型的语音活动检测方法
CN111739562B (zh) * 2020-07-22 2022-12-23 上海大学 一种基于数据选择性和高斯混合模型的语音活动检测方法

Similar Documents

Publication Publication Date Title
CN107004409B (zh) 利用运行范围归一化的神经网络语音活动检测
CN102820035A (zh) 一种对长时变噪声的自适应判决方法
EP3172906B1 (en) Method and apparatus for wind noise detection
CN100543842C (zh) 基于多统计模型和最小均方误差实现背景噪声抑制的方法
US7383178B2 (en) System and method for speech processing using independent component analysis under stability constraints
CN102522081B (zh) 一种检测语音端点的方法及系统
US10127919B2 (en) Determining noise and sound power level differences between primary and reference channels
JP5678445B2 (ja) 音声処理装置、音声処理方法およびプログラム
CN106875938B (zh) 一种改进的非线性自适应语音端点检测方法
US20080059163A1 (en) Method and apparatus for noise suppression, smoothing a speech spectrum, extracting speech features, speech recognition and training a speech model
US11128954B2 (en) Method and electronic device for managing loudness of audio signal
US9520138B2 (en) Adaptive modulation filtering for spectral feature enhancement
US20130297306A1 (en) Adaptive Equalization System
WO2004075167A2 (en) Log-likelihood ratio method for detecting voice activity and apparatus
EP3660845B1 (en) Method for detecting audio signal and apparatus
CN110875049B (zh) 语音信号的处理方法及装置
US9583120B2 (en) Noise cancellation apparatus and method
CN101853665A (zh) 语音中噪声的消除方法
CN102982808A (zh) 基于小波变换的语音去噪装置及方法
CN103824563A (zh) 一种基于模块复用的助听器去噪装置和方法
CN107969164B (zh) 适应性信道间判别再缩放滤波器
KR20160116440A (ko) 음성인식 시스템의 신호대잡음비 추정 장치 및 방법
WO2017128910A1 (zh) 一种语音出现概率的确定方法、装置及电子设备
EP2660814A1 (en) Adaptive equalization system
KR20070061216A (ko) Gmm을 이용한 음질향상 시스템

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20121212