CN102820035A - 一种对长时变噪声的自适应判决方法 - Google Patents
一种对长时变噪声的自适应判决方法 Download PDFInfo
- Publication number
- CN102820035A CN102820035A CN2012103040054A CN201210304005A CN102820035A CN 102820035 A CN102820035 A CN 102820035A CN 2012103040054 A CN2012103040054 A CN 2012103040054A CN 201210304005 A CN201210304005 A CN 201210304005A CN 102820035 A CN102820035 A CN 102820035A
- Authority
- CN
- China
- Prior art keywords
- frame
- noise
- self
- threshold value
- long
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Noise Elimination (AREA)
Abstract
本发明提供一种对长时变噪声的自适应判决方法。该方法利用初始化语音帧计算噪声帧参数集合的特征值与阈值判据,对后续待判决帧的各参数矢量进行计算后对阈值进行比较判决,得出该帧是否为噪声帧,并在反馈环中利用滑动因子对特征值与判决阈值进行自适应更新,构建出高效、稳定的处理模型与算法。
Description
技术领域
本发明涉及语音处理技术,特别涉及一种对具有长时变特性的带噪语音的自适应判决方法。
背景技术
目前的许多语音处理应用中需要对背景噪声做出估计,这种估计必须建立在对输入信号是否为噪声的判决基础上,该判决的准确程度在很大程度上影响着语音处理应用的效果。对噪声判决的普遍方法是采用一种经验性的固定特征值及固定阈值,或采用噪声特征值对阈值进行更新,这些方法都会导致无法适应噪声缓变情况而导致长时间运行后的判决失效。
噪声的平稳性与时间密切相关,短时间内平稳的噪声在较长的时间区间来观察具有时变特性,常用的经验阈值判决算法无法解决噪声的时变特性。另一方面,利用语音激活检测算法中的语音能量、短时平均过零率、自相关性、LPC谱包络进行多判断准则的互相校验与依赖判决,算法复杂而低效。
发明内容
针对现有噪声判决方法的上述缺陷,申请人经过研究改进,提供一种对长时变噪声的自适应判决方法,为具有长时变特性的带噪语音提供了一种自适应、高效的判决机制。
本发明的技术方案如下:
一种对长时变噪声的自适应判决方法,包括以下步骤:
步骤1),选取噪声帧特征参数集合A的特征值C和阈值Cth;
步骤2),对10ms带噪语音帧aj计算其特征值Cj;
步骤3),计算Cj与C的差异值,并将其与阈值Cth比较做出判决;
步骤4),更新特征值C和阈值Cth。
其进一步的技术方案为:所述步骤1)的具体实施步骤为:设定初始化帧数为INIT=128,对各带噪语音帧ai(i=1,2,.....INIT)分别做如下计算:
(1)做256点快速傅里叶FFT变换,得到频域幅度Ai;
Ai=∑|Ai(K)|exp(j2πk/N),k=0,1,....,(N/2)-1;
(2)均匀划分为M个子带,计算每个子带的能量:
Bi(s)=∑|Ai(k)|,k=fL(s),....,fH(s),s=0,1,....,M-1;
其中,fL(s)和fH(s)分别为第s个子带的下界和上界,M=32;
定义特征参数集合A={Bi(s)},s=0,1,....,M-1,
定义矢量距离d(Bi,Bj)=∑20I(1g10(Bi(s)/Bj(s))),其中
I(x)=x if(x>0),I(x)=0 if(x<=0),为半波整流;
(3)计算特征值C及阈值Cth:
C=E(c),为INIT个初始化帧子带能量矢量Bi的数学期望;
Cth=E(d[Bi,E(c)]),i=1,2,....,INIT,为各初始化帧和特征期望之间偏差的统计平均值。
其进一步的技术方案为:所述步骤2)的具体实施步骤为:对10ms的带噪语音帧aj进行256点的傅里叶FFT变换后,由步骤1)中的Bi(s)计算式算出该待判决帧的子带能量矢量Bj(s);Cj=Bj(s)。
其进一步的技术方案为:所述步骤3)的具体实施步骤为:计算Cj与C的差异值d(cj,c)=d[Bj,E(c)],若d(cj,c)<Cth,则判决该帧为噪声帧。
阈值Cth的更新采用边缘检测更新方式,若当前帧的判决结果与上一帧的判决结果异或为真,则按下式更新修正:Cth=θCth+(1-θ)d(cj,c),边缘滑动因子θ在0.95至0.98之间取值。
本发明的有益技术效果是:
本发明对带噪语音构建动态反馈、自适应更新的特征值和判决阈值,从而对噪声帧作出高效、稳定的判决。通过提取一定长度的初始化帧,首先估算出各帧频域子带幅度能量构造特征值矢量的数学望期与判决阈值,然后计算待判决帧特征矢量距离并与判决阈值进行比较判决得出是否为噪声帧。利用快速傅里叶FFT变换,全部在频域完成所有计算与判决,计算量少、效率高,并利用边界滑动因子对特征值与判决阈值进行动态回归,实现长时间的自适应稳定判决输出。
本发明附加的方面和优点将在下面具体实施方式部分的描述中给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
图1是本发明的流程框图。
具体实施方式
下面结合附图对本发明的具体实施方式做进一步说明。
如图1所示,本发明的主要过程步骤包括:
步骤1),选取噪声帧特征参数集合A的特征值C和阈值Cth;
步骤2),对10ms带噪语音帧aj计算其特征值Cj;
步骤3),计算Cj与C的差异值,并将其与阈值Cth比较做出判决;
步骤4),更新特征值C和阈值Cth。
步骤1)的具体实施步骤如下:
设定初始化帧数为INIT=128,对各带噪语音帧ai(i=1,2,.....INIT)分别做如下计算:
(1)做256点快速傅里叶FFT变换,得到频域幅度Ai;
Ai=∑|Ai(K)|exp(j2πk/N),k=0,1,....,(N/2)-1。
(2)均匀划分为M个子带,计算每个子带的能量:
Bi(s)=∑|Ai(k)|,k=fL(s),....,fH(s),s=0,1,....,M-1;
其中,fL(s)和fH(s)分别是第s个子带的下界和上界,M=32;
定义特征参数集合A={Bi(s)},s=0,1,....,M-1,
定义矢量距离d(Bi,Bj)=∑20I(1g10(Bi(s)/Bj(s))),其中
I(x)=x if(x>0),I(x)=0 if(x<=0),为半波整流。
(3)计算特征值C及阈值Cth:
C=E(c),是INIT个初始化帧子带能量矢量Bi的数学期望。
Cth=E(d[Bi,E(c)]),i=1,2,....,INIT是各初始化帧和特征期望之间偏差的统计平均值。
步骤2)的具体实施步骤如下:
对10ms的带噪语音帧aj进行256点的傅里叶FFT变换后,由步骤1)中的Bi(s)计算式算出该待判决帧的子带能量矢量Bj(s)。
Cj=Bj(s)
步骤3)的具体实施步骤如下:
计算Cj与C的差异值d(cj,c)=d[Bj,E(c)],如果d(cj,c)<Cth,则判决该帧为噪声帧。
步骤4)的具体实施步骤如下:
如果当前判决帧被判定为噪声帧,则采用滑动平均因子对特征值C进行修正,
阈值Cth的更新采用边缘检测更新方式,即当前帧的判决结果与上一帧的判决结果异或为真,则按下式更新修正:
Cth=θCth+(1-θ)d(cj,c),边缘滑动因子θ可在0.95至0.98间取值。
基于上述步骤,本发明利用语音短时变及噪声的短平稳特性,通过构造高效的计算模型与算法对带噪语音中的噪声帧做出高准确度判决,具有计算快捷、性能稳定的突出特点。
以上所述的仅是本发明的优选实施方式,本发明不限于以上实施例。可以理解,本领域技术人员在不脱离本发明的基本构思的前提下直接导出或联想到的其他改进和变化,均应认为包含在本发明的保护范围之内。
Claims (5)
1.一种对长时变噪声的自适应判决方法,其特征在于包括以下步骤:
步骤1),选取噪声帧特征参数集合A的特征值C和阈值Cth;
步骤2),对10ms带噪语音帧aj计算其特征值Cj;
步骤3),计算Cj与C的差异值,并将其与阈值Cth比较做出判决;
步骤4),更新特征值C和阈值Cth。
2.根据权利要求1所述对长时变噪声的自适应判决方法,其特征在于:所述步骤1)的具体实施步骤为:设定初始化帧数为INIT=128,对各带噪语音帧ai(i=1,2,.....INIT)分别做如下计算:
(1)做256点快速傅里叶FFT变换,得到频域幅度Ai;
Ai=∑|Ai(K)|exp(j2πk/N),k=0,1,....,(N/2)-1;
(2)均匀划分为M个子带,计算每个子带的能量:
Bi(s)=∑|Ai(k)|,k=fL(s),....,fH(s),s=0,1,....,M-1;
其中,fL(s)和fH(s)分别为第s个子带的下界和上界,M=32;
定义特征参数集合A={Bi(s)},s=0,1,....,M-1,
定义矢量距离d(Bi,Bj)=∑20I(1g10(Bi(s)/Bj(s))),其中
I(x)=x if(x>0),I(x)=0 if(x<=0),为半波整流;
(3)计算特征值C及阈值Cth:
C=E(c),为INIT个初始化帧子带能量矢量Bi的数学期望;
Cth=E(d[Bi,E(c)]),i=1,2,....,INIT,为各初始化帧和特征期望之间偏差的统计平均值。
3.根据权利要求1所述对长时变噪声的自适应判决方法,其特征在于:所述步骤2)的具体实施步骤为:对10ms的带噪语音帧aj进行256点的傅里叶FFT变换后,由步骤1)中的Bi(s)计算式算出该待判决帧的子带能量矢量Bj(s);Cj=Bj(s)。
4.根据权利要求1所述对长时变噪声的自适应判决方法,其特征在于:所述步骤3)的具体实施步骤为:计算Cj与C的差异值d(cj,c)=d[Bj,E(c)],若d(cj,c)<Cth,则判决该帧为噪声帧。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2012103040054A CN102820035A (zh) | 2012-08-23 | 2012-08-23 | 一种对长时变噪声的自适应判决方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2012103040054A CN102820035A (zh) | 2012-08-23 | 2012-08-23 | 一种对长时变噪声的自适应判决方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102820035A true CN102820035A (zh) | 2012-12-12 |
Family
ID=47304120
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2012103040054A Pending CN102820035A (zh) | 2012-08-23 | 2012-08-23 | 一种对长时变噪声的自适应判决方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102820035A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103824563A (zh) * | 2014-02-21 | 2014-05-28 | 深圳市微纳集成电路与系统应用研究院 | 一种基于模块复用的助听器去噪装置和方法 |
CN103971698A (zh) * | 2013-01-25 | 2014-08-06 | 北京千橡网景科技发展有限公司 | 用于语音实时降噪的方法和设备 |
CN105723458A (zh) * | 2013-09-12 | 2016-06-29 | 沙特阿拉伯石油公司 | 用于滤除噪声和还原声信号遭到衰减的高频分量的动态阈值方法、系统、计算机可读介质和程序代码 |
CN107359959A (zh) * | 2016-05-09 | 2017-11-17 | 上海复旦微电子集团股份有限公司 | 数据帧的起始位置检测方法及接收机 |
CN110265058A (zh) * | 2013-12-19 | 2019-09-20 | 瑞典爱立信有限公司 | 估计音频信号中的背景噪声 |
CN111739562A (zh) * | 2020-07-22 | 2020-10-02 | 上海大学 | 一种基于数据选择性和高斯混合模型的语音活动检测方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1912993A (zh) * | 2005-08-08 | 2007-02-14 | 中国科学院声学研究所 | 基于能量及谐波的语音端点检测方法 |
US20100094625A1 (en) * | 2008-10-15 | 2010-04-15 | Qualcomm Incorporated | Methods and apparatus for noise estimation |
CN101968957A (zh) * | 2010-10-28 | 2011-02-09 | 哈尔滨工程大学 | 一种噪声条件下的语音检测方法 |
WO2011049514A1 (en) * | 2009-10-19 | 2011-04-28 | Telefonaktiebolaget Lm Ericsson (Publ) | Method and background estimator for voice activity detection |
CN102044242A (zh) * | 2009-10-15 | 2011-05-04 | 华为技术有限公司 | 语音激活检测方法、装置和电子设备 |
-
2012
- 2012-08-23 CN CN2012103040054A patent/CN102820035A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1912993A (zh) * | 2005-08-08 | 2007-02-14 | 中国科学院声学研究所 | 基于能量及谐波的语音端点检测方法 |
US20100094625A1 (en) * | 2008-10-15 | 2010-04-15 | Qualcomm Incorporated | Methods and apparatus for noise estimation |
CN102044242A (zh) * | 2009-10-15 | 2011-05-04 | 华为技术有限公司 | 语音激活检测方法、装置和电子设备 |
WO2011049514A1 (en) * | 2009-10-19 | 2011-04-28 | Telefonaktiebolaget Lm Ericsson (Publ) | Method and background estimator for voice activity detection |
CN101968957A (zh) * | 2010-10-28 | 2011-02-09 | 哈尔滨工程大学 | 一种噪声条件下的语音检测方法 |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103971698A (zh) * | 2013-01-25 | 2014-08-06 | 北京千橡网景科技发展有限公司 | 用于语音实时降噪的方法和设备 |
CN103971698B (zh) * | 2013-01-25 | 2019-01-11 | 北京千橡网景科技发展有限公司 | 用于语音实时降噪的方法和设备 |
CN105723458A (zh) * | 2013-09-12 | 2016-06-29 | 沙特阿拉伯石油公司 | 用于滤除噪声和还原声信号遭到衰减的高频分量的动态阈值方法、系统、计算机可读介质和程序代码 |
CN105723458B (zh) * | 2013-09-12 | 2019-09-24 | 沙特阿拉伯石油公司 | 用于滤除噪声和还原声信号遭到衰减的高频分量的动态阈值方法、系统、计算机可读介质 |
CN110265058A (zh) * | 2013-12-19 | 2019-09-20 | 瑞典爱立信有限公司 | 估计音频信号中的背景噪声 |
CN110265058B (zh) * | 2013-12-19 | 2023-01-17 | 瑞典爱立信有限公司 | 估计音频信号中的背景噪声 |
CN103824563A (zh) * | 2014-02-21 | 2014-05-28 | 深圳市微纳集成电路与系统应用研究院 | 一种基于模块复用的助听器去噪装置和方法 |
CN107359959A (zh) * | 2016-05-09 | 2017-11-17 | 上海复旦微电子集团股份有限公司 | 数据帧的起始位置检测方法及接收机 |
CN107359959B (zh) * | 2016-05-09 | 2019-12-24 | 上海复旦微电子集团股份有限公司 | 数据帧的起始位置检测方法及接收机 |
CN111739562A (zh) * | 2020-07-22 | 2020-10-02 | 上海大学 | 一种基于数据选择性和高斯混合模型的语音活动检测方法 |
CN111739562B (zh) * | 2020-07-22 | 2022-12-23 | 上海大学 | 一种基于数据选择性和高斯混合模型的语音活动检测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107004409B (zh) | 利用运行范围归一化的神经网络语音活动检测 | |
CN102820035A (zh) | 一种对长时变噪声的自适应判决方法 | |
EP3172906B1 (en) | Method and apparatus for wind noise detection | |
CN100543842C (zh) | 基于多统计模型和最小均方误差实现背景噪声抑制的方法 | |
US7383178B2 (en) | System and method for speech processing using independent component analysis under stability constraints | |
CN102522081B (zh) | 一种检测语音端点的方法及系统 | |
US10127919B2 (en) | Determining noise and sound power level differences between primary and reference channels | |
JP5678445B2 (ja) | 音声処理装置、音声処理方法およびプログラム | |
CN106875938B (zh) | 一种改进的非线性自适应语音端点检测方法 | |
US20080059163A1 (en) | Method and apparatus for noise suppression, smoothing a speech spectrum, extracting speech features, speech recognition and training a speech model | |
US11128954B2 (en) | Method and electronic device for managing loudness of audio signal | |
US9520138B2 (en) | Adaptive modulation filtering for spectral feature enhancement | |
US20130297306A1 (en) | Adaptive Equalization System | |
WO2004075167A2 (en) | Log-likelihood ratio method for detecting voice activity and apparatus | |
EP3660845B1 (en) | Method for detecting audio signal and apparatus | |
CN110875049B (zh) | 语音信号的处理方法及装置 | |
US9583120B2 (en) | Noise cancellation apparatus and method | |
CN101853665A (zh) | 语音中噪声的消除方法 | |
CN102982808A (zh) | 基于小波变换的语音去噪装置及方法 | |
CN103824563A (zh) | 一种基于模块复用的助听器去噪装置和方法 | |
CN107969164B (zh) | 适应性信道间判别再缩放滤波器 | |
KR20160116440A (ko) | 음성인식 시스템의 신호대잡음비 추정 장치 및 방법 | |
WO2017128910A1 (zh) | 一种语音出现概率的确定方法、装置及电子设备 | |
EP2660814A1 (en) | Adaptive equalization system | |
KR20070061216A (ko) | Gmm을 이용한 음질향상 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20121212 |