CN102820035A

CN102820035A - 一种对长时变噪声的自适应判决方法

Info

Publication number: CN102820035A
Application number: CN2012103040054A
Authority: CN
Inventors: 郑朝晖; 黄河清; 周蕾
Original assignee: WUXI SIDAWU ELECTRONIC TECHNOLOGY Co Ltd
Current assignee: WUXI SIDAWU ELECTRONIC TECHNOLOGY Co Ltd
Priority date: 2012-08-23
Filing date: 2012-08-23
Publication date: 2012-12-12

Abstract

本发明提供一种对长时变噪声的自适应判决方法。该方法利用初始化语音帧计算噪声帧参数集合的特征值与阈值判据，对后续待判决帧的各参数矢量进行计算后对阈值进行比较判决，得出该帧是否为噪声帧，并在反馈环中利用滑动因子对特征值与判决阈值进行自适应更新，构建出高效、稳定的处理模型与算法。

Description

一种对长时变噪声的自适应判决方法

技术领域

本发明涉及语音处理技术，特别涉及一种对具有长时变特性的带噪语音的自适应判决方法。

背景技术

目前的许多语音处理应用中需要对背景噪声做出估计，这种估计必须建立在对输入信号是否为噪声的判决基础上，该判决的准确程度在很大程度上影响着语音处理应用的效果。对噪声判决的普遍方法是采用一种经验性的固定特征值及固定阈值，或采用噪声特征值对阈值进行更新，这些方法都会导致无法适应噪声缓变情况而导致长时间运行后的判决失效。

噪声的平稳性与时间密切相关，短时间内平稳的噪声在较长的时间区间来观察具有时变特性，常用的经验阈值判决算法无法解决噪声的时变特性。另一方面，利用语音激活检测算法中的语音能量、短时平均过零率、自相关性、LPC谱包络进行多判断准则的互相校验与依赖判决，算法复杂而低效。

发明内容

针对现有噪声判决方法的上述缺陷，申请人经过研究改进，提供一种对长时变噪声的自适应判决方法，为具有长时变特性的带噪语音提供了一种自适应、高效的判决机制。

本发明的技术方案如下：

一种对长时变噪声的自适应判决方法，包括以下步骤：

步骤1），选取噪声帧特征参数集合A的特征值C和阈值C_th；

步骤2），对10ms带噪语音帧a_j计算其特征值C_j；

步骤3），计算C_j与C的差异值，并将其与阈值C_th比较做出判决；

步骤4），更新特征值C和阈值C_th。

其进一步的技术方案为：所述步骤1）的具体实施步骤为：设定初始化帧数为INIT=128，对各带噪语音帧a_i（i＝1，2，.....INIT）分别做如下计算：

（1）做256点快速傅里叶FFT变换，得到频域幅度A_i；

A_i=∑|A_i(K)|exp(j2πk/N)，k＝0，1，....，(N/2)-1；

（2）均匀划分为M个子带，计算每个子带的能量：

B_i(s)=∑|A_i(k)|，k=fL(s)，....，fH(s)，s＝0，1，....，M-1；

其中，fL(s)和fH(s)分别为第s个子带的下界和上界，M=32；

定义特征参数集合A={B_i(s)}，s=0，1，....，M-1，

定义矢量距离d(B_i，B_j)=∑20I(1g10(B_i(s)/B_j(s)))，其中

I(x)=x if(x>0)，I(x)=0 if(x<=0)，为半波整流；

（3）计算特征值C及阈值C_th：

C=E(c)，为INIT个初始化帧子带能量矢量B_i的数学期望；

C_th=E(d[B_i，E(c)])，i＝1，2，....，INIT，为各初始化帧和特征期望之间偏差的统计平均值。

其进一步的技术方案为：所述步骤2）的具体实施步骤为：对10ms的带噪语音帧a_j进行256点的傅里叶FFT变换后，由步骤1）中的B_i(s)计算式算出该待判决帧的子带能量矢量B_j(s)；C_j=B_j(s)。

其进一步的技术方案为：所述步骤3）的具体实施步骤为：计算C_j与C的差异值d(c_j，c)=d[B_j，E(c)]，若d(c_j，c)<C_th，则判决该帧为噪声帧。

其进一步的技术方案为：所述步骤4）的具体实施步骤为：若当前判决帧被判定为噪声帧，则采用滑动平均因子对特征值C进行修正：滑动因子

在0.95至0.98之间取值；

阈值C_th的更新采用边缘检测更新方式，若当前帧的判决结果与上一帧的判决结果异或为真，则按下式更新修正：C_th=θC_th+(1-θ)d(c_j，c)，边缘滑动因子θ在0.95至0.98之间取值。

本发明的有益技术效果是：

本发明对带噪语音构建动态反馈、自适应更新的特征值和判决阈值，从而对噪声帧作出高效、稳定的判决。通过提取一定长度的初始化帧，首先估算出各帧频域子带幅度能量构造特征值矢量的数学望期与判决阈值，然后计算待判决帧特征矢量距离并与判决阈值进行比较判决得出是否为噪声帧。利用快速傅里叶FFT变换，全部在频域完成所有计算与判决，计算量少、效率高，并利用边界滑动因子对特征值与判决阈值进行动态回归，实现长时间的自适应稳定判决输出。

本发明附加的方面和优点将在下面具体实施方式部分的描述中给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

图1是本发明的流程框图。

具体实施方式

下面结合附图对本发明的具体实施方式做进一步说明。

如图1所示，本发明的主要过程步骤包括：

步骤1），选取噪声帧特征参数集合A的特征值C和阈值C_th；

步骤2），对10ms带噪语音帧a_j计算其特征值C_j；

步骤4），更新特征值C和阈值C_th。

步骤1）的具体实施步骤如下：

设定初始化帧数为INIT=128，对各带噪语音帧a_i（i＝1，2，.....INIT）分别做如下计算：

（1）做256点快速傅里叶FFT变换，得到频域幅度A_i；

A_i=∑|A_i(K)|exp(j2πk/N)，k＝0，1，....，(N/2)-1。

（2）均匀划分为M个子带，计算每个子带的能量：

B_i(s)=∑|A_i(k)|，k=fL(s)，....，fH(s)，s＝0，1，....，M-1；

其中，fL(s)和fH(s)分别是第s个子带的下界和上界，M=32；

定义特征参数集合A={B_i(s)}，s=0，1，....，M-1，

定义矢量距离d(B_i，B_j)=∑20I(1g10(B_i(s)/B_j(s)))，其中

I(x)=x if(x>0)，I(x)=0 if(x<=0)，为半波整流。

（3）计算特征值C及阈值C_th：

C=E(c)，是INIT个初始化帧子带能量矢量B_i的数学期望。

C_th=E(d[B_i，E(c)])，i=1，2，....，INIT是各初始化帧和特征期望之间偏差的统计平均值。

步骤2）的具体实施步骤如下：

对10ms的带噪语音帧a_j进行256点的傅里叶FFT变换后，由步骤1）中的B_i(s)计算式算出该待判决帧的子带能量矢量B_j(s)。

C_j＝B_j(s)

步骤3）的具体实施步骤如下：

计算C_j与C的差异值d(c_j，c)=d[B_j，E(c)]，如果d(c_j，c)<C_th，则判决该帧为噪声帧。

步骤4）的具体实施步骤如下：

如果当前判决帧被判定为噪声帧，则采用滑动平均因子对特征值C进行修正，

滑动因子

可取值0.95至0.98之间。

阈值C_th的更新采用边缘检测更新方式，即当前帧的判决结果与上一帧的判决结果异或为真，则按下式更新修正：

C_th=θC_th+(1-θ)d(c_j，c)，边缘滑动因子θ可在0.95至0.98间取值。

基于上述步骤，本发明利用语音短时变及噪声的短平稳特性，通过构造高效的计算模型与算法对带噪语音中的噪声帧做出高准确度判决，具有计算快捷、性能稳定的突出特点。

以上所述的仅是本发明的优选实施方式，本发明不限于以上实施例。可以理解，本领域技术人员在不脱离本发明的基本构思的前提下直接导出或联想到的其他改进和变化，均应认为包含在本发明的保护范围之内。

Claims

1.一种对长时变噪声的自适应判决方法，其特征在于包括以下步骤：

步骤1），选取噪声帧特征参数集合A的特征值C和阈值C_th；

步骤2），对10ms带噪语音帧a_j计算其特征值C_j；

步骤4），更新特征值C和阈值C_th。

2.根据权利要求1所述对长时变噪声的自适应判决方法，其特征在于：所述步骤1）的具体实施步骤为：设定初始化帧数为INIT=128，对各带噪语音帧a_i（i=1，2，.....INIT）分别做如下计算：

（1）做256点快速傅里叶FFT变换，得到频域幅度A_i；

A_i=∑|A_i(K)|exp(j2πk/N)，k＝0，1，....，(N/2)-1；

（2）均匀划分为M个子带，计算每个子带的能量：

B_i(s)=∑|A_i(k)|，k=fL(s)，....，fH(s)，s＝0，1，....，M-1；

其中，fL(s)和fH(s)分别为第s个子带的下界和上界，M=32；

定义特征参数集合A={B_i(s)}，s=0，1，....，M-1，

定义矢量距离d(B_i，B_j)=∑20I(1g10(B_i(s)/B_j(s)))，其中

I(x)=x if(x>0)，I(x)=0 if(x<=0)，为半波整流；

（3）计算特征值C及阈值C_th：

C=E(c)，为INIT个初始化帧子带能量矢量B_i的数学期望；

3.根据权利要求1所述对长时变噪声的自适应判决方法，其特征在于：所述步骤2）的具体实施步骤为：对10ms的带噪语音帧a_j进行256点的傅里叶FFT变换后，由步骤1）中的B_i(s)计算式算出该待判决帧的子带能量矢量B_j(s)；C_j=B_j(s)。

4.根据权利要求1所述对长时变噪声的自适应判决方法，其特征在于：所述步骤3）的具体实施步骤为：计算C_j与C的差异值d(c_j，c)=d[B_j，E(c)]，若d(c_j，ｃ)<C_th，则判决该帧为噪声帧。

5.根据权利要求1所述对长时变噪声的自适应判决方法，其特征在于：所述步骤4）的具体实施步骤为：若当前判决帧被判定为噪声帧，则采用滑动平均因子对特征值C进行修正：

滑动因子

在0.95至0.98之间取值；