CN101300623A

CN101300623A - 用于抑制噪声的方法、设备和计算机程序

Info

Publication number: CN101300623A
Application number: CNA2006800407045A
Authority: CN
Inventors: 杉山昭彦; 加藤正德
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 2005-09-02
Filing date: 2006-08-28
Publication date: 2008-11-05
Anticipated expiration: 2026-08-28
Also published as: US8477963B2; EP1930880A4; JPWO2007029536A1; US8489394B2; US20120290296A1; US20090196434A1; US20120288115A1; WO2007029536A1; KR20080042166A; US8233636B2; JP5092748B2; CN101300623B; EP1930880B1; EP1930880A1; KR101052445B1

Abstract

本发明提出了一种方法、一种设备和一种计算机程序，能够以较小的计算量来抑制低频范围内的分量，并能够实现高质量的噪声抑制。通过以下操作来抑制输入信号中叠加在所需信号上的噪声：将所述输入信号转换为频域信号；修正所述频域信号的幅度，以获得幅度修正信号；使用所述幅度修正信号，来获得估计噪声；使用所述估计噪声和所述幅度修正信号，来确定抑制系数；以及以所述抑制系数对所述幅度修正信号进行加权。

Description

用于抑制噪声的方法、设备和计算机程序

技术领域

本发明涉及一种噪声抑制方法、一种用于抑制叠加在所需语音信号上的噪声的噪声抑制设备、以及一种用于抑制所述噪声的计算机程序。

背景技术

噪声抑制器(噪声抑制系统)是一种用于抑制叠加在所需语音信号上的噪声的系统，通常通过以下操作来抑制混合在所需语音信号中的噪声：通过将输入信号转换到频域来估计噪声分量的功率谱；以及从输入信号中扣除所估计出的功率谱。噪声抑制器也可以用于通过连续估计噪声分量的功率谱来抑制不规则噪声。例如，噪声抑制器可以是一种北美便携式电话标准所采用的方法，可参见非专利文献1(技术要求(TR45).ENHANCED VARIABLE RATE CODEC，SPEECH SERVICEOPTION 3 FOR WIDEBAND SPREAD SPECTRUM DIGITAL SYSTEMS)和专利文献1(日本未审公开专利申请No.2002-204175)。

通常，将通过对用于收集声波的麦克风的输出信号进行模拟-数字(AD)转换而得到的数字信号作为输入信号传送至噪声抑制器。通常，将高通滤波器放置在AD转换器和噪声抑制器之间，主要用于抑制在麦克风中收集声音时和在对该声音进行AD转换时所引入的低频范围内的分量。例如，在专利文献2(美国专利No.5,659,622)中公开了上述结构示例。

图1示出了将专利文献1的噪声抑制器与专利文献2的高通滤波器进行组合的结构。

将含噪声的话音信号(其中所需语音信号与噪声相混合的信号)作为采样值序列传送至输入端11。将含噪声的话音信号采样传送至高通滤波器17，并在对其低频范围内的分量进行抑制之后，将其传送至分帧器(frame divider)1。对于保持输入含噪声话音的线性以及实现充分的信号处理性能而言，抑制低频范围内的分量是绝对必要的。分帧器1将含噪声的话音信号采样分为其单位是特定数目的帧，并将所述帧传送至窗口处理器2。窗口处理器2将已分为帧的、含噪声的话音信号采样与窗口函数相乘，并将结果传送至傅立叶变换器3。

傅立叶变换器3对窗口处理过的、含噪声的话音信号采样进行傅立叶变换，以便将所述信号采样分为多个频率分量，并对幅度值进行复用，以将所述多个频率分量传送至估计噪声计算器52、噪声抑制系数发生器82和复用乘法器16。将相位传送至逆傅立叶变换器9。估计噪声计算器52估计所传送的多个频率分量中的每一个的噪声，并将所述噪声传送至噪声抑制系数发生器82。一种噪声估计方法的示例是以过去的信号噪声比对含噪声的话音进行加权以将其指定为噪声分量的方法，在专利文献1中描述了上述方法的细节。

噪声抑制系数发生器82产生噪声抑制系数，以便通过将含噪声的话音与估计噪声相乘来获得已针对多个频率分量中的每一个抑制了噪声的增强语音。作为产生噪声抑制系数的示例，广泛地采用了用于使增强语音的平均平方功率最小化的最小均方短时谱幅度方法，在专利文献1中描述了上述方法的细节。

将针对每个频率而产生的噪声抑制系数传送至复用乘法器16。针对每个频率，复用乘法器16将从傅立叶变换器3传送过来的含噪声的话音与从噪声抑制系数发生器82传送过来的噪声抑制系数相乘，并将乘积传送至逆傅立叶变换器9，作为增强语音的幅度。逆傅立叶变换器9通过将从复用乘法器16传送过来的增强语音幅度与含噪声的话音的相位(所述相位来自傅立叶变换器3)进行组合来执行逆傅立叶变换，并将逆傅立叶变换后的信号传送至帧合成器10，作为增强语音信号采样。帧合成器10通过使用相邻帧的增强语音采样来合成相应帧的输出语音采样，以将合成后的采样传送至输出端12。

发明内容

高通滤波器17抑制直流附近的频率分量。通常，其频率等于或高于100Hz到120Hz的分量通过高通滤波器17而未被抑制。当高通滤波器17的结构可以被归类为有限冲激响应(FIR)型或无限冲激响应(IIR)型滤波器时，需要尖锐的通带端接特性，因此通常采用I IR型滤波器。对于IIR型滤波器，已知的是：传递函数被表达为有理函数，且对分母系数的敏感度极高。因此，存在以下问题：在将高通滤波器17实现为有限字长计算时，需要频繁地使用双精度计算来实现足够的精确性，因此计算量较大。另一方面，如果去除高通滤波器17以降低计算量，则难以维持输入信号的线性，而不能实现高质量的噪声抑制。

本发明的目的在于提供一种噪声抑制方法和一种噪声抑制设备，其能够以较小的计算量来抑制低频范围内的分量并实现高质量的噪声抑制。

根据本发明的噪声抑制方法将输入信号转换为频域信号，修正频域信号的幅度以获得幅度修正信号，通过使用幅度修正信号来获得估计噪声，通过使用估计噪声和幅度修正信号来确定抑制系数，以及以抑制系数对幅度修正信号进行加权。

另一方面，根据本发明的噪声抑制设备具有：转换器，用于将输入信号转换为频域信号；幅度修正器，用于修正频域信号的幅度以获得幅度修正信号；噪声估计器，用于通过使用幅度修正信号来获得估计噪声；抑制系数发生器，用于通过使用估计噪声和幅度修正信号来确定抑制系数；以及乘法器，用于以抑制系数对幅度修正信号进行加权。

根据本发明的一种用于噪声抑制的信号处理计算机程序包括：将输入信号转换为频域信号的处理，修正频域信号的幅度以获得幅度修正信号的处理，通过使用幅度修正信号来获得估计噪声的处理，通过使用估计噪声和幅度修正信号来确定抑制系数的处理，以及以抑制系数对幅度修正信号进行加权的处理。

具体地，根据本发明的噪声抑制方法和设备的特征在于抑制傅立叶变换后的信号的低频范围内的分量。更具体地，所述设备的特征在于包括：幅度修正器，用于抑制傅立叶变换后的输出的幅度的低频范围内的分量；以及相位修正器，用于修正与低频范围内的分量的幅度调整相对应的相位，以修正傅立叶变换后的输出的相位。

根据本发明，将转换到频域的信号的幅度与一常数相乘，将一常数与相位相加，从而能够以单一的精确计算来实现所述方法和设备，并能够以较小的计算量来实现高质量的噪声抑制。

附图说明

图1是示出了传统噪声抑制设备的结构示例的方框图；

图2是示出了本发明第一典型实施例的方框图；

图3是示出了包括在本发明第一典型实施例中的幅度修正器的结构的方框图；

图4是示出了包括在图3中的语音存在概率计算器的结构的方框图；

图5是示出了本发明第二典型实施例的方框图；

图6是示出了本发明第三典型实施例的方框图；

图7是示出了包括在本发明第三典型实施例中的复用乘法器的结构的方框图；

图8是示出了包括在本发明第三典型实施例中的加权噪声话音计算器的结构的方框图；

图9是示出了包括在图8中的频域SNR计算器的结构的方框图；

图10是示出了包括在图8中的复用非线性处理器的结构的方框图；

图11是示出了非线性处理器的非线性函数的示例的曲线图；

图12是示出了包括在本发明第三典型实施例中的估计噪声计算器的结构的方框图；

图13是示出了包括在图12中的频域估计噪声计算器的结构的方框图；

图14是示出了包括在图13中的更新判决器的结构的方框图；

图15是示出了包括在本发明第三典型实施例中的估计先验SNR计算器的结构的方框图；

图16是示出了包括在图15中的多值域限制器的结构的方框图；

图17是示出了包括在图15中的复用加权加法器的结构的方框图；

图18是示出了包括在图17中的加权加法器的结构的方框图；

图19是示出了包括在本发明第三典型实施例中的噪声抑制系数发生器的结构的方框图；

图20是示出了包括在本发明第三典型实施例中的抑制系数修正器的结构的方框图；以及

图21是示出了包括在图20中的频域抑制系数修正器的结构的方框图。

符号说明

1 分帧器

2、20 窗口处理器

3 傅立叶变换器

4、5049 计数器

5、52 估计噪声计算器

6、1042 频域SNR计算器

7 估计先验SNR计算器

8、82 噪声抑制系数发生器

9 逆傅立叶变换器

10 帧合成器

11 输入端

12 输出端

13、16、704、705、1404 复用乘法器

14 加权噪声话音计算器

15 抑制系数修正器

17 高通滤波器

18 幅度修正器

19 相位修正器

21 语音缺失概率存储器

22 偏移消除器

501、502、1302、1303 分离器

1422、1423、1495、1502 分离器

1503、1801、1901 分离器

7013、7072、7074 分离器

503、1304、1424、1475 复用器

1504、1803、1903 复用器

7014、7075 复用器

504₀至504_K-1 频域估计噪声计算器

520 更新判决器

701 多值域限制器

702 后验SNR存储器

703 抑制系数存储器

706 权重存储器

707 复用加权加法器

708、5046、7092、7094 加法器

811 MMSE STSA增益函数值计算器

812 广义似然比计算器

814 抑制系数计算器

921 瞬时估计SNR

921₀至921_K-1 频域瞬时估计SNR

922 以往估计SNR

922₀至922_K-1 以往频域估计SNR

923 权重

924 估计先验SNR

924₀至924_K-1 频域估计先验SNR

1301₀至1301_K-1 乘法器

1597、7091、7093 乘法器

1401、5042 估计噪声存储器

1405 复用非线性处理器

1421₀至1421_K-1、5048 除法器

1485₀至1485_K-1 非线性处理器

1501₀至1501_K-1 频域抑制系数修正器

1591、7012₀至7012_K-1 最大值选择器

1592 抑制系数下限值存储器

1593、5204、5206 阈值存储器

1594、5203、5205 比较器

1595、5044 开关

1596 修正值存储器

1802₀至1802_K-1 加权处理器

1902₀至1902_K-1 相位旋转器

5041 寄存器长度存储器

5045 移位寄存器

5047 最小值选择器

5201 逻辑或计算器

5207 阈值计算器

7011 常数存储器

7071₀至7071_K-1 加权加法器

7095 常数乘法器

具体实施方式

图2是示出了本发明第一典型实施例的方框图。除了高通滤波器17、幅度修正器18、相位修正器19和窗口处理器20以外，图2所示结构与图1所示结构(传统示例)相同。以下的详细讨论将集中在这些不同点上。

在图2中，删除了图1所示的高通滤波器17，而代替地设置了幅度修正器18、相位修正器19和窗口处理器20。设置幅度修正器18和相位修正器19，以将高通滤波器的频率响应施加于被转换至频域的信号上。将函数f的绝对值(幅度频率响应)在幅度修正器18中施加于输入信号，以及将函数f的相位(相位频率响应)在相位修正器19中施加于输入信号，其中通过将z＝exp(j·2πf)施加于高通滤波器17的传递函数来获得所述函数f。

通过上述操作，可以获得与将高通滤波器17施加于输入信号相同的效果。也就是说，代替在时域上将高通滤波器17的传递函数与输入信号进行卷积，在傅立叶变换器3中被转换为频域信号之后，将所述函数与频率响应相乘。

将幅度修正器18的输出传送至估计噪声计算器52、噪声抑制系数发生器82和复用乘法器16。将相位修正器19的输出传送至逆傅立叶变换器9。

随后的操作与参照图1所描述的操作相同。如专利文献3(日本未审公开专利申请No.2003-131689)所公开的那样，设置窗口处理器20以抑制帧边界处的间断声音。

图3示出了幅度修正器18的结构示例。将来自傅立叶变换器3的复用噪声话音幅度谱传送至分离器1801。分离器1801将复用噪声话音幅度谱分解为各个频率分量，并将所述频率分量传送至加权处理器1802₀至1802_K-1。加权处理器1802₀至1802_K-1以相应的幅度频率响应对被分解为各个频率分量的每个噪声话音幅度谱进行加权，并将所述谱传送至复用器1803。复用器1803对来自加权处理器1802₀至1802_K-1的信号进行复用，以输出复用信号，作为修正噪声话音幅度谱。

图4示出了相位修正器19的结构示例。将从傅立叶变换器3传送过来的复用噪声话音相位谱传送至分离器1901。分离器1901将复用噪声话音相位谱分解为各个频率分量，并将各个频率分量传送至相位旋转器1902₀至1902_K-1。每个相位旋转器1902₀至1902_K-1根据相应的相位频率响应对被分解为各个频率分量的噪声话音相位谱进行旋转，并将所述谱传送至复用器1903。复用器1903对来自相位旋转器1902₀至1902_K-1的信号进行复用，以输出复用信号，作为修正噪声话音相位谱。相位修正器19的存在并不如幅度修正器18那样重要，因此可以省略相位修正器19。原因在于：已知相位修正器19的存在仅影响输出信号的相位，而对于理解语音内容而言，相位信息比幅度信息次要得多。

图5是示出了本发明第二典型实施例的方框图。图5所示结构与作为第一典型实施例的图2所示结构的区别在于偏移消除器22。偏移消除器22消除窗口处理后的噪声话音的偏移，以输出语音。最简单的偏移消除方法是针对每一帧获得噪声话音的平均值，以将所述平均值指定为偏移，将从对应帧中的所有采样中扣除此偏移。或者，针对多个帧，对每一帧的平均值进行平均，并将所获得的数值作为偏移从采样中扣除。通过消除偏移，可以在傅立叶变换器3中提高转换精度，并能够改善将要输出的增强语音的声音质量。

图6是示出了本发明第三典型实施例的方框图。将含噪声的话音信号(所需语音信号与噪声相混合的信号)作为采样值序列传送至输入端11。将含噪声的话音信号采样传送至分帧器1，并以K/2个采样为单位分割成帧。这里，假设K是偶数。将被分割成帧的噪声话音信号采样传送至窗口处理器2，并与窗口函数w(t)相乘。通过对第n帧的输入信号y_n(t)(t＝0，1，…，K/2-1)进行窗口处理而获得的信号y_n(t)可以如下等式表示。

[等式1]

y_n(t)＝w(t)y_n(t) (1)

此外，在将要进行窗口处理的、两个连续帧彼此交叠的部分中广泛执行上述操作。如果假设交叠长度是帧长度的50％，对于t＝0，1，…，K/2-1，

[等式2]

y_n(t)＝w(t)y_n-1(t+K/2)

(2)

y_n(t+K/2)＝w(t+K/2)y_n(t)

通过上述等式获得的y_n(t)(t＝0，1，…，K /2-1)作为窗口处理器2的输出。将左右对称的窗口函数用于实数信号。设计窗口函数，从而使输入信号和输出信号彼此对应，以排除当抑制系数被设置为“1”时所导致的计算误差。这意味着w(t)+w(t+K/2)＝1。

下面，将继续作为示例来描述其中要进行窗口处理的两个连续帧的50％彼此交叠的情况。例如，可以将以如下等式表示的汉宁窗(Hanning Window)用作w(t)。

[等式3]

w (t) = \{\begin{matrix} 0.5 + 0.5 \cos (\frac{π (t - K / 2)}{K / 2}), & 0 \leq t < K \\ 0, & K \leq t \end{matrix} - - - (3)

除了上述等式外，诸如汉明窗(Hamming Window)、凯瑟窗(KayserWindow)和布莱克曼窗(Blackman Window)等多种窗口函数是已知的。将窗口处理后的输出y_n(t)传送至偏移消除器22，并对偏移进行消除。偏移消除的细节与参照图5所描述的内容相同。

将已经消除了偏移的信号传送至傅立叶变换器3，并转换为噪声话音谱Y_n(k)。将噪声话音谱Y_n(k)分离为相位和幅度，将噪声话音相位谱argY_n(k)通过相位修正器19传送至逆傅立叶变换器9，以及将噪声话音幅度谱|Y_n(k)|通过幅度修正器18传送至复用乘法器13和复用乘法器16。相位修正器19和幅度修正器18的操作与参照图2所描述的内容相同。

复用乘法器13通过使用其幅度已被修正的噪声话音幅度谱来计算噪声话音功率谱，并将所述噪声话音功率谱传送至估计噪声计算器5、频域SNR(信号噪声比)计算器6和加权噪声话音计算器14。加权噪声话音计算器14通过使用从复用乘法器13传送过来的噪声话音功率谱来计算加权噪声话音功率谱，并将所述加权噪声话音功率谱传送至估计噪声计算器5。

估计噪声计算器5通过使用噪声话音功率谱、加权噪声话音功率谱和来自计数器4的计数值来估计噪声的功率谱，并噪声的功率谱作为估计噪声功率谱传送至频域SNR计算器6。频域SNR计算器6通过使用输入的噪声话音功率谱和输入的估计噪声功率谱来计算每个频率的SNR，并将所述SNR作为后验SNR传送至估计先验SNR计算器7和噪声抑制系数发生器8。

估计先验SNR计算器7通过使用输入的后验SNR和来自抑制系数修正器15的修正抑制系数来估计先验SNR，并将先验SNR作为估计先验SNR传送至噪声抑制系数发生器8。噪声抑制系数发生器8通过使用作为输入而传送过来的后验SNR和估计先验SNR、以及通过使用从语音缺失概率存储器21传送过来的语音缺失概率来产生噪声抑制系数，并将噪声抑制系数作为抑制系数传送至抑制系数修正器15。抑制系数修正器15通过使用输入的估计先验SNR和抑制系数来修正抑制系数，并将修正后的抑制系数作为修正抑制系数G_n(k)传送至复用乘法器16。复用乘法器16通过以从抑制系数修正器15传送过来的修正抑制系数G_n(k)对从傅立叶变换器3通过幅度修正器18传送过来的修正噪声话音幅度谱进行加权来获得增强语音幅度谱|X_n(k)|，并将增强语音幅度谱传送至逆傅立叶变换器9。

|X_n(k)|可以由以下等式表示。

[等式4]

|X_n(k)|＝G_n(k)H_n(k)|Y_n(k)| (4)

这里，H_n(k)是幅度修正器18中的修正增益，并作为图1所示的高通滤波器的幅度频率响应而获得。

逆傅立叶变换器9通过将从复用乘法器16传送过来的增强语音幅度谱|X_n(k)|与从傅立叶变换器3通过相位修正器19传送过来的修正噪声话音相位谱arg Y_n(k)+arg H_n(k)相乘来获得增强语音X_n(k)。即，执行以下等式。

[等式5]

X_n(k)＝|X_n(k)|·{arg Y_n(k)+arg H_n(k)} (5)

这里，arg H_n(k)是相位修正器19中的修正相位，并作为图1所示的高通滤波器的相位频率响应而获得。

逆傅立叶变换器9对所获得的增强语音X_n(k)进行逆傅立叶变换，并将增强语音X_n(k)传送至窗口处理器20，作为时域采样序列x_n(t)(t＝0，1，…，K-1)，所述时域采样序列x_n(t)的帧配置有K个采样。窗口处理器20将从逆傅立叶变换器9传送过来的时域采样序列x_n(t)与窗口函数w(t)相乘。以如下等式表示信号x_n(t)，通过以w(t)对第n帧的输入信号x_n(t)(t＝0，1，…，K/2-1)进行窗口处理来获得信号x_n(t)。

[等式6]

x_n(t)＝w(t)x_n(t) (6)

[等式7]

x_n(t)＝w(t)x_n-1(t+K/2) (7)

x_n(t+K/2)＝w(t+K/2)x_n(t)

通过上述等式获得的y_n(t)(t＝0，1，…，K-1)作为窗口处理器20的输出，并传送至帧合成器10。

帧合成器10从两个相邻的帧x_n(t)的每一个中取出K/2个采样，以对这些采样进行交叠，并通过使用以下等式来获得增强语音

[等式8]

{\hat{x}}_{n} (t) = {\overset{&OverBar;}{x}}_{n - 1} (t + K / 2) + {\overset{&OverBar;}{x}}_{n} (t) - - - (8)

将所获得的增强语音

传送至输出端12，作为帧合成器10的输出。

图7是示出了图6所示的复用乘法器13的结构的方框图。复用乘法器13包括乘法器1301₀至1301_K-1、分离器1302和1303以及复用器1304。在分离器1302和1303中，将从图6的幅度修正器18传送过来的、已被复用的修正噪声话音幅度谱分解为每个频率K个采样，并将其分别传送至乘法器1301₀至1301_K-1。乘法器1301₀至1301_K-1分别对输入信号进行平方运算，并分别将平方信号传送至复用器1304。复用器1304对输入信号进行复用，以输出复用信号，作为噪声话音功率谱。

图8是示出了加权噪声话音计算器14的结构的方框图。加权噪声话音计算器14包括估计噪声存储器1401、频域SNR计算器1402、复用非线性处理器1405和复用乘法器1404。估计噪声存储器1401存储从图6的估计噪声计算器5传送过来的估计噪声功率谱，并将前一帧的估计噪声功率谱输出至频域SNR计算器1402。

频域SNR计算器1402通过使用从估计噪声存储器1401传送过来的估计噪声功率谱和从图6的复用乘法器13传送过来的噪声话音功率谱，来获得每个频率的SNR，并将SNR输出至复用非线性处理器1405。复用非线性处理器1405通过使用从频域SNR计算器1402传送过来的SNR，来计算权重系数矢量，并将权重系数矢量输出至复用乘法器1404。

针对每一频率，复用乘法器1404计算从图6的复用乘法器13传送过来的噪声话音功率谱和从复用非线性处理器1405传送过来的权重系数矢量的乘积，并将加权噪声话音功率谱输出至图6的估计噪声计算器5。复用乘法器1404的结构与参照图7所描述的复用乘法器13的结构相同，所以将省略对其的详细描述。

图9是示出了包括在图8中的频域SNR计算器1402的结构的方框图。频域SNR计算器1402包括除法器1421₀至1421_K-1、分离器1422和1423以及复用器1424。将从图6的复用乘法器13传送过来的噪声话音功率谱传送至分离器1422。将从图8的估计噪声存储器1401传送过来的估计噪声功率谱传送至分离器1423。在分离器1422和1423中，将噪声话音功率谱和估计噪声功率谱分别分解为与频率分量相对应的K个采样，并分别将其传送至除法器1421₀至1421_K-1。

在除法器1421₀至1421_K-1中，根据以下等式，通过将传送过来的噪声话音功率谱除以估计噪声功率谱，获得频域SNR

并将其传送至复用器1424。

[等式9]

{\hat{γ}}_{n} (k) = \frac{{| Y_{n} (k) |}^{2}}{λ_{n - 1} (k)} - - - (9)

这里，λ_n-1(k)是前一帧中的估计噪声功率谱。复用器1424对传送过来的K个频域SNR进行复用，并将复用SNR传送至图8的复用非线性处理器1405。

接下来，将参照图10，对图8的复用非线性处理器1405的结构和操作进行详细描述。图10是示出了包括在加权噪声话音计算器14中的复用非线性处理器1405的结构的方框图。复用非线性处理器1405包括分离器1495、非线性处理器1485₀至1485_K-1和复用器1475。分离器1495将从图8的频域SNR计算器1402传送过来的SNR分解为频域SNR，并将分解后的SNR传送至非线性处理器1485₀至1485_K-1。非线性处理器1485₀至1485_K-1分别包括用于根据输入值而输出实数值的非线性函数。

图11示出了非线性函数的示例。如果f₁是输入值，则可以通过以下等式获得图11所示的非线性函数的输出值f₂。

[等式10]

f_{2} = \{\begin{matrix} 1, & f_{1} \leq a \\ \frac{f_{1} - b}{a - b}, & a < f_{1} \leq b \\ 0, & b < f_{1} \end{matrix} - - - (10)

这里，a和b是任意实数。

回到图10，非线性处理器1485₀至1485_K-1利用非线性函数来处理从分离器1495传送过来的频域SNR，以获得加权系数，并将加权系数输出至复用器1475。即，非线性处理器1485₀至1485_K-1根据SNR来输出加权系数“1”至“0”。当SNR较小时，输出“1”，而当SNR较大时，输出“0”。复用器1475对从非线性处理器1485₀至1485_K-1输出的加权系数进行复用，并将复用加权系数作为加权系数矢量输出至复用乘法器1404。

在图8复用乘法器1404中与噪声话音功率谱相乘的加权系数是与SNR对应的值，当SNR较大，即包含在含噪声的话音中的语音分量较大时，加权系数的值较小。虽然通常将噪声话音功率谱用于更新估计噪声，但是通过根据SNR，对用于更新估计噪声的噪声话音功率谱进行加权，可以使包含在噪声话音功率谱中的语音分量的影响较小，并能够实现更为精确的噪声估计。同时，虽然描述了利用非线性函数来计算加权系数的示例，但是也可以使用除非线性函数以外的SNR的其他函数，该函数可以表示为另一等式，如线性函数或高阶多项式等。

图12是示出了图6所示的估计噪声计算器5的结构的方框图。估计噪声计算器5包括分离器501和502、复用器503和频域估计噪声计算器504₀至504_K-1。

在图12中，分离器501将从图6的加权噪声话音计算器14传送过来的加权噪声话音功率谱分解为每个频率的加权噪声话音功率谱，并将这些功率谱分别传送至频域估计噪声计算器504₀至504_K-1。分离器502将从图6的复用乘法器13传送过来的噪声话音功率谱分解为每个频率的噪声话音功率谱，并将这些功率谱分别输出至频域估计噪声计算器504₀至504_K-1。

频域估计噪声计算器504₀至504_k-1根据从分离器501传送过来的频域加权噪声话音功率谱、从分离器502传送过来的频域噪声话音功率谱和从图6的计数器4传送过来的计数值，计算频域估计噪声功率谱，并这些功率谱输出至复用器503。复用器503对从频域估计噪声计算器504₀至504_K-1传送过来的频域估计噪声功率谱进行复用，并将估计噪声功率谱输出至图6的频域SNR计算器6以及加权噪声话音计算器14。将参照图13，对频域估计噪声计算器504₀至504_K-1的结构和操作进行详细描述。

图13是示出了图12所示的频域估计噪声计算器504₀至504_K-1的结构的方框图。频域估计噪声计算器504包括更新判决器520、寄存器长度存储器5041、估计噪声存储器5042、开关5044、移位寄存器5045、加法器5046、最小值选择器5047、除法器5048和计数器5049。

将频域加权噪声话音功率谱从图12的分离器501传送至开关5044。当开关5044闭合时，将频域加权噪声话音功率谱传送至移位寄存器5045。移位寄存器5045响应于从更新判决器520传送过来的控制信号，年个内部寄存器的存储值移位至相邻的寄存器。寄存器长度与稍后描述的寄存器长度存储器5041中所存储的数值相同。将移位寄存器5045的所有寄存器输出传送至加法器5046。加法器5046对传送过来的所有寄存器输出进行求和，并将求和结果传送至除法器5048。

另一方面，向更新判决器520传送计数值、频域噪声话音功率谱和频域估计噪声功率谱。在计数值达到预定值之前，更新判决器520总是输出“1”，在计数值达到预定值之后，当更新判决器520确定输入噪声话音信号是噪声时，更新判决器520输出“1”，而在其他情况下，更新判决器520输出“0”。将更新判决器520的输出传送至计数器5049、开关5044和移位寄存器5045。

当从更新判决器520传送过来的信号是“1”时，开关5044闭合，而当该信号为“0”时，开关5044断开。当从更新判决器520传送过来的信号是“1”时，计数器5049增加计数值，而当该信号为“0”时，计数器5049不改变计数值。当从更新判决器520传送过来的信号是“1”时，移位寄存器5045输入从开关5044传送过来的一个信号采样，与此同时，将内部寄存器的存储值移位至相邻的寄存器。向最小值选择器5047传送计数器5049的输出和寄存器长度存储器5041的输出。

最小值选择器5047选择传送过来的计数值或寄存器长度(二者中较小的一个)，并将所选择的数值传送至除法器5048。除法器5048将从加法器5046传送过来的频域噪声话音功率谱的求和值除以计数值或寄存器长度(二者中较小的一个)，并输出所得的商，作为频域估计噪声功率谱λ_n(k)。如果B_n(k)(n＝0，1，…，N-1)是存储在移位寄存器5045中的噪声话音功率谱的采样值，则可以通过以下等式获得λ_n(k)

λ_{n} (k) = \frac{1}{N} Σ_{n = 0}^{N - 1} B_{n} (k) - - - (11)

在以上等式中，N是计数值或寄存器长度(二者中较小的一个)。由于计数值从“0”开始单调递增，所以首先使用计数值来执行除法操作，然后才使用寄存器长度来执行除法操作。针对以寄存器长度为除数的除法，需要获得存储在移位寄存器中的数值的平均值。首先，由于在移位寄存器5045中并未存储足够多的数值，所以使用实际存储有数值的寄存器的数目来执行除法操作。当计数值小于寄存器长度时，实际存储有数值的寄存器的数目等于计数值，而当计数值变得大于寄存器长度时，实际存储有数值的寄存器的数目等于寄存器长度。

图14是示出了图13所示的更新判决器520的结构的方框图。更新判决器520包括逻辑或计算器5201、比较器5203和5205、阈值存储器5204和5206以及阈值计算器5207。

将从图6的计数器4传送过来的计数值传送至比较器5203。同时，还将阈值(阈值存储器5204的输出)传送至比较器5203。比较器5203将传送过来的计数值与阈值进行比较，并在计数值小于阈值时，向逻辑或计算器5201传送“1”，而在计数值大于阈值时，向逻辑或计算器5201传送“0”。另一方面，阈值计算器5207根据从图13的估计噪声存储器5042传送过来的频域估计噪声功率谱来计算阈值，并将计算值作为阈值输出至阈值存储器5206。最简单的阈值计算方法是将频域估计噪声功率谱与常数相乘。作为另一方法，也可以使用高阶多项式和非线性函数来计算阈值。

阈值存储器5206存储从阈值计算器5207输出的阈值，并将一帧前已存储的阈值输出至比较器5205。比较器5205将从阈值存储器5206传送过来的阈值与从图12的分离器502传送过来的频域噪声话音功率谱进行比较，并在频域噪声话音功率谱小于阈值时，向逻辑或计算器5201传送“1”，而在频域噪声话音功率谱大于阈值时，向逻辑或计算器5201传送“0”。即，根据估计噪声功率谱的幅度来确定含噪声的话音信号是否是噪声。逻辑或计算器5201计算比较器5203的输出值和比较器5205的输出值的逻辑或，并将计算结果输出至图13的开关5044、移位寄存器5045和计数器5049。

如上所述，在初始状态或静音间隔中以及当非静音间隔中含噪声的话音功率较小时，更新判决器520输出“1”。即，对估计噪声进行更新。由于针对每一频率来计算阈值，可以针对每一频率来更新估计噪声。

图15是示出了图6所示的估计先验SNR计算器7的结构的方框图。估计先验SNR计算器7包括多值域限制器701、后验SNR存储器702、抑制系数存储器703、复用乘法器704和705、权重存储器706、复用加权加法器707以及加法器708。

将从图6的频域SNR计算器6传送过来的后验SNRγ_n(k)(k＝0，1，…，K-1)传送至后验SNR存储器702和加法器708。后验SNR存储器702存储第n帧的后验SNRγ_n(k)，并将第n-1帧的后验SNRγ_n-1(k)传送至复用乘法器705。将从图6的抑制系数修正器15传送过来的修正抑制系数G_n(k)(k＝0，1，…，K-1)传送至抑制系数存储器703。抑制系数存储器703存储第n帧的修正抑制系数G_n(k)，并将第n-1帧的修正抑制系数G_n-1(k)传送至复用乘法器704。

复用乘法器704对传送过来的G_n(k)进行平方，以获得G_n ²(k)，并将G_n-1 ²(k)传送至复用乘法器705。复用乘法器705将G_n-1 ²(k)与γ_n-1(k)(k＝0，1，…，K-1)相乘以获得G_n-1 ²(k)γ_n-1(k)，并将所获得的结果作为以往估计SNR 922传送至复用加权加法器707。由于复用乘法器704和705的结构与参照图7所描述的复用乘法器13的结构相同，所以将省略对其的详细描述。

向加法器708的另一端传送“-1”，并将求和结果γ_n(k)-1传送至多值域限制器701。多值域限制器701对从加法器708传送过来的求和结果γ_n(k)-1施加值域限制运算符P[·]的运算，并将结果P[γ_n(k)-1]作为瞬时估计SNR 921传送至复用加权加法器707。P[x]由以下等式定义。

[等式12]

P [x] = \{\begin{matrix} x, & x > 0 \\ 0, & x \leq 0 \end{matrix} - - - (12)

还向复用加权加法器707传送来自权重存储器706的权重923。复用加权加法器707通过使用传送过来的瞬时估计SNR 921、以往估计SNR922和权重923，来获得估计先验SNR 924。如果假设权重923为α，为估计先验SNR，则可以通过以下等式来计算

[等式13]

{\hat{ξ}}_{n} (k) = {αγ}_{n - 1} (k) {\overset{&OverBar;}{G}}_{n - 1}^{2} (k) + (1 - α) P [γ_{n} (k) - 1] - - - (13)

这里，假设

{\overset{&OverBar;}{G}}_{- 1}^{2} (k) γ_{- 1} (k) = 1 .

图16是示出了图15所示的多值域限制器701的结构的方框图。多值域限制器701包括常数存储器7011、最大值选择器7012₀至7012_k-1、分离器7013和复用器7014。向分离器7013传送来自图15的加法器708的γ_n(k)-1。分离器7013将传送过来的γ_n(k)-1分解为K个频域分量，并将这些频域分量传送至最大值选择器7012₀至7012_K-1。向最大值选择器7012₀至7012_K-1的另一输入传送来自常数存储器7011的“0”。最大值选择器7012₀至7012_K-1将γ_n(k)-1与“0”进行比较，以将较大的数值传送至复用器7014。此最大选择计算对应于以上等式12。复用器7014对这些数值进行复用和输出。

图17是示出了图15所示的复用加权加法器707的结构的方框图。复用加权加法器707包括加权加法器7071₀至7071_K-1、分离器7072和7074以及复用器7075。向分离器7072传送来自图15的多值域限制器701的、作为瞬时估计SNR 921的P[γ_n(k)-1]。分离器7072将P[γ_n(k)-1]分解为K个频域分量，并将这些频域分量作为频域瞬时估计SNR 921₀至92_k-1传送至加权加法器7071₀至7071_K-1。向分离器7074传送来自图15的复用乘法器705的、作为以往估计SNR 922的G_n-1 ²(k)γ_n-1(k)。

分离器7074将G_n-1 ²(k)γ_n-1(k)分解为K个频域分量，并将这些频域分量作为以往频域估计SNR 922₀至922_k-1传送至加权加法器7071₀至7071_K-1。另一方面，还向加权加法器7071₀至7071_K-1传送权重923。加权加法器7071₀至7071_K-1执行由上述等式13表示的加权加法，并将频域估计先验SNR 924₀至924_K-1传送至复用器7075。复用器7075对频域估计先验SNR 924₀至924_K-1进行复用，并输出复用SNR，作为估计先验SNR 924。接下来，将参照图18，对加权加法器7071₀至7071_K-1的操作和结构进行描述。

图18是示出了图17所示的加权加法器7071的结构的方框图。加权加法器7071包括乘法器7091和7093以及加法器7092和7094。作为每一输入，向加权加法器7071传送来自图16的分离器7072的频域瞬时估计SNR921、来自图17的分离器7074的以往频域SNR 922、和来自图15的权重存储器706的权重923。将包括数值α的权重923传送至常数乘法器7095和乘法器7093。常数乘法器7095将通过将输入信号与“-1”相乘所获得的-α传送至加法器7094。

向加法器7094的另一输入传送“1”，因此加法器7094的输出为1-α(二者之和)。将1-α传送至乘法器7091，并与另一输入(频域瞬时估计SNRP[γ_n(k)-1])相乘，并将乘积(1-α)P[γ_n(k)-1]传送至加法器7092。另一方面，乘法器7093将作为权重923传送过来的α与以往估计SNR 922相乘，并将乘积αG_n-1 ²(k)γ_n-1(k)传送至加法器7092。加法器7092输出(1-α)P[γ_n(k)-1]与αG_n-1 ²(k)γ_n-1(k)的和，作为频域估计先验SNR904。

图19是示出了图6所示的噪声抑制系数发生器8的结构的方框图。噪声抑制系数发生器8包括MMSE STSA增益函数值计算器811、广义似然比计算器812和抑制系数计算器814。下面，将根据在非专利文献2(IEEE TRANSACTIONS ON ACOUSTICS，SPEECH，AND SIGNALPROCESSING，VOL.32，NO.6，第1109～1121页，1984年12月)中所描述的计算等式，来描述抑制系数的计算方法。

假设帧数为n，频率数为k，γ_n(k)是从图6的频域SNR计算器6传送过来的频域后验SNR，

是从图6的估计先验SNR计算器7传送过来的频域估计先验SNR，以及q是从图6的语音缺失概率存储器21传送过来的语音缺失概率。此外，假设

η_{n} (k) = {\hat{ξ}}_{n} (k) / (1 - q)

v_n(k)＝(η_n(k)γ_n(k))/(1+η_n(k))

MMSE STSA增益函数值计算器811根据从图6的频域SNR计算器6传送过来的后验SNR γ_n(k)、从图6的估计先验SNR计算器7传送过来的估计先验SNR

以及从图6的语音缺失概率存储器21传送过来的语音缺失概率q，计算每一频率的MMSE STSA增益函数值，并将MMSESTSA增益函数值输出至抑制系数计算器814。

每一频率的MMSE STSA增益函数值G_n(k)由以下等式表示。

[等式14]

G_{n} (k) = \frac{\sqrt{π}}{2} \frac{\sqrt{v_{n} (k)}}{γ_{n} (k)} \exp (- \frac{v_{n} (k)}{2}) [(1 + v_{n} (k)) I_{0} (\frac{v_{n} (k)}{2}) + v_{n} (k) I_{1} (\frac{v_{n} (k)}{2})] - - - (14)

这里，I₀(z)是0阶修正贝塞尔函数，以及I₁(z)是1阶修正贝塞尔函数。在非专利文献3(MATHEMATICS DICTIONARY，IWANAMI BOOK SHOP，第374.G页，1985年)中描述了修正贝塞尔函数。

广义似然比计算器812根据从图6的频域SNR计算器6传送过来的后验SNRγ_n(k)、从图6的估计先验SNR计算器7传送过来的估计先验SNR

以及从图6的语音缺失概率存储器21传送过来的语音缺失概率q，来计算每一频率的广义似然比，并将广义似然比输出至抑制系数计算器814。

每一频率的广义似然比Λ_n(k)由以下等式表示。

[等式15]

Λ_{n} (k) = \frac{1 - q}{q} \frac{\exp (v_{n} (k))}{1 + η_{n} (k)} - - - (15)

抑制系数计算器814根据从MMSE STSA增益函数值计算器811传送过来的MMSE STSA增益函数值G_n(k)和从广义似然比计算器812传送过来的广义似然比Λ_n(k)，计算每一频率的抑制系数，并将抑制系数输出至图6的抑制系数修正器15。每一频率的抑制系数G_n(k)由以下等式表示。

[等式16]

{\overset{&OverBar;}{G}}_{n} (k) = \frac{Λ_{n} (k)}{Λ_{n} (k) + 1} G_{n} (k) - - - (16)

代替计算每一频率的SNR，也可以计算和使用在包括多个频率在内的频带内公用的SNR。

图20是示出了图6所示的抑制系数修正器15的结构的方框图。抑制系数修正器15包括频域抑制系数修正器1501₀至1501_K-1、分离器1502和1503以及复用器1504。

分离器1502将从图6的估计先验SNR计算器7传送过来的估计先验SNR分解为频域分量，并将这些频域分量分别输出至频域抑制系数修正器1501₀至1501_K-1。分离器1503将从图6的噪声抑制系数发生器8传送过来的抑制系数分解为频域分量，并将这些频域分量分别输出至频域抑制系数修正器1501₀至1501_K-1。

频域抑制系数修正器1501₀至1501_K-1根据从分离器1502传送过来的频域估计先验SNR和从分离器1503传送过来的频域抑制系数，来计算频域修正抑制系数，并将频域修正抑制系数输出至复用器1504。复用器1504对从频域抑制系数修正器1501₀至1501_K-1传送过来的频域修正抑制系数进行复用，并将复用频域修正抑制系数作为修正抑制系数输出至图6的复用乘法器16和估计先验SNR计算器7。

接下来，将参照图21，对频域抑制系数修正器1501₀至1501_K-1的结构和操作进行详细描述。

图21是示出了包括在抑制系数修正器15中的频域抑制系数修正器1501₀至1501_K-1的结构的方框图。频域抑制系数修正器1501包括最大值选择器1591、抑制系数下限值存储器1592、阈值存储器1593、比较器1594、开关1595、修正值存储器1596和乘法器1597。

比较器1594将从阈值存储器1593传送过来的阈值与从图20的分离器1502传送过来的频域估计先验SNR进行比较，当频域估计先验SNR大于阈值时，比较器1594向开关1595传送“0”，而当频域估计先验SNR小于阈值时，比较器1594向开关1595传送“1”。当比较器1594的输出值为“1”时，开关1595将从图20的分离器1503传送过来的频域抑制系数输出至乘法器1597，以及当输出值为“0”时，将频域抑制系数输出至最大值选择器1591。即，当频域估计先验SNR小于阈值时，对抑制系数进行修正。乘法器1597计算开关1595的输出值与修正值存储器1596的输出值的乘积，并将所述乘积输出至最大值选择器1591。

另一方面，抑制系数下限值存储器1592向最大值选择器1591传送所存储的抑制系数的下限值。最大值选择器1591将从图20的分离器1503传送过来的频域抑制系数或由乘法器1597计算出的乘积与从抑制系数下限值存储器1592传送过来的抑制系数下限值进行比较，并将较大的数值输出至图20的复用器1504。即，抑制系数必将变为比抑制系数下限值存储器1592所存储的下限值大的数值。

在所有上述典型实施例中，虽然假设采用最小均方短时谱幅度方法作为噪声抑制方法，但是这些实施例也可以应用于其他噪声抑制方法。这些噪声抑制方法的示例包括：在非专利文献4(PROCEEDINGS OFTHE IEEE，VOL.67，NO.12，第1586～1604页，1979年12月)中所公开的维纳滤波器方法；以及在非专利文献5(IEEE TRANSACTIONS ONACOUSTICS，SPEECH，AND SIGNAL PROCESSING，VOL.27，NO.2，第113～120页，1979年4月)中所公开的谱扣除方法，这里省略了对上述方法结构示例的详细描述。

上述每一典型实施例的噪声抑制设备均可以计算机设备来进行配置，所述计算机设备包括：用于蓄积程序等的存储设备、设置有按键和开关的操作单元、诸如LCD等的显示设备、以及通过接收来自操作单元的输入来控制每一部件的操作的控制设备。当控制设备执行存储在存储设备中的程序时，将实现上述每一典型实施例的噪声抑制设备的操作。程序可以预先存储在存储设备中，或者可以将其写入诸如CD-ROM等记录介质来提供给用户。也可以通过网络来提供所述程序。

Claims

1.一种噪声抑制方法，用于抑制包括在输入信号中的噪声，其特征在于包括：

将所述输入信号转换为频域信号；

修正所述频域信号的幅度，以获得幅度修正信号；

使用所述幅度修正信号，来获得估计噪声；

使用所述估计噪声和所述幅度修正信号，来确定抑制系数；以及

以所述抑制系数对所述幅度修正信号进行加权。

2.根据权利要求1所述的噪声抑制方法，其特征在于包括：

修正所述频域信号的相位，以获得相位修正信号；以及

将通过以所述抑制系数对所述幅度修正信号进行加权所获得的结果和所述相位修正信号转换为时域信号。

3.根据权利要求1或2所述的噪声抑制方法，其特征在于包括：

消除所述输入信号的偏移，以获得偏移消除信号；以及

将所述偏移消除信号转换为所述频域信号。

4.一种噪声抑制设备，用于抑制包括在输入信号中的噪声，其特征在于包括：

转换器，用于将所述输入信号转换为频域信号；

幅度修正器，用于修正所述频域信号的幅度，以获得幅度修正信号；

噪声估计器，用于使用所述幅度修正信号，来获得估计噪声；

抑制系数发生器，用于使用所述估计噪声和所述幅度修正信号，来确定抑制系数；以及

乘法器，用于以所述抑制系数对所述幅度修正信号进行加权。

5.根据权利要求4所述的噪声抑制设备，其特征在于包括：

相位修正器，用于修正所述频域信号的相位，以获得相位修正信号；以及

逆转换器，用于将通过以所述抑制系数对所述幅度修正信号进行加权所获得的结果和所述相位修正信号转换为时域信号。

6.根据权利要求4或5所述的噪声抑制设备，其特征在于包括：

偏移消除器，用于消除所述输入信号的偏移，以获得偏移消除信号；以及

转换器，用于将所述偏移消除信号转换为所述频域信号。

7.一种计算机程序，用于对信号进行处理，以抑制包括在输入信号中的噪声，所述计算机程序使计算机执行以下处理：