CN101904097B

CN101904097B - 噪声抑制方法和设备

Info

Publication number: CN101904097B
Application number: CN200780102005.3A
Authority: CN
Inventors: 佩尔·阿格伦; 安德尔斯·埃里克松
Original assignee: Telefonaktiebolaget LM Ericsson AB
Current assignee: Telefonaktiebolaget LM Ericsson AB
Priority date: 2007-12-20
Filing date: 2007-12-20
Publication date: 2015-05-13
Anticipated expiration: 2027-12-20
Also published as: EP2232703A1; CN101904097A; JP2011508505A; EP2232703B1; JP5086442B2; WO2009082299A1; EP2232703A4; US20100274561A1; US9177566B2

Abstract

本发明涉及一种数字滤波器的方法和设备，所述数字滤波器用于对表示声学记录的信号进行噪声抑制。所述方法包括：确定所述数字滤波器的期望频率响应(H(ω))；基于期望频率响应来产生噪声抑制滤波器。以期望频率响应不超过最大水平的方式来确定期望频率响应，其中，所述最大水平是响应于要滤波信号来确定的。

Description

噪声抑制方法和设备

技术领域

本发明涉及数字滤波器设计领域。具体地，本发明涉及设计用于在表示声学记录的信号中进行噪声抑制的数字滤波器的领域。

背景技术

由于自然环境中噪声的普遍存在，现实世界声音记录典型地包含来自各种源的噪声。为了改进声音记录的声音质量，已经开发了各种方法用于减小声音记录的噪声水平。通常，在这种方法中，根据期望频率响应H(ω)来计算时域噪声抑制滤波器，然后将时域噪声抑制滤波器应用至声音记录。

在理想的噪声抑制滤波器中，期望声学信号应当无失真地通过滤波器，而噪声应当被完全衰减。在实际滤波器中，这些属性不能同时满足(除非在没有期望信号或没有噪声或者期望信号和噪声在频谱上分离的特殊情况下)。因此，在确定滤波器的期望频率响应H(ω)时，对于期望信号和噪声共存的频率，必须进行使期望信号失真与使噪声失真之间的权衡。

可以通过各种方法来估计期望频率响应H(ω)，如频谱减法。在“Low-distortion spectral subtraction for speech enhancement”，PeterConference Proceedings of Eurospeech，pp.1549-1553，ISSN1018-4074，1995中讨论了用于抑制噪声的频谱减法的不同方面。在US5,706,395中，讨论了频谱减法并公开了一种用于定义应当将噪声衰减至的水平的方法。在US5,706,395中，期望频率响应H(ω)被箝位为衰减不能低于最小值，其中根据US5,706,395，最小值可以依赖于要滤波的有噪话音信号的信噪比。US5,706,395对期望频率响应的箝位防止了噪声抑制滤波器围绕非常小的值波动，从而避免了通常称为音乐噪声的噪声失真。

在许多频谱减法方法中，作为信噪比(SNR)的函数来计算期望频率响应。由于在特定频率处有噪声学信号的SNR随时间变化，一般随时间更新期望频率响应H(ω)——通常针对每个数据帧来更新期望频率响应H(ω)。这样做的效果是，通常将在有噪话音信号中处于恒定水平的噪声衰减至以可察觉的方式随时间显著变化的水平，导致残余噪声的波动。这种不利效果通常称为噪声脉动，可以作为伴随语音(shadow voice)而被听见。

发明内容

本发明所涉及的问题如何避免残余噪声中的不利波动。

这一问题是通过一种设计数字滤波器的方法来解决的，所述数字滤波器用于对要滤波的信号进行噪声抑制，其中所述信号表示声学记录。所述方法包括：确定所述数字滤波器的期望频率响应并基于期望频率响应来产生噪声抑制滤波器。所述方法的特征在于，以期望频率响应不超过最大水平的方式来确定期望频率响应，其中，所述最大水平是响应于要滤波信号来确定的。

此外，这一问题是通过一种数字滤波器设计设备来解决的，所述数字滤波器设计设备被配置为设计用于对要滤波的信号进行噪声抑制的数字滤波器，其中所述信号表示声学记录。所述数字滤波器设计设备包括：期望频率响应确定设备，被配置为响应于要滤波的信号来确定期望频率响应，其中，期望频率响应确定设备被配置为根据要滤波的信号来确定期望频率响应的最大水平；并且以期望频率响应不超过所述最大水平的方式来确定期望频率响应。

此外，这一问题是通过一种被配置为执行本发明方法的计算机程序产品来解决的。

通过响应于要滤波的信号来确定所设计的滤波器的期望频率响应的最大水平，可以减小残余噪声中的不利波动，因此可以提高声学信号的感知声学质量。例如，如果要滤波的信号的功率密度随时间变化，则最大水平可以以最小化功率密度变化对滤波后的信号的影响的方式，以与功率密度变化的时间标度适配的时间标度来变化。

此外，也可以作为频率的函数来确定最大水平。通过允许最大水平随要滤波的信号的频率而变化，可以更进一步提高滤波后的信号的感知质量。例如，与通常存在话音的高频相比，在通常仅包含噪声的低频处，可以将最大水平设置为较低的值。

有利地，可以基于对要滤波的信号的噪声水平的测量，如信噪比或噪声功率，来确定期望频率响应的最大水平。

本发明的其他有利实施例在从属权利要求中阐述。

附图说明

为了更完整地理解本发明及其优点，现在结合附图来参考以下描述，其中：

图1是数字滤波器设计设备的示意图。

图2a是示意本发明方法的实施例的流程图。

图2b是示意本发明方法的实施例的流程图。

图3是根据本发明实施例的期望响应确定设备的示意图。

图4a是并入了根据本发明的数字滤波器设计设备的用户设备的示意图。

图4b是通信系统中的节点的示意图，其中所述节点包括根据本发明的数字滤波器设计设备。

图5a示意了信号滤波的仿真结果，其中使用了传统滤波器设计方法。

图5b示意了信号滤波的仿真结果，其中使用了根据本发明的滤波器设计方法。

具体实施方式

具有期望话音分量s(t)和噪声分量n(t)的有噪话音信号y(t)可以表示为：

y(t)＝s(t)+n(t) (1)

在许多情况下，期望抑制噪声分量n(t)并形成话音分量的估计使得估计话音分量尽可能接近地与话音分量s(t)相似。一种实现方式是使用时域噪声抑制滤波器h(z)对有噪信号y(t)进行滤波，时域噪声抑制滤波器h(z)被设计为去除尽可能多的噪声分量n(t)，同时保留尽可能多的话音分量s(t)。

通常，根据期望频率响应H(ω)来计算噪声抑制滤波器h(z)，其中H(ω)是实值函数，典型地被设计为使得对于y(t)仅包含噪声的频率ω，H(ω)接近于零，而对于y(t)仅包含话音的频率ω，H(ω)＝1，并且对于y(t)包含有噪话音的频率ω，0＜H(ω)＜1。

在确定有噪信号的话音分量时，通常对有噪信号的样本的帧应用线性变换F[·]。通过假定以下关系：

F [\hat{s} (t)] = H (ω) F [y (t)] - - - (2)

其中F[·]表示如快速傅立叶变换(FFT)之类的线性变换，作为期望频率响应H(ω)的反线性变换F^-1[·]来获得噪声抑制滤波器h(z)。因此，可以通过：

\hat{s} (t) = F^{- 1} [H (ω)] &CircleTimes; y (t) = h (z) &CircleTimes; y (t) - - - (3)

来获得话音分量估计其中表示卷积。

因此，为了得到话音分量估计必须确定期望频率响应H(ω)。如上所述，对于y(t)包含有噪话音的频率ω，0＜H(ω)＜1。在y(t)包含有噪话音的特定频率处的H(ω)的值通常是根据该频率处有噪话音信号y(t)的信噪比(SNR)来选择的。

可以通过各种方法来估计期望频率响应H(ω)，如频谱减法。由于在特定频率处SNR随时间变化，因此一般随时间更新期望频率响应H(ω)——通常，针对每个数据帧来更新期望频率响应H(ω)。因此，期望频率响应H(ω)典型地在帧之间变化，使得H(k_n，ω)≠H(k_n+1，ω)，其中k_n表示具有帧编号n的帧的定时。备选地，可以以不同的时间间隔来更新期望频率响应H(ω)并从而更新根据期望频率响应来确定的滤波器配置。因此，期望频率响应和滤波器配置随时间变化。然而，为了简化描述，在以下表述中不显式示出H(ω)和h(z)的时间依赖性。

在以频谱减法方法来确定期望频率响应H(ω)时，通常使用以下表达式：

H (ω) = {(1 - δ (ω) {(\frac{{\hat{Φ}}_{n} (ω)}{{\hat{Φ}}_{y} (ω)})}^{γ_{1}})}^{γ_{2}} . - - - (4)

其中和分别是n(t)和y(t)的功率谱密度的估计，δ(ω)是用于减小音乐噪声的过减因子。如上所述，通常，将噪声抑制限制到水平H_min以限制通常称为音乐噪声的残余噪声的小波动是有利的。此时，表达式(4)可以采取以下形式：

H (ω) = \max {{(1 - δ (ω) {(\frac{{\hat{Φ}}_{n} (ω)}{{\hat{Φ}}_{y} (ω)})}^{γ_{1}})}^{γ_{2}}, H_{\min}} . - - - (4 a)

γ₁和γ₂是确定H(ω)≈1与H(ω)＝H_min之间的转变的急剧程度的因子。当γ₁＝γ₂＝1时，表达式(4)通常表示维纳滤波方法。

图1示意了滤波器设计设备100，滤波器设计设备100被配置为基于接收到的经采样的有噪话音信号y(t)来产生合适的噪声抑制滤波器h(z)。滤波器设计设备100具有：输入103，用于接收要滤波的有噪话音信号y(t)；以及输出104，用于输出表示所设计的数字滤波器h(z)的信号。滤波器设计设备100包括：线性变换设备105，被配置为接收经采样的有噪话音信号y(t)并产生经采样的有噪话音信号y(t)的线性变换Y(ω)。图1的滤波器设计设备100还包括：期望响应确定设备110，被配置为接收经采样的信号y(t)的线性变换Y(ω)，并基于线性变换Y(ω)来确定期望频率响应H(ω)。滤波器设计设备100还包括：滤波器信号产生设备112，滤波器信号产生设备112包括反线性变换设备115，反线性变换设备115被配置为接收期望频率响应H(ω)并产生期望频率响应H(ω)的反线性变换。一般地，在滤波器信号产生设备112中对反线性变换设备115的输出进行进一步处理，例如以US7,251,271中描述的方式，以获得滤波器h(z)。滤波器信号产生设备112的输出是表示滤波器h(z)的信号，滤波器信号产生设备112的输出有利地连接至滤波器设计设备100的输出104。

在理想噪声抑制技术中，任何话音应无失真地通过。因此，对于有噪话音信号y(t)包括话音分量s(t)的所有频率，H(ω)应满足H(ω)＝1。另一方面，理想噪声抑制技术应当将任何噪声衰减至期望噪声水平H_min，要求对于有噪话音信号y(t)包括噪声分量n(t)的所有频率H(ω)＝H_min。

一般不能同时满足上述期望属性，这是由于语音和噪声通常同时存在于相同频率。因此，在确定滤波器的期望频率响应H(ω)时，对于话音和噪声共存的频率，必须进行使话音失真与使残余噪声失真之间的权衡。当在存在话音的频率处H(ω)＜1时，话音被认为失真。当在存在噪声的频率处H(ω)≠H_min时，残余噪声被认为失真，其中残余噪声定义为：

n^{residual} (t) = h (z) &CircleTimes; n (t) . - - - (5)

根据本发明，选择期望频率响应使得应用H(ω)的适当最大水平，其中最大水平是响应于有噪话音信号y(t)来选择的。从以下可以看到，最大水平可以被选择为使得可以以受控的方式来限制话音和残余噪声中的失真。从而可以减小噪声衰减的波动以及噪声和话音失真的其他影响。

在图2a中，示出了示意用于确定期望频率响应H(ω)的本发明方法的流程图。在步骤205，根据有噪话音信号y(t)来确定期望频率响应的最大水平H_max——更具体地，可以有利地根据有噪话音信号y(t)的线性变换Y(ω)来确定最大水平H_max。可以基于有噪话音信号y(t)的当前时间实例(即要对其应用要确定的滤波器h(z)的有噪话音信号的时间实例)；基于在要对其应用要确定的滤波器h(z)的实例的时间实例之前的有噪话音信号y(t)的时间实例(或有噪话音信号y(t)的当前和先前时间实例的组合)来确定H_max。H_max可以是或不是频率ω的函数，H(ω)的最大水平以下表示为H_max(ω)。此外，H_max(ω)可以在不同时刻之间变化或不变。然而，一般地，以下不显式示出这种变化。可以以多种不同方式来确定H_max(ω)，其中一些方式在以下描述。

当在步骤205确定了H_max(ω)时，进入步骤210，其中根据H_max(ω)来确定期望频率响应H(ω)。在本发明的一个实现中，针对高于转换频率ω₀的所有频率ω，H(ω)可以例如被选择为等于H_max(ω)；针对低于ω₀的频率，H(ω)可以被选择为等于期望频率响应的最小水平H_min。在该实现中，转换频率ω₀可以例如被确定为以下频率(或者以任何其他合适的方式来确定)：低于该频率，有噪话音信号的话音分量s(t)的功率小于阈值。

图2b示意了本发明方法的实现，其中根据期望频率响应的近似H^approx(ω)以及根据最大水平H_max(ω)来执行确定期望频率响应的步骤205。在图2b的步骤205中，确定最大水平H_max(ω)(见图2a)。然后，进入步骤207，其中基于经采样的信号y(t)的线性变换Y(ω)来确定期望频率响应的近似H^approx(ω)。例如，可以使用表达式(4)来获得期望频率响应的这一近似H^approx(ω)。然后进入步骤210，其中基于期望频率响应的近似H^approx(ω)与期望频率响应的最大值H_max(ω)之间的比较来确定H(ω)的值。例如，可以使用以下表达式来执行上述确定：

H(ω)＝min{H^approx(ω)，H_mzx(ω)} (6)

优选地，应当针对应确定H(ω)值的每个频率箱体来进行表达式(6)所表达的选择。因此，图2b的步骤210优选地针对应确定H(ω)值的每个频率箱体来重复进行。然而，可能存在以下情况：对期望频率响应的最大水平的限制对于频谱的某些部分不那么有利。在与这种实现相关的实现中，应当仅针对需要对期望频率响应的最大值进行限制的频率箱体重复进行步骤210。

备选地，可以在步骤205之前执行步骤207。

在图2b的方法中(以及在图2a的方法中)可以包括检查值H^approx(ω)是否小于期望频率响应的最小值H_min。

然后，可以有利地将表达式(6)改变为如下：

H(ω)＝max{min{H^approx(ω)，H_max(ω)}，H_min} (6a)

或如下：

H(ω)＝min{max{H^approx(ω)，H_min}，H_max(ω)} (6b)

使用表达式(6a)还是(6b)取决于期望H(ω)取值H_max(ω)还是值H_min，其中H_min＞H_max。与H_max(ω)一样，H_min可以随频率改变，并且可以在不同时刻取不同值。

如上所述，H_max(ω)可以被设置为适用于所有频率和/或所有时刻的固定值。当H_max(ω)独立于时间和频率时，H_max＜1的值将用于限制存在话音的时刻与仅存在噪声的时刻之间在特定频率处的噪声抑制的差异，即可以减小残余噪声的波动。然后，所发生的话音失真总是至少为H_max所确定的程度。然而，为了减小话音失真以及提高获得对噪声衰减的波动的有效减小的可能性，有利地，引入随频率和时间变化的最大期望频率响应H_max(ω)。

例如，可以基于对有噪话音信号y(t)的噪声水平的测量，如有噪话音信号y(t)的信噪比SNR(ω)、不同频率处话音分量估计的SNR(ω)或话音分量估计的总信噪比等(其中“总”是指在相关频带上执行积分(见以下表达式(14)))，来导出图2的步骤205中确定的H_max(ω)的值。备选地，可以使用其他测量来确定H_max(ω)。优选地，所述其他测量应与信噪比相关：例如，H_max(ω)的确定可以基于有噪话音信号y(t)在不同频率处的噪声功率电平P_n(t，ω)，或基于有噪话音信号的总噪声水平对信号y(t)的噪声功率电平的测量可以被视为对信噪比的测量，其中假定信号功率具有特定值。H_max(ω)的值可以备选地基于有噪话音信号y(t)的功率电平，或基于有噪话音信号y(t)的任何其他测量。

基于SNR(t，ω)的最坏情况考虑的H _max

由于在H(ω)在特定时间段内变化时，针对该时间段获得的估计话音分量的SNR取决于H(ω)(见以下内容)，因此例如可以从话音分量估计的SNR(ω)的最坏情况考虑来导出H_max(ω)的表达式。

话音分量估计的SNR(ω)可以表达为：

SNR (ω) = \frac{{\hat{Φ}}_{\hat{s}} (ω)}{{\hat{Φ}}_{n^{residual}} (ω)} \approx \frac{H (ω) {{\hat{Φ}}_{y} (ω) - {\hat{Φ}}_{n} (ω)}}{H (ω) {\hat{Φ}}_{n} (ω)} - - - (8)

其中分别是对所估计的话音分量有噪话音信号y(t)和噪声分量n(t)的谱密度的估计，是对残余噪声n^residual(t)的谱密度的估计。

从以上表达式(1)-(3)和(8)可以看到，瞬时地，针对特定频率ω的的SNR(ω)独立于H(ω)(并且等于该频率处y(t)的SNR)。然而，与瞬时SNR不同，典型地，当H(ω)在特定时间段内变化时，针对该时间段的SNR依赖于H(ω)。为了示意这一点，考虑以下简单示例：其中基于在两个不同时刻t_A和t_B采集的两个采样y(t_A)和y(t_B)来确定SNR，并且在t_A获得的采样包含有噪话音：y(t_A)＝s(t_A)+n(t_A)；在t_B处的采样仅包含噪声：y(t_B)＝n(t_B)。假定针对特定频率ω的期望频率响应H(ω)在不同时刻取不同值，使得H(t_A，ω)≠H(t_B，ω)，基于这两个采样的针对频率ω的的SNR可以表示为：

SNR (ω) = \frac{{\hat{Φ}}_{\hat{s}} (t_{A}, ω) + 0}{{\hat{Φ}}_{n^{residual}} (t_{A}, ω) + {\hat{Φ}}_{n^{residual}} (t_{A}, ω)} \approx

\approx \frac{H (t_{A}, ω) {{\hat{Φ}}_{y} (t_{A}, ω) - {\hat{Φ}}_{n} (t_{A}, ω)}}{H (t_{A}, ω) {\hat{Φ}}_{n} (t_{A}, w) + H (t_{B}, ω) {\hat{Φ}}_{n} (t_{B}, ω)} . - - - (8 a)

显然，表达式(8a)中的SNR依赖于H(ω)，由于H(t_B，ω)仅存在于表达式(8a)的分母中。

当假定话音被最大衰减并且噪声被最小衰减时给出最坏情况SNR。对于频率ω，这可以表示为：

{SNR}_{worstcasc} (ω) \approx \frac{H_{\min}^{2} ({\hat{Φ}}_{y} (ω) - {\hat{Φ}}_{n} (ω))}{H_{\max}^{2} (ω) {\hat{Φ}}_{n} (ω)} . - - - (9)

为了限制最坏情况SNR，可以提供最坏情况SNR的最小值β，其中β是频率的函数：

{SNR}_{worstcasc} (ω) = \frac{H_{\min}^{2} ({\hat{Φ}}_{y} (ω) - {\hat{Φ}}_{n} (ω))}{H_{\max}^{2} (ω) {\hat{Φ}}_{n} (ω)} &GreaterEqual; β (ω) . - - - (10)

在表达式(10)中，β(ω)形成了最坏情况SNR的下限。以下将β称为容限阈值。优选地，针对所有频率，应当对容限阈值β给出大于0的值。

表达式(10)得到针对H(ω)的最大水平的以下表达式：

H_{\max} (ω) \leq \sqrt{\frac{H_{\min}^{2}}{β (ω)} \frac{{\hat{Φ}}_{y} (ω) - {\hat{Φ}}_{n} (ω)}{{\hat{Φ}}_{n} (ω)}} - - - (11)

通过针对H_min＝0或的特殊情况来定义H_max(ω)＝0，这些情况将被(11)所涵盖。

由于期望H(ω)以及从而H_max(ω)尽可能大，以最小化话音失真，因此(11)可以简化为：

H_{\max} (ω) = \sqrt{\frac{H_{\min}^{2}}{β (ω)} \frac{{\hat{Φ}}_{y} (ω) - {\hat{Φ}}_{n} (ω)}{{\hat{Φ}}_{n} (ω)}} - - - (12)

容限阈值β(ω)对最坏情况SNR可以多小定义了限制。β(ω)可以取大于0的任何值。在用于移动通信的噪声抑制应用中，β(ω)的值可以例如落在-10至10dB范围内。这种应用中β(ω)的典型值可以是-3dB，这已经被证明以合理的话音失真代价将残余噪声的波动减小至对于H_min(ω)的大多数值残余噪声不可察觉。

例如，可以根据以下表达式来选择容限阈值：

β (ω) = f (D_{acceptable}^{noise}) - - - (13 a)

或

β (ω) = g (D_{acceptable}^{speech}) - - - (13 b)

其中，f是递增函数，g是递减函数，是噪声的可接受失真，是话音的可接受失真(可以从中获得D^noise和D^speech的值的关系在以下表达式(21)和(22)中给出)。

在部分或整个频率范围内，β(ω)也可以取恒定值。如果对最小化残余噪声失真赋予比最小化话音失真更高的优先级，则β应当优选地被给予较大的值，例如大约+3dB。另一方面，如果最小化话音失真比最小化残余噪声更加重要，则β应当优选地被给予较小的值，例如大约-7dB。

在本发明的一个实现中，β(ω)的值可以取决于有噪话音信号在特定时间和频率处是否包含话音分量。如果在特定频率处没有话音分量，则β(ω)的值将被设置为相对较大的值；当在该特定频率处出现话音分量时，β(ω)的值可以有利地缓慢下降至明显较小的值。在话音出现时缓慢减小β(ω)的值时，实现了在不存在话音时获得高效的噪声抑制，并且在该特定频率处得到的话音失真以收听信号的人耳不会察觉到对话音分量估计的滤波的逐渐改变的方式逐渐减小。

基于总信噪比的H _max

如上所述，可以基于对总信噪比的考虑来确定H_max(ω)，其中

S \overset{&OverBar;}{N} R = \frac{{&Integral;}_{w 1}^{w 2} {{\hat{Φ}}_{y} (ω) - {\hat{Φ}}_{n} (ω)} dω}{{&Integral;}_{ω 1}^{w 2} {\hat{Φ}}_{n} (ω) dω} . - - - (14)

H_max的值可以例如从以下表达式获得：

H_{\max} = a {[S \overset{&OverBar;}{N} R]}^{b} + c - - - (15)

或从以下表达式获得：

H_{\max} = a \log_{2} [S \overset{&OverBar;}{N} R] + b - - - (16)

基于噪声功率电平P_n(ω)的H_max

此外，备选地，可以基于对噪声功率电平P_n(ω)的考虑来确定H_max(ω)的值，例如通过表达式(17)或(18)中提供的关系之一：

H_max(ω)＝a[P_n(ω)]^-b+c (17)

H_max(ω)＝alog₂[P_n(ω)]+b (18)

基于总噪声功率电平的H _max

备选地，可以基于对总噪声功率电平的考虑来确定H_max(ω)，其中是在ω₁和ω₂之间的频率区域内测量的噪声功率电平。

H_max的值可以例如从以下表达式获得：

H_{\max} = a {[{\overset{&OverBar;}{P}}_{n}]}^{- b} + c - - - (19)

或从以下表达式获得：

H_{\max} = a \log_{2} {\overset{&OverBar;}{P}}_{n} + b - - - (20)

在以上表达式(15)-(20)中，a、b和c是表示可以通过实验导出合适值的常数。也可以使用确定期望频率响应的最大水平H_max的其他方法。

图3中示意了根据本发明的期望响应确定设备110的实施例。图3的期望响应确定设备110包括：响应近似确定设备300、最大响应确定设备305和最小值选择器310。响应近似确定设备300被配置为：对馈送至期望响应确定设备110的输入315的信号(即典型为有噪话音信号的线性变换Y(ω))进行操作。此外，响应近似确定设备300被配置为基于输入信号来确定期望频率响应的近似H^approx(ω)。有利地，可以以用于确定期望频率响应的传统方式，例如根据上述表达式(4)来确定H^approx(ω)。

图3的最大响应确定设备305被配置为确定期望频率响应的最大水平H_max(ω)。在本发明的许多实施例中，最大响应确定设备305被配置为接收并操作线性变换Y(ω)，或接收并操作有噪话音信号y(t)，以例如根据上述表达式(12)或(15)-(20)中任一项来确定H_max(ω)。(在图3的实施例中，最大响应确定设备305被配置为接收线性变换Y(ω))。然而，在其他实施例中，可以以其他方式来确定H_max(ω)——其中之一为H_max(ω)取恒定值——并且可以省略图3所示的期望响应确定设备110的输入与最大响应确定设备之间的连接。

在图3所示的设备中，响应近似确定设备300的输出(由此传送表示H^approx(ω)的信号)和最大响应确定设备的输出(由此传送表示H_max(ω)的信号)均连接至最小值选择器310的输入。最小值选择器310被配置为：将表示H_max(ω)的信号与信号H^approx(ω)进行比较，并选择H_max(ω)与H^approx(ω)中的较小者。然后，最小值选择器310被配置为输出H_max(ω)与H^approx(ω)中的较小者。最小值选择器310的输出表示期望频率响应H(ω)的值，最小值选择器310的输出连接至期望频率响应确定设备110的输出320，以便将表示期望频率响应H(ω)的值馈送至输出320。

图3的期望响应确定设备110可以包括图3中未示出的其他组件，如最大值选择器，被配置为将频率响应的值与期望频率响应的最小水平H_min(ω)进行比较，并选择所比较值的最大值。有利地，这种最大值选择器可以被配置为将H_min(ω)与最小值选择器310的输出进行比较，在这种情况下，最大值选择器的输出可以有利地连接至期望响应确定设备110的输出320。备选地，这种最大值选择器可以被配置为将H_min(ω)与响应近似确定设备300的输出进行比较，在这种情况下，最大值选择器的输出有利地连接至最小值选择器310的输入而不是将响应近似确定设备300的输出连接至最小值选择器310(见上述表达式(6a)和(6b))。期望响应确定设备110还可以包括如缓冲器等其他组件。

期望频率响应确定设备110可以有利地由合适的计算机软件和/或硬件来实现，作为滤波器设计设备100的一部分。根据本发明的滤波器设计设备100可以有利地在用于传输话音的用户设备中实现，如移动电话、固定线路电话、无线电话机等等。滤波器设计设备100还可以在处理声学信号的其他类型的用户设备中实现，如便携式摄像机、录音电话等。在图4a中，示出了包括根据本发明的滤波器设计设备的用户设备400。用户设备400可以被配置为根据本发明在记录声学信号时和/或在重放已经在不同时刻和/或由不同用户设备记录的声学信号时执行噪声抑制。

此外，根据本发明的滤波器设计设备100可以有利地在通信网络中需要执行噪声抑制的中间节点中实现，如在IP多媒体子系统(IMS系统)中的媒体资源功能处理器(MRFP)中、在移动媒体网关中等等。图4b示出了包括节点410的通信系统405，节点410包括根据本发明的滤波器设计设备100。

表1以及图5a和5b示意了通过根据上述表达式(4a)针对特定时间t’和频率ω’来确定期望频率响应H(t’，ω’)(图5a)以及通过根据本发明的实施例确定期望频率响应H(t’，ω’)(图5b)而获得的仿真结果。在图5b中，使用表达式(6a)来确定H(t’，ω’)，其中使用表达式(12)来确定H_max(t’，ω’)，其中β(ω’)＝3dB，并且通过表达式(4)获得H^approx(t’，ω’)。在图5a中，用于获得H(t’，ω’)的方法以传统方式不对H(t’，ω)施加上限，即在图5a和5b所示的仿真中，均使用相关参数的以下值：δ(t′，ω′)＝1，γ₁＝γ₂＝1，并且当前时间和频率处y(t’)的SNR为10dB。

可以使用以下表达式作为对残余噪声的失真D^noise的测量：

D^{noise} = \frac{H^{2} (ω)}{H_{\min}^{2}} - - - (21)

而话音的失真D^speech可以表示为：

D^{speech} = \frac{1}{H^{2} (ω)} . - - - (22)

D^noise也可以用作对残余噪声的波动的测量。

在图5a和5b中，指示了5个不同信号水平：

1：有噪话音信号y(t’)的功率谱密度

2：噪声分量n(t’)的功率谱密度

3：期望噪声水平

4：话音分量估计的功率谱密度：

{\hat{Φ}}_{y} (t^{'}, ω^{'}) - H^{2} (t^{'}, ω^{'})

5：残余噪声n_residual(t′)的功率谱密度：

{\hat{Φ}}_{n} (t^{'}, ω^{'}) - H^{2} (t^{'}, ω^{'})

此外，在图5a和5b中指示了多个不同信号水平差：

A：有噪话音信号y(t’)的SNR(t’)以及话音分量估计的SNR(t’)(10dB)

B：

H_{\min}^{2} (15 dB)

C：话音失真：-H²(t′，ω′)

D：残余噪声失真：

H_{\min}^{2} - H^{2} (t^{'}, ω^{'})

E：H²(t′，ω′)

在表1中，给出了通过图5a中示意的确定H(ω)的传统方法和图5b中示意的本发明方法获得的D^noise和D^speech的值，以及最坏情况信噪比的值。

	根据(4a)确定的H(t’，ω’)	根据(6)和(12)确定的H(t’，ω’)
			H²(t′，ω′)	-0.41dB	-8dB
D^noise	14.59dB	7dB
			D^speech	0.41dB	8dB
最坏情况SNR	-4.59dB	3dB

表1.传统噪声抑制方法与根据本发明实施例的噪声抑制方法获得的噪声抑制的比较

从图5a和5b所示的仿真结果以及表1可以清楚看到，本发明方法获得的残余噪声失真和最坏情况SNR优于传统噪声抑制技术所获得的残余噪声失真和最坏情况SNR。这种改进总体上是以话音失真的增大为代价而获得的。然而，在许多情况下，如果减小了残余噪声中的波动，则话音失真的增大是可接受的。此外，从以上可以清楚看到，可以容易地计算根据本发明在残余噪声与话音的失真之间进行的权衡的效果。因此，判定是否要应用本发明方法来选择滤波器配置的期望频率响应可以基于对应用本发明方法将对话音失真对残余噪声失真具有何种结果的分析来进行。这种分析可以时常进行，可以基于该分析来判定是否要应用本发明方法来确定H(ω)。如果发现从确定H(ω)的传统方式至根据本发明的方法的转换是合适的，则可以有利地逐渐进行这种转换，以实现收听者不可察觉的无缝转变。

通过本发明，获得了一种灵活并且计算简单的方式来确定数字滤波器的期望频率响应H(ω)。通过应用该方法，可以以受控的方式来减小残余噪声的波动，并且残余噪声中的波动量与话音失真之间的必要权衡变得相当简单。本发明可以成功地应用于基于频谱减法的任何噪声减小方法。

以上就有噪话音信号的噪声抑制讨论了本发明。但是本发明也可以有利地应用于其他类型的声学记录中的噪声抑制。以上将要抑制噪声的信号y(t)称为有噪话音信号，但可以是任何类型的有噪声学记录。

本领域技术人员可以认识到，本发明不限于在附图中公开的实施例和以上详细描述，在附图中公开的实施例和以上详细描述仅呈现用于示意目的，可以以多种不同方式来实现本发明，本发明由所附权利要求来限定。

Claims

1.一种设计数字滤波器h(z)的方法，所述数字滤波器用于对要滤波的信号y(t)进行噪声抑制，其中所述信号表示声学记录，所述方法包括：

确定所述数字滤波器的期望频率响应H(ω)；

基于期望频率响应来构造噪声抑制滤波器；所述方法的特征在于，

以期望频率响应不超过最大水平H_max(ω)且不取低于期望频率响应的最小水平H_min(ω)的方式来确定期望频率响应，其中，所述最大水平H_max(ω)是响应于要滤波的信号且根据所述最小水平H_min(ω)而确定的。

2.根据权利要求1所述的方法，其中

所述频率响应的最大水平是频率的函数。

3.根据权利要求1或2所述的方法，其中，确定期望频率响应包括：

确定(205)所述频率响应的最大水平H_max(ω)；

确定(207)所述频率响应的近似H^approx(ω)；

将所述近似与所述最大水平进行比较(210)；以及

选择(210)所述最大水平，作为下述频率的期望频率响应的值：在所述频率处，所述最大水平的值低于所述频率响应的近似的值。

4.根据权利要求3所述的方法，其中

确定近似、确定最大水平、比较和选择的步骤针对至少两个不同的频率箱体重复进行。

5.根据权利要求1或2所述的方法，其中

所述最大水平是基于对要滤波的信号的噪声水平的测量来确定的。

6.根据权利要求5所述的方法，其中

在特定频率处的最大水平是根据对所述特定频率处要滤波的信号的信噪比的估计来确定的。

7.根据权利要求6所述的方法，其中

所述最大水平被产生为与下述公式的数值相对应的值：

H_{\max} (ω) = \max {\sqrt{\frac{H_{\min}^{2}}{β} \frac{{\hat{Φ}}_{y} (ω) - {\hat{Φ}}_{n} (ω)}{{\hat{Φ}}_{n} (ω)}} {, H}_{\min}},

其中H_max(ω)是作为频率的函数的所述最大水平，H_min是所述频率响应的最小水平，β是表示最大可接受信噪比的容限阈值，是有噪话音信号的y(t)的谱密度的估计，是噪声分量n(t)的谱密度的估计。

8.根据权利要求7所述的方法，其中

所述容限阈值的值取决于确定最大水平的频率。

9.根据权利要求5所述的方法，其中

所述最大水平是根据对信噪比的总值的估计来确定的。

10.根据权利要求5所述的方法，其中

在特定频率处的最大水平是根据对所述特定频率处要滤波的信号的噪声功率的估计来确定的。

11.根据权利要求5所述的方法，其中

所述最大水平是根据对所述信号的噪声功率的估计来确定的。

12.一种数字滤波器设计设备(100)，被配置为设计对要滤波的信号y(t)进行噪声抑制的数字滤波器h(z)，其中所述信号表示声学记录，所述数字滤波器设计设备包括：

期望频率响应确定设备(110)，被配置为响应于要滤波的信号来确定期望频率响应H(ω)；所述数字滤波器设计设备的特征在于，期望频率响应确定设备被配置为：

根据要滤波的信号且根据期望频率响应的最小水平H_min(ω)，确定(305)期望频率响应的最大水平H_max(ω)；以及

以期望频率响应不超过所述最大水平H_max(ω)且不取低于所述最小水平H_min(ω)的方式，确定(310)期望频率响应。

13.根据权利要求12所述的数字滤波器设计设备，其中

期望频率响应确定设备(110)被配置为：作为频率的函数来确定(300)期望频率响应的最大水平。

14.根据权利要求12所述的数字滤波器设计设备，其中，期望频率响应确定设备被配置为：

确定(300)期望频率响应的近似H^approx(ω)；

将所述频率响应的近似与所确定的最大水平进行比较(310)；以及

选择(310)所述最大水平与期望频率响应的近似中的较小者作为期望频率响应的值。

15.根据权利要求13所述的数字滤波器设计设备，其中，期望频率响应确定设备被配置为：

确定(300)期望频率响应的近似H^approx(ω)；

16.根据权利要求15所述的数字滤波器设计设备，其中，期望频率响应确定设备被配置为：针对每个频率箱体来进行比较和选择。

17.根据权利要求12～16中任一项所述的数字滤波器设计设备，其中

期望频率响应确定设备被配置为：基于对要滤波的信号的噪声水平的测量来确定所述最大水平。

18.一种用于处理声学信号的用户设备(400)，所述用户设备包括根据权利要求12～17中任一项所述的数字滤波器设计设备。

19.一种通信系统(405)中用于对表示语音的信号进行中继的节点(410)，所述节点包括根据权利要求12～17中任一项所述的数字滤波器设计设备(100)。