CN102779524B

CN102779524B - 噪声估计的设备和方法以及使用该设备和方法的降噪设备

Info

Publication number: CN102779524B
Application number: CN201210251379.4A
Authority: CN
Inventors: 金圭洪; 吴光哲
Original assignee: Samsung Electronics Co Ltd
Current assignee: Samsung Electronics Co Ltd
Priority date: 2008-10-10
Filing date: 2009-09-29
Publication date: 2015-01-07
Anticipated expiration: 2029-09-29
Also published as: JP5805365B2; JP2010092054A; US20100092000A1; CN104269179A; CN101727909A; EP2175446A3; KR20100040664A; EP2175446A2; US9159335B2; CN102779524A; KR101597752B1

Abstract

提供了一种噪声估计的设备和方法以及使用该设备和方法的降噪设备。噪声估计设备通过阻止接收的音频信号中的来自目标声音源的方向的音频信号来估计噪声，并补偿来自目标声音阻止器的方向性增益的失真，所述目标声音阻止器阻止来自目标声音源的音频信号。

Description

噪声估计的设备和方法以及使用该设备和方法的降噪设备

本申请是申请日为2009年9月29日、申请号为200910177314.8、题为“噪声估计的设备和方法以及使用该设备和方法的降噪设备”的专利申请的分案申请。

本申请要求于2008年10月10日在韩国知识产权局提交的10-2008-0099699号韩国专利申请的利益，该申请全部公开于此以资参考。

技术领域

以下描述涉及音频信号处理，更具体地，涉及一种用于噪声估计的设备和方法以及使用该设备和方法的降噪设备。

背景技术

使用诸如移动电话的通信终端的语音电话不能保证噪声环境中的高语音质量。为了提高噪声环境中的语音质量，需要一种估计背景噪声分量以仅提取实际语音信号的技术。

随着技术的发展，出现了用于响应于语音来操作或者存储音频数据的各种终端(诸如，便携式摄像机、笔记本PC、导航系统、游戏机等)的基于语音的应用。因此，迫切需要一种用于降低或清除背景噪声以提取高质量语音的技术。

已经提出了用于估计或降低背景噪声的各种方法。然而，由于随时间改变的噪声的统计特征或在用于更新噪声的统计特征的初始操作时产生无法预期的偶发噪声而难以获得期望的噪声降低或清除性能。

发明内容

根据一个总体方面，提供了一种噪声估计设备，包括：音频输入单元，从多个方向接收音频信号并将音频信号变换为频域信号；目标声音阻止器，阻止来自目标声音源方向的音频信号；补偿器，补偿来自目标声音阻止器的方向性增益的失真。

音频输入单元可包括彼此距离1cm到8cm的两个相邻的话筒，并且音频输入单元将通过两个话筒接收的音频信号变换为频域信号。

目标声音阻止器可通过计算经由两个话筒接收的音频信号之间的差来阻止来自目标声音源的声音信号。

补偿器可基于来自目标声音源的音频信号被阻止的音频信号的平均值来计算来自目标声音源的音频信号被阻止的音频信号的权重，并将来自目标声音源的音频信号被阻止的音频信号乘以相应的权重。

噪声估计设备还可包括：目标声音检测器，检测来自目标声音源的音频信号，在来自目标声音源的音频信号未被检测到的部分，计算与在所述部分中接收的音频信号的数量的比率相应的尺度系数，所述部分与补偿器估计的噪声分量相关，其中，补偿器将估计的噪声分量乘以尺度系数。

可在来自目标声音源的音频信号未被检测的部分计算和更新尺度系数，在来自目标声音源的音频信号被检测到的部分，可使用先前计算的尺度系数。

噪声估计设备还可包括：增益校准器，对所述两个话筒进行校准以均衡所述两个话筒的增益。

目标声音阻止器可输出来自目标声音源的音频信号被阻止的音频信号。

根据另一方面，提供了一种降噪设备，包括：噪声估计器，被配置为从多个方向接收音频信号，将音频信号变换为频域信号，阻止频域信号中的来自目标声音源的方向的音频信号，并补偿来自目标声音源的音频信号被阻止的音频信号的增益失真，从而估计噪声分量；降噪滤波器，使用基于估计的噪声分量计算的滤波器系数来去除由噪声估计器估计的噪声分量。

噪声估计器可包括彼此距离1cm到8cm的两个相邻的话筒，噪声估计器可将通过两个相邻话筒接收的音频信号变换为频域信号，计算频域信号之差来阻止来自目标声音源的声音信号，使用来自目标声音源的音频信号被阻止的音频信号的平均值计算来自目标声音源的音频信号被阻止的音频信号的权重，并将来自目标声音源的音频信号被阻止的音频信号乘以相应的权重。

根据另一方面，提供了一种噪声估计设备的噪声估计方法，所述方法包括：从多个方向接收音频信号并将音频信号变换为频域信号；阻止频域信号中的来自目标声音源的方向的音频信号；补偿来自目标声音源的音频信号被阻止的音频信号的增益失真。

接收音频信号的步骤可包括：使用彼此距离1cm到8cm的两个相邻的话筒接收音频信号，阻止音频信号的步骤可包括：通过计算经由两个话筒接收的音频信号之差来阻止来自目标声音源的声音信号。

补偿的步骤可包括：使用来自目标声音源的音频信号被阻止的音频信号的平均值来计算来自目标声音源的音频信号被阻止的音频信号的权重，并将来自目标声音源的音频信号被阻止的音频信号乘以相应的权重。

补偿的步骤可包括：检测来自目标声音源的音频信号，在来自目标声音源的音频信号未被检测到的部分，计算与在所述部分中接收的音频信号的数量的比率相应的尺度系数，所述部分与先前计算的噪声分量相关。

可在来自目标声音源的音频信号未被检测到的部分计算和更新尺度系数，在来自目标声音源的音频信号被检测到的部分，可使用先前计算的尺度系数。

噪声估计设备可包括两个话筒，所述方法还包括对所述两个话筒进行校准以均衡所述两个话筒的增益，接收音频信号的步骤可包括使用校准的两个话筒接收音频信号。

根据另一方面，提供了一种用于降噪的设备，包括：音频输入单元，具有从多个方向接收音频信号的多个话筒并将音频信号变换为频域信号；目标声音阻止器，通过计算经由多个话筒接收的音频信号之间的差来阻止频域信号中的来自目标声音源的方向的音频信号，并输出来自目标声音源的音频信号被阻止的音频信号；降噪单元，去除来自目标声音源的音频信号被阻止的音频信号，以输出来自目标声音源的音频信号。

降噪单元可以是使用基于来自目标声音源的音频信号被阻止的音频信号确定的滤波器系数来去除来自目标声音源的音频信号被阻止的音频信号的滤波器。

所述设备还可包括：补偿器，补偿来自目标声音阻止器的方向性增益的失真。

所述设备还可包括：目标声音检测器，检测来自目标声音源的音频信号，在来自目标声音源的音频信号未被检测到的部分，计算与在所述部分中接收的音频信号的数量的比率相应的尺度系数，所述部分与补偿器估计的噪声分量相关，其中，补偿器将估计的噪声分量乘以尺度系数。

所述设备还可包括：增益校准器，对所述多个话筒进行校准以均衡所述多个话筒的增益。

通过以下详细的描述、附图和权利要求，其它特点和方面将变得清楚。

附图说明

图1是示出示例性噪声估计设备的框图。

图2是示出声音源与图1的噪声估计设备的话筒阵列的布置之间的位置关系的示图。

图3是示出由图1的噪声估计设备的目标声音阻止器获得的方向性模式的图表。

图4是示出具有目标声音检测器的另一示例性噪声估计设备的框图。

图5是示出具有增益校准器的另一示例性噪声估计设备的框图。

图6是示出具有噪声估计器的示例性降噪设备的框图。

图7是示出示例性噪声估计方法的流程图。

在整个附图和详细描述中，除非另外描述，否则相同的附图标号将被理解为表示相同的元件、特征和结构。出于简明、示例和方便的目的可夸大这些元件的相对大小和叙述。

具体实施方式

提供以下描述以助于读者获得在此描述的方法、设备和/或系统的全面理解。因此，各种改变、修改和在此描述的系统、设备和/或方法的等同物将被建议给本领域的普通技术人员。另外，为了清楚和简明会省略已知功能和构建的描述。

图1是示出示例性噪声估计设备的框图。

如图1中所示，噪声估计设备100包括音频输入单元110、目标声音阻止器120和补偿器130。

音频输入单元110从多个方向接收音频信号并将音频信号变换为频域信号。目标声音阻止器120阻止来自目标声音源的方向的音频信号。补偿器130补偿来自目标声音阻止器120的增益失真。

如一个示例，音频输入单元110包括彼此相邻的两个话筒(未示出)，并且音频输入单元110将通过话筒接收的音频信号变换为频域信号。例如，变换可以是傅里叶变换。将参照图2对包括话筒的布置和数量、目标声音源的位置以及噪声源的位置的更多示例性细节进行描述。

在具有两个话筒的音频输入单元110的示例中，目标声音阻止器120通过计算经由两个话筒接收的音频信号之差来阻止目标声音。例如，用于从多个方向接收音频信号两个全向话筒被以预定距离(例如，1cm)分离放置，从而阻止例如来自产生目标声音的正前方向的音频信号，并接收来自其它方向的音频信号。

例如，两个话筒之间的距离可以从1cm到8cm。如果两个话筒之间的距离小于1cm，则会减少来自多个方向的所有音频信号。如果两个话筒之间的距离大于8cm，则会阻止除了来自目标源的方向的音频信号之外的来自多个方向的音频信号。

如所示的，可通过等式1计算由话筒接收的音频信号的频率变换的值S₁(f)和S₂(f)、目标声音被阻止的音频信号的频率变换的值B(f)：

B(f)＝w₁(f)·S₁(f)+w₂(f)·S₂(f) [等式1]

其中，w₁(f)和w₂(f)是用于阻止目标声音的参数并可通过过度(undue)的实验被合适地设置。例如，其中，w₁(f)和w₂(f)被分别设置为+1和-1，目标声音被阻止的音频信号的频率变换的值B(f)变为由话筒接收的音频信号的频率变换的值S₁(f)和S₂(f)之间的差。

其中，w₁(f)和w₂(f)被分别设置为+1和-1，由于从两个话筒的正前方向，也就是从目标声音源的方向接收的音频信号理想地相同，并且从其它方向接收的音频信号彼此不同，故仅有从两个话筒的正前方向接收的音频信号理想地成为零。因此，从正前方向接收的目标声音可被阻止。

目标声音被阻止的音频信号可以是噪声分量。然而，从目标声音阻止器120输出的音频信号的频率特征可根据例如话筒阵列口径大小、话筒的数量等而显著地改变。因此，为了在噪声估计中减小误差，补偿器130可被用于基于目标声音被阻止的音频信号的平均值来计算权重，并将音频信号分别乘以相应的权重。

可通过等式2计算目标声音被阻止的音频信号的通过目标声音阻止器120获得的方向性模式D(f，φ)：

D (f, φ) = Σ_{n = - \frac{N - 1}{2}}^{\frac{N - 1}{2}} w_{n} (f) e^{j \frac{2 π}{λ} nd \cos φ}

[等式2]

其中，N表示话筒的数量，d表示话筒之间的距离，φ表示方向，f表示频率，w_n(f)表示相对于位于坐标n的话筒的权重，其中，所述权重与等式1中的用于阻止目标的参数相关。例如，如果话筒的数量是两个，则w_-0.5(f)和w_0.5(f)分别是+1和-1。

补偿器130接收目标声音被阻止的通过等式1计算的音频信号B(f)，并将音频信号B(f)乘以相应的权重，从而实时估计噪声分量。可通过等式3计算权重：

W (f) = \frac{α}{\frac{1}{π} {&Integral;}_{0}^{π} | D (f, φ) | dφ}

[等式3]

其中，α是作为全局尺度系数的常数，被应用到所有频率分量以调节权重。可通过过度的实验获得α的值。

结果，可通过等式4写出由补偿器130估计的噪声分量：

{\tilde{N}}_{a} (f) = | B (f) \cdot W (f) |

[等式4]

如等式4中所示，可不使用先前帧的噪声信息来估计当前帧的噪声，并且可不管目标声音的方向来实时估计方向噪声的存在和数量。

已经为了说明性的目的描述了具有两个话筒的示例性实施例。因此，应该理解话筒的数量可以不是两个。例如，噪声估计设备的音频输入单元可具有三个或更多个话筒。基于话筒的数量，可选择参数w的合适的组合用于阻止从目标声音源的方向接收的音频信号。

图2是示出声音源220和声音源230-1到230-n与图1的噪声估计设备100的话筒阵列210的布置之间的位置关系的示图。

如所示出的，例如，组成话筒阵列210的话筒是彼此相邻的，并且，例如，目标声音源220位于话筒阵列210的前方(垂直向上/向下)，从而音频信号被输入到话筒阵列210。输入到话筒阵列210的音频信号被传送到降噪设备240以执行噪声估计和降噪。

降噪设备240通过例如以上参照图1描述的目标声音阻止方法来阻止从目标声音源220接收的音频信号，并提取从位于除声音源220所在方向以外的方向的噪声源230-1、230-2、...、230-n接收的噪声信号。

图3是示出由图1的噪声估计设备100的目标声音阻止器120获得的示例性方向性模式。

参照图2，在示图中示出，话筒阵列210与目标声音源220之间的角度是90°。参照图3，以目标声音被接收的90°的角度接收的所有频带具有大约零的增益。也就是说，以90°的角度接收的目标声音被阻止，声音源的角度的从90°偏离越大，增益就越大。增益取决于频带。例如，高频分量的增益较大，低频分量的增益较小。

同时，方向性模式可取决于目标声音阻止器120。

如图3中所示，根据噪声的方向的方向性模式的增益差在较高频率变得更大。因此，由补偿器130(见图1)计算的权重w(f)可被用于对方向性模式的增益取平均。

图4是示出具有目标声音检测器410的另一示例性噪声估计设备400的框图。

目标声音检测器410检测目标声音的存在与否，在目标声音未被检测到的部分，也就是，在噪声部分，计算与在噪声部分中接收的音频信号的数量的比率相应的尺度系数，并将尺度系数提供给补偿器420，所述噪声部分与补偿器420计算的噪声分量相关。随后估计噪声分量，补偿器420将先前计算的噪声分量乘以由目标声音检测器410计算的尺度系数。

虽然如上所述补偿器420使用平均值补偿方向应模式的增益，但是补偿器420不能在所有频率正确地补偿噪声信号的方向性。因此，在假设噪声的方向不由于噪声的特性随着时间改变而急剧地变化的情况下，示例性噪声估计设备400在未检测到目标声音的无声部分根据噪声的方向补偿增益的变化。也就是说，在目标声音检测器410检测目标声音不存在的噪声部分，通过计算在噪声部分中接收的噪声信号的数量的比率来调节先前估计的噪声，所述噪声部分与通过等式4计算的噪声信号相关。

可通过等式5计算比率，也就是，局部尺度系数β(f)：

β (f) = \frac{| S (f) |}{{\tilde{N}}_{a} (f)}

[等式5]

由于可以以帧为单位来执行频域中的估计的噪声值的计算，故等式5可重新写为包括帧信息的等式6：

[等式6]

也就是说，局部尺度系数β(f)被在未检测到目标声音的部分重新计算和更新，在检测到目标声音的部分，先前局部尺度系数被使用。在等式6中，γ是更新率，随着γ逼近1，目标声音检测器410对输入噪声中的改变响应更快，随着γ逼近0，目标声音检测器410对突发误差的响应具有较小的灵敏度。因此，可通过等式7计算反映局部尺度系数β(f)的从补偿器420输出的估计的噪声值：

{\tilde{N}}_{b} (f) = B (f) \cdot W (f) \cdot β (f)

[等式7]

应该理解，可将一般语音激活检测方法用于目标声音检测器410，因此，为了简明的目的省略对其进一步描述。还应该理解，各种已知或将被得知的方法可用于检测目标声音。

图5是示出具有增益校准器510的另一示例性噪声估计设备500的框图。

增益校准器510对例如被输入目标声音的两个话筒进行校准，以均衡所述两个话筒的增益。一般地，由于制造处理中的误差，根据标准制造的不同的话筒可具有不同的增益。如果两个话筒具有增益差，则目标声音阻止器120不能正确地阻止目标声音。因此，可在通过话筒接收音频信号之前执行增益校准。

增益校准可被执行一次。然而，由于增益可取决于诸如温度或适度的环境因素，故还可以以有规律的时间间隔执行增益校准。应该理解，可使用一般增益校准方法，因此，为了简明的目的省略对其进一步描述。

图6是示出具有噪声估计器的示例性降噪设备600的框图。

参照图6，降噪设备600包括噪声估计器610和降噪滤波器620。

噪声估计器610可执行上述参照图1到图5描述的噪声估计。例如，为了估计噪声，噪声估计器610从多个方向接收音频信号并将音频信号变换为频域信号，阻止频域信号中的来自将被检测的目标声音源的方向的音频信号，并补偿目标声音被阻止的结果音频信号的增益失真。

噪声估计器610将通过例如两个相邻话筒接收的音频信号变换为频域信号，计算频域信号之差以阻止目标声音，使用目标声音被阻止的音频信号的平均值来计算音频信号的权重，并将目标声音被阻止的音频信号乘以相应的权重，从而估计噪声分量。

可基于使用估计的噪声分量计算的滤波器参数来设计降噪滤波器620。降噪滤波器620可以是各种滤波器中的一种，诸如谱减法、维纳滤波器、振幅估计器等。

图7是示出示例性噪声估计方法的流程图。应该理解上述的示例性噪声估计设备可执行所述方法。

在操作S710，从多个方向接收音频信号并将音频信号变换为频域信号。

在操作S720，阻止频域信号中的来自将被检测的目标声音源的方向的音频信号。例如，通过计算经由例如两个相邻话筒接收的音频信号之差，可仅阻止目标声音。

在操作S730，补偿来自目标声音阻止器的方向性增益的失真。例如，基于目标声音被阻止的音频信号的平均值来计算音频信号的权重，并将音频信号乘以相应的权重，从而估计噪声分量。为了估计噪声分量，可检测目标声音的存在与否，在目标声音未被检测到的部分，可计算与先前估计的噪声分量相关的输入音频信号的数量的比率(尺度系数)，并可将先前估计的噪声分量乘以尺度系数。

尺度系数可以是如上所述的局部尺度系数。局部尺度系数可被在未检测到目标声音的部分重新计算和更新，在检测到目标声音的部分，可原样使用先前尺度系数。

在操作S730，可补偿从目标声音阻止器的方向性增益起源的谱失真。

为了均衡话筒的增益，可在接收音频信号的操作S710之前校准话筒。

根据如上所述的示例，由于能够估计随时间改变的非平稳噪声，故可在接收音频或语音的各种设备中提高音频或语音质量以及音频或语音识别性能。

如一个示例，上述的示例性噪声估计可被应用到诸如移动电话的通信终端以提高音频或语音质量。由于可在所有频域上以及存在音频或语音的部分一致地执行噪声估计，故有效或提高的噪声估计是可能的。

根据上述的示例，提供了一种通过阻止目标声音来估计非平稳噪声的设备和方法，以及使用所述设备和方法的降噪设备。

应该理解在此使用的术语在其它申请或当被该领域中的另一普通技术人员描述时可以不同。例如，“降”噪滤波器或“降”噪设备还可分别被称为“除”噪滤波器或“除”噪设备。此外，对于所述的被阻止的目标声音，应该理解，例如由于话筒的增益不匹配，目标声音阻止器可以不“完全”阻止目标声音。

上述的方法可被记录、存储或安装在包括由计算机实施以引起处理器执行程序指令的所述程序指令的一个或多个计算机可读介质中。介质还可包括程序指令、数据文件、数据结构等的单个或组合。计算机可读介质的示例包括：磁性介质，诸如硬盘、软盘和磁带；光学介质，诸如CD-ROM盘和DVD；磁光介质，诸如光盘；被具体配置为存储和执行程序指令的硬件装置，诸如只读存储器(ROM)、随机访问存储器(RAM)、闪存等。程序指令的示例包括：机器码，诸如由编译器产生的；文件，包含可被计算机使用解释器执行的更高级代码。所述硬件装置可被配置以作为一个或更多个软件模块，以执行上述的操作和方法，反之亦然。

上面已经描述了一些示例性实施例。然而，应该理解，可做出各种修改。例如，如果所述技术被以不同的顺序执行和/或如果上述系统、结构、装置或电路中的组件被以不同的方式组合和/或被其它组件或它们的等同物替代或补充，则可获得相配的结果。因此，其它实施落入权利要求的范围内。

Claims

1.一种噪声估计设备，包括：

音频输入单元，从多个方向接收音频信号并将音频信号变换为频域信号；

目标声音阻止器，阻止来自目标声音源方向的音频信号；和

补偿器，补偿来自目标声音阻止器的方向性增益的失真，

其中，补偿器基于来自目标声音源的音频信号被阻止的音频信号的平均值来计算来自目标声音源的音频信号被阻止的音频信号的权重，并将来自目标声音源的音频信号被阻止的音频信号乘以相应的权重。

2.如权利要求1所述的噪声估计设备，其中，音频输入单元包括彼此距离1cm到8cm的两个相邻的话筒，并且音频输入单元将通过两个话筒接收的音频信号变换为频域信号。

3.如权利要求2所述的噪声估计设备，其中，目标声音阻止器通过计算经由两个话筒接收的音频信号之间的差来阻止来自目标声音源的声音信号。

4.如权利要求1所述的噪声估计设备，还包括：目标声音检测器，检测来自目标声音源的音频信号，在来自目标声音源的音频信号未被检测到的部分，计算与在所述部分中接收的音频信号的数量相比于补偿器估计的噪声分量的比率相应的尺度系数，

其中，补偿器将估计的噪声分量乘以尺度系数。

5.如权利要求4所述的噪声估计设备，其中，在来自目标声音源的音频信号未被检测到的部分计算和更新尺度系数，在来自目标声音源的音频信号被检测到的部分，使用先前计算的尺度系数。

6.如权利要求2所述的噪声估计设备，还包括：增益校准器，对所述两个话筒进行校准以均衡所述两个话筒的增益。

7.如权利要求1所述的噪声估计设备，其中，目标声音阻止器输出来自目标声音源的音频信号被阻止的音频信号。

8.一种降噪设备，包括：

噪声估计器，被配置为从多个方向接收音频信号，将音频信号变换为频域信号，阻止频域信号中的来自目标声音源的方向的音频信号，并补偿来自目标声音源的音频信号被阻止的音频信号的增益失真，从而估计噪声分量；

以及

降噪滤波器，使用基于估计的噪声分量计算的滤波器系数来去除由噪声估计器估计的噪声分量，

其中，噪声估计器使用来自目标声音源的音频信号被阻止的音频信号的平均值来计算来自目标声音源的音频信号被阻止的音频信号的权重，并将来自目标声音源的音频信号被阻止的音频信号乘以相应的权重。

9.如权利要求8所述的降噪设备，其中，

噪声估计器包括彼此距离1cm到8cm的两个相邻的话筒，以及

噪声估计器将通过两个相邻话筒接收的音频信号变换为频域信号，计算频域信号之差来阻止来自目标声音源的声音信号。

10.一种用于降噪的设备，包括：

音频输入单元，具有从多个方向接收音频信号的多个话筒并将音频信号变换为频域信号；

目标声音阻止器，通过计算经由多个话筒接收的音频信号之差来阻止频域信号中的来自目标声音源的方向的音频信号，并输出来自目标声音源的音频信号被阻止的音频信号；

补偿器，补偿来自目标声音阻止器的方向性增益的失真；

降噪单元，去除来自目标声音源的音频信号被阻止的音频信号，以输出来自目标声音源的音频信号；以及

增益校准器，对所述多个话筒进行校准以均衡所述多个话筒的增益，

11.如权利要求10所述的设备，其中，降噪单元是使用基于来自目标声音源的音频信号被阻止的音频信号确定的滤波器系数来去除来自目标声音源的音频信号被阻止的音频信号的滤波器。

12.如权利要求10所述的设备，还包括：目标声音检测器，检测来自目标声音源的音频信号，在来自目标声音源的音频信号未被检测到的部分，计算与在所述部分中接收的音频信号的数量相比于补偿器估计的噪声分量的比率相应的尺度系数，

其中，补偿器将估计的噪声分量乘以尺度系数。

13.如权利要求12所述的设备，其中，在来自目标声音源的音频信号未被检测的部分计算和更新尺度系数，在来自目标声音源的音频信号被检测到的部分，使用先前计算的尺度系数。