CN105489224B

CN105489224B - 一种基于麦克风阵列的语音降噪方法及系统

Info

Publication number: CN105489224B
Application number: CN201410468440.XA
Authority: CN
Inventors: 王海坤; 马峰; 乔玉平; 王智国; 胡国平; 胡郁; 刘庆峰
Original assignee: Xun Feizhi Metamessage Science And Technology Ltd
Current assignee: Xun Feizhi Metamessage Science And Technology Ltd
Priority date: 2014-09-15
Filing date: 2014-09-15
Publication date: 2019-10-18
Anticipated expiration: 2034-09-15
Also published as: CN105489224A

Abstract

本发明公开了一种基于麦克风阵列的语音降噪方法及系统，包括：将组成麦克风阵列的两个无指向性麦克风构建为两个背向心形指向性麦克风，得到前向目标语音信号和后向噪声信号；对前向目标语音信号和后向噪声信号进行相同程度的频率均衡，得到已均衡目标语音信号和已均衡噪声信号；对前向目标语音信号和后向噪声信号进行自适应双滤波，得到已修正噪声信号和已修正目标语音信号；基于已修正目标语音信号，得到还原后的目标语音信号。本发明采用频率均衡避免还原后的目标语音信号出现频率失真，采用自适应双滤波方法解决在通过自适应滤波器进行降噪的同时也损害到目标语音信号的问题，进而彻底避免还原后的目标语音信号出现失真。

Description

一种基于麦克风阵列的语音降噪方法及系统

技术领域

本发明涉及数字信号处理技术领域，尤其涉及一种基于麦克风阵列的语音降噪方法及系统。

背景技术随着语音通信及语音识别技术的快速发展，其已在人们的日常生活和工作中的多个领域得到了广泛的应用，为人们提供了极大的便利。然而，语音通信及语音识别的应用环境是复杂多变的，尤其是在车载、机载以及多人讲话等信噪比较低的应用环境中，噪声的存在给传统的语音通信及语音识别技术带来了很大的挑战，因此语音降噪技术已成为语音通信及语音识别能正常、准确工作的保证。为了提升语音降噪技术的有效性，现有语音降噪技术主要包括单麦克风增强技术和麦克风阵列技术，其中，单麦克风增强技术单纯利用信号的时序信息进行降噪处理，而麦克风阵列技术却融合语音信号的时序信息和空间信息，因此，麦克风阵列技术相较于单麦克风语音增强技术，能更好地平衡噪声抑制幅度和语音失真度控制之间的关系。

麦克风阵列技术是利用两个或者更多的麦克风组成的麦克风阵列进行语音增强，其最基本的思想是通过自适应滤波器用一个麦克风接收到的噪声抵消另一个麦克风接收到的信号中的噪声成分，得到目标语音信号。由于在实际应用中两个麦克风采集的信号都可能包含目标语音信号，因此，降噪的同时也会损害到目标语音信号，这就需要对自适应滤波器的收敛和滤波进行控制，以保证在有效地抑制噪声的同时保护一个麦克风中的目标语音信号不会被另一个麦克风中的目标语音信号所抵消，否则就会造成目标语音信号的失真。针对上述技术问题，后又有技术人员提出通过确定麦克风阵列所有声音信号的入射角度进行信号成分的统计，进而得到滤波控制因子，利用该滤波控制因子可将目标语音信号中可能存在的噪声成分滤除，从而较有效地解决了在滤波过程中存在语音信号失真的问题，但是，如果噪声信号中含有目标语音信号成分，则无论如何调整滤波控制因子，目标语音信号经滤波后仍会存在一定的失真，这使得该种方案也无法完全解决语音信号失真的问题。

发明内容

本发明的实施例针对基于麦克风阵列的现有语音降噪方法存在的上述技术问题，提供一种可以更为有效地解决语音失真问题的语音降噪方法及系统。

为实现上述目的，本发明采用的技术方案为：一种基于麦克风阵列的语音降噪方法，包括：

利用波束成形技术将组成所述麦克风阵列的背靠背布置的两个无指向性麦克风构建为两个背向心形指向性麦克风，以得到前向目标语音信号和后向噪声信号；

对所述前向目标语音信号和所述后向噪声信号进行相同程度的频率均衡，得到已均衡目标语音信号和已均衡噪声信号；

对所述已均衡目标语音信号进行自适应滤波处理，估计出所述已均衡噪声信号中存在的目标语音信号的泄漏成分；

从所述已均衡噪声信号中去除所述目标语音信号的泄漏成分，得到已修正噪声信号；

对所述已修正噪声信号进行自适应滤波处理，估计出所述已均衡目标语音信号中存在的噪声信号的泄漏成分；

从所述已均衡目标语音信号中去除所述噪声信号的泄漏成分，得到已修正目标语音信号；

基于所述已修正目标语音信号，得到还原后的目标语音信号。

优选的是，所述对所述前向目标语音信号和所述后向噪声信号进行相同程度的频率均衡，得到已均衡目标语音信号和已均衡噪声信号包括：

提取所述前向目标语音信号相对最先到达所述麦克风阵列的频域声音信号进行缩放的增益因子；

将所述前向目标语音信号除以所述增益因子，得到所述已均衡目标语音信号；

将所述后向噪声信号除以所述增益因子，得到所述已均衡噪声信号。

优选的是，所述方法还包括：

计算所述已修正目标语音信号与所述已修正噪声信号之间的信噪比；

在所述信噪比大于预设门限时，更新估计出的所述目标语音信号的泄漏成分；

在所述信噪比小于等于所述预设门限时，更新估计出的所述噪声信号的泄漏成分。

优选的是，所述计算所述已修正目标语音信号与所述已修正噪声信号之间的信噪比包括：

计算所有频带下的已修正目标语音信号总量；

计算所有频带下的已修正噪声信号总量；

计算所述已修正目标语音信号总量与所述已修正噪声信号总量的比，并将计算结果作为所述已修正目标语音信号与所述已修正噪声信号之间的信噪比。

优选的是，所述基于所述已修正目标语音信号，得到还原后的目标语音信号包括：

对所述已修正目标语音信号进行自适应后置滤波处理，得到已后置滤波目标语音信号；

基于所述已后置滤波目标语音信号，得到所述还原后的目标语音信号。

为了实现上述目的，本发明采用的技术方案为：一种基于麦克风阵列的语音降噪系统，包括：

波束形成模块，用于利用波束成形技术将组成所述麦克风阵列的背靠背布置的两个无指向性麦克风构建为两个背向心形指向性麦克风，以得到前向目标语音信号和后向噪声信号；

频率均衡模块，用于对所述前向目标语音信号和所述后向噪声信号进行相同程度的频率均衡，得到已均衡目标语音信号和已均衡噪声信号；

目标语音信号自适应滤波模块，用于对所述已均衡目标语音信号进行自适应滤波处理，估计出所述已均衡噪声信号中存在的目标语音信号的泄漏成分；

噪声信号修正模块，用于从所述已均衡噪声信号中去除所述目标语音信号的泄漏成分，得到已修正噪声信号；

噪声信号自适应滤波模块，用于对所述已修正噪声信号进行自适应滤波处理，估计出所述已均衡目标语音信号中存在的噪声信号的泄漏成分；

目标语音信号修正模块，用于从所述已均衡目标语音信号中去除所述噪声信号的泄漏成分，得到已修正目标语音信号；以及，

后置处理模块，用于基于所述已修正目标语音信号，得到还原后的目标语音信号。

优选的是，所述频率均衡模块包括：

增益因子提取单元，用于提取所述前向目标语音信号相对最先到达所述麦克风阵列的频域声音信号进行缩放的增益因子；

目标语音信号均衡单元，用于将所述前向目标语音信号除以所述增益因子，得到所述已均衡目标语音信号；以及，

噪声信号均衡单元，用于将所述后向噪声信号除以所述增益因子，得到所述已均衡噪声信号。

优选的是，所述系统还包括：

信噪比计算模块，用于计算所述已修正目标语音信号与所述已修正噪声信号之间的信噪比；

所述目标语音信号自适应滤波模块还用于在所述信噪比大于预设门限时，更新估计出的所述目标语音信号的泄漏成分；

所述噪声信号自适应滤波模块还用于在所述信噪比小于等于所述预设门限时，更新估计出的所述噪声信号的泄漏成分。

优选的是，所述信噪比计算模块包括：

第一计算单元，用于计算所有频带下的已修正目标语音信号总量；

第二计算单元，用于计算所有频带下的已修正噪声信号总量；以及，

信噪比计算单元，用于计算所述已修正目标语音信号总量与所述已修正噪声信号总量的比，并将计算结果作为所述已修正目标语音信号与所述已修正噪声信号之间的信噪比。

优选的是，所述后置处理模块还用于对所述已修正目标语音信号进行自适应后置滤波处理，得到已后置滤波目标语音信号；及还用于基于所述已后置滤波目标语音信号，得到所述还原后的目标语音信号。

本发明的有益效果在于，本发明的基于麦克风阵列的语音降噪方法及系统通过波束成形技术将组成麦克风阵列的背靠背布置的两个无指向性麦克风构建为具有两个背向心形指向性麦克风，这可以获得主要包括目标语音信号的前向目标语音信号和主要包括噪声信号的后向噪声信号，而且本发明通过对前向目标语音信号进行频率均衡，可以有效地避免前向目标语音信号在不同的频带具有不同的缩放幅度，进而可以避免还原后的目标语音信号出现频率失真；另外，本发明在此基础上创新性地采用了对已均衡目标语音信号和已修正噪声信号均进行自适应滤波的自适应双滤波方法，彻底解决在两个麦克风采集到的声音信号均包含目标语音信号的情况下，通过自适应滤波进行降噪的同时也损害到目标语音信号的问题，进而可以从另一个方面避免还原后的目标语音信号出现失真。

附图说明

图1为根据本发明所述基于麦克风阵列的语音降噪方法的一种实施方式的流程图；

图2示出了图1所述麦克风阵列的布局结构；

图3示出了图2所示麦克风阵列接收源信号的情况；

图4示出了图1所述心形指向性麦克风的波束图，其中，实线代表前向目标语音信号的前向心形波束，虚线代表后向噪声信号的后向心形波束；

图5示出了图1所述麦克风阵列的波束形成结构图；

图6为根据本发明所述基于麦克风阵列的语音降噪系统的一种实施方式的方框原理图；

图7示出了图6所示语音降噪系统的一种实施结构；

图8示出了图6中频率均衡模块的一种实施结构；

图9为根据本发明所述基于麦克风阵列的语音降噪系统的另一种实施方式的方框原理图。

具体实施方式

下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，仅用于解释本发明，而不能解释为对本发明的限制。

如图1至图5所示，本发明的基于麦克风阵列的语音降噪方法，包括如下步骤：

步骤S1：利用波束成形技术将组成麦克风阵列的如图4所示的背靠背布置的两个无指向性麦克风M1、M2构建为两个背向心形指向性麦克风，以得到前向目标语音信号C(l,k)和后向噪声信号B(l,k)，该前向目标语音信号C(l,k)和后向噪声信号B(l,k)具体为离散的频域信号，其中，l为与时间相关的参数，k为频带。

步骤S2：对前向目标语音信号C(l,k)和后向噪声信号B(l,k)进行相同程度的频率均衡，得到已均衡目标语音信号C′(l,k)和已均衡噪声信号B′(l,k)，以防止因前向目标语音信号在不同的频带具有不同的缩放幅度而导致还原后的目标语音信号出现频率失真，在此对后向噪声信号进行相同程度的频率均衡是保证后续进行的自适应双滤波的准确性。

步骤S3：对已均衡目标语音信号C′(l,k)进行以β_T表示的自适应滤波处理，估计出已均衡噪声信号中存在的以β_T·C′(l,k)表示的目标语音信号的泄漏成分。

步骤S4：从已均衡噪声信号B′(l,k)中去除目标语音信号的泄漏成分β_T·C′(l,k)，得到更加纯净的已修正噪声信号CBA(l,k)。

步骤S5：对已修正噪声信号CBA(l,k)进行以β表示的自适应滤波处理，估计出已均衡目标语音信号中存在的以β·CBA(l,k)表示的噪声信号的泄漏成分。

步骤S6：从已均衡目标语音信号C′(l,k)中去除噪声信号的泄漏成分β·CBA(l,k)，得到已修正目标语音信号OUT(l,k)。通过步骤S3至步骤S6进行的自适应双滤波，保证了从已均衡目标语音信号中去除的仅为噪声信号的泄漏成分β·CBA(l,k)，进而可以有效避免在降噪的同时损害目标语音信号问题的发生，保证经本发明方法还原得到的目标语音信号Y_out(l,k)的真实性。

步骤S7：基于该已修正目标语音信号OUT(l,k)，得到还原后的目标语音信号，即降噪输出的时域目标语音信号。

在步骤S7中，可采用直接将已修正目标语音信号OUT(l,k)转换为时域信号，得到还原后的目标语音信号的方式。在本发明中，为了进一步对已修正目标语音信号OUT(l,k)中残留的稳态噪声做进一步的有效抑制，还可进一步对已修正目标语音信号OUT(l,k)进行自适应后置滤波处理，得到已后置滤波目标语音信号Y_out(l,k)，最后再基于该已后置滤波目标语音信号Y_out(l,k)得到还原后的目标语音信号y_out(n)，具体为对已后置滤波目标语音信号Y_out(l,k)进行反傅里叶变换(IDFT)，以将已后置滤波目标语音信号Y_out(l,k)转换为时域目标语音信号y_out(n)，在实际应用中，该时域目标语音信号y_out(n)通常经过数模转换后即可输出。在此，该自适应后置滤波处理例如可采用维纳滤波方法、卡尔曼滤波方法等手段进行，其中，采用维纳滤波方法进行自适应后置滤波处理的具体方法如图7所示可为：

分别计算已修正目标语音信号OUT(l,k)和已修正噪声信号CBA(l,k)的功率谱λ_out(l,k)和λ_B(l,k)，利用功率谱λ_B(l,k)和λ_out(l,k)进行自适应后置滤波，最终输出已后置滤波目标语音信号Y_out(l,k)：

Y_out(l,k)＝G(l,k)·λ_out(l,k)，其中G(l,k)为自适应后置滤波的增益，该增益可利用最小均方误差的方法获得：

即G(l,k)＝S′(l,k)/(λ_B(l,k)+S′(l,k))

公式中的S′(l,k)为考虑到语音信号的短时平稳性和相关性，通过平滑递归得到的干净语音信号，其估计方法为：

S′(l,k)＝0.85*Y_out(l-1,k)+0.15*(λ_out(l,k)-λ_B(l,k))

其中，Y_out(l-1,k)为上一时间帧输出的已后置滤波目标语音信号，λ_out(l,k)-λ_B(l,k)为初步估计得到的当前时间帧估计降噪语音信号。另外，上述自适应后置滤波的增益G(l,k)还可通过递归最小二乘滤波算法、自适应滤波的神经网络方法、基于QR分解的方法、统一模型下的自适应滤波及基于高阶累积量的自适应算法等获得。

步骤S1中利用波束成形技术将组成麦克风阵列的如图4所示的背靠背布置的两个无指向性麦克风M1、M2构建为两个背向心形指向性麦克风的具体方法如下：

如图2所示，首先使麦克风M1和麦克风M2背靠背布置，即使二者的轴向AX重合，其中的麦克风M1面向目标语音信号区域α，而麦克风M2则面向噪声信号区域β。

利用图2所示的麦克风阵列构建两个背向心形指向性麦克风，以得到前向目标语音信号和后向噪声信号的过程如下：

步骤S101：如图3所示，经麦克风M1获得时域声音信号x₁(n)，及经麦克风M2获得时域声音信号x₂(n)，其中，假设时域源信号为s(n)，则经麦克风M1接收到的时域声音信号x₁(n)＝s(n)，经麦克风M2接收到的时域声音信号x₂(n)＝s(n-τ)，其中，时域源信号s(n)、时域声音信号x₁(n)和时域声音信号x₂(n)均为经过模数转换后获得的数字信号，其中n代表时间，τ为时域源信号s(n)到达麦克风M2的时间相对到达麦克风M1的时间的延迟，在此假设时域源信号s(n)的入射波方向与轴向AX的夹角为θ，则τ＝dcosθ/c，其中d为麦克风M1和麦克风M2之间的间距，c为声音在空气中的传播速度，一般取c等于340米/秒。

步骤S102：将时域声音信号x₁(n)和时域声音信号x₂(n)从时间域变换为频率域，这具体需要先对时域声音信号进行分帧处理，再将分帧后的每帧时域声音信号进行加窗处理，最后对加窗后的每帧时域声音信号进行离散傅里叶变换(DFT)，最终得到源于时域声音信号x₁(n)的频域声音信号X₁(l,k)和源于时域声音信号x₂(n)的频域声音信号X₂(l,k)，具体地X₁(l,k)＝S(l,k)，X₂(l,k)＝S(l,k)e^-jωτ，其中S(l,k)为源于源信号s(n)的频域源信号。

步骤S103：如图5所示，以麦克风M1接收到的频域声音信号X₁(l,k)减去对麦克风M2接收到的频域声音信号进行时间T延迟后的信号，得到主要包括目标语音信号的前向目标语音信号C(l,k)，即C(l,k)＝X₁(l,k)-X₂(l,k)e-^jωd/c；及以麦克风M2接收到的频域声音信号X₂(l,k)减去对麦克风M1接收到的频域声音信号进行时间T延时后的信号，得到主要包括噪声信号的后向噪声信号B(l,k)，即：B(l,k)＝X₂(l,k)-X₁(l,k)e^-jωd/c；这里选取延迟时间T＝d/c，其中d为麦克风M1和麦克风M2之间的间距，c为声音在空气中的传播速度。通过该步骤即可将麦克风M1、麦克风M2构建为两个背向心形指向性麦克风，图4示出了由麦克风M1、麦克风M2组成的麦克风阵列的波束图。

上述步骤S2中，对前向目标语音信号C(l,k)和后向噪声信号B(l,k)进行相同程度的频率均衡，得到已均衡目标语音信号和已均衡噪声信号包括：

步骤S201：提取前向目标语音信号C(l,k)相对最先到达麦克风阵列的频域声音信号X₁(l,k)，即频域源信号S(l,k)，进行缩放的增益因子，具体为：

C(l,k)＝X₁(l,k)-X₂(l,k)e^-jωT＝S(l,k)-S(l,k)e^-jω(τ+T)，进而得到：

C(l,k)＝S(l,k)(1-e^{-jω(dcosθ/c+T}))＝S(l,k)·2sin[πf(T+dcosθ/c)]；

由此可见，前向目标语音信号C(l,k)并不仅仅是频域源信号S(l,k)，还乘上了一个与信号频率相关增益因子2sin[πf(T+dcosθ/c)](f为频带k对应的频率值)，在此将该增益因子记为w_eq，该增益因子会使得前向目标语音信号在不同的频带具有不同的缩放幅度，从而导致还原后的目标语音信号的失真，因此本发明在该步骤对前向目标语音信号C(l,k)进行频率均衡，也即将该增益因子w_eq规整掉，就可以避免还原后的目标语音信号出现频率失真。

步骤S202：将前向目标语音信号C(l,k)除以该增益因子w_eq，得到已均衡目标语音信号C′(l,k)。

步骤S203：将后向噪声信号B(l,k)除以增益因子w_eq，得到已均衡噪声信号B′(l,k)。

为了使上述自适应双滤波可以获得更好的修正和跟踪效果，本发明利用信噪比对两路自适应滤波的估计输出的更新时间进行控制，具体为：计算已修正目标语音信号OUT(l,k)与已修正噪声信号CBA(l,k)之间的信噪比γ(l)；在信噪比γ(l)大于预设门限时，认为存在目标语音信号的泄漏成分β_T·C′(l,k)，则更新估计出的目标语音信号的泄漏成分β_T·C′(l,k)；在信噪比γ(l)小于等于预设门限时，认为存在噪声信号的泄漏成分β·CBA(l,k)，则更新估计出的噪声信号的泄漏成分β·CBA(l,k)。在此，该预设门限可根据麦克风阵列的应用场合设定，对于麦克风M1与需要采集的目标语音信号较近的应用场合，例如在降噪耳机中的应用，容易获得更高的信噪比，此时预设门限应设定的相对高一些，通常设定为10左右；而对于麦克风M1与需要采集的目标语音信号较远的应用场合，例如在某些固定的降噪设备中的应用，信噪比会相对较低，此时预设门限应设定的相对低一些，通常设定为5左右，基于上述说明该预设门限的参考设定范围为5至10。

上述计算已修正目标语音信号与已修正噪声信号之间的信噪比γ(l)具体可包括：计算所有频带下的已修正目标语音信号总量；计算所有频带下的已修正噪声信号总量；计算已修正目标语音信号总量与所述已修正噪声信号总量的比，并将计算结果作为已修正目标语音信号与所述已修正噪声信号之间的信噪比γ(l)，公式表达为：γ(l)＝∑_kOUT(l,k)/∑_kCBA(l,k)。

本发明的基于麦克风阵列的语音降噪方法首先通过波束成形技术将组成麦克风阵列的背靠背布置的两个无指向性麦克风构建为两个背向心形指向性麦克风，因此可利用该麦克风阵列获得主要包括目标语音信号的前向目标语音信号和主要包括噪声信号的后向噪声信号；之后通过对前向目标语音信号进行规整掉与频率相关的增益因子的频率均衡处理，可以避免还原后的目标语音信号出现频率失真，为了保证后续自适应双滤波的准确实施，本发明在此对后向噪声信号进行了与前向目标语音信号相同程度的频率均衡，以保证在该频率均衡步骤可对前向目标语音信号和后向噪声信号进行相同程度的缩放；在上述处理的基础上，本发明的方法创新性地采用了自适应双滤波方法对已均衡目标语音信号进行降噪处理，利用后向噪声信号和前向目标语音信号的陷零方向分别跟踪到目标语音信号的泄漏成分和噪声信号的泄漏成分，具体为首先通过对已均衡目标语音信号进行自适应滤波处理，估计出已均衡噪声信号中存在的目标语音信号的泄漏成分，也即已均衡噪声信号中具有的目标语音信号的成分，这样，本发明通过在已均衡噪声信号中去除该目标语音信号的泄漏成分的方式即可获得纯净的已修正噪声信号，此时，再对已修正噪声信号进行自适应滤波处理，即可更准确地估计出已均衡目标语音信号中存在的噪声信号的泄漏成分，因此，通过在已均衡目标语音信号中去除该已噪声信号的泄漏成分，即可有效避免在对已均衡目标语音信号进行降噪的同时损害目标语音信号问题的发生，进而可以保证经本发明方法还原得到的目标语音信号的真实性。

与上述基于麦克风阵列的语音降噪方法相对应，本发明的基于麦克风阵列的语音降噪系统包括波束形成模块1、频率均衡模块2、目标语音信号自适应滤波模块3、噪声信号修正模块4、噪声信号自适应滤波模块5、目标语音信号修正模块6和后置处理模块7，该波束形成模块1用于按照图5和图7所示的波束成形技术将组成麦克风阵列的如图4所示的背靠背布置的两个无指向性麦克风M1、M2构建为两个背向心形指向性麦克风，以得到前向目标语音信号C(l,k)和后向噪声信号B(l,k)；频率均衡模块2用于对前向目标语音信号C(l,k)和后向噪声信号B(l,k)进行相同程度的频率均衡，得到已均衡目标语音信号C′(l,k)和已均衡噪声信号B′(l,k)；目标语音信号自适应滤波模块3用于对已均衡目标语音信号C′(l,k)进行以β_T表示的自适应滤波处理，估计出已均衡噪声信号存在的以β_T·C′(l,k)表示的目标语音信号的泄漏成分；噪声信号修正模块4用于从已均衡噪声信号B′(l,k)中去除目标语音信号的泄漏成分β_T·C′(l,k)，得到已修正噪声信号CBA(l,k)；噪声信号自适应滤波模块5用于对已修正噪声信号CBA(l,k)进行以β表征的自适应滤波处理，估计出已均衡目标语音信号中存在的以β·CBA(l,k)表示的噪声信号的泄漏成分；目标语音信号修正模块6用于从已均衡目标语音信号C′(l,k)中去除噪声信号的泄漏成分β·CBA(l,k)，得到已修正目标语音信号OUT(l,k)；后置处理模块7用于基于该已修正目标语音信号OUT(l,k)，得到还原后的目标语音信号。

如图8所示，上述频率均衡模块2可进一步包括增益因子提取单元21、目标语音信号均衡单元22和噪声信号均衡单元23，该增益因子提取单元21用于提取所述前向目标语音信号相对最先到达所述麦克风阵列的频域声音信号进行缩放的增益因子w_eq；目标语音信号均衡单元22用于将前向目标语音信号C(l,k)除以增益因子w_eq，得到已均衡目标语音信号C′(l,k)；噪声信号均衡单元23用于将后向噪声信号B(l,k)除以所述增益因子w_eq，得到已均衡噪声信号B′(l,k)。

如图9所示，本发明的系统还可包括信噪比计算模块8，其用于计算已修正目标语音信号OUT(l,k)与所述已修正噪声信号CBA(l,k)之间的信噪比γ(l)；在此基础上，上述目标语音信号自适应滤波模块3还用于在信噪比γ(l)大于预设门限时，更新估计出的目标语音信号的泄漏成分β_T·C′(l,k)；该噪声信号自适应滤波模块5还用于在信噪比γ(l)小于等于预设门限时，更新估计出的噪声信号的泄漏成分β·CBA(l,k)。

上述信噪比计算模块8可进一步包括第一计算单元、第二计算单元和信噪比计算单元(未图示)，该第一计算单元用于计算所有频带下的已修正目标语音信号总量；该第二计算单元用于计算所有频带下的已修正噪声信号总量；该信噪比计算单元用于计算所述已修正目标语音信号总量与所述已修正噪声信号总量的比，并将计算结果作为已修正目标语音信号OUT(l,k)与已修正噪声信号CBA(l,k)之间的信噪比γ(l)。

上述后置处理模块7例如可以采用维纳滤波方法对所述已修正目标语音信号进行自适应后置滤波处理，得到已后置滤波目标语音信号Y_out(l,k)，最后基于已后置滤波目标语音信号Y_out(l,k)得到还原后的目标语音信号y_out(n)。

本发明的基于麦克风阵列的语音降噪系统首先通过波束形成模块1获得主要包括目标语音信号的前向目标语音信号和主要包括噪声信号的后向噪声信号；之后通过频率均衡模块2对前向目标语音信号进行规整掉与频率相关的增益因子的频率均衡处理，可以避免还原后的目标语音信号出现频率失真，为了保证后续自适应双滤波的准确实施，该频率均衡模块2在此对后向噪声信号进行了与前向目标语音信号相同程度的频率均衡，以保证该频率均衡模块2可对前向目标语音信号和后向噪声信号进行相同程度的缩放；在此基础上，本发明的系统创新性地通过目标语音信号自适应滤波模块3、噪声信号修正模块4、噪声信号自适应滤波模块5和目标语音信号修正模块6采用了自适应双滤波方法对已均衡目标语音信号进行降噪处理，利用后向噪声信号和前向目标语音信号的陷零方向分别跟踪到目标语音信号的泄漏成分和噪声信号的泄漏成分，具体为首先通过目标语音信号自适应滤波模块3对已均衡目标语音信号进行自适应滤波处理，估计出已均衡噪声信号中存在的目标语音信号的泄漏成分，也即已均衡噪声信号中具有的目标语音信号的成分，这样，噪声信号修正模块4通过在已均衡噪声信号中去除该目标语音信号的泄漏成分的方式即可获得纯净的已修正噪声信号，此时，再通过噪声信号自适应滤波模块5对已修正噪声信号进行自适应滤波处理，即可更准确地估计出已均衡目标语音信号中存在的噪声信号的泄漏成分，因此，通过目标语音信号修正模块6在已均衡目标语音信号中去除该噪声信号的泄漏成分，即可有效避免在对已均衡目标语音信号进行降噪的同时损害目标语音信号问题的发生，进而可以保证经本发明系统还原得到的目标语音信号的真实性。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述得比较简单，相关之处参见方法实施例的部分说明即可。以上所描述的系统实施例仅仅是示意性的，其中所述作为分离部件说明的模块或单元可以是或者也可以不是物理上分开的，作为模块或单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

以上依据图式所示的实施例详细说明了本发明的构造、特征及作用效果，以上所述仅为本发明的较佳实施例，但本发明不以图面所示限定实施范围，凡是依照本发明的构想所作的改变，或修改为等同变化的等效实施例，仍未超出说明书与图示所涵盖的精神时，均应在本发明的保护范围内。

Claims

1.一种基于麦克风阵列的语音降噪方法，其特征在于，包括：

在所述信噪比小于等于所述预设门限时，更新估计出的所述噪声信号的泄漏成分；

2.根据权利要求1所述的方法，其特征在于，所述对所述前向目标语音信号和所述后向噪声信号进行相同程度的频率均衡，得到已均衡目标语音信号和已均衡噪声信号包括：

3.根据权利要求1所述的方法，其特征在于，所述计算所述已修正目标语音信号与所述已修正噪声信号之间的信噪比包括：

计算所有频带下的已修正目标语音信号总量；

计算所有频带下的已修正噪声信号总量；

4.根据权利要求1或2所述的方法，其特征在于，所述基于所述已修正目标语音信号，得到还原后的目标语音信号包括：

5.一种基于麦克风阵列的语音降噪系统，其特征在于，包括：

目标语音信号修正模块，用于从所述已均衡目标语音信号中去除所述噪声信号的泄漏成分，得到已修正目标语音信号；

所述噪声信号自适应滤波模块还用于在所述信噪比小于等于所述预设门限时，更新估计出的所述噪声信号的泄漏成分；以及，

6.根据权利要求5所述的系统，其特征在于，所述频率均衡模块包括：

7.根据权利要求5所述的系统，其特征在于，所述信噪比计算模块包括：

8.根据权利要求5或6所述的系统，其特征在于，所述后置处理模块还用于对所述已修正目标语音信号进行自适应后置滤波处理，得到已后置滤波目标语音信号；及还用于基于所述已后置滤波目标语音信号，得到所述还原后的目标语音信号。