CN106024001A

CN106024001A - 一种提高麦克风阵列语音增强性能的方法

Info

Publication number: CN106024001A
Application number: CN201610283434.6A
Authority: CN
Inventors: 汤煜华; 于鸿洋; 王昭婧
Original assignee: University of Electronic Science and Technology of China
Current assignee: University of Electronic Science and Technology of China
Priority date: 2016-05-03
Filing date: 2016-05-03
Publication date: 2016-10-12

Abstract

本发明提出了一种提高麦克风阵列语音增强算法性能的方法。本发明的方案为：通过语音检测器检测主通道当前是语音时期HSP还是无语音时期NSP；在NSP时，第一滤波器基于输入信号，通过自适应调整第一滤波器的系数，使得第一滤波器的输出信号的能量最小；在HSP时，将第一滤波器的系数锁定，不作调整，直接基于NSP时设置的滤波器系数对输入信号进行滤波处理；将第一滤波器的当前输出信号作为第二滤波器的输入，对主通道信号进行自适应性滤波处理，通过调整自适应第二滤波器的系数，使得第二滤波器的输出信号的能量最小，得到抗串扰且噪声消除的语音输出。本发明的实施，可以在一定程度上提高语音增强效果。

Description

一种提高麦克风阵列语音增强性能的方法

技术领域

本发明属于语音处理技术，具体涉及一种提高麦克风阵列语音增强性能的方法。

背景技术

声学环境很复杂，麦克风在拾取语音信号的同时，也会接收到各种噪声：建筑物的混响，干扰声源，电噪声等。传统的语音拾取工具难以提供好的抗噪声的能力，人们提出了麦克风列语音增强的技术。利用麦克风阵列的空间选择性，聚焦到一个或者多个感兴趣的声源上去。麦克风阵列具有灵敏的波束指向性，优秀的空间滤波性。

在众多的语音增强的算法中，自适应噪声消除(adaptive noise cancellation,ANC)是重要组成部分。它的计算复杂度不高，可以用来处理各种噪声，在实际的实时环境中应用比较多，它需要的麦克风数量不也多。

由于语音信号传播路径的复杂性，在两个通道的ANC系统中，参考通道和与主通道之间的噪声不是完全相关的。所以两个通道的ANC系统中语音增强的效果会受到限制。为了获得更好的性能，我们需要采用更多的麦克风。

在传统ANC算法中，参考通道理想的状态是只包含噪声信号。否则在主通道中的语音信号在噪声消除的时候会被部分抵消掉。参考通道里面的语音信号越多，噪声消除的时候，损失的语音信号也越多，增强的结果也就越差。然而在实际的环境中，让参考通道只包含噪声信号这是不可能的。尤其是在小麦克风阵列中。

发明内容

本发明的发明目的在于：针对上述存在的问题，提供一种能消除串扰的麦克风阵列语音增强性能的方法。

本发明一种提高麦克风阵列语音增强性能的方法，包括下列步骤：

通过语音检测器检测主通道当前是语音时期HSP还是无语音时期NSP；

在NSP时，将噪声信号作为第一滤波器的输入，通过自适应调整第一滤波器的系数，使得第一滤波器的输出信号的能量最小；其中，对于主通道和一个参考通道的双通道模式，噪声信号对应主通道信号和参考通道信号(即比较参考通道中的噪声信号和主通道中的噪声信号之间的关系，也是就所谓的传输函数。自适应调整第一滤波器的系数的过程就是获取这种关系的过程。以便在HSP时，可以利用所获得的传输函数和参考通道中的噪声信号来消除主通道中的噪声信号)；对于多通道模式，噪声信号对应所有参考通道信号；在HSP时，将第一滤波器的系数锁定，不作调整，直接基于NSP时设置的第一滤波器的系数对输入信号进行滤波处理；

将第一滤波器的当前输出信号作为第二滤波器的输入，对主通道信号进行自适应性滤波处理，通过自适应第二滤波器的系数，使得第二滤波器的输出信号的能量最小，得到抗串扰且噪声消除的语音输出。

即本发明在HSP和NSP均通过第二滤波器对主通道信号进行自适应性滤波处理，仅在NSP自适应调整第一滤波器的系数。

综上所述，由于采用了上述技术方案，本发明的有益效果是：在去除噪声的同时抗串扰，且计算复杂度低，对不同噪声的去噪处理的适用性强。

附图说明

图1是双通道自适应噪声消除示意图；

图2是双通道串扰模型；

图3是双通道抗串扰自信应噪声消除示意图；

图4是多通道串扰模型；

图5是多通道抗串扰自适应噪声消除算法示意图；

图6中，(a)为语音信号波形图，(b)为噪声信号波形图，(c)为主通道信号波形图，(d)为参考通道信号波形图；

图7中，(a)为纯净的语音信号波形图，(b)为带噪声的语音信号波形图，(c)为双通道自适应噪声消除后的语音信号波形图，(d)为抗串扰的双通道自适应噪声消除后的语音信号波形图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面结合实施方式和附图，对本发明作进一步地详细描述。

如图1所示，假设噪声信号是n(t)。它从噪声源传到麦克风阵M₀和M₁，然后噪声信号被分别拾取为n₀(t)和n₁(t)。假设语音信号是s(t)。被麦克风M₀拾取为s₀(t)。进一步假设语音信号s(t)没有进入参考信道M₁。所以最终被麦克风拾取的信号的形式是这样的：

x₀(t)＝s₀(t)+n₀(t) (1)

x₁(t)＝n₁(t) (2)

所述x₀(t)、x₁(t)分别对应麦克风M₀、M₁拾取的信道信号，其中：

n_i(t)＝h_ni(t)*n(t) i＝0,1 (3)

s₀(t)＝h_s0(t)*s(t) (4)

上式中，*是卷积符号(下同)，h_n0(t)和h_n1(t)分别是噪声源到麦克风M₀和M₁之间冲击响应，即主通道冲击响应，参考通道冲击响应。

在离散时域中t＝kT，其中k是时域中的序号，T是采样的周期。简单来说就是用k来代替t。连续信号是x(t)，离散信号是x(k)。

在噪声环境中只能获取到信号x₀(k)和x₁(k)，在基于所获取的两个信号恢复语音信号s₀(k)时，如果噪声信号和语音信号是不相关的，则可以通过ANC算法实现，参见图1，其ANC系统的输出信号e(k)＝x₀(k)-y(k)＝s₀(k)+n₀(k)-y(k)，对其两边同时平方可得：

e^{2} (k) = s_{0}^{2} (k) + {[n_{0} (k) - y (k)]}^{2} + 2 s_{0} (k) [n_{0} (k) - y (k)]

s₀(k)和n₀(k)，y(k)是不相关的，求期望的：以调整自适应滤波器A的系数，使得输出能量E[e²(k)]最小。即：

\min E [e^{2} (k)] = E [s_{0}^{2} (k)] + \min E {[n_{0} (k) - y (k)]}^{2} - - - (5)

从公式(5)可以看出最小化E[e²(k)]和最小化E[n₀(k)-y(k)]²是等价的。所以滤波器A在均方误差最小准则(MMSE)下的输出y(k)是对主通道中噪声信号的估计。整个系统的输出信号e(k)是对信号s₀(k)在最小均方差准则下的估计。

从公式(5)可以知道，要取得最小值E[e²(k)]＝E[s₀ ²(k)]，当且仅当E[n₀(k)-y(k)]²＝0。也就是说y(k)＝n₀(k)，e(k)＝s₀(k)，即当前系统的输出为无噪声的信号。

在ANC系统中，滤波器A可以有很多种形式。然而通常来说使用的是自适应的FIR滤波器，其形式为其中W是滤波器的系数向量，N₁(k)＝[n₁(k+L₁),...,n₁(k+1),n₁(k),...n₁(k-L₂)]^T，其中L₁表示主通道延时，L₂表示参考通道延时。

对于自适应滤波器A的系数的调整，可以采用常用的技术，比如最小均方差法(LMS)，递归最小二乘法(RLS)等。在这些方法中LMS算法是最简单，被广泛使用的方法。也有很多改进的LMS算法。本具体实施方式中采用LMS算法。

在传统的噪声消除处理中，通常假定参考通道中没有语音信号。否则主通道中的信号会被部分或者完全地消除掉。然而在实际的环境中，语音信号会不可避免的传入到参考通道中去，导致参考通道中含有语音信号，尤其是在阵列孔径比较小的时候。对于参考通道和主通道中均含有语音信号和噪声信号的情况，将其称之为串扰。

本发明针对麦克风阵列的串扰技术问题，公开了一种抗串扰的自适应噪声消除方法，其适用于双通道乃至多通道的串扰情况。

针对如图2所示的双通道的串扰，本发明包括两个滤波器(滤波器A和B)和一个语言探测器，其实现结构示意图如图3所示。首先，假设信号s(k)传播到麦克风M₀和M₁的传输函数是H_s0(z)和H_s1(z)，转换后得到的信号分别是s₀(k)和s₁(k)。其中噪声信号n(k)传播到麦克风M₀和M₁的传输函数是H_n0(z)和H_n1(z)，转换到麦克风M₀和M₁上的信号就是n₀(k)和n₁(k)。然后两个麦克风实际的信号获取情况是：

x₀(k)＝s₀(k)+n₀(k)

x₁(k)＝s₁(k)+n₁(k)

其中x₀(k)和x₁(k)包含了语音信号和噪声信号。

对于图2所示的模型有：

s₀(z)＝H_s0(z)s(z)

s₁(z)＝H_s1(z)s(z)

n₀(z)＝H_n0(z)n(z)

n₁(z)＝H_n1(z)n(z)

其中，s(z)对应信号s(k)的z变换，s₀(z)表示s₀(k)的z变换，定义s₀(k)到s₁(k)的传输函数是H_s0s1(z)，n₁(k)到n₀(k)的传输函数是H_n1n0(z)。即：

s₁(z)＝H_s0s1(z)s₀(z)

n₀(z)＝H_n1n0(z)n₁(z)

将上式转换为：

H_{s 0 s 1} (z) = \frac{H_{s 1} (z)}{H_{s 0} (z)}

H_{n 1 n 0} (z) = \frac{H_{n 0} (z)}{H_{n 1} (z)}

本发明通过噪声消除来实现语音增强，而噪声消除的处理为：

首先，因语音信号是间歇性的，因此将信号分为有语音时期(Having SpeechPeriod,HSP)和无语音时期(Non Speech Period,NSP)；

在NSP时，麦克风M₀和M₁拾取的是纯净的噪声信号：n₀(k)和n₁(k)。将主通道信号n₀(k)，参考通道的信号n₁(k)作为滤波器A的输入。其目的是为了估计通道间噪声信号的传输函数H_n1n0(z)。通过自适应的调整滤波器A的系数，使得e₁(k)的输出能量最小，从而估算得到H_n1n0(z)。

在HSP时，因当前噪声环境和NSP相比的变化很少，可以假设噪声环境无变化，即噪声源的位置和麦克风阵列的位置无变化或者变化可以忽略不计，即：

Y₁(z)＝H_n1n0(z)X₁(z)＝H_n1n0(z)[S₁(z)+N₁(z)]；

E₁(z)＝X₀(z)-Y₁(z)

＝S₀(z)+N₀(z)-H_n1n0(z)S₁(z)-H_n1n0(z)N₁(z)

＝S₀(z)-H_n1n0(z)S₁(z)

＝[1-H_n1n0(z)H_s0s1]S₀(z)

其中，Y₁(z)表示y₁(k)的z变换，y₁(k)表示滤波器A的输出信号，X₁(z)表示x₁(k)的z变换。

滤波器B的系统函数是[1-H_n1n0(z)H_s0s1]^-1,则基于上式可得：

Y₂(z)＝[1-H_n1n0(z)H_s0s1(z)]^-1E₁(z)＝S₀(z)

E₂(z)＝X₀(z)-Y₂(z)

＝[S₀(z)+N₀(z)]-S₀(z)＝N₀(z)

有上式可知，混合在信号x₀(k)中的语音信号s₀(k)和噪声信号n₀(k)被分离了。所以滤波器B的输出就是目标信号s₀(k)。接下来，为了得到滤波器B的系统函数[1-H_n1n0(z)H_s0s1]^-1，则通过自适应调整B的系数使得输出功率E[e₂ ²(k)]最小即可。这是因为：

||e₂(k)||²＝||x₀(k)-y₂(k)||²

＝||s₀(k)+n₀(k)-y₂(k)||²

＝||n₀(k)||²+||s₀(k)-y₂(k)||²+2n₀(k)[s₀(k)-y₂(k)]

上式中，y₂(k)表示滤波器B的输出信号，对等式左右两边同时取期望。考虑到n₀(k)和s₀(k)是不相关的，因此所以e₂(k)功率的最小值，意味着最小的E{[s₀(k)-y₂(k)]²}。考虑到滤波器B的输入信号e₁(k)和s₀(k)是相关。作为滤波器B的输出信号y₂(k)就是在最小均方误差准则下对信号s₀(k)的估计。

相邻的HSP和NSP时期，残留在增强后信号中的噪声水平是不一样的。因为在每一个时刻噪声环境都在有变化。所以残留噪声的水平会随着时间波动。为了克服这一点。可以在所有时期都动态的调整滤波器B的滤波系数来克服上述波动。

总而言之，如图3所示，NSP时期，在使得e₁(k)输出能量最小的准则下，动态的调整A的滤波系数；对于滤波器B，在使得e₂(k)的输出能量最小的准则下动态调整B的滤波系数。然后B的输出y₂(k)就是我们增强后的信号。这是对于双通道的抗串扰算法。

滤波器A和滤波器B的系统函数分别为H_n1n0(z)和[1-H_n1n0(z)H_s0s1]^-1。H_n1n0(z)是滤波器A在NSP得到。[1-H_n1n0(z)H_s0s1]^-1是滤波器B在HSP的时候得到的。如果在下一个阶段，NSP中的噪声环境没有发生变化吗，则滤波器A的系统函数也不会变化；如果在下一个HSP中的语音信号的环境没有发生变化(麦克风和声源位置不变，介质也没有发生变化或者其发变化可以忽略不计)，滤波器B的系统函数也不会变化。否则两个滤波器的系数需要自适应调整。本发明中，通过语音探测器来判断是否触发对滤波器A的系数的更新，即当语言探测器的检测结果为无语音信号时，对滤波器A的系数进行更新；否则滤波器A的系数被锁定。

本发明的语音增强方式不仅可以用于双声道的抗串扰噪声消除，还可以用于多声道的抗串扰的噪声消除，其具体处理为：

在多通道麦克风阵列中，假设输入信号是s(k)，噪声信号是n(k)，且两者不相干。信号s(k)、n(k)到达麦克风M_i通过了多种路径转换成了s_i(k)和n_i(k)。传输媒介对语音信号和噪声信号的冲击响应是h_si(k)和h_ni(k)。麦克风M_i获取的信号可以表示为：

x_i(k)＝s_i(k)+n_i(k) i＝0,1,...,N

N+1是麦克风阵列中的麦克风数目；k表示的是离散时刻的序号。既有噪声又有语音信号，这个时候就会发生串扰。

从图4可知：

s_i(k)＝h_si(k)*s(k) i＝0,1,...,N

n_i(k)＝h_ni(k)*n(k) i＝0,1,...,N

定义两个麦克风语音信号s_i(k)和s_j(k)之间的冲击响应为h_sisj(k)。同样的定义噪声n_i(k)和n_j(k)之间的冲击响应是h_ninj(k)。

s_j(k)＝h_sisj(k)*s_i(k) j,i＝0,1,...,N

n_j(k)＝h_ninj(k)*n_i(k) j,i＝0,1,...,N

根据这两个式子可以得出：

\begin{matrix} H_{s i s j} (z) = \frac{H_{s j} (z)}{H_{s i} (z)} & j, i = 0, 1, ..., N \end{matrix}

\begin{matrix} H_{n i n j} (z) = \frac{H_{n j} (z)}{H_{n i} (z)} & j, i = 0, 1, ..., N \end{matrix}

其中，H_sj(z)、H_si(z)、H_nj(z)、H_ni(z)分别为冲击响应h_si(k)、h_sj(k)、h_ni(k)、h_nj(k)的z变换，H_sisj(z)表示s_i(k)和s_j(k)之间的传输函数，H_ninj(z)表示n_i(k)和n_j(k)之间的传输函数，即冲击响应h_sisj(k)、h_ninj(k)的z变换。

假设x₀(k)就是麦克风阵列中的主通道M₀所捕获的信号，x_i(k)(i＝1,..,N)是其他N个参考通道中捕获的信号。在通常情况下(阵列元间隔比较近)，主通道和参考通道的信号是相关的。参考通道里既包含了语音信号又包含了噪声信号，通常的多声道噪声消除方法不能得到比较好的噪声消除效果。这是因为串扰的存在，主通道中的语音信号会被部分的消除掉。

多通道抗串扰噪声消除处理实现示意图参见图5，其包括一个语音检测器和两个自适应的滤波器A、B。

在NSP时，麦克风M₀,M₁..,M_N获取的只是噪声信号n₀(k),n₁(k),...,n_N(k)。n₀(k)为主通道中的噪声，n₁(k),...,n_N(k)是参考通道获取的噪声。

首先，将所有的参考声道的噪声(n₁(k),...,n_N(k))输入到滤波器A；

然后采用FIR滤波器的形式来设计自适应滤波器A：

n₀(k)＝W_iN_i(k)+e_i1(k)

W_i＝(w_i0,w_i1,...,w_iL)

N_i(k)＝[n_i(k),n_i(k-1),...,n_i(k-L)]^T

其中W_i是滤波器A的系数，L+1是滤波器A的长度。e_i1(k)是用n_i(k)来预测n₀(k)的误差。e_i1(k)与最终的能量大小和最终的增强效果有着密切的联系。参考通道中的噪声信号和主通道中的噪声信号相关度并不是很高。基于实际的噪声环境，麦克风隔得越远，噪声的相关性就会越小。所以误差功率p[e_i1(k)]就越大。

如果多个参考通道n₁(k),...,n_N(k)都输入到滤波器A来消除n₀(k)中的噪声，则：

n₀(k)＝WN(k)+e₁(k)

W＝(W₁,W₂,...,W_N)

W_i＝(w_i0,w_i1,...,w_iL)

其中W是滤波器A的系数，它是一个N(L+1)行向量。

N(k)＝[N₁(k),N₂(k),...,N_N(k)]^T

N_i(k)＝[n_i(k),n_i(k-1),...,n_i(k-L)]

所述N(k)是一个N(L+1)的列向量，e₁(k)是预期的误差。假设W＝(0,...,0,W_i,0,...,0)。则有：

e₁(k)＝n₀(k)-WN(k)

＝n₀(k)-W_iN_i(k)

＝e_i1(k)

所以在理想情况下取到W和W_i，它们对应的最小误差的功率最好满足下面这个不等式。

p[e_i(k)]＜p[e_i1(k)]

通常情况下p[e_i(k)]会远远小于p[e_i1(k)]，尤其是当有多个噪声源，并且噪声的传播路径不止一个的时候。这就意味着通过利用N个参考通道中的噪声信号，可以使残留在主通道中的噪声变得小，即可以通过增加麦克风的数目来增加主通道噪声和参考通道中噪声的相关性。但是如果N越大的话意味着需要采用更多的麦克风，L越大在实际的应用中则更加困难。因此麦克风的数目和滤波选取的采样点数可以通过调试进行设置：

将输出最小误差e₁(k)的滤波器A的系数写成下面这个形式：

\begin{matrix} W^{*} = ({W_{1}}^{*}, {W_{2}}^{*}, ..., {W_{N}}^{*}) \\ = (w_{10}^{*}, w_{11}^{*}, ..., w_{1 L}^{*}, w_{20}^{*}, w_{21}^{*}, ..., w_{2 L}^{*}, ..., w_{N 0}^{*}, w_{N 1}^{*}, ..., w_{N L}^{*}) \end{matrix}

对应的最小误差功率是为了取到对应的到W^*，通过调整滤波器A的系数使得误差功率最小即可。

在HSP时。设置噪声的冲击响应为h_nin0(k)(假设当前噪声环境不变或变化缓慢)，因此有：

\begin{matrix} y_{1} (k) = W^{*} X (k) \\ = W^{*} [S (k) + N (k)] \\ = W^{*} S (k) + W^{*} N (k) \\ = W^{*} S (k) + [N_{0} (k) - e_{1}^{*} (k)] \end{matrix}

其中，S(k)为：

S(k)＝[S₁(k),S₂(k),...,S_N(k)]^T

S_i(k)＝[s_i(k),s(k-1),...,s_i(k-L)]

因此可得：

\begin{matrix} e_{1} (k) = x_{0} (k) - y_{1} (k) \\ = [s_{0} (k) + n_{0} (k)] - [W^{*} S (k) + n_{0} (k) - e_{1}^{*} (k)] \\ = s_{0} (k) - W^{*} S (k) + e_{1}^{*} (k) \\ = p (k) + e_{1}^{*} (k) \end{matrix}

其中：

p(k)＝s₀(k)-W*S(k)

对上面的式子做z变换。

P (z) = S_{0} (z) - Z [Σ_{i = 1}^{N} Σ_{l = 0}^{L} {w_{i l}}^{*} s_{i} (k - l)]

\begin{matrix} = S_{0} (z) - Z [Σ_{i = 1}^{N} Σ_{l = 0}^{L} {w_{i l}}^{*} h_{s 0 s i} (k - l) * s_{0} (k - l)] \\ = S_{0} (z) - Σ_{i = 1}^{N} Σ_{l = 0}^{L} {w_{i l}}^{*} H_{s 0 s i} Z^{- 2 l} S_{0} (Z) \\ = [1 - Σ_{i = 1}^{N} Σ_{l = 0}^{L} {w_{i l}}^{*} H_{s 0 s i} (Z) Z^{- 2 l}] S_{0} (Z) \\ = \tilde{H} (z) S_{0} (z) \end{matrix}

其中：

\tilde{H} (z) = 1 - Σ_{i = 1}^{N} Σ_{l = 0}^{L} {w_{i l}}^{*} H_{s 0 s i} (Z) Z^{- 2 l}

由上式可知，p(k)会使得语音信号发生失真的，并且它和S₀(k)是相关的。此外p(k)的功率其实往往不会像的功率那样小。这就意味着带噪声的语音信号不会像噪声信号那样被严重削减。这是因为噪声信号和语音信号有着不同的传播方式。噪声源，目标声源，麦克风的位置通常是影响这个的因素。e₁(k)的信噪比通常比带噪信号x₀(k)有很大的提升。其中语音信号是p(k)而噪声信号的是然而，信号e₁(k)中的p(k)不是s₀(k)信号的近似，而是失真后的s₀(k)。当麦克风的数量增加的时候这种失真会变得更加的大。因此，本发明的滤波器B的作用就是从失真的p(k)中获取语音信号s₀(k)。通过调整滤波器B的系数即可实现滤波器B的该作用。从而使得e₂(k)的输出功率最小。

与双声道相同的处理方式，为了防止波动增强后语音信号中的噪声残留水平的波动。最好的办法就是滤波器B一直工作，一直保证e₂(k)最小，而滤波器A只有在没有语音信号的时候才调整系数。然后滤波器B的输出y₂(k)就是在最小均方误差准则下系统S₀(k)的估计。

\begin{matrix} Y_{2} (z) = {\tilde{H}}^{- 1} (z) E_{1} (z) \\ = {\tilde{H}}^{- 1} (z) [\tilde{H} (z) S_{0} (z) + E_{1}^{*} (z)] \\ = S_{0} (z) + {\tilde{H}}^{- 1} (z) E_{1}^{*} (z) \end{matrix}

因此：

y_{2} (k) = S_{0} (k) + {\tilde{h}}^{- 1} (k) * {e_{1}}^{*} (k)

实施例

提取一段语言信号和音乐，将音乐作为噪声信号。语音信号和噪声信号的采样率都是16kHz。为了仿真，将语音信号到主通道和参考通道的传输函数分别设置为：、

H_s0(z)＝[0.0408,0.0817,0.1633,0.1225,0.0408,0.2048,0.2450.0.0817]z

H_s1(z)＝[0.1293,0.1293,0.0970,0.2587,0.0647,0.0323,0.0970,0.1617]z

噪声信号到主通道和参考通道的传输函数分别设置为：

H_n0(z)＝[0.1187,0.2960,0.1781,0.0594,0.0000,0.0000,0.2375,0.0594]z

H_n1(z)＝[0.1309,0.2182,0.2618,0.000,0.0873,0.0000,0.0436,0.2182]z

其中，z＝[1,z^-1,z^-2,z^-3,z^-4,z^-5,z^-6,z^-7]^T。

根据s₀(k)＝h_s0(k)*s(k)可得到主通道中语音信号s₀(k)，根据n₀(k)＝h_n0(k)*n(k)可得到主通道中噪声信号n₀(k)；同理可得参考通道中语音信号s₁(k)、噪声信号n₁(k)。

s₀(k)、n₀(k)的波形图分别如图6(a)、(b)、所示，而主通道和参考通道中的信号x₀(k)＝s₀(k)+n₀(k)，x₁(k)＝s₁(k)+n₁(k)分别如图6(c)、(d)所示。

基于本发明的抗串扰方式，实现对语言信号的增强性处理，其输出结果如图7所示，其中图7(a)、(b)分别是本实施例纯净的语音信号s₀(k)和带噪声的语音信号x₀(k)，图7(c)是传统的双通道自适应噪声消除后的语音信号，图7(d)是抗串扰的双通道自适应噪声消除后的语音信号。从图7可知，本发明的处理效果良更优。

Claims

1.一种提高麦克风阵列语音增强性能的方法，其特征在于，包括下列步骤：

在NSP时，第一滤波器基于输入信号，通过自适应调整第一滤波器的系数，使得第一滤波器的输出信号的能量最小；其中，对于主通道和一个参考通道的双通道模式，第一滤波器的输入信号为主通道信号和参考通道信号；对于主通道和一个以上参考通道的多通道模式，第一滤波器的输入信号为所有参考通道信号；在HSP时，将第一滤波器的系数锁定，不作调整，直接基于NSP时设置的第一滤波器的系数对输入信号进行滤波处理；

将第一滤波器的当前输出信号作为第二滤波器的输入，对主通道信号进行自适应性滤波处理，通过调整自适应第二滤波器的系数，使得第二滤波器的输出信号的能量最小，得到抗串扰且噪声消除的语音输出。