CN107452393A

CN107452393A - 一种回声消除系统及方法

Info

Publication number: CN107452393A
Application number: CN201710624542.XA
Authority: CN
Inventors: 周萍; 吴雷; 杨海燕; 苏欣欣
Original assignee: Guilin University of Electronic Technology
Current assignee: Guilin University of Electronic Technology
Priority date: 2017-07-27
Filing date: 2017-07-27
Publication date: 2017-12-08
Anticipated expiration: 2037-07-27
Also published as: CN107452393B

Abstract

本发明涉及一种回声消除系统及方法，用于即时翻译过程中远距离声学回声消除，其方法包括以下步骤：获取即时翻译系统的输入信号，对输入信号进行处理，获取处理参数；根据处理参数对APA算法噪声进行量化，得量化模型；根据量化模型推导出统计量；将统计量代入变步长因子中，自动调整步长因子，构建改进APA算法，利用改进APA算法进行滤除干扰噪声。相对现有技术，本发明不但可以有效克服双端对讲干扰，消除噪声，而且在收敛速度、稳态失调等方面也有明显改善。

Description

一种回声消除系统及方法

技术领域

本发明涉及信号处理技术领域，特别涉及一种回声消除系统及方法。

背景技术

随着中国经济的快速发展，人们的生活水平逐步提高，出境旅游人数大幅增加，但是绝大部分人都无法独自进行外语交流，一款便携式的即时翻译系统可以很好的解决这一问题。目前便携式即时翻译系统的研究应用中还存在许多问题，比如算法的收敛速度还无法满足实时性要求，现有的回声消除算法在双端对讲情况下经常存在发散的问题，使用户体验不佳。因此，创建能够克服双端对讲干扰且具有快速收敛性的回声消除算法是所追求的目标。

传统的最小均方(LMS)算法和归一化最小均方(NLMS)算法因其结构简单、算法复杂度低，被广泛应用于回声消除中，但在远距离声学回声消除过程中，回声路径的冲激响应时间很长，且语音信号存在非平稳、强相关的特性，使得LMS算法和NLMS算法收敛速度减慢，稳态失调增加，无法满足实时处理的需求。

为克服输入信号相关性的影响,Ozeki与Umeda提出仿射投影算法(AffineProjection Algorithm,APA)。APA是NLMS算法的多维推广，在输入数据具有强相关性的情况下提高算法的收敛速度。同LMS算法一样，APA需要选择合适的步长来取得收敛速度与稳态误差之间的折衷，当步长较大时，收敛速度将加快，但同时稳态误差也会增大；当步长较小时，稳态误差减小，而收敛速度会变慢。因此，可采用变步长解决以上问题，在算法未收敛时采用较大的步长，当算法收敛时采用较小的步长。APA算法通过为自适应系统引入记忆性,重复使用输入信号以提高算法收敛速度，在处理非平稳、强相关的语音信号时仍能保持其优异的算法性能。

APA算法通过重复利用输入数据提高收敛速度。定义输入数据的重用次数为阶数，构造M阶APA如下：

设N为FIR滤波器长度；H＝[h₀，h₁，...，h_N-1]^T为回声路径序列；分别记t时刻噪声信号、输入信号为v(t)、x(t)，可得t时刻输入信号向量为X_N(t)，X_N(t)＝[x(t)，x(t-1)，...，x(t-N+1)]^T，其中下标N表示数组长度，上标T表示矩阵转置。

期望信号d(t)满足：

将t时刻前M个输入向量记为矩阵形式：

X_NM(t)＝[X_N(t),X_N(t-1),...,X_N(t-M+1)]； (11)

分别记V(t)、Y(t)、D(t)为t时刻前M个噪声、滤波器输出与期望信号构成的向量,得：

V(t)＝[v(t),v(t-1),...,v(t-M+1)]^T； (12)

Y(t)＝X^T _NM(t)W(t)＝[y₀(t),y₁(t),...,y_M-1(t)]^T； (13)

D(t)＝[d(t),d(t-1),...,d(t-M+1)]^T； (14)

分别定义t时刻先验误差、后验误差为：

e(t)＝D(t)-X^T _NM(t)W(t)＝D(t)-Y(t)

＝[e₀(t),e₁(t),...,e_M-1(t)]^T； (15)

ε(t)＝D(t)-X^T _NM(t)W(t+1)； (16)

APA以求解约束最优化问题为算法目标。

目标函数：

约束条件:ε(t)＝0_M1； (18)

式(18)中0_M1表示M×1零向量。物理意义为：在强制后验误差ε(t)为零的条件下，更新后的向量W(t+1)应尽可能与当前向量W(t)保持接近。应用拉普拉斯乘子法可得式(17)、(18)解为：

W(t+1)＝W(t)+X_NM(t)(X^T _NM(t)X_NM(t))^-1e(t)； (19)

由于各种环境噪声及测量噪声的存在,强迫后验误差为零，使算法对不相关的干扰信号进行补偿,最终导致稳态失调增加。因此需引入收敛步长μ(0<μ<2)以取得稳态失调与收敛速度的折衷。标准APA算法如下：

W(t+1)＝W(t)+μX_NM(t)(X^T _NM(t)X_NM(t))^-1e(t) (20)

APA算法在远距离回声消除过程中，回声路径的冲激响应时间很长，但是普通参数可调横向滤波器阶数比真实的回声路径阶数短，因此在实际应用中模型噪声普遍存在，将模型噪声进行量化并处理是必要的。

在处理非平稳、强相关的语音信号时，APA算法能保持较高的收敛速度以及较低的稳态失调量，但未考虑到双端对讲与回声路径突变的区别，所以无法有效克服双端对讲带来的干扰。

发明内容

本发明的目的是提供一种回声消除系统及方法，所要解决的技术问题是：APA算法在远距离回声消除过程中，回声路径的冲激响应时间很长，但是普通参数可调横向滤波器阶数比真实的回声路径阶数短；无法有效克服双端对讲带来的干扰。

本发明解决上述技术问题的技术方案如下：一种回声消除方法，用于即时翻译过程中远距离声学回声消除，包括以下步骤：

步骤S1.获取即时翻译系统的输入信号，对输入信号进行处理，获取处理参数；

步骤S2.根据处理参数对APA算法噪声进行量化，得量化模型；根据量化模型推导出统计量；

步骤S3.将统计量代入变步长因子中，自动调整步长因子，构建改进APA算法，利用改进APA算法进行滤除干扰噪声。

本发明的有益效果是：处理模块、量化统计模块和构建模块协调运作，构建改进APA算法，改进APA算法不但可以有效克服双端对讲干扰，消除噪声，而且在收敛速度、稳态失调等方面也有明显改善。

在上述技术方案的基础上，本发明还可以做如下改进。

进一步，所述步骤S1中获取即时翻译输入信号具体包括：获得t时刻输入信号向量为：

X_N(t)＝[x(t)，x(t-1)，...，x(t-N+1)]^T；

其中N表示数组长度，上标T表示矩阵转置。

进一步，所述步骤S1中，获取处理参数的具体步骤包括：对信号向量X_N(t)进行处理，获取t时刻前M个噪声信号向量V(t)、滤波器输出信号向量Y(t)和期望信号向量D(t)，以及t时刻先验误差e(t)、后验误差ε(t)。

进一步，所述步骤S2中根据处理参数对APA算法噪声进行量化的具体步骤包括以下：

步骤S21.获取即时翻译系统输入信号的回声路径有限冲激响应和滤波器的有限冲击响应；

步骤S22.对回声路径有限冲激响应和滤波器的有限冲击响应进行处理，得出回声信号；对处理参数和回声信号进行处理，得麦克风信号和滤波器输出信号；

步骤S23.利用麦克风信号和滤波器输出信号对模型噪声进行量化。

进一步，所述步骤S2中，根据量化模型推导出统计量具体包括以下步骤：

选用高斯白噪声信号为输入信号时，采用指数窗方法对处理参数和量化模型进行处理，获取近端信号能量统计量和滤波器收敛程度统计量ψ(t)。

进一步，所述步骤S3中，改进APA算法具体为：

W(t+1)＝W(t)+μ(t)X_NM(t)(X^T _NM(t)X_NM(t))^-1e(t)；

其中变步长因子为：

为近端信号能量统计量，ψ(t)为滤波器收敛程度统计量。

本发明解决上述技术问题的另一技术方案如下：一种回声消除系统，用于即时翻译过程中远距离声学回声消除，包括：

处理模块，用于获取即时翻译系统的输入信号，对输入信号进行处理，获取处理参数；

量化统计模块，用于根据处理参数对APA算法噪声进行量化，得量化模型；根据量化模型推导出统计量；

构建模块，用于将统计量代入变步长因子中，自动调整步长因子，构建改进APA算法，利用改进APA算法进行滤除干扰噪声。

在上述技术方案的基础上，本发明还可以做如下改进。

进一步，所述量化统计模块获取即时翻译系统输入信号的回声路径有限冲激响应和滤波器的有限冲击响应；

对回声路径有限冲激响应和滤波器的有限冲击响应进行处理，得出回声信号；对处理参数和回声信号进行处理，得麦克风信号和滤波器输出信号；

利用麦克风信号和滤波器输出信号对模型噪声进行量化。

进一步，所述量化统计模块选用高斯白噪声信号为输入信号时，采用指数窗方法对处理参数和量化模型进行处理，获取近端信号能量统计量和滤波器收敛程度统计量ψ(t)。

进一步，所述改进APA算法具体为：

W(t+1)＝W(t)+μ(t)X_NM(t)(X^T _NM(t)X_NM(t))^-1e(t)；

其中变步长因子为：

为近端信号能量统计量，ψ(t)为滤波器收敛程度统计量。

采用上述进一步方案的有益效果是：改进APA算法不但可以有效克服双端对讲干扰，消除噪声，而且在收敛速度、稳态失调等方面也有明显改善。

附图说明

图1为本发明一种回声消除方法的流程图；

图2为本发明仿真结果比较示意图；

图3为本发明跟踪性能比较示意图；

图4为本发明双端对讲时性能比较示意图；

图5为本发明一种回声消除系统的流程图。

附图中，各标号所代表的部件列表如下：

1、处理模块，2、量化统计模块，3、构建模块。

具体实施方式

以下结合附图对本发明的原理和特征进行描述，所举实例只用于解释本发明，并非用于限定本发明的范围。

如图1所示，一种回声消除方法，用于即时翻译过程中远距离声学回声消除，包括以下步骤：

可选的，作为本发明的一个实施例：所述步骤S1中获取即时翻译输入信号具体包括：获得t时刻输入信号向量为：

X_N(t)＝[x(t)，x(t-1)，...，x(t-N+1)]^T；

其中N表示数组长度，上标T表示矩阵转置。

可选的，作为本发明的一个实施例：所述步骤S1中，获取处理参数的具体步骤包括：对信号向量X_N(t)进行处理，获取t时刻前M个噪声信号向量V(t)、滤波器输出信号向量Y(t)和期望信号向量D(t)，以及t时刻先验误差e(t)、后验误差ε(t)。

可选的，作为本发明的一个实施例：所述步骤S2中根据处理参数对APA算法噪声进行量化的具体步骤包括以下：

上述实施例中，获取即时翻译系统的回声路径有限冲激响应：

h＝[h₀,h₁,...,h_N-1,h_N,h_N+1,...,h_L-1]^T； (21)

即时翻译系统中滤波器的有限冲击响应为：

其中，L是回声路径的阶数，N为参数可调横向滤波器的阶数，且N<L。

由式(21)(22)可知回声路径中的一部分冲激响应无法被横向滤波器逼近，将这部分表示为：

h_L-N＝[h_N,h_N+1,...,h_L-1]^T； (23)

进而可以将回声路径的有限冲击响应h表示为：

其中，h_N＝[h₀,h₁,...,h_N-1]T,为可被滤波器逼近的那部分。

由于回声路径与滤波器的阶数不同，导致两者所需的输入信号向量的长度也有所不同，分别表示为：

X_N(t)＝[x(t),x(t-1),...,x(t-N+1)]^T； (26)

其中X(t)表示回声路径的输入，长度为L；X_N(t)表示滤波器的输入，长度为N。

因此，X_L-N(t)＝[x(t-N),x(t-N-1),...,x(t-L+1)]^T为回声路径比滤波器多出来的输入信号。

由式(24)(25)推导出回声信号y(t)为：

便携式即时翻译系统中麦克风信号表示为d(t)，由回声信号y(t)、近端语音信号v(t)和背景噪声信号w(t)复合而成：

d(t)＝y(t)+v(t)+w(t)； (28)

由式(27)(28)推导得麦克风信号d(t)为：

由式(22)(26)可得滤波器的输出：

定义误差信号e(t)为：

将式(29)(30)代入(31)，得：

定义系数偏差向量为：

表示滤波器系数与其所逼近的回声路径之间的差别。

将式(33)带入式(32)得：

令定义为模型噪声；上述处理实现了对模型噪声的量化。

可选的，作为本发明的一个实施例：所述步骤S2中，根据量化模型推导出统计量具体包括以下步骤：

上述实施例中，

输入信号是高斯白噪声信号，则有：

其中为序列x(t)的能量。

由式(35)可得自相关矩阵R_xx的表达式简化为：

其中I表示单位矩阵。

一般而言，远端信号x(t)与近端语音信号v(t)和背景噪声信号w(t)都不相关，y_L-N(t)与v(t)和w(t)也不相关，由式(35)得X_N(t)与X_L-N(t)不相关，由可以得知X_N(t)与y_L-N(t)不相关，v(t)与w(t)也不相关，可推出式(34)右边几项因式彼此不相关，结合式(36)可得均方误差：

其中表示2-范数的平方。

信号X_N(t)与e(t)的互相关向量为：

将式(38)表示为r_ex(t),由式(37)的推导过程可知：

式(39)取2-范数的平方可得：

将式(40)代替式(37)中的可得：

由于回声路径冲激响应中h_N部分包含的能量比h_L-N大很多，所以模型噪声y_L-N(t)的能量很小。当近端信号v(t)不存在时，式(41)的值就是背景噪声w(t)和模型噪声y_L-N(t)的能量，这个值通常会很小。当近端信号v(t)存在时，由于v(t)的能量比w(t)和y_L-N(t)能量大很多，式(41)的值就会变得非常大。我们可以用式(41)来判断双端对讲的情况。所以近端能量统计量为：

其中定义的滤波器收敛程度统计量ψ(t)如下：

其中r_ed(t)＝E[e(t)d(t)]。

由式(37)的推导过程可知：

将式(38)、(44)、(45)代入式(43)可得：

由式(46)可知，收敛程度统计量ψ(t)对回声路径非常敏感，其估计值对激励信号的能量不敏感。因此，ψ(t)在检测滤波器收敛程度和反馈回声路径突变的情况时具有实用性和有效性。

上述实施例中，所述步骤S3中，改进APA算法具体为：

W(t+1)＝W(t)+μ(t)X_NM(t)(X^T _NM(t)X_NM(t))^-1e(t)；

其中变步长因子为：

为近端信号能量统计量，ψ(t)为滤波器收敛程度统计量。

上述实施例中，

W(t+1)＝W(t)+μ(t)X_NM(t)(X^T _NM(t)X_NM(t))^-1e(t)；(47)

其中变步长因子为：

基于经典的APA算法框架和上述推导得到的统计量和ψ(t)，结合变步长调整准则，得出改进APA算法，可以同时克服模型噪声与双端对讲两种干扰。

式(48)中等号右边第一项采用其中的指数窗方法对各种数学期望进行在线估计，以在线估计误差信号e(t)的能量为例如下：

式中：为t时刻的估计值，λ＝1-1/KN称为组合系数，K>1为工作之前设定的常数，N即为滤波器长度。

当单端讲话时，的值非常小，则此时改进APA算法变步长因子只有第一项发挥作用。在算法迭代初期，误差信号能量σ_e(n)的值比较大，麦克风信号能量和滤波器输出信号能量的值比较小，改进APA算法以较大的步长因子收敛，收敛速度快但同时伴随着较大的稳态失调。在算法迭代趋于稳定后，误差信号能量σ_e(n)的值变小,和的值逐渐增大，算法以较小的步长收敛以降低稳态失调。随着迭代收敛程度的不断增加，由式(46)可知ψ(t)的数值不断减小，从而导致的值减小，这有利于算法收敛精度进一步提高。由式(37)和式(44)可知麦克风信号能量和滤波器输出信号能量的差值始终小于误差信号能量，因此对于式(48)始终有0＜μ(t)＜1，满足仿射投影算法中步长参数介于0～1之间的要求，由此可以保证式(48)得到的改进APA算法的收敛性。

当发生双端对讲时，快速增加到一个较大的值，这会导致最终使步长μ(t)≈0。此时参数可调滤波器系数的更新过程接近停止，从而防止了滤波器系数发散。以上分析表明，在模型噪声和双端对讲干扰环境下，改进APA算法能够自动调整步长因子，保持算法收敛。改进APA算法在复合噪声下具有更好的适应性。

为了检验改进APA算法的性能，与经典自适应算法和APA算法进行仿真对比。采用实验典型值作为标准参数。选择回声路径阶数为L＝1024、采样频率为8kHz的有限冲击响应信号，采用长度N＝512的参数可调横向滤波器。远端信号x(t)采用零均值高斯白噪声信号，背景噪声w(t)采用与x(t)、v(t)都统计独立的零均值高斯白噪声信号。真实回声信号y(t)与背景噪声w(t)的信噪比为30dB。正则化参数ε＝0.001，指数加权因子λ＝0.01。衡量算法性能的指标为算法失调，用于度量自适应滤波器与目标系统的逼近程度，定义为：

改进APA算法分别与VSS-NLMS算法、NPVSS-NLMS算法和APA算法在收敛速度、跟踪能力和应对双端对讲干扰方面进行了仿真比较，并最后采用真实语音信号进行了应用性验证。以下为具体仿真结果和分析。

如图2所示，改进APA算法的收敛速度明显优于NLMS类型算法，NPVSS-NLMS算法的收敛速度虽然有了大幅提升，但其稳态失调要比APA算法大一点，本技术方案所提出的改进APA算法在APA算法的框架上进一步提升了它的收敛速度，也降低了稳态失调。

对于声学回声消除算法而言，回声路径总是不停地变化，因此算法的跟踪能力十分重要。我们通过在采样3000处将通道的增益增加来模拟通道改变。由图3仿真实验可知，NPVSS-NLMS算法的跟踪能力优于NLMS的，但是略次于APA算法，本技术方案提出的改进APA算法跟踪能力最强，但是跟踪后的算法稳态失调略有增加。

图4显示了四种自适应算法在发生双端对讲的情况下算法性能差异。在采样1800处开始双端对讲，在采样4500处结束双端对讲。在发生双端对讲的情况下，四种自适应算法的性能差异非常明显，经典的VSS-NLMS和APA算法处于一种发散的状态，完全不能发挥其功能；NPVSS-NLMS算法可以较为有效的保持收敛性，具有较强的抗双端对讲干扰的能力，但稳态失调有点严重，还无法满足现实需要；本技术方案所提的改进VSS-APA算法在发生双端对讲情况下可以继续保持算法收敛性，抗双端对讲干扰能力最强，其稳态失调量也要比NPVSS-NLMS算法小，基本可以满足现实应用需要。

该实验选取VSS-APA2算法进行性能比较，VSS-APA2算法的参数设置为：L＝2，λ₁＝0.1，λ₂＝0.01。实验环境设置方面与实验3一致，即在采样1800～4500阶段引入双端对讲干扰。实验结果如图5所示，本文所提的改进APA算法在收敛速度方面明显高于VSS-APA2算法，且在发生双端对讲时，VSS-APA2算法虽然可以保持收敛性，但其稳态失调大幅增加，无法满足双端对讲情况下的应用需求。

如图5所示，一种回声消除系统，用于即时翻译过程中远距离声学回声消除，包括：

处理模块1，用于获取即时翻译系统的输入信号，对输入信号进行处理，获取处理参数；

量化统计模块2，用于根据处理参数对APA算法噪声进行量化，得量化模型；根据量化模型推导出统计量；

构建模块3，用于将统计量代入变步长因子中，自动调整步长因子，构建改进APA算法，利用改进APA算法进行滤除干扰噪声。

上述实施例中，所述量化统计模块2获取即时翻译系统输入信号的回声路径有限冲激响应和滤波器的有限冲击响应；

利用麦克风信号和滤波器输出信号对模型噪声进行量化。

上述实施例中，所述量化统计模块2选用高斯白噪声信号为输入信号时，采用指数窗方法对处理参数和量化模型进行处理，获取近端信号能量统计量和滤波器收敛程度统计量ψ(t)。

上述实施例中，所述改进APA算法具体为：

W(t+1)＝W(t)+μ(t)X_NM(t)(X^T _NM(t)X_NM(t))^-1e(t)；

其中变步长因子为：

为近端信号能量统计量，ψ(t)为滤波器收敛程度统计量。

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种回声消除方法，用于即时翻译过程中远距离声学回声消除，其特征在于，包括以下步骤：

2.根据权利要求1所述一种回声消除方法，其特征在于，所述步骤S1中获取即时翻译输入信号具体包括：获得t时刻输入信号向量为：

X_N(t)＝[x(t)，x(t-1)，...，x(t-N+1)]^T；

其中N表示数组长度，上标T表示矩阵转置。

3.根据权利要求2所述一种回声消除方法，其特征在于，所述步骤S1中，获取处理参数的具体步骤包括：对信号向量X_N(t)进行处理，获取t时刻前M个噪声信号向量V(t)、滤波器输出信号向量Y(t)和期望信号向量D(t)，以及t时刻先验误差e(t)、后验误差ε(t)。

4.根据权利要求1至3任一项所述一种回声消除方法，其特征在于，所述步骤S2中根据处理参数对APA算法噪声进行量化的具体步骤包括以下：

5.根据权利要求4所述一种回声消除方法，其特征在于，所述步骤S2中，根据量化模型推导出统计量具体包括以下步骤：

6.根据权利要求5所述一种回声消除方法，其特征在于，所述步骤S3中，改进APA算法具体为：

W(t+1)＝W(t)+μ(t)X_NM(t)(X^T _NM(t)X_NM(t))^-1e(t)；

其中变步长因子为：

为近端信号能量统计量，ψ(t)为滤波器收敛程度统计量,e(t)为误差信号，为误差信号e(t)的能量。

7.一种回声消除系统，用于即时翻译过程中远距离声学回声消除，其特征在于，包括：

处理模块(1)，用于获取即时翻译系统的输入信号，对输入信号进行处理，获取处理参数；

量化统计模块(2)，用于根据处理参数对APA算法噪声进行量化，得量化模型；根据量化模型推导出统计量；

构建模块(3)，用于将统计量代入变步长因子中，自动调整步长因子，构建改进APA算法，利用改进APA算法进行滤除干扰噪声。

8.根据权利要求7所述一种回声消除系统，其特征在于，

所述量化统计模块(2)获取即时翻译系统输入信号的回声路径有限冲激响应和滤波器的有限冲击响应；

利用麦克风信号和滤波器输出信号对模型噪声进行量化。

9.根据权利要求8所述一种回声消除系统，其特征在于，所述量化统计模块(2)选用高斯白噪声信号为输入信号时，采用指数窗方法对处理参数和量化模型进行处理，获取近端信号能量统计量和滤波器收敛程度统计量ψ(t)。

10.根据权利要求9所述一种回声消除系统，其特征在于，所述改进APA算法具体为：

W(t+1)＝W(t)+μ(t)X_NM(t)(X^T _NM(t)X_NM(t))^-1e(t)；

其中变步长因子为：

为近端信号能量统计量，ψ(t)为滤波器收敛程度统计量。