CN107452393B - 一种回声消除系统及方法 - Google Patents

一种回声消除系统及方法 Download PDF

Info

Publication number
CN107452393B
CN107452393B CN201710624542.XA CN201710624542A CN107452393B CN 107452393 B CN107452393 B CN 107452393B CN 201710624542 A CN201710624542 A CN 201710624542A CN 107452393 B CN107452393 B CN 107452393B
Authority
CN
China
Prior art keywords
signal
processing
statistic
algorithm
noise
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710624542.XA
Other languages
English (en)
Other versions
CN107452393A (zh
Inventor
周萍
吴雷
杨海燕
苏欣欣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guilin University of Electronic Technology
Original Assignee
Guilin University of Electronic Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guilin University of Electronic Technology filed Critical Guilin University of Electronic Technology
Priority to CN201710624542.XA priority Critical patent/CN107452393B/zh
Publication of CN107452393A publication Critical patent/CN107452393A/zh
Application granted granted Critical
Publication of CN107452393B publication Critical patent/CN107452393B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0264Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Filters That Use Time-Delay Elements (AREA)

Abstract

本发明涉及一种回声消除系统及方法,用于即时翻译过程中远距离声学回声消除,其方法包括以下步骤:获取即时翻译系统的输入信号,对输入信号进行处理,获取处理参数;根据处理参数对APA算法噪声进行量化,得量化模型;根据量化模型推导出统计量;将统计量代入变步长因子中,自动调整步长因子,构建改进APA算法,利用改进APA算法进行滤除干扰噪声。相对现有技术,本发明不但可以有效克服双端对讲干扰,消除噪声,而且在收敛速度、稳态失调等方面也有明显改善。

Description

一种回声消除系统及方法
技术领域
本发明涉及信号处理技术领域,特别涉及一种回声消除系统及方法。
背景技术
随着中国经济的快速发展,人们的生活水平逐步提高,出境旅游人数大幅增加,但是绝大部分人都无法独自进行外语交流,一款便携式的即时翻译系统可以很好的解决这一问题。目前便携式即时翻译系统的研究应用中还存在许多问题,比如算法的收敛速度还无法满足实时性要求,现有的回声消除算法在双端对讲情况下经常存在发散的问题,使用户体验不佳。因此,创建能够克服双端对讲干扰且具有快速收敛性的回声消除算法是所追求的目标。
传统的最小均方(LMS)算法和归一化最小均方(NLMS)算法因其结构简单、算法复杂度低,被广泛应用于回声消除中,但在远距离声学回声消除过程中,回声路径的冲激响应时间很长,且语音信号存在非平稳、强相关的特性,使得LMS算法和NLMS算法收敛速度减慢,稳态失调增加,无法满足实时处理的需求。
为克服输入信号相关性的影响,Ozeki与Umeda提出仿射投影算法(AffineProjection Algorithm,APA)。APA是NLMS算法的多维推广,在输入数据具有强相关性的情况下提高算法的收敛速度。同LMS算法一样,APA需要选择合适的步长来取得收敛速度与稳态误差之间的折衷,当步长较大时,收敛速度将加快,但同时稳态误差也会增大;当步长较小时,稳态误差减小,而收敛速度会变慢。因此,可采用变步长解决以上问题,在算法未收敛时采用较大的步长,当算法收敛时采用较小的步长。APA算法通过为自适应系统引入记忆性,重复使用输入信号以提高算法收敛速度,在处理非平稳、强相关的语音信号时仍能保持其优异的算法性能。
APA算法通过重复利用输入数据提高收敛速度。定义输入数据的重用次数为阶数,构造M阶APA如下:
设N为FIR滤波器长度;H=[h0,h1,...,hN-1]T为回声路径序列;分别记t时刻噪声信号、输入信号为v(t)、x(t),可得t时刻输入信号向量为XN(t),XN(t)=[x(t),x(t-1),...,x(t-N+1)]T,其中下标N表示数组长度,上标T表示矩阵转置。
期望信号d(t)满足:
Figure BDA0001362490870000021
将t时刻前M个输入向量记为矩阵形式:
XNM(t)=[XN(t),XN(t-1),...,XN(t-M+1)]; (11)
分别记V(t)、Y(t)、D(t)为t时刻前M个噪声、滤波器输出与期望信号构成的向量,得:
V(t)=[v(t),v(t-1),...,v(t-M+1)]T; (12)
Y(t)=XT NM(t)W(t)=[y0(t),y1(t),...,yM-1(t)]T; (13)
D(t)=[d(t),d(t-1),...,d(t-M+1)]T; (14)
分别定义t时刻先验误差、后验误差为:
e(t)=D(t)-XT NM(t)W(t)=D(t)-Y(t)
=[e0(t),e1(t),...,eM-1(t)]T; (15)
ε(t)=D(t)-XT NM(t)W(t+1); (16)
APA以求解约束最优化问题为算法目标。
目标函数:
Figure BDA0001362490870000022
约束条件:ε(t)=0M1; (18)
式(18)中0M1表示M×1零向量。物理意义为:在强制后验误差ε(t)为零的条件下,更新后的向量W(t+1)应尽可能与当前向量W(t)保持接近。应用拉普拉斯乘子法可得式(17)、(18)解为:
W(t+1)=W(t)+XNM(t)(XT NM(t)XNM(t))-1e(t); (19)
由于各种环境噪声及测量噪声的存在,强迫后验误差为零,使算法对不相关的干扰信号进行补偿,最终导致稳态失调增加。因此需引入收敛步长μ(0<μ<2)以取得稳态失调与收敛速度的折衷。标准APA算法如下:
W(t+1)=W(t)+μXNM(t)(XT NM(t)XNM(t))-1e(t) (20)
APA算法在远距离回声消除过程中,回声路径的冲激响应时间很长,但是普通参数可调横向滤波器阶数比真实的回声路径阶数短,因此在实际应用中模型噪声普遍存在,将模型噪声进行量化并处理是必要的。
在处理非平稳、强相关的语音信号时,APA算法能保持较高的收敛速度以及较低的稳态失调量,但未考虑到双端对讲与回声路径突变的区别,所以无法有效克服双端对讲带来的干扰。
发明内容
本发明的目的是提供一种回声消除系统及方法,所要解决的技术问题是:APA算法在远距离回声消除过程中,回声路径的冲激响应时间很长,但是普通参数可调横向滤波器阶数比真实的回声路径阶数短;无法有效克服双端对讲带来的干扰。
本发明解决上述技术问题的技术方案如下:一种回声消除方法,用于即时翻译过程中远距离声学回声消除,包括以下步骤:
步骤S1.获取即时翻译系统的输入信号,对输入信号进行处理,获取处理参数;
步骤S2.根据处理参数对APA算法噪声进行量化,得量化模型;根据量化模型推导出统计量;
步骤S3.将统计量代入变步长因子中,自动调整步长因子,构建改进APA算法,利用改进APA算法进行滤除干扰噪声。
本发明的有益效果是:处理模块、量化统计模块和构建模块协调运作,构建改进APA算法,改进APA算法不但可以有效克服双端对讲干扰,消除噪声,而且在收敛速度、稳态失调等方面也有明显改善。
在上述技术方案的基础上,本发明还可以做如下改进。
进一步,所述步骤S1中获取即时翻译输入信号具体包括:获得t时刻输入信号向量为:
XN(t)=[x(t),x(t-1),...,x(t-N+1)]T
其中N表示数组长度,上标T表示矩阵转置。
进一步,所述步骤S1中,获取处理参数的具体步骤包括:对信号向量XN(t)进行处理,获取t时刻前M个噪声信号向量V(t)、滤波器输出信号向量Y(t)和期望信号向量D(t),以及t时刻先验误差e(t)、后验误差ε(t)。
进一步,所述步骤S2中根据处理参数对APA算法噪声进行量化的具体步骤包括以下:
步骤S21.获取即时翻译系统输入信号的回声路径有限冲激响应和滤波器的有限冲击响应;
步骤S22.对回声路径有限冲激响应和滤波器的有限冲击响应进行处理,得出回声信号;对处理参数和回声信号进行处理,得麦克风信号和滤波器输出信号;
步骤S23.利用麦克风信号和滤波器输出信号对模型噪声进行量化。
进一步,所述步骤S2中,根据量化模型推导出统计量具体包括以下步骤:
选用高斯白噪声信号为输入信号时,采用指数窗方法对处理参数和量化模型进行处理,获取近端信号能量统计量
Figure BDA0001362490870000041
和滤波器收敛程度统计量ψ(t)。
进一步,所述步骤S3中,改进APA算法具体为:
W(t+1)=W(t)+μ(t)XNM(t)(XT NM(t)XNM(t))-1e(t);
其中变步长因子为:
Figure BDA0001362490870000051
Figure BDA0001362490870000052
为近端信号能量统计量,ψ(t)为滤波器收敛程度统计量。
本发明解决上述技术问题的另一技术方案如下:一种回声消除系统,用于即时翻译过程中远距离声学回声消除,包括:
处理模块,用于获取即时翻译系统的输入信号,对输入信号进行处理,获取处理参数;
量化统计模块,用于根据处理参数对APA算法噪声进行量化,得量化模型;根据量化模型推导出统计量;
构建模块,用于将统计量代入变步长因子中,自动调整步长因子,构建改进APA算法,利用改进APA算法进行滤除干扰噪声。
本发明的有益效果是:处理模块、量化统计模块和构建模块协调运作,构建改进APA算法,改进APA算法不但可以有效克服双端对讲干扰,消除噪声,而且在收敛速度、稳态失调等方面也有明显改善。
在上述技术方案的基础上,本发明还可以做如下改进。
进一步,所述量化统计模块获取即时翻译系统输入信号的回声路径有限冲激响应和滤波器的有限冲击响应;
对回声路径有限冲激响应和滤波器的有限冲击响应进行处理,得出回声信号;对处理参数和回声信号进行处理,得麦克风信号和滤波器输出信号;
利用麦克风信号和滤波器输出信号对模型噪声进行量化。
进一步,所述量化统计模块选用高斯白噪声信号为输入信号时,采用指数窗方法对处理参数和量化模型进行处理,获取近端信号能量统计量
Figure BDA0001362490870000053
和滤波器收敛程度统计量ψ(t)。
进一步,所述改进APA算法具体为:
W(t+1)=W(t)+μ(t)XNM(t)(XT NM(t)XNM(t))-1e(t);
其中变步长因子为:
Figure BDA0001362490870000061
Figure BDA0001362490870000062
为近端信号能量统计量,ψ(t)为滤波器收敛程度统计量。
采用上述进一步方案的有益效果是:改进APA算法不但可以有效克服双端对讲干扰,消除噪声,而且在收敛速度、稳态失调等方面也有明显改善。
附图说明
图1为本发明一种回声消除方法的流程图;
图2为本发明仿真结果比较示意图;
图3为本发明跟踪性能比较示意图;
图4为本发明双端对讲时性能比较示意图;
图5为本发明一种回声消除系统的流程图。
附图中,各标号所代表的部件列表如下:
1、处理模块,2、量化统计模块,3、构建模块。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
如图1所示,一种回声消除方法,用于即时翻译过程中远距离声学回声消除,包括以下步骤:
步骤S1.获取即时翻译系统的输入信号,对输入信号进行处理,获取处理参数;
步骤S2.根据处理参数对APA算法噪声进行量化,得量化模型;根据量化模型推导出统计量;
步骤S3.将统计量代入变步长因子中,自动调整步长因子,构建改进APA算法,利用改进APA算法进行滤除干扰噪声。
可选的,作为本发明的一个实施例:所述步骤S1中获取即时翻译输入信号具体包括:获得t时刻输入信号向量为:
XN(t)=[x(t),x(t-1),...,x(t-N+1)]T
其中N表示数组长度,上标T表示矩阵转置。
可选的,作为本发明的一个实施例:所述步骤S1中,获取处理参数的具体步骤包括:对信号向量XN(t)进行处理,获取t时刻前M个噪声信号向量V(t)、滤波器输出信号向量Y(t)和期望信号向量D(t),以及t时刻先验误差e(t)、后验误差ε(t)。
可选的,作为本发明的一个实施例:所述步骤S2中根据处理参数对APA算法噪声进行量化的具体步骤包括以下:
步骤S21.获取即时翻译系统输入信号的回声路径有限冲激响应和滤波器的有限冲击响应;
步骤S22.对回声路径有限冲激响应和滤波器的有限冲击响应进行处理,得出回声信号;对处理参数和回声信号进行处理,得麦克风信号和滤波器输出信号;
步骤S23.利用麦克风信号和滤波器输出信号对模型噪声进行量化。
上述实施例中,获取即时翻译系统的回声路径有限冲激响应:
h=[h0,h1,...,hN-1,hN,hN+1,...,hL-1]T; (21)
即时翻译系统中滤波器的有限冲击响应为:
Figure BDA0001362490870000071
其中,L是回声路径的阶数,N为参数可调横向滤波器的阶数,且N<L。
由式(21)(22)可知回声路径中的一部分冲激响应无法被横向滤波器逼近,将这部分表示为:
hL-N=[hN,hN+1,...,hL-1]T; (23)
进而可以将回声路径的有限冲击响应h表示为:
Figure BDA0001362490870000081
其中,hN=[h0,h1,...,hN-1]T,为可被滤波器逼近的那部分。
由于回声路径与滤波器的阶数不同,导致两者所需的输入信号向量的长度也有所不同,分别表示为:
Figure BDA0001362490870000082
XN(t)=[x(t),x(t-1),...,x(t-N+1)]T; (26)
其中X(t)表示回声路径的输入,长度为L;XN(t)表示滤波器的输入,长度为N。
因此,XL-N(t)=[x(t-N),x(t-N-1),...,x(t-L+1)]T为回声路径比滤波器多出来的输入信号。
由式(24)(25)推导出回声信号y(t)为:
Figure BDA0001362490870000083
便携式即时翻译系统中麦克风信号表示为d(t),由回声信号y(t)、近端语音信号v(t)和背景噪声信号w(t)复合而成:
d(t)=y(t)+v(t)+w(t); (28)
由式(27)(28)推导得麦克风信号d(t)为:
Figure BDA0001362490870000084
由式(22)(26)可得滤波器
Figure BDA0001362490870000085
的输出:
Figure BDA0001362490870000086
定义误差信号e(t)为:
Figure BDA0001362490870000087
将式(29)(30)代入(31),得:
Figure BDA0001362490870000091
定义系数偏差向量
Figure BDA0001362490870000092
为:
Figure BDA0001362490870000093
表示滤波器系数与其所逼近的回声路径之间的差别。
将式(33)带入式(32)得:
Figure BDA0001362490870000094
Figure BDA0001362490870000095
定义为模型噪声;上述处理实现了对模型噪声的量化。
可选的,作为本发明的一个实施例:所述步骤S2中,根据量化模型推导出统计量具体包括以下步骤:
选用高斯白噪声信号为输入信号时,采用指数窗方法对处理参数和量化模型进行处理,获取近端信号能量统计量
Figure BDA00013624908700000910
和滤波器收敛程度统计量ψ(t)。
上述实施例中,
输入信号是高斯白噪声信号,则有:
Figure BDA0001362490870000096
其中
Figure BDA0001362490870000097
为序列x(t)的能量。
由式(35)可得自相关矩阵Rxx的表达式简化为:
Figure BDA0001362490870000098
其中I表示单位矩阵。
一般而言,远端信号x(t)与近端语音信号v(t)和背景噪声信号w(t)都不相关,yL-N(t)与v(t)和w(t)也不相关,由式(35)得XN(t)与XL-N(t)不相关,由
Figure BDA0001362490870000099
可以得知XN(t)与yL-N(t)不相关,v(t)与w(t)也不相关,可推出式(34)右边几项因式彼此不相关,结合式(36)可得均方误差:
Figure BDA0001362490870000101
其中
Figure BDA0001362490870000102
表示2-范数的平方。
信号XN(t)与e(t)的互相关向量为:
Figure BDA0001362490870000103
将式(38)表示为rex(t),由式(37)的推导过程可知:
Figure BDA0001362490870000104
式(39)取2-范数的平方可得:
Figure BDA0001362490870000105
将式(40)代替式(37)中的
Figure BDA0001362490870000106
可得:
Figure BDA0001362490870000107
由于回声路径冲激响应中hN部分包含的能量比hL-N大很多,所以模型噪声yL-N(t)的能量
Figure BDA0001362490870000108
很小。当近端信号v(t)不存在时,式(41)的值就是背景噪声w(t)和模型噪声yL-N(t)的能量,这个值通常会很小。当近端信号v(t)存在时,由于v(t)的能量比w(t)和yL-N(t)能量大很多,式(41)的值就会变得非常大。我们可以用式(41)来判断双端对讲的情况。所以近端能量统计量
Figure BDA00013624908700001012
为:
Figure BDA0001362490870000109
其中定义的滤波器收敛程度统计量ψ(t)如下:
Figure BDA00013624908700001010
其中red(t)=E[e(t)d(t)]。
由式(37)的推导过程可知:
Figure BDA00013624908700001011
Figure BDA0001362490870000111
将式(38)、(44)、(45)代入式(43)可得:
Figure BDA0001362490870000112
由式(46)可知,收敛程度统计量ψ(t)对回声路径非常敏感,其估计值对激励信号的能量不敏感。因此,ψ(t)在检测滤波器收敛程度和反馈回声路径突变的情况时具有实用性和有效性。
上述实施例中,所述步骤S3中,改进APA算法具体为:
W(t+1)=W(t)+μ(t)XNM(t)(XT NM(t)XNM(t))-1e(t);
其中变步长因子为:
Figure BDA0001362490870000113
Figure BDA0001362490870000114
为近端信号能量统计量,ψ(t)为滤波器收敛程度统计量。
上述实施例中,
W(t+1)=W(t)+μ(t)XNM(t)(XT NM(t)XNM(t))-1e(t); (47)
其中变步长因子为:
Figure BDA0001362490870000115
基于经典的APA算法框架和上述推导得到的统计量
Figure BDA0001362490870000116
和ψ(t),结合变步长调整准则,得出改进APA算法,可以同时克服模型噪声与双端对讲两种干扰。
式(48)中等号右边第一项采用其中的指数窗方法对各种数学期望进行在线估计,以在线估计误差信号e(t)的能量
Figure BDA0001362490870000117
为例如下:
Figure BDA0001362490870000118
式中:
Figure BDA0001362490870000121
为t时刻
Figure BDA0001362490870000122
的估计值,λ=1-1/KN称为组合系数,K>1为工作之前设定的常数,N即为滤波器长度。
当单端讲话时,
Figure BDA0001362490870000123
的值非常小,则
Figure BDA0001362490870000124
此时改进APA算法变步长因子只有第一项发挥作用。在算法迭代初期,误差信号能量σe(n)的值比较大,麦克风信号能量
Figure BDA0001362490870000125
和滤波器输出信号能量
Figure BDA0001362490870000126
的值比较小,改进APA算法以较大的步长因子收敛,收敛速度快但同时伴随着较大的稳态失调。在算法迭代趋于稳定后,误差信号能量σe(n)的值变小,
Figure BDA0001362490870000127
Figure BDA0001362490870000128
的值逐渐增大,算法以较小的步长收敛以降低稳态失调。随着迭代收敛程度的不断增加,由式(46)可知ψ(t)的数值不断减小,从而导致
Figure BDA0001362490870000129
的值减小,这有利于算法收敛精度进一步提高。由式(37)和式(44)可知麦克风信号能量和滤波器输出信号能量的差值始终小于误差信号能量,因此对于式(48)始终有0<μ(t)<1,满足仿射投影算法中步长参数介于0~1之间的要求,由此可以保证式(48)得到的改进APA算法的收敛性。
当发生双端对讲时,
Figure BDA00013624908700001210
快速增加到一个较大的值,这会导致
Figure BDA00013624908700001211
最终使步长μ(t)≈0。此时参数可调滤波器系数的更新过程接近停止,从而防止了滤波器系数发散。以上分析表明,在模型噪声和双端对讲干扰环境下,改进APA算法能够自动调整步长因子,保持算法收敛。改进APA算法在复合噪声下具有更好的适应性。
为了检验改进APA算法的性能,与经典自适应算法和APA算法进行仿真对比。采用实验典型值作为标准参数。选择回声路径阶数为L=1024、采样频率为8kHz的有限冲击响应信号,采用长度N=512的参数可调横向滤波器。远端信号x(t)采用零均值高斯白噪声信号,背景噪声w(t)采用与x(t)、v(t)都统计独立的零均值高斯白噪声信号。真实回声信号y(t)与背景噪声w(t)的信噪比为30dB。正则化参数ε=0.001,指数加权因子λ=0.01。衡量算法性能的指标为算法失调,用于度量自适应滤波器与目标系统的逼近程度,定义为:
Figure BDA0001362490870000131
改进APA算法分别与VSS-NLMS算法、NPVSS-NLMS算法和APA算法在收敛速度、跟踪能力和应对双端对讲干扰方面进行了仿真比较,并最后采用真实语音信号进行了应用性验证。以下为具体仿真结果和分析。
如图2所示,改进APA算法的收敛速度明显优于NLMS类型算法,NPVSS-NLMS算法的收敛速度虽然有了大幅提升,但其稳态失调要比APA算法大一点,本技术方案所提出的改进APA算法在APA算法的框架上进一步提升了它的收敛速度,也降低了稳态失调。
对于声学回声消除算法而言,回声路径总是不停地变化,因此算法的跟踪能力十分重要。我们通过在采样3000处将通道的增益增加来模拟通道改变。由图3仿真实验可知,NPVSS-NLMS算法的跟踪能力优于NLMS的,但是略次于APA算法,本技术方案提出的改进APA算法跟踪能力最强,但是跟踪后的算法稳态失调略有增加。
图4显示了四种自适应算法在发生双端对讲的情况下算法性能差异。在采样1800处开始双端对讲,在采样4500处结束双端对讲。在发生双端对讲的情况下,四种自适应算法的性能差异非常明显,经典的VSS-NLMS和APA算法处于一种发散的状态,完全不能发挥其功能;NPVSS-NLMS算法可以较为有效的保持收敛性,具有较强的抗双端对讲干扰的能力,但稳态失调有点严重,还无法满足现实需要;本技术方案所提的改进VSS-APA算法在发生双端对讲情况下可以继续保持算法收敛性,抗双端对讲干扰能力最强,其稳态失调量也要比NPVSS-NLMS算法小,基本可以满足现实应用需要。
该实验选取VSS-APA2算法进行性能比较,VSS-APA2算法的参数设置为:L=2,λ1=0.1,λ2=0.01。实验环境设置方面与实验3一致,即在采样1800~4500阶段引入双端对讲干扰。实验结果如图5所示,本文所提的改进APA算法在收敛速度方面明显高于VSS-APA2算法,且在发生双端对讲时,VSS-APA2算法虽然可以保持收敛性,但其稳态失调大幅增加,无法满足双端对讲情况下的应用需求。
如图5所示,一种回声消除系统,用于即时翻译过程中远距离声学回声消除,包括:
处理模块1,用于获取即时翻译系统的输入信号,对输入信号进行处理,获取处理参数;
量化统计模块2,用于根据处理参数对APA算法噪声进行量化,得量化模型;根据量化模型推导出统计量;
构建模块3,用于将统计量代入变步长因子中,自动调整步长因子,构建改进APA算法,利用改进APA算法进行滤除干扰噪声。
上述实施例中,所述量化统计模块2获取即时翻译系统输入信号的回声路径有限冲激响应和滤波器的有限冲击响应;
对回声路径有限冲激响应和滤波器的有限冲击响应进行处理,得出回声信号;对处理参数和回声信号进行处理,得麦克风信号和滤波器输出信号;
利用麦克风信号和滤波器输出信号对模型噪声进行量化。
上述实施例中,所述量化统计模块2选用高斯白噪声信号为输入信号时,采用指数窗方法对处理参数和量化模型进行处理,获取近端信号能量统计量
Figure BDA0001362490870000141
和滤波器收敛程度统计量ψ(t)。
上述实施例中,所述改进APA算法具体为:
W(t+1)=W(t)+μ(t)XNM(t)(XT NM(t)XNM(t))-1e(t);
其中变步长因子为:
Figure BDA0001362490870000142
Figure BDA0001362490870000151
为近端信号能量统计量,ψ(t)为滤波器收敛程度统计量。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (4)

1.一种回声消除方法,用于即时翻译过程中远距离声学回声消除,其特征在于,包括以下步骤:
步骤S1.获取即时翻译系统的输入信号,对输入信号进行处理,获取处理参数;
步骤S2.根据处理参数对APA算法噪声进行量化,得量化模型;根据量化模型推导出统计量;
步骤S3.将统计量代入变步长因子中,自动调整步长因子,构建改进APA算法,利用改进APA算法进行滤除干扰噪声;
所述步骤S2中根据处理参数对APA算法噪声进行量化的具体步骤包括以下:
步骤S21.获取即时翻译系统输入信号的回声路径有限冲激响应和滤波器的有限冲击响应;
步骤S22.对回声路径有限冲激响应和滤波器的有限冲击响应进行处理,得出回声信号;对处理参数和回声信号进行处理,得麦克风信号和滤波器输出信号;
步骤S23.利用麦克风信号和滤波器输出信号对模型噪声进行量化;
所述步骤S2中,根据量化模型推导出统计量具体包括以下步骤:
选用高斯白噪声信号为输入信号时,采用指数窗方法对处理参数和量化模型进行处理,获取近端信号能量统计量
Figure FDA0002463100700000011
和滤波器收敛程度统计量ψ(t);
所述步骤S3中,改进APA算法具体为:
W(t+1)=W(t)+μ(t)XNM(t)(XT NM(t)XNM(t))-1e(t);
其中变步长因子为:
Figure FDA0002463100700000021
Figure FDA0002463100700000022
为近端信号能量统计量,ψ(t)为滤波器收敛程度统计量,e(t)为误差信号,
Figure FDA0002463100700000023
为误差信号e(t)的能量。
2.根据权利要求1所述一种回声消除方法,其特征在于,所述步骤S1中获取即时翻译输入信号具体包括:获得t时刻输入信号向量为:
XN(t)=[x(t),x(t-1),...,x(t-N+1)]T
其中N表示数组长度,上标T表示矩阵转置。
3.根据权利要求2所述一种回声消除方法,其特征在于,所述步骤S1中,获取处理参数的具体步骤包括:对信号向量XN(t)进行处理,获取t时刻前M个噪声信号向量V(t)、滤波器输出信号向量Y(t)和期望信号向量D(t),以及t时刻先验误差e(t)、后验误差ε(t)。
4.一种回声消除系统,用于即时翻译过程中远距离声学回声消除,其特征在于,包括:
处理模块(1),用于获取即时翻译系统的输入信号,对输入信号进行处理,获取处理参数;
量化统计模块(2),用于根据处理参数对APA算法噪声进行量化,得量化模型;根据量化模型推导出统计量;
构建模块(3),用于将统计量代入变步长因子中,自动调整步长因子,构建改进APA算法,利用改进APA算法进行滤除干扰噪声;
所述量化统计模块(2)获取即时翻译系统输入信号的回声路径有限冲激响应和滤波器的有限冲击响应;
对回声路径有限冲激响应和滤波器的有限冲击响应进行处理,得出回声信号;对处理参数和回声信号进行处理,得麦克风信号和滤波器输出信号;
利用麦克风信号和滤波器输出信号对模型噪声进行量化;
所述量化统计模块(2)选用高斯白噪声信号为输入信号时,采用指数窗方法对处理参数和量化模型进行处理,获取近端信号能量统计量
Figure FDA0002463100700000031
和滤波器收敛程度统计量ψ(t);
所述改进APA算法具体为:
W(t+1)=W(t)+μ(t)XNM(t)(XT NM(t)XNM(t))-1e(t);
其中变步长因子为:
Figure FDA0002463100700000032
Figure FDA0002463100700000033
为近端信号能量统计量,ψ(t)为滤波器收敛程度统计量。
CN201710624542.XA 2017-07-27 2017-07-27 一种回声消除系统及方法 Active CN107452393B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710624542.XA CN107452393B (zh) 2017-07-27 2017-07-27 一种回声消除系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710624542.XA CN107452393B (zh) 2017-07-27 2017-07-27 一种回声消除系统及方法

Publications (2)

Publication Number Publication Date
CN107452393A CN107452393A (zh) 2017-12-08
CN107452393B true CN107452393B (zh) 2020-09-11

Family

ID=60489750

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710624542.XA Active CN107452393B (zh) 2017-07-27 2017-07-27 一种回声消除系统及方法

Country Status (1)

Country Link
CN (1) CN107452393B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109151237B (zh) * 2018-08-23 2020-10-09 西南交通大学 基于零吸引的仿射投影自适应回声消除方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101432426B1 (ko) * 2013-02-14 2014-08-22 한양대학교 산학협력단 적응필터의 필터계수 결정 방법 및 장치

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2399159A1 (en) * 2002-08-16 2004-02-16 Dspfactory Ltd. Convergence improvement for oversampled subband adaptive filters
CN105391879B (zh) * 2015-12-09 2018-06-12 天津大学 一种无回声残留双端通话鲁棒的声学回声消除方法
CN106448695B (zh) * 2016-09-28 2019-09-03 天津大学 一种双端通话鲁棒的变阶变步长仿射投影方法
CN106788337B (zh) * 2016-10-11 2020-08-28 沈阳工业大学 稳健的仿射投影符号自适应滤波算法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101432426B1 (ko) * 2013-02-14 2014-08-22 한양대학교 산학협력단 적응필터의 필터계수 결정 방법 및 장치

Also Published As

Publication number Publication date
CN107452393A (zh) 2017-12-08

Similar Documents

Publication Publication Date Title
CN109841206B (zh) 一种基于深度学习的回声消除方法
CN107993670B (zh) 基于统计模型的麦克风阵列语音增强方法
CN109040499B (zh) 一种抗冲击干扰的自适应回声消除方法
CN104506746B (zh) 一种改进的凸组合解相关成比例自适应回声消除方法
CN109102794A (zh) 基于凸组合的m估计成比例类仿射投影的回声消除方法
CN108877824B (zh) 一种跟踪性能高的组合步长回声消除方法
CN104144269B (zh) 一种基于解相关的成比例自适应电话回声消除方法
CN105721729A (zh) 基于块稀疏成比例重用权系数仿射投影的回声消除方法
CN101119135B (zh) 一种用于回音消除的步长参数调整方法及设备
CN109040497A (zh) 一种基于m估计的成比例类仿射投影自适应回声消除方法
Albu The constrained stability least mean square algorithm for active noise control
CN105070295A (zh) 一种活性因子成比例子带的自适应方法应用于回声消除
Bai et al. A modified NLMS algorithm for adaptive noise cancellation
CN107452393B (zh) 一种回声消除系统及方法
Haque et al. Robust speech dereverberation based on blind adaptive estimation of acoustic channels
Costa et al. A robust variable step size algorithm for LMS adaptive filters
Shen et al. An improved LMS adaptive filtering algorithm and its analysis
CN109151237A (zh) 基于零吸引的仿射投影自适应回声消除方法
CN109089004A (zh) 一种基于相关熵诱导的集员自适应回声消除方法
Málek et al. Sparse target cancellation filters with application to semi-blind noise extraction
CN113873090B (zh) 一种稳健估计仿射投影样条自适应回声消除方法
CN107527622B (zh) 一种基于最大熵的变步长符号子带回声消除方法
CN114400016A (zh) 基于自适应解相关和变步长成比例m估计的回声消除方法
Hamidia et al. Double-talk detection using the singular value decomposition for acoustic echo cancellation
CN111883155A (zh) 回声消除方法、装置及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20171208

Assignee: Guangxi Langyuantong Technology Co.,Ltd.

Assignor: GUILIN University OF ELECTRONIC TECHNOLOGY

Contract record no.: X2023980044847

Denomination of invention: An echo cancellation system and method

Granted publication date: 20200911

License type: Common License

Record date: 20231031

EE01 Entry into force of recordation of patent licensing contract