CN107871510B - 一种零吸引变核宽度的最大熵回声消除方法 - Google Patents

一种零吸引变核宽度的最大熵回声消除方法 Download PDF

Info

Publication number
CN107871510B
CN107871510B CN201710550955.8A CN201710550955A CN107871510B CN 107871510 B CN107871510 B CN 107871510B CN 201710550955 A CN201710550955 A CN 201710550955A CN 107871510 B CN107871510 B CN 107871510B
Authority
CN
China
Prior art keywords
current time
signal
value
core width
echo
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201710550955.8A
Other languages
English (en)
Other versions
CN107871510A (zh
Inventor
赵海全
刘倩倩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southwest Jiaotong University
Original Assignee
Southwest Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southwest Jiaotong University filed Critical Southwest Jiaotong University
Priority to CN201710550955.8A priority Critical patent/CN107871510B/zh
Publication of CN107871510A publication Critical patent/CN107871510A/zh
Application granted granted Critical
Publication of CN107871510B publication Critical patent/CN107871510B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0264Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
    • H04M9/082Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Filters That Use Time-Delay Elements (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)

Abstract

一种零吸引变核宽度的最大熵回声消除方法,其步骤是:A、获取信号,将远端传来的语音信号采样得到当前时刻n的远端信号离散值x(n);同时,对近端麦克风收集到的回声信号采样得到当前时刻n的期望信号d(n)。B、滤波器的输出,C、回声抵消,将近端信号d(n)与输出信号y(n)相减得到误差信号e(n),D、权系数向量的更新:D1、根据当前时刻n的误差信号e(n),算出当前时刻n去冲激干扰的误差信号D2、计算当前时刻n的核宽度σn;D3、利用前时刻n的核宽度σn更新得到下一个时刻n+1的抽头权向量W(n+1);E、令n=n+1,重复A、B、C、D的步骤,直至通话结束。该方法对电话通信这种系统的辨识能力强且收敛速度快、稳态误差低,回声消除效果明显。

Description

一种零吸引变核宽度的最大熵回声消除方法
技术领域
本发明属于语音通信的自适应回声消除技术领域。
背景技术
在通信系统中,噪声和回声的干扰一直不能被忽略掉。其中,最主要影响语音通话质量的是声学回声。声学回声是指用户在通信过程中能够反复听到自己的声音。回声时延短是察觉不到的,可理解为频谱失真的一种形式。反之,时延超过几十毫秒,回声就可单独觉察到。由于人耳对回声极其敏感,因此对消除声学回声方法的研究仍是一个热门的课题。
在自适应回声消除方法中,被广泛用到的方法主要有传统最小均方(LMS)算法和仿射投影(APA)算法等。但是在回声信道中,大多数都是稀疏信道,这种稀疏系统的脉冲值只有极少数不为零其余均为零或接近零。而在这种系统中LMS和APA算法的稳态误差就会变大、收敛速度变慢。同时,当系统存在冲激噪声时,上述算法会非常不稳定
目前,在较成熟的收敛性较好且抗冲击干扰的回声消除方法有如下所示:文献1“Adaptive Filtering under a Variable Kernel Width Maximum CorrentropyCriterion”(Fuyi Huang,Jiashu Zhang,and Sheng Zhang,CTransactions on Circuitsand Systems II:Express Briefs(2017))该方法利用了最大熵准则能够很好抗冲激干扰。但由于该算法没有考虑系统的稀疏性,因此在解决稀疏系统问题时性能会下降。
发明内容
本发明的目的就是提出一种零吸引变核宽度的最大熵回声消除方法,采用该方法进行回声消除,能获得更快的收敛速度和更低的稳态误差。
本发明实现其发明目的所采用的技术方案是,一种零吸引变核宽度的最大熵回声消除方法,其步骤如下:
A、获取信号
将远端传来的语音信号采样得到当前时刻n的远端信号离散值x(n);同时,对近端麦克风收集到的回声信号采样得到当前时刻n的期望信号d(n)。
B、计算自适应滤波器的输出y(n)
将远端信号离散值x(n)在当前时刻n到时刻n-L+1的值构成当前时刻n的自适应滤波器输入向量x(n),x(n)=[x(n),x(n-1)...,x(n-L+1)]T,其中,L表示自适应滤波器抽头数,L=512或1024,上标T代表转置;
计算当前时刻n的自适应滤波器的输出信号y(n),y(n)=WT(n)x(n),其中,W(n)为当前时刻n的自适应滤波器的抽头权向量,其长度等于L,初始值为零向量即W(1)=0;
C、回声抵消
将当前时刻n的期望信号d(n)减去当前时刻n的自适应滤波器的输出信号y(n),得到当前时刻n的误差信号e(n)作为当前时刻n消除回声后的近端信号再传送给远端,即e(n)=d(n)-y(n);
D、权系数向量的更新
D1、根据当前时刻n的误差信号e(n),算出当前时刻n去冲激干扰的误差信号
其中τ1表示误差信号估计量的平滑参数,取值为0.2;min(·)表示取最小值运算;的初始值为零,即Nw为误差信号平方平滑估计的平滑窗口的大小,取值为10~20;
D2、计算当前时刻n的核宽度σn
如果则当前时刻n的核宽度σn等于默认核宽度σ0,即σn=σ0,其中kσ为限定常数,取值为20,默认核宽度σ0的取值为5~20;
如果则当前时刻n的核宽度σn,由下式得出,
D3、更新得到下一个时刻n+1的抽头权向量W(n+1),
其中,μ为步长参数,取值为0.1;exp[·]表示指数运算;sgn[·]表示取符号运算;ρ为零吸引因子,取值为0.000001;ε为正参数,取值为1~20;
E、令n=n+1,重复A、B、C、D的步骤,直至通话结束。
与现有技术相比,本发明的有益效果是:
本发明的熵核宽度σn的值是根据噪声环境的状态而变化的,当存在冲击噪声时,σn=σ0。当不存在冲击噪声时,换句话说,当不存在冲激噪声时,更新公式中项为一个常数,算法类似于NLMS。因此算法可以得到很快的收敛速度;当存在冲击噪声时,项接近于零,算法不更新。因此算法具有很好的抗冲击噪声的能力。当系统为稀疏系统时,本发明中零吸引项可以很好的区分系统中非零元素,即,当元素为零时,零吸引项很大,加快收敛速度。当元素为零时,零吸引项为零。所以当语音信道为稀疏时,本发明的收敛速度很快。
总之,本发明的方法,只要算法偏离稳态,就能得到大步长,从而很快收敛;同时只要算法达到稳态,就能得到小步长,实现很小的稳态误差,从而能在在应用条件发生变化或应用条件不稳定的情况下,保证系统具有良好的回声消除性能。
下面结合附图和具体实施方式对本发明进行详细说明
附图说明
图1是本发明仿真实验的信道图。
图2是文献1(VKW-MCC)方法和本发明在真实语音信号为输入信号时,仿真实验的归一化稳态失调曲线。
具体实施方式
实施例
本发明的一种具体实施方式是,一种零吸引变核宽度的最大熵回声消除方法,其步骤如下:
A、获取信号
将远端传来的语音信号采样得到当前时刻n的远端信号离散值x(n);同时,对近端麦克风收集到的回声信号采样得到当前时刻n的期望信号d(n)。
B、计算自适应滤波器的输出y(n)
将远端信号离散值x(n)在当前时刻n到时刻n-L+1的值构成当前时刻n的自适应滤波器输入向量x(n),x(n)=[x(n),x(n-1)...,x(n-L+1)]T,其中,L表示自适应滤波器抽头数,L=512或1024,上标T代表转置;
计算当前时刻n的自适应滤波器的输出信号y(n),y(n)=WT(n)x(n),其中,W(n)为当前时刻n的自适应滤波器的抽头权向量,其长度等于L,初始值为零向量即W(1)=0;
C、回声抵消
将当前时刻n的期望信号d(n)减去当前时刻n的自适应滤波器的输出信号y(n),得到当前时刻n的误差信号e(n)作为当前时刻n消除回声后的近端信号再传送给远端,即e(n)=d(n)-y(n);
D、权系数向量的更新
D1、根据当前时刻n的误差信号e(n),算出当前时刻n去冲激干扰的误差信号
其中τ1表示误差信号估计量的平滑参数,取值为0.2;min(·)表示取最小值运算;的初始值为零,即Nw为误差信号平方平滑估计的平滑窗口的大小,取值为10~20;
D2、计算当前时刻n的核宽度σn
如果则当前时刻n的核宽度σn等于默认核宽度σ0,即σn=σ0,其中kσ为限定常数,取值为20,默认核宽度σ0的取值为5~20;
如果则当前时刻n的核宽度σn,由下式得出,
D3、更新得到下一个时刻n+1的抽头权向量W(n+1),
其中,μ为步长参数,取值为0.1;exp[·]表示指数运算;sgn[·]表示取符号运算;ρ为零吸引因子,取值为0.000001;ε为正参数,取值为1~20;
E、令n=n+1,重复A、B、C、D的步骤,直至通话结束。
仿真实验
为了验证本发明的有效性,进行了仿真实验,并与现有的文献1的方法进行了对比。
仿真实验的采样频率为8KHz。背景噪声是30dB信噪比的零均值高斯白噪声。回声信道脉冲响应在长6.25m,宽3.75m,高2.5m,温度20℃,湿度50%的安静密闭房间内获得,脉冲响应长度即滤波器的抽头数L=512。
按照以上实验条件,用本发明方法与现有的文献一方法进行回声消除实验。各种方法的实验最优参数取值如表1。
表1各方法的实验最优参数取值
文献一(VKW-MCC) κ=0;ε=0.0001;δ=0.01;N=4
本发明 f<sub>l</sub>(0)=0.001;δ=0.01;N=4;σ<sub>0</sub>=20;k<sub>0</sub>=20
图1是实验用的安静密闭房间构成的通信系统的信道图。
图2是文献一(VKW-MCC)的方法和本发明方法,在真实语音信号为输入信号时,仿真实验得到的归一化稳态失调曲线。
从图2可以看出:本发明在约10000个采样时刻(0.8s)收敛,稳态误差约在-36dB;而文献1则在约10000个采样时刻(0.8s)收敛,稳态误差约在-18dB;本发明的稳态误差比文献1的稳态误差减小了近两倍。

Claims (1)

1.一种零吸引变核宽度的最大熵回声消除方法,其步骤如下:
A、获取信号
将远端传来的语音信号采样得到当前时刻n的远端信号离散值x(n);同时,对近端麦克风收集到的回声信号采样得到当前时刻n的期望信号d(n);
B、计算自适应滤波器的输出y(n)
将远端信号离散值x(n)在当前时刻n到时刻n-L+1的值构成当前时刻n的自适应滤波器输入向量x(n),x(n)=[x(n),x(n-1)...,x(n-L+1)]T,其中,L表示自适应滤波器抽头数,L=512或1024,上标T代表转置;
计算当前时刻n的自适应滤波器的输出信号y(n),y(n)=WT(n)x(n),其中,W(n)为当前时刻n的自适应滤波器的抽头权向量,其长度等于L,初始值为零向量即W(1)=0;
C、回声抵消
将当前时刻n的期望信号d(n)减去当前时刻n的自适应滤波器的输出信号y(n),得到当前时刻n的误差信号e(n)作为当前时刻n消除回声后的近端信号再传送给远端,即e(n)=d(n)-y(n);
D、权系数向量的更新
D1、根据当前时刻n的误差信号e(n),算出当前时刻n去冲激干扰的误差信号
其中τ1表示误差信号估计量的平滑参数,取值为0.2;min(·)表示取最小值运算;的初始值为零,即Nw为误差信号平方平滑估计的平滑窗口的大小,取值为10~20;
D2、计算当前时刻n的核宽度σn
如果则当前时刻n的核宽度σn等于默认核宽度σ0,即σn=σ0,其中kσ为限定常数,取值为20,默认核宽度σ0的取值为5~20;
如果则当前时刻n的核宽度σn,由下式得出,
D3、更新得到下一个时刻n+1的抽头权向量W(n+1),
其中,μ为步长参数,取值为0.1;exp[·]表示指数运算;sgn[·]表示取符号运算;ρ为零吸引因子,取值为0.000001;ε为正参数,取值为1~20;
E、令n=n+1,重复A、B、C、D的步骤,直至通话结束。
CN201710550955.8A 2017-07-07 2017-07-07 一种零吸引变核宽度的最大熵回声消除方法 Expired - Fee Related CN107871510B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710550955.8A CN107871510B (zh) 2017-07-07 2017-07-07 一种零吸引变核宽度的最大熵回声消除方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710550955.8A CN107871510B (zh) 2017-07-07 2017-07-07 一种零吸引变核宽度的最大熵回声消除方法

Publications (2)

Publication Number Publication Date
CN107871510A CN107871510A (zh) 2018-04-03
CN107871510B true CN107871510B (zh) 2019-11-26

Family

ID=61761237

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710550955.8A Expired - Fee Related CN107871510B (zh) 2017-07-07 2017-07-07 一种零吸引变核宽度的最大熵回声消除方法

Country Status (1)

Country Link
CN (1) CN107871510B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109089004B (zh) * 2018-08-14 2020-10-09 西南交通大学 一种基于相关熵诱导的集员自适应回声消除方法
CN109040499B (zh) * 2018-08-14 2020-12-01 西南交通大学 一种抗冲击干扰的自适应回声消除方法
CN110572525B (zh) * 2019-10-30 2021-05-07 西南交通大学 一种用于语音通信的自适应通信回声消除方法
CN113409806B (zh) * 2021-01-28 2023-12-22 合肥工业大学 一种基于反正切函数的零吸引回声消除方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102006027673A1 (de) * 2006-06-14 2007-12-20 Friedrich-Alexander-Universität Erlangen-Nürnberg Signaltrenner, Verfahren zum Bestimmen von Ausgangssignalen basierend auf Mikrophonsignalen und Computerprogramm
KR100930060B1 (ko) * 2008-01-09 2009-12-08 성균관대학교산학협력단 신호 검출 방법, 장치 및 그 방법을 실행하는 프로그램이기록된 기록매체
US20130294611A1 (en) * 2012-05-04 2013-11-07 Sony Computer Entertainment Inc. Source separation by independent component analysis in conjuction with optimization of acoustic echo cancellation
CN106210370B (zh) * 2016-08-25 2019-07-23 西南交通大学 一种仿射投影最大熵子带自适应回声消除方法
CN106558316A (zh) * 2016-11-09 2017-04-05 天津大学 一种基于长时信号特定频带变化率的啸叫检测方法
CN106782593B (zh) * 2017-02-27 2019-10-25 重庆邮电大学 一种用于声学回声消除的多带结构自适应滤波器切换方法

Also Published As

Publication number Publication date
CN107871510A (zh) 2018-04-03

Similar Documents

Publication Publication Date Title
CN107871510B (zh) 一种零吸引变核宽度的最大熵回声消除方法
CN109040499B (zh) 一种抗冲击干扰的自适应回声消除方法
CN110572525B (zh) 一种用于语音通信的自适应通信回声消除方法
CN104506746B (zh) 一种改进的凸组合解相关成比例自适应回声消除方法
CN104683614A (zh) 基于m估计的记忆成比例仿射投影自适应回声消除方法
Hamidia et al. Improved variable step-size NLMS adaptive filtering algorithm for acoustic echo cancellation
CN104270539A (zh) 基于系数差的成比例仿射投影回声消除方法
CN109040497A (zh) 一种基于m估计的成比例类仿射投影自适应回声消除方法
CN105721729B (zh) 基于块稀疏成比例重用权系数仿射投影的回声消除方法
CN108877824B (zh) 一种跟踪性能高的组合步长回声消除方法
CN107369458B (zh) 一种基于熵吸引的最大熵子带回声消除方法
CN104144269B (zh) 一种基于解相关的成比例自适应电话回声消除方法
CN109151237A (zh) 基于零吸引的仿射投影自适应回声消除方法
CN109697986B (zh) 一种基于最小三次方绝对值的自适应偏差补偿回声消除方法
CN109089004B (zh) 一种基于相关熵诱导的集员自适应回声消除方法
CN105788605B (zh) 一种基于正交变换的仿射投影符号回声消除方法
CN106170049B (zh) 一种有偏补偿的归一化子带自适应回声消除方法
CN107527622B (zh) 一种基于最大熵的变步长符号子带回声消除方法
CN111243568B (zh) 一种凸约束自适应回声消除方法
CN106157965B (zh) 一种基于权向量重用的零范数集员仿射投影自适应回声消除方法
CN106128471B (zh) 一种收缩变步长子带回声消除方法
Shen et al. An improved LMS adaptive filtering algorithm and its analysis
CN106161823B (zh) 基于连续混合p范数的子带结构回声消除方法
CN107578782B (zh) 一种变核宽度的最大熵子带回声消除方法
CN113873090B (zh) 一种稳健估计仿射投影样条自适应回声消除方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20191126

CF01 Termination of patent right due to non-payment of annual fee