CN107369458B - 一种基于熵吸引的最大熵子带回声消除方法 - Google Patents

一种基于熵吸引的最大熵子带回声消除方法 Download PDF

Info

Publication number
CN107369458B
CN107369458B CN201710551228.3A CN201710551228A CN107369458B CN 107369458 B CN107369458 B CN 107369458B CN 201710551228 A CN201710551228 A CN 201710551228A CN 107369458 B CN107369458 B CN 107369458B
Authority
CN
China
Prior art keywords
subband
signal
moment
vector
entropy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710551228.3A
Other languages
English (en)
Other versions
CN107369458A (zh
Inventor
赵海全
刘倩倩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southwest Jiaotong University
Original Assignee
Southwest Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southwest Jiaotong University filed Critical Southwest Jiaotong University
Priority to CN201710551228.3A priority Critical patent/CN107369458B/zh
Publication of CN107369458A publication Critical patent/CN107369458A/zh
Application granted granted Critical
Publication of CN107369458B publication Critical patent/CN107369458B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0264Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
    • H04M9/082Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)

Abstract

一种基于熵吸引的最大熵子带回声消除方法,其步骤是:A、信号的采样与处理,远端信号构成当前时刻n分析滤波器一的输入向量U(n),输入向量U(n)经分析滤波器一分割成I个远端子带向量Ui(n),将远端信号滤波输入向量U(n)经分析滤波器分割成子带信号Ui(n);B、信号的抽取,将Ui(n)经抽取器进行N抽取,得到抽取后的输入信号Ui(k);C、滤波器的输出,D、回声抵消,将近端子带抽取信号di(k)与输出子带信号yi(k)相减得到误差信号ei(k),E、权系数向量的更新:E1、计算抽取时刻k的熵吸引量P(k);E2、更新得到下一个抽取时刻k+1的权系数向量W(k+1);F、令n=n+1,重复A、B、C、D的步骤,直至通话结束。该方法的收敛速度快、稳态误差低,回声消除效果明显。

Description

一种基于熵吸引的最大熵子带回声消除方法
技术领域
本发明属于语音通信的自适应回声消除技术领域。
背景技术
目前,回声消除器就是通过核心部件—自适应滤波器来估计回声,并在近端信号中减去回声的估计值以达到回声消除的效果。自适应回声消除技术因其成本低、效果好,得到一致认可,也是目前国际上公认的最有前景的回声消除技术之一。
从回声消除的基本原理看,利用声学回声消除器来实现回声消除,其中最核心的部分就是自适应滤波器。自适应系统中最常用的最小均方(LMS)算法往往在回声消除应用中不能获得较好的效果。为此,为了解决这一难点归一化子带自适应滤波器方法被提出,该种方法将输入信号经过分析滤波器按频率分割为多个子带信号,由于输入信号的频率与回声的相关度高,对不同的子带信号自适应的进行不同的回声消除,再进行归一化处理,能从整体上降低回声消除的难度,从而可以获得较好的收敛速度。在目前的自适应回声消除应用中,较成熟的子带回声消除方法为归一化子带类的自适应滤波算法,如有文献1“TwoImproved Normalized Subband Adaptive Filter Algorithms with Good RobustnessAgainst Impulsive Interferences”(Yu,Y.,&Zhao,H.,Circuits Syst Signal Process(2016)35:4607–4619)的(MCC‐SAF)方法,该方法是将最大熵思想加入子带(SAF)算法,以减少冲激噪声对算法的影响,该方法因没有考虑到系统的稀疏性,而没有区分系统冲激响应的幅值大小;因此,在系统为稀疏系统时该算法的性能降低。
发明内容
本发明的目的就是提出一种基于熵吸引的最大熵子带回声消除方法,该方法进行回声消除,具有较好的收敛速度和更低的稳态误差。
本发明实现其发明目的所采用的技术方案是,一种收缩变步长子带回声消除方法,其步骤如下:
A、信号的采样与处理
将当前时刻n到时刻n-L+1之间的采样远端信号u(n),u(n-1),...,u(n-L+1),构成当前时刻n分析滤波器一的输入向量U(n),U(n)=[u(n),u(n-1),...,u(n-L+1)]T;L=512是滤波器抽头数,上标T表示转置运算;
分析滤波器一将输入向量U(n)按频带分割成I个远端子带向量Ui(n),Ui(n)=[ui(n),ui(n-1),...,ui(n-L+1)]T
同时,分析滤波器二将近端麦克风拾取到的当前时刻n的带回声的近端信号d(n)按频带分割分割成I个近端子带信号di(n);
其中,i为远端子带向量或近端子带信号的序号,i=1,2,...,I,I为远端子带向量和近端子带信号的总个数,其取值为2、4、6、8;
B、信号抽取
将远端子带向量Ui(n)经抽取器进行I抽取,即将n=k=KI时刻的远端输入子带向量Ui(n)抽出,得到抽取时刻k的远端子带抽取向量Ui(k),Ui(k)=[ui(k),ui(k-1),...,ui(k-L+1)]T;其中,K为抽取的序号;
对近端子带信号di(n)也经抽取器进行I抽取,即将n=k=KI时刻的近端子带信号di(n)抽出,得到抽取时刻k的近端子带抽取信号di(k),di(k)=di(KI);
C、滤波器的输出
将抽取时刻k的远端子带抽取向量Ui(k)通过自适应回声消除滤波器中的子带滤波器得到抽取时刻k的输出子带信号yi(k),其中W(k)为子带滤波器在抽取时刻k的权系数向量,W(k)=[w1(k),w2(k),..wl(k).,wL(k)]T;wl(k)为权系数向量W(k)中的第l个权系数,l=1,2,...,L为权系数wl(k)的序号;W(k)的初始值为零,即W(1)=0;
D、回声抵消
将抽取时刻k的近端子带抽取信号di(k)与抽取时刻k的输出子带信号yi(k)相减得到抽取时刻k的子带误差信号ei(k),即抽取时刻k消除回声后的子带回送信号ei(k),ei(k)=di(k)-yi(k),并将抽取时刻k的子带误差信号ei(k)送回给远端;
E、权系数向量的更新
E1、根据抽取时刻k的权向量W(k),计算抽取时刻k的熵吸引量P(k),
其中表示熵吸引的核宽度,取值为0.2;exp(·)表示以自然常数为底的指数运算;表示向量或矩阵的对应元素相乘;
E2、更新得到下一个抽取时刻k+1的权系数向量W(k+1),
其中μ为步长参数,取值为0.1;γ为零吸引因子,取值为0.000001;
F、重复
令n=n+1,重复A、B、C、D、E的步骤,直至通话结束。
与现有技术相比,本发明的有益效果是:
本发明在最大熵的基础上引入了熵吸引因子当系统为稀疏时,系统中的冲激响应中接近零或为零的项占绝大多数。在自适应更新中权系数的值越接近于零,表明对应于该权系数的最优解为零的概率越大。由熵吸引因子表达式可知,权系数W(k)越接近于0,熵吸引因子越大,可以加快收敛速度。另一方面,当系统存在冲激噪声时,系统的近端子带信号变得很大,导致权系数向量更新公式中的接近于零,系统不更新,说明系统具有良好的抗冲激噪声的能力,可以获得较小的稳态误差。
下面结合附图和具体实施方式对本发明进行详细说明
附图说明
图1是本发明仿真实验的信道图。
图2是文献1的MCC-SAF方法和本发明在真实语音信号为输入信号时,仿真实验的归一化稳态失调曲线。
具体实施方式
实施例
本发明的一种具体实施方式是,一种基于熵吸引的最大熵子带回声消除方法,其步骤如下:
A、信号的采样与处理
将当前时刻n到时刻n-L+1之间的采样远端信号u(n),u(n-1),...,u(n-L+1),构成当前时刻n分析滤波器一的输入向量U(n),U(n)=[u(n),u(n-1),...,u(n-L+1)]T;L=512是滤波器抽头数,上标T表示转置运算;
分析滤波器一将输入向量U(n)按频带分割成I个远端子带向量Ui(n),Ui(n)=[ui(n),ui(n-1),...,ui(n-L+1)]T
同时,分析滤波器二将近端麦克风拾取到的当前时刻n的带回声的近端信号d(n)按频带分割分割成I个近端子带信号di(n);
其中,i为远端子带向量或近端子带信号的序号,i=1,2,...,I,I为远端子带向量和近端子带信号的总个数,其取值为2、4、6、8;
B、信号抽取
将远端子带向量Ui(n)经抽取器进行I抽取,即将n=k=KI时刻的远端输入子带向量Ui(n)抽出,得到抽取时刻k的远端子带抽取向量Ui(k),Ui(k)=[ui(k),ui(k-1),...,ui(k-L+1)]T;其中,K为抽取的序号;
对近端子带信号di(n)也经抽取器进行I抽取,即将n=k=KI时刻的近端子带信号di(n)抽出,得到抽取时刻k的近端子带抽取信号di(k),di(k)=di(KI);
C、滤波器的输出
将抽取时刻k的远端子带抽取向量Ui(k)通过自适应回声消除滤波器中的子带滤波器得到抽取时刻k的输出子带信号yi(k),其中W(k)为子带滤波器在抽取时刻k的权系数向量,W(k)=[w1(k),w2(k),..wl(k).,wL(k)]T;wl(k)为权系数向量W(k)中的第l个权系数,l=1,2,...,L为权系数wl(k)的序号;W(k)的初始值为零,即W(1)=0;
D、回声抵消
将抽取时刻k的近端子带抽取信号di(k)与抽取时刻k的输出子带信号yi(k)相减得到抽取时刻k的子带误差信号ei(k),即抽取时刻k消除回声后的子带回送信号ei(k),ei(k)=di(k)-yi(k),并将抽取时刻k的子带误差信号ei(k)送回给远端;
E、权系数向量的更新
E1、根据抽取时刻k的权向量W(k),计算抽取时刻k的熵吸引量P(k),
其中表示熵吸引的核宽度,取值为0.2;exp(·)表示以自然常数为底的指数运算;表示向量或矩阵的对应元素相乘;
E2、更新得到下一个抽取时刻k+1的权系数向量W(k+1),
其中μ为步长参数,取值为0.1;γ为零吸引因子,取值为0.000001;
F、重复
令n=n+1,重复A、B、C、D、E的步骤,直至通话结束。
仿真实验
为了验证本发明的有效性,进行了仿真实验,并与现有的文献1的方法进行了对比。
仿真实验的采样频率为8KHz。背景噪声是30dB信噪比的零均值高斯白噪声。回声信道脉冲响应在长6.25m,宽3.75m,高2.5m,温度20℃,湿度50%的安静密闭房间内获得,脉冲响应长度即滤波器的抽头数L=64。
按照以上实验条件,用本发明方法与现有的文献一方法进行回声消除实验。各种方法的实验最优参数取值如表1。
表1各方法的实验最优参数取值
文献一(MCC-SAF) κ=0;ε=0.0001;δ=0.01;N=4
本发明 f<sub>l</sub>(0)=0.001;δ=0.01;N=4;γ=0.000001
图1是实验用的安静密闭房间构成的通信系统的信道图。
图2是文献一(MCC-SSAF)的方法和本发明方法,在真实语音信号为输入信号时,仿真实验得到的归一化稳态失调曲线。
从图2可以看出:本发明在约20000个采样时刻(2.5s)收敛,稳态误差约在-35dB;而文献1则在约20000个采样时刻(2.5s)收敛,稳态误差约在-25dB;本发明比文献1稳态误差减小了近两倍。

Claims (1)

1.一种基于熵吸引的最大熵子带回声消除方法,其步骤如下:
A、信号的采样与处理
将当前时刻n到时刻n-L+1之间的采样远端信号u(n),u(n-1),...,u(n-L+1),构成当前时刻n分析滤波器一的输入向量U(n),U(n)=[u(n),u(n-1),...,u(n-L+1)]T;L=512是滤波器抽头数,上标T表示转置运算;
分析滤波器一将输入向量U(n)按频带分割成I个远端子带向量Ui(n),Ui(n)=[ui(n),ui(n-1),...,ui(n-L+1)]T
同时,分析滤波器二将近端麦克风拾取到的当前时刻n的带回声的近端信号d(n)按频带分割分割成I个近端子带信号di(n);
其中,i为远端子带向量或近端子带信号的序号,i=1,2,...,I,I为远端子带向量和近端子带信号的总个数,其取值为2、4、6、8;
B、信号抽取
将远端子带向量Ui(n)经抽取器进行I抽取,即将n=k=KI时刻的远端子带向量Ui(n)抽出,得到抽取时刻k的远端子带抽取向量Ui(k),Ui(k)=[ui(k),ui(k-1),...,ui(k-L+1)]T;其中,K为抽取的序号;
对近端子带信号di(n)也经抽取器进行I抽取,即将n=k=KI时刻的近端子带信号di(n)抽出,得到抽取时刻k的近端子带抽取信号di(k),di(k)=di(KI);
C、滤波器的输出
将抽取时刻k的远端子带抽取向量Ui(k)通过自适应回声消除滤波器中的子带滤波器得到抽取时刻k的输出子带信号yi(k),其中W(k)为子带滤波器在抽取时刻k的权系数向量,W(k)=[w1(k),w2(k),..wl(k).,wL(k)]T;wl(k)为权系数向量W(k)中的第l个权系数,l=1,2,...,L为权系数wl(k)的序号;W(k)的初始值为零,即W(1)=0;
D、回声抵消
将抽取时刻k的近端子带抽取信号di(k)与抽取时刻k的输出子带信号yi(k)相减得到抽取时刻k的子带误差信号ei(k),即抽取时刻k消除回声后的子带回送信号ei(k),ei(k)=di(k)-yi(k),并将抽取时刻k的子带误差信号ei(k)送回给远端;
E、权系数向量的更新
E1、根据抽取时刻k的权向量W(k),计算抽取时刻k的熵吸引量P(k),
其中表示熵吸引的核宽度,取值为0.2;exp(·)表示以自然常数为底的指数运算;表示向量或矩阵的对应元素相乘;
E2、更新得到下一个抽取时刻k+1的权系数向量W(k+1),
其中μ为步长参数,取值为0.1;γ为零吸引因子,取值为0.000001;
F、重复
令n=n+1,重复A、B、C、D、E的步骤,直至通话结束。
CN201710551228.3A 2017-07-07 2017-07-07 一种基于熵吸引的最大熵子带回声消除方法 Active CN107369458B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710551228.3A CN107369458B (zh) 2017-07-07 2017-07-07 一种基于熵吸引的最大熵子带回声消除方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710551228.3A CN107369458B (zh) 2017-07-07 2017-07-07 一种基于熵吸引的最大熵子带回声消除方法

Publications (2)

Publication Number Publication Date
CN107369458A CN107369458A (zh) 2017-11-21
CN107369458B true CN107369458B (zh) 2019-09-24

Family

ID=60305932

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710551228.3A Active CN107369458B (zh) 2017-07-07 2017-07-07 一种基于熵吸引的最大熵子带回声消除方法

Country Status (1)

Country Link
CN (1) CN107369458B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108512528B (zh) * 2018-03-05 2019-08-27 电子科技大学 一种cim函数下的比例控制和归一化lmp滤波方法
CN108877830B (zh) * 2018-05-31 2019-09-24 西南交通大学 基于连续混合最大熵的回声消除方法
CN109089004B (zh) * 2018-08-14 2020-10-09 西南交通大学 一种基于相关熵诱导的集员自适应回声消除方法
CN110191245B (zh) * 2019-07-10 2021-06-22 西南交通大学 一种基于时变参数的自适应回声消除方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102006027673A1 (de) * 2006-06-14 2007-12-20 Friedrich-Alexander-Universität Erlangen-Nürnberg Signaltrenner, Verfahren zum Bestimmen von Ausgangssignalen basierend auf Mikrophonsignalen und Computerprogramm
KR100930060B1 (ko) * 2008-01-09 2009-12-08 성균관대학교산학협력단 신호 검출 방법, 장치 및 그 방법을 실행하는 프로그램이기록된 기록매체
US20130294611A1 (en) * 2012-05-04 2013-11-07 Sony Computer Entertainment Inc. Source separation by independent component analysis in conjuction with optimization of acoustic echo cancellation
CN106210370B (zh) * 2016-08-25 2019-07-23 西南交通大学 一种仿射投影最大熵子带自适应回声消除方法
CN106558316A (zh) * 2016-11-09 2017-04-05 天津大学 一种基于长时信号特定频带变化率的啸叫检测方法
CN106782593B (zh) * 2017-02-27 2019-10-25 重庆邮电大学 一种用于声学回声消除的多带结构自适应滤波器切换方法

Also Published As

Publication number Publication date
CN107369458A (zh) 2017-11-21

Similar Documents

Publication Publication Date Title
CN107369458B (zh) 一种基于熵吸引的最大熵子带回声消除方法
CN106210370B (zh) 一种仿射投影最大熵子带自适应回声消除方法
CN109040499B (zh) 一种抗冲击干扰的自适应回声消除方法
CN104883462B (zh) 一种用于消除声学回声的自适应滤波器及滤波方法
CN104410761B (zh) 一种仿射投影符号子带凸组合自适应回声消除方法
CN107333017B (zh) 一种重用权系数指数型误差自适应回声消除方法
CN109102794A (zh) 基于凸组合的m估计成比例类仿射投影的回声消除方法
CN104683614A (zh) 基于m估计的记忆成比例仿射投影自适应回声消除方法
CN107871510B (zh) 一种零吸引变核宽度的最大熵回声消除方法
CN103369162A (zh) 一种低复杂度的电话回声自适应消除方法
CN105721729B (zh) 基于块稀疏成比例重用权系数仿射投影的回声消除方法
CN110191245A (zh) 一种基于时变参数的自适应回声消除方法
CN106128471B (zh) 一种收缩变步长子带回声消除方法
CN104601837A (zh) 一种鲁棒凸组合自适应电话回声消除方法
CN104270539A (zh) 基于系数差的成比例仿射投影回声消除方法
CN104144269B (zh) 一种基于解相关的成比例自适应电话回声消除方法
CN107527622B (zh) 一种基于最大熵的变步长符号子带回声消除方法
CN109040497A (zh) 一种基于m估计的成比例类仿射投影自适应回声消除方法
CN109151237A (zh) 基于零吸引的仿射投影自适应回声消除方法
CN109089004A (zh) 一种基于相关熵诱导的集员自适应回声消除方法
CN107610714A (zh) 基于一范数零吸引的最小均三次方绝对值的回声消除方法
CN106170049B (zh) 一种有偏补偿的归一化子带自适应回声消除方法
CN106161823A (zh) 基于连续混合p范数的子带结构回声消除方法
CN106157965B (zh) 一种基于权向量重用的零范数集员仿射投影自适应回声消除方法
CN107578782B (zh) 一种变核宽度的最大熵子带回声消除方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant