CN110838300A - 回声消除的处理方法及处理系统 - Google Patents

回声消除的处理方法及处理系统 Download PDF

Info

Publication number
CN110838300A
CN110838300A CN201911127848.XA CN201911127848A CN110838300A CN 110838300 A CN110838300 A CN 110838300A CN 201911127848 A CN201911127848 A CN 201911127848A CN 110838300 A CN110838300 A CN 110838300A
Authority
CN
China
Prior art keywords
echo
residual
signal
cohxe
power
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911127848.XA
Other languages
English (en)
Other versions
CN110838300B (zh
Inventor
叶顺舟
康力
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ziguang Zhanrui (chongqing) Technology Co Ltd
Unisoc Chongqing Technology Co Ltd
Original Assignee
Ziguang Zhanrui (chongqing) Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ziguang Zhanrui (chongqing) Technology Co Ltd filed Critical Ziguang Zhanrui (chongqing) Technology Co Ltd
Priority to CN201911127848.XA priority Critical patent/CN110838300B/zh
Publication of CN110838300A publication Critical patent/CN110838300A/zh
Application granted granted Critical
Publication of CN110838300B publication Critical patent/CN110838300B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
    • H04M9/082Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephone Function (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)

Abstract

本发明公开了一种回声消除的处理方法及处理系统,处理方法包括:基于自适应滤波器对近端频域信号Dn(k)中的线性回声进行消除处理,以得到第一残留信号En(k),第一残留信号En(k)包括残留线性回声信号和非线性回声信号;对第一残留信号En(k)进行处理,以消除第一残留信号En(k)中的残留线性回声信号后得到第二残留信号Vn(k),第二残留信号Vn(k)包括非线性回声信号;对第二残留信号Vn(k)进行处理,以消除第二残留信号Vn(k)中的非线性回声信号后得到输出信号Wn(k);其中,n表示帧索引,k表示频率索引。本发明根据回声产生的原理,通过细分待消除回声的成分,并针对性的对每种回声成分进行较精确的消除与抑制,能够达到尽可能高的回波抑制比,充分考虑回声消除彻底性的同时兼顾了全双工通信的需求。

Description

回声消除的处理方法及处理系统
技术领域
本发明涉及通信领域,特别涉及一种回声消除的处理方法及系统。
背景技术
在回声消除技术中回波抑制比与双讲衰减性能是一对相互制约的评估指标,已有的技术中为了达到较好的回声消除程度,往往是以牺牲双讲性能为代价的。
在实时语音通信与VOIP(Voice over Internet Protocol,基于IP的语音传输)过程中,通信终端扬声器发出的声音,总会被该终端的麦克风拾取到,若是不处理就发送出去,对方总能听到自己说话的声音;同时若处理不当则会对本端语音造成失真,影响语音的可懂度。在人机交互应用场景中,由于交互终端发出的声音又被麦克风拾取回去,同时拾取了控制者的说话声,若在麦克风拾取信号中不消除交互终端发出的声音,那么交互终端在识别控制者说话声音时将引入很强的干扰,降低了识别的成功率,最终造成交互困难;同样的,若对回声消除程度不加以控制,则会对控制者的语音成分造成缺失,也会影响交互指令的识别与理解。
以手机通信免提模式为例,麦克风采集到的回声在时间轴上的特性如图1所示:横坐标为时间(time),单位秒(s),纵坐标为幅度(magnitude),单位为dB(分贝)。回声的产生共源自直达路径(Direct path)、前期反射(Early reflection)与后期混响(Latereverberation)三种途径,其中直达路径能量最高;前期反射随时间推移呈线性衰减趋势,时间持续数十毫秒;后期混响能量较弱,很快衰减到噪声水平,持续百毫秒以上。无论是直达声、前期反射或是后期混响,回声成分与远端频域信号总是线性相关的,因此普遍采用自适应滤波器对其进行消除。但根据音频设备的不同,回声拖尾的时间会持续数百毫秒到数秒不等,受复杂度与资源需求的限制,滤波器的阶数不能一味的增加,同时根据自适应滤波器稳态误差的理论瓶颈,通常将20dB的回波抑制(decay)比作为自适应滤波器的设计目标,即图中电划线对应的位置,相应的时间长度则换算为滤波器的阶数。基于以上所述,自适应滤波器能消除大部分的回声成分,但仍有部分前期反射与后期混响残留了下来的残留回声,需要对该部分回声做进一步的抑制。
公开号为CN102164210A的专利文件公开了一种时域自适应滤波结合频域非线性处理的方法。其中自适应滤波部分提出了最优步长
Figure BDA0002277411680000021
及其变形的方法,增加了背景噪声与双讲场景下滤波器的稳健性。公式中z(n)表示残差,ε(n)表示残留回声,
Figure BDA0002277411680000022
是近端频域信号x(n)在L个样本窗上的短期能量,L是滤波器长度。频域非线性处理(NLP,Non-Linear Process)采用中心削波或舒适噪声插入的方法,在每个子带设置预定的阈值,若低于该阈值则进行清零或噪声插入处理。
公开号为CN104395957B的专利文件公开了一种可重构的回声消除系统,包括回声线性处理模块、非线性回声处理模块与回声泄漏防止模块。其中回声线性处理模块所指为时域(TD)或频域(FD)自适应滤波,以FD的NLMS(归一化最小均方自适应滤波)为例,采用远近端相关因子
Figure BDA0002277411680000023
作为滤波器的更新步长,保证其稳健性,公式中Xn(k)、Dn(k)分别代表远、近端频域信号,k为帧索引,n为频率索引。非线性回声处理模块结合了时频域的处理,通过对自适应滤波估计回声幅度与近端频域信号幅度作对比,并结合残差幅度的大小,做出是否有回声残留的判决,进而给出相应的抑制增益。回声泄漏防止模块则是直接判断近端频域信号的幅度,若小于阈值,则认为可能发生近端麦克风被静音或移走的情况,固定给非线性回声处理模块的输出乘上一个很小的增益。
如前述的公开号为CN102164210A与CN104395957B的专利文件中所公开的,现有技术中在对待残留回声处理方面,直接将所有的回声残留均视做非线性成分,采用的方法均是基于一些硬门限判决,得到0/1结果,近而进行强制增益或清零等非线性处理。这类方法其缺点在于完全依赖0/1结果的判决,一旦设定的门限或阈值对于实际场景的覆盖面不够,则会出现大量的回声残留。同时当近端语音与残留回声混合的时候,如双讲应用场景中,现有的回声消除方式会将残留回声一并保留了下来。因此在回声消除与双工性能两个层面上都没有达到较好的效果。
综上可知,现有技术中直接将所有的回声残留均视做非线性成分,针对残留回声常采用估计与抑制的方法加以解决,如基于一些硬门限判决后进行强制增益或清零等非线性处理,由于难以对相关能量做出精准的估计,加之与近端语音频谱上的重合,抑制过程中常出现双讲近端语音衰减或失真的问题。其次在近端有效语音能量较弱的时候会被当作残留回声抑制掉,造成断断续续,影响双工性能。另外,作为公知的方法,自适应滤波用于消除主要能量的线性回声,但在双讲、低信噪比场景下其稳健性受到考验,常面临失调的问题。
发明内容
本发明要解决的技术问题是为了克服现有技术中的直接将所有的残留回声均视做非线性成分,并常采用估计与抑制的方法造成无法对相关能量做出精准的估计,抑制过程中常出现双讲近端语音衰减或失真的缺陷,提供一种能够充分考虑回声消除彻底性的同时兼顾了全双工通信的需求的回声消除的处理方法及处理系统。
本发明是通过下述技术方案来解决上述技术问题:
本发明第一方面提供了一种回声消除的处理方法,包括以下步骤:
基于自适应滤波器对近端频域信号Dn(k)中的线性回声进行消除处理,以得到第一残留信号En(k),所述第一残留信号En(k)包括残留线性回声信号和非线性回声信号;
对所述第一残留信号En(k)进行处理,以消除所述第一残留信号En(k)中的所述残留线性回声信号后得到第二残留信号Vn(k),所述第二残留信号Vn(k)包括所述非线性回声信号;
对所述第二残留信号Vn(k)进行处理,以消除所述第二残留信号Vn(k)中的所述非线性回声信号后得到输出信号Wn(k);
其中,n表示帧索引,k表示频率索引。
本方案中,根据回声产生的原理,打破了现有技术中常规的线性回声与非线性残留的认知,将待消除的回声在频域上分解为了主要能量的线性回声、残留线性回声与非线性回声三部分,采用了对应的三级回声消除的处理方式,即自适应滤波器消除主要能量的线性回声、残留线性回声消除处理与非线性回声消除处理,通过细分了待消除回声的成分,并针对性的对每种回声成分进行较精确的消除与抑制,能够达到尽可能高的回波抑制比,充分考虑回声消除彻底性的同时兼顾了全双工通信的需求。
较佳地,所述对所述第一残留信号En(k)进行处理,以消除所述第一残留信号En(k)中的所述残留线性回声信号后得到第二残留信号Vn(k)的步骤包括以下步骤:
对所述第一残留信号En(k)进行功率计算,以得到第一残留功率PEn(k);
使用所述第一残留信号En(k)和远端频域信号Xn(k)进行相关计算得到第一相关系数Cohxen(k);
基于所述第一相关系数Cohxen(k)得到残留回声因子ηn(k);
根据公式(1)计算得到第二残留功率PEren(k):
PEren(k)=ηn(k)PEn(k) (1);
基于所述第一残留功率PEn(k)、所述第二残留功率PEren(k)得到残留回声抑制增益RESGainn(k);
根据公式(2)得到所述第二残留信号Vn(k):Vn(k)=RESGainn(k)*En(k)(2)。
本方案中,根据残留线性回声是由部分前期反射与后期混响形成,其与远端信号仍具备相关性,故以残留信号与远端信号的相关系数作为残留回声因子。使用相关性特征对残留线性回声做出较准确的估计,与现有技术相比,本方案不依赖于0/1结果的非线性处理,残留回声估计更加准确,过抑制问题得到改善。
较佳地,所述对所述第一残留信号En(k)进行处理,以消除所述第一残留信号En(k)中的所述残留线性回声信号后得到第二残留信号Vn(k)的步骤还包括以下步骤:
对所述近端频域信号Dn(k)进行功率计算,以得到近端功率PDn(k);
所述基于所述第一残留功率PEn(k)、所述第二残留功率PEren(k)得到残留回声抑制增益RESGainn(k)的步骤包括以下步骤:
使用所述第一残留功率PEn(k)、所述第二残留功率PEren(k)以及所述远端功率PDn(k)得到先验信回比SERn(k);
基于所述先验信回比SERn(k)得到所述残留回声抑制增益RESGainn(k)。
本方案中,将回声视为噪声的一类,使用语音增强理论进行先验信回比估计,然后再基于该先验信回比对残留回声抑制增益进行保护,能够避免语音的失真。
较佳地,所述使用所述第一残留功率PEn(k)、所述第二残留功率PEren(k)以及所述近端功率PDn(k)得到先验信回比SERn(k)的步骤包括以下步骤:
根据回波抑制比判断是否为双讲状态,若是,则设置双讲系数RESfac为第一预设值,若否,则设置所述双讲系数RESfac为1;
所述第一预设值为小于1且大于0的数;
根据公式(3)计算得到第三残留功率PEreFn(k):PEreFn(k)=PEren(k)*RESfac(3);
根据公式(4)计算得到所述先验信回比SERn(k):
Figure BDA0002277411680000051
其中,PVn-1(k)=||Vn-1(k)||2;γ表示平滑因子,γ取值范围为0.90~0.98;
初始值SER0(k)计算公式为:
Figure BDA0002277411680000061
本方案中,使用了回波抑制比为特征进行了双讲检测,若检测为双讲状态,则对回声的估计量做修改,以减小残留回声的估计量,最大程度的保护语音。进一步的保证了双工性能;同时抑制过程始终进行,双讲状态下也无回声残留。
较佳地,所述根据回波抑制比判断是否为双讲状态的步骤包括:根据所述回波抑制比和所述自适应滤波器的更新步长μn(k)判断是否为双讲状态。
双讲时近端信号被残留下来,回波抑制比低;同时在滤波器未收敛状态,大量线性回声残留,回波抑制比同样较低,为避免误检,本方案中,引入代表残留信号与回声估计信号的相关性的自适应滤波步长,若是双讲状态,该相关性很小。具体使用回波抑制比与自适应滤波步长为特征进行了双讲检测,以检测结果对回声的估计量做修改,最大程度的保护语音。进一步的保证了双工性能;同时抑制过程始终进行,双讲状态下也无回声残留。
较佳地,所述基于所述第一相关系数Cohxen(k)得到残留回声因子ηn(k)的步骤包括以下步骤:
对所述第一相关系数Cohxen(k)作谱平滑处理后得到第二相关系数Cohxe'n(k);
将所述第二相关系数Cohxe'n(k)设置为所述残留回声因子ηn(k)。
本方案中,将残留回声因子作谱平滑处理,谱泄漏得到控制,抑制更彻底,能够防止谱泄漏对回声估计的影响,与现有技术相比,本方案不依赖于0/1结果的非线性处理,残留回声估计更加准确,过抑制问题进一步得到改善。
较佳地,所述对所述第一相关系数Cohxen(k)作谱平滑处理后得到第二相关系数Cohxe'n(k)采用公式(5)实现:
CohxeF'n(k)=(1-β12)Cohxen(k)+β1Cohxen(k-1)+β2Cohxen(k+1)(5);
其中,β1、β2分别表示谱平滑第一系数和谱平滑第二系数;
起始频段与结束频段β1、β2分别取0;
β1、β2=βmax,Cohxen(k±1)≥Cohxen(k);
β1、β2=βmin,Cohxen(k±1)<Cohxen(k);
βmax的取值范围为0.2~0.4,βmin的取值范围为0.01~0.1。
本方案中,回声在形成的过程中由于声波拉伸等因素会在原本频率的基础上泄漏到临近的频谱中,基于此将残留回声因子作谱平滑,一定程度减少泄漏的影响。
较佳地,所述基于自适应滤波器对近端频域信号Dn(k)中的线性回声进行消除处理,以得到第一残留信号En(k)的步骤包括以下步骤:
对远端频域信号Xn(k)使用所述自适应滤波器进行处理后得到回声估计信号Yn(k);
根据公式(6)计算得到残差信号En'(k):
En'(k)=Dn(k)-Yn(k) (6);
对所述残差信号En'(k)进行失调检测与保护,以得到所述第一残留信号En(k)。
本方案中,针对自适应滤波器面临的各声场环境的失调问题,对自适应滤波器的输出进行幅度限制,进一步避免或减少了失调的产生。
较佳地,所述自适应滤波器的自适应更新步长μn(k)为所述残差信号En'(k)与所述回声估计信号Yn(k)的相关系数。
本方案中,使用估计回声与残差信号的相关性为滤波器的更新步长,在双讲、近端单讲以及近端噪声场景,残差信号与回声估计信号不具备相关性,滤波器的更新程度理论上逼近于0,滤波器系数不更新,保证了自适应滤波的稳健性。相比现有技术类似使用远近端相关性的方法,估计回声与残差信号的相关性更加准确,避免了因延迟未对齐、底噪等因素产生的影响。
本发明第二方面提供了一种回声消除的处理系统,包括线性回声处理模块、残留线性回声处理模块和非线性回声处理模块;
所述线性回声处理模块包括自适应滤波器;
所述线性回声处理模块用于基于所述自适应滤波器对近端频域信号Dn(k)中的线性回声进行消除处理,以得到第一残留信号En(k),所述第一残留信号En(k)包括残留线性回声信号和非线性回声信号;
所述残留线性回声处理模块用于对所述第一残留信号En(k)进行处理,以消除所述第一残留信号En(k)中的所述残留线性回声信号后得到第二残留信号Vn(k),所述第二残留信号Vn(k)包括所述非线性回声信号;
所述非线性回声处理模块用于对所述第二残留信号Vn(k)进行处理,以消除所述第二残留信号Vn(k)中的所述非线性回声信号后得到输出信号Wn(k);
其中,n表示帧索引,k表示频率索引。
较佳地,所述残留线性回声处理模块包括第一功率计算单元、相关计算单元、因子计算单元、第一功率修正单元、增益计算单元、信号输出单元:
所述第一功率计算单元用于对所述第一残留信号En(k)进行功率计算,以得到第一残留功率PEn(k);
所述相关计算单元使用所述第一残留信号En(k)和远端频域信号Xn(k)进行相关计算得到第一相关系数Cohxen(k);
所述因子计算单元用于基于所述第一相关系数Cohxen(k)得到残留回声因子ηn(k);
所述第一功率修正单元用于根据公式(1)计算得到第二残留功率PEren(k):
PEren(k)=ηn(k)PEn(k) (1);
所述增益计算单元用于基于所述第一残留功率PEn(k)、所述第二残留功率PEren(k)得到残留回声抑制增益RESGainn(k);
所述信号输出单元用于根据公式(2)得到所述第二残留信号Vn(k):Vn(k)=RESGainn(k)*En(k) (2)。
较佳地,所述残留线性回声处理模块还包括信回比计算单元和第二功率计算单元;
所述第二功率计算单元用于对所述近端频域信号Dn(k)进行功率计算,以得到近端功率PDn(k);
所述信回比计算单元用于使用所述第一残留功率PEn(k)、所述第二残留功率PEren(k)以及所述远端功率PDn(k)得到先验信回比SERn(k);
所述增益计算单元用于基于所述先验信回比SERn(k)得到所述残留回声抑制增益RESGainn(k)。
较佳地,所述残留线性回声处理模块还包括双讲判决单元和第二功率修正单元;
所述双讲判决单元用于根据回波抑制比判断是否为双讲状态,若是,则设置双讲系数RESfac为第一预设值,若否,则设置所述双讲系数RESfac为1;
所述第一预设值为小于1且大于0的数;
所述第二功率修正单元用于根据公式(3)计算得到第三残留功率PEreFn(k):PEreFn(k)=PEren(k)*RESfac (3);
所述信回比计算单元用于根据公式(4)计算得到所述先验信回比SERn(k):
其中,PVn-1(k)=||Vn-1(k)||2;γ表示平滑因子,γ取值范围为0.90~0.98;
初始值SER0(k)计算公式为:
Figure BDA0002277411680000092
较佳地,所述双讲判决单元用于根据所述回波抑制比和所述自适应滤波器的更新步长μn(k)判断是否为双讲状态。
较佳地,所述残留线性回声处理模块还包括谱泄露防止单元;
所述谱泄露防止单元用于对所述第一相关系数Cohxen(k)作谱平滑处理后得到第二相关系数Cohxe'n(k);
所述因子计算单元用于将所述第二相关系数Cohxe'n(k)设置为所述残留回声因子ηn(k)。
较佳地,所述谱泄露防止单元用于采用公式(5)得到所述第二相关系数Cohxe'n(k):
Cohxe'n(k)=(1-β12)Cohxen(k)+β1Cohxen(k-1)+β2Cohxen(k+1)(5);
其中,β1、β2分别表示谱平滑第一系数和谱平滑第二系数;
起始频段与结束频段β1、β2分别取0;
β1、β2=βmax,Cohxen(k±1)≥Cohxen(k);
β1、β2=βmin,Cohxen(k±1)<Cohxen(k);
βmax的取值范围为0.2~0.4,βmin的取值范围为0.01~0.1。
较佳地,所述线性回声处理模块包括回声估计单元、残差信号计算单元和失调处理单元;
所述回声估计单元用于对远端频域信号Xn(k)使用所述自适应滤波器进行处理后得到回声估计信号Yn(k);
所述残差信号计算单元用于根据公式(6)计算得到残差信号En'(k):
En'(k)=Dn(k)-Yn(k) (6);
所述失调处理单元用于对所述残差信号En'(k)进行失调检测与保护,以得到所述第一残留信号En(k)。
较佳地,所述自适应滤波器的自适应更新步长μn(k)为所述残差信号En'(k)与所述回声估计信号Yn(k)的相关系数。
本发明的积极进步效果在于:
本发明根据回声产生的原理,打破了现有技术中常规的线性回声与非线性残留的认知,将待消除的回声在频域上分解为了主要能量的线性回声、残留线性回声与非线性回声三部分,采用了对应的三级回声消除的处理方式,即自适应滤波器消除主要能量的线性回声、残留线性回声消除处理与非线性回声消除处理,通过细分待消除回声的成分,并针对性的对每种回声成分进行较精确的消除与抑制,能够达到尽可能高的回波抑制比,充分考虑回声消除彻底性的同时兼顾了全双工通信的需求。
附图说明
图1为手机通信免提模式时麦克风采集到的回声的时域特性示意图。
图2为本发明实施例1的回声消除的处理方法的流程图。
图3为本发明实施例2中步骤S1的处理流程对应的框架示意图。
图4为本发明实施例2中步骤S2的处理流程图。
图5为手机通信免提模式时麦克风采集到的回声的频域特性示意图。
图6本发明实施例3的回声消除的处理系统的模块示意图。
图7本发明实施例4中线性回声处理模块的示意图。
图8本发明实施例4中残留线性回声处理模块的示意图。
具体实施方式
下面通过实施例的方式进一步说明本发明,但并不因此将本发明限制在所述的实施例范围之中。
实施例1
如图2所示,本实施例提供了一种回声消除的处理方法,包括以下步骤:
步骤S1、基于自适应滤波器对近端频域信号Dn(k)中的线性回声进行消除处理,以得到第一残留信号En(k),第一残留信号En(k)包括残留线性回声信号和非线性回声信号。
步骤S2、对第一残留信号En(k)进行处理,以消除第一残留信号En(k)中的残留线性回声信号后得到第二残留信号Vn(k),第二残留信号Vn(k)包括非线性回声信号。
步骤S3、对第二残留信号Vn(k)进行处理,以消除第二残留信号Vn(k)中的非线性回声信号后得到输出信号Wn(k)。
其中,n表示帧索引,k表示频率索引。近端频域信号Dn(k)为近端声音采集传感器如麦克风采集到的时域信号d(n)经STFT(短时傅里叶变换)得到的频域信号。而输出信号Wn(k)最终输出时再进行STIFT(短时傅里叶反变换)转换为时域输出信号w(n),其也是整个完备性回声消除方法的输出。
本实施例中,根据回声产生的原理,打破了现有技术中常规的线性回声与非线性残留的认知,将待消除的回声在频域上分解为了主要能量的线性回声、残留线性回声与非线性回声三部分,采用了对应的三级回声消除的处理方式,即自适应滤波器消除主要能量的线性回声、残留线性回声消除处理与非线性回声消除处理,通过细分待消除回声的成分,并针对性的对每种回声成分进行较精确的消除与抑制,能够达到尽可能高的回波抑制比,充分考虑回声消除彻底性的同时兼顾了全双工通信的需求。
实施例2
本实施例在实施例1的基础上进一步改进。如图3所示,本实施例中,步骤S1包括:
S101、对远端频域信号Xn(k)使用自适应滤波器AF进行处理后得到回声估计信号Yn(k)。
其中,远端频域信号Xn(k)为远端输入扬声器SPK的时域信号x(n)经STFT得到的频域信号,时域信号x(n)经回声路径对应的响应h(n)后产生回声(echo),连同用户语音(voice)以及噪音(noise)一并收入麦克风(MIC)中。
具体地,
Figure BDA0002277411680000121
其中Wn(k)表示自适应滤波器系数,该系数采用下述公式进行更新:
Figure BDA0002277411680000122
δ为固定值,避免分母归0。
μn(k)为自适应滤波器的自适应更新步长。
S102、根据下述公式计算得到残差信号En'(k):
En'(k)=Dn(k)-Yn(k)。
S103、对残差信号En'(k)进行失调检测与保护,以得到第一残留信号En(k)。
其中,参考下述公式实现失调检测与保护:
Figure BDA0002277411680000131
本实施例中,针对自适应滤波器面临的各声场环境的失调问题,对自适应滤波器的输出进行幅度限制,进一步避免或减少了失调的产生。
本实施例中,自适应滤波器的自适应更新步长μn(k)为残差信号En'(k)与回声估计信号Yn(k)的相关系数。自适应更新步长μn(k)计算方式如下:
Figure BDA0002277411680000132
Figure BDA0002277411680000133
Figure BDA0002277411680000134
Figure BDA0002277411680000135
其中,α为帧平滑系数,通过时间平滑逼近统计值,通常取值为0.01~0.1。
如图4所示,本实施例中,步骤S2包括:
S201、对第一残留信号En(k)进行功率计算,以得到第一残留功率PEn(k),具体为PEn(k)=||En(k)||2
S201’、对近端频域信号Dn(k)进行功率计算,以得到近端功率PDn(k),具体为PDn(k)=||Dn(k)||2
S202’、使用第一残留功率PEn(k)和近端功率PDn(k)计算AF回波抑制比Errn(k),具体为:
Figure BDA0002277411680000136
S202、使用第一残留信号En(k)和远端频域信号Xn(k)进行相关计算得到第一相关系数Cohxen(k)。
S203、对第一相关系数Cohxen(k)作谱平滑处理后得到第二相关系数Cohxe'n(k);将第二相关系数Cohxe'n(k)设置为残留回声因子ηn(k)。
其中,第二相关系数Cohxe'n(k)采用下述公式计算得到:
Cohxe'n(k)=(1-β12)Cohxen(k)+β1Cohxen(k-1)+β2Cohxen(k+1);
其中,β1、β2分别表示谱平滑第一系数和谱平滑第二系数;起始频段与结束频段β1、β2分别取0;
β1、β2=βmax,Cohxen(k±1)≥Cohxen(k);
β1、β2=βmin,Cohxen(k±1)<Cohxen(k);
βmax的取值范围为0.2~0.4,βmin的取值范围为0.01~0.1,本实施例中,βmax取0.25,βmin取0.05。
本实施例中,基于线性残留回声是由部分前期反射与后期混响形成,其与远端信号仍具备相关性,故以残留信号与远端信号的相关系数作为残留回声因子的基础。
因为回声在形成的过程中由于声波拉伸等因素会在原本频率的基础上泄漏到临近的频谱中,基于此本实施例中将残留回声因子作谱平滑,一定程度上减少谱泄漏的影响。
S204、根据下述公式计算得到第二残留功率PEren(k):
PEren(k)=ηn(k)PEn(k)。
S204’、根据回波抑制比Errn(k)和自适应滤波器的更新步长μn(k)判断当前是否为双讲状态,若是,则设置双讲系数RESfac为第一预设值DTDfac,若否,则设置双讲系数RESfac为1;其中第一预设值DTDfac为小于1且大于0的数,本实施例中DTDfac取0.3。
具体地,双讲检测采用回波抑制比Errn(k)与自适应滤波器更新步长μn(k)联合检测。双讲时近端信号被残留下来,回波抑制比低;同时在滤波器未收敛状态,大量线性回声残留,回波抑制比同样较低,为避免误检,引入自适应滤波器更新步长μn(k),代表了残留信号与回声估计信号的相关性,若是双讲状态,该相关性很小,具体表示如下:
Figure BDA0002277411680000151
Figure BDA0002277411680000152
其中,DTDflagn(k)表示双讲标志;ErrThrd表示回波抑制比门限,该门限取值范围为2~100,本实施例中取10;CohThrd表示相关门限,取值范围为0~0.5,本实施例中取0.4。
步骤S205、根据下述公式计算得到第三残留功率PEreFn(k):PEreFn(k)=PEren(k)*RESfac。
本实施例中,若检测为双讲状态,则减小残留回声的估计量,最大程度的保护近端语音。
步骤S206、基于语音增强理论使用第一残留功率PEn(k)、第三残留功率PEreFn(k)以及远端功率PDn(k)得到先验信回比SERn(k)。具体地,根据下述公式计算得到先验信回比SERn(k):
Figure BDA0002277411680000153
其中,PVn-1(k)=||Vn-1(k)||2;γ表示平滑因子,γ取值范围为0.90~0.98;
初始值SER0(k)计算公式为:
Figure BDA0002277411680000154
步骤S207、基于先验信回比SERn(k)得到残留回声抑制增益RESGainn(k)。
增益计算方式多种多样,如维纳滤波、谱减法、MMSE(最小均方误差)与LOG-MMSE(基于对数的MMSE)等通用语音增强法。本实施例中采用如下增益计算方式:
Figure BDA0002277411680000155
同时对增益做最小值保护,避免语音的失真:RESGainn(k)=max[RESGainn(k),Gainmin],本实施例中,Gainmin取0.1。
步骤S208、根据下述公式得到第二残留信号Vn(k):Vn(k)=RESGainn(k)*En(k)。
本实施例中,步骤S3采用现有的非线性处理方式对第二残留信号继续处理,进一步地,针对输出后的信号主观听感上会有一定的不适感的情况,还可以通过添加舒适噪声的方式进行听感改善,然后再进行输出,以得到整个完备性回声消除方法的最终的输出信号。
需要说明的是,本实施例中仅提供了一种回声消除的处理方法的实现方式,其内部涉及的各个步骤之间的顺序仅是示例性说明,也就是说,内部涉及的各个步骤的顺序可根据需要进行调整,并不会对本发明的保护范围造成限制。本实施例中AF的滤波器结构并不是对本发明的保护范围的限制,除详细描述的实施方式外,其他频域NLMS(归一化最小均方自适应滤波)、LMS(最小均方自适应滤波)、RLS(递归最小二乘自适应滤波)以及多块的MDF(The multi-delay block frequency-domain adaptive filter,多延迟块频域自适应滤波)结构均适用于本发明。
为了更好地理解本实施例的实现方式及所能达到的技术效果,下面继续以手机通信免提模式为例进行说明,图5为播放1KHz(千赫兹)单音时,麦克风所采集到的回声频域特性,其中图5的上半部分为对应的远端频域信号示意图,下半部分为包括了噪音和各种回声(线性回声(Linear echo)、非线性回声(Non-linear echo)、残留回声(Spectrum leak))的近端频域信号的示意图,纵坐标为幅度,单位为dB,横坐标为频率,单位为赫兹。从图5中可知,由于音频功放、扬声器等的谐波失真因素,麦克风拾取到的回声除1KHz的线性回声外,还存在2KHz、3KHz的非线性回声成分,此外由于出声孔、防尘网等孔径对声波具有挤压作用,使得声波波长发生细微变化,在频域中体现为原本单一的频点变成了一个窄频带,对应的线性回声就存在一定的谱泄漏问题。经过对回声时频域特性的分析,待消除的回声成分则自然分解为了主要能量的线性回声、残留线性回声与非线性回声三部分。作为公知的方法,自适应滤波用于消除主要能量的线性回声。
针对AF面临的各声场环境的失调问题,本实施例使用估计回声与残差信号的相关性作为滤波器的更新步长,使得在双讲、单近端信号等声场环境下,滤波器的更新程度逼近于0,增强了滤波器的稳健性;相比现有技术类似使用远近端相关性的方法,估计回声与残差信号的相关性更加准确,避免了因延迟未对齐、底噪等因素产生的影响;同时对滤波器的输出进行幅度限制,进一步避免或减少了失调的产生。
针对残留线性回声面临的是回声频谱泄漏与过抑制问题,本实施例首先使用相关性特征对线性残留回声做出较准确的估计,其次将残留因子作谱平滑处理,防止谱泄漏对回声估计的影响;最后本实施例还使用了回波抑制比与自适应滤波步长为特征进行了双讲检测,以检测结果对回声的估计量做修改,最大程度的保护语音。与现有技术相比,本实施例不依赖于0/1结果的非线性处理,残留回声估计更加准确,过抑制问题得到改善;谱泄漏得到控制,抑制更彻底;基于双讲检测的语音保护策略则进一步的保证了双工性能;同时抑制过程始终进行,双讲状态下也无回声残留。
本实施例对非线性回声进行非线性处理,最后产生舒适噪声对因非线处理造成的主观不适感进行听觉的改善。
本实施例根据回声产生的原理,打破了现有技术中常规的线性回声与非线性残留的认知,将待消除的回声在频域上分解为了主要能量的线性回声、残留线性回声与非线性回声三部分,采用了对应的三级回声消除的处理方式,即自适应滤波器消除主要能量的线性回声、残留线性回声消除处理与非线性回声消除处理,通过细分待消除回声的成分,并针对性的对每种回声成分进行较精确的消除与抑制,能够达到尽可能高的回波抑制比,充分考虑回声消除彻底性的同时兼顾了全双工通信的需求。
实施例3
如图6所示,本实施例提供了一种回声消除的处理系统,包括线性回声处理模块1、残留线性回声处理模块2和非线性回声处理模块3。该处理系统用于执行实施例1公开的回声消除的处理方法。
其中,线性回声处理模块1包括自适应滤波器,该线性回声处理模块1用于基于自适应滤波器对近端频域信号Dn(k)中的线性回声进行消除处理,以得到第一残留信号En(k),第一残留信号En(k)包括残留线性回声信号和非线性回声信号。
残留线性回声处理模块2用于对第一残留信号En(k)进行处理,以消除第一残留信号En(k)中的残留线性回声信号后得到第二残留信号Vn(k),第二残留信号Vn(k)包括非线性回声信号。
非线性回声处理模块3用于对第二残留信号Vn(k)进行处理,以消除第二残留信号Vn(k)中的非线性回声信号后得到输出信号Wn(k)。
其中,n表示帧索引,k表示频率索引。近端频域信号Dn(k)为近端声音采集传感器如麦克风采集到的时域信号d(n)经STFT得到的频域信号。而输出信号Wn(k)最终输出时再进行STIFT转换得到时域输出信号w(n),其也是整个完备性回声消除方法的输出。
本实施例中,根据回声产生的原理,打破了现有技术中常规的线性回声与非线性残留的认知,将待消除的回声在频域上分解为了主要能量的线性回声、残留线性回声与非线性回声三部分,采用了对应的三级回声消除的处理方式,即自适应滤波器消除主要能量的线性回声、残留线性回声消除处理与非线性回声消除处理,通过细分待消除回声的成分,并针对性的对每种回声成分进行较精确的消除与抑制,能够达到尽可能高的回波抑制比,充分考虑回声消除彻底性的同时兼顾了全双工通信的需求。
实施例4
本实施例提供的回声消除的处理系统用于执行实施例1或实施例2公开的回声消除的处理方法。本实施例在实施例3的基础上进一步改进。
如图7所示,本实施例中,线性回声处理模块1包括回声估计单元101、残差信号计算单元102和失调处理单元103。
回声估计单元101用于对远端频域信号Xn(k)使用自适应滤波器进行处理后得到回声估计信号Yn(k)。
具体地,远端频域信号Xn(k)为远端输入扬声器SPK的时域信号x(n)经STFT得到的频域信号,时域信号x(n)经回声路径对应的响应h(n)后产生回声,连同用户语音以及噪音一并收入麦克风中。具体地,
Figure BDA0002277411680000191
其中Wn(k)表示自适应滤波器系数,该系数采用下述公式进行更新:
Figure BDA0002277411680000192
δ为固定值,避免分母归0。
μn(k)为自适应滤波器的自适应更新步长。
残差信号计算单元102用于根据下述公式计算得到残差信号En'(k):
En'(k)=Dn(k)-Yn(k)。
失调处理单元103用于对残差信号En'(k)进行失调检测与保护,以得到第一残留信号En(k)。
其中,参考下述公式实现失调检测与保护:
本实施例中,针对自适应滤波器面临的各声场环境的失调问题,对自适应滤波器的输出进行幅度限制,进一步避免或减少了失调的产生。
本实施例中,自适应滤波器的自适应更新步长μn(k)为残差信号En'(k)与回声估计信号Yn(k)的相关系数。自适应更新步长μn(k)计算方式如下:
Figure BDA0002277411680000194
Figure BDA0002277411680000195
Figure BDA0002277411680000196
Figure BDA0002277411680000197
其中,α为帧平滑系数,通过时间平滑逼近统计值,通常取值为0.01~0.1。
如图8所示,本实施例中,残留线性回声处理模块2包括第一功率计算单元201、第二功率计算单元202、相关计算单元203、谱泄露防止单元204、因子计算单元205、第一功率修正单元206、双讲判决单元207、第二功率修正单元208、信回比计算单元209、增益计算单元210、信号输出单元211。
其中,第一功率计算单元201用于对第一残留信号En(k)进行功率计算,以得到第一残留功率PEn(k),具体为PEn(k)=||En(k)||2
第二功率计算单元202用于对近端频域信号Dn(k)进行功率计算,以得到近端功率PDn(k),具体为PDn(k)=||Dn(k)||2
相关计算单元203使用第一残留信号En(k)和远端频域信号Xn(k)进行相关计算得到第一相关系数Cohxen(k)。
谱泄露防止单元204用于对第一相关系数Cohxen(k)作谱平滑处理后得到第二相关系数Cohxe'n(k)。具体地,谱泄露防止单元204用于采用下述公式得到第二相关系数Cohxe'n(k):
Cohxe'n(k)=(1-β12)Cohxen(k)+β1Cohxen(k-1)+β2Cohxen(k+1);
其中,β1、β2分别表示谱平滑第一系数和谱平滑第二系数;
起始频段与结束频段β1、β2分别取0;
β1、β2=βmax,Cohxen(k±1)≥Cohxen(k);
β1、β2=βmin,Cohxen(k±1)<Cohxen(k);
βmax的取值范围为0.2~0.4,βmin的取值范围为0.01~0.1,本实施例中,βmax取0.25,βmin取0.05。
因子计算单元205用于将第二相关系数Cohxe'n(k)设置为残留回声因子ηn(k)。
本实施例中,基于线性残留回声是由部分前期反射与后期混响形成,其与远端信号仍具备相关性,故以残留信号与远端信号的相关系数作为残留回声因子的基础。
因为回声在形成的过程中由于声波拉伸等因素会在原本频率的基础上泄漏到临近的频谱中,基于此本实施例中将残留回声因子作谱平滑,一定程度上减少谱泄漏的影响。
第一功率修正单元206用于根据下述公式计算得到第二残留功率PEren(k):PEren(k)=ηn(k)PEn(k)。
双讲判决单元207用于根据回波抑制比Errn(k)和自适应滤波器的更新步长μn(k)判断是否为双讲状态,若是,则设置双讲系数RESfac为第一预设值DTDfac,若否,则设置双讲系数RESfac为1;第一预设值DTDfac为小于1且大于0的数,本实施例中DTDfac取0.3。
其中,回波抑制比Errn(k)使用第一残留功率PEn(k)和近端功率PDn(k)计算得到,具体为:
Figure BDA0002277411680000211
具体地,双讲检测采用回波抑制比Errn(k)与自适应滤波器更新步长μn(k)联合检测。双讲时近端信号被残留下来,回波抑制比低;同时在滤波器未收敛状态,大量线性回声残留,回波抑制比同样较低,为避免误检,引入自适应滤波器更新步长μn(k),代表了残留信号与回声估计信号的相关性,若是双讲状态,该相关性很小,具体表示如下:
Figure BDA0002277411680000213
其中,DTDflagn(k)表示双讲标志;ErrThrd表示回波抑制比门限,该门限取值范围为2~100,本实施例中取10;CohThrd表示相关门限,取值范围为0~0.5,本实施例中取0.4。
第二功率修正单元208用于根据下述公式计算得到第三残留功率PEreFn(k):PEreFn(k)=PEren(k)*RESfac。
本实施例中,若检测为双讲状态,则减小残留回声的估计量,最大程度的保护近端语音。
信回比计算单元209用于基于语音增强理论使用第一残留功率PEn(k)、第三残留功率PEreFn(k)以及远端功率PDn(k)得到先验信回比SERn(k)。具体地,用于根据下述公式计算得到先验信回比SERn(k):
Figure BDA0002277411680000221
其中,PVn-1(k)=||Vn-1(k)||2;γ表示平滑因子,γ取值范围为0.90~0.98;
初始值SER0(k)计算公式为:
Figure BDA0002277411680000222
增益计算单元210用于基于第一残留功率PEn(k)、第二残留功率PEren(k)得到残留回声抑制增益RESGainn(k),具体地,用于基于先验信回比SERn(k)得到残留回声抑制增益RESGainn(k)。
增益计算方式多种多样,如维纳滤波、谱减法、MMSE与LOG-MMSE等通用语音增强法。本实施例中采用如下增益计算方式:
Figure BDA0002277411680000223
同时对增益做最小值保护,避免语音的失真:RESGainn(k)=max[RESGainn(k),Gainmin],本实施例中,Gainmin取0.1。
信号输出单元211用于根据下述公式得到第二残留信号Vn(k):Vn(k)=RESGainn(k)*En(k)。
本实施例中,非线性回声处理模块3采用现有的非线性处理方式对第二残留信号继续处理,进一步地,针对输出后的信号主观听感上会有一定的不适感的情况,还可以通过添加舒适噪声的方式进行听感改善,然后再进行输出,以得到整个完备性回声消除方法的最终的输出信号。
针对AF面临的各声场环境的失调问题,本实施例使用估计回声与残差信号的相关性作为滤波器的更新步长,使得在双讲、单近端信号等声场环境下,滤波器的更新程度逼近于0,增强了滤波器的稳健性;相比现有技术类似使用远近端相关性的方法,估计回声与残差信号的相关性更加准确,避免了因延迟未对齐、底噪等因素产生的影响;同时对滤波器的输出进行幅度限制,进一步避免或减少了失调的产生。
针对残留线性回声面临的是回声频谱泄漏与过抑制问题,本实施例首先使用相关性特征对线性残留回声做出较准确的估计,其次将残留因子作谱平滑处理,防止谱泄漏对回声估计的影响;最后本实施例还使用了回波抑制比与自适应滤波步长为特征进行了双讲检测,以检测结果对回声的估计量做修改,最大程度的保护语音。与现有技术相比,本实施例不依赖于0/1结果的非线性处理,残留回声估计更加准确,过抑制问题得到改善;谱泄漏得到控制,抑制更彻底;基于双讲检测的语音保护策略则进一步的保证了双工性能;同时抑制过程始终进行,双讲状态下也无回声残留。
本实施例对非线性回声进行非线性处理,最后产生舒适噪声对因非线处理造成的主观不适感进行听觉的改善。
本实施例从回声产生的原理入手,打破了现有技术中常规的线性回声与非线性残留的认知,将回声成分分解为了线性回声、残余线性回声与非线性回声三部分,对应设计出了以自适应滤波AF、残留回声抑制与非线性处理为基础的三级频域回声消除解决方案,在充分考虑回声消除彻底性的同时兼顾了全双工通信的需求。
虽然以上描述了本发明的具体实施方式,但是本领域的技术人员应当理解,这仅是举例说明,本发明的保护范围是由所附权利要求书限定的。本领域的技术人员在不背离本发明的原理和实质的前提下,可以对这些实施方式做出多种变更或修改,但这些变更和修改均落入本发明的保护范围。

Claims (18)

1.一种回声消除的处理方法,其特征在于,包括以下步骤:
基于自适应滤波器对近端频域信号Dn(k)中的线性回声进行消除处理,以得到第一残留信号En(k),所述第一残留信号En(k)包括残留线性回声信号和非线性回声信号;
对所述第一残留信号En(k)进行处理,以消除所述第一残留信号En(k)中的所述残留线性回声信号后得到第二残留信号Vn(k),所述第二残留信号Vn(k)包括所述非线性回声信号;
对所述第二残留信号Vn(k)进行处理,以消除所述第二残留信号Vn(k)中的所述非线性回声信号后得到输出信号Wn(k);
其中,n表示帧索引,k表示频率索引。
2.如权利要求1所述的回声消除的处理方法,其特征在于,所述对所述第一残留信号En(k)进行处理,以消除所述第一残留信号En(k)中的所述残留线性回声信号后得到第二残留信号Vn(k)的步骤包括以下步骤:
对所述第一残留信号En(k)进行功率计算,以得到第一残留功率PEn(k);
使用所述第一残留信号En(k)和远端频域信号Xn(k)进行相关计算得到第一相关系数Cohxen(k);
基于所述第一相关系数Cohxen(k)得到残留回声因子ηn(k);
根据公式(1)计算得到第二残留功率PEren(k):
PEren(k)=ηn(k)PEn(k) (1);
基于所述第一残留功率PEn(k)、所述第二残留功率PEren(k)得到残留回声抑制增益RESGainn(k);
根据公式(2)得到所述第二残留信号Vn(k):
Vn(k)=RESGainn(k)*En(k) (2)。
3.如权利要求2所述的回声消除的处理方法,其特征在于,所述对所述第一残留信号En(k)进行处理,以消除所述第一残留信号En(k)中的所述残留线性回声信号后得到第二残留信号Vn(k)的步骤还包括以下步骤:
对所述近端频域信号Dn(k)进行功率计算,以得到近端功率PDn(k);
所述基于所述第一残留功率PEn(k)、所述第二残留功率PEren(k)得到残留回声抑制增益RESGainn(k)的步骤包括以下步骤:
使用所述第一残留功率PEn(k)、所述第二残留功率PEren(k)以及所述远端功率PDn(k)得到先验信回比SERn(k);
基于所述先验信回比SERn(k)得到所述残留回声抑制增益RESGainn(k)。
4.如权利要求3所述的回声消除的处理方法,其特征在于,所述使用所述第一残留功率PEn(k)、所述第二残留功率PEren(k)以及所述近端功率PDn(k)得到先验信回比SERn(k)的步骤包括以下步骤:
根据回波抑制比判断是否为双讲状态,若是,则设置双讲系数RESfac为第一预设值,若否,则设置所述双讲系数RESfac为1;
所述第一预设值为小于1且大于0的数;
根据公式(3)计算得到第三残留功率PEreFn(k):PEreFn(k)=PEren(k)*RESfac (3);
根据公式(4)计算得到所述先验信回比SERn(k):
Figure FDA0002277411670000021
其中,PVn-1(k)=||Vn-1(k)||2;γ表示平滑因子,γ取值范围为0.90~0.98;
初始值SER0(k)计算公式为:
Figure FDA0002277411670000022
5.如权利要求4所述的回声消除的处理方法,其特征在于,所述根据回波抑制比判断是否为双讲状态的步骤包括:根据所述回波抑制比和所述自适应滤波器的更新步长判断是否为双讲状态。
6.如权利要求2所述的回声消除的处理方法,其特征在于,所述基于所述第一相关系数Cohxen(k)得到残留回声因子ηn(k)的步骤包括以下步骤:
对所述第一相关系数Cohxen(k)作谱平滑处理后得到第二相关系数Cohxe'n(k);
将所述第二相关系数Cohxe'n(k)设置为所述残留回声因子ηn(k)。
7.如权利要求6所述的回声消除的处理方法,其特征在于,
所述对所述第一相关系数Cohxen(k)作谱平滑处理后得到第二相关系数Cohxe'n(k)采用公式(5)实现:
Cohxe'n(k)=(1-β12)Cohxen(k)+β1Cohxen(k-1)+β2Cohxen(k+1)(5);
其中,β1、β2分别表示谱平滑第一系数和谱平滑第二系数;
起始频段与结束频段β1、β2分别取0;
β1、β2=βmax,Cohxen(k±1)≥Cohxen(k);
β1、β2=βmin,Cohxen(k±1)<Cohxen(k);
βmax的取值范围为0.2~0.4,βmin的取值范围为0.01~0.1。
8.如权利要求1所述的回声消除的处理方法,其特征在于,所述基于自适应滤波器对近端频域信号Dn(k)中的线性回声进行消除处理,以得到第一残留信号En(k)的步骤包括以下步骤:
对远端频域信号Xn(k)使用所述自适应滤波器进行处理后得到回声估计信号Yn(k);
根据公式(6)计算得到残差信号En'(k):
En'(k)=Dn(k)-Yn(k) (6);
对所述残差信号En'(k)进行失调检测与保护,以得到所述第一残留信号En(k)。
9.如权利要求8所述的回声消除的处理方法,其特征在于,所述自适应滤波器的自适应更新步长μn(k)为所述残差信号En'(k)与所述回声估计信号Yn(k)的相关系数。
10.一种回声消除的处理系统,其特征在于,包括线性回声处理模块、残留线性回声处理模块和非线性回声处理模块;
所述线性回声处理模块包括自适应滤波器;
所述线性回声处理模块用于基于所述自适应滤波器对近端频域信号Dn(k)中的线性回声进行消除处理,以得到第一残留信号En(k),所述第一残留信号En(k)包括残留线性回声信号和非线性回声信号;
所述残留线性回声处理模块用于对所述第一残留信号En(k)进行处理,以消除所述第一残留信号En(k)中的所述残留线性回声信号后得到第二残留信号Vn(k),所述第二残留信号Vn(k)包括所述非线性回声信号;
所述非线性回声处理模块用于对所述第二残留信号Vn(k)进行处理,以消除所述第二残留信号Vn(k)中的所述非线性回声信号后得到输出信号Wn(k);
其中,n表示帧索引,k表示频率索引。
11.如权利要求10所述的回声消除的处理系统,其特征在于,所述残留线性回声处理模块包括第一功率计算单元、相关计算单元、因子计算单元、第一功率修正单元、增益计算单元、信号输出单元:
所述第一功率计算单元用于对所述第一残留信号En(k)进行功率计算,以得到第一残留功率PEn(k);
所述相关计算单元使用所述第一残留信号En(k)和远端频域信号Xn(k)进行相关计算得到第一相关系数Cohxen(k);
所述因子计算单元用于基于所述第一相关系数Cohxen(k)得到残留回声因子ηn(k);
所述第一功率修正单元用于根据公式(1)计算得到第二残留功率PEren(k):
PEren(k)=ηn(k)PEn(k) (1);
所述增益计算单元用于基于所述第一残留功率PEn(k)、所述第二残留功率PEren(k)得到残留回声抑制增益RESGainn(k);
所述信号输出单元用于根据公式(2)得到所述第二残留信号Vn(k):Vn(k)=RESGainn(k)*En(k) (2)。
12.如权利要求11所述的回声消除的处理系统,其特征在于,所述残留线性回声处理模块还包括信回比计算单元和第二功率计算单元;
所述第二功率计算单元用于对所述近端频域信号Dn(k)进行功率计算,以得到近端功率PDn(k);
所述信回比计算单元用于使用所述第一残留功率PEn(k)、所述第二残留功率PEren(k)以及所述远端功率PDn(k)得到先验信回比SERn(k);
所述增益计算单元用于基于所述先验信回比SERn(k)得到所述残留回声抑制增益RESGainn(k)。
13.如权利要求12所述的回声消除的处理系统,其特征在于,所述残留线性回声处理模块还包括双讲判决单元和第二功率修正单元;
所述双讲判决单元用于根据回波抑制比判断是否为双讲状态,若是,则设置双讲系数RESfac为第一预设值,若否,则设置所述双讲系数RESfac为1;
所述第一预设值为小于1且大于0的数;
所述第二功率修正单元用于根据公式(3)计算得到第三残留功率PEreFn(k):PEreFn(k)=PEren(k)*RESfac (3);
所述信回比计算单元用于根据公式(4)计算得到所述先验信回比SERn(k):
其中,PVn-1(k)=||Vn-1(k)||2;γ表示平滑因子,γ取值范围为0.90~0.98;
初始值SER0(k)计算公式为:
Figure FDA0002277411670000052
14.如权利要求13所述的回声消除的处理系统,其特征在于,所述双讲判决单元用于根据所述回波抑制比和所述自适应滤波器的更新步长μn(k)判断是否为双讲状态。
15.如权利要求11所述的回声消除的处理系统,其特征在于,所述残留线性回声处理模块还包括谱泄露防止单元;
所述谱泄露防止单元用于对所述第一相关系数Cohxen(k)作谱平滑处理后得到第二相关系数Cohxe'n(k);
所述因子计算单元用于将所述第二相关系数Cohxe'n(k)设置为所述残留回声因子ηn(k)。
16.如权利要求15所述的回声消除的处理系统,其特征在于,
所述谱泄露防止单元用于采用公式(5)得到所述第二相关系数Cohxe'n(k):
CohxeF'n(k)=(1-β12)Cohxen(k)+β1Cohxen(k-1)+β2Cohxen(k+1)(5);
其中,β1、β2分别表示谱平滑第一系数和谱平滑第二系数;
起始频段与结束频段β1、β2分别取0;
β1、β2=βmax,Cohxen(k±1)≥Cohxen(k);
β1、β2=βmin,Cohxen(k±1)<Cohxen(k);
βmax的取值范围为0.2~0.4,βmin的取值范围为0.01~0.1。
17.如权利要求10所述的回声消除的处理系统,其特征在于,所述线性回声处理模块包括回声估计单元、残差信号计算单元和失调处理单元;
所述回声估计单元用于对远端频域信号Xn(k)使用所述自适应滤波器进行处理后得到回声估计信号Yn(k);
所述残差信号计算单元用于根据公式(6)计算得到残差信号En'(k):
En'(k)=Dn(k)-Yn(k) (6);
所述失调处理单元用于对所述残差信号En'(k)进行失调检测与保护,以得到所述第一残留信号En(k)。
18.如权利要求17所述的回声消除的处理系统,其特征在于,所述自适应滤波器的自适应更新步长μn(k)为所述残差信号En'(k)与所述回声估计信号Yn(k)的相关系数。
CN201911127848.XA 2019-11-18 2019-11-18 回声消除的处理方法及处理系统 Active CN110838300B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911127848.XA CN110838300B (zh) 2019-11-18 2019-11-18 回声消除的处理方法及处理系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911127848.XA CN110838300B (zh) 2019-11-18 2019-11-18 回声消除的处理方法及处理系统

Publications (2)

Publication Number Publication Date
CN110838300A true CN110838300A (zh) 2020-02-25
CN110838300B CN110838300B (zh) 2022-03-25

Family

ID=69576732

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911127848.XA Active CN110838300B (zh) 2019-11-18 2019-11-18 回声消除的处理方法及处理系统

Country Status (1)

Country Link
CN (1) CN110838300B (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111246037A (zh) * 2020-03-16 2020-06-05 北京字节跳动网络技术有限公司 一种回声消除方法、装置、终端设备及介质
CN111556210A (zh) * 2020-04-23 2020-08-18 深圳市未艾智能有限公司 通话语音处理方法与装置、终端设备和存储介质
CN111654585A (zh) * 2020-03-26 2020-09-11 紫光展锐(重庆)科技有限公司 回声声场状态确定方法及装置、存储介质、终端
CN111798863A (zh) * 2020-06-24 2020-10-20 北京梧桐车联科技有限责任公司 消除回声的方法、装置、电子设备及可读存储介质
CN111883153A (zh) * 2020-06-28 2020-11-03 厦门亿联网络技术股份有限公司 一种基于麦克风阵列的双端讲话状态检测方法及装置
CN112017679A (zh) * 2020-08-05 2020-12-01 海尔优家智能科技(北京)有限公司 用于自适应滤波器系数更新的方法及装置、设备
CN112492112A (zh) * 2020-11-19 2021-03-12 睿云联(厦门)网络通讯技术有限公司 一种基于对讲系统的回音消除方法和装置
CN112542176A (zh) * 2020-11-04 2021-03-23 北京百度网讯科技有限公司 信号增强方法、装置及存储介质
CN112735370A (zh) * 2020-12-29 2021-04-30 紫光展锐(重庆)科技有限公司 一种语音信号处理方法、装置、电子设备和存储介质
CN112786067A (zh) * 2020-12-30 2021-05-11 西安讯飞超脑信息科技有限公司 残留回声概率预测方法、模型训练方法、设备及存储装置
CN112837697A (zh) * 2021-02-20 2021-05-25 北京猿力未来科技有限公司 一种回声抑制方法及装置
CN113421579A (zh) * 2021-06-30 2021-09-21 北京小米移动软件有限公司 声音处理方法、装置、电子设备和存储介质
CN113436638A (zh) * 2021-06-22 2021-09-24 云知声智能科技股份有限公司 回声处理方法、装置、设备和存储介质
CN113938548A (zh) * 2020-06-29 2022-01-14 阿里巴巴集团控股有限公司 一种终端通信的回声抑制方法和装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1953060A (zh) * 2006-11-24 2007-04-25 北京中星微电子有限公司 一种麦克风回声消除装置及回声消除方法
US20110019831A1 (en) * 2009-07-21 2011-01-27 Yamaha Corporation Echo Suppression Method and Apparatus Thereof
CN104954595A (zh) * 2015-05-15 2015-09-30 百度在线网络技术(北京)有限公司 残留回声消除方法和装置
CN106713570A (zh) * 2015-07-21 2017-05-24 炬芯(珠海)科技有限公司 一种回声消除方法和装置
CN107071196A (zh) * 2017-05-04 2017-08-18 重庆第二师范学院 一种自适应回声消除方法
CN108376548A (zh) * 2018-01-16 2018-08-07 厦门亿联网络技术股份有限公司 一种基于麦克风阵列的回声消除方法与系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1953060A (zh) * 2006-11-24 2007-04-25 北京中星微电子有限公司 一种麦克风回声消除装置及回声消除方法
US20110019831A1 (en) * 2009-07-21 2011-01-27 Yamaha Corporation Echo Suppression Method and Apparatus Thereof
CN104954595A (zh) * 2015-05-15 2015-09-30 百度在线网络技术(北京)有限公司 残留回声消除方法和装置
CN106713570A (zh) * 2015-07-21 2017-05-24 炬芯(珠海)科技有限公司 一种回声消除方法和装置
CN107071196A (zh) * 2017-05-04 2017-08-18 重庆第二师范学院 一种自适应回声消除方法
CN108376548A (zh) * 2018-01-16 2018-08-07 厦门亿联网络技术股份有限公司 一种基于麦克风阵列的回声消除方法与系统

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111246037A (zh) * 2020-03-16 2020-06-05 北京字节跳动网络技术有限公司 一种回声消除方法、装置、终端设备及介质
CN111246037B (zh) * 2020-03-16 2021-11-16 北京字节跳动网络技术有限公司 一种回声消除方法、装置、终端设备及介质
CN111654585A (zh) * 2020-03-26 2020-09-11 紫光展锐(重庆)科技有限公司 回声声场状态确定方法及装置、存储介质、终端
CN111556210A (zh) * 2020-04-23 2020-08-18 深圳市未艾智能有限公司 通话语音处理方法与装置、终端设备和存储介质
CN111798863B (zh) * 2020-06-24 2024-03-08 北京梧桐车联科技有限责任公司 消除回声的方法、装置、电子设备及可读存储介质
CN111798863A (zh) * 2020-06-24 2020-10-20 北京梧桐车联科技有限责任公司 消除回声的方法、装置、电子设备及可读存储介质
CN111883153B (zh) * 2020-06-28 2024-02-23 厦门亿联网络技术股份有限公司 一种基于麦克风阵列的双端讲话状态检测方法及装置
CN111883153A (zh) * 2020-06-28 2020-11-03 厦门亿联网络技术股份有限公司 一种基于麦克风阵列的双端讲话状态检测方法及装置
CN113938548A (zh) * 2020-06-29 2022-01-14 阿里巴巴集团控股有限公司 一种终端通信的回声抑制方法和装置
CN112017679A (zh) * 2020-08-05 2020-12-01 海尔优家智能科技(北京)有限公司 用于自适应滤波器系数更新的方法及装置、设备
CN112017679B (zh) * 2020-08-05 2024-01-26 海尔优家智能科技(北京)有限公司 用于自适应滤波器系数更新的方法及装置、设备
CN112542176A (zh) * 2020-11-04 2021-03-23 北京百度网讯科技有限公司 信号增强方法、装置及存储介质
CN112492112A (zh) * 2020-11-19 2021-03-12 睿云联(厦门)网络通讯技术有限公司 一种基于对讲系统的回音消除方法和装置
CN112735370B (zh) * 2020-12-29 2022-11-01 紫光展锐(重庆)科技有限公司 一种语音信号处理方法、装置、电子设备和存储介质
CN112735370A (zh) * 2020-12-29 2021-04-30 紫光展锐(重庆)科技有限公司 一种语音信号处理方法、装置、电子设备和存储介质
CN112786067A (zh) * 2020-12-30 2021-05-11 西安讯飞超脑信息科技有限公司 残留回声概率预测方法、模型训练方法、设备及存储装置
CN112786067B (zh) * 2020-12-30 2024-04-19 西安讯飞超脑信息科技有限公司 残留回声概率预测方法、模型训练方法、设备及存储装置
CN112837697A (zh) * 2021-02-20 2021-05-25 北京猿力未来科技有限公司 一种回声抑制方法及装置
CN112837697B (zh) * 2021-02-20 2024-05-14 北京猿力未来科技有限公司 一种回声抑制方法及装置
CN113436638A (zh) * 2021-06-22 2021-09-24 云知声智能科技股份有限公司 回声处理方法、装置、设备和存储介质
CN113436638B (zh) * 2021-06-22 2023-01-24 云知声智能科技股份有限公司 回声处理方法、装置、设备和存储介质
CN113421579A (zh) * 2021-06-30 2021-09-21 北京小米移动软件有限公司 声音处理方法、装置、电子设备和存储介质
CN113421579B (zh) * 2021-06-30 2024-06-07 北京小米移动软件有限公司 声音处理方法、装置、电子设备和存储介质

Also Published As

Publication number Publication date
CN110838300B (zh) 2022-03-25

Similar Documents

Publication Publication Date Title
CN110838300B (zh) 回声消除的处理方法及处理系统
US8023641B2 (en) Spectral domain, non-linear echo cancellation method in a hands-free device
JP4257113B2 (ja) 音響エコーの相殺および抑制を実行する利得制御方法
US8311234B2 (en) Echo canceller and communication audio processing apparatus
EP1356589B1 (en) Asymmetric multichannel filter
US20080170706A1 (en) Method And Device For Removing Echo In A Multi-Channel Audio Signal
CN109273019B (zh) 用于回声抑制的双重通话检测的方法及回声抑制
US8798290B1 (en) Systems and methods for adaptive signal equalization
KR20040030817A (ko) 통신 시스템, 에코 제거 수단 및 에코 제거 방법
US8693678B2 (en) Device and method for controlling damping of residual echo
KR20100053502A (ko) 오디오 신호들을 처리하는 디바이스 및 방법
JP4457639B2 (ja) エコーキャンセラ
CN110956975B (zh) 回声消除方法及装置
US8964967B2 (en) Subband domain echo masking for improved duplexity of spectral domain echo suppressors
JP3420705B2 (ja) エコー抑圧方法及び装置並びにエコー抑圧プログラムが記憶されたコンピュータに読取り可能な記憶媒体
US9020144B1 (en) Cross-domain processing for noise and echo suppression
CN107005268B (zh) 回波消除装置和回波消除方法
US6108412A (en) Adaptive echo cancelling system for telephony applications
US8369511B2 (en) Robust method of echo suppressor
JP4396449B2 (ja) 残響除去方法及びその装置
JP2008263441A (ja) 非線形エコーキャンセラ装置
EP1518393A1 (en) Non stationary echo canceller
JPH0459812B2 (zh)
CN113921029A (zh) 一种应用于回声消除的双端发声检测的方法
CN117238306A (zh) 一种基于双麦克风的语音活动检测与环境噪声消除方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant