CN112017679B - 用于自适应滤波器系数更新的方法及装置、设备 - Google Patents

用于自适应滤波器系数更新的方法及装置、设备 Download PDF

Info

Publication number
CN112017679B
CN112017679B CN202010778388.3A CN202010778388A CN112017679B CN 112017679 B CN112017679 B CN 112017679B CN 202010778388 A CN202010778388 A CN 202010778388A CN 112017679 B CN112017679 B CN 112017679B
Authority
CN
China
Prior art keywords
signal
end signal
far
echo
adaptive filter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010778388.3A
Other languages
English (en)
Other versions
CN112017679A (zh
Inventor
黄华
马路
赵培
苏腾荣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Haier Uplus Intelligent Technology Beijing Co Ltd
Original Assignee
Haier Uplus Intelligent Technology Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Haier Uplus Intelligent Technology Beijing Co Ltd filed Critical Haier Uplus Intelligent Technology Beijing Co Ltd
Priority to CN202010778388.3A priority Critical patent/CN112017679B/zh
Publication of CN112017679A publication Critical patent/CN112017679A/zh
Application granted granted Critical
Publication of CN112017679B publication Critical patent/CN112017679B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0224Processing in the time domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)

Abstract

本申请涉及语音信号处理技术领域,公开一种用于自适应滤波器系数更新的方法。包括:获取近端信号和参考回声信号;将参考回声信号输入预设的自适应滤波器获得估计的回声信号;根据近端信号和估计的回声信号获取误差信号;对远端信号和近端信号进行双讲检测;在远端信号中存在语音信号且近端信号中不存在语音信号的情况下,对误差信号作非线性处理,根据误差信号和非线性处理后的残余回声获取最优步长;根据最优步长、远端信号和误差信号对自适应滤波器的滤波系数进行更新。该方法能够提高自适应滤波器对线性回声消除的鲁棒性,提升线性回声的消除效果。本申请还公开一种用于自适应滤波器系数更新的装置及设备。

Description

用于自适应滤波器系数更新的方法及装置、设备
技术领域
本申请涉及语音信号处理技术领域,例如涉及一种用于自适应滤波器系数更新的方法及装置、设备。
背景技术
语音信号处理技术是当今人机交互领域的一项关键技术,而回声消除可以实现对麦克风阵列采集到的扬声器播放的声音进行消除,得到较纯净的音频,对后端的语音唤醒或语音识别具有极其重要的作用,是语音信号处理的关键技术。由于回声路径是未知的,无法直接求取回声信号,因此现有技术将远端信号经过自适应滤波器来估计回声信号。
在实现本公开实施例的过程中,发现相关技术中至少存在如下问题:由于传统基于自适应滤波器的回声消除方法常采用预设固定步长更新滤波器系数,回声消除效果很大程度上依赖于步长选择,因此当回声信号不稳定时,固定步长使得自适应滤波器收敛过慢或发散导致回声线性部分消除鲁棒性不强,效果不佳。
发明内容
为了对披露的实施例的一些方面有基本的理解,下面给出了简单的概括。所述概括不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围,而是作为后面的详细说明的序言。
本公开实施例提供了一种用于自适应滤波器系数更新的方法、装置和设备,以能够提高线性回声消除的鲁棒性。
在一些实施例中,所述用于自适应滤波器系数更新的方法,包括:
获取近端信号和参考回声信号;
将所述参考回声信号输入预设的自适应滤波器获得估计的回声信号;
根据所述近端信号和所述估计的回声信号获取误差信号;
对远端信号和所述近端信号进行双讲检测;
在所述远端信号中存在语音信号且所述近端信号中不存在语音信号的情况下,对所述误差信号作非线性处理,根据所述误差信号和非线性处理后的残余回声获取最优步长;
根据所述最优步长、所述远端信号和所述误差信号对所述自适应滤波器的滤波系数进行更新。
在一些实施例中,根据所述近端信号和所述估计的回声信号获取误差信号,包括:
将所述近端信号减去所述估计的回声信号获得误差信号。
在一些实施例中,通过预设算法利用所述误差信号和非线性处理后的残余回声进行计算获得最优步长,包括:
获取所述误差信号的方差、获取所述残余回声的方差;
将所述误差信号的方差与所述残余回声的方差之比作为最优步长。
在一些实施例中,对所述误差信号作非线性处理后,还包括:
输出非线性处理后的误差信号。
在一些实施例中,对远端信号和所述近端信号进行双讲检测后,还包括:
在所述远端信号中不存在语音信号的情况下,直接输出所述近端语音信号。
在一些实施例中,对远端信号和所述近端信号进行双讲检测后,还包括:
在所述远端信号中存在语音信号且所述近端信号中存在语音信号的情况下,对所述误差信号作非线性处理,输出非线性处理后的误差信号。
在一些实施例中,获取近端信号和参考回声信号后,还包括:
分别对所述近端信号和所述参考回声信号进行时-频域信号变换。
在一些实施例中,对所述误差信号作非线性处理后,还包括:
将非线性处理后的误差信号变换到时域后输出。
在一些实施例中,所述用于自适应滤波器系数更新的装置,包括处理器和存储有程序指令的存储器,所述处理器被配置为在执行所述程序指令时,执行上述的用于自适应滤波器系数更新的方法。
在一些实施例中,所述设备,包括上述的用于自适应滤波器系数更新的装置。
本公开实施例提供的用于自适应滤波器系数更新的方法及装置、设备,可以实现以下技术效果:通过对近端信号和远端信号进行双讲检测,在远端信号中存在语音信号且近端信号中不存在语音信号的情况下,对误差信号作非线性处理,根据误差信号和非线性处理后的残余回声获取最优步长,并根据最优步长、远端信号和误差信号对所述自适应滤波器的滤波系数进行更新,这样能够提高自适应滤波器对线性回声消除的鲁棒性,提升线性回声的消除效果,同时,在远端信号中存在语音信号且近端信号中不存在语音信号的情况下对误差信号作非线性处理,可以更好的抑制因近端语音存在而导致自适应滤波器状态发散,进而能够提高利用更新后的自适应滤波器进行回声消除时的整体效果。
以上的总体描述和下文中的描述仅是示例性和解释性的,不用于限制本申请。
附图说明
一个或多个实施例通过与之对应的附图进行示例性说明,这些示例性说明和附图并不构成对实施例的限定,附图中具有相同参考数字标号的元件示为类似的元件,附图不构成比例限制,并且其中:
图1是本公开实施例提供的一个用于自适应滤波器系数更新的方法的示意图;
图2是本公开实施例提供的另一个用于自适应滤波器系数更新的方法的示意图;
图3是本公开实施例提供的一个用于自适应滤波器系数更新的装置的示意图。
具体实施方式
为了能够更加详尽地了解本公开实施例的特点与技术内容,下面结合附图对本公开实施例的实现进行详细阐述,所附附图仅供参考说明之用,并非用来限定本公开实施例。在以下的技术描述中,为方便解释起见,通过多个细节以提供对所披露实施例的充分理解。然而,在没有这些细节的情况下,一个或多个实施例仍然可以实施。在其它情况下,为简化附图,熟知的结构和装置可以简化展示。
本公开实施例的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开实施例的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含。
除非另有说明,术语“多个”表示两个或两个以上。
本公开实施例中,字符“/”表示前后对象是一种“或”的关系。例如,A/B表示:A或B。
术语“和/或”是一种描述对象的关联关系,表示可以存在三种关系。例如,A和/或B,表示:A或B,或,A和B这三种关系。
结合图1所示,本公开实施例提供一种用于自适应滤波器系数更新的方法,包括:
步骤S101,获取近端信号和参考回声信号;
步骤S102,将参考回声信号输入预设的自适应滤波器获得估计的回声信号;
步骤S103,根据近端信号和估计的回声信号获取误差信号;
步骤S104,对远端信号和近端信号进行双讲检测;
步骤S105,在远端信号中存在语音信号且近端信号中不存在语音信号的情况下,对误差信号作非线性处理,根据误差信号和非线性处理后的残余回声获取最优步长;
步骤S106,根据最优步长、远端信号和误差信号对自适应滤波器的滤波系数进行更新。
采用本公开实施例提供的用于自适应滤波器系数更新的方法,通过对近端信号和远端信号进行双讲检测,在远端信号中存在语音信号且近端信号中不存在语音信号的情况下,对误差信号作非线性处理,根据误差信号和非线性处理后的残余回声获取最优步长,并根据最优步长、远端信号和误差信号对所述自适应滤波器的滤波系数进行更新,这样能够提高自适应滤波器对线性回声消除的鲁棒性,提升线性回声的消除效果,同时,在远端信号中存在语音信号且近端信号中不存在语音信号的情况下对误差信号作非线性处理,可以更好的抑制因近端语音存在而导致自适应滤波器状态发散,进而能够提高利用更新后的自适应滤波器进行回声消除时的整体效果。
可选地,获取近端信号和参考回声信号,包括:通过麦克风采集带有回声信号的语音信号,将带有回声信号的语音信号为近端信号;通过麦克风采集扬声器播放的远端信号,将麦克风采集到的扬声器播放的远端信号为参考回声信号。
可选地,获取近端信号和参考回声信号后,还包括:分别对近端信号和参考回声信号进行时-频域信号变换。
可选地,对获取到的近端语音信号和参考回声信号分别做时-频域变换,将时域的近端语音信号和参考回声信号分别变换到频域。
可选地,根据近端信号和估计的回声信号获取误差信号,包括:将近端信号减去估计的回声信号获得误差信号。
可选地,将参考回声信号输入预设的自适应滤波器获得估计的回声信号,从麦克风采集到的近端信号中减去估计的回声信号得到误差信号。
可选地,对远端信号和近端信号进行双讲检测,获取双讲检测结果;该双讲检测结果包括只是近端信号中存在语音信号,或,只是远端信号中存在语音信号,或,远端信号中存在语音信号且近端信号中也存在语音信号。
可选地,对近端信号和远端信号进行双讲检测,包括:根据近端信号与远端信号的相关性及能量判断近端信号和远端信号的状态。
可选地,判断近端信号和远端信号的回声能量是否大于近端信号和远端信号的回声抵消输出能量的两倍与第一阈值的和;
若该回声能量不大于回声抵消输出能量的两倍与第一阈值的和,则根据回声能量是否小于近端信号的背景噪声能量的两倍与第二阈值的和判断近端信号中是否存在语音信号;
若回声能量不小于背景噪声能量的两倍与第二阈值的和,则近端信号中存在语音信号,并根据远端信号中的参考信号是否小于通过语音活动帧测获取的远端噪音能量的两倍与第三阈值的和判断远端信号中是否存在语音信号,该参考信号为远端信号中的语音信号经过网络传输还未经过扬声器播放的语音信号;
若该参考信号小于远端噪音能量的两倍与第三阈值的和,则远端信号中不存在语音信号,该双讲检测结果为近端单讲,即只是近端信号中存在语音信号;
若该参考信号不小于远端噪音能量的两倍与第三阈值的和,则远端信号中存在语音信号,该双讲检测结果为双讲,即远端信号中存在语音信号且近端信号中也存在语音信号。
可选地,通过对近端信号和远端信号进行双讲检测,获取双讲检测结果还包括:若回声能量大于回声抵消输出能量的两倍与第一阈值的和,根据回声能量是否小于背景噪声能量的两倍与第二阈值的和判断所述近端是否讲话;若回声能量小于背景噪声能量的两倍与第二阈值的和,则近端信号中不存在语音信号,该双讲检测结果为远端单讲,即只是远端信号中存在语音信号。这样,能够更加有利于判断近端信号和远端信号的状态。
可选地,在远端信号中存在语音信号且近端信号中不存在语音信号的情况下,对误差信号作非线性处理,并更新最优步长和滤波系数,然后输出非线性处理后的误差信号。
可选地,对误差信号作非线性处理,包括:对远端信号x、麦克风采集的近端信号d、估计的回声信号y和误差信号e分别进行傅里叶变换,得到对应频域的远端信号xf(n)、频域的近端信号df(n)、频域的估计回声信号yf(n)和频域的误差信号ef(n),其中,n代表频点标号;
对各频域信号xf(n)、df(n)、yf(n)与ef(n)在每个频点n上进行相关性计算,分别求出每个频点xf(n)与df(n)、yf(n)与df(n)、df(n)与ef(n)的互相关系数cohxd(n)′、cohyd(n)′和cohde(n)′;
可选地,计算每个频点xf(n)与df(n)、yf(n)与df(n)、df(n)与ef(n)的互功率谱Sxd(n)、Syd(n)和Sde(n),
通过计算Sxd(n)=xf(n)·conj(df(n))获得xf(n)与df(n)的互功率谱Sxd(n);
通过计算Syd(n)=yf(n)·conj(df(n))获得yf(n)与df(n)的互功率谱Syd(n);
通过计算Sde(n)=df(n)·conj(ef(n))获得df(n)与ef(n)的互功率谱Sde(n);
其中,conj为取共轭符号;
计算每个频点xf(n)与df(n)、yf(n)与df(n)、df(n)与ef(n)的互相关系数cohxd(n)′、cohyd(n)′和cohde(n)′,
通过计算获得xf(n)与df(n)的互相关系数cohxd(n)′;
通过计算获得yf(n)与df(n)的互相关系数cohyd(n)′;
通过计算获得df(n)与ef(n)的互相关系数cohde(n)′;
通过平滑系数smooth对互相关系数cohxd(n)′、cohyd(n)′和cohde(n)′进行平滑处理,得到平滑后的互相关系数cohxd(n)、cohyd(n)和cohde(n);
对平滑后的互相关系数cohxd(n)、cohyd(n)和cohde(n)求均值,选择较易产生回声的频点范围,计算平滑后的互相关性系数的均值,得到AvgCohXD(n)、AvgCohYD(n)和AvgCohDE(n),
通过计算获得平滑后的互相关系数cohxd(n)的均值AvgCohXD(n);
通过计算获得平滑后的互相关系数cohyd(n)的均值AvgCohYD(n);
通过计算获得平滑后的互相关系数cohde(n)的均值AvgCohDE(n);
其中,l为下限频点,l+m为上限频点,m为计算均值所使用的频点数,l和m均为正整指数;
根据AvgCohXD(n)、AvgCohYD(n)和AvgCohDE(n)互相关性系数均值,构建非线性回声抑制函数f(n),
通过计算f(n)=hkl(n)overdrive(n)*curve(n)获得非线性回声抑制函数f(n),
其中,overdrive(n)为抑制程度系数,curve(n)为各频点的预设抑制曲线,hkl(n)根据互相关性系数均值选取;
可选地,hkl(n)的选取过程包括:若AvgCohXD(n)<阈值1,且AvgCohDE(n)>阈值2,则说明远端信号x的音量小,按照无回声状态处理,hkl(n)取每个频点n的互相关系数cohde(n),抑制程度系数overdrive(n)取常数Coef1,表示无回声时抑制程度最小;若AvgCohXD(n)>阈值1,或AvgCohDE(n)<阈值2,则说明远端信号x存在,按照有回声状态处理,hkl(n)根据每个频点n的1-cohxd(n)计算抑制程度系数overdrive(n);
通过计算获得抑制程度系数overdrive(n);
其中,Wxd、Wyd和Wde分别代表互相关系数cohxd(n)、cohyd(n)和cohde(n)对抑制程度系数overdrive(n)计算所贡献的权重系数,取值均为0至1之间;
通过非线性回声抑制函数f(n),对频点n的误差信号ef(n)进行非线性回声处理,得到非线性回声抑制后的残余回声输出信号ef(n)′;
通过计算ef(n)′=ef(n)·f(n)获得非线性回声抑制后的参与回声ef(n)′。
这样,通过计算近端信号与远端信号的互相关系数,根据互相关系数和阀值更新权重系数,然后再由权重系数调整误差信号的值,对误差信号进行非线性处理,能够对残余的非线性回声进行有效的消除,从而提高非线性残余回声消除的效果。
可选地,通过预设算法利用误差信号和非线性处理后的残余回声进行计算获得最优步长,包括:获取误差信号的方差、获取残余回声的方差;将误差信号的方差与残余回声的方差之比作为最优步长β。这样,通过残余回声对自适应步长进行更新,能够提高自适应滤波对线性回声消除的鲁棒性,提升线性回声的消除效果。
可选地,根据最优步长β、远端信号xf(n)和误差信号ef(n)对自适应滤波器的滤波系数进行更新,包括:
通过计算获得更新后的自适应滤波器的滤波系数/>
其中,为更新后的自适应滤波器的滤波系数,ωk(n)为预设的自适应滤波器的滤波系数,ξ为泄露因子,可选地,ξ=1-2-26,/>为远端信号能量,β为最优步长,xf(n)为频域的远端信号,ef(n)为频域的误差信号。
可选地,通过计算获得频点n的远端信号能量;
其中,为频点n的远端信号能量,/>为频点n-1的远端信号能量,α=1/256。
这样,通过对滤波系数进行更新,能够提高自适应滤波器对线性回声消除的鲁棒性,提升线性回声的消除效果。并且在远端信号中存在语音信号且近端信号中不存在语音信号的情况下对误差信号作非线性处理,可以更好的抑制因近端语音存在而导致自适应滤波器状态发散,进而能够提高利用更新后的自适应滤波器进行回声消除时的整体效果。
可选地,对误差信号作非线性处理后,还包括:输出非线性处理后的误差信号。
这样,通过对误差信号进行非线性处理后,能够对残余的非线性回声进行有效的消除,提高回声消除性能,从而提高语音唤醒的成功率和语音识别准确率。
可选地,对远端信号和近端信号进行双讲检测后,还包括:在远端信号中不存在语音信号的情况下,直接输出近端语音信号。
可选地,在远端信号中不存在语音信号,即没有回声的情况下,不对远端信号进行自适应滤波处理也不对近端信号进行非线性处理,将近端信号中的语音信号变换到时域后直接输出。
可选地,对远端信号和近端信号进行双讲检测后,还包括:在远端信号中存在语音信号且近端信号中存在语音信号的情况下,对误差信号作非线性处理,输出非线性处理后的误差信号。这样,对近端信号中存在语音信号的情况下,不更新滤波器系数,避免引起自适应滤波器误调,导致算法发散。
可选地,对误差信号作非线性处理后,还包括:将非线性处理后的误差信号变换到时域后输出。
本公开实施例提供的用于自适应滤波器系数更新的方法,通过对近端信号和远端信号进行双讲检测,在远端信号中存在语音信号且近端信号中不存在语音信号的情况下,对误差信号作非线性处理,根据误差信号和非线性处理后的残余回声获取最优步长,并根据最优步长、远端信号和误差信号对自适应滤波器的滤波系数进行更新。这样,基于双讲检测结果进行决策,选择性的对步长进行调整选择最优步长,以对滤波系数进行更新,从而对线性回声进行消除;并通过非线性处理对残余非线性回声进行消除,从而提高了线性回声消除的鲁棒性与非线性回声消除的效果。同时,在远端信号中存在语音信号且近端信号中不存在语音信号的情况下对误差信号作非线性处理,可以更好的抑制因近端语音存在而导致自适应滤波器状态发散,进而能够提高利用更新后的自适应滤波器进行回声消除时的整体效果。
结合图2所示,在实际应用中,本公开实施例提供的用于自适应滤波器系数更新的方法包括:
将麦克风阵列采集到的回声信号和带噪声的语音信号v(n)为近端信号d(n),可选地,该回声信号为麦克风阵列采集到的扬声器播放的远端信号,即参考回声信号;
对近端语音信号和参考回声信号分别做时-频变换,从时域的近端语音信号和参考回声信号变换到频域的近端语音信号和参考回声信号;
将参考回声信号通过预设的自适应滤波器ωk(n),得到估计的回声信号y(n);
从麦克风采集到的近端语音信号d(n)中减去估计的回声信号y(n)得到误差信号e(n);
对远端信号x(n)和近端信号d(n)进行双讲检测,获取双讲检测结果;该双讲检测结果包括只是近端信号中存在语音信号,或,只是远端信号中存在语音信号,或,远端信号中存在语音信号且近端信号中也存在语音信号;可选地,根据近端信号和远端信号的相关性及能量判断近端信号和远端信号的状态,即获得双讲检测结构;可选地,判断近端信号和远端信号的回声能量是否大于近端信号和远端信号的回声抵消输出能量的两倍与第一阈值的和;若该回声能量不大于回声抵消输出能量的两倍与第一阈值的和,则根据回声能量是否小于近端信号的背景噪声能量的两倍与第二阈值的和判断近端信号中是否存在语音信号;若回声能量不小于背景噪声能量的两倍与第二阈值的和,则近端信号中存在语音信号,并根据远端信号中的参考信号是否小于通过语音活动侦测获取的远端噪音能量的两倍与第三阈值的和判断远端信号中是否存在语音信号,该参考信号为远端信号中的语音信号经过网络传输还未经过扬声器播放的语音信号;若该参考信号小于远端噪音能量的两倍与第三阈值的和,则远端信号中不存在语音信号,该双讲检测结果为近端单讲,即只是近端信号中存在语音信号;若该参考信号不小于远端噪音能量的两倍与第三阈值的和,则远端信号中存在语音信号,该双讲检测结果为双讲,即远端信号中存在语音信号且近端信号中也存在语音信号;若回声能量大于回声抵消输出能量的两倍与第一阈值的和,根据回声能量是否小于背景噪声能量的两倍与第二阈值的和判断所述本地会场是否讲话;若回声能量小于背景噪声能量的两倍与第二阈值的和,则近端信号中不存在语音信号,该双讲检测结果为远端单讲,即只是远端信号中存在语音信号;
可选地,如果远端信号中不存在语音信号,即为没有回声的情况,则不进行自适应滤波和非线性处理,直接将频域的近端语音信号d(n)变换到时域并输出output时域的近端语音信号;可选地,如果远端信号中存在语音信号且近端信号中存在语音信号,则对误差信号进行NLP(Non-Linear Process)非线性处理,然后将非线性处理后的误差信号变换到时域并输出output非线性处理后的时域的误差信号,但不更新最优步长和滤波器系数;可选地,如果远端信号中存在语音信号,但近端信号中不存在语音信号,则对误差信号进行NLP(Non-Linear Process)非线性处理,然后将非线性处理后的误差信号变换到时域并输出output非线性处理后的时域的误差信号,并更新最优步长和更新自适应滤波器的滤波系数;
可选地,对误差信号进行非线性处理,包括:通过计算近端信号与远端信号的互相关系数,根据互相关系数和阀值更新权重系数,然后再由权重系数调整误差信号的值,能够对残余的非线性回声进行有效的消除,从而提高非线性残余回声消除的效果。
可选地,更新最优步长,包括:获取误差信号的方差和非线性处理后的残余回声r(n)的方差,将误差信号的方差与残余回声的方差之比作为最优步长;
可选地,更新自适应滤波器的滤波系数,包括:根据最优步长、远端信号和误差信号对自适应滤波器的滤波系数进行更新,获得更新后的自适应滤波器的滤波系数
这样,通过对自适应滤波器的滤波系数进行更新,能够提高自适应滤波器对线性回声消除的鲁棒性,提升线性回声的消除效果。并且在远端信号中存在语音信号且近端信号中不存在语音信号的情况下对误差信号作非线性处理,可以更好的抑制因近端语音存在而导致自适应滤波器状态发散,进而能够提高利用更新后的自适应滤波器进行回声消除时的整体效果。
结合图3所示,本公开实施例提供一种用于自适应滤波器系数更新的装置,包括处理器(processor)100和存储有程序指令的存储器(memory)101。可选地,该装置还可以包括通信接口(Communication Interface)102和总线103。其中,处理器100、通信接口102、存储器101可以通过总线103完成相互间的通信。通信接口102可以用于信息传输。处理器100可以调用存储器101中的程序指令,以执行上述实施例的用于自适应滤波器系数更新的方法。
此外,上述的存储器101中的程序指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。
存储器101作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序,如本公开实施例中的方法对应的程序指令/模块。处理器100通过运行存储在存储器101中的程序指令/模块,从而执行功能应用以及数据处理,即实现上述实施例中用于自适应滤波器系数更新的方法。
存储器101可包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端设备的使用所创建的数据等。此外,存储器101可以包括高速随机存取存储器,还可以包括非易失性存储器。
采用本公开实施例提供的用于自适应滤波器系数更新的装置,通过对近端信号和远端信号进行双讲检测,在远端信号中存在语音信号且近端信号中不存在语音信号的情况下,对误差信号作非线性处理,根据误差信号和非线性处理后的残余回声获取最优步长,并根据最优步长、远端信号和误差信号对所述自适应滤波器的滤波系数进行更新,这样能够提高自适应滤波器对线性回声消除的鲁棒性,提升线性回声的消除效果,同时,在远端信号中存在语音信号且近端信号中不存在语音信号的情况下对误差信号作非线性处理,可以更好的抑制因近端语音存在而导致自适应滤波器状态发散,进而能够提高利用更新后的自适应滤波器进行回声消除时的整体效果。
本公开实施例提供了一种设备,包含上述的用于自适应滤波器系数更新的装置。
可选地,该设备包括智能手机、平板电脑、智能电视、智能手表等可以语音通讯的智能终端。
该设备通过对近端信号和远端信号进行双讲检测,在远端信号中存在语音信号且近端信号中不存在语音信号的情况下,对误差信号作非线性处理,根据误差信号和非线性处理后的残余回声获取最优步长,并根据最优步长、远端信号和误差信号对所述自适应滤波器的滤波系数进行更新,这样能够提高自适应滤波器对线性回声消除的鲁棒性,提升线性回声的消除效果,同时,在远端信号中存在语音信号且近端信号中不存在语音信号的情况下对误差信号作非线性处理,可以更好的抑制因近端语音存在而导致自适应滤波器状态发散,进而能够提高利用更新后的自适应滤波器进行回声消除时的整体效果。
本公开实施例提供了一种计算机可读存储介质,存储有计算机可执行指令,计算机可执行指令设置为执行上述用于自适应滤波器系数更新的方法。
本公开实施例提供了一种计算机程序产品,计算机程序产品包括存储在计算机可读存储介质上的计算机程序,计算机程序包括程序指令,当程序指令被计算机执行时,使计算机执行上述用于自适应滤波器系数更新的方法。
上述的计算机可读存储介质可以是暂态计算机可读存储介质,也可以是非暂态计算机可读存储介质。
本公开实施例的技术方案可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括一个或多个指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本公开实施例所述方法的全部或部分步骤。而前述的存储介质可以是非暂态存储介质,包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等多种可以存储程序代码的介质,也可以是暂态存储介质。
以上描述和附图充分地示出了本公开的实施例,以使本领域的技术人员能够实践它们。其他实施例可以包括结构的、逻辑的、电气的、过程的以及其他的改变。实施例仅代表可能的变化。除非明确要求,否则单独的部件和功能是可选的,并且操作的顺序可以变化。一些实施例的部分和特征可以被包括在或替换其他实施例的部分和特征。而且,本申请中使用的用词仅用于描述实施例并且不用于限制权利要求。如在实施例以及权利要求的描述中使用的,除非上下文清楚地表明,否则单数形式的“一个”(a)、“一个”(an)和“所述”(the)旨在同样包括复数形式。类似地,如在本申请中所使用的术语“和/或”是指包含一个或一个以上相关联的列出的任何以及所有可能的组合。另外,当用于本申请中时,术语“包括”(comprise)及其变型“包括”(comprises)和/或包括(comprising)等指陈述的特征、整体、步骤、操作、元素,和/或组件的存在,但不排除一个或一个以上其它特征、整体、步骤、操作、元素、组件和/或这些的分组的存在或添加。在没有更多限制的情况下,由语句“包括一个…”限定的要素,并不排除在包括所述要素的过程、方法或者设备中还存在另外的相同要素。本文中,每个实施例重点说明的可以是与其他实施例的不同之处,各个实施例之间相同相似部分可以互相参见。对于实施例公开的方法、产品等而言,如果其与实施例公开的方法部分相对应,那么相关之处可以参见方法部分的描述。
本领域技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,可以取决于技术方案的特定应用和设计约束条件。所述技术人员可以对每个特定的应用来使用不同方法以实现所描述的功能,但是这种实现不应认为超出本公开实施例的范围。所述技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本文所披露的实施例中,所揭露的方法、产品(包括但不限于装置、设备等),可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,可以仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例。另外,在本公开实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
附图中的流程图和框图显示了根据本公开实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这可以依所涉及的功能而定。在附图中的流程图和框图所对应的描述中,不同的方框所对应的操作或步骤也可以以不同于描述中所披露的顺序发生,有时不同的操作或步骤之间不存在特定的顺序。例如,两个连续的操作或步骤实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这可以依所涉及的功能而定。框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

Claims (10)

1.一种用于自适应滤波器系数更新的方法,其特征在于,包括:
获取近端信号和参考回声信号;
将所述参考回声信号输入预设的自适应滤波器获得估计的回声信号;
根据所述近端信号和所述估计的回声信号获取误差信号;
对远端信号和所述近端信号进行双讲检测;
在所述远端信号中存在语音信号且所述近端信号中不存在语音信号的情况下,对所述误差信号作非线性处理,根据所述误差信号和非线性处理后的残余回声获取最优步长;
根据所述最优步长、所述远端信号和所述误差信号对所述自适应滤波器的滤波系数进行更新;
根据最优步长、远端信号和误差信号对自适应滤波器的滤波系数进行更新,包括:通过计算获得更新后的自适应滤波器的滤波系数/>,其中,/>为更新后的自适应滤波器的滤波系数,/>为预设的自适应滤波器的滤波系数,/>为泄露因子,/>,/>为远端信号能量,/>为最优步长,/>为频域的远端信号,/>是对远端信号进行傅里叶变换获得的;/>为频域的误差信号,是对误差信号进行傅里叶变换获得的;通过计算 />获得频点n的远端信号能量;其中,/>为频点n的远端信号能量,/>为频点n-1的远端信号能量,/>
2.根据权利要求1所述的方法,其特征在于,根据所述近端信号和所述估计的回声信号获取误差信号,包括:
将所述近端信号减去所述估计的回声信号获得误差信号。
3.根据权利要求1所述的方法,其特征在于,通过预设算法利用所述误差信号和非线性处理后的残余回声进行计算获得最优步长,包括:
获取所述误差信号的方差、获取所述残余回声的方差;
将所述误差信号的方差与所述残余回声的方差之比作为最优步长。
4.根据权利要求1所述的方法,其特征在于,对所述误差信号作非线性处理后,还包括:
输出非线性处理后的误差信号。
5.根据权利要求1所述的方法,其特征在于,对远端信号和所述近端信号进行双讲检测后,还包括:
在所述远端信号中不存在语音信号的情况下,直接输出所述近端信号。
6.根据权利要求1所述的方法,其特征在于,对远端信号和所述近端信号进行双讲检测后,还包括:
在所述远端信号中存在语音信号且所述近端信号中存在语音信号的情况下,对所述误差信号作非线性处理,输出非线性处理后的误差信号。
7.根据权利要求1至6任一项所述的方法,其特征在于,获取近端信号和参考回声信号后,还包括:
分别对所述近端信号和所述参考回声信号进行时-频域信号变换。
8.根据权利要求7所述的方法,其特征在于,对所述误差信号作非线性处理后,还包括:
将非线性处理后的误差信号变换到时域后输出。
9.一种用于自适应滤波器系数更新的装置,包括处理器和存储有程序指令的存储器,其特征在于,所述处理器被配置为在执行所述程序指令时,执行如权利要求1至8任一项所述的用于自适应滤波器系数更新的方法。
10.一种用于自适应滤波器系数更新的设备,其特征在于,包括如权利要求9所述的用于自适应滤波器系数更新的装置。
CN202010778388.3A 2020-08-05 2020-08-05 用于自适应滤波器系数更新的方法及装置、设备 Active CN112017679B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010778388.3A CN112017679B (zh) 2020-08-05 2020-08-05 用于自适应滤波器系数更新的方法及装置、设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010778388.3A CN112017679B (zh) 2020-08-05 2020-08-05 用于自适应滤波器系数更新的方法及装置、设备

Publications (2)

Publication Number Publication Date
CN112017679A CN112017679A (zh) 2020-12-01
CN112017679B true CN112017679B (zh) 2024-01-26

Family

ID=73499197

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010778388.3A Active CN112017679B (zh) 2020-08-05 2020-08-05 用于自适应滤波器系数更新的方法及装置、设备

Country Status (1)

Country Link
CN (1) CN112017679B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113225442B (zh) * 2021-04-16 2022-09-02 杭州网易智企科技有限公司 一种消除回声的方法及装置
CN113223547B (zh) * 2021-04-30 2024-05-24 杭州网易智企科技有限公司 双讲检测方法、装置、设备和介质
CN113783551A (zh) * 2021-08-06 2021-12-10 浙江大华技术股份有限公司 滤波器系数确定方法、回声消除方法及装置
CN114299979A (zh) * 2021-12-09 2022-04-08 西安讯飞超脑信息科技有限公司 回声消除方法及相关装置、设备和存储介质
CN114650340B (zh) * 2022-04-21 2024-07-02 深圳市中科蓝讯科技股份有限公司 一种回声消除方法、装置及电子设备
CN115643342A (zh) * 2022-10-14 2023-01-24 巨人移动技术有限公司 一种回声消除方法
CN116610903B (zh) * 2023-07-14 2023-10-10 国网山西省电力公司营销服务中心 一种电气量矢量估算方法、装置及计算机可读存储介质

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007130765A2 (en) * 2006-05-04 2007-11-15 Sony Computer Entertainment Inc. Echo and noise cancellation
KR20110109470A (ko) * 2010-03-31 2011-10-06 부산대학교 산학협력단 적응 필터의 수렴을 이용한 음향 반향 제거 장치 및 방법
CN107026950A (zh) * 2017-05-04 2017-08-08 重庆第二师范学院 一种频域自适应回声消除方法
CN107071196A (zh) * 2017-05-04 2017-08-18 重庆第二师范学院 一种自适应回声消除方法
CN107123430A (zh) * 2017-04-12 2017-09-01 广州视源电子科技股份有限公司 回声消除方法、装置、会议平板及计算机存储介质
CN107134281A (zh) * 2017-05-04 2017-09-05 重庆第二师范学院 一种自适应回声消除中自适应滤波器系数更新方法
CN107483761A (zh) * 2016-06-07 2017-12-15 电信科学技术研究院 一种回波抑制方法及装置
CN108010536A (zh) * 2017-12-05 2018-05-08 深圳市声扬科技有限公司 回声消除方法、装置、系统及存储介质
CN109087665A (zh) * 2018-07-06 2018-12-25 南京时保联信息科技有限公司 一种非线性回声抑制方法
CN109785853A (zh) * 2019-03-11 2019-05-21 出门问问信息科技有限公司 一种回声消除方法、装置、系统及存储介质
WO2019112467A1 (en) * 2017-12-08 2019-06-13 Huawei Technologies Co., Ltd. Method and apparatus for acoustic echo cancellation
CN110838300A (zh) * 2019-11-18 2020-02-25 紫光展锐(重庆)科技有限公司 回声消除的处理方法及处理系统
CN111083297A (zh) * 2019-11-14 2020-04-28 维沃移动通信(杭州)有限公司 一种回声消除方法及电子设备
CN111445917A (zh) * 2020-03-17 2020-07-24 浙江大华技术股份有限公司 一种回声消除方法、装置以及计算机存储介质

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007130765A2 (en) * 2006-05-04 2007-11-15 Sony Computer Entertainment Inc. Echo and noise cancellation
KR20110109470A (ko) * 2010-03-31 2011-10-06 부산대학교 산학협력단 적응 필터의 수렴을 이용한 음향 반향 제거 장치 및 방법
CN107483761A (zh) * 2016-06-07 2017-12-15 电信科学技术研究院 一种回波抑制方法及装置
CN107123430A (zh) * 2017-04-12 2017-09-01 广州视源电子科技股份有限公司 回声消除方法、装置、会议平板及计算机存储介质
CN107071196A (zh) * 2017-05-04 2017-08-18 重庆第二师范学院 一种自适应回声消除方法
CN107134281A (zh) * 2017-05-04 2017-09-05 重庆第二师范学院 一种自适应回声消除中自适应滤波器系数更新方法
CN107026950A (zh) * 2017-05-04 2017-08-08 重庆第二师范学院 一种频域自适应回声消除方法
CN108010536A (zh) * 2017-12-05 2018-05-08 深圳市声扬科技有限公司 回声消除方法、装置、系统及存储介质
WO2019112467A1 (en) * 2017-12-08 2019-06-13 Huawei Technologies Co., Ltd. Method and apparatus for acoustic echo cancellation
CN109087665A (zh) * 2018-07-06 2018-12-25 南京时保联信息科技有限公司 一种非线性回声抑制方法
CN109785853A (zh) * 2019-03-11 2019-05-21 出门问问信息科技有限公司 一种回声消除方法、装置、系统及存储介质
CN111083297A (zh) * 2019-11-14 2020-04-28 维沃移动通信(杭州)有限公司 一种回声消除方法及电子设备
CN110838300A (zh) * 2019-11-18 2020-02-25 紫光展锐(重庆)科技有限公司 回声消除的处理方法及处理系统
CN111445917A (zh) * 2020-03-17 2020-07-24 浙江大华技术股份有限公司 一种回声消除方法、装置以及计算机存储介质

Also Published As

Publication number Publication date
CN112017679A (zh) 2020-12-01

Similar Documents

Publication Publication Date Title
CN112017679B (zh) 用于自适应滤波器系数更新的方法及装置、设备
CN109727604B (zh) 用于语音识别前端的频域回声消除方法及计算机储存介质
CN101719969B (zh) 判断双端对话的方法、系统以及消除回声的方法和系统
CN112863535B (zh) 一种残余回声及噪声消除方法及装置
JP4377952B1 (ja) 適応フィルタ及びこれを有するエコーキャンセラ
van Waterschoot et al. Double-talk-robust prediction error identification algorithms for acoustic echo cancellation
CN113808602A (zh) 语音增强方法、模型训练方法以及相关设备
CN106157964A (zh) 一种确定回声消除中系统延时的方法
JPWO2012153452A1 (ja) エコー消去装置およびエコー検出装置
CN109785853B (zh) 一种回声消除方法、装置、系统及存储介质
CN112602150A (zh) 噪声估计方法、噪声估计装置、语音处理芯片以及电子设备
CN106558314A (zh) 一种混音处理方法和装置及设备
CN111179931A (zh) 用于语音交互的方法、装置及家用电器
CN107071197B (zh) 一种基于全相位多延迟分块频域的回音消除方法及系统
CN111755020A (zh) 一种立体声回声消除方法
CN111989934B (zh) 回声消除装置、回声消除方法、信号处理芯片及电子设备
CN109920444A (zh) 回声时延的检测方法、装置以及计算机可读存储介质
CN111028855A (zh) 回声抑制方法、装置、设备及存储介质
CN103327201A (zh) 残留回声消除方法及系统
CN100524464C (zh) 一种提高移动通信设备语音质量的自适应滤波方法及装置
Gänsler A double-talk resistant subband echo canceller
CN111370016B (zh) 一种回声消除方法及电子设备
Paleologu et al. A Kalman filter with individual control factors for echo cancellation
CN111883155B (zh) 回声消除方法、装置及存储介质
CN115620737A (zh) 语音信号处理装置、方法、电子设备和扩音系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant