CN113838474B - 通信系统啸叫抑制方法和装置 - Google Patents

通信系统啸叫抑制方法和装置 Download PDF

Info

Publication number
CN113838474B
CN113838474B CN202111415588.3A CN202111415588A CN113838474B CN 113838474 B CN113838474 B CN 113838474B CN 202111415588 A CN202111415588 A CN 202111415588A CN 113838474 B CN113838474 B CN 113838474B
Authority
CN
China
Prior art keywords
signal
sub
acoustic feedback
band
spectrum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111415588.3A
Other languages
English (en)
Other versions
CN113838474A (zh
Inventor
梁民
赵元军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
G Net Cloud Service Co Ltd
Original Assignee
G Net Cloud Service Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by G Net Cloud Service Co Ltd filed Critical G Net Cloud Service Co Ltd
Priority to CN202111415588.3A priority Critical patent/CN113838474B/zh
Publication of CN113838474A publication Critical patent/CN113838474A/zh
Application granted granted Critical
Publication of CN113838474B publication Critical patent/CN113838474B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephone Function (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明公开了一种通信系统啸叫抑制方法和装置。所述方法包括:根据预设的参考信号和麦克风接收信号各自的子带谱,估计声学反馈抑制增益函数;对所述声学反馈抑制增益函数进行时域变换后,用以对所述麦克风接收信号进行时域滤波。本发明通过估计的声学反馈抑制增益函数时域变换得到的线性滤波器系数矢量对麦克风接收信号进行时域滤波,从而对麦克风接收信号中的声学反馈信号的抑制,进而实现了啸叫现象的抑制。

Description

通信系统啸叫抑制方法和装置
技术领域
本发明涉及在线会议技术领域,尤其涉及一种通信系统啸叫抑制方法和装置。
背景技术
在图1所示的通信系统中,当一个会议客户端用户A发话时,其邻近的会议客户端用户B的接收信号u(n)通过它的外放扬声器并经空间声学反馈路径h1(n)不可避免地耦合至发话方会议客户端A的麦克风,由此构成图1中所示的闭环回路1;此外,会议客户端用户A发话时的语音信号也会经空间声学反馈路径耦合到用户B的麦克风、并经B的发送链路和通信网络传输而送回至用户A的外放扬声器,然后再次耦合到B的麦克风而构成另一闭环回路,为简便起见,该闭环回路在图1中未画;同样地,用户B发话时,其邻近的用户A接收信号也会通过它的外放扬声器经声学反馈路径耦合至用户B的麦克风,从而也构成一闭环回路,该闭环回路在图1中未画。而远程的收话方会议客户端用户C1的接收信号u1(n)通过它的外放扬声器并经声学反馈路径h2(n)耦合至其邻近的收话方会议客户端用户C2的麦克风,由此构成图1中所示的闭环回路2;同样地,用户C2的接收信号通过它的外放扬声器经声学反馈路径也耦合至用户C1的麦克风而构成另一闭环回路,在图1中也未画。这些闭环回路的存在,引发了通信系统的不稳定、并产生严重的啸叫,以致通信系统无法正常工作。
现有的处理方式通常是在会议客户端首先进行啸叫的检测,在检测到啸叫发生时,会议客户端对其发送链路信号进行静音(如果该客户端没有发言)或者限波处理。然而,这种基于啸叫检测的控制方案,其核心要求是准确而及时地检测到啸叫现象;而现有的啸叫检测技术均存在误检和滞后检测问题。在误检的情况下,虽然对会议客户端后续采用静音处理的技术方案危害不大,但会议客户端后续处理若采用限波技术方案,则危害极大。另一方面,啸叫的滞后检测问题是现有的啸叫检测技术普遍存在的缺陷,目前尚无克服该缺陷的解决方案;该缺陷则会给参会者带非常痛苦的体验,因为啸叫已经发生了,在会议客户端检测到啸叫并启动后续处理时至啸叫最终消失为止,需经历一定的时间。因此,有必要提供一种能够及时有效抑制啸叫现象的方案。
发明内容
为了解决上述问题,本发明提供了一种通信系统啸叫抑制方法和装置,能够通过对麦克风接收信号中的声学反馈信号的抑制,来实现通信系统中啸叫现象的抑制。
本发明的第一方面涉及一种通信系统啸叫抑制方法,包括:
根据预设的参考信号和麦克风接收信号各自的子带谱,估计声学反馈抑制增益函数;
对所述声学反馈抑制增益函数进行时域变换得到线性滤波器系数矢量,所述线性滤波器系数矢量用以对所述麦克风接收信号进行时域滤波。
可选地,所述根据预设的参考信号和麦克风接收信号各自的子带谱,估计声学反馈抑制增益函数,包括:
对预设的参考信号和麦克风接收信号进行延时对齐,得到已对齐的参考信号;
对所述已对齐的参考信号和所述麦克风接收信号进行子带域变换,得到已对齐的参考信号的子带谱和麦克风接收信号的子带谱;
根据所述已对齐的参考信号的子带谱和所述麦克风接收信号的子带谱,获得声学反馈信号的子带谱估计;根据所述麦克风接收信号的子带谱和估计的所述声学反馈信号的子带谱,进行声学反馈抑制增益函数的估计。
可选地,所述对预设的参考信号和麦克风接收信号进行延时对齐,得到已对齐的参考信号,包括:
根据所述参考信号和所述麦克风接收信号,进行自适应时延估计;其中,参与自适应时延估计的所述参考信号和所述麦克风接收信号经过白化滤波预处理;
根据自适应时延估计的时延参数进行时延对齐,得到已对齐的参考信号。
可选地,所述根据所述参考信号和所述麦克风接收信号,进行自适应时延估计,包括:
根据公式
Figure DEST_PATH_IMAGE001
进行自适应时延估计;
当用以表征声学反馈信号形成路径的有限冲击响应FIR滤波器
Figure 461252DEST_PATH_IMAGE002
收敛时,时延参数的估计为绝对值最大的系数所对应的索引
Figure DEST_PATH_IMAGE003
其中,
Figure 648651DEST_PATH_IMAGE004
为n时刻FIR滤波器的系数矢量,L为系数矢量维数;
Figure DEST_PATH_IMAGE005
为白化的参考信号矢量;
Figure 571607DEST_PATH_IMAGE006
为白化的麦克风接收信号;
Figure DEST_PATH_IMAGE007
Figure 819049DEST_PATH_IMAGE008
,
Figure DEST_PATH_IMAGE009
Figure 827456DEST_PATH_IMAGE010
为两个预设的递归常数,且
Figure DEST_PATH_IMAGE011
Figure 818546DEST_PATH_IMAGE012
为大于0的预设实常数;
Figure DEST_PATH_IMAGE013
为预设的学习率实常数;误差信号
Figure 584290DEST_PATH_IMAGE014
由公式
Figure DEST_PATH_IMAGE015
计算。
可选地,所述得到已对齐的参考信号之后,所述方法还包括:
对所述麦克风接收信号和所述已对齐的参考信号进行白化滤波处理;
对白化的麦克风接收信号,以及白化的已对齐的参考信号进行子带域变换,得到各自对应的子带谱;
相应地,所述根据所述已对齐的参考信号的子带谱和所述麦克风接收信号的子带谱,获得声学反馈信号的子带谱估计,包括:
根据所述麦克风接收信号的子带谱、所述白化的麦克风接收信号的子带谱,以及所述白化的已对齐的参考信号的子带谱,自适应估计声学反馈路径的子带谱传递函数;
根据所述声学反馈路径的子带谱传递函数和已对齐的参考信号的子带谱,获得声学反馈信号的子带谱估计。
可选地,所述根据所述麦克风接收信号的子带谱和估计的所述声学反馈信号的子带谱,进行声学反馈抑制增益函数的估计,包括:
根据估计的所述声学反馈信号的子带谱和所述麦克风接收信号的子带谱,获得子带域后验信噪比估计;
根据估计的所述子带域后验信噪比、前一帧的声学反馈抑制增益函数估计和预设自适应平滑参数,获得子带域先验信噪比估计;
根据公式
Figure 268213DEST_PATH_IMAGE016
,获得第k个子带第t帧时刻的声学反馈抑制增益函数
Figure DEST_PATH_IMAGE017
的估计;其中,
Figure 29495DEST_PATH_IMAGE018
为估计的第k个子带第t帧时刻的子带域先验信噪比。
可选地,所述对所述声学反馈抑制增益函数进行时域变换得到线性滤波器系数矢量包括:
对估计的所述声学反馈抑制增益函数进行时域变换,获得时域信号矢量;
利用预设的窗函数对所述时域信号矢量进行均衡,得到所述线性滤波器系数矢量。
本发明的第二方面涉及一种通信系统啸叫抑制装置,包括:
声学反馈抑制估计模块,用于根据预设的参考信号和麦克风接收信号各自的子带谱,估计声学反馈抑制增益函数;
线性滤波器系数生成模块,用于对所述声学反馈抑制增益函数进行时域变换得到线性滤波器系数矢量,所述线性滤波器系数矢量用以对所述麦克风接收信号进行时域滤波。
可选地,所述声学反馈抑制估计模块包括:
时域信号对齐单元,用于对预设的参考信号和麦克风接收信号进行延时对齐,得到已对齐的参考信号;
子带变频单元,用于对所述已对齐的参考信号和所述麦克风接收信号进行子带域变换,得到已对齐的参考信号的子带谱和麦克风接收信号的子带谱;
子带域处理单元,用于根据所述已对齐的参考信号的子带谱和所述麦克风接收信号的子带谱,获得声学反馈信号的子带谱估计;并根据所述麦克风接收信号的子带谱和估计的所述声学反馈信号的子带谱,进行声学反馈抑制增益函数的估计。
可选地,所述时域信号对齐单元用于根据所述参考信号和所述麦克风接收信号,进行自适应时延估计;其中,参与自适应时延估计的所述参考信号和所述麦克风接收信号经过白化滤波预处理;根据自适应时延估计的时延参数进行时延对齐,得到已对齐的参考信号。
可选地,所述时域信号对齐单元用于根据公式
Figure 355434DEST_PATH_IMAGE001
进行自适应时延估计;当用以表征声学反馈信号形成路径的有限冲击响应FIR滤波器
Figure 784142DEST_PATH_IMAGE002
收敛时,时延参数的估计为绝对值最大的系数所对应的索引
Figure 170124DEST_PATH_IMAGE003
其中,
Figure 418702DEST_PATH_IMAGE004
为n时刻FIR滤波器的系数矢量,L为系数矢量维数;
Figure 548332DEST_PATH_IMAGE005
为白化的参考信号矢量;
Figure 831546DEST_PATH_IMAGE006
为白化的麦克风接收信号;
Figure 388430DEST_PATH_IMAGE007
Figure 124304DEST_PATH_IMAGE008
,
Figure 792046DEST_PATH_IMAGE009
Figure 195346DEST_PATH_IMAGE010
为两个预设的递归常数,且
Figure 657551DEST_PATH_IMAGE011
Figure 146301DEST_PATH_IMAGE012
为大于0的预设实常数;
Figure 617734DEST_PATH_IMAGE013
为预设的学习率实常数;误差信号
Figure 875540DEST_PATH_IMAGE014
由公式
Figure 508646DEST_PATH_IMAGE015
计算。
可选地,所述时域信号对齐单元还用于对所述麦克风接收信号和所述已对齐的参考信号进行白化滤波处理;
相应地,所述子带变频单元还用于对白化的麦克风接收信号,以及白化的已对齐的参考信号进行子带域变换,得到各自对应的子带谱;
相应地,所述子带域处理单元包括:
子带谱传递函数估计子模块,用于根据所述麦克风接收信号的子带谱、所述白化的麦克风接收信号的子带谱,以及所述白化的已对齐的参考信号的子带谱,自适应估计声学反馈路径的子带谱传递函数;根据所述声学反馈路径的子带谱传递函数和已对齐的参考信号的子带谱,获得声学反馈信号的子带谱估计;
子带域抑制增益函数计算子模块,用于根据所述麦克风接收信号的子带谱和估计的所述声学反馈信号的子带谱,进行声学反馈抑制增益函数的估计。
可选地,所述子带域抑制增益函数计算子模块用于根据所述子带谱传递函数估计子模块估计的所述声学反馈信号的子带谱和所述麦克风接收信号的子带谱,获得子带域后验信噪比估计;根据估计的所述子带域后验信噪比、前一帧的声学反馈抑制增益函数估计和预设自适应平滑参数,获得子带域先验信噪比估计;根据公式
Figure 484693DEST_PATH_IMAGE016
,获得第k个子带第t帧时刻的声学反馈抑制增益函数
Figure 494237DEST_PATH_IMAGE017
的估计;其中,
Figure 606549DEST_PATH_IMAGE018
为估计的第k个子带第t帧时刻的子带域先验信噪比。
可选地,所述线性滤波器系数生成模块用于对所述子带域抑制增益函数计算子模块估计的所述声学反馈抑制增益函数进行时域变换,获得时域信号矢量;利用预设的窗函数对所述时域信号矢量进行均衡,得到所述线性滤波器系数矢量。
本发明的第三方面涉及一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如第一方面所述的方法。
本发明的第四方面涉及一种电子设备,包括存储器和处理器,所述存储器上存储有计算机程序,所述处理器执行所述程序时实现如第一方面所述的方法。
本发明根据预设的参考信号和麦克风接收信号各自的子带谱,估计声学反馈抑制增益函数,进而利用声学反馈抑制增益函数时域变换得到的线性滤波器系数矢量对麦克风接收信号进行时域滤波,实现对麦克风接收信号中的声学反馈信号的抑制,以此达到抑制通信系统啸叫现象的目的。
附图说明
图1为根据本发明一实施例的通信系统啸叫抑制方法的流程示意图;
图2为根据本发明一实施例的声学反馈信号形成的原理模型示意图;
图3为根据本发明一实施例的通信系统啸叫抑制方法的流程示意图;
图4为根据本发明一实施例的声学反馈抑制增益函数估计方法的流程示意图;
图5为根据本发明一实施例的时域信号对齐与白化预处理的结构框图;
图6为根据本发明一实施例的分析滤波器组的算法的示意图;
图7为根据本发明一实施例的通信系统啸叫抑制装置的结构示意图;
图8为根据本发明一实施例的声学反馈抑制估计模块的结构示意图;
图9为根据本发明一实施例的通信系统啸叫抑制器的原理系统框图;
图10为能够实施本发明实施例的示例性电子设备的方框示意图。
具体实施方式
为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案做详细的说明。
鉴于通信系统啸叫产生的场景可由图1来示意描述,本发明的发明人考虑,可以在会议客户端的麦克风接收信号中对来自于其邻近的其它会议客户端反馈来的声学反馈信号进行抑制处理,以便达到抑制通信系统啸叫现象的目的。
可以理解的是,本发明提供的通信系统啸叫抑制方法可应用于包括但不限于通信系统中会议客户端的上行(发送)链路,还可应用于集群通信系统中移动客户端的上行(发送)链路,以及扩声等类似的系统中。
考虑到声学反馈信号x(n)是邻近的收话方客户端的接收信号u(n) 通过其外放扬声器、经空间声学反馈路径h1(n)耦合到发话方客户端的麦克风而形成的,收话方客户端扬声器的接收信号u(n)可视为由发话方客户端的上行(发送)链路中声码器的输入信号r(n)经过其后续处理、网络传输与转发后送至收话方客户端的下行(接收)链路而产生的。那么声学反馈信号x(n)可以看成是发话方客户端的上行链路中声码器的输入信号r(n)途经通信网络系统和收话方客户端的下行链路、邻近的收话方客户端到发话方客户端之间的空间声学反馈路径h1(n)而形成的。其中,通信网络系统和收话方客户端的下行链路可近似等效为传递路径h3(n)。
参考图2,其示出了根据本发明一实施例的声学反馈信号形成的原理模型示意图。如图2所示,声学反馈信号x(n)可近似地表述为:
Figure DEST_PATH_IMAGE019
,其中,
Figure 144978DEST_PATH_IMAGE020
是一个FIR((Finite Impulse Response,有限冲击响应)滤波器,
Figure DEST_PATH_IMAGE021
,可近似地表征声学反馈信号x(n) 形成的混合路径,“*”代表线性卷积算子。为简化起见,可近似把
Figure 811583DEST_PATH_IMAGE022
看作一个待估的时延参数τ,即
Figure DEST_PATH_IMAGE023
,这里
Figure 359239DEST_PATH_IMAGE024
为单位脉冲函数。
由于发话方客户端的麦克风接收信号y(n)中的回声信号d(n)可由发话方客户端上行(发送)链路中后续的AEC(Acoustic Echo Canceller,声学回声抵消器)来处理,故这里我们暂不处理该回声信号d(n),把它与发话方客户端的近端语音信号s(n)一起合并成信号sc (n)来考虑,那么发话方客户端的麦克风接收信号y(n)可表示为:
Figure DEST_PATH_IMAGE025
,其中,
Figure 794899DEST_PATH_IMAGE026
。这样,可以考虑将声学反馈信号x(n)视为发话方客户端的麦克风接收信号y(n)中的噪声信号,则可应用降噪技术来抑制它。为避免引入额外的非线性而影响AEC的性能,可以在发话方客户端的(上行)发送链路中AEC之前,利用线性时变滤波器来抑制麦克风接收信号y(n)中的声学反馈信号x(n)。
具体地,参考图3,其示出了根据本发明一实施例的通信系统啸叫抑制方法的流程示意图。如图3所示,本发明一实施例提供了一种通信系统啸叫抑制方法,包括:
S301、根据预设的参考信号和麦克风接收信号各自的子带谱,估计声学反馈抑制增益函数;
S302、对所述声学反馈抑制增益函数进行时域变换得到线性滤波器系数矢量,所述线性滤波器系数矢量用以对所述麦克风接收信号进行时域滤波。
这样,线性滤波器使用上述方法得到的线性滤波器系数矢量对麦克风接收信号进行滤波处理,可以实现对麦克风接收信号中的声学反馈信号的抑制,以此达到抑制通信系统啸叫现象的目的。
参考图4,其示出了根据本发明一实施例的声学反馈抑制增益函数估计方法的流程示意图。如图4所示,本发明一实施例提供了一种声学反馈抑制增益函数估计方法,包括:
S401、对预设的参考信号和麦克风接收信号进行延时对齐,得到已对齐的参考信号。
本发明的一些实施例中,可以大致估计发话方客户端的上行(发送)链路的一个参考点的参考信号r(n)传输到其邻近的收话方客户端的下行(接收)链路的一个参考点的时延参数τ,继而,根据估计的时延参数τ将参考信号r(n)和麦克风接收信号y(n)进行延时对齐,生成已对齐的参考信号
Figure DEST_PATH_IMAGE027
可以理解的是,本发明的一些实施例中,收话方客户端的下行链路的一个参考点可以为收话方客户端扬声器的输入点。相应地,发话方客户端的上行链路的参考点的参考信号可以为上行链路中声码器的输入信号,也可以是经过本发明提供的方案进行啸叫抑制的输出点的输出信号,或者也可以是上述输出点和声码器的输入点之间的上行链路中任何节点处的信号。
实际应用中,时延参数τ的自适应估计器可以采用时域自适应滤波技术来实现。鉴于麦克风接收信号y(n)中一直存在近端语音s(n)和回声d(n)的混合语音信号
Figure 769809DEST_PATH_IMAGE028
,那么用于更新FIR滤波器系数矢量
Figure DEST_PATH_IMAGE029
的学习算法应该具有抗混合语音信号
Figure 658130DEST_PATH_IMAGE028
的鲁棒性,为此可以考虑采用时域时变正则化因子的归一化最小均方误差算法为FIR滤波器系数矢量
Figure 275056DEST_PATH_IMAGE029
的学习算法。
进一步地,由于通信传输网络的时延通常较大,实际应用中,用于时延估计的FIR滤波器的系数矢量
Figure 96382DEST_PATH_IMAGE030
的维数的数值通常设置很高,由此可能会导致FIR滤波器学习的收敛速度变慢。
本发明的一些实施例中,可以根据所述参考信号和所述麦克风接收信号,进行自适应时延估计;其中,参与自适应时延估计的所述参考信号和所述麦克风接收信号经过白化滤波预处理;根据自适应时延估计的时延参数进行时延对齐。这样,通过对参与时延估计的两路信号进行白化预处理,对白化后的信号应用上述时域时变正则化因子的归一化最小均方误差算法,可以加速FIR滤波器学习的收敛性,从而提高学习速度。关于信号的白化滤波预处理,可以采用本领域常用的白化滤波器来进行,例如,可以采用线性预测误差滤波器。
可选地,本发明的一些实施例中,可以把白化滤波去相关技术与上述时域时变正则化因子的归一化最小均方误差算法相结合,提出一种去相关时域时变正则化因子的归一化最小均方误差算法的时延估计器。具体地,参考图5,其示出了根据本发明一实施例的时域信号对齐与白化预处理的结构框图。如图5所示,本发明的一些实施例中,可以通过如下公式(1)定义误差信号
Figure 507772DEST_PATH_IMAGE014
Figure DEST_PATH_IMAGE031
(1)
其中,
Figure 148969DEST_PATH_IMAGE032
Figure 569586DEST_PATH_IMAGE004
为n时刻FIR滤波器的系数矢量,L为系数矢量维数;
Figure 979838DEST_PATH_IMAGE005
为白化的参考信号矢量;
Figure 827709DEST_PATH_IMAGE006
为白化的麦克风接收信号。
相应地,本发明一实施例提供的去相关时域时变正则化因子的归一化最小均方误差算法可通过如下公式(2)表述:
Figure 221781DEST_PATH_IMAGE001
(2)
式中,
Figure 914930DEST_PATH_IMAGE007
Figure 976427DEST_PATH_IMAGE008
,
Figure 464040DEST_PATH_IMAGE009
Figure 610988DEST_PATH_IMAGE010
为两个预设的递归常数,且
Figure 107828DEST_PATH_IMAGE011
Figure 758253DEST_PATH_IMAGE012
为大于0的预设实常数;0 <μ< 2为预设的学习率实常数;误差信号
Figure 682346DEST_PATH_IMAGE014
由公式(1)计算。实际应用中,通常预置为μ=1。
这样,可以根据公式(2)进行自适应时延估计,当用以表征声学反馈信号形成路径的有限冲击响应FIR滤波器
Figure 51011DEST_PATH_IMAGE002
收敛时,时延参数的估计为绝对值最大的系数所对应的索引
Figure 351542DEST_PATH_IMAGE003
。继而,可以根据估计的时延参数τ将参考信号r(n)和麦克风接收信号y(n)进行延时对齐,生成已对齐的参考信号
Figure 122052DEST_PATH_IMAGE027
通过本发明实施例提供的去相关时域时变正则化因子的归一化最小均方误差算法来进行时延估计,可使得估计时延参数的自适应滤波器的学习速度加快,并对近端信号具有较好的鲁棒性,由此提高了时延参数的估计速度和精度。
S402、对所述已对齐的参考信号和所述麦克风接收信号进行子带域变换,得到已对齐的参考信号的子带谱和麦克风接收信号的子带谱。
本发明的一些实施例中,可以分别对所述麦克风接收信号和所述已对齐的参考信号进行频域变换,生成麦克风接收信号的子带谱和已对齐的参考信号的子带谱。
实际应用中,可以分别采用2个AFB(Analysis Filter Banks,分析滤波器组)分别把麦克风接收信号y(n)和已对齐的参考信号
Figure DEST_PATH_IMAGE033
,变换成麦克风接收信号的子带谱Y(k,t)和已对齐的参考信号的子带谱
Figure 951468DEST_PATH_IMAGE034
,其中,k为子带索引,t为信号帧索引。
可以理解的是,两个AFB的原型低通滤波器相同。对于AFB,假设原型低通滤波器窗函数为
Figure DEST_PATH_IMAGE035
,其长度为N个样本点,K为AFB中FFT(Fast Fourier Transform,快速傅里叶变换)运算的点数,相应地,子带个数为1+ K/2,M为输入时间序列的数据块长度。
参考图6,其示出了根据本发明一实施例的分析滤波器组的算法的示意图。如图6所示,本发明一实施例提供的分析滤波器组的算法包括如下步骤:
第0步):初始化AFB中分析移位寄存器
Figure 276270DEST_PATH_IMAGE036
的内容初始化为0;第1步):右端移入M个样本新数据块至
Figure 114913DEST_PATH_IMAGE036
中;第2步):应用窗函数
Figure 5508DEST_PATH_IMAGE035
来对
Figure 5825DEST_PATH_IMAGE036
的内容进行加权;第3步):将寄存器
Figure 349082DEST_PATH_IMAGE036
的内容划分成r段,每段含K个样本,这里
Figure DEST_PATH_IMAGE037
为整数;第4步):将r个K点样本段叠加后进行K点FFT运算,从而获得k个子带分量。
S403、根据所述已对齐的参考信号的子带谱和所述麦克风接收信号的子带谱,获得声学反馈信号的子带谱估计。
本发明的一些实施例中,可以在子带域中应用麦克风接收信号的子带谱Y(k,t)和已对齐的参考信号的子带谱
Figure 460258DEST_PATH_IMAGE034
来自适应估计声学反馈路径的子带谱传递函数
Figure 939780DEST_PATH_IMAGE038
。继而,根据估计的声学反馈路径的子带谱传递函数
Figure 642157DEST_PATH_IMAGE038
和已对齐的参考信号的子带谱
Figure 207131DEST_PATH_IMAGE034
,获得声学反馈信号的子带谱估计
Figure DEST_PATH_IMAGE039
考虑到,实际应用中,发话方客户端的麦克风接收信号y(n)中的近端语音信号与其邻近的收话方客户端耦合来的声学反馈信号x(n)具有很强的相关性,这是因为x(n)是由参考信号r(n)经近似等效的传输路径h3(n)形成的, 而r(n)信号又直接源自近端语音信号。这一强相关性的事实使得在子带域中直接应用麦克风接收信号的子带谱和已对齐的参考信号的子带谱来自适应估计声学反馈路径的子带谱传递函数
Figure 121997DEST_PATH_IMAGE038
可能存在严重偏差,进而导致估计的声学反馈信号的子带谱
Figure 456026DEST_PATH_IMAGE040
存在较大偏差。
可选地,为了减小声学反馈路径的子带谱传递函数
Figure 329305DEST_PATH_IMAGE038
的估计偏差,进而减小声学反馈信号的子带谱
Figure 381574DEST_PATH_IMAGE040
的估计偏差,得到已对齐的参考信号之后,本发明的一些实施例提供的通信系统啸叫抑制方法中还包括:对所述麦克风接收信号和所述已对齐的参考信号进行白化滤波处理;对白化的麦克风接收信号,以及白化的已对齐的参考信号进行子带域变换,得到各自对应的子带谱。继而,可以根据麦克风接收信号的子带谱
Figure DEST_PATH_IMAGE041
、白化的已对齐的参考信号的子带谱
Figure 100132DEST_PATH_IMAGE042
和白化的麦克风接收信号的子带谱
Figure DEST_PATH_IMAGE043
,自适应估计声学反馈路径的子带谱传递函数
Figure 23088DEST_PATH_IMAGE044
。继而,根据估计的声学反馈路径的子带谱传递函数
Figure 801688DEST_PATH_IMAGE038
和已对齐的参考信号的子带谱
Figure 341254DEST_PATH_IMAGE034
,获得声学反馈信号的子带谱估计
Figure 129081DEST_PATH_IMAGE039
本发明的一些实施例中,可以采用子带域时域时变正则化因子的归一化最小均方误差算法进行声学反馈路径的子带谱传递函数
Figure 437703DEST_PATH_IMAGE044
的自适应学习,具体可以根据如下公式(3)学习:
Figure DEST_PATH_IMAGE045
(3)
公式(3)中,
Figure 133344DEST_PATH_IMAGE046
Figure DEST_PATH_IMAGE047
Figure 629047DEST_PATH_IMAGE048
Figure DEST_PATH_IMAGE049
Figure 689407DEST_PATH_IMAGE050
Figure DEST_PATH_IMAGE051
分别为两个预设的递归常数,
Figure 321377DEST_PATH_IMAGE052
为大于0的预设实常数,
Figure DEST_PATH_IMAGE053
为预设的学习率实常数;
Figure 441780DEST_PATH_IMAGE054
为第k个子带、第t帧时刻的声学反馈路径的子带谱传递函数矢量,L1为其矢量维数;
Figure DEST_PATH_IMAGE055
为第k个子带、第t帧时刻的白化的已对齐的参考信号矢量,其维数为L1;子带索引k = 0, 1, 2, …, K/2,K为子带谱变换过程中采用的分析滤波器组AFB中FFT运算的点数;上标H为矢量的复共轭转置算子符,上标T为矢量的转置算子符。
根据上述公式(3)自适应学习获得的声学反馈路径的子带谱传递函数
Figure 690358DEST_PATH_IMAGE044
赋值给矢量
Figure 554409DEST_PATH_IMAGE056
,用矢量
Figure 103202DEST_PATH_IMAGE056
作用于已对齐的参考信号的子带谱
Figure 394506DEST_PATH_IMAGE034
,便获得声学反馈信号的子带谱估计
Figure DEST_PATH_IMAGE057
,即:
Figure 864802DEST_PATH_IMAGE058
,其中,实参数
Figure DEST_PATH_IMAGE059
为预置的过估计因子常数;上标H为复共轭转置运算符。
本发明的一些实施例中,通过采用白化信号的子带谱
Figure 266964DEST_PATH_IMAGE060
Figure 670264DEST_PATH_IMAGE043
来取代子带谱Rd(k,t)和Y(k,t)进行
Figure 132469DEST_PATH_IMAGE044
的自适应学习更新;鉴于白化信号的子带谱
Figure 621219DEST_PATH_IMAGE060
Figure 827073DEST_PATH_IMAGE043
互不相关,从而获得声学反馈路径的子带谱传递函数
Figure 84879DEST_PATH_IMAGE044
的无偏估计,极大地减小了声学反馈信号的子带谱
Figure DEST_PATH_IMAGE061
估计偏差。
S404、根据所述麦克风接收信号的子带谱和估计的所述声学反馈信号的子带谱,进行声学反馈抑制增益函数的估计。
在获得声学反馈信号的子带谱之后,可以应用谱减法技术对麦克风接收信号中的声学反馈信号进行抑制。
具体地,本发明的一些实施例中,可以根据估计的所述声学反馈信号的子带谱、所述麦克风接收信号的子带谱,获得子带域后验信噪比估计;根据估计的所述子带域后验信噪比、所述声学反馈信号的子带谱和混合语音信号子带谱,获得子带域先验信噪比估计;根据公式
Figure 717986DEST_PATH_IMAGE016
,获得第k个子带第t帧时刻的声学反馈抑制增益
Figure 428453DEST_PATH_IMAGE062
的估计;其中,
Figure 437997DEST_PATH_IMAGE018
为估计的第k个子带第t帧时刻的子带域先验信噪比。
本发明的一些实施例中,子带域后验信噪比可以根据所述声学反馈信号的子带谱,获得声学反馈信号自功率谱;根据所述声学反馈信号自功率谱,所述麦克风接收信号的子带谱,获得子带域后验信噪比估计。具体地,可以根据如下公式(4)估计第k个子带第t帧时刻的子带域后验信噪比
Figure DEST_PATH_IMAGE063
Figure 284730DEST_PATH_IMAGE064
(4)
其中,Y(k,t)是麦克风接收信号的子带谱,
Figure DEST_PATH_IMAGE065
。,
Figure 557580DEST_PATH_IMAGE066
是声学反馈信号自功率谱的估计,
Figure DEST_PATH_IMAGE067
是预设的取值接近1的平滑参数,通常
Figure 755343DEST_PATH_IMAGE068
本发明的一些实施例中,估计得到子带域后验信噪比之后,可以依据决策引导技术来估计子带域先验信噪比。具体地,可以根据如下公式(5)估计第k个子带第t帧时刻的子带域先验信噪比
Figure DEST_PATH_IMAGE069
Figure 771840DEST_PATH_IMAGE070
(5)
其中,
Figure DEST_PATH_IMAGE071
是(t-1)帧混合语音信号的子带谱的估计,
Figure 473080DEST_PATH_IMAGE072
是预设的取值接近1的另一平滑参数,以便克服音乐噪声,通常
Figure DEST_PATH_IMAGE073
考虑到,应用决策引导技术来估计子带域先验信噪比,通常存在滞后一帧的问题,这便使得根据公式
Figure 447989DEST_PATH_IMAGE016
,用子带域先验信噪比估计
Figure 133049DEST_PATH_IMAGE018
计算得到的声学反馈抑制增益函数
Figure 484396DEST_PATH_IMAGE074
,实际上是前一帧的增益,而并非当前帧的增益;由此可能会导致了混合语音信号既有起始段衰减又有结束段拖尾的现象。
本发明的一些实施例中,可以采用带自适应平滑参数的两步递归方式来估计子带域先验信噪比,以避免决策引导技术估计先验信噪比的滞后所引发的问题。具体地,在根据估计的所述声学反馈信号的子带谱和所述麦克风接收信号的子带谱,获得子带域后验信噪比估计,之后,可以根据估计的所述子带域后验信噪比、前一帧的声学反馈抑制增益函数估计和预设自适应平滑参数,获得子带域先验信噪比估计;根据公式
Figure 40142DEST_PATH_IMAGE016
,获得第k个子带第t帧时刻的声学反馈抑制增益函数
Figure 717111DEST_PATH_IMAGE017
的估计;其中,
Figure 623887DEST_PATH_IMAGE018
为估计的第k个子带第t帧时刻的子带域先验信噪比。
具体地,本发明的一些实施例中,可以根据如下公式(6)、公式(7)来估计第k个子带第t帧时刻的子带域先验信噪比
Figure 513345DEST_PATH_IMAGE069
Figure DEST_PATH_IMAGE075
(6)
Figure 189177DEST_PATH_IMAGE076
(7)
其中,
Figure DEST_PATH_IMAGE077
Figure 505889DEST_PATH_IMAGE078
是自适应平滑参数,
Figure DEST_PATH_IMAGE079
是前一帧的声学反馈抑制增益函数估计。
本发明的一些实施例提供的声学反馈抑制增益函数的估计方法,利用白化信号参与时延参数的自适应学习,提高了时延参数的估计速度和精度;通过白化的子带谱参与声学反馈路径的子带谱传递函数估计,提高了声学反馈信号的子带谱的估计精度和速度;进一步地,通过提高子带域先验信噪比的估计精度,为声学反馈抑制增益函数的可靠计算提供了保障。
基于图4所示声学反馈抑制增益函数估计方法获得声学反馈抑制增益函数之后,可以对所述声学反馈抑制增益函数进行时域变换,利用时域变换结果以对麦克风接收信号进行时域滤波,以抑制麦克风接收信号中的声学反馈信号,从而实现通信系统中啸叫现象的抑制。
本发明的一些实施例中,可以利用逆傅里叶变换器对声学反馈抑制增益函数进行逆傅里叶变换,从而获得对应的时域信号矢量,继而,利用获得的时域信号矢量对麦克风接收信号进行滤波处理。
进一步地,考虑到如果直接将声学反馈抑制增益函数的时域信号矢量对麦克风接收信号进行滤波处理,滤波处理后获得的输出信号可能会存在听觉感知的奇变。
可选地,为了消除声学反馈抑制增益函数帧时变性产生的谱奇变,本发明的一些实施例中,可以在对估计的所述声学反馈抑制增益函数进行时域变换,获得时域信号矢量;利用预设的窗函数对所述时域信号矢量进行均衡后,得到线性滤波器系数矢量,线性滤波器系数矢量用以对麦克风接收信号进行时域滤波。可以理解的是,预设的窗函数由本领域技术人员从对称的实窗函数中选择,例如,可以是Hanning(汉宁)窗函数。
参考图7,其示出了根据本发明一实施例的通信系统啸叫抑制装置的结构示意图;如图7所示,本发明一实施例提供了一种通信系统啸叫抑制装置,包括:
声学反馈抑制估计模块701,用于根据预设的参考信号和麦克风接收信号各自的子带谱,估计声学反馈抑制增益函数。
线性滤波器系数生成模块702,用于对所述声学反馈抑制增益函数进行时域变换得到线性滤波器系数矢量,所述线性滤波器系数矢量用以对所述麦克风接收信号进行时域滤波。
本发明的一些实施例中,线性滤波器系数生成模块702可以对声学反馈抑制估计模块701估计的所述声学反馈抑制增益函数进行时域变换,获得时域信号矢量;利用预设的窗函数对所述时域信号矢量进行均衡,得到所述线性滤波器系数矢量,所述线性滤波器系数矢量用以对麦克风接收信号进行时域滤波。
参考图8,其示出了根据本发明一实施例的声学反馈抑制估计模块的结构示意图。本发明的一些实施例中,如图8所示,声学反馈抑制估计模块701可以包括:时域信号对齐单元801、子带变频单元802子带域处理单元803。
其中,时域信号对齐单元801用于对预设的参考信号和麦克风接收信号进行延时对齐,得到已对齐的参考信号。
子带变频单元802用于对所述已对齐的参考信号和所述麦克风接收信号进行子带域变换,得到已对齐的参考信号的子带谱和麦克风接收信号的子带谱。
子带域处理单元803用于根据所述已对齐的参考信号的子带谱和所述麦克风接收信号的子带谱,获得声学反馈信号的子带谱估计;并根据所述麦克风接收信号的子带谱和估计的所述声学反馈信号的子带谱,进行声学反馈抑制增益函数的估计。
本发明的一些实施例中,时域信号对齐单元801可以根据所述参考信号和所述麦克风接收信号,进行自适应时延估计;其中,参与自适应时延估计的所述参考信号和所述麦克风接收信号经过白化滤波预处理;根据自适应时延估计的时延参数进行时延对齐,得到已对齐的参考信号。
本发明的一些实施例中,时域信号对齐单元801可以根据公式
Figure 634382DEST_PATH_IMAGE001
进行自适应时延估计;当用以表征声学反馈信号形成路径的有限冲击响应FIR滤波器
Figure 593111DEST_PATH_IMAGE002
收敛时,时延参数的估计为绝对值最大的系数所对应的索引
Figure 123450DEST_PATH_IMAGE003
;其中,
Figure 142221DEST_PATH_IMAGE004
为n时刻FIR滤波器的系数矢量,L为系数矢量维数;
Figure 23589DEST_PATH_IMAGE005
为白化的参考信号矢量;
Figure 520430DEST_PATH_IMAGE006
为白化的麦克风接收信号;
Figure 436433DEST_PATH_IMAGE007
Figure 94948DEST_PATH_IMAGE008
,
Figure 729191DEST_PATH_IMAGE009
Figure 764143DEST_PATH_IMAGE010
为两个预设的递归常数,且
Figure 800233DEST_PATH_IMAGE011
Figure 629648DEST_PATH_IMAGE012
为大于0的预设实常数;
Figure 485609DEST_PATH_IMAGE013
为预设的学习率实常数;误差信号
Figure 589831DEST_PATH_IMAGE014
由公式
Figure 214848DEST_PATH_IMAGE015
计算。
本发明的一些实施例中,所述时域信号对齐单元801还用于对所述麦克风接收信号和所述已对齐的参考信号进行白化滤波处理。
相应地,所述子带变频单元802还用于对白化的麦克风接收信号,以及白化的已对齐的参考信号进行子带域变换,得到各自对应的子带谱。
相应地,所述子带域处理单元803可以包括:子带谱传递函数估计子模块和子带域抑制增益函数计算子模块。
其中,子带谱传递函数估计子模块用于根据所述麦克风接收信号的子带谱、所述白化的麦克风接收信号的子带谱,以及所述白化的已对齐的参考信号的子带谱,自适应估计声学反馈路径的子带谱传递函数;根据所述声学反馈路径的子带谱传递函数和已对齐的参考信号的子带谱,获得声学反馈信号的子带谱估计。
子带域抑制增益函数计算子模块用于根据所述麦克风接收信号的子带谱和估计的所述声学反馈信号的子带谱,进行声学反馈抑制增益函数的估计。
本发明的一些实施例中,子带域抑制增益函数计算子模块可以根据子带谱传递函数估计子模块估计的所述声学反馈信号的子带谱和所述麦克风接收信号的子带谱,获得子带域后验信噪比估计;根据估计的所述子带域后验信噪比、前一帧的声学反馈抑制增益函数估计和预设自适应平滑参数,获得子带域先验信噪比估计;根据公式
Figure 480744DEST_PATH_IMAGE016
,获得第k个子带第t帧时刻的声学反馈抑制增益函数
Figure 558421DEST_PATH_IMAGE017
的估计;其中,
Figure 466334DEST_PATH_IMAGE018
为估计的第k个子带第t帧时刻的子带域先验信噪比。
可以理解的是,本发明的上述实施例提供的通信系统啸叫抑制装置的各模块,以及各模块的各单元,以及各单元的各子模块用于对应地实现上述通信系统啸叫抑制方法中的各步骤,具体内容在此不再赘述。
基于上述实施例提供的通信系统啸叫抑制方法,参考图9,其示出了根据本发明一实施例的通信系统啸叫抑制器的原理系统框图。如图9所示,本发明一实施例提供了一种通信系统啸叫抑制器,包括:时域信号对齐与白化预处理器901(即时域信号对齐单元)、分析滤波器组子带变换器902(即子带变频单元)、子带域处理器903(即子带域处理单元)和帧时变线性滤波器系数矢量生成器904(即线性滤波器系数生成模块)。
本发明的一些实施例中,时域信号对齐与白化预处理器901用于根据预设的参考信号和麦克风接收信号,进行自适应时延估计;其中,参与自适应时延估计的所述参考信号和所述麦克风接收信号经过白化滤波预处理;根据自适应时延估计的时延参数进行时延对齐,得到已对齐的参考信号。
本发明的一些实施例中,时域信号对齐与白化预处理器901可以根据公式
Figure 945857DEST_PATH_IMAGE001
进行自适应时延估计。
当用以表征声学反馈信号形成路径的有限冲击响应FIR滤波器
Figure 648234DEST_PATH_IMAGE002
收敛时,时延参数的估计为绝对值最大的系数所对应的索引
Figure 213208DEST_PATH_IMAGE003
其中,
Figure 659232DEST_PATH_IMAGE004
为n时刻FIR滤波器的系数矢量,L为系数矢量维数;
Figure 993262DEST_PATH_IMAGE005
为白化的参考信号矢量;
Figure 600961DEST_PATH_IMAGE006
为白化的麦克风接收信号;
Figure 918809DEST_PATH_IMAGE007
Figure 637367DEST_PATH_IMAGE008
,
Figure 357061DEST_PATH_IMAGE009
Figure 135661DEST_PATH_IMAGE010
为两个预设的递归常数,且
Figure 940806DEST_PATH_IMAGE011
Figure 463054DEST_PATH_IMAGE012
为大于0的预设实常数;
Figure 37255DEST_PATH_IMAGE013
为预设的学习率实常数;误差信号
Figure 975038DEST_PATH_IMAGE014
由公式
Figure 736321DEST_PATH_IMAGE015
计算。
本发明的一些实施例中,分析滤波器组子带变换器902由4个分析滤波器组组成,分别对麦克风接收信号、已对齐的参考信号、白化的麦克风接收信号,以及白化的已对齐的参考信号进行子带域变换,得到麦克风接收信号的子带谱、已对齐的参考信号的子带谱、白化的麦克风接收信号的子带谱,以及白化的已对齐的参考信号的子带谱。
本发明的一些实施例中,子带域处理器903包括子带域传递函数估计子模块和子带域抑制增益函数计算器子模块。
其中,子带域传递函数估计子模块用于根据所述麦克风接收信号、白化的麦克风接收信号,以及白化的已对齐的参考信号各自对应的子带谱,自适应估计声学反馈路径的子带谱传递函数;根据所述声学反馈路径的子带谱传递函数和已对齐的参考信号的子带谱,获得声学反馈信号的子带谱估计。
子带域抑制增益函数计算器子模块用于根据估计的所述声学反馈信号的子带谱和所述麦克风接收信号的子带谱,获得子带域后验信噪比估计;根据估计的所述子带域后验信噪比、前一帧的声学反馈抑制增益函数估计和预设自适应平滑参数,获得子带域先验信噪比估计;根据公式
Figure 327839DEST_PATH_IMAGE016
,获得第k个子带第t帧时刻的声学反馈抑制增益函数
Figure 490967DEST_PATH_IMAGE017
的估计;其中,
Figure 611370DEST_PATH_IMAGE018
为估计的第k个子带第t帧时刻的子带域先验信噪比。
本发明的一些实施例中,帧时变线性滤波器系数矢量生成器904用于对估计的所述声学反馈抑制增益函数进行时域变换,获得时域信号矢量;利用预设的窗函数对所述时域信号矢量进行均衡后,得到线性滤波器系数矢量,所述线性滤波器系数矢量用以对麦克风接收信号进行时域滤波。
本发明的一些实施例中,还提供了一种电子设备。该电子设备包括:存储器和处理器,所述存储器上存储有计算机程序,所述处理器执行所述程序时实现如上所述的通信系统啸叫抑制方法。进一步地,还提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如上所述的通信系统啸叫抑制方法。图10示出了可以用来实施本公开的实施例的电子设备1000的示意性框图。如图10所示,电子设备1000包括中央处理单元(CPU)1001,其可以根据存储在只读存储器(ROM)1002中的计算机程序指令或者从存储单元1008加载到随机访问存储器(RAM)1003中的计算机程序指令,来执行各种适当的动作和处理。在RAM 1003中,还可以存储电子设备1000操作所需的各种程序和数据。CPU1001、ROM 1002以及RAM 1003通过总线1004彼此相连。输入/输出(I/O)接口1005也连接至总线1004。
电子设备1000中的多个部件连接至I/O接口1005,包括:输入单元1006,例如键盘、鼠标等;输出单元1007,例如各种类型的显示器、扬声器等;存储单元1008,例如磁盘、光盘等;以及通信单元1009,例如网卡、调制解调器、无线通信收发机等。通信单元1009允许电子设备1000通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
处理单元1001执行上文所描述的各个方法和处理。例如,在一些实施例中,方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元1008。在一些实施例中,计算机程序的部分或者全部可以经由ROM1002和/或通信单元1009而被载入和/或安装到设备1000上。当计算机程序加载到RAM 1003并由CPU 1001执行时,可以执行上文描述的方法的一个或多个步骤。备选地,在其他实施例中,CPU 1001可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行方法。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)等等。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
此外,虽然采用特定次序描绘了各操作,但是这应当理解为要求这样操作以所示出的特定次序或以顺序次序执行,或者要求所有图示的操作应被执行以取得期望的结果。在一定环境下,多任务和并行处理可能是有利的。同样地,虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实现中。相反地,在单个实现的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实现中。
尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。

Claims (14)

1.一种通信系统啸叫抑制方法,其特征在于,包括:
根据预设的参考信号和麦克风接收信号各自的子带谱,估计声学反馈抑制增益函数;
对所述声学反馈抑制增益函数进行时域变换得到线性滤波器系数矢量,所述线性滤波器系数矢量用以对所述麦克风接收信号进行时域滤波;
所述根据预设的参考信号和麦克风接收信号各自的子带谱,估计声学反馈抑制增益函数,包括:
对预设的参考信号和麦克风接收信号进行时延对齐,得到已对齐的参考信号;
对所述已对齐的参考信号和所述麦克风接收信号进行子带域变换,得到已对齐的参考信号的子带谱和麦克风接收信号的子带谱;
根据所述已对齐的参考信号的子带谱和所述麦克风接收信号的子带谱,获得声学反馈信号的子带谱估计;根据所述麦克风接收信号的子带谱和估计的所述声学反馈信号的子带谱,进行声学反馈抑制增益函数的估计;
所述根据所述麦克风接收信号的子带谱和估计的所述声学反馈信号的子带谱,进行声学反馈抑制增益函数的估计,包括:
根据估计的所述声学反馈信号的子带谱和所述麦克风接收信号的子带谱,获得子带域后验信噪比估计;
根据估计的所述子带域后验信噪比、前一帧的声学反馈抑制增益函数估计和预设自适应平滑参数,获得子带域先验信噪比估计;
根据公式
Figure 281503DEST_PATH_IMAGE001
,获得第k个子带第t帧时刻的声学反馈抑制增益函 数
Figure 396089DEST_PATH_IMAGE002
的估计;其中,
Figure 911384DEST_PATH_IMAGE003
为估计的第k个子带第t帧时刻的子带域先验信噪比。
2.根据权利要求1所述的方法,其特征在于,所述对预设的参考信号和麦克风接收信号进行时延对齐,得到已对齐的参考信号,包括:
根据所述参考信号和所述麦克风接收信号,进行自适应时延估计;其中,参与自适应时延估计的所述参考信号和所述麦克风接收信号经过白化滤波预处理;
根据自适应时延估计的时延参数进行时延对齐,得到已对齐的参考信号。
3.根据权利要求2所述的方法,其特征在于,所述根据所述参考信号和所述麦克风接收信号,进行自适应时延估计,包括:
根据公式
Figure 427816DEST_PATH_IMAGE004
进行自适应时延估计;
当用以表征声学反馈信号形成路径的有限冲击响应FIR滤波器
Figure 65471DEST_PATH_IMAGE005
收敛时,时延参数的 估计为绝对值最大的系数所对应的索引
Figure 667353DEST_PATH_IMAGE006
其中,
Figure 986339DEST_PATH_IMAGE007
为n时刻FIR滤波器的系数矢量,L为系数矢量维数;
Figure 154015DEST_PATH_IMAGE008
为白化的参考信号矢量;
Figure 165834DEST_PATH_IMAGE009
为白化的麦克风接收信号;
Figure 723854DEST_PATH_IMAGE010
Figure 112110DEST_PATH_IMAGE011
,
Figure 337555DEST_PATH_IMAGE012
Figure 319942DEST_PATH_IMAGE013
为两个预设的递归 常数,且
Figure 896417DEST_PATH_IMAGE014
Figure 557205DEST_PATH_IMAGE015
为大于0的预设实常数;
Figure 637157DEST_PATH_IMAGE016
为预设的学习率实常数;误 差信号
Figure 53095DEST_PATH_IMAGE017
由公式
Figure 585707DEST_PATH_IMAGE018
计算。
4.根据权利要求1-3任一所述的方法,其特征在于,所述得到已对齐的参考信号之后,所述方法还包括:
对所述麦克风接收信号和所述已对齐的参考信号进行白化滤波处理;
对白化的麦克风接收信号,以及白化的已对齐的参考信号进行子带域变换,得到各自对应的子带谱;
相应地,所述根据所述已对齐的参考信号的子带谱和所述麦克风接收信号的子带谱,获得声学反馈信号的子带谱估计,包括:
根据所述麦克风接收信号的子带谱、所述白化的麦克风接收信号的子带谱,以及所述白化的已对齐的参考信号的子带谱,自适应估计声学反馈路径的子带谱传递函数;
根据所述声学反馈路径的子带谱传递函数和已对齐的参考信号的子带谱,获得声学反馈信号的子带谱估计。
5.根据权利要求4所述的方法,其特征在于,所述对所述声学反馈抑制增益函数进行时域变换得到线性滤波器系数矢量包括:
对估计的所述声学反馈抑制增益函数进行时域变换,获得时域信号矢量;
利用预设的窗函数对所述时域信号矢量进行均衡,得到所述线性滤波器系数矢量。
6.一种通信系统啸叫抑制装置,实现如权利要求1-5任一项的一种通信系统啸叫抑制方法,其特征在于,包括:
声学反馈抑制估计模块,用于根据预设的参考信号和麦克风接收信号各自的子带谱,估计声学反馈抑制增益函数;
线性滤波器系数生成模块,用于对所述声学反馈抑制增益函数进行时域变换得到线性滤波器系数矢量,所述线性滤波器系数矢量用以对所述麦克风接收信号进行时域滤波。
7.根据权利要求6所述的装置,其特征在于,所述声学反馈抑制估计模块包括:
时域信号对齐单元,用于对预设的参考信号和麦克风接收信号进行时延对齐,得到已对齐的参考信号;
子带变频单元,用于对所述已对齐的参考信号和所述麦克风接收信号进行子带域变换,得到已对齐的参考信号的子带谱和麦克风接收信号的子带谱;
子带域处理单元,用于根据所述已对齐的参考信号的子带谱和所述麦克风接收信号的子带谱,获得声学反馈信号的子带谱估计;并根据所述麦克风接收信号的子带谱和估计的所述声学反馈信号的子带谱,进行声学反馈抑制增益函数的估计。
8.根据权利要求7所述的装置,其特征在于,所述时域信号对齐单元用于根据所述参考信号和所述麦克风接收信号,进行自适应时延估计;其中,参与自适应时延估计的所述参考信号和所述麦克风接收信号经过白化滤波预处理;根据自适应时延估计的时延参数进行时延对齐,得到已对齐的参考信号。
9.根据权利要求8所述的装置,其特征在于,所述时域信号对齐单元用于根据公式
Figure 315766DEST_PATH_IMAGE004
进行自适应时延估计;当用以表征声学反馈 信号形成路径的有限冲击响应FIR滤波器
Figure 46961DEST_PATH_IMAGE005
收敛时,时延参数的估计为绝对值最大的系 数所对应的索引
Figure 899380DEST_PATH_IMAGE006
其中,
Figure 184868DEST_PATH_IMAGE007
为n时刻FIR滤波器的系数矢量,L为系数矢量维数;
Figure 453038DEST_PATH_IMAGE008
为白化的参考信号矢量;
Figure 507582DEST_PATH_IMAGE009
为白化的麦克风接收信号;
Figure 217654DEST_PATH_IMAGE010
Figure 911809DEST_PATH_IMAGE011
,
Figure 311566DEST_PATH_IMAGE012
Figure 17354DEST_PATH_IMAGE013
为两个预设的递归 常数,且
Figure 618100DEST_PATH_IMAGE014
Figure 878180DEST_PATH_IMAGE015
为大于0的预设实常数;
Figure 488153DEST_PATH_IMAGE016
为预设的学习率实常数;误 差信号
Figure 316956DEST_PATH_IMAGE017
由公式
Figure 354182DEST_PATH_IMAGE018
计算。
10.根据权利要求7-9任一所述的装置,其特征在于,所述时域信号对齐单元还用于对所述麦克风接收信号和所述已对齐的参考信号进行白化滤波处理;
相应地,所述子带变频单元还用于对白化的麦克风接收信号,以及白化的已对齐的参考信号进行子带域变换,得到各自对应的子带谱;
相应地,所述子带域处理单元包括:
子带谱传递函数估计子模块,用于根据所述麦克风接收信号的子带谱、所述白化的麦克风接收信号的子带谱,以及所述白化的已对齐的参考信号的子带谱,自适应估计声学反馈路径的子带谱传递函数;根据所述声学反馈路径的子带谱传递函数和已对齐的参考信号的子带谱,获得声学反馈信号的子带谱估计;
子带域抑制增益函数计算子模块,用于根据所述麦克风接收信号的子带谱和估计的所述声学反馈信号的子带谱,进行声学反馈抑制增益函数的估计。
11.根据权利要求10所述的装置,其特征在于,所述子带域抑制增益函数计算子模块用 于根据所述子带谱传递函数估计子模块估计的所述声学反馈信号的子带谱和所述麦克风 接收信号的子带谱,获得子带域后验信噪比估计;根据估计的所述子带域后验信噪比、前一 帧的声学反馈抑制增益函数估计和预设自适应平滑参数,获得子带域先验信噪比估计;根 据公式
Figure 835979DEST_PATH_IMAGE001
,获得第k个子带第t帧时刻的声学反馈抑制增益函数
Figure 249643DEST_PATH_IMAGE002
的估计;其中,
Figure 930023DEST_PATH_IMAGE003
为估计的第k个子带第t帧时刻的子带域先验信噪比。
12.根据权利要求11所述的装置,其特征在于,所述线性滤波器系数生成模块用于对所述子带域抑制增益函数计算子模块估计的所述声学反馈抑制增益函数进行时域变换,获得时域信号矢量;利用预设的窗函数对所述时域信号矢量进行均衡,得到所述线性滤波器系数矢量。
13.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1~5中任一项所述的方法。
14.一种电子设备,包括存储器和处理器,所述存储器上存储有计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1~5中任一项所述的方法。
CN202111415588.3A 2021-11-25 2021-11-25 通信系统啸叫抑制方法和装置 Active CN113838474B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111415588.3A CN113838474B (zh) 2021-11-25 2021-11-25 通信系统啸叫抑制方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111415588.3A CN113838474B (zh) 2021-11-25 2021-11-25 通信系统啸叫抑制方法和装置

Publications (2)

Publication Number Publication Date
CN113838474A CN113838474A (zh) 2021-12-24
CN113838474B true CN113838474B (zh) 2022-02-18

Family

ID=78971460

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111415588.3A Active CN113838474B (zh) 2021-11-25 2021-11-25 通信系统啸叫抑制方法和装置

Country Status (1)

Country Link
CN (1) CN113838474B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115604614B (zh) * 2022-12-15 2023-03-31 成都海普迪科技有限公司 采用吊装麦克风进行本地扩声和远程互动的系统和方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102740214A (zh) * 2011-04-01 2012-10-17 中国科学院声学研究所 一种基于反馈信号频谱估计的啸叫抑制方法
CN107749304A (zh) * 2017-09-07 2018-03-02 电信科学技术研究院 有限冲激响应滤波器系数矢量的可持续更新方法及装置
WO2018086444A1 (zh) * 2016-11-10 2018-05-17 电信科学技术研究院 噪声抑制信噪比估计方法和用户终端
CN110634500A (zh) * 2019-10-14 2019-12-31 达闼科技成都有限公司 一种先验信噪比的计算方法、电子设备及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102740214A (zh) * 2011-04-01 2012-10-17 中国科学院声学研究所 一种基于反馈信号频谱估计的啸叫抑制方法
WO2018086444A1 (zh) * 2016-11-10 2018-05-17 电信科学技术研究院 噪声抑制信噪比估计方法和用户终端
CN107749304A (zh) * 2017-09-07 2018-03-02 电信科学技术研究院 有限冲激响应滤波器系数矢量的可持续更新方法及装置
CN110634500A (zh) * 2019-10-14 2019-12-31 达闼科技成都有限公司 一种先验信噪比的计算方法、电子设备及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Automated suppression of howling noise using sinusoidal model based analysis/synthesis;Devis Thomas 等;《2014 IEEE International Advance Computing Conference (IACC)》;20140327;761-765 *
声学反馈控制技术的研究与展望;梁民 等;《数学技术与应用》;20120630;59-75,78 *

Also Published As

Publication number Publication date
CN113838474A (zh) 2021-12-24

Similar Documents

Publication Publication Date Title
US8594320B2 (en) Hybrid echo and noise suppression method and device in a multi-channel audio signal
US7742592B2 (en) Method and device for removing echo in an audio signal
US8675883B2 (en) Apparatus and associated methodology for suppressing an acoustic echo
JP5671147B2 (ja) 後期残響成分のモデリングを含むエコー抑制
US20020054685A1 (en) System for suppressing acoustic echoes and interferences in multi-channel audio systems
Zhang et al. On the use of channel shortening in multichannel acoustic system equalization
CN108447496B (zh) 一种基于麦克风阵列的语音增强方法及装置
EP2245861A1 (en) Enhanced blind source separation algorithm for highly correlated mixtures
US20170372722A1 (en) Acoustic echo cancellation with delay uncertainty and delay change
Mosayyebpour et al. Single-microphone LP residual skewness-based inverse filtering of the room impulse response
Nesta et al. Batch-online semi-blind source separation applied to multi-channel acoustic echo cancellation
CN111755020B (zh) 一种立体声回声消除方法
CN113838474B (zh) 通信系统啸叫抑制方法和装置
EP3692529B1 (en) An apparatus and a method for signal enhancement
CN106782592B (zh) 一种用于消除网络声音传输的回音和啸叫的系统和方法
Schneider et al. The generalized frequency-domain adaptive filtering algorithm as an approximation of the block recursive least-squares algorithm
Bekrani et al. A linear neural network-based approach to stereophonic acoustic echo cancellation
Helwani et al. On the robust and efficient computation of the Kalman gain for multichannel adaptive filtering with application to acoustic echo cancellation
WO2023244256A1 (en) Techniques for unified acoustic echo suppression using a recurrent neural network
Braun et al. Low complexity online convolutional beamforming
CN113824846A (zh) 一种集群通信系统的啸叫抑制方法及设备
Thüne et al. Trends in adaptive MISO system identification for multichannel audio reproduction and speech communication
US8144863B2 (en) Method and apparatus for echo cancellation
Kotte Performance Analysis of Adaptive Algorithms based on different parameters Implemented for Acoustic Echo Cancellation in Speech Signals
Tan et al. Kronecker Product Based Linear Prediction Kalman Filter for Dereverberation and Noise Reduction

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant