发明概述
本发明的一个目的是克服现有技术的这些和其它问题,并且提供一种回波消除设备和方法,即使当远端回波比近端信号大声很多的时候,其也能提供极好的回波抑制而基本上不会引入音响声音失真。
因此,本发明提供一种声回波消除设备,用于消除麦克风信号中响应于远端信号的回波,该设备包括:
-自适应滤波器单元,被设置来滤波远端信号以产生回波消除信号,
-组合单元,被设置来将回波消除信号和麦克风信号组合起来以产生一残留信号,
-后处理器,被设置来从残留信号中基本消除所有剩余回波,该设备进一步包括:
-近端音调估计单元,被设置来估计包含在麦克风信号中的任意近端信号的音调,并且根据估计的音调来控制后处理器单元,以使得估计的音调的谐波可以被基本保留。
通过提供一个可以估计近端信号音调的近端音调估计单元和一个可以根据估计的音调来控制后处理器单元的控制单元,后处理器的动作根据近端信号的音调来进行。特别地,该控制单元可以保留或至少基本保留估计的音调的谐波。也就是说,根据近端信号的估计的音调,估计的音调的谐波不能被后处理器单元显著地衰减。通过保留它的音调的谐波,防止了近端信号被后处理器意外抑制。
注意到术语音调经常指的是音频信号(例如语音信号)的可察觉的频率,其由基频和它的谐波来确定。但是,术语音调也可以被专用于表示信号的基频(f0)。在后一种情形,语音信号的大部分其它频率是音调的谐波(n×f0,其中n=2,3,4,...),那么音调(或基频)可以被认为是“第一谐波”(n=1)。在一些情况下,这个基频的信号功率可以是非常小或甚至实际上没有,但是它的频率可以从它的谐波来确定。当在本文档中谈到保留某个音调的谐波,它典型地意味着音调本身,就是“第一谐波”,也被保留。
尽管控制单元在这里描述为一个单独的单元,它可以被结合在后处理器中。也就是说,后处理器单元可以合并基于音调的控制功能,以及控制单元的任何其它功能。
在一个优选实施例中,本发明的近端音调估计单元包括:
-残留音调估计单元,被设置来估计残留信号的音调以便近似近端信号的音调,和
-控制单元,被设置来根据估计的音调提供衰减控制信号以使得估计的音调的谐波被基本保留。
当近端信号被包含在麦克风信号中,麦克风信号也包含回波信号的时候,该近端信号不能被直接估计。近端信号音调的间接估计能够通过估计残留信号的音调获得。如果自适应滤波器产生的回波消除信号等于回波信号,组合单元产生的残留信号就等于近端信号。因此,残留信号的音调提供了近端信号音调的良好的第一估计。
但是在一些情况下,回波不会被全部消除且残留信号包含残留回波成分,导致残留信号偏离近端信号。在这些情况下,基于残留信号的音调估计不会足够准确。
因此,本发明设备的一个优选实施例进一步包括被设置来估计回波消除信号的音调的回波音调估计单元,控制单元被设置来根据估计的残留信号音调和估计的回波消除信号音调控制后处理器。通过提供一个估计回波消除信号的音调从而间接估计回波信号的音调的回波音调估计单元,可以获得对近端信号音调的更准确的估计。
进一步优选的是,该控制单元被设置来比较估计的残留信号音调和估计的回波消除信号音调,并且控制后处理器单元,以使得只有在估计的音调不同时,估计的音调的谐波才被充分保留。当估计的残留信号音调和估计的回波消除信号音调基本相同时,残留信号音调的估计可能是错误地基于残留回波,它的谐波不应该被保留。
有利地,近端音调估计单元可以进一步包括梳状滤波器单元,被设置来在将残留信号馈送给残留音调估计单元之前滤波残留信号。
该梳状滤波器单元优选地被回波音调估计单元控制。该梳状滤波器单元被设置来在估计它的音调之前滤波残留信号以便衰减回波的所有谐波。
本发明还提供一种包括上面所定义的设备的声音处理系统,和一种包括上面所定义的设备的便携用户设备,例如一个移动电话装置。
本发明进一步提供一种消除麦克风信号中响应于远端信号的回波的方法,该方法包括步骤:
-滤波远端信号以产生一回波消除信号,
-将该回波消除信号与麦克风信号组合起来以产生一残留信号,
-后处理该残留信号以从所述信号中基本消除所有剩余回波,该方法进一步包括步骤:
-估计包含在麦克风信号中的任意近端信号的音调,
-根据估计的音调来控制后处理步骤,以使得估计的音调的谐波可以被基本保留。
通过防止近端信号音调谐波的意外衰减,本发明的方法提供了后处理残留信号的质量的显著改进。
本发明的方法优选进一步包括估计回波消除信号音调的步骤,控制步骤被设置来根据估计的残留信号音调和估计的回波消除信号音调进行控制。
本发明另外提供一种计算机程序产品,用于执行上面定义的方法。计算机程序产品可以包括存储在数据载体(例如CD或DVD)上的一组计算机可执行指令。这组计算机可执行指令也可以例如通过因特网从远程服务器下载,该组指令使得可编程计算机能够执行上面定义的方法。
详细描述
图1中所示的根据现有技术的声回波消除设备1′包括自适应滤波器(AF)单元10、滤波器系数(FC)单元11、组合单元12和后处理器(PP)单元13。设备1′可以进一步包括D/A(数/模)转换器、A/D(模/数)转换器、放大器和其它组件,为了示例的清楚性而未在图1中示出。
在设备1′的输入端A接收远端信号x。该输入信号x被馈送到扬声器2,其将这个信号转换为声音。这个声音的一部分被麦克风3接收,作为声回波e。麦克风3还接收声学的近端声音s,并将回波e和近端声音s的组合转换为麦克风信号z,其被馈送到组合单元12。
输入信号x还被馈送到自适应滤波器单元10和相关的滤波器系数单元(或滤波器更新单元)11,滤波器系数单元11还接收残留信号r并且设置自适应滤波器10的系数以使信号x和r之间的相关性最小。
自适应滤波器单元10滤波输入信号x,并且产生回波消除信号y,其理想地等于麦克风信号z的回波成分。麦克风信号z和回波消除信号y在组合单元12中组合起来,在本示例中组合单元12由一个加法器构成。回波消除信号y被冠以负号,从而从麦克风信号z中减去回波消除信号,产生了残留信号r。
尽管理想上残留信号r不包含回波成分,实际上一些回波成分将会保留。因为这个原因,加上一个后处理器13,其进一步处理残留信号r以产生一个处理过的残留信号rp。后处理器13还接收回波消除信号y以进一步根据信号y来处理残留信号r。一种适合的处理操作是谱减法,其中残留信号rp的频谱的绝对值|Rp|例如由|Rp|=|R|-γ|Y|来确定,其中|R|和|Y|分别是信号r和y的频谱的绝对值,其中γ是过减参数。这种类型的后处理操作在上面提到过的US6546099中进行了详细描述。后处理器单元13输出的已处理残留信号rp被馈送到设备1′的输出端B。
在一些情况中发现,图1描述的现有技术的设备1′产生的输出信号rp的质量不令人满意。在(移动或无线)电话机被用于免提模式的时候,例如,回波e可能比近端声音s大得多,特别是在人相对远离手机讲话的时候。结果,近端信号将会被设备1′大量抑制。回波消除信号y几乎等于麦克风信号z,近端信号的所有剩余成分被后处理器衰减。作为结果的输出信号rp将会失真。
本发明通过根据近端信号适当控制后处理器来解决这个问题。
通过附图2中非限制性实例的方式示出的依照本发明的声回波消除设备1也包括自适应滤波器(AF)单元10、滤波器系数(FC)单元11、组合单元12和后处理器(PP)单元13。另外,本发明的设备1包括一近端音调估计单元18,其被设置来估计近端信号s的音调并且产生一个衰减控制信号(或信号组)c。
本领域技术人员很清楚设备1可以进一步包括放大器、D/A(数/模)转换器、A/D(模/数)转换器、一个或多个带通滤波器和其它组件,为了示例的清楚性而未在图2中示出。
图2中示出的近端音调估计单元18被耦合到组合单元12的输出端和自适应滤波器单元10的输出端以分别接收残留信号r和回波消除信号y。近端音调估计单元18被示出包括一个残留音调估计(RPE)单元15,残留信号r被馈送到该残留音调估计单元,还包括一个接收回波消除信号y的回波音调估计(EPE)单元16。音调估计单元15和16的每一个都估计各自信号的音调(基频),并且将这个音调信息馈送到基于音调的控制(PBC)单元17,这个基于音调的控制单元在示出的实施例中也是近端音调估计单元18的一部分。基于音调的控制(PBC)单元17比较音调信息,输出相应的衰减控制信号c,其被馈送到后处理器13。
后处理器13试图通过基于时间和频率的衰减来消除保留在残留信号r中的所有回波成分。为此,后处理器提供一种基于时间和频率的增益功能,其选择性地衰减那些存在显著残留远端回波的频率点。这个增益功能可以利用谱减法来确定,如上面参考图1所提到的。残留信号rP的频谱的绝对值|RP|,例如由|Rp|=|R|-γ|Y|来确定,其中|R|和|Y|分别是信号r和y的频谱的绝对值,其中γ是过减参数。其它谱减方法包括将频谱Y分离为几个组成部分,每一个都具有一个单独的γ值,和/或可以包括麦克风信号z的频谱Z。这种类型的后处理操作在上面提到的US6546099中进行了详细描述。
当回波e比近端声音s大得多的时候,回波抑制信号y的信号电平将会相对于近端信号高。结果,后处理器可以将近端信号衰减到输出信号(处理过的残留信号)rP失真的程度。为了防止这个,图2中示例的后处理器13具有一个额外的用于接收衰减控制信号c的输入端。这个衰减控制信号(或衰减控制信号)c允许某些频带在某些时间间隔期间免除衰减,或至少限制在那些频带中的衰减,以便保留存在于那些频带中的近端信号的所有成分。这将会在后面参考图4进行进一步解释。
注意到相关频带的衰减或者是一致的(在处理器中包含近端信号成分的所有频带接收一致的衰减,典型地没有衰减),或者是选择性的(所有相关频带接收各自的衰减)。选择性的衰减允许已处理残留信号的频率整形,例如通过使这个信号衰减,衰减随频率而增加。这个选择性衰减信息可以被用在基于音调的控制单元17中以产生衰减控制信号c。
近端音调估计单元18估计近端信号的音调。因为这个信号不是直接可用,不得不进行间接估计或近似。第一近似是基于残留信号r,其包括近端信号。残留音调估计器(RPE)单元15提供这个音调的一个估计,将这个估计信息馈送到基于音调的控制(PBC)单元17,在这里估计信息被转换为衰减控制信号c。
在理想的情况下,残留信号r产生一个很好的近端信号估计。但是,当回波相对大的时候,残留信号典型地仍包含回波成分,其使得近端音调的估计较不可靠。另外,残留音调估计单元15不能区分近端音调和(残留)回波音调。由于这个原因,图2中示例的近端音调估计单元18还包括被设置来估计回波消除信号音调的回波音调估计(EPE)单元16。在可替换的实施例中(未示出),近端音调估计单元18没有包括回波音调估计(EPE)单元16,且衰减控制信号c只基于残留信号r的音调。
回波音调估计(EPE)单元16提供回波消除信号y的音调估计。注意到本领域中音调估计技术是公知的。适当的音调估计技术在J.D.Wise,J.R.Caprio和Th.W.Parks的论文“Maximum LikelihoodPitch Estimation”中进行了描述(IEEE Transactions on Acoustics,Speech and Signal Processing,Vol.ASSP-24,No.5,October1976)。
当回波消除信号y的音调已经被回波音调估计(EPE)单元16确定,于是基于音调的控制单元17比较由单元15和16产生的音调估计(也就是频率)。如果估计的音调值不同,那么残留信号音调估计被认为是正确的,并且产生衰减控制信号c。但是,如果估计的音调值近似相等,那么残留信号音调估计被认为是不正确的且后处理器的衰减不能被改变。基于音调的控制单元17有效地检查由RPE 15估计的音调是否就是近端信号的音调。
注意到音调估计和衰减控制信号c的确定可以例如每个时间帧或每个毫秒进行有规律地重复。
近端估计单元18可以进一步包括有声/无声检测器单元(未示出),用于检测近端信号是否包含有声语音。该有声/无声检测器单元可以被并行连接到残留音调估计单元15,从组合单元12的输出端接收残留信号r,并且只在存在有声语音信号的时候,将有声/无声信号馈送到基于音调的控制单元17以保留检测到的音调和它的谐波。因为在这里使用的这种情况下只有有声语音信号具有真实的音调,在无声语音的情况下音调保留可能导致失真。由于这个原因,基于音调的控制单元17可以被设置来在有声语音信号被有声/无声检测器检测到的时候仅仅阻止对估计的音调信号和它的谐波的衰减。有声/无声检测技术在本领域是公知的。
在图3的实施例中,近端估计单元18被示出包括设置在组合单元12和残留音调估计(RPE)单元15之间的梳状滤波器(CF)单元14。梳状滤波器单元14从回波音调估计(EPE)单元16接收控制信号。
梳状滤波器单元14被设置在估计残留信号r的音调之前对残留信号r进行滤波以衰减回波的所有谐波,也就是远端信号x的所有谐波。梳状滤波器14的系数基于回波消除信号y的估计音调,并由回波音调估计单元16控制。因为回波谐波被抑制,残留音调估计单元15提供的估计被改善。
图3的实施例进一步示出了组合单元12的输入端和后处理器之间的可选连接C。这个连接用于将麦克风信号z馈送到后处理器,以允许后处理器利用这个信号。但是,这个连接不是必需的,如果必要的话可以利用公式z=r+y从回波消除信号y和残留信号r来得到麦克风信号z。
另外,图3的实施例包括耦合在麦克风3和组合单元12之间的可选带通滤波器(BPF)单元19。这个滤波器单元用于抑制不是近端声音s的一部分的所有频率,这样简化了声回波消除器1的任务。
本发明提供的选择性衰减在图4中进行了说明,其示意性地示出了后处理器(图2和3中的13)的增益G作为频率(或频率点数量)f的一个函数。在图4的实例中,增益G被示出具有两个电平:一个相对低的电平G1和一个相对高的电平G2(例如等于1.0)。较低电平G1例如可以与等于0.3的增益(其相当于-10.5dB的衰减)相一致,而较高电平G2例如可以与等于1.0的增益(其相当于0dB的衰减)相一致,
增益在频率f0、f1、f2和f3的受保护频率范围(或频率点)HP内具有较高电平G2,在剩余频率的未保护频率范围Hu内具有较低电平G1。在示出的实例中,受保护的频谱范围HP与近端信号的估计音调或基频f0和它的谐波f1、f2和f3相一致。众所周知,谐波位于n×f0处,其中n=2,3,4。如果音调或基频f0已知,例如通过估计,谐波频率因此也是已知的。
依照本发明,近端信号的音调f0被估计。一旦这个音调已知,适当的衰减控制信号(图2和3中的c)被发送到后处理器,其基本上防止或限制了这些频率的衰减。在图4的实例中,频带HP被定义,其典型地与该近端信号(未示出)频谱中的峰值相一致。在这些受保护的频带中,后处理器的衰减被基本防止。
因此,通过防止近端信号在其基频和谐波处的衰减,可以防止后处理器引入近端信号和输出信号rp的质量的任何失真,处理的残留信号被显著地改善。
图5中图示的用户设备5包括依照本发明的声回波消除(AEC)设备1,还包括扬声器2和麦克风3。在图5中示出的实施例中,用户设备5是移动(也就是蜂窝)电话设备,其包括被耦合到声回波消除(AEC)设备1的移动通信(MC)单元6,扬声器2和麦克风3。由于声回波消除设备1的优良特性,本发明的用户设备5具有极大改善的声音质量。
本发明可以通过硬件和/或软件实现。硬件实现可以包括特定应用的集成电路(ASIC)。软件实现可以包括能够在常规或特定用途计算机上执行的软件程序。
本发明基于这样的认识:声回波消除器的残留信号的后处理可以通过考虑近端信号的频率结构而被改善,特别是防止近端信号谐波的衰减。本发明受益于进一步的认识:近端信号的音调可以通过利用残留信号,优选还利用回波消除信号,来进行估计。
注意到,本文档中使用的所有术语不应该被解释为限制本发明的范围,特别得,词语“包括”不意味着排除没有明确声明的任何单元。单个(电路)单元可以被多个(电路)单元或它们的等同物取代。
那些本领域技术人员应理解本发明不限于上面示例的实施例,可以在不脱离附加的权利要求定义的发明范围下进行很多修改和添加。