CN110169041A - 声回波消除 - Google Patents
声回波消除 Download PDFInfo
- Publication number
- CN110169041A CN110169041A CN201780080986.XA CN201780080986A CN110169041A CN 110169041 A CN110169041 A CN 110169041A CN 201780080986 A CN201780080986 A CN 201780080986A CN 110169041 A CN110169041 A CN 110169041A
- Authority
- CN
- China
- Prior art keywords
- signal
- sef
- adaptive
- filter
- adapting filter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000003044 adaptive effect Effects 0.000 claims abstract description 40
- 230000005540 biological transmission Effects 0.000 claims abstract description 32
- 238000001914 filtration Methods 0.000 claims abstract description 25
- 238000013016 damping Methods 0.000 claims abstract description 12
- 238000012546 transfer Methods 0.000 claims abstract description 12
- 238000000034 method Methods 0.000 claims description 29
- 238000001228 spectrum Methods 0.000 claims description 13
- 230000006978 adaptation Effects 0.000 claims description 5
- 238000013459 approach Methods 0.000 claims description 4
- 238000001514 detection method Methods 0.000 claims description 3
- 238000007619 statistical method Methods 0.000 claims description 2
- 230000008030 elimination Effects 0.000 abstract 1
- 238000003379 elimination reaction Methods 0.000 abstract 1
- 230000006870 function Effects 0.000 description 35
- 238000010586 diagram Methods 0.000 description 7
- 230000021615 conjugation Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 230000005855 radiation Effects 0.000 description 3
- 230000000717 retained effect Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 230000001629 suppression Effects 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 241000209140 Triticum Species 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 210000001367 artery Anatomy 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000002592 echocardiography Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 238000004080 punching Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 238000002945 steepest descent method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 210000003462 vein Anatomy 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M9/00—Arrangements for interconnection not involving centralised switching
- H04M9/08—Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
- H04M9/082—Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/165—Management of the audio stream, e.g. setting of volume, audio stream path
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02082—Noise filtering the noise being echo, reverberation of the speech
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Theoretical Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
消除声回波包括利用麦克风拾取由声源产生并经由具有未知传递函数的未知传递路径从所述声源传递到所述麦克风的声音,并且从中提供电麦克风信号。它还包括利用自适应滤波器的估计传递函数来逼近所述未知传递函数并且利用所述估计传递函数对代表由所述声源产生的所述声音的电信号进行滤波以从中提供估计信号,所述自适应滤波器具有适应性自适应步长。它还包括利用自适应后滤波器的后滤波器传递函数对差值信号进行滤波,所述差值信号是所述麦克风信号与所述估计信号之间的差值。所述后滤波器传递函数是一与所述适应性自适应步长之间的差值,并且所述自适应后滤波器被配置成具有最小阻尼,所述最小阻尼被限于最小阈值。
Description
技术领域
本公开涉及一种声回波消除的系统和方法(通常被称为“声回波消除器”)。
背景技术
在发射和接收声信号(例如,包括音乐、语音等的声音)的同时抑制、消除或补偿回波或混响效应通常被称为声回波消除(AEC)。例如,在免提电话上呼叫期间,呼叫者的声音从扬声器到达远程订户处的麦克风并且传输回到呼叫者,呼叫者在讲话的同时经历他自己声音的回波。回波消除用来降低此类不希望的效应。
发明内容
一种用于消除声回波的系统包括麦克风,所述麦克风被配置成拾取由声源产生并经由具有未知传递函数的未知传递路径从所述声源传递到所述麦克风的声音,并且从中提供电麦克风信号。所述系统还包括自适应滤波器,所述自适应滤波器被配置成利用估计传递函数来逼近所述未知传递函数并且利用所述估计传递函数对代表由所述声源产生的所述声音的电信号进行滤波以从中提供估计信号,所述自适应滤波器具有适应性自适应步长。所述系统还包括自适应后滤波器,所述自适应后滤波器被配置成利用后滤波器传递函数对差值信号进行滤波,所述差值信号是所述麦克风信号与所述估计的信号之间的差值。所述后滤波器传递函数是一与所述适应性自适应步长之间的差值,并且所述自适应后滤波器被配置成具有最小阻尼,所述最小阻尼被限于最小阈值。
一种用于消除声回波的方法包括利用麦克风拾取由声源产生并经由具有未知传递函数的未知传递路径从所述声源传递到所述麦克风的声音,并且从中提供电麦克风信号。所述方法还包括利用自适应滤波器的估计传递函数来逼近所述未知传递函数并且利用所述估计传递函数对代表由所述声源产生的所述声音的电信号进行滤波以从中提供估计信号,所述自适应滤波器具有适应性自适应步长。所述方法还包括利用自适应后滤波器的后滤波器传递函数对差值信号进行滤波,所述差值信号是所述麦克风信号与所述估计信号之间的差值。所述后滤波器传递函数是一与所述适应性自适应步长之间的差值,并且所述自适应后滤波器被配置成具有最小阻尼,所述最小阻尼被限于最小阈值。
在查阅以下详细描述和所附附图后,其他系统、方法、特征和优点将对本领域的技术人员来说显而易见。所有此类附加的系统、方法、特征和优点旨在包括在本说明书内、在本发明的范围内,并且受所附权利要求保护。
附图说明
参考以下附图和描述可更好地理解所述系统。在附图中,相同的附图标记指代贯穿不同视图的对应部分。
图1是示出基本声回波消除器的信号流图。
图2是基于重叠保留的频域自适应滤波器的信号流图。
图3是示出声回波消除器的信号流图,其中自适应后滤波器充当残余回波抑制器。
图4是示出基本多重单通道声回波消除器的信号流图。
图5是示出具有用于产生近似二维各向同性波场的多个扬声器和安装在相同装置处的多个误差麦克风的示例性装置的示意图。
图6是示出具有自动麦克风校准的多重单通道声回波消除器的信号流图。
具体实施方式
图1是示出可应用于声回波消除器(AEC)的基本自适应系统识别的信号流图。为简单起见,图1参考在时域中操作的声回波消除器,但其他声回波消除器(例如,在子带中或在频域中操作)也可适用。可以例如通过从包括回波的总声音信号中减去表示对这些回波的估计的估计回波信号来获得声回波消除。为了提供对实际回波信号的估计,可以利用在时域中操作且可以采用用于处理时间离散信号的自适应数字滤波器的算法。所采用的自适应数字滤波器可以按特定方式操作,使得参考预定质量函数来优化限定滤波器的传输特性的网络参数。例如通过参考参考信号最小化自适应网络的输出信号的均方误差来实施质量函数。
在图1所示的示例性布置中,未知系统101和自适应滤波器102并行地操作。未知系统101根据其传递函数w(n)而将来自信号源103的输入信号x(n)转换成信号y(n)。信号源103可以是扬声器,并且输入信号x(n)可以是供应到扬声器并由其重现的信号。信号y(n)可以是麦克风104的输出信号,所述麦克风104拾取由扬声器重现并经由未知系统101传递到麦克风104的声音。自适应滤波器102根据其传递函数而将输入信号x(n)转换成信号信号y(n),作为被具有未知传递函数w(n)的未知系统101扭曲的输入信号x(n),被视作期望的信号。自适应滤波器102的输出(即,信号)是由自适应滤波器102在滤波器控制器105的控制下依据输入信号x(n)和误差信号e(n)而从输入信号x(n)推断出来的。采用例如已知的最小均方(LMS)算法,滤波器控制器105以迭代循环调整自适应滤波器102的滤波器系数,使得作为信号y(n)与信号之间的差值(如由图1中的减法器106表示)的误差信号e(n)被最小化。因此,信号近似于信号y(n),并且未知传递函数w(n)近似为传递函数使得就消除而言,信号y(n)例如回波信号的最大消除通过信号获得。
LMS算法是基于所谓的最陡下降方法(梯度下降方法)并且以简单方式近似于梯度。所述算法以时间递归方式操作,也就是说,所述算法利用每个新数据集一遍又一遍地运行并且相应地更新答案。归因于其较小的复杂性、其数值稳定性和低存储要求,LMS算法非常适合于自适应滤波器和自适应控制。替代地,自适应算法可以采用例如递归最小二乘方、QR分解最小二乘方、最小二乘格、QR分解格或梯度自适应格、迫零、随机梯度算法等。无限脉冲响应(IIR)滤波器或有限脉冲响应(FIR)滤波器可以结合以上自适应算法用作自适应滤波器。
尽管事实上时域声回波消除器具有一些益处,诸如最小存储消耗和低时延,但时域操作也涉及一些缺点,诸如低消除性能、高处理器负载和算法的受限控制。其他类型的声回波消除器,例如在子带中或在频域中操作的那些可以更适合一些应用,并且可以处理更大的灵活度,例如以便控制自适应步长或者采用实施残余回波抑制(RES)功能的自适应后滤波器(APF)。有效的声回波消除器是基于可以使用重叠保留(OLS)法的已知频域自适应滤波器(FDAF)结构,从而充当信号处理帧,并且可以利用至少50%的重叠。
图2中详细地示出具有基于重叠保留的频域自适应滤波器的声回波消除器。应注意,输入信号与输出信号之间的时延可以由重叠的大小控制。如果使用50%的最小重叠,所述最小重叠是N/2,其中N表示快速傅里叶变换(FFT)的长度,则可以实现高效率。同时,这也反映N/2[样本]的最大可能时延。现在可以自由地选择重叠的大小并且因此将系统调整至最小可接受时延和/或调整至可用处理能力,以发现处理能力与时延之间的良好折衷。
频域块最小均方(FBLMS)算法是用于在频域中实施自适应滤波器的非常有效方法。FBLMS算法可以实施为重叠保留算法或重叠相加算法。重叠保留算法可以比重叠相加算法更有效地实施,并且因此用于下述声回波消除器。根据图2,使用重叠保留FBLMS算法的声回波消除器可以包括用于提供新输入块信号的功能块219、用于使用输出块信号的最后一半(在50%重叠的情况下)的功能块205、用于填充零的功能块207、用于清除块的第二半的功能块214、用于添加零的功能块215,以及用于形成共轭复频谱的功能块217。此外,在声回波消除器中,包括信号乘法器203、210和218、用于FFT的功能块220、208和216、用于快速傅里叶逆变换(IFFT)的两个功能块204和213、延迟单元212,以及两个信号加法器206和211。
功能块219的输出提供新输入块信号,所述新输入块信号供应到用于执行FFT的功能块220。功能块220的输出供应到信号乘法器203并且供应到用于形成共轭复频谱的功能块217的输入。信号乘法器203的输出供应到用于IFFT的功能块204,所述功能块204的输出供应到用于使用输出块信号的最后一半(在50%重叠的情况下)的功能块205。功能块205的输出供应到信号加法器206,所述信号加法器206的输出供应到用于用零填充块的第一半(在50%重叠的情况下)的功能块207。
用于用零填充块的第一半(在50%重叠的情况下)的功能块207的输出供应到用于FFT的功能块208,所述功能块208的输出供应到信号乘法器218。信号乘法器218的输出供应到信号乘法器210。继而,信号乘法器210的输出供应到信号加法器211。延迟单元212的输出供应到信号加法器211的另一输入并且输入到用于IFFT的功能块213。
用于IFFT的功能块213的输出供应到用于清除块的最后一半的功能块214,所述功能块214的输出供应到用于添加零的功能块215。用于向块的最后一半添加零的功能块215的输出供应到用于FFT的功能块216,所述功能块216的输出供应到信号乘法器203的另一输入。用于FFT的功能块220的输出也供应到用于形成共轭复频谱的功能块217,所述功能块217的输出供应到信号乘法器218的另一输入。
用于构建新输入块信号的功能块219的输入接收输入信号x(n)并形成输入块信号,根据选择的重叠,所述输入块信号包括先前处理的信号块“老”的信号部分和当前接收的输入信号x(n)的信号部分。这个输入块信号供应到用于FFT的功能块220,在所述功能块220的输出处相应地提供变换到频域的信号X(ejΩ,n)。这个输出信号X(ejΩ,n)供应到信号乘法器203以及用于形成共轭复频谱的功能块217。
信号通过在信号乘法器203中将信号X(ejΩ,n)乘以功能块216的输出信号而供应到用于IFFT的功能块204,由此在功能块204的输出处形成变换到时域的对应输出信号。这个输出信号随后供应到用于使用输出块信号的最后一半(在50%重叠的情况下)的功能块205以进一步处理。在这个功能块中,使用块信号的最后一半(重叠为50%)来构建信号
输出信号供应到信号加法器206,所述信号加法器的另一输入接收信号y(n)。信号从信号加法器206中的信号y(n)减去,由此在信号加法器206处形成误差信号e(n)。误差信号e(n)供应到用于填充零的功能块207,使得这个误差块的第一半充满零(重叠为50%,见用于构建新输入块信号的功能块219)。
以这种方式在用于填充零的功能块207的输出处实施的信号路由到用于FFT的功能块208的输入,在所述功能块208的输出处提供变换到频率范围的信号E(ejΩ,n)。在后续信号乘法器218中,这个信号E(ejΩ,n)乘以通过功能块217中的适当处理而从用于FFT的功能块220的输出信号X(ejΩ,n)中出现的信号X*(ejΩ,n),以产生共轭复频谱。在信号乘法器218的输出处从中出现的信号随后供应到信号乘法器210。
在信号乘法器210中,这个输出信号乘以2·μ(ejΩ,n),其中μ(ejΩ,n)对应于自适应滤波器的时间和频率相关步长。信号乘法器210的输出信号随后在信号加法器211中加到信号信号通过由延迟单元212实施的对应延迟而从用于FFT的功能块216的输出信号出现。信号加法器211的所得输出信号W(ejΩ,n+1)供应到用于IFFT的功能块213,所述功能块213相应地提供变换回到时域的输出信号。
FIR滤波器的滤波器系数块的第二半在功能块214中被丢弃并且在功能块215中用系数值零代替。通过功能块216,信号继而变换成频域中的信号并且供应到信号乘法器203以用于乘以信号X(ejΩ,n)。在根据图2的信号流程图中由用于IFFT的功能块213、用于清除块的最后一半的系数的功能块214、用于添加零的功能块215和用于FFT的功能块216实施的信号处理块响应于重叠保留FBLMS算法而被识别为“约束条件”。
在当前示例中,FBLMS算法包括标准化频率选择性时变自适应步长μ(ejΩ,n)。这个自适应步长μ(ejΩ,n)归一化到输入信号X(ejΩ,n)的功率密度谱。归一化具有补偿输入信号的幅度的波动的效果,从而允许自适应滤波器以更快的速度收敛。这个归一化具有积极效果,因为声回波消除器系统中的FBLMS算法并且因为将包括明显幅度波动的语音信号用作输入信号。常规自适应滤波器始终包括较慢会聚速度,这可以通过频域中的归一化而以简单的方式避免。
参考图3,由于图1所示的声回波消除器仅能够控制未知系统的线性部分,因此附加的APF 301可以连接在减法器106的下游以便进一步减少源于例如未知系统101的非线性部分的回波。在想要减少回波诸如从诸如源103的扬声器辐射并由诸如麦克风104的麦克风拾取的信号(如在例如免提系统、手持型或移动装置中常见)的情况下,一旦扬声器被驱动超出某一上限水平就会出现问题。在这种情形下,将不可避免地产生非线性,这主要归因于扬声器,特别是在微型扬声器的情况下。由于常见声回波消除器无法处理非线性,因此所谓的残余回波将不合需要地留在输出信号中。出于这个原因,可以采用残余回波抑制器。由扬声器产生的非线性的程度取决于音量以及输入信号的内容。
在下文描述的示例性声回波消除器中,残余回波抑制器自动地适应当前情形,例如,适应输入信号的能量含量并且因此适应所产生的非线性的潜在程度。将残余回波抑制器设定到固定侵入状态将负面地影响输出信号(例如,语音信号)的声品质,特别是在不存在或仅存在很少残余回波的情况下。声回波消除器被设计成将使用残余回波抑制器的程度保持尽可能低,而同时依据当前输入信号能量来调整其性能。声回波消除器不要求很多处理能力和存储。
声回波消除器可以在各种不希望的情形下操作,诸如双向通话或房间脉冲响应(RIR)、也被称为次级路径的突然变化。对自适应步长μ(ejΩ,n)的自适应控制可以描述如下:
μ(ejΩ,n)=Dist(ejΩ,n)SNR(ejΩ,n),其中
Ω是归一化频率(k/fs),其中k是离散频率槽,
n是离散时间索引,
Dist(ejΩ,n)是时间和频率相关的估计系统距离,并且
SNR(ejΩ,n)是时间和频率相关的估计信噪比。
结合如图2所示的FDAF,使用类似于Gerald Enzner、Peter Varymay,“Robust andElegant,Purely Statistical Adaptation of Acoustic Echo Canceler and PostFilter,International Workshop on Acoustic Echo and Noise Control(IWAENC2003),2003年9月,Kyoto,Japan的基于统计法来计算适应性自适应步长μ(ejΩ,n)和自适应后滤波器的系统和方法,其可以简化如下:
步长:
μ(ejΩ,n)==[μ(ejΩ 0,n),...,μ(ejΩ N-1,n)]T
后滤波器:H(ejΩ,n)==1-μ(ejΩ,n),其中1=[1,...,1]T
系统距离:|G(ejΩ k,n+1)|2=|G(ejΩ k,n)|2(1-μ(ejΩ k,n))+Δ(ejΩ k,n)
其中Δ(ejΩ k,n)=C∣W(ejΩ k,n)∣2,其中C是可以用于分别控制双向通话检测、重新适应的速度的常量。
一旦已知适应性自适应步长μ(ejΩ,n),就通过从所述自适应步长中减去一来计算频率和时间相关APF滤波器传递函数H(ejΩ,n)。此外,可以利用纯统计方法来估计系统距离G(ejΩ,n)。利用调谐参数C,可以控制自适应步长μ(ejΩ,n)以在双向通话情形下更好地表现:C越小,双向通话检测(DTD)性能越好,或者使得声回波消除器能够在快速次级路径改变的情况下迅速地重新适应。所有这些计算步骤都可以在滤波器控制块302中进行,所述滤波器控制块302代替图1所示的声回波消除器中使用的控制器105并且控制滤波器102和301。
自适应后滤波器301的目的是抑制(线性)声回波消除器的输出信号e(n)内剩余的潜在残余回波。声回波消除器在一些方面类似于单通道噪声降低,例如,就频率减法而言。因此,自适应后滤波器301表示可以产生不想要的声伪影(例如,乐音)的非线性信号处理级。避免伪影的一种方式是将自适应后滤波器301的(频率相关)阻尼限于最小阈值Hmin,如下所示:
如果Hmin设定为大约Hmin≥-6[dB]的值,则将产生更少或甚至没有声干扰伪影,而在约Hmin≤-9[dB]的值处,可以感知到更多声伪影,使得可以选择驻留在这个值范围内的最小阈值Hmin。
如先前提及,自适应后滤波器301的目的是抑制残余回波,否则所述参数回波将不会被线性自适应回波消除器减少,例如归因于未知系统的非线性。未知扬声器-封闭环境-麦克风(LEM)系统内的最相关非线性部分取决于所利用的扬声器。由此的确,音量越高,即,音圈的偏移越高,扬声器将越可能产生非线性。在这方面,可以采用音量设置(表示输入信号的幅度)或更一般地说,输入功率(即,输入信号的功率)控制的最小阈值Hmin(px(n)),其中px(n)指定输入信号x(n)的估计的时变功率,并且α是平滑参数(α∈[0,...,1[):
px(n)=αpx(n-1)+(1-α)x(n)2。
由此,输入功率控制的最小阈值Hmin(px(n))可以实现如下:
其中
HMinInit是独立于输入信号功率的固定最小阈值,
pxdB(n)=10log10{px(n)}是以[dB]为单位的输入信号功率,
px dB TH是以[dB]为单位的输入信号功率的阈值。
这意味着,如果当前输入功率pxdB(n)(以[dB]为单位)保持低于某一输入功率阈值pxdBTH,则固定最小阈值HMinInit将用于Hmin(px(n))。否则,将基于瞬间输入功率pxdB(n)、最小阈值HMinInit和输入功率阈值pxdBTH来确定瞬间阈值Hmin(px(n)),以这样的方式使得输入功率越高,它将线性地增长(在对数域中)。另外,对最小阈值Hmin(px(n))的控制可以不仅基于输入信号的功率,即输入功率pxdB(n)来确定,而且基于输入信号的频谱组成(频谱)。例如,后滤波器的频率相关最小阈值Hmin(px(n))可以仅在其中对应频谱输入功率pxdB(n)增长的频谱范围(频率范围)中改变。这可以在开关模式下执行,即,在输入功率pxdB(n)超过某一最小输入功率的情况下,或者在滑动模式下执行,例如根据预定函数,即,将输入功率pxdB(n)转换为最小后滤波器阈值。
图4示出了利用单通道参考信号(单个扬声器在播放来自信号源103的单声道输入信号x(n))和经由未知系统(路径)1011、……、101M的传递函数w1(z)、……、wM(z)声耦合到源103的M>1个误差麦克风1041、……、104M的多重单通道声回波消除器。如可以看出,在这种情况下,采用M次先前公开的如图1所示的单通道声回波消除器就足够了。未知系统(路径)1011、……、101M的传递函数w1(z)、……、wM(z)由自适应滤波器1021、……、102M利用传递函数在滤波器控制器1051、……、105M的控制下基于输入信号x(n)和误差信号e1(n)、……、eM(n)来逼近。自适应滤波器1021、……、102M提供信号所述信号由减法器1061、……、106M从未知系统(路径)1011、……、101M的输出信号y1(n)、……、yM(n)中减去以产生误差信号e1(n)、……、eM(n)。
如图4所描绘的情形在例如移动或手持装置中出现,所述移动或手持装置具有小尺寸并且能够用声音填满整个水平平面或理想地整个三维房间,例如,以模拟理想的各向同性辐射器。在这种情况下,重要的是装置是否能够播放立体或多通道信号,诸如5.1环绕声通道等,因为主要着眼于创建理想(单声道)各向同性波场。在这种特殊情况下,所有涉及的扬声器都可以被视作具有稍微全方向的圆柱形或球形辐射图案的一个虚拟扬声器(源103)。在这个虚拟全方向源附近的与其具有类似距离的麦克风然后将理想地拾取相同的声压级(SPL)。
图5中示出了大致满足上述要求的装置500。它包括例如安装在圆柱形主体502处的五个规则地分布的宽带扬声器501(图5中有两个不可见)和安装在装置的底部(图5中不可见)处的座地发射的亚低音扬声器503,以及八个等角地分布的全方向麦克风504(图5中有五个不可见),每一者位于安装在装置500的主体502处的空腔505的中心。如可以看出,扬声器501安装在圆柱形主体502处的层和麦克风504并行地安装的层的距离(即,麦克风504与虚拟圆柱形辐射扬声器501之间的距离)是相同的。“规则地分布”意指麦克风根据建立的规则或原则进行设置或布置,诸如相对于彼此等边地和/或等角地分布。相反,“不规则地分布”包括诸如随机分布的所有其他分布。
参考图6,结合如图5所示的装置,声回波消除器和可能地接下来各级(诸如束成形器)的回波消除性能可以通过引入能够合并到图4所描绘的声回波消除器中的自校准多麦克风布置而进一步改进。自校准多麦克风布置可以包括(一个或)多个麦克风1041、……、104M、麦克风校准块601和可控增益块6021、……、602M。可控增益块6021、……、602M连接在减法器1061、……、106M上游,并且由麦克风校准块601依据来自控制块1051、……、105M。的信号进行控制。由此,一旦多个自适应滤波器1021、……、102M已经收敛,这可以例如由以下情况指示:误差信号的功率的最大值max{pe(n)}(其中pe(n)=[pe1(n),...,peM(n)]和pem(n),这类似于px(n)=αpx(n-1)+(1-α)x(n)2来计算)底切可调下限阈值peTH,所有当前滤波器系数集就将用来计算用于M个麦克风信号ym(n),的缩放值gm(n),如下:
只有在确保已经以至少最小准确度估计一个或多个扬声器与一个或多个麦克风之间的未知传递函数的情况下,例如,在估计的系统距离底切预定下限阈值的情况下,才可以执行单独麦克风的缩放或频谱调谐。可以估计系统距离,如以下所述Gerald Enzner、Peter Varymay,“Robust and Elegant,Purely Statistical Adaptation of AcousticEcho Canceler and Post Filter,International Workshop on Acoustic Echo andNoise Control(IWAENC2003),2003年9月,Kyoto,Japan或E.G.Schmidt,“Topicsin Speech and Audio Processing in Adverse Environment”,Springer Verlag BerlinHeidelberg,2008年。在单独麦克风的非频谱调谐,即缩放(例如,仅放大)的情况下,另外地,某一频谱范围(例如,在100Hz与500Hz之间)的功率/能量可以用于确定缩放值。
如果仅使用单个麦克风(未示出)而不是多个麦克风1041、……、104M来拾取由声源103产生并经由具有未知传递函数的未知传递路径从声源103传递到单个麦克风的声音,并且因此仅提供单个电麦克风信号,则麦克风校准布置可以依据可以表示预定参考水平或者一个或多个期望(估计)传递函数的第一参考信号来单独地衰减或放大单个电麦克风信号。第一参考信号可以由存储并供应第一参考信号的存储器块(未示出)提供。
然而,如果使用多个麦克风1041、……、104M来拾取由声源103产生并经由具有多个未知传递函数的多个未知传递路径从声源103传递到多个麦克风1041、……、104M的声音,并且提供多个电麦克风信号,则麦克风校准块601可以依据从多个估计传递函数中的一者或多者导出的一个或多个第二参考信号来单独地频率相关或无关地衰减或放大(例如,滤波)多个电麦克风信号。一个或多个第二参考信号可以表示一个预定增益(频率相关或无关放大或衰减)或多个预定增益。替代地,一个或多个第二参考信号可以表示多个估计传递函数中的一些或全部的平均,或者估计传递函数中的充当用于进一步适配待估计的其他传递函数中的一者、多者或全部的参考的选定的一者。例如,单个第二参考信号可以表示估计传递函数中的除了与待依据这个单个第二参考信号进行滤波的电麦克风信号对应的估计传递函数之外的一者。
声回波消除器电路的部分或全部可以实施为由处理器或可编程数字电路执行的软件和固件。应认识到,本文所公开的任何声回波消除器电路可以包括任何数量的微处理器、集成电路、存储器装置(例如,闪存、随机存取存储器(RAM)、只读存储器(ROM)、电可编程只读存储器(EPROM)、电可擦除可编程只读存储器(EEPROM)或它们的其他合适的变体)以及软件,它们协作以执行本文所公开的操作。另外,所公开的任何声回波消除器电路可以利用任一个或多个微处理器来执行计算机程序,所述计算机程序体现在被编程为执行所公开的任何数量的功能的非暂时性计算机可读介质中。此外,本文提供的任何控制器包括外壳和各种数量的微处理器、集成电路和存储器装置(例如,闪存、随机存取存储器(RAM)、只读存储器(ROM)、电可编程只读存储器(EPROM)和/或电可擦除可编程只读存储器(EEPROM)。
已经出于说明和描述的目的呈现了对实施方案的描述。对实施方案的适当修改和变化可以鉴于以上描述来执行或可以从实践所述方法来获取。例如,除非另外指明,否则所述方法中的一者或多者可以由合适的装置和/或装置组合来执行。所述方法和相关联的动作也可以按照除本申请中所述的顺序之外的各种顺序、并行地和/或同时地执行。所述系统本质上是示例性的,并且可以包括附加元件和/或省略元件。
如本申请中所使用,以单数形式列举并且前面带有词语“一个”或“一种”的元件或步骤应当被理解为并不排除多个所述元件或步骤,除非指出这种排除情况。此外,对本公开的“一个实施方案”或“一个示例”的参考并非意图解释为排除也并入了所列举特征的另外实施方案的存在。术语“第一”、“第二”和“第三”等仅用作标签,而并非意在对其对象施加数值要求或特定位置顺序。
虽然已经描述了本发明的各种实施方案,但是对本领域的普通技术人员来说将显而易见的是,在本发明的范围内更多的实施方案和实现方式是可能的。具体地讲,技术人员将认识到来自不同实施方案的各种特征的可互换性。虽然在某些实施方案和示例的上下文中已公开了这些技术和系统,但将理解,这些技术和系统可以超出具体公开的实施方案而扩展到其他实施方案和/或其用途和明显修改。
Claims (22)
1.一种用于消除声回波的系统,所述系统包括:
麦克风,所述麦克风被配置成拾取由声源产生并经由具有未知传递函数的未知传递路径从所述声源传递到所述麦克风的声音,并且从中提供电麦克风信号;
自适应滤波器,所述自适应滤波器被配置成利用估计传递函数来逼近所述未知传递函数并且利用所述估计传递函数对代表由所述声源产生的所述声音的电信号进行滤波以从中提供估计信号,所述自适应滤波器具有适应性自适应步长;以及
自适应后滤波器,所述自适应后滤波器被配置成利用后滤波器传递函数对差值信号进行滤波,所述差值信号是所述麦克风信号与所述估计信号之间的差值,其中
所述后滤波器传递函数是一与所述适应性自适应步长之间的差值;并且
所述自适应后滤波器被配置成具有最小阻尼,所述最小阻尼被限于最小阈值。
2.如权利要求1所述的系统,其中所述自适应滤波器是频域自适应滤波器。
3.如权利要求1或2所述的系统,所述系统还包括滤波器控制块,所述滤波器控制块被配置成控制所述自适应滤波器和所述自适应后滤波器。
4.如权利要求3所述的系统,其中所述滤波器控制块被配置成依据对所述自适应滤波器的系统距离的统计分析来评估所述自适应滤波器的自适应步长。
5.如权利要求4所述的系统,其中所述滤波器控制块被配置成依据对所述适应性自适应步长的统计分析和所述自适应滤波器的先前估计的系统距离来估计所述自适应滤波器的所述系统距离。
6.如权利要求5所述的系统,其中
所述自适应滤波器的所述估计的系统距离进一步取决于调谐参数;并且
所述滤波器控制块还被配置成依据所述调谐参数来控制所述自适应滤波器的双向通话检测和重新适应中的至少一者。
7.如权利要求6所述的系统,其中所述滤波器控制块被配置成基于所述调谐参数而控制所述自适应步长是否在双向通话情形下更好地表现或者何时加速所述自适应滤波器的重新适应。
8.如权利要求1至7中任一项所述的系统,其中所述最小阈值被配置成依据输入信号的功率进行控制。
9.如权利要求8所述的系统,其中所述最小阈值还被配置成依据所述输入信号的频谱进行控制。
10.如权利要求9所述的系统,其中所述最小阈值被配置成由音量设置控制。
11.如权利要求1至10中任一项所述的系统,其中所述自适应后滤波器的所述最小阻尼是频率相关的。
12.一种用于消除声回波的方法,所述方法包括:
利用麦克风拾取由声源产生并经由具有未知传递函数的未知传递路径从所述声源传递到所述麦克风的声音,并且从中提供电麦克风信号;
利用自适应滤波器的估计传递函数来逼近所述未知传递函数并且利用所述估计传递函数对代表由所述声源产生的所述声音的电信号进行滤波以从中提供估计信号,所述自适应滤波器具有适应性自适应步长;以及
利用自适应后滤波器的后滤波器传递函数对差值信号进行滤波,所述差值信号是所述麦克风信号与所述估计信号之间的差值,其中
所述后滤波器传递函数是一与所述适应性自适应步长之间的差值;并且
所述自适应后滤波器被配置成具有最小阻尼,所述最小阻尼被限于最小阈值。
13.如权利要求12所述的方法,其中所述自适应滤波器是频域自适应滤波器。
14.如权利要求12或13所述的方法,所述方法还包括控制所述自适应滤波器和所述自适应后滤波器。
15.如权利要求14所述的方法,其中滤波器控制块被配置成依据对所述自适应滤波器的系统距离的统计分析来评估所述自适应滤波器的自适应步长。
16.如权利要求15所述的方法,所述方法还包括依据对所述适应性自适应步长的统计分析和所述自适应滤波器的先前估计的系统距离来估计所述自适应滤波器的所述系统距离。
17.如权利要求16所述的方法,其中所述自适应滤波器的所述估计的系统距离进一步取决于调谐参数,利用所述调谐参数来控制所述自适应滤波器的双向通话检测和重新适应中的至少一者。
18.如权利要求17所述的方法,其中所述滤波器控制块被配置成基于所述调谐参数而控制所述自适应步长是否在双向通话情形下更好地表现或者何时加速所述自适应滤波器的重新适应。
19.如权利要求12至18中任一项所述的方法,其中所述最小阈值被配置成依据输入信号的功率进行控制。
20.如权利要求19所述的方法,其中所述最小阈值还被配置成依据所述输入信号的频谱进行控制。
21.如权利要求20所述的方法,其中所述最小阈值被配置成由音量设置控制。
22.如权利要求12至21中任一项所述的方法,其中所述自适应后滤波器的所述最小阻尼是频率相关的。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP16207449.6 | 2016-12-30 | ||
EP16207449 | 2016-12-30 | ||
PCT/EP2017/081942 WO2018121971A1 (en) | 2016-12-30 | 2017-12-08 | Acoustic echo canceling |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110169041A true CN110169041A (zh) | 2019-08-23 |
CN110169041B CN110169041B (zh) | 2022-03-22 |
Family
ID=57777459
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201780080986.XA Active CN110169041B (zh) | 2016-12-30 | 2017-12-08 | 一种声回波消除的方法和系统 |
Country Status (5)
Country | Link |
---|---|
US (1) | US10930297B2 (zh) |
EP (1) | EP3563562B1 (zh) |
KR (1) | KR102420175B1 (zh) |
CN (1) | CN110169041B (zh) |
WO (1) | WO2018121971A1 (zh) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9565493B2 (en) | 2015-04-30 | 2017-02-07 | Shure Acquisition Holdings, Inc. | Array microphone system and method of assembling the same |
US9554207B2 (en) | 2015-04-30 | 2017-01-24 | Shure Acquisition Holdings, Inc. | Offset cartridge microphones |
US10367948B2 (en) | 2017-01-13 | 2019-07-30 | Shure Acquisition Holdings, Inc. | Post-mixing acoustic echo cancellation systems and methods |
WO2019231632A1 (en) | 2018-06-01 | 2019-12-05 | Shure Acquisition Holdings, Inc. | Pattern-forming microphone array |
JP7187183B2 (ja) * | 2018-06-14 | 2022-12-12 | 株式会社トランストロン | エコー抑圧装置、エコー抑圧方法およびエコー抑圧プログラム |
US11297423B2 (en) | 2018-06-15 | 2022-04-05 | Shure Acquisition Holdings, Inc. | Endfire linear array microphone |
WO2020061353A1 (en) | 2018-09-20 | 2020-03-26 | Shure Acquisition Holdings, Inc. | Adjustable lobe shape for array microphones |
US11558693B2 (en) | 2019-03-21 | 2023-01-17 | Shure Acquisition Holdings, Inc. | Auto focus, auto focus within regions, and auto placement of beamformed microphone lobes with inhibition and voice activity detection functionality |
US11438691B2 (en) | 2019-03-21 | 2022-09-06 | Shure Acquisition Holdings, Inc. | Auto focus, auto focus within regions, and auto placement of beamformed microphone lobes with inhibition functionality |
US11303981B2 (en) | 2019-03-21 | 2022-04-12 | Shure Acquisition Holdings, Inc. | Housings and associated design features for ceiling array microphones |
US11445294B2 (en) | 2019-05-23 | 2022-09-13 | Shure Acquisition Holdings, Inc. | Steerable speaker array, system, and method for the same |
TW202105369A (zh) | 2019-05-31 | 2021-02-01 | 美商舒爾獲得控股公司 | 整合語音及雜訊活動偵測之低延時自動混波器 |
US11297426B2 (en) | 2019-08-23 | 2022-04-05 | Shure Acquisition Holdings, Inc. | One-dimensional array microphone with improved directivity |
US11552611B2 (en) | 2020-02-07 | 2023-01-10 | Shure Acquisition Holdings, Inc. | System and method for automatic adjustment of reference gain |
WO2021243368A2 (en) | 2020-05-29 | 2021-12-02 | Shure Acquisition Holdings, Inc. | Transducer steering and configuration systems and methods using a local positioning system |
US11785380B2 (en) | 2021-01-28 | 2023-10-10 | Shure Acquisition Holdings, Inc. | Hybrid audio beamforming system |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1810019A (zh) * | 2003-06-27 | 2006-07-26 | 诺基亚有限公司 | 统计自适应滤波器控制器 |
CN101908342A (zh) * | 2010-07-23 | 2010-12-08 | 北京理工大学 | 利用频域滤波后处理进行音频暂态信号预回声抑制的方法 |
CN102387272A (zh) * | 2011-09-09 | 2012-03-21 | 南京大学 | 一种回声抵消系统中残留回声的抑制方法 |
KR20150054424A (ko) * | 2013-11-12 | 2015-05-20 | 고려대학교 산학협력단 | 잔여 에코 제거 방법 및 그 장치 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5680467A (en) * | 1992-03-31 | 1997-10-21 | Gn Danavox A/S | Hearing aid compensating for acoustic feedback |
US6925176B2 (en) * | 2003-06-27 | 2005-08-02 | Nokia Corporation | Method for enhancing the acoustic echo cancellation system using residual echo filter |
DE602007005228D1 (de) * | 2006-01-06 | 2010-04-22 | Koninkl Philips Electronics Nv | Akustischer echokompensator |
US9100466B2 (en) * | 2013-05-13 | 2015-08-04 | Intel IP Corporation | Method for processing an audio signal and audio receiving circuit |
US9531433B2 (en) * | 2014-02-07 | 2016-12-27 | Analog Devices Global | Echo cancellation methodology and assembly for electroacoustic communication apparatuses |
US9319783B1 (en) * | 2014-02-19 | 2016-04-19 | Amazon Technologies, Inc. | Attenuation of output audio based on residual echo |
US9172791B1 (en) * | 2014-04-24 | 2015-10-27 | Amazon Technologies, Inc. | Noise estimation algorithm for non-stationary environments |
WO2017099728A1 (en) * | 2015-12-08 | 2017-06-15 | Nuance Communications, Inc. | System and method for suppression of non-linear acoustic echoes |
-
2017
- 2017-12-08 EP EP17816654.2A patent/EP3563562B1/en active Active
- 2017-12-08 CN CN201780080986.XA patent/CN110169041B/zh active Active
- 2017-12-08 KR KR1020197017195A patent/KR102420175B1/ko active IP Right Grant
- 2017-12-08 US US16/473,574 patent/US10930297B2/en active Active
- 2017-12-08 WO PCT/EP2017/081942 patent/WO2018121971A1/en unknown
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1810019A (zh) * | 2003-06-27 | 2006-07-26 | 诺基亚有限公司 | 统计自适应滤波器控制器 |
CN101908342A (zh) * | 2010-07-23 | 2010-12-08 | 北京理工大学 | 利用频域滤波后处理进行音频暂态信号预回声抑制的方法 |
CN102387272A (zh) * | 2011-09-09 | 2012-03-21 | 南京大学 | 一种回声抵消系统中残留回声的抑制方法 |
KR20150054424A (ko) * | 2013-11-12 | 2015-05-20 | 고려대학교 산학협력단 | 잔여 에코 제거 방법 및 그 장치 |
Also Published As
Publication number | Publication date |
---|---|
EP3563562B1 (en) | 2022-10-12 |
US20200160876A1 (en) | 2020-05-21 |
CN110169041B (zh) | 2022-03-22 |
KR20190097026A (ko) | 2019-08-20 |
US10930297B2 (en) | 2021-02-23 |
KR102420175B1 (ko) | 2022-07-12 |
EP3563562A1 (en) | 2019-11-06 |
WO2018121971A1 (en) | 2018-07-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110169041A (zh) | 声回波消除 | |
US8306234B2 (en) | System for improving communication in a room | |
US7003099B1 (en) | Small array microphone for acoustic echo cancellation and noise suppression | |
JP5451876B2 (ja) | 音響マルチチャネル相殺 | |
US7174022B1 (en) | Small array microphone for beam-forming and noise suppression | |
US8396234B2 (en) | Method for reducing noise in an input signal of a hearing device as well as a hearing device | |
US8306215B2 (en) | Echo canceller for eliminating echo without being affected by noise | |
US9313573B2 (en) | Method and device for microphone selection | |
US20040170284A1 (en) | Sound reinforcement system having an echo suppressor and loudspeaker beamformer | |
KR20190085927A (ko) | 적응성 빔포밍 | |
US9699554B1 (en) | Adaptive signal equalization | |
EP0843934A1 (en) | Arrangement for suppressing an interfering component of an input signal | |
WO2008041878A2 (en) | System and procedure of hands free speech communication using a microphone array | |
US20180047410A1 (en) | Signal Processor with side-tone noise reduction for a headset | |
US9020144B1 (en) | Cross-domain processing for noise and echo suppression | |
WO2002032356A1 (en) | Transient processing for communication system | |
CN110140346A (zh) | 声回波消除 | |
CN109326297B (zh) | 自适应后滤波 | |
CN110199528B (zh) | 远场声音捕获 | |
Matheja et al. | A dynamic multi-channel speech enhancement system for distributed microphones in a car environment | |
CN109326301A (zh) | 自适应后滤波 | |
US20190035416A1 (en) | Single channel noise reduction | |
JP2011172081A (ja) | 拡声通話方法、拡声通話装置、拡声通話プログラム | |
CN115884022A (zh) | 音频设备和用于操作音频设备的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |