CN103155591B - 使用自适应频域滤波和动态快速卷积的自动均衡方法及装置 - Google Patents

使用自适应频域滤波和动态快速卷积的自动均衡方法及装置 Download PDF

Info

Publication number
CN103155591B
CN103155591B CN201180049284.8A CN201180049284A CN103155591B CN 103155591 B CN103155591 B CN 103155591B CN 201180049284 A CN201180049284 A CN 201180049284A CN 103155591 B CN103155591 B CN 103155591B
Authority
CN
China
Prior art keywords
filter
block
audio signal
response
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201180049284.8A
Other languages
English (en)
Other versions
CN103155591A (zh
Inventor
路易斯·D·费尔德
大卫·S·麦克格拉斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby Laboratories Licensing Corp
Original Assignee
Dolby Laboratories Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Laboratories Licensing Corp filed Critical Dolby Laboratories Licensing Corp
Publication of CN103155591A publication Critical patent/CN103155591A/zh
Application granted granted Critical
Publication of CN103155591B publication Critical patent/CN103155591B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/04Circuits for transducers, loudspeakers or microphones for correcting frequency response
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03HIMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
    • H03H17/00Networks using digital techniques
    • H03H17/02Frequency selective networks
    • H03H17/06Non-recursive filters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L25/00Baseband systems
    • H04L25/02Details ; arrangements for supplying electrical power along data transmission lines
    • H04L25/03Shaping networks in transmitter or receiver, e.g. adaptive shaping networks
    • H04L25/03006Arrangements for removing intersymbol interference
    • H04L25/03178Arrangements involving sequence estimation techniques
    • H04L25/03248Arrangements for operating in conjunction with other apparatus
    • H04L25/03286Arrangements for operating in conjunction with other apparatus with channel-decoding circuitry

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)

Abstract

频域技术用于自适应均衡,其响应于谱幅值特性,但对系统响应的相位特性不敏感。当存在显著水平的环境声音时,信号相关可以用于改进适配精度。优选的滤波器实现方式使用基于卷积的块变换和交叉衰落窗。

Description

使用自适应频域滤波和动态快速卷积的自动均衡方法及装置
相关申请的交叉引用
本申请要求于2010年10月14日提交的美国临时专利申请No.61/393,224的优先权,其整体通过引用合并于此。
技术领域
本发明总体上涉及音频信号滤波,更特别地,涉及可以用于使均衡滤波器具有期望的频率响应的技术。
背景技术
音频均衡滤波器用在各种音频信号处理系统中,以修正音频信号从而系统的传递函数符合期望的频率响应。例如,均衡滤波器可以用于补偿音频回放系统的电子和声学组件的频率响应特性,从而系统总传递函数是谱平坦的。
均衡滤波器的频率响应可以是静态或动态的;然而,因为动态或自适应均衡(AEQ)滤波器可以补偿系统的变化响应特性,所以它们对于很多应用是优选的。传统AEQ滤波器通过使得两个时域信号(例如系统输入信号和系统输出信号)之间的差异的测度最小化来操作,并且它们响应于各信号之间的幅度差和相位差二者。
无论是静态还是动态的,这些传统AEQ滤波器都典型地需要初始设置或校准过程,以确定幅度和相位二者的系统响应特性,从而可以正确地设置均衡滤波器的一个或多个参数的值。例如,典型地需要初始设置过程来十分精确地确定各种特性(例如设备信号处理延迟和声学信号传输延迟),从而可以使得归因于时间失配的相位误差最小化。如果并未正确地完成初始设置过程,则时间配准误差可能使得传 统AEQ滤波器不良地操作,并且在特定条件下变得不稳定。
发明内容
本发明的一个目的在于提供一种自适应过程,其以对不同信号之间的时间配准误差较不灵敏的方式来控制均衡滤波器的适配。
本发明的另一目的在于提供一种自适应均衡滤波器,其可以使其操作特性适配而不将明显失真引入到其滤波后的输出信号中。
通过实施如下所述的本发明来达成这些目的。公开了通过频域技术实现的若干自适应过程,其使用谱幅值差而不使用相位或时间差来驱动滤波器自适应过程。这些过程可以在系统处理普通音频节目材料时使系统中的均衡适配。无需特殊测试信号。这允许均衡滤波器在用于其预期目的时的适配。
通过参照以下讨论和附图,可以更好地理解本发明及其优选实施例的各种特性,在附图中,相同附图标记在若干附图中指代相同元件。以下讨论和附图的内容仅作为示例而阐述,而不应理解为表示对本发明范围的限制。
附图说明
图1是示例性音频回放系统的示意性框图,该系统使均衡滤波器的频率响应特性适配。
图2和图3是图1的系统中的分析器的示例性实现方式的示意性框图。
图4是图1的系统中的有效性测度生成器的示例性实现方式的示意性框图。
图5是图3的分析器中的对数平均互相关计算器和对数平均自相关计算器的示例性实现方式的示意性框图。
图6和图7是图1的系统中的控制信号生成器的示例性实现方式的示意性框图。
图8是示出图1的系统中的静态均衡滤波器的一种实现方式的块 操作的示意性框图。
图9是信号块结构的示意图。
图10是图8所示的静态滤波器的处理步骤的示意图。
图11是图1的系统中的自适应均衡滤波器的一种实现方式的示意性框图。
图12是图11所示的自适应滤波器的处理步骤的示意图。
图13是图1的系统中的自适应均衡滤波器的替选实现方式的示意性框图。
图14是可以用于实现本发明各个方面的设备的示意性框图。
具体实施方式
A.介绍
图1是包括本发明各个方面的音频回放系统1的示意性框图。该图未示出整个系统。例如,该图示省略了可以提供用于回放的音频信号的组件(比如压缩盘播放器和接收器)。这些类型的特征对于实践或理解本发明并非必需的。在对系统的一般描述之后讨论一些替选实现方式。
1.声学信号生成 
音频回放系统1包括AEQ滤波器100,其应用于音频信号5,根据其当前频率响应特性来对音频信号5进行滤波,将滤波后的音频信号195传送到驱动器210。可以通过各种方式来实现AEQ滤波器100,包括:使用一个或多个有限冲击响应(FIR)和无限冲击响应(IIR)滤波器,其被选择或适配为具有等于或近似一指定频率响应的频率响应。以下讨论使用通过频域块(block)变换所实现的滤波器组的示例性实现方式。滤波器可以应用于音频信号的整个带宽或仅一部分带宽。
驱动器210响应于滤波后的音频信号而生成能够驱动声学换能器(例如扬声器)的信号。驱动器210可以是例如音频功率放大器,并且可以通过可以期望的任何方式而实现。驱动器210在很多实现方式中可能是重要的,但对于实践本发明而言并非必需的。
驱动器210所生成的信号215传送到声学输出换能器220。声学输出换能器220响应于信号215而生成声场225。可以通过一个或多个不同的换能器来实现图中所示的声学输出换能器220,可以通过基本上可以期望的任何技术来实现这些一个或多个换能器。实质上,可以使用任何类型的扬声器或头戴式耳机换能器,但没有特定类型的输出换能器是必需的。
2.信号检测
声学输入换能器230响应于声场225而生成检测音频信号235。可以通过一个或多个不同的换能器来实现图中所示的声学输入换能器230,可以通过基本上可以期望的任何技术来实现这些一个或多个换能器。例如,基本上可以使用任何类型的麦克风,但没有特定类型的输入换能器是必需的。声学输入换能器230应位于预期一个或多个听众所处的位置附近。如果声学输出换能器220合并到头戴式耳机中,则声学输入换能器230应位于听众耳朵附近的头戴式耳机的任何耳罩(cup)或声学屏蔽物(shield)内部。
延迟器250从沿所示信号处理路径的某点接收信号,并且生成作为其输入信号的延迟副本的延迟音频信号255。延迟音频信号255在时间上与对应的检测音频信号235对准。在系统的初始设置期间建立获得正确对准所需的延迟量。本发明与使用传统方法可能的结果相比对于较大的对准误差一般能够实现十分良好的结果。可以通过任何可以期望的方式来实现延迟器250,但预期数字实现方式对于很多应用而言将是优选的。
如果延迟器250接收例如音频信号5作为其输入,则将延迟器250所施加的延迟量设置为近似等于从AEQ滤波器100的输入到声学输入换能器230的输出的总信号处理和传输延迟。在很多实现方式中,该总延迟近似等于通过AEQ滤波器100的信号处理延迟、从声学输出换能器220到声学输入换能器230的声场225传输延迟、以及针对模数转换和缓冲的处理延迟之和。用于该实现方式的控制方法以下被称为“反馈方法”,并且允许滤波器控制系统使AEQ滤波器100的 频率响应特性适配,该滤波器在控制环内。
如果延迟器250接收滤波后的音频信号195作为其输入,则将延迟器250所施加的延迟量设置为近似等于从驱动器210的输入到声学输入换能器230的输出的总信号处理和传输延迟以及针对模数转换和缓冲的处理延迟之和。在很多实现方式中,该总延迟近似等于从声学输出换能器220到声学输入换能器230的声场225传输延迟。对于该实现方式所使用的控制方法以下被称为“非反馈方法”,其使AEQ滤波器100的频率响应特性适配,该滤波器在控制环外。如果延迟器250接收信号215作为其输入,则存在相似的情况。
3.信号分析和控制信号生成
分析器300接收检测音频信号235和延迟音频信号255,获得这两个信号的频域表示,获得系统目标响应380的频域表示,并且处理这三个表示以生成估计谱幅值响应校正信号395。在一种实现方式中,从检测音频信号235和延迟音频信号255的频域表示来获得系统传递函数375,通过将该传递函数375与系统目标响应380进行比较来生成估计谱幅值响应校正信号395。以下描述一些实现方式的细节。
控制信号生成器400响应于估计谱幅值响应校正信号395而生成均衡滤波器控制信号495。均衡滤波器控制信号495可以与估计谱幅值响应校正信号395相同,或直接从估计谱幅值响应校正信号395获得;然而,在优选实现方式中,通过将平滑滤波器应用于从分析器300接收到的估计谱幅值响应校正信号395的序列来生成均衡滤波器控制信号495。
AEQ滤波器100响应于均衡滤波器控制信号495而使其频率响应特性适配。
4.信号验证
有效性测度生成器500是可选的,可以用于改进嘈杂环境中的AEQ滤波器的适配。声学输入换能器270应位于其可以响应于可能出现的任何环境声音而生成第二检测音频信号275的位置。可以通过一个或多个不同的换能器来实现声学输入换能器270,可以通过基本上 可以期望的任何技术来实现这些换能器。基本上可以使用任何类型的麦克风。没有特定类型的输入换能器是必需的。
如果声学输出换能器220合并到头戴式耳机中,则第二声学输入换能器270应位于离开听众耳朵在头戴式耳机的任何耳罩或声学屏蔽物的外部。
有效性测度生成器500比较第二检测音频信号275、检测音频信号235和延迟音频信号255的信号电平或谱特性,生成与估计谱幅值响应校正信号395的分量相关联的有效性测度595。
更高电平的环境声音通常产生第二检测音频信号275、检测音频信号235与延迟音频信号255之间更大的差。具有更大的差的谱分量一般表明检测音频信号的这些谱分量是真实系统性能的较不可靠指示物。控制信号生成器400可以响应于相关联的有效性测度595而修正估计谱幅值响应校正信号395的一个或多个分量的幅值,从而AEQ滤波器100的适配较少响应于认为较不可靠的这些分量。
B.示例性实现方式
以下描述四个示例性实现方式。这些实现方式使用被称为反馈方法和非反馈方法的两种控制方法之一,这些方法中的每一种可以用于分析谱幅值或谱幅值的平均相关得分。
在这四个示例性实现方式的每一个中,包括AEQ滤波器100和分析器300的音频回放系统1的若干组件使用滤波器组来获得信号的频域表示。例如,分析器300使用滤波器组来获得检测音频信号235和延迟音频信号255的频域表示。可以通过基本上可以期望的任何方式来实现这些滤波器组,其覆盖感兴趣的频率范围。例如,滤波器组可以是使用直接或替选计算方法(例如快速傅里叶变换(FFT))的离散傅里叶变换(DFT)和逆离散傅里叶变换(IDFT)、修正离散傅里叶变换(MDFT)和逆修正离散傅里叶变换(IMDFT)、离散余弦变换(DCT)和逆离散余弦变换(IDCT)、正交镜像滤波器(QMF)、以及复正交镜像滤波器(CQMF)的实现方式。在以下示例中对FFT和IFFT的提及指示使用FFT计算方法用于DFT滤波器组的实现。
1.具有幅值比较的反馈
在第一示例性实现方式中,延迟器250从在AEQ滤波器100之前的信号路径接收其输入信号。设置延迟器250所施加的滞后或延迟量,使得当延迟音频信号和检测音频信号输入到分析器300时,它们的对应时段(interval)在时间上是对准的。
a)信号分析 
分析器300处理延迟音频信号255的块(block)或片段(segment)的频域表示、检测音频信号235的块或片段的频域表示、以及系统目标响应380的频域表示,以生成估计谱幅值响应校正信号395。该估计校正信号395表示音频回放系统1实现与系统目标响应380匹配的总体频率响应所需的AEQ滤波器100的频率响应的改变。
可实现这点的一种方式是:从延迟音频信号255的块或片段中的谱幅值与检测音频信号235的对应块或片段中的谱幅值的比较来获得系统传递函数375,然后从系统传递函数375与系统目标响应380的比较来获得估计校正信号395。
(1)频域表示
图2所示的分析器300的一种实现方式逐块执行其分析。通过FFT来实现滤波器组310a,其生成构成检测音频信号235的频域表示的复值变换系数的块。对数计算器320a将这些变换系数的复值(complex value)转换为其幅值的对数,以便于后续计算。
滤波器组的操作将分析窗函数应用于一序列的重叠信号采样块,然后将变换应用于加窗采样块,以生成变换系数块。例如,滤波器组可以应用于在长度上是N=128个采样,彼此重叠N/2个采样的重叠信号采样块,其中信号采样率是8kHz。每个块中的所有或仅一部分变换系数可被分析并用于使AEQ滤波器100适配。
表达式1中示出合适的分析窗函数WA。
WA ( n ) = W Kaiser , &alpha; = 1 N 2 ( n ) 0 &le; n < N 4 1 N 4 &le; n < 3 N 4 W Kaiser , &alpha; N 2 ( n - N 2 ) 3 N 4 &le; n < N - - - ( 1 ) ,
其中,N=采样块的长度;
W Kaiser , &alpha; = 1 N 2 ( n ) = I 0 [ &pi;&alpha; 1.0 - ( n - N - 2 4 N - 2 4 ) 2 ] I 0 [ &pi;&alpha; ] , 0 &le; n < N 2 , &alpha; = 1 ;
I 0 ( x ) = &Sigma; k = 0 &infin; ( x 2 ) k k !
实验测试已经表明,该特定分析窗函数提供良好的频率选择性以及块边界假声(artifact)的减少;然而,可以使用任何分析窗函数。
该实现方式中所使用的FFT根据以下表达式来生成变换系数对的块:
X ( k ) = &Sigma; n = 0 N - 1 x ( n ) &CenterDot; e - 2 &pi;jkn N , 0 &le; k < N - - - ( 2 a ) ,
其中,x(n)=输入信号采样n;
j = - 1 ;
X(k)=谱分量k的变换系数。 
以下讨论的互补逆快速傅里叶变换(IFFT)根据以下表达式来生成时域信号采样块:
x ( n ) = 1 N &Sigma; k = 0 N - 1 X ( k ) &CenterDot; e 2 &pi;jkn N , 0 &le; n < N - - - ( 2 b ) .
前N/2-1个复系数对加上在零和尼奎斯特(Nyquist)频率处的系数是唯一的。对数计算器320a通过计算每个变换系数或复数对的幅值并且然后获得幅值的对数,来生成谱幅值的对数表示。如上所述,进行到对数域的这种转换以改进一些算法计算的效率。替代地,可以使用在线性域中的谱幅值计算。
FFT所实现的滤波器组310b生成构成延迟音频信号255的频域表示的复值变换系数的块。对数计算器320b将这些变换系数的复值转换为其幅值的对数。分别通过与滤波器组310a和对数计算器320a相同的方式来实现滤波器组310b和对数计算器320b。
(2)系统传递函数
减法器370从自对数计算器320a接收到的变换系数的对数值减去自对数计算器320b接收到的变换系数的对数值。该操作提供系统传递函数375在对数域中的表示。概念上说,减法器370通过可以表示为下式的计算来获得系统传递函数375的对数表示:
T log ( k ) = log ( S A ( k ) S D ( k ) ) , 0 &le; k &le; N 2 - - - ( 3 )
其中,SA(k)=检测音频信号的变换系数k的幅值;
SD(k)=延迟音频信号的变换系数k的幅值;以及
Tlog(k)=对数域中的系统传递函数。
(3)估计响应校正信号
图中系统目标响应380所表示的系统组件提供期望的系统频率响应或系统目标响应380在对数域中的表示。减法器390从系统目标响应380的对数值减去系统传递函数375的对数值,以获得估计谱幅值响应校正信号395。在对数域中表示估计校正信号395的分量的幅值。概念上说,减法器390通过可以表示为下式的计算来获得估计谱幅值响应校正信号395的谱幅值的对数表示:
C log ( k ) = log ( TGT ( k ) T ( k ) ) , 0 &le; k &le; N 2 - - - ( 4 )
其中TGT(k)=音频回放系统目标响应;
T(k)=线性域中的系统传递函数;以及
Clog(k)=估计校正信号的系数k的对数幅值。
估计谱幅值响应校正信号395传送到控制信号生成器400。该校正信号在长时间段上是准确的,但其能够由于音频信号5的变化、环境声音的变化以及系统自身内的随机噪声源的变化而逐块地明显变化。结果,用于任何给定块的估计校正信号395中的分量值可与应提供给AEQ滤波器100的校正值明显不同。优选地,平滑滤波器应用于估计校正信号395,以减少或消除否则可能导致AEQ滤波器100的适配从而生成可听到的假声的伪变化(spurious variation)。平滑化是可选的。在以下公开的示例性实现方式中,在控制信号生成器400中应用平滑滤波器。
b)控制信号生成
控制信号生成器400生成均衡滤波器控制信号495,其控制AEQ滤波器100的适配。在上述优选实现方式中,控制信号生成器400通过将平滑滤波器应用于估计校正信号395以减少系统对噪声的灵敏度来获得均衡滤波器控制信号495。在估计校正信号395的所选分量的值被认为不可靠或无效的情况下,控制信号生成器400也可以修正所选分量的值。
(1)分量平滑
如果块变换用于实现滤波器组310a、310b,则系统传递函数375和估计谱幅值响应校正信号395每个由一系列块中排布的值表示。值的突然改变可能从块到块而出现。构成均衡滤波器控制信号495的分量的时间平滑或低通滤波可以用于消除否则可能生成可听见的假声的AEQ滤波器100的频率响应的突然改变。
图6示出包括泄漏(leaky)校正器形式的一阶平滑函数的一种合适的实现方式。实验测试已经表明,一阶滤波器对于很多应用而言 是足够的,但可以根据期望而使用更高阶的平滑滤波器。在图6所示的实现方式中,适配控制器410生成泄漏因子矢量415,矢量乘法器420根据泄漏因子矢量415中的各个因子来使得估计谱幅值响应校正信号395中的分量的幅值衰减。矢量加法器430将估计谱幅值响应校正信号395中的衰减了的分量与当前期望的AEQ滤波器响应450中的对应分量进行组合。该和在延迟器440中被延迟等于N/2个信号采样时段的块重叠时段,然后被存储以成为当前期望的AEQ滤波器响应450。
期望的AEQ滤波器响应450可以在系统启动时通过在系统设计期间所建立的值而被初始化,或可以恢复为当系统关闭时为当前响应的最近的期望响应。
泄漏因子矢量415可以包括具有固定值的因子。如果泄漏因子矢量415包括具有固定值的因子,则可以选取这些值,以提供AEQ滤波器100的期望适配速率。实验测试已经表明,对于很多应用合适的速率允许AEQ滤波器100在大约一秒的时段上收敛到期望响应的大约2dB内,音频回放系统1中的其它因子保持恒定。如果块在长度上为N=128个采样,具有N/2个采样的重叠以及8kHz的采样率,则大约0.01的泄漏因子提供该收敛速率。
(2)分量修正
替代地,可以响应于指示估计谱幅值响应校正信号395中的分量的有效性或可靠性的信号来适配泄漏因子矢量415中的因子。如果来自任何其他源的高电平的环境声音或噪声存在并且由声学输入换能器230检测到,则这些分量中的一个或多个可能并不是需要什么响应校正的可靠指示。如果估计校正信号395的特定分量被认为不可靠,则可以减小或甚至消除该分量对均衡滤波器控制信号495所具有的影响。
优选实现方式评估估计校正信号395的分量的可靠性,并且使用该评估来控制估计校正信号395如何用于使AEQ滤波器100适配。可以实现这点的一种方式是:使用图1所示的声学输入换能器270和 有效性测度生成器500以生成有效性测度595,并且使得适配控制器410响应于这些测度而修正、代替或衰减估计校正信号395的各个分量的影响。以下描述该方法。
c)有效性测度生成
图4示出有效性测度生成器500的一种实现方式。在该实现方式中,信号活跃性检测器520分析延迟音频信号255,并且生成指示延迟音频信号255中是否存在有效谱分量的一组值525。这可以通过生成指示延迟音频信号255的谱幅值是否超过阈值的二元值来完成。从谱幅值获得的信号电平测度523被传送到外部声音检测器510。这些信号电平测度523可以是谱幅值自身。
可以通过计算分析器300中的滤波器组310b所生成的变换系数的幅值来获得谱分量的幅值。每个变换系数的幅值与表示谱分量被认为大到足以允许系统响应特性的可靠计算的频率相关的电平的各个阈值进行比较。该过程可以表示为:
V D ( k ) = 1 X D , log ( k ) > Th ( k ) 0 X D , log ( k ) &le; Th ( k ) - - - ( 4 )
其中,VD(k)=1表示延迟音频信号中的有效变换系数k;
XD,log(k)=延迟音频信号中的变换系数k的对数幅值;
Th(k)=变换系数k的阈值水平。 
外部声音检测器510确定环境声音的谱分量是否具有太低以使得估计谱幅值响应校正信号失真的幅值。这可以通过将检测音频信号235的变换系数幅值与调整了的第二检测音频信号275的变换系数幅值进行比较来完成。通过衰减因子来调整第二检测音频信号275的变换系数幅值,该衰减因子表示声场225传输通过的声学通道中的声音与该声学通道外部的声音之间的隔离度。在系统的设计或设置期间估计隔离度。外部声音检测器510生成指示检测到的音频信号的变换系数的值是否对于存在的任何环境声音基本上免疫的一组值515。该过程可以表示为:
V E ( k ) = 1 X A , log ( k ) > ( X E , log ( k ) - X I , log ( k ) ) 0 X A , log ( k ) &le; ( X E , log ( k ) - X I , log ( k ) ) - - - ( 5 )
其中,VE(k)=1表示检测到的音频信号的变换系数k对于环境声音免疫;
XA,log(k)=检测到的音频信号中的变换系数k的对数幅值;
XE,log(k)=第二检测到的音频信号中的变换系数k的对数幅值;
XI,log(k)=变换系数k的声学通道隔离的对数幅值。
矢量乘法器530将各组值515和525相乘,并且生成指示估计谱幅值响应校正信号395的哪些分量被视为无效或不可靠的有效性测度595。在该特定实现方式中,这些测度包括N/2+1个二元值元素,其中零指示各个分量不可靠。
(1)替选过程
可以通过从估计声学误差信号获得的测度来代替或扩充如上所述从第二检测音频信号275和声学隔离幅值得到的有效性测度。可以从检测音频信号235和延迟音频信号255的对应谱分量之间的差来获得估计声学误差信号。
如果系统目标响应380并非谱平坦的,则若具有目标响应的最小相位滤波器对传送到或接收自延迟器250的音频信号进行均衡,那么可以改进估计声学误差信号的精度。如果可能有时间延迟的最小相位滤波器可以精确地表示声学输出换能器220、声场225传输通过的声学通道以及声学输入换能器230的总体传递函数,则该操作运作良好。当这些条件存在时,AEQ滤波器100的滤波效果使得检测音频信号235基本上等于延迟音频信号255加上声学输入换能器230所检测到的任何环境声音。
(2)控制信号分量修正
在优选实施例中,控制信号生成器400中的适配控制器410通过进行以下操作之一或二者来对有效性测度595进行响应:对估计谱幅值响应校正信号395的分量进行修正,和使泄漏因子矢量415适配。这些修正的目的是消除或减少环境声音和其它噪声对AEQ滤波器100 的适配的影响。可以通过各种方式来完成该操作。以下描述一些示例。
以下所描述的过程涉及包含多个分量的带。这些过程也可以用在带包含估计谱幅值响应校正信号395的所有分量或带仅包含一个分量的实现方式中。以下示例使用上述一组二元值的有效性测度595,其中值1表示估计谱幅值响应校正信号395的各个分量是可靠的,值零表示分量不可靠。
在一过程中,如果有效性测度595指示带中的大部分分量不可靠,则适配控制器410对于特定带禁止AEQ滤波器100的适配。可以通过两种方式的任一种来完成该操作。
对于第一种方式,适配控制器410对于带中的所有分量继续传送相同控制值,直到有效性测度595指示至少大部分分量是可靠的。当对于带允许适配时,适配控制器410传送新的分量值,控制信号生成器400中的平滑滤波器生成具有用于该带的控制值的均衡滤波器控制信号序列495,该控制值从旧值到期望的新值平滑地改变。这种技术有时被称为基于时间的零阶保持。替代地,保持可以响应于有效性测度595指示带中的所有分量不可靠或指示带中的一个或多个分量不可靠而被触发。
对于第二种方式,适配控制器410将泄漏因子矢量415中的适当因子设置为零。当对于该带允许适配时,适配控制器410将该适当因子设置为它们的常规非零值。
在另一过程中,适配控制器410生成用于不可靠分量的替换值。可以通过若干方式来完成该操作。一种方式通过在可靠分量的值之间进行内插来获得替换值。内插可以跨频率进行,可以使用两个可靠分量之间的一阶或线性内插或使用更大量分量之间的更高阶内插来进行。另一方式从最近可靠分量获得替换值。对于带边缘的分量,当内插不可行时,这种方式是有用的。
作为不可靠分量的内插和替换的替代,可以修正不可靠分量的值,以限制频域中相邻分量之间的变化。该方法可能是有效的,因为误差表现为明显局部偏差,同时任何实际期望的均衡在相邻分量之间 具有有限的变化。
对分量间变化的这种限制可以根据频率而变化,或可以是恒定的。可以通过针对各种收听环境获得系统传递函数375并且确定所有系统传递函数375内的最大分量间变化来实验上确定合适的限制。
2.具有校正比较的反馈
第二示例性实现方式与上述第一实现方式相似。实现方式的差异源自分析器300中分析了什么。因为第二示例性实现方式通常对于噪声较不灵敏,所以它对于很多应用是优选的。
a)信号分析 
用于该实现方式的分析器300执行与上述实现方式基本上相同的过程,但是,代替比较谱分量的幅值来获得系统传递函数375,其比较这些谱分量的互相关和自相关得分的平均。图3示出分析器300的一种实现方式。以下段落描述与图2所示的上述实现方式的差别。
对数平均互相关(LOG AVX)计算器340a从滤波器组310a接收检测音频信号235的变换系数块315a,从滤波器组310b接收延迟音频信号255的变换系数块315b,计算这两个块中的变换系数的互相关得分,使用泄漏积分器来计算一系列相关得分的平均值,并且获得平均值的对数表示355a。如上所述,进行到对数域的转换以改进一些算法计算的效率。替代地,可以在线性域中进行这些计算以及其它计算。
对数平均自相关(LOG AVA)计算器340b从滤波器组310b接收延迟音频信号255的变换系数块315b,计算该块中的变换系数的自相关得分,使用泄漏积分器来计算一系列自相关得分的平均值,并且获得平均值的对数表示355b。
图5示出用于LOG AVX计算器340a的示例性实现方式。复共轭分量341获得从滤波器组310b接收到的延迟音频信号255的变换系数块315b中的每个变换系数的复共轭,将该结果传送到矢量乘法器342。矢量乘法器342还从滤波器组310a接收检测音频信号235的变换系数块315a作为其第二输入,对于其两个输入计算互相关得分的 块。相关得分块被传送到矢量乘法器343,其响应于第一相关泄漏因子矢量352中的各个因子而使得块中的每个得分衰减。衰减了的相关得分的块与从矢量乘法器348接收到的平均相关得分的衰减块相加,所得和被传送到延迟器345,其对块施加一个采样的延迟。延迟了的得分块然后成为块相关得分的新平均值346,其被传送到矢量乘法器348和对数计算器347。矢量乘法器348响应于第二相关泄漏因子矢量353中的各个因子而使得平均相关得分块中的每个得分衰减。对数计算器347计算平均相关得分块中的每个得分的对数表示355a。
矢量乘法器343和矢量乘法器348实现传统一阶低通滤波器,其中两个相关泄漏因子矢量中的因子被如下地彼此关联:
f2(k)=(1-f1(k))    (6) 
其中,f1(k)=第一相关泄漏因子矢量中的变换系数k的因子;
f2(k)=第二相关泄漏因子矢量中的变换系数k的因子。可以通过将每个f1(k)设置为泄漏因子矢量415的对应分量的至少两倍大来改进适配中的收敛性。较小的f1(k)值导致适配过冲(overshot)和/或振铃(ringing)。
用于计算检测音频信号235和延迟音频信号255的一对块的互相关得分的上述操作可以表示为:
xcorr ( k . m ) = X A ( k , m ) &CenterDot; X D * ( k , m ) - - - ( 7 )
其中,X* D(k,m)=延迟音频信号的块m中的变换系数k的复共轭;
XA(k,m)=检测到的音频信号的块m中的变换系数k;
xcorr(k,m)=块m的分量k的互相关得分。
根据下式来计算互相关得分的平均值:
avexcorr(k,m+1)=xcorr(k,m+1)·f1(k)+avexcorr(k,m)·f2(k)
=xcorr(k,m+1)·f1(k)+avexcorr(k,m)·[1-f1(k)]    (8) 
其中,avexcorr(k,m)=块m的分量k的平均互相关得分。
LOG AVA计算器340b还如图5所示地实现,并且除了在此所的描述差异之外,与LOG AVX计算器340a相同地操作。LOG AVA计算器的两个输入从滤波器组310b接收延迟音频信号255的相同变换 系数块315b。矢量乘法器342计算变换系数块的自相关得分块。
用于计算延迟音频信号255的块的自相关得分的上述操作可以表示为:
acorr ( k . m ) = X D ( k , m ) &CenterDot; X D * ( k , m ) - - - ( 9 )
其中,XD(k,m)=延迟音频信号的块m中的变换系数k;
acorr(k,m)=块m的分量k的自相关得分。
根据下式来计算自相关得分的平均值:
aveacorr(k,m+1)=acorr(k,m+1)·f1(k)+aveaorr(k,m)·f2(k)
=acorr(k,m+1)·f1(k)+aveacorr(k,m)·[1-f1(k)]    (10) 
其中,aveacorr(k,m)=块m的分量k的平均自相关得分。
第一相关泄漏因子矢量和第二相关泄漏因子矢量中的因子可以包括具有固定值的因子。如果这些矢量包括具有固定值的因子,则这些值影响AEQ滤波器100的适配速率。实验测试已经表明,对于很多应用合适的速率允许AEQ滤波器100在大约一秒的时段上收敛到期望响应的大约2dB内。如果块在长度上为N=128个采样,具有N/2个采样的重叠以及8kHz的采样率,则第一相关泄漏因子矢量中大约0.01的因子提供该收敛速率。
第一相关泄漏因子矢量和第二相关泄漏因子矢量中的因子也可以被适配。优选地,响应于表示检测音频信号235中出现的噪声的量的值而适配所述因子,从而当更多噪声出现时,第一相关泄漏因子矢量中的因子更小。如果期望,则当用于变换k的对应有效性测度595指示其不可靠时,可以通过将用于变换k的第一矢量中的因子设置为零来响应于有效性测度595而适配这些因子。根据表达式6来适配第二相关泄漏因子矢量中的因子。
减法器370从自LOG AVX计算器340a接收到的互相关得分的对数值减去自LOG AVA计算器340b接收到的自相关得分的对数值。这提供系统传递函数375在对数域中的表示。概念上说,减法器370通过可以表示为下式的计算来获得系统传递函数375的对数表示:
T log ( k , m ) = log ( avexcorr ( k , m ) aveacorr ( k , m ) ) , 0 &le; k &le; N 2 - - - ( 11 )
其中,Tlog(k,m)=块m的对数域系统传递函数。
减法器390从系统目标响应380的对数值减去系统传递函数375的对数值,以获得估计谱幅值响应校正信号395,如上所述。 
可以通过响应于环境声音电平对检测音频信号235中的期望电平的比率而改变相关泄漏因子矢量415来获得适配收敛性与减少的噪声灵敏度之间的折中的进一步改进。当环境对期望声音电平比率超过特定阈值时,第一相关泄漏因子矢量352中的每个分量从标称相关泄漏因子值减小。从检测音频信号235的变换系数k的平均对数幅值与其预期对数幅值之间的差在对数域中针对每个变换系数k计算该比率。可以从延迟音频信号255的变换系数k的对数幅值、先前估计的系统传递函数375以及系统目标响应380来获得预期的对数幅值。
在以下公式中示出该过程的一种实现方式:
f 1 ( k ) = nomcorrleak f 1 var ( k ) > nomcorrleak f 1 var ( k ) f 1 var ( k ) &le; nomcorrleak - - - ( 12 )
其中,nomcorrleak=相关泄漏因子的标称值;
f 1 var ( k ) = 10 [ 2 ( T log ( k , m - 1 ) ) + X D , log , ave 2 ( k ) - 2 ( TGT log ( k ) ) - X A , log , ave 2 ( k ) - const 10 ] ;
TGTlog(k)=系统目标响应中的分量k的对数值;
X2 A,log,ave(k)=分量k的检测音频信号自相关得分的对数平均值;
X2 D,log,ave(k)=分量k的延迟音频信号自相关得分的对数平均值;以及
const=实验获得的常数。
可以从LOG AVA计算器340b所生成的平均值的对数表示355b来获得延迟音频信号255的分量k的对数平均自相关得分。可以从应用于从滤波器组310a接收到的检测音频信号235的变换系数块315a的附加LOG AVA计算器来获得检测音频信号235的分量k的对数平 均自相关得分。
实验研究已经表明,对于很多应用而言标称相关泄漏因子nomcorrleak的合适值大约是上述固定值泄漏因子的两倍。对于8kHz的采样率、彼此重叠N/2个采样的N=128个采样的块,nomcorrleak的合适的值是0.02。
const的值典型地在从0至10dB的范围中,并且可以实验地调整,以获得期望水平的AEQ滤波器适配精度,即使有显著水平的环境声音。较大的const值使得平均化处理在更长的时间段上计算平均值,这将减小对环境声音的灵敏度,增大适配精度。
b)有效性测度生成
可以使用检测音频信号235、延迟音频信号255和第二检测音频信号275来计算有效性测度595,如上所述。因为相关方法对噪声较不灵敏,所以在典型应用中表达式5所示的每个变换系数k的声学通道隔离性的值XI,log(k)将较大。
也可以使用上述替选方法。其使用在该第二实现方式中一般更合适,因为使用相关得分而不是谱幅值减小了对环境声音的灵敏度。如上所述,即使可能具有时间延迟的最小相位滤波器不能精确地表示声学输出换能器220、声音场225传输通过的声学通道以及声学输入换能器230的总体传递函数,使用相关得分也允许替选方法提供良好的结果。
3.具有幅值比较的非反馈
第三示例性实现方式与上述第一实现方式相似。实现方式的差异源于这样的事实:延迟器250的输入跟随AEQ滤波器100,结果,该滤波器的响应特性未被包括在分析器300中获得的系统传递函数375中。
a)信号分析 
第二实现方式中的分析器300与第一实现方式中的分析器300基本上相同;然而,该实现方式中的估计谱幅值响应校正信号395表示AEQ滤波器100的期望频率响应的估计,而不是对该响应的校正。
减法器370从自对数计算器320a接收到的变换系数的对数值减去自对数计算器320b接收到的变换系数的对数值,以计算系统传递函数375在对数域中的表示。不像在第一实现方式中所计算的系统传递函数375,在该实现方式中所计算的系统传递函数375不包括AEQ滤波器100的响应特性。
结果,当减法器390从系统目标响应380的对数值减去系统传递函数375的对数值时,所得估计校正信号395是AEQ滤波器100的响应特性应为什么以获得等于系统目标响应380的总体系统响应的估计。
与对于第一实现方式以上所描述的相似,估计谱幅值响应校正信号395在长的时段上是精确的,但其可以从块到块明显地变化。结果,任何给定块的估计校正信号395中的分量值可能与应提供给AEQ滤波器100的校正值明显地不同。优选地,平滑滤波器应用于估计校正信号395,以减少或消除伪变化。平滑化是可选的。在该示例性实现方式中,在控制信号生成器400中应用平滑滤波器。
b)控制信号生成
控制信号生成器400生成均衡滤波器控制信号495,其控制AEQ滤波器100的适配。在上述优选实现方式中,控制信号生成器400通过将平滑滤波器应用于估计校正信号395以减少系统对噪声的灵敏度来获得均衡滤波器控制信号495。在估计校正信号395的所选分量的值被视为不可靠或无效的情况下,控制信号生成器400也可以修正所选分量的值。
(1)分量平滑
图7示出包括泄漏积分器形式的一阶平滑滤波器的一种合适的实现方式。实验测试已经表明,一阶滤波器对于很多应用是足够的,但可以根据期望而使用更高阶的平滑滤波器。
图7所示的实现方式与图6所示的上述实现方式相似。在此所使用的实现方式包括受控于适配控制器410所提供的第二泄漏因子矢量417的附加矢量乘法器460。矢量乘法器420使得传送到矢量加法器 430的当前期望的AEQ滤波器响应450中的分量的幅值衰减。
矢量乘法器420和矢量乘法器460实现传统一阶低通滤波器,其中两个相关泄漏因子矢量中的因子彼此关联,如以上表达式6所示。
泄漏因子矢量415可以包括具有固定值的因子。如果泄漏因子矢量415包括具有固定值的因子,则可以选取这些值,以提供AEQ滤波器100的期望适配速率,如上所述。
c)有效性测度生成
可以如对于第一实现方式以上所描述的那样来实现有效性测度生成器500。
4.具有相关比较的非反馈
第四示例性实现方式与上述第二实现方式和第三实现方式共享特征。由于分析器300中所执行的分析和控制信号生成器400中的改变导致的差异也应用于该第四实现方式。
5.AEQ滤波器
AEQ滤波器100可以本质上是任何类型的滤波器结构,包括递归结构、非递归结构和格状(lattice)结构,只要其可以根据均衡滤波器控制信号495指定的响应特性来适配其频率响应的幅值。例如,可以通过具有重叠或近乎重叠的通带的带通滤波器组以及用于每个带通滤波器的相应增益来实现AEQ滤波器100。作为另一示例,AEQ滤波器100可以根据选自多组预定参数的一组滤波器参数来操作,其中每组预定参数提供特定频率响应。选择提供对于均衡滤波器控制信号495所指定的响应最接近的匹配的一组参数。另一方法从均衡滤波器控制信号495所指定的响应特性来获得适当的滤波器参数。在2010年2月4日公开的国际专利申请公开WO2010/014663中讨论了可用于设计用于任一种方法的滤波器参数组的技术。
以下讨论用于频域实现方式的一种技术。该技术使用块变换来实现用有限冲击响应对信号采样块进行卷积的频域等效。基本上可以使用任何时域到频域的块变换及其频域到时域的块逆变换。变换长度由符号N表示。
a)静态滤波器 
图8至图10的示意性框图示出该滤波器实现方式的基本操作。参照图8,填充组件(pad component)110接收用于音频信号5的N/2采样片段105,并且将其与N/2零值采样片段107附接,以形成N采样块115。FFT120应用于采样块115,以生成N变换系数块125。
矢量乘法器134接收变换系数块125和表示期望频率响应的谱幅值的值的块189,将变换系数的幅值乘以期望频率响应中的各个值,以生成滤波后的变换系数块135。逆快速傅里叶变换(IFFT)144应用于滤波后的变换系数块135,以生成N时域信号采样块。该时域采样块的前一半包含表示FFT120对块115中的采样的初始响应的N/2采样片段145。该时域采样块的后一半包含表示FFT120对块115中的采样的最终响应的N/2采样片段146。
矢量乘法器131接收通过延迟器121的先前变换系数块125和表示期望频率响应的谱幅值的值的块189,并且将延迟变换系数的幅值乘以期望频率响应中的各个值,以生成延迟滤波变换系数块132。延迟器121施加等于一个片段的时段的延迟。IFFT141应用于延迟滤波变换系数块132,以生成N时域信号采样块。该时域采样块的前一半包含表示FFT120对先前块115中的采样的初始响应的N/2采样片段142。在该实现方式中不使用片段142。该时域采样块的后一半包含表示FFT120对先前块115中的采样的最终响应的N/2采样片段143。
重叠相加组件151将片段145中的采样与片段143中的采样相加,输出所得和作为N/2采样片段152。当AEQ滤波器100的频率响应如在这些段落中所描述的那样为静态时,该片段是滤波后的音频信号195的一部分。
图9和图10中示意性地示出用于该过程的一些块和片段的结构。N/2音频信号采样片段105中的采样由符号A(m)表示,其中m是单调递增的块编号。块编号对于每个后续块增加1。N/2零值采样片段107中的采样由符号Z(m)表示。IFFT所生成的N时域信号采样块包括附接到符号Z(m,r)所表示的N/2采样片段的符号A(m,r)所表示的N/2采 样片段,其中,r是滤波器频率响应的指数(index)。采样A(m,r)表示当滤波器频率响应符合指数r所表示的某种响应特性时,FFT对块m中的采样的初始响应。采样Z(m,r)表示当滤波器频率响应符合响应特性r时FFT对块m中的采样的最终响应。重叠相加组件151将各个采样Z(m-1,r)和A(m,r)相加,以获得表示为IS(m,r)的N/2临时采样片段152。
如果滤波器的响应特性是静态的,则该记号中的指数r不改变。如果滤波器的响应特性将被适配,则指数r将对于每个所请求的改变而增加1。滤波器响应可以通过使用下述附加处理而每块地频繁改变。
b)自适应滤波器
图12提供当如图11的示意性框图所示地那样实现AEQ滤波器100时,可以用于使AEQ滤波器100的频率响应适配的处理步骤序列的示意图。
参照图12,如上所述地处理音频信号5的每个片段105,以生成各个时域信号采样块。通过用适配为符合指数r-1所表示的期望频率响应的滤波器组件处理采样A(m-1)的片段来生成片段153和157。通过用适配为符合相同频率响应r-1的滤波器组件处理采样A(m)的片段来生成片段148和149。片段157中的采样重叠并且与片段148中的采样相加,以获得临时采样IS(m,r-1)的片段159。使用窗函数WF的后半部的加窗操作164应用于片段159中的临时采样IS(m,r-1)。窗函数的该后半部由符号WF2表示。合适的窗函数WF2如下所述。
通过用适配为符合指数r所表示的期望频率响应的滤波器组件处理采样A(m-1)的片段来生成片段142和143。通过用适配为符合相同频率响应r的滤波器组件处理采样A(m)的片段来生成片段145和146。片段143中的采样重叠并且与片段145中的采样相加,以获得临时采样IS(m,r)的片段155。使用窗函数WF的前半部的加窗操作161应用于片段155中的临时采样IS(m,r)。窗函数的该前半部由符号WF1表示。
两个窗加权片段中的采样重叠并且相加,以获得滤波后的音频信 号195中的N/2采样片段169。
优选地,半窗函数WF1和WF2在彼此重叠时加到1,并且提供良好的频率选择性和止带拒绝(stop-band rejection)。合适的窗函数WF1和WF2由以下表达式定义:
WF 1 ( n ) = [ &Sigma; p = 0 n [ W Kaiser , &alpha; = 10 &pi; N 2 + 1 ( p ) ] &Sigma; p = 0 N 2 [ W Kaiser , &alpha; = 10 &pi; N 2 + 1 ( p ) ] ] , 0 &le; n < N 2 - - - ( 13 )
WF 2 ( n ) = WF 1 ( N 2 - n - 1 ) , 0 &le; n < N 2 - - - ( 14 )
其中 W Kaiser , &alpha; = 10 &pi; N 2 + 1 ( n ) = I 0 [ &pi;&alpha; 1.0 - ( n - N 4 N 4 ) 2 ] I 0 [ &pi;&alpha; ] , 0 &le; n &le; N 2 &alpha; = 10 &pi; .
可以从1993年6月22日公告的美国专利5,222,189获得关于从Kaiser-Bessel内核函数获得的窗函数的附加细节。
图11是可以用于执行刚才描述的过程的设备的示意性框图。该示图并非意图示出实际实现方式。例如,可以通过使用缓冲器来存储对于先前采样片段所计算的时域采样而消除一些FFT和IFFT组件。
与图8所示的组件对应的图11所示的组件具有相同附图标记,并且如上所述地操作。
矢量乘法器136接收变换系数块125和表示先前期望频率响应的谱幅值的一个片段的延迟了一时段的值的块189,并且将变换系数的幅值乘以先前期望频率响应中的各个值,以生成滤波后的变换系数块137。IFFT147应用于滤波后的变换系数块137,以生成N时域信号采样块。该时域采样块的前一半包含表示FFT120对块115中的采样的初始响应的N/2采样片段148。该时域采样块的后一半包含表示FFT 120对块115中的采样的最终响应的N/2采样片段149。在该实现方式中不使用片段149。
重叠相加组件154将片段145中的采样与片段143中的采样相加,并且输出所得和作为N/2采样片段155。加窗运算161使用加窗函数WF的前半部应用于片段155中的采样,以生成N/2加窗采样片段162。该函数的前半部由符号WF1表示。
延迟器156将一个片段时段的延迟施加到片段146,以生成N/2延迟采样片段157。重叠相加组件158将片段148中的采样与片段157中的延迟采样相加,并且输出所得和作为N/2采样片段159。加窗运算164使用加窗函数WF的后半部应用于片段159中的采样,以生成N/2加窗采样片段165。该函数的后半部由符号WF2表示。
矢量加法器167使得片段162和165中的对应采样重叠并且相加以生成滤波后的音频信号195中的N/2采样片段169。
图中所示的其余组件181至186应用于均衡滤波器控制信号495,以生成表示期望频率响应的谱幅值的值的块189。
逆对数181生成均衡滤波器控制信号495中的分量的线性域幅值。Hilbert变换182应用于均衡滤波器控制信号495的对数幅值,以生成一组角(angular)系数。矢量乘法器183将线性域幅值的每个分量乘以各个角系数,以生成最小相位因果冲击响应的频域表示中的一组复值系数,该最小相位因果冲击响应具有与均衡滤波器控制信号495中所指定的频率响应相同的频率响应。可以从Oppenhiem等人的Digital Signal Processing,Prentice Hall Inc.,1975,pp337-361获得该过程的附加细节。
IFFT184应用于最小相位因果冲击响应的频域表示中的该组系数,以获得该冲击响应的时域表示。加窗操作185应用于该时域冲击响应,以确保不多于前N/2+1个采样具有非零值。对冲击响应的长度的限制以及上述输入音频采样的零填充防止了循环卷积失真。可以从Oppenhiem等人的Digital Signal Processing,Prentice Hall Inc.,1975,pp113-115获得附加细节。
基本上可以使用具有不大于N/2+1的长度的任何平滑变化窗函数。因为具有突然变化的窗函数的使用将把可听见的假声引入到所获得的频率响应中,所以它们不是期望的。
可以使用以下窗函数WX:
WX ( n ) = 1 0 &le; n < N 4 W Kaiser , &alpha; = 10 &pi; N 2 + 1 ( n ) N 4 &le; n &le; N 2 0 N 2 + 1 &le; n < N - - - ( 15 )
零值采样附接到加窗了的冲击响应,以获得N采样块。FFT186应用于加窗附接冲击响应,以生成表示由均衡滤波器控制信号495所指定的期望频率响应的谱幅值的值的块189。
C.替选实现方式
以下讨论一些替选实现方式
1.替选变换
可以通过基本上可以期望的任何滤波技术来实现AEQ滤波器100和分析器300中所执行的滤波操作。上述四个示例性实现方式使用FFT和IFFT计算方法来实现DFT和IDFT滤波器组。在此所描述的替选实现方式使用FFT和IFFT计算方法来实现MDFT和IDFT滤波器组。MDFT滤波器组根据以下表达式来生成变换系数块。
X ( k ) = &Sigma; n = 0 N - 1 x ( n ) &CenterDot; e - 2 &pi;j ( k + 1 2 ) n N , 0 &le; k < N - - - ( 16 a ) .
每个块中的前N/2个变换系数X(k)是唯一的且具有复值。
互补IMDFT滤波器组根据以下表达式来生成时域采样块:
x ( n ) = 1 N &Sigma; k = 0 N - 1 X ( k ) &CenterDot; e 2 &pi;j ( k + 1 2 ) n N , 0 &le; n < N - - - ( 16 b ) .
这些滤波器组使用一对加窗操作。一个加窗操作在分析或前向变换之前将分析窗函数应用于音频信号。另一加窗操作将合成窗函数应用于合成或逆变换所生成的时域采样块。基本上可以使用任何窗函数,但是分析和合成窗函数应被设计为使得它们的乘积窗(当与其自身重叠其长度的一半时)加到1。可以用于分析和窗函数中的每一个的一个示例性函数是正弦函数,其域被定标从而零到pi弧度与0到N-1采样对应。
下述实现方式使用窗函数WQ用于分析窗函数,并且使用其各个半窗函数WQ1、WQ2用于合成窗函数,如以下表达式所示:
WQ ( n ) = WF ( n ) = WF 1 ( n ) 0 &le; n < N 2 WF 2 ( n - N 2 ) N 2 &le; n < N - - - ( 17 )
WQ 1 ( n ) = WF 1 ( n ) = &Sigma; p = 0 n [ W Kaiser , &alpha; = 10 &pi; N 2 + 1 ( p ) ] &Sigma; p = 0 N 2 [ W Kaiser , &alpha; = 10 &pi; N 2 + 1 ( p ) ] , 0 &le; n < N 2 - - - ( 18 )
WQ 2 ( n ) = WF 2 ( n ) = WF 1 ( N 2 - n - 1 ) , 0 &le; n < N 2 - - - ( 19 )
图13中的示意性框图示出使用这些滤波器组的AEQ滤波器100的一种实现方式。加窗操作610将窗函数WQ应用于音频信号5的N采样块,以生成N窗加权采样块615。FFT620应用于窗加权采样块615,以生成N变换系数块625。
矢量乘法器630接收变换系数块625和表示期望频率响应的谱幅值的值的块685,将变换系数的幅值乘以期望频率响应中的各个值,以生成滤波后的变换系数块635。逆快速傅里叶变换(IFFT)640应用于滤波后的变换系数块635,以生成N时域信号采样块645。
时域采样块645的序列分别由窗函数WQ加权,彼此重叠N/2 采样,重叠块中的对应采样相加。可以通过各种方式来执行该加窗重叠相加处理。图中示出一种方式。
在该实现方式中,延迟器650对时域采样块645施加N/2采样的延迟,以生成延迟时域采样块655。加窗操作661将窗函数WQ的前一半WQ1应用于时域采样块645的前一半,以生成N/2加窗时域采样片段664。加窗操作662将窗函数WQ的后一半WQ2应用于延迟时域采样块655的后一半,以生成N/2加窗时域采样延迟片段665。重叠相加组件670将加窗时域采样片段664和加窗时域采样延迟片段665中的对应采样相加,并且输出所得和作为滤波后的音频信号195中的N/2时域采样片段。
逆对数680应用于均衡滤波器控制信号495中的分量,以生成表示均衡滤波器控制信号495所指定的期望频率响应的谱幅值的线性域中的值的块189。
2.替选延迟信号 
分析器300的替选实现方式省略滤波器组310b,直接从延迟器250接收延迟音频信号的频域表示。可以通过从AEQ滤波器100获得音频信号5的频域表示并且将该表示传送到延迟器250来实现该操作。
该实现方式中延迟器250所施加的延迟量等于整数片段的时长,其中每个片段具有N/2个采样。如果需要,则可以通过确保延迟器250所施加的延迟大于实现正确对准所需的并且在声学输入换能器230与滤波器组310a之间的信号路径中的某处引入附加延迟来实现延迟音频信号255与检测音频信号235之间的时间对准方面的更大精度。可以使用模拟技术或数字技术来实现附加延迟,以获得期望的时间对准。
3.替选变换长度 
AEQ滤波器100的谱分辨率应足够高以对于其可能碰到的大多数所需系统传递函数提供良好的均衡。由FFT620的长度N以及加窗操作610中使用的分析窗函数来确定该谱分辨率。对于给定的分析窗函数,谱分辨率随着变换长度增大而增大。
AEQ滤波器100中的信号处理延迟也随着变换长度增大而增大。 下述技术提供一种对于给定变换长度减小处理延迟的方式。
在一种实现方式中,将窗函数WQ设置为180个采样。加窗操作610生成具有等于256的长度的采样块615,每个块包括附接到音频信号5的180个窗加权采样的76个零值采样。FFT620和IFFT640每个都具有等于256的长度。IFFT640生成每个都具有256个时域采样的块645。可以忽略每个块中的最后76个采样。加窗操作661应用于每个块中的前180个采样的前一半,窗操作662应用于块中的前180个采样中的后一半。
重叠相加组件670将加窗时域采样片段664中的对应采样与加窗时域采样延迟片段665相加,并且输出所得和作为滤波后的音频信号195中的90个时域采样的片段。
D.实现方式 
可以通过各种方式来实现包括本发明各个方面的设备,包括用于由计算机或某些其他设备执行的软件,所述其他设备包括更专用的组件,诸如耦合到与通用计算机中的那些组件类似的组件的数字信号处理器(DSP)电路系统。图14是可以用于实现本发明各方面的设备70的示意性框图。处理器(PROC)72提供计算资源。RAM73是PROC72用于处理而使用的系统随机存取存储器(RAM)。ROM74表示用于存储操作设备70所需的并且可以用于执行本发明各个方面的程序的某种形式的永久存储(例如只读存储器(ROM))。I/O控制75表示用于接收并且发送信号(例如上述信号5、195、235、255、275和495)的接口电路系统。在所示实施例中,所有主要系统组件都连接到总线71,总线71可以表示多于一条的物理或逻辑总线;然而,总线架构不是实现本发明必需的。
在通用计算机系统所实现的实施例中,可以包括附加组件,以用于接口连接到诸如键盘或鼠标以及显示器之类的设备,并且用于控制具有存储介质(例如磁带、磁盘或光学介质)的存储设备78。存储介质可以用于记录用于操作系统、工具和应用的指令程序,并且可以包括实现本发明各个方面的程序。
可以通过以多种方式实现的组件来执行实践本发明各个方面所需的功能,包括离散逻辑组件、集成电路、一个或多个ASCI和/或程控处理器。实现这些组件的方式对于本发明并不重要。
可以通过各种机器可读介质(例如基带或整个频谱(包括从超声到紫外频率)的调制通信路径)或基本上使用包括磁带、磁卡或磁盘、光学卡或光盘以及包括纸张的介质上的可检测标记在内的任何记录技术来传递信息的存储介质来传递本发明的软件实现方式。

Claims (9)

1.一种用于对音频信号进行均衡的方法,其中,所述方法包括:
接收所述音频信号;
将自适应均衡滤波器应用于所述音频信号,以生成滤波音频信号;
用所述滤波音频信号驱动声学输出换能器,以生成声场;
通过用声学输入换能器检测在传输通过声学通道之后的所述声场来生成检测音频信号;
从所述检测音频信号获得第一频域表示,所述检测音频信号是所述声学输出换能器、所述声学通道和所述声学输入换能器的复合谱幅值响应;
将延迟应用于所述滤波音频信号以获得延迟滤波音频信号,其中所述延迟包括所述声场通过所述声学通道的传输延迟的近似;
从所述延迟滤波音频信号获得第二频域表示;
处理所述第一频域表示、所述第二频域表示以及来自目标谱幅值响应的谱分量的第三频域表示,以生成估计谱幅值响应校正信号;
从所述估计谱幅值响应校正信号获得均衡滤波器控制信号;以及
响应于所述均衡滤波器控制信号而适配所述自适应均衡滤波器的滤波特性。
2.如权利要求1所述的方法,其中,所述估计谱幅值响应校正信号是所述均衡滤波器控制信号。
3.如权利要求1所述的方法,包括:将平滑滤波器应用于所述估计谱幅值响应校正信号以及一个或多个先前的估计谱幅值响应校正信号的序列,以生成所述均衡滤波器控制信号。
4.如权利要求1至3中的任一项所述的方法,其中,所述第一频域表示包括表示所述复合谱幅值响应的谱分量的幅值的值,其中所述第二频域表示包括表示所述延迟音频信号的谱分量的幅值的值。
5.如权利要求1至3中的任一项所述的方法,其中:
所述第一频域表示是从所述复合谱幅值响应的谱分量与所述延迟音频信号的谱分量的互相关获得的;且
所述第二频域表示是从所述延迟滤波音频信号的自相关的谱分量获得的。
6.如权利要求1至3中的任一项所述的方法,包括如下的有效性检查:
通过用第二声学输入换能器检测所述声场和任何环境声音来生成第二检测音频信号;
比较所述延迟音频信号、所述检测音频信号和所述第二检测音频信号的信号电平或谱特性,以生成与所述估计谱幅值响应校正信号的谱分量相关联的有效性测度;
响应于相关联的有效性测度而修正所述估计谱幅值响应校正信号的谱分量中的一个或多个的幅值,以减小所述自适应均衡滤波器的适配对具有更低的有效性测度的那些谱分量的响应。
7.如权利要求1至3中的任一项所述的方法,包括:将所述自适应均衡滤波器应用于所述音频信号,并且通过执行以下操作来使所述自适应均衡滤波器适配于所述均衡滤波器控制信号:
(a)将零值采样片段附接到片段序列中的音频信号采样片段,以获得采样块序列,每个采样块具有音频信号采样的第一半和零值采样的第二半;
(b)响应于均衡滤波器控制信号而适配所述自适应均衡滤波器以具有第一频率响应特性;
(c)将具有所述第一频率响应特性的所述自适应均衡滤波器应用于所述采样块序列中的第一采样块,以获得具有第一半和第二半的谱分量的第一滤波块,其中,
(1)所述第一滤波块的第一半表示将所述自适应均衡滤波器应用于所述第一采样块的第一半,并且包括卷积积,且
(2)所述第一滤波块的第二半表示将所述自适应均衡滤波器应用于所述第一采样块的第二半,并且包括卷积积;
(d)将具有所述第一频率响应特性的所述自适应均衡滤波器应用于所述采样块序列中跟随所述第一采样块的第二采样块,以获得具有第一半和第二半的谱分量的第二滤波块,其中,
(1)所述第二滤波块的第一半表示将所述自适应均衡滤波器应用于所述第二采样块的第一半,并且包括卷积积,
(2)所述第二滤波块的第二半表示将所述自适应均衡滤波器应用于所述第二采样块的第二半,并且包括卷积积;
(e)将所述第一滤波块的第二半与所述第二滤波块的第一半进行组合,并且应用窗函数的第一半,以获得第一加窗块,其中所述窗函数具有第一半和第二半且所述第二半跟随所述第一半;
(f)响应于均衡滤波器控制信号而适配所述自适应均衡滤波器以具有第二频率响应特性;
(g)将具有所述第二频率响应特性的所述自适应均衡滤波器应用于采样块序列中的第一采样块,以获得具有第一半和第二半的谱分量的第三滤波块,其中,
(1)所述第三滤波块的第一半表示将所述自适应均衡滤波器应用于所述第一采样块的第一半,并且包括卷积积,
(2)所述第三滤波块的第二半表示将所述自适应均衡滤波器应用于所述第一采样块的第二半,并且包括卷积积;
(h)将具有所述第二频率响应特性的所述自适应均衡滤波器应用于所述采样块序列中跟随所述第一采样块的第二采样块,以获得具有第一半和第二半的谱分量的第四滤波块,其中,
(1)所述第四滤波块的第一半表示将所述自适应均衡滤波器应用于所述第二采样块的第一半,并且包括卷积积,
(2)所述第四滤波块的第二半表示将所述自适应均衡滤波器应用于所述第二采样块的第二半,并且包括卷积积;
(i)将所述第三滤波块的第二半与所述第四滤波块的第一半进行组合,并且应用所述窗函数的第二半,以获得第二加窗块;以及
(j)将所述第一加窗块与所述第二加窗块进行组合,以获得表示应用于所述音频信号采样的第二片段的滤波的频率响应从所述第一频率响应特性到所述第二频率响应特性的转变的输出块。
8.如权利要求7所述的方法,其中,所述窗函数的第一半和所述窗函数的第二半在彼此重叠时加到1。
9.一种用于均衡音频信号的装置,包括用于执行权利要求1至8中的任一项所述的方法中的所有步骤的部件。
CN201180049284.8A 2010-10-14 2011-09-13 使用自适应频域滤波和动态快速卷积的自动均衡方法及装置 Expired - Fee Related CN103155591B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US39322410P 2010-10-14 2010-10-14
US61/393,224 2010-10-14
PCT/US2011/051322 WO2012050705A1 (en) 2010-10-14 2011-09-13 Automatic equalization using adaptive frequency-domain filtering and dynamic fast convolution

Publications (2)

Publication Number Publication Date
CN103155591A CN103155591A (zh) 2013-06-12
CN103155591B true CN103155591B (zh) 2015-09-09

Family

ID=44736043

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201180049284.8A Expired - Fee Related CN103155591B (zh) 2010-10-14 2011-09-13 使用自适应频域滤波和动态快速卷积的自动均衡方法及装置

Country Status (4)

Country Link
US (1) US9084049B2 (zh)
EP (1) EP2628317B1 (zh)
CN (1) CN103155591B (zh)
WO (1) WO2012050705A1 (zh)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2969804A1 (fr) * 2010-12-23 2012-06-29 France Telecom Filtrage perfectionne dans le domaine transforme.
US9515629B2 (en) * 2013-05-16 2016-12-06 Apple Inc. Adaptive audio equalization for personal listening devices
US20140355769A1 (en) 2013-05-29 2014-12-04 Qualcomm Incorporated Energy preservation for decomposed representations of a sound field
US9466305B2 (en) 2013-05-29 2016-10-11 Qualcomm Incorporated Performing positional analysis to code spherical harmonic coefficients
CN104681034A (zh) 2013-11-27 2015-06-03 杜比实验室特许公司 音频信号处理
US9502045B2 (en) 2014-01-30 2016-11-22 Qualcomm Incorporated Coding independent frames of ambient higher-order ambisonic coefficients
US9922656B2 (en) 2014-01-30 2018-03-20 Qualcomm Incorporated Transitioning of ambient higher-order ambisonic coefficients
US10770087B2 (en) 2014-05-16 2020-09-08 Qualcomm Incorporated Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals
US9852737B2 (en) 2014-05-16 2017-12-26 Qualcomm Incorporated Coding vectors decomposed from higher-order ambisonics audio signals
US9620137B2 (en) 2014-05-16 2017-04-11 Qualcomm Incorporated Determining between scalar and vector quantization in higher order ambisonic coefficients
CN103987000A (zh) * 2014-05-28 2014-08-13 深圳市金立通信设备有限公司 一种音频修正的方法及终端
CN103987001A (zh) * 2014-05-28 2014-08-13 深圳市金立通信设备有限公司 一种音频修正的方法及装置
US9747910B2 (en) 2014-09-26 2017-08-29 Qualcomm Incorporated Switching between predictive and non-predictive quantization techniques in a higher order ambisonics (HOA) framework
CN107493247B (zh) * 2016-06-13 2021-10-22 中兴通讯股份有限公司 一种自适应均衡方法、装置及均衡器
US10644820B2 (en) * 2017-02-06 2020-05-05 Huawei Technologies Co., Ltd. Waveform-coding for multicarrier wake up radio frame
CN110161773B (zh) * 2019-04-26 2021-11-02 太原理工大学 基于切割超连续谱的超宽带白噪源
TW202105908A (zh) * 2019-06-26 2021-02-01 美商杜拜研究特許公司 具有改善頻率解析度的低延遲音訊濾波器組
US11489505B2 (en) * 2020-08-10 2022-11-01 Cirrus Logic, Inc. Methods and systems for equalization

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4207624A (en) * 1978-10-02 1980-06-10 Rockwell International Corporation Frequency domain adaptive filter for detection of sonar signals

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4939685A (en) 1986-06-05 1990-07-03 Hughes Aircraft Company Normalized frequency domain LMS adaptive filter
NL8601604A (nl) 1986-06-20 1988-01-18 Philips Nv Frequentie-domein blok-adaptief digitaal filter.
US5222189A (en) 1989-01-27 1993-06-22 Dolby Laboratories Licensing Corporation Low time-delay transform coder, decoder, and encoder/decoder for high-quality audio
US6760451B1 (en) 1993-08-03 2004-07-06 Peter Graham Craven Compensating filters
JP2004507922A (ja) 2000-08-21 2004-03-11 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 区分ブロック周波数領域適応フィルタ
ATE352124T1 (de) 2000-08-21 2007-02-15 Koninkl Philips Electronics Nv Adaptives frequency domain filter mit partitionierten blöcken
US6868162B1 (en) 2000-11-17 2005-03-15 Mackie Designs Inc. Method and apparatus for automatic volume control in an audio system
FR2827730A1 (fr) 2001-07-17 2003-01-24 Koninkl Philips Electronics Nv Recepteur, procede, programme et signal de transport pour adapter le volume sonore d'un signal acoustique d'appel entrant
US7480377B2 (en) 2003-12-31 2009-01-20 Intel Corporation Dual adaptive filter apparatus and method
CA2471674A1 (en) 2004-06-21 2005-12-21 Soft Db Inc. Auto-adjusting sound masking system and method
WO2006116883A1 (de) 2005-05-01 2006-11-09 Anocsys Ag Verfahren zur kompensation von änderungen reproduzierter audiosignale und eine vorrichtung
US8693699B2 (en) 2008-07-29 2014-04-08 Dolby Laboratories Licensing Corporation Method for adaptive control and equalization of electroacoustic channels
US9135907B2 (en) 2010-06-17 2015-09-15 Dolby Laboratories Licensing Corporation Method and apparatus for reducing the effect of environmental noise on listeners

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4207624A (en) * 1978-10-02 1980-06-10 Rockwell International Corporation Frequency domain adaptive filter for detection of sonar signals

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Gregory A.Clark,."A unified approach to time- and frequency-domain realization of FIR adaptive digital filters".《Acoustics, Speech and Signal Processing, IEEE Transactions on》.1983,第 31 卷(第 5 期),第1073-1083页. *

Also Published As

Publication number Publication date
EP2628317A1 (en) 2013-08-21
US9084049B2 (en) 2015-07-14
WO2012050705A1 (en) 2012-04-19
EP2628317B1 (en) 2015-10-07
CN103155591A (zh) 2013-06-12
US20130208917A1 (en) 2013-08-15

Similar Documents

Publication Publication Date Title
CN103155591B (zh) 使用自适应频域滤波和动态快速卷积的自动均衡方法及装置
EP3703052B1 (en) Echo cancellation method and apparatus based on time delay estimation
US9159335B2 (en) Apparatus and method for noise estimation, and noise reduction apparatus employing the same
US7602925B2 (en) Audio feedback processing system
JP5284359B2 (ja) 自動センサ信号整合
KR101470528B1 (ko) 적응 빔포밍을 위한 사용자 방향의 소리 검출 기반의 적응모드 제어 장치 및 방법
EP3080975B1 (en) Echo cancellation
AU2002331235B2 (en) Sound processing system including forward filter that exhibits arbitrary directivity and gradient response in single wave sound environment
US20080228470A1 (en) Signal separating device, signal separating method, and computer program
JP2002530922A (ja) 信号を処理する装置と方法
KR20140131367A (ko) 능동 잡음 제거와 지각적 잡음 보상의 결합에 의해 음향 재생의 지각 품질을 향상시키기 위한 장치 및 방법
CN101339769A (zh) 回音抑制器、回音抑制方法
CN101727912A (zh) 噪声抑制装置及噪声抑制方法
CN112037816B (zh) 语音信号频域频率的校正、啸叫检测、抑制方法及装置
EP3757993A1 (en) Pre-processing for automatic speech recognition
KR101581885B1 (ko) 복소 스펙트럼 잡음 제거 장치 및 방법
CN112272848A (zh) 使用间隙置信度的背景噪声估计
WO2012114946A1 (ja) 音声処理装置、音声処理方法、及びプログラム
CN112530450A (zh) 频域中的样本精度延迟识别
KR100936093B1 (ko) 전자 신호로부터의 잡음 제거 방법 및 장치
JP3878892B2 (ja) 収音方法、収音装置、および収音プログラム
EP2045620B1 (en) Acoustic propagation delay measurement
US11238882B2 (en) Dry sound and ambient sound separation
JP4510795B2 (ja) 伝達系推定装置、方法、プログラム、記録媒体
EP1415502A2 (en) Sound processing system including forward filter that exhibits arbitrary directivity and gradient response in multiple wave sound environment

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20150909

Termination date: 20170913