CN103222187B - 对于通过扬声器的音频的频谱不着色的优化串扰消除 - Google Patents

对于通过扬声器的音频的频谱不着色的优化串扰消除 Download PDF

Info

Publication number
CN103222187B
CN103222187B CN201180042554.2A CN201180042554A CN103222187B CN 103222187 B CN103222187 B CN 103222187B CN 201180042554 A CN201180042554 A CN 201180042554A CN 103222187 B CN103222187 B CN 103222187B
Authority
CN
China
Prior art keywords
mrow
audio
msup
msub
frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201180042554.2A
Other languages
English (en)
Other versions
CN103222187A (zh
Inventor
E·Y·舒埃里
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Princeton University
Original Assignee
Princeton University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Princeton University filed Critical Princeton University
Publication of CN103222187A publication Critical patent/CN103222187A/zh
Application granted granted Critical
Publication of CN103222187B publication Critical patent/CN103222187B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/04Circuits for transducers, loudspeakers or microphones for correcting frequency response
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/03Synergistic effects of band splitting and sub-band processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/12Circuits for transducers, loudspeakers or microphones for distributing signals to two or more loudspeakers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/04Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Stereophonic System (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)

Abstract

一种用于计算频率相关的正则化参数(FDRP)的方法和系统,所述频率相关的正则化参数(FDRP)被用于分析地导出或实验地测得的系统转移矩阵求逆以用于设计和/或生产串扰消除(XTC)过滤器,该方法和系统依赖于计算导致在扬声器处平坦的振幅相对频率响应(对比于如之前的方法中固有地所做地,在听者耳朵处的平坦的振幅相对频率响应)的FDRP,因此迫使XTC仅在相位域内起效并消除了XTC滤波器的音频频谱着色和动态范围损失的缺陷。当该方法和系统被与任何有效的优化技术一起使用时,其导致这样的XTC滤波器,其在音频带的任何期望部分上获得最佳XTC大小、在所处理的声音上不施加超出回放硬件和/或扬声器中固有频率着色的频谱着色、且不引起任何(或非常低的)动态范围损失。这样的XTC滤波器不仅优化且允许通过扬声器的对于双耳或立体声声音的最为自然和频谱通透的3D音频重现。

Description

对于通过扬声器的音频的频谱不着色的优化串扰消除
相关申请的交叉引用
本申请要求在2010年9月3日提交的、名为“OPTIMALCROSSTALKCANCELLATIONFORBINAURALAUDIOWITHTWOLOUDSPEAKERS”的美国临时申请号61/379,831的美国临时申请的权益且该专利内容通过参考并入此处。
背景技术
采用扬声器的双耳音频(BAL),也称为贯通听觉化(transauralization),意在在听者的耳道出口处再现仅在立体声信号的同侧通道内记录的声压信号。即,在左耳仅再现左立体声通道的声音信号且在右耳仅再现右立体声通道的声音信号。例如,如果用听者的头部相关变换函数(HRTF)来编码源信号、或者源信号包括合适的双耳间时间差(ITD)和双耳间强度差(ILD)线索,则在立体声信号的每一个通道上将信号传递至同侧的耳,且仅传递至该耳,将理想地确保耳-脑系统接收到它所需的线索,从而听到所记录的声场的准确的3-维(3-D)再现。
然而,通过扬声器的双耳音频回放的非故意序列是串扰。当左耳(右耳)听到来自右(左)声道的、源自右扬声器(左扬声器)声音时,发生串扰。换言之,当在立体声通道之一上的声音被听者的对侧的耳朵所听到时,发生串扰。
串扰破坏HRTF信息和ITD或ILD线索,从而听者可能未合适地或完整地理解被包含在记录中的声场的双耳线索。因此,接近BAL的目标要求有效地消除这个非故意的串扰,即串扰消除,或简称为XTC。
尽管存在用于对双扬声器系统能实现某种程度的串扰消除的各种技术,它们全都具有如下一个或多个缺陷:
D1:即使听者正坐在预期的甜区(sweetspot),也有对于听者所听到的声音的数个频谱着色。
D2:仅在音频带的有限频率范围内达到有用的XTC级别。
D3:当声音经过XTC滤波器或处理器处理(同时避免扭曲和/或削波)时的严重的动态范围损失。
通过使用XTC问题的最基本表达式来分析XTC-即通过查看描述从扬声器到听者的耳朵的声音传播的系统转移矩阵(如下所示且在下文描述)的逆(inverse),可看到上述缺陷。
尽管,通常用在使得系统转移矩阵的逆矩阵表现显著较好的XTC滤波器设计中的恒定参数(非频率相关的)正则化的技术,可消除缺陷D3的其中一些,但是它固有地引入其自身的频谱伪像(特定地,以减少逆转移矩阵中的频谱峰值的振幅为代价,恒定参数正则化导致在扬声器的较高频率处的不期望的窄带伪像和较低频率处的衰减(rolloff)),且几乎没有消除另外两个缺陷(D1和D2)。
现有技术的频率相关的正则化,即使当与有效的优化方案结合时,也不足以处理掉缺陷D1、D2、和D3。
基于系统转换矩阵逆矩阵(带有或不带有正则化)的以前的XTC滤波器设计方法,通过在扬声器处施加不平坦的振幅相对频率响应(如下所述),在听者的耳朵处争取维持平坦的振幅相对频率响应,这引起所处理的声音的动态范围中的损失,且基于如下所述的理由,即使听者坐在所预计的甜区,导致听者所听到的声音的频谱着色。
因此,尽管之前的方法对于设计可固有地校正回放硬件和扬声器的振幅相对频率响应的不理想度的XTC滤波器时是有用的,它们没有解决所有的缺陷D1、D2、和D3。
发明内容
描述了一种用于计算频率相关的正则化参数(FDRP)的方法和系统,所述频率相关的正则化参数(FDRP)被用于对于分析导出或实验测得的系统分析矩阵求逆以用于串扰消除(XTC)滤波器设计。本方法依赖于计算导致在扬声器处的平坦的振幅相对频率响应(而非如现有技术方法中原本所做的那样,导致在听者的耳朵处的平坦的振幅相对频率响应)的FDRP,因此强迫XTC仅在相位域中实现且减轻XTC滤波器在可听频谱着色和动态范围损失方面的缺陷。当与任何有效的优化方案一起使用本方法时,其导致这样的XTC滤波器,其在音频带的任何期望部分上获得最佳XTC大小、在所处理的声音上不施加超出回放硬件和/或扬声器中固有的频谱着色的频谱着色、且不引起任何动态范围损失。采用这个方法设计、且被用在该系统中的XTC滤波器不仅是最佳的,且由于不存在缺陷D1、D2、和D3,允许通过扬声器对于双耳或立体声音频的最自然的和频谱通透的3D音频再现。本发明和系统并不企图校正回放硬件的频谱特性、且因此最为适用于与被设计为在不需要用于频谱校正的附加信号处理的情况下满足期望的频谱保真度的音频回放硬件和扬声器。
附图说明
在下文详细描述中可看到本发明的更为详细的理解,该描述要在对照相应附图情况下阅读,在附图中:
图1是听者和双源模型的示图;
图2是在扬声器处的完美的XTC滤波器的频率响应曲线;
图3是示出对于在扬声器处的包络频谱的正则化的效果的曲线,
图4示出对于串扰消除频谱的正则化的效果,
图5是示出扬声器处的包络频谱的示图,
图6是本发明的方法的流程图。
图7示出代表时域中的转换函数的四个(加窗的)测得的脉冲响应(IR)。
图8是示出与完美的XTC滤波器关联的所测得的频谱的图。
图9是示出本发明的XTC滤波器的测得的频谱的图。
详细说明
为了解释本发明的方法和系统的优势,将描述在理想化情况下的基本XTC问题的分析表达式,且将定义“完美的XTC滤波器”,它将作为基准,说明所有XTC滤波器固有的可听频谱着色的严重问题。
在以下描述中,为了清楚以及允许分析观察,将使用在自由空间(没有声音反射)的两个点源(理想的扬声器)12、14以及对应于理想的听者20(没有)的耳朵位置的两个接听点16、18构成的理想化环境。然而,在本发明的下文描述中给出的示例中,将使用对应于在仿真头部的耳道入口处测得的在真实房间中的真实扬声器的脉冲响应的实际数据。
基本XTC问题的表达式
在频域中,在自由场(从听者或任何其他物理对象的头部或外耳壳,没有衍射或反射)中发生声音传播、且扬声器如同点源般辐射的理想化假设的情况下,在自辐射频率ω的声波的点源(单极)相距r处的自由场点处的空气压力,由下式给出:
P ( r , iω ) = iω ρ o q 4 π e - ikr r ,
其中ρo是空气密度,k=2π/λ=ω/cs是波数,λ是波长,cs是声速(340.3m/s),且q是源强度(单位为每单位时间的体积)。将来自源中心的空气的质量流率,V,定义为:
V = iω ρ o q 4 π ,
这是的时间导数,在上述假设下,在图1所示的对称的双源几何配置中由于双源12、14引起的空气压力加起来,为
P L ( iω ) = e - ikl 1 l 1 V L ( iω ) + e - ik l 2 l 2 V R ( iω ) . - - - ( 1 )
类似地,在听者20的右耳18处,下式是所感测到的压力:
P R ( iω ) = e - ik l 2 l 2 V L ( iω ) + e - ik l 1 l 1 V R ( iω ) . - - - ( 2 )
此处,l1和l2是双源12、14中任一个分别和同侧、对侧的耳朵之间的路径长度,如图1中所示。
在说明书全文中,大写字母代表频率变量、小写代表时域变量,大写粗体字母代表矩阵,且小写粗体字母代表向量,并且定义
Δl≡l2-l1且g≡l1/l2(3)
分别作为路径长度差和路径长度比。
由于在图1的几何配置中,对侧的距离大于同侧的距离,则0<g<1。进一步,由图1的几何配置,可将两个距离表达为:
l 1 = l 2 + ( Δr 2 ) 2 - Δ rl sin ( θ ) , - - - ( 4 )
l 2 = l 2 + ( Δr 2 ) 2 + Δ rl sin ( θ ) , - - - ( 5 )
其中Δr是耳道入口之间的有效距离,且l是任一源与听者的耳间中点之间的距离。如图1中所定义,Θ=2θ是扬声器跨距。注意,l>>Δrsin(θ),如很多基于扬声器的聆听设置中一样,这导致g≈1。另一个重要的参数是时间延迟,
τ c = Δl c s - - - ( 6 )
被定义为声波横穿路径长度差异Δl所花费的时间。
使用式(1)和(2),在听者左耳16处接收到的信号和在听者右耳18处接收到的信号可被写为如下向量形式:
P L ( iω ) P R ( iω ) = α 1 ge - iω τ c ge - iω τ c 1 V L ( iω ) V R ( iω ) - - - ( 7 )
p=αCv
其中
α = e - iω l 1 / c s l 1 - - - ( 8 )
其,在时域内,是不影响所接收的信号的形状的传输延迟(除以常数l1)。在包括左通道VL和右通道VR的扬声器处的源向量被写成向量形式v=[VL(iω),VR(iω)]T。v可使用如下变换,从被表示为d=[DL(iω),DR(iω)]T的“所记录的”信号的两个通道获得v:
v=Hd(9)
其中
H = H LL ( iω ) H LR ( iω ) H RL ( iω ) H RR ( iω ) - - - ( 10 )
是所要寻找的用于XTC的2×2滤波器或转换矩阵。因此,由式(7),可获得如下结果
p=αCHd(11)
其中p=[PL(iω),PR(iω)]T是耳朵处的压力的向量,且C是系统的转换矩阵。
C ≡ 1 ge - iω τ c ge - iω τ c 1 - - - ( 12 )
由于图1中所示的几何配置的对称性,C是对称的。
简而言之,从信号d、通过滤波器H、到源变量v、然后通过波传播从扬声器源到在听者耳朵处的压力p,这一转化可被写成
p=αRd
其中性能矩阵,R,被定义为
R = R LL ( iω ) R LR ( iω ) R RL ( iω ) R RR ( iω ) ≡ CH - - - ( 14 )
R的对角元素(即,RLL(iω)和RRR(iω))代表所记录的声音信号向耳朵的同侧的传播,且非对角元素(即,RRL(iω)和RLR(iω))代表不期望的对侧的传输,即,串扰。
性能度量
现在将描述判断XTC滤波器频谱着色与性能的一组度量。仅馈入系统的两个输入中的一个(左或右)、如在同侧的耳朵处听到的信号的振幅谱(对于因子α)为
Esi|(ω)≡|RLL(iω)|=|RRR(iω)|
其中下标“si”和||分别表示“侧图像”和“同侧的耳朵(相对于输入信号)”,如所定义的,Esi||是将由平移至一侧的输入产生的侧图像的(在同侧的耳朵处的)频率响应。类似地,在对侧耳朵,对于输入信号(下标X),如下是侧图像频率响应:
E si X ( ω ) ≡ | R LR ( iω ) | = | R LR ( iω ) |
当同一个信号在左和右输入时之间被等分时,在任一耳朵处的系统频率响应是另一个频谱着色度量: E ci ( ω ) ≡ | R LL ( iω ) + R LR ( iω ) 2 | = | R RL ( iω ) + R RR ( iω ) 2 | ,
此处,下标“ci”代表“中间图像”,因为如所定义的,Eci是将由平移至中间的输入产生的中间图像的率响应。
同样重要的是将在源(即,扬声器)处测得的频率响应,这由S表示且可从过滤器矩阵H的元素中获得:
Ssi||(ω)≡|HLL(iω)|=|HRR(iω)|
S si X ( ω ) ≡ | H LR ( iω ) | = | H RL ( iω ) |
S ci ( ω ) ≡ | H LL ( iω ) + H LR ( iω ) 2 | = | H RL ( iω ) + H RR ( iω ) 2 |
这些响应由与上述振幅谱所使用的相同下标惯例而给出(“||”和“X”分别表示与输入信号同侧与对侧的扬声器)。对于上述度量的重要性的直观解释是,从单输入平移至系统的两个输入的信号将导致在耳朵处的频率响应从Esi到Eci,且在扬声器处从Ssi到Sci
另外两个频谱着色度量是对于系统的同相和异相输入的系统的频率响应。这两个响应如下给出:
Si(ω)≡|HLL(iω)+HLR(iω)|=|HRL(iω)+HRR(iω)|
So(ω)≡|HLL(iω)-HLR(iω)|=|HRL(iω)-HRR(iω)|
下标i和o分别表示同相和异相响应。注意,如所定义地,Si是两倍的(即,比之大6dB)Sci,下文将描述振幅1的信号被平移至中间(即,在L和R输入之间相同地分离),而上文描述了两个振幅1的信号同相馈入系统的两个输入。由于真实的信号可包含具有不同相位关系的各组分,有用的是将Si(ω)和So(ω)组合为单个度量其是描述在扬声器处可被期待的最大振幅的包络频谱,且由下式给出
相关的是,注意等于的H的两次取模(2-norm),||H||,且Si和So是H的两个单值。
最后,将允许对于各种滤波器的XTC性能的评估和比较的重要的度量是χ(ω),串扰消除频谱:
χ ( ω ) ≡ | R LL ( iω ) | | R RL ( iω ) | = | R RR ( iω ) | | R LR ( iω ) | = | E si II ( ω ) | | E si X ( ω ) | .
这是在同侧耳朵的振幅谱与在对侧耳朵的振幅谱的比值,且因此,串扰消除频谱χ(ω)的值越大,串扰消除滤波器越是有效。上述定义给出了一共八个度量,全是频率的实函数,通过这些度量来评估并比较XTC滤波器的频谱着色和XTC性能。
基准:完美的串扰消除
完美的串扰消除(P-XTC)滤波器可被定义为理论上对于所有的频率在听者的耳朵处获得无限串扰消除的滤波器。串扰消除要求在两个耳朵的每一个耳朵处接收到的信号是可单独从同侧信号得到的。因此,为了实现完美的串扰消除,式(13)要求R=CH=I,其中I是单位矩阵(恒等矩阵),且因此,按照式(14)中对于R的定义,P-XTC滤波器是式(12)中所表达的系统转移矩阵的逆矩阵,且可被准确地表达为:
H [ P ] = C - 1 = 1 1 - g 2 e - 2 iω τ c 1 - g e - i ωτ c - g e - i ωτ c 1 - - - ( 15 )
其中上标[P]表示完美的XTC。对于这个滤波器,上述定义的八个度量变为:
E si II [ P ] = 1 ; E si X [ P ] = 0 ; E ci [ P ] = 1 2 ;
S si II [ P ] ( ω ) = | 1 1 - g 2 e - 2 i ωτ c | = 1 g 4 - 2 g 2 cos ( 2 ωτ c ) + 1
S si X [ P ] ( ω ) = | - g e - i ωτ c 1 - g 2 e - 2 i ωτ c | = g g 4 - 2 g 2 cos ( 2 ωτ c ) + 1 - - - ( 16 )
S ci [ P ] ( ω ) = 1 2 | 1 - g g + e i ωτ c | = 1 2 g 2 - 2 g cos ( ωτ c ) + 1
S ^ [ P ] ( ω ) = max ( | 1 - g g + e i ωτ c | , | 1 + g e i ωτ c - g | )
= max ( 1 g 2 + 2 g cos ( ωτ c ) + 1 , 1 g 2 - 2 g cos ( ωτ c ) + 1 )
χ [ P ] ( ω ) = ∞ - - - ( 17 )
完美的XTC滤波器(χ[P]=∞)给出在耳朵处的平坦的频率响应(如常数 所证明地)且在消除串扰方面是有效地,如所证明地,同时保持同侧信号,如振幅谱1,所证明地。然而,频谱在构成严重的频谱着色的源( )处具有频率变化的行为,这,如下文将看到的,仅在理想世界(即,在模型的理想化假设下)中才不被耳朵所听到。
扬声器处的频谱着色的程度被绘制在图2中,图2示出在扬声器处的完美XTC滤波器的频率响应:振幅包络(曲线22)、侧图像(曲线24)、和中间图像(曲线26)。虚线的水平线标记了包络顶部,这对于(g=.985)的情况是36.5dB。在底部轴上给出无量纲的频率ω/τc,且以Hz为单位的被图示在顶部轴上的相应频率,用来说明在44.1kHz的红书(redbook)CD采样频率处的τc=3样本的特别(典型)情况。(这将是例如,具有Δr=15cm、l=1.6m、且θ=18°的设置的情况。)
如图2中所示,在对于这些频率,扬声器处的信号振幅必须被提升从而实现在耳朵处的XTC同时补偿在这个位置的破坏性干扰的这些频率处,在 频谱中出现峰值。类似地,当由于破坏性干扰,振幅必须被衰减时,在频谱中出现最小值。
对于各频谱,使用表达式的一阶和二阶导数(相对于ωτc),相关峰值的振幅和频率,用上标↑表示,且最小值,用上标,表示,且由下式给出:
S si | | [ P ] ↑ = 1 1 - g 2 at ωτ c = nπ , with , n = 0,1,2,3,4 , . . .
S si | | [ P ] ↓ = 1 1 + g 2 at ωτ c = n π 2 , with , n = 1,3,5,7 , . . .
S si X [ P ] ↑ = g 1 - g 2 at ωτ c = nπ , with , n = 0,1,2,3,4 , . . .
S si X [ P ] ↓ = g 1 + g 2 at ωτ c = n π 2 , with , n = 1,3,5,7 , . . .
S ci [ P ] ↑ = 1 2 - 2 g at ωτ c = nπ , with , n = 1 , 3,5,7 , . . .
S ci [ P ] ↓ = 1 2 + 2 g at ωτ c = nπ , with , n = 0,2,4,6 , . . .
S ^ [ P ] ↑ = 1 1 - g at ωτ c = nπ , with , n = 0,1,2,3,4 , . . . - - - ( 18 )
S ^ [ P ] ↓ = 1 1 + g 2 at ωτ c = n π 2 , with , n = 1,3,5,7 , . . . - - - ( 19 )
对于典型的接听设置,g≈1,即,图2中所示的g=.985的情况,包络峰值(即,)对应于如下的增强:
20 log 10 ( 1 1 - . 985 ) = 36.5 dB
(且其他频谱中的峰值,对应于约30.5dB的增强。)尽管这些增强在频谱上具有相同的频率宽度,当用对数绘制频谱时(因为这适于人声音的感知),在所感知的频率范围内,低频增强是最突出的。这个低频(即,低音增强)被认为是XTC中的内在问题。尽管,理论上,通过减少τc(从式(4)到(6)可看出,通过增加l和/或减少扬声器跨距θ而达成,如在所谓“立体声偶极”配置中所做的那样,其中θ可以是10°),可从音频范围中推出高频峰值,但是P-XTC滤波器的“低频增强”将仍是问题。
与这些高振幅峰值关联的严重的频谱着色表现出三个实际问题:1)这将由甜区外的听者所听到、2)这将引起在回放换能器上物理张力的相对增加(相比未经处理的声音回放)、和3)这将对应于动态范围的损失。
如果在甜区的听者的耳朵处确保完美的XTC滤波器承诺的无限好的XTC性能(χ=∞)和完美地平坦的频率响应(F[P](ω)-constant),这些缺点或将是合理的代价。然而,实践中,由于该解对于不可避免的误差的敏感性,这些理论上承诺的优势是难以实现的。通过评估转移矩阵C的条件数,可最佳地了解这个问题。
已知的是在矩阵拟问题中,该解对于系统中误差的敏感度是由矩阵的条件数给出的。矩阵的条件数κ(C)由下式给出
κ(C)=||C||||C′-1||=||C||||H[P]||.。
(这等同地也是矩阵的最大单值与最小单值的比。)因此,我们有
κ ( C ) = max ( 2 ( g 2 + 1 ) g 2 + 2 g cos ( ωτ c ) + 1 - 1 ,
2 ( g 2 + 1 ) g 2 - 2 g cos ( ωτ c ) + 1 - 1 ) 30 .
使用这个函数的一阶和二阶导数,如对于之前的频谱所做的那样,以下是最大值和最小值:
ωτc=nπ, κ ↑ ( C ) = 1 + g 1 - g 35 ,其中n=0,1,2,3,4…(20)
κ(C)=1,其中n=1,3,5,7…(21)
首先,注意的是在与在扬声器处的振幅包络频谱的相同频率处,出现条件数的峰值和最小值。其次,要注意的是最小值具有单仿条件数(最低可能值),这暗示着源自C的逆矩阵的XTC滤波器在无量纲频率处是最为稳健的(即,最少地敏感于转移矩阵中的误差)。反之,在无量纲频率ωτc=0,π,2π,3π...处,条件数可达到非常高的值(如,对于g=.985的典型情况,κ(C)=132.3)。由于g→1,源自P-XTC滤波器的矩阵逆变得难以处理,或换言之,无限敏感于误差。例如,听者头部的最为轻微的未对准,将因此导致在耳朵处XTC控制的严重的损失(位于和靠近这些频率处),这进而引起将被传输至耳朵的中的的严重的频谱着色。
恒定参数正则化的缺陷
正则化方法,以该解的准确度的某些损失为代价,允许控制难以处理的(ill-conditioned)线性系统的近似解的模。可服从于优化规定(诸如最小化成本函数)来完成通过正则化对于模的控制。可在XTC滤波器优化的环境中分析地讨论正则化,XTC滤波器优化可被定义为对于频谱着色的期望的可容忍的级别的XTC性能的最大化,或等同地,对于期望的最小的XTC性能的频谱着色的最小化。
找到代表对于矩阵逆问题的最近解的伪逆:
H[β]=[CHC+βI]-1CH(22)
其中上标H表示厄密共轭运算符,且β是本质上引起与H[P](C的实际的逆)的偏离的正则化参数。β被取为常数0<β<<1。伪逆矩阵,,是被正则化的滤波器,且上标[β]被用于表示恒定参数正则化。式(22)中所表达的正则化对应于成本函数J(iω)的最小化,
J(iω)=eH(iω)e(iω)+βvH(iω)v(iω)(23)
其中,向量e代表作为与由完美滤波器重现的信号之间的偏离的测量的性能度量。然后,物理地,构成成本函数的和中的第一项代表性能误差的测量,且第二项代表“努力惩罚(effortpenalty)”,这是对于由扬声器施加的功率的测量。对于β>0,式(22)导致优化,这对应于成本函数J(iω)的最小乘方的最小化。
因此,正则化参数β的增加导致以较大的性能误差为代价的对于努力惩罚的最小化,且因此导致,以在系统难以处理情况下的频率和附近的XTC性能的减少为代价,对于H的模的峰值(即,在S(ω)频谱中的着色峰值)的消除。
使用对于式(12)给出的C的明确形式,恒定参数正则化XTC滤波器的频率响应变为:
其中
H LL [ β ] ( iω ) = H RR [ β ] ( iω )
= g 2 e i 4 ωτ c - ( β + 1 ) e i 2 ωτ c g 2 e i 4 ωτ c + g 2 - [ ( g 2 + β ) 2 + 2 β + 1 ] , - - - ( 25 )
H LR [ β ] ( iω ) = H RL [ β ] ( iω )
= g e i ωτ c - g ( g 2 + β ) e i 3 ωτ c g 2 e i 4 ωτ c + g 2 - [ ( g 2 + β ) 2 + 2 β + 1 ] . - - - ( 26 )
此处我们定义的八个度量频谱变为:
E si | | [ β ] ( ω ) = g 4 + β g 2 - 2 g 2 cos ( 2 ωτ c ) + β + 1 - 2 g 2 cos ( 2 ωτ c ) + ( g 2 + β ) 2 + 2 β + 1 ;
E si X [ β ] ( ω ) = 2 gβ | cos ( ωτ c ) | - 2 g 2 cos ( 2 ωτ c ) + ( g 2 + β ) 2 + 2 β + 1 ;
E ci [ β ] ( ω ) = 1 2 - β 2 [ g 2 + 2 cos ( ωτ c ) + β + 1 ] ;
S si | | [ β ] ( ω ) = g 4 - 2 ( β + 1 ) g 2 cos ( 2 ωτ c ) + ( β + 1 ) 2 - 2 g 2 cos ( 2 ωτ c ) + ( g 2 + β ) 2 + 2 β + 1 ;
S si X [ β ] ( ω ) = g ( g 2 + β ) 2 - 2 ( g 2 + β ) cos ( 2 ωτ c ) + 1 - 2 g 2 cos ( 2 ωτ c ) + ( g 2 + β ) 2 + 2 β + 1 ;
S ci [ β ] ( ω ) = g 2 + 2 g cos ( ωτ c ) + 1 2 [ g 2 + 2 g cos ( ωτ c ) + β + 1 ] ;
S ^ [ β ] ( ω ) = max ( g 2 + 2 g cos ( ωτ c ) + 1 g 2 + 2 g cos ( ωτ c ) + β + 1 ,
g 2 - 2 g cos ( ωτ c ) + 1 g 2 - 2 g cos ( ωτ c ) + β + 1 ) ; - - - ( 27 )
χ [ β ] = g 4 + β g 2 - 2 g 2 cos ( 2 ωτ c ) + β + 1 2 gβ | cos ( ωτ c ) | . - - - ( 28 )
值得注意的是当β→0,H[β]→H[P]且完美XTC滤波器的频谱如所预期地从上述表达式中被恢复。
在图3中对于β的三个值,绘出包络频谱在该绘图中可注意到两个特征:1)增加正则化参数,在不影响最小值的情况下衰减了频谱中的峰值,和2)随着增加β,频谱最大值分裂为成对的峰值(两个空间上紧邻的峰值)。
为了获得峰值衰减的测量和成对峰值的信息的情况,相对于ωτc的一阶和二阶导数被用于找出一阶导数为零且二阶为负的条件。这些条件被汇总如下:如果β低于被定义为β*的阈值:
β<β*≡(g-1)2.(29)
峰值是单个的且出现在与P-XTC滤波器的包络频谱峰值相同的无量纲频率处,且具有如下振幅:
S ^ [ β ] ↑ = 1 - g ( g - 1 ) 2 + β
在ωτc=nπ,其中n=0,1,2,3,4…
如果条件
β*≤β-1(30)
被满足,最大值是位于以下无量纲频率处的成对峰值:
ωτ c = nπ ± cos - 1 ( g 2 - β + 1 2 g ) , 其中n=0,1,2,3,4…(31)
且具有振幅
S ^ [ β ] ↑ ↑ = 1 2 β , - - - ( 32 )
这不依赖于g。(上标↑和分别表示单峰值和成对峰值。)通过将P-XTC(即,β=0)频谱中峰值的振幅除以经正则化的频谱中峰值的振幅,可获得由于正则化引起的在频谱中的峰值的衰减。对于单峰值的情况,衰减是
20 log 10 ( S ^ [ P ] ↑ S ^ [ β ] ↑ ) = 20 log 10 [ β ( g - 1 ) 2 + 1 ] dB ,
且对于成对峰值,它由下式给出
20 log 10 ( S ^ [ P ] ↑ S ^ [ β ] ↑ ↑ ) = 20log 10 [ 2 β 1 - g ] dB .
对于图2中所示的g=.985的典型情况,我们有β*=2.225×10-4,且对于β=.005和0.05,我们获得如图上所标记地分别被衰减达19.5和29.5dB(相对于P-XTC频谱中的峰值)的成对峰值。因此,将正则化参数增加至大于此(一般较低)阈值使得,包络频谱中的最大值分裂为成对峰值,在完美XTC滤波器的响应的峰值的每一侧变化频率(对于g=.985的说明性情况,据发现,对于β=.05,β*=2.225×10-4且Δ(ωτc);0.225)。由于对于人类的频率感知的对数本质,这些成对峰值在高频处(即,对于n=1,2,3,...)被感知为窄带伪像,但是集中在n=0处的第一成对峰值被感知为一般为很多dB的宽带低频衰减(roll-off),如可从图3中清晰可见地那样。因此,恒定-β正则化将完美XTC滤波器的低音增强转换为低音衰减(roll-off)。
由于正则化本质上是故意将误差引入系统逆,期待的是在耳朵处的XTC频谱和频率响应将经受(即,距离它们理想的∞和0dB的P-XTC滤波器级别)增加β。对于在耳朵处的响应的恒定参数正则化的效果被图示于图4中,图4示出在串扰消除频谱上正则化的效果(上面两个曲线)χ[β](ω)、以及对于侧图像在耳朵处的对侧频率响应,在顶部轴上的黑色水平条标记了在β=.05时达到20~dB或更高的XTC大小的频率范围,且灰色条代表对于β=.005情况下的相同项。(其他参数与图2的相同)。
图中的黑色曲线代表了串扰消除频谱并示出在集中在其中系统难以处理的频率(ωτc=nπ,其中n=0,1,2,3,4,...)周围的频带中丢失了XTC控制且其频率范围随着增加正则化而扩展。例如,将β增至.05将20dB或更高的XTC限制为由该图的顶部轴上的黑色水平条所标记的频率范围内,第一范围仅从1.1扩展到6.3kHz且第二和第三范围位于8.4kHz之上。在很多实践应用中,对于设计滤波器而言,不需要或不可实现这样高(20dB)的XTC大小(如,由于房间反射和/或听者与所使用的如仿真头的HRTF之间的不匹配),且需要更高的β值来将频谱着色峰值驯服至扬声器可容忍的所要求的大小之下。
如图4中的底部曲线所示,在耳朵处的响应,距离相应P-XTC(i.e.,β=0)滤波器响应(这在0dB处是平坦的曲线)仅偏离数dB。更准确地且一般地而言,频谱的最大值和最小值由下式给出:
ωτ c = n π 2 , E si | | [ β ] ↑ = g 2 + 1 g 2 + β + 1 , 其中n=1,3,5,7…
; ωτ c = nπ , E si | | [ β ] ↓ = g 4 + ( β - 2 ) g 2 + β + 1 g 4 + 2 ( β - 1 ) g 2 + ( β + 1 ) 2 , 其中n=0,1,2,3,4…
对于图中所示的典型(g=.985)示例,对于β=.05、示出在耳朵处频谱着色的甚至相对激进的正则化结果,相比于完美XTC滤波器施加在扬声器处的频谱着色而言是非常温和的。
总体上,尽管恒定参数正则化,在XTC滤波器设计中的常用技术,在扬声器处的包络频谱中减少峰值振幅(包括“低频增强”)是有效的,其通常导致扬声器处在更高频率处的不期望的窄带伪像和在更低频率处的衰减。如此处所述,如果正则化参数被允许是频率的函数,可避免这个非优化行为。
通过频率相关正则化的频谱平坦化
本发明的方法和系统依赖于使用特定方案来计算频率相关的正则化参数(FDRP),其将导致在扬声器处而不是在听者的耳朵处测得的振幅相对频谱的平坦化,而后者是基于系统转移矩阵的逆矩阵的在前XTC滤波器设计中所暗示的。
在扬声器处(而不是在听者的耳朵处)测得的振幅相对频谱的平坦化,迫使XTC仅源自相位效应、而不是来自振幅效果,因为随着扬声器处的频率变化,振幅是平坦的。这意味着将不校正在扬声器和/或回放硬件中的任何固有频谱(即,振幅相对频率)着色(而在先前的基于逆的XTC滤波器设计方法中是固有地这样做的,其中该XTC滤波器意在在耳朵处重现所记录的信号的相同振幅相对频率响应)。
对于在扬声器处测得的振幅相对频谱的平坦化,导致在不通过XTC滤波器处理声音的情况下,听者听到相同的振幅相对频率响应。这暗示着该听者将不会听到由于没有滤波器的回放硬件和扬声器引起的任何偏离的频谱着色。同样重要的是,在扬声器处的这样的平坦的滤波器响应还意味着在经处理的音频中没有动态范围损失。
为了说明本发明的方法和系统,将对于如何计算频率相关的正则化参数的理想化分析描述做出说明,其导致在扬声器处平坦化XTC滤波器的特定目的。
在理想化模型的环境中对于本发明的方法的描述
为简洁起见,将使用相对于式(23)中所表达的成本函数的最小化而描述的相同的优化方案,记住,本发明的方法和系统完全无关于所采用的优化方案。
为了避免上述的以及图3中示出的频域伪像,计算频率相关的正则化参数,这将使得包络频谱在其中完美滤波器的包络频谱超过Г的频带之上平坦存期望的大小Г(单位dB)。在这些频带外(即,其中小于Г),我们不施加正则化。这可被象征性地表达如下:
如果 S ^ [ P ] ( ω ) ≥ γ , S ^ [ P ] ( ω ) = γ - - - ( 33 )
如果 S ^ [ P ] ( &omega; ) < &gamma; . S ^ ( &omega; ) = S ^ [ P ] ( &omega; ) - - - ( 34 )
其中P-XTC包络频谱,由式(16)给出,且
γ=10Г/20(35)
其中用dR给出。不超过频谱峰值的大小,γ边界为:
&gamma; &le; 1 1 - g - - - ( 36 )
其中该边界是频谱的最大值,由式(18)给出。
由式(33)所要求的影响频谱平坦化所需的该频率相关的正则化参数是通过将由式(27)给出的设置为等于γ且对于β(ω)(现在是频率的函数)求解而获得。由于正则化频谱包络,(也是||H[β]||,正则化XTC滤波器的2-次模)是两个函数的最大值,对于β(ω)的两个解被获得:
&beta; I ( &omega; ) = - g 2 + 2 g cos ( &omega;&tau; c ) + g 2 - 2 g cos ( &omega;&tau; c ) + 1 &gamma; - 1 , - - - ( 37 )
&beta; II ( &omega; ) = - g 2 - 2 g cos ( &omega;&tau; c ) + g 2 + 2 g cos ( &omega;&tau; c ) + 1 &gamma; - 1 . - - - ( 38 )
第一个解,βI(ω),应用于其中完美滤波器的异相响应(即,第二单值,这是式(16)中的函数的第二自变量)相比同相响应(即,该函数的第一自变量)占优势的频带:
S o [ P ] = 1 g 2 - 2 g cos ( &omega;&tau; c ) + 1
&GreaterEqual; S i [ P ] = 1 g 2 + 2 g cos ( &omega;&tau; c ) + 1 . . - - - ( 39 )
类似地,用βII(ω)的正则化应用于其中的频带。因此,我们必须分辨最佳解的三种情况分支:对应于β=βI(ω)和β=βII(ω)的两个正则化分支,和对应于β=0的一个非正则化(完美滤波器)分支。我们分别称之为分支I、II、和P,并将与每一个相关联的情况如下总结:
分支I:适用于其中且要求设置
S ^ ( &omega; ) = &gamma; , β=βI(ω);
分支II:适用于其中且要求设置
S ^ ( &omega; ) = &gamma; , β=βII(ω);
分支P:应用于其中且要求设置
S ^ ( &omega; ) = S ^ [ P ] ( &omega; ) , β=0。
在这三分支后,对于频率相关的正则化的情况,对于在扬声器处的包络频谱,被绘制为图5中的加粗的黑色曲线。选择这个值是因为其对应于在β=.05频谱中(成对的)峰值的大小(即,),还绘制(未加粗实曲线)作为恒定参数正则化的对应情况的参考。(如果中的峰值,无论是单个或成对的,等于γ,我们将用频率相关正则化获得的频谱和用恒定-β正则化获得的一个称为“对应频谱”。)
从图中可看出,完美XTC频谱的低频增强和高频峰值(这可通过恒定β正则化分别被转换为低频衰减和窄带伪像),现在在最大着色大小处是平坦的。频谱的其余部分,即,具有低于的振幅的频带,被允许从完美XTC滤波器的无限XTC大小和与相对低的条件数相关联的稳健性中受益。
在本发明的方法中,γ被特定地选为在等于频谱的最低值的值处或低于该值,即
因为这将确保整个频谱是平坦的(即,(34)中的不相等并不维持且分支P消失)且XTC将被迫仅通过相位效应而生效,导致没有由于XTC过滤引起的振幅着色和任何动态范围损失,同时确保通过所采用的优化方法规定的无论什么成本函数(在这个特定示例中,是式(23))的最小化。
一般化方法
上文将我们引导至本发明的方法的一般化描述,形式为在XTC设计工艺中采取的特定步骤(这些步骤还被与每一个步骤的相关联的输入与输出被示意地图示于图6中):
在步骤30中,频域中系统的转换矩阵(即,步骤30中的矩阵C(即在式(12)和输入28中的矩阵C)被分析地(如果其源自易处理的理想化模型)或数值地(如果其源自实验测量)求逆,使用零或非常小的恒定正则化参数(大到足以避免机器逆问题)来获得相应的完美XTC滤波器,H[P]
在步骤34中,被设置为等于Г*,为在步骤34中由扬声器处的振幅相对频率响应所达到的最低值(单位为dB),这从式(19)(或源自另一个易处理的分析模型的类似式)或从绘制H[P]频谱(如果求逆是在下文进一步给出的示例中的实际测量完成的)中发现,然后从γ*=10Г*/20(36)中计算γ。
在步骤38中,计算导致在扬声器处的平坦的频率响应的频率相关的正则化参数(FDRP)β(ω),从而(如,通过使用式(37)和(38)所做的),因此迫使XTC仅由相位效应造成。
在步骤40中,由此获得的FDRP,β(ω),被用于计算系统转移矩阵的伪逆(如,根据式(22)),此举获得所寻找的在扬声器处具有平坦的频率响应的正则化的最佳XTC滤波器H[β]。(最终,如果需要通过时基卷积来施加所得滤波器(如实践中的XTC实现所经常做的那样),通过简单地采用H[β](输出42)的逆傅里叶变换来获得滤波器的时域版本(脉冲响应)。)
应该注意的是在步骤38中,如果计算FDRP以使对于侧图像(即,被平移到左或右通道、且因此当XTC大小足够高时,将由坐在他左耳或右耳处或在他左耳或右耳附近的听者所感知的声音)发生频谱平坦化。然而,仅通过要求S[β](ω)=常数≤γ*,其中S[β](ω)是XTC滤波器对于无论被平移到左和右通道之间何处的源的图像的XTC滤波器的频率响应,可使用相同的方法来平坦化非纯侧图像的图像在扬声器处的响应。例如,为了平坦化中间图像,我们将S[β] ci(ω)(如,通过之前的式27给出)设置为常数≤γ*,且继续如上所述的方法的步骤。在这个上下文中,有关且应提及的是,对于一些应用,例如流行音乐记录(其中主唱音频(leadvocalaudio)被平移至静点),可期望的是平坦化中间图像的响应,即Sci(ω)(或任何其他期望的平移至的图像的响应),从而避免该图像的着色。还应该注意的是,在上下文中,由于仅平坦化侧图像(即,将设置为)将会导致没有由于XTC滤波器引起的任何动态范围损失。换言之,平坦化侧图像外的任何将招致动态范围损失,这必须由期望平移至的图像的减少的频谱着色的优势所平衡。例如,对于实际声学音域的双向记录(一般不包括静点的平移图像),建议对侧图像平坦化,因为这导致没有动态范围损失。
使用所测得的转移函数的示例。
现在将描述基于由放置在仿真头部的耳道入口处的扩音器(NeumannKU-100)在室温测得的两个扬声器的转移函数为基础的示例。该两个扬声器具有在接听位置的60度的跨距,对于各扬声器距离约2.5米。
图7示出代表时域中的转换函数的四个(加窗)测得的脉冲响应(IR)。图7中的每一个曲线的x-轴是ms为单位的时间,且y-轴是所测得的信号的归一化振幅。顶部左侧曲线示出在仿真头部的左耳测得的左扬声器的IR,其底部左侧曲线示出在仿真头部的右耳测得的左扬声器的IR。顶部右侧曲线是右扬声器-左耳转移函数的IR,且底部曲线是右扬声器-右耳转移函数的IR。
图8,示出其中x-轴是以Hz为单位的频率且y-轴是以dB为单位的振幅的相关频谱。图中的曲线48是对应于通过将测试声完整地平移至左侧通道获得的在频域中左扬声器-左耳转移函数的频率响应CLL。曲线48在5kHz之上的波纹是由于头部和左耳翼的HRTF引起的。在该图中的其他曲线50、52、54是所测得的与完美XTC滤波器关联的频率响应,完美XTC滤波器是指通过对基本没有正则化((β=10-5)的转移函数求逆获得的XTC滤波器。特定地,曲线50是在左扬声器处的响应且示出31.45dB(在该曲线中最大值和最小值之间的差异)的动态范围损失。曲线52是在左(同侧)耳朵处测得的频率响应与期待自完美XTC滤波器的一样,在整个音频带上基本是平坦的。曲线54是在右(对侧)耳朵处测得的对应的频率响应且示出由于XTC引起的相对于曲线52的显著衰减。在频率上线性地平均化的曲线52和54之间振幅中的差异是平均的XTC大小,对于这个情况是21.3dB。
我们将这些曲线与图9中的曲线对比,图9示出由于根据本发明设计的滤波器引起的响应。通过设计,曲线60,代表在左边扬声器处的响应,在整个音频频谱上是完全平坦的。因此,在左耳处的频率响应,曲线62,与曲线64中示出的相对应的所测得的系统转移函数CLL,很好地匹配。由于是平坦的,不存在与该滤波器关联的动态范围损失。这个滤波器的平均XTC大小(通过获得曲线62和66之间的差异的线性平均)是19.54dB,仅比用完美滤波器获得的XTC大小低1.76dB,证实了经正则化滤波器的优化本质。[总而言之,用本发明的方法设计的滤波器,对于回放系统的声音没有施加任何音频着色,不具有动态范围损失,且获得与完美XTC滤波器的XTC大小基本一样的XTC大小。]
此处描述的方法可用结合在由通用目的计算机或处理器(诸如DSP芯片组)执行的计算机可读存储介质中的软件、或固件中实现。合适的计算接可读存储介质的示例包括只读存储器(ROM)、随机存取存储器(RAM)、寄存器、缓存、半导体存储器器件、诸如内部硬盘和可移除磁盘之类的磁性介质、磁-光介质、和诸如CD-ROM盘之类的光学介质、以及数字多用盘(DVD)。
本发明的实施例可被表现为存储于计算机可读存储介质中的指令和数据。例如,本发明的各方面可使用作为硬件描述语言(HDL)的Verilog来实现。在被处理时,Verilog数据指令可生成其他中间数据(如,netlists,GDSdata,等),这些可被用于执行在半导体制造设施中实现的制造工艺。可采用这制造工艺来制造实现本发明各方面的半导体器件(如,处理器)。
合适的处理器,以举例的方式,包括通用目的处理器、专用目的处理器、常规处理器、数字信号处理器(DSP)、多个微处理器、图形处理单元(GPU)、DSP核心、控制器、微控制器、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、任何其他类型的集成电路(IC)、和/或状态机、或其组合。
尽管参考优选实施例描述了上述方面,对于本领域技术人员而言各种改变和变形是容易想到的。所有这些改变和变形意在落在所附权利要求的范围内。

Claims (16)

1.一种用于过滤音频信号来消除音频系统中的扬声器串扰的方法,所述方法包括如下步骤
对于所述音频系统的转移矩阵或函数求逆;
使用来自所述逆转移矩阵或函数的信息来计算频率相关的正则化参数,所述频率相关的正则化参数被用来计算所述转移矩阵或函数的正则化的逆以获得串扰消除滤波器,当所述串扰消除滤波器被应用于音频信号时在所述音频系统的任何扬声器处在整个音频带或音频带一部分上产生平坦的频率响应。
2.如权利要求1的用于过滤音频信号来消除扬声器串扰的方法,其特征在于,所述串扰消除滤波器仅通过在整个所述音频带或所述音频带的一部分上的相位效应来对串扰消除起效。
3.如权利要求1的用于过滤音频信号来消除串扰的方法,其特征在于,当所述频率相关的正则化参数被施加至音频信号时,所述频率相关的正则化参数对于被平移至左和右通道之间的任意处的期望图像在扬声器中的一个或多个处产生平坦的频率响应。
4.如权利要求1的用于过滤音频信号来消除扬声器串扰的方法,其特征在于,所述音频系统是双耳音频系统。
5.如权利要求1的用于过滤音频信号来消除扬声器串扰的方法,其特征在于,所述音频系统是立体声音频系统。
6.一种用于为音频应用设计扬声器串扰消除滤波器的方法,所述方法包括如下步骤
对于音频系统的转移矩阵或函数求逆;
使用来自所述逆转移矩阵或函数的信息来计算频率相关的正则化参数,所述频率相关的正则化参数被用来计算所述转移矩阵或函数的正则化的逆以获得串扰消除滤波器,当所述串扰消除滤波器被应用于音频信号时在所述音频系统的任何扬声器处在整个音频带或音频带一部分上产生平坦的频率响应。
7.如权利要求6的用于为音频应用设计扬声器串扰消除滤波器的方法,其特征在于,频率相关的正则化使得串扰消除在整个所述音频带或所述音频带的一部分上仅通过相位效应起效。
8.如权利要求6的用于为音频应用设计扬声器串扰消除滤波器的方法,其特征在于,计算所述频率相关的正则化参数的所述步骤得到滤波器,当该滤波器被应用于音频信号时,对于被平移至左和右通道之间的任意处的期望图像在扬声器中的一个或多个处产生平坦的频率响应。
9.如权利要求6的用于为音频应用设计扬声器串扰消除滤波器的方法,其特征在于,所述音频系统是双耳音频系统。
10.如权利要求6的用于为音频应用设计扬声器串扰消除滤波器的方法,其特征在于,所述音频系统是立体声音频系统。
11.一种用于过滤音频信号来消除音频系统中的扬声器串扰的系统,所述系统包括:
音频输入级;
处理器,用于
对于所述音频系统的转移矩阵或函数求逆;
计算频率相关的正则化参数,所述频率相关的正则化参数被用来计算所述转移矩阵或函数的正则化的逆以获得串扰消除滤波器,当所述串扰消除滤波器被应用于音频信号时在所述音频系统的任何扬声器处在整个音频带或音频带一部分上产生平坦的频率响应。
12.如权利要求11的用于过滤音频信号来消除音频系统中的扬声器串扰的系统,其特征在于,所述串扰消除在所述音频带或所述音频带的一部分上仅通过相位效应由所述处理器起效。
13.如权利要求11的用于过滤音频信号来消除音频系统中的扬声器串扰的系统,其特征在于,所述处理器具有这样的能力:施加所述频率相关的正则化参数来过滤音频信号从而对于被平移至左和右通道之间的任意处的期望图像在扬声器中的一个或多个处产生平坦的频率响应。
14.一种用于为音频应用产生扬声器串扰消除滤波器的系统,所述系统包括:
音频输入级;
处理器,用于
对于所述音频系统的转移矩阵求逆;
计算频率相关的正则化参数,所述正则化参数被用来计算所述转移矩阵或函数的正则化的逆以获得串扰消除滤波器,当所述滤波器被应用于音频信号时,在所述音频系统的任何扬声器处在整个音频带或音频带一部分上产生平坦的频率响应。
15.如权利要求14的用于对音频应用产生扬声器串扰消除滤波器的系统,其特征在于,使用频率相关的正则化从而串扰消除在整个所述音频带或所述音频带的一部分上仅通过相位效应起效。
16.如权利要求14的用于为音频应用产生扬声器串扰消除滤波器的系统,其特征在于,所述处理器具有这样的能力:施加所述频率相关的正则化参数来产生滤波器,当该滤波器被应用于所述音频信号时,对于被平移至左和右通道之间的任意处的期望图像在扬声器中的一个或多个处产生平坦的频率响应。
CN201180042554.2A 2010-09-03 2011-09-01 对于通过扬声器的音频的频谱不着色的优化串扰消除 Active CN103222187B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US37983110P 2010-09-03 2010-09-03
US61/379,831 2010-09-03
PCT/US2011/050181 WO2012036912A1 (en) 2010-09-03 2011-09-01 Spectrally uncolored optimal croostalk cancellation for audio through loudspeakers

Publications (2)

Publication Number Publication Date
CN103222187A CN103222187A (zh) 2013-07-24
CN103222187B true CN103222187B (zh) 2016-06-15

Family

ID=45831909

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201180042554.2A Active CN103222187B (zh) 2010-09-03 2011-09-01 对于通过扬声器的音频的频谱不着色的优化串扰消除

Country Status (5)

Country Link
US (1) US9167344B2 (zh)
JP (1) JP5993373B2 (zh)
KR (1) KR101768260B1 (zh)
CN (1) CN103222187B (zh)
WO (1) WO2012036912A1 (zh)

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012068174A2 (en) * 2010-11-15 2012-05-24 The Regents Of The University Of California Method for controlling a speaker array to provide spatialized, localized, and binaural virtual surround sound
DE102013102356A1 (de) * 2013-03-08 2014-09-11 Sda Software Design Ahnert Gmbh Verfahren zum Bestimmen einer Konfiguration für eine Lautsprecheranordnung zum Beschallen eines Raums und Computerprogrammprodukt
US9445197B2 (en) 2013-05-07 2016-09-13 Bose Corporation Signal processing for a headrest-based audio system
US9338536B2 (en) 2013-05-07 2016-05-10 Bose Corporation Modular headrest-based audio system
US9215545B2 (en) 2013-05-31 2015-12-15 Bose Corporation Sound stage controller for a near-field speaker-based audio system
CN105917674B (zh) 2013-10-30 2019-11-22 华为技术有限公司 用于处理音频信号的方法和移动装置
US9560464B2 (en) * 2014-11-25 2017-01-31 The Trustees Of Princeton University System and method for producing head-externalized 3D audio through headphones
CN104503758A (zh) * 2014-12-24 2015-04-08 天脉聚源(北京)科技有限公司 一种生成动感音乐光圈的方法及装置
US9602947B2 (en) * 2015-01-30 2017-03-21 Gaudi Audio Lab, Inc. Apparatus and a method for processing audio signal to perform binaural rendering
CN111131970B (zh) * 2015-02-16 2023-06-02 华为技术有限公司 过滤音频信号的音频信号处理装置和方法
KR101964107B1 (ko) * 2015-02-18 2019-04-01 후아웨이 테크놀러지 컴퍼니 리미티드 오디오 신호를 필터링하기 위한 오디오 신호 처리 장치 및 방법
US9913065B2 (en) 2015-07-06 2018-03-06 Bose Corporation Simulating acoustic output at a location corresponding to source position data
US9854376B2 (en) 2015-07-06 2017-12-26 Bose Corporation Simulating acoustic output at a location corresponding to source position data
US9847081B2 (en) 2015-08-18 2017-12-19 Bose Corporation Audio systems for providing isolated listening zones
EP3369257B1 (en) * 2015-10-27 2021-08-18 Ambidio, Inc. Apparatus and method for sound stage enhancement
EP3406084B1 (en) * 2016-01-18 2020-08-26 Boomcloud 360, Inc. Subband spatial and crosstalk cancellation for audio reproduction
US10225657B2 (en) 2016-01-18 2019-03-05 Boomcloud 360, Inc. Subband spatial and crosstalk cancellation for audio reproduction
WO2017153872A1 (en) 2016-03-07 2017-09-14 Cirrus Logic International Semiconductor Limited Method and apparatus for acoustic crosstalk cancellation
US10271133B2 (en) 2016-04-14 2019-04-23 II Concordio C. Anacleto Acoustic lens system
EP3446499B1 (en) 2016-04-20 2023-09-27 Genelec OY Method for regularizing the inversion of a headphone transfer function
US10111001B2 (en) 2016-10-05 2018-10-23 Cirrus Logic, Inc. Method and apparatus for acoustic crosstalk cancellation
US10771896B2 (en) 2017-04-14 2020-09-08 Hewlett-Packard Development Company, L.P. Crosstalk cancellation for speaker-based spatial rendering
JP6884278B2 (ja) 2017-10-11 2021-06-09 ラム,ワイ−シャン オーディオ再生においてクロストークキャンセルゾーンを作成するためのシステム及び方法
US10511909B2 (en) 2017-11-29 2019-12-17 Boomcloud 360, Inc. Crosstalk cancellation for opposite-facing transaural loudspeaker systems
US10764704B2 (en) 2018-03-22 2020-09-01 Boomcloud 360, Inc. Multi-channel subband spatial processing for loudspeakers
CN113450811B (zh) * 2018-06-05 2024-02-06 安克创新科技股份有限公司 对音乐进行通透处理的方法及设备
US11425521B2 (en) * 2018-10-18 2022-08-23 Dts, Inc. Compensating for binaural loudspeaker directivity
CN111199174A (zh) * 2018-11-19 2020-05-26 北京京东尚科信息技术有限公司 信息处理方法、装置、系统和计算机可读存储介质
CN113039813B (zh) * 2018-11-21 2022-09-02 谷歌有限责任公司 串扰消除滤波器组以及提供串扰消除滤波器组的方法
CN110807225B (zh) * 2019-09-27 2023-07-25 哈尔滨工程大学 基于无量纲化分析的传递矩阵计算稳定性优化方法
US10841728B1 (en) 2019-10-10 2020-11-17 Boomcloud 360, Inc. Multi-channel crosstalk processing
US11363402B2 (en) 2019-12-30 2022-06-14 Comhear Inc. Method for providing a spatialized soundfield
GB202008547D0 (en) 2020-06-05 2020-07-22 Audioscenic Ltd Loudspeaker control
FR3113760B1 (fr) * 2020-08-28 2022-10-21 Faurecia Clarion Electronics Europe Dispositif électronique et procédé de réduction de diaphonie, système audio pour appuis-têtes de sièges et programme d’ordinateur associés
KR20230057307A (ko) 2023-04-11 2023-04-28 박상훈 비대칭 스피커 시스템

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6668061B1 (en) * 1998-11-18 2003-12-23 Jonathan S. Abel Crosstalk canceler
CN101212834A (zh) * 2006-12-30 2008-07-02 上海乐金广电电子有限公司 音频系统的串扰消除装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0296499A (ja) * 1988-09-30 1990-04-09 Nec Home Electron Ltd 音響特性補正装置
GB9603236D0 (en) 1996-02-16 1996-04-17 Adaptive Audio Ltd Sound recording and reproduction systems
GB0015419D0 (en) 2000-06-24 2000-08-16 Adaptive Audio Ltd Sound reproduction systems
KR20050060789A (ko) * 2003-12-17 2005-06-22 삼성전자주식회사 가상 음향 재생 방법 및 그 장치
US7536017B2 (en) 2004-05-14 2009-05-19 Texas Instruments Incorporated Cross-talk cancellation
GB0712998D0 (en) 2007-07-05 2007-08-15 Adaptive Audio Ltd Sound reproducing systems
US20090086982A1 (en) 2007-09-28 2009-04-02 Qualcomm Incorporated Crosstalk cancellation for closely spaced speakers

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6668061B1 (en) * 1998-11-18 2003-12-23 Jonathan S. Abel Crosstalk canceler
CN101212834A (zh) * 2006-12-30 2008-07-02 上海乐金广电电子有限公司 音频系统的串扰消除装置

Also Published As

Publication number Publication date
WO2012036912A1 (en) 2012-03-22
JP5993373B2 (ja) 2016-09-14
KR20130102566A (ko) 2013-09-17
US20130163766A1 (en) 2013-06-27
KR101768260B1 (ko) 2017-08-14
JP2013539289A (ja) 2013-10-17
CN103222187A (zh) 2013-07-24
US9167344B2 (en) 2015-10-20

Similar Documents

Publication Publication Date Title
CN103222187B (zh) 对于通过扬声器的音频的频谱不着色的优化串扰消除
US9635484B2 (en) Methods and devices for reproducing surround audio signals
US9215544B2 (en) Optimization of binaural sound spatialization based on multichannel encoding
EP3229498B1 (en) Audio signal processing apparatus and method for binaural rendering
US9577595B2 (en) Sound processing apparatus, sound processing method, and program
US8605909B2 (en) Method and device for efficient binaural sound spatialization in the transformed domain
RU2643630C1 (ru) Способ и устройство для рендеринга акустического сигнала и машиночитаемый носитель записи
CN110557710B (zh) 具有语音控制的低复杂度多声道智能扩音器
CN107039029B (zh) 头盔中具有有源噪声控制的声音再现
US8873762B2 (en) System and method for efficient sound production using directional enhancement
US8031883B2 (en) Crosstalk cancellation system with sound quality preservation and parameter determining method thereof
TW201732785A (zh) 用於音訊重現之次頻帶空間及串音消除
US10595150B2 (en) Method and apparatus for acoustic crosstalk cancellation
Choueiri Optimal crosstalk cancellation for binaural audio with two loudspeakers
KR20190064634A (ko) 비대칭 트랜스오럴 오디오 재생을 위한 이득 위상 등화(gpeq) 필터 및 튜닝 방법
TWI690220B (zh) 用於空間音訊信號之串音處理之頻譜缺陷補償
Li et al. Modeling perceived externalization of a static, lateral sound image
Choueiri Binaural audio through loudspeakers
EP2612437B1 (en) Spectrally uncolored optimal crosstalk cancellation for audio through loudspeakers
US20240056760A1 (en) Binaural signal post-processing
WO2023010691A1 (zh) 一种耳机虚拟空间声回放方法、装置、存储介质及耳机
JP2023503140A (ja) バイノーラル信号のステレオオーディオ信号への変換
CN116614761A (zh) 一种基于扬声器阵列的近场声源重放方法
KR20060091966A (ko) 머리 모델링을 이용한 입체음향 합성방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1187454

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1187454

Country of ref document: HK