CN104769968B - 音频呈现系统 - Google Patents
音频呈现系统 Download PDFInfo
- Publication number
- CN104769968B CN104769968B CN201280076887.1A CN201280076887A CN104769968B CN 104769968 B CN104769968 B CN 104769968B CN 201280076887 A CN201280076887 A CN 201280076887A CN 104769968 B CN104769968 B CN 104769968B
- Authority
- CN
- China
- Prior art keywords
- sound field
- loudspeaker
- weighting
- sound
- reproduction regions
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/307—Frequency adjustment, e.g. tone control
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/11—Positioning of individual sound objects, e.g. moving airplane, within a sound field
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Stereophonic System (AREA)
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本发明涉及一种音频呈现系统(100),包括:多个扬声器(102),被布置用于在预定再现区域(130)内近似计算所需空间声场,其中所述扬声器(102)用于基于所述再现区域(130)的正交基函数的加权序列近似计算所述声场。
Description
背景技术
本发明涉及一种诸如音频会议系统等之类的音频呈现系统以及一种用于声场再现的方法,尤其涉及一种使用多扬声器布置的空间多区域声场再现。
多区域声场再现是一种目的在于在没有物理隔离区域或不使用耳机的情况下向每个收听者提供独立的声音环境。随着快速发展的娱乐和通信领域对个性化声音环境的需求的不断增长,开放空间的扩展区域上的空间多区域声场再现已经对多种解决方案的定义进行了研究,例如M.Poletti在2008年的AES第125次常规音频工程社会会刊中的“对2D多区域环绕声系统的调查(An investigation of 2D multizone surround sound system)”;N.Radmanesh和I.S.Burnett在2011年的IEEE ICASSP会刊第11期第598至610页中的“多区域环绕系统中独立窄带声场的再现及其到语音信号源的扩展(Reproduction ofindependent narrowband soundfields in a multizone surround system and itsextension to speech signal sources)”;以及Y.J.Wu和T.D.Abhayapala在2009年的IEEEICASSP会刊第93至96页中的“空间多区域声场再现(Spatial multizone soundfieldreproduction)”。
空间多区域声场再现在声信号处理领域是一个复杂而具有挑战性的问题。主要目的是通过在指定亮区内准确地再现所需声场以提供好的定位感给收听者,同时还控制亮区和暗区之间的声亮度对比。特定频率下具有高的声亮度的区域定义为亮区,而具有低的声亮度的区域定义为暗区。一个区域在特定频率下的声亮度定义为该频率下的空间平均的势能密度。声能密度与压力复杂幅度的平方成正比,即为声场幅度的平方。最理想的是将暗区的声能密度设为零,然而,实际上,相对于其他区域,暗区的声能密度通常较小。在那种情况下,目的是为了实现声亮度对比,其通过暗区和亮区之间的功率比来定义。
通过使用由16个扬声器组成的线性扬声器阵列,Ivan Tashev、Jasha Droppo和Mike Seltzer已经证实了声波在一个区域内彼此抵消而在另一区域内放大。向指定声场的一侧即使步行几步就无法听见音乐。J.Daniel、R.Nicol和S.Moreau在2003年的AES第114次常规音频工程社会会刊第51期第425页的“对用于立体声成像的高阶高保真度立体声响复制和波场合成的进一步研究(Further investigations of high order ambisonics andwavefield synthesis for holophonic sound imaging)”中进行了初期理论研究,其引入高阶高保真度立体声响复制(HOA)以基于模式匹配在多区域中再现声场。在2008年,Poletti提出另一种方法,使用最小二乘匹配以在多区域环绕系统中生成2-D单色声场。这是基于对圆形扬声器孔径函数的计算,该函数允许声源位于一圈扬声器内或上面。N.Radmanesh和I.S.Burnett开展了进一步研究扩展到两个多频率源,然后扩展到窄带语音信号。
然而,上述提及的研究都没有给从一个区域泄露到其他指定区域的声音提供准确控制。T.Betlehem和P.Teal在2011年的IEEE ICASSP会刊第437至440页的“多区域环绕声的受约束优化方法(A constrained optimization approach for multizone surroundsound)”中提出了一种方法以独立控制各个区域中的声音,同时还控制向其他收听者区域的泄露。使用了一种用于确定最小化控制区域中再现的均方差(MSE)的扬声器权重的受约束优化,这种优化类似于P.D.Teal、T.Betlehem和M.Poletti在2010年3月的IEEE ICASSP会刊第101至104页中的“声音的功率约束的全息再现的算法(An algorithm for powerconstrained holographic reproduction of sound)”。他们对扬声器权重的合计平方值进行约束以提高系统鲁棒性。J.W.Choi和Y.H.Kim在2002年的JASA第111期第1695至1700页的“使用多种源的具有发光区域的声亮区的生成(Generation of an acousticallybright zone with an illuminated region using multiple sources)”中提出了一种方法,以通过在特定频率下使用多种控制源产生声亮区(具有高的声势能的区域)。引入了一种声对比控制方法以最大化两个区域(亮区和暗区)之间的声亮度对比。用于单声的声音聚焦的个人音频系统被实施为一种示例应用程序,展示了亮区和暗区之间高达20dB的压差。J.-Y.Park、J.-H.Chang、Y.-H.Kim和Y.Park在2008年10月的控制、自动化和系统的国际会议上的“使用扬声器的个人立体声系统:可行性研究(Personal stereophonic systemusing loudspeakers:feasibility study)”中进一步将声对比控制方法应用于个人立体声系统,结果表明可以在每个耳朵周围选择的亮区中获得超过20dB的声道间距。这些方法都受限于两个不同区域之间声能对比的控制,而且该方法的结果不能控制声场。事实上,它们不能为亮区中的收听者提供定位感。
Y.J.Wu和T.D.Abhayapala在2009年的IEEE ICASSP会刊第93至96页的“空间多区域声场再现(Spatial multizone soundfield reproduction)”中提出了一种框架以通过柱状谐波扩展在单个圆形扬声器阵列内的不同地点创建多个2-D声场。他们通过将各个所需声场转换到单个全球坐标系统以及应用合适的角窗函数得出所需全局声场。Y.Wu和T.Abhayapala在2009年的IEEE WASPAA第309至312页的“经过空间带阻滤波器的多区域2D声场再现(Multizone 2D soundfield reproduction via spatial band stop filters)”中提出了一种改进的方法,在暗区上使用空间带阻滤波以抑制附近所需声场的泄露。然而,这两个方法都是基于通过使用额外空间模式(谐波)消除对其他区域的不良效应这一思想。该方法的缺点在于其只能在指定再现区域之外创建暗区,这使该方法对实际应用没有重要意义。再现区域定义了用于呈现所需声场的感兴趣的总控制区域。感兴趣的区域可以只包含亮区,暗区只能在该再现区域之外获取。该再现区域至少通过扬声器划定范围,并且通常限制于较小区域。
现有技术中描述的方法无法通过在指定亮区内准确地再现所需声场来提供好的定位感给收听者,同时还无法以有效方式控制亮区和暗区之间的声亮度对比。现有技术只能通过重构声场或在两个区域之间无需定位信息提供声亮度对比来部分实现该目标。T.Betlehem、P.D.Teal在2011年的IEEE ICASSP会刊第437至440页的“多区域环绕声音的受限优化方法(A constrained optimization approach for multi-zone surroundsound)”中描述了一种基于凸优化实现声亮度对比和声场重建的方法,但是这种方法的计算复杂度使其在实际应用中很难实施。
发明内容
本发明的目的是提供一种在指定再现区域内提高所需声场再现的技术。
该目的可以通过独立权利要求的特征来实现。进一步的实施形式在从属权利要求、具体说明和附图中显而易见。
本发明基于以下发现:将所需多区域声场建模为所需再现区域上的基函数的正交展开,其中所述正交性意味着所需再现区域上的集合中的任意两个基函数的内部乘积为0,产生在加权的最小二乘意义上最接近于所需声场的亥姆霍兹解,并且可以最佳地再现所需声场。可以通过,例如将具有亥姆霍兹方程的解集合的格莱姆-施密特过程作为输入(假设所述集合是完整的)形成基正交集。或者,可以使用“豪斯霍尔德变换”来构建正交集。
一般来说,输入解的集合不是正交的,所以使用它们很繁琐。格莱姆-施密特过程能够将正交集的基函数构建为平行波和圆形波等基波场的线性组合。然后计算基波场的系数,这样能够应用现有再现方法以使用封闭的圆形扬声器阵列在再现区域内再现所需多区域声场。通过应用优化的半圆再现方法,可以使用半圆扬声器阵列,其要求如现有方法中所介绍的扬声器的近似一半。
这种技术提供了一种在指定再现区域内改进的所需声场再现方法,如下文将展示的那样。
为了详细描述本发明,将使用以下术语、缩略语和符号:
音频呈现:一种能够利用扬声器或扬声器阵列在扩展区域中创建空间声场的再现技术。
声场:声源使气体、液体或固体等周围媒质振动。然后振动通过媒质传播为压力波(声波)。声场是一种复数,表示特定频率下空间中特定点的声压波的幅度和相位。在气体中,可以通过使用称为麦克风的压力传感器将声场测量为气压场。
声亮度:一个区域的总的声亮度由空间平均的势能密度表示。声势能密度与压力复杂幅度的平方成正比,即声场幅度的平方。一个区域在特定频率下的声亮度定义为该频率下的空间平均的势能密度。声能量密度与压力复杂幅度的平方成正比,即该频率下的声场幅度的平方。
亮区:所定义的区域在某一频率下具有高的声亮度,即高声势能区域。高的声亮度表示声能接近于所需声场的能量。
暗区:所定义的区域在某一频率下具有低的声亮度。最理想的是将该区域的势能密度设为零,然而,实际上,相对于其他区域,该区域的潜能密度通常较小。低的声亮度表示声能相比于亮区的较小。这点可以通过由暗区和亮区之间的功率比所定义的声亮度对比来测量。例如,当获得的声亮度对比为至少15dB时,认为声亮度较低。
所需再现区域:感兴趣的总控制区域。亮区和暗区都可包含在所需再现区域中。再现区域、亮区和暗区可以是圆形、正方形、管道形状、扇形或其他形状。
泄露区域:所需再现区域之外的区域。它接收任意不受控制的泄露声能。
根据第一方面,本发明涉及一种音频呈现系统,包括:多个扬声器,被布置用于在预定再现区域内近似计算所需空间声场,其中所述扬声器用于基于所述再现区域的正交基函数的加权序列近似计算所述声场。
所需空间声场可以是一个不随时间演变的固定声场,或可以是一个声属性可随时间改变的动态声场。
这种扬声器配置提供了一种计算量少的简单方法以在所需再现区域内构建所需声场。
所述音频呈现系统有助于减少再现所需声场使用的激活扬声器的数目。扬声器布置不限于圆形阵列的扬声器。
如果是固定声场,再现这种声场所需的扬声器的数目减少了。如果是动态声场,相比于现有技术,同时激活的扬声器的数目也会减少。
在根据所述第一方面的所述音频呈现系统的第一可能实施方式中,调整所述加权序列的权重以近似计算所需声场。
在根据如上所述的第一方面或根据所述第一方面的所述第一实施方式的所述音频呈现系统的第二可能实施方式中,所述扬声器用于在预定频率下再现所需声场。
所述音频呈现系统能够在较广泛的高达10KHz的工作频率范围内运作。
在根据如上所述的第一方面或根据所述第一方面的任意前述实施方式的所述音频呈现系统的第三可能实施方式中,所述声场包括至少一个亮区和至少一个暗区。
所述音频呈现系统提供一种良好的定位感,其可以通过在指定亮区中准确地再现所需声场来创建,同时还可提供对声亮度的精确控制。亮区和暗区都可灵活地位于所需再现区域中。
如果所需空间声场是一个动态声场,那么暗区和亮区甚至可以移动到再现区域的内部。
最理想的是将暗区的声能密度设为零。然而,实际上,这通常是不可能的,只能近似。因此,本发明实施方式的另一目的是,绝对或相对于亮区,最小化暗区的声能。在后一种情况下,目的是,例如,获得声亮度对比,其由暗区和亮区之间的功率比定义,至少为15dB,在最佳情况下大于20dB。
在根据第一方面的所述第三实施方式的所述音频呈现系统的第四可能实施方式中,采用了正交基函数的加权序列,使得由至少一个暗区和至少一个亮区之间的功率比定义的声亮度对比至少为15dB或20dB。
在根据如上所述的第一方面或根据所述第一方面的任意前述实施方式的所述音频呈现系统的第五可能实施方式中,通过确定关于所需声场的正交基函数的加权序列的加权最小二乘解来调整加权序列的权重。
在根据所述第一方面的所述第五实施方式的所述音频呈现系统的第六可能实施方式中,所述加权最小二乘解是根据:
其中S(x,k)表示所需声场,Gn(x,k)表示正交基函数,Cn表示加权序列的权重,w(x)表示加权函数,D表示所需再现区域。
在根据所述第五实施方式或根据所述第一方面的所述第六实施方式的所述音频呈现系统的第七可能实施方式中,所述声场包括至少一个亮区、至少一个暗区和所需再现区域中的剩余无人区,其中加权最小二乘解的加权函数取决于所述至少一个亮区、所述至少一个暗区以及所需再现区域中的剩余无人区。
在根据所述第一方面的所述第七实施方式的所述音频呈现系统的第八可能实施方式中,所述加权最小二乘解的加权函数至少包括对应于所述至少一个亮区的第一权重、对应于所述至少一个暗区的第二权重和对应于所述无人区的第三权重。
在根据如上所述第一方面或根据所述第一方面的任意前述实施方式的所述音频呈现系统的第九可能实施方式中,所述正交基函数源自至少一个平面波集合或圆形波集合。
在根据如上所述的第一方面或根据所述第一方面的任意前述实施方式的所述音频呈现系统的第十可能实施方式中,所述正交基函数通过将具有亥姆霍兹方程的解集合的格莱姆-施密特过程作为输入或通过使用豪斯霍尔德变换形成。
在根据所述第一方面的所述第十实施方式的所述音频呈现系统的第十一可能实施方式中,所述格莱姆-施密特过程应用于平面波集合和圆形波集合之一。
在根据所述第一方面的所述第十一实施方式的所述音频呈现系统的第十二可能实施方式中,基于平面波集合或圆形波集合中的每个波的扬声器的已知权重计算用于基于正交基函数的加权序列近似计算所需声场的扬声器配置。
在根据如上所述的第一方面或根据所述第一方面的任意前述实施方式的所述音频呈现系统的第十三可能实施方式中,所述多个扬声器布置在圆形、半圆形、四分之一圆形、正方形或直线上。
根据第二方面,本发明涉及一种用于声场再现的方法,所述方法包括:布置多个扬声器用于在预定再现区域内近似计算所需空间声场,其中所述扬声器用于基于所述再现区域的正交基函数的加权序列近似计算所述声场;以及调整所述加权序列的权重用于近似计算所需声场。
根据第三方面,本发明涉及一种按确定频率在所需再现区域内再现声场的方法,所述方法包括:将所述声场建模为所需再现区域的基函数的正交扩展;通过使用格莱姆-施密特过程形成基函数的所述正交扩展;计算所述基函数的系数;以及基于所述计算的系数确定所述声场的扬声器权重。
在根据所述第三方面的所述方法的第一可能实施方式中,所述确定所述扬声器权重基于所需再现区域内的所述声场的加权。
根据第四方面,本发明涉及一种在某一频率下将所需再现区域内的任意声场描述为基函数的正交扩展的方法,所述基函数的正交扩展用于获得所需声场。在第四方面的第一实施方式中,所需声场包括至少一个亮区和一个暗区。在所述第四方面的第二实施方式中,所述基正交集根据平面波集合和/或圆形波集合确定。在所述第四方面的第三实施形式中,所述基正交集在训练阶段中确定。在所述第四方面的第四实施方式中,所述基正交集离线确定。
根据第五方面,本发明涉及一种在某一频率下描述所需再现区域内的任意再现声场的方法,所述方法包括:将所需声场描述为所需再现区域的基函数的正交扩展;通过使用具有亥姆霍兹方程的解集合的格莱姆-施密特过程,尤其通过使平面波或圆形波作为格莱姆-施密特过程的输入来形成所述基正交集;计算所述基函数的系数;以及基于所述计算的系数通过使用常规再现方法设计所需声场的扬声器权重。基正交集可以通过训练确定或离线确定。
本发明的各个方面提供了一种将所需声场准确地描述为所需再现区域的基函数的正交扩展的新方法。如果所需声场不满足物理约束,那么,在最小二乘意义上,该方法会求出最接近于以及可以最佳再现所需声场的亥姆霍兹解。在实施方式中,基正交集通过将具有亥姆霍兹方程的解集合的格莱姆-施密特过程作为输入(假设该集合是完整的)形成。由于输入解的集合一般不是正交的,所以使用它们很繁琐。然而,格莱姆-施密特过程能够,例如通过使用平面波和/或圆形波,将正交集的基函数构建为基波场的线性组合。然后可以计算基波场的系数以使用散列扬声器整列在再现区域内再现所需声场。
本文所述的方法、系统和设备可以实施为数字信号处理器(DSP)、微处理器或任意其他边处理器中的软件或专用集成电路(ASIC)内的硬件电路。
本发明可以在数字电子电路,或计算机硬件、固件、软件,或其组合中实施,例如,在传统移动设备的可用硬件或专用于处理音频增强系统的新硬件。
附图说明
本发明的具体实施方式将结合以下附图进行描述,其中:
图1示出了根据实施方式的音频呈现系统的示意图100;
图2示出了根据第一多区域再现场景的分别表示声场再现的实部和虚部的两个示意图200a、200b;
图3示出了根据第二多区域再现场景的分别表示声场再现的实部和虚部的两个示意图300a、300b;
图4示出了使用半圆形布置的扬声器的分别表示第一多区域再现场景和第二多区域再现场景的实部的两个示意图400a、400b;
图5示出了根据实施方式的声场再现方法500的示意图;以及
图6示出了根据实施方式的在某一频率下在所需再现区域内再现声场的方法600的示意图。
具体实施方式
图1示出了根据实施方式的音频呈现系统100的示意图。
在图1中,所需再现区域D130是一个半径为r的感兴趣的总控制圆形区域,其包括声圆形亮区120和圆形暗区110。特定频率下具有高的声亮度的区域定义为亮区120,而具有低的声亮度的区域为暗区110。相对于所需再现区域130的中心,亮区120和暗区110分别由它们的角度Φ1和Φ2定义。最理想的是将暗区110的声能密度设为零,然而,实际上,其相对于其他区域通常较小。所需再现区域130的剩余区域定义为无人区域140。所需再现区域130之外的区域定义为泄露区域150。泄露区域150接收任意不受控制的泄露声能。使用的扬声器102的数目是Q,第q个扬声器权重表示为lq(k),其中k=2πf/c是波数,f是频率,c是声音传播的速度。
一个区域在特定频率下的声亮度定义为该频率下的空间平均的势能密度。声能密度与压力复杂幅度的平方成正比,即为声场幅度的平方。因此,系统性能可以通过测量所选亮区和暗区之间的声亮度对比使用该定义来评估:
其中B(k)表示声亮度对比,x表示任意空间观察点,k是称为波数的归一化频率。Sb和Sq分别标记亮区和暗区的大小。
测量或量化再现声场相比于所需声场的准确性,或换言之,再现声场和待近似计算的所需声场之间的近似率的一种可能性是确定再现的均方差(MSE)εM(k)作为所选亮区Db上的整个所需声场Sd(x,k)和整个对应再现声场Sa(x,k)(两者都是归一化的)之间的平均平方差。
均方差(MSE)εM(k)越小,正确性或近似值越好。
在该实施方式中,所需再现区域130、亮区120和暗区都是圆形的,而且只有一个亮区120和一个暗区110存在于所需再现区域内部。在另一实施方式中,存在一个以上亮区和/或一个以上暗区。在另一实施方式中,所需再现区域还有另一种几何形式,例如正方形、椭圆形、三角形或多边形。在另一实施方式中,亮区120和/或暗区110还有另一种几何形式,例如正方形、椭圆形、三角形、长方形或多边形。暗区110和亮区120可以布置在所需再现区域130内的任意位置处。在实施方式中,至少一个亮区120和至少一个暗区110不重叠。
在该实施方式中,扬声器102布置在围绕所需再现区域130的半圆上。至少需要两个扬声器102以在再现区域130中产生所需声场。使用的扬声器102越多,可以在再现区域130内更好地实现声音再现。在另一实施方式中,扬声器102布置在所需再现区域130周围的全圆上。在另一实施方式中,扬声器102布置在所需再现区域130周围的四分之一圆上、正方形上或任意其他几何形状上或所需再现区域130前面的直线上。
图1描绘了音频呈现系统100,包括多个扬声器102,用于近似计算所需再现区域130内的所需空间声场S(x,k)。扬声器102被布置用于基于再现区域130的正交基函数Gn(x,k)的加权序列近似计算声场S(x,k)。
一种配置扬声器102用于近似计算所需声场S(x,k)的方法将所需声场描述为再现区域的基函数的正交扩展。该方法不仅解决了扬声器的定位问题,而且还处理了为了近似计算所需声场而应用于扬声器的信号和增益。满足波方程的任意2-D(高度不变)声场函数S(x,k)被认为是亥姆霍兹方程的正交解集合的叠加,例如E.G.Williams在1999年纽约学术报的“傅里叶声学:声音辐射和近场声全息学(Fourier Acoustics:Sound Radiation andNearfield Acoustical Holography)”中给出。正交性意味着所需再现区域上的集合中的任意两个基函数的内部乘积为0。因此,声场可以写作对D的基函数{Gn}的加权序列
重要的是,假设该集合是完整的,{Gn}形成一个正交集,其可以用来描述所需区域130内满足波方程的任意2-D声场。另外,引入了作为x的函数的常规加权函数w(x):
通过该加权函数,多区域系统通常会通过求解加权最小二乘解来近似计算所需声场:
应注意,该方法会求出亥姆霍兹解Cn,亥姆霍兹解在最小二乘意义上根据任意特定的加权函数w(x)最接近于所需波场,然后可以最佳地再现所需波场。具体来说,w(x)能够通过不同的设置控制各种类型区域的再现准确性。为了说明这一点,如果所选亮区120或暗区110中w(x)的值很大,那么该区域上的再现误差会招致严重“处罚”,而且系统100将在最小二乘意义上更准确地呈现该区域的波场。当然,在无人区150会观察到数量有限的声泄露能量。然而,在优选实施方式中,相对较小的权重值分配给无人区150,因为泄露应被限制,但并非很多,否则会影响亮区120和暗区110中的结果。
可以得到如下的亥姆霍兹解Cn:
其中D标记所需再现区域130。在优选实施方式中,选择w(x),使得{Gn}的集合通过加权函数w(x)在D上进行正交,这意味着只有当i=j,通过这种设置,分母是1,即一。
平面波函数fn(x,k)的集合表示来自的平面波,可以很容易通过使用现有再现方法在再现区域130内再现。表示向下取整运算。
平面波函数fn(x,k)的集合可以如下描述:
其中φn≡(1,φn)是平面波的方向。根据G.H.Golub和C.Van Loan在1996年10月的约翰霍普金斯大学第三版的“矩阵计算(Matrix Computation)”,可以利用格莱姆-施密特过程从平面波集合中形成D上的正交集为:
通过这种设置,所需声场Sd(x,k)可以写作再现区域D的基函数的正交扩展
其中
具有
为了在所需区域130内重建所需多区域声场,包含亮区120和暗区110的整个所需区域130与该方法匹配,然后通过合计用于基函数的孔径来计算孔径。正交集的基函数也是来自各个角度的平面波的线性组合。为了得到平面波函数的系数,构建如下的线性方程式组:
其中f=[f0(x,k),...,fN(x,k)]T,A是下三角矩阵。Aij表示第i个基函数内第j个平面波fj-1(x,k)的系数。A基于引入的格莱姆-施密特过程计算,其中如果i=j成立,那么关系式Aij=1。所以结果是:
然后,结果是:
其中所需声场可以写为:
Sd(x,k)=CdAf.
因此,p=Cd A指定平面波函数的系数以再现所需声场,其中p=[p(0),...,p(N)]。通过系数p,现有2-D再现方法由于其线性度可以很容易被应用于重建所需多区域声场。
再现声场可以通过使用具有权重的散列圆形扬声器阵列表示为:
其中Q表示所需扬声器的最小数量,标记扬声器的位置。特别地,wq(k)根据基波场的计算系数将加权得来的函数指定给第q个扬声器。
H0 (1)(k||..||)是第一类零阶汉克尔函数。
在替代性实施方式中,“豪斯霍尔德变换”用来构建正交集
然而,与优选实施方式一样,一种迭代方法被应用于计算基平面波的系数,这使得格莱姆-施密特过程更加实用。
半圆再现方法,即在半圆上布置扬声器的方法,的基本原理是将活动的扬声器的数目减到现有再现方法中提到的对应物的近似一半,例如Y.J.Wu和T.D.Abhayapala在2009年1月的IEEE声学、语音、信号处理会报第17(1)期第107至116页的“使用连续扬声器概念的声场再现的理论和设计(Theory and design of soundfield reproduction usingcontinuous loudspeaker concept)”中所需扬声器的数目,再现区域的半径r是Q=2M+1,其中是截断模式的长度。
在下文中,定义了布置在半圆上的扬声器的数学优化问题。该问题的本质是得出孔径函数的傅里叶系数集合,这样可以用来近似计算所需声场,而且还符合半圆设计的约束。下文展示了一种解决公式化问题的方法。
全圆上的扬声器孔径函数ρ(φ,k)可以写作傅里叶序列扩展,因为它是角度φ的周期函数:
其中{βm(k)}为傅里叶系数。
解决优化问题的最常用方式是求出{βm(k)}的集合,该集合最小化误差函数并使其尽可能地接近于其是傅里叶系数的所需值以计算全圆连续扬声器的孔径函数。因此,
中的结果受约束于ηc,当φ<φ0(半圆方法中设定φ0=π)时,其理想地将孔径函数ρ(φ,k)的值设为零:
因子表示角窗函数,定义为:
为了找到优化问题的解决方案,与优选实施例一样,可以使用拉格朗日乘子方法。也就是最小化以下公式的表达
η0=f({βm(k)})+ληc
其中η0是被最小化的总误差,ηc表示约束。
从另一角度来看,可以看出其定义了约束和由f确定的函数f之间的加权。
应注意,不可能找到满足约束ηc的合理解决方案。如果应用了设置λ=0,那么忽略该约束,且解决方案与全圆连续扬声器的孔径函数的情况一样。为了强调约束误差,选择足够大的λ以确保约束ηc较小。
最小化总误差η0的难度在于标准不是解析函数,即不满足柯西-黎曼条件。虽然问题在分析上有可能通过David G.Messerschmitt在2006年6月的技术报告UCB/EECS-2006-93,EECS部门,加利福尼亚大学,柏克莱中的“复变量的实值函数的平稳点(Stationarypoints of a real-valued function of a complex variable)”描述的方法论得到解决,但是此处使用粗略近似法作为第一解决方法。
找出傅里叶系数的集合,其最小化总误差η0。将η0设为较大值以强调约束误差。基本思想是从的任意初始集合开始,添加具有固定范数的随机向量以及基于约数η0是否下降接受或拒绝这种改变。创建一个随机移动,一般会在最近的局部最小值结束。在实施方式中,通过调整步长优化算法,凸优化提供了一种方法以得出好的计划。但是本文使用了具有固定步长的简单算法。因此,在随机向量的近似一个步长内发现了最小化η0的集合。该解决方案随后用于计算在再现区域130内近似再现所需声场所要求的所需非零孔径区域中的扬声器权重。然后的解用于描述扬声器权重lq(k):
其中Δφs=2π/Q是扬声器的角间距以及φq=qΔφs。定义为使用半圆方法以及具有由lq(k)提供的权重的再现声场。这时
其中φq=(1,φq)且R是扬声器102所在半圆的半径。
图2示出了根据第一多区域再现场景的分别表示声场再现的实部和虚部的两个示意图200a、200b。使用基扩展描述所需多区域声场。在亮区220a、220b中以φd=45°创建平面波,该亮区位于φ1=180°,而暗区210a、210b位于φ2=0。角度φ1=180°和φ2=0都与以上根据图1所述的再现区域230a、230b的中心有关。加权函数w(x)指定为:a=1,b=2.5以及c=0.05。左右绘图分别表示实部和虚部。
在两个区域,一个亮区220a、220b和一个暗区210a、210b,中进行多区域再现,在频率f=2000Hz下,半径r=1m的所需再现区域230a、230b内的每个区域的半径为0.3m。Db220a、220b和Dq210a、210b的中心之间的距离是0.6m。如图2所示,目标亮区220a、220b和暗区210a、210b分别位于φ1和φ2。平面波在所选亮区220a、220b中以与x轴的角度φd再现,同时减弱暗区210a、210b中的声音。在图2中,平面波在亮区220a、220b中以φd=45°创建,该亮区位于φ1=180°,而暗区210a、210b位于φ2=0。此处加权函数w(x)设为:a=1,b=2.5和c=0.05。设置Δφ=π/40,其表示自由度,即,集合中正交波的数目为80。根据图2,可以看出合成的多区域声场很好地对应到所需声场。
图3示出了根据第二多区域再现场景的分别表示声场再现的实部300a和虚部300b的两个示意图。使用基扩展描述所需多区域声场。在亮区320a、220b中以φd=60°创建平面波,该亮区位于φ1=225°,而暗区310a、210b位于φ2=45°。角度φ1=225°和φ2=45°都与以上根据图1所述的再现区域330a、330b的中心有关。加权函数w(x)指定为:a=1,b=2.5以及c=0.05。左右绘图分别表示实部和虚部。图3示出了多区域再现场景,其比参照图2描述的场景更具挑战性。由于平面波几乎与通过两个区域中心绘制的直线共线,所以如果不用于多区域补偿,在亮区320a、320b中创建的声场直接传播到暗区310a、310b。整体系统性能可以通过基于实际设置和需求改变加权函数中参数的值来调整。
图4示出了使用半圆布置的扬声器402的分别表示第一多区域再现场景400a和第二多区域再现场景400b的实部的两个示意图。所需多区域再现使用半圆方法和在频率2000Hz下设置的同一加权函数w(x)。在该实施方式中,使用了39个扬声器402。左右绘图分别表示具有φd=45°的第一场景和具有φd=60°的第二场景。总的来说,使用了39个扬声器402,但只使用了下半圈的扬声器402,而使用现有再现方法需要至少77个扬声器组成的圆形阵列。仅仅采用了一半的正交集,包括基平面波场,到达角度从0到π。这样做的基本原理在于声波无法呈现,向扬声器的半圆前进以及引入包含在基平面波场的到达角度从0到2π的另一半正交集会导致大的总再现误差。扬声器位于半径为R=1.5m的半圆上。图4中再现的多区域声场很好地对应于再现区域430a、430b内的所需场。
图5示出了根据实施方式的声场再现方法500的示意图。
方法500包括:布置501多个扬声器用于在预定再现区域D内近似计算所需空间声场S(x,k),其中扬声器用于基于再现区域D的正交基函数Gn(x,k)的加权序列近似计算声场S(x,k)。方法500还包括:调整503加权序列的权重以近似计算所需声场S(x,k)。
在实施方式中,调整加权序列的权重Cn以近似计算所需声场S(x,k)。在实施方式中,扬声器用于在预定频率下再现所需声场S(x,k)。在实施方式中,声场S(x,k)包括至少一个亮区B和至少一个暗区Q。在实施方式中,通过确定所需声场S(x,k)的正交基函数Gn(x,k)的加权序列的加权w(x)最小二乘解来调整加权序列的权重Cn。在实施方式中,加权w(x)最小二乘解是根据:
其中S(x,k)表示所需声场,Gn(x,k)表示正交基函数,Cn表示加权序列的权重,w(x)表示加权函数,D表示所需再现区域。在实施方式中,加权最小二乘解的加权函数w(x)取决于至少一个亮区B、至少一个暗区Q和无人区U。在实施方式中,加权最小二乘解的加权函数w(x)至少包括至对应于少一个亮区的第一权重“a”、对应于至少一个暗区Q的第二权重“b”以及对应于无人区U的第三权重“c”。在实施方式中,正交基函数Gn(x,k)从平面波集合或圆形波集合中的至少一个中得出。在实施方式中,通过将具有亥姆霍兹方程的解Cn集合的格莱姆-施密特过程作为输入或通过使用豪斯霍尔德变换形成正交基函数Gn(x,k)。在实施方式中,将格莱姆-施密特过程应用到平面波和圆形波之一的集合上。在实施方式中,基于平面波集合或圆形波集合中的每个波的已知扬声器权重计算用于基于正交基函数的加权序列近似计算所需声场的扬声器配置。在实施方式中,多个扬声器布置在圆形、半圆形、四分之一圆形、正方形或直线上。
图6示出了根据实施方式的在某一频率下在所需再现区域内再现声场的方法600的示意图。方法600包括将声场建模601为所需再现区域的基函数的正交扩展。方法600包括通过使用格莱姆-施密特过程形成603基函数的正交扩展。方法600包括计算605基函数的系数。方法600包括基于计算的系数确定607声场的扬声器权重。
通过阅读以上内容,所属领域的技术人员将清楚地了解,可提供多种方法、系统、记录媒体上的计算机程序及其类似者等等。
本发明还支持包含计算机可执行代码或计算机可执行指令的计算机程序产品,这些计算机可执行代码或计算机可执行指令在执行时使得至少一台计算机执行本文所述的执行及计算步骤。
通过以上启示,对于本领域技术人员来说,许多替代产品、修改及变体是显而易见的。当然,所属领域的技术人员容易意识到除本文所述的应用之外,还存在本发明的众多其它应用。虽然已参考一个或多个特定实施例描述了本发明,但所属领域的技术人员将认识到在不偏离本发明的范围的前提下,仍可对本发明作出许多改变。因此,应理解,只要是在所附权利要求书及其等效文句的范围内,可以用不同于本文具体描述的方式来实践本发明。
Claims (10)
1.一种音频呈现系统(100),其特征在于,包括:
多个扬声器(102),被布置用于近似计算预定所需再现区域(130)内的所需声场,
其中所述扬声器(102)用于通过相对于所述所需声场确定所述所需再现区域(130)的正交基函数的加权序列的加权最小二乘解调整所述加权序列的权重,近似计算所述所需声场;所述加权最小二乘解的加权函数取决于至少一个亮区(120)、至少一个暗区(110)以及所述所需再现区域(130)中的剩余无人区(140);其中,所述所需声场包括至少一个亮区(120)和至少一个暗区(110);且所述扬声器(102)用于按预定频率再现所述所需声场。
2.根据权利要求1所述的音频呈现系统(100),其特征在于,所述加权最小二乘解是根据:
其中S(x,k)表示所需声场,Gn(x,k)表示正交基函数,Cn表示加权序列的权重,w(x)表示加权函数,D表示所需再现区域(130)。
3.根据权利要求1所述的音频呈现系统(100),其特征在于,所述加权最小二乘解的所述加权函数至少包括对应于所述至少一个亮区(120)的第一权重、对应于所述至少一个暗区(110)的第二权重以及对应于所述无人区(140)的第三权重。
4.根据前述权利要求之一所述的音频呈现系统(100),其特征在于,所述正交基函数从至少一个平面波集合或圆形波集合中得出。
5.根据前述权利要求1-3任一项所述的音频呈现系统(100),其特征在于,通过将具有亥姆霍兹方程的解集合的格莱姆-施密特过程作为输入或通过使用豪斯霍尔德变换形成所述正交基函数。
6.根据权利要求5所述的音频呈现系统(100),其特征在于,所述格莱姆-施密特过程应用于平面波集合和圆形波集合中的一个。
7.根据权利要求6所述的音频呈现系统(100),其特征在于,基于所述平面波集合或所述圆形波集合中的每个波的所述扬声器(102)的已知权重计算用于基于正交基函数的所述加权序列近似计算所述所需声场的所述扬声器(102)的配置。
8.根据前述权利要求1-3任一项所述的音频呈现系统(100),其特征在于,所述多个扬声器(102)布置在圆形、半圆形、四分之一圆形、正方形或直线上。
9.根据前述权利要求7所述的音频呈现系统(100),其特征在于,所述多个扬声器(102)布置在圆形、半圆形、四分之一圆形、正方形或直线上。
10.一种用于声场再现的方法(500),其特征在于,所述方法包括:
布置(501)多个扬声器用于在预定所需再现区域内近似计算所需声场,其中所述扬声器用于基于所述所需再现区域的正交基函数的加权序列近似计算所述所需声场,以使所述扬声器(102)用于按预定频率再现所述所需声场;以及
通过相对于所述所需声场确定正交基函数的所述加权序列的加权最小二乘解调整(503)所述加权序列的权重,近似计算所述所需声场;其中,所述加权最小二乘解的加权函数取决于至少一个亮区(120)、至少一个暗区(110)以及所述所需再现区域(130)中的剩余无人区(140),所述所需声场包括至少一个亮区(120)和至少一个暗区(110)。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/EP2012/074146 WO2014082683A1 (en) | 2012-11-30 | 2012-11-30 | Audio rendering system |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104769968A CN104769968A (zh) | 2015-07-08 |
CN104769968B true CN104769968B (zh) | 2017-12-01 |
Family
ID=47290964
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201280076887.1A Active CN104769968B (zh) | 2012-11-30 | 2012-11-30 | 音频呈现系统 |
Country Status (4)
Country | Link |
---|---|
US (1) | US9774981B2 (zh) |
EP (1) | EP2912860B1 (zh) |
CN (1) | CN104769968B (zh) |
WO (1) | WO2014082683A1 (zh) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2905330A1 (en) * | 2013-03-15 | 2014-09-25 | Thx Ltd | Method and system for modifying a sound field at specified positions within a given listening space |
US9961467B2 (en) * | 2015-10-08 | 2018-05-01 | Qualcomm Incorporated | Conversion from channel-based audio to HOA |
US10249312B2 (en) | 2015-10-08 | 2019-04-02 | Qualcomm Incorporated | Quantization of spatial vectors |
WO2017063688A1 (en) | 2015-10-14 | 2017-04-20 | Huawei Technologies Co., Ltd. | Method and device for generating an elevated sound impression |
WO2017129236A1 (en) * | 2016-01-27 | 2017-08-03 | Huawei Technologies Co., Ltd. | An apparatus, a method, and a computer program for processing soundfield data |
CN106303843B (zh) * | 2016-07-29 | 2018-04-03 | 北京工业大学 | 一种多区域不同语音声源的2.5d重放方法 |
WO2018106163A1 (en) * | 2016-12-07 | 2018-06-14 | Dirac Research Ab | Audio precompensation filter optimized with respect to bright and dark zones |
CN110892735B (zh) * | 2017-07-31 | 2021-03-23 | 华为技术有限公司 | 一种音频处理方法以及音频处理设备 |
CN108966114A (zh) * | 2018-07-13 | 2018-12-07 | 武汉轻工大学 | 声场重建方法、音频设备、存储介质及装置 |
US11800311B2 (en) * | 2019-07-16 | 2023-10-24 | Ask Industries Gmbh | Method of reproducing an audio signal in a car cabin via a car audio system |
US11270712B2 (en) | 2019-08-28 | 2022-03-08 | Insoundz Ltd. | System and method for separation of audio sources that interfere with each other using a microphone array |
US11510004B1 (en) * | 2021-09-02 | 2022-11-22 | Ford Global Technologies, Llc | Targeted directional acoustic response |
US11908444B2 (en) * | 2021-10-25 | 2024-02-20 | Gn Hearing A/S | Wave-domain approach for cancelling noise entering an aperture |
CN116684784B (zh) * | 2023-06-29 | 2024-03-12 | 中国科学院声学研究所 | 一种基于参量阵扬声器阵列的声重放方法及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1901760A (zh) * | 2005-07-20 | 2007-01-24 | 索尼株式会社 | 声场测量装置和声场测量方法 |
CN1922924A (zh) * | 2004-02-18 | 2007-02-28 | 雅马哈株式会社 | 声音再现设备及扬声器位置识别方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030147539A1 (en) * | 2002-01-11 | 2003-08-07 | Mh Acoustics, Llc, A Delaware Corporation | Audio system based on at least second-order eigenbeams |
US8391500B2 (en) * | 2008-10-17 | 2013-03-05 | University Of Kentucky Research Foundation | Method and system for creating three-dimensional spatial audio |
-
2012
- 2012-11-30 CN CN201280076887.1A patent/CN104769968B/zh active Active
- 2012-11-30 EP EP12795419.6A patent/EP2912860B1/en active Active
- 2012-11-30 WO PCT/EP2012/074146 patent/WO2014082683A1/en active Application Filing
-
2015
- 2015-05-29 US US14/725,063 patent/US9774981B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1922924A (zh) * | 2004-02-18 | 2007-02-28 | 雅马哈株式会社 | 声音再现设备及扬声器位置识别方法 |
CN1901760A (zh) * | 2005-07-20 | 2007-01-24 | 索尼株式会社 | 声场测量装置和声场测量方法 |
Non-Patent Citations (2)
Title |
---|
MULTIZONE 2D SOUNDFIELD REPRODUCTION VIA SPATIAL BAND STOP FILTERS;Yan Jennifer Wu,et al;《2009 IEEE Workshop on Applications of Signal Processing to Audio and Acoustics》;20091021;第309-312页 * |
Reproduction of a Plane-Wave Sound Field Using an Array of Loudspeakers;Darren B. Ward,et al;《IEEE TRANSACTIONS ON SPEECH AND AUDIO PROCESSING》;20010930;第9卷(第6期);第697-707页 * |
Also Published As
Publication number | Publication date |
---|---|
US20150264510A1 (en) | 2015-09-17 |
EP2912860B1 (en) | 2018-01-10 |
US9774981B2 (en) | 2017-09-26 |
WO2014082683A1 (en) | 2014-06-05 |
CN104769968A (zh) | 2015-07-08 |
EP2912860A1 (en) | 2015-09-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104769968B (zh) | 音频呈现系统 | |
CN104170408B (zh) | 应用组合的或混合的声场控制策略的方法 | |
CN106658343B (zh) | 用于渲染音频声场表示以供音频回放的方法和设备 | |
JP2017085620A (ja) | オーディオ再生のためのオーディオ音場表現のデコードのための方法および装置 | |
JP5826996B2 (ja) | 音響信号変換装置およびそのプログラム、ならびに、3次元音響パンニング装置およびそのプログラム | |
CN106165444B (zh) | 声场再现设备、方法和程序 | |
CN107222824A (zh) | 从高阶立体混响声音频信号解码立体声扬声器信号的方法和装置 | |
Sakamoto et al. | Sound-space recording and binaural presentation system based on a 252-channel microphone array | |
CN106303843B (zh) | 一种多区域不同语音声源的2.5d重放方法 | |
Ziemer | Wave field synthesis | |
Pörschmann et al. | A method for spatial upsampling of voice directivity by directional equalization | |
Ziemer et al. | Psychoacoustic sound field synthesis for musical instrument radiation characteristics | |
Zhang et al. | Estimation of spherical harmonic coefficients in sound field recording using feed-forward neural networks | |
Yang et al. | A review of sound field control | |
CN113766396A (zh) | 扬声器控制 | |
WO2019208285A1 (ja) | 音像再現装置、音像再現方法及び音像再現プログラム | |
Hong et al. | End-to-end sound field reproduction based on deep learning | |
Zhang et al. | Optimization of sound fields reproduction based Higher-Order Ambisonics (HOA) using the Generative Adversarial Network (GAN) | |
CN109923877A (zh) | 对立体声音频信号进行加权的装置和方法 | |
Rabenstein et al. | Sound field synthesis | |
WO2018211984A1 (ja) | スピーカアレイ、および信号処理装置 | |
JP6388551B2 (ja) | 複数領域音場再現システムおよび方法 | |
Jin | A tutorial on immersive three-dimensional sound technologies | |
Mickiewicz et al. | Spatialization of sound recordings using intensity impulse responses | |
JP2014045281A (ja) | スピーカアレイ駆動装置およびスピーカアレイ駆動方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
EXSB | Decision made by sipo to initiate substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |