CN104956695A - 确定用于球面谐波系数的渲染器 - Google Patents
确定用于球面谐波系数的渲染器 Download PDFInfo
- Publication number
- CN104956695A CN104956695A CN201480006477.9A CN201480006477A CN104956695A CN 104956695 A CN104956695 A CN 104956695A CN 201480006477 A CN201480006477 A CN 201480006477A CN 104956695 A CN104956695 A CN 104956695A
- Authority
- CN
- China
- Prior art keywords
- loud speaker
- renderer
- geometry
- speaker geometry
- dimension
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S5/00—Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/301—Automatic calibration of stereophonic sound system, e.g. with test microphone
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/11—Positioning of individual sound objects, e.g. moving airplane, within a sound field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/11—Application of ambisonics in stereophonic audio systems
Abstract
一般来说,本发明描述用于确定用于渲染球面谐波系数的渲染器以产生一或多个扬声器信号的技术。一种包括一或多个处理器的装置可执行所述技术。所述一或多个处理器可经配置以确定用于表示声场的球面谐波系数的播放的一或多个扬声器的本地扬声器几何学,及配置所述装置以基于所述本地扬声器几何学进行操作。
Description
本申请案主张2013年5月31日申请的美国临时申请案第61/829,832号及2013年2月7日申请的美国临时申请案第61/762,302号的权利。
技术领域
本发明涉及音频渲染,且更具体地说,涉及球面谐波系数的渲染。
背景技术
高阶立体混响(HOA)信号(常常由多个球面谐波系数(SHC)或其它分层元素表示)为声场的三维表示。此HOA或SHC表示可以独立于用以播放从此SHC信号渲染的多信道音频信号的本地扬声器几何学的方式表示此声场。此SHC信号也可促进向后兼容性,这是因为可致使此SHC信号为众所周知且高度采用的多信道格式,诸如,5.1音频信道格式或7.1音频信道格式。SHC表示因此实现也适应向后兼容性的声场的较好表示。
发明内容
一般而言,描述用于确定适合特定本地扬声器几何学的音频渲染器的技术。虽然SHC可适应众所周知的多信道扬声器格式,但通常,终端用户并不按这些多信道格式所需要的方式恰当地放置或定位扬声器,从而引起不规则扬声器几何学。本发明中描述的技术可确定本地扬声器几何学,且接着基于此本地扬声器几何学确定用于渲染SHC信号的渲染器。渲染装置可从许多不同渲染器之中选择(例如)单声道渲染器、立体声渲染器、仅水平渲染器或三维渲染器,且基于本地扬声器几何学产生此渲染器。与经设计以用于规则扬声器几何学的规则渲染器相比,此渲染器可考量不规则扬声器几何学,且由此促进声场的较好重现,而不管不规则扬声器几何学如何。
此外,所述技术可给予均匀的扬声器几何学(其可被称作虚拟扬声器几何学),以便维持可逆性且恢复SHC。所述技术可接着执行各种操作以将这些虚拟扬声器投影到不同水平平面(其可在与虚拟扬声器原先所处的水平平面不同的高度)。所述技术可使装置能够产生将这些所投影的虚拟扬声器映射到按不规则扬声器几何学布置的不同物理扬声器的渲染器。以此方式投影这些虚拟扬声器可促进声场的较好重现。
在一个实例中,一种方法包括确定用于表示声场的球面谐波系数的播放的一或多个扬声器的本地扬声器几何学,及基于所述本地扬声器几何学确定二维或三维渲染器。
在另一实例中,一种装置包括一或多个处理器,其经配置以确定用于表示声场的球面谐波系数的播放的一或多个扬声器的本地扬声器几何学,及配置所述装置以基于所述所确定的本地扬声器几何学进行操作。
在另一实例中,一种装置包括用于确定用于表示声场的球面谐波系数的播放的一或多个扬声器的本地扬声器几何学的装置,及用于基于所述本地扬声器几何学确定二维或三维渲染器的装置。
在另一实例中,一种非暂时性计算机可读存储媒体具有存储于其上的指令,所述指令在执行时致使一或多个处理器确定用于表示声场的球面谐波系数的播放的一或多个扬声器的本地扬声器几何学,及基于所述本地扬声器几何学确定二维或三维渲染器。
在另一实例中,一种方法包括确定多个物理扬声器中的一者与按一几何学布置的多个虚拟扬声器中的一者之间的位置差,及基于所述所确定的位置差且在将所述多个虚拟扬声器映射到所述多个物理扬声器之前调整所述多个虚拟扬声器中的所述一者在所述几何学内的位置。
在另一实例中,一种装置包括一或多个处理器,其经配置以确定多个物理扬声器中的一者与按一几何学布置的多个虚拟扬声器中的一者之间的位置差,及基于所述所确定的位置差且在将所述多个虚拟扬声器映射到所述多个物理扬声器之前调整所述多个虚拟扬声器中的所述一者在所述几何学内的位置。
在另一实例中,一种装置包括用于确定多个物理扬声器中的一者与按一几何学布置的多个虚拟扬声器中的一者之间的位置差的装置,及用于基于所述所确定的位置差且在将所述多个虚拟扬声器映射到所述多个物理扬声器之前调整所述多个虚拟扬声器中的所述一者在所述几何学内的位置的装置。
在另一实例中,一种非暂时性计算机可读存储媒体具有存储于其上的指令,所述指令在执行时致使一或多个处理器确定多个物理扬声器中的一者与按一几何学布置的多个虚拟扬声器中的一者之间的位置差,及基于所述所确定的位置差且在将所述多个虚拟扬声器映射到所述多个物理扬声器之前调整所述多个虚拟扬声器中的所述一者在所述几何学内的位置。
在附图及以下描述中阐明所述技术的一或多个方面的细节。从描述及图式且从权利要求书,所述技术的其它特征、目标及优势将显而易见。
附图说明
图1及2为说明各种阶及子阶的球面谐波基函数的图解。
图3为说明可实施本发明中描述的技术的各种方面的系统的图解。
图4为说明可实施本发明中描述的技术的各种方面的系统的图解。
图5为说明在执行本发明中描述的技术的各种方面时的在图4的实例中展示的渲染器确定单元的示范性操作的流程图。
图6为说明在图4的实例中展示的立体声渲染器产生单元的示范性操作的流程图。
图7为说明在图4的实例中展示的水平渲染器产生单元的示范性操作的流程图。
图8A及8B为说明在图4的实例中展示的3D渲染器产生单元的示范性操作的流程图。
图9为说明在当确定不规则3D渲染器时执行下部半球处理及上部半球处理时的在图4的实例中展示的3D渲染器产生单元的示范性操作的流程图。
图10为说明展示可根据本发明中阐明的技术产生立体声渲染器的方式的在单元空间中的曲线图299的图解。
图11为说明展示可根据本发明中阐明的技术产生不规则水平渲染器的方式的在单元空间中的曲线图304的图解。
图12A及12B为说明展示可根据本发明中阐明的技术产生不规则3D渲染器的方式的曲线图306A及306B的图解。
图13A到13D说明根据本发明中描述的技术的各种方面形成的位流。
图14A及14B展示可实施本发明中描述的技术的各种方面的3D渲染器确定单元。
图15A及15B展示22.2扬声器几何学。
图16A及16B各自展示根据本发明中描述的技术的各种方面的其上布置虚拟扬声器、由虚拟扬声器中的一或多者投影到的水平平面分段的虚拟球。
图17展示根据本发明中描述的技术的各种方面的可应用于元素的分层集合的开窗函数。
具体实施方式
当今,环绕声的演进已使用于娱乐的许多输出格式可用。这些环绕声格式的实例包含流行的5.1格式(其包含以下六个信道:左前(FL)、右前(FR)、中心或中前、左后或左环绕、右后或右环绕及低频效果(LFE))、发展中的7.1格式及即将到来的22.2格式(例如,用于供超高清晰度电视标准使用)。另外实例包含用于球面谐波阵列的格式。
到未来MPEG编码器(其可大体上响应于日期为2013年1月的名为“Call forProposals for 3D Audio”且在瑞士日内瓦的大会上发布的ISO/IECJTC1/SC29/WG11/N13411文档而开发)的输入任选地为三个可能格式中的一者:(i)传统的基于信道的音频,其意指经由在预先指定位置处的扬声器播放;(ii)基于对象的音频,其涉及用于具有含有其位置坐标(在其它信息之中)的关联元数据的单一音频对象的离散脉码调制(PCM)数据;及(iii)基于场景的音频,其涉及使用球面谐波基函数的系数(也叫作“球面谐波系数”或SHC)表示声场。
市场上存在各种“环绕声”格式。其范围是(例如)从5.1家庭剧院系统(就侵入起居室而言,除了立体声外,其已为最成功的)到由NHK(Nippon Hoso Kyokai或JapanBroadcasting Corporation(日本广播公司))开发的22.2系统。内容创建者(例如,好莱坞摄影棚)将有可能一次针对一部电影产生配乐,而非花精力在针对每一扬声器配置来将其混录。近来,标准委员会已在考虑提供编码成标准化位流及可适应在渲染器的位置处的扬声器几何学及声学条件且为扬声器几何学及声学条件不可知的随后解码的方式。
为了针对内容创建者提供此灵活性,可使用元素的分层集合来表示声场。元素的分层集合可指元素经排序使得较低排序的元素的基本集合提供建模声场的完全表示的元素集合。因为所述集合经扩展以包含高阶元素,因此所述表示变得更详细。
元素的分层集合的一个实例为球面谐波系数(SHC)的集合。以下表达式使用SHC来演示声场的描述或表示:
此表达式展示声场的在任一点处的压力pi可唯一地由SHC表示。此处,c为声速(~343m/s),为参考点(或观测点),jn(·)为阶n的球面贝塞尔(Bessel)函数,且为阶n及子阶m的球面谐波基函数。可认识到,在正方形括符中的项为信号的频域表示(即,),其可通过各种时间频率变换而近似,所述时间频率变换是诸如离散傅立叶(Fourier)变换(DFT)、离散余弦变换(DCT)或小波变换。分层集合的其它实例包含小波变换系数的集合及多解基函数的系数的其它集合。
图1为说明从零阶(n=0)到四阶(n=4)的球面谐波基函数的图解。可看出,对于每一阶,存在子阶m的展开,为了易于说明目的而展示子阶m,但未明确地在图2的实例中指出。
图2为说明从零阶(n=0)到四阶(n=4)的球面谐波基函数的另一图解。在图2中,按三维坐标空间展示球面谐波基函数,其中阶及子阶皆被展示。
无论如何,SHC可由各种麦克风阵列配置物理上获取(例如,记录),或替代地,其可从声场的基于信道或基于对象的描述而导出。前者表示到编码器的基于场景的音频输入。举例来说,可使用涉及1+24(25,且因此为四阶)个系数的四阶表示。
为了说明可从基于对象的描述导出这些SHC的方式,考虑以下方程式。对应于个别音频对象的用于声场的系数可表达为
其中i为为阶n的(第二种类的)球面汉克尔(Hankel)函数,且为对象的位置。知道随频率而变的源能量g(ω)(例如,使用时间频率分析技术,诸如,对PCM流执行快速傅立叶变换)会允许我们将每一PCM对象及其位置转换成SHC另外,可展示(由于以上为线性且正交分解)用于每一对象的系数为加性的。以此方式,大量PCM对象可由系数表示(例如,作为用于个别对象的系数矢量的总和)。基本上,这些系数含有关于声场的信息(压力随3D坐标而变),且以上表示在观测点附近的从个别对象到总体声场的表示的变换。以下在基于对象及基于SHC的音频译码的上下文中描述剩余图。
图3为说明可执行本发明中描述的技术的各种方面的系统20的图解。如在图3的实例中所展示,系统20包含内容创建者22及内容消费者24。内容创建者22可表示可产生多信道音频内容供内容消费者(诸如,内容消费者24)消费的电影摄影棚或其它实体。通常,此内容创建者产生音频内容连同视频内容。内容消费者24表示拥有或能够存取音频播放系统32(其可指能够播放多信道音频内容的任一形式的音频播放系统)的个人。在图3的实例中,内容消费者24包含音频播放系统32。
内容创建者22包含音频渲染器28及音频编辑系统30。音频渲染器26可表示渲染或以其它方式产生扬声器馈送(speaker feed)(其也可被称作“扬声器馈送(loudspeakerfeed)”、“扬声器信号(speaker signal或loudspeaker signal)”)的音频处理单元。每一扬声器馈送可对应于针对多信道音频系统的特定信道重现声音的扬声器馈送。在图3的实例中,渲染器38可针对常规5.1、7.1或22.2环绕声格式渲染扬声器馈送,从而在5.1、7.1或22.2环绕声扬声器系统中产生针对5、7或22扬声器中的每一者的扬声器馈送。替代地,渲染器28可经配置以渲染来自针对具有任何数目个扬声器的任何扬声器配置的源球面谐波系数的扬声器馈送(在给出以上论述的源球面谐波系数的性质的情况下)。渲染器28可以此方式产生许多扬声器馈送(其在图3中表示为扬声器馈送29)。
内容创建者可在编辑过程期间渲染球面谐波系数27(“SHC 27”),从而收听经渲染的扬声器馈送以尝试识别不具有高保真度或不提供令人信服的环绕声体验的声场的方面。内容创建者22可接着编辑源球面谐波系数(常常间接经由可供按以上描述的方式导出源球面谐波系数的不同对象的操纵)。内容创建者22可使用音频编辑系统30以编辑球面谐波系数27。音频编辑系统30表示能够编辑音频数据且将此音频数据作为一或多个源球面谐波系数输出的任一系统。
当编辑过程完成时,内容创建者22可基于球面谐波系数27产生位流31。即,内容创建者22包含位流产生装置36,位流产生装置36可表示能够产生位流31的任一装置。在一些情况下,位流产生装置36可表示带宽压缩(作为一个实例,通过熵编码)球面谐波系数27且按所接受的格式布置球面谐波系数27的经带宽压缩版本以形成位流31的编码器。在其它情况下,位流产生装置36可表示使用(作为一个实例)类似于常规音频环绕声编码过程的过程以压缩多信道音频内容或其衍生物来编码多信道音频内容29的音频编码器(可能地,符合诸如MPEG环绕的已知音频译码标准或其衍生物的编码器)。经压缩的多信道音频内容29可接着以某一其它方式被熵编码或译码以带宽压缩内容29,且根据所同意的格式而布置以形成位流31。无论经直接压缩以形成位流31还是经渲染且接着经压缩以形成位流31,内容创建者22皆可将位流31发射到内容消费者24。
虽然图3中展示为直接发射到内容消费者24,但内容创建者22可将位流31输出到定位于内容创建者22与内容消费者24之间的中间装置。此中间装置可存储位流31以用于稍后递送到内容消费者24,内容消费者24可请求此位流。中间装置可包括文件服务器、web服务器、桌上型计算机、膝上型计算机、平板计算机、移动电话、智能电话,或能够存储位流31以用于稍后由音频解码器检索的任一其它装置。替代地,内容创建者22可将位流31存储到存储媒体,诸如,压缩光盘、数字视频盘、高清晰度视频盘或其它存储媒体,其中的大多数能够由计算机读取且因此可被称作计算机可读存储媒体。在此上下文中,发射信道可指供发射存储到这些媒体的内容的那些信道(且可包含零售商店或其它基于商店的递送机构)。无论如何,本发明的技术不应因此在此方面限于图3的实例。
如在图3的实例中进一步所展示,内容消费者24包含音频播放系统32。音频播放系统32可表示能够播放多信道音频数据的任一音频播放系统。音频播放系统32可包含许多不同渲染器。音频播放系统32也可包含渲染器确定单元40,渲染器确定单元40可表示经配置以从多个音频渲染器之中确定或以其它方式选择音频渲染器34的单元。在一些情况下,渲染器确定单元40可从许多预定义渲染器选择渲染器34。在其它情况下,渲染器确定单元40可基于本地扬声器几何学信息41动态地确定音频渲染器34。本地扬声器几何学信息41可指定耦合到音频播放系统32的每一扬声器相对于音频播放系统32、收听者或任一其它可识别区域或位置的位置。通常,收听者可经由图形用户接口(GUI)或其它形式的接口而与音频播放系统32进行接口连接以输入本地扬声器几何学信息41。在一些情况下,音频播放系统32可常常通过发射某些音调且经由耦合到音频播放系统32的麦克风测量音调而自动地(在此实例中意指无需任何收听者干预)确定本地扬声器几何学信息41。
音频播放系统32可进一步包含提取装置38。提取装置38可表示能够经由可通常与位流产生装置36的过程互逆的过程提取球面谐波系数27'(“SHC 27'”,其可表示球面谐波系数27的经修改形式或副本)的任一装置。音频播放系统32可接收球面谐波系数27'且调用提取装置38以提取SHC 27',且在指定或可用的情况下,提取音频渲染信息39。
无论如何,以上渲染器34中的每一者可提供不同渲染形式,其中不同渲染形式可包含执行矢量基振幅平移(VBAP)的各种方式中的一或多者、执行基于距离的振幅平移(DBAP)的各种方式中的一或多者、执行简单平移的各种方式中的一或多者、执行近场补偿(NFC)滤波的各种方式中的一或多者,及/或执行波场合成的各种方式中的一或多者。选定渲染器34可接着渲染球面谐波系数27'以产生许多扬声器馈送35(对应于电耦合到或可能地以无线方式耦合到音频播放系统32的扬声器的数目,为了易于说明目的而未在图3的实例中展示所述扬声器)。
通常,音频播放系统32可选择多个音频渲染器中的任一者,且可经配置以取决于供接收位流31的源(诸如,举几个实例,DVD播放器、蓝光播放器、智能电话、平板计算机、游戏系统及电视)选择音频渲染器中的一或多者。虽然可选择音频渲染器中的任一者,但归因于以下事实,当创建内容时使用的音频渲染器常常提供较好(且可能地为最好)渲染形式:内容是由内容创建者22使用音频渲染器中的此者(即,在图3的实例中,音频渲染器28)创建。选择具有与本地扬声器几何学的渲染形式相同或至少接近的渲染形式的音频渲染器34中的一者可提供声场的较好表示,其可引起对于内容消费者24的较好环绕声体验。
位流产生装置可产生位流31以包含音频渲染信息39(“音频渲染信息(audiorendering info)39”)。音频渲染信息39可包含识别当产生多信道音频内容时使用的音频渲染器(即,在图4的实例中,音频渲染器28)的信号值。在一些情况下,信号值包含用以将球面谐波系数渲染到多个扬声器馈送的矩阵。
在一些情况下,信号值包含定义指示位流包含用以将球面谐波系数渲染到多个扬声器馈送的矩阵的索引的两个或两个以上位。在一些情况下,当使用索引时,信号值进一步包含定义包含于位流中的矩阵的行数的两个或两个以上位,及定义包含于位流中的矩阵的列数的两个或两个以上位。在使用此信息且假定二维矩阵的每一系数通常由32位浮点数定义的情况下,可将就矩阵的位而言的大小计算为随行数、列数及定义矩阵的每一系数的浮点数(即,在此实例中,32位)的大小而变。
在一些情况下,信号值指定用以将球面谐波系数渲染到多个扬声器馈送的渲染算法。渲染算法可包含位流产生装置36及提取装置38皆已知的矩阵。即,除了诸如平移(例如,VBAP、DBAP或简单平移)或NFC滤波的其它渲染步骤之外,渲染算法也可包含应用矩阵。在一些情况下,信号值包含定义与用以将球面谐波系数渲染到多个扬声器馈送的多个矩阵中的一者相关联的索引的两个或两个以上位。再次,位流产生装置36及提取装置38皆可经配置有指示多个矩阵及多个矩阵的阶的信息,使得所述索引可唯一地识别所述多个矩阵中的特定者。替代地,位流产生装置36可指定位流31中定义多个矩阵及/或多个矩阵的阶的数据,使得所述索引可唯一地识别所述多个矩阵中的特定者。
在一些情况下,信号值包含定义与用以将球面谐波系数渲染到多个扬声器馈送的多个渲染算法中的一者相关联的索引的两个或两个以上位。再次,位流产生装置36及提取装置38皆可经配置有指示多个渲染算法及多个渲染算法的阶的信息,使得所述索引可唯一地识别所述多个矩阵中的特定者。替代地,位流产生装置36可指定位流31中定义多个矩阵及/或多个矩阵的阶的数据,使得所述索引可唯一地识别所述多个矩阵中的特定者。
在一些情况下,位流产生装置36在位流中基于每音频帧指定音频渲染信息39。在其它情况下,位流产生装置36在位流中单次地指定音频渲染信息39。
提取装置38可接着确定在位流中指定的音频渲染信息39。基于包含于音频渲染信息39中的信号值,音频播放系统32可基于音频渲染信息39渲染多个扬声器馈送35。如上文所指出,在一些情况下,信号值可包含用以将球面谐波系数渲染到多个扬声器馈送的矩阵。在此情况下,音频播放系统32可用所述矩阵配置音频渲染器34中的一者,从而使用音频渲染器34中的此者以基于所述矩阵渲染扬声器馈送35。
在一些情况下,信号值包含定义索引的两个或两个以上位,所述索引指示位流包含用以将球面谐波系数27'渲染到扬声器馈送35的矩阵。提取装置38可响应于所述索引从位流分析所述矩阵,因此,音频播放系统32可用经分析矩阵配置音频渲染器34中的一者,且调用渲染器34中的此者以渲染扬声器馈送35。当信号值包含定义包含于位流中的矩阵的行数的两个或两个以上位及定义包含于位流中的矩阵的列数的两个或两个以上位时,提取装置38可按以上描述的方式响应于所述索引且基于定义行数的两个或两个以上位及定义列数的两个或两个以上位从位流分析所述矩阵。
在一些情况下,信号值指定用以将球面谐波系数27'渲染到扬声器馈送35的渲染算法。在这些情况下,音频渲染器34中的一些或全部可执行这些渲染算法。音频播放装置32可接着利用指定渲染算法(例如,音频渲染器34中的一者)根据球面谐波系数27'渲染扬声器馈送35。
当信号值包含定义与用以将球面谐波系数27'渲染到扬声器馈送35的多个矩阵中的一者相关联的索引的两个或两个以上位时,音频渲染器34中的一些或全部可表示此多个矩阵。因此,音频播放系统32可使用与所述索引相关联的音频渲染器34中的所述一者根据球面谐波系数27'渲染扬声器馈送35。
当信号值包含定义与用以将球面谐波系数27'渲染到扬声器馈送35的多个渲染算法中的一者相关联的索引的两个或两个以上位时,音频渲染器34中的一些或全部可表示这些渲染算法。因此,音频播放系统32可使用与所述索引相关联的音频渲染器34中的一者根据球面谐波系数27'渲染扬声器馈送35。
取决于在位流中指定此音频渲染信息的频率,提取装置38可基于每音频帧或单次地确定音频渲染信息39。
通过以此方式指定音频渲染信息39,所述技术可潜在地引起多信道音频内容35的较好重现,且根据内容创建者22意欲重现多信道音频内容35的方式。结果,所述技术可提供更沉浸式的环绕声或多信道音频体验。
虽然描述为在位流中用信号通知(或以其它方式指定),但音频渲染信息39可指定为与位流分离的元数据,或换句话说,指定为与位流分离的旁侧信息。位流产生装置36可产生与位流31分离的此音频渲染信息39,以便维持与不支持本发明中描述的技术的那些提取装置的位流兼容性(且由此实现由那些提取装置进行的成功分析)。因此,虽然描述为在位流中指定,但所述技术可允许指定与位流31分离的音频渲染信息39的其它方式。
此外,虽然描述为在位流31中或在与位流31分离的元数据或旁侧信息中用信号通知或以其它方式指定,但所述技术可使位流产生装置36能够指定在位流31中的音频渲染信息39的部分及作为与位流31分离的元数据的音频渲染信息39的部分。举例来说,位流产生装置36可指定识别位流31中的矩阵的索引,其中可将指定包含经识别矩阵的多个矩阵的表指定为与位流分离的元数据。音频播放系统32可接着从呈索引的形式的位流31及从与位流31分离地指定的元数据确定音频渲染信息39。在一些情况下,音频播放系统32可经配置以从预先配置或经配置的服务器(最有可能由音频播放系统32的制造者或标准主体托管)下载或以其它方式检索表及任何其它元数据。
然而,情况常常是这样的,内容消费者24未根据指定(通常,由环绕声音频格式主体)几何学恰当地配置扬声器。通常,内容消费者24未将扬声器放置于固定高度处及相对于收听者的精确指定位置中。内容消费者24可能不能够将扬声器放置于这些位置中或意识不到甚至存在放置扬声器以实现合适的环绕声体验的指定位置。假定SHC表示二维或三维中的声场,那么使用SHC实现扬声器的更灵活布置,其意指,从SHC,声场的可接受(或与非SHC音频系统的音响相比,至少更好的音响)重现可由以大多数任一扬声器几何学配置的扬声器提供。
为了促进SHC渲染到大多数任一本地扬声器几何学,本发明中描述的技术可使渲染器确定单元40能够不仅以上文描述的方式使用音频渲染信息39选择标准渲染器,而且基于本地扬声器几何学信息41动态地产生渲染器。如关于图4到12C更详细地所描述,所述技术可提供产生适应于由本地扬声器几何学信息41指定的特定本地扬声器几何学的渲染器34的至少四个示范性方式。这三个方式可包含产生单声道渲染器34、立体声渲染器34、水平多信道渲染器34(其中例如,“水平多信道”是指其中所有扬声器通常在同一水平平面上或在同一水平平面附近的具有两个以上扬声器的多信道扬声器配置)及三维(3D)渲染器34(其中三维渲染器可针对扬声器的多个水平平面来渲染)的方式。
在操作中,渲染器确定单元40可基于音频渲染信息39或本地扬声器几何学信息41选择渲染器34。通常,内容消费者24可指定以下优选项:渲染器确定单元40基于音频渲染信息39(当存在时,这是因为此可能并不存在于所有位流中)选择渲染器34,且当不存在时,基于本地扬声器几何学信息41确定(或在先前确定的情况下,选择)渲染器34。在一些情况下,内容消费者24可指定以下优选项:渲染器确定单元40在渲染器34的选择期间基于本地扬声器几何学信息41而从不考虑音频渲染信息39来确定(或在先前确定的情况下,选择)渲染器34。虽然仅提供两个替代方案,但可指定任何数目个优选项,以用于配置渲染器确定单元40基于音频渲染信息39及/或本地扬声器几何学41选择渲染器34的方式。因此,所述技术在此方面不应限于以上论述的两个示范性替代方案。
无论如何,假定渲染器确定单元40将基于本地扬声器几何学信息41确定渲染器34,那么渲染器确定单元40可首先将本地扬声器几何学分类成以上简要提到的四个类别中的一者。即,渲染器确定单元40可首先确定本地扬声器几何学信息41是否指示本地扬声器几何学通常与单声道扬声器几何学、立体声扬声器几何学、在同一水平平面上具有三个或三个以上扬声器的水平多信道扬声器几何学或具有三个或三个以上扬声器(其中的两者在不同水平平面(常常被分离某一阈值高度)上)的三维多信道扬声器几何学一致。在基于此本地扬声器几何学信息41分类本地扬声器几何学后,渲染器确定单元40就可产生单声道渲染器、立体声渲染器、水平多信道渲染器及三维多信道渲染器中的一者。渲染器确定单元40可接着提供此渲染器34供音频播放系统32使用,因此,音频播放系统32可按以上描述的方式渲染SHC 27'以产生多信道音频数据35。
以此方式,所述技术可使音频播放系统32能够确定用于表示声场的球面谐波系数的播放的一或多个扬声器的本地扬声器几何学,及基于本地扬声器几何学确定二维或三维渲染器。
在一些实例中,音频播放系统32可使用所确定的渲染器渲染球面谐波系数以产生多信道音频数据。
在一些实例中,当基于本地扬声器几何学确定渲染器时,音频播放系统32可在本地扬声器几何学与立体声扬声器几何学一致时确定立体声渲染器。
在一些实例中,当基于本地扬声器几何学确定渲染器时,音频播放系统32可在本地扬声器几何学与具有两个以上扬声器的水平多信道扬声器几何学一致时确定水平多信道渲染器。
在一些实例中,当基于本地扬声器几何学确定渲染器时,音频播放系统32可在本地扬声器几何学与在一个以上水平平面上具有两个以上扬声器的三维多信道扬声器几何学一致时确定三维多信道渲染器。
在一些实例中,当确定一或多个扬声器的本地扬声器几何学时,音频播放系统32可从收听者接收指定描述本地扬声器几何学的本地扬声器几何学信息的输入。
在一些实例中,当确定一或多个扬声器的本地扬声器几何学时,音频播放系统32可经由图形用户接口从收听者接收指定描述本地扬声器几何学的本地扬声器几何学信息的输入。
在一些实例中,当确定一或多个扬声器的本地扬声器几何学时,音频播放系统32可自动地确定描述本地扬声器几何学的本地扬声器几何学信息。
以下为一种用以汇总前述技术的方式。通常,高阶立体混响信号(诸如,SHC 27)为使用球面谐波基函数的三维声场的表示,其中球面谐波基函数中的至少一者与具有大于1的阶的球面基函数相关联。此表示可提供理想的声音格式,这是因为其独立于终端用户扬声器几何学,且结果,可在无关于编码侧的先前知识的情况下在内容消费者处将表示渲染到任一几何学。最终扬声器信号可接着通过球面谐波系数的线性组合而导出,所述线性组合通常表示在那个特定扬声器的方向上指出的极化方向图。已进行针对设计用于普通扬声器布局(诸如,5.0/5.1)的特定HOA渲染器且也针对对于不规则2D及3D扬声器几何学实时地或几乎实时地产生渲染器(其通常被称作“在工作中”)的研究。通过使用基于伪逆的渲染矩阵,规则(t设计)扬声器几何学的“极好”情况可为众所周知的。在即将到来的MPEG-H标准的情况下,可能需要可采取任一扬声器几何学且使用正确的方法用于产生针对讨论中的扬声器几何学的最好渲染矩阵的系统。
本发明中描述的技术的各种方面提供HOA或SHC渲染器产生系统/算法。所述系统检测何种类型的扬声器几何学在使用中:单声道、立体声、水平、三维或旗标表示为已知几何学/渲染器矩阵。
图4为更详细地说明图3的渲染器确定单元40的框图。如在图4的实例中所展示,渲染器确定单元40可包含渲染器选择单元42、布局确定单元44及渲染器产生单元46。渲染器选择单元42可表示如下单元:所述单元经配置以选择基于渲染信息39而预定义的或选择在渲染信息39中指定的渲染器,从而将此选定或指定渲染器作为渲染器34输出。
布局确定单元44可表示经配置以基于本地扬声器几何学信息41分类本地扬声器几何学的单元。布局确定单元44可将本地扬声器几何学分类为以上描述的三个类别中的一者:1)单声道扬声器几何学、2)立体声扬声器几何学、3)水平多信道扬声器几何学,及4)三维多信道扬声器几何学。布局确定单元44可将指示与本地扬声器几何学最一致的三个类别中的哪一者的分类信息45传递到渲染器产生单元46。
渲染器产生单元46可表示经配置以基于分类信息45及本地扬声器几何学信息41产生渲染器34的单元。渲染器产生单元46可包含单声道渲染器产生单元48D、立体声渲染器产生单元48A、水平渲染器产生单元48B及三维(3D)渲染器产生单元48C。单声道渲染器产生单元48A可表示经配置以基于本地扬声器几何学信息41产生单声道渲染器的单元。立体声渲染器产生单元48A可表示经配置以基于本地扬声器几何学信息41产生立体声渲染器的单元。以下关于图6的实例更详细地描述由立体声渲染器产生单元48A使用的过程。水平渲染器产生单元48B可表示经配置以基于本地扬声器几何学信息41产生水平多信道渲染器的单元。以下关于图7的实例更详细地描述由水平渲染器产生单元48B使用的过程。3D渲染器产生单元48C可表示经配置以基于本地扬声器几何学信息41产生3D多信道渲染器的单元。以下关于图8及9的实例更详细地描述由水平渲染器产生单元48B使用的过程。
图5为说明在执行本发明中描述的技术的各种方面时的在图4的实例中展示的渲染器确定单元40的示范性操作的流程图。图5的流程图大体上概括由以上关于图4描述的渲染器确定单元40执行的操作,惟一些微小的标记法改变除外。在图5的实例中,渲染器旗标是指音频渲染信息39的特定实例。“SHC阶”是指SHC的最大阶。“立体声渲染器”可指立体声渲染器产生单元48A。“水平渲染器”可指水平渲染器产生单元48B。“3D渲染器”可指3D渲染器产生单元48C。“渲染器矩阵”可指渲染器选择单元42。
如在图5的实例中所展示,渲染器选择单元42可接收确定可表示为渲染器旗标39'的渲染器旗标是否存在于位流31(或与位流31相关联的其它旁侧信道信息)中(60)。当渲染器旗标39'存在于位流31中(“是”60)时,渲染器选择单元42可基于渲染器旗标39'从潜在的多个渲染器选择渲染器,且将选定渲染器作为渲染器34输出(62、64)。
当渲染器旗标39'不存在于位流中(“否”60)时,渲染器选择单元42可调用可确定本地扬声器几何学信息41的渲染器确定单元40。基于本地扬声器几何学信息41,渲染器确定单元40可调用单声道渲染器确定单元48D、扬声器渲染器确定单元48A、水平渲染器确定单元48B及3D渲染器确定单元48C中的一者。
当本地扬声器几何学信息41指示单声道本地扬声器几何学时,渲染器确定单元40可调用单声道渲染器确定单元48D,单声道渲染器确定单元48D可确定单声道渲染器(潜在地基于SHC阶)且将单声道渲染器作为渲染器34输出(66、64)。当本地扬声器几何学信息41指示立体声本地扬声器几何学时,渲染器确定单元40可调用立体声渲染器确定单元48A,立体声渲染器确定单元48A可确定立体声渲染器(潜在地基于SHC阶)且将立体声渲染器作为渲染器34输出(68、64)。当本地扬声器几何学信息41指示水平本地扬声器几何学时,渲染器确定单元40可调用水平渲染器确定单元48B,水平渲染器确定单元48B可确定水平渲染器(潜在地基于SHC阶)且将水平渲染器作为渲染器34输出(70、64)。当本地扬声器几何学信息41指示立体声本地扬声器几何学时,渲染器确定单元40可调用3D渲染器确定单元48C,3D渲染器确定单元48C可确定3D渲染器(潜在地基于SHC阶)且将3D渲染器作为渲染器34输出(72、64)。
以此方式,所述技术可使渲染器确定单元40能够确定用于表示声场的球面谐波系数的播放的一或多个扬声器的本地扬声器几何学,及基于本地扬声器几何学确定二维或三维渲染器。
图6为说明在图4的实例中展示的立体声渲染器产生单元48A的示范性操作的流程图。在图6的实例中,立体声渲染器产生单元48A可接收本地扬声器几何学信息41(100),且接着确定扬声器相对于在可被当作给定扬声器几何学的“甜点”的位置的收听者位置之间的角距离(102)。立体声渲染器产生单元48A可接着计算受到球面谐波系数的HOA/SHC阶限制的最高允许阶(104)。立体声渲染器产生单元48A可接下来基于所确定的允许阶产生相等间隔的方位角(106)。
立体声渲染器产生单元48A可接着在形成二维(2D)渲染器的虚拟或真实扬声器的位置处取样球面基函数。立体声渲染器产生单元48A可接着执行此2D渲染器的伪逆(在矩阵数学的上下文中理解)(108)。在数学上,此2D渲染器可由以下矩阵表示:
此矩阵的大小可为V个行乘(n+1)2,其中V表示虚拟扬声器的数目,且n表示SHC阶。为阶n的(第二种类的)球面汉克尔函数。为阶n及子阶m的球面谐波基函数。为就球面坐标而言的参考点(或观测点)。
立体声渲染器产生单元48A可接着向右边位置及向左边位置旋转方位角,从而产生两个不同2D渲染器(110、112)且接着将其组合成2D渲染器矩阵(114)。立体声渲染器产生单元48A可接着将此2D渲染器矩阵转换为3D渲染器矩阵(116),且零填补允许阶(在图6的实例中,表示为阶')与阶n之间的差(120)。立体声渲染器产生单元48A可接着执行关于3D渲染器矩阵的能量保存(122),从而输出此3D渲染器矩阵(124)。
以此方式,所述技术可使立体声渲染器产生单元48A能够基于SHC阶及左扬声器位置与右扬声器位置之间的角距离产生立体声渲染矩阵。立体声渲染器产生单元48A可接着旋转渲染矩阵的前位置以匹配左扬声器位置且接着匹配右扬声器位置,且接着组合这些左及右矩阵以形成最终渲染矩阵。
图7为说明在图4的实例中展示的水平渲染器产生单元48B的示范性操作的流程图。在图7的实例中,水平渲染器产生单元48B可接收本地扬声器几何学信息41(130),且接着找到扬声器相对于在可被当作给定扬声器几何学的“甜点”的位置的收听者位置之间的角距离(132)。水平渲染器产生单元48B可接着计算最小角距离及最大角距离,从而比较最小角距离与最大角距离(134)。当最小角距离相等(或在某一角阈值范围内大致相等)时,水平渲染器产生单元48B确定本地扬声器几何学为规则的。当最小角距离并不等于(或在某一角阈值范围内大致等于)最大角距离时,水平渲染器产生单元48B可确定本地扬声器几何学为不规则的。
首先考虑将本地扬声器几何学确定为规则的情况,水平渲染器产生单元48B可计算最高允许阶,其受到球面谐波系数的HOA/SHC阶限制,如上文所描述(136)。水平渲染器产生单元48B可接下来产生2D渲染器的伪逆(138),将2D渲染器的此伪逆转换为3D渲染器(140),且零填补3D渲染器(142)。
接下来考虑当将本地扬声器几何学确定为不规则时,水平渲染器产生单元48B可计算最高允许阶,其受到球面谐波系数的HOA/SHC阶限制,如上文所描述(144)。水平渲染器产生单元48B可接着基于允许阶产生相等间隔的方位角(146)以产生2D渲染器。水平渲染器产生单元48B可执行2D渲染器的伪逆(148),且执行任选开窗操作(150)。在一些情况下,水平渲染器产生单元48B可不执行开窗操作。无论如何,水平渲染器产生单元48B也可平移增益,从而将方位角置于与真实方位角相等(不规则扬声器几何学的真实方位角,152),且执行伪逆2D渲染器与平移的增益的矩阵相乘(154)。在数学上,平移增益矩阵可表示执行矢量基振幅平移(VBAP)的大小为R×V的VBAP矩阵,其中V再次表示虚拟扬声器的数目,且R表示真实扬声器的数目。VBAP矩阵可指定如下: 可将乘法表达如下: 水平渲染器产生单元48B可接着将矩阵相乘的输出(其为2D渲染器)转换为3D渲染器(156),且接着零填补3D渲染器,再次如上文所描述(158)。
虽然以上描述为执行特定类型的平移以将虚拟扬声器映射到真实扬声器,但可关于将虚拟扬声器映射到真实扬声器的任一方式执行所述技术。结果,可将矩阵表示为具有R×V的大小的“虚拟到真实扬声器映射矩阵”。所述乘法可因此更通常表达为:
此Virtual_to_Real_Speaker_Mapping_Matrix可表示可将虚拟扬声器映射到真实扬声器的任何平移或其它矩阵,包含:包含用于执行矢量基振幅平移(VBAP)的矩阵中的一或多者、用于执行基于距离的振幅平移(DBAP)的矩阵中的一或多者、用于执行简单平移的矩阵中的一或多者、用于执行近场补偿(NFC)滤波的矩阵中的一或多者,及/或用于执行波场合成的矩阵中的一或多者。
无论产生规则3D渲染器还是不规则3D渲染器,水平渲染器产生单元48B皆可执行关于规则3D渲染器或不规则3D渲染器的能量保存(160)。在一些实例而非所有实例中,水平渲染器产生单元48B可执行基于3D渲染器的空间性质的优化(162),从而输出此优化3D或未优化3D渲染器(164)。
在为水平的子类别中,系统可因此通常检测扬声器的几何学被规则地间隔还是不规则地间隔,且接着基于伪逆或AllRAD方法创建渲染矩阵。AllRAD方法更详细地论述于2013年3月18日到21日在Merano的AIA-DAGA期间提出的Franz Zotter等人的名为“Comparison of energy-preserving and all-round Ambisonic decoders”的论文中。在立体声子类别中,通过基于HOA阶及左与右扬声器位置之间的角距离创建针对规则水平的渲染器矩阵来产生渲染矩阵。接着旋转渲染矩阵的前位置以匹配左扬声器位置且接着匹配右扬声器位置,且接着经组合以形成最终渲染矩阵。
图8A到8B为说明在图4的实例中展示的3D渲染器产生单元48C的示范性操作的流程图。在图8A的实例中,3D渲染器产生单元48C可接收本地扬声器几何学信息41(170),且接着使用一阶的几何学及HOA/SHC阶n的几何学确定球面谐波基函数(172、174)。3D渲染器产生单元48C可接着确定一阶及更少基函数及与大于阶1但小于或等于n的球面基函数相关联的那些基函数的条件数(176、178)。3D渲染器产生单元48C可接着比较两个条件值与所谓的“规则值”(180),规则值可表示具有(在一些实例中)1.05的值的阈值。
当两个条件值低于规则值时,3D渲染器产生单元48C可确定本地扬声器几何学为规则的(在某一意义上,从左到右及从前到右对称,具有相等间隔的扬声器)。当两个条件值皆不低于或小于规则值时,3D渲染器产生单元48C可比较从一阶及更少球面基函数计算的条件值与规则值(182)。当此一阶或更少条件数小于规则值(“是”182)时,3D渲染器产生单元48C确定本地扬声器几何学为几乎规则的(或如在图8的实例中所展示,“几乎规则”)。当此一阶或更少条件数不低于规则值(“否”182)时,3D渲染器产生单元48C确定本地几何学为不规则的。
当确定本地扬声器几何学为规则的时,3D渲染器产生单元48C以类似于以上关于规则3D矩阵确定(关于图7的实例阐明)描述的方式的方式确定3D渲染矩阵,惟3D渲染器产生单元48C针对扬声器的多个水平平面产生此矩阵除外(184)。当将本地扬声器几何学确定为几乎规则的时,3D渲染器产生单元48C以类似于以上关于不规则2D矩阵确定(关于图7的实例阐明)描述的方式的方式确定3D渲染矩阵,惟3D渲染器产生单元48C针对扬声器的多个水平平面产生此矩阵除外(186)。当将本地扬声器几何学确定为不规则的时,3D渲染器产生单元48C以类似于在名为“PERFORMING 2D AND/OR 3DPANNING WITH RESPECT TO HEIRARCHICAL SETS OF ELEMENTS”的美国临时申请案U.S.61/762,302中描述的方式的方式确定3D渲染矩阵,惟稍微修改以适应此确定的更一般本质除外(其中本发明的技术不限于如由此临时申请案中的实例提供的22.2扬声器几何学,188)。
与产生规则、几乎规则还是不规则3D渲染矩阵无关,3D渲染器产生单元48C关于所产生的矩阵执行能量保存(190),接着为(在一些情况下)基于3D渲染矩阵的空间性质优化此3D渲染矩阵(192)。3D渲染器产生单元48C可接着将此渲染器作为渲染器34输出(194)。
结果,在三维情况下,系统可检测规则(使用伪逆)、几乎规则(即,在一阶规则,但在HOA阶不规则,且使用AllRAD方法)或最后不规则(这是基于以上参考的美国临时申请案U.S.61/762,302,但实施为潜在更一般的方法)。三维不规则过程188可在适当时针对由扬声器覆盖的区产生3D-VBAP三角测量、在顶部底部处的高及低平移环、水平频带、伸长因数等以创建包络渲染器用于不规则的三维收听。所有前述选项可使用能量保存,使得几何学之间的在工作中切换具有相同感知能量。大多数不规则或几乎不规则选择使用任选球面谐波开窗。
图8B为说明在确定3D渲染器以用于经由不规则3D本地扬声器几何学播放音频内容时的3D渲染器确定单元48C的操作的流程图。如在图8B的实例中所展示,3D渲染器确定单元48C可计算最高允许阶,其受到球面谐波系数的HOA/SHC阶限制,如上文所描述(196)。3D渲染器产生单元48C可接着基于允许阶产生相等间隔的方位角(198)以产生3D渲染器。3D渲染器产生单元48C可执行3D渲染器的伪逆(200),且执行任选开窗操作(202)。在一些情况下,3D渲染器产生单元48C可不执行开窗操作。
3D渲染器确定单元48C也可执行下半球处理及上半球处理,如以下关于图9更详细地所描述(204、206)。3D渲染器确定单元48C可在执行下半球处理及上半球处理时产生半球数据(其在以下被更详细地描述),所述半球数据指示“拉伸”在真实扬声器之间的角距离的量、可指定平移极限以限制平移到某些阈值高度的2D平移极限及可指定扬声器被视为在同一水平平面中的水平高度的水平频带量。
在一些情况下,3D渲染器确定单元48C可执行3D VBAP操作以构造3D VBAP三角形,同时可基于来自下半球处理及上半球处理中的一或多者的半球数据“拉伸”本地扬声器几何学(208)。3D渲染器确定单元48C可拉伸在给定半球内的真实扬声器角距离以覆盖更多空间。3D渲染器确定单元48C也可识别下半球及上半球的2D平移对(210、212),其中这些对分别识别在下半球及上半球中的每一虚拟扬声器的两个真实扬声器。3D渲染器确定单元48C可接着循环通过当产生同等间隔的几何学时识别的每一规则几何学位置,且基于下半球及上半球虚拟扬声器的2D平移对及3D VBAP三角形执行以下分析(214)。
3D渲染器确定单元48C可确定虚拟扬声器是否在用于下半球及上半球的半球数据中的指定的上部及下部水平频带值内(216)。当虚拟扬声器在这些频带值内(“是”216)时,3D渲染器确定单元48C将这些虚拟操的高度设置为零(218)。换句话说,3D渲染器确定单元48C可识别下半球及上半球中接近在所谓的“甜点”周围将球平分的中间水平平面的虚拟扬声器,且将这些虚拟扬声器的位置设置为在此水平平面上。在将这些虚拟扬声器位置设置为零之后或当虚拟扬声器不在上部及下部水平频带值内(“否”216)时,3D渲染器确定单元48C可执行3D VBAP平移(或将虚拟扬声器映射到真实扬声器的任一其它形式或方式)以沿着中间水平平面产生用以将虚拟扬声器映射到真实扬声器的3D渲染器的水平平面部分。
3D渲染器确定单元48C可在循环通过虚拟扬声器的每一规则几何学位置时评估在下半球中的那些虚拟扬声器以确定这些下半球虚拟扬声器是否低于在下半球数据中指定的下半球高度极限(222)。3D渲染器确定单元48C可执行关于上半球虚拟扬声器的类似评估以确定这些上半球虚拟扬声器是否高于在上半球数据中指定的上半球高度极限(224)。当在下半球虚拟扬声器的情况下低或在上半球虚拟扬声器的情况下高(“是”226、228)时,3D渲染器确定单元48C可分别由经识别的下部对及上部对执行平移(230、232),从而有效地创建可被称作平移环的物体,所述平移环裁剪虚拟扬声器的高度,且将其在高于给定半球的水平频带的真实扬声器之间平移。
3D渲染器确定单元48C可接着组合3D VBAP平移矩阵与下部对平移矩阵及上部对平移矩阵(234),且执行矩阵相乘以将3D渲染器与组合式平移矩阵进行矩阵相乘(236)。3D渲染器确定单元48C可接着零填补允许阶(在图6的实例中,表示为阶')与阶n之间的差(238),从而输出不规则3D渲染器。
以此方式,所述技术可使渲染器确定单元40能够确定与球面谐波系数相关联的球面基函数的允许阶,允许阶识别需要渲染的那些球面谐波系数,且基于所确定的允许阶确定渲染器。
在一些实例中,渲染器确定单元40,允许阶识别在给出用于播放球面谐波系数的扬声器的所确定的本地扬声器几何学的情况下需要渲染的那些球面谐波系数。
在一些实例中,渲染器确定单元40可在确定渲染器时确定渲染器,使得渲染器仅渲染与阶小于或等于所确定的允许阶的球面基函数相关联的那些球面谐波系数。
在一些实例中,渲染器确定单元40可,允许阶小于与球面谐波系数相关联的球面基函数的最大阶N。
在一些实例中,渲染器确定单元40可使用所确定的渲染器渲染球面谐波系数以产生多信道音频数据。
在一些实例中,渲染器确定单元40可确定用于播放球面谐波系数的一或多个扬声器的本地扬声器几何学。当确定渲染器时,渲染器确定单元40可基于所确定的允许阶及本地扬声器几何学确定渲染器。
在一些实例中,渲染器确定单元40可在基于本地扬声器几何学确定渲染器时确定立体声渲染器以当本地扬声器几何学与立体声扬声器几何学一致时渲染允许阶的那些球面谐波系数。
在一些实例中,渲染器确定单元40可在基于本地扬声器几何学确定渲染器时确定水平多信道渲染器以当本地扬声器几何学与具有两个以上扬声器的水平多信道扬声器几何学一致时渲染允许阶的那些球面谐波系数。
在一些实例中,渲染器确定单元40可在确定水平多信道渲染器时确定不规则水平多信道渲染器以当所确定的本地扬声器几何学指示不规则扬声器几何学时渲染允许阶的那些球面谐波系数。
在一些实例中,渲染器确定单元40可在确定水平多信道渲染器时确定规则水平多信道渲染器以当所确定的本地扬声器几何学指示规则扬声器几何学时渲染允许阶的那些球面谐波系数。
在一些实例中,渲染器确定单元40可在基于本地扬声器几何学确定渲染器时确定三维多信道渲染器以当本地扬声器几何学与在一个以上水平平面上具有两个以上扬声器的三维多信道扬声器几何学一致时渲染允许阶的那些球面谐波系数。
在一些实例中,渲染器确定单元40可在确定三维多信道渲染器时确定不规则三维多信道渲染器以当所确定的本地扬声器几何学指示不规则扬声器几何学时渲染允许阶的那些球面谐波系数。
在一些实例中,渲染器确定单元40可在确定三维多信道渲染器时确定几乎规则三维多信道渲染器以当所确定的本地扬声器几何学指示几乎规则扬声器几何学时渲染允许阶的那些球面谐波系数。
在一些实例中,渲染器确定单元40可在确定三维多信道渲染器时确定规则三维多信道渲染器以当所确定的本地扬声器几何学指示规则扬声器几何学时渲染允许阶的那些球面谐波系数。
在一些实例中,渲染器确定单元40可在确定一或多个扬声器的本地扬声器几何学时从收听者接收指定描述本地扬声器几何学的本地扬声器几何学信息的输入。
在一些实例中,渲染器确定单元40可在确定一或多个扬声器的本地扬声器几何学时经由图形用户接口从收听者接收指定描述本地扬声器几何学的本地扬声器几何学信息的输入。
在一些实例中,渲染器确定单元40可在确定一或多个扬声器的本地扬声器几何学时自动地确定描述本地扬声器几何学的本地扬声器几何学信息。
图9为说明在当确定不规则3D渲染器时执行下部半球处理及上部半球处理时的在图4的实例中展示的3D渲染器产生单元48C的示范性操作的流程图。关于在图9的实例中展示的过程的更多信息可在以上参考的美国临时申请案U.S.61/762,302中找到。在图9的实例中展示的过程可表示以上关于图8B描述的下半球或上半球处理。
最初,3D渲染器确定单元48C可接收本地扬声器几何学信息41且确定第一半球真实扬声器位置(250、252)。3D渲染器确定单元48C可接着将第一半球复制到相对的半球上,且使用用于HOA阶的几何学产生球面谐波(254、256)。3D渲染器确定单元48C可确定可指示本地扬声器几何学的规则性(或均匀性)的条件数(258)。当条件数小于阈值数或真实扬声器之间的最大绝对值高度差等于90度(“是”260)时,3D渲染器确定单元48C可确定半球数据,所述半球数据包含拉伸值零、sign(90)的2D平移极限值及水平频带值零(262)。如上文所指出,拉伸值指示“拉伸”真实扬声器之间的角距离的量,2D平移极限可指定限制平移到某些阈值高度的平移极限,且水平频带量可指定扬声器被视为在同一水平平面中的水平高度频带。
3D渲染器确定单元48C也可确定最高/最低(取决于执行上半球还是下半球处理)扬声器的方位角的角距离(264)。当条件数大于阈值数或真实扬声器之间的最大绝对值高度差不等于90度(“是”260)时,3D渲染器确定单元48C可确定最大绝对值高度差是否大于零且最大角距离是否小于阈值角距离(266)。当最大绝对值高度差大于零且最大角距离小于阈值角距离(“是”266)时,3D渲染器确定单元48C可接着确定高度的最大绝对值是否大于70(268)。
当高度的最大绝对值大于70(“是”268)时,3D渲染器确定单元48C确定包含等于零的拉伸值、等于高度的绝对值的最大者的正负号的2D平移极限及等于零的水平频带值的半球数据(270)。当高度的最大绝对值小于或等于70(“否”268)时,3D渲染器确定单元48C可确定包含以下各者的半球数据:等于10减高度的最大绝对值乘70乘10的拉伸值、等于高度的绝对值的最大者减拉伸值的正负号形式的2D平移极限及等于高度的最大绝对值乘0.1的正负号形式的水平频带值(272)。
当最大绝对值高度差小于或等于零或最大角距离大于或等于阈值角距离(“否”266)时,3D渲染器确定单元48C可接着确定高度的绝对值的最小者等于零(274)。当高度的绝对值的最小者等于零(“是”274)时,3D渲染器确定单元48C可确定包含以下各者的半球数据:等于零的拉伸值、等于零的2D平移极限、等于零的水平频带值及识别其高度等于零的真实扬声器的索引的界限半球值(276)。当高度的绝对值的最小者不等于零(“否”274)时,3D渲染器确定单元48C可确定界限半球值等于最低高度扬声器的索引(278)。3D渲染器确定单元48C可接着确定高度的最大绝对值是否大于70(280)。
当高度的最大绝对值大于70(“是”280)时,3D渲染器确定单元48C可确定包含等于零的拉伸值、等于高度的绝对值的最大者的正负号形式的2D平移极限及等于零的水平频带值的半球数据(282)。当高度的最大绝对值小于或等于70(“否”280)时,3D渲染器确定单元48C可确定包含以下各者的半球数据:等于10减高度的最大绝对值乘70乘10的拉伸值、等于高度的绝对值的最大者减拉伸值的正负号形式的2D平移极限及等于高度的最大绝对值乘0.1的正负号形式的水平频带值(282)。
图10为说明展示可根据本发明中阐明的技术产生立体声渲染器的方式的在单元空间中的曲线图299的图解。如在图10的实例中所展示,虚拟扬声器300A到300H是按均匀几何学布置于将单元球平分的水平平面(在所谓的“甜点”周围居中)的圆周周围。物理扬声器302A及302B是按30度及-30度(分别)的角距离定位,如从虚拟扬声器300A所测量。立体声渲染器确定单元48A可确定按以上更详细地描述的方式将虚拟扬声器300A映射到物理扬声器302A及302B的立体声渲染器34。
图11为说明展示可根据本发明中阐明的技术产生不规则水平渲染器的方式的在单元空间中的曲线图304的图解。如在图11的实例中所展示,虚拟扬声器300A到300H是按均匀几何学布置于将单元球平分的水平平面(在所谓的“甜点”周围居中)的圆周周围。物理扬声器302A到302D(“物理扬声器302”)不规则地定位于水平平面的圆周周围。水平渲染器确定单元48B可确定按以上更详细地描述的方式将虚拟扬声器300A到300H(“虚拟扬声器300”)映射到物理扬声器302的不规则水平渲染器34。
水平渲染器确定单元48B可将虚拟扬声器300映射到真实扬声器302中最接近虚拟扬声器中的每一者(就具有最小角距离而言)的两者。映射阐明于下表中:
虚拟扬声器 | 真实扬声器 |
300A | 302A及302B |
300B | 302B及302C |
300C | 302B及302C |
300D | 302C及302D |
300E | 302C及302D |
300F | 302C及302D |
300G | 302D及302A |
300H | 302D及302A |
图12A及12B为说明展示可根据本发明中阐明的技术产生不规则3D渲染器的方式的曲线图306A及306B的图解。在图12A的实例中,曲线图306A包含经拉伸扬声器位置308A到308H(“经拉伸扬声器位置308”)。3D渲染器确定单元48C可按以上关于图9的实例描述的方式识别具有经拉伸真实扬声器位置308的半球数据。曲线图306A也展示相对于经拉伸扬声器位置308的真实扬声器位置302A到302H(“真实扬声器位置302”),其中在一些情况下,真实扬声器位置302与经拉伸扬声器位置308相同,且在其它情况下,真实扬声器位置302不与经拉伸扬声器位置308相同。
曲线图306A也包含表示上部2D平移对的上部2D平移内插线310A及表示下部2D平移对的下部2D平移内插线310B,以上关于图8的实例更详细地描述其中的每一者。简要地,3D渲染器确定单元48C可基于上部2D平移对确定上部2D平移内插线310A,且基于下部2D平移对确定下部2D平移内插线310B。上部2D平移内插线310A可表示上部2D平移矩阵,而下部2D平移内插线310B可表示下部2D平移矩阵。如上文所描述的这些矩阵可接着与3D VBAP矩阵及规则几何学渲染器组合以产生不规则3D渲染器34。
在图12B的实例中,曲线图306B将虚拟扬声器300添加到曲线图306A,其中虚拟扬声器300未在形式上表示于图12B的实例中以避免与演示虚拟扬声器300到经拉伸扬声器位置308的映射的线不必要地混淆。通常,如上文所描述,3D渲染器确定单元48C将虚拟扬声器300中的每一者映射到经拉伸扬声器位置308中的具有最接近虚拟扬声器的角距离的两者或两者以上,类似于在图11及12的水平实例中所展示的情况。不规则3D渲染器可因此以在图12B的实例中展示的方式将虚拟扬声器映射到经拉伸扬声器位置。
在第一实例中,所述技术可因此提供一种装置(诸如,音频播放系统32),其包括用于确定用于表示声场的球面谐波系数的播放的一或多个扬声器的本地扬声器几何学的装置(例如,渲染器确定单元40),及用于基于本地扬声器几何学确定二维或三维渲染器的装置(例如,渲染器确定单元40)。
在第二实例中,第一实例的装置可进一步包括用于使用所确定的二级或三维渲染器产生多信道音频数据渲染球面谐波系数的装置(例如,音频渲染器34)。
在第三实例中,第一实例的装置,其中用于基于本地扬声器几何学确定二维或三维渲染器的装置可包括用于当本地扬声器几何学与立体声扬声器几何学一致时确定二维立体声渲染器的装置(例如,立体声渲染器产生单元48A)。
在第四实例中,第一实例的装置,其中用于基于本地扬声器几何学确定二维或三维渲染器的装置包括用于当本地扬声器几何学与具有两个以上扬声器的水平多信道扬声器几何学一致时确定水平二维多信道渲染器的装置(例如,水平渲染器产生单元48B)。
在第五实例中,第四实例的装置,其中用于确定水平二维多信道渲染器的装置包括用于当所确定的本地扬声器几何学指示不规则扬声器几何学时确定不规则水平二维多信道渲染器的装置,如关于图7的实例所描述。
在第六实例中,第四实例的装置,其中用于确定水平二维多信道渲染器的装置包括用于当所确定的本地扬声器几何学指示规则扬声器几何学时确定规则水平二维多信道渲染器的装置,如关于图7的实例所描述。
在第七实例中,第一实例的装置,其中用于基于本地扬声器几何学确定二维或三维渲染器的装置包括用于当本地扬声器几何学与在一个以上水平平面上具有两个以上扬声器的三维多信道扬声器几何学一致时确定三维多信道渲染器的装置(例如,3D渲染器产生单元48C)。
在第八实例中,第七实例的装置,其中用于确定三维多信道渲染器的装置包括用于当所确定的本地扬声器几何学指示不规则扬声器几何学时确定不规则三维多信道渲染器的装置,如以上关于图8A及8B的实例所描述。
在第九实例中,第七实例的装置,其中用于确定三维多信道渲染器的装置包括用于当所确定的本地扬声器几何学指示几乎规则扬声器几何学时确定几乎规则三维多信道渲染器的装置,如以上关于图8A的实例所描述。
在第十实例中,第七实例的装置,其中用于确定三维多信道渲染器的装置包括用于当所确定的本地扬声器几何学指示规则扬声器几何学时确定规则三维多信道渲染器的装置,如以上关于图8A的实例所描述。
在第十一实例中,第一实例的装置,其中用于确定渲染器的装置包括:用于确定与球面谐波系数相关联的球面基函数的允许阶的装置,允许阶识别在给出所确定的本地扬声器几何学的情况下需要渲染的那些球面谐波系数;及用于基于所确定的允许阶确定渲染器的装置,如上关于图5到8B的实例所描述。
在第十二实例中,第一实例的装置,其中用于确定二维或三维渲染器的装置包括:用于确定与球面谐波系数相关联的球面基函数的允许阶的装置,允许阶识别在给出所确定的本地扬声器几何学的情况下需要渲染的那些球面谐波系数;及用于确定二维或三维渲染器使得二维或三维渲染器仅渲染与阶小于或等于所确定的允许阶的球面基函数相关联的那些球面谐波系数的装置,如以上关于图5到8B的实例所描述。
在第十三实例中,第一实例的装置,其中用于确定一或多个扬声器的本地扬声器几何学的装置包括用于从收听者接收指定描述本地扬声器几何学的本地扬声器几何学信息的输入的装置。
在第十四实例中,第一实例的装置,其中基于本地扬声器几何学确定二维或三维渲染器包括当本地扬声器几何学与单声道扬声器几何学一致时确定单声道渲染器(例如,单声道渲染器确定单元48D)。
图13A到13D为说明根据本发明描述的技术形成的位流31A到31D。在图13A的实例中,位流31A可表示在图3的实例中展示的位流31的一个实例。位流31A包含音频渲染信息39A,其包含定义信号值54的一或多个位。此信号值54可表示以下描述的类型的信息的任何组合。位流31A也包含音频内容58,其可表示音频内容51的一个实例。
在图13B的实例中,位流31B可类似于位流31A,其中信号值54包括索引54A、定义用信号通知的矩阵的行大小54B的一或多个位、定义用信号通知的矩阵的列大小54C的一或多个位及矩阵系数54D。可使用两个到五个位来定义索引54A,而可使用两个到十六个位来定义行大小54B及列大小54C中的每一者。
提取装置38可提取索引54A,且确定索引是否用信号通知所述矩阵包含于位流31B中(其中诸如0000或1111的某些索引值可用信号通知所述矩阵明确地指定于位流31B中)。在图13B的实例中,位流31B包含索引54A,其用信号通知所述矩阵是否明确地指定于位流31B中。结果,提取装置38可提取行大小54B及列大小54C。提取装置38可经配置以计算位数目以分析其表示随行大小54B、列大小54C及每一矩阵系数的用信号通知(图13A中未展示)或隐含的位大小而变的矩阵系数。在使用所确定的数目个位的情况下,提取装置38可提取矩阵系数54D,音频播放装置24可使用所述矩阵系数配置音频渲染器34中的一者,如上文所描述。虽然展示为在位流31B中单次地用信号通知音频渲染信息39B,但音频渲染信息39B可多次地在位流31B中或至少部分或全部地在分离的带外信道中用信号通知(在一些情况下,作为任选数据)。
在图13C的实例中,位流31C可表示在以上图3的实例中展示的位流31的一个实例。位流31C包含音频渲染信息39C,其包含在此实例中指定算法索引54E的信号值54。位流31C也包含音频内容58。可使用两个到五个位来定义算法索引54E(如上文所指出),其中此算法索引54E可识别当渲染音频内容58时待使用的渲染算法。
提取装置38可提取算法索引50E,且确定算法索引54E是否用信号通知所述矩阵包含于位流31C中(其中诸如0000或1111的某些索引值可用信号通知所述矩阵明确地指定于位流31C中)。在图8C的实例中,位流31C包含用信号通知所述矩阵未明确地指定于位流31C中的算法索引54E。结果,提取装置38将算法索引54E转递到音频播放装置,音频播放装置选择渲染算法(其在图3及4的实例中表示为渲染器34)中的对应者(在可用的情况下)。虽然展示为在位流31C中单次地用信号通知音频渲染信息39C(在图13C的实例中),但音频渲染信息39C可多次地在位流31C中或至少部分或全部地在分离的带外信道中用信号通知(在一些情况下,作为任选数据)。
在图13D的实例中,位流31C可表示在以上图4、5及8中展示的位流31的一个实例。位流31D包含音频渲染信息39D,其包含在此实例中指定矩阵索引54F的信号值54。位流31D也包含音频内容58。可使用两个到五个位来定义矩阵索引54F(如上文所指出),其中此矩阵索引54F可识别当渲染音频内容58时待使用的渲染算法。
提取装置38可提取矩阵索引50F,且确定矩阵索引54F是否用信号通知所述矩阵包含于位流31D中(其中诸如0000或1111的某些索引值可用信号通知所述矩阵明确地指定于位流31C中)。在图8D的实例中,位流31D包含用信号通知所述矩阵未明确地指定于位流31D中的矩阵索引54F。结果,提取装置38将矩阵索引54F转递到音频播放装置,音频播放装置选择渲染器34中的对应者(在可用的情况下)。虽然展示为在位流31D中单次地用信号通知音频渲染信息39D(在图13D的实例中),但音频渲染信息39D可多次地在位流31D中或至少部分或全部地在分离的带外信道中用信号通知(在一些情况下,作为任选数据)。
图14A及14B为可执行本发明中描述的技术的各种方面的3D渲染器确定单元48C的另一实例。即,3D渲染器确定单元48C可表示如下单元:所述单元经配置以当虚拟扬声器是按球几何学布置得比将球几何学平分的水平平面低时在产生重现声场的第一多个扬声器信道信号时将虚拟扬声器投影到水平平面上的位置,且对描述所述声场的元素的分层集合执行二维平移,使得所重现的声场包含显得起源于虚拟扬声器的投影的位置的至少一个声音。
在图14A的实例中,3D渲染器确定单元48C可接收SHC 27'且调用虚拟扬声器渲染器350,虚拟扬声器渲染器350可表示经配置以执行虚拟扬声器t设计渲染的单元。虚拟扬声器渲染器350可渲染SHC 27'且针对给定数目个虚拟扬声器(例如,22或32)产生扬声器信道信号。
3D渲染器确定单元48C进一步包含球面加权单元352、上半球3D平移单元354、耳朵层面2D平移单元356及下半球2D平移单元358。球面加权单元352可表示经配置以加权某些信道的单元。上半球3D平移单元354表示经配置以对经球面加权的虚拟扬声器信道信号执行3D平移以将这些信号在各种上半球物理(或换句话说,真实)扬声器之中平移的单元。耳朵层面2D平移单元356表示经配置以对经球面加权的虚拟扬声器信道信号执行2D平移以将这些信号在各种耳朵层面物理(或换句话说,真实)扬声器之中平移的单元。下半球2D平移单元358表示经配置以对经球面加权的虚拟扬声器信道信号执行2D平移以将这些信号在各种下半球物理(或换句话说,真实)扬声器之中平移的单元。
在图14B的实例中,3D渲染确定单元48C'可类似于在图14B中展示的3D渲染确定单元,惟3D渲染确定单元48C'可不执行球面加权或以其它方式包含球面加权单元352除外。
无论如何,通过假定每一扬声器产生球面波来计算扬声器馈送。在此情境下,归因于第l个扬声器在某一位置r,θ,处的压力(随频率而变)由以下给出
其中表示第l个扬声器的位置,且gl(ω)为第l个扬声器的扬声器馈送(在频域中)。归因于所有五个扬声器的总压力Pt因此由以下给出
我们也知道,就五个SHC而言的总压力由以下方程式给出
使以上两个方程式相等会允许我们使用变换矩阵来表达扬声器馈送(就SHC而言),如下:
此表达式展示在五个扬声器馈送与选定SHC之间存在直接关系。所述变换矩阵可取决于(例如)哪一SHC用于子集(例如,基本集合)中且使用SH基函数的哪一定义而变化。以类似方式,可构造从选定基本集合转换为不同信道格式(例如,7.1、22.2)的变换矩阵。
虽然以上表达式中的变换矩阵允许从扬声器馈送到SHC的转换,但我们希望所述矩阵可逆,使得从SHC开始,我们可算出五个信道馈送,且接着在解码器处,我们可任选地转换回为SHC(当存在高级(即,非旧版)渲染器时)。
可采用操纵以上框架以确保矩阵的可逆性的各种方式。这些包含(但不限于)变化扬声器的位置(例如,调整5.1系统的五个扬声器中的一或多者的位置,使得其仍遵守由ITU-R BS.775-1标准指定的角容差;诸如遵守T设计的传感器的规则间距的传感器的规则间距通常表现良好)、规则化技术(例如,与频率相关的规则化)及常用以确保所有秩及良好定义的特征值的各种其它矩阵操纵技术。最后,可能需要在心理声学上测试5.1呈现以确保在所有操纵之后,经修改矩阵确实实际上产生正确及/或可接受的扬声器馈送。只要保存了可逆性,那么确保到SHC的正确解码的逆问题不成问题。
对于一些本地扬声器几何学(其可指在解码器处的扬声器几何学),以上概括的操纵以上框架以确保可逆性的方式可引起不太合乎需要的音频-图像质量。即,与正捕获的音频相比,声音重现可能并不始终引起声音的正确本地化。为了校正此不太合乎需要的图像质量,可进一步扩增所述技术以引入可被称作“虚拟扬声器”的概念。并不需要一或多个扬声器重新定位或定位于具有由诸如以上指出的ITU-R BS.775-1的标准指定的某些角容差的空间的特定或定义的区域中,而是以上框架可经修改以包含某一形式的平移,诸如,矢量基振幅平移(VBAP)、基于距离的振幅平移或其它形式的平移。为了说明的目的,集中于VBAP,VBAP可有效地引入可特性化为“虚拟扬声器”的概念。VBAP可通常修改到一或多个扬声器的馈送,使得这些一或多个扬声器有效地输出显得起源于在不同于支持虚拟扬声器的一或多个扬声器的位置及/或角度中的至少一者的位置及角度中的一或多者处的虚拟扬声器的声音。
为了说明,用于确定扬声器馈送的以上方程式(就SHC而言)可修改如下:
在以上方程式中,VBAP矩阵具有大小为M个行乘N个列,其中M表示扬声器的数目(且在以上方程式中,将等于五),且N表示虚拟扬声器的数目。可将VBAP矩阵计算为随从收听者的定义的位置到扬声器的位置中的每一者的矢量及从收听者的定义的位置到虚拟扬声器的位置中的每一者的矢量而变。以上方程式中的D矩阵可具有大小为N个行乘(阶+1)2个列,其中阶可指SH函数的阶。D矩阵可表示以下矩阵:
实际上,VBAP矩阵为M×N矩阵,其提供可被称作将扬声器的位置及虚拟扬声器的位置计算在内的“增益调整”的概念。以此方式引入平移可引起当由本地扬声器几何学重现时引起较好质量图像的多信道音频的较好重现。此外,通过将VBAP并入到此方程式内,所述技术可克服不与各种标准中指定的扬声器几何学对准的不良扬声器几何学。
实际上,所述方程式可被求逆且用以将SHC变换回为多信道馈送(针对扬声器的特定几何学或配置),其在以下可被称作几何学B。即,所述方程式可经求逆以求解出g矩阵。经求逆的方程式可如下:
g矩阵可表示针对(在此实例中)5.1扬声器配置中的五个扬声器中的每一者的扬声器增益。在此配置中使用的虚拟扬声器位置可对应于在5.1多信道格式规范或标准中定义的位置。可使用任何数目个已知音频本地化技术确定可支持这些虚拟扬声器中的每一者的扬声器的位置,所述技术中的许多者涉及播放具有特定频率的音调以确定每一扬声器相对于头端单元(诸如,音频/视频接收器(A/V接收器)、电视、游戏系统、数字视频盘系统或其它类型的头端系统)的位置。替代地,头端单元的用户可手动地指定扬声器中的每一者的位置。无论如何,在给出这些已知位置及可能角度的情况下,头端单元可求解出增益(假定通过VBAP的虚拟扬声器的理想配置)。
在此方面,所述技术可使装置或设备能够对第一多个扬声器信道信号执行矢量基振幅平移或其它形式的平移以产生第一多个虚拟扬声器信道信号。这些虚拟扬声器信道信号可表示提供到扬声器的信号,其使这些扬声器能够产生显得起源于虚拟扬声器的声音。结果,当对第一多个扬声器信道信号执行第一变换时,所述技术可使装置或设备能够对所述第一多个虚拟扬声器信道信号执行第一变换以产生描述声场的元素的分层集合。
此外,所述技术可使设备能够对元素的分层集合执行第二变换以产生第二多个扬声器信道信号,其中所述第二多个扬声器信道信号中的每一者与空间的对应不同区域相关联,其中所述第二多个扬声器信道信号包括第二多个虚拟扬声器信道,且其中所述第二多个虚拟扬声器信道信号与空间的对应不同区域相关联。在一些情况下,所述技术可使装置能够对所述第二多个虚拟扬声器信道信号执行矢量基振幅平移以产生第二多个扬声器信道信号。
虽然以上变换矩阵是从“模式匹配”准则导出,但替代的变换矩阵也可从其它准则(诸如,压力匹配、能量匹配等)导出。足够的是,可导出允许基本集合(例如,SHC子集)与传统多信道音频之间的变换的矩阵,且也足够的是,在操纵(其不降低多信道音频的保真度)之后,也可用公式表示也可逆的经稍微修改矩阵。
在一些情况下,当执行以上描述的平移(在三维空间中执行平移的意义上,其也可被称作“3D平移”)时,上述3D平移可引入假象或以其它方式引起扬声器馈送的较低质量播放。为了作为实例说明,以上描述的3D平移可关于22.2扬声器几何学来使用,其展示于图15A及图15B中。
图15A及15B说明同一22.2扬声器几何学,其中图15A中展示的曲线图中的黑点展示所有扬声器22个扬声器(不包含低频扬声器)的位置,且图15B展示这些相同扬声器的位置,但另外定义这些扬声器的半球位置本质(其阻挡位于阴影半球后方的那些扬声器)。无论如何,实际扬声器中的极少数者(其数目在以上表示为M)实际上在那个半球中在收听者的耳朵下方,其中收听者的头定位于半球中在图15A及15B的曲线图中的(0,0,0)的(x,y,z)点周围。结果,尝试执行3D平移以虚拟化在收听者的头下方的扬声器可为困难的,尤其是当努力虚拟化具有均匀地定位于全部球周围的虚拟扬声器的32扬声器球(而非半球)几何学时,如当产生SHC时通常所假定,且其在图12B的实例中以虚拟扬声器的位置来展示。
根据本发明中描述的技术,图14A的实例中展示的3D渲染器确定单元48C可表示如下单元:所述单元用以当虚拟扬声器是按球几何学布置得比将球几何学平分的水平平面低时在产生重现声场的第一多个扬声器信道信号时将虚拟扬声器投影到水平平面上的位置,且对描述所述声场的元素的分层集合执行二维平移,使得所重现的声场包含显得起源于虚拟操的投影的位置的至少一个声音。
在一些情况下,水平平面可将球几何学平分成两个相等部分。图16A根据本发明中描述的技术展示由水平平面402平分的球400,虚拟扬声器向上投影到水平平面402上。虚拟扬声器300A到300C,其中在以上关于图14A及14B的实例概括的方式执行二维平移之前按以上叙述的方式将下部虚拟扬声器300A到300C投影到水平平面402上。虽然描述为投影到将球400相等地平分的水平平面402上,但所述技术可将虚拟扬声器投影到球400内的任一水平平面(例如,高度)上。
图16B根据本发明中描述的技术展示由虚拟扬声器向下投影到其上的水平平面402平分的球400。在图16B的此实例中,3D渲染器确定单元48C可将虚拟扬声器300A到300C向下投影到水平平面402。虽然描述为投影到将球400相等地平分的水平平面402上,但所述技术可将虚拟扬声器投影到球400内的任一水平平面(例如,高度)。
以此方式,所述技术可使3D渲染器确定单元48C能够确定多个物理扬声器中的一者相对于按一几何学布置的多个虚拟扬声器中的一者的位置的位置,且基于所确定的位置调整所述多个虚拟扬声器中的所述一者在所述几何学内的位置。
3D渲染器确定单元48C可经进一步配置以当产生第一多个扬声器信道信号时对元素的分层集合除了执行二维平移之外也执行第一变换,其中所述第一多个扬声器信道信号中的每一者与空间的对应不同区域相关联。此第一变换可在以上方程式中反映为D-1。
3D渲染器确定单元48C可经进一步配置以当对元素的分层集合执行二维平移时在产生第一多个扬声器信道信号时对元素的分层集合执行基于二维矢量的振幅平移。
在一些情况下,第一多个扬声器信道信号中的每一者与空间的对应不同定义区域相关联。此外,空间的不同定义区域定义于音频格式规范及音频格式标准中的一或多者中。
3D渲染器确定单元48C也可或替代地经配置以当虚拟扬声器按球几何学布置于在球几何学中的耳朵层面处或附近的水平平面附近时在产生重现声场的第一多个扬声器信道信号时对描述声场的元素的分层集合执行二维平移,使得所重现的声场包含显得起源于虚拟扬声器的位置的至少一个声音。
在此上下文中,3D渲染器确定单元48C可经进一步配置以当产生第一多个扬声器信道信号时对元素的分层集合除了执行二维平移之外也执行第一变换(其再次可指以上指出的D-1变换),其中所述第一多个扬声器信道信号中的每一者与空间的对应不同区域相关联。
此外,3D渲染器确定单元48C可经进一步配置以当对元素的分层集合执行二维平移时在产生第一多个扬声器信道信号时对元素的分层集合执行基于二维矢量的振幅平移。
在一些情况下,第一多个扬声器信道信号中的每一者与空间的对应不同定义区域相关联。此外,空间的不同定义区域可定义于音频格式规范及音频格式标准中的一或多者中。
替代地,或结合本发明中描述的技术的其它方面中的任一者,装置10的一或多个处理器可经进一步配置以当将虚拟扬声器按球几何学布置于将球几何学平分的水平平面上方时在产生描述声场的第一多个扬声器信道信号时对元素的分层集合执行三维平移,使得声场包含显得起源于虚拟扬声器的位置的至少一个声音。
再次,在此上下文中,3D渲染器确定单元48C可经进一步配置以当产生第一多个扬声器信道信号时对元素的分层集合除了执行三维平移之外也执行第一变换,其中所述第一多个扬声器信道信号中的每一者与空间的对应不同区域相关联。
此外,3D渲染器确定单元48C可经进一步配置以当对元素的分层集合(第一多个扬声器信道信号)执行三维平移时在产生第一多个扬声器信道信号时对元素的分层集合执行三维矢量基振幅平移。在一些情况下,第一多个扬声器信道信号中的每一者与空间的对应不同定义区域相关联。此外,空间的不同定义区域可定义于音频格式规范及音频格式标准中的一或多者中。
替代地,或结合本发明中描述的技术的其它方面中的任一者,3D渲染器确定单元48C可经进一步配置以当在从元素的分层集合产生多个扬声器信道信号中执行三维平移及二维平移时基于元素的分层集合中的每一者的阶关于元素的分层集合执行加权。
3D渲染器确定单元48C可经进一步配置以当执行加权时基于元素的分层集合中的每一者的阶关于元素的分层集合执行窗函数。此开窗函数可展示于图17的实例中,其中y轴反映分贝且x轴表示SHC的阶。此外,装置10的一或多个处理器可经进一步配置以当执行加权时基于元素的分层集合中的每一者的阶关于元素的分层集合执行凯撒贝塞尔(Kaiser Bessle)窗函数(作为一个实例)。
这些一或多个处理器可各自表示用于执行归因于所述一或多个处理器的各种功能的装置。其它装置可包含专用硬件、现场可编程门阵列、专用集成电路,或专用于或能够执行可单独地或与本发明中描述的技术一起执行各种方面的软件的任一其它形式的硬件。
可如下汇总由所述技术识别及潜在地解决的问题。为了如实地播放高阶立体混响/球面谐波系数环绕声材料,扬声器的布置可为至关重要的。理想地,等距扬声器的三维球体可为需要的。在真实世界中,当前扬声器设置通常:1)并不同等地分布;2)仅存在于上半球中在收听者周围及上方,而非在下方的下半球中;及3)对于旧版支持(例如,5.1扬声器设置),通常具有在耳朵的高度处的扬声器的环。一种可解决所述问题的策略为实际上创建理想的扬声器布局(在下文,叫作“t设计”)且经由三维矢量基振幅平移(3D-VBAP)方法将这些虚拟扬声器投影到真实(非理想定位)扬声器上。即使如此,此仍可不表示对问题的最佳解决方案,这是因为从下半球的虚拟扬声器的投影可造成使播放的质量降级的强本地化错误及其它感知假象。
本发明中描述的技术的各种方面可克服以上概括的策略的不足之处。所述技术可提供虚拟扬声器信号的不同处理。所述技术的第一方面可使装置10能够将来自下半球的虚拟扬声器正交地映射到水平平面上且使用二维平移方法投影到两个最接近的真实扬声器上。结果,所述技术的第一方面可最小化、减少或移除由错误投影的虚拟扬声器造成的本地化错误。其次,根据本发明中描述的技术的第二方面,上半球中处于耳朵的高度处(或附近)的虚拟扬声器也可使用二维平移方法投影到两个最接近的扬声器。此第二修改所蕴含的原因可为:与方位角方向的感知相比,人类在感知升高的声音源时可能并不如此准确。虽然VBAP通常已知为在创建虚拟声音源的方位角方向中准确,但在创建升高的声音中其相对不准确——常常在比所预期高的高度的情况下感知到感知虚拟声音源。本发明的第二方面避免在将不从其受益且可能甚至造成降级的质量的空间区中使用3D-VBAP。
本发明的第三方面在于,使用常规三维平移方法投影在耳朵层面上方的上半球的所有剩余虚拟扬声器。在一些情况下,可执行所述技术的第四方面,其中使用随球面谐波阶而变的加权函数来加权所有高阶立体混响/球面谐波系数环绕声材料,以增加材料的较平滑空间重现。此已展示为潜在地对于匹配2D与3D平移的虚拟扬声器的能量有益。
虽然展示为执行本发明中描述的技术的每一方面,但3D渲染器确定单元48C可执行在本发明中描述的方面的任何组合,从而执行四个方面中的一或多者。在一些情况下,产生球面谐波系数的不同装置可以互逆方式执行所述技术的各种方面。虽然未详细地描述以避免冗余,但本发明的技术不应严格限于图14A的实例。
以上章节论述用于5.1兼容系统的设计。可相应地针对不同目标格式调整细节。作为实例,为了实现7.1系统的兼容性,将两个附加音频内容信道添加到兼容要求,且可将两个以上SHC添加到基本集合,使得矩阵可逆。由于针对7.1系统(例如,DolbyTrueHD)的大多数扬声器布置仍在水平平面上,因此SHC的选择可仍不包含具有高度信息的SHC。以此方式,水平平面信号渲染将从渲染系统中的添加的扬声器信道受益。在包含具有高度分集的扬声器的系统(例如,9.1、11.1及22.2系统)中,可能需要包含具有在基本集合中的高度信息的SHC。对于如立体声及单声道的较低数目个信道,现有5.1解决方案可能足够覆盖降混以维持内容信息。
以上因此表示在元素的分层集合(例如,SHC的集合)与多个音频信道之间转换的无损失机制。只要多信道音频信号未经受进一步的译码噪音,就不会招致错误。如果其经受译码噪音,那么到SHC的转换可招致错误。然而,可通过监视系数的值且采取适当动作以减少其效应来考量这些错误。这些方法可考量SHC的特性,包含SHC表示中的固有冗余。
本文中描述的方法提供对在声场的基于SHC的表示的使用中的潜在劣势的解决方案。在无此解决方案的情况下,归因于由不能够具有在数百万个旧版播放系统中的功能性强加的显著劣势,可不部署基于SHC的表示。
在第一实例中,所述技术可因此提供一种装置,其包括用于确定多个物理扬声器中的一者与按一几何学布置的多个虚拟扬声器中的一者之间的位置差的装置(例如,渲染器确定单元40),及用于基于所述所确定的位置差调整所述多个虚拟扬声器中的所述一者在所述几何学内的位置的装置(例如,渲染器确定单元40)。
在第二实例中,第一实例的装置,其中用于确定位置差的装置包括用于确定在多个物理扬声器中的所述一者与多个虚拟扬声器中的所述一者之间的高度差的装置(例如,3D渲染器确定单元48C)。
在第三实例中,第一实例的装置,其中用于确定位置差的装置包括用于确定在多个物理扬声器中的所述一者与多个虚拟扬声器中的所述一者之间的高度差的装置,且其中用于调整所述多个虚拟扬声器中的所述一者的位置的装置包括用于当所确定的高度差超过阈值时将所述多个虚拟扬声器中的所述一者投影到比所述多个虚拟扬声器的原始高度低的高度的装置,如上文关于图8A到9及14A到16B的实例更详细地所描述。
在第四实例中,第一实例的装置,其中用于确定位置差的装置包括用于确定在多个物理扬声器中的所述一者与多个虚拟扬声器中的所述一者之间的高度差的装置,且其中用于调整所述多个虚拟扬声器中的所述一者的位置的装置包括用于当所确定的高度差超过阈值时将所述多个虚拟扬声器中的所述一者投影到比所述多个虚拟扬声器中的所述一者的原始高度高的高度的装置,如上文关于图8A到9及14A到16B的实例更详细地所描述。
在第五实例中,第一实例的装置,其进一步包括用于当产生多个扬声器信道信号以驱动多个物理扬声器时对描述声场的元素的分层集合执行二维平移以便重现声场使得所重现的声场包含显得起源于虚拟扬声器的调整的位置的至少一个声音的装置,如上文关于图8A及8B的实例更详细地所描述。
在第六实例中,第五实例的装置,其中元素的分层集合包括多个球面谐波系数。
在第七实例中,第五实例的装置,其中用于对元素的分层集合执行二维平移的装置包括用于当产生多个扬声器信道信号时对元素的分层集合执行基于二维矢量的振幅平移的装置,如上文关于图8A及8B的实例更详细地所描述。
在第八实例中,第一实例的装置,其进一步包括用于确定不同于所述多个物理扬声器中的对应一或多者的位置的一或多个经拉伸物理扬声器位置的装置,如上文关于图8A到12B的实例更详细地所描述。
在第九实例中,第一实例的装置,其进一步包括用于确定不同于所述多个物理扬声器中的对应一或多者的位置的一或多个经拉伸物理扬声器位置的装置,其中用于确定位置差的装置包括用于确定经拉伸物理扬声器位置中的至少一者相对于所述多个虚拟扬声器中的所述一者的位置之间的差的装置,如上文关于图8A到12B的实例更详细地所描述。
在第十实例中,第一实例的装置,其进一步包括用于确定不同于所述多个物理扬声器中的对应一或多者的位置的一或多个经拉伸物理扬声器位置的装置,其中用于确定位置差的装置包括用于确定经拉伸物理扬声器位置中的至少一者与所述多个虚拟扬声器中的所述一者的位置之间的高度差的装置,且其中用于调整所述多个虚拟扬声器中的所述一者的位置的装置包括用于当所确定的高度差超过阈值时将所述多个虚拟扬声器中的所述一者投影到比所述多个虚拟扬声器的原始高度低的高度的装置,如上文关于图8A到12B及14A到16B的实例更详细地所描述。
在第十一实例中,第一实例的装置,其进一步包括用于确定不同于所述多个物理扬声器中的对应一或多者的位置的一或多个经拉伸物理扬声器位置的装置,其中用于确定位置差的装置包括用于确定经拉伸物理扬声器位置中的至少一者与所述多个虚拟扬声器中的所述一者的位置之间的高度差的装置,且其中用于调整所述多个虚拟扬声器中的所述一者的位置的装置包括用于当所确定的高度差超过阈值时将所述多个虚拟扬声器中的所述一者投影到比所述多个虚拟扬声器的原始高度高的高度的装置,如上文关于图8A到12B及14A到16B的实例更详细地所描述。
在第十二实例中,第一实例的装置,其中所述多个虚拟扬声器是按球面几何学布置,如上文关于图8A到12B及14A到16B的实例更详细地所描述。
在第十三实例中,第一实例的装置,其中所述多个虚拟扬声器是按多面体几何学布置。虽然为了易于说明目的而未在由本发明的图1到17说明的实例中的任一者中展示,但所述技术可关于任一虚拟扬声器几何学执行,包含任一形式的多面体几何学,诸如,立方体几何学、十二面体几何学、三十二面体几何学、菱形三十面体几何学、棱镜几何学及金字塔几何学(提供几个实例)。
在第十四实例中,第一实例的装置,其中所述多个物理扬声器是按不规则扬声器几何学布置。
在第十五实例中,第一实例的装置,其中所述多个物理扬声器是按不规则扬声器几何学布置于多个不同水平平面上。
应理解,取决于实例,本文中描述的方法中的任何者的某些动作或事件可按不同序列执行,可添加、合并或全部省去(例如,对于方法的实践,并非所有描述的动作或事件皆为必要的)。此外,在某些实例中,动作或事件可(例如)经由多线程处理、中断处理或多个处理器同时而非依序执行。此外,虽然为了清晰起见,本发明的某些方面经描述为由单一装置、模块或单元执行,但应理解,本发明的技术可由装置、单元或模块的组合来执行。
在一或多个实例中,所描述的功能可以硬件、软件、固件或其任何组合来实施。如果以软件来实施,那么所述功能可作为一或多个指令或代码而存储于计算机可读媒体上或经由计算机可读媒体而发射,且可由基于硬件的处理单元执行。计算机可读媒体可包含计算机可读存储媒体(其对应于诸如数据存储媒体的有形媒体)或通信媒体,通信媒体包含(例如)根据通信协议有助于计算机程序从一处转移到另一处的任何媒体。
以此方式,计算机可读媒体通常可对应于(1)非暂时性的有形计算机可读存储媒体,或(2)诸如信号或载波的通信媒体。数据存储媒体可为可由一或多个计算机或一或多个处理器存取以检索用于在本发明中描述的技术的实施的指令、代码及/或数据结构的任何可用媒体。计算机程序产品可包含计算机可读媒体。
作为实例而非限制,这些计算机可读存储媒体可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装置、闪速存储器,或可用以存储呈指令或数据结构的形式的所要程序代码且可由计算机存取的任何其它媒体。而且,将任何连接恰当地称为计算机可读媒体。举例来说,如果使用同轴电缆、光缆、双绞线、数字用户线(DSL)或无线技术(诸如,红外线、无线电及微波)而从网站、服务器或其它远程源发射指令,那么同轴电缆、光缆、双绞线、DSL或无线技术(诸如,红外线、无线电及微波)包含于媒体的定义中。
然而,应理解,计算机可读存储媒体及数据存储媒体不包含连接件、载波、信号或其它暂时性媒体,而是涉及非暂时性有形存储媒体。如本文中所使用,磁盘及光盘包含压缩光盘(CD)、激光光盘、光学光盘、数字多功能光盘(DVD)、软盘及蓝光光盘,其中磁盘通常以磁性方式重现数据,而光盘通过激光以光学方式重现数据。以上各者的组合也应包含于计算机可读媒体的范围内。
指令可由一或多个处理器执行,诸如,一或多个数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)或其它等效集成或离散逻辑电路。因此,如本文中所使用的术语“处理器”可指前述结构或适合于实施本文中所描述的技术的任何其它结构中的任一者。此外,在一些方面中,本文中所描述的功能性可提供于经配置用于编码及解码的专用硬件及/或软件模块内,或被并入于组合式编码解码器中。同样,所述技术可完全地实施于一或多个电路或逻辑元件中。
本发明的技术可实施于各种各样的装置或设备中,包含无线手机、集成电路(IC)或IC的集合(例如,芯片集)。各种组件、模块或单元在本发明中经描述以强调经配置以执行所揭示的技术的装置的功能方面,但未必需要通过不同硬件单元实现。更确切地,如上文所描述,各种单元可组合于编码解码器硬件单元中或由互操作的硬件单元(包含如上文所描述的一或多个处理器)结合合适的软件及/或固件的集合提供。
已描述了所述技术的各种实施例。这些及其它实施例处于所附权利要求书的范围内。
Claims (30)
1.一种方法,其包括:
确定用于表示声场的球面谐波系数的播放的一或多个扬声器的本地扬声器几何学;及
基于所述本地扬声器几何学确定二维或三维渲染器。
2.根据权利要求1所述的方法,其进一步包括使用所述所确定的二维或三维渲染器渲染所述球面谐波系数以产生多信道音频数据。
3.根据权利要求1所述的方法,其中基于所述本地扬声器几何学确定所述二维或三维渲染器包括当所述本地扬声器几何学与立体声扬声器几何学一致时确定二维立体声渲染器。
4.根据权利要求1所述的方法,其中基于所述本地扬声器几何学确定所述二维或三维渲染器包括当所述本地扬声器几何学与具有两个以上扬声器的水平多信道扬声器几何学一致时确定水平二维多信道渲染器。
5.根据权利要求4所述的方法,其中确定所述水平二维多信道渲染器包括当所述所确定的本地扬声器几何学指示不规则扬声器几何学时确定不规则水平二维多信道渲染器。
6.根据权利要求4所述的方法,其中确定所述水平二维多信道渲染器包括当所述所确定的本地扬声器几何学指示规则扬声器几何学时确定规则水平二维多信道渲染器。
7.根据权利要求1所述的方法,其中基于所述本地扬声器几何学确定所述二维或三维渲染器包括当所述本地扬声器几何学与在一个以上水平平面上具有两个以上扬声器的三维多信道扬声器几何学一致时确定三维多信道渲染器。
8.根据权利要求7所述的方法,其中确定所述三维多信道渲染器包括当所述所确定的本地扬声器几何学指示不规则扬声器几何学时确定不规则三维多信道渲染器。
9.根据权利要求7所述的方法,其中确定所述三维多信道渲染器包括当所述所确定的本地扬声器几何学指示几乎规则扬声器几何学时确定几乎规则三维多信道渲染器。
10.根据权利要求7所述的方法,其中确定所述三维多信道渲染器包括当所述所确定的本地扬声器几何学指示规则扬声器几何学时确定规则三维多信道渲染器。
11.根据权利要求1所述的方法,其中确定所述渲染器包括:
确定与所述球面谐波系数相关联的球面基函数的允许阶,所述允许阶识别在给出所述所确定的本地扬声器几何学的情况下在所述球面谐波系数中的需要渲染的那些球面谐波系数;及
基于所述所确定的允许阶确定所述渲染器。
12.根据权利要求1所述的方法,其中确定所述二维或三维渲染器包括:
确定与所述球面谐波系数相关联的球面基函数的允许阶,所述允许阶识别在给出所述所确定的本地扬声器几何学的情况下在所述球面谐波系数中的需要渲染的那些球面谐波系数;及
确定所述二维或三维渲染器,使得所述二维或三维渲染器仅渲染所述球面谐波系数中的与阶小于或等于所述所确定的允许阶的球面基函数相关联的那些球面谐波系数。
13.根据权利要求1所述的方法,其中确定所述一或多个扬声器的所述本地扬声器几何学包括从收听者接收指定描述所述本地扬声器几何学的本地扬声器几何学信息的输入。
14.根据权利要求1所述的方法,其中基于所述本地扬声器几何学确定所述二维或三维渲染器包括当所述本地扬声器几何学与单声道扬声器几何学一致时确定单声道渲染器。
15.一种装置,其包括:
一或多个处理器,其经配置以确定用于表示声场的球面谐波系数的播放的一或多个扬声器的本地扬声器几何学,及配置所述装置以基于所述所确定的本地扬声器几何学进行操作。
16.根据权利要求15所述的装置,其中所述一或多个处理器经进一步配置以当配置所述装置以基于所述所确定的本地扬声器几何学进行操作时基于所述本地扬声器几何学确定二维或三维渲染器,及配置所述装置以根据所述所确定的二维或三维渲染器进行操作。
17.根据权利要求16所述的装置,其中所述一或多个处理器经进一步配置以使用所述所确定的二维或三维渲染器渲染所述球面谐波系数以产生多信道音频数据。
18.根据权利要求16所述的装置,其中所述一或多个处理器经进一步配置以当基于所述本地扬声器几何学确定所述二维或三维渲染器时在所述本地扬声器几何学与立体声扬声器几何学一致时确定二维立体声渲染器。
19.根据权利要求16所述的装置,其中所述一或多个处理器经进一步配置以当基于所述本地扬声器几何学确定所述二维或三维渲染器时在所述本地扬声器几何学与具有两个以上扬声器的水平多信道扬声器几何学一致时确定水平二维多信道渲染器。
20.根据权利要求19所述的装置,其中所述一或多个处理器经进一步配置以当确定所述水平二维多信道渲染器时在所述所确定的本地扬声器几何学指示不规则扬声器几何学时确定不规则水平二维多信道渲染器。
21.根据权利要求19所述的装置,其中所述一或多个处理器经进一步配置以当确定所述水平二维多信道渲染器时在所述所确定的本地扬声器几何学指示规则扬声器几何学时确定规则水平二维多信道渲染器。
22.根据权利要求16所述的装置,其中所述一或多个处理器经进一步配置以当基于所述本地扬声器几何学确定所述二维或三维渲染器时在所述本地扬声器几何学与在一个以上水平平面上具有两个以上扬声器的三维多信道扬声器几何学一致时确定三维多信道渲染器。
23.根据权利要求22所述的装置,其中所述一或多个处理器经进一步配置以当确定所述三维多信道渲染器时在所述所确定的本地扬声器几何学指示不规则扬声器几何学时确定不规则三维多信道渲染器。
24.根据权利要求22所述的装置,其中所述一或多个处理器经进一步配置以当确定所述三维多信道渲染器时在所述所确定的本地扬声器几何学指示几乎规则扬声器几何学时确定几乎规则三维多信道渲染器。
25.根据权利要求22所述的装置,其中所述一或多个处理器经进一步配置以当确定所述三维多信道渲染器时在所述所确定的本地扬声器几何学指示规则扬声器几何学时确定规则三维多信道渲染器。
26.根据权利要求16所述的装置,其中所述一或多个处理器经进一步配置以当确定所述渲染器时确定与所述球面谐波系数相关联的球面基函数的允许阶,所述允许阶识别在给出所述所确定的本地扬声器几何学的情况下在所述球面谐波系数中的需要渲染的那些球面谐波系数,及基于所述所确定的允许阶确定所述渲染器。
27.根据权利要求16所述的装置,其中所述一或多个处理器经进一步配置以当确定所述二维或三维渲染器时确定与所述球面谐波系数相关联的球面基函数的允许阶,所述允许阶识别在给出所述所确定的本地扬声器几何学的情况下在所述球面谐波系数中的需要渲染的那些球面谐波系数,及确定所述二维或三维渲染器,使得所述二维或三维渲染器仅渲染所述球面谐波系数中的与阶小于或等于所述所确定的允许阶的球面基函数相关联的那些球面谐波系数。
28.根据权利要求16所述的装置,其中所述一或多个处理器经进一步配置以当确定所述一或多个扬声器的所述本地扬声器几何学时从收听者接收指定描述所述本地扬声器几何学的本地扬声器几何学信息的输入。
29.根据权利要求16所述的装置,其中所述一或多个处理器经进一步配置以当基于所述本地扬声器几何学确定所述二维或三维渲染器时在所述本地扬声器几何学与单声道扬声器几何学一致时确定单声道渲染器。
30.一种非暂时性计算机可读存储媒体,其上存储有指令,所述指令在执行时致使一或多个处理器:
确定用于表示声场的球面谐波系数的播放的一或多个扬声器的本地扬声器几何学;及
基于所述本地扬声器几何学确定二维或三维渲染器。
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361762302P | 2013-02-07 | 2013-02-07 | |
US61/762,302 | 2013-02-07 | ||
US201361829832P | 2013-05-31 | 2013-05-31 | |
US61/829,832 | 2013-05-31 | ||
US14/174,784 | 2014-02-06 | ||
US14/174,784 US9736609B2 (en) | 2013-02-07 | 2014-02-06 | Determining renderers for spherical harmonic coefficients |
PCT/US2014/015311 WO2014124264A1 (en) | 2013-02-07 | 2014-02-07 | Determining renderers for spherical harmonic coefficients |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104956695A true CN104956695A (zh) | 2015-09-30 |
CN104956695B CN104956695B (zh) | 2017-06-06 |
Family
ID=51259222
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201480006477.9A Expired - Fee Related CN104956695B (zh) | 2013-02-07 | 2014-02-07 | 确定用于球面谐波系数的渲染器的方法和装置 |
CN201480007510.XA Expired - Fee Related CN104969577B (zh) | 2013-02-07 | 2014-02-07 | 将虚拟扬声器映射到物理扬声器 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201480007510.XA Expired - Fee Related CN104969577B (zh) | 2013-02-07 | 2014-02-07 | 将虚拟扬声器映射到物理扬声器 |
Country Status (7)
Country | Link |
---|---|
US (2) | US9736609B2 (zh) |
EP (2) | EP2954703B1 (zh) |
JP (2) | JP6284955B2 (zh) |
KR (2) | KR101877604B1 (zh) |
CN (2) | CN104956695B (zh) |
TW (2) | TWI538531B (zh) |
WO (2) | WO2014124268A1 (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108476371A (zh) * | 2016-01-04 | 2018-08-31 | 哈曼贝克自动系统股份有限公司 | 声波场生成 |
CN110771181A (zh) * | 2017-05-15 | 2020-02-07 | 杜比实验室特许公司 | 用于将空间音频格式转换为扬声器信号的方法、系统和设备 |
CN112154676A (zh) * | 2018-01-30 | 2020-12-29 | 弗劳恩霍夫应用研究促进协会 | 转换音频对象的对象位置的设备、音频流供应器、音频内容产生系统、音频播放设备、方法及计算机程序 |
US11304003B2 (en) | 2016-01-04 | 2022-04-12 | Harman Becker Automotive Systems Gmbh | Loudspeaker array |
US11463836B2 (en) | 2018-05-22 | 2022-10-04 | Sony Corporation | Information processing apparatus and information processing method |
Families Citing this family (111)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8483853B1 (en) | 2006-09-12 | 2013-07-09 | Sonos, Inc. | Controlling and manipulating groupings in a multi-zone media system |
US8788080B1 (en) | 2006-09-12 | 2014-07-22 | Sonos, Inc. | Multi-channel pairing in a media system |
US9202509B2 (en) | 2006-09-12 | 2015-12-01 | Sonos, Inc. | Controlling and grouping in a multi-zone media system |
US8923997B2 (en) | 2010-10-13 | 2014-12-30 | Sonos, Inc | Method and apparatus for adjusting a speaker system |
US11429343B2 (en) | 2011-01-25 | 2022-08-30 | Sonos, Inc. | Stereo playback configuration and control |
US11265652B2 (en) | 2011-01-25 | 2022-03-01 | Sonos, Inc. | Playback device pairing |
US8938312B2 (en) | 2011-04-18 | 2015-01-20 | Sonos, Inc. | Smart line-in processing |
US9042556B2 (en) | 2011-07-19 | 2015-05-26 | Sonos, Inc | Shaping sound responsive to speaker orientation |
US8811630B2 (en) | 2011-12-21 | 2014-08-19 | Sonos, Inc. | Systems, methods, and apparatus to filter audio |
US9084058B2 (en) | 2011-12-29 | 2015-07-14 | Sonos, Inc. | Sound field calibration using listener localization |
US9729115B2 (en) | 2012-04-27 | 2017-08-08 | Sonos, Inc. | Intelligently increasing the sound level of player |
US9524098B2 (en) | 2012-05-08 | 2016-12-20 | Sonos, Inc. | Methods and systems for subwoofer calibration |
USD721352S1 (en) | 2012-06-19 | 2015-01-20 | Sonos, Inc. | Playback device |
US9219460B2 (en) | 2014-03-17 | 2015-12-22 | Sonos, Inc. | Audio settings based on environment |
US9106192B2 (en) | 2012-06-28 | 2015-08-11 | Sonos, Inc. | System and method for device playback calibration |
US9690271B2 (en) | 2012-06-28 | 2017-06-27 | Sonos, Inc. | Speaker calibration |
US9690539B2 (en) | 2012-06-28 | 2017-06-27 | Sonos, Inc. | Speaker calibration user interface |
US9668049B2 (en) | 2012-06-28 | 2017-05-30 | Sonos, Inc. | Playback device calibration user interfaces |
US9706323B2 (en) | 2014-09-09 | 2017-07-11 | Sonos, Inc. | Playback device calibration |
US9288603B2 (en) | 2012-07-15 | 2016-03-15 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for backward-compatible audio coding |
US9473870B2 (en) * | 2012-07-16 | 2016-10-18 | Qualcomm Incorporated | Loudspeaker position compensation with 3D-audio hierarchical coding |
US8930005B2 (en) | 2012-08-07 | 2015-01-06 | Sonos, Inc. | Acoustic signatures in a playback system |
US8965033B2 (en) | 2012-08-31 | 2015-02-24 | Sonos, Inc. | Acoustic optimization |
US9008330B2 (en) | 2012-09-28 | 2015-04-14 | Sonos, Inc. | Crossover frequency adjustments for audio speakers |
US9736609B2 (en) | 2013-02-07 | 2017-08-15 | Qualcomm Incorporated | Determining renderers for spherical harmonic coefficients |
EP2765791A1 (en) * | 2013-02-08 | 2014-08-13 | Thomson Licensing | Method and apparatus for determining directions of uncorrelated sound sources in a higher order ambisonics representation of a sound field |
USD721061S1 (en) | 2013-02-25 | 2015-01-13 | Sonos, Inc. | Playback device |
RU2769677C2 (ru) | 2013-04-26 | 2022-04-04 | Сони Корпорейшн | Способ и устройство обработки звука |
EP2991383B1 (en) | 2013-04-26 | 2021-01-27 | Sony Corporation | Audio processing device and audio processing system |
US9412385B2 (en) * | 2013-05-28 | 2016-08-09 | Qualcomm Incorporated | Performing spatial masking with respect to spherical harmonic coefficients |
US9466305B2 (en) | 2013-05-29 | 2016-10-11 | Qualcomm Incorporated | Performing positional analysis to code spherical harmonic coefficients |
US9495968B2 (en) | 2013-05-29 | 2016-11-15 | Qualcomm Incorporated | Identifying sources from which higher order ambisonic audio data is generated |
CN105379311B (zh) * | 2013-07-24 | 2018-01-16 | 索尼公司 | 信息处理设备以及信息处理方法 |
EP3056025B1 (en) * | 2013-10-07 | 2018-04-25 | Dolby Laboratories Licensing Corporation | Spatial audio processing system and method |
KR102231755B1 (ko) | 2013-10-25 | 2021-03-24 | 삼성전자주식회사 | 입체 음향 재생 방법 및 장치 |
US9489955B2 (en) | 2014-01-30 | 2016-11-08 | Qualcomm Incorporated | Indicating frame parameter reusability for coding vectors |
US9922656B2 (en) | 2014-01-30 | 2018-03-20 | Qualcomm Incorporated | Transitioning of ambient higher-order ambisonic coefficients |
US9226073B2 (en) | 2014-02-06 | 2015-12-29 | Sonos, Inc. | Audio output balancing during synchronized playback |
US9226087B2 (en) | 2014-02-06 | 2015-12-29 | Sonos, Inc. | Audio output balancing during synchronized playback |
US9264839B2 (en) | 2014-03-17 | 2016-02-16 | Sonos, Inc. | Playback device configuration based on proximity detection |
US10412522B2 (en) | 2014-03-21 | 2019-09-10 | Qualcomm Incorporated | Inserting audio channels into descriptions of soundfields |
WO2015147435A1 (ko) * | 2014-03-25 | 2015-10-01 | 인텔렉추얼디스커버리 주식회사 | 오디오 신호 처리 시스템 및 방법 |
US9620137B2 (en) | 2014-05-16 | 2017-04-11 | Qualcomm Incorporated | Determining between scalar and vector quantization in higher order ambisonic coefficients |
US10770087B2 (en) | 2014-05-16 | 2020-09-08 | Qualcomm Incorporated | Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals |
US9852737B2 (en) | 2014-05-16 | 2017-12-26 | Qualcomm Incorporated | Coding vectors decomposed from higher-order ambisonics audio signals |
US9367283B2 (en) | 2014-07-22 | 2016-06-14 | Sonos, Inc. | Audio settings |
USD883956S1 (en) | 2014-08-13 | 2020-05-12 | Sonos, Inc. | Playback device |
US9891881B2 (en) | 2014-09-09 | 2018-02-13 | Sonos, Inc. | Audio processing algorithm database |
US10127006B2 (en) | 2014-09-09 | 2018-11-13 | Sonos, Inc. | Facilitating calibration of an audio playback device |
US9952825B2 (en) | 2014-09-09 | 2018-04-24 | Sonos, Inc. | Audio processing algorithms |
US9910634B2 (en) | 2014-09-09 | 2018-03-06 | Sonos, Inc. | Microphone calibration |
US9747910B2 (en) | 2014-09-26 | 2017-08-29 | Qualcomm Incorporated | Switching between predictive and non-predictive quantization techniques in a higher order ambisonics (HOA) framework |
RU2704266C2 (ru) | 2014-10-31 | 2019-10-25 | Долби Интернешнл Аб | Параметрическое кодирование и декодирование многоканальных аудиосигналов |
EP3141002B1 (en) * | 2014-11-11 | 2020-01-08 | Google LLC | Virtual sound systems and methods |
EP3024253A1 (en) * | 2014-11-21 | 2016-05-25 | Harman Becker Automotive Systems GmbH | Audio system and method |
US9973851B2 (en) | 2014-12-01 | 2018-05-15 | Sonos, Inc. | Multi-channel playback of audio content |
US10664224B2 (en) | 2015-04-24 | 2020-05-26 | Sonos, Inc. | Speaker calibration user interface |
WO2016172593A1 (en) | 2015-04-24 | 2016-10-27 | Sonos, Inc. | Playback device calibration user interfaces |
USD920278S1 (en) | 2017-03-13 | 2021-05-25 | Sonos, Inc. | Media playback device with lights |
US20170085972A1 (en) | 2015-09-17 | 2017-03-23 | Sonos, Inc. | Media Player and Media Player Design |
USD906278S1 (en) | 2015-04-25 | 2020-12-29 | Sonos, Inc. | Media player device |
USD768602S1 (en) | 2015-04-25 | 2016-10-11 | Sonos, Inc. | Playback device |
USD886765S1 (en) | 2017-03-13 | 2020-06-09 | Sonos, Inc. | Media playback device |
US10248376B2 (en) | 2015-06-11 | 2019-04-02 | Sonos, Inc. | Multiple groupings in a playback system |
US10334387B2 (en) | 2015-06-25 | 2019-06-25 | Dolby Laboratories Licensing Corporation | Audio panning transformation system and method |
US9729118B2 (en) | 2015-07-24 | 2017-08-08 | Sonos, Inc. | Loudness matching |
US9538305B2 (en) | 2015-07-28 | 2017-01-03 | Sonos, Inc. | Calibration error conditions |
WO2017017262A1 (en) * | 2015-07-30 | 2017-02-02 | Dolby International Ab | Method and apparatus for generating from an hoa signal representation a mezzanine hoa signal representation |
US9712912B2 (en) | 2015-08-21 | 2017-07-18 | Sonos, Inc. | Manipulation of playback device response using an acoustic filter |
US9736610B2 (en) | 2015-08-21 | 2017-08-15 | Sonos, Inc. | Manipulation of playback device response using signal processing |
US9693165B2 (en) | 2015-09-17 | 2017-06-27 | Sonos, Inc. | Validation of audio calibration using multi-dimensional motion check |
EP3351015B1 (en) | 2015-09-17 | 2019-04-17 | Sonos, Inc. | Facilitating calibration of an audio playback device |
WO2017079334A1 (en) | 2015-11-03 | 2017-05-11 | Dolby Laboratories Licensing Corporation | Content-adaptive surround sound virtualization |
CN105392102B (zh) * | 2015-11-30 | 2017-07-25 | 武汉大学 | 用于非球面扬声器阵列的三维音频信号生成方法及系统 |
US9743207B1 (en) | 2016-01-18 | 2017-08-22 | Sonos, Inc. | Calibration using multiple recording devices |
US11106423B2 (en) | 2016-01-25 | 2021-08-31 | Sonos, Inc. | Evaluating calibration of a playback device |
US10003899B2 (en) | 2016-01-25 | 2018-06-19 | Sonos, Inc. | Calibration with particular locations |
US9886234B2 (en) | 2016-01-28 | 2018-02-06 | Sonos, Inc. | Systems and methods of distributing audio to one or more playback devices |
DE102016103209A1 (de) | 2016-02-24 | 2017-08-24 | Visteon Global Technologies, Inc. | System und Verfahren zur Positionserkennung von Lautsprechern und zur Wiedergabe von Audiosignalen als Raumklang |
US9864574B2 (en) | 2016-04-01 | 2018-01-09 | Sonos, Inc. | Playback device calibration based on representation spectral characteristics |
US9860662B2 (en) | 2016-04-01 | 2018-01-02 | Sonos, Inc. | Updating playback device configuration information based on calibration data |
US9763018B1 (en) | 2016-04-12 | 2017-09-12 | Sonos, Inc. | Calibration of audio playback devices |
FR3050601B1 (fr) * | 2016-04-26 | 2018-06-22 | Arkamys | Procede et systeme de diffusion d'un signal audio a 360° |
US9860670B1 (en) | 2016-07-15 | 2018-01-02 | Sonos, Inc. | Spectral correction using spatial calibration |
US9794710B1 (en) | 2016-07-15 | 2017-10-17 | Sonos, Inc. | Spatial audio correction |
US10372406B2 (en) | 2016-07-22 | 2019-08-06 | Sonos, Inc. | Calibration interface |
US10459684B2 (en) | 2016-08-05 | 2019-10-29 | Sonos, Inc. | Calibration of a playback device based on an estimated frequency response |
USD827671S1 (en) | 2016-09-30 | 2018-09-04 | Sonos, Inc. | Media playback device |
USD851057S1 (en) | 2016-09-30 | 2019-06-11 | Sonos, Inc. | Speaker grill with graduated hole sizing over a transition area for a media device |
US10412473B2 (en) | 2016-09-30 | 2019-09-10 | Sonos, Inc. | Speaker grill with graduated hole sizing over a transition area for a media device |
US10712997B2 (en) | 2016-10-17 | 2020-07-14 | Sonos, Inc. | Room association based on name |
KR20190091445A (ko) | 2016-10-19 | 2019-08-06 | 오더블 리얼리티 아이엔씨. | 오디오 이미지를 생성하는 시스템 및 방법 |
US11012803B2 (en) * | 2017-01-27 | 2021-05-18 | Auro Technologies Nv | Processing method and system for panning audio objects |
JP6543848B2 (ja) * | 2017-03-29 | 2019-07-17 | 本田技研工業株式会社 | 音声処理装置、音声処理方法及びプログラム |
US10015618B1 (en) * | 2017-08-01 | 2018-07-03 | Google Llc | Incoherent idempotent ambisonics rendering |
US10609485B2 (en) | 2017-09-29 | 2020-03-31 | Apple Inc. | System and method for performing panning for an arbitrary loudspeaker setup |
WO2020030304A1 (en) * | 2018-08-09 | 2020-02-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | An audio processor and a method considering acoustic obstacles and providing loudspeaker signals |
US10299061B1 (en) | 2018-08-28 | 2019-05-21 | Sonos, Inc. | Playback device calibration |
US11206484B2 (en) | 2018-08-28 | 2021-12-21 | Sonos, Inc. | Passive speaker authentication |
WO2020044244A1 (en) | 2018-08-29 | 2020-03-05 | Audible Reality Inc. | System for and method of controlling a three-dimensional audio engine |
US11798569B2 (en) * | 2018-10-02 | 2023-10-24 | Qualcomm Incorporated | Flexible rendering of audio data |
US10739726B2 (en) | 2018-10-03 | 2020-08-11 | International Business Machines Corporation | Audio management for holographic objects |
KR102323529B1 (ko) | 2018-12-17 | 2021-11-09 | 한국전자통신연구원 | 복합 차수 앰비소닉을 이용한 오디오 신호 처리 방법 및 장치 |
CN113615213A (zh) | 2019-03-29 | 2021-11-05 | 索尼集团公司 | 装置和方法 |
CA3135849A1 (en) | 2019-04-02 | 2020-10-08 | Syng, Inc. | Systems and methods for spatial audio rendering |
US11122386B2 (en) * | 2019-06-20 | 2021-09-14 | Qualcomm Incorporated | Audio rendering for low frequency effects |
US10734965B1 (en) | 2019-08-12 | 2020-08-04 | Sonos, Inc. | Audio calibration of a portable playback device |
CN110751956B (zh) * | 2019-09-17 | 2022-04-26 | 北京时代拓灵科技有限公司 | 一种沉浸式音频渲染方法及系统 |
CN115715470A (zh) * | 2019-12-30 | 2023-02-24 | 卡姆希尔公司 | 用于提供空间化声场的方法 |
US11246001B2 (en) | 2020-04-23 | 2022-02-08 | Thx Ltd. | Acoustic crosstalk cancellation and virtual speakers techniques |
US11750971B2 (en) | 2021-03-11 | 2023-09-05 | Nanning Fulian Fugui Precision Industrial Co., Ltd. | Three-dimensional sound localization method, electronic device and computer readable storage |
Family Cites Families (43)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB9204485D0 (en) | 1992-03-02 | 1992-04-15 | Trifield Productions Ltd | Surround sound apparatus |
US6072878A (en) | 1997-09-24 | 2000-06-06 | Sonic Solutions | Multi-channel surround sound mastering and reproduction techniques that preserve spatial harmonics |
CA2406926A1 (en) | 2000-04-19 | 2001-11-01 | Sonic Solutions | Multi-channel surround sound mastering and reproduction techniques that preserve spatial harmonics in three dimensions |
JP3624805B2 (ja) | 2000-07-21 | 2005-03-02 | ヤマハ株式会社 | 音像定位装置 |
US7113610B1 (en) | 2002-09-10 | 2006-09-26 | Microsoft Corporation | Virtual sound source positioning |
FR2847376B1 (fr) | 2002-11-19 | 2005-02-04 | France Telecom | Procede de traitement de donnees sonores et dispositif d'acquisition sonore mettant en oeuvre ce procede |
US20040264704A1 (en) | 2003-06-13 | 2004-12-30 | Camille Huin | Graphical user interface for determining speaker spatialization parameters |
US8054980B2 (en) * | 2003-09-05 | 2011-11-08 | Stmicroelectronics Asia Pacific Pte, Ltd. | Apparatus and method for rendering audio information to virtualize speakers in an audio system |
GB0419346D0 (en) | 2004-09-01 | 2004-09-29 | Smyth Stephen M F | Method and apparatus for improved headphone virtualisation |
US7928311B2 (en) | 2004-12-01 | 2011-04-19 | Creative Technology Ltd | System and method for forming and rendering 3D MIDI messages |
JP2008118166A (ja) | 2005-06-30 | 2008-05-22 | Pioneer Electronic Corp | スピーカエンクロージャ、これを備えたスピーカシステムおよび多チャンネルステレオシステム |
US7693709B2 (en) | 2005-07-15 | 2010-04-06 | Microsoft Corporation | Reordering coefficients for waveform coding or decoding |
JP4674505B2 (ja) | 2005-08-01 | 2011-04-20 | ソニー株式会社 | 音声信号処理方法、音場再現システム |
EP1992198B1 (fr) | 2006-03-09 | 2016-07-20 | Orange | Optimisation d'une spatialisation sonore binaurale a partir d'un encodage multicanal |
DE102006053919A1 (de) * | 2006-10-11 | 2008-04-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen einer Anzahl von Lautsprechersignalen für ein Lautsprecher-Array, das einen Wiedergaberaum definiert |
DE102007059597A1 (de) | 2007-09-19 | 2009-04-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Eine Vorrichtung und ein Verfahren zur Ermittlung eines Komponentensignals in hoher Genauigkeit |
EP2056627A1 (en) | 2007-10-30 | 2009-05-06 | SonicEmotion AG | Method and device for improved sound field rendering accuracy within a preferred listening area |
JP4338102B1 (ja) | 2008-08-25 | 2009-10-07 | 薫 長山 | スピーカーシステム |
US8391500B2 (en) * | 2008-10-17 | 2013-03-05 | University Of Kentucky Research Foundation | Method and system for creating three-dimensional spatial audio |
ES2733878T3 (es) | 2008-12-15 | 2019-12-03 | Orange | Codificación mejorada de señales de audio digitales multicanales |
EP2205007B1 (en) * | 2008-12-30 | 2019-01-09 | Dolby International AB | Method and apparatus for three-dimensional acoustic field encoding and optimal reconstruction |
GB2476747B (en) | 2009-02-04 | 2011-12-21 | Richard Furse | Sound system |
WO2010092014A2 (en) * | 2009-02-11 | 2010-08-19 | Basf Se | Pesticidal mixtures |
GB0906269D0 (en) * | 2009-04-09 | 2009-05-20 | Ntnu Technology Transfer As | Optimal modal beamformer for sensor arrays |
JP2010252220A (ja) * | 2009-04-20 | 2010-11-04 | Nippon Hoso Kyokai <Nhk> | 3次元音響パンニング装置およびそのプログラム |
US8971551B2 (en) | 2009-09-18 | 2015-03-03 | Dolby International Ab | Virtual bass synthesis using harmonic transposition |
JP5773540B2 (ja) * | 2009-10-07 | 2015-09-02 | ザ・ユニバーシティ・オブ・シドニー | 記録された音場の再構築 |
US20110091055A1 (en) * | 2009-10-19 | 2011-04-21 | Broadcom Corporation | Loudspeaker localization techniques |
KR101755531B1 (ko) | 2010-03-26 | 2017-07-07 | 돌비 인터네셔널 에이비 | 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법 및 장치 |
WO2011152044A1 (ja) * | 2010-05-31 | 2011-12-08 | パナソニック株式会社 | 音響再生装置 |
ES2922639T3 (es) | 2010-08-27 | 2022-09-19 | Sennheiser Electronic Gmbh & Co Kg | Método y dispositivo para la reproducción mejorada de campo sonoro de señales de entrada de audio codificadas espacialmente |
EP2450880A1 (en) | 2010-11-05 | 2012-05-09 | Thomson Licensing | Data structure for Higher Order Ambisonics audio data |
JP2012104871A (ja) | 2010-11-05 | 2012-05-31 | Sony Corp | 音響制御装置及び音響制御方法 |
JP2014506416A (ja) | 2010-12-22 | 2014-03-13 | ジェノーディオ,インコーポレーテッド | オーディオ空間化および環境シミュレーション |
EP2541547A1 (en) * | 2011-06-30 | 2013-01-02 | Thomson Licensing | Method and apparatus for changing the relative positions of sound objects contained within a higher-order ambisonics representation |
MX2014008123A (es) | 2012-03-22 | 2014-10-17 | Dirac Res Ab | Diseño de controlador de precompensacion de audio usando un conjunto variable de bocinas de soporte. |
US9473870B2 (en) * | 2012-07-16 | 2016-10-18 | Qualcomm Incorporated | Loudspeaker position compensation with 3D-audio hierarchical coding |
EP4284026A3 (en) | 2012-07-16 | 2024-02-21 | Dolby International AB | Method and device for rendering an audio soundfield representation |
WO2014088328A1 (ko) * | 2012-12-04 | 2014-06-12 | 삼성전자 주식회사 | 오디오 제공 장치 및 오디오 제공 방법 |
US9736609B2 (en) | 2013-02-07 | 2017-08-15 | Qualcomm Incorporated | Determining renderers for spherical harmonic coefficients |
US9495968B2 (en) | 2013-05-29 | 2016-11-15 | Qualcomm Incorporated | Identifying sources from which higher order ambisonic audio data is generated |
EP2866475A1 (en) | 2013-10-23 | 2015-04-29 | Thomson Licensing | Method for and apparatus for decoding an audio soundfield representation for audio playback using 2D setups |
US20150264483A1 (en) | 2014-03-14 | 2015-09-17 | Qualcomm Incorporated | Low frequency rendering of higher-order ambisonic audio data |
-
2014
- 2014-02-06 US US14/174,784 patent/US9736609B2/en active Active
- 2014-02-06 US US14/174,775 patent/US9913064B2/en not_active Expired - Fee Related
- 2014-02-07 TW TW103104151A patent/TWI538531B/zh not_active IP Right Cessation
- 2014-02-07 TW TW103104152A patent/TWI611706B/zh not_active IP Right Cessation
- 2014-02-07 CN CN201480006477.9A patent/CN104956695B/zh not_active Expired - Fee Related
- 2014-02-07 EP EP14707870.3A patent/EP2954703B1/en active Active
- 2014-02-07 CN CN201480007510.XA patent/CN104969577B/zh not_active Expired - Fee Related
- 2014-02-07 JP JP2015557126A patent/JP6284955B2/ja not_active Expired - Fee Related
- 2014-02-07 EP EP14707033.8A patent/EP2954702B1/en active Active
- 2014-02-07 JP JP2015557125A patent/JP6309545B2/ja not_active Expired - Fee Related
- 2014-02-07 KR KR1020157023104A patent/KR101877604B1/ko active IP Right Grant
- 2014-02-07 KR KR1020157023103A patent/KR20150115822A/ko active IP Right Grant
- 2014-02-07 WO PCT/US2014/015315 patent/WO2014124268A1/en active Application Filing
- 2014-02-07 WO PCT/US2014/015311 patent/WO2014124264A1/en active Application Filing
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108476371A (zh) * | 2016-01-04 | 2018-08-31 | 哈曼贝克自动系统股份有限公司 | 声波场生成 |
US11304003B2 (en) | 2016-01-04 | 2022-04-12 | Harman Becker Automotive Systems Gmbh | Loudspeaker array |
CN110771181A (zh) * | 2017-05-15 | 2020-02-07 | 杜比实验室特许公司 | 用于将空间音频格式转换为扬声器信号的方法、系统和设备 |
CN110771181B (zh) * | 2017-05-15 | 2021-09-28 | 杜比实验室特许公司 | 用于将空间音频格式转换为扬声器信号的方法、系统和设备 |
US11277705B2 (en) | 2017-05-15 | 2022-03-15 | Dolby Laboratories Licensing Corporation | Methods, systems and apparatus for conversion of spatial audio format(s) to speaker signals |
CN112154676A (zh) * | 2018-01-30 | 2020-12-29 | 弗劳恩霍夫应用研究促进协会 | 转换音频对象的对象位置的设备、音频流供应器、音频内容产生系统、音频播放设备、方法及计算机程序 |
US11653162B2 (en) | 2018-01-30 | 2023-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatuses for converting an object position of an audio object, audio stream provider, audio content production system, audio playback apparatus, methods and computer programs |
US11463836B2 (en) | 2018-05-22 | 2022-10-04 | Sony Corporation | Information processing apparatus and information processing method |
Also Published As
Publication number | Publication date |
---|---|
WO2014124264A1 (en) | 2014-08-14 |
US20140219456A1 (en) | 2014-08-07 |
TWI538531B (zh) | 2016-06-11 |
EP2954702A1 (en) | 2015-12-16 |
EP2954702B1 (en) | 2019-06-05 |
JP2016509819A (ja) | 2016-03-31 |
KR101877604B1 (ko) | 2018-07-12 |
TW201436587A (zh) | 2014-09-16 |
EP2954703A1 (en) | 2015-12-16 |
EP2954703B1 (en) | 2019-12-18 |
JP2016509820A (ja) | 2016-03-31 |
WO2014124268A1 (en) | 2014-08-14 |
TWI611706B (zh) | 2018-01-11 |
US20140219455A1 (en) | 2014-08-07 |
CN104969577B (zh) | 2017-05-10 |
US9736609B2 (en) | 2017-08-15 |
KR20150115822A (ko) | 2015-10-14 |
KR20150115823A (ko) | 2015-10-14 |
CN104956695B (zh) | 2017-06-06 |
JP6284955B2 (ja) | 2018-02-28 |
CN104969577A (zh) | 2015-10-07 |
JP6309545B2 (ja) | 2018-04-11 |
US9913064B2 (en) | 2018-03-06 |
TW201436588A (zh) | 2014-09-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104956695A (zh) | 确定用于球面谐波系数的渲染器 | |
CN106797527B (zh) | Hoa内容的显示屏相关调适 | |
KR102092774B1 (ko) | 고차 앰비소닉 오디오 데이터의 스케일러블 코딩을 위한 시그널링 계층들 | |
KR102053508B1 (ko) | 고차 앰비소닉 오디오 데이터의 스케일러블 코딩을 위한 채널들의 시그널링 | |
US10070094B2 (en) | Screen related adaptation of higher order ambisonic (HOA) content | |
US20150264483A1 (en) | Low frequency rendering of higher-order ambisonic audio data | |
CN104981869A (zh) | 在位流中用信号表示音频渲染信息 | |
CN104471960A (zh) | 用于向后兼容音频译码的系统、方法、设备和计算机可读媒体 | |
WO2015143355A1 (en) | Inserting audio channels into descriptions of soundfields | |
CN114128312A (zh) | 用于低频效果的音频渲染 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20170606 Termination date: 20210207 |