CN102326417A - 三维声场编码及优化重建的方法及装置 - Google Patents

三维声场编码及优化重建的方法及装置 Download PDF

Info

Publication number
CN102326417A
CN102326417A CN2009801531950A CN200980153195A CN102326417A CN 102326417 A CN102326417 A CN 102326417A CN 2009801531950 A CN2009801531950 A CN 2009801531950A CN 200980153195 A CN200980153195 A CN 200980153195A CN 102326417 A CN102326417 A CN 102326417A
Authority
CN
China
Prior art keywords
group
stereo
track
high fidelity
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2009801531950A
Other languages
English (en)
Other versions
CN102326417B (zh
Inventor
安东尼奥·玛地欧斯·索列
保罗·阿卢密·奥宝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby International AB
Original Assignee
Pompei Fabra University Barcelona Media Foundation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pompei Fabra University Barcelona Media Foundation filed Critical Pompei Fabra University Barcelona Media Foundation
Publication of CN102326417A publication Critical patent/CN102326417A/zh
Application granted granted Critical
Publication of CN102326417B publication Critical patent/CN102326417B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/11Application of ambisonics in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明公开了一种无需依据展示设置即可将具有空间信息的音频信号编码的方法及装置,以及,对任何给定的展示设置做最优化译码及播放,将结合点区域做最大化,且包括在不同高度的扬声器及耳机的设置。需要精准的定位的音频部分被编码成一组具有相关方向性参数的单音轨,而剩余的音频则被编码成一组选定序列及混成的高逼真度立体声复制音轨。在一给定展示系统的规格中,通过对每一指定群组使用不同的译码方法,展示独立格式被译码以适应特定的系统。

Description

三维声场编码及优化重建的方法及装置
技术领域
本发明是关于一种改善三维声场编码、分布、及译码的技术,本发明尤其指一种无需依据展示(exhibition)设置即可将具有空间信息的音频信号编码的技术,以及最优化译码一给定的展示系统,其可为多扬声器设置或耳机。
背景技术
在多通道再生及收听中,一听众通常会被多组扬声器所环绕。建造一声场使听众可以感知音源的预期位置即为再生中的一个一般的目的,例如一乐团中一音乐演出者的位置。而不同的扬声器设置可以创造出不同的空间印象。例如,标准立体声设置可以正确地在两扬声器之间的空间再创出声音场景,但却无法达到离开两扬声器的角度的效果。
在更广的角度下,在听众周围设置更多的扬声器可达到更佳的空间印象。例如,多扬声器配置标准中最知名的5.1环绕声道(ITU-R775-1),其是由五个扬声器所构成,五个扬声器分别设置在听众的-30度、0度、30度、-110度、及110度方位角,而0度是为正向方位。然而,上述的设置并无法处理高于听众的水平面的声音。
为增加听众的环场体验,目前的主流做法为在不同的高度拓设多扬声器。例如一由日本NHK,Hamasak所发展出的22.2系统,其是由总共24个设置在3个不同高度的扬声器所构成。
对上述设置而言,现有产生专门应用的空间化音频的范例是提供每一再生中所用的通道一个音轨。例如,立体声设置需要两个音轨、而5.1声道则需要六个音轨等。这些音轨虽然也可由记录时期直接产生而广播,但正常来说是为后制时期的结果。在许多场合中,使用少数扬声器来产生完全相同的音频通道是值得注意的。这是5.1声道电影院剧场相当常见的,每一环绕声道是通过三个或多个扬声器重放。因此,在这些场合中,虽然扬声器的数目可能多于六个,但不同音频声道的数目仍然为六,而总共只有六个不同的信号被重放。
此种一通道一音轨范例的一个结果是其将记录时期及后制时期所完成的工作与即将展示内容的展示设置连结。在记录时期,例如广播,所使用麦克风的型式与位置以及其混合的方法是被决定为即将被再生的事件的函数。同样地,在媒体产生中,后制工程师需要知道即将展示内容的展示设置的细节,并留意所有的通道。若无法正确地设定展示多扬声器配置以显示合适的内容,将导致再生质量的下降。如果即将展示内容在不同的设置中,在后制中则需要创出不同的版本。如此将增加成本及时间上的浪费。
另一个一通道一音轨范例的结果是为数据量为必需。另一方面,若无进一步的编码,此范例需要与通道数一样多的音轨。另一方面,若提供不同的版本,其也会分开地提供,如此将再造成数据量的上升,或是需要将多声道信号混合成两声道之后输出,而危及输出结果的质量。
最后,另一个一通道一音轨范例的不利趋势是为,以上述的方法产生的内容并非为永不过时的技术。例如,一5.1声道设置所产出的一给定影片中所呈现的六音轨并不包含位于听众上方的音源,也无法与扬声器完全地拓设设置于不同高度。
最近则出现一些能提供展示系统独立空间化音频的技术。振幅平移(amplitude panning)或许是最简易的技术,例如所谓的向量振幅平移(vector based Amplitude panning,VBAP)。VBAP是基于将相同的单音信号馈入扬声器中,扬声器是靠近声源预计设置的位置,并对每一扬声器的音量做调整。此系统可在二维或三维(包括高度)设置中运作,通过分别选择二或三个靠近的扬声器。可提供一大的最佳结合点为此方法的一个优点,意味着扬声器设置中具有宽广的区域使得声音的感知就像从预计的方向而来一般。然而,此方法并不适用于例如在回声房中再生回声场,也不适用于高扩散性的音源。由音源所发出的声音的第一次反弹多半可由这些方法再生,但其结果的质量相当低落。
高逼真度立体声复制(Ambisonics)是为另一种能提供展示系统独立空间化音频的技术。此技术可追溯到70年代,由Michael Gerzon所提出。此技术是提供一完整的编码-译码链方法(encoding-decoding chainmethodology)。就编码而言,一组球状谐和声场是在一点上被保留。第0阶(W)是在该点对应至一全方向性麦克风所记录的信息。而第1阶是由三个信号(X,Y,Z)所构成,是在该点对应至三个八字型(figure-of-eight)麦克风,并与卡氏坐标所记录的信息对应。高阶信号是对应至具更复杂图案的麦克风所记录的信息。混合序列高逼真度立体声复制编码是存在,每一序列中仅有一些子集合的信号被使用。例如,在第1阶高逼真度立体声复制中仅使用W,X,Y信号而省略Z信号。虽然1阶以上信号的产生对后制或通过声场模拟而言相当容易,但当通过麦克风对声场编码则较困难;事实上,时至今日,只有麦克风可以有效的在专业应用上测量出第0阶及第1阶信号。第1阶高逼真度立体声复制麦克风的实例有如Soundfield或最近的TetraMic。就解码而言,当多扬声器设置已被确认(每一扬声器的位置与数目),将被馈入至每一扬声器的信号是由完整设置所产生的声场的需求而决定,完整设置所产生的声场是与预期声场几乎近似(由后制所产生、或由记录该信号之处中二者之一)。除了展示系统的独立以外,此技术的其它优点是为其所提供的高阶操作(基本上为声景的旋转及缩放),且其能准确地记录回声场。
然而,高逼真度立体声复制技术是具有两个主要的缺点:其一为无法再生窄频音源;其二为结合点尺寸小。在本文中所用的窄频(narrow)及传播(spread)音源的概念是可视为所提及的感知声音影像的角度宽幅。第一个缺点是由于:即使试图要产生一个非常窄频的音源时,高逼真度立体声复制解码将开启比一个较靠近预期声音位置的扬声器更多的扬声器。第二个缺点是由于:在结合点上,把从每一个扬声器而来的声波做相位相加可产生所欲的声场,但在结合点外,声波并不以正确的相位干扰。如此将改变声音的保护色,而更重要的是,预感知的声音就像是从靠近听众的扬声器而来,即如已知的心理声学居前效应(psychoacoustical precedenceeffect)。对一个固定大小的视听室而言,唯一能够降低此二个问题的方法是增加高逼真度立体声复制序列的使用,然而,这也意味着通道的数目将会快速的增加,且需使用更多的扬声器。
一可正确地再生一任意声场的技术经常值得提及,即所谓的重现波场合成(wave field synthesis,WFS)。然而,此技术需要扬声器分开的距离小于15-20公分,其是需要更高度的近似值(导致质量的流失)及增加所需的扬声器数量,现有的方法是使用100到500个扬声器,如此将限制其于高阶客制化的使用性。
一种能够提供空间化音频内容、且空间化音频内容的分配是不依靠展示设置的方法是令人向往的,是为二维或三维;当设置被明确配置后,此方法是可被译码以完全地展现其具有的性能;此方法也可再生任何型态的声场(窄频音源,回声场或扩散场)给在场的听众,意即,有大的结合点;且此方法不需要大量的扬声器。如此即可能创造出不会过时的内容,在场景中,此方法是可轻易地适用于所有现有的或未来的多扬声器设置,且也可让听众在电影院剧场或家中选择最适合或听众所需的内容,而具有可确信会有大量内容能完全地开拓所选择设置的性能的利益。
发明内容
本发明的主要目的是在提供一种无需依据展示设置即可将具有空间信息的音频信号编码的方法及装置,以及最优化译码及播放任何给定的展示系统,包括在不同高度的扬声及耳机的设置。
本发明是基于一种方法,是将某些给定的音频原料通过将其指定至两群组而编码成一展示独立格式:第一群组包含需要高方向定位的音频;第二群组包含用于定位的音频,此定位是由足够的低阶高逼真度立体声复制技术提供。
第一群组所有的音频将被编码成一组具关联性元数据且各别分开的单音轨。各别分开的单音轨的数目并无限制,虽然在某些实施例中可能会有强制的限制,此情形将说明如下。元资料是包含与每一将被重放的音轨上的精确的时刻有关的信息,也包含空间信息描述,至少,在每一时刻信号的起源的方向。第二群组所有的音频将被编码成一组代表一给定的高逼真度立体声复制序列。就理想而言会有一高逼真度立体声复制通道的信号集合,即使在某些特定实施例中有多于一个会被使用。
就再生而言,一旦显示系统被确认,在第一群组中的音频通道是因重放而被编码,编码是使用标准平移算法(standard panning algorithms),而标准平移算法则使用少数的与音源的预期位置有关的扬声器。在第二群组中的音频通道是因重放而被译码,此译码是使用高逼真度立体声复制译码器,此译码器为给定的显示系统中的优化。
此方法及装置是解决上述的问题以及后续将叙述的问题。
第一,其允许音频录音。典型生产的后制时期与分布时期是与将显示内容的设置不相关。此一实情的一个通常结果为在此背景下以此方法产生的内容是为不会过时的内容,因此可适用于任何多扬声器设置,无论是现在或是未来。此一性能也可由高逼真度立体声复制技术来达到。
第二,其可正确地再生非常窄频音源。这些音源会被编码成个别的具有方向性元数据的音轨,允许使用少数的与音源的预期位置有关的扬声器的译码算法,例如基于振幅平移的二维或三维向量。相比之下,高逼真度立体声复制需要高阶的使用来达到相同的结果,如此造成相关音轨数目、数据量、及译码复杂度的关联性增加。
第三,此方法及装置在大部分的情况下可提供一个大结合点,因而放大最佳声场重建的区域。此是以将有分于减少结合点的所有音频部分予以分成第一组音轨来达成。例如图8所示的实施例以及以下的说明:一段对话的正向声音是被编码成一具有声音入射方向的信息的分离音轨,然而回声的部分是被编码成一组第一序列高逼真度立体声复制音轨。因此,多数的听众则感知到此音源的正向声音就如同从正确的位置而来一般,大部分从与预期位置有关的扬声器而来;因此,错相保护色(out-of-phasecolouration)及居前效应(precedence effect)可从正向声音中被消除,将声像定在正确的位置。
第四,当与一通道一音轨范例及高阶高逼真度立体声复制编码比较时,可在大部分多扬声器音轨编码情况下降低以此方法编码的数据量。此一实情是有利于存储及分配的目的。数据量缩减的原因是为双重的。在一方面,对于窄频音频播放列表的高度方向性音频的分派是允许仅第1阶高逼真度立体声复制的使用,第1阶高逼真度立体声复制是用于声景的剩余部分的重建,是由传播、重建或非高度方向性音频构成。因此,第1阶高逼真度立体声复制群组中的四个音轨就已足够。相比之下,正确地重建窄频音源则需要高阶高逼真度立体声复制,其是需要例如:第3阶所用的16个音频通道,或第4阶所用的25个音频通道。另一方面,同时播放的窄频音源所需的数目在大多数情况下并不多;电影即为一个例子,在电影中,仅有对话及少数特别的声音效应会被指定至窄频音频播放列表。再者,窄频音频播放列表群组中所有的音频是为一组长度仅与音频源的持续期间对应的个别音轨。例如,对应至在一场景中现三秒的车辆的音频仅会持续三秒。因此,在一个欲产生以22.2设定影片声轨的电影应用的例子中,一通道一音轨范例则需要24个音轨,而一第3阶高逼真度立体声复制编码则需要16个音轨。相比之下,本发明提出的展示独立格式仅需要4个全长度音轨,外加一组不同长度的分离的音轨,其是为了仅含盖选定的窄频音源的预期持续时间而被最小化。
附图说明
图1是显示对给定的一组初始音轨选择及编码,最后以任意的展示设置而将其优化地译码及播放。
图2是本发明提出的展示独立格式示意图,是具有两音频群组:具有空间信息的窄频音频播放列表及高逼真度立体声复制音轨。
图3是使用不同算法以处理两音频群组其中之一的译码器。
图4是显示两音频群组可被再编码的方法的一实施例。
图5是显示展示独立格式可以是基于音频串流、而非是存储于光盘或其它种类存储器中的完整音频档案的方法的一实施例。
图6是显示输入展示独立格式至一译码器的方法的一实施例,其是可在任何展示设置中再生内容。
图7是显示某些旋转程序的技术细节,是对应至在两音频群组上的简易操作。
图8是显示于视听后制架构中的方法的一实施例。
图9是显示于虚拟场景中音频的产生及后制的部分的方法的再一实施例。
图10是显示以数字电影服务器的部分为方法的再一实施例。
图11是显示在电影中的方法的一替代实施例,通过分配前将内容解码。
具体实施方式
图1是显示本发明的方法的一实施例,其对给定的一组初始音轨选择及编码,最后以任意的展示(exhibition)设置而将其优化地译码及播放。意即,对于已给定的扬声器的位置,空间声场可被尽可能的重建,以适合于可用的扬声器,以及尽可能地放大结合点(sweet-spot)。初始音频可由任何音源形成,例如:通过任何型式任何指向性图案的麦克风或频率响应;通过高逼真度立体声复制麦克风的使用,高逼真度立体声复制麦克风是可传送一组任何序列(order)或混成(mixture)序列的高逼真度立体声复制信号;或通过合成性产生的音频的使用,或例如回声房的效应。
选择程序及编码程序是由自初始音频中产生两群组音轨所构成。第一群组是由需要窄化定位(narrow localization)的音频所构成,因一给定的高逼真度立体声复制序列的方向性就已足够,故第二群组则由剩余的音频所构成。被指定至第一群组的音频信号是维持在单音轨,并伴随着与其沿着时间的原始方向及其初始重放(playback)时间有关的空间元数据。
选择程序是为一用户驱动程序,纵使预设动作可由某型式的初始音频呈现。在一般的情况下(例如对非高逼真度立体声复制音轨而言),用户对每一初始音频片段、其音源方向及音源型式做定义:窄频音源或高逼真度立体声复制音源,是对应至前述的编码群组。方向角度可通过例如与听众相关的音源的方位角与仰角来定义,且可被确认为固定数值或时变数据。若某些音轨并无提供方向,预设分派可被定义,例如,通过指定音轨至一给定的固定方向。
可选择性地,方向角度可由一传播参数所伴随。传播(spread)以及窄(narrow)的用词在本文件中是可视为音源的感知声像的角度宽幅。例如,量化传播的方法是做用在区间[0,1]之间数值,其中数值0是代表完美地方向性音源(意即从一可识别的方向而来的音源),而数值1是代表具相同能量且从四面八方而来的音源。
对某些型式的初始音轨,预设动作可被定义。例如,音轨被辨识为立体声对(stereo pairs),是可被指定至具高逼真度立体声复制群组,高逼真度立体声复制群组是具有分别为-30度方位角的L通道(L channel)及30度方位角的R通道(R channel)。被辨识为5.1环绕声道(ITU-R775-1)的音轨可被类似地映射至-30度、0度、30度、-110度、及110度方位角。最后,被辨识为第1阶高逼真度立体声复制(或B-格式,B-format)的音轨可被指定至无需方向性信息的高逼真度立体声复制群组。
如图1所示的编码程序,采用前述的用户定义信息并输出一具有空间信息的展示独立音频格式。而如图2中所描述,第一群组的编码程序的输出是为一组具有对应至不同音源的音频信号的单音轨,也具有关联性空间元数据,并包含与一给定参考系统相关的原始方向,或音频的传播特性。第二音频群组的转换程序的输出是为一选定序列的高逼真度立体声复制的信号集合(例如,若第1阶高逼真度立体声复制被选定,则需4个音轨),是对应至高逼真度立体声复制群组中所有音源的混合。
编码程序的输出接着被一译码器所使用,译码器是使用选定的展示设置的信息,展示设置是用以对设置中的每一通道产生一音轨或音频串流。
图3是使用不同算法以处理两音频群组其中之一的译码器。高逼真度立体声复制音轨群组是被使用适合的高逼真度立体声复制译码器所解码,高逼真度立体声复制译码器是用于特定的设置。在窄频音频播放列表中的音轨是被适用在此目的的算法所译码;这些使用每一音轨元数据空间信息来译码,正常来说,是使用非常少数每一音轨的预期位置有关的扬声器。一个如此算法的例子为VBAP(vector based Amplitude panning)。时间元数据是被用来在正确的时刻开始播放此音频。译码通道最后则被传送至扬声器或耳机播放。
图4是显示两音频群组可被再编码的方法的再一实施例。一般的再编码程序将输入作为包含窄频音频播放列表,窄频音频播放列表是具有关联性方向元数据的N个不同的音轨,以及一给定序列P的一组高逼真度立体声复制音轨,以及一混成A(例如,其可包含于第0阶及第1阶的所有音轨,但仅有两个音轨对应至第2阶信号)的给定型式。再编码程序的输出是为一窄频音频播放列,此窄频音频播放列表是包含M个具有具有关联性方向元数据的音轨,以及一具有一混成B型式的给定序列Q的一组高逼真度立体声复制音轨。在再编码程序中,M,Q,B可分别与N,P,A不同。
再编码程序可被用于例如降低所具数据的数量。此可通过例如选择一个或多个包含于窄频音频播放列表中的音轨并将其指定至高逼真度立体声复制群组来达成,以将一单音转换成高逼真度立体声复制来达到与单音轨关联的方向信息的使用。在此情况下,若以用于再编码的窄频音频的高逼真度立体声复制定位做为代价,获得M<N是有可能的。为了相同的目标,降低高逼真度立体声复制音轨是有可能的,例如,通过在平面展示设置中仅保留需要被播放的音轨。然而对于一给定或P的高逼真度立体声复制信号的数目是为(P+1)2,平面设置的数目是减为1+2P。
其它再编码程序的应用是为一给定窄频音频播放列表所需的同步音轨的减少。例如,在广播应用中大多希望能限制可被同时播放的音轨数目。再次,此可通过将窄频音频播放列表中的某些音轨指定至高逼真度立体声复制群组。
可选择性地,窄频音频播放列表可包含用以描述其所包含的音频的相关度的元数据(metadata),意即,描述每一将以窄频音源的算法译码的音频是有多重要。此元数据可被用于自动地将最低相关音频指定至高逼真度立体声复制群组。
一再编码程序的替代性使用是可简单的为允许用户将窄频音频播放列表中的音频指定至高逼真度立体声复制群组,或为了美观而改变高逼真度立体声复制群组的序列及混成型式。其也可将于高逼真度立体声复制群组中的音频指定至窄频音频播放列表:一个可能的事件为仅选择第0阶音频的部分并手动连结其空间元数据;另一个可能性为使用算法以由自高逼真度立体声复制音轨而演绎出音源位置,例如狄拉克算法(DirACalgorithm)。
图5是显示本发明的再一实施例,其中所提出的展示独立格式可以是基于音频串流,而非是存储于光盘或其它种类存储器中的完整音频档案。在广播的事态中,音频频宽是有限且固定的,而因此音频通道的数目可被同时串流。此一提出的方法是由下述两点所构成:第一,在窄频音频串流及高逼真度立体声复制串流的两群组之间划分有效的音频串流;第二,将中间型档案基底展示独立格式(file-based exhibition-independent format)编码成有限数目的串流。
此再编码程序是使用于先前段落中所解释说明的技术,当有必要时减少做为窄频音频部分(通过将低度相关音轨再指定至高逼真度立体声复制群组)以及群组部分(通过移除高逼真度立体声复制成分)的同步音轨的数目。
音频串流具有更进一步的特定性,例如需于连续串流中连接窄频音轨,以及在有效串流设备中对窄频音频方向性元数据再编码。如果音频串流格式不允许串接此方向性元数据,则应保留一信号音轨以输送此以一适合方式编码的元数据。
接下来的简单示例将用以对此做更详细的解释。考虑在本发明所提出的展示独立格式中的一电影配音,是使用第1阶高逼真度立体声复制(4通道)以及最大4个同步通道的窄频音频播放列表。此电影配音将被使用仅6通道的数字电视(digital TV)来串接。如图5所示,此再编码是使用3个高逼真度立体声复制通道(移除Z通道)以及2个窄频音频通道(意即,再指定一最大为2的同步音轨至高逼真度立体声复制群组)。
可选择性地,本发明所提出的展示独立格式可做音频压缩用。此是可用于本发明所提出的展示独立格式的两个特点(flavours):档案基底或串流基底。当心理声学基底失真格式被使用时,上述的压缩可能会影响空间重建的质量。
图6是显示本发明的方法的再一实施例,其中,展示独立格式是输入至一译码器,其是可于任何展示设置中再生内容。展示设置的规格可由数种不同的方法来完成。译码器可具有标准预设,例如5.1环绕声道(ITU-R775-1),用户可以轻易地选择以与用户的展示设置相配。此一选择是可选择性地允许一些调整,以对在用户的特定规配置中扬声器的位置进行微调。可选择性地,用户是可使用某些可对每一扬声器的位置做定位的自动侦测系统,例如,可通过音频、超声波、或红外线技术。此展示设置规格可被无限次的再配置,允许用户适应任何现在或未来的多扬声器设置。译码器是可具有多组输出,因而不同的译码程序可在同一时间被完成,为了能在不同设置中可同步播放。就理想而言,译码是在任何可能的播放系统的等化之前被完成。
如果再生系统是为一耳机,解码是由标准双声技术(Standard BinauralTechnology)来达成。使用一个或多个头部相关转移函数(Head-RelatedTransfer Functions,HRTF)的数据库,其是可能产生使用适用在本方法中的两音频群组的算法的空间化声音:两音频群组是为窄频音频播放列表及高逼真度立体声复制音轨。其一般由如下的二步骤所达成:首先以上述的算法对虚拟多扬声器做解码,再将每一通道与对应至虚拟扬声器的位置的HRTF做旋绕(convolving)。
对于多扬声器设置或耳机的展示而言,本方法的再一实施例是允许在一展示阶段中的全声景做最终旋转。此在数种不同方法中是为实用。在一应用中,一载耳机的用户是可具有一头部追踪机制,头部追踪机制是测量与用户根据全声景而旋转的头部的方位有关的参数。
图7是显示某些旋转程序的技术细节,是在两音频群组上对应至简易操作。高逼真度立体声复制音轨的旋转是由应用每一高逼真度立体声复制序列的不同旋转矩阵来实现,这是一已知的程序。另一方面,与每一在窄频音频播放列表中的音轨相关的空间元数据可被修正,是通过简单的计算音源方位角以及仰角,其是为在一给定的方位上的听众所能感知的。同样地,此为一简单的标准计算。
图8是显示于视听后制架构中的方法的一实施例。一用户拥有所有的音频在他的后制软件中,后制软件可为一数字音频工作站(Digital AudioWorkstation)。用户是使用标准外挂程序(standard plug-in)或专用外挂程序(dedicated plug-in)以明确地确认每一需要被定位的音源的方向。为产生本发明所提出的中间型展示独立格式,其是选择在单音轨播放列表中将被编码的音频,以及在高逼真度立体声复制群组中将被编码的音频。此一指定可由不同种方法来完成。在一实施例中,用户通过一外挂程序指定一指向性系数给每一音源;随即被用来自动指定所有具方向性系数的音源至一窄频音频播放列表,此系数是高于一给定的数值。在一替代实施例中,某些预设指定是由软件来实现;例如,所有音频的回声部分,也包括原始以高逼真度立体声复制麦克风记录的音频,可被指定至高逼真度立体声复制群组,除非用户指定至其它地方。可作为选择的是,所有的指定都由手动完成。
当指定完成时,此软件是使用专用外挂程序来产生窄频音频播放列表以及高逼真度立体声复制音轨。在此程序中,代表窄频音频播放列表中的空间性质的元数据是被编码。同样地,被指定至高逼真度立体声复制群组的音源的方向、以及随选出的传播方向是被用来做从单音或立体声至高逼真度立体声复制的转换,其是使用标准算法。因此,音频后制阶段的输出是为一中间型展示独立格式,此中间型展示独立格式是具有窄频音频播放列表以及一组给定序列及混成的高逼真度立体声复制通道。
在此实施例中,是有助于未来的再定版(re-versioning)以产生多于一组的高逼真度立体声复制通道。例如,在即将产生的不同语言版本的某些电影中,在一第二组高逼真度立体声复制音轨中是很有用处的,而此第二组高逼真度立体声复制音轨中的所有音频是与对话有关,包含对话的回声部分。通过使用此方法,唯一因需要产生一不同语言版本的改变是包括取代包含于窄频音频播放列表的干对话(dry dialogue)、以及包含于第二组高逼真度立体声复制音轨中的对话的回声部分。
图9是显示于虚拟场景中音频的产生及后制的部分的方法的再一实施例(例如,一动画电影或3D游戏)。在虚拟场景中,与音源以及听众的位置及方向有关的信息是有用的。三维几何(3D geometry)场景的信息以及其中所呈现的材料可随意地被利用。回声可随意地并自动地通过空间声音模拟被计算。在此文件中,将场景编码成本发明所提出的中间型展示独立格式的编码程序是可被简化。一方面,是有可能将音轨指定至每一音源,并对与听众有关的每一时刻的位置做编码,其是仅通过对各自的位置及方向做自动地演绎,而无需之后在后制中做确认。其也可决定于高逼真度立体声复制群组中有多少的回声需要被编码,通过将每一音源的正向声音与特定数目的第一声音反射指定至窄频音频播放列表,以及将回声的剩余部指定至高逼真度立体声复制群组。
图10是显示以数字电影服务器的部分为方法的再一实施例。在此情况中,相同的音频内容是可以前述的展示独立格式而被分配至电影院剧场,是由窄频音频播放列表加上一组高逼真度立体声复制音轨所构成。每一剧场可具有一具备每一特定多扬声器设置的规格的译码器,其是可由手动或由某种自动侦测机制而输入。尤其,设置的自动侦测可轻易地被嵌入于系统中,并且,同时计算每一扬声器所需的等化(equalization)。此一步骤可由测量于一已知剧场中的每一扬声器的脉冲响应所构成,以演绎剧场位置以及所需的并用于对其做等化的反向滤波器。脉冲响应的测量是可从现有的多种技术来完成(例如正弦扫描sine sweep,或最大长度序列MLSSequence),而相对应的扬声器位置的演绎方法是为一无需经常演绎的程序,但仅于当空间的特征或设置改变时。在任何情况下,一旦译码器具有设置的规格,随后内容可被最优化解码成一通道一音轨格式,以准备被播放。
图11是显示于电影中的方法的一替代实施例,通过分配前将内容解码。在此情况下,译码器需知道每一电影设置的规格,因此内容的多个一通道一音轨版本即可被产生,随后则被分配。此一应用是相当有用的,例如,将内容传送一不具有此处提出的展示独立格式兼容的译码器的电影。而在分配前先检查或保证适用于一特定设置的音频的质量也可是相当有用的。
在本方法的再一实施例中,某些窄频音频播放列表可被再编辑,且无需凭借原始的主要计划。例如,某些用以描述音源位置或其传播的元数据可被修改。
当前述的说明已配合特定实施例加以附图及描述后,本领域的普通技术人员可由本说明书所公开的内容轻易地了解本发明的其它优点与功效。此外,本发明也可通过其它不同的具体实施例加以施行或应用,且本说明书中的各项细节也可基于不同观点与应用,而在不悖离本发明的精神下进行各种修饰与变更。
上述实施例仅是为了方便说明而举例而已,本发明所主张的权利范围自应以权利要求所述为准,而非仅限于上述实施例。

Claims (26)

1.一种将音频信号及相关空间信息编码至一再生配置独立格式的方法,其特征在于,该方法包含:
(a)将一第一组音频信号指定至一第一群组,并将该第一群组编码成一组具关联性元数据的单音轨,该关联性元数据是描述与记录位置有关的每一原始音轨的方向及其重放时间;
(b)将一第二组音频信号指定至一第二群组,并将该第二群组编码成至少一组一给定序列及混成序列的高逼真度立体声复制音轨;以及
(c)产生包含该第一组音频信号及该第二组音频信号的两群组音轨。
2.根据权利要求1所述的方法,其特征在于,还包含:将与该组单音轨中的与音轨相关的传播参数编码。
3.根据权利要求1所述的方法,其特征在于,还包含:将与该组单音轨中的与音轨相关的更进一步方向参数编码。
4.根据权利要求1所述的方法,其特征在于,还包含:从任一包含与音轨有关的音源的场景的三维表示法推导出该第一组中的该信号的起源的方向,以及记录位置。
5.根据权利要求1所述的方法,其特征在于,还包含:根据预设规则指定该第一组中的音轨的该信号的起源的方向。
6.根据权利要求1所述的方法,其特征在于,还包含:将每一该第一组中每一音轨的方向参数编码成固定常数值或时变值。
7.根据权利要求1所述的方法,其特征在于,还包含:将用以描述使用格式的规格的元数据编码,该元数据包括:高逼真度立体声复制序列、混成序列型式、音轨关联增益、及音轨序列。
8.根据权利要求1所述的方法,其特征在于,还包含:将与高逼真度立体声复制音轨相关的该初始重放时间予以编码。
9.根据权利要求1所述的方法,其特征在于,还包含:将具有关联性方向数据编码成一给定序列及混成序列的该高逼真度立体声复制音轨。
10.根据权利要求1所述的方法,其特征在于,还包含:将任何输入多通道的信号编码成一给定序列及混成序列的该高逼真度立体声复制音轨。
11.根据权利要求1所述的方法,其特征在于,还包含:将任何序列及混成序列的任何输入高逼真度立体声复制信号编码成一可能不同的给定的序列及混成序列的高逼真度立体声复制音轨。
12.如权利要求1所述的方法,其特征在于,还包含再生配置独立格式的再编码,该再编码是至少包含下列之一:
(a)指定该组单音轨中的音轨至该高逼真度立体声复制集合;
(b)将部分在高逼真度立体声复制集合中的音频指定至单音轨集合,是可能包含已从高逼真度立体声复制信号推导出的方向信息;
(c)改变音轨的该高逼真度立体声复制集合的序列或混成序列;
(d)修改与该组单音轨关联的该方向元数据;
(e)通过如旋转及缩放的操作而修改高逼真度立体声复制音轨。
13.根据权利要求12所述的方法,其特征在于,还包含将再生配置独立格式再编码成适合用于广播的格式,该再编码是满足下列限制:一连续音频串流的固定数字、包含于再生配置独立格式的元数据的传输的有效协议的使用。
14.根据权利要求1所述的方法,其特征在于,还包含将再生配置独立格式译码至一给定的多扬声器配置,该译码是使用该多扬声器位置的一规格以用于:
(a)以适用于窄频音源的算法将该组单音轨解码;
(b)通过适用于该音轨序列及混成序列及特定设置的算法将该高逼真度立体声复制集合予以译码。
15.根据权利要求14所述的方法,其特征在于,还包含传播参数的使用、及可能其它与单音轨集合相关的空间元数据以使用适用于特定传播的译码算法。
16.根据权利要求14所述的方法,其特征在于,还包含标准再生配置设置预设的使用,标准再生配置设置预设的使用包括:立体声及5.1环绕声道。
17.根据权利要求14所述的方法,其特征在于,还包含通过标准双声技术对耳机译码,是使用头部相关转移函数的数据库。
18.根据权利要求14所述的方法,其特征在于,还包含使用旋转控制参数以实现一全声景的旋转,其中该控制参数由头部追踪装置产生。
19.根据权利要求14所述的方法,其特征在于,还包含使用自动推导扬声器的位置的技术,以定义译码器所使用的设定规格。
20.根据权利要求14或17所述的方法,其特征在于,其中解码后的输出是被存储成一音轨群组,而非直接重放。
21.根据权利要求1、12、13或20所述的方法,其特征在于,是将全部或部分的音频信号编码成压缩音频格式。
22.一种将音频信号及相关空间信息编码至一再生配置独立格式的编码器,其特征在于,该编码器包括:
(a)一将一第一组音频信号指定至一第一群组,并将该第一群组编码成一具有方向信息及初始重放信息的单音轨集合的编码器;
(b)一将一第二组音频信号指定至一第二群组,并将该第二群组编码成一任何序列及混成的高逼真度立体声复制音轨集合的编码器;
(c)一产生包含该第一组音频信号及该第二组音频信号的两群组音轨的编码器。
23.一种在一输入再生配置独立格式中对音频操纵及再编码的音频再编码器及修改器,其特征在于,藉此其输出是通过依据权利要求12所述的方法予以修改,其中该再编码器适用于下列任一:
(a)指定该组单音轨中的音轨至该高逼真度立体声复制集合;
(b)将部分在高逼真度立体声复制集合的音频指定至单音轨,是可能包含已从高逼真度立体声复制信号推导出的方向信息;
(c)改变音轨的该高逼真度立体声复制集合的序列或混成序列;
(d)与该组单音轨关联的该方向元数据的修改;
(e)高逼真度立体声复制音轨的修改,是通过例如旋转及缩放的操作。
24.一种将再生配置独立格式译码至一给定的N通道再生系统的音频译码器,其特征在于,该再生配置独立格式是依据权利要求14所述的方法所产生,该音频译码器包括:
(a)一基于再生设置规格并将一具有方向信息及初始重放信息的单音轨集合编码至N音频通道的译码器,
(b)一基于再生设置规格并将一高逼真度立体声复制音轨集合编码至N音频通道的译码器,
(c)一将前述的二译码器的输出混合的混合器,前述的二译码器是用于产生预备重放或存储的N输出音频通道。
25.一种系统,其特征在于,用于一再生配置独立格式中对空间音频编码及再编码,以及对任何多扬声器配置译码及重放,或用于耳机,该系统包括:
(a)一音频编码器,用以将一组音频信号及相关空间信息编码至一根据权利要求22所述的再生配置独立格式,
(b)一音频再编码器及音频修改器,用以于一根据权利要求23所述的输入再生配置独立格式中对音频操纵及再编码,
(c)一根据权利要求24所述的音频译码器,用以将再生配置独立格式译码至一给定的再生配置系统,其为一多扬声器配置或耳机。
26.一种计算机程序,其特征在于,是用于当一计算机运作时执行依据权利要求1至21的任一项所述的方法。
CN200980153195.0A 2008-12-30 2009-12-29 三维声场编码及优化重建的方法及装置 Active CN102326417B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP08382091.0A EP2205007B1 (en) 2008-12-30 2008-12-30 Method and apparatus for three-dimensional acoustic field encoding and optimal reconstruction
EP08382091.0 2008-12-30
PCT/EP2009/009356 WO2010076040A1 (en) 2008-12-30 2009-12-29 Method and apparatus for three-dimensional acoustic field encoding and optimal reconstruction

Publications (2)

Publication Number Publication Date
CN102326417A true CN102326417A (zh) 2012-01-18
CN102326417B CN102326417B (zh) 2015-07-08

Family

ID=40606571

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200980153195.0A Active CN102326417B (zh) 2008-12-30 2009-12-29 三维声场编码及优化重建的方法及装置

Country Status (8)

Country Link
US (1) US9299353B2 (zh)
EP (2) EP2205007B1 (zh)
JP (1) JP5688030B2 (zh)
CN (1) CN102326417B (zh)
MX (1) MX2011007035A (zh)
RU (1) RU2533437C2 (zh)
UA (1) UA106598C2 (zh)
WO (1) WO2010076040A1 (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103313182A (zh) * 2012-03-06 2013-09-18 汤姆逊许可公司 用于回放更高阶立体混响音频信号的方法和设备
CN105637901A (zh) * 2013-10-07 2016-06-01 杜比实验室特许公司 空间音频处理系统和方法
CN107180638A (zh) * 2012-05-14 2017-09-19 杜比国际公司 压缩和解压缩高阶高保真度立体声响复制信号表示的方法及装置
CN107293304A (zh) * 2013-04-29 2017-10-24 杜比国际公司 对更高阶高保真度立体声响复制表示进行压缩和解压缩的方法和装置
TWI655625B (zh) * 2017-09-15 2019-04-01 宏達國際電子股份有限公司 反應播放環境聲場效果的聲音再現方法及聲音再現裝置
CN109756683A (zh) * 2017-11-02 2019-05-14 深圳市裂石影音科技有限公司 全景音视频录制方法、装置、存储介质和计算机设备
CN110100460A (zh) * 2017-01-30 2019-08-06 谷歌有限责任公司 基于头部位置和时间的具有非头部跟踪立体声的高保真度立体声响复制音频
CN110648675A (zh) * 2013-07-11 2020-01-03 杜比国际公司 产生hoa信号的混合的空间/系数域表示的方法和设备
CN111149155A (zh) * 2017-07-14 2020-05-12 弗劳恩霍夫应用研究促进协会 使用多点声场描述生成经增强的声场描述或经修改的声场描述的概念
US11863962B2 (en) 2017-07-14 2024-01-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Concept for generating an enhanced sound-field description or a modified sound field description using a multi-layer description

Families Citing this family (53)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9591374B2 (en) 2010-06-30 2017-03-07 Warner Bros. Entertainment Inc. Method and apparatus for generating encoded content using dynamically optimized conversion for 3D movies
US10326978B2 (en) 2010-06-30 2019-06-18 Warner Bros. Entertainment Inc. Method and apparatus for generating virtual or augmented reality presentations with 3D audio positioning
US9552840B2 (en) * 2010-10-25 2017-01-24 Qualcomm Incorporated Three-dimensional sound capturing and reproducing with multi-microphones
EP2450880A1 (en) * 2010-11-05 2012-05-09 Thomson Licensing Data structure for Higher Order Ambisonics audio data
ES2643163T3 (es) * 2010-12-03 2017-11-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y procedimiento para codificación de audio espacial basada en geometría
EP2469741A1 (en) 2010-12-21 2012-06-27 Thomson Licensing Method and apparatus for encoding and decoding successive frames of an ambisonics representation of a 2- or 3-dimensional sound field
FR2970574B1 (fr) * 2011-01-19 2013-10-04 Devialet Dispositif de traitement audio
EP2862370B1 (en) 2012-06-19 2017-08-30 Dolby Laboratories Licensing Corporation Rendering and playback of spatial audio using channel-based audio systems
EP2688066A1 (en) * 2012-07-16 2014-01-22 Thomson Licensing Method and apparatus for encoding multi-channel HOA audio signals for noise reduction, and method and apparatus for decoding multi-channel HOA audio signals for noise reduction
TWI590234B (zh) 2012-07-19 2017-07-01 杜比國際公司 編碼聲訊資料之方法和裝置,以及解碼已編碼聲訊資料之方法和裝置
EP2733963A1 (en) * 2012-11-14 2014-05-21 Thomson Licensing Method and apparatus for facilitating listening to a sound signal for matrixed sound signals
KR102028122B1 (ko) * 2012-12-05 2019-11-14 삼성전자주식회사 오디오 장치 및 그의 신호 처리 방법 그리고 그 방법을 수행하는 프로그램이 기록된 컴퓨터 판독 가능 매체
EP2743922A1 (en) * 2012-12-12 2014-06-18 Thomson Licensing Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field
CN108174341B (zh) * 2013-01-16 2021-01-08 杜比国际公司 测量高阶高保真度立体声响复制响度级的方法及设备
US9913064B2 (en) * 2013-02-07 2018-03-06 Qualcomm Incorporated Mapping virtual speakers to physical speakers
EP2782094A1 (en) * 2013-03-22 2014-09-24 Thomson Licensing Method and apparatus for enhancing directivity of a 1st order Ambisonics signal
WO2014160576A2 (en) 2013-03-28 2014-10-02 Dolby Laboratories Licensing Corporation Rendering audio using speakers organized as a mesh of arbitrary n-gons
US9723305B2 (en) 2013-03-29 2017-08-01 Qualcomm Incorporated RTP payload format designs
TWI530941B (zh) 2013-04-03 2016-04-21 杜比實驗室特許公司 用於基於物件音頻之互動成像的方法與系統
JP6204684B2 (ja) * 2013-04-05 2017-09-27 日本放送協会 音響信号再生装置
JP6228389B2 (ja) * 2013-05-14 2017-11-08 日本放送協会 音響信号再生装置
JP6228387B2 (ja) * 2013-05-14 2017-11-08 日本放送協会 音響信号再生装置
US9466305B2 (en) * 2013-05-29 2016-10-11 Qualcomm Incorporated Performing positional analysis to code spherical harmonic coefficients
US9883312B2 (en) 2013-05-29 2018-01-30 Qualcomm Incorporated Transformed higher order ambisonics audio data
TWM487509U (zh) 2013-06-19 2014-10-01 杜比實驗室特許公司 音訊處理設備及電子裝置
EP2830045A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Concept for audio encoding and decoding for audio channels and audio objects
EP2830050A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for enhanced spatial audio object coding
EP2830047A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for low delay object metadata coding
WO2015038475A1 (en) 2013-09-12 2015-03-19 Dolby Laboratories Licensing Corporation Dynamic range control for a wide variety of playback environments
DE102013223201B3 (de) * 2013-11-14 2015-05-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren und Vorrichtung zum Komprimieren und Dekomprimieren von Schallfelddaten eines Gebietes
US9922656B2 (en) 2014-01-30 2018-03-20 Qualcomm Incorporated Transitioning of ambient higher-order ambisonic coefficients
US9502045B2 (en) 2014-01-30 2016-11-22 Qualcomm Incorporated Coding independent frames of ambient higher-order ambisonic coefficients
JP6374980B2 (ja) * 2014-03-26 2018-08-15 パナソニック株式会社 サラウンドオーディオ信号処理のための装置及び方法
US10770087B2 (en) 2014-05-16 2020-09-08 Qualcomm Incorporated Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals
US9852737B2 (en) 2014-05-16 2017-12-26 Qualcomm Incorporated Coding vectors decomposed from higher-order ambisonics audio signals
US9620137B2 (en) * 2014-05-16 2017-04-11 Qualcomm Incorporated Determining between scalar and vector quantization in higher order ambisonic coefficients
US9747910B2 (en) 2014-09-26 2017-08-29 Qualcomm Incorporated Switching between predictive and non-predictive quantization techniques in a higher order ambisonics (HOA) framework
IL276591B2 (en) 2015-10-08 2023-09-01 Dolby Int Ab Layered coding for voice or compressed sound field representations
US10070094B2 (en) * 2015-10-14 2018-09-04 Qualcomm Incorporated Screen related adaptation of higher order ambisonic (HOA) content
EP3188504B1 (en) 2016-01-04 2020-07-29 Harman Becker Automotive Systems GmbH Multi-media reproduction for a multiplicity of recipients
FR3046489B1 (fr) 2016-01-05 2018-01-12 Mimi Hearing Technologies GmbH Encodeur ambisonique ameliore d'une source sonore a pluralite de reflexions
CN109564760A (zh) * 2016-05-25 2019-04-02 华纳兄弟娱乐公司 通过3d音频定位来生成虚拟或增强现实呈现的方法和装置
US10390166B2 (en) 2017-05-31 2019-08-20 Qualcomm Incorporated System and method for mixing and adjusting multi-input ambisonics
GB2563635A (en) * 2017-06-21 2018-12-26 Nokia Technologies Oy Recording and rendering audio signals
US10714098B2 (en) * 2017-12-21 2020-07-14 Dolby Laboratories Licensing Corporation Selective forward error correction for spatial audio codecs
US10595146B2 (en) 2017-12-21 2020-03-17 Verizon Patent And Licensing Inc. Methods and systems for extracting location-diffused ambient sound from a real-world scene
EP3503102A1 (en) * 2017-12-22 2019-06-26 Nokia Technologies Oy An apparatus and associated methods for presentation of captured spatial audio content
GB2572420A (en) * 2018-03-29 2019-10-02 Nokia Technologies Oy Spatial sound rendering
CN109462811B (zh) * 2018-11-23 2020-11-17 武汉轻工大学 基于非中心点的声场重建方法、设备、存储介质及装置
CN218839317U (zh) * 2019-10-23 2023-04-11 索尼公司 移动装置
TW202123220A (zh) 2019-10-30 2021-06-16 美商杜拜研究特許公司 使用方向性元資料之多通道音頻編碼及解碼
CN111263291B (zh) * 2020-01-19 2021-06-11 西北工业大学太仓长三角研究院 一种基于高阶麦克风阵列的声场重构方法
JP2021131433A (ja) * 2020-02-19 2021-09-09 ヤマハ株式会社 音信号処理方法および音信号処理装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1735922A (zh) * 2002-11-19 2006-02-15 法国电信局 处理音频数据的方法和实行这个方法的声音获取设备
US20070269063A1 (en) * 2006-05-17 2007-11-22 Creative Technology Ltd Spatial audio coding based on universal spatial cues
US20080004729A1 (en) * 2006-06-30 2008-01-03 Nokia Corporation Direct encoding into a directional audio coding format

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9204485D0 (en) * 1992-03-02 1992-04-15 Trifield Productions Ltd Surround sound apparatus
AUPO316296A0 (en) * 1996-10-23 1996-11-14 Lake Dsp Pty Limited Dithered binaural system
AUPP272598A0 (en) * 1998-03-31 1998-04-23 Lake Dsp Pty Limited Wavelet conversion of 3-d audio signals
JP3863306B2 (ja) * 1998-10-28 2006-12-27 富士通株式会社 マイクロホンアレイ装置
KR100542129B1 (ko) * 2002-10-28 2006-01-11 한국전자통신연구원 객체기반 3차원 오디오 시스템 및 그 제어 방법
US8027482B2 (en) * 2003-02-13 2011-09-27 Hollinbeck Mgmt. Gmbh, Llc DVD audio encoding using environmental audio tracks
DE10344638A1 (de) * 2003-08-04 2005-03-10 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Erzeugen, Speichern oder Bearbeiten einer Audiodarstellung einer Audioszene
US7672196B1 (en) * 2004-11-16 2010-03-02 Nihon University Sound source localizing apparatus and method
DE102005008366A1 (de) * 2005-02-23 2006-08-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Ansteuern einer Wellenfeldsynthese-Renderer-Einrichtung mit Audioobjekten
FI20055260A0 (fi) * 2005-05-27 2005-05-27 Midas Studios Avoin Yhtioe Laite, järjestelmä ja menetelmä akustisten signaalien vastaanottamista tai toistamista varten
EP1989854B1 (fr) * 2005-12-27 2015-07-22 Orange Procede de determination d'un mode d'encodage spatial de donnees audio
WO2007141677A2 (en) * 2006-06-09 2007-12-13 Koninklijke Philips Electronics N.V. A device for and a method of generating audio data for transmission to a plurality of audio reproduction units
JP2008061186A (ja) * 2006-09-04 2008-03-13 Yamaha Corp 指向特性制御装置、収音装置および収音システム
WO2008039339A2 (en) * 2006-09-25 2008-04-03 Dolby Laboratories Licensing Corporation Improved spatial resolution of the sound field for multi-channel audio playback systems by deriving signals with high order angular terms
US8290167B2 (en) * 2007-03-21 2012-10-16 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for conversion between multi-channel audio formats
RS1332U (en) 2013-04-24 2013-08-30 Tomislav Stanojević FULL SOUND ENVIRONMENT SYSTEM WITH FLOOR SPEAKERS

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1735922A (zh) * 2002-11-19 2006-02-15 法国电信局 处理音频数据的方法和实行这个方法的声音获取设备
US20070269063A1 (en) * 2006-05-17 2007-11-22 Creative Technology Ltd Spatial audio coding based on universal spatial cues
US20080004729A1 (en) * 2006-06-30 2008-01-03 Nokia Corporation Direct encoding into a directional audio coding format

Cited By (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106714072B (zh) * 2012-03-06 2019-04-02 杜比国际公司 用于回放更高阶立体混响音频信号的方法和设备
CN103313182A (zh) * 2012-03-06 2013-09-18 汤姆逊许可公司 用于回放更高阶立体混响音频信号的方法和设备
CN103313182B (zh) * 2012-03-06 2017-04-12 杜比国际公司 用于回放更高阶立体混响音频信号的方法和设备
CN106714074A (zh) * 2012-03-06 2017-05-24 杜比国际公司 用于回放更高阶立体混响音频信号的方法和设备
CN106714072A (zh) * 2012-03-06 2017-05-24 杜比国际公司 用于回放更高阶立体混响音频信号的方法和设备
CN106954173A (zh) * 2012-03-06 2017-07-14 杜比国际公司 用于回放更高阶立体混响音频信号的方法和设备
CN106954172A (zh) * 2012-03-06 2017-07-14 杜比国际公司 用于回放更高阶立体混响音频信号的方法和设备
CN106954173B (zh) * 2012-03-06 2020-01-31 杜比国际公司 用于回放更高阶立体混响音频信号的方法和设备
CN106954172B (zh) * 2012-03-06 2019-10-29 杜比国际公司 用于回放更高阶立体混响音频信号的方法和设备
CN106714074B (zh) * 2012-03-06 2019-09-24 杜比国际公司 用于回放更高阶立体混响音频信号的方法和设备
CN106714073B (zh) * 2012-03-06 2018-11-16 杜比国际公司 用于回放更高阶立体混响音频信号的方法和设备
CN107180638B (zh) * 2012-05-14 2021-01-15 杜比国际公司 压缩和解压缩高阶高保真度立体声响复制信号表示的方法及装置
CN107180638A (zh) * 2012-05-14 2017-09-19 杜比国际公司 压缩和解压缩高阶高保真度立体声响复制信号表示的方法及装置
US11792591B2 (en) 2012-05-14 2023-10-17 Dolby Laboratories Licensing Corporation Method and apparatus for compressing and decompressing a higher order Ambisonics signal representation
US11234091B2 (en) 2012-05-14 2022-01-25 Dolby Laboratories Licensing Corporation Method and apparatus for compressing and decompressing a Higher Order Ambisonics signal representation
CN107293304B (zh) * 2013-04-29 2021-01-05 杜比国际公司 对更高阶高保真度立体声响复制表示进行压缩和解压缩的方法和装置
CN107293304A (zh) * 2013-04-29 2017-10-24 杜比国际公司 对更高阶高保真度立体声响复制表示进行压缩和解压缩的方法和装置
CN110648675B (zh) * 2013-07-11 2023-06-23 杜比国际公司 产生hoa信号的混合的空间/系数域表示的方法和设备
CN110648675A (zh) * 2013-07-11 2020-01-03 杜比国际公司 产生hoa信号的混合的空间/系数域表示的方法和设备
US11863958B2 (en) 2013-07-11 2024-01-02 Dolby Laboratories Licensing Corporation Methods and apparatus for decoding encoded HOA signals
US9807538B2 (en) 2013-10-07 2017-10-31 Dolby Laboratories Licensing Corporation Spatial audio processing system and method
CN105637901A (zh) * 2013-10-07 2016-06-01 杜比实验室特许公司 空间音频处理系统和方法
CN110100460B (zh) * 2017-01-30 2021-03-30 谷歌有限责任公司 用于产生声场的方法、系统和介质
CN110100460A (zh) * 2017-01-30 2019-08-06 谷歌有限责任公司 基于头部位置和时间的具有非头部跟踪立体声的高保真度立体声响复制音频
CN111149155A (zh) * 2017-07-14 2020-05-12 弗劳恩霍夫应用研究促进协会 使用多点声场描述生成经增强的声场描述或经修改的声场描述的概念
CN111149155B (zh) * 2017-07-14 2023-10-10 弗劳恩霍夫应用研究促进协会 使用多点声场描述生成经增强的声场描述的装置及方法
US11863962B2 (en) 2017-07-14 2024-01-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Concept for generating an enhanced sound-field description or a modified sound field description using a multi-layer description
US11950085B2 (en) 2017-07-14 2024-04-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Concept for generating an enhanced sound field description or a modified sound field description using a multi-point sound field description
TWI655625B (zh) * 2017-09-15 2019-04-01 宏達國際電子股份有限公司 反應播放環境聲場效果的聲音再現方法及聲音再現裝置
CN109756683A (zh) * 2017-11-02 2019-05-14 深圳市裂石影音科技有限公司 全景音视频录制方法、装置、存储介质和计算机设备
CN109756683B (zh) * 2017-11-02 2024-06-04 深圳市裂石影音科技有限公司 全景音视频录制方法、装置、存储介质和计算机设备

Also Published As

Publication number Publication date
UA106598C2 (uk) 2014-09-25
JP2012514358A (ja) 2012-06-21
US20110305344A1 (en) 2011-12-15
RU2011131868A (ru) 2013-02-10
WO2010076040A1 (en) 2010-07-08
EP2382803A1 (en) 2011-11-02
EP2205007A1 (en) 2010-07-07
CN102326417B (zh) 2015-07-08
EP2382803B1 (en) 2020-02-19
US9299353B2 (en) 2016-03-29
EP2205007B1 (en) 2019-01-09
MX2011007035A (es) 2011-10-11
JP5688030B2 (ja) 2015-03-25
RU2533437C2 (ru) 2014-11-20

Similar Documents

Publication Publication Date Title
CN102326417A (zh) 三维声场编码及优化重建的方法及装置
TWI744341B (zh) 使用近場/遠場渲染之距離聲相偏移
TWI603632B (zh) 用於適應性音頻信號的產生、譯碼與呈現之系統與方法
JP6088444B2 (ja) 3次元オーディオサウンドトラックの符号化及び復号
JP5174527B2 (ja) 音像定位音響メタ情報を付加した音響信号多重伝送システム、制作装置及び再生装置
CN101889307A (zh) 相位-幅度3d立体声编码器和解码器
CN107533843A (zh) 用于捕获、编码、分布和解码沉浸式音频的系统和方法
KR101381396B1 (ko) 입체음향 조절기를 내포한 멀티 뷰어 영상 및 3d 입체음향 플레이어 시스템 및 그 방법
JP2012514358A5 (zh)
CN105323702A (zh) 混音方法及系统
JP5338053B2 (ja) 波面合成信号変換装置および波面合成信号変換方法
KR101682105B1 (ko) 입체음향 조절 방법 및 장치
JP6228388B2 (ja) 音響信号再生装置
KR101114431B1 (ko) 실시간 스트리밍을 위한 오디오 생성장치, 오디오 재생장치 및 그 방법
Paterson et al. Producing 3-D audio
KR101534295B1 (ko) 멀티 뷰어 영상 및 3d 입체음향 제공방법 및 장치
KR102529400B1 (ko) 오디오 메타데이터 제공 장치 및 방법, 오디오 데이터 제공 장치 및 방법, 오디오 데이터 재생 장치 및 방법
JP5743003B2 (ja) 波面合成信号変換装置および波面合成信号変換方法
KR102370348B1 (ko) 오디오 메타데이터 제공 장치 및 방법, 오디오 데이터 제공 장치 및 방법, 오디오 데이터 재생 장치 및 방법
JP5590169B2 (ja) 波面合成信号変換装置および波面合成信号変換方法
RU2820838C2 (ru) Система, способ и постоянный машиночитаемый носитель данных для генерирования, кодирования и представления данных адаптивного звукового сигнала
Geier et al. The Future of Audio Reproduction: Technology–Formats–Applications
Proper et al. Surround+ immersive mastering
Devonport et al. Full Reviewed Paper at ICSA 2019
Scott Audio in 2011

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: VOICE FASHION CO., LTD.

Free format text: FORMER OWNER: BARCELONA MEDIA FOUNDATION

Effective date: 20130529

C41 Transfer of patent application or patent right or utility model
C53 Correction of patent of invention or patent application
CB02 Change of applicant information

Address after: Barcelona

Applicant after: Barcelona Media Foundation

Address before: Barcelona E-08018 Champlain Diyegenuo tower 9 117 Street

Applicant before: Pompei Fabra University Barcelona Media Foundation

COR Change of bibliographic data

Free format text: CORRECT: APPLICANT; FROM: FUNDACIO BARCELONA MEDIA UNIVERSITAT POMPEU FABRA TO: BARCELONA MEDIA FOUNDATION

TA01 Transfer of patent application right

Effective date of registration: 20130529

Address after: Barcelona

Applicant after: Sound & Co.,Ltd.

Address before: Barcelona

Applicant before: Barcelona Media Foundation

ASS Succession or assignment of patent right

Owner name: DOLBY INTERNATIONAL CO., LTD.

Free format text: FORMER OWNER: VOICE FASHION CO., LTD.

Effective date: 20140423

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20140423

Address after: Amsterdam, The Netherlands

Applicant after: DOLBY INTERNATIONAL AB

Address before: Barcelona

Applicant before: Sound & Co.,Ltd.

C14 Grant of patent or utility model
GR01 Patent grant