CN104854655B - 对声场的高阶立体混响表示进行压缩和解压缩的方法和设备 - Google Patents

对声场的高阶立体混响表示进行压缩和解压缩的方法和设备 Download PDF

Info

Publication number
CN104854655B
CN104854655B CN201380064856.9A CN201380064856A CN104854655B CN 104854655 B CN104854655 B CN 104854655B CN 201380064856 A CN201380064856 A CN 201380064856A CN 104854655 B CN104854655 B CN 104854655B
Authority
CN
China
Prior art keywords
hoa
signal
leading
phasing signal
phasing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201380064856.9A
Other languages
English (en)
Other versions
CN104854655A (zh
Inventor
亚历山大·克鲁格
斯文·科登
约翰内斯·伯姆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby International AB
Original Assignee
Dolby International AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to CN201910024895.5A priority Critical patent/CN109448742B/zh
Application filed by Dolby International AB filed Critical Dolby International AB
Priority to CN202310889797.4A priority patent/CN117037812A/zh
Priority to CN202311300470.5A priority patent/CN117392989A/zh
Priority to CN202310889802.1A priority patent/CN117037813A/zh
Priority to CN201910024898.9A priority patent/CN109448743B/zh
Priority to CN201910024894.0A priority patent/CN109410965B/zh
Priority to CN201910024905.5A priority patent/CN109616130B/zh
Priority to CN201910024906.XA priority patent/CN109545235B/zh
Publication of CN104854655A publication Critical patent/CN104854655A/zh
Application granted granted Critical
Publication of CN104854655B publication Critical patent/CN104854655B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H20/00Arrangements for broadcast or for distribution combined with broadcast
    • H04H20/86Arrangements characterised by the broadcast information itself
    • H04H20/88Stereophonic broadcast systems
    • H04H20/89Stereophonic broadcast systems using three or more audio channels, e.g. triphonic or quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/11Application of ambisonics in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Stereophonic System (AREA)
  • Percussion Or Vibration Massage (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明改善HOA声场表示压缩。针对主导声源的存在来对HOA表示进行分析,并且估计所述主导声源的方向。然后,HOA表示分解为多个主导定向信号和残余分量。该残余分量变换到离散空间域,以便在均匀采样方向获得总的平面波函数,所述均匀采样方向是根据主导定向信号中预测的。最后,预测误差变换回HOA域,并且表示残余环境HOA分量,针对所述残余环境HOA分量来执行阶的降低,随后是主导定向信号和残余分量的感知编码。

Description

对声场的高阶立体混响表示进行压缩和解压缩的方法和设备
技术领域
本发明涉及对声场的高阶立体混响表示进行压缩和解压缩的方法 和设备。
背景技术
高阶立体混响(表示为HOA)提供了表示三维立体声的一种方式。 其它的技术是波场合成(WFS)或者像22.2的基于声道的方法。相比 于基于声道的方法,HOA表示提供了独立于特定扬声器配置的优点。 然而,这种灵活性是以牺牲解码过程为代价的,对于在特定扬声器配 置上的HOA表示的回放,需要解码过程。与需要的扬声器数量通常 很大的WFS方法相比,HOA也可以被提供给只包括较少扬声器的配 置。HOA的其它优点是,在没有针对对耳机的双耳呈现的任何修改的 情况下,也可以采用相同的表示。
HOA是基于按照截短的球面谐波(SH)展开的、复杂谐波平面 波振幅的空间密度的表示。每个展开系数是角频率的函数,所述角频 率的函数可以通过时域函数来等价表示。因此,不失一般性地,实际 上可以假设完整的HOA声场表示由O个时域函数组成,其中O表示展开系数的数量。在下文中,这些时域函数将会等同地称为HOA系 数序列。
HOA表示的空间分辨率随着展开的最大阶N的增长而提高。不 幸地,展开系数O的数量随着阶N二次方地增长,具体地是O=(N+1)2。 例如,典型的使用阶N=4的HOA表示需要O=25的HOA(展开)系 数。根据上述考虑,给定期望的单声道采样速率fs以及每个样本的比特数量Nb,针对HOA表示的传输的总比特率由O·fs·Nb确定。使用每 个样本Nb=16个比特、以样本速率fs=48kHz传输阶N=4的HOA表示 将会导致19.2 MBits/s的比特率,这对于许多实际应用(例如流传输) 来说非常的高。因此,非常需要HOA表示的压缩。
发明内容
处理HOA表示(具有N>1)的压缩的现有方法是很少的。由E. Hellerud,I.Burnett,A Solvang and U.P.Svensson,″Encoding Higher Order Ambisonics withAAC″,124th AES Convention,Amsterdam,2008 提出的最直接的方法是使用高级音频编码(AAC)执行各个HOA系 数序列的直接编码,所述高级音频编码(AAC)是感知编码算法。然而,该方法固有的问题是从未听见的信号的感知编码。重建的回放信 号经常通过HOA系数序列的加权和来获得,并且当解压缩的HOA表 示在特定的扬声器配置上呈现时,有很大的可能会暴露感知编码噪音。 针对感知编码噪音暴露的主要问题是各个HOA系数序列之间的高互 相关性。由于各个HOA系数序列中的编码噪音信号经常是相互之间 不相关的,因此可能会出现感知编码噪音的有益的叠加,同时无噪音 HOA系数序列在叠加处消除。其它的问题是,这些互相关性导致感知 编码器效率下降。
为了使两种效果的程度降到最低,在EP 2469742 A2中提出了在 感知编码之前,将HOA表示变换为离散空间域中的等价表示。从形 式上看,该离散空间域是在一些离散方向处采样的、复杂谐波平面波 振幅的空间密度的时域等价物。因此离散空间域由O个传统时域信号 来表示,如果扬声器恰好位于与针对空间域变换假设的方向相同的方 向,则传统时域信号可以解释为从采样方向冲击的大体平面波,并且 传统时域信号将会与扬声器信号相对应。
向离散空间域的变换降低了各个空间域信号之间的互相关性,但 是没有完全消除这些互相关性。相对高的互相关性的示例是方向在由 空间域信号覆盖的相邻方向中间的方向的定向信号。
两种方法的主要缺点是:感知编码信号的数量是(N+1)2,并且针 对压缩的HOA表示的数据速率随着立体混响阶N二次方地增长。
为了降低感知编码信号的数量,专利申请EP 2665208 A1提出了 将HOA表示分解为给定的最大数量的主导定向信号和残余环境分量。 要感知编码的信号数量的降低是通过降低残余环境分量的阶来实现的。 该方法背后的原理是:在通过较低阶HOA表示使用足够精度来表示 残余的同时,保持关于主导定向信号的高空间分辨率。
只要满足关于声场的假设,该方法会很好的工作,即,假设声场 由少量的主导定向信号(代表使用完整的阶N编码的大体平面波函数) 和没有任何方向性的残余环境分量组成。然而,如果在分解之后残余 环境分量仍然包含一些主导定向分量,则阶降低会导致在分解之后的 呈现处明显可以感知到的错误。违反了假设的HOA表示的典型示例 是以低于N的阶编码的大体平面波。这样的阶低于N的大体平面波可 以产生于艺术创作,以便使得声源看起来更广泛,并且这样的阶低于 N的大体平面波还可以随着通过球形麦克风记录HOA声场表示而出 现。在两种示例中,由大量高度相关的空间域信号来表示声场(其解 释还可以参见Spatial resolution of Higher Order Ambisonics)。
本发明要解决的问题是消除专利申请EP 2665208A1中描述的过 程引起的缺点,由此也避免了上述其它引用的现有技术的缺点。该问 题是由权利要求1和3公开的方法解决的。权利要求2和4中公开了 利用这些方法的对应的设备。
本发明改进了专利申请EP 2665208 A1中描述的HOA声场表示压 缩过程。首先,像EP 2665208 A1中描述的,针对主导声源的存在对 HOA表示进行分析,估计所述主导声源的方向。利用主导声源方向的 信息,将HOA表示分解为多个表示大体平面波的主导定向信号和残 余分量。然而,将该残余HOA分量的阶变换到离散空间域,而不是 立即降低该残余HOA分量的阶,以便获得在表示残余HOA分量的均 匀采样方向处的大体平面波函数。此后,根据主导定向信号预测这些 平面波函数。该操作的原因在于,残余HOA分量的一部分可能与主导定向信号高度相关。
所述预测可以是简单的预测,从而只产生少量的辅助信息。在最 简单的情况下,预测由适当的缩放和延时组成。最后,预测误差变换 回HOA域,并且当作残余环境HOA分量,针对所述残余环境HOA 分量执行阶降低。
有利的是,从残余HOA分量中减去可预测的信号的效果是减小 其总功率并且保持主导定向信号的数量,并且通过这种方式来减少由 于阶降低导致的分解误差。
在原则上,本发明的压缩方法适用于压缩声场的高阶立体混响(表 示为HOA)表示,所述方法包括以下步骤:
-根据HOA系数的当前时帧,估计主导声源方向;
-基于所述HOA系数并且基于所述主导声源方向,将所述HOA 表示分解为时域中的主导定向信号和残余HOA分量,其中所述残余 HOA分量变换到离散空间域,以便在表示所述残余HOA分量的均匀 采样方向处获得平面波函数,并且其中所述平面波函数是根据所述主导定向信号预测的,由此提供描述所述预测的参数,并且对应的预测 误差变换回HOA域;
-将所述残余HOA分量的当前阶降低到更低的阶,得到降阶残余 HOA分量;
-对所述降阶残余HOA分量进行去相关,以获得对应的残余 HOA分量时域信号;
-对所述主导定向信号和所述残余HOA分量时域信号进行感知 编码,从而提供压缩的主导定向信号和压缩的残余分量信号。
原则上,本发明的压缩设备适用于压缩声场的高阶立体混响(表 示为HOA)表示,所述设备包括:
-适于根据HOA系数的当前时间帧来估计主导声源方向的装置;
-适于基于所述HOA系数并且基于所述主导声源方向,将所述 HOA表示分解为时域中的主导定向信号和残余HOA分量的装置,其 中所述残余HOA分量变换到离散空间域,以便在表示所述残余HOA 分量的均匀采样方向处获得平面波函数,并且其中所述平面波函数是根据所述主导定向信号预测的,由此提供描述所述预测的参数,并且 对应的预测误差变换回HOA域;
-适于将所述残余HOA分量的当前阶降低到更低的阶,得到降阶 残余HOA分量的装置;
-适于对所述降阶残余HOA分量进行去相关,以获得对应的残余HOA分量时域信号的装置;
-适于对所述主导定向信号和所述残余HOA分量时域信号进行 感知编码,从而提供解压缩的主导定向信号和解压缩的残余分量信号 的装置;
原则上,本发明的解压缩方法适用于解压缩根据上述压缩方法压 缩的高阶立体混响表示,所述解压缩方法包括以下步骤:
-对所压缩的主导定向信号和所压缩的残余分量信号进行感知解 码,从而提供解压缩的主导定向信号和表示空间域中的残余HOA分 量的解压缩的时域信号;
-对所述解压缩的时域信号进行重新相关,来获得对应的降阶残 余HOA分量;
-将所述降阶残余HOA分量的阶增大到原始的阶,从而提供对应 的解压缩残余HOA分量;
-使用所述解压缩主导定向信号、所述原始阶解压缩残余HOA 分量、所述估计的主导声源方向和描述所述预测的所述参数来组成对 应的HOA系数的解压缩且重新组成的帧。
在原则上,本发明的解压缩设备适于解压缩根据上述压缩方法压 缩的高阶立体混响表示,所述解压缩设备包括:
-适于对所压缩的主导定向信号和所压缩的残余分量信号进行感 知解码,从而提供解压缩的主导定向信号和表示空间域中的残余HOA 分量的解压缩的时域信号的装置;
-适于对所述解压缩的时域信号进行重新相关,以获得对应的降 阶残余HOA分量的装置;
-适于将所述降阶残余HOA分量的阶增大到原始的阶,从而提供 对应的解压缩的残余HOA分量的装置;
-适于通过使用所述解压缩的主导定向信号、所述原始阶解压缩 的残余HOA分量、所述估计的主导声源方向和描述所述预测的所述 参数,来组成对应的HOA系数的解压缩且重新组成的帧的装置。
在对应的从属权利要求中公开了有利的附加实施例。
附图说明
参照附图对本发明的示例性实施例进行描述,其中:
图1a压缩步骤1:将HOA信号分解为多个主导定向信号、残 余环境HOA分量和辅助信息;
图1b压缩步骤2:阶降低,针对环境HOA分量进行去相关, 以及对两个分量进行感知编码;
图2a解压缩步骤1:对时域信号进行感知解码,对表示残余 环境HOA分量的信号进行重新相关,以及阶增大;
图2b解压缩步骤2:总HOA表示的组成;
图3 HOA分解
图4 HOA组成
图5 球形坐标系
具体实施方式
压缩过程
根据本发明的压缩过程包括分别在图1a和图1b中示出的两个连 续的步骤。各个信号的准确定义在HOA分解和重新组成的详细描述 部分中描述。使用了针对长度B的HOA系数序列的非重叠输入帧D(k) 的压缩的逐帧处理,其中k表示帧索引。关于方程式(42)中指定的 HOA系数序列,帧定义如下:
D(k):=[d((kB+1)Ts)d((kB+2)Ts)…d((kB+B)Ts)] (1)
其中Ts表示采样周期。
在图1a中,HOA系数序列的帧D(k)输入到主导声源方向估计步 骤或阶段11,所述主导声源方向估计步骤或阶段针对主导定向信号的 存在来分析HOA表示,估计主导定向信号的方向。可以例如通过专 利申请EP 2665208 A1中描述的处理过程来执行方向的估计。估计的 方向由来表示,其中表示方向估计的最大数量。假 设估计的方向如下设置在矩阵中:
隐含地假设通过将方向估计分配给来自先前的帧的方向估计,来 对所述方向估计进行适当的整理。因此,假设各个方向估计的时间序 列描述主导声源的方向轨迹。具体地,如果第d个主导声源不应当运 行,则可以通过向分配非有效值来对其进行指示。然后,在 分解步骤或阶段12中,利用中估计的方向将HOA表示分解为个最大主导定向信号XDIR(k-1)、描述根据主导定向信号预测的残余 HOA分量的空间域信号的预测的一些参数ζ(k-1)、以及表示预测误 差的环境HOA分量DA(k-2)。在HOA解压缩部分提供了所述解压 缩的详细描述。
在图1b中示出了定向信号XDIR(k-1)的感知编码和残余环境 HOA分量DA(k-2)的感知编码。定向信号XDIR(k-1)是能够使用任 何现有感知压缩技术来分别压缩的传统时域信号。环境HOA域分量 DA(k-2)的压缩在两个连续的步骤或阶段中执行。在阶降低的步骤或阶段13中执行立体混响的阶NRED的降低,其中例如NRED=1,得到 环境HOA分量DA,RED(k-2)。通过在DA(k-2)中保留(NRED+1)2个 HOA系数并且丢弃其它系数来实现这样的阶的降低。在解码器一侧, 如下文的解释,针对省略的值,附加对应的零值。
应当注意的是,与专利申请EP 2665208 A1中的方法相比,由于 总功率以及残余环境HOA分量的方向性的残余量较小,所以降低的 阶NRED一般来说可以选择为更小的。因此与专利申请EP 2665208 A1 相比,所述阶的降低会导致更小的误差。
在后面的去相关步骤或阶段14中,对表示阶降低的环境HOA分 量DA,RED(k-2)的HOA系数序列进行去相关,以获得时域信号 WA,RED(k-2),所述时域信号WA,RED(k-2)输入到(一组)并行的感 知编码器或按照任何已知感知压缩技术操作的压缩器15。执行去相关 以便在解压缩之后呈现HOA表示时,避免暴露感知编码噪音(其解 释参见专利申请EP12305860.4)。通过将DA,RED(k-2)转化为变换为 空间域中ORED个等价信号可以实现近似的去相关,所述变换通过应用 专利申请EP 2469742 A2中描述的球谐变换来实现。
备选地,可以使用专利申请EP 12305861.2中提出的自适应球谐 变换,其中将采样方向的网格旋转以实现可能的最佳去相关效果。另 一个备选去相关技术是专利申请EP12305860.4中描述的 Karhunen-Loève变换(KLT)。应当注意的是,针对最后两种去相关,要提供表示为α(k-2)的某种辅助信息以便能够在HOA解压缩阶段 对去相关进行恢复。
在一个实施例中,联合地执行所有时域信号XDIR(k-1)和 DA,RED(k-2)的感知压缩,以便提高编码效率。
感知编码的输出是压缩的定向信号和压缩的环境时 域信号
解压缩步骤
图2a和图2b中示出了解压缩过程。与压缩类似,所述解压缩过 程由两个连续的步骤组成。在图2a中,在感知解码或解压缩步骤或阶 段21中执行对定向信号和表示残余环境HOA分量的时域 信号的感知解压缩。在重新相关步骤或阶段22中对得 到的感知解压缩时域信号进行重新相关,以便提供阶 NRED的残余分量HOA表示任选地,重新相关可以使用 传输的或存储的(取决于所使用的去相关方法)参数α(k-2),以与 针对步骤/阶段14描述的两种备选过程相反的方式来执行。此后,在 阶增大步骤或阶段23中,通过阶增大,根据估计阶N的适当的HOA表示阶增大通过将对应的‘零’值行附加 到来实现,由此假设关于更高阶的HOA系数具有零值。
在图2b中,在组成步骤或阶段24中,根据解压缩的主导定向信 号连同对应的方向和预测参数ζ(k-1),以及根据残余 环境HOA分量来重新组成总的HOA表示,得到解压缩 且重新组成的HOA系数的帧
在联合地执行所有时域信号XDIR(k-1)和WA,RED(k-2)的感知 压缩以便提高编码效率的情况下,也以对应的方式联合地执行压缩的 定向信号和压缩的时域信号的感知解压缩。
在HOA重新组织部分中提供对重新组织的详细描述。
HOA分解
图3中给出了示出针对HOA分解执行的操作的框图。该操作被 总结如下:首先,计算平滑的主导定向信号XDIR(k-1),并且将其输 出用于感知压缩。接着,由O个定向信号来表示主导定 向信号的HOA表示DDIR(k-1)与原始HOA表示D(k-1)之间的残余, 其中所述O个定向信号可以被认为是均匀分布的方向上的大体平面波。 根据主导定向信号XDIR(k-1)对这些定向信号进行预测,输出了预测 参数ζ(k-1)。最后,计算并输出原始HOA表示D(k-2)与主导定向 信号的HOA表示DDIR(k-1)之间的残余DA(k-2)以及均匀分布的方 向上的预测的定向信号的HOA表示
在描述细节之前,需要指出的是,在组成期间,连续帧之间的方 向变化可以导致所有计算的信号中断。因此,首先计算针对重叠帧的 相应信号的瞬时估计,所述瞬时估计的长度为2B。第二,使用适当的 窗口函数使连续的重叠帧的结果平滑。然而,每次平滑引入了单个帧 的迟滞。
计算瞬时主导定向信号
步骤或阶段30中针对HOA系数序列的当前帧D(k)根据中 的估计的声源方向计算瞬时主导方向信号的计算是基于以下文献中描 述的模式匹配:M.A.Poletti,″Three-Dimensional Surround Sound Systems Based on Spherical Harmonics″,J.Audio Eng.Soc,53(11), pages 1004-1025,2005。具体的,对HOA表示得到给定HOA信号的 最佳近似的定向信号进行搜索。
此外,不失一般性地,假设一向量可以唯一地指定有效主导声源 的每个方向估计所述向量包含依据以下公式的倾角 θDOM,d(k)∈[0,π]和方位角φDOM,d(k)∈[0,2π](其示意参见图5):
首先,根据
对基于有效声源的方向估计的模式矩阵进行计算,其
在方程式(4)中,DACT(k)表示针对第k个帧的有效方向的数量,并且 dACT,j(k)(1≤j≤dACT(k))指示它们的索引。表示实值球谐函数,所 述实值球谐函数在实值球谐函数的定义部分中定义。
第二,计算定义如下的包含第(k-1)个帧和第k个帧的所有主导 定向信号的瞬时估计的矩阵
其中
这通过两个步骤来实现。在第一个步骤中,将对应于无效方向的行中 的定向信号样本设置为零,即
其中指示有效方向的集。在第二个步骤中,通过首先将对应于 有效方向的定向信号样本排列在根据以下公式的矩阵中,来获得对应 于有效方向的定向信号样本:
然后对该矩阵进行计算,以使误差的欧几里德范数
最小化。解是由以下方程式给出的:
时间平滑
针对步骤或阶段31,只针对定向信号解释了平滑,因为其 它类型的信号的平滑能够以完全相似的方式来完成。通过以下的适当 窗函数来对样本被包含在根据方程式(6)的矩阵中的定向信 号估计进行加窗:
该窗函数必须满足这样的条件:它与其在以下重叠区域中的偏移 版本(假设B样本的偏移)之和为‘1’:
由以下方程式定义的周期性Hann窗给出了针对这样的窗函数的 示例:
通过根据以下方程式的加窗的瞬时估计的适当叠加来对第(k-1) 个帧的平滑的定向信号进行计算:
针对第(k-1)个帧的所有平滑的定向信号的样本被设置在以下的 矩阵中:
其中
平滑的主导定向信号XDIR,d(l)应当是连续地输入到感知编码器的 连续信号。
计算平滑的主导定向信号的HOA表示
在步骤或阶段32中,基于连续信号XDIR,d(l),根据XDIR(k-1)和 对平滑的主导定向信号的HOA表示进行计算,以便对将要针 对HOA组成所执行的操作相同的操作进行模仿。由于连续帧之间的 方向估计的变化会导致中断,再一次对长度为2B的重叠帧的瞬时 HOA表示进行计算,并且通过使用适当的窗函数对连续重叠帧的结果 进行平滑。因此,通过以下方程式来获得HOA表示DDIR(k-1):
DDIR(k-1)=ΞACT(k)XDIR,ACT,WIN1(k-1)+ΞACT(k-1)XDIR,ACT,WIN2(k-1) (18),
其中,
并且
通过均匀网格上的定向信号来表示残余HOA表示
在步骤或阶段33中,根据DDIR(k-1)和D(k-1)(即通过帧延时 381延时的D(k)D(k)),对由均匀网格上的定向信号表示的残余HOA 表示进行计算。该操作的目的是:获得从一些固定的、几乎均匀分布 的方向(1≤o≤O,也被称为网格方向)冲击的定向信号(即大 体平面波函数),以表示残余 [D(k-2) D(k-1)]-[DDIR(k-2) DDIR(k-1)]
首先,关于网格方向,如下计算模式矩阵ΞGRID
其中
由于在整个压缩过程期间网格方向是固定的,所以模式矩阵 ΞGRID只需要计算一次。
如下获得在对应的网格上的定向信号:
根据主导定向信号预测均匀网格上的定向信号
在步骤或阶段34中,根据和XDIR(k-1),对均匀网格上 的定向信号进行预测。根据定向信号的在网格方向(1≤o≤O) 组成的均匀网格上的定向信号的预测是基于针对平滑目的的两个连续 帧,即网格信号(长度为2B)的展开的帧是根据平滑的主 导定向信号的展开的帧:
预测的。
首先,包含在中的每个网格信号 (1≤o≤O)分配到包含在中的主导定向信号 中。所述分配可以基于网格信号与所有的 主导定向信号之间的归一化互相关函数的计算。特别是,该主导定向 信号被分配到网格信号,这提供归一化互相关函数的最高值。分配的 结果可以由将第o个网格信号分配到第个主导定向信号的分 配函数来表示。
第二,通过分配的主导定向信号来预测每个网 格信号根据分配的主导定向信号通过延时和缩放,如下对预测的网格信号进行计算:
其中,Ko(k-1)表示缩放因子并且Δo(k-1)指示样本延时。选择这些参 数来使预测误差最小化。
如果预测误差的功率大于网格信号本身的功率,则假设预测已经 失败。然后,对应的预测参数可以设置为任何非有效值。
应当注意的是,其它类型的预测也是可以的。例如,替代计算全 频带缩放因子,针对感知取向频带来确定缩放因子也是可以的。然而, 该操作改进预测是以辅助信息量增加为代价的。
所有的预测参数可以如下方程式设置在参数矩阵中:
假设所有的预测信号(1≤o≤O)设置在矩阵中。
计算预测的均匀网格上的定向信号的HOA表示
在步骤或阶段35中,根据以下公式,根据计算预测 的网格信号的HOA表示:
计算残余环境声场分量的HOA表示
在步骤或阶段37中,通过公式:
根据的时间平滑版本(在步骤/阶段36中)根据D(k)的二帧延时版本(延时381和383)D(k-2)、和DDIR(k-1)的 帧延时版本(延时382)DDIR(k-2),对残余环境声场分量的HOA表 示进行计算。
HOA表示
在对图4中的各个步骤或阶段的过程进行详细描述之前,提供摘 要。使用预测参数根据解码的主导定向信号预测关 于均匀分布的方向的定向信号接着,总的HOA表示 由主导定向信号的HOA表示预测的定向信号的 HOA表示和残余环境HOA分量组成。
计算主导定向信号的HOA表示
输入到步骤或阶段41中,用来确定主导定向信 号的HOA表示。在已经根据方向估计计算了模式矩阵 ΞACT(k)和ΞACT(k-1)之后,基于第k个和第(k-1)个帧的有效声场的方 向估计,通过以下方程式来获得主导定向信号的HOA表示:
其中,
并且
根据主导定向信号预测均匀网格上的定向信号
输入到步骤或阶段43中,用来根据主导定 向信号预测均匀网格上的定向信号。预测的均匀网格上的定向信号的 展开的帧由根据以下方程式的单元组成:
所述单元是通过以下方程式根据主导定向信号预测的:
计算预测的均匀网格上的定向信号的HOA表示
在计算均匀网格上的预测的定向信号的HOA表示的步骤或阶段 44中,通过方程式
来获得预测的网格定向信号的HOA表示,其中ΞGRID表示关于预 定义网格方向的模式矩阵(关于定义,参见方程式(21))。
组成HOA声场表示
在步骤或阶段46中,如以下方程式,根据(即由帧延时 42延时的(是步骤/阶段45中的时间平滑版 本的)来最终组成总的HOA生成表示:
高阶立体混响的基本原理
高阶立体混响是基于感兴趣的紧凑区域中的声场的描述,假设所 述紧凑区域中没有声源。在这种情况下,在该感兴趣的区域中,在时 间t和位置x的声压p(t,x)的时-空特性物理上完全由均匀波方程来确 定。下述内容基于图5中示出的球形坐标系。X轴指向正面位置,y 轴指向左方,并且z轴指向上方。通过半径r>0(即到坐标原点的距 离)、从极轴z测量的倾角θ∈[0,π]和在x-y平面中从x轴逆时针方向 测量的方位角φ∈[0,π]来表示空间中的位置x=(r,θ,φ)T。(·)T表示转置。
可以看出(参见E.G.Williams,″Fourier Acoustics″,volume 93 of AppliedMathematical Sciences,Academic Press,1999),声压关于时间 的傅里叶变换(由表示),即
(其中ω表示角频率,i表示虚数单位)可以如下展开成一系列 球形函数
其中cs表示声音的速度,并且k表示角波数,所述角波数k通过公式 与ω相关,jn(·)表示第一类球形贝赛尔函数,并且表示 阶为n、角度为m(在实值球谐函数部分定义了)的实值球谐函数。 展开系数只取决于角波数k。需要注意的是,这里已经隐性地 假设声压是空间频带受限的。因此,该系列关于阶索引n在上限N处 是截断的,所述上限N被称为HOA表示的阶。
如果声场由不同角频率ω的谐波平面波的无穷大量的叠加来表 示,并且声场可以从由角度元组(θ,φ)指定的所有可能的方向到达,则 可以看出(参见B.Rafaely,″Plane-wave Decomposition of the Sound Field on a Sphere by SphericalConvolution″,J.Acoust.Soc.Am.,4(116), pages 2149-2157,2004),对应的平面波复振幅函数可以由以下球谐函 数展开来表示:
其中展开系数通过以下方程式与展开系数相关:
假设各个系数是角频率ω的函数,傅里叶逆变换(由 表示)的应用给每个阶n和角度m提供了如下的时域函数:
所述函数可以收集在如下的单个矢量中:
由n(n+1)+1+m来给出矢量d(t)中的时域函数的位置索 引。
最终的立体混响格式提供使用采样频率fs的d(t)的采样的版本如 下:
其中Ts=1/fs表示采样周期。d(lTs)单元被称为立体混响系数。需要 注意的是,时域信号以及因此立体混响系数是实值的。
实值的球谐函数的定义
实值的球谐函数由以下方程式给出:
其中
使用勒让德多项式Pn(x),并且并不像上文提到的E.G.Williams textbook,在不使用Condon-Shortley项的情况下,如以下方程式定义 关联的Legendre函数Pn,m(x):
高阶立体混响的空间分辨率
从方向Ω0=(θ0,φ0)T到达的平面波函数x(t)在HOA中由以下方程 式来表示:
平面波振幅的对应的空间密度由以下公式给出:
可以从方程式(48)中看出,它是大体平面波函数x(t)和空间分 散函数vN(θ)的乘积,空间分散函数vN(θ)可以被视为仅取决于Ω和Ω0之 间的、具有如下特性的角度Θ:
cosΘ=cosθcosθ0+cos(φ-φ0)sinθsinθ0 (49)。
如预期的,在无限的阶的限制下,即N→∞,空间分散函数转换 为狄拉克delta函数δ(·),即
然而,在有限阶N的情况下,来自方向Ω0的大体平面波的贡献涂 到相邻方向,模糊程度随着阶的提高而减少的。图6中示出了针对不 同的N值的归一化函数vN(θ)的曲线。应当指出的是,任何平面波振幅 的空间密度的时域特性的方向Ω是它在其它任何方向上的特性的倍 数。特别是,针对一些固定方向Ω1和Ω2,函数d(t,Ω1)和d(t,Ω2)关于时 间t相互高度关联。
离散空间域
如果平面波振幅的空间密度在数量为O的、在单位球面上几乎均 匀分布的空间方向Ω0(1≤o≤O)上是离散的,则获得O个定向信号 d(t,Ωo)。将这些信号集合到如以下方程式的矢量中:
dSPAT(t):=[d(t,Ω1) … d(t,Ω0)]T (51)
通过使用方程式(47)可以证明,可以通过单一矩阵乘法,根据 方程式(41)中限定的连续的立体混响表示d(t)来计算该矢量,所述 单一矩阵乘法的方程式为:
dSPAT(t)=ΨHd(t), (52)
其中(·)H指示联合置换和共轭,并且Ψ表示由以下方程式限定的模式 矩阵:
Ψ:=[S1 … SO] (53),
其中
由于方向Ω0在单位球面上是几乎均匀分布的,所以模式矩阵一般 来说是可逆的。因此,通过方程式
d(t)=Ψ-HdSPAT(t) (55)
根据定向信号d(t,Ωo)可以计算连续的立体混响表示。两个方程式构在 立体混响表示与空间域之间的变换和逆变换。在该应用中,这些变换 被称为球谐变换和球谐逆变换。
因为在单位球面上方向Ω0是几乎均匀分布的,ΨH≈Ψ-1 (56) 这证明了在方程式(52)中使用Ψ-1而不使用ΨH是可行的。有利地, 上述所有的关系对于离散时域也是有效的。
在编码侧以及解码侧,本发明的过程可以通过单一处理器或电路 来执行,或者通过若干个处理器或电路并行操作和/或在本发明过程的 不同部分中操作。
本发明能够用于处理可以在家庭环境中的扬声器设备或电影院中 的扬声器设备上呈现或播放的对应的声音信号。

Claims (21)

1.一种用于压缩声场的高阶立体混响HOA表示的方法,所述方法包括:
-根据HOA系数D(k)的当前时间帧,估计(11)主导声源方向
-基于所述HOA系数D(k)和所述主导声源方向将所述HOA表示分解(12)为时域中的主导定向信号XDIR(k-1)和残余HOA分量DA(k-2),其中,所述残余HOA分量变换到离散空间域,以便获得表示(33)所述残余HOA分量的在均匀采样方向上的平面波函数,并且其中根据所述主导定向信号XDIR(k-1)预测(34)所述平面波函数,由此提供描述所述预测的参数ζ(k-1),并且对应的预测误差变换回(35)HOA域中;
-将所述残余HOA分量DA(k-2)的当前阶N降低(13)到较低的阶NRED,得到降低阶的残余HOA分量DA,RED(k-2);
-对所述降低阶的残余HOA分量DA,RED(k-2)进行去相关(14),以获得对应的残余HOA分量时域信号WA,RED(k-2);
-对所述主导定向信号XDIR(k-1)和所述残余HOA分量时域信号WA,RED(k-2)进行感知编码(15),从而提供压缩的主导定向信号和压缩的残余分量信号
2.根据权利要求1所述的方法,其中,通过使用球谐变换将所述降低阶的残余HOA分量变换为空间域中对应阶数个等价信号,来执行所述降低阶的残余HOA分量DA,RED(k-2)的所述去相关(14)。
3.根据权利要求1所述的方法,其中,通过使用球谐变换将所述降低阶的残余HOA分量DA,RED(k-2)变换为空间域中对应阶数个等价信号,并通过提供辅助信息α(k-2),来执行所述降低阶的残余HOA分量的所述去相关(14),其中,在球谐变换中对采样方向的网格进行旋转,所述辅助信息α(k-2)能够实现所述去相关的恢复。
4.根据权利要求1至3中任一项权利要求所述的方法,其中,联合地执行所述主导定向信号XDIR(k-1)和所述残余HOA分量时域信号WA,RED(k-2)的感知压缩(15)。
5.根据权利要求1-3中任一项权利要求所述的方法,其中,所述分解(12)包括:
-根据HOA系数的当前帧D(k)的估计的声源方向来计算(30)主导定向信号然后进行时间平滑(31),得到平滑的主导定向信号XDIR(k-1);
-根据所估计的声源方向和所平滑的主导定向信号XDIR(k-1)来计算(32)平滑的主导定向信号DDIR(k-1)的HOA表示;
-通过均匀网格上的定向信号来表示(33)对应的残余HOA表示;
-根据所述平滑的主导定向信号XDIR(k-1)和由所述定向信号表示的所述残余HOA表示来获取预测(34)的均匀网格上的定向信号并且由此计算(35)预测的均匀网格上的定向信号的HOA表示,然后进行时间平滑(36);
-根据所平滑的预测的均匀网格上的定向信号HOA系数的所述当前帧D(k)的二帧延时版本、和所述平滑的主导定向信号XDIR(k-1)的帧延时版本,计算(37)残余环境声场分量的HOA表示DA(k-2)。
6.根据权利要求5所述的方法,其中,在预测(34)的均匀网格上的定向信号的获取中,通过延时和全频带缩放,根据分配的主导定向信号来计算预测的网格信号
7.根据权利要求5所述的方法,其中,在预测(34)的均匀网格上的定向信号的获取中,确定针对感知取向频带的缩放因子。
8.一种用于解压缩根据权利要求1所述的方法压缩的高阶立体混响表示的方法,所述解压缩方法包括:
-对所述压缩的主导定向信号和所述压缩的残余分量信号进行感知解码(21),从而提供解压缩的主导定向信号和表示空间域中的残余HOA分量的解压缩的时域信号
-对所述解压缩的时域信号进行重新相关(22),以获得对应的降低阶的残余HOA分量
-将所述降低阶的残余HOA分量的阶NRED增大(23)到原始的阶N,从而提供对应的解压缩残余HOA分量
-使用所述解压缩的主导定向信号原始阶的所述解压缩残余HOA分量所述估计(11)的主导声源方向和描述所述预测的所述参数ζ(k-1)来组成(24)对应的HOA系数的解压缩且重新组成的帧
9.根据权利要求8所述的方法,其中,联合地执行所述压缩的定向信号和所述压缩的时域信号的感知解压缩(21)。
10.根据权利要求8或9所述的方法,其中,所述组成(24)包括:
-根据HOA系数的当前帧D(k)的所述估计的声源方向和所述解压缩的主导定向信号计算(41)主导定向信号的HOA表示
-根据所述解压缩的主导定向信号和描述所述预测的所述参数ζ(k-1)预测(43)均匀网格上的定向信号并且由此计算(44)预测的均匀网格上的定向信号的HOA表示然后进行时间平滑(45,);
-由所平滑的预测的均匀网格上的定向信号的HOA表示所述主导定向信号的HOA表示的帧延时(42)版本和所述解压缩的残余HOA分量来组成(46)HOA声场表示
11.一种用于压缩声场的高阶立体混响HOA表示的设备,所述设备包括:
-适于根据HOA系数D(k)的当前时间帧来估计主导声源方向的装置(11);
-适于基于所述HOA系数D(k)和所述主导声源方向将所述HOA表示分解为时域中的主导定向信号XDIR(k-1)和残余HOA分量DA(k-2)的装置(12),其中,所述残余HOA分量变换到离散空间域,以便获得表示(33)所述残余HOA分量的在均匀采样方向上的平面波函数,并且其中根据所述主导定向信号XDIR(k-1)预测(34)所述平面波函数,由此提供描述所述预测的参数ζ(k-1),并且对应的预测误差变换回(35)HOA域中;
-适于将所述残余HOA分量DA(k-2)的当前阶N降低到较低的阶NRED,产生降低阶的残余HOA分量DA,RED(k-2)的装置(13);
-适于对所述降低阶的残余HOA分量DA,RED(k-2)进行去相关,以获得对应的残余HOA分量时域信号WA,RED(k-2)的装置(14);
-适于对所述主导定向信号XDIR(k-1)和所述残余HOA分量时域信号WA,RED(k-2)进行感知编码,从而提供压缩的主导定向信号和压缩的残余分量信号的装置(15)。
12.根据权利要求11所述的设备,其中,通过使用球谐变换将所述降低阶的残余HOA分量DA,RED(k-2)变换为空间域中对应阶数个等价信号,来执行所述降低阶的残余HOA分量的所述去相关(14)。
13.根据权利要求11所述的设备,其中,通过使用球谐变换将所述降低阶的残余HOA分量DA,RED(k-2)变换为空间域中对应阶数个等价信号,并通过提供辅助信息α(k-2),来执行所述降低阶的残余HOA分量的所述去相关(14),其中,在球谐变换中对采样方向的网格进行旋转,所述辅助信息α(k-2)能够实现所述去相关的恢复。
14.根据权利要求11至13中任一项权利要求所述的设备,其中,联合地执行所述主导定向信号XDIR(k-1)和所述残余HOA分量时域信号WA,RED(k-2)的感知压缩(15)。
15.根据权利要求11至13中任一项权利要求所述的设备,其中,所述分解包括:
-根据HOA系数的当前帧D(k)的估计的声源方向来计算(30)主导定向信号然后进行时间平滑(31),得到平滑的主导定向信号XDIR(k-1);
-根据所估计的声源方向和所平滑的主导定向信号XDIR(k-1)来计算(32)平滑的主导定向信号DDIR(k-1)的HOA表示;
-通过均匀网格上的定向信号来表示(33)对应的残余HOA表示;
-根据所述平滑的主导定向信号XDIR(k-1)和由定向信号表示的所述残余HOA表示来获取预测(34)的均匀网格上的定向信号并且由此计算(35)预测的均匀网格上的定向信号的HOA表示,然后进行时间平滑(36);
-根据所平滑的预测的均匀网格上的定向信号HOA系数的所述当前帧D(k)的二帧延时版本、和所述平滑的主导定向信号XDIR(k-1)的帧延时版本,计算(37)残余环境声场分量的HOA表示DA(k-2)。
16.根据权利要求15所述的设备,其中,在预测(34)的均匀网格上的定向信号的获取中,通过延时和全频带缩放,根据分配的主导定向信号来计算预测的网格信号
17.根据权利要求15所述的设备,其中,在预测(34)的均匀网格上的定向信号的获取中,确定针对感知取向频带的缩放因子。
18.一种用于解压缩根据权利要求1所述的方法压缩的高阶立体混响表示的设备,所述设备包括:
-适于对所述压缩的主导定向信号和所述压缩的残余分量信号进行感知解码,从而提供解压缩的主导定向信号和表示空间域中的残余HOA分量的解压缩的时域信号的装置(21);
-适于对所述解压缩的时域信号进行重新相关,以获得对应的降低阶的残余HOA分量的装置(22);
-适于将所述降低阶的残余HOA分量的阶NRED增大到原始的阶N,从而提供对应的解压缩残余HOA分量的装置(23);
-适于使用所述解压缩的主导定向信号原始阶的所述解压缩残余HOA分量所述估计(11)的主导声源方向和描述所述预测的所述参数ζ(k-1)来组成(24)对应的HOA系数的解压缩且重新组成的帧的装置(24)。
19.根据权利要求18所述的设备,其中,联合地执行所述压缩的定向信号和所述压缩的时域信号的感知解压缩(21)。
20.根据权利要求18或19所述的设备,其中,所述组成(24)包括:
-根据HOA系数的当前帧D(k)的所述估计的声源方向和所述解压缩的主导定向信号计算(41)主导定向信号的HOA表示
-根据所述解压缩的主导定向信号和描述所述预测的所述参数ζ(k-1)预测(43)均匀网格上的定向信号并且由此计算(44)预测的均匀网格上的定向信号的HOA表示然后进行时间平滑(45,);
-由所平滑的预测的均匀网格上的定向信号的HOA表示所述主导定向信号的HOA表示的帧延时(42)版本和所述解压缩的残余HOA分量来组成(46)HOA声场表示
21.一种通过根据权利要求1-7中任一项权利要求所述的方法获得编码的数字音频信号的方法。
CN201380064856.9A 2012-12-12 2013-12-04 对声场的高阶立体混响表示进行压缩和解压缩的方法和设备 Active CN104854655B (zh)

Priority Applications (8)

Application Number Priority Date Filing Date Title
CN202310889797.4A CN117037812A (zh) 2012-12-12 2013-12-04 对声场的高阶立体混响表示进行压缩和解压缩的方法和设备
CN202311300470.5A CN117392989A (zh) 2012-12-12 2013-12-04 对声场的高阶立体混响表示进行压缩和解压缩的方法和设备
CN202310889802.1A CN117037813A (zh) 2012-12-12 2013-12-04 对声场的高阶立体混响表示进行压缩和解压缩的方法和设备
CN201910024898.9A CN109448743B (zh) 2012-12-12 2013-12-04 对声场的高阶立体混响表示进行压缩和解压缩的方法和设备
CN201910024895.5A CN109448742B (zh) 2012-12-12 2013-12-04 对声场的高阶立体混响表示进行压缩和解压缩的方法和设备
CN201910024905.5A CN109616130B (zh) 2012-12-12 2013-12-04 对声场的高阶立体混响表示进行压缩和解压缩的方法和设备
CN201910024894.0A CN109410965B (zh) 2012-12-12 2013-12-04 对声场的高阶立体混响表示进行压缩和解压缩的方法和设备
CN201910024906.XA CN109545235B (zh) 2012-12-12 2013-12-04 对声场的高阶立体混响表示进行压缩和解压缩的方法和设备

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP12306569.0A EP2743922A1 (en) 2012-12-12 2012-12-12 Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field
EP12306569.0 2012-12-12
PCT/EP2013/075559 WO2014090660A1 (en) 2012-12-12 2013-12-04 Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field

Related Child Applications (8)

Application Number Title Priority Date Filing Date
CN201910024898.9A Division CN109448743B (zh) 2012-12-12 2013-12-04 对声场的高阶立体混响表示进行压缩和解压缩的方法和设备
CN201910024905.5A Division CN109616130B (zh) 2012-12-12 2013-12-04 对声场的高阶立体混响表示进行压缩和解压缩的方法和设备
CN202311300470.5A Division CN117392989A (zh) 2012-12-12 2013-12-04 对声场的高阶立体混响表示进行压缩和解压缩的方法和设备
CN201910024894.0A Division CN109410965B (zh) 2012-12-12 2013-12-04 对声场的高阶立体混响表示进行压缩和解压缩的方法和设备
CN202310889797.4A Division CN117037812A (zh) 2012-12-12 2013-12-04 对声场的高阶立体混响表示进行压缩和解压缩的方法和设备
CN201910024906.XA Division CN109545235B (zh) 2012-12-12 2013-12-04 对声场的高阶立体混响表示进行压缩和解压缩的方法和设备
CN201910024895.5A Division CN109448742B (zh) 2012-12-12 2013-12-04 对声场的高阶立体混响表示进行压缩和解压缩的方法和设备
CN202310889802.1A Division CN117037813A (zh) 2012-12-12 2013-12-04 对声场的高阶立体混响表示进行压缩和解压缩的方法和设备

Publications (2)

Publication Number Publication Date
CN104854655A CN104854655A (zh) 2015-08-19
CN104854655B true CN104854655B (zh) 2019-02-19

Family

ID=47715805

Family Applications (9)

Application Number Title Priority Date Filing Date
CN202310889797.4A Pending CN117037812A (zh) 2012-12-12 2013-12-04 对声场的高阶立体混响表示进行压缩和解压缩的方法和设备
CN201910024905.5A Active CN109616130B (zh) 2012-12-12 2013-12-04 对声场的高阶立体混响表示进行压缩和解压缩的方法和设备
CN201910024894.0A Active CN109410965B (zh) 2012-12-12 2013-12-04 对声场的高阶立体混响表示进行压缩和解压缩的方法和设备
CN202310889802.1A Pending CN117037813A (zh) 2012-12-12 2013-12-04 对声场的高阶立体混响表示进行压缩和解压缩的方法和设备
CN202311300470.5A Pending CN117392989A (zh) 2012-12-12 2013-12-04 对声场的高阶立体混响表示进行压缩和解压缩的方法和设备
CN201910024895.5A Active CN109448742B (zh) 2012-12-12 2013-12-04 对声场的高阶立体混响表示进行压缩和解压缩的方法和设备
CN201910024898.9A Active CN109448743B (zh) 2012-12-12 2013-12-04 对声场的高阶立体混响表示进行压缩和解压缩的方法和设备
CN201380064856.9A Active CN104854655B (zh) 2012-12-12 2013-12-04 对声场的高阶立体混响表示进行压缩和解压缩的方法和设备
CN201910024906.XA Active CN109545235B (zh) 2012-12-12 2013-12-04 对声场的高阶立体混响表示进行压缩和解压缩的方法和设备

Family Applications Before (7)

Application Number Title Priority Date Filing Date
CN202310889797.4A Pending CN117037812A (zh) 2012-12-12 2013-12-04 对声场的高阶立体混响表示进行压缩和解压缩的方法和设备
CN201910024905.5A Active CN109616130B (zh) 2012-12-12 2013-12-04 对声场的高阶立体混响表示进行压缩和解压缩的方法和设备
CN201910024894.0A Active CN109410965B (zh) 2012-12-12 2013-12-04 对声场的高阶立体混响表示进行压缩和解压缩的方法和设备
CN202310889802.1A Pending CN117037813A (zh) 2012-12-12 2013-12-04 对声场的高阶立体混响表示进行压缩和解压缩的方法和设备
CN202311300470.5A Pending CN117392989A (zh) 2012-12-12 2013-12-04 对声场的高阶立体混响表示进行压缩和解压缩的方法和设备
CN201910024895.5A Active CN109448742B (zh) 2012-12-12 2013-12-04 对声场的高阶立体混响表示进行压缩和解压缩的方法和设备
CN201910024898.9A Active CN109448743B (zh) 2012-12-12 2013-12-04 对声场的高阶立体混响表示进行压缩和解压缩的方法和设备

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201910024906.XA Active CN109545235B (zh) 2012-12-12 2013-12-04 对声场的高阶立体混响表示进行压缩和解压缩的方法和设备

Country Status (12)

Country Link
US (7) US9646618B2 (zh)
EP (4) EP2743922A1 (zh)
JP (6) JP6285458B2 (zh)
KR (4) KR102428842B1 (zh)
CN (9) CN117037812A (zh)
CA (6) CA3168322C (zh)
HK (1) HK1216356A1 (zh)
MX (6) MX344988B (zh)
MY (2) MY169354A (zh)
RU (2) RU2623886C2 (zh)
TW (6) TWI681386B (zh)
WO (1) WO2014090660A1 (zh)

Families Citing this family (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2665208A1 (en) * 2012-05-14 2013-11-20 Thomson Licensing Method and apparatus for compressing and decompressing a Higher Order Ambisonics signal representation
EP2743922A1 (en) 2012-12-12 2014-06-18 Thomson Licensing Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field
US9959875B2 (en) 2013-03-01 2018-05-01 Qualcomm Incorporated Specifying spherical harmonic and/or higher order ambisonics coefficients in bitstreams
EP2800401A1 (en) 2013-04-29 2014-11-05 Thomson Licensing Method and Apparatus for compressing and decompressing a Higher Order Ambisonics representation
US9466305B2 (en) 2013-05-29 2016-10-11 Qualcomm Incorporated Performing positional analysis to code spherical harmonic coefficients
US9883312B2 (en) * 2013-05-29 2018-01-30 Qualcomm Incorporated Transformed higher order ambisonics audio data
EP2824661A1 (en) 2013-07-11 2015-01-14 Thomson Licensing Method and Apparatus for generating from a coefficient domain representation of HOA signals a mixed spatial/coefficient domain representation of said HOA signals
EP4089675A1 (en) 2014-01-08 2022-11-16 Dolby International AB Method and apparatus for improving the coding of side information required for coding a higher order ambisonics representation of a sound field
US9922656B2 (en) 2014-01-30 2018-03-20 Qualcomm Incorporated Transitioning of ambient higher-order ambisonic coefficients
US9489955B2 (en) 2014-01-30 2016-11-08 Qualcomm Incorporated Indicating frame parameter reusability for coding vectors
KR102201726B1 (ko) 2014-03-21 2021-01-12 돌비 인터네셔널 에이비 고차 앰비소닉스(hoa) 신호를 압축하는 방법, 압축된 hoa 신호를 압축 해제하는 방법, hoa 신호를 압축하기 위한 장치, 및 압축된 hoa 신호를 압축 해제하기 위한 장치
EP2922057A1 (en) 2014-03-21 2015-09-23 Thomson Licensing Method for compressing a Higher Order Ambisonics (HOA) signal, method for decompressing a compressed HOA signal, apparatus for compressing a HOA signal, and apparatus for decompressing a compressed HOA signal
JP6243060B2 (ja) 2014-03-21 2017-12-06 ドルビー・インターナショナル・アーベー 高次アンビソニックス(hoa)信号を圧縮する方法、圧縮されたhoa信号を圧縮解除する方法、hoa信号を圧縮する装置および圧縮されたhoa信号を圧縮解除する装置
US10770087B2 (en) * 2014-05-16 2020-09-08 Qualcomm Incorporated Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals
US9620137B2 (en) 2014-05-16 2017-04-11 Qualcomm Incorporated Determining between scalar and vector quantization in higher order ambisonic coefficients
US9852737B2 (en) 2014-05-16 2017-12-26 Qualcomm Incorporated Coding vectors decomposed from higher-order ambisonics audio signals
CN106471822B (zh) * 2014-06-27 2019-10-25 杜比国际公司 针对hoa数据帧表示的压缩确定表示非差分增益值所需的最小整数比特数的设备
CN107077852B (zh) 2014-06-27 2020-12-04 杜比国际公司 包括与hoa数据帧表示的特定数据帧的通道信号关联的非差分增益值的编码hoa数据帧表示
EP2960903A1 (en) 2014-06-27 2015-12-30 Thomson Licensing Method and apparatus for determining for the compression of an HOA data frame representation a lowest integer number of bits required for representing non-differential gain values
KR20240047489A (ko) 2014-06-27 2024-04-12 돌비 인터네셔널 에이비 Hoa 데이터 프레임 표현의 압축을 위해 비차분 이득 값들을 표현하는 데 필요하게 되는 비트들의 최저 정수 개수를 결정하는 방법
US9800986B2 (en) 2014-07-02 2017-10-24 Dolby Laboratories Licensing Corporation Method and apparatus for encoding/decoding of directions of dominant directional signals within subbands of a HOA signal representation
EP2963949A1 (en) * 2014-07-02 2016-01-06 Thomson Licensing Method and apparatus for decoding a compressed HOA representation, and method and apparatus for encoding a compressed HOA representation
CN106471579B (zh) * 2014-07-02 2020-12-18 杜比国际公司 用于对hoa信号表示的子带内的主导方向信号的方向进行编码/解码的方法和装置
CN106463132B (zh) * 2014-07-02 2021-02-02 杜比国际公司 对压缩的hoa表示编码和解码的方法和装置
US9838819B2 (en) * 2014-07-02 2017-12-05 Qualcomm Incorporated Reducing correlation between higher order ambisonic (HOA) background channels
EP2963948A1 (en) * 2014-07-02 2016-01-06 Thomson Licensing Method and apparatus for encoding/decoding of directions of dominant directional signals within subbands of a HOA signal representation
US9847088B2 (en) * 2014-08-29 2017-12-19 Qualcomm Incorporated Intermediate compression for higher order ambisonic audio data
US9747910B2 (en) 2014-09-26 2017-08-29 Qualcomm Incorporated Switching between predictive and non-predictive quantization techniques in a higher order ambisonics (HOA) framework
US10140996B2 (en) * 2014-10-10 2018-11-27 Qualcomm Incorporated Signaling layers for scalable coding of higher order ambisonic audio data
EP3007167A1 (en) * 2014-10-10 2016-04-13 Thomson Licensing Method and apparatus for low bit rate compression of a Higher Order Ambisonics HOA signal representation of a sound field
WO2017017262A1 (en) 2015-07-30 2017-02-02 Dolby International Ab Method and apparatus for generating from an hoa signal representation a mezzanine hoa signal representation
EP3345409B1 (en) 2015-08-31 2021-11-17 Dolby International AB Method for frame-wise combined decoding and rendering of a compressed hoa signal and apparatus for frame-wise combined decoding and rendering of a compressed hoa signal
US10249312B2 (en) * 2015-10-08 2019-04-02 Qualcomm Incorporated Quantization of spatial vectors
US9961467B2 (en) 2015-10-08 2018-05-01 Qualcomm Incorporated Conversion from channel-based audio to HOA
US9961475B2 (en) 2015-10-08 2018-05-01 Qualcomm Incorporated Conversion from object-based audio to HOA
MY188581A (en) * 2015-11-17 2021-12-22 Dolby Laboratories Licensing Corp Headtracking for parametric binaural output system and method
US9881628B2 (en) * 2016-01-05 2018-01-30 Qualcomm Incorporated Mixed domain coding of audio
JP6710768B2 (ja) * 2016-01-27 2020-06-17 ホアウェイ・テクノロジーズ・カンパニー・リミテッド 音場データを処理するための装置および方法
CA2999393C (en) 2016-03-15 2020-10-27 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus, method or computer program for generating a sound field description
CN107945810B (zh) * 2016-10-13 2021-12-14 杭州米谟科技有限公司 用于编码和解码hoa或多声道数据的方法和装置
US10332530B2 (en) 2017-01-27 2019-06-25 Google Llc Coding of a soundfield representation
JP6811312B2 (ja) * 2017-05-01 2021-01-13 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 符号化装置及び符号化方法
US10657974B2 (en) * 2017-12-21 2020-05-19 Qualcomm Incorporated Priority information for higher order ambisonic audio data
US10264386B1 (en) * 2018-02-09 2019-04-16 Google Llc Directional emphasis in ambisonics
JP2019213109A (ja) * 2018-06-07 2019-12-12 日本電信電話株式会社 音場信号推定装置、音場信号推定方法、プログラム
CN111193990B (zh) * 2020-01-06 2021-01-19 北京大学 一种抗高频空间混叠的3d音频系统及实现方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1230586A1 (en) * 1999-11-12 2002-08-14 Mass Engineered Design Horizontal three screen lcd display system
CN101606192A (zh) * 2007-02-06 2009-12-16 皇家飞利浦电子股份有限公司 低复杂度参数化立体声解码器
CN102163429A (zh) * 2005-04-15 2011-08-24 杜比国际公司 用于处理去相干信号或组合信号的设备和方法
EP2469742A3 (en) * 2010-12-21 2012-09-05 Thomson Licensing Method and apparatus for encoding and decoding successive frames of an ambisonics representation of a 2- or 3-dimensional sound field

Family Cites Families (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0575675B1 (en) * 1992-06-26 1998-11-25 Discovision Associates Method and apparatus for transformation of signals from a frequency to a time domaine
FR2801108B1 (fr) 1999-11-16 2002-03-01 Maxmat S A Analyseur chimique ou biochimique a regulation de la temperature reactionnelle
US8009966B2 (en) * 2002-11-01 2011-08-30 Synchro Arts Limited Methods and apparatus for use in sound replacement with automatic synchronization to images
US7983922B2 (en) * 2005-04-15 2011-07-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing
US8139685B2 (en) * 2005-05-10 2012-03-20 Qualcomm Incorporated Systems, methods, and apparatus for frequency control
JP4616074B2 (ja) * 2005-05-16 2011-01-19 株式会社エヌ・ティ・ティ・ドコモ アクセスルータ、サービス制御システム、サービス制御方法
TW200715145A (en) * 2005-10-12 2007-04-16 Lin Hui File compression method of digital sound signals
US8374365B2 (en) * 2006-05-17 2013-02-12 Creative Technology Ltd Spatial audio analysis and synthesis for binaural reproduction and format conversion
US8165124B2 (en) * 2006-10-13 2012-04-24 Qualcomm Incorporated Message compression methods and apparatus
FR2916078A1 (fr) * 2007-05-10 2008-11-14 France Telecom Procede de codage et decodage audio, codeur audio, decodeur audio et programmes d'ordinateur associes
GB2453117B (en) * 2007-09-25 2012-05-23 Motorola Mobility Inc Apparatus and method for encoding a multi channel audio signal
GB2467668B (en) * 2007-10-03 2011-12-07 Creative Tech Ltd Spatial audio analysis and synthesis for binaural reproduction and format conversion
WO2009067741A1 (en) * 2007-11-27 2009-06-04 Acouity Pty Ltd Bandwidth compression of parametric soundfield representations for transmission and storage
EP2205007B1 (en) * 2008-12-30 2019-01-09 Dolby International AB Method and apparatus for three-dimensional acoustic field encoding and optimal reconstruction
EP2626855B1 (en) * 2009-03-17 2014-09-10 Dolby International AB Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding
US20100296579A1 (en) * 2009-05-22 2010-11-25 Qualcomm Incorporated Adaptive picture type decision for video coding
EP2268064A1 (en) * 2009-06-25 2010-12-29 Berges Allmenndigitale Rädgivningstjeneste Device and method for converting spatial audio signal
ES2690164T3 (es) * 2009-06-25 2018-11-19 Dts Licensing Limited Dispositivo y método para convertir una señal de audio espacial
JP5773540B2 (ja) * 2009-10-07 2015-09-02 ザ・ユニバーシティ・オブ・シドニー 記録された音場の再構築
KR101717787B1 (ko) * 2010-04-29 2017-03-17 엘지전자 주식회사 디스플레이장치 및 그의 음성신호 출력 방법
CN101977349A (zh) * 2010-09-29 2011-02-16 华南理工大学 Ambisonic声重发系统解码的优化改进方法
US8855341B2 (en) * 2010-10-25 2014-10-07 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for head tracking based on recorded sound signals
EP2450880A1 (en) * 2010-11-05 2012-05-09 Thomson Licensing Data structure for Higher Order Ambisonics audio data
EP2451196A1 (en) * 2010-11-05 2012-05-09 Thomson Licensing Method and apparatus for generating and for decoding sound field data including ambisonics sound field data of an order higher than three
EP2665208A1 (en) * 2012-05-14 2013-11-20 Thomson Licensing Method and apparatus for compressing and decompressing a Higher Order Ambisonics signal representation
US9190065B2 (en) * 2012-07-15 2015-11-17 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for three-dimensional audio coding using basis function coefficients
EP2688066A1 (en) 2012-07-16 2014-01-22 Thomson Licensing Method and apparatus for encoding multi-channel HOA audio signals for noise reduction, and method and apparatus for decoding multi-channel HOA audio signals for noise reduction
TWI590234B (zh) * 2012-07-19 2017-07-01 杜比國際公司 編碼聲訊資料之方法和裝置,以及解碼已編碼聲訊資料之方法和裝置
EP2743922A1 (en) * 2012-12-12 2014-06-18 Thomson Licensing Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field
EP2765791A1 (en) * 2013-02-08 2014-08-13 Thomson Licensing Method and apparatus for determining directions of uncorrelated sound sources in a higher order ambisonics representation of a sound field
EP2800401A1 (en) * 2013-04-29 2014-11-05 Thomson Licensing Method and Apparatus for compressing and decompressing a Higher Order Ambisonics representation
US9883312B2 (en) * 2013-05-29 2018-01-30 Qualcomm Incorporated Transformed higher order ambisonics audio data

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1230586A1 (en) * 1999-11-12 2002-08-14 Mass Engineered Design Horizontal three screen lcd display system
CN102163429A (zh) * 2005-04-15 2011-08-24 杜比国际公司 用于处理去相干信号或组合信号的设备和方法
CN101606192A (zh) * 2007-02-06 2009-12-16 皇家飞利浦电子股份有限公司 低复杂度参数化立体声解码器
EP2469742A3 (en) * 2010-12-21 2012-09-05 Thomson Licensing Method and apparatus for encoding and decoding successive frames of an ambisonics representation of a 2- or 3-dimensional sound field

Also Published As

Publication number Publication date
JP2020074008A (ja) 2020-05-14
JP2018087996A (ja) 2018-06-07
US10609501B2 (en) 2020-03-31
CN109545235B (zh) 2023-11-17
CN109410965B (zh) 2023-10-31
CA3125246C (en) 2023-09-12
EP3496096B1 (en) 2021-12-22
EP2932502B1 (en) 2018-09-26
KR20150095660A (ko) 2015-08-21
JP7353427B2 (ja) 2023-09-29
CA2891636C (en) 2021-09-21
US10038965B2 (en) 2018-07-31
CN109545235A (zh) 2019-03-29
CN117392989A (zh) 2024-01-12
JP6640890B2 (ja) 2020-02-05
TW202013354A (zh) 2020-04-01
KR20230098355A (ko) 2023-07-03
RU2744489C2 (ru) 2021-03-10
US10257635B2 (en) 2019-04-09
KR102664626B1 (ko) 2024-05-10
TW201926319A (zh) 2019-07-01
RU2017118830A3 (zh) 2020-09-07
US20180310112A1 (en) 2018-10-25
MX2022008697A (es) 2022-08-08
CA3125248C (en) 2023-03-07
EP3996090A1 (en) 2022-05-11
CN117037813A (zh) 2023-11-10
MY191376A (en) 2022-06-21
CN109616130A (zh) 2019-04-12
RU2015128090A (ru) 2017-01-17
TW201435858A (zh) 2014-09-16
CN109616130B (zh) 2023-10-31
CN117037812A (zh) 2023-11-10
JP2023169304A (ja) 2023-11-29
JP6285458B2 (ja) 2018-02-28
US20200296531A1 (en) 2020-09-17
CA3168322C (en) 2024-01-30
CA3125228C (en) 2023-10-17
US9646618B2 (en) 2017-05-09
MX2015007349A (es) 2015-09-10
TW201807703A (zh) 2018-03-01
KR102546541B1 (ko) 2023-06-23
JP6869322B2 (ja) 2021-05-12
CA3125246A1 (en) 2014-06-19
CA3125228A1 (en) 2014-06-19
US11546712B2 (en) 2023-01-03
US20170208412A1 (en) 2017-07-20
CN104854655A (zh) 2015-08-19
MX2022008695A (es) 2022-08-08
TWI611397B (zh) 2018-01-11
CN109448742A (zh) 2019-03-08
TWI681386B (zh) 2020-01-01
KR20210007036A (ko) 2021-01-19
CN109410965A (zh) 2019-03-01
US20230179940A1 (en) 2023-06-08
MX2022008693A (es) 2022-08-08
CN109448743A (zh) 2019-03-08
MX2023008863A (es) 2023-08-15
EP2743922A1 (en) 2014-06-18
CA3168322A1 (en) 2014-06-19
CA3168326A1 (en) 2014-06-19
US20190239020A1 (en) 2019-08-01
CA2891636A1 (en) 2014-06-19
WO2014090660A1 (en) 2014-06-19
TWI729581B (zh) 2021-06-01
TW202209302A (zh) 2022-03-01
CN109448743B (zh) 2020-03-10
JP2022130638A (ja) 2022-09-06
RU2623886C2 (ru) 2017-06-29
MX2022008694A (es) 2022-08-08
CA3125248A1 (en) 2014-06-19
KR20220113839A (ko) 2022-08-16
HK1216356A1 (zh) 2016-11-04
TWI788833B (zh) 2023-01-01
US20150332679A1 (en) 2015-11-19
MX344988B (es) 2017-01-13
JP7100172B2 (ja) 2022-07-12
US20220159399A1 (en) 2022-05-19
TWI645397B (zh) 2018-12-21
US11184730B2 (en) 2021-11-23
JP2015537256A (ja) 2015-12-24
TW202338788A (zh) 2023-10-01
KR102428842B1 (ko) 2022-08-04
KR102202973B1 (ko) 2021-01-14
JP2021107938A (ja) 2021-07-29
CN109448742B (zh) 2023-09-01
EP2932502A1 (en) 2015-10-21
RU2017118830A (ru) 2018-10-31
MY169354A (en) 2019-03-26
EP3496096A1 (en) 2019-06-12

Similar Documents

Publication Publication Date Title
CN104854655B (zh) 对声场的高阶立体混响表示进行压缩和解压缩的方法和设备
JP4887307B2 (ja) ニアトランスペアレントまたはトランスペアレントなマルチチャネルエンコーダ/デコーダ構成
CN112712810A (zh) 压缩和解压缩高阶高保真度立体声响复制信号表示的方法及装置
KR20230145232A (ko) 파라메트릭 바이너럴 출력 시스템 및 방법을 위한 머리추적
KR102201027B1 (ko) 고차 앰비소닉스 신호에 동적 범위 압축을 적용하는 방법 및 디바이스
EP4372741A2 (en) Packet loss concealment for dirac based spatial audio coding
KR20240068780A (ko) 사운드 필드를 위해 고차 앰비소닉스 표현을 압축 및 압축 해제하기 위한 방법 및 장치

Legal Events

Date Code Title Description
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20160714

Address after: Amsterdam

Applicant after: Dolby International AB

Address before: I Si Eli Murli Nor, France

Applicant before: Thomson Licensing SA

GR01 Patent grant
GR01 Patent grant