CN101036183B - 用于立体声兼容的多声道音频编码/解码的方法和设备 - Google Patents
用于立体声兼容的多声道音频编码/解码的方法和设备 Download PDFInfo
- Publication number
- CN101036183B CN101036183B CN2005800338587A CN200580033858A CN101036183B CN 101036183 B CN101036183 B CN 101036183B CN 2005800338587 A CN2005800338587 A CN 2005800338587A CN 200580033858 A CN200580033858 A CN 200580033858A CN 101036183 B CN101036183 B CN 101036183B
- Authority
- CN
- China
- Prior art keywords
- parameters
- spatial
- stereo
- signal
- channel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 56
- 230000005236 sound signal Effects 0.000 claims abstract description 47
- 230000005540 biological transmission Effects 0.000 claims description 10
- 238000012545 processing Methods 0.000 claims description 9
- 230000006835 compression Effects 0.000 claims description 5
- 238000007906 compression Methods 0.000 claims description 5
- 238000012986 modification Methods 0.000 description 11
- 230000004048 modification Effects 0.000 description 11
- 230000008901 benefit Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 239000003607 modifier Substances 0.000 description 5
- 238000013459 approach Methods 0.000 description 4
- 238000004590 computer program Methods 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 230000001771 impaired effect Effects 0.000 description 3
- 230000003595 spectral effect Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 230000006735 deficit Effects 0.000 description 2
- 238000007620 mathematical function Methods 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 230000001427 coherent effect Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000001010 compromised effect Effects 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000010363 phase shift Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000000153 supplemental effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Theoretical Computer Science (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereo-Broadcasting Methods (AREA)
- Transceivers (AREA)
Abstract
当使用参数合并器(18)通过合并一个或更多空间参数(20)以及立体声参数(22)产生参数表示(12)时,这导致参数表示(12)具有解码器可使用的立体声参数(24)以及和解码器可使用的立体声参数(24)一起表示一个或更多空间参数(20)的有关一个或更多空间参数的信息(26),能够以立体声向后兼容的方式有效地导出多声道音频信号的参数表示(12),它具有适于和单声道下混信号一起使用以计算多声道音频信号重构的参数。
Description
技术领域
本发明涉及多声道音频编码,具体涉及产生和使用完全向后兼容参数立体声重放环境的多声道音频信号的参数表示的构思。
本发明涉及使用空间音频参数以与使用参数立体声参数编码2声道立体声信号相兼容的方式编码音频信号的多声道表示。本发明教导以向后兼容的方式有效地编码空间音频参数和参数立体声参数以及将编码的参数嵌入到比特流中的新颖方法。特别是本发明旨在最小化向后兼容比特流中的参数立体声和空间音频参数的总比特率而不损害被解码立体声或多声道音频信号的质量。当稍微损害的被解码立体声信号的质量可接受时,甚至能够进一步减小总比特率。
背景技术
近来,多声道音频再现技术正变得越来越重要。为了有效发送具有5个或更多独立声道的多声道音频信号,已经开发出压缩立体声或多声道信号的若干方式。用于参数编码多声道音频信号(参数立体声(PS),双耳提示编码(BCC)等等)的最新方法通过下混信号(可能是单声道的或包括若干信道)和参数补充信息(也被称为“空间提示”)表示多声道音频信号,表征它的感知的空间声级。
多声道编码设备通常接收至少两个声道作为输入,并输出一个或更多载波声道和参数数据。这样导出该参数数据,以便在解码器中能够计算原始多声道信号的近似。通常,所述载波声道将会包括提供基础信号的相对精细的表示的子频带采样、频谱系数、时域采样等等,而参数数据不包括频谱系数的这些采样但是包括控制某种重构算法的控制参数。这种重构可以包括通过相乘进行加权、时移、频移、相移等等。因此,所述参数数据只包括信号或相关声道的相对粗略的表示。
在许多公开文献中描述了这种双耳提示编码(BCC)技术,如:“Binaural Cue Coding applied to Stereo and Multi-Channel Audio Compression”,C.Faller,F.Baumgarte,AES convention paper 5574,2002年5月,慕尼黑;作者均为C.Faller和F.Baumgarte的2个ICASSP出版物“Estimation of auditory spatial cues for binaural cue coding”和“Binaural cue coding:a normal and efficient representation of spatial audio”,Orlando,FL,2002年5月。
在BCC编码中,使用基于DFT(离散傅里叶变换)的具有叠加窗口的变换将许多音频输入声道转换成频谱表示。然后所产生的均匀频谱被划分成非叠加的部分。每个部分具有与等效矩形带宽(ERB)成比例的带宽。然后,对于每个部分估计被称为ICLD(声道间级别差)和ICTD(声道间时间差)的空间参数。ICLD参数描述两个声道之间的级别差以及ICTD参数描述不同声道的两个信号之间的时间差(相移)。通常相对于参考声道为每个声道给定所述级别差和时间差。在导出这些参数之后,量化该参数并最终对其编码用于发送。
尽管ICLD和ICTD参数表示最重要的声音源定位参数,但是通过引入附加参数能够增强使用这些参数的空间表示。
称为“参数立体声”的相关技术描述了基于发送的单声道信号加上参数补充信息参数编码双声道立体声信号。引入称为声道间强度差(IID)、声道间相位差(IPD)、和声道间相干性(IC)的三种类型空间参数。利用相干性参数(相关参数)扩展空间参数集使得能够对声级的感知空间“扩散”或空间“紧凑”进行参数化。在以下文献中更详细地描述了参数立体声:“Parametric Coding of stereo audio”,J.Breebaart,S.van de Par,A.Kohlrausch,E.Schuijers(2005)Eurasip,J.Applied Signal Proc.9,第1305-1322页;“High-Quality Parametric Spatial Audio Coding at Low Bitrate”,J.Breebaart,S.van de Par,A.Kohlrausch,E.Schuij ers,AES 116th Convention,Preprint 6072,Berlin,2004年5月;以及“Low Complexity Parametric Stereo Coding”,E.Schuijers,J.Breebaart,H.Purnhagen,J. Engdegard,AES 116th Convention,Preprint 6073,Berlin,2004年5月。
如上所述,近来已经开发出用于参数立体声编码以及空间音频编码的系统。如在参数立体声中通过单声道下混音频信号和承载立体声参数的附加补充信息表示双声道立体声音频信号(参见PCT/SE02/01372“Efficient and scalable Parametric Stereo Coding for Low Bitrate Audio Coding Applications”),传统参数立体声解码器根据单声道信号和补充信息重构双声道立体声信号。
在空间音频编码方案中,通过单声道或立体声下混音频信号和承载空间音频参数的附加补充信息表示多声道环绕音频信号。众所周知的例子是家庭娱乐系统所使用的5.1声道结构。
传统空间音频解码器基于单声道或立体声信号以及附加的空间音频参数重构5.1多声道信号。
典型地使用低比特率感知音频编码技术(像MPEG AAC)附加地编码在参数立体声或空间音频编码系统中应用的下混信号以进一步减小传输不同类型信号所需的传输带宽。而且该下混信号通常以保证向后兼容传统解码器即利用不可操作用来处理参数立体声或空间音频参数的解码器的方式与参数立体声或空间音频补充信息组合在比特流中。以这种方式,传统音频解码器仅重构所传输的单声道或立体声下混信号。当使用实现参数立体声或空间音频编码的解码器时,该解码器还将恢复嵌入到比特流中的补充信息和重构完整的双声道立体声或5.1声道环绕信号。
当基于单声道下混信号使用空间音频编码时,进一步希望通过提供一种信号来增强向后兼容性,使得不仅传统感知音频解码器能够导出单声道下混信号,而且另外对于不支持空间音频解码的参数立体声解码器来说也有可能参数立体声解码这种比特流。为了实现这个目标,必需在比特流中包括参数立体声补充信息和空间音频补充信息二者。这种明显的方法导致在比特流中不希望地存在大量的补充信息。对于必须保持总的最大比特率以传送单声道信号和补充信息的情形而言, 这意味着补充信息的增加将会导致感知编码单声道下混可用的数据速率减小,这明显减小了解码的单声道下混信号的音频质量。
另一种同时包括参数立体声和空间音频参数以及补充信息的现有技术方法需要一组如此构造的空间音频参数,即这些参数的子集允许根据单声道下混信号重构双声道立体声信号。这个子集作为参数补充信息以兼容参数立体声比特流的方式嵌入到比特流中,同时不属于该子集的剩余的空间音频参数作为空间音频补充信息嵌入到兼容空间音频编码器的比特流中。在解码器侧,仅实现参数立体声的解码器将根据作为参数立体声补充信息被嵌入的参数子集重构双声道立体声信号。另一方面,仅实现空间音频的解码器将恢复参数立体声子集以及剩余的空间音频参数。利用这组完整的空间参数,能够重构多声道信号。
但是,这种方法所具有的缺点是它损害了向后兼容参数立体声重构或多声道重构的音频质量。这种损害是明显的,因为在第一种情况下,也被用作空间音频参数的参数子集描述了5.1信号的两个声道之间的相互关系。最自然的选择将是左前(l)和右前(r)声道,但是它们可能显著不同于对于立体声下混的左(l0)和右(r0)声道关系的校正值。在第二种情况下,立体声下混的校正值形成所述第一子集,这意味着它们被用来描述多声道环绕信号的左前和右前声道之间的相互关系。然而,由于为了以多声道兼容的方式在比特流中嵌入参数所需的参数量化,这可能导致空间音频重构的显著缺陷。
发明内容
本发明的目的是提供一种创建和使用多声道音频信号的参数表示以允许更有效的表示而几乎不损害参数立体声重构质量或空间音频重构质量的构思。
本发明基于这样的发现:当参数合并器被用于通过将一组空间参数与立体声参数合并来产生多声道音频信号的参数表示时,能够以向后兼容的方式有效地导出具有适于与单声道下混信号一起使用的参数 的该多声道音频信号的参数表示,所得到的参数表示具有解码器可使用的立体声参数和与该解码器可使用的立体声参数一起表示该组空间参数的有关该组空间参数的信息。
通过使用描述也通过空间参数描述的同一多声道音频信号立体声下混的空间参数和立体声参数之间的相互关系,能够根据参数立体声参数有利地预测空间参数的子集。
由于通过立体声参数描述的双声道立体声信号表示某种形式的5.1多声道信号的立体声下混,所以如上所述,在参数立体声系统的立体声参数与空间音频编码系统的空间参数之间存在一种相关性,本发明组合空间音频参数的子集来使用这些立体声参数以预测不包括在所述子集中的剩余空间音频参数的值。然后,仅有不包含在子集中的空间音频参数的预测值和实际值之差需要被传送。这种差(即预测误差)的熵典型小于实际参数本身的熵。这可能被应用本发明的系统以及接下来的某种熵编码所使用。这种系统与简单地独立嵌入所有参数的系统相比需要较少的补充信息比特率用于参数立体声和空间音频参数。应该注意到与此同时,应用本发明的这种系统并不损害参数立体声重构的质量或空间音频重构的质量。
因为本发明的目的是提供一种向后兼容参数立体声解码器的参数表示,优选的是应该使用表示立体声下混的正确参数以便不损害由参数立体声解码器重构的双声道立体声信号的质量。尽管如此,在本发明的替换实施例中,在编码器中根据估计的空间参数应用参数立体声参数的小修改,以便提高对空间音频参数进行参数预测的性能。很清楚参数立体声(PS)参数的这种修改导致通过实现参数立体声解码器的解码器所重构的立体声信号稍微地降低质量。通过本发明的本实施例,重构空间音频信号的质量保持不受PS参数修改的影响,同时减小PS以及嵌入到兼容比特流中空间补充信息所需的总比特率。
在本发明的优选实施例中,使用导出多声道音频信号的参数表示的编码器产生比特流,其中所述多声道信号的立体声下混的空间音频参数以及参数立体声参数被以完全向后兼容的方式嵌入。即,只能够处理参数立体声参数的参数立体声解码器将会能够使用参数立体声参 数重构高质量的立体声信号。而且,本发明的编码器通过实际空间参数和预测空间参数的差分表示替换了某些空间参数,但是空间参数的预测基于立体声参数和一组未被替换的空间音频参数。由于空间音频参数表示以及参数立体声表示参数都描述声道对之间的级别差和相关性,所以在空间音频参数和立体声参数之间存在一种相互关系,以及二者都以相同的数据即多声道信号为基础进行导出。然后,由于所述差值的熵通常远远小于基础空间音频参数的熵,通过使用预测和实际值之间的差用于发送,能够节约比特率。当所述预测精确为预测值和实际值之间的差值显然是零时,这意味着必须发送或在参数表示中存储被替换空间参数的只有零值的表示,当对该表示进一步执行熵编码步骤时这最为有利,正如通常的情况一样。
通过使用如上所述的构思,本发明的编码器或解码器具有以下明显的优点即尽管精确地毫无损耗地向后兼容发送空间音频和参数立体声参数,但是相比在比特流中简单地独立发送空间音频参数和参数立体声参数的情形而言本发明还能够降低比特率。
在本发明进一步的实施例中,在预测空间参数和发送修改的空间参数之前对参数立体声参数应用小的改变。这具有重要的优点即通过参数立体声参数的小改变能够提高预测的稳定性,并且因此,能够进一步降低总比特率。代价是由于在编码过程中改变实际上最佳的参数立体声参数,所以使用经修改立体声参数被重构的立体声上混的质量小幅降低。
在本发明进一步的实施例中,本发明的音频编码器包括根据输入到编码器的多声道信号产生单声道信号的空间下混器。所述单声道信号进一步被音频编码器使用例如感知音频压缩进行压缩,以进一步降低单声道下混信号在发送期间使用的比特率。比特流发生器最终产生用于将单声道信号、空间音频参数和参数立体声参数合并到单个、参数立体声兼容的比特流中的比特流。
在本发明进一步的实施例中,参数编码器或解码器包括允许进一步降低所需比特率的控制单元。这通过比较使用实际空间参数及其预测参数产生的空间参数差分表示所需的比特率与直接编码空间参数所 需的比特率予以实现。编码通过二步编码过程的方式执行,首先包括单独地时间和/或频率差分编码每个参数,以及接下来进行熵编码(使用例如霍夫曼编码器、算术编码器或游程长度编码器)。这种处理使用基于其自己历史的用于每个参数的可预测性(或冗余性)(与如上所述的在参数集上的预测比较)。在差分预测编码导致较高比特率的情况下,通过对于给定的时间帧直接发送空间参数能够进一步节约比特率。选择策略的判定能够在比特流中发送以在解码器侧被处理或者解码器可以在没有通知的情况下通过应用适当的检测算法判定原来已经使用过哪种策略。
如上所述,根据本发明产生的信号具有的重要优点是向后兼容参数立体声解码器以及并且当它被发送到本发明的解码器时保持完整的空间(环绕)信号再现所需的信息。
所以,本发明的接收参数立体声参数和空间音频参数的解码器能够通过应用差分发送的空间音频参数的相同预测和逆变换重构一组完整的空间参数,以从根据本发明的比特流导出表示多声道信号空间特性的一组完整的空间音频参数。
换言之,用于合并参数立体声参数和所接收空间音频参数以重构一组完整空间参数的合并规则与编码器侧应用的规则相反。在如上所述的差分编码的情况下,这将会意味着首先使用参数立体声参数之一或更多以及所接收空间音频参数之一或更多计算想要参数的预测。然后,计算预测值和发送值之和,该求和是该组完整空间参数的想要的参数。
在本发明进一步的实施例中,本发明的解码器还能够使用高质量的参数立体声参数重构多声道信号的立体声表示。这具有的重要优点是本发明的解码器能够根据需要被配置,即当只有立体声重放环境可用时,通过本发明的解码器能够再现高质量的立体声信号,但是当多声道重放环境可用时,可以再现信号的多声道表示以允许令人愉快地聆听环绕声音。
在本发明进一步的实施例中,本发明的编码器包括在发送器或音频记录器中,允许音频信号的比特率节约存储或发送,其中所述音频 信号可以利用极佳的质量被再现为立体声信号或完整的环绕信号。
在本发明进一步的实施例中,本发明的解码器包括在接收器或音频播放器中,以允许使用不同的扬声器设置接收或重放信号,其中所述音频信号能够以最佳拟合现有重放环境的表示被再现。
总而言之,本发明包括以下的有利特征:
-兼容编码多声道音频信号,包括:
在编码器侧,下混多声道信号成一个信道表示,
在编码器侧给定所述多声道信号表示该多声道信号的参数定义,
在编码器侧给定所述多声道信号表示该多声道信号立体声下混的参数定义,
在编码器侧,以比特率有效和向后兼容的方式将参数集嵌入到比特流中,
在解码器侧,从比特流中提取被嵌入的参数,
在解码器侧,根据从所述比特流提取的参数重构表示多声道信号的参数,
在解码器侧,给定根据比特流数据重构的参数,和所述下混的信号以重构多声道输出信号;
-嵌入表示立体声下混的参数到所述比特流中,以便通过仅支持参数立体声解码的(传统)解码方法对它们进行解码;
-分离表示多声道信号的该组参数成第一子集和第二子集;
-根据参数所述第二子集以及表示多声道信号立体声下混的参数预测参数所述第一子集中的值;
-控制自动选择是否直接编码参数的第一子集还是仅编码和预测的参数值相关的差值的机制;
-修改表示立体声下混的参数,这里表示多声道信号的原始参数和表示立体声下混的原始参数都被用作导出所述经修改的参数的基础;
-使用查询表查找所述预测的参数值;
-使用多项式函数查找所述预测的参数值;
-使用根据被应用于产生立体声下混的方法导出的数学函数查找所述预测的参数值。
附图说明
下面将参考附图描述本发明的优选实施例,其中:
图1所示为本发明编码器的方框图;
图2所示为根据本发明产生的比特流;
图3所示为本发明编码器的另一实施例;
图4所示为图3中本发明编码器的细节;
图5所示为本发明的解码器;
图6所示为本发明多声道解码器的优选实施例;
图7所示为图6中本发明多声道解码器的细节;
图8例示本发明信号的向后兼容性;
图9所示为具有本发明编码器的发送器或音频记录器;
图10所示为具有本发明多声道解码器的接收器或音频播放器;以及
图11所示为传输系统。
具体实施方式
以下描述的实施例仅仅用于示例本发明用于改进参数立体声兼容编码空间音频的原理。应该明白对于本领域的普通技术人员来说对这里所描述结构和细节的修改和变型将是显而易见的。所以,意图仅通过附属权利要求的范围而不是通过这里实施例描述和说明的具体细节来限定本发明。
图1所示为用于导出多声道音频信号的参数表示12的本发明编码器10。编码器10包括空间参数计算器14、立体声参数计算器16和参数合并器18。
空间参数计算器14计算描述多声道信号的空间特性的一组空间参数20。立体声参数计算器16计算描述多声道信号立体声下混的空间特性的立体声参数22。所述空间参数20和立体声参数22被传送到导出参数表示12的参数合并器18,该参数表示包括解码器可使用的立体声参数24和有关该组空间参数的信息26。
图2所示为向后兼容比特流的实例,该比特流是如通过根据图1的本发明编码器产生的多声道音频信号的参数表示。所述比特流包括立体声参数区30和空间参数区32。立体声参数区30在立体声参数区30的开头具有立体声标题34,之后是两个解码器可使用的立体声参数36a和36b,参数立体声解码器将会使用它们来重构立体声信号。能够处理参数立体声参数的解码器将仅通过包括在立体声标题34中的信息识别参数立体声参数36a和36b。
空间音频区32从空间标题38开始并且包括四个空间音频参数40a到40d。根据本发明的多声道解码器将通过借助空间标题38以及如通过立体声标题34被识别的立体声参数36a和36b识别它们来使用空间参数40a到40d。如在图2中所示,空间参数40a比空间参数40b到40d消耗较少的比特率。在图2所示的实例中,空间参数40a通过基础的原始空间参数和使用立体声参数36a之一或更多以及空间音频参数40b到40d之一或更多而导出的预测空间参数的差值表示。所以本发明的多声道解码器需要使用立体声参数36a和36b以及空间参数40b到40d重构有关在比特流中发送的空间参数40a的空间参数基础信息。
图3所示为用于导出多声道音频信号50的参数表示的本发明编码器52的优选实施例,所述信号具有三个声道,左声道l、右声道r和中间声道c。
本发明的编码器52包括空间下混器54、空间参数估计器56、立体声下混器58、参数立体声参数估计器60、音频编码器62、参数合并器(联合编码块)64以及比特流计算器(多路复用器(MUX))66。
空间下混器54、空间参数估计器56、立体声下混器58、接收多声道信号50作为输入。空间下混器54根据多声道信号50产生单声道下混信号68,空间参数估计器56导出描述多声道信号的空间特性的 空间参数70,以及立体声下混器58根据多声道信号50产生立体声下混信号72。
立体声下混信号72被输入到参数立体声参数估计器60,它用于根据描述立体声下混信号72的空间特性的立体声下混信号导出立体声参数74。单声道下混信号68被输入到音频编码器62中,它通过使用例如感知音频编码技术进行编码导出表示单声道下混信号68的音频比特流76。参数合并器64接收空间参数70和参数立体声参数74作为输入并且通过空间参数预测和空间参数本身的差值替换该组空间参数来导出解码器可使用的立体声参数(参数立体声补充信息)78和有关空间参数的信息(空间补充信息)80作为输出。这将通过以下的附图更详细地描述。
比特流计算器66最后接收音频比特流76、有关该组空间参数的信息80以及解码器可使用的立体声参数78作为输入并且合并所述输入到参数立体声兼容的比特流82中,该比特流可以例如包括在图2中详细描述参数的分段。
比特流计算器66可能是简单的多路复用器。但是根据本发明还可以实现用于合并三个输入到兼容比特流中的其他方式来导出比特流。
换言之,图3例示采用多声道音频信号作为输入并且产生允许通过空间解码器解码以及通过PS解码器向后兼容解码的兼容比特流的编码器,该信号包括三个声道l、r和c。所述空间下混采用多声道信号l、r和c并且产生单声道下混信号m。然后通过可选的感知音频编码器对该信号进行编码以产生表示单声道信号的压缩音频比特流。所述空间参数估计采用多声道信号l、r和c作为输入并且产生一组量化的空间参数。这些参数可能是时间和频率的函数。所述立体声下混例如使用ITU-R下混方程或替换的方法产生多声道信号的双声道立体声下混l0、r0。所述参数立体声(PS)参数估计采用这种立体声下混作为输入并且产生一组量化的可能是时间和频率函数的PS参数。所述量化编码块采用空间参数和PS参数二者作为输入并且产生参数立 体声补充信息(PS补充信息)和空间补充信息。最后多路复用器采用音频比特流以及空间和PS补充信息比特流作为输入并且以有可能通过传统解码器(仅实现PS)向后兼容解码的这样一种方式将补充信息嵌入到比特流中。
图4详细描述图3中所示的参数合并器64。参数合并器64具有参数分离器90、参数立体声参数修改器92、空间参数预测器94、合并器96、控制单元98、空间参数汇编器100以及第一差分编码器102、第二差分编码器104、第三差分编码器106a和第四差分编码器106b。
参数合并器64接收空间参数70和参数立体声参数74作为输入。参数立体声参数74在参数立体声参数修改器的第一输入被输入到参数立体声参数修改器92中,以及空间参数70在其第二输入被输入到参数立体声参数修改器92中。
空间参数70还被输入到参数分离器90中。参数立体声参数修改器92是可选的装置,它可以被用于通过使用空间参数70的信息修改参数立体声参数74以导出解码器可使用的立体声参数110。
参数分离器90将空间参数70划分成空间参数的第一子集112和空间参数的第二子集114,其中第一子集112是可以通过多声道信号最终参数表示中的差分预测所替换的空间参数的子集。
由于使用解码器可使用的立体声参数110和空间参数的第二子集114执行第一子集中的参数预测,解码器可使用的参数110和空间参数114的第二子集都被输入到空间参数预测器94中。空间参数预测器94使用解码器可使用的参数立体声参数110和空间参数114的第二子集导出预测参数116。预测参数116是第一子集112参数的预测并且被与第一子集112的参数进行比较。
因此,通过合并器96以参数方式计算预测参数116和参数112的第一子集的差值,即这种导出的差分参数118。参数112的第一子集被输入到通过应用时间或频率差分编码对该参数第一子集进行差分编码的第三差分编码器106a中。差分参数118被输入到第四差分编码器106b中。
根据在图4中所示的本发明优选实施例,通过控制单元98比较第一子集112的差分编码表示和差分参数118的差分编码表示以估计哪种表示在比特流中需要更多的比特。控制单元98控制开关120提供第一子集112的表示到需要较少比特的空间参数汇编器100,但是表示使用的信息被另外从控制单元98传送到空间参数汇编器100。
还通过第二差分编码器104差分编码空间参数的第二子集114,以及第二子集114的差分编码表示被输入到空间参数汇编器100中,因此具有有关空间参数70的完整信息。空间参数汇编器100最终通过重新汇编第一子集112和第二子集114的表示到有关保持空间参数70完整信息的该组空间参数的信息80中导出有关空间参数的信息80。
因此,有关该组空间参数80的最终信息包括未经修改但是差分编码的空间参数的第二子集以及空间参数第一子集的表示,取决于哪种表示需要更少的比特率,这种表示可能是第一子集112的直接差分编码表示或者是差分参数118的差分编码表示。
通过本发明参数合并器64导出的解码器可使用的参数立体声参数78通过第一差分编码器102导出。第一差分编码器102接收经修改的参数立体声参数110作为输入并且通过差分编码经修改的参数立体声参数110导出解码器可使用的参数立体声参数78。
换言之,图4例示采用空间参数和PS参数作为输入并且产生空间补充信息和PS补充信息的联合编码块。可选的PS参数修改块采用空间参数和PS参数作为输入并产生经修改的PS参数。这允许以牺牲损害根据经修改的PS参数重构的2声道立体声信号的质量为代价实现空间参数的较佳预测。如果不应用PS参数修改块,输入PS参数直接用作空间参数预测块和PS编码的输入。(经修改的)PS参数集能够使用时间差分(dt)或频率差分(df)编码,即分别在时间或频率方向编码连续参数的差值,以及使用霍夫曼编码即无损熵编码被编码,以便最小化表示参数集所需比特的数量。所述参数分离块分离被直接编码的第二子集中的所述空间参数集以及包含所有剩余参数并能够使用参数预测被编码的互补的第一子集。所述空间参数预测块采用空间 参数的第二子集和(经修改的)PS参数作为输入并且计算用于空间参数的第一子集的预测值。然后从第一子集中的空间参数的实际值中减去这些预测值,产生一组预测误差值。
使用时间或频率差分编码和霍夫曼编码对第二参数子集进行编码以便最小化表示该参数子集所需比特的数量。使用时间或频率差分编码和霍夫曼编码对第一参数子集编码以便最小化表示该参数子集所需比特的数量。使用时间或频率差分编码和霍夫曼编码对第一参数子集的预测误差值进行编码以便最小化表示该参数子集所需比特的数量。控制块选择是否应该直接编码第一参数子集或应该编码预测误差以最小化表示第一参数子集所需比特的数量。对于所述子集中的每个参数这种选择能够单独地完成。实际的选择判定能够作为补充信息在比特流中传送或者基于为空间参数预测一部分的规则。在后者的情况下,这种判定不必作为补充信息而被传送。最后,多路复用器合并所有编码的数据以形成空间补充信息。
为使用本发明的编码或解码构思,参数预测的不同实现是可行的。通常,有可能使用适当设计的查询表根据立体声参数和空间参数的第二子集导出空间参数第一子集的预测或者能够替换地应用解析函数根据具体下混处理的知识以及导出空间参数和立体声参数的方式导出所述预测的参数。以下段落给出了实现适当预测的某些具体实例的概述。
这种概述基于具有三个声道的多声道信号,
-l:左,
-c:中,
-r:右,
这仅仅被认为是作为一个实例。介绍的原理显然还相应地应用于其他声道结构。例如,在5.1声道结构的情况下,使用参数立体声模块合并左前和左环绕声道形成左信号(l),使用参数立体声模块合并右前和右环绕声道形成右信号(r),以及使用参数立体声模块合并中前和低频增强声道形成中间信号(c)。
以下的描述更详细地讨论空间参数预测块。立体声下混信号的2个声道表示为:
l0:左下混,
r0:右下混,
以及单声道下混表示为:
m:单声道下混。
在最普遍的意义上,它由列表函数(查询表)构成:
那么所述差分信号等于预测误差:
第一种设计方法是让F为所选择的列表函数或多元多项式以便在大型参数数据库上以最小二乘法来最小化预测误差。可替换地,F能够被如此选择以最小化所产生的表示空间参数第一子集所需的比特率,这里在这种意义上大型参数数据库被用作查找最佳F的训练数据。在预测单元中使用它们之前,这种列表函数或多项式能够跟随舍入或量化操作以便产生整数结果。
这种方法的一个重要的特殊情况是使用其中F是一阶多项式的线性预测。
第二种预测器设计是考虑所使用的实际参数结构。在本发明的优选实施例中,K=2和N=4,以及所述参数根据以下传送信息:
p1:iid_l0_r0 声道l0和r0之间的声道间强度差(IID);
p2:icc_l0_r0 声道l0和r0之间的声道间相干或互相关(ICC);
s1:iid_l_r 声道l和r之间的声道间强度差(IID);
s2:icc_l_r 声道l和r之间的声道间相干或互相关(ICC);
s3:iid_lr_c 声道l+r和c之间的声道间强度差(IID);
s4:icc_lr_c 声道l+r和c之间的声道间相干或互相关(ICC)。
这种设计的第一实例是以上线性预测器设计的一种特例并且由以下简单地设置构成:
这种简单的预测器所具有的优点是它产生更加稳定的预测误差(而不是最小的预测误差),其很适于时间差分或频率差分编码所述预测误差。这对于像上述多项式的所有预测器来说是正确的。
l0=l+q·c,r0=r+q·c (4)
所有信号l、r、c是典型根据时间信号的复调制的滤波器组分析由子频带采样的时间和频率间隔产生的有限长度向量。对于复向量x、y,复内积和模平方通过以下定义:
其中星号表示复共轭。然后假设IID参数的线性和非量化形式通过以下获得:
对于ICC参数,在互相关的情况下,公式如下:
在相干的情况下,公式(7)中实值运算被替换成绝对值(复幅度)运算。
假设简化成<l,c>=<r,c>=0,从而得出能够被插入到(6)的第一公式中的L0=L+q2C和R0=R+q2C。通过求解具有两个未知数的两个方程,然后根据P1和S3获得X=L/C和Y=R/C的以下估计:
当稍微损害质量的解码立体声信号可接受时,通过应用参数立体声参数的修改能够进一步减小总比特率。这种修改的目的是实现空间参数第一子集的更加稳定的预测和减小预测误差。它能够被看作是一种稳定上述计算的方式。这种参数修改的最极端情况将是使用p1’=s1,p2’=s2,这里p1’,p2’表示经修改的参数立体声参数。由于仅在编码器侧执行这种参数修改操作,所以在解码器侧不需要采取任何特殊处理。
更为普遍的方法包含在P1,P2,S3,S4中可用的完整功率和相关结构信息以经由公式(6)和(7)获得S1和S2的估计。通过参数的缩放不变性,为了计算目的假设C=1不失普遍性。然后利用定义:
a=Re<l,c>,b=Re<r,c>,ρ=Re<l,r> (9)
产生以下的方程系:
对于估计感兴趣的未知数是L、R、ρ,以及a、b是附加的未知数。取决于对a、b对的限制的选择,这种(未确定的)方程系能够用作许多预测公式的指引。例如,(10)中的第一和第三方程意味着:
因此导致公式(8)的所述计算对应于 的情况。更普遍而言,启发式参数γ经由 定义对a、b对的限制。
再次强调上述预测方案仅仅是在编码器侧以及解码器侧实现的可能预测方案的一些例子。
图5所示为本发明用于处理参数表示202的多声道音频解码器200。
参数表示202包括有关描述多声道信号空间特性的一组空间参数204的信息以及描述多声道信号立体声下混空间特性的解码器可使用 的立体声参数206。本发明的多声道音频解码器200具有参数重构器208,它用于合并解码器可使用的立体声参数206和有关该组空间参数的信息以获得空间参数210。
图6所示为根据本发明的多声道音频解码器220的实施例。多声道音频解码器220具有比特流分解器(去多路复用器(DEMUX))222、音频解码器224、参数重构器(联合解码器)226和上混器228。
比特流分解器222接收向后兼容的比特流230,该比特流包括音频比特流231、有关一组空间参数232和解码器可使用的立体声参数234(PS补充信息)的信息。所述比特流分解器分解或去多路复用向后兼容的比特流230以导出音频比特流231、以及有关该组空间参数232和解码器可使用立体声参数234的信息。音频解码器224接收音频比特流231作为输入并且根据音频比特流231导出单声道下混信号236。
参数重构器226接收有关该组空间参数232和解码器可使用立体声参数234的信息作为输入。参数重构器226合并有关该组空间参数和解码器可使用立体声参数的信息以导出一组用作上混器228输入的空间参数238,所述上混器还接收单声道下混信号236作为第二输入。根据空间参数238和单声道下混信号236,上混器228导出多声道信号240的重构作为其输出。
因此图6例示采用兼容的比特流作为输入并且产生包括声道l、r和c的多声道音频信号的空间音频解码器。首先去多路复用器采用兼容的比特流作为输入并且将它分解成音频比特流以及所述空间和PS补充信息。如果应用感知音频编码给所述单声道信号,相应的音频解码器则采用音频比特流作为输入并产生解码的单声道音频信号m,其经受如通过感知音频编译码器引入的失真。所述联合解码块采用空间和PS补充信息作为输入并重构空间参数。最后该空间重构采用解码的单声道信号m和空间参数作为输入并重构所述多声道音频信号。
图7给出了多声道音频解码器220所使用的参数重构器226的详细描述。参数重构器226包括空间参数反汇编器250、控制单元252、 空间参数预测器254、空间参数汇编器256和第一差分解码器258、第二差分解码器260、第三差分解码器262a、和第四差分解码器262b。
空间参数反汇编器250接收有关该组空间参数232的信息作为输入并且根据有关该组空间音频参数232的信息导出第一子集266和第二子集268。第一子集266包括可能通过在编码器侧执行的预测差分表示所表示的参数,以及第二子集268包括在比特流中未经修改发送的有关该组空间参数信息的子集。
而且,控制单元252可选地从空间参数反汇编器接收控制信息,该信息指示是否在编码期间已经使用过预测差分表示。在某种意义上即控制单元252能够可替换地使用适当的算法导出是否已经执行这种预测而不用访问指示参数这种信息是可选的。
参数的第二子集268被输入到差分解码第二子集以导出空间参数第二子集270的第二差分解码器260。
第一差分解码器258接收解码器可使用的立体声参数234作为输入,以根据编码的表示导出参数立体声参数272。空间参数预测器254以与其在编码器侧上的对应部分相同的方式操作,所以它接收参数立体声参数272作为第一输入以及空间参数270作为第二输入来导出预测的参数274。
控制单元252控制用于有关该组空间参数信息的第一子集的两种可能不同的数据路径。当控制单元252指示还未使用预测差分编码发送有关该组空间参数信息的第一子集时,控制单元252如此控制开关278a和278b即第一子集266被输入到第三差分解码器262a中以导出该组空间参数的第一子集280而不应用反向预测。空间参数的第一子集280然后在该汇编器的第二输入端被输入到空间参数汇编器256中。
但是,如果控制单元252指示差分预测的参数时,该组空间参数信息的第一子集266被输入到第四差分解码器262b中以在该差分解码器的输出端282导出第一子集266的差分预测表示。然后,通过加法器284计算所述差分表示和预测的参数274之和,因此反转在编码器侧执行的差分预测操作。结果,在空间参数汇编器256的第二输入端 可获得空间参数的第一子集280,空间参数汇编器256合并空间参数的第一子集280和空间参数的第二子集270以在其输出端提供一组完整的空间参数290,它是已编码信号的多声道重构的基础。
总而言之,图7例示采用空间补充信息和PS补充信息作为输入并且重构所述空间参数的联合解码块。该去多路复用器将空间补充信息分割成编码的空间参数第二子集和编码的空间参数第一子集以及控制信息。所述解码块采用编码的空间参数第二子集作为输入并重构这个参数子集。在编码器中应用这些编码的情况下这包括霍夫曼解码和时间差分(dt)或频率差分(df)解码。所述解码块采用PS补充信息作为输入并重构(经修改的)PS参数。所述空间参数预测块采用空间参数的第二子集和(经修改的)PS参数作为输入并以与其在编码器中的对应部分相同的方式计算空间参数第一子集的预测值。所述控制块确定其对应部分即编码器中的控制块采取哪种选择判定。根据这种选择,直接解码所述编码的空间参数第一子集或者考虑所述预测对其进行解码。在两种情况下,在编码器中应用这些编码的情况下这包括霍夫曼解码和时间或频率差分解码。在所述控制块确定不使用预测的情况下,采用解码块的输出作为重构的空间参数的第一子集。否则,所述解码块的输出包含然后被添加到如通过空间参数预测所产生的预测参数值,以便获得所述空间参数第一子集的原始值的预测误差值。最后重构的空间参数的第一和第二子集被合并形成该组完整的空间参数。
图8例示如何通过传统参数立体声解码器处理兼容的本发明比特流来导出立体声上混信号以强调本发明构思完全向后兼容的重要优点。
参数立体声解码器300接收兼容的比特流302作为输入。参数立体声解码器300包括去多路复用器304、音频解码器306、差分解码器308和上混器310。去多路复用器304根据兼容的比特流302导出音频比特流312和解码器可使用的参数立体声参数314。
由于参数立体声解码器300不能对空间音频参数操作,去多路复 用器304例如通过跳过对于所述解码器未知的比特流中的标题字段和相关数据区,简单地忽略包括在兼容比特流302中的空间音频参数。音频比特流312被输入到导出单声道下混信号316的音频解码器306中但是解码器可使用的立体声参数314被通过差分解码器308差分解码以导出参数立体声参数318。单声道下混信号316和参数立体声参数318被输入到上混器310,它使用单声道下混信号316和参数立体声参数318导出立体声上混信号320。
换言之,图8例示采用兼容比特流作为输入并产生包括声道10和r0的2声道立体声音频信号的参数立体声(PS)解码器。首先去多路复用器采用兼容比特流作为输入并将它分解成音频比特流和PS补充信息。由于所述空间补充信息被以向后兼容的方式嵌入到兼容的比特流中,它不影响去多路复用器。如果应用感知音频编码给单声道信号,相应的音频解码器则采用音频比特流作为输入和产生解码的单声道音频信号m,它经受如通过感知音频编译码器引入的失真。PS解码块采用PS补充信息作为输入并重构PS参数。在编码器中应用这些编码的情况下这包括霍夫曼解码和时间差分(dt)或频率差分(df)解码。最后所述PS重构采用解码的单声道信号m和PS参数作为输入并重构2声道立体声信号。
图9所示为本发明音频发送器或记录器330,它具有音频编码器10、输入接口332和输出接口334。
在发送器/记录器330的输入接口332提供音频信号。通过位于发送器/记录器内的本发明编码器10编码该音频信号并且在发送器/记录器330的输出接口334输出所述编码表示。然后该编码表示可以被发送或存储在存储介质上。
图10所示为本发明的接收器或音频播放器340,它具有本发明的音频解码器180、比特流输入端342、和音频输出端344。
在本发明接收器/音频播放器340的输入端342输入比特流。然后通过解码器180解码所述比特流以及在本发明的接收器/音频播放器340的输出端344输出或播放解码的信号。
图11所示为包括本发明发送器330、以及本发明接收器340的传输系统。
编码在发送器330的输入接口332输入的音频信号并从发送器330的输出端334传送到接收器340的输入端342。接收器解码该音频信号并在其输出端344重放或输出音频信号。
总结本发明的构思,可以说本发明涉及以和使用参数立体声参数编码2声道立体声信号相兼容的方式使用空间音频参数编码音频信号的多声道表示。本发明教导有效编码空间音频参数和参数立体声参数以及以向后兼容的方式在比特流中嵌入被编码参数的新颖方法。特别是本发明旨在最小化向后兼容比特流中的参数立体声和空间音频参数的总比特率而不损害解码的立体声或多声道音频信号的质量。但是,当稍微损害的解码的立体声信号质量可接受时,能够进一步减小总比特率。
尽管描述本发明信号的向后兼容性及其产生的比特流不包括描述单声道下混信号的参数,但是理所当然的是这些参数能够被容易地包含在所示的比特流中。
如果能够导出适当的规则来预测这些参数,通过使用参数立体声参数能够预测任意数量的空间音频参数。所以,以上给出的详细的预测规则应该理解成仅仅作为实例。显然其他预测规则能够导致同样的比特节约效果,所以,本发明并不局限于使用以上描述的预测规则之一。
尽管导出多声道信号的立体声下混的参数立体声下混器58存在于所给出的本发明编码器的实例中,在实际的实施中,如果已知下混规则,并且所以当根据多声道信号能够直接导出参数立体声参数时,则能够省略立体声下混器。
在给定的实施中,还通过音频编码器编码单声道下混信号或在解码器侧对其解码。这种编码和解码是可选的,即省略对单声道下混信号的进一步压缩还将会产生包含本发明构思的本发明编码器和解码器。
当差分预测的表示不节约发送比特率时,位于本发明编码器和解码器中的控制单元可以被省略以及在少数情况下可能为了普通的判定以节约控制单元为益处和以接受稍微较高的比特率为代价通过差分预测的参数表示空间参数的子集。
尽管,在给定的实例中,在信号路径中应用的其他编码器仅被称为差分编码器或差分解码器,但是应该明白还可以使用适于压缩参数的任何其他适当的编码器或解码器,特别是差分解码器或编码器和霍夫曼解码器或编码器的组合。这种组合以这样一种方式被使用,即首先差分编码所述参数以及然后霍夫曼编码差分编码的参数,这样最终使用较小的比特率产生参数表示,因为差分预测的表示通常比空间参数基础本身具有较低的熵。
总结本发明的思想,本发明教导如下内容:
在第一方面,一种用于兼容编码多声道音频信号的方法,其特征在于:在编码器侧,下混多声道信号成一个信道表示;在编码器侧给出所述多声道信号,定义表示多声道信号的参数;在编码器侧给出所述多声道信号,定义表示多声道信号立体声下混的参数;在编码器侧,以比特率有效和向后兼容的方式在比特流中嵌入两组参数;在解码器侧,从比特流中提取被嵌入的参数;在解码器侧,根据从比特流提取的参数重构表示多声道信号的参数;在解码器侧,给定根据比特流数据重构的参数,和所述下混的信号以重构多声道输出信号。
作为第二方面,根据第一方面的方法,其特征在于在所述比特流中嵌入表示立体声下混的参数,从而通过仅支持参数立体声解码的(传统)解码方法对它们进行解码。
作为第三方面,根据第一方面的方法,其特征在于分离表示多声道信号的该组参数成第一子集和第二子集。
作为第四方面,根据第三方面的方法,其特征在于根据所述参数第二子集和表示多声道信号立体声下混的参数预测所述参数第一子集的值。
作为第五方面,根据第四方面的方法,其特征在于控制方法,该 方法自动选择直接编码所述参数的第一子集还是仅编码和预测参数值相关的差值。
作为第六方面,根据第三方面的方法,其特征在于修改表示立体声下混的参数,其中使用表示多声道信号的原始参数和表示立体声下混的原始参数作为导出修改参数的基础。
作为第七方面,根据第四方面的方法,其特征在于使用查询表查找所述预测的参数值。
作为第八方面,根据第四方面的方法,其中在第四方面中使用多项式函数查找所述预测的参数值。
作为第九方面,根据第四方面的方法,其特征在于使用根据被应用于产生立体声下混的方法导出的数学函数查找所述预测的参数值。
作为第十方面,一种用于编码多声道音频信号表示的设备,其特征在于:用于下混多声道信号成一个信道表示的装置;用于定义表示多声道信号的参数的装置;用于定义表示多声道信号立体声下混的参数的装置;用于以比特率有效和向后兼容的方式在比特流中嵌入两组参数的装置。
作为第十一方面,一种用于根据下混的信号和相应的参数集重构多声道信号的设备,其特征在于:用于提取在比特流中嵌入的参数集的装置;用于根据从比特流提取的参数重构表示多声道信号的参数的装置;用于给定根据比特流数据重构的参数集,和所述下混的信号以重构多声道输出信号的装置。
取决于本发明方法的某些实现需求,本发明的方法能够以硬件或软件实现。这种实现能够使用数字存储介质,特别是光盘如在其上面存储有电子可读控制信号的DVD或CD执行,所述介质与可编程计算机系统互操作以便执行本发明的方法。一般而言,本发明因此是具有在机器可读载体上存储的程序代码的计算机程序产品,当计算机程序产品在计算机上运行时该程序代码可操作用于执行本发明的方法。换言之,当计算机程序在计算机上运行时本发明的方法因此是具有用于执行本发明方法其中至少之一的程序代码的计算机程序。
尽管已经参考本发明的特定实施例特定地显示和描述了以上内容,但是本领域的普通技术人员将会明白可以在形式和细节方面作出各种其他改变而不背离本发明的精神和范围。应该明白适应于不同实施例可以作出各种改变而不背离这里所公开的以及通过以下权利要求书所包含的更为广泛的构思。
Claims (28)
1.一种用于处理参数表示(202)的多声道音频解码器(200),其中参数表示(202)包括描述多声道信号的立体声下混的空间特性的立体声参数(206)和有关描述多声道信号的空间特性的一个或更多空间参数的信息(204),其中有关一个或更多空间参数的信息(204)和立体声参数(206)当使用合并规则被合并时产生一个或更多空间参数(210),所述解码器包括:
参数重构器(208),用于使用合并规则合并立体声参数(206)和有关一个或更多空间参数的信息(204)以获得一个或更多空间参数(210)。
2.根据权利要求1所述的多声道音频解码器(200),其中所述合并规则是所述合并包括通过由合并立体声参数(206)和有关一个或更多空间参数的信息(204)的参数的第一子集而导出的替换参数来替换所述参数的第一子集。
3.根据权利要求2所述的多声道音频解码器(200),其中所述合并规则是这样的,即通过线性合并来自参数的第一子集的相应参数和该参数的预测来导出替换参数,其中所述预测被使用有关一个或更多空间参数的信息(204)的第二子集参数以及立体声参数(206)导出,使用一种预测规则合并它们。
4.根据权利要求3所述的多声道音频解码器(200),其中所述预测规则是使用立体声参数(206)导出所述预测。
5.根据权利要求4所述的多声道音频解码器(200),其中所述预测规则是立体声参数(206)被用作空间参数的预测。
7.根据权利要求1所述的多声道音频解码器(200,220),其中参数重构器(226)还包括用于判定是否通过替换参数来替换参数的第一子集的判定单元(252)。
8.根据权利要求1所述的多声道音频解码器(200,220),还包括比特流分解器(222),它从比特流(230)中分解立体声参数的表示(234)和有关一个或更多空间参数的信息的表示(232),其中比特流(230)是向后兼容的以可通过传统参数立体声设备进行处理。
9.根据权利要求8所述的多声道音频解码器(200,220),还包括熵解码器和差分解码器(258,260,262a,262b),其用于根据立体声参数的表示(234)以及有关一个或更多空间参数的信息的表示(232)导出立体声参数(272)和有关一个或更多空间参数的信息(266,268)。
10.根据权利要求8所述的多声道音频解码器(220),其中比特流分解器(222)还操作用于从所述比特流中分解单声道下混信号(236),单声道下混信号(236)是多声道信号的单声道下混;以及
该解码器还包括使用单声道下混信号(236)和所述一个或更多空间参数(238)导出多声道信号的重构(240)的上混器(228)。
11.根据权利要求10所述的多声道音频解码器(220),还包括音频解码器(224),它用于根据从比特流(230)中分解的编码的单声道下混信号的表示(231)导出单声道下混信号(236)。
12.一种用于导出多声道音频信号的参数表示(12)的编码器(10),参数表示(12)具有适于和单声道下混信号一起使用的参数,编码器(10)包括:
空间参数计算器(14),用于计算描述多声道信号的空间特性的一个或更多空间参数(20);
立体声参数计算器(16),用于计算描述根据多声道信号所导出的立体声下混信号的空间特性的立体声参数(22);以及
参数合并器(18),用于通过使用一种合并规则合并一个或更多空间参数(20)和立体声参数(22)产生参数表示(12),其中参数合并器(18)操作用于使用合并规则,产生解码器可使用的立体声参数(24)和与解码器可使用的立体声参数(24)一起表示一个或更多空间参数(20)的有关一个或更多空间参数的信息(26)。
13.根据权利要求12所述的编码器(10;52),其中立体声参数计算器(16)还包括根据多声道信号(50)导出立体声下混信号(72)的立体声下混器(58)。
14.根据权利要求12或13所述的编码器(10;52),还包括根据多声道信号(50)导出单声道下混信号(68)的空间下混器(54)。
15.根据权利要求12所述的编码器(10;52),还包括用于以一种向后兼容传统参数立体声解码器的方式导出比特流(82)的比特流计算器(66),该比特流包括所述参数表示和单声道下混信号(68)。
16.根据权利要求14所述的编码器,其中空间下混器(54)还包括使用一种压缩规则压缩单声道下混信号(68)的音频编码器(62)。
17.一种处理参数表示的方法,其中该参数表示包括描述多声道信号的立体声下混的空间特性的立体声参数(206)以及有关描述多声道信号的空间特性的一个或更多空间参数的信息,其中有关一个或更多空间参数的信息以及立体声参数当被使用一种合并规则合并时产生一个或更多空间参数,该方法包括:
使用所述合并规则合并所述立体声参数和有关一个或更多空间参数的信息以获得所述一个或更多空间参数。
18.一种用于导出多声道音频信号的参数表示的方法,该参数表示具有适于和单声道下混信号一起使用的参数,该方法包括:
计算描述多声道信号的空间特性的一个或更多空间参数;
计算描述根据多声道信号所导出的立体声下混信号的空间特性的立体声参数;和
通过使用一种合并规则合并所述一个或更多空间参数和立体声参数来产生所述参数表示,其中使用所述合并规则产生解码器可使用的立体声参数和与解码器可使用的立体声参数一起表示所述一个或更多空间参数的有关一个或更多空间参数的信息。
19.一种发送器,它具有根据权利要求12所述的用于导出多声道音频信号的参数表示的编码器。
20.一种接收器,它具有根据权利要求1所述的多声道音频解码器(200)。
21.一种发送的方法,该方法具有根据权利要求18所述的用于导出多声道音频信号的参数表示的方法。
22.一种接收的方法,该方法具有根据权利要求17所述的用于处理参数表示的方法。
23.一种具有发送器(330)和接收器(340)的传输系统,其中,
发送器(330)具有根据权利要求12所述的用于导出多声道音频信号的参数表示的编码器;以及
接收器(340)具有根据权利要求1所述的多声道音频解码器。
24.一种发送和接收的方法,该方法包括:
发送方法,具有根据权利要求18所述的用于导出多声道音频信号的参数表示的方法;和
接收方法,具有根据权利要求17所述的用于处理参数表示的方法。
25.一种音频记录器(330),它具有根据权利要求12所述的用于导出多声道音频信号的参数表示的编码器。
26.一种音频播放器(340),它具有根据权利要求1所述的多声道音频解码器(200)。
27.一种音频记录的方法,该方法具有根据权利要求18所述的用于导出多声道音频信号的参数表示的方法。
28.一种音频播放的方法,该方法具有根据权利要求17所述的用于处理参数表示的方法。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
SE0402650A SE0402650D0 (sv) | 2004-11-02 | 2004-11-02 | Improved parametric stereo compatible coding of spatial audio |
SE04026506 | 2004-11-02 | ||
SE0402650-6 | 2004-11-02 | ||
PCT/EP2005/011663 WO2006048226A1 (en) | 2004-11-02 | 2005-10-31 | Stereo compatible multi-channel audio coding |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101036183A CN101036183A (zh) | 2007-09-12 |
CN101036183B true CN101036183B (zh) | 2011-06-01 |
Family
ID=33448766
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2005800338587A Active CN101036183B (zh) | 2004-11-02 | 2005-10-31 | 用于立体声兼容的多声道音频编码/解码的方法和设备 |
Country Status (13)
Country | Link |
---|---|
US (2) | US7916873B2 (zh) |
EP (1) | EP1784819B1 (zh) |
JP (1) | JP4616349B2 (zh) |
KR (1) | KR100936498B1 (zh) |
CN (1) | CN101036183B (zh) |
AT (1) | ATE393951T1 (zh) |
DE (1) | DE602005006424T2 (zh) |
ES (1) | ES2306235T3 (zh) |
HK (1) | HK1106606A1 (zh) |
RU (1) | RU2381570C2 (zh) |
SE (1) | SE0402650D0 (zh) |
TW (1) | TWI330825B (zh) |
WO (1) | WO2006048226A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11776552B2 (en) | 2013-09-12 | 2023-10-03 | Dolby International Ab | Methods and apparatus for decoding encoded audio signal(s) |
Families Citing this family (101)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2003244932A1 (en) * | 2002-07-12 | 2004-02-02 | Koninklijke Philips Electronics N.V. | Audio coding |
ATE527654T1 (de) | 2004-03-01 | 2011-10-15 | Dolby Lab Licensing Corp | Mehrkanal-audiodecodierung |
KR101283525B1 (ko) * | 2004-07-14 | 2013-07-15 | 돌비 인터네셔널 에이비 | 오디오 채널 변환 |
EP1818911B1 (en) * | 2004-12-27 | 2012-02-08 | Panasonic Corporation | Sound coding device and sound coding method |
BRPI0519454A2 (pt) * | 2004-12-28 | 2009-01-27 | Matsushita Electric Ind Co Ltd | aparelho de codificaÇço reescalonÁvel e mÉtodo de codificaÇço reescalonÁvel |
EP1691348A1 (en) * | 2005-02-14 | 2006-08-16 | Ecole Polytechnique Federale De Lausanne | Parametric joint-coding of audio sources |
CN101151659B (zh) * | 2005-03-30 | 2014-02-05 | 皇家飞利浦电子股份有限公司 | 多通道音频编码器、设备、方法及其解码器、设备和方法 |
WO2006126844A2 (en) * | 2005-05-26 | 2006-11-30 | Lg Electronics Inc. | Method and apparatus for decoding an audio signal |
JP4988716B2 (ja) | 2005-05-26 | 2012-08-01 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号のデコーディング方法及び装置 |
WO2007004831A1 (en) * | 2005-06-30 | 2007-01-11 | Lg Electronics Inc. | Method and apparatus for encoding and decoding an audio signal |
AU2006266655B2 (en) | 2005-06-30 | 2009-08-20 | Lg Electronics Inc. | Apparatus for encoding and decoding audio signal and method thereof |
US8082157B2 (en) | 2005-06-30 | 2011-12-20 | Lg Electronics Inc. | Apparatus for encoding and decoding audio signal and method thereof |
JP2009503574A (ja) * | 2005-07-29 | 2009-01-29 | エルジー エレクトロニクス インコーポレイティド | 分割情報のシグナリング方法 |
WO2007013784A1 (en) * | 2005-07-29 | 2007-02-01 | Lg Electronics Inc. | Method for generating encoded audio signal amd method for processing audio signal |
JP5173811B2 (ja) * | 2005-08-30 | 2013-04-03 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号デコーディング方法及びその装置 |
US8577483B2 (en) * | 2005-08-30 | 2013-11-05 | Lg Electronics, Inc. | Method for decoding an audio signal |
US7788107B2 (en) * | 2005-08-30 | 2010-08-31 | Lg Electronics Inc. | Method for decoding an audio signal |
WO2007032648A1 (en) * | 2005-09-14 | 2007-03-22 | Lg Electronics Inc. | Method and apparatus for decoding an audio signal |
US20080221907A1 (en) * | 2005-09-14 | 2008-09-11 | Lg Electronics, Inc. | Method and Apparatus for Decoding an Audio Signal |
ES2478004T3 (es) * | 2005-10-05 | 2014-07-18 | Lg Electronics Inc. | Método y aparato para decodificar una señal de audio |
KR100857111B1 (ko) * | 2005-10-05 | 2008-09-08 | 엘지전자 주식회사 | 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치 |
US7653533B2 (en) | 2005-10-24 | 2010-01-26 | Lg Electronics Inc. | Removing time delays in signal paths |
TWI329462B (en) * | 2006-01-19 | 2010-08-21 | Lg Electronics Inc | Method and apparatus for processing a media signal |
EP1974344A4 (en) * | 2006-01-19 | 2011-06-08 | Lg Electronics Inc | METHOD AND APPARATUS FOR DECODING A SIGNAL |
US8560303B2 (en) * | 2006-02-03 | 2013-10-15 | Electronics And Telecommunications Research Institute | Apparatus and method for visualization of multichannel audio signals |
JP4966981B2 (ja) | 2006-02-03 | 2012-07-04 | 韓國電子通信研究院 | 空間キューを用いたマルチオブジェクト又はマルチチャネルオーディオ信号のレンダリング制御方法及びその装置 |
JP5054035B2 (ja) * | 2006-02-07 | 2012-10-24 | エルジー エレクトロニクス インコーポレイティド | 符号化/復号化装置及び方法 |
KR20080093422A (ko) * | 2006-02-09 | 2008-10-21 | 엘지전자 주식회사 | 오브젝트 기반 오디오 신호의 부호화 및 복호화 방법과 그장치 |
ES2339888T3 (es) | 2006-02-21 | 2010-05-26 | Koninklijke Philips Electronics N.V. | Codificacion y decodificacion de audio. |
CA2636330C (en) | 2006-02-23 | 2012-05-29 | Lg Electronics Inc. | Method and apparatus for processing an audio signal |
JP2009532712A (ja) * | 2006-03-30 | 2009-09-10 | エルジー エレクトロニクス インコーポレイティド | メディア信号処理方法及び装置 |
EP1853092B1 (en) | 2006-05-04 | 2011-10-05 | LG Electronics, Inc. | Enhancing stereo audio with remix capability |
US8326609B2 (en) * | 2006-06-29 | 2012-12-04 | Lg Electronics Inc. | Method and apparatus for an audio signal processing |
US20090313029A1 (en) * | 2006-07-14 | 2009-12-17 | Anyka (Guangzhou) Software Technologiy Co., Ltd. | Method And System For Backward Compatible Multi Channel Audio Encoding and Decoding with the Maximum Entropy |
US20080235006A1 (en) * | 2006-08-18 | 2008-09-25 | Lg Electronics, Inc. | Method and Apparatus for Decoding an Audio Signal |
CN101652810B (zh) * | 2006-09-29 | 2012-04-11 | Lg电子株式会社 | 用于处理混合信号的装置及其方法 |
KR100891668B1 (ko) | 2006-10-12 | 2009-04-02 | 엘지전자 주식회사 | 믹스 신호 처리 방법 및 장치 |
KR100891672B1 (ko) | 2006-10-12 | 2009-04-03 | 엘지전자 주식회사 | 믹스 신호의 처리 방법 및 장치 |
EP2084901B1 (en) | 2006-10-12 | 2015-12-09 | LG Electronics Inc. | Apparatus for processing a mix signal and method thereof |
WO2008060111A1 (en) | 2006-11-15 | 2008-05-22 | Lg Electronics Inc. | A method and an apparatus for decoding an audio signal |
KR101434198B1 (ko) | 2006-11-17 | 2014-08-26 | 삼성전자주식회사 | 신호 복호화 방법 |
KR100891669B1 (ko) | 2006-12-01 | 2009-04-02 | 엘지전자 주식회사 | 믹스 신호의 처리 방법 및 장치 |
KR100891671B1 (ko) | 2006-12-01 | 2009-04-03 | 엘지전자 주식회사 | 믹스신호 제어 방법 및 장치 |
KR101062353B1 (ko) | 2006-12-07 | 2011-09-05 | 엘지전자 주식회사 | 오디오 신호의 디코딩 방법 및 그 장치 |
JP5450085B2 (ja) | 2006-12-07 | 2014-03-26 | エルジー エレクトロニクス インコーポレイティド | オーディオ処理方法及び装置 |
KR20080052813A (ko) * | 2006-12-08 | 2008-06-12 | 한국전자통신연구원 | 채널별 신호 분포 특성을 반영한 오디오 코딩 장치 및 방법 |
WO2008096313A1 (en) * | 2007-02-06 | 2008-08-14 | Koninklijke Philips Electronics N.V. | Low complexity parametric stereo decoder |
US20100121470A1 (en) * | 2007-02-13 | 2010-05-13 | Lg Electronics Inc. | Method and an apparatus for processing an audio signal |
CN101627425A (zh) * | 2007-02-13 | 2010-01-13 | Lg电子株式会社 | 用于处理音频信号的装置和方法 |
TWI374671B (en) | 2007-07-31 | 2012-10-11 | Realtek Semiconductor Corp | Audio encoding method with function of accelerating a quantization iterative loop process |
KR101505831B1 (ko) | 2007-10-30 | 2015-03-26 | 삼성전자주식회사 | 멀티 채널 신호의 부호화/복호화 방법 및 장치 |
AU2008344132B2 (en) * | 2008-01-01 | 2012-07-19 | Lg Electronics Inc. | A method and an apparatus for processing an audio signal |
JP5243556B2 (ja) | 2008-01-01 | 2013-07-24 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号の処理方法及び装置 |
KR101444102B1 (ko) | 2008-02-20 | 2014-09-26 | 삼성전자주식회사 | 스테레오 오디오의 부호화, 복호화 방법 및 장치 |
KR101061128B1 (ko) * | 2008-04-16 | 2011-08-31 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 이의 장치 |
US8326446B2 (en) | 2008-04-16 | 2012-12-04 | Lg Electronics Inc. | Method and an apparatus for processing an audio signal |
EP2111060B1 (en) | 2008-04-16 | 2014-12-03 | LG Electronics Inc. | A method and an apparatus for processing an audio signal |
US8060042B2 (en) * | 2008-05-23 | 2011-11-15 | Lg Electronics Inc. | Method and an apparatus for processing an audio signal |
BRPI0908630B1 (pt) * | 2008-05-23 | 2020-09-15 | Koninklijke Philips N.V. | Aparelho de 'upmix' estéreo paramétrico, decodificador estéreo paramétrico, método para a geração de um sinal esquerdo e de um sinal direito a partir de um sinal de 'downmix' mono com base em parâmetros espaciais, dispositivo de execução de áudio, aparelho de 'downmix' estéreo paramétrico, codificador estéreo paramétrico, método para a geração de um sinal residual de previsão para um sinal de diferença a partir de um sinal esquerdo e de um sinal direito com base nos parâmetros espaciais, e, produto de programa de computador |
KR101614160B1 (ko) * | 2008-07-16 | 2016-04-20 | 한국전자통신연구원 | 포스트 다운믹스 신호를 지원하는 다객체 오디오 부호화 장치 및 복호화 장치 |
EP2169664A3 (en) * | 2008-09-25 | 2010-04-07 | LG Electronics Inc. | A method and an apparatus for processing a signal |
WO2010036059A2 (en) * | 2008-09-25 | 2010-04-01 | Lg Electronics Inc. | A method and an apparatus for processing a signal |
EP2169665B1 (en) * | 2008-09-25 | 2018-05-02 | LG Electronics Inc. | A method and an apparatus for processing a signal |
US8479015B2 (en) * | 2008-10-17 | 2013-07-02 | Oracle International Corporation | Virtual image management |
KR101499785B1 (ko) | 2008-10-23 | 2015-03-09 | 삼성전자주식회사 | 모바일 디바이스를 위한 오디오 처리 장치 및 그 방법 |
CN102369573A (zh) * | 2009-03-13 | 2012-03-07 | 皇家飞利浦电子股份有限公司 | 嵌入和提取辅助数据 |
KR101433701B1 (ko) | 2009-03-17 | 2014-08-28 | 돌비 인터네셔널 에이비 | 적응형으로 선택가능한 좌/우 또는 미드/사이드 스테레오 코딩과 파라메트릭 스테레오 코딩의 조합에 기초한 진보된 스테레오 코딩 |
US8666752B2 (en) * | 2009-03-18 | 2014-03-04 | Samsung Electronics Co., Ltd. | Apparatus and method for encoding and decoding multi-channel signal |
US20100324915A1 (en) * | 2009-06-23 | 2010-12-23 | Electronic And Telecommunications Research Institute | Encoding and decoding apparatuses for high quality multi-channel audio codec |
TWI433137B (zh) | 2009-09-10 | 2014-04-01 | Dolby Int Ab | 藉由使用參數立體聲改良調頻立體聲收音機之聲頻信號之設備與方法 |
CN102812511A (zh) * | 2009-10-16 | 2012-12-05 | 法国电信公司 | 优化的参数立体声解码 |
EP2346028A1 (en) | 2009-12-17 | 2011-07-20 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | An apparatus and a method for converting a first parametric spatial audio signal into a second parametric spatial audio signal |
CN102157152B (zh) | 2010-02-12 | 2014-04-30 | 华为技术有限公司 | 立体声编码的方法、装置 |
EP2375409A1 (en) * | 2010-04-09 | 2011-10-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction |
US9236047B2 (en) | 2010-05-21 | 2016-01-12 | Microsoft Technology Licensing, Llc | Voice stream augmented note taking |
TWI516138B (zh) | 2010-08-24 | 2016-01-01 | 杜比國際公司 | 從二聲道音頻訊號決定參數式立體聲參數之系統與方法及其電腦程式產品 |
KR101697550B1 (ko) * | 2010-09-16 | 2017-02-02 | 삼성전자주식회사 | 멀티채널 오디오 대역폭 확장 장치 및 방법 |
KR101742136B1 (ko) * | 2011-03-18 | 2017-05-31 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 오디오 콘텐츠를 표현하는 비트스트림의 프레임들 내의 프레임 요소 배치 |
JP5895050B2 (ja) * | 2011-06-24 | 2016-03-30 | コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. | 符号化された多チャンネルオーディオ信号を処理するオーディオ信号プロセッサ及びその方法 |
KR101842257B1 (ko) * | 2011-09-14 | 2018-05-15 | 삼성전자주식회사 | 신호 처리 방법, 그에 따른 엔코딩 장치, 및 그에 따른 디코딩 장치 |
WO2013120510A1 (en) * | 2012-02-14 | 2013-08-22 | Huawei Technologies Co., Ltd. | A method and apparatus for performing an adaptive down- and up-mixing of a multi-channel audio signal |
US9601122B2 (en) | 2012-06-14 | 2017-03-21 | Dolby International Ab | Smooth configuration switching for multichannel audio |
KR101434206B1 (ko) | 2012-07-25 | 2014-08-27 | 삼성전자주식회사 | 신호 복호화 장치 |
IN2015DN02595A (zh) * | 2012-11-15 | 2015-09-11 | Ntt Docomo Inc | |
US9191516B2 (en) * | 2013-02-20 | 2015-11-17 | Qualcomm Incorporated | Teleconferencing using steganographically-embedded audio data |
EP3528249A1 (en) | 2013-04-05 | 2019-08-21 | Dolby International AB | Stereo audio encoder and decoder |
US8804971B1 (en) * | 2013-04-30 | 2014-08-12 | Dolby International Ab | Hybrid encoding of higher frequency and downmixed low frequency content of multichannel audio |
KR20160015280A (ko) * | 2013-05-28 | 2016-02-12 | 노키아 테크놀로지스 오와이 | 오디오 신호 인코더 |
TWI579831B (zh) | 2013-09-12 | 2017-04-21 | 杜比國際公司 | 用於參數量化的方法、用於量化的參數之解量化方法及其電腦可讀取的媒體、音頻編碼器、音頻解碼器及音頻系統 |
TWI847206B (zh) | 2013-09-12 | 2024-07-01 | 瑞典商杜比國際公司 | 多聲道音訊系統中之解碼方法、解碼裝置、包含用於執行解碼方法的指令之非暫態電腦可讀取的媒體之電腦程式產品、包含解碼裝置的音訊系統 |
EP2866227A1 (en) | 2013-10-22 | 2015-04-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder |
WO2015104447A1 (en) | 2014-01-13 | 2015-07-16 | Nokia Technologies Oy | Multi-channel audio signal classifier |
KR101500972B1 (ko) * | 2014-03-05 | 2015-03-12 | 삼성전자주식회사 | 멀티 채널 신호의 부호화/복호화 방법 및 장치 |
KR101856127B1 (ko) * | 2014-04-02 | 2018-05-09 | 주식회사 윌러스표준기술연구소 | 오디오 신호 처리 방법 및 장치 |
US9674598B2 (en) | 2014-04-15 | 2017-06-06 | Fairchild Semiconductor Corporation | Audio accessory communication with active noise cancellation |
CN107731238B (zh) * | 2016-08-10 | 2021-07-16 | 华为技术有限公司 | 多声道信号的编码方法和编码器 |
US10366695B2 (en) * | 2017-01-19 | 2019-07-30 | Qualcomm Incorporated | Inter-channel phase difference parameter modification |
CN108694955B (zh) * | 2017-04-12 | 2020-11-17 | 华为技术有限公司 | 多声道信号的编解码方法和编解码器 |
EP3588495A1 (en) | 2018-06-22 | 2020-01-01 | FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. | Multichannel audio coding |
WO2023088560A1 (en) * | 2021-11-18 | 2023-05-25 | Nokia Technologies Oy | Metadata processing for first order ambisonics |
CN115691515A (zh) * | 2022-07-12 | 2023-02-03 | 南京拓灵智能科技有限公司 | 一种音频编解码方法及装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003090208A1 (en) * | 2002-04-22 | 2003-10-30 | Koninklijke Philips Electronics N.V. | pARAMETRIC REPRESENTATION OF SPATIAL AUDIO |
WO2004008806A1 (en) * | 2002-07-16 | 2004-01-22 | Koninklijke Philips Electronics N.V. | Audio coding |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
BR9105987A (pt) | 1990-09-19 | 1993-02-02 | Philips Nv | Portador de registro no qual foram registrados um arquivo de dados principais e um arquivo de controle,processo e dispositivo para registrar um arquivo de dados principais e um arquivo de controle num portador de registro,e dispositivo para ter um portador de registro |
DE4236989C2 (de) * | 1992-11-02 | 1994-11-17 | Fraunhofer Ges Forschung | Verfahren zur Übertragung und/oder Speicherung digitaler Signale mehrerer Kanäle |
US6226616B1 (en) | 1999-06-21 | 2001-05-01 | Digital Theater Systems, Inc. | Sound quality of established low bit-rate audio coding systems without loss of decoder compatibility |
JP2002175097A (ja) * | 2000-12-06 | 2002-06-21 | Yamaha Corp | 音声信号のエンコード/圧縮装置およびデコード/伸長装置 |
US7292901B2 (en) | 2002-06-24 | 2007-11-06 | Agere Systems Inc. | Hybrid multi-channel/cue coding/decoding of audio signals |
CN1705980A (zh) | 2002-02-18 | 2005-12-07 | 皇家飞利浦电子股份有限公司 | 参数音频编码 |
ES2280736T3 (es) * | 2002-04-22 | 2007-09-16 | Koninklijke Philips Electronics N.V. | Sintetizacion de señal. |
KR101049751B1 (ko) | 2003-02-11 | 2011-07-19 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 오디오 코딩 |
EP1606797B1 (en) * | 2003-03-17 | 2010-11-03 | Koninklijke Philips Electronics N.V. | Processing of multi-channel signals |
US7394903B2 (en) * | 2004-01-20 | 2008-07-01 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal |
SE0400998D0 (sv) * | 2004-04-16 | 2004-04-16 | Cooding Technologies Sweden Ab | Method for representing multi-channel audio signals |
-
2004
- 2004-11-02 SE SE0402650A patent/SE0402650D0/xx unknown
-
2005
- 2005-10-31 EP EP05798859A patent/EP1784819B1/en active Active
- 2005-10-31 AT AT05798859T patent/ATE393951T1/de not_active IP Right Cessation
- 2005-10-31 ES ES05798859T patent/ES2306235T3/es active Active
- 2005-10-31 KR KR1020077006367A patent/KR100936498B1/ko active IP Right Grant
- 2005-10-31 CN CN2005800338587A patent/CN101036183B/zh active Active
- 2005-10-31 DE DE602005006424T patent/DE602005006424T2/de active Active
- 2005-10-31 RU RU2007120634/09A patent/RU2381570C2/ru active
- 2005-10-31 JP JP2007539523A patent/JP4616349B2/ja active Active
- 2005-10-31 WO PCT/EP2005/011663 patent/WO2006048226A1/en active IP Right Grant
- 2005-11-01 TW TW094138330A patent/TWI330825B/zh active
- 2005-11-23 US US11/286,239 patent/US7916873B2/en active Active
-
2007
- 2007-11-01 HK HK07111849A patent/HK1106606A1/xx unknown
-
2011
- 2011-03-03 US US13/040,057 patent/US8654985B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003090208A1 (en) * | 2002-04-22 | 2003-10-30 | Koninklijke Philips Electronics N.V. | pARAMETRIC REPRESENTATION OF SPATIAL AUDIO |
WO2004008806A1 (en) * | 2002-07-16 | 2004-01-22 | Koninklijke Philips Electronics N.V. | Audio coding |
Non-Patent Citations (1)
Title |
---|
FALLER C.Coding of spatial audio compatible with different playback formats.AUDIO ENGINEERING SOCIETY CONVENTION PAPER 17TH AES CONVENTION.2004,全文. * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11776552B2 (en) | 2013-09-12 | 2023-10-03 | Dolby International Ab | Methods and apparatus for decoding encoded audio signal(s) |
Also Published As
Publication number | Publication date |
---|---|
DE602005006424T2 (de) | 2009-05-28 |
US20110211703A1 (en) | 2011-09-01 |
RU2381570C2 (ru) | 2010-02-10 |
ES2306235T3 (es) | 2008-11-01 |
SE0402650D0 (sv) | 2004-11-02 |
KR100936498B1 (ko) | 2010-01-13 |
HK1106606A1 (en) | 2008-03-14 |
RU2007120634A (ru) | 2008-12-10 |
EP1784819A1 (en) | 2007-05-16 |
DE602005006424D1 (de) | 2008-06-12 |
US7916873B2 (en) | 2011-03-29 |
JP2008519301A (ja) | 2008-06-05 |
JP4616349B2 (ja) | 2011-01-19 |
EP1784819B1 (en) | 2008-04-30 |
KR20070051915A (ko) | 2007-05-18 |
ATE393951T1 (de) | 2008-05-15 |
US8654985B2 (en) | 2014-02-18 |
US20060133618A1 (en) | 2006-06-22 |
TWI330825B (en) | 2010-09-21 |
CN101036183A (zh) | 2007-09-12 |
WO2006048226A1 (en) | 2006-05-11 |
TW200627379A (en) | 2006-08-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101036183B (zh) | 用于立体声兼容的多声道音频编码/解码的方法和设备 | |
KR100946688B1 (ko) | 멀티 채널 오디오 디코더, 멀티 채널 인코더, 오디오 신호 처리 방법 및 상기 처리 방법을 수행하는 프로그램을 기록한 기록매체 | |
RU2388068C2 (ru) | Временное и пространственное генерирование многоканальных аудиосигналов | |
JP4685925B2 (ja) | 適応残差オーディオ符号化 | |
RU2491657C2 (ru) | Способы и устройства для эффективного использования поэтапно передаваемой информации в кодировании и декодировании звука | |
KR101629862B1 (ko) | 파라메트릭 스테레오 업믹스 장치, 파라메트릭 스테레오 디코더, 파라메트릭 스테레오 다운믹스 장치, 파라메트릭 스테레오 인코더 | |
CN109509478B (zh) | 音频处理装置 | |
RU2367033C2 (ru) | Многоканальное иерархическое аудиокодирование с компактной дополнительной информацией | |
KR101271069B1 (ko) | 다중채널 오디오 인코더 및 디코더와, 인코딩 및 디코딩 방법 | |
CN102388417B (zh) | 基于自适应地可选择的左/右或中央/侧边立体声编码和参数立体声编码的组合的高级立体声编码 | |
JP4601669B2 (ja) | マルチチャネル信号またはパラメータデータセットを生成する装置および方法 | |
CN101248483B (zh) | 多声道音频信号的生成 | |
EP1999747B1 (en) | Audio decoding | |
JP4794448B2 (ja) | オーディオエンコーダ | |
WO2011013381A1 (ja) | 符号化装置および復号装置 | |
CN101371300A (zh) | 用于可伸缩声道解码的方法、介质和设备 | |
MX2015001514A (es) | Metodo y descodificador para codificacion de objeto de audio especial de multi-instancias que emplea un concepto parametrico para casos de mezcla descendente/mezcla ascendente de multicanal. | |
JP6179122B2 (ja) | オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化プログラム | |
RU2485605C2 (ru) | Усовершенствованный метод кодирования и параметрического представления кодирования многоканального объекта после понижающего микширования | |
CN113614827A (zh) | 用于预测性译码中的低成本错误恢复的方法和设备 | |
Quackenbush | MPEG Audio Compression Advances |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |