CN101014999B - 产生多通道信号或参数数据集的设备和方法 - Google Patents

产生多通道信号或参数数据集的设备和方法 Download PDF

Info

Publication number
CN101014999B
CN101014999B CN2005800300274A CN200580030027A CN101014999B CN 101014999 B CN101014999 B CN 101014999B CN 2005800300274 A CN2005800300274 A CN 2005800300274A CN 200580030027 A CN200580030027 A CN 200580030027A CN 101014999 B CN101014999 B CN 101014999B
Authority
CN
China
Prior art keywords
configuration
data
transmission channel
prompting
hyperchannel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2005800300274A
Other languages
English (en)
Other versions
CN101014999A (zh
Inventor
拉尔夫·施佩尔施奈德
于尔根·赫勒
约翰内斯·希尔伯特
克里斯蒂安·埃特尔
斯特凡·盖尔斯贝格
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Publication of CN101014999A publication Critical patent/CN101014999A/zh
Application granted granted Critical
Publication of CN101014999B publication Critical patent/CN101014999B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Mathematical Physics (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Time-Division Multiplex Systems (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Channel Selection Circuits, Automatic Tuning Circuits (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)

Abstract

为了灵活地信号通知多通道参数重建中的同步模式或异步模式,将参数配置提示插入数据流,多通道解码器侧的配置装置使用该参数配置提示来配置多通道重建装置。如果参数配置提示具有第一意义,则配置装置将在其输入数据中查找其它配置信息,而当参数配置提示具有另一意义时,配置装置根据与编码传输通道数据所用的编码算法有关的信息,来执行多通道重建装置的配置设置,从而一方面确保了效率,另一方面确保了灵活性,总是可以获得参数数据和解码的传输通道数据之间的正确关联。

Description

产生多通道信号或参数数据集的设备和方法
技术领域
本发明涉及参数多通道处理技术,具体地,涉及用于产生和/或读取灵活数据句法、并用于将参数数据与下混(down-mix)和/或传输通道的数据相关联的编码器/解码器。
背景技术
除了两个立体声通道之外,所推荐的多通道环绕表述还包括中央通道C和两个环绕通道,即左环绕通道L和右环绕通道R,此外,如果可以应用,则还包括被称作LFE通道(LFE=低频增强)的超低音扬声器通道。这种参考声音格式也称作3/2(加LFE)立体声,近来也称作5.1多通道,这表示有三个前通道和两个环绕通道。一般而言,需要5或6个传输通道。在再现环境中,5个各自不同的位置上至少需要5个扬声器,以获得与5个正确放置的扬声器相隔确定距离的最优的所谓最佳听音位置。然而,相对于超低音扬声器的定位,可以相对自由地使用超低音扬声器。
已有多种技术用于减少传输多通道音频信号所需的数据量。这些技术也称作联合立体声技术。为此参考图5。图5示出了联合立体声设备60。例如,这种设备可以是实现强度立体声技术(IS技术)或技术心理声学编码技术(BCC技术)的设备。这种设备一般接收至少两个通道(CH1、CH2、...CHn)作为输入信号,并输出至少一个单载波通道(下混)和参数数据(即,一个或多个参数集)。对参数数据进行定义,从而可以在解码器中计算每个原始通道(CH1、CH2、...CHn)的近似。
通常,载波通道将包括子带采样、频谱系数或时域采样等,提供了下层(underlying)信号的相对精细的表述,而参数数据和/或参数集不包括任何这种采样或频谱系数。取而代之的是,参数数据包括用于对诸如乘法加权、时移、频移等确定的重建算法进行控制的控制参数。因此,参数数据只包括信号或关联通道的相对粗略的表述。当以数字表达时,(压缩的,即通过例如AAC编码的)载波通道所需的数据量在60到70kbit/s的范围中,而参数辅助信息所需的数据量在每通道1.5kbit/s的量级上。参数数据的一个示例是如将在以下描述的公知的缩放因子、强度立体声信息或技术心理声学参数。
在AES preprint 3799中由J.Herre,K.H.Brandenburg和D.Lederer所著的题为“Intensity stereo coding”,1994年2月,Amsterdam中描述了强度立体声编码技术。一般而言,强度立体声的概念基于要应用于两个立体声音频通道数据的主轴变换。如果将大多数数据点设置在第一主轴周围,则可以通过在编码之前将两个信号均旋转确定角度来实现编码增益。但是,这并不总是适用于实际立体声再现技术。左和右通道的重建信号包括相同传输信号的不同加权或缩放的版本。虽然重建信号在幅度上不同,但是相对于相位信息是相同的。但是,典型地两个原始音频通道的能量时间包络是通过以频率选择形式而操作的选择性缩放操作来保持的。这与高频上的人类声音感知相对应,在高频上,主导空间提示由能量包络确定。
此外,在实际实现中,传输信号(即,载波通道)由左通道和右通道的和信号形成,而不是通过旋转两个分量来形成。此外,以频率选择方式,即,针对每个缩放因子频带(即,针对每个编码器频率部分)彼此独立,来执行这种处理(即,用于执行缩放操作的强度立体声参数的产生)。优选地,将两个通道组合,形成组合或“载波”通道。除了组合通道之外,对强度立体声信息进行确定还取决于第一通道的能量、第二通道的能量和组合或和通道的能量。
在AES convention paper 5574中的C.Faller和F.Baumgarte所著的题为“Binaural cue coding applied to stereo and multi-channel audio compression”,2002年5月,München中描述了BCC技术。在BCC编码中,使用具有交迭窗的基于DFT的变换,将多个音频输入通道转换为频谱表述。将得到的频谱划分为非交迭部分。每个部分具有与等效矩形带宽(ERB)成比例的带宽。针对每个部分,即,针对每个频带和针对每一帧k(即,时间采样块),来计算所谓的通道间电平差(ICLD)和所谓的通道间时间差(ICTD)。对ICLD和ICTD参数进行量化和编码,以获得BCC比特流。通道间电平差和通道间时间差是相对于参考通道而给予每个通道的。具体地,取决于要处理信号的特定划分,根据预定公式计算参数。
在解码器侧,解码器接收单声道信号和BCC比特流(即,针对每一帧的通道间时间差的第一参数集和针对每一帧的通道间电平差的第二参数集)。将单声道信号变换到频域,并输入到也接收已解码的ICLD和ICTD值的合成块中。在合成块或重建块中,使用BCC参数(ICLD和ICTD)执行对单声道信号的加权操作,以重建多通道信号,然后,在经过频率/时间转换之后,多通道信号代表原始多通道信号音频信号的重建。
在BCC的情况下,联合立体声模块60进行操作,以输出通道辅助信息,从而将参数通道数据量化和编码为ICLD和ICTD参数,其中原始通道之一可以用作对通道辅助信息进行编码的参考通道。通常,载波通道由参与原始通道的总和形成。
当然,上述技术只为仅能够对载波通道进行解码的解码器提供单声道表述,而无法产生用于生成多于一个输入通道的一个或多个近似的参数数据。
在美国专利申请US 2003/0219130 A1、2003/0026441 A1和2003/0035553 A1中也描述了被称作BCC技术的音频编码技术。此外,参见C.Faller和F.Baumgarte所著的“Binaural Cue Coding.Part.II:Schemes and Applications”,IEEE:Transactions on Audio and Speech Proc.,Vol.11,No.6,1993年11月。此外,还参见C.Faller和F.Baumgarte所著的“Binaural Cue Coding applied to Stereo and Multi-Channel Audio compression”,Preprint,112th Convention of the Audio Engineering Society(AES),2002年5月,以及J.Herre,C.Faller,C.Ertel,J.Hilpert,A.Hoelzer和C.Spenger所著的“MP3Surround:Efficient and Compatible Coding of Multi-Channel Audio”,116th AES Convention,Berlin,2004,Preprint 6049。在下文中,将参考图6到8,更加详细地描述用于多通道音频编码的典型通用BCC方案。图6示出了用于多通道音频信号的编码/传输的通用BCC编码方案。在BCC编码器112的输入110处输入多通道音频输入信号,并在所谓的下混块114中对其进行“下混”,即,转换为单个和通道。在本示例中,输入110处的信号是5通道环绕信号,具有前左通道和前右通道、左环绕通道和右环绕通道、以及中央通道。典型地,下混块通过将这5个通道简单地相加成单声道信号,来产生和信号。其它下混方案在本领域中是公知的,所有方案均使用多通道输入信号来产生具有单通道或具有多个下混通道的下混信号,其中,下混通道的数目无论如何都少于原始输入通道的数目。在本示例中,如果从5个输入通道中产生四个载波通道,则已实现了下混操作。在和信号线路115上输出单个输出通道和/或多个输出通道。
在辅助信息线路117上输出由BCC分析块116获得的辅助信息。在BCC分析块中,可以计算通道间电平差(ICLD)、通道间时间差(ICTD)或通道间相关值(ICC值)。因此,在BCC合成块122中有用于重建的3个不同参数集,即通道间电平差(ICLD)、通道间时间差(ICTD)和通道间相关值(ICC)。
典型地,和信号以及具有参数集的辅助信息以量化和编码的格式被传输到BCC解码器120。BCC解码器将所传输的(在编码传输的情况下,所传输且解码的)和信号分为多个子带,并执行缩放、延迟和进一步处理,以产生要重建的多个通道的子带。执行这种处理,从而输出121处的重建多通道信号的ICLD、ICTD和ICC参数(提示(cue))与在输入110处进入BCC编码器112的原始多通道信号的各个提示类似。为此,BCC解码器120包括BCC合成块122和辅助信息处理块123。
下文将参考图7示出BCC合成块122的内部结构。将线路115上的和信号输入典型地体现为滤波器组FB 125的时间/频率转换块中。在块125的输出处,有N个子带信号,或者在极端情况下,如果音频滤波器组125执行从N个时域采样中产生N个频谱系数的变换,则有频谱系数块。
BCC合成块122还包括延迟级126、电平修正级127、相关处理级128和代表逆滤波器组的级IFB 129。例如,如图6所示,在级129的输出处,在5通道环绕系统的情况下,具有5个通道的重建多通道音频信号可以在一组扬声器124上输出。
图7进一步示出了通过元件125将输入信号s(n)转换到频域或滤波器组域。如节点130所示,使元件125输出的信号翻倍,以获得相同信号的多个版本。原始信号的版本数目等于要重建的输出信号中的输出通道的数目。如果在节点130处对原始信号的每个版本进行确定的延迟d1、d2、...di、dN,则结果是块126的输出处的情况:包括相同信号但具有不同延迟的版本。延迟参数由图6中的辅助信息处理块123来计算,并如由BCC分析块116所确定的通道间时间差而推导出来。
这同样适用于乘法参数a1、a2、...ai、aN,它们也由辅助信息处理块123基于由BCC分析块116所确定的通道间电平差来计算。
ICC参数由BCC分析块116来计算,并用于控制块128的功能,从而在块128的输出处获得在经延迟和电平处理过的信号之间的所确定的相关值。要注意,级126、127和128的顺序可以不同于图7中所表示的。
还要注意,在音频信号的逐块处理中,BCC分析也是逐块执行的。此外,BCC分析也是逐频率执行的,即,以频率选择方式。这表示对于每个频带,对于每个块都具有ICLD参数、ICTD参数和ICC参数。因此,穿过所有频带的至少一个通道的至少一个块的ICTD参数代表ICTD参数集。这同样适用于代表用于重建至少一个输出通道的所有频带的至少一个块的所有ICLD参数的ICLD参数集。这同样适用于ICC参数集,ICC参数集同样包括用于基于输入通道或和通道来重建至少一个输出通道的各个频带的至少一个块的多个单独的ICC参数。
在下文中,参考图8,图8示出了从中可以看到BCC参数的确定的情况。通常,可以在任意通道对之间定义ICLD、ICTD和ICC参数。典型地,在参考通道与每个其它输入通道之间执行ICLD和ICTD参数的确定,从而对于除参考通道之外的每个输入通道,均有独特的参数集。这也在图8中示出。
但是,可以对ICC参数进行不同的定义。一般而言,如也在图8B中示意性示出的,在编码器中,可以在任何通道对之间产生ICC参数。在这种情况下,解码器将执行ICC合成,从而在任何通道对之间获得与原始信号中呈现的近似相同的结果。但是,建议在任何时间(即,针对每个时间帧)仅仅计算两个最强通道之间的ICC参数。图8C中表示本方案,示出了如下示例:在一个时间上计算并传输通道1与2之间的ICC参数,在另一时间上计算通道1与5之间的ICC参数。然后,解码器对解码器中两个最强通道之间的通道间相关进行合成,并进一步执行启发式规则,以对剩余通道对的通道间相干进行合成。
例如,对于基于所传输的ICLD参数对乘法参数a1、...、aN的计算,参考所引用的AES convention paper 5574。ICLD参数代表原始多通道信号中的能量分布。不失一般性,图8A示出了存在代表所有其它通道与前左通道之间的能量差的四个ICLD参数。在辅助信息处理块123中,从ICLD参数中推导出乘法参数a1、...、aN,从而所有重建输出通道的总能量是与所传输的和信号所呈现的相同的能量,或至少与该能量成比例。确定这些参数的一种方式是两级过程,其中,在第一级中,将左前通道的乘法因子设为1,而将图8C中其它通道的乘法因子设为所传输的ICLD值。然后,在第二级中,计算所有5个通道的能量,并将其与所传输的和信号的能量比较。接着,缩减所有通道,即,使用针对所有通道相等的缩放因子,其中,选择缩放因子,以使缩放之后的所有重建输出通道的总能量等于所传输的和信号和/或多个所传输的和信号的总能量。
对于从BCC编码器传输到BCC解码器、作为进一步的参数集的通道间相干测量ICC,要注意,可以通过对乘法因子的修正来执行相干处理,例如,将所有子带的加权因子乘以具有在20log10-6和20log106之间的值的随机数。典型地,选择伪随机序列,从而所有临界带的方差近似相等,并且每个临界带内的平均值为0。相同的序列用于每个不同帧或块的频谱系数。因此,通过对伪随机序列的方差的修正来控制音频场景的宽度。较大的方差产生较大的听觉宽度。可以在具有临界带宽度的单独频带中执行方差修正。这允许听觉场景中同时存在多个对象,其中,每个对象具有不同的听觉宽度。伪随机序列的适合幅度分布是对数尺度上的均匀分布,例如在美国专利公开2002/0219130 A1中所述。
为了以兼容方式(例如,以也适合于正常立体声解码器的比特流格式)传输5个通道,可以使用G.Theile和G.Stoll所著的“MUSICAM Surround:A universal multi-channel coding system compatible with ISO/IEC 11172-3”,AES Preprint,1992年10月,San Francisco中所述的所谓矩阵技术。
此外,参见出版物中的B.Grill,J.Herre,K.H.Brandenburg,E.Eberlein,J.Koller和J.Miller所著的“Improved MPEG 2 Audio multi-channel encoding”,AES Preprint 3865,1994年2月,Amsterdam中所述的多通道编码技术,其中,兼容性矩阵用于从原始输入通道中获得下混通道。
总之,可以说BCC技术允许对多通道音频材料的高效并且向后兼容的编码,例如,如由E.Schuijer,J.Breebaart,H.Purnhagen和J.所著的专家出版物“Low-Complexity Parametric Stereo Coding”,119th AES Convention,Berlin,2004,Preprint 6073中所述。在这种环境下,还应该提及MPEG-4标准,特别是对参数音频技术的扩展,其中,该标准部分也是通过名称ISO/IEC 14496-3:2001/FDAM 2(Parametric Audio)而公知的。在这方面,特别应该提及在MPEG-4标准的表8.9中名为“syntax of the psdata()”的句法。在本示例中,应该提及句法元素“enable_icc”和“enable_ipdopd”,其中,这些句法元素用于开启和关闭ICC参数和与通道间时间差相对应的相位的传输。还应该提及句法元素“icc_data()”、“ipd_data()”和“opd_data()”。
总之,要注意一般采用一个或多个所传输的载波通道来使用这种参数多通道技术,其中,从N个原始通道中形成M个所传输的通道,以再次重建N个输出通道或K个输出通道,其中,K等于或小于原始通道的数目N。
从图6中可见,BCC分析是根据具有N个原始通道的多通道信号的典型分离预处理,一方面用于产生参数数据,另一方面产生一个或多个传输通道(下混通道)。典型地,尽管图6中未示出,然后例如通过典型的MP3或AAC立体声/单声道编码器,压缩这些下混通道,使得在输出侧,有以压缩形式表述传输通道数据的比特流,并且还有表述参数数据的另一比特流。这样,与图6的下混通道和/或和信号115的实际音频编码相独立地,进行BCC分析。
解码器侧是类似的。具有多通道能力的解码器将首先根据所使用的编码算法,对包括压缩下混信号的比特流进行解码,并还在输出侧提供一个或多个传输通道,即典型地作为时间序列PCM(脉冲编码调制)数据来提供。然后,作为截然独立且孤立后处理来进行BCC合成,BCC合成自身足以信号通知参数数据流,并且具有数据,以在输出侧产生优选地与音频解码下混信号的原始输入通道的数目相等的多个输出通道。
因此,BCC分析的优点在于,其具有用于BCC分析的独立滤波器组和用于BCC合成的独立滤波器组,因此与音频编码器/解码器的滤波器组分离,从而一方面,不必对音频压缩有任何让步,而另一方面,可进行多通道重建。一般而言,这样,与多通道参数处理独立地进行音频压缩,可最佳地针对应用领域来配备这些处理。
然而,该概念的缺点在于,要针对多通道重建和音频解码来传输完整信号通知。当音频解码器和多通道重建装置执行相同或类似步骤并因此需要相同和/或彼此依赖的配置设置时(通常都是这种情况),这尤其不利。由于完全分离的概念,因此发送信号通知数据两次,导致数据量的人为“扩大”,这根本上是由于在音频编码/解码和多通道分析/合成之间选择了分离概念。
另一方面,多通道重建到音频解码的完整“链路”将相当大地限制灵活性,这是因为在这种情况下,则必须放弃分离两个处理步骤以便以最佳方式执行每个处理步骤的实际主要目的。因此,将引起质量损耗,尤其是在多个连续编码/解码级(也被称为“串联”编码)的情况下。如果存在BCC数据到编码的音频数据的完整链路,则必须在每次解码时执行多通道重建,以在重新编码时再次执行多通道合成。由于每种参数技术本质上都是有损的,所以通过重复的分析合成分析,损耗将积累,因此,随着每一解码/解码级,音频信号的可感知质量将进一步降低。
在这种情况下,仅当串联链路中的每个音频编解码器等同工作,即具有相同采样速率、块长度、提前(advance)长度、窗口、变换、…,也即通常具有相同配置,并且还保持各个块边界,才可以解码/编码音频数据而不同时进行参数数据的分析/合成处理。然而,这种概念相当大地限制了整个概念的灵活性。尤其是对于参数多通道技术意欲例如通过附加参数数据来补充已有的立体声数据的事实,该限制更加烦人。由于已有的立体声数据可来源于都使用不同的块长度或者甚至在频域内不工作而在时域工作的多个不同编码器,所以这种限制导致从一开始就不可能进行后续的补充。
发明内容
本发明的目的是提供一种用于产生多通道音频信号或重建参数数据集的灵活有效的概念。
由根据本发明所述的一种用于产生多通道信号的设备、一种用于产生多通道信号的方法、一种用于产生参数数据集的设备、一种用于产生参数数据集的方法、一种用于产生参数数据输出的设备、或一种用于产生参数数据输出的设备来实现该目的。
根据本发明的一方面,提供了一种用于使用输入数据来产生多通道信号以获得K个输出通道的设备,其中输入数据包括表示M个传输通道的传输通道数据和参数数据,M个传输通道和参数数据一起表述N个原始通道,M小于N且等于或大于1,K大于M,输入数据包括参数配置提示,所述设备包括:多通道重建装置,设计用于根据传输通道数据和参数数据来产生K个输出通道;以及配置装置,用于配置多通道重建装置,其中配置装置设计用于读取输入数据以解译参数配置提示,当参数配置提示具有第一意义时,提取输入数据中包含的配置信息,并实现多通道重建装置的配置设置,以及当参数配置提示具有与第一意义不同的第二意义时,利用与从传输通道数据的编码版本来解码传输通道数据所使用的编码算法有关的信息,来配置多通道重建装置,使得多通道重建装置的配置设置与编码算法的配置设置相同或取决于编码算法的配置设置。
根据本发明的另一方面,提供了一种用于使用输入数据来产生多通道信号以获得K个输出通道的方法,其中输入数据包括表示M个传输通道的传输通道数据和参数数据,M个传输通道和参数数据一起表述N个原始通道,M小于N且等于或大于1,K大于M,输入数据包括参数配置提示,所述方法包括:基于重建算法,根据传输通道数据和参数数据来重建K个输出通道;以及通过以下子步骤来配置重建算法:
读取输入数据以解译参数配置提示,当参数配置提示具有第一意义时,提取输入数据中包含的配置信息,并实现重建算法的配置设置,以及当参数配置提示具有与第一意义不同的第二意义时,使用与从编码版本解码传输通道数据所用的编码算法有关的信息,来实现重建算法的配置设置,使得该配置设置与编码算法的配置设置相同或取决于编码算法的配置设置。
根据本发明的另一方面,提供了一种用于产生参数数据输出的设备,其中参数数据输出与包括M个传输通道的传输通道数据一起表述N个原始通道,M小于N且等于或大于1,所述设备包括:多通道参数装置,用于提供参数数据;信号通知装置,用于确定参数配置提示,其中当参数数据输出中包含的配置信息将用于多通道重建装置时,参数配置提示具有第一意义,而当配置数据将用于基于要用于编码或解码所述M个传输通道的编码算法的多通道重建时,参数配置提示具有第二意义;以及配置数据写装置,用于输出配置信息以获得参数数据输出。
根据本发明的另一方面,提供了一种用于产生参数数据输出的方法,其中参数数据输出与包括M个传输通道的传输通道数据一起表述N个原始通道,M小于N且等于或大于1,所述方法包括:提供参数数据;确定参数配置提示,其中当参数数据输出中包含的配置信息将用于多通道重建算法时,参数配置提示具有第一意义,而当配置数据将用于基于要用于编码或解码所述M个传输通道的编码算法的多通道重建时,参数配置提示具有第二意义;以及输出配置信息以获得参数数据输出。
根据本发明的另一方面,提供了一种用于使用输入数据来产生参数数据输出的设备,其中参数数据输出与包括M个传输通道的传输通道数据一起表述N个原始通道,M小于N且等于或大于1,输入数据包括参数配置提示,参数配置提示具有第一意义,即输入数据中包含用于多通道重建装置的配置信息,或具有第二意义,即多通道重建装置将用于根据从编码版本的传输通道数据来解码传输通道数据所用的编码算法来使用配置信息,所述设备包括:
写装置,用于写配置数据,其中写装置设计用于读取输入数据以解译参数配置提示,以及当参数配置提示具有第二意义时,检索并输出与从编码版本的传输通道数据来解码传输通道数据所用的编码算法有关的信息,作为配置数据;或者当参数配置提示具有第一意义时,输出在输入数据中包含的用于多通道重建装置的配置数据。
根据本发明的另一方面,提供了一种用于使用输入数据来产生参数数据输出的方法,其中参数数据输出与包括M个传输通道的传输通道数据一起表述N个原始通道,M小于N且等于或大于1,输入数据包括参数配置提示,参数配置提示具有第一意义,即输入数据中包含用于多通道重建装置的配置信息,或具有第二意义,即多通道重建装置将用于根据从编码版本的传输通道数据来解码传输通道数据所用的编码算法来使用配置信息,所述方法包括:
读取输入数据以解译参数配置提示,以及当参数配置提示具有第二意义时,检索与从编码版本的传输通道数据来解码传输通道数据所用的编码算法有关的信息,并输出检索到的配置数据;或者当参数配置提示具有第一意义时,输出在输入数据中包含的用于多通道重建装置的配置数据。
本发明基于以下发现:效率和灵活性可通过使可包括传输通道数据和参数数据的数据流包含在编码器侧插入并在解码器侧评价的参数配置提示。该提示表示是否根据输入数据(即从编码器发送到解码器的数据)配置了多通道重建装置,或者是否通过将编码的传输通道数据解码所使用的编码算法的提示而配置了多通道重建装置。多通道重建装置具有与用于将编码的传输通道数据解码的音频解码器的配置设置相同的配置设置,或者至少取决于该设置的配置设置。
如果解码器检测到第一种情况,即参数配置提示具有第一意义,解码器将在所接收的输入数据中查找其它配置信息,以正确地配置多通道重建装置,然后使用该信息来实现多通道重建装置的配置设置。例如,这种配置设置将是块长度、提前、采样频率、滤波器组控制数据、所谓粒度信息(帧中有多少BCC块)、通道配置(例如,产生输出,而无论是否有“mp3”)、参数数据必须以缩放形式的信息(例如ICLD)和参数数据不必以缩放形式的信息(ICTD)等。
然而,如果解码器确定参数配置提示具有与第一意义不同的第二意义,则多通道重建装置将根据与传输通道数据(即下混通道)的编码/解码所基于的音频编码算法,选择多通道重建装置中的配置设置。
与参数数据的分离概念以及压缩的下混数据相反地,用于产生多通道音频信号的本发明设备将实施“盗窃”来配置自身,也就是说,对于多通道重建装置的配置,在实际完全分离且自足的音频数据中和/或在自足工作的上游音频解码器中实施“盗窃”来配置自身。
在虑及不同的音频编码算法时,本发明的概念在本发明的优选实施例中尤其有用。在这种情况下,必须发送大量显式通知信息来实现同步操作,即多通道重构装置与音频解码器同步工作的操作,即对于每个不同的编码算法,有相应的提前长度,因此实际独立的多通道重建算法与音频解码器算法同步。
根据本发明,单个比特就足够的参数配置提示(输入到解码器的信号)为了解码器的配置,要看看该信号的下游是哪个音频编码器。在此之后,解码器将接收与哪个音频编码器当前是大量不同音频编码器的上游有关的信息。在接收到该信息时,优选地进入位于多通道解码器中的配置表,利用该音频编码算法标识,从中检索针对每个可能的音频编码算法而预定义的配置信息,来实现多通道重建装置的至少一种配置设置。与在数据流中显式地表示配置的情况相比,这实现了显著的数据率节约,在数据流中显式地表示配置时,未考虑多通道重建装置与音频解码器之间的数据率,并且没有本发明的多通道重建装置对音频解码器数据的“盗窃”。
另一方面,本发明概念还提供了配置信息的显式通知内在的高度灵活性,由于对于参数配置提示,数据流中的单个比特就足够,所以可以实际发送数据流中的所有配置信息,或者,如果需要,按照混合形式,发送数据流中的至少一部分参数配置信息,并从放弃(laid down)信息集中获取另一部分所需信息。
在本发明的优选实施例中,编码器发送到解码器的数据还包括继续提示信号通知,用于向解码器信号通知是否应该与已有或先前信号通知的配置设置相比而改变配置设置,或者应该按照之前配置,或者作为对继续提示的特定设置的反应,读入参数配置提示以确定是否应该存在多通道重建装置相对于音频解码器的对齐,或者在传输数据中是否包含与配置有关的至少部分显式的信息。
附图说明
下面将参考附图,更详细地解译本发明的优选实施例,附图中:
图1是用于产生可在编码器侧使用的参数数据集的本发明设备的电路框图;
图2是用于产生在解码器侧使用的多通道音频信号的设备的电路框图;
图3是在本发明的优选实施例中的图2的配置装置的操作的原理流程图;
图4a是用于音频解码器和多通道重建装置之间的同步操作的数据流的示意表述;
图4b是用于音频解码器和多通道重建装置之间的异步操作的数据流的示意表述;
图4c是句法形式的用于产生多通道音频信号的设备的优选实施例;
图5是多通道编码器的大体表述;
图6是BCC编码器/BCC解码器路径的示意框图;
图7是图6的BCC合成块的电路框图;以及
图8A至8C是用于计算参数集ICLD、ICTD和ICC的典型场景的表述。
具体实施方式
图1示出了用于产生参数数据集的本发明设备的电路框图,其中,可在图1所示的设备的输出10处输出参数数据集。参数数据集包含参数数据以及图1未示出但是将在下面讨论的、表述N个原始通道的传输通道数据,其中,传输通道数据典型地包括M个传输通道,其中传输通道的数目M小于原始通道的数目N并等于或大于1。
容纳在编码器侧的图1所示设备包括多通道参数装置11,多通道参数装置11被设计用于执行例如BCC分析或强度立体声分析等。在这种情况下,多通道参数装置11将在输入12处接收N个原始通道。然而,可选地,多通道参数装置11也可设计用作代码转换装置,用于使用馈入原始参数输入13的已有原始参数数据,在装置11的输出处产生参数数据。如果参数数据是BCC分析装置所提供的简单BCC数据,则多通道参数装置11的处理将只包括将输入13的数据复制到装置11的输出的复制功能。然而,多通道参数装置11也可设计用于改变原始参数数据流的句法,例如添加信号通知数据或者写出可以与已有原始参数数据彼此至少部分独立的方式被解码或略过的参数集。
图1所示的设备还包括信号通知装置14,用于在装置11的输出处确定参数配置提示PKH并使参数配置提示PKH与参数数据相关联。具体地,信号通知装置被设计用于确定参数配置提示,使得在参数数据中包含的配置信息被用于多通道重建时,参数配置提示具有第一意义。可选地,信号通知装置14确定参数配置提示,使得在基于要用于和/或已用于编码传输通道数据的编码算法的配置数据将被用于多通道重建时,参数配置提示具有第二意义。
最后,图1的本发明设备包括配置数据写装置15,配置数据写装置15设计用于使配置信息与参数数据和参数配置提示相关联,以最终在输出10处获得参数数据集。参数数据集10因此包括来自多通道参数装置11的参数数据、来自信号通知装置14的参数配置提示PKH,适当的话还包括来自配置数据写装置15的配置数据。在参数数据集中,数据集的这些单元根据确定的句法来排列,并典型地在时间上复用,复用通常以图1中组合装置16的单元来以符号表示。
在本发明的优选实施例中,信号通知装置14经由控制线17与配置数据写装置15相连,以仅在参数配置提示具有第一意义时,激活配置数据写装置15,即在多通道重建中,不能够以任何方式访问解码器中存在的配置信息,但是当存在显式信号通知时,即在参数数据集中存在其它配置信息时,才可访问。在参数配置提示具有第二意义的其它情况下,不激活配置数据写装置15以将数据引入输出10处的参数数据集,因为解码器不会读取这种数据和/或解码器不会获取这种数据(将在下面进行讨论)。在混合的解决方案中,代替信号通知数据流中的所有部分,仅信号通知配置的一部分,而从解码器中的配置表中获取剩余部分。
信号通知装置14包括控制输入18,信号通知装置14经由控制输入18,获知参数配置提示是具有第一意义还是第二意义。如将参考图4a和4b所述,在所谓“同步”操作中,优选地选择参数配置提示,使得其具有第二意义,以在解码器侧获得与编码算法有关的信息,并在解码器侧据此来做出多通道重建装置中的配置设置。然而,在异步操作中,控制输入18将驱动信号通知装置,以便确定参数配置提示的第一意义,解码器解译该第一意义,因此在数据本身中存在配置信息,并且不使用传输通道数据所基于的音频编码算法。
要注意,参数数据集和/或参数数据输出不必具有彼此相对的严格形式。因此,配置提示、配置数据和参数数据不必在流或分组中一起传输,而可彼此分离地提供给解码器。
以下讨论参考图4a来提出所谓“同步”操作。为了演示,图4a以帧40序列示出了参数数据,其中在帧40序列之前是报头41,在报头41中,具有信号通知装置14所产生的参数配置提示,并且如果适当的话,还有配置数据写装置15所产生的配置信息。装置11的输出处的参数数据被容纳在帧1、2、3、4中,这就是它们被称为图4中的有效载荷数据的原因。
在图1的信号通知装置14的输出处且在图4a的报头41处提到的继续提示FSH在继续提示FSH具有确定的意义时使解码器保持(即继续)先前所通信的配置设置,而在继续提示FSH具有另一意义时,根据参数配置提示来确定是否根据数据流中的配置信息或根据通过对解码器侧的音频编码算法的提示所检索到的配置数据,在多通道重建装置中实施配置设置。
图4a还表示了时间相关的编码传输数据块的序列42,序列42还具有四个帧,即帧1、帧2、帧3、帧4。参数数据与编码传输通道数据的相关由图4a的垂直箭头表示。因此,编码的传输通道数据块总是与输入数据块相关,并且/或者在使用交迭窗时,将至少放弃提前(与前一块相比新处理了块中的多少数据),并且在同步操作中,与块长度和/或获得参数数据的提前同步。这一方面确保了重建参数之间的连接,另一方面不会丢失传输通道数据。
现在通过简短的示例来解译。假设5通道输入信号,该5通道输入信号具有包括分别从时间x到时间y的时间样本的五个不同音频通道。在图6的下混级114中,产生与多通道输入数据同步的至少一个传输通道。因此从时间x到时间y的传输通道数据的一部分对应于从时间x到时间y的各个多通道输入数据的一部分。此外,图6的BCC分析装置116精确地针对从时间x到时间y的传输通道数据的时间部分,再次产生了参数数据,因此,在解码器侧,根据从时间x到时间y的传输通道数据和从时间x到时间y的参数数据,再次产生了从时间x到时间y的各个输出通道数据。
当产生并写出参数数据的帧结构与音频编码器操作用于压缩一个或多个传输通道的帧结构相同时,自动地实现同步操作。因此,如果参数数据和编码的传输通道数据(图4a中的40和42)总是与相同的时间部分相关,则多通道重建设备可容易地一直处理与音频帧相对应的数据,并同时处理参数帧。
在同步操作中,用于下混数据的传输的音频编码器的帧长度因此与参数多通道方案所使用的帧相同。类似地,当然,在帧长度与参数数据和编码的传输通道数据之间还可能存在整数关系。在这种情况下,即使用于参数多通道编码的辅助信息也可复用到音频下混信号的编码比特流中,从而可产生单个比特流。在“改进(retrofitting)”已有的立体声数据中的情况下,将仍然存在两个不同的数据流。然而,在两个帧序列之间可能存在1:1和/或m:1或m:n的关系。帧结构光栅(raster)将永远不会相对于彼此偏移。因此,音频数据帧和相应的参数辅助信息数据帧之间存在明确的关联。该模式有利于多种应用。
根据本发明,参数配置提示在这种情况下具有第一意义。这意味着,在报头41中没有或只有一部分配置信息,这是由于多通道重建装置给其自身提供与附属的音频编码器有关的信息,并根据该信息来选择其配置设置,例如提前的时间采样数目或块长度等。
相反地,图4b示出了异步操作。例如,当传输通道数据42’不具有帧结构而仅以PCM采样出现时,存在异步操作。可选地,当音频编码器具有不规则帧结构或只是具有与参数数据40的帧光栅不同的帧长度和/或帧光栅的帧结构时,也会出现异步情况。这里,参数多通道编码方案和音频编码/解码装置因此被认为是彼此不依赖的孤立且独立的处理级。这在有多个连续编码/解码级的所谓串联编码场景中尤其有利。如果参数数据固定地与压缩的音频数据相连,则在每个编码/解码中必须同时执行多通道合成和随后的多通道分析。由于这些操作是有损的,损耗将逐渐累积,导致多通道印象的劣化增加。
在这种串联链路中,第二意义的参数配置提示的设置和配置信息写入数据流使得解码器中多通道重建装置的配置设置与附属的音频编码器独立。因此可以在不必总是同时执行多通道合成或多通道分析的情况下,将下混数据解码/编码。根据参数数据句法将配置信息引入数据流(优选地引入参数数据流)使得可以解除参数数据与解码的传输通道数据的采样的绝对关联,即自足且并不涉及编码器帧处理规则的关联,就像同步操作一样,
在异步操作中,由于并不总是执行多通道分析/合成,因此可避免多通道第二特性的劣化。参数多通道编码/解码的帧大小因此不必与音频编码器的帧大小相连。
图1的设备可实现为编码器和所谓“前向代码转换器”。在第一种情况下,多通道参数装置自身计算参数数据。在第二种情况下,多通道参数装置接收已经具有确定形式的参数数据,并给本发明的参数数据输出提供参数配置提示和有关配置数据。前向代码转换器因此从任意数据输出中产生本发明的参数数据输出。
由所谓“后向代码转换器”执行该措施的反转,即从本发明的参数数据输出中产生不再包含参数配置提示而已经完全包含配置数据的某种输出,因此在用于配置的多通道重建中不必使用音频编码算法。
根据本发明,后向代码转换器被设计成用于使用输入数据来产生与包括M个传输通道的传输通道数据一起代表N个原始通道的参数数据输出的设备,其中M小于N且等于或大于1,其中输入数据包括配置参数提示(41),配置参数提示(41)具有第一意义,即多通道重建装置的配置信息包含在输入数据中,或具有第二意义,即多通道重建装置要根据从编码版本中解码传输通道数据所用的编码器算法(23)来使用配置信息。后向代码转换器包含用于写出配置数据的写装置,其中写装置设计成首先读取输入数据以解译(30)参数配置提示,并在参数配置提示具有第二意义时,检索与从编码版本中解码传输通道数据所用的编码算法(23)有关的信息并作为配置数据来输出该信息。
下面,将参考图2,描述根据本发明优选实施例、用于产生多通道音频信号的设备的方框电路图。为了产生多通道音频信号,使用包括代表M个传输通道的传输通道数据并还包括参数数据21的输入数据以包含K个输出通道。M个传输通道和参数数据一起代表N个原始通道,其中M小于N并等于或大于1,其中K大于M。此外,输入数据包括已经讨论的参数配置提示PKH,而传输通道数据20是根据编码算法所编码的传输通道数据22的解码版本。在图2所示的实施例中,编码算法由具有例如根据MP3概念或根据MPEG-2(AAC)或根据任意其它编码概念而操作的编码算法的音频解码器23实现。
图2所示要在解码器侧使用的设备包括多通道重建装置24,设计用于在输出25处根据传输通道数据20和参数数据21来产生K个输出通道。
此外,图2所示的本发明设备包括配置装置26,设计用于通过经由信号线27来信号通知配置设置,以配置多通道重建装置24。配置装置26接收输入数据,优选地接收参数数据21,以读取并相应地处理参数配置提示、继续提示FSH以及可能的当前配置数据。此外,配置装置包括编码算法信号输入28,用于获得与解码的传输通道数据所基于的音频编码算法(即音频编码器23所执行的编码算法)有关的信息。可以以不同方式获得信息,例如如果从对解码的传输通道数据的观察中可看出它们所编码/解码的编码算法,则从对解码的传输通道数据的观察中获得。可选地,音频解码器23自身可将其身份通信给配置装置26。可选地,配置装置26还可解析编码的传输通道数据22,根据进行了哪一种编码算法编码,从编码的传输通道数据中确定提示。这种“编码算法信号”通常包括在编码器的每个输出数据流中。
下面,参考图3a,根据框图来描述配置装置的优选实施方式。如块30所示,配置装置26设计用于从输入数据中读出参数配置提示PKH,并解译该提示。如果参数配置提示具有第一意义,则如块31所示,配置装置将继续读入参数数据流,以提取参数数据流中的配置信息(或至少部分配置信息)。然而,如果步骤30确定参数配置提示PKH具有第二意义,则在步骤32中,配置装置将包含与解码的传输通道数据所基于的编码算法有关的信息。
如果基本上存在用于产生多通道信号的本发明设备所设计用于的多种可能的编码算法,步骤32之后是随后的步骤33,在步骤33中,多通道重建装置根据解码器侧已有的信息,确定(33)配置设置。例如,这可以以查找表(LUT)的形式来实现。如果在步骤32的结尾获得了音频编码器标识提示,则在步骤33中,使用音频编码器标识提示,输入查找表,其中音频编码器标识提示用作索引。通过索引的关联,找到与这种音频编码器相关联的多个配置设置,例如块长度、采样速率、提前等。
然后在步骤34中将配置设置应用于多通道重建装置,然而,如果在步骤30中选择了参数配置提示的第一意义,则如图3中块31和块34之间的连接箭头所示,根据参数数据流中包含的配置信息,实现相同的配置设置。
本发明的方案的灵活之处在于,该方案支持显式和隐式的配置信息信号通知方法。这是优选地作为标志插入的参数配置提示PKH在最佳情况下自身仅需要单个比特来表示配置信息的信号的原因。参数多通道解码器随后可评价该标志。如果该标志表示显式可用的配置信息可供使用,则使用该配置信息。另一方面,如果该标志表示隐式的信号通知,则解码器将使用与所使用的音频或声音编码方法有关的信息,并根据所通知的编码方法来应用配置信息。为此,参数多通道解码器和/或多通道重建装置优选地具有包含针对确定数目的音频或声音编码器的标准配置信息的查找表。然而,除了查找表之外,还有其它可能,例如包括硬布线方案等。通常,解码器能够根据实际存在的解码器标识信息,给配置信息提供其自身中存在的确定信息。
该概念在可以最小的附加努力就可实现参数方案的完整配置的情况下尤其有利,其中,在极限情况下,与必须以相当大的努力将所有配置信息显式地写入数据流本身的相反,单个比特就足够。
根据本发明,可前后切换通知。这使得即使传输通道数据的表述改变,例如在解码、并在稍后解码传输通道数据时,即在存在串联编码情况时,也可以简化多通道数据处理。
因此,本发明的概念一方面可在同步操作的情况下节省通知比特,另一方面如果需要可节省异步操作的切换,即一方面实现有效的比特节省,另一方面实现灵活的处理,这在涉及多通道表述的已有立体声数据的“补充”中尤其有利。
下面,参考图4c,以句法伪代码的示例,给出用于产生多通道音频信号的本发明设备的示范实施方式。首先,读入变量“useSameBccConfig”的值。这里,该变量用作继续提示。因此,当该变量(即继续提示)具有等于例如1的值时,仅继续解译参数配置提示。然而,如果继续提示不等于1,即其具有其它意义,则使用先前传输的配置。如果在多通道重建装置中尚没有配置,则必须等待,直到包含第一个配置信息和/或配置设置为止。
接下来检查参数配置提示。变量“codecToBccConfigAlignment”用作参数配置提示PKH。如果该变量等于1,即其具有第二意义,则解码器不使用任何其它配置信息,而根据编码器标识(例如MP3、CoderX或CoderY,可从图4c中以“case”起始的行中可见),来确定配置信息。要注意,作为示例,图4c所示的句法仅支持MP3、CoderX和CoderY。但是,也可添加任意其它的名称/标识。
例如,当将MP3确定为编码器信息时,将变量bccConfigID设置为例如MP3_V1,MP3_V1是句法版本V1的附属MP3编码器的配置。随后,根据该BCC配置标识,以确定的参数集来配置解码器。因此,例如,激活576个采样的块长度,作为配置设置。因此,信号通知具有该块长度的帧结构。可选/附加的配置设置可以是采样速率等。然而,如果参数配置提示(codecToBccConfigAlignment)具有第一意义,即值0,则解码器显式地从数据流中接收配置信息,即从数据流(输入数据)中接收确定的bccConfigID。接下来的过程与以上所述相同。然而,在这种情况下,用于将编码的传输通道数据解码的解码器的标识未用于多通道重建装置的配置。
因此,在用于配置多通道重建装置的MP3音频解码器的情况下,bccConfigID可用于解码传输通道数据。另一方面,在数据流中还可存在任意其它的配置信息bccConfigID,并可评价该信息,而与附属的音频解码器是否是MP3解码器无关。这对于其它预定配置设置一样,例如CoderX和CoderY,并且对于单独设置配置信息(bccConfigID)的更自由配置也是一样。在优选实施例中,数据流中还有其它配置信息,该信息通知解码器其应该使用解码器中存在的已预定配置信息和显式传输的配置信息的混合。
与上述实施例不同,本发明还可应用于不是音频信号的其它多通道信号,例如参数编码的视频信号等。
根据情况,本发明用于产生和/或编码的方法可以硬件或软件实现。可在数字存储介质中进行所述实现,尤其是可与可编程计算机系统协作以执行该方法的具有可电子地读出的控制器信号的软盘或CD。通常,本发明还存在于计算机程序产品中,该计算机程序产品具有在该计算机程序产品在计算机上运行时用于执行存储在机器可读载体上存储的方法的程序代码。换言之,本发明可实现为计算机程序,具有在该计算机程序在计算机上运行时用于执行该方法的程序代码。

Claims (20)

1.一种用于使用输入数据来产生多通道信号以获得K个输出通道的设备,其中输入数据包括表示M个传输通道的传输通道数据和参数数据,M个传输通道和参数数据一起表述N个原始通道,M小于N且等于或大于1,K大于M,输入数据包括参数配置提示(41),所述设备包括:
多通道重建装置(24),设计用于根据传输通道数据和参数数据来产生K个输出通道;以及
配置装置(26),用于配置多通道重建装置,其中配置装置设计用于
读取输入数据以解译参数配置提示,
当参数配置提示具有第一意义时,提取(31)输入数据中包含的配置信息,并实现(34)多通道重建装置的配置设置,以及
当参数配置提示具有与第一意义不同的第二意义时,利用与从传输通道数据的编码版本来解码传输通道数据所使用的编码算法(23)有关的信息,来配置(34)多通道重建装置,使得多通道重建装置的配置设置与编码算法(23)的配置设置相同或取决于编码算法(23)的配置设置。
2.根据权利要求1所述的设备,其中,传输通道数据包括具有传输通道数据句法的传输通道数据流,
其中,参数数据包括具有参数数据句法的参数数据流,其中传输通道数据句法与参数数据句法不同,以及
其中,参数配置提示根据该句法被插入参数数据中,
其中,配置装置(26)设计用于根据参数数据句法来读取参数数据,并提取参数配置提示。
3.根据权利要求1或2所述的设备,其中,多通道重建装置(24)设计用于按照块来执行处理,其中传输通道数据是采样序列,并且配置设置包括每个处理块的块长度或已由多通道重建装置(24)新近处理的采样的提前数目。
4.根据权利要求3所述的设备,其中,传输通道数据是所述至少一个传输通道的时间采样,多通道重建装置(24)包括滤波器组,用于将传输通道数据的时间采样块转换为频域表述。
5.根据权利要求1所述的设备,其中,参数数据包括参数值块的序列,其中参数值块与所述至少一个传输通道的时间部分相关联,设计多通道重建装置(24),以便配置设置使参数值块和所述至少一个传输通道的有关时间部分用于产生K个输出通道。
6.根据权利要求1所述的设备,其中,编码算法(23)是多个编码算法之一,以及
其中,配置装置(26)包括查找表装置,查找表装置包括编码算法的索引和与索引相关联的配置信息集,分别包括针对该编码算法的配置设置,
其中,配置装置(26)设计用于根据与编码算法有关的信息,确定查找表的索引,并据此来确定(31)多通道重建装置的配置信息。
7.根据权利要求1所述的设备,其中,输入数据在参数配置提示具有第一意义的情况下包括多通道重建装置(24)的配置信息,并在参数配置提示具有第二意义的情况下,不包括多通道重建装置的配置信息或仅包括多通道重建装置的配置信息的一部分。
8.根据权利要求1所述的设备,其中,在参数配置提示具有第二意义时,配置装置(26)设计用于从输入数据中仅提取所需配置信息的一部分,并使用来自多通道重建装置已知的预设配置信息中的配置信息的剩余部分。
9.根据权利要求1所述的设备,其中,当参数配置提示具有第二意义时,配置装置(26)设计用于经由连接线获得与编码算法有关的信息,其中配置装置经由该连接线与根据编码的传输通道数据而产生传输通道数据的解码器相连,或通过读取传输通道数据或编码的传输通道数据来获得与编码算法有关的信息。
10.根据权利要求1所述的设备,其中,输入数据还包括继续提示,以及
其中,配置装置(26)设计用于在继续提示具有第一意义时,读取并解译(29)继续提示以实现多通道重建装置的固定的配置设置集或先前信号通知的配置设置,并仅在继续提示具有与第一意义不同的第二意义时,根据参数配置提示来配置多通道重建装置。
11.根据权利要求10所述的设备,其中,继续提示根据参数数据句法而与参数数据相关联,并且是参数数据流中的标志。
12.根据权利要求1所述的设备,其中,参数配置提示根据参数数据句法而与参数数据相关联,并且是参数数据流中的标志。
13.根据权利要求11所述的设备,其中,继续提示或参数配置提示每个都包括单个比特。
14.一种用于使用输入数据来产生多通道信号以获得K个输出通道的方法,其中输入数据包括表示M个传输通道的传输通道数据和参数数据,M个传输通道和参数数据一起表述N个原始通道,M小于N且等于或大于1,K大于M,输入数据包括参数配置提示(41),所述方法包括:
基于重建算法,根据传输通道数据和参数数据来重建(24)K个输出通道;以及
通过以下子步骤来配置(26)重建算法:
读取输入数据以解译参数配置提示,
当参数配置提示具有第一意义时,提取(31)输入数据中包含的配置信息,并实现(34)重建算法的配置设置,以及
当参数配置提示具有与第一意义不同的第二意义时,使用与从编码版本解码传输通道数据所用的编码算法(23)有关的信息,来实现(34)重建算法的配置设置,使得该配置设置与编码算法(23)的配置设置相同或取决于编码算法(23)的配置设置。
15.一种用于产生参数数据输出的设备,其中参数数据输出与包括M个传输通道的传输通道数据一起表述N个原始通道,M小于N且等于或大于1,所述设备包括:
多通道参数装置(11),用于提供参数数据;
信号通知装置(14),用于确定参数配置提示,其中当参数数据输出中包含的配置信息将用于多通道重建装置时,参数配置提示具有第一意义,而当配置数据将用于基于要用于编码或解码所述M个传输通道的编码算法的多通道重建时,参数配置提示具有第二意义;以及
配置数据写装置(15),用于输出配置信息以获得参数数据输出。
16.根据权利要求15所述的设备,其中,所述配置数据写装置(15)设计用于将继续提示插入参数数据集,
其中,继续提示在具有第一意义时使先前信号通知的固定配置设置集用于多通道重建,并且在继续提示具有与第一意义不同的第二意义时,使用参数配置提示来进行多通道重建的配置。
17.根据权利要求15所述的设备,其中,配置数据写装置设计用于在参数配置提示具有第二意义(17)时,不使所需配置信息或仅使所述配置信息的一部分与参数数据集相关联。
18.一种用于产生参数数据输出的方法,其中参数数据输出与包括M个传输通道的传输通道数据一起表述N个原始通道,M小于N且等于或大于1,所述方法包括:
提供(11)参数数据;
确定(14)参数配置提示,其中当参数数据输出中包含的配置信息将用于多通道重建算法时,参数配置提示具有第一意义,而当配置数据将用于基于要用于编码或解码所述M个传输通道的编码算法的多通道重建时,参数配置提示具有第二意义;以及
输出(15)配置信息以获得参数数据输出。
19.一种用于使用输入数据来产生参数数据输出的设备,其中参数数据输出与包括M个传输通道的传输通道数据一起表述N个原始通道,M小于N且等于或大于1,输入数据包括参数配置提示(41),参数配置提示(41)具有第一意义,即输入数据中包含用于多通道重建装置的配置信息,或具有第二意义,即多通道重建装置将用于根据从编码版本的传输通道数据来解码传输通道数据所用的编码算法(23)来使用配置信息,所述设备包括:
写装置,用于写配置数据,其中写装置设计用于
读取输入数据以解译参数配置提示,以及
当参数配置提示具有第二意义时,检索并输出与从编码版本的传输通道数据来解码传输通道数据所用的编码算法(23)有关的信息,作为配置数据;或者当参数配置提示具有第一意义时,输出在输入数据中包含的用于多通道重建装置的配置数据。
20.一种用于使用输入数据来产生参数数据输出的方法,其中参数数据输出与包括M个传输通道的传输通道数据一起表述N个原始通道,M小于N且等于或大于1,输入数据包括参数配置提示(41),参数配置提示(41)具有第一意义,即输入数据中包含用于多通道重建装置的配置信息,或具有第二意义,即多通道重建装置将用于根据从编码版本的传输通道数据来解码传输通道数据所用的编码算法(23)来使用配置信息,所述方法包括:
读取输入数据以解译参数配置提示,以及
当参数配置提示具有第二意义时,检索与从编码版本的传输通道数据来解码传输通道数据所用的编码算法(23)有关的信息,并输出检索到的配置数据;或者当参数配置提示具有第一意义时,输出在输入数据中包含的用于多通道重建装置的配置数据。
CN2005800300274A 2004-09-08 2005-08-10 产生多通道信号或参数数据集的设备和方法 Active CN101014999B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DE102004043521A DE102004043521A1 (de) 2004-09-08 2004-09-08 Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals oder eines Parameterdatensatzes
DE102004043521.9 2004-09-08
PCT/EP2005/008694 WO2006027079A1 (de) 2004-09-08 2005-08-10 Vorrichtung und verfahren zur wiederherstellung eines multikanal-audiosignals und zum erzeugen eines parameterdatensatzes hierfür

Publications (2)

Publication Number Publication Date
CN101014999A CN101014999A (zh) 2007-08-08
CN101014999B true CN101014999B (zh) 2011-04-27

Family

ID=35502612

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2005800300274A Active CN101014999B (zh) 2004-09-08 2005-08-10 产生多通道信号或参数数据集的设备和方法

Country Status (18)

Country Link
US (1) US8731204B2 (zh)
EP (1) EP1687809B1 (zh)
JP (1) JP4601669B2 (zh)
KR (1) KR100857920B1 (zh)
CN (1) CN101014999B (zh)
AT (1) ATE409938T1 (zh)
AU (1) AU2005281966B2 (zh)
BR (1) BRPI0515651B1 (zh)
CA (1) CA2579114C (zh)
DE (2) DE102004043521A1 (zh)
ES (1) ES2314706T3 (zh)
HK (1) HK1093595A1 (zh)
IL (1) IL181743A0 (zh)
MX (1) MX2007002854A (zh)
NO (1) NO338932B1 (zh)
PT (1) PT1687809E (zh)
RU (1) RU2355046C2 (zh)
WO (1) WO2006027079A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014048225A1 (zh) * 2012-09-26 2014-04-03 中兴通讯股份有限公司 使用参数集的编码、解码方法及装置、电子设备

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100740807B1 (ko) 2004-12-31 2007-07-19 한국전자통신연구원 공간정보기반 오디오 부호화에서의 공간정보 추출 방법
EP1691348A1 (en) * 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
US7788107B2 (en) 2005-08-30 2010-08-31 Lg Electronics Inc. Method for decoding an audio signal
KR20080049735A (ko) 2005-08-30 2008-06-04 엘지전자 주식회사 오디오 신호의 디코딩 방법 및 장치
US8577483B2 (en) 2005-08-30 2013-11-05 Lg Electronics, Inc. Method for decoding an audio signal
EP1853092B1 (en) * 2006-05-04 2011-10-05 LG Electronics, Inc. Enhancing stereo audio with remix capability
RU2407227C2 (ru) * 2006-07-07 2010-12-20 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Концепция для объединения множества параметрически кодированных аудиоисточников
KR101438387B1 (ko) * 2006-07-12 2014-09-05 삼성전자주식회사 서라운드 확장 데이터 부호화 및 복호화 방법 및 장치
CN101617360B (zh) 2006-09-29 2012-08-22 韩国电子通信研究院 用于编码和解码具有各种声道的多对象音频信号的设备和方法
JP5232791B2 (ja) 2006-10-12 2013-07-10 エルジー エレクトロニクス インコーポレイティド ミックス信号処理装置及びその方法
CN101169866B (zh) * 2006-10-26 2010-09-01 朱明程 自重构片上多媒体处理系统及其自重构实现方法
EP2238589B1 (en) * 2007-12-09 2017-10-25 LG Electronics Inc. A method and an apparatus for processing a signal
US8654988B2 (en) * 2008-05-05 2014-02-18 Qualcomm Incorporated Synchronization of signals for multiple data sinks
EP2124486A1 (de) * 2008-05-13 2009-11-25 Clemens Par Winkelabhängig operierende Vorrichtung oder Methodik zur Gewinnung eines pseudostereophonen Audiosignals
CN102100009B (zh) 2008-07-15 2015-04-01 Lg电子株式会社 处理音频信号的方法和装置
WO2010008198A2 (en) * 2008-07-15 2010-01-21 Lg Electronics Inc. A method and an apparatus for processing an audio signal
KR101499785B1 (ko) 2008-10-23 2015-03-09 삼성전자주식회사 모바일 디바이스를 위한 오디오 처리 장치 및 그 방법
EP2323130A1 (en) * 2009-11-12 2011-05-18 Koninklijke Philips Electronics N.V. Parametric encoding and decoding
CN103403799B (zh) 2010-10-06 2015-09-16 弗兰霍菲尔运输应用研究公司 用于针对合成统一语音和音频编解码器(usac)处理音频信号和提供较高时间粒度的设备和方法
CA2827249C (en) * 2011-02-14 2016-08-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing a decoded audio signal in a spectral domain
US8600692B2 (en) * 2011-03-17 2013-12-03 Sysacom Automatically configurable sensing device
EP2686848A1 (en) * 2011-03-18 2014-01-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Frame element positioning in frames of a bitstream representing audio content
KR101660004B1 (ko) 2012-08-03 2016-09-27 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 멀티채널 다운믹스/업믹스 케이스들에 대해 매개변수 개념을 이용한 멀티-인스턴스 공간-오디오-오브젝트-코딩을 위한 디코더 및 방법
EP2981956B1 (en) * 2013-04-05 2022-11-30 Dolby International AB Audio processing system
CN103336747B (zh) * 2013-07-05 2015-09-09 哈尔滨工业大学 VxWorks操作系统下CPCI总线数字量输入与开关量输出可配置驱动器及驱动方法
EP2840811A1 (en) 2013-07-22 2015-02-25 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for processing an audio signal; signal processing unit, binaural renderer, audio encoder and audio decoder
CN103412833A (zh) * 2013-08-30 2013-11-27 哈尔滨工业大学 VxWorks操作系统下CPCI总线扫描ADC功能模块驱动设备及其控制方法
EP2863386A1 (en) 2013-10-18 2015-04-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder, apparatus for generating encoded audio output data and methods permitting initializing a decoder
CN103744805B (zh) * 2014-01-03 2016-04-27 哈尔滨工业大学 VxWorks下CPCI总线开关量与模拟量输出模块硬件架构与时序可配置驱动方法
EP3067885A1 (en) * 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding a multi-channel signal
WO2018127764A1 (en) * 2017-01-06 2018-07-12 Telefonaktiebolaget Lm Ericsson (Publ) Explicit configuration of paging and control channel in system information
US10542052B2 (en) * 2017-04-27 2020-01-21 Samsung Electronics Co., Ltd. Multi-area grouping

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5329000A (en) * 1991-10-31 1994-07-12 Becton, Dickinson And Company Purification of DNA with silicon tetrahydrazide
DE4236989C2 (de) * 1992-11-02 1994-11-17 Fraunhofer Ges Forschung Verfahren zur Übertragung und/oder Speicherung digitaler Signale mehrerer Kanäle
EP0631458B1 (en) 1993-06-22 2001-11-07 Deutsche Thomson-Brandt Gmbh Method for obtaining a multi-channel decoder matrix
ES2165370T3 (es) * 1993-06-22 2002-03-16 Thomson Brandt Gmbh Metodo para obtener una matriz decodificadora multicanal.
JP2001523937A (ja) 1997-11-14 2001-11-27 エックスディー・ラブ・アール・アンド・ディー インコーポレーテッド 増幅後のステレオ音響サラウンドサウンドデコード回路
KR100335611B1 (ko) * 1997-11-20 2002-10-09 삼성전자 주식회사 비트율 조절이 가능한 스테레오 오디오 부호화/복호화 방법 및 장치
KR100335609B1 (ko) * 1997-11-20 2002-10-04 삼성전자 주식회사 비트율조절이가능한오디오부호화/복호화방법및장치
JPH11330980A (ja) 1998-05-13 1999-11-30 Matsushita Electric Ind Co Ltd 復号装置及びその復号方法、並びにその復号の手順を記録した記録媒体
US6452941B1 (en) * 1998-09-16 2002-09-17 Telefonaktiebolaget Lm Ericsson (Publ) Method and system for alternating transmission of codec mode information
DE19900961A1 (de) 1999-01-13 2000-07-20 Thomson Brandt Gmbh Verfahren und Vorrichtung zur Wiedergabe von Mehrkanaltonsignalen
US6539357B1 (en) * 1999-04-29 2003-03-25 Agere Systems Inc. Technique for parametric coding of a signal containing information
TW533746B (en) 2001-02-23 2003-05-21 Formosa Ind Computing Inc Surrounding sound effect system with automatic detection and multiple channels
US7116787B2 (en) * 2001-05-04 2006-10-03 Agere Systems Inc. Perceptual synthesis of auditory scenes
US20030035553A1 (en) * 2001-08-10 2003-02-20 Frank Baumgarte Backwards-compatible perceptual coding of spatial cues
US7292901B2 (en) * 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
US7006636B2 (en) * 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
TW569551B (en) 2001-09-25 2004-01-01 Roger Wallace Dressler Method and apparatus for multichannel logic matrix decoding
BRPI0304542B1 (pt) * 2002-04-22 2018-05-08 Koninklijke Philips Nv “Método e codificador para codificar um sinal de áudio de multicanal, sinal de áudio multicanal codificado, e, método e decodificador para decodificar um sinal de áudio de multicanal codificado”
EP1500084B1 (en) * 2002-04-22 2008-01-23 Koninklijke Philips Electronics N.V. Parametric representation of spatial audio
US20040037433A1 (en) 2002-08-21 2004-02-26 Heng-Chien Chen Multi-channel wireless professional audio system
EP1414273A1 (en) * 2002-10-22 2004-04-28 Koninklijke Philips Electronics N.V. Embedded data signaling
JP2005352396A (ja) * 2004-06-14 2005-12-22 Matsushita Electric Ind Co Ltd 音響信号符号化装置および音響信号復号装置
US8204261B2 (en) * 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
US7751572B2 (en) * 2005-04-15 2010-07-06 Dolby International Ab Adaptive residual audio coding
EP1987597B1 (en) * 2006-02-23 2013-04-10 LG Electronics Inc. Method and apparatus for processing an audio signal

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014048225A1 (zh) * 2012-09-26 2014-04-03 中兴通讯股份有限公司 使用参数集的编码、解码方法及装置、电子设备

Also Published As

Publication number Publication date
CN101014999A (zh) 2007-08-08
US20070206690A1 (en) 2007-09-06
HK1093595A1 (en) 2007-03-02
KR20070065314A (ko) 2007-06-22
KR100857920B1 (ko) 2008-09-10
AU2005281966A1 (en) 2006-03-16
EP1687809B1 (de) 2008-10-01
CA2579114A1 (en) 2006-03-16
JP2008512708A (ja) 2008-04-24
EP1687809A1 (en) 2006-08-09
NO20071132L (no) 2007-04-03
IL181743A0 (en) 2007-07-04
PT1687809E (pt) 2009-01-14
BRPI0515651B1 (pt) 2019-07-02
US8731204B2 (en) 2014-05-20
CA2579114C (en) 2011-05-10
DE502005005522D1 (de) 2008-11-13
RU2355046C2 (ru) 2009-05-10
AU2005281966B2 (en) 2008-07-17
WO2006027079A1 (de) 2006-03-16
DE102004043521A1 (de) 2006-03-23
BRPI0515651A (pt) 2008-07-29
RU2007112943A (ru) 2008-10-20
MX2007002854A (es) 2007-05-08
ES2314706T3 (es) 2009-03-16
ATE409938T1 (de) 2008-10-15
NO338932B1 (no) 2016-10-31
JP4601669B2 (ja) 2010-12-22

Similar Documents

Publication Publication Date Title
CN101014999B (zh) 产生多通道信号或参数数据集的设备和方法
US20230345176A1 (en) Audio decoder for audio channel reconstruction
RU2379768C2 (ru) Устройство и способ генерирования кодированного многоканального сигнала и устройство и способ декодирования кодированного многоканального сигнала
CN101930740B (zh) 使用解相关信号的多信道音频信号解码
EP1869668B1 (en) Adaptive residual audio coding
AU2007312598B2 (en) Enhanced coding and parameter representation of multichannel downmixed object coding
KR101236259B1 (ko) 오디오 채널들을 인코딩하는 방법 및 장치
EP1618763B1 (en) Audio signal synthesis
Breebaart et al. High-quality parametric spatial audio coding at low bitrates
KR20070001139A (ko) 오디오 분배 시스템, 오디오 인코더, 오디오 디코더 및이들의 동작 방법들
KR20080071971A (ko) 미디어 신호 처리 방법 및 장치

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant