CN1934640B - 用于写入到音频cd的设备和方法以及音频cd - Google Patents

用于写入到音频cd的设备和方法以及音频cd Download PDF

Info

Publication number
CN1934640B
CN1934640B CN2005800060514A CN200580006051A CN1934640B CN 1934640 B CN1934640 B CN 1934640B CN 2005800060514 A CN2005800060514 A CN 2005800060514A CN 200580006051 A CN200580006051 A CN 200580006051A CN 1934640 B CN1934640 B CN 1934640B
Authority
CN
China
Prior art keywords
audio
stereo
channel
compact disk
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2005800060514A
Other languages
English (en)
Other versions
CN1934640A (zh
Inventor
哈拉尔德·波普
斯蒂芬·格耶尔斯博尔格尔
沃夫冈·菲瑟尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Publication of CN1934640A publication Critical patent/CN1934640A/zh
Application granted granted Critical
Publication of CN1934640B publication Critical patent/CN1934640B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/12Formatting, e.g. arrangement of data block or words on the record carriers
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • G11B27/034Electronic editing of digitised analogue information signals, e.g. audio or video signals on discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • G11B27/30Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on the same track as the main recording
    • G11B27/3027Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on the same track as the main recording used signal is digitally coded
    • G11B27/3063Subcodes
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B7/00Recording or reproducing by optical means, e.g. recording using a thermal beam of optical radiation by modifying optical properties or the physical structure, reproducing using an optical beam at lower power by sensing optical properties; Record carriers therefor
    • G11B7/004Recording, reproducing or erasing methods; Read, write or erase circuits therefor
    • G11B7/0045Recording
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • G11B2020/10537Audio or video recording
    • G11B2020/10546Audio or video recording specifically adapted for audio data
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • G11B2020/10537Audio or video recording
    • G11B2020/10592Audio or video recording specifically adapted for recording or reproducing multichannel signals
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/20Disc-shaped record carriers
    • G11B2220/25Disc-shaped record carriers characterised in that the disc is based on a specific recording technology
    • G11B2220/2537Optical discs
    • G11B2220/2545CDs

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Stereophonic System (AREA)

Abstract

根据本发明,参数化多声道信息(16b)被写入到标准音频压缩盘,例如在用户子信道上,使得CD能够借助于标准重现设备进行普通的立体声重现,或者用易于连接的附加设备进行多声道重现,所述附加设备从标准音频CD读出立体声信息(16a)和参数化多声道信息(16b),并根据所述信息重建两个以上的音频声道。

Description

用于写入到音频CD的设备和方法以及音频CD
本发明涉及立体声音频CD技术,具体地涉及用于写入到音频CD的设备和方法以及用于从CD恢复数据的各个方法和设备。
最近,多声道音频重现技术变为越来越重要。这可能是由于诸如现有MP3技术那样的音频压缩/编码技术允许经由互联网或具有有限带宽的其它传输信道传输音频数据。MP3编码技术已变得非常出名,这是由于它使得所有的记录能够以立体声格式,即以音频记录的数字表示被分发,这包括第一或左立体声声道和第二或右立体声声道。
用于发行立体声数据的其他媒体是现有技术音频CD。由菲力浦和索尼公司合作开发的数字压缩盘是基于借助于激光的、对于作为信息载体的光盘的非接触光扫描,该光盘在它的一面上被记录。在用于读出的CD播放器上,被光盘反射的、并且其强度被调制的半导体激光器的光束被光电二极管接收。光电二极管的输出信号被转换成串行数据信号,以及由此得到时钟信号。随后是分离同步字符,并把信道代码重新转换成数据、测试字符和控制/显示比特。控制/显示解码器提供用于电机速度、聚焦和跟踪-追随以及用于找出和显示音乐中的某些位置的信号。在错误保护解码器中,任何干扰的信号信息可以借助于检验比特被补充。在借助于复接器分离数据流后,执行数字/模拟重新转换成左和右声道的模拟音频信号。
按照由具有立体声信息的所有的音频CD所共享的和普通CD播放器所设置的标准化CD帧结构,在一个帧中分别有左和右声道的六个连续的采样。在每种情形下,传输从左声道开始。每个16比特采样从MSB开始,并被划分成两个音频码元,每个8比特。立体声数据通过两步的所谓CIRC方法进行误差保护编码。
无论如何,常规的双声道声音系统存在基本缺点。所以,研发了所谓的环绕技术。所建议的多声道环绕表示除了两个立体声声道L和R以外,还包括附加的中心声道C和两个环绕声道Ls、Rs。这个参考音格式也被称为3/2立体声,它是指有三个前声道和两个环绕声道。通常,需要5个传输声道。在重现的环境下,至少需要分别在五个不同的位置处的五个扬声器,以便在离五个精确地放置的扬声器的特定的距离处得到最佳的所谓的“悦耳点”。
在CD技术领域,所谓的DVD已经广泛被接受。它们典型地包含完整的5.1或7.1记录,即每个相应声道的完整的表示。
然而,DVD的缺点在于,对于它们需要特定的DVD播放器,常规的音频CD播放器不能用来播放DVD。另外,也不可能用简单的措施更新这样的普通音频CD播放器,使它们不但能够播放音频CD,而且也能播放DVD。
这是特别不幸的,因为有大量正在流通中的CD播放器不能达到多声道重现。然而,另一方面,许多顾客从“选择”他们熟悉的和完全满足的全功能CD播放器退避到现在改变为仅仅DVD,甚至顾客对于DVD中典型包含的视频信息可能完全不感兴趣,而只是想要有良好的5声道声音。
经由互联网或从其它来源得到的编码后的多声道表示只要不侵犯版权,确实可以被烧制到CD上。但这样烧制的CD也不能与通常的CD播放器兼容,因为它们包含编码信息,而被包含在音频CD上的立体声数据仅仅是未被压缩的16比特PCM数据,它仅仅受到导致数据速率提高的误差保护编码,而没有受到导致数据率减小的数据压缩。
因此,在技术上有许多用于减小对于传输多声道音频信号所需要的数据量的技术。这样的技术被称为联合立体声技术。为此,可参考图3,图上显示联合立体声设备60。这个设备可以是例如实施强度立体声(IS)技术或双耳提示编码技术(BCC)的设备。这样的设备典型地接收至少两个声道CH1,CH2,...,CHn作为输入信号,以及输出一个单载波信道以及参数的多声道信息。参数数据被定义成使得在解码器中可以计算原先声道(CH1,CH2,...,CHn)的近似值。
通常,载波信号包括子频带采样、频谱系数、时域采样等等,它们提供基础信号的相当精细的表示,而参数数据不包括这样的采样和频谱系数,而只包括用于控制某个特定重建算法的控制参数,如通过相乘、通过时移、通过频移等等进行加权。因此参数多声道信息包括信号或相关信道的相对较粗略的表示。在数目上,由载波信道所需要的数据量是从大约60到70kbits/s的量,而对于一个信道由参数侧信息所需要的数据量范围在1.5与2.5kbits/s之间。应注意到以上的数目应用于压缩的数据。自然,未压缩的CD信道需要在大约10倍的所述数量的范围内的数据率。参数数据的例子是现有技术的缩放因子、强度立体声信息或BCC参数,正如下面阐述的。
强度立体声编码的技术在J.Herre,K.H.Brandenburg,D.Lederer的“Intensity Stereo Coding”(AES preprint 3799,1994年2月,阿姆斯特丹)中描述。通常,强度立体声的概念是基于对于两个立体声电话音频声道要执行的主轴变换。当大多数数据点被集中到第一主轴周围时,可以得到编码增益,使两个信号在进行编码之前被旋转某个角度。然而,这对于真实的立体声电话重现技术并不总是给定的,所以,这个技术被修改成使得第二正交分量从比特流的传输中被排除。因此,对于左和右声道的重建的信号包含所传送的同一个信号的不同的加权的或缩放的版本。无论如何,重建的信号在它们的幅度方面是不同的,但它们在它们的相位信息方面是相同的。然而,两个原始音频声道的能量/时间包络通过典型地以频率选择方式工作的选择性缩放操作而被保持。这相应于人对于高频的声音的感知,其中占优势的空间信息由能量包络确定。
在实际的实施中,所传送的信号,即载波信号,是从左和右声道的集聚信号生成的,而不是两个分量的旋转。另外,这个处理,即强度立体声参数的生成,是以频率选择方式被执行的,即对于每个缩放因子频带,即对于每个编码器频率划分段独立地执行的,用于执行缩放操作。这两个声道最好结合起来,以形成一个组合的声道,或“载波”声道,并且除了这个组合的声道外还形成强度立体声信息。强度立体声信息取决于第一声道的能量、第二声道的能量、或组合的声道的能量。
BCC技术在T.Faller,F.Baumgarte的“Binaural Cue Codingapplied to stereo and multichannel audio compression”(AESConvention Paper 5574,2002年5月,慕尼黑)中描述。在BCC编码时,多个音频输入声道通过专门使用具有重叠窗口的基于DFT的转换而被转换成频谱表示。最终得到的频谱被划分成非重叠的部分,每个部分具有一个索引。每个划分段具有与等效的方形带宽(ERB)成比例的带宽。对于每个划分段和每个帧k,确定信道间电平差(ICLD)和信道间时间差(ICTD)。ICLD和ICTD被量化和被编码,以便最终作为面信息传送到BCC比特流。信道间电平差和信道间时间差是对于每个信道相对于一个参考信道给出的。随后,这些参数按照预定的公式进行计算,它们取决于要被处理的信号的特定的划分段。
在解码器侧,解码器典型地接收单信号和BCC比特流。单信号被转换成频域,并被输入到空间合成块,空间合成块还接收解码的ICLD和ICTD值。在空间合成块中,BCC参数(ICLD和ICTD)被用来执行单信号的加权操作,以合成这些多声道信号,它们在频率/时间转换后表示原始多声道音频信号的重建。
在BCC的情形下,联合立体声模块60用来输出信道一侧的信息,这样,参数的信道数据是量化的和编码的ICLD或ICTD参数,原始信道之一被用作为参考信道,用于对信道一侧的信息进行编码。
通常,载波信号从参与的原始信道的和值被形成。
自然,以上的技术为只能处理载波信道而不能处理参数的数据的解码器只提供单个表示,用于生成一个以上的输入信道的一个或几个近似。
BCC技术还在美国专利公开文献US2003/0219130A1,US2003/0026441A1和US2003/0035553A1中描述。另外,还将参考专业论文,T.Faller和F.Baumgarte的“Binaural Cue Coding.Part II:Scheme and Applications”,(IEEE Trans,on Audio and Speech Proc.Vol.11,No.6,2003年11月)。
下面具体参考图4到6更详细地给出用于多声道音频编码的典型的BCC方案。
图5示出了用于编码/发送多声道音频信号的这样的BCC方案。在BCC编码器112的输入端110处的多声道音频输入信号在所谓的下混频块114中被下混频。在本例中,在输入端110处的原始多声道信号是5声道环绕声信号,具有前左声道、前右声道、左环绕声道、右环绕声道和中心声道。在本发明的优选实施例中,下混频块114通过把这五个声道简单地相加成单信号而生成集聚信号。
其它的下混频方案在技术上是已知的,以使得使用多声道输入信号导致具有单信道的下混频信道。这个单信道在集聚信号线115上输出。从BCC分析块116得到的一段面信息在面信息线117上输出。
在BCC分析块中,信道间电平差(ICLD)和信道间时间差(ICTD)被计算,正如以上表示的。正如近来那样,BCC分析块116也能够计算信道间相关值(ICC值)。集聚信号和面信息以量化和编码格式被发送到BCC解码器120。BCC解码器把传送的集聚信号分解成多个子频带并执行缩放、延时和其它处理步骤,提供多信道音频信号的子频带以便输出。这个处理被执行,以使得在输出端121处的重建的多声道信号的ICLD、ICTD和ICC参数(提示)与在BCC编码器112的输入端110处的原始多声道信号的各个提示相匹配。为此,BCC解码器120包括BCC合成块122和面信息修订块123。
BCC合成块122的内部结构在下面参照图6给出。在线115上的集聚信号被馈送到时间/频率转换单元或滤波器组FB 125。在块125的输出端,有N个子频带信号,或在极端的情形下,当音频滤波器组125执行1∶1转换时,即从N个时域采样生成N个频谱系数的转换时的频谱系数块。
BCC合成块122还包括延时级126、电平修改级127、相关处理级128和逆滤波器组级IFB 129。在级129的输出端,例如在5声道环绕系统的情形下具有5声道的、重建的多声道音频信号可被输出到一组扬声器124,正如在图5或图4上给出的。
输入信号sn借助于单元125被转换到频率范围或滤波器组范围。由单元125输出的信号被复制,以便得到同一个信号的几个版本,正如由复制节点130所表示的。原始信号的版本的数目等于输出信号中输出声道的数目。然后原始信号的每个版本在节点130处受到一定的延时d1,d2,...,di,...,dN。延时参数由图5的面信息处理块123进行计算,并从由图5的BCC分析块116计算出的信道间时间差推导出来。
同样的过程应用到乘法参数a1,a2,...,ai,...,aN,这些参数也是由面信息处理块123根据由BCC分析块116计算出的信道间电平差进行计算的。
由BCC分析块116计算出的ICC参数被用于控制该块128的功能,以使得在块128的输出端处得到在被延时的及其电平受到操控的信号之间的特定相关性。应注意的是,级126,127,128的次序可以与图6所示的次序不同。
应当指出,对于按帧处理音频信号,BCC分析也是以按帧的方式,即时变的方式执行的,另外,得到按频率的BCC分析,正如从图6的滤波器频带划分可以看到的。这意味着,对于每个频带得到BCC参数。这还意味着,在音频滤波器组125把输入信号分解成例如32个带通信号的情形下,BCC分析块将得到用于该32个频带中的每一个的一组BCC参数。当然,在图6中详细显示的、图5所示的BCC合成块122执行也是基于作为例子提到的该32频带的重建。
参照图4,下面将给出被用来确定各个BCC参数的情形。通常,ICLD、ICTD和ICC参数可以被定义在成对的信道之间。然而,最好是确定在参考信道与任何其它信道之间的ICLD和ICTC参数。这在图4A中示出。
ICC参数可以以各种不同的方式被定义。一般说来,在编码器中的ICC参数可以在所有可能的信道对之间被确定,正如图4B中显示的。然而,已经提出在任何时间只计算在两个最强的信道之间的ICC参数,正如图4C中显示的,图中显示其中在一个时间计算在信道1和2之间的ICC参数,并在另一个时间计算在信道1和5之间的ICC参数的例子。随后,解码器合成在解码器中最强的信道之间的信道间相关值,以及使用特定的探试法则,用于计算和合成对于剩余的信道对的信道间相干性。
关于例如根据所发送的ICLD参数计算乘法参数a1,...,aN,可参考AES convention paper(AES大会文章)No.5574。ICLD参数表示原始多声道信号的能量分布。不失一般性,优选地如图4A所示,取表示在各个声道与前左声道之间的能量差值的4个ICLD参数。在面信息处理块122中,从ICLD参数得出乘法参数a1,...,aN,以使得所有的重建的输出声道的整个能量是相同的(或正比于所发送的集聚信号的能量)。
为了把多声道信息放置在CD上,除了提供DVD以外,也可以回到专门的音频CD,这些CD通过使用诸如DTS的音频编码方法以数据减小的形式存储声道。这些专门的音频CD不能在普通的音频CD播放器上播放,而是需要它们自己的解码器,它们在大多数情形下要外部连接到普通CD播放器的数字输出端。
另外,有混合的SACD,它们借助于CD上的两层提供常规的立体声,用于在音频CD播放器上重现(在一个层上),以及以DSC格式的多声道声音(在另一个层上),用于在SACD播放器上重现。
本发明的目的是提供用于扩散和生成多声道音频数据的灵活的概念,该概念潜在地得到高度的市场接受度。
这个目的是通过权利要求1中要求保护的用于写到压缩盘的设备、权利要求9中要求保护的压缩盘、权利要求10中要求保护的用于播放压缩盘的设备、权利要求12中要求保护的用于写到压缩盘的方法、权利要求13中要求保护的用于播放压缩盘的方法、或者权利要求14中要求保护的计算机程序来实现的。
本发明是基于这样的发现,在符合普通CD格式的普通音频CD上,提供按照CD标准所规定的子信道,用来传送元信息,如数据和文本和/或视频图像。按照本发明,这些子信道还被用来把参数信息写入到普通的立体声音频CD上,以使得普通的立体声音频CD包括用于多声道重现的足够的信息。
这个概念的一个优点在于,它与普通的CD播放器兼容。普通的CD播放器然后继续提供不受本发明的概念影响的普通音频CD立体声数据的立体声声音表示。然而,如果CD播放器按照本发明配备有小的补充模块,它在CD播放器在输出端除了子信道数据以外还接收立体声数据,即多声道参数数据,并通过使用基础重建算法互相计算参数数据和立体声数据,原始多声道信号的多声道表示将被提供。
这实现了以下目的:用户可保留他/她习惯使用的和他/她对其满意的、他/她的普通CD播放器,并为了读取多声道音频CD将只需要补充模块,然而,它可以容易地被连接到CD播放器,因为每个CD播放器都具有立体声输出。因此,补充模块不需要介入到CD播放器中,而可以仅仅插入到由CD播放器提供的末端。优选地,CD播放器的这个末端或输出端是数字输出端。然而,如果CD播放器只具有模拟输出端,这可能是型号非常老的情形,则在补充多声道模块中附带地需要模/数转换器。
另外,本发明的有利之处在于,CD在可后向兼容地记录多声道信息方面是可后向兼容的,即它也可以在常规类型的立体声CD播放器上被播放。因此本发明的CD既可以在普通的CD播放器上播放也可以在被扩展成多声道CD播放器的CD播放器上播放。
作为替代,多声道参数信息也可以被容纳在没有被二声道表示占用的音频CD的其它位置,例如在CD的仍旧空闲的位置,在混合CD的数据划分段,在CD的结束处的单独会话部分等等。
然而,最好把参数数据“隐藏”在由普通音频CD标准已提供的子信道上,因为无论如何没有计划在CD上介入,并且因为CD完全遵循标准而不管现在是否具有多声道声音信息,以及因为它们因此在播放设备中不会引起任何问题。
本发明所述概念的另外的有利之处在于,由于多声道信息由参数多声道数据表示,数据量被充分地压缩,这样,在CD上子信道的信道容量是足够大的。当然,在这些子信道上不可能存储任何非参数信息,如在DVD中那样。
本发明的另一个优点在于,可以使用现有的CD写设备,因为它们已被设计成用来将数据写到用户子信道中。
而且,可以使用被设计成用于从子信道读出的、现有的CD播放设备。
因此,立体声CD可以在部分CD制造商处,对于CD本身以及在部分用户处,以最小的花费被转换成具有至少3个、优选地为5个、7个或甚至更多个声道的多声道CD。所有这些是通过使用试探的和测试的音频CD技术而达到,它是近年来已被改进的、很好地测试的、和可接受的,但它是不能说成没有保留用于最新技术,具体地说如DVD领域的技术。
下面参照附图详细地描述本发明的优选实施例,其中:
图1是用于写到压缩盘的本发明所述设备的框图;
图2是用于播放压缩盘的本发明所述设备的框图;
图3是现有技术中用于生成信道数据和参数多声道信息的联合立体声编码器;
图4是用于确定ICLD、ICTD和ICC参数的方案的表示;
图5是表示BCC编码器/解码器链的框图;以及
图6是图5的BCC合成块的实施方案的的框图。
图1示出了用于写音频信息的本发明所述设备,通过使用用于将参数化多声道信息写到CD的不是为包括双声道音频信息表示的两个基本声道所提供的一个或几个位置处的装置可以把多声道音频表示重建在压缩盘上。
具体地说,没有通过装置10写到CD上的参数化多声道信息被配置成使得它能够用两个以上的音频声道连同两个基本声道一起呈现多声道音频表示。优选地,参数化多声道信息是BCC参数或强度立体声参数或其它的不像两个立体声基本声道那样的仅仅是原始多声道音频信号的一个信道的粗略表示。
根据该实施例,CD在被写入之前已配备有具有普通立体声数据的参数化多声道信息。这是多声道信息以后被写入到CD上的情形。然而,最好是把未写的音频CD引入到本发明的用于写入的设备中,以使得本发明的设备还包括用于按照CD标准写立体声数据的装置12。仅仅为了说明起见,图1上显示两个用于写入的装置作为分立的装置。自然,它们也可以用相同的物理CD写设备实现。
本发明所述设备的产品是CD14,包括在CD的对于立体声信息提供的位置上绝对普通的立体声基本声道,如以16a表示的。然而,与普通CD不同的是,如5.1参数信息、7.1参数信息等等的多声道参数化信息出现在还没有写上立体声信息的位置处,即在位置16b处。这个参数信息最好是BCC参数数据,正如已经阐述的。
在本发明的一个优选实施例中,参数数据按逐个扇区的方式以在音频CD上可得到的“子信道”R,S,T,U,V,W与普通立体声数据同步地被存储在音频CD上。子信道和CD数据格式的说明可以在教科书“Audio-Handbuch der Schaltungstechnik”,Paul Skretek,Franzis出版社,1988年,第17章“Kompakt-Disk-Technik”,第329-338页中找到。
通常,希望这些子信道存储关于CD的信息,包括内容表和用于重现设备的指示的音轨的当前时间。作为替代,这些信道也可以用来存储低分辨率的图形表示并在相应重现设备上输出这些图形表示。这些子信道或被存储在子信道上的子代码也可以被用来按照需要存储附加信息,例如卡拉OK CD。
然而,按照本发明,这些子信道现在被用来“升级”有效荷载数据本身,即立体声基本信息,以使得参数化多声道信息被存储在子信道中。在数据率方面,可得到的总的数据率总计为7.36kbps。由于可得到六个用户数据信道,因此可获得总共44.1kbps的数据率。这个数值甚至高于典型地由BCC参数所需要的数据量,对于5.1多声道信息它仅仅是可得到的44.1kbps比特率的大约一半。在子信道中整个空间是对于10.1多声道信息所需要的。
在本发明的一个优选实施例中,误差保护编码被用来使通常没有受到误差保护编码的附加数据在它被写入到子信道之前进行误差保护编码,误差保护编码在播放期间被解除,并特别用来校正读出的错误。
图2显示本发明的重现设备,首先像普通的CD播放器那样,包括用于读出立体声声道的装置20。然而,除了普通的CD播放器以外,提供了用于读出多声道参数信息的装置22,然而它仅仅是一个补充装置,如果CD播放器还没有被配置成读出子信道,或者如果参数信息被存储在CD的其它位置,即没有被存储在子信道而是被存储在CD的结束处的一个或几个单独的会话中,或者被存储在混合CD和/或混合的划分段的数据域等等。
在从装置22开始的下行方向上连接有一个用于重建多声道输出的装置24,该多声道输出在多声道输出端26处被提供。另外,CD识别装置或外部控制器28——它是人工的或由另外的设备接管——被提供用来启动切换开关30。如果认识到CD仅仅包括立体声信息,则用于读出立体声声道的装置20的输出将由开关30直接切换到立体声输出端32。然而,如果CD识别装置28认识到所处理的CD是具有例如在子信道中的多声道数据的CD,则用于读出立体声声道的装置20的输出将由开关30进行切换,并被馈送到用于重建的装置24,从而生成多声道输出,并在输出端32处没有或仅仅提供一个附加的立体声输出。
应注意的是,图2中的开关30也可以用支路来代替,这样,普通立体声信号(例如经由播放器的模拟输出端或经由播放器的第一数字输出端)和包括多声道信息的立体声信号可以经由对于CD播放器通常给出的和被提供用于该目的的数字输出端并行地输出。本发明的扩展盒被安装在这个数字输出端处,扩展盒然后在输出端输出具有两个以上声道的、重建的多声道声音。
这样的播放设备因此能够进行立体声重建,或者当对参数化多声道数据解码时重建具有两个以上声道的声音,即例如5.1环绕声。
取决于环境,用于写到压缩盘或用于播放压缩盘的本发明的方法可以以硬件或以软件实现。实施方案可以通过与可编程计算机系统进行交互以便执行该方法的电子可读控制信号在数字存储介质,尤其是在光盘或CD上实现。通常,本发明因此还包含具有被存储在机器可读载体上的程序代码的计算机程序产品,用于当计算机程序产品在计算机上运行时执行本发明所述方法。换句话说,本发明因此可被实现为具有程序代码的计算机程序,用于当该计算机程序在计算机上运行时执行本发明的方法。

Claims (8)

1.一种用于把可以由其重建多声道音频表示的音频信息写入到压缩盘的设备,该设备包括:
用于把参数化多声道信息写入到压缩盘的对于包括音频信息的两个信道立体声表示的两个立体声音频声道未被使用的一个或多个位置的装置,参数化多声道信息被配置成使得它连同两个立体声音频声道一起能够呈现两个以上的音频声道的多声道音频表示,
其中参数化多声道信息包括双耳提示参数、强度立体声参数或其它不像两个立体声声道那样的、而是作为原始多声道音频信号的一个声道的粗略表示的参数数据,
其中压缩盘在由用于写入的装置写入参数化多声道信息之前已具有立体声音频声道,或者
其中用于写入的装置还被配置成从不具有音频信息的压缩盘开始,写入两个立体声音频声道和参数化多声道信息,并且
其中立体声音频声道按照压缩盘标准被写入到压缩盘上,以使得通过使用按照压缩盘标准被配置的压缩盘重现设备能够以立体声来重现两个立体声音频声道。
2.如在权利要求1中所述的设备,其中用于写入的装置包括编码器,用于对该参数化多声道信息进行误差保护编码,这样,用于写入的装置被配置成把误差保护编码后的参数化多声道信息写入到压缩盘上。
3.如在权利要求1中所述的设备,其中用于写入的装置被配置成把参数化多声道信息按照压缩盘标准写入到R,S,T,U,V或W子信道。
4.如在权利要求1中所述的设备,其中用于写入的装置被配置成把参数化多声道信息写入到跟随在由两个立体声音频信道占用的数据记录的结束或在所述数据记录开始之前的空闲区域。
5.如在权利要求1中所述的设备,其中压缩盘是具有数据域的混合压缩盘,并且其中用于写入的装置被配置成把参数化多声道信息写入到压缩盘的数据域,而把立体声音频声道写入到音频压缩盘区域。
6.一种用于播放压缩盘的设备,包括:
用于读取压缩盘的读取装置,所述压缩盘包括:
音频信息,所述音频信息包括两个立体声音频声道和参数化多声道信息,
其中参数化多声道信息被写入到压缩盘的未被两个立体声音频声道占用的位置,
参数化多声道信息被配置成使得它连同两个立体声音频声道一起能够呈现两个以上的音频声道的多声道音频表示,
所述参数化多声道信息包括双耳提示参数、强度立体声参数或其它不像两个信道立体声声道那样、而是作为原始多声道音频信号的一个声道的粗略表示的参数数据;
其中读取装置被配置为用于获得两个立体声音频声道和参数化多声道信息;以及
用于根据两个立体声音频声道和参数化多声道信息重建多声道音频表示的重建装置。
7.一种用于把由其重建多声道音频表示的音频信息写入到压缩盘的方法,该方法包括:
把参数化多声道信息写入到压缩盘的不是为包括音频信息的两个信道表示的两个立体声音频声道提供的一个或多个位置,参数化多声道信息被配置成使得它连同两个立体声音频声道一起能够呈现两个以上的音频声道的多声道音频表示,
其中参数化多声道信息包括双耳提示参数、强度立体声参数或其它不像两个信道立体声声道那样、而是作为原始多声道音频信号的一个声道的粗略表示的参数数据,
其中压缩盘在由用于写入的装置写入参数化多声道信息之前已具有立体声音频声道,
其中从不具有音频信息的压缩盘开始,写入两个立体声音频声道和参数化多声道信息,以及
其中立体声音频声道按照压缩盘标准被写入到压缩盘上,以使得通过使用按照压缩盘标准被配置的压缩盘重现设备能够以立体声来重现两个立体声音频声道。
8.一种用于播放压缩盘的方法,包括:
读取压缩盘,所述压缩盘包括:
音频信息,所述音频信息包括两个立体声音频声道和参数化多声道信息,
其中多声道信息被写入到压缩盘的未被两个立体声音频声道占用的位置,
参数化多声道信息被配置成使得它连同两个立体声音频声道一起能够呈现两个以上的音频声道的多声道音频表示,以及
其中参数化多声道信息包括双耳提示参数、强度立体声参数或其它不像两个信道立体声声道那样的、而是作为原始多声道音频信号的一个声道的粗略表示的参数数据;
其中读取装置被配置为获得两个立体声音频声道和参数化多声道信息;以及
根据两个立体声音频声道和参数化多声道信息重建多声道表示。
CN2005800060514A 2004-02-27 2005-02-17 用于写入到音频cd的设备和方法以及音频cd Active CN1934640B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DE102004009628.7 2004-02-27
DE102004009628A DE102004009628A1 (de) 2004-02-27 2004-02-27 Vorrichtung und Verfahren zum Beschreiben einer Audio-CD und Audio-CD
PCT/EP2005/001650 WO2005083702A1 (de) 2004-02-27 2005-02-17 Vorrichtung und verfahren zum beschreiben einer audio-cd und audio-cd

Publications (2)

Publication Number Publication Date
CN1934640A CN1934640A (zh) 2007-03-21
CN1934640B true CN1934640B (zh) 2010-08-18

Family

ID=34894881

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2005800060514A Active CN1934640B (zh) 2004-02-27 2005-02-17 用于写入到音频cd的设备和方法以及音频cd

Country Status (6)

Country Link
US (1) US8989881B2 (zh)
EP (1) EP1719128A1 (zh)
KR (1) KR100813192B1 (zh)
CN (1) CN1934640B (zh)
DE (1) DE102004009628A1 (zh)
WO (1) WO2005083702A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101842257B1 (ko) * 2011-09-14 2018-05-15 삼성전자주식회사 신호 처리 방법, 그에 따른 엔코딩 장치, 및 그에 따른 디코딩 장치
EP3067885A1 (en) * 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding a multi-channel signal
US11212631B2 (en) * 2019-09-16 2021-12-28 Gaudio Lab, Inc. Method for generating binaural signals from stereo signals using upmixing binauralization, and apparatus therefor

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0540329A2 (en) * 1991-10-30 1993-05-05 Salon Televisiotehdas Oy Method for storing a multichannel audio signal on a compact disc
US5583308A (en) * 1993-10-14 1996-12-10 Maestromedia, Inc. Musical effects apparatus and tone control process for a musical instrument
US5870355A (en) * 1996-07-25 1999-02-09 International Business Machines Corporation CD-ROM device capable of reproducing both audio data and computer data
US6591392B1 (en) * 1999-11-24 2003-07-08 Oak Technology, Inc. Compact disc subcode packing and error correction detection

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03205659A (ja) 1989-10-27 1991-09-09 Pioneer Electron Corp ディジタル情報信号記録媒体及びその演奏装置
FI89439C (fi) * 1991-10-30 1993-09-27 Salon Televisiotehdas Oy Foerfarande foer att dekoda en audiosignal i vilken annan information aer infoerd med anvaendning av maskningseffekt
US6298025B1 (en) * 1997-05-05 2001-10-02 Warner Music Group Inc. Recording and playback of multi-channel digital audio having different resolutions for different channels
EP2391146A3 (en) * 1999-04-07 2011-12-14 Dolby Laboratories Licensing Corporation Lossless encoding and decoding methods and apparatus for multichannel signals
US7212872B1 (en) * 2000-05-10 2007-05-01 Dts, Inc. Discrete multichannel audio with a backward compatible mix
PT1362499E (pt) * 2000-08-31 2012-04-18 Dolby Lab Licensing Corp Processo para dispositivo para descodificação matricial áudio
US7292901B2 (en) * 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
US20030035553A1 (en) * 2001-08-10 2003-02-20 Frank Baumgarte Backwards-compatible perceptual coding of spatial cues
US7006636B2 (en) * 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
US7116787B2 (en) * 2001-05-04 2006-10-03 Agere Systems Inc. Perceptual synthesis of auditory scenes
JP2003303488A (ja) 2002-04-05 2003-10-24 Pioneer Electronic Corp データ処理装置、その方法、そのプログラム、および、そのプログラムを記録した記録媒体
JP3971635B2 (ja) * 2002-04-08 2007-09-05 株式会社ソニー・ディスクアンドデジタルソリューションズ データ記録媒体、データ記録方法および装置
AU2003219426A1 (en) * 2002-04-22 2003-11-03 Koninklijke Philips Electronics N.V. pARAMETRIC REPRESENTATION OF SPATIAL AUDIO
US7447317B2 (en) * 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
US7639823B2 (en) * 2004-03-03 2009-12-29 Agere Systems Inc. Audio mixing using magnitude equalization
JP2006065944A (ja) * 2004-08-26 2006-03-09 Funai Electric Co Ltd 光ディスク装置
US20060093164A1 (en) * 2004-10-28 2006-05-04 Neural Audio, Inc. Audio spatial environment engine

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0540329A2 (en) * 1991-10-30 1993-05-05 Salon Televisiotehdas Oy Method for storing a multichannel audio signal on a compact disc
US5583308A (en) * 1993-10-14 1996-12-10 Maestromedia, Inc. Musical effects apparatus and tone control process for a musical instrument
US5870355A (en) * 1996-07-25 1999-02-09 International Business Machines Corporation CD-ROM device capable of reproducing both audio data and computer data
US6591392B1 (en) * 1999-11-24 2003-07-08 Oak Technology, Inc. Compact disc subcode packing and error correction detection

Also Published As

Publication number Publication date
US8989881B2 (en) 2015-03-24
KR100813192B1 (ko) 2008-03-13
WO2005083702A1 (de) 2005-09-09
KR20060134973A (ko) 2006-12-28
DE102004009628A1 (de) 2005-10-06
CN1934640A (zh) 2007-03-21
US20070121448A1 (en) 2007-05-31
EP1719128A1 (de) 2006-11-08

Similar Documents

Publication Publication Date Title
US11343631B2 (en) Compatible multi-channel coding/decoding
Spanias et al. Audio signal processing and coding
CN101479785B (zh) 用于编码和解码基于对象的音频信号的方法和装置
CN101160618B (zh) 用于空间音频参数编码的紧凑辅助信息
JP4519919B2 (ja) コンパクトなサイド情報を用いたマルチチャネルの階層的オーディオ符号化
CN101133680B (zh) 用于产生已编码立体声信号的设备及方法
US20150382126A1 (en) Binaural decoder to output spatial stereo sound and a decoding method thereof
US20070297624A1 (en) Digital audio encoding
CN1934640B (zh) 用于写入到音频cd的设备和方法以及音频cd
US6463405B1 (en) Audiophile encoding of digital audio data using 2-bit polarity/magnitude indicator and 8-bit scale factor for each subband
Smyth et al. DTS Coherent Acoustics Delivering High-Quality Multichannel Sound to the Consumer
JP2001100792A (ja) 符号化方法、符号化装置およびそれを備える通信システム
AU2004306509B2 (en) Compatible multi-channel coding/decoding
JP4123632B2 (ja) 情報符号化方法及び装置、並びにプログラム供給媒体
TWI281356B (en) Device and method for generate a coded multi-channels signal and device and method for decode a coded multi-channels signal and recordable medium

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant