CN101641970B - 用于组合和分离数字音频数据集的方法和设备 - Google Patents

用于组合和分离数字音频数据集的方法和设备 Download PDF

Info

Publication number
CN101641970B
CN101641970B CN2007800460450A CN200780046045A CN101641970B CN 101641970 B CN101641970 B CN 101641970B CN 2007800460450 A CN2007800460450 A CN 2007800460450A CN 200780046045 A CN200780046045 A CN 200780046045A CN 101641970 B CN101641970 B CN 101641970B
Authority
CN
China
Prior art keywords
sample
data collection
digital audio
frequency data
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2007800460450A
Other languages
English (en)
Other versions
CN101641970A (zh
Inventor
吉多·范登·贝格
维尔弗里德·万·巴埃伦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Newaro LLC
Original Assignee
Galaxy Studios NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Galaxy Studios NV filed Critical Galaxy Studios NV
Publication of CN101641970A publication Critical patent/CN101641970A/zh
Application granted granted Critical
Publication of CN101641970B publication Critical patent/CN101641970B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • H04S5/02Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation  of the pseudo four-channel type, e.g. in which rear channel signals are derived from two-channel stereo signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels

Abstract

本发明涉及用于组合数字数据集的方法和编码器、用于这种组合式数字数据集的解码方法和解码器以及用于存储这种组合式数字数据集的记录载体。其中,通过将第一样本子集等化成与第一样本子集交错的来自第二子集的相邻样本并且通过随后将来自两个数字数据集的相应样本相加而组合两个数字数据集,其中该两个数字数据集的等化样本并不时间对应。这产生了允许分离该两个数字数据集的第三数字数据集。当将两个数字音频流组合成单一数字音频流时,该第三数字数据集仍然是该两个组合数字音频流的良好的单音表示并且因此能够被在普通再现装备上再现,然后使用根据本发明的解码器允许将该两个数字数据集从该第三数字数据集分离。

Description

用于组合和分离数字音频数据集的方法和设备
技术领域
本发明涉及一种方法,用于将具有第一尺寸的第一样本数字数据集和具有第二尺寸的第二样本数字数据集组合成具有第三尺寸的第三样本数字数据集,该第三尺寸小于该第一尺寸和该第二尺寸之和。 
背景技术
从EP1592008已知这种方法,在其中披露了一种用于将两个数字数据集混合成第三数字数据集的方法。为了将两个数字数据集拟合成具有小于该两个数字数据集的尺寸之和的尺寸的单一数字数据集,需要缩减该两个数字数据集中的信息。通过在第一数字数据集中在第一组预定位置之间的样本处和在第二数字数据集中在预定位置之间的非一致的一组样本处定义内插,EP1592008实现了这种信息缩减。在数字数据集的预定位置之间的样本数值(值)被设为内插数值。在于该两个数字数据集中执行这种信息缩减之后,合并(总计)第一数字数据集的每一个样本与第二数字数据集的相应样本。这产生了包括该合并样本的第三数字数据集。虽然仅仅利用在预定位置之间的内插样本,但是利用在第一数字数据集和第二数字数据集之间的预定位置之间的已知偏移关系的、这种将样本一起地合并允许恢复第一数字数据集和第二数字数据集。当EP1592008的方法被用于音频流时,这种内插并不明显并且能够作为所包括的两个数字数据集的混合表示而播放第三数字数据集。为了使得能够利用内插样本恢复第一和第二数字数据集,必须知道用于第一和第二数字数据集这两者的起始值,并且因此在混合期间这两个数值也被存储,以允许在以后从第三数字数据集分离该两个数字数据集。 
EP1592008的方法具有以下缺点,即,它要求在编码一侧上进行集中处理。 
发明内容
本发明的目的在于缩减在编码侧上要求的处理。 
为了实现这个目的,本发明的方法包括以下步骤: 
-将第一数字数据集的第一样本子集等化成(equate)第一数字数据集的第二样本子集中的相邻样本,其中该第一样本子集和该第二样本子集交错, 
-将第二数字数据集的第三样本子集等化成第二数字数据集的第四样本子集中的相邻样本,其中该第三样本子集和该第四样本子集交错, 
-通过在时域中将第一数字数据集的样本与第二数字数据集的对应样本相加而产生第三数字数据集的样本, 
-在该第三数字数据集中嵌入该第一数字数据集的第一种子样本和该第二数字数据集的第二种子样本。 
通过利用以下步骤替代在EP1592008的方法中的内插步骤,即,在预定位置之间的数值被设为相邻样本的数值,在编码侧的处理强度被大大地降低。结果信号仍然允许从第三数字数据集分离(即提取)该两个数字数据集。当将两个数字音频流组合成单一数字音频流时,该第三数字数据集仍然是该两个已被组合的数字音频流的良好的单音(mono)表示。 
本发明是基于以下认识,即,在编码侧上内插是不必要的,这是因为,由于本组合和分离方法保持第一和第二数字数据集的样本在它们分别的预定位置处完好并且可被恢复,因此允许在第三数字数据集解码之后在该完好样本之间的样本内插,所以能够同样好地在解码侧上执行内插。本发明的独立权利要求的第三数字数据集不同于EP1592008的第三数字数据集之处在于,在本发明的情形中,在第一和第二数字数据集的真正合并和第三数字数据集之间通常存在更大 的误差。 
将第一数字数据集的第一样本子集等化成第一数字数据集的第二样本子集中的相邻样本,其中第一样本子集和第二样本子集交错,在第一数字数据集的信息中实现了容易被执行的缩减。 
将第二数字数据集的第三样本子集等化成第二数字数据集的第四样本子集中的相邻样本,其中第三样本子集和第四样本子集交错,在第二数字数据集的信息中实现了容易被执行的缩减。 
通过使得来自第一和第二数字数据集的初始数值可得,其中该初始数值能够用作种子数值,并且确保第二和第四子集也是交错的,在其中第一数字数据集的第一样本子集被等化成第一数字数据集的第二样本子集中的相邻样本并且第二数字数据集的第三样本子集被等化成第二数字数据集的第四样本子集中的相邻样本的状态中,能够从第三数字数据集恢复第一和第二数字数据集。一旦在这种状态中第一和第二数字数据集已被恢复,便能够使用内插或者滤波尽可能准确地恢复第一数字数据流的第一样本子集和第二数字数据流的第三样本子集的初始数值。因此将第一数字数据流和第二数字数据流组合成第三数字数据流的该方法允许以高的精度恢复第二和第四样本子集以及重构第一和第三数值子集,并且在解码期间,如果需要,能够执行内插步骤。 
包括解码器的终端用户设备能够决定该重构所实现的质量水平,这是因为能够由解码器选择和执行内插而不是由编码器规定。 
通过不对第一和第二数字数据集进行任何内插而是包括在第三数字数据流的最低有效位中隐藏的误差近似,实现了以下优点,即,解码步骤能够自由选择应用什么样的重构。然而,当在构建第3数字集(是包括近似误差的第1和第2数字集的样本混合)期间也使用误差近似时,在解码过程期间也必须使用在最低有效位中隐藏的误差近似数值从而执行初始数字数据集,即初始数字音频通道的重构。 
在解码期间的重构能够被选择以使用如在最低有效位中存储的误差近似并且在预定位置处在样本数值之间执行线性内插,这是因 为,除了在最低有效位中的信息损失,它们是完全可被恢复的。因此能够更加灵活地使用编码和解码系统。 
编码能够或者仅仅减少处理并且将第一和第二数字数据流融合成第三数字数据流而不加上误差近似并且仅仅将在预定位置之间的样本数值设为相邻样本的数值,或者误差近似能够被从一组有限的误差近似选定并且被添加到第三数字数据集的最低有效位。 
在该方法的一个实施例中,该第一数字数据集代表第一音频信号并且该第二数字数据集代表第二音频信号。 
通过将本发明应用于音频信号,不仅实现了能够以可接受的精度恢复第一和第二音频信号而且实现了如由第三数字数据集代表的所得组合式音频信号是当与第二音频信号混合时的第一音频信号的、在可被感知方面可接受的表示。因此实现了在没有能力从第三数字数据集提取第一或者第二数字音频信号的装备上能够正确地再现所得第三数字数据集,而有能力执行提取的装备能够提取第一和第二音频信号从而分离地进行再现或者进一步处理。当使用本发明组合,即混合多于两个音频信号时,还能够提取仅仅其中一个音频信号,而保持另一音频信号被组合。这些剩余的音频信号仍然给出代表仍被组合的音频信号的混合的可再现的音频信号,同时能够单独地处理已被提取的音频信号。 
作为一种用于录音工程师的工具-对于成对音频通道到单一通道的混音(混合,mix)的实时仿真是可能的。在作为认证过程的一个部分的记录编辑期间,这将形成音频输出,该音频输出将代表最终混音过程的最低保证质量以及解混音或者解码通道的最低质量。一旦基本AURO-phonic多通道PCM数据集得以产生,便可以离线计算用于增加混音信号质量的另外的编码参数,从而无需实时处理。 
在该方法进一步的实施例中,第一种子样本是第一数字数据集的第一样本并且第二种子样本是第二数字数据集的第二样本。 
靠近数字数据集起点选择用于分离的种子样本允许一旦第三数字数据集开始被读出便开始分离第一和第二数字数据集。该种子样本 还能够被进一步地嵌入,即定位于第三数字数据集中从而将需要递归方案以分离位于该种子样本之前的样本。在初始数字数据集开始时,或者在这之前,从该初始数字数据集选择种子样本简化了用于恢复第一和第二数字数据集的分离过程。 
在该方法进一步的实施例中,第一种子样本和第二种子样本被嵌入第三数字数据集的样本的较低有效位中。 
通过在样本的较低有效位中嵌入种子数值,受到影响样本将仅仅从初始数值稍微地偏离,已经发现这实际上是觉察不到的,因为仅仅很少的种子数值需被存储并且因此仅仅很少的样本受到影响。另外,选择较低有效位保证了仅仅能够发生小的偏离。 
即使当所有样本的最低有效位都被用于嵌入数据时,这个偏差也不被察觉或者难以被察觉,这是因为最低有效位被从样本移除并且这是难以被注意到的。 
这种从样本移除最低有效位减少了用于存储在其中包括这些样本的数字数据集所需的空间,并且因此在记录载体上或者在传输通道中释放了更多空间或者例如为了控制的目的而允许嵌入另外的数据。 
在从在PCM样本的较低有效位中编码的另外的数据读出或者甚至作为用于音频的PCM样本的较高有效位的一个部分时,当读出误差发生时,使用本发明的基本方法解混音PCM样本可以引起误差。这个分离过程的本质是这样的,使得与一个(音频/数据)样本有关的这些误差将引起随后的样本的解混音操作。然而,用于以优化方式使用在PCM流中用于另外的数据的辅助数据区域,其中高级编码将使用这个辅助数据区域以存储(样本频率降低)误差,并且使得所有的这种校正数据被压缩,将在数据块的端部处添加CRC校验和以使得解码器能够检验在这种块中的所有数据的完整性。通过以规则的间隔存储种子数值,能够限制由于音频样本中的误差引起的影响。当误差发生时,该误差将仅仅传播至它的种子数值已知的下一位置,这是因为,在那个点处,能够重新开始分离过程,从而有效地终止误差传播。另外,当在存储于较低有效位的辅助数据区域中的种子数值中发生数 据误差时,基于那些坏的种子数值的分离将是错误的,但这仅仅限于它的种子数值已知的下一位置之前,因为在那个点处,能够重新开始分离过程。 
通过在样本的较低有效位中的辅助数据区域中存储另外的数据,本发明在BLU-RayDVD或者HD-DVD的情形中,已混音音频数据(较高精度位)和编码/解码数据(通常每一样本2、4或者6位)的混音或者“复用”除了每一样本(已经可用的)24位之外并不要求任何额外的记录空间,并且它也不从在光盘上的数据“导航”要求任何额外信息(例如无需任何章节或者流的时间戳)。同样地,在读盘控制(如由DVD播放器的嵌入软件执行地)中无需任何改变。进一步,无需为了使用本发明而对于这些新的媒体格式的标准进行任何改变或者添加。进而,音频样本位分辨率的降低和在最低有效位中存储音频解码/编码数据在利用并不执行解码算法的设备或者系统(例如HD-DVD或者BLU-RayDVD播放器)正常回放期间将使得用户感觉不到任何声响伪迹(artifact)。 
在该方法的进一步的实施例中,在相对于第一种子样本的位置界定的位置处嵌入同步模式。 
嵌入同步模式以允许恢复第一种子样本,这是因为,当探测到同步模式时,便已知第一种子样本的位置。这也能够被应用于定位第二种子样本。通过在规则的间隔处重复该同步模式从而能够使用飞轮探测以可靠地探测该同步模式,能够进一步改进该同步模式。这将在较低有效位中的数据存储划分成块,这允许应用逐块处理。 
在该方法的进一步的实施例中,在等化样本的步骤之前,通过从一组误差近似中选择误差近似而近似样本等化所引起的误差。 
等化样本的步骤在组合第一和第二数字数据集期间是非常易于执行的,但是也引入了误差。 
为了减小这个误差,建立误差数值,从用于从中进行选择的一组有限的误差近似中选择该误差数值。 
这一组有限的误差近似允许减小误差,并同时节约了空间,这是 因为,能够仅从一组有限的误差近似中选择该误差近似,该组有限的误差近似能够利用在等化步骤期间实际误差遇到的更少的位来表示。与在编码过程期间释放的位数相比,误差近似的索引对于每一样本要求更少的位。对于保证数据的可压缩性而言,这是重要的。这个被得以节约的空间允许嵌入另外的信息例如同步模式和种子样本。从96kHz到48kHz或者从192kHz到96kHz的采样频率的降低可能成为问题,这是因为,为了再形成音频的目的而引入了更高的采样速率,其中为了高保真音频再现,与光盘音频记录相比,不仅这样的采样速率而且主要地相位信息都是更加具体地需要的。 
由于样本频率降低而引起的误差和用于(尽可能多地)消除这些误差的校正数据(误差近似)能够是最优化算法的结果,其中,最优化准则能够被定义成平方误差的最小和或者甚至可以包括基于感知音频目标的准则。 
在该方法进一步的实施例中,在已经为样本建立了误差近似之后,该样本将被等化成的相邻样本的数值被修改,从而当从包括误差近似的等化样本重构样本时,该样本更加接近地代表在等化之前的样本。根据需要,通过修改相邻样本的数值从而当该样本被等化成相邻样本时相邻数值和误差近似的组合更加准确地代表在执行到其相邻样本的等化之前的初始样本数值,该误差能够被进一步降低。 
在该方法进一步的实施例中,该组误差近似被索引并且在该误差近似对应的样本中嵌入代表该误差近似的索引。 
在该方法进一步的实施例中,样本被划分成块并且在包括该索引对应的样本的第二块前面的第一块中的样本中嵌入该索引。 
通过索引一组有限的误差近似并且仅仅在该索引对应的样本前面的第三数字数据集的样本的较低有效位中存储适当的索引,进一步实现了误差近似的尺寸的降低。通过在前一个块的样本中嵌入索引,当相应样本的分离过程开始时,该索引并且因此该误差近似是可用的。 
在该方法进一步的实施例中,嵌入式误差近似被压缩。 
除了索引,能够采用用于压缩的其它方法,例如LempelZiff。误差近似来自一组有限的误差近似并且因此能够被压缩,这允许当在样本中嵌入误差近似时使用更少的空间。 
如果其它嵌入数据也存在于样本的较低有效位中,这是特别有益的。对于这个另外的数据,索引不必是可用的,并且能够使用普通压缩格式。能够使用关于误差近似的索引和关于另外数据的压缩的组合,或者能够使用对于在较低有效位中嵌入的所有数据,即误差近似和另外的数据的总体压缩。 
在该方法进一步的实施例中,以预定的偏移嵌入误差数值。 
预定偏移在误差近似和该误差近似对应的样本之间建立了确定的关系。 
在使用索引存储误差近似的情形中,该索引适用于每一个块并且适用的索引也被存储在每一个块中。 
如果可能的,索引还能够对于每一数字数据集被选择或者是固定的并且被存储于编码器和解码器中而不被存储于数据流中,这是以灵活性为代价的。 
当不使用任何误差近似改进所被提取的音频信号的质量时,无需存储误差近似。这并不阻止在数字数据集的较低有效位中嵌入和压缩其它数据。 
在该方法进一步的实施例中,在相对于误差数值所对应的样本具有变化位置的第一可用位置处嵌入该误差数值。 
通过一旦存在可用空间时便压缩样本中的误差数值,样本空间得以节约,能够使用该空间以在以后允许扩展该组有限的误差数值,从而由此允许更加准确的校正等化样本,这样实现了数字数据集的更好再现。 
这本能够成为对所获空间加以利用的方法,但是优选地采取一种不同的方案。 
从压缩误差数值&索引列表节约的空间实际上被用于限制将被混音到一起的下一个块的样本数目。因为这个数目小于当前块,所以 各种误差将会更小并且因此能够利用相同数目的误差近似数值而被更好地近似。这些误差数值和参考索引再次被压缩并且所节约的空间再次被继续用于限制在下一个块中的被混音样本的数目。 
在该方法进一步的实施例中,未被用于嵌入误差近似或者其它控制数据的、第三数字数据集的样本的任何较低有效位,被设为预定数值或者被设为零。 
较低有效位能够或者在组合数字数据集之前或者在嵌入嵌入式信息例如种子数值,同步模式和误差数值之后被设为零。 
预定数值或者零数值能够帮助辨别嵌入式数据,因为嵌入式数据不再被看起来随机的数据包围。 
它进一步允许简化组合和分离过程,因为显然这些位无需处理。 
应该指出,在较低有效位中选择被释放的位数可以被动态地执行,换言之,这是基于数字数据集在该瞬时的内容。例如古典音乐的无声部分可能要求更多的位以用于信号分辨率,而流行音乐的高声部分可能并不要求那么多的位 
在本发明的一个实施例中,已被提取的信号或者嵌入式控制数据能够被用于控制需与音频信号被同步地控制的外部设备,或者例如通过相对于基础水平或者相对于未被从组合信号提取的其它音频通道,或者相对于组合音频信号定义已被提取的音频信号的幅度而控制已被提取的音频信号的再现。 
本发明描述了一种技术,用于通常从3维音频记录,但是并不限于这个用途-将音频PCM轨道(PCM轨道是代表数字音频通道的数字数据集)-混音(并且存储)成一定数目的轨道,该数目小于在初始记录中使用的轨道数目。这种通道组合是通过以支持反向操作即解码操作的方式将成对音频轨道混音成单一轨道而实现的,该解码操作允许分离组合信号,以重建初始的分离的音频轨道,该音频轨道将与来自母带记录(主记录,master recording)的原始音频轨道是感知相同的,而在同时,组合信号提供了一种能够经由规则回放通道再现并且当被再现时与音频通道混音物感知相同的音频轨道。这样,当将3维 音频记录(录音)的通道组合成一组通常用于2维环绕音频记录的通道,并且再现所被组合的通道而不应用反向操作时,已被组合的,即(向下)混音的,音频记录仍然符合用于重建通常被称为立体声,4.0,5.1或者甚至7.1环绕音频格式的、逼真的2维环绕音频记录的要求,并且能够被原样地播放而不需要额外的设备、修改设备或者解码器。这保证了所得组合通道的向下兼容性。 
向多于2个的数字数据集或者两个音频信号的扩展是非常可行的。关于2个数字数据集解释了该项技术,能够以类似的方式实现这项技术向多于2个数字数据集的扩展,这是通过:改变交错,从而对于第三数字数据集的每一个样本,仅仅一个数字数据集提供将被与来自其它数字数据集的已等化样本组合的非等化样本并且从提供样本的数字数据集以交替的方式选择提供非等化样本的数字数据集。 
如果多于2个数字数据集被组合,则每一个数字数据集的每第n个样本被用作每n(相等)个数据集样本保持(n-1)个样本的第一子集的等化样本,而第二子集每n个数据集样本保持1个样本。对于每一个数据集,等化样本的位置在时域中偏移1个位置。 
这样,在由目前的数字音频标准提供的数据速率和分辨率内,已经发现3通道数字音频到1通道数字音频混音物(3到1混音)是当然可行的。以此方式,4到1混音也是可能的。 
数字音频通道的这种混音允许使用具有第一数目的独立数字音频通道的第一数字音频标准以存储、传输和再现具有第二数目的独立数字音频通道的第二数字音频标准,其中数字音频通道的第二数目高于数字音频通道的第一数目。 
本发明通过使用本发明的方法或者根据本发明的编码器将至少两个数字音频通道组合成单一数字音频通道而实现了这一点。因为在该方法中的添加步骤,所得数字音频流是相组合的两个数字音频通道的感知满意表示。 
对于多个通道执行这种组合降低了通道数目,例如从3D 9.1体系到2D 5.1体系。这能够通过例如将9.1系统的左下前通道和左上前 通道组合成通常能够通过5.1系统的左前通道存储、传输和再现的一个左前通道而得以实现。 
因此,虽然使用本发明产生的信号允许通过分离组合信号而恢复初始9.1通道,但是该组合信号同等地适用于由仅仅具有5.1系统的用户使用。对于适当的向下混音5.1系统,可能要求在混音或者编码之前衰减两个通道,从而在解码期间要求每一个通道的(反向)衰减数据。 
使用在本发明中形成的技术-但是并不限于这个用途-以产生能够在现有的或者新的媒体载体例如仅仅作为实例给出的HD-DVD或者BLU-RAYDVD上存储的AURO-phonic音频记录,而无需向它们的媒体格式定义增加任何额外的媒体格式或者添加,因为这些标准已经支持多通道音频PCM数据,例如96khz 24位PCM音频(HD-DVD)的6通道或者96khz 24位PCM音频(BLU-RayDVD)的8通道或者192khz 24位PCM音频(BLU-RayDVD)的6通道。 
对于AURO-phonic音频记录,与在这些现有或者新的媒体载体上可用的通道相比,需要更多的通道。本发明允许使用其中存在通道不足的这些媒体载体,或者其它传输装置并且使得能够在用于3D音频存储或者传输的通道数目不足的情况下使用这种系统,并且同时保证了与所有的现有回放装备向后兼容,从而自动地在2D系统中提供3D音频通道,如同它是2D音频通道一样。如果存在适用的回放装备,则能够使用根据本发明的解码方法或者解码器提取完整的该组3D音频通道并且该系统能够在提取分离的数字音频通道并且再现这些个体通道之后适当地提供完整的3D音频。 
Aurophony指定了能够正确地提供-由它的x、y和z轴定义的录音室三维性的音频(或者音频+视频)回放系统。已经发现与(一种或多种)特殊扬声器布局相组合的适当的声音记录提供了更加自然的声音。 
3D音频记录例如Aurophony还能够被定义成带有高度扬声器的环绕设置。正是这种高度扬声器的添加引起了对于与目前通常使用的 系统所能够提供的相比更多的通道的需求,这是因为目前使用的2D系统仅仅提供在室内基本上处于相同水平的扬声器。因为Aurophony融合并且掺合了两个空间的音调特征,所以它被关联到特定的知觉方面。数目增加的通道和扬声器的定位允许在这个基础上进行任何记录以实现使用音频的固有三维方面的全部潜能的回放。与特殊扬声器定位相组合的多通道技术在听觉上将听众带到声音事件的实际场所-带到虚拟空间,并且使得它们能够在虚拟模式中感受到它的空间维度。这个空间的宽度、深度和高度实际地和在情感上都是被首次感知的。 
进而,设备例如HD-DVD或者BLU-RayDVD播放器实现了一种音频混音器,以在回放期间将外部音频通道(不是从盘读出的)混音到音频输出中,或者通常根据用户导航操作混音音频效果以增加用户的感受。然而,它们还具有“电影”真实模式,该模式在回放期间消除了这些音频效果。最后这种模式由这些播放器用来通过它们的音频(A/D)转换器输出多通道PCM混音或者用来提供作为在包括例如视频的数据中封装的音频多通道混音而被加密的多通道PCM混音并且使用HDMI接口发出以进一步处理。对于在回放/记录期间使用的无损压缩(例如位相同音频PCM数据)的要求对于任何设备提供或者记录这些向下混音的多通道PCM音频轨道而言都是成立的,只要该解码器-如在本发明中解释地被用于重建3维音频记录或者仅仅“空间”增强音频记录。 
除通过以可逆方式将多个通道组合成单一通道的、更加有效的或者有效率的音频PCM存储之外,一项目标应用或者使用是3维音频记录和再现的音频PCM存储,它仍然保持与如由DVD、HD-DVD或者BLU-RayDVD标准提供的音频格式的兼容性。在控制环绕音频记录或者多通道音频期间,记录工程师目前具有多个音频轨道可用并且使用模板以使得它们的控制工具形成可以例如在CD、SA-CD、DVD、BLU-RayDVD或者HD-DVD上创造的或者仅仅被以数字方式存储在记录设备(如,例如硬驱动器)上的立体声或者(2维)环绕音频轨 道。在真实世界中总是位于3维空间中的音频源至此已经主要被作为在2维空间中限定的源记录,即使对于音频记录工程师而言,第3维信息也是可用的或者能够已被容易地添加(例如,声音效果如在听众头顶上掠过的飞机、或者小鸟在空中的“鸣唱”)或者被从真实的生活场景记录。 
直至现在,除了以下系统,其中例如在电影院应用中另外的多个音频轨道的系列被独立地存储于提供用于存储的充分数目的轨道的系统中,没有任何通用音频格式已经是可用的。然而,这些另外的通道不能被存储在记录媒体如HD-DVD或者BLU-RayDVD上,这是因为,这些存储系统提供了数目不足的音频通道。本发明的目的在于,以它们将不会干扰(或者打扰)(2D)标准多通道或者2通道音频信息的方式,以对于记录工程师而言在完成3D音频记录之前基本实时评价是可用的方式并且以在这些新的媒体上仍然使用不多于“标准”多通道轨道的方式形成这些额外的“虚拟”轨道。 
应该指出,虽然针对音频应用描述了本发明,但是对于视频应用而言,能够设想采用相同的原理,以例如形成3维视频再现,这是例如通过使用每一个均被取自具有微小角度差异的照相机的2个同步视频流(角度),从而形成3D效果,然而如本发明详细描述的那样组合该两个视频流并且因此使得能够存储和传输3D视频从而它仍然能够在普通的视频装备上回放。 
应用实例 
在环绕混音(SurroundMix)中包括的立体声(艺术)混音。 
在控制音频记录期间,声音工程师定义或者使用混音模板,以从多个音频轨道开始,形成“真实”或者“艺术“立体声混音,以及环绕混音(例如4.0,5.1...)。虽然环绕混音到立体声混音的矩阵向下混音是可能的,但是能够很容易地例示出这种向下混音矩阵技术的缺点。矩阵向下混音立体声将充分地不同于“艺术”立体声混音,因为来自这种矩阵向下混音立体声信号的内容将通常位于L-R域(异相信号)中,而真实“艺术”立体声混音将主要位于L+R域(同相信号)中,并且 在L-R域中具有适度的数量。仅仅作为一个实例;在单音中,矩阵向下混音立体声将听起来基本上更加寂静,这是由于异相信号的数量较高。因此,利用大多数的目前音频编码/解码技术控制和编码的当前的环绕音频记录通常提供-如果它们关心逼真的立体声再现-该记录的分离的真实(“艺术”)立体声版本。 
利用在本发明的技术上建立的应用,本领域技术人员能够容易地建立一种系统,该系统将艺术记录的左(前)音频和右(前)音频通道控制成左和右通道,并且使得这些通道中的每一个与(例如)24dB衰减音频Delta通道(L-艺术-L-环绕)和(R-艺术-R-环绕)混音。当不利用任何解码器地播放多通道记录的L/R通道时,将主要地存在艺术左/右音频记录,但是当利用如在本发明中解释的解码器播放时,混音通道将被首先解混音,接着,(delta)通道将被(例如)24dB放大并且被从“艺术”通道减除,以对于环绕混音根据需要形成左和右通道,在此时还播放环绕(L/R)通道以及中心和超低音(Subwoofer)通道。 
3-维(“AURO-phonic”)混音被包括在环绕混音中。 
使用如在本发明中解释的编码技术,能够容易地看到,简单地通过在2维2.0,4.0,5.1或者甚至7.1环绕混音的每一个通道上混音,代表如在高于那些2维扬声器的特定高度处记录的音频的另一音频通道,第3维音频信息的混音能够得以实现。当未与如在本发明中限定的这种解码器一起地使用多通道记录时,在混音期间,这些第3维音频通道能够被衰减,以避免非理想的音频效果。在解码期间,这些通道被解混音并且当需要时被放大,并且在顶部扬声器上提供这些通道。 
在环绕混音中包括的立体声(“艺术”)混音&3-D(“AURO-phonic”)混音。 
如果旨在产生对于艺术立体声再现,2-D环绕再现或者3-DAURO-phonic再现而言是有用的多合一记录,例如在96kHz(HD-DVD)或者192kHz(BLU-RayDVD)下的6通道,则能够使 用基于本发明的应用。通过以因子3(或者更大)降低“初始”采样速率,本发明能够被用于将3个通道(或者更多)混音成一个通道,并且近似在这种降低期间产生的误差,以尽可能多地恢复初始信号。这能够被用于混音96kHz左前-艺术通道,与96kHz(衰减)左前Delta(L-艺术-L-环绕),和与96kHz(衰减)左前顶部。类似的混音方案可以被应用于右前通道。2-通道混音能够被应用于左环绕和被应用于右环绕。甚至中心通道也能够被用于混音中心顶部音频通道。 
从“古典”2-D记录提供自动化3-D音频。 
大多数目前存在的音频或者视频制作具有2维(环绕)音频轨道。除真实的第3维音频源位置之外,如在本发明中解释的编码器能够在控制和混音期间使用该位置,以使用该信息作为被向下混音成2-维记录的另外的通道,如存在于标准2维音频记录中的扩散音频是将在3维音频设置的顶部扬声器上移动和提供的候选音频。能够想到自动化(离线或者非实时)音频过程,该音频过程将从2维记录提取扩散音频,并且可以使用该所被提取的音频以形成被与2-D环绕记录的“降低”音频轨道混音(根据本发明的格式)的通道,从而获得能够作为3D音频而被解码的环绕多通道记录。根据计算要求,从2D-环绕通道提取扩散音频的这种滤波技术能够被实时地应用。 
本发明能够被用于形成3维音频系统的一部分的几种设备。 
Aurophonic编码器-计算机应用(软件)插件。 
通常可用于音频/视频记录和控制世界的控制和混音工具允许第三方研制软件插件。它们通常提供公共数据/命令接口以启动在由混音和控制工程师所使用的整套工具中的插件。因为AUROPHONIC编码器的核心是一个简单的编码器事例,在一方面利用多个音频通道输入和一个音频通道输出并且在另一方面对于作为另外的参数的用户设置如质量和通道衰减/位置加以考虑,能够在这些音频控制/混音工具中提供软件插件。 
AUROPHONIC解码器-计算机应用(软件)插件。 
能够以与编码器插件类似的方式研制作为利用控制和混音工具 的检验工具的软件插件解码器。这种软件插件解码器还能够被集成到消费者/终端用户PC的媒体播放器(如视窗媒体播放器WindowsMedia Player,或者DVD软件播放器并且最可能的HD-DVD/Blu-Ray软件播放器)中。 
AUROPHONIC解码器-内置于BLU-Ray或者HD-DVD播放器中的专用ASIC/DSP。 
几种新的媒体高清晰度格式定义了能够在它们的分别的(消费者)播放器内部使用的多个高频/高位分辨率音频PCM流。当使用其中没有任何音频PCM数据被混音/融合/衰减/...以被提供给内部音频数字模拟转换器的模式从这些盘播放内容时,这些音频PCM数据(能够是AURO编码数据)能够被专用ASIC或者DSP(加载有AURO解码器固件)截取以解码所有的混音音频通道并且产生额外的一组音频输出以传送例如艺术左/右音频或者例如另外的一组顶部L/R输出。 
作为BLU-Ray或者HD-DVD固件的一个部分集成的AUROPHONIC解码器。 
在BLU-Ray或者HD-DVD盘回放期间,只要AUROPHONIC解码过程具有意义,这些播放器的回放模式便需要被设为真实FiIm模式,以防止播放器的音频混音器损坏/修改如在这个盘上控制的PCM流的初始数据。在这种模式中,并不需要播放器的CPU或者DSP的完全处理能力。这样,能够作为另外的解混音过程集成AUROPHONIC解码器,作为播放器的CPU或者DSP的固件的一个部分执行该另外的解混音过程。 
AUROPHONIC解码器-ASIC/DSP附加在HDMI切换器,USB或者FIREWIRE音频设备中。 
HDMI(高清晰度媒体接口)使得能够传输全带宽的多通道音频流(8通道,192kHz,24位)。HDMI切换器通过首先解扰而再生数字音频/视频数据,从而在这种切换器中能够内部访问经由HDMI接口传输的音频数据。可以利用实现AURO解码器的附加板来解码AURO编码音频。类似的附加集成(通常在音频记录/回放工具中) 能够被用于USB或者FIREWIRE多通道音频I/O设备。 
如在这里描述的编码器能够被集成于更大的设备例如记录系统中或者能够是一种被联接到记录系统或者混音系统的独立编码器。该编码器还能够被实现为计算机程序以例如当在适用于运行所述计算机程序的计算机系统上运行时执行本发明的编码方法。 
如在这里描述的解码器能够被集成于更大的设备例如在回放设备中的输出模块,在放大设备中的输入模块中或者能够是一种独立解码器,该解码器经由它的输入被联接(耦接)到已被编码的组合数据流源并且经由它的输出被联接到放大器。 
数字信号处理设备在该文献中应该被理解成在记录/传输/再现链条的记录部分中的设备,例如音频混音表格、用于在记录介质例如光盘或者硬盘上记录的记录设备、信号处理设备或者信号捕捉设备。 
再现设备在本文中应该被理解成是在记录/传输/再现链条的再现部分中的设备,例如音频放大器或者回放设备,用于从存储介质恢复(取回,retrieve)数据。 
再现设备或者解码器能够被有利地集成于车辆例如小汽车或者公共汽车中。在车辆中,乘客通常被乘客厢包围。 
该隔室允许容易地定位扬声器,将通过该扬声器再现多通道音频。因此,设计者能够专门地将音频环境定制成适合于在乘客厢内部再现3维或者其它多通道音频。 
另一个益处在于,正如其它配线被隐藏那样,能够容易地隐藏扬声器所需的配线。在乘客厢的下部中定位3维扬声器系统的下部组扬声器,正如很多的扬声器目前被安装在例如门板中,在仪表板中或者靠近底板。能够例如靠近车顶或者在高于汽车仪表板或者仪表板或者至少高于下部组扬声器的另一位置处而在乘客厢的上部中定位该3维扬声器系统的上部组扬声器。 
允许用户将再现设备从其中解码器分离音频通道并且将已被分离的音频通道传送到放大器的第一状态切换到其中已被组合的音频通道到达放大器的第二状态也是有益的。能够通过绕过解码器而实现 在3维再现和2维再现之间的切换。 
在另一种配置中,还设想到在2维再现和立体声再现之间的切换。 
对于2和3维音频再现的要求,例如扬声器的定位,并不是本发明的一个部分并且因此将不与详细描述。然而应该记住的是,本发明能够适应于多通道音频再现设备的设计者例如当将小汽车配置成正确地再现多通道音频时可以选择的任何通道配置。 
附图说明
现在将基于附图描述本发明。 
图1示出用于组合两个通道的、根据本发明的编码器。 
图2示出被等化样本转换的第一数字数据集。 
图3示出被等化样本转换的第二数字数据集。 
图4示出将两个所得数字数据集编码成第三数字数据集。 
图5示出将第三数字数据集解码回(成)两个分离的数字数据集。 
图6示出改进的对第一数字数据集的转换。 
图7示出改进的对第二数字数据集的转换。 
图8示出将两个所得数字数据集编码成第三数字数据集。 
图9示出将第三数字数据集解码回两个分离的数字数据集。 
图10示出一个实例,其中描绘了如利用如在图6中描述的编码而获得的第一个流A的样本。 
图11示出一个实例,其中描绘了如利用如在图7中描述的编码而获得的第一个流B的样本。 
图12示出已被混音的流C的样本。 
图13示出由本发明引入到PCM流的误差。 
图14示出在组合式数字数据集的样本的较低有效位中的辅助数据区域的格式。 
图15示出该辅助数据区域的更多细节。 
图16示出其中适应导致可变长度AURO数据块的一种情形。 
图17给出如在以前的部分中解释的处理步骤组合的概况。 
图18示出Aurophonic编码器设备。 
图19示出Aurophonic解码器设备。 
图20示出根据本发明的解码器。 
具体实施方式
图1示出用于组合两个通道的、根据本发明的编码器。编码器10包括第一等化单元11a和第二等化单元11b。每一个等化单元11a、11b均从编码器10的分别的输入接收数字数据集。 
第一等化单元11a选择第一数字数据集的第一样本子集并且将这个第一子集的每一个样本等化成第一数字数据集的第二样本子集的相邻样本,其中,如将在图2中详细解释地,第一样本子集和第二样本子集交错。包括第二子集的未受影响的样本和第一子集的等化样本的所得数字数据集能够被传递到第一可选样本尺寸降低器12a或者能够被直接地传送到组合器13。 
第二等化单元11b选择第二数字数据集的第三样本子集并且将这个第三子集的每一个样本等化成第二数字数据集的第四样本子集的相邻样本,其中,如将在图3中详细解释地,第三样本子集和第四样本子集交错。包括第四子集的样本和第三子集的等化样本的所得数字数据集能够被传递到第二可选样本尺寸降低器12b或者能够被直接地传送到组合器13。 
第一和第二样本尺寸降低器均从它们的分别的数字数据集的样本移除确定(定义)数目的下位,例如通过移除四位的最低有效位而将24位样本降低成20位样本。 
如由等化单元11a、11b执行的样本等化引入了误差。可选地,通过比较等化样本与初始样本而由误差近似器15近似这个误差。如在下面解释的那样,这种误差近似能够由解码器使用以更加准确地恢复初始数字数据集。组合器13将第一数字数据集的样本添加到第二数字数据集的相应的样本,如提供到它的输入,并且经由它的输出将第三数字数据集的所得样本供应到格式化器14,格式化器14在第三 数字数据集的较低有效位中嵌入另外的数据例如来自两个数字数据集的种子数值和如从误差近似器15接收到的误差近似并且将所得数字数据集提供到编码器10的输出。 
为了解释原理,使用两个输入流对实施例进行解释,但是本发明能够同等地使用被组合成一个单一输出流的三个或者更多输入流。 
图2示出由等化样本转换的第一数字数据集。第一数字数据集20包括样本数值A0,A1,A2,A3,A4,A5,A6,A7,A8,A9的序列。第一数字数据集被划分成第一样本子集A1,A3,A5,A7,A9和第二样本子集A0,A2,A4,A6,A8。 
随后,如由图2中的箭头所示意地,第一样本子集的每一个样本A1,A3,A5,A7,A9的每一个数值被等化成来自第二子集的相邻样本A0,A2,A4,A6,A8的数值。具体地,这意味着样本A1的数值被相邻样本A0的数值替代,即样本A1的数值被等化成样本A0的数值。这产生了如图所示的第一中间数字数据集21,该第一中间数字数据集包括样本数值A0″,A1″,A2″,A3″,A4″,A5″,A6″,A7″,A8″,A9″,等,其中数值A0″等于数值A0并且A1″等于数值A0等。在图6中,将示出一个实施例,其中由于样本中的位数降低,A0″不再等于A0。 
图3示出被等化样本转换的第二数字数据集。第二数字数据集30包括样本数值B0,B1,B2,B3,B4,B5,B6,B7,B8,B9的序列。第二数字数据集被划分成第三样本子集B0,B2,B4,B6,B8和第四样本子集B1,B3,B5,B7,B9。 
随后,如由图3中的箭头所示意地,第三样本子集的每一个样本B0,B2,B4,B6,B8的每一个数值被等化成来自第四子集的相邻样本B1,B3,B5,B7,B9的数值。 
具体地,这意味着样本B2的数值被相邻样本B1的数值替代,即样本B2的数值被等化成样本B1的数值。这产生了如图所示的第二中间数字数据集31,第二中间数字数据集包括样本数值B0″,B1″,B2″,B3″,B4″,B5″,B6″,B7″,B8″,B9″,其中数值B1″等于数值B1并且B2″等于数值B1,等。在图7中,将示出一个实施例,其中由于样 本中的位数降低,B1″不再等于B1。 
图4示出将两个所得数字数据集编码成第三数字数据集。 
现在通过相加相应的样本而组合第一中间数字数据集21和第二中间数字数据集31。 
例如,第一中间数字数据集21的第二样本A1″与第二中间数字数据集31的第二样本B1″相加。所得第一组合样本C1被置于第三数字数据集40的第二位置处并且具有数值A1″+B1″。 
第一中间数字数据集21的第三样本A2″与第二中间数字数据集31的第三样本B2″相加。所得第二组合样本C2被置于第三数字数据集40的第三位置处并且具有数值A2″+B2″。 
图5示出将第三数字数据集解码回两个分离的数字数据集。 
第三数字数据集40被提供给解码器以分离在第三数字数据集40中包括的两个数字数据集31、32。 
第三数字数据集40的第一位置被示为保持数值A0″,这是在解码期间需要的种子数值。这个种子数值能够被存储在任何位置,但是在解释期间为了方便起见被在第一位置中示出。第二位置保持具有数值A0″+B0″的第一组合样本。因为解码器知道如从第一位置恢复到的种子数值A0″,能够通过相减C0-A0″=(A0″+B0″)-A0″=B0″而建立第二中间数字数据集的样本数值。 
这个恢复样本数值B0″被用于重构第二中间数字数据集,但是也被用于恢复第一中间数字数据集的样本。因为数值A0″现在已知,并且已知它的相邻样本A1″具有相同数值,所以现在能够计算第2中间数字数据集的样本: 
C1-A1″=(A1″+B1″)-A1″=B1″。 
这个恢复样本数值B1″被用于重构第二中间数字数据集,但是也被用于恢复第一中间数字数据集的样本。 
因为数值B1″现在已知,并且已知它的相邻样本B2″具有相同数值,所以现在能够计算第一中间数字数据集的样本: 
C2-B2″=(A2″+B2″)-B2″=A2″。 
这个恢复样本数值A2″被用于重构第一中间数字数据集,但是也被用于恢复第二中间数字数据集的样本。 
能够对于其余的样本如在图5中所示那样重复这一点。 
为了近似第一初始数字数据集20,能够使用系统已知的有关信号的信息处理恢复第一中间数字数据集,例如对于音频信号,能够通过内插或者其它已知信号重构方法重构被编码和解码(等化样本)损失的样本。如将在以后示出的那样,还能够存储有关通过在信号中等化而被引入的误差的信息并且使用这个误差信息接近于它们在等化之前所具有的数值,即接近于它们在初始数字数据集21中具有的数值地重构样本。 
当然能够对于每一个恢复中间数字数据集执行这一点以将等化样本恢复成与在初始数字数据集中的样本的初始数值尽可能接近的数值。 
在下面对图6、7和8的说明中,2个初始通道在位分辨率中例如从每样本24位降低到18位。接着在降低样本分率之后,采样频率被降低为初始采样频率的一半(在该实例中从2个音频通道开始,其每一个均具有相同的位分辨率和采样频率)。其它组合也是可能的,例如从X位开始并且降低到Y位(例如X/Y=24/22,24/20,24/16等...或者20/18,20/16,或者16/15,16/14...),根据高保真音频的要求,不应该在位分辨率中将样本降至低于14位...如果更多的通道被混音,则在这里描述的基本技术要求将采样频率除以需被混音成一个通道的通道的数目。所被混音的通道越多,则通道(在混音之前)的实际采样频率将越低。在HD-DVD或者BLU-RayDVD中,初始采样频率能够高达96kHz或者甚至(BLU-Ray)高达192kHz。在每一个采样频率均为96kHz时从2个通道开始,并且二者均降低至48kHz,这仍然保留了在高保真音频的范围中的采样频率。对于电影/TV音频质量而言,甚至混音3个通道,并且被降低至32kHz也是可接受的(这是如由NICAM数字广播TV音频所使用的频率)。从真实的192kHz记录开始,给出混音4个通道的方式,将采样频率降至48kHz。 
图6示出第一数字数据集的一种改进的转换。在该改进转换中,样本的较低有效位不再代表初始样本而是被用于存储另外的信息例如种子数值、同步模式、有关通过样本等化引起的误差的信息或者其它控制信息。 
第一数字数据集20包括样本数值序列A0,A1,A2,A3,A4,A5,A6,A7,A8,A9。每一个样本A0,A1,A2,A3,A4,A5,A6,A1,A8,A9均被截断从而产生截断或者舍入样本A0′,A1′,A2′,A3′,A4′,A5′,A6,A7′,A8′,A9′。随后如在图2中解释的那样处理这组60截断样本A0′,A1′,A2′,A3′,A4′,A5′,A6′,A7′,A8′,A9′,其中较低有效位得到考虑,或者实际上确实不再带有有关样本的信息。该组60截断样本被划分成第一样本子集A1′,A3′,A5′,A7′,A9′和第二样本子集A0′,A2′,A4′,A6′,A8′。 
随后,如在图6中的箭头所示意地,第一样本子集的每一个样本A1′,A3′,A5′,A7′,A9′的每一个数值被等化成来自第二子集的相邻样本A0′,A2′,A4′,A6′,A8′的数值。 
具体地,这意味着样本A1′的数值被相邻样本A0的数值替代,即样本A1′的数值被等化成样本A0′的数值。这产生了如所示的第一中间数字数据集61,它包括样本数值A0″,A1″,A2″,A3″,A4″,A5″,A6″,A7″,A8″,A9″,等,其中数值A0″等于数值A0′并且A1″等于数值A0′等。 
应该指出,因为截断,即样本舍入,在第一中间数字数据集61中产生保留区域62。 
图7示出第二数字数据集的一种改进的转换。以与用于第一数字数据集的方式相同的方式,该转换能够被改进,即,样本的较低有效位不再代表初始样本而是被用于存储另外的信息例如种子数值、同步模式、有关通过样本等化引起的误差的信息或者其它控制信息。 
第一数字数据集30包括样本数值序列B0,B1,B2,B3,B4,B5,B6,B7,B8,B9。每一个样本B0,B1,B2,B3,B4,B5,B6,B7,B8,B9均被截断,从而产生截断或者舍入样本B0′,B1′,B2′,B3′,B4′, B5′,B6′,B7′,B8′,B9′。 
随后如在图3中解释的那样处理这组70截断样本B0′,B1′,B2′,B3′,B4′,B5′,B6′,B7′,B8′,B9′,其中较低有效位得到考虑,或者实际上确实不再带有有关样本的信息。 
该组70截断样本B0′,B1′,B2′,B3′,B4′,B5′,B6′,B7′,B8′,B9′被划分成第三样本子集B0′,B2′,B4′,B6′,B8′和第四样本子集B1′,B3′,B5′,B7′,B9′。 
随后,如由图3中的箭头所示意地,第三样本子集的每一个样本B0′,B2′,B4′,B6′,B8′的每一个数值被等化成来自第四子集的相邻样本B1′,B3′,B5′,B7′,B9′的数值。具体地,这意味着样本B2′的数值被相邻样本B1′的数值替代,即样本B2′的数值被等化成样本B1′的数值。 
这产生了如所示的第二中间数字数据集71,它包括样本数值B0″,B1″,B2″,B3″,B4″,B5″,B6″,B7″,B8″,B9″,其中数值B2″等于数值B1′并且B1″等于数值B1′,等。应该指出,因为截断,即样本舍入,在第二中间数字数据集71中产生保留区域72。 
通过如在图6和7中解释的舍入而被引入的分辨率降低在原理上是“不可恢复的”,但是能够应用增加感知样本频率的技术。如果要求更多的位分辨率,则本发明允许增加Y的数值(实际上被使用的位),其代价是用于编码数据或者每样本的X位的可用“空间”更少。当然,在辅助数据区域中的数据块中存储的误差近似允许显著降低分辨率的感知损失。 
对于24位PCM音频流,利用18/6格式并且混音2个通道,我们得到18位音频样本和6位数据样本,每一个数据块均以6个数据样本(每一个6位)的同步信号(sync)开始,2个数据样本(总共12位)被用于存储数据块的长度并且最终2×3数据样本(2×18位)被用于存储副本音频样本。关于其它格式(实例): 
-16/8:8个数据样本的同步信号,2个数据样本(16位,仅仅使用12位)用于长度,并且2×2个数据样本(2×16位)用于副本音频 样本; 
-20/4:4个数据样本的同步信号,3个数据样本(总共12位,比特)用于长度,并且2×5个数据样本(2×20位)用于副本音频样本 
-22/2:2个数据样本的同步信号,6个数据样本(总共12个位)用于长度,并且2×11个数据样本(2×22位)用于副本音频样本。 
关于其它格式(例如16位PCM音频,具有14/2格式),能够定义类似的结构。 
图8示出将两个所得数字数据集编码成第三数字数据集。 
以与在图4中所述相同的方式执行编码。 
既然第一中间数字数据组61具有保留区域62并且第二中间数字数据集71也具有保留区域72,现在将两个数字数据集相加产生了具有辅助数据区域81的第三数字数据集80。 
在这个辅助数据区域81中,能够放置另外的数据。 
当利用并不知晓存在这个辅助数据区域81的装备再现第三数字数据集80时,在这个辅助数据区域81中的数据将被这种装备解释成是将被再现的数字数据集的较低有效位。 
被置于这个辅助数据区域81中的数据将因此向信号引入在很大程度上觉察不到的、轻微的噪音。这个觉察不到性当然依赖于被选择为这个辅助数据区域81保留的较低有效位的数目,并且本领域技术人员易于选择的将被使用的较低有效位的适当数量从而平衡在辅助数据区域81中的数据存储要求和所导致的在数字数据集中的质量损失。显然,在24位音频系统中,专用于辅助数据区域81的较低有效位的数目能够高于在16位音频系统中的数目。 
为了使得能够对这些混音音频通道进行逆(或者解混音)操作,有限数目的样本的副本拷贝被存储。 
虽然在以上实例中,仅仅单一种子数值样本即样本的副本拷贝被使用和存储,但是存储多个种子数值样本是有利的,因为这样提供了冗余。这个冗余是由于所被存储的种子数值的重复性质,该重复性质允许通过在流中提供新的开始点而从误差恢复,同时由于以下事实, 即能够存储用于每一个开始位置的两个种子数值。种子数值A0和B1允许检验开始位置,这是因为以A0开始的计算将产生数值B0,数值B0然后能够被与所被存储的种子数值相比较以进行检验。进一步的优点在于,A0和B1这两者的存储允许搜索两个种子数值属于它的正确的开始位置,允许在种子数值和数字数据集C之间自动同步,这是因为很可能在于其中使用种子数值A0解码的位置处将准确地产生等于所被存储的种子数值B1的数值B1。 
当开始时,例如,从24(Z)位96kHz采样信号降低到18(Y)位48kHz,并且每毫秒(msec)产生一个样本的副本,即每毫秒一个种子数值,每个通道混音1000个18位样本副本,即种子数值。如果这个混音包括2个通道,则每秒将需要用于样本副本“存储”的2×1000×18位或者36K个位。因为产生了第一额外“空间”-在每秒96K下,每一样本6(X)位,所以在由较低有效位形成的辅助数据区域中,每秒6×96=576K位是可用的,其中能够容易地存储样本数值的这些副本拷贝。事实上,存在可被用于存储这些拷贝的16x存储器,并且因此如果在这个辅助数据区域中将不存储任何其它信息,则能够以每毫秒16次的速率存储这2个通道的副本样本。如果选择了用于Z/Y/X的其它数值,例如在96kHz下24/20/4或者在44.1kHz下16/14/2,则通过使用最低有效位产生的“自由”辅助数据区域的数量将是不同的。以实例形式给出下面的情形,但是本发明不限于这些其它的使用情形;在在96kHz下24/20/4的2个通道,并且每秒4×96=392K位存储器要求每毫秒2×1000×20=40K位用于副本样本,能够以每毫秒9.6次的速率存储副本样本。在在44.1kHz下16/14/2的2个通道,并且每秒2×44.1=88.2K位存储器要求每毫秒2×1000×14=28K位用于副本样本,能够以每毫秒3.15次的速率存储副本样本。在这里述及的实例将由样本的较低有效位形成的辅助数据区域专门地用于从初始(分辨率和频率降低)音频流再现样本。由于如在这里使用的技术的性质和特征,不仅仅使用这个“自由”辅助数据区域用于存储副本样本是有益的,虽然这些样本副本是由解混音过程 或者解码器使用的基本信息。 
在基本技术中,如在图2-8中解释地,首先降低2个PCM音频流A(A0,A1,A2)和B(B0,B1,B2)的位分辨率,以产生2个新的流A′(A′0,A′1,A′2)和B′(B′0,B′1,B′2)。接着,这些流的采样频率被降低为初始采样频率的一半,从而给出A″(A″0,A″1,A″2)和B″(B″0,B″1,B″2)。这个最后的操作引入了误差,其中A″21=A″2i+1=A′2i产生了误差E2i+1=A′2i+1-A′2i并且B″2i+1=B″2i+2=B′2i+1(B″0=B′0)产生了误差E2i+2=B′2i+2-B′2i+1(E0=0)。这个误差系列(E0,E1,E2,E3...)含有由于音频流B的采样降低而产生的具有偶数索引的误差和因为音频流A的采样降低而产生的具有奇数索引的误差。高级编码将近似这些误差并且使用这些近似以在混音之前减小误差。作为混音的一个部分,作为在样本的较低有效位中的辅助数据区域中建立的分离的通道添加近似误差(被表示成真正误差的倒数)E′。这样,利用样本(Z=A″+B″+E′),混音信号被定义成Zi=Ai″+Bi″+Ei′。如果误差流能够被准确地近似,则E′=E,其中Z2i=A2i″+B″2i+E2i=A′2i+B′2i-1+B′2i-B′2i-1=A′2i+B′2i,并且Z2i+1=A2i+1″+B″2i+1+E2i+1=A′2i+B′2i+1+A′2i+1-A′2i=A ′2i+1+B′2i+1。在这种情形中,在最终混音流中不产生任何采样降低误差。 
图9示出将第三数字数据集解码回两个分离的数字数据集。 
正如在图5中描述的常规解码那样,执行通过增强编码,即较低有效位81被用于存储另外的数据而获得的数字数据集80的解码,但是解码器仅仅提供每一个样本的有关的位A0″,A1″,A2″,A3″,A4″,A5″,A6″,A7″,A8″,A9″,B0″,B1″,B2″,B3″,B4″,B5″,B6″,B7″,B8″,B9″,即并非较低有效位。解码器能够进一步恢复在较低有效位中的辅助数据区域81中存储的另外的数据。如在图20中解释地,这个另外的数据能够随后被传送到另外的数据的目标。 
一旦解码器将这些副本样本、种子数值重构,则这些副本样本(种子数值)然后便被用于解混音混音通道。混音通道例如是PCM流A″和B″的混音,其中A″2i=A″2i+1=A′2i并且B″2i+1=B″2i+2=B′2i+1。A′0和 B′1将被用作副本样本并且被编码成数据块。 
作为在图5中解释的方法的替代,其中仅仅使用一个种子数值,能够如下地实现从A″+B″解混音(单音)信号:A″+B″样本是:A″0+B″0,A″1+B″1,A″2+B″2,A″3+B″3,A″4+B″4,A″5+B″5。因为我们具有A″0=A′0&B″1=B′1的拷贝,所以我们能够重构A″&B″流。 
1.利用A″0+B″0-(A″0=A′0),我们从副本样本得到B″0并且得到A″0; 
2.利用A″1+B″1-(B″1=B′1),我们从副本样本得到A″1并且得到B″1; 
3.利用A″2+B″2-(B″2=B″1),我们得到A″2和B″2=B″1; 
4.利用A″3+B″3-(A″3=A″2),我们得到B″3和A″3=A″2; 
5.利用A″4+B″4-(B″4=B″3),我们得到A″4和B″4=B″3; 
6.利用A″5+B″5-(A″5=A″4),我们得到B″5和A″5=A″4; 
7.... 
在媒体格式如HD-DVD或者BLU-RayDVD上,能够作为复用PCM音频流存储多通道音频。在这些通道的每一个上使用如在以上解释的混音/解混音技术,能够容易地再现该多个通道(从6或者8到12或者16)。这允许通过在每一个地面扬声器上方增加顶部扬声器而存储或者形成第3维度的音频记录或者再现,而不要求用户具有解码器来收听该音频的“2维”版本,这是因为在多通道音频轨道上存储的音频仍然是100%的PCM“可播放”音频。在这最后一种再现模式中,将不产生第3维度的效果,但是它也不会降低2维音频记录的可察觉质量。 
图10示出一个实例,其中描绘了如通过在图6中描述的编码获得的第一个流A的样本。 
例如,假设将对2个单音96kHz24位数字音频流A&B进行处理。 
A=初始样本(24位),A′=被舍入样本(18H有效位&6L位=0),A″=采样频率降低样本。 
在图10中,在图表中以暗灰线示出第一音频流A。A的样本是: A0,A1,A2,A3,A4,A5...每一个样本的分辨率是被表示成24位带符号整数数值的每样本24(Z)位,所以数值范围从-2(Z-1)到(2(Z-1)-1)。从这个样本系列,我们将分辨率降至18(Y)位,清除6(×)最低有效位以形成用于编码数据的“空间”。降低是通过使用总共Z个中的仅仅Y个最高有效位将所有的Z位样本舍入成它们的最接近的表示而实现的。至此,每一个样本被加上(2(X-1)-1),每一个总数被限制为(2(Z-1)-1)或者被表示成[](2(Z-1)-1)。接着,利用逐位AND((2(Y)-1)向左逐位移位X位),我们将6(X)个最低有效位设为0,这样,我们产生了一个新的流A′(浅灰)。A′的样本是:A′0,A′1,A′2...其中A′i=[Ai+(2(X-1)-1)](2(Z-1)-1)AND((2(Y)-1)<<X)。 
在降低样本分辨率之后,我们还以因子2降低采样频率(在我们将混音多于2个通道的情形中,我们需要以等于所被混音的通道数目的因子降低采样频率)。至此,我们重复初始流A′的每一个偶数样本。在样本频率降低之后,我们得到新的流A″。A″的样本是:A″0,A″1,A″2,...其中A″2i=A′2i+1=A′2i。 
在索引(下标)2i处的A″的所有偶数样本与在索引2i处的A′的初始数据相同,并且在索引2i+1处的A″的所有的奇数样本是在索引2i处的A″的先前样本的副本。 
图11示出一个实例,其中描绘了如通过如在图7中描述的编码获得的第一个流B的样本。 
B=初始样本(24位),B′=被舍入样本(18H有效位&6L位=0),B″=采样频率降低样本。 
在图11中,在图表中以暗灰线示出第二音频流B。同一样本分辨率降低被应用于这个流。B的样本是:B0,B1,B2,B3,B4,B5,...从这个样本系列,我们产生新的流B′(浅灰)。B′的样本是:B′0,B′1,B′2,...其中: 
B′i=[Bi+(2(X-1)-1)](2(Z-1)-1)AND((2(Y)-1)<<X)。 
在降低样本分辨率之后,我们也类似地以因子2降低采样频率 并且我们得到新的流B″。B″的样本是:B″0,B″1,B″2...其中:B″2i+1=B″2i+2=B′2i+1。 
在索引2i+1处的B″的所有奇数样本均与在索引2i+1处的B′的初始数据相同,并且在索引2i+2处的B″的所有偶数样本都是在索引2i+1处的B″的先前样本的副本。 
图12示出混音流C的样本。 
A+B=初始样本(24位),A′+B′=被舍入样本(18H有效位&6L位=0),A″+B″=采样频率降低样本。 
两个流A+B被混音(被相加)以得到新的流(暗灰)。将流A″和B″混音(相加)则我们得到另一个流(浅灰)。对于每一个样本,A″+B″将不同于A+B并且不同于A′+B′,这是因为,由于位分辨率降低(舍入),A″或者B″可以不同于初始样本A和B,并且由于样本降低而可以不同于分辨率降低样本,但是通常,由于初始的高位分辨率和高采样频率,我们仍然具有初始A+B(暗灰)流的良好感知近似。 
图13示出被本发明引入PCM流的误差。 
由于舍入样本,而Error=Errors,由于舍入样本+频率降低,而Error′=Errors。 
图14示出组合式数字数据集的样本的较低有效位中的辅助数据区域的格式。 
最终,为了使得解码器能够解混音混音音频PCM数据,解码器要求在它接收到音频PCM样本之前具有音频PCM样本的副本样本,从而能够利用流式音频PCM实时地执行解混音操作。至此,我们需要将数据块的这个数据(保持音频样本的副本样本、同步信号模式、长度参数...)置于也带有与先前数据块有关的音频PCM信息的样本(Z位)中。为了给予解码器解码这些数据块的时间,它们甚至可以在被用于从其采取副本的音频PCM样本之前结束几个音频PCM样本。在数据块的末端和被用于作为副本样本拷贝的音频PCM样本之间的音频PCM样本的数目是Offset(偏移),这是在数据块中存储的另一个参数。有时这个偏移可以是负的,这说明在音频PCM流中 的副本样本的位置位于用于携带那个数据块的音频PCM样本中。对于偏移,我们也将使用12位数值(带符号整数数值)。 
数据块包括: 
1.同步信号模式 
2.数据块长度 
3.参考那个数据块的终端的音频PCM样本偏移。 
4.音频PCM样本的副本(对于每一个混音通道存在一个)。 
通过包括允许(部分)否定通过样本等化引入的误差的校正信息而实现了进一步优点。 
在图14中,在时间0,编码器开始读出2xU X位样本,它们被降至Y位(比特)以形成用于保持数据块的辅助数据区域。样本频率降低产生了误差,该误差被近似并且被参考这些近似的列表替代。除了被有效地压缩的这个数据之外--产生数据块头(同步信号、长度、偏移...等),从而形成U′个样本的数据块长度。这些数据样本被置于第一U个样本的数据段中。在下面的步骤中,编码器读出U′(<U)个样本,从而产生(未被压缩地)要求U个样本、而在压缩之后要求U″个样本的数据块。同样,这个数据块被联结到先前的数据块并且在该实例中(仍然)使用初始U(X位)样本中的一些样本。编码器读出U′..′X位样本并且产生相应的数据块的过程继续,直至所有的数据均已被处理。 
图15示出辅助数据区域的更多细节。 
AUROPHONIC Data Carrier Format(数据载体格式)符合下面的结构。 
它是位精确音频/数据流150,通常为PCM流150,其中数据被划分成Z个样本的段158、159。在段158、159中的每一个样本均由X个位构成。(对于音频CD/DVD数据,X通常将是16位,或者对于BIu-Ray/HDDVD音频数据,是24位)。最高有效位(Y个第一位,对于例如Blu-Ray,通常是18或者20个位)保持音频数据(能够是PCM音频数据),最低有效位(Q个最后的位,例如对于Blu-Ray, 通常是6或者4位)保持AURO解码数据。 
以如下方式地组织在每一个数据块156、157中如在解码期间使用的AURO另外的数据: 
它包括同步信号段151、通用解码数据段154、可选地索引列表152和误差表格153,并且最后是CRC数值155。 
同步信号部分151被预定义成滚动位模式(尺寸依赖于用于AURO数据宽度的Q位数目)。通用数据154包括有关AURO数据块的长度的信息,须在其上应用AURO解码数据156的第一音频(PCM)数据158的准确偏移(相对于同步信号位置151),第一音频(PCM)数据样本(对于每一个通道编码存在一个)的拷贝,衰减数据和其它数据。可选地(根据在编码过程期间的AURO质量选择),这个AURO解码数据156、157也可以包括索引列表152和保持在编码步骤期间产生的所有误差近似的误差表格153。此外,也可选地,索引列表152和误差表格153可被压缩。通用解码数据段154将指示这种索引列表152和误差表格153是否存在,包括有关所应用的压缩的信息。最后,CRC数值155是使用音频PCM数据(Y位)和AURO数据(Q位)这两者计算的CRC。 
AURO解码器的一个特征在于它的极低等待时间。解码仅需2个AURO(PCM)样本的处理延迟。必须在传输AURO解码数据需被应用到其中的PCM音频数据158之前传输和处理(例如解压缩)AURO数据块156、157信息。结果,AURO数据块156、157(最低有效位)被与音频PCM数据159(最高有效位)融合使得来自一个块的最后的AURO数据信息154、155总是不晚于AURO数据信息被应用于其中的第一(PCM)音频数据样本。 
执行通道的解混音操作的解码器使用同步信号模式以允许它定位例如副本样本并且将它们关联到匹配初始样本。对于每个样本,这些同步信号模式也能够被置于6(X)位中,并且应该是能够被解码器容易探测到的。“sync(同步信号)”模式能够是几个6(X)位长“keys(密钥)”的序列的重复模式。例如,通过使得单一位从最低有效位 置移位到最高有效位置,或者二进制被表示成:000001,000010,000100,001000,010000,100000。能够基于样本的特征选择其它位模式从而避免该同步信号模式以可感知方式影响样本,或者该样本影响同步信号模式探测。这样,能够对于所有不同的样本分辨率组合(24/22/2,24/20/4/,24/18/6,24/16/8,16/14/2...)定义一致的同步信号模式。这些模式还能够被优化以消除当被不使用这种AURO-Phonic解码器的DVD-播放器播放时从音频样本的最低有效位产生的“噪音”。 
图16示出一种情形,其中适配导致可变长度AURO数据块。进一步要求解码器在它处理混音音频样本之前接收数据块的信息,这是因为,它必须解码数据块(包括解压缩)并且需要访问这些(近似)误差从而执行解混音操作。将利用包含近似的表格和参考列表对误差流样本(从那个第2n块)近似(使用K-中值或者Facility Location设施定位算法)以将那个误差流段的每一个样本关联到那个近似表格的一个元素。这个参考列表构成近似误差流。这个列表和具有近似数值的表格均被压缩器压缩,数据结构的其它剩余元素由格式化器定义(如同步信号模式、数据块长度、偏移、副本音频样本、衰减等。)从而(极有可能地)将以少于U的数据样本结束,我们将该样本数目称为W(W<=U)。可以预期数值W通常比U小20%到50%。接着,这个数据块被格式化器置于第一U个样本的数据空间中。这保证了在它接收到匹配音频样本之前解码器将能够使用这些数据样本。因为我们可以已经节约了(U-W)个数据样本以便以后的使用,所以将被编码(这是混音和误差近似)的下一个音频段应该仅仅包含W个音频样本(<=U)。即便用于这个段(W个音频样本的)的数据块应该要求U个数据样本,也保证了在它参考的第一音频样本之前终结这个数据块。进而,因为更小数目音频样本(W<=U),所以我们可以预期对于样本频率降低误差的近似是更好的,这是因为必须近似更小数目的误差数值。这样,由音频样本的下一个段的更好近似来使用压缩增益。再次地,数据块的这个最后的段能够小于U,例如W′(<=U)从 而下一个将被编码的音频样本的数目能够进而也被限制为W′。 
进一步应该理解,根据压缩质量,数据块的尺寸将改变。因此,偏移参数(数据块结构的一个部分)是用于将尺寸变化的数据块关联到相应的第一音频样本的重要参数。从已经利用偏移参数而被关联到数据块的第一音频样本开始,数据块自身的长度匹配在解码期间需要的音频样本的数目。当在特定情形中解码器相对于它接收到第一匹配音频样本的瞬时可能需要更多时间开始数据块解码时,如果需要则甚至可以加上这个偏移参数(并且数据块在时间上更加向后地移位)。进一步应该理解,解码器应该至少实时地执行数据块解码,这是因为这种延迟可以不增加。 
本发明的另一个特征在于,解码器将容易地停留在带有同步信号参考的同步信号中并且进而自动地探测已被使用的编码格式(探测被用于同步信号模式/样本副本的音频样本的位数)。至此,我们作为编码数据的一个部分在同步信号模式的每一个第一字之间包括样本数目。我们还要求同步信号模式在至多4096×2(2=混音通道数目)个样本之后重复。这将数据块(同步信号模式+样本副本数据)的最大长度降至4096×2个样本,从而要求12个位来存储每一个数据块的这个长度。使用这个信息,并且给定不同编码分辨率例如对于24位PCM样本:22/2,20/4,18/6,16/8,解码器应该能够容易地自动识别编码格式,探测同步信号模式及其重复。 
由样本的较低有效位形成的数据区域中嵌入辅助数据能够与组合/分离机构独立地使用。同样在单一音频流中,能够产生这个数据区域而不在听觉上影响辅助数据被嵌入其中的信号。如果没有进行任何组合,对由于样本频率降低(样本等化)引起的误差嵌入误差近似仍然是有益的,这是因为它也允许降低样本频率(因此节约存储空间),仍允许如解释的那样使用误差近似良好地重构初始信号以应对样本频率降低的影响。 
图17示出包括所有的实施例改进的编码。 
所示的框对应于方法步骤并且同等地对应于编码器的硬件块并 且示出在硬件块之间的以及在方法步骤之间的数据流。 
编码处理步骤。 
在第一步骤中,首先通过舍入(rounding)音频样本(24→18/6)将音频流A,B降至A′,B′。 
在第二步骤中,在这些流上应用动态压缩而预混音(使用衰减数据)已被降低的流以避免音频限幅(A′c,B′c)。 
在第三步骤中,以等于混音通道(A′C′,B′C′)数目的因子降低样本频率从而引入误差流E。在第四步骤中,利用E′近似误差流E:使用2(Z-1)个中心(例如K-中值近似)和用于这些中心的参考列表。 
在第五步骤中,表格和参考被压缩,定义了采样衰减(音频样本开始),块头(同步信号,长度......,crc)。在第六步骤中,流(A′C′,B′C′,E′)被混音,包括最终对于限幅(音频过冲)进行检查,这个检查可能要求微小变化。在第七步骤中,数据块段(6位样本)与音频样本融合。 
图17给出如在前面部分中解释的处理步骤组合的概略示意。应该理解,当在离线状况中应用时,这个编码过程最容易工作,编码器能够访问它必须在任何时候处理的所有的流的相应的部分的样本。所以,要求音频流的部分至少被暂时地存储在例如硬盘上从而编码器过程能够搜寻(前后地)以使用它为了处理那个部分而需要的数据。在图17的解释中,作为实例使用这样一种情形,其中24位样本(X/Y/Z)=(24/18/6)被划分成18位样本数值和6位数据数值,该6位数据数值是保持控制数据和种子数值的辅助数据区域的部分。 
块长度-为了一般化,将被称作U。 
编码过程的第一步骤<1>(如在关于基本技术的部分中解释的)是通过将每一个样本舍入成它的最接近的18位表示,而利用样本尺寸降低器在两个流A161a和流B161b上将样本分辨率例如从24降低到18位。作为这种舍入的结果的这些流163a、163b被称作流A′163a和流B′163b。同时地,利用从输入接收所期望的衰减数值161c的衰减器控制器来确定衰减。 
第二步骤<2>是利用衰减操纵器在这些流163a,163b上进行混音模拟以分析混音是否可能引起限幅(clip)。如果需要在混音之前衰减一个流163b,在AURO-PHONIC编码的情形中通常是第3维音频流,则衰减操纵器应该在这个混音模拟中对这个衰减加以考虑。如果尽管这种衰减,混音两个(96kHz)流163a、163b仍将产生限幅,则由衰减操纵器执行的编码过程的这个步骤将执行平滑压缩(朝向限幅点逐渐地增加音频样本的衰减并且接着逐渐地将其降低)。这个压缩可以被衰减操纵器应用于流163a、163b这两者,但是这不是必要的,因为在一个流163b上的(更多)压缩也能够消除这个限幅。当被应用于这些流A′163a和流B′163b时,衰减控制器产生新的流A′c165a和流B ′c165b。用于防止限幅的这个衰减的效果将存留于最终的混音流169中,以及解混音流中。换言之,解码器将不会补偿这个衰减以产生初始流A′163a或者初始流B′163b,而是它的目标将是产生A′c165a和B′c165b。在控制这种(Aurophonic)记录期间,如果需要,记录工程师能够定义衰减水平161c并且经由输入而将其提供给衰减控制器以控制当被向下混音成2维音频再现时期望的第二流163b(通常第3维音频流)的衰减。 
在下面的步骤<3>中,频率降低器以等于通道混音(A′C′,B′C′)的数目的因子降低样本频率,从而引入误差流E167。能够例如如在图2和3,或者6和7中解释的那样执行频率降低。 
在下面的步骤<4>中,利用由误差近似器产生的E′162近似误差流E167:使用2(Z-1)个中心(例如K-中值近似)和用于这些中心的参考列表。 
在高级编码/解码部分中,解释了在能够无误差地近似这个误差流167的条件下,在混音和解混音操作中的误差167(由于样本频率降低)能够得以避免。在这个具体实例(X/Y/Z)=(24/18/6)和V=32(2(Z-1))近似中,很有可能的是,当我们在数据块中仅仅具有V个样本时,不存在任何误差(除了由于误差的12位表示引起的限制),从而存在这些误差到这些“近似”的一一映射。在另一方面,我们还定 义了数据块的最大长度U,这在任何情况下将保证在这种数据块中误差参考列表和近似表格将是“能够被编码的”。因此这个编码步骤将起初地从两个流A′c′165a和B′c′165b并且从误差流E167要求数目为U的样本。 
首先,选择误差样本的宽度(这是用于代表这个误差信息的位数)。因为基本流是来自音频记录的PCM数据,所以可以预期在2个相邻样本之间的误差或者差异与最大(或者最小)样本相比是较小的。对于(例如)96kHz音频信号,仅当音频流含有具有非常高的频率的信号时,这个误差才能够是较大的。如之前解释的那样,在本说明中,使用24位PCM流,对于每一样本被降低成用于音频的18个位并且产生用于6个数据位的空间。如在基本技术中解释的那样,使用这些数据位以存储同步信号模式、数据块的长度、偏移、将被确定的参数、2个副本样本(当混音2个通道时),被压缩的“误差索引列表”、被压缩的误差表格和校验和。将在下面解释“误差索引列表”和误差表格。在24/18/6的实例中,每样本6个位可用于辅助数据区域并且每样本6个位根据需要在理论上能够定义具有26=64个误差的表格。在24/18/6的这个实例中,误差表示将被限制为带符号的2x6位整数。 
带有6位的U个样本的辅助数据区域中的数据块的部分内容(24/18/6-对于数据块的每一个样本,存在一个音频(混音)样本)是具有由于这些流的样本频率降低而产生的误差近似的表格。如之前述及的那样,将使用2个6位数据样本近似误差。因为没有足够的“空间”以存储用于每一个误差的近似,所以需要定义尽可能地接近所有的这些误差的误差′数值的有限数字。接着,产生列表,该列表包括用于辅助数据区域中的数据块中的误差′流′的每一个元素的对于这些近似误差的引用。除同步信号、长度、偏移、样本副本等...之外,需要空间以在数据块中存储具有近似误差′的表格。这个表格能够被压缩,以限制用于数据块的存储器,并且进而参考列表也能够被压缩。 
首先,将探究从误差流近似这些元素的方式。需要被定义的是数 目为K的数值,从而流的每一个元素(但通常是在数据块中的数据所对应的该流的一个部分)能够被与这些数值之一关联并且从而误差总和(这是误差流的每一个元素与它的最好(最接近)近似数值误差的绝对差异)尽可能小。能够使用其它“加权”因子以代替绝对值,例如这个绝对值的平方或者定义对于感知音频特征加以考虑的定义。从一系列数值-在此情形中被定义成由于2个混音通道的样本频率降低而产生的误差发现这样的K个数字被定义成K-中值目标。来自误差流的元素的组需被聚集,并且需要识别K个中心使得从每一个点到它的最近中心的距离之和最小。 
在文献例如设施定位算法中,类似的问题及其方案也是已知的。进而,在本文中需要考虑“流化”方案以及非流化方案。前者将意味着“编码器”对于从寿命音频流混音产生的寿命(和实时)误差仅仅具有一次和一遍访问。后者(非流化)将意味着编码器对于它要求处理的数据具有“离线”和连续访问。由于输出数字数据流(具有18位音频样本和6位数据的音频PCM流)的结构,来自辅助数据区域的数据块在它所对应的音频样本之前被发出,产生用于非流化使用K-中值或者设施定位算法情形的状态。因为在公开文献中很多的这些算法都是可用的,所以本发明的目的并非定义一种新的数据分组算法,而是作为用于技术实施人员的方案参考这些算法。[例如见Clustering DataStreams:Theory and Practice(分组数据流:理论和实践),IEEETRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING,VOL.15,NO.3,2003年5月/6月]。 
一旦这K个中心或者误差近似已被确定,便产生列表,其中来自混音的误差流的L个元素被对于那个表格中的元素的L个参考替代,从而包含K个近似(或者中心)。因为对于每一个音频样本,数据的6个位是可用的,所以对于误差流的特定部分能够对于在那个部分中的所有不同误差定义K=64个不同的近似。然后能够依赖于具有L个参考的列表的无损压缩,从而在压缩之后最终产生M×6位数据样本,和N个“自由”6位数据样本,其中L=M+N。辅助数据区域的 自由空间本可被用于存储误差近似以及同步信号模式、数据块的长度,等。然而,因为在这个具有L个参考的列表中的数值能够是一系列的真实随机数字,所以不应该依赖于对于这个列表的压缩,而是实际上保证这个列表是可压缩的。因此,在X/Y/Z的情形中,并且在该实例中X=24,Y=I8,Z=6,使用不多于32=2(Z-1)个近似。这样,为了参考这个表格,仅仅需要(Z-1)个位,并且能够容易地证明这种参考列表是可压缩的;5*6位数据样本能够保持对于这个表格个6个参考(每一个需要5位)。在24/18/6的情形中,如在基本技术部分中解释的那样,总共至少需要86个数据样本来存储不包括参考列表的所有的数据。(6个(6比特)样本用于同步信号,2个(6比特)样本用于数据块长度,2个(6比特)样本用于偏移,6个(6比特)样本用于每一个18位的2个音频样本副本,2个(6比特)用于衰减,将被限定的2个(6比特)数据,至多64个(6比特)样本用于32个误差近似...如果不可压缩,则2个(6比特)样本用于CRC)。给定至少将6个压缩成5个的压缩比(给出1个自由数据样本),需要至多6×86=516个样本。这个总和还为24/18/6的这个模式限定了最大数据块长度。将近似数目限制为例如16,产生了总共86到54的降低,至少6个被压缩成4个的参考列表的最小压缩比和3×54=162个数据样本的最大数据块长度。或者,通过将误差宽度延伸到3x6位,产生了118个数据样本以存储除了参考列表之外的所有的数据(这将要求总共708=6×118)。然而,在大多数情形中,因为在上面仅仅考虑了一种最差的情形,所以进一步压缩这个数据的压缩是现实的;例如以25%(4位降低到3位)压缩,这是用于误差近似表格的典型压缩比。对于具有32个误差近似的近似,这个特大比率会将数据块长度降低超过50%;来自(32)个误差近似的64个数据样本将被降至48个数据样本,从而总计(不含参考列表)被降至70。进一步,对于参考列表的另外的20%-25%的压缩,将这个列表从6位压缩到5位,进一步压缩至4位,从而产生总共具有3×70=210个数据样本的数据块长度。结果,能够利用对于32个误差近似的参考流近似具有 由于混音音频流样本降低而产生的210个误差的误差流。 
对于具有仅仅16个误差近似的24/18/6的情形,并且采取相当的压缩比,产生了要求3×46=138个数据样本的误差流。 
最后-基于以上实例-但是并不限于这些实例-在这里介绍的压缩格式使得能够以如此方式近似误差流,使得在混音样本频率被降低的音频流时,能够对这个近似加以考虑,这将显著地减小由于这个样本频率降低而引起的误差。使用这些压缩误差近似允许以显著的精度重构这两个被混音的PCM流,从而使得由于组合和分离这两个PCM流而引入的误差很大程度上是觉察不到的。 
进一步要求,解码器在它处理混音音频样本之前接收数据块的信息,因为它必须解码数据块(包括解压缩)并且需要访问这些(近似)误差从而执行解混音操作。这样,在这个编码步骤的第一阶段中,还将需要来自流A′c′165a和B′c′165b以及来自误差流E167的具有数目为U的样本(=段)的第二个块。将利用含有V(=32)个12位近似的表格和参考列表近似(使用K-中值或者设施定位算法)误差流样本(来自该第2n块),以将这个误差流部分的每一个样本关联到那个近似表格的元素。这个参考列表构成近似误差流E′162。 
在组合步骤<6>中,利用组合器/格式化器混音流(A′c′,B′c′,E′)。这个组合器/格式化器包括另外的限幅分析器以关于限幅(音频过冲)执行最终检查,这个检查可能要求微小的变化。 
组合器/格式化器将另外的数据例如衰减,种子数值和误差近似添加到在由样本尺寸降低器产生的组合数据流中的适当数据块的辅助数据区域,并且向编码器的输出提供包括组合流的输出流169,与音频样本融合的数据块部分。 
降低将通过限幅而被引入的误差。 
本发明的另一个方面在于在被有效地混音之前预处理音频流。当这些信号被混音到一起时,两个或者更多的流能够产生限幅。在这种情形中,预处理步骤在被混音通道之一上或者甚至在两个通道上包括动态音频压缩器/限制器。这能够通过在这些特殊事件之前逐渐地增加 衰减,并且在那些事件之后逐渐地降低衰减而得以实现。这个方案将主要被应用于编码处理器的非流化模式中,这是因为,它要求(提前)将产生这些过冲/限幅的样本数值。能够在音频流自身上处理这些衰减并且因此以当被解混音时这些压缩器效果将仍然是解混音流的一个部分的方式避免限幅。除避免(混音)音频的限幅之外,被向下混音的3D到2D音频记录必须是当不存在任何解码器(如在本发明中描述地)时是可使用的。因此,在混音音频流上使用动态音频信号压缩(或者衰减)以减少过多地干扰基本的2维音频的另外的音频(从第3维),但是通过存储这些衰减参数,在解混音之后能够执行逆操作从而恢复正确的信号水平。如上所述,由样本的较低有效位形成的辅助数据区域的数据块结构含有至少8位的用于保持这个动态音频压缩参数(衰减)的部分。此外,根据分析(见样本频率降低误差校正),能够推出,关于具有32个元素和12位误差宽度的误差表格的24/18/6的典型情形,数据块的最大长度是大致500个样本。在96kHz的采样速率下,这个部分是大约5毫秒的音频,它因此成为衰减参数的定时间隔尺寸。衰减数值自身利用8位数值表示,当不同的dB衰减水平被分配给每一个数值(例如:0=0dB,1=(-0.1)dB,2=(-0.2)dB...)时,能够依赖于这些数值和时间步长以实现平滑的压缩曲线,在解码操作期间该压缩曲线能够被反向地使用以恢复正确的相对信号水平。 
在音频流的较低有效位中存储衰减数值当然也能够被应用于单一流,其中一些分辨率位在该情形中被牺牲掉以在流中增加信号的总体动态范围。可替代地,在混音流中,能够在数据块中存储多个衰减数值从而每一个数据流均具有相关的衰减数值,因此对于每一个信号各自地限定回放水平,然而对于每一个信号即使在低信号水平下也保持分辨率。 
另外,衰减参数能够以如此方式用于混音3维音频信息,使得不使用这些3维音频信息的消费者听不到另外的3维音频信号,这是因为这个另外的信号相对于主要的2维信号被衰减,同时知道该衰减数值允许恢复(retrieve)另外的3维信号的解码器将已被衰减的3维信 号分量恢复(复原,restore)成它的初始信号水平。通常这要求在将其混音成2维音频PCM流之前,例如以18dB衰减第3维音频流,以避免这个音频信息“控制”“正常”的音频PCM流。这要求另外的(8位)参数以定义在它与另一音频流混音之前在第3维音频流上使用的衰减(对于音频流的每一个部分-被定义成数据块的长度)。在通过放大第3维音频流解码之后,该18位衰减能够被取消。 
图18示出AUROPHONIC编码器设备。 
AUROPHONIC编码器设备184包括AURO编码器的多个实例181、182、183,每一个均使用在图1-17中描述的技术混音1个或者更多音频PCM通道。对于每一个Aurophonic输出通道,一个AURO编码器181、182、183实例被启动。当提供仅仅1个通道时,没有任何通道需被混音并且编码器实例应该不被启动。 
Aurophonic编码器184的输入是多个音频(PCM)通道(音频通道1到音频通道X)。对于每一个通道,附加关于它的位置(3D)及其当被向下混音成更少的通道时使用的衰减的信息(位置/衰减)。Aurophonic编码器的其它输入包括决定哪些音频PCM通道被向下混音成什么Aurophonic输出通道的音频矩阵选择180和被提供给每一个AURO编码器181、182、183的Aurophonic编码器性质指示器。 
3D编码器的典型输入通道是L(前左)、Lc(前左中心)、C(前中心)、Rc(前右中心)、R(前右)、LFE(低频率效果)、Ls(左环绕)、Rs(右环绕)、UL(上前左)、UC(上前中心)、UR(上前右)、ULs(上左环绕)、URs(上右环绕)、AL(艺术-左)、AR(艺术-右)...。 
如由编码器提供并且能够与2D再现格式相兼容的典型输出通道是AURO-L(left左)(Aurophonic通道1)、AURO-C(center中心)(Aurophonic通道2)、AURO-R(right右)(Aurophonic通道...)、AURO-Ls(left surround左环绕)(Aurophonic通道...)、AURO-Rs(right surround右环绕)(Aurophonic通道...)、AURO-LFE(Low Freq uency Effects低频效果)(Aurophonic通道 Y)。 
如由编码器184的输出提供的AURO编码通道的实例: 
(AURO-L、AURO-R、AURO-Ls、AURO-Rs)。 
AURO-L可以包含初始L(前左)、UL(前上左)&AL(艺术-左)PCM音频通道,AURO-R将是类似的但是用于前右音频通道,AURO-Ls保持Ls(左环绕)&ULs(上左环绕)音频PCM通道,AURO-Rs是等价的右通道。 
图19示出Aurophonic解码器设备。 
AUROPHONIC解码器194包括使用在图5和10中描述的技术解混音1个或者更多音频PCM通道的、AURO解码器的多个实例191、192、193。对于每一个AURO输入通道,AURO解码器191、192、193实例被启动。当AURO通道包括仅仅1个音频通道的混音时,解码器实例应该不被启动。 
AUROPHONIC解码器的输入接收Aurophonic(PCM)通道Aurophonic通道1...Aurophonic通道X。对于每一个通道Aurophonic通道1...Aurophonic通道X,作为解码器的一个部分的辅助数据区域解码器将自动探测是否存在PCM通道的AURO数据块的同步信号模式。当探测到一致的同步信号时,AURO解码器191、192、193开始解混音AURO(PCM)通道的音频部分,并且同时解压缩(如果需要)索引列表和误差表格,并且将这个校正应用于解混音音频通道。AURO数据还包括参数如衰减(由解码器予以补偿)和3D位置。3D位置在音频输出选择部分190中被用于将解混音音频通道重定向到解码器194的正确输出。用户选择音频输出通道的组。 
图20示出根据本发明的解码器。 
既然已经解释了本发明的所有方面,解码器能够得以描述,包括有利的实施例。 
用于解码如由本发明获得的信号的解码器200应该优选地自动地探测“音频”(例如24位)是否已经根据在先前部分中详述的技术而被编码。 
这能够例如利用同步信号(同步)探测器201而被实现,同步信号探测器201在所接收到的数据流中搜索在较低有效位中的同步模式。同步信号探测器201具有通过发现同步模式而对于在由样本的较低有效位形成的辅助数据区域中的数据块同步化的能力。如以上所解释地,使用同步模式是可选地但是是有利的。同步信号模式能够例如对于24位样本尺寸是2、4、6或者8位(Z-位)宽,和2、4、6或者8个样本长。(2位(比特):LSB=01,10;4位:LSB=0001,0010,0100,1000;6位:000001...,100000;8位:00000001...,10000000)。一旦同步信号探测器201已经发现这些匹配模式中的任何一个,它便“等待”直至探测到类似的模式。一旦该模式已被探测到,同步信号探测器201便进入SYNC-候选-状态。基于所探测到的同步模式,同步信号探测器201还能够确定每一样本是否2、4、6或者8个位被用于辅助数据区域。 
在第2同步信号模式上,解码器200将对数据块进行扫描以解码块长度,并且利用下一同步信号模式检验在块长度和下一同步信号模式的起点之间是否存在匹配。如果这两者匹配,则解码器200进入Sync状态。如果这个测试失败,则解码器200将一直从开始重启它的同步syncing过程。在解码操作期间,解码器200将总是比较块长度与在每一个相继同步信号块的始点之间的样本数目。一旦已经探测到差异,解码器200便离开Sync状态并且syncing过程必须重新开始。 
如在图15和16中解释地,误差校正代码能够被应用于在辅助数据区域中的数据块以保护所存在的数据。如果误差校正代码块的格式是已知的,并且辅助数据在误差校正代码块中的位置是已知的,则这个误差校正代码还能够被用于同步。因此,在图20中,为了方便起见,同步信号探测器和误差探测器被示为在块201中组合,但是它们也可以被单独地实现。 
误差探测器计算CRC数值(使用来自这个数据块的所有的数据,除了同步信号)并且将这个CRC数值与在数据块终端处发现的数值相比较。如果存在失配,则认为解码器处于CRC误差状态中。 
同步信号探测器向种子数值恢复器202,误差近似恢复器203和辅助控制器204提供信息,该信息允许种子数值恢复器202、误差近似恢复器203和辅助控制器204从如从解码器200的输入接收到的辅助数据区域中提取有关数据。 
一旦同步信号探测器与数据块同步信号头同步,种子数值恢复器便扫描数据块中的数据以确定偏移,即在数据块的终端和第一副本音频样本之间的样本数目(这个数目在理论上能够是负的)并且读出这些副本(音频)样本。 
种子数值恢复器202从所接收到的数字数据集的辅助数据区域恢复一个或者多个种子数值并且将恢复到的种子数值提供给分离器206。分离器206如在图5和9中解释地使用种子数值(一个或多个)执行数字数据集的基本分离(unraveling)。这个分离的结果或者是多个数字数据集,或者是单一数字数据集,其中从组合式数字数据集移除了一个或者多个数字数据集。这在图20中利用将分离器206连接到解码器200的输出的三个箭头示意出。 
如以上解释地,使用误差近似是可选的,因为如被分离器206分离的音频已经是非常可接受的,而不用使用误差近似以减小通过由编码器执行的等化而引入的误差。 
如果需要,误差近似恢复器203将解压缩参考列表和近似表格。如果误差近似将被用于改进被分离的数字数据集(一个或多个),则分离器206将从误差近似恢复器203接收到的误差近似应用于相应的数字数据集(一个或多个)并且将所得数字数据集(一个或多个)提供给解码器的输出。 
只要解码器200保持与数据块头同步,误差近似恢复器203便将继续解压缩参考列表和近似表格,并且将这些数据供应到分离器206以根据C=A″+B″+E′或者C-E′=A″+B″来解混音已被混音的音频样本。分离器206使用副本音频样本以开始解混音成A″样本和B″样本。对于在其中两个数字数据集已被组合的组合式数字数据集,通过加上E′2i+1来校正与A′2i和A″2i+1的那些偶数索引样本匹配的A″2i的偶数索 引样本。类似地,通过加上E′2i+1来校正与B′2i+1和B″2i+2d的那些奇数索引样本匹配的B″2i+1的奇数索引样本。在第二音频流(B)上应用逆衰减,并且通过将这些样本向左移位Z位同时在最低有效位侧中充零,两个音频样本(A′&B′)均被转换成它们的初始位宽度。重构样本作为独立的非关联音频流而被发出。 
解码器200的另一可选元件是辅助控制器204。辅助控制器204从辅助数据区域恢复辅助控制数据以及处理恢复到的辅助控制数据并且例如以用于控制机械启动器,乐器或者灯的控制数据的形式向解码器的辅助输出提供结果。 
事实上,在解码器仅仅需要提供辅助控制数据,以例如用于以对应于组合式数字数据集中的音频流的方式控制机械启动器的情形中,解码器能够被从分离器206,种子数值恢复器202和误差近似恢复器203去除。 
当解码器进入CRC-误差状态时,用户能够限定解码器的行为,例如他可以希望使得第二输出衰弱成静噪水平,并且一旦解码器从它的CRC-误差状态恢复,便使得第二输出再次衰弱。另一种行为能够是将混音信号复现到两个输出,但是在解码器的输出处提供的这些音频变化应该绝对不会引起不理想的音频坠落(plopping)或者裂化(cracking)。 

Claims (20)

1.一种用于将具有第一尺寸的第一样本(A0,A1,A2,A3,A4,A5,A6,A7,A8,A9)数字音频数据集(20)和具有第二尺寸的第二样本(B0,B1,B2,B3,B4,B5,B6,B7,B8,B9)数字音频数据集(30)组合成具有第三尺寸的第三样本(C0,C1,C2,C3,C4,C5,C6,C7,C8,C9)数字音频数据集(40)的方法,该第三尺寸小于该第一尺寸和该第二尺寸之和,所述方法包括以下步骤:
-将第一数字音频数据集(20)的第一样本子集(A1,A3,A5,A7,A9)中的每一个样本等化成第一数字音频数据集(20)的第二样本子集(A0,A2,A4,A6,A8)中的相邻样本,其中该第一样本子集(A1,A3,A5,A7,A9)和该第二样本子集(A0,A2,A4,A6,A8)交错,
-将第二数字音频数据集(30)的第三样本子集(B0,B2,B4,B6,B8)中的每一个样本等化成第二数字音频数据集(30)的第四样本子集(B1,B3,B5,B7,B9)中的相邻样本,其中该第三样本子集(B0,B2,B4,B6,B8)和该第四样本子集(B1,B3,B5,B7,B9)交错,其中第四样本子集(B1,B3,B5,B7,B9)和第二样本子集(A0,A2,A4,A6,A8)不具有任何时间相应样本,
-通过在时域中将等化的第一数字音频数据集的样本(A0″,A1″,A2″,A3″,A4″,A5″,A6″,A7″,A8″,A9″)与等化的第二数字音频数据集的对应样本(B0″,B1″,B2″,B3″,B4″,B5″,B6″,B7″,B8″,B9″)相加而产生第三数字音频数据集的样本(C0,C1,C2,C3,C4,C5,C6,C7,C8,C9),
-在该第三数字音频数据集(40)中嵌入该第一数字音频数据集(20)的第一种子样本(A0)和该第二数字音频数据集(30)的第二种子样本(B1)。
2.根据权利要求1的方法,其中,第一数字音频数据集(20)代表第一音频信号,第二数字音频数据集(30)代表第二音频信号,并且第三数字音频数据集(40)代表是第一音频信号和第二音频信号的组合的第三音频信号。
3.根据权利要求2的方法,其中代表第四音频信号的第四数字音频数据集被与第一数字音频数据集(20)和第二数字音频数据集(30)组合成代表第三音频信号的第三数字音频数据集(40),所述第三音频信号是第一音频信号、第二音频信号和第四音频信号的组合。
4.根据权利要求1的方法,其中第一种子样本是第一数字音频数据集的第一样本并且第二种子样本是第二数字音频数据集的第二样本。
5.根据权利要求1的方法,其中第一种子样本(A0)和第二种子样本(B1)被嵌入第三数字音频数据集(40)的样本(C0,C1,C2,C3,C4,C5,C6,C7,C8,C9)的较低有效位中。
6.根据权利要求1的方法,其中在相对于第一种子样本(A0)的位置确定的位置处嵌入同步模式(SYNC)。
7.根据权利要求1的方法,其中,在等化样本的步骤之前,通过从一组误差近似中选择误差近似而近似样本等化所引起的误差。
8.根据权利要求7的方法,其中,该组误差近似被索引并且在通过该误差近似对应的样本的较低有效位形成的辅助数据区域(81)中嵌入代表该误差近似的索引。
9.一种用于从利用根据权利要求1的方法获得的第三样本(C0,C1,C2,C3,C4,C5,C6,C7,C8,C9)数字音频数据集(40)提取第一样本(A0,A1,A2,A3,A4,A5,A6,A7,A8,A9)数字音频数据集(20)和第二样本(B0,B1,B2,B3,B4,B5,B6,B7,B8,B9)数字音频数据集(30)的方法,所述方法包括以下步骤:
-从第三数字音频数据集(40)恢复第一数字音频数据集(20)的第一种子样本(A0)和第二数字音频数据集(30)的第二种子样本(B1),
-恢复包括第一样本子集(A1,A3,A5,A7,A9)和第二样本子集(A0,A2,A4,A6,A8)的第一数字音频数据集(20)以及包括第三样本子集(B0,B2,B4,B6,B8)和第四样本子集(B1,B3,B5,B7,B9)的第二数字音频数据集(30),这是通过从第三数字音频数据集(40)的相应样本减去第一数字音频数据集(20)的已知样本数值而提取第二数字音频数据集(30)的样本(Bn),并且通过从第三数字音频数据集(31)的相应样本减去第二数字音频数据集(30)的已知样本数值而提取第一数字音频数据集(20)的样本来进行的,其中第四样本子集(B1,B3,B5,B7,B9)和第二样本子集(A0,A2,A4,A6,A8)不具有任何时间相应样本,其中第一样本子集(A1,A3,A5,A7,A9)中的每一个样本具有等于第二样本子集(A0,A2,A4,A6,A8)中的相邻样本的数值,其中第一样本子集(A1,A3,A5,A7,A9)和第二样本子集(A0,A2,A4,A6,A8)交错,其中第三样本子集(B0,B2,B4,B6,B8)中的每一个样本具有等于第四样本子集(B1,B3,B5,B7,B9)中的相邻样本的数值,并且其中第三样本子集(B0,B2,B4,B6,B8)和第四样本子集(B1,B3,B5,B7,B9)交错。
10.根据权利要求9的方法,其中第一数字音频数据集(20)代表第一音频信号,第二数字音频数据集(30)代表第二音频信号,并且第三数字音频数据集(31)代表是第一音频信号和第二音频信号的组合的第三音频信号。
11.根据权利要求10的方法,其中代表第四音频信号的第四数字音频数据集被提取,所述第四数字音频数据集被与第一和第二数字音频数据集(20,30)组合成代表第三音频信号的第三数字音频数据集(31),所述第三音频信号是第一音频信号、第二音频信号和第四音频信号的组合。
12.根据权利要求9的方法,其中第一种子样本是第一数字音频数据集的第一样本(A0)并且第二种子样本(B1)是第二数字音频数据集的第二样本。
13.根据权利要求9的方法,其中第一种子样本(A0)和第二种子样本(B1)从第三数字音频数据集(40)的样本(C0,C1,C2,C3,C4,C5,C6,C7,C8,C9)的较低有效位提取。
14.根据权利要求9的方法,其中同步模式(SYNC)被用于限定第一种子样本(A0)的位置。
15.根据权利要求9的方法,其中,在恢复第一数字音频数据集的步骤之后,通过加上恢复误差近似而补偿在编码期间由于样本等化引起的误差。
16.根据权利要求15的方法,其中从由第三数字音频数据集的样本的较低有效位形成的辅助数据区域(81)恢复误差近似。
17.一种编码器(10),被布置成执行根据权利要求1的方法,包括:
-第一等化装置(11a),用于将第一数字音频数据集(20)的第一样本子集(A1,A3,A5,A7,A9)中的每一个样本等化成第一数字音频数据集(20)的第二样本子集(A0,A2,A4,A6,A8)中的相邻样本,其中该第一样本子集(A1,A3,A5,A7,A9)和该第二样本子集(A0,A2,A4,A6,A8)交错,
-第二等化装置(11b),用于将第二数字音频数据集(30)的第三样本子集(B0,B2,B4,B6,B8)中的每一个样本等化成第二数字音频数据集(30)的第四样本子集(B1,B3,B5,B7,B9)中的相邻样本,其中该第三样本子集(B0,B2,B4,B6,B8)和该第四样本子集(B1,B3,B5,B7,B9)交错,其中第四样本子集(B1,B3,B5,B7,B9)和第二样本子集(A0,A2,A4,A6,A8)不具有任何时间相应样本,
-组合器(13),用于通过在时域中将第一数字音频数据集的样本与第二数字音频数据集的对应样本相加而产生第三数字音频数据集的样本,和
-格式化装置(14),用于在该第三数字音频数据集中嵌入该第一数字音频数据集的第一种子样本和该第二数字音频数据集的第二种子样本。
18.一种解码器,被布置成执行根据权利要求9的方法,包括:
-种子数值恢复器(202),用于从第三数字音频数据集(40)恢复第一数字音频数据集(20)的第一种子样本(A0)和第二数字音频数据集(30)的第二种子样本(B1),
-处理器(206),用于恢复包括第一样本子集(A1,A3,A5,A7,A9)和第二样本子集(A0,A2,A4,A6,A8)的第一数字音频数据集(20)以及包括第三样本子集(B0,B2,B4,B6,B8)和第四样本子集(B1,B3,B5,B7,B9)的第二数字音频数据集(30),所述处理器包括用于提取第二数字音频数据集(30)的样本(Bn)的第一提取器和用于从第三数字音频数据集(40)的相应样本减去第一数字音频数据集(20)的已知样本数值的第一减法器,所述处理器进一步包括用于提取第一数字音频数据集(20)的样本的第二提取器和用于从第三数字音频数据集(31)的相应样本减去第二音频数字数据集(30)的已知样本数值的第二减法器,其中第四样本子集(B1,B3,B5,B7,B9)和第二样本子集(A0,A2,A4,A6,A8)不具有任何时间相应样本,其中第一样本子集(A1,A3,A5,A7,A9)中的每一个样本具有等于第二样本子集(A0,A2,A4,A6,A8)中的相邻样本的数值,其中第一样本子集(A1,A3,A5,A7,A9)和第二样本子集(A0,A2,A4,A6,A8)交错,其中第三样本子集(B0,B2,B4,B6,B8)中的每一个样本具有等于第四样本子集(B1,B3,B5,B7,B9)中的相邻样本的数值,并且其中第三样本子集(B0,B2,B4,B6,B8)和第四样本子集(B1,B3,B5,B7,B9)交错,以及
用于输出所被恢复的第一数字音频数据集的输出装置。
19.一种再现设备,包括根据权利要求18的解码器(200)。
20.一种具有乘客厢的车辆,所述乘客厢包括根据权利要求19的再现设备,所述再现装备包括用于带有音频信息的数据载体的读出器和放大器。
CN2007800460450A 2006-10-13 2007-10-15 用于组合和分离数字音频数据集的方法和设备 Active CN101641970B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US82932106P 2006-10-13 2006-10-13
US60/829,321 2006-10-13
PCT/EP2007/060980 WO2008043858A1 (en) 2006-10-13 2007-10-15 A method and encoder for combining digital data sets, a decoding method and decoder for such combined digital data sets and a record carrier for storing such combined digital data set

Publications (2)

Publication Number Publication Date
CN101641970A CN101641970A (zh) 2010-02-03
CN101641970B true CN101641970B (zh) 2012-12-12

Family

ID=38983768

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007800460450A Active CN101641970B (zh) 2006-10-13 2007-10-15 用于组合和分离数字音频数据集的方法和设备

Country Status (13)

Country Link
US (1) US8620465B2 (zh)
EP (4) EP2299734B1 (zh)
JP (1) JP5325108B2 (zh)
CN (1) CN101641970B (zh)
AT (1) ATE476834T1 (zh)
CA (1) CA2678681C (zh)
DE (1) DE602007008289D1 (zh)
DK (1) DK2092791T3 (zh)
ES (2) ES2399562T3 (zh)
HK (1) HK1141188A1 (zh)
PL (2) PL2092791T3 (zh)
PT (1) PT2299734E (zh)
WO (1) WO2008043858A1 (zh)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9310959B2 (en) * 2009-06-01 2016-04-12 Zya, Inc. System and method for enhancing audio
JP2011155640A (ja) * 2009-12-28 2011-08-11 Panasonic Corp 立体映像再生装置
US8781000B2 (en) * 2010-12-30 2014-07-15 Vixs Systems, Inc. Dynamic video data compression
WO2012138594A1 (en) * 2011-04-08 2012-10-11 Dolby Laboratories Licensing Corporation Automatic configuration of metadata for use in mixing audio programs from two encoded bitstreams
KR102160248B1 (ko) * 2012-01-05 2020-09-25 삼성전자주식회사 다채널 음향 신호의 정위 방법 및 장치
WO2013122386A1 (en) * 2012-02-15 2013-08-22 Samsung Electronics Co., Ltd. Data transmitting apparatus, data receiving apparatus, data transreceiving system, data transmitting method, data receiving method and data transreceiving method
WO2013122385A1 (en) 2012-02-15 2013-08-22 Samsung Electronics Co., Ltd. Data transmitting apparatus, data receiving apparatus, data transreceiving system, data transmitting method, data receiving method and data transreceiving method
WO2013122387A1 (en) 2012-02-15 2013-08-22 Samsung Electronics Co., Ltd. Data transmitting apparatus, data receiving apparatus, data transceiving system, data transmitting method, and data receiving method
EP2826236A4 (en) * 2012-03-13 2015-08-26 Ericsson Telefon Ab L M MIX OF CODED VIDEO STREAMS
TWI530941B (zh) 2013-04-03 2016-04-21 杜比實驗室特許公司 用於基於物件音頻之互動成像的方法與系統
ES2640815T3 (es) 2013-05-24 2017-11-06 Dolby International Ab Codificación eficiente de escenas de audio que comprenden objetos de audio
WO2014187989A2 (en) 2013-05-24 2014-11-27 Dolby International Ab Reconstruction of audio scenes from a downmix
JP6192813B2 (ja) 2013-05-24 2017-09-06 ドルビー・インターナショナル・アーベー オーディオ・オブジェクトを含むオーディオ・シーンの効率的な符号化
MY178342A (en) 2013-05-24 2020-10-08 Dolby Int Ab Coding of audio scenes
EP2830053A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal
EP2830052A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder, audio encoder, method for providing at least four audio channel signals on the basis of an encoded representation, method for providing an encoded representation on the basis of at least four audio channel signals and computer program using a bandwidth extension
WO2015150384A1 (en) 2014-04-01 2015-10-08 Dolby International Ab Efficient coding of audio scenes comprising audio objects
US10262664B2 (en) * 2015-02-27 2019-04-16 Auro Technologies Method and apparatus for encoding and decoding digital data sets with reduced amount of data to be stored for error approximation
CN109391443B (zh) * 2017-08-11 2021-12-14 华为技术有限公司 同步信号块指示及确定方法、网络设备和终端设备
CN109361933B (zh) * 2018-11-13 2019-11-05 仲恺农业工程学院 一种音视频信息处理方法
CA3189122A1 (en) * 2020-09-22 2022-03-31 Qsc, Llc Transparent data encryption
CN114137348B (zh) * 2021-11-29 2023-11-24 国网湖南省电力有限公司 一种配电终端智能联调验收方法和验收设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5351087A (en) * 1990-06-01 1994-09-27 Thomson Consumer Electronics, Inc. Two stage interpolation system
JP2003177795A (ja) * 2002-11-27 2003-06-27 Victor Co Of Japan Ltd 音声符号化方法及び音声復号化方法
EP1592008A2 (en) * 2004-04-30 2005-11-02 Van Den Berghe Engineering Bvba Multi-channel compatible stereo recording

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5642437A (en) * 1992-02-22 1997-06-24 Texas Instruments Incorporated System decoder circuit with temporary bit storage and method of operation
JPH06325499A (ja) * 1993-05-11 1994-11-25 Sony Corp 記録装置、再生装置および記録再生装置
FI101439B1 (fi) * 1995-04-13 1998-06-15 Nokia Telecommunications Oy Transkooderi, jossa on tandem-koodauksen esto
US5884269A (en) * 1995-04-17 1999-03-16 Merging Technologies Lossless compression/decompression of digital audio data
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
TW417082B (en) * 1997-10-31 2001-01-01 Yamaha Corp Digital filtering processing method, device and Audio/Video positioning device
US6104991A (en) * 1998-02-27 2000-08-15 Lucent Technologies, Inc. Speech encoding and decoding system which modifies encoding and decoding characteristics based on an audio signal
GB2345233A (en) * 1998-10-23 2000-06-28 John Robert Emmett Encoding of multiple digital audio signals into a lesser number of bitstreams, e.g. for surround sound
JP4170795B2 (ja) * 2003-03-03 2008-10-22 大日本印刷株式会社 時系列信号の符号化装置および記録媒体
ATE362167T1 (de) * 2003-04-08 2007-06-15 Koninkl Philips Electronics Nv Aktualisieren eines verborgenen datenkanals
US20060015329A1 (en) * 2004-07-19 2006-01-19 Chu Wai C Apparatus and method for audio coding
US20090182563A1 (en) * 2004-09-23 2009-07-16 Koninklijke Philips Electronics, N.V. System and a method of processing audio data, a program element and a computer-readable medium
FR2899423A1 (fr) * 2006-03-28 2007-10-05 France Telecom Procede et dispositif de spatialisation sonore binaurale efficace dans le domaine transforme.
JP4714075B2 (ja) * 2006-05-11 2011-06-29 日本電信電話株式会社 多チャネル信号符号化方法、その方法を用いた装置、プログラム、および記録媒体

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5351087A (en) * 1990-06-01 1994-09-27 Thomson Consumer Electronics, Inc. Two stage interpolation system
JP2003177795A (ja) * 2002-11-27 2003-06-27 Victor Co Of Japan Ltd 音声符号化方法及び音声復号化方法
EP1592008A2 (en) * 2004-04-30 2005-11-02 Van Den Berghe Engineering Bvba Multi-channel compatible stereo recording

Also Published As

Publication number Publication date
ES2350018T3 (es) 2011-01-14
DK2092791T3 (da) 2010-11-22
EP2299734B1 (en) 2012-11-14
EP2328364B1 (en) 2020-07-01
EP2299734A2 (en) 2011-03-23
ES2399562T3 (es) 2013-04-02
CA2678681A1 (en) 2008-04-17
CN101641970A (zh) 2010-02-03
EP2299734A3 (en) 2011-06-08
PT2299734E (pt) 2013-02-20
EP2092791A1 (en) 2009-08-26
PL2092791T3 (pl) 2011-05-31
DE602007008289D1 (de) 2010-09-16
EP2337380A1 (en) 2011-06-22
US20100027819A1 (en) 2010-02-04
US8620465B2 (en) 2013-12-31
WO2008043858A1 (en) 2008-04-17
HK1141188A1 (en) 2010-10-29
EP2337380B1 (en) 2020-01-08
ATE476834T1 (de) 2010-08-15
PL2299734T3 (pl) 2013-05-31
EP2337380B8 (en) 2020-02-26
JP5325108B2 (ja) 2013-10-23
EP2328364A1 (en) 2011-06-01
EP2092791B1 (en) 2010-08-04
CA2678681C (en) 2016-03-22
JP2010506226A (ja) 2010-02-25

Similar Documents

Publication Publication Date Title
CN101641970B (zh) 用于组合和分离数字音频数据集的方法和设备
TW448436B (en) Digital audio data storage media and its regeneration device
CN101385077B (zh) 用于编码/解码信号的装置和方法
US8009837B2 (en) Multi-channel compatible stereo recording
US20110112672A1 (en) Systems and Methods of Constructing a Library of Audio Segments of a Song and an Interface for Generating a User-Defined Rendition of the Song
CN103649706A (zh) 三维音频音轨的编码及再现
CN102227769A (zh) 解码装置、解码方法、编码装置、编码方法和编辑装置
EP1113439A2 (en) Recording medium having recorded data structure and method and apparatus of recording/reproducing using the data structure
CN101490745B (zh) 用于编码和解码基于对象的音频信号的方法和装置
KR100291612B1 (ko) 데이터유니트의 오리지널시퀀스편집방법및그장치
US8989881B2 (en) Apparatus and method for writing onto an audio CD, and audio CD
CN1103105C (zh) 用于记录和/或再现一脉冲码调制数字音频信号的系统
US8626494B2 (en) Data compression format
KR100552605B1 (ko) 멀티 트랙 오디오 포맷 변환/재생 방법 및 시스템
JP2001100792A (ja) 符号化方法、符号化装置およびそれを備える通信システム
Gibson Microphones & Mixers
JP2006195066A (ja) 符号化オーディオ信号の再生装置及び再生方法
KR20020061656A (ko) 복수의 종류의 오디오데이터의 기록/재생이 가능한 디지털자기 기록/재생장치 및 그 기록/재생방법
WO2001052421A1 (en) Dual rate transmission scheme and apparatus using the same

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1141188

Country of ref document: HK

ASS Succession or assignment of patent right

Owner name: GALAXY STUDIOS NV

Free format text: FORMER OWNER: GALAXY STUDIOS NV (BE)

Effective date: 20121101

Free format text: FORMER OWNER: GUIDO VAN DEN BERGHE BAELEN VAN. WILFRIED

Effective date: 20121101

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20121101

Address after: Belgian Mohr

Applicant after: AURO TECHNOLOGIES

Address before: Belgian Mohr

Applicant before: GALAXY STUDIOS NV BE

Applicant before: Van Den Berghe Guido

Applicant before: Villefried Van Baellen

C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1141188

Country of ref document: HK

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20230726

Address after: Hoik, Belgium

Patentee after: Newaro LLC

Address before: Belgian Mohr

Patentee before: AURO TECHNOLOGIES