CN101432802A

CN101432802A - 使用有损编码的数据流和无损扩展数据流对源信号进行无损编码的方法以及设备

Info

Publication number: CN101432802A
Application number: CNA2007800156041A
Authority: CN
Inventors: 彼得·杰克斯; 弗洛里安·凯勒; 奥利弗·乌伯特; 斯文·科登; 约翰尼斯·伯姆
Original assignee: Thomson Licensing SAS
Current assignee: Deutsche Thomson Brandt GmbH; Thomson Licensing SAS
Priority date: 2006-05-05
Filing date: 2007-04-18
Publication date: 2009-05-13
Anticipated expiration: 2027-04-18
Also published as: JP2009536364A; BRPI0711272A2; EP2453437A2; JP5215994B2; US8326618B2; EP2016583A1; KR20090007396A; EP1852849A1; US20090177478A1; EP2453437A3; KR101473016B1; WO2007128662A1; PT2016583E; CN101432802B; EP2016583B1

Abstract

在基于有损的无损编码中，PCM音频信号通过有损编码器(101)至无损解码器(102)。有损编码器提供有损比特流(111)。有损解码器还提供用于控制(105)预测滤波器(106)的系数(118)的辅助信息(115)，所述预测滤波器(106)对PCM信号与有损解码器输出之间的差信号(104)进行去相关。对去相关的差信号进行无损编码(108)，提供扩展比特流(121)。代替时域中的去相关或除此之外，可使用频谱白化在频域中去相关。有损编码的比特流与无损编码的扩展比特流一起形成无损编码的比特流。本发明通过扩展以利于增强有损感知音频编码/解码，其中所述扩展使得在数学上能够精确再现原始波形，并且为在解码器处重建中间质量音频信号提供附加数据。无损扩展可用于将广泛使用的mp3编码/解码扩展为无损编码/解码和高质量mp3编码/解码。

Description

使用有损编码的数据流和无损扩展数据流对源信号进行无损编码的方法以及设备

技术领域

本发明涉及使用有损编码(encode)的数据流和无损扩展数据流对源信号进行无损编码的方法以及设备，其中所述有损编码的数据流和无损扩展数据流一起形成所述源信号的无损编码的数据流。

背景技术

对照有损音频编码技术(如mp3、AAC等)，无损压缩算法能够仅采用原始音频信号的冗余以减小数据率。如现有技术的有损音频编解码器中的心理声学模型所标识的，这不可能依靠不相关性(irrelevancy)。因此，所有无损音频编码方案的公共技术原理是应用滤波器或变换进行去相关(例如预测滤波器或频率变换)，然后以无损方式对变换后的信号进行编码。编码后的比特流包括：变换或滤波器的参数，以及变换后的信号的无损表示。

例如，参见Makhoul，“Linear prediction：A tutorial review”，Proceedings of the IEEE，Vol.63，pp.561-580，1975，T.Painter，A.Spanias，“Perceptual coding of digital audio”，Proceedings of the IEEE，Vol.88，No.4，pp.451-513，2000，以及M.Hans，R.W.Schafer，“Losslesscompression of digital audio”，IEEE Signal Processing Magazine，July2001，pp.21-32。

在图8和图9中描述了基于有损的无损编码的基本原理。在图8左侧的编码部分，PCM音频输入信号S_PCM通过有损编码器81至有损解码器82，并且作为有损比特流至解码部分(右侧)的有损解码器85。有损编码和解码用于对信号进行去相关。在减法器83中将解码器82的输出信号从输入信号S_PCM中去除，得到的差信号通过无损编码器84，作为至无损解码器87的扩展比特流。86将解码器85和87的输出信号结合，以重新得到原始信号S_PCM。

在EP-B-0756386和US-B-6498811中针对音频编码公开了该基本原理，还在P.Craven，M.Gerzon，“Lossless Coding for Audio Discs”，J.Audio Eng.Soc.，Vol.44，No.9，September 1996中以及在J.Koller，Th.Sporer，K.H.Brandenburg，“Robust Coding of High Quality AudioSignals”，AES 103rd Convention，Preprint 4621，August 1997中论述了该基本原理。

在图9中的有损编码器中，PCM音频输入信号S_PCM通过分析滤波器组91以及子带(sub-band)采样的量化92，至编码和比特流打包(packing)93。由接收信号S_PCM并从分析滤波器组91接收相应信息的感知模型计算器94来控制量化。

在解码器侧，解码的有损比特流进入用于对比特流进行解包的装置95，装置95之后跟着用于对子带采样进行解码的装置96以及输出解码后的有损PCM信号S_Dec的合成滤波器组97。

在标准ISO/IEC 11172-3(MPEG-1 Audio)中详细描述了针对有损编码和解码的示例。

在现有技术中，根据以下3个基本信号处理构思之一进行无损音频编码：

a)使用线性预测技术进行时域去相关；

b)使用可逆整数分析-合成滤波器组进行频域无损编码；

c)对有损基本层编解码器的残余(误差信号)进行无损编码。

发明内容

本发明将要解决的问题是提供分级的无损音频编码和解码，所述无损音频编码和解码是建立在嵌入的有损音频编解码器之上的，并且与依靠现有技术的基于有损的无损音频编码方案相比提供了更好的效率(也就是压缩比)。通过权利要求1至3和7至9中公开的方法解决了该问题。在权利要求4至6和10至12中分别公开了应用这些方法的设备。

本发明在有损编码之上使用数学上的无损编码和解码。数学上无损音频压缩是指在解码器输出处采用对原始PCM采样的比特精确再现的音频编码。对于某些实施例，假设使用诸如MDCT之类的频率变换或类似的滤波器组在变换域进行有损编码。作为示例，在描述中自始至终将mp3标准(ISO/IEC 11172-3 Layer 3)用于有损基本层，然而也能够以类似的方式与其它有损编码方案(例如AAC、MPEG-4音频)一起应用本发明。

传输或记录的编码比特流包括2部分：有损音频编解码器的嵌入的比特流，以及针对一个或几个附加层的扩展数据，用以得到无损(也就是比特精确的)原始PCM采样或中间质量。

本发明基本上按照以上所列构思的版本c)。然而，本发明实施例还应用来自构思a)和b)的特征，也就是对几个现有技术无损音频编码方案的技术的协同结合(synergistic combination)。

本发明使用频域去相关、时域去相关、或其结合，以为高效无损编码准备基本层有损音频编解码器的残余信号(误差信号)。提出的去相关技术使用从有损解码器提取的辅助信息。因此，防止了对比特流中多余信息的传输，并且改进了总压缩比。

除了改进了压缩比以外，本发明的一些实施例提供了采用(在有损编解码器与数学上无损质量所限定的范围内的)一个或几个中间质量的音频信号。此外，本发明允许使用简单的比特丢弃技术除去(strip)嵌入的有损比特流。

本发明的3个基本实施例在域方面有所不同，其中，以协同的方式在时域中、频域、或时域和频域中进行对有损基本层编解码器的残余信号的去相关。与现有技术对比，所有实施例使用从有损基本层编解码器的解码器得到的信息，以控制去相关和无损编码过程。可选地，实施例中的一些还使用来自有损基本层编解码器的编码器的信息。采用来自有损基本层编解码器的辅助信息可以减少总比特流中的冗余，从而改进基于有损的无损编解码器的编码效率。

在所有实施例中，能够从比特流中提取具有不同质量级别的音频信号的至少2个不同变体。这些变体包括：由嵌入的有损编码流方案表示的信号，以及对原始PCM采样的无损解码。在一些实施例中(参见频域去相关以及频域和时域中的去相关部分)，可以对具有中间质量的音频信号的一个或几个另外的变体进行解码。

在原理上，本发明的编码方法适于使用有损编码的数据流和无损扩展数据流对源信号进行无损编码，所述有损编码的数据流和无损扩展数据流一起形成所述源信号的无损编码的数据流，所述方法包括步骤：

-对所述源信号进行有损编码，其中所述有损编码提供所述有损编码的数据流；

-对所述有损编码的数据进行有损解码，从而重建解码的信号，以及提供用于控制时域预测滤波器的辅助信息；

-形成所述源信号的相应延迟的版本与所述解码的信号之间的差信号，

-使用从所述辅助信息得到的滤波器系数对所述差信号进行预测滤波，以在时域对所述差信号的连续值进行去相关；

-对所述去相关的差信号进行无损编码，以提供所述无损扩展数据流；

-将所述无损扩展数据流与所述有损编码的数据流组合，以形成所述无损编码的数据流，

或包括步骤：

-根据所述有损编码的数据流的量化的系数以及从所述有损编码接收的相应的尚未量化的系数来计算频谱白化数据，所述频谱白化数据表示对原始系数的更精细量化，由此对所述计算进行控制，以使得量化误差的功率对于所有频率本质上恒定；

-使用所述频谱白化数据对所述有损编码的数据进行有损解码，从而重建解码的信号；

-形成所述源信号的相应延迟的版本与所述解码的信号之间的差信号；

-对所述差信号进行无损编码以提供所述无损扩展数据流；

-将所述无损扩展数据流与所述有损编码的数据流和所述频谱白化数据组合，以形成所述无损编码的数据流，

或包括步骤：

-对所述源信号进行有损编码，其中所述有损编码提供所述有损编码的数据流，

-根据所述有损编码的数据流的量化的系数以及从所述有损编码接收的相应的尚未量化的系数，来计算频谱白化数据，所述频谱白化数据表示对原始系数的更精细量化，由此对所述计算进行控制，以使得量化误差的功率对于所有频率本质上恒定；

-使用所述频谱白化数据对所述有损编码的数据进行有损解码，从而重建解码的信号，以及提供用于控制时域预测滤波器的辅助信息；

-使用从所述辅助信息得到的滤波器系数对所述差信号进行预测滤波，以在时域中对所述差信号的连续值进行去相关；

-将所述无损扩展数据流与所述有损编码的数据流和所述频谱白化数据组合，以形成所述无损编码的数据流。

原理上，本发明的解码方法适于对从有损编码的数据流和无损扩展数据流得到的无损编码的源信号数据流进行解码，所述有损编码的数据流和无损扩展数据流一起形成所述源信号的无损编码的数据流，其中：

对所述源信号进行有损编码，所述有损编码提供所述有损编码的数据流；

对所述有损编码的数据进行相应的有损解码，从而重建标准解码的信号，并且提供用于控制时域预测滤波器的辅助信息；

形成所述源信号的相应延迟的版本与所述解码的信号之间的差信号；

使用从所述辅助信息得到的滤波器系数对所述差信号进行预测滤波，以在时域对所述差信号的连续值进行去相关；

对所述去相关的差信号进行无损编码，以提供所述无损扩展数据流；

将所述无损扩展数据流与所述有损编码的数据流组合，以形成所述无损编码的数据流，

所述方法包括步骤：

-对所述无损编码的源信号数据流进行解复用，以提供所述无损扩展数据流以及所述有损编码的数据流；

-对所述有损编码的数据流进行有损解码，从而重建有损解码的信号并且提供用于控制时域预测滤波器的所述辅助信息；

-对所述无损扩展数据流进行解码，以提供所述去相关的差信号；

-使用从所述辅助信息得到的滤波器系数对所述去相关的差信号的连续值进行逆去相关滤波；

-将所述去相关滤波的差信号与所述有损编码的信号组合，以重建所述源信号，

或其中：

对所述源信号进行有损编码，其中所述有损编码提供所述有损编码的数据流；

根据所述有损编码的数据流的量化的系数以及从所述有损编码接收的相应的尚未量化的系数，来计算频谱白化数据，所述频谱白化数据表示对原始系数的更精细量化，由此对所述计算进行控制，以使得量化误差的功率对于所有频率本质上恒定；

使用所述频谱白化数据对所述有损编码的数据进行有损解码，从而重建解码的信号；

对所述差信号进行无损编码以提供所述无损扩展数据流；

将所述无损扩展数据流与所述有损编码的数据流和所述频谱白化数据组合，以形成所述无损编码的数据流，

所述方法包括步骤：

-使用所述频谱白化数据对所述有损编码的数据流进行有损解码，从而重建有损解码的信号；

-对所述无损扩展数据流进行解码，以提供所述差信号；

-将所述差信号与所述有损解码的信号组合，以重建所述源信号，

或其中：

使用所述频谱白化数据对所述有损编码的数据进行有损解码，从而重建解码的信号，以及提供用于控制时域预测滤波器的辅助信息；

使用从所述辅助信息得到的滤波器系数对所述差信号进行预测滤波，以在时域中对所述差信号的连续值进行去相关；

对所述去相关的差信号进行无损编码以提供所述无损扩展数据流；

所述方法包括步骤：

-使用所述频谱白化数据对所述有损编码的数据流进行有损解码，从而重建有损解码的信号，以及提供用于控制时域预测滤波器的所述辅助信息；

-将所述去相关滤波的差信号与所述有损解码的信号组合，以重建所述源信号。

本发明的设备实施相应的本发明的方法的功能。

在各个从属权利要求中公开了本发明的有利附加实施例。

附图说明

参考附图描述了本发明的示例实施例，附图中：

图1示出了基于有损的无损编码器的方框图或信号流图，其中使用时域线性预测对残余信号进行去相关；

图2示出了基于有损的无损解码器的方框图或信号流图，其中使用时域线性预测对残余信号进行去相关；

图3示出了基于有损的无损编码器的方框图或信号流图，其中在频域中对残余信号进行去相关；

图4示出了基于有损的无损解码器的方框图或信号流图，其中在频域中对残余信号进行去相关；

图5示出了现有的ISO/IEC 11172-3 Layer III编码器的方框图；

图6示出了基于有损的无损编码器的方框图或信号流图，其中在频域和时域对残余信号进行去相关；

图7示出了基于有损的无损解编码器的方框图或信号流图，其中在频域和时域对残余信号进行去相关；

图8示出了现有的基于有损的无损编码器和解码器的基本方框图；

图9示出了现有的有损编码器和解码器的一般方框图。

具体实施方式

时域去相关

该实施例使用现有的残余编码原理。在图1中描述的编码中，编码以有损编码器步骤或阶段101开始，产生传递至MUX块109的有损比特流111。相应的有损解码器102生成解码的音频信号112以及将要用于对时域线性预测滤波器进行控制的一些辅助信息115。例如，该辅助信息115包括一组参数，所述参数描述了有损编解码器101/102的误差(也就是在减法器104中形成的(有损)解码的音频信号112与适当延迟的原始信号PCM采样113之间的差)(也就是残余信号114)的频谱包络。延迟103对由有损编码器101和有损解码器102的链(chain)所引起的任何算法延迟进行补偿。辅助信息还能够包括以下之一或更多个：块大小、窗函数、截止频率、比特分配。

从有损解码器102提取的辅助信息115(以及可能的信号114，特别地，在有损编码器101仅对部分音频信号频率范围进行编码的情况下，或为了利于在步骤/阶段105中更精确地确定滤波器系数，还有信号114)用于滤波器适配块105中，以确定将要应用到线性预测滤波器106中的一组最佳滤波器系数118。预测滤波和减法107的目的是生成具有平坦(也就是“白色”)频谱的去相关的输出信号102。优选地，对白信号进行去相关，相应的连续时域采样或值呈现最低可能功率和熵。因此，对信号更好的去相关导致具有更低平均数据率的无损编码。与现有的基于有损的无损方式相比，本发明可以进行非常好的去相关，而不需要传输与预测滤波器设置有关的大量信息。在数据率方面，相应的信息流116总是比未采用来自有损解码器的辅助信息115的系统低。最后，将要传输以用于在解码侧适配预测滤波器系数的额外信息116可以是0。也就是，所提出的方法的编码效率总是比类似的基于有损的无损音频编码方法好。

通常，可以采用来自有损解码器的任何有用信息(参数、信号等)，以改进对预测滤波器和有损编码器的适配。

为了可操作，将以平台无关的方式实现有损解码器102、时域线性预测滤波器106、延迟补偿103、减法点104和107、以及可以在有损解码器块102中选择地实现的任何内插功能性。也就是，对于所有目标平台，需要具有整数精度的定点实现(fixed-point implementation)来生成可比特精确再现的结果。

将预测误差信号120馈送至无损编码块108，无损编码块108生成编码的比特流121。有利地，因为能够假设预测误差信号120是去相关的(白色的)，所以在无损编码器108中可以使用简单的无记忆熵编码(例如Rice编码)。可以利用将要在滤波器适配块105的滤波器适配期间得到的附加辅助信息117可选地支持无损编码。例如，可以提供残余信号120的估计功率，作为辅助信息117，其是现有技术预测滤波器适配方法的副产物。复用器109将部分比特流111、116以及121组合以形成输出比特流信号122，并且可以针对输出比特流122生成不同文件格式或比特流格式。

术语“有损解码器”是指对有损编码的比特流进行精确解码，也就是有损编码器的逆操作。

在图2的解码中，由解复用器201将进入的总比特流122分成子比特流。有损解码器202生成有损解码的时间信号218以及辅助信息212，其中将所述有损解码器202实现为以平台无关方式精确地生成与解码器102相同的输出。根据该辅助信息以及任何比特流分量210(与图1中的信号116相对应)，可以正如在相应编码块105中一样，在滤波器适配块203中执行滤波器适配。解复用器201还将有损扩展比特流211提供给无损解码器204，所述无损解码器204的输出馈送至包括加法器205和由块212提供的滤波器系数214控制的预测滤波器206在内的逆去相关滤波器，从而生成有损编解码器误差信号114的比特精确的复制217。该误差信号与来自解码器202的解码信号218的相加207产生原始PCM采样S_PCM。滤波器系数214与滤波器系数118相同。元件202、204、205、206以及207的操作与相应元件102、108、107、106以及104的操作相同。

可选实施例

可以以不同方式来应用该基本处理。

代替图1中包括块106和107在内的前向反馈线性预测滤波器结构，可以使用时域线性预测滤波器的其它变体。例如，后向预测或后向预测与上述前向预测的结合。另一选项是除了这些短期预测技术以外，使用长期预测滤波器。

从滤波器适配块105/203提取的附加辅助信息117/213可用于控制无损编码/解码块108/204。例如，如公共滤波器适配技术所估计的，预测残余的标准偏差可用于对无损编码进行参数化(例如选择Huffman表格)。在图1和2中针对信号117/213的虚线示出了该选项。

可以将提出的实施例应用在各种编解码器上，对于所述各种编解码器，可以根据解码器处可用的参数组来确定或估计误差信号的功率谱。因此，能够将该分级的编解码器处理应用到大范围的音频和语音编解码器。

示例实现

假设有损基本层(base-layer)编解码器遵从mp3标准，则可以根据缩放因子组，确定时域线性预测滤波器的最佳系数。在mp3编解码器中，缩放因子描述了将要应用于对MDCT系数进行编码的量化步长。也就是，可以根据每一信号帧(微粒(granule))的缩放因子组得到误差信号功率谱的包络。

令S_ee(i)指示在功率谱域表示的、针对第i个MDCT系数的缩放因子。然后，可以通过逆离散傅里叶变换(IDFT)来确定自相关系数

。对Levinson-Durbin算法(上面引用的Makhoul)的应用将生成将要在p阶线性预测滤波器106/206中应用的最佳滤波器系数118/214的期望组a_i，i＝1...p。针对音频信号的每一帧(微粒)重复该过程。除了滤波器系数组a_i，i＝1...p以外，Levinson-Durbin算法生成预测误差信号120/215的期望变体。该变体是对预测残余的随后无损编码108加以控制的重要信息。

如果mp3编码器从比特分配中排除特定频率范围(例如低数据率处的高频率)，或使用先进的编码工具，则应用更复杂的方案。此外，在特定频率范围中，误差信号的功率谱的估计S_ee(i)可能不具有将用于滤波器适配的期望精度。则将通过检查误差信号114获得附加信息。这可以在时域和频域执行。

频域去相关

在该实施例中，在有损编解码器的变换域中执行对残余的去相关。然而，仍然在时域执行实际的无损编码。因此，该方法不同于现有的基于有损的无损方案以及基于变换的无损编码方法。提出的实施例结合了变换域去相关与基于时域的无损编码方式的优点。

在图3描述的编码中，在使用适配的或固定的比特分配对变换参数进行量化之前，有损编码器301使用对原始信号S_PCM(或其子带信号)的某一变换。在不丧失一般性的情况下，以下假设有损编码器是基于频率变换的。在有损编码器301生成了组合比特流317的嵌入的后向兼容的有损信号部分309之后，应用“频谱白化”块302，所述“频谱白化”块302的目的是：在变换域中确定有损编码器301的误差信号，以及对这些误差系数执行附加量化，以针对将要编码的扩展数据信号的连续值的大小实现频谱平坦(也就是“白色”)的误差基底。通常有损音频编解码器应用复杂的噪声整形技术以获得误差频谱，所述误差频谱遵从于人耳的非白色掩蔽阈值。频谱白化块至少需要原始变换系数310以及作为输入信号包含在比特流中的量化的变换系数309。通过在频域内将误差量化，能够实现这样的白化。频域中原始变换系数310与量化的变换系数309之间的差信号是时域中差信号314的反映(mirror)或映像(image)。

将有损编码器的输出比特流309和来自频谱白化块302的附加信息311馈送至扩展的有损和白化解码器块303中，以及馈送至复用器307。将得到的时域信号312从原始信号S_PCM的适当延迟的版本313中减去(补偿有损编解码器的任何延迟)，生成残余信号314。由于频谱白化过程，使得该残余信号具有平坦频谱，也就是在连续的采样间存在可忽略的相关。可以将残余信号直接馈送至无损编码器306中，无损编码器306输出无损扩展流316。可选地，可以使用来自有损&白化解码器303的辅助信息(参见以上给出的示例；对于误差信号的平均功率是尤其有利的)315来控制无损编码器306。

为了可操作，以平台无关的方式实现有损&白化解码器303、减法器305、以及可以在有损解码器块内选择地实现的任何内插功能性。也就是，对于所有目标平台，需要具有整数精度的定点实现，来生成可比特精确地再现的结果。

复用器307将部分比特流309、311以及316组合以形成输出比特流信号317，并且可以生成不同文件格式或比特流格式。

在图4所示的解码中，将接收的比特流317解复用401并且分成独立的信号层406、407以及408。将嵌入的有损比特流406和频谱白化比特流407馈送至有损和白化解码器402。得到的时域信号是编码中中间质量信号312的比特精确的复制。无损解码器403从比特流408以及选择地从有损和白化解码器(辅助信息410)获得输入，以生成残余信号411。通过将中间质量信号409加上无损解码的残余信号411，获得最终输出信号S_PCM。

元件402、403以及404的操作与相应元件303、306以及305的相同。

可选实施例

对于通过为频谱白化分配更多或更少量的比特来控制残余信号的功率，存在几种可能性。一个选项是，通过在频谱白化块302中改变量化的量以及允许对时域无损编码306的固定设置，将残余信号的恒定功率作为目标。另一选项是，允许时域残余信号的可变功率电平(powerlevel)。

通过采用有损编码器301生成的部分比特流以及频谱白化块302，特制的(tailored)解码器可以生成具有中间质量的输出信号，所述中间质量在嵌入的有损编解码器的质量和对原始PCM采样的数学上无损解码的质量之间。该中间质量依赖于残余信号的功率，其中采用先前段落中描述的方式之一来控制所述残余信号。这样的解码器可以不包括无损解码器403和加法器404，并且将不处理比特流316/408。

为了支持多于1个的中间质量信号的产生，频谱白化信息311的分层组织是有可能的。这样，可以指定这样的编解码器：所述编解码器在由有损编解码器(最低质量)和原始PCM采样(最高质量)所限定的范围内具有任意数目的中间质量级别。可以组织不同的质量级别，以便提供可缩放的比特流。

示例实施例

本发明的示例实施例基于mp3标准。在图5中示出了符合mp3的编码器的方框图。在图3的内容中，图5的mp3编码器(可能除了MUX507，取决于文件格式的比特流)是有损编码器块301的一部分。

原始输入信号S_PCM通过多相滤波器组&抽取器(decimator)503、分割&MDCT504以及比特分配和量化器505，至复用器507。输入信号S_PCM还通过FFT阶段或步骤501至心理声学分析502，所述心理声学分析502控制步骤/阶段504和量化505中的分割(或加窗(windowing))。比特分配和量化器505还提供辅助信息515，所述辅助信息515通过辅助信息编码器506至复用器507，复用器507输出信号517。

分别地，令x指示来自块504的输出矢量513的(也就是在针对mp3的MDCT域中的)、独立却任意的原始变换系数，令

指示由比特流514表示和指示的相同系数的量化版本，它是输出信号517或309的一部分。除了比特流309/517以外，MDCT系数513的原始矢量被传递给频谱白化块302上。因此，信号310包括信号513以及可选地来自mp3编码器的附加有用辅助信息。在频谱白化块302中，为了获得白误差基底，也就是频谱平坦(白)误差频谱

，

\hat{e} = Q (e)

，利用第二量化器对mp3编解码器的误差

e = x - \hat{x}

进行量化。因此，应该对将要在频谱白化块中应用的比特分配进行控制，使得满足条件

，其中E是期望值。

对于频谱白化量化器，可以使用已知的量化技术，例如熵编码之后的标量(scalar)或栅格(lattice)量化，或优化的(训练过的)固定熵标量或矢量量化。如果不依赖于频谱系数的原始mp3量化器的参数值而选择并且优化了频谱白化量化器，则可以期望最好的结果。也就是，频谱白化量化器应该是条件量化器。

频域和时域中的去相关

该实施例结合了时域去相关和频域去相关部分中所描述的特征。将去相关分成分别在频域和时域操作的2个子系统。

在图6描述的编码中，在利用适配或固定的比特分配对变换系数进行量化之前，有损编码器601使用对原始信号S_PCM(或其子带信号)的某一变换。在不失一般性的情况下，以下假设编码器601使用频率变换。在生成了组合比特流625的嵌入的后向兼容的有损信号部分612之后，应用频谱白化块602，目的是为了在变换域内确定编码器601的误差信号，以及对这些误差系数执行附加量化，以针对将要编码的扩展数据信号的连续值，实现在频谱方面比有损解码器的输入误差频谱的基底更平坦或白的误差基底。频谱白化块至少需要原始变换系数613和量化的变换系数612，作为输入信号。

将有损编码器的输出比特流612和来自频谱白化块602的相应附加信息614馈送至有损和白化解码器块603以及馈送至复用器610。将其得到的时域输出信号615从原始信号S_PCM的适当延迟版本616中减去605，生成残余信号617。

在预测滤波器607中将在残余信号617的连续采样间仍然保持的弱相关性去除。在滤波器适配块606中使用从有损和白化解码器块603提取的辅助信息(参见以上给出的示例，例如误差频谱的包络)618，以确定将要应用在滤波器607中的一组最佳滤波器系数621。预测滤波和减法608的目的是生成具有平坦或白频谱的完全去相关的输出信号623。该残余信号通过无损编码器609，无损编码器609输出无损扩展流624。可选地，可以使用来自滤波器适配块606的辅助信息(参见以上给出的示例，例如信号功率)来自控制编码器609。可选地，将与预测滤波器设置有关的、来自块606的信息发送至复用器610。在数据率方面，相应的信息流619总是比未采用辅助信息618的系统低。

复用器610将部分比特流612、614、619以及624组合以形成输出信号625，并且可以生成不同的文件格式或比特流格式。

在图7描述的解码中，由解复用器701将接收的比特流625分成独立的信号层709、710、711以及712。将嵌入的有损比特流709和频谱白化比特流710都馈送至有损和白化解码器702。所述有损和白化解码器702的有损或中间质量时域输出信号719是编码中有损或中间质量信号615的比特精确的复制。

解码器702还将辅助信息713提供给滤波器适配块703。根据该辅助信息以及任何比特流分量711(与图6中的信号619相对应)，正如在相应编码块606中一样，执行滤波器适配。

无损解码器704从无损扩展流712以及可选地从滤波器适配块703输出的辅助信息715(与图6的辅助信息620相对应)得到输入，以生成(部分地)去相关的残余信号717(与图6中的信号623相对应)。将所述信号馈送至包括加法器705以及由块703提供的滤波器系数714控制的预测滤波器706在内的逆去相关滤波器，从而生成残余信号617的比特精确的复制718。通过在加法器707中将有损解码的信号719与无损解码的残余信号718组合，得到最后输出信号S_PCM。滤波器系数714与滤波器系数621相同。元件702、704、705、706以及707的操作与相应元件603、609、608、607以及605的操作相同。

尽管这些块的功能和操作基本上分别遵从图1和3、或图2和4所描述的操作，然而在控制方式以及将要在频域和时域应用的去相关的量方面存在不同。

控制频域与时域去相关之间的平衡的一个策略是，对比特流的有损部分和频谱白化部分的总数据率加以限制。如果存在比特流的这两个分量的数据率的固定上限，则频谱白化仅能够执行误差信号的去相关任务的特定部分。也就是，时域残余信号617将仍然呈现一定的相关性。如在时域去相关部分中描述的，通过使用线性预测滤波器、采用从有损&白化解码器得到的信息，由下游的时域去相关去除剩余的相关性。

另一策略是，仅使用频域去相关从残余信号中去除长期相关性，也就是与残余信号的音调(tonal)分量相对应的、在频域中较窄(或“尖(peaky)”)的信号的相关特性。随后，优化由线性预测滤波执行的时域去相关，并且使用所述所述时域去相关从残余信号中去除剩余的短期相关性。从而有利地，这两个去相关技术都用在了它们最好的操作点上。因此，这种处理可以以低计算复杂度实现非常高效的编码。

可选实施例

通过为频谱白化分配更多或更少量的比特来控制残余信号的功率存在几种可能。一个选项是，通过改变频谱白化块602中的量化的量以及通过允许对时域无损编码609的固定设置(setup)，将残余信号的恒定功率作为目标。另一选项是，允许时域残余信号的可变功率电平。

通过采用有损编码器601和频谱白化块602生成的部分比特流进行，定制的解码器可以生成具有中间质量的输出信号，所述中间质量在嵌入的有损编解码器的质量和对原始PCM采样的数学上无损解码的质量之间。该中间质量取决于由先前段落中描述的方式之一控制的残余信号的功率。这样的解码器可以不包括无损解码器704、滤波器适配块703、预测滤波器706以及加法器705和707。

Claims

1、一种使用有损编码的数据流(111)和无损扩展数据流(121)对源信号(S_PCM)进行无损编码的方法，所述有损编码的数据流(111)和无损扩展数据流(121)一起形成所述源信号的无损编码的数据流(122)，所述方法包括步骤：

-对所述源信号进行有损编码(101)，其中所述有损编码提供所述有损编码的数据流(111)，

其特征在于：

-对所述有损编码的数据进行有损解码(102)，从而重建解码的信号(112)，以及提供用于控制时域预测滤波器的辅助信息(115)；

-形成所述源信号的相应延迟(103)的版本与所述解码的信号(112)之间的差信号(114)，

-使用从所述辅助信息得到(105)的滤波器系数(118)对所述差信号进行预测滤波(106，107)，以在时域对所述差信号的连续值进行去相关；

-对所述去相关的差信号(120)进行无损编码(108)，以提供所述无损扩展数据流(121)；

-将所述无损扩展数据流与所述有损编码的数据流组合(109)，以形成所述无损编码的数据流(122)。

2、一种使用有损编码的数据流(309)和无损扩展数据流(316)对源信号(S_PCM)进行无损编码的方法，所述有损编码的数据流(309)和无损扩展数据流(316)一起形成所述源信号的无损编码的数据流(317)，所述方法包括步骤：

-对所述源信号进行有损编码(301)，其中所述有损编码提供所述有损编码的数据流(309)，

其特征在于：

-根据所述有损编码的数据流的量化的系数以及从所述有损编码接收的相应的尚未量化的系数，来计算(302)频谱白化数据(311)，所述频谱白化数据表示对原始系数的更精细量化，由此对所述计算进行控制，以使得量化误差的功率对于所有频率本质上恒定；

-使用所述频谱白化数据对所述有损编码的数据进行有损解码(303)，从而重建解码的信号(312)；

-形成(305)所述源信号(S_PCM)的相应延迟(304)的版本与所述解码的信号(312)之间的差信号(314)；

-对所述差信号进行无损编码(306)以提供所述无损扩展数据流(316)；

-将所述无损扩展数据流与所述有损编码的数据流和所述频谱白化数据(311)组合(307)，以形成所述无损编码的数据流(317)。

3、一种使用有损编码的数据流(612)和无损扩展数据流(624)对源信号(S_PCM)进行无损编码的方法，所述有损编码后的数据流(612)和无损扩展数据流(624)一起形成所述源信号的无损编码的数据流(625)，所述方法包括步骤：

-对所述源信号进行有损编码(601)，其中所述有损编码提供所述有损编码的数据流(612)，

其特征在于：

-根据所述有损编码的数据流的量化的系数以及从所述有损编码接收的相应的尚未量化的系数，来计算(602)频谱白化数据(614)，所述频谱白化数据表示对原始系数的更精细量化，由此对所述计算进行控制，以使得量化误差的功率对于所有频率本质上恒定；

-使用所述频谱白化数据对所述有损编码的数据进行有损解码(603)，从而重建解码的信号(615)，以及提供用于控制时域预测滤波器的辅助信息(618)；

-形成(605)所述源信号(S_PCM)的相应延迟(604)的版本与所述解码的信号(615)之间的差信号(617)；

-使用从所述辅助信息得到(606)的滤波器系数(621)对所述差信号进行预测滤波(607，608)，以在时域中对所述差信号的连续值进行去相关；

-对所述去相关的差信号(623)进行无损编码(609)以提供所述无损扩展数据流(624)；

-将所述无损扩展数据流与所述有损编码的数据流和所述频谱白化数据(614)组合(610)，以形成所述无损编码的数据流(625)。

4、一种使用有损编码的数据流(111)和无损扩展数据流(121)对源信号(S_PCM)进行无损编码的设备，所述有损编码的数据流(111)和无损扩展数据流(121)一起形成所述源信号的无损编码的数据流(122)，所述设备包括：

-适于对所述源信号进行有损编码的装置(101)，其中所述有损编码提供所述有损编码的数据流(111)，

其特征在于：

-适于对所述有损编码的数据进行有损解码从而重建解码的信号(112)以及提供用于控制时域预测滤波器的辅助信息(115)的装置(102)；

-适于形成所述源信号的相应延迟的版本与所述解码的信号(112)之间的差信号(114)的装置(104，103)，

-适于使用从所述辅助信息得到的滤波器系数(118)对所述差信号进行预测滤波以在时域对所述差信号的连续值进行去相关的装置(105，106，107)；

-适于对所述去相关的差信号(120)进行无损编码以提供所述无损扩展数据流(121)的装置(108)；

-适于将所述无损扩展数据流与所述有损编码的数据流组合以形成所述无损编码的数据流(122)的装置(109)。

5、一种使用有损编码的数据流(309)和无损扩展数据流(316)对源信号(S_PCM)进行无损编码的设备，所述有损编码的数据流(309)和无损扩展数据流(316)一起形成所述源信号的无损编码的数据流(317)，所述设备包括：

-适于对所述源信号进行有损编码的装置(301)，其中所述有损编码提供所述有损编码的数据流(309)，

其特征在于：

-适于根据所述有损编码的数据流的量化的系数以及从所述有损编码接收的相应的尚未量化的系数，来计算频谱白化数据(311)，其中所述频谱白化数据表示对原始系数的更精细量化，由此对所述计算进行控制，以使得量化误差的功率对于所有频率本质上恒定的装置(302)；

-适于使用所述频谱白化数据对所述有损编码的数据进行有损解码从而重建解码的信号(312)的装置(303)；

-适于形成所述源信号(S_PCM)的相应延迟的版本与所述解码的信号(312)之间的差信号(314)的装置(305，304)；

-适于对所述差信号进行无损编码以提供所述无损扩展数据流(316)的装置(306)；

-适于将所述无损扩展数据流与所述有损编码的数据流和所述频谱白化数据(311)组合以形成所述无损编码的数据流(317)的装置(307)。

6、一种使用有损编码的数据流(612)和无损扩展数据流(624)对源信号(S_PCM)进行无损编码的方法，所述有损编码的数据流(612)和无损扩展数据流(624)一起形成所述源信号的无损编码的数据流(625)，所述设备包括：

-适于对所述源信号进行有损编码的装置(601)，其中所述有损编码提供所述有损编码的数据流(612)，

其特征在于：

-适于根据所述有损编码的数据流的量化的系数以及从所述有损编码接收的相应的尚未量化的系数，来计算频谱白化数据(614)，其中所述频谱白化数据表示对原始系数的更精细量化，由此对所述计算进行控制，以使得量化误差的功率对于所有频率本质上恒定的装置(602)；

-适于使用所述频谱白化数据对所述有损编码的数据进行有损解码从而重建解码的信号(615)，以及提供用于控制时域预测滤波器的辅助信息(618)的装置(603)；

-适于形成所述源信号(S_PCM)的相应延迟的版本与所述解码的信号(615)之间的差信号(617)的装置(605，604)；

-适于使用从所述辅助信息得到的滤波器系数(621)对所述差信号进行预测滤波以在时域中对所述差信号的连续值进行去相关的装置(606，607，608)；

-适于对所述去相关的差信号(623)进行无损编码以提供所述无损扩展数据流(624)的装置(609)；

-将所述无损扩展数据流与所述有损编码的数据流和所述频谱白化数据(614)组合以形成所述无损编码的数据流(625)的装置(610)。

7、一种对从有损编码的数据流(111)和无损扩展数据流(121)得到的无损编码的源信号(S_PCM)数据流进行解码的方法，所述有损编码的数据流(111)和无损扩展数据流(121)一起形成所述源信号的无损编码的数据流(122)，其中：

对所述源信号进行了有损编码(101)，所述有损编码提供所述有损编码的数据流(111)；

对所述有损编码的数据进行了相应的有损解码(102)，从而重建标准解码的信号(S_Dec)并且提供用于控制时域预测滤波器的辅助信息(115)；

形成了(104)所述源信号的相应延迟(103)的版本与所述解码的信号(112)之间的差信号(114)；

使用从所述辅助信息得到(105)的滤波器系数(118)对所述差信号进行了预测滤波(106，107)，以在时域对所述差信号的连续值进行去相关；

对所述去相关的差信号(120)进行了无损编码(108)，以提供所述无损扩展数据流(121)；

将所述无损扩展数据流与所述有损编码的数据流组合(109)，以形成所述无损编码的数据流(122)，

所述方法包括步骤：

-对所述无损编码的源信号数据流(122)进行解复用(201)，以提供所述无损扩展数据流(211)以及所述有损编码的数据流(209)；

-对所述有损编码的数据流进行有损解码(202)，从而重建有损解码的信号(218)并且提供用于控制时域预测滤波器的所述辅助信息(212)；

-对所述无损扩展数据流进行解码(204)，以提供所述去相关的差信号(215)；

-使用从所述辅助信息(212)得到(203)的滤波器系数(214)对所述去相关的差信号的连续值进行逆去相关滤波(205，206)；

-将所述去相关滤波的差信号(217)与所述有损解码的信号(218)组合(207)，以重建所述源信号(S_PCM)。

8、一种对从有损编码的数据流(309)和无损扩展数据流(316)得到的无损编码的源信号(S_PCM)数据流进行解码的方法，所述有损编码的数据流(309)和无损扩展数据流(316)一起形成所述源信号的无损编码的数据流(317)，其中：

对所述源信号进行了有损编码(301)，其中所述有损编码提供所述有损编码的数据流(309)，

根据所述有损编码的数据流的量化的系数以及从所述有损编码接收的相应的尚未量化的系数，计算了(302)表示频谱白化数据(311)，所述频谱白化数据对原始系数的更精细量化，由此对所述计算进行了控制以使得量化误差的功率对于所有频率本质上恒定；

使用所述频谱白化数据对所述有损编码的数据进行了有损解码(303)，从而重建了解码的信号(312)；

形成了(305)所述源信号(S_PCM)的相应延迟(304)的版本与所述解码的信号(312)之间的差信号(314)；

对所述差信号进行了无损编码(306)以提供所述无损扩展数据流(316)；

将所述无损扩展数据流与所述有损编码的数据流和所述频谱白化数据(311)组合(307)，以形成所述无损编码后的数据流(317)，

所述方法包括步骤：

-对所述无损编码的源信号数据流(317)进行解复用(401)，以提供所述无损扩展数据流(408)以及所述有损编码的数据流(406)；

-使用所述频谱白化数据(407)对所述有损编码的数据流进行有损解码(402)，从而重建有损解码的信号(409)；

-对所述无损扩展数据流进行解码(403)，以提供所述差信号(411)；

-将所述差信号(411)与所述有损解码的信号(409)组合(404)，以重建所述源信号(S_PCM)。

9、一种对从有损编码的数据流(612)和无损扩展数据流(624)得到的无损编码的源信号(S_PCM)数据流进行解码的方法，所述有损编码的数据流(612)和无损扩展数据流(624)一起形成所述源信号的无损编码的数据流(625)，其中：

对所述源信号进行了有损编码(601)，其中所述有损编码提供所述有损编码的数据流(612)，

根据所述有损编码的数据流的量化的系数以及从所述有损编码接收的相应的尚未量化的系数，计算了(602)频谱白化数据(614)，所述频谱白化数据表示对原始系数的更精细量化，由此对所述计算进行了控制，以使得量化误差的功率对于所有频率本质上恒定；

使用所述频谱白化数据对所述有损编码的数据进行了有损解码(603)，从而重建了解码的信号(615)以及提供了用于控制时域预测滤波器的辅助信息(618)；

形成了(605)所述源信号(S_PCM)的相应延迟(604)的版本与所述解码的信号(615)之间的差信号(617)；

使用从所述辅助信息得到(606)的滤波器系数(621)对所述差信号进行了预测滤波(607，608)，以在时域中对所述差信号的连续值进行去相关；

对所述去相关的差信号(623)进行了无损编码(609)以提供所述无损扩展数据流(624)；

将所述无损扩展数据流与所述有损编码的数据流和所述频谱白化数据(614)组合(610)，以形成所述无损编码的数据流(625)，

所述方法包括步骤：

-对所述无损编码的源信号数据流(625)进行解复用(701)，以提供所述无损扩展数据流(712)以及所述有损编码的数据流(709)；

-使用所述频谱白化数据(710)对所述有损编码的数据流进行有损解码(702)，从而重建有损解码的信号(719)，以及提供用于控制时域预测滤波器的所述辅助信息(713)；

-对所述无损扩展数据流进行解码(704)，以提供所述去相关的差信号(717)；

-使用从所述辅助信息(713)得到(703)的滤波器系数(714)对所述去相关的差信号的连续值进行逆去相关滤波(705，706)；

-将所述去相关滤波的差信号(718)与所述有损解码的信号(719)组合(707)，以重建所述源信号(S_PCM)。

10、一种对从有损编码的数据流(111)和无损扩展数据流(121)得到的无损编码的源信号(S_PCM)数据流进行解码的设备，所述有损编码的数据流(111)和无损扩展数据流(121)一起形成所述源信号的无损编码的数据流(122)，其中：

对所述有损编码的数据进行了相应的有损解码(102)，从而重建标准解码的信号(S_Dec)，并且提供用于控制时域预测滤波器的辅助信息(115)；

所述设备包括：

-适于对所述无损编码的源信号数据流(122)进行解复用以提供所述无损扩展数据流(211)以及所述有损编码的数据流(209)的装置(201)；

-适于对所述有损编码的数据流进行有损解码从而重建有损解码的信号(218)并且提供用于控制时域预测滤波器的所述辅助信息(212)的装置(202)；

-适于对所述无损扩展数据流进行解码以提供所述去相关的差信号(215)的装置(204)；

-适于使用从所述辅助信息(212)得到(203)的滤波器系数(214)对所述去相关的差信号的连续值进行逆去相关滤波的装置(205，206)；

-适于将所述去相关滤波的差信号(217)与所述有损解码的信号(218)组合以重建所述源信号(S_PCM)的装置(207)。

11、一种对从有损编码的数据流(309)和无损扩展数据流(316)得到的无损编码的源信号(S_PCM)数据流进行解码的设备，所述有损编码的数据流(309)和无损扩展数据流(316)一起形成所述源信号的无损编码的数据流(317)，其中：

对所述源信号进行了有损编码(301)，其中所述有损编码提供所述有损编码的数据流(309)；

根据所述有损编码的数据流的量化的系数以及从所述有损编码接收的相应的尚未量化的系数，计算了(302)频谱白化数据(311)，所述频谱白化数据表示对原始系数的更精细量化，由此对所述计算进行了控制，以使得量化误差的功率对于所有频率本质上恒定；

将所述无损扩展数据流与所述有损编码的数据流和所述频谱白化数据(311)组合(307)，以形成所述无损编码的数据流(317)，

所述设备包括：

-适于对所述无损编码的源信号数据流(317)进行解复用以提供所述无损扩展数据流(408)以及所述有损编码的数据流(406)的装置(401)；

-适于使用所述频谱白化数据(407)对所述有损编码的数据流进行有损解码从而重建有损解码的信号(409)的装置(402)；

-适于对所述无损扩展数据流进行解码以提供所述差信号(411)的装置(403)；

-适于将所述差信号(411)与所述有损解码的信号(409)组合以重建所述源信号(S_PCM)的装置(404)。

12、一种对从有损编码的数据流(612)和无损扩展数据流(624)得到的无损编码的源信号(S_PCM)数据流进行解码的设备，所述有损编码的数据流(612)和无损扩展数据流(624)一起形成所述源信号的无损编码的数据流(625)，其中：

使用所述频谱白化数据对所述有损编码的数据进行了有损解码(603)，从而重建解码的信号(615)，以及提供了用于控制时域预测滤波器的辅助信息(618)；

所述设备包括：

-适于对所述无损编码的源信号数据流(625)进行解复用以提供所述无损扩展数据流(712)以及所述有损编码的数据流(709)的装置(701)；

-适于使用所述频谱白化数据(710)对所述有损编码的数据流进行有损解码从而重建有损解码的信号(719)以及提供用于控制时域预测滤波器的所述辅助信息(713)的装置(702)；

-适于对所述无损扩展数据流进行解码以提供所述去相关的差信号(717)的装置(704)；

-适于使用从所述辅助信息(713)得到(703)的滤波器系数(714)对所述去相关的差信号的连续值进行逆去相关滤波的装置(705，706)；

-将所述去相关滤波的差信号(718)与所述有损解码的信号(719)组合以重建所述源信号(S_PCM)的装置(707)。

13、根据权利要求1、3、7和9之一的方法，或根据权利要求4、6、10和12之一的设备，其中，从所述辅助信息(115，618)得到预测滤波器设置数据(116，619)，并且所述预测滤波器设置数据(116，619)包含在所述无损编码的数据流(122，625)中，或从所述无损编码的数据流(122，625)得到辅助信息预测滤波器设置数据(210，711)并且所述辅助信息预测滤波器设置数据(210，711)用于产生(203，703)所述预测滤波器系数(214，714)。

14、根据权利要求1、3、7、9和13之一的方法，或根据权利要求4、6、10、12和13之一的设备，其中，预测残余的标准偏差(117，213；620，715)分别用于将所述无损编码(108，609)参数化或用于控制所述无损解码(204，704)。

15、根据权利要求2或8的方法，或根据权利要求5或11的设备，其中，来自所述有损解码器(303，402)的辅助信息(315，410)分别用于控制所述无损编码(306)或所述无损解码(403)。

16、根据权利要求8或9的方法，或根据权利要求11或12的设备，其中，不对所述无损扩展数据流(408，712)进行评估，并且所述频谱白化数据(407，710)与所述有损编码的数据流(406，709)一起用于对具有比所述源信号的质量低的中间质量的输出信号进行解码(402，702)。

17、一种存储介质，例如光盘上的存储介质，包含或存储或在其上记录有根据权利要求1至3和13至15之一的方法编码的数字信号。