CN1973319A

CN1973319A - 编码和解码多通道音频信号的方法和设备

Info

Publication number: CN1973319A
Application number: CNA2005800204239A
Authority: CN
Inventors: A·C·登布林克尔
Original assignee: Koninklijke Philips Electronics NV
Current assignee: Koninklijke Philips NV
Priority date: 2004-06-21
Filing date: 2005-06-14
Publication date: 2007-05-30
Anticipated expiration: 2025-06-14
Also published as: JP4950040B2; DE602005011439D1; KR101183857B1; ATE416455T1; KR20070030841A; US20070248157A1; US7742912B2; EP1761915B1; CN1973319B; EP1761915A1; JP2008503767A; WO2006000952A1

Abstract

一种用于对多通道音频信号进行编码的编码器(100)包括：预测处理器(101)，其通过与心理声学预测滤波器相关联的线性预测为多通道信号的两个信号分量产生两个残留信号。旋转处理器(105)旋转两个残留信号的组合信号来产生一个主信号和一个侧信号。优选地，主信号能量被最大化而侧信号能量被最小化。编码处理器(109)对主信号以及优选地对侧信号进行编码，并且输出处理器(111)产生一个输出信号，该输出信号包括已编码主数据以及优选地侧数据、预测参数和旋转参数。线性预测的组合、心理声学特性的使用以及用于对一个多通道信号进行编码的通用编码器(100)包括：预测处理器(101)，其通过与相关联的线性预测来为多通道信号的两个信号分量产生两个残留信号并且其特别地使用心理声学预测滤波器。旋转处理器(105)旋转两个残留信号的组合信号来产生一个主信号和一个侧信号。优选地，主信号能量被最大化而侧信号能量被最小化。编码处理器(109)对主信号以及优选地对侧信号进行编码，并且输出处理器(111)产生一个输出信号，该输出信号包括已编码主数据以及优选地侧数据、预测参数和旋转参数。线性预测、心理声学使用以及主侧信号的产生的结合改善了编码并且增强了编码器对于不同数据速率的灵活性。

Description

编码和解码多通道音频信号的方法和设备

发明领域

本发明涉及一种多信号编码器、多信号解码器及其方法，但是尤其不排他地涉及立体声音频信号的编码。

发明背景

近年来，数字形式的内容信号的分发和存储已经在大量增长。因此，大量的编码标准和协议已在发展。

音频信号的数字音频编码的最广泛的编码标准之一是动画图像专家组级3标准，通常称为MP3。举例来说，MP3允许一个30或40兆字节的数字PCM(脉冲编码调制)录音的歌曲例如被压缩成一个3或4兆字节的MP3文件。精确的压缩率取决于期望的MP3编码音频质量。

诸如MP3之类音频编码和压缩技术提供非常有效的音频编码，其允许数据尺寸相对较低且高质量的音频文件通过诸如互联网之类的数据网络被便捷地分发。

许多编码协议提供有效的立体声通道编码。立体声编码意在从立体声信号中消除冗余和不相干以便对于一个给定的质量水平，获得比分离通道的比特率之和还低的比特率。

大量不同的立体声编码算法和技术是已知的。其中一个技术被称为强度立体声编码。与音频通道的独立编码相比，强度立体声编码允许比特率的一个极大降低。在强度立体声中，为信号的高频率范围产生一个单声道音频信号。另外，为不同通道产生分离的强度参数。通常，强度参数是左右标度因子的形式，其被用于解码器中以便从单声道音频信号中产生左右输出信号。一个变体是使用单个标度因子和一个方向参数。

然而强度立体声编码技术有几个缺点。首先，编码器丢弃较高频率的时间和相位信息。因此解码器不能再生存在于原始音频资料中的时间或相位通道差值。此外，通常，编码不能够保存音频通道之间的相关性。因此，编码器产生的立体声信号的质量衰减不能避免。

另一技术被称为中间/侧(MS)编码，其中：一个中间信号分量可以通过左右通道信号相加来产生并且侧通道可以通过左右通道信号相减来产生。因为左右信号之间的相关性一般较高，所以这通常导致一个高信号能量的中间信号分量和一个低信号能量的侧信号。然后使用不同的编码参数对中间和侧信号进行编码，其中：侧信号的编码一般是这样的，它降低了侧信号的数据速率。

MS编码的一个缺点是：MS编码的比特率效率通常远远低于例如强度立体声编码从而导致增加的数据速率。在最坏条件的情况中，较之左右通道的独立编码，MS编码不提供任何比特率增益。

另一立体声编码技术被称为线性预测技术，其中：左右通道被线性地组合成一个复信号。然后一个复线性预测滤波器被用来预测复信号并且结果的残留信号被编码。这样一个编码器的示例在“An experimentalaudio codec based on warped linear prediction of complex valuedsignals”(harma，Laine和karjalainen，Proceedings of ICASSP-97，第323-326页，德国慕尼黑，1997年4月)中给出。

一个与当前的线性预测提议相关联的问题是把左右通道组合成一个复信号强加左右通道的时域关联，这在预测的可用的自由度中产生一个限制。因此，预测不能获得最大的移除冗余信息。而且，所述技术没有标识或构造一个可以为它们分别优化编码的主和侧信号。另外，所使用的预测标准是基于不产生最佳预测的简单预测滤波器。因此，对于一个给定信号质量的可达到的数据速率并不是最佳的。

一个不同的编码技术使用频带或子带的旋转。在这种技术中，带通滤波器可以被用来产生用于左右通道的多个子带信号。一个通道的每个子带都与另一个通道的子带形成一对，并且一个主分量分析被执行。每个子带，参数都在编码器中被应用来通过旋转而每个子带产生一个主和侧信号。参数还被存储在数据流中，因此解码器可以应用逆处理。

这类旋转器技术的问题在于，它不考虑左右信号之间可能的时差因此没有实现最佳性能。其次，由于交叠相加的分析与综合，即使没有信号量化(quantisation)，子带信号的完美重建是不可能的。

当前，低数据速率立体声编码的最有前途的技术看起来是感觉立体声编码，其中，感觉模式和信息被用来降低被编码的数据速率。从而，不是试图尽可能接近地表示原始立体声信号的波形，感觉立体声编码意在产生一个信号，解码器可以使用该信号来产生一个对一个用户产生相同的音频感觉的输出信号。

在这个方法中固有的一个问题是即使没有信号量化，原始信号也不能被完美地重建。特别地，这可能是由于在分析与综合系统中被使用的交叠相加程序。因此，对于高数据速率应用，感觉立体声编码的性能趋向于提供被重建信号的较低质量。

因此，一种用于多通道编码和/或解码的改进系统将是有利的，并且特别地，一种允许增加灵活性、降低数据速率、增加质量和/或降低复杂性的系统将是有利的。特别地，一种允许高数据速率下的高信号质量和低数据速率下的有效编码的系统将是有利的。

发明内容

因此，优选地，本发明设法分别或者组合地缓和、减轻或消除上述缺点的一个或多个。

根据本发明的第一方面提供了一种信号编码器，用于对包括至少一个第一信号分量和一个第二信号分量的多通道信号进行编码，该信号编码器包括：预测装置，用于通过第一信号分量和第二信号分量的线性预测来产生第一信号分量的第一残留信号和第二信号分量的第二残留信号，该线性预测与心理声学特性相关联；旋转装置，用于通过旋转包括第一残留信号和第二残留信号的一个组合信号来产生一个主信号和一个侧信号，主信号具有比侧信号高的信号能量；第一编码装置，用于对主信号进行编码以便产生已编码主数据；和输出装置，用于产生包括已编码主数据的一个输出信号。

本发明可以以一个给定数据速率提供改善的质量和/或为一个给定质量水平提供一个较低数据速率。替换或另外地，本发明可以提供一种在一个数据速率范围内具有改善的灵活性和/或改善的性能的信号编码器。特别地，本发明可以以低数据速率产生适用于有效编码的主信号和侧信号同时提供一种允许精确表示高数据速率的原始信号波形的编码方案。

本发明可以允许不同编码方法的优点被组合来克服与个别编码方案相关联的缺点。特别地，本发明可以提供一个用于预测的增加的自由度从而降低残留信号的量值。而且，一个改进的音频信号预测可以通过使用一个基于心理声学特性的预测而被实现。心理声学特性表现用户对音频信号的感觉。一个改进的预测和旋转的组合可以降低给定质量水平的数据速率并且可以特别地产生一个主信号和一个侧信号，它们可以通过一个特别适用于个别信号特性的算法被个别地编码。

特别地，本发明的实施例可以提供一种信号编码器，其在没有信号量化的情况下允许几乎完美的信号重建并且因此接近高数据速率的完美的信号重建。相同的信号编码器还可以构造一个与对于低数据速率编码可能有利的参量感觉立体声编码提供的那些信号相似的主信号和侧信号。

主信号的编码例如可以包括主信号的量化。输出装置优选地可操作来进一步包括输出信号中的线性预测的旋转参数和/或预测参数。

根据本发明的优选特征，信号编码器进一步包括第二编码装置，用于编码侧信号以便产生编码侧数据；并且输出装置可进一步操作来在包括输出信号中的编码侧数据。

这可以允许一个解码器再生一个具有更高质量的信号并且同时保持低数据速率。

编码主数据信号的数据速率优选地高于编码侧数据的数据速率。优选地，编码主数据的抽样率高于编码侧信号的抽样率和/或编码主数据的量化比编码侧信号更精细。

根据本发明的优选特征，第二编码装置可操作来参量地编码侧信号。这可以提供一个有效的编码，其对于给定质量水平产生一个输出信号的低数据速率。

根据本发明的优选特征，预测装置包括至少一个基于心理声学的滤波器系统。

这可以提供一个有效的预测性能和/或简化实现。基于心理声学的滤波器系统例如可以是Kautz滤波器组、Laguerre滤波器组、抽头全通线路或Gamma-tone滤波器组。

根据本发明的优选特征，旋转装置可操作来旋转组合信号以便充分地最大化主信号的信号能量。这可以提供多通道信号的有效编码。特别地，它可以增加主信号中的信息从而允许主信号的精确编码以便保留一个高信息度。

根据本发明的优选特征，旋转装置可操作来旋转组合信号以便充分地最小化侧信号的信号能量。这可以提供多通道信号的有效编码。特别地，它可以减少侧信号的相对信息内容，从而允许减少由将被减少的侧信号的有损编码引起的输出信号的衰减。特别地，在侧信号被丢弃的实施例中，与此相关联的质量衰减可以被降低。

根据本发明的优选特征，该预测装置包括：第一预测器，其响应于第一信号分量来产生一个用于第一信号分量的第一估计信号；第二预测器，其响应于第二信号分量来产生一个用于第一信号分量的第二估计信号；和装置，用于产生作为第一信号分量减去第一估计信号和第二估计信号的第一残留信号。

这可以提供一个适当的实现和/或产生准确预测，并且从而产生质量水平和输出信号数据速率之间的一个改进比率。特别地，该特征可以允许一个基于第一信号分量并且基于第二信号分量的第一信号分量的独立预测。第一和第二预测器可以明确地产生不同的时域预测。第一估计信号和第二估计信号之间的时域独立为产生改进性能的预测提供了增加的自由度。

第一和/或第二预测器中的每一个可以包括有限冲激响应(FIR)或无限冲激响应(IIR)滤波器和可以特别地包括一个基于心理声学的滤波器组。

根据本发明的优选特征，预测装置包括：第三预测器，其响应于第一信号分量来产生一个用于第二信号分量的第三估计信号；第四预测器，其响应于第二信号分量来产生一个用于第二信号分量的第四估计信号；和装置，用于产生作为第二信号分量减去第三估计信号和第四估计信号的第二残留信号。

这可以提供一个适当的实现和/或产生准确预测，并且从而产生质量水平和输出信号数据速率之间的一个改进比率。

第三和/或第四预测器中的每一个可以包括有限冲激响应(FIR)或无限冲激响应(IIR)滤波器和可以特别地包括一个基于心理声学的滤波器组。

根据本发明的优选特征，旋转器可操作来对组合信号执行一个矩阵乘法。这可以提供一个适当的实现。

根据本发明的优选特征，信号编码器还包括装置，用于响应于第一信号分量和第二信号分量的频谱特性来频谱地整形主信号。优选地，第一编码装置包括一个心理声学单声道编码器。这可以在输出信号的质量水平和数据速率之间产生一个改进的比率。

多通道信号可以包括多个信号分量中的任意一个但是优选地，多通道信号是一个立体声音频信号。

根据本发明的第二方面提供了一种用于解码多通道信号的信号解码器，该信号解码器包括：

接收装置，用于接收一个多通道信号；

旋转装置，用于通过多通道信号的旋转来产生第一残留信号和第二残留信号；

合成装置，用于响应于第一残留信号和第二残留信号通过线性预测来产生一个输出的多通道信号，线性预测与心理声学特性相关联。

根据本发明的第三方面提供了一种编码多通道信号的方法，多通道信号包括至少一个第一信号分量和一个第二信号分量，该方法包括下列步骤：通过第一信号分量和第二信号分量的线性预测来产生第一信号分量的第一残留信号和第二信号分量的第二残留信号，该线性预测与心理声学特性相关联；通过旋转包括第一残留信号和第二残留信号的一个组合信号来产生一个主信号和一个侧信号，主信号具有比侧信号高的信号能量；对主信号编码以便产生已编码主数据；和产生包括已编码主数据的一个输出信号。

根据本发明的第四方面提供了一种解码多通道信号的方法，该方法包括下列步骤：接收一个多通道信号；通过多通道信号的旋转来产生第一残留信号和第二残留信号；响应于第一残留信号和第二残留信号通过线性预测来产生一个输出的多通道信号，线性预测与心理声学特性相关联。

根据本发明的第五方面提供了一种包括用于多通道信号的编码数据的数据流，该数据流包括：线性预测参数，其表示多通道信号的第一信号分量和第二信号分量的线性预测；表示主信号和组合信号之间的旋转值的旋转参数，该组合信号包括与第一信号分量的线性预测相关联的第一残留信号和与第二信号分量的线性预测相关联的第二残留信号；和主信号的编码主数据。

本发明的这些和其它方面、特征和优点将参考下文中所描述的(一个或多个)实施例而被阐明以变得明显。

附图说明

本发明的实施例将只通过举例的方式参考附图而被描述，其中

图1说明了根据本发明实施例的编码器的框图示例。

图2说明了一个根据本发明实施例的解码器的框图示例。

图3说明了用于根据本发明实施例的编码器的线性预测和旋转装置的实现；

图4说明了根据本发明实施例的编码器中的线性预测的实现；

图5说明了用于根据本发明实施例的解码器的线性预测和旋转转置的实现；和

图6说明了根据本发明实施例的解码器中线性预测的实现；

具体实施方式

下文中的说明集中在本发明适用于立体声音频信号的编码器和解码器的一个实施例。然而，应当理解，本发明不被限制于该应用，而是可以被应用到许多其它的多通道信号。

图1说明了根据本发明实施例的编码器100的框图示例。

编码器100接收一个立体声信号，该立体声信号包括在所述实施例中是左通道信号的第一信号分量x₁和在所述实施例中是右通道信号的第二信号分量x₂。第一和第二信号分量x₁ x₂被馈送到预测处理器101，预测处理器101通过第一和第二信号分量x₁、x₂的线性预测来产生第一信号分量的第一残留信号e₁和第二信号分量的第二残留信号e₂。

第一和第二信号分量x₁、x₂还被馈送到预测参数处理器103，预测参数处理器103确定用于预测处理器101执行的线性预测的最佳预测系数。因此，预测参数处理器103被耦合到预测处理器101并且向这里馈送已确定的预测参数。预测参数处理器103可以使用本领域的技术人员所熟知的诸如线性回归之类的已知最佳算法来确定预测参数。

预测参数处理器103还可以执行诸如频谱平滑(亦称峰值变宽)和预测参数内插法之类的其它标准线性预测操作。通常，预测参数处理器103还将包括参数的量化。

基于从预测参数处理器103接收的预测参数，预测处理器101产生当前左右通道抽样的预期值并且将其从第一和第二信号分量x₁、x₂的真实值中减去。因此，预测处理器101产生第一和第二残留信号e₁、e₂，它们对应于第一和第二信号分量x₁、x₂的预测值和真实值之间的差值。通常，残留信号e₁、e₂的值是比第一和第二信号分量的值低得多的值。

预测处理器101可操作来执行考虑人类对音频感觉的线性预测。从而，线性预测与一个心理声学特性相关联。例如，线性预测可以考虑人耳在不同频率范围中的灵敏度、脉冲性能以及对音量级别的敏感度等等。线性预测可以根据心理声学特性来更改或者改变一个参数，或者心理声学特性可以例如是预测处理器101的设计和实现的固有部分。例如，所使用的算法可以被选择来反映人听觉的心理声学模式。特别地，预测处理器101可以使用一个或多个基于心理声学的预测系统，诸如Kautz滤波器组、Laguerre滤波器滤波器组或者Gamma-tone滤波器组。

预测处理器101被耦合到一个旋转处理器105，旋转处理器105通过旋转包括第一残留信号e₁和第二残留信号e₂的组合信号来产生一个主信号和一个侧信号。而且，预测处理器101还被耦合到一个旋转系数处理器107，旋转系数处理器107确定旋转处理器105所用的旋转系数。在特定的实施例中，组合信号可以被认为是一个对应于e₁+j·e₂的复信号，其被乘以一个复旋转值a+j·b从而通过下列公式来产生主和侧信号：

m+j·s＝(e₁+j·e₂)·(a+j·b) (1)

等同地，旋转系数处理器107可以产生一个角值α₀，其可以在旋转处理器105执行的矩阵计算中被使用：

(\begin{matrix} m \\ s \end{matrix}) = (\begin{matrix} \cos (α_{0}) & \sin (α_{0}) \\ - \sin (α_{0}) & \cos (α_{0}) \end{matrix}) \cdot \begin{matrix}  \end{matrix} (\begin{matrix} e_{1} \\ e_{2} \end{matrix}) - - - (2)

在实施例中，旋转系数处理器107确定旋转参数，因此主信号比侧信号具有更高的信号能量。这将通常允许主信号的信号值大于侧信号的信号值，从而提供用于主信号中的信息浓度。这可以允许一个更有效的编码。特别地，侧信号的量化和/或抽样率可以被充分地降低。在某些实施例中，侧信号甚至可以被完全地丢弃。

在所述实施例中，旋转系数处理器107确定旋转参数，因此信号能量对于主信号被最大化和/或对于侧信号被最小化。例如，角值α₀被确定，因此主信号被最大化并且侧信号被最小化。

旋转处理器105被耦合到编码处理器109，编码处理器109编码主信号和侧信号来产生编码主数据并且优选地产生编码侧数据。应当理解，编码主和侧信号的任何适当的方法都可以被使用。在一个简单的实施例中，编码处理器109可以简单地包括一个量化器，该量化器通过主和侧信号的个别量化来产生用于主和侧信号(b_m、b_s)的量化数据。

在某些实施例中，侧信号被参量地编码，而非包括描述侧信号波形的信号数据值，从而一个或多个描述侧信号的一个或多个特性的参数被包括。这可以实现一个非常有效和低数据速率的侧信号编码。

编码处理器109被耦合到输出处理器111，输出处理器111产生一个包括编码主数据并且优选地包括侧编码数据的输出信号。另外，输出处理器111在所述实施例中还包括用于线性预测的预测参数和旋转参数。因此，单个表示立体声信号的比特流被产生。

将基于心理声学参数的线性预测和具有所产生残留信号的旋转的组合提供了具有高灵活性的高效编码。特别地，主和侧信号的产生可以提供较低的数据速率的高效编码。而且，编码器以高数据速率产生一个比特流，原始信号可以从该比特流非常精确地被再生。

图2说明了一个根据本发明实施例的解码器200的框图示例。解码器可以解码来自图1的编码器的比特流，以下参考该图来描述。

解码器200包括接收来自编码器100的以编码器100产生的比特流的形式的多通道信号的接收器201。接收器201包括一个解复用器，该解复用器可操作来分离比特流的数据并且将其提供给解码器200的适当功能决。

解码器200包括从比特流中产生主和侧信号的解码器处理器203。特别地，接收器201把已编码的主和侧数据b_m、b_s提供给解码器处理器203，解码器处理器203执行对图1的编码器100的编码处理器109的互补操作。在一个简单的实施例中，其中，编码处理器109只量化来自旋转处理器105数据值，解码器处理器203可以简单地转发在编码主和侧数据中接收的量化值。

而且，解码器201包括一个被耦合到解码器处理器203的解码旋转处理器205。解码器处理器203把接收到的主和侧信号馈送到解码旋转处理器205，解码旋转处理器205通过旋转主和侧信号来再生第一残留信号e₁和第二残留信号e₂。特别地，解码旋转处理器205可以执行矩阵运算：

(\begin{matrix} e_{1} \\ e_{2} \end{matrix}) = (\begin{matrix} \cos ({- α}_{0}) & \sin ({- α}_{0}) \\ - \sin ({- α}_{0}) & \cos ({- α}_{0}) \end{matrix}) \cdot (\begin{matrix} m \\ s \end{matrix}) - - - (4)

因此，解码旋转处理器205被馈送来自接收器201的值α₀。

解码旋转处理器205被耦合到预测解码器207。预测解码器207通过线性预测滤波来产生用于多通道信号的第一信号分量的第一预测信号以及用于多通道信号的第二信号分量的第二预测信号。第一和第二预测信号被产生来对应于预测处理器101用来产生残留信号的预测信号。特别地，相同的预测算法可以基于被解码信号而被使用。因此，预测解码器207接收来自于接收器201的预测参数α_m。

类似于编码器，线性预测滤波是基于诸如表示收听人心理声学感觉特性的预测滤波器之类的适合的心理声学特性。

基于第一预测信号和第一残留信号e₁，第一信号分量x₁被预测解码器207再生。类似地，第二信号分量x₂基于第二预测信号和第二残留信号被产生。

应当理解，尽管上述的说明集中在一个预测参数和旋转参数被包括在被接收数据流中的实现，然而这不是本发明的本质特征。

例如，在某些实施例中，这些值可以用后向自适应算法来构造。

在下文中，图1的编码器100的各个方面将被更加详细地描述。

图3说明了一个根据本发明实施例的线性预测和旋转装置的实现。特别地，该附图说明了图1的预测处理器101和旋转处理器105的一个实施例。

第一和第二信号分量x₁、x₂被输入到预测处理器101，预测处理器101是一个产生输出信号e₁、e₂的双通道预测器。

在该实施例中，预测处理器101包括四个预测器301、303、305、307，每个预测器都对应于第一和第二信号分量x₁、x₂和第一和第二预测信号的四个可能组合中的一个。

因此，在该实施例中，预测处理器101包括：第一预测器301，其响应于第一信号分量来产生用于第一信号分量的第一估计信号；第二预测器303，其响应于第二信号分量来产生用于第一信号分量的第二估计信号；第三预测器305，其响应于第一信号分量来产生用于第二信号分量的第三估计信号；第四预测器307，其响应于第二信号分量来产生用于第二信号分量的第四估计信号。

在该实施例中，每个预测器是一个基于心理声学的预测系统，比如Kautz滤波器组、Laguerre滤波器组、抽头全通的线路或者Gamma tone滤波器。Laguerre滤波器组或抽头全通线路中的全通滤波器可以根据一个类似于心理声学相关频标的弯曲频标而被采取，比如Smith和Abel在1999年的IEEE学报，语音和音频处理，第7卷，第697到708页中“Bark and ERBbilinear transform”中公开的Barkscale或ERB定标。在Kautz或Gamma-tone滤波器组中，滤波器传送可以被选择，因此中心频率和带宽定性地类似于在心理声学实验中找到的那些。

为了音频和语音编码的目的，与心理声学特性相关联的预测滤波器的使用提供了较之基于抽头延迟线滤波的传统预测算法有所改进的质量。

预测处理器101还包括：第一加法器309(减法器)，其产生作为第一信号分量x₁减去第一估计信号和第二估计信号的第一残留信号e₁；第二加法器311，其产生作为第二信号分量x₂减去第三估计信号和第四估计信号的第二残留信号e₂。因此，残留信号e₁、e₂对应于原始信号分量和组合估计之间的差值。

预测处理器101的双通道系统的传送可以在稳态中由下示公式来描述：

(\begin{matrix} E_{1} (z) \\ E_{2} (z) \end{matrix}) = (\begin{matrix} 1 - P_{1,1} (z) & - P_{1,2} (z) \\ - P_{2,1} (z) & 1 - P_{2,2} (z) \end{matrix}) \cdot (\begin{matrix} X_{1} (z) \\ X_{2} (z) \end{matrix}) - - - (5)

其中，P_n，m(z)是个别的预测滤波器的传递函数。

因为用于预测滤波器的预测参数可以被个别地确定，大量的预测自由度被获得。特别地，第一和第二信号分量x₁、x₂之间没有时域假定或关联被强加或假定；这和一个复预测滤波器被用于复信号x₁+j·x₂的情形相反。

一个用于预测滤波器的特殊滤波器结构在图4中说明。一个实施例的预测滤波器的传递函数可以被写作：

P_{k, l} = H_{0}^{(k, l)} Σ_{m = 1}^{M} α_{m}^{(k, l)} \cdot H_{m}^{(k, l)} - - - (6)

即，预滤波器H₀后面是多个由系数α_m ^(k，l)加权并且在求和器中被求和的滤波器H_m ^(k，l)。

鉴于对称考虑，让

H_{0}^{(k, l)} = H_{0}^{(l, k)}

和

H_{m}^{(k, l)} = H_{m}^{(l, k)}

是有利的。为了降低复杂性，我们设置

H_{0}^{(k, l)} = H_{0}^{(k, k)} = H_{0}

并且

H_{m}^{(k, l)} = H_{m}^{(k, k)} = H_{m},

从而得出传递函数

P_{k, l} {= H}_{0} Σ_{m = 1}^{M} α_{m}^{(k, l)} \cdot H_{m} - - - (7)

滤波器H₁到H_m形成一个由H表示的滤波器组，其具有一个输入和M个输出。

从而在这个例子中，第一和第二信号分量x₁、x₂分别被馈送到具有传输特性H₀的因果稳定滤波器401，其特别地可以是产生纯线性预测系统的单个延迟H₀(z)＝z^-1。

随后，滤波器401的输出被馈送到一个由因果、稳定、线性滤波器403组成的单入多出(SIMO)系统，为了在图4中清楚说明，滤波器403具有两个输出。通常，输出的数量在实际的实施例中将大约是20到50，这反映了根据一个适当的心理声学的频标的相关的自由度(频带)。

滤波器组403的每个输出都在乘法器405中被乘以一个因数α_m ^(l，k)。结果在加法器407中被相加来产生第一和第二信号分量x₁、x₂的(部分)预测。特别地，第一估计信号基于第一信号分量x₁被产生用于第一信号分量x₁，而第二估计信号基于第二信号分量x₂被产生用于第一信号分量x₁。这些估计信号从第一信号分量x₁中被减去来产生第一残留信号e₁。对称处理被应用来产生第二残留信号e₂。

预测系数α_m ^(l，k)可以通过标准线性回归法来确定，即通过最小化第一和第二残留信号e₁、e₂的(加权)平方和来确定。第一和第二信号分量x₁、x₂可以是来自一个立体声信号的未处理的左右信号，但是也可以构成诸如左右通道的带限版本之类的预处理信号。

双通道分析系统可以保证第一和第二残留信号e₁、e₂的频谱是平坦的(从而在形状中相等)并且与第一和第二残留信号e₁、e₂相关联的互相关函数除零延迟外被最小化。这些是一种适用于旋转的情况并且旋转处理器105因此可以被用来构造主和侧信号。

α₀的最优值一般被定义为其产生主信号的(加权)平方和的最大值并且从而产生侧信号的(加权)平方和的最小值。

解码器200执行对编码器的逆操作。特别地，如图5中所示，解码器200的预测解码器207可以利用预测器301、303、305、307，其与那些在编码器中采用的相同。然而，与使用前馈结构的编码器相比，该解码器使用一种反馈结构从而用先前解码的信号抽样来预测当前的信号抽样。

更确切地说，如图6中所示，解码器200的预测解码器207可以利用与编码器相同的预测滤波器结构，但是以一种反馈耦合被耦合并且把最后产生的(部分)信号估计加到残留信号e₁、e₂上。

通常，用这种方法产生的第一和第二残留信号e₁、e₂将具有高斯分布和平坦或白频率频谱。因此，主和侧信号也是具有平坦频谱的高斯信号。然而在某些实施例中，设备还可以包括这样的装置，其用于响应于第一信号分量和第二信号分量的频谱特性来频谱地整形主信号以及优选地整形侧信号。

例如，一个实施例可以使用单编码器在编码处理器109中编码主信号。为了使用一个采用心理声学模型的普通单编码器，具有类似于第一和第二信号分量x₁ x₂的平均频谱形状的频谱形状的信号是优选的。

这不是通过直接编码主信号，而是可以通过使用具有z表示的信号m_s来实现。

M_{s} (z) = \frac{M (z)}{H_{s} (z)} - - - (7)

其中，M(z)是主信号的z表示。相同的滤波可以被应用到侧信号。适当地选择1/H_s(z)，第一和第二信号分量x₁、x₂的平均频谱包络在编码器中被恢复。这种滤波可以在旋转器之前或之后被应用。显而易见，解码器可以因此通过引入一个与H_s(z)的乘法来适配。

优选地，H_s(z)满足下列两个条件：

·|1/H_s(z)|表示第一和第二信号分量x₁、x₂的平均频谱包络。

·H_s(z)可以直接从意指没有额外数据需要被发送的预测系数中被导出。

一个理论上的可能性将是使用下示公式给出的滤波：

H_{s} (z) = \sqrt{F_{1,1} (z) \cdot F_{2,2} (z) - F_{1,2} (z) \cdot F_{2,1} (z)} - - - (8)

其中，F_k，l(z)表示滤波器的z表示

F_1，1(z)＝1-P_1，1(z)，F_2，2(z)＝1-P_2，2(z)，

F_1，2(z)＝-P_1，2(z)and F_2，1(z)＝-P_2，1(z).

这个选项在滤波器H_s(z)不太可能具有有限阶的意义上是理论的。使用近似值，一个可实现滤波器是可行的并且然后仍然将只根据预测系数来定义。

在使用额外滤波器H_s(z)的情况下，解码器的适配是简单明了的。因为，解码器最初实现了一个具有传递函数矩阵的双通道系统：

{(F (z))}^{- 1} = \frac{1}{F_{1,1} F_{2,2} - F_{1,2} F_{2,1}} \cdot (\begin{matrix} F_{2, 2} (z) & {- F}_{1,2} (z) \\ {- F}_{2,1} (z) & F_{1,1} (z) \end{matrix}) - - - (9)

因此，解码器被相应地修改来提供对应的合成系统：

{(F (z))}^{- 1} \cdot H_{s} (z) = \frac{H_{s} (z)}{F_{1,1} F_{2,2} - F_{1,2} F_{2,1}} \cdot (\begin{matrix} F_{2,2} (z) & - F_{1,2} (z) \\ {- F}_{2,1} (z) & F_{1,1} (z) \end{matrix}) - - - (9)

应当理解，上述说明为了清楚起见已经参考存储装置的不同功能单元来描述了本发明的实施例。然而，不同功能单元之间的适当功能分布显然可以被使用而不会贬低本发明。因此，对特定功能单元的引用将只被看作是对用于提供所述功能的适当装置的引用，而不是表示一个严格的逻辑或机械构造、组织或分离。例如，应用数据发生器可以与提取处理器集成并且编合在一起或者可以是其一部分。

本发明可以用任何适当的形式来实现，包括硬件、软件、固件或这些的任何组合。然而，本发明优选地被实现为一个或多个数据处理器和/或数字信号处理器上运行的计算机软件。本发明实施例的元件和分量可以用任何适当的方法被物理地、功能上地并且逻辑上实现。实际上，所述功能可以在一个单元、多个单元或作为其它功能单元的一部分来实现。因而，本发明可以在一个单元中被实现或者可以在不同的单元和处理器之间被物理地和功能上地分布。

尽管本发明已经关于优选实施例被描述，然而它并不是要被限制于此处阐述的特定形式。相反，本发明的范围仅仅由附属的权利要求来限制。在权利要求中，术语“包括”不排除其它元件或步骤的存在。而且，尽管分别地被列出，然而多个装置、元件或方法步骤可以通过一个单元或处理器来实现。另外，尽管个别特征可以被包括在不同的权利要求中，但是这些也许可以被有利地组合，并且在不同权利要求中包含不暗示特征组合是不可行和/或不利的。另外，单数引用并不排除多个。从而，“一个”、“第一”、“第二”等等的引用没有排除多个。权利要求中的参考符号只被提供为澄清实例，而不应该被看作是以任何方法来限制权利要求。

Claims

1.一种用于对包括至少一个第一信号分量和一个第二信号分量的一个多通道信号进行编码的信号编码器，该信号编码器包括：

预测装置(101、103)，用于通过第一信号分量和第二信号分量的线性预测来产生第一信号分量的第一残留信号和第二信号分量的第二残留信号，该线性预测与心理声学特性相关联；

旋转装置(105、107)，用于通过旋转包括第一残留信号和第二残留信号的一个组合信号来产生一个主信号和一个侧信号，主信号具有比侧信号高的信号能量；

第一编码装置109)，用于对主信号进行编码以便产生编码主数据；和

输出装置(111)，用于产生包括已编码主数据的一个输出信号。

2.权利要求1中要求的信号编码器，还包括第二编码装置(109)，用于编码侧信号以便产生编码侧数据；和其中，输出装置(111)还可操作来包括输出信号中的编码侧数据。

3.权利要求2中要求的信号编码器，其中，第二编码装置(109)可操作来参量地编码侧信号。

4.权利要求1中要求的信号编码器，其中，预测装置(101、103)包括至少一个基于心理声学的滤波器组。

5.权利要求1中要求的信号编码器，其中，旋转装置(105、107)可操作来旋转组合信号以便充分地最大化主信号的信号能量。

6.权利要求1中要求的信号编码器，其中，旋转装置(105、107)可操作来旋转组合信号以便充分地最小化侧信号的信号能量。

7.权利要求1中要求的信号编码器，其中，预测装置(101 103)包括第一预测器(301)，用于响应于第一信号分量来产生一个用于第一信号分量的第一估计信号；

第二预测器(303)，用于响应于第二信号分量来产生一个用于第一信号分量的第二估计信号；和

用于产生(309)第一残留信号的装置，第一残留信号为第一信号分量减去第一估计信号和第二估计信号。

8.权利要求7中要求的信号编码器，其中预测装置(101、103)包括第三预测器(305)，用于响应于第一信号分量来产生一个用于第二信号分量的第三估计信号；

第四预测器(307)，用于响应于第二信号分量来产生一个用于第二信号的第四估计信号；和

用于产生(311)第二残留信号的装置，第二残留信号为第二信号分量减去第三估计信号和第四估计信号。

9.权利要求1中要求的信号编码器，其中，旋转装置(105、107)可操作来对组合信号执行一个矩阵乘法。

10.权利要求1中要求的信号编码器，还包括用于响应于第一信号分量和第二信号分量的频谱特性来频谱地整形主信号的装置。

11.权利要求10中要求的信号编码器，其中，第一编码装置(109)包括一个心理声学单编码器。

12.权利要求1中要求的信号编码器，其中，多通道信号是一个立体声音频信号。

13.一种用于解码多通道信号的信号解码器，该信号解码器包括：

接收装置(201、203)，用于接收一个多通道信号；

旋转装置(205)，用于通过多通道信号的旋转来产生第一残留信号和第二残留信号；

合成装置(207)，用于响应于第一残留信号和第二残留信号通过线性预测来产生一个输出的多通道信号，该线性预测与心理声学特性相关联。

14.一种编码多通道信号的方法，多通道信号至少包括一个第一信号分量和一个第二信号分量，该方法包括下列步骤：

通过第一信号分量和第二信号分量的线性预测来产生第一信号分量的第一残留信号和第二信号分量的第二残留信号，该线性预测与心理声学特性相关联；

通过旋转包括第一残留信号和第二残留信号的一个组合信号来产生一个主信号和一个侧信号，主信号具有比侧信号高的信号能量；

对主信号编码以便产生已编码主数据；和

产生包括已编码主数据的输出信号。

15.一种解码多通道信号的方法，该方法包括下列步骤：

接收一个多通道信号；

通过多通道信号的旋转来产生第一残留信号和第二残留信号；和

响应于第一残留信号和第二残留信号通过线性预测来产生一个输出的多通道信号，该线性预测与心理声学特性相关联。

16.一种使得能够执行根据权利要求14或者15的方法的计算机程序。

17.一种包括权利要求16中要求的计算机程序的记录载体。

18.一种包括用于多通道信号的编码数据的数据流，该数据流包括：

线性预测参数，其表示多通道信号的第一信号分量和第二信号分量的线性预测；

表示主信号和组合信号之间的旋转值的旋转参数，该组合信号包括与第一信号分量的线性预测相关联的第一残留信号和与第二信号分量的线性预测相关联的第二残留信号；和

主信号的编码主数据。