CN101887726B

CN101887726B - 立体声编码和解码的方法

Info

Publication number: CN101887726B
Application number: CN2010101493135A
Authority: CN
Inventors: E·G·P·舒伊杰斯; D·J·布里巴特; F·P·迈伯格; L·M·范德克克霍夫
Original assignee: Koninklijke Philips Electronics NV
Current assignee: Koninklijke Philips NV
Priority date: 2004-04-05
Filing date: 2005-03-29
Publication date: 2013-11-20
Anticipated expiration: 2025-03-29
Also published as: JP5032978B2; BRPI0509108B1; US20070171944A1; KR101135726B1; EP1944758A2; US8254585B2; EP3561810B1; PL3561810T3; EP3561810A1; DK3561810T3; TWI387351B; TW200603637A; CN101887726A; MXPA06011396A; JP2007531915A; ES2945463T3; CN1973320B; RU2006139036A; US7646875B2; US20110106540A1

Abstract

提供一种编码输入信号(l、r)以产生编码数据(100)的方法。该方法包括处理输入信号(l、r)以确定描述信号(l、r)间相对相位差异和时间差异的第一参数

并应用这些第一参数

处理输入信号以产生中间信号。该方法包括处理中间信号以确定描述第一中间信号角度旋转的第二参数(α；IID，ρ)，用以产生一个主要信号(m)和一个残留信号(s)，该主要信号(m)的幅值或能量高于残留信号(s)。可应用这些第二参数处理中间信号以产生主要信号(m)和残留信号(s)。该方法还包括量化第一参数、第二参数以及主要信号和残留信号(m，s)，用以产生相应的量化数据，用于后续多路复用以产生编码数据(100)。

Description

立体声编码和解码的方法

本申请是进入中国国家阶段的PCT申请PCT/IB2005/051058(中国申请号200580012102.4)的分案申请，原案的国际申请日为2005年3月29日，发明名称为“立体声编码和解码的方法及其设备”。

技术领域

本发明涉及编码数据的方法，例如涉及一种利用可变的数据分量的角度旋转来编码音频和/或图像数据的方法。此外，本发明还涉及使用这些方法的编码器，并涉及用于对这些编码器所生成的数据进行解码的解码器。另外，本发明关注经由数据载体和/或通信网络传递的编码数据，这种编码数据根据上述方法产生。

背景技术

已知许多用于编码音频和/或图像数据以便产生相应编码输出数据的当代方法。一个编码音频的当代方法示例是公知为MP3的MPEG-1Layer III，其被记载于ISO/IEC JTC1/SC29/WG11 MPEG，IS11172-3，Information Technology-Coding of Moving Picture and Associated Audiofor Digital Storage Media at up to about 1.5Mbit/s，Part 3：Audio(信息技术-以直至约1.5Mbit/s为数字存储介质编码移动图片和相关音频，第3部分：音频)，MPEG-1，1992。这些当代方法中的某些方法用来改进编码效率，即通过使用中/侧(M/S)立体声编码或和/差立体声编码提供增强的数据压缩，J.D.Johnston和A.J Ferreira于1992年3月在加利福尼亚的旧金山Proc.IEEE，Int.Conf.Acoust.，Speech and Signal Proc.II：569-572的“Sum-difference stereo transformcoding(和-差立体声转换编码)”中对和/差立体声编码进行了阐述。

在M/S编码中，立体声信号分别包括左声道和右声道信号l[n]、r[n]，例如通过应用式1和2(Eq.1和2)描述的处理将它们编码为一个和信号m[n]和一个差信号s[n]：

m[n]＝r[n]+l[n] Eq.1

s[n]＝r[n]-l[n] Eq.2

当信号l[n]和r[n]几乎相同时，由于差信号s[n]接近零并因而输送相对少量信息而和信号有效包括了大部分信号信息内容，M/S编码能够提供有效的数据压缩。这种情况下，表示和信号和差信号所要求的比特率接近独立编码信号l[n]和r[n]所要求的一半。

式1和2容许以式3(Eq.3)中旋转矩阵的方式表示：

(\begin{matrix} m [n] \\ s [n] \end{matrix}) = c (\begin{matrix} \cos (\frac{π}{4}) & \sin (\frac{π}{4}) \\ - \sin (\frac{π}{4}) & \cos (\frac{π}{4}) \end{matrix}) (\begin{matrix} l [n] \\ r [n] \end{matrix}) - - - Eq . 3

其中c为通常用于防止限幅的恒定比例缩放系数。

尽管式3有效对应信号l[n]、r[n]旋转45°，但如式4(Eq.4)中所提供的那样，其它旋转角度是可能的，其中α为应用到信号l[n]、r[n]的旋转角度，产生此后分别被描述为主要信号和残留信号的相应编码信号m′[n]、s′[n]：

(\begin{matrix} m^{'} [n] \\ s^{'} [n] \end{matrix}) = c (\begin{matrix} \cos α & \sin (α) \\ - \sin (α) & \cos (α) \end{matrix}) (\begin{matrix} l [n] \\ r [n] \end{matrix}) - - - Eq . 4

角度α被有利地为可变的，以通过减少残留信号s′[n]中出现的信息内容并集中信息内容在主要信号m′[n]中(即最小化残留信号s′[n]中的能量并由此最大化主要信号m′[n]中的能量)来为大范围的信号l[n]、r[n]提供增强的压缩。

式1-4表示的编码技术通常不应用到宽带信号，而是应用到多个子信号，每个子信号只表示用来输送音频信号的全带宽的一个较小部分。此外，式1-4的技术还通常应用到信号l[n]、r[n]的频域表示。

在公布的美国专利US 5621855中，其中阐述了一种对具有第一和第二信号分量的数字信号进行子带编码的方法，该数字信号被子带编码，用以响应第一信号分量产生具有第一q采样信号块的第一子带信号并响应第二信号分量产生具有第二q采样信号块的第二子带信号，第一子带信号和第二子带信号处于相同的子带，且第一和第二信号块在时间上等价。

第一和第二信号块被处理，用以在时间等价采样的点表示之间获得一个最小距离值。当最小距离值小于或等于阀值距离值时，在第一块的每个采样乘以cos(α)并将第二信号块的每个采样乘以-sin(α)之后，通过将第一和第二信号块中的各个时间等价采样对加到一起来获得一个包括q采样的合成块。

尽管前述旋转角度α的应用容许减少其中只应用45°旋转的M/S编码的许多缺点，但也会发现当这些方法应用到信号组时是有问题的，例如立体声信号对，当其中出现可观的相对的相互相位或时间偏移时。本发明旨在解决这一问题。

发明内容

本发明的一个目的是提供一种编码数据的方法。

根据本发明的第一方面，提供了一种编码多个输入信号(l，r)以产生相应编码数据的方法，该方法包括步骤：

处理输入信号(l，r)以确定第一参数

所述第一参数

描述信号(l，r)间相对相位差异和时间差异中的至少一个，并应用这些第一参数处理输入信号以产生相应的中间信号；

处理中间信号和/或输入信号(l，r)以确定第二参数，所述第二参数描述生成主要信号(m)和残留信号(s)所需要的中间信号的旋转，所述主要信号(m)的幅值或能量大于残留信号(s)，并应用这些第二参数处理中间信号以产生主要信号(m)和残留信号(s)；

量化第一参数、第二参数，并编码至少部分主要信号(m)和残留信号(s)以产生相应量化数据；以及

多路复用量化数据以产生编码数据。

本发明的优势在于能够提供更有效的数据编码。

优选地，在该方法中，编码数据只包括残留信号(s)的一部分。部分包含残留信号(s)能够增强编码数据中可达到的数据压缩。

更优选地，在该方法中，编码数据还包括一个或多个指示包含在编码数据中的残留信号部分的参数。这些指示参数容许使编码数据的后续解码的复杂性降低。

优选地，该方法的步骤(a)和(b)通过对频域(l[k]，r[k])中表示的输入信号(l[n]，r[n])实施复旋转实现。实施复旋转能够更有效地处理多个输入信号之间出现的相对时间和/或相位差异。更优选地，在频域或子带域执行步骤(a)和(b)。“子带”被理解为小于一个信号所需完整频率带宽的频率区域。

优选地，在包括输入信号(l、r)的完整频率范围的子部分中应用该方法。更优选地，通过其它编码技术对该完整频率范围的其它子部分进行编码，例如前述的传统M/S编码。

优选地，该方法包括在步骤(c)之后的附加步骤，该步骤无损耗地编码量化数据以提供用于在步骤(d)中多路复用的数据以产生编码数据。更优选地，使用Huffman编码来实现该无损耗编码。使用无损耗编码能够实现潜在地更高的音频质量。

优选地，该方法包括通过删除残留信号(s)中出现的感知上无关的时频信息来对残留信号(s)进行操作的步骤，所述操作后的残留信号(s)贡献到编码数据(100)中，并且所述感知上无关的信息对应输入信号频谱-时间表示中的选定部分。删除感知上无关的信息使本方法能够在编码数据中提供更高程度的数据压缩。

优选地，在该方法的步骤(b)中，通过最小化残留信号(s)的幅值或能量导出第二参数(α；

D，ρ)。同其它导出参数的方法相比，这种方法生成第二参数在计算上是高效的。

优选地，在该方法中，通过信道间强度差参数和相干参数(

D，ρ)表示第二参数(α；

D，ρ)。该方法的这种实现能够提供对现有参数立体声编码和相关解码硬件或软件的向后兼容。

优选地，在该方法的步骤(c)和(d)中，编码数据被安排在多个重要层中，所述层包括输送主要信号(m)的基层、包含对应多个立体声告知参数的第一和/或第二参数的第一增强层、输送残留信号(s)的表示的第二增强层。更优选地，第二增强层还被再分为第一子层和第二子层，第一子层用于输送残留信号(s)的主要相关(mostrelevant)时频信息，第二子层用于输送残留信号(s)的次相关(lessrelevant)时频信息。这些层和子层按要求表示输入信号能够增强编码信号传输错误的稳定性并使其对更简单的解码硬件向后兼容。

根据本发明的第二方面，提供了一种编码器，用于编码多个输入信号(l，r)以产生对应的编码数据，该编码器包括：

第一处理装置，用于处理输入信号(l，r)以确定描述信号(l，r)间相对相位差异和时间差异中至少一个的第一参数所述第一处理装置可操作地应用这些第一参数

来处理输入信号以便产生对应的中间信号；

第二处理装置，用于处理中间信号以确定描述产生主要信号(m)和残留信号(s)所需要的中间信号的旋转，所述主要信号(m)的幅值或能量高于残留信号(s)，第二处理装置可操作地应用这些第二参数处理中间信号以产生至少主要信号(m)和残留信号(s)；

量化装置，用于量化第一参数

第二参数(α；

D，ρ)以及至少部分主要信号(m)和残留信号(s)来产生对应的量化数据；以及

多路复用装置，用于多路复用量化数据以产生编码数据。

该编码器的优点在于其能够提供有效的数据编码。

优选地，该编码器包括通过删除残留信号(s)中出现的感知上无关的时频信息来操作残留信号(s)的处理装置，所述变换残留信号(s)贡献到编码数据(100)中，且所述感知上无关的信息对应输入信号频谱-时间表示中的选定部分。删除感知上无关的信息使编码器能够在编码数据中提供更高程度的数据压缩。

根据本发明的第三方面，提供了一种解码编码数据以重新产生多个输入信号的相应表示(l′，r′)的方法，所述输入信号(l，r)已被在先编码产生所述编码数据，该方法包括步骤：

多路分解编码数据以产生相应的量化数据；

处理量化数据以产生相应的第一参数

第二参数以及至少一个主要信号(m)和一个残留信号(s)，所述主要信号(m)的幅值或能量高于残留信号(s)；

通过应用第二参数旋转该主要信号(m)和残留信号(s)，以产生相应的中间信号；以及

通过应用第一参数

处理中间信号以重新产生所述输入信号的所述表示(l′，r′)，第一参数

描述信号(l，r)间相对相位差异和时间差异中的至少一个。

该方法提供了能够对已使用根据本发明第一方面的方法有效编码的数据进行有效解码的优点。

优选地，该方法的步骤(b)还包括对残留信号(s)的丢失时频信息适当补充从主要信号(m)中导出的合成残留信号的步骤。所述合成信号的产生能够导致有效解码编码数据。

优选地，在该方法中，编码数据包括多个指示残留信号(s)的哪些部分被编码到编码数据中的参数。包括这些指示参数能够使编码要求高效和更少量的计算。

根据本发明的第四方面，提供了一种解码器，用于解码编码数据以重新产生多个输入信号的相应表示(l′，r′)，所述输入信号(l，r)已被在先编码产生编码数据，该解码器包括：

多路分解装置，用于多路分解编码数据以产生相应的量化数据；

第一处理装置，用于处理量化数据以产生相应的第一参数

第二处理装置，用于通过应用第二参数来旋转主要信号(m)和残留信号(s)，以产生相应的中间信号；以及

第三处理装置，用于通过应用第一参数

来处理中间信号，以产生输入信号(l，r)的所述表示，第一参数描述信号(l，r)间的相对相位差异和时间差异中的至少一个。

优选地，第二处理装置可操作地产生从解码的主要信号(m)中导出的补充合成信号，用以提供从解码的残留信号中丢失的信息。

根据本发明的第五方面，提供了根据本发明第一方面的方法产生的编码数据，该数据为记录在数据载体上的数据或可经由通信网络传递的数据中的一种。

根据本发明的第六方面，提供了用于在计算硬件上执行本发明第一方面的方法的软件。

根据本发明的第七方面，提供了在计算硬件上执行本发明第三方面的方法的软件。

根据本发明的第八方面，提供了记录在数据载波上的编码数据和可经由通信网络传递的编码数据中的至少一种编码数据，所述数据包括量化第一参数、量化第二参数、和对应至少部分主要信号(m)和残留信号(s)的量化数据的多路复用，其中主要信号(m)的幅值或能量高于残留信号(s)，所述主要信号(m)和所述残留信号(s)可通过根据第二参数旋转中间信号导出，通过处理多个输入信号来产生所述中间信号以补偿第一参数所描述的在多个输入信号间的相对相位和/或时间延迟。

应该理解，在不背离所附权利要求规定的本发明范畴的前提下，本发明的特征容许结合到任何组合当中。

附图说明

现参考下列附图仅通过示例的方式对本发明实施例进行阐述，其中：

图1说明满足相对相互时间和相位延迟的信号l[n]、r[n]的采样序列；

图2对依照式1和2的传统M/S变换应用到图1的信号以产生相应的和信号与差信号m[n]、s[n]进行说明；

图3对依照式4的旋转变换应用到图1信号以产生相应主要信号m[n]和残留信号s[n]进行说明；

图4对应用根据本发明的依照式5至15的复旋转变换以产生相应的主要信号m[n]和残留信号s[n]进行说明，其中尽管图1的信号具有相对相互相位和时间延迟，但残留信号具有相对小的幅值；

图5是根据本发明的编码器的示意图；

图6是根据本发明的解码器的示意图，该解码器同图5的编码器兼容；

图7是参数立体声解码器的示意图；

图8是根据本发明的增强参数立体声编码器的示意图；以及

图9是根据本发明的增强参数立体声解码器的示意图，该解码器同图9编码器兼容。

具体实施方式

总的说来，本发明涉及一种编码数据的方法，其相对前述使用可变旋转角度的M/S编码方法表现出进步。发明者为了能够更好地编码同满足一定相位和/或时间偏移的信号组相对应的数据而发明了该方法。此外，同传统编码技术相比，该方法通过使用当信号l[n]、r[n]分别由其等价的复值频域表示l[k]、r[k]表示时可用的旋转角度α值而提供了优势。

角度α被设置为实值并且是实值相位旋转，该实值相位旋转被应用于使信号l[n]、r[n]相互“相干”，用以调节这些信号间的相互时间和/或相位延迟。但是，复值旋转角度α的使用使本发明更容易实现。这种通过角度α实现旋转的替代方法可在本发明的范畴内实施。

前述时域信号l[n]、r[n]的频域表示优选通过应用式5和6(Eq.5和6)描述的时间加窗过程来导出以提供加窗信号l_q[n]、r_q[n]：

l_q[n]＝l[n+qH]h[n] Eq.5

r_q[n]＝r[n+qH]h[n] Eq.6

其中

q＝帧指标，q＝0，1，2，…表示连续的信号帧；

H＝跳跃尺寸或更新尺寸；并且

n＝时间指标，具有取值范围0到L-1，其中参数L等价于窗h[n]的长度。

可通过式7和8(Eq.7和8)中所描述的离散傅立叶变换(DFT)或功能上等价的变换将加窗信号l_q[n]、r_q[n]变换到频域：

l [k] = Σ_{n = 0}^{N - 1} l_{q} [n] \exp (- j \frac{2 πkn}{N}) - - - Eq . 7

r [k] = Σ_{n = 0}^{N - 1} r_{q} [n] \exp (- j \frac{2 πkn}{N}) - - - Eq . 8

其中参数N表示DFT长度，因此N≥L。由于实值序列的DFT是对称的，因此只有前N/2+1个点在转换后被保存下来。为了在实施DFT时保存信号能量，优选使用下面式9和10(Eq.9和10)中描述的比例缩放：

l [0] = \frac{l [0]}{3} - - - Eq . 9

r [0] = \frac{r [0]}{2} - - - Eq . 10

本发明方法执行式11(Eq.11)描述的信号处理操作来将式7和8中的频域信号表示l[k]、r[k]转换为频域中的相应旋转和信号与差信号m″[k]、s″[k]：

其中

α＝实值可变旋转角度；

并且

角度

的使用是可选的。此外，优选在逐帧的基础上即帧步骤上动态执行按照式11的旋转。但是，这种逐帧旋转中的动态变化将潜在地导致和信号m″[k]中的间断，可通过适当选择角度至少部分删除所述间断。

另外，优选将式11的频率范围k＝0，…，N/2+1划分为子范围，即区。编码期间对每个区来说，其相应的角度参数α、

和

被独立确定、编码并随后被发送或输送到解码器用于后续解码。通过安排要再分的频率范围，可在编码期间更好地捕获信号特征，这潜在地导致更高的压缩比。

执行了按照式7到11的映射后，对信号m″[k]、s″[k]进行式12和13(Eq.12&13)中描述的离散傅立叶逆变换：

m_{q} [n] = Σ_{n = 0}^{N - 1} m [k] \exp (j \frac{2 πkn}{N}) - - - Eq . 12

s_{q} [n] = Σ_{n = 0}^{N - 1} s [k] \exp (j \frac{2 πkn}{N}) - - - Eq . 13

其中

m_q[n]＝主要时域表示；并且

s_q[n]＝残留(差)时域表示。

在该方法中，主要和残留表示随后被转换成窗基础上的表示，按式14和15(Eq.14和15)描述的处理操作所提供那样对所述窗基础上的表示应用重叠：

m[n+qH]＝m[n+qH]+2Re{m_q[n]h[n]} Eq.14

s[n+qH]＝s[n+qH]+2Re{s_q[n]h[n]} Eq.15

或者，式5到15描述的本发明方法的处理操作容许至少部分通过使用复调制滤波器组来实际实现。计算机处理硬件中应用的数字处理可用来执行本发明。

为了说明本发明方法，将阐述本发明的一个信号处理示例。例如，将两个时间信号用作需要使用本方法处理的初始信号，这两个信号由式16和17(Eq.16和17)定义：

l[n]＝0.5cos(0.32n+0.4)+0.05z₁[n]+0.06z₂[n] Eq.16

r[n]＝0.25cos(0.32n+1.8)+0.03z₁[n]+0.05z₃[n] Eq.17

其中z₁[n]、z₂[n]和z₃[n]为相互独立的单位方差白噪声序列。为了更好地理解本发明方法的操作，图1中示出了式16和17描述的信号l[n]、r[n]的一些部分。

图2中示出M/S变换信号m[n]和s[n]，这些信号是从式16和17的信号l[n]、r[n]通过式1和2的传统处理导出的。由图2可以看出，从式16和17的信号产生信号m[n]和s[n]的传统方法将导致残留信号s[n]的能量高于式17中输入信号r[n]的能量。很明显，由于信号s[n]不具有可忽略的幅值，因此应用到式16和17信号上的传统M/S变换信号处理在信号压缩方面是低效的。

通过使用式4描述的旋转变换，使示例信号l[n]、r[n]能够如图3所示那样降低其相应残留信号s[n]中的残留能量并相应增强其主要信号m[n]。尽管式4的旋转方法能够比图2中给出的传统M/S处理实现得更好，但发明者发现当信号l[n]、r[n]满足相对相互相位和/或时间偏移时式4的旋转方法并不令人满意。

当式16和17的采样信号l[n]、r[n]被转换到频域时，则其受到按照式5到15的复优化旋转，将残留信号s[n]的能量降低到图4所示的较低幅值是可能的。

下面阐述用来实现式5到15所描述的信号处理的编码器硬件的实施例。

图5中，示出了根据本发明的一个编码器，通常由10表示。编码器10用来接收左声道(l)和右声道(r)互补输入信号并编码这些信号以产生编码比特流(bs)100。此外，编码器10包括相位旋转单元20、信号旋转单元30、时间/频率选择器40、第一编码器50、第二编码器60、参数量化处理单元(Q)70以及比特流多路复用器单元80。

输入信号l、r耦合到相位旋转单元20的输入端，相位旋转单元20的相应输出端连接到信号旋转单元30。信号旋转单元30的主要信号和残留信号分别由m、s表示。主要信号m经由第一编码器50输送到多路复用器单元80。此外，残留信号s经由时间/频率选择器40耦合到第二编码器60并随后耦合到多路复用器单元80。来自相位旋转单元20的角度参数输出

经由处理单元70耦合到多路复用器单元80。此外，角度参数输出α从信号旋转单元30经由处理单元70耦合到多路复用器单元80。多路复用器单元80包括前述的编码比特流输出(bs)100。

操作中，相位旋转单元20对信号l、r应用处理以便对它们之间的相对相位差异做出补偿，并由此产生参数

其中参数

表示这种相对相位差异，参数

被传递到处理单元70进行量化，并由此作为相应的参数数据包含在编码比特流100中。被补偿了相对相位差异的信号l、r传递到信号旋转单元30，信号旋转单元30为角度α确定一个优化值用以将最大量的信号能量集中在主要信号m中并将最少量的信号能量集中在残留信号s中。主要信号和残留信号m、s而后经由编码器50、60传递以便被转换成合适的格式包含在比特流100中。处理单元70接收角度信号α、并将它们同编码器50、60的输出一起多路复用，以便产生比特流输出(bs)100。因此，比特流(bs)100包括包含主要信号和残留信号m、s以及角度参数数据α、

的表示的数据流，其中参数

是必需的，而参数是可选的但有益的包含该参数。

编码器50和60优选实现为两个单声道音频编码器，或实现为一个双声道编码器。可选地，可在时间/频率选择器40中删除残留信号s没有在感知上贡献到比特流100中的某些部分(例如在时频平面中表示时被识别)，由此提供下面更详细阐述的可伸缩的数据压缩。

编码器10可选地能够用来在包括输入信号的完整频率范围的一部分上处理输入信号(l、r)。输入信号(l、r)中没有被编码器10编码的那些部分随后被其它方法平行地被编码，例如通过前面阐述的传统M/S编码。如果需要，可实现左声道(l)和右声道(r)输入信号的单独编码。

编码器10容许被实现在硬件中，例如实现为一种专用集成电路或此类电路组。或者，编码器10可实现在执行于计算硬件上(例如在专有软件驱动信号处理集成电路或此类电路组上)的软件中。

图6中，总的由200表示同编码器10兼容的解码器。解码器200包括一个比特流多路分解器210、第一和第二解码器220、230，用于去量化(de-quantizing)参数的处理单元240、信号旋转解码器单元250以及提供同输入到编码器10中的输入信号l、r相对应的解码输出l′、r′的相位旋转解码单元260。多路分解器210被配置来接收由编码器10产生的比特流(bs)100，该比特流(bs)100例如通过数据载体(例如诸如CD或DVD的光盘数据载体)和/或经由诸如因特网的通信网络从编码器10输送到解码器200。多路分解器210的多路分解输出被耦合到解码器220、230的输入端并被耦合到处理单元240。第一和第二解码器220、230分别包括被耦合到旋转解码器单元250的主要和残留解码输出m′、s′。此外，处理单元240包括同样被耦合到旋转解码器单元250的旋转角度输出α′；角度α′对应于针对编码器10的前述角度α的解码版本。角度输出

对应于针对编码器10的前述角度

的解码版本；这些角度输出同来自旋转解码器单元250的解码主要信号和残留信号输出一起被输送到相位旋转解码单元260，相位旋转解码单元260正如说明的那样包括解码输出l′、r′。

操作中，解码器200执行编码器10中所执行的编码步骤的逆步骤。因此，在解码器200中，在多路分解器210中多路分解比特流100以分离同主要信号和残留信号相对应的数据，所述数据被解码器220、230重构以产生解码的主要信号和残留信号m′、s′。然后根据角度α′旋转这些信号m′、s′，并随后通过角度针对相对相位对它们进行校正以便重新生成左声道信号和右声道信号l′、r′。从多路分解器210中多路分解的参数重新生成角度

α′，并在处理单元240中分离这些角度。

编码器10和解码器200中，优选地在比特流100中传送一个

D值和一个相干值ρ，而不是前述角度α。

D值被用来表示信道间差异，即表示左信道信号和右信道信号l、r间频率和时间变量幅值差异。相干值ρ表示频率变量相干，即相位同步后左声道信号和右声道信号l、r间的相似性。但是，例如在解码器200中，可容易地通过应用式18(Eq.18)从

D值和ρ值导出角度α：

图7中，由400总的表示参数解码器，这个解码器400与根据本发明的编码器互为补充。解码器400包括比特流多路分解器410、解码器420、解相关单元430、比例缩放单元440、信号旋转单元450、相位旋转单元460以及去量化单元470。多路分解器410包括一个用于接收比特流信号(bs)100的输入端和四个用于信号m、s数据、角度参数数据、

D数据和相干数据ρ的相应输出端，这些输出端如图示那样连接到解码器420和去量化单元470。解码器420的一个输出端经由解相关单元430耦合，以便重新产生输入到比例缩放功能440的残留信号表示s′。此外，重新产生的主要信号表示m′从解码器单元420输送到比例缩放单元440。同样从去量化单元470为比例缩放单元440提供

D′和相干数据ρ′。比例缩放单元440的输出端被耦合到信号旋转单元450，用以产生中间输出信号。随后，在相位旋转单元460中使用去量化单元470解码的角度

来校正这些中间输出信号，以便重新产生左声道信号和右声道信号表示l′、r′。

解码器400同图6解码器200的区别在于解码器400包括解相关单元430，该解相关单元430通过解相关单元430内执行的解相关过程来根据主要信号m′估计残留信号s′。此外，左和右输出信号l′、r′间的相干量通过比例缩放操作确定。比例缩放操作在比例缩放单元440中被执行并涉及主要信号m′和残留信号s′间的比率。

参考图8，示出一个由500总的表示的增强编码器。编码器500包括分别接收左和右输入信号l、r的相位旋转单元510、信号旋转单元520、时间/频率选择器530、各个第一和第二编码器540、550、量化单元560以及包括比特流输出(bs)100的多路复用器570。来自相位旋转单元510的角度输出从相位旋转单元510耦合到量化单元560。此外，来自相位旋转单元510的相位校正过的输出经由信号旋转单元520和时间/频率选择器530被连接，用以分别产生主要信号和残留信号m、s以及

D和相干ρ数据/参数。

D和相干ρ数据/参数耦合到量化单元560，而主要信号和残留信号m、s经由第一和第二编码器540、550传递，用以为多路复用器570产生相应的数据。多路复用器570还用来接收描述角度

相干ρ和

D的数据。多路复用器570可操作地多路复用来自编码器540、550和量化单元560的数据，用以产生比特流(bs)100。

编码器500中，直接将残留信号s编码为比特流100。可选地，时间/频率选择器单元530可操作地确定残留信号s时间/频率平面的哪个部分被编码成比特流(bs)100，由此单元530确定残留信息包含在比特流100中的程度，并由此影响编码器500中可得到的压缩同比特流100中包含信息的程度之间的折衷。

在图9中，由600总的表示增强参数解码器，解码器600与图8所示编码器500互为补充。解码器600包括多路分解器610、各个第一和第二解码器620、640、解相关单元630、组合器单元650、比例缩放单元660、信号旋转单元670、相位旋转单元680以及去量化单元690。多路分解器单元610被耦合来接收编码比特流(bs)100并将相应的多路分解输出提供到第一和第二解码器620、640，并且还提供到多路分解器单元690。同解相关单元630和组合器单元650连接的解码器620、640分别可操作地重新产生主要信号和残留信号的表示m′、s′。这些表示在比例缩放单元660中接受比例缩放过程并随后在信号旋转单元670中接受旋转，以便产生中间信号，随后中间信号在旋转单元680中响应于去量化单元690所产生的角度参数被相位旋转，用以重新产生左声道和右声道信号的表示l′、r′。

解码器600中，比特流100被多路分解成用于主要信号m′、残留信号s′和立体声参数的独立流。随后，主要信号和残留信号m′、s′分别被解码器620、640解码。残留信号s′中被编码到比特流100中的那些频谱/时间部分在比特流100中被隐含(即通过检测时频平面中的“空白”区域)或明确(即通过从比特流100解码的表示信令参数)传递。解相关单元630和组合器单元650可操作地利用合成残留信号有效填充所解码的残留信号s′中的空白时频区域。这个合成信号通过使用所解码的主要信号m′来产生并从解相关单元650输出。对于所有的其它时频区域，应用残留信号s构造解码残留信号s′；对于这些区域，不在比例缩放单元660应用比例缩放。可选地，对于这些区域，在编码器500中传送前述角度α是有益的，而并非

D和相干ρ数据，因为输送单个角度参数α所需要的数据速率比输送等价的 D和相干ρ参数数据所需要的数据速率低。但是，角度α参数(而不是 D和相干ρ参数数据)在比特流100中的传输使编码器500和解码器600无法同使用这种 D和相干ρ数据的常规传统参数立体声(PS)系统向后兼容。

编码器10、500的各个选择器单元40、530在选择需要将残留信号s的哪个时频区域编码到比特流100中时优选使用一种感知模型。通过编码编码器10、500中残留信号s的不同时频方面，由此有可能实现比特率可缩放编码器和解码器。当比特流100中的多个层相互依赖时，同感知上很相关的时频方面相对应的编码数据被包含在该多个层中包括的基层中，感知上更不重要的数据被移动到该多个层中包括的精炼层或增强层中；“增强层”也称为“精炼层”。这样的一种方案中，所述基层优选包括对应主要信号m的比特流、第一增强层以及第二增强层，其中第一增强层包括同诸如前述角度α、

的立体声参数相对应的比特流，第二增强层包括同残留信号s对应的比特流。

比特流数据100中层的这种安排允许对残留信号s进行输送的第二增强层被可选地丢失或删除；此外，图10中示出的解码器600能够如前面阐述的那样将解码的多个剩余层同合成残留信号相组合，用以产生感知上有意义的残留信号以便用户欣赏。此外，如果例如由于成本和/或复杂性限制而可选地没有为解码器600提供第二解码器640，即使以降低的质量但仍能解码残留信号s。

删除前述比特流(bs)100中的编码角度参数

可能导致前述比特流(bs)100的比特率进一步降低。这种情况下，解码器600中的相位旋转单元680通过定值(例如零值)的缺省旋转角度重建所重新产生的信号l′、r′；这种进一步的比特率降低利用以下特性，即人类听觉系统在较高音频处是相对相位不灵敏的。作为一个示例，在比特流(bs)100中传输参数

且从那里删除参数以便降低比特率。

前面阐述的根据本发明的编码器和互补解码器可潜在用于大范围的电子仪器和系统中，例如至少下列之一中：因特网收音机、因特网流传送、电子音乐分发(EMD：electronic music distribution)、固态音频播放器和记录器以及通常的电视和音频产品。

尽管上面阐述了一种编码输入信号(l、r)以产生比特流100的方法以及解码前述比特流100的补充方法，但应该理解本发明容许用来编码多于两个的输入信号。例如本发明能够适于为多信道音频(例如5信道家庭影院系统)提供数据编码和相应解码。

在附加的权利要求书中，括号内包含的数字和其它符号用来辅助理解权利要求书，而不以任何方式限制权利要求的范围。

应该理解，在不背离附加的权利要求书规定的本发明范围的前提下容许对前述的本发明实施例做出修改。

在解释说明书及其权利要求书时，诸如“包括”、“包括”、“结合”、“含有”，“是”以及“具有”的表述应该以非穷尽的方式理解，也就是说应该被理解为还可能存在没有清楚列出的其它项目或者部件。参考为单数的也可理解成参考复数，反之亦然。

Claims

1.一种编码和解码方法，用于将至少第一和第二宽带数字音频信号成分(L，R)编码成复合数据信号，以及用于将该复合数据信号解码成所述至少第一和第二宽带数字音频信号成分的副本，

所述方法包括以下编码步骤：

-分别接收所述至少第一和第二宽带数字音频信号成分；

-将第一和第二宽带数字音频信号成分中的每个成分从时域转换成多个窄带子信号，针对宽带数字音频信号成分的用于窄带的子信号表示所述窄带中的宽带音频信号成分，

-在窄带中通过信号旋转将所述窄带中的所述第一和第二宽带数字音频信号成分的子信号转换成针对所述窄带的复合子信号，该信号旋转还适于可选地在窄带内将所述第一和第二宽带数字音频信号成分的子信号转换成误差子信号，

-将复合子信号和误差子信号(如果存在的话)组合成复合数据信号，

-输出所述复合数据信号，以及

所述方法还包括以下解码步骤：

-接收所述复合数据信号，

-解复用所述复合数据信号，以从所述复合数据信号恢复复合子信号和误差子信号(如果存在的话)，

-将复合子信号解相关成解相关的子信号，

-在窄带内将所述窄带中的所述解相关的子信号与所述窄带中的误差子信号进行组合，使得当在窄带中存在误差子信号时，将该误差子信号提供为另一组合单元的输出端的输出信号，以及当在窄带中不存在误差子信号时，将所述窄带中的所述解相关的子信号提供为所述另一组合单元的输出端的输出信号，

-通过信号旋转，在窄带内将复合子信号和输出信号转换成所述窄带内针对第一和第二宽带数字音频信号成分的子信号的副本，

-将所述第一和第二宽带数字音频信号成分的子信号的副本从频域转换成所述第一和第二宽带数字音频信号成分的时域副本。

2.如权利要求1所述的编码和解码方法，其特征在于，

所述编码步骤还包括：产生控制信号，该信号指示误差子信号是否可用于窄带，以及将控制信号组合到所述复合数据信号中并且所述解码步骤包括：从所述复合数据信号中恢复控制信号，以及根据控制信号提供误差子信号或解相关的子信号。