CN101604524B

CN101604524B - 立体声编码方法及其装置、立体声解码方法及其装置

Info

Publication number: CN101604524B
Application number: CN2008101147525A
Authority: CN
Inventors: 徐恒宇; 李靓; 潘兴德
Original assignee: BEIJING TIANLAI CHUANYIN DIGITAL TECHNOLOGY Co Ltd
Current assignee: BEIJING TIANLAI CHUANYIN DIGITAL TECHNOLOGY Co Ltd
Priority date: 2008-06-11
Filing date: 2008-06-11
Publication date: 2012-01-11
Anticipated expiration: 2028-06-11
Also published as: CN101604524A

Abstract

本发明公开了一种立体声编码方法，该方法包括：提取表征立体声中第一声道频谱与第二声道频谱的能量比的第一立体声参数，表征第一声道和第二声道的加权差频谱与加权和频谱能量比的第二立体声参数，并获取第一声道和第二声道的加权和频谱；其中，所述加权的权值为所述第一立体声参数；所述第一声道和第二声道分别为所述立体声中左声道和右声道中的一个和另一个；对所述加权和频谱、第一立体声参数和第二立体声参数进行编码，向解码端发送。本发明还公开了一种针对于该编码方法的解码方法，以及一种立体声编码装置和一种立体声解码装置。使用本发明能够实现低码率下对立体声的高质量编码。解码过程也无需任何的角度计算，降低了解码复杂度。

Description

立体声编码方法及其装置、立体声解码方法及其装置

技术领域

本发明涉及编解码技术，具体涉及立体声编码方法及装置、立体声解码方法及其装置。

背景技术

在低码率的声音编解码应用中，为了尽量减少传输数据量，提高低码率条件下的传输效率，可以只传输单声道信号。但是，单声道信号给听者的感觉是从头部内产生声音，如果收听时间较长则会产生不舒服的感觉，因此希望能在低码率条件下引入立体声的效果。其中，低码率是指单位时间内传输较少的比特位。

目前的立体声编解码方案有：纯粹的后处理方案、和差立体声方案和扩展的宽带自适应多速率(AMR-WB+，Extended AdaptiveMulti-Rate-Wideband)立体声编解码方案。

其中，单纯的后处理方案是在解码器端向所接收的单声道信号中添加一个延时信号，从而构建出双声道立体声信号，以建立立体声感觉。这种方法的优点是只需传输单声道信号，占用码率空间小。但是，后处理方案不能区分原始信号是单声道信号还是立体声信号，即使原始信号为单纯的单声道信号，也将被盲目的转换成立体声信号，此时，听者会感觉到不舒服，而且这种情况经常发生在语音信号的录音中。此外，这种后处理的方案仅能建立类似立体声的感觉，并不能准确恢复出原始信号声像的位置。

和差立体声方案利用原始信号左右声道的相关性，分别对左右声道的和信号

\overset{&RightArrow;}{M} = (\overset{&RightArrow;}{L} + \overset{&RightArrow;}{R}) / 2

和差信号

\overset{&RightArrow;}{S} = (\overset{&RightArrow;}{L} - \overset{&RightArrow;}{R}) / 2

进行波形编码，其中，

为左声道信号，

为右声道信号，

为和信号，

为差信号；

和

都是具有长度和方向的向量。但是，和差立体声方案需要传输和信号和差信号，因此在低码率编码应用中需占用较多的码率空间，因此传输效率不高。只有原始信号左右声道极其相似的情况下，差信号所需比特数才有所减少，此时才能体现出高效率。而在很多情况下，例如左右声道分别录制不同的乐器，或者左右声道声像较偏、左右声道信号能量相差很大的情况下，这种同时传输差信号的处理就无法在低码率的条件下达到较好的效果。因此，和差立体声方案在低码率的条件下并不能达到较好的效果。

扩展的宽带自适应多速率(AMR-WB+，Extended Adaptive Multi-Rate-Wideband)立体声编解码方案，是目前较为有效的立体声编码技术。但是，该方案中的立体声编码技术采用时域滤波方法实现，其分辨率不高，解码后生成的立体声声音质量也比较低，不能更好的接近原始立体声。

因此，研究一种低码率下对立体声的高质量编码是亟待解决的问题。

发明内容

有鉴于此，本发明提供了一种立体声编码方法，能够实现低码率下对立体声的高质量编码。

该方法包括：

A、编码端提取表征立体声中第一声道频谱与第二声道频谱的能量比的第一立体声参数，表征第一声道和第二声道的加权差频谱与加权和频谱能量比的第二立体声参数，并获取第一声道和第二声道的加权和频谱；

所述加权和频谱是将左右声道中的第二声道频谱进行长度缩放，使得缩放后第二声道频谱与未缩放的第一声道频谱能量相等，然后将未缩放第一声道频谱和缩放后第二声道频谱进行向量相加得到的；

所述加权差频谱是将上述未缩放第一声道频谱和缩放后第二声道频谱相减得到的；

其中，加权的权值为所述第一立体声参数；所述第一声道和第二声道分别为所述立体声中左声道和右声道中的一个和另一个；

B、对所述加权和频谱、第一立体声参数和第二立体声参数进行编码，向解码端发送。

本发明还提供了一种立体声解码方法，能够实现低码率下对立体声的高质量编码。

该方法包括：

A、解码端接收立体声第一声道与第二声道的加权和频谱，以及第一立体声参数和第二立体声参数；所述第一立体声参数表征第一声道频谱和第二声道频谱的能量比，所述第二立体声参数表征第一声道和第二声道的加权差频谱与加权和频谱的能量比；

B、利用加权和频谱与采用第二立体声参数进行缩放的缩放后加权差频谱具有等幅垂直的特点，计算加权差频谱；

C、根据所述加权和频谱、加权差频谱以及第一立体声参数，恢复第一声道频谱和第二声道频谱。

本发明还提供了一种立体声编码装置，能够实现低码率下对立体声的高质量编码。

该装置包括第一参数提取单元、第二参数提取单元、加权单元和发送单元；

所述第一参数提取单元，用于提取表征立体声第一声道频谱和第二声道频谱的能量比的第一立体声参数；所述第一声道和第二声道分别为所述立体声中左声道和右声道中的一个和另一个；

所述加权单元，用于获取每个频点上第一声道和第二声道的加权和频谱，加权的权值为所述第一立体声参数；

所述第二参数提取单元，用于提取表征第一声道和第二声道加权差频谱与所述加权和频谱之间能量比的第二立体声参数；

所述发送单元，用于向解码端发送从第一参数提取单元获取的第一立体声参数、从第二参数提取单元获取的第二立体声参数和从加权单元获取的加权和频谱；

所述加权差频谱是将上述未缩放第一声道频谱和缩放后第二声道频谱相减得到的。

本发明还提供了一种立体声解码装置，能够实现低码率下对立体声的高质量编码。

该装置包括接收单元、中间参数求取单元和恢复单元；

所述接收单元，用于接收立体声第一声道与第二声道的加权和频谱，以及第一立体声参数和第二立体声参数；所述第一立体声参数表征第一声道频谱和第二声道频谱之间的能量比，所述第二立体声参数表征第一声道和第二声道的加权差频谱和加权和频谱的能量比；加权的权值为第一立体声参数；

其中，加权的权值为第一立体声参数；所述第一声道和第二声道分别为所述立体声中左声道和右声道中的一个和另一个；

所述中间参数求取单元，用于利用加权和频谱与采用第二立体声参数进行缩放的缩放后加权差频谱具有等幅垂直的特点，计算加权差频谱；

所述恢复单元，用于根据所述加权和频谱、加权差频谱以及第一立体声参数，恢复第一声道频谱和第二声道频谱。

根据以上技术方案可见，本发明采用频域编码方法实现，其分辨率较高，解码后生成的立体声声音质量也相对较高，能够较好的接近原始立体声，提高了立体声编解码质量。而且，经编码，只需传输加权和声道频谱以及两个立体声参数，有效地提高了低码率条件下的传输效率。

在解码端，利用左右声道的加权和以及加权差近似垂直这一隐含参数，得到加权差，并采用加权和、加权差以及作为加权权值的第一立体声参数恢复得到左右声道频谱，整个恢复过程没有进行正弦、余弦等角度计算，因此大大降低了解码端的解码复杂度，从而减小了解码时间。

较佳地，当根据最小均方差准则对加权和以及两个立体声参数的求取进行优化后，令加权和以及两个立体声参数的取值能够使得左右声道均方差之和最小，则，恢复出的立体声解码信号更加接近原始信号，进一步提高了立体声编解码质量。

附图说明

图1为本发明实施例中立体声编码方法的流程图。

图2为本发明实施例中立体声编码模式模型图。

图3为本发明实施例中立体声解码方法的流程图。

图4为本发明实施例中立体声编码装置的结构示意图。

图5为本发明实施例中立体声解码装置的结构示意图。

具体实施方式

本发明实施例所提供的立体声编解码方案属于参数立体声方案，其基本思想为：编码端提取表征立体声信号特征的立体声参数，只传输左右声道的加权和频谱以及所提取的参数，从而减少所传输数据数量，以达到低码率条件下较好的传输效率。所提取的立体声参数分别是表征左右声道能量比的第一立体声参数，和表征左右声道加权差和加权和能量比的第二立体声参数。

加权和频谱的求取方式是：将左右声道中的第二声道频谱进行长度缩放，使得缩放后第二声道频谱与未缩放的第一声道频谱能量相等，然后将未缩放第一声道频谱和缩放后第二声道频谱进行向量相加，得到的加权和频谱。

加权差频谱是将上述未缩放第一声道频谱和缩放后第二声道频谱相减得到的。

由于未缩放第一声道和缩放后的第二声道能量相等，因此加权和频谱与加权差频谱之间的角度关系是垂直的。那么当通过第二立体声参数对加权差进行缩放，就可以得到缩放后的加权差频谱，该缩放后的加权差频谱与加权和频谱垂直且等长。

那么，在解码端，当接收到加权和频谱时，能够获取其等幅垂直的缩放后加权差频谱，然后利用第二立体声参数进行缩放，得到原始的加权差频谱。然后利用加权和频谱以及加权差频谱，得到左声道和缩放后的右声道，最后利用第一立体声参数对缩放后的右声道进行缩放，从而获得原始右声道频谱。

从以上所述可以看到，本发明解码端恢复立体声所利用的数据不仅包括所传输的加权和频谱以及两个立体声参数，还包括加权和频谱与缩放后的加权差频谱具有等幅垂直这一特点，实际上这一特点是解码时所利用的必不可少的隐性参数。该隐性参数不必在码流中传输，减少了传输码流的比特数，提高了低码流下的传输效率，而且，利用该隐性参数只需将加权和频谱进行等幅垂直的变换处理，而频谱信号是由实部和虚部组成的，所谓等幅垂直处理就是对加权和的虚部取负，然后将实部数值和取负后的虚部数值进行实虚部的调换，得到缩放后的加权差频谱。然后再利用第一立体声参数和第二立体声参数进行乘除运算，得到第一声道频谱和第二声道频谱。整个计算过程无需任何的角度计算，降低了解码复杂度，从而减少了解码端的解码时间。

下面，结合附图并举实施例，对本发明进行详细描述。

图1为本发明实施例中立体声编码方法的流程图。该实施例以第一声道为左声道，第二声道为右声道为例，进行描述。如图1所示，该方法包括以下步骤：

步骤100：分别对立体声的左声道信号和右声道信道进行离散傅立叶变换(DFT)变换，得到DFT变换域上的左声道频谱和右声道频谱。

步骤101：分别将立体声的左声道频谱和右声道频谱划分为K个子频带，K为正整数。

在DFT变换域上，各子频带内的左声道频谱

和右声道频谱

都是频谱向量，具有实部和虚部。子频带内的

和

的表达式为：

\overset{&RightArrow;}{L} [i, k] = x_{l} [i, k] + {jy}_{l} [i, k]; - - - (1)

\overset{&RightArrow;}{R} [i, k] = x_{r} [i, k] + {jy}_{r} [i, k]; - - - (2)

其中，x_l和y_l分别为左声道频谱的实部和虚部，x_r和y_r分别为右声道频谱的实部和虚部，k为子频带标号，i为子频带内的频率点标号。以下描述中涉及到

就表示

表示

步骤102：分别在每个子频带k内，提取各子频带中表征左声道频谱和右声道频谱能量比的第一立体声参数

k＝1、2......K。

本步骤中，第一立体声参数为左声道频谱的能量与右声道频谱的能量之间的比值，其计算方法可以采用以下公式：

\frac{1}{g_{r} (k)} = \sqrt{\frac{E_{L} (k)}{E_{R} (k)}} = \frac{{| \overset{&RightArrow;}{L} |}^{2}}{{| \overset{&RightArrow;}{R} |}^{2}} - - - (3)

其中，E_L(k)和E_R(k)分别为子频带k的左声道能量和右声道能量。子频带k内的声道能量是对该子频带声道向量取模的平方。计算声道能量的方式为已知技术手段，这里就不再详述。

步骤103：采用第一立体声参数

作为右声道频谱的缩放比，计算缩放后右声道频谱，使得缩放后右声道频谱

与未缩放的左声道频谱

的能量相等。

本步骤中，缩放后的右声道频谱

采用如下公式计算：

{\overset{&RightArrow;}{R}}^{'} = \frac{1}{g_{r} (k)} * \overset{&RightArrow;}{R} - - - (4)

参见图2示出的本发明实施例中立体声编码模式模型图，图中的向量

和

分别表示左声道频谱和右声道频谱，采用

对

进行缩放后，得到与

方向相同，与

长度相同的

。从物理意义上讲，图2中的

与

能量相等。

步骤104：对于子频带k内的每个频率点i，计算该频率点的加权和频谱

和加权差频谱

。其中，所谓加权是指对右声道

加权，加权权值为

或者说，本步骤是求取和

的和频谱与差频谱。

需要说明的是，每个频率点i都具有其对应的

和

，但是，处于同一子频带的频率点共用相同的和g_d(k)。对

和这些向量进行运算时，是对每一个频率点i分别进行运算。以下就不再重复说明。

本步骤中，加权和频谱

以及加权差频谱

的计算方法可以采用如下公式：

\overset{&RightArrow;}{M} = (\overset{&RightArrow;}{L} + {\overset{&RightArrow;}{R}}^{'}) / 2 = [\overset{&RightArrow;}{L} + \frac{1}{g_{r} (k)} \overset{&RightArrow;}{R}] / 2; - - - (5)

\overset{&RightArrow;}{S} = (\overset{&RightArrow;}{L} - {\overset{&RightArrow;}{R}}^{'}) / 2 = [\overset{&RightArrow;}{L} - \frac{1}{g_{r} (k)} \overset{&RightArrow;}{R}] / 2 = (\frac{\overset{&RightArrow;}{L}}{2} - \frac{2 \overset{&RightArrow;}{M} - \overset{&RightArrow;}{L}}{2}) = \overset{&RightArrow;}{L} - \overset{&RightArrow;}{M}; - - - (6)

从以上公式(5)和(6)可以看出，解码端可以根据 g_r(k)和

恢复出

和

那么如何得到

就是一个关键问题。

如图2所示，经步骤103的缩放后，左声道频谱

的能量与缩放后右声道频谱的能量近似相等，根据

和

获得的加权和频谱

和加权差频谱

也近似垂直，但是长度并不相等。那么如何在解码端根据以及垂直关系得到

呢？从图2中可以看到，如果根据

计算其等幅垂直的正交频谱

，那么将

乘以一个长度系数，就可以得到

以下步骤105就是计算这个长度系数，即第二立体声参数g_d(k)的具体方式。

步骤105：产生与加权和频谱

等幅垂直的正交频谱

，即缩放后加权差频谱，提取表征加权差频谱

和正交频谱之间能量比的第二立体声参数g_d(k)。

较佳地，在本步骤中，由于

与

等幅，因此二者能量相等。而且考虑到在编码端求取出来的正交频谱并实质上的作用，因此本步骤可以直接求取加权差频谱

和加权和频谱

的能量比，作为g_d(k)。g_d(k)的计算方法可以采用以下公式：

g_{d} (k) = \sqrt{\frac{E_{S}}{E_{D}}} = \sqrt{\frac{E_{S}}{E_{M}}} = \frac{{| \overset{&RightArrow;}{S} |}^{2}}{{| \overset{&RightArrow;}{M} |}^{2}} = \frac{{| L - M |}^{2}}{{| \overset{&RightArrow;}{M} |}^{2}} = \frac{{| (\overset{&RightArrow;}{L} - {\overset{&RightArrow;}{R}}^{'}) / 2 |}^{2}}{{| (\overset{&RightArrow;}{L} + {\overset{&RightArrow;}{R}}^{'}) / 2 |}^{2}} - - - (7)

从公式(7)中可以看出，该公式根据

与

能量相等，即E_D＝E_M，得到

g_{d} (k) = \frac{{| \overset{&RightArrow;}{S} |}^{2}}{{| \overset{&RightArrow;}{M} |}^{2}}

，然后将公式(6)代入该表达式，得到公式(7)的

g_{d} (k) = \frac{{| (\overset{&RightArrow;}{L} - {\overset{&RightArrow;}{R}}^{'}) / 2 |}^{2}}{{| (\overset{&RightArrow;}{L} + {\overset{&RightArrow;}{R}}^{'}) / 2 |}^{2}} .

计算声道能量的方式为已知技术手段，这里就不再详述。

本步骤中得到的g_d(k)反映了

与的长度比，因此，解码端就可以将g_d(k)作为正交频谱

的缩放比从而计算

，计算

的公式为：

\overset{&RightArrow;}{S} = g_{d} (k) * \overset{&RightArrow;}{D} - - - (8)

步骤106：对加权和频谱

进行波形编码，对

和g_d(k)进行量化编码，将编码结果输出到发给解码端的比特流中。当然，也可以直接传输g_r(k)。

至此，本流程结束。

需要说明的是，以上求取

g_r(k)和g_d(k)都是在各子频带内完成的。每个子频带都具有对应的

g_r(k)和g_d(k)。在恢复时，也是采用各子频带对应的

g_r(k)和g_d(k)恢复得到各子频带的左右声道频谱，经逆DFT变换后，求出合成立体声信号。

以下图3示出的流程就是本发明实施例中立体声解码方法的流程图。如图3所示，该方法包括以下步骤：

步骤301：将从码流中获取的数据进行逆量化解码后，得到加权和频谱

以及每个子频带的

和g_d(k)。当然如果编码端传输的是g_r(k)，解码端只需要对其进行倒数运算，即可得到第一立体声参数

传输g_r(k)还是

是由编码端和解码端预先约定的。

步骤302：利用加权和频谱

与采用g_d(k)作为缩放比的缩放后加权差频谱

之间具有等幅垂直这一特点，计算加权差频谱

本步骤中，计算

的过程具体包括以下步骤：

a1、产生与加权和频谱

等幅垂直的正交频谱及采用g_d(k)作为缩放比的缩放后加权差频谱；

若，

\overset{&RightArrow;}{M} [i, k] = x_{m} [i, k] + {jy}_{m} [i, k]; - - - (9)

则，

\overset{&RightArrow;}{D} [i, k] = - y_{m} [i, k] + {jx}_{m} [i, k]; - - - (10)

其中，x_m和y_m分别为加权和频谱的实部和虚部；

b1、根据公式(8)，利用得到的g_d(k)将正交频谱

进行缩放，得到加权差频谱

步骤303：根据加权和频谱

加权差频谱

以及作为加权权值的第一立体声参数g_r(k)，恢复左声道频谱

和右声道频谱

本步骤中，具体恢复过程包括以下步骤：

a2、根据公式(6)中

\overset{&RightArrow;}{S} = \overset{&RightArrow;}{L} - \overset{&RightArrow;}{M},

将

和

相加，得到左声道频谱

b2、根据公式(5)中

\overset{&RightArrow;}{M} = [\overset{&RightArrow;}{L} + {\overset{&RightArrow;}{R}}^{'}] / 2,

利用

和

得到缩放后的右声道频谱

c2、根据公式(4)中

{\overset{&RightArrow;}{R}}^{'} = \frac{1}{g_{r} (k)} * \overset{&RightArrow;}{R},

利用g_r(k)对

进行缩放，得到原始右声道频谱

在实际恢复过程中，步骤302和303可以简化为如下两个步骤：

步骤一、根据公式(9)和(10)产生与加权和频谱

等幅垂直的正交频谱

步骤二、利用如下公式(11)和(12)获得

和

\overset{&RightArrow;}{L} = \overset{&RightArrow;}{M} + \overset{&RightArrow;}{S} = \overset{&RightArrow;}{M} + g_{d} (k) \overset{&RightArrow;}{D}; - - - (11)

\overset{&RightArrow;}{R} = g_{r} (k) * {\overset{&RightArrow;}{R}}^{'} = g_{r} (k) * [\overset{&RightArrow;}{M} - \overset{&RightArrow;}{S}] = g_{r} (k) * [\overset{&RightArrow;}{M} - g_{d} (k) \overset{&RightArrow;}{D}]; - - - (12)

经过以上步骤的执行，可以得到各子频带的

和

和

就合成了立体声信号的频谱。

步骤304：对立体声信号的频谱进行逆DFT变换，得到合成的立体声信号。

至此，本流程结束。

从以上实施例中的编码方法和解码方法来看，本发明采用频域编码方法实现立体声的编解码，其分辨率较高，解码后生成的立体声声音质量也相对较高，能够较好的接近原始立体声，提高了立体声编解码质量。而且，经本发明实施例中的编码，只需要传输加权和声道频谱以及两个立体声参数，有效地提高了低码率条件下的传输效率。

在解码端，利用左右声道的加权和以及加权差近似垂直这一隐含参数，得到加权差，并采用加权和、加权差以及作为加权参数的第一立体声参数恢复得到左右声道频谱，整个恢复过程没有进行正弦、余弦等角度计算，因此大大降低了解码端的解码复杂度，从而减小了解码时间。

为了能够进一步提高立体声编解码质量，令恢复的立体声解码信号更加接近原始信号，减少恢复信号与原始信号之间的误差，本发明在上述实施例的基础上，根据最小均方差准则对 g_r(k)和g_d(k)的求取进行优化，令优化后的

g_r(k)和g_d(k)的取值能够使得左右声道均方差之和最小。

优选地，为了体现误差在左右声道的分配程度，在计算左右声道均方差之和时，进行加权处理，使得

g_r(k)和g_d(k)的取值能够令左右声道均方差的加权和最小。

本发明实施例仍以第一声道为左声道，第二声道为右声道为例，对

g_r(k)和g_d(k)的优化过程进行详细描述，其优化流程如下：

首先，建立求取子频带k内左右声道均方差加权和的表达式：

ϵ (k) = ϵ_{l} (k) + g (k) ϵ_{r} (k) = \underset{i &Element; band (k)}{Σ} {{| \hat{\overset{&RightArrow;}{L}} (i, k) - \overset{&RightArrow;}{L} (i, k) |}^{2} + g (k) * {| \hat{\overset{&RightArrow;}{R}} (i, k) - \overset{&RightArrow;}{R} (i, k) |}^{2} - - - (13)

其中，i∈band(k)是指i取子频带k内的频率点；ε_l(k)为左声道均方差之和，ε_r(k)右声道均方差之和，为解码端接收到的左声道频谱，

为解码端编码前的原始左声道频谱，

为解码端接收到的右声道频谱，

为解码端编码前的原始右声道频谱；g(k)为重要度因子，反映了编码误差在左右声道的分配程度。在实际应用中，g(k)可以为常数1，也可以为左右声道信号的能量比。当g(k)为能量比时，右声道能量越弱，g(k)的值越大；右声道能量越强，g(k)的值越小。

表达式(13)中的和

为解码端接收到的左右声道频谱，因此将解码端用于恢复左右声道频谱的公式(11)和(12)代入表达式(13)，并采用表达式

\overset{&RightArrow;}{L} [i, k] = x_{l} [i, k] + {jy}_{l} [i, k],

\overset{&RightArrow;}{R} [i, k] = x_{r} [i, k] + {jy}_{r} [i, k],

\overset{&RightArrow;}{M} [i, k] = x_{m} [i, k] + {jy}_{m} [i, k],

\overset{&RightArrow;}{D} [i, k] = - y_{m} [i, k] + {jx}_{m} [i, k]

表示表达式(13)中

和

得到如下变形后的左右声道均方差加权和的表达式(14)：

ϵ (k) = \underset{i &Element; band (k)}{Σ} [\begin{matrix} (x_{l}^{2} [i, k] + y_{l}^{2} [i, k]) + g (k) (x_{r}^{2} [i, k] + y_{r}^{2} [i, k]) + \\ (1 + g_{d}^{2} (k)) (1 + g (k) g_{r}^{2} (k)) (x_{m}^{2} [i, k] + y_{m}^{2} [i, k]) + \\ 2 * (- x_{l} [i, k] - g_{d} (k) y_{l} [i, k] - g (k) g_{r} (k) x_{r} [i, k] + g (k) g_{d} (k) g_{r} (k) y_{r} [i, k]) * x_{m} [i, k] + \\ 2 * (g_{d} (k) x_{l} [i, k] - y_{l} [i, k] - g (k) g_{d} (k) g_{r} (k) x_{r} [i, k] - g (k) g_{r} (k) y_{r} [i, k]) * y_{m} [i, k] \end{matrix}]

(14)

其中，x_l、y_l、x_r、y_r、x_m和y_m的意义已经在前面进行了注释。

第二步，为了使ε(k)的取值最小，对于每一个频率点i都要满足加权均方差ε(k)最小，因此对于加权和频谱每个频率点来说都需要满足

\frac{&PartialD; ϵ (k)}{&PartialD; x_{m} [i, k]} = 0

和

\frac{&PartialD; ϵ (k)}{&PartialD; y_{m} [i, k]} = 0;

那么，本步骤中分别对x_m和y_m求偏导，得到：

x_{m} [i, k] = \frac{x_{l} [i, k] + g_{d} (k) y_{l} [i, k] + g (k) g_{r} (k) (x_{r} [i, k] - g_{d} (k) y_{r} [i, k])}{(1 + g_{d}^{2} (k)) (1 + g (k) g_{r}^{2} (k))}

i∈band(k) (15)

y_{m} [i, k] = \frac{- g_{d} (k) x_{l} [i, k] + y_{l} [i, k] + g (k) g_{r} (k) (g_{d} (k) x_{r} [i, k] + y_{r} [i, k])}{(1 + g_{d}^{2} (k)) (1 + g (k) g_{r}^{2} (k))}

通过表达式(15)求得的x_m和y_m就是令ε(k)取值最小的x_m和y_m。

第三步，将表达式(15)代入公式(14)，得到

信号取值最优后的ε(k)的表达式：

ϵ (k) = \frac{c (k) g (k) g_{r}^{2} (k) + g (k) d (k)}{1 + g (k) g_{r}^{2} (k)} - \frac{2 g (k) g_{r} (k)}{1 + g (k) g_{r}^{2} (k)} [\frac{b (k) (1 - g_{d}^{2} (k) + 2 a (k) g_{d} (k))}{1 + g_{d}^{2} (k)}] - - - (16)

其中，

a (k) = \underset{i &Element; band (k)}{Σ} (x_{r} [i, k] y_{l} [i, k] - x_{l} [i, k] y_{r} [i, k]);

b (k) = \underset{i &Element; band (k)}{Σ} (x_{l} [i, k] x_{r} [i, k] + y_{l} [i, k] y_{r} [i, k]);

c (k) = \underset{i &Element; band (k)}{Σ} (x_{l} [i, k] x_{l} [i, k] + y_{l} [i, k] y_{l} [i, k]);

d (k) = \underset{i &Element; band (k)}{Σ} (x_{r} [i, k] x_{r} [i, k] + y_{r} [i, k] y_{r} [i, k]) .

第四步，求优化后的g_d(k)。

对表达式(16)求g_d(k)的偏导，由

\frac{&PartialD; ϵ (k)}{&PartialD; g_{d} (k)} = 0,

可以得到：

g_{d} (k) = \frac{- b (k) + \sqrt{b^{2} (k) + a^{2} (k)}}{a (k)} - - - (17)

最后，求优化后的g_r(k)。

对表达式(16)求g_r(k)的偏导，由

\frac{&PartialD; ϵ (k)}{&PartialD; g_{r} (k)} = 0,

可以得到：

g_{r} (k) = \frac{- (c (k) - g (k) * d (k)) + \sqrt{{(c (k) - g (k) * d (k))}^{2} + g (k) m^{2} (k)}}{g (k) m (k)} - - - (18)

其中，

m (k) = 2 \frac{b (k) (1 - g_{d}^{2} (k)) + 2 a (k) g_{d} (k)}{1 + g_{d}^{2} (k)} .

那么，编码端进行编码的步骤就可以为：分别采用公式(17)和(18)计算g_r(k)和g_d(k)，再将得到的g_r(k)和g_d(k)，以及重要度因子g(k)代入表达式(15)，求出每个频率点i上的加权和频谱

然后将求得的数据

g_r(k)和g_d(k)进行编码并发给解码端。

无论编码端采用图1的流程求取

和g_d(k)，或是采用优化后的表达式(15)、(17)和(18)计算

g_r(k)和g_d(k)，在解码端，都是采用图3示出的流程恢复

和

如果不考虑编码误差在左右声道的分配程度，将公式表达式(15)、(17)和(18)中的g(k)取1即可。

需要说明的是，以上实施例都是以第一声道为左声道，第二声道为右声道为例进行描述。可以理解，如果第一声道为右声道，第二声道为左声道，仍可以根据本发明原理得到一套编码公式和解码公式。编解码原理本质上是一样的，只是推导出来的公式可能在形式上有所区别。

而且，以上实施例只对DFT变换后的左右声道频谱进行子带划分和立体声参数的计算，实际上该方法还适用于进行其它类型时频转换后的左右声道频谱。此外，还可以对立体声信号的左、右声道分别进行子带分解，得到左、右声道的低频子带域信号，然后对左、右声道的低频子带域信号进行预测分析和时频变换，以获取左、右声道的低频子带域激励谱，此时将左、右声道的激励谱作为左、右声道频谱，并采用本发明实施例的立体声编解码方法进行编解码处理。

此外，以上实施例中划分子带的原因是：各个频带的特征不同，编码阶段得到的立体声参数也不同，因为为了在解码端更好的恢复立体声，在编码时进行子带划分，并针对每个子带进行加权和以及立体声参数的求取。

为了实现以上立体声编解码方法，本发明还提供了立体声编码装置和解码装置。

图4为本发明实施例中立体声编码装置的结构示意图。如图4所示，该立体声编码装置400包括子带划分单元410、第一参数提取单元420、第二参数提取单元430、加权单元440和发送单元450；

所述子带划分单元410，用于分别将立体声的第一声道和第二声道频谱划分为K个子频带，K为正整数；其中，第一声道和第二声道为所述立体声中左声道和右声道中的一个和另一个；本实施例以第一声道为左声道，第二声道为右声道为例。当然，为了获取频谱，本单元还需要在子带划分之前对立体声的左声道信号和右声道信道进行DFT，得到DFT变换域上的左声道频谱和右声道频谱，然后再进行子带划分处理。

第一参数提取单元420，用于在每个子频带k内，分别提取表征左声道频谱和右声道频谱能量比的第一立体声参数

k＝1、2...K。

该第一参数提取单元420在提取

时，可以直接将第一声道频谱的能量与第二声道频谱的能量之间的比值作为

的值；或者，利用优化过的g_r(k)表达式(18)计算g_r(k)的值，使得

的值不仅表征第一声道和第二声道的能量比，而且能够令左右声道的均方差加权和最小。

加权单元440，用于采用接收的

作为权值，获取左右声道的加权和频谱

。在计算

时，为了获得最优的

，可以利用优化过的

表达式(15)计算各频点i的

。在计算过程中需要代入g_d(k)和g_r(k)的值，这些值可以从第一参数提取单元420和第二参数提取单元430中获取。

第二参数提取单元430，用于在每个子频带k内，分别提取表征

和之间能量比的第二立体声参数g_d(k)。或者，利用优化过的g_d(k)表达式(17)计算g_d(k)的值，使得g_d(k)的值不仅表征左右声道加权差和加权和的能量比，而且能够令左右声道的均方差加权和最小。

发送单元450，用于向解码端发送从加权单元440获取的

、从第一参数提取单元420获取的

或g_r(k)，以及从第二参数提取单元430获取的g_d(k)。

图5为本发明实施例中立体声解码装置的结构示意图。如图5所示，该装置500包括接收单元510、中间参数求取单元520以及恢复单元530。

其中，接收单元510，用于接收左右声道的加权和频谱

，以及和g_d(k)；其中，

表征左右声道频谱的能量比，g_d(k)表征左右声道的加权差频谱和加权和频谱的能量比；其中，加权差以及加权和的加权权值为

中间参数求取单元520，用于利用加权和频谱

与采用g_d(k)作为缩放比的缩放后加权差频谱具有等幅垂直的特点，计算加权差频谱

。该中间参数求取单元520具体包括正交模块和缩放模块，其中正交模块产生与

等幅垂直的正交频谱

，作为缩放后加权差频谱；缩放模块根据

与

方向相同且长度之比为g_d(k)的特点，利用g_d(k)将

进行缩放，得到

恢复单元530，用于根据所接收的

以及从中间参数求取单元520获得的

恢复左、右声道频谱。该恢复单元530具体包括：左声道恢复模块和右声道恢复模块，其中左声道恢复模块，将与相加，得到；

右声道恢复模块，利用

和

得到缩放后右声道频谱，即

，然后采用

对

进行缩放，得到

在实际中，中间参数求取单元520可以只求取正交频谱

，然后由缩放模块将

和g_d(k)输出给恢复单元530即可。恢复单元530中的左声道恢复模块存储公式(11)，即

\overset{&RightArrow;}{L} = \overset{&RightArrow;}{M} + g_{d} (k) \overset{&RightArrow;}{D};

右声道恢复模块存储公式(12)，即

\overset{&RightArrow;}{R} = g_{r} (k) * [\overset{&RightArrow;}{M} - g_{d} (k) \overset{&RightArrow;}{D}],

那么左声道恢复模块和右声道恢复模块只需要获取相应参数并代入公式计算就可以了。

由以上所述可以看出，本发明所提供的立体声编解码方法，能实现低码率下对立体声的高质量编码。解码过程也无需任何的角度计算，降低了解码复杂度，从而减少了解码端的解码时间。当采用优化公式进行编码运算时，还能够进一步提高编解码质量。

综上所述，以上仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种立体声编码方法，其特征在于，该方法包括：

2.如权利要求1所述的方法，其特征在于，步骤A之前进一步包括：

A0、分别将立体声的第一声道频谱和第二声道频谱划分为K个子频带，K为正整数；

所述步骤A为：分别提取各子频带k内的第一立体声参数和第二立体声参数，以及以第一立体声参数为加权权值的加权和频谱；k＝1、2...K；

所述步骤B为：对所述各子频带的加权和频谱、第一立体声参数和第二立体声参数进行编码，向解码端发送。

3.如权利要求1或2所述的方法，其特征在于，所述第一立体声参数为：第一声道频谱的能量值与第二声道频谱的能量值之间的比值；

所述第二立体声参数为：加权差频谱的能量值与加权和频谱的能量值之间的比值。

4.如权利要求2所述的方法，其特征在于，所述第一立体声参数、第二立体声参数和加权和频谱都是根据令第一声道的均方差与第二声道的均方差的加权和最小准则获取的。

5.如权利要求4所述的方法，其特征在于，所述第一声道为左声道，所述第二声道为右声道；

所述第二立体声参数g_d(k)采用公式

计算；

所述第一立体声参数

利用如下公式计算：

g_{r} (k) = \frac{- (c (k) - g (k) * d (k)) + \sqrt{(c (k) - g (k) * d (k))^{2} + g (k) m^{2} (k)}}{g (k) m (k)};

所述加权和频谱为

其实部x_m和虚部y_m采用如下公式计算：

x_{m} [i, k] = \frac{x_{l} [i, k] + g_{d} (k) y_{l} [i, k] + g (k) g_{r} (k) (x_{r} [i, k] - g_{d} (k) y_{r} [i, k])}{(1 + g_{d}^{2} (k)) (1 + g (k) g_{r}^{2} (k))};

y_{m} [i, k] = \frac{{- g}_{d} (k) x_{l} [i, k] + y_{l} [i, k] + g (k) g_{r} (k) (g_{d} (k) x_{r} [i, k] + y_{r} [i, k])}{(1 + g_{d}^{2} (k)) (1 + g (k) g_{r}^{2} (k))};

其中，

m (k) = 2 \frac{b (k) (1 - g_{d}^{2} (k)) + 2 a (k) g_{d} (k)}{1 + g_{d}^{2} (k)};

a (k) = \underset{i &Element; band (k)}{Σ} (x_{r} [i] y_{l} [i] - x_{l} [i] y_{r} [i]);

b (k) = \underset{i &Element; band (k)}{Σ} (x_{l} [i] x_{r} [i] + y_{l} [i] y_{r} [i]);

c (k) = \underset{i &Element; band (k)}{Σ} (x_{l} [i] x_{l} [i] + y_{l} [i] y_{l} [i]);

d (k) = \underset{i &Element; band (k)}{Σ} (x_{r} [i] x_{r} [i] + y_{r} [i] y_{r} [i]);

g(k)为计算均方差加权和的权值；x_l和y_l分别为左声道频谱的实部和虚部，x_r和y_r分别为右声道频谱的实部和虚部，i为子频带k内的频率点标号，i∈band(k)表示i取子频带k内的频率点。

6.如权利要求5所述的方法，其特征在于，所述g(k)取1。

7.如权利要求5所述的方法，其特征在于，所述g(k)为表征编码误差在第一声道和第二声道分配程度的重要度因子。

8.如权利要求7所述的方法，其特征在于，所述重要度因子为：第一声道频谱与第二声道频谱的能量比。

9.一种立体声解码方法，其特征在于，该方法包括：

10.如权利要求9所述的方法，其特征在于，所述步骤A接收的所述加权和频谱、第一立体声参数和第二立体声参数是各子频带的加权和频谱、第一立体声参数和第二立体声参数；

所述步骤B为：利用各子频带对应的加权和频谱与采用第二立体声参数进行缩放的缩放后加权差频谱具有等幅垂直的特点，分别计算各子频带的加权差频谱；

所述步骤C为：根据各子频带对应的所述加权和频谱、加权差频谱以及第一立体声参数，恢复各子频带的第一声道频谱和第二声道频谱。

11.如权利要求9所述的方法，其特征在于，所述步骤B包括：

b1、产生与所述加权和频谱等幅垂直的正交频谱，作为缩放后加权差频谱；

b2、利用所述第二立体声参数对所述缩放后加权差频谱进行缩放，得到加权差频谱。

12.如权利要求9所述的方法，其特征在于，所述步骤C包括：

c1、将所述加权和频谱与所述加权差频谱相加，得到左声道频谱；

c2、根据加权和频谱和左声道频谱，得到缩放后右声道频谱；

c3、利用所述第一立体声参数对得到的缩放后右声道频谱进行缩放，得到右声道频谱。

13.一种立体声编码装置，其特征在于，该装置包括第一参数提取单元、第二参数提取单元、加权单元和发送单元；

14.如权利要求13所述的编码装置，其特征在于，该编码装置进一步包括子带划分单元，用于分别将立体声的第一声道频谱和第二声道频谱划分为K个子频带，K为正整数；

所述第一参数提取单元、第二参数提取单元和加权单元分别对各子频带执行自身处理功能。

15.如权利要求13所述的编码装置，其特征在于，所述第一参数提取单元将所述第一声道频谱的能量值与所述第二声道频谱的能量值之间的比值作为第一立体声参数；

所述第二参数提取单元将所述加权差频谱的能量值与所述加权和频谱的能量值之间的比值作为第二立体声参数。

16.如权利要求13所述的编码装置，其特征在于，所述第一参数提取单元进一步用于，根据令第一声道的均方差与第二声道的均方差的加权和最小准则获取所述第一立体声参数；

所述第二参数提取单元进一步用于，根据令第一声道的均方差与第二声道的均方差加权和最小的准则获取所述第二立体声参数；

所述加权单元进一步用于，根据第一声道的均方差与第二声道的均方差加权和最小准则获取所述加权和频谱。

17.一种立体声解码装置，其特征在于，该装置包括接收单元、中间参数求取单元和恢复单元；

18.如权利要求17所述的解码装置，其特征在于，所述接收单元接收的所述加权和频谱、第一立体声参数和第二立体声参数是各子频带的加权和频谱、第一立体声参数和第二立体声参数；

中间参数求取单元和恢复单元分别对各子频带执行自身处理功能。

19.如权利要求17所述的解码装置，其特征在于，所述中间参数求取单元包括正交模块和缩放模块；

所述正交模块，用于产生与所述加权和频谱等幅垂直的正交频谱，作为缩放后加权差频谱；

所述缩放模块，用于利用所述第二立体声参数对所述缩放后加权差频谱进行缩放，得到加权差频谱。

20.如权利要求19所述的解码装置，其特征在于，所述恢复单元包括左声道恢复模块和右声道恢复模块；

所述左声道恢复模块，用于将所述加权和频谱与所述加权差频谱相加，得到左声道频谱；

所述右声道恢复模块，用于根据加权和频谱和左声道频谱，得到缩放后的右声道频谱，利用所述第一立体声参数对得到的缩放后右声道频谱进行缩放，得到右声道频谱。