CN101350197B

CN101350197B - 立体声音频编/解码方法及编/解码器

Info

Publication number: CN101350197B
Application number: CN2007101358339A
Authority: CN
Inventors: 张树华; 窦维蓓; 张斌; 侯欢; 郭利斌; 王庭红; 肖玮
Original assignee: Tsinghua University; Huawei Technologies Co Ltd
Current assignee: Tsinghua University; Huawei Technologies Co Ltd
Priority date: 2007-07-16
Filing date: 2007-07-16
Publication date: 2011-05-11
Anticipated expiration: 2027-07-16
Also published as: CN101350197A

Abstract

本发明公开了一种立体声音频编码方法，对左右声道的矢量语音信号进行旋转正交变换，提高两个矢量之间的相关度。本发明还提供相应的立体声音频解码方法以及立体声音频编/解码器。由于变换后的两个矢量具有较好的相关性，本发明使得后续的编码过程能够以低码率实现较高的音质，确保了编码增益的提高。与传统方法相比，能够在相同的码率下获得更高的音质，或者在同等音质下实现更低的码率。

Description

立体声音频编/解码方法及编/解码器

技术领域

本发明涉及音频处理技术领域，具体涉及数字立体声音频编/解码方法及编/解码器。

背景技术

立体声是指能使听者有声源在空间分布的感觉的声音信号。立体声音频在录制时通常被分配到两个独立的声道：左声道和右声道，在重放时人耳通过分辨来自左右声道的音频信号的强度差、延时等产生听觉的空间感。

通常立体声信号主要有两个来源：一是采用双麦克风或多麦克风自然录音，此时左右声道音频来自同一音频场景，除了由于麦克风摆位造成的时间差、强度差等不同，他们记录的音频信息基本一致；一是采用音频工作室人工混音，由于在大多数情况下力求营造具有真实感的音频场景，因此这种方式下左右声道间一般也具有较强的相关性。

在处理立体声音频信号时，一般先对左右声道进行模/数(A/D：Analog/Digital)采样得到数字立体声信号，本文中将左右声道的对应的数字信号表示为两个矢量语音信号：X_L和X_R，矢量的维数与采样数据点数相关；然后对X_L和X_R进行编码。如何在尽可能低的编码码率下获得尽可能好的重现音质是始终追求的目标之一。目前主要有两种立体声音频编码方法：

一、和差立体声(Sum-difference Stereo)

如图1所示，该方法将X_L和X_R在频域对应频率处进行相加和相减处理，分别得到和矢量信号X_S与差矢量信号X_D，然后分别对X_S和X_D进行量化编码。由图1可以看出，在较为理想的情况下，由于X_L和X_R差别不大，使得X_D能量非0但明显小于X_S。因此可对与X_L和X_R类似的X_S以常规的码率进行编码，而对X_D则以较小的码率进行编码。

二、强度立体声(Intensity Stereo)

为了使码率进一步下降，在强度立体声方法中引入心理声学以去除声道间的主观冗余。该方法中只编码一个声道的信号，例如X_L或X_R，以及另一个声道与之的能量比。在解码端重现出一个声道的信号，以及仅体现能量差异的另一个信号。

在对现有技术的研究和实践过程中，发明人发现实际的立体声信号由于受环境噪音，墙体、地面的多次反射、折射和吸收，以及多声源的影响，在很多时候并不接近图1所示的模型，而是表现为图2所示的情况，即差矢量信号X_D的能量并不明显小于原始的矢量语音信号X_L和X_R。此时，现有和差立体声编码方法无法带来码率降低的效果，而强度立体声编码方法则会引入明显的失真。

发明内容

本发明提供一种能够有效提高编码增益的立体声音频编码方法以及相应的解码方法和编/解码器。

一种立体声音频编码方法，包括：获取分别属于左声道和右声道的两个对应的矢量语音信号；对所述两个矢量语音信号进行正交旋转变换，获得两个旋转矢量信号；所述两个旋转矢量信号之间的相关度大于或等于所述两个矢量语音信号之间的相关度；对所述旋转矢量信号进行编码；在编码结果中放入所述正交旋转变换的旋转角度的信息。

一种立体声音频解码方法，包括：获取立体声音频编码码流；从所述编码码流中获取旋转角度的信息；从所述编码码流中获取两个旋转矢量信号；按照所述旋转角度对所述两个旋转矢量信号进行反向正交旋转变换，获得两个矢量语音信号。

一种立体声音频编码器，包括：信号分析单元，用于输出分别属于左声道和右声道的两个对应的矢量语音信号；旋转变换单元，用于对所述两个矢量语音信号进行正交旋转变换，输出两个旋转矢量信号以及所述正交旋转变换的旋转角度；所述两个旋转矢量信号之间的相关度大于或等于所述两个矢量语音信号之间的相关度；编码单元，用于对输入的两个矢量信号进行编码，输出编码结果；当输入的矢量信号为所述旋转变换单元输出的旋转矢量信号时，在输出的编码结果中放入所述旋转变换单元输出的旋转角度的信息。

一种立体声音频解码器，包括：码流接收单元，用于获取立体声音频编码码流；解码单元，用于从所述编码码流中获取旋转角度的信息以及两个旋转矢量信号并输出；反旋转变换单元，用于按照所述解码单元输出的旋转角度的信息对所述解码单元输出的两个旋转矢量信号进行反向正交旋转变换，输出两个矢量语音信号。

本发明实施例采用对左右声道的矢量语音信号进行旋转正交变换，提高两个矢量之间的相关度的方法；由于变换后的两个矢量具有较好的相关性，使得后续的编码过程能够以低码率实现较高的音质，确保了编码增益的提高。与传统方法相比，能够在相同的码率下获得更高的音质，或者在同等音质下实现更低的码率。

附图说明

图1是一种现有左右声道矢量声音信号和差示意图；

图2是另一种现有左右声道矢量声音信号和差示意图；

图3是本发明实施例一立体声音频编码方法流程示意图；

图4是本发明实施例一中正交旋转变换示意图；

图5是本发明实施例二立体声音频解码方法流程示意图；

图6是本发明实施例三立体声音频编码方法流程示意图；

图7是本发明实施例四立体声音频编码方法流程示意图；

图8是本发明实施例五立体声音频编码方法流程示意图；

图9是本发明实施例六立体声音频解码方法流程示意图；

图10是本发明实施例七立体声音频编码器逻辑结构示意图；

图11是本发明实施例八立体声音频解码器逻辑结构示意图；

图12是本发明实施例九立体声音频编码器逻辑结构示意图；

图13是本发明实施例十立体声音频编码器逻辑结构示意图；

图14是本发明实施例十一立体声音频编码器逻辑结构示意图；

图15是本发明实施例十二立体声音频解码器逻辑结构示意图。

具体实施方式

本发明实施例提供了一种立体声音频编码方法，对左右声道的矢量语音信号进行旋转正交变换，提高两个矢量之间的相关度。本发明实施例还提供相应的立体声音频解码方法和立体声音频编/解码器。以下分别进行详细说明。

实施例一、一种立体声音频编码方法，如图3所示，包括：

A1、获取分别属于左声道和右声道的两个对应的矢量语音信号。

对左右声道矢量语音信号的采集可参照现有方式进行。基于人耳的听觉特性，可将左声道和右声道按频率划分为若干子带，获取分别属于左声道和右声道的相同子带的两个矢量语音信号作为对应的矢量语音信号。以子带为单位进行立体声音频处理的依据在于：

人的听觉可以用一个非均匀带宽的滤波器组描述，每个滤波器组通道被称为一个子带。子带的带宽与人的听觉特性匹配，人耳对立体声的空间感主要来自左右声道对应子带信号的整体特性，如强度差、延时等，而对子带信号的细节不敏感。从低频到高频，子带的带宽不断增大，在理想的情况下与心理声学中的关键带(Critical Band)或等效矩形带宽(Equivalent Rectangular Bandwidth，ERB)一致。因此根据心理声学，子带是最小的听觉单位，每个子带可以作为一个独立的听觉单元，即可以以子带为单位进行立体声音频处理操作。

获取子带的矢量语音信号可采用两类方法：1、基于可重建滤波器组，如滤波器多相滤波器组(PQMF：Polyphase Quadrature Mirror Filterbank)；2、基于时频变换，如快速傅立叶变换(FFT：Fast Fourier Transform)、离散余弦变换(DCT：Discrete Cosine Transform)和修正离散余弦变换(MDCT：ModifiedDiscrete Cosine Transform)等。将左右声道相同子带的采样数据按时间(基于滤波器组)或频率(基于时频变换)排列形成矢量语音信号对X_L和X_R。例如，若左右声道划分为4个子带，每个子带包含12个数据点，则有4组12维的X_L和X_R向量对，每个向量对均可按照本实施例后续提供的方法进行处理。

A2、对所述两个矢量语音信号进行正交旋转变换，获得两个旋转矢量信号；所述两个旋转矢量信号之间的相关度大于或等于所述两个矢量语音信号之间的相关度。

对矢量语音信号X_L和X_R执行的正交旋转变换如图4所示，可用公式表示为：

(\begin{matrix} Y_{0} \\ Y_{1} \end{matrix}) = (\begin{matrix} \cos θ & \sin θ \\ - \sin θ & \cos θ \end{matrix}) (\begin{matrix} X_{L} \\ X_{R} \end{matrix}) - - - (1)

其中，X_L和X_R表示左右声道相同子带的两个矢量语音信号；Y₀和Y₁表示变换后的两个旋转语音信号；θ表示旋转角度。本实施例中仅要求θ是使得相关度增大的旋转角度，对其带来的相关度增量以及获取方式不作限定，例如可在[-π/2，π/2]中随机或按某种规律搜索获取。由于矢量对的相关度越高后续的编码过程就可能获得更大的编码增益，因此使得相关度极大化的旋转角度是希望被采用的。

下面给出极大化相关度旋转角的推理过程：

由(1)式得到旋转语音信号Y₀和Y₁的代数表达式为，

\{\begin{matrix} Y_{0} = \cos {θX}_{L} + \sin {θX}_{R} \\ Y_{1} = - \sin {θX}_{L} + \cos {θX}_{R} \end{matrix} - - - (2)

假定矢量对a、b的相关度corr(a，b)采用如下归一化的度量计算方式，

corr (a, b) = \frac{&lang; a, b &rang;}{| a | | b |},

其中<x1，x2>表示矢量x1和x2的标量积；||表示矢量的模。则由(2)式，相关度corr(Y₀，Y₁)可以表示为，

corr (Y_{0}, Y_{1}) = \frac{&lang; Y_{0}, Y_{1} &rang;}{| Y_{0} | | Y_{1} |}

= \frac{\sin 2 θ (\frac{&lang; X_{R}, X_{R} &rang; - &lang; X_{L}, X_{L} &rang;}{2}) + \cos 2 θ &lang; X_{L}, X_{R} &rang;}{| Y_{0} | | Y_{1} |} - - - (3)

令

θ_{0} = \frac{1}{2} \arctan \frac{&lang; X_{R}, X_{R} &rang; - &lang; X_{L}, X_{L} &rang;}{2 &lang; X_{L}, X_{R} &rang;} - - - (4)

则使(3)式corr(Y₀，Y₁)有最大值的旋转角度θ的值在[-π/2，π/2]之间表示为，

θ = \{\begin{matrix} θ_{0}, & &lang; X_{L}, X_{R} &rang; &GreaterEqual; 0 \\ θ_{0} - π / 2, & &lang; X_{L}, X_{R} &rang; < 0, θ_{0} &GreaterEqual; 0 \\ θ_{0} + π / 2, & &lang; X_{L}, X_{R} &rang; < 0, θ_{0} < 0 \end{matrix} - - - (5)

此时，旋转语音信号Y₀和Y₁有最大的相关度，

corr (Y_{0}, Y_{1}) = \sqrt{\frac{{(E_{XL} - E_{XR})}^{2}}{{(E_{XL} + E_{XR})}^{2}} [1 - corr {(X_{L}, X_{R})}^{2}] + corr {(X_{L}, X_{R})}^{2}}

&GreaterEqual; | corr (X_{L}, X_{R}) | - - - (6)

其中，E_XL和E_XR分别为X_L和X_R的能量，等于其模的平方。

由于采用正交旋转变换，变换前后矢量能量之和不变。在极大化相关度的旋转变换下，Y₀和Y₁的能量E_Y0和E_Y1有下述重要而简单的关系，

E_{Y 0} = E_{Y 1} = \frac{1}{2} (E_{XL} + E_{XR}) - - - (7)

图4中Y₀和Y₁的差矢量信号Y_D＝(Y₀-Y₁)/2的能量E_YD，与X_L和X_R的差矢量信号X_D＝(X_L-X_R)/2的能量E_XD关系如下，

E_{YD} = E_{XD} - 2 (\sqrt{{&lang; X_{L}, X_{R} &rang;}^{2} - {(E_{XL} - E_{XR})}^{2} / 4} - &lang; X_{L}, X_{R} &rang;)

\leq E_{XD} - - - (8)

A3、对所述旋转矢量信号进行编码。

对Y₀和Y₁编码的过程可参照现有方式进行，例如采用现有的和差立体声或强度立体声编码方式。

1、采用和差立体声方式。编码步骤包括：计算两个旋转矢量信号Y₀和Y₁的和与差，获得和矢量信号Y_S＝(Y₀+Y₁)/2与差矢量信号Y_D＝(Y₀-Y₁)/2；

对所述和矢量信号Y_S与差矢量信号Y_D分别进行量化编码，一般对Y_S采用通常的编码方式，对Y_D则可根据码率、频带和信号特性等采用不同精度的编码方式。在采用极大化相关度旋转变换的情况下，由(8)式可以看出变换后的差矢量信号Y_D的能量E_YD小于原差矢量信号X_D的能量E_XD，因此和差立体声编码的效率将提高。

2、采用强度立体声方式。编码步骤包括：对两个旋转矢量信号Y₀和Y₁中的任意一个进行量化编码。在采用极大化相关度旋转变换的情况下，由(7)式可以看出，Y₀和Y₁的能量比例因子恒为1，因此不需要在码流中记录这个参数。由于Y₀和Y₁的相关度corr(Y₀，Y₁)大于X_L和X_R的相关度corr(X_L，X_R)，因此强度立体声编码引入的失真将减小。

A4、在编码结果中放入所述正交旋转变换的旋转角度的信息。

为使解码端能根据Y₀和Y₁重建原始的矢量语音信号X_L和X_R，需要将正交旋转变换的旋转角度θ放入编码结果中，具体放置的字段以及码流成型格式等可根据实际应用需要确定，本实施例中不予限定。

本实施例采用对左右声道的矢量语音信号进行旋转正交变换，提高两个矢量之间的相关度的方法；由于变换后的两个矢量具有较好的相关性，使得后续的编码过程能够以低码率实现较高的音质，确保了编码增益的提高。与传统方法相比，能够在相同的码率下获得更高的音质，或者在同等音质下实现更低的码率。本实施例还进一步给出计算极大化相关度旋转角的方法，可获得具有最大相关度的旋转语音信号，使得后续编码过程能够获得更高的编码增益。

实施例二、一种立体声音频解码方法，提供与实施例一编码方法相应的解码方法，流程如图5所示，包括：

B1、获取立体声音频编码码流。

该编码码流为采用实施例一编码方法获得的编码码流。

B2、从所述编码码流中获取旋转角度的信息。

解码方可按照与编码方共同采用的约定，从某个字段中读取并解码出旋转角度θ。

B3、从所述编码码流中获取两个旋转矢量信号；

解码得到两个旋转矢量信号Y₀和Y₁的过程，可对应于Y₀和Y₁的编码方式进行。

B4、按照所述旋转角度对所述两个旋转矢量信号进行反向正交旋转变换，获得两个矢量语音信号。

即相当于对Y₀和Y₁进行旋转角度为-θ的正交旋转变换，从而重建原始左右声道的矢量语音信号X_L和X_R。

实施例三、一种立体声音频编码方法，本实施例方法与实施例一的区别之处在于在进行正交旋转变换前，增加了对该变换的编码增益进行评估判断的过程。方法流程如图6所示，包括：

C1、获取分别属于左声道和右声道的两个对应的矢量语音信号。

此步骤可参照实施例一中的步骤A1进行。

C2、判断需要对所述两个矢量语音信号进行正交旋转变换。

由于进行正交旋转变换的目的是为了提高矢量的相关度，因此可以利用当前矢量语音信号的相关度作为判断的依据，例如可以计算所述两个矢量语音信号的相关度，当相关度小于设定阈值时，确定需要进行所述正交旋转变换。

当然，若相关度大于设定阈值，说明当前矢量语音信号具有良好的相关性，则可直接按照现有方式进行编码，不在本实施例讨论之列。

C3、对所述两个矢量语音信号进行正交旋转变换，获得相关度增加的两个旋转矢量信号。

C4、对所述旋转矢量信号进行编码。

上述步骤C3、C4可参照实施例一中的步骤A2、A3进行。

C5、在编码结果中放入所述正交旋转变换的旋转角度的信息，并且在所述编码结果中设置已进行正交旋转变换的标识；这两个操作的执行不分先后。

为使得解码端能够识别编码码流是否采用了旋转正交变换，可以在码流中放入一个标志位，用来标识是否进行了正交旋转变换。在进行了正交旋转变换的情况下，需要将该标志位设置成已进行正交旋转变换的标识，例如设置为1。

本实施例在进行正交旋转变换前，增加了对该变换的编码增益进行评估判断的过程，使得正交旋转变换的应用更加有效，提高了编码的效率。

实施例四、一种立体声音频编码方法，本实施例方法与实施例一的区别之处在于在进行正交旋转变换后，增加了对该变换的编码增益进行评估判断的过程。方法流程如图7所示，包括：

D1、获取分别属于左声道和右声道的两个对应的矢量语音信号。

D2、对所述两个矢量语音信号进行正交旋转变换，获得相关度增加的两个旋转矢量信号。

上述步骤D1、D2可参照实施例一中的步骤A1、A2进行。

D3、比较所述两个旋转矢量信号之间的相关度相对所述两个矢量语音信号之间的相关度的增加量，根据所述增加量判断需要对所述旋转矢量信号进行后续的编码操作。

由于进行正交旋转变换的目的是为了提高矢量的相关度，因此可以通过变换前后相关度的增加量来判断变换是否有效，例如可设置相关度增加量的阈值，当相关度增加量超过阈值时，认为所进行的正交旋转变换是有效的，确定需要对旋转矢量信号进行后续的编码操作。

当然，若相关度增加量未达到阈值，则可认为正交旋转变换效果不大，可直接对原始的矢量语音信号按照现有方式进行编码，不在本实施例讨论之列。

D4、对所述旋转矢量信号进行编码。

此步骤可参照实施例一中的步骤A3进行。

D5、在编码结果中放入所述正交旋转变换的旋转角度的信息，并且在所述编码结果中设置已进行正交旋转变换的标识；这两个操作的执行不分先后。

本实施例在进行正交旋转变换后，增加了对该变换的编码增益进行评估判断的过程，在评估通过时才对正交旋转变换的结果进行编码，使得正交旋转变换的应用更加有效，提高了编码的效率。

实施例五、一种立体声音频编码方法，本实施例方法与实施例一的区别之处在于在对正交旋转变换的结果进行编码后，增加了对该编码结果的编码增益进行评估判断的过程。方法流程如图8所示，包括：

E1、获取分别属于左声道和右声道的两个对应的矢量语音信号。

E2、对所述两个矢量语音信号进行正交旋转变换，获得相关度增加的两个旋转矢量信号。

E3、对所述旋转矢量信号进行编码。

上述步骤E1、E2、E3可参照实施例一中的步骤A1、A2、A3进行。

E4、将在未采用所述正交旋转变换的情况下对所述两个矢量语音信号进行编码的结果，与所述对旋转矢量信号进行编码的结果进行比较，根据比较结果判断需要采用所述对旋转矢量信号进行编码的结果。

此步骤综合评价不进行和进行正交旋转变换的编码结果，通常可选择码流长度、失真度等作为评价参数，注意在考虑码流长度时需要加上旋转角度对应的编码长度。例如可设置编码长度减少量的阈值，当采用正交旋转变换的编码结果带来的编码长度减少量超过阈值时，确定需要采用所述对旋转矢量信号进行编码的结果。

当然，若通过编码结果的比较评价确定选择不进行正交旋转变换的编码结果，则可直接采用对原始的矢量语音信号进行编码的结果。

E5、在编码结果中放入所述正交旋转变换的旋转角度的信息，并且在所述编码结果中设置已进行正交旋转变换的标识；这两个操作的执行不分先后。

本实施例在对正交旋转变换的结果进行编码后，增加了对该编码结果的编码增益进行评估判断的过程，使得正交旋转变换的应用更加有效，确保编码结果的最优性。

实施例六、一种立体声音频解码方法，提供与实施例三～五编码方法相应的解码方法，流程如图9所示，包括：

F1、获取立体声音频编码码流。

该编码码流为采用实施例三～五编码方法获得的编码码流。

F2、判断所述编码码流中包括已进行正交旋转变换的标识。

例如解码方可按照与编码方共同采用的约定，读取作为标识的某个标志位的值，然后根据该值判断当前编码码流是否已进行正交旋转变换，若确定已进行正交旋转变换则按下述解码过程执行，若判断未进行正交旋转变换则可按照现有解码方式进行解码操作，不在本实施例讨论之列。

F3、从所述编码码流中获取旋转角度的信息。

F4、从所述编码码流中获取两个旋转矢量信号；

F5、按照所述旋转角度对所述两个旋转矢量信号进行反向正交旋转变换，获得两个矢量语音信号。

上述步骤F3、F4、F5可参照实施例二中的步骤B2、B3、B4进行。

应当理解，实现本发明立体声音频编码方法和解码方法的软件可以存储于计算机可读介质中。该软件的编码方法在执行时，包括如下步骤：获取分别属于左声道和右声道的两个对应的矢量语音信号；对所述两个矢量语音信号进行正交旋转变换，获得两个旋转矢量信号；所述两个旋转矢量信号之间的相关度大于或等于所述两个矢量语音信号之间的相关度；对所述旋转矢量信号进行编码；在编码结果中放入所述正交旋转变换的旋转角度的信息。该软件的解码方法在执行时，包括如下步骤：获取立体声音频编码码流；从所述编码码流中获取旋转角度的信息；从所述编码码流中获取两个旋转矢量信号；按照所述旋转角度对所述两个旋转矢量信号进行反向正交旋转变换，获得两个矢量语音信号。所述的可读介质，如：ROM/RAM、磁碟、光盘等。

为更好的理解上述实施例，以下给出实施例一编码方法的一个数据应用例。

1、假定左右声道矢量语音信号的获取采用MDCT变换方式，变换后左右声道的每个语音帧分别包含32个频谱数据。根据人耳的非线性频率分辨率将频谱数据从低到高分成4个子带：子带1，谱线1～谱线4；子带2，谱线5～谱线8；子带3，谱线9～谱线20；子带4，谱线21～谱线32。以子带1为例，假定子带1对应的4维矢量语音信号对为，

X_L＝(-0.4513，-0.0091，-0.5363，-0.3011)，

X_R＝(0.1739，0.3309，0.9390，-0.7371)，

可得，X_L的能量E_XL＝0.5821，X_R的能量E_XR＝1.5646；X_L和X_R的标量积为<X_L，X_R>＝-0.3632，归一化相关度为，

corr(X_L，X_R)＝-0.3632/(0.5821×1.5646)^0.5＝-0.3806

2、由(4)、(5)两式可计算得到此时的极大化相关度旋转角θ(弧度)

θ＝θ₀+π/2＝0.5×arctan[(1.5646-0.5821)/(2×-0.3632)]+1.5708＝1.1037

cosθ＝0.4503，sinθ＝0.8929

再由(1)、(2)两式得到极大化相关度正交旋转变换后的旋转语音信号，

Y₀＝0.4503X_L+0.8929X_R＝(-0.0480，0.2914，0.5968，-0.7937)，

Y₁＝-0.8929X_L+0.4503X_R＝(0.4813，0.1571，0.9017，-0.0630)，

可得，Y₀和Y₁的能量E_Y0＝E_Y1＝1.0734；Y₀和Y₁的标量积为<Y₀，Y₁>＝0.6109，归一化相关度为，

corr(Y₀，Y₁)＝0.6109/1.0734＝0.5691

显然变换后相关度由-0.3806提高到0.5691。

3、对Y₀和Y₁采用和差或强度立体声的方式进行编码，并在编码结果中放入旋转角度θ＝1.1037。

对于左右声道的其他子带，可以同样方式进行处理。

下面对本发明实施例的立体声音频编/解码器进行详细说明。

实施例七、一种立体声音频编码器10，如图10所示，包括：

信号分析单元11，用于输出分别属于左声道和右声道的两个对应的矢量语音信号X_L和X_R。

旋转变换单元12，用于对信号分析单元11输出的两个矢量语音信号X_L和X_R进行正交旋转变换，输出两个旋转矢量信号Y₀和Y₁以及所述正交旋转变换的旋转角度θ；所述两个旋转矢量信号Y₀和Y₁之间的相关度大于或等于所述两个矢量语音信号X_L和X_R之间的相关度。

编码单元13，用于对输入的两个矢量信号进行编码，输出编码结果；当输入的矢量信号为旋转变换单元12输出的旋转矢量信号Y₀和Y₁时，在输出的编码结果中放入旋转变换单元12输出的旋转角度θ的信息。

本实施例立体声音频编码器可用于执行实施例一中描述的立体声音频编码方法。

实施例八、一种立体声音频解码器20，如图11所示，包括：

码流接收单元21，用于获取立体声音频编码码流。

解码单元22，用于从码流接收单元21获取的编码码流中获取旋转角度θ的信息以及两个旋转矢量信号Y₀和Y₁并输出。

反旋转变换单元23，用于按照解码单元22输出的旋转角度θ的信息对解码单元22输出的两个旋转矢量信号Y₀和Y₁进行反向正交旋转变换，输出两个矢量语音信号X_L和X_R。

本实施例立体声音频解码器可用于执行实施例二中描述的立体声音频解码方法。

实施例九、一种立体声音频编码器30，如图12所示，包括：

信号分析单元31，用于输出分别属于左声道和右声道的两个对应的矢量语音信号X_L和X_R。

第一判断单元32，用于判断信号分析单元3 1输出的两个矢量语音信号X_L和X_R是否需要进行正交旋转变换；若是，则将所述两个矢量语音信号X_L和X_R输出到旋转变换单元32，若否，则将所述两个矢量语音信号X_L和X_R输出到编码单元34。

旋转变换单元33，用于对第一判断单元32输出的两个矢量语音信号X_L和X_R进行正交旋转变换，输出两个旋转矢量信号Y₀和Y₁以及所述正交旋转变换的旋转角度θ；所述两个旋转矢量信号Y₀和Y₁之间的相关度大于或等于所述两个矢量语音信号X_L和X_R之间的相关度。

编码单元34，用于对输入的两个矢量信号(X_L、X_R或者Y₀、Y₁)进行编码，输出编码结果；当输入的矢量信号为旋转变换单元33输出的旋转矢量信号Y₀和Y₁时，在输出的编码结果中放入旋转变换单元33输出的旋转角度θ的信息。

第一填充单元35，用于根据第一判断单元32的判断结果，在编码单元34输出的编码结果中设置已进行或未进行正交旋转变换的标识。

本实施例立体声音频编码器可用于执行实施例三中描述的立体声音频编码方法。

实施例十、一种立体声音频编码器40，如图13所示，包括：

信号分析单元41，用于输出分别属于左声道和右声道的两个对应的矢量语音信号X_L和X_R。

旋转变换单元42，用于对信号分析单元41输出的两个矢量语音信号X_L和X_R进行正交旋转变换，输出两个旋转矢量信号Y₀和Y₁以及所述正交旋转变换的旋转角度θ；所述两个旋转矢量信号Y₀和Y₁之间的相关度大于或等于所述两个矢量语音信号X_L和X_R之间的相关度。

第二判断单元43，用于比较旋转变换单元42输出的两个旋转矢量信号Y₀和Y₁之间的相关度，相对信号分析单元41输出的两个矢量语音信号X_L和X_R之间的相关度的增加量，根据所述增加量判断是否需要对所述旋转矢量信号Y₀和Y₁进行后续的编码操作；若是，则将所述两个旋转矢量信号Y₀和Y₁输出到编码单元44，若否，则将所述两个矢量语音信号X_L和X_R输出到编码单元44。

编码单元44，用于对第二判断单元43输入的两个矢量信号(X_L、X_R或者Y₀、Y₁)进行编码，输出编码结果；当输入的矢量信号为旋转矢量信号Y₀和Y₁时，在输出的编码结果中放入旋转变换单元42输出的旋转角度θ的信息。

第二填充单元45，用于根据第二判断单元43的判断结果，在编码单元44输出的编码结果中设置已进行或未进行正交旋转变换的标识。

本实施例立体声音频编码器可用于执行实施例四中描述的立体声音频编码方法。

实施例十一、一种立体声音频编码器50，如图14所示，包括：

信号分析单元51，用于输出分别属于左声道和右声道的两个对应的矢量语音信号X_L和X_R。

旋转变换单元52，用于对信号分析单元51输出的两个矢量语音信号X_L和X_R进行正交旋转变换，输出两个旋转矢量信号Y₀和Y₁以及所述正交旋转变换的旋转角度θ；所述两个旋转矢量信号Y₀和Y₁之间的相关度大于或等于所述两个矢量语音信号X_L和X_R之间的相关度。

编码单元53，用于分别对信号分析单元51和旋转变换单元52输入的两个矢量信号(X_L、X_R和Y₀、Y₁)进行编码，输出编码结果；当输入的矢量信号为旋转矢量信号Y₀和Y₁时，在输出的编码结果中放入旋转变换单元52输出的旋转角度θ的信息。

第三判断单元54，用于对编码单元53输出的两种编码结果进行比较，根据比较结果选择输出所述两种编码结果之一；

第三填充单元55，用于根据第三判断单元54的选择，在第三判断单元54选择的编码结果中设置已进行或未进行正交旋转变换的标识。

本实施例立体声音频编码器可用于执行实施例五中描述的立体声音频编码方法。

实施例十二、一种立体声音频解码器60，如图15所示，包括：

码流接收单元61，用于获取立体声音频编码码流。

第四判断单元62，用于判断码流接收单元61获取的编码码流中包括已进行正交旋转变换的标识，触发解码单元62的操作。

解码单元63，用于从码流接收单元61获取的编码码流中获取旋转角度θ的信息以及两个旋转矢量信号Y₀和Y₁并输出。

反旋转变换单元64，用于按照解码单元63输出的旋转角度θ的信息对解码单元63输出的两个旋转矢量信号Y₀和Y₁进行反向正交旋转变换，输出两个矢量语音信号X_L和X_R。

本实施例立体声音频解码器可用于执行实施例六中描述的立体声音频解码方法。

通过上述实施例可以看出，本发明实施例采用对左右声道的矢量语音信号进行旋转正交变换，提高两个矢量之间的相关度的方法；由于变换后的两个矢量具有较好的相关性，使得后续的编码过程能够以低码率实现较高的音质，确保了编码增益的提高。与传统方法相比，能够在相同的码率下获得更高的音质，或者在同等音质下实现更低的码率。采用本发明实施例进一步给出的计算极大化相关度旋转角的方法，可获得具有最大相关度的旋转语音信号，使得后续编码过程能够获得更高的编码增益。并且若进一步增加对正交旋转变换的编码增益进行评估判断的过程，能够使得正交旋转变换的应用更加有效，确保编码结果的优选性。

以上对本发明实施例所提供的立体声音频编/解码方法及编/解码器进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种立体声音频编码方法，其特征在于，包括：

获取分别属于左声道和右声道的两个对应的矢量语音信号；

对所述两个矢量语音信号进行正交旋转变换，获得两个旋转矢量信号；所述两个旋转矢量信号之间的相关度大于或等于所述两个矢量语音信号之间的相关度；

对所述旋转矢量信号进行编码；

在编码结果中放入所述正交旋转变换的旋转角度的信息。

2.根据权利要求1所述的立体声音频编码方法，其特征在于，所述左声道和右声道的频率范围划分为若干子带，所述获取分别属于左声道和右声道的两个对应的矢量语音信号的步骤具体为：获取分别属于左声道和右声道的相同子带的两个矢量语音信号。

3.根据权利要求1所述的立体声音频编码方法，其特征在于，在所述对两个矢量语音信号进行正交旋转变换的步骤之前还包括：判断需要对所述两个矢量语音信号进行正交旋转变换；

在所述对旋转矢量信号进行编码的步骤之后还包括：在所述编码结果中设置已进行正交旋转变换的标识。

4.根据权利要求3所述的立体声音频编码方法，其特征在于，所述判断需要对两个矢量语音信号进行正交旋转变换的步骤具体为：计算所述两个矢量语音信号的相关度，当相关度小于设定阈值时，确定需要进行所述正交旋转变换。

5.根据权利要求1所述的立体声音频编码方法，其特征在于，在所述对两个矢量语音信号进行正交旋转变换的步骤之后还包括：比较所述两个旋转矢量信号之间的相关度相对所述两个矢量语音信号之间的相关度的增加量，根据所述增加量判断需要对所述旋转矢量信号进行后续的编码操作；

6.根据权利要求1所述的立体声音频编码方法，其特征在于，在所述对旋转矢量信号进行编码的步骤之后还包括：

将在未采用所述正交旋转变换的情况下对所述两个矢量语音信号进行编码的结果，与所述对旋转矢量信号进行编码的结果进行比较，根据比较结果判断需要采用所述对旋转矢量信号进行编码的结果；

在所采用的编码结果中设置已进行正交旋转变换的标识。

7.根据权利要求1～6任意一项所述的立体声音频编码方法，其特征在于，所述对两个矢量语音信号进行正交旋转变换的步骤具体为：按照旋转角度θ执行所述正交旋转变换，

其中，θ的值在[-π/2，π/2]之间表示为，

X_L和X_R表示所述两个矢量语音信号；Y₀和Y₁表示所述两个旋转语音信号；<x1，x2>表示矢量x1和x2的标量积。

8.根据权利要求7所述的立体声音频编码方法，其特征在于，所述对旋转矢量信号进行编码的步骤包括：

计算所述两个旋转矢量信号的和与差，获得和矢量信号与差矢量信号；

对所述和矢量信号与差矢量信号分别进行量化编码。

9.根据权利要求7所述的立体声音频编码方法，其特征在于，所述对旋转矢量信号进行编码的步骤具体为：对所述两个旋转矢量信号中的任意一个进行量化编码。

10.一种立体声音频解码方法，其特征在于，包括：

获取立体声音频编码码流；

从所述编码码流中获取旋转角度的信息；

从所述编码码流中获取两个旋转矢量信号；

按照所述旋转角度对所述两个旋转矢量信号进行反向正交旋转变换，获得两个矢量语音信号。

11.根据权利要求10所述的立体声音频解码方法，其特征在于，在所述从编码码流中获取旋转角度的信息的步骤之前还包括：判断所述编码码流中包括已进行正交旋转变换的标识。

12.一种立体声音频编码器，其特征在于，包括：

信号分析单元，用于输出分别属于左声道和右声道的两个对应的矢量语音信号；

旋转变换单元，用于对所述两个矢量语音信号进行正交旋转变换，输出两个旋转矢量信号以及所述正交旋转变换的旋转角度；所述两个旋转矢量信号之间的相关度大于或等于所述两个矢量语音信号之间的相关度；

编码单元，用于对输入的两个矢量信号进行编码，输出编码结果；当输入的矢量信号为所述旋转变换单元输出的旋转矢量信号时，在输出的编码结果中放入所述旋转变换单元输出的旋转角度的信息。

13.根据权利要求12所述的立体声音频编码器，其特征在于，还包括：

第一判断单元，用于判断所述信号分析单元输出的两个矢量语音信号是否需要进行正交旋转变换；若是，则将所述两个矢量语音信号输出到所述旋转变换单元，若否，则将所述两个矢量语音信号输出到所述编码单元；

第一填充单元，用于根据所述第一判断单元的判断结果，在所述编码单元输出的编码结果中设置已进行或未进行正交旋转变换的标识。

14.根据权利要求12所述的立体声音频编码器，其特征在于，还包括：

第二判断单元，用于比较所述旋转变换单元输出的两个旋转矢量信号之间的相关度，相对所述信号分析单元输出的两个矢量语音信号之间的相关度的增加量，根据所述相关度的增加量判断是否需要对所述旋转矢量信号进行后续的编码操作；若是，则将所述两个旋转矢量信号输出到所述编码单元，若否，则将所述两个矢量语音信号输出到所述编码单元；

第二填充单元，用于根据所述第二判断单元的判断结果，在所述编码单元输出的编码结果中设置已进行或未进行正交旋转变换的标识。

15.根据权利要求12所述的立体声音频编码器，其特征在于，所述编码单元分别对所述信号分析单元和旋转变换单元的输出进行编码；所述编码器还包括：

第三判断单元，用于对所述编码单元输出的两种编码结果进行比较，根据比较结果选择输出所述两种编码结果之一；

第三填充单元，用于根据所述第三判断单元的选择，在所述第三判断单元选择的编码结果中设置已进行或未进行正交旋转变换的标识。

16.一种立体声音频解码器，其特征在于，包括：

码流接收单元，用于获取立体声音频编码码流；

解码单元，用于从所述编码码流中获取旋转角度的信息以及两个旋转矢量信号并输出；

反旋转变换单元，用于按照所述解码单元输出的旋转角度的信息对所述解码单元输出的两个旋转矢量信号进行反向正交旋转变换，输出两个矢量语音信号。

17.根据权利要求16所述的立体声音频解码器，其特征在于，还包括：

第四判断单元，用于判断所述编码码流中包括已进行正交旋转变换的标识，触发所述解码单元的操作。