CN101202043A

CN101202043A - 音频信号的编码方法和系统与解码方法和系统

Info

Publication number: CN101202043A
Application number: CNA2007103044868A
Authority: CN
Inventors: 张树华; 窦维蓓
Original assignee: Tsinghua University
Current assignee: Tsinghua University
Priority date: 2007-12-28
Filing date: 2007-12-28
Publication date: 2008-06-18
Anticipated expiration: 2027-12-28
Also published as: CN101202043B

Abstract

本发明公开了一种音频信号的编码方法和系统与解码方法和系统，属于多媒体信号处理和信源编码领域。编码方法包括：对左右声道的音频信号以极大相关度旋转角为旋转角进行正交旋转变换；对经过正交旋转变换的左右声道的音频信号进行编码。解码方法包括：对接收到的码流数据进行解码输出经过解码的音频信号；对经过解码的音频信号以极大相关度旋转角为旋转角进行正交逆旋转变换。编码系统包括：极大相关度旋转变换模块和编码模块。解码系统包括：解码模块和极大相关度逆旋转变换模块。本发明通过少量的极大相关度旋转角参数记录立体声信息，可以用很低的码率实现立体声音频信号的高保真压缩。

Description

音频信号的编码方法和系统与解码方法和系统

技术领域

本发明涉及多媒体信号处理和信源编码领域，特别涉及一种音频信号的编码方法和系统与解码方法和系统。

背景技术

立体声信号有两个主要来源，一个是采用双麦克风或多麦克自然录音，另一个是音频工作室人工混音。前者各通道音频来自同一个音频场景，除了由于麦克风摆位造成的时间差、强度差等不同，他们记录音频信息基本一致，因此有很强的相关性。后者在大多数情况下力求营造具有真实感的音频场景，因此声道间也具有很强的相关性。

利用这种相关性降低立体声编码的码率是音频编码领域一个重要的研究课题。较早提出的是和差立体声(Sum-difference Stereo)。该方法将原始立体声信号中的左声道L与右声道R在频域对应频率处进行相加和相减处理，分别得到和声道S与差声道D。在理想的情况下，L等于R，那么D就为0。通常L与R有明显的相关但不会严格一致，因此多数情况下D的能量非0但明显小于R，可以用较小的比特率进行编码。由于仍需要对变换后的两个声道S与D独立编码，码率下降有限。该方法用于MP3(MPEG-1 Layer III)和AAC(Advanced Audio Coding)立体声编码。

为了使码率进一步下降，需要引入心理声学以去除声道间的主观冗余。人的听觉可以用一个非均匀带宽的滤波器组描述，每个滤波器组通道被称为一个子带，它是最小的听觉单位，空间感主要来自左右声道对应子带信号的整体特性，如强度差、延时、相关度，而对子带信号的细节不敏感。基于上面的心理声学原理，MP3和AAC中还采用了强度立体声(IntensityStereo)。该方法在每个子带，只将其中一个声道的信号，以及另一个声道与之的能量比传送给解码器。解码器根据和信号与能量比，恢复出和原始立体声信号能量相等但有细节差异的立体声信号。该方法使码率有明显下降，但由于不能重建频谱细节，它也带来一定的音质损失，因此主要用于人耳不敏感的较高频率子带。

发明内容

为了进一步降低立体声编码的码率，本发明提供了一种音频信号的编解码方法和系统。所述技术方案如下：

一种音频信号的编码方法，所述方法包括：

步骤A：对左右声道的音频信号以极大相关度旋转角为旋转角进行正交旋转变换；

步骤B：对经过所述正交旋转变换的左右声道的音频信号进行编码，形成码流数据。

所述步骤A具体包括：

步骤A1：对左右声道的时域音频信号进行时频变换输出左右声道的频域音频信号；

步骤A2：提取所述左右声道的频域音频信号的极大相关度旋转角；

步骤A3：对所述左右声道的频域音频信号以极大相关度旋转角为旋转角进行正交旋转变换。

所述步骤B具体包括：

步骤B1：对经过所述正交旋转变换的左右声道的音频信号进行和差立体声编码，形成和差音频码流；

步骤B2：对旋转角进行量化熵编码，形成参数码流；

步骤B3：对所述和差音频码流进行量化和熵编码；

步骤B4：将经过量化和熵编码的所述和差音频码流和参数码流组合成编码码流。

所述步骤B具体包括：

步骤B1：对经过所述正交旋转变换的左右声道的音频信号进行强度立体声编码，形成强度音频码流；

步骤B2：对旋转角进行量化熵编码，形成参数码流；

步骤B3：对所述强度音频码流进行量化和熵编码；

步骤B4：将经过量化和熵编码的所述强度音频码流和参数码流组合成编码码流。

所述步骤A1具体为：

对左右声道的时域音频信号进行多相滤波器组变换输出左右声道的频域音频信号。

所述步骤A1具体为：

对左右声道的时域音频信号进行快速傅里叶变换输出左右声道的频域音频信号。

所述步骤A具体包括：

步骤A2：将所述左右声道的频域音频信号划分为连续无重叠的子带信号；

步骤A3：提取所述左右声道的子带信号的极大相关度旋转角；

步骤A4：对所述左右声道的频域音频信号以极大相关度旋转角为旋转角进行正交旋转变换。

所述步骤B具体包括：

步骤B1：将所述经过正交旋转变换的两路音频信号下混为一路下混声道的音频信号；

步骤B2：对下混声道的音频信号进行编码，形成编码码流。

所述步骤A1具体为：

对左右声道的时域音频信号进行多相滤波器组变换输出左右声道的频域音频信号；

所述步骤A2具体为：

将所述左右声道的频域音频信号按照等效矩形带宽划分为连续无重叠的子带信号。

所述步骤A1具体为：

所述步骤A2具体为：

将所述左右声道的频域音频信号按照临界带宽划分为连续无重叠的子带信号。

一种音频信号的解码方法，所述方法包括：

步骤A：对接收到的码流数据进行解码输出经过解码的音频信号；

步骤B：对所述经过解码的音频信号以极大相关度旋转角为旋转角进行正交逆旋转变换，输出左右声道的音频信号。

所述步骤A具体为：

步骤A1：将码流分解成音频码流和参数码流；

步骤A2：将音频码流和参数码流分别进行熵解码和反量化得到频谱数据以及旋转角度；

步骤A3：根据编码的模式对所述频谱数据进行解码得到两路音频信号。

所述步骤B具体为：

步骤B1：对所述解码得到的两路音频信号以极大相关度旋转角为旋转角进行正交逆旋转变换；

步骤B2：对经过所述正交逆旋转变换的两路音频信号进行时频逆变换输出左右声道的时域音频信号。

所述步骤B2具体为：

对经过所述正交逆旋转变换的两路音频信号进行多相滤波器组逆变换输出左右声道的时域音频信号。

所述步骤B2具体为：

对经过所述正交逆旋转变换的两路音频信号进行快速傅里叶逆变换输出左右声道的时域音频信号。

所述步骤A具体为：

步骤A1：对所述编码码流进行解码得到下混声道的音频信号；

步骤A2：对下混声道的音频信号进行子带划分，输出连续无重叠的子带；

步骤A3：将下混声道的音频信号进行上混输出所述经过正交旋转变换的两路子带信号；

相应的，所述步骤B具体包括：

步骤B1：对所述经过正交旋转变换的两路子带信号以极大相关度旋转角为旋转角进行正交逆旋转变换；

所述步骤B2具体为：

所述步骤A2具体为：

对下混声道的音频信号按照等效矩形带宽进行子带划分，输出连续无重叠的子带。

所述步骤A2具体为：

对下混声道的音频信号按照临界带宽进行子带划分，输出连续无重叠的子带。

一种音频信号的编码系统，包括极大相关度旋转变换模块、编码模块；

所述极大相关度旋转变换模块，用于对所述左右声道的频域音频信号以极大相关度旋转角为旋转角进行正交旋转变换；

所述编码模块，用于对所述经过正交旋转变换的音频信号进行编码形成编码码流。

所述极大相关度旋转变换模块具体包括时频分析单元、极大相关度旋转变换单元；

所述时频分析单元，用于对左右声道的时域音频信号进行时频变换输出左右声道的频域音频信号；

所述极大相关度旋转变换单元，用于对所述左右声道的频域音频信号以极大相关度旋转角为旋转角进行正交旋转变换；

所述编码模块具体包括编码单元、量化熵编码单元、码流成型单元；

所述编码单元，用于对经过所述正交旋转变换的左右声道的音频信号进行编码，形成码流；

所述量化熵编码单元，用于对所述音频码流和参数码流分别进行量化和熵编码，去除信号的主观冗余；

码流成型单元，用于将经过量化和熵编码的所述码流和参数码流组合成编码码流。

所述时频分析单元具体为具体为快速傅里叶变换单元。

所述时频分析单元具体为具体为多相滤波器组变换单元。

所述极大相关度旋转变换模块具体包括快速傅里叶变换单元、极大相关度旋转变换单元；

所述快速傅里叶变换单元，用于对左右声道的时域音频信号进行时频变换输出左右声道的频域音频信号；

所述编码模块具体包括下混单元、快速傅里叶逆变换单元、编码单元、矢量量化单元、复用单元；

所述下混单元，用于将所述经过正交旋转变换的两路音频信号下混为一路下混声道的音频信号；

所述快速傅里叶逆变换单元，用于将下混后一路音频信号进行快速傅里叶逆变换为时域的音频信号；

所述编码单元，用于对经过所述正交旋转变换的左右声道的音频信号进行编码，形成音频码流；

所述矢量量化单元，用于形成量化指标数码流，以便进一步去除旋转角参数的客观冗余，降低参数码率；

所述复用单元，用于将形成的音频码流和量化指标数码流封装成给定格式的编码码流。

一种音频信号的解码系统，包括解码模块、极大相关度逆旋转变换模块；

所述解码模块，用于对接收到的码流数据进行解码，输出经过解码的音频信号；

所述极大相关度逆旋转变换模块，用于对所述经过解码的音频信号以极大相关度旋转角为旋转角进行正交逆旋转变换，输出左右声道的音频信号。

所述解码模块具体包括码流解析单元、熵解码反量化单元、解码单元；

所述码流解析单元，用于将码流分解成音频码流和参数码流；

所述熵解码反量化单元，用于将音频码流进行熵解码和反量化得到频谱数据以及旋转角度；

所述解码单元，用于根据编码的模式对所述频谱数据进行解码得到两路音频信号；

所述极大相关度逆旋转变换模块，具体包括极大相关度逆旋转变换单元、时频综合单元；

所述极大相关度逆旋转变换单元，用于对所述解码得到的两路音频信号以极大相关度旋转角为旋转角进行正交逆旋转变换；

所述时频综合单元，用于对经过所述正交逆旋转变换的两路音频信号进行时频逆变换输出左右声道的时域音频信号。

所述时频综合单元具体为快速傅里叶逆变换单元。

所述时频综合单元具体为多相滤波器组逆变换单元。

所述解码模块具体包括解码单元、快速傅里叶变换单元、上混单元、反矢量量化单元；

所述快速傅里叶变换单元，用于将解码单元输出的的音频信号进行快速傅里叶变换输出频域的音频信号；

所述上混单元，用于将下混声道的音频信号进行上混输出所述经过正交旋转变换的两路音频信号；

所述反矢量量化单元，用于从量化指标数查找出对应的旋转角参数，以便解码端进行相应的逆旋转变换；

所述极大相关度逆旋转变换模块，具体包括极大相关度逆旋转变换单元、快速傅里叶逆变换单元；

所述极大相关度逆旋转变换单元，用于对所述上混得到的两路音频信号以极大相关度旋转角为旋转角进行正交逆旋转变换；

所述快速傅里叶逆变换单元，用于对经过所述正交逆旋转变换的两路音频信号进行时频逆变换输出左右声道的时域音频信号。

本发明通过对左右声道的音频信号进行极大相关度旋转变换，然后将两路音频信号进行编码，解码后再对两路音频信号进行极大相关度逆旋转变换，还原出左右声道的音频信号。由于对音频信号进行极大相关度旋转与逆旋转变换，改善了信号质量，所以与传统的只对两路音频信号进行编解码操作的编解码方法与系统相比，通过少量的极大相关度旋转角参数记录立体声信息，可以用很低的码率实现立体声音频信号的高保真压缩。

附图说明

图1是本发明实施例1提供的音频信号的编码方法的流程图；

图2是本发明实施例2提供的音频信号的解码方法的流程图；

图3是本发明实施例3提供的音频信号的编码系统的结构示意图；

图4是本发明实施例4提供的音频信号的解码系统的结构示意图；

图5是本发明实施例1提供的音频信号的编码方法中适于和差立体声或强度立体声编码的两路子带信号示意图；

图6是本发明实施例1提供的音频信号的编码方法中不适于和差立体声或强度立体声编码的两路子带信号示意图；

图7是本发明实施例1提供的音频信号的编码方法中极大相关度正交旋转对子带信号的作用示意图；

图8是本发明实施例1提供的音频信号的编码方法中极大相关度正交旋转的空间心理声学意义示意图；

图9是本发明实施例5提供的音频信号的编码方法的流程图；

图10是本发明实施例6提供的音频信号的解码方法的流程图；

图11是本发明实施例7提供的音频信号的编码系统的结构图；

图12是本发明实施例8提供的音频信号的解码系统的结构图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明实施方式作进一步地详细描述。

实施例1

参见图1，本发明实施例提供了一种音频信号的编码方法，具体包括以下步骤：

步骤101：对左右声道时域音频信号进行时频变换；

输入为左右声道时域音频信号，输出为左右声道频域音频信号，这里可以采用FFT(FastFlourier Transform，快速傅里叶变换)，MDCT(Modified Discrete Cosine Transform，修正离散余弦变换)，或是PQMF(Polyphase Quadrature Mirror Filterbank，多相滤波器组)来实现。

步骤102：划分子带；

将左右声道的频域音频信号输出为按照一定带宽划分的连续无重叠的子带，子带的带宽与人的听觉特性匹配，从低频到高频，带宽不断增大，在理想的情况下与心理声学中的关键带(Critical Band)或等效矩形带宽(Equivalent Rectangular Bandwidth，ERB)一致。

步骤103：提取两路子带的极大相关度旋转角度；

相对于原始时域音频信号，按照心理声学划分的子带信号的有两个重要特点：首先原始信号中包含的各个声源在子带信号域有一定的分离，而分离声源的子带信号具有相对简单的空间心理声学描述，即单一的空间位置感；其次，其根据心理声学，每个子带可以作为一个独立的听觉单元，即便子带包含多个声源，主观听觉是多个声源的整体作用的结果，而不再区分单独的声源，此时即便不能精确重建信号中各个声源，只要重建整体作用的结果，也可以达到与原始信号相同的听觉效果。

理想的情况下，立体声左右声道的子带信号是相应频带内某一声源经不同路径直达左右麦克风，并被采集的相关但是不完全相同的两路信号。声源本身的信息体现在子带的波形(滤波器组)或频谱(时频变换)；而声源的位置则主要体现为左右两路子带信号的强度差和时间差上。将左右声道的子带信号按时间(滤波器组)或频率(时频变换)排列分别形成向量X_l和X_r，维数等于子带的数据点数。上面的关系可以表示为对一般的立体声信号，有较大的概率相关度Re{corr(X_l，X_r)}＝Re{<X_l，X_r>}/|X_l||X_r|≈1，幅度|X_l|≈|X_r|，且|X_l-X_r|＜＜min{|X_l|，|X_r|}，如图5所示，其中<·，·>是标量积，|·|是向量的模或长度。此时和信号X_s＝(X_l+X_r)/2≈X_l≈X_r，差信号X_d＝(X_l-X_r)/2≈0，和信号的编码比特数与原来左右声道子带信号基本一致，差信号可以用较少的比特数进行编码，和差立体声有较高的编码增益。同时由于Re{corr(X_l，X_r)}接近1，X_l与X_r的夹角接近0，二者主要相差一个比例因子，因此强度立体声引入的失真较小，编码增益高。

然而实际的立体声信号由于环境噪音，墙体、地面的多次反射、折射和吸收，以及多声源的影响，左右子带信号的相关性大大降低，甚至出现负相关，如图6所示。由于X_d的长度并不明显小于原始左右信号，和差立体声编码增益不明显；强度立体声重建的左右子带信号方向相同，在X_l和X_r其中之一的方向上，而X_l与X_r的夹角较大，因而引入明显的失真。

从上面的分析可以看出，相关度是与和差立体声或强度立体声的编码效率密切相关：相关度越大，编码增益就越大。本发明提出如下正交旋转变换可以提高原始左右子带信号的相关度，因而可以提高立体声编码的效率：

(\begin{matrix} Y_{0} \\ Y_{1} \end{matrix}) = (\begin{matrix} \cos θ & \sin θ \\ - \sin θ & \cos θ \end{matrix}) (\begin{matrix} X_{l} \\ X_{r} \end{matrix}), - - - (1)

其中θ是使Re{corr(Y₀，Y₁)}有最大值旋转角度，不大于-π/2且不小于π/2。将变换后的子带信号以代数式表示有

\{\begin{matrix} Y_{0} = \cos θ X_{l} + \sin θ X_{r} \\ Y_{1} = - \sin θ X_{l} + \cos θ X_{r} \end{matrix},

进一步，相关度corr(Y₀，Y₁)可以表示为

corr (Y_{0}, Y_{1}) = \frac{&lang; Y_{0}, Y_{1} &rang;}{| Y_{0} | | Y_{1} |}

= \frac{\sin 2 θ (\frac{&lang; X_{r}, X_{r} &rang; - &lang; X_{l}, X_{l} &rang;}{2}) + \cos 2 θ &lang; X_{l}, X_{r} &rang;}{| Y_{0} | | Y_{1} |}, - - - (3)

令

θ_{0} = \frac{1}{2} \arctan \frac{&lang; X_{r}, X_{r} &rang; - &lang; X_{l}, X_{l} &rang;}{2 Re &lang; X_{l}, X_{r} &rang;}, - - - (4)

则使Re{corr(Y₀，Y₁)}有最大值且不超过±π/2的θ可以表示为

θ = \{\begin{matrix} θ_{0}, & Re &lang; X_{l}, X_{r} &rang; &GreaterEqual; 0 \\ θ_{0} - π / 2, & Re &lang; X_{l}, X_{r} &rang; < 0, θ_{0} &GreaterEqual; 0 \\ θ_{0} + π / 2, & Re &lang; X_{l}, X_{r} &rang; < 0, θ_{0} < 0 \end{matrix}, - - - (5)

在这个特定旋转角度变换下，子带信号Y₀和Y₁的能量E_Y0和E_Y1有下述重要而简单的关系

E_{Y_{0}} = E_{Y_{1}} = \frac{1}{2} (E_{X_{l}} + E_{X_{r}}), - - - (6)

而子带信号Y₀和Y₁有最大的相关度

Re {corr (Y_{0}, Y_{1})} = \sqrt{\frac{{(E_{X_{l}} - E_{X_{r}})}^{2}}{{(E_{X_{l}} + E_{X_{r}})}^{2}} (1 - Re {corr (X_{l}, X_{r})}^{2}) + Re {corr (X_{l}, X_{r})}^{2}}, - - - (7)

&GreaterEqual; | corr (X_{l}, X_{r}) |

其中E_Xl和E_Xr分别为X_l和X_r的能量。差信号Y_d＝(Y₀-Y₁)/2的能量E_Yd与原差信号X_d＝(X_l-X_r)/2的能量E_Xd有下面的关系

E_{Y_{d}} = E_{X_{d}} - 2 (\sqrt{< X_{l}, X_{r} > - {(E_{X_{r}} - E_{X_{l}})}^{2} / 4} - Re < X_{l}, X_{r} >), - - - (8)

\leq E_{X_{d}}

步骤104：对两路子带信号进行极大相关度旋转变换，获得具有正交旋转变换下最大相关度的两路子带信号；

图7是这种特定的正交旋转变换的示意图。由于采用正交旋转变换，变换前后子带能量之和不变，即E_Y0+E_Y1＝E_Xl+E_Xr，并且从(6)式看出，变换后的子带信号Y₀和Y₁的能量E_Y0和E_Y1恒等。对典型的立体声信号，从(7)式看出，变换的两路子带信号Y₀和Y₁的相关度Re{corr(Y₀，Y₁)}大于原信号X_l和X_r的相关度Re{corr(X_l，X_r)}；从(8)看出，变换后的差信号Y_d的能量E_Yd小于原差信号X_d的能量E_Xd。如果采用和差立体声处理，由于差信号能量降低，立体声编码的效率将提高；如果采用强度立体声，首先由于相关度的增加，编码引入的失真将减小，此外子带能量比例因子恒为1，因此不需要在码流中记录这个参数。

进行这种特定的正交旋转变换，编码器需要向解码器每个子带传送一个旋转角度参数θ。如果对某一子带，这种变换的立体声编码增益远大于传送旋转角度θ的编码码流比特数增加，那么在当前子带应用这种变换的总体编码效率是增加的；否则可以不在当前带进行这种变换。这样，编码器在大多数情况下，立体声编码的效率将有明显提高，并且在所有情况下，不会导致立体声编码效率的下降。

图8是极大正交旋转角度与声像空间位置关系的示意图。当旋转角度θ＝0时，此时声源的空间位置是正前方；当旋转角度θ从0逐渐变大时，对应的声源空间位置逐渐右移：当θ＝π/4时，声源处于正右方，当θ＝π/2时，声源处于正后方；当旋转角度θ从0逐渐变小时，对应的声源位置逐渐左移：当θ＝-π/4时，声源出于正左方，当θ＝-π/2时，声源处于正后方。同时，当-π/4≤θ≤π/4时，左右声道的信号是同相的，当-π/2≤θ＜-π/4和π/4≤θ＜π/2时，左右声道的信号是反相的。

步骤105：根据码率及两路子带信号特性，选择和差或强度立体声进行编码；

形成和差音频码流或强度音频码流。

步骤106：将输出的信号及旋转角度分别进行量化和熵编码，进一步去除信号的主客观冗余；

对旋转角进行量化熵编码，形成参数码流。

步骤107：将输出的信号按照给定的格式组合成编码码流。

本实施例通过对左右声道的音频信号进行极大相关度旋转变换，然后将两路音频信号进行编码。由于对音频信号进行极大相关度旋转变换，改善了信号质量，所以与传统的只对两路音频信号进行编码操作的编码方法相比，通过少量的极大相关度旋转角参数记录立体声信息，可以用很低的码率实现立体声音频信号的高保真压缩。

实施例2

参见图2，本发明实施例提供了一种音频信号的解码方法，具体包括以下步骤：

步骤111：将编码码流分解成音频码流和参数码流。

步骤112：将音频码流和参数码流分别进行熵解码和反量化得到频谱数据以及旋转角度。

步骤113：根据立体声编码的模式，进行相应的和差或强度立体声解码得到两路相关子带信号。

步骤114：对两路子带信号进行极大相关度逆旋转输出左右子带信号。

步骤115：将左右子带信号进行时频综合，重建时域左右声道数字音频信号。

本实施例通过对解码后的两路音频信号进行极大相关度逆旋转变换，还原出左右声道的音频信号。由于对音频信号进行极大相关度逆旋转变换，改善了信号质量，所以与传统的只对两路音频信号进行解码操作的解码方法相比，通过少量的极大相关度旋转角参数记录立体声信息，可以用很低的码率实现立体声音频信号的高保真压缩。

另外，实施例1与实施例2可以结合起来，组成一种音频信号的编解码方法。

实施例3

参见图3，本发明实施例提供了一种音频信号的编码系统，包括时频分析单元501和502，极大相关度旋转变换单元503、和差或强度立体声编码单元504、量化熵编码单元505和506、以及码流成型模块单元507。

时频分析单元501和502，用于分别对左右声道的信号进行时频变换，这里可以是FFT，MDCT，或是多相滤波器组；

极大相关度旋转变换单元503是核心单元，通过(3)式所述变换，并且旋转角度由(5)式决定，获得具有正交旋转变换下最大相关度的两路子带信号；

和差或强度立体声编码单元504根据码率及两路子带信号特性，选择和差或强度立体声进行编码；

量化熵编码单元505和506将和差或强度立体声编码单元504的输出及旋转角度分别进行量化和熵编码，进一步去除信号的主客观冗余并对旋转角进行量化熵编码，形成参数码流；

码流成型模块单元507将量化熵编码单元505和506的输出按照给定的格式组合成编码码流。

本实施例通过对左右声道的音频信号进行极大相关度旋转变换，然后将两路音频信号进行编码。由于对音频信号进行极大相关度旋转变换，改善了信号质量，所以与传统的只对两路音频信号进行编码操作的编码系统相比，通过少量的极大相关度旋转角参数记录立体声信息，可以用很低的码率实现立体声音频信号的高保真压缩。

实施例4

参见图4，本发明实施例提供了一种音频信号的解码系统，具体包括码流解析单元601、熵解码及反量化单元602和603、和差或强度立体声解码单元604、极大相关度逆旋转单元605、以及时频综合单元606和607。

码流解析单元601，用于将编码码流分解成后续模块需要音频码流和参数码流；

熵解码及反量化单元602和603，用于将音频码流和参数码流分别进行熵解码和反量化，得到频谱数据以及旋转角度；

和差或强度立体声解码单元604，用于根据立体声编码的模式，进行相应的和差或强度立体声解码，得到两路相关子带信号；

极大相关度逆旋转单元605，用于对这两路子带信号进行极大相关度逆旋转，输出左右子带信号；

时频综合单元606和607，用于分别将左右子带信号进行时频综合，重建时域左右声道数字音频信号。

本实施例通过对解码后的两路音频信号进行极大相关度逆旋转变换，还原出左右声道的音频信号。由于对音频信号进行极大相关度逆旋转变换，改善了信号质量，所以与传统的只对两路音频信号进行解码操作的解码系统相比，通过少量的极大相关度旋转角参数记录立体声信息，可以用很低的码率实现立体声音频信号的高保真压缩。

另外，实施例3与实施例4可以结合起来，组成一种音频信号的编解码系统。

实施例5

参见图9，本发明实施例提供了一种音频信号的编码方法，具体包括以下步骤：

步骤301：对左右声道时域信号进行MDCT，输出左右声道的MDCT频谱；

步骤302：将左右声道的MDCT频谱输出为按照等效矩形带宽ERB或临界带宽划分的连续无重叠的子带；

步骤303：提取两路子带信号的极大相关度旋转角度；

输入为左右声道的MDCT域子带信号，输出为子带信号的极大相关度旋转角度，由于MDCT是实变换，旋转角度由下列公式计算：

θ = \{\begin{matrix} θ_{0}, & &lang; X_{l}, X_{r} &rang; &GreaterEqual; 0 \\ θ_{0} - π / 2, & &lang; X_{l}, X_{r} &rang; < 0, θ_{0} &GreaterEqual; 0 \\ θ_{0} + π / 2, & &lang; X_{l}, X_{r} &rang; < 0, θ_{0} < 0 \end{matrix}, - - - (9)

其中

θ_{0} = \frac{1}{2} \arctan \frac{&lang; X_{r}, X_{r} &rang; - &lang; X_{l}, X_{l} &rang;}{2 &lang; X_{l}, X_{r} &rang;}, - - - (10)

这里X_l和X_r分别表示MDCT域左右声道的子带信号向量；

步骤304：对两路子带信号进行极大相关度旋转，输出变换后的两路子带信号；

按下面的公式计算：

(\begin{matrix} Y_{0} \\ Y_{1} \end{matrix}) = (\begin{matrix} \cos θ & \sin θ \\ - \sin θ & \cos θ \end{matrix}) (\begin{matrix} X_{l} \\ X_{r} \end{matrix}) - - - (11)

其中Y₀和Y₁是变换后的两路子带信号；

步骤305：对变换后的两路子带信号进行下混，输出子带信号的平均值，这些子带信号按频率排列就是下混声道的MDCT频谱；

步骤306：对下混声道的MDCT频谱进行编码形成码流。

本实施例通过对左右声道的音频信号进行极大相关度旋转变换，然后下混，将两路音频信号变为一路音频信号后再进行编码。由于对音频信号进行极大相关度旋转与逆旋转变换，改善了信号质量，所以与传统的只对一路音频信号进行编码操作的编码方法相比，通过少量的极大相关度旋转角参数记录立体声信息，可以用很低的码率实现立体声音频信号的高保真压缩。

实施例6

参见图10，本发明实施例提供了一种音频信号的解码方法，具体包括以下步骤：

步骤311：对码流进行解码输出下混声道的MDCT频谱；

步骤312：将下混声道的MDCT频谱输出为无重叠的MDCT域的一路子带；

步骤313：将MDCT域的一路子带信号进行上混，输出MDCT域的两路子带信号，这两路信号都是输入子带信号的复制；

步骤314：对MDCT域的两路子带信号进行极大相关度逆旋转，输出左右声道的两路子带信号；

输入为上混得到的MDCT域的两路子带信号，输出为逆旋转得到的对应左右声道的两路子带信号X_l和X_r，按下面的公式计算：

(\begin{matrix} X_{l} \\ X_{r} \end{matrix}) = (\begin{matrix} \cos θ & - \sin θ \\ \sin θ & \cos θ \end{matrix}) (\begin{matrix} Y_{0} \\ Y_{1} \end{matrix}) - - - (12)

其中θ是编码端计算得到的极大相关旋转角；

步骤315：对左右声道的两路子带信号进行IMDCT(Inverse Modified Discrete CosineTransform，修正离散余弦逆变换)，输出左右声道时域信号，是步骤301的逆变换。

本实施例通过对解码后的音频信号进行上混，将一路音频信号还原为两路音频信号，再对两路音频信号进行极大相关度逆旋转变换，还原出左右声道的音频信号。由于对音频信号进行极大相关度逆旋转变换，改善了信号质量，所以与传统的只对一路音频信号进行解码操作的解码方法相比，通过少量的极大相关度旋转角参数记录立体声信息，可以用很低的码率实现立体声音频信号的高保真压缩。

另外，实施例5与实施例6可以结合起来，组成一种音频信号的编解码方法。

实施例7

参见图11，本发明实施例提供了一种音频信号的编码系统，包括FFT单元、极大相关度旋转变换单元、矢量量化单元、下混单元、IFFT(Inverse Fast Flourier Transform，快速傅里叶逆变换)单元、编码单元以及MUX(Multiplexer，复用)单元。编码的输入是左右两路时域信号，分别经FFT后的两路FFT频谱经极大相关度旋转变换，得到各个子带的旋转角度并进行矢量量化，输出码字，同时输出两路极大相关变换的子带信号，经下混得到一路FFT域子带信号，经IFFT得到时域下混信号，最后由编码单元进行编码，输出编码码字，将矢量量化单元输出的码字与编码单元输出的编码码字一同输入MUX单元，封装成给定格式的码流。

对于极大相关度旋转变换单元，由于FFT是复变换，特别的可以采用每个子带提取一个参数的模式提取旋转角度，如下所示：

θ = \{\begin{matrix} θ_{0}, & Re &lang; X_{l}, X_{r} &rang; &GreaterEqual; 0 \\ θ_{0} - π / 2, & Re &lang; X_{l}, X_{r} &rang; < 0, θ_{0} &GreaterEqual; 0 \\ θ_{0} + π / 2, & Re &lang; X_{l}, X_{r} &rang; < 0, θ_{0} < 0 \end{matrix}, - - - (13)

其中

θ_{0} = \frac{1}{2} \arctan \frac{&lang; X_{r}, X_{r} &rang; - &lang; X_{l}, X_{l} &rang;}{2 Re &lang; X_{l}, X_{r} &rang;}, - - - (14)

相应的旋转变换为

(\begin{matrix} Y_{0} \\ Y_{1} \end{matrix}) = (\begin{matrix} \cos θ & \sin θ \\ - \sin θ & \cos θ \end{matrix}) (\begin{matrix} X_{l} \\ X_{r} \end{matrix}) - - - (15)

也可以采用每个子带提取两个参数的模式提取旋转角度，分别对应实部和虚部，如下所示：

θ_{r} = \{\begin{matrix} θ_{r 0}, & &lang; Re {X_{l}}, Re {X_{r}} &rang; &GreaterEqual; 0 \\ θ_{r 0} - π / 2, & &lang; Re {X_{l}}, Re {X_{r}} &rang; < 0, θ_{r 0} &GreaterEqual; 0 \\ θ_{r 0} + π / 2, & &lang; Re {X_{l}}, Re {X_{r}} &rang; < 0, θ_{r 0} < 0 \end{matrix}, - - - (16 . a)

θ_{i} = \{\begin{matrix} θ_{i 0}, & &lang; Im {X_{l}}, Im {X_{r}} &rang; &GreaterEqual; 0 \\ θ_{i 0} - π / 2, & &lang; Im {X_{l}}, Im {X_{r}} &rang; < 0, θ_{i 0} &GreaterEqual; 0 \\ θ_{i 0} + π / 2, & &lang; Im {X_{l}}, Im {X_{r}} &rang; < 0, θ_{i 0} < 0 \end{matrix}, - - - (16 . b)

θ_r和θ_i分别表示实部和虚部的旋转角度，其中θ_r0和θ_i0由下面的公式得到

θ_{r 0} = \frac{1}{2} \arctan \frac{&lang; Re {X_{r}}, Re {X_{r}} &rang; - &lang; Re {X_{l}}, Re {X_{l}} &rang;}{2 &lang; Re {X_{l}}, Re {X_{r}} &rang;} - - - (17 . a)

θ_{i 0} = \frac{1}{2} \arctan \frac{&lang; Im {X_{r}}, Im {X_{r}} &rang; - &lang; Im {X_{l}}, Im {X_{l}} &rang;}{2 &lang; Im {X_{l}}, Im {X_{r}} &rang;} - - - (17 . b)

相应的实部和虚部的旋转变换为

(\begin{matrix} Re {Y_{0}} \\ Re {Y_{1}} \end{matrix}) = (\begin{matrix} \cos θ_{r} & \sin θ_{r} \\ - \sin θ_{r} & \cos θ_{r} \end{matrix}) (\begin{matrix} Re {X_{l}} \\ Re {X_{r}} \end{matrix}) - - - (18 . a)

(\begin{matrix} Im {Y_{0}} \\ Im {Y_{1}} \end{matrix}) = (\begin{matrix} \cos θ_{i} & \sin θ_{i} \\ - \sin θ_{i} & \cos θ_{i} \end{matrix}) (\begin{matrix} Im {X_{l}} \\ Im {X_{r}} \end{matrix}) - - - (18 . b)

也可以采用将谱线的幅度和相位分别处理的方式，如下所示

θ_{A} = \{\begin{matrix} θ_{A 0}, & &lang; | X_{l} |, | X_{r} | &rang; &GreaterEqual; 0 \\ θ_{A 0} - π / 2, & &lang; | X_{l} |, | X_{r} | &rang; < 0, θ_{A 0} &GreaterEqual; 0 \\ θ_{A 0} + π / 2, & &lang; | X_{l} |, | X_{r} | &rang; < 0, θ_{A 0} < 0 \end{matrix}, - - - (19 . a)

θ_{p} = \{\begin{matrix} θ_{p 0}, & &lang; \arg {X_{l}}, \arg {X_{r}} &rang; &GreaterEqual; 0 \\ θ_{p 0} - π / 2, & &lang; \arg {X_{l}}, \arg {X_{r}} &rang; < 0, θ_{p 0} &GreaterEqual; 0 \\ θ_{p 0} + π / 2, & &lang; \arg {X_{l}}, \arg {X_{r}} &rang; < 0, θ_{p 0} < 0 \end{matrix}, - - - (19 . b)

θ_A和θ_p分别表示幅度和相位的旋转角度，其中θ_A0和θ_p0由下面的公式得到

θ_{A 0} = \frac{1}{2} \arctan \frac{&lang; | X_{r} |, | X_{r} | &rang; - &lang; | X_{l} |, | X_{l} | &rang;}{2 &lang; | X_{l} |, | X_{r} | &rang;} - - - (20 . a)

θ_{p 0} = \frac{1}{2} \arctan \frac{&lang; \arg {X_{r}}, \arg {X_{r}} &rang; - &lang; \arg {X_{l}}, \arg {X_{l}} &rang;}{2 &lang; \arg {X_{l}}, \arg {X_{r}} &rang;} - - - (20 . b)

本实施例通过对左右声道的音频信号进行极大相关度旋转变换，然后下混，将两路音频信号变为一路音频信号后再进行编码。由于对音频信号进行极大相关度旋转与逆旋转变换，改善了信号质量，所以与传统的只对一路音频信号进行编码操作的编码系统相比，通过少量的极大相关度旋转角参数记录立体声信息，可以用很低的码率实现立体声音频信号的高保真压缩。

实施例8

参见图12，本发明实施例提供了一种音频信号的解码系统，包括：解码单元、FFT单元、上混单元、反矢量量化单元、极大相关度逆旋转变换单元、IFFT单元以及MUX单元。解码的输入是MUX单元输出的下混声道的编码码字和各子带旋转角度的矢量量化码字；首先解码单元根据编码码字解码得到时域下混声道，经FFT得到频域下混信号，上混后成为两路相关的频域信号，反矢量量化单元，用于从量化指标数查找出对应的旋转角参数，以便解码端进行相应的逆旋转变换，极大相关解码单元根据这个旋转角度将上混的频域信号按子带进行逆向旋转，得到两路分别对应左右声道频域信号，最后通过IFFT得到左右两路时域音频信号。

对于极大相关度逆旋转变换单元，与音频编码器对应的，当只提取一个参数时，按照下面的式子进行逆旋转变换：

(\begin{matrix} X_{l} \\ X_{r} \end{matrix}) = (\begin{matrix} \cos θ & - \sin θ \\ \sin θ & \cos θ \end{matrix}) (\begin{matrix} Y_{0} \\ Y_{1} \end{matrix}) - - - (21)

当实部和虚部分别处理，提取两个参数时，按照下面的式子进行逆旋转变换：

(\begin{matrix} Re {X_{l}} \\ Re {X_{r}} \end{matrix}) = (\begin{matrix} \cos θ_{r} & - \sin θ_{r} \\ \sin θ_{r} & \cos θ_{r} \end{matrix}) (\begin{matrix} Re {Y_{0}} \\ Re {Y_{1}} \end{matrix}) - - - (22)

(\begin{matrix} Im {X_{l}} \\ Im {X_{r}} \end{matrix}) = (\begin{matrix} \cos θ_{i} & - \sin θ_{i} \\ \sin θ_{i} & \cos θ_{i} \end{matrix}) (\begin{matrix} Im {Y_{0}} \\ Im {Y_{1}} \end{matrix}) - - - (23)

当幅度和相位分别处理时，按照下面的式子进行逆旋转变换：

(\begin{matrix} | X_{l} | \\ | X_{r} | \end{matrix}) = (\begin{matrix} {\cos θ}_{A} & - \sin θ_{A} \\ \sin θ_{A} & \cos θ_{A} \end{matrix}) (\begin{matrix} | Y_{0} | \\ | Y_{1} | \end{matrix}) - - - (24)

(\begin{matrix} \arg {X_{l}} \\ \arg {X_{r}} \end{matrix}) = (\begin{matrix} \cos θ_{p} & - \sin θ_{p} \\ \sin θ_{p} & \cos θ_{p} \end{matrix}) (\begin{matrix} \arg {Y_{0}} \\ \arg {Y_{1}} \end{matrix}) - - - (25)

本实施例通过对解码后的音频信号进行上混，将一路音频信号还原为两路音频信号，再对两路音频信号进行极大相关度逆旋转变换，还原出左右声道的音频信号。由于对音频信号进行极大相关度逆旋转变换，改善了信号质量，所以与传统的只对一路音频信号进行解码操作的解码系统相比，通过少量的极大相关度旋转角参数记录立体声信息，可以用很低的码率实现立体声音频信号的高保真压缩。

另外，实施例7与实施例8可以结合起来，组成一种音频信号的编解码系统。

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种音频信号的编码方法，其特征在于，所述方法包括：

2.根据权利要求1所述的一种音频信号的编码方法，其特征在于，所述步骤A具体包括：

3.根据权利要求2所述的一种音频信号的编码方法，其特征在于，所述步骤B具体包括：

步骤B2：对旋转角进行量化熵编码，形成参数码流；

步骤B3：对所述和差音频码流进行量化和熵编码；

4.根据权利要求2所述的一种音频信号的编码方法，其特征在于，所述步骤B具体包括：

步骤B2：对旋转角进行量化熵编码，形成参数码流；

步骤B3：对所述强度音频码流进行量化和熵编码；

5.根据权利要求3或4所述的一种音频信号的编码方法，其特征在于，所述步骤A1具体为：

6.根据权利要求3或4所述的一种音频信号的编码方法，其特征在于，所述步骤A1具体为：

7.根据权利要求1所述的一种音频信号的编码方法，其特征在于，所述步骤A具体包括：

8.根据权利要求7所述的一种音频信号的编码方法，其特征在于，所述步骤B具体包括：

步骤B2：对下混声道的音频信号进行编码，形成编码码流。

9.根据权利要求8所述的一种音频信号的编码方法，其特征在于，所述步骤A1具体为：

所述步骤A2具体为：

10.根据权利要求8所述的一种音频信号的编码方法，其特征在于，所述步骤A1具体为：

所述步骤A2具体为：

11.一种音频信号的解码方法，其特征在于，所述方法包括：

12.根据权利要求11所述的一种音频信号的解码方法，其特征在于，所述步骤A具体为：

步骤A1：将编码码流分解成音频码流和参数码流；

13.根据权利要求12所述的一种音频信号的解码方法，其特征在于，所述步骤B具体为：

14.根据权利要求13所述的一种音频信号的解码方法，其特征在于，所述步骤B2具体为：

15.根据权利要求13所述的一种音频信号的解码方法，其特征在于，所述步骤B2具体为：

16.根据权利要求11所述的一种音频信号的解码方法，其特征在于，所述步骤A具体为：

相应的，所述步骤B具体包括：

17.根据权利要求16所述的一种音频信号的解码方法，其特征在于，所述步骤B2具体为：

18.根据权利要求17所述的一种音频信号的解码方法，其特征在于，所述步骤A2具体为：

19.根据权利要求18所述的一种音频信号的解码方法，其特征在于，所述步骤A2具体为：

20.一种音频信号的编码系统，其特征在于，包括极大相关度旋转变换模块、编码模块；

21.根据权利要求20所述的一种音频信号的编码系统，其特征在于，所述极大相关度旋转变换模块具体包括时频分析单元、极大相关度旋转变换单元；

码流成型单元，用于将经过量化和熵编码的所述音频码流和参数码流组合成编码码流。

22.根据权利要求21所述的一种音频信号的编码系统，其特征在于，所述时频分析单元具体为具体为快速傅里叶变换单元。

23.根据权利要求21所述的一种音频信号的编码系统，其特征在于，所述时频分析单元具体为具体为多相滤波器组变换单元。

24.根据权利要求20所述的一种音频信号的编码系统，其特征在于，所述极大相关度旋转变换模块具体包括快速傅里叶变换单元、极大相关度旋转变换单元；

25.一种音频信号的解码系统，其特征在于，包括解码模块、极大相关度逆旋转变换模块；

26.根据权利要求25所述的一种音频信号的解码系统，其特征在于，所述解码模块具体包括码流解析单元、熵解码反量化单元、解码单元；

27.根据权利要求26所述的一种音频信号的解码系统，其特征在于，所述时频综合单元具体为快速傅里叶逆变换单元。

28.根据权利要求26所述的一种音频信号的解码系统，其特征在于，所述时频综合单元具体为多相滤波器组逆变换单元。

29.根据权利要求25所述的一种音频信号的解码系统，其特征在于，所述解码模块具体包括解码单元、快速傅里叶变换单元、上混单元、反矢量量化单元；