CN102103859B

CN102103859B - 一种数字音频编码、解码方法及装置

Info

Publication number: CN102103859B
Application number: CN2011100042443A
Authority: CN
Inventors: 伍家松; 舒华忠; 王膂; 李松毅; 罗立民
Original assignee: Southeast University
Current assignee: Southeast University
Priority date: 2011-01-11
Filing date: 2011-01-11
Publication date: 2012-04-11
Anticipated expiration: 2031-01-11
Also published as: CN102103859A

Abstract

本发明公开了一种数字音频编码、解码方法，属于数字信号编码技术领域。本发明方法在对数字音频进行编解码时，将长度为2M的MCLT和IMCLT分别分解为两个长度为M的MCLT和IMCLT来进行快速计算，从而降低计算复杂度。相比现有技术，本发明方法具有计算复杂度低、实时性能好、易于实现的优点。本发明还公开了采用本发明编码、解码方法的数字音频编码、解码装置。

Description

一种数字音频编码、解码方法及装置

技术领域

本发明涉及一种数字音频编码、解码方法及装置，属于数字信号编码技术领域。

背景技术

由于数字音频信号在空间域上具有较强的相关性，而一维重叠正交变换则是去除数字音频信号空间域冗余度的有效方法，因此被广泛应用于各种音频编码标准(如：MPEG，E-AC-3等)。数字音频编码装置通常包括数据输入单元、数据正向变换单元、量化单元以及熵编码单元，相应的解码装置包括反熵编码单元、反量化单元、数据反向变换单元及输出单元。通常为了使得经过数据反向变换后得到的重叠数字音频信号经过“重叠相加”操作后能够完全恢复得到初始的数字音频信号，需要在正向变换单元之前对输入的音频信号进行加窗操作以及在反向变换单元之前对重叠正交变换域的系数进行加窗操作。数字音频信号编解码的过程通常包括以下几个步骤：

编码过程：

1、输入数字音频信号数据；

2、对输入的音频信号数据进行加窗操作；

3、将加窗后得到的新的音频信号数据进行一维正向重叠正交变换，得到变换域系数；

4、对得到的变换域系数向量进行量化处理；

5、对经过量化后的系数进行熵编码，即利用哈夫曼编码，游程编码，算术编码等编码方法进行压缩编码，得到编码后的数据；此时即可将编码后的数据存储在存储介质中或进行传输。

解码过程：

1、对编码后的数据进行反熵编码，即利用反哈夫曼编码，反游程编码，反算术编码等方式进行解码；

2、对反熵编码后的数据进行反量化处理；

3、对经过反量化处理的数据进行加窗操作；

4、将加窗后的数据进行一维反向重叠正交变换，从而得到“重叠”的数字音频数据；

5、将“重叠”的数字音频数据进行“重叠相加”操作得到原始的音频数据；

6、将原始的数字音频数据进行输出。

目前数字音频编解码装置中经常使用的变换方法包括改进的离散余弦变换(Modulated Discrete Cosine Transform，MDCT)以及复数调制重叠变换(ModulatedComplex Lapped Transform，MCLT)等。其中，复数调制重叠变换是一种余弦调制滤波器，其将实数输入信号转化为复数输出信号。MCLT是调制重叠变换(MLT)，也就是改进的离散余弦变换(MDCT)的复数扩展形式。MCLT实部是MDCT，虚部是改进的离散正弦变换(MDST)。MCLT因为具有相位信息，因此被广泛用于需要相位信息的数字音频信号处理问题，如音频水印，音频编码，音频流识别和声学回声消除，音频数据包丢失隐藏等，且被最新的音频标准E-AC-3所采纳。

长度为2M的实输入音频信号序列{x(n)}，n＝0，1，...，2M-1，的MCLT定义为

X (k) = Σ_{n = 0}^{2 M - 1} x^{'} (n) l (k, n), k = 0,1, . . ., M - 1, - - - (1)

其中l(k，n)是分析基函数

l (k, n) = \exp [- j \frac{π}{4 M} (2 n + 1 + M) (2 k + 1)] - - - (2)

其中

j = \sqrt{- 1} .

{x′(n)}是加窗后的新的输入音频信号序列

x^{'} (n) = \sqrt{\frac{2}{M}} h (n) x (n) - - - (3)

其中

\sqrt{\frac{2}{M}} h (n)

为窗函数。

如果直接采用定义计算式(1)，相当于计算下面的一个矩阵与向量的乘积

X_{M \times 1} = L_{M \times 2 M} x_{2 M \times 1}^{'} &DoubleLeftRightArrow;

[\begin{matrix} X (0) \\ X (1) \\ M \\ X (M - 1) \end{matrix}] = [\begin{matrix} l (0,0) & l (0,1) & L & l (0,2 M - 1) \\ l (1,0) & l (1,1) & L & l (1,2 M - 1) \\ M & M & O & M \\ l (M - 1,0) & l (M - 1,1) & L & l (M - 1,2 M - 1) \end{matrix}] [\begin{matrix} x^{'} (0) \\ x^{'} (1) \\ M \\ x^{'} (2 M - 1) \end{matrix}] - - - (4)

其中L_M×2M是一个M×(2M)的正向MCLT矩阵，x′_2M×1＝[x′(0)，x′(1)，...，x′(2M-1)]^T是输入的加窗后的数字音频信号向量，x_M×1＝[X(0)，X(1)，...，X(M-1)]^T是输出的MCLT域系数向量，其中上标“T”代表转置。

直接计算式(4)需要4M²次乘法和4M²-2M次加法，再加上式(3)中加窗操作需要2M次乘法，因此直接利用式(1)计算MCLT总共需要的计算复杂度为：4M²+2M次乘法和4M²-2M次加法。

一维反向MCLT定义(IMCLT)为：

{X′(k)}是加窗后的新的MCLT系数向量

X^{'} (k) = \sqrt{\frac{2}{M}} h (k) X (k) - - - (6)

其中X(k)为通过式(1)得到的MCLT系数，为窗函数。

是输出的“重叠”的音频信号。通常来说，

与x(n)的值是不一样的，但是可以通过对

进行“重叠相加”操作得到x(n)。

如果直接采用定义计算式(5)，相当于计算下面的一个矩阵与向量的乘积

其中

是一个(2M)×M的反向MCLT(IMCLT)矩阵，X′_M×1＝[X′(0)，X′(1)，...，X′(M-1)]^T是输入的加窗后的MCLT系数向量，

是输出的“重叠”的音频信号向量。

直接计算式(7)需要4M²次乘法和4M²-4M次加法，再加上式(6)中加窗操作需要M次乘法，因此直接利用式(5)计算IMCLT总共需要的计算复杂度为：4M²+M次乘法和4M²-4M次加法。

由此可见使用传统方法进行MCLT变换和IMCLT变换，计算复杂度极高，需要消耗较多的硬件资源并严重影响音频编解码的实时性。因此，针对MCLT和IMCLT发展快速算法是非常必要的。

发明内容

本发明要解决的技术问题在于解决现有基于MCLT变换的数字音频信号编解码方法存在的计算复杂度高的问题，提供一种具有较低复杂度的数字音频信号编码、解码方法及装置。

本发明的思路是在进行一维正向MCLT变换时，对一维正向MCLT变换2M阶矩阵进行稀疏矩阵分解，将其分解为两个一维正向MCLT变换M阶矩阵，从而降低计算复杂度。具体而言，本发明采用以下技术方案：

一种数字音频编码方法，包括对输入的长度为2M的数字音频数据进行一维正向MCLT变换，输出数字音频数据的MCLT域系数向量的步骤，M为大于等于2的偶数，其特征在于，所述一维正向MCLT变换通过2个长度为M的正向MCLT变换来实现，具体按照以下方法：

X_{M \times 1} = R_{M \times M} \cdot [\begin{matrix} I_{M / 2} & - I_{M / 2} \\ I_{M / 2} & I_{M / 2} \end{matrix}] \cdot [\begin{matrix} L_{(M / 2) \times M} \cdot [\begin{matrix} I_{M} & - I_{M} \end{matrix}] \cdot C_{2 M \times 2 M} & 0_{(M / 2) \times (2 M)} \\ 0_{(M / 2) \times (2 M)} & j \cdot L_{(M / 2) \times M} \cdot [\begin{matrix} I_{M} & - I_{M} \end{matrix}] \cdot S_{2 M \times 2 M} \end{matrix}]

\cdot [\begin{matrix} I_{2 M} \\ I_{2 M} \end{matrix}] \cdot x_{2 M \times 1}

其中，

x_2M×1＝[x(0)，x(1)，...，x(2M-1)]^T是输入的长度为2M的数字音频信号向量，M为大于等于2的偶数，上标“T”代表转置；X_M×1＝[X(0)，X(1)，...，X(M-1)]^T是输出的MCLT域系数向量；L_M×2M是长度为2M的一维正向MCLT矩阵；L_(M/2)×M是长度为M的一维正向MCLT矩阵；I_M/2，I_M和I_2M分别是M/2，M和2M阶单位矩阵；C_2M×2M和S_2M×2M都是由旋转因子组成的矩阵，表示如下：

C_{2 M \times 2 M} = {[\begin{matrix} C_{1} \\ C_{2} \end{matrix}]}_{2 M \times 2 M};

S_{2 M \times 2 M} = {[\begin{matrix} S_{1} \\ S_{2} \end{matrix}]}_{2 M \times 2 M};

C_{1} = {[\begin{matrix} \cos [\frac{π}{4 M} (M + 1)] \\ \cos [\frac{π}{4 M} (M + 3)] \\ O \\ \cos [\frac{π}{4 M} (\frac{7}{2} M - 1)] \end{matrix}]}_{(7 M / 4) \times (7 M / 4)}

C_{2} {= [\begin{matrix} - \cos [\frac{π}{4 M} (\frac{M}{2} + 1)] \\ - \cos [\frac{π}{4 M} (\frac{M}{2} + 3)] \\ O \\ - \cos [\frac{π}{4 M} (M - 1)] \end{matrix}]}_{(M / 4) \times (M / 4)}

S_{1} = {[\begin{matrix} \sin [\frac{π}{4 M} (M + 1)] \\ \sin [\frac{π}{4 M} (M + 3)] \\ O \\ \sin [\frac{π}{4 M} (\frac{7}{2} M - 1)] \end{matrix}]}_{(7 M / 4) \times (7 M / 4)}

S_{2} = {[\begin{matrix} - \sin [\frac{π}{4 M} (\frac{M}{2} + 1)] \\ - \sin [\frac{π}{4 M} (\frac{M}{2} + 3)] \\ O \\ - \sin [\frac{π}{4 M} (M - 1)] \end{matrix}]}_{(M / 4) \times (M / 4)};

R_M×M是置换矩阵。

相应的数字音频解码方法，包括对输入的经反量化处理的，长度为M的MCLT域系数向量进行一维反向MCLT变换，输出重叠的数字音频数据的步骤，M为大于等于2的偶数，其特征在于，所述一维反向MCLT变换通过两个长度为M的反向MCLT变换来实现，具体按照以下方法：

\cdot [\begin{matrix} C_{2 M \times 2 M} \cdot [\begin{matrix} I_{M} \\ - I_{M} \end{matrix}] {\cdot (L_{(M / 2) \times M})}^{T} & 0_{(2 M) \times (M / 2)} \\ 0_{(2 M) \times (M / 2)} & S_{2 M \times 2 M} \cdot [\begin{matrix} I_{M} \\ - I_{M} \end{matrix}] \cdot j \cdot {(L_{(M / 2) \times M})}^{T} \end{matrix}],

\cdot [\begin{matrix} I_{M / 2} & I_{M / 2} \\ - I_{M / 2} & I_{M / 2} \end{matrix}] \cdot R_{M \times M}^{T} \cdot X_{M \times 1}

其中，

X_M×1＝[X(0)，X(1)，...，X(M-1)]^T是输入的经反量化处理的长度为M的MCLT域系数向量，上标“T”代表转置，M为大于等于2的偶数；

是输出的长度为2M的重叠的数字音频信号向量；(L_M×2M)^T是长度为2M的一维反向MCLT矩阵；(L_(M/2)×M)^T是长度为M的一维反向MCLT矩阵；I_M/2，I_M和I_2M分别是M/2，M和2M阶单位矩阵；C_2M×2M和S_2M×2M都是由旋转因子组成的矩阵，表示如下：

C_{2 M \times 2 M} = {[\begin{matrix} C_{1} \\ C_{2} \end{matrix}]}_{2 M \times 2 M};

S_{2 M \times 2 M} = {[\begin{matrix} S_{1} \\ S_{2} \end{matrix}]}_{2 M \times 2 M};

C_{1} {= [\begin{matrix} \cos [\frac{π}{4 M} (M + 1)] \\ \cos [\frac{π}{4 M} (M + 3)] \\ O \\ \cos [\frac{π}{4 M} (\frac{7}{2} M - 1)] \end{matrix}]}_{(7 M / 4) \times (7 M / 4)}

C_{2} {= [\begin{matrix} - \cos [\frac{π}{4 M} (\frac{M}{2} + 1)] \\ - \cos [\frac{π}{4 M} (\frac{M}{2} + 3)] \\ O \\ - \cos [\frac{π}{4 M} (M - 1)] \end{matrix}]}_{(M / 4) \times (M / 4)}

S_{1} = {[\begin{matrix} \sin [\frac{π}{4 M} (M + 1)] \\ \sin [\frac{π}{4 M} (M + 3)] \\ O \\ \sin [\frac{π}{4 M} (\frac{7}{2} M - 1)] \end{matrix}]}_{(7 M / 4) \times (7 M / 4)}

S_{2} = {[\begin{matrix} - \sin [\frac{π}{4 M} (\frac{M}{2} + 1)] \\ - \sin [\frac{π}{4 M} (\frac{M}{2} + 3)] \\ O \\ - \sin [\frac{π}{4 M} (M - 1)] \end{matrix}]}_{(M / 4) \times (M / 4)};

R_{M \times M}^{T}

是置换矩阵。

根据上述编码、解码方法可得到相应的数字音频编码及解码装置如下，

一种数字音频编码装置，包括顺次信号连接的信号输入单元、MCLT单元、量化单元及熵编码单元，其中MCLT单元通过2个长度为M的正向MCLT变换将长度为2M的数字音频数据变换为长度为M的MCLT域系数向量，M为大于等于2的偶数。

一种数字音频解码装置，包括顺次信号连接的反熵编码单元、反量化单元、IMCLT单元、重叠相加及输出单元，其中IMCLT单元通过2个长度为M的反向MCLT变换将长度为M的MCLT域系数向量变换为长度为2M的重叠的数字音频信号向量，M为大于等于2的偶数。

本发明的数字音频编码、解码方法，通过将长度为2M的一维正向/反向MCLT/IMCLT变换通过两个长度为M的MCLT/IMCLT变换来实现，从而大幅降低了计算复杂度，提高了数字音频编码/解码装置的实时性，且实现方便。

附图说明

图1为本发明所使用的MCLT变换的算法原理示意图；

图2为本发明所使用的IMCLT变换的算法原理示意图；

图3为具体实施方式中所述4点MCLT变换的具体实现流图；

图4为具体实施方式中所述4点IMCLT变换的具体实现流图；

图5为具体实施方式中所述8点MCLT具体实现流图；

图6为具体实施方式中所述8点IMCLT具体实现流图。

具体实施方式

下面结合附图对本发明的技术方案进行详细说明：

本发明的数字音频编码装置包括顺次信号连接的信号输入单元、加窗操作单元、MCLT单元、量化单元及熵编码单元；本发明的数字音频解码装置包括顺次信号连接的反熵编码单元、反量化单元、加窗操作单元、IMCLT单元、重叠相加及输出单元。

使用上述编码装置对长度为2M的数字音频进行编码时，按照以下步骤：

步骤1、将输入的数字音频信号序列数据x(n)进行加窗操作得到新的数字音频信号序列

其中

为窗函数，M表示输入音频信号采样点数2M的一半，其取值为大于等于2的偶数；

步骤2、将{x′(n)}作为输入向量进行一维正向MCLT变换，得到MCLT域系数X(k)；如采用传统方法，即背景技术部分所述公式(4)，则需要将加窗操作后的数字音频信号序列x′(n)乘以一个M×(2M)的正向MCLT矩阵L_M×2M，此时计算复杂度较高，本发明采用对一维正向MCLT变换2M阶矩阵L_M×2M进行稀疏矩阵分解，分解为两个一维正向MCLT变换M阶矩阵L_(M/2)×M的计算，从而式(4)可以通过如下方式计算：

X_{M \times 1} = L_{M \times 2 M} x_{2 M \times 1}^{'} &DoubleLeftRightArrow;

X_{M \times 1} = R_{M \times M} \cdot [\begin{matrix} I_{M / 2} & - I_{M / 2} \\ I_{M / 2} & I_{M / 2} \end{matrix}] \cdot [\begin{matrix} L_{(M / 2) \times M} \cdot [\begin{matrix} I_{M} & - I_{M} \end{matrix}] \cdot C_{2 M \times 2 M} & 0_{(M / 2) \times (2 M)} \\ 0_{(M / 2) \times (2 M)} & j \cdot L_{(M / 2) \times M} \cdot [\begin{matrix} I_{M} & - I_{M} \end{matrix}] \cdot S_{2 M \times 2 M} \end{matrix}]

\cdot [\begin{matrix} I_{2 M} \\ I_{2 M} \end{matrix}] \cdot x_{2 M \times 1}^{'} - - - (8)

其中

x′_2M×1＝[x′(0)，x′(1)，...，x′(2M-1)]^T是输入的加窗后的数字音频信号向量，上标“T”代表转置。X_M×1＝[X(0)，X(1)，...，X(M-1)]^T是输出的MCLT域系数向量；L_M×2M是长度为2M的一维正向MCLT矩阵；L_(M/2)×M是长度为M的一维正向MCLT矩阵；I_M/2，I_M和I_2M分别是M/2，M和2M阶单位矩阵，比如

C_2M×2M和S_2M×2M都是由旋转因子(余弦或者正弦函数值)组成的矩阵，表示如下：

C_{2 M \times 2 M} = {[\begin{matrix} C_{1} \\ C_{2} \end{matrix}]}_{2 M \times 2 M};

S_{2 M \times 2 M} = {[\begin{matrix} S_{1} \\ S_{2} \end{matrix}]}_{2 M \times 2 M};

C_{1} = {[\begin{matrix} \cos [\frac{π}{4 M} (M + 1)] \\ \cos [\frac{π}{4 M} (M + 3)] \\ O \\ \cos [\frac{π}{4 M} (\frac{7}{2} M - 1)] \end{matrix}]}_{(7 M / 4) \times (7 M / 4)}

C_{2} {= [\begin{matrix} - \cos [\frac{π}{4 M} (\frac{M}{2} + 1)] \\ - \cos [\frac{π}{4 M} (\frac{M}{2} + 3)] \\ O \\ - \cos [\frac{π}{4 M} (M - 1)] \end{matrix}]}_{(M / 4) \times (M / 4)}

S_{1} = {[\begin{matrix} \sin [\frac{π}{4 M} (M + 1)] \\ \sin [\frac{π}{4 M} (M + 3)] \\ O \\ \sin [\frac{π}{4 M} (\frac{7}{2} M - 1)] \end{matrix}]}_{(7 M / 4) \times (7 M / 4)}

S_{2} = {[\begin{matrix} - \sin [\frac{π}{4 M} (\frac{M}{2} + 1)] \\ - \sin [\frac{π}{4 M} (\frac{M}{2} + 3)] \\ O \\ - \sin [\frac{π}{4 M} (M - 1)] \end{matrix}]}_{(M / 4) \times (M / 4)}

R_M×M是置换矩阵，比如：对于输入长度为M的输入序列

{u(0)，u(2)，u(4)，...，u(M-2)，u(1)，u(3)，u(5)，...，u(M-1)，}，

R_M×M实现的功能是

{u(0)，u(1)，u(2)，u(3)，...，u(M-2)，u(M-1)}

＝R_M×M·{u(0)，u(2)，u(4)，...，u(M-2)，u(1)，u(3)，u(5)，...，u(M-1)}。

需要注意的是，式(8)的分解过程是可以递归实现的，比如可以继续在式(8)中将一维正向MCLT变换M阶矩阵L_(M/2)×M分解为两个一维正向MCLT变换(M/2)阶矩阵如下：

L_{(M / 2) \times M} =

R_{(M / 2) \times (M / 2)} [\begin{matrix} L_{(M / 4) \times (M / 2)} \cdot [\begin{matrix} I_{M / 2} & - I_{M / 2} \end{matrix}] \cdot C_{M \times M} & 0_{(M / 4) \times M} \\ 0_{(M / 4) \times M} & j \cdot L_{(M / 4) \times (M / 2)} \cdot [\begin{matrix} I_{M / 2} & {- I}_{M / 2} \end{matrix}] \cdot S_{M \times M} \end{matrix}] \cdot [\begin{matrix} I_{M} \\ I_{M} \end{matrix}] - - - (9)

可以一直这样递归的分解下去，直到起点，比如4点一维正向MCLT变换矩阵(也就是M＝4)，也就是

L_{2 \times 4} = R_{2 \times 2} \cdot [\begin{matrix} L_{1 \times 2} \cdot [\begin{matrix} I_{2} & {- I}_{2} \end{matrix}] \cdot C_{4 \times 4} & 0_{1 \times 4} \\ 0_{1 \times 4} & j \cdot L_{1 \times 2} \cdot [\begin{matrix} I_{2} & {- I}_{2} \end{matrix}] \cdot S_{4 \times 4} \end{matrix}] \cdot [\begin{matrix} I_{4} \\ I_{4} \end{matrix}] - - - (10)

我们可以通过引入一系列中间变量，将式(8)进行分步计算如下：

X_{M \times 1} = R_{M \times M} [\begin{matrix} X_{(M / 2) \times 1}^{1} \\ X_{(M / 2) \times 1}^{2} \end{matrix}];

[\begin{matrix} X_{(M / 2) \times 1}^{1} \\ X_{(M / 2) \times 1}^{2} \end{matrix}] = [\begin{matrix} I_{M / 2} & {- I}_{M / 2} \\ I_{M / 2} & I_{M / 2} \end{matrix}] [\begin{matrix} A_{(M / 2) \times 1} \\ B_{(M / 2) \times 1} \end{matrix}];

X_{M \times 1} = R_{M \times M} [\begin{matrix} I_{M / 2} & {- I}_{M / 2} \\ I_{M / 2} & I_{M / 2} \end{matrix}] [\begin{matrix} A_{(M / 2) \times 1} \\ B_{(M / 2) \times 1} \end{matrix}];

A_(M/2)×1＝L_(M/2)×Mp_M×1；(11)

p_M×1＝[I_M-I_M]y_2M×1；

y_2M×1＝C·x′_2M×1；

B_(M/2)×1＝j·B′_(M/2)×1；

B′_(M/2)×1＝L_(M/2)×Mq_M×1；

q_M×1＝[I_M-I_M]z_2M×1；

z_2M×1＝S_2M×2M·x′_2M×1；

其中

A_(M/2)×1、p_M×1、y_2M×1、B_(M/2)×1、B′_(M/2)×1、q_M×1、z_2M×1为构造的中间结果向量，具体表达如下：

X_{(M / 2) \times 1}^{1} = {[X (0), X (2), X (4), . . ., X (M - 2)]}^{T} - - - (12)

X_{(M / 2) \times 1}^{2} = {[X (1), X (3), X (5), . . ., X (M - 1)]}^{T} - - - (13)

A_(M/2)×1＝[A(0)，A(1)，A(2)，...，A(M/2-1)]^T (14)

p_M×1＝[p(0)，p(1)，p(2)，...，p(M-1)]^T (15)

y_2M×1＝[y(0)，y(1)，y(2)，...，y(2M-1)]^T (16)

B_(M/2)×1＝[B(0)，B(1)，B(2)，...，B(M/2-1)]^T (17)

B′_(M/2)×1＝-jB_(M/2)×1＝[-jB(0)，-jB(1)，-jB(2)，...，-jB(M/2-1)]^T (18)

q_M×1＝[q(0)，q(1)，q(2)，...，q(M-1)]^T (19)

z_2M×1＝[z(0)，z(1)，z(2)，...，z(2M-1)]^T (20)

式(14)-(20)中的向量A_(M/2)×1、p_M×1、y_2M×1、B_(M/2)×1、B′_(M/2)×1、q_M×1、z_2M×1中的元素分别由下面的式子(23)-(29)给出。式(12)和式(13)中的向量

中的元素分别由下面的式子(30)和(31)计算出。

本发明将输出X(k)的计算分成偶数输出索引X(2k)和奇数输出索引X(2k+1)两个部分进行计算。为了计算X(2k)和X(2k+1)，我们构造如下两个子式：

A(k)＝(X(2k+1)+X(2k))/2，k＝0，1，...，M/2-1，(21)

B(k)＝(X(2k+1)-X(2k))/2，k＝0，1，...，M/2-1；(22)

A(k)按照下式计算，

A (k) = Σ_{n = 0}^{2 M - 1} x^{'} (n) \cos [\frac{π}{4 M} (2 n + 1 + M)] \exp [- j \frac{π}{2 M} (2 n + 1 + M) (2 k + 1)]

= Σ_{n = 0}^{2 M - 1} y (n) \exp [- j \frac{π}{2 M} (2 n + 1 + \frac{M}{2}) (2 k + 1)] - - - (23)

= Σ_{n = 0}^{M - 1} p (n) \exp [- j \frac{π}{2 M} (2 n + 1 + \frac{M}{2}) (2 k + 1)]

其中，

p(n)＝y(n)-y(n+M) (24)

y (n) = \{\begin{matrix} - x^{'} (n + \frac{7 M}{4}) \cos [\frac{π}{4 M} (2 n + 1 + \frac{M}{2})], n = 0, L, \frac{M}{4} - 1 \\ x^{'} (n - \frac{M}{4}) \cos [\frac{π}{4 M} (2 n + 1 + \frac{M}{2})], n = \frac{M}{4}, L, 2 M - 1 \end{matrix} - - - (25)

B(k)按照下式计算，

B (k) = - j Σ_{n = 0}^{2 M - 1} x^{'} (n) \sin [\frac{π}{4 M} (2 n + 1 + M)] \exp [- j \frac{π}{2 M} (2 n + 1 + M) (2 k + 1)] - - - (26)

令B′(k)＝jB(k)，则

B^{'} (k) = Σ_{n = 0}^{2 M - 1} z (n) \exp [- j \frac{π}{2 M} (2 n + 1 + \frac{M}{2}) (2 k + 1)]

(27)

= Σ_{n = 0}^{M - 1} q (n) \exp [- j \frac{π}{2 M} (2 n + 1 + \frac{M}{2}) (2 k + 1)]

其中

q(n)＝z(n)-z(n+M)(28)

z (n) = \{\begin{matrix} - x^{'} (n + \frac{7 M}{4}) \sin [\frac{π}{4 M} (2 n + 1 + \frac{M}{2})], n = 0, L, \frac{M}{4} - 1 \\ x^{'} (n - \frac{M}{4}) \sin [\frac{π}{4 M} (2 n + 1 + \frac{M}{2})], n = \frac{M}{4}, L, 2 M - 1 \end{matrix} - - - (29)

通过A(k)和B(k)根据以下式(30)、(31)即可得到X(k)，k＝0，1，...，M 1，

X(2k)＝A(k)-B(k)＝A(k)+jB′(k)，k＝0，1，...，M/2-1，(30)

X(2k+1)＝A(k)+B(k)＝A(k)-jB′(k)，k＝0，1，...，M/2-1，(31)

以上算法等价的实现过程如附图1所示。

步骤3、将步骤2得到的MCLT域系数向量X(k)进行量化及熵编码，即可完成数字音频的编码。

相应地，(7)中的一维反向MCLT变换，本发明采用对一维反向MCLT变换2M阶矩阵(L_M×2M)^T进行稀疏矩阵分解，分解为两个一维反向MCLT变换M阶矩阵(L_(M/2)×M)^T的计算，从而式(7)可以通过如下方式计算：

\cdot [\begin{matrix} C_{2 M \times 2 M}^{T} \cdot [\begin{matrix} I_{M} \\ - I_{M} \end{matrix}] \cdot {(L_{(M / 2) \times M})}^{T} & 0_{(2 M) \times (M / 2)} \\ 0_{(2 M) \times (M / 2)} & S_{2 M \times 2 M}^{T} \cdot [\begin{matrix} I_{M} \\ {- I}_{M} \end{matrix}] \cdot j \cdot {(L_{(M / 2) \times M})}^{T} \end{matrix}] - - - (32)

\cdot [\begin{matrix} I_{M / 2} & I_{M / 2} \\ - I_{M / 2} & I_{M / 2} \end{matrix}] \cdot R_{M \times M}^{T} \cdot X_{M \times 1}^{'}

下面我们通过引入一系列中间变量，将式(32)进行分步计算如下：

其中

为构造的中间结果向量，具体表达如下：

上述计算的实现原理如附图2所示。

上述MCLT/IMCLT变换相比传统方法，计算复杂度明显降低，下面的表1、表2分别显示采用本发明的MCLT/IMCLT变换方法与传统MCLT/IMCLT变换方法的计算复杂度比较，

表1

表2

为了进一步说明本发明方法所使用的MCLT/IMCLT变换方法，下面分别以4点MCLT变换、4点IMCLT变换、8点MCLT变换、8点IMCLT变换为例来说明其具体实现过程。

例1、

附图3给出了4点MCLT的具体实现流程。该流图实现了

X (k) = Σ_{n = 0}^{4 - 1} x (n) h (n) \exp [- j \frac{π}{8} (2 n + 3) (2 k + 1)]; k = 0,1

其中输入是长度为4的音频信号x(n)：x(0)，x(1)，x(2)，x(3)；输出是长度为2的MCLT域系数X(k)：X(0)，X(1)。

其等价的实现过程如下：

1)加窗

x′(0)＝x(0)h(0)，x′(1)＝x(1)h(1)，x′(2)＝x(2)h(2)，x′(3)＝x(3)h(3).

2)计算过程：

X(0)＝-((x′(2)+x′(3))cos(π/8)-(x′(0)-x′(1))sin(π/8))

-j((x′(2)-x′(3))sin(π/8)+(x′(0)+x′(1))cos(π/8))

X(1)＝-((x′(0)-x′(1))cos(π/8)+(x′(2)+x′(3))sin(π/8))

+j((x′(0)+x′(1))sin(π/8)-(x′(2)-x′(3))cos(π/8))

例2

附图4给出了4点IMCLT的具体实现流图(图3的流图转置)。该流图实现了

其中输入是长度为2的MCLT域系数X(k)：X(0)，X(1)；输出是长度为4的“重叠”的音频信号

例3

附图5给出了8点MCLT计算流图。该流图实现了

X (k) = \frac{\sqrt{2}}{2} Σ_{n = 0}^{8 - 1} x (n) h (n) \exp [- j \frac{π}{16} (2 n + 5) (2 k + 1)]; k = 0,1,2,3

其中输入是长度为8的音频信号x(n)：x(0)，x(1)，...，x(7)；输出是长度为4的MCLT域系数X(k)：X(0)，X(1)，X(2)，X(3)。

该流图等价的实现过程如下：

1)加窗操作

\{\begin{matrix} x^{'} (0) = \sqrt{2} h (0) x (0) / 2; & x^{'} (4) = \sqrt{2} h (4) x (4) / 2 \\ x^{'} (1) = \sqrt{2} h (1) x (1) / 2; & x^{'} (5) = \sqrt{2} h (5) x (5) / 2 \\ x^{'} (2) = \sqrt{2} h (2) x (2) / 2; & x^{'} (6) = \sqrt{2} h (6) x (6) / 2 \\ x^{'} (3) = \sqrt{2} h (3) x (3) / 2; & x^{'} (7) = \sqrt{2} h (7) x (7) / 2 \end{matrix}

2)计算p(n)，q(n)

\{\begin{matrix} p (0) = y (0) - y (4) = - x^{'} (7) \cos (3 π / 16) + x^{'} (3) \sin (3 π / 16) \\ p (1) = y (1) - y (5) = x^{'} (0) \sin (3 π / 16) + x^{'} (4) \cos (3 π / 16) \\ p (2) = y (2) - y (6) = x^{'} (1) \sin (π / 16) + x^{'} (5) \cos (π / 16) \\ p (3) = y (3) - y (7) = - x^{'} (2) \sin (π / 16) + x^{'} (6) \cos (π / 16) \end{matrix}

\{\begin{matrix} q (0) = z (0) - z (4) = - x^{'} (7) \sin (3 π / 16) - x^{'} (3) \cos (3 π / 16) \\ q (1) = z (1) - z (5) = x^{'} (0) \cos (3 π / 16) - x^{'} (4) \sin (3 π / 16) \\ q (2) = z (2) - z (6) = x^{'} (1) \cos (π / 16) - x^{'} (5) \sin (π / 16) \\ q (3) = z (3) - z (7) = - x^{'} (2) \cos (π / 16) + x^{'} (6) \sin (π / 16) \end{matrix}

3)计算4点MCLT得到A(k)，B′(k)

A (k) = Σ_{n = 0}^{4 - 1} p (n) \exp [- j \frac{π}{8} (2 n + 3) (2 k + 1)], k = 0,1

A(0)＝-((p(2)+p(3))cos(π/8)-(p(0)-p(1))sin(π/8))

-j((p(2)-p(3))sin(π/8)+(p(0)+p(1))cos(π/8))

A(1)＝-((p(0)-p(1))cos(π/8)+(p(2)+p(3))sin(π/8))

+j((p(0)+p(1))sin(π/8)-(p(2)-p(3))cos(π/8))

B^{'} (k) = Σ_{n = 0}^{4 - 1} q (n) \exp [- j \frac{π}{8} (2 n + 3) (2 k + 1)], k = 0,1

B′(0)＝-((q(2)+q(3))cos(π/8)-(q(0)-q(1))sin(π/8))

-j((q(2)-q(3))sin(π/8)+(q(0)+q(1))cos(π/8))

B′(1)＝-((q(0)-q(1))cos(π/8)+(q(2)+q(3))sin(π/8))

+j((q(0)+q(1))sin(π/8)-(q(2)-q(3))cos(π/8))

4)计算X(k)

\{\begin{matrix} X (2 k + 1) = A (k) + B (k) = A (k) - j B^{'} (k) \\ X (2 k) = A (k) - B (k) = A (k) + j B^{'} (k) \end{matrix}, k = 0,1 .

例4、

附图6给出了8点IMCLT计算流图，是图5的流图转置。

该流图实现了

其中输入是长度为4的MCLT域系数X(k)：X(0)，X(1)，X(2)，X(3)；输出是长度为8的音频信号

Claims

1.一种数字音频编码方法，包括对输入的长度为2M的数字音频数据进行一维正向MCLT变换，输出数字音频数据的MCLT域系数向量的步骤，M为大于等于2的偶数，其特征在于，所述一维正向MCLT变换通过2个长度为M的正向MCLT变换来实现，具体按照以下方法：

其中，

x_2M×1＝[x(0)，x(1)，...，x(2M-1)]^T是输入的长度为2M的数字音频信号向量，M为大于等于2的偶数，上标“T”代表转置；X_M×1＝[X(0)，X(1)，...，X(M-1)]^T是输出的MCLT域系数向量；L_M×2M是长度为2M的一维正向MCLT矩阵；L_(M/2)×M是长度为M的一维正向MCLT矩阵；I_M/2，I_M和I_2M分别是M/2，M和2M阶单位矩阵；C_2M×2M和S_2M×2M 都是由旋转因子组成的矩阵，表示如下：