CN101527139A

CN101527139A - 一种音频编码解码方法及其装置

Info

Publication number: CN101527139A
Application number: CN200910058339A
Authority: CN
Inventors: 阮思恩; 司国鹏
Original assignee: Chengdu Jiuzhou Electronic Information System Co Ltd
Current assignee: Chengdu Jiuzhou Electronic Information System Co Ltd
Priority date: 2009-02-16
Filing date: 2009-02-16
Publication date: 2009-09-09
Anticipated expiration: 2029-02-16
Also published as: CN101527139B

Abstract

本发明涉及一种可以抑制音频信号预回声的编码解码方法及其装置。本发明的技术方案可以任意的减小音频帧在交迭区域的程度(从50％到0％)，从而减少量化误差在交迭区域内的扩散，进而抑制预回声失真；而且该交迭程度是动态适应的，可以根据信号暂态的强弱而改变；最后减小交迭程度不会影响编码的完美重建性，即不会在量化噪声之外产生新的编码误差。

Description

一种音频编码解码方法及其装置

技术领域

本发明涉及一种音频编码解码的技术领域，尤其涉及一种可以抑制音频信号预回声的编码解码方法及其装置。

背景技术

现今的音频编码已进入了感知编码(perceptual coding)的时代，得到广泛运用的代表是MP3(MPEG-1LayerIII)和AAC(先进音频编码)。音频的感知编码，不仅采用传统的变换编码(将时间信号转换为频率信号再进行编码)以去除音频信号的时间统计冗余，而且使用心理声学模型计算感知域上允许的量化噪声以进一步去除那些与人听觉无关的信号部分。

一个标准的音频感知编码器是一个因果的编码器：即，一个声音文件被分段为若干交迭的时间块(帧)，这些时间帧被变换为频域系数并量化。每一帧都是依次处理的，过去的n-1，n-2……会影响到第n帧的编码结果。解码器为了从频域系数重建原信号，反向变换时必须使用交迭相加(overlap add)的方式：即，交迭区域的反向量化样点必须通过相加来得到最终的时间信号。最主流应用的交迭变换(lapped transform)是MDCT(改进型离散余弦变换)，它将2M个时间采样点变换为M个频域系数。MDCT变换是基于50％的交迭程度，每次变换更新M个样点并交迭M个样点。

预回声失真是感知编码系统中的一种音频假象(artefact)。当原始音频信号中存在暂态部分，即在低能量区域后出现能量突变区域，同时该能量突变区域正好位于编码块的后部，这时编码结果中将出现预回声失真。在基于交迭变换的音频编码系统中(如MP3和AAC)，量化和比特分配是为了满足通过完整变换窗(transform window)下所有频率谱线计算而得到的量化噪声掩频阀值(masking thresholds)；这种情况下，量化误差将会作为一种完整窗长度的误差信号而叠加在变换窗的频率谱线之上，量化产生的噪声也将遍布在整个变换窗内。同时，在解码端为实现信号完美重建(perfect reconstruction)而必须使用交迭相加方式，这意味着量化噪声除了遍布在本窗内，还将在交迭相加的过程中被叠加到前一帧中。这将导致在解码的音频信号中，真实的暂态声音将出现(扩散)在突变之前的低能量区域，即预回声失真。在对富含有敲击乐器的音频信号进行编码时，预回声失真的发生尤为常见，影响了编码的质量。

预回声失真的产生，究其原因主要有两个部分。一是在当前帧内未能有效的捕捉突变信号，二是当前帧的突变信号由于交迭相加而对前一帧产生回溯影响。对于预回声失真产生的第一个原因，现在的音频编码技术普遍使用窗切换(window switching)来捕捉信号的时变性，并辅以时域噪声整型(temporalnoise shaping)对突变部分的包络进行编码。对于预回声失真产生的第二个原因，现有的解决方法是在编码端放弃掉交迭变换，即帧与帧之间不再交迭，但这种方式有如下问题：1、现在最广泛使用的基于50％交迭的变换将不再适用(比如MDCT)；2、在无交迭的情况下，由编码理论的完美重建条件约束，唯一能够使用的时间窗将是矩形窗，但矩形窗的旁瓣抑制能力相当低，会带来严重的能量泄漏；3、无交迭(0％交迭)将带来块效应(blocking effect)音频失真，即在帧边界处由于量化误差而产生的人耳可闻的滴答声。

发明内容

本发明的目的是提供一种音频编码方法及其装置，有效的抑制预回声失真。

本发明还提供了一种与上述音频编码方法及其装置对应的音频解码方法及其装置，有效的抑制预回声失真。

本发明提供的音频编码方法的技术方案包括步骤：

(A)将输入的串行采样点的音频暂态信号分成并行采样点的音频帧，每帧包含M个采样点；

(B)将相邻输入帧的采样点相互交迭(L-M)/2个采样点，构成交迭的音频帧，该交迭帧依次包含上一音频帧末尾交迭的(L-M)/2个采样点、该音频帧的M个采样点、下一音频帧开始交迭的(L-M)/2个采样点，形成的该交迭帧共L个采样点，其中L为M到2M之间的任意自然偶数，同时将交迭程度参数(L-M)/2送到码流传输；

(C)对该交迭帧的L个采样点进行时域前向跨帧滤波处理，得到L个滤波采样点；

(D)将滤波后的L个采样点，通过抽取得到该帧对应的M个滤波采样点；

(E)将M个滤波后的时域采样点，通过非交迭的时间频率变换得到M个频域样点；

(F)对该帧的M个频域样点，乘以对应的乘性符号1或-1，得到符号反转处理后的M个频域样点；

(G)将处理后的M个频域样点经量化编码后输出至码流。

上述骤(B)中相邻输入帧的采样点的交迭程度参数(L-M)/2为0％～50％之间的任意取值。

上述步骤(C)中对L个采样点x_L进行前向跨帧滤波是通过如下公式实现：x′_L＝P_L×Lx_L，

其中P是前向跨帧滤波矩阵，通过如下公式实现：

P = {[\begin{matrix} B_{L - M} & 0_{(L - M) \times (2 M - L)} & 0_{(L - M) \times (L - M)} \\ 0_{(2 M - L) \times (L - M)} & I_{(2 M - L) \times (2 M - L)} & 0_{(2 M - L) \times (L - M)} \\ 0_{(L - M) \times (L - M)} & 0_{(L - M) \times (2 M - L)} & B_{L - M} \end{matrix}]}_{L \times L},

其中I是单位矩阵，B是蝶形运算系数组成的跨帧滤波矩阵，通过如下公式实现：

B是正交矩阵，其中蝶形运算系数C₁＝cos[(2i-1)π/4M]，S₁＝sin[(2i-1)π/4M]，其余部分为零。

上述步骤(D)中对滤波后的L个采样点x_L抽取得到M个滤波采样点是通过如下公式实现：

x′_M＝H_M×Lx′_L，

其中H是抽取矩阵，通过如下公式实现：

H = {[\begin{matrix} 0_{\frac{L - M}{2} \times \frac{L - M}{2}} & I_{\frac{L - M}{2} \times \frac{L - M}{2}} & 0_{\frac{L - M}{2} \times (2 M - L)} & 0_{\frac{L - M}{2} \times \frac{L - M}{2}} & 0_{\frac{L - M}{2} \times \frac{L - M}{2}} \\ 0_{(2 M - L) \times \frac{L - M}{2}} & 0_{(2 M - L) \times \frac{L - M}{2}} & I_{(2 M - L) \times (2 M - L)} & 0_{(2 M - L) \times \frac{L - M}{2}} & 0_{(2 M - L) \times \frac{L - M}{2}} \\ 0_{\frac{L - M}{2} \times \frac{L - M}{2}} & 0_{\frac{L - M}{2} \times \frac{L - M}{2}} & 0_{\frac{L - M}{2} \times (2 M - L)} & I_{\frac{L - M}{2} \times \frac{L - M}{2}} & 0_{\frac{L - M}{2} \times \frac{L - M}{2}} \end{matrix}]}_{M \times L},

其中I是单位矩阵。

上述步骤(E)中对抽取得到的M个时域滤波采样点x′_M进行时频变换是通过如下公式实现：

X_{M}^{'} = S_{M}^{IV} x_{M}^{'},

其中S^IV是标准的非交迭的DST-IV(第四型离散正弦正变换)的时频变换。

上述步骤(F)中对时频变换后的M个频域样点X′_M进行符号反转处理是通过如下公式实现：X_M＝D_MX′_M，其中D是符号矩阵，并且D是正交矩阵，通过如下公式实现：

上述步骤(A)和步骤(B)之间还可以包括步骤：

(H)将输入的并行采样点的音频帧的暂态强度E_Δ和预设的门限值T的大小进行比较，并通过交迭判断函数L＝f(E_Δ)，判断交迭程度值R，计算交迭帧包含的采样点个数L。

上述步骤(H)中E_Δ是当前输入帧相对上一输入帧的暂态强度，通过如下公式实现：

E_Δ＝(|E_n-E_n-1|/E_n)％，其中E_n指当前帧的总能量，其计算公式为：

E_{n} = Σ_{i = 0}^{M - 1} {(x_{i}^{n})}^{2},

其中x_i ⁿ表示当前输入帧的一个采样点，E_n-1指上一帧的总能量，其计算公式为：

E_{n - 1} = Σ_{i = 0}^{M - 1} {(x_{i}^{n - 1})}^{2},

其中x_i ^n-1表示上一输入帧的一个采样点。

上述步骤(H)中预设的门限值T的取值集合是来自预设的集合{T₁，T₂，T₃}，其中T₁＜T₂＜T₃，它们均可以是任意值。

上述步骤(H)中交迭程度值R为预设值，其取值集合是来自预设的集合{R₁，R₂，R₃，R₄}，其中R₁＜R₂＜R₃＜R₄，它们的取值可以是0％～50％之间的任意值，交迭程度值R的取值和暂态强度E_Δ和预设的门限值T的大小比较结果具有一一对应的函数关系。

本发明提供的音频编码装置的技术方案包括：

分帧模块，用以将输入的串行采样点的音频暂态信号分成并行采样点的音频帧，每帧包含M个采样点；

帧交迭模块，用以将相邻输入帧的采样点相互交迭(L-M)/2点，构成交迭的音频帧，该交迭帧依次包含上一音频帧末尾交迭的(L-M)/2个采样点、该音频帧的M个采样点、下一音频帧开始交迭的(L-M)/2个采样点，形成的该交迭帧共L个采样点，其中L为M到2M之间的任意自然偶数；

交迭参数传输模块，用以将交迭程度参数(L-M)/2送到码流传输；

前向跨帧滤波模块，用以对该交迭帧的L个采样点进行时域前向跨帧滤波处理，得到L个滤波采样点；

抽取模块，用以将滤波后的L个采样点，通过抽取得到该帧对应的M个滤波采样点；

时频变换模块，用以将M个滤波后的时域采样点，通过非交迭的时间频率变换得到M个频域样点；

符号反转模块，用以将该帧的M个频域样点，乘以对应的乘性符号1或-1，得到符号反转处理后的M个频域样点；

量化编码模块，用以将处理后的M个频域样点经量化编码后输出至码流；

所述分帧模块、帧交迭模块、前向跨帧滤波模块、抽取模块、时频变换模块、符号反转模块和量化编码模块依次串行联结，交迭参数传输模块一端串行联结在帧交迭模块之后，另一端和编码装置的外部装置联结。

上述音频编码装置中在分帧模块和帧交迭模块之间还可以串行联结有判断模块，用以将输入帧的暂态强度E_Δ和门限T的大小进行比较，并通过交迭判断函数L＝f(E_Δ)，判断交迭程度值R，计算交迭帧包含的采样点个数L。

本发明提供的音频解码方法的技术方案包括步骤：

(a)从接收到的码流中进行量化解码得到该音频帧的M个频域样点；

(b)对该音频帧量化解码后的M个频域样点，乘以对应的乘性符号1或-1，得到反向符号反转处理后的M个频域样点；

(c)将该音频帧反向符号反转处理后的M个频域样点，通过非交迭的频率时间变换得到该帧的M个时域采样点；

(d)从码流中获取交迭程度参数(L-M)/2，将相邻帧的采样点相互交迭(L-M)/2点，构成共L个采样点的交迭帧，该交迭帧依次包含上一帧末尾交迭的(L-M)/2个采样点、该帧的M个采样点、下一帧开始交迭的(L-M)/2个采样点；

(e)对该交迭帧的L个采样点进行时域后向跨帧滤波处理，得到L个滤波采样点；

(f)将该交迭帧滤波后的L个采样点，通过抽取得到该音频帧的M个采样点；

(g)将包含M个采样点的并行音频帧，合成串行采样点的音频暂态信号。

上述解码方法的步骤(b)中对M个频域样点X_M进行反向符号反转处理通过如下公式实现：

X′_M＝(D_M)^-1X_M，其中D是符号矩阵，并且是正交矩阵，(D_M)^-1为正交矩阵D的逆矩阵。

上述解码方法的步骤(c)中对M个频域样点X′_M进行频时变换通过如下公式实现：

x_{M}^{'} = {(S_{M}^{IV})}^{- 1} X_{M}^{'},

其中(S^IV)^-1是标准的非交迭的IDST-IV(第四型离散正弦反变换)的频时变换。

上述解码方法的步骤(e)中对L个采样点x′_L进行后向跨帧滤波的公式为：

x_{L} = {[\begin{matrix} B_{L - M}^{- 1} \\ I_{2 M - L} \\ B_{L - M}^{- 1} \end{matrix}]}_{L \times L} x_{L}^{'},

其中B是跨帧滤波矩阵，并且是正交矩阵，B^-1为正交矩阵B的逆矩阵。

上述解码方法的步骤(f)中对L个滤波采样点x_L通过抽取得到M个采样点的公式为：x_M＝H_M×Lx_L，其中H是抽取矩阵。

本发明提供的音频编码装置的技术方案包括：

量化解码模块，用以从码流中进行量化解码得到该音频帧的M个频域样点；

反向符号反转模块，用以将该音频帧量化解码后的M个频域样点，乘以对应的乘性符号1或-1，得到反向符号反转处理后的M个频域样点；

频时变换模块，用以将该音频帧反向符号反转处理后的M个频域样点，通过非交迭的频率时间变换得到该帧的M个时域采样点；

交迭参数获取模块，用以将码流中获取将交迭程度参数(L-M)/2；

帧交迭模块，用以将相邻帧的采样点相互交迭(L-M)/2点，构成共L个采样点的交迭帧，该交迭帧依次包含上一帧末尾交迭的(L-M)/2个采样点、该帧的M个采样点、下一帧开始交迭的(L-M)/2个采样点；

后向跨帧滤波模块，用以将该交迭帧的L个采样点进行时域后向跨帧滤波处理，得到L个滤波采样点；

抽取模块，用以将该交迭帧滤波后的L个采样点，通过抽取得到该音频帧的M个采样点；

合帧模块，用以将包含M个采样点的并行音频帧，合成串行采样点的音频暂态信号；

所述量化解码模块、反向符号反转模块、频时变换模块、帧交迭模块、后向跨帧滤波模块、抽取模块和合帧模块依次串行联结，交迭参数获取模块一端串行联结在帧交迭模块之前，另一端和解码装置的外部装置联结。

本发明的有益效果是：1、可以任意的减小交迭区域的程度(从50％到0％)，从而减少量化误差在交迭区域内的扩散，进而抑制预回声失真；2、该交迭程度是动态适应的，可以根据信号暂态的强弱而改变；3、减小交迭程度不会影响编码的完美重建性，即不会在量化噪声之外产生新的编码误差。

附图说明

附图1是本发明的音频编码方法的一个较佳实施例的流程图。

附图2是本发明的音频编码方法的另一个较佳实施例的流程图。

附图3是本发明的音频解码方法的一个较佳实施例的流程图。

附图4是本发明的音频编码装置的一个较佳实施例的原理框图。

附图5是本发明的音频编码装置的另一个较佳实施例的原理框图。

附图6是本发明的音频解码装置的一个较佳实施例的原理框图。

具体实施方式

下面结合附图和具体实施例对本发明的原理进行详细说明。

本发明的音频编码方法的一个较佳实施例：

下面结合图1对音频编码方法的实施例1的流程中各步骤加以详细描述：

步骤S1：将输入的串行采样点的音频暂态信号分成并行采样点的音频帧，每帧包含M个采样点，此时对应的每帧的长度为M。

步骤S2：将长度为M的音频帧，相互交迭(L-M)/2个采样点，L为M到2M之间的任意自然偶数。形成的交迭帧包含L个采样点，此时对应的每帧的长度为L，依次包括：(x_3M/2-L/2 ^n-1，...，x_M-1 ^n-1)，(x₀ ⁿ，...，x_M-1 ⁿ)，(x₀ ⁿ⁺¹，...，x_L/2-M/2-1 ⁿ⁺¹)，其中x^n-1是上一帧，xⁿ是当前帧，xⁿ⁺¹是下一帧。同时将交迭程度参数(L-M)/2送到码流传输。

这里的交迭方式多种多样，可以将所有相邻帧交迭20％，也可以将所有相邻帧交迭30％，也可以将所有的相邻帧根据暂态出现的强度交迭为0％～50％之间任意值。

步骤S3：对长度为L的交迭帧x_L进行时域前向跨帧滤波处理，滤波公式为：x′_L＝P_L×Lx_L，其中的前向跨帧滤波矩阵P的定义如公式1：

P = {[\begin{matrix} B_{L - M} & 0_{(L - M) \times (2 M - L)} & 0_{(L - M) \times (L - M)} \\ 0_{(2 M - L) \times (L - M)} & I_{(2 M - L) \times (2 M - L)} & 0_{(2 M - L) \times (L - M)} \\ 0_{(L - M) \times (L - M)} & 0_{(L - M) \times (2 M - L)} & B_{L - M} \end{matrix}]}_{L \times L}

公式1，

其中I是单位矩阵，B是蝶形运算系数组成的跨帧滤波矩阵，定义如公式2：

公式2，

B是正交矩阵，其中蝶形运算系数C_i＝cos[(2i-1)π/4M]，S_i＝sin[(2i-1)π/4M]，其余部分为零。

这里的前向跨帧滤波矩阵P是一个与交迭参数(L-M)/2相关的矩阵，当前帧两端的(L-M)/2个采样点和前一帧和下一帧的(L-M)/2个采样点分别通过跨帧滤波矩阵B，当前帧的中间2M-L个采样点直接通过单位矩阵不做任何滤波。比如极端情况交迭帧长度L为2M，则当前帧的前M/2个采样点和上一帧的后M/2个采样点通过矩阵B，当前帧的后M/2个采样点和下一帧的前M/2个采样点通过矩阵B，当前帧无直通的采样点。又比如极端情况交迭帧长度L为M，则当前帧的M个样点全部直接通过，无跨帧滤波的采样点。

步骤S4：对滤波后的L个采样点x′_L，抽取出M个采样点，抽取的公式为：x′_M＝H_M×Lx′_L，其中的抽取矩阵H的定义如公式3：

H = {[\begin{matrix} 0_{\frac{L - M}{2} \times \frac{L - M}{2}} & I_{\frac{L - M}{2} \times \frac{L - M}{2}} & 0_{\frac{L - M}{2} \times (2 M - L)} & 0_{\frac{L - M}{2} \times \frac{L - M}{2}} & 0_{\frac{L - M}{2} \times \frac{L - M}{2}} \\ 0_{(2 M - L) \times \frac{L - M}{2}} & 0_{(2 M - L) \times \frac{L - M}{2}} & I_{(2 M - L) \times (2 M - L)} & 0_{(2 M - L) \times \frac{L - M}{2}} & 0_{(2 M - L) \times \frac{L - M}{2}} \\ 0_{\frac{L - M}{2} \times \frac{L - M}{2}} & 0_{\frac{L - M}{2} \times \frac{L - M}{2}} & 0_{\frac{L - M}{2} \times (2 M - L)} & I_{\frac{L - M}{2} \times \frac{L - M}{2}} & 0_{\frac{L - M}{2} \times \frac{L - M}{2}} \end{matrix}]}_{M \times L}

公式3，

其中I是单位矩阵。

这里的抽取方式是：抛弃掉L个采样点两端的(L-M)/2的采样点，直接保留中间的M个采样点。

步骤S5：对滤波后的M个采样点x′_M，进行传统时频变换的公式为：

X_{M}^{'} = S_{M}^{IV} x_{M}^{'},

其中S^IV是标准的非交迭的DST-IV(第四型离散正弦正变换)。这里的时频变换是非交迭的变换，从M个时域采样点得到M个频域样点。第四型离散正弦变换有各种成熟的快速变换方式可供实施选择。

步骤S6：对M个频域样点X′_M，进行符号反转处理的公式为：X_M＝D_MX′_M，其中的符号矩阵D的定义如公式4：

公式4，

D是正交矩阵，这些频域样点(X′₀，X′₁，...，X′_M-2，X′_M-1)被符号反转为：(-X′₀，X′₁，...，-X′_M-2，X′_M-1)。

步骤S7：将处理后的频域样点(X₀，X₁，...，X_M-2，X_M-1)经量化编码后输出至码流。

基于上述音频编码方法的一个较佳实施例，本发明提供了对应的音频编码装置的一个较佳实施例。

下面结合图4对音频编码装置的原理结构加以详细描述：

一种音频编码装置，包括分帧模块1、帧交迭模块2、交迭参数传输模块3、前向跨帧滤波模块4、抽取模块5、时频变换模块6、符号反转模块7和量化编码模块8。

分帧模块1，用以将输入的串行采样点的音频暂态信号分成并行采样点的音频帧，每帧包含M个采样点。

帧交迭模块2，用以将长度为M的音频帧，相互交迭(L-M)/2个采样点，L为M到2M之间的任意自然偶数。形成的交迭帧包含L个采样点，依次包括：(x_3M/2-L/2 ^n-1，...，x_M-1 ^n-1)，(x₀ ⁿ，...，x_M-1 ⁿ)，(x₀ ⁿ⁺¹，...，x_L/2-M/2-1 ⁿ⁺¹)，其中x^n-1是上一帧，xⁿ是当前帧，xⁿ⁺¹是下一帧。这里的交迭方式多种多样，可以将所有相邻帧交迭20％，也可以将所有相邻帧交迭30％，也可以将所有的相邻帧根据暂态出现的强度交迭为0％～50％之间任意值。

交迭参数传输模块3，用以将交迭程度参数(L-M)/2送到码流传输。

前向跨帧滤波模块4，用以将长度为L的交迭帧x_L进行时域前向跨帧滤波处理，滤波公式为：x′_L＝P_L×Lx_L，其中前向跨帧滤波矩阵P的形式如前所述，在此不再赘述。

抽取模块5，用以将滤波后的L个采样点x′_L抽取出M个采样点，抽取的公式为：x′_M＝H_M×Lx′_L，其中抽取矩阵H的形式如前所述，在此不再赘述。

时频变换模块6，用以对滤波后的M个采样点x′_M进行传统的时频变换，变换的公式为：

X_{M}^{'} = S_{M}^{IV} x_{M}^{'},

其中S^IV是标准的非交迭的DST-IV(第四型离散正弦正变换)。

符号反转模块7，用以将M个频域样点X′_M进行符号反转处理，处理的公式为：X_M＝D_MX′_M，其中符号矩阵D的形式如如前所述，在此不再赘述。

量化编码模块8，用以将处理后的频域样点(X₀，X₁，...，X_M-2，X_M-1)经量化编码后输出至码流。

所述分帧模块1、帧交迭模块2、前向跨帧滤波模块4、抽取模块5、时频变换模块6、符号反转模块7和量化编码模块8依次串行联结，交迭参数传输模块3一端串行联结在帧交迭模块2之后，另一端和编码装置的外部装置联结。

本发明的音频编码方法的另一个较佳实施例：

如图2所示，该方案在前述音频编码方法的实施例的基础上改进，步骤S11、S13、S14、S15、S16、S17和S18分别与前述实施例的步骤S1、S2、S3、S4、S5、S6、S7相同，在此不再详细复述，本实施例与前述实施例的不同之处在于，本实施例增加了一个步骤：

步骤S12：对长度为M的音频帧，计算该输入帧的暂态强度E_Δ，比较E_Δ和门限值T的相对大小，通过交迭判断函数L＝f(E_Δ)，判断交迭程度值R，计算确定交迭帧长度L。

这里的音频帧的暂态强度E_Δ是一个与当前输入帧和上一输入帧能量有关的变量，其计算公式为：E_Δ＝(|E_n-E_n-1|/E_n)％，其中帧能量

E_{n} = Σ_{i = 0}^{M - 1} {(x_{i}^{n})}^{2},

E_{n - 1} = Σ_{i = 0}^{M - 1} {(x_{i}^{n - 1})}^{2},

x_i ⁿ和x_i ^n-1的定义如前所述。当E_Δ＜T₁时，判断当前帧暂态信号强度很弱，当T₁≤E_Δ＜T₂时，判断当前帧暂态信号强度较弱，当T₂≤E_Δ＜T₃时，判断当前帧暂态信号强度较强，当E_Δ≥T₃时，判断当前帧暂态信号强度很强。

这里的交迭判断函数L＝f(E_Δ)是一个与暂态强度E_Δ、门限T、交迭程度值R都有关的函数，函数值L为交迭帧的采样点个数，其中自变量E_Δ为当前帧的暂态强度，交迭程度值R和暂态强度E_Δ和预设的门限值T的大小比较结果具有一一对应的分段函数关系，交迭采样点L的取值和交迭程度值R具有线性函数的关系

暂态信号强度越强，判断的交迭程度就越小；暂态信号强度越弱，判断的交迭程度就越大。具体的函数形式如下表1所示，，当E_Δ＜T₁时，判断交迭程度值R是40％，计算函数值当T₁≤E_Δ＜T₂时，判断交迭程度值R是30％，计算函数值

当T₂≤E_Δ＜T₃时，判断交迭程度值R是20％，计算函数值

当E_Δ≥T₃时，判断交迭程度值R是10％，计算函数值其中

为向下取整操作。

表1

暂态强度E_Δ、门限T 交迭程度值R 函数值L

E_Δ＜T₁ 40％(暂态很弱)

T₁≤E_Δ＜T₂ 30％(暂态较弱)

T₂≤E_Δ＜T₃ 20％(暂态较强)

E_Δ≥T₃ 10％(暂态很强)

这里的门限T的取值是预设的，其取值的集合是来自预设的集合{T₁，T₂，T₃}，其中T₁＜T₂＜T₃，它们均可以是任意值。

这里的交迭程度值R的取值是预设的，其取值的集合是多种多样，可以来自预设的固定值集合{10％，20％，30％，40％}，也可以来自预设的任意值集合{R₁，R₂，R₃，R₄}，其中R₁＜R₂＜R₃＜R₄，它们均是0％～50％之间的任意值。在本发明中，交迭程度值R和交迭程度参数(L-M)/2是两个既有联系又不相同的两个物理量，交迭程度值R为0％～50％之间的任意值，表征的是帧与帧之间的相互交迭程度，它不依赖于具体的编码器实现；交迭程度参数(L-M)/2为0～M/2之间的任意自然数，表征的是帧与帧之间相互交迭的采样点数，它依赖于具体的编码实现内容，具体的说，它依赖于编码器时域分帧时一帧所包含的采样点数M，该点数在不同编码器实现中可以是各不相同的。

基于上述音频编码方法的另一个较佳实施例，本发明提供了对应的音频编码装置的另一个较佳实施例。

下面结合图5对音频编码装置原理结构加以详细描述，该方案在前述音频编码装置的实施例的基础上改进，包括了分帧模块11、判断模块12、帧交迭模块13、交迭参数传输模块14、前向跨帧滤波模块15、抽取模块16、时频变换模块17、符号反转模块18和量化编码模块19，其中分帧模块11、帧交迭模块13、交迭参数传输模块14、前向跨帧滤波模块15、抽取模块16、时频变换模块17、符号反转模块18和量化编码模块19分别对应于前述实施例的分帧模块1、帧交迭模块2、交迭参数传输模块3、前向跨帧滤波模块4、抽取模块5、时频变换模块6、符号反转模块7和量化编码模块8，两个实施例的前述对应的模块的结构和原理相同，不再复述；两个实施例的不同之处在于本实施例的分帧模块11和帧交迭模块13之间还串行联结有判断模块12，用以将输入帧的暂态强度E_Δ和门限T的大小进行比较，并通过交迭判断函数L＝f(E_Δ)，判断交迭程度值R，计算交迭帧包含的采样点个数L。

判断模块12对长度为M的音频帧，根据门限T、交迭程度值R、暂态强度E_Δ、交迭判断函数f(E_Δ)，计算交迭帧长度L。门限T的取值是预先设定的，其预设的取值集合的形式如前所述，在此不再赘述。交迭程度值R的取值是预先设定的，其预设的取值集合的形式如前所述，在此不再赘述。暂态强度E_Δ的值是动态的，对每一输入帧进行计算而得的，其计算的形式如前所述，在此不再赘述。交迭判断函数L＝f(E_Δ)是一个与暂态强度E_Δ有关的函数，在不同的E_Δ有不同的函数值L，函数的具体形式请见前述音频编码方法的另一实施例中的表1。

本发明的音频解码方法，可以对应于前述两种音频解码方法的实施例。

下面结合图3对解码方法的一个较佳实施例的流程步骤加以详细的描述。

步骤S21：从接收到的码流中进行量化解码得到该音频帧的M个频域样点(X₀，X₁，...，X_M-2，X_M-1)。

步骤S22：对M个频域样点X_M，进行反向符号反转处理的公式为：X′_M＝(D_M)^-1X_M，其中符号矩阵D的定义如公式4所示，其中D^-1为正交矩阵D的逆矩阵。这里的反向符号矩阵D^-1＝D^T＝D，这些频域样点(X₀，X₁，...，X_M-2，X_M-1)被反向符号反转为：(-X₀，X₁，...，-X_M-2，X_M-1)。

步骤S23：对反向符号反转处理后的M个样点X′_M，进行频时变换的公式为：

x_{M}^{'} = {(S_{M}^{IV})}^{- 1} X_{M}^{'},

步骤S24：从码流中获取交迭程度参数(L-M)/2。将长度为M的相邻帧，相互交迭(L-M)/2个采样点。形成的交迭帧包含L个采样点，依次包括：(x′_3M/2-L/2 ^n-1，...，x′_M-1 ^n-1)，(x′₀ ⁿ，...，x′_M-1 ⁿ)，(x′₀ ⁿ⁺¹，...，x′_L/2-M/2-1 ⁿ⁺¹)，其中x′^n-1是上一帧，x′ⁿ是当前帧，x′ⁿ⁺¹是下一帧。

步骤S25：对长度为L的交迭帧x′_L进行时域后向跨帧滤波处理，滤波公式为：

x_{L} = {[\begin{matrix} B_{L - M}^{- 1} \\ I_{2 M - L} \\ B_{L - M}^{- 1} \end{matrix}]}_{L \times L} x_{L}^{'},

其中的跨帧滤波矩阵B的定义如公式2，

其中B^-1为正交矩阵B的逆矩阵。这里的跨帧滤波逆矩阵B^-1＝B^T，当前帧两端的(L-M)/2个采样点和上一帧和下一帧的(L-M)/2个采样点分别通过跨帧滤波逆矩阵B^T，当前帧的中间2M-L个采样点直接通过单位矩阵不做任何滤波。

步骤S26：对滤波后的L个采样点x_L，抽取出M个采样点，抽取的公式为：x_M＝H_M×Lx_L，其中抽取矩阵H的定义如公式3所示。这里的抽取方式是，抛弃掉L个采样点两端的(L-M)/2的采样点，直接保留中间的M个采样点。

步骤S27：对包含M个采样点的并行音频帧，进行标准的时域信号并串处理，合成为串行采样点的音频暂态信号。

基于上述音频解码方法的一个较佳实施例，本发明提供了对应的音频解码装置的一个较佳实施例。

下面结合图6对本实施例所述的音频解码装置原理结构加以详细描述，本音频解码装置包括：量化解码模块21、反向符号反转模块22、频时变换模块23、交迭参数获取模块24、帧交迭模块25、后向跨帧滤波模块26、抽取模块27和合帧模块28。

量化解码模块21，用以从接收到的码流中经量化解码得到该帧处理后的M个频域样点(X₀，X₁，...，X_M-2，X_M-1)。

反向符号反转模块22，用以对M个频域样点X_M，进行反向符号反转处理的公式为：X′_M＝(D_M)^-1X_M，其中反向符号矩阵D^-1的定义如前所述，在此不再赘述。

频时变换模块23，用以对反向符号反转处理后的M个样点X′_M，进行频时变换的公式为：

x_{M}^{'} = {(S_{M}^{IV})}^{- 1} X_{M}^{'},

交迭参数获取模块24，用以从码流中获取交迭程度参数(L-M)/2。

帧交迭模块25，用以将长度为M的相邻帧，相互交迭(L-M)/2个采样点。形成的交迭帧包含L个采样点，依次包括：(x′_3M/2-L/2 ^n-1，...，x′_M-1 ^n-1)，(x′₀ ⁿ，...，x′_M-1 ⁿ)，(x′₀ ⁿ⁺¹，...，x′_L/2-M/2-1 ⁿ⁺¹)，其中x′^n-1是上一帧，x′ⁿ是当前帧，x′ⁿ⁺¹是下一帧。

后向跨帧滤波模块26，用以对长度为L的交迭帧x′_L进行时域后向跨帧滤波处理，滤波公式为：

x_{L} = {[\begin{matrix} B_{L - M}^{- 1} \\ I_{2 M - L} \\ B_{L - M}^{- 1} \end{matrix}]}_{L \times L} x_{L}^{'},

其中跨帧滤波逆矩阵B^-1的定义如前所述，在此不再赘述。

抽取模块27，用以对滤波后的L个采样点x_L，抽取出M个采样点，抽取的公式为：x_M＝H_M×Lx_L，其中抽取矩阵H的定义如前所述，在此不再赘述。

合帧模块28，用以对包含M个采样点的并行音频帧，进行标准的时域信号并串处理，合成为串行采样点的音频暂态信号。

上述量化解码模块21、反向符号反转模块22、频时变换模块23、帧交迭模块25、后向跨帧滤波模块26、抽取模块27和合帧模块28依次串行联结，交迭参数获取模块24一端串行联结在帧交迭模块之前，另一端和解码装置的外部装置联结。

上述的实施例和实施例中所给出的系数和参数，是提供给本领域的技术人员来实现或使用本发明的，本发明并不限定仅取前述公开的数值，在不脱离本发明的发明思想的情况下，本领域的技术人员可以对上述实施例作出种种修改或调整，因而本发明的保护范围并不被上述实施例所限，而应该是符合权利要求书提到的创新性特征的最大范围。

Claims

1.一种音频编码方法，其特征在于，包括步骤：

(G)将处理后的M个频域样点经量化编码后输出至码流。

2.根据权利要求1所述的一种音频编码方法，其特征在于，步骤(B)中相邻输入帧的采样点的交迭程度参数(L-M)/2为0％～50％之间的任意取值。

3.根据权利要求1所述的一种音频编码方法，其特征在于，步骤(C)中对L个采样点x_L进行前向跨帧滤波是通过如下公式实现：x′_L＝P_L×Lx_L，

其中P是前向跨帧滤波矩阵，通过如下公式实现：

P = {[\begin{matrix} B_{L - M} & 0_{(L - M) \times (2 M - L)} & 0_{(L - M) \times (L - M)} \\ 0_{(2 M - L) \times (L - M)} & I_{(2 M - L) \times (2 M - L)} & 0_{(2 M - L) \times (L - M)} \\ 0_{(L - M) \times (L - M)} & 0_{(L - M) \times (2 M - L)} & B_{L - M} \end{matrix}]}_{L \times L},

其中I是单位矩阵，其中B是蝶形运算系数组成的跨帧滤波矩阵，通过如下公式实现：

B_{N} = {[\begin{matrix} C_{1} & S_{1} \\ \cdot & \cdot \\ \cdot & \cdot \\ \cdot & \cdot \\ C_{\frac{N}{2}} & S_{\frac{N}{2}} \\ - S_{\frac{N}{2}} & C_{\frac{N}{2}} \\ \cdot & \cdot \\ \cdot & \cdot \\ \cdot & \cdot \\ - S_{1} & C_{1} \end{matrix}]}_{N \times N},

B是正交矩阵，其中蝶形运算系数C_i＝cos[(2i-1)π/4M]，

\overset{\cdot}{S_{i}} = \sin [(2 i - 1) π / 4 M],

其余部分为零。

4.根据权利要求3所述的一种音频编码方法，其特征在于，步骤(D)中对滤波后的L个采样点x_L抽取得到M个滤波采样点是通过如下公式实现：

x′_M＝H_M×Lx′_L，其中H是抽取矩阵，通过如下公式实现：

H = {[\begin{matrix} 0_{\frac{L - M}{2} \times \frac{L - M}{2}} & I_{\frac{L - M}{2} \times \frac{L - M}{2}} & 0_{\frac{L - M}{2} \times (2 M - L)} & 0_{\frac{L - M}{2} \times \frac{L - M}{2}} & 0_{\frac{L - M}{2} \times \frac{L - M}{2}} \\ 0_{(2 M - L) \times \frac{L - M}{2}} & 0_{(2 M - L) \times \frac{L - M}{2}} & I_{(2 M - L) \times (2 M - L)} & 0_{(2 M - L) \times \frac{L - M}{2}} & 0_{(2 M - L) \times \frac{L - M}{2}} \\ 0_{\frac{L - M}{2} \times \frac{L - M}{2}} & 0_{\frac{L - M}{2} \times \frac{L - M}{2}} & 0_{\frac{L - M}{2} \times (2 M - L)} & I_{\frac{L - M}{2} \times \frac{L - M}{2}} & 0_{\frac{L - M}{2} \times \frac{L - M}{2}} \end{matrix}]}_{M \times L} .

5.根据权利要求4所述的一种音频编码方法，其特征在于，步骤(E)中对抽取得到的M个时域滤波采样点x′_M进行时频变换是通过如下公式实现：

X_{M}^{'} = S_{M}^{IV} x_{M}^{'},

6.根据权利要求5所述的一种音频编码方法，其特征在于，步骤(F)中对时频变换后的M个频域样点X′_M进行符号反转处理是通过如下公式实现：

X_M＝D_MX′_M，其中D是符号矩阵，并且D是正交矩阵，通过如下公式实现：

D_{M} = {[\begin{matrix} - 1 \\ 1 \\ - 1 \\ \cdot \\ \cdot \\ \cdot \\ 1 \end{matrix}]}_{M \times M} .

7.根据权利要求1至6任一项所述的一种音频编码方法，其特征在于，在步骤(A)和步骤(B)之间还可以包括步骤：

8.根据权利要求7所述的一种音频编码方法，其特征在于，E_Δ是当前输入帧相对上一输入帧的暂态强度，通过如下公式实现：

E_Δ＝(|E_n-E_n-1|/E_n)％，

其中E_n指当前帧的总能量，其计算公式为：

E_{n} = Σ_{i = 0}^{M - 1} {(x_{i}^{n})}^{2},

E_{n - 1} = Σ_{i = 0}^{M - 1} {(x_{i}^{n - 1})}^{2},

其中x_i ^n-1表示上一输入帧的一个采样点。

9.根据权利要求7所述的一种音频编码方法，其特征在于，预设的门限值T的取值集合是来自预设的集合{T₁，T₂，T₃}，其中T₁＜T₂＜T₃，它们均可以是任意值。

10.根据权利要求7所述的一种音频编码方法，其特征在于，交迭程度值R为预设值，其取值集合是来自预设的集合{R₁，R₂，R₃，T₄}，其中R₁＜R₂＜T₃＜R₄，它们的取值可以是0％～50％之间的任意值，交迭程度值R与暂态强度E_Δ和预设的门限值T的大小比较结果具有一一对应的分段函数关系，交迭采样点L的取值和交迭程度值R具有线性函数的关系

。

11.一种音频编码装置，其特征在于，包括：

12.根据权利要求11所述的一种音频编码装置，其特征在于，在装置分帧模块和帧交迭模块之间还可以串行联结有判断模块，用以将输入帧的暂态强度E_Δ和门限T的大小进行比较，并通过交迭判断函数L＝f(E_Δ)，判断交迭程度值R，计算交迭帧包含的采样点个数L。

13.一种音频解码方法，其特征在于，包括步骤：

14.根据权利要求13所述的一种音频解码方法，其特征在于，步骤(b)中对M个频域样点X_M进行反向符号反转处理通过如下公式实现：

15.根据权利要求14所述的一种音频解码方法，其特征在于，步骤(c)中对M个频域样点X′_M进行频时变换通过如下公式实现：

x_{M}^{'} = {(S_{M}^{IV})}^{- 1} X_{M}^{'},

16.根据权利要求15所述的一种音频解码方法，其特征在于，步骤(e)中对L个采样点x′_L进行后向跨帧滤波的公式为：

x_{L} = {[\begin{matrix} B_{L - M}^{- 1} \\ \cdot \\ I_{2 M - L} \\ B_{L - M}^{- 1} \end{matrix}]}_{L \times L} x_{L}^{'},

17.根据权利要求16所述的一种音频解码方法，其特征在于，步骤(f)中对L个滤波采样点x_L通过抽取得到M个采样点的公式为：x_M＝H_M×Lx_L，其中H是抽取矩阵。

18.一种音频解码装置，其特征在于，包括：