CN101572092B

CN101572092B - 编解码端的固定码本激励的搜索方法及装置

Info

Publication number: CN101572092B
Application number: CN2008101056155A
Authority: CN
Inventors: 胡瑞敏; 张勇; 周成; 高戈; 张德军
Original assignee: Huawei Technologies Co Ltd
Current assignee: JIANGSU YALONG NEW MATERIAL TECHNOLOGY Co.,Ltd.
Priority date: 2008-04-30
Filing date: 2008-04-30
Publication date: 2012-11-21
Anticipated expiration: 2028-04-30
Also published as: CN101572092A

Abstract

一种编解码端的固定码本激励的搜索方法及装置，其包括：在编码端，获得当前输入子帧固定码本激励搜索的目标信号；对所述目标信号进行格型矢量量化处理，根据处理结果确定搜索获得的固定码本激励。在解码端，接收编码码流，获取编码码流中的固定码本索引；并根据所述的固定码本激励索引确定对应的固定码本激励，且所述的固定码本激励为经过格型矢量量化处理获得的固定码本激励。本发明实施例中，由于其使用格型矢量量化的处理方式获得固定码本激励，因而，可以有效减少对存储空间的占用，降低基于固定码本激励搜索的编解码过程的实现复杂度，并可以较好地提升语音信息的音质效果。

Description

编解码端的固定码本激励的搜索方法及装置

技术领域

本发明涉及编解码技术领域，尤其涉及编解码过程中的固定码本激励搜索技术。

背景技术

CELP(Code Excited Linear Prediction，码本激励线性预测)语音编码器是对每个以一定时间划分声音的帧进行线性预测，用存储过去的驱动声源的自适应码本和存储多个噪声矢量的固定码本，对每帧线性预测的预测残差(激励信号)进行编码。CELP以高质量的合成语音以及优良的抗噪声和多次转接性能，在低速率语音编码上得到了广泛的应用。

在CELP语音编码器中，如图1所示，具体是采用一个自适应码本中的码字(即自适应码本)逼近语音长时周期性(基音)结构，采用一个固定的随机码本中的码字(即固定码本)逼近语音经过短时、长时预测后的残差信号；为此，在CELP编解码过程中，需要进行固定码本的搜索，以便于确定用于逼近残差信号的固定码本中的码矢量。目前，是采用加权输入语音和加权重构语音之间的均方差最小化准则进行固定码本中的码矢量的搜索。对应的，在解码端也需要获得相应的固定码本，以进行相应的解码操作。

在实现本发明过程中，发明人发现现有技术中，搜索确定的固定码本激励为脉冲串，使得生成的噪声矢量比较简单，进而导致相应的编解码过程的复杂程度增加，在提升音质方面效果不佳。

发明内容

本发明的实施例提供了一种编解码端的固定码本激励的搜索方法及装置，从而降低相应的基于固定码本搜索的编解码过程的实现复杂度。

一种编码端的固定码本激励搜索方法，包括：

获得当前输入子帧固定码本激励搜索的目标信号；

对所述目标信号进行格型矢量量化处理，根据处理结果确定搜索获得的固定码本激励。

一种编码端的固定码本激励搜索装置，包括：

目标信号获取单元，用于获得当前输入子帧固定码本激励搜索的目标信号；

第一固定码本获取单元，用于对所述目标信号获取单元获取的目标信号进行格型矢量量化处理，并根据处理结果确定搜索获得的固定码本激励。

一种解码端的固定码本获取方法，包括：

接收编码码流，获取编码码流中的固定码本索引；

根据所述的固定码本索引确定对应的固定码本激励，且所述的固定码本激励为经过格型矢量量化处理获得的固定码本激励。

一种解码端的固定码本获取装置，包括：

固定码本索引获取单元，用于从接收到的编码码流中解析获取编码码流中的固定码本索引；

第二固定码本获取单元，用于根据所述固定码本索引获取单元获取的固定码本索引确定对应的固定码本激励，且所述的固定码本激励为经过格型矢量量化处理获得的固定码本激励。

由上述本发明的实施例提供的技术方案可以看出，由于其使用格型矢量量化的处理方式获得固定码本激励，因而，可以有效减少对存储空间的占用，降低基于固定码本搜索的编解码过程的实现复杂度，并可以较好地提升语音信息的音质效果。

附图说明

图1为现有技术提供的编码原理示意图；

图2为本发明实施例提供的编码原理示意图；

图3为本发明实施例提供的固定码本搜索过程示意图；

图4为本发明实施例中的Voronoi扩展编码原理框图；

图5为本发明实施例提供的解码原理示意图；

图6为本发明实施例中的Voronoi扩展解码原理框图；

图7为本发明实施例提供的装置的结构示意图。

具体实施方式

本发明实施例提供的固定码本激励搜索方案主要采用格型矢量量化的处理方式进行固定码本激励搜索，具体可以应用于CELP编解码处理过程中进行相应的固定码本激励搜索。

进一步讲，在编码端相应的固定码本激励搜索过程包括：获得当前输入子帧固定码本激励搜索的目标信号；对获得的目标信号进行格型矢量量化，根据量化结果确定搜索获得的固定码本激励。

相应的，在进行格型矢量量化处理过程中，具体可以为：在当前编码比特数小于预定值的情况下，在频域对获得的目标信号进行格型矢量量化处理，在当前编码比特数不小于预定值的情况下，在时域对所述目标信号进行格型矢量量化处理。

在上述格型矢量量化处理过程中，若需要在频域对获得的目标信号进行格型矢量量化处理，则可以在将所述目标信号转换到频域后，再对转换到频域的目标信号进行格型矢量量化处理，以获得格型矢量量化处理结果。

本发明实施例中，具体可以通过对进行格型矢量量化处理后的目标信号进行逆加权合成滤波处理获得固定码本激励(即固定码本激励信号)；并且，还可以根据获得的固定码本激励及所述当前输入子帧固定码本激励搜索的目标信号计算确定固定码本增益。

与上述在编码端采用的固定码本激励搜索方式对应，相应的在解码端的固定码本激励获取方式可以包括：接收编码码流，获取编码码流中的固定码本索引；并根据所述的固定码本索引确定对应的固定码本激励，且所述的固定码本激励为经过格型矢量量化处理获得的固定码本激励。

在解码端，在解码获得相应的固定码本索引后，具体可以根据该固定码本索引获得对应的固定码本，将所述固定码本进行逆加权合成滤波处理获得固定码本激励。其中，在根据所述固定码本索引获得对应的固定码本的过程具体可以包括：若根据码流中的信息确定在编码端的编码比特数小于预定值，则在根据固定码本索引确定量化的频域目标信号后，将该量化的频域目标信号转换为量化的时域目标信号作为所述固定码本激励；否则，将根据固定码本索引确定量化的时域目标信号作为所述固定码本激励。

可选地，若编码端选择在频域对目标信号进行格型矢量量化处理(即根据码流中的信息确定在编码端的编码比特数小于预定值)，则在解码端为了避免因量化比特数不够导致出现高频频谱空洞的情况，还可以对进行格型矢量量化处理后的目标信号进行噪声填充处理。

在解码端，还可以根据解码获得的增益码本序号获得相应的固定码本增益及自适应码本增益。

为便于对本发明实施例的理解，下面将结合具体的编码及解码过程，对相应的固定码本激励搜索方式的应用进行详细的说明。

(一)编码过程

如图2所示，相应的编码过程包括：

步骤1，对输入的音频信号进行预处理；

为避免处理中产生溢出和不必要的低频部分，具体可以将输入样点值除以2，并通过一个截止频率为60Hz的高通滤波器；例如，可以通过一个二阶极/零点滤波器H_hl(z)实现相应的预处理，该滤波器的参数为：

H_{hl} (z) = \frac{0.989502 - 1.979004 z^{- 1} + 0.989502 z^{- 2}}{1 - 1.978882 z^{- 1} + 0.979126 z^{- 2}};

步骤2，对经过预处理后的输入信号进行线性预测分析；

具体可以为计算输入信号的一组16阶的LPC系数

该组LPC系数将用于后续感知加权滤波器；

步骤3，根据获得的LPC系数进行目标信号的计算；

具体要以将输入信号通过感知加权滤波器W(z)(该感知加权滤波器W(z)利用LPC系数对输入信号进行处理)并减掉感知加权合成滤波器W′(z)的零输入响应得到用于自适应码本搜索的目标信号x(n)，n表示矢量的长度，在此可以表示多个时间点；其中，W(z)与W′(z)的系统函数分别为：

W (z) = \frac{A (z / γ_{1})}{1 - β_{1} z^{- 1}},

W^{'} (z) = \frac{1}{\hat{A} (z)} \frac{A (z / γ_{1})}{1 - β_{1} z^{- 1}},

其中，

A (Z) = 1 + Σ_{i = 1}^{16} a_{i} z^{- i},

\hat{A} (Z) = 1 + Σ_{i = 1}^{16} {\hat{a}}_{i} z^{- i},

为步骤2获得的线性预测系数，γ₁＝0.92为感知加权因子，β₁＝0.68为常数。

步骤4，根据获得的目标信号进行自适应码本的搜索，获得相应的自适应激励信号及自适应码本增益g_p；

自适应码本搜索的准则是使原始语音和重构语音之间均方加权误差最小化，即：使R(k)最大，此时，相应的R(k)为：

R (k) = \frac{Σ_{n = 0}^{63} x (n) y_{k} (n)}{{(Σ_{n = 0}^{63} y_{k} (n) y_{k} (n))}^{\frac{1}{2}}},

其中，x(n)为目标信号，y_k(n)是在延时k的过去滤波激励，N为子帧长度；

相应的自适应码本增益g_p的计算公式如下：

g_{p} = \frac{Σ_{n = 0}^{63} x (n) y (n)}{Σ_{n = 0}^{63} y (n) y (n)},

其中，x(n)是目标信号，y(n)是自适应码本矢量滤波信号(即y(n)＝v(n)*h(n))，v(n)为自适应码本激励，h(n)为加权合成滤波器的

H (z) = \frac{W (z)}{\hat{A} (z)}

的脉冲响应，N为子帧长度。

步骤5，根据目标信号及自适应码本增益g_p进行固定码本激励的搜索；

如图3所示，相应的固定码本激励的搜索过程具体包括以下过程：

(1)根据自适应码本矢量滤波信号y(n)和自适应码本增益g_p，计算当前输入子帧的固定码本激励搜索的目标信号x′(n)，并将x′(n)存放于数组xn2[i]，i＝0～N-1；

相应的目标信号为：x′(n)＝x(n)-g_py(n)，其中，x(n)为目标信号，y(n)是自适应码书矢量滤波输出结果，g_p是自适应码本增益；

(2)根据编码比特率选择固定码本激励搜索的编码模式，即根据码率的大小选择编码模式，编码模式包括频域的格型矢量量化处理和时域的格型矢量量化处理；

具体可以为：当编码比特数较少，可以为低于预定值时选择模式0，模式0表示在频域对目标信号x′(n)利用格型矢量量化进行编码；当编码比特数较多(即高于预定值)时选择模式1，模式1表示在时域对目标信号x′(n)利用格型矢量量化进行编码；其中，若选择模式0，则执行过程(3)，若选择模式1，则执行过程(7)；

(3)将保存于数组xn2[i]中的目标信号转换到频域；

具体可以对相应的目标信号进行DCT-IV(离散余弦变换)转换到频域，并将转换到频域的信息存放于数组xn2_dct[i]；

具体地，相应转换到频域的信息可以为：

X (k) = \sqrt{\frac{2}{N}} Σ_{i = 1}^{N - 1} x (i) \cos (\frac{π}{4 N} (2 i + 1) (2 k + 1)),

其中，k＝0～N-1，N＝64；

(4)对信号xn2_dct[i]进行相应的自适应低频预整形处理，通过对0～1.6KHz低频部分进行预整形处理，以平滑频谱去除共振峰影响从而更好的量化低频频谱，相应的预整形处理后的结果存放于数组xn2_dct[i]，i＝0～N-1；

相应的预整形处理的过程具体可以包括：计算0～1.6KHz低频部分每8维矢量分成一个波段，然后计算该波段的能量E_m，m为位置索引，并令最大的能量为E_max，然后逐波段计算比率R_m＝(E_max/E_m)^1/4，如果R_m＞10，那么使R_m＝10(最大增益为20db)；如果R_m＞R_m-1，那么使R_m＝R_m-1，最后根据各波段计算得到的比率乘以各个需要调整能量的波段的能量，以实现预整形；

(5)使用格型矢量量化(基于RE₈格)对信号xn2_dct[i]进行量化，得到噪音因子与量化信号，其中，噪音因子存放于变量fac_ns中，量化信号存放于数组y2_dct[i]中，i＝0～N-1；

(6)对信号y2_dct[i]进行去预整形处理，并将处理结果存放于数组sub2_y2[i]，i＝0～N-1；

该去预整形处理的过程可以为：计算0～1.6KHz低频部分每8维矢量分成一个波段，然后计算该波段的能量E_m，m为位置索引，并令最大的能量为E_max，然后逐波段计算比率R_m＝(E_max/E_m)^1/2，如果R_m＞10，则使R_m＝10(最大增益为20db)；如果R_m＞R_m-1，那么使R_m＝R_m-1，最后根据各波段计算得到的比率除以各个需要能量调整的波段的能量，得到去预整形后的波段；

(7)使用格型矢量量化对目标信号xn2[i]进行量化，并将量化索引写入压缩码流，得到量化后的目标信号，存放于数组sub2_y2[i]，i＝0～N-1，执行过程(8)；

(8)进行固定码本增益的计算；

由于量化对象为目标信号，而分析合成法(即合成语音)需要用到激励信号，因此将量化后的目标信号sub2_y2[i]通过逆加权合成滤波器

H^{'} (z) = \frac{1}{H (z)}

的处理得到固定码本激励信号c(n)(即搜索确定的固定码本激励)，并将其存放于数组code[i]中，i＝0～N-1；

之后，再计算y′(n)＝c(n)*h(n)，其中，h(n)为加权合成滤波器的

H (z) = \frac{W (z)}{\hat{A} (z)}

的脉冲响应，该信号y′(n)将用于后续固定码本增益计算；

最后，通过存放于数组xn2[i]中的目标信号x′(n)和y′(n)计算固定码本增益g_c，相应的固定码本增益可以为：

g_{c} = \frac{Σ_{n = 0}^{63} x (n) y^{'} (n)}{Σ_{n = 0}^{63} y^{'} (n) y^{'} (n)} .

在上述处理过程中，xn2[i]＝x为要量化的N维源矢量，C表示从RE8格点阵A得到的基本码本，且将mA定义为RE8格点阵A按整数因子m＞0缩放所得，则如4所示，相应的格型矢量量化的实现过程可以包括：

(1)确定在无穷RE8点阵A中输入矢量x的最近邻点y；

(2)确定y是否在基本码本C中(基本码本C包括Q₀，Q₂，Q₃，Q₄四个码本，且

Q_{2} &Subset; Q_{3}

)若在，则直接利用基本码本量化x，并将码本号n设为0，若不在，则将y看作是局外点，采用Voronoi(一种图结构)扩展的方法进行编码，即执行处理过程(3)；

(3)在y作为局外点时，则将扩展阶数r设为1，且缩放因子m设为m＝2^r＝2；

(4)计算RE8格点阵A中矢量×的最近邻点y的Voronoi索引k；Voronoi索引k取决于扩展阶数r和缩放因子m；

该Voronoi索引k具体可以为：

k = \mod_{m} (y G_{A}^{- 1}),

其中G_A为A的生成矩阵，且mod_m(·)是逐个分量的模m运算；

(5)在给定m后，根据Voronoi索引k计算Voronoi码矢量v；

计算Voronoi码矢量v的具体方式可以为：

首先，计算z＝k*G(RE8)，并在RE8中找到

的最近邻点u；之后，便可以计算v＝z-m＊u；

(6)计算差分矢量w＝y-v，该差分矢量w总属于缩放的RE8格点阵mA；通过缩放差分矢量w来计算码矢量c＝w/m；

由于w属于缩放的RE8格点阵mA，故码矢量c一定属于RE8格点阵；

(7)接着验证c是否在基本码本C中，若不在基本码本C中，则将扩展阶数r增加1，缩放因子m乘以2，且Voronoi扩展到新一次迭代中，即重新执行过程(4)；若c在基本码本C中，则表示已经找到了采用y量化源矢量x而不会出现溢出的扩展阶数r和缩放因子m＝2^r。

在通过处理过程(7)找到采用量化矢量y量化源矢量x而不会出现溢出的扩展阶数r和缩放因子m＝2^r之后，计算量化矢量y的基本码矢量c的索引j，然后将j和k复合成索引i，且码本号n设置为扩展阶数n＝r，量化过程结束。

相应的经过上述处理后，格型矢量量化的输出包括码本号n和码矢量y的索引i；其中，如果使用了Voronoi扩展，则n＞0，否则，n＝0；对于索引i，则若未使用了Voronoi扩展，则基本码本中码矢量y的索引i等于基本码矢量c的索引(此时，基本码矢量c即为y)，若使用Voronoi扩展，则将j和k的复合，其中j是基本码本C中c的索引，且k是与矢量v对应的Voronoi索引，复合获得相应的码矢量y的索引i。

需要说明的是，上述步骤4和步骤5的执行过程并无先后顺序限制，即也可以首先执行步骤5，之后，再执行步骤4，或者，也可以并行执行步骤4和步骤5。

步骤6，根据步骤4和步骤5的处理结果执行增益联合量化处理；

具体可以为：首先，计算固定码本增益g_c和固定码本预测增益g′_c的相关因子γ为：

γ＝g_c/g′_c，其中，

{g^{'}}_{c} = 10^{0.05 (\tilde{E (n)} + \overset{&OverBar;}{E} - E_{i})};

E (n) = 10 \log (\frac{1}{N} g_{c}^{2} Σ_{i = 0}^{N - 1} c^{2} (i)) - \overset{&OverBar;}{E},

N＝64为子帧长度，c(i)为固定码本激励，

\overset{&OverBar;}{E} = 30 dB

是固定码本激励的平均能量；

E_{i} = 10 \log [\frac{1}{N} Σ_{i = 0}^{N - 1} c^{2} (i)];

之后，将自适应码本增益和相关因子γ组成2维矢量，并在编码码流中使用7bits记录相应的增益联合量化结果。

步骤7，进行激励信号的计算；

由自适应码本激励v(n)、固定码本激励c(n)、量化后的自适应码本增益

以及量化后的固定码本增益

共同生成当前子帧的激励信号u(n)：

u (n) = \hat{g_{p}} v (n) + \hat{g_{c}} c (n), n = 0 ~ N - 1;

在完成激励信号的计算后，还根据确定的激励信号u(n)修改用于计算目标信号的加权合成滤波器参数，以便计算下一子帧的目标信号。

(二)解码过程

参照图5所示，本发明实施例提供的相应解码过程具体可以包括：

步骤1，LP滤波器参数解码；

具体可以在收到序号L0、L1、L2和L3后，根据各序号索引(ISF索引)到的参数相应的重构LSP系数，并将每子帧的LSP系数转换为LP滤波器系数

以子帧为单位重构语音；

步骤2，进行自适应码本矢量解码；

具体可以根据收到的自适应码本索引寻找基因延时的整数和分数部分，并通过内插过去的激励(即以前的激励)u(n)以得到自适应码本矢量v(n)；

步骤3，进行固定码本矢量解码；

该固定码本矢量解码过程具体可以包括：

(1)根据从收到的码流中解析获得的固定码本索引得到固定码本y′(n)；获得固定码本的过程通过相应的格型矢量量化解码过程实现，如图5、6所示，在解码端采用的格型矢量量化解码的步骤可以包括：

首先，从接收到的压缩码流中读取码本号n和索引i；

之后，根据n值进行量化矢量的重建处理：

如果n＝0，则表明编码未使用Voronoi扩展，在该情况下直接将索引i解码以构成基本码本C中的码矢量c，并将量化矢量重建为y＝c；

如果n＞0，则表明编码使用了Voronoi扩展，此时需要分别将扩展阶数和缩放因子设置为r＝n和m＝2^r，并将索引j和k分离，进而将索引j解码为基本码本C中的c，将k解码为Voronoi扩展码本V^(r)中的v，相应的重建的量化矢量为y＝mc+v；

最后，根据重建的量化矢量便可以确定相应的固定码本y′(n)；

其中，确定相应的固定码本y′(n)的过程可以包括：

当编码端采用模式0，即在频域进行的格型矢量量化，则此时获得的是获得的是量化的频域目标信号，对该频域目标信号进行噪声填充处理，如可以利用正弦函数随机生成一组正弦信号，并用噪音因子fac_ns调整该组正弦信号的幅度得到待填充信号，再利用该信号填充数组y2_dct[i]中未量化的频段，以避免因量化比特数不够而导致出现高频频谱空洞；之后，再对完成噪声填充处理后的信号进行IDCT变换处理，得到量化的时域目标信号，即固定码本y′(n)；

当编码端采用模式1，即在时域进行相应的格型矢量量化处理，则此时获得的直接即为相应的量化的时域目标信号，即固定码本y′(n)；

(2)将得到的固定码本y′(n)通过逆加权合成滤波器H′(z)处理得到固定码本激励信号c(n)：c(n)＝y′(n)*H′(z)，符号*表示卷积；

其中，若预定义的加权合成滤波器H(z)为：

H (z) = \frac{W (z)}{\hat{A} (z)},

则对应的逆加权合成滤波器H′(z)为：

H^{'} (z) = \frac{1}{H (z)};

步骤4，根据增益索引进行增益解码，具体为进行相应的自适应码本和固定码本的增益解码；

根据收到的增益码本序号确定自适应码本增益

和固定码本增益相关因子

进而确定当前子帧n的固定码本预测能量，相应的计算公式如下：

\tilde{E (n)} = Σ_{i = 1}^{4} b_{i} R (\hat{n} - i),

其中，[b₁，b₂，b₃，b₄]＝[0.5，0.4，0.3，0.2]是MA预测器的系数，

为子帧k的预测误差的量化值；

令固定码本激励的平均能量贡献为：

E_{i} = 10 \log [\frac{1}{N} Σ_{i = 0}^{N - 1} c^{2} (i)],

则固定码本预测增益g′_c的计算公式为：

{g^{'}}_{c} = 10^{0.05 (\tilde{E (n)} + \overset{&OverBar;}{E} - E_{i})};

固定码本增益g_c的计算公式为：

\hat{g_{c}} = \hat{γ} {g^{'}}_{c} .

需要说明的是，上述步骤2、3、4的执行顺序并无限制，即步骤2、3、4可以以任意顺序执行或并行执行。

步骤5，根据步骤2、3、4的处理结果进行合成激励信号的操作，即重构合成滤波器的激励信号；

具体可以由自适应码本激励v(n)、固定码本激励c(n)、量化后的自适应码本增益

以及量化后的固定码本增益共同生成当前子帧的激励信号u(n)：

u (n) = \hat{g_{p}} v (n) + \hat{g_{c}} c (n), n = 0 ~ N - 1;

步骤6，进行噪音增强处理；

具体可以通过非线性增益平滑技术对固定码本增益

进行处理，即通过平滑固定码本增益来减少激励信号的能量波动，从而改进固定背景噪声下的编码性能；

在该步骤中，相应的的固定码本增益的更新公式为：

\hat{g_{c}} = θ g_{0} + (1 - θ) \hat{g_{c}},

其中，等式左边的

为更新后的值，等式右边的

为更新前的值，θ为基于相邻的LP滤波器距离测度得的稳定因子，g₀为根据当前帧固定码本增益

与前一帧的固定码本增益g_-1比较得出的初始化修改增益；

步骤7，进行基音增强处理；

基音增强处理将固定码本激励通过低通滤波器进行处理，该低通滤波器的转移函数为：

F_inno(z)＝-C_pez+1-C_pez^-1，其中C_pe＝0.125(1-r_v)，r_v＝(E_v-E_c)/(E_v+E_c)，E_v是自适应码本矢量的能量，E_c是固定码本矢量的能量；

相应的通过短时合成滤波器后的固定码本矢量为：

c′(n)＝c(n)-c_pe(c(n+10+c(n-1))；

且由于

u (n) = {\hat{g}}_{p} v (n) + \hat{g_{c}} c (n),

则基音增强后的更新激励为：

u (n) = u (n) - g_{c} {\hat{c}}_{pe} (c (n + 1) + c (n - 1));

步骤8，对基音增强处理后的激励信号进行后处理，以便进行语音合成；

该后处理用于对低码率(如8k以下)下的合成激励u(n)进行处理，以强调自适应码本贡献，具体可以为：

\hat{u} (n) = \{\begin{matrix} u (n) + 0.25 β {\hat{g}}_{p} v (n), & {\hat{g}}_{p} > 0.5 \\ u (n), & {\hat{g}}_{p} \leq 0.5 \end{matrix},

其中，

为量化后的自适应码本增益，β为调整因子；

在后处理过程中，还通过自适应增益控制(AGC)补偿未强调激励u(n)和强调激励

之间的增益差异，相应的增益缩放因子η可为：

η = \{\begin{matrix} \sqrt{\frac{Σ_{n = 0}^{N - 1} u^{2} (n)}{Σ_{n = 0}^{N - 1} {\hat{u}}^{2} (n)}} & {\hat{g}}_{p} > 0.5 \end{matrix}

{\hat{g}}_{p} \leq 0.5,

则缩放后的强调激励信号

为：

{\hat{u}}^{'} (n) = \hat{u} (n) η;

这样，每64样点的子帧重构语音为：

\hat{s} (n) = \hat{u} (n) - Σ_{i = 1}^{16} \hat{a_{i}} \hat{s} (n - i) .

可见，通过上述本发明实施例可以在编解码端提供了相应的复杂程度低且性能良好的固定码本激励搜索实现方案。

在编解码端的进行固定码本激励搜索过程中，若对低码率的目标信号进行量化，则需要进行相应的由时频变换处理，相应的时频变换处理可以但不限于采用以下处理方式实现：

在时频变换中，选取DCT-IV(DCT-IV与IDCT-IV变换核相同)，在实现中为了降低运算复杂度，可以采用如下快速算法：

相应的N/2点DCT-IV定义如下：

x^{'} [i] = Σ_{k = 0}^{N / 2 - 1} X [k] \cos [\frac{π}{2 N} (2 i + 1) (2 k + 1)]

fori = 0 to \frac{N}{2} - 1;

相应的N/2点IDCT-II定义如下：

x^{''} [i] = Σ_{k = 0}^{N / 2 - 1} X [k] \cos [\frac{π}{N} (2 i + 1) k]

\begin{matrix} fori = 0 to \frac{N}{2} - 1; \end{matrix}

对所述N/2点DCT-IV的输出乘以常数矢量：

2 \cos [\frac{π}{2 N} (2 i + 1)]

\begin{matrix} fori = 0 to \frac{N}{2} - 1, \end{matrix}

则：

2 x^{'} [i] \cos [\frac{π}{2 N} (2 i + 1)] = 2 Σ_{k = 0}^{N / 2 - 1} X [k] \cos [\frac{π}{2 N} (2 i + 1)] \cos [\frac{π}{2 N} (2 i + 1) (2 k + 1)]

= Σ_{k = 0}^{N / 2 - 1} X [k] \cos [\frac{π}{N} (2 i + 1) k] + Σ_{k = 0}^{N / 2 - 1} X [k] \cos [\frac{π}{N} (2 i + 1) (k + 1)]

令k＝k′-1，并定义X[-1]＝0，发现

\cos [\frac{π}{N} (2 i + 1) k] |_{k = N / 2} = 0,

则有N/2点DCT-IV可以转换为：

x^{'} [i] = \frac{1}{2 \cos [\frac{π}{2 N} (2 i + 1)]} Σ_{k = 0}^{N / 2 - 1} (X [k - 1] + X [k]) \cos [\frac{π}{N} (2 i + 1) k]

for \begin{matrix} i = 0 to \frac{N}{2} - 1 \end{matrix}

由上式可以看出：通过上式可以将N/2点DCT-IV计算转换为N/2点IDCT-II，令M＝N/2，则IDCT-II可以写为：

y [i] = Σ_{k = 0}^{M - 1} Y [k] \cos [\frac{π}{2 M} (2 i + 1) k]

fori＝0toM-1；

令：

g [i] = Σ_{k = 0}^{M / 2 - 1} Y [2 k] \cos [\frac{π}{2 M} (2 i + 1) 2 k] = Σ_{k = 0}^{M / 2 - 1} Y [2 k] \cos [\frac{π}{M} (2 i + 1) k]

h^{'} [i] = Σ_{k = 0}^{M / 2 - 1} Y [2 k + 1] \cos [\frac{π}{2 M} (2 i + 1) (2 k + 1)]

\begin{matrix} fori = 0 to \frac{M}{2} - 1 \end{matrix}

则有：

y[i]＝g[i]+h′[i]

y[M-1-i]＝g[i]-h′[i]

\begin{matrix} fori = 0 to \frac{M}{2} - 1, \end{matrix}

其中，g[i]为M/2点IDCT-II，而h′[i]为M/2点IDCT-IV。

由上述推导可以知：M点IDCT-IV可以转换为M点的IDCT-II变换，M点IDCT-II可以转换为M/2点的IDCT-II变换和M/2点的IDCT-IV变换。

因此，可以采用递归调用的方式逐次降低变换点数，进而有效降低DCT变换的运算复杂度。

本发明实施例还提供了一种编码端的固定码本激励搜索装置，其具体实现结构如图7所示，该装置可以包括：

第一固定码本获取单元，用于对所述目标信号获取单元获取的目标信号进行格型矢量量化处理，并根据处理结果确定搜索获得的固定码本激励；具体地，该第一固定码本获取单元还可以对进行格型矢量量化处理后的目标信号进行逆加权合成滤波处理，以获得所述固定码本激励；

可选地，该第一固定码本获取单元具体可以包括：

判断单元，用于判断当前编码比特数与预定值之间的关系；

格型矢量量化处理单元，用于在所述判断单元确定当前编码比特数小于预定值时，在频域对所述目标信号进行格型矢量量化处理，否则，在时域对所述目标信号进行格型矢量量化处理；其中，该格型矢量量化处理单元中还可以包括时频域转换单元，用于将所述目标信号通过时频变换处理转换到频域后，再进行格型矢量量化处理；

第一固定码本确定单元，用于根据所述格型矢量量化处理单元的处理结果确定所述固定码本激励。

在该装置中，还可以包括固定码本增益计算单元，用于对所述第一固定码本获取单元获得的固定码本激励及所述当前输入子帧固定码本激励搜索的目标信号计算确定固定码本增益。

本发明实施例还提供了一种解码端的固定码本激励获取装置，其具体实现结构如图7所示，其具体可以包括：

第二固定码本获取单元，用于根据所述固定码本索引获取单元获取的固定码本索引确定对应的固定码本激励，且所述的固定码本激励为经过格型矢量量化处理获得的固定码本激励；

其中，相应的第二固定码本获取单元具体可以包括：

固定码本获取单元，用于根据所述固定码本索引获取单元获取的固定码本索引获得对应的固定码本；

该固定码本信号获取单元具体可以包括以下两单元：

第二判断单元，用于根据码流中的信息确定在编码端的编码比特数是否小于预定值；

第二固定码本确定单元，用于在所述第二判断单元确定在编码端的编码比特数小于预定值时，在根据固定码本索引确定量化的频域目标信号后，将该量化的频域目标信号转换为量化的时域目标信号作为所述固定码本激励；否则，将根据固定码本索引确定量化的时域目标信号作为所述固定码本激励；可选地，在该第二固定码本确定单元中还可以包括噪声填充单元，用于对所述格型矢量量化处理单元进行格型矢量量化处理后的目标信号进行噪声填充处理。

逆加权合成滤波处理单元，用于将所述固定码本获取单元获取的固定码本进行逆加权合成滤波处理，获得固定码本激励信号。

综上所述，本发明实施例可以对不同的编码速率选择在时域或者频域量化目标信号，再将量化的目标信号逆滤波求取固定码本激励。由于格型矢量量化不需要存储码本，故相比传统的固定码本激励存储法能大幅度的减少存储开销。同时利用残差信号频谱平滑的特性，在频域对目标信号进行量化并填充一定量的舒适噪声，能够生成接近实际声音的固定码本激励矢量，实现了编码后的感知音质的提高。

以上所述，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应该以权利要求的保护范围为准。

Claims

1.一种编码端的固定码本激励搜索方法，其特征在于，包括：

获得当前输入子帧固定码本激励搜索的目标信号；

对所述目标信号进行格型矢量量化，根据量化结果确定搜索获得的固定码本激励；

所述进行格型矢量量化处理具体包括：

若当前编码比特数小于预定值，则在频域对所述目标信号进行格型矢量量化处理，否则，在时域对所述目标信号进行格型矢量量化处理。

2.根据权利要求1所述的方法，其特征在于，所述在频域对所述目标信号进行格型矢量量化处理的过程具体包括：将所述目标信号通过时频变换处理转换到频域后，进行格型矢量量化处理。

3.根据权利要求2所述的方法，其特征在于，所述时频变换处理包括：离散余弦变换处理或快速傅里叶变换处理。

4.根据权利要求1至3任一项所述的方法，其特征在于，所述根据量化结果确定搜索获得的固定码本激励的过程具体包括：

对进行格型矢量量化处理后的目标信号进行逆加权合成滤波处理，以获得固定码本激励。

5.根据权利要求4所述的方法，其特征在于，该方法还包括：

对获得的固定码本激励进行加权合成滤波处理，并根据加权合成滤波处理结果及所述当前输入子帧固定码本激励搜索的目标信号确定固定码本增益。

6.一种编码端的固定码本激励搜索装置，其特征在于，包括：

第一固定码本获取单元，用于对所述目标信号获取单元获取的目标信号进行格型矢量量化处理，并根据处理结果确定搜索获得的固定码本激励；

所述第一固定码本获取单元具体包括第一判断单元、格型矢量量化处理单元和第一固定码本确定单元：

第一判断单元，用于判断当前编码比特数与预定值之间的关系；

格型矢量量化处理单元，用于在所述第一判断单元确定当前编码比特数小于预定值时，在频域对所述目标信号进行格型矢量量化处理，否则，在时域对所述目标信号进行格型矢量量化处理；

7.根据权利要求6所述的装置，其特征在于，所述格型矢量量化处理单元中还包括时频域转换单元，用于将所述目标信号通过时频变换处理转换到频域后，再进行格型矢量量化处理。

8.根据权利要求6至7任一项所述的装置，其特征在于，所述第一固定码本获取单元还用于对进行格型矢量量化处理后的目标信号进行逆加权合成滤波处理，以获得所述固定码本激励。

9.根据权利要求8所述的装置，其特征在于，该装置还包括：

固定码本增益计算单元，用于对所述第一固定码本获取单元获得的固定码本激励进行加权合成滤波处理，并根据加权合成滤波处理结果及所述当前输入子帧固定码本激励搜索的目标信号计算确定固定码本增益。

10.一种解码端的固定码本获取方法，其特征在于，包括：

接收编码码流，获取编码码流中的固定码本索引；

根据所述的固定码本索引确定对应的固定码本激励，所述的固定码本激励为经过格型矢量量化处理获得的固定码本激励；

根据所述固定码本索引确定对应的固定码本激励的过程包括：根据所述固定码本索引获得对应的固定码本，将所述固定码本进行逆加权合成滤波处理获得固定码本激励。

11.根据权利要求10所述的方法，其特征在于，根据所述固定码本索引获得对应的固定码本的过程包括：

若根据码流中的信息确定在编码端的编码比特数小于预定值，则在根据固定码本索引确定量化的频域目标信号后，将该量化的频域目标信号转换为量化的时域目标信号作为所述固定码本激励；否则，将根据固定码本索引确定量化的时域目标信号作为所述固定码本激励。

12.根据权利11所述的方法，其特征在于，若编码比特数小于预定值，对进行格型矢量量化处理后的目标信号进行噪声填充处理。

13.一种解码端的固定码本获取装置，其特征在于，包括：

所述第二固定码本获取单元具体包括固定码本获取单元和逆加权合成滤波处理单元：

逆加权合成滤波处理单元，用于将所述固定码本获取单元获取的固定码本进行逆加权合成滤波处理，获得固定码本激励。

14.根据权利要求13所述的装置，其特征在于，所述固定码本获取单元具体包括：

第二固定码本确定单元，用于在所述第二判断单元确定在编码端的编码比特数小于预定值时，在根据固定码本索引确定量化的频域目标信号后，将该量化的频域目标信号转换为量化的时域目标信号作为所述固定码本激励；否则，将根据固定码本索引确定量化的时域目标信号作为所述固定码本激励。

15.根据权利要求13所述的装置，其特征在于，所述第二固定码本确定单元还包括噪声填充单元，用于在所述第二判断单元确定在编码端的编码比特数小于预定值时，对进行格型矢量量化处理后的目标信号进行噪声填充处理。