CN102968997A

CN102968997A - 用于宽带语音解码中噪声增强后处理的方法及装置

Info

Publication number: CN102968997A
Application number: CN2012104360810A
Authority: CN
Inventors: 张勇; 闫建新
Original assignee: SHENZHEN GUANGSHENG XINYUAN TECHNOLOGY Co Ltd
Current assignee: SHENZHEN GUANGSHENG XINYUAN TECHNOLOGY Co Ltd
Priority date: 2012-11-05
Filing date: 2012-11-05
Publication date: 2013-03-13

Abstract

本发明涉及一种用于宽带语音解码中噪声增强后处理的方法和装置。所述方法包括：S1、检测当前帧的语音/非语音特性，计算出当前帧的噪声因子；S2、确定该噪声因子是否大于一预设的门限值；S3、在噪声因子大于预设的门限值时，对当前帧的固定码矢执行能量平滑处理，得到经过能量平滑后的固定码矢；S4、将当前帧的自适应码矢与该经过能量平滑后的固定码矢相加，合成激励信号。本发明还涉及一种用于宽带语音解码的方法和解码器。本发明通过解码语音信号的噪声因子的特性对固定码矢的能量进行平滑，从而达到噪声增强的目的。本发明能够适用于各种语音编解码器，算法运算复杂度比较低，并且不额外增加传输码率。

Description

用于宽带语音解码中噪声增强后处理的方法及装置

技术领域

本发明涉及语音编解码技术，更具体地说，涉及一种用于宽带语音解码中噪声增强后处理的方法及装置。

背景技术

语音编/解码器广泛地应用于数字通信系统，有效的发送/存储语音信号。在数字系统中，输入的模拟语音信号经过采样转化到数字域，在数字域中，对连续的语音采样做进一步处理。即语音编码器的输入为语音采样，输出则为压缩的比特流。压缩的比特流通过信道传入解码端，语音解码器接收该比特流，并产生重构的语音信号。

在CELP（Code Excited Linear Prediction，码激励线性预测）编码中，数字语音信号以帧为单位进行编码传输。对于每帧数字语音信号，编码器从中抽取多个编码参数，并将这些编码参数发送/存储。而CELP解码器则是处理所接收的编码参数重构合成语音信号的指定帧。在CELP编解码模式下，信道中传输的编码参数有：

LSF（Linear Spectrum Frequencies，线谱频率）或ISF（Immitance SpectrumFrequencies，导谱频率）；

基音参数，包括基音延迟和基音增益；

革新激励参数，包括固定码本索引和增益；

LSF或ISF系数按帧为单位进行编码传输，基音参数和革新激励参数一般按子帧为单位进行编码传输。其中，基音参数和革新激励参数描述了激励信号。LSF/ISF是LP（Linear Prediction，线性预测）滤波器的系数的频域表现形式。激励信号可以看作声门的输出，LP滤波器可以看作声道模型。所以当激励信号通过LP滤波器后，就得到输出的合成语音信号。

为了提高解码后合成语音的质量，通常会在解码端进行一些增强后处理。在CELP编码中，其激励产生的二元模型中包括了模拟浊音特性的自适应码本激励和模拟清音特性的固定码本激励，其总的激励为自适应码本激励和固定码本激励的和，最后总的激励通过一个合成滤波器得到合成语音。当人声趋向清音特性时，在解码端对模拟清音特性的固定码本激励进行一定的噪声增强可以提高合成语音的质量。

AMR-WB（ITU-T G.722.2）语音编码标准是一种宽带语音编码标准，该标准采用的自适应噪声增强算法的实现方法如下：

（1）对初始的固定码本增益进行修正：

\{\begin{matrix} g_{0} = g * 1.19, (g < g_{- 1}) \\ g_{0} = g / 1.19, (g &GreaterEqual; g_{- 1}) \end{matrix},

其中，g为固定码本增益，g₀为修正的固定码本增益，g_-1为上一帧的修正的固定码本增益。

（2）对修正的固定码本增益进行平滑：

g_s=s_m*g₀+(1-s_m)*g，

其中，g_s为平滑后的固定码本增益，平滑因子s_m由稳定度因子θ和清浊音度因子λ决定：

s_m=λθ。

清浊音度因子λ的计算方法如下：

λ=0.5(1-γ_v)，

γ_v=(E_v-E_c)/(E_v+E_c)，

其中，E_v=b²vv^T为缩放的自适应码矢的能量，其中b为自适应码本增益，v为自适应码本激励；E_c=g²cc^T为缩放的固定码矢的能量，其中，g为固定码本增益，c为固定码本激励。

其中，-1≤γ_v≤1。当y_v=-1时为纯清音；当γ_v=1时为纯浊音。相应的，对于纯清音，λ=1；对于纯浊音，λ=0。即：

0--------→λ---------→1

纯浊音-------------→纯清音

稳定度因子θ的计算方法如下：

θ＝1.25-D_s/400000,(0≤θ≤1)，

D_{s} = Σ_{i = 1}^{p - 1} {({isp}_{i}^{(n)} - {isp}_{i}^{(n - 1)})}^{2},

其中，为当前帧的ISP系数，

为前一帧的ISP系数。由此可知：

0--------→θ---------→1

不稳定---------------→稳定

AMR-WB语音编码标准采用的以上自适应噪声增强算法的最大缺点是计算复杂度比较高。

Ozawa,K.,"A post-processing technique to improve coding quality of CELPunder background noise,"Procs.2000 IEEE Workshop on Speech Coding,pp.102-104,2000一文中提出了一种基于CELP模型的背景噪声后处理方法。该背景噪声后处理方法的基本原理是：

通过ISP系数经过一系列的计算，得到一个长时平均距离，此长时平均距离与一个门限值作比较，如果大于门限值，则说明此帧为语音帧，不需作任何处理；反之，则为非语音帧。

当判断为非语音帧后，通过计算长时平均距离的长时平均值，得到一个再一次平均后的距离值，同样地，若该距离值大于一个门限值，则为非稳定噪声，不需对当前帧进行任何处理；反之则为稳定噪声。通过前面的判断，若判断结果为稳定地非语音帧，则对当前帧进行激励信号的能量平滑和ISP系数平滑处理。上述噪声增强处理方法的主要步骤如下：

（1）计算当前谱包络和一个长时平均谱包络之间的距离

d_{q}^{(n)} = Σ_{j = 0}^{N_{p} - 1} Σ_{m = 0}^{N_{sfr} - 1} \frac{| {\overset{&OverBar;}{q}}_{L, j}^{(n)} - q_{j}^{(m, n)} |}{| {\overset{&OverBar;}{q}}_{L, j}^{(n)} |},

其中，

{\overset{&OverBar;}{q}}_{L, j}^{(n)} = β_{q} {\overset{&OverBar;}{q}}_{L, j}^{(n - 1)} + (1 - β_{q}) q_{j}^{[N_{sfr}, n]} .

（2）通过计算长时平均距离来判断输入信号帧为语音还是非语音帧。长时平均距离的计算方法如下：

{\overset{&OverBar;}{d}}_{q 1}^{(n)} = β_{d} {\overset{&OverBar;}{d}}_{q 1}^{(n - 1)} + (1 - β_{d}) d_{q}^{(n)},

其中，

为第n帧的第m子帧的LSP系数，

为第n帧的长时平均LSP系数，N_p为LP阶数，N_sfr为一帧中子帧的数目，β_q、β_d为常数，th1为门限值。

（3）当在步骤（2）中判定为非语音时，即s_n1=0时，对噪声进行如下分类：

{\overset{&OverBar;}{d}}_{q 2}^{(n)} = β_{d 1} {\overset{&OverBar;}{d}}_{q 1}^{(n - 1)} + (1 - β_{d 1}) {\overset{&OverBar;}{d}}_{q 1}^{(n)},

（4）对由自适应码矢和固定码矢加权得到激励信号进行能量平滑：

E_{exc}^{(m)} = Σ_{i = 0}^{64} v_{exc} {[i]}^{*} v_{exc} [i],

{\overset{&OverBar;}{E}}_{exc}^{(m)} = α_{E} * {\overset{&OverBar;}{E}}_{exc}^{(m - 1)} + (1 - α_{E}) E_{exc}^{(m)},

K = \sqrt{\frac{{\overset{&OverBar;}{E}}_{exc}^{(m)}}{E_{exc}^{(m)}}},

{\overset{&OverBar;}{v}}_{exc} [i] = K * v_{exc} [i],

其中，v_exc[i]为激励矢量，常数α_E为能量平滑因子，α_E的值随着s_n2的跳变而变化。

（5）LSP系数平滑：

{\overset{&OverBar;}{q}}_{j}^{(m)} = α_{q} * {\overset{&OverBar;}{q}}_{j}^{(m - 1)} + (1 - α_{q}) * q_{j}^{(m)},

其中，常数α_q为能量平滑因子，α_q的值随着s_n2的跳变而变化。

上文提出的噪声增强处理方法未说明其中用到的一系列的常数值、门限值时如何确定的，也未给出任何确定常数值、门限值的方法或规律，因而很难实现。

发明内容

本发明要解决的技术问题在于，针对现有技术的上述缺陷，提供一种运算复杂度低且不额外增加传输码率的用于宽带语音解码中噪声增强后处理的方法和装置，能够增强解码端合成语音质量。

本发明解决其技术问题所采用的技术方案是：提出一种用于宽带语音解码中噪声增强后处理的方法，包括如下步骤：

S1、检测当前帧的语音/非语音特性，计算出当前帧的噪声因子；

S2、确定该噪声因子是否大于一预设的门限值；

S3、在噪声因子大于预设的门限值时，对当前帧的固定码矢执行能量平滑处理，得到经过能量平滑后的固定码矢；

S4、将当前帧的自适应码矢与该经过能量平滑后的固定码矢相加，合成激励信号。

本发明上述用于宽带语音解码中噪声增强后处理的方法中，所述步骤S1进一步包括：

S11、通过下式计算当前谱包络和一个长时平均谱包络之间的距离d_q：

d_{q}^{(n)} = Σ_{j = 0}^{N_{p} - 1} Σ_{m = 0}^{N_{sfr} - 1} \frac{| {\overset{&OverBar;}{q}}_{L, j}^{(n)} - q_{j}^{(m, n)} |}{| {\overset{&OverBar;}{q}}_{L, j}^{(n)} |},

其中，

{\overset{&OverBar;}{q}}_{L, j}^{(n)} = β_{q} {\overset{&OverBar;}{q}}_{L, j}^{(n - 1)} + (1 - β_{q}) q_{j}^{[N_{sfr} - 1, n]},

其中，β_q=0.25，

为第n帧的第m子帧的LSP系数，

为第n帧的长时平均LSP系数，N_p为LP阶数，N_sfr为一帧中子帧的数目；

S12、通过下式对该距离进行缩放，得到当前帧的噪声因子：

γ_n=1.35-(d_q/50)，

其中，γ_n为当前帧的噪声因子，且0≤γ_n≤1.3。

本发明上述用于宽带语音解码中噪声增强后处理的方法中，所述预设的门限值为1。

本发明上述用于宽带语音解码中噪声增强后处理的方法中，所述步骤S3进一步包括：

S31、基于当前帧的噪声因子和自适应码矢增益计算能量平滑因子：

e_s=α*(_nγ-1)，

其中，e_s为能量平滑因子，γ_n为噪声因子，α=1-b，且b为自适应码本增益；

S32、确定当前帧的固定码矢能量是否小于上一帧的固定码矢能量；

S33、在当前帧的固定码矢能量小于上一帧的固定码矢能量时，通过下式对当前帧的固定码矢执行能量平滑：

ene1=(1+e_s)ene，且ene1≤ene，

其中，ene为当前帧的缩放的固定码矢能量，且ene=g²cc^T，其中，g为固定码本增益，c为固定码本激励，ene1为平滑后的固定码矢能量；

S34、在当前帧的固定码矢能量不小于上一帧的固定码矢能量时，通过下式对当前帧的固定码矢执行能量平滑：

ene1=(1-e_s)ene，且ene1≥ene；

S35、通过下式计算固定码矢的缩放因子k：

k = \sqrt{\frac{ene 1}{ene}};

S36、将固定码矢乘以该缩放因子，得到经过能量平滑后的固定码矢。

本发明为解决其技术问题还提出一种用于宽带语音解码中噪声增强后处理的装置，包括：

码矢计算模块，用于处理语音信号中每一帧的解码参数，分别计算出固定码矢和自适应码矢；

噪声检测模块，用于检测当前帧的语音/非语音特性，计算出当前帧的噪声因子；

能量平滑模块，用于确定该噪声因子是否大于一预设的门限值，并在噪声因子大于预设的门限值时，对当前帧的固定码矢执行能量平滑处理，得到经过能量平滑后的固定码矢；

合成模块，用于将当前帧的自适应码矢与该经过能量平滑后的固定码矢相加，合成激励信号。

本发明上述用于宽带语音解码中噪声增强后处理的装置中，所述码矢计算模块进一步包括：

固定码矢计算模块，用于将码本索引解码并用固定码本增益作为缩放因子进行缩放，得到缩放后的所述固定码矢；

自适应码矢计算模块，用于将基音索引解码并用自适应码本增益作为缩放因子进行缩放，得到缩放后的所述自适应码矢。

本发明上述用于宽带语音解码中噪声增强后处理的装置中，所述噪声检测模块进一步包括：

距离计算子模块，用于通过下式计算当前谱包络和一个长时平均谱包络之间的距离d_q：

d_{q}^{(n)} = Σ_{j = 0}^{N_{p} - 1} Σ_{m = 0}^{N_{sfr} - 1} \frac{| {\overset{&OverBar;}{q}}_{L, j}^{(n)} - q_{j}^{(m, n)} |}{| {\overset{&OverBar;}{q}}_{L, j}^{(n)} |},

其中，

{\overset{&OverBar;}{q}}_{L, j}^{(n)} = β_{q} {\overset{&OverBar;}{q}}_{L, j}^{(n - 1)} + (1 - β_{q}) q_{j}^{[N_{sfr} - 1, n]},

其中，β_q=0.25，

为第n帧的第m子帧的LSP系数，

噪声因子计算子模块，用于通过下式对距离计算子模块计算出的距离进行缩放，得到当前帧的噪声因子：

γ_n=1.35-(d_q/50)，

其中，γ_n为当前帧的噪声因子，且0≤γ_n≤1.3。

本发明上述用于宽带语音解码中噪声增强后处理的装置中，所述能量平滑模块进一步包括：

能量平滑因子计算子模块，用于基于当前帧的噪声因子和自适应码矢增益计算能量平滑因子：

e_s=α*(γ_n-1)，

能量平滑子模块，用于确定当前帧的固定码矢能量是否小于上一帧的固定码矢能量，并在当前帧的固定码矢能量小于上一帧的固定码矢能量时，通过下式对当前帧的固定码矢执行能量平滑：

ene1=(1+e_s)ene，且ene1≤ene，

以及在当前帧的固定码矢能量不小于上一帧的固定码矢能量时，通过下式对当前帧的固定码矢执行能量平滑：

ene1=(1-e_s)ene，且ene1≥ene，

缩放因子计算子模块，用于通过下式计算固定码矢的缩放因子k：

k = \sqrt{\frac{ene 1}{ene}};

乘法器，用于将固定码矢乘以该缩放因子，得到经过能量平滑后的固定码矢。

本发明为解决其技术问题还提出一种用于宽带语音解码的方法，包括如下步骤：

a、对语音信号的解码参数中的导谱频率索引进行解码处理，得到合成滤波器的转移函数；

b、通过上述用于宽带语音解码中噪声增强后处理的方法得到激励信号；

c、使用步骤a得到的转移函数对步骤b得到的激励信号进行合成滤波，输出语音信号。

本发明为解决其技术问题还提出一种用于宽带语音解码的解码器，包括：

参数处理模块，用于对语音信号的解码参数中的导谱频率索引进行解码处理，得到合成滤波器的转移函数；

如上所述的用于宽带语音解码中噪声增强后处理的装置，用于得到激励信号；

合成滤波器，用于使用参数解码模块得到的转移函数对噪声增强后处理装置得到的激励信号进行合成滤波，输出语音信号。

本发明通过解码语音信号的噪声因子的特性对固定码矢的能量进行平滑，从而达到噪声增强的目的。本发明能够适用于各种语音编解码器，算法运算复杂度比较低，并且不额外增加传输码率。

附图说明

下面将结合附图及实施例对本发明作进一步说明，附图中：

图1是宽带语音编解码系统的示意框图；

图2是本发明一个实施例的解码器的原理性示意框图；

图3是本发明一个实施例的用于宽带语音解码中噪声增强后处理的方法的流程图；

图4是图3中步骤330的具体实现流程图；

图5是本发明一个实施例的用于宽带语音解码中噪声增强后处理的装置的逻辑框图；

图6是图5中噪声检测模块的具体实现逻辑框图；

图7是图5中能量平滑模块的具体实现逻辑框图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

图1示出了宽带语音编解码系统100。如图1所示，语音信号经过语音编码器110（包括源编码器111和参数编码器112）编码成一系列的参数，这些参数通过信道120传送到解码端，经过解码器130（包括参数解码器131和源解码器132）解码还原出合成语音信号。

本发明主要体现在ACELP（Algebraic Code Excited Linear Prediction，代数码激励线性预测）编码模式的解码端，即解码器130中。本发明根据语音信号帧的噪声特性对固定码矢进行能量平滑处理，达到噪声增强的目的。众所周知，自适应码书表征了信号的周期性，它的作用相当于一个基音预测器，而固定码书则表征了信号的长时相关性，它相当于一个长时预测器。也即，自适应码矢更多的表征了信号中语音信号的信息，而固定码矢则更多的表征了信号中非语音信号的信息，所以对固定码矢根据语音信号帧的噪声特性进行能量平滑处理，能够起到噪声增强的目的。以下将结合图2所示的根据本发明一个实施例的解码器200详细介绍本发明的技术方案。

如图2所示，解码器200主要包括ACELP解码参数模块210、参数处理模块220、噪因增强后处理模块230和合成滤波器240。ACELP解码参数模块210获取数字语音信号的解码参数，包括ISF索引、码本索引、基因索引、自适应码本增益和固定码本增益。参数处理模块220对解码参数中的ISF索引进行解码处理，得到合成滤波器240的转移函数

具体如图2所示，ISF索引分别经过解码ISP（Immitance Spectrum Pairs，导抗频谱对）模块221、解码ISP并插值模块222和ISP参数转化为LP系数模块223的处理，得到

即为合成滤波器240的转移函数。有关ISF索引的解码处理的具体实现过程，可以通过现有技术中各种合适的技术手段来实现，且并非本发明技术方案的关注点，故在此不再给出详细描述。

本发明的技术方案的具体实现体现在噪声增强后处理模块230，用于根据语音信号帧的噪声特性对固定码矢进行能量平滑处理，达到噪声增强的目的。具体参见图2，将解码参数基音索引传入解码自适应码本模块231，然后将得到的码矢通过放大器232用自适应码本增益b作为缩放因子进行缩放，即得到缩放后的自适应码矢C(n)。将解码参数码本索引传入解码固定码本模块233解码，然后将得到的码矢通过放大器234用固定码本增益g作为缩放因子进行缩放，即得到缩放后的固定码矢V(n)。噪声检测模块235利用从参数处理模块220得到的解码并插值的ISP系数求得当前谱包络和一个长时平均谱包络之间的距离，并根据这个距离计算得到噪声因子γ_n（具体的计算步骤将在后续描述中给出）。能量平滑模块236对缩放后的固定码矢V(n)进行能量平滑处理，能量平滑的主要参数是噪声检测模块235提供的噪声因子γ_n和自适应码本增益b（具体的处理过程将在后续描述中给出）。经过能量平滑后的固定码矢V’(n)和缩放的自适应码矢C(n)通过加法器237，得到激励信号ex(n)。激励信号ex(n)经过合成滤波器240使用参数处理模块220提供的转移函数

进行滤波，即得到合成语音信号。该合成语音信号由于经过了噪声增强处理，语音质量得到提高。

结合以上描述，本发明提出一种用于宽带语音解码中噪声增强后处理的方法和装置。图3示出了根据本发明一个实施例的用于宽带语音解码中噪声增强后处理的方法300的流程图。如图3所示，该方法300包括如下步骤：

步骤310中，检测当前帧的语音/非语音特性，计算出当前帧的噪声因子γ_n。

具体实施例中，本发明通过求得当前谱包络与一个长时平均谱包络之间的距离d_q来判断当前帧的语音/非语音特性。当此距离d_q的值越大，说明当前帧的语音特性越明显；反之，若此距离d_q的值越小，就说明非语音特性越明显，亦可说是噪声特性越明显。距离d_q的计算如下：

d_{q}^{(n)} = Σ_{j = 0}^{N_{p} - 1} Σ_{m = 0}^{N_{sfr} - 1} \frac{| {\overset{&OverBar;}{q}}_{L, j}^{(n)} - q_{j}^{(m, n)} |}{| {\overset{&OverBar;}{q}}_{L, j}^{(n)} |},

其中，

{\overset{&OverBar;}{q}}_{L, j}^{(n)} = β_{q} {\overset{&OverBar;}{q}}_{L, j}^{(n - 1)} + (1 - β_{q}) q_{j}^{[N_{sfr} - 1, n]},

其中，β_q=0.25，

为第n帧的第m子帧的LSP系数，

为第n帧的长时平均LSP系数，N_p为LP阶数，N_sfr为一帧中子帧的数目。

由于d_q的数值很大，故本发明的一个优选实施例中，对距离d_q进行如下缩放，得到噪声因子γ_n：

γ_n=1.35-(d_q/50)，且0≤γ_n≤1.3。

当噪声因子γ_n的值越大，说明噪声特性越明显。

随后步骤320中，确定噪声因子γ_n是否大于一个预设的门限值th。

由于当噪声因子γ_n的值较小时，说明当前帧语音特性很强，此时就不能进行噪声增强，否则会产生负效应，因此本发明对噪声因子γ_n设置一个门限值th=1。

若在步骤320中确定噪声因子γ_n大于此门限值th时，则执行步骤330，对当前帧的固定码矢V(n)做能量平滑处理以得到经过能量平滑后的固定码矢V’(n)，否则不做能量平滑处理。

随后步骤340中，将当前帧的自适应码矢C(n)与该经过能量平滑后的固定码矢V’(n)相加，合成激励信号ex(n)。激励信号ex(n)经过合成滤波器滤波，即得到合成语音信号。

图4是图3中步骤330的具体实施例的流程图。如图4所示，步骤330中对当前帧的固定码矢V(n)做能量平滑处理具体通过如下方法实现：

步骤331中，基于当前帧的噪声因子和自适应码矢增益计算能量平滑因子：

e_s=α*(γ_n-1)，

其中，e_s为能量平滑因子，γ_n为噪声因子，α=1-b，且b为自适应码本增益。

随后步骤332中，确定当前帧的固定码矢能量是否小于上一帧的固定码矢能量。

若在步骤332中确定当前帧的固定码矢能量小于上一帧的固定码矢能量，则执行步骤333，通过下式对当前帧的固定码矢执行能量平滑：

ene1=(1+e_s)ene，且ene1≤ene，

其中，ene为当前帧的缩放的固定码矢能量，且ene=g²cc^T，其中，g为固定码本增益，c为固定码本激励，ene1为平滑后的固定码矢能量。

若在步骤332中确定当前帧的固定码矢能量不小于上一帧的固定码矢能量，则执行步骤334，通过下式对当前帧的固定码矢执行能量平滑：

ene1=(1-e_s)ene，且ene1≥ene。

随后步骤335中，将平滑后的固定码矢能量与原始的能量相比并开方，得到固定码矢的缩放因子k：

k = \sqrt{\frac{ene 1}{ene}} .

随后步骤336中，将固定码矢V(n)乘以该缩放因子k，得到经过能量平滑后的固定码矢V’(n)。

该经过能量平滑后的固定码矢V’(n)与自适应码矢C(n)相加，即为最后的激励信号ex(n)。

图5示出了根据本发明一个实施例的用于宽带语音解码中噪声增强后处理的装置400的逻辑框图。如图5所示，用于宽带语音解码中噪声增强后处理的装置400包括码矢计算模块410、噪声检测模块420、能量平滑模块430和合成模块440。其中，码矢计算模块410用于处理语音信号中每一帧的解码参数，分别计算出固定码矢V(n)和自适应码矢C(n)。具体实施例中，码矢计算模块410进一步包括自适应码矢计算模块411和固定码矢计算模块412。自适应码矢计算模块411将解码参数中的基音索引解码并用自适应码本增益b作为缩放因子进行缩放，得到缩放后的自适应码矢C(n)。固定码矢计算模块412将解码参数中的码本索引解码并用固定码本增益g作为缩放因子进行缩放，得到缩放后的固定码矢V(n)。

噪声检测模块420通过利用解码并插值的ISP系数求得当前谱包络和一个长时平均谱包络之间的距离来检测当前帧的语音/非语音特性，并根据这个距离计算得到噪声因子γ_n。一个具体实施例中，如图6所示，噪声检测模块420进一步包括距离计算子模块421和噪声因子计算子模块422。距离计算子模块421通过下式计算当前谱包络和一个长时平均谱包络之间的距离d_q：

d_{q}^{(n)} = Σ_{j = 0}^{N_{p} - 1} Σ_{m = 0}^{N_{sfr} - 1} \frac{| {\overset{&OverBar;}{q}}_{L, j}^{(n)} - q_{j}^{(m, n)} |}{| {\overset{&OverBar;}{q}}_{L, j}^{(n)} |},

其中，

{\overset{&OverBar;}{q}}_{L, j}^{(n)} = β_{q} {\overset{&OverBar;}{q}}_{L, j}^{(n - 1)} + (1 - β_{q}) q_{j}^{[N_{sfr} - 1, n]},

其中，β_q=0.25，

为第n帧的第m子帧的LSP系数，为第n帧的长时平均LSP系数，N_p为LP阶数，N_sfr为一帧中子帧的数目。噪声因子计算模块422通过下式对距离计算子模块412计算出的距离进行缩放，得到当前帧的噪声因子γ_n：

γ_n=1.35-(d_q/50)，且0≤γ_n≤1.3。

能量平滑模块430用于确定噪声检测模块420得到的噪声因子γ_n是否大于一预设的门限值th，并在噪声因子γ_n大于预设的门限值th时，对当前帧的固定码矢V(n)执行能量平滑处理，得到经过能量平滑后的固定码矢V’(n)。由于当噪声因子γ_n的值较小时，说明当前帧语音特性很强，此时就不能进行噪声增强，否则会产生负效应，因此本发明对噪声因子γ_n设置一个门限值th=1。当噪声因子γ_n>1时，就对固定码矢V(n)执行能量平滑，否则就不做处理。

一个具体实施例中，如图7所示，能量平滑模块430进一步包括能量平滑因子计算子模块431、能量平滑子模块432、缩放因子计算子模块433和乘法器434。能量平滑因子计算子模块431基于当前帧的噪声因子γ_n和自适应码矢增益b计算能量平滑因子e_s=α*(γ_n-1)，且α=1-b。能量平滑子模块432用于确定当前帧的固定码矢能量是否小于上一帧的固定码矢能量，并据此对当前帧的固定码矢执行能量平滑。在当前帧的固定码矢能量小于上一帧的固定码矢能量时，能量平滑子模块432通过下式对当前帧的固定码矢执行能量平滑：

ene1=(1+e_s)ene，且ene1≤ene，

其中，ene为当前帧的缩放的固定码矢能量，且ene=g²cc^T，其中，g为固定码本增益，c为固定码本激励，ene1为平滑后的固定码矢能量。在当前帧的固定码矢能量不小于上一帧的固定码矢能量时，能量平滑子模块432通过下式对当前帧的固定码矢执行能量平滑：

ene1=(1-e_s)ene，且ene1≥ene。

缩放因子计算子模块433将平滑后的固定码矢能量与原始的能量相比并开方，得到固定码矢的缩放因子k：

k = \sqrt{\frac{ene 1}{ene}} .

乘法器434将固定码矢V(n)乘以该缩放因子k，得到经过能量平滑后的固定码矢V’(n)。

最后，如图5所示，合成模块440将当前帧的自适应码矢C(n)与经过能量平滑后的固定码矢V’(n)相加，合成激励信号ex(n)。激励信号ex(n)经过合成滤波器滤波，即得到合成语音信号。

本发明的噪声增强后处理是通过解码语音信号的噪声因子的特性对固定码矢的能量进行平滑，从而达到噪声增强的目的。因而，本发明能够适用于各种语音编解码器，算法运算复杂度比较低，并且不额外增加传输码率。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

Claims

1.一种用于宽带语音解码中噪声增强后处理的方法，其特征在于，包括如下步骤：

S2、确定该噪声因子是否大于一预设的门限值；

2.根据权利要求1所述的方法，其特征在于，所述步骤S1进一步包括：

d_{q}^{(n)} = Σ_{j = 0}^{N_{p} - 1} Σ_{m = 0}^{N_{sfr} - 1} \frac{| {\overset{&OverBar;}{q}}_{L, j}^{(n)} - q_{j}^{(m, n)} |}{| {\overset{&OverBar;}{q}}_{L, j}^{(n)} |},

其中，

{\overset{&OverBar;}{q}}_{L, j}^{(n)} = β_{q} {\overset{&OverBar;}{q}}_{L, j}^{(n - 1)} + (1 - β_{q}) q_{j}^{[N_{sfr} - 1, n]},

其中，β_q=0.25，

为第n帧的第m子帧的LSP系数，为第n帧的长时平均LSP系数，N_p为LP阶数，N_sfr为一帧中子帧的数目；

S12、通过下式对该距离进行缩放，得到当前帧的噪声因子：

γ_n=1.35-(d_q/50)，

其中，γ_n为当前帧的噪声因子，且0≤γ_n≤1.3。

3.根据权利要求2所述的方法，其特征在于，所述预设的门限值为1。

4.根据权利要求1所述的方法，其特征在于，所述步骤S3进一步包括：

e_c=α*(γ_n-1)，

ene1=(1+e_s)ene，且ene1≤ene，

ene1=(1-e_s)ene，且ene1≥ene；

S35、通过下式计算固定码矢的缩放因子k：

k = \sqrt{\frac{ene 1}{ene}};

5.一种用于宽带语音解码中噪声增强后处理的装置，其特征在于，包括：

6.根据权利要求5所述的装置，其特征在于，所述码矢计算模块进一步包括：

7.根据权利要求5所述的装置，其特征在于，所述噪声检测模块进一步包括：

d_{q}^{(n)} = Σ_{j = 0}^{N_{p} - 1} Σ_{m = 0}^{N_{sfr} - 1} \frac{| {\overset{&OverBar;}{q}}_{L, j}^{(n)} - q_{j}^{(m, n)} |}{| {\overset{&OverBar;}{q}}_{L, j}^{(n)} |},

其中，

{\overset{&OverBar;}{q}}_{L, j}^{(n)} = β_{q} {\overset{&OverBar;}{q}}_{L, j}^{(n - 1)} + (1 - β_{q}) q_{j}^{[N_{sfr} - 1, n]},

其中，β_q=0.25，

为第n帧的第m子帧的LSP系数，

γ_n=1.35-(d_q/50)，

其中，γ_n为当前帧的噪声因子，且0≤γ_n≤1.3。

8.根据权利要求5所述的装置，其特征在于，所述能量平滑模块进一步包括：

e_s=α*(γ_n-1)，

ene1=(1+e_s)ene，且ene1≤ene，

ene1=(1-e_s)ene，且ene1≥ene，

k = \sqrt{\frac{ene 1}{ene}};

9.一种用于宽带语音解码的方法，其特征在于，包括如下步骤：

b、通过根据权利要求1-4中任一项所述的方法得到激励信号；

10.一种用于宽带语音解码的解码器，其特征在于，包括：

根据权利要求5-8中任一项所述的噪声增强后处理的装置，用于得到激励信号；