CN102968997A - 用于宽带语音解码中噪声增强后处理的方法及装置 - Google Patents

用于宽带语音解码中噪声增强后处理的方法及装置 Download PDF

Info

Publication number
CN102968997A
CN102968997A CN2012104360810A CN201210436081A CN102968997A CN 102968997 A CN102968997 A CN 102968997A CN 2012104360810 A CN2012104360810 A CN 2012104360810A CN 201210436081 A CN201210436081 A CN 201210436081A CN 102968997 A CN102968997 A CN 102968997A
Authority
CN
China
Prior art keywords
code vector
energy
fixed code
present frame
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012104360810A
Other languages
English (en)
Inventor
张勇
闫建新
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHENZHEN GUANGSHENG XINYUAN TECHNOLOGY Co Ltd
Original Assignee
SHENZHEN GUANGSHENG XINYUAN TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHENZHEN GUANGSHENG XINYUAN TECHNOLOGY Co Ltd filed Critical SHENZHEN GUANGSHENG XINYUAN TECHNOLOGY Co Ltd
Priority to CN2012104360810A priority Critical patent/CN102968997A/zh
Publication of CN102968997A publication Critical patent/CN102968997A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明涉及一种用于宽带语音解码中噪声增强后处理的方法和装置。所述方法包括:S1、检测当前帧的语音/非语音特性,计算出当前帧的噪声因子;S2、确定该噪声因子是否大于一预设的门限值;S3、在噪声因子大于预设的门限值时,对当前帧的固定码矢执行能量平滑处理,得到经过能量平滑后的固定码矢;S4、将当前帧的自适应码矢与该经过能量平滑后的固定码矢相加,合成激励信号。本发明还涉及一种用于宽带语音解码的方法和解码器。本发明通过解码语音信号的噪声因子的特性对固定码矢的能量进行平滑,从而达到噪声增强的目的。本发明能够适用于各种语音编解码器,算法运算复杂度比较低,并且不额外增加传输码率。

Description

用于宽带语音解码中噪声增强后处理的方法及装置
技术领域
本发明涉及语音编解码技术,更具体地说,涉及一种用于宽带语音解码中噪声增强后处理的方法及装置。
背景技术
语音编/解码器广泛地应用于数字通信系统,有效的发送/存储语音信号。在数字系统中,输入的模拟语音信号经过采样转化到数字域,在数字域中,对连续的语音采样做进一步处理。即语音编码器的输入为语音采样,输出则为压缩的比特流。压缩的比特流通过信道传入解码端,语音解码器接收该比特流,并产生重构的语音信号。
在CELP(Code Excited Linear Prediction,码激励线性预测)编码中,数字语音信号以帧为单位进行编码传输。对于每帧数字语音信号,编码器从中抽取多个编码参数,并将这些编码参数发送/存储。而CELP解码器则是处理所接收的编码参数重构合成语音信号的指定帧。在CELP编解码模式下,信道中传输的编码参数有:
LSF(Linear Spectrum Frequencies,线谱频率)或ISF(Immitance SpectrumFrequencies,导谱频率);
基音参数,包括基音延迟和基音增益;
革新激励参数,包括固定码本索引和增益;
LSF或ISF系数按帧为单位进行编码传输,基音参数和革新激励参数一般按子帧为单位进行编码传输。其中,基音参数和革新激励参数描述了激励信号。LSF/ISF是LP(Linear Prediction,线性预测)滤波器的系数的频域表现形式。激励信号可以看作声门的输出,LP滤波器可以看作声道模型。所以当激励信号通过LP滤波器后,就得到输出的合成语音信号。
为了提高解码后合成语音的质量,通常会在解码端进行一些增强后处理。在CELP编码中,其激励产生的二元模型中包括了模拟浊音特性的自适应码本激励和模拟清音特性的固定码本激励,其总的激励为自适应码本激励和固定码本激励的和,最后总的激励通过一个合成滤波器得到合成语音。当人声趋向清音特性时,在解码端对模拟清音特性的固定码本激励进行一定的噪声增强可以提高合成语音的质量。
AMR-WB(ITU-T G.722.2)语音编码标准是一种宽带语音编码标准,该标准采用的自适应噪声增强算法的实现方法如下:
(1)对初始的固定码本增益进行修正:
g 0 = g * 1.19 , ( g < g - 1 ) g 0 = g / 1.19 , ( g &GreaterEqual; g - 1 ) ,
其中,g为固定码本增益,g0为修正的固定码本增益,g-1为上一帧的修正的固定码本增益。
(2)对修正的固定码本增益进行平滑:
gs=sm*g0+(1-sm)*g,
其中,gs为平滑后的固定码本增益,平滑因子sm由稳定度因子θ和清浊音度因子λ决定:
sm=λθ。
清浊音度因子λ的计算方法如下:
λ=0.5(1-γv),
γv=(Ev-Ec)/(Ev+Ec),
其中,Ev=b2vvT为缩放的自适应码矢的能量,其中b为自适应码本增益,v为自适应码本激励;Ec=g2ccT为缩放的固定码矢的能量,其中,g为固定码本增益,c为固定码本激励。
其中,-1≤γv≤1。当yv=-1时为纯清音;当γv=1时为纯浊音。相应的,对于纯清音,λ=1;对于纯浊音,λ=0。即:
0--------→λ---------→1
纯浊音-------------→纯清音
稳定度因子θ的计算方法如下:
θ=1.25-Ds/400000,(0≤θ≤1),
D s = &Sigma; i = 1 p - 1 ( isp i ( n ) - isp i ( n - 1 ) ) 2 ,
其中,为当前帧的ISP系数,
Figure BDA00002358692900033
为前一帧的ISP系数。由此可知:
0--------→θ---------→1
不稳定---------------→稳定
AMR-WB语音编码标准采用的以上自适应噪声增强算法的最大缺点是计算复杂度比较高。
Ozawa,K.,"A post-processing technique to improve coding quality of CELPunder background noise,"Procs.2000 IEEE Workshop on Speech Coding,pp.102-104,2000一文中提出了一种基于CELP模型的背景噪声后处理方法。该背景噪声后处理方法的基本原理是:
通过ISP系数经过一系列的计算,得到一个长时平均距离,此长时平均距离与一个门限值作比较,如果大于门限值,则说明此帧为语音帧,不需作任何处理;反之,则为非语音帧。
当判断为非语音帧后,通过计算长时平均距离的长时平均值,得到一个再一次平均后的距离值,同样地,若该距离值大于一个门限值,则为非稳定噪声,不需对当前帧进行任何处理;反之则为稳定噪声。通过前面的判断,若判断结果为稳定地非语音帧,则对当前帧进行激励信号的能量平滑和ISP系数平滑处理。上述噪声增强处理方法的主要步骤如下:
(1)计算当前谱包络和一个长时平均谱包络之间的距离
Figure BDA00002358692900034
d q ( n ) = &Sigma; j = 0 N p - 1 &Sigma; m = 0 N sfr - 1 | q &OverBar; L , j ( n ) - q j ( m , n ) | | q &OverBar; L , j ( n ) | ,
其中, q &OverBar; L , j ( n ) = &beta; q q &OverBar; L , j ( n - 1 ) + ( 1 - &beta; q ) q j [ N sfr , n ] .
(2)通过计算长时平均距离来判断输入信号帧为语音还是非语音帧。长时平均距离的计算方法如下:
d &OverBar; q 1 ( n ) = &beta; d d &OverBar; q 1 ( n - 1 ) + ( 1 - &beta; d ) d q ( n ) ,
Figure BDA00002358692900041
其中,
Figure BDA00002358692900042
为第n帧的第m子帧的LSP系数,
Figure BDA00002358692900043
为第n帧的长时平均LSP系数,Np为LP阶数,Nsfr为一帧中子帧的数目,βq、βd为常数,th1为门限值。
(3)当在步骤(2)中判定为非语音时,即s_n1=0时,对噪声进行如下分类:
d &OverBar; q 2 ( n ) = &beta; d 1 d &OverBar; q 1 ( n - 1 ) + ( 1 - &beta; d 1 ) d &OverBar; q 1 ( n ) ,
Figure BDA00002358692900045
(4)对由自适应码矢和固定码矢加权得到激励信号进行能量平滑:
E exc ( m ) = &Sigma; i = 0 64 v exc [ i ] * v exc [ i ] ,
E &OverBar; exc ( m ) = &alpha; E * E &OverBar; exc ( m - 1 ) + ( 1 - &alpha; E ) E exc ( m ) ,
K = E &OverBar; exc ( m ) E exc ( m ) ,
v &OverBar; exc [ i ] = K * v exc [ i ] ,
其中,vexc[i]为激励矢量,常数αE为能量平滑因子,αE的值随着s_n2的跳变而变化。
(5)LSP系数平滑:
q &OverBar; j ( m ) = &alpha; q * q &OverBar; j ( m - 1 ) + ( 1 - &alpha; q ) * q j ( m ) ,
其中,常数αq为能量平滑因子,αq的值随着s_n2的跳变而变化。
上文提出的噪声增强处理方法未说明其中用到的一系列的常数值、门限值时如何确定的,也未给出任何确定常数值、门限值的方法或规律,因而很难实现。
发明内容
本发明要解决的技术问题在于,针对现有技术的上述缺陷,提供一种运算复杂度低且不额外增加传输码率的用于宽带语音解码中噪声增强后处理的方法和装置,能够增强解码端合成语音质量。
本发明解决其技术问题所采用的技术方案是:提出一种用于宽带语音解码中噪声增强后处理的方法,包括如下步骤:
S1、检测当前帧的语音/非语音特性,计算出当前帧的噪声因子;
S2、确定该噪声因子是否大于一预设的门限值;
S3、在噪声因子大于预设的门限值时,对当前帧的固定码矢执行能量平滑处理,得到经过能量平滑后的固定码矢;
S4、将当前帧的自适应码矢与该经过能量平滑后的固定码矢相加,合成激励信号。
本发明上述用于宽带语音解码中噪声增强后处理的方法中,所述步骤S1进一步包括:
S11、通过下式计算当前谱包络和一个长时平均谱包络之间的距离dq
d q ( n ) = &Sigma; j = 0 N p - 1 &Sigma; m = 0 N sfr - 1 | q &OverBar; L , j ( n ) - q j ( m , n ) | | q &OverBar; L , j ( n ) | ,
其中, q &OverBar; L , j ( n ) = &beta; q q &OverBar; L , j ( n - 1 ) + ( 1 - &beta; q ) q j [ N sfr - 1 , n ] ,
其中,βq=0.25,
Figure BDA00002358692900053
为第n帧的第m子帧的LSP系数,
Figure BDA00002358692900054
为第n帧的长时平均LSP系数,Np为LP阶数,Nsfr为一帧中子帧的数目;
S12、通过下式对该距离进行缩放,得到当前帧的噪声因子:
γn=1.35-(dq/50),
其中,γn为当前帧的噪声因子,且0≤γn≤1.3。
本发明上述用于宽带语音解码中噪声增强后处理的方法中,所述预设的门限值为1。
本发明上述用于宽带语音解码中噪声增强后处理的方法中,所述步骤S3进一步包括:
S31、基于当前帧的噪声因子和自适应码矢增益计算能量平滑因子:
es=α*(nγ-1),
其中,es为能量平滑因子,γn为噪声因子,α=1-b,且b为自适应码本增益;
S32、确定当前帧的固定码矢能量是否小于上一帧的固定码矢能量;
S33、在当前帧的固定码矢能量小于上一帧的固定码矢能量时,通过下式对当前帧的固定码矢执行能量平滑:
ene1=(1+es)ene,且ene1≤ene,
其中,ene为当前帧的缩放的固定码矢能量,且ene=g2ccT,其中,g为固定码本增益,c为固定码本激励,ene1为平滑后的固定码矢能量;
S34、在当前帧的固定码矢能量不小于上一帧的固定码矢能量时,通过下式对当前帧的固定码矢执行能量平滑:
ene1=(1-es)ene,且ene1≥ene;
S35、通过下式计算固定码矢的缩放因子k:
k = ene 1 ene ;
S36、将固定码矢乘以该缩放因子,得到经过能量平滑后的固定码矢。
本发明为解决其技术问题还提出一种用于宽带语音解码中噪声增强后处理的装置,包括:
码矢计算模块,用于处理语音信号中每一帧的解码参数,分别计算出固定码矢和自适应码矢;
噪声检测模块,用于检测当前帧的语音/非语音特性,计算出当前帧的噪声因子;
能量平滑模块,用于确定该噪声因子是否大于一预设的门限值,并在噪声因子大于预设的门限值时,对当前帧的固定码矢执行能量平滑处理,得到经过能量平滑后的固定码矢;
合成模块,用于将当前帧的自适应码矢与该经过能量平滑后的固定码矢相加,合成激励信号。
本发明上述用于宽带语音解码中噪声增强后处理的装置中,所述码矢计算模块进一步包括:
固定码矢计算模块,用于将码本索引解码并用固定码本增益作为缩放因子进行缩放,得到缩放后的所述固定码矢;
自适应码矢计算模块,用于将基音索引解码并用自适应码本增益作为缩放因子进行缩放,得到缩放后的所述自适应码矢。
本发明上述用于宽带语音解码中噪声增强后处理的装置中,所述噪声检测模块进一步包括:
距离计算子模块,用于通过下式计算当前谱包络和一个长时平均谱包络之间的距离dq
d q ( n ) = &Sigma; j = 0 N p - 1 &Sigma; m = 0 N sfr - 1 | q &OverBar; L , j ( n ) - q j ( m , n ) | | q &OverBar; L , j ( n ) | ,
其中, q &OverBar; L , j ( n ) = &beta; q q &OverBar; L , j ( n - 1 ) + ( 1 - &beta; q ) q j [ N sfr - 1 , n ] ,
其中,βq=0.25,
Figure BDA00002358692900073
为第n帧的第m子帧的LSP系数,
Figure BDA00002358692900074
为第n帧的长时平均LSP系数,Np为LP阶数,Nsfr为一帧中子帧的数目;
噪声因子计算子模块,用于通过下式对距离计算子模块计算出的距离进行缩放,得到当前帧的噪声因子:
γn=1.35-(dq/50),
其中,γn为当前帧的噪声因子,且0≤γn≤1.3。
本发明上述用于宽带语音解码中噪声增强后处理的装置中,所述能量平滑模块进一步包括:
能量平滑因子计算子模块,用于基于当前帧的噪声因子和自适应码矢增益计算能量平滑因子:
es=α*(γn-1),
其中,es为能量平滑因子,γn为噪声因子,α=1-b,且b为自适应码本增益;
能量平滑子模块,用于确定当前帧的固定码矢能量是否小于上一帧的固定码矢能量,并在当前帧的固定码矢能量小于上一帧的固定码矢能量时,通过下式对当前帧的固定码矢执行能量平滑:
ene1=(1+es)ene,且ene1≤ene,
以及在当前帧的固定码矢能量不小于上一帧的固定码矢能量时,通过下式对当前帧的固定码矢执行能量平滑:
ene1=(1-es)ene,且ene1≥ene,
其中,ene为当前帧的缩放的固定码矢能量,且ene=g2ccT,其中,g为固定码本增益,c为固定码本激励,ene1为平滑后的固定码矢能量;
缩放因子计算子模块,用于通过下式计算固定码矢的缩放因子k:
k = ene 1 ene ;
乘法器,用于将固定码矢乘以该缩放因子,得到经过能量平滑后的固定码矢。
本发明为解决其技术问题还提出一种用于宽带语音解码的方法,包括如下步骤:
a、对语音信号的解码参数中的导谱频率索引进行解码处理,得到合成滤波器的转移函数;
b、通过上述用于宽带语音解码中噪声增强后处理的方法得到激励信号;
c、使用步骤a得到的转移函数对步骤b得到的激励信号进行合成滤波,输出语音信号。
本发明为解决其技术问题还提出一种用于宽带语音解码的解码器,包括:
参数处理模块,用于对语音信号的解码参数中的导谱频率索引进行解码处理,得到合成滤波器的转移函数;
如上所述的用于宽带语音解码中噪声增强后处理的装置,用于得到激励信号;
合成滤波器,用于使用参数解码模块得到的转移函数对噪声增强后处理装置得到的激励信号进行合成滤波,输出语音信号。
本发明通过解码语音信号的噪声因子的特性对固定码矢的能量进行平滑,从而达到噪声增强的目的。本发明能够适用于各种语音编解码器,算法运算复杂度比较低,并且不额外增加传输码率。
附图说明
下面将结合附图及实施例对本发明作进一步说明,附图中:
图1是宽带语音编解码系统的示意框图;
图2是本发明一个实施例的解码器的原理性示意框图;
图3是本发明一个实施例的用于宽带语音解码中噪声增强后处理的方法的流程图;
图4是图3中步骤330的具体实现流程图;
图5是本发明一个实施例的用于宽带语音解码中噪声增强后处理的装置的逻辑框图;
图6是图5中噪声检测模块的具体实现逻辑框图;
图7是图5中能量平滑模块的具体实现逻辑框图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
图1示出了宽带语音编解码系统100。如图1所示,语音信号经过语音编码器110(包括源编码器111和参数编码器112)编码成一系列的参数,这些参数通过信道120传送到解码端,经过解码器130(包括参数解码器131和源解码器132)解码还原出合成语音信号。
本发明主要体现在ACELP(Algebraic Code Excited Linear Prediction,代数码激励线性预测)编码模式的解码端,即解码器130中。本发明根据语音信号帧的噪声特性对固定码矢进行能量平滑处理,达到噪声增强的目的。众所周知,自适应码书表征了信号的周期性,它的作用相当于一个基音预测器,而固定码书则表征了信号的长时相关性,它相当于一个长时预测器。也即,自适应码矢更多的表征了信号中语音信号的信息,而固定码矢则更多的表征了信号中非语音信号的信息,所以对固定码矢根据语音信号帧的噪声特性进行能量平滑处理,能够起到噪声增强的目的。以下将结合图2所示的根据本发明一个实施例的解码器200详细介绍本发明的技术方案。
如图2所示,解码器200主要包括ACELP解码参数模块210、参数处理模块220、噪因增强后处理模块230和合成滤波器240。ACELP解码参数模块210获取数字语音信号的解码参数,包括ISF索引、码本索引、基因索引、自适应码本增益和固定码本增益。参数处理模块220对解码参数中的ISF索引进行解码处理,得到合成滤波器240的转移函数
Figure BDA00002358692900101
具体如图2所示,ISF索引分别经过解码ISP(Immitance Spectrum Pairs,导抗频谱对)模块221、解码ISP并插值模块222和ISP参数转化为LP系数模块223的处理,得到
Figure BDA00002358692900102
即为合成滤波器240的转移函数。有关ISF索引的解码处理的具体实现过程,可以通过现有技术中各种合适的技术手段来实现,且并非本发明技术方案的关注点,故在此不再给出详细描述。
本发明的技术方案的具体实现体现在噪声增强后处理模块230,用于根据语音信号帧的噪声特性对固定码矢进行能量平滑处理,达到噪声增强的目的。具体参见图2,将解码参数基音索引传入解码自适应码本模块231,然后将得到的码矢通过放大器232用自适应码本增益b作为缩放因子进行缩放,即得到缩放后的自适应码矢C(n)。将解码参数码本索引传入解码固定码本模块233解码,然后将得到的码矢通过放大器234用固定码本增益g作为缩放因子进行缩放,即得到缩放后的固定码矢V(n)。噪声检测模块235利用从参数处理模块220得到的解码并插值的ISP系数求得当前谱包络和一个长时平均谱包络之间的距离,并根据这个距离计算得到噪声因子γn(具体的计算步骤将在后续描述中给出)。能量平滑模块236对缩放后的固定码矢V(n)进行能量平滑处理,能量平滑的主要参数是噪声检测模块235提供的噪声因子γn和自适应码本增益b(具体的处理过程将在后续描述中给出)。经过能量平滑后的固定码矢V’(n)和缩放的自适应码矢C(n)通过加法器237,得到激励信号ex(n)。激励信号ex(n)经过合成滤波器240使用参数处理模块220提供的转移函数
Figure BDA00002358692900103
进行滤波,即得到合成语音信号。该合成语音信号由于经过了噪声增强处理,语音质量得到提高。
结合以上描述,本发明提出一种用于宽带语音解码中噪声增强后处理的方法和装置。图3示出了根据本发明一个实施例的用于宽带语音解码中噪声增强后处理的方法300的流程图。如图3所示,该方法300包括如下步骤:
步骤310中,检测当前帧的语音/非语音特性,计算出当前帧的噪声因子γn
具体实施例中,本发明通过求得当前谱包络与一个长时平均谱包络之间的距离dq来判断当前帧的语音/非语音特性。当此距离dq的值越大,说明当前帧的语音特性越明显;反之,若此距离dq的值越小,就说明非语音特性越明显,亦可说是噪声特性越明显。距离dq的计算如下:
d q ( n ) = &Sigma; j = 0 N p - 1 &Sigma; m = 0 N sfr - 1 | q &OverBar; L , j ( n ) - q j ( m , n ) | | q &OverBar; L , j ( n ) | ,
其中, q &OverBar; L , j ( n ) = &beta; q q &OverBar; L , j ( n - 1 ) + ( 1 - &beta; q ) q j [ N sfr - 1 , n ] ,
其中,βq=0.25,
Figure BDA00002358692900113
为第n帧的第m子帧的LSP系数,
Figure BDA00002358692900114
为第n帧的长时平均LSP系数,Np为LP阶数,Nsfr为一帧中子帧的数目。
由于dq的数值很大,故本发明的一个优选实施例中,对距离dq进行如下缩放,得到噪声因子γn
γn=1.35-(dq/50),且0≤γn≤1.3。
当噪声因子γn的值越大,说明噪声特性越明显。
随后步骤320中,确定噪声因子γn是否大于一个预设的门限值th。
由于当噪声因子γn的值较小时,说明当前帧语音特性很强,此时就不能进行噪声增强,否则会产生负效应,因此本发明对噪声因子γn设置一个门限值th=1。
若在步骤320中确定噪声因子γn大于此门限值th时,则执行步骤330,对当前帧的固定码矢V(n)做能量平滑处理以得到经过能量平滑后的固定码矢V’(n),否则不做能量平滑处理。
随后步骤340中,将当前帧的自适应码矢C(n)与该经过能量平滑后的固定码矢V’(n)相加,合成激励信号ex(n)。激励信号ex(n)经过合成滤波器滤波,即得到合成语音信号。
图4是图3中步骤330的具体实施例的流程图。如图4所示,步骤330中对当前帧的固定码矢V(n)做能量平滑处理具体通过如下方法实现:
步骤331中,基于当前帧的噪声因子和自适应码矢增益计算能量平滑因子:
es=α*(γn-1),
其中,es为能量平滑因子,γn为噪声因子,α=1-b,且b为自适应码本增益。
随后步骤332中,确定当前帧的固定码矢能量是否小于上一帧的固定码矢能量。
若在步骤332中确定当前帧的固定码矢能量小于上一帧的固定码矢能量,则执行步骤333,通过下式对当前帧的固定码矢执行能量平滑:
ene1=(1+es)ene,且ene1≤ene,
其中,ene为当前帧的缩放的固定码矢能量,且ene=g2ccT,其中,g为固定码本增益,c为固定码本激励,ene1为平滑后的固定码矢能量。
若在步骤332中确定当前帧的固定码矢能量不小于上一帧的固定码矢能量,则执行步骤334,通过下式对当前帧的固定码矢执行能量平滑:
ene1=(1-es)ene,且ene1≥ene。
随后步骤335中,将平滑后的固定码矢能量与原始的能量相比并开方,得到固定码矢的缩放因子k:
k = ene 1 ene .
随后步骤336中,将固定码矢V(n)乘以该缩放因子k,得到经过能量平滑后的固定码矢V’(n)。
该经过能量平滑后的固定码矢V’(n)与自适应码矢C(n)相加,即为最后的激励信号ex(n)。
图5示出了根据本发明一个实施例的用于宽带语音解码中噪声增强后处理的装置400的逻辑框图。如图5所示,用于宽带语音解码中噪声增强后处理的装置400包括码矢计算模块410、噪声检测模块420、能量平滑模块430和合成模块440。其中,码矢计算模块410用于处理语音信号中每一帧的解码参数,分别计算出固定码矢V(n)和自适应码矢C(n)。具体实施例中,码矢计算模块410进一步包括自适应码矢计算模块411和固定码矢计算模块412。自适应码矢计算模块411将解码参数中的基音索引解码并用自适应码本增益b作为缩放因子进行缩放,得到缩放后的自适应码矢C(n)。固定码矢计算模块412将解码参数中的码本索引解码并用固定码本增益g作为缩放因子进行缩放,得到缩放后的固定码矢V(n)。
噪声检测模块420通过利用解码并插值的ISP系数求得当前谱包络和一个长时平均谱包络之间的距离来检测当前帧的语音/非语音特性,并根据这个距离计算得到噪声因子γn。一个具体实施例中,如图6所示,噪声检测模块420进一步包括距离计算子模块421和噪声因子计算子模块422。距离计算子模块421通过下式计算当前谱包络和一个长时平均谱包络之间的距离dq
d q ( n ) = &Sigma; j = 0 N p - 1 &Sigma; m = 0 N sfr - 1 | q &OverBar; L , j ( n ) - q j ( m , n ) | | q &OverBar; L , j ( n ) | ,
其中, q &OverBar; L , j ( n ) = &beta; q q &OverBar; L , j ( n - 1 ) + ( 1 - &beta; q ) q j [ N sfr - 1 , n ] ,
其中,βq=0.25,
Figure BDA00002358692900133
为第n帧的第m子帧的LSP系数,为第n帧的长时平均LSP系数,Np为LP阶数,Nsfr为一帧中子帧的数目。噪声因子计算模块422通过下式对距离计算子模块412计算出的距离进行缩放,得到当前帧的噪声因子γn
γn=1.35-(dq/50),且0≤γn≤1.3。
能量平滑模块430用于确定噪声检测模块420得到的噪声因子γn是否大于一预设的门限值th,并在噪声因子γn大于预设的门限值th时,对当前帧的固定码矢V(n)执行能量平滑处理,得到经过能量平滑后的固定码矢V’(n)。由于当噪声因子γn的值较小时,说明当前帧语音特性很强,此时就不能进行噪声增强,否则会产生负效应,因此本发明对噪声因子γn设置一个门限值th=1。当噪声因子γn>1时,就对固定码矢V(n)执行能量平滑,否则就不做处理。
一个具体实施例中,如图7所示,能量平滑模块430进一步包括能量平滑因子计算子模块431、能量平滑子模块432、缩放因子计算子模块433和乘法器434。能量平滑因子计算子模块431基于当前帧的噪声因子γn和自适应码矢增益b计算能量平滑因子es=α*(γn-1),且α=1-b。能量平滑子模块432用于确定当前帧的固定码矢能量是否小于上一帧的固定码矢能量,并据此对当前帧的固定码矢执行能量平滑。在当前帧的固定码矢能量小于上一帧的固定码矢能量时,能量平滑子模块432通过下式对当前帧的固定码矢执行能量平滑:
ene1=(1+es)ene,且ene1≤ene,
其中,ene为当前帧的缩放的固定码矢能量,且ene=g2ccT,其中,g为固定码本增益,c为固定码本激励,ene1为平滑后的固定码矢能量。在当前帧的固定码矢能量不小于上一帧的固定码矢能量时,能量平滑子模块432通过下式对当前帧的固定码矢执行能量平滑:
ene1=(1-es)ene,且ene1≥ene。
缩放因子计算子模块433将平滑后的固定码矢能量与原始的能量相比并开方,得到固定码矢的缩放因子k:
k = ene 1 ene .
乘法器434将固定码矢V(n)乘以该缩放因子k,得到经过能量平滑后的固定码矢V’(n)。
最后,如图5所示,合成模块440将当前帧的自适应码矢C(n)与经过能量平滑后的固定码矢V’(n)相加,合成激励信号ex(n)。激励信号ex(n)经过合成滤波器滤波,即得到合成语音信号。
本发明的噪声增强后处理是通过解码语音信号的噪声因子的特性对固定码矢的能量进行平滑,从而达到噪声增强的目的。因而,本发明能够适用于各种语音编解码器,算法运算复杂度比较低,并且不额外增加传输码率。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种用于宽带语音解码中噪声增强后处理的方法,其特征在于,包括如下步骤:
S1、检测当前帧的语音/非语音特性,计算出当前帧的噪声因子;
S2、确定该噪声因子是否大于一预设的门限值;
S3、在噪声因子大于预设的门限值时,对当前帧的固定码矢执行能量平滑处理,得到经过能量平滑后的固定码矢;
S4、将当前帧的自适应码矢与该经过能量平滑后的固定码矢相加,合成激励信号。
2.根据权利要求1所述的方法,其特征在于,所述步骤S1进一步包括:
S11、通过下式计算当前谱包络和一个长时平均谱包络之间的距离dq
d q ( n ) = &Sigma; j = 0 N p - 1 &Sigma; m = 0 N sfr - 1 | q &OverBar; L , j ( n ) - q j ( m , n ) | | q &OverBar; L , j ( n ) | ,
其中, q &OverBar; L , j ( n ) = &beta; q q &OverBar; L , j ( n - 1 ) + ( 1 - &beta; q ) q j [ N sfr - 1 , n ] ,
其中,βq=0.25,
Figure FDA00002358692800013
为第n帧的第m子帧的LSP系数,为第n帧的长时平均LSP系数,Np为LP阶数,Nsfr为一帧中子帧的数目;
S12、通过下式对该距离进行缩放,得到当前帧的噪声因子:
γn=1.35-(dq/50),
其中,γn为当前帧的噪声因子,且0≤γn≤1.3。
3.根据权利要求2所述的方法,其特征在于,所述预设的门限值为1。
4.根据权利要求1所述的方法,其特征在于,所述步骤S3进一步包括:
S31、基于当前帧的噪声因子和自适应码矢增益计算能量平滑因子:
ec=α*(γn-1),
其中,es为能量平滑因子,γn为噪声因子,α=1-b,且b为自适应码本增益;
S32、确定当前帧的固定码矢能量是否小于上一帧的固定码矢能量;
S33、在当前帧的固定码矢能量小于上一帧的固定码矢能量时,通过下式对当前帧的固定码矢执行能量平滑:
ene1=(1+es)ene,且ene1≤ene,
其中,ene为当前帧的缩放的固定码矢能量,且ene=g2ccT,其中,g为固定码本增益,c为固定码本激励,ene1为平滑后的固定码矢能量;
S34、在当前帧的固定码矢能量不小于上一帧的固定码矢能量时,通过下式对当前帧的固定码矢执行能量平滑:
ene1=(1-es)ene,且ene1≥ene;
S35、通过下式计算固定码矢的缩放因子k:
k = ene 1 ene ;
S36、将固定码矢乘以该缩放因子,得到经过能量平滑后的固定码矢。
5.一种用于宽带语音解码中噪声增强后处理的装置,其特征在于,包括:
码矢计算模块,用于处理语音信号中每一帧的解码参数,分别计算出固定码矢和自适应码矢;
噪声检测模块,用于检测当前帧的语音/非语音特性,计算出当前帧的噪声因子;
能量平滑模块,用于确定该噪声因子是否大于一预设的门限值,并在噪声因子大于预设的门限值时,对当前帧的固定码矢执行能量平滑处理,得到经过能量平滑后的固定码矢;
合成模块,用于将当前帧的自适应码矢与该经过能量平滑后的固定码矢相加,合成激励信号。
6.根据权利要求5所述的装置,其特征在于,所述码矢计算模块进一步包括:
固定码矢计算模块,用于将码本索引解码并用固定码本增益作为缩放因子进行缩放,得到缩放后的所述固定码矢;
自适应码矢计算模块,用于将基音索引解码并用自适应码本增益作为缩放因子进行缩放,得到缩放后的所述自适应码矢。
7.根据权利要求5所述的装置,其特征在于,所述噪声检测模块进一步包括:
距离计算子模块,用于通过下式计算当前谱包络和一个长时平均谱包络之间的距离dq
d q ( n ) = &Sigma; j = 0 N p - 1 &Sigma; m = 0 N sfr - 1 | q &OverBar; L , j ( n ) - q j ( m , n ) | | q &OverBar; L , j ( n ) | ,
其中, q &OverBar; L , j ( n ) = &beta; q q &OverBar; L , j ( n - 1 ) + ( 1 - &beta; q ) q j [ N sfr - 1 , n ] ,
其中,βq=0.25,
Figure FDA00002358692800033
为第n帧的第m子帧的LSP系数,
Figure FDA00002358692800034
为第n帧的长时平均LSP系数,Np为LP阶数,Nsfr为一帧中子帧的数目;
噪声因子计算子模块,用于通过下式对距离计算子模块计算出的距离进行缩放,得到当前帧的噪声因子:
γn=1.35-(dq/50),
其中,γn为当前帧的噪声因子,且0≤γn≤1.3。
8.根据权利要求5所述的装置,其特征在于,所述能量平滑模块进一步包括:
能量平滑因子计算子模块,用于基于当前帧的噪声因子和自适应码矢增益计算能量平滑因子:
es=α*(γn-1),
其中,es为能量平滑因子,γn为噪声因子,α=1-b,且b为自适应码本增益;
能量平滑子模块,用于确定当前帧的固定码矢能量是否小于上一帧的固定码矢能量,并在当前帧的固定码矢能量小于上一帧的固定码矢能量时,通过下式对当前帧的固定码矢执行能量平滑:
ene1=(1+es)ene,且ene1≤ene,
以及在当前帧的固定码矢能量不小于上一帧的固定码矢能量时,通过下式对当前帧的固定码矢执行能量平滑:
ene1=(1-es)ene,且ene1≥ene,
其中,ene为当前帧的缩放的固定码矢能量,且ene=g2ccT,其中,g为固定码本增益,c为固定码本激励,ene1为平滑后的固定码矢能量;
缩放因子计算子模块,用于通过下式计算固定码矢的缩放因子k:
k = ene 1 ene ;
乘法器,用于将固定码矢乘以该缩放因子,得到经过能量平滑后的固定码矢。
9.一种用于宽带语音解码的方法,其特征在于,包括如下步骤:
a、对语音信号的解码参数中的导谱频率索引进行解码处理,得到合成滤波器的转移函数;
b、通过根据权利要求1-4中任一项所述的方法得到激励信号;
c、使用步骤a得到的转移函数对步骤b得到的激励信号进行合成滤波,输出语音信号。
10.一种用于宽带语音解码的解码器,其特征在于,包括:
参数处理模块,用于对语音信号的解码参数中的导谱频率索引进行解码处理,得到合成滤波器的转移函数;
根据权利要求5-8中任一项所述的噪声增强后处理的装置,用于得到激励信号;
合成滤波器,用于使用参数解码模块得到的转移函数对噪声增强后处理装置得到的激励信号进行合成滤波,输出语音信号。
CN2012104360810A 2012-11-05 2012-11-05 用于宽带语音解码中噪声增强后处理的方法及装置 Pending CN102968997A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2012104360810A CN102968997A (zh) 2012-11-05 2012-11-05 用于宽带语音解码中噪声增强后处理的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2012104360810A CN102968997A (zh) 2012-11-05 2012-11-05 用于宽带语音解码中噪声增强后处理的方法及装置

Publications (1)

Publication Number Publication Date
CN102968997A true CN102968997A (zh) 2013-03-13

Family

ID=47799101

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012104360810A Pending CN102968997A (zh) 2012-11-05 2012-11-05 用于宽带语音解码中噪声增强后处理的方法及装置

Country Status (1)

Country Link
CN (1) CN102968997A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107369454A (zh) * 2014-03-21 2017-11-21 华为技术有限公司 语音频码流的解码方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101533639A (zh) * 2008-03-13 2009-09-16 华为技术有限公司 语音信号处理方法及装置
CN101572093A (zh) * 2008-04-30 2009-11-04 北京工业大学 一种转码方法和装置
CN101582263A (zh) * 2008-05-12 2009-11-18 华为技术有限公司 语音解码中噪音增强后处理的方法和装置
US7848922B1 (en) * 2002-10-17 2010-12-07 Jabri Marwan A Method and apparatus for a thin audio codec

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7848922B1 (en) * 2002-10-17 2010-12-07 Jabri Marwan A Method and apparatus for a thin audio codec
CN101533639A (zh) * 2008-03-13 2009-09-16 华为技术有限公司 语音信号处理方法及装置
CN101572093A (zh) * 2008-04-30 2009-11-04 北京工业大学 一种转码方法和装置
CN101582263A (zh) * 2008-05-12 2009-11-18 华为技术有限公司 语音解码中噪音增强后处理的方法和装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107369454A (zh) * 2014-03-21 2017-11-21 华为技术有限公司 语音频码流的解码方法及装置
US11031020B2 (en) 2014-03-21 2021-06-08 Huawei Technologies Co., Ltd. Speech/audio bitstream decoding method and apparatus

Similar Documents

Publication Publication Date Title
JP3481390B2 (ja) 短期知覚重み付けフィルタを使用する合成分析音声コーダに雑音マスキングレベルを適応する方法
CN104021796B (zh) 语音增强处理方法和装置
CN111179953B (zh) 编码音频的编码器、音频发送系统和确定校正值的方法
KR101698905B1 (ko) 정렬된 예견 부를 사용하여 오디오 신호를 인코딩하고 디코딩하기 위한 장치 및 방법
CN105009209A (zh) 用于降低时域解码器中的量化噪声的装置和方法
US9082398B2 (en) System and method for post excitation enhancement for low bit rate speech coding
CN100578618C (zh) 一种解码方法及装置
EP3058569B1 (en) Concept for encoding an audio signal and decoding an audio signal using deterministic and noise like information
CN105745705A (zh) 使用语音相关的频谱整形信息编码音频信号和解码音频信号的概念
EP2608200B1 (en) Estimation of speech energy based on code excited linear prediction (CELP) parameters extracted from a partially-decoded CELP-encoded bit stream
JP3806344B2 (ja) 定常雑音区間検出装置及び定常雑音区間検出方法
CN101582263B (zh) 语音解码中噪音增强后处理的方法和装置
EP1442455B1 (en) Enhancement of a coded speech signal
CN102968997A (zh) 用于宽带语音解码中噪声增强后处理的方法及装置
CN101533639B (zh) 语音信号处理方法及装置
US20130096913A1 (en) Method and apparatus for adaptive multi rate codec
CN102930872A (zh) 用于宽带语音解码中基音增强后处理的方法及装置
Srivastava et al. Performance evaluation of Speex audio codec for wireless communication networks
Li et al. A variable-bit-rate speech coding algorithm based on enhanced mixed excitation linear prediction
CN101266798B (zh) 一种在语音解码器中进行增益平滑的方法及装置
Villette et al. A 2.4/1.2 kbps SB-LPC based speech coder: the Turkish NATO STANAG candidate
Elsayed et al. CS-ACELP Speech Coding Simulink Modeling, Verification, and Optimized DSP Implementation on DSK 6713
Liu et al. Speech VTF similarity property and its application on coding analysis
Lukasiak et al. Low rate speech coding incorporating simultaneously masked spectrally weighted linear prediction
Rashed et al. The effect of weight factor on the performance of G. 729A speech coder

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20130313