CN101572092B - 编解码端的固定码本激励的搜索方法及装置 - Google Patents

编解码端的固定码本激励的搜索方法及装置 Download PDF

Info

Publication number
CN101572092B
CN101572092B CN2008101056155A CN200810105615A CN101572092B CN 101572092 B CN101572092 B CN 101572092B CN 2008101056155 A CN2008101056155 A CN 2008101056155A CN 200810105615 A CN200810105615 A CN 200810105615A CN 101572092 B CN101572092 B CN 101572092B
Authority
CN
China
Prior art keywords
codebook
fixed codebook
echo signal
excitations
constant
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2008101056155A
Other languages
English (en)
Other versions
CN101572092A (zh
Inventor
胡瑞敏
张勇
周成
高戈
张德军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JIANGSU YALONG NEW MATERIAL TECHNOLOGY Co.,Ltd.
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN2008101056155A priority Critical patent/CN101572092B/zh
Publication of CN101572092A publication Critical patent/CN101572092A/zh
Application granted granted Critical
Publication of CN101572092B publication Critical patent/CN101572092B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

一种编解码端的固定码本激励的搜索方法及装置,其包括:在编码端,获得当前输入子帧固定码本激励搜索的目标信号;对所述目标信号进行格型矢量量化处理,根据处理结果确定搜索获得的固定码本激励。在解码端,接收编码码流,获取编码码流中的固定码本索引;并根据所述的固定码本激励索引确定对应的固定码本激励,且所述的固定码本激励为经过格型矢量量化处理获得的固定码本激励。本发明实施例中,由于其使用格型矢量量化的处理方式获得固定码本激励,因而,可以有效减少对存储空间的占用,降低基于固定码本激励搜索的编解码过程的实现复杂度,并可以较好地提升语音信息的音质效果。

Description

编解码端的固定码本激励的搜索方法及装置
技术领域
本发明涉及编解码技术领域,尤其涉及编解码过程中的固定码本激励搜索技术。
背景技术
CELP(Code Excited Linear Prediction,码本激励线性预测)语音编码器是对每个以一定时间划分声音的帧进行线性预测,用存储过去的驱动声源的自适应码本和存储多个噪声矢量的固定码本,对每帧线性预测的预测残差(激励信号)进行编码。CELP以高质量的合成语音以及优良的抗噪声和多次转接性能,在低速率语音编码上得到了广泛的应用。
在CELP语音编码器中,如图1所示,具体是采用一个自适应码本中的码字(即自适应码本)逼近语音长时周期性(基音)结构,采用一个固定的随机码本中的码字(即固定码本)逼近语音经过短时、长时预测后的残差信号;为此,在CELP编解码过程中,需要进行固定码本的搜索,以便于确定用于逼近残差信号的固定码本中的码矢量。目前,是采用加权输入语音和加权重构语音之间的均方差最小化准则进行固定码本中的码矢量的搜索。对应的,在解码端也需要获得相应的固定码本,以进行相应的解码操作。
在实现本发明过程中,发明人发现现有技术中,搜索确定的固定码本激励为脉冲串,使得生成的噪声矢量比较简单,进而导致相应的编解码过程的复杂程度增加,在提升音质方面效果不佳。
发明内容
本发明的实施例提供了一种编解码端的固定码本激励的搜索方法及装置,从而降低相应的基于固定码本搜索的编解码过程的实现复杂度。
一种编码端的固定码本激励搜索方法,包括:
获得当前输入子帧固定码本激励搜索的目标信号;
对所述目标信号进行格型矢量量化处理,根据处理结果确定搜索获得的固定码本激励。
一种编码端的固定码本激励搜索装置,包括:
目标信号获取单元,用于获得当前输入子帧固定码本激励搜索的目标信号;
第一固定码本获取单元,用于对所述目标信号获取单元获取的目标信号进行格型矢量量化处理,并根据处理结果确定搜索获得的固定码本激励。
一种解码端的固定码本获取方法,包括:
接收编码码流,获取编码码流中的固定码本索引;
根据所述的固定码本索引确定对应的固定码本激励,且所述的固定码本激励为经过格型矢量量化处理获得的固定码本激励。
一种解码端的固定码本获取装置,包括:
固定码本索引获取单元,用于从接收到的编码码流中解析获取编码码流中的固定码本索引;
第二固定码本获取单元,用于根据所述固定码本索引获取单元获取的固定码本索引确定对应的固定码本激励,且所述的固定码本激励为经过格型矢量量化处理获得的固定码本激励。
由上述本发明的实施例提供的技术方案可以看出,由于其使用格型矢量量化的处理方式获得固定码本激励,因而,可以有效减少对存储空间的占用,降低基于固定码本搜索的编解码过程的实现复杂度,并可以较好地提升语音信息的音质效果。
附图说明
图1为现有技术提供的编码原理示意图;
图2为本发明实施例提供的编码原理示意图;
图3为本发明实施例提供的固定码本搜索过程示意图;
图4为本发明实施例中的Voronoi扩展编码原理框图;
图5为本发明实施例提供的解码原理示意图;
图6为本发明实施例中的Voronoi扩展解码原理框图;
图7为本发明实施例提供的装置的结构示意图。
具体实施方式
本发明实施例提供的固定码本激励搜索方案主要采用格型矢量量化的处理方式进行固定码本激励搜索,具体可以应用于CELP编解码处理过程中进行相应的固定码本激励搜索。
进一步讲,在编码端相应的固定码本激励搜索过程包括:获得当前输入子帧固定码本激励搜索的目标信号;对获得的目标信号进行格型矢量量化,根据量化结果确定搜索获得的固定码本激励。
相应的,在进行格型矢量量化处理过程中,具体可以为:在当前编码比特数小于预定值的情况下,在频域对获得的目标信号进行格型矢量量化处理,在当前编码比特数不小于预定值的情况下,在时域对所述目标信号进行格型矢量量化处理。
在上述格型矢量量化处理过程中,若需要在频域对获得的目标信号进行格型矢量量化处理,则可以在将所述目标信号转换到频域后,再对转换到频域的目标信号进行格型矢量量化处理,以获得格型矢量量化处理结果。
本发明实施例中,具体可以通过对进行格型矢量量化处理后的目标信号进行逆加权合成滤波处理获得固定码本激励(即固定码本激励信号);并且,还可以根据获得的固定码本激励及所述当前输入子帧固定码本激励搜索的目标信号计算确定固定码本增益。
与上述在编码端采用的固定码本激励搜索方式对应,相应的在解码端的固定码本激励获取方式可以包括:接收编码码流,获取编码码流中的固定码本索引;并根据所述的固定码本索引确定对应的固定码本激励,且所述的固定码本激励为经过格型矢量量化处理获得的固定码本激励。
在解码端,在解码获得相应的固定码本索引后,具体可以根据该固定码本索引获得对应的固定码本,将所述固定码本进行逆加权合成滤波处理获得固定码本激励。其中,在根据所述固定码本索引获得对应的固定码本的过程具体可以包括:若根据码流中的信息确定在编码端的编码比特数小于预定值,则在根据固定码本索引确定量化的频域目标信号后,将该量化的频域目标信号转换为量化的时域目标信号作为所述固定码本激励;否则,将根据固定码本索引确定量化的时域目标信号作为所述固定码本激励。
可选地,若编码端选择在频域对目标信号进行格型矢量量化处理(即根据码流中的信息确定在编码端的编码比特数小于预定值),则在解码端为了避免因量化比特数不够导致出现高频频谱空洞的情况,还可以对进行格型矢量量化处理后的目标信号进行噪声填充处理。
在解码端,还可以根据解码获得的增益码本序号获得相应的固定码本增益及自适应码本增益。
为便于对本发明实施例的理解,下面将结合具体的编码及解码过程,对相应的固定码本激励搜索方式的应用进行详细的说明。
(一)编码过程
如图2所示,相应的编码过程包括:
步骤1,对输入的音频信号进行预处理;
为避免处理中产生溢出和不必要的低频部分,具体可以将输入样点值除以2,并通过一个截止频率为60Hz的高通滤波器;例如,可以通过一个二阶极/零点滤波器Hhl(z)实现相应的预处理,该滤波器的参数为:
H hl ( z ) = 0.989502 - 1.979004 z - 1 + 0.989502 z - 2 1 - 1.978882 z - 1 + 0.979126 z - 2 ;
步骤2,对经过预处理后的输入信号进行线性预测分析;
具体可以为计算输入信号的一组16阶的LPC系数
Figure S2008101056155D00052
该组LPC系数将用于后续感知加权滤波器;
步骤3,根据获得的LPC系数进行目标信号的计算;
具体要以将输入信号通过感知加权滤波器W(z)(该感知加权滤波器W(z)利用LPC系数对输入信号进行处理)并减掉感知加权合成滤波器W′(z)的零输入响应得到用于自适应码本搜索的目标信号x(n),n表示矢量的长度,在此可以表示多个时间点;其中,W(z)与W′(z)的系统函数分别为:
W ( z ) = A ( z / γ 1 ) 1 - β 1 z - 1 , W ′ ( z ) = 1 A ^ ( z ) A ( z / γ 1 ) 1 - β 1 z - 1 , 其中, A ( Z ) = 1 + Σ i = 1 16 a i z - i , A ^ ( Z ) = 1 + Σ i = 1 16 a ^ i z - i ,
Figure S2008101056155D00057
为步骤2获得的线性预测系数,γ1=0.92为感知加权因子,β1=0.68为常数。
步骤4,根据获得的目标信号进行自适应码本的搜索,获得相应的自适应激励信号及自适应码本增益gp
自适应码本搜索的准则是使原始语音和重构语音之间均方加权误差最小化,即:使R(k)最大,此时,相应的R(k)为:
R ( k ) = Σ n = 0 63 x ( n ) y k ( n ) ( Σ n = 0 63 y k ( n ) y k ( n ) ) 1 2 , 其中,x(n)为目标信号,yk(n)是在延时k的过去滤波激励,N为子帧长度;
相应的自适应码本增益gp的计算公式如下:
g p = Σ n = 0 63 x ( n ) y ( n ) Σ n = 0 63 y ( n ) y ( n ) , 其中,x(n)是目标信号,y(n)是自适应码本矢量滤波信号(即y(n)=v(n)*h(n)),v(n)为自适应码本激励,h(n)为加权合成滤波器的 H ( z ) = W ( z ) A ^ ( z ) 的脉冲响应,N为子帧长度。
步骤5,根据目标信号及自适应码本增益gp进行固定码本激励的搜索;
如图3所示,相应的固定码本激励的搜索过程具体包括以下过程:
(1)根据自适应码本矢量滤波信号y(n)和自适应码本增益gp,计算当前输入子帧的固定码本激励搜索的目标信号x′(n),并将x′(n)存放于数组xn2[i],i=0~N-1;
相应的目标信号为:x′(n)=x(n)-gpy(n),其中,x(n)为目标信号,y(n)是自适应码书矢量滤波输出结果,gp是自适应码本增益;
(2)根据编码比特率选择固定码本激励搜索的编码模式,即根据码率的大小选择编码模式,编码模式包括频域的格型矢量量化处理和时域的格型矢量量化处理;
具体可以为:当编码比特数较少,可以为低于预定值时选择模式0,模式0表示在频域对目标信号x′(n)利用格型矢量量化进行编码;当编码比特数较多(即高于预定值)时选择模式1,模式1表示在时域对目标信号x′(n)利用格型矢量量化进行编码;其中,若选择模式0,则执行过程(3),若选择模式1,则执行过程(7);
(3)将保存于数组xn2[i]中的目标信号转换到频域;
具体可以对相应的目标信号进行DCT-IV(离散余弦变换)转换到频域,并将转换到频域的信息存放于数组xn2_dct[i];
具体地,相应转换到频域的信息可以为:
X ( k ) = 2 N Σ i = 1 N - 1 x ( i ) cos ( π 4 N ( 2 i + 1 ) ( 2 k + 1 ) ) , 其中,k=0~N-1,N=64;
(4)对信号xn2_dct[i]进行相应的自适应低频预整形处理,通过对0~1.6KHz低频部分进行预整形处理,以平滑频谱去除共振峰影响从而更好的量化低频频谱,相应的预整形处理后的结果存放于数组xn2_dct[i],i=0~N-1;
相应的预整形处理的过程具体可以包括:计算0~1.6KHz低频部分每8维矢量分成一个波段,然后计算该波段的能量Em,m为位置索引,并令最大的能量为Emax,然后逐波段计算比率Rm=(Emax/Em)1/4,如果Rm>10,那么使Rm=10(最大增益为20db);如果Rm>Rm-1,那么使Rm=Rm-1,最后根据各波段计算得到的比率乘以各个需要调整能量的波段的能量,以实现预整形;
(5)使用格型矢量量化(基于RE8格)对信号xn2_dct[i]进行量化,得到噪音因子与量化信号,其中,噪音因子存放于变量fac_ns中,量化信号存放于数组y2_dct[i]中,i=0~N-1;
(6)对信号y2_dct[i]进行去预整形处理,并将处理结果存放于数组sub2_y2[i],i=0~N-1;
该去预整形处理的过程可以为:计算0~1.6KHz低频部分每8维矢量分成一个波段,然后计算该波段的能量Em,m为位置索引,并令最大的能量为Emax,然后逐波段计算比率Rm=(Emax/Em)1/2,如果Rm>10,则使Rm=10(最大增益为20db);如果Rm>Rm-1,那么使Rm=Rm-1,最后根据各波段计算得到的比率除以各个需要能量调整的波段的能量,得到去预整形后的波段;
(7)使用格型矢量量化对目标信号xn2[i]进行量化,并将量化索引写入压缩码流,得到量化后的目标信号,存放于数组sub2_y2[i],i=0~N-1,执行过程(8);
(8)进行固定码本增益的计算;
由于量化对象为目标信号,而分析合成法(即合成语音)需要用到激励信号,因此将量化后的目标信号sub2_y2[i]通过逆加权合成滤波器 H ′ ( z ) = 1 H ( z ) 的处理得到固定码本激励信号c(n)(即搜索确定的固定码本激励),并将其存放于数组code[i]中,i=0~N-1;
之后,再计算y′(n)=c(n)*h(n),其中,h(n)为加权合成滤波器的 H ( z ) = W ( z ) A ^ ( z ) 的脉冲响应,该信号y′(n)将用于后续固定码本增益计算;
最后,通过存放于数组xn2[i]中的目标信号x′(n)和y′(n)计算固定码本增益gc,相应的固定码本增益可以为:
g c = Σ n = 0 63 x ( n ) y ′ ( n ) Σ n = 0 63 y ′ ( n ) y ′ ( n ) .
在上述处理过程中,xn2[i]=x为要量化的N维源矢量,C表示从RE8格点阵A得到的基本码本,且将mA定义为RE8格点阵A按整数因子m>0缩放所得,则如4所示,相应的格型矢量量化的实现过程可以包括:
(1)确定在无穷RE8点阵A中输入矢量x的最近邻点y;
(2)确定y是否在基本码本C中(基本码本C包括Q0,Q2,Q3,Q4四个码本,且 Q 2 ⋐ Q 3 )若在,则直接利用基本码本量化x,并将码本号n设为0,若不在,则将y看作是局外点,采用Voronoi(一种图结构)扩展的方法进行编码,即执行处理过程(3);
(3)在y作为局外点时,则将扩展阶数r设为1,且缩放因子m设为m=2r=2;
(4)计算RE8格点阵A中矢量×的最近邻点y的Voronoi索引k;Voronoi索引k取决于扩展阶数r和缩放因子m;
该Voronoi索引k具体可以为: k = mod m ( y G A - 1 ) , 其中GA为A的生成矩阵,且modm(·)是逐个分量的模m运算;
(5)在给定m后,根据Voronoi索引k计算Voronoi码矢量v;
计算Voronoi码矢量v的具体方式可以为:
首先,计算z=k*G(RE8),并在RE8中找到
Figure S2008101056155D00092
的最近邻点u;之后,便可以计算v=z-m*u;
(6)计算差分矢量w=y-v,该差分矢量w总属于缩放的RE8格点阵mA;通过缩放差分矢量w来计算码矢量c=w/m;
由于w属于缩放的RE8格点阵mA,故码矢量c一定属于RE8格点阵;
(7)接着验证c是否在基本码本C中,若不在基本码本C中,则将扩展阶数r增加1,缩放因子m乘以2,且Voronoi扩展到新一次迭代中,即重新执行过程(4);若c在基本码本C中,则表示已经找到了采用y量化源矢量x而不会出现溢出的扩展阶数r和缩放因子m=2r
在通过处理过程(7)找到采用量化矢量y量化源矢量x而不会出现溢出的扩展阶数r和缩放因子m=2r之后,计算量化矢量y的基本码矢量c的索引j,然后将j和k复合成索引i,且码本号n设置为扩展阶数n=r,量化过程结束。
相应的经过上述处理后,格型矢量量化的输出包括码本号n和码矢量y的索引i;其中,如果使用了Voronoi扩展,则n>0,否则,n=0;对于索引i,则若未使用了Voronoi扩展,则基本码本中码矢量y的索引i等于基本码矢量c的索引(此时,基本码矢量c即为y),若使用Voronoi扩展,则将j和k的复合,其中j是基本码本C中c的索引,且k是与矢量v对应的Voronoi索引,复合获得相应的码矢量y的索引i。
需要说明的是,上述步骤4和步骤5的执行过程并无先后顺序限制,即也可以首先执行步骤5,之后,再执行步骤4,或者,也可以并行执行步骤4和步骤5。
步骤6,根据步骤4和步骤5的处理结果执行增益联合量化处理;
具体可以为:首先,计算固定码本增益gc和固定码本预测增益g′c的相关因子γ为:
γ=gc/g′c,其中, g ′ c = 10 0.05 ( E ( n ) ~ + E ‾ - E i ) ; E ( n ) = 10 log ( 1 N g c 2 Σ i = 0 N - 1 c 2 ( i ) ) - E ‾ , N=64为子帧长度,c(i)为固定码本激励, E ‾ = 30 dB 是固定码本激励的平均能量; E i = 10 log [ 1 N Σ i = 0 N - 1 c 2 ( i ) ] ; 之后,将自适应码本增益和相关因子γ组成2维矢量,并在编码码流中使用7bits记录相应的增益联合量化结果。
步骤7,进行激励信号的计算;
由自适应码本激励v(n)、固定码本激励c(n)、量化后的自适应码本增益
Figure S2008101056155D00105
以及量化后的固定码本增益
Figure S2008101056155D00106
共同生成当前子帧的激励信号u(n):
u ( n ) = g p ^ v ( n ) + g c ^ c ( n ) , n = 0 ~ N - 1 ;
在完成激励信号的计算后,还根据确定的激励信号u(n)修改用于计算目标信号的加权合成滤波器参数,以便计算下一子帧的目标信号。
(二)解码过程
参照图5所示,本发明实施例提供的相应解码过程具体可以包括:
步骤1,LP滤波器参数解码;
具体可以在收到序号L0、L1、L2和L3后,根据各序号索引(ISF索引)到的参数相应的重构LSP系数,并将每子帧的LSP系数转换为LP滤波器系数
Figure S2008101056155D00108
以子帧为单位重构语音;
步骤2,进行自适应码本矢量解码;
具体可以根据收到的自适应码本索引寻找基因延时的整数和分数部分,并通过内插过去的激励(即以前的激励)u(n)以得到自适应码本矢量v(n);
步骤3,进行固定码本矢量解码;
该固定码本矢量解码过程具体可以包括:
(1)根据从收到的码流中解析获得的固定码本索引得到固定码本y′(n);获得固定码本的过程通过相应的格型矢量量化解码过程实现,如图5、6所示,在解码端采用的格型矢量量化解码的步骤可以包括:
首先,从接收到的压缩码流中读取码本号n和索引i;
之后,根据n值进行量化矢量的重建处理:
如果n=0,则表明编码未使用Voronoi扩展,在该情况下直接将索引i解码以构成基本码本C中的码矢量c,并将量化矢量重建为y=c;
如果n>0,则表明编码使用了Voronoi扩展,此时需要分别将扩展阶数和缩放因子设置为r=n和m=2r,并将索引j和k分离,进而将索引j解码为基本码本C中的c,将k解码为Voronoi扩展码本V(r)中的v,相应的重建的量化矢量为y=mc+v;
最后,根据重建的量化矢量便可以确定相应的固定码本y′(n);
其中,确定相应的固定码本y′(n)的过程可以包括:
当编码端采用模式0,即在频域进行的格型矢量量化,则此时获得的是获得的是量化的频域目标信号,对该频域目标信号进行噪声填充处理,如可以利用正弦函数随机生成一组正弦信号,并用噪音因子fac_ns调整该组正弦信号的幅度得到待填充信号,再利用该信号填充数组y2_dct[i]中未量化的频段,以避免因量化比特数不够而导致出现高频频谱空洞;之后,再对完成噪声填充处理后的信号进行IDCT变换处理,得到量化的时域目标信号,即固定码本y′(n);
当编码端采用模式1,即在时域进行相应的格型矢量量化处理,则此时获得的直接即为相应的量化的时域目标信号,即固定码本y′(n);
(2)将得到的固定码本y′(n)通过逆加权合成滤波器H′(z)处理得到固定码本激励信号c(n):c(n)=y′(n)*H′(z),符号*表示卷积;
其中,若预定义的加权合成滤波器H(z)为: H ( z ) = W ( z ) A ^ ( z ) , 则对应的逆加权合成滤波器H′(z)为: H ′ ( z ) = 1 H ( z ) ;
步骤4,根据增益索引进行增益解码,具体为进行相应的自适应码本和固定码本的增益解码;
根据收到的增益码本序号确定自适应码本增益
Figure S2008101056155D00123
和固定码本增益相关因子
Figure S2008101056155D00124
进而确定当前子帧n的固定码本预测能量,相应的计算公式如下:
E ( n ) ~ = Σ i = 1 4 b i R ( n ^ - i ) , 其中,[b1,b2,b3,b4]=[0.5,0.4,0.3,0.2]是MA预测器的系数,
Figure S2008101056155D00126
为子帧k的预测误差的量化值;
令固定码本激励的平均能量贡献为: E i = 10 log [ 1 N Σ i = 0 N - 1 c 2 ( i ) ] , 则固定码本预测增益g′c的计算公式为: g ′ c = 10 0.05 ( E ( n ) ~ + E ‾ - E i ) ;
固定码本增益gc的计算公式为: g c ^ = γ ^ g ′ c .
需要说明的是,上述步骤2、3、4的执行顺序并无限制,即步骤2、3、4可以以任意顺序执行或并行执行。
步骤5,根据步骤2、3、4的处理结果进行合成激励信号的操作,即重构合成滤波器的激励信号;
具体可以由自适应码本激励v(n)、固定码本激励c(n)、量化后的自适应码本增益
Figure S2008101056155D001210
以及量化后的固定码本增益共同生成当前子帧的激励信号u(n):
u ( n ) = g p ^ v ( n ) + g c ^ c ( n ) , n = 0 ~ N - 1 ;
步骤6,进行噪音增强处理;
具体可以通过非线性增益平滑技术对固定码本增益
Figure S2008101056155D00132
进行处理,即通过平滑固定码本增益来减少激励信号的能量波动,从而改进固定背景噪声下的编码性能;
在该步骤中,相应的的固定码本增益的更新公式为: g c ^ = θ g 0 + ( 1 - θ ) g c ^ , 其中,等式左边的
Figure S2008101056155D00134
为更新后的值,等式右边的
Figure S2008101056155D00135
为更新前的值,θ为基于相邻的LP滤波器距离测度得的稳定因子,g0为根据当前帧固定码本增益
Figure S2008101056155D00136
与前一帧的固定码本增益g-1比较得出的初始化修改增益;
步骤7,进行基音增强处理;
基音增强处理将固定码本激励通过低通滤波器进行处理,该低通滤波器的转移函数为:
Finno(z)=-Cpez+1-Cpez-1,其中Cpe=0.125(1-rv),rv=(Ev-Ec)/(Ev+Ec),Ev是自适应码本矢量的能量,Ec是固定码本矢量的能量;
相应的通过短时合成滤波器后的固定码本矢量为:
c′(n)=c(n)-cpe(c(n+10+c(n-1));
且由于 u ( n ) = g ^ p v ( n ) + g c ^ c ( n ) , 则基音增强后的更新激励为:
u ( n ) = u ( n ) - g c c ^ pe ( c ( n + 1 ) + c ( n - 1 ) ) ;
步骤8,对基音增强处理后的激励信号进行后处理,以便进行语音合成;
该后处理用于对低码率(如8k以下)下的合成激励u(n)进行处理,以强调自适应码本贡献,具体可以为:
u ^ ( n ) = u ( n ) + 0.25 β g ^ p v ( n ) , g ^ p > 0.5 u ( n ) , g ^ p ≤ 0.5 , 其中,
Figure S2008101056155D00142
为量化后的自适应码本增益,β为调整因子;
在后处理过程中,还通过自适应增益控制(AGC)补偿未强调激励u(n)和强调激励
Figure S2008101056155D00143
之间的增益差异,相应的增益缩放因子η可为:
η = Σ n = 0 N - 1 u 2 ( n ) Σ n = 0 N - 1 u ^ 2 ( n ) g ^ p > 0.5
g ^ p ≤ 0.5 , 则缩放后的强调激励信号
Figure S2008101056155D00146
为:
u ^ ′ ( n ) = u ^ ( n ) η ;
这样,每64样点的子帧重构语音为: s ^ ( n ) = u ^ ( n ) - Σ i = 1 16 a i ^ s ^ ( n - i ) .
可见,通过上述本发明实施例可以在编解码端提供了相应的复杂程度低且性能良好的固定码本激励搜索实现方案。
在编解码端的进行固定码本激励搜索过程中,若对低码率的目标信号进行量化,则需要进行相应的由时频变换处理,相应的时频变换处理可以但不限于采用以下处理方式实现:
在时频变换中,选取DCT-IV(DCT-IV与IDCT-IV变换核相同),在实现中为了降低运算复杂度,可以采用如下快速算法:
相应的N/2点DCT-IV定义如下:
x ′ [ i ] = Σ k = 0 N / 2 - 1 X [ k ] cos [ π 2 N ( 2 i + 1 ) ( 2 k + 1 ) ] fori = 0 to N 2 - 1 ;
相应的N/2点IDCT-II定义如下:
x ′ ′ [ i ] = Σ k = 0 N / 2 - 1 X [ k ] cos [ π N ( 2 i + 1 ) k ] fori = 0 to N 2 - 1 ;
对所述N/2点DCT-IV的输出乘以常数矢量:
2 cos [ π 2 N ( 2 i + 1 ) ] fori = 0 to N 2 - 1 , 则:
2 x ′ [ i ] cos [ π 2 N ( 2 i + 1 ) ] = 2 Σ k = 0 N / 2 - 1 X [ k ] cos [ π 2 N ( 2 i + 1 ) ] cos [ π 2 N ( 2 i + 1 ) ( 2 k + 1 ) ]
= Σ k = 0 N / 2 - 1 X [ k ] cos [ π N ( 2 i + 1 ) k ] + Σ k = 0 N / 2 - 1 X [ k ] cos [ π N ( 2 i + 1 ) ( k + 1 ) ]
令k=k′-1,并定义X[-1]=0,发现 cos [ π N ( 2 i + 1 ) k ] | k = N / 2 = 0 , 则有N/2点DCT-IV可以转换为:
x ′ [ i ] = 1 2 cos [ π 2 N ( 2 i + 1 ) ] Σ k = 0 N / 2 - 1 ( X [ k - 1 ] + X [ k ] ) cos [ π N ( 2 i + 1 ) k ] for i = 0 to N 2 - 1
由上式可以看出:通过上式可以将N/2点DCT-IV计算转换为N/2点IDCT-II,令M=N/2,则IDCT-II可以写为:
y [ i ] = Σ k = 0 M - 1 Y [ k ] cos [ π 2 M ( 2 i + 1 ) k ] fori=0toM-1;
令:
g [ i ] = Σ k = 0 M / 2 - 1 Y [ 2 k ] cos [ π 2 M ( 2 i + 1 ) 2 k ] = Σ k = 0 M / 2 - 1 Y [ 2 k ] cos [ π M ( 2 i + 1 ) k ]
h ′ [ i ] = Σ k = 0 M / 2 - 1 Y [ 2 k + 1 ] cos [ π 2 M ( 2 i + 1 ) ( 2 k + 1 ) ]
fori = 0 to M 2 - 1
则有:
y[i]=g[i]+h′[i]
y[M-1-i]=g[i]-h′[i] fori = 0 to M 2 - 1 , 其中,g[i]为M/2点IDCT-II,而h′[i]为M/2点IDCT-IV。
由上述推导可以知:M点IDCT-IV可以转换为M点的IDCT-II变换,M点IDCT-II可以转换为M/2点的IDCT-II变换和M/2点的IDCT-IV变换。
因此,可以采用递归调用的方式逐次降低变换点数,进而有效降低DCT变换的运算复杂度。
本发明实施例还提供了一种编码端的固定码本激励搜索装置,其具体实现结构如图7所示,该装置可以包括:
目标信号获取单元,用于获得当前输入子帧固定码本激励搜索的目标信号;
第一固定码本获取单元,用于对所述目标信号获取单元获取的目标信号进行格型矢量量化处理,并根据处理结果确定搜索获得的固定码本激励;具体地,该第一固定码本获取单元还可以对进行格型矢量量化处理后的目标信号进行逆加权合成滤波处理,以获得所述固定码本激励;
可选地,该第一固定码本获取单元具体可以包括:
判断单元,用于判断当前编码比特数与预定值之间的关系;
格型矢量量化处理单元,用于在所述判断单元确定当前编码比特数小于预定值时,在频域对所述目标信号进行格型矢量量化处理,否则,在时域对所述目标信号进行格型矢量量化处理;其中,该格型矢量量化处理单元中还可以包括时频域转换单元,用于将所述目标信号通过时频变换处理转换到频域后,再进行格型矢量量化处理;
第一固定码本确定单元,用于根据所述格型矢量量化处理单元的处理结果确定所述固定码本激励。
在该装置中,还可以包括固定码本增益计算单元,用于对所述第一固定码本获取单元获得的固定码本激励及所述当前输入子帧固定码本激励搜索的目标信号计算确定固定码本增益。
本发明实施例还提供了一种解码端的固定码本激励获取装置,其具体实现结构如图7所示,其具体可以包括:
固定码本索引获取单元,用于从接收到的编码码流中解析获取编码码流中的固定码本索引;
第二固定码本获取单元,用于根据所述固定码本索引获取单元获取的固定码本索引确定对应的固定码本激励,且所述的固定码本激励为经过格型矢量量化处理获得的固定码本激励;
其中,相应的第二固定码本获取单元具体可以包括:
固定码本获取单元,用于根据所述固定码本索引获取单元获取的固定码本索引获得对应的固定码本;
该固定码本信号获取单元具体可以包括以下两单元:
第二判断单元,用于根据码流中的信息确定在编码端的编码比特数是否小于预定值;
第二固定码本确定单元,用于在所述第二判断单元确定在编码端的编码比特数小于预定值时,在根据固定码本索引确定量化的频域目标信号后,将该量化的频域目标信号转换为量化的时域目标信号作为所述固定码本激励;否则,将根据固定码本索引确定量化的时域目标信号作为所述固定码本激励;可选地,在该第二固定码本确定单元中还可以包括噪声填充单元,用于对所述格型矢量量化处理单元进行格型矢量量化处理后的目标信号进行噪声填充处理。
逆加权合成滤波处理单元,用于将所述固定码本获取单元获取的固定码本进行逆加权合成滤波处理,获得固定码本激励信号。
综上所述,本发明实施例可以对不同的编码速率选择在时域或者频域量化目标信号,再将量化的目标信号逆滤波求取固定码本激励。由于格型矢量量化不需要存储码本,故相比传统的固定码本激励存储法能大幅度的减少存储开销。同时利用残差信号频谱平滑的特性,在频域对目标信号进行量化并填充一定量的舒适噪声,能够生成接近实际声音的固定码本激励矢量,实现了编码后的感知音质的提高。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (15)

1.一种编码端的固定码本激励搜索方法,其特征在于,包括:
获得当前输入子帧固定码本激励搜索的目标信号;
对所述目标信号进行格型矢量量化,根据量化结果确定搜索获得的固定码本激励;
所述进行格型矢量量化处理具体包括:
若当前编码比特数小于预定值,则在频域对所述目标信号进行格型矢量量化处理,否则,在时域对所述目标信号进行格型矢量量化处理。
2.根据权利要求1所述的方法,其特征在于,所述在频域对所述目标信号进行格型矢量量化处理的过程具体包括:将所述目标信号通过时频变换处理转换到频域后,进行格型矢量量化处理。
3.根据权利要求2所述的方法,其特征在于,所述时频变换处理包括:离散余弦变换处理或快速傅里叶变换处理。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述根据量化结果确定搜索获得的固定码本激励的过程具体包括:
对进行格型矢量量化处理后的目标信号进行逆加权合成滤波处理,以获得固定码本激励。
5.根据权利要求4所述的方法,其特征在于,该方法还包括:
对获得的固定码本激励进行加权合成滤波处理,并根据加权合成滤波处理结果及所述当前输入子帧固定码本激励搜索的目标信号确定固定码本增益。
6.一种编码端的固定码本激励搜索装置,其特征在于,包括:
目标信号获取单元,用于获得当前输入子帧固定码本激励搜索的目标信号;
第一固定码本获取单元,用于对所述目标信号获取单元获取的目标信号进行格型矢量量化处理,并根据处理结果确定搜索获得的固定码本激励;
所述第一固定码本获取单元具体包括第一判断单元、格型矢量量化处理单元和第一固定码本确定单元:
第一判断单元,用于判断当前编码比特数与预定值之间的关系;
格型矢量量化处理单元,用于在所述第一判断单元确定当前编码比特数小于预定值时,在频域对所述目标信号进行格型矢量量化处理,否则,在时域对所述目标信号进行格型矢量量化处理;
第一固定码本确定单元,用于根据所述格型矢量量化处理单元的处理结果确定所述固定码本激励。
7.根据权利要求6所述的装置,其特征在于,所述格型矢量量化处理单元中还包括时频域转换单元,用于将所述目标信号通过时频变换处理转换到频域后,再进行格型矢量量化处理。
8.根据权利要求6至7任一项所述的装置,其特征在于,所述第一固定码本获取单元还用于对进行格型矢量量化处理后的目标信号进行逆加权合成滤波处理,以获得所述固定码本激励。
9.根据权利要求8所述的装置,其特征在于,该装置还包括:
固定码本增益计算单元,用于对所述第一固定码本获取单元获得的固定码本激励进行加权合成滤波处理,并根据加权合成滤波处理结果及所述当前输入子帧固定码本激励搜索的目标信号计算确定固定码本增益。
10.一种解码端的固定码本获取方法,其特征在于,包括:
接收编码码流,获取编码码流中的固定码本索引;
根据所述的固定码本索引确定对应的固定码本激励,所述的固定码本激励为经过格型矢量量化处理获得的固定码本激励;
根据所述固定码本索引确定对应的固定码本激励的过程包括:根据所述固定码本索引获得对应的固定码本,将所述固定码本进行逆加权合成滤波处理获得固定码本激励。
11.根据权利要求10所述的方法,其特征在于,根据所述固定码本索引获得对应的固定码本的过程包括:
若根据码流中的信息确定在编码端的编码比特数小于预定值,则在根据固定码本索引确定量化的频域目标信号后,将该量化的频域目标信号转换为量化的时域目标信号作为所述固定码本激励;否则,将根据固定码本索引确定量化的时域目标信号作为所述固定码本激励。
12.根据权利11所述的方法,其特征在于,若编码比特数小于预定值,对进行格型矢量量化处理后的目标信号进行噪声填充处理。
13.一种解码端的固定码本获取装置,其特征在于,包括:
固定码本索引获取单元,用于从接收到的编码码流中解析获取编码码流中的固定码本索引;
第二固定码本获取单元,用于根据所述固定码本索引获取单元获取的固定码本索引确定对应的固定码本激励,且所述的固定码本激励为经过格型矢量量化处理获得的固定码本激励;
所述第二固定码本获取单元具体包括固定码本获取单元和逆加权合成滤波处理单元:
固定码本获取单元,用于根据所述固定码本索引获取单元获取的固定码本索引获得对应的固定码本;
逆加权合成滤波处理单元,用于将所述固定码本获取单元获取的固定码本进行逆加权合成滤波处理,获得固定码本激励。
14.根据权利要求13所述的装置,其特征在于,所述固定码本获取单元具体包括:
第二判断单元,用于根据码流中的信息确定在编码端的编码比特数是否小于预定值;
第二固定码本确定单元,用于在所述第二判断单元确定在编码端的编码比特数小于预定值时,在根据固定码本索引确定量化的频域目标信号后,将该量化的频域目标信号转换为量化的时域目标信号作为所述固定码本激励;否则,将根据固定码本索引确定量化的时域目标信号作为所述固定码本激励。
15.根据权利要求13所述的装置,其特征在于,所述第二固定码本确定单元还包括噪声填充单元,用于在所述第二判断单元确定在编码端的编码比特数小于预定值时,对进行格型矢量量化处理后的目标信号进行噪声填充处理。
CN2008101056155A 2008-04-30 2008-04-30 编解码端的固定码本激励的搜索方法及装置 Expired - Fee Related CN101572092B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2008101056155A CN101572092B (zh) 2008-04-30 2008-04-30 编解码端的固定码本激励的搜索方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2008101056155A CN101572092B (zh) 2008-04-30 2008-04-30 编解码端的固定码本激励的搜索方法及装置

Publications (2)

Publication Number Publication Date
CN101572092A CN101572092A (zh) 2009-11-04
CN101572092B true CN101572092B (zh) 2012-11-21

Family

ID=41231425

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008101056155A Expired - Fee Related CN101572092B (zh) 2008-04-30 2008-04-30 编解码端的固定码本激励的搜索方法及装置

Country Status (1)

Country Link
CN (1) CN101572092B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101577551A (zh) 2009-05-27 2009-11-11 华为技术有限公司 一种生成格型矢量量化码书的方法及装置
EP2980792A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating an enhanced signal using independent noise-filling
CN104202018B (zh) * 2014-08-22 2017-11-28 华为技术有限公司 确定自适应滤波器的稳定因子的方法和装置
WO2016084764A1 (ja) * 2014-11-27 2016-06-02 日本電信電話株式会社 符号化装置、復号装置、これらの方法及びプログラム
CN117476022A (zh) * 2022-07-29 2024-01-30 荣耀终端有限公司 声音编解码方法以及相关装置、系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1121375A (zh) * 1994-02-17 1996-04-24 摩托罗拉公司 分组编码信号的方法和装置
CN1957398A (zh) * 2004-02-18 2007-05-02 沃伊斯亚吉公司 在基于代数码激励线性预测/变换编码激励的音频压缩期间低频加重的方法和设备
CN101110214A (zh) * 2007-08-10 2008-01-23 北京理工大学 一种基于多描述格型矢量量化技术的语音编码方法
EP1914725A1 (en) * 2006-10-18 2008-04-23 Polycom, Inc. Fast lattice vector quantization

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1121375A (zh) * 1994-02-17 1996-04-24 摩托罗拉公司 分组编码信号的方法和装置
CN1957398A (zh) * 2004-02-18 2007-05-02 沃伊斯亚吉公司 在基于代数码激励线性预测/变换编码激励的音频压缩期间低频加重的方法和设备
EP1914725A1 (en) * 2006-10-18 2008-04-23 Polycom, Inc. Fast lattice vector quantization
CN101110214A (zh) * 2007-08-10 2008-01-23 北京理工大学 一种基于多描述格型矢量量化技术的语音编码方法

Also Published As

Publication number Publication date
CN101572092A (zh) 2009-11-04

Similar Documents

Publication Publication Date Title
CN1051392C (zh) 矢量量化器方法
CN101548316B (zh) 编码装置、解码装置以及其方法
EP0910067B1 (en) Audio signal coding and decoding methods and audio signal coder and decoder
EP0942411B1 (en) Audio signal coding and decoding apparatus
CN101615396B (zh) 语音编码设备、以及语音解码设备
CN1957398B (zh) 在基于代数码激励线性预测/变换编码激励的音频压缩期间低频加重的方法和设备
RU2462770C2 (ru) Устройство кодирования и способ кодирования
CN1669075A (zh) 音频编码
CN102089810A (zh) 多基准线性预测系数滤波器量化和逆量化设备及方法
EP2128858B1 (en) Encoding device and encoding method
CN101572092B (zh) 编解码端的固定码本激励的搜索方法及装置
CN102714040A (zh) 编码装置、解码装置、频谱变动量计算方法和频谱振幅调整方法
CN1192357C (zh) 用于语音编码的自适应规则
CN101198041A (zh) 矢量量化方法及装置
CN1234898A (zh) 具有改进语音编码器和解码器的发射机
CN1124588C (zh) 信号编码方法及设备
CN1132157C (zh) 线性预测分析合成的编码方法和编码器
CN102598124B (zh) 编码装置、解码装置及其方法
JP2004348120A (ja) 音声符号化装置、音声復号化装置及びこれらの方法
CN101630510B (zh) Amr语音编码中lsp系数量化的快速码本搜索的方法
CN1622198A (zh) 自适应帧选择线谱频率参数量化方法
CN101990253A (zh) 一种带宽扩展方法及其装置
CN103337243A (zh) 一种amr码流转换成amr-wb码流的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20201210

Address after: No. 188, Xingang Avenue, Jingjiang City, Taizhou City, Jiangsu Province

Patentee after: JIANGSU YALONG NEW MATERIAL TECHNOLOGY Co.,Ltd.

Address before: Unit 2414-2416, main building, no.371, Wushan Road, Tianhe District, Guangzhou City, Guangdong Province

Patentee before: GUANGDONG GAOHANG INTELLECTUAL PROPERTY OPERATION Co.,Ltd.

Effective date of registration: 20201210

Address after: Unit 2414-2416, main building, no.371, Wushan Road, Tianhe District, Guangzhou City, Guangdong Province

Patentee after: GUANGDONG GAOHANG INTELLECTUAL PROPERTY OPERATION Co.,Ltd.

Address before: 518129 Bantian HUAWEI headquarters office building, Longgang District, Guangdong, Shenzhen

Patentee before: HUAWEI TECHNOLOGIES Co.,Ltd.

TR01 Transfer of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20121121

Termination date: 20210430

CF01 Termination of patent right due to non-payment of annual fee