CN102867516A - 一种采用高阶线性预测系数分组矢量量化的语音编解方法 - Google Patents

一种采用高阶线性预测系数分组矢量量化的语音编解方法 Download PDF

Info

Publication number
CN102867516A
CN102867516A CN2012103346125A CN201210334612A CN102867516A CN 102867516 A CN102867516 A CN 102867516A CN 2012103346125 A CN2012103346125 A CN 2012103346125A CN 201210334612 A CN201210334612 A CN 201210334612A CN 102867516 A CN102867516 A CN 102867516A
Authority
CN
China
Prior art keywords
coefficient
lsf
scope
lsp
rank
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012103346125A
Other languages
English (en)
Other versions
CN102867516B (zh
Inventor
殷福亮
陈喆
汪林
张旭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dalian University of Technology
Original Assignee
Dalian University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dalian University of Technology filed Critical Dalian University of Technology
Priority to CN201210334612.5A priority Critical patent/CN102867516B/zh
Publication of CN102867516A publication Critical patent/CN102867516A/zh
Application granted granted Critical
Publication of CN102867516B publication Critical patent/CN102867516B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明公开了一种采用高阶线性预测系数分组矢量量化的语音编解方法,其能够应用于低码率、高质量语音编解码器中,能够减少对高阶线谱频率矢量量化所需的码本体积和计算量。

Description

一种采用高阶线性预测系数分组矢量量化的语音编解方法
技术领域
本发明涉及一种采用高阶线性预测系数分组矢量量化的语音编解方法,属于语音编码技术领域。 
背景技术
基本的语音通信过程如说明书附图1所示,对语音编解码器的要求是:在保证语音质量的前提下,编码码流的比特率越低越好。采用矢量量化技术、线性预测分析技术和数据插值技术的编解码器能够很好地满足这个要求。在基于上述技术的语音编解码器中,线性预测系数的编解码过程为:在编码端,用莱文森-德宾算法算法求解线性预测系数,并转化为相应的线谱频率参数,用存储在本地的码本对线谱频率参数进行矢量量化,得到码本的索引号。这些索引号会和其它语音编码参数一起被打包成比特流,通过通信网络传送到输出端。在解码端,根据从编码器传送的索引号解码出线谱频率参数,并转化为对应的线性预测系数,最后根据线性预测系数及其它编码参数合成出语音,整个过程的原理如说明书附图2所示。 
矢量量化是一种高效的数据压缩方法,如说明书附图3所示,它是将若干个标量数据组构成一个矢量,然后在矢量空间中进行整体量化。对1个N维编码端待量化矢量x,从N维码本矢量集Y={y(1),y(2),...,y(L)}中选择与x最匹配的矢量y(i),在信道中只需传输y(i)在码本Y中的索引号i即可。在解码端,根据索引号i即可找到对应矢量y(i),并作为解码结果输出。码本的设计可使用LBG算法。为了降低矢量量化所需的码本体积,分裂式矢量量化技术应运而生。分裂式矢量 量化技术是比较适合于高阶线谱频率参数量化的一种方法,分裂矢量量化的过程如图4所示。分裂式矢量量化是指将待量化矢量分为几个低维子矢量,每个子矢量分别使用不同的码本量化。计算出信号线谱频率参数后,将线谱频率参数分为T个子矢量lsf0,lsf1,...,lsfT-1,每一部分分别使用不同的码本作矢量量化,得到索引号0,1,…,T–1,由这T个索引号联合表示LSF参数。同理,在解码端由这T个索引号恢复T个子矢量lsf0,lsf1,...,lsfT-1,再合并出完整LSF参数,并进一步计算线性预测系数。说明书附图4中的矢量量化在编码端表示码本搜索,在解码端表示码本提取。同传统的矢量量化技术相比,分裂式矢量量化所需的码本体积大大减小。但其还存在两个问题:第一,从高阶线性预测系数直接计算高阶线谱频率参数,运算量很大,运算量与线性预测系数个数的平方成正比;第二,针对T个子矢量,需要分别设计T组码本,因此高阶线谱频率参数所需要的码本总量仍然很大。 
在语音信号分析中,常把语音x(n)看作是一个时间序列模型的输出,x(n)可表示为: 
x ( n ) + Σ i = 1 M a ( i ) x ( n - i ) = e ( n )
其中,M为线性预测分析阶数。a(i),i=1,2,…,M为模型参数,也称线性预测系数。e(n)为激励信号。x(n)也可以等效为e(n)经过一个全极点滤波器(也称合成滤波器)H(z)的输出,H(z)可表示为: 
H ( z ) = 1 A ( z ) = 1 1 + Σ i = 1 M a ( i ) z - i
其中,A(z)称为预测误差滤波器。给定输入语音信号(或其自相关函数),系数a(i)可以由莱文森-德宾(Levinson-Durbin)算法求出;实际应用当中,除了使用线性 预测系数表征声道模型外,还常使用反射系数k(i)和线谱频率(线谱频率)参数lsf(i),使用lsf(i)生成H(z)时,和k(i)一样容易保证H(z)的稳定性,且lsf(i)量化特性和内插特性均优于k(i),使得产生相同质量的合成语音所需的编码码率得以降低,因此,目前对线性预测参数的矢量量化通常在线谱频率域上进行。这三种参数之间的关系如下: 
(1)已知线性预测系数a(i),求反射系数k(i)的递推方法为: 
k(m)=-a(m,m), 
a(m-1,i)=[a(m,i)+k(m)a(m,m–i)]/[1–k(i)]。 
其中,m是阶数,m=M,M–1,...,1。a(m,i)是m阶的第i个线性预测系数。k(m)是第m个反射系数。 
(2)已知反射系数k(i),求线性预测系数a(i)的递推方法为: 
a(m,m)=k(m), 
a(m,i)=[a(m–1,i)+k(m)a(m–1,m–i)], 
其中,m是阶数,m=1,2,...,M。a(m,i)是m阶的第i个线性预测系数,i=1,2,...,m-1。k(m)是第m个反射系数。 
(3)已知线性预测系数a(i),求线谱频率参数lsf(i)的方法为: 
使用线性预测系数a(i)可以构建两个多项式P(z)和Q(z); 
P(z)=A(z)+z-(M+1)A(z-1), 
Q(z)=A(z)-z-(M+1)A(z-1)。 
方程P(z)=0与Q(z)=0在余弦域的根lspP(i)与lspQ(i)称为线谱对系数,求解线谱频率参数的数值方法有许多种,如代数式方程求根法和DFT方法等。可以证明,当A(z)的零点都位于单位圆内时,多项式P(z)和Q(z)具有如下性质: 
P(z)和Q(z)的零点都位于单位圆上,P(z)和Q(z)的零点沿着单位圆上随着ω的 增加交替出现,若除去P(z)的1和Q(z)的–1这两个零点,P(z)和Q(z)还各有M个零点。当A(z)满足最小相位特性时,可以由线性预测系数唯一确定线谱频率参数。 
由lspP(i)、lspQ(i)计算反余弦即可得到lsfP(i)、lsfQ(i)。 
lsfP(i)=arccos[lspP(i)], 
lsfQ(i)=arccos[lspQ(i)]。 
(4)已知线谱频率参数lsf(i),求线性预测系数a(i)的方法为 
使用线谱频率参数lsfP(i)lsfQ(i)可以计算lsfP(i)、lsfQ(i),即 
lspP(i)=cos[lsfP(i)], 
lspQ(i)=cos[lsfQ(i)]。 
使用LSP参数lspP(i)lspQ(i)可以构建两个多项式P(z)和Q(z) 
P(z)=(1+z-1)П(1-lspP(i)z-1), 
Q(z)=(1-z-1)П(1-lspQ(i)z-1)。 
其中,П表示连乘。 
A(z)可以用多项式P(z)和Q(z)表示为 
A(z)=[P(z)+Q(z)]/2。 
对音频信号进行线性预测分析时,分析精度与线性预测的阶数直接相关。对语音信号来说,10阶线性预测分析就足够合成出高质量的语音。对音乐或具有复杂背景声的信号,则需要提高线性预测分析阶数以获得更多的频谱细节。但是高阶线性预测分析也带来了另外一些问题。在编码时,线性预测系数在传输之前要先经过量化,以降低数码率。线谱频率(线谱频率)具有良好的内插特性和抗量化误差能力,矢量量化通常在线谱频率域进行。但随着线性预测阶数增加,现有语音编码器均使用代数式方程求根法由线性预测系数a(i)求解线谱频率参数lsf(i),从线性预测系数计算线谱频率参数所需的运算量与线性预测系数个数 的平方成正比;同时,即使采用分裂矢量量化技术,对高阶线谱频率矢量量化所需的码本体积也很大,故高阶线性预测分析在低码率、高质量语音编码器中的应用非常困难。 
缩略语和关键术语定义:VQ:Vector Quantization,矢量量化。线性预测:Linear Prediction,线性预测。线性预测系数:Linear Prediction Coefficient,线性预测系数。Levinson算法:也称为Levinson-Durbin算法,莱文森-德宾算法,是一种基于自相关函数计算线性预测系数的方法。LSP:Linear Spectrum Pair,线谱对。LSF:Linear Spectrum frequency,线谱频率。 
发明内容
为了克服上述的不足,本发明的目的在于提供一种采用高阶线性预测系数分组矢量量化的语音编解方法,其能够应用于低码率、高质量语音编解码器中,能够减少对高阶线谱频率矢量量化所需的码本体积和计算量。 
本发明采取的技术方案分如下,分编码和解码两步骤: 
1、一种采用高阶线性预测系数分组矢量量化的语音编解方法;分编码和解码两步骤, 
第一步:编码, 
编码按照以下步骤进行: 
(1)使用莱文森-德宾算法进行高阶线性预测分析得到R个线性预测系数a(i)并且R=dM;可由已知R个线性预测系数a(i)得到R个反射系数k(i)(i=1,2,...,R); 
所述已知R个线性预测系数a(i),求R个反射系数k(i)的递推方法为:k(m)=-a(m,m), 
a(m-1,i)=[a(m,i)+k(m)a(m,m-i)]/[1-k(i)], 
其中,m是阶数,m=R,R-1,…,1;a(m,i)是进行m阶线性预测时的第i个线性预测系数,k(m)是第m个反射系数; 
所述R、M、d均为正整数,R范围为10~100,M范围为8~16;R、M、d须满足关系R=dM; 
(2)反射系数k分组器将R个反射系数k(i)(i=1,2,...,R)分为d组,每组包含相邻M个反射系数k(i)(i=1,2,...,M);所述的第j组的第i个系数k(j,i)与k(i)的关系表示为k(j,i)=k(jM+i)(j=0,1,...,d-1;i=1,2,...,M);所述R、M、d均为正整数,所述M范围为8~16,R、M、d须满足关系R=dM; 
(3)对每组M阶反射系数k(j,i),经过k→a转化器计算出对应的M阶线性预测系数a(j,i)(j=0,1,...,d-1;i=1,2,...,M);所述R、M、d均为正整数,所述M范围为8~16,R、M、d须满足关系R=dM,R范围为10~100; 
所述已知反射系数k(i),求线性预测系数a(i)的递推方法为: 
a(m,m)=k(m), 
a(m,i)=[a(m-1,i)+k(m)a(m–1,m–i)], 
其中,m是阶数,m=1,2,...,M;a(m,i)是m阶线性预测时的第i个线性预测系数,i=1,2,...,m-1;k(m)是第m个反射系数; 
(4)对每组已知M个线性预测系数a(j,i)经过a→lsf转化器计算出对应的线谱频率参数lsf(j,i)(j=0,1,...,d-1;i=1,2,...,M);所述M范围为8~16,d为正整数,R、M、d须满足关系R=dM,所述R、M、d均为正整数; 
所述已知线性预测系数a(i),求线谱频率参数lsf(i)的方法为: 
使用线性预测系数a(i)可以构建两个多项式P(z)和Q(z); 
P(z)=A(z)+z-(M+1)A(z-1), 
Q(z)=A(z)-z-(M+1)A(z-1); 
所述 M是线性预测阶数,z代表Z变换域的自变量; 
方程P(z)=0与Q(z)=0在余弦域的根分别为lspP(i)与lspQ(i),i=1,2,...,M+1,称lspP(i)与lspQ(i)为线谱对系数,当A(z)的零点都位于单位圆内时,P(z)和Q(z)的 零点都位于单位圆上,P(z)和Q(z)的零点沿着单位圆上随着ω的增加交替出现,若除去1和–1这两个零点,P(z)和Q(z)各有M个零点,当A(z)满足最小相位特性时,可以由线性预测系数a(i)唯一确定线谱频率参数lspP(i)与lspQ(i),i=1,2,...,M/2;由lspP(i)、lspQ(i)计算反余弦即可得到lsfP(i)、lsfQ(i); 
lsfP(i)=arccos[lspP(i)], 
lsfQ(i)=arccos[lspQ(i)]; 
lsfP(i)、lsfQ(i)交错排列 
lsf(2i)=lsfP(i), 
lsf(2i+1)=lsfQ(i); 
可得lsf(i); 
(5)矢量量化器使用相同的量化码本对d组线谱频率参数分别作矢量量化得到d个索引号,索引号和其它编码参数一起被打包成比特流进入通信网络并被传送到输出端; 
第二步:解码, 
解码按照以下步骤进行: 
(1)根据通信网络接收的d个索引号可以恢复d组线谱频率参数lsf(j,i)(j=0,1,...,d-1;i=1,2,...,M),对d组线谱频率参数使用lsf→a转化器计算对应的M阶线性预测系数a(j,i)(j=0,1,...,d-1;i=1,2,...,M);所述M范围为8~16,R范围为10~100,R、M、d满足关系R=dM;所述R、M、d均为正整数; 
所述已知线谱频率参数lsf(i),使用lsf→a转化器计算对应的M阶线性预测系数a(i)的方法为: 
将偶数序号的lsf(i)参数定义为lsfP(i),奇数序号的lsf(i)参数定义为lsfQ(i), 
lsfP(i)=lsf(2i), 
lsfQ(i)=lsf(2i+1); 
其中,i=1,2,…,M/2;对线谱频率参数lsfP(i)、lsfQ(i)取余弦可以计算LSP参数 
lspP(i)、lspQ(i),即 
lspP(i)=cos[lsfP(i)], 
lspQ(i)=cos[lsfQ(i)]; 
使用LSP参数lspP(i)、lspQ(i)可以构建两个多项式P(z)和Q(z) 
P ( z ) = ( 1 + z - 1 ) Π i = 1 M / 2 [ 1 - 2 lsp P ( i ) z - 1 + z - 2 ] ,
Q ( z ) = ( 1 - z - 1 ) Π i = 1 M / 2 [ 1 - 2 lsp Q ( i ) z - 1 + z - 2 ] .
其中,П表示连乘,z代表Z变换域的自变量,M是线性预测阶数代表系数a(i)的数目; 
多项式A(z)可以用多项式P(z)和Q(z)表示为 
A(z)=[P(z)+Q(z)]/2。 
根据表达式 
Figure BDA00002119191200083
按照z-i系数对应相等的原则,即可确定出a(i)的值, 
(2)对d组M阶线性预测系数a(j,i)使用a→k转化器计算对应的M阶反射系数k(j,i)(j=0,1,...,d-1;i=1,2,...,M),R、M、d须满足关系R=dM;R范围为10~100;所述M范围为8~16,R范围为10~100,R、M、d满足关系R=dM;所述R、M、d均为正整数; 
所述已知线性预测系数a(i),使用a→k转化器求反射系数k(i)的递推方法为:k(m)=-a(m,m), 
a(m-1,i)=[a(m,i)+k(m)a(m,m-i)]/[1-k(i)], 
其中,m是阶数,m=M,M-1,...,1;a(m,i)是m阶的第i个线性预测系数,k(m)是第m个反射系数;所述M范围为8~16,R范围为10~100,R、M、d满足关系R=dM; 
所述R、M、d均为正整数; 
(3)对d组反射系数k(j,i)(j=0,1,...,d-1)使用反射系数组合器按顺序组成R阶反射系数k(jM+i)=k(j,i)(j=0,1,...,d-1,i=1,2,...,M);所述M范围为8~16,R范围为10~100,R、M、d满足关系R=dM,所述R、M、d均为正整数; 
(4)对R阶反射系数k(i)使用k→a转化器转换为R阶线性预测系数a(i)(i=1,2,...,R):R范围为10~100,R、M、d满足关系R=dM,M范围为8~16,所述R、M、d均为正整数; 
所述已知R阶反射系数k(i),使用k→a转化器求R阶线性预测系数a(i)的递推方法为: 
a(m,m)=k(m), 
a(m,i)=[a(m–1,i)+k(m)a(m–1,m–i)], 
其中,m是阶数,m=1,2,...,R;a(m,i)是m阶的第i个线性预测系数,i=1,2,...,m–1,k(m)是第m个反射系数,R范围为10~100,R、M、d满足关系R=dM,M范围为8~16,所述R、M、d均为正整数; 
本发明的有益效果如下: 
(1)显著降低使用高阶线性预测系数的语音编码器的运算量。将高阶线性预测系数分解为多组低阶线性预测系数,然后再计算对应的线谱频率参数。计算多组低阶线谱频率参数所需的运算量要小于直接计算高阶线谱频率所需的运算量。 
(2)减少矢量量化所用码本的体积,进而减少码本的存储量。将反射系数划分为多个子组,然后将各子组的反射系数转化为线谱频率参数后分别予以矢量量化。各子组的线谱频率参数都分布在(0,π)区间内,因此可以使用相同的码本做矢量量化,减少了总的码本矢量的个数,从而节省了码本存储空间。 
(3)本发明适合应用到变码率分级语音编码算法中。各个子组根据反射系数划分,而各个反射系数是与线性预测阶数无关的。基于此,在传输码流时,根 据信道带宽情况,可以首先传送低阶线性预测分析得到的反射系数生成的线谱频率系数索引;若信道带宽允许,再传输更高阶数的反射系数生成的线谱频率系数索引。 
附图说明
图1为语音通信过程示意图; 
图2为现有的基于线谱频率参数和矢量量化技术的语音编码器即语音编解码器中LP系数编码工作过程示意图; 
图3为矢量量化原理图; 
图4为分裂式矢量量化原理图; 
图5为本发明技术原理框图。 
具体实施方式
基本的语音通信过程如说明书附图1所示,原始的语音信号经过发送端语音编码器后变成码流,码流经过信道传输到接收端的语音解码器后恢复出原始的语音信号。 
现有的基于线谱频率参数和矢量量化技术的语音编码器如说明书附图2所示,原始的待编码语音信号LP分析模块后,得到LP系数;LP系数经过LSF计算模块后,得到LSF系数;LSF系数经过矢量量化模块后,得到码本索引参数;码本索引参数经过通信信道被传输到接收端。接收端解码过程与编码过程相反,接收的经过逆矢量量化模块后,得到LSF系数;LSF系数经过LP系数计算模块后,得到LP系数;LP系数即被用于合成语音模块中来合成语音信号。实用的语音编码器的编码参数除了LSF码本索引参数外,还包括如基音周期、固定码本索引等,但这些参数的处理与本发明关联不大,故此处没有赘述。 
矢量量化原理图如说明书附图3所示,待量化的矢量通入码书搜索器,码书搜索器搜索编码器码本中与待量化的矢量最接近的码字,并将该码字索引经过通信信道传输到接收端。接收端解码过程与编码过程相反,码书提取器根据接收的索引,从解码器码本得到解码输出矢量。 
分裂式矢量量化原理图如说明书附图4所示,LP系数LSF计算模块得到LSF 系数,该LSF系数矢量被简单分割一系列长度较小的矢量。而后分别进行矢量量化得到多个索引值,这些索引值经数据打包,经过通信信道传输到接收端。接收端解码过程与编码过程相反,数据先经过拆包模块得到多个索引值,每个索引值经过反量化得到一系列长度较小的矢量,这些长度较小的矢量被LSF组合模块组合为LSF系数矢量,进而经过LP恢复模块恢复出LP系数用于合成语音。 
本发明采取的技术方案分两步骤: 
1.编码技术方案: 
(1)使用莱文森-德宾算法进行高阶线性预测分析,得到R个线性预测系数a(i)。适当选取R,使之满足R=dM。图5中,a→k转化器使用背景技术中提及的方法,可由R个a(i)得到R个反射系数k(i),i=1,2,...,R。 
在编码技术方案中涉及的变量R、M、d的取值范围均相同,R、M、d均为正整数,R范围为10~100,M范围为8~16;R、M、d须满足关系R=dM; 
已知线性预测系数a(i),求反射系数k(i)的递推方法为: 
k(m)=-a(m,m), 
a(m-1,i)=[a(m,i)+k(m)a(m,m-i)]/[1-k(i)]。 
其中,m是阶数,m=M,M-1,...,1。a(m,i)是m阶的第i个线性预测系数。k(m)是第m个反射系数。 
(2)如图5所示,反射系数k分组器将R个反射系数分为d组,每组包含相邻M个反射系数。例如,第j组的第i个系数k(j,i)与k(i)的关系可以表示为k(j,i)=k(jM+i),j=0,1,...,d-1,i=1,2,...,M。 
(3)对每组M阶反射系数,图5中k→a转化器使用背景技术中提及的方法计算出对应的M阶线性预测系数a(j,i),j=0,1,...,d-1,i=1,2,...,M。 
(4)对每组M个线性预测系数,图5中a→lsf转化器使用背景技术中提及的方法计算出对应的线谱频率参数lsf(j,i),j=0,1,...,d-1,i=1,2,...,M。由于 这些组的线谱频率参数都分布在(0,π)区间,分布情况类似,因此可用相同的码本量化它们。 
(5)矢量量化器矢量量化使用相同的量化码本对d组线谱频率参数分别作矢量量化,得到d个索引号。这些索引号会进入通信网络,并被传送到输出端。 
2.解码技术方案; 
(1)根据通信网络接收的d个索引号可以恢复d组线谱频率参数lsf(j,i),j=0,1,...,d-1,i=1,2,...,M。对d组线谱频率参数。对d组M阶线谱频率参数,使用图5中lsf→a转化器计算对应的M阶线性预测系数a(j,i),j=0,1,...,d-1,i=1,2,...,M。 
在解码技术方案中涉及的变量R、M、d的取值范围均相同,R、M、d均为正整数,R范围为10~100,M范围为8~16;R、M、d须满足关系R=dM; 
(2)对d组M阶线性预测系数a(j,i),使用图5中a→k转化器计算对应的M阶反射系数k(j,i),j=0,1,...,d-1,i=1,2,...,M。 
(3)对d组反射系数k(j,i),j=0,1,...,d-1。使用图5中反射系数组合器按顺序组成R阶反射系数k(jM+i)=k(j,i),j=0,1,...,d-1,i=1,2,...,M。 
(4)对R阶反射系数k(i),图5中k→a转化器使用背景技术中提及的方法转换为R阶线性预测系数a(i),i=1,2,...,R。 
以R=50、M=10、d=5为例,在线性预测系数编码输出50bit的情况下,运算量、码本体积等的情况如下。 
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。 

Claims (1)

1.一种采用高阶线性预测系数分组矢量量化的语音编解方法,其特征在于:分编码和解码两步骤,
第一步:编码,
编码按照以下步骤进行:
(1)使用莱文森-德宾算法进行高阶线性预测分析得到R个线性预测系数a(i)并且R=dM;可由已知R个线性预测系数a(i)得到R个反射系数k(i)(i=1,2,...,R);
所述已知R个线性预测系数a(i),求R个反射系数k(i)的递推方法为:k(m)=-a(m,m),
a(m-1,i)=[a(m,i)+k(m)a(m,m–i)]/[1–k(i)],
其中,m是阶数,m=R,R–1,…,1;a(m,i)是进行m阶线性预测时的第i个线性预测系数,km)是第m个反射系数;
所述R、M、d均为正整数,R范围为10~100,M范围为8~16;R、M、d须满足关系R=dM;
(2)反射系数k分组器将R个反射系数k(i)(i=1,2,...,R)分为d组,每组包含相邻M个反射系数k(i)(i=1,2,...,M);所述的第j组的第i个系数k(j,i)与k(i)的关系表示为k(j,i)=k(jM+i)(j=0,1,...,d-1;i=1,2,...,M);所述R、M、d均为正整数,R范围为10~100,M范围为8~16;R、M、d须满足关系R=dM;
(3)对每组M阶反射系数k(j,i),经过k→a转化器计算出对应的M阶线性预测系数a(j,i)(j=0,1,...,d-1;i=1,2,...,M);所述R、M、d均为正整数,R范围为10~100,M范围为8~16;R、M、d须满足关系R=dM;
所述已知反射系数k(i),求线性预测系数a(i)的递推方法为:
a(m,m)=k(m),
a(m,i)=[a(m-1,i)+k(m)a(m–1,m–i)],
其中,m是阶数,m=1,2,...,M;a(m,i)是m阶线性预测时的第i个线性预测系数,i=1,2,...,m–1;k(m)是第m个反射系数;
(4)对每组已知M个线性预测系数a(j,i)经过a→lsf转化器计算出对应的线谱频率参数lsf(j,i)(j=0,1,...,d-1;i=1,2,...,M);所述R、M、d均为正整数,R范围为10~100,M范围为8~16;R、M、d须满足关系R=dM;
所述已知线性预测系数a(i),求线谱频率参数lsf(i)的方法为:
使用线性预测系数a(i)可以构建两个多项式P(z)和Q(z);
P(z)=A(z)+z-(M+1)A(z-1),
Q(z)=A(z)–z-(M+1)A(z-1);
所述
Figure FDA00002119191100021
M是线性预测阶数,z代表Z变换域的自变量;
方程P(z)=0与Q(z)=0在余弦域的根分别为lspP(i)与lspQ(i),i=1,2,...,M+1,称lspP(i)与lspQ(i)为线谱对系数,当A(z)的零点都位于单位圆内时,P(z)和Q(z)的零点都位于单位圆上,P(z)和Q(z)的零点沿着单位圆上随着ω的增加交替出现,若除去1和-1这两个零点,P(z)和Q(z)各有M个零点,当A(z)满足最小相位特性时,可以由线性预测系数a(i)唯一确定线谱频率参数lspP(i)与lspQ(i),i=1,2,...,M/2;由lspP(i)、lspQ(i)计算反余弦即可得到lsfP(i)、lsfQ(i);
lsfP(i)=arccos[lspP(i)],
lsfQ(i)=arccos[lspQ(i)];
lsfP(i)、lsfQ(i)交错排列
lsf(2i)=lsfP(i),
lsf(2i+1)=lsfQ(i);
可得lsf(i);
(5)矢量量化器使用相同的量化码本对d组线谱频率参数分别作矢量量化得到d个索引号,索引号和其它编码参数一起被打包成比特流进入通信网络并被传送到输出端;
第二步:解码,
解码按照以下步骤进行:
(1)根据通信网络接收的d个索引号可以恢复d组线谱频率参数lsf(j,i)(j=0,1,...,d-1;i=1,2,...,M),对d组线谱频率参数使用lsf→a转化器计算对应的M阶线性预测系数a(j,i)(j=0,1,...,d-1;i=1,2,...,M);所述M范围为8~16,R、M、d须满足关系R=dM;R范围为10~100,所述R、M、d均为正整数;
所述已知线谱频率参数lsf(i),使用lsf→a转化器计算对应的M阶线性预测系数a(i)的方法为:
将偶数序号的lsf(i)参数定义为lsfP(i),奇数序号的lsf(i)参数定义为lsfQ(i),lsfP(i)=lsf(2i),
lsfQ(i)=lsf(2i+1);
其中,i=1,2,…,M/2;对线谱频率参数lsfP(i)、lsfQ(i)取余弦可以计算LSP参数lspP(i)、lspQ(i),即
lspP(i)=cos[lsfP(i)],
lspQ(i)=cos[lsfQ(i)]。
使用LSP参数lspP(i)、lspQ(i)可以构建两个多项式P(z)和Q(z)
P ( z ) = ( 1 + z - 1 ) Π i = 1 M / 2 [ 1 - 2 lsp P ( i ) z - 1 + z - 2 ] ,
Q ( z ) = ( 1 - z - 1 ) Π i = 1 M / 2 [ 1 - 2 lsp Q ( i ) z - 1 + z - 2 ] .
其中,П表示连乘,z代表Z变换域的自变量,M是线性预测阶数代表系数a(i)的数目;
多项式A(z)可以用多项式P(z)和Q(z)表示为
A(z)=[P(z)+Q(z)]/2。
根据表达式
Figure FDA00002119191100041
按照z-i系数对应相等的原则,即可确定出a(i)的值;
(2)对d组M阶线性预测系数a(j,i)使用a→k转化器计算对应的M阶反射系数k(j,i)(j=0,1,...,d-1;i=1,2,...,M);所述M范围为8~16,R、M、d满足关系R=dM;R范围为10~100,所述R、M、d均为正整数;
所述已知线性预测系数a(i),使用a→k转化器求反射系数k(i)的递推方法为:k(m)=-a(m,m),
a(m-1,i)=[a(m,i)+k(m)a(m,m–i)]/[1–k(i)],
其中,m是阶数,m=M,M–1,...,1;a(m,i)是m阶的第i个线性预测系数,k(m)是第m个反射系数;所述M范围为8~16,R、M、d满足关系R=dM;R范围为10~100,所述R、M、d均为正整数;
(3)对d组反射系数k(j,i)(j=0,1,...,d-1)使用反射系数组合器按顺序组成R阶反射系数k(jM+i)=k(j,i)(j=0,1,...,d-1,i=1,2,...,M);所述M范围为8~16,R、M、d满足关系R=dM;R范围为10~100,所述R、M、d均为正整数;
(4)对R阶反射系数k(i)使用k→a转化器转换为R阶线性预测系数a(i)(i=1,2,...,R):所述R范围为10~100,R、M、d满足关系R=dM;M范围为8~16,所述R、M、d均为正整数;
所述已知R阶反射系数K(i),使用k→a转化器求R阶线性预测系数a(i)的递推方法为:
a(m,m)=k(m),
a(m,i)=[a(m–1,i)+k(m)a(m–1,m–i)],
其中,m是阶数,m=1,2,...,R;a(m,i)是m阶的第i个线性预测系数,i=1,2,...,m–1,k(m)是第m个反射系数;所述R范围为10~100,R、M、d满足关系R=dM;M范围为8~16,所述R、M、d均为正整数。
CN201210334612.5A 2012-09-10 2012-09-10 一种采用高阶线性预测系数分组矢量量化的语音编解方法 Expired - Fee Related CN102867516B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210334612.5A CN102867516B (zh) 2012-09-10 2012-09-10 一种采用高阶线性预测系数分组矢量量化的语音编解方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210334612.5A CN102867516B (zh) 2012-09-10 2012-09-10 一种采用高阶线性预测系数分组矢量量化的语音编解方法

Publications (2)

Publication Number Publication Date
CN102867516A true CN102867516A (zh) 2013-01-09
CN102867516B CN102867516B (zh) 2014-08-27

Family

ID=47446340

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210334612.5A Expired - Fee Related CN102867516B (zh) 2012-09-10 2012-09-10 一种采用高阶线性预测系数分组矢量量化的语音编解方法

Country Status (1)

Country Link
CN (1) CN102867516B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103474067A (zh) * 2013-08-19 2013-12-25 安徽科大讯飞信息科技股份有限公司 语音信号传输方法及系统
CN107564535A (zh) * 2017-08-29 2018-01-09 中国人民解放军理工大学 一种分布式低速语音通话方法
CN107945812A (zh) * 2014-04-25 2018-04-20 株式会社Ntt都科摩 线性预测系数变换装置和线性预测系数变换方法
CN109214543A (zh) * 2017-06-30 2019-01-15 华为技术有限公司 数据处理方法及装置
CN110085243A (zh) * 2013-07-18 2019-08-02 日本电信电话株式会社 线性预测分析装置、方法、程序以及记录介质
CN111179952A (zh) * 2014-03-07 2020-05-19 弗劳恩霍夫应用研究促进协会 用于信息编码的概念

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002093551A2 (en) * 2001-05-16 2002-11-21 Nokia Corporation Method and system for line spectral frequency vector quantization in speech codec
CN101110214A (zh) * 2007-08-10 2008-01-23 北京理工大学 一种基于多描述格型矢量量化技术的语音编码方法
CN101145344A (zh) * 2006-09-15 2008-03-19 华为技术有限公司 线谱频率矢量量化的方法及系统
CN101192408A (zh) * 2006-11-24 2008-06-04 华为技术有限公司 选择导谱频率系数矢量量化的方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002093551A2 (en) * 2001-05-16 2002-11-21 Nokia Corporation Method and system for line spectral frequency vector quantization in speech codec
CN101145344A (zh) * 2006-09-15 2008-03-19 华为技术有限公司 线谱频率矢量量化的方法及系统
CN101192408A (zh) * 2006-11-24 2008-06-04 华为技术有限公司 选择导谱频率系数矢量量化的方法及装置
CN101110214A (zh) * 2007-08-10 2008-01-23 北京理工大学 一种基于多描述格型矢量量化技术的语音编码方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
梁彦霞: "低速率多带激励线性预测语音编码技术的研究", 《中国博士学位论文全文数据库》 *

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110085243B (zh) * 2013-07-18 2022-12-02 日本电信电话株式会社 线性预测分析装置、线性预测分析方法以及记录介质
CN110085243A (zh) * 2013-07-18 2019-08-02 日本电信电话株式会社 线性预测分析装置、方法、程序以及记录介质
CN103474067B (zh) * 2013-08-19 2016-08-24 科大讯飞股份有限公司 语音信号传输方法及系统
CN103474067A (zh) * 2013-08-19 2013-12-25 安徽科大讯飞信息科技股份有限公司 语音信号传输方法及系统
CN111179952B (zh) * 2014-03-07 2023-07-18 弗劳恩霍夫应用研究促进协会 用于信息编码的概念
US11640827B2 (en) 2014-03-07 2023-05-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Concept for encoding of information
CN111179952A (zh) * 2014-03-07 2020-05-19 弗劳恩霍夫应用研究促进协会 用于信息编码的概念
CN107945812A (zh) * 2014-04-25 2018-04-20 株式会社Ntt都科摩 线性预测系数变换装置和线性预测系数变换方法
CN107945812B (zh) * 2014-04-25 2022-01-25 株式会社Ntt都科摩 线性预测系数变换装置和线性预测系数变换方法
CN109214543B (zh) * 2017-06-30 2021-03-30 华为技术有限公司 数据处理方法及装置
US11334758B2 (en) 2017-06-30 2022-05-17 Huawei Technologies Co., Ltd. Method and apparatus of data processing using multiple types of non-linear combination processing
CN109214543A (zh) * 2017-06-30 2019-01-15 华为技术有限公司 数据处理方法及装置
US11748452B2 (en) 2017-06-30 2023-09-05 Huawei Technologies Co., Ltd. Method for data processing by performing different non-linear combination processing
CN107564535B (zh) * 2017-08-29 2020-09-01 中国人民解放军理工大学 一种分布式低速语音通话方法
CN107564535A (zh) * 2017-08-29 2018-01-09 中国人民解放军理工大学 一种分布式低速语音通话方法

Also Published As

Publication number Publication date
CN102867516B (zh) 2014-08-27

Similar Documents

Publication Publication Date Title
CN102867516B (zh) 一种采用高阶线性预测系数分组矢量量化的语音编解方法
CN102119414B (zh) 用于在超帧中量化和逆量化线性预测系数滤波器的设备和方法
CN103098126B (zh) 音频编码器、音频解码器及利用复预测处理多信道音频信号的相关方法
CN101023471B (zh) 可伸缩性编码装置、可伸缩性解码装置、可伸缩性编码方法、可伸缩性解码方法、通信终端装置以及基站装置
CN101542599B (zh) 用于编码和解码宽带语音信号的方法、装置和系统
CN100370517C (zh) 一种对编码信号进行解码的方法
KR100872538B1 (ko) Lpc 파라미터의 벡터 양자화 장치, lpc 파라미터복호화 장치, lpc 계수의 복호화 장치, 기록 매체,음성 부호화 장치, 음성 복호화 장치, 음성 신호 송신장치, 및 음성 신호 수신 장치
CN102341849B (zh) 锥形矢量音频编码
CN103280221B (zh) 一种基于基追踪的音频无损压缩编码、解码方法及系统
CN104217726A (zh) 一种无损音频压缩编码方法及其解码方法
WO2005027094A1 (fr) Procede et dispositif de quantification de vecteur multi-resolution multiple pour codage et decodage audio
EP2207167A1 (en) Multistage quantizing method and apparatus
CN101420231A (zh) 编码方法和装置、以及程序
CN103050122B (zh) 一种基于melp的多帧联合量化低速率语音编解码方法
CN101162584A (zh) 使用带宽扩展技术对音频信号编码和解码的方法和设备
CN103714822A (zh) 基于silk编解码器的子带编解码方法及装置
CN103236262B (zh) 一种语音编码器码流的转码方法
CN103918028A (zh) 基于自回归系数的有效表示的音频编码/解码
CN102982807B (zh) 用于对语音信号lpc系数进行多级矢量量化的方法和系统
CN101350199A (zh) 音频编码器及音频编码方法
CN101572092B (zh) 编解码端的固定码本激励的搜索方法及装置
Adoul et al. Baseband speech coding at 2400 bps using" Spherical vector quantization"
CN101604524B (zh) 立体声编码方法及其装置、立体声解码方法及其装置
CN102903365A (zh) 一种在解码端细化窄带声码器参数的方法
JPH05265499A (ja) 高能率符号化方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20140827

Termination date: 20180910