CN100550132C - 线谱频率矢量量化的方法及系统 - Google Patents

线谱频率矢量量化的方法及系统 Download PDF

Info

Publication number
CN100550132C
CN100550132C CNB200610153330XA CN200610153330A CN100550132C CN 100550132 C CN100550132 C CN 100550132C CN B200610153330X A CNB200610153330X A CN B200610153330XA CN 200610153330 A CN200610153330 A CN 200610153330A CN 100550132 C CN100550132 C CN 100550132C
Authority
CN
China
Prior art keywords
vector
sub
coefficient
value
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CNB200610153330XA
Other languages
English (en)
Other versions
CN101145344A (zh
Inventor
李立雄
张德军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CNB200610153330XA priority Critical patent/CN100550132C/zh
Publication of CN101145344A publication Critical patent/CN101145344A/zh
Application granted granted Critical
Publication of CN100550132C publication Critical patent/CN100550132C/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明提供了一种线谱频率矢量量化的方法,包括:将当前帧线谱频率矢量或者当前帧线谱频率残差矢量分为两组子矢量{ai}、{bj},对其中一组子矢量{ai}进行矢量量化后得到一组子矢量系数值ai q,选择其中部分子矢量系数值aj,k q对未量化的一组子矢量{bj}系数进行预测,得到子矢量系数预测值bj predict;将所述未量化的一组子矢量{bj}系数与其相应的子矢量系数预测值bj predict进行差值运算,得到一组预测值残差矢量{bj′},对该预测值残差矢量{bj′}进行矢量量化。通过对本发明和AMR-WB+所述矢量量化方法基于ITU-T的评测标准协议P.862,利用客观评测标准WB-PESQ进行的语音质量客观评测可以得出,本发明相对于AMR-WB+提高了语音质量的感知评价PESQ分值。

Description

线谱频率矢量量化的方法及系统
技术领域
本发明涉及多媒体语音编码技术领域,尤其涉及一种线谱频率矢量量化的方法及系统。
背景技术
随着近几年计算机技术的不断发展,各种多媒体应用越来越受到人们的青睐。作为多媒体应用不可缺少的语音编码技术,在最近十几年也取得了很大的进步。在语音编码技术领域,线谱频率(LSF:Linear Spectral Frequency)系数精度关系到语音编码质量、声道幅度谱特性等方面的好坏,所以一般采用对LSF矢量进行量化来保证LSF系数精度。
对LSF矢量进行量化,就是对LSF矢量系数的量化。在AMR-WB+(Extended Adaptive MultiRate WideBand Codec)中对LSF矢量系数的量化具体实现方法如下:
首先求出当前帧的LSF残差矢量r(n):
r(n)=z(n)-p(n)
其中,z(n)=isfn-mean_isf, p ( n ) = 1 3 r q ( n - 1 ) , isfn为第n帧LSF矢量,mean_isf为LSF均值矢量,p(n)为当前帧预测值矢量,rq(n-1)为前一帧量化后的LSF残差矢量;
进而,得到LSF残差矢量r=[r0,r1,…,r15];
之后,对LSF残差矢量r=[r0,r1,…,r15]进行分裂多级矢量量化(S-MSVQ),其被分裂为两个子矢量r1(n)和r2(n),其中r1(n)是9维,r2(n)是7维,对这两个子矢量再分别进行两级矢量量化,在第一级矢量量化中,用8比特量化r1(n),8比特量化r2(n);
在第一级矢量量化后,得到两个量化残差矢量,记作r′i=ri-rq i,i=1,2。在第二级矢量量化中,再将r′1分裂成3个子矢量,r′2分裂成2个子矢量,分别用下表1中分配的比特数进行量化:
表1:LSF矢量量化比特分配表
Figure C20061015333000071
最后,用均方误差准则作为量化过程中的失真测度。通常,对于一个输入的LSP矢量或者LSF残差矢量ri,i=1,2和码书中的第k个码字
Figure C20061015333000072
来说,量化的过程就是在码书中寻找使下式E值最小的那个码字的索引号:
E = Σ i = m n ( r i - r q i k ) 2
其中,m和n表示子矢量中的第一个和最后一个元素在整个LSF矢量中的元素序号。
于是,得出对LSF矢量量化需要的比特数为:一级矢量量化中9维矢量r1(n)需要8比特,7维矢量r2(n)需要8比特;二级矢量量化中,4个3维矢量分别需要6、7、7和5比特,4维矢量需要5比特,总共需要46比特。
那么,针对上述AMR-WB+中LSF矢量量化的过程,能否再提高矢量量化的精度,即提高语音主客观的质量,或者提出另外一种矢量量化的方法及系统,是本发明研究的对象。
发明内容
为此,本发明所要解决的技术问题是:提供一种LSF矢量量化的方法及系统,来实现对LSF矢量的量化,减少平均量化误差,以得到好的量化效果。
于是,本发明提供了一种线谱频率矢量量化的方法,包括:
将当前帧线谱频率矢量或者当前帧线谱频率残差矢量分为两组子矢量{ai}、{bj},所述当前帧线谱频率残差矢量为当前帧线谱频率矢量减去均值线谱频率矢量、再减去当前帧的前一帧线谱频率矢量对当前帧线谱频率矢量的贡献所得到的差值;对其中一组子矢量{ai}进行矢量量化后得到一组子矢量系数值ai q,选择其中部分子矢量系数值aj,k q对未量化的一组子矢量{bj}系数进行预测,得到子矢量系数预测值bj predict;将所述未量化的一组子矢量{bj}系数与其相应的子矢量系数预测值bj predict进行差值运算,得到一组预测值残差矢量{bj′},对该预测值残差矢量{bj′}进行矢量量化。
其中,对所述一组子矢量{ai}进行分组,对相应组的子矢量进行矢量量化得到子矢量系数值ai q,选择相应组中部分矢量系数值对未量化的一组子矢量{bj}系数进行预测。
其中,所述对未量化的一组子矢量{bj}系数进行预测,求预测值的公式为: b j predict = r j , 0 + Σ k = 1 w ( r j , k × a j , k q ) , 其中,rj,k为线性预测系数,由aj,k q所确定,k为自然数,aj,k q为所述一组子矢量{ai}的部分矢量的量化值,其组成的矩阵为:
A = 1 a 1 q . . . a w - 1 q ,
对子矢量{bj}预测的预测系数组成的预测矩阵为:
R = r 0,0 , r 0,1 , . . . , r 0 , w - 1 r 1,0 , r 1,1 , . . . , r 1 , w - 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . r m - 1,0 , r m - 1,1 , . . . , r m - 1 , w - 1 , 其中m为待量化LSF残差系数的个数,
预测值组成的矩阵为:
B = b 0 predict b 1 predict . . . b m - 1 predict = R · A = R · 1 a 1 q . . . a w - 1 q = r 0,0 , r 0,1 , . . . , r 0 , w - 1 r 1,0 , r 1,1 , . . . , r 1 , w - 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . r m - 1,0 , r m - 1,1 , . . . , r m - 1 , w - 1 · 1 a 1 q . . . a w - 1 q .
进一步,求最佳预测值bj predict的方法为:
对于每一帧LSF残差矢量,通过从ω个预先计算好的预测矩阵Rl中选择一个预测误差最小的预测矩阵,其判断准则为,其中,l为0,1,…,ω-1:
利用均方误差准则进行判断,计算针对不同的预测矩阵Rl所对应的均方误差El
E l = Σ j = m n ( b j - b j predict ) 2 , l = 0,1 , . . . , ω - 1 , 其中,对应不同的子矢量m和n值不同,
计算出El的最小值Eλ
Eλ=Min(El),l=0,1,...,ω-1,
并找出Eλ对应的预测矩阵Rλ,此预测矩阵Rλ即为最佳预测矩阵,并根据最佳预测矩阵Rλ求出预测值bj predict
其中,对所述一组预测值残差矢量{bj′}系数进行分组,分别对所述组子矢量进行矢量量化。
其中,所述当前帧的前一帧线谱频率矢量对当前帧线谱频率矢量的贡献矢量分量值为an,i predict=MU·an-1,i,其中,an-1,i表示第n-1帧第i个残差线谱频率系数,MU为经验值。
本发明还提供了一种实现线谱频率矢量量化的系统,包括:
执行将当前帧线谱频率矢量系数或者当前帧线谱频率残差矢量系数进行分组、得到两组子矢量{ai}、{bj}步骤的分组单元(10);
执行对其中一组子矢量{ai}直接进行矢量量化后得到一组矢量系数值ai q步骤的矢量量化单元(11);
执行从所述矢量系数值ai q中选择部分矢量系数值aj,k q对未量化的一组子矢量{bj}系数进行预测,得到矢量系数预测值bj predict步骤的预测单元(12);
执行所述子矢量{bj}系数与其相应的矢量系数预测值bj predict进行差值运算,得到一组预测值残差矢量{bj′}步骤的残差矢量单元(13);
当前帧线谱频率矢量系数或者当前帧线谱频率残差矢量系数在分组单元(10)进行分组后,到矢量量化单元(11)中对其中一组子矢量{ai}进行矢量量化,利用矢量量化单元(11)中得到的部分矢量系数在预测单元(12)对未量化的一组子矢量{bj}系数进行预测,并在残差矢量单元(13)中求得残差矢量{bj′},并回到矢量量化单元(11)对所述残差矢量{bj′}进行量化。
其中,所述分组单元(10),还包括:
对一组子矢量{ai}进行分组、得到相应组子矢量步骤的子分组单元(101)。
其中,所述预测单元(12),还包括:
执行对于每一帧LSF残差矢量,通过从ω个预先计算好的预测矩阵Rl中选择一个预测误差最小的预测矩阵,其判断准则为,其中,l为0,1,…,ω-1:
利用均方误差准则进行判断,计算针对不同的预测矩阵Rl所对应的均方误差El
E l = Σ j = m n ( b j - b j predict ) 2 , l = 0,1 , . . . , ω - 1 , 其中,对应不同的子矢量m和n值不同,
计算出El的最小值Eλ
Eλ=Min(El),l=0,1,...,ω-1,
并找出Eλ对应的预测矩阵Rλ,此预测矩阵Rλ即为最佳预测矩阵,并根据最佳预测矩阵Rλ求出最佳预测值bj predict步骤的最佳预测值单元(121)。
其中,所述残差矢量单元(13),还包括:
执行对所述预测值残差矢量{bj′}系数进行分组,得到对应组预测值残差子矢量步骤的残差矢量分组单元(131)。
可见,本发明采用分组形式,利用对其中一组子矢量的量化来预测另外一组未被量化的子矢量,进而求出未被量化的子矢量组对应的预测值残差矢量,再进一步对该预测值残差矢量进行矢量量化,实现了对LSF矢量或者LSF残差矢量量化;
通过对本发明和AMR-WB+所述矢量量化方法基于ITU-T的评测标准协议P.862,利用客观评测标准WB-PESQ进行的语音质量客观评测可以得出,本发明相对于AMR-WB+提高了语音质量的感知评价PESQ(Perceptual Evaluation ofSpeech Quality)分值。
附图说明
图1为本发明实施例的系统框图;
图2为AMR-WB+与本发明实施例的语音质量的感知评价测试结果对比图。
具体实施方式
下面,结合附图对本发明实施例进行详细描述。
本发明采用分组的方法通过矢量量化、预测、求残差矢量、再矢量量化的方法实现对LSF矢量或者LSF残差矢量量化,其实现的机理是利用了帧内及帧间LSF矢量系数的相关性。
下面以本发明实施例来具体说明矢量量化的过程:
实施例1
以16维LSF矢量为例,对16维LSF矢量进行矢量量化,首先计算LSF残差矢量,对LSF残差矢量进行矢量量化,其优点在于,可以提高LSF系数矢量量化的精度,具体实现步骤为:
首先求出LSF残差矢量,
{res_isfn,i}={isfn,i-mean_isfi-pred_isfn,i},i=0,1,...,14,15
其中,isfn,i为当前第n帧第i个LSF矢量系数,mean_isfi为LSF均值矢量的第i个LSF系数,pred_isfn,i表示当前第n帧的第i个LSF预测系数,即当前帧的前一帧LSF矢量对当前帧LSF矢量的贡献,其具体由一阶滑动平均(MA)预测法得到:pred_isfn,i=MU×res_isfn-1,i
其中,res_isfn-1,i为当前帧的前一帧,即第n-1帧第i个ISF差值系数,MU为经验值,一般取值在0.3~0.8之间;
对当前帧LSF残差矢量系数res_isfn,i进行分组,分为两组子矢量{ai}和{bj},其分别对应的矢量系数为:
ai:res_isf0,res_isf2,res_isf4,res_isf6,res_isf8,res_isf10,res_isf12,res_isf14
bj:res_isf1,res_isf3,res_isf5,res_isf7,res_isf9,res_isf11,res_isf13,res_isf15
对其中一组子矢量,例如{ai}用19比特进行矢量量化,得到量化后的矢量系数值为ai q
res_isf0 q,res_isf2 q,res_isf4 q,res_isf6 q,res_isf8 q,res_isf10 q,res_isf12 q,res_isf14 q
选择其中一部分或者全部矢量量化系数值aj,k q,本实施例选择使用全部矢量量化系数值aj,k q对未量化的一组子矢量{bj}系数进行预测,得到矢量系数预测值bj predict为:
b j predict = r j , 0 + Σ k = 1 w ( r j , k × a j , k q )
其中,rj,k为线性预测系数,由aj,k q所确定,k为自然数,aj,k q为所述一组子矢量{ai}的部分矢量的量化值。
其中,选择一部分和全部矢量量化后的值来进行预测,其区别仅在于得出的矢量量化精度不同,选择全部矢量进行预测,其得出的矢量量化精度高些,不影响本发明的实施;
其中,作为优选的,也可以先将子矢量{ai}再进行分组,分为若干个子矢量,分别对相应组的子矢量进行矢量量化,例如分三组,
子矢量{ai1}={res_isf0,res_isf2,res_isf4}
子矢量{ai2}={res_isf6,res_isf8,res_isf10};
子矢量{ai3}={res_isf12,res_isf14,res_isf1};
对这三组子矢量先用10比特、9比特、9比特进行矢量量化,得到矢量量化值:
a i 1 q = { res _ isf 0 q , res _ isf 2 q , res _ isf 4 q } , a i 2 q = { res _ isf 6 q , res _ isf 8 q , res _ isf 10 q }
a i 3 q = { res _ isf 12 q , res _ isf 14 q , res _ isf 1 q } ,
这样做的优点在于,矢量量化的结果更精确,不影响本发明的实施;
本发明所采用的求预测值的公式为: b j predict = r j , 0 + Σ k = 1 w ( r j , k × a j , k q ) , 其中,rj,k为线性预测系数,由aj,k q所确定,k为自然数,aj,k q为所述一组子矢量{ai}的部分矢量的量化值,其组成的矩阵为:
A = 1 a 1 q . . . a w - 1 q ,
对子矢量{bj}预测的预测系数组成的预测矩阵为:
R = r 0,0 , r 0,1 , . . . , r 0 , w - 1 r 1,0 , r 1,1 , . . . , r 1 , w - 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . r m - 1,0 , r m - 1,1 , . . . , r m - 1 , w - 1 , 其中m为待量化LSF残差系数的个数,
预测值组成的矩阵为:
B = b 0 predict b 1 predict . . . b m - 1 predict = R · A = R · 1 a 1 q . . . a w - 1 q = r 0,0 , r 0,1 , . . . , r 0 , w - 1 r 1,0 , r 1,1 , . . . , r 1 , w - 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . r m - 1,0 , r m - 1,1 , . . . , r m - 1 , w - 1 · 1 a 1 q . . . a w - 1 q ;
进而,求出本实施例中的aj,k q为:
res_isf0 q,res_isf1 q,res_isf2 q,res_isf4 q
res_isf6 q,res_isf8 q,res_isf10 q,res_isf12 q,res_isf14 q
其中,作为一种实施例,利用{bj}前后两个量化的LSF系数来预测{bj}系数,其中,对res_isf15不进行预测,经计算得到矢量系数预测值bj predict为:
r1,0+r1,1res_isf2 q+r1,2res_isf4 q;r2,0+r2,1res_isf4 q+r2,2res_isf6 q
r3,0+r3,1res_isf6 q+r3,2res_isf8 q;r4,0+r4,1res_isf8 q+r4,2res_isf10 q
r5,0+r5,1res_isf10 q+r5,2res_isf12 q;r6,0+r6,1res_isf12 q+r6,2res_isf14 q
将子矢量{bj}系数与其相应的矢量系数预测值bj predict进行差值运算,得到一组预测值残差矢量{bj′}={bj-bj predict}为:
{res_isfj-(rj,0+rj,1res_isfj-1 q+rj,2res_isfj+1 q)},其中j=3、5、7、9、11、13;
之后,再将预测值残差矢量{bj′}和res_isf15一起进行矢量量化,其量化需要27比特;
其中,作为优选的,对预测值残差矢量{bj′}也可以先进行分组,分成若干个子矢量后,再对相应的子矢量进行矢量量化,例如,将上述未量化的预测值残差及res_isf15分成两组子矢量{bj1′}{bj2′}:
{bj1′}={res_isf3′,res_isf5′,res_isf7′}
{bj2′}={res_isf9′,res_isf11′,res_isf13′,res_isf15}
然后分别使用9比特、9比特矢量量化所述子矢量{bj1′}{bj2′},这样做的结果是LSF矢量量化的精度更高,不影响本发明的实施;
至此,对16维LSF矢量进行矢量量化就完成了,各个子矢量对应的最佳量化矢量(即最佳码本)的索引号。共需要的矢量量化数维46比特;
其中,依据各ISF系数对误差的敏感程度不同,对矢量{ai1}分配10比特、{ai2}、分配10比特,矢量{ai3}分配10比特,矢量{bj1′}分配10比特,矢量{bj2′}分配10比特,总共需要50比特,不影响本发明的实施;
或者,依据各ISF系数对误差的敏感程度不同,也可以,对矢量{ai1}分配9比特,矢量{ai2}分配9比特,矢量{ai3}分配8比特,矢量{bj1′}分配8比特,矢量{bj2′}分配8比特,总共需要42比特,不影响本发明的实施。
对应本发明实施例的一种实现线谱频率矢量量化的系统,如图1所示,包括:
执行将当前帧线谱频率矢量系数或者当前帧线谱频率残差矢量系数进行分组、得到两组子矢量{ai}、{bj}步骤的分组单元(10);
执行对其中一组子矢量{ai}直接进行矢量量化后得到一组矢量系数值ai q步骤的矢量量化单元(11);
执行从所述矢量系数值ai q中选择部分矢量系数值alk q对未量化的一组子矢量{bj}系数进行预测,得到矢量系数预测值bj predict步骤的预测单元(12);
执行所述子矢量{bj}系数与其相应的矢量系数预测值bj predict进行差值运算,得到一组预测值残差矢量{bj′}步骤的残差矢量单元(13);
当前帧线谱频率矢量系数或者当前帧线谱频率残差矢量系数在分组单元(10)进行分组后,到矢量量化单元(11)中对其中一组子矢量{ai}进行矢量量化,利用矢量量化单元(11)中得到的部分矢量系数在预测单元(12)对未量化的一组子矢量{bj}系数进行预测,并在残差矢量单元(13)中求得残差矢量{bj′},并回到矢量量化单元(11)对所述残差矢量{bj′}进行量化;
其中,所述分组单元(10),还包括:
对一组子矢量{ai}进行分组,例如分为子矢量{ai1}、{ai2},得到相应组子矢量步骤的子分组单元(101);
其中,所述预测单元(12),还包括:
执行对于每一帧LSF残差矢量,通过从ω个预先计算好的预测矩阵Rl中选择一个预测误差最小的预测矩阵,其判断准则为,其中,l为0,1,…,ω-1,:
利用均方误差准则进行判断,计算针对不同的预测矩阵Rl所对应的均方误差El
E l = Σ j = m n ( b j - b j predict ) 2 , l = 0,1 , . . . , ω - 1 , 其中,对应不同的子矢量m和n值不同,
计算出El的最小值Eλ
Eλ=Min(El),l=0,1,...,ω-1,
并找出Eλ对应的预测矩阵Rλ,此预测矩阵Rλ即为最佳预测矩阵,并根据最佳预测矩阵Rλ求出最佳预测值bj predict步骤的最佳预测值单元(121);
其中,所述残差矢量单元(13),还包括:
执行对所述预测值残差矢量{bj′}系数进行分组,例如,分为{bj1′}、{bj21′},得到对应组预测值残差子矢量步骤的残差矢量分组单元(131)。
实施例2
本实施例是一种增强型的帧内预测方法,本实施例与实施例1不同之处,具体在于:
所述预测值bj predict的最佳值为:针对不同LSF残差矢量对应不同的线性预测系数rj,k,即对应于不同的预测矩阵Rl,不妨设l=ω,即有ω个不同的预测矩阵,利用均方误差准则进行判断,计算针对不同的预测矩阵Rl所对应的均方误差El
E l = Σ j = m n ( b j - b j predict ) 2 , l = 0,1 , . . . , ω - 1 , 对应不同的子矢量m和n值不同。
计算出El的最小值,
Eλ=Min(El),l=0,1,...,ω-1
并找出对应的使El值最小的预测矩阵Rλ,此预测矩阵Rλ即为最佳预测矩阵;
其余步骤与实施例1相同,在此不再重复描述。
实施例3
本实施例是一种直接对对16维LSF矢量进行矢量量化的方法,与实施例1不同之处在于:
直接对LSF矢量进行分组,分为两组子矢量{ai}、{bj},其相应的矢量系数为:
ai:isf0,isf2,isf4,isf6,isf8,isf10,isf12,isf14
bj:isf1,isf3,isf5,isf0,isf7,isf9,isf11,isf13
其余步骤与实施例1相同,在此不再重复描述。
为检验本发明实施例所述方法及系统的性能,我们对AMR-WB+和本发明方法实施例的语音质量进行了客观评测,评测软件为ITU-T的P.862客观评测标准WB-PESQ。测试序列为3GPP组织提供的AMR-WB+的测试序列,由16个测试序列组成,其中包括语音、音乐、语音背景音乐,音乐背景语音等,如图2所示,测试序列均为wav单声道波形文件,采样频率为16000Hz,输出采样频率为16000Hz,编码速率为10.4kbit/s;
由此可见,对任意序列,本发明的PESQ分值均比AMR WB+要高0.025~0.455个MOS(Mean Opinion Score)分。
综上所述,本发明实施例所述方法及系统相比于AMR-WB+的语音质量提高了PESQ分值。
本发明实施例所述方法及系统减少了平均量化误差,经过统计本发明方法实施例和AMR-WB+的量化误差,本发明方法实施例的平均量化误差是AMRWB+的0.6倍左右,量化效果更好。以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1、一种在语音处理系统中应用的线谱频率矢量量化的方法,其特征在于,包括:
将当前帧线谱频率矢量或者当前帧线谱频率残差矢量分为两组子矢量{ai}、{bj},所述当前帧线谱频率残差矢量为当前帧线谱频率矢量减去均值线谱频率矢量、再减去当前帧的前一帧线谱频率矢量对当前帧线谱频率矢量的贡献所得到的差值;对其中一组子矢量{ai}进行矢量量化后得到一组子矢量系数值ai q,选择其中部分子矢量系数值aj,k q对未量化的一组子矢量{bj}系数进行预测,得到子矢量系数预测值bj predict;将所述未量化的一组子矢量{bj}系数与其相应的子矢量系数预测值bj predict进行差值运算,得到一组预测值残差矢量{bj′},对该预测值残差矢量{bj′}进行矢量量化,实现减少平均量化误差以提高语音编码质量。
2、根据权利要求1所述的方法,其特征在于,对所述一组子矢量{ai}进行分组,对相应组的子矢量进行矢量量化得到子矢量系数值ai q,选择相应组中部分矢量系数值对未量化的一组子矢量{bj}系数进行预测。
3、根据权利要求1所述的方法,其特征在于,所述对未量化的一组子矢量{bj}系数进行预测,求预测值的公式为: b j predict = r j , 0 + Σ k = 1 w ( r j , k × a j , k q ) , 其中,rj,k为线性预测系数,由aj,k q所确定,k为自然数,aj,k q为所述一组子矢量{ai}的部分矢量的量化值,其组成的矩阵为:
A = 1 a 1 q . . . a w - 1 q ,
对子矢量{bj}预测的预测系数组成的预测矩阵为:
R = r 0,0 , r 0,1 , . . . , r 0 , w - 1 r 1,0 , r 1,1 , . . . , r 1 , w - 1 . . . . . . . . . . . . . . . . . . . . . . . . r m - 1,0 , r m - 1,1 , . . . , r m - 1 , w - 1 , 其中m为待量化LSF残差系数的个数,
预测值组成的矩阵为:
B = b 0 predict b 1 predict . . . b m - 1 predict = R · A = R · 1 a 1 q . . . a w - 1 q = r 0,0 , r 0,1 , . . . , r 0 , w - 1 r 1,0 , r 1,1 , . . . , r 1 , w - 1 . . . . . . . . . . . . . . . . . . . . . . . . r m - 1,0 , r m - 1,1 , . . . , r m - 1 , w - 1 · 1 a 1 q . . . a w - 1 q .
4、根据权利要求3所述的方法,其特征在于,求最佳预测值bj predict的方法为:
对于每一帧LSF残差矢量,通过从ω个预先计算好的预测矩阵Rl中选择一个预测误差最小的预测矩阵,其判断准则为,其中,l为0,1,…,ω-1:
利用均方误差准则进行判断,计算针对不同的预测矩阵Rl所对应的均方误差El
E l = Σ j = m n ( b j - b j predict ) 2 , l=0,1,...,ω-1,其中,对应不同的子矢量m和n值不同,
计算出El的最小值Eλ
Eλ=Min(Ei),l=0,1,...,ω-1,
并找出Eλ对应的预测矩阵Rλ,此预测矩阵Rλ即为最佳预测矩阵,并根据最佳预测矩阵Rλ求出预测值bj predict
5、根据权利要求1所述的方法,其特征在于,对所述一组预测值残差矢量{bj′}系数进行分组,分别对所述组子矢量进行矢量量化。
6、根据权利要求1所述的方法,其特征在于,所述当前帧的前一帧线谱频率矢量对当前帧线谱频率矢量的贡献矢量分量值为an,i predict=MU·an-1,i,其中,an-1,i表示第n-1帧第i个残差线谱频率系数,MU为经验值。
7、一种用于语音处理的线谱频率矢量量化的系统,其特征在于,包括:
执行将当前帧线谱频率矢量系数或者当前帧线谱频率残差矢量系数进行分组、得到两组子矢量{ai}、{bj}步骤的分组单元(10);
执行对其中一组子矢量{ai}直接进行矢量量化后得到一组矢量系数值ai q步骤的矢量量化单元(11);
执行从所述矢量系数值ai q中选择部分矢量系数值aj,k q对未量化的一组子矢量{bj}系数进行预测,得到矢量系数预测值bj predict步骤的预测单元(12);
执行所述子矢量{bj}系数与其相应的矢量系数预测值bj predict进行差值运算,得到一组预测值残差矢量{bj′}步骤的残差矢量单元(13);
当前帧线谱频率矢量系数或者当前帧线谱频率残差矢量系数在分组单元(10)进行分组后,到矢量量化单元(11)中对其中一组子矢量{ai}进行矢量量化,利用矢量量化单元(11)中得到的部分矢量系数在预测单元(12)对未量化的一组子矢量{bj}系数进行预测,并在残差矢量单元(13)中求得残差矢量{bj′},并回到矢量量化单元(11)对所述残差矢量{bj′}进行量化,实现减少平均量化误差以提高语音编码质量。
8、根据权利要求7所述的系统,其特征在于,所述分组单元(10),还包括:
对一组子矢量{ai}进行分组、得到相应组子矢量步骤的子分组单元(101)。
9、根据权利要求7所述的系统,其特征在于,所述预测单元(12),还包括:
执行对于每一帧LSF残差矢量,通过从ω个预先计算好的预测矩阵Rl中选择一个预测误差最小的预测矩阵,其判断准则为,其中,l为0,1,…,ω-1:
利用均方误差准则进行判断,计算针对不同的预测矩阵Rl所对应的均方误差El
E l = Σ j = m n ( b j - b j predict ) 2 , l=0,1,...,ω-1,其中,对应不同的子矢量m和n值不同,
计算出El的最小值Eλ
Eλ=Min(El),l=0,1,...,ω-1,
并找出Eλ对应的预测矩阵Rλ,此预测矩阵Rλ即为最佳预测矩阵,并根据最佳预测矩阵Rλ求出最佳预测值bj predict步骤的最佳预测值单元(121)。
10、根据权利要求7所述的系统,其特征在于,所述残差矢量单元(13),还包括:
执行对所述预测值残差矢量{bj′}系数进行分组,得到对应组预测值残差子矢量步骤的残差矢量分组单元(131)。
CNB200610153330XA 2006-09-15 2006-09-15 线谱频率矢量量化的方法及系统 Active CN100550132C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB200610153330XA CN100550132C (zh) 2006-09-15 2006-09-15 线谱频率矢量量化的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB200610153330XA CN100550132C (zh) 2006-09-15 2006-09-15 线谱频率矢量量化的方法及系统

Publications (2)

Publication Number Publication Date
CN101145344A CN101145344A (zh) 2008-03-19
CN100550132C true CN100550132C (zh) 2009-10-14

Family

ID=39207831

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB200610153330XA Active CN100550132C (zh) 2006-09-15 2006-09-15 线谱频率矢量量化的方法及系统

Country Status (1)

Country Link
CN (1) CN100550132C (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101714354B (zh) * 2009-11-27 2012-06-20 江南大学 一种由时频原子聚合生成时频分子的方法
CN102867516B (zh) * 2012-09-10 2014-08-27 大连理工大学 一种采用高阶线性预测系数分组矢量量化的语音编解方法
CN103824561B (zh) * 2014-02-18 2015-03-11 北京邮电大学 一种语音线性预测编码模型的缺失值非线性估算方法
CN104361894A (zh) * 2014-11-27 2015-02-18 湖南省计量检测研究院 一种基于输出的客观语音质量评估的方法

Also Published As

Publication number Publication date
CN101145344A (zh) 2008-03-19

Similar Documents

Publication Publication Date Title
CN101903945B (zh) 编码装置、解码装置以及编码方法
KR101175651B1 (ko) 다중 압축 부호화 방법 및 장치
KR100464369B1 (ko) 음성 부호화 시스템의 여기 코드북 탐색 방법
CN1078998C (zh) 对语音编码的随时间变化的频谱按内插法进行分析的方法
US20070171931A1 (en) Arbitrary average data rates for variable rate coders
Quackenbush MPEG unified speech and audio coding
JPH08263099A (ja) 符号化装置
CN106165013A (zh) 用于在具有不同采样速率的各帧之间的过渡时的声音信号的线性预测编码和解码的方法、编码器和解码器
KR20160080115A (ko) 부호화 방법, 부호화 장치, 주기성 특징량 결정 방법, 주기성 특징량 결정 장치, 프로그램, 기록 매체
CN102714040A (zh) 编码装置、解码装置、频谱变动量计算方法和频谱振幅调整方法
CN100550132C (zh) 线谱频率矢量量化的方法及系统
CN104517612B (zh) 基于amr-nb语音信号的可变码率编码器和解码器及其编码和解码方法
US8271275B2 (en) Scalable encoding device, and scalable encoding method
JP4639073B2 (ja) オーディオ信号符号化装置および方法
CN101198041B (zh) 矢量量化方法及装置
Dusan et al. Speech compression by polynomial approximation
KR101826237B1 (ko) 부호화 방법, 부호화 장치, 프로그램 및 기록 매체
US6622120B1 (en) Fast search method for LSP quantization
JP4359949B2 (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
CN105096958A (zh) 音频编码方法及相关装置
CN101192408A (zh) 选择导谱频率系数矢量量化的方法及装置
CN101256773A (zh) 导抗谱频率参数的矢量量化方法及装置
Yeh et al. An efficient complexity reduction algorithm for G. 729 speech codec
CN105340010B (zh) 用于通过应用分布量化和编码分裂音频信号包络的音频信号包络编码、处理和解码的装置和方法
Bhatt et al. Overall performance evaluation of adaptive multi rate 06.90 speech codec based on code excited linear prediction algorithm using MATLAB

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant