CN101908341A - 一种适用于嵌入式系统实现的基于g.729算法的语音编码优化方法 - Google Patents

一种适用于嵌入式系统实现的基于g.729算法的语音编码优化方法 Download PDF

Info

Publication number
CN101908341A
CN101908341A CN2010102458285A CN201010245828A CN101908341A CN 101908341 A CN101908341 A CN 101908341A CN 2010102458285 A CN2010102458285 A CN 2010102458285A CN 201010245828 A CN201010245828 A CN 201010245828A CN 101908341 A CN101908341 A CN 101908341A
Authority
CN
China
Prior art keywords
vector
algorithm
code word
code
assignment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2010102458285A
Other languages
English (en)
Other versions
CN101908341B (zh
Inventor
孟利民
李晶
宁双龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HANGZHOU PUNUO TECHNOLOGY CO LTD
Zhejiang University of Technology ZJUT
Original Assignee
HANGZHOU PUNUO TECHNOLOGY CO LTD
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by HANGZHOU PUNUO TECHNOLOGY CO LTD, Zhejiang University of Technology ZJUT filed Critical HANGZHOU PUNUO TECHNOLOGY CO LTD
Priority to CN2010102458285A priority Critical patent/CN101908341B/zh
Publication of CN101908341A publication Critical patent/CN101908341A/zh
Application granted granted Critical
Publication of CN101908341B publication Critical patent/CN101908341B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

一种适用于嵌入式系统实现的基于G.729算法的语音编码优化方法,所述G.729算法在搜索相对应码值时,将搜索范围限制在开环基音分析所得到的候选延迟Top附近,对每一帧语音数据作一次开环音调分析,每一帧语音数据的特性参数:10ms、80个样点;对累加次数进行降低,由原来的80次累加降为40次累加,再进行相关系数值的最大值比较,然后将最大值进行归一化处理;LSP系数q2使用频率域[0,π]中的LSF即w2来进行量化。本发明能降低算法的复杂度、减少计算量、对硬件的要求较低、增加编码效率。

Description

一种适用于嵌入式系统实现的基于G.729算法的语音编码优化方法
技术领域
本发明属于嵌入式系统的基于G.729算法的语音编码控制技术领域,尤其是一种基于G.729算法的语音编码优化方法。
背景技术
随着现代社会通信技术的高速发展,频率资源显得越加宝贵,为了尽可能地提高频带利用率,在语音通信系统中需要对音频数据进行压缩传输,而正是由于高质量低速率的语音压缩标准的出现和该技术的实现和应用使得现代数字语音通信网的系统容量得到了极大的提高。
G.726标准中采用的ADPCM(Adaptive Differential Pulse Code Modulation)算法很好地综合了APCM(Adaptive Pulse Code Modulation)算法的自适应特性和DPCM(Differential Pulse Code Modulation)算法的差分特性,是一种性能比较好的波形编码。它的核心思想是:采取自适应的方式去选取信号量化阶的大小,即当信号之间差值较小的时候使用小的量化阶进行编码,当信号之间差值较大的时候使用大的量化阶进行编码;使用已经得到的前一样本值去预测下一个输入样本的值,并总是使得实际样本值和预测样本值之间的差值达到最小。早期出现的G.721、G.723、G.726和G.727语音编码标准都采用了ADPCM算法。ADPCM算法相对于后来出现的CELP算法,其算法的计算量要小得多,可以最大限度地节省系统资源。
CELP(码激励线性预测)技术无疑是在目前的各种高质量低速率语音编码标准中发展最为成功的语音编码技术之一。CELP编码技术得到的语音质量要好于所有的16kbit/s编码率的编码标准,甚至可与编码率为32kbit/s的连续可变斜率增量调制技术(CVSD)相媲美。正是由于该算法的优异表现,CELP编码算法已经被广泛应用于各种低速率语音压缩编码标准当中。比如:G.728 16kbit/s低时延码激励线性预测(LD-CELP)标准、G.729 8kbit/s共扼结构代数码激励线性预测(CS-ACELP)标准以及G.723.l的5.3kbit/s算术码本激励线性预测(ACELP)和6.3kbit/s多脉冲最大似然量化(MP-MLQ) 标准等等。但是,CELP编码技术的缺点也十分明显:其编码算法相对复杂,计算复杂度也非常高。正是由于这一缺点,使得CELP编码技术在实际的工程实现上存在着一定的困难。
G.729语音编码标准采用基于CELP编码模型的CS-ACELP算法。其主要的技术指标如下:在无误码的情况下,得到的语音质量和编码率为32kbit/s自适应差分脉冲编码调制得到的语音质量相当;在3%数据帧出现错误的情况下,与无误码的编码率为32kbit/s自适应差分脉冲编码调制(ADPCM) 方法对比,得到的语音质量平均评价得分(MOS)降低度不超过0.5。如上所述,CS-ACELP编码具有低速率、高质量、低延迟的特点,是目前理论上非常理想的一种编码算法。目前主要应用于分组语音通信(如IP Phone)、移动无线通信、个人通信、数字卫星通信、微波接力通信以及未来的综合业务数字通信网(ISDN)中。但是G.729的算法复杂度高、计算量大,对硬件的要求也高,在ARM平台上实现存在一定的难度。因此,减少G.729的计算量,增加编码效率十分必要。
发明内容
为了克服已有嵌入式系统实现的基于G.729算法的语音编码方法的算法复杂度高、计算量大、对硬件的要求高、降低编码效率的不足,本发明提供一种降低算法的复杂度、减少计算量、对硬件的要求较低、增加编码效率的适用于嵌入式系统实现的基于G.729算法的语音编码优化方法。
本发明解决其技术问题所采用的技术方案是:
一种适用于嵌入式系统实现的基于G.729算法的语音编码优化方法,所述G.729算法在搜索相对应码值时,将搜索范围限制在开环基音分析所得到的候选延迟                                                附近,对每一帧语音数据作一次开环音调分析,每一帧语音数据的特性参数:10ms、80个样点,过程如下:
在时间t中选取范围[N1,N2],并将其分为三部分,即[N1,N1’]、[N1’,N2’]、[N2’,N2],分别求出加权语音信号
Figure 798360DEST_PATH_IMAGE002
在这三部分内的自相关函数
Figure 2010102458285100002DEST_PATH_IMAGE003
的三个最大值
Figure 131253DEST_PATH_IMAGE004
Figure 2010102458285100002DEST_PATH_IMAGE005
,其中,
1.2,对
Figure 391256DEST_PATH_IMAGE004
Figure 845240DEST_PATH_IMAGE005
进行归一化处理,如下:
Figure 2010102458285100002DEST_PATH_IMAGE007
  
Figure 981823DEST_PATH_IMAGE005
                 (1)
1.3,确定最佳开环时延
Figure 339118DEST_PATH_IMAGE001
,其过程如下:
1.3.1,将t1赋值给Top
Figure 270165DEST_PATH_IMAGE008
Figure 2010102458285100002DEST_PATH_IMAGE009
赋值给
Figure 211445DEST_PATH_IMAGE010
1.3.2,如果
Figure 886140DEST_PATH_IMAGE012
,则将
Figure 2010102458285100002DEST_PATH_IMAGE013
赋值给
Figure 862772DEST_PATH_IMAGE010
Figure 292616DEST_PATH_IMAGE014
,t2赋值给Top
Figure 2010102458285100002DEST_PATH_IMAGE015
1.3.3,如果
Figure 658876DEST_PATH_IMAGE016
,则将
Figure 2010102458285100002DEST_PATH_IMAGE017
赋值给
Figure 265886DEST_PATH_IMAGE018
,t2赋值给Top
Figure 2010102458285100002DEST_PATH_IMAGE019
优化后的加权语音信号相关系数的表达式如下:
Figure 725686DEST_PATH_IMAGE020
   
Figure 2010102458285100002DEST_PATH_IMAGE021
                       (2)。
作为优选的一种方案:所述G.729算法中,LSP系数
Figure 77776DEST_PATH_IMAGE022
使用频率域
Figure 2010102458285100002DEST_PATH_IMAGE023
中的LSF即
Figure 94274DEST_PATH_IMAGE024
来进行量化,即:
Figure 2010102458285100002DEST_PATH_IMAGE025
   
Figure 716885DEST_PATH_IMAGE026
                (3)
利用两个可相互切换的4阶MA预测器之一用来预测当前帧的LSF系数,计算系数和预测系数之间的差值,使用两级矢量进行量化,第一级矢量量化使用包括128个码字的10维矢量码本L1,第二级矢量量化使用32个码字的两个5维码本L2和L3;
采用一般性码字判别算法搜索最佳逼近码字,具体过程为:
2.1,求出当前输入信号矢量和
Figure 2010102458285100002DEST_PATH_IMAGE027
维码本里的各个码字矢量的平均值;
2.2,计算输入信号矢量平均值和第一个码字矢量平均值的均方误差值,并设定其为
Figure 176947DEST_PATH_IMAGE028
,再计算输入信号矢量平均值和第二个码字平均值的均方误差,如果其小于
Figure 65269DEST_PATH_IMAGE028
,则把该均方误差值设定为新的
Figure 134725DEST_PATH_IMAGE028
,如果大于
Figure 487209DEST_PATH_IMAGE028
,则认定当前码字为非最佳逼近码字,排除在搜索范围之内,减去了对该码字的不必要的搜索计算,依此类推,直到比较到第
Figure 367440DEST_PATH_IMAGE027
个码字,并得到最佳逼近码字。
进一步,在所述2.2中,设
Figure 496720DEST_PATH_IMAGE027
维矢量,
Figure 855020DEST_PATH_IMAGE030
,定义矢量
Figure 514541DEST_PATH_IMAGE029
的均值为
Figure 2010102458285100002DEST_PATH_IMAGE031
Figure 179319DEST_PATH_IMAGE027
维码本里的一个码字,
Figure 403627DEST_PATH_IMAGE032
的均值为
Figure 2010102458285100002DEST_PATH_IMAGE033
Figure 589758DEST_PATH_IMAGE028
是当前码本搜索中已知的最小失真,若
Figure 874109DEST_PATH_IMAGE034
                      (4)
则矢量
Figure 224319DEST_PATH_IMAGE029
Figure 937804DEST_PATH_IMAGE032
的失真,码字可以被判决为非最佳逼近码字,则可以排除在搜索范围之内。
本发明的技术构思为:该优化方法包括开环基音搜索的粗化、LSP系数量化算法的优化。开环基音粗化搜索的简化算法主要针对于第一级搜索,其基本原则是:在搜索精度允许的条件下,改变搜索过程中判决准则的计算方法,以达到减少计算量的目的。LSP系数量化算法的优化在各级矢量量化器中采用一般性码字判别算法来代替全搜索算法搜索最佳逼近码字,从而减少了矢量量化算法的运算量和运算时间,加快了矢量量化的编码速度,并且没有影响矢量量化的精度。
本发明的有益效果主要表现在:降低算法的复杂度、减少计算量、对硬件的要求较低、增加编码效率。
附图说明
图1为LSP矢量量化图。
具体实施方式
下面结合附图对本发明作进一步描述。
参照图1,一种适用于嵌入式系统实现的基于G.729算法的语音编码优化方法,所述G.729算法在搜索相对应码值时,将搜索范围限制在开环基音分析所得到的候选延迟
Figure 433693DEST_PATH_IMAGE001
附近,对每一帧语音数据作一次开环音调分析,每一帧语音数据的特性参数:10ms、80个样点,过程如下:
1.1,在时间t中选取范围[N1,N2],并将其分为三部分,即[N1,N1’]、[N1’,N2’]、[N2’,N2],分别求出加权语音信号
Figure 333516DEST_PATH_IMAGE002
在这三部分内的自相关函数
Figure 837309DEST_PATH_IMAGE003
的三个最大值
Figure 827393DEST_PATH_IMAGE004
Figure 187967DEST_PATH_IMAGE005
,其中,
1.2,对
Figure 69522DEST_PATH_IMAGE004
进行归一化处理,如下:
Figure 694855DEST_PATH_IMAGE007
  
Figure 303691DEST_PATH_IMAGE005
                 (1)
1.3,确定最佳开环时延
Figure 156810DEST_PATH_IMAGE001
,其过程如下:
1.3.1,将t1赋值给Top
Figure 105174DEST_PATH_IMAGE008
Figure 73130DEST_PATH_IMAGE009
赋值给
Figure 5500DEST_PATH_IMAGE011
1.3.2,如果
Figure 870688DEST_PATH_IMAGE012
,则将赋值给
Figure 468788DEST_PATH_IMAGE014
,t2赋值给Top
Figure 641012DEST_PATH_IMAGE015
1.3.3,如果
Figure 950770DEST_PATH_IMAGE016
,则将
Figure 959178DEST_PATH_IMAGE017
赋值给
Figure 698070DEST_PATH_IMAGE010
Figure 537850DEST_PATH_IMAGE018
,t2赋值给Top
Figure 956193DEST_PATH_IMAGE019
优化后的加权语音信号相关系数的表达式如下:
Figure 435585DEST_PATH_IMAGE020
   
Figure 292683DEST_PATH_IMAGE021
                       (2)。
本实施例中,开环基音搜索的粗化的过程为:在G.729算法中的一些关键模块中,在搜索相对应码值的时候都采用了多级查询的方法。多级查询的基本原理是:首先按照一定的算法或判断准则将查询或量化的范围缩小到某一较小的搜索区域内;然后再提高精度,把搜索锁定到更小的范围;最后在一个最小的范围内进行计算判决以确定最终的值。这种多级的查询搜索相对于全搜索过程,可以有效地减小搜索的计算量。实际情况是经过第一级的运算后,所得到的区域已经很小,此后的运算量也会变得很小,进行优化的意义不大。所以粗化搜索的简化算法主要针对于第一级搜索。其基本原则是:在搜索精度允许的条件下,改变搜索过程中判决准则的计算方法,以达到减少计算量的目的。下面以开环基音分析中周期搜索为例:
为了减少自适应码书的最佳时延的搜索复杂度,将其搜索范围限制在开环基音分析所得到的候选延迟附近。对每一帧(10ms,80个样点)语音数据都需要作一次开环音调分析。具体过程如下:
第一步,在时间t中选取范围[N1,N2],并将其分为三部分,即[N1,N1’]、[N1’,N2’]、[N2’,N2],分别求出加权语音信号
Figure 264629DEST_PATH_IMAGE002
在这三部分内的自相关函数
Figure 309945DEST_PATH_IMAGE003
的三个最大值
Figure 642838DEST_PATH_IMAGE004
Figure 378581DEST_PATH_IMAGE005
,其中,
第二步,对
Figure 671340DEST_PATH_IMAGE004
Figure 561585DEST_PATH_IMAGE005
进行归一化处理,如下:
Figure 964884DEST_PATH_IMAGE007
  
Figure 161511DEST_PATH_IMAGE036
                 (1)
第三步,确定最佳开环时延
Figure 102791DEST_PATH_IMAGE001
,其过程如下:
1.3.1,将t1赋值给Top
Figure 839803DEST_PATH_IMAGE008
Figure 300871DEST_PATH_IMAGE009
赋值给
Figure 419131DEST_PATH_IMAGE010
Figure 332860DEST_PATH_IMAGE011
1.3.2,如果,则将
Figure 703984DEST_PATH_IMAGE013
赋值给
Figure 976834DEST_PATH_IMAGE010
Figure 705756DEST_PATH_IMAGE014
,t2赋值给Top
1.3.3,如果,则将
Figure 598735DEST_PATH_IMAGE017
赋值给
Figure 752636DEST_PATH_IMAGE010
,t2赋值给Top
Figure 676040DEST_PATH_IMAGE019
在进行第一级运算的时候,也就是计算开环基音延迟周期
Figure 556272DEST_PATH_IMAGE001
的时候,加权语音信号相关系数的表达式如下所示:
               
式中,的取值范围为[N1,N2]。从上式中可以看出,其加权语音信号相关系数的表达式是进行80次的累加求和。但是一般的语音信号变化缓慢,各个样点之间的波动幅度较小,在优化的时候考虑每隔一个样点进行一次累加计算,去掉一半的样点计算量,累加次数由原来的80次降低为40次,得到优化后的加权语音信号相关系数的表达式如下:
Figure 242521DEST_PATH_IMAGE020
    
Figure 652774DEST_PATH_IMAGE021
          (2)
由于仅仅是对累加次数进行降低,由原来的80次累加降为40次累加,再进行相关系数值的最大值比较,然后将最大值进行归一化处理,因此,适当地降低累加次数对最终结果影响不大,但却可缩小开环基音分析搜索中一半的计算时间。
LSP系数量化算法优化的过程为:在G.729算法中LSP系数量化的基本原理如下:LSP系数
Figure 500644DEST_PATH_IMAGE022
使用频率域
Figure 612825DEST_PATH_IMAGE023
中的LSF即
Figure 774817DEST_PATH_IMAGE024
来进行量化,即:
Figure 101893DEST_PATH_IMAGE025
   
Figure 74659DEST_PATH_IMAGE026
                (3)
利用两个可相互切换的4阶MA预测器之一用来预测当前帧的LSF系数。计算系数和预测系数之间的差值,使用两级矢量进行量化。第一级矢量量化使用包括128个码字(7bit)的10维矢量码本L1,第二级矢量量化使用32个码字的两个5维码本L2和L3。LSP矢量量化的过程如图1所示。具体步骤如下:
第一步,求得目标矢量
Figure 424869DEST_PATH_IMAGE040
    
Figure 374239DEST_PATH_IMAGE026
         (5)
其中
Figure DEST_PATH_IMAGE041
为MA预测系数,
Figure 493505DEST_PATH_IMAGE042
先前第
Figure DEST_PATH_IMAGE043
帧量化后的目标矢量。
第二步,进行第一级矢量量化,在L1中,以加权均方误差最小为准则来进行最佳码矢量的搜索,从而得到它的码本索引。
第三步,进行第二级矢量量化的低部分矢量量化,其目标矢量是与第一级搜索到的最佳码字矢量的误差矢量,以加权后的均方误差最小为准则进行搜索。
第四步,进行第二级矢量量化的高部分矢量量化,其目标矢量是低部分矢量的目标矢量与低部分矢量量化的最佳码字矢量之间的误差矢量。
第五步,对得到的两级矢量量化后的结果进行修正。
参照图1,为待量化的矢量,
Figure DEST_PATH_IMAGE045
为结果矢量。LSP系数经过两级矢量量化,找到能最逼近当前LSP系数的矢量码字。所谓“最佳逼近”是指能使下面的加权均方误差达到最小。
Figure 224810DEST_PATH_IMAGE046
                    (6)
G.729编码标准中对预测分裂矢量量化过程中各级矢量量化器选择何种搜索算法没有进行具体规定,若采用全搜索算法,对三个码本矢量共需进行128+32=160次 (码本Ll和L3)均方误差和32次(码本L2)加权均方误差的计算,运算量相当大。
采用一般性码字判别算法搜索最佳逼近码字。其基本原则如下:
第一步,求出当前输入信号矢量和
Figure 198582DEST_PATH_IMAGE027
维码本里的各个码字矢量的平均值(对于每个当前输入信号矢量需要计算平均值,但是各个码字的平均值可以存储起来,避免重复计算)。
第二步,计算输入信号矢量平均值和第一个码字矢量平均值的均方误差值,并设定其为
Figure 513151DEST_PATH_IMAGE028
,再计算输入信号矢量平均值和第二个码字平均值的均方误差,如果其小于
Figure 900270DEST_PATH_IMAGE028
,则把这个均方误差值设定为新的
Figure 942176DEST_PATH_IMAGE028
,如果大于
Figure 285301DEST_PATH_IMAGE028
,则认定当前码字为非最佳逼近码字,排除在搜索范围之内,减去了对该码字的不必要的搜索计算,依此类推,直到比较到第
Figure 82356DEST_PATH_IMAGE027
个码字,并得到最佳逼近码字。
具体过程是:设
Figure 628875DEST_PATH_IMAGE029
Figure 493712DEST_PATH_IMAGE027
(
Figure 504394DEST_PATH_IMAGE030
)维矢量,定义矢量
Figure 410033DEST_PATH_IMAGE029
的均值为
Figure 693116DEST_PATH_IMAGE031
维码本里的一个码字,
Figure 34863DEST_PATH_IMAGE032
的均值为
Figure 555975DEST_PATH_IMAGE033
是当前码本搜索中已知的最小失真,若
Figure 977915DEST_PATH_IMAGE034
                      (4)
则矢量
Figure 296080DEST_PATH_IMAGE032
的失真
Figure 34973DEST_PATH_IMAGE035
,码字
Figure 812436DEST_PATH_IMAGE032
可以被判决为非最佳逼近码字,则可以排除在搜索范围之内,减去了对该码字的不必要的搜索。
优化算法的计算复杂度如下:计算矢量
Figure 293096DEST_PATH_IMAGE044
的均值和码字
Figure 772488DEST_PATH_IMAGE039
的均值共需要进行2次乘法运算和2×K次加法运算;计算矢量
Figure 629585DEST_PATH_IMAGE044
和码码字的误差失真需要进行K次乘方运算、K次加法运算和K次减法运算。以K=10为例,优化的算法在每次搜索过程中,最多进行20次均值运算和9次误差失真运算,最少情况只进行10次均值运算和1次误差失真运算。而全搜索算法每次搜索过程中都需要进行10次误差失真运算。相比而言,优化算法的误差失真运算要少得多,而均值的运算相对而言计算简单,所以总体而言,优化算法的计算量得到了很大的减少。
由此可见 ,优化算法减少了矢量量化算法的运算量和运算时间,加快了矢量量化的编码速度。由于只是改变了码字的搜索方法,并没有改变其码字的精度,所以并没有影响矢量量化的精度。

Claims (3)

1.一种适用于嵌入式系统实现的基于G.729算法的语音编码优化方法,其特征在于:所述G.729算法在搜索相对应码值时,将搜索范围限制在开环基音分析所得到的候选延迟                                                
Figure DEST_PATH_IMAGE001
附近,对每一帧语音数据作一次开环音调分析,每一帧语音数据的特性参数:10ms、80个样点,过程如下:
1.1,在时间t中选取范围[N1,N2],并将其分为三部分,即[N1,N1’]、[N1’,N2’]、[N2’,N2],分别求出加权语音信号
Figure 106720DEST_PATH_IMAGE002
在这三部分内的自相关函数
Figure DEST_PATH_IMAGE003
的三个最大值
Figure 775205DEST_PATH_IMAGE004
,其中,
Figure 295048DEST_PATH_IMAGE006
1.2,对
Figure 843841DEST_PATH_IMAGE004
Figure 620298DEST_PATH_IMAGE005
进行归一化处理,如下:
                   (1)
1.3,确定最佳开环时延
Figure 945286DEST_PATH_IMAGE001
,其过程如下:
1.3.1,将t1赋值给Top
Figure 551848DEST_PATH_IMAGE008
赋值给
Figure DEST_PATH_IMAGE011
1.3.2,如果
Figure 103802DEST_PATH_IMAGE012
,则将
Figure DEST_PATH_IMAGE013
赋值给,t2赋值给Top
Figure DEST_PATH_IMAGE015
1.3.3,如果
Figure 357825DEST_PATH_IMAGE016
,则将
Figure DEST_PATH_IMAGE017
赋值给
Figure 786401DEST_PATH_IMAGE010
Figure 264787DEST_PATH_IMAGE018
,t2赋值给Top
优化后的加权语音信号相关系数的表达式如下:
Figure 328164DEST_PATH_IMAGE020
   
Figure DEST_PATH_IMAGE021
                       (2)。
2.如权利要求1所述的适用于嵌入式系统实现的基于G.729算法的语音编码优化方法,其特征在于:所述G.729算法中,LSP系数
Figure 866593DEST_PATH_IMAGE022
使用频率域
Figure DEST_PATH_IMAGE023
中的LSF即
Figure 516886DEST_PATH_IMAGE024
来进行量化,即:
Figure DEST_PATH_IMAGE025
   
Figure 487378DEST_PATH_IMAGE026
                (3)
利用两个可相互切换的4阶MA预测器之一用来预测当前帧的LSF系数,计算系数和预测系数之间的差值,使用两级矢量进行量化,第一级矢量量化使用包括128个码字的10维矢量码本L1,第二级矢量量化使用32个码字的两个5维码本L2和L3;
采用一般性码字判别算法搜索最佳逼近码字,具体过程为:
2.1,求出当前输入信号矢量和维码本里的各个码字矢量的平均值;
2.2,计算输入信号矢量平均值和第一个码字矢量平均值的均方误差值,并设定其为,再计算输入信号矢量平均值和第二个码字平均值的均方误差,如果其小于
Figure 616057DEST_PATH_IMAGE028
,则把该均方误差值设定为新的
Figure 832275DEST_PATH_IMAGE028
,如果大于,则认定当前码字为非最佳逼近码字,排除在搜索范围之内,减去了对该码字的不必要的搜索计算,依此类推,直到比较到第个码字,并得到最佳逼近码字。
3.如权利要求2所述的适用于嵌入式系统实现的基于G.729算法的语音编码优化方法,其特征在于:在所述2.2中,设
Figure DEST_PATH_IMAGE029
Figure 310945DEST_PATH_IMAGE027
维矢量,
Figure 935830DEST_PATH_IMAGE030
,定义矢量
Figure 622026DEST_PATH_IMAGE029
的均值为
Figure DEST_PATH_IMAGE031
Figure 455115DEST_PATH_IMAGE032
Figure 568565DEST_PATH_IMAGE027
维码本里的一个码字,
Figure 618429DEST_PATH_IMAGE032
的均值为
Figure DEST_PATH_IMAGE033
Figure 465906DEST_PATH_IMAGE028
是当前码本搜索中已知的最小失真,若 
Figure 792982DEST_PATH_IMAGE034
                      (4)
则矢量
Figure 348914DEST_PATH_IMAGE032
的失真
Figure DEST_PATH_IMAGE035
,码字
Figure 314596DEST_PATH_IMAGE032
被判决为非最佳逼近码字,则排除在搜索范围之内。
CN2010102458285A 2010-08-05 2010-08-05 一种基于g.729算法的语音编码优化方法 Expired - Fee Related CN101908341B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2010102458285A CN101908341B (zh) 2010-08-05 2010-08-05 一种基于g.729算法的语音编码优化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010102458285A CN101908341B (zh) 2010-08-05 2010-08-05 一种基于g.729算法的语音编码优化方法

Publications (2)

Publication Number Publication Date
CN101908341A true CN101908341A (zh) 2010-12-08
CN101908341B CN101908341B (zh) 2012-05-23

Family

ID=43263781

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010102458285A Expired - Fee Related CN101908341B (zh) 2010-08-05 2010-08-05 一种基于g.729算法的语音编码优化方法

Country Status (1)

Country Link
CN (1) CN101908341B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108922549A (zh) * 2018-06-22 2018-11-30 浙江工业大学 一种基于ip对讲系统中音频压缩的方法
CN109243476A (zh) * 2018-10-18 2019-01-18 电信科学技术研究院有限公司 混响语音信号中后混响功率谱的自适应估计方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6889185B1 (en) * 1997-08-28 2005-05-03 Texas Instruments Incorporated Quantization of linear prediction coefficients using perceptual weighting
US7310598B1 (en) * 2002-04-12 2007-12-18 University Of Central Florida Research Foundation, Inc. Energy based split vector quantizer employing signal representation in multiple transform domains
CN101149924A (zh) * 2006-09-18 2008-03-26 华为技术有限公司 一种实现开环基音搜索的方法和装置
CN101183526A (zh) * 2006-11-14 2008-05-21 中兴通讯股份有限公司 一种检测语音信号基音周期的方法
CN101542589A (zh) * 2006-10-13 2009-09-23 诺基亚公司 基音滞后估计

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6889185B1 (en) * 1997-08-28 2005-05-03 Texas Instruments Incorporated Quantization of linear prediction coefficients using perceptual weighting
US7310598B1 (en) * 2002-04-12 2007-12-18 University Of Central Florida Research Foundation, Inc. Energy based split vector quantizer employing signal representation in multiple transform domains
CN101149924A (zh) * 2006-09-18 2008-03-26 华为技术有限公司 一种实现开环基音搜索的方法和装置
CN101542589A (zh) * 2006-10-13 2009-09-23 诺基亚公司 基音滞后估计
CN101183526A (zh) * 2006-11-14 2008-05-21 中兴通讯股份有限公司 一种检测语音信号基音周期的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
《CODING OF SPEECH AT 8 kbit/s USING CONJUGATE-STRUCTURE ALGEBRAIC-CODE-EXCITED LINEAR-PREDICTION(CS-ACELP)》 19960319 TELECOMMUNICATION STANDARDIZATION SECTOR OF ITU CODING OF SPEECH AT 8 kbit/s USING CONJUGATE-STRUCTURE ALGEBRAIC-CODE-EXCITED LINEAR-PREDICTION(CS-ACELP) 第7-16页 1 , 1 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108922549A (zh) * 2018-06-22 2018-11-30 浙江工业大学 一种基于ip对讲系统中音频压缩的方法
CN108922549B (zh) * 2018-06-22 2022-04-08 浙江工业大学 一种基于ip对讲系统中音频压缩的方法
CN109243476A (zh) * 2018-10-18 2019-01-18 电信科学技术研究院有限公司 混响语音信号中后混响功率谱的自适应估计方法及装置
CN109243476B (zh) * 2018-10-18 2021-09-03 电信科学技术研究院有限公司 混响语音信号中后混响功率谱的自适应估计方法及装置

Also Published As

Publication number Publication date
CN101908341B (zh) 2012-05-23

Similar Documents

Publication Publication Date Title
CN101542589B (zh) 基音滞后估计的方法、设备和系统
FI120117B (fi) Vokooderi-ASIC
US9245532B2 (en) Variable bit rate LPC filter quantizing and inverse quantizing device and method
US7496506B2 (en) Method and apparatus for one-stage and two-stage noise feedback coding of speech and audio signals
US8229749B2 (en) Wide-band encoding device, wide-band LSP prediction device, band scalable encoding device, wide-band encoding method
US5495555A (en) High quality low bit rate celp-based speech codec
CN1947174B (zh) 可扩展编码装置、可扩展解码装置、可扩展编码方法以及可扩展解码方法
CN104011794B (zh) 具有并行架构的音频编码器
US20070043560A1 (en) Excitation codebook search method in a speech coding system
JPH08263099A (ja) 符号化装置
CN101114450A (zh) 一种语音编码选择性加密方法
CN110853659A (zh) 用于对音频信号进行编码的量化装置
CN103348597A (zh) 低比特率信号编码器及解码器
CN104517612B (zh) 基于amr-nb语音信号的可变码率编码器和解码器及其编码和解码方法
CN101208741B (zh) 一种适用于数字信号短时相关性模型之间的互用性的方法
JP2003524796A (ja) 音声コーダにおける線スペクトル情報量子化方法を交錯するための方法および装置
WO2009090875A1 (ja) ベクトル量子化装置、ベクトル逆量子化装置、およびこれらの方法
CN101908341B (zh) 一种基于g.729算法的语音编码优化方法
US7206740B2 (en) Efficient excitation quantization in noise feedback coding with general noise shaping
CN116709409A (zh) 基于知识蒸馏的轻量化频谱预测方法
US7110942B2 (en) Efficient excitation quantization in a noise feedback coding system using correlation techniques
JP3435310B2 (ja) 音声符号化方法および装置
Gottesman et al. High quality enhanced waveform interpolative coding at 2.8 kbps
Tsai et al. GSM to G. 729 speech transcoder
CN101630510A (zh) Amr语音编码中lsp系数量化的快速码本搜索的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120523

Termination date: 20200805

CF01 Termination of patent right due to non-payment of annual fee