CN101908341A - 一种适用于嵌入式系统实现的基于g.729算法的语音编码优化方法 - Google Patents
一种适用于嵌入式系统实现的基于g.729算法的语音编码优化方法 Download PDFInfo
- Publication number
- CN101908341A CN101908341A CN2010102458285A CN201010245828A CN101908341A CN 101908341 A CN101908341 A CN 101908341A CN 2010102458285 A CN2010102458285 A CN 2010102458285A CN 201010245828 A CN201010245828 A CN 201010245828A CN 101908341 A CN101908341 A CN 101908341A
- Authority
- CN
- China
- Prior art keywords
- vector
- algorithm
- code word
- code
- assignment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
一种适用于嵌入式系统实现的基于G.729算法的语音编码优化方法,所述G.729算法在搜索相对应码值时,将搜索范围限制在开环基音分析所得到的候选延迟Top附近,对每一帧语音数据作一次开环音调分析,每一帧语音数据的特性参数:10ms、80个样点;对累加次数进行降低,由原来的80次累加降为40次累加,再进行相关系数值的最大值比较,然后将最大值进行归一化处理;LSP系数q2使用频率域[0,π]中的LSF即w2来进行量化。本发明能降低算法的复杂度、减少计算量、对硬件的要求较低、增加编码效率。
Description
技术领域
本发明属于嵌入式系统的基于G.729算法的语音编码控制技术领域,尤其是一种基于G.729算法的语音编码优化方法。
背景技术
随着现代社会通信技术的高速发展,频率资源显得越加宝贵,为了尽可能地提高频带利用率,在语音通信系统中需要对音频数据进行压缩传输,而正是由于高质量低速率的语音压缩标准的出现和该技术的实现和应用使得现代数字语音通信网的系统容量得到了极大的提高。
G.726标准中采用的ADPCM(Adaptive Differential Pulse Code Modulation)算法很好地综合了APCM(Adaptive Pulse Code Modulation)算法的自适应特性和DPCM(Differential Pulse Code Modulation)算法的差分特性,是一种性能比较好的波形编码。它的核心思想是:采取自适应的方式去选取信号量化阶的大小,即当信号之间差值较小的时候使用小的量化阶进行编码,当信号之间差值较大的时候使用大的量化阶进行编码;使用已经得到的前一样本值去预测下一个输入样本的值,并总是使得实际样本值和预测样本值之间的差值达到最小。早期出现的G.721、G.723、G.726和G.727语音编码标准都采用了ADPCM算法。ADPCM算法相对于后来出现的CELP算法,其算法的计算量要小得多,可以最大限度地节省系统资源。
CELP(码激励线性预测)技术无疑是在目前的各种高质量低速率语音编码标准中发展最为成功的语音编码技术之一。CELP编码技术得到的语音质量要好于所有的16kbit/s编码率的编码标准,甚至可与编码率为32kbit/s的连续可变斜率增量调制技术(CVSD)相媲美。正是由于该算法的优异表现,CELP编码算法已经被广泛应用于各种低速率语音压缩编码标准当中。比如:G.728 16kbit/s低时延码激励线性预测(LD-CELP)标准、G.729 8kbit/s共扼结构代数码激励线性预测(CS-ACELP)标准以及G.723.l的5.3kbit/s算术码本激励线性预测(ACELP)和6.3kbit/s多脉冲最大似然量化(MP-MLQ) 标准等等。但是,CELP编码技术的缺点也十分明显:其编码算法相对复杂,计算复杂度也非常高。正是由于这一缺点,使得CELP编码技术在实际的工程实现上存在着一定的困难。
G.729语音编码标准采用基于CELP编码模型的CS-ACELP算法。其主要的技术指标如下:在无误码的情况下,得到的语音质量和编码率为32kbit/s自适应差分脉冲编码调制得到的语音质量相当;在3%数据帧出现错误的情况下,与无误码的编码率为32kbit/s自适应差分脉冲编码调制(ADPCM) 方法对比,得到的语音质量平均评价得分(MOS)降低度不超过0.5。如上所述,CS-ACELP编码具有低速率、高质量、低延迟的特点,是目前理论上非常理想的一种编码算法。目前主要应用于分组语音通信(如IP Phone)、移动无线通信、个人通信、数字卫星通信、微波接力通信以及未来的综合业务数字通信网(ISDN)中。但是G.729的算法复杂度高、计算量大,对硬件的要求也高,在ARM平台上实现存在一定的难度。因此,减少G.729的计算量,增加编码效率十分必要。
发明内容
为了克服已有嵌入式系统实现的基于G.729算法的语音编码方法的算法复杂度高、计算量大、对硬件的要求高、降低编码效率的不足,本发明提供一种降低算法的复杂度、减少计算量、对硬件的要求较低、增加编码效率的适用于嵌入式系统实现的基于G.729算法的语音编码优化方法。
本发明解决其技术问题所采用的技术方案是:
一种适用于嵌入式系统实现的基于G.729算法的语音编码优化方法,所述G.729算法在搜索相对应码值时,将搜索范围限制在开环基音分析所得到的候选延迟 附近,对每一帧语音数据作一次开环音调分析,每一帧语音数据的特性参数:10ms、80个样点,过程如下:
优化后的加权语音信号相关系数的表达式如下:
利用两个可相互切换的4阶MA预测器之一用来预测当前帧的LSF系数,计算系数和预测系数之间的差值,使用两级矢量进行量化,第一级矢量量化使用包括128个码字的10维矢量码本L1,第二级矢量量化使用32个码字的两个5维码本L2和L3;
采用一般性码字判别算法搜索最佳逼近码字,具体过程为:
2.2,计算输入信号矢量平均值和第一个码字矢量平均值的均方误差值,并设定其为,再计算输入信号矢量平均值和第二个码字平均值的均方误差,如果其小于,则把该均方误差值设定为新的,如果大于,则认定当前码字为非最佳逼近码字,排除在搜索范围之内,减去了对该码字的不必要的搜索计算,依此类推,直到比较到第个码字,并得到最佳逼近码字。
本发明的技术构思为:该优化方法包括开环基音搜索的粗化、LSP系数量化算法的优化。开环基音粗化搜索的简化算法主要针对于第一级搜索,其基本原则是:在搜索精度允许的条件下,改变搜索过程中判决准则的计算方法,以达到减少计算量的目的。LSP系数量化算法的优化在各级矢量量化器中采用一般性码字判别算法来代替全搜索算法搜索最佳逼近码字,从而减少了矢量量化算法的运算量和运算时间,加快了矢量量化的编码速度,并且没有影响矢量量化的精度。
本发明的有益效果主要表现在:降低算法的复杂度、减少计算量、对硬件的要求较低、增加编码效率。
附图说明
图1为LSP矢量量化图。
具体实施方式
下面结合附图对本发明作进一步描述。
参照图1,一种适用于嵌入式系统实现的基于G.729算法的语音编码优化方法,所述G.729算法在搜索相对应码值时,将搜索范围限制在开环基音分析所得到的候选延迟附近,对每一帧语音数据作一次开环音调分析,每一帧语音数据的特性参数:10ms、80个样点,过程如下:
优化后的加权语音信号相关系数的表达式如下:
本实施例中,开环基音搜索的粗化的过程为:在G.729算法中的一些关键模块中,在搜索相对应码值的时候都采用了多级查询的方法。多级查询的基本原理是:首先按照一定的算法或判断准则将查询或量化的范围缩小到某一较小的搜索区域内;然后再提高精度,把搜索锁定到更小的范围;最后在一个最小的范围内进行计算判决以确定最终的值。这种多级的查询搜索相对于全搜索过程,可以有效地减小搜索的计算量。实际情况是经过第一级的运算后,所得到的区域已经很小,此后的运算量也会变得很小,进行优化的意义不大。所以粗化搜索的简化算法主要针对于第一级搜索。其基本原则是:在搜索精度允许的条件下,改变搜索过程中判决准则的计算方法,以达到减少计算量的目的。下面以开环基音分析中周期搜索为例:
为了减少自适应码书的最佳时延的搜索复杂度,将其搜索范围限制在开环基音分析所得到的候选延迟附近。对每一帧(10ms,80个样点)语音数据都需要作一次开环音调分析。具体过程如下:
式中,的取值范围为[N1,N2]。从上式中可以看出,其加权语音信号相关系数的表达式是进行80次的累加求和。但是一般的语音信号变化缓慢,各个样点之间的波动幅度较小,在优化的时候考虑每隔一个样点进行一次累加计算,去掉一半的样点计算量,累加次数由原来的80次降低为40次,得到优化后的加权语音信号相关系数的表达式如下:
由于仅仅是对累加次数进行降低,由原来的80次累加降为40次累加,再进行相关系数值的最大值比较,然后将最大值进行归一化处理,因此,适当地降低累加次数对最终结果影响不大,但却可缩小开环基音分析搜索中一半的计算时间。
利用两个可相互切换的4阶MA预测器之一用来预测当前帧的LSF系数。计算系数和预测系数之间的差值,使用两级矢量进行量化。第一级矢量量化使用包括128个码字(7bit)的10维矢量码本L1,第二级矢量量化使用32个码字的两个5维码本L2和L3。LSP矢量量化的过程如图1所示。具体步骤如下:
第一步,求得目标矢量:
第二步,进行第一级矢量量化,在L1中,以加权均方误差最小为准则来进行最佳码矢量的搜索,从而得到它的码本索引。
第三步,进行第二级矢量量化的低部分矢量量化,其目标矢量是与第一级搜索到的最佳码字矢量的误差矢量,以加权后的均方误差最小为准则进行搜索。
第四步,进行第二级矢量量化的高部分矢量量化,其目标矢量是低部分矢量的目标矢量与低部分矢量量化的最佳码字矢量之间的误差矢量。
第五步,对得到的两级矢量量化后的结果进行修正。
G.729编码标准中对预测分裂矢量量化过程中各级矢量量化器选择何种搜索算法没有进行具体规定,若采用全搜索算法,对三个码本矢量共需进行128+32=160次 (码本Ll和L3)均方误差和32次(码本L2)加权均方误差的计算,运算量相当大。
采用一般性码字判别算法搜索最佳逼近码字。其基本原则如下:
第二步,计算输入信号矢量平均值和第一个码字矢量平均值的均方误差值,并设定其为,再计算输入信号矢量平均值和第二个码字平均值的均方误差,如果其小于,则把这个均方误差值设定为新的,如果大于,则认定当前码字为非最佳逼近码字,排除在搜索范围之内,减去了对该码字的不必要的搜索计算,依此类推,直到比较到第个码字,并得到最佳逼近码字。
优化算法的计算复杂度如下:计算矢量的均值和码字的均值共需要进行2次乘法运算和2×K次加法运算;计算矢量和码码字的误差失真需要进行K次乘方运算、K次加法运算和K次减法运算。以K=10为例,优化的算法在每次搜索过程中,最多进行20次均值运算和9次误差失真运算,最少情况只进行10次均值运算和1次误差失真运算。而全搜索算法每次搜索过程中都需要进行10次误差失真运算。相比而言,优化算法的误差失真运算要少得多,而均值的运算相对而言计算简单,所以总体而言,优化算法的计算量得到了很大的减少。
由此可见 ,优化算法减少了矢量量化算法的运算量和运算时间,加快了矢量量化的编码速度。由于只是改变了码字的搜索方法,并没有改变其码字的精度,所以并没有影响矢量量化的精度。
Claims (3)
1.一种适用于嵌入式系统实现的基于G.729算法的语音编码优化方法,其特征在于:所述G.729算法在搜索相对应码值时,将搜索范围限制在开环基音分析所得到的候选延迟 附近,对每一帧语音数据作一次开环音调分析,每一帧语音数据的特性参数:10ms、80个样点,过程如下:
(1)
优化后的加权语音信号相关系数的表达式如下:
利用两个可相互切换的4阶MA预测器之一用来预测当前帧的LSF系数,计算系数和预测系数之间的差值,使用两级矢量进行量化,第一级矢量量化使用包括128个码字的10维矢量码本L1,第二级矢量量化使用32个码字的两个5维码本L2和L3;
采用一般性码字判别算法搜索最佳逼近码字,具体过程为:
2.1,求出当前输入信号矢量和维码本里的各个码字矢量的平均值;
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2010102458285A CN101908341B (zh) | 2010-08-05 | 2010-08-05 | 一种基于g.729算法的语音编码优化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2010102458285A CN101908341B (zh) | 2010-08-05 | 2010-08-05 | 一种基于g.729算法的语音编码优化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101908341A true CN101908341A (zh) | 2010-12-08 |
CN101908341B CN101908341B (zh) | 2012-05-23 |
Family
ID=43263781
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2010102458285A Expired - Fee Related CN101908341B (zh) | 2010-08-05 | 2010-08-05 | 一种基于g.729算法的语音编码优化方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101908341B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108922549A (zh) * | 2018-06-22 | 2018-11-30 | 浙江工业大学 | 一种基于ip对讲系统中音频压缩的方法 |
CN109243476A (zh) * | 2018-10-18 | 2019-01-18 | 电信科学技术研究院有限公司 | 混响语音信号中后混响功率谱的自适应估计方法及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6889185B1 (en) * | 1997-08-28 | 2005-05-03 | Texas Instruments Incorporated | Quantization of linear prediction coefficients using perceptual weighting |
US7310598B1 (en) * | 2002-04-12 | 2007-12-18 | University Of Central Florida Research Foundation, Inc. | Energy based split vector quantizer employing signal representation in multiple transform domains |
CN101149924A (zh) * | 2006-09-18 | 2008-03-26 | 华为技术有限公司 | 一种实现开环基音搜索的方法和装置 |
CN101183526A (zh) * | 2006-11-14 | 2008-05-21 | 中兴通讯股份有限公司 | 一种检测语音信号基音周期的方法 |
CN101542589A (zh) * | 2006-10-13 | 2009-09-23 | 诺基亚公司 | 基音滞后估计 |
-
2010
- 2010-08-05 CN CN2010102458285A patent/CN101908341B/zh not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6889185B1 (en) * | 1997-08-28 | 2005-05-03 | Texas Instruments Incorporated | Quantization of linear prediction coefficients using perceptual weighting |
US7310598B1 (en) * | 2002-04-12 | 2007-12-18 | University Of Central Florida Research Foundation, Inc. | Energy based split vector quantizer employing signal representation in multiple transform domains |
CN101149924A (zh) * | 2006-09-18 | 2008-03-26 | 华为技术有限公司 | 一种实现开环基音搜索的方法和装置 |
CN101542589A (zh) * | 2006-10-13 | 2009-09-23 | 诺基亚公司 | 基音滞后估计 |
CN101183526A (zh) * | 2006-11-14 | 2008-05-21 | 中兴通讯股份有限公司 | 一种检测语音信号基音周期的方法 |
Non-Patent Citations (1)
Title |
---|
《CODING OF SPEECH AT 8 kbit/s USING CONJUGATE-STRUCTURE ALGEBRAIC-CODE-EXCITED LINEAR-PREDICTION(CS-ACELP)》 19960319 TELECOMMUNICATION STANDARDIZATION SECTOR OF ITU CODING OF SPEECH AT 8 kbit/s USING CONJUGATE-STRUCTURE ALGEBRAIC-CODE-EXCITED LINEAR-PREDICTION(CS-ACELP) 第7-16页 1 , 1 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108922549A (zh) * | 2018-06-22 | 2018-11-30 | 浙江工业大学 | 一种基于ip对讲系统中音频压缩的方法 |
CN108922549B (zh) * | 2018-06-22 | 2022-04-08 | 浙江工业大学 | 一种基于ip对讲系统中音频压缩的方法 |
CN109243476A (zh) * | 2018-10-18 | 2019-01-18 | 电信科学技术研究院有限公司 | 混响语音信号中后混响功率谱的自适应估计方法及装置 |
CN109243476B (zh) * | 2018-10-18 | 2021-09-03 | 电信科学技术研究院有限公司 | 混响语音信号中后混响功率谱的自适应估计方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN101908341B (zh) | 2012-05-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101542589B (zh) | 基音滞后估计的方法、设备和系统 | |
FI120117B (fi) | Vokooderi-ASIC | |
US9245532B2 (en) | Variable bit rate LPC filter quantizing and inverse quantizing device and method | |
US7496506B2 (en) | Method and apparatus for one-stage and two-stage noise feedback coding of speech and audio signals | |
US8229749B2 (en) | Wide-band encoding device, wide-band LSP prediction device, band scalable encoding device, wide-band encoding method | |
US5495555A (en) | High quality low bit rate celp-based speech codec | |
CN1947174B (zh) | 可扩展编码装置、可扩展解码装置、可扩展编码方法以及可扩展解码方法 | |
CN104011794B (zh) | 具有并行架构的音频编码器 | |
US20070043560A1 (en) | Excitation codebook search method in a speech coding system | |
JPH08263099A (ja) | 符号化装置 | |
CN101114450A (zh) | 一种语音编码选择性加密方法 | |
CN110853659A (zh) | 用于对音频信号进行编码的量化装置 | |
CN103348597A (zh) | 低比特率信号编码器及解码器 | |
CN104517612B (zh) | 基于amr-nb语音信号的可变码率编码器和解码器及其编码和解码方法 | |
CN101208741B (zh) | 一种适用于数字信号短时相关性模型之间的互用性的方法 | |
JP2003524796A (ja) | 音声コーダにおける線スペクトル情報量子化方法を交錯するための方法および装置 | |
WO2009090875A1 (ja) | ベクトル量子化装置、ベクトル逆量子化装置、およびこれらの方法 | |
CN101908341B (zh) | 一种基于g.729算法的语音编码优化方法 | |
US7206740B2 (en) | Efficient excitation quantization in noise feedback coding with general noise shaping | |
CN116709409A (zh) | 基于知识蒸馏的轻量化频谱预测方法 | |
US7110942B2 (en) | Efficient excitation quantization in a noise feedback coding system using correlation techniques | |
JP3435310B2 (ja) | 音声符号化方法および装置 | |
Gottesman et al. | High quality enhanced waveform interpolative coding at 2.8 kbps | |
Tsai et al. | GSM to G. 729 speech transcoder | |
CN101630510A (zh) | Amr语音编码中lsp系数量化的快速码本搜索的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20120523 Termination date: 20200805 |
|
CF01 | Termination of patent right due to non-payment of annual fee |