CN100593195C - 在语音编码系统中对增益信息进行编码的方法和装置 - Google Patents

在语音编码系统中对增益信息进行编码的方法和装置 Download PDF

Info

Publication number
CN100593195C
CN100593195C CN200380102803A CN200380102803A CN100593195C CN 100593195 C CN100593195 C CN 100593195C CN 200380102803 A CN200380102803 A CN 200380102803A CN 200380102803 A CN200380102803 A CN 200380102803A CN 100593195 C CN100593195 C CN 100593195C
Authority
CN
China
Prior art keywords
gain
constituent
vector
constituents
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
CN200380102803A
Other languages
English (en)
Other versions
CN1711589A (zh
Inventor
马克·A·亚修克
詹姆士·P·阿什利
乌达尔·米塔尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Motorola Mobility LLC
Google Technology Holdings LLC
Original Assignee
Motorola Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Motorola Inc filed Critical Motorola Inc
Publication of CN1711589A publication Critical patent/CN1711589A/zh
Application granted granted Critical
Publication of CN100593195C publication Critical patent/CN100593195C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/083Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain

Abstract

一种用于对信号进行综合分析编码的语音编码器(300),确定合成激励信号(ex(n))的多个构成成分中每个构成成分的增益参数。该语音编码器基于输入信号(s(n))生成目标矢量(p(n))。该语音编码器还生成与合成激励信号相关联的多个构成成分,其中多个构成成分中的一个构成成分基于偏移后的多个构成成分中的另一个构成成分。该语音编码器还基于目标矢量和多个构成成分来评估差标准,以确定与多个构成成分中每个构成成分相关联的增益。

Description

在语音编码系统中对增益信息进行编码的方法和装置
相关申请交叉引用
本申请与同日提交的美国专利申请10/291,056(代理人卷号CML00766M)相关。
技术领域
本发明一般涉及信号压缩系统,更具体涉及码本激励线性预测(CELP)型的语音编码系统。
背景技术
低速率编码应用,诸如数字语音,通常使用诸如线性预测编码(LPC)的技术来对短时语音信号进行建模。采用LPC技术的编码系统提供预测残差信号,用于校正短时模型的特性。一种这样的编码系统是称为码本激励线性预测(CELP)的语音编码系统,其以低比特率、即4.8到9.6千比特每秒(kbps)的比特率,产生高质量合成语音。这类语音编码,也称为矢量激励线性预测或随机编码,用于各种语音通信和语音合成应用中。CELP还特别适用于数字语音加密和数字无线电话通信系统,在这样的系统中,特别关注语音质量、数据速率、大小和成本。
实现LPC编码技术的CELP语音编码器通常采用长时(“基音”)和短时(“共振峰”)预测器,它们对输入语音信号的特性进行建模并且合并到一组时变线性滤波器中。用于滤波器的激励信号,或者说码矢量,选自储存的码矢量的码本。对于每个语音帧,语音编码器将码矢量用于滤波器以生成重建的语音信号,并且将原始输入语音信号与重建信号进行比较以产生差信号。然后通过让差信号通过具有基于人类听觉的响应的加权滤波器而对差信号进行加权。然后通过选择一个或多个产生具有当前帧的最小能量的加权差信号的码矢量来确定最优化的激励信号。
例如,图1是现有技术的CELP编码器100的框图。在CELP编码器100中,将输入信号s(n)施加到线性预测(LP)分析器101,其中使用线性预测编码来估计短时频谱包络。得到的频谱系数(或线性预测(LP)系数)是由传输函数A(z)表示的。将频谱系数施加到LP量化器102,LP量化器102对频谱系数进行量化以产生适合用于多路复用器109的量化后的频谱系数Aq。量化后的频谱系数Aq随后被传送到多路复用器109,多路复用器基于量化后的频谱系数以及由平方差最小化/参数量化模块108确定的一组与激励矢量相关的参数L,β,I和γ来产生编码比特流。结果,对于每个语音块,产生的对应的一组与激励矢量相关的参数包括长时预测器(LTP)参数L和β,以及固定码本索引I和缩放因子γ。
量化后的频谱参数还被本地传送到LP合成滤波器105,LP合成滤波器105具有对应的传输函数1/Aq(z)。LP合成滤波器105还接收组合的激励信号ex(n)并基于量化频谱系数Aq和组合的激励信号ex(n)来产生对输入信号的估计
Figure C20038010280300061
如下产生组合的激励信号ex(n)。固定码本(FCB)码矢量,或激励矢量,
Figure C20038010280300062
选自固定码本(FCB)103,其基于固定码本索引参数I。FCB码矢量
Figure C20038010280300063
随后基于增益参数γ进行加权,加权后的固定码本码矢量被传送到长时预测器(LTP)滤波器104。LTP滤波器104具有对应的传输函数“1/(1-βz-L)”,其中β和L是由平方差最小化/参数量化模块108传送到滤波器的与激励矢量相关的参数。LTP滤波器104对从FCB 103接收的加权固定码本码矢量进行滤波,以产生组合激励信号ex(n)并将激励信号传送到LP合成滤波器105。
LP合成滤波器105将输入信号估计
Figure C20038010280300064
传送到组合器106。组合器106还接收输入信号s(n)并且用输入信号s(n)减去输入信号的估计输入信号s(n)和输入信号估计
Figure C20038010280300072
之差施加到感觉差加权滤波器107,该滤波器基于
Figure C20038010280300073
和s(n)之差和加权函数W(z)产生感觉加权差信号e(n)。感觉加权差信号e(n)然后被传送到平方差最小化/参数量化块108。平方差最小化/参数量化108使用差信号e(n)来确定一组与激励矢量相关的最优化参数L,β,I和γ,这些参数产生了输入信号s(n)的最佳估计
Figure C20038010280300074
量化的LP系数和最优化的一组参数L,β,I和γ随后通过通信信道被传送到接收通信设备,在接收通信设备,语音合成器使用LP系数和与激励矢量相关的参数来重构输入语音信号s(n)。
在CELP编码器中,诸如编码器100中,用于生成CELP编码器组合激励信号的合成函数是由下面的广义差分方程给出的:
ex ( n ) = γ c ~ I ( n ) + βex ( n - L ) , n = 0 , N - 1 - - - ( 1 )
其中,ex(n)是一子帧的合成组合激励信号,
Figure C20038010280300076
是码矢量或激励矢量,选择诸如FCB 103的码本,I是索引参数或码字,指定选择的码矢量,γ是用于缩放码矢量的增益,ex(n-L)是相对当前子帧的第n个采样延迟L个采样的合成组合激励信号(对于浊语音来说,L通常与基音周期相关),β是长时预测器(LTP)增益因子,N是子帧中的采样数。当n-L<0时,ex(n-L)包含过去合成激励的历史,如公式(1)所示构建。也即,对于n-L<0,表达式“ex(n-L)”对应于在当前子帧之前构建的激励采样,该激励采样已经依照LTP滤波器传输函数“1/(1-βz-L)”延迟且缩放。
典型CELP语音编码器(诸如编码器100)的目标是选择规定合成激励的参数,即,编码器100中的参数L,β,I,γ,n<0的给定ex(n)以及短时线性预测器(LP)滤波器105的确定系数,由此,当n=0,N-1的合成激励序列ex(n)通过LP滤波器105进行滤波以生成合成语音信号时,根据所采用的失真标准,合成语音信号最接近地近似于在子帧被编码的输入语音信号s(n)。
对于大于或等于N的L值,即L N  ,公式(1)准确实现。在这样的情况下,对于该子帧的合成激励,可等价地定义为
ex(n)=βco(n)+γc1(n),n=0,N-1,    (2)
其中
c0(n)=ex(n-L),n=0,N-1,      (3)
c 1 ( n ) = c ~ I ( n ) , n = 0 , N - 1 , - - - ( 4 )
而且,其中,c0(n)是为该子帧所选择的LTP矢量,c1(n)是为该子帧选择的码矢量。由于L≥N,c0(n)和c1(n)一旦选定,在公式(2)的方程里显然独立于β和γ。而且,c0(n)仅仅是n<0的ex(n)的函数,其保持β的解为线性问题。类似地,因为L≥N,在当前子帧,c1(n)不受长时预测器(LTP)滤波器104的影响。这些因子通过语音编码器100的平方差最小化/参数量化模块108简化了参数(L,β,I,γ)的选择。选择L的范围,使其覆盖较广大的讲话者的基音的期望范围,在8kHz采样频率,该范围的低限通常设置为20个采样左右,对应于400Hz的基音频率。为了获得好的编码效率,最好使用N>Lmin,其中是Lmin是延迟范围上的低限。典型地,编码器的激励参数以子帧速率传输,该子帧速率与子帧长度N成反比。也就是说,子帧长度N越长,就越不需要频繁地量化和传输编码器的子帧参数。
对于小于N的L值,即L<N,公式(2)不再等价于公式(1)。为了在L<N时保留使用公式(2)的形式的优点,题为“Code ExcitedLinear Precictive Vocoder Using Virtual Searching”的美国专利4,910,781中提出了一种想法,即如下修改c0(n)的定义:
ex(n)=βco(n)+γc1(n),n=0,N-1,    (5)
其中
c 0 ( n ) = ex ( n - L ) , n = 0 , Min ( L , N ) - 1 , c 0 ( n - L ) , n = L , N - 1 - - - ( 6 )
c 1 ( n ) = c ~ I ( n ) , n = 0 , N - 1 - - - ( 7 )
在公式(6)中,c0(n)包含取自“虚拟码本”(通常为自适应码本(ACB))的矢量,其中允许L<N。公式(4)中给出的c1(n)的定义在公式(6)中保留,这意味着,当L<N时,
Figure C20038010280300084
由LTP滤波器滤波而免除。这是公式(1)的直接实现的另一偏差。因此,公式(5)具有提供由公式(2)提供的简化实现、同时还允许L<N的优点。通过在L<N时偏离公式(1)的精确实现而达到此优点。
例如,图2是现有技术中实现公式(5)-(7)的另一CELP编码器200的框图。类似于CELP编码器100,在CELP编码器200中,由LP分析器101和LP量化器102来产生量化频谱系数Aq,该量化频谱系数被传送到多路复用器109,多路复用器109基于量化频谱系数和一组与激励矢量相关的参数L,β,I和γ产生编码比特流,上述一组参数是由平方差最小化/参数量化模块108确定的。量化频谱系数Aq还被本地传送到LP合成滤波器105,LP合成滤波器105具有对应的传输函数1/Aq(z)。LP合成滤波器105还接收组合激励信号ex(n),并且基于量化频谱系数Aq和组合激励信号ex(n)产生输入信号的估计
Figure C20038010280300091
CELP编码器200不同于CELP编码器100的地方在于用于产生组合激励信号ex(n)的技术。在CELP编码器200中,第一激励矢量c0(n)基于与激励矢量相关的参数L,选自虚拟码本201。虚拟码本201典型为自适应码本(ACB),此时,第一激励矢量是自适应(ACB)码矢量。虚拟码本码矢量c0(n)随后基于增益参数β被加权,加权虚拟码本码矢量被传送到第一组合器203。固定码本(FCB)码矢量,或激励矢量,
Figure C20038010280300092
基于与激励矢量相关的参数I而选自固定码本(FCB)202。FCB码矢量
Figure C20038010280300093
(或者等价地,c1(n),根据公式(7))随后基于增益参数γ被加权,也被传送到第一组合器203。第一组合器203随后通过将加权的虚拟码本码矢量c0(n)同加权的FCB码矢量c1(n)相组合而产生组合激励信号ex(n)。
LP合成滤波器105将输入信号估计传送到第二组合器106。第二组合器106还接收输入信号s(n),用输入信号s(n)减去输入信号估计
Figure C20038010280300095
输入信号s(n)与输入信号估计
Figure C20038010280300096
之差施加到感觉差加权滤波器107,该滤波器基于与s(n)之差和加权函数W(z)而产生感觉加权的差信号e(n)。然后,将感觉加权差信号e(n)传送到平方差最小化/参数量化模块108。平方差最小化/参数量化模块108使用差信号e(n)来确定一组与激励矢量相关的最优参数L,β,I和γ,这组参数产生输入信号s(n)的最佳估计
Figure C20038010280300102
类似于编码器100,编码器200将量化频谱系数和所选的一组参数L,β,I和γ通过通信信道传送到接收通信设备,在接收通信设备,语音合成器使用LP系数和与激励矢量相关的参数来重构编码的输入语音信号s(n)。
在论文Mano,K;Moriya,T;Miki,S;and Ohmuro,H.,“Design of apsi-celp coder for mobile communications”,Proceedings of the IEEEWorkshop on Speech Coding for Telecommunications,pp.21-22,October13-15,1993中,美国专利4,910,781中提出的“虚拟码本”的概念被扩展到在L<N时还修改固定码本码矢量的定义,也就是说,
ex(n)=βco(n)+γc1(n),n=0,N-1,   (8)
其中
c 0 ( n ) = ex ( n - L ) , n = 0 , Min ( L , N ) - 1 , c 0 ( n - L ) , n = L , N - 1 - - - ( 9 )
c 1 ( n ) = c ~ I ( n ) , n = 0 , Min ( L , N ) - 1 , c 1 ( n - L ) , n = L , N - 1 - - - ( 10 )
很显然,在公式(8)、(9)和(10)中,当L<N时,c1(n)在N采样的L中是周期性的。
另一用于在L<N时近似公式(1)的技术在论文Salami,R.,Laflamme,C.,Adoul,J.-P.,Massaloux,D.,“A toll quality 8kb/s speechcodec for the personal communications system(PCS)”,IEEE Transactionson Vehicular Technology,Volume 43,Issue 3,Parts 1-2,August 1994,pages 808-816中(下文称之为“Salami et al.”)提出。Salami et al.所提出的想法是施加零状态长时滤波器(“基音锐化滤波器”)以产生激励码矢量c1(n),其中
ex(n)=βc0(n)+γc1(n),n=0,N-1     (11)
c 0 ( n ) = ex ( n - L ) , n = 0 , Min ( L , N ) - 1 , c 0 ( n - L ) , n = L , N - 1 - - - ( 12 )
c 1 ( n ) = c ~ I ( n ) , n = 0 , Min ( L ^ , N ) - 1 , c ~ I ( n ) + β ^ c 1 ( n - L ^ ) , n = L ^ , N - 1 - - - ( 13 )
注意到,公式(12)中,使用了“虚拟码本”或ACB,而长时延迟
Figure C20038010280300113
(用于“基因锐化滤波器”)和L(与ACB相关的延迟)允许不同。例如,L可以表示为采样分数解(此时,将使用内插滤波器来计算分数延迟采样),而
Figure C20038010280300114
可以是L的函数,其中,
Figure C20038010280300115
的值设置为等于L四舍五入或舍位为最接近L的整数值。可替换地,
Figure C20038010280300116
可以设置为等于L。此外,在Salami et al.中,是设置为0.8的常数。
Figure C20038010280300118
预设为常数值是Salami et al.的限制特征。为了提供改进的公式(1)在L<N时的近似,题为“CS-ACELP Speech CompressionSystem with Adaptive Pitch Prediction Filter Gain Based on a Measure ofPeriodicity”的美国专利5,664,055(下文称之为“’055专利”)提出,使
Figure C20038010280300119
为基于周期性的时变函数,例如,其中
Figure C200380102803001110
可以以子帧速率得到更新。当连续选择和量化了β和γ时,’055专利提出将定义为
β ^ = Max ( 0.2 , Min ( 0.8 , β ) ) . - - - ( 14 )
也就是说,
Figure C200380102803001113
最初设置为等于β,但是限制为不小于0.2、不大于0.8。’055专利提出的方法是用于语音编码器标准电信工业协会/电子工业联盟过渡标准127(TIA/EIA/IS-127)和全球移动通信系统(GSM)标准06.60的方法,这些标准在此通过引用整体结合进来参考。
典型地,以连续的方式进行对最优化增益参数β和γ的确定。但是,对最优化增益参数β和γ的连续确定实际上是次优化(sub-optimal)的,因为一旦选择了β,其值在进行γ优化时保持固定。如果没有连续选择和量化β和γ,而是联合选择和量化的话,也就是说,矢量量化为(β,γ)对,就会出现一个问题,因为增益矢量量化在选择c0(n)和c1(n)之后进行,而c1(n)(公式(13))是
Figure C20038010280300121
的函数。如公式(14)所定义的,
Figure C20038010280300122
取决于β的量化值,其不可用,直到完成增益β和γ的矢量量化,并由此确定量化(β,γ)增益矢量。为了解决该问题,’055专利提出,在采用增益的矢量量化时,使用
Figure C20038010280300123
的修改定义,即
β ^ = Max ( 0.2 , Min ( 0.8 , β previous ) ) . - - - ( 15 )
公式(15)中的βprevious表示用于定义在前面子帧的激励序列ex(n)的β的值。国际电信联盟(ITU)建议G.729,“Coding of Speech at 8kbit/susing Conjugate-Structure Algebraic-Code-Excited Linear Prediction(CS-ACELP),”Geneva,1996 and TIA/EIA/IS-641中描述的语音编码器采用了这种方法。尽管该方法解决了略述的非因果问题,其还是不如优化,因为βprevious总是不能在当前子帧正确地对β建模,尤其是在当前子帧的浊音程度基本上不同于前一子帧的浊音程度的时候,诸如在浊音到清音或清音到浊音转换的区域。
因此,需要一种改进的方法来在CELP型语音编码器中量化增益参数,其中基于当前子帧联合优化增益参数。
附图说明
图1是现有技术的码本激励线性预测(CELP)编码器的框图。
图2是另一现有技术的码本激励线性预测(CELP)编码器的框图。
图3是根据本发明实施例的码本激励线性预测(CELP)编码器的框图。
图4是根据本发明实施例由图3的CELP编码器对信号进行编码的执行步骤的逻辑流程图。
图5是根据本发明另一实施例的码本激励线性预测(CELP)编码器的框图。
图6是根据本发明另一实施例的码本激励线性预测(CELP)编码器的框图。
具体实施方式
为了解决对于一种改进的在CELP型语音编码器中对增益参数进行量化的方法的需要,其中基于当前子帧联合优化增益参数,一种执行信号的综合分析(analysis-by-synthesis)编码的语音编码器为合成激励信号的多个构成成分的每一构成成分确定增益参数。语音编码器基于输入信号生成目标矢量。语音编码器进一步生成与合成激励信号相关的多个构成成分,其中多个构成成分中的一个构成成分基于多个构成成分中另一构成成分的偏移。该语音编码器进一步基于目标矢量和多个构成成分评估误差标准,以确定与多个构成成分的每个构成成分相关的增益。
通常,本发明的一个实施例包括一种用于信号的综合分析编码的方法。该方法包括步骤:基于输入信号生成目标矢量,以及生成与合成激励信号相关联的多个构成成分,其中多个构成成分中的一个构成成分基于多个构成成分中另一构成成分的偏移。该方法还包括步骤:基于目标矢量和多个构成成分评估误差标准,以确定与多个构成成分的每个构成成分相关的增益。
本发明的另一个实施例包括一种用于信号的综合分析编码的装置。该装置包括用于基于输入信号生成目标矢量的装置和生成与合成激励信号相关联的多个构成成分的成分生成器,其中多个构成成分中的一个构成成分基于多个构成成分中另一构成成分的偏移。该装置还包括误差最小化单元,用于基于目标矢量和多个构成成分评估误差标准,以确定与多个构成成分的每个构成成分相关的增益。
本发明的又一种实施例包括一种用于子帧的综合分析编码的方法。该方法包括步骤:基于输入信号生成目标矢量,生成与合成激励信号相关联的多个构成成分,以及基于目标矢量和多个构成成分确定差信号。该方法还包括步骤:基于差信号,为子帧联合确定多个增益参数,其中多个增益参数的每个增益参数与多个码本的不同码本相关联,其中联合确定的多个增益参数不是基于较早的子帧的增益参数而确定的。
本发明的另一种实施例包括一种编码器,执行信号的综合分析编码。该编码器包括处理器,用于基于输入信号生成目标矢量,生成与合成激励信号相关联的多个构成成分,其中多个构成成分中的一个构成成分基于多个构成成分中另一构成成分的偏移,以及基于目标矢量和多个构成成分评估误差标准,以确定与多个构成成分的每个构成成分相关的增益。
本发明的又一个实施例包括一种编码器,其执行子帧的综合分析编码。该编码器包括处理器和用于维持多个码本的存储器,其中处理器基于输入信号生成目标矢量,生成与合成激励信号相关联的多个构成成分,基于目标矢量和多个构成成分确定差信号,以及基于差信号,为子帧联合确定多个增益参数,其中多个增益参数的每个增益参数与多个码本的不同码本相关联,其中联合确定的多个增益参数不是基于较早的子帧的增益参数而确定的。
结合图3-6可更加全面地描述本发明。图3是根据本发明实施例的CELP型语音编码器300的框图。编码器300实现在处理器中,诸如一个或多个微处理器、微控制器、数字信号处理器(DSP)、其组合或者本领域普通技术人员所知的其他这样的设备,其与一个或多个相关的存储设备相通信,相关存储设备诸如随机存取存储器(RAM)、动态随机存取存储器(DRAM)、和/或只读存储器(ROM)或者其等价物,其储存数据、码本、和可由处理器执行的程序。
图4是根据本发明实施例的编码器300在编码信号时所执行的步骤的逻辑流程图400。逻辑流程400开始(402)于输入信号s(n)施加到感觉差加权滤波器304。加权滤波器304通过加权函数W(z)对输入信号进行加权(404),以产生加权输入信号s’(n)。此外,过去组合激励信号ex(n-N),其中N是子帧中的采样数,对于加权合成滤波器302可用,其具有对应的零输入响应Hzir(z),用来为子帧计算加权合成滤波器的零输入响应d(n)。Hzir或H是N x N零状态加权合成卷积矩阵,是由加权合成滤波器的冲激响应hzir(n)或h(n)形成的,对应于传输函数H(z),该矩阵可表示为:
Figure C20038010280300151
加权输入信号s’(n)和滤波后的过去激励信号ex(n-N),即由加权合成滤波器302产生的d(n)都被传送到第一组合器320。第一组合器320用加权输入信号s’(n)减去(406)滤波后的过去激励信号ex(n-N)即d(n),以产生目标输入信号p(n),其中p(n)=s’(n)-d(n)。本领域普通技术人员意识到目标信号p(n)、与加权输入信号s’(n)、滤波后的过去激励信号d(n)、以及下面结合编码器300、500和600所描述的所有其他信号,诸如组合激励信号ex(n)、滤波后的组合激励信号ex’(n)、以及差信号e(n),每个都可以在编码器操作的矢量表示中表示为矢量。第一组合器320随后将目标输入信号p(n)传送到第三组合器322。
矢量生成器306基于与激励矢量相关的初始第一参数L(其由误差最小化单元324提供给矢量生成器)生成(408)初始第一激励矢量c0(n)。在本发明一个实施例中,矢量生成器306是虚拟码本,诸如自适应码本(ACB),激励矢量c0(n)是自适应码本(ACB)码矢量,基于索引参数L选自ACB。在本发明另一实施例中,矢量生成器306和缩放模块308可以基于延时参数L、过去组合激励信号ex(n-N)和β,使用形为“1/(1-βz-L)”的传输函数,由基音滤波器的输出替换。在参看图3和4,初始第一激励矢量c0(n)随后被第一加权器308基于初始第一增益参数(由误差最小化单元324提供给加权器)加权(410),以产生加权初始第一激励矢量yL(n),这里yL(n)=βc0(n)。第一加权器308随后将加权第一激励矢量yL(n)传送到第二组合器316。
第二组合器316还接收如下产生的加权初始第二激励矢量yI(n)。初始第二激励矢量是由固定码本310基于与激励矢量相关的初始第二激励索引参数I(由误差最小化单元324提供给矢量生成器310)而生成的(412)。固定码本310将初始第二激励矢量
Figure C20038010280300162
传送到具有对应传输函数“1/(1-βz-L)”的基音预滤波器312。基音预滤波器312将初始第二激励矢量
Figure C20038010280300163
与矢量
Figure C20038010280300164
用第一增益参数β加权后的偏移版本(诸如时间延迟或相位偏移版本)即
Figure C20038010280300165
相组合,以产生激励矢量c1(n)。延时因子L和初始第一增益参数β都是由误差最小化单元324提供给基音预滤波器312的。基音预滤波器312将激励矢量c1(n)传送到第二加权器314,第二加权器314基于初始第二增益参数γ(由误差最小化单元324提供给加权器)来加权(414)激励矢量c1(n),以产生加权滤波后的初始第二激励矢量yI(n),这里
Figure C20038010280300166
Figure C20038010280300167
第二加权器314随后将加权滤波后的初始第二激励矢量yI(n)传送到第二组合器316。
第二组合器316将加权的第一初始激励矢量yL(n)与加权滤波的初始第二激励矢量yI(n)相结合,以产生组合激励信号ex(n),其中
ex ( n ) = y ‾ L ( n ) + y ‾ I ( n ) = β c 0 ( n ) + γ c ~ I ( n ) + βγ c ~ I ( n - L ) . - - - ( 16 )
第二组合器316将组合激励信号ex(n)传送到零状态加权合成滤波器318,用于对组合激励信号ex(n)进行滤波(418),以产生滤波后的组合激励信号ex’(n)。加权合成滤波器318将滤波后的组合激励信号ex’(n)传送到第三组合器322,这里,用目标信号p(n)减 去(420)滤波后的组合激励信号ex’(n)以产生感觉加权差信号e(n)。感觉加权差信号e(n)随后被传送到误差最小化单元324,优选是平方差最小化/参数量化模块。误差最小化单元324使用差信号e(n)来确定(422)与激励矢量相关的一组优化参数L,β,I和γ,其通过最小化差信号e(n)最优化了编码器300的性能,其中,该确定包括联合确定与激励矢量相关的一组增益参数β和γ,这组参数与组合激励信号ex(n)的构成成分即c0(n),
Figure C20038010280300171
Figure C20038010280300172
相关联。
基于与激励矢量相关的优化参数L和I,编码器300分别由矢量生成器306和码本310生成(424)优化的(相对于所采用的选择标准)一组第一和第二激励矢量,或码矢量,c0(n)和
Figure C20038010280300173
与激励矢量相关的增益参数β和γ的优化导致加权器308和314对组合激励信号ex(n)的构成成分即c0(n),
Figure C20038010280300175
的优化加权(426),由此产生(428)对输入信号s(n)的最佳估计。编码器300随后将与激励矢量相关的优化的一组参数L,β,I和γ传送(430)到接收通信设备,这里,语音合成器使用接收的与激励矢量相关的参数来重构输入语音信号s(n)的编码版本。逻辑流程随后结束(432)。在上述图3和4的讨论中需要注意的一点是,为了举例描述,假定的数值。
在现有技术编码器中,与激励矢量相关的优化的一组用于当前子帧的增益参数β和γ是通过进行顺序优化过程而确定的,或者由联合优化过程使用与前一子帧相关的增益参数βprevious确定的,或者是在优化过程之前就已知的值,而与现有技术编码器不同,编码器300的误差最小化单元324通过在步骤(422)基于当前子帧的处理而进行联合优化过程来确定与激励矢量相关的优化的一组增益参数β和γ,即,增益矢量(β,γ)或(β,γ)对。通过基于当前子帧的处理进行联合优化过程,优化了对于激励矢量相关的一组增益参数β和γ的确定,因为考虑到了在优化每个参数时选择一个与激励矢量相关的增益参数对选择另一个与激励矢量相关的增益参数的影响,以及消除了由于使用βprevious来在当前子帧建模β或者使用常数
Figure C20038010280300177
带来的次优化。
由误差最小化单元324对于激励矢量相关的增益参数β和γ进行联合优化的步骤(422)可以如下导出。为了开始,公式(1)提供了广义差分方程,其定义了用于生成现有技术的典型CELP编码器的组合激励信号ex(n)的合成函数,如下重述:
ex ( n ) = γ c ~ I ( n ) + βex ( n - L ) , n = 0 , N - 1 . - - - ( 1 )
现在参看图5,考虑
Figure C20038010280300182
的情况。图5是根据本发明另一实施例的CELP编码器500的框图。类似于编码器300,编码器500实现在处理器中,诸如一个或多个微处理器、微控制器、数字信号处理器(DSP)、其组合或者本领域普通技术人员所知的其他这样的设备,其与一个或多个相关的存储设备相通信,相关存储设备诸如随机存取存储器(RAM)、动态随机存取存储器(DRAM)、和/或只读存储器(ROM)或者其等价物,其储存数据、码本、和可由处理器执行的程序。
编码器500所采用的用来联合优化与激励矢量相关的增益参数β和γ的基本原理也可以由编码器300来实现。使用编码器500仅仅是为了说明本发明的原理,而非以任何方式限制本发明。此外,为了说明本发明的原理,假设L具有整数解;但是,本领域普通技术人员意识到,L可以具有子采样解。在L具有子采样解的情况下,可以使用内插滤波器来计算分数延迟的采样,总和的范围也可以进行调整以解决对这样的内插滤波器的使用。当
Figure C20038010280300183
时,β和β2都将出现在对子帧的合成激励ex(n)的定义中。此时,ex(n)可以分解成四个构成矢量c0(n)到c3(n)的线性叠加,这些矢量可以通过下面的公式(17)-(20)表示:
c ‾ 0 ( n ) = ex ( n - L ) , n = 0 , L - 1 0 , n = L , N - 1 , - - - ( 17 )
c ‾ 1 ( n ) = 0 , n = 0 , L - 1 c ‾ 0 ( n - L ) , n = L , N - 1 , - - - ( 18 )
c ‾ 2 ( n ) = c ~ I ( n ) , n = 0 , N - 1 , - - - ( 19 )
c ‾ 3 ( n ) = 0 , n = 0 , L - 1 c ~ I ( n - L ) , n = L , N - 1 , - - - ( 20 )
并且该合成组合激励信号ex(n)可以通过下面的公式(21)表示为:
ex(n)=βc0(n)+β2c1(n)+γc2(n)+βγc3(n),n=0,N-1.(21)
c0(n)是子帧要由增益β缩放的ex(n)的成分。c1(n)是子帧要由增益β2缩放的ex(n)的成分。c2(n)是要由增益γ缩放的对ex(n)的码矢量贡献。最后,c3(n)是要由增益βγ缩放的对ex(n)的码矢量贡献。公式(1)分解成四个增益缩放构成矢量c0(n)到c3(n)的叠加,如公式(21)所示,明确地将构成矢量与增益缩放因子β和γ相分离。
也就是,类似于编码器300,编码器500将输入信号s(n)施加到感觉差加权滤波器304。加权滤波器304通过加权函数W(z)对输入信号进行加权(404),以产生加权输入信号s’(n)。此外,过去组合激励信号ex(n-N)对于加权合成滤波器302可用,其具有对应的零输入响应Hzir(z),用来为子帧计算加权合成滤波器的零输入响应d(n)。第一组合器320用加权输入信号s’(n)减去滤波后的过去激励信号d(n),以产生目标输入信号p(n)。此外,类似于编码器300,初始第一激励矢量c0(n)或ex(n-L)是由矢量生成器502(诸如虚拟码本或LTP滤波器)基于与激励矢量相关的初始第一参数L产生的,初始第二激励矢量
Figure C20038010280300191
是固定码本(FCB)310基于与激励矢量相关的初始第二参数I产生的。
与编码器300不同,编码器500中包括且连接到矢量生成器502的第一构成矢量生成器504将初始第一激励矢量c0(n)或ex(n-L)分解成构成矢量c0(n)和c1(n)。矢量c0(n)如公式(17)所定义的,包括第一L项的矢量c0(n),矢量c1(n)如公式(18)所定义的,包括剩余项的c0(n)。此外,不像编码器300,编码器500中包括且连接到FCB 310的第二构成矢量生成初始第二激励矢量
Figure C20038010280300192
的一个或多个构成成分,以产生c2(n)和c3(n)。矢量c2(n)如公式(19)所定义的,等价于矢量
Figure C20038010280300193
矢量c3(n)如公式(20)所定义的,包括矢量第一L项的零(0)和剩余N-L项的
Figure C20038010280300201
项。编码器500随后通过与激励矢量相关的各自增益参数β,β2,γ和βγ、经各自的加权器508-511来分别加权每个矢量c0(n),c1(n),c2(n)和c3(n)。加权的矢量β c0(n),β2 c1(n),γc2(n),以及βγ c3(n)每个都被路由到组合器516,在这里,将它们加起来以产生组合激励信号ex(n)=βc0(n)+β2c1(n)+γc2(n)+βγc3(n),n=0,N-1。
类似于编码器300,组合激励信号ex(n)随后被零状态加权合成滤波器318滤波以产生滤波组合后的激励信号ex’(n)。加权合成滤波器318将滤波组合的激励信号ex’(n)传送到组合器322,在这里,用目标信号p(n)减去滤波组合激励信号ex’(n)以产生感觉加权差信号e(n)。感觉加权差信号e(n)随后被传送到误差最小化单元524,优选是平方差最小化/参数量化模块。误差最小化单元524使用差信号e(n)来确定与激励矢量相关的一组优化参数L,β,I和γ,其通过最小化差信号e(n)最优化了编码器500的性能,其中,该确定包括联合确定与激励矢量相关的一组增益参数β和γ,由此确定与组合激励信号ex(n)的构成成分即c0(n),c1(n),c2(n)和c3(n)相关联的优化增益β,β2,γ和βγ。
与激励矢量相关的一组优化增益参数β和γ可如下联合确定。如上面所说的,s′(n)对应于感觉加权语音,d(n)对应于感觉加权合成滤波器对子帧的零输入响应。编码器300和500在编码器执行来定义ex(n)所使用的感觉加权目标矢量p(n)随后可以用下面的公式表示:
p(n)=s′(n)-d(n),n=0,N-1. (22)
子帧的合成激励ex(n)随后被施加到感觉加权合成滤波器,以产生滤波后的合成激励ex’(n)。用于滤波后的合成激励ex’(n)的公式可以如下导出。让矢量c′0(n)到c′3(n)分别表示滤波后的矢量c0(n)到c3(n)。也就是,矢量c0(n)到c3(n)由加权合成滤波器318进行滤波以产生矢量c′0(n)到c′3(n)。可替换地,对矢量c0(n)到c3(n)的每个的滤波可以包括将每个矢量与加权合成滤波器318的冲激响应进行卷积的步骤。滤波后的合成激励矢量ex’(n)随后可以由下面的公式(23)表示:
ex′(n)=βc′0(n)+β2c′1(n)+γc′2(n)+βγc′3(n),n=0,N-1    (23)
而子帧的感觉加权差能量E可以由下面的公式(24)和(25)中的一个来表示,即:
E = Σ n = 0 N - 1 ( p ( n ) - e x ′ ( n ) ) 2 - - - ( 24 )
E = Σ n = 0 N - 1 [ p ( n ) - β c ‾ 0 ′ ( n ) - β 2 c ‾ 1 ′ ( n ) - γ c ‾ 2 ′ ( n ) - βγ c ‾ 3 ′ ( n ) ] 2 . - - - ( 25 )
通过扩展公式(25),很明显,公式(25)可以用下面这几个方面来等价地表示:(i)β和γ,(ii)滤波后构成矢量c′0(n)到c′3(n)的交叉相关,即(Rcc(i,j)),(iii)感觉加权目标矢量p(n)与每个滤波后构成矢量之间的交叉相关,即(Rpc(i)),以及(iv)子帧的加权目标矢量p(n)的能量,即(Rpp)。上面列出的相关可以用下面的公式表示:
R pp = Σ n = 0 N - 1 p 2 ( n ) - - - ( 26 )
R pc ( i ) = Σ n = 0 N - 1 p ( n ) c ‾ i ′ ( n ) , i = 0,3 - - - ( 27 )
R cc ( i , j ) = Σ n = 0 N - 1 c ‾ i ′ ( n ) c ‾ j ′ ( n ) , i = 0,3 ; j = i , 3 - - - ( 28 )
R cc ( i , j ) = R cc ( j , i ) , i = 0,3 ; j = i + 1,3 - - - ( 29 )
根据公式(26)-(29)以及增益项β和γ重写公式(25)则生成了下面的用于子帧的感觉加权差能量E的公式:
E=Rpp-2βRpc(0)-2β2Rpc(1)-2γRpc(2)-2βγRpc(3)
+2β3Rcc(0,1)+2βγRcc(0,2)+2β2γRcc(0,3)
+2β2γRcc(1,2)+2β3γRcc(1,3)+2βγ2Rcc(2,3)   (30)
2Rcc(0,0)+β4Rcc(1,1)+γ2Rcc(2,2)+γ2β2Rcc(2,3)
解与激励矢量相关的联合优化的一组增益项(β,γ)包括取E关于β的第一偏导数,将该第一偏导数设置为等于零(0),取E关于γ的第二偏导数,将该第二偏导数设置为等于零(0),然后解这两个联立非线性方程的得到的系统,即,解下面的联立非线性方程组:
∂ E ∂ β = 0 , ∂ E ∂ γ = 0 - - - ( 31 )
本领域普通技术人认识到,方程(31)的解不需要编码器300或者编码器500实时执行。编码器300和500每个都可以单独地解方程(31),作为步骤一部分来训练和获得增益矢量(β,γ),其储存在各自的增益信息表326、526中。每个增益信息表326、526可以包括一个或多个用于储存增益信息的表,包括在,或者可以引用自,各自的误差最小化单元324、524,并且可以用于量化和联合优化与激励矢量相关的增益项对(β,γ)。
假定每个增益信息表326、526这样获得,编码器300和500的任务,特别是各自误差最小化单元324、524的任务,是选择增益矢量,即(β,γ)对,使用各自的增益信息表326、526,使得子帧的感觉加权差能量E,如公式(30)所示,在增益信息表中评估的矢量上进行最小化。为了帮助选择(β,γ)对,以生成用于感觉加权差矢量的最小化能量,在公式(30)所表示的E的每项β和γ的解可以由每个编码器300、500为每个(β,γ)对进行预先计算并储存在各自增益信息表326、526中,其中每个增益信息表326、526包括一个查找表。
一旦基于增益信息表326、526确定增益矢量,可以通过用公式(30)的14个预先计算项(对应于选择的增益矢量)的第一项乘以值“-0.5”以获得β的值。类似地,可以通过用公式(30)的14个预先计算项的第三项乘以值“-0.5”以获得γ的值。由于相关Rpp,Rpc和Rcc明显与增益项β和γ相分离,分解操作如上所述,相关Rpp,Rpc和Rcc只能为每个子帧计算一次。此外,Rpp的计算可以完全忽略,因为对于给定子帧,相关Rpp是常数,其值将选择相同增益矢量即(β,γ)对在公式(30)中具有或不具有相关Rpp
当公式(30)的项如上所述预先计算了时,公式(30)的评估可以通过每评估的增益矢量14个乘累加(MAC)运算来有效地完成。本领域普通技术人员认识到,尽管特殊增益矢量量化器,即误差最小化单元324、524和624的特殊格式的增益信息表326、526和626在这里的描述是用于说明性目的,列出的方法同样适用于其他量化增益信息的方法,诸如标量量化或矢量量化技术,包括无后效性的或预测技术。如本领域所公知,使用标量量化或矢量量化技术将包括储存增益信息到增益信息表326和526,然后可用于确定增益矢量。本领域普通技术人员进一步认识到,尽管上面的例子说明了在
Figure C20038010280300231
时将ex(n)分解为其构成矢量的方法,该方法也可轻易的扩展到
Figure C20038010280300232
等的情况。
上面所示的分解过程有效地在L<N时,特别是给定的例子,将构成矢量与增益参数或缩放因子β和γ相分离。该分解使得,一旦构成矢量c0(n)到c3(n)由公式(17)-(20)所定义,作为互相独立的矢量,可能处理构成矢量c0(n)到c3(n)。这使得有可能对于给定子帧,预先计算相关项Rpc和Rcc,并且因此有效评估公式(30)。将公式(21)重写为公式(32),合成组合激励信号ex(n)可再次如下表示:
ex(n)=βc0(n)+β2c1(n)+γc2(n)+βγc3(n),n=0,N-1,(32)
而且,很明显,确定联合优化增益β和γ,使得公式(30)中的加权差能量E最小化,包括解两个联立非线性方程的系统,即,解方程(31)。但是,作为解优化增益矢量即优化(β,γ)对的联立方程的系统的另一方案,增益矢量的量化和优化对的确定可以替换地包括在增益信息表326、526中检索每个增益矢量并选择增益矢量即(β,γ)对,用来产生该子帧最小的E值。可替换地,只有增益矢量量化器即增益信息表326、526中的矢量子集,可以预先选择用以评估,从而进一步限制与选择(β,γ)对有关的计算量。
但是,可能希望使解联合优化增益β和γ成为线性(因此在计算量上解起来更简单)问题。这可能非常有用,例如如果搜索激励码字或索引参数I,假定对于给定L评估每个激励码矢量
Figure C20038010280300241
使用联合优化的一组增益缩放因子。因此,在本发明另一“线性化”实施例中,CELP编码器可以例如在联合优化增益β和γ中解联立线性方程的系统。
图6是根据本发明线性化实施例的示例CELP编码器600的框图。类似于编码器300和500,编码器600实现在处理器中,该处理器与一个或多个存储设备相通信,存储设备储存数据、码本、和可由处理器执行的程序。编码器600类似于编码器500,除了在编码器600中,与构成矢量c0(n)到c3(n)中的每个相关缩放因子或增益参数是独立的。通过使缩放因子独立,可以获得与激励矢量相关的联合优化增益参数的线性解。例如,公式(32)可以重写如下:
ex(n)=λ0c0(n)+λ1c1(n)+λ2c2(n)+λ3c3(n),n=0,N-1.(33)
其中,λ0,λ1,λ2,λ3是增益或缩放因子,分别与构成矢量c0(n)到c3(n)相关,并通过加权器608-611分别施加给构成矢量。本领域普通技术人员认识到,公式(33)所表示的合成激励函数是公式(32)中提供的合成激励函数的更一般的方程。当
λ0=β,λ1=β2,λ2=γ,λ3=βγ, (34)
则公式(32)和公式(33)是等价的。因此,公式(33)所提供的ex(n)的方程,在如公式(34)所示选择缩放因子时,能够准确地实现CELP激励合成公式(1)。这样,编码器600可以视为说明编码器300和500的特殊的、线性实施例。但是,由于缩放因子λ0,λ1,λ2,λ3允许互相独立,且独立变量的个数从2个(在组合激励信号ex(n)的公式基于β和γ采用缩放因子的时候)增加到4个,因为需要乘c1(n)的缩放因子是β2(β的函数)且乘c3(n)的缩放因子是βγ(β和γ的函数),对构成信号ex(n)影响的限制提升了。这个额外灵活性的代价在于现在有4个、而不是2个增益缩放因子(λ0到λ3)需要量化。
线性化实施例中的子帧加权差能量E可以用下面的公式表示:
E = Σ n = 0 N - 1 [ p ( n ) - λ 0 c ‾ 0 ′ ( n ) - λ 1 c ‾ 1 ′ ( n ) - λ 2 c ‾ 2 ′ ( n ) - λ 3 c ‾ 3 ′ ( n ) ] 2 - - - ( 35 )
扩展公式(35)且将其按照相关项进行表示,得到下面的公式:
E = R pp - 2 Σ k = 0 3 λ k R pc ( k ) + 2 Σ k = 0 2 Σ l = k + 1 3 λ k λ l R cc ( k , l ) + Σ k = 0 3 λ k 2 R cc ( k , k ) - - - ( 36 )
为了解联合优化增益,或缩放因子,矢量(λ0,λ1,λ2,λ3),公式(36)可以进行偏微分,相对于四个增益或缩放因子中的每个,四个得到的公式中的每个可以设置为等于零(0):
∂ E ∂ λ 0 = 0 , ∂ E ∂ λ 1 = 0 , ∂ E ∂ λ 2 = 0 , ∂ E ∂ λ 3 = 0 . - - - ( 37 )
评估公式(37)中的这四个公式,得到了四个联立线性方程的系统。联合优化增益的矢量或缩放因子(λ0,λ1,λ2,λ3)的解可以通过解下面的方程来获得:
R cc ( 0,0 ) R cc ( 0,1 ) R cc ( 0,2 ) R cc ( 0,3 ) R cc ( 1,0 ) R cc ( 1,1 ) R cc ( 1,2 ) R cc ( 1,3 ) R cc ( 2 , 0 ) R cc ( 2,1 ) R cc ( 2,2 ) R cc ( 2,3 ) R cc ( 3,0 ) R cc ( 3,1 ) R cc ( 3,2 ) R cc ( 3,3 ) λ 0 λ 1 λ 2 λ 3 = R pc ( 0 ) R pc ( 1 ) R pc ( 2 ) R pc ( 3 ) - - - ( 38 )
现有技术的组合激励信号ex(n)的公式,即公式(11)、(12)和(13)现在可以基于分解组合激励信号或矢量为构成矢量的概念来再访和修订,在L<N时构成矢量每个都独立于增益。而且,使解联合优化组的增益成为线性问题的技术也在该例子的环境中进行了说明。公式(11)、(12)和(13)现在重写为下面的公式(39)、(40)和(41):
ex(n)=βco(n)+γc1(n),n=0,N-1    (39)
c 0 ( n ) = ex ( n - L ) , n = 0 , Min ( L , N ) - 1 , c 0 ( n - L ) , n = L , N - 1 - - - ( 40 )
c 1 ( n ) = c ~ I ( n ) , n = 0 , Min ( L ^ , N ) - 1 , c ~ I ( n ) + β ^ c 1 ( n - L ^ ) , n = L ^ , N - 1 - - - ( 41 )
该例子的限制为 N 2 &le; L < N N 2 &le; L ^ < N .
以公式(11)-(13)或者(39)-(41)开始,可以得出一个方案,由此,误差最小化单元324、524和624可以确定联合优化的增益矢量(β,γ)。虚拟码本,本领域中也称为自适应码本(ACB),用于构造本例中的c0(n)。使用虚拟码本构造c0(n)意味着c0(n)的生成基于ex(n),n<0且c0(n)在公式(39)中与β线性组合。矢量c1(n)是通过将基音锐化滤波器施加到所选码矢量
Figure C20038010280300261
而构造,该滤波器是参数
Figure C20038010280300262
Figure C20038010280300263
定义的零状态LTP滤波器。将分解技术施加到公式(39)产生了下面的用于组合激励信号或矢量ex(n)的公式:
ex ( n ) = &beta; c &OverBar; 0 ( n ) + &gamma; c &OverBar; 1 ( n ) + &beta; ^ &gamma; c &OverBar; 2 ( n ) , n = 0 , N - 1 - - - ( 42 )
其中,
c &OverBar; 0 ( n ) = ex ( n - L ) , n = 0 , Min ( L , N ) - 1 , c &OverBar; 0 ( n - L ) , n = L , N - 1 , - - - ( 43 )
c &OverBar; 1 ( n ) = c ~ I ( n ) , n = 1 , N - 1 , - - - ( 44 )
c &OverBar; 2 ( n ) = 0 , n = 0 , Min ( L ^ , N ) - 1 , c &OverBar; 1 ( n - L ^ ) , n = L ^ , N - 1 . - - - ( 45 )
其中,矢量c0(n),c1(n)和c2(n)是组合激励矢量的构成矢量。加权差的能量,即E,对应于公式(42)所表示的组合激励信号ex(n),随后可以由下面的公式表示:
E = &Sigma; n = 0 N - 1 [ p ( n ) - &beta; c &OverBar; 0 &prime; ( n ) - &gamma; c &OverBar; 1 &prime; ( n ) - &beta; ^ &gamma; c &OverBar; 2 &prime; ( n ) ] 2 . - - - ( 46 )
加权差的能量E还可以用信号相关各项表示如下:
E = R pp - 2 &beta; R pc ( 0 ) - 2 &gamma; R pc ( 1 ) - 2 &beta; ^ &gamma; R pc ( 2 )
+ 2 &beta;&gamma; R cc ( 0,1 ) + 2 &beta; &beta; ^ &gamma; R cc ( 0,2 ) + &beta; ^ &gamma; 2 R cc ( 1,2 ) - - - ( 47 )
+ &beta; 2 R cc ( 0,0 ) + &gamma; 2 R cc ( 1,1 ) + &beta; ^ 2 &gamma; 2 R cc ( 2,2 )
公式(14)给出的
Figure C200380102803002612
的定义是这样假设的,即:
&beta; ^ = Max ( 0.2 , Min ( 0.8 , &beta; ) ) - - - ( 46 )
注意到,是用在当前子帧的增益参数β而不是前一子帧的增益参数的函数。因此公式(47)具有两个独立的变量,即β和γ。解联合优化增益矢量,即增益项(β,γ)对,包括取E即公式(47)对于β的第一偏导数,设置该第一偏导数为等于零(0),取E对于γ的第二偏导数,设置该第二偏导数为等于零(0),然后解两个联立非线性方程的系统,也就是解下面两个联立非线性方程的结果:
&PartialD; E &PartialD; &beta; = 0 , &PartialD; E &PartialD; &gamma; = 0 . - - - ( 48 a )
如前所讨论的,尽管(β,γ)的联合优化包括解联立非线性方程的系统,从实现增益量化的有利点来看,不需要解联合优化组的增益,因为可用于每个编码器300、500、600的可能增益组限制于这样的一组优化增益值,其可以由正在使用的误差最小化单元为给定子帧生成。因此,选择联合优化(β,γ)对包括在可由正在使用的误差最小化单元产生的一组增益上评估公式(47)。
当希望线性化一组联合优化增益的解时,使用所提出的线性化技术。在此时,公式(42)的合成组合激励信号ex(n)可以使用线性缩放因子重写如下:
ex(n)=λ0c0(n)+λ1c1(n)+λ2c2(n),n=0,N-1    (49)
对应的子帧加权差E可以表示为:
E = &Sigma; n = 0 N - 1 [ p ( n ) - &lambda; 0 c &OverBar; 0 &prime; ( n ) - &lambda; 1 c &OverBar; 1 &prime; ( n ) - &lambda; 2 c &OverBar; 2 &prime; ( n ) ] 2 - - - ( 50 )
扩展公式(50)且将公式(50)按照得到的相关项表示,产生了下面的对于子帧加权差E的表示:
E = R pp - 2 &Sigma; k = 0 2 &lambda; k R pc ( k ) + 2 &Sigma; k = 0 1 &Sigma; l = k + 1 2 &lambda; k &lambda; l R cc ( k , l ) + &Sigma; k = 0 2 &lambda; k 2 R cc ( k , k ) - - - ( 51 )
为了解联合优化的缩放因子,或增益,矢量(λ0,λ1,λ2),公式(51)对三个增益λ0,λ1,λ2中的每个求偏导数,这三个得到的微分方程的每个都被设置为等于零(0),即:
&PartialD; E &PartialD; &lambda; 0 = 0 , &PartialD; E &PartialD; &lambda; 1 = 0 , &PartialD; E &PartialD; &lambda; 2 = 0 . - - - ( 52 )
联合优化缩放因子,或增益,矢量(λ0,λ1,λ2)然后可以通过解由公式(52)提供的三个微分方程所表示的三个联立线性方程的系统而得到,如下所示:
R cc ( 0,0 ) R cc ( 0,1 ) R cc ( 0,2 ) R cc ( 1,0 ) R cc ( 1,1 ) R cc ( 1,2 ) R cc ( 2,0 ) R cc ( 2,1 ) R cc ( 2,2 ) &lambda; 0 &lambda; 1 &lambda; 2 = R pc ( 0 ) R pc ( 1 ) R pc ( 2 ) . - - - ( 53 )
应该注意到,在用于确定一组联合优化增益的非线性和线性实施例中,其中使用虚拟或自适应码本来定义c0(n),施加基音锐化技术来形成码本激励矢量c1(n),用于基音锐化滤波器的增益参与了加权差E在公式(47)或公式(51)中的最小化。此外,加权差E是通过正用于评估公式(47)或公式(51)的增益值而联合优化的。这与现有技术实现增益信息的矢量量化形成对比,当激活基音锐化时,现有技术使用来自前一子帧的β值来定义用在当前子帧的基音锐化滤波器系数
Figure C20038010280300283
而且,在现有技术中,
Figure C20038010280300284
的值对于子帧是固定的,因此不允许对于每个正在评估的增益矢量而改变。编码器300、500和600通过许可增益,包括用于定义基音锐化系数
Figure C20038010280300285
的信息,对于增益信息表中的每个矢量进行优化,来允许有效地最小化加权子帧差能量E。

Claims (11)

1.一种用于对信号进行综合分析编码的方法,包括步骤:
基于输入信号,生成目标矢量;
生成与合成激励信号相关的多个构成成分,其中所述多个构成成分包括第一构成成分和第二构成成分,并且其中所述第一构成成分至少部分地是所述第二构成成分的偏移版本;和
基于目标矢量和多个构成成分来评估差标准,以确定多个增益,其中,所述多个增益中的每个增益与所述多个构成成分中的不同构成成分一一相关联;以及
将所述多个增益传送到解码器。
2.如权利要求1所述的方法,其中,评估差标准的步骤包括步骤:基于目标矢量和多个构成成分来评估差标准,以确定多个增益参数,其中使用所述增益参数来产生所述多个增益,并且所述多个增益参数与多个构成成分相关联。
3.如权利要求2所述的方法,其中,评估差标准的步骤包括步骤:
基于多个构成成分生成非线性方程的系统;和
解所述非线性方程的系统,从而确定所述多个增益参数。
4.如权利要求1所述的方法,其中,评估差标准的步骤包括步骤:
基于多个构成成分生成线性方程的系统;和
解所述线性方程的系统,从而确定所述多个增益。
5.如权利要求2所述的方法,其中,生成多个增益参数的步骤包括步骤:
预先计算第一多个增益参数,以产生多个预先计算的增益参数;和
基于预先计算的多个增益参数,选择第二多个增益参数。
6.一种用于对信号进行综合分析编码的装置,包括:
目标矢量生成器装置,用于基于输入信号,生成目标矢量;
成分生成器,用于生成与合成激励信号相关的多个构成成分,其中所述多个构成成分包括第一构成成分和第二构成成分,并且其中所述第一构成成分至少部分地是所述第二构成成分的偏移版本;和
误差最小化单元,用于基于目标矢量和多个构成成分来评估差标准,以确定多个增益,其中所述多个增益中的每个增益与所述多个构成成分中的不同构成成分一一相关联。
7.如权利要求6所述的装置,其中,所述成分生成器包括基音预滤波器。
8.如权利要求6所述的装置,其中,由所述误差最小化单元对误差标准的评估包括基于目标矢量和多个构成成分来评估差标准,以确定多个增益参数,其中使用所述增益参数来产生所述多个增益,并且所述多个增益参数与所述多个构成成分相关联。
9.如权利要求8所述的装置,其中,由所述误差最小化单元对误差标准的评估包括基于目标矢量和多个构成成分来评估差标准以及基于对差标准的评估来生成多个增益参数,其中,所述装置进一步包括加权器,用于基于多个增益参数中的增益参数来对多个构成成分中的构成成分进行加权。
10.如权利要求9所述的装置,其中,由所述误差最小化单元对误差标准的评估包括确定差能量,并且其中由所述误差最小化单元对多个增益参数的生成包括生成用于最小化所述差能量的多个增益参数。
11.一种对信号进行综合分析编码的语音编码器,所述编码器包括处理器,所述处理器被配置用于:基于输入信号生成目标矢量;生成与合成激励信号相关联的多个构成成分,其中所述多个构成成分包括第一构成成分和第二构成成分,并且其中所述第一构成成分至少部分地是所述第二构成成分的偏移版本;和基于目标矢量和多个构成成分来评估差标准,以确定多个增益,其中所述多个增益的每个增益与所述多个构成成分中的不同构成成分一一相关联。
CN200380102803A 2002-11-08 2003-11-06 在语音编码系统中对增益信息进行编码的方法和装置 Expired - Lifetime CN100593195C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/290,572 2002-11-08
US10/290,572 US7047188B2 (en) 2002-11-08 2002-11-08 Method and apparatus for improvement coding of the subframe gain in a speech coding system

Publications (2)

Publication Number Publication Date
CN1711589A CN1711589A (zh) 2005-12-21
CN100593195C true CN100593195C (zh) 2010-03-03

Family

ID=32229050

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200380102803A Expired - Lifetime CN100593195C (zh) 2002-11-08 2003-11-06 在语音编码系统中对增益信息进行编码的方法和装置

Country Status (6)

Country Link
US (1) US7047188B2 (zh)
EP (1) EP1563489A4 (zh)
KR (1) KR20050072811A (zh)
CN (1) CN100593195C (zh)
AU (1) AU2003291397A1 (zh)
WO (1) WO2004044892A1 (zh)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6959274B1 (en) * 1999-09-22 2005-10-25 Mindspeed Technologies, Inc. Fixed rate speech compression system and method
US9454974B2 (en) * 2006-07-31 2016-09-27 Qualcomm Incorporated Systems, methods, and apparatus for gain factor limiting
US20080120098A1 (en) * 2006-11-21 2008-05-22 Nokia Corporation Complexity Adjustment for a Signal Encoder
US20080208575A1 (en) * 2007-02-27 2008-08-28 Nokia Corporation Split-band encoding and decoding of an audio signal
JP5596341B2 (ja) * 2007-03-02 2014-09-24 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 音声符号化装置および音声符号化方法
US9263053B2 (en) 2012-04-04 2016-02-16 Google Technology Holdings LLC Method and apparatus for generating a candidate code-vector to code an informational signal
US9070356B2 (en) * 2012-04-04 2015-06-30 Google Technology Holdings LLC Method and apparatus for generating a candidate code-vector to code an informational signal
US9728200B2 (en) 2013-01-29 2017-08-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for adaptive formant sharpening in linear prediction coding
US9620134B2 (en) 2013-10-10 2017-04-11 Qualcomm Incorporated Gain shape estimation for improved tracking of high-band temporal characteristics
US10614816B2 (en) 2013-10-11 2020-04-07 Qualcomm Incorporated Systems and methods of communicating redundant frame information
US10083708B2 (en) 2013-10-11 2018-09-25 Qualcomm Incorporated Estimation of mixing factors to generate high-band excitation signal
US9384746B2 (en) 2013-10-14 2016-07-05 Qualcomm Incorporated Systems and methods of energy-scaled signal processing
US10163447B2 (en) 2013-12-16 2018-12-25 Qualcomm Incorporated High-band signal modeling
CN105096958B (zh) 2014-04-29 2017-04-12 华为技术有限公司 音频编码方法及相关装置
CN104994500B (zh) * 2015-05-22 2018-07-06 南京科烁志诺信息科技有限公司 一种用于移动电话的语音保密传输方法及装置

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5359696A (en) * 1988-06-28 1994-10-25 Motorola Inc. Digital speech coder having improved sub-sample resolution long-term predictor
IT1241358B (it) * 1990-12-20 1994-01-10 Sip Sistema di codifica del segnale vocale con sottocodice annidato
US5233660A (en) * 1991-09-10 1993-08-03 At&T Bell Laboratories Method and apparatus for low-delay celp speech coding and decoding
WO1993018505A1 (en) 1992-03-02 1993-09-16 The Walt Disney Company Voice transformation system
WO1994023426A1 (en) * 1993-03-26 1994-10-13 Motorola Inc. Vector quantizer method and apparatus
JP2970407B2 (ja) * 1994-06-21 1999-11-02 日本電気株式会社 音声の励振信号符号化装置
FR2729244B1 (fr) * 1995-01-06 1997-03-28 Matra Communication Procede de codage de parole a analyse par synthese
FR2738482B1 (fr) * 1995-09-07 1997-10-24 Oreal Composition conditionnante et detergente a usage capillaire
US5774837A (en) 1995-09-13 1998-06-30 Voxware, Inc. Speech coding system and method using voicing probability determination
US5809459A (en) 1996-05-21 1998-09-15 Motorola, Inc. Method and apparatus for speech excitation waveform coding using multiple error waveforms
US5751901A (en) * 1996-07-31 1998-05-12 Qualcomm Incorporated Method for searching an excitation codebook in a code excited linear prediction (CELP) coder
US6073092A (en) * 1997-06-26 2000-06-06 Telogy Networks, Inc. Method for speech coding based on a code excited linear prediction (CELP) model
US6141638A (en) * 1998-05-28 2000-10-31 Motorola, Inc. Method and apparatus for coding an information signal
US6311154B1 (en) 1998-12-30 2001-10-30 Nokia Mobile Phones Limited Adaptive windows for analysis-by-synthesis CELP-type speech coding

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
A toll quality 8 kb/s speech codec for the personalcommunications system(PCS). Salami et al.IEEE Transactions on Vehicular Technology,Vol.43 No.3. 1994
A toll quality 8 kb/s speech codec for the personalcommunications system(PCS). Salami et al.IEEE Transactions on Vehicular Technology,Vol.43 No.3. 1994 *
Real-time implementation of the VSELP on a 16-bit DSP chip. Myung H.et al.IEEE Transactions on Consumer Electronics,Vol.37 No.4. 1991
Real-time implementation of the VSELP on a 16-bit DSP chip. Myung H.et al.IEEE Transactions on Consumer Electronics,Vol.37 No.4. 1991 *

Also Published As

Publication number Publication date
CN1711589A (zh) 2005-12-21
US20040093205A1 (en) 2004-05-13
EP1563489A1 (en) 2005-08-17
AU2003291397A1 (en) 2004-06-03
EP1563489A4 (en) 2007-06-13
WO2004044892A1 (en) 2004-05-27
US7047188B2 (en) 2006-05-16
KR20050072811A (ko) 2005-07-12

Similar Documents

Publication Publication Date Title
CN100593195C (zh) 在语音编码系统中对增益信息进行编码的方法和装置
AU668817B2 (en) Vector quantizer method and apparatus
US5485581A (en) Speech coding method and system
US6865530B2 (en) LPAS speech coder using vector quantized, multi-codebook, multi-tap pitch predictor and optimized ternary source excitation codebook derivation
EP2805324B1 (en) System and method for mixed codebook excitation for speech coding
JPH0990995A (ja) 音声符号化装置
CN1751338B (zh) 用于语音编码的方法和设备
EP0657874A1 (en) Voice coder and a method for searching codebooks
US8712766B2 (en) Method and system for coding an information signal using closed loop adaptive bit allocation
JPH05216500A (ja) 音声符号化装置
US7337110B2 (en) Structured VSELP codebook for low complexity search
KR20040043278A (ko) 음성 부호화기 및 이를 이용한 음성 부호화 방법
JPH1063300A (ja) 音声復号化装置及び音声符号化装置
JPH07168596A (ja) 音声符号化装置
JP2808841B2 (ja) 音声符号化方式
JP3144244B2 (ja) 音声符号化装置
JP3284874B2 (ja) 音声符号化装置
Saleem et al. Implementation of Low Complexity CELP Coder and Performance Evaluation in terms of Speech Quality
Sahab et al. SPEECH CODING ALGORITHMS: LPC10, ADPCM, CELP AND VSELP
JP2001100799A (ja) 音声符号化装置、音声符号化方法および音声符号化アルゴリズムを記録したコンピュータ読み取り可能な記録媒体
EP1212750A1 (en) Multimode vselp speech coder
JPH0455899A (ja) 音声信号符号化方式
Lupini Harmonic coding of speech at low bit rates
Bhattacharya Efficient vector quantization of LPC parameters for harmonic speech coding
Parvez Investigation of speech coding algorithms for voice communication through personal computers

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: MOTOROLA MOBILE CO., LTD

Free format text: FORMER OWNER: MOTOROLA INC.

Effective date: 20110120

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20110120

Address after: Illinois State

Patentee after: MOTOROLA MOBILITY, Inc.

Address before: Illinois, USA

Patentee before: Motorola, Inc.

C41 Transfer of patent application or patent right or utility model
C56 Change in the name or address of the patentee
CP01 Change in the name or title of a patent holder

Address after: Illinois State

Patentee after: MOTOROLA MOBILITY LLC

Address before: Illinois State

Patentee before: MOTOROLA MOBILITY, Inc.

TR01 Transfer of patent right

Effective date of registration: 20160415

Address after: California, USA

Patentee after: Google Technology Holdings LLC

Address before: Illinois State

Patentee before: MOTOROLA MOBILITY LLC

CX01 Expiry of patent term
CX01 Expiry of patent term

Granted publication date: 20100303