CN1026274C - 采用长期预测器的语言合成方法及其装置 - Google Patents
采用长期预测器的语言合成方法及其装置 Download PDFInfo
- Publication number
- CN1026274C CN1026274C CN90109233A CN90107394A CN1026274C CN 1026274 C CN1026274 C CN 1026274C CN 90109233 A CN90109233 A CN 90109233A CN 90107394 A CN90107394 A CN 90107394A CN 1026274 C CN1026274 C CN 1026274C
- Authority
- CN
- China
- Prior art keywords
- long
- sample
- mentioned
- term
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 230000007774 longterm Effects 0.000 title claims abstract description 139
- 239000013598 vector Substances 0.000 claims abstract description 103
- 230000005284 excitation Effects 0.000 claims description 48
- 238000000034 method Methods 0.000 claims description 37
- 230000008569 process Effects 0.000 claims description 12
- 230000006870 function Effects 0.000 claims description 11
- 238000001914 filtration Methods 0.000 claims description 10
- 238000010189 synthetic method Methods 0.000 claims description 3
- 238000010276 construction Methods 0.000 claims description 2
- 230000005055 memory storage Effects 0.000 claims 1
- 230000004044 response Effects 0.000 abstract description 32
- 230000003111 delayed effect Effects 0.000 abstract 5
- 239000000523 sample Substances 0.000 description 121
- 238000010586 diagram Methods 0.000 description 15
- 238000005457 optimization Methods 0.000 description 11
- 238000004458 analytical method Methods 0.000 description 10
- 238000004891 communication Methods 0.000 description 8
- 238000003780 insertion Methods 0.000 description 8
- 230000037431 insertion Effects 0.000 description 8
- 239000000203 mixture Substances 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 238000012545 processing Methods 0.000 description 3
- 208000009766 Blau syndrome Diseases 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 101001096074 Homo sapiens Regenerating islet-derived protein 4 Proteins 0.000 description 1
- LTXREWYXXSTFRX-QGZVFWFLSA-N Linagliptin Chemical compound N=1C=2N(C)C(=O)N(CC=3N=C4C=CC=CC4=C(C)N=3)C(=O)C=2N(CC#CC)C=1N1CCC[C@@H](N)C1 LTXREWYXXSTFRX-QGZVFWFLSA-N 0.000 description 1
- 102100037889 Regenerating islet-derived protein 4 Human genes 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- -1 multiple-pulse Proteins 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 238000005086 pumping Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000001373 regressive effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000012488 sample solution Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0011—Long term prediction filters, i.e. pitch estimation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0012—Smoothing of parameters of the decoder interpolation
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Complex Calculations (AREA)
- Analogue/Digital Conversion (AREA)
- Near-Field Transmission Systems (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
Abstract
数字化语言编码器包括一具有改进的允许非整数延迟系数L的长期预测器的长期滤波器,每帧有N个样本的输入语言矢量b(N)被加到为长期滤波器产生输出矢量的加法器。b(n)被反馈回延迟矢量发生器,标称长期预测器延迟系数L还被输入延迟矢量发生器。它包括一个保持过去样本b(n)并计算和在各过去样本间存贮至少一个插入样本b(n)的存贮器。延迟矢量发生器给长期乘法器提供输出矢量,乘法器将长期预测器响应放大β倍,放大的输出βq(n)被加到加法器上以完成反馈环。
Description
本发明涉及在低比特率下数字化语言编码。特别涉及采用长期预测器的语言合成方法及其装置。
编码激发线性预测(CELP)是一种语言编码技术,它具有在低比特率(即每秒4.8至9.6千比特(kbps)下产生高质量合成语言的潜力。这一类语言编码(也被称作矢量激发线性预测或随机编码)最有可能用于数字化语言通讯及语言合成应用。可以证明,CELP(编码激发线性预测)特别适用于数字语言编码和数字无线电话通讯系统。在这种系统中语言的质量,数据的速率,规模和成本是主要问题。
“编码激发”或“矢量激发”这一词组来源于下列事实,即:用于语言编码器的激发序列是矢量化的,也就是用一个单个编码字代表激发样本序列或矢量。用这种方法,即使每一样本的数据速率少于一个比特,也可以对所激发序列进行编码。存储的激发编码矢量通常是由独立的随机白色高斯序列构成。从编码本中选出一个编码矢量代表N个激发样本中的每一单元。每一个存储的编码矢量是由一个编码字代表的,也就是该编码矢量存储位置的地址。正是这个编码字,按顺序通过通信信道被送
到语言合成器,在接受器那里重新构成语言帧。有关CELP编码激发线性预测的更详细解释请见M.R.Schrseder和B.S.Atal的论著“编码激发线性预测:低比特率,高质量语言”。此文发表在1985年3月召开的IEEE声学,语言信号处理国际会议文件汇编第3卷第937-40页。
在编码线性激发(CELP)语言编码器中,从编码本中得到的激发编码矢量被加到两个随时间变化的线性滤波器上。此滤波器模拟输入语言信号的特点。在第一个滤波器的反馈环中有一个长期预测器。这个长期预测器有2到5毫秒(ms)的延迟,用以产生语音的音调周期特性。第二个滤波器的反馈环中有一个短期预测器。这个短期预测器的延迟时间少于2毫秒。用以产生频谱包络线,即格式结构。对每一帧语言,语言编码器将一独立的编码矢量加到滤波器上,以产生一个重新构成的语言信号,并且将原来的输入信号与重新构成的语言信号进行比较,以产生一个误差信号。误差信号然后过一个加权滤波器进行加权。这个加权滤波器具有依据人的听力而作出的反应。如果选出的编码矢量所产生的加权误差信号对于当前的一帧语言具有最小的能量,那么最优化激发信号将由这个编码矢量所决定。然后,用于最优化编码矢量的编码字通过通信信道被发送。
在CEIP语言合成器中,从通信信道收到的编码字用于为激发矢量的编码本编址。接着,单个的编码矢量与增益系数相乘,并通过长期和短期滤波器得到一个重新构成的语言矢量。增益系数和预测器参数也是由通信信道得到的。现在已经发现,如果在分析阶段使用合成器使用的实际参数,从而减少错误的数量,那么就能产生一个更好质量的合成信号。因此,在CELP语言分析阶段使用这种合成参数以产生更高质量的语言被称为合成分析语言编码。
短期预测器试图通过使用刚输出过的样本s(n-i)的线性组合来预测正要输出的样本s(n),依据下列公式:
s(n)=α1s(n-1)+α2s(n-2)+…+αps(n-p)+e(n)
这里p是短期预测器的阶,e(n)是预测偏差,即先前样本的加权和不能代表的那一部分。假定样本速率为8KHz,预测器阶p的典型范围从8到12。加权数α1、α2、α3在此公式中称为预测器系数。从使用传统线性预测编码技术(LPC)的语言信号中可以决定出短期预测器系数。短期滤波器输出响应可用Z变换形式表达:
有关短期滤波器参数的进一步讨论,请参照IEEETrans.Com-mum.Vol.COM30,600-14页。文章名称是《低比特率下的语言预测编码》。
另一方面,长期滤波器必须根据先前的样本预测下一个输出样本。那些先前的样本延长一个相当长的时间。如果预测器仅使用单一的过去样本,那么这种预测器就是单口预测器。典型情况下,使用一到三口的预测器。对于一个单口长期滤波器的输出响应,以Z变换形式给出的长期预测器如下:
注意此输出响应仅为此滤波器的延迟L和滤波器系数β的函数。对于声音语言,延迟L为一典型的语言音调周期,或它的倍数。在8KHz样本速率时,延迟L的合适范围应在16和143之间,此数相对于音调范围为56至5000Hz。
长期预测器延迟系数和长期预测器系数B可由开环结构或闭环结构决定。若使用开环结构,延迟L和系数B可从输入信号(或它的偏差)直接算出。在闭环结构中,可从代表长期滤波器的过去输出和输入语言信号的编码数据中以帧速率的形式计算出延迟L和系数β。在使用编码数据时,决定长期预测器的延迟是基于长期滤波器的实际状态。此状态存在于合成器中。因此,闭环结构比开环结构运行的更好,这是因为音调滤波器本身有助于误差信号的优化。而且,单口预测器在闭环结构下工作得非常好。
使用闭环结构,依据下列公式,长期滤波器的输出响应仅由长期滤波器过去的输出样本和当前的输入语言样本S(n)决定。公式如下:
b(n)=S(n)+βb(n-L)
这种技术直接用于大于帧长度N为音调延迟L,即当L≥N时,因为因子b(n-L)对所有的样本n,0≤n≤N-1而言,总是代表一个过去的样本。更进一步研究,在L>N的情况下,激发增益系数和长期预测器系数β可共同用来优化延迟L和编码字i的给定值。现已发现,这种联合优化技术显著地改进了语言质量。
然而,如果必须使长期预测器的延迟L小于帧的长度N,那么闭环方式将会失败。在高音调女性语言情况下,这种情况已经产生,例如当女性的音调为250Hz,长期预测器的延迟L等于4毫秒。在8KHz样本速率时,250Hz的音调相当于32个样本的长期预测器延迟L。然而,我们不希望所使用的帧的长度小于4毫秒。因为所使用的帧长度越长,对CELP激发矢量的编码就更有效。于是,在8KHz样本速率时,如果使用帧长度时间为7.5毫秒,那么帧的长度应该等于60个样本。这意味着仅有32个过去的样本对预测下一帧的60个样本有效。因此如果长期预测器延迟L小于帧的长度N,那么所需要的N个样本中仅有L个过去的样本能够确定。
在现有技术中已经采取了几种替代办法以解决音调延迟时间小于帧长度的问题。在试图解决联合优化长期预测器延迟L和系数β的方法中,首先尝试的是假定没有激励信号存在,试图直接来求解那些方程。这种方法在题为“规则脉冲激励-有效和有影响的多脉冲语言编码的新方法”一文中有解释。此文作者为Kroon,等.见《声学、语言及信号处理会刊》卷1,ASSP-34,№5 1986年10月1054-1063页。然而,接下来,在这个方法中,必须解决有关单一系数β的非线性方程,必须解出有关β的二次或三次的解。有关β的二次或三次解在计算上是不现实的。因此,试图使用这种方法用增益系数γ联合优化系数仍旧是不可能的。
第二种解决方法是限制长期预测器延迟L一定要大于帧长度N。此方法是由Singhal和Atal在“改进多脉冲LPC编码器在低比特率条件下运行”一文中提出的。此文发表在IEEE声学、语言、信号处理国际会议文件汇编第一卷,1984年3月19日-21日1.3.1-1.3.4页。这种人为的限制音调延迟L通常不能正确地反映出音调信息。因此,使用这种方法,对于高频率语言其声音的质量会降低。
第三种解决方法是减小帧长度N的规模。使用一个较短帧长度,长期预测器延迟L总能由过去的样本决定。然而这种方法要求严格的比特速率。使用一个较短的帧长度,必须为更多的长期预测系数和激发矢量编码。因此信道的比特速率必须要更大,以适应额外的编码。
对于高音调说话者,存在着第二个问题,编码器使用的抽样速率为单口音调预测器的运行设置了一个上限。例如,如果音调频率实际为485Hz,那么最接近的延迟值将为16,这个数值对应为500Hz。这样相对于原有的音调频率就产生了15Hz的误差,从而降低了声音的质量。对于音调频率的谐波成分,这一误差还会被扩大,以至于引起进一步的失真。
因此,需要提供一种改进方法以决定长期预测器延迟L。高音调语言编码最优化解决方法必须兼顾到计算的复杂性和声音的质量这两个方面。
因此,本发明总的目的是提供一种能在低比特率下产生高质量语言的改进了的数字语言编码技术。
本发明更具体的目的是提供一种方法以确定使用闭环趋近的长期预测器的系数。
本发明的另一个目的是提供一种改进了的方法以确定长期预测器在其延迟系数不是整数时的输出响应。
本发明的进一步目的是提供一种改进了的CELP语言编码器。当搜索编码本来找出优化激励编码矢量时,此编码器能联合优化增益系数γ和长期预测器系数B。
依据本发明的一个新颖构思,可允许系数L取非整数值,因此增加了系数L的解决办法。要做到这一点,可使用插入式波波器以提供长期预测器状态的插入样本。在闭环应用时,长期预测器状态的将来样本不能用于插入滤波器。解决问题的方法是用音频同步地把长期预测器的状态延伸到将来,以供插入滤波器使用。当下一帧实际激励样本变得可能时,更新长期预测器状态以反映实际的激励样本(置换这些状态是基于音调同步延伸样本)。例如,插值法可以用来在两个现存样之间插
入一个样本,这样L的解被加倍为半个样本。也可选择更高的插入因数,例如选3和4,这样可以使L的解加到一个样本的1/3或1/4。
本发明的方法是一种采用长期预测器的语言合成方法,其中滤波一个每一帧具有N个样本的输入信号s(n)以提供一个输出信号b(n),(n为每一帧的样本数),该方法的特征在于下列步骤:
(a)输入上述输入信号s(n)的一组N个数字化输入样本;
(b)将存贮延迟系数L输入到存贮装置;
(c)将至少L个上述输出信号b(n)的过去样本存贮在上述存贮装置中;
(d)从存贮在上述存贮装置中读出至小N个存贮样本做为延迟信号q(n),如果L小于N,则重复地从上述存贮装置中读出至少一些同样的存贮样本,做为延迟信号q(n);
(e)线性组合延迟信号q(n)和输入信号s(n)以产生上述的输出信号b(n)。
本发明的装置是一种采用长期预测器合成语言的装置,用于构造一个从激励矢量u(n),延迟系数L和滤波器系数β而来的N个样本的信号矢量s′(n),其中n代表一个样本数,样本连续从0到N-1编号,该装置的特征在于:
用于滤波上述激励矢量u(n)以提供经滤波的矢量b(n)的装置,上述滤波装置包括:
用于把上述激励矢量u(n),上述延迟参数L及上述滤波器参数β输入到上述滤波装置的装置,这里L可能小于N;
根据下列公式:
q(n)=b(n-kL)
用来产生延迟矢量q(n)的装置,这里选择变量q的值,使(n-kL)的值小于0;
用于线性结合上述延迟矢量q(n)和上述激励矢量b(n)的装置;
利用信号来处理上述经滤波的矢量b(n)以产生上述构造了的信号矢量s′(n)的装置。
本发明,连同进一步的目的和它的先进之处,可以通过参照下列描述并参考相应的附图更好地了解。在几张图中,相同的数字标识相同的部件。
图1是编码激励线性预测语言编码器总框图,说明了在使用本发明时长期滤波器的位置;
图2是图1中长期滤波器实施方案的详细框图,说明了当滤波器延迟L是整数时长期预测器的响应;
图3是移位寄存器简化图,以此来说明图2中长期预测器的运行状况。
图4是图1中长期滤波器的另一实施方案的详细框图,说明了当滤波器延迟L是整数时长期预测器的响应;
图5是说明图2中长期滤波器工作情况的详细流程图;
图6是依据本发明使用的语言合成器总框图;
图7是图1中长期滤波器的详细框图,说明依据本发明利用样本来求解的长期预测器的响应。
图8和图9是图7中长期滤波器的操作过程的详细流程图;
图10是音调滞后滤波器详细框图,此滤波器用来互连图6中的短期滤波器和语言合成器的D/A转换器;
现参见图1,这里展示了依据本发明使用了长期滤波器的编码激励线性预测语言编码器100的总框图。要被分析的声音输入信号通过话筒102加到语言编码器上。输入信号(典型情况为一语言信号)被加到滤波器104,滤波器一般情况下具有宽带滤波器特性。然而,如果语言频带宽度已达到要求,滤波器104可直接用导线联接。
由滤波器104而来的模拟语言信号然后转换为由N个脉冲样本构成的序列。在A/D转换器108中每一脉冲样本的振幅由数字编码代替,如同现有技术中已知的那样。取样速率由样本时钟SC决定。在最佳实施方案中它为8.0KHz。通过时钟112产生样本时钟SC及帧时钟FC。
A/D转换器108的数字化输出(可用输入语言矢量s(n)代表)加到系数分析仪110。这一输入语言矢量s(n)以分离帧,即时间块的形式不断获得,其长度是由帧时钟FC决定的。在最佳实施方案中,输入语言矢量s(n),0≤n≤N-1,代表7.5ms的一帧,每一帧含N=60个样本,每一样本由12-16比特的全幅数字编码代表。在这个实施方案中,对每一语言块,每一套线性预测编码系数由系数分析仪110以开环结构产生。短期预测器系数αi,长期预测器系数β,正常长期预测器延迟系数L,加权滤波器系数WFP及激励增益因数γ(同时还有后面要讲到的最佳激励编码字)被
加到多路调制器150,然后通过通信信道送到语言合成器供其使用。本实施方案所需的产生这些参数的代表性方法请参照B.S.Atal的文章《低比特率时的语言预测编码》,IEEETrans Commun卷COM-30 600-14页,1987年4月。输入语言矢量s(n)也加到减法器130,其功能将在下面描述。
编码本ROM120存有一套M个激发矢量ui(n)量这里1≤i≤M,每一个由N个样本构成,这里0≤n≤N-1。编码本ROM120产生这些伪随机激发矢量以响一套激发编码字i中特定的一个。激发矢量中的每一个是由一系列随机白色高斯样本组成的,当然其它类型的激发矢量也可用于本发明。如果对60个样本中的任意一个,以每一样本0.2比特的速率对激发信号编码,那么将会有4096个编码字对应于可能的激发矢量。
为与输入矢量si(n)相比较,对每一独立的激发矢量ui(n),均产生一个重新构造的语言矢量si(n)。增益单元122将激励矢量ui(n)放大激励增益因数γ倍。激励增益因数γ对特定的一帧来说是一常数。激励增益因数γ可由系数分析仪110预先计算出来。系数分析仪并用来分析所有激发矢量,如图1所示,激励增益因数γ可与寻找最佳激发字I联合被优化。最佳激发字I是由编码本搜寻控制器140产生的。
放大了的激发信号γui(n)由长期滤波器124和短期滤波器126滤波以产生重新构造的语言矢量s′i(n)。滤波器124使用长期预测器系数β和L以产生语言周期。滤波器126使用短期预测器系数αi以产生频谱包络线。长期滤波器将在下面图中做进一步详细描写。应当注意,方块124和126是实际的循环滤波器。在它们相应的反馈回路中带有长期预测器和短期预测器。
用于第i个激发编码矢量的重新结构过的语言矢量s′i(n)与输入语言矢量s(n)在减法器130中通过相减进行比较。两矢量差ei(n)表示了原有信号与重新构造过的语言单元的差别。矢量差通过加权滤波器132进行敏感性加权。加权滤波器使用的参数WFP是由参数分析仪产生的。对有代表性的加权滤波器的转换功能可参考以前的参考资料。敏感性加权是指加重对人耳较为敏感的那些频率,而削弱其它一些频率。
能量计算器134计算出经过加权的矢量差e′i(n)的能量。然后将误差信号Ei加到编码本搜寻控制器140。搜寻控制器比较第i个误差信号,以便提供一个针对先前误差信号的激发矢量ui(n),以便激发矢量产生最小的错误。错误最小的第i个激发矢量编码然后做为最佳激发编码I经由信道输出。在替代方案中,搜寻控制器140应能决定一个特别的编码字。此编码字带有一事先预置了临界值的误差信号。例如满足一个事先预置的误差阈值。
图1说明了本发明用于编码激励线性预测语言编码器的一个实施方案。在这一方案中,在开环结构中的长期滤波器系数L和β是由系数分析仪110决定的。另一种方法也可确定闭环系统中长期滤波器系数。此方法在前面提到的Singhal和Atal的论文中有论述。一般而论,使用由闭环结构中决定的长期滤波器系数可以改进语言编码器的操作。依据本发明所做的长期预测器的最新结构能极大地简化使用闭环结构来确定延迟L小于帧长度N的那些系数的过程。
图62说明了图1中长期滤波器124的一种实施方案。这里L限定为整数。虽然图1表明经增益单元122放大了的激励矢量γui(n)做为长期滤波器124的输入,但是在图2中,为了说明方便,仍使用有代表性的输入语言矢量s(n),因此,输入语言矢量s(n)的N个样本中的一帧,仍被加到加法器210上。加法器210产生一个输出矢量b(n)供长期滤波器124使用。输出矢量b(n)反馈到长期预测器的延迟单元230。正常长期预测器的延迟系数L也输入到延迟单元230。长期预测器延迟单元提供一个输出矢量q(n)给长期预测器乘法器单元220。在那里由长期预测器系数β来放大长期预测器的响应。如果是一个递归滤波器,放大了的输出βq(n)然后送到加法器210,这样就完成了环路反6馈。
长期滤波器124的输出响应用Hn(z)变换形式定义如下:
这里n代表含有N个样本的一帧中一个样本的序数,0≤n≤N-1,β表示滤波器系数;L表示长期滤波器的正常延迟;在这里[(n+L)/L]代表小于或等于(n+L)/L的最接近的整数。长期预测器延迟[(n+L)/L]作为样本数n的函数而变化。这样,依据本发明,实际的长期预测器延迟变为kL,在这里L是基本的或正常的长期预测器延迟;k是从做为样本数n的函数之集合{1,2,3,4,……}中选定的一个整数。因此,长期滤波器输出响应b(n)是正常长期预测器延迟系数L和滤波器状态FS的函数。滤波器状态FS存在于每一帧的开始,这种状态对于L的所有取值都是真的。即使是在音调延迟L小于帧长度N的这种成问题的情况下,上述状态对于L的取值也是真的。
长期预测器延迟单元230的函数被存入当前输入样本,以便预测将来的样本。图3为一移位寄存器简图。此图可以帮助了解图2中长期预测器延迟单元230的工作情况。对于样本数1例如n=1,当前输出样本b(n)加到移位寄存器的输入端,该输入端位于图3的右侧。对于下一个样本n=1+1,先前的样本b(n)向左移位进入移位寄存器。这一样本现在变成了第一个过去样本b(n-1)。对于下一个样本n=1+2,另一个b(n)样本左移进入移位寄存器,原有的样本再次左移一位,变成第二个过去样本b(n-1)。当L个样本移进寄存器后,原有的样本已经左移L次,现在它可由b(n-L)代表。
如上所述,延迟L应是典型的语音音调周期或是它的倍数。如果延迟L为最小长度而帧长度N为最长,那么有足够数量的过去样本会移入并存贮在寄存器内以预测下一帧语言,即使是在极端的情况下,L=N,在这里n=N-1,b(n-L)将为b(-1),它仅为一个过去样本。这样,样本b(n-L)将做为输出样本q(n)从移位寄存器中输出。
如果长期预测器延迟系数L比帧长度N短些,那不足的样本数将会由下一帧的开始部分移入移位寄存器。使用上面的例子,250Hz音调周期,音调延迟L应等于32。这样,在L=32,N=60,n=N-1=59时,b(n-L)自然应为b(27)。b(27)就代表与60个样本组成的帧首有关的将来样本。换言之,不足的过去样本已经存贮好了,以便提供一个完整的长期预测器响应。在一帧开始时,需要一个完整的长期预测器响应,因此可以进行预测系数的闭环分析。依据本发明,在那种情况下,相同的被存贮的样本b(n-L),0≤n≤L总被重复,这样,长期预测器的输出响应总是为先于当前帧的开始部分已经输入到长期预测器的延迟单元中的样本的函数。在图3中,加长了移位寄存器以便存贮另一些kL样本。这种形式代表了对长期预测器延迟单元230的结构的修改。因此,做为填入新样本b(n)的移位寄存器,必须选择一k值,以便b(n-kL)代表先于一帧开始时,存在于移位寄存器中的一个样本。利用先前的例子L=32,N=60,输出样本q(32)应是样本q(0)的重复,它是b(0-L)=b(32-2L)或b(-32)。
因此,长期预测器延迟单元230的输出响应q(n)与下式一致:
q(n)=b(n-kL)
这里0≤n≤N-1,k应选最小的整数以使(n-kL)为负数。更详细地说,如果一帧中N个样本中的一个s(n)样本输入到长期预测器滤波器124,那么样本数目n为j≤n≤N+j-1。这里j是一帧中N个样本的第一样本的索引。因此,变量k的变化应使(n-kL)总小于j,这样确保长期预测器仅用先于每一帧开始时有效的样本,以便预测出输出响应。
现在根据图5的流程图,描述图2中长期滤波器的运行情况。由350步开始,样本数n在351步置零。正常的长期预测器延迟系数L和长期预测器系数β由352步的系数分析仪输入。在353步中,测试样本数n,以检查整个一帧是否输出了。如果n≥N,那么上述操作在361步结束,如果所有的样本还没有被计算过,那么信号样本s(n)被输入到354步。在355中,依据下面公式计算出长期预测延迟单元230的输出响应:
q(n)=b(n-[(n+L)/L]L)
这里[(n+L)/L]代表最接近小于或等于(n+L)/L的整数。例如,如果,n=56,L=32那么[(n+L)/L]L)应为[(56+32)/32]L,也就是[2.75]L或2L。在356步,长期滤波器的输出
响应b(n)据下列公式计算:
b(n)=βq(n)+s(b)
这表示了乘法器220和加法器210的功能。在357步,对于所有位于b(n-2)和b(n-LMAX)之间的寄存器各位上的样本,均在移位寄存器中左移一位置。这里LMAX代表可被确定的最大长期预测器延迟。在最佳实施方案中,LMAX等于143。在358步,输出样本b(n)输出到移位寄存器的第一位b(n-1)。359步输出滤过波的样本b(n)。样本数目n然后在360步加1。并在第353步测试,当计算了所有的N个样本后,程序在361步结束。
图4是依据本发明的另一种实施方案。数字滤波器124′是图2中循环滤波器结构的前反馈逆转接法。输入矢量s(n)加到减法器240和长期预测器延迟单元260上,延迟了的矢量q(n)为乘法器250的输入。数字滤波器124′的输出响应Hn(Z)在下列Z变换形式中给出:
式中,n代表在含有N个样本的一帧中的样本号,0≤n≤N-1,β代表长期滤波器系数;L代表长期预测器的正常延迟或延误;[(n+L)/L]代表最接近于或等于(n+L)/L的整数。滤波器124′的输出信号也可用输入信号s(n)的形式定义,如:
b(n)=s(n)-βs(n-[(n+L)/L]L)
其中0≤n≤N-1。本领域的技术人员可以理解,长期预测器的结构被重新修改了,以便在长期预测器延迟L小于帧的长度N时,能够重复输出存贮在长期预测器中的相同的样本。
参考下一张图7。本图说明了图1中长期滤波器124的最佳实施方案。此方案允许对于延迟系数L有一个子样本解。一帧具有N个样本的输入语言矢量s(n)送到加法器510上。加法器510产生了一个供长期滤波器124使用的输出矢量b(n)。输出矢量b(n)反馈到长期预测器的延迟矢量发生器单元530。长期预测器延迟系数L能够取非整数值。最佳实施方案允许L取一个是0.5倍数的值。根据本发明所做的子样本解长期预测器的替代方案,能够允许取值为1/3的倍数,1/4的倍数或任何其它比例的倍数。
在最佳实施方案中,延迟矢量发生器530包括一个能够存储b(n)个过去样本的存储器。另外,利用延迟矢是发生器530也可计算出b(n)的插入样本,并存贮在它的存贮器中。在最佳实施方案中,包含在延迟矢量发生器530中的长期预测器的状态对每一个存贮的样本b(n)有两个样本。一个样本用于b(n),另一个样本代表两个连续样本之间的插入样本。用这种方式,b(n)的样本可从延迟矢量发生器530获得。延迟矢量发生器530与整数延迟或1/2样本系数的延迟一致。插值的方法是插入有限的脉冲响应滤波器,此方法在R.Crochiere和L.Rabiner合著的名为《多速率数字信号处理》一书中有描述,该书是由Prentice Hall在1983年出版的。对矢量延迟发生器530的工作情况将结合图8和图9的流程图作进一步详细描述。
延迟矢量发生器530提供一个输出矢量q(n)给长期乘法器单元520。乘法器单元520将长期预测器响应放大长期预测器系数β倍。放大了的输出βq(n)然后加到加法器510以完成图7中循环滤波器124的反馈回路。
参照图8和图9,这是详细的流程图,说明由图7所示的长期滤波器的详细工作情况。依照本发明最佳实施方案,将N个点序列b(n)映射到2N个点的矢量ex(i),以此方法扩大长期预测器存贮的解。ex(i)的负指数样本包含有长期滤波器输出b(n)的扩大了的解的过去值。映射处理使长期预测器存贮的暂时解扩大两倍。这里为了简单起见仅描述单一阶段的映射,当然其它阶段也可用在本发明的其它实施方案中。
现在让我们进入到图8的开始这一步602,流程图运行到604步,在这里输入L,β和s(n)。在608步,矢量q(n)依照下式构成:
对于0≤n≤N-1有
q(n)=ex(2n-2L[(n+L)/L])
这里[(n+L)/L]代表最接近小于或等于(n+L)/L的整数。L是长期预测器延迟。对于声音语言而言,长期预测器延迟L可以是音调周期或音调周期的倍数。在最佳实施方案中,L可以是整数或是小数部分为0.5的实数。当L的小数部分是0.5时,它的有效解为半个样本。
在610步,长期滤波器的矢量b(n)根据下
式算出:
b(n)=βq(n)+s(n)
0≤n≤N-1
在612步中,长期滤波器矢量b(n)被输出。在614步中扩大的解状态ex(n)被更新以产生b(n)的插入值并把它存贮在延迟矢量发生器530的存贮器中。图9更详细地说明了614步。下一步为616步,整个过程在616步完成并停止。
现在进入图9中的开始步骤622,流程图运行到624步。在此子帧中要计算的以ex(i)表示的样本在这里归零。即对于i=-M,-M+2,…2N-1,ex(i)=0。对于阶为2M+1的插入滤波器,选M为奇数。例如,如果滤波器的阶是39,M就应为19,虽然为简单起见,选M为奇数,M也可为偶数。在626步中,依据下列公式用b(n)样本预置每一个i=0,2,2…(N-1)的ex(i)其它每一个样本。
ex(2i)=b(i)
i=0,1,…,N-1.
这样当i=0,2,…2(N-1)时,对于映射为其偶指数的当前帧,ex(i)保持了输出矢量b(n),同时当i=1,3,…2(N-1)+1时,奇次指数的ex(i)预置为零。
在628步,预置为零的插入ex(i)样本通过有限脉冲响应(EIR)插入重新构造。假定这种有限脉冲响应滤波器的阶如上边所解释的为2M+1,那么这种重新构造使用一种对称的零相位移滤波器。这里有限脉冲响应滤波器系数是α(j),这里j=-M,-M+2,…,M-1,M,a(j)=a(-j)。仅有被指定为有限脉冲响应滤波器标号(tab)的偶数样本才用于样本重造。因为奇数样本已经置零。结果对于每一个重造的样本,实际是M+1而不是2M+1的样本被加权并相加了。有限脉冲响应插值依照下列公式实现:
这里i=-M,-M+2,…,2(N-1)-M-2,2(N-1)-M
注意,要重构造的第一个样本是ex(-M),而不是所希望的ex(1)。这时因为在指数为-M,-M+2,…,-1时被插入的样本使用当前帧中的激励估计值在前一帧被重新构造。因此在当前帧中的那些样本是已知的(我们有b(n))情况下,再一次使用指向实际的而不是b(n)的估计值的滤波器标号来重新构造ex(i)(i=-M,-M+2,…,-1)的样本。
在上述公式中i的最大值是2(N-1)-M。意味着对于i=2N-M,2N-M+2,…,2(N-1)+1,ex(i)的(M+1)/2的奇数样本仍要重新构造。然而,对于那些指数i的值,插入滤波器的上部开口指向尚未定义的将来激发样本。为了计算用于那些指数的ex(i)值,对于i=2N,2N+2,…,2N+M-1,ex(i)的将来状态通过在630步的估算得到扩大:
ex(i)=λex(i-2L),
i=2N,2N+2,…,2N+M-1
用在本方案中的2L的最小值是2M+1。这条限制可以取消,如果我们定义:
ex(i)=λex(F(i-2L)),
i=2N,2N+2,…,2N+M-1;
对于等于奇数的i-2L,F(i-2L)由下式给出:
对于i-2L等于偶数的F(i-2L)由下式给出:
参数λ为历史延伸放大系数,可以置成等于β,或置成1(unity)。β是音调预测器的系数。在632步,使用如此延伸了的激励历史,最后(M+1)/2个归零的当前延伸过的有解帧的样本可用下式计算来:
i=2N-M,2N-M+2,…,2(N-1)+1
这些样本在下一子帧一旦对于ex(i)(i-2N,2N+2…,2N+M-1)的实际的激励样本
变为有用时,被重新计算。
这样,b(n)(n=0),N-1已经被映射到矢量ex(i)上,i=0,2,…,2(N-1)。使用有限脉冲响应插入滤波器重新构造丢失的置零的样本。注意有限脉冲响应插入仅用于丢失的样本这就确保不将失真引入已知的样本之中。这些样本贮存在ex(i)的偶数指数中,仅处理丢失的样本的另一好处是可以减半子插入而引起的计算量。
最后,在634步,步期预测器的历史终于通过扩充解的激励矢量ex(i)的内容下移2N点而被更新。即:
ex(i)=ex(i+2N),
i=-2Max_L,-1
这里Max_L是使用过的长期预测器的最大延迟。下一步,在636步,整个过程完成并停止。
现在参见图6,图6说明了使用本发明的长期滤波器所做的语言合成器的框图。语言合成器得到短期预测器系数αi;长期预测器系数β和L,激励增益系数γ及来自通信通道的经过信号分离器450收到的编码字I。编码字I加到编码本ROM420以确定激励矢量编码本的地址。然后,单个的激励矢量ui(n)在422单元放大增益系数γ倍,并由长期预测器滤波器424和短期预测器滤波器426滤波,以得到重新构造过的语言矢量s′I(n)。这一矢量代表了重新构造了的语言的一帧。然后这一矢量加到数模转换器D/A408上以产生一重新构造过的模拟信号。此模拟信号通过滤波器404进行低通滤波以减小混淆,然后加到输出变换器,例如402中的扬声器。因此,CELP合成器使用与图1的CELP分析器所用的一样的编码本,增益单元,长期滤波器和短期滤波器。
图10是音调滞后滤波器的详细框图。音调滞后滤波器用于连接图6所示的语言合成器的短期滤波器426和数模转换器408,音调滞后滤波器去除由滤波器424和426所产生的噪音以改善语言质量,由重新构造的语言矢量sI(n)的N个样本组成的一帧加到加法器710上。加法器710的输出产生一个用于音调后滤波器的输出矢量s″I(I)。输出矢量s″I(n)反馈到音调滞后滤波器的延迟样本发生器单元730。正常长期预测器延迟系数L也输出到延迟样本发生器单元730。对于本发明,L可取非整数值。如果L是一个非整数,那么插入有限脉冲响应滤波器用来产生一个所需的分数样本延迟。延迟样本发生器730为乘法器单元720提供一个输出矢量q(n)。乘法器720使用属于长期预测器系数β之函数的系数R来放大音调滞后滤波器的响应。放大了的输出Rq(n)然后送到加法器710,从而完成了图10所示的音调滞后滤波器的反馈环路。
依据本发明,在使用长期预测器响应时,可同时优化激励增益系数γ和长期预测器系数β。这两系数用于闭环结构中所有的L值。至今为止,对L<N的值,这种联合优化的技术是不实际的,这是因为就单个的系数β联合优化公式将为非线性。本发明修改了长期预测器的结构,以满足线性联合优化公式。另外,本发明能使长期预测器比单一样本有更好的解,在此提高了它的性能。
还有一点,编码本搜寻程序被进一步简化了,这是因为对于小于一帧长度的延迟,长期滤波器的零状态响应变为零。这一附加的特点使本领域的技术人员可以从编码本搜寻程序中去除长期滤波器的影响。这样,业已表明CELP语言编码器可以对所有的音调速率提供更高质量的语言,同时保留实际实施和低比特率的优点。
这里已经显示和描述了本发明的特殊的实施方案,在不超出本发明的各个方面的情况下,可以做出进一步的修改和改进。例如,任何类型的语言编码(例如:RELP,多脉冲,RPE,LPC,等)可以和这里所描述的子样本解长期预测器滤波器技术一起使用。另外,可以做出其它的子样本解长期预测器结构的等价结构。这一结构可进行如上述的同样的计算。
Claims (10)
1、一种采用长期预测器的语言合成方法,其中滤波一个每一帧具有N个样本的输入信号s(n)以提供一个输出信号b(n),(n)为每一帧的样本数),该方法的特征在于下列步骤:
(a)输入上述输入信号s(n)的一组N个数字化输入样本;
(b)将存贮延迟系数L输入到存贮装置;
(c)将至少L个上述输出信号b(n)的过去样本存贮在上述存贮装置中;
(d)从存贮在上述存贮装置中读出至少N个存贮样本做为延迟信号q(n),如果L小于N,则重复地从上述存贮装置的样本中读出至少一些存贮样本,做为延迟信号q(n);
(e)线性组合延迟信号q(n)和输入信号s(n)以产生上述的输出信号b(n)。
2、按照权利要求1的方法,其特征在于上述生成步骤中包括滤波器参数β与上述延迟信号q(n)相乘并将新得到的信号加到上述信号s(n)以产生上述输出信号b(n)的各个步骤。
3、按照权利要求1的方法,其中所述存储装置是长期预测器的延迟设备,所述的存贮参数L代表上述长期预测器的正常延迟。
4、按照权利要求1的方法,其特征是上述输出信号b(n)的一组N个数字化样本的步骤。
5、一种采用长期预测器合成语言的装置,用于构造一个从激励矢量u(n),延迟系数L和滤波器系数β而来的N个样本的信号矢量s′(n),其中n代表一个样本数,样本连续从0到N-1编号,该装置的特征在于:
用于滤波上述激励矢量u(n)以提供滤了波的矢量b(n)的装置,上述滤波装置包括:
用于把上述激励矢量u(n),上述延迟参数L及上述滤波器参数β输入到上述滤波装置的装置,这里L可能小于N;
根据下列公式:
q(n)=b(n-kL)
用来产生延迟矢量q(n)的装置,这里选择变量q的值,使(n-qL)的值小于0;
用于线性结合上述延迟矢量q(n)和上述激励矢量b(n)的装置;
利用信号来处理上述经滤波的矢量b(n)以产生上述构造了的信号矢量s′(n)的装置。
6、根据权利要求5的装置,其特征在于:上述滤波装置按下列公式构造为循环滤波器:
b(n)=u(n)+βb(n-kL)
7、根据权利要求5的装置,其特征在于:变量k代表下列量度:
[(n+L)/L]
其中[(n+L)/L]代表最接近小于或等于(n+L)/L的整数。
8、根据权利要求5的装置,其特征在于:当L>N时,k=1,当L<N时,k做为N的函数,是从集合{1,2,3,4,……}中选出的。
9、根据权利要求5的装置,其特征在于:具有编码本装置用来存贮一组激励矢量ui(n)并用来产生一个特殊的激励矢量以响应一选定的编码字i。
10、根据权利要求5的装置,其特征在于:上述的构造过的信号矢量s′(n)是一语言信号。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US40220689A | 1989-09-01 | 1989-09-01 | |
US402,206 | 1989-09-01 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1050633A CN1050633A (zh) | 1991-04-10 |
CN1026274C true CN1026274C (zh) | 1994-10-19 |
Family
ID=23590969
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN90109233A Expired - Lifetime CN1026274C (zh) | 1989-09-01 | 1990-08-31 | 采用长期预测器的语言合成方法及其装置 |
Country Status (12)
Country | Link |
---|---|
EP (1) | EP0450064B2 (zh) |
JP (1) | JP3268360B2 (zh) |
CN (1) | CN1026274C (zh) |
AT (1) | ATE191987T1 (zh) |
AU (1) | AU634795B2 (zh) |
CA (1) | CA2037899C (zh) |
DE (1) | DE69033510T3 (zh) |
DK (1) | DK0450064T4 (zh) |
ES (1) | ES2145737T5 (zh) |
MX (1) | MX167644B (zh) |
SG (1) | SG47028A1 (zh) |
WO (1) | WO1991003790A1 (zh) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5327520A (en) * | 1992-06-04 | 1994-07-05 | At&T Bell Laboratories | Method of use of voice message coder/decoder |
FR2702590B1 (fr) * | 1993-03-12 | 1995-04-28 | Dominique Massaloux | Dispositif de codage et de décodage numériques de la parole, procédé d'exploration d'un dictionnaire pseudo-logarithmique de délais LTP, et procédé d'analyse LTP. |
FI96248C (fi) | 1993-05-06 | 1996-05-27 | Nokia Mobile Phones Ltd | Menetelmä pitkän aikavälin synteesisuodattimen toteuttamiseksi sekä synteesisuodatin puhekoodereihin |
DE4421853A1 (de) * | 1994-06-22 | 1996-01-04 | Philips Patentverwaltung | Mobilfunkendgerät |
GB9408037D0 (en) * | 1994-04-22 | 1994-06-15 | Philips Electronics Uk Ltd | Analogue signal coder |
JP2970407B2 (ja) * | 1994-06-21 | 1999-11-02 | 日本電気株式会社 | 音声の励振信号符号化装置 |
FR2729247A1 (fr) * | 1995-01-06 | 1996-07-12 | Matra Communication | Procede de codage de parole a analyse par synthese |
FR2729244B1 (fr) * | 1995-01-06 | 1997-03-28 | Matra Communication | Procede de codage de parole a analyse par synthese |
FR2729246A1 (fr) * | 1995-01-06 | 1996-07-12 | Matra Communication | Procede de codage de parole a analyse par synthese |
US5708757A (en) * | 1996-04-22 | 1998-01-13 | France Telecom | Method of determining parameters of a pitch synthesis filter in a speech coder, and speech coder implementing such method |
JP4857468B2 (ja) | 2001-01-25 | 2012-01-18 | ソニー株式会社 | データ処理装置およびデータ処理方法、並びにプログラムおよび記録媒体 |
JP4857467B2 (ja) | 2001-01-25 | 2012-01-18 | ソニー株式会社 | データ処理装置およびデータ処理方法、並びにプログラムおよび記録媒体 |
GB2466672B (en) * | 2009-01-06 | 2013-03-13 | Skype | Speech coding |
GB2466673B (en) | 2009-01-06 | 2012-11-07 | Skype | Quantization |
GB2466674B (en) | 2009-01-06 | 2013-11-13 | Skype | Speech coding |
GB2466671B (en) | 2009-01-06 | 2013-03-27 | Skype | Speech encoding |
GB2466675B (en) | 2009-01-06 | 2013-03-06 | Skype | Speech coding |
EP2761616A4 (en) * | 2011-10-18 | 2015-06-24 | Ericsson Telefon Ab L M | IMPROVED METHOD AND DEVICE FOR AN ADAPTIVE MULTIRATE CODEC |
FR3015754A1 (fr) * | 2013-12-20 | 2015-06-26 | Orange | Re-echantillonnage d'un signal audio cadence a une frequence d'echantillonnage variable selon la trame |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
NL168669C (nl) * | 1974-09-16 | 1982-04-16 | Philips Nv | Interpolerend digitaal filter met ingangsbuffer. |
US4080660A (en) * | 1975-07-11 | 1978-03-21 | James Nickolas Constant | Digital signal time scale inversion |
US4020332A (en) * | 1975-09-24 | 1977-04-26 | Bell Telephone Laboratories, Incorporated | Interpolation-decimation circuit for increasing or decreasing digital sampling frequency |
NL8105801A (nl) * | 1981-12-23 | 1983-07-18 | Philips Nv | Recursief digitaal filter. |
US4573135A (en) * | 1983-04-25 | 1986-02-25 | Rca Corporation | Digital lowpass filter having controllable gain |
JPS60116000A (ja) * | 1983-11-28 | 1985-06-22 | ケイディディ株式会社 | 音声符号化装置 |
JPS63214032A (ja) * | 1987-03-02 | 1988-09-06 | Fujitsu Ltd | 符号化伝送装置 |
JPS63249200A (ja) * | 1987-04-06 | 1988-10-17 | 日本電信電話株式会社 | ベクトル量子化方式 |
JPH01177227A (ja) * | 1988-01-05 | 1989-07-13 | Toshiba Corp | 音声コーデック |
-
1990
- 1990-06-25 ES ES91905041T patent/ES2145737T5/es not_active Expired - Lifetime
- 1990-06-25 WO PCT/US1990/003625 patent/WO1991003790A1/en active IP Right Grant
- 1990-06-25 DE DE69033510T patent/DE69033510T3/de not_active Expired - Lifetime
- 1990-06-25 EP EP91905041A patent/EP0450064B2/en not_active Expired - Lifetime
- 1990-06-25 AT AT91905041T patent/ATE191987T1/de not_active IP Right Cessation
- 1990-06-25 JP JP50964190A patent/JP3268360B2/ja not_active Expired - Lifetime
- 1990-06-25 DK DK91905041T patent/DK0450064T4/da active
- 1990-06-25 AU AU59525/90A patent/AU634795B2/en not_active Expired
- 1990-06-25 CA CA002037899A patent/CA2037899C/en not_active Expired - Lifetime
- 1990-06-25 SG SG1996002783A patent/SG47028A1/en unknown
- 1990-08-15 MX MX021980A patent/MX167644B/es unknown
- 1990-08-31 CN CN90109233A patent/CN1026274C/zh not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
CN1050633A (zh) | 1991-04-10 |
EP0450064A4 (en) | 1995-04-05 |
JP3268360B2 (ja) | 2002-03-25 |
DK0450064T4 (da) | 2006-09-04 |
MX167644B (es) | 1993-03-31 |
EP0450064B1 (en) | 2000-04-19 |
WO1991003790A1 (en) | 1991-03-21 |
DE69033510T2 (de) | 2000-11-23 |
EP0450064A1 (en) | 1991-10-09 |
CA2037899A1 (en) | 1991-03-02 |
EP0450064B2 (en) | 2006-08-09 |
DE69033510T3 (de) | 2007-06-06 |
AU634795B2 (en) | 1993-03-04 |
DE69033510D1 (de) | 2000-05-25 |
ES2145737T3 (es) | 2000-07-16 |
AU5952590A (en) | 1991-04-08 |
ES2145737T5 (es) | 2007-03-01 |
ATE191987T1 (de) | 2000-05-15 |
CA2037899C (en) | 1996-09-17 |
DK0450064T3 (da) | 2000-10-02 |
SG47028A1 (en) | 1998-03-20 |
JPH04502675A (ja) | 1992-05-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1026274C (zh) | 采用长期预测器的语言合成方法及其装置 | |
CN1150516C (zh) | 语音编码方法和语音编码器 | |
CN1120471C (zh) | 语音编码 | |
CN1104710C (zh) | 在语音数字传输系统中产生悦耳噪声的方法与装置 | |
CN1035379A (zh) | 具有改进的矢量激发源的数字语音编码器 | |
CN1264138C (zh) | 复制语音信号、解码语音、合成语音的方法和装置 | |
RU2257556C2 (ru) | Квантование коэффициентов усиления для речевого кодера линейного прогнозирования с кодовым возбуждением | |
KR100304682B1 (ko) | 음성 코더용 고속 여기 코딩 | |
CN1202514C (zh) | 编码和解码语音及其参数的方法、编码器、解码器 | |
CN1795495A (zh) | 音频编码设备、音频解码设备、音频编码方法和音频解码方法 | |
CN1274456A (zh) | 语音编码器 | |
US20100010810A1 (en) | Post filter and filtering method | |
WO1995016260A1 (en) | Adaptive speech coder having code excited linear prediction with multiple codebook searches | |
CN1689069A (zh) | 声音编码设备和声音编码方法 | |
CN1218501C (zh) | 在话音频带数据通信期间避免量化器饱和的方法和系统 | |
CN1192357C (zh) | 用于语音编码的自适应规则 | |
CN1711589A (zh) | 在语音编码系统中对增益信息进行编码的方法和装置 | |
CN1132157C (zh) | 线性预测分析合成的编码方法和编码器 | |
CN1218296C (zh) | 音调周期搜索范围设置装置 | |
KR20100049562A (ko) | 음성 부호화 장치 및 음성 부호화 방법 | |
CN1124590C (zh) | 改善话音信号编码器性能的方法 | |
EP2116996A1 (en) | Encoding device and encoding method | |
KR100341398B1 (ko) | 씨이엘피형 보코더의 코드북 검색 방법 | |
CN1926606A (zh) | 基于模板匹配和多分辨率分析的编/解码方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
SE01 | Entry into force of request for substantive examination | ||
PB01 | Publication | ||
C06 | Publication | ||
C10 | Entry into substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C19 | Lapse of patent right due to non-payment of the annual fee | ||
CP01 | Change in the name or title of a patent holder |
Patentee after: Motorola Inc. Patentee before: Motorola Ltd. |
|
OR01 | Other related matters | ||
CX01 | Expiry of patent term |
Expiration termination date: 20100831 Granted publication date: 19941019 |