CN1173940A - 综合分析语音编码方法 - Google Patents
综合分析语音编码方法 Download PDFInfo
- Publication number
- CN1173940A CN1173940A CN96191795A CN96191795A CN1173940A CN 1173940 A CN1173940 A CN 1173940A CN 96191795 A CN96191795 A CN 96191795A CN 96191795 A CN96191795 A CN 96191795A CN 1173940 A CN1173940 A CN 1173940A
- Authority
- CN
- China
- Prior art keywords
- frame
- subframe
- filter
- index
- short
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 38
- 238000003786 synthesis reaction Methods 0.000 title claims abstract description 38
- 230000015572 biosynthetic process Effects 0.000 title claims abstract description 33
- 238000000034 method Methods 0.000 title claims description 54
- 230000004044 response Effects 0.000 claims description 40
- 230000014509 gene expression Effects 0.000 claims description 28
- 238000011002 quantification Methods 0.000 claims description 27
- 238000005070 sampling Methods 0.000 claims description 23
- 239000000203 mixture Substances 0.000 claims description 15
- 230000004913 activation Effects 0.000 claims description 12
- 239000002131 composite material Substances 0.000 claims description 12
- 238000001228 spectrum Methods 0.000 claims description 8
- 238000004904 shortening Methods 0.000 claims description 7
- 238000009826 distribution Methods 0.000 claims description 5
- 230000005284 excitation Effects 0.000 abstract description 30
- 239000011159 matrix material Substances 0.000 abstract description 29
- 238000012804 iterative process Methods 0.000 abstract 1
- 230000007774 longterm Effects 0.000 description 33
- 238000013139 quantization Methods 0.000 description 29
- 239000013598 vector Substances 0.000 description 28
- 230000008569 process Effects 0.000 description 21
- 238000012360 testing method Methods 0.000 description 17
- 230000006870 function Effects 0.000 description 15
- 230000005540 biological transmission Effects 0.000 description 12
- 101100176198 Caenorhabditis elegans nst-1 gene Proteins 0.000 description 9
- 230000008901 benefit Effects 0.000 description 9
- 230000003044 adaptive effect Effects 0.000 description 6
- 238000000354 decomposition reaction Methods 0.000 description 6
- 238000007689 inspection Methods 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 238000010606 normalization Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 101100148606 Caenorhabditis elegans pst-1 gene Proteins 0.000 description 3
- 238000005311 autocorrelation function Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 230000008447 perception Effects 0.000 description 3
- PMOWTIHVNWZYFI-WAYWQWQTSA-N cis-2-coumaric acid Chemical compound OC(=O)\C=C/C1=CC=CC=C1O PMOWTIHVNWZYFI-WAYWQWQTSA-N 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008929 regeneration Effects 0.000 description 2
- 238000011069 regeneration method Methods 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 101000822695 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C1 Proteins 0.000 description 1
- 101000655262 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C2 Proteins 0.000 description 1
- 101000655256 Paraclostridium bifermentans Small, acid-soluble spore protein alpha Proteins 0.000 description 1
- 101000655264 Paraclostridium bifermentans Small, acid-soluble spore protein beta Proteins 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 210000003205 muscle Anatomy 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
- Analysing Materials By The Use Of Radiation (AREA)
Abstract
为确定短期综合滤波器的系数,对每帧语音信号进行线性预测分析,并且对每个子帧确定一个激发序列,使加到短期综合滤波器的激发序列产生表征语音信号的一个综合信号,激发序列由迭代过程确定,其中,再次迭代逐渐建立对稳矩阵Bn。矩阵Bn再次迭代通过用Ln=Rn·Kn分解模式Bn=Ln·RnT被转置,这里,Ln、Rn是三角矩阵,k是对角线矩阵,矩阵L仅具有在它的应对角线上的1′s。
Description
本发明涉及综合分析语音编码。
本申请公司已在它的欧洲专利申请第0195487,0347307和0469997号中,特别描述了这种已开发的语音编码。
在综合分析语音编码器中,为了获得模型化声音区域的传送函数的短期合成滤波器系数,执行一个语音信号的线性预测。这些系数和具有用于激励短期合成滤波器特性的参数一起被传送到译码器。在当前的大多数编码器中,为了重视语音音调的长期综合滤波器的特性,也要寻找语音信号的长期相互关系。当信号被话音化时,这种激励实际上包括一个可以由过去的激励表示的推断成份,由语音信号TP取样延迟以及受到增益gp控制。长期综合滤波器也在译码器中设置,且具有一个1/B(z)形式的传递函数,其中:B(z)=1-gp·z-TP。其余部分,激励的不可预测部分称为随机的激励。在称为CELP(激励编码的线性预测)编码器的编码器中,随机激励包括在预定字典中查找到的矢量。在称为MPLPC(“多脉冲线性预测编码”)编码器的编码器中,随机激励包括一定的由编码器查寻位置脉冲的数量。通常,CELP编码器更适用于低数据传输速度,但它比MPLPC编码器执行起来更复杂。
为了确定长期预测的延迟,常使用一个闭合环路分析,它有助于直接减少在语音信号和合成信号之间感知加权的不同。这个闭合环路分析的缺点是它依据计算总量的要求,因为一个延迟的选择含有对一定数量的候选延迟的估计,一个延迟的每个估算要求对感知加权合成滤波器的延迟激励和脉冲响应间的卷积结果的计算。上述的缺点对随机激励的查寻也存在,它也是一个闭合回路过程,在这个过程中,包括与这个脉冲响应的卷积的结果。这个激励比短期合成滤波器的频谱参数特性变化得更快。这个激励(预测的和随机的)可以每5ms子帧被典型地确定一次,而频谱参数每20ms帧被确定一次。就有关语音编码器中所需的计算速度而言,对激励的闭合环路查寻的复杂性和频率使得这个阶段成为最重要的部分。
本发明的主要目的是就有关闭合环路分析或解析而言,提供一种减少复杂性的语音编码方法。
因此,本发明提供了一种编码语音信号的一种综合分析方法,这个语音信号数字化成分解为包含一个定义的采样数量的子帧的连续帧,其中,为确定短期综合滤波器的系数,对每个帧,执行语音信号的一个线性预测分析;为确定这帧的语音等级,对每个帧,执行一个开环回路分析;为确定一个提交的短期综合滤波器,产生一个语音信号的同步信号表征的激励序列,对每个子帧,执行至少一个闭合回路分析。每个闭合环路分析利用合成滤波器的脉冲响应,这个合成过程器包括短期综合滤波器和感知加权滤波器。在每次闭合回路分析期间,用到了上述脉冲响应,把它缩短到一个缩短长度,这个长度至多等于每个子帧的采样量,依赖上述响应的能量分配和这个帧的语音等级。
通常,缩短的长度会比大多数语音帧更大。可能在不损失编码质量的情况下,依靠匹配语音信号的特征,减少闭合环路分析的复杂性。
本发明的其它特性和优点,将参数附图在下述对优选但不限制可仿效的实施例的下述描述中体现,
其中:
图1是一个结合实施本发明的语音编码器的无线通信站的框图;
图2是一个能接收由图1的站产生的信号的一个无线通信站的框图;
图3到6是说明用在图1的语音编码中开环回路LTP分析的一个处理过程的流图;
图7是说明用于确定用于图1的语音编码器的加权综合滤波器过程的一个流图;
图8到11是说明在图1的语音编码器中用于随机激励查寻过程的流图。
实施本发明的语音编码器依赖一个数字压缩技术的适用于不同类型的语音传输和/或存储系统,在图1的例子中,语音编码器16形成移动无线通信站的部分。语音信号S是一个0以典型地等于8KHz的频率取样的数字信号。这个信号S从送话器20接收的被放大和滤波的输出信号通过模拟数字转换器18输出。转换器18使这个语音信号S的自身子分割成1st采样的nst子帧的连续帧的形式。一个20ms帧典型地包括以8KHz的16位1st=40采样的nst=4个子帧。编码器16的上数据流,语音信号S也可以用于传统的形式处理,如海明滤波。语音编码器16以实际上小于语音信号S的数据速度传送一个二进制序列,并且把这个序列用于信道编码器22,信道编码器22的功能是把冗余位引入信号中,以便允许任何传输误差的检测和/或纠正。然后,信道编码器22的输出信号由调制器24调制成一个载波频率,并把被调制信号传送到在空间接口上。
语音编码器16是一个综合分析编码器。一方面,编码器16确定具有模型化扬声器的声音区域的短期综合滤波器特征的参数,另一方面,用于短期综合滤波器的一个激励序列,根据感知加权准则,提供一个构成一个语音信号S的估算值的一个综合信号。
短期综合滤波器具有一个1/A(z)形式的传递函数:
系数ai由用于语音信号S的短期线性预测分析的模块26确定的。ai是语音信号S的线性预测的系数。线性预测的阶q典型地是阶10。可以由用于短期线性预测的模块26采用的方法,这在语音编码领域中已广为人知。例如,模块26执行Durbin-LevinS0n算法(见J.Makhoul的“线性预测:指导评论”,IEEE的1975年4月4期63卷p.561-580)。获得的系数ai用于把它们转换成线性频谱参数(LSP)的模块28。由LSP参数表示的预测参数ai频繁用于综合分析语音编码器。LSP的参数是以降序排列的q数cos(2πfi),q的正常化线性频谱频率(LSF)f1(1≤i≤q),也就是复数exp(2πfi),其中,i=1,3,…,q-1,q+1并且fq+1=0.5,是由Q(z)=A(z)+z-(q+1)、A(z-1)定义的多项式Q(z)的根,复数exp(2πjffi),其中i=0,2,4…q和f0=0,是由Q*(z)=A(z)-z-(q+1).A(z-1)定义的多项式Q*(z)的根。
LSP参数可以用切比雪夫多项式的传统方法通过换算模块28获得(见P.Kabal和R.P Ramachandran:“使用Chebyshev多项式的线光谱频率的计算”,IEEE Trans ASSP卷346期1986年1419-1426页)。它是由量化模块30获得的LSP参数的量化值,这些值被送往用来恢复短期综合滤波器的系数ai的译码器。系数ai可以简单地恢复,如下: A(z)=[Q(z)+Q*(z)]/2
为了避免短期综合滤波器的传递函数发生突然变化,LSP的参数用于在预测系数ai从它们中推演出来前进行插入。这个插入在信号的每帧的第一个子帧上执行。例如,如果LSPt和LSPt-1分别表示为帧t和预测帧t-1计算的一个LSP参数,那么对于帧t的子帧0,1,2,…,nst-1,LSPt(0)=0.5LSPt-1+0.5LSPt,LSPt(1)=0.25LSPt-1+0.75LSPt以及LSPt(2)=……=LSPt(nst-1)=LSPt。这个1/A(z)滤波器的系数ai在插入LSP参数的基础上通过逐字帧确定。
非量化的LSP参数由模块28提供给计算一个感知加权滤波器34系数的模块32。感知加权滤波器34具有公式W(z)=A(z/γ1)/A(z/γ2)的传递函数,其中γ1和γ2是系数,γ1>γ2>0(例如:r=0.9和r2=0.6)。感知加权滤波器的系数在从模块28接收的LSP参数插入后,由用于每子帧的模块32计算。
感知加权滤波器34接收语音信号S并传送一个由模块36,38,40为确定激励序列而分解的感知加权信号SW。短期滤波器的激励序列包括可以由模型化语音音调的一个长期综合滤波器预测的激励和一个非预测随机激励,或创新序列。
模块36在开环回路中,执行一个长期预测(LTP),也就是说,它不直接用于最小化加权误差,在这种情况下,加权滤波器34位于开环回路分析模块的上游,但它也可以放在别处:模块36可以用传递函数A(z)直接操纵语音信号S,甚至通过滤波器除去与它的短期相关部分直接操纵语音信号S。另一方面,模块38和40在闭环回路上操纵,也就是说,它直接用于最小化感知加权误差。
长期综合滤波器具有公式1/B(z)的一个传递函数,B(z)=1-gp·z-TP,其中,gp表示一个长期预测增益,TP表示一个长期预测延迟。这个长期预延迟可以典型地取位于rmin和rmax取样间的值N=256。分解的分解率提供给延迟的最小值,以便避免在语音频率方面,由于具有太多感知造成的不同。例如,使用介于rmin=21和33+5/6之间的1/6分解率,一个介于34和47+2/3的1/3分解,上介于48和88+1/2的1/2分解率,一个介于89和rmax=142的整数分解率。每个可能的延迟都由位于0和N-1=255的整数索引量化。
长期预测延迟在两个阶段确定。第一阶段中,开环回路LTP分析模块36检测语音信号的话音帧,并且为每个话音帧确定话音等级MV和一个长期预测延迟的查寻间隔。一个话音帧的话音等级MV可以取三个值:1是轻话音帧,2是中话音帧,3是高话音帧。在下面使用的注示中,MV=0的话音等级用于非话音帧。查寻间隔仍赖于话音MV的等级,由其量化索引ZP和量化索引域中的宽度表示的中心值来定义。对于轻度或中度话音帧(MV=1或2),查寻间隔的宽度是N1索引,也就是说,若N1=32,则将在ZP-16和ZP+15间查寻长期预测延迟。对于高话音帧(MV=3),查寻间隔的宽度是N3索引,也就是说,若N3=16,则长期预测延迟的索引将在ZP-8和ZP+7间查寻。
一但一个帧的话音等级MV已由模块36确定,模块30执行一个前面已为此帧确定的LSP参数的量化过程。例如,这个量化是垂直的,也就是说,在从一个或更多个预定量化表中选择的情况下,它包括展示与由模块28提供的LSP参数值之间的一个最小距离的一个量化参数LSPQ集合。用一个已知的方法,量化表随由开环分析器36提供给量化模块30的话音等级MV而变化。在前面提到的近似解中,确定话音等级MV的一个量化表集合,以便可以静态地表示具有此等级MV的帧。这些集合存储在本发明实施例的编码器和译码器中。模块30传送量化参数LSPQ的集合和在申请的量化表中的索引值Q一样。
语音编码器16还包括一个模块42,它用于计算短期综合滤波器和感知加权滤波器的合成滤波器的脉冲响应。这个合成滤波器具有一个传递函数的W(z)/A(z),它用于在一个子帧期间,计算其脉冲响应h=(h(0),h(1),…,h(1st-1)),模块42完成对感知加权滤波器W(z),它根据已插入但非量化的LSP参数,也就是说,已由模块32计算的那个系数,并对综合滤波器1/A(z),它根据量化的和已插入的LSP参数,也就是说,可以实际上由编码器重新构成的那一个。
在长期预测延迟TP确定的第二阶段中,闭环回路LTP分析模块38为每个话音帧(MV=1,2,或3)的每个子帧确定延迟TP。这个延迟TP由在量化索引的域中的一个差分值DP为特性,这个量化索引如果在MV=1或2(N1=32)时,以5位编码,若在MV=3(N3=16)时以4位编码。延迟TP的索引引等于ZP+DP。在已知的方法中,闭环回路LTP分析在于:在长期预测延迟T的查寻间隔内,它延迟TP为一个话音帧的每个子帧最大限度的归一化相互关系:
其中,X(i)表示这个子帧的加权语音信号SW,这个子帧已经从加权综合滤波器的存储器中减去。(也就是说,由于起始状态,对由模块42计算的脉冲响应h的滤波器的零信号的响应),YT(i)表示一个卷积的结果:
U(j-T)由T采用延迟表示通过已知自适应码本技术估算的激励序列的预测成份。对于此子帧长度短的延迟T,U(j-T)的丢失值可以从前面的值中推断出来。通过进一步采样自适应的码本中的信号U(j-T),考虑到小数部分的延迟。由因子m进一步取样是通过插入多相滤波器的方法获得的。通过使用已知公式
长期预测增益gp可以对每个子帧由模块38确定。但是,在本发明的一个优选版本,增益是由随机分析模块40计算的。
由模块40为每个子帧确定的随机激励是多脉冲类型。一个1st采样的更新序列包括具有位置P(n)和振幅g(n)的np脉冲。换句话说,脉冲具有一个为1的振幅,并且分配一个各自独立的增益g(n)。给出LTP延迟对非话音帧的子帧没有确定,对于这些子帧相关的随机激励,可以采用更高数量的脉冲,例如,若MV=1,2或3,则np=5,若MV=0,np=6。由随机分析模块40计算的位置和增益由模块44量化。
一个位排列次序模块46接收对译码器有用的不同参数,并且编码前向信道编码器22的二进制序列。这些参数是:
-为每帧量化的LST参数的索引Q;
-每个帧的话音等级MV;
-每个话音帧的LTP延迟查寻间隔中心的索引ZP;
-每个话音帧的子帧的LTP延迟和分配的增益gp的差分索引Dp;
-每个子帧的随机激励的脉冲的位置P(n)和增益g(n)。
这些参数的一部分在语音再生质量上是特别重要的,或者对传输差错特别敏感。因此,在编码器中提供了一个模块48,这个模块接收不同的参数并把冗余位加到其中的某个部分,它可能检测和/或纠正任何传输差错。例如,作为两位编码的话音等级MV是一个关键性的参数,它需要以尽可能少的差错到所述译码器。由于这个原因,冗余位由模块48加到这个参数中。例如,可能增加一个奇偶位到这两个MV编码位并复制一次获得的三个位。这个冗余的例子可能检测所有单个或双个的误差,并校正所有的成单差错和75%的成双差错。
例如,在表I中指示的每20ms帧的二进制数据速度的分配。
在这里考虑的例子中,信道编码器22是用于移动无线通信(GMS)的泛欧洲系统的编码器。这个信道编码器,在GSM建议05.03中详细描述已经对每20ms帧也产生260位的RPE-LTP型13kbit/s语音编码器的开发。这260位的每位的敏感度在收听测试的基础上已被确定了。从源编码器输出的比特被一起分为三组类型。这些类IA的第一分组50个比特将在给定的一半冗余的生成器多项式的基础上,与一个强制长度为5的进行卷积编码。三个奇偶位在卷积编码前计算并加到类型IA的50位中。第二类(IB)用与前面类型相同的多项式,保护一个一半水平的132位编号。第三类(II)包含78个非保护位。在卷积编码应用之后,这些位(每帧456)用于主观的交替扫描。实施本发明的新信源编码器的排序模块46在主观上有重要意义的这些位的基础上,把这些位分配成三个类型。
量化参数 | MV=0 | MV=1或2 | MV=3 |
LST | 34 | 34 | 34 |
MV+冗余位 | 6 | 6 | 6 |
ZP | - | 8 | 8 |
DP | - | 20 | 16 |
gTP | - | 20 | 24 |
脉冲位置 | 80 | 72 | 72 |
脉冲增益 | 140 | 100 | 100 |
总计 | 260 | 260 | 260 |
表I
移动无线通信站能够接收通过在图2中图解表示的信源编码器16处理的语音信号。接收的无线信号首先是通过解调器50,然后由执行调制器24和信道编码器22的信号双工操作的信道译码器52处理。信道译码器52提供给语音译码器54一个二进制序列,在忽略传输误差或当任何误差已由信道译码器52纠正时,对应的这个二进制序列交付给在编码器16的排序模块46。译码器54包括接收这个二进制序列并标识与不同话音帧和子帧有关参数的模块56。模块56也在接收参数基础上执行一些检测。特别是,为了结合冗余位检测和/或纠正误差影响的这个参数,模块56检查由编码器的模块48插入的冗余位。
对于合成的每个语音帧,译码器的模块58接收话音等级MV和LSP参数的量化Q索引。模块58从对应MV值的表中,恢复量化的LSP参数,并在插入之后,把它们转换成用于短期综合滤波器60的系数ai。对于每个合成的语音子帧,一个脉冲生成器62接收随机激励的np脉冲的位置P(n)。生成器62传送每个由相应的增益g(n)以64多路复用的单元振幅的脉冲。放大器64的输出用于长期综合滤波器66。这个滤波器66具有一个自适应的码本结构。滤波器66的输出采样u存在自适应码本68的存储器中,以便对序列子帧可以合用。从量化索引ZP和DP计算的与子帧有关的延迟TP被提供给自适应码本68,以产生适当延迟的信号u。放大器70多路复用信号由长期预测增益gp延迟的。最后,长期滤波器66包括一个加法器72,它把放大器64和70相加的输出提供激励序列u。例如,当LTP分析在编码器中未执行时,若MV=0,在用于相关子帧的放大器70中,采用零预测增益gp。为了形成合成语音信号S’,激励序列用于短期综合滤波器60,并用已知的方法还能够把结果信号提送给一个后置滤波器74,这个滤波器的系数依赖接收的合成参数。然后,为了驱动大音量扬声器78,译码器54的输出信号S’在放大之前,由转换器76转换成模拟量。
根据本发明的第一观点,现在参照图3至6将要描述由编码器模块36执行的开环回路分析过程。
在第一阶段90中,模块36为当前帧的每个子帧st=0,1,…,nst-1计算并存储位于rmin和rmax之间的整数延迟的加权语音信号SW的自相关函数Cst(k)和延迟能量函数Gst(k): 每个子帧的能量R0st也被计算为:
在阶段90中,另外在考虑自相关函数Cst(k)为正或比子帧的能量R0st的一个小比例ε小的那些延迟K的情况下,模块36为每个子帧st确定最大化在子帧st的长期预测增益的开环回路估计值pst(k)的整数延迟Kst。用分贝表示的估计值pst(k)表达为:
pst(k)=20log10[R0st/(R0st-Cst 2(k)/gst(k))]
这样最大化Rst(k)相当于最大化在图6中所示的表达式Xst(k)=Cst 2(k)/Gst(k)。整数延迟Kst是子帧st的整数分解中的基本延迟。在阶段90之后是在当前帧上的综合预测增益的一个第一个开环回路估计值和典型的位于1和2分贝之间的预定门限S0(例如,S0=1.5dB)。综合预定增益的第一估计值等于,
其中,R0是帧的能量总合(R0=R00+R01+…R0nst-1)和Xst(Kst)=Cst 2(Kst)/Gst(Kst)表示在阶段90上相关的与子帧st确定的最大值。如图6所示,不用计算这个对数,就可以执行这个比较92。
若比较92表示低于门限S0的预定增益的第一估计值,则认为语音信号包含太少的话音的长期相关性,当前帧的话音等级MV在阶段94被置为0。在这种情况下,阶段94终止在此帧上由模块36执行的操作。与此对照,若门限值S0在阶段92被交替,当前帧被检测为话音和等级MV等于1,2或3。然后,模块36对每个子帧st计算包含候选延迟的表Ist,以构成长期预测延迟的查寻间隔的中心ZP。
由模块36为话音帧的每个子帧st(st在阶段96初始化为0)执行的操作,等于在子帧上以分贝为单位的预定增益的估计值pst(Kst)的一个定义比例β,在级90被最大化(典型的β=0.75)以分贝为单位的选择门限SEst的确定98开始。对于话音帧的每个子帧st,模块36为剩余的过程确定以整数分解率的基本延迟rbf。这个基本延迟可以置为在阶段90获得的整数Kst。但是,以围绕Kst的小数分解率依据精确增益查寻基本延迟的实现,阶段100是围绕着在阶段90获得的整数延迟Kst,查寻最大化表达式Cst 2/Gst的分数延迟。即使整数延迟Kst不在这个最大分解率所用的域中,这个查寻也可以用小数延迟的最大分解率(在这里描述的例子中为1/6)。例如,最大化Cst 2(Kst+δ/6)/Gst(Kst+δ/6)的数Δst被确定为-6<δ<+6,然后,具有最大分解率的基本延迟rbf置为Kst+Ast/6。对于延迟的小数值T,自相关函数Cst(T)和延迟的能量函数Gst(T)是在用于整数延迟的阶段90,从存贮存储器中的值通过插入获得的。更清楚地说,与子帧相关的基本延迟也能用从阶段90得到小数分解率确定,并且在此帧的综合预测增益的第一估计值中考虑。
一旦已为一个子帧确定了基本延迟rbf,则执行一个检测101,它检测此延迟的子多路复用,以便采用那些预测增益相对高的值(图4),然后采用最小的子多路复用的多路复用(图5)。在阶段102,在表Ist中的地址j和子多路复用的索引m分别初始化为0和1。执行子多路复用rbf/m和最小延迟rmin之间的一个比较104。检验子多路复用以便看其是否比rmin大。与rbf/m(阶段106)最接近的量化延迟ri的索引值置为整数i,然后,在108,该子帧的量化延迟ri相关的预测增益pst(ri)的估计值与阶段98中计算的选择门限SEst相比较:
pst(ri)=20·log10[R0st/(R0st-Cst 2(ri)/Gst(ri))]
在小数延迟的情况下,是对整数延迟在阶段90计算的值Cst和Gst的一个插入。如果pst(ri)<SEst,则不考虑延迟ri,且在再次执行对下一子多路复用的比较104之前,直接进入用于增大索引m的阶段110。如果测试108表示pst(ri)≥SEst,那么采用延迟ri并且索引m在阶段110中增大之前执行阶段112。在阶段112中,索引i存贮在表Ist中的地址j所在的存储器中,值m置为应等于mo然后地址j增大一个单元。
当比较104表示为rbf/m<rmin时,基本帧的子多路复用的检验被终止。然后,在图5中说明的过程之后,检查作为前面采用的子多路复用的最大rbf/mo的多路复用的这些延迟。这个检查以多路复用的索引n的起始化开始:n=2。在多路复用nrbf/mo和最大延迟rmax之间执行一个比较116。如果nrbf/mo>rmax,那么为为确定最小的子多路复用的索引,mo是否是一个为n的整数的多路复用,执行测试118。如果是这个延迟nrbf/mo已经在rbf的子多路复用检查期间被检查了,并直接进入阶段120,阶段120用于在再次执行下一个多路复用的比较116之前增大索引n。如果测试118表示mo不是一个n的整数多路复用,那么就需要检查多路复用n.rbf/mo。最接近n.rbf/mo(阶段122)的量化延迟ri的索引值被置为整数i,然后,在阶段124,预测的增益pst(ri)的估算值与选择的门限值SEst相比较。如果pst(riK SEst)那么就不考虑这个延迟ri,并直接进入用于增加索引的阶段120。如果测试124表示pst(ri)≥SEst,就采用这个延迟ri,且在阶段120增加索引n之前执行阶段126。在阶段126中,索引i被存贮在表Ist中的地址j指向的存储器中,然后地址i增大一个单元。
当比较116表示n-rbf/mo>rmax时,则终止最小子多路复用的多路复用检查。在那一点,表Ist包含候选延迟的j索引。如果对下面的阶段需将表Ist的最大长度限制为jmax,那么这个表的长度jst可以等于min(j.jmax)(阶段128),然后,在阶段130,表Ist可以减少排序划分增益Cst 2(r1st(j))/Gst 2(r1st(j))0<j<jst,以便仅保留产生增益最大值的jst延迟。在设想的查寻LTP延迟的有效性和复杂性的折衷方案的基础上,选择jmax值。jmax的典型值范围从3到5。
一旦子多路复用和多路复用已被检查,且已获得表Ist(图3),分析模块36计算确定整个帧上的长期预测增益和一个第二开环回路的分量Ymax,和在相位132中的索引ZP.ZP0和ZP1一样,这个过程详见图6。这个相位132在测试长度N1的查寻间隔,以确定最大化帧上的全局预测增益的一个第二估计值的那个查寻间隔。测试的间隔是那些中心包含在相位101期间计算的表Ist中的候选延迟。相位132以表Ist中的地址j初始化为0的阶段136开始。在阶段138,检测索引Ist(j),去判断已通过测试中心在Ist’(j’),st’<st且0≤j’<j’st的前面的间隔。已找到它了,这样可以避免两次测试同样的间隔。如果测试138揭示Ist(j)已在表Ist中,st’<st,那么地址j在阶段140直接增大,然后它与表Ist的长度jst作比较。如果比较142显示j<jst,那么地址j的新值重新进入阶段138。当比较142表示j=jst时,那么与表Ist有关的所有间隔都已被测试过了并且相位132被终止。当测试138为负时,在Ist(j)中心的间隔测试,它从阶段148开始,在阶段148中,为每个子帧st’,确定在这个间隔上,最大化的长期预测增益的开环回路估计值pst(ri)的最佳延迟的索引值Ist’,也就是说,最大量值Yst’(i)=Cst’2(ri)/Gst’(ri),其中,ri表示索引i的量化延迟,Ist(j)-N1/2≤i<Ist(j)+N1/2且0≤i<n。在与子帧st’相关的最大化过程148期间,为了避免降低编码,那些自相关Cst’(ri)为负的索引i被放到旁边。如果发现所有位于测试间隔[I(j)-N1/2,I(j)+N1/2]的值i变为负的自相关Cst’(ri),那么选择自相关在绝对值上最小的索引Ist’。下面在150中,根据
计算确定在Ist(j)中心间隔的全部预测增益的第二估计值的量Y,然后,与Ymax比较,其中,Ymax表示最大值。例如,值Ymax在与阶段96上索引st相同时间上,初始化为0。如果Y≤Ymax,那么直接进入增大索引值j的阶段140。如果比较150表示Y>Ymax,在阶段140中增加地址j之前,执行阶段152。在这个阶段152,索引ZP被置为Ist(j),并且索引ZP0和ZP1分别等于阶段148确定的索引Ist’的最小和最大值。
在与子帧st相关的相位132的尾部,索引st被增大一个单元(阶段154),然后,在阶段156,与每帧的子帧的值nst相比较。如果st<nst,那么重新输入阶段98执行与下列子帧有关的操作。当比较156表示为st=nst时,这个索引ZP表示将提供给闭环回路LTP分析模块38的查寻间隔的中心,ZP0和ZP1是索引,索引间的差值是在ZP中心的间隔内,每子帧的最优延迟上的离差特征。
在阶段158,模块36在以分贝表示的增益的第二开环回路估计值:Gp=20·log10(R0/R0-Ymax)的基础上,确定话音等级MV。其他两个门限S1和S2也被用到。如果Gp≤S1,那么话音等级MV对当前帧置为1。例如,这个门限值典型地位于3到5dB之间S1=4dB。如果S1<Gp<S2,那么话音等级MV对当前帧置为2。例如,门限值S2典型地位于5和8dB之间,S2=7dB如果Gp>S2,那么检查当前帧的不同子帧的最优延迟的离差。如果ZP1-ZP<N3/2和ZP-ZP0≤N3/2,那么在ZP中心的长度N3的间隔要考虑所有的最优延迟,并把话音调音等级置为3(若Gp>S2)。
对于话音调音帧的预测延迟查寻间隔中心的索引ZP可能位于0到N-1=255之间,并对模块38确定差分索引DP可能的范围,若在MV=1或2时,是在-16到+15之间,若在MV=3(N1=32,N2=16的情况时),是在-8和-7之间。因此,最终确定的延迟Tp的索引ZP+DP,在某种情况下,可以比0更小或比255大。这些允许闭环回路LTP分析在比rmin小或比rmax大的几个延迟TP上相等的范围。这样称为变态话音和非声音信号(由交换电话网使用的DTMF话音频率和信号频率)的再生的主观质量被增高了。另一种可能性是对查寻间隔,若在MV=1或2时ZP<16或ZP>240,则取值延迟的第一个或最后的一个32量化索引,若在MV=3时ZP<8或ZP>240,那么取值第1个或最后的16个索引。
对于特殊话音帧减小延迟查寻间隔(典型地用MV=3的值16代替MV=1或2的值32)这个实际情况,根据公式(1)通过减少的要计算的卷积YT(i)的数量,有可能减少由模块38执行的闭环回路路LTP分析的复杂性。另一个优点是保存差分索引DP的一个编码位。当输出数据速率是一个常量时,这些位可以重新分配给其它参数的编码。特别是,可以分配这个补充位用于数量化由模块40计算的长期预测增益gp。事实上,因为这个参数对特殊的语音子帧(MV=3)是具有感知的重要性,通过附加数值化位的有效在增益gp上具有更高精确度是可感知的。另一个可能性是提供给延迟和/或增益gp一个奇偶位,它可以检测出任何影响这些参数的误差。
参照图3至6,可以对上面描述的开环回路LTP分析过程做一个修改。
根据这个过程的第一个改变,在与不同子帧有关的阶段90执行的第一最优条件被一个覆盖全帧的一个单个最优条件所代替。除了在为每个子帧st计算参数Cst(k)和Gst(k)之外,自相关C(k)和延迟能量G(k)也为整个帧进行计算:
然后,为基本延迟确定具有rmin≤K≤rmax的X(k)=C2(k)/G(k)最大值的整数分解率K。阶段92中在S0比较的增益的第一估计值是P(k)=20·log10〔R0/[R0-X(k)]〕。下一个单独基本延迟被确定在小数分解率rbf的k值附近,子多路复用和多路复用的检查101再次被执行,并产生代替nst表Ist的一个单独表I。相位132仅识别在阶段148、150和152的子帧,而且对此表1执行一个单独时间。这个变化的实施例具有减少开环回路分析复杂性的优点。
根据开环回路LTP分析过程的第二个变化,例如,可能的延迟域[rmin,rmax]被划分成nz子间隔,它具有相同的长度(典型的nZ=3),在与不同子帧有关的阶段90执行的第一优化条件被替换为每个都覆盖全部帧的不同的子间隔中nz优化条件。这样,以整数分解率获得nz基本延迟K’1,…K’nz。在产生长期预测增益的第一开环回路估计值的最大值的基本延迟K’i之一的基础上,做出话音/非话音的决定(阶段92)。下一步,如果此帧是话音,基本延迟用与阶段100相同的过程,用小数分解率确定,但是仅允许延迟的量化值。不执行子多路复用和多路复用的检查101。对于预测增益的第二估计值计算的相位132,前面确定的nz基本延迟作为候选延迟。这个第二变化可能配有通常具有可能延迟域的子分割优点的子多路复用和多路复用的有规则的检查。
根据开环回路LTP分析处理过程的第三个变化,把相位132修改为:在最优条件阶段148,一方面索引值Ist’被确定为Cst’(ri)/Gst’(ri)的最大值,Ist(j)-N1/2≤i<Ist(j)+N1/2且0≤j≤N,另一方面,在同样的最大环路过程中,索引Kst’在一个减少的间隔Ist(j)-N3/2≤i<Ist(j)+N3/2上的最大化这个相同数量。阶段152也修改为:索引ZP0和ZP1不再存贮在存储器中,但是数量Ymax’参照减少长度间隔
用与Ymax相同的方法定义。
在这个第三变化中,话音模式的确定158更多地导致选择话音等级MV=3。除了在前面描述的增益GP之外,还考虑到了LTP增益的一个第三开环回路估计值,对应Ymax’:GP’=20·log10[R0/R0-Ymax’]。如果GP≤S1,那么话音等级为MV=1;若GP>S2,则MV=3;若两个条件都满足,则MV=2。这样,通过增加等级MV=3帧的比例,减少了闭环回路分析的平均复杂性,且增强了传输误差的健状性。
开环回路LTP分析过程的第四个变化特别是涉及到轻微的话音帧(MV=1)。这些帧经常对应于一个话音区域的开始和结束。因此,这些帧可以频繁地包括从一到三子帧之间,对这些子帧,长期综合滤波器的增益系数为零或为正。建议不对有问题的子帧执行闭环回路LTP分析,以便减少编码的平均复杂性。可以通过在图6的阶段152存贮在存储器中nst指针来实现,nst指针为每个子帧st’指示根据索引Ist’的延迟的自相关Cst’是否为负或更小。一旦在表Ist’中已经有了许多间隔的参考,对于预测增益为负或可忽略不计,子帧可以通过查找nst指针来标识。如果合适,模块38对相应的子帧是不能使用模块38。由于对应这些子帧的预测增益将处于实际为0的情况,这些并没有影响LTP分析的质量。
本发明的另一个观点是关于模块42,它计算加权综合滤波器的脉冲响应。为了计算根据公式(1)的卷积YT(i),闭环回路LTP分析模块38在一个子帧期间需要这个脉冲响应h。为了计算如后面所示的卷积,随机分析模块40也需要它。需要计算与一个子帧期间(典型地,Ist=40)扩展的响应h的卷积的事实,这意味着需要减少相对编码复杂性,特别是,为了增加移动站的寿命。在某种情况下,已经建议把脉冲响应缩短到一个子帧的长度(例如,到20个采样),但是这可能降低编码的质量。根据本发明,建议通过一方面考虑缩短这个脉冲响应h,另一方面,考虑由开环回路LTP分析模块36确定的有问题帧的话音等级M,缩短这个脉冲响应h的能量分布。
例如,由模块42执行的操作对应的图7的流图。脉冲响应是在比子帧长度大的长度pst的阶段160上计算的所有值中的第一个,并且这个响应具有足够长度,确信所有脉冲响应能量的考虑(例如,如果短期线性预测是阶q=10,那么,对于nst=4和Ist=40,pst=60)。脉冲响应缩短的能量在阶段160也可以计算出来:
通过用具有传递函数W(z)/A(z)的一个滤波器的方法,以零初始状态或者甚至是递归,通过滤一个单元脉冲可以获得脉冲响应成份h(i)和缩短的能量Eh(i)。 Eh(i)=Eh(i-1)+[h(i)]2
其中,0<i<pst,对i<0时,f(i)=h(i)=0;对i≠0时,δ(o)=f(o)=h(o)=Eh(o)=1和δ(i)=0。在表达式(2)中,系数ak是包括在感性加权滤波器中的系数,也就是说被插入的倒是非量化的线性预测系数。而在表达式(3)中,系数ak是用于综合滤波器的系数,也就是量化和插入的线性预测系数。
接着,模块42确定最小长度Lα,以便使缩短到Lα采样的脉冲响应的能量Eh(lα-1)至少等于在pst采样上估计的总能量Eh(pst-1)的一个比例α。α的一个典型值是98%。尽管Eh(Lα-2)>α·Eh(pst-1)(测试164),在阶段162,数字Lα初始化为pst,并在166减去一个单元。当测试表示Eh(Lα-2)≤α·Eh(pst-1)时,获取查寻的长度Lα。
为了考虑话音等级MV,一个校正器项Δ(MV)被加到已获得的Lα值中(阶段168)。校正器项是优选的话音等级的扩大函数。例如,可以取值为:如Δ(0)=-5,Δ(1)=0,Δ(2)=+5,并且Δ(3)=+7。在这个方法中,脉冲响应h会更精确的确定语音的话音等级。若Lα≤nst则这个脉冲响应的缩短长度Lh等于Lα,否则,就等于nst。可以删去脉冲响应的剩余采样(h(i)=0,i>Lh)。
随着脉冲响应的缩短,用下列方法:
修改来自闭环回路LTP分析模块38的卷积YT(i)的计算。
获得的这些卷积和这些卷积表示执行运算的一个有效的部分,因此,需要重要部分的n个的多路复用和附加成分,并且当脉冲响应被缩短时,在自适应的码本中的寻址。产生话音等级MV的脉冲响应的动态缩短可能在不影响编码质量的情况下,获得在复杂性上的减小。同样考虑用于由随机分析模块40执行的卷积的计算。这些优点是特别明显的,当感知加权滤波器具有公式W(z)=A(z/γ1)/A(z/γ2)的传递函数时,其中o<γ2<γ1<1,这个函数产生比通常的综合分析编码器的公式W(z)=A(z)/A(z/γ)的脉冲响应大的脉冲响应。
本发明的第三个方面是关于随机分析模块40,它服务于模块化激励的非预测部分。
这里考虑的随机激励是多脉冲类型。与子帧有关的这个随机激励由具有位置p(n)的np脉冲和振幅或增益g(n)表示(1≤n≤np)。长期预测增益gp也可以在同样的处理过程中计算。通常,可以认为与子帧有关的激励序列包括分别与nc增益相关的nc影响。这些影响是由相关的和总的增益加权的Ist取样矢量,对应短期综合滤波器的激励序列。影响之一是可预测的,或者在长期综合滤波器具有几个抽头(“多抽头音调综合滤波器”)的情况下的几个。在此情况下,其他的影响是除了振幅为1的脉冲之外,仅包括o’s的np矢量。因此,若MV=0则nc=np,若MV=0,则nc=np,若MV=1,2或3,nc=np+1。
包括增益gp=g(o)计算的多脉冲分析是用一种已知的方法,对每个子帧,查找具有在语音信号和合成信号之间的最小感知加权平方误差E的位置p(n)(1≤n≤np),以及增益g(n)(1≤n≤np),由下式给出:
这些增益是线性系统g·B=b的一个解法。
在上面的符号中:
-X表示一个初始的目标矢量,它包括不在存储器中的加权语音信号SW的Ist采样:X=(X(0),X(1),…,X(Ist-1)),X(i)’S已在闭环回路分析期间,如前面描述的那样被计算出来了;
-g表示np+1个增益组成的行矢量,g=(g(0)=gp,g(1),…,g(np));
-行矢量Fp(n)(0≤n<nc)有加权影响,这个加权影响,如成份i(0≤i≤Ist),在激励序列的影响n与加权综合滤波器的脉冲响应h之间的卷积的结果;
-b表示行矢量,它由矢量X和行矢量Fp(n)间的nc标量结果组成;
-B表示具有nc行和nc列的一个对称矩阵,在这个矩阵中,项Bi.j=Fp(i)·Fp(j)T(0≤i,j≤nc)等于前面定义的Fp(i)和Fp(j)的标量结果;
-(·)T表示矩阵置换。
对于随机的激励的脉冲(1≤n≤np=nc-1),这个矢量Fp(n)简单地包括由P(n)采样偏移的脉冲响应h的矢量组成。上面描述的缩短脉冲响应的事实可能实际上减少了用于计算包含这些矢量Fp(n)的标量结果的操作量。对于激励的预测影响,矢量Fp(0)=YTP具有如成份Fp(0)(i)(0≤i≤Ist),根据公式(1)或(1’),模块38为选择长期预测延迟Tp计算的卷积YTP(i),若MV=0,影响n=0也是脉冲类型,并且将要计算位置P(0)。
上面定义的量小化的平方误差E相当于查找最大化的正常化的相互关系b.B-1·bT的位置集合,然后,根据g=b·B-1计算增益。
但是,对脉冲位置精确的查寻要求非常大的计算量。为了减少这个问题,多脉冲方法通常使一个近于最佳过程,这个过程是为每个影响连续地计算增益和/或脉冲位置。对于每个影响n(0≤n≤nc),确定所有位置P(n)的第一个是正常化的相互关系(Fp·Cn-1T)2/Fp·FpT最大的一个。增益gn(o)到gn(n)根据gn=bn·Bn -1被重新计算,其中gn=gn(0),…,gn(n),bn=(b(o),…,b(n))且Bn={Bi,j}i≤i,j≤n。然后,为下面的迭代,计算目标矢量en,相当于初始化目标矢量X减去由他们的各自增益多路复用加权综合信号的影响0到n:
在完成最后一个迭代nc-1时,增益gnc-1(i)是被选择的增益,并且最小平方误差E等于目标矢量的能量Cnc-1。
上面的方法给出满意的结果,但是它在每次迭代时,要求矩阵Bn反转。在他们的论文“多脉冲编码器中振幅最佳化和音调预测”(IEEETrans,声学,语音,信号处理,卷37,3期,1989年5月,317-327页),S.Singhal和B.S-Atal建议通过使用Cholesky分解:Bn=Mn·MnT,简化Bn矩阵反转问题,在上述分解中,Mn为一个比较低级的三角矩阵。因为Bn是具有正数特征值的对称矩阵,所以这个分解具有可能性。这种方法的优点是三角矩阵的反转是相对简单,Bn-1可以由Bn-1=(Mn-1)T·Mn-1获得。
但是Cholesky分解和矩阵Mn的反转要求执行分割和平方根计算,它需要复杂的计算操作。本发明建议通过用下列方法:
Bn=LnRn T=Ln(Ln·Kn -1)T
修改矩阵Bn的分解,简化最优化的实施。其中,Kn是一个对角矩阵,Ln是仅在它的主对角线上具有I’S的一个下三角矩阵(例如,用前面的符号,Ln=MnKn 1/2)。关于矩阵Bn的结构,矩阵Ln=Rn·Kn,Rn,Kn和Ln -1每个都是通过把一行简单地加到相应的前面迭代的矩阵来构成的。
在这种条件下,Bn的分解,Ln的反转,Bn -1=Kn·(Ln -1)T·Ln -1的获取和增益的重新计算,每闪迭代仅需要一个单独的分割且不需要平方根计算。
与一个话音帧(MV=1,2,或3)的一个子帧有关的随机分析,此刻可以如图8到11表示处理。为计算长期预测增益,影响索引n在阶段180被初始化为0,并且矢量Fp(0)置为由模块38提供的长期影响YTP若n>0,迭代n从脉冲n的位置P(n)的测定182开始,脉冲n的最大限度量:
其中,e=(e(0)…e(Ist-1))是在前一次迭代期间计算的一个目标矢量。不同抑制条件可以用于包含在间隔[0,Ist]中的上述量的最大限度区域。本发明优选使用一个把激励子帧分割成同样长度的ns段(如Ist=40,ns=10)的一个段查寻。对于第一个脉冲(n=1),在子帧中所有可能的位置P上执行(Fp/eT)2/Fp·FpT)的最大限度。在一个迭代n>1,在阶段182中,除了前面迭代期间,分别建立脉冲的位置P(1)……P(n-1)的段之外,在所有可能的位置上执行最大化。
在当前帧已作为非话音被检测出来的情况下,影响n=0也由位置P(0)的脉冲组成。然后阶段180仅包括初始化n=0,其后是与阶段182相同的最大化阶段,它以e=e-1=x作为目标矢量初始值查找P(0)。
需要注意的是:当影响n=0是可预测时(MV=1,2,或3),因为它通过延迟特征化已经确定长期影响,所以闭环回路LTP分析模块38已经执行了与最大化182相同类型的操作,并通过以e=e-1=x作为目标矢量初始值,最大化在延迟T查寻间隔内的量(YT·eT)2/(YT·YT T)。当影响LTP的能量很低时,也可能在重新计算增益的过程中,忽略这个影响。
在阶段180或182之后,模块40执行包括在短阵B分解中的矩阵L,R和K的行n的计算184,它使完成上面定义的矩阵Ln,Rn和Kn成为可能。矩阵B分解为位于行n和列j的成分产生。 然后可能是对j从0增大到n-1:
L(n,j)=R(n,j).K(j)对j=n: L(n,n)=1
这些关系用于图9的详细计算184中。在阶段186,列索引j首先初始化为0。对于列索31j,变量tmp首先初始化为成份B(n,j)的值,例如:
tmp=Fp(n)·Fp(j) T
在阶段188,整数k被另外初始化为0。然后,比较190在整数k和j之间执行比较。若K>j,则把L(n,k)·R(j,k)项加到变量tmp,然后整数k在再次执行比较190之前,增加一个单元(阶段192)。当比较190表示k=j时,在整数j和n之间执行比较194。若j<n,在阶段196成份R(n,j)等于tmp,并且成份L(n,j)等于tmp·K(j),然后列索引j在为了计算下面的成份返回阶段188之前,增加一个单元。当比较194表示j=n时,计算矩阵K的行n的成分K(n),它终止与行n有关的计算184。如果tmp≠0(阶段198)时K(n)置为1/tmp,否则被置为0。注意:为获得K(n),计算184至多仅要求1次除法198。另外,因为避免被0除,任何一个单独的矩阵Bn不会是卷入稳定。
参照图8,L,R,K的行n的计算之后是包含矩阵L的0到n和才列的矩阵Ln的反转200。L是在主对角线上具有I’S的三角形的事实大大地简化了如图10所示的反转。实际上,它可能的状态为:
对0≤j≤n且L-1(n,n)=1,也就是说,反转不是必须执行除法就可以执行。另外,当L-1的行n的成份满足对重新计算增益的需要,使用关系(5)就有可能在不需存储整个矩阵L-1,而只存储一个矢量Linv=(LinV(0),…Linv(n-1)),在Linv(j’)=L-1(n·j’)的情况下执行转换。然后,转换200以列索引j’到n-1的从恢复202开始。在阶段204中,Linv(j’)项被初始化为-L(n,j’),且整数k’被初始化为j’+1。下一个比较206在整数K’和n之间执行的。若K’<n,则从Linv(j’)减去项L(K’,j’)·Linv(K’),然后,整数K在再次执行比较206之前,增大一个单元。当比较206表示K’=n,j’时与0相比较(测试210)。若j’>0,则整数j’减小一个单元(阶段212)并且阶段204为计算下列成份再次进入阶段204。当测试210表示j’=0时,终止转置。
参照图8,反转200之后是通过重新最优化增益和对一个迭代目标矢量E的计算214。重新最优化的增益计算也由矩阵B采纳的分解大大简化了。因为它可以计算矢量gn=(gn(0),…gn(n)),gn·Bn=bn的解法是根据:
且gn(i’)=gn-1(i’)+L-1(n,i’)·gn(n),0≤i≤n。计算214详见图11。首先,矢量b的成份b(n)的计算:
b(n)作为变量tmp的恢复值。在阶段216,索引i也被初始化为0。下一个比较218在整数i和n之间执行。若i<n,则把项b(i)·Linv(i)加到变量tmq中,且在返回到比较218之前i增大一个单元(阶段220)。当比较218表示i=n时,与影响n有关的增益根据g(n)=tmq·K(n),并且用e=X-g(n)·Fp(n)和i’=0初始化用于计算其它增益的环路和目标矢量。这个环路包括在整数i’和n之间的比较224。若i’<n,则通过把Linv(i’)·g(n)加到它在迭代n-1之上计算的值中,在阶段226,增益g(i’)被重新计算,然后,从目标矢量已减去矢量g(i’).Fp(i’),阶段226还包括在返回比较224之前的索引i’的增大。当比较224表示i’=n时,终止增益和目标矢量的计算214。可以看出,当仅在反转矩阵Ln-1的行n上调用时,可以更新这个增益。
计算214之后是影响的索引n通过增加228,然后是索引n和影响nc量之间的比较230。若n<nc,则为下一轮迭代重新进入阶段182。当在测试230中n=nc时,终止位置和增益的最优化。
对这个脉冲的段查寻实际上减少了在随机激励查寻阶段182的过程中估计的脉冲位置量。另外,它允许发现位置的有效定量。在1S=40采样的子帧被分割为1S=4采样的ns=10段的特殊情况下,可能的脉冲位置集合可以取得ns!,若np=5(MV=1,2,3)可取值ns!·1snp/[np!(ns-np)!]=258,048;若np=6(MV=0),取值860,160,它替代了在仅特指在两个脉冲本不可能具有同一位置的情况下,若np=5,则取值Ist!/[np!(Ist-np)!]=658,008,或者若np=6时,取值3,838,380。换句话说,如果np=5,位置可以将原来以20位量化代之以18位量化;若np=6,则可将原来以22位量化代之以20位量化。
每个子帧段量等于每个随机激励脉冲量的特殊情况(ns=np),导致了最简化的随机激励查寻,与最低的二进制数速率一样(若Ist=40和np=5,则那里存在85=32768个可能位置的集合,如果ns=10时仅在15位上进行量化,而不是在18位上量化)。但是,通过减少这一点可能创新的序列量,可能会使编码质量降低。对于一个给定的脉冲数量,可以根据编码质量和它的执行的简便性之间设想的折衷方法(与它要求的数据速率一样)优化段的数量。
就脉冲位置而言,通过占用段的次序号和每个占用段的脉冲相对位置的分别量化的优点,可以获得ns>np展示的对传输误差具有很强的健状性的优点。对一个脉冲n,段的次邓号Sn和相对位置Prn分别是用一个段的长度1S进行的P(n)的欧几里德除法的商数和余数:P(n)=Sn·1S+Prn(0≤Sn≤ns,0≤Prn<1S)。若1S=4,则每个相对位置都分别以2位量化。如果发生传输误差影响其中的一位,相应的脉冲仅会发生轻微的偏移,将会限制误差的感知影响。占有段的次序号用一个ns=10位的一个二进制字标识,它对占用段的每个值为1,且对随机激励无脉冲的段置为0。可能的二进制字是具有一个np的海明负荷;若n=5,则他们的编号为ns!/[np!(ns-np)!]=252,或者若n=6则为210。这个二进制字可以用满足2nb-1<ns!(ns-np)!≤2nb的nb位的索引来量化,在分析的例子中,nb=8。例如,如果随机分析已经把np=5提供给位置4、12、21、34、38,作为标量量化的相对位置是0,0,1,2,2并且表示占用段的二进制字是0101010011或者翻译成十进制为339。
对于译码器,可能的二进制字被存储在读取地址是接收的量化索引的一个是量化表中。在彻底地确定的表的次序可以被最优化,以便根据一个近似判别式,影响一位索引的传输误差(特别是当隔行扫描用于信道编码器22时,最高的频率误差情况)平均具有最小的序列。例如,近似判别式是一个ns位的字,可以仅由“邻近”位来替换,由至多等于一个门限值np-2δ的海明距离分离,以便在影响一个单独位的索引的传输中的误差事件中,保留除以有效位置的脉冲δ之外的所有脉冲。其它判别式可以用于替换式增补中,例如,如果一个字替换另一个不更改对应脉冲的增益的指定次序,这两个字被认为是邻近的。
通过说明的方法,简化的情况可以认为ns=4和np=2,例如,在nb=3位上量化的6个可能的二进制字。在这种情况下,可以检验在表II中的量化表允许np-1=1,它对传送索引的每个误差影响一位保持正确的位置脉冲。存在4个误差情况(18个总量之外),对于那些量化索引已经知道被错误的接收(用6代替2或4;用7代替3或5),但是,译码器可以测量限制的畸变,例如可以重复与前面子帧相关的创新序列,或者甚至把可采用的二进制字分配给“不存在的”索引(例如,对于索引6是1001或1010、对于索引7是1100或0110,在接收具有一个二进制误差的6或7的事件中,再次使用np-1=1正确地位置脉冲)。
在通常情况下,在运算的基础上考虑,或者,如果它是不能胜任的,通过在计算机上模拟误差现场(精密地或通过依赖于可能误差情况的数量的蒙特卡罗类型的一个统计采样)。
为了使占用段的量化索引更可靠,特别是,如果近似准则不可能满意地用于所有可能影响一位索引的误差情况,可以具有由信道编码22提供的不同的保护类型的优点,这样,排序模块46可以放在最小保护分类或非保护分类中,索引的某些量hx位,如果它们由传送误差影响,这个索引产生一个有错但又满足具有被认为是满足可能的近惟准则的一个字,并且,排序模块46还把索引的其它位放置在一个更好的保护类型中。这个方法包括在量化表中的字的另一个排序。如果要求最大化分配给最少的保护的类型的索引的位的数量nx,这个排序也可以通过模拟的方法进行优化。
表II
量化索引 | 段占用字 | ||
十进制 | 自然二进制 | 自然二进制 | 十进制 |
0 | 000 | 0011 | 3 |
1 | 001 | 0101 | 5 |
2 | 010 | 1001 | 9 |
3 | 011 | 1100 | 12 |
4 | 100 | 1010 | 10 |
5 | 101 | 0110 | 6 |
(6) | (110) | (100或1010) | (9或10) |
(7) | (111) | (1100或0110) | (12或6) |
一种可能性是通过编译由从0到2ns-1的格雷码计算的ns位的一个字表开始,通过从不具有np的一个海明加权的词表中删除获取排序的量化表。如果这个表中的索引具有用格雷码的二进制表征,在最不重要位中的任何误差使索引产生±1的变化,并且,必须由在海明距离上这个门限np-2的有意义的邻近的一个字,替换实际的占用字。在第i个最不重要位的误差也有大约21-i的可能性,使索引产生±1变化。通过在一个非保护类型的格雷码中放置索引的这个nx最不重要数字位,任何传输误差影响这些位中的一个将导致由至少等于(1+1/2+…+1/2nx-1)/nx的一个可能的邻近字替换这个占用字。对从1增大到nb的nx,最小概率是从1降到(2/nb)(1·1/2nb)。影响索引的nb·nx的最重要数字位的误差通常依靠用它的信道编码保护来纠正误差。在这种情况下的nx值排选在误差的健状性(小值)和保护类型的有限尺寸(大值)之间的折衷方案。
就编码器而论,可能用于表示段占用的二进制字以增序排列在表中。存贮在译码器的量化表中的一个索引表,为每个地址分配查找表中具有此地址的二进制字的次序号。在上面开始的简化例中,查找表和索引表的内容在表III中给出(以十进制值)。
从随机分析模块40提供的np位置推演的段占用字的量化,由量化模块44在两个阶段中执行。为了确定要量化学的表中的地址,首先在所有的检查表中执行二进制查寻。以提供给位排序模块46的索引表中的定义地址,然后获得量化索引。
表III地址 检查表 索引表0 3 01 5 12 6 53 9 24 10 45 12 3
另外,模块44执行由模块40计算的增益的量化。为了考虑对高话音帧的这个参数的更高的感知重要性,增益gTP被量化,例如,在间隔[0,1.6],若MV=1或2,以59位量化,若MV=3,以6位量化。对于分配随机激励脉冲的增益编码,增益g(1),…g(np)的最大绝对值GS以5位量化,例如,在间隔〔0,32767〕内的几保级数中取32值,并且每个相对增益g(1)/GS,…,g(np)/GS在间〔-1,+1〕内被量化,若MV=1,2或3,以4位量化;如果M=0,则是以5位量化。
GS的量化位由信道编码器22放置在一个保护类型中,作为相关增益的量化索引的最重要数字位。相关增益的量化位用一种允许这些位赋予属于由占用字安排这个段的相应脉冲的方法排序。根据本发明的段查寻还有可能更有效地保护由增益最高值分配脉冲的相对位置。
在np=5和1S=4的情况下,每个子帧的十位需要量化在段中脉冲的相对位置。这个情况被认为是这10位中的5位被放置在一个局部地保护或非保护类型(II),其他5位被放置在一个更高的保护类型(IB)。最自然的分配是放置保护类型IB中的每个相对位置的最重要数字位,以便任何传输误差趋向影响最重要数字位,并因此对相应脉冲仅引起一个取样的一个偏移。但是,对相对位置的量化,在相关的增益的绝对值的降序排列中考虑脉冲,并在类型IB中放置每个第一个两个相对位置的两个量化位和第三个两个相对位置的最重要数字位一样。在这个方法中,当以高增益分配它们时,优先保护这个脉冲的位置,这些增强了平均质量,特别是对大多数话音子帧。
为了重新配置这个激励的脉冲影响,译码器54首先用接收占用字的中间项安排段;它指配这个相关的增益;然后,在增益尺寸的次序基础上,它把相对位置指配这个脉冲。
可以理解上面描述的本发明的每一个不同观点产生特定的改进,并且因此可以彼此间独立地执行它们。结合它们可以产生特定地有益性能的编码器。
在前面描述的说明实施例中,这个13Kbits/s的声码器要求在固定点模式下每秒15兆指令(Mips)。因此,这可以通过使用一个商业化合用的数字信号处理器(DSP)产生这个编码器,并且同样对这个译码器仅要求5MiPS指令。
Claims (5)
1.一种综合分析语音编码方法,用于编码被数字化成连续帧的语音信号,这些帧被分割成包括一定数量取样的子帧,其中,为确定一个短期综合滤波器(60)的系数,对每个帧进行语言信号的线性预测分析;为确定帧的话音等级对每个帧进行开环回路分析;为了确定向短期综合滤波器施加并产生表征语音信号的综合信号的激励序列,对每个子帧进行至少一个闭环回路分析;每个闭环回路分析使用包括一个短期综合滤波器和一个感知加权滤波器组成的复合滤波器的脉冲响应,
其特点在于:在每个闭环回路分析期间,利用上述脉冲响应,把它缩短到一个缩短的长度(Lh),这个缩短的长度至多等于每个子帧采样量(lst),并且依赖于上述响应的能量分布和该帧的话音等级。
2.根据权利要求1的方法,其特征在于:合成滤波器的脉冲响应在比每个子帧采样量(lst)大的一个总长度(pst)上计算;确定最小长度Lα,以便通过缩短对Lα取样的上述响应而计算的脉冲响应的能量至少等于在上述总长度上计算的脉冲响应能量的一个定义的小数部分(α);并且若上述最小长度Lα和依赖该帧话音等级的校正器项(Δ(MV))之和比每子帧取样的量(lst)小,则缩短长度(Lh)就等于这个和。
3.根据权利要求2所述的方法,其特征在于:上述校正器项(Δ(MV))是话音等级的递增函数。
4.根据权利要求1到3中任意任一项所述的方法,其特征在于:感知加权滤波器具有化式W(z)=A(z/γ1)/A(z/γ2)的传递函数,其中,1/A(z)表示短期综合滤波器的传递函数并且γ1和γ2是两个系数,满足0<γ2<γ1<1。
5.根据权利要求4所述的方法,其特征在于:短期合成滤波器的系数是由线状谱参数(LSP)表示;上述线状率参数被量化;为了构成将至少与一个帧的一个子帧有关的激励序列施加给短期综合滤波器,在与上述帧有关的线状谱参数和与该前一帧相关的线状谱参数之间进行插入;为了计算合成滤波器的脉冲响应,在量化和插入的线状谱参数的基础上,计算这个短期综合滤波器,而在被插入的但非量化的线状谱参数的基础上,计算感知加权滤波器。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR9500124A FR2729244B1 (fr) | 1995-01-06 | 1995-01-06 | Procede de codage de parole a analyse par synthese |
FR95/00124 | 1995-01-06 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1173940A true CN1173940A (zh) | 1998-02-18 |
CN1134761C CN1134761C (zh) | 2004-01-14 |
Family
ID=9474923
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB961917954A Expired - Fee Related CN1134761C (zh) | 1995-01-06 | 1996-01-03 | 综合分析语音编码方法 |
Country Status (8)
Country | Link |
---|---|
US (1) | US5899968A (zh) |
EP (2) | EP0801789B1 (zh) |
CN (1) | CN1134761C (zh) |
AT (2) | ATE174147T1 (zh) |
AU (1) | AU4490296A (zh) |
DE (2) | DE69601068T2 (zh) |
FR (1) | FR2729244B1 (zh) |
WO (1) | WO1996021219A1 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101320565B (zh) * | 2007-06-08 | 2011-05-11 | 华为技术有限公司 | 感知加权滤波方法及感知加权滤波器 |
CN105513602A (zh) * | 2011-04-21 | 2016-04-20 | 三星电子株式会社 | 用于语音信号或音频信号的解码设备和方法及量化设备 |
US10224051B2 (en) | 2011-04-21 | 2019-03-05 | Samsung Electronics Co., Ltd. | Apparatus for quantizing linear predictive coding coefficients, sound encoding apparatus, apparatus for de-quantizing linear predictive coding coefficients, sound decoding apparatus, and electronic device therefore |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FI955266A (fi) * | 1995-11-02 | 1997-05-03 | Nokia Telecommunications Oy | Menetelmä ja laitteisto viestien välittämiseksi tietoliikennejärjestelmässä |
JP3134817B2 (ja) * | 1997-07-11 | 2001-02-13 | 日本電気株式会社 | 音声符号化復号装置 |
WO1999041737A1 (en) * | 1998-02-17 | 1999-08-19 | Motorola Inc. | Method and apparatus for high speed determination of an optimum vector in a fixed codebook |
US6810377B1 (en) * | 1998-06-19 | 2004-10-26 | Comsat Corporation | Lost frame recovery techniques for parametric, LPC-based speech coding systems |
US6453289B1 (en) | 1998-07-24 | 2002-09-17 | Hughes Electronics Corporation | Method of noise reduction for speech codecs |
US6480822B2 (en) | 1998-08-24 | 2002-11-12 | Conexant Systems, Inc. | Low complexity random codebook structure |
US6493665B1 (en) * | 1998-08-24 | 2002-12-10 | Conexant Systems, Inc. | Speech classification and parameter weighting used in codebook search |
US6823303B1 (en) * | 1998-08-24 | 2004-11-23 | Conexant Systems, Inc. | Speech encoder using voice activity detection in coding noise |
US6192335B1 (en) * | 1998-09-01 | 2001-02-20 | Telefonaktieboiaget Lm Ericsson (Publ) | Adaptive combining of multi-mode coding for voiced speech and noise-like signals |
JP3372908B2 (ja) * | 1999-09-17 | 2003-02-04 | エヌイーシーマイクロシステム株式会社 | マルチパルス探索処理方法と音声符号化装置 |
JP4367808B2 (ja) * | 1999-12-03 | 2009-11-18 | 富士通株式会社 | 音声データ圧縮・解凍装置及び方法 |
US6842733B1 (en) | 2000-09-15 | 2005-01-11 | Mindspeed Technologies, Inc. | Signal processing system for filtering spectral content of a signal for speech coding |
US6850884B2 (en) * | 2000-09-15 | 2005-02-01 | Mindspeed Technologies, Inc. | Selection of coding parameters based on spectral content of a speech signal |
US7047188B2 (en) * | 2002-11-08 | 2006-05-16 | Motorola, Inc. | Method and apparatus for improvement coding of the subframe gain in a speech coding system |
US9626982B2 (en) * | 2011-02-15 | 2017-04-18 | Voiceage Corporation | Device and method for quantizing the gains of the adaptive and fixed contributions of the excitation in a CELP codec |
US9208134B2 (en) * | 2012-01-10 | 2015-12-08 | King Abdulaziz City For Science And Technology | Methods and systems for tokenizing multilingual textual documents |
Family Cites Families (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
NL8302985A (nl) * | 1983-08-26 | 1985-03-18 | Philips Nv | Multipulse excitatie lineair predictieve spraakcodeerder. |
CA1223365A (en) * | 1984-02-02 | 1987-06-23 | Shigeru Ono | Method and apparatus for speech coding |
NL8500843A (nl) * | 1985-03-22 | 1986-10-16 | Koninkl Philips Electronics Nv | Multipuls-excitatie lineair-predictieve spraakcoder. |
US4831624A (en) * | 1987-06-04 | 1989-05-16 | Motorola, Inc. | Error detection method for sub-band coding |
US4802171A (en) * | 1987-06-04 | 1989-01-31 | Motorola, Inc. | Method for error correction in digitally encoded speech |
CA1337217C (en) * | 1987-08-28 | 1995-10-03 | Daniel Kenneth Freeman | Speech coding |
DE3879664D1 (de) * | 1988-01-05 | 1993-04-29 | British Telecomm | Sprachkodierung. |
SE463691B (sv) * | 1989-05-11 | 1991-01-07 | Ericsson Telefon Ab L M | Foerfarande att utplacera excitationspulser foer en lineaerprediktiv kodare (lpc) som arbetar enligt multipulsprincipen |
US5060269A (en) * | 1989-05-18 | 1991-10-22 | General Electric Company | Hybrid switched multi-pulse/stochastic speech coding technique |
US5097508A (en) * | 1989-08-31 | 1992-03-17 | Codex Corporation | Digital speech coder having improved long term lag parameter determination |
WO1991003790A1 (en) * | 1989-09-01 | 1991-03-21 | Motorola, Inc. | Digital speech coder having improved sub-sample resolution long-term predictor |
DE69033011T2 (de) * | 1989-10-17 | 2001-10-04 | Motorola Inc | Digitaler sprachdekodierer unter verwendung einer nachfilterung mit einer reduzierten spektralverzerrung |
US5073940A (en) * | 1989-11-24 | 1991-12-17 | General Electric Company | Method for protecting multi-pulse coders from fading and random pattern bit errors |
US5097507A (en) * | 1989-12-22 | 1992-03-17 | General Electric Company | Fading bit error protection for digital cellular multi-pulse speech coder |
US5265219A (en) * | 1990-06-07 | 1993-11-23 | Motorola, Inc. | Speech encoder using a soft interpolation decision for spectral parameters |
FI98104C (fi) * | 1991-05-20 | 1997-04-10 | Nokia Mobile Phones Ltd | Menetelmä herätevektorin generoimiseksi ja digitaalinen puhekooderi |
WO1993005502A1 (en) * | 1991-09-05 | 1993-03-18 | Motorola, Inc. | Error protection for multimode speech coders |
US5253269A (en) * | 1991-09-05 | 1993-10-12 | Motorola, Inc. | Delta-coded lag information for use in a speech coder |
TW224191B (zh) * | 1992-01-28 | 1994-05-21 | Qualcomm Inc | |
FI95085C (fi) * | 1992-05-11 | 1995-12-11 | Nokia Mobile Phones Ltd | Menetelmä puhesignaalin digitaaliseksi koodaamiseksi sekä puhekooderi menetelmän suorittamiseksi |
US5495555A (en) * | 1992-06-01 | 1996-02-27 | Hughes Aircraft Company | High quality low bit rate celp-based speech codec |
US5317595A (en) * | 1992-06-30 | 1994-05-31 | Nokia Mobile Phones Ltd. | Rapidly adaptable channel equalizer |
IT1264766B1 (it) * | 1993-04-09 | 1996-10-04 | Sip | Codificatore della voce utilizzante tecniche di analisi con un'eccitazione a impulsi. |
-
1995
- 1995-01-06 FR FR9500124A patent/FR2729244B1/fr not_active Expired - Fee Related
-
1996
- 1996-01-03 AT AT96901009T patent/ATE174147T1/de not_active IP Right Cessation
- 1996-01-03 EP EP96901009A patent/EP0801789B1/fr not_active Expired - Lifetime
- 1996-01-03 DE DE69601068T patent/DE69601068T2/de not_active Expired - Fee Related
- 1996-01-03 US US08/860,799 patent/US5899968A/en not_active Expired - Fee Related
- 1996-01-03 AU AU44902/96A patent/AU4490296A/en not_active Abandoned
- 1996-01-03 WO PCT/FR1996/000005 patent/WO1996021219A1/fr active IP Right Grant
- 1996-01-03 CN CNB961917954A patent/CN1134761C/zh not_active Expired - Fee Related
- 1996-01-05 AT AT96400028T patent/ATE183600T1/de not_active IP Right Cessation
- 1996-01-05 DE DE69603755T patent/DE69603755T2/de not_active Expired - Fee Related
- 1996-01-05 EP EP96400028A patent/EP0721180B1/fr not_active Expired - Lifetime
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101320565B (zh) * | 2007-06-08 | 2011-05-11 | 华为技术有限公司 | 感知加权滤波方法及感知加权滤波器 |
CN105513602A (zh) * | 2011-04-21 | 2016-04-20 | 三星电子株式会社 | 用于语音信号或音频信号的解码设备和方法及量化设备 |
US10224051B2 (en) | 2011-04-21 | 2019-03-05 | Samsung Electronics Co., Ltd. | Apparatus for quantizing linear predictive coding coefficients, sound encoding apparatus, apparatus for de-quantizing linear predictive coding coefficients, sound decoding apparatus, and electronic device therefore |
US10229692B2 (en) | 2011-04-21 | 2019-03-12 | Samsung Electronics Co., Ltd. | Method of quantizing linear predictive coding coefficients, sound encoding method, method of de-quantizing linear predictive coding coefficients, sound decoding method, and recording medium and electronic device therefor |
CN105513602B (zh) * | 2011-04-21 | 2019-08-06 | 三星电子株式会社 | 用于语音信号或音频信号的解码设备和方法及量化设备 |
Also Published As
Publication number | Publication date |
---|---|
DE69603755D1 (de) | 1999-09-23 |
EP0801789A1 (fr) | 1997-10-22 |
EP0721180A1 (fr) | 1996-07-10 |
DE69603755T2 (de) | 2000-07-06 |
AU4490296A (en) | 1996-07-24 |
CN1134761C (zh) | 2004-01-14 |
ATE174147T1 (de) | 1998-12-15 |
FR2729244A1 (fr) | 1996-07-12 |
ATE183600T1 (de) | 1999-09-15 |
WO1996021219A1 (fr) | 1996-07-11 |
US5899968A (en) | 1999-05-04 |
FR2729244B1 (fr) | 1997-03-28 |
EP0801789B1 (fr) | 1998-12-02 |
DE69601068T2 (de) | 1999-07-15 |
DE69601068D1 (de) | 1999-01-14 |
EP0721180B1 (fr) | 1999-08-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1173940A (zh) | 综合分析语音编码方法 | |
US8401843B2 (en) | Method and device for coding transition frames in speech signals | |
US8249860B2 (en) | Adaptive sound source vector quantization unit and adaptive sound source vector quantization method | |
US8521519B2 (en) | Adaptive audio signal source vector quantization device and adaptive audio signal source vector quantization method that search for pitch period based on variable resolution | |
CN1173938A (zh) | 综合分析语音编码方法 | |
CN1173939A (zh) | 综合分析的语音编码方法 | |
EP0504627B1 (en) | Speech parameter coding method and apparatus | |
CN1121683C (zh) | 语音编码 | |
US8452590B2 (en) | Fixed codebook searching apparatus and fixed codebook searching method | |
US20100185442A1 (en) | Adaptive sound source vector quantizing device and adaptive sound source vector quantizing method | |
US8200483B2 (en) | Adaptive sound source vector quantization device, adaptive sound source vector inverse quantization device, and method thereof | |
US6470310B1 (en) | Method and system for speech encoding involving analyzing search range for current period according to length of preceding pitch period | |
KR100510399B1 (ko) | 고정 코드북내의 최적 벡터의 고속 결정 방법 및 장치 | |
JP3194930B2 (ja) | 音声符号化装置 | |
EP0910063B1 (en) | Speech parameter coding method | |
Görtz | On the combination of redundant and zero-redundant channel error detection in CELP speech-coding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C19 | Lapse of patent right due to non-payment of the annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |