CN1120472C - 矢量搜索方法 - Google Patents
矢量搜索方法 Download PDFInfo
- Publication number
- CN1120472C CN1120472C CN98109402A CN98109402A CN1120472C CN 1120472 C CN1120472 C CN 1120472C CN 98109402 A CN98109402 A CN 98109402A CN 98109402 A CN98109402 A CN 98109402A CN 1120472 C CN1120472 C CN 1120472C
- Authority
- CN
- China
- Prior art keywords
- vector
- code
- gray code
- marker word
- code book
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 239000013598 vector Substances 0.000 title claims abstract description 169
- 238000000034 method Methods 0.000 title claims description 21
- 239000003550 marker Substances 0.000 claims description 21
- 230000015572 biosynthetic process Effects 0.000 claims description 16
- 238000003786 synthesis reaction Methods 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000013139 quantization Methods 0.000 abstract description 11
- 230000003044 adaptive effect Effects 0.000 description 22
- 230000005236 sound signal Effects 0.000 description 14
- 230000035807 sensation Effects 0.000 description 11
- 239000002131 composite material Substances 0.000 description 8
- 230000005540 biological transmission Effects 0.000 description 3
- 230000000052 comparative effect Effects 0.000 description 3
- 238000006467 substitution reaction Methods 0.000 description 3
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 230000000737 periodic effect Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 239000003638 chemical reducing agent Substances 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
- G10L19/135—Vector sum excited linear prediction [VSELP]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明在对一个声音信号或类似信号进行编码时简化了矢量量化中的代码簿搜索,提高了矢量搜索速度。在符号添加器(270)中,将噪声代码簿(260)中的M个基础矢量中的每一个乘以一个系数±1,并且在加法器(280)中将其合成以产生2M个噪声标记矢量。在这里如下面这样使用格雷编码的特征。在基于二进制格雷编码的标记字i的噪声标记矢量用基于紧邻标记字i而仅在预定的V位置与标记字i不同的标记字u的噪声标记矢量之间得到变化量ΔGu,并以这样的方式使用变化量ΔGu,利用标记字u’与标记字u仅在除V位以外的W位不同的事实,用紧挨着在格雷编码列上的反V位的标记字u’能够表现一个从噪声标记矢量的变化量ΔGu’。这样,简化了计算,提高了矢量搜索速度。
Description
本发明涉及一种矢量搜索方法,它在对一个声音信号和一个声学信号进行压缩以编码的矢量量化中获得最佳的声源矢量。
通过利用时域和频域的统计特征以及听觉特性来压缩声音信号和声学信号的多种编码方法正为人所知。这些编码方法可以分为时域编码,频域编码,分析-合成编码及其它。
作为用于压缩以对声音信号或其它类似信号进行编码的有效的编码方法,已知一种正弦波分析编码,诸如谐波编码以及多频带激励编码(MBE)以及部分波频编码(SBC),线性预测编码(LPC),离散余弦变换(DCT),经调制的DCT(MDCT),快速付立叶变换(FFT),以及其它类似的方法。
当对一个声音信号进行编码时,利用相邻采样值之间的关系,可以根据过去的采样值预测一个当前的采样值。自适应预测编码(APC)利用了这一特性并且对预测值和输入信号之间差值,即预测余值进行编码。
在这种自适应预测编码中,在一个编码单元中取出一个输入信号,在上述编码单元中可以将声音信号看做是不变的,例如在一个20ms的帧单元中,并且根据由线性预测编码(LPC)得到的预测参数进行线性预测,从而得到预测值与输入信号之间的差值。将这一差值量化并与预测系数和作为辅助信息的量化步进宽度相乘,从而以帧为单位传输。
下面将介绍编码激励线性预测(CELP)编码方法,以其作为预测编码方法的代表。
上述CELP编码使用一个噪声代码字典,称为代码簿,从其中选择最佳的噪声来表现输入声音信号,并对其数字索引进行传输。在CELP编码中,对于时间轴波形的矢量量化实行使用合成分析的封闭循环,这样对声源参数进行编码。
图1为一方框图,表示了使用CELP编码对声音信号进行编码的编码装置的主要部分的构成。以下参考这种编码装置的构成介绍所述的CELP编码。
首先在LPC分析器20中对从输入端子10输入的声音信号进行LPC(线性预测编码)分析,将得到的预测参数传送至合成滤波器30。此外,还将该预测参数传送至多路传输器130。
在合成滤波器30中,将来自LPC分析器20的预测参数同来自自适应代码簿40和噪声代码簿60经过了放大器50和70以及加法器80的标记矢量进行合成,对此将在下文中详述。
加法器90确定从输入端子10提供的声音信号同来自合成滤波器30的预测值之间的差值,并将其传送至听觉加权模块100。
考虑到人类听觉的特征,在听觉加权模块100中对加法器90中得到的差值进行加权。误差计算器110搜索标记矢量以使按听觉加权的差值,即来自合成滤波器30的预测值与输入声音信号以及放大器50和70的增益之间的差值的失真最小。将搜索的结果作为索引传送到自适应代码簿40,噪声代码簿60,增益代码簿120以及多路传输器130,以便从输出端140作为传输路径标记传输。
这样,从自适应代码簿40和噪声代码簿60中选取了表现输入声音信号的最佳标记矢量,并为了将他们合成确定了最佳的增益。应该注意的是,上述处理能够在对输入端子10输入的声音信号进行了按听觉加权之后进行,并且可以对存储在代码簿中的标记矢量进行按听觉加权。
下面介绍上述的自适应代码簿40,噪声代码簿60和增益代码簿120。
在CELP编码中,用于表现输入声音信号的声源矢量是由存储在自适应代码簿40中的标记矢量和存储在噪声代码簿60中的标记矢量的线性和构成。这里,为了表现使得经过按听觉加权的与输入声音信号差别最小的声源矢量的各个代码簿的索引是通过计算对于所有存储标记矢量的合成滤波器30的输出矢量并且在误差计算器110中计算误差来确定的。
此外,通过相似的搜索将放大器50中的自适应代码簿的增益和放大器70中的噪声代码器的增益进行编码。
噪声代码簿通常包含一系列具有离差1的高斯噪声矢量,如2的位数次方的代码簿矢量。并且通常选择代码簿矢量的组合以使得声源矢量的失真度最小,该声源矢量是通过对这些代码簿矢量增加适当的增益得到的。
通过增加代码簿的维数可以减少对所述代码簿矢量进行量化时的量化失真。例如,所用的代码簿为40维,2的9次方即512项。
使用这种CELP编码,可以得到比较而言更高的压缩率和更好的音质。然而大维度代码簿的使用在合成滤波器中需要大的计算量,并需要大量的代码簿存储量,这给实时处理造成困难。如果要保证有好的声音质量会导致严重的滞后。此外,还有一个问题,就是仅仅一位编码误差就会带来完全不同的矢量再现。就是,对于标记误差这种编码方法还不足。
为了克服上述CELP编码的问题,采用了矢量和激励线性预测(VSELP)编码。以下将参照图2和图3介绍这种VSELP编码。
图2为一方框图,它表示了利用VSELP对声音信号进行编码的编码装置所使用的噪声代码簿的构成。
VSELP编码使用了一个由多个预定基础矢量组成的噪声代码簿260。存储在噪声代码簿260中的每一个基础矢量数M与系数+1或-1相乘以颠倒与所述索引相对应的值,由解码器210借助代码辅助部分270-1到270-M将所述索引解码。与系数+1或-1相乘的M个基础矢量在加法器280中互相组合以产生2M个噪声标记矢量。
结果,通过对M个基础矢量及其和值和差值进行卷积运算,对于全部噪声标记矢量得到了卷积计算结果。另外,由于仅须将M个基础矢量存储在噪声代码簿260中,就可以减少存储量。另外,由于所产生的2M个噪声标记矢量具有多种构成,这所以通过将基础矢量相加或相减来表现,所以这能够提高对标记误差的承受能力。
图3为一方框图,表示了具有上述噪声代码簿的VSELP编码装置主要部分的构成。在这种VSELP编码装置中,在传统CELP编码装置中通常为512的噪声代码簿数目M减少至9,并且由符号添加器365给每个标记矢量(基础矢量)加上一个符号+1或-1,从而在加法器370中得到了这些矢量的线性和,以便产生29=512个噪声标记矢量。
如上面已经讲过的,VSELP编码的主要特征就是噪声标记矢量由基础矢量的线性和形成,并且立即对自适应代码簿的增益和噪声代码簿的增益进行矢量量化。
这种VSELP编码的基本构成就是一种通过合成的分析方法,即实施一种音调频率分量和噪声分量的线性预测合成作为激励源。就是说,从自适应代码簿340和噪声代码簿360的矢量单元中选出一个波形,该自适应代码簿340随输入声音信号的频率而定,以进行线性预测合成,从而选取使得与输入声音信号差别为最小的标记矢量和增益。
在VSELP编码中,选自自适应代码簿的标记矢量代表输入声音信号的音调分量,而选自噪声代码簿的标记矢量代表输入声音信号的噪声分量,从而可以同时获得组合的两个最佳参数。
在这种处理中,由于基础矢量仅具有被加上+1或-1的自由度,并且自适应代码簿并不与基础矢量相正交,如果要很好地确定自适应代码簿和噪声代码簿的矢量在执行CELP处理程序时的效果会降低。为了克服这一点,在VSELP中,根据以下步骤确定基础矢量符号。
首先,搜索输入声音信号的音调频率以确定自适应代码簿的标记矢量。接下来将噪声基础矢量设计为与自适应代码簿的标记矢量空间正交,并计算出其与输入矢量的内积,从而确定噪声代码簿的标记矢量。
下面,根据确定出的两个标记矢量,搜索代码簿以确定增益β与增益γ的组合,它使得合成矢量同输入声音信号间的差别最小。为了量化这两个增益,使用一对双参数对等转换。在这里,β对应于长期预测增益系数,而γ对应于标记矢量的标量增益。
尽管VSELP编码中的代码簿搜索的计算量比CELP编码中的计算量已经减少,但是仍然需要进一步提高处理速度,进一步减少滞后。
所以,本发明的一个目的为在对输入声音信号或其它类似信号进行矢量量化时简化代码簿搜索,提高矢量搜索速度。
为了实现上述目的,在本发明的矢量搜索方法中,包括根据将多个基础矢量合成得到的合成矢量获得的预测矢量,每个基础矢量与系数+1或-1相乘,确定这样的一个矢量以使得它同已知输入矢量间的差值最小或使它同已知输入矢量间的内积最大,根据格雷码,通过改变与每个基础矢量相乘的系数的组合来实施计算,以得到它同输入矢量间的差值或得到它同输入矢量间的内积,从而通过基于与格雷码u紧邻的i和它们之间的变化量DGu的中间值Gi来表示中间值Gu,它是从根据格雷码u产生的合成矢量得到的。
更进一步说,通过使用当格雷码的预定比特位量变化时的合成矢量变化量与不同的比特位置变化时合成矢量的变化量之间的差值得到基础矢量的组合,它使得输入矢量与预测矢量的差值最小,或者使得它们之间的内积最大。
根据上述矢量搜索方法,通过利用格雷码的特性,能够使用为实施下面计算而获得的计算结果,这样能够提高矢量搜索速度。
图1为一方框图,它表示了一个用于解释CELP编码的编码装置的构成实例。
图2为一方框图,它表示了用于VSELP编码的噪声代码簿的构成。
图3为一方框图,它表示了用于解释VSELP编码的编码装置的构成实例。
图4表示了二进制格雷编码的实例。
图5为一流程图,它表示了根据本发明的矢量搜索方法的程序。
图6表示了根据本发明的矢量搜索方法与常规矢量搜索之间的计算量和存储器写入量的比较。
图7解释了PSI-CELP。
图8为一方框图,它表示了用于解释PSI-CELP编码的编码装置的构成实例。
现在针对根据本发明的优选实施例的矢量搜索方法进行叙述。
首先,介绍由上面提到的VSELP编码装置进行的矢量量化的情况。
在波形编码和分析-合成系统中,取代对每个波形采样值和谱包络参数进行量化,将多个组合的数值(矢量)表示为具有一个标记的整体。这样的一个量化方法称为矢量量化。在运用波形矢量量化进行编码时,将经过采样的波形以预定的时间间隔切断作为编码单元,并且将该时间间隔中的波形型式表示为一个标记。为此,事先将多个波形型式存储在存储器中,并对它们加以标记。标记与型式(经过标记的矢量)之间的对应关系由一个代码簿指出。
对于一个声音信号波形,对于每个时间间隔将其同存储在代码簿中的每个参数进行比较,并用具有最高相似度的波形标记来表示该间隔的波形。这样,可以用有限数目的型式来表示多个输入声音。所以,考虑到模式分布一类因素应当将减小整个失真度的适当的模式存储在代码簿中。
该矢量量化可以是一种高效的编码,这种编码是以这样的事实为基础的,即所实现的模式具有多种特性,从而可以在声音波形的一个确定间隔内的采样点之间看到相关性,并且将采样点光滑连接。
接下来,将介绍用于搜索经过标记的矢量的矢量搜索,上述经过标记的矢量使得输入矢量同合成矢量间差别最小,上述合成矢量是由选自代码簿的多个矢量的最佳组合形成的。
首先,假设p(n)是一个经过按听觉加权的声音信号而q’m(n)(1≤m≤M)是一个正交于经过按听觉加权的长期预测矢量的基础矢量。
公式(1)给出了输入矢量和由选自代码簿的多个矢量组合形成的合成矢量的内积。就是说,通过获取使公式(1)值最大的θij,使得合成矢量与输入矢量间的内积最大。
值得注意的是,如果标记字i的j位为0则组合θij为-1,而如果标记词i的j位为1则θij为1(0≤i≤2M-1,1≤m≤M)。[公式1]
将公式(1)的分母演变得到公式(2)。[公式2]
在此,引入由公式(3)给出的变量Rm以及由公式(4)给出的变量Dmj。[公式3]
将变量Rm和Dmj代入公式(1)得到公式(5)。[公式4]
在此,进一步引入由公式(b)给出的变量Ci以及由公式(7)给出的变量Gi。[公式5]
通过使用这些变量Ci和Gi能够将公式(1)改写为公式(8)。就是说,通过得到使公式(8)值最大的变量Ci和Gi,可以使合成矢量同输入矢量之间的相关性最大。
ci 2/Gi-Max. (8)
顺便讲一下,如果有一个标记字u,其仅仅在V位与标记字i不同,并且如果Ci和Gi已知,于是可以用公式(9)和公式(10)表示Cu和Gu。[公式6]
Cu=Cf+θxvRv …(9)
通过运用这些并通过使用二进制格雷码转换该标记字i,可以高效地计算选自代码簿的多个标记矢量的最佳组合。格雷码将在后面详细介绍。
如果假设ΔGu为Gi到Gu的变化量,可以将公式(10)改写为公式(11)。[公式7]
在这里,二进制格雷码的标记词字u’与标记字i仅在V位上不同。标记字u’与在先的标记字u除V位以外仅有一位不同。
现在,如果假设W为上面提到的比特位置,则θUV的符号相反,并且可以从公式(11)得到公式(12)的关系。
ΔGu’=-ΔGu+2θuwθuvDwv (12)
从这里,当V位首先变为二进制格雷码时,用公式(11)获取变化量ΔGu,并在这之后用公式(12)获取在相同的V位的变化量,这提高了矢量搜索速度。
图4表示了当M=4时的二进制格雷码。正如在这里所看到的,格雷编码是一种循环编码,其中相邻的两个标记字仅有一位不同。
这里,留意一下V=3的比特位置,例如,当N从3变为4时,如参考标记425所示,该值发生变化,并且在N从11变为12时,如参考标记42b所示,该值发生变化。就是说,如果将N=4时的格雷码同N=12时的格雷码相比,唯一不同的是W位(W=4),V位(V=3)除外。
这时,如果假设N=4时的格雷码为u,而N=12时的格雷码为u’,于是
当 N=4: θu1=-1,θu2=1,θu3=1,θu4=-1
当 N=12:θu’1=-1,θu’2=1,θu’3=-1,θu’4=1
(13)
从这个以及公式(11)可以得到下面的公式。
当 N=4:ΔGu=θu3{θu1D13+θu2D23+θu4D43}
当 N=12:ΔGu’=θu’3{θu’1D13+θu’2D23+θu’4D43}
(14)
如上面已经叙述过的,因为V=1和2的比特位置具有相同的标记,而V=3和4比特位置是不同的标记,下列公式满足。
ΔGu’=-θu3{θu1D13+θu2D23+(-θu4)D43}(15a)
=-θu3{θu1D13+θu2D23+θu4D43}+2θu3θu4D43
=-ΔGu+2θu1θu4D43 (15b)
就是说,可以将公式(15a)化简为公式(15b)。
图5为一流程图,它表示上述根据本发明的矢量搜索方法的程序。
首先,在步骤ST1,由公式(3)计算变量Rm,由公式(4)计算变量Dmj。
在步骤ST2,由公式(b)计算变量Co,由公式(7)计算变理Go。
在步骤ST3,由公式(9)计算Ci(1≤i≤2M-1)。
在步骤ST4,计算V-1位。
在步骤ST5,当一个确定的V位首先改变,由公式(11)计算Gu的变化量ΔGu。
在步骤ST6,当剩下的V位变化时,由公式(12)计算ΔGu。
在步骤ST7,将V位设置为V+1。
在步骤ST8,判断V是否等于或小于M。如果V小于或等于M,则控制返回步骤ST5以重复上述过程。相反,如果V大于M,控制进行到步骤ST9。
在步骤ST9,计算Gu=G1+ΔG(其中1≤μ≤2M-1),完成了矢量搜索。
图6表示了根据本发明的矢量搜索方法的计算处理量与常规的矢量搜索方法的处理量的比较情况。
图6A表示了乘法计算次数的比较结果。而图6B表示了加法和减法计算次数的比较结果。从这些结果可以看到随着M的增加,计算次数减少。
此外,图6C表示了写存储器次数的比较结果。这个结果表明,与常规的矢量搜索方法相比,写存储器次数增加为二倍,与M值无关。
接下来介绍以PSI-CELP编码实行矢量量化的本发明一个实施例的矢量量化方法。
该PSI-CELP(音调合成革新CELP)编码,通过对于从具有自适应代码簿的音调周期性(音调滞后)的噪声代码簿提取的标记矢量进行周期性处理从而成为一种用于获取声音现有部分改进音质的高效的声音编码方法。
图7概括表示了对于选自噪声代码簿的标记矢量的周期性音调处理。在上述的CELP编码中,自适应代码簿用于有效地表现一个声音信号,该声音信号包含了周期性的音调组分。然而,当位速率降低至4kbs,则为音调编码标记的位数减少,这样,仅用自适应代码簿则不足以表现上述包含了周期性音调组分的声音信号。
为了克服这一点,在PSI-CELP编码系统中,选自噪声代码簿的标记矢量须经过周期性的处理。这就能够准确地表现包含周期性音调组分的声音信号,该周期性音调组分仅用自适应代码簿是不足以表现的。应该注意的是,所述滞后(音调滞后)L代表了用采样数目表示的音调周期。
图8为一方框图,它表示了PSI-CELP编码装置主要部分的构成实例。下面,将参照附图8介绍这种PSI-CELP编码。
PSI-CELP编码的特点在于实行噪声代码簿的音调周期性处理。这种周期性处理就是通过取出一个为该声音信号基础周期的音调周期性分量将声音信号变形从而对其进行重复。
从输入端710提供的声音信号首先须经过线性预测分析,这是在一线性预测分析器720中进行的,并且将所得到的预测系数送入线性预测合成滤波器730中。在该合成滤波器730中将取自LPC分析器720的预测系数同自适应代码640和噪声代码簿680,760,761分别通过放大器650,670和加法器780进行合成。
选自噪声代码簿660的噪声标记矢量是一个由选择器655从32个基础矢量中选出并通过符号添加器657与系数+1或-1相乘得到的矢量。乘以系数+1或-1的噪声标记矢量以及取自自适当代码簿的标记矢量是由选择器652选择的,并且经由放大器650施以一个预定的增益g0,从而将其送至加法器780。
另一方面由选择器755和756从16个基础矢量中分别选择来自噪声代码簿的噪声标记矢量,并经过音调循环器750和751的音调周期性处理,在这之后由符号添加器740和741将其与系数+1或-1相乘,从而送至加法器765。这之后,在放大器770中对它们施以一个增益g1并将其送至加法器780中。
由放大器650和770分别施以了增益的标记矢量在加法器780中相加并送至线性预测合成滤波器730中。
在加法器790中得到从输入端子710提供的声音信号与线性预测合成滤波器730的预测值之间的差值。
考虑到人的听觉特点,在听觉加权失真缩减器800中将从加法器790中得到的差值经过按听觉加权。确定经过听觉加权的差值以便将线性预测合成滤波器730的预测值与输入声音信号之间的差值误差减至最小。将结果作为一个索引传送至自适应代码簿640,噪声代码簿660,760和761,并作为一个传送通路标记输出。
顺便提一下,在LSP中段第二级量化中给出了一个由选自代码簿的多个矢量的组合形成的合成矢量与输入中段LSP误差矢量之间的欧几里德(Euclid)距离。就是说,通过获得一对使公式(16)给出的欧几里德(Euclid)为最小的θ(k,i)来进行这一计算,其中假设0≤k≤MM-1,以及0≤i≤7。[公式8] 将公式(16)演变为下面的公式(17)。[公式9]
在这里引入由公式(18)给出的变量R(k,i)(0<k<MM-i,0<1<7)以及由公式(19)给出的变量D(i,m)(0<i,m<7)。[公式10]
在公式(17)中,其右侧第一项一直为常数,并且可以适当地将其省略。通过代入上述变量R和D,可以获得满足下列公式(20)所限定的关系的θ(k,i)。[公式11]
在这里,进一步引入由公式(21)给出的变量CI和由公式(22)给出的变量GI(其中0≤I≤28-1)。[公式12]
将上述变量CI和GI代入公式(20)得到下面的式子。
-2*CI+GI-Min. (23)就是说通过获得使公式(23)值最小的变量CI和GI可以使误差最小。
在上述PSI-CELP编码系统中的矢量搜索中,公式(21)和(22)与VSELP编码中的矢量搜索中的公式(9)和(10)形式相同。因此,上述根据本发明的矢量搜索方法也能够应用于PSI-CELP,以提高矢量搜索速度。
根据本发明的运用了格雷码特征的矢量搜索方法,使用已经变成的计算的结果进行下一步计算,这样能简化合成矢量的计算并提高矢量搜索速度。
Claims (5)
1.一种矢量搜索方法,其中以这样的方法计算预测矢量与输入矢量之间的差值误差,就是根据格雷码改变与多个基础矢量相乘的矢量的组合;其特征在于所述方法包括下列步骤:
通过计算根据格雷码的标记字u产生的合成矢量获得中间值Gu;
将得到的中间值Gu用中间值Gi和变化量ΔGu表示,所述中间值Gi是通过计算根据相邻标记字i产生的合成矢量得到的,其中所述标记字i与所述标记字u仅在预定的V位不同,所述变化量ΔGu是通过运用所述格雷码特征计算的,以及
利用所述ΔGu表示中间值Gi’和Gu’之间的差值ΔGu’,中间值Gi’与所述格雷码中的另一个标记字i’相对应,而中间值Gu’与仅在预定的V位与上述标记间i’不同的相邻标记字u’相对应。
2.如权利要求1所述的一种矢量搜索方法,其特征在于通过将所述合成矢量同基于过去声源信号的矢量合成,由一个预测合成滤波器产生上述预测矢量。
3.如权利要求1所述的一种矢量搜索方法,其特征在于所述格雷编码中的所述标记字u’仅在除了预定的V位以外的W位与所述标记字u不同,以及
所述变化量ΔGu’是由已经根据所述格雷编码的所述标记字u得到的变化量ΔGu与所述变化量ΔGu和所述ΔGu’之间的差值的和来表示的。
4.如权利要求1所述的一种矢量搜索方法,其特征在于所述使所述预测矢量与所述输入矢量之间的差值为最小的计算就是这样一种计算,它确定一个合成矢量并使其与所述输入矢量的内积为最大,上述合成矢量是从由对于所述格雷编码的所述标记字的合成矢量产生的合成矢量中确定的,以及
所述内积是用两个变量Ci和Gi表示的,如Ci2/Gi,使其值为最大。
5.如权利要求1所述的一种矢量搜索方法,其特征在于,所述使所述预测矢量与所述输入矢量之间的差值为最小的计算就是这样一种计算,它确定一个合成矢量并使其到所述输入矢量的欧几里德距离最小,上述合成矢量是从由对于所述格雷编码的所述标记字的合成矢量产生的合成矢量中确定的,以及
所述欧几里德距离是由两个变量Ci和Gi的和表示的,其和值最小。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP07861597A JP3593839B2 (ja) | 1997-03-28 | 1997-03-28 | ベクトルサーチ方法 |
JP78615/1997 | 1997-03-28 | ||
JP78615/97 | 1997-03-28 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1203411A CN1203411A (zh) | 1998-12-30 |
CN1120472C true CN1120472C (zh) | 2003-09-03 |
Family
ID=13666802
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN98109402A Expired - Fee Related CN1120472C (zh) | 1997-03-28 | 1998-03-28 | 矢量搜索方法 |
Country Status (9)
Country | Link |
---|---|
US (1) | US7464030B1 (zh) |
EP (1) | EP0867863B1 (zh) |
JP (1) | JP3593839B2 (zh) |
KR (1) | KR100556278B1 (zh) |
CN (1) | CN1120472C (zh) |
AU (1) | AU757927B2 (zh) |
DE (1) | DE69808687T2 (zh) |
SG (1) | SG71098A1 (zh) |
TW (1) | TW371342B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100318336B1 (ko) * | 2000-01-14 | 2001-12-22 | 대표이사 서승모 | G.723.1 mp-mlq 코드북 검색 시간 단축 방법. |
JP4358229B2 (ja) * | 2004-07-09 | 2009-11-04 | 日本電信電話株式会社 | 信号検出システム、信号検出サーバ、信号検出方法及びプログラム |
CN101266795B (zh) * | 2007-03-12 | 2011-08-10 | 华为技术有限公司 | 一种格矢量量化编解码的实现方法及装置 |
US8581757B2 (en) * | 2009-07-02 | 2013-11-12 | Siemens Enterprise Communications Gmbh & Co. Kg | Method for vector quantization of a feature vector |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4817157A (en) * | 1988-01-07 | 1989-03-28 | Motorola, Inc. | Digital speech coder having improved vector excitation source |
US4896361A (en) * | 1988-01-07 | 1990-01-23 | Motorola, Inc. | Digital speech coder having improved vector excitation source |
JP2776050B2 (ja) | 1991-02-26 | 1998-07-16 | 日本電気株式会社 | 音声符号化方式 |
JPH06138896A (ja) | 1991-05-31 | 1994-05-20 | Motorola Inc | 音声フレームを符号化するための装置および方法 |
JP3056339B2 (ja) * | 1992-10-16 | 2000-06-26 | 沖電気工業株式会社 | ベクトル量子化の基準ベクトルへの符号ビット割当方法 |
JPH06186998A (ja) * | 1992-12-15 | 1994-07-08 | Nec Corp | 音声符号化装置のコードブック探索方式 |
JPH07170192A (ja) * | 1993-12-16 | 1995-07-04 | Toshiba Corp | ベクトル量子化装置 |
CA2136891A1 (en) * | 1993-12-20 | 1995-06-21 | Kalyan Ganesan | Removal of swirl artifacts from celp based speech coders |
JPH07199994A (ja) * | 1993-12-28 | 1995-08-04 | Nec Corp | 音声符号化方式 |
JPH0863198A (ja) * | 1994-08-22 | 1996-03-08 | Nec Corp | ベクトル量子化器 |
JPH08137495A (ja) * | 1994-11-07 | 1996-05-31 | Matsushita Electric Ind Co Ltd | 音声符号化装置 |
-
1997
- 1997-03-28 JP JP07861597A patent/JP3593839B2/ja not_active Expired - Fee Related
-
1998
- 1998-03-24 SG SG1998000605A patent/SG71098A1/en unknown
- 1998-03-25 KR KR1019980010207A patent/KR100556278B1/ko not_active IP Right Cessation
- 1998-03-26 US US09/048,076 patent/US7464030B1/en not_active Expired - Fee Related
- 1998-03-26 TW TW087104557A patent/TW371342B/zh not_active IP Right Cessation
- 1998-03-26 EP EP98302329A patent/EP0867863B1/en not_active Expired - Lifetime
- 1998-03-26 DE DE69808687T patent/DE69808687T2/de not_active Expired - Lifetime
- 1998-03-28 CN CN98109402A patent/CN1120472C/zh not_active Expired - Fee Related
- 1998-03-30 AU AU59706/98A patent/AU757927B2/en not_active Ceased
Also Published As
Publication number | Publication date |
---|---|
JP3593839B2 (ja) | 2004-11-24 |
DE69808687D1 (de) | 2002-11-21 |
JPH10276096A (ja) | 1998-10-13 |
AU757927B2 (en) | 2003-03-13 |
KR100556278B1 (ko) | 2006-06-29 |
DE69808687T2 (de) | 2003-06-12 |
AU5970698A (en) | 1998-10-01 |
CN1203411A (zh) | 1998-12-30 |
KR19980080612A (ko) | 1998-11-25 |
TW371342B (en) | 1999-10-01 |
SG71098A1 (en) | 2000-03-21 |
EP0867863B1 (en) | 2002-10-16 |
US7464030B1 (en) | 2008-12-09 |
EP0867863A1 (en) | 1998-09-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1154086C (zh) | Celp转发 | |
CN1121683C (zh) | 语音编码 | |
CN1199151C (zh) | 语音编码器 | |
CN1123866C (zh) | 一种语音编/解码方法和装置 | |
US6385576B2 (en) | Speech encoding/decoding method using reduced subframe pulse positions having density related to pitch | |
CN1509469A (zh) | 语音编解码器中用于线频谱频率矢量量化的方法和系统 | |
JP5241701B2 (ja) | 符号化装置および符号化方法 | |
CN1739142A (zh) | 用于可变比特率语音编码中的线性预测参数的稳健预测向量量化的方法和设备 | |
CN1167048C (zh) | 语音编码设备和语音解码设备 | |
CN1795495A (zh) | 音频编码设备、音频解码设备、音频编码方法和音频解码方法 | |
CN1265217A (zh) | 在语音通信系统中语音增强的方法和装置 | |
CN1152776A (zh) | 复制语言信号、解码语音、合成语音的方法和装置 | |
CN1334952A (zh) | 用于改善编码通信信号性能的编码增强特性 | |
CN101044554A (zh) | 可扩展性编码装置、可扩展性解码装置以及可扩展性编码方法 | |
CN1167046C (zh) | 矢量编码方法及其利用该方法的编码器和解码器 | |
CN1195414A (zh) | 生成和编码线状谱平方根的方法和装置 | |
CN1192357C (zh) | 用于语音编码的自适应规则 | |
JPH1124698A (ja) | 信号識別装置、コードブツク切換装置、信号識別方法及びコードブツク切換方法 | |
CN1120472C (zh) | 矢量搜索方法 | |
CN101053020A (zh) | 利用信号属性的有效音频编码 | |
JP3275247B2 (ja) | 音声符号化・復号化方法 | |
US6470312B1 (en) | Speech coding apparatus, speech processing apparatus, and speech processing method | |
JP2538450B2 (ja) | 音声の励振信号符号化・復号化方法 | |
CN1124590C (zh) | 改善话音信号编码器性能的方法 | |
CN1815894A (zh) | 一种音频信号编码的方法和设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20030903 Termination date: 20120328 |