CN1106710C - 向量量化装置和方法 - Google Patents

向量量化装置和方法 Download PDF

Info

Publication number
CN1106710C
CN1106710C CN95107152A CN95107152A CN1106710C CN 1106710 C CN1106710 C CN 1106710C CN 95107152 A CN95107152 A CN 95107152A CN 95107152 A CN95107152 A CN 95107152A CN 1106710 C CN1106710 C CN 1106710C
Authority
CN
China
Prior art keywords
vector
mentioned
code
unit
code vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN95107152A
Other languages
English (en)
Other versions
CN1120268A (zh
Inventor
天田皇
三关公生
赤岭政已
押切正浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Publication of CN1120268A publication Critical patent/CN1120268A/zh
Application granted granted Critical
Publication of CN1106710C publication Critical patent/CN1106710C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/3002Conversion to or from differential modulation
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/3082Vector coding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/008Vector quantisation

Abstract

本发明提出的一种向量量化装置,能减少主要用于语音偏码方式的代码本查找等的向量量化中的计算量,以较少的计算量查找最佳向量。其中具有:求得接近目标向量R的近似向量X1的第一查找单元130;由目标向量R与近似向量X1求取残差向量Rv的残差向量计算单元140;求得将向量X2~XN加权得的向量组X2~XN的加权单元120;和以残差向量Rv对近似向量X1与经加权的向量组X2~XN的伸展空间的映射向量的大小作评p价值、查找该评价值较大的代码向量的第二查找单元170。

Description

向量量化装置和方法
本发明涉及用于声音和图象等信息信号的量化的向量量化装置,特别是涉及有关CELP方式中的代码本查找技术。
在对电话频段的声音以4Kbps左右的传输率进行编码的技术中,CELP(Cade Excifed Linear Predicfion)方式是一种有效的方式。采用这种CELP方式的处理,与要求根据被分割为帧单位的输入语音进行声道模型化的语音合成滤波器的处理,在要求相当于这种滤波器的输入信号的驱动向量的处理上有很大不同。其中,后者必须将存贮在代码本中的多个驱动向量引入每一语音合成滤波器,将输入语音与所得到的合成声音进行比较,根据其误差进行由代码本查找驱动向量被称之为代码本查找的向量量化,这种处理通常需要多个计算量。本发明就是关于一种设置有多个代码本的CELP方式中的代码本查找技术。
有关CELP方式,例如在M.R.Schroeder和B.S.Atal的″代码活化线性予测(CELP):在很低位速率时的高质量话音″(Proc,ICASSP,pp.937-940,1985),T W.S.Kleijin,D.J.Krasinski等的″在CELP中完善话音质量和高效向量量化″(Proc.ICASSP,pp,155-158,1988)中进行了详细描述,图23对之有概略说明。
图23中,向语音输入端960输入的声音经线性予测分析单元950分析,求取加权合成滤波kkd 930的系数。输入的语音还被送至声响加权单元940,以得到加权输入语音。由加权输入语音中除去加权合成滤波器的零状态响应,就得到目标向量980。接着由加权合成滤波器930将适应编码本911中每一驱动向量加以合成以求取合成语音向量,评价单元970查找与目标向量980的差(偏差向量)更小的驱动向量,以最佳值作为第一驱动向量。接着考虑第一驱动向量的影响,由噪声编码本912同样地选择第二驱动向量。最后,在由放大电路921、922对第一和第二编码向量分别作最佳放大后,经补充混合生成驱动信号,以此驱动信号对适应编码本911进行更新,为下一帧作准备。
在上述流程中,由适应代码本911和噪声编码本912查找出偏差向量值更小的驱动向量的处理被称之为代码本查找。在进行这种代码本查找时,一般先查找适应代码本911,选择第一最佳驱动向量X1,然后考虑X1的影响查找噪声代码本912,以确定第二驱动向量X2,最后将二向量X1、X2分别放大再加以混合。
日本专利平5-506514中揭示的正交查找,广泛采用在求得X1的条件下求取最佳X2的方法。具体说是,针对将所给予的X1送入合成滤波器910所得到的合成语音向量X1、将查找中的向量X2引入合成滤波器910所得的合成语音向量X2按式(1)来求取作正交处理的向量X2v,再求取由此X2v与目标向量R所组成的式(2)的评价值E为最大时的向量X2。 X 2 v = X 2 - ( X 2 , X 1 ) | X 1 | 2 X 1 - - - ( 1 ) E = ( R , X 2 v ) 2 | X 2 v | 2 - - - ( 2 )
但是,这一方法因为需要对噪声代码本912的所有驱动向量作X1正交处理进行查找,所以存在着代码本查找时要进行大量计算的问题。
鉴于上述情况,现有的正交查找是对由适应代码本所得到的最佳合成声音向量,将由噪声代码本所所得到的合成声音向量逐个作正交处理来进行噪声代码本的查找,就存在有在进行代码表的查找中所需计算量很大的缺点。
本发明的目的是要提出一种不进行代码向量正交处理,因而能以较之过去大大减少计算工作量来实现最佳代码向量查找的向量量化装置。
为解决上述课题,有关第一发明的向量量化装置的特征在于设置有:取得残差向量的手段;由代码向量的集合中选择至少一个代码向量的手段;获得将由上述手段所选择的代码向量与构成第一基本向量集合的基本向量合并的向量伸展空间的基本向量作为第二基本向量集合的手段;由前述代码向量集合查找前述残差向量投影在前述第二基本向量集合的伸展空间上的映射向量的大小较大的代码向量组的查找手段;和将指定由此查找手段查找得的代码向量的信息输出的手段。
有关第二发明的向量量化装置的特征在于设置有:取得残差向量的手段,由代码向量集合中选择至少一个代码向量的手段;根据由该手段选择的代码向量与前述残差向量的内积值的大小由前述代码向量集合查找评价值较大的代码向量组的查找手段;和将指定该查找手段所查找得的代码向量组的信息输出的手段。
有关第三发明的向量量化装置的特征在于设置有:取得残差向量的手段;由代码向量集合选择至少一个代码向量的手段;根据对由该手段所选择的代码向量和前述残差向量的内积值的大小以基于前述代码向量的加权系数进行加权的值由前述代码向量集合查找评价值较大的代码向量组的查找手段;和将指定由该查找手段查找到的代码向量组的信息输出的手段。
有关第四发明的向量量化装置的特征在于设置有:取得残差向量的手段;由代码向量集合中选择至少一个代码向量的手段;采用第二发明或第三发明中的查找手段向前述代码向量集合选择多组代码向量作为备用选择候补的备用选择手段;由前述备用选择候补中利用第一发明中的查找手段选择至少一组代码向量作为最佳代码向量组的基本选择手段;和输出指定前述最佳代码向量组的信息的手段。
有关第五发明的向量量化装置的特征在于设置有:取得残差向量的手段;由代码向量集合选择至少一个代码向量的手段;采用第二或第三发明中的查找手段由前述代码向量集合选择多组代码向量作为备用选择候补的备用选择手段;由前述备用选择候补中选择前述备用选择手段中用的内积值的大小,按在前述第二基本向量集合的伸展平面中作正交处理的代码向量的大小分割的值较大的代码向量作为最佳向量组的基本选择手段;和输出指定前述最佳向量组的信息的手段。
有关第六发明的向量量化装置的特征在于装置有:取得接近目标向量的近似向量的手段;利用前述目标向量与前述近似向量求得残差向量的手段;查找对于前述近似向量和多个代码向量集合的伸展空间的前述残差向量的映射向量的大小较大的代码向量的查找手段;和输出指定该查找手段所查找到的代码向量的信息的手段。
有关第七发明的向量量化装置的特征在于设置有:取得接近目标向量的近似向量的手段;利用前述目标向量与前述近似向量取得残差向量的手段;查找代码向量与前述残差向量的内积值的大小较大的代码向量的查找手段;和输出指定该查找手段查找到的代码向量的信息的手段。
有关第八发明的向量量化装置的特征在于设置有:取得接近目标向量的近似向量的手段;利用前述,目标向量与前述近似向量求取残差向量的手段;查找将代码向量与前述残差向量的内积值的大小以基于前述代码向量的加权系数进行加权所得的值较大的代码向量的查找手段;和输出指定由该查找手段所查找到的代码向量的信息的手段。
有关第九发明的向量量化装置的特征在于设置有:选择由第七发明或第八发明中的查找手段得到的多个代码向量作为备用选择候补的备用选择手段;由前述备用选择候补中利用第六发明中的查找手段选择至少一组代码向量作为最佳代码向量的候补的基本选择手段;和输出指定前述最佳代码向量的候补的信息的手段。
在第一至第九发明中,前述查找手段亦可作成输入以规定的加权系数加权的代码向量。
而在第二、三、七、八发明中,对前述内积值亦可由前述代码向量和前述残差向量作逆卷积运算的向量的内积来求取。
在第一发明中,当查找代码向量组时,首先取得代码向量组与第一基本向量合并的向量伸展的空间,求取在该空间映射残差向量的映射向量的大小作为评价值,查找该评价值较大的代码向量组作为最佳代码向量组。依靠这样的查找,由于查找中无须对代码向量组作正交处理,因而能以比现有的正交查找要少的计算工作量进行查找。
在第二发明中,求取代码向量与残差向量的内积值的大小作为评价值,查找该评价值较大的代码向量组作为最佳代码向量组,而在第三发明中则求取代码向量与残差向量的内积值的大小以基于代码向量的大小的加权系数进行加权的值作为评价值,查找该评价值较大的代码向量组作为最佳代码向量组,因而可能以更少的计算量进行查找。
在第四、五发明中,作为第一至第三发明的组合,能以较少的计算求取更高精度的查找结果作为最佳代码向量。
在第六发明中,在得到接近目标向量的近似向量后查找代码向量时,求取目标向量与近似向量的残差向量映射于近似向量和代码向量的伸展空间上的映射向量,将此映射向量的大小作为评价值,查找此评价值较大的代码向量作为最佳代码向量。这种情况,由于查找中无需对代码向量作正交处理,所以比同样的正交查找法能以较少的计算量进行查找。
在第七发明中,查找与残差向量的内积值的大小较大的前述向量,而在第八发明中则查找与残差向量的内积值以基于代码的加权系数进行加权的值较大的代码向量作为最佳代码向量。在此第七、第八发明中因为是查找将第六发明中表达评价值的分数式的分子的值或分子以代码向量进行加权的值较大的代码向量,所以能以更少的计算量进行查找。
第九发明中,作为第六至第八发明的组合,所以能以较少的计算量求取精度更高的查找结果作为最佳代码向量。
下面参照附图对本发明的实施例加以说明。
图1是说明有关实施例1的向量量化装置的结构方框图;
图2是说明有关实施例2的向量量化装置的结构方框图;
图3是说明有关实施例3的向量量化装置的结构方框图;
图4是说明有关实施例4的向量量化装置的结构方框图;
图5是说明有关实施例5的向量量化装置的结构方框图;
图6是说明有关实施例6的向量量化装置的结构方框图;
图7是说明有关实施例7的向量量化装置的结构方框图;
图8是说明映射向量的图形;
图9是说明有关实施例8的向量量化装置的结构方框图;
图10是说明有关实施例9的向量量化装置的结构方框图;
图11是说明有关实施例10的向量量化装置的结构方框图;
图12是说明有关实施例11的向量量化装置的结构方框图;
图13是说明有关实施例12的向量量化装置的结构方框图;
图14是说明有关实施例13的向量量化装置的结构方框图;
图15是说明有关实施例15的向量量化装置的结构方框图;
图16是用于实施例1中作逆卷积运算的图形;
图17是用于实施例3中作逆卷积运算的图形;
图18是说明取得第二残差向量的结构的图形;
图19是说明取得第二残差向量的另一结构的图形;
图20是说明有关实施例15的向量量化装置的变形结构的方框图;
图21是说明有关实施例16的向量量化装置的结构方框图;
图22是说明图21中的查找方框结构的示例图;
图23是CELP编码方式的示意图;
图24是说明实施例1中最佳代码向量的查找步骤的流程图;
图25是说明实施例2中最佳代码向量的查找步骤的流程图。
图中标号说明:
111—代码本1             112—代码本N
120—加权单元            130—第一查找单元
140—残差向量计算单元    170—第二查找单元
171—查找结果            172—评价单元
173—映射向量计算单元    174—内积值计算单元
175—加权系数计算单元    176—加权单元
180—目标向量输入端      211—适应代码本
212—噪声代码本          221,222—放大电路
230—加权合成滤波器      240—音响加权单元
250—线性予测分析单元    260—语音输入端
270—逆卷积运算单元      370a—备用选择单元
370b—基本选择单元       371—备用选择候补
372a—评价单元           372b—评价单元
1001~1003—输入端       1010—代码本
1020—组合单元           1030—加权单元
1040—残差向量计算单元   1050—基本向量生成单元
1070—查找单元           1071—映射向量计算单元
1072—评价单元            1073—内积值计算单元
1074—加权单元            1075—加权系数计算单元
1370a—查找单元(备用选择) 1070b—查找单元(基本选择)
1380—备用选择信息        1401~1403—输入端
1410—音响加权单元        1421~1423—查找方框
1430—线性予测分析单元    1501~1502—输入端
1571—映射向量计算单元    1630—逆卷积运算单元
1910—近似向量计算单元    2111~2113—代码本
2130—加权合成滤波器      2121~2123—选择单元
2201—代码向量输入端
2202—经加权的代码向量输入端
实施例1
图1示出了实施例1的向量量化装置的结构。该向量量化装置由代码本1010、组合单元1020、加权单元1030、残差向量计算单元1040、基本向量生成单元1050和查找单元1070构成,而查找单元1070则由映射向量计算单元1071和评价单元1072构成。
在残差向量计算单元1040中求取成为查找的目标向量的残差向量R(K)。在本实施例中,作为示例是由前级的残差向量和前级所输出的基本向量的集合中求取残差向量R(K)的结构。更具体地说,残差向量计算单元1040利用端点1001所输入的前级的残差向量R(k-1)和端点1002所输入的第一基本向量的集合B(k-1),由R(k-1)中减去其映射在B(k-1)的伸展空间上的映射向量,来求出作为目标向量的残差向量R(k)。
在组合单元1020中由代码本1010选择的M个代码向量,在加权单元1030中经加权成为代码向量X(k1),X(k2),……,X(kM),被输入至基本向量生成单元1050。在基本向量生成单元1050中求取由代码向量X(k1),X(k2),……,X(kM)与构成由端点1002输入的第一基本向量集合的基本向量相合并的向量伸展空间,计算出其基本向量并作为第二基本向量集合B(k)输出。
这样求得的残差向量R(k)与第二基本向量的集合B(k)被输入至查找单元1070中的映射向量计算单元1071,在此计算出B(k)伸展空间上映射R(k)所得到的第二映射向量P(k)的大小,将其值输入至评价单元1072。
在评价单元1072中,由对组合单元1020的控制来查找映射向量计算单元1071输入的值,亦即第二映射向量P(k)的大小成为较大值的M个代码向量的组合作为最佳代码向量,并将指定此最佳代码向量的信息(指针)作为查找结果输出。
但是,在本实施例所示的由一个代码本1010查找M个代码向量的结构只不过是代码本构成方法中的一个示例,如同后面所述实施例七那样由N个代码本分别选择一个代码向量的方法则是另一个示例。通常,最好考虑由代码向量集合选择代码向量,例如在代码本中设置少量的基本向量,由对这些基本向量作简单计算(例如线性结合等)来构成的事实上包含多个代码向量的代码本的例子等,也包括在这种考虑方法之中。实际上由于计算量等的限制,因而很多情况均为M=1。这在以下的实施例中也是同样的。
在基本向量生成单元1050中,由第一基本向量集合B(k-1)与代码向量X(k-1)、X(k2)、……X(kM)产生第二基本向量集合B(k)。这一B(k)的生成方法虽然可考虑各种不同方法,但最简单的一个例子是直接求和方法。也就是,在B(k-1)由m个基本向量b1(k-1)、b2(k-1)、……bm(k-1)构成的情况下,
B(k)={b1(k-1),b2(k-1),…,bm(k-1),
       X(k1),X(k2),…,X(kM)}其它的方法有递归地采用残差向量的映射向量构成B(k)的方法。
在查找单元1070中,查找作为输入值的第二映射向量P(k)的大小较大的代码向量组。通常虽然一次选择最佳组合,但由于在CELP编码中利用近年常采用的延迟停机等,也有多次选择最佳值的情况。这对以下的实施例也是同样的。
下面利用图24所示的流程图来说明本实施例中的编码向量查找过程。为简单起见,查找的代码向量为1个(代码向量组由一个代码向量组成),结束条件为代码本1010全部查找的情况,映射向量的大小限定为向量的长的二次方的情况。
步骤S11,进行初始化设置:i=1,imax=1,|Pmax(k)|2=0。imax表示作为指定最佳代码向量的信息的索引,|Pmax(k)|表示映射向量的大小的最大值。
步骤S12,计算残差向量R(k)。
步骤S13,计算经加权的代码向量Xi(k)。
步骤S14,产生基本向量Bi(k)。
步骤S15,计算映射向量的大小|Pi(k)|2
步骤S16,判定步骤S15中算出的|Pi(k)|2与先前算出的映射向量的大小的最大值|Pmax(k)|2的大小关系。
步骤17,如果步骤S16的判定结果为|Pmax(k)|2<|Pi(k)|2,则将|Pi(k)|2更新为新的|Pmax(k)|2,同时将此时的i作成下标imax。
步骤18,在步骤S17的处理之后,或在步骤S17的判定结果为|Pmax(k)|2>|Pi(k)|2时,将i加1。
步骤S19,检验i是否达到设定值。直到i=N时为止,重复进行由步骤S13至S18的处理,i=N时结束处理程序。
这样,在本实施例中,由于利用残差向量来查找最佳代码向量,无需像现有的正交化查找方法那样在查找循环中对代码向量作正交处理,从而能以很少的计算量进行查找。
实施例2
图2示出了第2实施例的向量量化装置的结构。在本实施例中,查找单元1070的结构与图1中所示的实施例1不同。亦即,与在实施例1中的求取第二映射向量P(k)的大小相对的是,在本实施例的查找单元1070中,用内积值计算单元1073求取残差向量R(k)与由加权单元1030所加权的代码向量X(k)的内积值的大小,并将此值送至评价单元1072。
在评价单元1072中,按照基于该内积值的评价方法查找最佳代码向量。作为基于内积值的评价方法的例子可以是:(1)在代码向量组由一个向量构成的情况下内积值的大小较大;(2)在代码向量组由多组构成的情况下内积值之和的大小较大。
图25为说明本实施例中的代码向量查找处理过程的流程图。其中与图24作同样的限定,采用内积值的二次方作为基于内积值大小的评价值。
步骤S21,进行初始化,设定i=1,imax=1,Emax=0。imax表示作为指定最佳向量的信息的下标,Emax表示内积值的大小的最大值。
步骤S22,计算残差R(k)。
步骤S23,计算出对残差向量作逆卷积运算的向量R′(k)。
步骤S24,计算内积值的大小
E=(Xi(k),R′(k))2
步骤S25,判定步骤S24计算出的内积值的大小E与先前计算出的内积值大小的最大值Emax之间的大小关系。
步骤S26,如果步骤S25的判定结果为Emax<E,则将E更新为新的Emax,同时将此时的i作成下标imacx。
步骤S27,在步骤S26的处理之后,或在步骤S25的判定结果为Emax的判定结果为Emax>E情况时,增加i。
步骤S28,检验是否达到设定值N。在i=N之前重复进行步骤S24至S27的处理,当i=N时,结束处理程序。
在下面的实施例中,因为由图24和图25的适宜组合,修正的流程图表示代码向量查找的处理顺序,所以省略流程图。
本实施例中查找单元1070的内积值的计算,虽然在实施例1中为映射向量计算的近似计算,但具有计算量大幅度减少的优点。例如,采用现有的正交查找来进行同样的工作,就存在着在求内积值之前对代码向量作正交处理的必要,因而增加这部分的计算量。与此相反,本实施例中由于不必作正交处理,所以能以较现有的方法要少得多的计算量来进行代码向量查找。
而在采用多级向量量化装置进行多级量化的情况下,在第k级查找时必须对直至第k-1级的查找中所求得的全部代码向量作正交处理并计算内积值。与此相反,本实施例如求得残差向量,因为内积值的计算与查找级数无关而保持一定,所以级数越多较之现有方法减少计算量的效果就越大。本实施例中所得到的查找结果与现有方法的结果相同(其理由在下述的实施例7中叙述)。
实施例3
图3示出了第3实施例的向量量化装置的结构。本实施例中的查找单元1070中,其内积值计算单元1073与评价单元1072之间插入有加权单元1074,以由加权系数计算单元1075根据代码向量求得的加权系数对由内积值计算单元1073求得的内积值的大小作加权处理,以基于此经加权的内积值的评价方法查找最佳代码向量。评价单元1072中的评价方法也可与实施例2中说明的方法相同。
按照本实施例,虽然因为对内积值的大小作加权处理而使计算量有所增加,但提高了查找精度。因此,随着无须进行现有方法中那样的正交处理,而能以能少的计算量进行精度高的查找。
实施例4
图4示出了第4实施例的向量量化装置的结构。本实施例中的查找单元为由备用选择单元1370a与基本选择单元1370b组成的二级结构。备用选择单元1370a采用可能的查找方法以尽可能少的计算量进行代码向量查找,选择数个代码向量作为备用选择候补。在此例中,备用选择单元1370a与图3中所示的实施例3中的查找单元1070相同,由评价单元1072,内积值计算单元1073、加权单元1074和加权系数计算单元1075构成,但也可以是与图2中所示的实施例2的查找单元1070相同的结构。
备用选择单元1370a所选择的备用选择候补信息1380被传送给基本选择单元1370b。基本选择单元1370b以针对备用选择候补的高精度查找方法,例如实施例1所示查找单元1370相同的结构,由备用选择候补中选择一个或多个代码向量作为最佳代码向量,并输出作为查找结果的作为最佳代码向量的信息的指针。
本实施例为兼备实施例1和3的优点的结构,具有能以很少的计算量选择更好的代码向量的候补的优点,亦即,备用选择单元1370a因为不进行正交处理来计算内积值,因而能大大减少计算量,而基本选择单元1370b依靠计算完整的评价状态而能使代码向量的查找精度得以提高。
而且可以将查找单元作成三级以上的结构,例如也可以将备用选择单元设置成二级,对第一级备用选择单元中所选择的候补在第二级备用选择单元中作进一步缩小候补,再对第二级备用选择单元所选择的候补进行基本选择。
实施例5
图5示出了实施例5的向量量化装置的结构。本实施例改变了图4所示实施例4的基本选择单元1370b的结构。亦即,本实施例中的基本选择单元1370b,在正交化向量计算单元1076中求取将经加权单元1030加权的代码向量在第一基本向量伸展空间上作正交处理的向量。而在评价单元1072中,则由将经过加权的代码向量按此作正交化的向量的大小进行分割,对由备用选择单元1370a所得的选择备用候补加以评价,以选择最佳代码向量。
实施例6
图6示出了采用按照本发明的向量量化装置的向量编码/译码装置的一实施例的结构。编码装置3000对输入的目标向量R进行多级(M级)向量量化。M级量化装置3001~3003中至少一级采用上述实施例1~5中的任一个向量量化装置进行量化。用于指定量化装置3001~3003各自查找得的最佳代码向量的指针,和由增益计算单元3004所得的增益信息被传送至译码装置4000。
在译码装置4000中,按照由编码装置3000所传送的指针,由M级译码装置4001~4003对代码向量进行译码,根据这些值以及增益信号由合成单元4004取得目标向量的量化值。
像这样将实施例1~5用于多级向量量化装置,除了能实现减少计算量的效果之外,由于是递归地处理,所以不管由软件还是硬件来实现这种处理,均能容易地实现处理过程。
实施例7
图7示出了实施例7的向量量化装置的结构。此向量量化装置由代码本111~112、加权单元120、第一查找单元130、残差向量计算单元140和第二查找单元170构成。而第二查找单元170则由评价单元172和映射向量计算单元173组成。
第一查找单元130输出接近于输入端180所输入的目标向量的向量(以下称近似向量)X1。残差向量计算单元140计算近似向量X1与目标向量R的残差向量Rv。此残差向量Rv被输入到映射向量计算单元173。另一方面,分别由代码本111~112逐个选出的代码向量X2~XN经加权单元120加权,被作为经加权的向量组X2~XN输入至映射向量计算单元173。
在映射向量计算单元173中,计算残差向量Rv相对近似向量X1与向量组X2~XN的伸展空间的映射量的大小。评价单元172由代码本111~112中查找该映射向量Rv较大的代码向量,并输出指定该代码向量的信息作为查找结果171。而作为查找结果的表示代码向量自身的代码,也可以是间接地指定这些例如行距周期等的信息。
下面利用图8对按照本实施例的结构求取最佳代码向量的理由作几何上的说明。近似向量X1与向量组X2~XN的线性结合最接近目标向量R的情况是,在目标向量R对X1~XN伸展空间的映射向量作为Rp时,使得偏离向量的大小|R-Rp|为最小。如以近似向量接近目标向量时的残差向量作为Rv和其映射向量作为Rvp,则
|R-Rp|=|Rv-Rvp|要使得|R-Rp|成为最小,即与使得|Rv-Rvp|成为最小一样。
这里,Rvp为映射向量,由Rv、Rvp作成的三角形为直角三角形,因此,按三平方定理得出
|Rv|2=|Rvp|2+|Rv-Rvp|2在进行查找时,因近似向量X1与目标向量R为固定向量,所以相当于直角三角形的斜边的残差向量Rv也是固定的。因而,使|Rv-Rvp|成为最小,就看作是与使残差向量Rv的映射向量的大小|Rvp|成为最大是等效的。
现对以上所述用算式来进行详细说明。残差向量Rv如式(3)所示: Rv = R - ( R , X 1 ) | X 1 | 2 X 1 - - - ( 3 )
这里,Rvp为X1~XN所伸展平面上的向量,所表示为:
Rvp=a1*X1+a2*X2+……+aN*XN                  (4)系数a1~aN由使得|Rv-Rvp|为最小来确定。其确定方法的细节在日本专利申请平6-96655中予以介绍。将其代入|Rv-Rvp|2式中整理后得:
|Rv-Rvp|2=|Rv|2-|Rvp|2                      (5)|Rv|2为固定数,为使映射向量的长Rvp2为最大,即成为相当于使误差|Rv-Rvp|为最小。
这里,式(3)中第二项X1的系数(R,X1)/|X1|2即成为X1接近R时的最佳增益。在编码等情况情况中对此最佳增益进行量化或求取以最佳增益为依据的值时,也可能由此值来求取残差向量Rv来代替最佳增益(R,X1)/|X1|2
对于经加权的向量组为一个时的详细计算结果如下。在将Rv的映射向量Rvp作为
Rvp=a1*X1+a2*X2                             (6)时,此映射向量Rvp的长|Rvp|2按照日本专利申请平6-96655所述的方法,为|Rvp|2={|X1|2*(Rv,X2)2-2*(Rv,X1)(X1,X2)(X2,Rv)+|X2|2*(Rv,X1)}/D   …(7)其中
D=|X1|2*|X2|2-(X1,X2)2                     (8)这里,如计算式(3)X1的内积值,因为(X1,Rv)=0,所以式(7)的第二项、第三项成为0,得出:
|Rvp|2={|X1|2*(Rv,X2)2}/D                  (9)因为X1为固定值,最后,如下所示,评价值E为:
E={(Rv,X2)2}/D             (10)
这里,对于经加权的向量组为一组的情况,虽然现有的方法广泛采了用正交查找法(平5-506514),而按本实施例则得到与之相同的结果。其理由是,在如式(11)那样利用式(1)将正交查找的式(2)展开并作变形时,即成为与本实施例的式(9)相等。而且由式(11)的第三行至第4行的分子变形即用到式(3)的关系。 E = ( R , X 2 v ) 2 | X 2 v | 2 X 1 { ( R , X 2 ) - ( R , X 1 ) ( X 1 , X 2 ) / | X 1 | 2 } 2 | X 2 - { ( X 2 , X 1 ) / | X 1 | 2 } X 1 | 2 = ( R - [ ( R , X 1 ) / | X 1 | 2 ] X 1 , X 2 ) 2 | X 2 | 2 - ( X 2 , X 1 ) 2 / | X 1 | 2 = | X 1 | 2 · ( Rv , X 2 ) 2 D · · · ( 11 )
在现有的正交查找中,在查找回路内求取促使候补向量X2正交化的X2v来进行查找,与此相对的是在本实施例中,在查找回路外求取促使目标向量R正交化的Rv时,能够考虑在查找回路内不对候补向量X2作正交处理进行查找。从而,因在查找回路内不进行正交处理,因而与现有的正交查找相比,具有大大减少计算量并可获得完全相同结果的优点。
实施例8
图9示出了实施例8的向量量化装置的结构。本实施例涉及高效率近似计算评价值的方法,本实施例的第二查找单元170的结构与实施例7不同。亦即,在本实施例中不是像实施例7那样求取映射向量的大小,而是由内积值计算单元174求出残差向量与目标向量(经加权的代码向量)的内积值大小,再由评价单元172求取其内积值较大的代码向量。仅利用内积值的大小,在假定式(10)的分母为恒定值时,就只要计算分子。虽然这是近似计算,常常不能求得最佳代码向量,但却具有能以比实施例7更少的计算量来求取最佳候补值的优点。
实施例9
图10示出了实施例9的向量量化装置的结构。本实施例涉及实施例8中的近似计算的精度提高的方法。由加权系数计算单元175求取基于代码向量的加权系数,将此加权系数在加权单元176中与内积值计算单元174求得的内积值的大小相乘所得的值作为评价值。作为加权系数的具体例子,例如可以采用代码向量的乘方的倒数。
按照本实施例,与实施例8相比虽然稍稍增加了计算量,但却具有提高近似精度的优点。关于精度提高的依据以及其它加权系数的例子在日本专利申请平6-65265中有所介绍。
实施例10
图11示出了实施例10的向量量化装置的结构。本实施例给出了具有适应代码本211和噪声代码本212的CELP编码方式中的代码本查找单元的处理。如已介绍的那样,通常由适应代码本211选择最佳代码向量,然后再进行噪声代码本212的查找。本实施例即为在此噪声代码本212查找中应用本发明的示例。
在图11中,加到输入端260的输入语音在音响加权单元240中作音响加权,去除前面帧的影响就成为目标向量R。之后,根据此目标向量由适应代码本211查找生成接近的合成语音向量的代码向量,将此代码向量作为X1,通过加权合成滤波器230得到合成语音向量作为X1。在残差向量计算单元140中,按式(12)由合成语音向量X1和目标向量R求取残差向量Rv。 Rv = R - ( R , X 1 ) ′ | X 1 | 2 X 1 · · · ( 12 )
在映射向量计算单元173,输出作为映射向量大小的
E={(Rv,X2)2}/D                        (13)其中
D=|X1|2*|X2|2-(X1,X2)2                (14)
X2为将噪声代码本212的候补作为X2,通过加权合成滤波器230得到的语音向量。
在评价单元172中,由噪声代码本查找出E值较大的X2,输出查找结果171。
在本实施例中,因为目标向量和适应代码本2l1的代码向量是在查找前确定的,开始查找前仅作一次残差向量Rv的计算,在噪声代码本212的查找中照原样使用X2,而可能以计算式(13)来进行查找,所以与对X2作正交处理进行查找的正交查找法相比,具有减少计算量的优点。
由放大电路221、222所给出的增益值,通常在求得代码向量后决定,所以在查找中也可以作为1。
而且,代码本的种类也不限于适应代码本和噪声代码本,还考虑二个噪声代码本的组合。这样,本发明所描述的内容能适用于不依赖于代码本的种类、结构和个数。这在以下的实施例中也是同样的。
实施例11
图12示出了实施例11的向量量化装置的结构。在本实施例中,与实施例10同样地求得的残差向量,经过逆卷积运算单元260而成为Rv′。在内积值计算单元174中,将Rv′和噪声代码本212的代码和量X2的内积的二次方值
E=(Rv′,X2)2                              (15)作为评价值输出,评价单元172由噪声代码本212查找出E较大的代码向量,作为查找结果输出。E的值等于按式(16)的关系得到的式(13)的分子的值:
            t        t
(Rv,X2)=Rv·HX2=Rv  H·X2=(R′v,X2)    (16)其中,H为加权合成滤波器的脉冲响应矩阵。RvH的计算称之为逆卷积运算,由将向量Rv项作逆序排列,并将加权合成滤波器进行卷积所得的结果再作逆序排列改变来实现。依靠在查找开始前对Rv作逆卷积处理,就不必再由加权合成滤波器在查找中对X2作卷积处理,因而能使计算量减少。
本实施例中,如将式(13)的分母看作不变地进行近似的评价计算,由于采用逆卷积运算就具有较之实施例4能进一步减少计算量的优点。但因为是近似计算,在通常要查找最佳候补时,很多场合下要采用下述的实施例13所述的那样作为备用选择手段。而逆卷积计算也可能是实施例10中的分子计算中所用的过程。
实施例12
图13示出了实施例12的向量量化装置的结构。本实施例为提高近似的精度,对与实施例11同样地求得内积值的大小,例如以由加权系数计算单元175求得的代码向量X2的乘方的倒数作为加权系数在加权单元176加权得到的值:
E=(Rv′,X2)2/|X2|2                        (17)以此作为评价值,进行噪声代码本412的查找。这一方法虽然比实施例5增加若干计算量,但具有提高近似计算的精度的优点。其依据以及其它加权系数的例子,在日本专利申请平6-65265中已有披露。
实施例13
图14示出了实施例13的向量量化装置的结构。本实施例以实施例6的查找单元作备用选择单元370a、实施例10的查找单元作基本选择单元370b来构成。在实施例的评价公式中,分母的计算,特别是|X2|2的计算比较昂贵。这是因为X2有必要在查找循环内利用合成滤波器时对X2作卷积运算,而|X2|2的计算不使用逆卷积运算。
因此在本实施例中由备用选择单元370a的近似计算选择数个使评价式较大的X2,将其指针和备用选择中的评价式的分子的值作为备用选择候补371送至基本选择单元370b。在基本选择单元370b中,对送来的备用选择候补计算分母值,构成基本选择的评价式,查找使之较大的候补,将表明最佳候补X2的信息作为查找结果171输出。
本实施例为有效利用实施例12和10的优点的结构,具有以少量计算选择更佳候补的优点。而作为备用选择单元,除实施例12之外,也可利用实施例11及其它的结构。
实施例14
对于本实施例,在与图11中所示的实施例10中的噪声代码本212具有VSELP结构的情况下,根据本发明可不改变性能而降低计算量。历来,在将各基本向量经加权合成滤波器作卷积得到的合成语音向量对适应代码本的候补X1进行正交处理后,递归地对相当于式(2)的评价式进行计算,以决定基本向量的代码。
与此相反,本发明中不对基本向量的响应作正交处理,以求取对目标向量作正交处理的残差向量Rv,由递归地对相当于式(10)的评价式进行计算,因而具有以少量计算决定基本向量的代码的优点。而且,如利用实施例13中所述的备用选择与基本选择相结合,就具有以更少的计算量救是基本为最佳代码的优点。
实施例15
图15示出了实施例15的向量量化装置的结构。本实施例为将本发明应用于CELP语音编码方式的情况,对输入语音在音响加权单元中作加权得到的目标向量R(0)进行多级向量量化。在第一级查找块1421中,作为初始化值,例如分别将P(0)给予零向量,B(0)给予空集合。这些初始化值是概念上的,也有时不加以明示。由端子1401输入的输入语音经音响加权单元1410处理,成为残差向量的初始化值R(0)。经线性予测分析单元1430分析过的参数被送至各查找决1421~1423的加权单元1030,构成加权合成滤波器。这些查找块1421~1423,由上述说明中的实施例1~14中的任一个的向量量化装置构成。
而在已谈过的CELP语音编码方式中,依靠采用逆卷积运算能相当程度地减少加权合成滤波器中的计算量。虽然作为举例如在图16和17中所示在实施例1、3中采用逆卷积运算的情况,但如作成设置加权合成滤波器的方式,在除实施例1、3外的实施例作同样的处理也能降低计算量。
逆卷积运算单元1630本身的结构大体上与加权合成滤波器相同,不同点在于:将输入向量的顺序倒转后进行滤波,并将所得到的向量再次倒转输出的向量作为等价的向量输出。在采用逆卷积运算的情况中,查找单元块1421~1423所输入的线性予测分析单元的参数被送至逆卷积运算单元1630。
在求取残差向量方面,除到目前所述的方法外,还有求取目标向量与其近似向量之差的方法。现对这一方法加以说明。
图18示出了求取第二残差向量的部分的图示,图19则为图18的另一图示。亦即,取第一残差向量与其映射向量的差,等于取目标向量R(0)与其映射向量Q(k-1)的差。利用表明作二级查找的例子的图8对其理由已作了直观的说明。图8的虚线部分R-Rp为目标向量与其映射向量之差,而残差向量与其映射向量的差为Rv-Rvp,两者成为同一向量是十分明显的。
如将这一事实适用于本实施例中,就可能得到图20所示的结构。其中,查找块中所包含的图18的结构的部分替换为图19中所示的结构,输入参考即变成为目标向量R(0)和近似向量Q(u)。这在本质上与图15的结构相同,也可以有其它的结构方法。这并不限于CELP语音编码方式,多级向量量化一般也是同样的。
实施例16
图21所示为实施例16的向量量化装置的结构。本实施例为CELP语音编码方式中最易使用的结构的一个示例。也就是,相当于加权单元的加权合成滤波器2130在一系列查找中是共同的,由多个代码本211~2112的每一个中在各查找块1421~1423中逐个地查找一代码向量。
图22所示为本实施例的查找块的结构示例。采用逆卷积运算与备用选择法能有效地减少计算量。这一实施例除外加代码本和加权滤波器和查找的代码向量的数量为1之外,实质上与实施例2相同。采用同样的变更,其它的实施例也适用于本实施例的查找块。而在不采用逆卷积运算的情况下,亦可不将代码向量输入到直接查找块。
如上所述那样,按照本发明利用残差向量进行最佳代码向量的查找,由于在查找循环内无需对代码向量作正交处理,因而能以比现有的正交查找法少的计算量查找最佳代码向量,特别是在多级化的向量量化装置中计算量减少的效果更大。

Claims (31)

1.一种向量量化装置,包括:
接收与预期输出对应的第一基本向量的集合的单元;
接收目标向量的单元;
基于上述第一基本向量的集合和目标计算与上述目标接近的近似向量,并计算与上述目标向量和上述近似向量的差相对应的残差向量的单元;
输出代码向量的集合的代码向量单元;
从上述代码向量的集合选择至少一个代码向量的选择单元;
基于由该选择装置所选择的代码向量和第一基本向量的集合生成第二基本向量的集合的单元;
从上述代码向量的集合中,查找使上述残差向量在由上述第二基本向量的集合形成的向量空间中映射得到的映射向量的大小增大的代码向量组的查找单元;和
输出指定由该查找手段所查找到的向量的信息的单元。
2.如权利要求1上述的向量化量化装置,其中上述查找单元包括:
映射向量单元,用来接收第二基本向量的集合,并计算使上述残差向量在由上述第二基本向量的集合形成的向量空间中映射得到的映射向量的大小增大的代码向量组的结合;和
评价单元,用来从上述代码向量的集合中查找使映射向量最大化的代码向量。
3.如权利要求1上述的向量量化装置,其中还包括:
用来对从上述代码向量的集合中选出的代码向量加权的加权单元,
其中,上述生成第二基本向量的集合的单元从加权后的代码向量和上述第一基本向量的集合计算第二基本向量。
4.如权利要求3上述的向量化量化装置,其中上述查找单元包括:
映射向量单元,用来接收第二基本向量的集合,并计算使上述残差向量在由上述第二基本向量的集合形成的向量空间中映射得到的映射向量的大小增大的代码向量组的结合;和
评价单元,用来查找使映射向量最大化的代码向量。
5.如权利要求3上述的向量量化装置,其中上述查找单元包括:
存储大量代码向量的代码本;和
从上述代码本查找最佳代码向量的单元。
6.如权利要求1上述的向量量化装置,其中还包括:
预选单元,用来从代码向量的集合中选择可使增加映射向量的评价值的大小增加的代码向量。
7.如权利要求6所述的向量量化装置,其中:
上述预选单元基于被上述选择单元选择的代码向量和上述残差向量的内积,选择可使评价值的大小增加的代码向量。
8.一种向量量化装置,包括:
接收与预期输出对应的第一基本向量的集合的单元;
接收目标向量的单元;
基于上述第一基本向量的集合和目标计算与上述目标接近的近似向量,并计算与上述目标向量和上述近似向量的差相对应的残差向量的单元;
输出代码向量的集合的代码向量单元;
从上述代码向量的集合选择至少一个代码向量的选择单元;
从上述代码向量的集合中,查找使与上述选择单元选择的代码向量和上述残差向量的内积相对应的评价值最大的至少一个代码向量;和
输出指定由该查找手段所查找到的向量的信息的单元。
9.如权利要求8上述的向量量化装置,其中上述查找单元包括:
计算上述残差向量和上述被选择的代码向量的内积的内积计算单元;和
从上述代码向量的集合中基于内积查找使评价值最大的代码向量的查找单元。
10.如权利要求9上述的向量量化装置,其中还包括:
对上述代码向量加权的加权单元,
其中,上述内积计算单元计算被加权的代码向量和上述残差向量的内积。
11.如权利要求8所述的向量量化装置,其中:
上述查找单元查找使上述代码向量和上述残差向量的内积最大化的代码向量。
12.一种向量量化装置,包括:
接收与预期输出对应的第一基本向量的集合的单元;
接收目标向量的单元;
基于上述第一基本向量的集合和目标计算与上述目标接近的近似向量,并计算与上述目标向量和上述近似向量的差相对应的残差向量的单元;
输出代码向量的集合的代码向量单元;
从上述代码向量的集合选择至少一个代码向量的选择单元;
基于上述选择单元选择的代码向量和上述残差向量的内积,从上述代码向量的集合中选择多个可使评价值增加的代码向量作为预选候用的第一查找单元,
基于上述第一查找单元选出作为预选候用的代码向量和上述第一基本向量的集合生成第二基本向量的集合的单元;
从上述代码向量的集合,查找使上述残差向量在由上述第二基本向量的集合形成的向量空间中映射得到的映射向量的大小增大的最佳代码向量的第二查找单元;和
输出指定由该查找手段所查找到的向量的信息的单元。
13.如权利要求12上述的向量量化装置,其中上述第一查找单元包括:
计算上述残差向量和上述被选择的代码向量的内积计算单元;和
基于上述内积查找使评价值最大的代码向量的查找单元。
14.如权利要求12上述的向量量化装置,其中还包括:
用来对从上述代码向量的集合中选出的代码向量加权的加权单元,
其中,上述第一查找单元从被加权的代码向量的集合中选择多个被加权的代码向量作为预选候用,上述生成第二基本向量的集合的单元从加权后的代码向量和上述第一基本向量形成的向量空间计算第二基本向量的集合。
15.如权利要求12上述的向量化量化装置,其中上述第二查找单元包括:
映射向量单元,用来接收第二基本向量的集合,并计算使上述残差向量在由上述第二基本向量的集合形成的向量空间中映射得到的映射向量的大小增大的代码向量组的结合;和
评价单元,用来从上述代码向量的集合中查找使映射向量最大化的代码向量。
16.一种向量量化装置,包括:
接收与预期输出对应的第一基本向量的集合的单元;
接收目标向量的单元;
基于上述第一基本向量的集合和目标计算与上述目标接近的近似向量,并计算与上述目标向量和上述近似向量的差相对应的残差向量的单元;
输出代码向量的集合的代码向量单元;
从上述代码向量的集合选择至少一个代码向量的选择单元;
预选单元,用来基于上述选择单元选择的代码向量和上述残差向量的内积,从代码向量的集合中选择了使评价值增加的代码向量;
主选择单元,包括基于上述预选单元选择的代码向量和上述第一基本向量的集合生成第基本向量的集合的单元;
从上述代码向量的集合中,查找使上述残差向量在由上述第二基本向量的集合形成的向量空间中映射得到的映射向量的大小增大的代码向量组的查找单元;和
输出指定最佳代码向量的信息的单元。
17.如权利要求16上述的向量量化装置,其中上述主选择单元包括:
从预选候用中选择可使如下上述的值最大的最佳代码向量的单元,该值是用在上述第一基本向量的集合形成的向量空间中正交的代码向量的大小去除在上述预选单元中使用的内积得到的。
18.如权利要求16所述的向量量化装置,其中:
上述预选单元选择使如下上述的值增加的代码向量,该值是基于一个代码向量用加权系数对该代码向量和上述残差向量的内积加权得到的。
19.如权利要求16上述的向量量化装置,其中上述预选单元包括:
用上述代码向量和上述残差向量的后过滤向量的内积计算上述内积的单元。
20.一种向量量化装置,包括:
接收与预期输出对应的第一基本向量的集合的单元;
接收目标向量的单元;
基于上述第一基本向量的集合和目标计算与上述目标接近的近似向量,并计算与上述目标向量和上述近似向量的差相对应的残差向量的单元;
输出代码向量的集合的代码向量单元;
从上述代码向量的集合选择至少一个代码向量的选择单元;
基于上述选择单元选择的代码向量和上述残差向量的内积,从上述代码向量的集合中,查找使评价值最大的代码向量的查找单元,其包括用上述代码向量和上述残差向量的后过滤向量的内积计算与上述内积对应的值的单元;和
输出指定由该查找手段所查找到的向量的信息的单元。
21.如权利要求20上述的向量量化装置,其中上述查找单元包括:
多个存储代码向量的代码本;
设在外部的加权合成过滤器;以及
对残差向量后过滤的后过滤单元。
22.如权利要求20上述的向量量化装置,其中上述查找单元包括:
计算代码向量的加权系数计算器;和
在上述内积上乘上一个与上述代码向量的平方的倒数对应的加权系数的加权部分,以获得用来查找随机代码本的评价值。
23.如权利要求20上述的向量量化装置,其中上述查找单元包括:
通过近似计算选择多个向量候用的预选单元;和
计算各个预选候用的分母的值的主选择单元,且
构成主选择部分的评价公式,然后寻找一个使评价公式最大化的候用,并把表示该最佳候用的信息输出。
24.如权利要求20上述的向量量化装置,其中还包括:
获得上述残差向量的后过滤向量的后过滤单元,且
上述查找单元包括从上述代码向量和上述残差向量的后过滤向量计算上述内积的单元。
25.如权利要求20上述的向量量化装置,其中还包括:
获得上述残差向量的后过滤向量的后过滤单元,且
其中上述查找单元包括:通过近似计算选择多个向量候用的预选单元;和从上述代码本的代码向量的集合中查找使上述残差向量在由上述第二基本向量的集合形成的向量空间中映射得到的映射向量的大小增大的代码向量组的主选择单元。
26.如权利要求20上述的向量量化装置,其中上述查找单元包括:
多个存储代码向量的代码本;设在外部的加权合成过滤器;以及对残差向量后过滤的后过滤单元,
其中上述查找单元包括:通过近似计算选择多个向量候用的预选单元;和从上述代码本的代码向量的集合中查找使上述残差向量在由上述第二基本向量的集合形成的向量空间中映射得到的映射向量的大小增大的代码向量组的主选择单元。
27.一种向量量化方法,包括:
接收与预期输出对应的第一基本向量的集合;
基于上述第一基本向量的集合和目标计算与上述目标接近的近似向量,
计算与上述目标向量和上述近似向量的差相对应的残差向量的单元;
生成代码向量的集合;
从上述代码向量的集合选择至少一个代码向量;
基于由该选择装置所选择的代码向量和第一基本向量的集合生成第二基本向量的集合;
从上述代码向量的集合,查找使上述残差向量在由上述第二基本向量的集合形成的向量空间中映射得到的映射向量的大小增大的代码向量;和
输出指定由该查找所查找到的向量的信息。
28.一种向量量化方法,包括:
接收与预期输出对应的第一基本向量的集合;
基于上述第一基本向量的集合和目标计算与上述目标接近的近似向量,
计算与上述目标向量和上述近似向量的差相对应的残差向量的单元;
生成代码向量的集合;
从上述代码向量的集合选择至少一个代码向量;
从上述代码向量的集合中,查找使与上述选择单元选择的代码向量和上述残差向量的内积相对应的评价值最大的代码向量的集合;和
输出指定由查找到的向量的信息的单元。
29.一种向量量化方法,包括:
接收与预期输出对应的第一基本向量的集合;
基于上述第一基本向量的集合和目标计算与上述目标接近的近似向量,
计算与上述目标向量和上述近似向量的差相对应的残差向量的单元;
生成代码向量的集合;
从上述代码向量的集合选择至少一个代码向量;
基于上述选择单元选择的代码向量和上述残差向量的内积,从上述代码向量的集合中选择多个可使评价值增加的代码向量作为预选候用;
基于上述第一查找单元选出作为预选候用的代码向量和上述第一基本向量的集合生成第二基本向量的集合;
从上述代码向量的集合,查找使上述残差向量在由上述第二基本向量的集合形成的向量空间中映射得到的映射向量的大小增大的最佳代码向量;和
输出指定最佳代码向量的信息。
30.一种向量量化方法,包括:
接收与预期输出对应的第一基本向量的集合;
基于上述第一基本向量的集合和目标计算与上述目标接近的近似向量,
计算与上述目标向量和上述近似向量的差相对应的残差向量的单元;
生成代码向量的集合;
从上述代码向量的集合选择至少一个代码向量;
基于上述选择单元选择的代码向量和上述残差向量的内积,从上述代码向量的集合中选择多个可使评价值增加的代码向量;
基于上述查找单元选出的代码向量和上述第一基本向量的集合生成第二基本向量的集合;
从上述代码向量的集合,查找使上述残差向量在由上述第二基本向量的集合形成的向量空间中映射得到的映射向量的大小增大的代码向量;和
输出指定最佳代码向量的信息。
31.一种向量量化方法,包括:
接收与预期输出对应的第一基本向量的集合;
基于上述第一基本向量的集合和目标计算与上述目标接近的近似向量,
计算与上述目标向量和上述近似向量的差相对应的残差向量的单元;
生成代码向量的集合;
从上述代码向量的集合选择至少一个代码向量;
基于上述选择单元选择的代码向量和上述残差向量的内积查找使评价值最大的代码向量,其包括用上述代码向量和上述残差向量的后过滤向量的内积计算与上述内积对应的值;和
输出指定由该查找所查找到的向量的信息的单元。
CN95107152A 1994-05-27 1995-05-25 向量量化装置和方法 Expired - Fee Related CN1106710C (zh)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
JP11546594 1994-05-27
JP115465/1994 1994-05-27
JP115465/94 1994-05-27
JP26782894A JP3224955B2 (ja) 1994-05-27 1994-10-31 ベクトル量子化装置およびベクトル量子化方法
JP267828/1994 1994-10-31
JP267828/94 1994-10-31

Publications (2)

Publication Number Publication Date
CN1120268A CN1120268A (zh) 1996-04-10
CN1106710C true CN1106710C (zh) 2003-04-23

Family

ID=26453959

Family Applications (1)

Application Number Title Priority Date Filing Date
CN95107152A Expired - Fee Related CN1106710C (zh) 1994-05-27 1995-05-25 向量量化装置和方法

Country Status (7)

Country Link
US (1) US5677986A (zh)
EP (1) EP0684702B1 (zh)
JP (1) JP3224955B2 (zh)
KR (1) KR100190183B1 (zh)
CN (1) CN1106710C (zh)
DE (1) DE69528685T2 (zh)
TW (1) TW264592B (zh)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3273455B2 (ja) * 1994-10-07 2002-04-08 日本電信電話株式会社 ベクトル量子化方法及びその復号化器
KR100322706B1 (ko) * 1995-09-25 2002-06-20 윤종용 선형예측부호화계수의부호화및복호화방법
EP0788091A3 (en) * 1996-01-31 1999-02-24 Kabushiki Kaisha Toshiba Speech encoding and decoding method and apparatus therefor
JP3357795B2 (ja) * 1996-08-16 2002-12-16 株式会社東芝 音声符号化方法および装置
JP3707153B2 (ja) * 1996-09-24 2005-10-19 ソニー株式会社 ベクトル量子化方法、音声符号化方法及び装置
EP1136985B1 (en) 1996-11-07 2002-09-11 Matsushita Electric Industrial Co., Ltd. Apparatus and method for CELP speech coding and decoding
US6161086A (en) * 1997-07-29 2000-12-12 Texas Instruments Incorporated Low-complexity speech coding with backward and inverse filtered target matching and a tree structured mutitap adaptive codebook search
DE69836624T2 (de) 1997-10-22 2007-04-05 Matsushita Electric Industrial Co., Ltd., Kadoma Audiokodierer und -dekodierer
JP3261691B2 (ja) * 1997-11-28 2002-03-04 沖電気工業株式会社 符号帳予備選択装置
CZ304212B6 (cs) * 2000-11-27 2014-01-08 Nippon Telegraph And Telephone Corporation Způsob kódování a dekódování akustického parametru, kódovací a dekódovací zařízení akustického parametru, a program pro provedení způsobu kódování a dekódování akustického parametru
CA2733453C (en) * 2000-11-30 2014-10-14 Panasonic Corporation Lpc vector quantization apparatus
JP4623920B2 (ja) * 2002-07-09 2011-02-02 ソニー株式会社 類似度算出方法及び装置、並びにプログラム及び記録媒体
KR100492965B1 (ko) * 2002-09-27 2005-06-07 삼성전자주식회사 벡터 양자화를 위한 고속 탐색방법
KR100651712B1 (ko) * 2003-07-10 2006-11-30 학교법인연세대학교 광대역 음성 부호화기 및 그 방법과 광대역 음성 복호화기및 그 방법
US7475011B2 (en) * 2004-08-25 2009-01-06 Microsoft Corporation Greedy algorithm for identifying values for vocal tract resonance vectors
CN101345530B (zh) * 2007-07-11 2010-09-15 华为技术有限公司 一种矢量量化方法及矢量量化器
US8493244B2 (en) * 2009-02-13 2013-07-23 Panasonic Corporation Vector quantization device, vector inverse-quantization device, and methods of same
EP3038104B1 (en) * 2013-08-22 2018-12-19 Panasonic Intellectual Property Corporation of America Speech coding device and method for same
US10255323B1 (en) 2015-08-31 2019-04-09 Google Llc Quantization-based fast inner product search
US10063892B2 (en) 2015-12-10 2018-08-28 Adobe Systems Incorporated Residual entropy compression for cloud-based video applications
US10264262B2 (en) 2016-02-29 2019-04-16 Adobe Inc. Codebook generation for cloud-based video applications
US10719509B2 (en) * 2016-10-11 2020-07-21 Google Llc Hierarchical quantization for fast inner product search
CN109693999B (zh) * 2017-10-23 2020-05-01 上海三菱电梯有限公司 自动扶梯或人行道信息监控装置
US11392596B2 (en) 2018-05-14 2022-07-19 Google Llc Efficient inner product operations
WO2021215234A1 (ja) * 2020-04-20 2021-10-28 ソニーグループ株式会社 情報処理システム、情報処理方法、プログラム、情報処理装置、及び演算装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62166655A (ja) * 1986-01-20 1987-07-23 Nippon Telegr & Teleph Corp <Ntt> 自己トレ−ニング機能を有するベクトル量子化方式
US4878230A (en) * 1986-10-16 1989-10-31 Mitsubishi Denki Kabushiki Kaisha Amplitude-adaptive vector quantization system
US4817157A (en) * 1988-01-07 1989-03-28 Motorola, Inc. Digital speech coder having improved vector excitation source
EP0364647B1 (en) * 1988-10-19 1995-02-22 International Business Machines Corporation Improvement to vector quantizing coder
KR930004311B1 (ko) * 1989-04-18 1993-05-22 미쯔비시덴끼 가부시끼가이샤 동화상 부호화 복호화장치
IL94119A (en) * 1989-06-23 1996-06-18 Motorola Inc Digital voice recorder
GB2235354A (en) * 1989-08-16 1991-02-27 Philips Electronic Associated Speech coding/encoding using celp
JP3129778B2 (ja) * 1991-08-30 2001-01-31 富士通株式会社 ベクトル量子化器

Also Published As

Publication number Publication date
DE69528685T2 (de) 2003-07-03
EP0684702B1 (en) 2002-10-30
US5677986A (en) 1997-10-14
JP3224955B2 (ja) 2001-11-05
EP0684702A2 (en) 1995-11-29
CN1120268A (zh) 1996-04-10
DE69528685D1 (de) 2002-12-05
KR100190183B1 (ko) 1999-06-01
TW264592B (zh) 1995-12-01
KR950035109A (ko) 1995-12-30
JPH0844400A (ja) 1996-02-16
EP0684702A3 (en) 2000-02-23

Similar Documents

Publication Publication Date Title
CN1106710C (zh) 向量量化装置和方法
CN1200403C (zh) 线性预测编码参数的矢量量化装置
CN1236420C (zh) 量化线谱对参数特征提取器及其特征提取方法
CN1187735C (zh) 多模式话音编码装置和解码装置
CN1220178C (zh) 在码本中进行搜索以对声音信号编码的方法和设备
CN1172294C (zh) 音频编码装置、音频编码方法、音频解码装置及音频解码方法
CN1096148C (zh) 信号编码方法和装置
CN1252681C (zh) 一种码激励线性预测语音编码器的增益量化
CN1201288C (zh) 解码方法和设备
CN1172292C (zh) 在编码宽带信号中用于适应性带宽音调搜寻的方法与设备
CN1114900C (zh) 快速语音编码的代数码书深度优先搜索方法
CN1161751C (zh) 语音分析方法和语音编码方法及其装置
CN1097396C (zh) 声音编码装置和方法
CN1156872A (zh) 语音编码的方法和装置
CN1185625C (zh) 语音编码方法及语音编码装置
CN1129485A (zh) 信号分析装置
CN1249035A (zh) 声音编码装置、声音译码装置及声音编码译码装置、以及声音编码方法、声音译码方法及声音编码译码方法
CN1222926C (zh) 语音编码方法及其装置
CN1957399A (zh) 语音/音频解码装置以及语音/音频解码方法
CN1922660A (zh) 通信装置和信号编码/解码方法
CN1977311A (zh) 语音编码装置、语音解码装置及其方法
CN1139912C (zh) 码激励线性预测编码型语音编码装置
CN1669071A (zh) 用于在音频代码的编码/解码处理之间转换代码的方法和装置以及使用该方法和装置的存储介质
CN1144178C (zh) 音频信号编码装置和译码装置以及音频信号编码和译码方法
CN1135528C (zh) 声音编码装置以及声音解码装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20030423

Termination date: 20130525