CN101821800B - 矢量量化装置、矢量反量化装置和其方法 - Google Patents

矢量量化装置、矢量反量化装置和其方法 Download PDF

Info

Publication number
CN101821800B
CN101821800B CN200880110748XA CN200880110748A CN101821800B CN 101821800 B CN101821800 B CN 101821800B CN 200880110748X A CN200880110748X A CN 200880110748XA CN 200880110748 A CN200880110748 A CN 200880110748A CN 101821800 B CN101821800 B CN 101821800B
Authority
CN
China
Prior art keywords
vector
code
scale factor
code book
generation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN200880110748XA
Other languages
English (en)
Other versions
CN101821800A (zh
Inventor
佐藤薰
森井利幸
江原宏幸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
III Holdings 12 LLC
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Publication of CN101821800A publication Critical patent/CN101821800A/zh
Application granted granted Critical
Publication of CN101821800B publication Critical patent/CN101821800B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0004Design or structure of the codebook
    • G10L2019/0005Multi-stage vector quantisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

公开了在根据与量化对象矢量具有相关性的特征的种类切换第一级矢量量化的码本时,提高矢量量化精度的矢量量化装置。在该矢量量化装置中,分类器(101)生成表示多个种类中与宽带LSP(Line Spectral Pairs,线谱对)具有相关性的窄带LSP矢量的种类的分类信息,第一码本(103)从分别对应于窄带LSP矢量的多个种类的多个子码本(CBa1~CBan)中选择对应于分类信息的一个子码本作为在第一级量化中使用的码本,乘法器(107)将比例因子决定单元(106)所存储的多个比例因子中对应于分类信息的比例因子,乘以从加法器(104)输入的第一级的量化残差矢量,并作为第二级的量化对象输出到加法器(109)。

Description

矢量量化装置、矢量反量化装置和其方法
技术领域
本发明涉及在进行LSP(Line Spectral Pairs,线谱对)参数的矢量量化的矢量量化装置、矢量反量化装置和其方法,特别涉及在以因特网通信为代表的分组通信系统或移动通信系统等领域中,进行语音信号的传输的语音编码/解码装置所使用的、进行LSP参数的矢量量化的矢量量化装置、矢量反量化装置和其方法。 
背景技术
在数字无线通信、以因特网通信为代表的分组通信或语音存储等领域中,为了实现电波等的传输路径容量或存储媒体的有效利用,语音信号的编码和解码技术必不可少。其中,特别是CELP(Code Excited Linear Prediction,码激励线性预测)方式的语音编码/解码技术正在成为主流技术。 
CELP方式的语音编码装置基于预先存储的语音模型,对输入语音进行编码。具体而言,CELP方式的语音编码装置将数字化后的语音信号划分为10至20ms左右的一定时间间隔的帧,对各个帧内的语音信号进行线性预测分析来求线性预测系数(LPC:Linear Prediction Coefficient)和线性预测残差矢量,并分别单独地对线性预测系数和线性预测残差矢量进行编码。作为线性预测系数的编码方法,通常将线性预测系数变换为LSP(Line Spectral Pairs)参数,对LSP参数进行编码。另外,作为LSP参数的编码方法,对LSP参数进行矢量量化的情况较多。所谓矢量量化,是指从具有多个代表性矢量(代码矢量)的码本(codebook)中选择最接近于量化对象的矢量的代码矢量,输出附加到所选择的代码矢量上的索引(代码)作为量化结果的方法。在矢量量化中,根据可使用的信息量决定码本的大小。例如,在以8比特的信息量进行矢量量化时,能够使用256(=28)种代码矢量构成码本。 
另外,为了减少矢量量化中的信息量和计算量,使用了多级矢量量化(MSVQ:Multi-Stage Vector Quantization)或分裂矢量量化(SVQ:Split VectorQuantization)等各种技术(参照非专利文献1)。所谓多级矢量量化,是指对矢量进行一次矢量量化之后,进一步对量化误差进行矢量量化的方法,所谓分裂矢量量化,是指分别对将矢量分割为多个所获得的分割矢量进行量化的方法。
另外,存在以下的技术,即根据与作为量化对象的LSP具有相关性的语音性特征(例如,语音的有声性、无声性、模式等信息),适当地切换在矢量量化中使用的码本,从而进行适合于LSP的特征的矢量量化,进一步提高LSP编码性能。例如,在可扩展编码中,利用宽带LSP(根据宽带信号求出的LSP)与窄带LSP(根据窄带信号求出的LSP)之间的相互关系,并根据特征对窄带LSP进行分类,根据窄带LSP的特征的种类(以下简称为“窄带LSP的种类”)切换多级矢量量化的第一极码本,对宽频带LSP进行矢量量化(参照专利文献1)。 
非专利文献1:Allen Gersho、Robert M.Gray著,古井及另外三人翻译,「ベクトル量子化と情報圧縮」《矢量量化与信息压缩》,CORONA公司,1998年11月10日,p.506,524-531 
专利文献1:国际公开第2006/030865号小册子 
发明内容
发明需要解决的问题 
在专利文献1中记载的多级矢量量化中,使用对应于窄带LSP的种类的码本进行第一级的矢量量化,所以第一级的矢量量化的量化误差的方差因窄带LSP的种类而异。但是,在第二级以后的矢量量化中,无论窄带LSP的种类如何,均使用共用的一个码本,所以存在第二级以后的矢量量化精度变得不充分的问题。 
本发明鉴于上述各点而完成,其目的在于,提供在根据与量化对象矢量具有相关性的特征的种类切换第一级的码本的多级矢量量化中,能够提高第二级以后的矢量量化的量化精度的矢量量化装置、矢量反量化装置以及其方法。 
解决问题的方案 
本发明的用于语音信号/音乐信号的矢量量化装置包括:分类单元,生成表示多个种类中的与线谱对参数和导抗频谱对参数中的一种参数的量化对象 矢量具有相关性的特征的种类的分类信息;选择单元,从分别对应于所述多个种类的多个第一码本中选择对应于所述分类信息的一个第一码本;第一量化单元,使用构成所述选择出的第一码本的多个第一代码矢量,对量化对象矢量进行量化,获得第一代码;比例因子码本,由分别对应于所述多个种类的比例因子构成;以及第二量化单元,其具有由多个第二代码矢量构成的第二码本,并使用所述第二代码矢量和对应于所述分类信息的比例因子,对所述第一代码所表示的一个第一代码矢量与所述量化对象矢量的残差矢量进行量化,获得第二代码。 
本发明的用于语音信号/音乐信号的矢量反量化装置包括:分类单元,生成表示多个种类中的与线谱对参数和导抗频谱对参数中的一种参数的量化对象矢量具有相关性的特征的种类的分类信息;分离单元,从接收到的编码数据中分离出作为所述量化对象矢量的第一级量化结果的第一代码、以及作为所述量化对象矢量的第二级量化结果的第二代码;选择单元,从分别对应于多个种类的多个第一码本中选择对应于所述分类信息的一个第一码本;第一反量化单元,从所述选择出的第一码本中选择对应于所述第一代码的一个第一代码矢量;比例因子码本,由分别对应于所述多个种类的比例因子构成;以及第二反量化单元,从由多个第二代码矢量构成的第二码本中选择对应于所述第二代码的一个第二代码矢量,将所述一个第二代码矢量与对应于所述分类信息的比例因子相乘所得的结果、和所述一个第一代码矢量相加,以获得所述量化对象矢量。 
本发明的用于语音信号/音乐信号的矢量量化方法,包括以下的步骤:生成表示多个种类中的与线谱对参数和导抗频谱对参数中的一种参数的量化对象矢量具有相关性的特征的种类的分类信息;从分别对应于所述多个种类的多个第一码本中选择对应于所述分类信息的一个第一码本;使用构成所述选择出的第一码本的多个第一代码矢量,对所述量化对象矢量进行量化,获得第一代码;以及 
使用构成第二码本的多个第二代码矢量、以及对应于所述分类信息的比例因子,将对应于所述第一代码的第一代码矢量与所述量化对象矢量的残差矢量进行量化,获得第二代码。 
本发明的用于语音信号/音乐信号的矢量反量化方法,包括以下的步骤:生成表示多个种类中的与线谱对参数和导抗频谱对参数中的一种参数的量化 对象矢量具有相关性的特征的种类的分类信息;从接收到的编码数据中分离出作为所述量化对象矢量的第一级量化结果的第一代码、以及作为所述量化对象矢量的第二级量化结果的第二代码;从分别对应于多个种类的多个第一码本中选择对应于所述分类信息的一个第一码本;从所述选择出的第一码本中选择对应于所述第一代码的一个第一代码矢量;以及从由多个第二代码矢量构成的第二码本中选择对应于所述第二代码的一个第二代码矢量,将所述一个第二代码矢量与对应于所述分类信息的比例因子相乘所得的结果、和所述一个第一代码矢量相加,以生成所述量化对象矢量。 
发明的效果 
根据本发明,在根据与量化对象矢量具有相关性的特征的种类切换第一级的码本的多级矢量量化中,使用对应于上述种类的比例因子(scaling factor)进行第二级以后的矢量量化,从而能够提高第二级以后的矢量量化的量化精度。 
附图说明
图1是表示实施方式1的LSP矢量量化装置的主要结构的方框图。 
图2是表示实施方式1的LSP矢量反量化装置的主要结构的方框图。 
图3是表示实施方式2的LSP矢量量化装置的主要结构的方框图。 
图4是表示实施方式3的LSP矢量量化装置的主要结构的方框图。 
图5是表示实施方式3的LSP矢量反量化装置的主要结构的方框图。 
具体实施方式
以下,参照附图详细地说明本发明的实施方式。另外,作为本发明的矢量量化装置、矢量反量化装置以及其方法,以LSP矢量量化装置、LSP矢量反量化装置以及其方法为例进行说明。 
另外,在本发明的实施方式中,以在可扩展编码的宽带LSP量化器中,将宽带LSP作为矢量量化对象,并使用具有与矢量量化对象的相关性的窄带LSP的种类,切换在第一级量化中使用的码本的情况为例进行说明。另外,也可以代替窄带LSP而使用量化窄带LSP(由未图示的窄带LSP量化器预先量化的窄带LSP),切换在第一级量化中使用的码本。另外,也可以将量化窄 带LSP变换为宽带形态,并使用变换后的量化窄带LSP切换在第一级量化中使用的码本。 
(实施方式1) 
图1是表示本发明的实施方式1的LSP矢量量化装置100的主要结构的方框图。这里,以在LSP矢量量化装置100中,通过三级的多级矢量量化对所输入的LSP矢量进行量化的情况为例进行说明。 
在图1中,LSP矢量量化装置100包括:分类器101、开关102、第一码本103、加法器104、误差最小化单元105、比例因子决定单元106、乘法器107、第二码本108、加法器109、第三码本110、以及加法器111。 
分类器101预先存储有由分别表示窄带LSP矢量的多个种类的多个分类信息构成的分类用码本,从分类用码本中选择表示作为矢量量化对象的宽带LSP矢量的种类的分类信息,并将其输出到开关102和比例因子决定单元106。具体而言,分类器101内置有由对应于各种窄带LSP矢量的代码矢量构成的分类用码本,通过对分类用码本进行搜索,求使与所输入的窄带LSP矢量之间的均方误差最小的代码矢量。分类器101将通过搜索求出的代码矢量的索引作为表示LSP矢量的种类的分类信息。 
开关102从第一码本103中选择一个对应于从分类器101输入的分类信息的子码本,并将该子码本的输出端子连接到加法器104。 
第一码本103预先存储有对应于各种窄带LSP的子码本(CBa1~CBan)。也就是说,例如在窄带LSP的种类的总数为n时,构成第一码本103的子码本的数也为n。第一码本103从构成第一码本的多个第一代码矢量中,将由来自误差最小化单元105的指示所指示的第一代码矢量输出到开关102。 
加法器104求作为矢量量化对象而输入的宽带LSP矢量与从开关102输入的代码矢量之差,并将该差作为第一残差矢量输出到误差最小化单元105。另外,加法器104将分别对应于所有的第一代码矢量的第一残差矢量中,通过误差最小化单元105的搜索得知为最小的一个第一残差矢量输出到乘法器107。 
误差最小化单元105将从加法器104输入的对第一残差矢量进行平方所得的结果作为宽带LSP矢量与第一代码矢量之间的均方误差,并通过对第一码本进行搜索,求该均方误差最小的第一代码矢量。同样地,误差最小化单元105将从加法器109输入的对第二残差矢量进行平方所得的结果作为第一残差矢量与第二代码矢量之间的均方误差,并通过对第二码本进行搜索,获得该均方误差最小的第二代码矢量。同样地,误差最小化单元105将从加法器111输入的对第三残差矢量进行平方所得的结果作为第二残差矢量与第三代码矢量之间的均方误差,并通过对第三码本进行搜索,获得该均方误差最小的第三代码矢量。误差最小化单元105对附加到通过搜索获得的三个代码 矢量的索引一起进行编码,并作为编码数据输出。 
比例因子决定单元106预先存储有由对应于各种窄带LSP矢量的比例因子构成的比例因子码本。比例因子决定单元106从比例因子码本中选择对应于从分类器101输入的分类信息的比例因子,并将所选择的比例因子的倒数输出到乘法器107。这里,比例因子既可以是标量(scalar),也可以是矢量。 
乘法器107将从比例因子决定单元106输入的比例因子的倒数乘以从加法器104输入的第一残差矢量,并输出到加法器109。 
第二码本(CBb)108由多个第二代码矢量构成,将由来自误差最小化单元105的指示所指示的第二代码矢量输出到加法器109。 
加法器109求从乘法器107输入的乘以了比例因子的倒数的第一残差矢量与从第二码本108输入的第二代码矢量之差,并将该差作为第二残差矢量输出到误差最小化单元105。另外,加法器109将分别对应于所有的第二代码矢量的第二残差矢量中,通过误差最小化单元105的搜索得知为最小的一个第二残差矢量输出到加法器111。 
第三码本110(CBc)由多个第三代码矢量构成,将由来自误差最小化单元105的指示所指示的第三代码矢量输出到加法器111。 
加法器111求从加法器109输入的第二残差矢量与从第三码本110输入的第三代码矢量之差,并将该差作为第三残差矢量输出到误差最小化单元105。 
接着,以作为量化对象的宽带LSP矢量的次数为R次的情况为例,说明LSP矢量量化装置100进行的动作。另外,在以下的说明中,将宽带LSP矢量记为LSP(i)(i=0,1,...,R-1)。 
分类器101内置有由分别对应于窄带LSP矢量的n个种类的n个代码矢量构成的分类用码本,通过对代码矢量进行搜索,求与所输入的窄带LSP矢量之间的均方误差最小的第m代码矢量。分类器101将m(1≤m≤n)作为分类信息输出到开关102和比例因子决定单元106。 
开关102从第一码本103中选择对应于分类信息m的子码本CBam,并将该子码本的输出端子连接到加法器104。 
第一码本103从n个子码本CBa1~CBan中构成CBam的各个第一代码矢量CODE_1(d1)(i)(d1=0,1,...,D1-1,i=0,1,...,R-1)中,将由来自误差最小化单元105的指示d1’所指示的第一代码矢量CODE_1(d1’)(i) (i=0,1,...,R-1)输出到开关102。这里,D1是第一码本的代码矢量的总数,d1是第一代码矢量的索引。这里,第一码本103依序从误差最小化单元105指示从d1’=0至d1’=D1-1为止的d1’的值。 
加法器104根据下式(1),求作为矢量量化对象而输入的宽带LSP矢量LSP(i)(i=0,1,...,R-1)与从第一码本103输入的第一代码矢量CODE_1(d1’)(i)(i=0,1,...,R-1)之差,并将该差作为第一残差矢量Err_1(d1’)(i)(i=0,1,...,R-1)输出到误差最小化单元105。另外,加法器104将分别对应于从d1’=0至d1’=D1-1为止的d1’的第一残差矢量Err_1(d1’)(i)(i=0,1,...,R-1)中,通过误差最小化单元105的搜索得知为最小的第一残差矢量Err_1(d1_min)(i)(i=0,1,...,R-1)输出到乘法器107。 
Err_1(d1′)(i)=LSP(i)-CODE_1(d1′)(i)(i=0,1,…,R-1)...(1) 
误差最小化单元105将从d1’=0至d1’=D1-1为止的d1’的值依序指示给第一码本103,分别对于从d1’=0至d1’=D1-1为止的d1’,根据下式(2)求从加法器104输入的第一残差矢量Err_1(d1’)(i)(i=0,1,...,R-1)的平方而求均方误差Err。 
Err = Σ i = 0 R - 1 ( Err _ 1 ( d 1 ′ ) ( i ) ) 2 . . . ( 2 )
误差最小化单元105存储均方误差Err最小的第一代码矢量的索引d1’作为第一索引d1_min。 
比例因子决定单元106从比例因子码本中选择对应于分类信息m的比例因子Scale(m)(i)(i=0,1,...,R-1),根据下式(3)求该比例因子的倒数Rec_Scale(m)(i)并将其输出到乘法器107。 
Rec _ Scal e ( m ) ( i ) = 1 Scale ( m ) ( i ) , ( i = 0,1 , . . . , R - 1 ) . . . ( 3 )
乘法器107根据下式(4),将从比例因子决定单元106输入的比例因子的倒数Rec_Scale(m)(i)(i=0,1,...,R-1)乘以从加法器104输入的第一残差矢量Err_1(d1_min)(i)(i=0,1,...,R-1),并输出到加法器109。 
Sca_Err_1(d1_min)(i)=Err_1(d1_min)(i)×Rec_Scale(m)(i)(i=0,1,…,R-1)...(4) 
第二码本108从构成码本的各个第二代码矢量CODE_2(d2)(i)(d2=0,1,...,D2-1,i=0,1,...,R-1)中,将由来自误差最小化单元105的指示d2’所指示的代码矢量CODE_2(d2’)(i)(i=0,1,...,R-1)输出到加法器109。这里,D2是第二码本的代码矢量的总数,d2是代码矢量的索引。第二码本 108依序从误差最小化单元105指示从d2’=0至d2’=D2-1为止的d2’的值。 
加法器109根据下式(5),求从乘法器107输入的乘以了比例因子的倒数的第一残差矢量Sca_Err_1(d1_min)(i)(i=0,1,...,R-1)与从第二码本108输入的第二代码矢量CODE_2(d2’)(i)(i=0,1,...,R-1)之差,并将该差作为第二残差矢量Err_2(d2’)(i)(i=0,1,...,R-1)输出到误差最小化单元105。另外,加法器109将分别对应于从d2’=0至d2’=D1-1为止的d2’的第二残差矢量Err_2(d2’)(i)(i=0,1,...,R-1)中,通过误差最小化单元105的搜索得知为最小的第二残差矢量Err_2(d2_min)(i)(i=0,1,...,R-1)输出到加法器111。 
Err_2(d2′)(i)=Sca_Err_1(d1_min)(i)-CODE_2(d2′)(i)(i=0,1,…,R-1)(5) 
这里,误差最小化单元105将从d2’=0至d2’=D2-1为止的d2’的值依序指示给第二码本108,分别对于从d2’=0至d2’=D2-1为止的d2’,根据下式(6)求从加法器109输入的第二残差矢量Err_2(d2’)(i)(i=0,1,...,R-1)的平方而求均方误差Err。 
Err = Σ i = 0 R - 1 ( Err _ 2 ( d 2 ′ ) ( i ) ) 2 . . . ( 6 )
误差最小化单元105存储均方误差Err最小的第二代码矢量的索引d2’作为第二索引d2_min。 
第三码本110从构成码本的各个第三代码矢量CODE_3(d3)(i)(d3=0,1,...,D3-1,i=0,1,...,R-1)中,将由来自误差最小化单元105的指示d3’所指示的第三代码矢量CODE_3(d3’)(i)(i=0,1,...,R-1)输出到加法器111。这里,D3是第三码本的代码矢量的总数,d3是代码矢量的索引。第三码本110依序从误差最小化单元105指示从d3’=0至d3’=D3-1为止的d3’的值。 
加法器111根据下式(7),求从加法器109输入的第二残差矢量Err_2 (d2_min)(i)(i=0,1,...,R-1)与从第三码本110输入的代码矢量CODE_3(d3’)(i)(i=0,1,...,R-1)之差,并将该差作为第三残差矢量Err_3(d3’)(i)(i=0,1,...,R-1)输出到误差最小化单元105。 
Err_3(d3′)(i)=Err_2(d2_min)(i)-CODE_3(d3′)(i)(i=0,1,…,R-1)...(7) 
这里,误差最小化单元105将从d3’=0至d3’=D3-1为止的d3’的值依序指示给第三码本110,分别对于从d3’=0至d3’=D3-1为止的d3’,根据下式(8) 求从加法器111输入的第三残差矢量Err_3(d3’)(i)(i=0,1,...,R-1)的平方而求均方误差Err。 
Err = Σ i = 0 r - 1 ( Err _ 3 ( d 3 ′ ) ( i ) ) 2 . . . ( 8 )
接着,误差最小化单元105存储均方误差Err最小的第三代码矢量的索引d3’作为第三索引d3_min。然后,误差最小化单元105对第一索引d1_min、第二索引d2_min和第三索引d3_min一起进行编码,并作为编码数据输出。 
图2是表示本实施方式的LSP矢量反量化装置200的主要结构的方框图。LSP矢量反量化装置200对LSP矢量量化装置100中输出的编码数据进行解码,并生成量化LSP矢量。 
LSP矢量反量化装置200包括:分类器201、代码分离单元202、开关203、第一码本204、比例因子决定单元205、第二码本(CBb)206、乘法器207、加法器208、第三码本(CBc)209、乘法器210和加法器211。另外,第一码本204具有内容与第一码本103具有的子码本(CBa1~CBan)相同的子码本,比例因子决定单元205具有内容与比例因子决定单元106具有的比例因子码本相同的比例因子码本。另外,第二码本206具有内容与第二码本108具有的码本相同的码本,第三码本209具有内容与第三码本110具有的码本相同的码本。 
分类器201预先存储有由分别表示窄带LSP矢量的多个种类的多个分类信息构成的分类用码本,从分类用码本中选择表示作为矢量量化对象的宽带LSP矢量的种类的分类信息,并将其输出到开关203和比例因子决定单元205。具体而言,分类器201内置有由对应于各种窄带LSP矢量的代码矢量构成的分类用码本,通过对分类用码本进行搜索,求与从未图示的窄带LSP量化器输入的量化窄带LSP矢量之间的均方误差最小的代码矢量。分类器201将通过搜索求出的代码矢量的索引作为表示LSP矢量的种类的分类信息。 
代码分离单元202将从LSP矢量量化装置100发送的编码数据分离为第一索引、第二索引和第三索引。代码分离单元202将第一索引指示给第一码本204,将第二索引指示给第二码本206,并将第三索引指示给第三码本209。 
开关203从第一码本204中选择一个对应于从分类器201输入的分类信息的子码本(CBam),并将该子码本的输出端子连接到加法器208。 
第一码本204从构成第一码本的多个第一代码矢量中,将对应于由代码 分离单元202所指示的第一索引的一个第一代码矢量输出到开关203。 
比例因子决定单元205从比例因子码本中选择对应于从分类器201输入的分类信息的比例因子,并将其输出到乘法器207和乘法器210。 
第二码本206将对应于代码分离单元202所指示的第二索引的一个第二代码矢量输出到乘法器207。 
乘法器207将从比例因子决定单元205输入的比例因子乘以从第二码本206输入的第二代码矢量,并输出到加法器208。 
加法器208将从乘法器207输入的乘以比例因子后的第二代码矢量与从开关203输入的第一代码矢量相加,并将成为相加结果的矢量输出到加法器211。 
第三码本209将对应于代码分离单元202所指示的第三索引的一个第三代码矢量输出到乘法器210。 
乘法器210将从比例因子决定单元205输入的比例因子乘以从第三码本209输入的第三代码矢量,并输出到加法器211。 
加法器211将从乘法器210输入的乘以比例因子后的第三代码矢量与从加法器208输入的矢量相加,并输出成为相加结果的矢量作为量化宽带LSP矢量。 
接着,说明LSP矢量反量化装置200的动作。 
分类器201内置有由分别对应于窄带LSP矢量的n个种类的n个代码矢量构成的分类用码本,通过对代码矢量进行搜索,求与从未图示的窄带LSP量化器输入的量化窄带LSP矢量之间的均方误差最小的第m代码矢量。分类器201将m(1≤m≤n)作为分类信息输出到开关203和比例因子决定单元205。 
代码分离单元202将从LSP矢量量化装置100发送的编码数据分离为第一索引d1_min、第二索引d2_min和第三索引d3_min。代码分离单元202将第一索引d1_min指示给第一码本204,将第二索引d2_min指示给第二码本206,并将第三索引d3_min指示给第三码本209。 
开关203从第一码本204中选择对应于从分类器201输入的分类信息m的子码本CBam,并将该子码本的输出端子连接到加法器208。 
第一码本204从构成子码本CBam的各个第一代码矢量CODE_1(d1)(i)(d1=0,1,...,D1-1,i=0,1,...,R-1)中,将由来自代码分离单元202的指示d1_min所指示的第一代码矢量CODE_1(d1_min)(i)(i=0,1,...,R-1) 输出到开关203。 
比例因子决定单元205从比例因子码本中选择对应于从分类器201输入的分类信息m的比例因子Scale(m)(i)(i=0,1,...,R-1),并将其输出到乘法器207和乘法器210。 
第二码本206从构成第二码本的各个第二代码矢量CODE_2(d2)(i)(d2=0,1,...,D2-1,i=0,1,...,R-1)中,将由来自代码分离单元202的指示d2_min所指示的第二代码矢量CODE_2(d2_min)(i)(i=0,1,...,R-1)输出到乘法器207。 
乘法器207根据下式(9),将从比例因子决定单元205输入的比例因子Scale(m)(i)(i=0,1,...,R-1)乘以从第二码本206输入的第二代码矢量CODE_2(d2_min)(i)(i=0,1,...,R-1),并输出到加法器208。 
Sca_CODE_2(d2_min)(i)=CODE_2(d2_min)(i)×Scale(m)(i)(i=0,1,…,R-1)...(9) 
加法器208根据下式(10),将从第一码本204输入的第一代码矢量CODE_1(d1_min)(i)(i=0,1,...,R-1)与从乘法器207输入的乘以比例因子后的第二代码矢量Sca_CODE_2(d2_min)(i)(i=0,1,...,R-1)相加,并将成为相加结果的矢量TMP(i)(i=0,1,...,R-1)输出到加法器211。 
TMP(i)=CODE_1(d1_min)(i)+Sca_CODE_2(d2_min)(i)(i=0,1,…,R-1)...(10) 
第三码本209从构成码本的各个第三代码矢量CODE_3(d3)(i)(d3=0,1,...,D3-1,i=0,1,...,R-1)中,将由来自代码分离单元202的指示d3_min所指示的第三代码矢量CODE_3(d3_min)(i)(i=0,1,...,R-1)输出到乘法器210。 
乘法器210根据下式(11),将从比例因子决定单元205输入的比例因子Scale(m)(i)(i=0,1,...,R-1)乘以从第三码本209输入的第三代码矢量CODE_3(d3_min)(i)(i=0,1,...,R-1),并输出到加法器211。 
Sca_CODE_3(d3_min)(i)=CODE_3(d3_min)(i)×Scale(m)(i)(i=0,1,…,R-1)...(11) 
加法器211根据下式(12),将从加法器208输入的矢量TMP(i)(i=0,1,...,R-1)与从乘法器210输入的乘以比例因子后的第三代码矢量Sca_CODE_3(d3_min)(i)(i=0,1,...,R-1)相加,并输出成为相加结果的矢量Q_LSP(i)(i=0,1,...,R-1)作为量化宽带LSP矢量。 
Q_LSP(i)=TMP(i)+Sca_CODE_3(d3_min)(i)(i=0,1,…,R-1)...(12) 
在LSP矢量量化装置100和LSP矢量反量化装置200中使用的第一码本、 第二码本、第三码本和比例因子码本预先通过学习加以设计。以下,说明一例这些码本的学习方法。 
为了通过学习求第一码本103和第一码本204具有的第一码本,首先准备根据多个学习用的语音数据获得的多个、例如V个LSP矢量。接着,按每个种类(n种)对V个LSP矢量进行分组,使用属于各个组的LSP矢量,根据LBG(Linde Buzo Gray)算法等学习算法求D1个第一代码矢量CODE_1(d1)(i)(d1=0,1,...,D1-1,i=0,1,...,R-1),并生成n个子码本。 
为了通过学习求第二码本108和第二码本206具有的第二码本,使用由所述方法求出的第一码本进行第一级的矢量量化,获得V个从加法器104输出的第一残差矢量Err_1(d1_min)(i)(i=0,1,...,R-1)。接着,使用V个第一残差矢量Err_1(d1_min)(i)(i=0,1,...,R-1),根据LBG算法等学习算法求D2个第二代码矢量CODE_2(d2)(i)(d2=0,1,...,D1-1,i=0,1,...,R-1),并生成第二码本。 
为了通过学习求第三码本110和第三码本209具有的第三码本,使用由所述方法求出的第一码本和第二码本进行第一级和第二级的矢量量化,获得V个从加法器109输出的第二残差矢量Err_2(d2_min)(i)(i=0,1,...,R-1)。接着,使用V个第二残差矢量Err_2(d2_min)(i)(i=0,1,...,R-1),根据LBG算法等学习算法求D3个第三代码矢量CODE_3(d3)(i)(d3=0,1,...,D1-1,i=0,1,...,R-1),并生成第三码本。这里,因为尚未生成比例因子码本,所以不使乘法器107动作而直接将加法器104的输出输入到加法器109。 
为了通过学习求比例因子决定单元106和比例因子决定单元205具有的比例因子码本,假设比例因子的值为α,使用由所述方法求出的第一码本~第三码本进行第一级~第三级的矢量量化,求V个量化LSP。接着,求作为输入的V个LSP矢量与V个量化LSP矢量之间的频谱失真(也可以是倒频谱失真)的平均值。此时,在使α的值例如在0.8~1.2的范围内逐渐变化的同时,求对应于各个α的频谱失真,并将频谱失真最小的α的值设为比例因子即可。通过对每种窄带LSP矢量决定α的值,从而决定对应于各个种类的比例因子,使用这些比例因子生成比例因子码本。另外,在比例因子为矢量时,对每个矢量的元素进行上述学习即可。 
这样,根据本实施方式,根据与宽带LSP矢量具有相关性的窄带LSP矢量的种类,切换第一级的矢量量化的码本,在第一级的矢量量化误差(第一 残差矢量)的统计方差因种类而异的多级矢量量化中,将对应于窄带LSP矢量的分类结果的比例因子乘以第一级的量化残差矢量,所以能够根据第一级的矢量量化误差的统计方差,改变第二级和第三级的矢量量化对象的矢量的方差,由此能够提高宽带LSP矢量的量化精度。 
而且,在矢量反量化装置中,输入由提高了量化精度的量化方法生成的宽带LSP矢量的编码数据来进行矢量反量化,从而能够生成高精度的量化宽带LSP矢量。另外,若将这样的矢量反量化装置用于语音解码装置,则能够使用高精度的量化宽带LSP矢量对语音进行解码,所以能够获得高质量的解码语音。 
另外,在本实施方式中,以构成比例因子决定单元106和比例因子决定单元205具有的比例因子码本的比例因子对应于窄带LSP矢量的种类的情况为例进行了说明,但本发明并不限定于此,构成比例因子决定单元106和比例因子决定单元205具有的比例因子码本的比例因子也可以对应于对语音特征进行分类所得的各个种类。在此情况下,分类器101输入表示语音特征的参数而非输入窄带LSP矢量作为语音特征信息,并将对应于所输入的语音特征信息的语音特征的种类作为分类信息输出到开关102和比例因子决定单元106。例如,在将本发明适用于如VMR-WB(Variable-Rate Multimode WidebandSpeech Codec,可变速率多模式宽带语音编解码器)那样,根据语音的有声性、噪声性等特征来切换编码器的类型的编码装置时,可以将编码器的类型的信息直接用作语音特征量。 
另外,在本实施方式中,以比例因子决定单元106输出对应于从分类器101输入的种类的比例因子的倒数的情况为例进行了说明,但本发明并不限定于此,也可以预先求比例因子的倒数,将求出的比例因子的倒数存储到比例因子码本中。 
另外,在本实施方式中,以对LSP矢量进行三级的矢量量化的情况为例进行了说明,但本发明并不限定于此,也可以适用于进行二级的矢量量化或四级以上的矢量量化的情况。 
另外,在本实施方式中,以对LSP矢量进行三级的多级矢量量化的情况为例进行了说明,但本发明并不限定于此,也可以适用于与分裂矢量量化一起进行矢量量化的情况。 
另外,在本实施方式中,作为量化对象,以宽带LSP矢量为例进行了说 明,但量化对象并不限定于此,也可以是宽带LSP矢量以外的矢量。 
另外,在本实施方式中,LSP矢量反量化装置200对LSP矢量量化装置100中输出的编码数据进行解码,但本发明并不限于此,只要是可以由LSP矢量反量化装置200进行解码的形式的编码数据,则不言而喻可以由LSP矢量反量化装置接收并进行解码。 
(实施方式2) 
图3是表示本发明的实施方式2的LSP矢量量化装置300的主要结构的方框图。另外,LSP矢量量化装置300具有与实施方式1所示的LSP矢量量化装置100(参照图1)同样的基本结构,对相同的结构要素附加相同的标号,并省略其说明。 
LSP矢量量化装置300包括:分类器101、开关102、第一码本103、加法器304、误差最小化单元105、比例因子决定单元306、第二码本308、加法器309、第三码本310、加法器311、乘法器312和乘法器313。 
加法器304求作为矢量量化对象的从外部输入的宽带LSP矢量与从开关102输入的第一代码矢量之差,并将该差作为第一残差矢量输出到误差最小化单元105。另外,加法器304将分别对应于所有的第一代码矢量的第一残差矢量中,通过误差最小化单元105的搜索得知为最小的一个第一残差矢量输出到加法器309。 
比例因子决定单元306预先存储有由对应于各种窄带LSP矢量的比例因子构成的比例因子码本。比例因子决定单元306将对应于从分类器101输入的分类信息的比例因子输出到乘法器312和乘法器313。这里,比例因子既可以是标量,也可以是矢量。 
第二码本(CBb)308由多个第二代码矢量构成,将由来自误差最小化单元105的指示所指示的第二代码矢量输出到乘法器312。 
第三码本(CBc)310由多个第三代码矢量构成,将由来自误差最小化单元105的指示所指示的第三代码矢量输出到乘法器313。 
乘法器312将从比例因子决定单元308输入的比例因子乘以从第二码本306输入的第二代码矢量,并输出到加法器309。 
加法器309求从加法器304输入的第一残差矢量与从乘法器312输入的乘以比例因子后的第二代码矢量之差,并将该差作为第二残差矢量输出到误差最小化单元105。另外,加法器309将分别对应于所有的第二代码矢量的 第二残差矢量中,通过误差最小化单元105的搜索得知为最小的一个第二残差矢量输出到加法器311。 
乘法器313将从比例因子决定单元306输入的比例因子乘以从第三码本310输入的第三代码矢量,并输出到加法器311。 
加法器311求从加法器309输入的第二残差矢量与从乘法器313输入的乘以比例因子后的第三代码矢量之差,并将该差作为第三残差矢量输出到误差最小化单元105。 
接着,以作为量化对象的LSP矢量的次数为R次的情况为例,说明LSP矢量量化装置300进行的动作。另外,在以下的说明中,将LSP矢量记为LSP(i)(i=0,1,...,R-1)。 
加法器304根据下式(13),求宽带LSP矢量LSP(i)(i=0,1,...,R-1)与从第一码本103输入的第一代码矢量CODE_1(d1′)(i)(i=0,1,...,R-1)之差,并将该差作为第一残差矢量Err_1(d1′)(i)(i=0,1,...,R-1)输出到误差最小化单元105。另外,加法器304将分别对应于从d1’=0至d1’=D1-1为止的d1’的第一残差矢量Err_1(d1’)(i)(i=0,1,...,R-1)中,通过误差最小化单元105的搜索得知为最小的第一残差矢量Err_1(d1_min)(i)(i=0,1,...,R-1)输出到加法器309。 
Err_1(d1′)(i)=LSP(i)-CODE_1(d1′)(i)(i=0,1,…,R-1)...(13) 
比例因子决定单元306从比例因子码本中选择对应于分类信息m的比例因子Scale(m)(i)(i=0,1,...,R-1),并将其输出到乘法器312和乘法器313。 
第二码本308从构成码本的各个第二代码矢量CODE_2(d2)(i)(d2=0,1,...,D2-1,i=0,1,...,R-1)中,将由来自误差最小化单元105的指示d2′所指示的代码矢量CODE_2(d2′)(i)(i=0,1,...,R-1)输出到乘法器312。这里,D2是第二码本的代码矢量的总数,d2是代码矢量的索引。第二码本308依序从误差最小化单元105指示从d2’=0至d2’=D2-1为止的d2’的值。 
乘法器312根据下式(14),将从比例因子决定单元306输入的比例因子Scale(m)(i)(i=0,1,...,R-1)乘以从第二码本308输入的第二代码矢量CODE_2(d2’)(i)(i=0,1,...,R-1),并输出到加法器309。 
Sca_CODE_2(d2′)(i)=CODE_2(d2′)(i)×Scale(m)(i)(i=0,1,…,R-1)(14) 
加法器309根据下式(15),求从加法器304输入的第一残差矢量Err_1 (d1_min)(i)(i=0,1,...,R-1)与从乘法器312输入的乘以比例因子后的第二代码矢量Sca_CODE_2(d2’)(i)(i=0,1,...,R-1)之差,并将该差作为第二残差矢量Err_2(d2’)(i)(i=0,1,...,R-1)输出到误差最小化单元105。另外,加法器309将分别对应于从d2’=0至d2’=D1-1为止的d2’的第二残差矢量Err_2(d2’)(i)(i=0,1,...,R-1)中,通过误差最小化单元105的搜索得知为最小的第二残差矢量Err_2(d2_min)(i)(i=0,1,...,R-1)输出到加法器311。 
Err_2(d2′)(i)=Err_1(d1_min)(i)-Sca_CODE_2(d2′)(i)(i=0,1,…,R-1)...(15) 
第三码本310从构成码本的各个第三代码矢量CODE_3(d3)(i)(d3=0,1,...,D3-1,i=0,1,...,R-1)中,将由来自误差最小化单元105的指示d3′所指示的代码矢量CODE_3(d3′)(i)(i=0,1,...,R-1)输出到乘法器313。这里,D3是第三码本的代码矢量的总数,d3是代码矢量的索引。第三码本310依序从误差最小化单元105指示从d3’=0至d3’=D3-1为止的d3’的值。 
乘法器313根据下式(16),将从比例因子决定单元306输入的比例因子Scale(m)(i)(i=0,1,...,R-1)乘以从第三码本310输入的第三代码矢量CODE_3(d3′)(i)(i=0,1,...,R-1),并输出到加法器311。 
Sca_CODE_3(d3′)(i)=CODE_3(d3′)(i)×Scale(m)(i)(i=0,1,…,R-1)...(16) 
加法器311根据下式(17),求从加法器309输入的第二残差矢量Err_2 (d2_min)(i)(i=0,1,...,R-1)与从乘法器313输入的乘以比例因子后的第三代码矢量Sca_CODE_3(d3’)(i)(i=0,1,...,R-1)之差,并将该差作为第三残差矢量Err_3(d3’)(i)(i=0,1,...,R-1)输出到误差最小化单元105。 
这样,根据本实施方式,根据与宽带LSP矢量具有相关性的窄带LSP矢量的种类,切换第一级的矢量量化的码本,在第一级的矢量量化误差(第一残差矢量)的统计方差因种类而异的多级矢量量化中,将对应于窄带LSP矢量的分类结果的比例因子乘以在第二级和第三级的矢量量化中使用的第二码本和第二码本的代码矢量,所以能够与第一级的矢量量化误差的统计方差相适应地改变在第二级和第三级中使用的码本的代码矢量的方差,由此能够提高宽带LSP矢量的量化精度。 
另外,本实施方式的第二码本308可以是内容与实施方式1的第二码本108相同的码本,本实施方式的第三码本310可以是内容与实施方式1的第 三码本110相同的码本。另外,本实施方式的比例因子决定单元306可以具有内容与实施方式1的比例因子决定单元106具有的比例因子码本相同的码本。 
(实施方式3) 
图4是表示本发明的实施方式3的LSP矢量量化装置400的主要结构的方框图。另外,LSP矢量量化装置400具有与实施方式1所示的LSP矢量量化装置100(参照图1)同样的基本结构,对相同的结构要素附加相同的标号,并省略其说明。 
LSP矢量量化装置400包括:分类器101、开关102、第一码本103、加法器104、误差最小化单元105、比例因子决定单元406、乘法器407、第二码本108、加法器409、第三码本110、加法器412和乘法器411。 
比例因子决定单元406预先存储有由对应于各种窄带LSP矢量的比例因子构成的比例因子码本。比例因子决定单元406决定对应于从分类器101输入的分类信息的比例因子。这里,比例因子由与加法器104输出的第一残差矢量相乘的比例因子(第一比例因子)、以及与加法器409输出的第一残差矢量相乘的比例因子(第二比例因子)构成。接着,比例因子决定单元406将第一比例因子输出到乘法器407,并将第二比例因子输出到乘法器411。这样,通过预先准备适合于多级矢量量化的各个级的比例因子,能够更仔细地对码本进行适应性调整。 
乘法器407将从比例因子决定单元406输入的第一比例因子的倒数乘以从加法器104输入的第一残差矢量,并输出到加法器409。 
加法器409求从乘法器407输入的乘以了比例因子的倒数的第一残差矢量与从第二码本108输入的第二代码矢量之差,并将该差作为第二残差矢量输出到误差最小化单元105。另外,加法器409将分别对应于所有的第二代码矢量的第二残差矢量中,通过误差最小化单元105的搜索得知为最小的一个第二残差矢量输出到乘法器411。 
乘法器411将从比例因子决定单元406输入的第二比例因子的倒数乘以从加法器409输入的第二残差矢量,并输出到加法器412。 
加法器412求从乘法器411输入的乘以了比例因子的倒数的第二残差矢量与从第三码本110输入的第三代码矢量之差,并将该差作为第三残差矢量输出到误差最小化单元105。 
接着,以作为量化对象的LSP矢量的次数为R次的情况为例,说明LSP矢量量化装置400进行的动作。另外,在以下的说明中,将LSP矢量记为LSP(i)(i=0,1,...,R-1)。 
比例因子决定单元406从比例因子码本中选择对应于分类信息m的第一比例因子Scale_1(m)(i)(i=0,1,...,R-1)与第二比例因子Scale_2(m)(i)(i=0,1,...,R-1),根据下式(17)求第一比例因子Scale_1(m)(i)(i=0,1,...,R-1)的倒数,并将其输出到乘法器407,而且根据下式(18)求第二比例因子Scale_2(m)(i)(i=0,1,...,R-1)的倒数,并将其输出到乘法器411。 
Rec _ Scale _ 1 ( m ) ( i ) = 1 Scale _ 1 ( m ) ( i ) , ( i = 0,1 , . . . , R - 1 ) . . . ( 17 )
Rec _ Scale _ 2 ( m ) ( i ) = 1 Scale _ 2 ( m ) ( i ) , ( i = 0,1 , . . . , R - 1 ) . . . ( 18 )
另外,这里说明了在选择各个比例因子之后求倒数的情况,但通过预先求各个比例因子的倒数,并预先将各个比例因子的倒数存储到比例因子码本中,能够省略求倒数的运算。在该情况下,本发明也能够得到同样的效果。 
乘法器407根据下式(19),将从比例因子决定单元406输入的第一比例因子的倒数Rec_Scale_1(m)(i)(i=0,1,...,R-1)乘以从加法器104输入的第一残差矢量Err_1(d1_min)(i)(i=0,1,...,R-1),并输出到加法器409。 
Sca_Err_1(di_min)(i)=Err_1(di_min)(i)×Rec_Scale_1(m)(i)(i=0,1,…,R-1)...(19) 
加法器409根据下式(20),求从乘法器407输入的乘以了第一比例因子的倒数的第一残差矢量Sca_Err_1(d1_min)(i)(i=0,1,...,R-1)与从第二码本108输入的第二代码矢量CODE_2(d2’)(i)(i=0,1,...,R-1)之差,并将该差作为第二残差矢量Err_2(d2’)(i)(i=0,1,...,R-1)输出到误差最小化单元105。另外,加法器409将分别对应于从d2’=0至d2’=D1-1为止的d2’的第二残差矢量Err_2(d2’)(i)(i=0,1,...,R-1)中,通过误差最小化单元105的搜索得知为最小的第二残差矢量Err_2(d2_min)(i)(i=0,1,...,R-1)输出到乘法器411。 
Err_2(d2’)(i)=Sca_Err_1(d1_min)(i)-CODE_2(d2’)(i)(i=0,1,…,R-1)...(20) 
乘法器411根据下式(21),将从比例因子决定单元406输入的第二比例因子的倒数Rec_Scale_2(m)(i)(i=0,1,...,R-1)乘以从加法器409输入的第二残差矢量Err_2(d2_min)(i)(i=0,1,...,R-1),并输出到加法器412。Sca_Err_2(d2_min)(i)=Err_2(d2_min)(i)×Rec_Scale_2(m)(i)(i=0,1,…,R-1)...(21) 
加法器412根据下式(22),求从乘法器411输入的乘以了第二比例因子的倒数的第二残差矢量Sca_Err_2(d2_min)(i)(i=0,1,...,R-1)与从第三码本110输入的第三代码矢量CODE_3(d3’)(i)(i=0,1,...,R-1)之差,并将该差作为第三残差矢量Err_3(d3’)(i)(i=0,1,...,R-1)输出到误差最小化单元105。 
Err_3(d3′)(i)=Sca_Err_2(d2_min)(i)-CODE_3(d3′)(i)(i=0,1,…,R-1)...(22) 
这样,根据本实施方式,根据与宽带LSP矢量具有相关性的窄带LSP矢量的种类,切换第一级的矢量量化的码本,在第一级的矢量量化误差(第一残差矢量)的统计方差因种类而异的多级矢量量化中,将对应于窄带LSP矢量的分类结果的比例因子乘以在第二级和第三级的矢量量化中使用的第二码本和第三码本的代码矢量,所以能够与第一级的矢量量化误差的统计方差相适应地改变在第二级和第三级中使用的码本的代码矢量的方差,由此能够提高宽带LSP矢量的量化精度。另外,通过个别准备在第二级中使用的比例因子和在第三级中使用的比例因子,能够实现更仔细的适应。 
图5是表示本实施方式的LSP矢量量化装置500的主要结构的方框图。LSP矢量反量化装置500对LSP矢量量化装置400中输出的编码数据进行解码,并生成量化LSP矢量。另外,LSP矢量反量化装置500具有与实施方式1所示的LSP矢量反量化装置200(参照图2)同样的基本结构,对相同的结构要素附加相同的标号,并省略其说明。 
LSP矢量反量化装置500包括:分类器201、代码分离单元202、开关203、第一码本204、比例因子决定单元505、第二码本(CBb)206、乘法器507、加法器208、第三码本(CBc)209、乘法器510和加法器211。另外,第一码本204具有内容与第一码本103具有的子码本(CBa1~CBan)相同的子码本,比例因子决定单元505具有内容与比例因子决定单元406具有的比例因子码本相同的比例因子码本。另外,第二码本206具有内容与第二码本108具有的码本相同的码本,第三码本209具有内容与第三码本110具有的码本相同的码本。 
比例因子决定单元505从比例因子码本中选择对应于从分类器201输入的分类信息m的第一比例因子Scale_1(m)(i)(i=0,1,...,R-1)和第二比例因子Scale_2(m)(i)(i=0,1,...,R-1),将第一比例因子Scale_1(m)(i)(i=0,1,...,R-1)输出到乘法器507和乘法器510,并将第二比例因子Scale_2 (m)(i)(i=0,1,...,R-1)输出到乘法器510。 
乘法器507根据下式(23),将从比例因子决定单元505输入的第一比例因子Scale_1(m)(i)(i=0,1,...,R-1)乘以从第二码本206输入的第二代码矢量CODE_2(d2_min)(i)(i=0,1,...,R-1),并输出到加法器208。Sca_CODE_2(d2_min)(i)=CODE_2(d2_min)(i)×Scale_1(m)(i)(i=0,1,…,R-1)...(23) 
乘法器510根据下式(24),将从比例因子决定单元505输入的第一比例因子Scale_1(m)(i)(i=0,1,...,R-1)和第二比例因子Scale_2(m)(i)(i=0,1,...,R-1)乘以从第三码本209输入的第三代码矢量CODE_3(d3_min)(i)(i=0,1,...,R-1),并输出到加法器211。 
Sca_CODE_3(d3_min)(i)=CODE_3(d3_min)(i)×Scale_1(m)(i)×Scale_2(m)(i)(i=0,1,…,R-1)...(24) 
这样,根据本实施方式,在LSP矢量反量化装置中,输入由提高了量化精度的量化方法生成的宽带LSP矢量的编码数据来进行矢量反量化,从而能够生成高精度的量化宽带LSP矢量。另外,若将这样的矢量反量化装置用于语音解码装置,则能够使用高精度的量化宽带LSP矢量对语音进行解码,所以能够获得高质量的解码语音。 
另外,LSP矢量反量化装置500对LSP矢量量化装置400中输出的编码数据进行解码,但本发明并不限于此,只要是可以由LSP矢量反量化装置500进行解码的形式的编码数据,则不言而喻可以由LSP矢量反量化装置接收并进行解码。 
以上,对本发明的各实施方式进行了说明。 
另外,本发明的矢量量化装置、矢量反量化装置以及其方法,并不限于上述各个实施方式,可以进行各种变更后实施。 
例如,在上述各个实施方式中,在矢量量化装置、矢量反量化装置和其方法中,以语音信号为对象进行了说明,但也可适用于音乐信号等。 
另外,LSP有时也称为LSF(Line Spectral Frequency,线谱频率),且也可以将LSP称为LSF。另外,在代替LSP将ISP(Immittance Spectrum Pairs,导航频谱对)作为频谱参数进行量化的情况下,可以将LSP称为ISP,并利用本实施方式作为ISP量化/反量化装置。在代替LSP将ISF(Immittance SpectrumFrequency,导航谱频率)作为频谱参数进行量化的情况下,可以将LSP称为ISF,并利用本实施方式作为ISF量化/反量化装置。 
另外,本发明的矢量量化装置和矢量反量化装置能够用于进行语音信号 或音乐信号等的编码/解码的CELP编码装置/CELP解码装置。例如,在将本发明的LSP矢量量化装置适用于CELP型语音编码装置时,在CELP编码装置中,在输入根据对输入信号进行线性预测分析所得的线性预测系数而转换的LSP,进行量化处理,将量化后的量化LSP输出到合成滤波器,同时输出表示量化LSP的量化LSP码作为编码数据的LSP量化单元处,配置本发明的LSP矢量量化装置100。由此,能够提高矢量量化精度,所以解码时的语音质量也提高。同样地,在将本发明的LSP矢量反量化装置适用于CELP型语音解码装置时,在CELP解码装置中,在根据分离所接收的复用编码数据所得的量化LSP码对量化LSP进行解码,并将解码后的量化LSP输出到合成滤波器的LSP反量化单元处,配置本发明的LSP矢量反量化装置200即可,能够获得与上述相同的作用效果。 
另外,本发明的矢量量化装置和矢量反量化装置能够装载于进行语音或音乐等的传输的移动通信系统的通信终端装置中,由此能够提供具有与上述同样的作用效果的通信终端装置。 
另外,虽然这里以用硬件构成本发明的情况为例进行了说明,但是本发明也可以用软件实现。例如,通过利用编程语言(programming language)记述本发明的矢量量化方法和矢量反量化方法的算法,将该程序存储在存储器后使信息处理单元执行该程序,从而能够实现与本发明的矢量量化装置和矢量反量化装置同样的功能。 
另外,上述各个实施方式的说明中使用的各功能块,典型地被作为集成电路的LSI来实现。这些块既可以单独地集成为一个芯片,也可以包含一部分或全部地集成为一个芯片。 
另外,虽然此处称为LSI,但根据集成程度,也可以称为IC、系统LSI、超大LSI(Super LSI)、特大LSI(Ultra LSI)等。 
另外,实现集成电路化的方法不仅限于LSI,也可使用专用电路或通用处理器来实现。也可以使用在LSI制造后可编程的FPGA(Field ProgrammableGate Array:现场可编程门阵列),或者可重构LSI内部的电路单元的连接和设定的可重构处理器。 
再者,随着半导体的技术进步或随之派生的其它技术的出现,如果能够出现替代LSI的集成电路化的新技术,当然可利用该新技术进行功能块的集成化。还存在着适用生物技术等的可能性。 
2007年10月12日提交的特愿第2007-266922号以及2007年11月1日提交的特愿第2007-285602号的日本专利申请中包含的说明书、附图以及说明书摘要的公开内容全部引用于本申请。 
工业实用性 
本发明的矢量量化装置、矢量反量化装置和其方法能够适用于语音编码和语音解码等的用途。 

Claims (9)

1.用于语音信号/音乐信号的矢量量化装置,包括:
分类单元,生成表示多个种类中的与线谱对参数和导抗频谱对参数中的一种参数的量化对象矢量具有相关性的特征的种类的分类信息;
选择单元,从分别对应于所述多个种类的多个第一码本中选择对应于所述分类信息的一个第一码本;
第一量化单元,使用构成所述选择出的第一码本的多个第一代码矢量,对量化对象矢量进行量化,获得第一代码;
比例因子码本,由分别对应于所述多个种类的比例因子构成;以及
第二量化单元,其具有由多个第二代码矢量构成的第二码本,并使用所述第二代码矢量和对应于所述分类信息的比例因子,对所述第一代码所表示的一个第一代码矢量与所述量化对象矢量的残差矢量进行量化,获得第二代码。
2.如权利要求1所述的矢量量化装置,还包括:
乘法单元,将对应于所述分类信息的比例因子的倒数乘以所述残差矢量而获得乘法矢量,
所述第二量化单元使用所述多个第二代码矢量,对所述乘法矢量进行量化。
3.如权利要求1所述的矢量量化装置,还包括:
乘法单元,将对应于所述分类信息的比例因子分别乘以所述多个第二代码矢量而获得多个乘法矢量,
所述第二量化单元使用所述多个乘法矢量,对所述残差矢量进行量化。
4.如权利要求1所述的矢量量化装置,包括:
第三量化单元,其具有由多个第三代码矢量构成的第三码本,并使用所述第三代码矢量和对应于所述分类信息的比例因子,对所述第二代码所表示的一个第二代码矢量与所述残差矢量的第二残差矢量进行量化,获得第三代码。
5.如权利要求4所述的矢量量化装置,还包括:
第二乘法单元,将对应于所述分类信息的比例因子的倒数乘以所述第二残差矢量而获得第二乘法矢量,
所述第三量化单元使用所述多个第三代码矢量,对所述第二乘法矢量进行量化。
6.如权利要求4所述的矢量量化装置,还包括:
第二乘法单元,将对应于所述分类信息的比例因子分别乘以所述多个第三代码矢量而获得多个第二乘法矢量,
所述第三量化单元使用所述多个第二乘法矢量,对所述第二残差矢量进行量化。
7.用于语音信号/音乐信号的矢量反量化装置,包括:
分类单元,生成表示多个种类中的与线谱对参数和导抗频谱对参数中的一种参数的量化对象矢量具有相关性的特征的种类的分类信息;
分离单元,从接收到的编码数据中分离出作为所述量化对象矢量的第一级量化结果的第一代码、以及作为所述量化对象矢量的第二级量化结果的第二代码;
选择单元,从分别对应于多个种类的多个第一码本中选择对应于所述分类信息的一个第一码本;
第一反量化单元,从所述选择出的第一码本中选择对应于所述第一代码的一个第一代码矢量;
比例因子码本,由分别对应于所述多个种类的比例因子构成;以及
第二反量化单元,从由多个第二代码矢量构成的第二码本中选择对应于所述第二代码的一个第二代码矢量,将所述一个第二代码矢量与对应于所述分类信息的比例因子相乘所得的结果、和所述一个第一代码矢量相加,以获得所述量化对象矢量。
8.用于语音信号/音乐信号的矢量量化方法,包括以下的步骤:
生成表示多个种类中的与线谱对参数和导抗频谱对参数中的一种参数的量化对象矢量具有相关性的特征的种类的分类信息;
从分别对应于所述多个种类的多个第一码本中选择对应于所述分类信息的一个第一码本;
使用构成所述选择出的第一码本的多个第一代码矢量,对所述量化对象矢量进行量化,获得第一代码;以及
使用构成第二码本的多个第二代码矢量、以及对应于所述分类信息的比例因子,将对应于所述第一代码的第一代码矢量与所述量化对象矢量的残差矢量进行量化,获得第二代码。
9.用于语音信号/音乐信号的矢量反量化方法,包括以下的步骤:
生成表示多个种类中的与线谱对参数和导抗频谱对参数中的一种参数的量化对象矢量具有相关性的特征的种类的分类信息;
从接收到的编码数据中分离出作为所述量化对象矢量的第一级量化结果的第一代码、以及作为所述量化对象矢量的第二级量化结果的第二代码;
从分别对应于多个种类的多个第一码本中选择对应于所述分类信息的一个第一码本;
从所述选择出的第一码本中选择对应于所述第一代码的一个第一代码矢量;以及
从由多个第二代码矢量构成的第二码本中选择对应于所述第二代码的一个第二代码矢量,将所述一个第二代码矢量与对应于所述分类信息的比例因子相乘所得的结果、和所述一个第一代码矢量相加,以生成所述量化对象矢量。
CN200880110748XA 2007-10-12 2008-10-10 矢量量化装置、矢量反量化装置和其方法 Active CN101821800B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP2007-266922 2007-10-12
JP2007266922 2007-10-12
JP2007285602 2007-11-01
JP2007-285602 2007-11-01
PCT/JP2008/002876 WO2009047911A1 (ja) 2007-10-12 2008-10-10 ベクトル量子化装置、ベクトル逆量子化装置、およびこれらの方法

Publications (2)

Publication Number Publication Date
CN101821800A CN101821800A (zh) 2010-09-01
CN101821800B true CN101821800B (zh) 2012-09-26

Family

ID=40549063

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200880110748XA Active CN101821800B (zh) 2007-10-12 2008-10-10 矢量量化装置、矢量反量化装置和其方法

Country Status (10)

Country Link
US (1) US8438020B2 (zh)
EP (1) EP2202727B1 (zh)
JP (1) JP5300733B2 (zh)
KR (1) KR101390051B1 (zh)
CN (1) CN101821800B (zh)
BR (1) BRPI0818062A2 (zh)
CA (1) CA2701757C (zh)
MY (1) MY152348A (zh)
RU (1) RU2469421C2 (zh)
WO (1) WO2009047911A1 (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101335004B (zh) * 2007-11-02 2010-04-21 华为技术有限公司 一种多级量化的方法及装置
WO2009090876A1 (ja) * 2008-01-16 2009-07-23 Panasonic Corporation ベクトル量子化装置、ベクトル逆量子化装置、およびこれらの方法
JP5355244B2 (ja) * 2009-06-23 2013-11-27 日本電信電話株式会社 符号化方法、復号方法、符号化器、復号器およびプログラム
JP5336943B2 (ja) * 2009-06-23 2013-11-06 日本電信電話株式会社 符号化方法、復号方法、符号化器、復号器、プログラム
JP5336942B2 (ja) * 2009-06-23 2013-11-06 日本電信電話株式会社 符号化方法、復号方法、符号化器、復号器、プログラム
CN103636129B (zh) * 2011-07-01 2017-02-15 诺基亚技术有限公司 多尺度码本搜索
TR201911121T4 (tr) * 2012-03-29 2019-08-21 Ericsson Telefon Ab L M Vektör niceleyici.
CN104620315B (zh) * 2012-07-12 2018-04-13 诺基亚技术有限公司 一种矢量量化的方法及装置
JP2018526669A (ja) 2015-07-06 2018-09-13 ノキア テクノロジーズ オサケユイチア オーディオ信号デコーダのためのビット・エラー検出器

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1141684A (zh) * 1994-12-21 1997-01-29 索尼公司 声音编码方法
CN1158665A (zh) * 1994-10-07 1997-09-03 日本电信电话株式会社 矢量编码方法及其利用该方法的编码器和解码器
CN1468427A (zh) * 2000-05-19 2004-01-14 �����ɭ��ϵͳ��˾ 一种码激励线性预测语音编码器的增益量化

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1170269C (zh) * 1996-11-07 2004-10-06 松下电器产业株式会社 声源矢量生成装置以及声音编码装置和声音解码装置
WO1999016050A1 (en) * 1997-09-23 1999-04-01 Voxware, Inc. Scalable and embedded codec for speech and audio signals
WO2002045077A1 (en) * 2000-11-30 2002-06-06 Matsushita Electric Industrial Co., Ltd. Vector quantizing device for lpc parameters
CA2415105A1 (en) * 2002-12-24 2004-06-24 Voiceage Corporation A method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding
RU2248619C2 (ru) * 2003-02-12 2005-03-20 Рыболовлев Александр Аркадьевич Способ и устройство преобразования речевого сигнала методом линейного предсказания с адаптивным распределением информационных ресурсов
US20060014288A1 (en) * 2004-06-23 2006-01-19 Tissuegene, Inc. Nerve regeneration
WO2006000020A1 (en) 2004-06-29 2006-01-05 European Nickel Plc Improved leaching of base metals
CN101023471B (zh) 2004-09-17 2011-05-25 松下电器产业株式会社 可伸缩性编码装置、可伸缩性解码装置、可伸缩性编码方法、可伸缩性解码方法、通信终端装置以及基站装置
KR20070085982A (ko) * 2004-12-10 2007-08-27 마츠시타 덴끼 산교 가부시키가이샤 광대역 부호화 장치, 광대역 lsp 예측 장치, 대역스케일러블 부호화 장치 및 광대역 부호화 방법
KR101280096B1 (ko) 2005-06-29 2013-06-28 컴퓨메딕스 리미티드 전도성 브리지를 포함하는 센서 어셈블리
JP2007266922A (ja) 2006-03-28 2007-10-11 Make Softwear:Kk 写真シール作成装置、写真シール作成装置の制御方法、および写真シール作成装置の制御プログラム
JP4820682B2 (ja) 2006-04-17 2011-11-24 株式会社東芝 加熱調理器
JPWO2007132750A1 (ja) * 2006-05-12 2009-09-24 パナソニック株式会社 Lspベクトル量子化装置、lspベクトル逆量子化装置、およびこれらの方法
TW200801513A (en) 2006-06-29 2008-01-01 Fermiscan Australia Pty Ltd Improved process
US7873514B2 (en) * 2006-08-11 2011-01-18 Ntt Docomo, Inc. Method for quantizing speech and audio through an efficient perceptually relevant search of multiple quantization patterns
JPWO2008047795A1 (ja) * 2006-10-17 2010-02-25 パナソニック株式会社 ベクトル量子化装置、ベクトル逆量子化装置、およびこれらの方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1158665A (zh) * 1994-10-07 1997-09-03 日本电信电话株式会社 矢量编码方法及其利用该方法的编码器和解码器
CN1141684A (zh) * 1994-12-21 1997-01-29 索尼公司 声音编码方法
CN1468427A (zh) * 2000-05-19 2004-01-14 �����ɭ��ϵͳ��˾ 一种码激励线性预测语音编码器的增益量化

Also Published As

Publication number Publication date
CN101821800A (zh) 2010-09-01
EP2202727B1 (en) 2018-01-10
CA2701757C (en) 2016-11-22
JPWO2009047911A1 (ja) 2011-02-17
JP5300733B2 (ja) 2013-09-25
KR101390051B1 (ko) 2014-04-29
EP2202727A1 (en) 2010-06-30
US8438020B2 (en) 2013-05-07
RU2469421C2 (ru) 2012-12-10
BRPI0818062A2 (pt) 2015-03-31
EP2202727A4 (en) 2012-08-22
MY152348A (en) 2014-09-15
KR20100085908A (ko) 2010-07-29
RU2010114237A (ru) 2011-10-20
WO2009047911A1 (ja) 2009-04-16
CA2701757A1 (en) 2009-04-16
US20100211398A1 (en) 2010-08-19

Similar Documents

Publication Publication Date Title
CN101821800B (zh) 矢量量化装置、矢量反量化装置和其方法
CN101911185B (zh) 矢量量化装置、矢量反量化装置及其方法
KR100872538B1 (ko) Lpc 파라미터의 벡터 양자화 장치, lpc 파라미터복호화 장치, lpc 계수의 복호화 장치, 기록 매체,음성 부호화 장치, 음성 복호화 장치, 음성 신호 송신장치, 및 음성 신호 수신 장치
KR101740359B1 (ko) 부호화 방법, 부호화 장치, 주기성 특징량 결정 방법, 주기성 특징량 결정 장치, 프로그램, 기록 매체
JP4879748B2 (ja) 最適化された複合的符号化方法
CN101903945A (zh) 编码装置、解码装置以及编码方法
US8719011B2 (en) Encoding device and encoding method
WO2008047795A1 (fr) Dispositif de quantification vectorielle, dispositif de quantification vectorielle inverse et procédé associé
EP2398149B1 (en) Vector quantization device, vector inverse-quantization device, and associated methods
JP2000003193A (ja) 音声音楽信号の符号化装置および復号装置
JPWO2009125588A1 (ja) 符号化装置および符号化方法
JP2000132194A (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
JP5714172B2 (ja) 符号化装置、この方法、プログラムおよび記録媒体
JP2004177982A (ja) 音声音楽信号の符号化装置および復号装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: MATSUSHITA ELECTRIC (AMERICA) INTELLECTUAL PROPERT

Free format text: FORMER OWNER: MATSUSHITA ELECTRIC INDUSTRIAL CO, LTD.

Effective date: 20140716

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20140716

Address after: California, USA

Patentee after: PANASONIC INTELLECTUAL PROPERTY CORPORATION OF AMERICA

Address before: Osaka Japan

Patentee before: Matsushita Electric Industrial Co.,Ltd.

TR01 Transfer of patent right

Effective date of registration: 20170531

Address after: Delaware

Patentee after: III Holdings 12 LLC

Address before: California, USA

Patentee before: PANASONIC INTELLECTUAL PROPERTY CORPORATION OF AMERICA