CN102194462B - 固定码本搜索装置 - Google Patents
固定码本搜索装置 Download PDFInfo
- Publication number
- CN102194462B CN102194462B CN2011101877341A CN201110187734A CN102194462B CN 102194462 B CN102194462 B CN 102194462B CN 2011101877341 A CN2011101877341 A CN 2011101877341A CN 201110187734 A CN201110187734 A CN 201110187734A CN 102194462 B CN102194462 B CN 102194462B
- Authority
- CN
- China
- Prior art keywords
- vector
- impulse response
- matrix
- fixed codebook
- convolution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 239000013598 vector Substances 0.000 claims abstract description 116
- 230000004044 response Effects 0.000 claims abstract description 61
- 239000011159 matrix material Substances 0.000 claims abstract description 60
- 230000035807 sensation Effects 0.000 claims description 42
- 239000002131 composite material Substances 0.000 claims description 36
- 239000004577 thatch Substances 0.000 claims description 18
- 238000004422 calculation algorithm Methods 0.000 claims description 15
- 230000015572 biosynthetic process Effects 0.000 abstract description 5
- 238000003786 synthesis reaction Methods 0.000 abstract description 4
- 230000005284 excitation Effects 0.000 abstract 1
- 230000001364 causal effect Effects 0.000 description 21
- 238000000034 method Methods 0.000 description 15
- 230000003044 adaptive effect Effects 0.000 description 12
- 230000000694 effects Effects 0.000 description 10
- 238000004458 analytical method Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- JEIPFZHSYJVQDO-UHFFFAOYSA-N ferric oxide Chemical compound O=[Fe]O[Fe]=O JEIPFZHSYJVQDO-UHFFFAOYSA-N 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
- G10L19/107—Sparse pulse excitation, e.g. by using algebraic codebook
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Algebra (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Mathematical Physics (AREA)
- Pure & Applied Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
公开了固定码本搜索装置,即使声源脉冲所通过的滤波器具有无法用下三角矩阵表示的特性,也将运算量的增加抑制得较小,从而实现次优的固定码本搜索。在该固定码本搜索装置中,包括:卷积运算单元,向在负的时间具有非零值的脉冲响应矢量上卷积听觉加权合成滤波器的脉冲响应,以生成在负的时间具有非零值的第二脉冲响应矢量;矩阵生成单元,利用由所述卷积运算单元生成的第二脉冲响应矢量生成特普利茨型的卷积矩阵;以及搜索单元,使利用了所述特普利茨型的卷积矩阵的数式最大,以进行码本搜索,所述第二脉冲响应矢量的负的时间分量的时间长度比非负的时间分量的时间长度短。
Description
本申请是申请日为2007年3月8日、申请号为200780002877.2、发明名称为“固定码本搜索装置以及固定码本搜索方法”的发明专利申请的分案申请。
技术领域
本发明涉及固定码本搜索装置以及固定码本搜索方法,用于通过码激励线性预测(Code Excited Linear Prediction:CELP)型的语音编码装置对语音信号进行编码。
背景技术
在语音编码处理中,一般而言CELP型语音编码装置中的固定码本的搜索处理在处理量中占得最多,因此以往就开发了各种各样的固定码本的结构和固定码本的搜索方法。
作为比较能够减少用于搜索的处理量的固定码本,可举出在ITU-T建议G.729和G.723.1,或者3GPP标准AMR等国际标准编解码(codec)中被广泛采用的利用了代数码本(Algebraic Codebook)的固定码本(Fixed Codebook)(参照例如非专利文献1至3)。利用这些固定码本,通过稀疏(sparse)根据代数码本生成的脉冲数,能够减少固定码本搜索所需的处理量。另一方面,可利用稀疏的脉冲声源表现的信号特性有限,因此有时在编码质量上发生问题。为了对应这样的问题,提出了为使根据代数码本生成的脉冲声源具有特性而使其通过滤波器的方法(参照例如非专利文献4)。
【非专利文献1】ITU-T Recommendation G.729,“Coding of Speech at 8kbit/s using Conjugate-structure Algebraic-Code-Excited Lineare-Prediction(CS-ACELP)”,1996年3月
【非专利文献2】ITU-T Recommendation G.723.1,“Dual Rate SpeechCoder for Multimedia Communications Transmitting at 5.3and 6.3kbit/s”,1996年3月
【非专利文献3】3GPP TS 26.090、“AMR speech codec;Transcodingfunctions”V4.0.0,2001年3月
【非专利文献4】R.Hagen等,“Removal of sparse-excitation artifacts inCELP”and IEEE ICASSP‘98,pp.145~148,1998
发明内容
发明所要解决的课题
但是,在声源脉冲所通过的滤波器无法用下三角特普利茨(Toeplitz)矩阵表现时(例如,在非专利文献4那样的循环卷积处理时等,为在负的时间具有值的滤波器的情况下),在矩阵运算中需要额外的存储器和运算量。
本发明的目的在于提供语音编码装置等,即使声源脉冲所通过的滤波器具有无法用下三角矩阵表示的特性,也将运算量的增加抑制得较小,从而能够实现次优的固定码本搜索。
用于解决课题的手段
本发明通过固定码本搜索装置具有以下单元来达到上述目的:脉冲声源矢量生成单元,生成脉冲声源矢量;第一卷积运算单元,向在负的时间具有值的脉冲响应矢量上卷积听觉加权合成滤波器的脉冲响应,从而生成在负的时间具有值的第二脉冲响应矢量;矩阵生成单元,利用由所述第一卷积运算单元生成的第二脉冲响应矢量生成特普利茨型的卷积矩阵;以及搜索单元,利用由所述矩阵生成单元生成的矩阵,对由所述脉冲声源矢量生成单元生成的脉冲声源矢量进行卷积处理,并搜索使经所述卷积处理得到的听觉加权合成信号与根据输入语音信号得到的对象信号之间的误差成为最小的脉冲声源矢量,以确定用于生成搜索出的脉冲声源矢量的编码索引。
另外,本发明通过具有固定码本搜索方法来达到上述目的,该固定码本搜索方法包括:脉冲声源矢量生成步骤,生成脉冲声源矢量;第一卷积运算步骤,在负的时间具有值的脉冲响应矢量上卷积听觉加权合成滤波器的脉冲响应,从而生成在负的时间具有值的第二脉冲响应矢量;矩阵生成步骤,利用在所述第一卷积运算步骤中生成的第二脉冲响应矢量,生成特普利茨型的卷积矩阵;以及搜索步骤,利用所述特普利茨型的卷积矩阵,对所述脉冲声源矢量进行卷积处理,并搜索使经所述卷积处理得到的听觉加权合成信号与根据输入语音信号得到的对象信号之间的误差成为最小的脉冲声源矢量,以确定用于生成搜索出的脉冲声源矢量的编码索引。
另外,本发明的固定码本搜索装置包括:卷积运算单元,向在负的时间具有非零值的脉冲响应矢量上卷积听觉加权合成滤波器的脉冲响应,以生成在负的时间具有非零值的第二脉冲响应矢量;以及矩阵生成单元,利用由所述卷积运算单元生成的第二脉冲响应矢量生成特普利茨型的卷积矩阵H′,所述第二脉冲响应矢量的负的时间分量的时间长度比非负的时间分量的时间长度短,搜索使利用了所述特普利茨型的卷积矩阵H′的以下式(1)为最大的索引k,
其中,上标t表示其为转置矩阵,Ck为听觉加权合成信号s和对象矢量x之间的内积,Ek为听觉加权合成信号s的能量,ck为以索引k指定的脉冲声源矢量,ck(n)为脉冲声源矢量ck的第n个元素,n=0,...,N-1,
x(n)为对象矢量x的第n个元素,n=0,...,N-1,
h(0)(n)为在负的时间具有非零值的第二脉冲响应矢量的第n个元素,n=-m,...,0,...,N-1,N为表示声源信号的编码的处理单位时间的帧或者子帧的长度的自然数,m为1至N-1的整数。
发明的效果
根据本发明,将无法用特普利茨矩阵表现的传递函数,使用截取了下三角特普利茨矩阵的行元素的一部分的形式的矩阵来近似,因此能够以与用下三角特普利茨矩阵表现的因果的滤波器的情况大致相同的存储量和运算量进行语音信号的编码处理。
附图说明
图1是表示本发明的一个实施方式的语音编码装置的固定码本矢量生成装置的方框图。
图2是表示本发明的一个实施方式的语音编码装置的一例固定码本搜索装置的方框图。
图3是表示本发明的一个实施方式的一例语音编码装置的方框图。
具体实施方式
本发明在使用缩减(truncate)了下三角特普利茨型矩阵的行元素的矩阵进行固定码本的搜索的结构上具有特征。
下面,适当地参照附图详细地说明本发明的实施方式。
(实施方式)
图1是表示本发明的一个实施方式的语音编码装置中的固定码本矢量生成装置100的结构的方框图。
另外,在本实施方式中,设固定码本矢量生成装置100为作为搭载并使用于移动电话等通信终端装置的CELP型语音编码装置的固定码本而使用的装置。
固定码本矢量生成装置100具备代数码本101和卷积运算单元102。
代数码本101生成在以输入的码本索引k指定的位置上代数方式地配置了音源脉冲的脉冲音源矢量ck,并将所生成的脉冲音源矢量输出到卷积运算单元102。代数码本的结构为哪种结构都可以,也可以为例如ITU-T建议G.729所记载的结构。
卷积运算单元102在从代数码本101输入的脉冲音源矢量上,卷积另外输入的、在负的时间具有值的脉冲响应矢量,并将卷积的结果的矢量作为固定码本矢量输出。虽然在负的时间具有值的脉冲响应矢量可以为任意的形状,但是在时间0的点的元素的振幅最大,而且时间0的点占有矢量整体的能量的多半的形状的矢量较适宜。另外,对于非因果的部分(也就是负的时间的矢量元素)而言,矢量长度比包含时间0的点的因果的部分(也就是非负的时间的矢量元素)短的矢量较适宜。在负的时间具有值的脉冲响应矢量既可以作为固定的矢量预先记忆在存储器,也可以为通过逐次计算求出的可变的矢量。以下,在本实施方式中,具体地说明在负的时间具有值的脉冲响应从时间“-m”开始具有值(也就是时间“-m-1”以前全都为0)的例子。
在图1中,使参照所输入的固定码本索引k根据固定码本生成的脉冲声源矢量ck,通过卷积滤波器F(相当于图1中的卷积运算单元102)和未图示的听觉加权合成滤波器H,由此得到的听觉加权合成信号s如下式(1)那样表示。
其中,h(n),n=0,...,N-1表示听觉加权合成滤波器的脉冲响应,f(n),n=-m,...,N-1表示非因果的滤波器的脉冲响应(也就是在负的时间具有值的脉冲响应),ck(n),n=0,...,N-1表示以索引k指定的脉冲声源矢量。
固定码本的搜索通过寻找使下式(2)为最大的k而进行。另外,在式(2)中,Ck为听觉加权合成信号s与后述的对象(target)矢量x之间的内积(或者互相关),Ek为听觉加权合成信号s的能量(也就是|s|2),所述听觉加权合成信号s为使以索引k指定的脉冲声源矢量(固定码本矢量)ck通过卷积滤波器F和听觉加权合成滤波器H而得到的听觉加权合成信号。
x为被称为CELP语音编码中的对象矢量的矢量,是从听觉加权输入语音信号除去听觉加权合成滤波器的零输入响应而得到的矢量。听觉加权输入语音信号是指使作为编码对象的输入语音信号通过听觉加权滤波器而得到的信号。听觉加权滤波器一般是指利用进行输入语音信号的线性预测分析而得到的线性预测系数构成的全极型或者极零型的滤波器,在CELP型语音编码装置中被广泛地利用。听觉加权合成滤波器是指将利用由CELP型语音编码装置进行了量化的线性预测系数构成的线性预测滤波器(也就是合成滤波器)与上述的听觉加权滤波器串行连接的滤波器。这些结构要素虽然在本实施方式中未图示,但是在CELP型语音编码装置中较普遍,例如在ITU-T建议G.729中,关于“对象矢量(target vector)”、“加权合成滤波器(weighted synthesisfilter)”以及“听觉加权合成滤波器的零输入响应(zero-input response of theweighted synthesis filter)”有记载。另外,上标t表示其为转置矩阵。
但是,根据式(1)可知,卷积了在负的时间具有值的脉冲响应的卷积听觉加权合成滤波器的用于卷积脉冲响应的矩阵H”不是特普利茨矩阵。缩减要卷积的脉冲响应的一部分或者全部的非因果的分量而利用其计算第一列至第m列,因此与利用要卷积的脉冲响应的全部的非因果的分量而计算的第m+1列以后的列分量不同。因此,矩阵H”不为特普利茨型。因此,必须分别计算并保持h(1)至h(m)的m种的脉冲响应,从而导致d以及Φ的计算所需的运算量以及存储量的增大。
于是,以下面的式(3)近似式(2)。
其中,d’t以下面的式(4)来表示。
也就是说,d’(i)以下面的式(5)来表示。
其中,x(n)表示对象矢量的第n个元素(n=0,1,...…,N-1,N为声源信号的编码的处理单位时间的帧或者子帧的长度),h(0)(n)表示在听觉加权滤波器的脉冲响应卷积了在负的时间具有值的脉冲响应的矢量的第n个元素(n=-m,0,...,N-1)。对象矢量在CELP语音编码中被普遍使用,并为从听觉加权输入语音信号除去听觉加权合成滤波器的零输入响应而得到的矢量。h(0)(n)为使听觉加权合成滤波器的脉冲响应h(n)(n=0,1,...,N-1)通过非因果的滤波器(脉冲响应f(n),n=-m,...,0,...,N-1)而得到的矢量,以下面的式(6)来表示。h(0)(n)也为非因果的滤波器的脉冲响应(n=-m,0,...,N-1)。
另外,矩阵Φ’以下面的式(7)来表示。
也就是说,矩阵H’为将矩阵H”的第p列元素h(p)(n),p=1至m以其它的列的元素h(0)(n)近似了的矩阵。该矩阵H’为缩减了下三角特普利茨型矩阵的行元素的特普利茨型矩阵。即使进行这样的近似,在负的时间具有值的脉冲响应矢量中,非因果的元素(负的时间的分量)的能量比因果的元素(非负的,也就是包含0的正的时间的分量)的能量足够小的情况下,由近似产生影响较小。而且,近似的进行限定于矩阵H”的第一列到第m列元素(这里m为非因果的元素的长度),m越短则近似的影响就越可以忽视。
另一方面,矩阵Φ’与Φ的计算所需的运算量存在较大的不同。也就是说,使用式(3)来近似与不使用式(3)来近似的情况之间出现较大的差异。例如,在考虑与求用于卷积在负的时间不具有脉冲响应的、通常的代数码本中的矩阵Φ0=HtH(H为卷积式(1)中的听觉加权滤波器的脉冲响应的下三角特普利茨型矩阵)的情况相比较时,根据式(8)可知,使用了式(3)来近似的情况下的矩阵Φ’的计算基本上只增加m次的积和运算。另外,还如以ITU-T建议G.729的C代码进行的那样,对于(i,j)而言,(j-i)相等的元素(例如,(N-2,N-1)、(N-3,N-2)、...、(0,1))可递归地求出。根据该特征,实现矩阵Φ’的高效的计算,因此矩阵元素的计算并不是总是要追加m次积和运算。
相对于此,在不使用式(3)来近似的矩阵Φ的计算中,对于 N-1的元素,需要进行特有的脉冲响应矢量的相关计算。也就是说用于这些计算的脉冲响应矢量与用于其它的矩阵元素的计算的脉冲响应矢量不同(也就是说,不是求h(0)与h(0)之间的相关,而是求h(0)与h(p),p=1至m之间的相关)。这些元素为在递归地求出时,最后才能得到计算结果的元素。也就是说,会失去上述的“可递归地求出,因此能够高效地计算矩阵Φ’的元素”的优点。该优点意味着运算量以大致与在负的时间具有值的脉冲响应矢量的、非因果的元素的数目成比例的形式增加(例如,即使在m=1的情况下,也变成接近两倍的运算量)。
图2为表示一例实现上述的固定码本搜索方法的固定码本搜索装置150的方框图。
在负的时间具有值的脉冲响应矢量与听觉加权合成滤波器的脉冲响应矢量被输入到卷积运算单元151。卷积运算单元151根据式(6)计算h(0)(n),并输出到矩阵生成单元152。
矩阵生成单元152利用由卷积运算单元151输入的h(0)(n)生成矩阵H’,并输出到卷积运算单元153。
卷积运算单元153在由代数码本101输入的脉冲声源矢量ck上卷积由矩阵生成单元152输入的矩阵H’的元素h(0)(n),并将其结果输出到加法器154。
加法器154计算从卷积运算单元153输入的听觉加权合成信号与被另外输入的对象矢量之间的差分信号,并将该差分信号输出到误差最小化单元155。
误差最小化单元155确定用于生成使从加法器154输入的差分信号的能量成为最小的脉冲声源矢量ck的码本索引k。
图3是表示一例将图1所示的固定码本矢量生成装置100作为固定码本矢量生成单元100a具备的CELP型语音编码装置200的方框图。
输入语音信号被输入到预处理单元201。预处理单元201进行直流分量的除去等预处理,并将处理后的信号输出到线性预测分析单元202以及加法器203。
线性预测分析单元202进行由预处理单元201输入的信号的线性预测分析,将作为分析结果的线性预测系数输出到LPC量化单元204以及听觉加权滤波器205。
加法器203计算由预处理单元201输入的预处理后的输入语音信号与由合成滤波器206输入的合成语音信号之间的差信号,并输出到听觉加权滤波器205。
LPC量化单元204进行从线性预测分析单元202输入的线性预测系数的量化以及编码处理,将量化LPC输出到合成滤波器206,并将编码结果输出到比特流生成单元212。
听觉加权滤波器205为使用由线性预测分析单元202输入的线性预测系数而构成的极零型的滤波器,对由加法器203输入的预处理后的输入语音信号与合成语音信号之间的差信号进行滤波处理,并输出到误差最小化单元207。
合成滤波器206为通过由LPC量化单元204输入的量化线性预测系数构筑的线性预测滤波器,由加法器211输入驱动信号,对其进行线性预测合成处理,并将合成语音信号输出到加法器203。
误差最小化单元207确定有关自适应码本矢量生成单元208、固定码本矢量生成单元100a、以及对于自适应码本矢量和固定码本矢量增益的参数,以使由听觉加权滤波器205输入的信号的能量成为最小,并且将这些参数的编码结果输出到比特流生成单元212。另外,虽然在本图中设想有关增益的参数在误差最小化单元207内被量化而得到一个编码结果,但是增益量化单元也可以在误差最小化单元207的外面。
自适应码本矢量生成单元208具有自适应码本,以缓存过去从加法器211输入的驱动信号,生成自适应码本矢量而输出到放大器209。自适应码本矢量根据来自误差最小化单元207的指示被确定。
放大器209将从误差最小化单元207输入的自适应码本增益乘以从自适应码本矢量生成单元208输入的自适应码本矢量,并将其结果输出到加法器211。
固定码本矢量生成单元100a与图1所示的固定码本矢量生成装置100为相同的结构,由误差最小化单元207输入有关码本索引和非因果的滤波器的脉冲响应的信息,生成固定码本矢量而输出到放大器210。
放大器210将从误差最小化单元207输入的固定码本增益乘以从固定码本矢量生成单元100a输入的固定码本矢量,并将其结果输出到加法器211。
加法器211进行从放大器209以及210输入的增益乘法后的自适应码本矢量以及固定码本矢量的加法运算,并将结果作为滤波器驱动信号输出到合成滤波器206。
比特流生成单元212输入由LPC量化单元204输入的线性预测系数(也就是LPC)的编码结果、以及由误差最小化单元207输入的自适应码本矢量、固定码本矢量和对于它们的增益信息的编码结果,将其变换为比特流而输出。
另外,在决定误差最小化单元207中的固定码本矢量的参数时,使用上述固定码本搜索方法,而实际的固定码本搜索装置使用图2所示的装置。
这样,在本实施方式中,在使根据代数码本生成的声源矢量通过具有在负的时间具有值的脉冲响应特性的滤波器(一般称为非因果的滤波器)的情况下,将非因果的滤波器和听觉加权合成滤波器串行连接了的处理块的传递函数,通过缩减了相当于非因果部分的长度的行数的矩阵元素的下三角特普利茨型矩阵来近似。通过该近似可以抑制代数码本的搜索所需的运算量的增加。另外,在非因果的元素的数目比因果的元素的数目少,和/或非因果的元素的能量比因果的元素的能量小的情况下,可抑制上述近似对编码质量造成的影响。
另外,也可以如下地对本实施方式进行变形或者应用。
也可以将非因果的滤波器的脉冲响应的因果的分量的数目在比非因果的分量的数目大的范围内限定为特定的数目。
另外,在本实施方式中,只说明了固定码本搜索时的处理。在CELP型语音编码装置中,在固定码本搜索之后,一般进行增益量化。此时,因为需要通过了听觉加权合成滤波器的固定声源码本矢量(也就是使选择出的固定声源码本矢量通过听觉加权合成滤波器而得到的合成信号),所以在固定码本搜索结束后,一般计算该“通过了听觉加权合成滤波器的固定声源码本矢量”。此时要使用的脉冲响应卷积矩阵与其为在搜索时使用了的近似的脉冲响应卷积矩阵H(0),不如使用只有第1~m列(=非因果的元素的数目为m的情况下)的元素与其它元素不同的矩阵H”好。
另外,在本实施方式中,对于非因果的部分(也就是负的时间的矢量元素)而言,虽然设定为矢量长度比包含时间0的点的因果的部分(也就是非负的时间的矢量元素)短的矢量较适宜,但是将非因果的部分的长度设定为小于N/2(N为脉冲声源矢量的长度)。
以上说明了本发明实施方式。
本发明的固定码本搜索装置和语音编码装置等并不只限于上述实施方式,能够加以各种各样的变更而实施。
本发明的固定码本搜索装置和语音编码装置等能够搭载于移动通信系统中的通信终端装置以及基站装置,由此能够提供具有与上述同样的作用效果的通信终端装置、基站装置以及移动通信系统。
另外,在这里,虽然以本发明通过硬件构成的情况为例进行了说明,但本发明也可以通过软件来实现。例如,将本发明的固定码本搜索方法和语音编码方法等算法通过程序语言记述,并将该程序预先记忆在存储器而通过信息处理方法来实行,由此能够实现与本发明的固定码本搜索装置和语音编码装置同样的功能。
另外,也可以将在上述实施方式中使用了的“固定码本”和“自适应码本”称为“固定声源码本”和“自适应声源码本”。
另外,用于上述实施方式的说明中的各功能块通常被作为集成电路的LSI来实现。这些块既可以被单独地集成为一个芯片,也可以包含一部分或全部地被集成为一个芯片。
虽然此处称为LSI,但根据集成程度,可以被称为IC、系统LSI、超大LSI(Super LSI)、或特大LSI(Ultra LSI)。
另外,实现集成电路化的方法不仅限于LSI,也可使用专用电路或通用处理器来实现。也可以使用可在LSI制造后编程的FPGA(Field ProgrammableGate Array:现场可编程门阵列),或者可重构LSI内部的电路单元的连接和设定的可重构处理器。
再者,随着半导体的技术进步或随之派生的其它技术的出现,如果出现能够替代LSI的集成电路化的新技术,当然可利用该新技术进行功能块的集成化。还存在着适用生物技术等的可能性。
2006年3月10日提交的特愿第2006-065399号和2007年2月6日提交的特愿第2007-027408号的日本专利申请中所包含的说明书、附图以及说明书摘要的公开内容,都引用于本申请。
工业实用性
本发明的固定码本搜索装置等在将代数码本作为固定码本利用的CELP型语音编码装置中,具有能够不较大地增加运算量以及存储量地将非因果的滤波器特性附加在通过代数码本生成的脉冲声源矢量的效果,对于可利用的存储量具有限制,并且不得不低速地进行无线通信的携带电话等的通信终端装置等中的语音编码装置的固定码本搜索很有用。
Claims (2)
1.一种固定码本搜索装置,包括:
卷积运算单元,向在负的时间具有非零值的脉冲响应矢量上卷积听觉加权合成滤波器的脉冲响应,以生成在负的时间具有非零值的第二脉冲响应矢量;以及
矩阵生成单元,利用由所述卷积运算单元生成的第二脉冲响应矢量生成特普利茨型的卷积矩阵H′,
所述第二脉冲响应矢量的负的时间分量的时间长度比非负的时间分量的时间长度短,
搜索使利用了所述特普利茨型的卷积矩阵H′的以下式(1)为最大的索引k,
其中,上标t表示其为转置矩阵,Ck为听觉加权合成信号s和对象矢量x之间的内积,Ek为听觉加权合成信号s的能量,ck为以索引k指定的脉冲声源矢量,ck(n)为脉冲声源矢量ck的第n个元素,n=0,...,N-1,
x(n)为对象矢量x的第n个元素,n=0,...,N-1,
h(0)(n)为在负的时间具有非零值的第二脉冲响应矢量的第n个元素,n=-m,...,0,...,N-1,N为表示声源信号的编码的处理单位时间的帧或者子帧的长度的自然数,m为1至N-1的整数。
2.如权利要求1所述的固定码本搜索装置,所述第二脉冲响应矢量包括一个负的时间分量。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP065399/06 | 2006-03-10 | ||
JP2006065399 | 2006-03-10 | ||
JP027408/07 | 2007-02-06 | ||
JP2007027408A JP3981399B1 (ja) | 2006-03-10 | 2007-02-06 | 固定符号帳探索装置および固定符号帳探索方法 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2007800028772A Division CN101371299B (zh) | 2006-03-10 | 2007-03-08 | 固定码本搜索装置以及固定码本搜索方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102194462A CN102194462A (zh) | 2011-09-21 |
CN102194462B true CN102194462B (zh) | 2013-02-27 |
Family
ID=37891857
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2007800028772A Expired - Fee Related CN101371299B (zh) | 2006-03-10 | 2007-03-08 | 固定码本搜索装置以及固定码本搜索方法 |
CN201110188743.2A Expired - Fee Related CN102201239B (zh) | 2006-03-10 | 2007-03-08 | 固定码本搜索装置以及固定码本搜索方法 |
CN2011101877341A Expired - Fee Related CN102194462B (zh) | 2006-03-10 | 2007-03-08 | 固定码本搜索装置 |
CN2011101875793A Expired - Fee Related CN102194461B (zh) | 2006-03-10 | 2007-03-08 | 固定码本搜索装置 |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2007800028772A Expired - Fee Related CN101371299B (zh) | 2006-03-10 | 2007-03-08 | 固定码本搜索装置以及固定码本搜索方法 |
CN201110188743.2A Expired - Fee Related CN102201239B (zh) | 2006-03-10 | 2007-03-08 | 固定码本搜索装置以及固定码本搜索方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2011101875793A Expired - Fee Related CN102194461B (zh) | 2006-03-10 | 2007-03-08 | 固定码本搜索装置 |
Country Status (15)
Country | Link |
---|---|
US (4) | US7519533B2 (zh) |
EP (4) | EP2113912B1 (zh) |
JP (1) | JP3981399B1 (zh) |
KR (4) | KR101359167B1 (zh) |
CN (4) | CN101371299B (zh) |
AT (1) | ATE400048T1 (zh) |
AU (1) | AU2007225879B2 (zh) |
BR (1) | BRPI0708742A2 (zh) |
CA (1) | CA2642804C (zh) |
DE (3) | DE602007000030D1 (zh) |
ES (3) | ES2308765T3 (zh) |
MX (1) | MX2008011338A (zh) |
RU (2) | RU2425428C2 (zh) |
WO (1) | WO2007105587A1 (zh) |
ZA (1) | ZA200807703B (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5159318B2 (ja) * | 2005-12-09 | 2013-03-06 | パナソニック株式会社 | 固定符号帳探索装置および固定符号帳探索方法 |
US20090164211A1 (en) * | 2006-05-10 | 2009-06-25 | Panasonic Corporation | Speech encoding apparatus and speech encoding method |
JP5425066B2 (ja) | 2008-06-19 | 2014-02-26 | パナソニック株式会社 | 量子化装置、符号化装置およびこれらの方法 |
CN105225669B (zh) * | 2011-03-04 | 2018-12-21 | 瑞典爱立信有限公司 | 音频编码中的后量化增益校正 |
GB201115048D0 (en) | 2011-08-31 | 2011-10-19 | Univ Bristol | Channel signature modulation |
CN103456309B (zh) * | 2012-05-31 | 2016-04-20 | 展讯通信(上海)有限公司 | 语音编码器及其代数码表搜索方法和装置 |
BR112015007137B1 (pt) * | 2012-10-05 | 2021-07-13 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Aparelho para codificar um sinal de fala que emprega acelp no domínio de autocorrelação |
CN111052111A (zh) * | 2017-09-14 | 2020-04-21 | 三菱电机株式会社 | 运算电路、运算方法以及程序 |
CN109446413B (zh) * | 2018-09-25 | 2021-06-01 | 上海交通大学 | 基于物品关联关系的序列化推荐方法 |
CN116052700B (zh) * | 2022-07-29 | 2023-09-29 | 荣耀终端有限公司 | 声音编解码方法以及相关装置、系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4868867A (en) * | 1987-04-06 | 1989-09-19 | Voicecraft Inc. | Vector excitation speech or audio coder for transmission or storage |
US4991214A (en) * | 1987-08-28 | 1991-02-05 | British Telecommunications Public Limited Company | Speech coding using sparse vector codebook and cyclic shift techniques |
EP0619574A1 (en) * | 1993-04-09 | 1994-10-12 | SIP SOCIETA ITALIANA PER l'ESERCIZIO DELLE TELECOMUNICAZIONI P.A. | Speech coder employing analysis-by-synthesis techniques with a pulse excitation |
US5717825A (en) * | 1995-01-06 | 1998-02-10 | France Telecom | Algebraic code-excited linear prediction speech coding method |
CN1321297A (zh) * | 1999-08-23 | 2001-11-07 | 松下电器产业株式会社 | 音频编码装置以及音频编码方法 |
CN1585970A (zh) * | 2001-11-13 | 2005-02-23 | 日本电气株式会社 | 代码转换方法、设备、程序和记录介质 |
Family Cites Families (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2010830C (en) * | 1990-02-23 | 1996-06-25 | Jean-Pierre Adoul | Dynamic codebook for efficient speech coding based on algebraic codes |
US5754976A (en) * | 1990-02-23 | 1998-05-19 | Universite De Sherbrooke | Algebraic codebook with signal-selected pulse amplitude/position combinations for fast coding of speech |
US5701392A (en) * | 1990-02-23 | 1997-12-23 | Universite De Sherbrooke | Depth-first algebraic-codebook search for fast coding of speech |
US5734789A (en) * | 1992-06-01 | 1998-03-31 | Hughes Electronics | Voiced, unvoiced or noise modes in a CELP vocoder |
US5732389A (en) * | 1995-06-07 | 1998-03-24 | Lucent Technologies Inc. | Voiced/unvoiced classification of speech for excitation codebook selection in celp speech decoding during frame erasures |
US5751901A (en) * | 1996-07-31 | 1998-05-12 | Qualcomm Incorporated | Method for searching an excitation codebook in a code excited linear prediction (CELP) coder |
US6055496A (en) * | 1997-03-19 | 2000-04-25 | Nokia Mobile Phones, Ltd. | Vector quantization in celp speech coder |
JP3276356B2 (ja) | 1998-03-31 | 2002-04-22 | 松下電器産業株式会社 | Celp型音声符号化装置及びcelp型音声符号化方法 |
US6826527B1 (en) * | 1999-11-23 | 2004-11-30 | Texas Instruments Incorporated | Concealment of frame erasures and method |
US7606703B2 (en) * | 2000-11-15 | 2009-10-20 | Texas Instruments Incorporated | Layered celp system and method with varying perceptual filter or short-term postfilter strengths |
CA2327041A1 (en) * | 2000-11-22 | 2002-05-22 | Voiceage Corporation | A method for indexing pulse positions and signs in algebraic codebooks for efficient coding of wideband signals |
SE521693C3 (sv) * | 2001-03-30 | 2004-02-04 | Ericsson Telefon Ab L M | En metod och anordning för brusundertryckning |
US6766289B2 (en) * | 2001-06-04 | 2004-07-20 | Qualcomm Incorporated | Fast code-vector searching |
DE10140507A1 (de) | 2001-08-17 | 2003-02-27 | Philips Corp Intellectual Pty | Verfahren für die algebraische Codebook-Suche eines Sprachsignalkodierers |
US6829579B2 (en) * | 2002-01-08 | 2004-12-07 | Dilithium Networks, Inc. | Transcoding method and system between CELP-based speech codes |
US7363218B2 (en) * | 2002-10-25 | 2008-04-22 | Dilithium Networks Pty. Ltd. | Method and apparatus for fast CELP parameter mapping |
KR100463559B1 (ko) | 2002-11-11 | 2004-12-29 | 한국전자통신연구원 | 대수 코드북을 이용하는 켈프 보코더의 코드북 검색방법 |
WO2004084179A2 (en) * | 2003-03-15 | 2004-09-30 | Mindspeed Technologies, Inc. | Adaptive correlation window for open-loop pitch |
KR100556831B1 (ko) * | 2003-03-25 | 2006-03-10 | 한국전자통신연구원 | 전역 펄스 교체를 통한 고정 코드북 검색 방법 |
CN1240050C (zh) * | 2003-12-03 | 2006-02-01 | 北京首信股份有限公司 | 一种用于语音编码的固定码本快速搜索方法 |
JP4605445B2 (ja) | 2004-08-24 | 2011-01-05 | ソニー株式会社 | 画像処理装置および方法、記録媒体、並びにプログラム |
SG123639A1 (en) * | 2004-12-31 | 2006-07-26 | St Microelectronics Asia | A system and method for supporting dual speech codecs |
JP2007027408A (ja) | 2005-07-15 | 2007-02-01 | Sony Corp | 電子部品の吸着ノズル機構 |
-
2007
- 2007-02-06 JP JP2007027408A patent/JP3981399B1/ja not_active Expired - Fee Related
- 2007-03-08 KR KR1020127004260A patent/KR101359167B1/ko active IP Right Grant
- 2007-03-08 US US11/683,830 patent/US7519533B2/en active Active
- 2007-03-08 KR KR1020087017192A patent/KR101359203B1/ko active IP Right Grant
- 2007-03-08 CA CA2642804A patent/CA2642804C/en active Active
- 2007-03-08 CN CN2007800028772A patent/CN101371299B/zh not_active Expired - Fee Related
- 2007-03-08 CN CN201110188743.2A patent/CN102201239B/zh not_active Expired - Fee Related
- 2007-03-08 CN CN2011101877341A patent/CN102194462B/zh not_active Expired - Fee Related
- 2007-03-08 BR BRPI0708742-0A patent/BRPI0708742A2/pt not_active Application Discontinuation
- 2007-03-08 KR KR1020127004264A patent/KR101359147B1/ko active IP Right Grant
- 2007-03-08 AU AU2007225879A patent/AU2007225879B2/en not_active Ceased
- 2007-03-08 MX MX2008011338A patent/MX2008011338A/es active IP Right Grant
- 2007-03-08 RU RU2008136401/09A patent/RU2425428C2/ru not_active IP Right Cessation
- 2007-03-08 WO PCT/JP2007/054529 patent/WO2007105587A1/ja active Application Filing
- 2007-03-08 CN CN2011101875793A patent/CN102194461B/zh not_active Expired - Fee Related
- 2007-03-09 KR KR1020070023587A patent/KR100806470B1/ko active IP Right Grant
- 2007-03-12 EP EP09007849.4A patent/EP2113912B1/en not_active Not-in-force
- 2007-03-12 ES ES07103936T patent/ES2308765T3/es active Active
- 2007-03-12 EP EP08005995A patent/EP1942488B1/en active Active
- 2007-03-12 DE DE602007000030T patent/DE602007000030D1/de active Active
- 2007-03-12 ES ES08005996T patent/ES2329199T3/es active Active
- 2007-03-12 DE DE602007001862T patent/DE602007001862D1/de active Active
- 2007-03-12 EP EP07103936A patent/EP1833047B1/en active Active
- 2007-03-12 AT AT07103936T patent/ATE400048T1/de not_active IP Right Cessation
- 2007-03-12 EP EP08005996A patent/EP1942489B1/en active Active
- 2007-03-12 DE DE602007001861T patent/DE602007001861D1/de active Active
- 2007-03-12 ES ES08005995T patent/ES2329198T3/es active Active
-
2008
- 2008-09-08 ZA ZA200807703A patent/ZA200807703B/xx unknown
-
2009
- 2009-02-25 US US12/392,858 patent/US7949521B2/en active Active
- 2009-02-25 US US12/392,880 patent/US7957962B2/en active Active
-
2011
- 2011-03-29 RU RU2011111943/08A patent/RU2458412C1/ru not_active IP Right Cessation
- 2011-04-25 US US13/093,294 patent/US8452590B2/en active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4868867A (en) * | 1987-04-06 | 1989-09-19 | Voicecraft Inc. | Vector excitation speech or audio coder for transmission or storage |
US4991214A (en) * | 1987-08-28 | 1991-02-05 | British Telecommunications Public Limited Company | Speech coding using sparse vector codebook and cyclic shift techniques |
EP0619574A1 (en) * | 1993-04-09 | 1994-10-12 | SIP SOCIETA ITALIANA PER l'ESERCIZIO DELLE TELECOMUNICAZIONI P.A. | Speech coder employing analysis-by-synthesis techniques with a pulse excitation |
US5717825A (en) * | 1995-01-06 | 1998-02-10 | France Telecom | Algebraic code-excited linear prediction speech coding method |
CN1321297A (zh) * | 1999-08-23 | 2001-11-07 | 松下电器产业株式会社 | 音频编码装置以及音频编码方法 |
CN1585970A (zh) * | 2001-11-13 | 2005-02-23 | 日本电气株式会社 | 代码转换方法、设备、程序和记录介质 |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102194462B (zh) | 固定码本搜索装置 | |
CN102682778B (zh) | 编码装置以及编码方法 | |
CN101583995A (zh) | 参数解码装置、参数编码装置以及参数解码方法 | |
EP2867892B1 (en) | Linear prediction based audio coding using improved probability distribution estimation | |
CN101622663B (zh) | 编码装置以及编码方法 | |
CN103069483B (zh) | 编码装置以及编码方法 | |
CN1751338B (zh) | 用于语音编码的方法和设备 | |
CN101185123B (zh) | 可扩展编码装置及可扩展编码方法 | |
EP2099025A1 (en) | Audio encoding device and audio encoding method | |
JPH1063300A (ja) | 音声復号化装置及び音声符号化装置 | |
CN103119650B (zh) | 编码装置和编码方法 | |
JPH10260698A (ja) | 信号符号化装置 | |
CN102598124A (zh) | 编码装置、解码装置及其方法 | |
JP3471892B2 (ja) | ベクトル量子化方法及び装置 | |
JPH07142959A (ja) | ディジタルフィルタ | |
Casajus-Quiros et al. | Analysis and quantization procedures for a real-time implementation of a 4.8 kb/s CELP coder | |
JPH09269800A (ja) | 音声符号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20170601 Address after: Delaware Patentee after: III Holdings 12 LLC Address before: Osaka Japan Patentee before: Matsushita Electric Industrial Co.,Ltd. |
|
TR01 | Transfer of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20130227 |
|
CF01 | Termination of patent right due to non-payment of annual fee |