CN102194461B - 固定码本搜索装置 - Google Patents

固定码本搜索装置 Download PDF

Info

Publication number
CN102194461B
CN102194461B CN2011101875793A CN201110187579A CN102194461B CN 102194461 B CN102194461 B CN 102194461B CN 2011101875793 A CN2011101875793 A CN 2011101875793A CN 201110187579 A CN201110187579 A CN 201110187579A CN 102194461 B CN102194461 B CN 102194461B
Authority
CN
China
Prior art keywords
vector
impulse response
matrix
prime
fixed codebook
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2011101875793A
Other languages
English (en)
Other versions
CN102194461A (zh
Inventor
江原宏幸
吉田幸司
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
III Holdings 12 LLC
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Publication of CN102194461A publication Critical patent/CN102194461A/zh
Application granted granted Critical
Publication of CN102194461B publication Critical patent/CN102194461B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • G10L19/107Sparse pulse excitation, e.g. by using algebraic codebook
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders

Abstract

公开了固定码本搜索装置,即使声源脉冲所通过的滤波器具有无法用下三角矩阵表示的特性,也将运算量的增加抑制得较小,从而实现次优的固定码本搜索。在该固定码本搜索装置中,包括:卷积运算单元,向在负的时间具有非零值的脉冲响应矢量上卷积听觉加权合成滤波器的脉冲响应,以生成在负的时间具有非零值的第二脉冲响应矢量;以及矩阵生成单元,利用由所述卷积运算单元生成的第二脉冲响应矢量生成特普利茨型的卷积矩阵。

Description

固定码本搜索装置
本申请是申请日为2007年3月8日、申请号为200780002877.2、发明名称为“固定码本搜索装置以及固定码本搜索方法”的发明专利申请的分案申请。
技术领域
本发明涉及固定码本搜索装置以及固定码本搜索方法,用于通过码激励线性预测(Code Excited Linear Prediction:CELP)型的语音编码装置对语音信号进行编码。
背景技术
在语音编码处理中,一般而言CELP型语音编码装置中的固定码本的搜索处理在处理量中占得最多,因此以往就开发了各种各样的固定码本的结构和固定码本的搜索方法。
作为比较能够减少用于搜索的处理量的固定码本,可举出在ITU-T建议G.729和G.723.1,或者3GPP标准AMR等国际标准编解码(codec)中被广泛采用的利用了代数码本(Algebraic Codebook)的固定码本(Fixed Codebook)(参照例如非专利文献1至3)。利用这些固定码本,通过稀疏(sparse)根据代数码本生成的脉冲数,能够减少固定码本搜索所需的处理量。另一方面,可利用稀疏的脉冲声源表现的信号特性有限,因此有时在编码质量上发生问题。为了对应这样的问题,提出了为使根据代数码本生成的脉冲声源具有特性而使其通过滤波器的方法(参照例如非专利文献4)。
【非专利文献1】ITU-T Recommendation G.729,“Coding of Speech at 8kbit/s using Conjugate-structure Algebraic-Code-Excited Lineare-Prediction(CS-ACELP)”,1996年3月
【非专利文献2】ITU-T Recommendation G.723.1,“Dual Rate SpeechCoder for Multimedia Communications Transmitting at 5.3 and 6.3kbit/s”,1996年3月
【非专利文献3】3GPP TS 26.090、“AMR speech codec;Transcodingfunctions”V4.0.0,2001年3月
【非专利文献4】R.Hagen等,“Removal of sparse-excitation artifacts inCELP”and IEEE ICASSP‘98,pp.145~148,1998
发明内容
发明所要解决的课题
但是,在声源脉冲所通过的滤波器无法用下三角特普利茨(Toeplitz)矩阵表现时(例如,在非专利文献4那样的循环卷积处理时等,为在负的时间具有值的滤波器的情况下),在矩阵运算中需要额外的存储器和运算量。
本发明的目的在于提供语音编码装置等,即使声源脉冲所通过的滤波器具有无法用下三角矩阵表示的特性,也将运算量的增加抑制得较小,从而能够实现次优的固定码本搜索。
用于解决课题的手段
本发明的固定码本搜索装置包括:卷积运算单元,向在负的时间具有非零值的脉冲响应矢量上卷积听觉加权合成滤波器的脉冲响应,以生成在负的时间具有非零值的第二脉冲响应矢量;以及矩阵生成单元,利用由所述卷积运算单元生成的第二脉冲响应矢量生成特普利茨型的卷积矩阵H′,搜索使利用了所述特普利茨型的卷积矩阵H′的以下式(1)为最大的索引k,
C k 2 E k 2 = ( Σ n = 0 N - 1 d ′ ( n ) c k ( n ) ) 2 c k t Φ ′ c k - - - ( 1 )
其中,上标t表示其为转置矩阵,Ck为听觉加权合成信号s与对象矢量x之间的内积,Ek为听觉加权合成信号s的能量,ck为以索引k指定的脉冲声源矢量,ck(n)为脉冲声源矢量ck的第n个元素,n=0,...,N-1,
d ′ ( i ) = Σ n = - i N - 1 - i x ( n + i ) h ( 0 ) ( n ) , wherei = 0 , . . . , m - 1 Σ n = - m N - 1 - i x ( n + i ) h ( 0 ) ( n ) , wherei = m , . . . , N - 1
x(n)为对象矢量x的第n个元素,n=0,...,N-1,
Figure GDA00001722181500031
h(0)(n)为在负的时间具有非零值的第二脉冲响应矢量的第n个元素,n=-m,...,0,...,N-1,N为表示声源信号的编码的处理单位时间的帧或者子帧的长度的自然数,m为表示非因果的元素的长度的1至N-1的整数。
发明的效果
根据本发明,将无法用特普利茨矩阵表现的传递函数,使用截取了下三角特普利茨矩阵的行元素的一部分的形式的矩阵来近似,因此能够以与用下三角特普利茨矩阵表现的因果的滤波器的情况大致相同的存储量和运算量进行语音信号的编码处理。
附图说明
图1是表示本发明的一个实施方式的语音编码装置的固定码本矢量生成装置的方框图。
图2是表示本发明的一个实施方式的语音编码装置的一例固定码本搜索装置的方框图。
图3是表示本发明的一个实施方式的一例语音编码装置的方框图。
具体实施方式
本发明在使用缩减(truncate)了下三角特普利茨型矩阵的行元素的矩阵进行固定码本的搜索的结构上具有特征。
下面,适当地参照附图详细地说明本发明的实施方式。
(实施方式)
图1是表示本发明的一个实施方式的语音编码装置中的固定码本矢量生成装置100的结构的方框图。
另外,在本实施方式中,设固定码本矢量生成装置100为作为搭载并使用于移动电话等通信终端装置的CELP型语音编码装置的固定码本而使用的装置。
固定码本矢量生成装置100具备代数码本101和卷积运算单元102。
代数码本101生成在以输入的码本索引k指定的位置上代数方式地配置了音源脉冲的脉冲音源矢量ck,并将所生成的脉冲音源矢量输出到卷积运算单元102。代数码本的结构为哪种结构都可以,也可以为例如ITU-T建议G.729所记载的结构。
卷积运算单元102在从代数码本101输入的脉冲音源矢量上,卷积另外输入的、在负的时间具有值的脉冲响应矢量,并将卷积的结果的矢量作为固定码本矢量输出。虽然在负的时间具有值的脉冲响应矢量可以为任意的形状,但是在时间0的点的元素的振幅最大,而且时间0的点占有矢量整体的能量的多半的形状的矢量较适宜。另外,对于非因果的部分(也就是负的时间的矢量元素)而言,矢量长度比包含时间0的点的因果的部分(也就是非负的时间的矢量元素)短的矢量较适宜。在负的时间具有值的脉冲响应矢量既可以作为固定的矢量预先记忆在存储器,也可以为通过逐次计算求出的可变的矢量。以下,在本实施方式中,具体地说明在负的时间具有值的脉冲响应从时间“-m”开始具有值(也就是时间“-m-1”以前全都为0)的例子。
在图1中,使参照所输入的固定码本索引k根据固定码本生成的脉冲声源矢量ck,通过卷积滤波器F(相当于图1中的卷积运算单元102)和未图示的听觉加权合成滤波器H,由此得到的听觉加权合成信号s如下式(1)那样表示。
Figure GDA00001722181500041
Figure GDA00001722181500042
Figure GDA00001722181500043
Figure GDA00001722181500044
...(1)
其中,h(n),n=0,...,N-1表示听觉加权合成滤波器的脉冲响应,f(n),n=-m,...,N-1表示非因果的滤波器的脉冲响应(也就是在负的时间具有值的脉冲响应),ck(n),n=0,...,N-1表示以索引k指定的脉冲声源矢量。
固定码本的搜索通过寻找使下式(2)为最大的k而进行。另外,在式(2)中,Ck为听觉加权合成信号s与后述的对象(target)矢量x之间的内积(或者互相关),Ek为听觉加权合成信号s的能量(也就是|s|2),所述听觉加权合成信号s为使以索引k指定的脉冲声源矢量(固定码本矢量)ck通过卷积滤波器F和听觉加权合成滤波器H而得到的听觉加权合成信号。
C k 2 E k 2 = | x t H ′ ′ c k | 2 c k t H ′ ′ t H ′ ′ c k = | d t c k | 2 c k t Φc k = ( Σ n = 0 N - 1 d ( n ) c k ( n ) ) 2 c k t Φc k . . . ( 2 )
x为被称为CELP语音编码中的对象矢量的矢量,是从听觉加权输入语音信号除去听觉加权合成滤波器的零输入响应而得到的矢量。听觉加权输入语音信号是指使作为编码对象的输入语音信号通过听觉加权滤波器而得到的信号。听觉加权滤波器一般是指利用进行输入语音信号的线性预测分析而得到的线性预测系数构成的全极型或者极零型的滤波器,在CELP型语音编码装置中被广泛地利用。听觉加权合成滤波器是指将利用由CELP型语音编码装置进行了量化的线性预测系数构成的线性预测滤波器(也就是合成滤波器)与上述的听觉加权滤波器串行连接的滤波器。这些结构要素虽然在本实施方式中未图示,但是在CELP型语音编码装置中较普遍,例如在ITU-T建议G.729中,关于“对象矢量(target vector)”、“加权合成滤波器(weighted synthesisfilter)”以及“听觉加权合成滤波器的零输入响应(zero-input response of theweighted synthesis filter)”有记载。另外,上标t表示其为转置矩阵。
但是,根据式(1)可知,卷积了在负的时间具有值的脉冲响应的卷积听觉加权合成滤波器的用于卷积脉冲响应的矩阵H”不是特普利茨矩阵。缩减要卷积的脉冲响应的一部分或者全部的非因果的分量而利用其计算第一列至第m列,因此与利用要卷积的脉冲响应的全部的非因果的分量而计算的第m+1列以后的列分量不同。因此,矩阵H”不为特普利茨型。因此,必须分别计算并保持h(1)至h(m)的m种的脉冲响应,从而导致d以及Φ的计算所需的运算量以及存储量的增大。
于是,以下面的式(3)近似式(2)。
C k 2 E k 2 = | x t H ′ ′ c k | 2 c k t H ′ ′ t H ′ ′ c k ≈ | x t H ′ c k | 2 c k t H ′ t H ′ c k = | d ′ t c k | 2 c k t Φ ′ c k = ( Σ n = 0 N - 1 d ′ ( n ) c k ( n ) ) 2 c k t Φ ′ c k . . . ( 3 )
其中,d’t以下面的式(4)来表示。
Figure GDA00001722181500062
Figure GDA00001722181500063
也就是说,d’(i)以下面的式(5)来表示。
d ′ ( i ) = Σ n = - i N - 1 - i x ( n + i ) h ( 0 ) ( n ) , wherei = 0 , . . . , m - 1 Σ n = - m N - 1 - i x ( n + i ) h ( 0 ) ( n ) , wherei = m , . . . , N - 1 . . . ( 5 )
其中,x(n)表示对象矢量的第n个元素(n=0,1,...,N-1,N为声源信号的编码的处理单位时间的帧或者子帧的长度),h(0)(n)表示在听觉加权滤波器的脉冲响应卷积了在负的时间具有值的脉冲响应的矢量的第n个元素(n=-m,0,...,N-1)。对象矢量在CELP语音编码中被普遍使用,并为从听觉加权输入语音信号除去听觉加权合成滤波器的零输入响应而得到的矢量。h(0)(n)为使听觉加权合成滤波器的脉冲响应h(n)(n=0,1,...,N-1)通过非因果的滤波器(脉冲响应f(n),n=-m,...,0,...,N-1)而得到的矢量,以下面的式(6)来表示。h(0)(n)也为非因果的滤波器的脉冲响应(n=-m,0,...,N-1)。
h ( 0 ) ( i ) = Σ n = - m i f ( n ) h ( i - n ) , i=-m,...,N-1    ...(6)
另外,矩阵Φ’以下面的式(7)来表示。
Figure GDA00001722181500071
Figure GDA00001722181500072
也就是说,矩阵Φ’的各个元素
Figure GDA00001722181500073
以下面的式(8)来表示。
φ ′ ( i , j ) = Σ n = - i N - 1 - i h ( 0 ) ( n ) h ( 0 ) ( n ) , wherei = j = 0 , . . . , m - 1 φ ′ ( j , i ) = Σ n = - m N - 1 - i h ( 0 ) ( n + j - i ) h ( 0 ) ( n ) , wherei = m , . . . , N - 1 , j = i , . . . N - 1 . . . ( 8 )
也就是说,矩阵H’为将矩阵H”的第p列元素h(p)(n),p=1至m以其它的列的元素h(0)(n)近似了的矩阵。该矩阵H’为缩减了下三角特普利茨型矩阵的行元素的特普利茨型矩阵。即使进行这样的近似,在负的时间具有值的脉冲响应矢量中,非因果的元素(负的时间的分量)的能量比因果的元素(非负的,也就是包含0的正的时间的分量)的能量足够小的情况下,由近似产生影响较小。而且,近似的进行限定于矩阵H”的第一列到第m列元素(这里m为非因果的元素的长度),m越短则近似的影响就越可以忽视。
另一方面,矩阵Φ’与Φ的计算所需的运算量存在较大的不同。也就是说,使用式(3)来近似与不使用式(3)来近似的情况之间出现较大的差异。例如,在考虑与求用于卷积在负的时间不具有脉冲响应的、通常的代数码本中的矩阵Φ0HtH(H为卷积式(1)中的听觉加权滤波器的脉冲响应的下三角特普利茨型矩阵)的情况相比较时,根据式(8)可知,使用了式(3)来近似的情况下的矩阵Φ’的计算基本上只增加m次的积和运算。另外,还如以ITU-T建议G.729的C代码进行的那样,对于
Figure GDA00001722181500075
而言,(j-i)相等的元素(例如,
Figure GDA00001722181500076
Figure GDA00001722181500077
...、
Figure GDA00001722181500078
)可递归地求出。根据该特征,实现矩阵Φ’的高效的计算,因此矩阵元素的计算并不是总是要追加m次积和运算。
相对于此,在不使用式(3)来近似的矩阵Φ的计算中,对于
Figure GDA00001722181500079
Figure GDA000017221815000710
p=0,...,m,k=0,...,N-1的元素,需要进行特有的脉冲响应矢量的相关计算。也就是说用于这些计算的脉冲响应矢量与用于其它的矩阵元素的计算的脉冲响应矢量不同(也就是说,不是求h(0)与h(0)之间的相关,而是求h(0)与h(p),p=1至m之间的相关)。这些元素为在递归地求出时,最后才能得到计算结果的元素。也就是说,会失去上述的“可递归地求出,因此能够高效地计算矩阵Φ’的元素”的优点。该优点意味着运算量以大致与在负的时间具有值的脉冲响应矢量的、非因果的元素的数目成比例的形式增加(例如,即使在m=1的情况下,也变成接近两倍的运算量)。
图2为表示一例实现上述的固定码本搜索方法的固定码本搜索装置150的方框图。
在负的时间具有值的脉冲响应矢量与听觉加权合成滤波器的脉冲响应矢量被输入到卷积运算单元151。卷积运算单元151根据式(6)计算h(0)(n),并输出到矩阵生成单元152。
矩阵生成单元152利用由卷积运算单元151输入的h(0)(n)生成矩阵H’,并输出到卷积运算单元153。
卷积运算单元153在由代数码本101输入的脉冲声源矢量ck上卷积由矩阵生成单元152输入的矩阵H’的元素h(0)(n),并将其结果输出到加法器154。
加法器154计算从卷积运算单元153输入的听觉加权合成信号与被另外输入的对象矢量之间的差分信号,并将该差分信号输出到误差最小化单元155。
误差最小化单元155确定用于生成使从加法器154输入的差分信号的能量成为最小的脉冲声源矢量ck的码本索引k。
图3是表示一例将图1所示的固定码本矢量生成装置100作为固定码本矢量生成单元100a具备的CELP型语音编码装置200的方框图。
输入语音信号被输入到预处理单元201。预处理单元201进行直流分量的除去等预处理,并将处理后的信号输出到线性预测分析单元202以及加法器203。
线性预测分析单元202进行由预处理单元201输入的信号的线性预测分析,将作为分析结果的线性预测系数输出到LPC量化单元204以及听觉加权滤波器205。
加法器203计算由预处理单元201输入的预处理后的输入语音信号与由合成滤波器206输入的合成语音信号之间的差信号,并输出到听觉加权滤波器205。
LPC量化单元204进行从线性预测分析单元202输入的线性预测系数的量化以及编码处理,将量化LPC输出到合成滤波器206,并将编码结果输出到比特流生成单元212。
听觉加权滤波器205为使用由线性预测分析单元202输入的线性预测系数而构成的极零型的滤波器,对由加法器203输入的预处理后的输入语音信号与合成语音信号之间的差信号进行滤波处理,并输出到误差最小化单元207。
合成滤波器206为通过由LPC量化单元204输入的量化线性预测系数构筑的线性预测滤波器,由加法器211输入驱动信号,对其进行线性预测合成处理,并将合成语音信号输出到加法器203。
误差最小化单元207确定有关自适应码本矢量生成单元208、固定码本矢量生成单元100a、以及对于自适应码本矢量和固定码本矢量增益的参数,以使由听觉加权滤波器205输入的信号的能量成为最小,并且将这些参数的编码结果输出到比特流生成单元212。另外,虽然在本图中设想有关增益的参数在误差最小化单元207内被量化而得到一个编码结果,但是增益量化单元也可以在误差最小化单元207的外面。
自适应码本矢量生成单元208具有自适应码本,以缓存过去从加法器211输入的驱动信号,生成自适应码本矢量而输出到放大器209。自适应码本矢量根据来自误差最小化单元207的指示被确定。
放大器209将从误差最小化单元207输入的自适应码本增益乘以从自适应码本矢量生成单元208输入的自适应码本矢量,并将其结果输出到加法器211。
固定码本矢量生成单元100a与图1所示的固定码本矢量生成装置100为相同的结构,由误差最小化单元207输入有关码本索引和非因果的滤波器的脉冲响应的信息,生成固定码本矢量而输出到放大器210。
放大器210将从误差最小化单元207输入的固定码本增益乘以从固定码本矢量生成单元100a输入的固定码本矢量,并将其结果输出到加法器211。
加法器211进行从放大器209以及210输入的增益乘法后的自适应码本矢量以及固定码本矢量的加法运算,并将结果作为滤波器驱动信号输出到合成滤波器206。
比特流生成单元212输入由LPC量化单元204输入的线性预测系数(也就是LPC)的编码结果、以及由误差最小化单元207输入的自适应码本矢量、固定码本矢量和对于它们的增益信息的编码结果,将其变换为比特流而输出。
另外,在决定误差最小化单元207中的固定码本矢量的参数时,使用上述固定码本搜索方法,而实际的固定码本搜索装置使用图2所示的装置。
这样,在本实施方式中,在使根据代数码本生成的声源矢量通过具有在负的时间具有值的脉冲响应特性的滤波器(一般称为非因果的滤波器)的情况下,将非因果的滤波器和听觉加权合成滤波器串行连接了的处理块的传递函数,通过缩减了相当于非因果部分的长度的行数的矩阵元素的下三角特普利茨型矩阵来近似。通过该近似可以抑制代数码本的搜索所需的运算量的增加。另外,在非因果的元素的数目比因果的元素的数目少,和/或非因果的元素的能量比因果的元素的能量小的情况下,可抑制上述近似对编码质量造成的影响。
另外,也可以如下地对本实施方式进行变形或者应用。
也可以将非因果的滤波器的脉冲响应的因果的分量的数目在比非因果的分量的数目大的范围内限定为特定的数目。
另外,在本实施方式中,只说明了固定码本搜索时的处理。在CELP型语音编码装置中,在固定码本搜索之后,一般进行增益量化。此时,因为需要通过了听觉加权合成滤波器的固定声源码本矢量(也就是使选择出的固定声源码本矢量通过听觉加权合成滤波器而得到的合成信号),所以在固定码本搜索结束后,一般计算该“通过了听觉加权合成滤波器的固定声源码本矢量”。此时要使用的脉冲响应卷积矩阵与其为在搜索时使用了的近似的脉冲响应卷积矩阵H(0),不如使用只有第1~m列(=非因果的元素的数目为m的情况下)的元素与其它元素不同的矩阵H”好。
另外,在本实施方式中,对于非因果的部分(也就是负的时间的矢量元素)而言,虽然设定为矢量长度比包含时间0的点的因果的部分(也就是非负的时间的矢量元素)短的矢量较适宜,但是将非因果的部分的长度设定为小于N/2(N为脉冲声源矢量的长度)。
以上说明了本发明实施方式。
本发明的固定码本搜索装置和语音编码装置等并不只限于上述实施方式,能够加以各种各样的变更而实施。
本发明的固定码本搜索装置和语音编码装置等能够搭载于移动通信系统中的通信终端装置以及基站装置,由此能够提供具有与上述同样的作用效果的通信终端装置、基站装置以及移动通信系统。
另外,在这里,虽然以本发明通过硬件构成的情况为例进行了说明,但本发明也可以通过软件来实现。例如,将本发明的固定码本搜索方法和语音编码方法等算法通过程序语言记述,并将该程序预先记忆在存储器而通过信息处理方法来实行,由此能够实现与本发明的固定码本搜索装置和语音编码装置同样的功能。
另外,也可以将在上述实施方式中使用了的“固定码本”和“自适应码本”称为“固定声源码本”和“自适应声源码本”。
另外,用于上述实施方式的说明中的各功能块通常被作为集成电路的LSI来实现。这些块既可以被单独地集成为一个芯片,也可以包含一部分或全部地被集成为一个芯片。
虽然此处称为LSI,但根据集成程度,可以被称为IC、系统LSI、超大LSI(Super LSI)、或特大LSI(Ultra LSI)。
另外,实现集成电路化的方法不仅限于LSI,也可使用专用电路或通用处理器来实现。也可以使用可在LSI制造后编程的FPGA(Field ProgrammableGate Array:现场可编程门阵列),或者可重构LSI内部的电路单元的连接和设定的可重构处理器。
再者,随着半导体的技术进步或随之派生的其它技术的出现,如果出现能够替代LSI的集成电路化的新技术,当然可利用该新技术进行功能块的集成化。还存在着适用生物技术等的可能性。
2006年3月10日提交的特愿第2006-065399号和2007年2月6日提交的特愿第2007-027408号的日本专利申请中所包含的说明书、附图以及说明书摘要的公开内容,都引用于本申请。
工业实用性
本发明的固定码本搜索装置等在将代数码本作为固定码本利用的CELP型语音编码装置中,具有能够不较大地增加运算量以及存储量地将非因果的滤波器特性附加在通过代数码本生成的脉冲声源矢量的效果,对于可利用的存储量具有限制,并且不得不低速地进行无线通信的携带电话等的通信终端装置等中的语音编码装置的固定码本搜索很有用。

Claims (2)

1.一种固定码本搜索装置,包括:
卷积运算单元,向在负的时间具有非零值的脉冲响应矢量上卷积听觉加权合成滤波器的脉冲响应,以生成在负的时间具有非零值的第二脉冲响应矢量;以及
矩阵生成单元,利用由所述卷积运算单元生成的第二脉冲响应矢量生成特普利茨型的卷积矩阵H′,
搜索使利用了所述特普利茨型的卷积矩阵H′的以下式(1)为最大的索引k,
C k 2 E k 2 = ( Σ n = 0 N - 1 d ′ ( n ) c k ( n ) ) 2 c k t Φ ′ c k - - - ( 1 )
其中,上标t表示其为转置矩阵,Ck为听觉加权合成信号s与对象矢量x之间的内积,Ek为听觉加权合成信号s的能量,ck为以索引k指定的脉冲声源矢量,ck(n)为脉冲声源矢量ck的第n个元素,n=0,...,N-1,
d ′ ( i ) = Σ n = - i N - 1 - i x ( n + i ) h ( 0 ) ( n ) , where i = 0 , · · · , m - 1 Σ n = - m N - 1 - i x ( n + i ) h ( 0 ) ( n ) , where i = m , · · · , N - 1
x(n)为对象矢量x的第n个元素,n=0,...,N-1,
Φ ′ = H ′ t H ′
h(0)(n)为在负的时间具有非零值的第二脉冲响应矢量的第n个元素,n=-m,...,0,...,N-1,N为表示声源信号的编码的处理单位时间的帧或者子帧的长度的自然数,m为表示非因果的元素的长度的1至N-1的整数。
2.如权利要求1所述的固定码本搜索装置,实现使所述听觉加权合成信号s与所述对象矢量x之间的误差成为最小的功能,所述听觉加权合成信号s是在从代数码本输出的脉冲矢量上乘以所述特普利茨型的卷积矩阵进行卷积处理而得到的。
CN2011101875793A 2006-03-10 2007-03-08 固定码本搜索装置 Expired - Fee Related CN102194461B (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2006065399 2006-03-10
JP065399/06 2006-03-10
JP2007027408A JP3981399B1 (ja) 2006-03-10 2007-02-06 固定符号帳探索装置および固定符号帳探索方法
JP027408/07 2007-02-06

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN2007800028772A Division CN101371299B (zh) 2006-03-10 2007-03-08 固定码本搜索装置以及固定码本搜索方法

Publications (2)

Publication Number Publication Date
CN102194461A CN102194461A (zh) 2011-09-21
CN102194461B true CN102194461B (zh) 2013-01-23

Family

ID=37891857

Family Applications (4)

Application Number Title Priority Date Filing Date
CN2011101875793A Expired - Fee Related CN102194461B (zh) 2006-03-10 2007-03-08 固定码本搜索装置
CN201110188743.2A Expired - Fee Related CN102201239B (zh) 2006-03-10 2007-03-08 固定码本搜索装置以及固定码本搜索方法
CN2007800028772A Expired - Fee Related CN101371299B (zh) 2006-03-10 2007-03-08 固定码本搜索装置以及固定码本搜索方法
CN2011101877341A Expired - Fee Related CN102194462B (zh) 2006-03-10 2007-03-08 固定码本搜索装置

Family Applications After (3)

Application Number Title Priority Date Filing Date
CN201110188743.2A Expired - Fee Related CN102201239B (zh) 2006-03-10 2007-03-08 固定码本搜索装置以及固定码本搜索方法
CN2007800028772A Expired - Fee Related CN101371299B (zh) 2006-03-10 2007-03-08 固定码本搜索装置以及固定码本搜索方法
CN2011101877341A Expired - Fee Related CN102194462B (zh) 2006-03-10 2007-03-08 固定码本搜索装置

Country Status (15)

Country Link
US (4) US7519533B2 (zh)
EP (4) EP2113912B1 (zh)
JP (1) JP3981399B1 (zh)
KR (4) KR101359203B1 (zh)
CN (4) CN102194461B (zh)
AT (1) ATE400048T1 (zh)
AU (1) AU2007225879B2 (zh)
BR (1) BRPI0708742A2 (zh)
CA (1) CA2642804C (zh)
DE (3) DE602007000030D1 (zh)
ES (3) ES2329198T3 (zh)
MX (1) MX2008011338A (zh)
RU (2) RU2425428C2 (zh)
WO (1) WO2007105587A1 (zh)
ZA (1) ZA200807703B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5159318B2 (ja) * 2005-12-09 2013-03-06 パナソニック株式会社 固定符号帳探索装置および固定符号帳探索方法
JPWO2007129726A1 (ja) * 2006-05-10 2009-09-17 パナソニック株式会社 音声符号化装置及び音声符号化方法
WO2009153995A1 (ja) 2008-06-19 2009-12-23 パナソニック株式会社 量子化装置、符号化装置およびこれらの方法
ES2641315T3 (es) * 2011-03-04 2017-11-08 Telefonaktiebolaget Lm Ericsson (Publ) Corrección de ganancia post-cuantificación en codificación de audio
GB201115048D0 (en) * 2011-08-31 2011-10-19 Univ Bristol Channel signature modulation
CN103456309B (zh) * 2012-05-31 2016-04-20 展讯通信(上海)有限公司 语音编码器及其代数码表搜索方法和装置
MY194208A (en) * 2012-10-05 2022-11-21 Fraunhofer Ges Forschung An apparatus for encoding a speech signal employing acelp in the autocorrelation domain
JP6956796B2 (ja) * 2017-09-14 2021-11-02 三菱電機株式会社 演算回路、演算方法、およびプログラム
CN109446413B (zh) * 2018-09-25 2021-06-01 上海交通大学 基于物品关联关系的序列化推荐方法
CN116052700B (zh) * 2022-07-29 2023-09-29 荣耀终端有限公司 声音编解码方法以及相关装置、系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0749626A1 (fr) * 1995-01-06 1996-12-27 France Telecom Procede de codage de parole a prediction lineaire et excitation par codes algebriques
CN1547193A (zh) * 2003-12-03 2004-11-17 北京首信股份有限公司 一种用于语音编码的固定码本快速搜索算法
US6829579B2 (en) * 2002-01-08 2004-12-07 Dilithium Networks, Inc. Transcoding method and system between CELP-based speech codes

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4868867A (en) * 1987-04-06 1989-09-19 Voicecraft Inc. Vector excitation speech or audio coder for transmission or storage
CA1337217C (en) * 1987-08-28 1995-10-03 Daniel Kenneth Freeman Speech coding
US5701392A (en) 1990-02-23 1997-12-23 Universite De Sherbrooke Depth-first algebraic-codebook search for fast coding of speech
CA2010830C (en) * 1990-02-23 1996-06-25 Jean-Pierre Adoul Dynamic codebook for efficient speech coding based on algebraic codes
US5754976A (en) * 1990-02-23 1998-05-19 Universite De Sherbrooke Algebraic codebook with signal-selected pulse amplitude/position combinations for fast coding of speech
US5734789A (en) * 1992-06-01 1998-03-31 Hughes Electronics Voiced, unvoiced or noise modes in a CELP vocoder
IT1264766B1 (it) * 1993-04-09 1996-10-04 Sip Codificatore della voce utilizzante tecniche di analisi con un'eccitazione a impulsi.
US5732389A (en) * 1995-06-07 1998-03-24 Lucent Technologies Inc. Voiced/unvoiced classification of speech for excitation codebook selection in celp speech decoding during frame erasures
US5751901A (en) * 1996-07-31 1998-05-12 Qualcomm Incorporated Method for searching an excitation codebook in a code excited linear prediction (CELP) coder
US6055496A (en) * 1997-03-19 2000-04-25 Nokia Mobile Phones, Ltd. Vector quantization in celp speech coder
JP3276356B2 (ja) 1998-03-31 2002-04-22 松下電器産業株式会社 Celp型音声符号化装置及びcelp型音声符号化方法
CN1296888C (zh) * 1999-08-23 2007-01-24 松下电器产业株式会社 音频编码装置以及音频编码方法
US6826527B1 (en) * 1999-11-23 2004-11-30 Texas Instruments Incorporated Concealment of frame erasures and method
US7606703B2 (en) * 2000-11-15 2009-10-20 Texas Instruments Incorporated Layered celp system and method with varying perceptual filter or short-term postfilter strengths
CA2327041A1 (en) * 2000-11-22 2002-05-22 Voiceage Corporation A method for indexing pulse positions and signs in algebraic codebooks for efficient coding of wideband signals
SE521693C3 (sv) * 2001-03-30 2004-02-04 Ericsson Telefon Ab L M En metod och anordning för brusundertryckning
US6766289B2 (en) * 2001-06-04 2004-07-20 Qualcomm Incorporated Fast code-vector searching
DE10140507A1 (de) 2001-08-17 2003-02-27 Philips Corp Intellectual Pty Verfahren für die algebraische Codebook-Suche eines Sprachsignalkodierers
JP4108317B2 (ja) * 2001-11-13 2008-06-25 日本電気株式会社 符号変換方法及び装置とプログラム並びに記憶媒体
US7363218B2 (en) * 2002-10-25 2008-04-22 Dilithium Networks Pty. Ltd. Method and apparatus for fast CELP parameter mapping
KR100463559B1 (ko) 2002-11-11 2004-12-29 한국전자통신연구원 대수 코드북을 이용하는 켈프 보코더의 코드북 검색방법
WO2004084467A2 (en) * 2003-03-15 2004-09-30 Mindspeed Technologies, Inc. Recovering an erased voice frame with time warping
KR100556831B1 (ko) * 2003-03-25 2006-03-10 한국전자통신연구원 전역 펄스 교체를 통한 고정 코드북 검색 방법
JP4605445B2 (ja) 2004-08-24 2011-01-05 ソニー株式会社 画像処理装置および方法、記録媒体、並びにプログラム
SG123639A1 (en) * 2004-12-31 2006-07-26 St Microelectronics Asia A system and method for supporting dual speech codecs
JP2007027408A (ja) 2005-07-15 2007-02-01 Sony Corp 電子部品の吸着ノズル機構

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0749626A1 (fr) * 1995-01-06 1996-12-27 France Telecom Procede de codage de parole a prediction lineaire et excitation par codes algebriques
US6829579B2 (en) * 2002-01-08 2004-12-07 Dilithium Networks, Inc. Transcoding method and system between CELP-based speech codes
CN1547193A (zh) * 2003-12-03 2004-11-17 北京首信股份有限公司 一种用于语音编码的固定码本快速搜索算法

Also Published As

Publication number Publication date
BRPI0708742A2 (pt) 2011-06-28
CA2642804A1 (en) 2007-09-20
AU2007225879B2 (en) 2011-03-24
EP1942488A2 (en) 2008-07-09
EP1942489B1 (en) 2009-08-05
WO2007105587A1 (ja) 2007-09-20
JP3981399B1 (ja) 2007-09-26
KR20070092678A (ko) 2007-09-13
DE602007001861D1 (de) 2009-09-17
KR101359147B1 (ko) 2014-02-05
CA2642804C (en) 2015-06-09
JP2007272196A (ja) 2007-10-18
KR101359203B1 (ko) 2014-02-05
EP1942488A3 (en) 2008-07-23
US20070213977A1 (en) 2007-09-13
DE602007000030D1 (de) 2008-08-14
US7519533B2 (en) 2009-04-14
DE602007001862D1 (de) 2009-09-17
KR100806470B1 (ko) 2008-02-21
US7957962B2 (en) 2011-06-07
EP2113912B1 (en) 2018-08-01
RU2008136401A (ru) 2010-03-20
EP1833047B1 (en) 2008-07-02
US20090228266A1 (en) 2009-09-10
CN101371299B (zh) 2011-08-17
EP1942489A1 (en) 2008-07-09
MX2008011338A (es) 2008-09-12
KR20080101875A (ko) 2008-11-21
ATE400048T1 (de) 2008-07-15
CN102194461A (zh) 2011-09-21
CN102201239B (zh) 2014-01-01
US20090228267A1 (en) 2009-09-10
ZA200807703B (en) 2009-07-29
RU2458412C1 (ru) 2012-08-10
KR20120032036A (ko) 2012-04-04
AU2007225879A1 (en) 2007-09-20
ES2329198T3 (es) 2009-11-23
EP2113912A1 (en) 2009-11-04
CN102194462A (zh) 2011-09-21
CN102201239A (zh) 2011-09-28
ES2329199T3 (es) 2009-11-23
CN101371299A (zh) 2009-02-18
ES2308765T3 (es) 2008-12-01
US20110202336A1 (en) 2011-08-18
RU2425428C2 (ru) 2011-07-27
US8452590B2 (en) 2013-05-28
EP1942488B1 (en) 2009-08-05
KR101359167B1 (ko) 2014-02-06
EP1833047A1 (en) 2007-09-12
CN102194462B (zh) 2013-02-27
US7949521B2 (en) 2011-05-24
KR20120032037A (ko) 2012-04-04

Similar Documents

Publication Publication Date Title
CN102194461B (zh) 固定码本搜索装置
CN102682778B (zh) 编码装置以及编码方法
CN101401153B (zh) Celp技术中改进的数字音频信号的编码/解码
CN101622663B (zh) 编码装置以及编码方法
CN1751338B (zh) 用于语音编码的方法和设备
CN103069483B (zh) 编码装置以及编码方法
CN101185123B (zh) 可扩展编码装置及可扩展编码方法
EP2099025A1 (en) Audio encoding device and audio encoding method
CN102334156A (zh) 音调判定装置及音调判定方法
CN102598124B (zh) 编码装置、解码装置及其方法
JPH1063300A (ja) 音声復号化装置及び音声符号化装置
JPH07168596A (ja) 音声符号化装置
JP3471892B2 (ja) ベクトル量子化方法及び装置
JPWO2007129726A1 (ja) 音声符号化装置及び音声符号化方法
CN103119650A (zh) 编码装置和编码方法
JPH07142959A (ja) ディジタルフィルタ
JPH09269800A (ja) 音声符号化装置
JP2000148195A (ja) 音声符号化装置
JP2000338999A (ja) Celp型音声符号化装置及びcelp型音声符号化方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20170524

Address after: Delaware

Patentee after: III Holdings 12 LLC

Address before: Osaka Japan

Patentee before: Matsushita Electric Industrial Co.,Ltd.

TR01 Transfer of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20130123

CF01 Termination of patent right due to non-payment of annual fee