CN1672192A - 语音编解码方法之间的代码转换方法及装置和其存储介质 - Google Patents

语音编解码方法之间的代码转换方法及装置和其存储介质 Download PDF

Info

Publication number
CN1672192A
CN1672192A CN03817675.0A CN03817675A CN1672192A CN 1672192 A CN1672192 A CN 1672192A CN 03817675 A CN03817675 A CN 03817675A CN 1672192 A CN1672192 A CN 1672192A
Authority
CN
China
Prior art keywords
gain
code
acb
fcb
circuit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN03817675.0A
Other languages
English (en)
Other versions
CN1327410C (zh
Inventor
村岛淳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of CN1672192A publication Critical patent/CN1672192A/zh
Application granted granted Critical
Publication of CN1327410C publication Critical patent/CN1327410C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/083Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders

Abstract

在将根据第一方法的第一码串转换为根据第二方法的第二码串的代码转换装置中,语音解码电路(1500)从所述第一码串得到第一线性预测系数和激励信号的信息,并使用从所述激励信号的信息得到的激励信号驱动具有所述第一线性预测系数的滤波器,从而生成第一语音信号;增益码生成电路(1400)计算使根据从第二码串得到的信息而生成的第二语音信号和所述第一语音信号的距离最小的增益,并修正所述最佳增益,从而基于修正后的最佳增益(修正最佳增益)、所述最佳增益和从第二方法的增益码本中读取的增益来求出第二码串中的增益信息。此时,基于语音判别值,在非语言区间使用使第二码串的增益的时间变动变小的评价函数来求出增益。

Description

语音编解码方法之间的代码转换方法及装置和其存储介质
技术领域
本发明涉及一种用于以低码率传输或存储语音信号的编码及解码方法,特别是涉及一种在使用不同的编解码方法进行语音通信时,将使用某种方法对语音进行编码而得的代码以高音质和低运算量转换成能够以其他方法进行解码的代码的代码转换方法及装置及其存储介质。
背景技术
作为以低码率且高效地对语音信号进行编码的方法,广泛使用着将语音信号分离成线性预测(Linear Prediction:IP)滤波器和驱动它的激励信号来进行编码的方法。作为其具有代表性的方法之一,有码激励线性预测(Code Excited Linear Prediction:称为CELP)。在CELP中,通过使用激励信号驱动LP滤波器来得到合成语音信号,其中所述LP滤波器设定有表示输入语音的频率特性的LP系数,所述激励信号用表示输入语音的间隔(pitch)周期的自适应码本(Adaptive Codebook:称为ACB)和由随机数或脉冲组成的固定码本(Fixed Codebook:称为FCB)之和来表示。此时,在所述ACB成分和所述FCB成分上乘上各自的增益(“ACB增益”和“FCB增益”)。此外,关于CELP,可参见M.Schroeder和S.Atal的《Code excited linear prediction:High quality speech at very low bit rates》(Proc.Of IEEE Int.Conf.On Acoust.,Speech and Signal Processing,pp.937-940,1985)(称为文献1)。
此外,当例如假设3G移动网和有线分组网之间相互连接时,由于各个网络所使用的标准语音编码方法不同,所以存在无法直接连接的问题。对此最简单的解决方法是串联连接。但是,在串联连接中,从使用一侧的标准方法对语音进行编码而得的码串使用其标准方法暂时解码出语言信号,然后使用另一侧的标准方法再次对所述被解码的语音信号进行编码。因此,相比于使用各语音编解码方法仅进行一次编码和解码的情况,通常存在导致音质差、延迟增加、计算量增加的问题。
对此,下述的代码转换方法对解决所述问题很有效,所述代码转换方法在代码区域或编码参数区域中将使用一侧的标准方法对语音进行编码而得的代码转换成可使用另一侧的标准方法进行解码的代码。关于转换代码的方法,参见Hong-Goo Kang的《Improving Transcoding Capability ofSpeech Coders in Clean and Frame Erasured Channel Environments》(Proc.ofIEEE Workshop on Speech Coding 2000,pp78-80,2000)(称为文献2)。
图12是示出了代码转换装置的构成的一个例子的示意图,所述代码转换装置将使用第一语音编码方法(称为方法A)对语音进行编码所得的代码转换成可使用第二方法(称为方法B)解码的代码。参照图12,代码转换装置具有输入端子10、代码分离电路1010、LP系数码转换电路100、ACB码转换电路200、FCB码转换电路300、增益码转换电路400、代码复用电路1020、输出端子20。参照图12说明以往的代码转换装置的各构成要素。
从输入端子10输入使用方法A对语音进行编码所得的第一码串。
代码分离电路1010从自输入端子10输入的第一码串分离出与LP系数、ACB、FCB、ACB增益及FCB增益对应的代码,即LP系数码、ACB码、FCB码、增益码。此处,将ACB增益及FCB增益一起被编解码,因此简单地将其称为增益,将其代码称为增益码。此外,将LP系数码、ACB码、FCB码、增益码分别称为第一LP系数码、第一ACB码、第一FCB码、第一增益码。并且,向LP系数码转换电路100输出第一LP系数码,向ACB码转换电路200输出第一ACB码,向FCB码转换电路300输出第一FCB码,向增益码转换电路400输出第一增益码。
LP系数码转换电路100输入由代码分离电路1010输出的第一LP系数码,并将第一LP系数码转换为可使用方法B解码的代码。并且将所述转换后的LP系数码作为第二LP系数码输出给代码复用电路1020。
ACB码转换电路200输入由代码分离电路1010输出的第一ACB码,并将第一ACB码转换为可使用方法B解码的代码。并且将所述转换后的ACB码作为第二ACB码输出给代码复用电路1020。
FCB码转换电路300输入由代码分离电路1010输出的第一FCB码,并将第一FCB码转换为可使用方法B解码的代码。并且将所述转换后的FCB码作为第二FCB码输出给代码复用电路1020。
增益码转换电路400输入由代码分离电路1010输出的第一增益码,并将第一增益码转换为可使用方法B解码的代码。并且将所述转换后的增益码作为第二增益码输出给代码复用电路1020。
下面说明各转换电路的更加具体的操作。
LP系数码转换电路100使用方法A中的LP系数解码方法对从代码分离电路1010输入的第一LP系数码进行解码,从而得到第一LP系数。接着,LP系数码转换电路100使用方法B中的LP系数的量化方法及编码方法对第一LP系数进行量化及编码,从而得到第二LP系数码。然后,LP系数码转换电路100将第二LP系数码作为可使用方法B中的LP系数解码方法进行解码的代码输出给代码复用电路1020。
ACB码转换电路200通过使用方法A中的代码和方法B中的代码的对应关系对从代码分离电路1010输入的第一ACB码进行变换,从而得到第二ACB码。然后,ACB码转换电路200将第二ACB码作为可使用方法B中的ACB解码方法进行解码的代码输出给代码复用电路1020。
FCB码转换电路300通过使用方法A中的代码和方法B中的代码的对应关系对从代码分离电路1010输入的第一FCB码进行变换,从而得到第二FCB码。然后,FCB码转换电路300将第二FCB码作为可使用方法B中的FCB解码方法进行解码的代码输出给代码复用电路1020。
增益码转换电路400使用方法A中的增益解码方法对从代码分离电路1010输入的第一增益码进行解码,从而得到第一增益。接着,增益码转换电路400使用方法B中的增益的量化方法及编码方法对第一增益进行量化及编码,从而得到第二增益及其代码(第二增益码)。然后,增益码转换电路400将第二增益码作为可使用方法B中的增益解码方法进行解码的代码输出给代码复用电路1020。
代码复用电路1020输入从LP系数码转换电路100输出的第二LP系数码、从ACB码转换电路200输出的第二ACB码、从FCB码转换电路300输出的第二FCB码、以及从增益码转换电路400输出的第二增益码,并且将这些进行复用所得的码串作为第二码串经由输出端子20输出。至此,结束对图12的说明。
但是,参照图12所说明的以往的代码转换装置存在非语音区间中的背景噪声的音质恶化的问题。
这是因为非语音区间中的背景噪声能量在时间上的变动大的原因。其起因是将第一增益再次量化而得的第二增益在非语音区间中在时间上变动很大。
因此,本发明就是鉴于上述问题而完成的,其主要目的在于提供一种能够减少非语音区间中的背景噪声音质的恶化的装置和方法以及记录了其程序的记录介质。此外通过以下的说明,本领域的技术人员能够立刻清楚除此之外的本发明的目的、特征及优点等。
发明内容
实现上述目的的本发明第一方面的方法是一种将根据第一方法的第一码串转换为根据第二方法的第二码串的代码转换方法,该方法包括以下步骤:从所述第一码串得到第一线性预测系数和激励信号的信息,并使用从所述激励信号的信息得到的激励信号驱动具有所述第一线性预测系数的滤波器,从而生成第一语音信号;基于根据从第二码串得到的信息而生成的第二语音信号和所述第一语音信号来计算最佳增益;修正所述最佳增益;基于修正后的最佳增益(修正最佳增益)、所述最佳增益和从第二方法的增益码本中读取的增益来求出第二码串中的增益信息。在本发明的方法中,最佳增益最好作为使第二语音信息和所述第一语音信息之间的距离最小的增益而求出,其中所述第二语音信息是根据从第二码串得到的信息而生成的。
本发明第二方面的方法是一种将根据第一方法的第一码串转换为根据第二方法的第二码串的代码转换方法,该方法包括以下步骤:从所述第一码串解码增益信息;修正解码后的增益(解码增益);基于修正后的解码增益(修正解码增益)、所述解码增益和从第二方法的增益码本中读取的增益来求出第二码串中的增益信息。
在上述第一方面的发明中,最好从所述修正最佳增益和从所述增益码本中读取的增益计算第一平方误差,从所述最佳增益和从所述增益码本中读取的增益计算第二平方误差,从而通过从所述增益码本选择使基于所述第一平方误差和所述第二平方误差的评价函数最小的增益,来求出第二码串中的增益信息。
在上述第二方面的发明中,最好从所述修正解码增益和从所述增益码本中读取的增益计算第一平方误差,从所述解码增益和从所述增益码本中读取的增益计算第二平方误差,从而通过从所述增益码本选择使基于所述第一平方误差和所述第二平方误差的评价函数最小的增益,来求出第二码串中的增益信息。
在上述第一方面的发明中,所述修正最佳增益最好基于所述最佳增益的长时间平均。
在上述第二方面的发明中,所述修正解码增益最好基于所述解码增益的长时间平均。
本发明第三方面的装置是一种将根据第一方法的第一码串转换为根据第二方法的第二码串的代码转换装置,该装置包括:语音解码电路,从所述第一码串得到第一线性预测系数和激励信号的信息,并使用从所述激励信号的信息得到的激励信号驱动具有所述第一线性预测系数的滤波器,从而生成第一语音信号;最佳增益计算电路,基于根据从第二码串得到的信息而生成的第二语音信号、和所述第一语音信号来计算最佳增益;最佳增益修正电路,修正所述最佳增益;增益编码电路,基于修正后的最佳增益(修正最佳增益)、所述最佳增益和从第二方法的增益码本中读取的增益,来求出第二码串中的增益信息。在本发明的装置中,最佳增益计算电路最好将使第二语音信息和所述第一语音信息之间的距离最小的增益作为最佳增益来求出,其中所述第二语音信息是根据从第二码串得到的信息而生成的。
本发明第四方面中的装置是一种将根据第一方法的第一码串转换为根据第二方法的第二码串的代码转换装置,该装置包括:增益解码电路,从所述第一码串解码增益信息;增益修正电路,修正解码后的增益(解码增益);增益编码电路,基于修正后的解码增益(修正解码增益)、所述解码增益和从第二方法的增益码本中读取的增益来求出第二码串中的增益信息。
在上述第三方面的发明中,增益编码电路最好从所述修正最佳增益和从所述增益码本中读取的增益计算第一平方误差,从所述最佳增益和从所述增益码本中读取的增益计算第二平方误差,从而通过从所述增益码本选择使基于所述第一平方误差和所述第二平方误差的评价函数最小的增益,来求出第二码串中的增益信息。
在上述第四方面的发明中,增益编码电路最好从所述修正解码增益和从所述增益码本中读取的增益计算第一平方误差,从所述解码增益和从所述增益码本中读取的增益计算第二平方误差,从而通过从所述增益码本选择使基于所述第一平方误差和所述第二平方误差的评价函数最小的增益,来求出第二码串中的增益信息。
在上述第三方面的发明的最佳增益修正电路中,所述修正最佳增益最好基于所述最佳增益的长时间平均。
在上述第四方面的发明的解码增益修正电路中,所述修正解码增益最好基于所述解码增益的长时间平均。
本发明第五方面的程序提供一种用于使构成将根据第一方法的第一码串转换为根据第二方法的第二码串的代码转换装置的计算机执行下述处理的程序:
(a)从所述第一码串得到第一线性预测系数和激励信号的信息,并使用从所述激励信号的信息得到的激励信号驱动具有所述第一线性预测系数的滤波器,从而生成第一语音信号;
(b)基于根据从第二码串得到的信息而生成的第二语音信号和所述第一语音信号来计算增益(最佳增益);
(c)修正所述最佳增益;
(d)基于修正后的最佳增益(修正最佳增益)、所述最佳增益和从第二方法的增益码本中读取的增益来求出第二码串中的增益信息。在本发明中,将使第二语音信息和所述第一语音信息之间的距离最小的增益作为最佳增益求出,其中所述第二语音信息是根据从第二码串得到的信息而生成的。
本发明第六方面的程序提供一种用于使构成将根据第一方法的第一码串转换为根据第二方法的第二码串的代码转换装置的计算机执行下述处理的程序:
(a)从所述第一码串解码增益信息;
(b)修正解码后的增益(解码增益);
(c)基于修正后的解码增益(修正解码增益)、所述解码增益和从第二方法的增益码本中读取的增益来求出第二码串中的增益信息。
在上述第五方面的发明的程序中,最好从所述修正最佳增益和从所述增益码本中读取的增益计算第一平方误差,从所述最佳增益和从所述增益码本中读取的增益计算第二平方误差,从而通过从所述增益码本选择使基于所述第一平方误差和所述第二平方误差的评价函数最小的增益,来求出第二码串中的增益信息。
在上述第六方面的发明的程序中,最好从所述修正解码增益和从所述增益码本中读取的增益计算第一平方误差,从所述解码增益和从所述增益码本中读取的增益计算第二平方误差,从而通过从所述增益码本选择使基于所述第一平方误差和所述第二平方误差的评价函数最小的增益,来求出第二码串中的增益信息。
在上述第五方面的发明的程序中,所述修正最佳增益最好基于所述最佳增益的长时间平均。
在上述第六方面的发明的程序中,所述修正解码增益最好基于所述解码增益的长时间平均。
本申请第七方面的发明提供一种记录有所述第五及第六方面的发明的所述程序的记录介质。
附图说明
图1是本发明代码转换装置的第一实施例的构成示意图;
图2是本发明代码转换装置中的LP系数码转换电路的构成示意图;
图3是ACB码和ACB延迟之间的对应关系和ACB码的变换方法的说明图;
图4是本发明代码转换装置的语音解码电路的构成示意图;
图5是本发明代码转换装置中的目标信号计算电路的构成示意图;
图6是本发明代码转换装置中的FCB码生成电路的构成示意图;
图7是脉冲位置代码和脉冲位置之间的对应关系和ACB码的变换方法的说明图;
图8是本发明代码转换装置中的增益码生成电路的构成示意图;
图9是本发明代码转换装置的第二实施例的构成示意图;
图10是本发明代码转换装置中的增益码生成电路的构成示意图;
图11是本发明代码转换装置的第三、第四实施例的构成示意图;
图12是以往的代码转换装置的构成示意图。
具体实施方式
以下说明本发明的实施方式。首先说明本发明的装置和方法的概要和原理,然后在下面详细说明实施例。
在本发明的代码转换装置中,从依据第一方法的第一码串得到第一线性预测系数和激励信号的信息,通过使用从所述激励信号的信息中得到的激励信号驱动具有所述第一线性预测系数的滤波器,从而生成第一语音信号,增益码生成电路(1400)计算出使第二语音信号和所述第一语音信号之间的距离最小的增益(最佳增益),并且修正所述最佳增益,从而基于修正后的最佳增益(修正最佳增益)、所述最佳增益、从第二方法中的增益码本读取的增益来求出第二码串中的增益信息,其中所述第二语音信号是根据从依据第二方法的第二码串得到的信息而生成的。
本发明的方法具有以下步骤。
步骤a:从第一码串得出第一线性预测系数;
步骤b:从第一码串得出激励信号的信息;
步骤c:从激励信号的信息得出激励信号;
步骤d:通过使用所述激励信号驱动具有第一线性预测系数的滤波器来生成第一语音信号;
步骤e:计算使第二语音信号和所述第一语音信号之间的距离最小的增益(最佳增益),其中所述第二语音信号是根据从依据第二方法的第二码串得到的信息而生成的;
步骤f:修正所述最佳增益;
步骤g:基于修正后的最佳增益(修正最佳增益)、所述最佳增益、从第二方法中的增益码本读取的增益来求出第二码串中的增益信息。
在本发明中,在非语音区间中使用使第二增益(第二码串中的增益)的时间变动变小的评价函数来求出所述第二增益。
因此,在所述非语音区间中,所得到的第二增益的时间变动变小,从而同一区间的背景噪声能量的时间变动变小。
其结果是减少了所述非语音区间中的背景噪声音质的恶化。
以下,参照附图详细说明本发明的实施例。
第一实施例
图1是本发明代码转换装置的第一实施例的构成示意图。在图1中,对于与图12相同或等同的要素用相同的参照标号标注。参照图1,具有输入端子10、代码分离电路1010、LP系数码转换电路1100、LSP-LPC转换电路1110、脉冲响应计算电路1120、ACB码转换电路1200、目标信号计算电路1700、FCB码生成电路1800、增益码生成电路1400、语音解码电路1500、第二激励信号计算电路1610、第二激励信号存储电路1620、代码复用电路1020、输出端子20。输入端子10、输出端子20、代码分离电路1010、代码复用电路1020除连接上有一部分不同之外,基本上与图12所示的要素相同。下面省略与上述相同或等同的要素的说明,而主要说明与图12所示的构成的不同点。
此外,在方法A中,设定LP系数的编码每
Tfr (A)
msec周期(帧)进行,ACB、FCB及增益等激励信号的构成要素的编码每
T sfr ( A ) = T fr ( A ) / N sfr ( A )
msec周期(子帧)进行。
另一方面,在方法B中,设定LP系数的编码每
Tfr (B)
msec周期(帧)进行,激励信号的构成要素的编码每
T sfr ( B ) = T fr ( B ) / N sfr ( B )
msec周期(子帧)进行。
此外,分别将方法A的帧长、子帧数以及子帧长设为
Lfr (A)
Nsfr (A)
L sfr ( A ) = L fr ( A ) / N sfr ( A ) .
分别将方法B的帧长、子帧数以及子帧长分别设为
Lfr (B)
Nsfr (B)
L sfr ( B ) = L fr ( B ) / N sfr ( B ) .
在以下的说明中,为方便起见,设为
L fr ( A ) = L fr ( B )
N sfr ( A ) = N sfr ( B ) = 2 .
此处,例如,若将取样频率设为8000Hz,将
Tfr (A)
Tfr (B)
设为10msec,
则Lfr (A)
及Lfr (B)
为160样本,
Lsfr (A)
Lsfr (B)
为80样本。
LP系数码转换电路1100从代码分离电路1010输入第一LP系数码。此处,在《3GPP AMR Speech Codec》(文献3)或ITU-T建议G.729等很多标准方法中,由于用线谱对(Line Spectral Pair:LSP)表示LP系数,并对LSP进行编码及解码的时候很多,所以LP系数的编码及解码在LSP区域中进行。关于从LP系数向LSP的转换、以及从LSP向LP系数的转换的公知方法,例如可参见“文献3”的第5.2.3节及第6.2.4节的记载。LP系数码转换电路1100使用方法A中的LSP解码方法对所述第一LP系数码进行解码,从而得到第一LSP。
接着,LP系数码转换电路1100使用方法B中的LSP量化方法及编码方法对所述第一LSP进行量化及编码,从而得到第二LSP和与其对应的代码(第二LP系数码)。然后,LP系数码转换电路1100将所述第二LP系数码作为可使用方法B中的LSP解码方法进行解码的代码输出给代码复用电路1020,并且将所述第一LSP和第二LSP输出给LSP-LPC转换电路1110。
图2是LP系数码转换电路1100的构成示意图。参照图2,LP系数码转换电路1100具有LSP解码电路110、第一LSP码本111、LSP系数编码电路130、第二LSP码本131。参照图2说明LP系数码转换电路1100的各构成要素。
LSP解码电路110从LP系数码解码出所对应的LSP。LSP解码电路110具有存储了多组LSP的第一LSP码本111,并经由输入端子31输入从代码分离电路1010输出的第一LP系数码,从而从第一LSP码本111读取与第一LP系数码相对应的LSP并将读取的LSP作为第一LSP输出给LSP编码电路130,并经由输出端子33输出给LSP-LPC转换电路1110。此处,来自LP系数码的LSP的解码依据方法A中的LSP的解码方法,并使用方法A的LSP码本。
LSP编码电路130输入由LSP解码电路110输出的第一LSP,从存储有多组LSP的第二LSP码本131中依次分别读取第二LSP和与其对应的LP系数码,并选择与第一LSP之间的误差最小的第二LSP,从而将与其对应的LP系数码作为第二LP系数码经由输出端子32输出给代码复用电路1020,并且经由输出端子34将第二LSP输出给LSP-LPC转换电路1110。此处,第二LSP选择方法,即LSP量化及编码方法依据方法B中的LSP量化方法及编码方法,使用方法B的LSP码本。此处,关于LSP的量化及编码,参见例如“文献3”的第5.2.5节的记载。
至此,结束对图2中的LP系数码转换电路1100的说明,再次回到图1的说明。
LSP-LPC转换电路1110输入由LP系数码转换电路1100输出的第一LSP和第二LSP,并将第一LSP转换为第一LP系数a1、i,将第二LSP转换为第二LP系数a2、i,从而将第一LP系数a1、I输出给目标信号计算电路1700、语音解码电路1500和脉冲响应计算电路1120,并将第二LP系数a2、i输出给目标信号计算电路1700和脉冲响应计算电路1120。此处,关于从LSP向LP系数的转换,参见“文献3”的第5.2.4节的记载。
ACB码转换电路1200使用方法A中的代码和方法B中的代码之间的对应关系来对由代码分离电路1010输入的第一ACB码进行变换(読み替ぇ),从而得到第二ACB码。并且,ACB码转换电路1200将第二ACB码作为可使用方法B中的ACB解码方法进行解码的代码输出给代码复用电路1020。此外,ACB码转换电路1200将与第二ACB码对应的ACB延迟作为第二ACB延迟输出给目标信号计算电路1700。
此处,参照图3说明代码的变换。例如,假设在方法A中的ACB码
iT (A)
为56时,与此对应的ACB延迟
T(A)
为76。若在方法B中,假设ACB码
iT (B)
为53时,与此对应的ACB延迟
T(B)
为76,则为使ACB延迟的值相同(此时是76)而从方法A向方法B进行ACB码转换时,只要将方法A中的ACB码56与方法B中的ACB码53对应起来即可。至此,结束关于代码的变换的说明,再次返回到图1的说明。
语音解码电路1500输入由代码分离电路1010输出的第一ACB码、第一FCB码、第一增益码,并从LSP-LPC转换电路1110输入第一LP系数。接着,语音解码电路1500分别使用方法A中的ACB信号解码方法、FCB信号解码方法及增益解码方法,从第一ACB码、第一FCB码及第一增益码中分别解码出ACB延迟、FCB信号及增益,并将这些分别作为第一ACB延迟、第一FCB信号及第一增益。语音解码电路1500使用第一ACB延迟生成ACB信号,并将此作为第一ACB信号。并且,语音解码电路1500从第一ACB信号、第一FCB信号及第一增益和第一LP系数生成语音,并将语音输出给目标信号计算电路1700。
图4是语音解码电路1500的构成示意图。参照图4,语音解码电路1500具有激励信号信息解码电路1600、激励信号计算电路1540、激励信号存储电路1570和合成滤波器1580,其中所述激励信号信息解码电路1600具有ACB解码电路1510、FCB解码电路1520和增益解码电路1530。参照图4,说明语音解码电路1500的各构成要素。
激励信号信息解码电路1600从与激励信号的信息对应的代码中解码出激励信号的信息。将由代码分离电路1010输出的第一ACB码、第一FCB码及第一增益码分别经由输入端子51、52及53输入,并分别从第一ACB码、第一FCB码及第一增益码中解码出ACB延迟、FCB信号及增益,并将这些分别作为第一ACB延迟、第一FCB信号及第一增益。此处,第一增益由ACB增益和FCB增益组成,分别将它们作为第一ACB增益和第一FCB增益。此外,激励信号信息解码电路1600输入由激励信号存储电路1570输出的过去的激励信号。激励信号信息解码电路1600使用过去的激励信号和第一ACB延迟生成ACB信号,并将此作为第一ACB信号。并且,激励信号信息解码电路1600将第一ACB信号、第一FCB信号、第一ACB增益及第一FCB增益输出给激励信号计算电路1540。
下面,详细说明作为激励信号信息解码电路1600的构成要素的ACB解码电路1510、FCB解码电路1520和增益解码电路1530。
ACB解码电路1510经由输入端子51输入由代码分离电路1010输出的第一ACB码,并输入由激励信号存储电路1570输出的过去的激励信号。接着,ACB解码电路1510与上述ACB码转换电路1200相同,使用图3所示的方法A中的ACB码和ACB延迟的对应关系,得到与第一ACB码对应的第一ACB延迟
T(A)
。对于激励信号,从自当前子帧的始点
T(A)
采样过去的点截出与子帧长度相当的
Lsfr (A)
采样信号,从而生成第一ACB信号。此处,当
T(A)
Lsfr (A)
小时,截出
T(A)
采样量的矢量,并反复连接所述矢量,从而形成长度为
Lsfr (A)
的采样信号。然后,向激励信号计算电路1540输出第一ACB信号。此处,关于生成第一ACB信号的方法的详细说明,参见“文献3”的第6.1节及第5.6节的记载。
FCB解码电路1520经由输入端子52输入由代码分离电路1010输出的第一FCB码,并将与第一FCB码对应的第一FCB信号输出给激励信号计算电路1540。FCB信号表现为由脉冲位置和脉冲极性规定的多脉冲信号,因此第一FCB码由与脉冲位置对应的代码(脉冲位置代码)和与脉冲极性对应的代码(脉冲极性代码)组成。此处,关于生成表现为多脉冲信号的FCB信号的方法的详细说明,参见“文献3”的第6.1节及第5.7节的记载。
增益解码电路1530经由输入端子53输入由代码分离电路1010输出的第一增益码。增益解码电路1530内置有存储了多个增益的表格,并从表格中读取与第一增益码对应的增益。然后,增益解码电路1530向激励信号计算电路1540输出在所读取的增益之中与ACB增益对应的第一ACB增益、与FCB增益对应的第一FCB增益。此处,在将第一ACB增益和第一FCB增益一起编码的情况下,在表格中存储多个由第一ACB增益和第一FCB增益组成的二维矢量。此外,在将第一ACB增益和第一FCB增益分别编码的情况下,内置两个表格,并在一个表格中存储多个第一ACB增益,在另一个表格中存储多个第一FCB增益。
激励信号计算电路1540输入由ACB解码电路1510输出的第一ACB信号、由FCB解码电路1520输出的第一FCB信号以及由增益解码电路1530输出的第一ACB增益和第一FCB增益。激励信号计算电路1540将在第一ACB信号上乘上第一ACB增益所得的信号和在第一FCB信号上乘上第一FCB增益所得的信号相加起来,从而得到第一激励信号。然后,激励信号计算电路1540向合成滤波器1580和激励信号存储电路1570输出第一激励信号。
激励信号存储电路1570输入由激励信号计算电路1540输出的第一激励信号,并将其存储保持。并且,激励信号存储电路1570将在过去输入并存储保持的过去的第一激励信号输出给ACB解码电路1510。
合成滤波器1580输入由激励信号计算电路1540输出的第一激励信号,并经由输入端子61输入由LSP-LPC转换电路1110输出的第一LP系数。然后,合成滤波器1580通过使用第一激励信号驱动具有第一LP系数的线性预测滤波器来生成语音。并经由输出端子63将语音信号输出给目标信号计算电路1700。
至此,结束对图4中的语音解码电路1500的说明,再次返回到图1的说明。
目标信号计算电路1700从LSP-LPC转换电路1110输入第一LSP和第二LSP,从ACB码转换电路1200输入与第二ACB码对应的第二ACB延迟,从语音解码电路1500输入解码语音,从脉冲响应计算电路1120输入脉冲响应信号,并输入存储保持在第二激励信号存储电路1620中的过去的第二激励信号。目标信号计算电路1700从解码语音和第一LP系数及第二LP系数算出第一目标信号。接着,目标信号计算电路1700从过去的第二激励信号、脉冲响应信号、第一目标信号和第二ACB延迟求出第二ACB信号及最佳ACB增益。然后,目标信号计算电路1700向增益码生成电路1400输出第一目标信号和最佳ACB增益,向增益码生成电路1400和第二激励信号计算电路1610输出第二ACB信号。
图5是目标信号计算电路1700的构成示意图。参照图5,目标信号计算电路1700具有加权信号计算电路1710、ACB信号生成电路1720和最佳ACB增益计算电路1730。参照图5说明目标信号计算电路1700的各构成要素。
加权信号计算电路1710经由输入端子57输入由语音解码电路1500的合成滤波器1580输出的解码语音s(n),并分别经由输入端子36和输入端子35输入由LSP-LPC转换电路1110输出的第一LP系数a1、i和第二LP系数a2、i。加权信号计算电路1710首先使用第一LP系数构成听感加权滤波器W(z)。
然后,加权信号计算电路1710使用解码语音驱动听感加权滤波器,从而生成听感加权语音信号。接着,加权信号计算电路1710使用第一LP系数和第二LP系数构成听感加权合成滤波器W(z)/A2(z)。
然后,加权信号计算电路1710将从听感加权语音信号减去听感加权合成滤波器的零输入响应而得的第一目标信号X(n)输出给ACB信号生成电路1720和最佳ACB增益计算电路1730,并且经由输出端子78输出给第二目标信号计算电路1430。
ACB信号生成电路1720输入由加权信号计算电路1710输出的第一目标信号,并且经由输入端子37输入由ACB码转换电路1200输出的第二ACB延迟T(B) lag,经由输入端子74输入由脉冲响应计算电路1120输出的脉冲响应信号h(n),经由输入端子75输入由第二激励信号存储电路1620输出的过去的第二激励信号u(n)。
ACB信号生成电路1720根据以延迟k从过去的第二激励信号中截出的信号和脉冲信号之间的卷积(畳み込み)来计算滤波器处理后的延迟k的过去的激励信号
y k ( n ) , n = 0 , · · · , L sfr ( B ) - 1 .
此处,延迟k是第二ACB延迟。以延迟k从过去的第二激励信号中截出的信号是第二ACB信号v(n)。
然后,ACB信号生成电路1720经由输出端子76将第二ACB信号输出给第二目标信号计算电路1430和第二激励信号计算电路1610,并将滤波器处理后的延迟k的过去的激励信号yk(n)输出给最佳ACB增益计算电路1730。
最佳ACB增益计算电路1730输入由加权信号计算电路1710输出的第一目标信号x(n),并输入由ACB信号生成电路1720输出的滤波器处理后的延迟k的过去的激励信号yk(n)。
接着,ACB增益计算电路1730根据下式从第一目标信号x(n)和滤波器处理后的延迟k的过去的激励信号yk(n)算出最佳ACB增益gp。最佳ACB增益gp是使第一目标信号x(n)和滤波器处理后的延迟k的过去的激励信号yk(n)之间的距离最小的增益。
g p = Σ n - 0 L sfr ( B ) - 1 x ( n ) y k ( n ) Σ n - 0 L sfr ( B ) - 1 y k ( n ) y k ( n )
然后,ACB增益计算电路1730经由输出端子77向ACB增益编码电路1410输出最佳ACB增益gp。
此外,关于计算第二ACB信号的方法及计算最佳ACB增益的方法的详细说明,参见“文献3”的第6.1节及第5.6节的记载。至此,结束对图5的目标信号计算电路1700的说明,再次返回到图1的说明。
脉冲响应计算电路1120输入由LSP-LPC转换电路1110输出的第一LP系数和第二LP系数,并且使用第一LP系数和第二LP系数构成听感加权合成滤波器。
然后,脉冲响应计算电路1120向目标信号计算电路1700和增益码生成电路1400输出听感加权合成滤波器的脉冲响应信号。此处,听感加权合成滤波器的传递函数用下式表示。
W ( z ) A 2 ( z ) = A 1 ( z / r 1 ) A 2 ( z ) A 1 ( z / r 1 )
其中,
1 A 2 ( z ) = 1 1 + Σ i = 1 P a 2 , i z - i
是具有第二LP系数
a2,i,i=1,…,P
的线性预测滤波器的传递函数。
W ( z ) = A 1 ( z / r 1 ) A 1 ( z / r 2 ) = 1 + Σ i = 1 P r 1 i a 1 , i z - i 1 + Σ i = 1 P r 2 i a 1 , i z - i
是具有第一LP系数
a1,i,i=1,…,P
的听感加权滤波器的传递函数。
此处,P是线性预测次数(例如为10),r1和r2是控制加权的系数(例如为0.94和0.6)。
FCB码生成电路1800输入由代码分离电路1010输出的第一FCB码,并将第一FCB码转换成可使用方法B进行解码的代码。FCB码生成电路1800将转换后的FCB码作为第二FCB码输出给代码复用电路1020,将与第二FCB码对应的第二FCB信号输出给增益码生成电路1400和第二激励信号计算电路1610。此处,FCB信号由多个脉冲组成,表现为由脉冲的位置(脉冲位置)和极性(脉冲极性)规定的多脉冲信号。FCB码由与脉冲位置对应的代码(脉冲位置代码)和与脉冲极性对应的代码(脉冲极性代码)组成。关于FCB信号的使用多脉冲信号的表现方法,参见“文献3”的第5.7节的记载。
图6是图1的FCB码生成电路1800的构成示意图。参照图6,FCB码生成电路1800具有FCB码转换电路1300和FCB信号生成电路1820。参照图6,说明FCB码生成电路1800的各构成要素。
FCB码转换电路1300使用方法A中的代码和方法B中的代码之间的对应关系对从代码分离电路1010经由输入端子85输入的第一FCB码i(A) P进行变换,从而得到第二FCB码i(B) P。然后,FCB码转换电路1300将其作为可使用方法B中的FCB解码方法进行解码的代码经由输出端子55输出给代码复用电路1020,并将与第二FCB码对应的脉冲位置
Pi (A)
及脉冲极性
Si (A)
输出给FCB信号生成电路1820。
参照图7说明脉冲位置代码的变换。
例如,当方法A中的脉冲位置代码
iP (A)
是6时,与其对应的脉冲位置
P0 (A)
是30。若在方法B中,假设当脉冲位置代码
iP (B)
为1时,与其对应的脉冲位置
P0 (B)
为30,则为使脉冲位置的值相同(此时是30)而从方法A向方法B进行脉冲位置代码的转换时,只要将方法A中的脉冲位置代码6与方法B中的脉冲位置代码1对应起来即可。
关于脉冲极性代码,只要对代码进行变换,使得对应于变换之前的代码的极性(正或负)和对应于变换之后的代码的极性相同即可。
至此,结束关于脉冲位置代码及脉冲极性代码的变换的说明,再次返回到图6的说明。
FCB信号生成电路1820输入由FCB码转换电路1300输出的脉冲位置及脉冲极性。FCB信号生成电路1820将由脉冲位置及脉冲极性规定的FCB信号作为第二FCB信号c(n),并经由输出端子86将其输出给最佳FCB增益计算电路1440和第二激励信号计算电路1610。
至此,结束对图6的FCB码生成电路1800的说明,再次返回到图1的说明。
增益码生成电路1400输入由目标信号计算电路1700输出的第一目标信号、第二ACB信号和最佳ACB增益,输入由FCB码生成电路1800输出的第二FCB信号,输入由脉冲响应计算电路1120输出的脉冲响应信号,输入由LP系数码转换电路1100输出的第一LSP。
增益码生成电路1400首先从第一目标信号、第二ACB信号、最佳ACB增益和脉冲响应信号算出第二目标信号,从第二目标信号、第二FCB信号和脉冲响应信号算出最佳FCB增益,从最佳FCB增益算出修正FCB增益,并从第一LSP确定语音判定值。
接着,增益码生成电路1400从依次从ACB增益码本读取的ACB增益和最佳ACB增益算出第一平方误差,并从ACB增益和修正ACB增益算出第二平方误差。
并且,增益码生成电路1400选择使评价函数最小的ACB增益以及所对应的ACB增益码,其中所述评价函数是从自语音判定值算出的权重系数、第一平方误差和第二平方误差算出的。
此外,增益码生成电路1400从依次从FCB增益码本读取的FCB增益和最佳FCB增益算出第三平方误差,并且由FCB增益和修正FCB增益算出第四平方误差。
并且,增益码生成电路1400选择使评价函数最小的FCB增益以及所对应的FCB增益码,其中所述评价函数是从自语音判定值算出的权重系数、第三平方误差和第四平方误差算出的。
最后,增益码生成电路1400经由输出端子56向代码复用电路1020输出由所选择的ACB增益码和FCB增益码组成的第二增益码,作为可使用方法B中的增益解码方法进行解码的代码。
图8是增益码生成电路1400的构成示意图。参照图8,增益码生成电路1400具有ACB增益编码电路1410、ACB增益码本1411、FCB增益编码电路1420、FCB增益码本1421、第二目标信号计算电路1430、最佳FCB增益计算电路1440、最佳FCB增益修正电路1450、语音/非语音识别电路1460。参照图8,详细说明增益码生成电路1400的各构成要素。
第二目标信号计算电路1430经由输入端子92输入由ACB信号生成电路1720输出的第二ACB信号v(n),经由输入端子93输入由加权信号计算电路1710输出的第一目标信号x(n),经由输入端子94输入由脉冲响应计算电路1120输出的脉冲响应信号h(n),并输入由ACB增益编码电路1410输出的第二ACB增益。
第二目标信号计算电路1430根据第二ACB信号和脉冲响应信号的卷积来计算滤波器处理后的第二ACB信号
y ( n ) , n = 0 , · · · , L sfr ( B ) - 1
,并从第一目标信号x(n)中减去y(n)乘以第二ACB增益
Figure A0381767500362
所得的信号,从而得到第二目标信号x2(n)。
x 2 ( n ) = x ( n ) - g ^ P y ( n ) ,
y(n)=v(n)*h(n)
然后,第二目标信号计算电路1430向最佳FCB增益计算电路1440输出第二目标信号x2(n)。
最佳FCB增益计算电路1440经由输入端子91输入由FCB信号生成电路1820输出的第二FCB信号c(n),经由输入端子94输入由脉冲响应计算电路1120输出的脉冲响应信号h(n),输入由第二目标信号计算电路1430输出的第二目标信号x2(n),从而根据第二FCB信号和脉冲响应信号的卷积来计算滤波器处理后的第二FCB信号
z ( n ) , n = 0 , · · · , L sfr ( B ) - 1
,并根据下式从第二目标信号x2(n)和滤波器处理后的第二FCB信号z(n)算出最佳FCB增益gc。最佳FCB增益gc是使第二目标信号x2(n)和滤波器处理后的第二FCB信号z(n)之间的距离最小的增益。
g c = Σ n = 0 L sfr ( g ) - 1 x 2 ( n ) z ( n ) Σ n = 0 L sfr ( g ) - 1 z ( n ) z ( n )
然后,最佳FCB增益计算电路1440将最佳FCB增益输出给最佳FCB增益修正电路1450和FCB增益编码电路1420。
语音/非语音识别电路1460经由输入端子98输入由LSP解码电路110输出的第一LSP。并从第一LSP和其长时间平均算出LSP的变动量,从LSP变动量确定语音判定值。
求LSP变动量的步骤如下所述。在第n帧中按照下式计算LSP的长时间平均
qj(n)。
q ‾ j ( n ) = β · q ‾ j ( n - 1 ) + ( 1 - β ) · q ^ j ( N sfr ) ( n ) , j = 1 , · · · , N P
此处,NP是线性预测次数,β例如是0.9。
第n帧的LSP变动量dq(n)用下式定义。
d q ( n ) = Σ j = 1 N P Σ m = 1 N sfr D q , j ( m ) ( n ) q ‾ j ( n )
此处,
Dq,j (m)(n)
可以定义为
Figure A0381767500382
Figure A0381767500383
之间的误差,例如可定义为
D q , j ( m ) ( n ) = ( q ‾ j ( n ) - q ^ j ( m ) ( n ) ) 2
D q , j ( m ) ( n ) = | q ‾ j ( n ) - q ^ j ( m ) ( n ) |
等,此处使用后者。可使变动量dq(n)大的区间对应语音区间,使变动量dq(n)小的区间对应非语音区间。通过对变动量dq(n)的阈值处理来确定语音判定值
Svs
if (dq(n)≥Cvs) then Vs=1
else Vs=0
(Vs=1 dq(n)大于或等于CVS的情况
Vs=0 dq(n)小于CVS的情况)
此处,CVS是某一常数(例如为2.2),并且Vs=1对应语音区间,Vs=0对应非语音区间。将语音判定值输出给最佳ACB增益修正电路1480、ACB增益编码电路1410、最佳FCB增益修正电路1450和FCB增益编码电路1420。
最佳ACB增益修正电路1480经由输入端子97输入由ACB信号生成电路1720输出的最佳ACB增益,并且输入由语音/非语音识别电路1460输出的语音判定值。在最佳ACB增益修正电路1480中,当语音判定值VS是0(非语音区间)时,将最佳ACB增益的长时间平均作为修正ACB增益。在非语音区间中,根据下式计算最佳ACB增益的长时间平均。
gP(n)=α· gP(n-1)+(1-α)·gP(n)
此处,
gP(n)
是第n子帧中的最佳ACB增益,
gP(n)
是第n子帧中的最佳ACB增益的长时间平均,并且α例如是0.9。此外,平均值、中值、最频值等都可适用于长时间平均。
另一方面,在最佳ACB增益修正电路1480中,当语音判定值VS是1(语音区间)时,将最佳ACB增益本身作为修正ACB增益。
最佳ACB增益修正电路1480将修正ACB增益输出给ACB增益编码电路1410。
ACB增益编码电路1410经由输入端子97输入由ACB信号生成电路1720输出的最佳ACB增益gp,输入由最佳ACB增益修正电路1480输出的修正ACB增益,输入由语音/非语音识别电路1460输出的语音判定值。
ACB增益编码电路1410从依次从ACB增益码本1411读取的ACB增益和来自输入端子97的最佳ACB增益算出第一平方误差,从ACB增益和修正ACB增益算出第二平方误差,从根据语音判定值算出的权重系数、第一平方误差和第二平方误差算出由下式定义的评价函数。
E gp = μ · ( g p - g ^ p ) 2 + ( 1 - μ ) · ( g ~ p - g ^ p ) 2
此处,
gp
是最佳ACB增益,
是修正ACB增益,
是从ACB增益码本依次读取的ACB增益,μ是权重系数。例如,当语音判定值Vs是1(语音区间)时,权重系数μ是1.0,当Vs是0(非语音区间)时,μ是0.2。
并且,ACB增益编码电路1410选择使评价函数最小的ACB增益,并将所选择的ACB增益作为第二ACB增益输出给第二目标信号计算电路1430,同时经由输出端子95输出给第二激励信号计算电路1610,将与第二ACB增益对应的代码作为ACB增益码输出给增益码复用电路1470。
最佳FCB增益修正电路1450输入由最佳FCB增益计算电路1440输出的最佳FCB增益,并且输入由语音/非语音识别电路1460输出的语音判定值。
在最佳FCB增益修正电路1450中,当语音判定值VS是0(非语音区间)时,将最佳FCB增益的长时间平均作为修正FCB增益。在非语音区间中,根据下式计算最佳FCB增益的长时间平均。
gc(n)=α· gc(n-1)+(1-α)·gc(n)
此处,
gc(n)
是第n子帧中的最佳FCB增益,
gc(n)
是第n子帧中的最佳FCB增益的长时间平均,并且α例如是0.9。此外,平均值、中值、最频值等都可适用于长时间平均。
另一方面,在最佳FCB增益修正电路1450中,当语音判定值VS为1(语音区间)时,将最佳FCB增益本身作为修正FCB增益。
最佳FCB增益修正电路1450将修正FCB增益输出给FCB增益编码电路1420。
FCB增益编码电路1420输入由最佳FCB增益计算电路1440输出的最佳FCB增益,输入由最佳FCB增益修正电路1450输出的修正FCB增益,输入由语音/非语音识别电路1460输出的语音判定值。FCB增益编码电路1420从依次从FCB增益码本1421读取的FCB增益和最佳FCB增益算出第一平方误差,从FCB增益和修正FCB增益算出第二平方误差,从根据语音判定值算出的权重系数、第一平方误差和第二平方误差算出由下式定义的评价函数。
E gc = μ · ( g c - g ^ c ) 2 + ( 1 - μ ) · ( g ~ c - g ^ c ) 2
此处,
gc
是最佳FCB增益,
Figure A0381767500411
是修正FCB增益,
Figure A0381767500412
是从FCB增益码本依次读取的FCB增益,μ是权重系数。例如,当语音判定值Vs是1(语音区间)时,权重系数μ是1.0,当Vs是0(非语音区间)时,μ是0.2。
然后,FCB增益编码电路1420选择使评价函数最小的FCB增益,并将所选择的FCB增益作为第二FCB增益经由输出端子96输出给第二激励信号计算电路1610,将与第二FCB增益对应的代码作为FCB增益码输出给增益码复用电路1470。
增益码复用电路1470输入由ACB增益编码电路1410输出的ACB增益码,输入由FCB增益编码电路1420输出的FCB增益码,并将ACB增益码和FCB增益码进行复用而得的第二增益码作为可使用方法B中的增益解码方法进行解码的代码输出给代码复用电路1020。
至此,结束对图8的增益码生成电路1400的说明,再次返回到图1的说明。
第二激励信号计算电路1610输入由目标信号计算电路1700输出的第二ACB信号,输入由FCB码生成电路1800输出的第二FCB信号,输入由增益码生成电路1400输出的第二ACB增益和第二FCB增益。第二激励信号计算电路1610将第二ACB信号乘上第二ACB增益所得到的信号和第二FCB信号乘上第二FCB增益所得到的信号相加,从而得到第二激励信号。然后将第二激励信号输出给第二激励信号存储电路1620。
第二激励信号存储电路1620输入由第二激励信号计算电路1610输出的第二激励信号,并将其存储保持。并且,将在过去输入并存储保持的第二激励信号输出给目标信号计算电路1700。至此,结束对本发明第一实施例的说明。
第二实施例
下面说明本发明的第二实施例。图9是本发明代码转换装置的第二实施例的构成示意图。在图9中,用LP系数码转换电路1100和增益码转换电路2400分别替换图12中的LP系数码转换电路100和增益码转换电路400,并且在LP系数码转换电路1100和增益码转换电路2400之间添加连接线。以下省略对与图12所示的要素相同或等同的要素的说明,仅说明不同点。
LP系数码转换电路1100与使用图1说明的第一实施例中的相同。但是与其他电路之间的连线方法不同,将第一LSP输出给增益码转换电路400。
增益码转换电路2400输入由代码分离电路1010输出的第一增益码,并输入由LP系数码转换电路1100输出的第一LSP。
增益码转换电路2400首先从第一增益(第一ACB增益及第一FCB增益)算出修正ACB增益及修正FCB增益,从第一LSP确定语音判定值,其中所述第一增益是将第一增益码使用方法A中的增益解码方法解码后所得到的。
接着,增益码转换电路2400从依次从ACB增益码本读取的ACB增益和第一ACB增益算出第一平方误差,并从ACB增益和修正ACB增益算出第二平方误差。
然后,增益码转换电路2400选择使评价函数最小的ACB增益及所对应的ACB增益码,所述评价函数是从根据语音判定值算出的权重系数、第一平方误差和第二平方误差算出的。
并且,增益码转换电路2400从依次从FCB增益码本读取的FCB增益和第一FCB增益算出第三平方误差,从FCB增益和修正FCB增益算出第四平方误差。然后,增益码转换电路2400选择使评价函数最小的FCB增益及所对应的FCB增益码,所述评价函数是从根据语音判定值算出的权重系数、第三平方误差和第四平方误差算出的。
最后,增益码转换电路2400将由所选择的ACB增益码和FCB增益码组成的第二增益码作为可使用方法B中的增益解码方法进行解码的代码输出给代码复用电路1020。
图10是图9的增益码转换电路2400的构成示意图。参照图10,增益码转换电路2400具有语音/非语音识别电路1460、增益码分离电路2490、ACB增益解码电路2470、ACB增益码本2471、ACB增益修正电路2440、ACB增益编码电路2410、ACB增益码本1411、FCB增益解码电路2480、FCB增益码本2481、FCB增益修正电路2450、FCB增益编码电路2420、FCB增益码本1421以及增益码复用电路1470。参照图10,说明本实施例的增益码转换电路2400的各构成要素。此外,在图10中,语音/非语音识别电路1460及增益码复用电路1470与图8所示的要素基本相同,因此下面省略对它们的说明。
增益码分离电路2490经由输入端子45输入由代码分离电路1010输出的第一增益码,并从第一增益码分离出与ACB增益及FCB增益对应的代码,即第一ACB增益码即第一FCB增益码,从而向ACB增益解码电路2470输出第一ACB增益码,向FCB增益解码电路2480输出第一FCB增益码。
ACB增益解码电路2470具有存储了多组ACB增益的ACB增益码本2471,并输入由增益码分离电路2490输出的第一ACB增益码,从而从ACB增益码本2471读取与第一ACB增益码对应的ACB增益,并将读取的ACB增益作为第一ACB增益输出给ACB增益修正电路2440,同时输出给ACB增益编码电路2410。此处,从ACB增益码的ACB增益的解码根据方法A中的ACB增益的解码方法,并使用方法A的ACB增益码本进行。
FCB增益解码电路2480具有存储了多组FCB增益的FCB增益码本2481,并输入由增益码分离电路2490输出的第一FCB增益码,从而从FCB增益码本2481读取与第一FCB增益码对应的FCB增益,并将读取的FCB增益作为第一FCB增益输出给FCB增益修正电路2450,同时输出给FCB增益编码电路2420。此处,从FCB增益码的FCB增益的解码根据方法A中的FCB增益的解码方法,并使用方法A的FCB增益码本进行。
ACB增益修正电路2440输入由ACB增益解码电路2470输出的第一ACB增益,并输入由语音/非语音识别电路1460输出的语音判定值。当语音判定值VS为0(非语音区间)时,将第一ACB增益的长时间平均作为修正ACB增益。
ACB增益修正电路2440在非语音区间中,根据下式计算第一ACB增益的长时间平均。
gqp(n)=α· gqp(n-1)+(1-α)·gqp(n)
此处,
gqp(n)
是第n子帧中的第一ACB增益,
gqp(n)
是第n子帧中的第一ACB增益的长时间平均,并且α例如是0.9。此外,平均值、中值、最频值等都可适用于长时间平均。
另一方面,当语音判定值VS为1(语音区间)时,ACB增益修正电路2440将第一ACB增益本身作为修正ACB增益。
ACB增益修正电路2440将修正ACB增益输出给ACB增益编码电路2410。
FCB增益修正电路2450输入由FCB增益解码电路2480输出的第一FCB增益,并输入由语音/非语音识别电路1460输出的语音判定值。
在FCB增益修正电路2450中,当语音判定值VS是0(非语音区间)时,将第一FCB增益的长时间平均作为修正FCB增益。在非语音区间中,根据下式计算第一FCB增益的长时间平均。
gqc(n)=α· gqc(n-1)+(1-α)·gqc(n)
此处,
gqc(n)
是第n子帧中的第一FCB增益,
gqc(n)
是第n子帧中的第一FCB增益的长时间平均,并且α例如是0.9。此外,平均值、中值、最频值等都可适用于长时间平均。
另一方面,当语音判定值VS为1(语音区间)时,FCB增益修正电路2450将第一FCB增益本身作为修正FCB增益。
FCB增益修正电路2450将修正FCB增益输出给FCB增益编码电路2420。
ACB增益编码电路2410输入由ACB增益解码电路2470输出的第一ACB增益,输入由ACB增益修正电路2440输出的修正ACB增益,输入由语音/非语音识别电路1460输出的语音判定值。
ACB增益编码电路2410从依次从ACB增益码本1411读取的ACB增益和第一ACB增益算出第一平方误差,并从ACB增益和修正ACB增益算出第二平方误差,从根据语音判定值算出的权重系数、第一平方误差和第二平方误差算出由下式定义的评价函数。
E gqp = μ · ( g qp - g ^ qp ) 2 + ( 1 - μ ) · ( g ~ qp - g ^ qp ) 2
此处,
gqp
是第一ACB增益,
Figure A0381767500452
是修正ACB增益,
Figure A0381767500453
是从ACB增益码本1411依次读取的ACB增益,μ是权重系数。例如,当语音判定值Vs是1(语音区间)时,设权重系数μ为1.0,当Vs是0(非语音区间)时,设μ为0.2。
然后,ACB增益编码电路2410选择使评价函数最小的ACB增益,并将所选择的ACB增益作为第二ACB增益,将与第二ACB增益对应的代码作为第二ACB增益码输出给增益码复用电路1470。
FCB增益编码电路2420输入由FCB增益解码电路2480输出的第一FCB增益,输入由FCB增益修正电路2450输出的修正FCB增益,输入由语音/非语音识别电路1460输出的语音判定值。
FCB增益编码电路2420从依次从FCB增益码本1421读取的FCB增益和第一FCB增益算出第三平方误差,从FCB增益和修正FCB增益算出第四平方误差,从根据语音判定值算出的权重系数、第三平方误差和第四平方误差算出由下式定义的评价函数。
E gqc = μ · ( g qc - g ^ qc ) 2 + ( 1 - μ ) · ( g ~ qc - g ^ qc ) 2
此处,
gqc
是第一FCB增益,
Figure A0381767500462
是修正FCB增益,
是从FCB增益码本1421依次读取的FCB增益,μ是权重系数。例如,当语音判定值Vs是1(语音区间)时,设权重系数μ为1.0,当Vs是0(非语音区间)时,设μ为0.2。
然后,FCB增益编码电路2420选择使评价函数最小的FCB增益,并将所选择的FCB增益作为第二FCB增益,将与第二FCB增益对应的代码作为第二FCB增益码输出给增益码复用电路1470。
第三实施例
上述本发明的各实施例的代码转换装置也可以通过数字信号处理器等的计算机控制来实现。图11是作为本发明的第三实施例的、通过计算机(处理器)执行的程序来实现上述各实施例的代码转换处理的装置构成示意图。在执行从记录介质6读取的程序的计算机1中,执行将由第一编解码装置对语音进行编码所得的第一代码转换为可由第二编解码装置进行解码的第二代码的代码转换处理,而与此相应,在记录介质6中记录有用于使下述处理执行的程序:
(a)从第一码串得出第一线性预测系数;
(b)从第一码串得出激励信号的信息;
(c)从激励信号的信息得出激励信号;
(d)通过使用激励信号驱动具有第一线性预测系数的滤波器来生成语音信号;
(e)计算使第二语音信号和第一语音信号之间的距离最小的增益(最佳增益),其中所述第二语音信号根据从第二码串得到的信息生成;
(f)修正所述最佳增益;
(g)从修正后的最佳增益(修正最佳增益)和从第二方法中的增益码本读取的增益算出第一平方误差,从最佳增益和从增益码本读取的增益算出第二平方误差,从增益码本中选择使基于第一平方误差和第二平方误差的评价函数最小的增益,从而求出第二码串的增益信息的处理。
从记录介质6经由记录介质读取装置5、接口4将所述程序读入存储器3中执行。上述程序也可以存储在掩模ROM等、闪存等不挥发性存储器中,记录介质除了包括不挥发性存储器之外,还包括CD-ROM、FD、数字通用光盘(DVD)、磁带(MT)、可移动HDD等介质,此外,还包括例如在使用计算机从服务器装置对所述程序进行通信介质传输时,承载程序的以有线、无线进行通信的通信介质等。
在本发明的第四实施例中,在执行从记录介质6读取的程序的计算机1中,执行将由第一编解码装置对语音进行编码所得的第一代码转换为可由第二编解码装置进行解码的第二代码的代码转换处理,而与此相应,在记录介质6中记录有用于使下述处理执行的程序:
(a)从第一码串解码出增益信息;
(b)对解码后的增益(解码增益)进行修正;
(g)从修正后的解码增益(修正解码增益)和从第二方法中的增益码本读取的增益算出第一平方误差,从解码增益和从增益码本读取的增益算出第二平方误差,从增益码本中选择使基于第一平方误差和第二平方误差的评价函数最小的增益,从而求出第二码串的增益信息。
以上根据上述实施例说明了本发明,但本发明并不仅限于此,当然还包括本领域的技术人员在各项权利要求的发明的范围内可以得到的各种变形、改进。
工业实用性
如上所述,根据本发明,获得了能够减少非语音区间中的背景噪声音质的恶化的效果。
其原因在于本发明如下构成:从第一码串中使用激励信号驱动具有第一线性预测系数的合成滤波器来得到第一语音信号,根据从第二码串得到的信息生成第二语音信号,并从所述的第一语音信号和第二语音信号导出最佳增益,进而修正最佳增益,然后基于修正后的最佳增益、最佳增益和从第二方法中的增益码本读取的增益求出第二码串中的增益信息,此时,在非语音区间中,使用使第二增益的时间变动变小的评价函数来求出第二增益。上述效果还可以通过如下构成的本发明来实现:从第一码串解码出增益信息,并修正解码后的增益,从而基于修正后的增益、所述解码增益和从第二方法中的增益码本读取的增益来求出第二码串中的增益信息,并在非语音区间中,使用使第二增益的时间变动变小的评价函数来求出第二增益。

Claims (36)

1.一种代码转换方法,将根据第一方法的第一码串转换为根据第二方法的第二码串,其特征在于,包括以下步骤:
从所述第一码串得到第一线性预测系数和激励信号的信息,并使用从所述激励信号的信息得到的激励信号驱动具有所述第一线性预测系数的滤波器,从而生成第一语音信号;
基于根据从第二码串得到的信息而生成的第二语音信号和所述第一语音信号来计算最佳增益;
修正所述最佳增益;
基于修正后的最佳增益(称为“修正最佳增益”)、所述最佳增益和从第二方法的增益码本中读取的增益来求出第二码串的增益信息。
2.一种代码转换方法,将根据第一方法的第一码串转换为根据第二方法的第二码串,其特征在于,包括以下步骤:
从所述第一码串解码增益信息;
修正解码后的增益(称为“解码增益”);
基于修正后的解码增益(称为“修正解码增益”)、所述解码增益和从第二方法的增益码本中读取的增益来求出第二码串的增益信息。
3.如权利要求1所述的代码转换方法,其特征在于,包括以下步骤:
从所述修正最佳增益和从所述增益码本中读取的增益计算第一平方误差;
从所述最佳增益和从所述增益码本中读取的增益计算第二平方误差;
从所述增益码本选择使基于所述第一平方误差和所述第二平方误差的评价函数最小的增益,从而求出第二码串中的增益信息。
4.如权利要求2所述的代码转换方法,其特征在于,包括以下步骤:
从所述修正解码增益和从所述增益码本中读取的增益计算第一平方误差;
从所述解码增益和从所述增益码本中读取的增益计算第二平方误差;
从所述增益码本选择使基于所述第一平方误差和所述第二平方误差的评价函数最小的增益,从而求出第二码串中的增益信息。
5.如权利要求1或3所述的代码转换方法,其特征在于,所述修正最佳增益是基于所述最佳增益的长时间平均的增益。
6.如权利要求2或4所述的代码转换方法,其特征在于,所述修正解码增益是基于所述解码增益的长时间平均的增益。
7.如权利要求1所述的代码转换方法,其特征在于,将使第二语音信息和所述第一语音信息之间的距离最小的增益作为最佳增益求出,其中所述第二语音信息是根据从第二码串得到的信息而生成的。
8.如权利要求3至7中任一项所述的代码转换方法,其特征在于,所述评价函数由所述第一平方误差、所述第二平方误差和权重系数构成。
9.如权利要求1或2所述的代码转换方法,其特征在于,包括以下步骤:
基于所述第一线性预测系数来确定识别语音区间/非语音区间的语音判别值;
当所述语音判别值表示非语音区间时,使用使所述第二码串中的增益的时间变动变小的评价函数来求出所述第二码串的增益信息。
10.如权利要求3或4所述的代码转换方法,其特征在于,具有基于所述第一线性预测系数来确定识别语音区间/非语音区间的语音判别值的步骤;
所述评价函数通过使用权重系数对所述第一平方误差和所述第二平方误差进行加权平均来求得;
并且,具有基于所述语音判别值并对应语音区间和非语音区间来分别将所述权重系数设定为预定的值,从而计算所述评价函数的步骤。
11.一种代码转换装置,将根据第一方法的第一码串转换为根据第二方法的第二码串,其特征在于,包括:
语音解码电路,从所述第一码串得到第一线性预测系数和激励信号的信息,并使用从所述激励信号的信息得到的激励信号驱动具有所述第一线性预测系数的滤波器,从而生成第一语音信号;
最佳增益计算电路,基于根据从第二码串得到的信息而生成的第二语音信号和所述第一语音信号来计算最佳增益;
最佳增益修正电路,修正所述最佳增益;
增益编码电路,基于修正后的最佳增益(称为“修正最佳增益”)、所述最佳增益和从第二方法的增益码本中读取的增益来求出第二码串中的增益信息。
12.一种代码转换装置,将根据第一方法的第一码串转换为根据第二方法的第二码串,其特征在于,包括:
增益解码电路,从所述第一码串中解码增益信息;
增益修正电路,修正解码后的增益(称为“解码增益”);
增益编码电路,基于修正后的解码增益(称为“修正解码增益”)、所述解码增益和从第二方法的增益码本中读取的增益来求出第二码串中的增益信息。
13.如权利要求11所述的代码转换装置,其特征在于,所述增益编码电路具有如下装置,该装置
从所述修正最佳增益和从所述增益码本中读取的增益计算第一平方误差,从所述最佳增益和从所述增益码本中读取的增益计算第二平方误差,从而通过从所述增益码本选择使基于所述第一平方误差和所述第二平方误差的评价函数最小的增益,来求出第二码串的增益信息。
14.如权利要求12所述的代码转换装置,其特征在于,所述增益编码电路具有如下装置,该装置
从所述修正解码增益和从所述增益码本中读取的增益计算第一平方误差,从所述解码增益和从所述增益码本中读取的增益计算第二平方误差,从而通过从所述增益码本选择使基于所述第一平方误差和所述第二平方误差的评价函数最小的增益,来求出第二码串的增益信息。
15.如权利要求11或13所述的代码转换装置,其特征在于,所述修正最佳增益是基于所述最佳增益的长时间平均的增益。
16.如权利要求12或14所述的代码转换装置,其特征在于,所述修正解码增益是基于所述解码增益的长时间平均的增益。
17.如权利要求10所述的代码转换装置,其特征在于,所述最佳增益计算电路将使第二语音信息和所述第一语音信息之间的距离最小的增益作为最佳增益输出,其中所述第二语音信息是根据从第二码串得到的信息而生成的。
18.如权利要求12至17中任一项所述的代码转换装置,其特征在于,所述评价函数由所述第一平方误差、所述第二平方误差和权重系数构成。
19.如权利要求11或12所述的代码转换装置,其特征在于,
具有语音/非语音识别电路,该电路基于所述第一线性预测系数来输出识别语音区间/非语音区间的语音判别值;
当所述语音判别值表示非语音区间时,所述增益编码电路使用使所述第二码串的增益的时间变动变小的评价函数来求出所述第二码串中的增益信息。
20.如权利要求13或14所述的代码转换装置,其特征在于,
具有语音/非语音识别电路,该电路基于所述第一线性预测系数来输出识别语音区间/非语音区间的语音判别值;
所述增益编码电路通过使用权重系数对所述第一平方误差和所述第二平方误差进行加权平均来求出所述评价函数,此时,基于所述语音判别值并对应语音区间和非语音区间来分别将所述权重系数设定为预定的值,从而计算所述评价函数。
21.一种计算机程序产品,将下述程序包含在可通过计算机利用的介质中,所述程序用于使构成将根据第一方法的第一码串转换为根据第二方法的第二码串的代码转换装置的计算机执行下述处理:
(a)从所述第一码串得到第一线性预测系数和激励信号的信息,并使用从所述激励信号的信息得到的激励信号驱动具有所述第一线性预测系数的滤波器,从而生成第一语音信号;
(b)基于根据从第二码串得到的信息而生成的第二语音信号和所述第一语音信号来计算最佳增益;
(c)修正所述最佳增益;
(d)基于修正后的最佳增益(称为“修正最佳增益”)、所述最佳增益和从第二方法的增益码本中读取的增益来求出第二码串中的增益信息。
22.一种计算机程序产品,将下述程序包含在可通过计算机利用的介质中,所述程序用于使构成将根据第一方法的第一码串转换为根据第二方法的第二码串的代码转换装置的计算机执行下述处理:
(a)从所述第一码串解码增益信息;
(b)修正解码后的增益(称为“解码增益”);
(c)基于修正后的解码增益(称为“修正解码增益”)、所述解码增益和从第二方法的增益码本中读取的增益来求出第二码串中的增益信息。
23.如权利要求21所述的计算机程序产品,其特征在于,
包含用于使所述计算机执行下述处理的程序:从所述修正最佳增益和从所述增益码本中读取的增益计算第一平方误差,从所述最佳增益和从所述增益码本中读取的增益计算第二平方误差,从而通过从所述增益码本选择使基于所述第一平方误差和所述第二平方误差的评价函数最小的增益,来求出第二码串的增益信息。
24.如权利要求22所述的计算机程序产品,其特征在于,
包含用于使所述计算机执行下述处理的程序:从所述修正解码增益和从所述增益码本中读取的增益计算第一平方误差,从所述解码增益和从所述增益码本中读取的增益计算第二平方误差,从而通过从所述增益码本选择使基于所述第一平方误差和所述第二平方误差的评价函数最小的增益,来求出第二码串的增益信息。
25.如权利要求21或23所述的计算机程序产品,其特征在于,
所述修正最佳增益是基于所述最佳增益的长时间平均的增益。
26.如权利要求22或24所述的计算机程序产品,其特征在于,
所述修正解码增益是基于所述解码增益的长时间平均的增益。
27.如权利要求22至26中任一项所述的计算机程序产品,其特征在于,包含用于使所述计算机执行下述处理的程序:将使第二语音信息和所述第一语音信息之间的距离最小的增益作为最佳增益求出,其中所述第二语音信息是根据从第二码串得到的信息而生成的。
28.如权利要求21至26中任一项所述的计算机程序产品,其特征在于,所述评价函数由所述第一平方误差、所述第二平方误差和权重系数构成。
29.如权利要求21或22所述的计算机程序产品,其特征在于,包含用于使所述计算机执行下述处理的程序:
基于所述第一线性预测系数来确定识别语音区间/非语音区间的语音判别值;
当所述语音判别值表示非语音区间时,使用使所述第二码串的增益的时间变动变小的评价函数来求出所述第二码串中的增益信息。
30.如权利要求23或24所述的计算机程序产品,其特征在于,包含用于使所述计算机执行下述处理的程序:
基于所述第一线性预测系数来确定识别语音区间/非语音区间的语音判别值;
所述评价函数是通过使用权重系数对所述第一平方误差和所述第二平方误差进行加权平均来求出的,基于所述语音判别值并对应语音区间和非语音区间来分别将所述权重系数设定为预定的值,从而计算所述评价函数。
31.一种计算机可读的记录介质,记录有权利要求21至30中任一项所述的所述程序。
32.一种代码转换装置,将以第一方法对语音信号编码后的代码进行复用而成的码串数据输入到代码分离电路中,从而基于由所述代码分离电路分离后的代码,转换成依据与所述第一方法不同的第二方法的代码,并将该转换后的代码提供给代码复用电路,从而从所述代码复用电路输出将所述转换后的代码进行复用而成的码串数据,其特征在于,
具有:
基于由所述代码分离电路分离的线性预测系数码,生成使用第一方法和第二方法解码而成的第一、第二线性预测系数的电路;
自适应码本码转换电路(称为“ACB码转换电路”),包括下述装置,该装置使用第一方法的代码和第二方法的代码之间的对应关系来对从所述代码分离电路输入的第一方法的自适应码本(ACB)码进行变换,从而得到第二方法的ACB码,并将其输出给所述代码复用电路,并将与所述第二ACB码对应的ACB延迟作为第二ACB延迟输出给目标信号计算电路;
语音解码电路,将包含有由所述代码分离电路分离的第一方法的ACB码、固定码本(FCB)码及增益码的激励信号信息作为输入接收并分别解码,使用从所述激励信号信息得到的激励信号驱动具有第一线性预测系数的合成滤波器,从而合成并输出解码语音信号,其中所述第一线性预测系数是基于由所述代码分离电路分离的线性预测系数码以第一方法解码而成的;
固定码本码生成电路(称为“FCB码生成电路”),输入由所述代码分离电路输出的第一方法的FCB码,并将所述FCB码转换为可使用第二方法进行解码的代码,并将所述转换后的代码作为第二FCB码输出给所述代码复用电路,并输出与所述第二FCB码对应的第二FCB信号;
脉冲响应计算电路,输出由所述第一线性预测系数和所述第二线性预测系数构成的听感加权合成滤波器的脉冲响应信号;
所述目标信号计算电路;
增益码生成电路;
其中,所述目标信号计算电路具有:
加权信号计算电路,输入由所述语音解码电路的合成滤波器输出的解码语音,并利用所述解码语音驱动使用所述第一线性预测系数构成的听感加权滤波器,从而生成听感加权语音信号,并且生成第一目标信号,所述第一目标信号是通过从所述听感加权语音信号中减去使用所述第一及第二线性预测系数构成的听感加权合成滤波器的零输入响应而得到的;
ACB信号生成电路,输入由所述加权信号计算电路输出的所述第一目标信号、由所述ACB码转换电路输出的所述ACB延迟、由所述脉冲响应计算电路输出的所述脉冲响应信号、以及由存储保持过去的第二激励信号的第二激励信号存储电路输出的过去的第二激励信号,并且通过以延迟k(k是所述第二ACB延迟)从所述过去的第二激励信号截出的信号和所述脉冲响应信号之间的卷积,来计算滤波器处理后的延迟k的过去的激励信号,并将其作为第二ACB信号输出;
最佳ACB增益计算电路,输入由所述加权信号计算电路输出的所述第一目标信号、和由所述ACB信号生成电路输出的所述滤波器处理后的延迟k的过去的激励信号,从而从所述第一目标信号和所述滤波器处理后的延迟k的过去的激励信号导出并输出最佳ACB增益;
所述增益码生成电路
输入由所述目标信号计算电路输出的所述第一目标信号、所述第二ACB信号、所述最佳ACB增益、由所述FCB码生成电路输出的所述第二FCB信号、由所述脉冲响应计算电路输出的所述脉冲响应信号、以及所述第一线性预测系数;
并且具有:
从所述第一目标信号、所述第二ACB信号、所述最佳ACB增益和所述脉冲响应信号计算第二目标信号,并从所述第二目标信号、所述第二FCB信号和所述脉冲响应信号计算最佳FCB增益的装置;
从所述最佳ACB增益求出修正ACB增益的装置;
输入所述算出的最佳FCB增益,并从所述最佳FCB增益计算修正FCB增益的装置;
从所述第一线性预测系数确定语音判定值的装置;
从依次从ACB增益码本读取的ACB增益和所述最佳ACB增益计算第一平方误差,并从所述ACB增益和所述修正ACB增益计算第二平方误差的装置;
选择使第一评价函数最小的ACB增益及所对应的ACB增益码的装置,其中所述第一评价函数是从根据所述语音判定值算出的权重系数、所述第一平方误差和所述第二平方误差计算的;
从依次从FCB增益码本读取的FCB增益和所述最佳FCB增益计算第三平方误差,并从所述FCB增益和所述修正FCB增益计算第四平方误差的装置;
选择使第二评价函数最小的FCB增益及所对应的FCB增益码的装置,其中所述第二评价函数是从根据语音判定值算出的权重系数、第三平方误差和第四平方误差计算的;以及
将由所选择的ACB增益码和FCB增益码组成的第二增益码作为可使用第二方法中的增益解码方法进行解码的代码输出给所述代码复用电路的装置。
33.如权利要求32所述的代码转换装置,其特征在于,具有第二激励信号计算电路,该电路输入由目标信号计算电路输出的第二ACB信号、由所述FCB码生成电路输出的第二FCB信号、由所述增益码生成电路输出的第二ACB增益和第二FCB增益,并将所述第二ACB信号乘上第二ACB增益所得的信号和所述第二FCB信号乘上第二FCB增益所得的信号相加,从而得到第二激励信号,并且将所述第二激励信号输出给所述第二激励信号存储电路;
所述第二激励信号存储电路输入由所述第二激励信号计算电路输出的第二激励信号,并将其存储保持,并且,将在过去输入并存储保持的第二激励信号输出给所述目标信号计算电路。
34.如权利要求32所述的代码转换装置,其特征在于,
所述增益码生成电路具有:
第二目标信号计算电路,输入由所述ACB信号生成电路输出的所述第二ACB信号、由所述加权信号计算电路输出的所述第一目标信号、由所述脉冲响应计算电路输出的所述脉冲响应信号、以及由所述ACB增益编码电路输出的所述第二ACB增益,并通过所述第二ACB信号和所述脉冲响应信号的卷积来计算滤波器处理后的第二ACB信号,并从所述第一目标信号中减去在滤波器处理后的第二ACB信号乘上第二ACB增益而得的信号,从而导出第二目标信号,并输出所述第二目标信号;
最佳FCB增益计算电路,输入由所述FCB信号生成电路输出的所述第二FCB信号、由所述脉冲响应计算电路输出的所述脉冲响应信号、以及由所述第二目标信号计算电路输出的所述第二目标信号,通过所述第二FCB信号和脉冲响应信号的卷积来计算滤波器处理后的第二FCB信号,并计算使所述第二目标信号和所述第二FCB信号之间的距离最小的最佳FCB增益;
语音/非语音识别电路,从所述第一线性预测系数和其长时间平均算出线性预测系数的变动量,并确定语音判定值;
最佳ACB增益修正电路,输入由所述ACB信号生成电路输出的所述最佳ACB增益、和由语音/非语音识别电路输出的所述语音判定值,并且当所述语音判定值表示非语音区间时,将所述最佳ACB增益的长时间平均作为修正ACB增益,从而在非语音区间中计算所述最佳ACB增益的长时间平均,当所述语音判定值表示语音区间时,将所述最佳ACB增益本身作为修正ACB增益输出;
ACB码增益编码电路,输入由所述ACB信号生成电路输出的所述最佳ACB增益、由所述最佳ACB增益修正电路输出的所述修正ACB增益、以及由所述语音/非语音识别电路输出的所述语音判定值,并从依次从所述ACB增益码本读取的ACB增益、和所述最佳ACB增益计算第一平方误差,从所述ACB增益和所述修正ACB增益计算第二平方误差,从根据所述语音判定值算出的权重系数、所述第一平方误差和所述第二平方误差算出评价函数,并选择使所述评价函数最小的ACB增益,从而将所选择的ACB增益作为第二ACB增益输出给所述第二目标信号计算电路,同时输出给所述第二激励信号计算电路,将与所述第二ACB增益对应的代码作为ACB增益码输出给增益码复用电路;
最佳FCB增益修正电路,输入由所述最佳FCB增益计算电路输出的所述最佳FCB增益、和由所述语音/非语音识别电路输出的所述语音判定值,并且当所述语音判定值表示非语音区间时,将所述最佳FCB增益的长时间平均作为修正FCB增益,当所述语音判定值表示语音区间时,将最佳FCB增益本身作为修正FCB增益,并将所述修正FCB增益输出给FCB增益编码电路;
FCB增益编码电路,输入由所述最佳FCB增益计算电路输出的所述最佳FCB增益、由所述最佳FCB增益修正电路输出的所述修正FCB增益、以及由所述语音/非语音识别电路输出的所述语音判定值,并且从依次从所述FCB增益码本读取的FCB增益、和所述最佳FCB增益计算第三平方误差,从所述FCB增益和所述修正FCB增益计算第四平方误差,从根据所述语音判定值算出的权重系数、所述第三平方误差和第四平方误差计算评价函数,选择使所述评价函数最小的FCB增益,并将所选择的所述FCB增益作为第二FCB增益输出给所述第二激励信号计算电路,将与第二FCB增益对应的代码作为FCB增益码输出给增益码复用电路;
增益码复用电路,输入由所述ACB增益编码电路输出的ACB增益码、和由所述FCB增益编码电路输出的FCB增益码,并将ACB增益码和FCB增益码进行复用而得的第二增益码作为可使用第二方法中的增益解码方法进行解码的代码输出给所述代码复用电路。
35.一种代码转换装置,将以第一方法对语音信号编码后的代码进行复用而成的码串数据输入到代码分离电路中,从而基于由所述代码分离电路分离的代码,转换成根据与所述第一方法不同的第二方法的代码,并将该转换后的代码提供给代码复用电路,从而从所述代码复用电路输出将所述转换后的代码进行复用而成的码串数据,其中,
具有:
基于由所述代码分离电路分离的线性预测系数码,生成以第一方法和第二方法解码而成的第一、第二线性预测系数的电路;
ACB码转换电路,输入由所述代码分离电路输出的第一ACB码,从而将所述第一ACB码转换为可使用第二方法解码的代码,并将转换后的ACB码作为第二ACB码输出给所述代码复用电路;
FCB码转换电路,输入由所述代码分离电路输出的第一FCB码,从而将所述第一FCB码转换为可使用第二方法解码的代码,并将转换后的FCB码作为第二FCB码输出给所述代码复用电路;以及
增益码转换电路,输入由所述代码分离电路输出的第一增益码,从而将所述第一增益码转换为可使用第二方法解码的代码,并将转换后的增益码作为第二增益码输出给所述代码复用电路;
所述增益码转换电路具有:
输入由所述代码分离电路输出的第一增益码、和所述第一线性预测系数,从而从使用第一方法中的增益解码方法将所述第一增益码解码而得的第一自适应码本(ACB)增益及第一固定码本(FCB)增益算出修正ACB增益及修正FCB增益的装置;
从所述第一线性预测系数确定语音判定值的装置;
从依次从ACB增益码本读取的ACB增益、和所述第一ACB增益算出第一平方误差,并从所述ACB增益和所述修正ACB增益算出第二平方误差,选择使第一评价函数最小的ACB增益及所对应的ACB增益码的装置,其中所述第一评价函数是从根据所述语音判定值算出的权重系数、所述第一平方误差和所述第二平方误差算出的;
从依次从FCB增益码本读取的FCB增益、和所述第一FCB增益算出第三平方误差,并从FCB增益和所述修正FCB增益算出第四平方误差,选择使第二评价函数最小的FCB增益及所对应的FCB增益码的装置,其中所述第二评价函数是从根据所述语音判定值算出的权重系数、所述第三平方误差和所述第四平方误差算出的;以及
将由所选择的所述ACB增益码和所述FCB增益码组成的第二增益码作为可使用第二方法中的增益解码方法解码的代码输出给代码复用电路的装置。
36.如权利要求35所述的代码转换装置,其特征在于,
所述增益码转换电路具有:
语音/非语音识别电路,从所述第一线性预测系数和其长时间平均计算线性预测系数的变动量,并确定语音判定值;
增益码分离电路,输入由所述代码分离电路输出的第一增益码,并从第一增益码分离出与ACB增益及FCB增益对应的第一ACB增益码及第一FCB增益码,从而向ACB增益解码电路输出第一ACB增益码,向FCB增益解码电路输出第一FCB增益码;
ACB增益解码电路,具有存储了多组ACB增益的ACB增益码本,并输入由所述增益码分离电路输出的第一ACB增益码,从而从第一ACB增益码本读取与所述第一ACB增益码对应的ACB增益,并将读取的ACB增益作为第一ACB增益输出给ACB增益修正电路,同时输出给ACB增益编码电路,从ACB增益码的ACB增益的解码利用第一方法中的ACB增益的解码方法,并使用第一方法的ACB增益码本;
FCB增益解码电路,具有存储了多组FCB增益的FCB增益码本,并输入由所述增益码分离电路输出的第一FCB增益码,从而从第一FCB增益码本读取与所述第一FCB增益码对应的FCB增益,并将读取的FCB增益作为第一FCB增益输出给FCB增益修正电路,同时输出给FCB增益编码电路,从FCB增益码的FCB增益的解码利用第一方法中的FCB增益的解码方法,并使用第一方法的FCB增益码本;
ACB增益修正电路,输入由所述ACB增益解码电路输出的所述第一ACB增益、和由所述语音/非语音识别电路输出的所述语音判定值,并且当所述语音判定值表示非语音区间时,将所述第一ACB增益的长时间平均作为修正ACB增益,当所述语音判定值表示语音区间时,将所述第一ACB增益本身作为修正ACB增益,并将所述修正ACB增益输出给ACB增益编码电路;
FCB增益修正电路,输入由所述FCB增益解码电路输出的所述第一FCB增益、和由所述语音/非语音识别电路输出的所述语音判定值,并且当语音判定值表示非语音区间时,将所述第一FCB增益的长时间平均作为修正FCB增益,当所述语音判定值显示语音区间时,将所述第一FCB增益本身作为修正FCB增益,并将所述修正FCB增益输出给FCB增益编码电路;
ACB增益编码电路,输入由所述ACB增益解码电路输出的所述第一ACB增益、由所述ACB增益修正电路输出的所述修正ACB增益、以及由所述语音/非语音识别电路输出的语音判定值,并从依次从所述ACB增益码本读取的ACB增益、和第一ACB增益计算第一平方误差,从所述ACB增益和所述修正ACB增益计算第二平方误差,从根据所述语音判定值算出的权重系数、所述第一平方误差和所述第二平方误差计算第一评价函数,选择使所述第一评价函数最小的ACB增益,并将所选择的所述ACB增益作为第二ACB增益,将与所述第二ACB增益对应的代码作为第二ACB增益码输出给增益码复用电路;
FCB增益编码电路,输入由所述FCB增益解码电路输出的所述第一FCB增益、由所述FCB增益修正电路输出的所述修正FCB增益、以及由所述语音/非语音识别电路输出的所述语音判定值,并从依次从FCB增益码本读取的FCB增益、和所述第一FCB增益计算第三平方误差,从所述FCB增益和所述修正FCB增益计算第四平方误差,从根据所述语音判定值算出的权重系数、所述第三平方误差和所述第四平方误差计算第二评价函数,选择使所述第二评价函数最小的FCB增益,并将所选择的所述FCB增益作为第二FCB增益,将与第二FCB增益对应的代码作为第二FCB增益码输出给增益码复用电路;
增益码复用电路,输入由所述ACB增益编码电路输出的ACB增益码和由所述FCB增益编码电路输出的FCB增益码,并将ACB增益码和FCB增益码进行复用而得的第二增益码作为可使用第二方法中的增益解码方法解码的代码输出给所述代码复用电路。
CNB038176750A 2002-07-24 2003-07-09 语音编解码方法之间的代码转换方法及装置 Expired - Fee Related CN1327410C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP215766/2002 2002-07-24
JP2002215766A JP4238535B2 (ja) 2002-07-24 2002-07-24 音声符号化復号方式間の符号変換方法及び装置とその記憶媒体

Publications (2)

Publication Number Publication Date
CN1672192A true CN1672192A (zh) 2005-09-21
CN1327410C CN1327410C (zh) 2007-07-18

Family

ID=30767940

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB038176750A Expired - Fee Related CN1327410C (zh) 2002-07-24 2003-07-09 语音编解码方法之间的代码转换方法及装置

Country Status (3)

Country Link
JP (1) JP4238535B2 (zh)
CN (1) CN1327410C (zh)
WO (1) WO2004010416A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101553870B (zh) * 2006-11-02 2012-07-18 弗劳恩霍夫应用研究促进协会 后处理谱值的设备和方法及音频信号的编码器和解码器
CN106663442A (zh) * 2014-07-28 2017-05-10 弗劳恩霍夫应用研究促进协会 使用零输入响应以获得平滑过渡的音频解码器、方法及计算机程序

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2867648A1 (fr) * 2003-12-10 2005-09-16 France Telecom Transcodage entre indices de dictionnaires multi-impulsionnels utilises en codage en compression de signaux numeriques

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08146997A (ja) * 1994-11-21 1996-06-07 Hitachi Ltd 符号変換装置および符号変換システム
JP3331297B2 (ja) * 1997-01-23 2002-10-07 株式会社東芝 背景音/音声分類方法及び装置並びに音声符号化方法及び装置
JP2002198870A (ja) * 2000-12-27 2002-07-12 Mitsubishi Electric Corp エコー処理装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101553870B (zh) * 2006-11-02 2012-07-18 弗劳恩霍夫应用研究促进协会 后处理谱值的设备和方法及音频信号的编码器和解码器
CN106663442A (zh) * 2014-07-28 2017-05-10 弗劳恩霍夫应用研究促进协会 使用零输入响应以获得平滑过渡的音频解码器、方法及计算机程序
US11170797B2 (en) 2014-07-28 2021-11-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio decoder, method and computer program using a zero-input-response to obtain a smooth transition
US11922961B2 (en) 2014-07-28 2024-03-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio decoder, method and computer program using a zero-input-response to obtain a smooth transition

Also Published As

Publication number Publication date
JP2004061558A (ja) 2004-02-26
JP4238535B2 (ja) 2009-03-18
WO2004010416A1 (ja) 2004-01-29
CN1327410C (zh) 2007-07-18

Similar Documents

Publication Publication Date Title
CN100346392C (zh) 编码设备、解码设备、编码方法和解码方法
CN1242380C (zh) 利用原型波形的周期性语音编码
CN1296888C (zh) 音频编码装置以及音频编码方法
CN1145142C (zh) 矢量量化方法和语音编码方法及其装置
CN1163870C (zh) 声音编码装置和方法,声音译码装置,以及声音译码方法
CN1205603C (zh) 在用于宽带信号编码的代数码本中索引脉冲位置和符号的方法和设备
CN1160703C (zh) 语音编码方法和装置以及声音信号编码方法和装置
CN1324556C (zh) 生成基音周期波形信号的装置和方法及处理语音信号的装置和方法
CN1178204C (zh) 声源矢量生成装置以及声音编码装置和声音解码装置
CN1229775C (zh) 宽带语音和音频信号解码器中的增益平滑
CN1331826A (zh) 可变速率语音编码
CN101067931A (zh) 一种高效可配置的频域参数立体声及多声道编解码方法与系统
CN1110486A (zh) 传输误差的隐蔽
CN1338096A (zh) 用于分析-合成celp型语音编码的自适应窗
CN1208288A (zh) 用于视听设备的信号处理及声象定位装置和方法
CN1898723A (zh) 信号解码装置以及信号解码方法
CN1639984A (zh) 数字信号编码方法、解码方法、编码设备、解码设备、数字信号编码程序和解码程序
CN1265355C (zh) 音源矢量生成装置及语音编码/解码装置
CN1669071A (zh) 用于在音频代码的编码/解码处理之间转换代码的方法和装置以及使用该方法和装置的存储介质
CN1702736A (zh) 生成基音周期波形信号的装置和方法及处理语音信号的装置和方法
CN1287354C (zh) 代码转换方法与设备
CN1890713A (zh) 用于数字信号压缩编码的多脉冲字典的索引间的编码转换
CN1471078A (zh) 字识别设备、字识别方法和字识别程序
CN1898724A (zh) 语音/乐音编码设备及语音/乐音编码方法
CN1216367C (zh) 数据处理装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20070718

Termination date: 20130709