CN105374362A - 编码方法、解码方法、编码装置、解码装置以及程序 - Google Patents

编码方法、解码方法、编码装置、解码装置以及程序 Download PDF

Info

Publication number
CN105374362A
CN105374362A CN201510673204.6A CN201510673204A CN105374362A CN 105374362 A CN105374362 A CN 105374362A CN 201510673204 A CN201510673204 A CN 201510673204A CN 105374362 A CN105374362 A CN 105374362A
Authority
CN
China
Prior art keywords
pitch period
code
time interval
subframe
gain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510673204.6A
Other languages
English (en)
Other versions
CN105374362B (zh
Inventor
守谷健弘
原田登
鎌本优
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Publication of CN105374362A publication Critical patent/CN105374362A/zh
Application granted granted Critical
Publication of CN105374362B publication Critical patent/CN105374362B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/09Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明涉及编码方法、解码方法、编码装置、解码装置以及程序。在编码处理中,算出与规定时间区间中包含的时序信号对应的基音周期,输出与基音周期对应的码,此时,在用于表示时序信号的周期性和/或稳态性的高度的指标满足用于表示周期性和/或稳态性高的条件的情况下,在第一搜索范围内搜索基音周期,在其他情况下,在比第一搜索范围窄的第二搜索范围内搜索基音周期。

Description

编码方法、解码方法、编码装置、解码装置以及程序
本发明是以下专利申请的分案申请:申请号:201180005221.2,申请日:2011年01月07日,发明名称:编码方法、解码方法、编码装置、解码装置、程序以及记录介质。
技术领域
本发明涉及编码技术,尤其涉及基音周期的编码技术。
背景技术
将语音信号或者声响信号等时序信号以低比特进行编码的以往方式之一有以下方式:求出编码对象的基音周期(pitchperiod)后进行编码(例如,参照非专利文献1)。以下,以在移动电话等中利用的CELP(Code-ExcitedLinearPrediction:码激励线性预测)方式为例,例示求出基音周期后进行编码的以往方式。
图1是用于说明以往的CELP方式的一例的方框图。
对编码装置91输入以作为规定的时间区间的帧为单位分割的语音信号或者声响信号等的时序信号x(n)(n=0、……、L-1,L是2以上的整数)。线性预测分析单元911进行属于当前帧的各时刻n=0、……L-1中的时序信号x(n)(n=0、……、L-1)的线性预测分析,并生成用于确定在该当前帧中的全极型的合成滤波器915的线性预测信息LPCinfo。例如,线性预测分析单元911算出当前帧的时序信号x(n)(n=0、……、L-1)中的线性预测系数α(m)(m=1、……、P,P是作为正整数的线性预测系数),并将线性预测系数α(m)(m=1、……、P)变换为线谱对系数(linespectrumpaircoefficients)LSP,并作为线性预测信息LPCinfo而输出线谱对系数LSP的量化值。
固定码本914按照检索单元913的控制,输出信号分量c(n)(n=0、……、L-1),所述信号分量c(n)(n=0、……、L-1)由具有由非零的单位脉冲与其正负的组合所组成的值的一个以上的信号、以及具有零值的一个以上的信号构成。此外,在自适应码本912中存储在过去的各个时刻生成的激励信号,自适应码本912输出利用根据在检索单元913中求出的基音周期T而延迟后的激励信号而获得的自适应信号分量v(n)(n=0、……、L-1)。与来自固定码本914的信号分量c(n)(n=0、……、L-1)、以及来自自适应码本192的自适应信号分量v(n)(n=0、……、L-1)对应的当前帧的激励信号可如下表现。
u(n)=gp·v(n)+gc·c(n)(n=0,...,L-1)…(1)
另外,gp是提供给自适应分量v(n)的基音增益,gc是提供给信号分量c(n)的固定码本增益。
检索单元913检索基音周期T、信号分量c(n)(n=0、……、L-1)、基音增益gp与固定码本增益gc,使得对将由线性预测信息LPCinfo确定的全极型的合成滤波器915应用于激励信号u(n)(n=0、……、L-1)而获得的合成信号x’(n)(n=0、……、L-1)、与输入的时序信号x(n)(n=0、……、L-1,将各个n称为采样点)之间的差,应用了听觉加权滤波器916的值成为最小。检索单元913输出激励参数,所述激励参数包含基音周期T、用于确定信号分量c(n)(n=0、……、L-1)的码索引Cf、基音增益gp、固定码本增益gc
这里,线性预测信息LPCinfo在每一帧被更新,基音周期T、码索引Cf、基音增益gp、固定码本增益gc在将一个帧进行分割后的每个子帧被更新。如果每一个帧的子帧数目是一个,则虽然激励参数等信息量少,但是无法跟随时序信号x(n)(n=0、……、L-1)的时间变化,因此编码失真较大。如果每一个帧的子帧数目多,则起到相反的效果,但即使过多,质量的改善也会饱和,只会导致信息量增多。以下,表示将一个帧等分为4个子帧的例子。此外,将通过从帧的开头起数的第1、2、3、4个的各子帧(称为第1、2、3、4子帧)求出的码索引Cf分别表示为Cf1、Cf2、Cf3、Cf4。此外,将通过第1、2、3、4子帧求出的基音增益gp分别表示为gp1、gp2、gp3、gp4,将固定码本增益gc分别表示为gc1、gc2、gc3、gc4,将基音增益与固定码本增益总称为激励增益。此外,将通过第1、2、3、4子帧求出的基音周期T分别表示为T1、T2、T3、T4。此外,基音周期T不仅有仅通过采样点n的间隔的整数倍来表现的情况(整数精度),有时还利用采样点n的间隔的整数倍与小数值(分数值)来表现(小数精度)。例如,当以通过两个比特来表现小数值的小数精度表现周期T时,通过Tint-1/4、Tint、Tint+1/4、Tint+1/2(Tint是整数)这四种来表现基音周期T。此外,当利用小数精度的基音周期T来表现自适应信号分量v(n)时,使用插补滤波器,所述插补滤波器对根据基音周期T而延迟的多个激励信号进行加权平均操作。
基音周期T、码索引Cf、基音增益gp、以及固定码本增益gc等的激励参数被输入到参数编码单元917,参数编码单元917生成并输出与这些对应的码即比特流BS。有时通过用于对基音增益与固定码本增益的对选择最佳的码的矢量量化,对基音增益gp与固定码本增益gc进行编码。
图2A是用于例示使用小数精度的基音周期T时的比特流BS的结构的图,图2B是用于说明与小数精度的基音周期T对应的码的图。图3是说明用于表现基音周期T的精度(周期精度)的图。
如图2A以及图2B所示,在使用小数精度的基音周期T时,生成与各基音周期T=T1、T2、T3、T4的整数部与小数部对应的码。在图2A以及图2B的例子,在第1、第3子帧中,分别分配9个比特用于基音周期,且第1、第3子帧的基音周期T1、T3的值(从基音周期的最低值的差分)通过不依赖于其他的子帧的基音周期的编码方式分别独立地被编码(基音周期部)。将如上那样某子帧的基音周期通过不依赖于其他的子帧的基音周期的编码方式被独立编码的情况称为“对每个子帧单独”编码。一般,基音周期T越短,利用越小数精度表现较理想。在图3的例子中,当基音周期T的整数部是最小值Tmin以上且比TA小时,通过以两个比特来表现小数值的小数精度表现基音周期T(4倍小数精度),当基音周期T的整数部为从TA至TB时,通过以一个比特来表现小数值的小数精度表现基音周期T(2倍小数精度),当基音周期T的整数部为从TB至最大值Tmax时,仅通过采样点n的间隔的整数倍来表现基音周期T(整数精度)。
另一方面,在第2、第4子帧(图2A以及B)中,分别通过四个比特对第2、第4子帧的基音周期T2、T4的整数部分别与第1、第3子帧的基音周期T1、T3的整数部之间的差分值进行编码(差分整数部),且与差分整数部的值无关地分别通过两个比特对基音周期T2、T4的小数点以下的值(小数部)进行编码而(4倍小数精度)。另外,基音周期T2、T4是在能够将其各自的整数部与基音周期T1、T3各自的整数部的差分值通过四个比特进行编码的范围内检索的值。即,基音周期T2、T4是在其各自的整数部成为从基音周期T1、T3的整数部的值-8至基音周期T1、T3的整数部的值+7的范围的范围内检索的值。
从编码装置91(图1)的参数编码单元917输出的比特流BS被输入到解码装置92的参数解码单元927。参数解码单元927对比特流BS进行解码,并输出据此获得的码索引Cf=Cf1、Cf2、Cf3、Cf4、基音增益gp’=gp1’、gp2’、gp3’、gp4’、固定码本增益gc’=gc1’、gc2’、gc3’、gc4’、基音周期T’=T1’、T2’、T3’、T4’以及线性预测信息LPCinfo。
固定码本924输出通过码索引Cf来确定的信号分量c’(n)(n=0、……、L-1),自适应码本922输出通过基音周期T’确定的自适应信号分量v’(n)(n=0、……、L-1)。然后,将对信号分量c’(n)(n=0、……、L-1)乘以固定码本增益gc’的值与对自适应信号分量v’(n)(n=0、……、L-1)乘以基音增益gp’的值之和即激励信号u’(n)(n=0、……、L-1)追加到自适应码本922。此外,对激励信号u’(n)(n=0、……、L-1)应用通过线性预测信息LPCinfo确定的全极型的合成滤波器925,输出据此生成的合成信号x’(n)(n=0、……、L-1)。
现有技术文献
非专利文献
非专利文献1:3rdGenerationPartnershipProject(3GPP),TechnicalSpecification(TS)26.090,“AMRspeechcodec;Transcodingfunctions”,Version4.0.0(2001-03)
发明内容
发明要解决的课题
在以往的CELP方式中,分配固定比特用于在各子帧的基音周期的编码而进行编码。这样的情况并不限定于CELP方式,求出编码对象的基音周期后进行编码的其他的现有方式也一样。
在本发明中,通过对基音周期的编码方法下功夫从而提高压缩效率。
用于解决课题的方法
在本发明的编码处理中,算出与规定时间区间中包含的时序信号对应的基音周期,并输出与基音周期对应的码。此时,根据用于表示时序信号的周期性和/或稳态性的高低的指标是否满足用于表示周期性和/或稳态性高的条件、或者用于表示周期性和/或稳态性低的条件,切换用于表现基音周期的精度和/或基音周期的编码方式。
在与此相对的解码处理中,输入与规定时间区间对应的码,根据码中包含的或者从码获得的用于表示周期性和/或稳态性的高低的指标是否满足用于表示周期性和/或稳态性高的条件、或者用于表示周期性和/或稳态性低的条件,切换在码中包含的与基音周期对应的码的解码方式,对与基音周期对应的码进行解码,从而获得与规定时间区间对应的基音周期。
发明效果
在本发明中,在求出编码对象的基音周期后进行编码的方式中,根据时序信号的周期性和稳态性,切换用于表现基音周期的精度和/或基音周期的编码方式,因此能够提高基音周期的压缩效率。
附图说明
图1是用于说明以往的CELP方式的一例的方框图。
图2A是用于例示在利用小数精度的基音周期T时的比特流BS的结构的图。图2B是用于说明与小数精度的基音周期T对应的码的图。
图3是用于说明基音周期的小数部的编码方法的图。
图4是用于说明实施方式的编码装置以及解码装置的方框图。
图5是用于说明实施方式的参数编码单元的方框图。
图6是用于说明实施方式的参数解码单元的方框图。
图7A是用于说明实施方式的编码方法的流程图。图7B是用于说明实施方式的解码方法的流程图。
图8A以及图8B是用于说明与基音周期对应的码的结构例的图。
图9A是用于说明与基音周期对应的码的结构例的图。图9B是用于说明与第2以及第4子帧的基音周期的整数部对应的可变长度码的图。
图10A是用于例示在时序信号是稳态(周期性)时的、第3实施方式中的基音周期的编码方法的图。图10B以及图10C是用于例示第3子帧的基音周期的码X3的图。
图11是例示了帧与超帧之间关系的图。
图12A以及B是用于例示在时序信号是稳态(周期性)时的、第4实施方式中的基音周期的编码方法的图。
图13是用于说明第5实施方式的编码方法的流程图。
图14是用于说明第5实施方式的解码方法的流程图。
图15A是用于说明基音周期的编码方法的变形例的图。图15B是用于说明与第2以及第4子帧的基音周期的整数部对应的可变长度码的图。
图16A~图16C是用于说明基音周期的编码方法的变形例的图。
图17A是用于说明基音周期的编码方法的变形例的图。图17B是用于说明与第2以及第4子帧的基音周期的整数部对应的可变长度码的图。
具体实施方式
以下,参照附图说明本发明的实施方式。另外,虽然本发明能够应用于求出编码对象的基音周期后进行编码的全部方式,但以下举例说明对CELP方式应用本发明的情况。此外,以下表示将一个帧等分成四个子帧的例子,但这并不限定本发明。此外,以下着重说明与已经说明的事项之间的不同点,对于已经说明的事项省略重复说明。
[第1实施方式]
首先,说明本发明的第1实施方式。
在时序信号x(n)(n=0、……、L-1)的稳态性低的(称为“非稳态”)帧,时序信号x(n)(n=0、……、L-1)的周期性也低(称为“非周期性”),周期性分量在码整体所占的贡献较少。因此,即使降低用于表现基音周期T的精度、编码频度(进行编码的帧的频度),编码质量(解码后的合成信号相对于编码前的时序信号的质量)并不那么下降。因此,在第1实施方式中,在非稳态(非周期性)的帧中,降低用于表现基音周期T的精度、编码频度。由此,减少每个帧的平均码量。其结果,例如,能够降低平均比特率,或者能够通过将能够节省的信息例如分配给来自固定码本的信号分量的码的码长度的增加而提高质量。
<结构>
图4是用于说明实施方式的编码装置以及解码装置的方框图。图5是用于说明实施方式的参数编码单元的方框图。此外,图6是用于说明实施方式的参数解码单元的方框图。
如图4至图6例示那样,第1实施方式的编码装置11与以往的编码装置91的不同点在于,参数编码单元917被置换为参数编码单元117。此外,第1实施方式的解码装置12与以往的解码装置92的不同点在于,参数解码单元927被置换为参数解码单元127。
如图5例示那样,本方式的参数编码单元117具有增益量化单元117a、判定单元117b、开关单元117c、117f、基音周期编码单元117d、117e、以及合成单元117g。此外,如图6例示那样,本方式的参数解码单元127具有判定单元127b、开关单元127c、127f、增益周期解码单元127d、127e、以及分离单元127g。
另外,本方式的编码装置11以及解码装置12是通过对例如具有CPU(中央处理单元)、RAM(随机存取存储器)、ROM(只读存储器)等的公知的计算机或者专用的计算机读入程序和数据而构成的特别的装置。此外,编码装置11以及解码装置12的处理单元的至少一部分也可以由集成电路等的硬件来构成。
<编码方法>
图7A是用于说明实施方式的编码方法的流程图。以下,着重说明与现有技术之间的不同点。
线性预测分析单元911对当前帧生成的线性预测信息LPCinfo、检索单元913对属于当前帧的第1~第4子帧生成的码索引Cf=Cf1、Cf2、Cf3、Cf4、基音增益gp=gp1、gp2、gp3、gp4、固定码本增益gc=gc1、gc2、gc3、gc4、基音周期T=T1、T2、T3、T4被输入到参数编码单元117(图5)。
参数编码单元117的增益量化单元117a对基音增益gp=gp1、gp2、gp3、gp4以及固定码本增益gc=gc1、gc2、gc3、gc4进行量化,并输出用于确定量化后的基音增益gp’=gp1’、gp2’、gp3’、gp4’的索引等的码以及用于确定量化后的固定码本增益gc’=gc1’、gc2’、gc3’、gc4’的索引等的码。
另外,基音增益gp=gp1、gp2、gp3、gp4与固定码本增益gc=gc1、gc2、gc3、gc4可以单独被量化,但也可以对基音增益与固定码本增益的组合进行矢量量化。当对基音增益与固定码本增益的组合进行矢量量化时,基音增益的量化值(已量化基音增益)与固定码本增益的量化值(已量化固定码本增益)的组合与索引等的码相关联。将通过这样的矢量量化获得的量化后的基音增益与量化后的固定码本增益的组称为“已量化增益矢量”,将通过矢量量化获得的码称为“已矢量量化增益码(VQ增益码)”。在这样的矢量量化中,例如可以对对应于相同的子帧的基音增益的量化值与固定码本增益的量化值的每个组合相关联一个VQ增益码,也可以对对应于多个子帧的每个子帧的基音增益的量化值与固定码本增益的量化值的每个组合相关联一个VQ增益码,也可以对对应于相同的帧的基音增益的量化值与固定码本增益的量化值的每个组合相关联一个VQ增益码。
在这样的矢量量化中,例如使用用于确定对应于基音增益的量化值与固定码本增益的量化值的组合的VQ增益码的表格(二维码本)。二维码本的例子是对基音增益的量化值以及固定码本增益的量化值的组合相关联VQ增益码的表格。二维码本的其他的例子是对基音增益的量化值以及固定码本增益对应值的量化值的组合相关联VQ增益码的表格。固定码本增益对应值的例子是用于表示以过去的子帧(或者帧)中的来自固定码本914的信号分量的能量为基础预测的当前的子帧(或者帧)中的固定码本增益的估计值、与当前的子帧(或者帧)中的固定码本增益之比的校正系数(correctionfactor)等。校正系数的例子是在参考文献1《ITU-TRecommendationG.729,“CodingofSpeechat8kbit/susingConjugate-StructureAlgebraic-Code-ExcitedLinear-Prediction(CS-ACELP)”》的“3.9Quantizationofthegains”的栏里记载的γ。例如,在子帧j=1、……、4中的固定码本增益gcj、矫正系数γ、子帧j=1、……、4中的固定码本增益的估计值pgcj之间成立以下的关系。
gcj=γ×pgcj
二维码本可以由一个表格构成,也可以如参考文献1的两级的共轭结构码本(two-stageconjugatestructuredcodebook)那样由多个表格构成。当二维码本由多个表格构成时,对应于基音增益的量化值与固定码本增益的量化值的组合的VQ增益码例如是对于基音增益的量化值与固定码本增益的量化值的组合,对构成该二维码本的每个表格决定的索引的组合等(步骤S111)。
接着,判定单元117b判定当前帧的时序信号x(n)(n=0、……、L-1)是否为稳态(步骤S112)。步骤S112的判定根据表示时序信号x(n)(n=0、……、L-1)的稳态性的高低的指标是否满足认为时序信号的稳态性高的条件来进行。以下,例示具体的判断方法。
[步骤S112的具体例1]
在步骤S112的具体例1中,作为用于表示时序信号x(n)(n=0、……、L-1)的稳态性的高低的指标,使用用于表示时序信号x(n)(n=0、……、L-1)的大小相对于对该时序信号x(n)(n=0、……、L-1)进行线性预测分析后获得的预测残差的大小的比的指标。此外,作为表示时序信号x(n)(n=0、……、L-1)的稳态性高的条件,使用用于表示该时序信号x(n)(n=0、……、L-1)的大小相对于对该时序信号x(n)(n=0、……、L-1)进行线性预测分析后获得的预测残差的大小的比的指标比规定值大这样的条件。这一点基于在稳态的帧中能够进行效果较佳的线性预测,因此预测残差变小,时序信号x(n)(n=0、……、L-1)的大小相对于预测残差的大小的比变大。
用于表示时序信号x(n)(n=0、……、L-1)的大小相对于对该时序信号x(n)(n=0、……、L-1)进行线性预测分析后获得的预测残差的大小的比的指标的例子是该时序信号x(n)(n=0、……、L-1)的能量相对于预测残差的能量的比即预测增益的估计值。
[数1]
E = 1 / &Pi; m = 1 P ( 1 - k m 2 ) ...... ( 2 )
其中,式(2)的km是根据线性预测信息LPCinfo确定的m次的PARCOR系数。此时,例如,对判定单元117b输入线性预测信息LPCinfo,判定单元117b判定根据线性预测信息LPCinfo求出的预测增益的估计值E是否比规定值大。然后,当预测增益的估计值E比估计值大时,判定为当前帧的时序信号x(n)(n=0、……、L-1)是稳态,反之,判定为当前帧的时序信号x(n)(n=0、……、L-1)不是稳态(非稳态)。
或者,代替预测增益的估计值E,也可以利用预测增益、或者时序信号x(n)(n=0、……、L-1)的绝对值相对于预测残差的绝对值的比、时序信号x(n)(n=0、……、L-1)的绝对值相对于预测残差的绝对值的比的估计值等进行判定。
另外,也可以通过判定是否满足指标>规定值,从而判定指标是否比规定值大,也可以通过判定是否满足指标≥(规定值+常数)来判定指标是否比规定值大。此时,可以作为处理上的阈值而设定规定值,也可以作为处理上的阈值而设定(规定值+常数)。对于在以后要说明的其他的“指标是否比规定值大”的判定也是一样的。
[步骤S112的具体例2]
在步骤S112的具体例2中,作为用于表示时序信号x(n)(n=0、……、L-1)的稳态性的高低的指标而使用量化后的基音增益。此外,作为用于表示时序信号x(n)(n=0、……、L-1)的稳态性高的情况的条件,使用量化后的基音增益比规定值大的条件。这一点基于在稳态的帧中,基音周期的周期性高,且基音增益大。
此时,例如,对判定单元117b输入量化后的基音增益gp’=gp1’、gp2’、gp3’、gp4’,判定单元117b判定量化后的基音增益gp’=gp1’、gp2’、gp3’、gp4’的平均值是否比规定值大。然后,当量化后的基音增益gp’=gp1’、gp2’、gp3’、gp4’的平均值比规定值大时,判定为当前帧的时序信号x(n)(n=0、……、L-1)是稳态,反之,判定为当前帧的时序信号x(n)(n=0、……、L-1)不是稳态(非稳态)。或者,代替量化后的基音增益gp’=gp1’、gp2’、gp3’、gp4’的平均值,也可以使用在一部分子帧中的量化后的基音增益的平均值(例如,gp1’和gp3’的平均值)、或者在任一个子帧中的量化后的基音增益(例如,gp1’)进行判定。如果利用了任一个子帧的量化后的基音增益的判定设为利用了在帧中包含的所有子帧的量化后的基音增益中值最小的基音增益的判定,则性能良好。或者,也可以在量化后的所有基音增益gp’=gp1’、gp2’、gp3’、gp4’均比规定值大时判定为稳态,在至少一部分量化后的基音增益gp’=gp1’、gp2’、gp3’、gp4’是规定值以下时判定为不是稳态(非稳态)。或者,也可以在规定数目以上的量化后的基音增益gp’=gp1’、gp2’、gp3’、gp4’比规定值大时判定为稳态,反之判定为不是稳态(非稳态)。
[步骤S112的具体例3]
在步骤S112的具体例3中,作为用于表示时序信号x(n)(n=0、……、L-1)的稳态性的高低的指标,利用对应于量化后的基音增益的值与对应于量化后的固定码本增益的值之间的比。以下,例示利用了该指标的判断基准。该判断基准基于以下情况:在稳态的帧中基音增益的周期性高,对应于基音增益的值相对于对应于固定码本增益的值之比较大。
判断基准:当对应于量化后的基音增益的值相对于对应于量化后的固定码本增益的值之比成为规定值以上、或者对应于量化后的固定码本增益的值相对于对应于量化后的基音增益的值之比成为规定值以下时,判断为时序信号x(n)(n=0、……、L-1)是稳态。对应于量化后的固定码本增益的值的例子是量化后的固定码本增益其本身、量化后的所述的校正系数(correctionfactor)等。对应于量化后的基音增益的值的例子是量化后的基音增益其本身、量化后的基音增益的平均值、量化后的基音增益的广义单调递增函数值等。
此时,例如,对判定单元117b输入对应于量化后的基音增益的值与对应于量化后的固定码本增益的值的组,判定单元117b基于上述的判断基准,判断时序信号x(n)(n=0、……、L-1)是否是稳态(周期性)的。例如,判定单元117b利用在任一个子帧(例如,开头的子帧)中的对应于量化后的基音增益的值与对应于量化后的固定码本增益的值的组,进行该判断,并判断时序信号x(n)(n=0、……、L-1)是否是稳态(周期性)的。或者,例如,判定单元117b也可以分别利用属于相同帧的多个子帧的对应于量化后的基音增益的值与对应于量化后的固定码本增益的值的组,分别进行基于上述的判断基准的判断,并基于这些结果而判断时序信号x(n)(n=0、……、L-1)是否是稳态(周期性)的。例如,也可以在利用了各子帧的对应于量化后的基音增益的值域对应于量化后的固定码本增益的值的组的判断结果全部表示稳态(周期性)时,判断为时序信号x(n)(n=0、……、L-1)是稳态(周期性)的。或者,也可以在利用了规定数目以上的子帧的对应于量化后的基音增益的值与对应于量化后的固定码本增益的值的组的判断结果表示稳态(周期性)时,判断为时序信号x(n)(n=0、……、L-1)是稳态(周期性)的。另外,例如在不满足上述的判断基准时,判断为时序信号x(n)(n=0、……、L-1)不是稳态(非稳态)。
[步骤S112的具体例4]
在步骤S112的具体例4中,作为用于表示时序信号x(n)(n=0、……、L-1)的稳态性的高低的指标而使用对应于量化后的基音增益的值与对应于量化后的固定码本增益的值,并将其各自与第1规定值以及第2规定值进行比较。
通常,在稳态的帧中,基音周期的周期性高且基音增益大。其中,在语音上升部分的帧,虽然来自前一帧的基音周期的周期性低且基音增益小,但在该帧中基音周期的周期性高。此外,在语音上升部分的帧中,利用前一阵而预测的当前帧的固定码本增益的估计值pgcj小。由于当前帧的量化后的固定码本增益gc’根据gc'=γgc^×pgcjgc^是量化后的校正系数)来决定,因此在语音上升部分的帧中γgc^(对应于量化后的固定码本增益的值)成为较大的值。因此,可以说“即使在对应于基音增益的值小的情况下,只要对应于量化后的固定码本增益的值是大的值,则该帧也是稳态的”。反而言之,可以说“在对应于基音增益的值小且对应于量化后的固定码本增益的值是小的值时,该帧不是稳态的”。以下,例示利用了这些指标的判断基准。
判断基准1:当对应于量化后的基音增益的值比第1规定值小而且对应于量化后的固定码本增益的值比第2规定值小的情况下,判断为时序信号x(n)(n=0、……、L-1)不是稳态(非稳态)的。
判断基准2:当对应于量化后的基音增益的值比第1规定值小而且对应于量化后的固定码本增益的值比第2规定值大的情况下,判断为时序信号x(n)(n=0、……、L-1)是稳态的。
对应于量化后的基音增益的值的例子是量化后的基音增益其本身、量化后的基音增益的平均值、量化后的基音增益的广义单调递增函数值等。量化后的基音增益的例子是非专利文献1的g^p(quantifiedadaptivecodebookgain)。对应于量化后的固定码本增益的值的例子是量化后的固定码本增益其本身、量化后的校正系数γgc^等。量化后的校正系数γgc^的例子是非专利文献1的γgc^(optimumvalueforγgc)。
此时,例如,对判定单元117b输入对应于量化后的基音增益的值与对应于量化后的固定码本增益的值的组,判定单元117b基于上述的判断基准1或2,判断时序信号x(n)(n=0、……、L-1)是否不是稳态(周期性)的(是否是稳态(周期性)的)。或者,例如判定单元117b分别利用属于相同帧的多个子帧的对应于量化后的基音增益的值与对应于量化后的固定码本增益的值的组,基于上述的判断基准1或者2进行判断,并基于它们的结果判断时序信号x(n)(n=0、……、L-1)是否不是稳态(周期性)的(是否是稳态(周期性)的)。例如,可以当利用各子帧的对应于量化后的基音增益的值与对应于量化后的固定码本增益的值的组的判断结果全部表示是稳态(周期性)时,判断时序信号x(n)(n=0、……、L-1)是稳态(周期性)。或者,在利用了规定数目以上的子帧的对应于量化后的基音增益的值与对应于量化后的固定码本增益的值的组的判断结果表示稳态(周期性)时,判断为时序信号x(n)(n=0、……、L-1)是稳态(周期性)的。此外,也可以对判断基准1或者2增加其他的条件,也可以进一步对判断基准增加实际的差分值。
[步骤S112的具体例5]
步骤S112的具体例5是一下的例子:在步骤S111中对基音增益与固定码本增益的组合进行矢量量化,对量化后的基音增益与量化后的固定码本增益的组合两关联VQ增益码。在该例子中,作为用于表示时序信号x(n)(n=0、……、L-1)的稳态性的高低的指标而使用VQ增益码。例如,作为指标而使用VQ增益码,并进行步骤S112的具体例2或者3或者4的判断。以下例示作为指标而使用VQ增益码的判断方法。
如上所述,VQ增益码与基音增益的量化值和固定码本增益的量化值的组、或者与基音增益的量化值和固定码本增益对应值的量化值的组,一对一对应。因此,能够将在上述[步骤S112的具体例2-4]中的判断结果分别与VQ增益码相关联。具体来说,在步骤S112的具体例2中,由于将量化后的基音增益作为指标而进行判断,因此能够将对应于作为指标的量化后的基音增益的VQ增益码(对应于量化后的基音增益的值)与判断结果相关联。在步骤S112的具体例3中,将对应于量化后的基音增益的值与对应于量化后的固定码本的值之间的比作为指标而进行判断,因此能够将对应于作为指标的该比的VQ增益码与判断结果相关联。在步骤S112的具体例4中,由于将对应于量化后的基音增益的值与对应于量化后的固定码本增益的值作为指标而进行判断,因此能够将与对应于量化后的基音增益的值和对应于量化后的固定码本增益的值的组对应的VQ增益码和判断结果相关联。从而,基于上述的[步骤S112的具体例2-4]的任一个,预先获得是稳态还是不是稳态(非稳态)的判断结果,并能够将这样的判断结果和对应于判断结果的VQ增益码分别相关联的表格预先存储在判定单元117b内。判定单元117b通过参照这样的表格,能够获得与被输入的VQ增益码对应的判断结果。或者,根据这样的判断结果,决定用于表示基音周期的精度和/或基音周期的编码方式,因此还能够在判定单元117b内预先存储将各VQ增益码与用于表现基音周期的精度和/或基音周期的编码方式相关联的表格。此时,判定单元117b通过参照这样的表格,能够获得与被输入的VQ增益码对应的、用于表现基音周期的精度和/或基音周期的编码方式([步骤S112的具体例1-5]的说明结束)。
在步骤S112的判定中,判定为表示时序信号x(n)(n=0、……、L-1)的稳态性的指标不满足用于表示时序信号x(n)(n=0、……、L-1)的稳态性高的条件时(非稳态),基于判定单元117b的控制,开关单元117c将基音周期T=T1、T2、T3、T4发送给基音周期编码单元117d。如后所述,基音周期编码单元117d输出将以第1精度表现的基音周期在每个第1时间区间进行编码而获得的码(步骤S113)。另一方面,在步骤S112的判定中,在判定为用于表示时序信号x(n)(n=0、……、L-1)的稳态性的指标满足用于表示时序信号x(n)(n=0、……、L-1)的稳态性高的条件时(稳态),基于判定单元117b(图5)的控制,开关单元117c将基音周期T=T1、T2、T3、T4发送给基音周期编码单元117e。基音周期编码117e输出将以第2精度表现的基音周期在每个第2时间区间进行编码而获得的码。这里,第2精度比第1精度高,且/或者第2时间区间比第1时间区间短。例如,与以往一样(参照图2A以及B),基音周期编码单元117e生成并输出与当前帧的基音周期T对应的码CT(步骤S114)。
[步骤S113、S114的具体例1]
在本例的步骤S113(非稳态)中,基音周期编码单元117d将用于表现各基音周期T=T1、T2、T3、T4的精度仅设为整数精度(第1精度),在每个子帧单独对基音周期T进行编码,并生成与当前帧的基音周期T对应的码CT。图8A是用于说明在步骤S113中生成的与当前帧的基音周期T对应的码CT的结构例的图。在图8A的例子中,第1~第4子帧的各基音周期T=T1、T2、T3、T4分别以整数精度来表现,并对个基音周期T=T1、T2、T3、T4分别以6个比特进行编码(基音周期整数部)。
另一方面,在本例的步骤S114(稳态)中,基音周期编码单元117e将用于表现基音周期T1、T3的精度设为小数精度(第2精度)或者整数精度,对每个子帧分别单独进行编码。此外,基音周期编码单元117e对以小数精度(第2精度)表现的基音周期T2、T4的整数部以及基音周期T1、T3的整数部的差分值分别进行编码。进而,将基音周期T2、T4的小数点以下的值(小数部)分别以两个比特进行编码(参照图2B)。
[步骤S113、步骤S114的具体例2]
在本例的步骤S113(非稳态)中,基音周期编码单元117d在每个由多个子帧构成的时间区间(第1时间区间)获得与基音周期对应的码,并生成与当前帧的基音周期T对应的码CT。即,对多个子帧利用公共的基音周期T生成码(降低基音周期的编码频度)。图8B是用于说明在步骤S113中生成的与当前帧的基音周期T对应的码CT的结构例的图。在图8B的例子中,作为第1、第2子帧的基音周期T的码,共用对以整数精度表现的基音周期T1、T2进行编码而获得的码中的其中一个,作为第3、第4子帧的基音周期T的码,共用对以整数精度表现的基音周期T3、T4进行编码而获得的码中的其中一个。
另一方面,在本例的步骤S114(稳态)中,基音周期编码单元117e在每个子帧(第2时间区间)对基音周期T1、T2、T3、T4进行编码。在图2B的例子的情况下,对基音周期T1、T3的值按照子帧单独进行编码,并对基音周期T2、T4的整数部与基音周期T1、T3的整数部的差分值进行编码。对基音周期T2、T4的小数点以下的值(小数部)分别以两个比特进行编码(参照图2B/[步骤S113、S114的具体例1、2]的说明结束)。
从基音周期编码单元117d或者117e输出的与当前帧的基音周期T对应的码CT基于判定单元117d的控制,通过开关单元117f而发送到合成单元117g。合成单元117g生成并输出将线性预测信息LPCinfo、码索引Cf=Cf1、Cf2、Cf3、Cf4、与当前帧的基音周期T对应的码CT、表示量化后的基音增益gp’=gp1’、gp2’、gp3’、gp4’的码、表示量化后的固定码本增益gc’=gc1’、gc2’、gc3’、gc4’的码合成后的比特流BS。也可以代替表示量化后的基音增益gp’=gp1’、gp2’、gp3’、gp4’的码与表示量化后的固定码本增益gc’=gc1’、gc2’、gc3’、gc4’的码而在比特流BS中包含VQ增益码等的索引(步骤S115)。
<解码方法>
图7B是用于说明实施方式的解码方法的流程图。以下,着重说明与现有技术的不同点。
比特流BS输入到解码装置12的参数解码单元127(图6)。参数解码单元127从比特流BS将线性预测信息LPCinfo、码索引Cf=Cf1、Cf2、Cf3、Cf4、与当前帧的基音周期T对应的码CT、量化后的基音增益gp’=gp1’、gp2’、gp3’、gp4’、以及量化后的固定码本增益gc’=gc1’、gc2’、gc3’、gc4’分离或者解码后输出。量化后的基音增益gp’=gp1’、gp2’、gp3’、gp4’与量化后的固定码本增益gc’=gc1’、gc2’、gc3’、gc4’通过对比特流BS中包含的用于表示量化后的基音增益gp’=gp1’、gp2’、gp3’、gp4’的码以及用于表示量化后的固定码本增益gc’=gc1’、gc2’、gc3’、gc4’的码、或者比特流BS中包含的VQ增益码进行解码而获得(步骤S121)。
接着,为了确定码CT的解码方式,判定单元127b判定与当前帧的比特流BS对应的时序信号x(n)(n=0、……、L-1)是否为稳态(步骤S122)。步骤S122的判定通过用于表示该时序信号x(n)(n=0、……、L-1)的稳态性的高低的指标是否满足看做时序信号的稳态性高的条件而进行。该判断使用在编码装置11中进行的步骤S112相同的方法。
[在编码装置11中使用步骤S112的具体例1的情况]
此时,在判定单元127b中,作为用于表示时序信号x(n)(n=0、……、L-1)的稳态性的高低的指标,也使用用于表示时序信号x(n)(n=0、……、L-1)的大小相对于对该时序信号x(n)(n=0、……、L-1)进行线性预测分析后获得的预测残差的大小的比的指标(预测增益的估计值E等)。此外,作为用于表示时序信号x(n)(n=0、……、L-1)的稳态性高的条件,使用用于表示时序信号x(n)(n=0、……、L-1)的大小相对于对该时序信号x(n)(n=0、……、L-1)进行线性预测分析后获得的预测残差的大小的比的指标比规定值大的条件。具体的判定内容如在步骤S112的具体例1中例示那样。
[在编码装置1中使用步骤S112的具体例2的情况]
此时,在判定单元127b中作为用于表示时序信号x(n)(n=0、……、L-1)的稳态性的高低的指标也使用量化后的基音增益。此外,作为用于表示时序信号x(n)(n=0、……、L-1)的稳态性高的条件,使用量化后的基音增益比规定值大的条件。具体的判定内容如在步骤S112的具体例2中例示那样。
[在编码装置11中使用步骤S112的具体例3的情况]
此时,判定单元127b作为用于表示时序信号x(n)(n=0、……、L-1)的稳态性的高低的指标,也使用与量化后的基音增益对应的值以及与量化后的固定码本增益对应的值之间的比。具体的判定内容如在步骤S112的具体例3中例示那样。
[在编码装置11中使用步骤S112的具体例4的情况]
此时,判定单元127b作为用于表示时序信号x(n)(n=0、……、L-1)的稳态性的高低的指标也使用与量化后的基音增益对应的值和与量化后的固定码本增益对应的值,并分别与第1规定值以及第2规定值进行比较。具体的判定内容如在步骤S112的具体例4中例示那样。
[在编码装置11中使用步骤S112的具体例5的情况]
此时,判定单元127b作为用于表示时序信号x(n)(n=0、……、L-1)的稳态性的高低的指标而使用比特流BS中包含的VQ增益码。具体的判定内容如在步骤S112的具体例5中例示那样。例如,预先在判定单元127b中存储在步骤S112的具体例5中说明的将判定结果以及与该判断结果对应的VQ增益码分别相关联的表格,判定单元127b参照这样的表格而获得与输入的VQ增益码对应的判断结果。此外,如上所述,根据判断结果决定用于表现基音周期的精度和/或基音周期的编码方式,还决定与其对应的解码方式。从而,还能够在判定单元127b内预先存储将各VQ增益码与用于表现基音周期的精度和/或基音周期的解码相关联的表格。此时,判定单元127b通过参照这样的表格而能够获得与输入的VQ增益码对应的、用于表现基音周期的精度和/或基音周期的解码方式(步骤S122的具体例的说明结束)。
根据步骤S122的判定结果,切换码CT的解码方式。
在步骤S122的判定中,判定为与比特流BS对应的用于表示时序信号x(n)(n=0、……、L-1)的稳态性的指标不满足用于表示时序信号x(n)(n=0、……、L-1)的稳态性高的条件的情况下(非稳态),基于判定单元127b的控制,开关单元127f将当前帧的码CT发送给基音周期解码单元127d。基音周期解码单元127d通过与在基音周期编码单元117d(图5)中进行的编码处理对应的解码处理,对码CT进行解码,并输出当前帧的基音周期T’=T1’、T2’、T3’、T4’(步骤S123)。以下表示步骤S123的处理的具体例。
[在编码装置11中使用步骤S113的具体例1的情况]
此时,基音周期解码单元127d从码CT提取以整数精度(第1精度)表现的第1~第4子帧的基音周期T1’、T2’、T3’、T4’,并将其输出。
[在编码装置11中使用步骤S113的具体例2的情况]
此时,基音周期解码单元127d从码CT提取每个由多个子帧构成的时间区间(第1时间区间)的基音周期,并将其输出。即,通过在每个第1时间区间获得基音周期的解码方式,对与基音周期对应的码进行解码。在将第1、第2子帧、第3、第4子帧分别设为第1时间区间的图8B的例子中,对第1、第2子帧提取相同的基音周期T1’、T2’=T1’,对第3、第4子帧提取相同的基音周期T3’、T4’=T3’,并输出基音周期T1’、T2’、T3’、T4’(步骤S123的具体例的说明结束)。
另一方面,在步骤S122的判定中,用于表示与比特流BS对应的时序信号x(n)(n=0、……、L-1)的稳态性的指标满足了用于表示时序信号x(n)(n=0、……、L-1)的稳态性高的条件时(稳态),基于判定单元127b(图6)的控制,开关单元127c将当前帧的码CT发送给基音周期解码单元127e。基音周期解码单元127e通过与在基音周期编码单元117e(图5)中进行的编码处理对应的解码处理对码CT进行解码,输出当前帧的基音周期T’=T1’、T2’、T3’、T4’(步骤S124)。基音周期解码单元127e对将以第2精度表现的基音周期在每个第2时间区间进行编码而获得的码进行解码。即,通过在每个第2时间区间获得以第2精度表现的基音周期的解码方式,对于基音周期对应的码进行解码。例如,与以往一样,基音周期解码单元127e对当前帧的码CT进行解码,从而输出当前帧的基音周期T’=T1’、T2’、T3’、T4’。以下表示步骤S124的具体例。
[在编码装置11中使用了步骤S114的具体例1、2的情况]
此时,基音周期解码单元127e从码CT提取第1子帧的基音周期T1’、第3子帧的基音周期T3’,并将其输出。此外,基音周期解码单元127e从码CT提取第2子帧的基音周期的整数部与第1子帧的基音周期的整数部之间的差分值、第4子帧的基音周期的整数部与第3子帧的基音周期的整数部之间的差分值、第2子帧的基音周期的小数部、第4子帧的基音周期的小数部。
进而,基音周期解码单元127e将从第1子帧的基音周期T1’获得的第1子帧的基音周期的整数部、第2子帧的基音周期的整数部与第1子帧的基音周期的整数部的差分值、第2子帧的基音周期的小数部相加,从而获得第2子帧的基音周期T2’,并将其输出。
进而,基音周期解码单元127e将从第3子帧的基音周期T3’获得的第3子帧的基音周期的整数部、第4子帧的基音周期的整数部与第3子帧的基音周期的整数部的差分值、以及第4子帧的基音周期的小数部相加,从而获得第4子帧的基音周期T4’,并将其输出(步骤S124的具体例的说明结束)。
解码后的当前帧的基音周期T’=T1’、T2’、T3’、T4’基于判定单元127b的控制,通过开关单元127c被输出。此外,参数解码单元127输出线性预测信息LPCinfo、码索引码索引Cf=Cf1、Cf2、Cf3、Cf4、量化后的基音增益gp’=gp1’、gp2’、gp3’、gp4’、量化后的固定码本增益gc’=gc1’、gc2’、gc3’、gc4’。此后,与以往以往,在解码装置12中生成并输出合成信号x’(n)(n=0、……、L-1)。
[第1实施方式的变形例1]
作为上述的第1实施方式的变形,也可以根据在步骤S112中当前帧的时序信号x(n)(n=0、……、L-1)被判定为稳态,还是被判定为非稳态,编码装置11的检索单元913(图4)改变比当前帧还未来的帧中的基音周期T的检索范围。例如,在判定为非稳态时,由于自适应信号的贡献少,因此可以将基音周期的检索范围设定为比判定为稳态时的检索范围还小。
此外,也可以在检索单元913检索当前帧的基音周期T之前,利用预测增益的估计值E而判定当前帧的时序信号x(n)(n=0、……、L-1)是稳态还是非稳态,并根据其结果,变更当前帧中的基音周期T的检索范围,所述预测增益利用对当前帧生成的线性预测信息LPCinfo而生成。例如将判断为非稳态时的检索范围设为比判断为稳态时的检索范围还小。
此外,也可以通过步骤S112判定时稳态还是非稳态,并根据其结果设定基音周期T的检索范围之后,重新进行对于当前帧的检索对于913的处理。
进而,如步骤S113的具体例2那样,在判定为非稳态时在每个由多个子帧构成的时间区间对基音周期T进行编码(降低编码频度)的情况下,对于判定为非稳态的帧,也可以降低检索单元913的基音周期T的计算频度。即,例如,如果针对多个子帧,仅对一个基音周期进行编码,则针对该多个子帧,只要算出一个基音周期即可。
[第1实施方式的变形例2]
作为上述的第1实施方式的变形,也可以根据在步骤S112中将当前帧的时序信号x(n)(n=0、……、L-1)判定为稳态还是判定为非稳态,改变在比当前帧还未来的帧中编码装置11的检索单元913(图4)算出的基音周期T的精度。例如,也可以在判断为非稳态时算出以整数精度表现的基音周期T,在判断为稳态时算出以小数精度表现的基音周期T。
此外,也可以在检索单元913算出当前帧的基音周期T之前,利用预测增益的估计值E判定当前帧的时序信号x(n)(n=0、……、L-1)是稳态还是非稳态,并根据其结果,选择将当前帧中的基音周期T以整数精度算出还是以小数精度算出,所述预测增益利用对当前帧生成的线性预测信息LPCinfo而生成。例如,也可以在判断为非稳态时算出以整数精度表现的基音周期T,在判断为稳态时算出以小数精度表现的基音周期T。
此外,也可以通过步骤S112判定是稳态还是非稳态,并根据其结果设定了在检索单元913算出的基音周期T的精度之后,重新进行对于当前帧的检索单元913的处理。
[第1实施方式的变形例3]
此外,作为上述的第1实施方式的变形,也可以根据在步骤S112中将当前帧的时序信号x(n)(n=0、……、L-1)判定为稳态还是判定为非稳态,改变对码索引Cf分配的比特数目。例如,在判定为非稳态时,与判定为稳态时相比,与基音周期T对应的码CT的码量小,因此通过降低比特率,从而在重视相同程度的比特率下的质量改善的情况下,与对应于基音周期T的码CT的码量的节约量对应地、对码索引Cf分配较多的比特数,从而提高编码质量。
[第1实施方式的变形例4]
此外,代替判定时序信号x(n)(n=0、……、L-1)是否为稳态并根据其结果而切换用于表现基音周期的精度、基音周期的编码方式,也可以判定时序信号x(n)(n=0、……、L-1)是否为周期性的,并根据其结果切换用于表现基音周期的精度、基音周期的编码方式。在此时的处理成为将上述的“稳态”置换为“周期性”,将“非稳态”置换为“非周期性”的处理。另外,时序信号x(n)(n=0、……、L-1)是否为周期性的判定也能够通过预测增益、量化后的基音增益是否比规定值还大而判定。即,也可以根据用于表示时序信号的周期性和/或稳态性的高低的指标是否满足用于表示周期性和/或稳态性高的条件,切换用于表示基音周期的精度和/或基音周期的编码方式。
[第1实施方式的变形例5]
此外,作为用于判断时序信号x(n)(n=0、……、L-1)是否为稳态(周期性)的指标,也可以利用与规定时间区间中包含的某个时间区间的基音周期对应的值(例如,基音周期、基音周期的整数部)以及与该规定时间区间中包含的比该时间区间还过去的时间区间的基音周期对应的值之间的差分值。然后,可以在该差分值比规定值还小的情况下判断为稳态(周期性),在并非如此时判定为非稳态(非周期性)。此外,也可以通过判定是否满足指标<规定值,判定指标是否比规定值还小,也可以通过判定是否满足指标≤(规定值-常数)而判定指标是否比规定值还小。此时,作为处理上的阈值,可以设定规定值,作为处理上的阈值也可以设定(规定值-常数)。
[第1实施方式的变形例6]
此外,也可以设为在比特流BS中包含用于确定编码装置11根据稳态性和周期性的判断结果而选择的事项(基音周期的精度、编码方式等)的辅助信息。此时,解码装置12利用比特流BS中包含的辅助信息,能够确定根据稳态性和周期性的判断结果而选择的事项(基音周期的精度和解码方式等)。
[第2实施方式]
第2实施方式是对第1实施方式或者其变形例1~6的变形。第2实施方式与第1实施方式或者其变形例1~6的不同点在于,根据时序信号是否为稳态(周期性)而切换的、基音周期的编码方式以及解码方式的内容。
如果是语音信号等的时序信号,则在稳态(周期性)的帧中,基音周期的变化较少,属于该帧的子帧的各基音周期之间的差分值成为0或者较小的值的可能性较大。从而,在稳态的帧中,对子帧的各基音周期之间的差分值进行可变长度编码较有效。相反,在不是稳态(周期性)的帧中,这样的差分值的偏差较大,因此可变长度编码并不有效的情况较多。
因此,在第2实施方式的基音周期的编码处理中,当用于表示时序信号的周期性和/或稳态性的高低的指标满足用于表示周期性和/或稳态性高的条件时,对规定时间区间中包含的第1规定时间区间的基音周期进行编码,并对与该规定时间区间中包含的第1规定时间区间以外的第2规定时间区间的基音周期对应的值、和与该第2规定时间区间以外的时间区间的基音周期对应的值之间的差分值进行可变长度编码。以下,举例说明“规定时间区间”是帧、“第1规定时间区间”是第1、第3子帧、“第2规定时间区间”是第2、第4子帧、“与基音周期对应的值”是基音周期的整数部的情况。但是,这并不限定本发明。
<结构>
利用图4至图6,说明第2实施方式的编码装置21以及解码装置22的结构。
如图4例示那样,第2实施方式的编码装置21与第1实施方式的编码装置11的不同点在于,将参数编码单元117置换为参数编码单元217。此外,第2实施方式的解码装置22与第1实施方式的解码装置12的不同点在于,将参数解码单元127置换为参数解码单元227。
如图5例示,第2实施方式的参数编码单元217与第1实施方式的参数编码单元117的不同点在于,将基音周期编码单元117d置换为基音周期编码单元217d,将基音周期编码单元117e置换为基音周期编码单元217d。此外,如图6例示,第2实施方式的参数解码单元227与第1实施方式的参数解码单元127的不同点在于,将基音周期解码单元127d置换为基音周期解码单元227d,将基音周期解码单元127e置换为基音周期解码单元227e。
<编码方法>
利用图7A,说明第2实施方式的编码方法。
在第2实施方式的编码方法,代替第1实施方式的步骤S113而执行以下的步骤S213,代替第1实施方式的步骤S114而执行以下的步骤S214。除此之外,均与第1实施方式和其变形例相同。以下,仅说明本方式的步骤S213以及步骤S214的处理。
[步骤S213的处理]
若在步骤S112中判定为非稳态(非周期性),则基于判定单元117b的控制,开关单元117c将基音周期T=T1、T2、T3、T4发送给基音周期编码单元217d(图5)。例如,基音周期编码单元217d通过与以往(图2A以及图2B)相同的方法(步骤S213的具体例1)、或者与第1实施方式的步骤S113(图8)相同的方法(步骤S213的具体例2),生成并输出与当前帧的基音周期T对应的码CT(步骤S213)。
[步骤S214的处理]
若再步骤S112中判定为稳态(周期性),则基于判定单元117b的控制,开关单元117c将基音周期T=T1、T2、T3、T4发送给基音周期编码单元217e。基音周期编码单元217e与以往一样(图2A、图2B以及图3),在每个子帧单独对第1、第3子帧(第1规定时间区间)的基音周期T1、T3(从基音周期的最低值起的差分)进行编码。进而,基音周期编码单元217e对第2子帧(第2规定时间区间)的基音周期T2的整数部(与基音周期对应的值)与第1子帧(第2规定时间区间以外的时间区间)的基音周期T1的整数部的差分值TD(1、2)进行可变长度编码,并对第4子帧(第2规定时间区间)的基音周期T4的整数部与第3子帧(第2规定时间区间以外的时间区间)基音周期T3的整数部的差分值TD(3、4)进行可变长度编码。另外,差分值TD(α、β)可以是(基音周期Tα的整数部)-(基音周期Tβ的整数部),也可以是(基音周期Tβ的整数部)-(基音周期Tα的整数部),但要在编码装置和解码装置中统一到底要采用哪一个。此外,对第2、第4子帧的基音周期T2、T4的小数部分别以固定比特(例如两个比特)进行编码。
这样,基音周期编码单元217e在每个子帧单独对第1、第3子帧的基音周期T1、T3进行编码,对差分值TD(1、2)以及TD(3、4)进行可变长度编码,并对基音周期T2、T4的小数部以固定比特进行编码,从而生成并输出与当前帧的基音周期T=T1、T2、T3、T4对应的码CT(步骤S214)。以下,例示在本方式中对差分值TD(1、2)以及差分值TD(3、4)进行的可变长度编码方法。
[可变长度编码方法的具体例1]
在本例中,当差分值TD(1、2)以及差分值TD(3、4)的各大小均为0时,将特别的一个比特(例如“0”)设为与差分值TD(1、2)以及差分值TD(3、4)对应的码。除此之外的情况下,将用于表示“在除此之外的情况”的一个比特(例如“1”)和用于表示差分值TD(1、2)的三个比特的总计4个比特、以及用于表示“在除此之外的情况”的一个比特(例如“1”)和用于表示差分值TD(3、4)的三个比特的总计4个比特设为对应于差分值TD(1、2)以及差分值TD(3、4)的码。
[可变长度编码方法的具体例2]
在本例中,当差分值TD(1、2)以及差分值TD(3、4)是-1、0、+1时,将对差分值TD(1、2)以及差分值TD(3、4)分别进行可变长度编码后的结果设为码,在除此之外的情况下,将表示该情况的一个比特(例如“1”)和表示差分值的四个比特设为码。例如,如下那样,差分值TD(1、2)和差分值TD(3、4)分别被进行可变长度编码。
表1
差分值 比特数 假设频度 码长度期待值
“01” 0 2 0.25 0.5
“000” -1 3 0.125 0.375
“001” +1 3 0.125 0.375
“1”+“XXXX” 其他 1+4 0.5 2.5
3.75
另外,在表1的例子时,如果差分值为-1、0、+1以外,则信息量反而增加25%,因此在差分值为-1、0、+1以外的频度大时,比特数不被削减。在“1”+“XXXX”时的“XXXX”的16个差分值中,0、+1、-1的三个不会被指定,因此能够指定XXXX中13个差分值,并将剩余的三个码用于在特别的处理中使用的标识等其他的目的。或者,利用预先生成了通过“1”+“XXXX”指定的13个(16-3)的差分值的对应表,仅将频度高的两个差分值以三个比特来表现,剩余的11个以四个比特来表现,从而能够进一步削减平均码量。
[可变长度编码方法的具体例3]
在本例中,对与规定时间区间中包含的第1规定时间区间以外的多个第2规定时间区间的各基音周期对应的值、和与该规定时间区间中包含的该第2规定时间区间以外的时间区间的各基音周期对应的值的各差分值进行整合的信息,进行可变长度编码。如前所述,这里,举例说明了“规定时间区间”是帧,“第1规定时间区间”是第1、第3子帧,“第2规定时间区间”是第2、第4子帧,“与基音周期对应的值”是基音周期的整数部的情况。
在本例中,当差分值TD(1、2)以及差分值TD(3、4)均为0时,将特别的一个比特的指定码(例如“1”)设为与差分值TD(1、2)以及差分值(3、4)对应的码。此外,差分值TD(1、2)以及差分值TD(3、4)中的一个是0而且另一个是+1、-1中的其中一个的状态有四个状态。在本例中,将由用于表示是该四个状态中的一个状态的两个比特的指定码(例如“00”)以及用于识别各状态的两个比特(“00”、“01”、“10”、“11”)构成的总计四个比特设为与差分值TD(1、2)以及差分值TD(3、4)对应的码。在除此之外的情况下,将用于确定该情况的两个比特(例如“01”)的指定码、用于表示差分值TD(1、2)的四个比特、用于表示差分值TD(3、4)的四个比特这样的总计10个比特设为与差分值TD(1、2)以及差分值(3、4)对应的码。例如,如下所示,差分值TD(1、2)以及差分值TD(3、4)被集中进行可变长度编码。
[表2]
[可变长度编码方法的具体例4]
在本例中,当所述的差分值TD(1、2)以及差分值TD(3、4)等均为0的情况下,将特别的两个比特的指定码(例如“01”)设为与差分值TD(1、2)以及差分值TD(3、4)对应的码。此外,差分值TD(1、2)以及差分值(3、4)中的其中一个为0且另一个为+1、-1中的其中一个的状态有四个状态,且差分值TD(1、2)以及差分值TD(3、4)中的一个是-1且另一个是+1的状态有两个状态。在本例中,将由用于表示是该总计6个状态中的一个状态的两个比特的指定码(例如“00”)以及用于识别各状态的2个或3个比特(例如“00”、“01”、“100”、“101”、“110”、“111”)构成的总计4个或5个比特设为与差分值TD(1、2)以及差分值TD(3、4)对应的码。在除此之外的情况下,将用于确定该情况的一个比特(例如“1”)的指定码、用于表示差分值TD(1、2)的四个比特、用于表示差分值TD(3、4)的四个比特这样的总计9个比特设为与差分值TD(1、2)以及差分值TD(3、4)对应的码。例如,如图9A和图9B以及以下例示,差分值TD(1、2)以及差分值TD(3、4)被集中进行可变长度编码。
[表3]
另外,在表3,差分值TD(1、2)为+1且差分值TD(3、4)为-1时的码(“00110”)、以及差分值TD(1、2)为-1且差分值TD(3、4)为+1时的码(“00111”)的码长度比差分值TD(1、2)为0且差分值TD(3、4)为+1、-1中的任一个时的码(“0000”、“0001”)的码长度还长,这一点基于差分值TD(1、2)为+1且差分值TD(3、4)成为-1的频度、以及差分值TD(1、2)为-1且差分值TD(3、4)成为+1的频度小。
以下,例示各状态的预想频度。
[表4]
在表4的预想频度时,在以表3的分配方式进行编码时,与差分值TD(1、2)、TD(3、4)对应的码的码长度期待值平均成为5.35比特,从将差分值TD(1、2)以及TD(3、4)分别以四个比特编码时的总计码长度8比特节约2.64比特。其中,该预想频度是稳态性高的帧(例如,整体的40%的帧)的预想频度,在稳态性低的帧中,差分值TD(1、2)以及TD(3、4)的偏差小且分布较广。从而,在所述的步骤S112的判定中,仅限于在判定为稳态性时进行该编码,从而能够获得基于可变长度编码的高压缩效果。但是,如果将步骤S112中的条件(稳态性时的条件)设为过严,则应用可变长度编码的频度下降,因此信息削减效果有限。另一方面,如果将步骤S112中的条件(稳态性时的条件)设为过松,则无法获得基于可变长度编码的高压缩效果,根据情况还存在平均比特数比以往还增加的可能性。从而,需要适当地调整在步骤S112中的条件设定。
<解码方法>
利用图7B,说明第2实施方式的解码方法。
在第2实施方式的解码方法中,代替第1实施方式的步骤S123而执行以下的步骤S223,代替第1实施方式的步骤S124而执行以下的步骤S224.除此之外,与第1实施方式和其变形例相同。以下,仅说明本方式的步骤S223以及步骤S224的处理。
[步骤S223的处理]
在步骤S122的判定中,当判定为用于表示与比特流BS对应的时序信号x(n)(n=0、……、L-1)的稳态性的指标不满足用于表示时序信号x(n)(n=0、……、L-1)的稳态性高的条件时(非稳态),基于判定部127b的控制,开关单元127f将当前帧的码CT发送给基音周期解码单元227d。基音周期解码单元227d通过与在基音周期编码单元217d(图5)中进行的编码处理对应的解码处理,从而对码CT进行解码,输出当前帧的基音周期T’=T1’、T2’、T3’、T4’(步骤S223)。例如,如果在编码装置21中执行步骤S213的具体例1的处理而生成当前帧的码CT(参照图2A以及B),则通过与以往相同的方法,根据码CT而生成当前帧的基音周期T’=T1’、T2’、T3’、T4’。此外,例如,如果在编码装置21中执行步骤S213的具体例2的处理而生成当前帧的码CT,则通过与其对应的第1实施方式的步骤S123的处理,根据码CT生成当前帧的基音周期T’=T1’、T2’、T3’、T4’。
[步骤S224的处理]
在步骤S122的判定中,在判定为用于表示与比特流BS对应的时序信号x(n)(n=0、……、L-1)的稳态性的指标满足用于表示时序信号x(n)(n=0、……、L-1)的稳态性高的条件时(稳态),基于判定单元127b的控制,开关单元127f将当前帧的码CT发送给基音周期解码单元227e。基音周期解码单元227e通过与在基音周期编码单元217e(图5)中进行的编码处理对应的解码处理,对码CT进行解码,并输出当前帧的基音周期T’=T1’、T2’、T3’、T4’(步骤S224)。
[第3实施方式]
第3实施方式是对于第1实施方式或其变形例1~6或第2实施方式的变形。第3实施方式与第1实施方式或其变形例1~6或第2实施方式的不同点在于,根据时序信号是否稳态(周期性)而进行切换的、基音周期的编码方式以及解码方式的内容。
当稳态性(周期性)高时,即量化后的基音增益、预测增益比规定值大时或者差分值TD(1、2)、TD(3、4)比规定值小时,第1子帧的基音周期T1与第3子帧的基音周期T3之差也小的情况较多。从而,在本方式的编码处理中,在时序信号x(n)(n=0、……、L-1)的稳态性(周期性)高时,对与基音周期T3对应的值(例如,基音周期T3的整数部)以及与基音周期T1对应的值(例如,基音周期T1的整数部)的差分值TD(1、3)进行可变长度编码。
即,第3实施方式的基音周期的编码处理也在用于表示时序信号的周期性和/或稳态性的高低的指标满足用于表示周期性和/或稳态性高的条件时,对规定时间区间中包含的第1规定时间区间的基音周期进行编码,并对与该规定时间区间中包含的第1规定时间区间以外的第2规定时间区间的基音周期对应的值和与该规定时间区间中包含的该第2规定时间区间以外的时间区间的基音周期对应的值的差分值进行可变长度编码。其中,在本方式中,“规定时间区间”是帧,“第1规定时间区间”是第1子帧,“第2规定时间区间”是第3子帧,“第2规定时间区间以外的时间区间”是第1子帧,“与基音周期对应的值”是基音周期的整数部。另外,这并不限定本发明。以下,着重说明与第1实施方式或者其变形例1~6或者第2实施方式的不同点。
<结构>
利用图4至图6,说明第3实施方式的编码装置31以及解码装置32的结构。
如图4所示,第3实施方式的编码装置31与第1实施方式的编码装置11的不同点在于,利用参数编码单元317置换了参数编码单元117。此外,第3实施方式的解码装置32与第1实施方式的解码装置12的不同点在于,利用参数解码单元327置换了参数解码单元127。
如图5例示,第3实施方式的参数编码单元317与第1实施方式的参数编码单元117的不同点在于,利用判定单元317b置换判定单元117b,利用基音周期编码单元317d置换基音周期编码单元117d,利用基音周期编码单元317e置换基音周期编码单元117e。此外,如图6例示,第3实施方式的参数解码单元327与第1实施方式的参数解码单元127的不同点在于,利用判定单元327b置换判定单元127b,利用基音周期解码单元327d置换基音周期解码单元127d,利用基音周期解码单元327e置换基音周期解码单元127e。
<编码方法>
利用图7A,说明第3实施方式的编码方法。
在第3实施方式的编码方法中,代替第1实施方式的步骤S112而执行以下的步骤S312,代替第1实施方式的步骤S113而执行以下的步骤S313,代替第1实施方式的步骤S114而执行以下的步骤S314。除此之外,与第1实施方式或其变形例相同。以下,仅说明本方式的步骤S312、步骤S313以及步骤S314的处理。
[步骤S312的处理]
在步骤S312中,判定单元317b判定当前帧的时序信号x(n)(n=0、……、L-1)是否稳态(周期性)(步骤S312)。步骤S312的判定可以与第1实施方式的步骤S112相同地进行。在第3实施方式中,说明了以下的例子:以与规定时间区间中包含的任一个时间区间的基音周期对应的值和与该规定时间区间中包含的比该时间区间过去的时间区间的基音周期对应的值的差分值的大小作为指标,在该指标比规定值小的情况下,判定为时序信号x(n)(n=0、……、L-1)是稳态(周期性),在并非如此时,判定为时序信号x(n)(n=0、……、L-1)是非稳态(非周期性)。以下,说明以差分值TD(1、2)的大小和/或TD(3、4)的大小作为指标,判定是否稳态(周期性)的例子。
[步骤S312的具体例1]
在步骤S312的具体例1中,对判定单元317b输入基音周期T1、T2。判定单元317b以基音周期T1、T2的整数部的差分即差分值TD(1、2)的大小作为指标,判定其是否比规定值小。然后,当差分值TD(1、2)的大小比规定值小的情况下,判定为当前帧的时序信号x(n)(n=0、……、L-1)是稳态(周期性),在并非如此时,判定为当前帧的时序信号x(n)(n=0、……、L-1)不是稳态(非周期性)。
另外,可以通过判定是否满足指标<规定值来判定指标是否比规定值还小,也可以通过判定是否满足指标≤(规定值-常数)来判定指标是否比规定值还小。此时,作为处理上的阈值可以设定规定值,作为处理上的阈值也可以设定(规定值-常数)。对于以后要说明的除此之外的“指标是否比规定值还小”的判定也一样。此外,也可以代替基音周期T1、T2的整数部的差分即差分值TD(1、2)而使用基音周期T3、T4的整数部的差分即差分值TD(3、4)作为指标。
[步骤S312的具体例2]
在步骤S312的具体例2中,对判定单元317b输入基音周期T1、T2、T3、T4。判定单元317b以差分值TD(1、2)的大小以及TD(3、4)的大小作为指标,判定它们是否均比规定值小。然后,当差分值TD(1、2)的大小以及TD(3、4)的大小均比规定值小的情况下,判定为当前帧的时序信号x(n)(n=0、……、L-1)是稳态(周期性),在并非如此时,判定为当前帧的时序信号x(n)(n=0、……、L-1)不是稳态(非周期性)。
[步骤S312的具体例3]
在步骤S312的具体例3中,也对判定单元317b输入基音周期T1、T2、T3、T4。判定单元317b判定是否是差分值TD(1、2)比规定值A小且差分值TD(3、4)比规定值B小。然后,在满足这些条件时,判定为当前帧的时序信号是稳态(周期性),在并非如此时判定为当前帧的时序信号不是稳态(非周期性)。
[步骤S312的具体例4]
在步骤S312的具体例4中,也对判定单元317b输入基音周期T1、T2、T3、T4。判定单元317b是否是差分值TD(1、2)比规定值A1大且比规定值A2小并且差分值TD(3、4)比规定值B1大且比规定值B2小。然后,在满足这些条件时,判定为当前帧的时序信号x(n)(n=0、……、L-1)是稳态(周期性),在并非如此时判定为当前帧的时序信号x(n)(n=0、……、L-1)不是稳态(非周期性)。
[步骤S312的具体例5]
此外,也可以将步骤S312的具体例1至4中的任一个判定与第1实施方式的步骤S112中的任一个判定进行组合,从而判定当前帧的时序信号x(n)(n=0、……、L-1)是否为稳态(周期性)。
[步骤S313的处理]
如果在步骤S312中判定为时非稳态(非周期性),则基于判定单元317b的控制,开关单元117c将基音周期T=T1、T2、T3、T4发送给基音周期编码单元317d(图5)。基音周期编码单元317d例如通过与以往(图2A以及B)相同的方法(步骤S313的具体例1)或者与第1实施方式的步骤S113(图8B)相同的方法(步骤S313的具体例2),生成并输出与当前帧的基音周期T对应的码CT(步骤S313)。
[步骤S314的处理]
如果在步骤S312中判定为时稳态(周期性),则基于判定单元317b的控制,开关单元117c将基音周期T=T1、T2、T3、T4发送给基音周期编码单元317e。图10A~图10C是用于例示在时序信号是稳态(周期性)时的、第3实施方式中的基音周期的编码方法的图。
如图10A例示那样,基音周期编码单元317e分别对第2子帧的基音周期T2的整数部与第1子帧的基音周期T1的整数部的差分值TD(1、2)、以及第4子帧的基音周期T4的整数部与第3子帧的基音周期T3的整数部的差分值TD(3、4)进行编码(差分整数部),并对基音周期T2、T4的小数点以下的值(小数部)分别进行编码。然后,基音周期编码单元317e对第1子帧的基音周期T1按照子帧单独进行编码。这些第1、2、4子帧的编码方法例如可以与以往同样地进行。基音周期编码单元317e进一步根据差分值TD(1、3)对第3子帧的基音周期T3的整数部与第1子帧的基音周期T1的整数部的差分值TD(1、3)进行可变长度编码(图10B),或者将第3子帧的基音周期T3按照子帧单独进行编码(图10C),并生成第3子帧的基音周期T3的码X3(图10A)。另外,在对差分值TD(1、3)进行可变长度编码时,对基音周期T3的小数部以对应于基音周期T3的整数部的大小的比特进行编码。例如,基音周期编码单元317e在基音周期T3的整数部是最小值Tmin以上且比TA小时,以两个比特对小数部进行编码,在基音周期T3的整数部是TA至TB的情况下,以一个比特对小数部进行编码,在基音周期T3的整数部是TB以上且比最大值Tmax小时,不对小数部进行编码(图10B)。通过以上的处理,基音周期编码单元317e生成并输出与基音周期T=T1、T2、T3、T4对应的码CT。以下,例示基音周期T3的编码方法。
[基音周期T3的编码方法的具体例1]
在本例中,当所述的差分值TD(1、3)是0时,将一个比特的指定码(例如“1”)设为与差分值TD(1、3)对应的码。此外,当差分值TD(1、3)是+1、-1中的任一个时,将三个比特的指定码(例如“000”、“001”)设为与差分值TD(1、3)对应的码。进而,在差分值TD(1、3)成为其他值时,生成由用于表示该情况的两个比特的指定码(例如“01”)以及与基音周期T3对应的7个比特构成的总计9个比特的码。例如,如以下例示那样,对基音周期T3进行编码。
[表5]
在表5的预想频度时,与以往的7比特相比,用于表现基音周期T3的码的码长度期待值能够节约3.2比特。此外,表5的预想频度是当设为在上述的步骤S312中判定为仅在差分值TD(1、2)的大小小于1时(差分值TD(1、2)为0时)是稳态(周期性)的情况下的频度。此时,能够预想在上述的步骤S312中判定为稳态(周期性)的帧的频度是整体的25%,用于表现基音周期T3的码的节约量平均成为0.8比特。
[基音周期T3的编码方法的具体例2]
在本例中,在所述的差分值TD(1、3)为0时,将用于表示该情况的一个比特的指定码(例如“1”)设为与差分值TD(1、3)对应的码。此外,当差分值TD(1、3)是+1、-1中的其中一个时,将三个比特的指定码(例如“000”、“001”)设为与差分值TD(1、3)对应的码。此外,当差分值TD(1、3)是0、+1、-1以外的数值而且能够用四个比特以下的比特来表现时,将用于表示该情况的三个比特的指定码(例如“010”)与用于表示差分值TD(1、3)的四个比特的总计7个比特设为与差分值TD(1、3)对应的码。当差分值TD(1、3)成为除此之外的值时,生成由用于表示该情况的三个比特的指定码(例如“001”)和与基音周期T3对应的7个比特构成的总计10个比特的码。例如,如以下例示那样,对基音周期T3进行编码。
[表6]
在表6的预想频度时,与以往的7个比特相比,用于表现基音周期T3的码的码长度期待值能够节约2.4比特。此外,表6的预想频度是当设为在上述的步骤S312中判定为仅在差分值TD(1、2)的大小比2小时(差分值TD(1、2)是0、-1、1中的任一个时)是稳态(周期性)的情况下的频度。此时,能够预想在上述的步骤S312中判定为是稳态(周期性)的帧的频度是50%,用于表现基音周期T3的码的节约量平均成为1.2比特。
[基音周期T3的编码方法的具体例3]
在本例中的码的分配方法与基音周期T3的编码方法的具体例2相同。其中,在上述的步骤S312中,仅在差分值TD(1、2)以及TD(3、4)的大小均小于2时(差分值TD(1、2)以及TD(3、4)是0、-1、1中的任一个时)判定为是稳态(周期性)。此时的预想频度成为如下。
[表7]
在表7的预想频度中,与以往的7个比特相比,用于表现基音周期T3的码的码长度期待值能够节约3.9比特。其中,此时,能够预想在上述的步骤S312中判定为是稳态(周期性)的帧的频度是24%,用于表现基音周期T3的码的节约量平均成为0.95比特。
[基音周期T3的编码方法的具体例4]
在本例中,当所述的差分值TD(1、3)为0时,将用于表示该情况的一个比特的指定码(例如“1”)设为与差分值TD(1、3)对应的码。此外,当差分值TD(1、3)为-1时,将两个比特的指定码(例如“01”)设为与差分值TD(1、3)对应的码。此外,当差分值TD(1、3)为+1时,将三个比特的指定码(例如“000”)设为与差分值TD(1、3)对应的码。当差分值TD(1、3)成为其他的值时,生成由用于表示该情况的三个比特的指定码(例如“001”)和与基音周期T3对应的7个比特构成的总计10个比特的码。例如,如以下例示那样,对基音周期T3进行编码。
[表8]
在表8的预想频度时,与以往的7个比特相比,用于表现基音周期T3的码的码长度期待值能够节约3.75比特。此外,表8的预想频度是当设为在上述的步骤S312中判定为仅在差分值TD(1、2)以及TD(3、4)的大小均小于2时(差分值TD(1、2)以及TD(3、4)是0、-1、1的其中一个时)是稳态(周期性),且仅在基音增益T2、T4均为0.7以上时是稳态(周期性)的情况下的频度。此时,能够预想在上述的步骤S312中判定为是稳态(周期性)的帧的频度是24%,且用于表现基音周期T3的码的节约量平均成为0.95比特。
[基音周期T3的编码方法的具体例5]
在本例中的码的分配方法与基音周期T3的编码方法的具体例4相同。其中,在上述的步骤S312中,判定为仅在与差分值TD(1、2)、TD(3、4)无关,基音增益T2、T4均为0.7以上时是稳态(周期性)。此时的预想频度成为如下。
[表9]
在表9的预想频度中,与以往的7个比特相比,用于表现基音周期T3的码的码长度期待值能够节约1.8比特。其中,此时,能够预想在上述的步骤S312中判定为是稳态(周期性)的帧的频度是40%,用于表现基音周期T3的码的节约量平均成为0.72比特。
<解码方法>
利用图7B,说明第3实施方式的解码方法。
在第3实施方式的解码方法中,代替第1实施方式的步骤S122而执行以下的步骤S322,代替第1实施方式的步骤S123而执行以下的步骤S323,代替第1实施方式的步骤S124而执行以下的步骤S324。此外,与第1实施方式及其变形例相同。以下,仅说明本方式的步骤S322、S323以及S324的处理。
[步骤S322的处理]
在步骤S322中,解码装置32(图4)的判定单元327b(图6)判定与当前帧的比特流BS对应的时序信号x(n)(n=0、……、L-1)是否为稳态(步骤S322)。步骤S322的判定通过用于表示该时序信号x(n)(n=0、……、L-1)的稳态性的高低的指标是否满足看做时序信号的稳态性高的条件而进行。在该判定中,输入从分离单元127g输出的判定单元327b的判定所需的信息(LPCinfo、CT、gp’等),通过与在编码装置31中进行的步骤S312相同的方法进行。另外,当将差分值TD(1、2)、TD(3、4)作为用于判定的指标来使用时,在它们被进行了可变长度编码时,需要将其进行解码后进行步骤S322的判定。
[步骤S323的处理]
在步骤S322的判定中判定为用于表示与比特流BS对应的时序信号x(n)(n=0、……、L-1)的稳态性的指标不满足用于表示时序信号x(n)(n=0、……、L-1)的稳态性高的条件时(非稳态),基于判定单元327b的控制,开关单元127f将当前帧的码CT发送给基音周期解码单元327d。基音周期解码单元327d通过与在基音周期编码单元317d(图5)中进行的编码处理对应的解码处理,对码CT进行解码,并输出当前帧的基音周期T’=T1’、T2’、T3’、T4’(步骤S323)。
[步骤S324的处理]
在步骤S322的判定中,在判定为用于表示与比特流BS对应的时序信号x(n)(n=0、……、L-1)的稳态性的指标满足用于表示时序信号x(n)(n=0、……、L-1)的稳态性高的条件时(稳态),基于判定单元327b的控制,开关单元127f将当前帧的码CT发送给基音周期解码单元327e。基音周期解码单元327e通过与在基音周期编码单元317e(图5)中进行的编码处理对应的解码处理,对码CT进行解码,并输出当前帧的基音周期T’=T1’、T2’、T3’、T4’(步骤S324)。
[第3实施方式的变形例1]
在第3实施方式的编码处理中,在判断为当前帧的时序信号x(n)(n=0、……、L-1)的稳态性高时,对属于当前帧的第3子帧的基音周期T3的整数部与第1子帧的基音周期T1的整数部的差分值TD(1、3)进行可变长度编码。但是,在判断为当前帧的时序信号x(n)(n=0、……、L-1)的稳态性高时,也可以对属于当前帧的第3子帧的基音周期T3的整数部与第2子帧的基音周期T2的整数部的差分值TD(2、3)进行可变长度编码,而取代对差分值TD(1、3)进行可变长度编码。另外,当如图2B那样,将基音周期T2被编码为整数部的差分值TD(1、2)时,将对基音周期T1的整数部加上差分值TD(1、2)的值作为基音周期T2的整数部。
[第3实施方式的变形例2]
在第3实施方式中,在判断为当前帧的时序信号x(n)(n=0、……、L-1)的稳态性高时,对属于当前帧的第3子帧的基音周期T3的整数部和第1子帧的基音周期T1的整数部的差分值TD(1、3)进行可变长度编码。但是,也可以代替对整数部的差分值TD(1、3)进行可变长度编码,而是对第3子帧的包含小数部的基音周期T3的去除了最低两个比特的值、和第1子帧的包含小数部的基音周期T1的去除了最低两个比特的值的差分值进行可变长度编码,并代替基音周期T3的小数部而直接对基音周期T3的最低两个比特进行编码。此时,当基音周期T3的整数部是最小值Tmin以上且小于TA时,直接对基音周期T3的小数部的两个比特进行编码,当基音周期T3的整数部是从TA至TB之间时,直接对基音周期T3的整数部的最低一个比特和小数部的一个比特进行编码,在基音周期T3的整数部是TB到最大值Tmax时,直接对基音周期T3的整数部的最低两个比特直接进行编码。
[第3实施方式的变形例3]
在第3实施方式中,在判断为当前帧的时序信号x(n)(n=0、……、L-1)的稳态性共高时,对属于当前帧的第3子帧的基音周期T3的基音周期T3的整数部、和第1子帧的基音周期T1的整数部的差分值TD(1、3)进行可变长度编码。但在判断为当前帧的时序信号x(n)(n=0、……、L-1)的稳态性高时,也可以将对差分值TD(1、3)进行可变长度编码而获得的码与基音周期T3的小数部的码的合计码长、以及将基音周期T3(整数部以及小数部)按照子帧单独进行编码而获得的码的码长度进行比较,并选择压缩效果好的码作为第3子帧的基音周期T3的码。
此外,在作为第3子帧的基音周期T3的码而选择了将基音周期T3(整数部以及小数部)按照子帧单独进行编码而获得的码时,也可以将对属于当前帧的第1子帧的基音周期T1的整数部、和第3子帧的基音周期T3的整数部的差分值TD(3、1)进行可变长度编码而获得的码与基音周期T1的小数部的码的合计码长度、以及将基音周期T1(整数部以及小数部)按照子帧单独进行编码而获得的码的码长度进行比较,并选择压缩效果好地码作为第1子帧的基音周期T1的码。
另外,上述的码长度的比较可以实际求出比较对象的码后利用它们的码长度进行,也可以利用码长度的预测值进行。此外,在对码附加用于表示选择了哪个码的固定长度的辅助比特时,还考虑该辅助比特的码长度后进行比较。
[第4实施方式]
在第4实施方式中,在跨越帧的子帧之间求出与基音周期对应的值的差分值,并对该差分值进行可变长度编码。如图11例示那样,有时按照由多个子帧构成的超级帧进行某些处理(长期预测和短期预测等),此时,属于相同超级帧的子帧之间的稳态性和周期性有时变高。此外,即使是不同的超级帧,也有时超级帧之间的稳态性较高。此时,当前帧的第1子帧的基音周期与其过去的帧的第3子帧或者第4子帧的基音周期的差分值变小的情况较多。由此,在本方式中,在跨越帧的子帧之间求出与基音周期对应的值的差分值,并对该差分值进行可变长度编码,从而削减码长度。
即,第4实施方式的基音周期的编码处理也如下进行:在用于表示时序信号的周期性和/或稳态性的高低的指标满足用于表示周期性和/或稳态性高的条件时,对规定时间区间中包含的第1规定时间区间的基音周期进行编码,并对与该规定时间区间中包含的第1规定时间区间以外的第2规定时间区间的基音周期对应的值和与该规定时间区间中包含的该第2规定时间区间以外的时间区间的基音周期对应的值的差分值进行可变长度编码。其中,“规定时间区间”是帧,“第1规定时间区间”是比当前帧过去的帧的任一个子帧,“第2规定时间区间”是当前帧的第1子帧,“第2规定时间区间以外的时间区间”是比当前帧过去的帧的任一个子帧,“与基音周期规定的值”是基音周期的整数部。以下为了简化说明,说明“第1规定时间区间”是当前帧的前一个帧的第3子帧,“第2规定时间区间”是当前帧的第1子帧,“第2规定时间区间以外的时间区间”是当前帧的前一个帧的第3子帧的情况。其中,这并不限定本发明。以下,着重说明与至今说明的方式之间的不同点。
<结构>
利用图4至图6,说明第4实施方式的编码装置41以及解码装置42的结构。
如图4例示那样,第4实施方式的编码装置41与第1实施方式的编码装置11的不同点在于,利用参数编码单元417置换了参数编码单元117。此外,第4实施方式的解码装置42与第1实施方式的解码装置12的不同点在于,利用参数解码单元427置换了参数解码单元127。
如图5例示那样,第4实施方式的参数编码单元417与第1实施方式的参数编码单元117的不同点在于,利用判定单元317b置换了判定单元117b,利用基音周期编码单元417d置换了基音周期编码单元117d,利用基音周期编码单元417e置换了基音周期编码单元117e。此外,如图6例示那样,第4实施方式的参数解码单元427与第1实施方式的参数解码单元127的不同点在于,利用判定单元327b置换判定单元127b,利用基音周期解码单元427d置换基音周期解码单元127d,利用基音周期解码单元427e置换基音周期解码单元127e。
<编码方法>
利用图7A,说明第4实施方式的编码方法。
在第4实施方式的编码方法中,代替第1实施方式的步骤S112而执行所述的步骤S312,代替第1实施方式的步骤S113而执行以下的步骤S413,代替第1实施方式的步骤S114而执行以下的步骤S414。除此之外,与第1实施方式或其变形例相同。以下,仅说明本方式的步骤S413以及步骤S414的处理。
[步骤S413的处理]
如果在步骤S312中判定为是非稳态(非周期性),则基于判定单元317b的控制,开关117c将基音周期T=T1、T2、T3、T4发送给基音周期编码单元417d(图5)。基音周期编码单元417d例如通过与以往(图2A以及B)相同的方法(步骤S413的具体例1)、或者与第1实施方式的步骤S113(图8B)相同的方法(步骤S413的具体例2),生成并输出与当前帧的基音周期T对应的码CT(步骤S413)。
[步骤S414的处理]
如果在步骤S312中判定为是稳态(周期性),则基于判定单元317b的控制,开关单元117c将基音周期T=T1、T2、T3、T4发送给基音周期编码单元417e。图12A以及图12B是用于例示在时序信号是稳态(周期性)时的在第4实施方式中的基音周期的编码方法的图。
如图12B例示那样,基音周期编码单元417e分别对当前帧(图12B)的第2子帧的基音周期T2的整数部和当前帧的第1子帧的基音周期T1的整数部的差分值TD(1、2)、以及当前帧的第4子帧的基音周期T4的整数部和当前帧的第3子帧的基音周期T3的整数部的差分值TD(3、4)进行编码(差分整数部),并对基音周期T2、T4的小数点以下的值(小数部)分别进行编码。进而,基音周期编码单元417e对当前帧的第3子帧的基音周期T3按照子帧单独进行编码。这些第2、3、4子帧的编码方法例如也可以与以往相同。
基音周期编码单元417e进而求出当前帧(图12B)中的第1子帧的基音周期T1的整数部与过去输入到基音周期编码单元417e的当前帧的前一帧(图12A)的第3子帧的基音周期T3’的整数部的差分值TD(3’、1)。然后,基音周期编码单元417e根据差分值TD(3’、1),对差分值TD(3’、1)进行可变长度编码,或者将当前帧的第1子帧的基音周期T1按照子帧单独进行编码,并生成当前帧的第1子帧中的基音周期T1的码X1(图12B)。该处理除了利用差分值TD(3’、1)置换差分值TD(1、3)之外,均与第3实施方式相同。此外,也可以代替差分值TD(3’、1)而使用与当前帧的前一帧中的第4子帧的基音周期T4’的整数部之间的差分值TD(4’、1)。此时,在通过该前一帧的第3、4子帧的基音周期T3’、T4’的整数部的差分值TD(3’、4)对该前一帧的第4子帧的基音周期T4’进行编码时,对基音周期T3’加上差分值TD(3’、4’)求出TD(4’、1)作为T4
<解码方法>
利用图7B,说明第4实施方式的解码方法。在第4实施方式的解码方法中,代替第1实施方式的步骤S122而执行步骤S322,代替第1实施方式的步骤S123而执行以下的步骤S423,代替第1实施方式的步骤S124而执行以下的步骤S424。除此之外,与第1实施方式或其变形例相同。以下,仅说明本发明的步骤S423以及步骤S424的处理。
[步骤S423的处理]
在步骤S322的判定中,判定为用于表示与比特流BS对应的时序信号x(n)(n=0、……、L-1)的稳态性的指标不满足用于表示时序信号x(n)(n=0、……、L-1)的稳态性高的条件时(非稳态),基于判定单元327b的控制,开关单元127f将当前帧的码CT发送给基音周期解码单元427d。基音周期解码单元427d通过与在基音周期编码单元417d(图5)中进行的编码处理对应的解码处理,对码CT进行解码,并输出当前帧的基音周期T’=T1’、T2’、T3’、T4’(步骤S423)。
[步骤S424的处理]
在步骤S322的判定中判定为用于表示与比特流BS对应的时序信号x(n)(n=0、……、L-1)的稳态性的指标满足用于表示时序信号x(n)(n=0、……、L-1)的稳态性高的条件时(稳态),基于判定单元327b的控制,开关单元127f将当前帧的码CT发送给基音周期解码单元427e。基音周期解码单元427e通过与在基音周期编码单元417e(图5)中进行的编码处理对应的解码处理,对码CT进行解码,并输出当前帧的基音周期T’=T1’、T2’、T3’、T4’(步骤S424)。
[第5实施方式]
又可以是将上述的各实施方式进行组合后的方式。第5实施方式是其一例。
<结构>
利用图4至图6,说明第5实施方式的编码装置51以及解码装置52的结构。
如图4例示那样,第5实施方式的编码装置51与第1实施方式的编码装置11的不同点在于,利用参数编码单元517置换了参数编码单元117。此外,第5实施方式的解码装置52与第1实施方式的解码装置12的不同点在于,利用参数解码单元527置换了参数解码单元127。
如图5例示那样,第5实施方式的参数编码单元517与第1实施方式的参数编码单元117的不同点在于,利用判定单元517b置换判定单元117b,利用基音周期编码单元517d置换基音周期编码单元117d,利用基音周期编码单元517e置换基音周期编码单元117e。此外,如图6例示那样,第5实施方式的参数解码单元527与第1实施方式的参数解码单元127的不同点在于,利用判定单元527b置换判定单元127b,利用基音周期解码单元527d置换基音周期解码单元127d,利用基音周期解码单元527e置换基音周期解码单元127e。
<编码方法>
图13是用于说明第5实施方式的编码方法的流程图。
在执行了步骤S111的处理之后,参数编码单元517(图5)的判定单元517b通过所述的步骤S112的判定处理,判定当前帧的时序信号x(n)(n=0、……、L-1)是否为稳态(周期性)。
在该判定中判定为用于表示时序信号x(n)(n=0、……、L-1)的稳态性的指标不满足用于表示时序信号x(n)(n=0、……、L-1)的稳态性(周期性)高的条件时(非稳态/非周期性),基于判定单元517b的控制,开关单元117c将基音周期T2、T4发送给基音周期编码单元517d。基音周期编码单元517d将用于表现各基音周期T2、T4的精度仅设为整数精度,分别按照子帧单独进行编码(步骤S513)。
另一方面,在判定为用于表示时序信号x(n)(n=0、……、L-1)的稳态性的指标满足用于表示时序信号x(n)(n=0、……、L-1)的稳态性(周期性)高的条件时(稳态/周期性),基于判定单元517b的控制,开关单元117c将基音周期T1、T2、T3、T4发送给基音周期编码单元517e。基音周期编码单元517e对以小数精度表现的基音周期T2、T4的整数部与基音周期T1、T3的整数部的差分值进行编码,并将基音周期T2、T4的小数点以下的值分别以两个比特进行编码(步骤S514)。
接着,参数编码单元517的判定单元517b根据所述步骤S312的判定处理,判定当前帧的时序信号x(n)(n=0、……、L-1)是否为稳态(周期性)。
若在该判定中判定为是非稳态(非周期性),则基于判定单元517b的控制,开关单元117c将基音周期T1、T3发送给基音周期编码单元517d。基音周期编码单元517d将用于表现各基音周期T1、T3的精度仅设为整数精度,并分别按照子帧单独进行编码(步骤S516)。
另一方面,若在该判定中判定为是稳态(周期性),则基于判定单元517b的控制,开关单元117c将基音周期T1、T3发送给基音周期编码单元517e。基音周期编码单元517e与第3实施方式(或第4实施方式)的步骤S314(或S424)相同地,对基音周期T1、T3进行编码。
此后,执行在第1实施方式中说明的步骤S115的处理。
图14是用于说明第5实施方式的解码方法的流程图。
在执行了步骤S121的处理之后,参数解码单元527(图6)的判定单元527b通过所述的步骤S122的判定处理,判定与当前帧的比特流BS对应的时序信号x(n)(n=0、……、L-1)是否为稳态(周期性)。
在该判定中,在判定为用于表示时序信号x(n)(n=0、……、L-1)的稳态性的指标不满足用于表示时序信号x(n)(n=0、……、L-1)的稳态性(周期性)高的条件时(非稳态/非周期性),基于判定单元527b的控制,开关单元127f将码CT发送给基音周期解码单元527d。基音周期解码单元527d通过与步骤S513对应的解码处理,获得第2、第4子帧的各基音周期T2’、T4’(步骤S523)。
另一方面,在判定为用于表示时序信号x(n)(n=0、……、L-1)的稳态性的指标满足用于表示时序信号x(n)(n=0、……、L-1)的稳态性(周期性)高的条件时(稳态/周期性),基于判定单元527b的控制,开关单元127f将码CT发送给基音周期解码单元527e。基音周期解码单元527e通过与步骤S514对应的解码处理,获得第2、第4子帧的各基音周期T2’、T4’(步骤S524)。
接着,判定单元527b通过所述的步骤S322的判定处理,判定与当前帧的比特流BS对应的时序信号x(n)(n=0、……、L-1)是否为稳态(周期性)。
在该判定中判定为用于表示时序信号x(n)(n=0、……、L-1)的稳态性的指标不满足用于表示时序信号x(n)(n=0、……、L-1)的稳态性(周期性高的条件时(非稳态/非周期性),基于判定单元527b的控制,开关单元127f将码CT发送给基音周期解码单元527d。基音周期解码单元527d通过与步骤S516对应的解码处理,获得第1、第3子帧的各基音周期T1’、T3’(步骤S526)。
另一方面,在判定为用于表示时序信号x(n)(n=0、……、L-1)的稳态性的指标满足用于表示时序信号x(n)(n=0、……、L-1)的稳态性(周期性)高的条件时(稳态/周期性),基于判定单元527b的控制,开关单元127f将码CT发送给基音周期解码单元527e。基音周期解码单元527e通过与步骤S314(或S414)对应的解码处理,获得第1、第3子帧的各基音周期T1’、T3’。
在上述的处理过程中,使用依赖于其他的参数的可变长度编码,因此需要用于能够唯一地解码的比特流的结构。图2A所例示的比特流的要素中,能够首先解码基音周期以外的码,且需要基于解码后的量化后的基音增益和线性预测信息,对基音周期T2’、T4’进行解码。进而还依赖基音周期T2’、T4’而对基音周期T1’、T3’进行解码。
[第6实施方式]
在分组传送各帧的比特流BS时,期望每个帧的码长度(比特长度)是固定的。另一方面,在分组传送中对帧内的比特结构并不存在制约。在第6实施方式中,将每个帧的码长度设为固定,且将帧内的剩余的比特用于该帧内的编码质量的提高。
<结构>
利用图4至图6,说明第6实施方式的编码装置61以及解码装置62的结构。
如图4例示那样,第6实施方式的编码装置61与第1实施方式的编码装置11的不同点在于,利用检索单元613置换检索单元913,利用固定码本614置换固定码本914,利用参数编码单元617置换参数编码单元117,并追加比特分配单元611。此外,第6实施方式的解码装置62与第1实施方式的解码装置12的不同点在于,利用参数解码单元627置换参数解码单元127。
<编码方法>
检索单元613(图4)对属于当前帧的第1~第3子帧,与以往一样,求出基音周期T1、T2、T3(整数部以及小数部),并决定来自固定码本614的由持有由不是零的单位脉冲及其正负的组合构成的值的一个以上的信号、以及持有零值的一个以上的信号所构成的信号分量c(n),并确定用于表示这些信号分量c(n)的码索引Cf1、Cf2、Cf3,获得基音增益gp1、gp2、gp3以及固定码本增益gc1、gc2、gc3。在固定码本614中,设定有对于各子帧的单位脉冲的数目、在各子帧内允许的单位脉冲的位置(位置候选)、以及对各单位脉冲允许的正负标号(正负标号候选)(例如,参照非专利文献1的“5.7Algebraiccodebook”等)。检索单元613在固定码本614中设定的范围内决定信号分量c(n),确定码索引Cf1、Cf2、Cf3。即,检索单元613针对第1~第3子帧的每一个,从允许的子帧内的位置,选择被设定的数目的单位脉冲的位置,并分别选择从允许的正负标号中选择的各位置的单位脉冲的正负标号,确定用于表示这些的选择内容的码索引Cf1、Cf2、Cf3。对于各子帧的单位脉冲的数目越多,码索引的比特数目越多,编码精度变高。在本方式中,对于第1~第3子帧的这样的固定码本614的设定被固定。即,在第1~第3子帧中,对于各子帧的单位脉冲的数据、在各子帧内允许的单位脉冲的位置、以及对单位脉冲允许的正负标号相同。
对于第1~第3子帧的基音增益gp1、gp2、gp3以及固定码本增益gc1、gc2、gc3被输入到参数编码单元617的增益量化单元617a(图5)。增益量化单元617a将这些按照子帧进行矢量量化,并针对每个子帧生成与基音增益的量化值和固定码本增益的量化值的组对应的VQ增益码。用于表现VQ增益码的比特值(称为“VQ增益码比特数”)越多,越能够减小量化间隔(量化步骤)或增大可矢量量化的基音增益和固定码本增益的范围(range),能够提高编码质量。在本方式中,预先固定对于第1~第3子帧的VQ增益码比特数(例如7个比特(能够表现128种比特增益的量化值和固定码本增益或固定码本增益对应值的组))。增益量化单元617a输出与第1~第3子帧的VQ增益码对应的码(例如,这些VQ增益码被压缩编码后的码)。
检索单元613(图4)对属于当前帧的第4子帧,与以往一样,求出基音周期T4(整数部以及小数部)。第1~第4子帧的基音周期T1、T2、T3、T4被输入到参数编码单元617(图5)。参数编码单元617与上述的第1~第5实施方式一样,对基音周期T1、T2、T3、T4的各整数部进行编码。例如,参数编码单元617作为用于表示时序信号x(n)(n=0、……、L-1)的稳态性的高低的指标而利用第1~第3子帧的任一个或者全部的VQ增益码等,与上述的实施方式及其变形例一样,对基音周期T1、T2、T3、T4的各整数部进行编码。除此之外,与以往技术一样,也可以对基音周期T1、T2、T3、T4的各整数部进行编码。
比特分配单元611(图4)利用当前帧的线性预测信息LPCinfo的码长度、与基音周期T1、T2、T3、T4的各整数部对应的码的码长度、码索引Cf1、Cf2、Cf3的码长度、以及与第1~第3子帧的VQ增益码对应的码的码长度等决定了在当前帧中的分配的码长度、以及预先决定的每一个帧的固定码长度,决定在当前帧没有决定分配的码长度的分配。本方式的比特分配单元611决定第1~第4子帧的基音周期T1、T2、T3、T4的小数部的精度(参照图3)、对于第4子帧的单位脉冲数、对于第4子帧的VQ增益码比特数。其中,它们的一部分也可以是固定值。
另外,基音周期的小数部的精度越高,对与基音周期的小数部对应的码分配的码长度越长,提高编码质量。对于第4子帧的单位脉冲的数越多,对第4子帧的码索引Cf4分配的码长度越长,提高第4子帧的编码质量。对于第4子帧的VQ增益码比特数越多,对于第4子帧的VQ增益码对应的码分配的码长度越长,提高第4子帧的编码质量。这样的码长度的分配如下进行:在当前帧中未被决定分配的比特中,对与比特周期的小数部对应的码、第4子帧的码索引Cf4、以及与第4子帧的VQ增益码对应的码分配尽量多的比特。优选地,如下进行:在当前帧中未被决定分配的所有的比特被分配给与基音周期的小数部对应的码、第4子帧的码索引Cf4、以及与第4子帧的VQ增益码对应的码。这样的码长度的分配按照预先决定的规则进行。
在比特分配单元611中决定的用于表示第1~第4子帧的比特周期T1、T2、T3、T4的小数部的精度的信息,被输入到参数编码单元617。参数编码单元617以该信息所表示的精度,对第1~第4子帧的基音周期T1、T2、T3、T4的小数部进行编码,并生成与基音周期T1、T2、T3、T4的小数部对应的码。
在比特分配单元611中决定的用于表示对于第4子帧的单位脉冲的数目的信息被输入到检索单元613(图4)。检索单元613通过对于属于当前帧的第4子帧的分析,决定由该信息所表示的单位脉冲及其正负的组合构成的第4子帧的信号分量c(n)(决定单位脉冲的位置及其正负的组合),从而确定表示该信号分量c(n)的码索引Cf4,获得基音增益gp4以及固定码本增益gc4。该分析除了固定之前求出的第4子帧的基音周期T4而进行之外,通过与以往相同的方法来进行。
在比特分配单元611中决定的用于表示对于第4子帧的VQ增益码比特数的信息、在检索单元613中获得的基音增益gp4以及固定码本增益gc4被输入到参数编码单元617(图5)的增益量化单元617a。增益量化单元617a以用于表示VQ增益码比特数的信息所表示的比特数,对基音增益gp4以及固定码本增益gc4进行矢量量化,获得该VQ增益码比特数的对于第4子帧的VQ增益码,并输出与第4子帧的VQ增益码对应的码(例如,这些VQ增益码被压缩编码后的码)。
当前帧的线性预测信息LPCinfo、码索引Cf=Cf1、Cf2、Cf3、Cf4、与第1~第4子帧的基音周期T1、T2、T3、T4(整数部以及小数部)对应的码CT、以及与第1~第4子帧的VQ增益码对应的码被输入到合成单元117g。合成单元117g将这些按照预先决定的顺序合成,生成并输出固定了每个帧的码长度的比特流BS。另外,在被输入到合成单元117g的信息的每个帧的合成码长度小于每个帧的固定码长度时,也可以对比特流BS追加辅助比特以及其他的比特。
<解码方法>
比特流BS输入到解码装置62的参数解码单元627(图6)。参数解码单元627首先根据比特流BS获得线性预测信息LPCinfo、第1~第3子帧的码索引Cf1、Cf2、Cf3、与第1~第4子帧的基音周期T1、T2、T3、T4的整数部对应的码、与第1~第3子帧的VQ增益码对应的码。参数解码单元627根据它们的码长度的合成值,能够确定在比特分配单元611中决定的码长度的分配,能够根据比特流BS确定与第1~第4子帧的基音周期T1、T2、T3、T4的小数部对应的码、第4子帧的码索引Cf4、与第4子帧的VQ增益码对应的码。进而,参数解码单元627根据与第1~第4子帧的VQ增益码对应的码,获得与量化后的基音增益gp’=gp1’、gp2’、gp3’、gp4’以及量化后的固定码本增益gc’=gc1’、gc2’、gc3’、gc4’。此后的处理与第1~第5实施方式相同。
[第6实施方式的变形例1]
作为第6实施方式的变形,代替检索单元613与以往一样求出第2~第4子帧的基音周期T2、T3、T4(整数部以及小数部),也可以由检索单元613’(图4)通过与比当前子帧还过去的子帧的VQ增益码对应的检索方法,检索该当前子帧的基音周期(整数部以及小数部),求出第2~第4子帧的基音周期T2、T3、T4(整数部以及小数部)。例如,检索单元613’也可以通过与第1子帧的VQ增益码对应的检索方法检索第2子帧的基音周期T2(整数部以及小数部),通过与第1、第2子帧的VQ增益码对应的检索方法来检索第3子帧的基音周期T3(整数部以及小数部),并通过与第1~第3子帧的VQ增益码对应的检索方法来检索第4子帧的基音周期T4(整数部以及小数部)。具体地说,例如检索单元613’可以将过去的子帧的VQ增益码应用于[步骤S112的具体例3]的判断基准1、判断基准2,判断当前帧的时序信号是否为稳态(周期性),并根据其结果,变更当前子帧中的基音周期的检索范围。例如检索单元613’由于在判断为是非稳态(非周期性)时自适应信号分量的贡献较少,因此与判定为是稳态(周期性)时相比,基音周期的检索范围变窄,或者基音周期的小数部的检索精度降低。或者,例如,在判定为是稳态(周期性)时,检索基音周期的整数部以及小数部,但在判定为是非稳态(非周期性)时仅检索基音周期的整数部,不检索小数部。
[第6实施方式的变形例2]
作为第6实施方式的变形,比特分配单元611’也可以根据过去的子帧的VQ增益码,决定第2以及第3子帧的基音周期的小数部的精度。例如,比特分配单元611’与第1~第5实施方式、以往技术一样,决定第1子帧的基音周期T1的小数部的精度,并根据第1子帧的VQ增益码而决定第2子帧的基音周期T2的小数部的精度,根据第1、第2子帧的VQ增益码而决定第3子帧的基音周期T3的小数部的精度。具体地说,例如比特分配单元611’将过去的子帧的VQ增益码应用于[步骤S112的具体例3]的判断基准1、判断基准2,从而判断当前子帧的时序信号是否为稳态(周期性),并根据其结果,决定第2以及第3子帧中的基音周期的小数部的精度。具体地说,例如比特分配单元611’由于在判断为是非稳态(非周期性)时自适应信号分量的贡献较少,因此与在判定为稳态(周期性)时相比,基音周期的小数部的精度下降。例如,比特分配单元611’在判定为是稳态(周期性)时以小数精度对基音周期的小数部进行编码,但在判断为是非稳态(非周期性)时以整数进行进行编码。
而且,比特分配单元611’利用当前帧的线性预测信息LPCinfo的码长度、与基音周期T1、T2、T3、T4的各整数部对应的码的码长度、与基音周期T1、T2、T3的各小数部对应的码的码长度、码索引Cf1、Cf2、Cf3的码长度、以及与第1~第3子帧的VQ增益码对应的码的码长度等决定了在当前帧中的分配的码长度、以及预先决定的每个帧的固定码长度,决定在当前帧中未被决定分配的码长度的分配。例如,比特分配单元611’决定第4子帧的基音周期T4的小数部的精度、对于第4子帧的单位脉冲数、对于第4子帧的VQ增益码比特数。该码长度的分配如下进行:在当前帧中未被决定分配的比特中,对与第4子帧的基音周期T4的小数部对应的码、第4子帧的码索引Cf4、以及与第4子帧的VQ增益码对应的码分配尽量多的比特。优选地,如下进行:在当前帧中未被决定分配的所有的比特被分配给与第4子帧的基音周期T4的小数部对应的码、第4子帧的码索引Cf4、以及与第4子帧的VQ增益码对应的码。
[第6实施方式的变形例3]
作为其他的第6实施方式的变形,比特分配单元611”也可以根据过去的子帧的VQ增益码而决定第2以及第3子帧的VQ增益码比特数。例如,比特分配单元611”固定第1子帧的VQ增益码比特数,根据第1子帧的VQ增益码而决定第2子帧的VQ增益码比特数,根据第1、第2子帧的VQ增益码而决定第3子帧的VQ增益码比特数。具体地说,例如比特分配单元611”将过去的子帧的VQ增益码应用于[步骤S112的具体例3]的判断基准1、判断基准2,从而判断当前帧的时序信号是否为稳态(周期性),并根据其结果,决定第2、第3子帧中的VQ增益码比特数。具体地说,例如比特分配单元611”由于在判断为是非稳态(非周期性)时自适应信号分量的贡献较少,因此与判定为是稳态(周期性)时相比,VQ增益码比特数较小。
此后,比特分配单元611”利用当前帧的线性预测信息LPCinfo的码长度、与基音周期T1、T2、T3、T4的各整数部对应的码的码长度、码索引Cf1、Cf2、Cf3的码长度、以及与第1~第3子帧的VQ增益码对应的码的码长度等的决定了当前帧中的分配的码长度、以及预先决定的每个帧的固定码长度,与第6实施方式一样,决定第4子帧的VQ增益码比特数等在当前帧中未被决定分配的码长度的分配。
[第6实施方式的变形例4]
作为第6实施方式的变形例,也可以利用当前帧的线性预测信息LPCinfo的码长度、与基音周期T1、T2、T3、T4的各整数部对应的码的码长度、码索引Cf1、Cf2、Cf3的码长度、以及与第1~第3子帧的VQ增益码对应的码的码长度等的决定了在当前帧中的分配的码长度、以及预先决定的每个帧的固定码长度,根据在当前帧中未被决定分配的码长度,变更对于第4子帧的基音增益以及固定码本增益的更新次数(VQ增益码的更新次数)。例如,当在当前帧中未被决定分配的码长度成为规定值以上时,也可以在第4子帧中两次更新基音增益以及固定码本增益,并生成对于各个基音增益的量化值以及固定码本增益的量化值的组合的VQ增益码。
[其他变形例等]
本发明并不限定于上述的实施方式。例如,在上述的各实施方式中,代替以固定比特长度对第2、第4子帧的基音周期的小数部进行编码(例如参照图9A以及B),也可以是与第1、第3子帧一样,对第2、第4子帧的基音周期的小数部,以依赖于各个基音周期的整数部的值的从四倍小数精度到整数精度中的任一个精度进行编码的结构(例如,参照图15A以及图15B)。例如,也可以在基音周期T2的整数部是最小值Tmin以上且小于TA时,以两个比特对基音周期T2的小数值进行编码,在基音周期T2的整数部处于TA至TB时,以一个比特对基音周期T2的小数值进行编码,在基音周期T2的整数部处于TB至最大至Tmax时,不对基音周期T2的小数值进行编码(例如,对于基音周期T3也一样)。由此,能够削减平均比特数,而几乎不影响性能。此外,代替在图2A以及图2B等所示的结构中以固定比特长度对第2、第4子帧的基音周期的小数部进行编码,也可以是与第1、第3子帧一样,对第2、第4子帧的基音周期的小数部,以依赖于各个基音周期的整数部的值的从四倍小数精度至整数精度的任一个精度进行编码的结构。
此外,上述的各实施方式中的差分值TD(α、β)是(基音周期Tα的整数部)-(基音周期Tβ的整数部)或者(基音周期Tβ的整数部)-(基音周期Tα的整数部)。但是,在基音周期的整数部与小数部如图16A那样,分别以固定比特长度表现时,也可以代替差分值TD(α、β)而使用基音周期的上位部的差分值TD’(α、β)[(基音周期Tα的上位部)-(基音周期Tβ的上位部)或者(基音周期Tβ的上位部)-(基音周期Tα的上位部)]。另外,基音周期的上位部是以固定比特长度表现的基音周期的固定上位比特的值,基音周期的下位部是该基音周期的剩余的固定下位比特。此外,基音周期的上位部可以是由基音周期的整数部的所有比特和小数部所包含的一部分的比特(例如,小数比的固定上位比特和固定下位比特)构成的比特(例如,参照图16B),也可以是周期的整数部所包含的一部分比特(例如,整数部的固定上位比特、固定下位比特)(例如,参照图16C)。另外,在代替基音周期的整数部的差分值TD(α、β)而使用基音周期的上位部的差分值TD’(α、β)时,各基音周期的下位部例如直接对数值进行编码。在图9A以及图9B的结构中,在代替基音周期的整数部的差分值TD(α、β)而使用基音周期的上位部的差分值TD’(α、β)时,基音周期的码的结构例如成为如图17A以及图17B。
此外,也可以代替如图9A以及图9B等那样根据基音周期的差分值TD(1、2)以及差分值TD(3、4)的值而对整合了差分值TD(1、2)以及差分值TD(3、4)的值进行可变长度编码,而根据基音周期的整数部的差分值TD(4’、1)以及差分值TD(2、3)的值,对整合了差分值TD(4’、1)以及差分值TD(2、3)的值进行可变长度编码。另外,差分值TD(4’、1)是当前帧的前一帧中的第4子帧的基音周期的整数部与当前帧的第1子帧的基音周期的整数部的差分值。此外,此时,代替基音周期的整数部的差分值TD(α、β),也可以使用基音周期的上位部的差分值TD’(α、β)。
也可以在检索单元中直接求出与量化后的基音增益对应的值和与量化后的固定码本增益对应的值,而非在检索单元求出基音增益与固定码本增益之后求出与量化后的基音增益对应的值和与量化后的固定码本增益对应的值。
此外,至今说明了基于是否满足用于表示周期性和/或稳态性高的条件的两种判断的处理,但还可以延伸到如下情况:将周期性和/或稳态性的程度分类成三种以上,并根据该分类,切换用于表现基音周期的精度和/或基音周期的编码方式。
此外,上述的各种处理并非仅按照记载时序地执行,也可以根据执行处理的装置的处理能力或者需要而并列地或者单独执行。此外,在不脱离本发明的意思的范围内,当然能够适当变更。
此外,在通过计算机来实现上述的结构时,通过程序来记述各装置应具有的功能的处理内容。然后,通过计算机来执行该程序,从而在计算机上实现上述处理功能。
记述了该处理内容的程序可以预先记录在计算机能够读取的记录介质上。作为计算机能够读取的记录介质,例如可以是磁记录装置、光盘、光磁记录介质、半导体存储器等。
此外,该程序的流通例如通过销售、转让、出借记录了该程序的DVD、CD-ROM等可移动记录介质而进行。而且,也可以是如下的结构:预先将该程序存储在服务器计算机的存储装置中,经由网络,从服务器计算机对其他的计算机转发该程序,从而使该程序流通。
执行这样的程序的计算机例如首先将在可移动记录介质中记录的程序或者从服务器计算机转发的程序临时存储在自己的存储装置中。然后,在执行处理时,该计算机读取在自己的记录介质中存储的程序,并根据所读取的程序执行处理。此外,作为该程序的其他的执行方式,计算机也可以从可移动记录介质直接读取程序,并按照该程序执行处理,进一步,也可以在每次从服务器计算机对该计算机转发程序时,依次,按照接受到的程序执行处理。此外,从也可以设为如下结构:从服务器计算机不进行对该计算机的程序的转发,而是通过仅根据执行指示与结果取得而实现处理功能、所谓的ASP(应用服务提供商)型的服务,执行上述的处理。另外,设本方式中的程序中包含为了电子计算机的处理而提供的基于程序的数据(虽然不是对于计算机的直接的指令但是具有用于规定计算机的处理的性质的数据等)。
此外,在本方式中,通过在计算机上执行规定的程序,从而构成本装置,但也可以通过硬件来实现这些处理内容的至少一部分。
标号说明
11、21、31、41、51编码装置
12、22、32、42、52解码装置
117、217、317、417、517参数编码单元
127、227、327、427、527参数解码单元

Claims (9)

1.一种编码方法,具有:
获得与规定时间区间中包含的时序信号对应的基音周期的步骤;以及
输出与所述基音周期对应的码的步骤,
在用于表示所述时序信号的周期性和/或稳态性的高度的指标满足用于表示周期性和/或稳态性高的条件的情况下,在第一搜索范围内搜索所述基音周期,
在所述以外的情况下,在比所述第一搜索范围窄的第二搜索范围内搜索所述基音周期。
2.如权利要求1所述的编码方法,其中,
所述指标包含与所述规定时间区间中包含的任一个时间区间的基音周期对应的值、和与所述规定时间区间中包含的比该时间区间过去的时间区间的基音周期对应的值的差分值的大小,
所述用于表示周期性和/或稳态性高的条件包含如下条件:与所述规定时间区间中包含的任一个时间区间的基音周期对应的值、和与所述规定时间区间中包含的比该时间区间过去的时间区间的基音周期对应的值的差分值的大小比规定值小。
3.一种解码方法,其中,
被输入与规定时间区间对应的码,在所述码中包含的或者根据所述码获得的用于表示周期性和/或稳态性的高低的指标满足用于表示周期性和/或稳态性高的条件的情况下,从所述基音周期的第一搜索范围,解码与在所述码中包含的基音周期对应的码而输出基音周期,
在上述以外的情况下,从比所述第一搜索范围窄的第二搜索范围,解码与在所述码中包含的基音周期对应的码而输出基音周期。
4.如权利要求3所述的解码方法,其中,
所述指标包含与所述规定时间区间中包含的任一个时间区间的基音周期对应的值、和与所述规定时间区间中包含的比该时间区间过去的时间区间的基音周期对应的值的差分值的大小,
所述用于表示周期性和/或稳态性高的条件包含如下条件:与所述规定时间区间中包含的任一个时间区间的基音周期对应的值、和与所述规定时间区间中包含的比该时间区间过去的时间区间的基音周期对应的值的差分值的大小比规定值小。
5.一种编码装置,具有:
获得与规定时间区间中包含的时序信号对应的基音周期的部件;以及
输出与所述基音周期对应的码的部件,
在用于表示所述时序信号的周期性和/或稳态性的高度的指标满足用于表示周期性和/或稳态性高的条件的情况下,在第一搜索范围内搜索所述基音周期,
在所述以外的情况下,在比所述第一搜索范围窄的第二搜索范围内搜索所述基音周期。
6.如权利要求5所述的编码装置,其中,
所述指标包含与所述规定时间区间中包含的任一个时间区间的基音周期对应的值、和与所述规定时间区间中包含的比该时间区间过去的时间区间的基音周期对应的值的差分值的大小,
所述用于表示周期性和/或稳态性高的条件包含如下条件:与所述规定时间区间中包含的任一个时间区间的基音周期对应的值、和与所述规定时间区间中包含的比该时间区间过去的时间区间的基音周期对应的值的差分值的大小比规定值小。
7.一种解码装置,其中,
被输入与规定时间区间对应的码,在所述码中包含的或者根据所述码获得的用于表示周期性和/或稳态性的高低的指标满足用于表示周期性和/或稳态性高的条件的情况下,从所述基音周期的第一搜索范围,解码与在所述码中包含的基音周期对应的码而输出基音周期,
在上述以外的情况下,从比所述第一搜索范围窄的第二搜索范围,解码与在所述码中包含的基音周期对应的码而输出基音周期。
8.如权利要求7所述的解码装置,其中,
所述指标包含与所述规定时间区间中包含的任一个时间区间的基音周期对应的值、和与所述规定时间区间中包含的比该时间区间过去的时间区间的基音周期对应的值的差分值的大小,
所述用于表示周期性和/或稳态性高的条件包含如下条件:与所述规定时间区间中包含的任一个时间区间的基音周期对应的值、和与所述规定时间区间中包含的比该时间区间过去的时间区间的基音周期对应的值的差分值的大小比规定值小。
9.一种用于使计算机执行权利要求1或2的编码方法的各步骤或者权利要求3或4的解码方法的各步骤的程序。
CN201510673204.6A 2010-01-08 2011-01-07 编码方法、解码方法、编码装置、解码装置以及记录介质 Active CN105374362B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2010-002494 2010-01-08
JP2010002494 2010-01-08
CN201180005221.2A CN102687199B (zh) 2010-01-08 2011-01-07 编码方法、解码方法、编码装置、解码装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201180005221.2A Division CN102687199B (zh) 2010-01-08 2011-01-07 编码方法、解码方法、编码装置、解码装置

Publications (2)

Publication Number Publication Date
CN105374362A true CN105374362A (zh) 2016-03-02
CN105374362B CN105374362B (zh) 2019-05-10

Family

ID=44305585

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201180005221.2A Active CN102687199B (zh) 2010-01-08 2011-01-07 编码方法、解码方法、编码装置、解码装置
CN201510673204.6A Active CN105374362B (zh) 2010-01-08 2011-01-07 编码方法、解码方法、编码装置、解码装置以及记录介质

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201180005221.2A Active CN102687199B (zh) 2010-01-08 2011-01-07 编码方法、解码方法、编码装置、解码装置

Country Status (9)

Country Link
US (4) US9812141B2 (zh)
EP (1) EP2523189B1 (zh)
JP (3) JP5314771B2 (zh)
KR (1) KR101381272B1 (zh)
CN (2) CN102687199B (zh)
ES (1) ES2508590T3 (zh)
IN (1) IN2012DN05235A (zh)
RU (1) RU2510974C2 (zh)
WO (1) WO2011083849A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109309548A (zh) * 2018-05-11 2019-02-05 深圳市华星光电技术有限公司 编码方法、设备及可读存储介质

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101381272B1 (ko) 2010-01-08 2014-04-07 니뽄 덴신 덴와 가부시키가이샤 부호화 방법, 복호 방법, 부호화 장치, 복호 장치, 프로그램 및 기록 매체
WO2012111512A1 (ja) * 2011-02-16 2012-08-23 日本電信電話株式会社 符号化方法、復号方法、符号化装置、復号装置、プログラム及び記録媒体
EP3441967A1 (en) 2011-04-05 2019-02-13 Nippon Telegraph and Telephone Corporation Decoding method, decoder, program, and recording medium
CN107342094B (zh) 2011-12-21 2021-05-07 华为技术有限公司 非常短的基音周期检测和编码
WO2013129439A1 (ja) * 2012-02-28 2013-09-06 日本電信電話株式会社 符号化装置、この方法、プログラム及び記録媒体
JP5762636B2 (ja) * 2012-07-05 2015-08-12 日本電信電話株式会社 符号化装置、復号装置、これらの方法、プログラム、および記録媒体
ES2657039T3 (es) * 2012-10-01 2018-03-01 Nippon Telegraph And Telephone Corporation Método de codificación, dispositivo de codificación, programa, y medio de grabación
KR102148407B1 (ko) * 2013-02-27 2020-08-27 한국전자통신연구원 소스 필터를 이용한 주파수 스펙트럼 처리 장치 및 방법
ES2768090T3 (es) * 2014-03-24 2020-06-19 Nippon Telegraph & Telephone Método de codificación, codificador, programa y soporte de registro
ES2738723T3 (es) 2014-05-01 2020-01-24 Nippon Telegraph & Telephone Dispositivo de generación de secuencia envolvente combinada periódica, método de generación de secuencia envolvente combinada periódica, programa de generación de secuencia envolvente combinada periódica y soporte de registro
US10325609B2 (en) * 2015-04-13 2019-06-18 Nippon Telegraph And Telephone Corporation Coding and decoding a sound signal by adapting coefficients transformable to linear predictive coefficients and/or adapting a code book
US9837089B2 (en) * 2015-06-18 2017-12-05 Qualcomm Incorporated High-band signal generation
US10847170B2 (en) 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges
WO2018180974A1 (ja) * 2017-03-28 2018-10-04 株式会社神戸製鋼所 タイヤ試験方法及びタイヤ試験装置
CN111033620B (zh) 2017-08-24 2023-11-21 株式会社半导体能源研究所 读出放大器、半导体装置及它们的工作方法以及电子设备
US11270719B2 (en) * 2017-12-01 2022-03-08 Nippon Telegraph And Telephone Corporation Pitch enhancement apparatus, pitch enhancement method, and program
US11699451B2 (en) * 2018-07-02 2023-07-11 Dolby Laboratories Licensing Corporation Methods and devices for encoding and/or decoding immersive audio signals
JP7311319B2 (ja) * 2019-06-19 2023-07-19 ファナック株式会社 時系列データ表示装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6094630A (en) * 1995-12-06 2000-07-25 Nec Corporation Sequential searching speech coding device
JP2002268696A (ja) * 2001-03-13 2002-09-20 Nippon Telegr & Teleph Corp <Ntt> 音響信号符号化方法、復号化方法及び装置並びにプログラム及び記録媒体
CN1465044A (zh) * 2001-06-15 2003-12-31 索尼公司 声信号编码方法和设备、解码方法和设备及记录介质
CN1484823A (zh) * 2000-11-30 2004-03-24 松下电器产业株式会社 音频解码器和音频解码方法
US20040111256A1 (en) * 2000-10-26 2004-06-10 Hirohisa Tasaki Voice encoding method and apparatus
CN1672193A (zh) * 2002-07-31 2005-09-21 摩托罗拉公司 用于语音帧误差降低的语音通信单元和方法
CN101197576A (zh) * 2006-12-07 2008-06-11 上海杰得微电子有限公司 一种音频信号编码、解码方法
CN101615395A (zh) * 2008-12-31 2009-12-30 华为技术有限公司 信号编码、解码方法及装置、系统

Family Cites Families (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3566035A (en) * 1969-07-17 1971-02-23 Bell Telephone Labor Inc Real time cepstrum analyzer
JPS6323200A (ja) 1987-06-29 1988-01-30 日本電気株式会社 ピッチ抽出装置
US5396576A (en) * 1991-05-22 1995-03-07 Nippon Telegraph And Telephone Corporation Speech coding and decoding methods using adaptive and random code books
JP3226180B2 (ja) * 1992-04-09 2001-11-05 日本電信電話株式会社 音声のピッチ周期符号化法
US5734789A (en) * 1992-06-01 1998-03-31 Hughes Electronics Voiced, unvoiced or noise modes in a CELP vocoder
JP3353852B2 (ja) * 1994-02-15 2002-12-03 日本電信電話株式会社 音声の符号化方法
US5732389A (en) * 1995-06-07 1998-03-24 Lucent Technologies Inc. Voiced/unvoiced classification of speech for excitation codebook selection in celp speech decoding during frame erasures
US5794185A (en) * 1996-06-14 1998-08-11 Motorola, Inc. Method and apparatus for speech coding using ensemble statistics
JP3435310B2 (ja) 1997-06-12 2003-08-11 株式会社東芝 音声符号化方法および装置
JPH11184500A (ja) * 1997-12-24 1999-07-09 Fujitsu Ltd 音声符号化方式及び音声復号化方式
TW358925B (en) * 1997-12-31 1999-05-21 Ind Tech Res Inst Improvement of oscillation encoding of a low bit rate sine conversion language encoder
CA2252170A1 (en) * 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
US6456964B2 (en) * 1998-12-21 2002-09-24 Qualcomm, Incorporated Encoding of periodic speech using prototype waveforms
AU4072400A (en) * 1999-04-05 2000-10-23 Hughes Electronics Corporation A voicing measure as an estimate of signal periodicity for frequency domain interpolative speech codec system
US6636829B1 (en) * 1999-09-22 2003-10-21 Mindspeed Technologies, Inc. Speech communication system and method for handling lost frames
US6581032B1 (en) * 1999-09-22 2003-06-17 Conexant Systems, Inc. Bitstream protocol for transmission of encoded voice signals
US20070110042A1 (en) * 1999-12-09 2007-05-17 Henry Li Voice and data exchange over a packet based network
WO2001052241A1 (en) * 2000-01-11 2001-07-19 Matsushita Electric Industrial Co., Ltd. Multi-mode voice encoding device and decoding device
US6757654B1 (en) * 2000-05-11 2004-06-29 Telefonaktiebolaget Lm Ericsson Forward error correction in speech coding
US6898566B1 (en) * 2000-08-16 2005-05-24 Mindspeed Technologies, Inc. Using signal to noise ratio of a speech signal to adjust thresholds for extracting speech parameters for coding the speech signal
US6760698B2 (en) * 2000-09-15 2004-07-06 Mindspeed Technologies Inc. System for coding speech information using an adaptive codebook with enhanced variable resolution scheme
US6820054B2 (en) * 2001-05-07 2004-11-16 Intel Corporation Audio signal processing for speech communication
US6871176B2 (en) * 2001-07-26 2005-03-22 Freescale Semiconductor, Inc. Phase excited linear prediction encoder
CA2365203A1 (en) * 2001-12-14 2003-06-14 Voiceage Corporation A signal modification method for efficient coding of speech signals
US20040002856A1 (en) * 2002-03-08 2004-01-01 Udaya Bhaskar Multi-rate frequency domain interpolative speech CODEC system
CA2388439A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for efficient frame erasure concealment in linear predictive based speech codecs
CA2392640A1 (en) * 2002-07-05 2004-01-05 Voiceage Corporation A method and device for efficient in-based dim-and-burst signaling and half-rate max operation in variable bit-rate wideband speech coding for cdma wireless systems
CA2415105A1 (en) * 2002-12-24 2004-06-24 Voiceage Corporation A method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding
US7146309B1 (en) * 2003-09-02 2006-12-05 Mindspeed Technologies, Inc. Deriving seed values to generate excitation values in a speech coder
CN1989548B (zh) * 2004-07-20 2010-12-08 松下电器产业株式会社 语音解码装置及补偿帧生成方法
CN101116137B (zh) * 2005-02-10 2011-02-09 松下电器产业株式会社 语音编码中的脉冲分配方法
JP5058152B2 (ja) * 2006-03-10 2012-10-24 パナソニック株式会社 符号化装置および符号化方法
US20070217579A1 (en) * 2006-03-20 2007-09-20 Arun Sobti System and method for enhanced voice mail
US8135047B2 (en) * 2006-07-31 2012-03-13 Qualcomm Incorporated Systems and methods for including an identifier with a packet associated with a speech signal
JP2008058667A (ja) * 2006-08-31 2008-03-13 Sony Corp 信号処理装置および方法、記録媒体、並びにプログラム
PT2102619T (pt) * 2006-10-24 2017-05-25 Voiceage Corp Método e dispositivo para codificação de tramas de transição em sinais de voz
US9037474B2 (en) * 2008-09-06 2015-05-19 Huawei Technologies Co., Ltd. Method for classifying audio signal into fast signal or slow signal
US8718804B2 (en) * 2009-05-05 2014-05-06 Huawei Technologies Co., Ltd. System and method for correcting for lost data in a digital audio signal
EP2335522B1 (en) 2009-12-18 2012-02-29 Borghi S.P.A. Tufting tool for an apparatus for producing brushes or brooms
KR101381272B1 (ko) * 2010-01-08 2014-04-07 니뽄 덴신 덴와 가부시키가이샤 부호화 방법, 복호 방법, 부호화 장치, 복호 장치, 프로그램 및 기록 매체
WO2012111512A1 (ja) * 2011-02-16 2012-08-23 日本電信電話株式会社 符号化方法、復号方法、符号化装置、復号装置、プログラム及び記録媒体

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6094630A (en) * 1995-12-06 2000-07-25 Nec Corporation Sequential searching speech coding device
US20040111256A1 (en) * 2000-10-26 2004-06-10 Hirohisa Tasaki Voice encoding method and apparatus
CN1484823A (zh) * 2000-11-30 2004-03-24 松下电器产业株式会社 音频解码器和音频解码方法
JP2002268696A (ja) * 2001-03-13 2002-09-20 Nippon Telegr & Teleph Corp <Ntt> 音響信号符号化方法、復号化方法及び装置並びにプログラム及び記録媒体
CN1465044A (zh) * 2001-06-15 2003-12-31 索尼公司 声信号编码方法和设备、解码方法和设备及记录介质
CN1672193A (zh) * 2002-07-31 2005-09-21 摩托罗拉公司 用于语音帧误差降低的语音通信单元和方法
CN101197576A (zh) * 2006-12-07 2008-06-11 上海杰得微电子有限公司 一种音频信号编码、解码方法
CN101615395A (zh) * 2008-12-31 2009-12-30 华为技术有限公司 信号编码、解码方法及装置、系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109309548A (zh) * 2018-05-11 2019-02-05 深圳市华星光电技术有限公司 编码方法、设备及可读存储介质

Also Published As

Publication number Publication date
US10056088B2 (en) 2018-08-21
US10049679B2 (en) 2018-08-14
EP2523189B1 (en) 2014-09-03
EP2523189A1 (en) 2012-11-14
CN102687199A (zh) 2012-09-19
JP2013137574A (ja) 2013-07-11
US20180040329A1 (en) 2018-02-08
US20180047402A1 (en) 2018-02-15
KR20120089349A (ko) 2012-08-09
US20180040330A1 (en) 2018-02-08
JP5627144B2 (ja) 2014-11-19
IN2012DN05235A (zh) 2015-10-23
RU2510974C2 (ru) 2014-04-10
EP2523189A4 (en) 2013-08-14
JPWO2011083849A1 (ja) 2013-05-16
KR101381272B1 (ko) 2014-04-07
JP5314771B2 (ja) 2013-10-16
RU2012127132A (ru) 2014-02-27
CN105374362B (zh) 2019-05-10
US20120265525A1 (en) 2012-10-18
JP5442887B2 (ja) 2014-03-12
JP2013156649A (ja) 2013-08-15
WO2011083849A1 (ja) 2011-07-14
CN102687199B (zh) 2015-11-25
US9812141B2 (en) 2017-11-07
ES2508590T3 (es) 2014-10-16
US10049680B2 (en) 2018-08-14

Similar Documents

Publication Publication Date Title
CN102687199B (zh) 编码方法、解码方法、编码装置、解码装置
CN103370880B (zh) 编码方法、解码方法、编码装置以及解码装置
KR101152707B1 (ko) 다단계 양자화 방법 및 장치
JP5893153B2 (ja) 符号化方法、符号化装置、プログラム、および記録媒体
RU2005137320A (ru) Способ и устройство для квантования усиления в широкополосном речевом кодировании с переменной битовой скоростью передачи
JP3143956B2 (ja) 音声パラメータ符号化方式
US7965206B2 (en) Apparatus and method of lossless coding and decoding
CN101996637A (zh) 长期预测编码和长期预测解码的方法和装置
US8576910B2 (en) Parameter selection method, parameter selection apparatus, program, and recording medium
CN101266795B (zh) 一种格矢量量化编解码的实现方法及装置
KR101826237B1 (ko) 부호화 방법, 부호화 장치, 프로그램 및 기록 매체
EP2352230B1 (en) Signal encoding method and signal encoding device for a speech or audio signal
CN102239640B (zh) 编码方法、解码方法、使用这些方法的装置
CN101073272A (zh) 减小量化噪音的方法
Xydeas et al. A long history quantization approach to scalar and vector quantization of LSP coefficients
US20010044716A1 (en) Encoding and decoding system using code books
Czihó et al. Signal Compression using finite state vector quantization with optimized state codebook size
KR20010040902A (ko) 분리 벡터 양자화 데이터 부호화를 제공하기 위한 시스템및 방법
Mohammadi et al. Efficient coding of speech spectral envelope using a non-linear two-dimensional predictive method in the index domain
CN101436408A (zh) 矢量量化方法及矢量量化器

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant