CN110415715A - 线性预测分析装置、方法、程序以及记录介质 - Google Patents

线性预测分析装置、方法、程序以及记录介质 Download PDF

Info

Publication number
CN110415715A
CN110415715A CN201910634756.4A CN201910634756A CN110415715A CN 110415715 A CN110415715 A CN 110415715A CN 201910634756 A CN201910634756 A CN 201910634756A CN 110415715 A CN110415715 A CN 110415715A
Authority
CN
China
Prior art keywords
coefficient
value
pitch gain
correlation
linear prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910634756.4A
Other languages
English (en)
Other versions
CN110415715B (zh
Inventor
镰本优
守谷健弘
原田登
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Powering Service Co Ltd
Original Assignee
Nippon Powering Service Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Powering Service Co Ltd filed Critical Nippon Powering Service Co Ltd
Publication of CN110415715A publication Critical patent/CN110415715A/zh
Application granted granted Critical
Publication of CN110415715B publication Critical patent/CN110415715B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/12Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/21Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Complex Calculations (AREA)

Abstract

自相关计算部(21)根据输入信号计算自相关RO(i)。预测系数计算部(23)利用将系数wO(i)和自相关RO(i)进行乘法的值即变形自相关R'O(i)而进行线性预测分析。在此,包含如下情况:对至少一部分各阶数i,与各阶数i对应的系数wO(i)处于随着与当前或过去的帧中的输入信号的基音增益有正相关关系的值的增加而单调递减的关系。

Description

线性预测分析装置、方法、程序以及记录介质
本申请是以下发明专利申请的分案申请:申请号:201580005196.6,申请日:2015年1月20日,发明名称:“线性预测分析装置、方法、程序以及记录介质”。
技术领域
本发明涉及语音信号、声音信号、心电图、脑波、脑磁图、地震波等数字时序信号的分析技术。
背景技术
在语音信号、声音信号的编码中,广泛使用基于对所输入的语音信号或声音信号进行线性预测分析而获得的预测系数进行编码的方法(例如,参照非专利文献1、2)。
在非专利文献1至3中,通过图11中例示的线性预测分析装置来计算预测系数。线性预测分析装置1具有自相关计算部11、系数乘法部12以及预测系数计算部13。
被输入的时域的数字语音信号或数字声音信号即输入信号按照每个N样本的帧进行处理。将在当前时刻设为处理对象的帧即当前帧的输入信号设为XO(n)(n=0,1,…,N-1)。n表示输入信号中的各样本的样本编号,N是预定的正整数。在此,当前帧的前一帧的输入信号为XO(n)(n=-N,-N+1,…,-1),当前帧的后一帧的输入信号为XO(n)(n=N,N+1,…,2N-1)。
[自相关计算部11]
线性预测分析装置1的自相关计算部11根据输入信号XO(n)通过式(11)求出自相关RO(i)(i=0,1,…,Pmax,Pmax是预测系数)而输出。Pmax是小于N的预定的正整数。
【数1】
[系数乘法部12]
接着,由系数乘法部12按照相同的i对从自相关计算部11输出的自相关RO(i)乘以预先决定的系数wO(i)(i=0,1,…,Pmax),从而求出变形自相关R'O(i)(i=0,1,…,Pmax)。即,通过式(12)求出变形自相关函数R'O(i)。
【数2】
R'O(i)=RO(i)×wO(i)(12)
[预测系数计算部13]
然后,由预测系数计算部13利用从系数乘法部12输出的变形自相关R'O(i)例如通过Levinson-Durbin法等,求出可变换为1阶至作为预先决定的预测系数的Pmax阶为止的线性预测系数的系数。可变换为线性预测系数的系数是PARCOR系数KO(1),KO(2),…,KO(Pmax)或线性预测系数aO(1),aO(2),…,aO(Pmax)等。
在非专利文献1即国际标准ITU-T G.718或非专利文献2即国际标准ITU-T G.729中,作为系数wO(i)而利用预先决定的60Hz带宽的固定的系数。
具体地,系数wO(i)如式(13)那样利用指数函数而定义,在式(13)中,使用f0=60Hz这样的固定值。fs是采样频率。
【数3】
在非专利文献3中,记载了利用基于上述的指数函数以外的函数的系数的例子。但是,在此所利用的函数是基于采样周期τ(相当于对应于fs的周期)与预定的常数a的函数,依然使用了固定值的系数。
现有技术文献
非专利文献
非专利文献1:ITU-T Recommendation G.718,ITU,2008
非专利文献2:ITU-T Recommendation G.729,ITU,1996
非专利文献3:Yoh’ichi Tohkura,Fumitada Itakura,Shin’ichiro Hashimoto,“Spectral Smoothing Technique in PARCOR Speech Analysis-Synthesis”,IEEETrans.On Acoustics,Speech,and Signal Processing,Vol.ASSP-26,No.6,1978
发明内容
在以往的语音信号、声音信号的编码中所使用的线性预测分析方法中,利用对自相关RO(i)乘以固定的系数wO(i)而获得的变形自相关R'O(i),求出可变换为线性预测系数的系数。从而,即使如不需要对自相关RO(i)乘以系数wO(i)的变形那样的、即不是利用变形自相关R'O(i)而是利用自相关RO(i)本身从而求出可变换为线性预测系数的系数,也会存在如下的可能性:当在与可变换为线性预测系数的系数对应的频谱包络中频谱的尖峰不会过大的输入信号的情况下,通过对自相关RO(i)乘以系数wO(i),与通过变形自相关R'O(i)而求出的可变换为线性预测系数的系数对应的频谱包络与输入信号XO(n)的频谱包络近似的精度会下降,即线性预测分析的精度会下降。
本发明的目的在于,提供分析精度比以往高的线性预测分析方法、装置、程序以及记录介质。
用于解决课题的手段
本发明的一个方式的线性预测分析方法是按照作为规定时间区间的帧,求出可变换为与输入时序信号对应的线性预测系数的系数的线性预测分析方法,所述线性预测分析方法包含:自相关计算步骤,至少针对各i=0,1,…,Pmax,计算当前帧的输入时序信号XO(n)与i样本之前的输入时序信号XO(n-i)或i样本之后的输入时序信号XO(n+i)之间的自相关RO(i);以及预测系数计算步骤,利用将系数wO(i)与自相关RO(i)按照对应的每个i进行乘法后的值即变形自相关R'O(i),求出可变换为1阶至Pmax阶为止的线性预测系数的系数,包含如下情况:对至少一部分各阶数i,与各阶数i对应的系数wO(i)处于随着与当前或过去的帧中的输入时序信号的周期性的强度或基于输入时序信号的基音增益有正相关关系的值的增加而单调递减的关系。
本发明的一个方式的线性预测分析方法是按照作为规定时间区间的帧,求出可变换为与输入时序信号对应的线性预测系数的系数的线性预测分析方法,所述线性预测分析方法包含:自相关计算步骤,至少针对各i=0,1,…,Pmax,计算当前帧的输入时序信号XO(n)与i样本之前的输入时序信号XO(n-i)或i样本之后的输入时序信号XO(n+i)之间的自相关RO(i);系数决定步骤,设在两个以上的系数表格各自中对应地存储有i=0,1,…,Pmax的各阶数i以及与各阶数i对应的系数wO(i),利用与当前或过去帧中的输入时序信号的周期性的强度或基于输入时序信号的基音增益有正相关关系的值,从两个以上的系数表格中的一个系数表格取得系数wO(i);以及预测系数计算步骤,利用将所取得的系数wO(i)与自相关RO(i)按照对应的每个i进行乘法后的值即变形自相关R'O(i),求出可变换为1阶至Pmax阶为止的线性预测系数的系数,将两个以上的系数表格中的、当与周期性的强度或基音增益有正相关关系的值是第一值的情况下在系数决定步骤中取得系数wO(i)的系数表格作为第一系数表格,将两个以上的系数表格中的、当与周期性的强度或基音增益有正相关关系的值是比第一值小的第二值的情况下在系数决定步骤中取得系数wO(i)的系数表格作为第二系数表格,对至少一部分各阶数i,第二系数表格中的与各阶数i对应的系数大于第一系数表格中的与各阶数i对应的系数。
本发明的一个方式的线性预测分析方法是按照作为规定时间区间的帧,求出可变换为与输入时序信号对应的线性预测系数的系数的线性预测分析方法,所述线性预测分析方法包含:自相关计算步骤,至少针对各i=0,1,…,Pmax,计算当前帧的输入时序信号XO(n)与i样本之前的输入时序信号XO(n-i)或i样本之后的输入时序信号XO(n+i)之间的自相关RO(i);系数决定步骤,设在系数表格t0中存储有系数wt0(i),在系数表格t1中存储有系数wt1(i),在系数表格t2中存储有系数wt2(i),利用与当前或过去帧中的输入时序信号的周期性的强度或基于输入时序信号的基音增益有正相关关系的值,从系数表格t0、t1、t2中的一个系数表格取得系数;以及预测系数计算步骤,利用将取得的系数与自相关RO(i)按照对应的每个i进行乘法后的值即变形自相关R'O(i),求出可变换为1阶至Pmax阶为止的线性预测系数的系数,设根据与周期性的强度或基音增益有正相关关系的值,被分类为周期性的强度或基音增益大的情况、周期性的强度或基音增益是中等程度的情况、以及周期性的强度或基音增益小的情况的任一个情况,在周期性的强度或基音增益大的情况下将在系数决定步骤中取得系数的系数表格设为系数表格t0,在周期性的强度或基音增益是中等程度的情况下将在系数决定步骤中取得系数的系数表格设为系数表格t1,在周期性的强度或基音增益小的情况下将在系数决定步骤中取得系数的系数表格设为系数表格t2,从而针对至少一部分i是wt0(i)<wt1(i)≦wt2(i),针对除此之外的i中的至少一部分各i是wt0(i)≦wt1(i)<wt2(i),针对剩余的各i是wt0(i)≦wt1(i)≦wt2(i)。
本发明的一个方式的线性预测分析方法是按照作为规定时间区间的帧,求出可变换为与输入时序信号对应的线性预测系数的系数的线性预测分析方法,所述线性预测分析方法包含:自相关计算步骤,至少针对各i=0,1,…,Pmax,计算当前帧的输入时序信号XO(n)与i样本之前的输入时序信号XO(n-i)或i样本之后的输入时序信号XO(n+i)之间的自相关RO(i);以及预测系数计算步骤,利用将系数wO(i)与所述自相关RO(i)按照对应的每个i进行乘法后的值即变形自相关R'O(i),求出可变换为1阶至Pmax阶为止的线性预测系数的系数,还包含系数决定步骤,设在两个以上的系数表格各自中存储有系数wO(i),利用与当前或过去帧中的输入时序信号的周期性的强度或基于输入时序信号的基音增益有正相关关系的值,从所述两个以上的系数表格中的一个系数表格取得系数wO(i),将所述两个以上的系数表格中的、当与所述周期性的强度或基音增益有正相关关系的值是第一值的情况下在所述系数决定步骤中取得系数wO(i)的系数表格作为第一系数表格,将所述两个以上的系数表格中的、当与所述周期性的强度或基音增益有正相关关系的值是比第一值小的第二值的情况下在所述系数决定步骤中取得系数wO(i)的系数表格作为第二系数表格,对至少一部分各阶数i,所述第二系数表格中的与所述各阶数i对应的系数大于所述第一系数表格中的与所述各阶数i对应的系数。
本发明的一个方式的线性预测分析装置是按照作为规定时间区间的帧,求出可变换为与输入时序信号对应的线性预测系数的系数的线性预测分析装置,所述线性预测分析装置包含:自相关计算部,至少针对各i=0,1,…,Pmax,计算当前帧的输入时序信号XO(n)与i样本之前的输入时序信号XO(n-i)或i样本之后的输入时序信号XO(n+i)之间的自相关RO(i);以及预测系数计算部,利用将系数wO(i)与所述自相关RO(i)按照对应的每个i进行乘法后的值即变形自相关R'O(i),求出可变换为1阶至Pmax阶为止的线性预测系数的系数,还包含系数决定部,设在两个以上的系数表格各自中存储有系数wO(i),利用与当前或过去帧中的输入时序信号的周期性的强度或基于输入时序信号的基音增益有正相关关系的值,从所述两个以上的系数表格中的一个系数表格取得系数wO(i),将所述两个以上的系数表格中的、当与所述周期性的强度或基音增益有正相关关系的值是第一值的情况下在所述系数决定部中取得系数wO(i)的系数表格作为第一系数表格,将所述两个以上的系数表格中的、当与所述周期性的强度或基音增益有正相关关系的值是比第一值小的第二值的情况下在所述系数决定部中取得系数wO(i)的系数表格作为第二系数表格,对至少一部分各阶数i,所述第二系数表格中的与所述各阶数i对应的系数大于所述第一系数表格中的与所述各阶数i对应的系数。
发明效果
能够实现分析精度比以往高的线性预测。
附图说明
图1是用于说明第一实施方式以及第二实施方式的线性预测装置的例子的模块图。
图2是用于说明线性预测分析方法的例子的流程图。
图3是用于说明第二实施方式的线性预测分析方法的例子的流程图。
图4是用于说明第三实施方式的线性预测装置的例子的模块图。
图5是用于说明第三实施方式的线性预测分析方法的例子的流程图。
图6是用于说明第三实施方式的具体例的图。
图7是用于说明变形例的模块图。
图8是用于说明变形例的模块图。
图9是用于说明变形例的流程图。
图10是用于说明第四实施方式的线性预测分析装置的例子的模块图。
图11是用于说明以往的线性预测装置的例子的模块图。
具体实施方式
以下,参照附图说明线性预测分析装置以及方法的各实施方式。
[第一实施方式]
如图1所示,第一实施方式的线性预测分析装置2例如具有自相关计算部21、系数决定部24、系数乘法部22以及预测系数计算部23。自相关计算部21、系数乘法部22以及预测系数计算部23的动作分别与以往的线性预测分析装置1的自相关计算部11、系数乘法部12以及预测系数计算部13的动作相同。
线性预测分析装置2中被输入作为预定时间区间即每个帧的时域的数字语音信号或数字声音信号或心电图、脑波、脑磁图、地震波等数字信号的输入信号XO(n)。输入信号是输入时序信号。将当前帧的输入信号设为XO(n)(n=0,1,…,N-1)。n表示输入信号中的各样本的样本编号,N是预定的正整数。在此,当前帧的前一帧的输入信号为XO(n)(n=-N,-N+1,…,-1),当前帧的后一帧的输入信号为XO(n)(n=N,N+1,…,2N-1)。以下,说明输入信号XO(n)是数字语音信号或数字声音信号的情况。输入信号XO(n)(n=0,1,…,N-1)可以是被拾音的信号本身,也可以是为了分析而改变了采样率的信号,也可以是被进行了预加重处理的信号,也可以是加窗后的信号。
此外,在线性预测分析装置2中,还输入有关每个帧的数字语音信号或数字声音信号的基音增益的信息。有关基音增益的信息通过处于线性预测分析装置2外的基音增益计算部950而求出。
基音增益是每个帧的输入信号的周期性的强度。基音增益是例如针对输入信号或其线性预测残差信号的具有基音周期量的时间差的信号之间的进行了标准化的相关。
[基音增益计算部950]
基音增益计算部950根据当前帧的输入信号XO(n)(n=0,1,…,N-1)和/或当前帧的附近帧的输入信号的所有或者一部分,求出基音增益G。基音增益计算部950例如求出包含当前帧的输入信号XO(n)(n=0,1,…,N-1)的所有或者一部分的信号区间的数字语音信号或数字声音信号的基音增益G,并将能够确定基音增益G的信息作为有关基音增益的信息而输出。作为求出基音增益的方法,存在各种公知的方法,因此可以利用公知的任意的方法。此外,也可以设为对所求出的基音增益G进行编码而获得基音增益码的结构,并将基音增益码作为有关基音增益的信息而输出。进而,也可以设为获得与基音增益码对应的基音增益的量化值^G的结构,并将基音增益的量化值^G设为有关基音增益的信息而输出。以下,说明基音增益计算部950的具体例。
<基音增益计算部950的具体例1>
基音增益计算部950的具体例1是当前帧的输入信号XO(n)(n=0,1,…,N-1)由多个子帧构成且针对相同的子帧由基音增益计算部950先于线性预测分析装置2而动作的情况下的例子。基音增益计算部950首先求出作为2以上的整数的M个子帧即XOs1(n)(n=0,1,…,N/M-1),…,XOsM(n)(n=(M-1)N/M,(M-1)N/M+1,…,N-1)各自的基音增益即Gs1,…,GsM。设N被M整除。基音增益计算部950将可确定构成当前帧的M个子帧的基音增益即Gs1,…,GsM中的最大值max(Gs1,…,GsM)的信息作为与基音增益有关的信息而输出。
<基音增益计算部950的具体例2>
基音增益计算部950的具体例2是如下情况下的例子:当前帧的输入信号XO(n)(n=0,1,…,N-1)与后一帧的一部分输入信号XO(n)(n=N,N+1,…,N+Nn-1)(其中,Nn是满足Nn<N的关系的预定的正整数)中,包含先读到的部分的信号区间构成为当前帧的信号区间,而且针对同一帧,基音增益计算部950在线性预测分析装置2之后工作。基音增益计算部950针对当前帧的信号区间,求出作为当前帧的输入信号XO(n)(n=0,1,…,N-1)与后一帧的一部分输入信号XO(n)(n=N,N+1,…,N+Nn-1)各自的基音增益的Gnow、Gnext,并将基音增益Gnext存储在基音增益计算部950。基音增益计算部950还将能够确定针对前一帧的信号区间求出后存储在基音增益计算部950中的基音增益Gnext、即前一帧的信号区间中针对当前帧的一部分输入信号XO(n)(n=0,1,…,Nn-1)而求出的基音增益的信息作为有关基音增益的信息来输出。另外,与具体例1同样地,也可以针对当前帧求出每多个子帧的基音增益。
<基音增益计算部950的具体例3>
基音增益计算部950的具体例3是如下情况下的例子:当前帧的输入信号XO(n)(n=0,1,…,N-1)本身作为当前帧的信号区间而构成,而且针对同一帧,基音增益计算部950在线性预测分析装置2之后工作。基音增益计算部950求出作为当前帧的信号区间的当前帧的输入信号XO(n)(n=0,1,…,N-1)的基音增益G,并将基音增益G存储在基音增益计算部950。基音增益计算部950还将能够确定针对前一帧的信号区间、即前一帧的输入信号XO(n)(n=-N,-N+1,…,-1)求出后存储在基音增益计算部950中的基音增益G的信息作为有关基音增益的信息而输出。
以下、说明线性预测分析装置2的动作。图2是线性预测分析装置2的线性预测分析方法的流程图。
[自相关计算部21]
自相关计算部21根据被输入的每N个样本的帧的时域上的数字语音信号或数字声音信号即输入信号XO(n)(n=0,1,…,N-1),计算自相关RO(i)(i=0,1,…,Pmax)(步骤S1)。Pmax是能够变换为由预测系数计算部23求出的线性预测系数的系数的最大阶数,是小于N的预定的正整数。所计算的自相关RO(i)(i=0,1,…,Pmax)被提供给系数乘法部22。
自相关计算部21利用输入信号XO(n),例如通过式(14A)计算自相关RO(i)(i=0,1,…,Pmax)而输出。即,计算当前帧的输入时序信号XO(n)与i样本之前的输入时序信号XO(n-i)之间的自相关RO(i)。
【数4】
此外,自相关计算部21利用输入信号XO(n),例如通过式(14B),计算自相关RO(i)(i=0,1,…,Pmax)。即,计算当前帧的输入时序信号XO(n)与i样本后的输入时序信号XO(n+i)之间的自相关RO(i)。
此外,自相关计算部21也可以求出与输入信号XO(n)对应的功率谱之后,按照Wiener-Khinchin的定理计算自相关RO(i)(i=0,1,…,Pmax)。此外,在任何一种方法中,也都可以如输入信号XO(n)(n=-Np,-Np+1,…,-1,0,1,…,N-1,N,…,N-1+Nn)那样进一步还利用前后帧的一部分输入信号而计算自相关RO(i)。这里,Np、Nn分别是满足Np<N、Nn<N的关系的预定的正整数。或者,也可以将MDCT序代替用作功率谱的近似,根据被近似的功率谱求出自相关。以此方式,自相关的计算方法利用世上所使用的现有技术的任何一种即可。
[系数决定部24]
系数决定部24利用被输入的有关基音增益的信息,决定系数wO(i)(i=0,1,…,Pmax)(步骤S4)。系数wO(i)是用于对自相关RO(i)进行变形的系数。系数wO(i)是在信号处理的领域又被称为滞后窗wO(i)或者滞后窗系数wO(i)的系数。由于系数wO(i)是正值,所以会将系数wO(i)大于/小于预定的值表现为系数wO(i)的大小大于/小于预定的值。此外,设wO(i)的大小表示该wO(i)的值。
输入到系数决定部24的有关基音增益的信息是确定根据当前帧的输入信号和/或当前帧的附近的帧的全部或一部分输入信号而求出的基音增益的信息。即,用于决定系数wO(i)的基音增益是根据当前帧的输入信号和/或当前帧的附近的帧的全部或一部分输入信号而求出的基音增益。
系数决定部24针对0阶至Pmax阶的所有或者一部分阶数,将在与有关基音增益的信息对应的基音增益的所有或一部分采用范围中与有关基音增益的信息对应的基音增益越大其值越小的值决定为wO(0),wO(1),…,wO(Pmax)。此外,系数决定部24也可以代替基音增益而利用与基音增益具有正相关关系的值,将基音增益越大其值越小的值决定为系数wO(0),wO(1),…,wO(Pmax)。
即,系数wO(i)(i=0,1,…,Pmax)被决定为包含如下的情况:对至少一部分预测阶数i,与该阶数i对应的系数wO(i)的大小处于随着与包含当前帧的全部或一部分输入信号XO(n)的信号区间的基音增益具有正相关关系的值的增加而单调递减的关系
换言之,如后所述,根据阶数i,系数wO(i)的大小也可以不随着与基音增益具有正相关关系的值的增加而单调递减。
此外,设在与基音增益具有正相关关系的值的可采用范围内,系数wO(i)的大小也可以有一定的范围,而和与基音增益具有正相关关系的值的增加无关,但在其他范围内系数wO(i)的大小随着与基音增益具有正相关关系的值的增加而单调递减。
系数决定部24例如利用关于与被输入的有关基音增益的信息对应的基音增益的单调非递增函数,决定系数wO(i)。例如,根据利用了比0大的预先决定的值即α的以下的式(2),决定系数wO(i)。在式(2)中,G表示与被输入的有关基音增益的信息对应的基音增益。α是作为滞后窗而取系数wO(i)时的滞后窗的宽度的值、换言之是用于调整滞后窗的强度的值。预先决定的α只要如下决定即可:例如,关于多个α的候选值,在包含线性预测分析装置2的编码装置以及与该编码装置对应的解码装置中对语音信号或声音信号进行编码解码,从而选择解码语音信号和解码声音信号的主观质量和客观质量良好的候选值作为α。
【数6】
此外,也可以通过利用了针对基音增益G的预先决定的函数f(G)的以下的式(2A),决定系数wO(i)。函数f(G)是f(G)=αG+β(α为正数,β为任意数)、f(G)=αG2+βG+γ(α是正数,β、γ是任意的数)等与基音增益G有正相关关系且针对基音增益G成为单调非递减的关系的函数。
【数7】
此外,利用基音增益G决定系数wO(i)的式并不限定于上述的(2)、(2A),只要是能够记载针对与基音增益有正相关关系的值的增加而单调非递增的关系的式,也可以是其他的式。例如,也可以通过以下的式(3)至(6)的任意一个决定系数wO(i)。在以下的式(3)至(6)的式中,将α设为依赖于基音增益而决定的实数,将m设为依赖于基音增益而决定的自然数。例如,将a设为与基音增益有负相关关系的值,将m设为与基音增益有负相关关系的值。τ是采样周期。
【数8】
wo(i)=1-τi/a,i=0,1,...,Pmax (3)
式(3)是被称为巴特利特窗(Bartlett window)的形式的窗函数,式(4)是由二项式系数定义的被称为二项式窗(Binomial window)的形式的窗函数,式(5)是被称为三角频域窗(Triangular in frequency domain window)的形式的窗函数,式(6)是被称为矩形频域窗(Rectangular in frequency domain window)的形式的窗函数。
另外,也可以仅针对至少一部分阶数i,系数wO(i)随着与基音增益有正相关关系的值的增加而单调递减,而非针对0≦i≦Pmax的各i。换言之,根据阶数i,系数wO(i)的大小也可以不随着与基音增益有正相关关系的值的增加而单调递减。
例如,在i=0的情况下,可以利用上述的式(2)至式(6)的任意一个决定系数wO(i)的值,也可以利用如在ITU-T G718等中也利用的、如wO(0)=1.0001,wO(0)=1.003的、不依赖于与基音增益有正相关关系的值的、根据经验而获得的固定值。即,针对0≦i≦Pmax的各i,系数wO(i)取与基音增益有正相关关系的值越大而越小的值,但针对i=0,并不限于此,而可以利用固定值。
[系数乘法部22]
系数乘法部22将在系数决定部24中决定的系数wO(i)(i=0,1,……,Pmax)与在自相关计算部21中求出的自相关RO(i)(i=0,1,…,Pmax)按照相同i相乘,从而求出变形自相关R'O(i)(i=0,1,…,Pmax)(步骤S2)。即,系数乘法部22通过以下的式(7)而计算自相关R'O(i)。所计算的自相关R'O(i)被提供给预测系数计算部23。
【数9】
R'O(i)=RO(i)×wO(i) (7)
[预测系数计算部23]
预测系数计算部23利用从系数乘法部22输出的变形自相关R'O(i)而求出可变换为线性预测系数的系数(步骤S3)。
例如,预测系数计算部23利用从系数乘法部22输出的变形自相关R'O(i),通过Levinson-Durbin等,计算并输出从1阶至预先决定的最大阶数即Pmax为止的PARCOR系数KO(1),KO(2),…,KO(Pmax)或线性预测系数aO(1),aO(2),…,aO(Pmax)。
根据第一实施方式的线性预测分析装置2,将包含基于与基音增益有正相关关系的值,对至少一部分预测系数i,处于与该阶数i对应的系数wO(i)的大小随着包含当前帧的全部或一部分输入信号XO(n)的信号区间的基音增益有正相关关系的值的增加而单调递减的关系的情况的系数wO(i)乘以自相关而求出变形自相关,求出可变换为线性预测系数的系数,从而即使在输入信号的基音增益大时,也能够求出可变换为抑制了由基音分量而引起的频谱的尖峰的产生的线性预测系数的系数,且即使在输入信号的基音增益小时,也能够求出可变换为可表现频谱包络的线性预测系数的系数,能够实现分析精度比以往高的线性预测。从而,在包含第一实施方式的线性预测分析装置2的编码装置以及与该编码装置对应的解码装置中对语音信号或声音信号进行编码解码而获得的解码语音信号或解码声音信号的质量比在包含以往的线性预测分析装置的编码装置以及与该编码装置对应的解码装置中对语音信号或声音信号进行编码解码而获得的解码语音信号或解码语音信号的质量高。
[第二实施方式]
第二实施方式比较与当前或过去的帧中的输入信号的基音增益有正相关关系的值与规定的阈值,并根据其比较结果,决定系数系数wO(i)。第二实施方式只有系数决定部24中的系数wO(i)的决定方法不同于第一实施方式,其他与第一实施方式相同。以下,着重说明不同于第一实施方式的部分,对与第一实施方式相同的部分省略重复说明。
第二实施方式的线性预测分析装置2的功能结构以及线性预测分析装置2进行的线性预测分析方法的流程图与第一实施方式相同,是图1以及图2。第二实施方式的线性预测分析装置2除了系数决定部24的处理不同的部分以外,与第一实施方式的线性预测分析装置2相同。
图3表示第二实施方式的系数决定部24的处理的流程的例子。第二实施方式的系数决定部24例如进行图3的各步骤S41A、步骤S42、步骤S43的处理。
系数决定部24比较和与被输入的有关基音增益的信息对应的基音增益有正相关关系的值、与规定的阈值(步骤S41A)。和与被输入的有关基音增益的信息对应的基音增益有正相关关系的值例如是与被输入的有关基音增益的信息对应的基音增益其本身。
当与基音增益有正相关关系的值是规定的阈值以上的情况下,即当判断为基音增益大的情况下,系数决定部24按照预先决定的规则决定系数wh(i),并将该决定的系数wh(i)(i=0,1,…,Pmax)设为wO(i)(i=0,1,…,Pmax)(步骤S42)。即,设为wO(i)=wh(i)。
当与基音增益有正相关关系的值不是规定的阈值以上的情况下,即当判断为基音增益小的情况下,系数决定部24按照预先决定的规则决定系数wl(i),并将该决定的系数wl(i)(i=0,1,…,Pmax)设为wO(i)(i=0,1,…,Pmax)(步骤S43)。即,设为wO(i)=wl(i)。
在此,决定wh(i)与wl(i)针对至少一部分的各i满足wh(i)<wl(i)的关系。此外,决定wh(i)与wl(i)针对至少一部分的各i满足wh(i)<wl(i)的关系,针对除此之外的i满足wh(i)≤wl(i)。在此,至少一部分的各i例如是0以外的i(即1≤i≤Pmax)。例如,wh(i)和wl(i)按照如下的预先决定的规则求出:求出在式(2)中基音增益G为G1时的wO(i)作为wh(i),并求出在式(2)中基音增益G为G2(其中,G1>G2)时的wO(i)作为wl(i)。此外,例如wh(i)与wl(i)按照如下的预先决定的规则求出:求出在式(2)中α为α1时的wO(i)作为wh(i),并求出在式(2)中α为α2(其中,α1>α2)时的wO(i)作为wl(i)。此时,α1与α2一并与式(2)的α同样预先决定。另外,也可以设为如下的结构:将按照这些任一个规则预先求出的wh(i)与wl(i)预先存储在表格中,根据与基音增益有正相关关系的值是否为规定的阈值以上,从表格中选择wh(i)和wl(i)中的任一个。此外,wh(i)与wl(i)分别被决定为随着i变大,wh(i)、wl(i)的值变小。另外,关于i=0的系数wh(i)、wl(i),并非必须满足wh(0)≦wl(0)的关系,也可以利用满足wh(0)>wl(0)的关系的值。
根据第二实施方式,也与第一实施方式同样,即使在输入信号的基音增益大时,也能够求出可变换为抑制了由基音分量引起的频谱的尖峰的产生的线性预测系数的系数,且即使在输入信号的基音增益小时也能够求出可变换为可表现频谱包络的线性预测系数的系数,能够实现分析精度比以往高的线性预测。
<第二实施方式的变形例>
在上述的第二实施方式中,利用一个阈值决定了系数wO(i),但第二实施方式的变形例利用两个以上的阈值决定系数wO(i)。以下,举例说明利用两个阈值th1、th2决定系数的方法。设阈值th1、th2满足0<th1<th2的关系。
第二实施方式的变形例的线性预测分析装置2的功能结构是与第二实施方式相同的图1。第二实施方式的变形例的线性预测分析装置2除了系数决定部24的处理不同的部分以外,与第二实施方式的线性预测分析装置2相同。
系数决定部24比较和与被输入的有关基音增益的信息对应的基音增益有正相关关系的值、与阈值th1、th2。和与被输入的有关基音增益的信息对应的基音增益有正相关关系的值例如是与被输入的有关基音增益的信息对应的基音增益。
在与基音增益有正相关关系的值比阈值th2大的情况下,即在判断为基音增益大的情况下,系数决定部24按照预先决定的规则决定系数wh(i)(i=0,1,…,Pmax),并将该决定的系数wh(i)(i=0,1,…,Pmax)设为wO(i)(i=0,1,…,Pmax)。即,设wO(i)=wh(i)。
在与基音增益有正相关关系的值比阈值th1大且为阈值th2以下的情况下,即在判断为基音增益为中等程度的情况下,系数决定部24按照预先决定的规则决定系数wm(i)(i=0,1,…,Pmax),并将该决定的系数wm(i)(i=0,1,…,Pmax)设为wO(i)(i=0,1,…,Pmax)。即,设wO(i)=wm(i)。
在与基音增益有正相关关系的值为阈值th1以下的情况下,即在判断为基音增益小的情况下,系数决定部24按照预先决定的规则决定系数wl(i)(i=0,1,…,Pmax),并将该决定的系数wl(i)(i=0,1,…,Pmax)设为wO(i)(i=0,1,…,Pmax)。即,设wO(i)=wl(i)。
在此,设wh(i)、wm(i)、wl(i)决定为针对至少一部分各i,满足wh(i)<wm(i)<wl(i)的关系。在此,至少一部分各i例如是0以外的各i(即,1≦i≦Pmax)。此外,决定wh(i)、wm(i)、wl(i)针对至少一部分各i满足wh(i)<wm(i)≦wl(i),针对除此以外的i中的至少一部分各i满足wh(i)≦wm(i)<wl(i),针对剩余的至少一部分各i满足wh(i)≦wm(i)≦wl(i)的关系。例如,wh(i)、wm(i)、wl(i)按照以下的预先决定的规则而求出:求出在式(2)中基音增益G为G1时的wO(i)作为wh(i),并求出在式(2)中基音增益G为G2(其中G1>G2)时的wO(i)作为wm(i),求出在式(2)中基音增益G为G3(其中G2>G3)时的wO(i)作为wl(i)。此外,例如wh(i)、wm(i)、wl(i)按照以下的预先决定的规则而求出:求出在式(2)中α为α1时的wO(i)作为wh(i),并求出在式(2)中α为α2(其中α1>α2)时的wO(i)作为wm(i),并求出在式(2)中α为α3(其中α2>α3)时的wO(i)作为wl(i)。此时,α1、α2、α3与式(2)的α同样预先决定。另外,也可以设为如下的结构:将按照这些任一个规则预先求出的wh(i)、wm(i)、wl(i)预先存储在表格中,通过与基音增益有正相关关系的值与规定的阈值的比较,从表格选择wh(i)、wm(i)、wl(i)中的任一个。
另外,也可以利用wh(i)与wl(i)决定其间的系数wm(i)。即,可以通过wm(i)=β'×wh(i)+(1-β')×wl(i)决定wm(i)。这里β'是0≦β'≦1,且是根据基音增益G,通过在基音增益G取小的值时β'的值也小,在基音增益G取大的值时β'的值也大的函数β'=c(G)而求出的值。若这样求出wm(i),则通过在系数决定部24中预先仅存储两个表格即存储了wh(i)(i=0,1,…,Pmax)的表格以及存储了wl(i)(i=0,1,…,Pmax)的表格,在基音增益为中等程度的情况下的基音增益大时能够获得接近wh(i)的系数,相反在基音增益为中等程度的情况下的基音增益小时能够获得接近wl(i)的系数。此外,wh(i)、wm(i)、wl(i)被决定为随着i变大,各wh(i)、wm(i)、wl(i)的值变小。另外,关于i=0的系数wh(0)、wm(0)、wl(0),并非必须满足wh(0)≦wm(0)≦wl(0)的关系,也可以利用满足wh(0)>wm(0)和/或wm(0)>wl(0)的关系的值。
根据第二实施方式的变形例,也与第二实施方式同样地,即使在输入信号的基音增益大时也能够求出可变换为抑制了由于基音分量引起的频谱的尖峰的产生的线性预测系数的系数,且即使在输入信号的基音增益小时也能够求出可变换为可表现频谱包络的线性预测系数的系数,能够实现分析精度比以往高的线性预测。
[第三实施方式]
第三实施方式利用多个系数表格决定系数wO(i)。第三实施方式与第一实施方式的不同点仅在于系数决定部24中的系数wO(i)的决定方法,其他方面与第一实施方式同样。以下,着重说明与第一实施方式不同的部分,针对与第一实施方式同样的部分省略其重复说明。
第三实施方式的线性预测分析装置2除了系数决定部24的处理不同,如图4例示那样还具有系数表格存储部25的部分以外,与第一实施方式的线性预测分析装置2相同。系数表格存储部25中存储有两个以上的系数表格。
图5表示第三实施方式的系数决定部24的处理的流程的例子。第三实施方式的系数决定部24例如进行图5的步骤S44、步骤S45的处理。
首先,系数决定部24利用与被输入的有关基音增益的信息对应的基音增益有正相关关系的值,从在系数表格存储部25中存储着的两个以上的系数表格,选择对应于与该基音增益有正相关关系的值的一个系数表格t(步骤S44)。例如,和与有关基音增益的信息对应的基音增益有正相关关系的值是与有关基音增益的信息对应的基音增益。
例如,设在系数表格存储部25中存储有不同的两个系数表格t0、t1,在系数表格t0中存储有系数wt0(i)(i=0,1,…,Pmax),在系数表格t1中存储有系数wt1(i)(i=0,1,…,Pmax)。在两个系数表格t0、t1的各表格中,存储有如下决定的系数wt0(i)(i=0,1,…,Pmax)与系数wt1(i)(i=0,1,…,Pmax):针对至少一部分各i成为wt0(i)<wt1(i),针对剩余的各i成为wt0(i)≦wt1(i)。
此时,若与根据被输入的有关基音增益的信息确定的基音增益有正相关关系的值是规定的阈值以上,则选择系数表格t0作为系数表格t,否则选择系数表格t1作为系数表格t。即,在与基音增益有正相关关系的值是规定的阈值以上的情况下,即,在判断为基音增益大的情况下,选择针对各i的系数小的系数表格,在与基音增益有正相关关系的值比规定的阈值小的情况下,即,在判断为基音增益小的情况下,选择针对各i的系数大的系数表格。
换言之,将在系数表格存储部25中存储的两个系数表格中的、与基音增益有正相关关系的值是第一值的情况下由系数决定部24选择的系数表格设为第一系数表格,将在系数表格存储部25中存储的两个系数表格中的、与基音增益有正相关关系的值是比第一值小的第二值的情况下由系数决定部24选择的系数表格作为第二系数表格,对至少一部分各阶数i,与第二系数表格中的各阶数i对应的系数的大小比与第一系数表格中的各阶数i对应的系数的大小大。
另外,对于在系数表格存储部25中存储的系数表格t0、t1的i=0的系数wt0(0)、wt1(0),并非必须满足wt0(0)≦wt1(0)的关系,也可以是处于wt0(0)>wt1(0)的关系的值。
此外,例如设在系数表格存储部25中存储三个不同的系数表格t0、t1、t2,在系数表格t0中存储有系数wt0(i)(i=0,1,…,Pmax),在系数表格t1中存储有系数wt1(i)(i=0,1,…,Pmax),在系数表格t2中存储有系数wt2(i)(i=0,1,…,Pmax)。在三个系数表格t0、t1、t2各自中,存储有决定了对至少一部分各i成为wt0(i)<wt1(i)≦wt2(i),且对除此之外的i中的至少一部分各i成为wt0(i)≦wt1(i)<wt2(i),对剩余的各i成为wt0(i)≦wt1(i)≦wt2(i)的系数wt0(i)(i=0,1,…,Pmax)、系数wt1(i)(i=0,1,…,Pmax)以及系数wt2(i)(i=0,1,…,Pmax)。
在此,设决定了满足0<th1<th2的关系的两个阈值th1、th2。此时,系数决定部24,
(1)在与基音增益有正相关关系的值>th2的情况下,即,在判断为基音增益大的情况下,选择系数表格t0作为系数表格t,
(2)在th2≧与基音增益有正相关关系的值>th1的情况下、即,在判断为基音增益为中等程度的情况下,选择系数表格t1作为系数表格t,
(3)在th1≧与基音增益有正相关关系的值的情况下,即,在判断为基音增益小的情况下,选择系数表格t2作为系数表格t。
另外,针对在系数表格存储部25中存储的系数表格t0、t1、t2的i=0的系数wt0(0)、wt1(0)、wt2(0),并非必须满足wt0(0)≦wt1(0)≦wt2(0)的关系,也可以是处于wt0(0)>wt1(0)和/或wt1(0)>wt2(0)的关系的值
然后,系数决定部24将该选择的系数表格t中存储的各阶数i的系数wt(i)作为系数wO(i)(步骤S45)。即,设为wO(i)=wt(i)。换言之,系数决定部24从被选择的系数表格t取得与各阶数i对应的系数wt(i),将所取得的与各阶数i对应的系数wt(i)作为wO(i)。
在第三实施方式中,与第一实施方式以及第二实施方式不同,由于不需要基于与基音增益有正相关关系的值的式计算系数wO(i),因此能够以更少的运算处理量决定wO(i)。
<第三实施方式的具体例>
以下,说明第三实施方式的具体例。对线性预测分析装置2,输入通过高通滤波器被采样变换为12.8kHz且被进行了预加重处理的每一帧N样本的数字声音信号即输入信号XO(n)(n=0,1,…,N-1)、以及作为有关基音增益的信息而对当前帧的一部分输入信号XO(n)(n=0,1,…,Nn)(其中,Nn是满足Nn<N的关系的规定的正整数)在基音增益计算部950中求出的基音增益G。有关当前帧的一部分输入信号XO(n)(n=0,1,…,Nn)的基音增益G是在基音增益计算部950中作为该输入信号的前一帧的信号区间而预先包含当前帧的一部分输入信号XO(n)(n=0,1,…,Nn),并在基音增益计算部950对于前一帧的信号区间的处理中对XO(n)(n=0,1,…,Nn)计算并存储的基音增益。
自相关计算部21根据输入信号XO(n)通过以下的式(8)求出自相关RO(i)(i=0,1,…,Pmax)。
【数10】
对系数决定部24输入有关基音增益的信息即基音增益G。
设在系数表格存储部25中存储有系数表格t0、系数表格t1、以及系数表格t2。
系数表格t0是式(13)的以往方法的f0=60Hz的系数表格,如下决定各阶数的系数wtO(i)。
wt0(i)=[1.0001,0.999566371,0.998266613,0.996104103,0.993084457,0.989215493,0.984507263,0.978971839,0.972623467,0.96547842,0.957554817,0.948872864,0.939454317,0.929322779,0.918503404,0.907022834,0.894909143]
系数表格t1是式(13)的以往方法的f0=40Hz的表格,如下决定各阶数的系数wt1(i)。
wt1(i)=[1.0001,0.999807253,0.99922923,0.99826661,0.99692050,0.99519245,0.99308446,0.99059895,0.98773878,0.98450724,0.98090803,0.97694527,0.97262346,0.96794752,0.96292276,0.95755484,0.95184981]
系数表格t2是式(13)的以往方法的f0=20Hz的表格,如下决定各阶数的系数wt2(i)。
wt2(i)=[1.0001,0.99995181,0.99980725,0.99956637,0.99922923,0.99879594,0.99826661,0.99764141,0.99692050,0.99610410,0.99519245,0.99418581,0.99308446,0.99188872,0.99059895,0.98921550,0.98773878]
在此,上述的wtO(i)、wt1(i)、wt2(i)的列表是设为Pmax=16,并按照i=0,1,2,…,16的顺序从左起排列了与i对应的系数的大小的系数。即,在上述的例子中,例如wt0(0)=1.0001,wt0(3)=0.996104103。
在图6中以图表方式表示系数表格t0、t1、t2的系数wt0(i)、wt1(i)、wt2(i)的大小。图6的图表的虚线表示系数表格t0的系数wt0(i)的大小,图6的图表的点划线表示系数表格t1的系数wt1(i)的大小,图6的图表的实线表示系数表格t2的系数wt2(i)的大小。图6的图表的横轴表示阶数i,图6的图表的纵轴表示系数的大小。从该图表也可知,在各系数表格内,处于随着i的值变大,系数的大小单调递减的关系。此外,比较与相同的i的值对应的值在不同的系数表格的系数的大小,对除了0的i≧1的i,换言之对至少一部分的i,满足wt0(i)<wt1(i)<wt2(i)的关系。在系数表格存储部25中存储的多个系数表格只要具有这样的关系,则并不限于上述的例子。
此外,如在非专利文献1或非专利文献2中记载那样,也可以仅特别处理i=0的系数,从而利用wt0(0)=wt1(0)=wt2(0)=1.0001或wt0(0)=wt1(0)=wt2(0)=1.003这样的经验性的值。另外,对i=0不需要满足wt0(i)<wt1(i)<wt2(i)的关系,此外,wt0(0),wt1(0),wt2(0)可以不必是相同的值。例如,也可以如wt0(0)=1.0001,wt1(0)=1.0,wt2(0)=1.0那样,仅针对i=0,wt0(0)、wt1(0)、wt2(0)中的两个以上的值的大小关系不满足wt0(i)<wt1(i)<wt2(i)的关系。
上述的系数表格t0相当于在式(13)中设为f0=60Hz、fs=12.8kHz的情况下的系数值,系数表格t1相当于在式(13)中设为f0=40Hz、fs=12.8kHz的情况下的系数值,系数表格t2相当于在式(13)中设为f0=20Hz的情况下的系数值,但这些分别相当于在式(2A)中设为f(G)=60、fs=12.8kHz的情况下的系数值、设为f(G)=40、fs=12.8kHz的情况、设为f(G)=20、fs=12.8kHz的情况,式(2A)中的函数f(G)是与基音增益G有正相关关系的函数。即,在预先决定三个系数表格的系数值时,也可以利用预先决定的三个f0通过式(13)求出系数值,而代替利用预先决定的三个基音增益通过式(2A)求出系数值的情况。
系数决定部24将被输入的基音增益G与规定的阈值th1=0.3以及阈值th2=0.6进行比较,在G≦0.3的情况下选择系数表格t2,在0.3<G≦0.6的情况下选择系数表格t1,在0.6<G的情况下选择系数表格t0。
然后,系数决定部24将所选择的系数表格t的各系数wt(i)作为系数wO(i)。即,设为wO(i)=wt(i)。换言之,系数决定部24从所选择的系数表格t取得与各阶数i对应的系数wt(i),将所取得的与各阶数i对应的系数wt(i)作为wO(i)。
<第三实施方式的变形例>
在第三实施方式中,将在多个系数表格中其中一个表格存储的系数决定为系数wO(i),但第三实施方式的变形例除此之外还包含通过基于在多个系数表格中存储的系数的运算处理而决定系数wO(i)的情况。
第三实施方式的变形例的线性预测分析装置2的功能结构是与第三实施方式相同的图4。第三实施方式的变形例的线性预测分析装置2的系数决定部24的处理不同,在系数表格存储部25中包含的系数表格不同的部分以外,与第三实施方式的线性预测分析装置2相同。
在系数表格存储部25中仅存储有系数表格t0与t2,在系数表格t0中存储有系数wt0(i)(i=0,1,…,Pmax),在系数表格t2中存储有系数wt2(i)(i=0,1,…,Pmax)。在两个系数表格t0、t2各自中存储有被决定为至少针对一部分各i成为wt0(i)<wt2(i),针对剩余的各i成为wt0(i)≦wt2(i)的系数wt0(i)(i=0,1,…,Pmax)与系数wt2(i)(i=0,1,…,Pmax)。
在此,设决定了满足0<th1<th2的关系的两个阈值th1、th2。此时,系数决定部24,
(1)当与基音增益有正相关关系的值>th2的情况下,即在判断为基音增益大的情况下,选择系数表格t0的各系数wt0(i)作为系数wO(i),
(2)当th2≧与基音增益有正相关关系的值>th1的情况下,即,在判断为基音增益是中等程度的情况下,利用系数表格t0的各系数wt0(i)与系数表格t2的各系数wt2(i),通过wO(i)=β'×wt0(i)+(1-β')×wt2(i)决定系数wO(i),
(3)当th1≧与基音增益有正相关关系的值的情况下,即,在判断为基音增益小的情况下,选择系数表格t2的各系数wt2(i)作为系数wO(i)。
在此,β'是0≦β'≦1,且是通过在基音增益G取小的值时β'的值也小,基音增益G取大的值时β'的值也大的函数β'=c(G),根据基音增益G求出的值。根据该结构,在基音增益是中等程度的情况下的基音增益G小时,能够将接近wt2(i)的值作为系数wO(i),相反,在基音增益是中等程度的情况下的基音增益G大时,能够将接近wt0(i)的值作为系数wO(i),因此仅通过两个表格就能够获得三个以上的系数wO(i)。
另外,针对在系数表格存储部25中存储的系数表格t0、t2的i=0的系数wt0(0)、wt2(0),并非必须满足wt0(0)≦wt2(0)的关系,也可以是处于wt0(0)>wt2(0)的关系的值。
[第一实施方式至第三实施方式共同的变形例]
如图7以及图8所示,在上述的所有实施方式以及变形例中,也可以不包含系数乘法部22,而是在预测线性计算部23中利用系数wO(i)与自相关RO(i)进行线性预测分析。图7与图8是分别与图1和图4对应的线性预测分析装置2的结构例。此时,预测系数计算部23在图9的步骤S5中,并不是利用系数wO(i)与自相关RO(i)相乘后的值即变形自相关R'O(i),而是直接利用系数wO(i)与自相关RO(i)而进行线性预测分析(步骤S5)。
[第四实施方式]
第四实施方式对输入信号XO(n)利用以往的线性预测分析装置进行线性预测分析,并利用其线性预测分析的结果,在基音增益计算部中获得基音增益,利用基于所获得的基音增益的系数wO(i)通过本发明的线性预测分析装置求出可变换为线性预测系数的系数。
如图10所示,第四实施方式的线性预测分析装置3例如具有第一线性预测分析部31、线性预测残差计算部32、基音增益计算部36、第二线性预测分析部34。
[第一线性预测分析部31]
第一线性预测分析部31进行与现有的线性预测分析装置1相同的动作。即,第一线性预测分析部31根据输入信号XO(n)求出自相关RO(i)(i=0,1,…,Pmax),并通过将自相关RO(i)(i=0,1,…,Pmax)与预先决定的系数wO(i)(i=0,1,…,Pmax)按照每个相同的i相乘,从而求出变形自相关R'O(i)(i=0,1,…,Pmax),根据变形自相关R'O(i)(i=0,1,…,Pmax)求出可变换为从1至预先决定的最大阶数即Pmax阶为止的线性预测系数的系数。
[线性预测残差计算部32]
线性预测残差计算部32对输入信号XO(n)进行基于可变换为从1至预先决定的最大阶数即Pmax阶为止的线性预测系数的系数的线性预测或与线性预测等价或类似的过滤处理而求出线性预测残差信号XR(n)。过滤处理又被称为加权处理,因此线性预测残差信号XR(n)也可以称为加权输入信号。
[基音增益计算部36]
基音增益计算部36求出线性预测残差信号XR(n)的基音增益G,输出有关基音增益的信息。作为求出基音增益的方法,有各种现有的方法,因此可以利用现有的任意的方法。基音增益计算部36例如针对构成当前帧的线性预测残差信号XR(n)(n=0,1,…,N-1)的多个子帧的各个子帧求出基音增益。即,求出作为2以上的整数即M个子帧的XRs1(n)(n=0,1,…,N/M-1)、…、XRsM(n)(n=(M-1)N/M,(M-1)N/M+1,…,N-1)各自的基音增益即Gs1、…、GsM。设N能够被M整除。基音增益计算部36接着输出能够确定构成当前帧的M个子帧的基音增益即Gs1、…、GsM中的最大值max(Gs1,…,GsM)的信息作为有关基音增益的信息。
[第二线性预测分析部34]
第二线性预测分析部34进行与本发明的第一实施方式至第三实施方式以及它们的变形例的线性预测分析装置2的任一个相同的动作。即,第二线性预测分析部34根据输入信号XO(n)求出自相关RO(i)(i=0,1,…,Pmax),基于基音增益计算部36输出的有关基音增益的信息决定系数wO(i)(i=0,1,…,Pmax),利用自相关RO(i)(i=0,1,…,Pmax)与所决定的系数wO(i)(i=0,1,…,Pmax)求出根据变形自相关R'O(i)(i=0,1,…,Pmax)可变换为1至预先决定的最大阶数即Pmax阶为止的线性预测系数的系数。
<针对与基音增益有正相关关系的值>
如在第一实施方式中作为基音增益计算部950的具体例2而说明那样,作为与基音增益有正相关关系的值,也可以利用在之前帧的信号处理中进行被称为前瞻(Look-ahead)的先读而利用的样本部分中的与当前帧的样本对应的部分的基音增益。
此外,作为与基音增益有正相关关系的值,也可以利用基音增益的估计值。例如,也可以利用从过去的多个帧的基音增益所预测的有关当前帧的基音增益的估计值、或者有关过去的多个帧的基音增益的平均值或最小值或最大值或加权线性和作为基音增益的估计值。此外,也可以利用有关多个子帧的基音增益的平均值或最小值或最大值或加权线性和作为基音增益的估计值。
此外,作为与基音增益有正相关关系的值,也可以利用基音增益的量化值。即,也可以利用量化前的基音增益,也可以利用量化后的基音增益。
另外,在上述的各实施方式以及各变形例的与基音增益有正相关关系的值与阈值之间的比较中,可以设定为当与基音增益有正相关关系的值是与阈值相同的值的情况下,被分到以阈值为边界而相邻的两个情况中的任一个情况中。即,可以将设为某阈值以上的情况的部分作为比该阈值大的情况,将设为小于该阈值的情况的部分作为该阈值以下的情况。此外,也可以将设为比某阈值大的情况的部分作为该阈值以上的情况,将设为该阈值以下的情况的部分作为比该阈值小的情况。
在上述装置以及方法中说明的处理不仅按照记载的顺序时序地执行,也可以根据执行处理的装置的处理能力或根据需要而并行地或者单独执行。
此外,在通过计算机来实现线性预测分析方法中的各步骤的情况下,通过程序来记述线性预测分析方法应具有的功能的处理内容。然后,通过计算机来执行该程序,从而在计算机上实现其各步骤。
记述了该处理内容的程序可以预先存储在计算机中可读取的记录介质中。作为计算机中可读取的记录介质,例如可以是磁记录装置、光盘、光磁记录介质、半导体存储器等任意的介质。
此外,各处理部件可以通过在计算机上执行规定的程序而构成,也可以将这些处理内容的至少一部分通过硬件来实现。
此外,在不脱离本发明的宗旨的范围内当然可进行适当变更。

Claims (4)

1.一种线性预测分析方法,按照作为规定时间区间的帧,求出可变换为与输入时序信号对应的线性预测系数的系数,所述线性预测分析方法包含:
自相关计算步骤,至少针对各i=0,1,…,Pmax,计算当前帧的输入时序信号XO(n)与i样本之前的输入时序信号XO(n-i)或i样本之后的输入时序信号XO(n+i)之间的自相关RO(i);以及
预测系数计算步骤,利用将系数wO(i)与所述自相关RO(i)按照对应的每个i进行乘法后的值即变形自相关R'O(i),求出可变换为1阶至Pmax阶为止的线性预测系数的系数,
还包含系数决定步骤,设在两个以上的系数表格各自中存储有系数wO(i),利用与当前或过去帧中的输入时序信号的周期性的强度或基于输入时序信号的基音增益有正相关关系的值,从所述两个以上的系数表格中的一个系数表格取得系数wO(i),
将所述两个以上的系数表格中的、当与所述周期性的强度或基音增益有正相关关系的值是第一值的情况下在所述系数决定步骤中取得系数wO(i)的系数表格作为第一系数表格,
将所述两个以上的系数表格中的、当与所述周期性的强度或基音增益有正相关关系的值是比第一值小的第二值的情况下在所述系数决定步骤中取得系数wO(i)的系数表格作为第二系数表格,
对至少一部分各阶数i,所述第二系数表格中的与所述各阶数i对应的系数大于所述第一系数表格中的与所述各阶数i对应的系数。
2.一种线性预测分析装置,按照作为规定时间区间的帧,求出可变换为与输入时序信号对应的线性预测系数的系数,所述线性预测分析装置包含:
自相关计算部,至少针对各i=0,1,…,Pmax,计算当前帧的输入时序信号XO(n)与i样本之前的输入时序信号XO(n-i)或i样本之后的输入时序信号XO(n+i)之间的自相关RO(i);以及
预测系数计算部,利用将系数wO(i)与所述自相关RO(i)按照对应的每个i进行乘法后的值即变形自相关R'O(i),求出可变换为1阶至Pmax阶为止的线性预测系数的系数,
还包含系数决定部,设在两个以上的系数表格各自中存储有系数wO(i),利用与当前或过去帧中的输入时序信号的周期性的强度或基于输入时序信号的基音增益有正相关关系的值,从所述两个以上的系数表格中的一个系数表格取得系数wO(i),
将所述两个以上的系数表格中的、当与所述周期性的强度或基音增益有正相关关系的值是第一值的情况下在所述系数决定部中取得系数wO(i)的系数表格作为第一系数表格,
将所述两个以上的系数表格中的、当与所述周期性的强度或基音增益有正相关关系的值是比第一值小的第二值的情况下在所述系数决定部中取得系数wO(i)的系数表格作为第二系数表格,
对至少一部分各阶数i,所述第二系数表格中的与所述各阶数i对应的系数大于所述第一系数表格中的与所述各阶数i对应的系数。
3.一种程序,用于使计算机执行权利要求1或2的线性预测分析方法的各步骤。
4.一种计算机可读取的记录介质,记录了用于使计算机执行权利要求1或2的线性预测分析方法的各步骤的程序。
CN201910634756.4A 2014-01-24 2015-01-20 线性预测分析装置、线性预测分析方法以及记录介质 Active CN110415715B (zh)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
JP2014-011317 2014-01-24
JP2014011317 2014-01-24
JP2014152526 2014-07-28
JP2014-152526 2014-07-28
CN201580005196.6A CN106415718B (zh) 2014-01-24 2015-01-20 线性预测分析装置、方法以及记录介质
PCT/JP2015/051351 WO2015111568A1 (ja) 2014-01-24 2015-01-20 線形予測分析装置、方法、プログラム及び記録媒体

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201580005196.6A Division CN106415718B (zh) 2014-01-24 2015-01-20 线性预测分析装置、方法以及记录介质

Publications (2)

Publication Number Publication Date
CN110415715A true CN110415715A (zh) 2019-11-05
CN110415715B CN110415715B (zh) 2022-11-25

Family

ID=53681371

Family Applications (3)

Application Number Title Priority Date Filing Date
CN201580005196.6A Active CN106415718B (zh) 2014-01-24 2015-01-20 线性预测分析装置、方法以及记录介质
CN201910634745.6A Active CN110415714B (zh) 2014-01-24 2015-01-20 线性预测分析装置、线性预测分析方法以及记录介质
CN201910634756.4A Active CN110415715B (zh) 2014-01-24 2015-01-20 线性预测分析装置、线性预测分析方法以及记录介质

Family Applications Before (2)

Application Number Title Priority Date Filing Date
CN201580005196.6A Active CN106415718B (zh) 2014-01-24 2015-01-20 线性预测分析装置、方法以及记录介质
CN201910634745.6A Active CN110415714B (zh) 2014-01-24 2015-01-20 线性预测分析装置、线性预测分析方法以及记录介质

Country Status (8)

Country Link
US (3) US9966083B2 (zh)
EP (3) EP3441970B1 (zh)
JP (3) JP6250072B2 (zh)
KR (3) KR101850523B1 (zh)
CN (3) CN106415718B (zh)
ES (3) ES2799899T3 (zh)
PL (3) PL3441970T3 (zh)
WO (1) WO2015111568A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109979471B (zh) * 2013-07-18 2022-12-02 日本电信电话株式会社 线性预测分析装置、线性预测分析方法以及记录介质
PL3462449T3 (pl) * 2014-01-24 2021-06-28 Nippon Telegraph And Telephone Corporation Urządzenie, sposób i program do analizy liniowo-predykcyjnej oraz nośnik zapisu
ES2689120T3 (es) * 2014-03-24 2018-11-08 Nippon Telegraph And Telephone Corporation Método de codificación, codificador, programa y soporte de registro
EP3471095B1 (en) * 2014-04-25 2024-05-01 Ntt Docomo, Inc. Linear prediction coefficient conversion device and linear prediction coefficient conversion method

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW283775B (en) * 1995-10-11 1996-08-21 Nat Science Council Linear prediction coefficient based inverse spectrum coefficient generator
CN1132972A (zh) * 1994-12-21 1996-10-09 美国电报电话公司 线性预测滤波系数量化器及滤波器组
WO2010073977A1 (ja) * 2008-12-22 2010-07-01 日本電信電話株式会社 符号化方法、復号方法、それらの装置、プログラム及び記録媒体
WO2010084951A1 (ja) * 2009-01-23 2010-07-29 日本電信電話株式会社 パラメータ選択方法、パラメータ選択装置、プログラム及び記録媒体
CN102341844A (zh) * 2009-03-10 2012-02-01 日本电信电话株式会社 编码方法、解码方法、编码装置、解码装置、程序及记录介质

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2654542B1 (fr) * 1989-11-14 1992-01-17 Thomson Csf Procede et dispositif de codage de filtres predicteurs de vocodeurs tres bas debit.
US5781880A (en) * 1994-11-21 1998-07-14 Rockwell International Corporation Pitch lag estimation using frequency-domain lowpass filtering of the linear predictive coding (LPC) residual
FR2742568B1 (fr) * 1995-12-15 1998-02-13 Catherine Quinquis Procede d'analyse par prediction lineaire d'un signal audiofrequence, et procedes de codage et de decodage d'un signal audiofrequence en comportant application
US7065338B2 (en) * 2000-11-27 2006-06-20 Nippon Telegraph And Telephone Corporation Method, device and program for coding and decoding acoustic parameter, and method, device and program for coding and decoding sound
US20040002856A1 (en) * 2002-03-08 2004-01-01 Udaya Bhaskar Multi-rate frequency domain interpolative speech CODEC system
EP1604352A4 (en) * 2003-03-15 2007-12-19 Mindspeed Tech Inc SINGLE NOISE DELETION MODEL
US8032240B2 (en) * 2005-07-11 2011-10-04 Lg Electronics Inc. Apparatus and method of processing an audio signal
JP4733552B2 (ja) * 2006-04-06 2011-07-27 日本電信電話株式会社 Parcor係数算出装置、parcor係数算出方法、そのプログラムおよびその記録媒体
JP4658853B2 (ja) * 2006-04-13 2011-03-23 日本電信電話株式会社 適応ブロック長符号化装置、その方法、プログラム及び記録媒体
DE602007003023D1 (de) * 2006-05-30 2009-12-10 Koninkl Philips Electronics Nv Linear-prädiktive codierung eines audiosignals
JP4691050B2 (ja) * 2007-01-29 2011-06-01 日本電信電話株式会社 Parcor係数算出方法、及びその装置とそのプログラムと、その記憶媒体
US8301444B2 (en) 2008-12-29 2012-10-30 At&T Intellectual Property I, L.P. Automated demographic analysis by analyzing voice activity
CN101599272B (zh) * 2008-12-30 2011-06-08 华为技术有限公司 基音搜索方法及装置
CN101609678B (zh) * 2008-12-30 2011-07-27 华为技术有限公司 信号压缩方法及其压缩装置
US9082416B2 (en) * 2010-09-16 2015-07-14 Qualcomm Incorporated Estimating a pitch lag
EP2671323B1 (en) * 2011-02-01 2016-10-05 Huawei Technologies Co., Ltd. Method and apparatus for providing signal processing coefficients
JP5613781B2 (ja) * 2011-02-16 2014-10-29 日本電信電話株式会社 符号化方法、復号方法、符号化装置、復号装置、プログラム及び記録媒体
CN102595495A (zh) * 2012-02-07 2012-07-18 北京新岸线无线技术有限公司 一种数据发送、接收方法和装置
CN103050121A (zh) * 2012-12-31 2013-04-17 北京迅光达通信技术有限公司 线性预测语音编码方法及语音合成方法
PL3462449T3 (pl) * 2014-01-24 2021-06-28 Nippon Telegraph And Telephone Corporation Urządzenie, sposób i program do analizy liniowo-predykcyjnej oraz nośnik zapisu

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1132972A (zh) * 1994-12-21 1996-10-09 美国电报电话公司 线性预测滤波系数量化器及滤波器组
TW283775B (en) * 1995-10-11 1996-08-21 Nat Science Council Linear prediction coefficient based inverse spectrum coefficient generator
WO2010073977A1 (ja) * 2008-12-22 2010-07-01 日本電信電話株式会社 符号化方法、復号方法、それらの装置、プログラム及び記録媒体
WO2010084951A1 (ja) * 2009-01-23 2010-07-29 日本電信電話株式会社 パラメータ選択方法、パラメータ選択装置、プログラム及び記録媒体
CN102341844A (zh) * 2009-03-10 2012-02-01 日本电信电话株式会社 编码方法、解码方法、编码装置、解码装置、程序及记录介质

Also Published As

Publication number Publication date
US10170130B2 (en) 2019-01-01
CN110415714A (zh) 2019-11-05
EP3462453A1 (en) 2019-04-03
KR20180015286A (ko) 2018-02-12
KR101850523B1 (ko) 2018-04-19
KR101877397B1 (ko) 2018-07-11
JP6449968B2 (ja) 2019-01-09
CN106415718B (zh) 2019-10-25
JP6250072B2 (ja) 2017-12-20
PL3441970T3 (pl) 2020-04-30
US9966083B2 (en) 2018-05-08
KR101826219B1 (ko) 2018-02-13
US20160336019A1 (en) 2016-11-17
US10163450B2 (en) 2018-12-25
JPWO2015111568A1 (ja) 2017-03-23
ES2799899T3 (es) 2020-12-22
EP3098812A4 (en) 2017-08-02
EP3462453B1 (en) 2020-05-13
EP3441970A1 (en) 2019-02-13
US20180211679A1 (en) 2018-07-26
PL3462453T3 (pl) 2020-10-19
WO2015111568A1 (ja) 2015-07-30
ES2770407T3 (es) 2020-07-01
EP3098812A1 (en) 2016-11-30
JP2018028699A (ja) 2018-02-22
CN106415718A (zh) 2017-02-15
KR20160097367A (ko) 2016-08-17
EP3441970B1 (en) 2019-11-13
US20180211678A1 (en) 2018-07-26
JP6416363B2 (ja) 2018-10-31
EP3098812B1 (en) 2018-10-10
PL3098812T3 (pl) 2019-02-28
CN110415715B (zh) 2022-11-25
JP2018028698A (ja) 2018-02-22
CN110415714B (zh) 2022-11-25
KR20180015284A (ko) 2018-02-12
ES2703565T3 (es) 2019-03-11

Similar Documents

Publication Publication Date Title
US11532315B2 (en) Linear prediction analysis device, method, program, and storage medium
JP6423065B2 (ja) 線形予測分析装置、方法、プログラム及び記録媒体
CN106415718B (zh) 线性预测分析装置、方法以及记录介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant