CN110070877B - 线性预测分析装置、线性预测分析方法以及记录介质 - Google Patents
线性预测分析装置、线性预测分析方法以及记录介质 Download PDFInfo
- Publication number
- CN110070877B CN110070877B CN201811547976.5A CN201811547976A CN110070877B CN 110070877 B CN110070877 B CN 110070877B CN 201811547976 A CN201811547976 A CN 201811547976A CN 110070877 B CN110070877 B CN 110070877B
- Authority
- CN
- China
- Prior art keywords
- coefficient
- fundamental frequency
- value
- linear prediction
- period
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 154
- 238000004364 calculation method Methods 0.000 claims abstract description 73
- 238000006243 chemical reaction Methods 0.000 claims description 8
- 230000000875 corresponding effect Effects 0.000 description 87
- 238000012986 modification Methods 0.000 description 61
- 230000004048 modification Effects 0.000 description 61
- 230000005236 sound signal Effects 0.000 description 47
- 238000000034 method Methods 0.000 description 31
- 238000012545 processing Methods 0.000 description 27
- 230000003595 spectral effect Effects 0.000 description 19
- 230000007423 decrease Effects 0.000 description 11
- 230000014509 gene expression Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 10
- 230000003247 decreasing effect Effects 0.000 description 9
- 238000013139 quantization Methods 0.000 description 6
- 238000005070 sampling Methods 0.000 description 5
- 238000001228 spectrum Methods 0.000 description 4
- 102220475340 DNA replication licensing factor MCM2_S41A_mutation Human genes 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 101100441445 Sulfolobus acidocaldarius (strain ATCC 33909 / DSM 639 / JCM 8929 / NBRC 15157 / NCIMB 11770) cutB gene Proteins 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 101150089047 cutA gene Proteins 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/04—Time compression or expansion
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/06—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/12—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Complex Calculations (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
自相关计算部(21)根据输入信号而计算自相关RO(i)。预测系数计算部(23)使用系数wO(i)和自相关RO(i)相乘得到的变形自相关R'O(i)而进行线性预测分析。在此,假设对于至少一部分的各阶数i,包含以下情况,即与各阶数i对应的系数wO(i),具有随着与当前或者过去的帧中的输入信号的基本频率处于负的相关关系的值的增加而单调增加的关系。
Description
本发明是以下专利申请的分案申请:申请号:201480040536.4,申请日:2014年7月16日,发明名称:线性预测分析装置、方法、程序以及记录介质。
技术领域
本发明涉及声音信号、音响信号、心电图、脑电波、脑磁图、地震波等数字时间序列信号的分析技术。
背景技术
在声音信号、音响信号的编码中,广泛使用基于对所输入的声音信号或音响信号进行线性预测分析而得到的预测系数进行编码的方法(例如,参照非专利文献1、2)。
在非专利文献1至3中,由图15中例示的线性预测分析装置计算预测系数。线性预测分析装置1具备自相关计算部11、系数乘法部12以及预测系数计算部13。
作为所输入的时域的数字声音信号或数字音响信号的输入信号,按N个样本的每个帧而进行处理。将在当前时刻设为处理对象的帧即当前帧的输入信号设为XO(n)(n=0,1,…,N-1)。n表示输入信号中的各样本的样本号,N是预定的正整数。在此,当前帧的前一帧的输入信号是XO(n)(n=-N,-N+1,…,-1),当前帧的后一帧的输入信号是XO(n)(n=N,N+1,…,2N-1)。
[自相关计算部11]
线性预测分析装置1的自相关计算部11根据输入信号XO(n),通过式(11)求出自相关RO(i)(i=0,1,…,Pmax)。Pmax是小于N的预定的正整数。
[数1]
[系数乘法部12]
接着,系数乘法部12通过按每个相同的i对自相关RO(i)乘以预先决定的系数wO(i)(i=0,1,…,Pmax),从而求出变形自相关R'O(i)(i=0,1,…,Pmax)。即,通过式(12)求出变形自相关R'O(i)。
[数2]
R'O(i)=RO(i)×wO(i) (12)
[预测系数计算部13]
然后,预测系数计算部13使用R'O(i),例如通过莱文森-德宾(Levinson-Durbin)法等,求出能够变换为从一阶到预先决定的最大阶数即Pmax阶为止的线性预测系数的系数。能够变换为线性预测系数的系数是指,PARCOR系数KO(1),KO(2),…,KO(Pmax)或线性预测系数aO(1),aO(2),…,aO(Pmax)等。
在作为非专利文献1的国际标准ITU-T G.718或作为非专利文献2的国际标准ITU-T G.729中,作为系数wO(i)而使用预先求出的60Hz的带宽的固定系数。
具体而言,系数wO(i)如式(13)那样使用指数函数而定义,在式(3)中使用了f0=60Hz这样的固定值。fs是采样频率。
[数3]
在非专利文献3中记载了使用基于上述的指数函数以外的函数的系数的例子。但是,此处使用的函数是基于采样周期τ(相当于与fs对应的周期)和预定的常数a的函数,仍然使用固定值的系数。
[现有技术文献]
[非专利文献]
[非专利文献1]ITU-T Recommendation G.718,ITU,2008.
[非专利文献2]ITU-T Recommendation G.729,ITU,1996
[非专利文献3]Yoh'ichi Tohkura,Fumitada Itakura,Shin'ichiroHashimoto,"Spectral Smoothing Technique in PARCOR Speech Analysis-Synthesis",IEEE Trans.on Acoustics,Speech,and Signal Processing,Vol.ASSP-26,No.6,1978
发明内容
发明要解决的课题
在以往的声音信号、音响信号的编码中使用的线性预测分析方法中,使用对自相关RO(i)乘以固定的系数wO(i)而得到的变形自相关R'O(i),求出了能够变换为线性预测系数的系数。从而,在如不需要基于对自相关RO(i)乘以系数wO(i)的变形的、即就算不是使用变形自相关R'O(i)而是使用自相关RO(i)其本身而求出了能够变换为线性预测系数的系数,在与能够变换为线性预测系数的系数对应的频谱包络中频谱的峰值也不会变得过大的输入信号的情况下,通过对自相关RO(i)乘以系数wO(i),与通过变形自相关R'O(i)求出的能够变换为线性预测系数的系数对应的频谱包络近似于输入信号XO(n)的频谱包络的精度可能会降低,即线性预测分析的精度可能会降低。
本发明的目的在于提供一种与以往相比分析精度高的线性预测分析方法、装置、程序以及记录介质。
用于解决课题的方案
本发明的一个方式的线性预测分析方法是,按作为预定时间区间的每个帧,求出与输入时间序列信号对应的能够变换为线性预测系数的系数的线性预测分析方法,该线性预测分析方法包括:自相关计算步骤,至少关于i=0,1,…,Pmax的每一个,计算当前的帧的输入时间序列信号XO(n)和i样本以前的输入时间序列信号XO(n-i)或者i样本以后的输入时间序列信号XO(n+i)的自相关RO(i);以及预测系数计算步骤,使用系数wO(i)和自相关RO(i)按对应的每个i相乘得到的变形自相关R’O(i),求出能够变换为1阶到Pmax阶为止的线性预测系数的系数,对于至少一部分的各阶数i,包含以下情况:与各阶数i对应的系数wO(i),具有随着基于当前或者过去的帧中的输入时间序列信号的周期、或者周期的量化值、或者与基本频率处于负的相关关系的值的增加而单调增加的关系。
本发明的一个方式的线性预测分析方法是,按作为预定时间区间的每个帧,求出与输入时间序列信号对应的能够变换为线性预测系数的系数的线性预测分析方法,该线性预测分析方法包括:自相关计算步骤,至少关于i=0,1,…,Pmax的每一个,计算当前的帧的输入时间序列信号XO(n)和i样本以前的输入时间序列信号XO(n-i)或者i样本以后的输入时间序列信号XO(n+i)的自相关RO(i);系数决定步骤,设为在两个以上的系数表格的每一个中i=0,1,…,Pmax的各阶数i和与各阶数i对应的系数wO(i)相关联而存储,使用基于当前或者过去的帧中的输入时间序列信号的周期、或者周期的量化值、或者与基本频率处于负的相关关系的值,从两个以上的系数表格中的一个系数表格取得系数wO(i);以及预测系数计算步骤,使用所取得的系数wO(i)和自相关RO(i)按对应的每个i相乘得到的变形自相关R'O(i),求出能够变换为1阶到Pmax阶为止的线性预测系数的系数,将两个以上的系数表格中的、在周期、或者周期的量化值、或者与基本频率处于负的相关关系的值为第一值的情况下在系数决定步骤中取得系数wO(i)的系数表格作为第一系数表格,将两个以上的系数表格中的、在周期、或者周期的量化值、或者与基本频率处于负的相关关系的值为大于第一值的第二值的情况下在系数决定步骤中取得系数wO(i)的系数表格作为第二系数表格,对于至少一部分的各阶数i,第二系数表格中的与各阶数i对应的系数,大于第一系数表格中的与各阶数i对应的系数。
本发明的一个方式的线性预测分析方法是,按作为预定时间区间的每个帧,求出与输入时间序列信号对应的能够变换为线性预测系数的系数的线性预测分析方法,该线性预测分析方法包括:自相关计算步骤,至少关于i=0,1,…,Pmax的每一个,计算当前的帧的输入时间序列信号XO(n)和i样本以前的输入时间序列信号XO(n-i)或者i样本以后的输入时间序列信号XO(n+i)的自相关RO(i);系数决定步骤,设为在系数表格t0中存储了系数wt0(i),在系数表格t1中存储了系数wt1(i),在系数表格t2中存储了系数wt2(i),使用基于当前或者过去的帧中的输入时间序列信号的周期、或者周期的量化值、或者与基本频率处于负的相关关系的值,从系数表格t0,t1,t2中的一个系数表格取得系数;以及预测系数计算步骤,使用取得的系数和自相关RO(i)按对应的每个i相乘得到的变形自相关R'O(i),求出能够变换为1阶到Pmax阶为止的线性预测系数的系数,设为根据周期、或者周期的量化值、或者与基本频率处于负的相关关系的值,分类为周期短的情况、周期为中等程度的情况、周期长的情况中的其中一个情况,将周期短的情况下在系数决定步骤中取得系数的系数表格作为系数表格t0,将周期为中等程度的情况下在系数决定步骤中取得系数的系数表格作为系数表格t1,将周期长的情况下在系数决定步骤中取得系数的系数表格作为系数表格t2,从而关于至少一部分i为wt0(i)<wt1(i)≦wt2(i),关于除此以外的i中的至少一部分的各i为wt0(i)≦wt1(i)<wt2(i),关于剩余的各i为wt0(i)≦wt1(i)≦wt2(i)。
本发明的一个方式的线性预测分析方法是,按作为预定时间区间的每个帧,求出与输入时间序列信号对应的能够变换为线性预测系数的系数的线性预测分析方法,该线性预测分析方法包括:自相关计算步骤,至少关于i=0,1,…,Pmax的每一个,计算当前的帧的输入时间序列信号XO(n)和i样本以前的输入时间序列信号XO(n-i)或者i样本以后的输入时间序列信号XO(n+i)的自相关RO(i);以及预测系数计算步骤,使用系数wO(i)和自相关RO(i)按对应的每个i相乘得到的变形自相关R'O(i),求出能够变换为1阶到Pmax阶为止的线性预测系数的系数,对于至少一部分的各阶数i,包含以下情况:与各阶数i对应的系数wO(i),具有随着与基本频率处于正的相关关系的值的增加而单调减少的关系,其中,该基本频率基于当前或者过去的帧中的输入时间序列信号。
本发明的一个方式的线性预测分析方法是,按作为预定时间区间的每个帧,求出与输入时间序列信号对应的能够变换为线性预测系数的系数的线性预测分析方法,该线性预测分析方法包括:自相关计算步骤,至少关于i=0,1,…,Pmax的每一个,计算当前的帧的输入时间序列信号XO(n)和i样本以前的输入时间序列信号XO(n-i)或者i样本以后的输入时间序列信号XO(n+i)的自相关RO(i);以及预测系数计算步骤,使用系数wO(i)和自相关RO(i)按对应的每个i相乘得到的变形自相关R'O(i),求出能够变换为1阶到Pmax阶为止的线性预测系数的系数,该线性预测分析方法还包括:系数决定步骤,设为在两个以上的系数表格的每一个中i=0,1,…,Pmax的各阶数i和与各阶数i对应的系数wO(i)相关联而存储,使用与基本频率处于正的相关关系的值,从两个以上的系数表格中的一个系数表格取得系数wO(i),其中,该基本频率基于当前或者过去的帧中的输入时间序列信号,将两个以上的系数表格中的、在与基本频率处于正的相关关系的值为第一值的情况下在系数决定步骤中取得系数wO(i)的系数表格作为第一系数表格,将两个以上的系数表格中的、在与基本频率处于正的相关关系的值为小于第一值的第二值的情况下在系数决定步骤中取得系数wO(i)的系数表格作为第二系数表格,对于至少一部分的各阶数i,第二系数表格中的与各阶数i对应的系数,大于第一系数表格中的与各阶数i对应的系数。
本发明的一个方式的线性预测分析方法是,按作为预定时间区间的每个帧,求出与输入时间序列信号对应的能够变换为线性预测系数的系数的线性预测分析方法,该线性预测分析方法包括:自相关计算步骤,至少关于i=0,1,…,Pmax的每一个,计算当前的帧的输入时间序列信号XO(n)和i样本以前的输入时间序列信号XO(n-i)或者i样本以后的输入时间序列信号XO(n+i)的自相关RO(i);系数决定步骤,设为在系数表格t0中存储了系数wt0(i),在系数表格t1中存储了系数wt1(i),在系数表格t2中存储了系数wt2(i),使用与基本频率处于正的相关关系的值,从系数表格t0,t1,t2中的一个系数表格取得系数,其中,该基本频率基于当前或者过去的帧中的输入时间序列信号;以及预测系数计算步骤,使用取得的系数和自相关RO(i)按对应的每个i相乘得到的变形自相关R'O(i),求出能够变换为1阶到Pmax阶为止的线性预测系数的系数,设为根据与基本频率处于正的相关关系的值,分类为基本频率高的情况、基本频率为中等程度的情况、基本频率低的情况中的其中一个情况,将基本频率高的情况下在系数决定步骤中取得系数的系数表格作为系数表格t0,将基本频率为中等程度的情况下在系数决定步骤中取得系数的系数表格作为系数表格t1,将基本频率低的情况下在系数决定步骤中取得系数的系数表格作为系数表格t2,从而关于至少一部分i为wt0(i)<wt1(i)≦wt2(i),关于除此以外的i中的至少一部分的各i为wt0(i)≦wt1(i)<wt2(i),关于剩余的各i为wt0(i)≦wt1(i)≦wt2(i)。
发明效果
作为为了求出变形自相关而与自相关相乘的系数,使用根据与基本频率处于正的相关关系的值或者与基本频率处于负的相关关系的值而确定的系数,从而能够实现与以往相比分析精度更高的线性预测。
附图说明
图1是用于说明第一实施方式以及第二实施方式的线性预测装置的例子的框图。
图2是用于说明线性预测分析方法的例子的流程图。
图3是用于说明第二实施方式的线性预测分析方法的例子的流程图。
图4是用于说明第二实施方式的线性预测分析方法的例子的流程图。
图5是用于说明第三实施方式的线性预测分析装置的例子的框图。
图6是用于说明第三实施方式的线性预测分析方法的例子的流程图。
图7是用于说明第三实施方式的具体例的图。
图8是用于说明第三实施方式的具体例的图。
图9是表示实验结果的例子的图。
图10是用于说明变形例的框图。
图11是用于说明变形例的框图。
图12是用于说明变形例的流程图。
图13是用于说明第四实施方式的线性预测分析装置的例子的框图。
图14是用于说明第四实施方式的变形例的线性预测分析装置的例子的框图。
图15是用于说明以往的线性预测装置的例子的框图。
具体实施方式
以下,参照附图说明线性预测分析装置以及方法的各实施方式。
[第一实施方式]
如图1所示,第一实施方式的线性预测分析装置2例如具备自相关计算部21、系数决定部24、系数乘法部22以及预测系数计算部23。自相关计算部21、系数乘法部22以及预测系数计算部23的动作与以往的线性预测分析装置1的自相关计算部11、系数乘法部12以及预测系数计算部13中的动作分别相同。
在线性预测分析装置2中,被输入预定时间区间即每个帧的时域的数字声音信号或数字音响信号或心电图、脑电波、脑磁图、地震波等的数字信号即输入信号XO(n)。输入信号是输入时间序列信号。将当前帧的输入信号设为XO(n)(n=0,1,…,N-1)。n表示输入信号中的各样本的样本号,N是预定的正整数。在此,当前帧的前一帧的输入信号是XO(n)(n=-N,-N+1,…,-1),当前帧的后一帧的输入信号是XO(n)(n=N,N+1,…,2N-1)。以下,说明输入信号XO(n)是数字声音信号或数字音响信号的情况。输入信号XO(n)(n=0,1,…,N-1)可以是被拾音的信号其本身,也可以是为了分析而转换了采样率的信号,也可以是进行了预加重处理的信号,也可以是进行了窗口化的信号。
此外,在线性预测分析装置2中,还被输入有关每个帧的数字声音信号或数字音响信号的基本频率的信息。有关基本频率的信息在位于线性预测分析装置2外的周期性分析部900中求出。周期性分析部900例如具备基本频率计算部930。
[基本频率计算部930]
基本频率计算部930根据当前帧的输入信号XO(n)(n=0,1,…,N-1)和/或当前帧的邻近的帧的输入信号的全部或者一部分而求出基本频率P。基本频率计算部930例如求出包含当前帧的输入信号XO(n)(n=0,1,…,N-1)的全部或者一部分的信号区间的数字声音信号或数字音响信号的基本频率P,将能够确定基本频率P的信息作为有关基本频率的信息而输出。作为求出基本频率的方法,存在各种公知的方法,因而也可以使用公知的任意方法。此外,也可以设为对求出的基本频率P进行编码而得到基本频率码的结构,并将基本频率码作为有关基本频率的信息来输出。进而也可以设为得到与基本频率码对应的基本频率的量化值^P的结构,并将基本频率的量化值^P作为有关基本频率的信息来输出。以下,说明基本频率计算部930的具体例。
<基本频率计算部930的具体例1>
基本频率计算部930的具体例1是,当前帧的输入信号XO(n)(n=0,1,…,N-1)由多个子帧构成,并且关于同一帧,基本频率计算部930比线性预测分析装置2还要先进行动作的情况下的例子。基本频率计算部930首先求出作为2以上的整数的M个子帧即XOs1(n)(n=0,1,…,N/M-1),…,XOsM(n)(n=(M-1)N/M,(M-1)N/M+1,…,N-1)的各自的基本频率即Ps1,…,PsM。设N能用M整除。基本频率计算部930将能够确定构成当前帧的M个子帧的基本频率即Ps1,…,PsM中的最大值max(Ps1,…,PsM)的信息作为有关基本频率的信息来输出。
<基本频率计算部930的具体例2>
基本频率计算部930的具体例2是,在当前帧的输入信号XO(n)(n=0,1,…,N-1)和后一帧的一部分输入信号XO(n)(n=N,N+1,…,N+Nn-1)(其中,Nn是满足Nn<N的关系的预定的正整数)中,包含先读部分的信号区间作为当前帧的信号区间而构成,并且,关于同一帧,基本频率计算部930在线性预测分析装置2之后进行动作的情况下的例子。基本频率计算部930关于当前帧的信号区间,求出当前帧的输入信号XO(n)(n=0,1,…,N-1)和后一帧的一部分输入信号XO(n)(n=N,N+1,…,N+Nn-1)的各自的基本频率即Pnow、Pnext,将基本频率Pnext存储到基本频率计算部930。基本频率计算部930还将能够确定关于前一帧的信号区间求出并存储到基本频率计算部930的基本频率Pnext、即关于前一帧的信号区间中的当前帧的一部分输入信号XO(n)(n=0,1,…,Nn-1)求出的基本频率的信息,作为有关基本频率的信息来输出。另外,与具体例1同样地,关于当前帧也可以求出每多个子帧的基本频率。
<基本频率计算部930的具体例3>
基本频率计算部930的具体例3是,当前帧的输入信号XO(n)(n=0,1,…,N-1)其本身作为当前帧的信号区间而构成,并且,关于同一帧,基本频率计算部930在线性预测分析装置2之后进行动作的情况下的例子。基本频率计算部930求出作为当前帧的信号区间的当前帧的输入信号XO(n)(n=0,1,…,N-1)的基本频率P,并将基本频率P存储到基本频率计算部930。基本频率计算部930还将能够确定关于前一帧的信号区间、即前一帧的输入信号XO(n)(n=-N,-N+1,…,-1)求出并存储到基本频率计算部930的基本频率P的信息,作为有关基本频率的信息来输出。
以下,说明线性预测分析装置2的动作。图2是线性预测分析装置2的线性预测分析方法的流程图。
[自相关计算部21]
自相关计算部21根据作为所输入的N个样本的每个帧的时域的数字声音信号或数字音响信号的输入信号XO(n)(n=0,1,…,N-1),计算自相关RO(i)(i=0,1,…,Pmax)(步骤S1)。Pmax是预测系数计算部23求出的能够变换为线性预测系数的系数的最大阶数,是N以下的预定的正整数。计算出的自相关RO(i)(i=0,1,…,Pmax)被提供给系数乘法部22。
自相关计算部21使用输入信号XO(n),例如通过式(14A)计算自相关RO(i)(i=0,1,…,Pmax)。即,计算当前帧的输入时间序列信号XO(n)和i样本以前的输入时间序列信号XO(n-i)的自相关RO(i)。
[数4]
或者,自相关计算部21使用输入信号XO(n),例如通过式(14B)计算自相关RO(i)(i=0,1,…,Pmax)。即,计算当前帧的输入时间序列信号XO(n)和i样本以后的输入时间序列信号XO(n+i)的自相关RO(i)。
[数5]
或者,自相关计算部21也可以在求出与输入信号XO(n)对应的功率谱之后按照维纳-辛钦(Wiener-Khinchin)定理计算自相关RO(i)(i=0,1,…,Pmax)。此外,在任一方法中都可以如输入信号XO(n)(n=-Np,-Np+1,…,-1,0,1,…,N-1,N,…,N-1+Nn)那样还使用前后的帧的输入信号的一部分而计算自相关RO(i)。在此,Np,Nn是分别满足Np<N,Nn<N的关系的预定的正整数。或者,也可以将MDCT序列作为功率谱的近似来代用,根据近似的功率谱而求出自相关。这样,自相关的计算方法能够使用在世间使用的公知技术的任意一个。
[系数决定部24]
系数决定部24使用所输入的有关基本频率的信息,决定系数wO(i)(i=0,1,…,Pmax)(步骤S4)。系数wO(i)是用于将自相关RO(i)变形而得到变形自相关R'O(i)的系数。系数wO(i)在信号处理的领域中也被称为时滞窗wO(i)或者时滞窗系数wO(i)。由于系数wO(i)是正的值,因而有时将系数wO(i)比预定的值大/小表现为系数wO(i)的大小比预定的值大/小。此外,假设时滞窗wO(i)的大小意味着该时滞窗wO(i)的值。
输入到系数决定部24的有关基本频率的信息是,确定根据当前帧的输入信号和/或当前帧的邻近的帧的输入信号的全部或者一部分而求出的基本频率的信息。即,在系数wO(i)的决定中使用的基本频率是,根据当前帧的输入信号和/或当前帧的邻近的帧的输入信号的全部或者一部分而求出的基本频率。
系数决定部24关于从0阶到Pmax阶的全部或者一部分阶数,在与有关基本频率的信息对应的基本频率可取的范围中的全部或者一部分中,与有关基本频率的信息对应的基本频率越大则将越小的值决定为系数wO(0),wO(1),…,wO(Pmax)。此外,系数决定部24也可以取代基本频率而使用与基本频率处于正的相关关系的值,基本频率越大则将越小的值决定为系数wO(0),wO(1),…,wO(Pmax)。
即,系数wO(i)(i=0,1,…,Pmax)被决定为,对于至少一部分预测阶数i包含以下情况,即与该阶数i对应的系数wO(i)的大小具有随着与包含当前帧的输入信号XO(n)的全部或一部分的信号区间的基本频率处于正的相关关系的值的增加而单调减少的关系。换言之,如后述那样,根据阶数i,系数wO(i)的大小也可以不随着与基本频率处于正的相关关系的值的增加而单调减少。
进而,在与基本频率处于正的相关关系的值可取的范围中,也可以存在系数wO(i)的大小无论与基本频率处于正的相关关系的值是否增加都一定的范围,但设为在其他的范围中系数wO(i)的大小随着与基本频率处于正的相关关系的值的增加而单调减少。
系数决定部24例如使用与所输入的有关基本频率的信息对应的有关基本频率的单调非增加函数,决定系数wO(i)。例如,通过以下的式(1)决定系数wO(i)。在以下的式中,P是与所输入的有关基本频率的信息对应的基本频率。
[数6]
或者,通过使用了大于0的预先决定的值即α的、以下的式(2)决定系数wO(i)。α是在将系数wO(i)作为时滞窗来掌握时的时滞窗的宽度、换言之是用于调整时滞窗的强度的值。预先决定的α例如通过关于多个α的候选值,在包含线性预测分析装置2的编码装置和与该编码装置对应的解码装置中对声音信号或音响信号进行编解码,从而将解码声音信号或解码音响信号的主观质量或客观质量良好的候选值作为α来选择而决定即可。
[数7]
或者,也可以通过使用了有关基本频率P的预先决定的函数f(P)的、以下的式(2A)来决定系数wO(i)。函数f(P)是f(P)=αP+β(α是正的数,β是任意的数)、f(P)=αP2+βP+γ(α是正的数,β、γ是任意的数)等的、与基本频率P为正的相关关系且对于基本频率P成为单调非减少的关系的函数。
[数8]
此外,使用基本频率P来决定系数wO(i)的式不限于上述的式(1)、(2)、(2A),只要是能够描述相对于与基本频率处于正的相关关系的值的增加而单调非增加的关系的式,则也可以是其他的式。例如,也可以将系数wO(i)通过以下的(3)到(6)的任意一个式来决定。在以下的(3)到(6)的式中,将a设为依赖于基本频率而决定的实数,将m设为依赖于基本频率而决定的自然数。例如,将a设为与基本频率处于负的相关关系的值,将m设为与基本频率处于负的相关关系的值。τ是采样周期。
[数9]
wo(i)=1-τi/a,i=0,1,...,Pmax (3)
式(3)是被称为巴特兰窗(Bartlett window)的形式的窗函数,式(4)是被称为二项式窗(Binomial window)的形式的窗函数,式(5)是被称为频域中的三角窗(Triangularin frequency domain window)的形式的窗函数,式(6)是被称为频域中的矩形窗(Rectangular in frequency domain window)的形式的窗函数。
另外,也可以不是0≦i≦Pmax的各i,而仅关于至少一部分阶数i,系数wO(i)随着与基本频率处于正的相关关系的值的增加而单调减少。换言之,根据阶数i,系数wO(i)的大小也可以不随着与基本频率处于正的相关关系的值的增加而单调减少。
例如,在i=0的情况下,也可以使用上述的式(1)到式(6)的任一个来决定wO(0)的值,也可以使用如在ITU-T G.718等中也使用的wO(0)=1.0001、wO(0)=1.003这样的不依赖与基本频率处于正的相关关系的值的、依据经验而得到的固定值。即,关于1≦i≦Pmax的各i,系数wO(i)在与基本频率处于正的相关关系的值越大时取越小的值,但关于i=0的系数,并不局限于此,也可以使用固定值。
[系数乘法部22]
系数乘法部22将在系数决定部24中决定的系数wO(i)(i=0,1,…,Pmax)和在自相关计算部21中求出的自相关RO(i)(i=0,1,…,Pmax)按相同的i而相乘,从而求出变形自相关R'O(i)(i=0,1,…,Pmax)(步骤S2)。即,系数乘法部22通过以下的式(15)来计算自相关R'O(i)。计算出的自相关R'O(i)被提供给预测系数计算部23。
[数10]
R'O(i)=RO(i)×wO(i) (15)
[预测系数计算部23]
预测系数计算部23使用变形自相关R'O(i),求出能够变换为线性预测系数的系数(步骤S3)。
例如,预测系数计算部23使用变形自相关R'O(i),通过莱文森-德宾(Levinson-Durbin)法等计算从一阶到预先决定的最大阶数即Pmax阶为止的PARCOR系数KO(1),KO(2),…,KO(Pmax)或线性预测系数aO(1),aO(2),…,aO(Pmax)。
根据第一实施方式的线性预测分析装置2,根据与基本频率处于正的相关关系的值,对于至少一部分预测阶数i,将包含以下情况的系数wO(i)与自相关相乘而求出变形自相关后求出能够变换为线性预测系数的系数,即与该阶数i对应的系数wO(i)的大小具有随着与包含当前帧的输入信号XO(n)的全部或一部分的信号区间的基本频率处于正的相关关系的值的增加而单调减少的关系,从而即使在输入信号的基本频率高时也能够求出能够变换为抑制了间距分量引起的谱峰的发生的线性预测系数的系数,并且,即使在输入信号的基本频率低时也能够求出能够变换为可表现频谱包络的线性预测系数的系数,能够实现与以往相比分析精度高的线性预测。从而,在包含第一实施方式的线性预测分析装置2的编码装置和与该编码装置对应的解码装置中对声音信号或音响信号进行编解码而得到的解码声音信号或解码音响信号的质量,比在包含以往的线性预测分析装置的编码装置和与该编码装置对应的解码装置中对声音信号或音响信号进行编解码而得到的解码声音信号或解码音响信号的质量要好。
<第一实施方式的变形例>
第一实施方式的变形例中,系数决定部24不是基于与基本频率处于正的相关关系的值,而是基于与基本频率处于负的相关关系的值来决定系数wO(i)。与基本频率处于负的相关关系的值例如是周期、周期的估计值或者周期的量化值。例如,若设周期T、基本频率P、采样频率fs,则成为T=fs/P,因而周期是与基本频率处于负的相关关系的量。将基于与基本频率处于负的相关关系的值来决定系数wO(i)的例子作为第一实施方式的变形例而进行说明。
第一实施方式的变形例的线性预测分析装置2的功能结构和预测分析装置2的线性预测分析方法的流程图是与第一实施方式相同的图1和图2。第一实施方式的变形例的线性预测分析装置2除了系数决定部24的处理不同的部分以外,与第一实施方式的线性预测分析装置2相同。在线性预测分析装置2中,还被输入有关每个帧的数字声音信号或数字音响信号的周期的信息。有关周期的信息在位于线性预测分析装置2外的周期性分析部900中求出。周期性分析部900例如具备周期计算部940。
[周期计算部940]
周期计算部940根据当前帧的输入信号XO和/或当前帧的邻近的帧的输入信号的全部或者一部分而求出周期T。周期计算部940例如求出包含当前帧的输入信号XO(n)的全部或者一部分的信号区间的数字声音信号或数字音响信号的周期T,将能够确定周期T的信息作为有关周期的信息而输出。作为求出周期的方法,存在各种公知的方法,因而也可以使用公知的任意方法。此外,也可以设为对求出的周期T进行编码而得到周期码的结构,并将周期码作为有关周期的信息来输出。进而也可以设为得到与周期码对应的周期的量化值^T的结构,并将周期的量化值^T作为有关周期的信息来输出。以下,说明周期计算部940的具体例。
<周期计算部940的具体例1>
周期计算部940的具体例1是,当前帧的输入信号XO(n)(n=0,1,…,N-1)由多个子帧构成,并且关于同一帧,周期计算部940比线性预测分析装置2还要先动作的情况下的例子。周期计算部940首先求出作为2以上的整数的M个子帧即XOs1(n)(n=0,1,…,N/M-1),…,XOsM(n)(n=(M-1)N/M,(M-1)N/M+1,…,N-1)的各自的周期即Ts1,…,TsM。设N能用M整除。周期计算部940将能够确定构成当前帧的M个子帧的周期即Ts1,…,TsM中的最小值min(Ts1,…,TsM)的信息作为有关周期的信息来输出。
<周期计算部940的具体例2>
周期计算部940的具体例2是,在当前帧的输入信号XO(n)(n=0,1,…,N-1)和后一帧的一部分输入信号XO(n)(n=N,N+1,…,N+Nn-1)(其中,Nn是满足Nn<N的关系的预定的正整数)中,包含先读部分的信号区间作为当前帧的信号区间而构成,并且,关于同一帧,周期计算部940在线性预测分析装置2之后进行动作的情况下的例子。周期计算部940关于当前帧的信号区间,求出当前帧的输入信号XO(n)(n=0,1,…,N-1)和后一帧的一部分输入信号XO(n)(n=N,N+1,…,N+Nn-1)的各自的周期即Tnow、Tnext,将周期Tnext存储到周期计算部940。周期计算部940还将能够确定关于前一帧的信号区间求出并存储到周期计算部940的周期Tnext、即关于前一帧的信号区间中的当前帧的一部分输入信号XO(n)(n=0,1,…,Nn-1)求出的周期的信息,作为有关周期的信息来输出。另外,与具体例1同样地,关于当前帧也可以求出每多个子帧的周期。
<周期计算部940的具体例3>
周期计算部940的具体例3是,当前帧的输入信号XO(n)(n=0,1,…,N-1)其本身作为当前帧的信号区间而构成,并且,关于同一帧,周期计算部940在线性预测分析装置2之后进行动作的情况下的例子。周期计算部940求出作为当前帧的信号区间的当前帧的输入信号XO(n)(n=0,1,…,N-1)的周期T,并将周期T存储到周期计算部940。周期计算部940还将能够确定关于前一帧的信号区间、即前一帧的输入信号XO(n)(n=-N,-N+1,…,-1)求出并存储到周期计算部940的周期T的信息,作为有关周期的信息来输出。
以下,说明第一实施方式的变形例的线性预测分析装置2的动作中与第一实施方式的线性预测分析装置2不同的部分的系数决定部24的处理。
[变形例的系数决定部24]
第一实施方式的变形例的线性预测分析装置2的系数决定部24使用所输入的有关周期的信息,决定系数wO(i)(i=0,1,…,Pmax)(步骤S4)。
输入到系数决定部24的有关周期的信息是,确定根据当前帧的输入信号和/或当前帧的邻近的帧的输入信号的全部或者一部分而求出的周期的信息。即,在系数wO(i)的决定中使用的周期是,根据当前帧的输入信号和/或当前帧的邻近的帧的输入信号的全部或者一部分而求出的周期。
系数决定部24关于从0阶到Pmax阶的全部或者一部分阶数,在与有关周期的信息对应的周期可取的范围中的全部或者一部分中,与有关周期的信息对应的周期越大则将越大的值决定为系数wO(0),wO(1),…,wO(Pmax)。此外,系数决定部24也可以取代周期而使用与周期处于正的相关关系的值,周期越大则将越大的值决定为系数wO(0),wO(1),…,wO(Pmax)。
即,系数wO(i)(i=0,1,…,Pmax)被决定为,对于至少一部分预测阶数i包含以下情况,即与该阶数i对应的系数wO(i)的大小具有随着与包含当前帧的输入信号XO(n)的全部或一部分的信号区间的基本频率处于负的相关关系的值的增加而单调增加的关系。
换言之,根据阶数i,系数wO(i)的大小也可以不随着与基本频率处于负的相关关系的值的增加而单调增加。
进而,在与基本频率处于负的相关关系的值可取的范围中,也可以存在系数wO(i)的大小无论与基本频率处于负的相关关系的值是否增加都一定的范围,但设为在其他的范围中系数wO(i)的大小随着与基本频率处于负的相关关系的值的增加而单调增加。
系数决定部24例如使用与所输入的有关周期的信息对应的有关周期的单调非减少函数,决定系数wO(i)。例如,通过以下的式(7)决定系数wO(i)。T是与所输入的有关周期的信息对应的周期。
[数11]
或者,通过使用了大于0的预先决定的值即α的、以下的式(8)决定系数wO(i)。α是在将系数wO(i)作为时滞窗来掌握时的时滞窗的宽度、换言之是用于调整时滞窗的强度的值。预先决定的α例如通过关于多个α的候选值,在包含线性预测分析装置2的编码装置和与该编码装置对应的解码装置中对声音信号或音响信号进行编解码,将解码声音信号或解码音响信号的主观质量或客观质量良好的候选值选择作为α而决定即可。
[数12]
或者,也可以通过使用了有关周期T的预先决定的函数f(T)的、以下的式(8A)来决定系数wO(i)。函数f(T)是f(T)=αT+β(α是正的数,β是任意的数)、f(T)=αT2+βT+γ(α是正的数,β、γ是任意的数)等的、与周期T为正的相关关系且对于周期T成为单调非减少的关系的函数。
[数13]
此外,使用周期T来决定系数wO(i)的式不限于上述的式(7)、(8)、(8A),只要是能够描述相对于与基本频率处于负的相关关系的值的增加而单调非减少的关系的式,则也可以是其他的式。
另外,也可以不是0≦i≦Pmax的各i,而仅关于至少一部分阶数i,系数wO(i)随着与基本频率处于负的相关关系的值的增加而单调增加。换言之,根据阶数i,系数wO(i)的大小也可以不随着与基本频率处于负的相关关系的值的增加而单调增加。
例如,在i=0的情况下,也可以使用上述的式(7)、(8)、(8A)来决定wO(0)的值,也可以使用如在ITU-T G.718等中也使用的wO(0)=1.0001、wO(0)=1.003这样的不依赖与基本频率处于负的相关关系的值的、依据经验而得到的固定值。即,关于1≦i≦Pmax的各i,系数wO(i)在与基本频率处于负的相关关系的值越大时取越大的值,但关于i=0的系数,并不局限于此,也可以使用固定值。
根据第一实施方式的变形例的线性预测分析装置2,根据与基本频率处于负的相关关系的值,对于至少一部分预测阶数i,将包含以下情况的系数wO(i)与自相关相乘而求出变形自相关后求出能够变换为线性预测系数的系数,即与该阶数i对应的系数wO(i)的大小具有随着与包含当前帧的输入信号XO(n)的全部或一部分的信号区间的基本频率处于负的相关关系的值的增加而单调增加的关系,从而即使在输入信号的基本频率高时也能够求出能够变换为抑制了间距分量引起的谱峰的发生的线性预测系数的系数,并且,即使在输入信号的基本频率低时也能够求出能够变换为可表现频谱包络的线性预测系数的系数,能够实现与以往相比分析精度高的线性预测。从而,在包含第一实施方式的变形例的线性预测分析装置2的编码装置和与该编码装置对应的解码装置中对声音信号或音响信号进行编解码而得到的解码声音信号或解码音响信号的质量,比在包含以往的线性预测分析装置的编码装置和与该编码装置对应的解码装置中对声音信号或音响信号进行编解码而得到的解码声音信号或解码音响信号的质量要好。
[实验结果]
图9是基于24个声音音响信号源和24人的被试验者的MOS评价实验的实验结果。图9的“以往方法”“cutA”的6个MOS值是,对于使用包含以往的线性预测分析装置在内的图9中记载的各个位速率的编码装置和与这些编码装置对应的解码装置,对声音音响信号源进行编解码而得到的解码声音信号或解码音响信号的MOS值。图9的“提案方法”“cutB”的6个MOS值是,对于使用包含第一实施方式的变形例的线性预测分析装置在内的图9中记载的各个位速率的编码装置和与这些编码装置对应的解码装置,对声音音响信号源进行编解码而得到的解码声音信号或解码音响信号的MOS值。根据图9的实验结果也可知,通过使用包含本发明的线性预测分析装置的编码装置和与该编码装置对应的解码装置,与包含以往的线性预测分析装置的情况相比,能够得到更高的MOS值即更好的质量。
[第二实施方式]
第二实施方式将与基本频率处于正的相关关系的值或者与基本频率处于负的相关关系的值和预定的阈值进行比较,并根据该比较结果来决定系数wO(i)。第二实施方式只有系数决定部24中的系数wO(i)的决定方法不同于第一实施方式,其他点与第一实施方式同样。以下,以与第一实施方式不同的部分为中心进行说明,关于与第一实施方式同样的部分省略重复说明。
在此,首先说明将与基本频率处于正的相关关系的值和预定的阈值进行比较,并根据该比较结果来决定系数wO(i)的例子,将与基本频率处于负的相关关系的值和预定的阈值进行比较,并根据该比较结果来决定系数wO(i)的例子在第二实施方式的第一变形例中进行说明。
第二实施方式的线性预测分析装置2的功能结构和线性预测分析装置2的线性预测分析方法的流程图是与第一实施方式相同的图1和图2。第二实施方式的线性预测分析装置2除了系数决定部24的处理不同的部分以外,与第一实施方式的线性预测分析装置2相同。
图3中示出第二实施方式的系数决定部24的处理的流程的例子。第二实施方式的系数决定部24例如进行图3的各步骤S41A、步骤S42、步骤S43的处理。
系数决定部24将与基本频率处于正的相关关系的值和预定的阈值进行比较,该基本频率对应于所输入的有关基本频率的信息(步骤S41A)。与对应于所输入的有关基本频率的信息的基本频率处于正的相关关系的值,例如是与所输入的有关基本频率的信息对应的基本频率其本身。
系数决定部24在与基本频率处于正的相关关系的值为预定的阈值以上的情况下、即判断为基本频率高的情况下,通过预先决定的规则来决定系数wh(i),将该决定的系数wh(i)(i=0,1,…,Pmax)设为wO(i)(i=0,1,…,Pmax)(步骤S42)。即,设为wO(i)=wh(i)。
系数决定部24在与基本频率处于正的相关关系的值不是预定的阈值以上的情况下、即判断为基本频率低的情况下,通过预先决定的规则来决定系数wl(i),将该决定的系数wl(i)(i=0,1,…,Pmax)设为wO(i)(i=0,1,…,Pmax)(步骤S43)。即,设为wO(i)=wl(i)。
在此,wh(i)和wl(i)决定为关于至少一部分的各i满足wh(i)<wl(i)这样的关系。或者,wh(i)和wl(i)决定为关于至少一部分的各i满足wh(i)<wl(i)这样的关系,关于除此以外的i满足wh(i)≦wl(i)这样的关系。在此,至少一部分的各i是指例如0以外的i(即,1≦i≦Pmax)。例如,wh(i)和wl(i)通过如下的预先决定的规则而求出:将在式(1)中基本频率P为P1时的wO(i)作为wh(i)而求出,将在式(1)中基本频率P为P2(其中,P1>P2)时的wO(i)作为wl(i)而求出。此外,例如wh(i)和wl(i)通过如下的预先决定的规则而求出:将在式(2)中α为α1时的wO(i)作为wh(i)而求出,将在式(2)中α为α2(其中,α1>α2)时的wO(i)作为wl(i)而求出。该情况下,α1和α2都与式(2)的α同样地预先决定。另外,也可以设为将通过这其中的任意规则而预先求出的wh(i)和wl(i)存储到表格中,并根据与基本频率处于正的相关关系的值是否为预定的阈值以上而从表格中选择wh(i)和wl(i)的其中一个的结构。此外,wh(i)和wl(i)分别被决定为随着i增大而wh(i),wl(i)的值减小。另外,关于i=0的系数wh(0),wl(0),不是必须要满足wh(0)≦wl(0)的关系,也可以使用满足wh(0)>wl(0)的关系的值。
通过第二实施方式也与第一实施方式同样地,即使在输入信号的基本频率高时也能够求出能够变换为抑制了间距分量引起的谱峰的发生的线性预测系数的系数,并且,即使在输入信号的基本频率低时也能够求出能够变换为可表现频谱包络的线性预测系数的系数,能够实现与以往相比分析精度高的线性预测。
<第二实施方式的第一变形例>
第二实施方式的第一变形例不是将与基本频率处于正的相关关系的值,而是将与基本频率处于负的相关关系的值和预定的阈值进行比较,并根据该比较结果来决定系数wO(i)。第二实施方式的第一变形例中的预定的阈值,不同于在第二实施方式中和与基本频率处于正的相关关系的值进行比较的预定的阈值。
第二实施方式的第一变形例的线性预测分析装置2的功能结构和流程图是与第一实施方式的变形例相同的图1和图2。第二实施方式的第一变形例的线性预测分析装置2除了系数决定部24的处理不同的部分以外,与第一实施方式的变形例的线性预测分析装置2相同。
图4中示出第二实施方式的第一变形例的系数决定部24的处理的流程的例子。第二实施方式的第一变形例的系数决定部24例如进行图4的步骤S41B、步骤S42、步骤S43的处理。
系数决定部24将与基本频率处于负的相关关系的值和预定的阈值进行比较,该基本频率对应于所输入的有关周期的信息(步骤S41A)。与对应于所输入的有关周期的信息的基本频率处于负的相关关系的值,例如是与所输入的有关周期的信息对应的周期。
系数决定部24在与基本频率处于负的相关关系的值为预定的阈值以下的情况下、即判断为周期短的情况下,通过预先决定的规则来决定系数wh(i)(i=0,1,…,Pmax),将该决定的系数wh(i)(i=0,1,…,Pmax)设为wO(i)(i=0,1,…,Pmax)(步骤S42)。即,设为wO(i)=wh(i)。
系数决定部24在与基本频率处于负的相关关系的值不是预定的阈值以下的情况下、即判断为周期长的情况下,通过预先决定的规则来决定系数wl(i)(i=0,1,…,Pmax),将该决定的系数wl(i)设为wO(i)(步骤S43)。即,设为wO(i)=wl(i)。
在此,wh(i)和wl(i)决定为关于至少一部分i满足wh(i)<wl(i)这样的关系。或者,wh(i)和wl(i)决定为关于至少一部分i满足wh(i)<wl(i)这样的关系,关于其他的i满足wh(i)≦wl(i)这样的关系。在此,至少一部分i是指例如0以外的i(即,1≦i≦Pmax)。例如,wh(i)和wl(i)通过如下的预先决定的规则而求出:将在式(7)中周期T为T1时的wO(i)作为wh(i)而求出,将在式(7)中周期T为T2(其中,T1<T2)时的wO(i)作为wl(i)而求出。此外,例如wh(i)和wl(i)通过如下的预先决定的规则而求出:将在式(8)中α为α1时的wO(i)作为wh(i)而求出,将在式(8)中α为α2(其中,α1<α2)时的wO(i)作为wl(i)而求出。该情况下,α1和α2都与式(8)的α同样地预先决定。另外,也可以设为将通过这其中的任意规则而预先求出的wh(i)和wl(i)存储到表格中,并根据与基本频率处于负的相关关系的值是否为预定的阈值以下而从表格中选择wh(i)和wl(i)的其中一个的结构。此外,wh(i)和wl(i)分别被决定为随着i增大而的wh(i),wl(i)值减小。另外,关于i=0的系数wh(0),wl(0),不是必须要满足wh(0)≦wl(0)的关系,也可以使用满足wh(0)>wl(0)的关系的值。
通过第二实施方式的第一变形例也与第一实施方式的变形例同样地,即使在输入信号的基本频率高时也能够求出能够变换为抑制了间距分量引起的谱峰的发生的线性预测系数的系数,并且,即使在输入信号的基本频率低时也能够求出能够变换为可表现频谱包络的线性预测系数的系数,能够实现与以往相比分析精度高的线性预测。
<第二实施方式的第二变形例>
在第二实施方式中使用一个阈值决定了系数wO(i),但第二实施方式的第二变形例使用两个以上的阈值来决定系数wO(i)。以下,例举使用两个阈值th1',th2'来决定系数的方法进行说明。假设阈值th1',th2'满足0<th1'<th2'这样的关系。
第二实施方式的第二变形例的线性预测分析装置2的功能结构是与第二实施方式相同的图1。第二实施方式的第二变形例的线性预测分析装置2除了系数决定部24的处理不同的部分以外,与第二实施方式的线性预测分析装置2相同。
系数决定部24将与基本频率处于正的相关关系的值和阈值th1',th2'进行比较,该基本频率对应于所输入的有关基本频率的信息。与对应于所输入的有关基本频率的信息的基本频率处于正的相关关系的值,例如是与所输入的有关基本频率的信息对应的基本频率其本身。
系数决定部24在与基本频率处于正的相关关系的值大于阈值th2'的情况下、即判断为基本频率高的情况下,通过预先决定的规则来决定系数wh(i)(i=0,1,…,Pmax),将该决定的系数wh(i)(i=0,1,…,Pmax)设为wO(i)(i=0,1,…,Pmax)。即,设为wO(i)=wh(i)。
系数决定部24在与基本频率处于正的相关关系的值大于阈值th1'且为阈值th2'以下的情况下、即判断为基本频率是中等程度的情况下,通过预先决定的规则来决定系数wm(i)(i=0,1,…,Pmax),将该决定的系数wm(i)(i=0,1,…,Pmax)设为wO(i)(i=0,1,…,Pmax)。即,设为wO(i)=wm(i)。
系数决定部24在与基本频率处于正的相关关系的值为阈值th1'以下的情况下、即判断为基本频率低的情况下,通过预先决定的规则来决定系数wl(i)(i=0,1,…,Pmax),将该决定的系数wl(i)(i=0,1,…,Pmax)设为wO(i)(i=0,1,…,Pmax)。即,设为wO(i)=wl(i)。
在此,假设wh(i),wm(i),wl(i)决定为关于至少一部分的各i满足wh(i)<wm(i)<wl(i)这样的关系。在此,至少一部分的各i是指例如0以外的各i(即,1≦i≦Pmax)。或者,wh(i),wm(i),wl(i)决定为关于至少一部分的各i满足wh(i)<wm(i)≦wl(i),关于除此以外的i中的至少一部分的各i满足wh(i)≦wm(i)<wl(i),关于剩余的至少一部分的各i满足wh(i)≦wm(i)≦wl(i)这样的关系。例如,wh(i),wm(i),wl(i)通过如下的预先决定的规则而求出:将在式(1)中基本频率P为P1时的wO(i)作为wh(i)而求出,将在式(1)中基本频率P为P2(其中,P1>P2)时的wO(i)作为wm(i)而求出,将在式(1)中基本频率P为P3(其中,P2>P3)时的wO(i)作为wl(i)而求出。此外,例如wh(i),wm(i),wl(i)通过如下的预先决定的规则而求出:将在式(2)中α为α1时的wO(i)作为wh(i)而求出,将在式(2)中α为α2(其中,α1>α2)时的wO(i)作为wm(i)而求出,将在式(2)中α为α3(其中,α2>α3)时的wO(i)作为wl(i)而求出。该情况下,α1,α2,α3都与式(2)的α同样地预先决定。另外,也可以设为将通过这其中的任意规则而预先求出的wh(i),wm(i),wl(i)存储到表格中,并通过与基本频率处于正的相关关系的值和预定的阈值的比较而从表格中选择wh(i),wm(i),wl(i)的其中一个的结构。另外,也可以使用wh(i)和wl(i)来决定其中间的系数wm(i)。即,也可以通过wm(i)=β'×wh(i)+(1-β')×wl(i)来决定wm(i)。在此,β'是,0≦β'≦1,并且,通过在基本频率P取较小的值时β'的值也会减小而在基本频率P取较大的值时β'的值也会增大的函数β'=c(P),根据基本频率P而求出的值。这样,若求出wm(i),则通过在系数决定部24中只将存储了wh(i)(i=0,1,…,Pmax)的表格和存储了wl(i)(i=0,1,…,Pmax)的表格这两个表格进行存储,从而在基本频率为中等程度的情况中的基本频率较大时能够得到接近wh(i)的系数,相反在基本频率为中等程度的情况中的基本频率较小时能够得到接近wl(i)的系数。此外,wh(i),wm(i),wl(i)被决定为随着i增大而wh(i),wm(i),wl(i)的值分别减小。另外,关于i=0的系数wh(0),wm(0),wl(0),不是必须要满足wh(0)≦wm(0)≦wl(0)的关系,也可以使用满足wh(0)>wm(0)和/或wm(0)>wl(0)的关系的值。
通过第二实施方式的第二变形例也与第二实施方式同样地,即使在输入信号的基本频率高时也能够求出能够变换为抑制了间距分量引起的谱峰的发生的线性预测系数的系数,并且,即使在输入信号的基本频率低时也能够求出能够变换为可表现频谱包络的线性预测系数的系数,能够实现与以往相比分析精度高的线性预测。
<第二实施方式的第三变形例>
在第二实施方式的第一变形例中使用一个阈值决定了系数wO(i),但第二实施方式的第三变形例使用两个以上的阈值来决定系数wO(i)。以下,例举使用两个阈值th1,th2来决定系数的方法进行说明。假设阈值th1,th2满足0<th1<th2这样的关系。
第二实施方式的第三变形例的线性预测分析装置2的功能结构是与第二实施方式的第一变形例相同的图1。第二实施方式的第三变形例的线性预测分析装置2除了系数决定部24的处理不同的部分以外,与第二实施方式的第一变形例的线性预测分析装置2相同。
系数决定部2将与基本频率处于负的相关关系的值和阈值th1,th2进行比较,该基本频率对应于所输入的有关周期的信息。与对应于所输入的有关周期的信息的基本频率处于负的相关关系的值,例如是与所输入的有关周期的信息对应的周期。
系数决定部24在与基本频率处于负的相关关系的值小于阈值th1的情况下、即判断为周期短的情况下,通过预先决定的规则来决定系数wh(i)(i=0,1,…,Pmax),将该决定的系数wh(i)(i=0,1,…,Pmax)设为wO(i)(i=0,1,…,Pmax)。即,设为wO(i)=wh(i)。
系数决定部24在与基本频率处于负的相关关系的值为阈值th1以上且小于阈值th2的情况下、即判断为周期是中等程度的情况下,通过预先决定的规则来决定系数wm(i)(i=0,1,…,Pmax),将该决定的系数wm(i)(i=0,1,…,Pmax)设为wO(i)(i=0,1,…,Pmax)。即,设为wO(i)=wm(i)。
系数决定部24在与基本频率处于负的相关关系的值为阈值th2以上的情况下、即判断为周期长的情况下,通过预先决定的规则来决定系数wl(i),将该决定的系数wl(i)(i=0,1,…,Pmax)设为wO(i)(i=0,1,…,Pmax)。即,设为wO(i)=wl(i)。
在此,假设wh(i),wm(i),wl(i)决定为关于至少一部分的各i满足wh(i)<wm(i)<wl(i)这样的关系。在此,至少一部分的各i是指例如0以外的各i(即,1≦i≦Pmax)。或者,wh(i),wm(i),wl(i)决定为关于至少一部分的各i满足wh(i)<wm(i)≦wl(i),关于除此以外的i中的至少一部分的各i满足wh(i)≦wm(i)<wl(i),关于剩余的各i满足wh(i)≦wm(i)≦wl(i)这样的关系。例如,wh(i),wm(i),wl(i)通过如下的预先决定的规则而求出:将在式(7)中周期T为T1时的wO(i)作为wh(i)而求出,将在式(7)中周期T为T2(其中,T1<T2)时的wO(i)作为wm(i)而求出,将在式(7)中周期T为T3(其中,T2<T3)时的wO(i)作为wl(i)而求出。此外,例如wh(i),wm(i),wl(i)通过如下的预先决定的规则而求出:将在式(8)中α为α1时的wO(i)作为wh(i)而求出,将在式(8)中α为α2(其中,α1<α2)时的wO(i)作为wm(i)而求出,将在式(8)中α为α3(其中,α2<α3)时的wO(i)作为wl(i)而求出。该情况下,α1,α2,α3都与式(8)的α同样地预先决定。另外,也可以设为将通过这其中的任意规则而预先求出的wh(i),wm(i),wl(i)存储到表格中,并通过与基本频率处于负的相关关系的值和预定的阈值的比较而从表格中选择wh(i),wm(i),wl(i)的其中一个的结构。另外,也可以使用wh(i)和wl(i)来决定其中间的系数wm(i)。即,也可以通过wm(i)=(1-β)×wh(i)+β×wl(i)来决定wm(i)。在此,β是,0≦β≦1,并且,通过在周期T取较小的值时β的值也会减小而在周期T取较大的值时β的值也会增大的函数β=b(T),根据周期T而求出的值。这样,若求出wm(i),则通过在系数决定部24中只将存储了wh(i)(i=0,1,…,Pmax)的表格和存储了wl(i)(i=0,1,…,Pmax)的表格这两个表格进行存储,从而在周期为中等程度的情况中的周期较小时能够得到接近wh(i)的系数,相反在周期为中等程度的情况中的周期较大时能够得到接近wl(i)的系数。此外,wh(i),wm(i),wl(i)被决定为随着i增大而wh(i),wm(i),wl(i)的值分别减小。另外,关于i=0的系数wh(0),wm(0),wl(0),不是必须要满足wh(0)≦wm(0)≦wl(0)的关系,也可以使用满足wh(0)>wm(0)和/或wm(0)>wl(0)的关系的值。
通过第二实施方式的第三变形例也与第二实施方式的第一变形例同样地,即使在输入信号的基本频率高时也能够求出能够变换为抑制了间距分量引起的谱峰的发生的线性预测系数的系数,并且,即使在输入信号的基本频率低时也能够求出能够变换为可表现频谱包络的线性预测系数的系数,能够实现与以往相比分析精度高的线性预测。
[第三实施方式]
第三实施方式使用多个系数表格来决定系数wO(i)。第三实施方式只有系数决定部24中的系数wO(i)的决定方法不同于第一实施方式,关于其他点与第一实施方式同样。以下,以与第一实施方式不同的部分为中心进行说明,关于与第一实施方式同样的部分则省略重复说明。
第三实施方式的线性预测分析装置2中,系数决定部24的处理不同,如图5中例示那样还具备系数表格存储部25,除该部分以外与第一实施方式的线性预测分析装置2相同。在系数表格存储部25中存储了两个以上的系数表格。
图6中示出第三实施方式的系数决定部24的处理的流程的例子。第三实施方式的系数决定部24例如进行图6的步骤S44、步骤S45的处理。
首先,系数决定部24使用与对应于所输入的有关基本频率的信息的基本频率处于正的相关关系的值,或者使用与对应于所输入的有关周期的信息的基本频率处于负的相关关系的值,从在系数表格存储部25中存储的两个以上的系数表格中,选择和该与基本频率处于正的相关关系的值或者与基本频率处于负的相关关系的值相应的一个系数表格t(步骤S44)。例如,与对应于有关基本频率的信息的基本频率处于正的相关关系的值是,与有关基本频率的信息对应的基本频率,与对应于有关周期的信息的基本频率处于负的相关关系的值是,与所输入的有关周期的信息对应的周期。
例如,假设在系数表格存储部25中存储了不同的两个系数表格t0,t1,在系数表格t0中存储了系数wt0(i)(i=0,1,…,Pmax),在系数表格t1中存储了系数wt1(i)(i=0,1,…,Pmax)。在两个系数表格t0,t1中分别存储了如下决定的系数wt0(i)(i=0,1,…,Pmax)和系数wt1(i)(i=0,1,…,Pmax),即关于至少一部分的各i为wt0(i)<wt1(i),关于剩余的各i成为wt0(i)≦wt1(i)。
这时,若与基本频率处于正的相关关系的值为预定的阈值以上,则系数决定部24选择系数表格t0作为系数表格t,否则选择系数表格t1作为系数表格t。即,在与基本频率处于正的相关关系的值为预定的阈值以上的情况下、即判断为基本频率高的情况下,选择有关各i的系数较小的系数表格,在与基本频率处于正的相关关系的值不是预定的阈值以上的情况下、即判断为基本频率低的情况下,选择有关各i的系数较大的系数表格。换言之,将在系数表格存储部25中存储的两个系数表格中的、在与基本频率处于正的相关关系的值为第一值的情况下由系数决定部24选择的系数表格作为第一系数表格,将在系数表格存储部25中存储的两个系数表格中的、在与基本频率处于正的相关关系的值为小于第一值的第二值的情况下由系数决定部24选择的系数表格作为第二系数表格,从而对于至少一部分的各阶数i,第二系数表格中的与各阶数i对应的系数的大小,大于第一系数表格中的与各阶数i对应的系数的大小。
此外,若与基本频率处于负的相关关系的值为预定的阈值以下,则系数决定部24选择系数表格t0作为系数表格t,否则选择系数表格t1作为系数表格t。即,在与基本频率处于负的相关关系的值为预定的阈值以下的情况下、即判断为周期短的情况下,选择有关各i的系数较小的系数表格,在与基本频率处于负的相关关系的值不是预定的阈值以下的情况下、即判断为周期长的情况下,选择有关各i的系数较大的系数表格。换言之,将在系数表格存储部25中存储的两个系数表格中的、在与基本频率处于负的相关关系的值为第一值的情况下由系数决定部24选择的系数表格作为第一系数表格,将在系数表格存储部25中存储的两个系数表格中的、在与基本频率处于负的相关关系的值为大于第一值的第二值的情况下由系数决定部24选择的系数表格作为第二系数表格,从而对于至少一部分的各阶数i,第二系数表格中的与各阶数i对应的系数的大小,大于第一系数表格中的与各阶数i对应的系数的大小。
另外,关于在系数表格存储部25中存储的系数表格t0,t1的i=0的系数wt0(0),wt1(0),不是必须要满足wt0(0)≦wt1(0)的关系,也可以使用具有wt0(0)>wt1(0)的关系的值。
此外,例如,假设在系数表格存储部25中存储了不同的3个系数表格t0,t1,t2,在系数表格t0中存储了系数wt0(i)(i=0,1,…,Pmax),在系数表格t1中存储了系数wt1(i)(i=0,1,…,Pmax),在系数表格t2中存储了系数wt2(i)(i=0,1,…,Pmax)。在3个系数表格t0,t1,t2中分别存储了如下决定的系数wt0(i)(i=0,1,…,Pmax)和系数wt1(i)(i=0,1,…,Pmax)和系数wt2(i)(i=0,1,…,Pmax),即关于至少一部分i为wt0(i)<wt1(i)≦wt2(i),关于除此之外的i中的至少一部分的各i为wt0(i)≦wt1(i)<wt2(i),关于剩余的各i成为wt0(i)≦wt1(i)≦wt2(i)。
在此,假设决定了满足0<th1'<th2'这样的关系的两个阈值th1',th2'。这时,系数决定部24,
(1)在与基本频率处于正的相关关系的值>th2'的情况下、即判断为基本频率高的情况下,选择系数表格t0作为系数表格t,
(2)在th2'≧与基本频率处于正的相关关系的值>th1'的情况下、即判断为基本频率是中等程度的情况下,选择系数表格t1作为系数表格t,
(3)在th1'≧与基本频率处于正的相关关系的值的情况下、即判断为基本频率低的情况下,选择系数表格t2作为系数表格t。
此外,假设决定了满足0<th1<th2这样的关系的两个阈值th1,th2。这时,系数决定部24,
(1)在与基本频率处于负的相关关系的值≧th2的情况下、即判断为周期长的情况下,选择系数表格t2作为系数表格t,
(2)在th2>与基本频率处于负的相关关系的值≧th1的情况下、即判断为周期是中等程度的情况下,选择系数表格t1作为系数表格t,
(3)在th1>与基本频率处于负的相关关系的值的情况下、即判断为周期短的情况下,选择系数表格t0作为系数表格t。
另外,关于在系数表格存储部25中存储的系数表格t0,t1,t2的i=0的系数wt0(0),wt1(0),wt2(0),不是必须要满足wt0(0)≦wt1(0)≦wt2(0)的关系,也可以是具有wt0(0)>wt1(0)和/或wt1(0)>wt2(0)的关系的值。
然后,系数决定部24将在该选择的系数表格t中存储的各阶数i的系数wt(i)设为系数wO(i)(步骤S45)。即,设为wO(i)=wt(i)。换言之,系数决定部24从所选择的系数表格t中取得与各阶数i对应的系数wt(i),将所取得的与各阶数i对应的系数wt(i)设为wO(i)。
在第三实施方式中不同于第一实施方式以及第二实施方式,由于不需要基于与基本频率处于正的相关关系的值或与基本频率处于负的相关关系的值的函数来计算系数wO(i),因而能够以更少的运算处理量来决定wO(i)。
关于在系数表格存储部25中存储的两个以上的系数表格可以说以下几点。
将在系数表格存储部25中存储的两个以上的系数表格中的、在与基本频率处于正的相关关系的值为第一值的情况下由系数决定部24取得系数wO(i)(i=0,1,…,Pmax)的系数表格设为第一系数表格。将在系数表格存储部25中存储的两个以上的系数表格中的、在与基本频率处于正的相关关系的值为小于第一值的第二值的情况下由系数决定部24取得系数wO(i)(i=0,1,…,Pmax)的系数表格设为第二系数表格。这时,对于至少一部分的各阶数i,第二系数表格中的与各阶数i对应的系数,大于第一系数表格中的与该各阶数i对应的系数。
此外,将在系数表格存储部25中存储的两个以上的系数表格中的、在与基本频率处于负的相关关系的值为第一值的情况下由系数决定部24取得系数wO(i)(i=0,1,…,Pmax)的系数表格设为第一系数表格。将在系数表格存储部25中存储的两个以上的系数表格中的、在与基本频率处于负的相关关系的值为大于第一值的第二值的情况下由系数决定部24取得系数wO(i)(i=0,1,…,Pmax)的系数表格设为第二系数表格。这时,对于至少一部分的各阶数i,第二系数表格中的与各阶数i对应的系数,大于第一系数表格中的与该各阶数i对应的系数。
<第三实施方式的具体例>
以下,说明第三实施方式的具体例。在该具体例中,作为与基本频率处于负的相关关系的值而使用周期的量化值,根据该周期的量化值而选择系数表格t。
在线性预测分析装置2中被输入通过高通滤波器而采样变换为128kHz且进行了预增强处理的每帧N样本的数字音响信号即输入信号XO(n)(n=0,1,…,N-1)、和作为有关周期的信息而关于当前帧的一部分输入信号XO(n)(n=0,1,…,Nn)(其中,Nn是满足Nn<N这样的关系的预定的正整数)在周期计算部940中求出的周期T。有关当前帧的一部分输入信号XO(n)(n=0,1,…,Nn)的周期T是,在周期计算部940中作为该输入信号的前一帧的信号区间而包含当前帧的一部分输入信号XO(n)(n=0,1,…,Nn),在对于前一帧的信号区间的周期计算部940的处理中对XO(n)(n=0,1,…,Nn)进行计算并存储的周期。
自相关计算部21根据输入信号XO(n)通过下述的式(16)求出自相关RO(i)(i=0,1,…,Pmax)。
[数14]
在系数决定部24中被输入作为有关周期的信息的周期T。在此,假设周期T被包含在29≦T≦231这样的范围内。系数决定部24根据由所输入的有关周期T的信息而确定的周期T,通过以下的式(17)的运算而得到索引D。该索引D是与基本频率处于负的相关关系的值,对应于周期的量化值。
D=int(T/110+0.5) (17)
在此,int是取整函数,是通过舍去所输入的实数的小数点以下而仅输出该实数的整数部分的函数。图7是表示周期T、索引D、周期的量化值T'的关系的图的例子。图7的横轴是周期T,纵轴是周期的量化值T'。周期的量化值是T'=D×110。由于周期T为29≦T≦231,因而索引D成为0,1,2的其中一个值。另外,也可以不使用式(17),而使用阈值来如下求出索引D,即如果周期T为29≦T≦54则D=0、如果55≦T≦164则D=1、如果165≦T≦231则D=2。
在系数表格存储部25中存储了在D=0时选择的系数表格t0、在D=1时选择的系数表格t1、在D=2时选择的系数表格t2。
系数表格t0是式(13)的以往方法的f0=60Hz(即相当于半幅值142Hz)的系数表格,各阶数的系数wtO(i)如下决定。
wt0(i)=[1.0,0.999566371,0.998266613,0.996104103,0.993084457,0.989215493,0.984507263,0.978971839,0.972623467,0.96547842,0.957554817,0.948872864,0.939454317,0.929322779,0.918503404,0.907022834,0.894909143]
系数表格t1是式(13)的f0=50Hz(即相当于半幅值116Hz)的系数表格,各阶数的系数wt1(i)如下决定。
wt1(i)=[1.0,0.999706,0.998824,0.997356,0.995304,0.992673,0.989466,0.985689,0.98135,0.976455,0.971012,0.965032,0.958525,0.951502,0.943975,0.935956,0.927460]
系数表格t2是式(13)的f0=25Hz(即相当于半幅值58Hz)的系数表格,各阶数的系数wt2(i)如下决定。
wt2(i)=[1.0,0.999926,0.999706,0.999338,0.998824,0.998163,0.997356,0.996403,0.995304,0.99406,0.992672,0.99114,0.989465,0.987647,0.985688,0.983588,0.981348]
在此,上述的wtO(i),wt1(i),wt2(i)的列表是,设为Pmax=16,按照i=0,1,2,…,16的顺序从左开始排列了与i对应的系数的大小的列表。即,在上述的例子中,例如是wt0(0)=1.0,wt0(3)=0.996104103。
图8中以图表表示每个i的系数表格的系数wt0(i),wt1(i),wt2(i)的系数的大小。图8的横轴表示阶数i,图8的纵轴表示系数的大小。根据该图表也可知,在各系数表格内,具有随着i的值增大而系数的大小会单调减少的关系。此外,若将与相同的i的值对应的不同的系数表格的系数的大小进行比较,则对于i≧1,满足wt0(i)<wt1(i)<wt2(i)的关系。即,对于除0以外的i≧1的i,换言之,关于至少一部分i,具有随着索引D增大而系数的大小会单调增加的关系。对于i=0以外,在系数表格存储部25中存储的多个系数表格只要是具有这样的关系的表格,则不限于上述的例子。
此外,如在非专利文献1或非专利文献2中所记载的那样,也可以仅对i=0的系数进行特殊处理,从而使用wt0(0)=wt1(0)=wt2(0)=1.0001或wt0(0)=wt1(0)=wt2(0)=1.003这样的经验值。另外,关于i=0,不需要满足wt0(i)<wt1(i)<wt2(i)的关系,并且,wt0(0),wt1(0),wt2(0)也可以不一定是相同的值。例如,也可以如wt0(0)=1.0001,wt1(0)=1.0,wt2(0)=1.0那样,仅关于i=0,wt0(0),wt1(0),wt2(0)中的两个以上的值的大小关系不满足wt0(i)<wt1(i)<wt2(i)的关系。
系数决定部24选择与索引D对应的系数表格tD作为系数表格t。
然后,系数决定部24将该选择的系数表格t的各系数wt(i)设为系数wO(i)。即,设为wO(i)=wt(i)。换言之,系数决定部24从所选择的系数表格t中取得与各阶数i对应的系数wt(i),将所取得的与各阶数i对应的系数wt(i)设为wO(i)。
另外,在上述的例子中,将各系数表格t0,t1,t2和索引D建立对应,但也可以将各系数表格t0,t1,t2和与基本频率处于正的相关关系的值或者索引D以外的与基本频率处于负的相关关系的值建立对应。
<第三实施方式的变形例>
在第三实施方式中将在多个系数表格的其中一个表格中存储的系数决定为系数wO(i),但第三实施方式的变形例在除此之外,还包含通过基于在多个系数表格中存储的系数的运算处理来决定系数wO(i)的情况。
第三实施方式的变形例的线性预测分析装置2的功能结构是与第三实施方式相同的图5。第三实施方式的变形例的线性预测分析装置2中,系数决定部24的处理不同,除了在系数表格存储部25中包含的系数表格不同的部分以外,与第三实施方式的线性预测分析装置2相同。
在系数表格存储部25中仅存储了系数表格t0和t2,在系数表格t0中存储了系数wt0(i)(i=0,1,…,Pmax),系数表格t2中存储了系数wt2(i)(i=0,1,…,Pmax)。在两个系数表格t0,t2中分别存储了如下决定的系数wt0(i)(i=0,1,…,Pmax)和系数wt2(i)(i=0,1,…,Pmax),即关于至少一部分的各i为wt0(i)<wt2(i),关于剩余的各i成为wt0(i)≦wt2(i)。
在此,假设决定了满足0<th1'<th2'这样的关系的两个阈值th1',th2'。这时,系数决定部24,
(1)在与基本频率处于正的相关关系的值>th2'的情况下、即判断为基本频率高的情况下,选择系数表格t0的各系数wt0(i)作为系数wO(i),
(2)在th2'≧与基本频率处于正的相关关系的值>th1'的情况下、即判断为基本频率是中等程度的情况下,使用系数表格t0的各系数wt0(i)和系数表格t2的各系数wt2(i),通过wO(i)=β'×wt0(i)+(1-β')×wt2(i)来决定系数wO(i),
(3)在th1'≧与基本频率处于正的相关关系的值的情况下、即判断为基本频率低的情况下,选择系数表格t2的各系数wt2(i)作为系数wO(i)。在此,β'是,0≦β'≦1,且通过在基本频率P取较小的值时β'的值也会减小而在基本频率P取较大的值时β'的值也会增大的函数β'=c(P),根据基本频率P而求出的值。若设为该结构,则在基本频率为中等程度的情况中的基本频率P较小时能够将接近wt2(i)的值设为系数wO(i),相反在基本频率为中等程度的情况中的基本频率P较大时能够将接近wt0(i)的值设为系数wO(i),因而仅凭两个表格就能够得到3个以上的系数wO(i)。
此外,在此,假设决定了满足0<th1<th2这样的关系的两个阈值th1,th2。这时,系数决定部24,
(1)在与基本频率处于负的相关关系的值≧th2的情况下、即判断为周期长的情况下,选择系数表格t2的各系数wt2(i)作为系数wO(i),
(2)在th2>与基本频率处于负的相关关系的值≧th1的情况下、即判断为周期是中等程度的情况下,使用系数表格t0的各系数wt0(i)和系数表格t2的各系数wt2(i),通过wO(i)=(1-β)×wt0(i)+β×wt2(i)来决定系数wO(i),
(3)在th1>与基本频率处于负的相关关系的值的情况下、即判断为周期小的情况下,选择系数表格t0的各系数wt0(i)作为系数wO(i)。在此,β是,0≦β≦1,且通过在周期T取较小的值时β的值也会减小而在周期T取较大的值时β的值也会增大的函数β=b(T),根据周期T而求出的值。若设为该结构,则在周期为中等程度的情况中的周期T较小时能够将接近wt0(i)的值设为系数wO(i),相反在周期为中等程度的情况中的周期T较大时能够将接近wt2(i)的值设为系数wO(i),因而仅凭两个表格就能够得到3个以上的系数wO(i)。
另外,关于在系数表格存储部25中存储的系数表格t0,t2的i=0的系数wt0(0),wt2(0),不是必须要满足wt0(0)≦wt2(0)的关系,也可以是具有wt0(0)>wt2(0)的关系的值。
[第一实施方式至第三实施方式公共的变形例]
如图10以及图11所示,在上述所有的实施方式以及变形例中,也可以不包含系数乘法部22,在预测系数计算部23中使用系数wO(i)和自相关RO(i)而进行线性预测分析。图10和图11是分别与图1和图5对应的线性预测分析装置2的结构例。该情况下,如图12所示,预测系数计算部23不是使用系数wO(i)和自相关RO(i)相乘后的值即变形自相关R'O(i),而是直接使用系数wO(i)和自相关RO(i)而进行线性预测分析(步骤S5)。
[第四实施方式]
第四实施方式是,对输入信号XO(n)使用以往的线性预测分析装置而进行线性预测分析,使用该线性预测分析的结果在基本频率计算部中得到基本频率,使用基于所得到的基本频率的系数wO(i),通过本发明的线性预测分析装置而求出能够变换为线性预测系数的系数。
如图13所示,第四实施方式的线性预测分析装置3例如具备第一线性预测分析部31、线性预测残差计算部32、基本频率计算部33、第二线性预测分析部34。
[第一线性预测分析部31]
第一线性预测分析部31进行与以往的线性预测分析装置1相同的动作。即,第一线性预测分析部31根据输入信号XO(n)求出自相关RO(i)(i=0,1,…,Pmax),通过将自相关RO(i)(i=0,1,…,Pmax)和预先决定的系数wO(i)(i=0,1,…,Pmax)按相同i进行相乘而求出变形自相关R'O(i)(i=0,1,…,Pmax),根据变形自相关R'O(i)(i=0,1,…,Pmax),求出能够变换为从1阶到预先决定的最大阶数Pmax阶为止的线性预测系数的系数。
[线性预测残差计算部32]
线性预测残差计算部32对于输入信号XO(n)进行基于能够变换为从1阶到Pmax阶为止的线性预测系数的系数的线性预测、或与线性预测等价或者相似的过滤处理,从而求出线性预测残差信号XR(n)。由于过滤处理也可以说是加权处理,因而线性预测残差信号XR(n)也可以说是加权输入信号。
[基本频率计算部33]
基本频率计算部33求出线性预测残差信号XR(n)的基本频率P,输出有关基本频率的信息。作为求出基本频率的方法,存在各种公知的方法,因而也可以使用公知的任意方法。基本频率计算部33例如关于构成当前帧的线性预测残差信号XR(n)(n=0,1,…,N-1)的多个子帧分别求出基本频率。即,求出2以上的整数的M个子帧即XRs1(n)(n=0,1,…,N/M-1),…,XRsM(n)(n=(M-1)N/M,(M-1)N/M+1,…,N-1)的各自的基本频率即Ps1,…,PsM。假设N能够用M整除。基本频率计算部33接着将能够确定构成当前帧的M个子帧的基本频率即Ps1,…,PsM中的最大值max(Ps1,…,PsM)的信息,作为有关基本频率的信息而输出。
[第二线性预测分析部34]
第二线性预测分析部34进行与第一实施方式至第三实施方式的线性预测分析装置2、第二实施方式的第二变形例的线性预测分析装置2、第三实施方式的变形例的线性预测分析装置2、第一实施方式至第三实施方式公共的变形例的线性预测分析装置2的任意一个相同的动作。即,第二线性预测分析部34根据输入信号XO(n)求出自相关RO(i)(i=0,1,…,Pmax),基于基本频率计算部33输出的有关基本频率的信息而决定系数wO(i)(i=0,1,…,Pmax),使用自相关RO(i)(i=0,1,…,Pmax)和已决定的系数wO(i)(i=0,1,…,Pmax),求出能够变换为1阶到预先决定的最大阶数即Pmax阶为止的线性预测系数的系数。
<第四实施方式的变形例>
第四实施方式的变形例,对输入信号XO(n)使用以往的线性预测分析装置进行线性预测分析,使用该线性预测分析的结果在周期计算部中得到周期,使用基于所得到的周期的系数wO(i),通过本发明的线性预测分析装置求出能够变换为线性预测系数的系数。
如图14所示,第四实施方式的变形例的线性预测分析装置3例如具备第一线性预测分析部31、线性预测残差计算部32、周期计算部35、第二线性预测分析部34。第四实施方式的变形例的线性预测分析装置3的第一线性预测分析部31和线性预测残差计算部32分别与第四实施方式的线性预测分析装置3同样。以下,以与第四实施方式不同的部分为中心进行说明。
[周期计算部35]
周期计算部35求出线性预测残差信号XR(n)的周期T,输出有关周期的信息。作为求出周期的方法,存在各种公知的方法,因而也可以使用公知的任意方法。周期计算部35例如关于构成当前帧的线性预测残差信号XR(n)(n=0,1,…,N-1)的多个子帧分别求出周期。即,求出2以上的整数的M个子帧即XRs1(n)(n=0,1,…,N/M-1),…,XRsM(n)(n=(M-1)N/M,(M-1)N/M+1,…,N-1)的各自的周期即Ts1,…,TsM。假设N能够用M整除。周期计算部35接着将能够确定构成当前帧的M个子帧的周期即Ts1,…,TsM中的最小值min(Ts1,…,TsM)的信息作为有关周期的信息来输出。
[变形例的第二线性预测分析部34]
第四实施方式的变形例的第二线性预测分析部34进行与第一实施方式的变形例的线性预测分析装置2、第二实施方式的第一变形例的线性预测分析装置2、第二实施方式的第三变形例的线性预测分析装置2、第三实施方式的线性预测分析装置2、第三实施方式的变形例的线性预测分析装置2、第一实施方式至第三实施方式公共的变形例的线性预测分析装置2的任意一个相同的动作。即,第二线性预测分析部34根据输入信号XO(n)求出自相关RO(i)(i=0,1,…,Pmax),基于周期计算部35输出的有关周期的信息来决定系数wO(i)(i=0,1,…,Pmax),使用自相关RO(i)(i=0,1,…,Pmax)和已决定的系数wO(i)(i=0,1,…,Pmax),求出能够变换为1阶到预先决定的最大阶数即Pmax为止的线性预测系数的系数。
<关于与基本频率处于正的相关关系的值>
如在第一实施方式中作为基本频率计算部930的具体例2而说明的那样,作为与基本频率处于正的相关关系的值,也可以使用在前面的帧的信号处理中进行也被称为先行(Look-ahead)的预读而利用的样本部分中与当前帧的样本对应的部分的基本频率。
此外,作为与基本频率处于正的相关关系的值,也可以使用基本频率的估计值。例如,也可以将根据过去的多个帧的基本频率而预测的有关当前的帧的基本频率的估计值、或有关过去的多个帧的基本频率的平均值或最小值或最大值作为基本频率的估计值来使用。此外,也可以将有关多个子帧的基本频率的平均值或最小值或最大值作为基本频率的估计值来使用。
此外,作为与基本频率处于正的相关关系的值,也可以使用基本频率的量化值。即,可以使用量化前的基本频率,也可以使用量化后的基本频率。
进而,作为与基本频率处于正的相关关系的值,在立体声等的多个通道的情况下,也可以使用有关其中一个已分析的通道的基本频率。
<关于与基本频率处于负的相关关系的值>
如在第一实施方式中作为周期计算部940的具体例2而说明的那样,作为与基本频率处于负的相关关系的值,也可以使用在前面的帧的信号处理中进行也被称为先行(Look-ahead)的预读而利用的样本部分中与当前帧的样本对应的部分的周期。
此外,作为与基本频率处于负的相关关系的值,也可以使用周期的估计值。例如,也可以将根据过去的多个帧的基本频率而预测的有关当前的帧的周期的估计值、或有关过去的多个帧的周期的平均值或最小值或最大值作为周期的估计值来使用。此外,也可以将有关多个子帧的周期的平均值或最小值或最大值作为周期的估计值来使用。或者,也可以使用过去的多个帧的基本频率、以及通过进行也被称为先行(Look-ahead)的预读而利用的样本部分中与当前帧的样本对应的部分所预测的有关当前帧的周期的估计值,同样地,也可以将过去的多个帧的基本频率、以及有关进行也被称为先行(Look-ahead)的预读而利用的样本部分中与当前帧的样本对应的部分的平均值或最小值或最大值作为估计值来使用。
此外,作为与基本频率处于负的相关关系的值,也可以使用周期的量化值。即,可以使用量化前的周期,也可以使用量化后的周期。
进而,作为与基本频率处于负的相关关系的值,在立体声等的多个通道的情况下,也可以使用有关其中一个已分析的通道的周期。
另外,在上述的各实施方式以及各变形例的与基本频率处于正的相关关系的值或与基本频率处于负的相关关系的值和阈值的比较中,进行设定以便在与基本频率处于正的相关关系的值或与基本频率处于负的相关关系的值为与阈值相同的值的情况下,将情况划分到以阈值为边界的相邻的两个情况的其中一个即可。即,也可以将某一阈值以上的情况设为大于该阈值的情况,并且将小于该阈值的情况设为该阈值以下的情况。此外,也可以将大于某一阈值的情况设为该阈值以上的情况,并且将该阈值以下的情况设为小于该阈值的情况。
在上述装置以及方法中说明的处理不仅可以按照记载的顺序以时间序列方式来执行,也可以根据执行处理的装置的处理能力或者需要而并行或者单独地执行。
此外,在由计算机实现线性预测分析方法中的各步骤的情况下,通过程序来记述线性预测分析方法应具有的功能的处理内容。并且,通过由计算机来执行该程序,在计算机上实现其各步骤。
记述了该处理内容的程序能够记录在计算机可读取的记录介质中。作为计算机可读取的记录介质,例如可以是磁记录介质、光盘、光磁记录介质、半导体存储器等的介质。
此外,各处理部件可以通过使计算机执行预定的程序而构成,也可以设为将这些处理内容的至少一部分以硬件方式来实现。
除此之外,在不脱离本发明的宗旨的范围内能够适当进行变更是不言而喻的。
Claims (3)
1.一种线性预测分析方法,按作为预定时间区间的每个帧,求出与输入时间序列信号对应的能够变换为线性预测系数的系数,该线性预测分析方法包括:
自相关计算步骤,至少关于i=0,1,…,Pmax的每一个,计算当前的帧的输入时间序列信号XO(n)和i样本以前的输入时间序列信号XO(n-i)或者i样本以后的输入时间序列信号XO(n+i)的自相关RO(i);以及
预测系数计算步骤,使用系数wO(i)和所述自相关RO(i)按对应的每个i相乘得到的变形自相关R'O(i),求出能够变换为1阶到Pmax阶为止的线性预测系数的系数,
该线性预测分析方法还包括:
系数决定步骤,设为在两个以上的系数表格的每一个中存储系数wO(i),使用与基本频率处于正的相关关系的值,从所述两个以上的系数表格中的一个系数表格取得系数wO(i),其中,该基本频率基于当前或者过去的帧中的输入时间序列信号,
将所述两个以上的系数表格中的、在与所述基本频率处于正的相关关系的值为第一值的情况下在所述系数决定步骤中取得系数wO(i)的系数表格作为第一系数表格,
将所述两个以上的系数表格中的、在与所述基本频率处于正的相关关系的值为小于所述第一值的第二值的情况下在所述系数决定步骤中取得系数wO(i)的系数表格作为第二系数表格,
对于至少一部分的各阶数i,所述第二系数表格中的与所述各阶数i对应的系数,大于所述第一系数表格中的与所述各阶数i对应的系数。
2.一种线性预测分析装置,按作为预定时间区间的每个帧,求出与输入时间序列信号对应的能够变换为线性预测系数的系数,该线性预测分析装置包括:
自相关计算部,至少关于i=0,1,…,Pmax的每一个,计算当前的帧的输入时间序列信号XO(n)和i样本以前的输入时间序列信号XO(n-i)或者i样本以后的输入时间序列信号XO(n+i)的自相关RO(i);以及
预测系数计算部,使用系数wO(i)和所述自相关RO(i)按对应的每个i相乘得到的变形自相关R'O(i),求出能够变换为1阶到Pmax阶为止的线性预测系数的系数,
该线性预测分析装置还包括:
系数决定部,设为在两个以上的系数表格的每一个中存储系数wO(i),使用与基本频率处于正的相关关系的值,从所述两个以上的系数表格中的一个系数表格取得系数wO(i),其中,该基本频率基于当前或者过去的帧中的输入时间序列信号,
将所述两个以上的系数表格中的、在与所述基本频率处于正的相关关系的值为第一值的情况下在所述系数决定部中取得系数wO(i)的系数表格作为第一系数表格,
将所述两个以上的系数表格中的、在与所述基本频率处于正的相关关系的值为小于所述第一值的第二值的情况下在所述系数决定部中取得系数wO(i)的系数表格作为第二系数表格,
对于至少一部分的各阶数i,所述第二系数表格中的与所述各阶数i对应的系数,大于所述第一系数表格中的与所述各阶数i对应的系数。
3.一种计算机可读取的记录介质,记录了用于使计算机执行权利要求1的线性预测分析方法的各步骤的程序。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013-149160 | 2013-07-18 | ||
JP2013149160 | 2013-07-18 | ||
CN201480040536.4A CN105378836B (zh) | 2013-07-18 | 2014-07-16 | 线性预测分析装置、方法、以及记录介质 |
PCT/JP2014/068895 WO2015008783A1 (ja) | 2013-07-18 | 2014-07-16 | 線形予測分析装置、方法、プログラム及び記録媒体 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201480040536.4A Division CN105378836B (zh) | 2013-07-18 | 2014-07-16 | 线性预测分析装置、方法、以及记录介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110070877A CN110070877A (zh) | 2019-07-30 |
CN110070877B true CN110070877B (zh) | 2022-11-11 |
Family
ID=52346231
Family Applications (6)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201480040536.4A Active CN105378836B (zh) | 2013-07-18 | 2014-07-16 | 线性预测分析装置、方法、以及记录介质 |
CN201811547577.9A Active CN109979471B (zh) | 2013-07-18 | 2014-07-16 | 线性预测分析装置、线性预测分析方法以及记录介质 |
CN201811547969.5A Active CN110085243B (zh) | 2013-07-18 | 2014-07-16 | 线性预测分析装置、线性预测分析方法以及记录介质 |
CN201811547968.0A Active CN109887520B (zh) | 2013-07-18 | 2014-07-16 | 线性预测分析装置、线性预测分析方法以及记录介质 |
CN201811547970.8A Active CN110070876B (zh) | 2013-07-18 | 2014-07-16 | 线性预测分析装置、线性预测分析方法以及记录介质 |
CN201811547976.5A Active CN110070877B (zh) | 2013-07-18 | 2014-07-16 | 线性预测分析装置、线性预测分析方法以及记录介质 |
Family Applications Before (5)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201480040536.4A Active CN105378836B (zh) | 2013-07-18 | 2014-07-16 | 线性预测分析装置、方法、以及记录介质 |
CN201811547577.9A Active CN109979471B (zh) | 2013-07-18 | 2014-07-16 | 线性预测分析装置、线性预测分析方法以及记录介质 |
CN201811547969.5A Active CN110085243B (zh) | 2013-07-18 | 2014-07-16 | 线性预测分析装置、线性预测分析方法以及记录介质 |
CN201811547968.0A Active CN109887520B (zh) | 2013-07-18 | 2014-07-16 | 线性预测分析装置、线性预测分析方法以及记录介质 |
CN201811547970.8A Active CN110070876B (zh) | 2013-07-18 | 2014-07-16 | 线性预测分析装置、线性预测分析方法以及记录介质 |
Country Status (9)
Country | Link |
---|---|
US (4) | US10909996B2 (zh) |
EP (3) | EP3389047B1 (zh) |
JP (1) | JP6117359B2 (zh) |
KR (3) | KR101883789B1 (zh) |
CN (6) | CN105378836B (zh) |
ES (3) | ES2699582T3 (zh) |
PL (3) | PL3389047T3 (zh) |
TR (1) | TR201815212T4 (zh) |
WO (1) | WO2015008783A1 (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10909996B2 (en) * | 2013-07-18 | 2021-02-02 | Nippon Telegraph And Telephone Corporation | Linear prediction analysis device, method, program, and storage medium |
PL3385948T3 (pl) | 2014-03-24 | 2020-01-31 | Nippon Telegraph And Telephone Corporation | Sposób kodowania, koder, program i nośnik zapisu |
US9721159B2 (en) * | 2015-10-05 | 2017-08-01 | Evan Donald Balster | Periodicity analysis system |
US11723579B2 (en) | 2017-09-19 | 2023-08-15 | Neuroenhancement Lab, LLC | Method and apparatus for neuroenhancement |
JP6904198B2 (ja) * | 2017-09-25 | 2021-07-14 | 富士通株式会社 | 音声処理プログラム、音声処理方法および音声処理装置 |
US11717686B2 (en) | 2017-12-04 | 2023-08-08 | Neuroenhancement Lab, LLC | Method and apparatus for neuroenhancement to facilitate learning and performance |
WO2019133997A1 (en) | 2017-12-31 | 2019-07-04 | Neuroenhancement Lab, LLC | System and method for neuroenhancement to enhance emotional response |
US11364361B2 (en) | 2018-04-20 | 2022-06-21 | Neuroenhancement Lab, LLC | System and method for inducing sleep by transplanting mental states |
WO2020056418A1 (en) | 2018-09-14 | 2020-03-19 | Neuroenhancement Lab, LLC | System and method of improving sleep |
US11786694B2 (en) | 2019-05-24 | 2023-10-17 | NeuroLight, Inc. | Device, method, and app for facilitating sleep |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010170124A (ja) * | 2008-12-30 | 2010-08-05 | Huawei Technologies Co Ltd | 信号圧縮方法及び装置 |
CN101983402A (zh) * | 2008-09-16 | 2011-03-02 | 松下电器产业株式会社 | 声音分析装置、声音分析合成装置、校正规则信息生成装置、声音分析系统、声音分析方法、校正规则信息生成方法、以及程序 |
CN102044250A (zh) * | 2009-10-23 | 2011-05-04 | 华为技术有限公司 | 频带扩展方法及装置 |
CN102067211A (zh) * | 2009-03-11 | 2011-05-18 | 华为技术有限公司 | 一种线性预测分析方法、装置及系统 |
CN102884570A (zh) * | 2010-04-09 | 2013-01-16 | 杜比国际公司 | 基于mdct的复数预测立体声编码 |
Family Cites Families (35)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5550859A (en) * | 1994-04-29 | 1996-08-27 | Lucent Technologies Inc. | Recovering analog and digital signals from superimposed analog and digital signals using linear prediction |
JP3402748B2 (ja) * | 1994-05-23 | 2003-05-06 | 三洋電機株式会社 | 音声信号のピッチ周期抽出装置 |
US5774846A (en) * | 1994-12-19 | 1998-06-30 | Matsushita Electric Industrial Co., Ltd. | Speech coding apparatus, linear prediction coefficient analyzing apparatus and noise reducing apparatus |
US5648989A (en) * | 1994-12-21 | 1997-07-15 | Paradyne Corporation | Linear prediction filter coefficient quantizer and filter set |
JP3522012B2 (ja) * | 1995-08-23 | 2004-04-26 | 沖電気工業株式会社 | コード励振線形予測符号化装置 |
TW321810B (zh) * | 1995-10-26 | 1997-12-01 | Sony Co Ltd | |
DE69712535T2 (de) * | 1996-11-07 | 2002-08-29 | Matsushita Electric Industrial Co., Ltd. | Vorrichtung zur Erzeugung eines Vektorquantisierungs-Codebuchs |
FI113903B (fi) * | 1997-05-07 | 2004-06-30 | Nokia Corp | Puheen koodaus |
EP1959434B1 (en) * | 1999-08-23 | 2013-03-06 | Panasonic Corporation | Speech encoder |
US6959274B1 (en) * | 1999-09-22 | 2005-10-25 | Mindspeed Technologies, Inc. | Fixed rate speech compression system and method |
US20040002856A1 (en) * | 2002-03-08 | 2004-01-01 | Udaya Bhaskar | Multi-rate frequency domain interpolative speech CODEC system |
EP1484841B1 (en) * | 2002-03-08 | 2018-12-26 | Nippon Telegraph And Telephone Corporation | DIGITAL SIGNAL ENCODING METHOD, DECODING METHOD, ENCODING DEVICE, DECODING DEVICE and DIGITAL SIGNAL DECODING PROGRAM |
CN1677493A (zh) * | 2004-04-01 | 2005-10-05 | 北京宫羽数字技术有限责任公司 | 一种增强音频编解码装置及方法 |
CN1947174B (zh) * | 2004-04-27 | 2012-03-14 | 松下电器产业株式会社 | 可扩展编码装置、可扩展解码装置、可扩展编码方法以及可扩展解码方法 |
US7733973B2 (en) * | 2004-08-19 | 2010-06-08 | The University Of Tokyo | Multichannel signal encoding method, its decoding method, devices for these, program, and its recording medium |
CN101006495A (zh) * | 2004-08-31 | 2007-07-25 | 松下电器产业株式会社 | 语音编码装置、语音解码装置、通信装置以及语音编码方法 |
BRPI0515453A (pt) * | 2004-09-17 | 2008-07-22 | Matsushita Electric Ind Co Ltd | aparelho de codificação escalável, aparelho de decodificação escalável, método de codificação escalável método de decodificação escalável, aparelho de terminal de comunicação, e aparelho de estação de base |
CN101091317B (zh) * | 2005-01-12 | 2011-05-11 | 日本电信电话株式会社 | 用于长期预测编码和长期预测解码的方法和装置 |
JP4675692B2 (ja) * | 2005-06-22 | 2011-04-27 | 富士通株式会社 | 話速変換装置 |
JP4736632B2 (ja) * | 2005-08-31 | 2011-07-27 | 株式会社国際電気通信基礎技術研究所 | ボーカル・フライ検出装置及びコンピュータプログラム |
CN1815552B (zh) * | 2006-02-28 | 2010-05-12 | 安徽中科大讯飞信息科技有限公司 | 基于线谱频率及其阶间差分参数的频谱建模与语音增强方法 |
US20090204397A1 (en) * | 2006-05-30 | 2009-08-13 | Albertus Cornelis Den Drinker | Linear predictive coding of an audio signal |
JP4757130B2 (ja) * | 2006-07-20 | 2011-08-24 | 富士通株式会社 | ピッチ変換方法及び装置 |
CN101154381B (zh) * | 2006-09-30 | 2011-03-30 | 华为技术有限公司 | 一种获取线性预测滤波器系数的装置 |
US20110022924A1 (en) * | 2007-06-14 | 2011-01-27 | Vladimir Malenovsky | Device and Method for Frame Erasure Concealment in a PCM Codec Interoperable with the ITU-T Recommendation G. 711 |
JP4825916B2 (ja) * | 2007-12-11 | 2011-11-30 | 日本電信電話株式会社 | 符号化方法、復号化方法、これらの方法を用いた装置、プログラム、記録媒体 |
JP4918074B2 (ja) * | 2008-08-18 | 2012-04-18 | 日本電信電話株式会社 | 符号化装置、符号化方法、符号化プログラム、及び記録媒体 |
JP4932917B2 (ja) * | 2009-04-03 | 2012-05-16 | 株式会社エヌ・ティ・ティ・ドコモ | 音声復号装置、音声復号方法、及び音声復号プログラム |
WO2012046685A1 (ja) * | 2010-10-05 | 2012-04-12 | 日本電信電話株式会社 | 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体 |
JP5663461B2 (ja) * | 2011-12-06 | 2015-02-04 | 日本電信電話株式会社 | 符号化方法、符号化装置、プログラム、記録媒体 |
CN102693147B (zh) * | 2012-06-13 | 2015-10-28 | 上海第二工业大学 | 计算机汇编语言的辅助分析装置及分析方法 |
CN102867516B (zh) * | 2012-09-10 | 2014-08-27 | 大连理工大学 | 一种采用高阶线性预测系数分组矢量量化的语音编解方法 |
US10909996B2 (en) * | 2013-07-18 | 2021-02-02 | Nippon Telegraph And Telephone Corporation | Linear prediction analysis device, method, program, and storage medium |
CN106415718B (zh) * | 2014-01-24 | 2019-10-25 | 日本电信电话株式会社 | 线性预测分析装置、方法以及记录介质 |
KR101832368B1 (ko) * | 2014-01-24 | 2018-02-26 | 니폰 덴신 덴와 가부시끼가이샤 | 선형 예측 분석 장치, 방법, 프로그램 및 기록 매체 |
-
2014
- 2014-07-16 US US14/905,158 patent/US10909996B2/en active Active
- 2014-07-16 CN CN201480040536.4A patent/CN105378836B/zh active Active
- 2014-07-16 ES ES14826090T patent/ES2699582T3/es active Active
- 2014-07-16 PL PL18173641T patent/PL3389047T3/pl unknown
- 2014-07-16 CN CN201811547577.9A patent/CN109979471B/zh active Active
- 2014-07-16 TR TR2018/15212T patent/TR201815212T4/tr unknown
- 2014-07-16 CN CN201811547969.5A patent/CN110085243B/zh active Active
- 2014-07-16 CN CN201811547968.0A patent/CN109887520B/zh active Active
- 2014-07-16 EP EP18173641.4A patent/EP3389047B1/en active Active
- 2014-07-16 ES ES18173641T patent/ES2749904T3/es active Active
- 2014-07-16 EP EP18173638.0A patent/EP3399522B1/en active Active
- 2014-07-16 KR KR1020177032374A patent/KR101883789B1/ko active IP Right Grant
- 2014-07-16 CN CN201811547970.8A patent/CN110070876B/zh active Active
- 2014-07-16 KR KR1020167001218A patent/KR101797679B1/ko active IP Right Grant
- 2014-07-16 JP JP2015527315A patent/JP6117359B2/ja active Active
- 2014-07-16 ES ES18173638T patent/ES2760934T3/es active Active
- 2014-07-16 CN CN201811547976.5A patent/CN110070877B/zh active Active
- 2014-07-16 PL PL14826090T patent/PL3012835T3/pl unknown
- 2014-07-16 EP EP14826090.4A patent/EP3012835B1/en active Active
- 2014-07-16 PL PL18173638T patent/PL3399522T3/pl unknown
- 2014-07-16 WO PCT/JP2014/068895 patent/WO2015008783A1/ja active Application Filing
- 2014-07-16 KR KR1020177032372A patent/KR101883767B1/ko active IP Right Grant
-
2020
- 2020-12-14 US US17/120,462 patent/US11532315B2/en active Active
-
2022
- 2022-10-21 US US17/970,879 patent/US11972768B2/en active Active
-
2024
- 2024-03-25 US US18/614,837 patent/US20240233739A1/en active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101983402A (zh) * | 2008-09-16 | 2011-03-02 | 松下电器产业株式会社 | 声音分析装置、声音分析合成装置、校正规则信息生成装置、声音分析系统、声音分析方法、校正规则信息生成方法、以及程序 |
JP2010170124A (ja) * | 2008-12-30 | 2010-08-05 | Huawei Technologies Co Ltd | 信号圧縮方法及び装置 |
CN102067211A (zh) * | 2009-03-11 | 2011-05-18 | 华为技术有限公司 | 一种线性预测分析方法、装置及系统 |
CN102044250A (zh) * | 2009-10-23 | 2011-05-04 | 华为技术有限公司 | 频带扩展方法及装置 |
CN102884570A (zh) * | 2010-04-09 | 2013-01-16 | 杜比国际公司 | 基于mdct的复数预测立体声编码 |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110070877B (zh) | 线性预测分析装置、线性预测分析方法以及记录介质 | |
JP6423065B2 (ja) | 線形予測分析装置、方法、プログラム及び記録媒体 | |
JP6416363B2 (ja) | 線形予測分析装置、方法、プログラム及び記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |