JP6449969B2 - 線形予測分析装置、方法、プログラム及び記録媒体 - Google Patents
線形予測分析装置、方法、プログラム及び記録媒体 Download PDFInfo
- Publication number
- JP6449969B2 JP6449969B2 JP2017223809A JP2017223809A JP6449969B2 JP 6449969 B2 JP6449969 B2 JP 6449969B2 JP 2017223809 A JP2017223809 A JP 2017223809A JP 2017223809 A JP2017223809 A JP 2017223809A JP 6449969 B2 JP6449969 B2 JP 6449969B2
- Authority
- JP
- Japan
- Prior art keywords
- coefficient
- value
- pitch gain
- fundamental frequency
- coefficient table
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004458 analytical method Methods 0.000 title claims description 132
- 238000000034 method Methods 0.000 title description 38
- 230000002596 correlated effect Effects 0.000 claims description 208
- 238000004364 calculation method Methods 0.000 claims description 126
- 230000000875 corresponding effect Effects 0.000 claims description 124
- 238000013139 quantization Methods 0.000 claims description 17
- 230000000737 periodic effect Effects 0.000 claims description 4
- 230000001568 sexual effect Effects 0.000 claims 1
- 238000012986 modification Methods 0.000 description 76
- 230000004048 modification Effects 0.000 description 76
- 230000007423 decrease Effects 0.000 description 20
- 230000003595 spectral effect Effects 0.000 description 11
- 230000005236 sound signal Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 230000003247 decreasing effect Effects 0.000 description 8
- 230000014509 gene expression Effects 0.000 description 8
- 238000001228 spectrum Methods 0.000 description 8
- 238000005070 sampling Methods 0.000 description 5
- 238000005311 autocorrelation function Methods 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 3
- 102220475340 DNA replication licensing factor MCM2_S41A_mutation Human genes 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 101150045326 Fth1 gene Proteins 0.000 description 1
- 244000309464 bull Species 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/12—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/06—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/21—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Complex Calculations (AREA)
- Measurement Of Length, Angles, Or The Like Using Electric Or Magnetic Means (AREA)
- Auxiliary Devices For Music (AREA)
- Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)
Description
線形予測分析装置1の自己相関計算部11は、入力信号XO(n)から自己相関RO(i) (i=0,1,…,Pmax,Pmaxは予測次数)を式(11)により求めて出力する。Pmaxは、N未満の所定の正の整数である。
次に、係数乗算部12が、自己相関計算部11から出力された自己相関RO(i)に予め定めた係数wO(i) (i=0,1,…,Pmax)を同じiごとに乗じることにより、変形自己相関R' O(i)を求める。すなわち、変形自己相関R' O(i)を式(12)により求める。
そして、予測係数計算部13が、係数乗算部12から出力された変形自己相関R'O(i)を用いて例えばLevinson-Durbin法などにより、1次から予め定めた予測次数であるPmax次までの線形予測係数に変換可能な係数を求める。線形予測係数に変換可能な係数とは、PARCOR係数KO(1),KO(2),…,KO(Pmax)や線形予測係数aO(1),aO(2),…,aO(Pmax)等である。
第一実施形態の線形予測分析装置2は、図1に示すように、自己相関計算部21、係数決定部24、係数乗算部22及び予測係数計算部23を例えば備えている。自己相関計算部21、係数乗算部22及び予測係数計算部23の動作は、従来の線形予測分析装置1の自己相関計算部11、係数乗算部12及び予測係数計算部13における動作とそれぞれ同じである。
基本周波数計算部930は、現フレームの入力信号XO(n) (n=0, 1, …, N-1)および/または現フレームの近傍のフレームの入力信号の全部または一部から基本周波数Pを求める。基本周波数計算部930は、例えば、現フレームの入力信号XO(n) (n=0, 1, …, N-1)の全部または一部を含む信号区間のディジタル音声信号やディジタル音響信号の基本周波数Pを求め、基本周波数Pを特定可能な情報を基本周波数についての情報として出力する。基本周波数を求める方法としては、様々な公知の方法が存在するので、公知の何れの方法を用いてもよい。また、求めた基本周波数Pを符号化して基本周波数符号を得る構成とし、基本周波数符号を基本周波数についての情報として出力してもよい。さらに基本周波数符号に対応する基本周波数の量子化値^Pを得る構成とし、基本周波数の量子化値^Pを基本周波数についての情報として出力してもよい。以下、基本周波数計算部930の具体例について説明する。
基本周波数計算部930の具体例1は、現フレームの入力信号XO(n) (n=0, 1, …, N-1)が複数個のサブフレームで構成されている場合、かつ、同一のフレームについては線形予測分析装置2よりも先に基本周波数計算部930が動作される場合、の例である。基本周波数計算部930は、まず、2以上の整数であるM個のサブフレームであるXOs1(n) (n=0, 1, …, N/M-1), …, XOsM(n)(n= (M-1)N/M, (M-1)N/M+1, …, N-1)のそれぞれの基本周波数であるPs1, …, PsMを求める。NはMで割り切れるとする。基本周波数計算部930は、現フレームを構成するM個のサブフレームの基本周波数であるPs1, …, PsMのうちの最大値max(Ps1, …, PsM)を特定可能な情報を基本周波数についての情報として出力する。
基本周波数計算部930の具体例2は、現フレームの入力信号XO(n) (n=0, 1, …, N-1)と1つ後のフレームの一部の入力信号XO(n) (n=N, N+1, …, N+Nn-1) (ただし、Nnは、Nn<Nという関係を満たす所定の正の整数。)とで、先読み部分を含む信号区間が現フレームの信号区間として構成されている場合であり、かつ、同一のフレームについては線形予測分析装置2よりも後に基本周波数計算部930が動作される場合、の例である。基本周波数計算部930は、現フレームの信号区間について、現フレームの入力信号XO(n) (n=0, 1, …, N-1)と1つ後のフレームの一部の入力信号XO(n) (n=N, N+1, …, N+Nn-1)のそれぞれの基本周波数であるPnow, Pnextを求め、基本周波数Pnextを基本周波数計算部930に記憶する。基本周波数計算部930は、また、1つ前のフレームの信号区間について求めて基本周波数計算部930に記憶されていた基本周波数Pnext、すなわち、1つ前のフレームの信号区間のうちの現フレームの一部の入力信号XO(n) (n=0, 1, …, Nn-1)について求めた基本周波数、を特定可能な情報を基本周波数についての情報として出力する。なお、具体例1と同様に、現フレームについては複数のサブフレームごとの基本周波数を求めてもよい。
基本周波数計算部930の具体例3は、現フレームの入力信号XO(n) (n=0, 1, …, N-1)そのものが現フレームの信号区間として構成されている場合であり、かつ、同一のフレームについては線形予測分析装置2よりも後に基本周波数計算部930が動作される場合、の例である。基本周波数計算部930は、現フレームの信号区間である現フレームの入力信号XO(n) (n=0, 1, …, N-1)の基本周波数Pを求め、基本周波数Pを基本周波数計算部930に記憶する。基本周波数計算部930は、また、1つ前のフレームの信号区間、すなわち、1つ前のフレームの入力信号XO(n) (n=-N, -N+1, …, -1)について求めて基本周波数計算部930に記憶されていた基本周波数Pを特定可能な情報を基本周波数についての情報として出力する。
ピッチゲイン計算部950は、現フレームの入力信号XO(n) (n=0, 1, …, N-1)および/または現フレームの近傍のフレームの入力信号の全部または一部からピッチゲインGを求める。ピッチゲイン計算部950は、例えば、現フレームの入力信号XO(n) (n=0, 1, …, N-1)の全部または一部を含む信号区間のディジタル音声信号やディジタル音響信号のピッチゲインGを求め、ピッチゲインGを特定可能な情報をピッチゲインについての情報として出力する。ピッチゲインを求める方法としては、様々な公知の方法が存在するので、公知の何れの方法を用いてもよい。また、求めたピッチゲインGを符号化してピッチゲイン符号を得る構成とし、ピッチゲイン符号をピッチゲインについての情報として出力してもよい。さらにピッチゲイン符号に対応するピッチゲインの量子化値^Gを得る構成とし、ピッチゲインの量子化値^Gをピッチゲインについての情報として出力してもよい。以下、ピッチゲイン計算部950の具体例について説明する。
ピッチゲイン計算部950の具体例1は、現フレームの入力信号XO(n) (n=0, 1, …, N-1)が複数個のサブフレームで構成されている場合、かつ、同一のフレームについては線形予測分析装置2よりも先にピッチゲイン計算部950が動作される場合、の例である。ピッチゲイン計算部950は、まず、2以上の整数であるM個のサブフレームであるXOs1(n) (n=0, 1, …, N/M-1), …, XOsM(n)(n= (M-1)N/M, (M-1)N/M+1, …, N-1)のそれぞれのピッチゲインであるGs1,…,GsMを求める。NはMで割り切れるとする。ピッチゲイン計算部950は、現フレームを構成するM個のサブフレームのピッチゲインであるGs1,…, GsMのうちの最大値max(Gs1,…,GsM)を特定可能な情報をピッチゲインについての情報として出力する。
ピッチゲイン計算部950の具体例2は、現フレームの入力信号XO(n) (n=0, 1, …, N-1)と1つ後のフレームの一部の入力信号XO(n) (n=N, N+1, …, N+Nn-1)とで、先読み部分を含む信号区間が現フレームの信号区間として構成されている場合であり、かつ、同一のフレームについては線形予測分析装置2よりも後にピッチゲイン計算部950が動作される場合、の例である。ピッチゲイン計算部950は、現フレームの信号区間について、現フレームの入力信号XO(n) (n=0, 1, …, N-1)と1つ後のフレームの一部の入力信号XO(n) (n=N, N+1, …, N+Nn-1)のそれぞれのピッチゲインであるGnow, Gnextを求め、ピッチゲインGnextをピッチゲイン計算部950に記憶する。ピッチゲイン計算部950は、また、1つ前のフレームの信号区間について求めてピッチゲイン計算部950に記憶されていたピッチゲインGnext、すなわち、1つ前のフレームの信号区間のうちの現フレームの一部の入力信号XO(n) (n=0, 1, …, Nn-1)について求めたピッチゲイン、を特定可能な情報をピッチゲインについての情報として出力する。なお、具体例1と同様に、現フレームについては複数のサブフレームごとのピッチゲインを求めてもよい。
ピッチゲイン計算部950の具体例3は、現フレームの入力信号XO(n) (n=0, 1, …, N-1)そのものが現フレームの信号区間として構成されている場合であり、かつ、線形予測分析装置2よりも後にピッチゲイン計算部950が動作される場合、の例である。ピッチゲイン計算部950は、現フレームの信号区間である現フレームの入力信号XO(n) (n=0, 1, …, N-1)のピッチゲインGを求め、ピッチゲインGをピッチゲイン計算部950に記憶する。ピッチゲイン計算部950は、また、1つ前のフレームの信号区間、すなわち、1つ前のフレームの入力信号XO(n) (n=-N, -N+1, …, -1)について求めてピッチゲイン計算部950に記憶されていたピッチゲインGを特定可能な情報をピッチゲインについての情報として出力する。
自己相関計算部21は、入力されたNサンプルのフレーム毎の時間領域のディジタル音声信号やディジタル音響信号である入力信号XO(n)(n=0,1,…,N-1)から自己相関RO(i) (i=0,1,…,Pmax)を計算する(ステップS1)。Pmaxは、予測係数計算部23が求める線形予測係数に変換可能な係数の最大次数であり、N未満の所定の正の整数である。計算された自己相関RO(i) (i=0,1,…,Pmax)は、係数乗算部22に提供される。
係数決定部24は、入力された基本周波数についての情報及び入力されたピッチゲインについての情報を用いて、係数wO(i) (i=0,1,…,Pmax)を決定する(ステップS4)。係数wO(i)は、自己相関RO(i)を変形するための係数である。係数wO(i)は、信号処理の分野においては、ラグ窓wO(i)又はラグ窓係数wO(i)とも呼ばれているものである。係数wO(i)は正の値であるので、係数wO(i)が所定の値よりも大きい/小さいことを、係数wO(i)の大きさが所定の値よりも大きい/小さいと表現することがある。また、wO(i)の大きさとは、そのwO(i)の値を意味するものとする。
係数乗算部22は、係数決定部24で決定した係数wO(i) (i=0,1,…,Pmax)と、自己相関計算部21で求めた自己相関RO(i) (i=0,1,…,Pmax)とを同じiごとに乗じることにより、変形自己相関R'O(i) (i=0,1,…,Pmax)を求める(ステップS2)。すなわち、係数乗算部22は、以下の式(7)により自己相関R'O(i)を計算する。計算された自己相関R'O(i)は、予測係数計算部23に提供される。
予測係数計算部23は、係数乗算部22から出力された変形自己相関R'O(i)を用いて線形予測係数に変換可能な係数を求める(ステップS3)。
第一実施形態の変形例は、係数決定部24が、基本周波数及びピッチゲインと正の相関関係にある値ではなく、基本周波数と負の相関関係にある値、及び、ピッチゲインと正の相関関係にある値に基づいて係数wO(i)を決定するものである。
周期計算部940は、現フレームの入力信号XOおよび/または現フレームの近傍のフレームの入力信号の全部または一部から周期Tを求める。周期計算部940は、例えば、現フレームの入力信号XO(n)の全部または一部を含む信号区間のディジタル音声信号やディジタル音響信号の周期Tを求め、周期Tを特定可能な情報を周期についての情報として出力する。周期を求める方法としては、様々な公知の方法が存在するので、公知の何れの方法を用いてもよい。また、求めた周期Tを符号化して周期符号を得る構成とし、周期符号を周期についての情報として出力してもよい。さらに周期符号に対応する周期の量子化値^Tを得る構成とし、周期の量子化値^Tを周期についての情報として出力してもよい。以下、周期計算部940の具体例について説明する。
周期計算部940の具体例1は、現フレームの入力信号XO(n) (n=0, 1, …, N-1)が複数個のサブフレームで構成されている場合、かつ、同一のフレームについては線形予測分析装置2よりも先に周期計算部940が動作される場合、の例である。周期計算部940は、まず、2以上の整数であるM個のサブフレームであるXOs1(n) (n=0, 1, …, N/M-1), …, XOsM(n)(n= (M-1)N/M, (M-1)N/M+1, …, N-1)のそれぞれの周期であるTs1, …, TsMを求める。NはMで割り切れるとする。周期計算部940は、現フレームを構成するM個のサブフレームの周期であるTs1, …, TsMのうちの最小値min(Ts1, …, TsM)を特定可能な情報を周期についての情報として出力する。
周期計算部940の具体例2は、現フレームの入力信号XO(n) (n=0, 1, …, N-1)と1つ後のフレームの一部の入力信号XO(n) (n=N, N+1, …, N+Nn-1)(ただし、Nnは、Nn<Nという関係を満たす所定の正の整数。)とで、先読み部分を含む信号区間が現フレームの信号区間として構成されている場合であり、かつ、同一のフレームについては線形予測分析装置2よりも後に周期計算部940が動作される場合、の例である。周期計算部940は、現フレームの信号区間について、現フレームの入力信号XO(n) (n=0, 1, …, N-1)と1つ後のフレームの一部の入力信号XO(n) (n=N, N+1, …, N+Nn-1)のそれぞれの周期であるTnow, Tnextを求め、周期Tnextを周期計算部940に記憶する。周期計算部940は、また、1つ前のフレームの信号区間について求めて周期計算部940に記憶されていた周期Tnext、すなわち、1つ前のフレームの信号区間のうちの現フレームの一部の入力信号XO(n) (n=0, 1, …, Nn-1)について求めた周期、を特定可能な情報を周期についての情報として出力する。なお、具体例1と同様に、現フレームについては複数のサブフレームごとの周期を求めてもよい。
周期計算部940の具体例3は、現フレームの入力信号XO(n) (n=0, 1, …, N-1)そのものが現フレームの信号区間として構成されている場合であり、かつ、同一のフレームについては線形予測分析装置2よりも後に周期計算部940が動作される場合、の例である。周期計算部940は、現フレームの信号区間である現フレームの入力信号XO(n) (n=0, 1, …, N-1)の周期Tを求め、周期Tを周期計算部940に記憶する。周期計算部940は、また、1つ前のフレームの信号区間、すなわち、1つ前のフレームの入力信号XO(n) (n=-N, -N+1, …, -1)について求めて周期計算部940に記憶されていた周期Tを特定可能な情報を周期についての情報として出力する。
第一実施形態の変形例の線形予測分析装置2の係数決定部24は、入力された周期についての情報及び入力されたピッチゲインについての情報を用いて、係数wO(i) (i=0,1,…,Pmax)を決定する(ステップS4)。
ここで、ζ及びεは、重み係数であり、正の数とする。つまり、Tが大きいほどH´の値は小さく、F(G)が大きいほどH´の値は大きくなる。
第二実施形態は、現在又は過去のフレームにおける入力信号の基本周波数と正又は負の相関関係にある値と所定の閾値とを比較し、かつ、ピッチゲインと正の相関関係にある値と所定の閾値とを比較し、それらの比較結果に応じて係数wO(i)を決定するものである。第二実施形態は、係数決定部24における係数wO(i)の決定方法のみが第一実施形態と異なり、他の点については第一実施形態と同様である。以下、第一実施形態と異なる部分を中心に説明し、第一実施形態と同様の部分については重複説明を省略する。
第二実施形態の第一変形例は、基本周波数と正の相関関係にある値ではなく、基本周波数と負の相関関係にある値と所定の閾値とを比較し、かつ、ピッチゲインと正の相関関係にある値と所定の閾値とを比較し、それらの比較結果に応じて係数wO(i)を決定するものである。第二実施形態の第一変形例において基本周波数と負の相関関係にある値と比較される所定の閾値は、第二実施形態において基本周波数と正の相関関係にある値と比較される所定の閾値とは異なる。
上述の第二実施形態では、基本周波数と正の相関関係にある値を1個の閾値と比較し、また、ピッチゲインと正の相関関係にある値を1個の閾値と比較することにより係数wO(i)を決定したが、第二実施形態の第二変形例は、これらの値のそれぞれを2個以上の閾値と比較することにより係数wO(i)を決定するものである。以下、基本周波数と正の相関関係にある値を2個の閾値fth1',fth2'と比較し、ピッチゲインと正の相関関係にある値を2個の閾値gth1,gth2と比較することにより係数wO(i)を決定する方法を例に挙げて説明する。
上述の第二実施形態の第一変形例では、基本周波数と負の相関関係にある値を1個の閾値と比較し、また、ピッチゲインと正の相関関係にある値を1個の閾値と比較することにより係数wO(i)を決定したが、第二実施形態の第三変形例はこれらの値のそれぞれを2個以上の閾値を用いて係数wO(i)を決定するものである。以下、これらの値のそれぞれを2個の閾値fth1,fth2,gth1,gth2を用いて係数を決定する方法を例に挙げて説明する。
第三実施形態は、複数個の係数テーブルを用いて係数wO(i)を決定するものである。第三実施形態は、係数決定部24における係数wO(i)の決定方法のみが第一実施形態と異なり、他の点については第一実施形態と同様である。以下、第一実施形態と異なる部分を中心に説明し、第一実施形態と同様の部分については重複説明を省略する。
第三実施形態の第一変形例は、係数決定部24は、入力された基本周波数と負の相関関係にある値及びピッチゲインと正の相関関係にある値を用いて、係数テーブル記憶部25に記憶された2個以上の係数テーブルから、その入力された基本周波数と負の相関関係にある値及びピッチゲインと正の相関関係にある値に応じた1個の係数テーブルtを選択するものである。
第三実施形態では、基本周波数と正の相関関係にある値を1個の閾値と比較し、また、ピッチゲインと正の相関関係にある値を1個の閾値と比較することにより係数テーブルを決定したが、第三実施形態の第二変形例はこれらの値のそれぞれを2個以上の閾値と比較し、これらの比較結果に応じて係数wO(i)を決定するものである。
(1) 基本周波数と正の相関関係にある値が閾値fth2'より大きく、かつ、ピッチゲインと正の相関関係にある値が閾値gth2より大きい場合、すなわち、基本周波数が高くピッチゲインが大きいと判断された場合には、係数テーブルt0の各係数wt0(i)が係数wO(i)として選択され、
(2) 基本周波数と正の相関関係にある値が閾値fth2'より大きく、かつ、ピッチゲインと正の相関関係にある値が閾値gth1よりも大きく閾値gth2以下である場合、すなわち、基本周波数が高くピッチゲインが中程度と判断された場合には、係数テーブルt0,t1,t2の何れかの係数テーブルの各係数が係数wO(i)として選択され、
(3) 基本周波数と正の相関関係にある値が閾値fth2'より大きく、かつ、ピッチゲインと正の相関関係にある値が閾値gth1以下の場合、すなわち、基本周波数が高くピッチゲインが小さいと判断された場合には、係数テーブルt0,t1,t2の何れかの係数テーブルの各係数が係数wO(i)として選択され、
(4) 基本周波数と正の相関関係にある値が閾値fth1'よりも大きく閾値fth2'以下であり、かつ、ピッチゲインと正の相関関係にある値が閾値gth2より大きい場合、すなわち、基本周波数が中程度でありピッチゲインが大きいと判断された場合には、係数テーブルt0,t1,t2の何れかの係数テーブルの各係数が係数wO(i)として選択され、
(5) 基本周波数と正の相関関係にある値が閾値fth1'よりも大きく閾値fth2'以下であり、かつ、ピッチゲインと正の相関関係にある値が閾値gth1よりも大きく閾値gth2以下である場合、すなわち、基本周波数が中程度でありピッチゲインが中程度と判断された場合には、係数テーブルt0,t1,t2の何れかの係数テーブルの各係数が係数wO(i)として選択され、
(6) 基本周波数と正の相関関係にある値が閾値fth1'よりも大きく閾値fth2'以下であり、かつ、かつ、ピッチゲインと正の相関関係にある値が閾値gth1以下の場合、すなわち、基本周波数が中程度でありピッチゲインが小さいと判断された場合には、係数テーブルt0,t1,t2の何れかの係数テーブルの各係数が係数wO(i)として選択され、
(7) 基本周波数と正の相関関係にある値が閾値fth1'以下であり、かつ、ピッチゲインと正の相関関係にある値が閾値gth2より大きい場合、すなわち、基本周波数が低くピッチゲインが大きいと判断された場合には、係数テーブルt0,t1,t2の何れかの係数テーブルの各係数が係数wO(i)として選択され、
(8) 基本周波数と正の相関関係にある値が閾値fth1'以下であり、かつ、ピッチゲインと正の相関関係にある値が閾値gth1よりも大きく閾値gth2以下である場合、すなわち、基本周波数が低くピッチゲインが中程度と判断された場合には、係数テーブルt0,t1,t2の何れかの係数テーブルの各係数が係数wO(i)として選択され、
(9) 基本周波数と正の相関関係にある値が閾値fth1'以下であり、かつ、ピッチゲインと正の相関関係にある値が閾値gth1以下の場合、すなわち、基本周波数が低くピッチゲインが小さいと判断された場合には、係数テーブルt2の各係数wt2(i)が係数wO(i)として選択されるように、係数テーブル記憶部25に記憶された係数テーブルから係数wO(i)を選択する。
以下、第三実施形態の第二変形例の具体例について説明する。
係数テーブルt1には、式(13)の従来法のf0=40Hzのテーブルであり、各次数の係数wt1(i)が次のように定められている。
係数テーブルt2には、式(13)の従来法のf0=20Hzのテーブルであり、各次数の係数wt2(i)が次のように定められている。
ここで、上述のwtO(i), wt1(i), wt2(i)のリストは、Pmax=16として、i=0,1,2,…,16の順に左からiに対応する係数の大きさを並べたものである。すなわち上述の例では、例えばwt0(0)=1.001であり、wt0(3)=0.996104103である。
第三実施形態の第一変形例では、基本周波数と負の相関関係にある値を1個の閾値と比較し、また、ピッチゲインと正の相関関係にある値を1個の閾値と比較することにより係数テーブルを決定したが、第三実施形態の第三変形例はこれらの値のそれぞれを2個以上の閾値と比較し、これらの比較結果に応じて係数wO(i)を決定するものである。
(1) 基本周波数と負の相関関係にある値が閾値fth1より小さく、かつ、ピッチゲインと正の相関関係にある値が閾値gth2より大きい場合、すなわち、周期が短くピッチゲインが大きい場合には、係数テーブルt0の各係数wt0(i)が係数wO(i)として選択され、
(2) 基本周波数と負の相関関係にある値が閾値fth1より小さく、かつ、ピッチゲインと正の相関関係にある値が閾値gth1よりも大きく閾値gth2以下である場合、すなわち、周期が短くピッチゲインが中程度である場合には、係数テーブルt0,t1,t2の何れかの係数テーブルの各係数が係数wO(i)として選択され、
(3) 基本周波数と負の相関関係にある値が閾値fth1より小さく、かつ、ピッチゲインと正の相関関係にある値が閾値gth1以下の場合、すなわち、周期が短くピッチゲインが小さい場合には、係数テーブルt0,t1,t2の何れかの係数テーブルの各係数が係数wO(i)として選択され、
(4) 基本周波数と負の相関関係にある値が閾値fth1以上であり閾値fth2より小さく、かつ、ピッチゲインと正の相関関係にある値が閾値gth2より大きい場合、すなわち、周期が中程度でありピッチゲインが大きい場合には、係数テーブルt0,t1,t2の何れかの係数テーブルの各係数が係数wO(i)として選択され、
(5) 基本周波数と負の相関関係にある値が閾値fth1以上であり閾値fth2より小さく、かつ、ピッチゲインと正の相関関係にある値が閾値gth1よりも大きく閾値gth2以下である場合、すなわち、周期が中程度でありピッチゲインが中程度である場合には、係数テーブルt0,t1,t2の何れかの係数テーブルの各係数が係数wO(i)として選択され、
(6) 基本周波数と負の相関関係にある値が閾値fth1以上であり閾値fth2より小さく、かつ、ピッチゲインと正の相関関係にある値が閾値gth1以下の場合、すなわち、周期が中程度でありピッチゲインが小さい場合には、係数テーブルt0,t1,t2の何れかの係数テーブルの各係数が係数wO(i)として選択され、
(7) 基本周波数と負の相関関係にある値が閾値fth2以上であり、かつ、ピッチゲインと正の相関関係にある値が閾値gth2より大きい場合、すなわち、周期が長くピッチゲインが大きい場合には、係数テーブルt0,t1,t2の何れかの係数テーブルの各係数が係数wO(i)として選択され、
(8) 基本周波数と負の相関関係にある値が閾値fth2以上であり、かつ、ピッチゲインと正の相関関係にある値が閾値gth1よりも大きく閾値gth2以下である場合、すなわち、周期が長くピッチゲインが中程度である場合には、係数テーブルt0,t1,t2の何れかの係数テーブルの各係数が係数wO(i)として選択され、
(9) 基本周波数と負の相関関係にある値が閾値fth2以上であり、かつ、ピッチゲインと正の相関関係にある値が閾値gth1以下の場合、すなわち、周期が長くピッチゲインが小さい場合には、係数テーブルt2の各係数wt2(i)が係数wO(i)として選択されるように、係数テーブル記憶部25に記憶された係数テーブルから係数wO(i)を選択する。
以下、第三実施形態の第三変形例の具体例について説明する。ここでは、第三実施形
態の第二変形例の具体例と異なる部分を中心に説明する。
第三実施形態では複数個の係数テーブルのうち何れか1つのテーブルに記憶された係数を係数wO(i)として決定したが、第三実施形態の第四変形例はこれに加えて複数個の係数テーブルに記憶された係数に基づく演算処理により係数wO(i)を決定する場合を含む。
(1) 基本周波数と正の相関関係にある値が閾値fth2'より大きく、かつ、ピッチゲインと正の相関関係にある値が閾値gth2より大きい場合、すなわち、基本周波数が高くピッチゲインが大きいと判断された場合には、係数テーブルt0の各係数wt0(i)が係数wO(i)として選択され、
(2) 基本周波数と正の相関関係にある値が閾値fth2'より大きく、かつ、ピッチゲインと正の相関関係にある値が閾値gth1よりも大きく閾値gth2以下である場合、すなわち、基本周波数が高くピッチゲインが中程度と判断された場合には、係数テーブルt0,t2の何れかの係数テーブルの各係数が係数wO(i)として選択されるか、係数テーブルt0とt2の各係数から求まる係数が係数wO(i)とされ、
(3) 基本周波数と正の相関関係にある値が閾値fth2'より大きく、かつ、ピッチゲインと正の相関関係にある値が閾値gth1以下の場合、すなわち、基本周波数が高くピッチゲインが小さいと判断された場合には、係数テーブルt0,t2の何れかの係数テーブルの各係数が係数wO(i)として選択されるか、係数テーブルt0とt2の各係数から求まる係数が係数wO(i)とされ、
(4) 基本周波数と正の相関関係にある値が閾値fth1'よりも大きく閾値fth2'以下であり、かつ、ピッチゲインと正の相関関係にある値が閾値gth2より大きい場合、すなわち、基本周波数が中程度でありピッチゲインが大きいと判断された場合には、係数テーブルt0,t2の何れかの係数テーブルの各係数が係数wO(i)として選択されるか、係数テーブルt0とt2の各係数から求まる係数が係数wO(i)とされ、
(5) 基本周波数と正の相関関係にある値が閾値fth1'よりも大きく閾値fth2'以下であり、かつ、ピッチゲインと正の相関関係にある値が閾値gth1よりも大きく閾値gth2以下である場合、すなわち、基本周波数が中程度でありピッチゲインが中程度と判断された場合には、係数テーブルt0,t2の何れかの係数テーブルの各係数が係数wO(i)として選択されるか、係数テーブルt0とt2の各係数から求まる係数が係数wO(i)とされ、
(6) 基本周波数と正の相関関係にある値が閾値fth1'よりも大きく閾値fth2'以下であり、かつ、ピッチゲインと正の相関関係にある値が閾値gth1以下の場合、すなわち、基本周波数が中程度でありピッチゲインが小さいと判断された場合には、係数テーブルt0,t2の何れかの係数テーブルの各係数が係数wO(i)として選択されるか、係数テーブルt0とt2の各係数から求まる係数が係数wO(i)とされ、
(7) 基本周波数と正の相関関係にある値が閾値fth1'以下であり、かつ、ピッチゲインと正の相関関係にある値が閾値gth2より大きい場合、すなわち、基本周波数が低くピッチゲインが大きいと判断された場合には、係数テーブルt0,t2の何れかの係数テーブルの各係数が係数wO(i)として選択されるか、係数テーブルt0とt2の各係数から求まる係数が係数wO(i)とされ、
(8) 基本周波数と正の相関関係にある値が閾値fth1'以下であり、かつ、ピッチゲインと正の相関関係にある値が閾値gth1よりも大きく閾値gth2以下である場合、すなわち、基本周波数が低くピッチゲインが中程度と判断された場合には、係数テーブルt0,t2の何れかの係数テーブルの各係数が係数wO(i)として選択されるか、係数テーブルt0とt2の各係数から求まる係数が係数wO(i)とされ、
(9) 基本周波数と正の相関関係にある値が閾値fth1'以下であり、かつ、ピッチゲインと正の相関関係にある値が閾値gth1以下の場合、すなわち、基本周波数が低くピッチゲインが小さいと判断された場合には、係数テーブルt2の各係数wt2(i)が係数wO(i)として選択されるように、係数テーブル記憶部25に記憶された係数テーブルから係数wO(i)を選択し、または、求める。
第三実施形態では複数個の係数テーブルのうち何れか1つのテーブルに記憶された係数を係数wO(i)として決定したが、第三実施形態の第五変形例はこれに加えて複数個の係数テーブルに記憶された係数に基づく演算処理により係数wO(i)を決定する場合を含む。
(1) 基本周波数と負の相関関係にある値が閾値fth1より小さく、かつ、ピッチゲインと正の相関関係にある値が閾値gth2より大きい場合、すなわち、周期が短くピッチゲインが大きい場合には、係数テーブルt0の各係数wt0(i)が係数wO(i)として選択され、
(2) 基本周波数と負の相関関係にある値が閾値fth1より小さく、かつ、ピッチゲインと正の相関関係にある値が閾値gth1よりも大きく閾値gth2以下である場合、すなわち、周期が短くピッチゲインが中程度である場合には、係数テーブルt0, t2の何れかの係数テーブルの各係数が係数wO(i)として選択されるか、係数テーブルt0とt2の各係数から求まる係数が係数wO(i)とされ、
(3) 基本周波数と負の相関関係にある値が閾値fth1より小さく、かつ、ピッチゲインと正の相関関係にある値が閾値gth1以下の場合、すなわち、周期が短くピッチゲインが小さい場合には、係数テーブルt0, t2の何れかの係数テーブルの各係数が係数wO(i)として選択されるか、係数テーブルt0とt2の各係数から求まる係数が係数wO(i)とされ、
(4) 基本周波数と負の相関関係にある値が閾値fth1以上であり閾値fth2より小さく、かつ、ピッチゲインと正の相関関係にある値が閾値gth2より大きい場合、すなわち、周期が中程度でありピッチゲインが大きい場合には、係数テーブルt0, t2の何れかの係数テーブルの各係数が係数wO(i)として選択されるか、係数テーブルt0とt2の各係数から求まる係数が係数wO(i)とされ、
(5) 基本周波数と負の相関関係にある値が閾値fth1以上であり閾値fth2より小さく、かつ、ピッチゲインと正の相関関係にある値が閾値gth1よりも大きく閾値gth2以下である場合、すなわち、周期が中程度でありピッチゲインが中程度である場合には、係数テーブルt0, t2の何れかの係数テーブルの各係数が係数wO(i)として選択されるか、係数テーブルt0とt2の各係数から求まる係数が係数wO(i)とされ、
(6) 基本周波数と負の相関関係にある値が閾値fth1以上であり閾値fth2より小さく、かつ、ピッチゲインと正の相関関係にある値が閾値gth1以下の場合、すなわち、周期が中程度でありピッチゲインが小さい場合には、係数テーブルt0, t2の何れかの係数テーブルの各係数が係数wO(i)として選択されるか、係数テーブルt0とt2の各係数から求まる係数が係数wO(i)とされ、
(7) 基本周波数と負の相関関係にある値が閾値fth2以上であり、かつ、ピッチゲインと正の相関関係にある値が閾値gth2より大きい場合、すなわち、周期が長くピッチゲインが大きい場合には、係数テーブルt0, t2の何れかの係数テーブルの各係数が係数wO(i)として選択されるか、係数テーブルt0とt2の各係数から求まる係数が係数wO(i)とされ、
(8) 基本周波数と負の相関関係にある値が閾値fth2以上であり、かつ、ピッチゲインと正の相関関係にある値が閾値gth1よりも大きく閾値gth2以下である場合、すなわち、周期が長くピッチゲインが中程度である場合には、係数テーブルt0, t2の何れかの係数テーブルの各係数が係数wO(i)として選択されるか、係数テーブルt0とt2の各係数から求まる係数が係数wO(i)とされ、
(9) 基本周波数と負の相関関係にある値が閾値fth2以上であり、かつ、ピッチゲインと正の相関関係にある値が閾値gth1以下の場合、すなわち、周期が長くピッチゲインが小さい場合には、係数テーブルt2の各係数wt2(i)が係数wO(i)として選択されるように、係数テーブル記憶部25に記憶された係数テーブルから係数wO(i)を選択し、または、求める。
また、(2),(3),(4),(5),(6),(7),(8)の少なくとも1つの場合には係数決定部24により係数テーブルt0とt2から取得した各係数から係数が求められる。
図11及び図12に示すように、上述の全ての実施形態及び変形例において、係数乗算部22を含まず、予測係数計算部23において係数wO(i)と自己相関RO(i)とを用いて線形予測分析を行ってもよい。図11と図12は、それぞれ図1と図7に対応する線形予測分析装置2の構成例である。この場合は、予測係数計算部23は、図13に示すように、係数wO(i)と自己相関RO(i)とが乗算されたものである変形自己相関R'O(i)ではなく、係数wO(i)と自己相関RO(i)とを直接用いて線形予測分析を行う(ステップS5)。
第四実施形態は、入力信号XO(n)に対して従来の線形予測分析装置を用いて線形予測分析を行い、その線形予測分析の結果を用いて基本周波数計算部及びピッチゲイン計算部でそれぞれ基本周波数及びピッチゲインを得て、得られた基本周波数及びピッチゲインに基づく係数wO(i)を用いて本発明の線形予測分析装置により線形予測係数に変換可能な係数を求めるものである。
第一線形予測分析部31は、従来の線形予測分析装置1と同じ動作をする。すなわち、第一線形予測分析部31は、入力信号XO(n)から自己相関RO(i) (i=0,1,…,Pmax)を求め、自己相関RO(i) (i=0,1,…,Pmax)と予め定めた係数wO(i) (i=0,1,…,Pmax)とを同じiごとに乗じることにより変形自己相関R' O(i) (i=0,1,…,Pmax)を求め、変形自己相関R' O(i) (i=0,1,…,Pmax)から1次から予め定めた最大次数であるPmax次までの線形予測係数に変換可能な係数を求める。
線形予測残差計算部32は、入力信号XO(n)に対して、1次からPmax次までの線形予測係数に変換可能な係数に基づく線形予測や線形予測と等価なまたは類似したフィルタリング処理を行って線形予測残差信号XR(n)を求める。フィルタリング処理は重み付け処理とも言えるので、線形予測残差信号XR(n)は重み付け入力信号であるともいえる。
基本周波数計算部33は、線形予測残差信号XR(n)の基本周波数Pを求め、基本周波数についての情報を出力する。基本周波数を求める方法としては、様々な公知の方法が存在するので、公知の何れの方法を用いてもよい。基本周波数計算部33は、例えば、現フレームの線形予測残差信号XR (n) (n=0, 1, …, N-1)を構成する複数個のサブフレームのそれぞれについて基本周波数を求める。すなわち、2以上の整数であるM個のサブフレームであるXRs1(n) (n=0, 1, …, N/M-1), …, XRsM(n) (n= (M-1)N/M, (M-1)N/M+1, …, N-1)のそれぞれの基本周波数であるPs1, …, PsMを求める。NはMで割り切れるとする。基本周波数計算部33は、次に、現フレームを構成するM個のサブフレームの基本周波数であるPs1, …, PsMのうちの最大値max(Ps1, …, PsM)を特定可能な情報を基本周波数についての情報として出力する。
ピッチゲイン計算部36は、線形予測残差信号XR(n)のピッチゲインGを求め、ピッチゲインについての情報を出力する。ピッチゲインを求める方法としては、様々な公知の方法が存在するので、公知の何れの方法を用いてもよい。ピッチゲイン計算部36は、例えば、現フレームの線形予測残差信号XR (n) (n=0, 1, …, N-1)を構成する複数個のサブフレームのそれぞれについてピッチゲインを求める。すなわち、2以上の整数であるM個のサブフレームであるXRs1(n) (n=0, 1, …, N/M-1), …, XRsM(n) (n= (M-1)N/M, (M-1)N/M+1, …, N-1)のそれぞれのピッチゲインであるGs1, …, GsMを求める。NはMで割り切れるとする。ピッチゲイン計算部36は、次に、現フレームを構成するM個のサブフレームのピッチゲインであるGs1, …, GsMのうちの最大値max(Gs1, …, GsM)を特定可能な情報をピッチゲインについての情報として出力する。
第二線形予測分析部34は、本発明の第一実施形態の線形予測分析装置2、第二実施形態の線形予測分析装置2、第二実施形態の第二変形例の線形予測分析装置2、第三実施形態の線形予測分析装置2、第三実施形態の第二変形例の線形予測分析装置2、第三実施形態の第四変形例の線形予測分析装置2、第一実施形態から第三実施形態に共通の変形例の線形予測分析装置2、の何れかと同じ動作をする。すなわち、第二線形予測分析部34は、入力信号XO(n)から自己相関RO(i) (i=0,1,…,Pmax)を求め、基本周波数計算部33が出力した基本周波数についての情報及びピッチゲイン計算部36が出力したピッチゲインについての情報に基づいて係数wO(i) (i=0,1,…,Pmax)を決定し、自己相関RO(i) (i=0,1,…,Pmax)と決定した係数wO(i) (i=0,1,…,Pmax)とを用いて1次から予め定めた最大次数であるPmax次までの線形予測係数に変換可能な係数を求める。
第四実施形態の変形例は、入力信号XO(n)に対して従来の線形予測分析装置を用いて線形予測分析を行い、その線形予測分析の結果を用いて周期計算部及びピッチゲイン計算部でそれぞれ周期及びピッチゲインを得て、得られた周期及びピッチゲインに基づく係数wO(i)を用いて本発明の線形予測分析装置により線形予測係数に変換可能な係数を求めるものである。
周期計算部35は、線形予測残差信号XR(n)の周期Tを求め、周期についての情報を出力する。周期を求める方法としては、様々な公知の方法が存在するので、公知の何れの方法を用いてもよい。周期計算部35は、例えば、現フレームの線形予測残差信号XR (n) (n=0, 1, …, N-1)を構成する複数個のサブフレームのそれぞれについて周期を求める。すなわち、2以上の整数であるM個のサブフレームであるXRs1(n) (n=0, 1, …, N/M-1), …, XRsM(n)(n= (M-1)N/M, (M-1)N/M+1, …, N-1)のそれぞれの周期であるTs1, …, TsMを求める。NはMで割り切れるとする。周期計算部35は、次に、現フレームを構成するM個のサブフレームの周期であるTs1, …, TsMのうちの最小値min(Ts1 …, TsM)を特定可能な情報を周期についての情報として出力する。
第四実施形態の変形例の第二線形予測分析部34は、本発明の第一実施形態の変形例の線形予測分析装置2、第二実施形態の第一変形例の線形予測分析装置2、第二実施形態の第三変形例の線形予測分析装置2、第三実施形態の第一変形例の線形予測分析装置2、第三実施形態の第三変形例の線形予測分析装置2、第三実施形態の第五変形例の線形予測分析装置2、第一実施形態から第三実施形態に共通の変形例の線形予測分析装置2、の何れかと同じ動作をする。すなわち、第二線形予測分析部34は、入力信号XO(n)から自己相関RO(i) (i=0,1,…,Pmax)を求め、周期計算部35が出力した周期についての情報及びピッチゲイン計算部36が出力したピッチゲインについての情報に基づいて係数wO(i) (i=0,1,…,Pmax)を決定し、自己相関RO(i) (i=0,1,…,Pmax)と決定した係数wO(i) (i=0,1,…,Pmax)とを用いて1次から予め定めた最大次数であるPmax次までの線形予測係数に変換可能な係数を求める。
第一実施形態において基本周波数計算部930の具体例2として説明した通り、基本周波数と正の相関関係にある値として、前のフレームの信号処理においてLook-aheadとも呼ばれる先読みして利用するサンプル部分のうち現フレームのサンプルに対応する部分の基本周波数を用いてもよい。
第一実施形態において周期計算部940の具体例2として説明した通り、基本周波数と負の相関関係にある値として、前のフレームの信号処理においてLook-aheadとも呼ばれる先読みして利用するサンプル部分のうち現フレームのサンプルに対応する部分の周期Tを用いてもよい。
第一実施形態においてピッチゲイン計算部950の具体例2として説明した通り、ピッチゲインと正の相関関係にある値として、前のフレームの信号処理においてLook-aheadとも呼ばれる先読みして利用するサンプル部分のうち現フレームのサンプルに対応する部分のピッチゲインを用いてもよい。
Claims (6)
- 入力時系列信号に対応する線形予測係数に変換可能な係数を、所定時間区間であるフレームごとに求める、線形予測分析方法であって、
少なくともi=0,1,…,Pmaxのそれぞれについて、現在のフレームの入力時系列信号XO(n)とiサンプルだけ過去の入力時系列信号XO(n-i)またはiサンプルだけ未来の入力時系列信号XO(n+i)との自己相関RO(i)を計算する自己相関計算ステップと、
係数と前記自己相関RO(i)とが対応するiごとに乗算されたものである変形自己相関R'O(i)を用いて、1次からPmax次までの線形予測係数に変換可能な係数を求める予測係数計算ステップと、を含み、
第一係数テーブルには係数w h (i)が記憶されており、第二係数テーブルには係数w l (i)が記憶されているとして、現在又は過去のフレームにおける入力時系列信号に基づく周期、または、周期の推定値、または、周期の量子化値、または、基本周波数と負の相関関係にある値、と、現在又は過去のフレームにおける入力時系列信号の周期性の強さ又はピッチゲインと正の相関関係にある値とを用いて前記第一係数テーブルと前記第二係数テーブルの中の1個の係数テーブルから係数を取得する係数決定ステップを更に含み、
前記周期、または、周期の推定値、または、周期の量子化値、または、基本周波数と負の相関関係にある値、が第一値であり、かつ、前記周期性の強さ又はピッチゲインと正の相関関係にある値が第三値である場合に前記係数決定ステップで係数が取得される係数テーブルを前記第一係数テーブルとし、
前記周期、または、周期の推定値、または、周期の量子化値、または、基本周波数と負の相関関係にある値、が前記第一値よりも大きい第二値であり、かつ、前記周期性の強さ又はピッチゲインと正の相関関係にある値が前記第三値よりも小さい第四値である場合に前記係数決定ステップで係数が取得される係数テーブルを前記第二係数テーブルとして、
i=0以外の次数のうちの少なくとも一部の各次数iに対しては、前記第二係数テーブルにおける該次数iに対応する係数w l (i)は、前記第一係数テーブルにおける該次数iに対応する係数w h (i)よりも大きく、i=0以外の次数のうちの前記以外の各次数iに対しては、前記第二係数テーブルにおける該次数iに対応する係数w l (i)は、前記第一係数テーブルにおける該次数iに対応する係数w h (i)以上である、
線形予測分析方法。 - 入力時系列信号に対応する線形予測係数に変換可能な係数を、所定時間区間であるフレームごとに求める、線形予測分析方法であって、
少なくともi=0,1,…,Pmaxのそれぞれについて、現在のフレームの入力時系列信号XO(n)とiサンプルだけ過去の入力時系列信号XO(n-i)またはiサンプルだけ未来の入力時系列信号XO(n+i)との自己相関RO(i)を計算する自己相関計算ステップと、
係数と前記自己相関RO(i)とが対応するiごとに乗算されたものである変形自己相関R'O(i)を用いて、1次からPmax次までの線形予測係数に変換可能な係数を求める予測係数計算ステップと、を含み、
第一係数テーブルには係数w h (i)が記憶されており、第二係数テーブルには係数w l (i)が記憶されているとして、現在又は過去のフレームにおける入力時系列信号に基づく基本周波数と正の相関関係にある値と、現在又は過去のフレームにおける入力信号のピッチゲインと正の相関関係にある値とを用いて前記第一係数テーブルと前記第二係数テーブルの中の1個の係数テーブルから係数を取得する係数決定ステップを更に含み、
前記基本周波数と正の相関関係にある値が第一値であり、かつ、前記ピッチゲインと正の相関関係にある値が第三値である場合に前記係数決定ステップで係数が取得される係数テーブルを前記第一係数テーブルとし、
前記基本周波数と正の相関関係にある値が前記第一値よりも小さい第二値であり、かつ、前記ピッチゲインと正の相関関係にある値が前記第三値よりも小さい第四値である場合に前記係数決定ステップで係数が取得される係数テーブルを前記第二係数テーブルとして、
i=0以外の次数のうちの少なくとも一部の各次数iに対しては、前記第二係数テーブルにおける該次数iに対応する係数w l (i)は、前記第一係数テーブルにおける該次数iに対応する係数w h (i)よりも大きく、i=0以外の次数のうちの前記以外の各次数iに対しては、前記第二係数テーブルにおける該次数iに対応する係数w l (i)は、前記第一係数テーブルにおける該次数iに対応する係数w h (i)以上である、
線形予測分析方法。 - 入力時系列信号に対応する線形予測係数に変換可能な係数を、所定時間区間であるフレームごとに求める、線形予測分析装置であって、
少なくともi=0,1,…,Pmaxのそれぞれについて、現在のフレームの入力時系列信号XO(n)とiサンプルだけ過去の入力時系列信号XO(n-i)またはiサンプルだけ未来の入力時系列信号XO(n+i)との自己相関RO(i)を計算する自己相関計算部と、
係数と前記自己相関RO(i)とが対応するiごとに乗算されたものである変形自己相関R'O(i)を用いて、1次からPmax次までの線形予測係数に変換可能な係数を求める予測係数計算部と、を含み、
第一係数テーブルには係数w h (i)が記憶されており、第二係数テーブルには係数w l (i)が記憶されているとして、現在又は過去のフレームにおける入力時系列信号に基づく周期、または、周期の推定値、または、周期の量子化値、または、基本周波数と負の相関関係にある値、と、現在又は過去のフレームにおける入力時系列信号の周期性の強さ又はピッチゲインと正の相関関係にある値とを用いて前記第一係数テーブルと前記第二係数テーブルの中の1個の係数テーブルから係数を取得する係数決定部を更に含み、
前記周期、または、周期の推定値、または、周期の量子化値、または、基本周波数と負の相関関係にある値が、第一値であり、かつ、前記周期性の強さ又はピッチゲインと正の相関関係にある値が第三値である場合に前記係数決定部で係数が取得される係数テーブルを前記第一係数テーブルとし、
前記周期、または、周期の推定値、または、周期の量子化値、または、基本周波数と負の相関関係にある値、が前記第一値よりも大きい第二値であり、かつ、前記周期性の強さ又はピッチゲインと正の相関関係にある値が前記第三値よりも小さい第四値である場合に前記係数決定部で係数が取得される係数テーブルを前記第二係数テーブルとして、
i=0以外の次数のうちの少なくとも一部の各次数iに対しては、前記第二係数テーブルにおける該次数iに対応する係数w l (i)は、前記第一係数テーブルにおける該次数iに対応する係数w h (i)よりも大きく、i=0以外の次数のうちの前記以外の各次数iに対しては、前記第二係数テーブルにおける該次数iに対応する係数w l (i)は、前記第一係数テーブルにおける該次数iに対応する係数w h (i)以上である、
線形予測分析装置。 - 入力時系列信号に対応する線形予測係数に変換可能な係数を、所定時間区間であるフレームごとに求める、線形予測分析装置であって、
少なくともi=0,1,…,Pmaxのそれぞれについて、現在のフレームの入力時系列信号XO(n)とiサンプルだけ過去の入力時系列信号XO(n-i)またはiサンプルだけ未来の入力時系列信号XO(n+i)との自己相関RO(i)を計算する自己相関計算部と、
係数と前記自己相関RO(i)とが対応するiごとに乗算されたものである変形自己相関R'O(i)を用いて、1次からPmax次までの線形予測係数に変換可能な係数を求める予測係数計算部と、を含み、
第一係数テーブルには係数w h (i)が記憶されており、第二係数テーブルには係数w l (i)が記憶されているとして、現在又は過去のフレームにおける入力時系列信号に基づく基本周波数と正の相関関係にある値と、現在又は過去のフレームにおける入力信号のピッチゲインと正の相関関係にある値とを用いて前記第一係数テーブルと前記第二係数テーブルの中の1個の係数テーブルから係数を取得する係数決定部を更に含み、
前記基本周波数と正の相関関係にある値が第一値であり、かつ、前記ピッチゲインと正の相関関係にある値が第三値である場合に前記係数決定部で係数が取得される係数テーブルを前記第一係数テーブルとし、
前記基本周波数と正の相関関係にある値が前記第一値よりも小さい第二値であり、かつ、前記ピッチゲインと正の相関関係にある値が前記第三値よりも小さい第四値である場合に前記係数決定部で係数が取得される係数テーブルを前記第二係数テーブルとして、
i=0以外の次数のうちの少なくとも一部の各次数iに対しては、前記第二係数テーブルにおける該次数iに対応する係数w l (i)は、前記第一係数テーブルにおける該次数iに対応する係数w h (i)よりも大きく、i=0以外の次数のうちの前記以外の各次数iに対しては、前記第二係数テーブルにおける該次数iに対応する係数w l (i)は、前記第一係数テーブルにおける該次数iに対応する係数w h (i)以上である、
線形予測分析装置。 - 請求項1又は2の線形予測分析方法の各ステップをコンピュータに実行させるためのプログラム。
- 請求項1又は2の線形予測分析方法の各ステップをコンピュータに実行させるためのプログラムが記録されたコンピュータ読み取り可能な記録媒体。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014011318 | 2014-01-24 | ||
JP2014011318 | 2014-01-24 | ||
JP2014152525 | 2014-07-28 | ||
JP2014152525 | 2014-07-28 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015558850A Division JP6250073B2 (ja) | 2014-01-24 | 2015-01-20 | 線形予測分析装置、方法、プログラム及び記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018049288A JP2018049288A (ja) | 2018-03-29 |
JP6449969B2 true JP6449969B2 (ja) | 2019-01-09 |
Family
ID=53681372
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015558850A Active JP6250073B2 (ja) | 2014-01-24 | 2015-01-20 | 線形予測分析装置、方法、プログラム及び記録媒体 |
JP2017223810A Active JP6423065B2 (ja) | 2014-01-24 | 2017-11-21 | 線形予測分析装置、方法、プログラム及び記録媒体 |
JP2017223809A Active JP6449969B2 (ja) | 2014-01-24 | 2017-11-21 | 線形予測分析装置、方法、プログラム及び記録媒体 |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015558850A Active JP6250073B2 (ja) | 2014-01-24 | 2015-01-20 | 線形予測分析装置、方法、プログラム及び記録媒体 |
JP2017223810A Active JP6423065B2 (ja) | 2014-01-24 | 2017-11-21 | 線形予測分析装置、方法、プログラム及び記録媒体 |
Country Status (8)
Country | Link |
---|---|
US (4) | US9928850B2 (ja) |
EP (3) | EP3462449B1 (ja) |
JP (3) | JP6250073B2 (ja) |
KR (3) | KR101850529B1 (ja) |
CN (3) | CN110349590B (ja) |
ES (3) | ES2713027T3 (ja) |
PL (3) | PL3462448T3 (ja) |
WO (1) | WO2015111569A1 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ES2749904T3 (es) * | 2013-07-18 | 2020-03-24 | Nippon Telegraph & Telephone | Dispositivo, método, programa y medio de almacenamiento de análisis de predicción lineal |
ES2713027T3 (es) * | 2014-01-24 | 2019-05-17 | Nippon Telegraph & Telephone | Aparato, método, programa y soporte de registro de análisis predictivo lineal |
EP3098812B1 (en) * | 2014-01-24 | 2018-10-10 | Nippon Telegraph and Telephone Corporation | Linear predictive analysis apparatus, method, program and recording medium |
CN107980151B (zh) * | 2017-02-22 | 2020-03-17 | 清华大学深圳研究生院 | 一种基于心电认证的门禁系统及其认证方法 |
JP6904198B2 (ja) * | 2017-09-25 | 2021-07-14 | 富士通株式会社 | 音声処理プログラム、音声処理方法および音声処理装置 |
Family Cites Families (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2654542B1 (fr) * | 1989-11-14 | 1992-01-17 | Thomson Csf | Procede et dispositif de codage de filtres predicteurs de vocodeurs tres bas debit. |
JP3237089B2 (ja) * | 1994-07-28 | 2001-12-10 | 株式会社日立製作所 | 音響信号符号化復号方法 |
US5781880A (en) * | 1994-11-21 | 1998-07-14 | Rockwell International Corporation | Pitch lag estimation using frequency-domain lowpass filtering of the linear predictive coding (LPC) residual |
FR2742568B1 (fr) * | 1995-12-15 | 1998-02-13 | Catherine Quinquis | Procede d'analyse par prediction lineaire d'un signal audiofrequence, et procedes de codage et de decodage d'un signal audiofrequence en comportant application |
KR100537123B1 (ko) * | 1996-12-26 | 2006-02-28 | 소니 가부시끼 가이샤 | 화상 신호 부호화 장치, 화상 신호 부호화 방법, 화상 신호 복호 장치, 화상 신호 복호 방법 및 기록매체 |
US7529661B2 (en) * | 2002-02-06 | 2009-05-05 | Broadcom Corporation | Pitch extraction methods and systems for speech coding using quadratically-interpolated and filtered peaks for multiple time lag extraction |
US20040002856A1 (en) * | 2002-03-08 | 2004-01-01 | Udaya Bhaskar | Multi-rate frequency domain interpolative speech CODEC system |
US20050228656A1 (en) * | 2002-05-30 | 2005-10-13 | Den Brinker Albertus C | Audio coding |
EP1604354A4 (en) * | 2003-03-15 | 2008-04-02 | Mindspeed Tech Inc | VOICE INDEX CONTROLS FOR CELP LANGUAGE CODING |
US8180631B2 (en) * | 2005-07-11 | 2012-05-15 | Lg Electronics Inc. | Apparatus and method of processing an audio signal, utilizing a unique offset associated with each coded-coefficient |
JP4733552B2 (ja) * | 2006-04-06 | 2011-07-27 | 日本電信電話株式会社 | Parcor係数算出装置、parcor係数算出方法、そのプログラムおよびその記録媒体 |
JP4658853B2 (ja) * | 2006-04-13 | 2011-03-23 | 日本電信電話株式会社 | 適応ブロック長符号化装置、その方法、プログラム及び記録媒体 |
WO2007138511A1 (en) * | 2006-05-30 | 2007-12-06 | Koninklijke Philips Electronics N.V. | Linear predictive coding of an audio signal |
JP4691050B2 (ja) * | 2007-01-29 | 2011-06-01 | 日本電信電話株式会社 | Parcor係数算出方法、及びその装置とそのプログラムと、その記憶媒体 |
JP2009185701A (ja) * | 2008-02-06 | 2009-08-20 | Aisan Ind Co Ltd | 燃料ポンプ |
WO2010073977A1 (ja) * | 2008-12-22 | 2010-07-01 | 日本電信電話株式会社 | 符号化方法、復号方法、それらの装置、プログラム及び記録媒体 |
CN101599272B (zh) * | 2008-12-30 | 2011-06-08 | 华为技术有限公司 | 基音搜索方法及装置 |
CN101609678B (zh) * | 2008-12-30 | 2011-07-27 | 华为技术有限公司 | 信号压缩方法及其压缩装置 |
CN102282770B (zh) * | 2009-01-23 | 2014-04-16 | 日本电信电话株式会社 | 一种参数选择方法、参数选择装置 |
CN102067211B (zh) * | 2009-03-11 | 2013-04-17 | 华为技术有限公司 | 一种线性预测分析方法、装置及系统 |
CN102930871B (zh) * | 2009-03-11 | 2014-07-16 | 华为技术有限公司 | 一种线性预测分析方法、装置及系统 |
JP5814340B2 (ja) * | 2010-04-09 | 2015-11-17 | ドルビー・インターナショナル・アーベー | Mdctベース複素予測ステレオ符号化 |
EP2650878B1 (en) * | 2011-01-25 | 2015-11-18 | Nippon Telegraph and Telephone Corporation | Encoding method, encoder, periodic feature amount determination method, periodic feature amount determination apparatus, program and recording medium |
CN102783034B (zh) * | 2011-02-01 | 2014-12-17 | 华为技术有限公司 | 用于提供信号处理系数的方法和设备 |
EP3098812B1 (en) * | 2014-01-24 | 2018-10-10 | Nippon Telegraph and Telephone Corporation | Linear predictive analysis apparatus, method, program and recording medium |
ES2713027T3 (es) * | 2014-01-24 | 2019-05-17 | Nippon Telegraph & Telephone | Aparato, método, programa y soporte de registro de análisis predictivo lineal |
-
2015
- 2015-01-20 ES ES15740985T patent/ES2713027T3/es active Active
- 2015-01-20 PL PL18200698T patent/PL3462448T3/pl unknown
- 2015-01-20 CN CN201910603209.XA patent/CN110349590B/zh active Active
- 2015-01-20 EP EP18200716.1A patent/EP3462449B1/en active Active
- 2015-01-20 CN CN201910603208.5A patent/CN110299146B/zh active Active
- 2015-01-20 EP EP15740985.5A patent/EP3098813B1/en active Active
- 2015-01-20 KR KR1020187004953A patent/KR101850529B1/ko active IP Right Grant
- 2015-01-20 CN CN201580005184.3A patent/CN105960676B/zh active Active
- 2015-01-20 KR KR1020187004957A patent/KR101883800B1/ko active IP Right Grant
- 2015-01-20 ES ES18200698T patent/ES2798139T3/es active Active
- 2015-01-20 ES ES18200716T patent/ES2863554T3/es active Active
- 2015-01-20 PL PL15740985T patent/PL3098813T3/pl unknown
- 2015-01-20 WO PCT/JP2015/051352 patent/WO2015111569A1/ja active Application Filing
- 2015-01-20 US US15/112,318 patent/US9928850B2/en active Active
- 2015-01-20 EP EP18200698.1A patent/EP3462448B1/en active Active
- 2015-01-20 JP JP2015558850A patent/JP6250073B2/ja active Active
- 2015-01-20 PL PL18200716T patent/PL3462449T3/pl unknown
- 2015-01-20 KR KR1020167019614A patent/KR101832368B1/ko active IP Right Grant
-
2017
- 2017-11-21 JP JP2017223810A patent/JP6423065B2/ja active Active
- 2017-11-21 JP JP2017223809A patent/JP6449969B2/ja active Active
-
2018
- 2018-02-06 US US15/889,748 patent/US10115413B2/en active Active
- 2018-02-06 US US15/889,775 patent/US10134420B2/en active Active
- 2018-02-06 US US15/889,684 patent/US10134419B2/en active Active
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6449969B2 (ja) | 線形予測分析装置、方法、プログラム及び記録媒体 | |
JP6117359B2 (ja) | 線形予測分析装置、方法、プログラム及び記録媒体 | |
JP6449968B2 (ja) | 線形予測分析装置、方法、プログラム及び記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181009 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181113 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20181127 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20181206 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6449969 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |