JP6250072B2 - 線形予測分析装置、方法、プログラム及び記録媒体 - Google Patents
線形予測分析装置、方法、プログラム及び記録媒体 Download PDFInfo
- Publication number
- JP6250072B2 JP6250072B2 JP2015558849A JP2015558849A JP6250072B2 JP 6250072 B2 JP6250072 B2 JP 6250072B2 JP 2015558849 A JP2015558849 A JP 2015558849A JP 2015558849 A JP2015558849 A JP 2015558849A JP 6250072 B2 JP6250072 B2 JP 6250072B2
- Authority
- JP
- Japan
- Prior art keywords
- coefficient
- pitch gain
- value
- periodicity
- autocorrelation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004458 analytical method Methods 0.000 title claims description 73
- 238000000034 method Methods 0.000 title description 22
- 238000004364 calculation method Methods 0.000 claims description 64
- 230000000875 corresponding effect Effects 0.000 claims description 50
- 230000002596 correlated effect Effects 0.000 claims description 37
- 230000007423 decrease Effects 0.000 claims description 13
- 230000003247 decreasing effect Effects 0.000 claims description 7
- 238000012986 modification Methods 0.000 description 13
- 230000004048 modification Effects 0.000 description 13
- 230000005236 sound signal Effects 0.000 description 8
- 230000014509 gene expression Effects 0.000 description 7
- 230000003595 spectral effect Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000001228 spectrum Methods 0.000 description 6
- 230000000737 periodic effect Effects 0.000 description 4
- 238000013139 quantization Methods 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 238000007796 conventional method Methods 0.000 description 3
- 102220475340 DNA replication licensing factor MCM2_S41A_mutation Human genes 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000005311 autocorrelation function Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/06—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/12—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/21—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Complex Calculations (AREA)
Description
線形予測分析装置1の自己相関計算部11は、入力信号XO(n)から自己相関RO(i) (i=0,1,…,Pmax,Pmaxは予測次数)を式(11)により求めて出力する。Pmaxは、N未満の所定の正の整数である。
次に、係数乗算部12が、自己相関計算部11から出力された自己相関RO(i)に予め定めた係数wO(i) (i=0,1,…,Pmax)を同じiごとに乗じることにより、変形自己相関R'O(i) (i=0,1,…,Pmax)を求める。すなわち、変形自己相関関数R' O(i)を式(12)により求める。
そして、予測係数計算部13が、係数乗算部12から出力された変形自己相関R'O(i)を用いて例えばLevinson-Durbin法などにより、1次から予め定めた予測次数であるPmax次までの線形予測係数に変換可能な係数を求める。線形予測係数に変換可能な係数とは、PARCOR係数KO(1),KO(2),…,KO(Pmax)や線形予測係数aO(1),aO(2),…,aO(Pmax)等である。
第一実施形態の線形予測分析装置2は、図1に示すように、自己相関計算部21、係数決定部24、係数乗算部22及び予測係数計算部23を例えば備えている。自己相関計算部21、係数乗算部22及び予測係数計算部23の動作は、従来の線形予測分析装置1の自己相関計算部11、係数乗算部12及び予測係数計算部13における動作とそれぞれ同じである。
ピッチゲイン計算部950は、現フレームの入力信号XO(n) (n=0, 1, …, N-1)および/または現フレームの近傍のフレームの入力信号の全部または一部からピッチゲインGを求める。ピッチゲイン計算部950は、例えば、現フレームの入力信号XO(n) (n=0, 1, …, N-1)の全部または一部を含む信号区間のディジタル音声信号やディジタル音響信号のピッチゲインGを求め、ピッチゲインGを特定可能な情報をピッチゲインについての情報として出力する。ピッチゲインを求める方法としては、様々な公知の方法が存在するので、公知の何れの方法を用いてもよい。また、求めたピッチゲインGを符号化してピッチゲイン符号を得る構成とし、ピッチゲイン符号をピッチゲインについての情報として出力してもよい。さらにピッチゲイン符号に対応するピッチゲインの量子化値^Gを得る構成とし、ピッチゲインの量子化値^Gをピッチゲインについての情報として出力してもよい。以下、ピッチゲイン計算部950の具体例について説明する。
ピッチゲイン計算部950の具体例1は、現フレームの入力信号XO(n) (n=0, 1, …, N-1)が複数個のサブフレームで構成されている場合、かつ、同一のフレームについては線形予測分析装置2よりも先にピッチゲイン計算部950が動作される場合、の例である。ピッチゲイン計算部950は、まず、2以上の整数であるM個のサブフレームであるXOs1(n) (n=0, 1, …, N/M-1), …, XOsM(n)(n= (M-1)N/M, (M-1)N/M+1, …, N-1)のそれぞれのピッチゲインであるGs1,…, GsMを求める。NはMで割り切れるとする。ピッチゲイン計算部950は、現フレームを構成するM個のサブフレームのピッチゲインであるGs1,…, GsMのうちの最大値max(Gs1,…,GsM)を特定可能な情報をピッチゲインについての情報として出力する。
ピッチゲイン計算部950の具体例2は、現フレームの入力信号XO(n) (n=0, 1, …, N-1)と1つ後のフレームの一部の入力信号XO(n) (n=N, N+1, …, N+Nn-1)(ただし、Nnは、Nn<Nという関係を満たす所定の正の整数。)とで、先読み部分を含む信号区間が現フレームの信号区間として構成されている場合であり、かつ、同一のフレームについては線形予測分析装置2よりも後にピッチゲイン計算部950が動作される場合、の例である。ピッチゲイン計算部950は、現フレームの信号区間について、現フレームの入力信号XO(n) (n=0, 1, …, N-1)と1つ後のフレームの一部の入力信号XO(n) (n=N, N+1, …, N+Nn-1)のそれぞれのピッチゲインであるGnow, Gnextを求め、ピッチゲインGnextをピッチゲイン計算部950に記憶する。ピッチゲイン計算部950は、また、1つ前のフレームの信号区間について求めてピッチゲイン計算部950に記憶されていたピッチゲインGnext、すなわち、1つ前のフレームの信号区間のうちの現フレームの一部の入力信号XO(n) (n=0, 1, …, Nn-1)について求めたピッチゲイン、を特定可能な情報をピッチゲインについての情報として出力する。なお、具体例1と同様に、現フレームについては複数のサブフレームごとのピッチゲインを求めてもよい。
ピッチゲイン計算部950の具体例3は、現フレームの入力信号XO(n) (n=0, 1, …, N-1)そのものが現フレームの信号区間として構成されている場合であり、かつ、同一のフレームについては線形予測分析装置2よりも後にピッチゲイン計算部950が動作される場合、の例である。ピッチゲイン計算部950は、現フレームの信号区間である現フレームの入力信号XO(n) (n=0, 1, …, N-1)のピッチゲインGを求め、ピッチゲインGをピッチゲイン計算部950に記憶する。ピッチゲイン計算部950は、また、1つ前のフレームの信号区間、すなわち、1つ前のフレームの入力信号XO(n) (n=-N, -N+1, …, -1)について求めてピッチゲイン計算部950に記憶されていたピッチゲインGを特定可能な情報をピッチゲインについての情報として出力する。
自己相関計算部21は、入力されたNサンプルのフレーム毎の時間領域のディジタル音声信号やディジタル音響信号である入力信号XO(n)(n=0,1,…,N-1)から自己相関RO(i) (i=0,1,…,Pmax)を計算する(ステップS1)。Pmaxは、予測係数計算部23が求める線形予測係数に変換可能な係数の最大次数であり、N未満の所定の正の整数である。計算された自己相関RO(i) (i=0,1,…,Pmax)は、係数乗算部22に提供される。
係数決定部24は、入力されたピッチゲインについての情報を用いて、係数wO(i) (i=0,1,…,Pmax)を決定する(ステップS4)。係数wO(i)は、自己相関RO(i)を変形するための係数である。係数wO(i)は、信号処理の分野においては、ラグ窓wO(i)又はラグ窓係数wO(i)とも呼ばれているものである。係数wO(i)は正の値であるので、係数wO(i)が所定の値よりも大きい/小さいことを、係数wO(i)の大きさが所定の値よりも大きい/小さいと表現することがある。また、wO(i)の大きさとは、そのwO(i)の値を意味するものとする。
係数乗算部22は、係数決定部24で決定した係数wO(i) (i=0,1,…,Pmax)と、自己相関計算部21で求めた自己相関RO(i) (i=0,1,…,Pmax)とを同じiごとに乗じることにより、変形自己相関R'O(i) (i=0,1,…,Pmax)を求める(ステップS2)。すなわち、係数乗算部22は、以下の式(7)により自己相関R'O(i)を計算する。計算された自己相関R'O(i)は、予測係数計算部23に提供される。
予測係数計算部23は、係数乗算部22から出力された変形自己相関R'O(i)を用いて線形予測係数に変換可能な係数を求める(ステップS3)。
第二実施形態は、現在又は過去のフレームにおける入力信号のピッチゲインと正の相関関係にある値と所定の閾値とを比較し、その比較結果に応じて係数wO(i)を決定するものである。第二実施形態は、係数決定部24における係数wO(i)の決定方法のみが第一実施形態と異なり、他の点については第一実施形態と同様である。以下、第一実施形態と異なる部分を中心に説明し、第一実施形態と同様の部分については重複説明を省略する。
上述の第二実施形態では1個の閾値を用いて係数wO(i)を決定したが、第二実施形態の変形例は2個以上の閾値を用いて係数wO(i)を決定するものである。以下、2個の閾値th1,th2を用いて係数を決定する方法を例に挙げて説明する。閾値th1,th2は、0<th1<th2という関係を満たすとする。
第三実施形態は、複数個の係数テーブルを用いて係数wO(i)を決定するものである。第三実施形態は、係数決定部24における係数wO(i)の決定方法のみが第一実施形態と異なり、他の点については第一実施形態と同様である。以下、第一実施形態と異なる部分を中心に説明し、第一実施形態と同様の部分については重複説明を省略する。
(1) ピッチゲインと正の相関関係にある値>th2の場合、すなわち、ピッチゲインが大きいと判断された場合には、係数テーブルt0を係数テーブルtとして選択し、
(2) th2≧ ピッチゲインと正の相関関係にある値>th1の場合、すなわち、ピッチゲインが中程度であると判断された場合には、係数テーブルt1を係数テーブルtとして選択し、
(3) th1≧ ピッチゲインと正の相関関係にある値の場合、すなわち、ピッチゲインが小さいと判断された場合には、係数テーブルt2を係数テーブルtとして選択する。
以下、第三実施形態の具体例について説明する。線形予測分析装置2には、ハイパスフィルタを通り、12.8 kHzにサンプリング変換され、プリエンファシス処理をされた1フレームあたりNサンプルのディジタル音響信号である入力信号XO(n) (n=0,1,…,N-1)と、ピッチゲインについての情報として現フレームの一部の入力信号XO(n) (n=0, 1, …, Nn)(ただし、Nnは、Nn<Nという関係を満たす所定の正の整数。)についてピッチゲイン計算部950で求めたピッチゲインGとが入力される。現フレームの一部の入力信号XO(n) (n=0, 1, …, Nn)についてのピッチゲインGは、ピッチゲイン計算部950において当該入力信号の1つ前のフレームの信号区間として現フレームの一部の入力信号XO(n) (n=0, 1, …, Nn)を含めておき、1つ前のフレームの信号区間に対するピッチゲイン計算部950の処理においてXO(n) (n=0, 1, …, Nn)に対して計算し記憶したピッチゲインである。
係数テーブルt1は、式(13)の従来法のf0=40Hzのテーブルであり、各次数の係数wt1(i)が次のように定められている。
係数テーブルt2は、式(13)の従来法のf0=20Hzのテーブルであり、各次数の係数wt2(i)が次のように定められている。
ここで、上述のwtO(i), wt1(i), wt2(i)のリストは、Pmax=16として、i=0,1,2,…,16の順に左からiに対応する係数の大きさを並べたものである。すなわち上述の例では、例えばwt0(0)=1.0001であり、wt0(3)=0.996104103である。
第三実施形態では複数個の係数テーブルのうち何れか1つのテーブルに記憶された係数を係数wO(i)として決定したが、第三実施形態の変形例はこれに加えて複数個の係数テーブルに記憶された係数に基づく演算処理により係数wO(i)を決定する場合を含む。
(1) ピッチゲインと正の相関関係にある値>th2の場合、すなわち、ピッチゲインが大きいと判断された場合には、係数テーブルt0の各係数wt0(i)を係数wO(i)として選択し、
(2) th2≧ピッチゲインと正の相関関係にある値>th1の場合、すなわち、ピッチゲインが中程度であると判断された場合には、係数テーブルt0の各係数wt0(i)と係数テーブルt2の各係数wt2(i)とを用いて、wO(i)=β'×wt0(i)+(1-β')×wt2(i)により係数wO(i)を決定し、
(3) th1≧ピッチゲインと正の相関関係にある値の場合、すなわち、ピッチゲインが小さいと判断された場合には、係数テーブルt2の各係数wt2(i)を係数wO(i)として選択する。
図7及び図8に示すように、上述の全ての実施形態及び変形例において、係数乗算部22を含まず、予測係数計算部23において係数wO(i)と自己相関RO(i)とを用いて線形予測分析を行ってもよい。図7と図8は、それぞれ図1と図4に対応する線形予測分析装置2の構成例である。この場合は、予測係数計算部23は、図9のステップS5において、係数wO(i)と自己相関RO(i)とが乗算されたものである変形自己相関R'O(i)ではなく、係数wO(i)と自己相関RO(i)とを直接用いて線形予測分析を行う(ステップS5)。
第四実施形態は、入力信号XO(n)に対して従来の線形予測分析装置を用いて線形予測分析を行い、その線形予測分析の結果を用いてピッチゲイン計算部でピッチゲインを得て、得られたピッチゲインに基づく係数wO(i)を用いて本発明の線形予測分析装置により線形予測係数に変換可能な係数を求めるものである。
第一線形予測分析部31は、従来の線形予測分析装置1と同じ動作をする。すなわち、第一線形予測分析部31は、入力信号XO(n)から自己相関RO(i) (i=0,1,…,Pmax)を求め、自己相関RO(i) (i=0,1,…,Pmax)と予め定めた係数wO(i) (i=0,1,…,Pmax)とを同じiごとに乗じることにより変形自己相関R' O(i) (i=0,1,…,Pmax)を求め、変形自己相関R' O(i) (i=0,1,…,Pmax)から1次から予め定めた最大次数であるPmax次までの線形予測係数に変換可能な係数を求める。
線形予測残差計算部32は、入力信号XO(n)に対して、1次からPmax次までの線形予測係数に変換可能な係数に基づく線形予測や線形予測と等価なまたは類似したフィルタリング処理を行って線形予測残差信号XR(n)を求める。フィルタリング処理は重み付け処理とも言えるので、線形予測残差信号XR(n)は重み付け入力信号であるともいえる。
ピッチゲイン計算部36は、線形予測残差信号XR(n)のピッチゲインGを求め、ピッチゲインについての情報を出力する。ピッチゲインを求める方法としては、様々な公知の方法が存在するので、公知の何れの方法を用いてもよい。ピッチゲイン計算部36は、例えば、現フレームの線形予測残差信号XR (n) (n=0, 1, …, N-1)を構成する複数個のサブフレームのそれぞれについてピッチゲインを求める。すなわち、2以上の整数であるM個のサブフレームであるXRs1(n) (n=0, 1, …, N/M-1), …, XRsM(n) (n=(M-1)N/M, (M-1)N/M+1, …, N-1)のそれぞれのピッチゲインであるGs1, …, GsMを求める。NはMで割り切れるとする。ピッチゲイン計算部36は、次に、現フレームを構成するM個のサブフレームのピッチゲインであるGs1, …, GsMのうちの最大値max(Gs1, …, GsM)を特定可能な情報をピッチゲインについての情報として出力する。
第二線形予測分析部34は、本発明の第一実施形態から第三実施形態及びこれらの変形例の線形予測分析装置2の何れかと同じ動作をする。すなわち、第二線形予測分析部34は、入力信号XO(n)から自己相関RO(i) (i=0,1,…,Pmax)を求め、ピッチゲイン計算部36が出力したピッチゲインについての情報に基づいて係数wO(i) (i=0,1,…,Pmax)を決定し、自己相関RO(i) (i=0,1,…,Pmax)と決定した係数wO(i) (i=0,1,…,Pmax)とを用いて変形自己相関R' O(i) (i=0,1,…,Pmax)から1次から予め定めた最大次数であるPmax次までの線形予測係数に変換可能な係数を求める。
第一実施形態においてピッチゲイン計算部950の具体例2として説明した通り、ピッチゲインと正の相関関係にある値として、前のフレームの信号処理においてLook-aheadとも呼ばれる先読みして利用するサンプル部分のうち現フレームのサンプルに対応する部分のピッチゲインを用いてもよい。
Claims (6)
- 入力時系列信号に対応する線形予測係数に変換可能な係数を、所定時間区間であるフレームごとに求める、線形予測分析方法であって、
少なくともi=0,1,…,Pmaxのそれぞれについて、現在のフレームの入力時系列信号XO(n)とiサンプルだけ過去の入力時系列信号XO(n-i)またはiサンプルだけ未来の入力時系列信号XO(n+i)との自己相関RO(i)を計算する自己相関計算ステップと、
係数wO(i) と前記自己相関RO(i) とが対応するiごとに乗算されたものである変形自己相関R'O(i) を用いて、1次からPmax次までの線形予測係数に変換可能な係数を求める予測係数計算ステップと、を含み、
各次数iに対応する係数wO(i)が、現在又は過去のフレームにおける入力時系列信号の周期性の強さ又は入力時系列信号に基づくピッチゲインと正の相関関係にある値の取り得る範囲の全てにおいて、前記周期性の強さ又はピッチゲインと正の相関関係にある値の増加とともに単調減少する関係にあるか、または、前記周期性の強さ又はピッチゲインと正の相関関係にある値の取り得る範囲のうちの一部の範囲では、前記周期性の強さ又はピッチゲインと正の相関関係にある値の増加に関わらず一定であり、前記周期性の強さ又はピッチゲインと正の相関関係にある値の取り得る範囲のうちの前記一部の範囲以外の範囲では、前記周期性の強さ又はピッチゲインと正の相関関係にある値の増加とともに単調減少する関係にある、
線形予測分析方法。 - 入力時系列信号に対応する線形予測係数に変換可能な係数を、所定時間区間であるフレームごとに求める、線形予測分析方法であって、
少なくともi=0,1,…,Pmaxのそれぞれについて、現在のフレームの入力時系列信号XO(n)とiサンプルだけ過去の入力時系列信号XO(n-i)またはiサンプルだけ未来の入力時系列信号XO(n+i)との自己相関RO(i)を計算する自己相関計算ステップと、
係数wO(i) と前記自己相関RO(i) とが対応するiごとに乗算されたものである変形自己相関R'O(i) を用いて、1次からPmax次までの線形予測係数に変換可能な係数を求める予測係数計算ステップと、を含み、
i=0以外の各次数iに対しては、前記各次数iに対応する係数wO(i)が、現在又は過去のフレームにおける入力時系列信号の周期性の強さ又は入力時系列信号に基づくピッチゲインと正の相関関係にある値の取り得る範囲の全てにおいて、前記周期性の強さ又はピッチゲインと正の相関関係にある値の増加とともに単調減少する関係にあるか、または、前記周期性の強さ又はピッチゲインと正の相関関係にある値の取り得る範囲のうちの一部の範囲では、前記周期性の強さ又はピッチゲインと正の相関関係にある値の増加に関わらず一定であり、前記周期性の強さ又はピッチゲインと正の相関関係にある値の取り得る範囲のうちの前記一部の範囲以外の範囲では、前記周期性の強さ又はピッチゲインと正の相関関係にある値の増加とともに単調減少する関係にあり、
i=0に対しては、係数w O (i)は固定値である、
線形予測分析方法。 - 入力時系列信号に対応する線形予測係数に変換可能な係数を、所定時間区間であるフレームごとに求める、線形予測分析装置であって、
少なくともi=0,1,…,Pmaxのそれぞれについて、現在のフレームの入力時系列信号XO(n)とiサンプルだけ過去の入力時系列信号XO(n-i)またはiサンプルだけ未来の入力時系列信号XO(n+i)との自己相関RO(i) を計算する自己相関計算部と、
係数wO(i) と前記自己相関RO(i) とが対応するiごとに乗算されたものである変形自己相関R'O(i) を用いて、1次からPmax次までの線形予測係数に変換可能な係数を求める予測係数計算部と、を含み、
各次数iに対応する係数wO(i)が、現在又は過去のフレームにおける入力時系列信号の周期性の強さ又は入力時系列信号に基づくピッチゲインと正の相関関係にある値の取り得る範囲の全てにおいて、前記周期性の強さ又はピッチゲインと正の相関関係にある値の増加とともに単調減少する関係にあるか、または、前記周期性の強さ又はピッチゲインと正の相関関係にある値の取り得る範囲のうちの一部の範囲では、前記周期性の強さ又はピッチゲインと正の相関関係にある値の増加に関わらず一定であり、前記周期性の強さ又はピッチゲインと正の相関関係にある値の取り得る範囲のうちの前記一部の範囲以外の範囲では、前記周期性の強さ又はピッチゲインと正の相関関係にある値の増加とともに単調減少する関係にある、
線形予測分析装置。 - 入力時系列信号に対応する線形予測係数に変換可能な係数を、所定時間区間であるフレームごとに求める、線形予測分析装置であって、
少なくともi=0,1,…,Pmaxのそれぞれについて、現在のフレームの入力時系列信号XO(n)とiサンプルだけ過去の入力時系列信号XO(n-i)またはiサンプルだけ未来の入力時系列信号XO(n+i)との自己相関RO(i) を計算する自己相関計算部と、
係数wO(i) と前記自己相関RO(i) とが対応するiごとに乗算されたものである変形自己相関R'O(i) を用いて、1次からPmax次までの線形予測係数に変換可能な係数を求める予測係数計算部と、を含み、
i=0以外の各次数iに対しては、前記各次数iに対応する係数wO(i)が、現在又は過去のフレームにおける入力時系列信号の周期性の強さ又は入力時系列信号に基づくピッチゲインと正の相関関係にある値の取り得る範囲の全てにおいて、前記周期性の強さ又はピッチゲインと正の相関関係にある値の増加とともに単調減少する関係にあるか、または、前記周期性の強さ又はピッチゲインと正の相関関係にある値の取り得る範囲のうちの一部の範囲では、前記周期性の強さ又はピッチゲインと正の相関関係にある値の増加に関わらず一定であり、前記周期性の強さ又はピッチゲインと正の相関関係にある値の取り得る範囲のうちの前記一部の範囲以外の範囲では、前記周期性の強さ又はピッチゲインと正の相関関係にある値の増加とともに単調減少する関係にあり、
i=0に対しては、係数w O (i)は固定値である、
線形予測分析装置。 - 請求項1又は2の線形予測分析方法の各ステップをコンピュータに実行させるためのプログラム。
- 請求項1又は2の線形予測分析方法の各ステップをコンピュータに実行させるためのプログラムが記録されたコンピュータ読み取り可能な記録媒体。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014011317 | 2014-01-24 | ||
JP2014011317 | 2014-01-24 | ||
JP2014152526 | 2014-07-28 | ||
JP2014152526 | 2014-07-28 | ||
PCT/JP2015/051351 WO2015111568A1 (ja) | 2014-01-24 | 2015-01-20 | 線形予測分析装置、方法、プログラム及び記録媒体 |
Related Child Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017223807A Division JP6416363B2 (ja) | 2014-01-24 | 2017-11-21 | 線形予測分析装置、方法、プログラム及び記録媒体 |
JP2017223806A Division JP6449968B2 (ja) | 2014-01-24 | 2017-11-21 | 線形予測分析装置、方法、プログラム及び記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2015111568A1 JPWO2015111568A1 (ja) | 2017-03-23 |
JP6250072B2 true JP6250072B2 (ja) | 2017-12-20 |
Family
ID=53681371
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015558849A Active JP6250072B2 (ja) | 2014-01-24 | 2015-01-20 | 線形予測分析装置、方法、プログラム及び記録媒体 |
JP2017223807A Active JP6416363B2 (ja) | 2014-01-24 | 2017-11-21 | 線形予測分析装置、方法、プログラム及び記録媒体 |
JP2017223806A Active JP6449968B2 (ja) | 2014-01-24 | 2017-11-21 | 線形予測分析装置、方法、プログラム及び記録媒体 |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017223807A Active JP6416363B2 (ja) | 2014-01-24 | 2017-11-21 | 線形予測分析装置、方法、プログラム及び記録媒体 |
JP2017223806A Active JP6449968B2 (ja) | 2014-01-24 | 2017-11-21 | 線形予測分析装置、方法、プログラム及び記録媒体 |
Country Status (8)
Country | Link |
---|---|
US (3) | US9966083B2 (ja) |
EP (3) | EP3462453B1 (ja) |
JP (3) | JP6250072B2 (ja) |
KR (3) | KR101850523B1 (ja) |
CN (3) | CN106415718B (ja) |
ES (3) | ES2703565T3 (ja) |
PL (3) | PL3098812T3 (ja) |
WO (1) | WO2015111568A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
PL3012835T3 (pl) * | 2013-07-18 | 2019-02-28 | Nippon Telegraph And Telephone Corporation | Urządzenie, sposób i program do analizy predykcji liniowej, oraz nośnik zapisu |
CN110349590B (zh) | 2014-01-24 | 2023-03-24 | 日本电信电话株式会社 | 线性预测分析装置、方法以及记录介质 |
KR101826237B1 (ko) | 2014-03-24 | 2018-02-13 | 니폰 덴신 덴와 가부시끼가이샤 | 부호화 방법, 부호화 장치, 프로그램 및 기록 매체 |
EP4343763A3 (en) * | 2014-04-25 | 2024-06-05 | Ntt Docomo, Inc. | Linear prediction coefficient conversion device and linear prediction coefficient conversion method |
Family Cites Families (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2654542B1 (fr) * | 1989-11-14 | 1992-01-17 | Thomson Csf | Procede et dispositif de codage de filtres predicteurs de vocodeurs tres bas debit. |
US5781880A (en) * | 1994-11-21 | 1998-07-14 | Rockwell International Corporation | Pitch lag estimation using frequency-domain lowpass filtering of the linear predictive coding (LPC) residual |
US5648989A (en) * | 1994-12-21 | 1997-07-15 | Paradyne Corporation | Linear prediction filter coefficient quantizer and filter set |
TW283775B (en) * | 1995-10-11 | 1996-08-21 | Nat Science Council | Linear prediction coefficient based inverse spectrum coefficient generator |
FR2742568B1 (fr) * | 1995-12-15 | 1998-02-13 | Catherine Quinquis | Procede d'analyse par prediction lineaire d'un signal audiofrequence, et procedes de codage et de decodage d'un signal audiofrequence en comportant application |
CN1202514C (zh) * | 2000-11-27 | 2005-05-18 | 日本电信电话株式会社 | 编码和解码语音及其参数的方法、编码器、解码器 |
US20040002856A1 (en) * | 2002-03-08 | 2004-01-01 | Udaya Bhaskar | Multi-rate frequency domain interpolative speech CODEC system |
US7024358B2 (en) * | 2003-03-15 | 2006-04-04 | Mindspeed Technologies, Inc. | Recovering an erased voice frame with time warping |
US7830921B2 (en) * | 2005-07-11 | 2010-11-09 | Lg Electronics Inc. | Apparatus and method of encoding and decoding audio signal |
JP4733552B2 (ja) * | 2006-04-06 | 2011-07-27 | 日本電信電話株式会社 | Parcor係数算出装置、parcor係数算出方法、そのプログラムおよびその記録媒体 |
JP4658853B2 (ja) * | 2006-04-13 | 2011-03-23 | 日本電信電話株式会社 | 適応ブロック長符号化装置、その方法、プログラム及び記録媒体 |
DE602007003023D1 (de) * | 2006-05-30 | 2009-12-10 | Koninkl Philips Electronics Nv | Linear-prädiktive codierung eines audiosignals |
JP4691050B2 (ja) * | 2007-01-29 | 2011-06-01 | 日本電信電話株式会社 | Parcor係数算出方法、及びその装置とそのプログラムと、その記憶媒体 |
JP5253518B2 (ja) * | 2008-12-22 | 2013-07-31 | 日本電信電話株式会社 | 符号化方法、復号方法、それらの装置、プログラム及び記録媒体 |
US8301444B2 (en) | 2008-12-29 | 2012-10-30 | At&T Intellectual Property I, L.P. | Automated demographic analysis by analyzing voice activity |
CN101599272B (zh) * | 2008-12-30 | 2011-06-08 | 华为技术有限公司 | 基音搜索方法及装置 |
CN101609678B (zh) * | 2008-12-30 | 2011-07-27 | 华为技术有限公司 | 信号压缩方法及其压缩装置 |
CN102282770B (zh) * | 2009-01-23 | 2014-04-16 | 日本电信电话株式会社 | 一种参数选择方法、参数选择装置 |
US8665945B2 (en) * | 2009-03-10 | 2014-03-04 | Nippon Telegraph And Telephone Corporation | Encoding method, decoding method, encoding device, decoding device, program, and recording medium |
US9082416B2 (en) * | 2010-09-16 | 2015-07-14 | Qualcomm Incorporated | Estimating a pitch lag |
CN102783034B (zh) * | 2011-02-01 | 2014-12-17 | 华为技术有限公司 | 用于提供信号处理系数的方法和设备 |
JP5613781B2 (ja) * | 2011-02-16 | 2014-10-29 | 日本電信電話株式会社 | 符号化方法、復号方法、符号化装置、復号装置、プログラム及び記録媒体 |
CN102595495A (zh) * | 2012-02-07 | 2012-07-18 | 北京新岸线无线技术有限公司 | 一种数据发送、接收方法和装置 |
CN103050121A (zh) * | 2012-12-31 | 2013-04-17 | 北京迅光达通信技术有限公司 | 线性预测语音编码方法及语音合成方法 |
CN110349590B (zh) * | 2014-01-24 | 2023-03-24 | 日本电信电话株式会社 | 线性预测分析装置、方法以及记录介质 |
-
2015
- 2015-01-20 PL PL15740820T patent/PL3098812T3/pl unknown
- 2015-01-20 EP EP18196351.3A patent/EP3462453B1/en active Active
- 2015-01-20 PL PL18196340T patent/PL3441970T3/pl unknown
- 2015-01-20 CN CN201580005196.6A patent/CN106415718B/zh active Active
- 2015-01-20 KR KR1020187003046A patent/KR101850523B1/ko active IP Right Grant
- 2015-01-20 WO PCT/JP2015/051351 patent/WO2015111568A1/ja active Application Filing
- 2015-01-20 CN CN201910634756.4A patent/CN110415715B/zh active Active
- 2015-01-20 JP JP2015558849A patent/JP6250072B2/ja active Active
- 2015-01-20 US US15/112,534 patent/US9966083B2/en active Active
- 2015-01-20 ES ES15740820T patent/ES2703565T3/es active Active
- 2015-01-20 PL PL18196351T patent/PL3462453T3/pl unknown
- 2015-01-20 ES ES18196351T patent/ES2799899T3/es active Active
- 2015-01-20 EP EP18196340.6A patent/EP3441970B1/en active Active
- 2015-01-20 EP EP15740820.4A patent/EP3098812B1/en active Active
- 2015-01-20 CN CN201910634745.6A patent/CN110415714B/zh active Active
- 2015-01-20 ES ES18196340T patent/ES2770407T3/es active Active
- 2015-01-20 KR KR1020167019020A patent/KR101826219B1/ko active IP Right Grant
- 2015-01-20 KR KR1020187003053A patent/KR101877397B1/ko active IP Right Grant
-
2017
- 2017-11-21 JP JP2017223807A patent/JP6416363B2/ja active Active
- 2017-11-21 JP JP2017223806A patent/JP6449968B2/ja active Active
-
2018
- 2018-03-19 US US15/924,963 patent/US10170130B2/en active Active
- 2018-03-19 US US15/924,887 patent/US10163450B2/en active Active
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6117359B2 (ja) | 線形予測分析装置、方法、プログラム及び記録媒体 | |
JP6423065B2 (ja) | 線形予測分析装置、方法、プログラム及び記録媒体 | |
JP6449968B2 (ja) | 線形予測分析装置、方法、プログラム及び記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170823 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170912 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171026 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20171031 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20171121 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6250072 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |