JP6416363B2 - 線形予測分析装置、方法、プログラム及び記録媒体 - Google Patents
線形予測分析装置、方法、プログラム及び記録媒体 Download PDFInfo
- Publication number
- JP6416363B2 JP6416363B2 JP2017223807A JP2017223807A JP6416363B2 JP 6416363 B2 JP6416363 B2 JP 6416363B2 JP 2017223807 A JP2017223807 A JP 2017223807A JP 2017223807 A JP2017223807 A JP 2017223807A JP 6416363 B2 JP6416363 B2 JP 6416363B2
- Authority
- JP
- Japan
- Prior art keywords
- coefficient
- pitch gain
- linear prediction
- periodicity
- strength
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004458 analytical method Methods 0.000 title claims description 73
- 238000000034 method Methods 0.000 title description 23
- 238000004364 calculation method Methods 0.000 claims description 67
- 230000000875 corresponding effect Effects 0.000 claims description 45
- 230000002596 correlated effect Effects 0.000 claims description 28
- 238000012986 modification Methods 0.000 description 13
- 230000004048 modification Effects 0.000 description 13
- 230000005236 sound signal Effects 0.000 description 8
- 230000014509 gene expression Effects 0.000 description 7
- 230000003595 spectral effect Effects 0.000 description 7
- 230000007423 decrease Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 238000001228 spectrum Methods 0.000 description 6
- 238000013139 quantization Methods 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 238000007796 conventional method Methods 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 3
- 230000000737 periodic effect Effects 0.000 description 3
- 102220475340 DNA replication licensing factor MCM2_S41A_mutation Human genes 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000005311 autocorrelation function Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/06—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/12—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/21—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Complex Calculations (AREA)
Description
この発明は、音声信号、音響信号、心電図、脳波、脳磁図、地震波等のディジタル時系列信号の分析技術に関する。
音声信号、音響信号の符号化では、入力された音声信号や音響信号を線形予測分析して得た予測係数に基づいて符号化する手法が広く用いられている(例えば、非特許文献1,2参照。)。
非特許文献1から3では、図11に例示する線形予測分析装置により予測係数が計算されている。線形予測分析装置1は、自己相関計算部11、係数乗算部12及び予測係数計算部13を備えている。
入力された時間領域のディジタル音声信号やディジタル音響信号である入力信号は、Nサンプルのフレーム毎に処理される。現時刻で処理対象とするフレームである現フレームの入力信号をXO(n)(n=0,1,…,N-1)とする。nは入力信号における各サンプルのサンプル番号を表し、Nは所定の正の整数である。ここで、現フレームの1つ前のフレームの入力信号はXO(n)(n=-N,-N+1,…,-1)であり、現フレームの1つ後のフレームの入力信号はXO(n)(n=N,N+1,…,2N-1)である。
[自己相関計算部11]
線形予測分析装置1の自己相関計算部11は、入力信号XO(n)から自己相関RO(i) (i=0,1,…,Pmax,Pmaxは予測次数)を式(11)により求めて出力する。Pmaxは、N未満の所定の正の整数である。
線形予測分析装置1の自己相関計算部11は、入力信号XO(n)から自己相関RO(i) (i=0,1,…,Pmax,Pmaxは予測次数)を式(11)により求めて出力する。Pmaxは、N未満の所定の正の整数である。
[係数乗算部12]
次に、係数乗算部12が、自己相関計算部11から出力された自己相関RO(i)に予め定めた係数wO(i) (i=0,1,…,Pmax)を同じiごとに乗じることにより、変形自己相関R'O(i) (i=0,1,…,Pmax)を求める。すなわち、変形自己相関関数R' O(i)を式(12)により求める。
次に、係数乗算部12が、自己相関計算部11から出力された自己相関RO(i)に予め定めた係数wO(i) (i=0,1,…,Pmax)を同じiごとに乗じることにより、変形自己相関R'O(i) (i=0,1,…,Pmax)を求める。すなわち、変形自己相関関数R' O(i)を式(12)により求める。
[予測係数計算部13]
そして、予測係数計算部13が、係数乗算部12から出力された変形自己相関R'O(i)を用いて例えばLevinson-Durbin法などにより、1次から予め定めた予測次数であるPmax次までの線形予測係数に変換可能な係数を求める。線形予測係数に変換可能な係数とは、PARCOR係数KO(1),KO(2),…,KO(Pmax)や線形予測係数aO(1),aO(2),…,aO(Pmax)等である。
そして、予測係数計算部13が、係数乗算部12から出力された変形自己相関R'O(i)を用いて例えばLevinson-Durbin法などにより、1次から予め定めた予測次数であるPmax次までの線形予測係数に変換可能な係数を求める。線形予測係数に変換可能な係数とは、PARCOR係数KO(1),KO(2),…,KO(Pmax)や線形予測係数aO(1),aO(2),…,aO(Pmax)等である。
非特許文献1である国際標準ITU-T G.718や非特許文献2である国際標準ITU-T G.729では、係数wO(i)として予め求めておいた60 Hzのバンド幅の固定の係数を用いている。
非特許文献3には、上述の指数関数以外の関数に基づく係数を用いる例が記載されている。しかし、ここで用いられている関数は、サンプリング周期τ(fsに対応する周期に相当)と所定の定数aとに基づく関数であり、やはり固定値の係数が使われている。
ITU-T Recommendation G.718, ITU, 2008.
ITU-T Recommendation G.729, ITU, 1996
Yoh'ichi Tohkura, Fumitada Itakura, Shin'ichiro Hashimoto, "Spectral Smoothing Technique in PARCOR Speech Analysis-Synthesis", IEEE Trans. on Acoustics, Speech, and Signal Processing, Vol. ASSP-26, No.6, 1978
従来の音声信号、音響信号の符号化で用いられている線形予測分析方法では、自己相関RO(i)に固定の係数wO(i)が乗算して得られる変形自己相関R'O(i)を用いて線形予測係数に変換可能な係数を求めていた。よって、自己相関RO(i)への係数wO(i)の乗算による変形を必要としないような、すなわち、変形自己相関R'O(i)ではなく自己相関RO(i)そのものを用いて線形予測係数に変換可能な係数を求めたとしても、線形予測係数に変換可能な係数に対応するスペクトル包絡においてスペクトルのピークが大きくなりすぎることがないような入力信号の場合には、自己相関RO(i)への係数wO(i)の乗算によって、変形自己相関R'O(i)により求まる線形予測係数に変換可能な係数に対応するスペクトル包絡が、入力信号XO(n)のスペクトル包絡を近似する精度が下がってしまう、すなわち、線形予測分析の精度が下がってしまう可能性、があった。
この発明は、従来よりも分析精度が高い線形予測分析方法、装置、プログラム及び記録媒体を提供することを目的とする。
この発明の一態様による線形予測分析方法は、入力時系列信号に対応する線形予測係数に変換可能な係数を、所定時間区間であるフレームごとに求める、線形予測分析方法であって、少なくともi=0,1,…,Pmaxのそれぞれについて、現在のフレームの入力時系列信号XO(n)とiサンプルだけ過去の入力時系列信号XO(n-i)またはiサンプルだけ未来の入力時系列信号XO(n+i)との自己相関RO(i)を計算する自己相関計算ステップと、係数と自己相関RO(i)とが対応するiごとに乗算されたものである変形自己相関R' O(i)を用いて、1次からPmax次までの線形予測係数に変換可能な係数を求める予測係数計算ステップと、を含み、係数テーブルt0には係数wt0(i)が格納されており、係数テーブルt1には係数wt1(i)が格納されており、係数テーブルt2には係数wt2(i)が格納されているとして、現在又は過去のフレームにおける入力時系列信号の周期性の強さ又は入力時系列信号に基づくピッチゲインと正の相関関係にある値を用いて係数テーブルt0,t1,t2の中の1個の係数テーブルから係数を取得する係数決定ステップを更に含み、周期性の強さ又はピッチゲインと正の相関関係にある値に応じて、周期性の強さ又はピッチゲインが大きい場合、周期性の強さ又はピッチゲインが中程度の場合、周期性の強さ又はピッチゲインが小さい場合の何れかの場合に分類されるとし、周期性の強さ又はピッチゲインが大きい場合に係数決定ステップで係数が取得される係数テーブルを係数テーブルt0とし、周期性の強さ又はピッチゲインが中程度の場合に係数決定ステップで係数が取得される係数テーブルを係数テーブルt1とし、周期性の強さ又はピッチゲインが小さい場合に係数決定ステップで係数が取得される係数テーブルを係数テーブルt2として、i=0以外のiのうちの少なくとも一部のiについてwt0(i)<wt1(i)≦wt2(i)であり、i=0以外のiのうちの少なくとも一部の各iについてwt0(i)≦wt1(i)<wt2(i)であり、i=0以外のiのうちの残りの各iについてwt0(i)≦wt1(i)≦wt2(i)である。
この発明の一態様による線形予測分析方法は、入力時系列信号に対応する線形予測係数に変換可能な係数を、所定時間区間であるフレームごとに求める、線形予測分析方法であって、少なくともi=0,1,…,Pmaxのそれぞれについて、現在のフレームの入力時系列信号XO(n)とiサンプルだけ過去の入力時系列信号XO(n-i)またはiサンプルだけ未来の入力時系列信号XO(n+i)との自己相関RO(i) を計算する自己相関計算ステップと、係数と自己相関RO(i)とが対応するiごとに乗算されたものである変形自己相関R' O(i)を用いて、1次からPmax次までの線形予測係数に変換可能な係数を求める予測係数計算ステップと、を含み、係数テーブルt0には係数wt0(i)が格納されており、係数テーブルt2には係数wt2(i)が格納されているとして、現在又は過去のフレームにおける入力時系列信号の周期性の強さ又は入力時系列信号に基づくピッチゲインと正の相関関係にある値を用いて係数テーブルt0,t2の少なくとも何れかの係数テーブルから係数を取得する係数決定ステップを更に含み、周期性の強さ又はピッチゲインと正の相関関係にある値に応じて、周期性の強さ又はピッチゲインが大きい場合、周期性の強さ又はピッチゲインが中程度の場合、周期性の強さ又はピッチゲインが小さい場合の何れかの場合に分類されるとし、周期性の強さ又はピッチゲインが大きい場合に係数決定ステップで係数が取得される係数テーブルを係数テーブルt0とし、周期性の強さ又はピッチゲインが小さい場合に係数決定ステップで係数が取得される係数テーブルを係数テーブルt2として、i=0以外のiのうちの少なくとも一部のiについてwt0(i)<wt2(i)であり、i=0以外のiのうちの残りの各iについてwt0(i)≦wt2(i)であり、上記係数決定ステップは、周期性の強さ又はピッチゲインが中程度の場合には、i=0以外の各iについて、w0(i)=β’×wt0(i)+(1-β’)×wt2(i) (ただし0≦β’≦1)である係数を決定する。
従来よりも分析精度の高い線形予測を実現することができる。
以下、図面を参照して、線形予測分析装置及び方法の各実施形態を説明する。
[第一実施形態]
第一実施形態の線形予測分析装置2は、図1に示すように、自己相関計算部21、係数決定部24、係数乗算部22及び予測係数計算部23を例えば備えている。自己相関計算部21、係数乗算部22及び予測係数計算部23の動作は、従来の線形予測分析装置1の自己相関計算部11、係数乗算部12及び予測係数計算部13における動作とそれぞれ同じである。
第一実施形態の線形予測分析装置2は、図1に示すように、自己相関計算部21、係数決定部24、係数乗算部22及び予測係数計算部23を例えば備えている。自己相関計算部21、係数乗算部22及び予測係数計算部23の動作は、従来の線形予測分析装置1の自己相関計算部11、係数乗算部12及び予測係数計算部13における動作とそれぞれ同じである。
線形予測分析装置2には、所定時間区間であるフレームごとの時間領域のディジタル音声信号やディジタル音響信号や心電図、脳波、脳磁図、地震波等のやディジタル信号である入力信号XO(n)が入力される。入力信号は、入力時系列信号である。現フレームの入力信号をXO(n)(n=0,1,…,N-1)とする。nは入力信号における各サンプルのサンプル番号を表し、Nは所定の正の整数である。ここで、現フレームの1つ前のフレームの入力信号はXO(n)(n=-N,-N+1,…, -1)であり、現フレームの1つ後のフレームの入力信号はXO(n)(n=N,N+1,…, 2N-1)である。以下では、入力信号XO(n)がディジタル音声信号やディジタル音響信号である場合について説明する。入力信号XO(n) (n=0,1,…,N-1)は、収音された信号そのものであってもよいし、分析のためにサンプリングレートが変換された信号でもよいし、プリエンファシス処理された信号でもよいし、窓かけされた信号でもよい。
また、線形予測分析装置2には、フレームごとのディジタル音声信号やディジタル音響信号のピッチゲインについての情報も入力される。ピッチゲインについての情報は、線形予測分析装置2外にあるピッチゲイン計算部950で求められる。
ピッチゲインは、フレームごとの入力信号の周期性の強さのことである。ピッチゲインは、例えば、入力信号やその線形予測残差信号についてのピッチ周期分だけ時間差がある信号間の正規化された相関である。
[ピッチゲイン計算部950]
ピッチゲイン計算部950は、現フレームの入力信号XO(n) (n=0, 1, …, N-1)および/または現フレームの近傍のフレームの入力信号の全部または一部からピッチゲインGを求める。ピッチゲイン計算部950は、例えば、現フレームの入力信号XO(n) (n=0, 1, …, N-1)の全部または一部を含む信号区間のディジタル音声信号やディジタル音響信号のピッチゲインGを求め、ピッチゲインGを特定可能な情報をピッチゲインについての情報として出力する。ピッチゲインを求める方法としては、様々な公知の方法が存在するので、公知の何れの方法を用いてもよい。また、求めたピッチゲインGを符号化してピッチゲイン符号を得る構成とし、ピッチゲイン符号をピッチゲインについての情報として出力してもよい。さらにピッチゲイン符号に対応するピッチゲインの量子化値^Gを得る構成とし、ピッチゲインの量子化値^Gをピッチゲインについての情報として出力してもよい。以下、ピッチゲイン計算部950の具体例について説明する。
ピッチゲイン計算部950は、現フレームの入力信号XO(n) (n=0, 1, …, N-1)および/または現フレームの近傍のフレームの入力信号の全部または一部からピッチゲインGを求める。ピッチゲイン計算部950は、例えば、現フレームの入力信号XO(n) (n=0, 1, …, N-1)の全部または一部を含む信号区間のディジタル音声信号やディジタル音響信号のピッチゲインGを求め、ピッチゲインGを特定可能な情報をピッチゲインについての情報として出力する。ピッチゲインを求める方法としては、様々な公知の方法が存在するので、公知の何れの方法を用いてもよい。また、求めたピッチゲインGを符号化してピッチゲイン符号を得る構成とし、ピッチゲイン符号をピッチゲインについての情報として出力してもよい。さらにピッチゲイン符号に対応するピッチゲインの量子化値^Gを得る構成とし、ピッチゲインの量子化値^Gをピッチゲインについての情報として出力してもよい。以下、ピッチゲイン計算部950の具体例について説明する。
<ピッチゲイン計算部950の具体例1>
ピッチゲイン計算部950の具体例1は、現フレームの入力信号XO(n) (n=0, 1, …, N-1)が複数個のサブフレームで構成されている場合、かつ、同一のフレームについては線形予測分析装置2よりも先にピッチゲイン計算部950が動作される場合、の例である。ピッチゲイン計算部950は、まず、2以上の整数であるM個のサブフレームであるXOs1(n) (n=0, 1, …, N/M-1), …, XOsM(n)(n= (M-1)N/M, (M-1)N/M+1, …, N-1)のそれぞれのピッチゲインであるGs1,…, GsMを求める。NはMで割り切れるとする。ピッチゲイン計算部950は、現フレームを構成するM個のサブフレームのピッチゲインであるGs1,…, GsMのうちの最大値max(Gs1,…,GsM)を特定可能な情報をピッチゲインについての情報として出力する。
ピッチゲイン計算部950の具体例1は、現フレームの入力信号XO(n) (n=0, 1, …, N-1)が複数個のサブフレームで構成されている場合、かつ、同一のフレームについては線形予測分析装置2よりも先にピッチゲイン計算部950が動作される場合、の例である。ピッチゲイン計算部950は、まず、2以上の整数であるM個のサブフレームであるXOs1(n) (n=0, 1, …, N/M-1), …, XOsM(n)(n= (M-1)N/M, (M-1)N/M+1, …, N-1)のそれぞれのピッチゲインであるGs1,…, GsMを求める。NはMで割り切れるとする。ピッチゲイン計算部950は、現フレームを構成するM個のサブフレームのピッチゲインであるGs1,…, GsMのうちの最大値max(Gs1,…,GsM)を特定可能な情報をピッチゲインについての情報として出力する。
<ピッチゲイン計算部950の具体例2>
ピッチゲイン計算部950の具体例2は、現フレームの入力信号XO(n) (n=0, 1, …, N-1)と1つ後のフレームの一部の入力信号XO(n) (n=N, N+1, …, N+Nn-1)(ただし、Nnは、Nn<Nという関係を満たす所定の正の整数。)とで、先読み部分を含む信号区間が現フレームの信号区間として構成されている場合であり、かつ、同一のフレームについては線形予測分析装置2よりも後にピッチゲイン計算部950が動作される場合、の例である。ピッチゲイン計算部950は、現フレームの信号区間について、現フレームの入力信号XO(n) (n=0, 1, …, N-1)と1つ後のフレームの一部の入力信号XO(n) (n=N, N+1, …, N+Nn-1)のそれぞれのピッチゲインであるGnow, Gnextを求め、ピッチゲインGnextをピッチゲイン計算部950に記憶する。ピッチゲイン計算部950は、また、1つ前のフレームの信号区間について求めてピッチゲイン計算部950に記憶されていたピッチゲインGnext、すなわち、1つ前のフレームの信号区間のうちの現フレームの一部の入力信号XO(n) (n=0, 1, …, Nn-1)について求めたピッチゲイン、を特定可能な情報をピッチゲインについての情報として出力する。なお、具体例1と同様に、現フレームについては複数のサブフレームごとのピッチゲインを求めてもよい。
ピッチゲイン計算部950の具体例2は、現フレームの入力信号XO(n) (n=0, 1, …, N-1)と1つ後のフレームの一部の入力信号XO(n) (n=N, N+1, …, N+Nn-1)(ただし、Nnは、Nn<Nという関係を満たす所定の正の整数。)とで、先読み部分を含む信号区間が現フレームの信号区間として構成されている場合であり、かつ、同一のフレームについては線形予測分析装置2よりも後にピッチゲイン計算部950が動作される場合、の例である。ピッチゲイン計算部950は、現フレームの信号区間について、現フレームの入力信号XO(n) (n=0, 1, …, N-1)と1つ後のフレームの一部の入力信号XO(n) (n=N, N+1, …, N+Nn-1)のそれぞれのピッチゲインであるGnow, Gnextを求め、ピッチゲインGnextをピッチゲイン計算部950に記憶する。ピッチゲイン計算部950は、また、1つ前のフレームの信号区間について求めてピッチゲイン計算部950に記憶されていたピッチゲインGnext、すなわち、1つ前のフレームの信号区間のうちの現フレームの一部の入力信号XO(n) (n=0, 1, …, Nn-1)について求めたピッチゲイン、を特定可能な情報をピッチゲインについての情報として出力する。なお、具体例1と同様に、現フレームについては複数のサブフレームごとのピッチゲインを求めてもよい。
<ピッチゲイン計算部950の具体例3>
ピッチゲイン計算部950の具体例3は、現フレームの入力信号XO(n) (n=0, 1, …, N-1)そのものが現フレームの信号区間として構成されている場合であり、かつ、同一のフレームについては線形予測分析装置2よりも後にピッチゲイン計算部950が動作される場合、の例である。ピッチゲイン計算部950は、現フレームの信号区間である現フレームの入力信号XO(n) (n=0, 1, …, N-1)のピッチゲインGを求め、ピッチゲインGをピッチゲイン計算部950に記憶する。ピッチゲイン計算部950は、また、1つ前のフレームの信号区間、すなわち、1つ前のフレームの入力信号XO(n) (n=-N, -N+1, …, -1)について求めてピッチゲイン計算部950に記憶されていたピッチゲインGを特定可能な情報をピッチゲインについての情報として出力する。
ピッチゲイン計算部950の具体例3は、現フレームの入力信号XO(n) (n=0, 1, …, N-1)そのものが現フレームの信号区間として構成されている場合であり、かつ、同一のフレームについては線形予測分析装置2よりも後にピッチゲイン計算部950が動作される場合、の例である。ピッチゲイン計算部950は、現フレームの信号区間である現フレームの入力信号XO(n) (n=0, 1, …, N-1)のピッチゲインGを求め、ピッチゲインGをピッチゲイン計算部950に記憶する。ピッチゲイン計算部950は、また、1つ前のフレームの信号区間、すなわち、1つ前のフレームの入力信号XO(n) (n=-N, -N+1, …, -1)について求めてピッチゲイン計算部950に記憶されていたピッチゲインGを特定可能な情報をピッチゲインについての情報として出力する。
以下、線形予測分析装置2の動作について説明する。図2は、線形予測分析装置2による線形予測分析方法のフローチャートである。
[自己相関計算部21]
自己相関計算部21は、入力されたNサンプルのフレーム毎の時間領域のディジタル音声信号やディジタル音響信号である入力信号XO(n)(n=0,1,…,N-1)から自己相関RO(i) (i=0,1,…,Pmax)を計算する(ステップS1)。Pmaxは、予測係数計算部23が求める線形予測係数に変換可能な係数の最大次数であり、N未満の所定の正の整数である。計算された自己相関RO(i) (i=0,1,…,Pmax)は、係数乗算部22に提供される。
自己相関計算部21は、入力されたNサンプルのフレーム毎の時間領域のディジタル音声信号やディジタル音響信号である入力信号XO(n)(n=0,1,…,N-1)から自己相関RO(i) (i=0,1,…,Pmax)を計算する(ステップS1)。Pmaxは、予測係数計算部23が求める線形予測係数に変換可能な係数の最大次数であり、N未満の所定の正の整数である。計算された自己相関RO(i) (i=0,1,…,Pmax)は、係数乗算部22に提供される。
自己相関計算部21は、入力信号XO(n)を用いて、例えば式(14A)により自己相関RO(i) (i=0,1,…,Pmax)を計算して出力する。すなわち、現在のフレームの入力時系列信号XO(n)とiサンプルだけ過去の入力時系列信号XO(n-i)との自己相関RO(i)を計算する。
または、自己相関計算部21は、入力信号XO(n)を用いて、例えば式(14B)により自己相関RO(i) (i=0,1,…,Pmax)を計算する。すなわち、現在のフレームの入力時系列信号XO(n)とiサンプルだけ未来の入力時系列信号XO(n+i)との自己相関RO(i)を計算する。
または、自己相関計算部21は、入力信号XO(n)に対応するパワースペクトルを求めてからWiener-Khinchinの定理に従って自己相関RO(i) (i=0,1,…,Pmax)を計算してもよい。また、何れの方法においても、入力信号XO(n) (n=-Np, -Np+1,…, -1, 0,1,…,N-1, N,…, N-1+Nn)というように前後のフレームの入力信号の一部も用いて自己相関RO(i)を計算してもよい。ここで、Np,Nnはそれぞれ、Np<N, Nn<Nという関係を満たす所定の正の整数である。もしくは、MDCT系列をパワースペクトルの近似として代用し、近似されたパワースペクトルから自己相関を求めてもよい。このように自己相関の算出方法は世の中で使われている公知技術の何れかを用いればよい。
[係数決定部24]
係数決定部24は、入力されたピッチゲインについての情報を用いて、係数wO(i) (i=0,1,…,Pmax)を決定する(ステップS4)。係数wO(i)は、自己相関RO(i)を変形するための係数である。係数wO(i)は、信号処理の分野においては、ラグ窓wO(i)又はラグ窓係数wO(i)とも呼ばれているものである。係数wO(i)は正の値であるので、係数wO(i)が所定の値よりも大きい/小さいことを、係数wO(i)の大きさが所定の値よりも大きい/小さいと表現することがある。また、wO(i)の大きさとは、そのwO(i)の値を意味するものとする。
係数決定部24は、入力されたピッチゲインについての情報を用いて、係数wO(i) (i=0,1,…,Pmax)を決定する(ステップS4)。係数wO(i)は、自己相関RO(i)を変形するための係数である。係数wO(i)は、信号処理の分野においては、ラグ窓wO(i)又はラグ窓係数wO(i)とも呼ばれているものである。係数wO(i)は正の値であるので、係数wO(i)が所定の値よりも大きい/小さいことを、係数wO(i)の大きさが所定の値よりも大きい/小さいと表現することがある。また、wO(i)の大きさとは、そのwO(i)の値を意味するものとする。
係数決定部24に入力されるピッチゲインについての情報は、現フレームの入力信号および/または現フレームの近傍のフレームの入力信号の全部または一部から求まったピッチゲインを特定する情報である。すなわち、係数wO(i)の決定に用いるピッチゲインは、現フレームの入力信号および/または現フレームの近傍のフレームの入力信号の全部または一部から求まったピッチゲインである。
係数決定部24は、0次からPmax次の全てまたは一部の次数について、ピッチゲインについての情報に対応するピッチゲインの取り得る範囲のうち全てまたは一部で、ピッチゲインについての情報に対応するピッチゲインが大きいほど小さな値を係数wO(0), wO(1), …, wO(Pmax)として決定する。また、係数決定部24は、ピッチゲインの代わりにピッチゲインと正の相関関係にある値を用いて、ピッチゲインが大きいほど小さな値を係数wO(0), wO(1), …, wO(Pmax)として決定してもよい。
すなわち、係数wO(i) (i=0,1,…,Pmax)は、少なくとも一部の予測次数iに対して、その次数iに対応する係数wO(i)の大きさが、現フレームの入力信号XO(n)の全部または一部を含む信号区間のピッチゲインと正の相関関係にある値の増加とともに単調減少する関係にある場合が含まれているように決定される。
言い換えれば、後述するように、次数iによっては、係数wO(i)の大きさがピッチゲインと正の相関関係にある値の増加とともに単調減少しなくてもよい。
また、ピッチゲインと正の相関関係にある値の取り得る範囲には、係数wO(i)の大きさがピッチゲインと正の相関関係にある値の増加に関わらず一定の範囲があってもよいが、その他の範囲では係数wO(i)の大きさがピッチゲインと正の相関関係にある値の増加とともに単調減少するものとする。
係数決定部24は、例えば、入力されたピッチゲインについての情報に対応するピッチゲインについての単調非増加関数を用いて、係数wO(i)を決定する。例えば、0より大きい予め定めた値であるαを用いた、以下の式(2)により係数wO(i)を決定する。式(2)において、Gは入力されたピッチゲインについての情報に対応するピッチゲインを意味する。αは、係数wO(i)をラグ窓としてとらえたときのラグ窓の幅、言い換えればラグ窓の強さを調整するための値である。予め定めるαは、例えば、複数のαの候補値について線形予測分析装置2を含む符号化装置とその符号化装置に対応する復号装置とで音声信号や音響信号を符号化復号して、復号音声信号や復号音響信号の主観品質や客観品質が良好である候補値をαとして選択することにより定めればよい。
または、ピッチゲインGについての予め定めた関数f(G)を用いた、以下の式(2A)により係数wO(i)を決定してもよい。関数f(G)は、f(G)=αG+β(αは正の数、βは任意の数)、f(G)=αG2+βG+γ(αは正の数、β、γは任意の数)などの、ピッチゲインGと正の相関関係、ピッチゲインGに対して単調非減少の関係となる関数である。
また、ピッチゲインGを用いて係数wO(i)を決定する式は、上述の(2), (2A)に限らず、ピッチゲインと正の相関関係にある値の増加に対して単調非増加の関係を記述できるものであれば他の式であってもよい。例えば、係数wO(i)を、以下の(3)から(6)の何れかの式により決定してもよい。以下の(3)から(6)の式において、aをピッチゲインに依存して決まる実数とし、mをピッチゲインに依存して決まる自然数とする。例えば、aをピッチゲインと負の相関関係にある値とし、mをピッチゲインと負の相関関係にある値とする。τはサンプリング周期である。
式(3)はBartlett windowと呼ばれる形式の窓関数であり、式(4)は二項係数により定義されるBinomial windowと呼ばれる形式の窓関数であり、式(5)はTriangular in frequency domain windowと呼ばれる形式の窓関数であり、式(6)はRectangular in frequency domain windowと呼ばれる形式の窓関数である。
式(3)はBartlett windowと呼ばれる形式の窓関数であり、式(4)は二項係数により定義されるBinomial windowと呼ばれる形式の窓関数であり、式(5)はTriangular in frequency domain windowと呼ばれる形式の窓関数であり、式(6)はRectangular in frequency domain windowと呼ばれる形式の窓関数である。
なお、0≦i≦Pmaxの各iではなく、少なくとも一部の次数iについてのみ、係数wO(i)がピッチゲインと正の相関関係にある値の増加とともに単調減少してもよい。言い換えれば、次数iによっては、係数wO(i)の大きさがピッチゲインと正の相関関係にある値の増加とともに単調減少しなくてもよい。
例えば、i=0の場合は、上述の式(2)から式(6)の何れかを用いて係数wO(0)の値を決定してもよいし、ITU-T G.718等でも用いられているようなwO(0)=1.0001,wO(0)=1.003といった、ピッチゲインと正の相関関係にある値には依存しない、経験的に得られた固定値を用いてもよい。すなわち、1≦i≦Pmaxの各iについては、係数wO(i)はピッチゲインと正の相関関係にある値が大きいほど小さな値を取るが、i=0の係数についてはこの限りではなく固定値を用いてもよい。
[係数乗算部22]
係数乗算部22は、係数決定部24で決定した係数wO(i) (i=0,1,…,Pmax)と、自己相関計算部21で求めた自己相関RO(i) (i=0,1,…,Pmax)とを同じiごとに乗じることにより、変形自己相関R'O(i) (i=0,1,…,Pmax)を求める(ステップS2)。すなわち、係数乗算部22は、以下の式(7)により自己相関R'O(i)を計算する。計算された自己相関R'O(i)は、予測係数計算部23に提供される。
係数乗算部22は、係数決定部24で決定した係数wO(i) (i=0,1,…,Pmax)と、自己相関計算部21で求めた自己相関RO(i) (i=0,1,…,Pmax)とを同じiごとに乗じることにより、変形自己相関R'O(i) (i=0,1,…,Pmax)を求める(ステップS2)。すなわち、係数乗算部22は、以下の式(7)により自己相関R'O(i)を計算する。計算された自己相関R'O(i)は、予測係数計算部23に提供される。
[予測係数計算部23]
予測係数計算部23は、係数乗算部22から出力された変形自己相関R'O(i)を用いて線形予測係数に変換可能な係数を求める(ステップS3)。
予測係数計算部23は、係数乗算部22から出力された変形自己相関R'O(i)を用いて線形予測係数に変換可能な係数を求める(ステップS3)。
例えば、予測係数計算部23は、係数乗算部22から出力された変形自己相関R'O(i)を用いて、Levinson-Durbin法などにより、1次から予め定めた最大次数であるPmax次までのPARCOR係数KO(1),KO(2),…,KO(Pmax)や線形予測係数aO(1),aO(2),…,aO(Pmax)を計算して出力する。
第一実施形態の線形予測分析装置2によれば、ピッチゲインと正の相関関係にある値に応じて、少なくとも一部の予測次数iに対して、その次数iに対応する係数wO(i)の大きさが、現フレームの入力信号XO(n)の全部または一部を含む信号区間のピッチゲインと正の相関関係にある値の増加とともに単調減少する関係にある場合が含まれている係数wO(i)を自己相関に乗算して変形自己相関を求めて線形予測係数に変換可能な係数を求めることにより、入力信号のピッチゲインが大きいときであってもピッチ成分に起因するスペクトルのピークの発生を抑えた線形予測係数に変換可能な係数を求めることができ、かつ、入力信号のピッチゲインが小さいときであってもスペクトル包絡を表現可能な線形予測係数に変換可能な係数を求めることができ、従来よりも分析精度の高い線形予測を実現することができる。したがって、第一実施形態の線形予測分析装置2を含む符号化装置とその符号化装置に対応する復号装置とで音声信号や音響信号を符号化復号して得られる復号音声信号や復号音響信号の品質は、従来の線形予測分析装置を含む符号化装置とその符号化装置に対応する復号装置とで音声信号や音響信号を符号化復号して得られる復号音声信号や復号音響信号の品質よりも、良い。
[第二実施形態]
第二実施形態は、現在又は過去のフレームにおける入力信号のピッチゲインと正の相関関係にある値と所定の閾値とを比較し、その比較結果に応じて係数wO(i)を決定するものである。第二実施形態は、係数決定部24における係数wO(i)の決定方法のみが第一実施形態と異なり、他の点については第一実施形態と同様である。以下、第一実施形態と異なる部分を中心に説明し、第一実施形態と同様の部分については重複説明を省略する。
第二実施形態は、現在又は過去のフレームにおける入力信号のピッチゲインと正の相関関係にある値と所定の閾値とを比較し、その比較結果に応じて係数wO(i)を決定するものである。第二実施形態は、係数決定部24における係数wO(i)の決定方法のみが第一実施形態と異なり、他の点については第一実施形態と同様である。以下、第一実施形態と異なる部分を中心に説明し、第一実施形態と同様の部分については重複説明を省略する。
第二実施形態の線形予測分析装置2の機能構成と線形予測分析装置2による線形予測分析方法のフローチャートは、第一実施形態と同じ図1と図2である。第二実施形態の線形予測分析装置2は、係数決定部24の処理が異なる部分以外は、第一実施形態の線形予測分析装置2と同じである。
第二実施形態の係数決定部24の処理の流れの例を図3に示す。第二実施形態の係数決定部24は、図3の各ステップS41A、ステップS42、ステップS43の処理を例えば行う。
係数決定部24は、入力されたピッチゲインについての情報に対応するピッチゲインと正の相関関係にある値と所定の閾値とを比較する(ステップS41A)。入力されたピッチゲインについての情報に対応するピッチゲインと正の相関関係にある値とは、例えば、入力されたピッチゲインについての情報に対応するピッチゲインそのものである。
係数決定部24は、ピッチゲインと正の相関関係にある値が所定の閾値以上である場合、すなわち、ピッチゲインが大きいと判断された場合には、予め定めた規則により係数wh(i)を決定し、この決定された係数wh(i) (i=0,1,…,Pmax)をwO(i) (i=0,1,…,Pmax)とする(ステップS42)。すなわち、wO(i)=wh(i)とする。
係数決定部24は、ピッチゲインと正の相関関係にある値が所定の閾値以上でない場合、すなわち、ピッチゲインが小さいと判断された場合には、予め定めた規則により係数wl(i)を決定し、この決定された係数wl(i) (i=0,1,…,Pmax)をwO(i) (i=0,1,…,Pmax)とする(ステップS43)。すなわち、wO(i)=wl(i)とする。
ここで、wh(i)とwl(i)は、少なくとも一部の各iについてwh(i)<wl(i)という関係を満たすよう決定する。または、wh(i)とwl(i)は、少なくとも一部の各iについてはwh(i)<wl(i)という関係を満たし、それ以外のiについてはwh(i)≦wl(i)という関係を満たすよう決定する。ここで、少なくとも一部の各iとは、例えば0以外のi(つまり、1≦i≦Pmax)のことである。例えば、wh(i)とwl(i)は、式(2)でピッチゲインGがG1であるときのwO(i)をwh(i)として求め、式(2)でピッチゲインGがG2(ただしG1>G2)であるときのwO(i)をwl(i)として求めるという予め定めた規則により求める。または、例えば、wh(i)とwl(i)は、式(2)でαがα1であるときのwO(i)をwh(i)として求め、式(2)でαがα2(ただしα1>α2)であるときのwO(i)をwl(i)として求めるという予め定めた規則により求める。この場合は、α1とα2は共に式(2)のαと同様に予め定めておく。なお、これらの何れかの規則により予め求めたwh(i) とwl(i)をテーブルに記憶しておき、ピッチゲインと正の相関関係にある値が所定の閾値以上であるか否かによりwh(i)とwl(i)の何れかをテーブルから選択する構成としてもよい。また、wh(i)とwl(i)のそれぞれは、iが大きくなるにつれてwh(i), wl(i)の値が小さくなるように決定される。なお、i=0の係数wh(i), wl(i)については、 wh(0)≦wl(0)の関係を満たしていることは必須ではなく、wh(0)>wl(0)の関係を満たす値を用いてもよい。
第二実施形態によっても、第一実施形態と同様に、入力信号のピッチゲインが大きいときであってもピッチ成分に起因するスペクトルのピークの発生を抑えた線形予測係数に変換可能な係数を求めることができ、かつ、入力信号のピッチゲインが小さいときであってもスペクトル包絡を表現可能な線形予測係数に変換可能な係数を求めることができ、従来よりも分析精度の高い線形予測を実現することができる。
<第二実施形態の変形例>
上述の第二実施形態では1個の閾値を用いて係数wO(i)を決定したが、第二実施形態の変形例は2個以上の閾値を用いて係数wO(i)を決定するものである。以下、2個の閾値th1,th2を用いて係数を決定する方法を例に挙げて説明する。閾値th1,th2は、0<th1<th2という関係を満たすとする。
上述の第二実施形態では1個の閾値を用いて係数wO(i)を決定したが、第二実施形態の変形例は2個以上の閾値を用いて係数wO(i)を決定するものである。以下、2個の閾値th1,th2を用いて係数を決定する方法を例に挙げて説明する。閾値th1,th2は、0<th1<th2という関係を満たすとする。
第二実施形態の変形例の線形予測分析装置2の機能構成は、第二実施形態と同じ図1である。第二実施形態の変形例の線形予測分析装置2は、係数決定部24の処理が異なる部分以外は、第二実施形態の線形予測分析装置2と同じである。
係数決定部24は、入力されたピッチゲインについての情報に対応するピッチゲインと正の相関関係にある値と、閾値th1,th2とを比較する。入力されたピッチゲインについての情報に対応するピッチゲインと正の相関関係にある値とは、例えば、入力されたピッチゲインについての情報に対応するピッチゲインそのものである。
係数決定部24は、ピッチゲインと正の相関関係にある値が閾値th2より大きい場合、すなわち、ピッチゲインが大きいと判断された場合には、予め定めた規則により係数wh(i) (i=0,1,…,Pmax)を決定し、この決定された係数wh(i) (i=0,1,…,Pmax)をwO(i) (i=0,1,…,Pmax)とする。すなわち、wO(i)=wh(i)とする。
係数決定部24は、ピッチゲインと正の相関関係にある値が閾値th1よりも大きく閾値th2以下の場合、すなわち、ピッチゲインが中程度と判断された場合には、予め定めた規則により係数wm(i) (i=0,1,…,Pmax)を決定し、この決定された係数wm(i) (i=0,1,…,Pmax)をwO(i) (i=0,1,…,Pmax)とする。すなわち、wO(i)=wm(i)とする。
係数決定部24は、ピッチゲインと正の相関関係にある値が閾値th1以下の場合、すなわち、ピッチゲインが小さいと判断された場合には、予め定めた規則により係数wl(i) (i=0,1,…,Pmax)を決定し、この決定された係数wl(i) (i=0,1,…,Pmax)をwO(i) (i=0,1,…,Pmax)とする。すなわち、wO(i)=wl(i)とする。
ここで、wh(i),wm(i),wl(i)は、少なくとも一部の各iについてwh(i)<wm(i)<wl(i)という関係を満たすよう決定するものとする。ここで、少なくとも一部の各iとは、例えば0以外の各i(つまり、1≦i≦Pmax)のことである。または、wh(i),wm(i),wl(i)は、少なくとも一部の各iについてwh(i)<wm(i)≦wl(i)、それ以外のiのうちの少なくとも一部の各iについてwh(i)≦wm(i)<wl(i)、残り少なくとも一部の各iについてwh(i)≦wm(i)≦wl(i)という関係を満たすよう決定する。例えば、wh(i), wm(i), wl(i)は、式(2)でピッチゲインGがG1であるときのwO(i)をwh(i)として求め、式(2)でピッチゲインGがG2(ただしG1>G2)であるときのwO(i)をwm(i)として求め、式(2)でピッチゲインGがG3(ただしG2>G3)であるときのwO(i)をwl(i)として求めるという予め定めた規則により求める。または、例えば、wh(i), wm(i), wl(i)は、式(2)でαがα1であるときのwO(i)をwh(i)として求め、式(2)でαがα2(ただしα1>α2)であるときのwO(i)をwm(i)として求め、式(2)でαがα3(ただしα2>α3)であるときのwO(i)をwl(i)として求めるという予め定めた規則により求める。この場合は、α1, α2, α3は式(2)のαと同様に予め定めておく。なお、これらの何れかの規則により予め求めたwh(i), wm(i), wl(i)をテーブルに記憶しておき、ピッチゲインと正の相関関係にある値と所定の閾値との比較によりwh(i), wm(i), wl(i)の何れかをテーブルから選択する構成としてもよい。
なお、wh(i)とwl(i)を用いて、その間の係数wm(i)を決定しても良い。すなわち、wm(i)=β'×wh(i)+(1-β')×wl(i)によりwm(i)を決定しても良い。ここでβ'は、0≦β'≦1であり、かつ、ピッチゲインGが小さい値をとるときはβ'の値も小さくなり、ピッチゲインGが大きい値をとるときにβ'の値も大きくなる関数β'=c(G)により、ピッチゲインGから求める値である。このようにwm(i)を求めれば、係数決定部24にはwh(i) (i=0,1,…,Pmax)を記憶したテーブルとwl(i) (i=0,1,…,Pmax)を記憶したテーブルの2つのテーブルだけを記憶しておくことで、ピッチゲインが中程度の場合のうちのピッチゲインが大きいときにはwh(i)に近い係数を得ることができ、逆にピッチゲインが中程度の場合のうちのピッチゲインが小さいときにはwl(i)に近い係数を得ることができる。また、wh(i), wm(i), wl(i)は、iが大きくなるにつれてそれぞれwh(i), wm(i), wl(i)の値が小さくなるよう決定される。なお、i=0の係数wh(0), wm(0), wl(0)については、wh(0)≦wm(0)≦wl(0)の関係を満たしていることは必須ではなく、wh(0)>wm(0)または/およびwm(0)>wl(0)の関係を満たす値を用いてもよい。
第二実施形態の変形例によっても、第二実施形態と同様に、入力信号のピッチゲインが大きいときであってもピッチ成分に起因するスペクトルのピークの発生を抑えた線形予測係数に変換可能な係数を求めることができ、かつ、入力信号のピッチゲインが小さいときであってもスペクトル包絡を表現可能な線形予測係数に変換可能な係数を求めることができ、従来よりも分析精度の高い線形予測を実現することができる。
[第三実施形態]
第三実施形態は、複数個の係数テーブルを用いて係数wO(i)を決定するものである。第三実施形態は、係数決定部24における係数wO(i)の決定方法のみが第一実施形態と異なり、他の点については第一実施形態と同様である。以下、第一実施形態と異なる部分を中心に説明し、第一実施形態と同様の部分については重複説明を省略する。
第三実施形態は、複数個の係数テーブルを用いて係数wO(i)を決定するものである。第三実施形態は、係数決定部24における係数wO(i)の決定方法のみが第一実施形態と異なり、他の点については第一実施形態と同様である。以下、第一実施形態と異なる部分を中心に説明し、第一実施形態と同様の部分については重複説明を省略する。
第三実施形態の線形予測分析装置2は、係数決定部24の処理が異なり、図4に例示するように、係数テーブル記憶部25を更に備えている部分以外は、第一実施形態の線形予測分析装置2と同じである。係数テーブル記憶部25には、2個以上の係数テーブルが記憶されている。
第三実施形態の係数決定部24の処理の流れの例を図5に示す。第三実施形態の係数決定部24は、図5のステップS44、ステップS45の処理を例えば行う。
まず、係数決定部24は、入力されたピッチゲインについての情報に対応するピッチゲインと正の相関関係にある値を用いて、係数テーブル記憶部25に記憶された2個以上の係数テーブルから、そのピッチゲインと正の相関関係にある値に応じた1個の係数テーブルtを選択する(ステップS44)。例えば、ピッチゲインについての情報に対応するピッチゲインと正の相関関係にある値は、ピッチゲインについての情報に対応するピッチゲインである。
例えば、係数テーブル記憶部25に、異なる2個の係数テーブルt0, t1が記憶されており、係数テーブルt0には係数wt0(i) (i=0,1,…,Pmax)が格納されており、係数テーブルt1には係数wt1(i) (i=0,1,…,Pmax)が格納されているとする。2個の係数テーブルt0, t1のそれぞれには、少なくとも一部の各iについてwt0(i)<wt1(i)であり、残りの各iについてwt0(i)≦wt1(i)となるように定められた係数wt0(i) (i=0,1,…,Pmax)と係数wt1(i) (i=0,1,…,Pmax)が格納されている。
このとき、係数決定部24は、入力されたピッチゲインについての情報により特定されるピッチゲインと正の相関関係にある値が所定の閾値以上であれば係数テーブルt0を係数テーブルtとして選択し、そうでない場合には係数テーブルt1を係数テーブルtとして選択する。すなわち、ピッチゲインと正の相関関係にある値が所定の閾値以上である場合、すなわち、ピッチゲインが大きいと判断された場合には、各iについての係数が小さい方の係数テーブルを選択し、ピッチゲインと正の相関関係にある値が所定の閾値より小さい場合、すなわちピッチゲインが小さいと判断された場合には、各iについての係数が大きい方の係数テーブルを選択する。
言い換えれば、係数テーブル記憶部25に記憶されている2個の係数テーブルの中の、ピッチゲインと正の相関関係にある値が第一値である場合に係数決定部24により選択される係数テーブルを第一係数テーブルとし、係数テーブル記憶部25に記憶されている2個の係数テーブルの中の、ピッチゲインと正の相関関係にある値が第一値よりも小さい第二値である場合に係数決定部24により選択される係数テーブルを第二係数テーブルとして、少なくとも一部の各次数iに対して、第二係数テーブルにおける各次数iに対応する係数の大きさは、第一係数テーブルにおける各次数iに対応する係数の大きさよりも大きい。
なお、係数テーブル記憶部25に記憶されている係数テーブルt0, t1のi=0の係数wt0(0), wt1(0)については、wt0(0)≦wt1(0)の関係を満たしていることは必須ではなく、wt0(0)>wt1(0)の関係にある値であってもよい。
また、例えば、係数テーブル記憶部25に、異なる3個の係数テーブルt0, t1, t2が記憶されて、係数テーブルt0には係数wt0(i) (i=0,1,…,Pmax)が格納されており、係数テーブルt1には係数wt1(i) (i=0,1,…,Pmax) 、係数テーブルt2には係数wt2(i) (i=0,1,…,Pmax)が格納されているとする。3個の係数テーブルt0, t1, t2のそれぞれには、少なくとも一部の各iについてwt0(i)<wt1(i)≦wt2(i)であり、それ以外のiのうちの少なくとも一部の各iについてwt0(i)≦wt1(i)<wt2(i)であり、残りの各iについてwt0(i)≦wt1(i)≦wt2(i)となるように定められた係数wt0(i) (i=0,1,…,Pmax)と係数wt1(i) (i=0,1,…,Pmax) と係数wt2(i) (i=0,1,…,Pmax)が格納されている。
ここで、0<th1<th2という関係を満たす2個の閾値th1,th2が定められているとする。このとき、係数決定部24は、
(1) ピッチゲインと正の相関関係にある値>th2の場合、すなわち、ピッチゲインが大きいと判断された場合には、係数テーブルt0を係数テーブルtとして選択し、
(2) th2≧ ピッチゲインと正の相関関係にある値>th1の場合、すなわち、ピッチゲインが中程度であると判断された場合には、係数テーブルt1を係数テーブルtとして選択し、
(3) th1≧ ピッチゲインと正の相関関係にある値の場合、すなわち、ピッチゲインが小さいと判断された場合には、係数テーブルt2を係数テーブルtとして選択する。
(1) ピッチゲインと正の相関関係にある値>th2の場合、すなわち、ピッチゲインが大きいと判断された場合には、係数テーブルt0を係数テーブルtとして選択し、
(2) th2≧ ピッチゲインと正の相関関係にある値>th1の場合、すなわち、ピッチゲインが中程度であると判断された場合には、係数テーブルt1を係数テーブルtとして選択し、
(3) th1≧ ピッチゲインと正の相関関係にある値の場合、すなわち、ピッチゲインが小さいと判断された場合には、係数テーブルt2を係数テーブルtとして選択する。
なお、係数テーブル記憶部25に記憶されている係数テーブルt0, t1, t2のi=0の係数wt0(0), wt1(0), wt2(0)については、wt0(0)≦wt1(0)≦wt2(0)の関係を満たしていることは必須ではなく、wt0(0)>wt1(0)または/およびwt1(0)>wt2(0)の関係にある値であってもよい。
そして、係数決定部24は、その選択された係数テーブルtに格納された各次数iの係数wt(i)を係数wO(i)とする(ステップS45)。すなわち、wO(i)=wt(i)とする。言い換えれば、係数決定部24は、選択された係数テーブルtから各次数iに対応する係数wt(i)を取得し、取得された各次数iに対応する係数wt(i)をwO(i)とする。
第三実施形態では、第一実施形態及び第二実施形態とは異なり、ピッチゲインと正の相関関係にある値の式に基づいて係数wO(i)を計算する必要がないため、より少ない演算処理量でwO(i)を決定することができる。
<第三実施形態の具体例>
以下、第三実施形態の具体例について説明する。線形予測分析装置2には、ハイパスフィルタを通り、12.8 kHzにサンプリング変換され、プリエンファシス処理をされた1フレームあたりNサンプルのディジタル音響信号である入力信号XO(n) (n=0,1,…,N-1)と、ピッチゲインについての情報として現フレームの一部の入力信号XO(n) (n=0, 1, …, Nn)(ただし、Nnは、Nn<Nという関係を満たす所定の正の整数。)についてピッチゲイン計算部950で求めたピッチゲインGとが入力される。現フレームの一部の入力信号XO(n) (n=0, 1, …, Nn)についてのピッチゲインGは、ピッチゲイン計算部950において当該入力信号の1つ前のフレームの信号区間として現フレームの一部の入力信号XO(n) (n=0, 1, …, Nn)を含めておき、1つ前のフレームの信号区間に対するピッチゲイン計算部950の処理においてXO(n) (n=0, 1, …, Nn)に対して計算し記憶したピッチゲインである。
以下、第三実施形態の具体例について説明する。線形予測分析装置2には、ハイパスフィルタを通り、12.8 kHzにサンプリング変換され、プリエンファシス処理をされた1フレームあたりNサンプルのディジタル音響信号である入力信号XO(n) (n=0,1,…,N-1)と、ピッチゲインについての情報として現フレームの一部の入力信号XO(n) (n=0, 1, …, Nn)(ただし、Nnは、Nn<Nという関係を満たす所定の正の整数。)についてピッチゲイン計算部950で求めたピッチゲインGとが入力される。現フレームの一部の入力信号XO(n) (n=0, 1, …, Nn)についてのピッチゲインGは、ピッチゲイン計算部950において当該入力信号の1つ前のフレームの信号区間として現フレームの一部の入力信号XO(n) (n=0, 1, …, Nn)を含めておき、1つ前のフレームの信号区間に対するピッチゲイン計算部950の処理においてXO(n) (n=0, 1, …, Nn)に対して計算し記憶したピッチゲインである。
係数決定部24に、ピッチゲインについての情報であるピッチゲインGが入力される。
係数テーブル記憶部25には、係数テーブルt0と、係数テーブルt1と、係数テーブルt2とが記憶されているものとする。
係数テーブルt0、式(13)の従来法のf0=60Hzの係数テーブルであり、各次数の係数wtO(i)が次のように定められている。
wt0(i)=[1.0001, 0.999566371, 0.998266613, 0.996104103, 0.993084457, 0.989215493, 0.984507263, 0.978971839, 0.972623467, 0.96547842, 0.957554817, 0.948872864, 0.939454317, 0.929322779, 0.918503404, 0.907022834, 0.894909143]
係数テーブルt1は、式(13)の従来法のf0=40Hzのテーブルであり、各次数の係数wt1(i)が次のように定められている。
係数テーブルt1は、式(13)の従来法のf0=40Hzのテーブルであり、各次数の係数wt1(i)が次のように定められている。
wt1(i)=[1.0001, 0.999807253, 0.99922923, 0.99826661, 0.99692050, 0.99519245, 0.99308446, 0.99059895, 0.98773878, 0.98450724, 0.98090803, 0.97694527, 0.97262346, 0.96794752, 0.96292276, 0.95755484, 0.95184981]
係数テーブルt2は、式(13)の従来法のf0=20Hzのテーブルであり、各次数の係数wt2(i)が次のように定められている。
係数テーブルt2は、式(13)の従来法のf0=20Hzのテーブルであり、各次数の係数wt2(i)が次のように定められている。
wt2(i)=[1.0001, 0.99995181, 0.99980725, 0.99956637, 0.99922923, 0.99879594, 0.99826661, 0.99764141, 0.99692050, 0.99610410, 0.99519245, 0.99418581, 0.99308446, 0.99188872, 0.99059895, 0.98921550, 0.98773878]
ここで、上述のwtO(i), wt1(i), wt2(i)のリストは、Pmax=16として、i=0,1,2,…,16の順に左からiに対応する係数の大きさを並べたものである。すなわち上述の例では、例えばwt0(0)=1.0001であり、wt0(3)=0.996104103である。
ここで、上述のwtO(i), wt1(i), wt2(i)のリストは、Pmax=16として、i=0,1,2,…,16の順に左からiに対応する係数の大きさを並べたものである。すなわち上述の例では、例えばwt0(0)=1.0001であり、wt0(3)=0.996104103である。
図6に係数テーブルt0,t1,t2の係数wt0(i), wt1(i), wt2(i)の大きさをグラフで表す。図6のグラフの点線は係数テーブルt0の係数wt0(i)の大きさを表し、図6のグラフの一点鎖線は係数テーブルt1の係数wt1(i)の大きさを表し、図6のグラフの実線は係数テーブルt2の係数wt2(i)の大きさを表す。図6のグラフの横軸は次数iを意味し、図6のグラフの縦軸は係数の大きさを表す。このグラフからも分かるように、各係数テーブル内では、iの値が大きくなるにしたがって、係数の大きさが単調減少する関係にある。また、同じiの値に対応する異なる係数テーブルの係数の大きさを比較すると、0を除くi≧1のiに対して、言い換えれば少なくとも一部のiについて、wt0(i)<wt1(i)<wt2(i)の関係を満たしている。係数テーブル記憶部25に記憶される複数の係数テーブルは、このような関係を持つものであれば、上述の例に限らない。
また、非特許文献1や非特許文献2に記載されているように、i=0の係数だけ特別扱いをして、wt0(0)=wt1(0)=wt2(0)=1.0001やwt0(0)=wt1(0)=wt2(0)=1.003という経験的な値を用いてもよい。なお、i=0についてはwt0(i)<wt1(i)<wt2(i)の関係を満たしている必要はなく、また、wt0(0),wt1(0),wt2(0)が必ずしも同じ値でなくともよい。例えば、wt0(0)=1.0001, wt1(0)=1.0, wt2(0)=1.0のように、i=0に関してのみwt0(0), wt1(0), wt2(0)のうちの2つ以上の値の大小関係がwt0(i)<wt1(i)<wt2(i)の関係を満たさなくてもよい。
上述の係数テーブルt0は式(13)においてf0=60Hz, fs=12.8kHzとした場合、係数テーブルt1は式(13)においてf0=40Hz, fs=12.8kHzとした場合、係数テーブルt2は式(13)においてf0=20Hzとした場合の係数値に相当するが、これらはそれぞれ、式(2A)においてf(G)=60, fs=12.8kHzとした場合の係数値、f(G)=40, fs=12.8kHzとした場合、f(G)=20, fs=12.8kHzとした場合、に相当し、式(2A)における関数f(G)はピッチゲインGと正の相関関係にある関数である。つまり、3つの係数テーブルの係数値を予め定める際に、予め定めた3つのピッチゲインを用いて式(2A)により係数値を求めることに代えて、予め定めた3つのf0を用いて式(13)により係数値を求めてもよい。
係数決定部24は、入力されたピッチゲインGを所定の閾値th1=0.3及び閾値th2=0.6と比較し、G≦0.3の場合は係数テーブルt2を、0.3<G≦0.6の場合は係数テーブルt1を、0.6<Gの場合は係数テーブルt0を選択する。
そして、係数決定部24は、その選択された係数テーブルtの各係数wt(i)を係数wO(i)とする。すなわち、wO(i)=wt(i)とする。言い換えれば、係数決定部24は、選択された係数テーブルtから各次数iに対応する係数wt(i)を取得し、取得された各次数iに対応する係数wt(i)をwO(i)とする。
<第三実施形態の変形例>
第三実施形態では複数個の係数テーブルのうち何れか1つのテーブルに記憶された係数を係数wO(i)として決定したが、第三実施形態の変形例はこれに加えて複数個の係数テーブルに記憶された係数に基づく演算処理により係数wO(i)を決定する場合を含む。
第三実施形態では複数個の係数テーブルのうち何れか1つのテーブルに記憶された係数を係数wO(i)として決定したが、第三実施形態の変形例はこれに加えて複数個の係数テーブルに記憶された係数に基づく演算処理により係数wO(i)を決定する場合を含む。
第三実施形態の変形例の線形予測分析装置2の機能構成は、第三実施形態と同じ図4である。第三実施形態の変形例の線形予測分析装置2は、係数決定部24の処理が異なり、係数テーブル記憶部25に含まれる係数テーブルが異なる部分以外は、第三実施形態の線形予測分析装置2と同じである。
係数テーブル記憶部25には、係数テーブルt0とt2のみが記憶されており、係数テーブルt0には係数wt0(i) (i=0,1,…,Pmax)が格納されており、係数テーブルt2には係数wt2(i) (i=0,1,…,Pmax)が格納されている。2個の係数テーブルt0, t2のそれぞれには、少なくとも一部の各iについてwt0(i)<wt2(i)であり、残りの各iについてwt0(i)≦wt2(i)となるように定められた係数wt0(i) (i=0,1,…,Pmax)と係数wt2(i) (i=0,1,…,Pmax)が格納されている。
ここで、0<th1<th2という関係を満たす2個の閾値th1,th2が定められているとする。このとき、係数決定部24は、
(1) ピッチゲインと正の相関関係にある値>th2の場合、すなわち、ピッチゲインが大きいと判断された場合には、係数テーブルt0の各係数wt0(i)を係数wO(i)として選択し、
(2) th2≧ピッチゲインと正の相関関係にある値>th1の場合、すなわち、ピッチゲインが中程度であると判断された場合には、係数テーブルt0の各係数wt0(i)と係数テーブルt2の各係数wt2(i)とを用いて、wO(i)=β'×wt0(i)+(1-β')×wt2(i)により係数wO(i)を決定し、
(3) th1≧ピッチゲインと正の相関関係にある値の場合、すなわち、ピッチゲインが小さいと判断された場合には、係数テーブルt2の各係数wt2(i)を係数wO(i)として選択する。
(1) ピッチゲインと正の相関関係にある値>th2の場合、すなわち、ピッチゲインが大きいと判断された場合には、係数テーブルt0の各係数wt0(i)を係数wO(i)として選択し、
(2) th2≧ピッチゲインと正の相関関係にある値>th1の場合、すなわち、ピッチゲインが中程度であると判断された場合には、係数テーブルt0の各係数wt0(i)と係数テーブルt2の各係数wt2(i)とを用いて、wO(i)=β'×wt0(i)+(1-β')×wt2(i)により係数wO(i)を決定し、
(3) th1≧ピッチゲインと正の相関関係にある値の場合、すなわち、ピッチゲインが小さいと判断された場合には、係数テーブルt2の各係数wt2(i)を係数wO(i)として選択する。
ここでβ'は、0≦β'≦1であり、ピッチゲインGが小さい値をとるときはβ'の値も小さくなり、ピッチゲインGが大きい値をとるときにβ'の値も大きくなる関数β'=c(G)により、ピッチゲインGから求める値である。この構成とすれば、ピッチゲインが中程度の場合のうちのピッチゲインGが小さい時にはwt2(i)に近い値を係数wO(i)とすることができ、逆にピッチゲインが中程度の場合のうちのピッチゲインGが大きい時にはwt0(i)に近い値を係数wO(i)とすることができるので、2つのテーブルだけで、3個以上の係数wO(i)を得ることができる。
なお、係数テーブル記憶部25に記憶されている係数テーブルt0, t2のi=0の係数wt0(0), wt2(0)については、wt0(0)≦wt2(0)の関係を満たしていることは必須ではなく、wt0(0)>wt2(0)の関係にある値であってもよい。
[第一実施形態から第三実施形態に共通の変形例]
図7及び図8に示すように、上述の全ての実施形態及び変形例において、係数乗算部22を含まず、予測係数計算部23において係数wO(i)と自己相関RO(i)とを用いて線形予測分析を行ってもよい。図7と図8は、それぞれ図1と図4に対応する線形予測分析装置2の構成例である。この場合は、予測係数計算部23は、図9のステップS5において、係数wO(i)と自己相関RO(i)とが乗算されたものである変形自己相関R'O(i)ではなく、係数wO(i)と自己相関RO(i)とを直接用いて線形予測分析を行う(ステップS5)。
図7及び図8に示すように、上述の全ての実施形態及び変形例において、係数乗算部22を含まず、予測係数計算部23において係数wO(i)と自己相関RO(i)とを用いて線形予測分析を行ってもよい。図7と図8は、それぞれ図1と図4に対応する線形予測分析装置2の構成例である。この場合は、予測係数計算部23は、図9のステップS5において、係数wO(i)と自己相関RO(i)とが乗算されたものである変形自己相関R'O(i)ではなく、係数wO(i)と自己相関RO(i)とを直接用いて線形予測分析を行う(ステップS5)。
[第四実施形態]
第四実施形態は、入力信号XO(n)に対して従来の線形予測分析装置を用いて線形予測分析を行い、その線形予測分析の結果を用いてピッチゲイン計算部でピッチゲインを得て、得られたピッチゲインに基づく係数wO(i)を用いて本発明の線形予測分析装置により線形予測係数に変換可能な係数を求めるものである。
第四実施形態は、入力信号XO(n)に対して従来の線形予測分析装置を用いて線形予測分析を行い、その線形予測分析の結果を用いてピッチゲイン計算部でピッチゲインを得て、得られたピッチゲインに基づく係数wO(i)を用いて本発明の線形予測分析装置により線形予測係数に変換可能な係数を求めるものである。
第四実施形態の線形予測分析装置3は、図10に示すように、第一線形予測分析部31、線形予測残差計算部32、ピッチゲイン計算部36、第二線形予測分析部34を例えば備えている。
[第一線形予測分析部31]
第一線形予測分析部31は、従来の線形予測分析装置1と同じ動作をする。すなわち、第一線形予測分析部31は、入力信号XO(n)から自己相関RO(i) (i=0,1,…,Pmax)を求め、自己相関RO(i) (i=0,1,…,Pmax)と予め定めた係数wO(i) (i=0,1,…,Pmax)とを同じiごとに乗じることにより変形自己相関R' O(i) (i=0,1,…,Pmax)を求め、変形自己相関R' O(i) (i=0,1,…,Pmax)から1次から予め定めた最大次数であるPmax次までの線形予測係数に変換可能な係数を求める。
第一線形予測分析部31は、従来の線形予測分析装置1と同じ動作をする。すなわち、第一線形予測分析部31は、入力信号XO(n)から自己相関RO(i) (i=0,1,…,Pmax)を求め、自己相関RO(i) (i=0,1,…,Pmax)と予め定めた係数wO(i) (i=0,1,…,Pmax)とを同じiごとに乗じることにより変形自己相関R' O(i) (i=0,1,…,Pmax)を求め、変形自己相関R' O(i) (i=0,1,…,Pmax)から1次から予め定めた最大次数であるPmax次までの線形予測係数に変換可能な係数を求める。
[線形予測残差計算部32]
線形予測残差計算部32は、入力信号XO(n)に対して、1次からPmax次までの線形予測係数に変換可能な係数に基づく線形予測や線形予測と等価なまたは類似したフィルタリング処理を行って線形予測残差信号XR(n)を求める。フィルタリング処理は重み付け処理とも言えるので、線形予測残差信号XR(n)は重み付け入力信号であるともいえる。
線形予測残差計算部32は、入力信号XO(n)に対して、1次からPmax次までの線形予測係数に変換可能な係数に基づく線形予測や線形予測と等価なまたは類似したフィルタリング処理を行って線形予測残差信号XR(n)を求める。フィルタリング処理は重み付け処理とも言えるので、線形予測残差信号XR(n)は重み付け入力信号であるともいえる。
[ピッチゲイン計算部36]
ピッチゲイン計算部36は、線形予測残差信号XR(n)のピッチゲインGを求め、ピッチゲインについての情報を出力する。ピッチゲインを求める方法としては、様々な公知の方法が存在するので、公知の何れの方法を用いてもよい。ピッチゲイン計算部36は、例えば、現フレームの線形予測残差信号XR (n) (n=0, 1, …, N-1)を構成する複数個のサブフレームのそれぞれについてピッチゲインを求める。すなわち、2以上の整数であるM個のサブフレームであるXRs1(n) (n=0, 1, …, N/M-1), …, XRsM(n) (n=(M-1)N/M, (M-1)N/M+1, …, N-1)のそれぞれのピッチゲインであるGs1, …, GsMを求める。NはMで割り切れるとする。ピッチゲイン計算部36は、次に、現フレームを構成するM個のサブフレームのピッチゲインであるGs1, …, GsMのうちの最大値max(Gs1, …, GsM)を特定可能な情報をピッチゲインについての情報として出力する。
ピッチゲイン計算部36は、線形予測残差信号XR(n)のピッチゲインGを求め、ピッチゲインについての情報を出力する。ピッチゲインを求める方法としては、様々な公知の方法が存在するので、公知の何れの方法を用いてもよい。ピッチゲイン計算部36は、例えば、現フレームの線形予測残差信号XR (n) (n=0, 1, …, N-1)を構成する複数個のサブフレームのそれぞれについてピッチゲインを求める。すなわち、2以上の整数であるM個のサブフレームであるXRs1(n) (n=0, 1, …, N/M-1), …, XRsM(n) (n=(M-1)N/M, (M-1)N/M+1, …, N-1)のそれぞれのピッチゲインであるGs1, …, GsMを求める。NはMで割り切れるとする。ピッチゲイン計算部36は、次に、現フレームを構成するM個のサブフレームのピッチゲインであるGs1, …, GsMのうちの最大値max(Gs1, …, GsM)を特定可能な情報をピッチゲインについての情報として出力する。
[第二線形予測分析部34]
第二線形予測分析部34は、本発明の第一実施形態から第三実施形態及びこれらの変形例の線形予測分析装置2の何れかと同じ動作をする。すなわち、第二線形予測分析部34は、入力信号XO(n)から自己相関RO(i) (i=0,1,…,Pmax)を求め、ピッチゲイン計算部36が出力したピッチゲインについての情報に基づいて係数wO(i) (i=0,1,…,Pmax)を決定し、自己相関RO(i) (i=0,1,…,Pmax)と決定した係数wO(i) (i=0,1,…,Pmax)とを用いて変形自己相関R' O(i) (i=0,1,…,Pmax)から1次から予め定めた最大次数であるPmax次までの線形予測係数に変換可能な係数を求める。
第二線形予測分析部34は、本発明の第一実施形態から第三実施形態及びこれらの変形例の線形予測分析装置2の何れかと同じ動作をする。すなわち、第二線形予測分析部34は、入力信号XO(n)から自己相関RO(i) (i=0,1,…,Pmax)を求め、ピッチゲイン計算部36が出力したピッチゲインについての情報に基づいて係数wO(i) (i=0,1,…,Pmax)を決定し、自己相関RO(i) (i=0,1,…,Pmax)と決定した係数wO(i) (i=0,1,…,Pmax)とを用いて変形自己相関R' O(i) (i=0,1,…,Pmax)から1次から予め定めた最大次数であるPmax次までの線形予測係数に変換可能な係数を求める。
<ピッチゲインと正の相関関係にある値について>
第一実施形態においてピッチゲイン計算部950の具体例2として説明した通り、ピッチゲインと正の相関関係にある値として、前のフレームの信号処理においてLook-aheadとも呼ばれる先読みして利用するサンプル部分のうち現フレームのサンプルに対応する部分のピッチゲインを用いてもよい。
第一実施形態においてピッチゲイン計算部950の具体例2として説明した通り、ピッチゲインと正の相関関係にある値として、前のフレームの信号処理においてLook-aheadとも呼ばれる先読みして利用するサンプル部分のうち現フレームのサンプルに対応する部分のピッチゲインを用いてもよい。
また、ピッチゲインと正の相関関係にある値として、ピッチゲインの推定値を用いてもよい。例えば、過去の複数フレームのピッチゲインから予測される現在のフレームについてのピッチゲインの推定値や、過去の複数フレームについてのピッチゲインの平均値や最小値や最大値や重み付線形和を、ピッチゲインの推定値として用いてもよい。また、複数サブフレームについてのピッチゲインの平均値や最小値や最大値や重み付線形和を、ピッチゲインの推定値として用いてもよい。
また、ピッチゲインと正の相関関係にある値として、ピッチゲインの量子化値を用いてもよい。すなわち、量子化前のピッチゲインを用いてもよいし、量子化後のピッチゲインを用いてもよい。
なお、上記の各実施形態及び各変形例のピッチゲインと正の相関関係にある値と閾値との比較においては、ピッチゲインと正の相関関係にある値が閾値と同じ値である場合には、閾値を境として隣接する二つの場合の何れか一方に場合分けされるように設定すればよい。すなわち、ある閾値以上の場合としているところを当該閾値より大きい場合とするとともに、当該閾値より小さい場合としているところを当該閾値以下の場合としてもよい。また、ある閾値より大きい場合としているところを当該閾値以上の場合とするとともに、当該閾値以下の場合としているところを当該閾値より小さい場合としてもよい。
上記装置及び方法において説明した処理は、記載の順にしたがって時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。
また、線形予測分析方法における各ステップをコンピュータによって実現する場合、線形予測分析方法が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、その各ステップがコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。
また、各処理手段は、コンピュータ上で所定のプログラムを実行させることにより構成することにしてもよいし、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。
その他、この発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。
Claims (6)
- 入力時系列信号に対応する線形予測係数に変換可能な係数を、所定時間区間であるフレームごとに求める、線形予測分析方法であって、
少なくともi=0,1,…,Pmaxのそれぞれについて、現在のフレームの入力時系列信号XO(n)とiサンプルだけ過去の入力時系列信号XO(n-i)またはiサンプルだけ未来の入力時系列信号XO(n+i)との自己相関RO(i)を計算する自己相関計算ステップと、
係数と前記自己相関RO(i)とが対応するiごとに乗算されたものである変形自己相関R' O(i)を用いて、1次からPmax次までの線形予測係数に変換可能な係数を求める予測係数計算ステップと、を含み、
係数テーブルt0には係数wt0(i)が格納されており、係数テーブルt1には係数wt1(i)が格納されており、係数テーブルt2には係数wt2(i)が格納されているとして、現在又は過去のフレームにおける入力時系列信号の周期性の強さ又は入力時系列信号に基づくピッチゲインと正の相関関係にある値を用いて前記係数テーブルt0,t1,t2の中の1個の係数テーブルから係数を取得する係数決定ステップを更に含み、
前記周期性の強さ又はピッチゲインと正の相関関係にある値に応じて、周期性の強さ又はピッチゲインが大きい場合、周期性の強さ又はピッチゲインが中程度の場合、周期性の強さ又はピッチゲインが小さい場合の何れかの場合に分類されるとし、周期性の強さ又はピッチゲインが大きい場合に前記係数決定ステップで係数が取得される係数テーブルを係数テーブルt0とし、周期性の強さ又はピッチゲインが中程度の場合に前記係数決定ステップで係数が取得される係数テーブルを係数テーブルt1とし、周期性の強さ又はピッチゲインが小さい場合に前記係数決定ステップで係数が取得される係数テーブルを係数テーブルt2として、i=0以外のiのうちの少なくとも一部のiについてwt0(i)<wt1(i)≦wt2(i)であり、i=0以外のiのうちの前記以外のiのうちの少なくとも一部の各iについてwt0(i)≦wt1(i)<wt2(i)であり、i=0以外のiのうちの残りの各iについてwt0(i)≦wt1(i)≦wt2(i)である、
線形予測分析方法。 - 入力時系列信号に対応する線形予測係数に変換可能な係数を、所定時間区間であるフレームごとに求める、線形予測分析方法であって、
少なくともi=0,1,…,Pmaxのそれぞれについて、現在のフレームの入力時系列信号XO(n)とiサンプルだけ過去の入力時系列信号XO(n-i)またはiサンプルだけ未来の入力時系列信号XO(n+i)との自己相関RO(i) を計算する自己相関計算ステップと、
係数と前記自己相関RO(i)とが対応するiごとに乗算されたものである変形自己相関R'O(i)を用いて、1次からPmax次までの線形予測係数に変換可能な係数を求める予測係数計算ステップと、を含み、
係数テーブルt0には係数wt0(i)が格納されており、係数テーブルt2には係数wt2(i)が格納されているとして、現在又は過去のフレームにおける入力時系列信号の周期性の強さ又は入力時系列信号に基づくピッチゲインと正の相関関係にある値を用いて前記係数テーブルt0,t2の少なくとも何れかの係数テーブルから係数を取得する係数決定ステップを更に含み、
前記周期性の強さ又はピッチゲインと正の相関関係にある値に応じて、周期性の強さ又はピッチゲインが大きい場合、周期性の強さ又はピッチゲインが中程度の場合、周期性の強さ又はピッチゲインが小さい場合の何れかの場合に分類されるとし、周期性の強さ又はピッチゲインが大きい場合に前記係数決定ステップで係数が取得される係数テーブルを係数テーブルt0とし、周期性の強さ又はピッチゲインが小さい場合に前記係数決定ステップで係数が取得される係数テーブルを係数テーブルt2として、i=0以外のiのうちの少なくとも一部のiについてwt0(i)<wt2(i)であり、i=0以外のiのうちの残りの各iについてwt0(i)≦wt2(i)であり、
前記係数決定ステップは、周期性の強さ又はピッチゲインが中程度の場合には、i=0以外の各iについて、w0(i)=β’×wt0(i)+(1-β’)×wt2(i) (ただし0≦β’≦1)である係数を決定する、
線形予測分析方法。 - 入力時系列信号に対応する線形予測係数に変換可能な係数を、所定時間区間であるフレームごとに求める、線形予測分析装置であって、
少なくともi=0,1,…,Pmaxのそれぞれについて、現在のフレームの入力時系列信号XO(n)とiサンプルだけ過去の入力時系列信号XO(n-i)またはiサンプルだけ未来の入力時系列信号XO(n+i)との自己相関RO(i)を計算する自己相関計算部と、
係数と前記自己相関RO(i)とが対応するiごとに乗算されたものである変形自己相関R' O(i)を用いて、1次からPmax次までの線形予測係数に変換可能な係数を求める予測係数計算部と、を含み、
係数テーブルt0には係数wt0(i)が格納されており、係数テーブルt1には係数wt1(i)が格納されており、係数テーブルt2には係数wt2(i)が格納されているとして、現在又は過去のフレームにおける入力時系列信号の周期性の強さ又は入力時系列信号に基づくピッチゲインと正の相関関係にある値を用いて前記係数テーブルt0,t1,t2の中の1個の係数テーブルから係数を取得する係数決定部を更に含み、
前記周期性の強さ又はピッチゲインと正の相関関係にある値に応じて、周期性の強さ又はピッチゲインが大きい場合、周期性の強さ又はピッチゲインが中程度の場合、周期性の強さ又はピッチゲインが小さい場合の何れかの場合に分類されるとし、周期性の強さ又はピッチゲインが大きい場合に前記係数決定部で係数が取得される係数テーブルを係数テーブルt0とし、周期性の強さ又はピッチゲインが中程度の場合に前記係数決定部で係数が取得される係数テーブルを係数テーブルt1とし、周期性の強さ又はピッチゲインが小さい場合に前記係数決定部で係数が取得される係数テーブルを係数テーブルt2として、i=0以外のiのうちの少なくとも一部のiについてwt0(i)<wt1(i)≦wt2(i)であり、i=0以外のiのうちの前記以外のiのうちの少なくとも一部の各iについてwt0(i)≦wt1(i)<wt2(i)であり、i=0以外のiのうちの残りの各iについてwt0(i)≦wt1(i)≦wt2(i)である、
線形予測分析装置。 - 入力時系列信号に対応する線形予測係数に変換可能な係数を、所定時間区間であるフレームごとに求める、線形予測分析装置であって、
少なくともi=0,1,…,Pmaxのそれぞれについて、現在のフレームの入力時系列信号XO(n)とiサンプルだけ過去の入力時系列信号XO(n-i)またはiサンプルだけ未来の入力時系列信号XO(n+i)との自己相関RO(i) を計算する自己相関計算部と、
係数と前記自己相関RO(i)とが対応するiごとに乗算されたものである変形自己相関R'O(i)を用いて、1次からPmax次までの線形予測係数に変換可能な係数を求める予測係数計算部と、を含み、
係数テーブルt0には係数wt0(i)が格納されており、係数テーブルt2には係数wt2(i)が格納されているとして、現在又は過去のフレームにおける入力時系列信号の周期性の強さ又は入力時系列信号に基づくピッチゲインと正の相関関係にある値を用いて前記係数テーブルt0,t2の少なくとも何れかの係数テーブルから係数を取得する係数決定部を更に含み、
前記周期性の強さ又はピッチゲインと正の相関関係にある値に応じて、周期性の強さ又はピッチゲインが大きい場合、周期性の強さ又はピッチゲインが中程度の場合、周期性の強さ又はピッチゲインが小さい場合の何れかの場合に分類されるとし、周期性の強さ又はピッチゲインが大きい場合に前記係数決定部で係数が取得される係数テーブルを係数テーブルt0とし、周期性の強さ又はピッチゲインが小さい場合に前記係数決定部で係数が取得される係数テーブルを係数テーブルt2として、i=0以外のiのうちの少なくとも一部のiについてwt0(i)<wt2(i)であり、i=0以外のiのうちの残りの各iについてwt0(i)≦wt2(i)であり、
前記係数決定部は、周期性の強さ又はピッチゲインが中程度の場合には、i=0以外の各iについて、w0(i)=β’×wt0(i)+(1-β’)×wt2(i) (ただし0≦β’≦1)である係数を決定する、
線形予測分析装置。 - 請求項1又は2の何れかの線形予測分析方法の各ステップをコンピュータに実行させるためのプログラム。
- 請求項1又は2の何れかの線形予測分析方法の各ステップをコンピュータに実行させるためのプログラムが記録されたコンピュータ読み取り可能な記録媒体。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014011317 | 2014-01-24 | ||
JP2014011317 | 2014-01-24 | ||
JP2014152526 | 2014-07-28 | ||
JP2014152526 | 2014-07-28 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015558849A Division JP6250072B2 (ja) | 2014-01-24 | 2015-01-20 | 線形予測分析装置、方法、プログラム及び記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018028699A JP2018028699A (ja) | 2018-02-22 |
JP6416363B2 true JP6416363B2 (ja) | 2018-10-31 |
Family
ID=53681371
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015558849A Active JP6250072B2 (ja) | 2014-01-24 | 2015-01-20 | 線形予測分析装置、方法、プログラム及び記録媒体 |
JP2017223807A Active JP6416363B2 (ja) | 2014-01-24 | 2017-11-21 | 線形予測分析装置、方法、プログラム及び記録媒体 |
JP2017223806A Active JP6449968B2 (ja) | 2014-01-24 | 2017-11-21 | 線形予測分析装置、方法、プログラム及び記録媒体 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015558849A Active JP6250072B2 (ja) | 2014-01-24 | 2015-01-20 | 線形予測分析装置、方法、プログラム及び記録媒体 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017223806A Active JP6449968B2 (ja) | 2014-01-24 | 2017-11-21 | 線形予測分析装置、方法、プログラム及び記録媒体 |
Country Status (8)
Country | Link |
---|---|
US (3) | US9966083B2 (ja) |
EP (3) | EP3462453B1 (ja) |
JP (3) | JP6250072B2 (ja) |
KR (3) | KR101850523B1 (ja) |
CN (3) | CN106415718B (ja) |
ES (3) | ES2703565T3 (ja) |
PL (3) | PL3098812T3 (ja) |
WO (1) | WO2015111568A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
PL3012835T3 (pl) * | 2013-07-18 | 2019-02-28 | Nippon Telegraph And Telephone Corporation | Urządzenie, sposób i program do analizy predykcji liniowej, oraz nośnik zapisu |
CN110349590B (zh) | 2014-01-24 | 2023-03-24 | 日本电信电话株式会社 | 线性预测分析装置、方法以及记录介质 |
KR101826237B1 (ko) | 2014-03-24 | 2018-02-13 | 니폰 덴신 덴와 가부시끼가이샤 | 부호화 방법, 부호화 장치, 프로그램 및 기록 매체 |
EP4343763A3 (en) * | 2014-04-25 | 2024-06-05 | Ntt Docomo, Inc. | Linear prediction coefficient conversion device and linear prediction coefficient conversion method |
Family Cites Families (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2654542B1 (fr) * | 1989-11-14 | 1992-01-17 | Thomson Csf | Procede et dispositif de codage de filtres predicteurs de vocodeurs tres bas debit. |
US5781880A (en) * | 1994-11-21 | 1998-07-14 | Rockwell International Corporation | Pitch lag estimation using frequency-domain lowpass filtering of the linear predictive coding (LPC) residual |
US5648989A (en) * | 1994-12-21 | 1997-07-15 | Paradyne Corporation | Linear prediction filter coefficient quantizer and filter set |
TW283775B (en) * | 1995-10-11 | 1996-08-21 | Nat Science Council | Linear prediction coefficient based inverse spectrum coefficient generator |
FR2742568B1 (fr) * | 1995-12-15 | 1998-02-13 | Catherine Quinquis | Procede d'analyse par prediction lineaire d'un signal audiofrequence, et procedes de codage et de decodage d'un signal audiofrequence en comportant application |
CN1202514C (zh) * | 2000-11-27 | 2005-05-18 | 日本电信电话株式会社 | 编码和解码语音及其参数的方法、编码器、解码器 |
US20040002856A1 (en) * | 2002-03-08 | 2004-01-01 | Udaya Bhaskar | Multi-rate frequency domain interpolative speech CODEC system |
US7024358B2 (en) * | 2003-03-15 | 2006-04-04 | Mindspeed Technologies, Inc. | Recovering an erased voice frame with time warping |
US7830921B2 (en) * | 2005-07-11 | 2010-11-09 | Lg Electronics Inc. | Apparatus and method of encoding and decoding audio signal |
JP4733552B2 (ja) * | 2006-04-06 | 2011-07-27 | 日本電信電話株式会社 | Parcor係数算出装置、parcor係数算出方法、そのプログラムおよびその記録媒体 |
JP4658853B2 (ja) * | 2006-04-13 | 2011-03-23 | 日本電信電話株式会社 | 適応ブロック長符号化装置、その方法、プログラム及び記録媒体 |
DE602007003023D1 (de) * | 2006-05-30 | 2009-12-10 | Koninkl Philips Electronics Nv | Linear-prädiktive codierung eines audiosignals |
JP4691050B2 (ja) * | 2007-01-29 | 2011-06-01 | 日本電信電話株式会社 | Parcor係数算出方法、及びその装置とそのプログラムと、その記憶媒体 |
JP5253518B2 (ja) * | 2008-12-22 | 2013-07-31 | 日本電信電話株式会社 | 符号化方法、復号方法、それらの装置、プログラム及び記録媒体 |
US8301444B2 (en) | 2008-12-29 | 2012-10-30 | At&T Intellectual Property I, L.P. | Automated demographic analysis by analyzing voice activity |
CN101599272B (zh) * | 2008-12-30 | 2011-06-08 | 华为技术有限公司 | 基音搜索方法及装置 |
CN101609678B (zh) * | 2008-12-30 | 2011-07-27 | 华为技术有限公司 | 信号压缩方法及其压缩装置 |
CN102282770B (zh) * | 2009-01-23 | 2014-04-16 | 日本电信电话株式会社 | 一种参数选择方法、参数选择装置 |
US8665945B2 (en) * | 2009-03-10 | 2014-03-04 | Nippon Telegraph And Telephone Corporation | Encoding method, decoding method, encoding device, decoding device, program, and recording medium |
US9082416B2 (en) * | 2010-09-16 | 2015-07-14 | Qualcomm Incorporated | Estimating a pitch lag |
CN102783034B (zh) * | 2011-02-01 | 2014-12-17 | 华为技术有限公司 | 用于提供信号处理系数的方法和设备 |
JP5613781B2 (ja) * | 2011-02-16 | 2014-10-29 | 日本電信電話株式会社 | 符号化方法、復号方法、符号化装置、復号装置、プログラム及び記録媒体 |
CN102595495A (zh) * | 2012-02-07 | 2012-07-18 | 北京新岸线无线技术有限公司 | 一种数据发送、接收方法和装置 |
CN103050121A (zh) * | 2012-12-31 | 2013-04-17 | 北京迅光达通信技术有限公司 | 线性预测语音编码方法及语音合成方法 |
CN110349590B (zh) * | 2014-01-24 | 2023-03-24 | 日本电信电话株式会社 | 线性预测分析装置、方法以及记录介质 |
-
2015
- 2015-01-20 PL PL15740820T patent/PL3098812T3/pl unknown
- 2015-01-20 EP EP18196351.3A patent/EP3462453B1/en active Active
- 2015-01-20 PL PL18196340T patent/PL3441970T3/pl unknown
- 2015-01-20 CN CN201580005196.6A patent/CN106415718B/zh active Active
- 2015-01-20 KR KR1020187003046A patent/KR101850523B1/ko active IP Right Grant
- 2015-01-20 WO PCT/JP2015/051351 patent/WO2015111568A1/ja active Application Filing
- 2015-01-20 CN CN201910634756.4A patent/CN110415715B/zh active Active
- 2015-01-20 JP JP2015558849A patent/JP6250072B2/ja active Active
- 2015-01-20 US US15/112,534 patent/US9966083B2/en active Active
- 2015-01-20 ES ES15740820T patent/ES2703565T3/es active Active
- 2015-01-20 PL PL18196351T patent/PL3462453T3/pl unknown
- 2015-01-20 ES ES18196351T patent/ES2799899T3/es active Active
- 2015-01-20 EP EP18196340.6A patent/EP3441970B1/en active Active
- 2015-01-20 EP EP15740820.4A patent/EP3098812B1/en active Active
- 2015-01-20 CN CN201910634745.6A patent/CN110415714B/zh active Active
- 2015-01-20 ES ES18196340T patent/ES2770407T3/es active Active
- 2015-01-20 KR KR1020167019020A patent/KR101826219B1/ko active IP Right Grant
- 2015-01-20 KR KR1020187003053A patent/KR101877397B1/ko active IP Right Grant
-
2017
- 2017-11-21 JP JP2017223807A patent/JP6416363B2/ja active Active
- 2017-11-21 JP JP2017223806A patent/JP6449968B2/ja active Active
-
2018
- 2018-03-19 US US15/924,963 patent/US10170130B2/en active Active
- 2018-03-19 US US15/924,887 patent/US10163450B2/en active Active
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6117359B2 (ja) | 線形予測分析装置、方法、プログラム及び記録媒体 | |
JP6423065B2 (ja) | 線形予測分析装置、方法、プログラム及び記録媒体 | |
JP6416363B2 (ja) | 線形予測分析装置、方法、プログラム及び記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20171121 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20181002 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20181003 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6416363 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |