JP4634969B2 - 線形予測モデル次数決定装置、線形予測モデル次数決定方法、そのプログラムおよび記録媒体 - Google Patents

線形予測モデル次数決定装置、線形予測モデル次数決定方法、そのプログラムおよび記録媒体 Download PDF

Info

Publication number
JP4634969B2
JP4634969B2 JP2006148919A JP2006148919A JP4634969B2 JP 4634969 B2 JP4634969 B2 JP 4634969B2 JP 2006148919 A JP2006148919 A JP 2006148919A JP 2006148919 A JP2006148919 A JP 2006148919A JP 4634969 B2 JP4634969 B2 JP 4634969B2
Authority
JP
Japan
Prior art keywords
model order
code amount
model
prediction error
order
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2006148919A
Other languages
English (en)
Other versions
JP2007318691A (ja
Inventor
健弘 守谷
登 原田
優 鎌本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2006148919A priority Critical patent/JP4634969B2/ja
Publication of JP2007318691A publication Critical patent/JP2007318691A/ja
Application granted granted Critical
Publication of JP4634969B2 publication Critical patent/JP4634969B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

信号分析や信号の符号化などに用いられる線形予測分析技術に関する。
線形予測モデルは、ある時点{t}における時系列離散信号のサンプル値xと、その時点{t}よりも過去のp個の時点{t−1}、時点{t−2}、・・・、時点{t−p}における時系列離散信号のサンプル値xt−1、xt−2、・・・、xt−pのそれぞれに係数φ(i=1、・・・、p)による重み付けをしたものと、線形予測誤差εと間に線形1次結合が成り立つと仮定したモデルとして式(A)によって表すことができる。なお、例えば係数φのいずれかが0となる場合、厳密には線形予測モデルは過去p個の時系列離散信号のサンプル値に基づくものとは言えないが、このような場合も含めて、過去p個の時系列離散信号のサンプル値に基づくものであると考える。ここでpは、線形予測モデルが要するサンプル数を表し、これをモデル次数ということにする。
Figure 0004634969
全極型の線形予測分析では、線形予測モデルのモデル次数の決定を要求される場合がある。例えば、圧縮符号化を例とすると、線形予測係数に係わる補助情報および予測誤差波形の各符号量の和を最小化するためにモデル次数を決める必要がある。このように決定されるべきモデル次数を最適モデル次数ということにする。
このことを、PARCOR係数を算出する場合を一例として図7に示して説明する。
所定の時間間隔で標本化された時間離散信号をフレーム毎に分割した各フレームを入力信号yとする。ここではロスレス符号化〔Lossless Coding〕を例とし、入力信号yは整数変換された整数値からなるとする。また、最適モデル次数は、モデル次数をNminからNmaxまでとした探索範囲をn次〔但し、nはn≧1を満たす整数である。また、NminおよびNmaxはNmax>Nminを満たす正整数である。〕ごとに調べたものの中から決定することにする。なお、以下ではモデル次数mを正整数とする。
PARCOR係数算出部(901)は、入力信号yを入力として、モデル次数が1,2,・・・,Nmaxの各線形予測モデルのPARCOR係数γm,m〔m=1,2,・・・,Nmax〕をそれぞれ算出する〔PARCOR係数の算出方法については非特許文献1または後述の《PARCOR係数・前向き予測誤差系列・後向き予測誤差系列の算出》を参照のこと。〕。モデル次数が1,2,・・・,Nmaxのときの各PARCOR係数γm,m〔m=1,2,・・・,Nmax〕は、PARCOR係数量子化部(902)の入力となる。
PARCOR係数量子化部(902)は、各PARCOR係数γm,m〔m=1,2,・・・,Nmax〕を量子化して、モデル次数が1,2,・・・,Nmaxのときの量子化済PARCOR係数qγm,m〔m=1,2,・・・,Nmax〕をそれぞれ算出する。
また、PARCOR係数量子化部(902)は、量子化済PARCOR係数qγm,m〔m=1,2,・・・,Nmax〕それぞれについて、量子化表を用いて量子化済PARCOR係数をインデックスの数値に変換し、これらを符号化して、係数符号Cp〔m=1,2,・・・,Nmax〕をそれぞれ算出する。
量子化方法は公知・周知の手法を用いることができるので、その詳細な説明を略する〔例えば非特許文献2を参照のこと。〕。なお、上記のように量子化済PARCOR係数qγm,m〔m=1,2,・・・,Nmax〕それぞれについて量子化してもよいが、それらの一部または全部をまとめてベクトル量子化してもよい。但し、ベクトル量子化する場合には、探索範囲に含まれる各モデル次数までの符号〔つまり、モデル次数が1からNminまでの符号、モデル次数が1から(Nmin+n)までの符号、モデル次数が1から(Nmin+2n)までの符号、・・・、である。〕を最適モデル次数探索・符号選択部(906)で選択できるようにまとめる範囲を設定するか、それぞれの符号を最適モデル次数探索・符号選択部(906)に出力するか、の何れかにすることを要する。
各量子化済PARCOR係数qγm,m〔m=1,2,・・・,Nmax〕は、線形予測係数変換部(903)の入力となる。
各係数符号Cp〔m=1,2,・・・,Nmax〕は、最適モデル次数探索・符号選択部(906)の入力となる。
線形予測係数変換部(903)は、各量子化済PARCOR係数qγm,m〔m=1,2,・・・,Nmax)から、モデル次数がNminからNmaxまでのnごとの各モデル次数に応じた線形予測モデルの〔量子化済みの〕線形予測係数γm,k〔探索対象モデル次数m=Nmin,Nmin+n,Nmin+2n,・・・,Nmin+n×i,・・・,Nmin+n×[(Nmax−Nmin)/n]、但し[・]はガウス記号である。imax=[(Nmax−Nmin)/n]として、「i=0,1,2,・・・,imax」などと表記する。また、k=1,2,・・・,mである。〕をそれぞれ算出する〔線形予測係数の算出方法については非特許文献1または後述の《PARCOR係数・前向き予測誤差系列・後向き予測誤差系列の算出》を参照のこと。〕。つまり、i=0,1,2,・・・,imaxとして、モデル次数(Nmin+n×i)の線形予測モデルの線形予測係数γg,k〔k=1,2,・・・,g〕を算出する〔Nmin+n×i=gとして記号の置き換えをした。〕。なお、線形予測係数γg,gは、PARCOR係数として既に与えられていることに留意すること。
モデル次数(Nmin+n×i)の線形予測モデルの線形予測係数γg,k〔k=1,2,・・・,g〕は、予測誤差フィルタ部(904−i)〔但し、i=0,1,2,・・・,imax〕の入力となる。
予測誤差フィルタ部(904−i)〔i=0,1,2,・・・,imax〕はそれぞれ、入力信号yも入力として、線形予測係数γg,k〔k=1,2,・・・,g〕を予測係数とした予測誤差フィルタに入力信号yを例えば前向きで通し、入力信号yと線形予測係数γg,kからなるモデル次数gの線形予測モデルの予測値との誤差である予測誤差信号〔予測誤差波形〕eを出力する。
線形予測誤差信号eは、誤差信号符号化部(905−i)〔i=0,1,2,・・・,imax〕の入力となる。
誤差信号符号化部(905−i)〔i=0,1,2,・・・,imax〕はそれぞれ、予測誤差信号eを符号化して、モデル次数(Nmin+n×i)の誤差信号符号C〔g=Nmin+n×i〕を出力する。
誤差信号符号C〔g=Nmin+n×i〕は、最適モデル次数探索・符号選択部(906)の入力となる。
最適モデル次数探索・符号選択部(906)は、i=0,1,2,・・・,imaxについて、モデル次数(Nmin+n×i)のときの誤差信号符号C〔g=Nmin+n×i〕の符号量と、モデル次数が(Nmin+n×i)までの係数符号Cp(m=1,2,・・・,Nmin+n×i)の符号量との和である合計符号量を求め、求めた各合計符号量のうち最小の合計符号量を探索する。そして、例えば最小合計符号量のものがi=Iの場合、つまりモデル次数(Nmin+n×I)のときの誤差信号符号C〔g=Nmin+n×I〕の符号量とモデル次数が(Nmin+n×I)までの係数符号Cp(m=1,2,・・・,Nmin+n×I)の符号量との合計符号量が最小であったとすると、最適モデル次数は(Nmin+n×I)であると決定できる。
そして、通信路に対して、最適モデル次数(Nmin+n×I)までのPARCOR係数に対応した係数符号Cp(m=1,2,・・・,Nmin+n×I)および最適モデル次数(Nmin+n×I)のときの誤差信号符号C〔g=Nmin+n×I〕が送り出される。なお、係数符号Cp(m=1,2,・・・,Nmin+n×I)から最適モデル次数を判別できない場合には、最適モデル次数を表す情報〔次数情報〕を適宜符号化し、この符号化された次数情報も通信路に対して送り出される。
上記の例のように、従来では、言わば総当りで各モデル次数における合計符号量を求め、最小のものを探索していた。
日野幹雄著、"スペクトル解析"、朝倉書店、1979 守谷健弘著、"音声符号化"、社団法人電子情報通信学会、1998
それぞれのモデル次数ごとに、予測係数に係わる補助情報および予測誤差波形を符号化して合計符号量を求め、合計符号量が最小となる場合のモデル次数を最適モデル次数として決定することは可能であるが、多大な処理時間を要するといった問題があった。
そこで本発明は、上記の問題点に鑑み、実際に各モデル次数での合計符号量を求めることなく線形予測モデルの最適モデル次数を決定する線形予測モデル次数決定装置、方法、プログラム、記録媒体を提供することを目的とする。
上記課題を解決するために、本発明は、次のような構成とする。即ち、入力信号から、モデル次数が1,・・・,m〔但し、mは2以上の整数Nsupに対して1≦m≦Nsupを満たす整数である。〕の各線形予測モデルのPARCOR係数と、モデル次数mのときの前向き予測誤差系列および/または後向き予測誤差系列とをそれぞれ算出する。そして、モデル次数mのときの前向き予測誤差系列および/または後向き予測誤差系列から、モデル次数が1,・・・,mのときの各PARCOR係数によって与えられる線形予測係数からなるモデル次数mの線形予測モデルの予測値と入力信号との誤差である予測誤差波形の符号量を推定する。また、モデル次数が1,・・・,mのときの各PARCOR係数に対応した符号量〔個別符号量〕、あるいは全てのPARCOR係数に対応する符号量〔全体符号量〕を算出する。1からNsupまでのモデル次数に含まれる複数のモデル次数について、各モデル次数mにおける、全体符号量あるいはモデル次数が1,・・・,mのときの各個別符号量の合計と、予測誤差波形の推定された符号量との合計〔合計符号量〕を求め、合計符号量からモデル次数を1つに決定する。この決定された1つのモデル次数が最適モデル次数である。
このように、実際に各モデル次数での符号量を求めるのではなく、PARCOR係数の算出過程で得られた前向き予測誤差系列および/または後向き予測誤差系列によって、予測誤差波形の符号量を推定する構成としている。
この発明によれば、PARCOR係数の算出過程で得られた前向き予測誤差系列および/または後向き予測誤差系列によって予測誤差波形の符号量を推定するから、実際に各モデル次数での符号量〔係数符号量と予測誤差波形の符号量との合計符号量〕を求めることなく、線形予測モデルの最適モデル次数を決定することができる。
[技術説明]
本発明では、PARCOR係数の算出過程で得られた予測誤差系列を有効利用して最適モデル次数を決定する。
《PARCOR係数・前向き予測誤差系列・後向き予測誤差系列の算出》
全極型の線形予測分析の一つとしてPARCOR係数を直接求める方法が知られている。この算出方法は、上記非特許文献1にBurg法として説明されている。
Burg法の概要を説明する。Burg法では、モデル次数m−1の線形予測モデルをモデル次数mの線形予測モデルに拡張することを考える。つまり、Burg法では、線形予測モデルのPARCOR係数を、あるモデル次数m−1におけるPARCOR係数から当該モデル次数よりも1大きいモデル次数mにおけるPARCOR係数を求める漸化関係から算出する。
与えられたデータをx,x,・・・,xとする。このとき、予測誤差フィルター(モデル次数mの線形予測モデル)にデータx,x,・・・,xを前向きに通す場合および後向きに通す場合の平均出力P〔式(1)参照。〕が最小になることを条件として採用する。但し、γm,k(k=1,2,・・・,m)はモデル次数mの線形予測係数である。
Figure 0004634969
ここでγm,k(k=1,2,・・・,m−1)は、式(2)、つまり式(3)で表される関係がある〔Levinsonアルゴリズム;上記非特許文献1参照。〕。
Figure 0004634969
式(2)あるいは式(3)を用いて、式(1)を書き換えると、式(4)を得る。
Figure 0004634969
ここで、b′m,iは式(5)で表される。b′m,iを前向き予測誤差系列と呼ぶことにする。
また、bm,iは式(6)で表される。bm,iを後向き予測誤差系列と呼ぶことにする。
Figure 0004634969
なお、前向き予測誤差系列および後向き予測誤差系列には式(7)、式(8)で表される関係がある〔上記非特許文献1参照。〕。
Figure 0004634969
このとき、平均出力Pを最小にするという条件からγm,m〔いわゆるPARCOR係数である。〕について式(9)を得る。
Figure 0004634969
つまりPARCOR係数γm,mは、前向き予測誤差系列b′m,i(i=1,・・・,N−m;以下同様。)と後向き予測誤差系列bm,iの内積〔式(9)の分子に相当する。〕を、前向き予測誤差系列b′m,iおよび後向き予測誤差系列bm,iの各エネルギーの平均〔以下、「平均エネルギー」という。式(9)の分母に相当する。〕で除したものとして表される。
なお、モデル次数mのときの線形予測係数γm,k(k=1,2,・・・,m−1)は式(3)で与えられる。線形予測係数γm,k(k=m)はPARCOR係数として式(9)で与えられる。
以上では、Burg法に拠るPARCOR係数などの算出を説明したが、この方法に限定するものではなく例えばYule−Walker法に拠るものであってもよい。Yule−Walker法については、上記非特許文献1を参照のこと。
以上で《PARCOR係数・前向き予測誤差系列・後向き予測誤差系列の算出》の説明は終わりである。
《PARCOR係数の情報量》
次に、PARCOR係数の情報量について説明する。
PARCOR係数の情報量の計算は、PARCOR係数の量子化方法、符号化方法に依存する。そこで、ここでは一般的な手法を一例として説明する。
一般的には最子化表〔PARCOR係数とその量子化値とが対応したデータテーブルである。〕を用いて、PARCOR係数をインデックスの数値に変換する。さらに、その数値の符号化方法として2つの例を示す。一つ目の方法は、インデックスの数値を予め決められたビット数で符号ビット(正負を表すビット)を含めて符号化する場合で、係数符号は、インデックスの数値に対応する符号の表〔インデックスの数値と係数符号とが対応したデータテーブルである。〕を参照して求めることができる。二つ目の方法は、PARCOR係数のインデックスの数値に依存して可変長符号を用いる場合である。この場合、PARCOR係数のインデックス値の絶対値によってビット数が異なるので、インデックスの数値の絶対値に対応する符号の表〔インデックスの数値の絶対値と係数符号とが対応したデータテーブルである。〕を参照して係数符号を求める。ここで求めた係数符号の符号量が、PARCOR係数の情報量に相当する。なお、符号化に用いる表を符号化表〔データテーブルである。〕と云うことにする。
また、それぞれ別々のデータテーブルである量子化表および符号化表を用いるのではなく、PARCOR係数の範囲とその範囲に対応する量子化値と符号との組み合わせが、PARCOR係数の取りえる範囲の全てについて記載された量子化・符号化表〔データテーブルである。〕を用いるとしてもよい。
例えば、固定長符号化の場合であれば表1に簡単に例示する量子化・符号化表などを用いることができる。また、可変長符号化の場合であれば表2に簡単に例示する量子化・符号化表などを用いることができる。なお、表2で示す符号は0を指標とする瞬時復号可能な符号となっている。
Figure 0004634969
Figure 0004634969
係数符号の符号量の算出には、2つの方法が考えられる。一つ目の方法は、モデル次数1からモデル次数mまでの各モデル次数について求めた全てのPARCOR係数に対応する係数符号の全部の符号量〔全体符号量〕を算出するものである。二つ目の方法は、モデル次数1からモデル次数mまでの各モデル次数ごとに、各モデル次数のときのPARCOR係数に対応する係数符号の符号量〔個別符号量〕をそれぞれ算出するものである。二つ目の方法では、それぞれの係数符号の個別符号量を合計したものをPARCOR係数の情報量として取り扱うことになるが、このことは後述の《最適モデル次数の決定》でも説明する。
以上で《PARCOR係数の情報量》の説明は終わりである。
《予測誤差波形の符号量の推定》
次に、線形予測モデルの予測値と入力信号との誤差である予測誤差波形の符号量の推定について説明する。予測誤差波形の符号量の推定は、系列の平均的大きさの指標を用いて行う。ここで系列とは、前向き予測誤差系列、後向き予測誤差系列、前向き予測誤差および後向き予測誤差の両方の系列、のいずれかをいう。また、平均的大きさの指標〔以下、単に「指標」という。〕とは、系列のエネルギーの平均の平方根、あるいは系列の絶対値の平均をいう。以下、具体的に説明する。
まず、系列のエネルギーを用いて予測誤差波形の符号量を推定する方法について説明する。具体的には、モデル次数をmとした場合に、N点のサンプルからなるフレーム〔入力信号〕の前向き予測誤差系列のエネルギーと後向き予測誤差系列のエネルギーとの平均である平均エネルギーEから式(10)で表される指標aを求める。
Figure 0004634969
なお、N点のサンプルからなるフレームの前向き予測誤差系列のエネルギーあるいは後向き予測誤差系列のエネルギーを上記Eの値に用いる構成としてもよい。
あるいは、指標aを、前向き予測誤差系列の指標と後向き予測誤差系列の指標との平均で与えるとしてもよい。つまり、前向き予測誤差系列のエネルギーをE、前向き予測誤差系列の指標をa、後向き予測誤差系列のエネルギーをE、後向き予測誤差系列の指標をaとすると、指標aは式(11)で与えられる。
Figure 0004634969
例えば可変長符号として表3のようなゴロム-ライス符号を用いる場合では、(指標の2倍+1)が符号ビット数の良い近似になるので、フレームにおける予測誤差波形の符号量の推定値〔推定符号量〕Sは、指標aの2倍に1を加算したものに入力信号のサンプル数を乗じたものとして、式(12)で得られる。
Figure 0004634969
Figure 0004634969
また、予測誤差系列の下位hビット〔但し、hは1以上の整数である。〕はそのままの数値として符号化し、それより上位のビットだけをゴロム-ライス符号化する場合もある。この場合、平均エネルギーEの場合を例にとれば、平均エネルギーEをhビットだけ下位にシフトした後に、式(13)で表される指標a′を求める。平均エネルギーEをhビットだけ下位にシフトしたものは平均エネルギーEを1/2倍したものに相当し、式(10)はh=0の場合に相当する。
Figure 0004634969
この場合では、フレームにおける予測誤差波形の符号量の推定値〔推定符号量〕S′は、下位のhビットを加えた式(14)で得られる。なお、式(12)はh=0の場合に相当する。
Figure 0004634969
次に、予測誤差系列の絶対値を用いて予測誤差波形の符号量を推定する方法について説明する。具体的には、N点のサンプルからなるフレームの前向き予測誤差系列の絶対値の和および後向き予測誤差系列の絶対値の和を求め、それぞれの和の平均Dから式(15)で表される指標aを求める。
Figure 0004634969
上記と同様に、例えば可変長符号として表3のようなゴロム-ライス符号を用いるとする。このとき、フレームにおける予測誤差波形の符号量の推定値〔推定符号量〕Sは式(16)で得られる。
Figure 0004634969
予測誤差系列の絶対値を用いて予測誤差波形の符号量を推定する方法は、一般に推定精度が高い。なお、N点のサンプルからなるフレームの前向き予測誤差系列の絶対値の和あるいは後向き予測誤差系列の絶対値の和を上記Dの値に用いる構成としてもよい。
あるいは、指標aを、前向き予測誤差系列の指標と後向き予測誤差系列の指標との平均で与えるとしてもよい。つまり、前向き予測誤差系列の絶対値の和をDf1、前向き予測誤差系列の指標をaf1、後向き予測誤差系列の絶対値の和をDr1、後向き予測誤差系列の指標をar1とすると、指標aは式(17)で与えられる。
以上で《予測誤差波形の符号量の推定》の説明は終わりである。
Figure 0004634969
《最適モデル次数の決定》
最適モデル次数の決定の方法について、特に限定はなく、ここでは3つの方法を例示する。
一つ目の方法(方法A)は、予め設定した探索範囲の各モデル次数m〔探索範囲の全モデル次数ではなく、その一部、例えばnごとの各モデル次数としてもよい。〕について、そのモデル次数におけるPARCOR係数の情報量〔つまり、係数符号量であるが、係数符号量として全体符号量が算出されている場合にはそのまま全体符号量を、係数符号量として個別符号量が算出されている場合にはモデル次数が1からmまでの全モデル次数に対応した各個別符号量を合計した符号量を、PARCOR係数の情報量として扱う。以下同様である。〕と、そのモデル次数における予測誤差波形の推定符号量との合計〔合計符号量〕を求め、その合計符号量が最小になるときのモデル次数を最適モデル次数として決定する。
二つ目の方法(方法B)は、1つ前に設定されたモデル次数よりも大となるように逐次にモデル次数を設定し、設定されたモデル次数における合計符号量が1つ前に設定されたモデル次数における合計符号量よりも大となったときに、1つ前に設定されたモデル次数を最適モデル次数として決定する。
この二つ目の方法では、設定されたモデル次数における合計符号量が1つ前に設定されたモデル次数における合計符号量よりも大となったとき、1つ前に設定されたモデル次数〔暫定最適次数〕から、さらに予め定められただけの先のモデル次数〔例えば、暫定最適次数に正整数Fを加えたモデル次数とする。〕までの各モデル次数における合計符号量〔補合計符号量〕を求め、もし、暫定最適次数での合計符号量よりも少ない補合計符号量となるモデル次数が存在する場合には、暫定最適次数での合計符号量よりも少ない補合計符号量のうち最小の補合計符号量となるときのモデル次数を最適モデル次数とする方法に変形することも可能である。この変形方法(方法C)は、基本的には合計符号量が1つ前に設定されたモデル次数における合計符号量よりも大となった時点での1つ前に設定されたモデル次数〔暫定最適次数〕を最適モデル次数の有力候補としつつ、念のためその先のモデル次数まで合計符号量の増減のチェックを行うものである。
以上で《最適モデル次数の決定》の説明は終わりである。
[実施形態]
以下、本発明の実施形態について説明を行う。本発明は線形予測モデルの最適モデル次数を決定するものであるところ、最適モデル次数を決定することを所望として実施するとしてもよいし、例えば信号分析や信号の符号化などに用いられることを所望として実施するとしてもよい。
ここでは、上記従来技術との対比から本発明の特徴を明らかにする観点から、本発明が信号符号化に用いられる場合を例として実施形態の説明を行う。
《第1実施形態》
本発明の第1実施形態について、図面を参照しながら説明する。
<第1実施形態の線形予測モデル次数決定装置>
図1に例示するように、線形予測モデル次数決定装置(1)は、キーボードなどが接続可能な入力部(11)、液晶ディスプレイなどが接続可能な出力部(12)、CPU(Central Processing Unit;14)〔キャッシュメモリなどを備えていてもよい。〕、メモリであるRAM(Random Access Memory)(15)、ROM(Read Only Memory)(16)やハードディスクである外部記憶装置(17)、並びにこれらの入力部(11)、出力部(12)、CPU(14)、RAM(15)、ROM(16)、外部記憶装置(17)間のデータのやり取りが可能なように接続するバス(18)などを備えている。また必要に応じて、線形予測モデル次数決定装置(1)に、CD−ROMなどの記憶媒体を読み書きできる装置(ドライブ)などを設けるとしてもよい。このようなハードウェア資源を備えた物理的実体としては、汎用コンピュータなどがある。
線形予測モデル次数決定装置(1)の外部記憶装置(17)には、線形予測モデルの最適モデル次数決定のためのプログラムおよびこのプログラムの処理において必要となるデータなどが保存記憶されており、必要に応じてこれらがメモリに読み込まれる。また、これらのプログラムの処理によって得られるデータなどは、RAM(15)などのメモリに適宜に保存記憶されて、さらに適宜に読み出されるなどして情報処理の用に供される。
所定の時間間隔で標本化された時間離散信号をフレーム毎に分割した各フレームを入力信号xとする。ここではロスレス符号化〔Lossless Coding〕を例とし、入力信号xは整数変換された整数値からなり、サンプル数Nのデータ列としてx,x,・・・,xと表されるとする。入力信号xは、外部記憶装置(17)にデータとして保存記憶されているとする。また、最適モデル次数は、モデル次数をNminからNmaxまでとした探索範囲をn次〔但し、nはn≧1を満たす整数である。また、NminおよびNmaxはNmax>Nminを満たす正整数である。〕ごとに調べたものの中から決定することにする。なお、以下ではモデル次数mを正整数とする。一般的には、モデル次数の上限をNsupとすると〔無限のモデル次数を調査対象とすることは事実上不可能だからモデル次数の上限を定める。〕、モデル次数が1からNsupまでの範囲に含まれるように探索範囲を設定できる。つまり、1≦Nmin<Nmax≦Nsupである。ただ、Nmax<Nsupの場合は、Nmax+1からNsupまでのモデル次数についてPARCOR係数などを求めても無意味なってしまうので、通常は、Nmax=Nsupとして考えればよい。本明細書ではNmax=Nsupとする。
各実施形態で扱う信号は、人の音声、音楽、騒音・雑音などの音響信号とする。勿論、音響信号に限定されず、例えば生体信号などでもよい。
入力信号xが予め外部記憶装置(17)に保存記憶される構成とするのではなく、例えば、CD−ROMなどの記憶媒体から入力信号xを読み込み外部記憶装置(17)に保存記憶する構成でも、あるいは、音声信号の場合に、線形予測モデル次数決定装置(1)を具備する信号符号化装置(2)がマイクロフォンを備えるとし、このマイクロフォンで得られた収音信号をA/D変換・整数変換して入力信号xを得る構成とすることなどが考えられる。いずれにしても、A/D変換などを実行するために必要となる構成要素(手段)や記録媒体からのデータ提供技術は、公知技術の常套手段によって達成されるから、説明および図示を略する。
外部記憶装置(17)には、上述した量子化・符号化表(データテーブル)が保存記憶されている。
また外部記憶装置(17)には、PARCOR係数・前向き予測誤差系列・後向き予測誤差系列を算出するためのプログラム、予測誤差波形の符号量の推定をするためのプログラム、係数符号量を算出するためのプログラム、最適モデル次数を決定するためのプログラムが保存記憶されている。その他、これらのプログラムに基づく処理を制御するための制御プログラムも適宜に保存しておいてよい。
線形予測モデル次数決定装置(1)では、外部記憶装置(17)に記憶された各プログラムとこの各プログラムの処理に必要なデータが必要に応じてRAM(15)に読み込まれて、CPU(14)で解釈実行・処理される。この結果、CPU(14)が所定の機能(PARCOR係数算出部、予測誤差符号量推定部、係数符号量算出部、最適モデル次数探索部、制御部)を実現することで線形予測モデルの最適モデル次数決定が実現される。
<第1実施形態の線形予測モデル次数決定処理>
次に、図2および図3を参照して、線形予測モデル次数決定装置(1)における最適モデル次数決定処理の流れを叙述的に説明する。第1実施形態は上記方法Aによって最適モデル次数を決定する。
まず、PARCOR係数算出部(141)は、入力信号xを入力として、モデル次数が1からNmaxまでの各モデル次数について、それぞれのモデル次数におけるPARCOR係数γm,m〔m=1,2,・・・,Nmax〕、前向き予測誤差系列b′m,i〔m=1,2,・・・,Nmax〕、後向き予測誤差系列bm,i〔m=1,2,・・・,Nmax〕をそれぞれ算出する(ステップS11)。PARCOR係数・前向き予測誤差系列・後向き予測誤差系列の算出方法は、《PARCOR係数・前向き予測誤差系列・後向き予測誤差系列の算出》で説明したとおりであり、式(7)、式(8)、式(9)を用いて求めることができる。ここで添え字iは、特定の或る値を示すのではなく、式(9)のインデックスiに相当することに留意しなければならない〔以下同様である。また、図中の添え字iについても同様である。〕。つまり、インデックスiが取り得る値の個数に相当する個数のデータが存在する。
各前向き予測誤差系列b′m,i〔m=1,2,・・・,Nmax〕、各後向き予測誤差系列bm,i〔m=1,2,・・・,Nmax〕はそれぞれ予測誤差符号量推定部(142)の入力となる。各PARCOR係数γm,m〔m=1,2,・・・,Nmax〕は、係数符号量算出部(143)の入力となる。
次いで、予測誤差符号量推定部(142)は、各前向き予測誤差系列b′m,i〔m=1,2,・・・,Nmax〕、各後向き予測誤差系列bm,i〔m=1,2,・・・,Nmax〕を用いて、予測誤差波形の符号量の推定値〔推定符号量〕Ce〔m=1,2,・・・,Nmax〕を算出する(ステップS12)。各推定符号量の算出は、《予測誤差波形の符号量の推定》で説明したとおりであり、いずれか1つの方法を用いてm=1,2,・・・,Nmaxの各モデル次数ごとに行う。
各推定符号量Ce〔m=1,2,・・・,Nmax〕は、最適モデル次数探索部(144)の入力となる。
また、係数符号量算出部(143)は、各PARCOR係数γm,m〔m=1,2,・・・,Nmax〕を用いて、係数符号量Cp〔m=1,2,・・・,Nmax〕を算出する(ステップS13)。係数符号量の算出は、《PARCOR係数の情報量》で説明したとおりであり、いずれか1つの方法を用いて行うが、この実施形態では一例として個別符号量を求める場合とする。
各係数符号量Cp〔m=1,2,・・・,Nmax〕は、最適モデル次数探索部(144)の入力となる。
ステップS12およびステップS13は、いずれを先行するものとしてもよい。つまり、ステップS11、ステップS12、ステップS13の順序で処理することもできるし、ステップS11、ステップS13、ステップS12の順序で処理することもできる。
次に、最適モデル次数探索部(144)は、各係数符号量Cp〔m=1,2,・・・,Nmax〕および各推定符号量Ce〔m=1,2,・・・,Nmax〕から線形予測モデルの最適モデル次数を決定する。その処理を説明する。
まず、最適モデル次数探索部(144)は、探索範囲であるNminからNmaxまでの各モデル次数について、各モデル次数における合計符号量を算出する(ステップS14)。つまり、Nmin≦m≦Nmaxなるnごとの各モデル次数m〔上記探索対象モデル次数〕について、モデル次数mまでの個別符号量の合計と、モデル次数mにおける予測誤差波形の推定符号量との合計を求める。
次に、最適モデル次数探索部(144)は、反復処理用のパラメータjにNminを設定し、最小合計符号量の探索用のパラメータMに任意の値(初期値)を設定する(ステップS15)。この初期値は十分に大きな値に設定する。
次に、最適モデル次数探索部(144)は、モデル次数jにおける合計符号量〔つまりモデル次数1からjまでの各個別符号量の合計と、モデル次数jにおける予測誤差波形の推定符号量との合計である。〕とMとの大小を判定する(ステップS16)。第1実施形態では、M>(モデル次数jにおける合計符号量)の成立を判定する。
M>(モデル次数jにおける合計符号量)の成立が真ならば、最適モデル次数探索部(144)はステップS17の処理を実行する。M>(モデル次数jにおける合計符号量)の成立が偽ならば、最適モデル次数探索部(144)はステップS18の処理を実行する。
M>(モデル次数jにおける合計符号量)の成立が真ならば、最適モデル次数探索部(144)は、最適モデル次数決定用のパラメータNoptにパラメータjの値を代入し、さらに、パラメータMにモデル次数jにおける合計符号量を代入する(ステップS17)。次いで、ステップS18の処理が実行される。
最適モデル次数探索部(144)は、パラメータjとモデル次数Nmaxとの大小を比較判定する(ステップS18)。第1実施形態では、j≧Nmaxの成立を判定する。
j≧Nmaxの成立が真ならば、最適モデル次数探索部(144)は最適モデル次数決定処理を終了する。つまり、この時点でのパラメータNoptの値が最適モデル次数である。この最適モデル次数Noptを表す次数情報は信号符号化装置(2)の出力となる場合がある。また、最適モデル次数Noptは、PARCOR係数量子化部(145)の入力となる。
j≧Nmaxの成立が偽ならば、最適モデル次数探索部(144)はステップS19の処理を実行する。
最適モデル次数探索部(144)は、パラメータjにnを加算したもの、つまりj+nをパラメータjの新たな値に設定し(ステップS19)、ステップS16〜S18の処理を行う。
以下、最摘モデル次数を得た後の信号符号化に関わる処理を説明する。
PARCOR係数量子化部(145)は、PARCOR係数算出部(141)によって得られた各PARCOR係数γm,m〔m=1,2,・・・,Nopt〕を量子化して、モデル次数が1からNoptまでの各モデル次数について量子化済PARCOR係数qγm,m〔m=1,2,・・・,Nopt〕をそれぞれ算出する。各量子化済PARCOR係数qγm,m〔m=1,2,・・・,Nopt〕は、線形予測係数変換部(146)の入力となる。
また、PARCOR係数量子化部(145)は、各量子化済PARCOR係数qγm,m〔m=1,2,・・・,Nopt〕それぞれについて、量子化表を用いて量子化済PARCOR係数をインデックスの数値に変換し、これらを符号化して、係数符号Cp〔m=1,2,・・・,Nopt〕をそれぞれ算出する。各係数符号Cp〔m=1,2,・・・,Nopt〕は信号符号化装置(2)の出力となる。
次に、線形予測係数変換部(146)は、各量子化済PARCOR係数qγm,m〔m=1,2,・・・,Nopt〕から、式(3)に従い、〔量子化済みの〕線形予測係数γg,k〔g=Nopt、k=1,2,・・・,g〕を算出する。〔量子化済みの〕各線形予測係数γg,k〔g=Nopt、k=1,2,・・・,g〕は、予測誤差フィルタ部(147)の入力となる。
次に、予測誤差フィルタ部(147)は、入力信号xも入力として、線形予測係数γg,k〔k=1,2,・・・,g〕を予測係数とした予測誤差フィルタに入力信号xを例えば前向きで通し、入力信号xと線形予測係数γg,kからなるモデル次数gの線形予測モデルの予測値との誤差である予測誤差信号〔予測誤差波形〕eを出力する。
線形予測誤差信号eは、誤差信号符号化部(148)の入力となる。
次に、誤差信号符号化部(148)は、予測誤差信号eを符号化して、誤差信号符号C〔g=Nopt〕を出力する。この誤差信号符号C〔g=Nopt〕は信号符号化装置(2)の出力となる。
第1実施形態では、係数符号量算出部(143)が個別符号量を算出する場合として説明した。係数符号量算出部(143)が全体符号量を算出する場合には、ステップS16の処理において、最適モデル次数探索部(144)は、モデル次数jにおける合計符号量〔つまり全体符号量の合計と、モデル次数jにおける予測誤差波形の推定符号量との合計である。〕とMとの大小を判定すればよい。
《第2実施形態》
本発明の第2実施形態について、図面を参照しながら説明する。
第2実施形態の線形予測モデル次数決定装置のハードウェア構成やプログラムなどは第1実施形態の場合と同様であるから説明を略する。
<第2実施形態の線形予測モデル次数決定処理>
図2および図4を参照して、第2実施形態の線形予測モデル次数決定装置(1)における最適モデル次数決定処理の流れを叙述的に説明する。第2実施形態は上記方法Bによって最適モデル次数を決定する。なお、《PARCOR係数・前向き予測誤差系列・後向き予測誤差系列の算出》、《予測誤差波形の符号量の推定》、《PARCOR係数の情報量》については既に説明したとおりであるから説明を略する〔[技術説明]および《第1実施形態》を参照のこと。〕。
まず、制御部(190)は、パラメータjにNminを設定する(ステップS21)。
次に、PARCOR係数算出部(141)は、入力信号xを入力として、モデル次数が1からjまでの各モデル次数について、それぞれのモデル次数におけるPARCOR係数γm,m〔m=1,2,・・・,j〕、前向き予測誤差系列b′m,i〔m=1,2,・・・,j〕、後向き予測誤差系列bm,i〔m=1,2,・・・,j〕をそれぞれ算出する(ステップS22)。
各前向き予測誤差系列b′m,i〔m=1,2,・・・,j〕、各後向き予測誤差系列bm,i〔m=1,2,・・・,j〕はそれぞれ予測誤差符号量推定部(142)の入力となる。各PARCOR係数γm,m〔m=1,2,・・・,j〕は、係数符号量算出部(143)の入力となる。
次いで、予測誤差符号量推定部(142)は、各前向き予測誤差系列b′m,i〔m=1,2,・・・,j〕、各後向き予測誤差系列bm,i〔m=1,2,・・・,j〕を用いて、予測誤差波形の符号量の推定値〔推定符号量〕Ce〔m=j〕を算出する(ステップS23)。
各推定符号量Ce〔m=j〕は、最適モデル次数探索部(144)の入力となる。
また、係数符号量算出部(143)は、各PARCOR係数γm,m〔m=1,2,・・・,j〕を用いて、個別符号量として係数符号量Cp〔m=1,2,・・・,j〕を算出する(ステップS24)。各係数符号量Cp〔m=1,2,・・・,j〕は、最適モデル次数探索部(144)の入力となる。
ステップS23およびステップS24は、いずれを先行するものとしてもよい。つまり、ステップS21、ステップS22、ステップS23、ステップS24の順序で処理することもできるし、ステップS21、ステップS22、ステップS24、ステップS23の順序で処理することもできる。
次に、最適モデル次数探索部(144)は、逐次に設定されるモデル次数mの係数符号量Cp〔m=1,2,・・・,j〕および推定符号量Ce〔m=j〕を用いて線形予測モデルの最適モデル次数を決定する。その処理を説明する。
まず、最適モデル次数探索部(144)は、モデル次数jにおける合計符号量を算出する(ステップS25)。つまり、モデル次数1からjまでの各個別符号量の合計と、モデル次数jにおける予測誤差波形の推定符号量との合計を求める。
次に、最適モデル次数探索部(144)は、パラメータjがNminに等しいか否かの判定する(ステップS26)。
パラメータjがNminに等しいならば、最適モデル次数探索部(144)はステップS29の処理を実行する。パラメータjがNminに等しくないならば、最適モデル次数探索部(144)はステップS27の処理を実行する。
この段階ではj=Nminであるから、ステップS29の処理を行う。
最適モデル次数探索部(144)は、パラメータMにモデル次数jにおける合計符号量を設定する(ステップS29)。次いで制御部(190)は、パラメータjにnを加算したもの、つまりj+nをパラメータjの新たな値に設定し(ステップS30)、ステップS22〜S26の処理を行うように制御する。
この段階を経れば、ステップS26の処理でパラメータjがNminに等しいと判定されることはないので、ステップS27の処理を行うことになる。
最適モデル次数探索部(144)は、モデル次数jにおける合計符号量〔つまりモデル次数1からjまでの各個別符号量の合計と、モデル次数jにおける予測誤差波形の推定符号量との合計である。〕とMとの大小を判定する(ステップS27)。第2実施形態では、第1実施形態と同様にM>(モデル次数jにおける合計符号量)の成立を判定する。
M>(モデル次数jにおける合計符号量)の成立が真ならば、最適モデル次数探索部(144)はステップS28の処理を実行する。M>(モデル次数jにおける合計符号量)の成立が偽ならば、最適モデル次数探索部(144)はステップS32の処理を実行する。
M>(モデル次数jにおける合計符号量)の成立が偽ならば、最適モデル次数探索部(144)は、最適モデル次数Noptにj−nの値を代入する(ステップS32)。そして、最適モデル次数探索部(144)は最適モデル次数決定処理を終了する。この最適モデル次数Noptを表す次数情報は信号符号化装置(2)の出力となる場合がある。また、最適モデル次数Noptは、PARCOR係数量子化部(145)の入力となりえる。
M>(モデル次数jにおける合計符号量)の成立が真ならば、最適モデル次数探索部(144)は、パラメータjとモデル次数Nmaxとの大小を比較判定する(ステップS28)。第2実施形態では、第1実施形態と同様に、j≧Nmaxの成立を判定する。
j≧Nmaxの成立が真ならば、最適モデル次数探索部(144)は最適モデル次数Noptにパラメータjの値を代入する(ステップS31)。そして、最適モデル次数探索部(144)は最適モデル次数決定処理を終了する。この最適モデル次数Noptを表す次数情報は信号符号化装置(2)の出力となる場合がある。また、最適モデル次数Noptは、PARCOR係数量子化部(145)の入力となりえる。
j≧Nmaxの成立が偽ならば、最適モデル次数探索部(144)はステップS29の処理を実行する。ステップS29以降の処理は上記に説明したとおりである。
第2実施形態では、係数符号量算出部(143)が個別符号量を算出する場合として説明した。係数符号量算出部(143)が全体符号量を算出する場合には、ステップS27の処理において、最適モデル次数探索部(144)は、全体符号量と、モデル次数jにおける予測誤差波形の推定符号量との合計を求めればよい。また、ステップS27の処理において、最適モデル次数探索部(144)は、モデル次数jにおける合計符号量〔つまり全体符号量の合計と、モデル次数jにおける予測誤差波形の推定符号量との合計である。〕とMとの大小を判定すればよい。このことは後述する第3実施形態でも同様である。
最摘モデル次数を得た後の例えば信号符号化に関わる処理を行う場合は、第1実施形態で説明したとおりであるから説明を略する。
《第3実施形態》
本発明の第3実施形態について、図面を参照しながら説明する。
第3実施形態の線形予測モデル次数決定装置のハードウェア構成やプログラムなどは、第1実施形態、第2実施形態の場合と同様であるから説明を略する。
<第3実施形態の線形予測モデル次数決定処理>
図2、図5および図6を参照して、第3実施形態の線形予測モデル次数決定装置(1)における最適モデル次数決定処理の流れを叙述的に説明する。第3実施形態は上記方法Cによって最適モデル次数を決定する。
処理の骨子は第2実施形態と同様であるから、ここでは第2実施形態と異なる部分について説明を行う。
まず、制御部(190)は、パラメータjにNminを設定し、パラメータfに1を設定する(ステップS21a)。ステップS21aに続いて、第2実施形態で説明したステップS22以降の処理を行う。
第2実施形態ではステップS27の処理において、M>(モデル次数jにおける合計符号量)の成立が偽ならば、最適モデル次数探索部(144)はステップS32の処理を実行するとしていたが、第3実施形態では、後述するステップS32a以降の処理を実行する。
最適モデル次数探索部(144)は、j−nの値をパラメータjtempに代入する(ステップS32a)。
次に、最適モデル次数探索部(144)は、パラメータfと定数F〔上記の正整数Fに同じであり、予めメモリに保存記憶されている。〕との大小を比較判定する(ステップS32b)。第2実施形態では、f≧Fの成立を判定する。
この段階では、f≧Fの成立が偽であり、ステップS33の処理が実行される。
最適モデル次数探索部(144)は、パラメータfに1を加算したもの、つまりf+1をパラメータfの新たな値に設定する(ステップS33)。
続いて、最適モデル次数探索部(144)は、パラメータjに1を加算したもの、つまりj+1をパラメータjの新たな値に設定する(ステップS34)。
そして、制御部(190)は、ステップS35〜S39の処理を実行するように制御する。ステップS35の処理はステップS22の処理に、ステップS36の処理はステップS23の処理に、ステップS37の処理はステップS24の処理に、ステップS38の処理はステップS25の処理に、ステップS39の処理はステップS27の処理に同じであるから説明を略する。
ステップS39の処理で、M>(モデル次数jにおける合計符号量)の成立が真ならば、最適モデル次数探索部(144)はステップS40の処理を実行する。ステップS40の処理はステップS29の処理に同じであるから説明を略する。ステップS40の処理に続いてステップS41の処理が行われる。即ち、最適モデル次数探索部(144)は、パラメータjの値をパラメータjtempに代入する(ステップS41)。
ステップS39の処理で、M>(モデル次数jにおける合計符号量)の成立が偽ならば、最適モデル次数探索部(144)はステップS32の処理を実行する。
ステップS32の処理において、f≧Fの成立が真になるまで、ステップS33〜S41の処理が行われる。
ステップS32の処理において、f≧Fの成立が真ならば、最適モデル次数探索部(144)は最適モデル次数Noptにパラメータjtempの値を代入する(ステップS42)。そして、最適モデル次数探索部(144)は最適モデル次数決定処理を終了する。この最適モデル次数Noptを表す次数情報は信号符号化装置(2)の出力となる場合がある。また、最適モデル次数Noptは、PARCOR係数量子化部(145)の入力となりえる。
最摘モデル次数を得た後の例えば信号符号化に関わる処理を行う場合は、第1実施形態で説明したとおりであるから説明を略する。
以上の各実施形態の他、本発明である線形予測モデル次数決定装置・方法は上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。また、上記線形予測モデル次数決定装置・方法において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。
また、上記線形予測モデル次数決定装置における処理機能をコンピュータによって実現する場合、線形予測モデル次数決定装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記線形予測モデル次数決定装置における処理機能がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD−RAM(Random Access Memory)、CD−ROM(Compact Disc Read Only Memory)、CD−R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto-Optical disc)等を、半導体メモリとしてEEP−ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、線形予測モデル次数決定装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。
本発明は、全極型の線形予測モデルを用いた信号分析や信号の符号化などに有用である。
第1実施形態に係わる線形予測モデル次数決定装置のハードウェア構成例を示す図。 線形予測モデル次数決定装置の機能構成例を示すブロック図。 第1実施形態に係わる線形予測モデル次数決定処理の処理フローを示す図。 第2実施形態に係わる線形予測モデル次数決定処理の処理フローを示す図。 第3実施形態に係わる線形予測モデル次数決定処理の処理フローを示す図。 第3実施形態に係わる線形予測モデル次数決定処理の処理フローを示す図(図5に附属する図である。)。 従来の線形予測モデル次数決定装置の機能構成例を示すブロック図。
符号の説明
1 線形予測モデル次数決定装置
141 予測誤差符号量推定部
142 係数符号量算出部
143 最適モデル次数探索部
145 PARCOR係数量子化部
146 線形予測係数変換部
147 予測誤差フィルタ部
148 誤差信号符号化部
190 制御部

Claims (20)

  1. 入力信号から、線形予測モデルが要するサンプル数であるモデル次数が1,・・・,m〔但し、mは2以上の整数Nsupに対して1≦m≦Nsupを満たす整数である。〕の各線形予測モデルのPARCOR係数と、モデル次数mのときの前向き予測誤差系列および/または後向き予測誤差系列と、をそれぞれ算出するPARCOR係数算出手段と、
    モデル次数mのときの上記前向き予測誤差系列および/または上記後向き予測誤差系列から、モデル次数が1,・・・,mのときの上記各PARCOR係数によって与えられる線形予測係数からなるモデル次数mの線形予測モデルの予測値と入力信号との誤差である予測誤差波形の符号量を推定する予測誤差符号量推定手段と、
    モデル次数が1,・・・,mのときの上記各PARCOR係数に対応した符号量〔個別符号量〕、あるいは全てのPARCOR係数に対応する符号量〔全体符号量〕を算出する係数符号量算出手段と、
    1からNsupまでのモデル次数に含まれる複数のモデル次数について、各モデル次数mにおける、上記全体符号量あるいはモデル次数が1,・・・,mのときの上記各個別符号量の合計と、上記予測誤差符号量推定手段によって推定された符号量との合計〔合計符号量〕を求め、合計符号量からモデル次数を1つに決定する最適モデル次数探索手段と
    を備えた線形予測モデル次数決定装置。
  2. 上記予測誤差符号量推定手段は、
    モデル次数mのときの上記前向き予測誤差系列またはモデル次数mのときの上記後向き予測誤差系列の平均的大きさの指標値、
    あるいは、モデル次数mのときの上記前向き予測誤差系列および上記後向き予測誤差系列の両方の系列の平均的大きさの指標値、
    あるいは、モデル次数mのときの上記前向き予測誤差系列の平均的大きさの指標値とモデル次数mのときの上記後向き予測誤差系列の平均的大きさの指標値との平均、
    のいずれかを1/2倍〔但し、hは0以上の整数である。〕したものを用いて予測誤差波形の符号量を推定するものである
    請求項1に記載の線形予測モデル次数決定装置。
  3. 上記予測誤差符号量推定手段は
    デル次数mのときの上記前向き予測誤差系列またはモデル次数mのときの上記後向き予測誤差系列の平均的大きさの指標値の2倍に1+hを加算したものに入力信号のサンプル数を乗じたもの、
    あるいは、モデル次数mのときの上記前向き予測誤差系列および上記後向き予測誤差系列の両方の系列の平均的大きさの指標値の2倍に1+hを加算したものに入力信号のサンプル数を乗じたもの、
    あるいは、モデル次数mのときの上記前向き予測誤差系列の平均的大きさの指標値とモデル次数mのときの上記後向き予測誤差系列の平均的大きさの指標値との平均の2倍に1+hを加算したものに入力信号のサンプル数を乗じたもの、
    のいずれかを予測誤差波形の推定された符号量とする
    請求項2に記載の線形予測モデル次数決定装置。
  4. 上記平均的大きさの指標値は、
    系列の絶対値の平均、あるいは系列のエネルギーの平均の平方根である
    請求項2または請求項3に記載の線形予測モデル次数決定装置。
  5. 上記係数符号量算出手段は、
    上記個別符号量または上記全体符号量を、PARCOR係数の値に依存しない固定長符号の符号量によって求める
    請求項1から請求項4のいずれかに記載の線形予測モデル次数決定装置。
  6. 上記係数符号量算出手段は、
    上記個別符号量または上記全体符号量を、PARCOR係数の値に依存する可変長符号の符号量によって求める
    請求項1から請求項4のいずれかに記載の線形予測モデル次数決定装置。
  7. 上記最適モデル次数探索手段は、
    1からNsupまでのモデル次数に含まれる複数のモデル次数について、各モデル次数mにおける、上記全体符号量あるいはモデル次数が1,・・・,mのときの上記各個別符号量の合計と、上記予測誤差符号量推定手段によって推定された符号量との合計符号量を求め、合計符号量が最小になるときのモデル次数を最適モデル次数として決定するものである
    請求項1から請求項6のいずれかに記載の線形予測モデル次数決定装置。
  8. 最適モデル次数探索手段によってモデル次数が決定されるまで、モデル次数が1つ前のモデル次数よりも大となるように逐次にモデル次数を設定し、設定されたモデル次数ごとに、設定されたモデル次数mについて、上記PARCOR係数算出手段と、上記予測誤差符号量推定手段と、上記係数符号量算出手段と、最適モデル次数探索手段とを実行させる制御手段を備え、
    上記制御手段によって実行を制御される最適モデル次数探索手段は、
    上記制御手段によって設定されたモデル次数mにおける、上記全体符号量またはモデル次数が1,・・・,mのときの上記各個別符号量の合計と、上記予測誤差符号量推定手段によって推定された符号量との合計符号量を求め、その合計符号量が、モデル次数mの1つ前に設定されたモデル次数Mにおける合計符号量よりも大となったときに、モデル次数Mを最適モデル次数として決定するものである
    請求項1から請求項6のいずれかに記載の線形予測モデル次数決定装置。
  9. 最適モデル次数探索手段によってモデル次数が決定されるまで、モデル次数が1つ前のモデル次数よりも大となるように逐次にモデル次数を設定し、設定されたモデル次数ごとに、設定されたモデル次数mについて、上記PARCOR係数算出手段と、上記予測誤差符号量推定手段と、上記係数符号量算出手段と、最適モデル次数探索手段とを実行させる制御手段を備え、
    上記制御手段によって実行を制御される最適モデル次数探索手段は、
    上記制御手段によって設定されたモデル次数mにおける、上記全体符号量またはモデル次数が1,・・・,mのときの上記各個別符号量の合計と、上記予測誤差符号量推定手段によって推定された符号量との合計符号量を求め、その合計符号量がモデル次数mの1つ前に設定されたモデル次数Mにおける合計符号量よりも大となったときのモデル次数M〔暫定最適次数〕から予め定められただけの先のモデル次数までの各モデル次数における合計符号量〔補合計符号量〕について、暫定最適次数での合計符号量よりも少ない補合計符号量となるモデル次数が存在する場合には、当該補合計符号量のうち最小の補合計符号量となるときのモデル次数を最適モデル次数として決定し、暫定最適次数での合計符号量よりも少ない補合計符号量となるモデル次数が存在しない場合には、暫定最適次数を最適モデル次数として決定するものである
    請求項1から請求項6のいずれかに記載の線形予測モデル次数決定装置。
  10. 力信号から、線形予測モデルが要するサンプル数であるモデル次数が1,・・・,m〔但し、mは2以上の整数Nsupに対して1≦m≦Nsupを満たす整数である。〕の各線形予測モデルのPARCOR係数と、モデル次数mのときの前向き予測誤差系列および/または後向き予測誤差系列と、をそれぞれ算出するPARCOR係数算ステップと、
    デル次数mのときの上記前向き予測誤差系列および/または上記後向き予測誤差系列から、モデル次数が1,・・・,mのときの上記各PARCOR係数によって与えられる線形予測係数からなるモデル次数mの線形予測モデルの予測値と入力信号との誤差である予測誤差波形の符号量を推定する予測誤差符号量推定ステップと、
    デル次数が1,・・・,mのときの上記各PARCOR係数に対応した符号量〔個別符号量〕、あるいは全てのPARCOR係数に対応する符号量〔全体符号量〕を算出する係数符号量算出ステップと、
    からNsupまでのモデル次数に含まれる複数のモデル次数について、各モデル次数mにおける、上記全体符号量あるいはモデル次数が1,・・・,mのときの上記各個別符号量の合計と、上記予測誤差符号量推定ステップおいて推定された符号量との合計〔合計符号量〕を求め、合計符号量からモデル次数を1つに決定する最適モデル次数探索ステップと
    を有する線形予測モデル次数決定方法。
  11. 上記予測誤差符号量推定ステップは、
    モデル次数mのときの上記前向き予測誤差系列またはモデル次数mのときの上記後向き予測誤差系列の平均的大きさの指標値、
    あるいは、モデル次数mのときの上記前向き予測誤差系列および上記後向き予測誤差系列の両方の系列の平均的大きさの指標値、
    あるいは、モデル次数mのときの上記前向き予測誤差系列の平均的大きさの指標値とモデル次数mのときの上記後向き予測誤差系列の平均的大きさの指標値との平均、
    のいずれかを1/2倍〔但し、hは0以上の整数である。〕したものを用いて予測誤差波形の符号量を推定するものである
    請求項10に記載の線形予測モデル次数決定方法。
  12. 上記予測誤差符号量推定ステップは
    デル次数mのときの上記前向き予測誤差系列またはモデル次数mのときの上記後向き予測誤差系列の平均的大きさの指標値の2倍に1+hを加算したものに入力信号のサンプル数を乗じたもの、
    あるいは、モデル次数mのときの上記前向き予測誤差系列および上記後向き予測誤差系列の両方の系列の平均的大きさの指標値の2倍に1+hを加算したものに入力信号のサンプル数を乗じたもの、
    あるいは、モデル次数mのときの上記前向き予測誤差系列の平均的大きさの指標値とモデル次数mのときの上記後向き予測誤差系列の平均的大きさの指標値との平均の2倍に1+hを加算したものに入力信号のサンプル数を乗じたもの、
    のいずれかを予測誤差波形の推定された符号量とする
    請求項11に記載の線形予測モデル次数決定方法。
  13. 上記平均的大きさの指標値は、
    系列の絶対値の平均、あるいは系列のエネルギーの平均の平方根である
    請求項11または請求項12に記載の線形予測モデル次数決定方法。
  14. 上記係数符号量算出ステップは、
    上記個別符号量または上記全体符号量を、PARCOR係数の値に依存しない固定長符号の符号量によって求める
    請求項10から請求項13のいずれかに記載の線形予測モデル次数決定方法。
  15. 上記係数符号量算出ステップは、
    上記個別符号量または上記全体符号量を、PARCOR係数の値に依存する可変長符号の符号量によって求める
    請求項10から請求項13のいずれかに記載の線形予測モデル次数決定方法。
  16. 上記最適モデル次数探索ステップは、
    1からNsupまでのモデル次数に含まれる複数のモデル次数について、各モデル次数mにおける、上記全体符号量あるいはモデル次数が1,・・・,mのときの上記各個別符号量の合計と、上記予測誤差符号量推定ステップおいて推定された符号量との合計符号量を求め、合計符号量が最小になるときのモデル次数を最適モデル次数として決定するものである
    請求項10から請求項15のいずれかに記載の線形予測モデル次数決定方法。
  17. 適モデル次数探索ステップにおいてモデル次数が決定されるまで、モデル次数が1つ前のモデル次数よりも大となるように逐次にモデル次数を設定し、設定されたモデル次数ごとに、設定されたモデル次数mについて、上記PARCOR係数算出ステップ、上記予測誤差符号量推定ステップ、上記係数符号量算出ステップ、最適モデル次数探索ステップの各処理を実行させる制御ステップを有し、
    上記制御ステップにおいて実行を制御される最適モデル次数探索ステップは、
    上記制御ステップにおいて設定されたモデル次数mにおける、上記全体符号量またはモデル次数が1,・・・,mのときの上記各個別符号量の合計と、上記予測誤差符号量推定ステップおいて推定された符号量との合計符号量を求め、その合計符号量が、モデル次数mの1つ前に設定されたモデル次数Mにおける合計符号量よりも大となったときに、モデル次数Mを最適モデル次数として決定するものである
    請求項10から請求項15のいずれかに記載の線形予測モデル次数決定方法。
  18. 適モデル次数探索ステップにおいてモデル次数が決定されるまで、モデル次数が1つ前のモデル次数よりも大となるように逐次にモデル次数を設定し、設定されたモデル次数ごとに、設定されたモデル次数mについて、上記PARCOR係数算出ステップ、上記予測誤差符号量推定ステップ、上記係数符号量算出ステップ、最適モデル次数探索ステップの各処理を実行させる制御ステップを有し、
    上記制御ステップにおいて実行を制御される最適モデル次数探索ステップは、
    上記制御ステップにおいて設定されたモデル次数mにおける、上記全体符号量またはモデル次数が1,・・・,mのときの上記各個別符号量の合計と、上記予測誤差符号量推定ステップおいて推定された符号量との合計符号量を求め、その合計符号量がモデル次数mの1つ前に設定されたモデル次数Mにおける合計符号量よりも大となったときのモデル次数M〔暫定最適次数〕から予め定められただけの先のモデル次数までの各モデル次数における合計符号量〔補合計符号量〕について、暫定最適次数での合計符号量よりも少ない補合計符号量となるモデル次数が存在する場合には、当該補合計符号量のうち最小の補合計符号量となるときのモデル次数を最適モデル次数として決定し、暫定最適次数での合計符号量よりも少ない補合計符号量となるモデル次数が存在しない場合には、暫定最適次数を最適モデル次数として決定するものである
    請求項10から請求項15のいずれかに記載の線形予測モデル次数決定方法。
  19. コンピュータ請求項から請求項のいずれかに記載の線形予測モデル次数決定装置として機能させるためのプログラム。
  20. 請求項19に記載のプログラムを記録した、コンピュータに読み取り可能な記録媒体。
JP2006148919A 2006-05-29 2006-05-29 線形予測モデル次数決定装置、線形予測モデル次数決定方法、そのプログラムおよび記録媒体 Active JP4634969B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006148919A JP4634969B2 (ja) 2006-05-29 2006-05-29 線形予測モデル次数決定装置、線形予測モデル次数決定方法、そのプログラムおよび記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006148919A JP4634969B2 (ja) 2006-05-29 2006-05-29 線形予測モデル次数決定装置、線形予測モデル次数決定方法、そのプログラムおよび記録媒体

Publications (2)

Publication Number Publication Date
JP2007318691A JP2007318691A (ja) 2007-12-06
JP4634969B2 true JP4634969B2 (ja) 2011-02-16

Family

ID=38852105

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006148919A Active JP4634969B2 (ja) 2006-05-29 2006-05-29 線形予測モデル次数決定装置、線形予測モデル次数決定方法、そのプログラムおよび記録媒体

Country Status (1)

Country Link
JP (1) JP4634969B2 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4838774B2 (ja) * 2007-07-18 2011-12-14 日本電信電話株式会社 マルチチャネル線形予測符号化の予測係数決定方法及び装置、プログラム、記録媒体
JP4838773B2 (ja) * 2007-07-18 2011-12-14 日本電信電話株式会社 線形予測符号化の予測次数決定方法及びそれを使った予測係数決定方法及び装置、プログラム、その記録媒体
JP5231794B2 (ja) 2007-12-10 2013-07-10 株式会社大協精工 バイアル用プラスチック製キャップ
JP4848049B2 (ja) * 2008-12-09 2011-12-28 日本電信電話株式会社 符号化方法、復号方法、それらの装置、プログラム及び記録媒体
CN102239640B (zh) * 2008-12-09 2015-01-07 日本电信电话株式会社 编码方法、解码方法、使用这些方法的装置
JP4918103B2 (ja) * 2009-01-09 2012-04-18 日本電信電話株式会社 符号化方法、復号方法、それらの装置、プログラム及び記録媒体
JP5281485B2 (ja) * 2009-05-28 2013-09-04 日本電信電話株式会社 双方向予測符号化装置、双方向予測復号装置、それらの方法、それらのプログラム及びその記録媒体
WO2010140591A1 (ja) * 2009-06-03 2010-12-09 日本電信電話株式会社 予測次数決定方法、予測次数決定装置、プログラム及び記録媒体
KR20120129205A (ko) * 2011-05-19 2012-11-28 엘지이노텍 주식회사 스핀들 모터
JP5663461B2 (ja) * 2011-12-06 2015-02-04 日本電信電話株式会社 符号化方法、符号化装置、プログラム、記録媒体
JP6959559B2 (ja) * 2017-06-14 2021-11-02 日本電信電話株式会社 データ数決定装置、データ数決定方法及びデータ数決定プログラム
JP6849542B2 (ja) * 2017-06-14 2021-03-24 日本電信電話株式会社 クラス決定装置、クラス決定方法及びクラス決定プログラム
CN112767957A (zh) * 2020-12-31 2021-05-07 科大讯飞股份有限公司 获得预测模型的方法、语音波形的预测方法及相关装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007279385A (ja) * 2006-04-06 2007-10-25 Nippon Telegr & Teleph Corp <Ntt> マルチチャネル符号化方法、その装置、そのプログラム及び記録媒体
JP2007286146A (ja) * 2006-04-13 2007-11-01 Nippon Telegr & Teleph Corp <Ntt> 適応ブロック長符号化装置、その方法、プログラム及び記録媒体

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1780705B1 (en) * 2004-08-19 2011-01-12 Nippon Telegraph And Telephone Corporation Multichannel signal decoding method, device, program, and its recording medium

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007279385A (ja) * 2006-04-06 2007-10-25 Nippon Telegr & Teleph Corp <Ntt> マルチチャネル符号化方法、その装置、そのプログラム及び記録媒体
JP2007286146A (ja) * 2006-04-13 2007-11-01 Nippon Telegr & Teleph Corp <Ntt> 適応ブロック長符号化装置、その方法、プログラム及び記録媒体

Also Published As

Publication number Publication date
JP2007318691A (ja) 2007-12-06

Similar Documents

Publication Publication Date Title
JP4634969B2 (ja) 線形予測モデル次数決定装置、線形予測モデル次数決定方法、そのプログラムおよび記録媒体
JP5603484B2 (ja) 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体
JP4691082B2 (ja) 線形予測モデル次数決定装置、線形予測モデル次数決定方法、そのプログラムおよび記録媒体
JP5596800B2 (ja) 符号化方法、周期性特徴量決定方法、周期性特徴量決定装置、プログラム
JP6422813B2 (ja) 符号化装置、復号装置、これらの方法及びプログラム
JP6867528B2 (ja) 周期性統合包絡系列生成装置、周期性統合包絡系列生成方法、周期性統合包絡系列生成プログラム、記録媒体
KR101762205B1 (ko) 부호화 방법, 부호화 장치, 프로그램 및 기록 매체
CN104321814A (zh) 编码方法、解码方法、编码装置、解码装置、程序以及记录介质
JP4658852B2 (ja) 適応ブロック長符号化装置、その方法、プログラム及び記録媒体
JP6412993B2 (ja) 符号化装置、復号装置、符号化方法、復号方法、符号化プログラム、復号プログラム、記録媒体
JP2012128022A (ja) 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体
JP4989095B2 (ja) マルチチャネル符号化方法、その装置、そのプログラム及び記録媒体
JP2007286200A (ja) 適応ブロック長符号化装置、その方法、プログラム及び記録媒体
JP5663461B2 (ja) 符号化方法、符号化装置、プログラム、記録媒体
JP4691050B2 (ja) Parcor係数算出方法、及びその装置とそのプログラムと、その記憶媒体
JP5336942B2 (ja) 符号化方法、復号方法、符号化器、復号器、プログラム
JP4746532B2 (ja) 線形予測係数算出方法、及びその装置とそのプログラムと、その記憶媒体
JP4918103B2 (ja) 符号化方法、復号方法、それらの装置、プログラム及び記録媒体
JP5714172B2 (ja) 符号化装置、この方法、プログラムおよび記録媒体
JP5579932B2 (ja) 符号化方法、装置、プログラム及び記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080804

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100819

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100831

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101022

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101109

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101119

R150 Certificate of patent or registration of utility model

Ref document number: 4634969

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131126

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350