JP4691050B2 - Parcor係数算出方法、及びその装置とそのプログラムと、その記憶媒体 - Google Patents

Parcor係数算出方法、及びその装置とそのプログラムと、その記憶媒体 Download PDF

Info

Publication number
JP4691050B2
JP4691050B2 JP2007017921A JP2007017921A JP4691050B2 JP 4691050 B2 JP4691050 B2 JP 4691050B2 JP 2007017921 A JP2007017921 A JP 2007017921A JP 2007017921 A JP2007017921 A JP 2007017921A JP 4691050 B2 JP4691050 B2 JP 4691050B2
Authority
JP
Japan
Prior art keywords
prediction error
parcor coefficient
sample
unit
parcor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2007017921A
Other languages
English (en)
Other versions
JP2008185701A (ja
Inventor
健弘 守谷
登 原田
優 鎌本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2007017921A priority Critical patent/JP4691050B2/ja
Publication of JP2008185701A publication Critical patent/JP2008185701A/ja
Application granted granted Critical
Publication of JP4691050B2 publication Critical patent/JP4691050B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

この発明は、例えば音声音響信号などの分析や符号化のための線形予測分析技術を利用する音声予測符号化装置等に用いて好適な、PARCOR係数算出方法及び、その装置、そのプログラムとそのプログラムを記憶する記憶媒体に関する。
従来から線形予測分析手法のひとつとして自己相関法や共分散法がよく知られている。いずれも予測誤差信号のエネルギーを最小にすることを目的としている。この線形予測分析手法を音声音響信号に利用した一例として、PARCOR係数算出装置を用いた音声予測符号化装置120を図20に示し、その動作を説明する。
音声予測符号化装置120は、入力端子122から入力される離散的時系列ディジタル信号x,(i:整数、以降、ディジタル信号xと称す)を、所定サンプル数Nごとのフレームに分割するフレーム化部124と、各フレーム毎に所定の次数のPARCOR係数を算出するPARCOR係数算出装置126と、PARCOR係数を符号化するPARCOR係数量子化部128と、PARCOR係数を通常の線形予測係数に変換する係数変換部130と、線形予測係数とディジタル信号xとから予測値を計算し、ディジタル信号xから予測値を減算して線形予測誤差信号を生成する線形予測分析フィルタ132と、線形予測誤差信号を例えばエントロピー符号化する予測誤差符号化部134とで構成される。
全極型の線形予測分析手法としては、いくつかあるがその一つとしてPARCOR係数を直接求める方法が知られている。その算出方法は、非特許文献1にBurg法として説明されている。
Burg法の概要を説明する。Burg法では、モデル次数m−1の線形予測モデルをモデル次数mの線形予測モデルに拡張することを考える。つまり、Burg法では、線形予測モデルのPARCOR係数を、あるモデル次数m−1におけるPARCOR係数から当該モデル次数よりも1大きいモデル次数mにおけるPARCOR係数を求める漸化関係から算出する。
与えられたデータをx,x,・・・,xとする。このとき、予測誤差フィルター(モデル次数mの線形予測モデル)にデータx,x,・・・,xを前向きに通す場合および後向きに通す場合の平均出力P〔式(1)参照。〕が最小になることを条件として採用する。但し、γm,k(k=1,2,・・・,m)はモデル次数mの線形予測係数である。
Figure 0004691050
ここでγm,k(k=1,2,・・・,m)は、式(2)、つまり式(3)で表される関係がある〔Levinsonアルゴリズム;非特許文献1参照。〕。
Figure 0004691050
式(2)あるいは式(3)を用いて、式(1)を書き換えると、式(4)を得る。
Figure 0004691050
ここで、fm,iは式(5)で表される。fm,iを後向き予測誤差サンプルと呼ぶことにする。
m,iは式(6)で表される。gm,iを前向き予測誤差サンプルと呼ぶことにする。
Figure 0004691050
なお、前向き予測誤差サンプルおよび後向き予測誤差サンプルには式(7)、式(8)で表される関係がある〔非特許文献1参照。〕。
Figure 0004691050
このとき、平均出力Pを最小にするという条件からγm,m〔いわゆるPARCOR係数である。〕について式(9)を得る。
Figure 0004691050
つまりPARCOR係数γm,mは、前向き予測誤差サンプルgm,i(i=1,・・・,N−m;以下同様、以下サンプルは、特に必要が無いところでは省略する。)と後向き予測誤差fm,iの内積〔式(9)の分子に相当する。〕を、前向き予測誤差gm,iおよび後向き予測誤差fm,iの各エネルギーの平均〔以下、「平均エネルギー」という。式(9)の分母に相当する。〕で除したものとして表される。
なお、モデル次数m(以下、単に「次数m」ともいう。)のときの線形予測係数γm,k(k=1,2,・・・,m−1)は式(3)で与えられる。線形予測係数γm,k(k=m)はPARCOR係数として式(9)で与えられる。
従来のPARCOR係数算出装置126の機能構成例を図21に、その動作フローを図22に示して、更に動作を説明する。PARCOR係数算出装置126は、初期値設定部136と、それら初期値と、それぞれの初期値が更新されたそれらの値を記憶するレジスタ138と、前向き予測誤差更新部140と後向き予測誤差更新部142と、PARCOR係数算出部144と、求めるPARCOR係数の次数Mを設定するPARCOR係数次数M設定部146とから構成される。
PARCOR係数算出部144は、ディジタル信号xを読み込み、初期値として1次の(m=1)の前向き予測誤差g1,i=x、後向き予測誤差f1,i=xi+1を設定する(ステップS10)。そして、初期値設定部156内の1次PARCOR係数生成部136aにおいて、式(9)の演算を行って1次のPARCOR係数γ1,1を算出する(ステップS12)。それら1次の初期値はレジスタ138に記憶される。今、例えばPARCOR係数次数M設定部146にM=1が設定されていたとすると、1次のPARCOR係数γ1,1を求めた段階で動作を終了する(ステップS14、Yes)。
PARCOR係数次数M設定部146に、より大きな値が設定されていたとすると、ステップS16で次数mが2次に更新される。次数mが2に更新されると、前向き予測誤差更新部140は、レジスタ138から1次の前向き予測誤差g1,iと後向き予測誤差f1,iと1次のPARCOR係数γ1,1とを読み込み、式(8)の演算を行って2次の前向き予測誤差g2,iを算出し、その値をレジスタ138に記憶すると共にPARCOR係数算出部144に出力する(ステップS18)。なお、レジスタ138は必須の構成要素ではない。各値を各部で記憶するようにしてもよい。
後向き予測誤差更新部142も式(7)の演算を行って、前向き予測誤差更新部160と同様に2次の後向き予測誤差f2,iを算出し、その値をレジスタ138に記憶すると共にPARCOR係数算出部144に出力する(ステップS20)。
1個のCPUや、1個のシステムクロックを動作の基本単位にしたハードウェアで構成される装置では、各ステップは時系列的に処理されるのが普通であるが、図21の動作フロー図は、PARCOR係数を演算する式(9)をイメージし易いように、一部の動作ステップを並列に表記している。
2次の前向き予測誤差g2,iと2次の後向き予測誤差f2,iが、PARCOR係数算出部144に入力され、PARCOR係数算出部144内の内積演算部144aで式(9)の分子に示す内積値Vが演算される。PARCOR係数算出部144内のエネルギー演算部144bでは、ステップS24で2次の前向き予測誤差g2,iのエネルギーFを算出し、ステップS26で2次の後向き予測誤差f2,iのエネルギーGを算出し、ステップS28で式(9)の分母に相当する演算を行う。
そしてPARCOR係数算出部144内の除算部144cにおいて2次のPARCOR係数γ2,2が演算される(ステップS30)。更新されたPARCOR係数γ2,2は、外部に出力されると共にレジスタ138に記憶される。PARCOR係数次数M設定部146の設定値Mが2であると、2次のPARCOR係数を算出した時点で動作を終了する(ステップS14)。Mがm=2より大きな値の場合は、ステップS16からの処理をm=Mになるまで繰り返してより高次のPARCOR係数を算出する動作を繰り返す。なお、PARCOR係数次数M設定部146で設定されるMは、固定値としてPARCOR係数算出部144内に持たせてもよい。
日野幹雄著、"スペクトル解析"、12.4章、朝倉書店、1979
しかしながら従来の方法で求めたPARCOR係数を用いて、例えば音声符号化装置を構成した場合に、求めた線形予測誤差信号をエントロピー符号化しても符号量が最小にならない。良く知られているようにエントロピー符号化は、発生頻度の対数に符号長を比例させるものである。つまり、発生頻度の大きな入力に、ビット数の少ない符号を割り当てることで、全体の符号量を減らす方法である。通常の音声の圧縮では、符号長が振幅に比例するライス符号が使われ、符号量を最小にするためには振幅の絶対値の和を最小化する必要があり、平均出力P(式(4))を最小とする関係から得られたPARCOR係数から求められた線形予測誤差信号を、エントロピー符号化しても符号量は最小にならない。
この発明は、このような問題点に鑑みてなされたものであり、平均出力Pを最小とする関係からではなく前向き予測誤差と後向き予測誤差の振幅の絶対値を最小化の近似を行ってする基準でPARCOR係数を求めることで、線形予測誤差信号をエントロピー符号化する際の符号量を小さくすることが出来るPARCOR係数算出方法、及びその装置とそのプログラムと、その記憶媒体を提供することを目的とする。
この発明によるPARCOR係数算出装置は、離散的時系列ディジタル信号を所定サンプル数毎にフレーム分割するフレーム化部の出力信号を入力とし、逐次次数を増やしてPARCOR係数を求めるPARCOR係数算出装置であり、初期値設定部と前向き予測誤差サンプル生成部と後向き予測誤差サンプル生成部と符号長近似部とPARCOR係数算出部とを具備する。
初期値設定部は、フレーム化部の出力信号を入力として、初期値としての前向き予測誤差サンプルと後向き予測誤差サンプルと1次のPARCOR係数を設定する。
前向き予測誤差サンプル生成部は、フレーム化部の出力信号と初期値設定部が設定した初期値と1サンプル前のPARCOR係数を入力として、前向き予測誤差サンプルを生成する。
後向き予測誤差サンプル生成部は、フレーム化部の出力信号と初期値設定部が設定した初期値と1サンプル前のPARCOR係数を入力として、後向き予測誤差サンプルを生成する。
符号長近似部は、前向き予測誤差サンプルと後向き予測誤差サンプルの、それぞれの振幅の絶対値を微分可能な連続関数に近似して、前向き予測誤差符号と後向き予測誤差符号を算出する。
PARCOR係数算出部内の数値解析手段が、前向き予測誤差符号と後向き予測誤差符号を累計した符号量を各次のPARCOR係数で偏微分した値が0となるPARCOR係数を算出する。
又は、この発明によるPARCOR係数算出装置は、前向き予測誤差サンプルと後向き予測誤差サンプルの振幅が大きいほど抑圧する重み係数を生成する重み係数生成部と、
前向き予測誤差サンプルと後向き予測誤差サンプルとの内積値を演算し、内積値に上記重み係数を乗算する内積演算部と、
前向き予測誤差サンプルと後向き予測誤差サンプルの、それぞれのエネルギー値を演算し、それぞれのエネルギー値に上記重み係数を乗算するエネルギー演算部と、
重み係数が乗算された内積値を、重み係数が乗算されたエネルギー値の平均値で除する除算部とを備え、
重み係数が乗算された内積値を、重み係数が乗算されたエネルギー値の平均値で除算してPARCOR係数を算出する。
この発明によれば、PARCOR係数を求めるにあたって、従来の平均出力Pを最小にする関係からではなく前向き予測誤差と後向き予測誤差の振幅の絶対値を最小化する基準でPARCOR係数を求める。この発明によるPARCOR係数算出装置を例えば音声符号化装置に利用すると、従来のPARCOR係数算出装置を用いて求めた線形予測誤差信号の符号量よりも符号量を減らすことが出来る。
以下、この発明の実施の形態を図面を参照して説明する。複数の図面中同一のものには同じ参照符号を付し、説明は繰り返さない。
この発明のPARCOR係数算出装置10の実施例1の機能構成例を図1に、動作フローを図2に示す。この発明のPARCOR係数算出装置10は、従来技術の一例として図19に示した音声予測符号化装置120内のPARCOR係数算出装置126に相当するものである。
PARCOR係数算出装置10は、符号長近似部12が、前向き予測誤差更新部140及び後向き予測誤差更新部142と、PARCOR係数算出部14との間に配置されている点、及び、PARCOR係数算出部14が数値解析手段14aを備え、PARCOR係数を数値解析で導出する点が、従来技術で説明したPARCOR係数算出装置124と異なる。
この実施例1の要部は、符号長近似部12で前向き予測誤差と上記後向き予測誤差の、それぞれの振幅の絶対値を微分可能な連続関数に近似する部分と、PARCOR係数算出部14内に数値解析手段14aを備える部分である。
従来のPARCOR係数の算出方法は、上記したように平均出力Pを最小にする条件から求められる。式(4)から分かるように、前向き予測誤差gm,iと後向き予測誤差fm,iの二乗和の最小化基準で、従来はPARCOR係数を求めていた。しかし、予測誤差をエントロピー符号化した後の符号量を最小化するためには、前向き予測誤差gm,iと後向き予測誤差fm,iの振幅の絶対値の和を最小化する基準でPARCOR係数を求めた方が目的に近くなる。
予測誤差の振幅の頻度分布は指数分布で近似できる。前向き予測誤差gm,iと後向き予測誤差fm,i(以降、予測誤差信号とも称す)の振幅xの頻度分布を模式的に図3(a)に示す。図3(a)の横軸は、予測誤差信号の振幅x、縦軸はその頻度である。予測誤差信号の振幅xの頻度分布は、振幅が小さいと頻度Fが高く、振幅が大きいと頻度Fが低くなる。すなわち頻度の対数は振幅に比例する例えば、e−axのような指数関数で近似できる。
これを横軸を時間、縦軸を予測誤差信号の±振幅xで時系列に模式的に表わすと、図3(b)のように表わせる。つまり、振幅xの小さな予測誤差信号が多く、振幅の大きな予測誤差信号が少ない。
したがって、符号量を最小化する目的で、振幅が小さい予測誤差信号の符号長を小さく、振幅が大きい予測誤差信号の符号長を大きくする近似を行う。その関係を図3(c)に模式的に示す。図3(c)の横軸は中央を0として一方は+振幅、他方は−振幅であり、縦軸は符号長を表わす。符号長は予測誤差信号の振幅が0でも0にはならずに所定の値を持つ。
振幅の絶対値が大きくなればそれに比例して符号長も大きくなる。このように近似した符号長から符号量を求め、この符号量を最小化するようにPARCOR係数を求める。こうして求めたPARCOR係数から予測誤差信号を求めると、フレーム全体の符号量を最小化することが出来る。なお、PARCOR係数を順次決定するにあたり、次数毎に異なる誤差基準を使ってもよい。
例えばライス符号でエントロピー符号化した場合、予測誤差信号の1サンプル当たりの符号長は、予測誤差信号の振幅xの2倍で近似出来る。これは、ライス符号の符号長E(x)が、振幅xに対して式(10)に示す関係であることによる。
E(x)=2|x+0.25|+0.5 (10)
ところが、絶対値は微分値が常に一定で、原点で微分出来ないので、微分に基づく最小化基準として使えない。
そこでこの発明では、予測誤差信号の振幅の絶対値を近似する微分可能な連続関数を用いる。この実施例1では、その連続関数の一つとして式(11)に示す関数を使うことを考える。
E(x)=2(δ+x (1/q) (11)
ここでδは定数である。特にq=2の場合が計算上簡便である(式(12))。
Figure 0004691050
E(x)を振幅xで微分する(式(13))。
Figure 0004691050
式(13)をPARCOR係数γm,mで微分する(式14)。
Figure 0004691050
式(14)からxがδより十分大きいときは、2xで近似出来る。xがδより小さい時は、式(13)からxの微分が一次関数2xで近似できるからxは2次関数で近似できる。
式(12)のδをδ=0.5とした符号長の特性を図4に示す。横軸は予測誤差信号xの振幅、縦軸は符号長E(x)である。振幅=0の時の符号長は1.414、振幅=±1の符号長は2.44、振幅=±2の符号長は4.24、振幅±7以上の振幅は、2×xの一次関数である。つまり、予測誤差信号xの振幅の絶対値に比例した符号長を得ることが出来る。
このように近似した絶対値近似誤差による全体の推定符号量Jtotalは、式(16)で計算出来る。
Figure 0004691050
但し、E(ζ)とE(η)は、式(17)と(18)に示すように後向き予測誤差更新部142及び前向き予測誤差更新部140において更新された予測誤差更新値を式(12)で近似した値である。つまり、符号長近似部12は、それぞれの予測誤差更新値の振幅の絶対値を微分可能な連続関数に近似(図2のステップS32、S34)して、PARCOR係数算出部14に出力する。
Figure 0004691050
この実施例のPARCOR係数算出部14内で使われる予測誤差更新値は、式(17)及び(18)の近似が行われた値である。
totalをPARCOR係数γm,mで最小化する目的で式(16)を、PARCOR係数γm,mで微分して0と置いた式を解く。
Figure 0004691050
参考までにE(x)=x の場合は、
Figure 0004691050
式(18-1)からPARCOR係数γm,mを求めると式(9)になる。
この実施例では、上記した式(12)を用いて予測誤差信号の振幅の絶対値を近似しているので、式(19)を満たすPARCOR係数γm,mをPARCOR係数算出部14内の数値解析手段14aで数値解析により導出される(ステップS36)。
Figure 0004691050
このようにして求めたPARCOR係数は、絶対値近似誤差の振幅を最小にするものであるので、そのPARCOR係数に基づいて求めた線形予測誤差をエントロピー符号化した際の符号量を最小にすることが出来る。
なお、全体の推定符号量Jtotalを、前向き予測誤差符号長と後向き予測誤差符号長とを累計した符号量を最小にする関係からPARCOR係数γm,mを求める方法で説明を行ったが、式(20)、(21)に示すように前向き予測誤差符号長若しくは後向き予測誤差符号長の一方の推定符号量を微分して0と置いた式を解くことでPARCOR係数γm,mを求めることも可能である。
Figure 0004691050
予測誤差信号の振幅の絶対値近似誤差による符号量Jを、PARCOR係数γm,mで偏微分した式(19)の分母であるum,i=(fm,i+γm,m・gm,iとvm,i=(gm,i+γm,m・fm,iは、本来PARCOR係数γm,mの関数であるので、式(19)は、手間のかかる数値解析を用いないと解けない。
そこで、実施例2では、前向き予測誤差のエネルギーum,iと後向き予測誤差のエネルギーvm,iを、PARCOR係数γm,mとは無関係なエネルギーの推定値とする近似を導入する。つまり、式(22)、(23)のように近似する。
Figure 0004691050
ここでφとψは、個々の予測誤差信号に依存しない1以下の定数である。低次すなわちmが小さい時には、一般にγm,mが大きく、近似する前の式(19)の分母の(fm,i+γm,m・gm,iや(gm,i+γm,m・fm,iは、次の次数の予測誤差信号のエネルギーの和そのものの値(fm,i +gm,i )よりも小さい場合が多い。そこで、mが小さい時にはφとψを1より小さい値に設定し、mが大きい場合、例えばmが10以上の範囲では1に設定するとよい。
例えば、φとψは、φ=φ (1-γm−1,m−1 )、ψ=ψ (1-γm−1,m−1 )で近似することも可能である。
このγm,mと無関係な近似を導入した結果、式(19)は式(24)に書き換えられる。これをPARCOR係数γm,mについて解くと式(25)になる。
Figure 0004691050
Figure 0004691050
式(25)から、内積の各要素に1/√(δ+um,i)+1/√(δ+vm,i)を乗算し、前向き予測誤差の更新値のエネルギー値Fと後向き予測誤差のエネルギー値Gの各要素に1/√(δ+um,i)と1/√(δ+vm,i)を乗算すれば、式(25)は従来のPARCOR係数を算出する式(9)と同じ形になることが分かる。
したがって、式(25)の各要素に重み付けすることで、従来と同じ方法でPARCOR係数を求めることが可能になる。実施例2のPARCOR係数算出装置40の機能構成例を図5に、その動作フローを図6に示す。実施例2は、図1の実施例1に対してPARCOR係数算出部46内に従来のPARCOR係数算出部144と同じように、内積演算部144aとエネルギー演算部144bと除算部144cを備える。これら内積演算部144aとエネルギー演算部144bは、予測誤差更新値の振幅の絶対値を微分可能な連続関数に近似する演算も同時に行うものである。更にそれらに加えて誤差近似部46aと重み係数生成部46bが設けられている点とが異なる。
更新された前向き予測誤差gm,iと後向き予測誤差fm,iとを入力として、エネルギー演算部144bが前向き予測誤差エネルギーF(ステップS36)と、後向き予測誤差エネルギーG(ステップS38)を算出する。内積演算部144aが、微分可能な連続関数に近似された前向き予測誤差gm,iと後向き予測誤差fm,iとの内積を演算する(ステップS40)。
誤差近似部46aは、前向き予測誤差エネルギーFと、後向き予測誤差エネルギーGを入力として式(20)と(21)の演算を行いPARCOR係数γm,mと無関係なエネルギーの推定値um,iとvm,iとを算出する(ステップS42)。um,iとvm,iとは、PARCOR係数算出部内46の重み係数生成部46bに入力される。重み係数生成部46bは、内積値Vに乗算する重み係数1/√(δ+um,i)+1/√(δ+vm,i)と、前向き予測誤差の更新値のエネルギー値Fと後向き予測誤差のエネルギー値Gに乗算する重み係数1/√(δ+um,i)と1/√(δ+vm,i)を生成(ステップS44)し、それらを重み付け部46cに出力する。重み付け部46cは、重み係数1/√(δ+um,i)+1/√(δ+vm,i)を内積値に乗算する(ステップS46)。更に、前向き予測誤差の更新値のエネルギー値Fに重み係数1/√(δ+um,i)を、後向き予測誤差のエネルギー値Gに重み係数1/√(δ+vm,i)を乗算する(ステップS48とステップS50)。
重み付けされた前向き予測誤差の更新値のエネルギー値Fと後向き予測誤差のエネルギー値Gは、再びエネルギー演算部144bに入力され、平均エネルギーUが算出される(ステップS52)。
重み付けされた内積値Vと平均エネルギーUは、除算部144cに入力され、
内積値を平均エネルギー値で除算することでm次のPARCOR係数が算出される(ステップS54)。なお、内積演算部144aとエネルギー演算部144bは、予測誤差更新値の振幅の絶対値を微分可能な連続関数に近似する演算も同時に行う例で説明を行ったが、実施例1と同じように、PARCOR係数算出部46に予測誤差更新値が入力される前に符号長近似部42で近似演算を行ってもよい。
次に前向き予測誤差のエネルギーum,iと後向き予測誤差のエネルギーvm,iの近似を更に粗くした実施例3を説明する。実施例2のφとψを一つの値σで近似して、前向き、後向き予測誤差エネルギーの推定値として式(26)のように定義し、実施例2で説明したum,iとvm,iに共通にwm,iを使うことを考える。この結果、上記した式(25)は、式(27)で書ける。
Figure 0004691050
Figure 0004691050
式(27)から前向き予測誤差gm,iと後向き予測誤差fm,iを、1個の重み係数を乗算した形で、次のように近似出来る。
Figure 0004691050
この1個の重み係数(δ+wm,i-1/4を用いることで、PARCOR係数γm,mを算出する式(27)は次の式(30)で表わせる。
Figure 0004691050
式(30)は従来のPARCOR係数を算出する式(9)と同じである。すなわち、誤差の大きい予測誤差信号の振幅を小さくする重みを各予測誤差信号に乗算した系列を求め、その系列を予測誤差信号系列とみなして、従来のPARCOR係数を算出する手順と同じ手順で算出することが出来る。つまりwm,iの大きなサンプルは抑圧される。
実施例3の場合の動作フローを図7に示す。前向き、後向き予測誤差エネルギーの推定値を一つにしているために、実施例2の動作フロー(図6)と一部が異なる。前向き予測誤差gm,iと後向き予測誤差fm,iのそれぞれについての重みは式(28)、(29)に示すように(δ+wm,i-1/4であるが、PARCOR係数γm,mを算出する式(30)の分母及び分子は、それぞれが重み係数が二乗された形なので、ステップS58で生成する重みは(δ+wm,i-1/2である。そして、後向き予測誤差エネルギーGと前向き予測誤差エネルギーFと内積値Vのそれぞれ、同一の重み係数(δ+wm,i-1/2が乗算される(ステップS60、S62、S64)。その他の動作ステップは、実施例2と同じである。
またこのとき、重み係数(δ+wm,i-1/4の性質から、実施例3’として下記のような近似も可能である。フレーム内の前向き予測誤差gm,iと後向き予測誤差fm,iの絶対値平均値τを式(31)とした場合に、wm,i≦τの予測誤差信号又は(√(σ)fm,i)≦τあるいは(√(σ)gm,i)≦τの、τより小さいと推定される予測誤差信号には、重み係数を乗算せず単に式(32)(33)としてもよい。絶対値平均値τは、フレーム内の前向き予測誤差gm,iと後向き予測誤差fm,iを一度全て走査して求められる値である。
Figure 0004691050
Figure 0004691050
一方、τ≦wm,iの場合は予測誤差信号が大きいので、上記した式(28)(29)を使用する。
また、fm,iやgm,iに対してδは無視することも可能であり、結果的に式(34)(35)として式(30)を解くこともできる。
Figure 0004691050
この実施例3’の式(31)を演算する絶対値平均算出部50と、絶対値平均τと各予測誤差信号との大きさを比較する比較部52を、図5の機能構成例のPARCOR係数算出部46内に破線で示す。実施例3’の動作フローを図8に示す。
絶対値平均算出部50が式(29)の演算を行ってそれぞれの予測誤差信号の絶対値平均τを算出する(ステップS80)。比較部52が、各予測誤差信号のエネルギーの近似値と、絶対値平均の二乗値τを比較(ステップS82とS84)して、τよりも小さいエネルギーの近似値wm,iになる各予測誤差信号については、重み係数が乗算されない点が実施例3と異なる。他の動作ステップは実施例3と同じである。
実施例3’によれば、予測誤差信号が大きい場合にのみ重み係数が乗算されるので演算量を減らすことが出来る。
実施例4として繰り返しPARCOR係数を修正する方法を示す。この繰り返しPARCOR係数を修正して求める方法は、上記した各実施例について適用可能である。構成及び動作フローが最も単純な実施例1に繰り返しPARCOR係数を修正する方法を適用した実施例4の動作フローを図9に示して動作を説明する。機能構成としては、PARCOR係数算出部14に、繰り返し部90と終了判定部92が追加される。この構成を図1のPARCOR係数算出部14内に破線で示す。
実施例4では、繰り返し部90が終了判定部92に設定された終了条件を満足するまで、PARCOR係数を求める動作を繰り返す。ステップS36で一度求めたPARCOR係数γm,mを使って前向き予測誤差及び、後向き予測誤差を再計算するのでPARCOR係数算出装置として性能を高めることが出来る。
繰り返す回数は、終了判定部92内の回数判定部92aが、所定回数を数えると出力する終了信号が出力されるまでとしてもよい。または、終了判定部92内の収束判定部92bが、前回と今回のPARCOR係数が収束した時点、すなわち変化量が決められた値より小さくなった時点としてもよい。
予測誤差信号をエントロピー符号化するのにライス符号を使うと、その符号長は、上記した式(10)で求められ、予測誤差信号の振幅xに対して例えば図10に示すようになる。振幅1に対して符号長3、振幅−1に対して符号長2、振幅2に対して符号長5、振幅−2に対して符号長4となる。−振幅の符号長は、+振幅の符号長より符号長が1つ少ない。
予測誤差信号の振幅は例えば1万と言った数が想定されるので、その1万の振幅を全てライス符号化すると、符号が2万ビットと極めて大きな値になってしまう。そこで、振幅が大きい場合には、下位のビットを固定長符号化し、所定のビット以上をエントロピー符号化(可変長符号化)する方法が考えられる。その固定長符号化と可変長符号化を組み合わせた実施例5の機能構成例を図11に示す。
実施例5は実施例3に対して符号長近似部82内に可変長符号化開始ビット設定部111を備えたことを特徴とする。他の構成は実施例3と同じである。
可変長符号化開始ビット設定部111は、絶対値平均算出部50と可変長符号化開始ビット計算部111bとで構成される。絶対値平均算出部50は、実施例3で説明したフレーム内の前向き予測誤差gm,iと後向き予測誤差fm,iの絶対値平均値τを式(31)で計算するものと同じものである。絶対値平均値τは、可変長符号ビット計算部111bに入力され、例えば式(36)に基づいて可変長符号化開始ビットであるβが計算される。
Figure 0004691050
ただし、{ }は小数点以下の切捨てを表わす。
この可変長符号化開始ビットβを求める方法は、ISO規格(ISO/IEC14496-5 2001/AMD 10 Reference Software
)に例示されている。
こうして求めた可変長符号化開始ビットβを用いて、βビット以上のビットを例えばライス符号化した予測誤差信号の符号長は、式(37)で計算出来る。
E(x)=2|(x/2β)+0.25|+β+0.5 (37)
符号長E(x)は式(38)で近似出来る。ここでxは、前向き予測誤差gm,iと後向き予測誤差fm,iの振幅である。
Figure 0004691050
符号長E(x)の近似式である式(38)で符号長を計算した例を図12に示す。図12の横軸と縦軸の交点は、2β未満の振幅を意味し、交点を中心に振幅の絶対値が2β以上の範囲を±で表わす。縦軸は符号長である。図12は、ライス符号の例を示した図10と対比することで容易に理解出来る。2β未満の振幅は、β+1ビットであり縦軸上の○で表わされる。2βの振幅はβ+3ビットとなる。図10からも明らかなように、ライス符号では、−側の振幅の符号長が1ビット少ないので、2β未満の振幅に対して符号長は左右対称ではない。振幅が−2βの時の符号長は、β+2ビットとなる。振幅がその倍(−2β×2)の時の符号長はβ+4ビットとなる。
このように近似したE(x)を振幅xで微分する(式(39))。
Figure 0004691050
式(39)をPARCOR係数γm,mで微分する(式(40))。
Figure 0004691050
Figure 0004691050
式(41)から以下が導かれる。
Figure 0004691050
式(42)の0.25fm,i/2βの項である式(43)と(44)は、音声信号と仮定すると、交流波形なので平均値は0と近似出来る。したがって、式(19)との違いは、分母の定数だけの違いとなり次の式(45)を使えばよい。
Figure 0004691050
Figure 0004691050
この場合、図13に示すように予測誤差信号の振幅が2βより大きい場合には、式(46)に示す重みを使う。
Figure 0004691050
この重みは、可変長符号化開始ビットβ以上の予測誤差信号xに適用される。可変長符号化開始ビットβ未満の符号化ビット数は、振幅の大小とは無関係なので、重みを小さくして軽視すればよい。
ただし振幅が2βに近い予測誤差信号は予測係数が更新される時に、振幅が2βより大きくなる場合も考えられるので、図13に示すような重み係数κを使えばよい。図13の横軸は、予測誤差信号xの振幅であり、縦軸は重みκである。可変長符号化開始ビットβ以上の予測誤差信号には、式(46)で計算される重み係数を掛ける。つまり、振幅の大きな予測誤差信号は軽視するように小さな重み係数を掛ける。可変長符号化開始ビットβ未満の予測誤差信号は、つまり重さ1を乗算する。又は、可変長符号化開始ビットβ未満の予測誤差信号には、図10中に破線で示すように符号長2βに対する重み係数よりも小さな重み係数を掛けてもよい。
また、式(44)のように各サンプル毎に重みを計算するのではなく、図14に示すような符号長の範囲毎に所定の重みを決めておく離散的な重み係数を用いてもよい。符号長の所定の範囲毎に重みを決めておくことで、重み係数生成部46bで重みを計算する手間が省ける。
実施例5の主要な処理の流れを図15に示す。実施例5では、実施例3の主要な処理の流れを示した図6の、前向き予測誤差gm,iと後向き予測誤差fm,iの更新値を算出するステップS18とS20と、更新された値を入力として各エネルギー値と内積値を算出するステップとの間に、予測誤差信号の絶対値平均値τを算出するステップS80と、絶対値平均値τから可変長符号化開始ビットβを算出するステップS82とが設けられている点のみが異なる。ステップS80の処理は、上記した式(31)を計算するものであり、ステップS82は、上記した式(36)を計算するものである。したがって説明は省略する。
実施例3までに前向き予測誤差及び後向き予測誤差のエネルギーをPARCOR係数と無関係な値に近似し、更に重み係数を用いることで、従来と同じ計算方法でPARCOR係数を演算する方法を述べた。その近似を更に粗くして行くと、更新された予測誤差信号の振幅の絶対値を微分可能な連続関数に近似するまでも無く、絶対値を最小にするPARCOR係数に近いPARCOR係数を選べば、この発明の技術思想を利用でき、符号量を小さくする効果が得られることに気が付く。
つまり、振幅の大きな予測誤差信号ほど抑圧する重み係数(大きい振幅の場合の重み係数は、小さい振幅の場合の重み係数以下である)を乗算することで、線形予測誤差信号をエントロピー符号化する際の符号量を小さくすることが出来るPARCOR係数算出装置が実現できる。
その前向き予測誤差サンプルと後向き予測誤差サンプルの振幅が大きいほど小さい重み係数を乗算するこの発明のPARCOR係数算出装置60を示す機能構成例を図16に、その動作フローを図17に示す。
実施例6のPARCOR係数算出装置60は、符号長近似部42が無い点で実施例2又は3と異なる。他の部分の機能構成は、基本的に同じである。動作フローも前向き予測誤差及び後向き予測誤差の更新値を算出するステップS18とS20まで、上記した各実施例と同じである。
前向き予測誤差更新部140と後向き予測誤差更新部142で更新された各予測誤差サンプルgm,i、fm,iは、PARCOR係数算出部96に入力される。PARCOR係数算出部96内の重み係数生成部98は、各予測誤差サンプルgm,i、fm,iの振幅が大きいほど小さな重み係数を生成する(ステップS90)。重み係数は、例えば、式(34)や(35)のような、各予測誤差信号の振幅の絶対値の平方根の逆数としてもよい。また、図13に示すような重み係数としてもよい。
重み係数生成部98が生成した重み係数は、内積演算部91とエネルギー演算部93に入力される。内積演算部91は、前向き予測誤差サンプルと後向き予測誤差サンプルの内積Vを演算し、その内積値に重み係数を乗算して内積値Vとする。
エネルギー演算部93は、前向き予測誤差サンプルと後向き予測誤差サンプルの各エネルギーGとFを演算し、その各エネルギー値に重み係数をそれぞれ乗算して各エネルギー値GとFとする。
以降の、各エネルギー値GとFの平均エネルギーUを求める処理(ステップS52)及び、内積値Vをエネルギーの平均値Uで除算してPARCOR係数を求める処理(ステップS54)は、実施例2や3と同じである。
また、実験等で予測誤差信号の振幅に反比例する重み係数を求めておき、重み係数生成部98内の重み係数テーブル98aに重み係数を記憶させておいてもよい。この場合の動作フローを図18に示す。重み係数生成部98は、前向き予測誤差の振幅を評価(ステップS901)して、その振幅に見合った重み係数を重み係数テーブル98aから読み出して、前向き予測誤差用の重み係数とする(ステップS903)。同様に、重み係数生成分98が、後向き予測誤差の振幅を評価(ステップS902)して、その振幅に見合った重み係数を重み係数テーブル98aから読み出して、後向き予測誤差用の重み係数とする(ステップS904)。
このように予め重み係数を固定値としてPARCOR係数算出部96内に持たせておいてもよい。
エネルギーを最小にする従来のPARCOR係数よりも、絶対値を最小にするPARCOR係数に近いPARCOR係数を選べば、この発明の技術思想を利用でき、符号量を小さくする効果が得られる。従って、実施例2や3のように、予測誤差更新値の振幅の絶対値を微分可能な連続関数に近似しなくとも、線形予測誤差信号をエントロピー符号化する際の符号量を小さくする点で、一定の効果が期待出来る。
なお、実施例4で述べた繰り返しPARCOR係数を修正して求める方法や、実施例5で述べた固定長符号化と可変長符号化を組み合わせて全体の符号長を短くする方法は、この実施例6にも適用可能である。その繰り返しPARCOR係数を修正して求めるための比較部52と繰り返し部90を、PARCOR係数算出部96内に破線で示す。また、可変長符号化するための可変符号化開始ビット設定部111を、前向き予測誤差更新部140又は後向き予測誤差更新部142と、PARCOR係数算出部96との愛間に破線で示す。これらの動作は、説明済みであるので省略する。
〔シミュレーション結果〕
例えば、MPEG標準ではライス符号を使用することが決められている。そこで、ライス符号を使用する前提でシミュレーションを行う。ライス符号を使うと、フレーム内の予測誤差信号毎の符号長の総和の符号量は、各予測誤差信号の振幅の絶対値の大きさに比例する。フレーム内の符号量の総和を最小にすることは、各予測誤差信号の振幅の絶対値の総和を最小化することで近似出来る。
従来の線形予測では二乗誤差を最小化する基準で予測係数を求め、その予測係数から予測誤差信号を求めていたので、予測誤差信号の符号量の総和は必ずしも最小化されない。
二乗誤差の総和を最小にする従来法と、絶対値の総和を最小にするこの発明による符号量の比較を、予測次数を変えて行なった結果を図18に示す。図18の横軸は予測次数を示し、縦軸は圧縮率を%で示す。圧縮率は、分母を通常のPCM符号の場合の符号量とした値である。
シミュレーション条件:予測次数を8次、16次、32次、64次として、サンプリングレートを48kHz,16bitと、48kHz,24bitと、96kHz,24bitと、192kHz,24bitとした各30秒のファイルの51個分の符号量の比較を行なった。
図18は、51個分のファイルの符号量の平均値を比較したものである。予測次数8次では、従来法の圧縮率≒49.34%に対してこの発明の圧縮率≒49.32%であり、約0.02%符号量が削減されている。予測次数16次では、従来法の圧縮率≒47.69%に対してこの発明の圧縮率≒47.67%であり、約0.02%符号量が削減されている。予測次数32次では、従来法の圧縮率≒47.48%に対してこの発明の圧縮率≒47.46%であり、約0.02%符号量が削減されている。予測次数64次では、従来法の圧縮率≒47.43%に対してこの発明の圧縮率≒47.42%であり、約0.01%符号量が削減されている。
このようにどの次数でも符号量が削減できていることが分かる。なお、従来法に対する符号量の削減率が少ないような印象を受けるが、一般的に音声予測符号化装置等において符号量を1%減らすことは難しいことである。したがって、この発明による0.01〜0.02%の符号量の削減は、実用上大きな効果である。
以上の各実施例の他、この発明である各装置及び方法は上述の実施形態に限定されるものではなく、この発明の趣旨を逸脱しない範囲で適宜変更が可能である。また、上記装置及び方法において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。
また、上記各装置における処理機能をコンピュータによって実現する場合、PARCOR係数算出装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記PARCOR係数算出装置における処理機能がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記憶媒体に記憶しておくことができる。コンピュータで読み取り可能な記憶媒体としては、例えば、磁気記憶装置、光ディスク、光磁気記憶媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記憶装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD−RAM(Random Access Memory)、CD−ROM(Compact Disc Read Only Memory)、CD−R(Recordable)/RW(ReWritable)等を、光磁気記憶媒体として、MO(Magneto Optical disc)等を、半導体メモリとしてEEP−ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。
また、このプログラムの流通は、例えば、そのプログラムを記憶したDVD、CD−ROM等の可搬型記憶媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記憶媒体に記憶されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記憶媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記憶媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、この形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、各装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。
この発明のPARCOR係数算出装置10の実施例1の機能構成例を示す図。 実施例1の動作フロー図。 予測誤差信号xを示す図、図3(a)は振幅と頻度との関係を示す図、図3(b)は時系列的に発生する予測誤差信号xを示す図、図3(c)は振幅と符号長との関係を示す図である。 予測誤差信号xの振幅に対する符号長の変化を示す図。 この発明のPARCOR係数算出装置40の実施例2の機能構成例を示す図。 実施例2の動作フロー図。 実施例3の動作フロー図。 実施例3’の動作フロー図。 実施例4の動作フロー図。 ライス符号の例を示す図。 この発明のPARCOR係数算出装置80の実施例5の機能構成例を示す図。 式(37)で計算した符号長の一例を示す図。 実施例5に用いる重み係数の一例を示す図。 離散的時系列ディジタル信号の一例を示す図。 実施例5の動作フロー図。 この発明のPARCOR係数算出装置60の実施例6の機能構成例を示す図。 実施例6の動作フロー図。 重み係数をテーブルで持つ場合の実施例6の動作フロー図。 この発明と従来法との符号量の比較を示す図。 従来のPARCOR係数算出装置を用いた音声予測符号化装置120を示す図。 従来のPARCOR係数算出装置126の機能構成例を示す図。 従来のPARCOR係数算出装置126の動作フロー図。

Claims (28)

  1. 離散的時系列ディジタル信号を所定サンプル数毎にフレーム分割するフレーム化部の出力信号を入力とし、逐次次数を増やしてPARCOR係数を求めるPARCOR係数算出装置において、
    上記フレーム化部の出力信号を入力として、初期値としての前向き予測誤差サンプルと後向き予測誤差サンプルと1次のPARCOR係数を設定する初期値設定部と、
    上記初期値及び1サンプル前のPARCOR係数を入力として、前向き予測誤差サンプルを更新する前向き予測誤差更新部と、
    上記初期値及び1サンプル前のPARCOR係数を入力として、後向き予測誤差サンプルを更新する後向き予測誤差更新部と、
    上記前向き予測誤差サンプルと上記後向き予測誤差サンプルを入力として、前向き予測誤差符号長と後向き予測誤差符号長の絶対値を微分可能な連続関数を利用して近似する符号長近似部と、
    上記前向き予測誤差符号長と上記後向き予測誤差符号長を累計した符号量を各次のPARCOR係数で偏微分した値が0となるPARCOR係数を数値解析手段により求めるPARCOR係数算出部とを、
    具備することを特徴とするPARCOR係数算出装置。
  2. 離散的時系列ディジタル信号を所定サンプル数毎にフレーム分割するフレーム化部の出力信号を入力とし、逐次次数を増やしてPARCOR係数を求めるPARCOR係数算出装置において、
    上記フレーム化部の出力信号を入力として、初期値としての前向き予測誤差サンプルと後向き予測誤差サンプルと1次のPARCOR係数を設定する初期値設定部と、
    上記初期値及び1サンプル前のPARCOR係数を入力として、前向き予測誤差サンプルを更新する前向き予測誤差更新部と、
    上記初期値及び1サンプル前のPARCOR係数を入力として、後向き予測誤差サンプルを更新する後向き予測誤差更新部と、
    上記前向き予測誤差サンプルと上記後向き予測誤差サンプルの振幅が大きいほど抑圧する重み係数を生成する重み係数生成部と、
    上記前向き予測誤差サンプルと上記後向き予測誤差サンプルとの内積値を演算し、上記内積値に上記重み係数を乗算する内積演算部と、
    上記前向き予測誤差サンプルと上記後向き予測誤差サンプルの、それぞれのエネルギー値を演算し、上記それぞれのエネルギー値に上記重み係数を乗算するエネルギー演算部と、
    上記重み係数が乗算された内積値を、上記重み係数が乗算されたエネルギー値の平均で除し、上記PARCOR係数を算出する除算部を備えることを特徴とするPARCOR係数算出装置。
  3. 請求項2に記載のPARCOR係数算出装置において、
    上記重み係数生成部は、上記前向き予測誤差サンプルと上記後向き予測誤差サンプルの振幅を評価し、振幅に対応した重み係数を重み係数テーブルから読み出して上記重み係数とするものであることを特徴とするPARCOR係数算出装置。
  4. 離散的時系列ディジタル信号を所定サンプル数毎にフレーム分割するフレーム化部の出力信号を入力とし、逐次次数を増やしてPARCOR係数を求めるPARCOR係数算出装置において、
    上記フレーム化部の出力信号を入力として、初期値としての前向き予測誤差サンプルと後向き予測誤差サンプルと1次のPARCOR係数を設定する初期値設定部と、
    上記初期値及び1サンプル前のPARCOR係数を入力として、前向き予測誤差サンプルを更新する前向き予測誤差更新部と、
    上記初期値及び1サンプル前のPARCOR係数を入力として、後向き予測誤差サンプルを更新する後向き予測誤差更新部と、
    上記前向き予測誤差と上記後向き予測誤差からPARCOR係数を算出するPARCOR係数算出部とを、具備し、
    上記PARCOR係数算出部は、上記前向き予測誤差のエネルギーと上記後向き予測誤差のエネルギーとの和を上記PARCOR係数と無関係な、それぞれの予測誤差のエネルギーとして近似する誤差近似部と、
    上記前向き予測誤差と上記後向き予測誤差との内積値に乗ずる重み係数と、上記前向き予測誤差と上記後向き予測誤差のエネルギー値のそれぞれに乗ずる重み係数とを生成する重み係数生成部と、
    上記重み係数が乗算された内積値を、上記重み係数が乗算されたエネルギー値の平均で除し、上記PARCOR係数を算出する除算部を備えることを特徴とするPARCOR係数算出装置。
  5. 請求項4に記載のPARCOR係数算出装置において、
    上記誤差近似部は、PARCOR係数の次数m毎に定数φと定数ψとを、PARCOR係数の次数mが所定の値よりも小さい時は1以下の値に定め、上記次数mが所定の値より大きい時は1に定め、
    上記前向き予測誤差の二乗値と上記後向き予測誤差の二乗値との和に、上記定数φを乗算した値を上記前向き予測誤差のエネルギー、上記ψを乗算した値を上記後向き予測誤差のエネルギーとする近似を行うことを特徴とするPARCOR係数算出装置。
  6. 請求項5に記載のPARCOR係数算出装置において、
    上記定数φと定数ψが、φ=ψであることを特徴とするPARCOR係数算出装置。
  7. 請求項6に記載のPARCOR係数算出装置において、
    上記PARCOR係数算出部は、上記前向き予測誤差と上記後向き予測誤差との内積値と、上記前向き予測誤差のエネルギー値と上記後向き予測誤差のエネルギー値との和、それぞれに同じ重み係数を乗じた値を用いてPARCOR係数を算出するものであることを特徴とするPARCOR係数算出装置。
  8. 請求項7に記載のPARCOR係数算出装置において、
    上記PARCOR係数算出部は、上記フレーム内の上記前向き予測誤差と上記後向き予測誤差の絶対値の平均値を算出する絶対値平均算出部と、
    上記絶対値平均値と上記サンプルの予測誤差とを比較する比較部と、
    を具備し、上記サンプルの予測誤差が上記絶対値平均値より小の場合は、重みを考慮せず、上記サンプルの予測誤差が上記絶対値平均値より大の場合は、サンプルの予測誤差に上記各サンプルの予測誤差の平方根の逆数が重み係数として乗算された上記前向き予測誤差と上記後向き予測誤差とからPARCOR係数を算出するものであることを特徴とするPARCOR係数算出装置。
  9. 請求項1乃至8の何れかに記載のPARCOR係数算出装置において、
    上記PARCOR係数算出部は、PARCOR係数を求める動作を繰り返す繰り返し部と、
    上記繰り返し部の繰り返し動作を終了させるか否かを判定し上記繰り返し部に終了信号を出力する終了判定部とを、具備するものであることを特徴とするPARCOR係数算出装置。
  10. 請求項9に記載のPARCOR係数算出装置において、
    上記終了判定部は、上記繰り返し部の繰り返し回数が所定回数に達すると、終了信号を出力する回数判定部を具備するものであることを特徴とするPARCOR係数算出装置。
  11. 請求項9に記載のPARCOR係数算出装置において、
    上記終了判定部は、上記繰り返し求められた前回のPARCOR係数と今回のPARCOR係数の差が所定値以下になると、終了信号を出力する収束判定部を具備するものであることを特徴とするPARCOR係数算出装置。
  12. 請求項1乃至11の何れかに記載したPARCOR係数算出装置において、
    上記符号長近似部は、上記フレーム内の上記前向き予測誤差と上記後向き予測誤差の絶対値の平均値を算出する絶対値平均算出部と、上記可変長符号化開始ビット数を決定する可変長符号化開始ビット計算部とからなる可変長符号化開始ビット設定部を具備し、
    上記PARCOR係数算出部は、上記前向き予測誤差と上記後向き予測誤差との内積値に乗ずる重み係数と、上記前向き予測誤差と上記後向き予測誤差のエネルギー値のそれぞれに乗ずる重み係数とを生成する重み係数生成部を具備し、
    上記可変長符号化開始ビット数以上の上記前向き予測誤差と上記後向き予測誤差とに乗ずる上記重み係数と、上記可変長符号化開始ビット数未満に乗ずる上記重み係数とが異なることを特徴とするPARCOR係数算出装置。
  13. 請求項12に記載したPARCOR係数算出装置において、
    上記可変長符号化開始ビット数未満の上記それぞれの予測誤差信号に掛けられる重みは、上記可変長符号化開始ビット以上に掛けられる重み以下であることを特徴とするPARCOR係数算出装置。
  14. 離散的時系列ディジタル信号を所定サンプル数毎にフレーム分割するフレーム化部の出力信号を入力とし、逐次次数を増やしてPARCOR係数を求めるPARCOR係数算出方法において、
    初期値設定部が、上記フレーム化部の出力信号を入力として、初期値としての前向き予測誤差サンプルと後向き予測誤差サンプルと1次のPARCOR係数を設定する初期値設定過程と、
    前向き予測誤差サンプル生成部が、上記初期値及び1サンプル前のPARCOR係数を入力として前向き予測誤差サンプルを更新する前向き予測誤差サンプル生成過程と、
    後向き予測誤差サンプル生成部が、上記初期値及び1サンプル前のPARCOR係数を入力として後向き予測誤差サンプルを更新する後向き予測誤差サンプル生成過程と、
    符号長近似部が、上記前向き予測誤差更新値と上記後向き予測誤差更新値の、それぞれの振幅の絶対値を微分可能な連続関数に近似して、前向き予測誤差符号長と後向き予測誤差符号長を算出する符号長近似過程と、
    PARCOR係数算出部の数値解析手段が、上記前向き予測誤差と上記後向き予測誤差を累計した符号量を各次のPARCOR係数で偏微分した値が0となるPARCOR係数を算出するPARCOR係数算出過程とを、有することを特徴とするPARCOR係数算出方法。
  15. 離散的時系列ディジタル信号を所定サンプル数毎にフレーム分割するフレーム化部の出力信号を入力とし、逐次次数を増やしてPARCOR係数を求めるPARCOR係数算出方法において、
    初期値設定部が、上記フレーム化部の出力信号を入力として、初期値としての前向き予測誤差サンプルと後向き予測誤差サンプルと1次のPARCOR係数を設定する初期値設定過程と、
    前向き予測誤差サンプル生成部が、上記初期値及び1サンプル前のPARCOR係数を入力として前向き予測誤差サンプルを更新する前向き予測誤差サンプル生成過程と、
    後向き予測誤差サンプル生成部が、上記初期値及び1サンプル前のPARCOR係数を入力として後向き予測誤差サンプルを更新する後向き予測誤差サンプル生成過程と、
    重み係数生成部が、上記前向き予測誤差サンプルと上記後向き予測誤差サンプルの振幅が大きいほど抑圧する重み係数を生成する重み係数生成過程と、
    内積演算部が、上記前向き予測誤差サンプルと上記後向き予測誤差サンプルとの内積値を演算し、上記内積値に上記重み係数を乗算する内積演算過程と、
    エネルギー演算部が、上記前向き予測誤差サンプルと上記後向き予測誤差サンプルの、それぞれのエネルギー値を演算し、上記それぞれのエネルギー値に上記重み係数を乗算するエネルギー演算過程と、
    除算部が、上記重み係数が乗算された内積値を、上記重み係数が乗算されたエネルギー値の平均で除し、上記PARCOR係数を算出するPARCOR係数算出過程とを、有することを特徴とするPARCOR係数算出方法。
  16. 請求項15に記載されたPARCOR係数算出方法において、
    上記重み係数生成過程は、上記前向き予測誤差サンプルと上記後向き予測誤差サンプルの振幅を評価し、振幅に対応した重み係数を重み係数テーブルから読み出して上記重み係数とする過程であることを特徴とするPARCOR係数算出方法。
  17. 離散的時系列ディジタル信号を所定サンプル数毎にフレーム分割するフレーム化部の出力信号を入力とし、逐次次数を増やしてPARCOR係数を求めるPARCOR係数算出方法において、
    初期値設定部が、上記フレーム化部の出力信号を入力として、初期値としての前向き予測誤差サンプルと後向き予測誤差サンプルと1次のPARCOR係数を設定する初期値設定過程と、
    前向き予測誤差サンプル生成部が、上記初期値及び1サンプル前のPARCOR係数を入力として前向き予測誤差サンプルを更新する前向き予測誤差サンプル生成過程と、
    後向き予測誤差サンプル生成部が、上記初期値及び1サンプル前のPARCOR係数を入力として後向き予測誤差サンプルを更新する後向き予測誤差サンプル生成部過程と、
    PARCOR係数算出部が、上記前向き予測誤差と上記後向き予測誤差からPARCOR係数を算出するPARCOR係数算出過程とを、具備し、
    上記PARCOR係数算出過程は、上記前向き予測誤差のエネルギーと上記後向き予測誤差のエネルギーとの和を上記PARCOR係数と無関係な、それぞれの予測誤差のエネルギーとして近似する誤差近似ステップと、
    上記前向き予測誤差と上記後向き予測誤差との内積値に乗ずる重み係数と、上記前向き予測誤差と上記後向き予測誤差のエネルギー値のそれぞれに乗ずる重み係数とを生成する重み係数生成ステップと、
    上記重み係数が乗算された内積値を、上記重み係数が乗算されたエネルギー値の平均で除し、上記PARCOR係数を算出するPARCOR係数算出過程とを、有することを特徴とするPARCOR係数算出方法。
  18. 請求項17に記載のPARCOR係数算出方法において、
    上記誤差近似ステップは、上記前向き予測誤差の二乗値と上記後向き予測誤差の二乗値との和を演算するステップと、上記二乗値の和に定数ψを乗算して上記前向き予測誤差のエネルギー、上記二乗値の和に定数φを乗算して上記後向き予測誤差のエネルギーとする近似を行うステップとを、含むことを特徴とするPARCOR係数算出方法。
  19. 請求項18に記載のPARCOR係数算出方法において、
    上記定数φとψがそれぞれ乗算されるステップの上記定数φとψが等しい値であることを特徴とするPARCOR係数算出方法。
  20. 請求項19に記載のPARCOR係数算出方法において、
    内積値に乗ずる重み係数を生成するステップと、上記前向き予測誤差と上記後向き予測誤差のエネルギー値に乗ずる重み係数を生成するステップの、重み係数が同じ値であることを特徴とするPARCOR係数算出方法。
  21. 請求項20に記載のPARCOR係数算出方法において、
    上記PARCOR係数算出過程は、
    上記フレーム内の上記前向き予測誤差と上記後向き予測誤差の絶対値の平均値を算出する絶対値平均値算出ステップと、
    上記前向き予測誤差及び上記後向き予測誤差と上記絶対値平均値とを比較する比較ステップとを備え、
    上記サンプルの予測誤差が上記予測誤差の平均値より小の場合は、重みを考慮せず、上記サンプルの予測誤差が上記予測誤差の平均値より大の場合は、サンプルの予測誤差に上記各サンプルの予測誤差の平方根の逆数を重み係数として乗算するステップを含むことを特徴とするPARCOR係数算出方法。
  22. 請求項14乃至21の何れかに記載のPARCOR係数算出方法において、
    上記PARCOR係数算出過程は、PARCOR係数を繰り返して求める動作を終了判定部が終了信号を出力するまで、繰り返すステップを含むことを特徴とするPARCOR係数算出方法。
  23. 請求項22に記載のPARCOR係数算出方法において、
    上記終了信号を出力するステップは、上記繰り返す過程の繰り返し回数が、所定回数に達すると終了信号を出力するものであることを特徴とするPARCOR係数算出方法。
  24. 請求項22に記載のPARCOR係数算出方法において、
    上記終了信号を出力するステップは、上記繰り返し求められた前回のPARCOR係数と今回のPARCOR係数との差が所定値以下になると、終了信号を出力するものであることを特徴とするPARCOR係数算出方法。
  25. 請求項14乃至24の何れかに記載のPARCOR係数算出方法において、
    符号長近似部内の絶対値平均算出部が、上記フレーム内の上記前向き予測誤差と上記後向き予測誤差の絶対値の平均値を算出する予測誤差平均値算出過程と、
    符号長近似部内の可変長符号化開始ビット設定部が、可変長符号化開始ビット数を決定する過程と、
    PARCOR係数算出部内の重み係数生成部が、上記前向き予測誤差と上記後向き予測誤差との内積値に乗ずる重み係数と、上記前向き予測誤差と上記後向き予測誤差のエネルギー値のそれぞれに乗ずる重み係数とを生成する過程とを、備え、
    上記可変長符号化開始ビット数以上の上記前向き予測誤差と上記後向き予測誤差とに乗ずる上記重み係数と、上記可変長符号化開始ビット数未満に乗ずる上記重み係数とが異なることを特徴とするPARCOR係数算出方法。
  26. 請求項25に記載のPARCOR係数算出方法において、
    上記可変長符号化開始ビット数未満の上記それぞれの予測誤差信号に掛けられる重みは、上記可変長符号化開始ビットに掛けられる重み以下である過程であることを特徴とするPARCOR係数算出方法。
  27. 請求項1乃至13の何れかに記載した各装置としてコンピュータを機能させるための装置プログラム。
  28. 請求項27に記載した何れかのプログラムを記憶したコンピュータで読み取り可能な記憶媒体。
JP2007017921A 2007-01-29 2007-01-29 Parcor係数算出方法、及びその装置とそのプログラムと、その記憶媒体 Active JP4691050B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007017921A JP4691050B2 (ja) 2007-01-29 2007-01-29 Parcor係数算出方法、及びその装置とそのプログラムと、その記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007017921A JP4691050B2 (ja) 2007-01-29 2007-01-29 Parcor係数算出方法、及びその装置とそのプログラムと、その記憶媒体

Publications (2)

Publication Number Publication Date
JP2008185701A JP2008185701A (ja) 2008-08-14
JP4691050B2 true JP4691050B2 (ja) 2011-06-01

Family

ID=39728814

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007017921A Active JP4691050B2 (ja) 2007-01-29 2007-01-29 Parcor係数算出方法、及びその装置とそのプログラムと、その記憶媒体

Country Status (1)

Country Link
JP (1) JP4691050B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102282770B (zh) * 2009-01-23 2014-04-16 日本电信电话株式会社 一种参数选择方法、参数选择装置
WO2010140590A1 (ja) * 2009-06-03 2010-12-09 日本電信電話株式会社 Parcor係数量子化方法、parcor係数量子化装置、プログラム及び記録媒体
PL3098812T3 (pl) * 2014-01-24 2019-02-28 Nippon Telegraph And Telephone Corporation Urządzenie, sposób i program do analizy liniowo-predykcyjnej oraz nośnik zapisu
CN110349590B (zh) * 2014-01-24 2023-03-24 日本电信电话株式会社 线性预测分析装置、方法以及记录介质
CN117932280B (zh) * 2024-03-25 2024-06-25 之江实验室 长序列数据预测方法、装置、计算机设备、介质和产品

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57158897A (en) * 1981-03-27 1982-09-30 Tokyo Shibaura Electric Co Voice analyzer
JPH0863192A (ja) * 1994-08-22 1996-03-08 Nec Corp スペクトルパラメータ抽出装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS4918007B1 (ja) * 1969-05-27 1974-05-07

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57158897A (en) * 1981-03-27 1982-09-30 Tokyo Shibaura Electric Co Voice analyzer
JPH0863192A (ja) * 1994-08-22 1996-03-08 Nec Corp スペクトルパラメータ抽出装置

Also Published As

Publication number Publication date
JP2008185701A (ja) 2008-08-14

Similar Documents

Publication Publication Date Title
JP4634969B2 (ja) 線形予測モデル次数決定装置、線形予測モデル次数決定方法、そのプログラムおよび記録媒体
JP6422813B2 (ja) 符号化装置、復号装置、これらの方法及びプログラム
RU2643646C2 (ru) Кодер для кодирования аудиосигнала, система передачи аудио и способ определения значений коррекции
JP4691082B2 (ja) 線形予測モデル次数決定装置、線形予測モデル次数決定方法、そのプログラムおよび記録媒体
WO2012137617A1 (ja) 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体
JPH11143499A (ja) 切替え型予測量子化の改良された方法
WO2012102149A1 (ja) 符号化方法、符号化装置、周期性特徴量決定方法、周期性特徴量決定装置、プログラム、記録媒体
JP4691050B2 (ja) Parcor係数算出方法、及びその装置とそのプログラムと、その記憶媒体
KR101661917B1 (ko) 부호화 방법, 부호화 장치, 프로그램 및 기록 매체
JP2002335161A (ja) 信号処理装置及び方法、信号符号化装置及び方法、並びに信号復号装置及び方法
JP4761251B2 (ja) 長期予測符号化方法、長期予測復号化方法、これら装置、及びそのプログラム
JP2019079069A (ja) 線形予測復号装置、方法、プログラム及び記録媒体
KR20070085788A (ko) 신호 속성들을 사용한 효율적인 오디오 코딩
JP5663461B2 (ja) 符号化方法、符号化装置、プログラム、記録媒体
JP4746532B2 (ja) 線形予測係数算出方法、及びその装置とそのプログラムと、その記憶媒体
WO2016121826A1 (ja) 符号化装置、復号装置、これらの方法、プログラム及び記録媒体
JP5336942B2 (ja) 符号化方法、復号方法、符号化器、復号器、プログラム
US20050177257A1 (en) Digital signal processing method, learning method, apparatuses thereof and program storage medium
JP5361565B2 (ja) 符号化方法、復号方法、符号化器、復号器およびプログラム
JP2800599B2 (ja) 基本周期符号化装置
JP6668532B2 (ja) 復号装置、及びその方法、プログラム、記録媒体
JP2002049397A (ja) ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体
RU2662921C2 (ru) Устройство и способ для кодирования, обработки и декодирования огибающей аудиосигнала путем моделирования представления совокупной суммы с использованием квантования и кодирования распределения
JP5320508B2 (ja) 符号化装置、復号装置、これらの方法、プログラム及び記録媒体
JP4107085B2 (ja) 波形データ圧縮方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090105

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110104

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110208

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110218

R150 Certificate of patent or registration of utility model

Ref document number: 4691050

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140225

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350