JP4838773B2 - 線形予測符号化の予測次数決定方法及びそれを使った予測係数決定方法及び装置、プログラム、その記録媒体 - Google Patents

線形予測符号化の予測次数決定方法及びそれを使った予測係数決定方法及び装置、プログラム、その記録媒体 Download PDF

Info

Publication number
JP4838773B2
JP4838773B2 JP2007187682A JP2007187682A JP4838773B2 JP 4838773 B2 JP4838773 B2 JP 4838773B2 JP 2007187682 A JP2007187682 A JP 2007187682A JP 2007187682 A JP2007187682 A JP 2007187682A JP 4838773 B2 JP4838773 B2 JP 4838773B2
Authority
JP
Japan
Prior art keywords
prediction
order
code amount
coefficient
residual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2007187682A
Other languages
English (en)
Other versions
JP2009025496A (ja
Inventor
優 鎌本
登 原田
健弘 守谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2007187682A priority Critical patent/JP4838773B2/ja
Publication of JP2009025496A publication Critical patent/JP2009025496A/ja
Application granted granted Critical
Publication of JP4838773B2 publication Critical patent/JP4838773B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

この発明は、時系列信号の線形予測符号化における予測次数決定方法及びそれを使った予測係数決定方法と装置に関するものである。
従来の線形予測符号化では、非特許文献1に記載されているようなFPE(Final Prediction Error: 最終予測誤差)やAIC(Akaike Information Criterion: 赤池情報量基準)を用いて、予測次数を決定していた。また、非特許文献2に記載されているような、MDL原理(Minimum Description Length Principle)を下に、予測次数を決定する方法もある。MDL原理は、
(符号語長)=(モデルの記述長)+(そのモデルによるデータの記述長) (1)
となる。ロスレス符号化で使われる言葉で言い換えると、
(ロスレスで復号するために必要な符号量)=(PARCOR係数に必要な符号量)+(予測残差に必要な符号量) (2)
となる。図1に模式的に示すように、PARCOR係数に必要な符号量は直線1Aで示すように予測次数に比例して増加する。1フレームあたりのサンプル数をNとすると、1フレームあたりの信号のエネルギーはΣn=1 Nxn 2で表され、それをNで割り算して得られる1サンプルあたりのエネルギー
Figure 0004838773
で表され、従って、分散σ2が小さければエントロピーも小さい。ロスレス符号化であるエントロピー符号化においては、エントロピーは1サンプルあたりのビット数に対応し、ビット数は符号量に対応する。従って、予測残差のフレームあたりの符号量は予測残差のフレームあたりのエネルギーに対応する。一般に、線形予測の分析次数を高くすれば予測残差のエネルギーは小となる(平均振幅が小となる)ので、図1に曲線1Bで示すように予測次数が大となるにつれ、予測残差を符号化した場合の符号量は対数的に減少する。
ロスレス復号するために必要な符号量は直線1Aと曲線1Bの和である曲線1Cに示すように、ある予測次数P0で符号量が最小となる特徴を示す。つまり、予測次数を増加させるほど予測残差に必要な符号量は減少するが、その分PARCOR係数に必要な符号量が増加してしまうため、予測次数を増加させてもロスレス復号するための線形予測符号化に必要な符号量を減少させることができるとは限らない。そこで、式(2) を用いて、ロスレス復号するために必要な符号量が最小となる予測次数(最適予測次数)P0を計算し、この最適予測次数P0を用いて圧縮符号化を行っていた。
図2は従来の典型的な線形予測符号化装置の機能構成図を示す。この線形予測符号化装置は、入力信号x(n)を線形予測分析してPARCOR係数K={k(1), k(2), …, k(P0)}を出力する線形予測分析部11と、PARCOR係数Kを量子化して量子化済PARCOR係数K’={k'(1), k'(2), …, k'(P)}を出力する量子化部12と、量子化済PARCOR係数K'を線形予測係数a’={α'(1), α'(2), …, α'(P0)}に逆変換する逆変換部13と、線形予測係数a'を使って入力信号x(n)を線形予測フィルタ処理して予測残差e(n)を出力する線形予測フィルタ部14と、最適予測次数P0と量子化済PARCOR係数K’を符号化して係数符号Ckを出力する係数符号化部21と、予測残差e(n)を符号化して残差符号Ceを出力する残差符号化部22と、係数符号Ckと残差符号Ceとを合成して合成符号Cgを出力する符号合成部23とから構成されている。
線形予測分析部11においては、入力信号x(n)をフレーム毎に線形予測分析するが、その線形予測分析の最適予測次数P0は、例えば非特許文献2に示されているMDL原理に基づく方法により決定していた。その方法を図3を参照して説明する。
Step100:1次から予め決めた最大予測次数PmaxまでのPARCOR係数を例えばレビンソン-ダービン(Levinson-Durbin)法又はバーグ(Burg)法により算出する。
Step200:予め決めた最小予測次数Pminから最大予測次数Pmaxまでの各予測次数の場合のPARCOR係数を符号化して係数符号量を求める。
Step300:最小予測次数Pminから最大予測次数Pmaxまでの各予測次数の場合の予測残差符号量を求める。
Step400:係数符号量と残差符号量との合計が最小となる予測次数を最適予測次数P0と決める。
Step500:最適予測次数P0のときのStep100で求めたPARCOR係数又はそれに対応する線形予測係数を最適な予測係数と決定する。
図2における線形予測分析部11はこのようにして最適予測次数P0を決定し、最適予測次数P0の場合のStep100で得られたPARCOR係数を最適な係数Kとして出力する。この線形予測分析部11で使用されるLevinson-Durbin法によれば、第h次の予測次数PhのPARCOR係数は、すでに得られている1〜Ph−1次のPARCOR係数に対し、更にPh次目の係数を演算して追加するだけでよいので、係数を求める演算処理量が少ない利点がある。しかし、Levinson-Durbin法では、入力信号に窓を掛けることで定常とみなして分析を行うため、これによって得られたPARCOR係数を逆変換して得られる線形予測係数(線形予測フィルタ部14で使用するため)は、共分散法(予測残差のエネルギーを線形予測係数で偏微分し、結果を0とおいて連立方程式を解く方法)や、数値計算による方法(線形予測係数に数値を入れて予測残差エネルギーが最小となるような線形予測係数を見つける方法)により求めた線形予測係数よりも正確さに劣り、そのためStep400における合計符号量を最小とする最適予測次数を正確に求めることが困難である。
この点を改善した方法を図4に示す。図3との相違は、図3のStep100ではLevinson-Durbin法又はBurg法によりPARCOR係数を求めたが、図4のStep110では共分散法又は数値計算法のようにPmin〜Pmaxの各予測次数Ph毎に予測次数Phの線形予測係数(Ph個の係数)を求め、その線形予測係数をPARCOR係数に変換する。
尾崎統、北川源四郎、"時系列解析の方法"、朝倉書店、pp.82-92 "情報源符号化=無歪データ圧縮"、培風館、pp.114-115
図4に示したこの方法によれば、Levinson-Durbin法又はBurg法のような入力信号に窓関数をかける必要が無いので、より精度の高い線形予測係数を求めることができ、従ってより正確に最適予測次数を決定することができるが、各予測次数PhごとにPh個の全係数を計算する必要があり、必要な演算処理量が図3の場合に比べ圧倒的に大となる欠点がある。
この発明の目的は、演算処理量が少なく、かつより正確な最適予測次数を決定できる予測次数決定方法及びそれを使った予測係数決定方法及び装置を提供することである。
この発明の第1の観点による時系列入力信号に対する予測次数決定方法は、
(a) フレーム毎に上記入力信号を逐次的方法により線形予測分析し、予め決めた第1の範囲の各予測次数について、予測係数の係数符号量または推定符号量と、予測残差の残差符号量または推定符号量と、の合計が最小となる予測次数を最適予測次数探索の初期値として得るステップと、
(b) 上記初期値を含み、上記第1の範囲より狭い第2の範囲の各予測次数で上記入力信号を、予測次数毎に全次の線形予測係数を求める方法により線形予測分析し、予測係数の係数符号量または推定符号量と、予測残差の残差符号量または推定符号量と、の合計が最小となる予測次数を最適予測次数と決定するステップ、
とを含むことを特徴とする。
この発明の第2の観点によるマルチチャネル時系列入力信号中の何れかのチャネルに対する予測次数決定方法は、
(a) フレーム毎に該チャネル以外の何れかのチャネルの入力信号を線形予測分析し、予め決めた第1の範囲の各予測次数について、予測係数の係数符号量または推定符号量と、予測残差の残差符号量または推定符号量と、の合計が最小となる予測次数を最適予測次数探索の初期値として得るステップと、
(b) 上記初期値を含み、上記第1の範囲より狭い第2の範囲の各予測次数で該チャネルの入力信号を、予測次数毎に全次の線形予測係数を求める方法により線形予測分析し、予測係数の係数符号量または推定符号量と、予測残差の残差符号量または推定符号量と、の合計が最小となる予測次数を最適予測次数と決定するステップ、
とを含むことを特徴とする。
この発明の第3の観点によるマルチチャネル時系列入力信号中の何れかのチャネルに対する最適予測次数の決定方法は、
(a) フレーム毎に該チャネルの入力信号を該チャネルの信号のみを用いて線形予測分析し、予め決めた第1の範囲の各予測次数について、予測係数の係数符号量または推定符号量と、予測残差の残差符号量または推定符号量と、の合計が最小となる予測次数を最適予測次数探索の初期値として得るステップと、
(b) 上記初期値を含み、上記第1の範囲より狭い第2の範囲の各予測次数で該チャネルの入力信号を該チャネルの線形予測残差と該チャネル以外のチャネルの信号の線形予測残差との重み付き差分が最小となる基準で全次の線形予測係数を求め、予測係数の係数符号量または推定符号量と、予測残差の残差符号量または推定符号量と、の合計が最小となる予測次数を最適予測次数と決定するステップ、
とを含むことを特徴とする最適予測次数決定方法。
この発明による線形予測符号化の最適予測係数決定方法は、上記のいずれかの最適予測次数決定方法によって最適予測次数を決定し、さらに、上記最適予測次数に対応する上記ステップ(b) で求めた線形予測係数を最適予測係数と決めることを特徴とする。
この発明によれば、少ない演算量で、正確に最適予測次数を決定できる。
図5はこの発明による最適予測次数決定方法及び最適予測係数決定方法の一実施例を示す処理手順を示す。まず、図3の方法におけると同様に、Step100〜Step300を行う。
Step100:1次から予め決めた最大予測次数PmaxまでのPARCOR係数を例えばLevinson-Durbin法又はBurg法のような、低次から順次次数を増加させながら、順次増加させた次数分のみのPARCOR係数または線形予測係数を求める逐次的手法(以下、「逐次法」と呼ぶ)により算出する。
Step200:予め決めた最小予測次数Pminから最大予測次数Pmaxまでの各予測次数の場合のPARCOR係数を符号化して係数符号量を求める。
Step300:最小予測次数Pminから最大予測次数Pmaxまでの各予測次数の場合の予測残差符号量を求める。
以降は図3の場合と異なり、最適予測次数決定方法はStep410〜Step450を行い、最適予測係数決定方法はこれらに加え、図5中に破線で示すようにStep460も行う。
Step410:係数符号量と残差符号量の合計が最小となる予測次数を最適次数探索の初期値P0とする。
Step420:予め設定した探索範囲P0−ΔPv〜P0+ΔPvの各予測次数について共分散法又は数値計算法のような、予測次数毎に全次の線形予測係数またはPARCOR係数を求める厳密な手法(以下、「厳密法」と呼ぶ)により線形予測係数を算出する。ここで、ΔPvは例えば1≦ΔPv<(Pmin+Pmax)/2の範囲の予め決めた整数である。また、予め設定した探索範囲は最適次数探索の初期値P0を中心とする範囲を対称とせず、例えばP0−ΔPb〜P0+ΔPtというように非対称な範囲としてもよい。ここでΔPb及びΔPtは、0≦ΔPb≦P0−Pmin,0≦ΔPt≦Pmax−P0,ΔPb≠ΔPtの範囲で予め決めた整数である。
Step430:上記探索範囲の各予測次数での係数符号を求め、符号量を求める。ここで、係数符号量は実際に係数を符号化して求めた符号量でなくても、例えば、予測次数から推定される推定係数符号量や、予測次数と各予測係数の絶対値等から推定される推定係数符号量を係数符号量として用いてもよい。
Step440:上記探索範囲の各予測次数での残差符号量を求めるる。ここで、残差符号量は実際に残差を符号化して求めた符号量でなくても、例えば、予測残差のパワーや絶対値和等から推定した推定残差符号量を残差符号量として用いてもよい。
Step450:Step430で得られた係数符号量とStep440で得られた残差符号量との合計が最小となる予測次数を最適予測次数Pvと決定する。
Step460:最適予測次数PvのときのStep420で求めた線形予測係数を最適な予測係数と決定する。
図5の実施例を図2の線形予測符号化装置に適用した場合、線形予測分析部11は図5のStep450までにより最適予測次数Pvを決定し、Step460で求めた線形予測係数をPARCOR係数K={k(1), k(2), …, k(Pv)}に変換し、得られたPARCOR係数Kを最適な予測係数として出力する。従ってこの場合、図2における線形予測分析部11自体がこの発明による最適予測次数決定装置を含む最適予測係数決定装置を構成していることになる。
この実施例の最適予測次数決定装置40及びそれを含む最適予測係数決定装置11の機能構成を図6に示す。この実施例の最適予測次数決定装置40は、逐次線形予測分析部100と、係数符号量算出部200と、残差符号量算出部300と、最適次数探索初期値決定部410と、厳密線形予測分析部420と、係数符号量算出部430と、残差符号量算出部440と、最適次数探索部450とにより構成されている。最適予測係数決定装置11は、最適予測次数決定装置40と最適係数決定部460とから構成されている。
逐次線形予測分析部100は、入力信号x(n)が与えられて図5のStep100を行い各予測次数の場合のPARCOR係数を求める。係数符号量算出部200及び残差符号量算出部300はそれぞれ図5のStep200及びStep300を行い、各予測次数の場合の係数符号量及び残差符号量を求める。最適次数探索初期値決定部410は図5のStep410を行い係数符号量と残差符号量の合計が最小となる予測次数を最適次数探索の初期値P0と決定する。
厳密線形予測分析部420は入力信号x(n)と最適次数探索初期値P0が与えられ、図5のStep420で厳密法による線形予測分析を行なって各予測次数の場合の線形予測次数を求める。係数符号量算出部430及び残差符号量算出部440はそれぞれ図5のStep430及びStep440を行なって各予測次数の場合の係数符号量と残差符号量を求める。最適次数探索部450は図5のStep450を行なって係数符号量と残差符号量の合計が最小となるときの予測次数を最適予測次数Pvと決定する。最適係数決定部460は、図5のStep460を行い最適予測次数Pvが決定されたときの予測係数を最適予測係数として出力する。
このように、この実施例ではLevinson-Durbin法又はBurg法などの逐次法により少ない演算処理量で暫定的な最適予測次数(最適予測次数探索の初期値)P0を求め、更にその次数P0の周辺の各予測次数について共分散法や数値計算法などの厳密法により求めた線形予測係数から予測係数の符号量を求めるとともに残差符号の符号量を求め、これらの残差符号量と係数符号量の合計が最小となる予測次数を最適予測次数Pvと決定する。従って、合計符号量を最小とする最適予測次数、及び必要に応じて最適予測係数、をより正確に、しかも比較的少ない演算処理量で得ることができる。
図5のStep300における各予測次数での残差符号量を求める方法は、例えばStep100で得た各予測次数でのPARCOR係数またはそのPARCOR係数を量子化した量子化済PARCOR係数を線形予測係数に変換し、得られた線形予測係数を使って入力信号に対し線形予測フィルタ処理を行って予測残差を求め、その予測残差を符号化して符号量を得る方法が一般的である。
残差符号量を推定する方法としては、例えば、各予測次数でのPARCOR係数を使って求まる予測残差のエネルギーから符号量を推定する方法がある。例えば、入力信号x(n)の1フレームあたりのエネルギーE(0)は
Figure 0004838773
となる。1次のPARCOR係数k(1)を用いて、1次の線形予測を行ったときの予測残差のエネルギーE(1)は、
E(1)=E(0){1-k(1)2} (6)
となる。2次の線形予測を行ったときの予測残差のエネルギーE(2)は、
E(2)=E(1){1-k(2)2} (7)
となる。これをPmaxまで繰り返すと、Pmax次の線形予測を行ったときの予測残差のエネルギーE(Pmax)は、
Figure 0004838773
となるので、それぞれの予測次数での残差エネルギーで予測残差の符号量を近似できる。
図5のStep440における残差符号量としても、Step420で求めた線形予測係数を使って上述と同様に入力信号に対し線形予測フィルタ処理を行って予測残差を求め、その予測残差を符号化して実際の符号量を用いてもよいし、Step420で得られた線形予測係数をPARCOR係数に変換し、上述のように各予測次数でのPARCOR係数を使って求めた予測残差のエネルギーから推定した符号量を用いてもよい。
以上の説明において、多チャネル信号符号化にこの発明を適用する場合、後述のようにあるチャネルにおける線形予測分析のための最適予測次数探索の初期値予測次数P0としては、他のチャネルの線形予測分析部において求めた最適予測次数を使用してもよい。
マルチチャネル信号符号化
この発明による線形予測符号化の最適予測次数の決定方法を適用したマルチチャネル信号符号化方法及び装置を以下に説明する。
<第1実施例>
図6は、図5に示した方法を2チャネル信号符号化装置に適用した実施例を示す。例えばコンパクトディスク(CD)のオーディオ2チャネル信号(ステレオ信号)の左右チャネル信号間には相互相関があることが知られている。このことから、一方のチャネルにおいて線形予測分析に最適な分析予測次数は、他方のチャネルにおける線形予測分析に最適な予測次数と近いことが推定される。図7の実施例では、2チャネル信号の符号化装置にこの発明を適用することにより、線形予測分析部において最適な予測次数を決定する演算処理量を減らすことができる。
右チャネルの符号化構成と左チャネルの符号化構成は図2の符号化構成を同様である。図7は、左チャネルの最適予測次数を求める方法として本発明を適用したものであり、右チャネルの線形予測分析部11Rで図5のStep100〜Step410により決定された最適予測次数P0が左チャネルの線形予測分析部31Lに最適予測次数探索の初期値として与えられ、Step420〜Step450が実行されることが特徴である。
線形予測分析部11Rに与えられた右チャネル入力信号xR(n)に対し、予め決めた第1の範囲(Pmin1〜Pmax1)の各予測次数の線形予測係数を逐次法で求める。具体的には、1次からPmax1次まで順次次数を増加させながら、順次増加させた次数分のみのPARCOR係数または線形予測係数を例えばLevinson-Durbin法又はBurg法のような逐次的方法により線形予測分析を行なって求める。そして、Pmin1〜Pmax1の各次における予測残差符号量と係数符号量を求めて、それらの合計が最小となる予測次数P0を決め、その予測次数P0で得られた予測係数をPARCOR係数KR={kR(1), kR(2), …, kR(P0)}として出力する。量子化部12RはPARCOR係数KRを量子化し、量子化済PARCOR係数K'R={k'R(1), k'R(2), …, k'R(P0)}を出力する。逆変換部13Rは量子化済PARCOR係数K'Rを線形予測係数a'R={α'R(1), α'R(2), …, α'R(P0)}に変換する。線形予測フィルタ14Rは線形予測係数a'Rを使って入力信号xR(n)を線形予測フィルタ処理して予測残差eR(n)を出力する。線形予測分析部11R、量子化部12R、逆変換部13R、線形予測フィルタ14Rは線形予測分析手段10Rを構成している。
係数符号化部21Rは最適予測次数P0と量子化済PARCOR係数K'Rを符号化し、係数符号Ck Rを出力する。残差符号化部22Rは予測残差eR(n)を例えばエントロピー符号化し、残差符号Ce Rを出力する。符号合成部23Rは係数符号Ck Rと残差符号Ce Rを合成し、Rチャネル符号Cg Rとして出力する。係数符号化部21R、残差符号化部22R、符号合成部23Rは符号化手段20Rを構成している。
左チャネル側符号化構成においては、線形予測分析部31Lは線形予測分析部11Rから予測次数P0が探索初期値として与えられ、P0を含む第1の範囲より狭い第2の範囲(Pmin2〜Pmax2)の各予測次数で入力信号xL(n)に対し例えば共分散法や数値計算法のような厳密な方法で線形予測分析を行ない、予測残差とそのときの線形予測係数の符号量の合計を求め、合計符号量が最も小さくなる予測次数を最適予測次数Pvと決定する。そして、この最適予測次数Pvのときの厳密法で求めた線形予測係数をPARCOR係数KL={kL(1), kL(2), …, kL(Pv)}に変換して出力する。
量子化部32LはPARCOR係数KLを量子化し、量子化済PARCOR係数K'L={k'L(1), k'L(2), …, k'L(Pv)}を出力する。逆変換部33Lは量子化済PARCOR係数K'Lを線形予測係数a'L={α'L(1), α'L(2), …, α'L(P0)}に変換する。線形予測フィルタ34Lは線形予測係数a'Lを使って入力信号xL(n)を線形予測フィルタ処理して予測残差eL(n)を出力する。線形予測分析部31L、量子化部32L、逆変換部33L、線形予測フィルタ34Lは線形予測分析手段30を構成している。
係数符号化部21Lは最適予測次数Pvと量子化済PARCOR係数K'Lを符号化し、係数符号Ck Lを出力する。残差符号化部22Lは予測残差eL(n)を例えばエントロピー符号化し、残差符号Ce Lを出力する。符号合成部23Lは係数符号Ck Lと残差符号Ce Lを合成し、Lチャネル符号Cg Lとして出力する。残差符号化部22L、係数符号化部21L、符号合成部23Lは符号化手段20Lを構成している。
また、この実施例では線形予測分析部11Rと31Lの組がこの発明による最適予測次数決定装置及びそれを含む最適予測係数決定装置を構成している。この実施例の最適予測次数決定装置40'及びそれを含む最適予測係数決定装置11'の機能構成を図8に示す。この実施例の最適予測次数決定装置40'は、線形予測分析部11R中の逐次線形予測分析部100と係数符号量算出部200と残差符号量算出部300と最適次数探索初期値決定部410と、線形予測分析部31L中の厳密線形予測分析部420と係数符号量算出部430と残差符号量算出部440と最適次数探索部450とにより構成されている。最適予測係数決定装置11'は、最適予測次数決定装置40'と、線形予測分析部11R中の最適係数決定部411と、線形予測分析部31L中の最適係数決定部460とから構成されている。
逐次線形予測分析部100は、入力信号xR(n)が与えられて図5のStep100を行い各予測次数の場合のPARCOR係数を求める。係数符号量算出部200及び残差符号量算出部300はそれぞれ図5のStep200及びStep300を行い、各予測次数の場合の係数符号量及び残差符号量を求める。最適次数探索初期値決定部410は図5のStep410を行い係数符号量と残差符号量の合計が最小となる予測次数を最適次数探索の初期値P0と決定する。
厳密線形予測分析部420は入力信号xL(n)と最適次数探索初期値P0が与えられ、図5のStep420で厳密法による線形予測分析を行なって各予測次数の場合の線形予測次数を求める。係数符号量算出部430及び残差符号量算出部440はそれぞれ図5のStep430及びStep440を行なって各予測次数の場合の係数符号量と残差符号量を求める。最適次数探索部450は図5のStep450を行なって係数符号量と残差符号量の合計が最小となるときの予測次数を最適予測次数Pvと決定する。最適係数決定部460は、図5のStep460を行い最適予測次数Pvが決定されたときの予測係数を左チャネルの最適予測係数として出力する。一方、最適係数決定部411は、最適次数探索初期値決定部410が探索初期値P0を決めたときの予測係数を右チャネルの最適予測係数として出力する。
チャネル間相関を利用した符号化
マルチチャネル信号の圧縮符号化では、”チャネル間相関を用いた多チャネル信号の可逆圧縮符号化“、情報処理学会論文誌、Vol.46, No.5, pp.1118-1128(以下、参考文献1と呼ぶ)に示されているように、チャネル間の相関を利用して符号化を行うことにより、圧縮効率の良い符号化を行うことができる。具体的には、所望の1つのチャネルを親チャネルとし、他を子チャネルとし、それぞれのチャネルごとに独立に線形予測分析を行って予測残差の基準値(エネルギーなど)を最小化するように、例えばLevinson-Durbin法などにより線形予測分析が行なわれ、分析により得られた線形予測係数a={α(1), α(2), …, α(P)}, α(0)=1を用いたフィルタを通して得られる親チャネルの予測残差に対して各子チャネルの予測残差を重み付き減算処理して残差差分を求め、親チャネルについてはその予測係数と予測残差を符号化し、各子チャネルについてはその予測係数と残差差分を符号化している。
マルチチャネル信号間に相互相関がある場合、それぞれのチャネル毎に線形予測残差のエネルギーが小さくなるように求めた線形予測係数を用いて線形予測分析を行っても、子チャネルにおいて符号化の対象となる残差差分信号についてはエネルギーが最小となっているわけではなく、残差差分信号をエントロピー符号化した際の符号量は必ずしも少なくできず、効率の良い符号化を行っているとはいえない。そこで合計の基準値(言い換えれば実際に符号化される信号の基準値)、例えば入力信号が2チャネルステレオ信号の右チャネル信号xR(n)を親チャネル信号、左チャネル信号xL(n)を子チャネル信号とする場合、親チャネルの予測残差エネルギー基準と、親チャネル予測残差と子チャネル予測残差の重みつき減算処理後の残差差分信号エネルギー基準の合計
Figure 0004838773
が最小となるように、子チャネル予測残差を求めるための線形予測係数を決めることが鎌本、原田、守谷、“MPEG-4 ALSのマルチチャネル符号化に対応した線形予測分析”、日本音響学会講演論文集、1-1-4、2007年3月13日(以下、参考文献2と呼ぶ)に示されている。ここで、重み係数γは前述のように減算処理後のエネルギーが最小となるように、
Figure 0004838773
によって決められる。
このようにチャネル間の相互相関を考慮した式(9)を最小化する線形予測係数を求めるため、式(9)を線形予測係数で偏微分して0とおいた式を解くことにより線形予測係数を求める変形された共分散法(これも線形予測分析の厳密な手法の1つであり、以降、変形共分散法と呼ぶ)も、参考文献2に示されている。以下のマルチチャネル信号符号化装置の実施例においても、相互相関を利用した線形予測分析部においてこの手法を使うものとする。
<第2実施例>
図9は図10に示すチャネル間相関を利用した線形予測分析を行なうマルチチャネル信号符号化装置に適用する予測次数の決定方法の処理手順を示す。この実施例では、Step410’で示すように、子チャネル側のチャネル間相関を利用した線形予測分析部54Mにおいて、他のチャネルである親チャネルの線形予測分析部11Rにおいて決定された最適予測次数P0を最適予測次数探索の初期値として使用することが特徴である。共分散法または数値計算による手法を用いるStep420の代わりに変形共分散法を用いるStep420’を行う以外は図5のStep420〜Step460の対応する処理手順と同じである。
あるフレーム(Nサンプル)のRチャネルの信号をxR(n)(n=1, 2, …, N)、Lチャネルの信号をxL(n)(n=1, 2, …, N)とする。ここでは、Rチャネルを親チャネル、Lチャネルを子チャネルとする。
線形予測分析部11Rは入力された親チャネル信号xR(n)から図5で説明した方法により最適予測次数P0を決定し、その予測次数でのPARCOR係数KR={kR(1), kR(2), …, kR(P0)}を得る。また、その最適予測次数P0を探索初期値としてチャネル間相関を利用した線形予測分析部54Mに与える。量子化部12Rは入力されたPARCOR係数KR={kR(1), kR(2), …, kR(P0)}を量子化し、量子化済PARCOR係数K'R={k'R(1), k'R(2), …, k'R(P0)}を出力する。逆変換部13Rは入力された量子化済PARCOR係数K'R={kR(1), k'R(2), …, k'R(P0)}を量子化済予測係数a'R={α'R(1), α'R(2), …, α'R(P0)}に逆変換する。線形予測フィルタ14Rは量子化済予測係数a'R={α'R(1), α'R(2), …, α'R(P0)}をフィルタ係数として、入力された親チャネル原信号xR(n)を次式でフィルタリングし予測残差eR(n)を得る。ただしα'R(0)=1とする。
Figure 0004838773
係数符号化部21Rは最適予測次数P0と量子化済PARCOR係数K'R={k'R(1), k'R(2), …, k'R(P0)}を符号化し係数符号Ck Rを出力する。残差符号化部22Rは予測残差eR(n)を符号化し残差符号Ce Rを出力する。符号合成部23Rは残差符号Ce Rと係数符号Ck Rを合成し、親チャネル合成符号Cg Rを出力する。
チャネル間相関を利用した線形予測分析部54Mは、与えられた最適予測次数の初期値P0の周辺(P0±ΔPvの範囲)の各予測次数Ph(h=-ΔPv, …, +ΔPv)それぞれについて以下のStep1〜Step4を行う。
Step1:入力された子チャネル信号xL(n)と、線形予測フィルタ14Rからの親チャネル予測残差eR(n)とを使ってチャネル間の相互相関を考慮した変形共分散法により相互相関を考慮した線形予測係数aM={αM(1), αM(2), …, αM(Ph)}を求める。
Step2:線形予測係数aMをPARCOR係数に変換し、係数符号量を推定する。
Step3:親チャネル予測残差eR(n)と相関を考慮した子チャネル予測残差eM(n)とから変形共分散法により残差差分信号e'M(n)=eR(n)-γeM(n)を推定し、その符号量を残差符号量として求める。
Step4:Step2とStep3で得た係数符号量と残差符号量の合計符号量を求める。
チャネル間相関を利用した線形予測分析部54Mは、すべての予測次数について得られた合計符号量から合計符号量を最小にする予測次数Phを最適予測次数Pvと決定する。
変換部55Mは線形予測係数aM={αM(1), αM(2), …, αM(Pv)}をPARCOR係数KM={kM(1), kM(2), …, kM(Pv)}に変換する。量子化部56Mは入力されたPARCOR係数KMを量子化し、量子化済PARCOR係数K'M={k'M(1), k'M(2), …, k'M(Pv)}を出力する。逆変換部57Mは入力された量子化済PARCOR係数K'M={k'M(1), k'M(2), …, k'M(Pv)}を量子化済予測係数a'M={α'M(1), α'M(2), …, α'M(Pv)}に逆変換する。線形予測フィルタ58Mは量子化済予測係数a'M={α'M(1), α'M(2), …, α'M(Pv)}をフィルタ係数として、入力された子チャネル信号xL(n)を以下の式でフィルタリングし予測残差eM(n)を得る。ただしα'M(0)=1とする。
Figure 0004838773
重み計算部51は親チャネルの予測残差eR(n)と相互相関を考慮した予測残差eM(n)を用いて以下の式から重み係数γを求める。
Figure 0004838773
重み量子化部52は重み係数γを量子化し、量子化済重み係数γ'を得る。重み付き減算処理部53は、予測残差eR(n)、eM(n)と量子化済重み係数γ'を用いて以下の式より、残差差分信号e'M(n)を得る。
Figure 0004838773
重み計算部51、重み量子化部52、重み付き減算処理部53、チャネル間相関を利用した線形予測分析部54M、変換部55M、量子化部56M、逆変換部57M、線形予測フィルタ58Mは線形予測分析手段50を構成している。
残差符号化部61Mは残差差分信号e'M(n)を符号化し残差符号Ce Mを出力する。係数符号化部64Mは最適予測次数Pvと量子化済PARCOR係数K'M={k'M(1), k'M(2), …, k'M(Pv)}を符号化し係数符号Ck Mを出力する。重み符号化部62Mは量子化済重み係数γ'を符号化し重み符号Cw Mを出力する。符号合成部63Mは残差符号Ce Mと重み符号Cw Mと係数符号Ck Mを合成し、子チャネル合成符号Cg Mを出力する。残差符号化部61M、重み符号化部62M、符号合成部63M、係数符号化部64Mは符号化手段60を構成している。
また、この実施例では線形予測分析部11Rとチャネル間相関を利用した線形予測分析部54Mの組がこの発明の最適予測次数決定装置及びそれを含む最適予測係数決定装置を構成している。
<第3実施例>
図11は図12の多チャネル信号符号化装置に適用するこの発明による予測次数決定方法の処理手順を示す。ここでは、子チャネル側の信号xL(n)に対するチャネル相関を利用した予測分析において、同じ子チャネル側の線形予測分析部31Lにおいて決定した最適予測次数P0を探索の初期値として使用することが特徴である。またこの実施例では、子チャネルに関しては、子チャネルについて独立して線形予測分析を行って求めた係数符号Ck Lと残差符号Ce Lとを合成して得たCg Lと、図10の実施例で求めたCg Mの符号量を符号量比較部で比較して少ない方を出力している。
図12の実施例は、図10の実施例に対し、線形予測分析部11L、量子化部12L、逆変換部13L、線形予測フィルタ14L、残差符号化部22L、係数符号化部21L、符号合成部23L、符号量比較部71が追加されている。
図11の処理において、Step100の代わりに子チャネルについて独立してPARCOR係数を算出するStep100’を行い、Step420の代わりに親チャネルとの相関を考慮した手法により線形予測係数を算出するStep420’を行う以外は、図5のStep100〜Step450の処理と同様である。Step100’〜Step410は子チャネル側の線形予測分析部11Lによって実行され、Step420’〜Step450は同じ子チャネル側のチャネル間相関を利用した線形予測分析部54Mにおいて実行される。
線形予測分析部11Lは入力された子チャネル原信号xL(n)を従来の線形予測分析方法(Levinson-Durbin法又はBurg法などの逐次法または共分散法または数値計算法などの厳密法)により線形予測分析し、最適予測次数探索初期値P0を求め、PARCOR係数KL={kL(1), kL(2), …, kL(P0)}を出力する。量子化部12Lは入力されたPARCOR係数KL={kL(1), kL(2), …, kL(P0)}を量子化し、量子化済PARCOR係数K'L={k'L(1), k'L(2), …, k'L(P0)}を出力する。逆変換部13Lは入力された量子化済PARCOR係数K'L={k'L(1), k'L(2), …, k'L(P0)}を量子化済予測係数a'L={α'L(1), α'L(2), …, α'L(P0)}に逆変換する。線形予測フィルタ14Lは量子化済予測係数a'L={α'L(1), α'L(2), …, α'L(P0)}をフィルタ係数として、入力された子チャネル信号xL(n)を以下の式でフィルタリングし予測残差eL(n)を得る。ただしα'L(0)=1とする。
Figure 0004838773
残差符号化部22Lは予測残差eL(n)を符号化し残差符号Ce Lを出力する。係数符号化部21Lは最適予測次数P0と量子化済PARCOR係数K'L={k'L(1), k'L(2), …, k'L(P0)}を符号化し係数符号Ck Lを出力する。符号合成部23Lは残差符号Ce Lと係数符号Ck Lを合成し、通常子チャネル合成符号Cg Lを出力する。
この実施例では、子チャネルの線形予測分析部11Lにおいて子チャネルについて独立して線形予測分析を行う方法により求めた最適予測次数P0がチャネル間相関を利用した線形予測分析部54Mに与えられる。チャネル間相関を利用した線形予測分析部54Mは、与えられた予測次数P0を初期値とし、図9,10で説明したと同様の手法でP0±ΔPvの範囲で各予測次数について前述の変形共分散法により線形予測係数を求め、残差差分の符号量と係数符号量の合計が最小となる予測次数Pvを最適予測次数と決め、そのときの線形予測係数を変換部55Mに与える。この線形予測係数に基づく量子化済線形予測係数を使って線形予測フィルタ58Mにより子チャネルの予測残差を生成し、重み計算部51及び重み付き減算処理部53に与える。
符号合成部23Lからの合成符号Cg Lと符号合成部63Mからの合成符号Cg Mが符号量比較部71に与えられてそれらの符号量が比較され、少ない方の合成符号を選択してどちらを選択したかを表す情報と共に子チャネルの符号として出力する(図11のStep600)。つまり、この実施例では、線形予測分析部11Lは子チャネルについて独立した線形予測分析方法に基づいて最適予測次数P0を決定してそのときの予測係数を出力し、チャネル間相関を利用した線形予測分析部54Mはその最適予測次数P0を初期値として使って図5のStep420〜Step460により変形共分散法による予測次数の探索を実行している。従って、この実施例では線形予測分析部11Lとチャネル間相関を利用した線形予測分析部54Mの組がこの発明の最適予測次数決定装置及びそれを含む最適予測係数決定装置を構成している。
この実施例によれば、チャネル間相関を利用した線形予測分析部における最適予測次数の探索を少ない演算量で行うことができる。
図13は、図12のチャネル間相関を利用した線形予測分析部54Mにおいて、入力信号xL(n)の各フレーム毎に1次から予め決めたPmax次までの各予測次数で変形共分散法に基づく連立方程式を解くことを繰り返すことにより求めた最適予測次数Pvに対する、子チャネルの線形予測分析部11Lにおいて従来のLevinson-Drubin法又はBurg法により推定した最適予測次数P0との差を求めることを所定長の入力信号について繰り返し、各最適予測次数P0との差に対する変形共分散法による最適予測次数の出現確率分布を示す。入力信号はサンプル周波数48kHz、各サンプル長16ビット、のステレオ音響信号で、それぞれ30秒のファイルを15ファイル用いた。最大次数Pmax=31とした。図12の実施例において、線形予測分析部31Lから与えられる最適予測次数P0に対し、チャネル間相関を利用した線形予測分析部54Mで探索を行なって得られる最適予測次数Pvが同じとなる出現確率は約40%であり、P0=Pvを中心に前後4の範囲に最適予測次数が存在する確率は、70%以上となることを示している。
図14は図10又は12における親チャネル符号化構成部11R〜14R,21R,22R,23Rの代わりに実施可能な変形例を示す。前述のようにLevinson-Durbin法では、信号に窓関数を掛けることで定常とみなし、分析を行なっている。そのため、正確な予測係数を得るには窓を用いない共分散法を用いたほうがよいが、共分散法を用いた場合のほうが常に符号量が小さくなるとは限らない。そこで、ここではLevinson-Durvin法で求めた最適次数P0を使って推定した符号量と、予測次数P0を初期値として、共分散法の最適予測次数を探索により見つけて、符号量を求めた場合を比較し、符号量の少ないほうを採用する。
入力信号x(n)から符号化構成部11〜14,21,22,23により合成符号Cgxを出力するまでは図10,12と同様にLevinson-Durbin法により最適な予測次数P0が決定され、そのときの予測係数に基づいてPARCOR係数及び予測残差の符号化が行なわれ、符号合成部23で合成される。ここでは、探索する予測次数の範囲をP0-ΔPv〜P0+ΔPvとする。ただし、P0-ΔPvが予め定められた下限Pmin(例えば0)を下回った場合は、ΔPb=P0-Pminとし(つまり次数が負にならないようにする)、同様にP0+ΔPvが予め定められた上限Pmaxを上回った場合は、ΔPt=P0+Pmaxとし、探索範囲をP0-ΔPb〜P0+ΔPv、P0-ΔPv〜P0+ΔPt、P0-ΔPb〜P0+ΔPt、というように非対称に変形することもある。また、すでに処理を終えたフレームまでの次数の差の出現確率分布に基づく統計量を用いてもよい。例えば統計的分布が左右対称でない場合は、3次統計量などを利用して、P0-ΔPb〜P0+ΔPtというような非対称の探索範囲としてもよい。ここで、ΔPbとΔPtは同じ値になることも、異なる値となることもありえる。
線形予測分析部11Vは以下の処理を実行する。
Step1:入力信号x(n)を用いて予測次数Pvi=P0の共分散法による線形予測分析を行ない、線形予測係数avi={αvi(1), αvi(2), …, αvi(Pvi)}を得る。これをPARCOR係数Kvi={kvi(1), kvi(2), …, kvi(Pvi)}に変換し、予測次数Pviの符号量を含む係数符号量を得る。式(8)においてPmax=Pviとし、エネルギー残差を求め、残差符号量を推定する。係数符号量と残差符号量を合計した符号量を求める。
Step2:入力信号x(n)を用いて予測次数Pvi=P0-1の共分散法による線形予測分析を行ない、線形予測係数avi={αvi(1), αvi(2), …, αvi(Pvi)}を得る。これをPARCOR係数Kvi={kvi(1), kvi(2), …, kvi(Pvi)}に変換し、予測次数Pviの符号量を含む係数符号量を得る。式(8)においてPmax=Pviとし、エネルギー残差を求め、残差符号量を推定する。係数符号量と残差符号量を合計した符号量を求める。
Step3:入力信号x(n)を用いて予測次数Pvi=P0+1の共分散法による線形予測分析を行ない、線形予測係数avi={αvi(1), αvi(2), …, αvi(Pvi)}を得る。これをPARCOR係数Kvi={ kvi(1), kvi(2), …, kvi(Pvi)}に変換し、係数符号量を得る。式(8)においてPmax=Pviとし、エネルギー残差を求め、残差符号量を推定する。係数符号量と残差符号量を合計した符号量を求める。
このように上記StepをP0-ΔPvからP0+ΔPvまで繰り返し、最も合計符号量が小さくなる予測次数Pviを最適予測次数Pvと決定する。
線形予測分析部11Vは、最適予測次数とPARCOR係数Kv={ kv(1), kv(2), …, kv(Pv)}を出力する。量子化部12VはPARCOR係数Kvを量子化し、量子化済PARCOR係数K'v={Pv, k'(1), k'(2), …, k'(Pv)}を出力する。逆変換部13Vは量子化済PARCOR係数K'vを線形予測係数a'v={α'v(1), α'v(2), …, α'(Pv)}に変換して出力する。線形予測フィルタ14Vは線形予測係数a'vをフィルタ係数として、入力された信号x(n)(n=1, 2, …, N)をPv次の線形予測フィルタ処理し、予測残差
Figure 0004838773
を得る。残差符号化部22Vは予測残差ev(n)を例えばエントロピー符号化し、残差符号Cevを出力する。係数符号化部21Vは最適予測次数Pvと量子化済PARCOR係数K'vを符号化し、係数符号Ckvを出力する。符号合成部23Vは残差符号Cevと係数符号Ckvを合成し、合成符号Cgvを出力する。符号量比較部24は、合成符号Cgxと合成符号Cgvを比較し、符号量の小さいほうを合成符号Cgとして出力する。線形予測分析部11V、量子化部12V、逆量子化部13V、線形予測フィルタ14Vは線形予測分析手段10Vを構成し、係数符号化部21V、残差符号化部22V、符号合成部23Vは符号化手段20Vを構成している。
図14の変形例は図12における子チャネル側符号化構成部31L〜34L,42L,43L,44Lにも同様に適用できる。また、図14の装置を単独のチャネルの符号化装置として使用してもよい。
図15は、図14の変形実施例である。入力信号x(n)から符号化構成部11〜14,21〜23により合成符号Caを出力するまでは図14と同様にLevinson-Durbin法やBurg法などにより最適予測次数P0が決定され、そのときの予測次数に基づいてPARCOR係数及び予測残差の符号化が行なわれ、符号合成部23で合成される。図14では線形予測分析部11Vは入力信号x(n)から各予測次数ごとに共分散法に基づく線形予測分析により係数符号量及び残差符号量を推定して合計符号量が最小となる予測次数を決定した。しかし、図15では、線形予測分析部11Vは各予測次数Pv=P0-ΔPv,P0-ΔPv+1, …, P0, …, P0+ΔPv-1, P0+ΔPvごとに共分散法に基づく線形予測分析により線形予測係数を求め、PARCOR係数に変換して出力し、以下、そのPARCOR係数から量子化部12V、逆変換部13V,線形予測フィルタ14V、係数符号化部21V、残差符号化部22V、符号合成部23Vにより実際に係数符号及び残差符号を求め、合成符号を生成し、線形予測分析部11Vに与える。線形予測分析部11Vは各予測次数Pvに対する合成符号の符号量を比較し、最小符号量となる予測次数を決定する。
以下では、線形予測分析部11から与えられた最適予測次数の初期値P0に対し、探索予測次数をPvi=P0+iとおき、iを-ΔPv〜ΔPvの範囲で変化させる場合の各予測次数Pviでの処理手順を説明する。
Step1:線形予測分析部11Vでは、入力信号x(n)を用いて予測次数Pviの共分散法又は数値計算法による線形予測分析を行ない、線形予測係数avi={αvi(1), αvi(2), …, αvi(Pvi)}を変換したPARCOR係数Kvi={kvi(1), kvi(2), …, kvi(Pvi)}を出力する。
Step2:量子化部12VはPARCOR係数Kviを量子化し、量子化済PARCOR係数K'vi={k'vi(1), k'vi(2), …, k'vi(Pvi)}を出力する。
Step3:逆量子化部13Vは量子化済PARCOR係数K'viを線形予測係数a'vi={α'vi(1), α'vi(2), …, α'vi(Pvi)}に変換して出力する。
Step4:線形予測フィルタ14Vは線形予測係数a'vi={α'vi(1), α'vi(2), …, α'vi(Pvi)}をフィルタ係数として、入力信号x(n)(n=1, 2, …, N)を次式でPvi次の線形予測フィルタ処理を行い、予測残差evi(n)を得る。
Figure 0004838773
Step5:残差符号化部22Vは予測残差evi(n)を例えばエントロピー符号化し、残差符号Ceviを出力する。
Step6:係数符号化部21Vは最適予測次数Pviと量子化済PARCOR係数K'vi={k'vi(1), k'vi(2), …, k'vi(Pvi)}を符号化し、係数符号Ckviを出力する。
Step7:符号合成部23Vは残差符号Ceviと係数符号Ckviを合成し、合成符号Cgviを線形予測分析部11Vに与える。
上記Step1〜Step7が-ΔPv〜+ΔPv の範囲のiについてすべて実行され、それによって線形予測分析部11Vは各予測次数Pv=P0+iに対する合成符号の符号量を得て、それらの中で最小の符号量に対応する予測次数を最適予測次数と決定し、符号合成部24Vはその最適予測次数に対応する合成符号Cgvを符号量比較部24に出力する。符号量比較部24は符号合成部23及び23Vからの合成符号Cgx及びCgvの符号量を比較し、小さいほうを合成符号Cgとして出力する。
予測次数Pvの探索範囲が広くなれば、圧縮率は向上するが、処理量が増えるため処速度が低下するので、図13の結果を参考にすれば、予測次数P0の周辺5次程度で探索すれば十分な性能が得られる。
図15の装置も単独チャネルの符号化装置として使用してもよい。
<応用例1>
前述の図7及び10のマルチチャネル線形予測符号化においては、1つのチャネルでの線形予測分析で決めた最適予測次数P0を他の1つのチャネルの線形予測分析における最適予測次数探索の初期値として利用する場合を示した。脳磁場計測(MEG)信号やマイクロホンアレー信号などのようなマルチチャネル信号(Mチャネル、Mは3以上の整数)において、Hチャネル(Hは2以上M未満の整数)の最適次数の平均値や中央値(即ち、統計的な代表値)を初期値として、残りのM−Hチャネルの最適予測次数をそれぞれ求めてもよい。M−Hチャネルのうちの1つのチャネルにおけるその処理手順を図16に示す。
Step410":複数の他チャネルについて求めた最適予測次数の平均値又は中央値などを厳密法による最適予測次数探索の初期値P0とする。
Step420:厳密法によりP0−ΔPv〜P0+ΔPvの範囲の各予測次数の場合の線形予測係数を算出する。
Step430:上記範囲の各予測次数の場合の係数符号量を求める。
Step440:上記範囲の各予測次数の場合の残差符号量を求める。
Step450:係数符号量と残差符号量の合計が最小となる予測次数を最適予測次数Pvとする。
Step460:最適予測次数Pvのときの線形予測係数を最適な予測係数とする。
例えば、512チャネルのMEG信号(M=512)であれば、その10分の1程度の50チャネルをHとし、残りの462チャネルのそれぞれについて上記処理を実行する。
<応用例2>
上記応用例1において、探索範囲を決めるΔPvの値は例えば標準偏差などの統計量に基づいて決めることができる。その場合の処理手順を図17に示す。
Step410":複数の他チャネルについて求めた最適予測次数の平均値又は中央値などを厳密法による最適予測次数探索の初期値P0とする。
Step415:複数の他のチャネルについて求めた最適予測次数の標準偏差に最も近い整数値(切り上げ、切り捨て、四捨五入など)をΔPvとする。ただし、P0-ΔPvが予め定められた下限Pmin(例えば0)を下回った場合は、ΔPb=P0-Pminとし(つまり次数が負にならないようにする)、同様にP0+ΔPvが予め定められた上限Pmaxを上回った場合は、ΔPt=P0+Pmaxとし、探索範囲をP0-ΔPb〜P0+ΔPv、P0-ΔPv〜P0+ΔPt、P0-ΔPb〜P0+ΔPt、というように非対称に変形することもある。また、標準偏差に限らず他の統計量を用いてもよい。例えば統計的分布が左右対称でない場合は、3次統計量などを利用して、P0-ΔPb〜P0+ΔPtというような非対称の探索範囲としてもよい。ここで、ΔPbとΔPtは同じ値になることも、異なる値となることもありえる。以降のStep420〜Step460は図16の場合と同様なので説明を省略する。
ここで、Step410"において平均値や中央値などを求める対象のチャネルやチャネル数と、Step415において標準偏差を求める対象のチャネルやチャネル数とは同じとするのが通常であるが、必ずしも同じである必要はなく、異なってもよい。また、Step420の代わりに、他チャネルとの相関を考慮した厳密法である変形共分散法などを用いてもよい。この場合は、Step420を図11のStep420'に置き換える構成となる。
以上説明したこの発明による予測次数決定装置は、この発明による予測次数決定方法を処理手順として表したコンピュータプログラムを実行するコンピュータにより実現してもよい。また、そのコンピュータは、記録媒体に記録された上記プログラムを読み取り、実行するように構成してもよい。
ロスレス符号化における予測次数と符号量の関係を説明するためのグラフ。 従来の線形予測符号化の機能構成ブロック図。 従来の予測次数決定方法の処理手順を示すフロー図。 従来の他の予測次数決定方法の処理手順を示すフロー図。 この発明による予測次数決定方法の処理手順を示すフロー図。 この発明による最適予測次数決定装置及びそれを含む最適予測係数決定装置の機能構成を示すブロック図。 この発明が適用されたマルチチャネル符号化装置の第1実施例を示す機能構成ブロック図。 この発明による最適予測次数決定装置及びそれを含む最適予測係数決定装置の他の例を示す機能構成ブロック図。 マルチチャネル符号化に適用されたこの発明の予測次数決定方法の処理手順を示すフロー図。 この発明を適用したマルチチャネル符号化装置の第2実施例を示す機能構成ブロック図。 マルチチャネル符号化に適用されたこの発明の予測次数決定方法の他の例を示すフロー図。 この発明を適用したマルチチャネル符号丘装置の第3実施例を示す機能構成ブロック図。 入力された予測次数からのずれに対する最適予測次数の出現確率の例を示すグラフ。 この発明が適用された符号化装置の変形実施例を示す機能構成ブロック図。 この発明が適用された符号化装置の他の変形実施例を示す機能構成ブロック図。 マルチチャネル予測符号化におけるこの発明の応用例を説明するためのフロー図。 図16における初期予測次数の決め方を説明するためのフロー図。

Claims (13)

  1. 時系列入力信号に対する最適予測次数の決定方法であり、
    (a) 第1線形予測分析手段が、フレーム毎に上記入力信号を逐次的方法により線形予測分析し、予め決めた第1の範囲の各予測次数について、予測係数の係数符号量または推定符号量と、予測残差の残差符号量または推定符号量と、の合計が最小となる予測次数を最適予測次数探索の初期値として得るステップと、
    (b) 第2線形予測分析手段が、上記初期値を含み、上記第1の範囲より狭い第2の範囲の各予測次数で上記入力信号を、予測次数毎に全次の線形予測係数を求める方法により線形予測分析し、予測係数の係数符号量または推定符号量と、予測残差の残差符号量または推定符号量と、の合計が最小となる予測次数を最適予測次数と決定するステップ、
    とを含むことを特徴とする最適予測次数決定方法。
  2. マルチチャネル時系列入力信号中のいずれかのチャネルに対する最適予測次数の決定方法であり、
    (a) 第1線形予測分析手段が、フレーム毎に該チャネル以外の何れかのチャネルの入力信号を線形予測分析し、予め決めた第1の範囲の各予測次数について、予測係数の係数符号量または推定符号量と、予測残差の残差符号量または推定符号量と、の合計が最小となる予測次数を最適予測次数探索の初期値として得るステップと、
    (b) 第2線形予測分析手段が、上記初期値を含み、上記第1の範囲より狭い第2の範囲の各予測次数で該チャネルの入力信号を、予測次数毎に全次の線形予測係数を求める方法により線形予測分析し、予測係数の係数符号量または推定符号量と、予測残差の残差符号量または推定符号量と、の合計が最小となる予測次数を最適予測次数と決定するステップ、
    とを含むことを特徴とする最適予測次数決定方法。
  3. 請求項2記載の最適予測次数決定方法において、
    上記ステップ(a) は、最適予測次数を決定する対象以外の複数個のチャネルについて求めた、予測係数の係数符号量または推定符号量と、予測残差の残差符号量または推定符号量と、の合計が最小となる予測次数の統計的な代表値を上記最適予測次数探索の初期値とすることを特徴とする最適予測次数決定方法。
  4. 請求項2または3記載の最適予測次数決定方法において、
    最適予測次数を決定する対象以外の複数個のチャネルについて求めた、予測係数の係数符号量または推定符号量と、予測残差の残差符号量または推定符号量と、の合計が最小となる予測次数の標準偏差に最も近い整数をΔPvとし、上記最適予測次数探索の初期値をP0としたとき、上記ステップ(b) における上記第2の範囲を、P0−ΔPvからP0+ΔPvまでの範囲とすることを特徴とする最適予測次数決定方法。
  5. 請求項1記載の最適予測次数決定方法において、上記逐次的方法は、低次から順次次数を増加させながら、順次増加させた次数分のみの線形予測係数を求める分析手順であることを特徴とする最適予測次数決定方法。
  6. マルチチャネル時系列入力信号中の何れかのチャネルに対する最適予測次数の決定方法であり、
    (a) 第1線形予測分析手段が、フレーム毎に該チャネルの入力信号を該チャネルの信号のみを用いて線形予測分析し、予め決めた第1の範囲の買う予測次数について、予測係数の係数符号量または推定符号量と、予測残差の残差符号量または推定符号量と、の合計が最小となる予測次数を最適予測次数探索の初期値として得るステップと、
    (b) 第2線形予測分析手段が、上記初期値を含み、上記第1の範囲より狭い第2の範囲の各予測次数で該チャネルの入力信号を該チャネルの線形予測残差と該チャネル以外のチャネルの信号の線形予測残差との重み付き差分が最小となる基準で全次の線形予測係数を求め、予測係数の係数符号量または推定符号量と、予測残差の残差符号量または推定符号量と、の合計が最小となる予測次数を最適予測次数と決定するステップ、
    とを含むことを特徴とする最適予測次数決定方法。
  7. 請求項6記載の最適予測次数決定方法において、
    上記ステップ(a) の、該チャネルの信号のみを用いる線形予測分析は、該チャネルの線形予測残差が最小となる基準で線形予測係数を求める分析手順であることを特徴とする最適予測次数決定方法。
  8. 線形予測符号化の最適予測係数決定方法であり、請求項1乃至7のいずれか1つの最適予測次数決定方法によって最適予測次数を決定し、さらに、最適係数決定手段が、上記最適予測次数に対応する上記ステップ(b) で求めた線形予測係数を最適予測係数と決めることを特徴とする最適予測係数決定方法。
  9. 時系列入力信号に対する最適予測次数の決定装置であり、
    フレーム毎に上記入力信号を逐次的方法により線形予測分析し、予め決めた第1の範囲の各予測次数について、予測係数の係数符号量または推定符号量と、予測残差の残差符号量または推定符号量と、の合計が最小となる予測次数を最適予測次数探索の初期値として得る第1線形予測分析手段と、
    上記初期値を含み、上記第1の範囲より狭い第2の範囲の各予測次数で上記入力信号を、予測次数毎に全次の線形予測係数を求める方法により線形予測分析し、予測係数の係数符号量または推定符号量と、予測残差の残差符号量または推定符号量と、の合計が最小となる予測次数を最適予測次数と決定する第2線形予測分析手段、
    とを含むことを特徴とする最適予測次数決定装置。
  10. マルチチャネル時系列入力信号中のいずれかのチャネルに対する最適予測次数の決定装置であり、
    フレーム毎に該チャネル以外の何れかのチャネルの入力信号を線形予測分析し、予め決めた第1の範囲の各予測次数について、予測係数の係数符号量または推定符号量と、予測残差の残差符号量または推定符号量と、の合計が最小となる予測次数を最適予測次数探索の初期値として得る第1線形予測分析手段と、
    上記初期値を含み、上記第1の範囲より狭い第2の範囲の各予測次数で該チャネルの入力信号を、予測次数毎に全次の線形予測係数を求める方法により線形予測分析し、予測係数の係数符号量または推定符号量と、予測残差の残差符号量または推定符号量と、の合計が最小となる予測次数を最適予測次数と決定する第2線形予測分析手段、
    とを含むことを特徴とする最適予測次数決定装置。
  11. マルチチャネル時系列入力信号中の何れかのチャネルに対する最適予測次数の決定装置であり、
    フレーム毎に該チャネルの入力信号を該チャネルの信号のみを用いて線形予測分析し、予め決めた第1の範囲の各予測次数について、予測係数の係数符号量または推定符号量と、予測残差の残差符号量または推定符号量と、の合計が最小となる予測次数を最適予測次数探索の初期値として得る第1線形予測分析手段と、
    上記初期値を含み、上記第1の範囲より狭い第2の範囲の各予測次数で該チャネルの入力信号を該チャネルの線形予測残差と該チャネル以外のチャネルの信号の線形予測残差との重み付き差分が最小となる基準で全次の線形予測係数を求め、予測係数の係数符号量または推定符号量と、予測残差の残差符号量または推定符号量と、の合計が最小となる予測次数を最適予測次数と決定する第2線形予測分析手段、とを含むことを特徴とする最適予測次数決定装置。
  12. コンピュータを請求項9,10又は11記載の最適予測次数決定装置として機能させるためのプログラム。
  13. コンピュータを請求項9、10又は11記載の最適予測次数決定装置として機能させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体。
JP2007187682A 2007-07-18 2007-07-18 線形予測符号化の予測次数決定方法及びそれを使った予測係数決定方法及び装置、プログラム、その記録媒体 Active JP4838773B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007187682A JP4838773B2 (ja) 2007-07-18 2007-07-18 線形予測符号化の予測次数決定方法及びそれを使った予測係数決定方法及び装置、プログラム、その記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007187682A JP4838773B2 (ja) 2007-07-18 2007-07-18 線形予測符号化の予測次数決定方法及びそれを使った予測係数決定方法及び装置、プログラム、その記録媒体

Publications (2)

Publication Number Publication Date
JP2009025496A JP2009025496A (ja) 2009-02-05
JP4838773B2 true JP4838773B2 (ja) 2011-12-14

Family

ID=40397363

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007187682A Active JP4838773B2 (ja) 2007-07-18 2007-07-18 線形予測符号化の予測次数決定方法及びそれを使った予測係数決定方法及び装置、プログラム、その記録媒体

Country Status (1)

Country Link
JP (1) JP4838773B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010067800A1 (ja) * 2008-12-09 2010-06-17 日本電信電話株式会社 符号化方法、復号方法、それらの装置、プログラム及び記録媒体
CN102282770B (zh) * 2009-01-23 2014-04-16 日本电信电话株式会社 一种参数选择方法、参数选择装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2560785B2 (ja) * 1988-05-31 1996-12-04 沖電気工業株式会社 自己回帰モデル自動次数決定方法
JP2625998B2 (ja) * 1988-12-09 1997-07-02 沖電気工業株式会社 特徴抽出方式
JP2000020099A (ja) * 1998-06-26 2000-01-21 Oki Electric Ind Co Ltd 線形予測分析器,コード励振線形予測符号器及びコード励振線形予測復号器
JP4634969B2 (ja) * 2006-05-29 2011-02-16 日本電信電話株式会社 線形予測モデル次数決定装置、線形予測モデル次数決定方法、そのプログラムおよび記録媒体

Also Published As

Publication number Publication date
JP2009025496A (ja) 2009-02-05

Similar Documents

Publication Publication Date Title
JP5975243B2 (ja) 符号化装置および方法、並びにプログラム
JP5413839B2 (ja) 符号化装置および復号装置
US20090204397A1 (en) Linear predictive coding of an audio signal
JP5340261B2 (ja) ステレオ信号符号化装置、ステレオ信号復号装置およびこれらの方法
Ozerov et al. Coding-based informed source separation: Nonnegative tensor factorization approach
JP4838774B2 (ja) マルチチャネル線形予測符号化の予測係数決定方法及び装置、プログラム、記録媒体
JPH09152896A (ja) 声道予測係数符号化・復号化回路、声道予測係数符号化回路、声道予測係数復号化回路、音声符号化装置及び音声復号化装置
JP4838773B2 (ja) 線形予測符号化の予測次数決定方法及びそれを使った予測係数決定方法及び装置、プログラム、その記録媒体
JP3444131B2 (ja) 音声符号化及び復号装置
JP2003140692A (ja) 符号化装置及び復号化装置
CN107945813B (zh) 解码方法、解码装置、和计算机可读取的记录介质
JP2008519308A5 (ja)
EP3610481B1 (en) Audio coding
Muin et al. A review of lossless audio compression standards and algorithms
JP4963973B2 (ja) マルチチャネル信号符号化方法、それを使った符号化装置、その方法によるプログラムとその記録媒体
JP4914245B2 (ja) マルチチャネル信号符号化方法、それを使った符号化装置、その方法によるプログラムとその記録媒体
JP3348759B2 (ja) 変換符号化方法および変換復号化方法
JP5799824B2 (ja) オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム
JP4848049B2 (ja) 符号化方法、復号方法、それらの装置、プログラム及び記録媒体
JP2014160212A (ja) オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化プログラム
JP5166618B2 (ja) マルチチャネル信号符号化方法、それを使った符号化装置、その方法によるプログラムとその記録媒体
JPH05289700A (ja) 音声符号化装置
KR101536855B1 (ko) 레지듀얼 코딩을 이용하는 인코딩 장치 및 방법
Biswas et al. Quantization of Laguerre-Based Stereo Linear Predictors

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090729

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101109

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101208

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110802

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20110810

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110830

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110920

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110930

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141007

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4838773

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350