JP2000507754A

JP2000507754A - 組込み形コーディングを有するテーブルベースの圧縮

Info

Publication number: JP2000507754A
Application number: JP9534591A
Authority: JP
Inventors: シャダー，ナビン
Original assignee: ブイエックストリーム，インコーポレイティド
Priority date: 1996-03-28
Filing date: 1997-03-26
Publication date: 2000-06-20
Also published as: US6360019B1; EP0890222A1; WO1997036376A1; US6215910B1; US6154572A; US7162091B2; US20030185452A1; US6205256B1; US6349152B1; AU2547297A

Abstract

(57)【要約】画像圧縮システムは、ベクトライザと組込み形コードを出力する階層形ベクトル量子化テーブルとを有する。ベクトライザは画像を画像画素のそれぞれのブロックを表わす画像ベクトルに変換する。テーブルは計算のない変換と画像ベクトルの圧縮を提供する。テーブル設計は、各段に対してコードブック設計と挿入手順とに分割できる。予備的な段に対するコードブック設計は、知覚により重み付けられた歪み手段を使う分裂された一般化ロイドアルゴリズム（ＬＢＧ／ＧＬＡ）を使う。最終段に対するコードブックの設計は、エントロピー制約の歪み手段で、どんどん成長されその後エントロピー剪定されたツリー構造のＧＬＡの変形を使う。全段に対するテーブル記入は、入力をコードブックベクトルに割り振るための重み付けされていない近似手法を使う。変換および圧縮は、それらは計算ツリーであるので速い。テーブルの階層形，多段といった特徴は、低メモリ要件で動作できるようにする。組込み形出力は、手ごろなスケーラビリティを異成分からなるネットワークの共同ビデオアプリケーションに適するようにする。

Description

【発明の詳細な説明】組込み形コーディングを有するテーブルベースの圧縮発明の背景本発明は、データ処理、特にデータ圧縮に関し、例えば、静止およびビデオ画像，音声，および音楽に適用されるものようなものである。本発明の主な目的は、安価な多目的コンピュータの異成分からなるネットワーク(heterogeneous net work)を通じて共同ビデオアプリケーション(collaborative video application) を広めることにある。コンピュータは人間の対話(interaction)の伝達手段になりつつあり、その対話がより迅速にかつ完全になるように要求が高まりつつある。ローカルネットワーク上およびインターネット上で優位を占めるテキストベースの電子メールおよびデータベースサービスにおいて、例えばテレビ会議や双方向ビデオのような共同ビデオアプリケーションのようなデータ集中サービスを提供する努力がいる。ほとんどの場合、そのようなアプリケーションに対する生データ要件は入手できる帯域幅をはるかに超えているので、データ圧縮は要求を満たすために必要であるといえる。有効性は画像圧縮スキームの目標である。音声は、対話に即時性を提供するために共同アプリケーションによって課される要件である。スケーラビリティ（scalability）は、ネットワークおよびコンピュータの階層によって課される要件である。有効性は、与えられた圧縮の程度に対して結果的に生じる歪み量に関して測定され得る。歪みは、画像にわたって平均された対応する画素の間の差の二乗、すなわち平均二乗エラー（少ないほど良い）に関して表わすことができる。平均二乗エラーは、1)例えば知覚（perceptual ）による感度のバリエーションを考慮するために重み付けられ、あるいは、２）重み付けされない。圧縮の程度は、圧縮比あるいはビットレートとして測定される。圧縮比（多いほど良い）は、圧縮されたコード（コードが可変長である場合、非常に多数の入力値にわたり平均される）での値の表現におけるビットの数によって分割される入力値のビット数である。ビットレートは、入力値を表示するのに必要な圧縮されたコードのビット数である。圧縮の有効性はビットレートの関数による歪みのプロットで特徴付けられる。理想的には、歪みはゼロであり、かつこれを達成する圧縮技術の損失はないであろう。しかし、損失のない圧縮技術は約２の圧縮比に制限される傾向があるが、２０〜５００までの圧縮比が共同ビデオアプリケーションに対して所望される。損失のある圧縮技術は常にいくらかの歪みが生じる。しかし、歪みは、ごくわずかであっても受け入れることができ、一方で圧縮がより一層達成される。共同ビデオは、アナログ電話回線、デジタル電話回線、およいローカルエリアネットワークを含む異成分からなるネットワークを介して多目的コンピュータ間での通信に対して所望される。エンコードおよびデコードは、しばしば集中的に計算され、したがってデータストリームにおける待ち時間(latencies)あるいはボトルネックを引き起こし得る。しばしば専用のハードウェアがエンコードおよびデコードを促進するために必要である。しかし、専用のハードウェアを必要とすることによって、共同ビデオに対するマーケットが大きく減少する。共同ビデオに対しては、まずソフトウェアベースの圧縮が非常に所望されるであろう。多目的コンピュータの異成分からなるネットワークは、チャンネル容量およびデコード容量の広い範囲を提供する。あるやり方では、画像データを再三圧縮し、異なるチャンネルおよびコンピュータに対して異なる度合いで圧縮するであろう。しかし、これはエンコード側に負担となり、受信側での違う計算力に対しては不自由である。より良い解決策は、より多くの歪みを犠牲にしてさらに圧縮することが容易にスケーラブルである低圧縮／低歪みコードへ画像データを圧縮することである。最新の圧縮スキームが、国際的なMotion Picture Experts Groupによる規格として公表されている。現在の規格はＭＰＥＧ−１およびＭＰＥＧ−２である。この規格は、オフラインでエンコードされたビデオの再生を伴うアプリケーションによく適している。例えば、これらはＣＤ−ＲＯＭおよびＤＶＤディスクの再生によく適している。しかし、圧縮の効力には非最適であり、エンコードに必要なものは高価であり、スケーラビリティは限定されすぎている。これらの限定は以下の説明でよりよく理解できるであろう。ほとんどの圧縮スキームは、画素(picture elements，pixels)の２次元アレイとして表わされるデジタル画像上で動作し、その各画素はそれぞれに割り当てられた（単色あるいはグレースケールの画像におけるように）１つ，あるいは（カラー画像におけるように）複数の値を有する。通例、カラー画像は、圧縮の目的に対して３つの独立した単色画像の重ね合せとして扱われる。ビデオ圧縮に実際に必要な損失のない圧縮技術は、単色（グレースケールあるいはカラーの要素）画像に適用される量子化を伴う。量子化では、一般に多数対１の写像によって高精度画像記述が低精度画像記述へ変換される。量子化技術をスカラー量子化（ＳＱ）技術およびベクトル量子化技術（ＶＱ）技術へ分割することができる。スカラーが１次元ベクトルであるとみなすことができるとき、２つの量子化技術の間に重大な品質的な区別が存在する。ベクトル量子化は、ブロックにおいて画像を処理するために使うことができ、ｎ次元空間におけるベクトルとして表わされる。単色の写真画像において、隣接した画素は輝度が近い傾向がある。ベクトル量子化は、隣接した画素の輝度が全く違うようなｎ次元空間の領域に対してよりも、隣接した画素は輝度が近いようなｎ次元空間の領域に対してよりのほうが多くの各ベクトルが存在すると仮定することによってこの事実を利用することができる。類似のスカラー量子化においては、各画素は独立に圧縮されるであろう。隣接した画素間の相関関数は利用しない。スカラー量子化技術は、相関関数を利用するために付加的な計算を使って修正され得るが、類似の修正がベクトル量子化に対して適用される。総合的に見れば、ベクトル量子化はスカラー量子化よりもより効果的な圧縮を提供する。ベクトル量子化とスカラー量子化との他の相違点は、どのように各値あるいはベクトルが圧縮されたデータに表わされるかという点である。スカラー量子化においては、圧縮されたデータは各値の減少させられた精度の表記を有しても良い。そのような表記は、各値から１つあるいはそれより多い最下位ビットを取り除くことによって簡単な調整で容易にすることができる。より精巧なスカラー量子化技術では、各値はインデックスによって表わされる。しかし、スケーリングは、各値がメートルの次元における与えられたオーダーを有するということをまだ利用することができる。ベクトル量子化技術では、各ベクトルはｎ次元の空間に分布される。ｎ＞１では、各ベクトルに対して自然のオーダーは存在しない。したがって、任意のインデックスが効果的に割り振られる。圧縮をスケーラブルにするためにインデックスを巧みに操作するような簡単かつ効果的な方法は存在しない。ベクトル量子化とスカラー量子化との最後の相違点は、量的であるというよりは質的であるという点である。量子化に必要な計算は、計算に伴う画素の数を（線形的によりはむしろ）劇的に増やす。スカラー量子化では、１画素が同時に処理される。ベクトル量子化では、複数の画素が一度に処理される。その場合、一般には４×４および８×８のブロックサイズで、一度に処理される画素の数はそれぞれ１６および６４になる。最小の歪みを得るために、「全探索（full-searc h）」ベクトル量子化は、それぞれ各ベクトルから画像ベクトルのｎ次元空間において距離を計算する。したがって、ベクトル量子化はスカラー量子化よりもずっと遅くなり、したがってオフライン圧縮アプリケーションに対して制限される傾向がある。より高い有効性のために、かなりの努力が、必要とされる計算のうちいくつかを取り除くことによりベクトル量子化を促進することに向けられている。少ない歪みの増加に目をつむって入力ブロックごとに必要な計算の数を減少させる「全探索」ＶＱに代わるものが構成される。構成されたＶＱ技術は、明らかに不必要な比較を除外するように指図した方法で比較を実行する。そのような技術の全ては、最も近い比較が見つからないであろうというリスクをいくらか伴う。しかし、そのリスクは大きくはなく、一般的な結論としては、最も近い第１のポイントが選択されないとき最も近い第２のポイントが選択される。結局のところ歪みは全探索ＶＱのときよりも大きいものになるにもかかわらず、各次元で別個に実行されるスカラーＶＱよりも一般的には良好である。「ツリー構造(tree-structured)」ＶＱでは、比較はペアで実行される。例えば、第１の２つの測定は、ベクトル空間の上側および下側半分における対称な位置でのコードブックポイントを伴ってもよい。画像入力が上側のコードブックポイントにより近い場合、空間の下側半分におけるコードブックポイントの比較はもはや実行されない。ツリー構造ＶＱは、コードブックが一定の対称性を有するとき最もよく動作する。しかし、このような対称性を必要とすることによってコードブックの設計の自由度を減少させてしまい、結果として生じるコードブックは歪みを最小にするのに最適ではなくなる。さらに、減少するにもかかわらず、ツリー構造ＶＱに必要な計算は、共同ビデオアプリケーションに対して過大になり得る。テーブルベースのベクトル量子化（ＴＢＶＱ）において、コードブックベクトルに対する可能性のある全てのブロックの割り振りは、予め計算されてルックアップテーブル(lookup table)に表わされる。画像圧縮の間は計算は必要ではない。しかし、画素の４×４ブロックの場合、各画素を特徴付けるために割り当てられた８ビットで、テーブルアドレスの数は２５６¹⁶になり、それは明らかに非実用的である。階層形テーブルベースベクトル量子化（ＨＴＢＶＱ）は、ベクトル量子化テーブルを段(stage)に分ける。これは効果的にメモリの必要性を減少させるが、付加的な歪みを犠牲にする。さらに、画像がオリジナルに表現される画素空間は、ベクトル量子化にとってあまり最良ではないことがよく知られている。ベクトル量子化は、次元が知覚による重み(significance)において異なるとき最も効果的である。しかし、画素空間においては、次元の知覚による重み（ブロックにおいて異なる画素位置を単に表わす）は変化しない。したがって、ベクトル量子化は、一般的にウェーブレット変換(wavelet transform)のような変換より前である。それゆえ、計算が量子化の前の変換に必要である場合、ベクトル量子化の間、計算を除去する価値は減らされる。ウェーブレット変換をまとめてＨＴＢＶＱテーブルにするということがいくらかなされても、その結果生じる有効性は満足ではないままである。ハードウェアアクセラレータがデータ圧縮システムのエンコーディングレートを改善することに使われることは理解される。しかしこの解決策は高価である。より重要なのは、歪みの観点から厄介であるという点である。インターネットで、画像およびウェブページは多くの異なるフォーマットによって表わされ、それぞれはそれ自身のビューアあるいは「ブラウサ゛」が必要である。最低限共通の性質の鑑賞技術に頼ることなしに最大限可能な観客に到達するために、画像提供者は、予期される消費者へ鑑賞アプリケーションをダウンロードできる。あきらかに、このダウンロード分配システムは、ハードウェアベースのエンコーダに対しては適用し難い。共同ビデオに対するエンコーダがダウンロード可能なものである場合、それらはソフトウェア実現でのリアルタイム動作に対して十分に早くなければならない。アプリケーションが多目的コンピュータの異成分からなるネットワーク上で共同ビデオを伴うようなところでは、有効性，スピード，およびスケーラビリティのより最適な組み合わせを提供するダウンロード可能な圧縮スキームがまだ必要である。発明の概要本発明は、ブロック変換を実現しかつ可変レートの組込み形コードを出力する階層形テーブルを使った、データ圧縮を提供することである。最適な利益を得るためまとめられる本発明の種々の態様が存在するが、これらは別個に使われてもよい。本発明の反直観的な態様は、圧縮テーブルにおける構造ベクトル量子化(struc tured vector quantization)に対して使われるタイプのコードブックの結合である。構造ベクトル量子化は、全探索ベクトル量子化に関する歪みが若干増加することを許容して、圧縮に必要な計算を減らすように設計させる。しかし、全計算が予め計算されるので、このトレードオフはテーブルという面で不十分なものである。この場合は、ツリー構造ベクトル量子化に対して使われるコードブック設計手順が使われるが、これは計算を減らさず、組込み形コードに容易に写像できるコードブックを提供する。組込み形コードでは、ビットは重みのために配置される。第１のコードブックベクトルに対するマルチビットのインデックスの最下位ビットが落ちるとき、第１のコードブックベクトルの近くのコードブックベクトルのインデックスが結果として生じる。それゆえ、組込み形コードは可変レートシステムを提供するために容易に調整される。組込み形コードは、エントロピーを減少させるために容易に可変長にすることができ、圧縮の有効性における正味のゲインに対してビットレートを減少させることができる。したがって、構造ベクトル量子化コードブックを使用することによって生じる有効性の損失は、可変長コードを使用することによって生じる圧縮の有効性におけるゲインによる、少なくとも部分的なオフセットである。本発明の別の態様は、テーブルにおけるブロック変換の実現である。ブロック変換は、情報が重みによって分けられるようにデータをあらわすことができる。これは、圧縮の明白な効力で正味のゲインについて重要ではないデータに対してより多くの圧縮を適応することを実現可能にする。画像あるいは知覚のデータ圧縮の場合、データが変換される先の空間が知覚的に線形ではないならば、コードブック設計の間、知覚的に重み付けされた近似手法を使うことができる。本発明によれば、重み付けされないあるいは知覚的に重み付けされた近似手法は、歪みを最小にするためのテーブル挿入手順(table fil l-in procedure)の間に使われるべきである。本発明のさらなる態様は、コードブック設計において、知覚的に重み付けされたあるいは重み付けされない近似手法のほかに考えられるものの結合である。例えば、エントロピーの制約(constraints)はビットレートを高くするためのコードブック設計に課せられ得る。決定ツリー(decision tree)が(どんどん:greedy) 成長するときにおいて、接続エントロピーおよび歪み手法は、成長させるあるいは剪定（prune）させるべきノードを選択するために使われ得る。接続手法がノード毎の基準に適用される場合、利用可能な各ビットレートにおいて高い圧縮有効性を保ちながら事実上連続的であるスケーラビリティが提供され得る。本発明の最終の態様では、階層形テーブルによって与えられるより低いメモリ要件を利用する。階層形テーブルは、構造，制約，および変換をどのように統合するかという問題を提起する。ブロック変換の場合、変換は、テーブルの全ての段におけるコードブック設計で使われる。しかし、可変長コードを提供することに使われる構造および制約の場合、最後の段のテーブルだけの設計について最も制限する。利点を得るために本発明の全態様を不自然に一緒にする必要はない。しかし、可変レート組込み形コードを有するテーブルベースデータ圧縮システムを生成するために結合されるとき、その結果は共同ビデオアプリケーションに最適に当てはまる。エンコードおよびコード両方の側におけるスケーラビリティは組込み形コードによって提供される。スピードは、全てが予め計算されているようなテーブルを使って提供される。階層形テーブルを使うことによって、メモリ要件は道理にかなう。圧縮の有効性は、統合されたブロック変換およびコードブック設計に関するエントロピーの検討によって高められる。それゆえ、圧縮はソフトウェアのみのアプリケーションにあてはまる。それゆえ、圧縮スキームを、共同ビデオアプリケーションを広く利用可能にするためにネットワークを通じて分配することができる。本発明のこれらおよび他の形態および利点は添付の図面を参照して以下の説明から明らかになる。図面の簡単な説明図１は、本発明による画像圧縮の概略的な例示である。図２は、本発明による図１の圧縮システムを設計するためのフローチャートである。図３は、図１のシステムのための組込み式コードのための決定ツリーの１概略的な例示である。図４は、図１のシステムの性能を示すグラフである。図５〜８は本発明の別の実施例の性能を示すグラフである。好適な実施例の説明本発明によると、画像圧縮システムA1は、図１に示されるように、エンコーダ ENCと通信ラインLAN，POTS，IDSNとデコーダDECとを備える。エンコーダENCは、通信ラインを介する分配に対してオリジナル画像を圧縮するために設計されている。通信ラインPOTS，IDSN，およびLANは、帯域幅において大きく異なる。「Plain Old Telephone Service（従来の普通の電話サービス）」ラインPOTSは、対応するモデムを有し、２８．８キロボー（毎秒あたりの記号）の公称のレートでデータを伝達する。「Integrated Data Service Network（統合データサービスネットワーク）」ラインIDSNは、非常に速いオーダーでデータを伝達する。「Local Area Network（ローカルエリアネットワーク）」は、毎秒約１０メガビットでデータを伝達する。受信およびデコードしている多くのコンピュータは、各ラインに接続されるが、１つだけのコンピュータが図１ではデコーダDECで表わされている。このコンピュータは、エンコーダENCからの送信を解凍し、オリジナル画像に忠実な再生画像を生成する。図１に示されるように、エンコーダENCはベクトライザ(vectorizer)VECおよび階層形ルックアップテーブル(hierarchical lookuptable）HLTを備える。ベクトライザVECはデジタル画像を一連の画像ベクトルIiへ変換する。階層形ルックアップテーブルHLTは一連のベクトルIiを３つの一連のインデックスZAi，ZBi，およびZCiへ変換する。インデックスZAiはラインLANを通じた転送に対する高度の平均精度の可変長組込み形コードであり、インデックスZBiはラインIDSNを通じた転送に対する中程度の平均精度の可変長組込み形コードであり、インデックス ZCiはラインPOTSを通じた転送に対する低程度の平均精度の可変長組込み形コードである。変化する精度は、ラインの変化する帯域幅に順応する。ベクトライザVECは、４×４画素のブロックBiに画像を効果的に分割する。オリジナル画像が選ばれたブロックサイズによって平等に分割できない場合、画像分析の公知の方法で分割するために画像の側部に付加的な画素が加えられ得る。各ブロックは１６次元のベクトルIi＝(Vij)として表わされ、ここでjは、ブロックBiにおける画素の図１に示されたオーダーにおいて１〜１６（1-G、セプタデシマル表記）の範囲の次元インデックスである。図１には１つのブロックだけが例示されているので、「i」インデックスは、図１および以下においてベクトル値から省く。各ベクトル要素Vjは、適切な精度、例えば８ビットで表わされ、各画素に関して単色（カラーあるいはグレースケール）の輝度を表わす。図１に示すように、ベクトライザVECは、隣接して番号付けられている奇偶のペア（例えば、V1，V2）において階層形ルックアップテーブル HLTにベクトル要素Vjを表示する。階層形ルックアップテーブルHLTは４つの段S1，S2，S3，およびS4を有する。段S1，S2，およびS3は、階層形ルックアップテーブルHLTの予備セクション(prel iminary section)PREを集合的に構成し、一方で第４の段S4は最終セクションを構成する。各段S1，S2,S3，およびS4はそれぞれ段テーブルT1，T2，T3，およびT 4を有する。図１において、予備セクションの段S1，S2，およびS3のテーブルは、画像ベクトルごとに使われる回数を表わすために、多数の回数で表わされる。例えば、テーブルT1は８つのペアの画像ベクトル要素Vjを受信し、それぞれ８つの第１段インデックスWjを出力する。処理電力が入手可能である場合、入力値のペアを並列に処理できるように、段は同じデザインの別個のテーブルを有する。階層形ルックアップテーブルの目的は、各画像ベクトルを組込み形インデックスZA，ZB，およびZCのそれぞれに多数対１に写像することである。別個の画像ベクトルの全体数は別個の値であることを注意すると、ベクトル値Vjはこの場合２⁸ ＝２５６で、次元の数はこの場合１６であると仮定できる。２５６¹⁶のエントリでテーブルを実現することは非実用的である。予備セクションPREの目的は、知覚的に関連のある情報の最小の損失で圧縮されなければならない、可能性のあるベクトルの数を減らすことである。最終段のテーブルT4の目的は、減少させられたベクトルの数を組込み形インデックスの各組に多数対１に写像することである。テーブルT2およびT3はテーブルT4と同じサイズであり、一方でテーブルT1は２¹⁶のエントリでさらに小さい。したがって、階層形ルックアップテーブルHLT の全段に対するアドレスの数全体は４００万よりは小さく、これは現実的なテーブルエントリの数であるといえる。極端であるようなコンピュータに対しては、全テーブルは２¹⁶のエントリに制限することができ、テーブルエントリの全体数は約１００万である。各予備段のテーブルT1，T2およびT3は１つの入力と１つの出力とを有しており、一方で最終段T4は２つの入力と３つの出力とを有している。画像ベクトル要素 Vjのペアは、第１段のテーブルT1に対して、入力としての役割を果たす。ベクトル要素は、画像ブロックのそれぞれの画素に関して値を示すことができる。しかし、ベクトル要素Vjが画像ブロックでの変換の後に得られる値のアレイを表わす場合もまた本発明は適用される。例えば、ベクトル要素は画像ブロックに適用される離散コサイン変換の係数であり得る。一方で、階層形ルックアップテーブルにおける計算される前の変換を実現するほうが、分類されている各画像の各ブロックに対する変換を計算するより、計算するのにさらに効率的である。したがって、この場合、各入力のベクトルは画素領域にあり、階層テーブルHLTは離散コサイン変換を実現する。言い換えれば、各ベクトル値Vjは、関連する画像ブロックのそれぞれの画素に対して単色輝度値を表わすものとして取り扱われ、一方でインデックスWj，Xj，Yj,ZA，ZB，およびZCは空間周波数領域でベクトルを表わす。ベクトル値(Vj,V(j+1))の各ペアは、１６ビット全体で画素の２×１（列×行）ブロックを表わす。例えば(V1,V2)は、図１のテーブルT1のいちばん左のレプリカを特に明るくする２×１ブロックを表わす。テーブルT1は、ベクトル要素の値のペアを８ビットの第１段のインデックスWjに多数対１に写像させる。この場合、ｊの範囲は１〜８である。各８ビットWjはまた２×１画素ブロックを表わす。しかし精度は１６ビットから８ビットに減少する。各画像ベクトルに対して、１６個のベクトル値Vjおよび８個の第１段インデックスWjが存在する。８個の第１段インデックスWjは、隣接する奇偶の第２段入力の４個のペアに結合される。各ペア(Wj,W(j+1))は、２×２ブロックを１６ビットの精度で表わし、その２×２ブロックは、個々の第１段インデックスWjによって表わされる２個の２×１ブロックによって構成される。例えば(W1,W2)は、図１のテーブルT2のいちばん左のレプリカを特に明るくする２×２ブロックを表わす。第２段のテーブルT2は、第１段のインデックスの各第２段入力のペアを第２の段インデックス Xjに多数対１に写像させる。各画像入力ベクトルに対して、８個の第１段インデックスは４個の第２段インデックスX1,X2，X3，およびX4を生成する。第２段インデックスXjのそれぞれは、８ビットの精度で２×２画像ブロックを表わす。４個の第２段インデックスXjは、第３段入力の２個のペア(X1,X2)および(X3,X 4)に結合され、各々は、４×２画像ブロックを１６ビットの精度で表わされる。例えば、(X1,X2)は、テーブルT3の左側のレプリカを特に明るくする上方の半分のブロックを表わし、一方で、(X3,X4)は、図１のテーブルT3の右側のレプリカを特に明るくする下方の半分のブロックを表わす。第３段のテーブルT3は、各第３段入力のペアを第３段インデックスY1およびY2に多数対１に写像させる。これら２つのインデックスY1およびY2は、１つの画像ベクトルに応じた予備セクションPREの出力である。２つの第３段のインデックスは、16ビットの程度で画像ブロック全体を表現する第４段入力のペア(Y1,Y2)を形成するためにペアにされる。第４段のテーブルT 4は、第４段入力のペアを組込み形インデックスZA，ZB，およびZCのそれぞれに多数対１に写像させる。画像全体に対して、多くの画像ベクトルIiが存在し、その各々は３個の各出力インデックスZAi，ZBi，およびZCiを生成する。入力および出力の間の明確な関係は図１の他に以下の表１に示される。デコーダDECは、LANラインを介してエンコーダENCから受信した画像を解凍(de compressing)するように設計される。デコーダDECは、コード剪定器(code prune r)51とデコードテーブル52と画像アセンブラ53とを有する。コード剪定器51は、段S4からの複数の出力が送信端で行う機能を受信端でおこない、忠実度(fidelit y)とビットレートとの間のトレードオフを許容する。コード剪定器51はインデックスZAを剪定(prune)するための分類を具体化し、インデックスZBおよびZCを得る。代わりに、コード剪定器51はインデックスZAを切り取らないで通過させることもできる。さらに以下に説明するように、コードを剪定することによって、どんどん(greedy)成長するツリーの、より早期のバージョンに効果的に戻ることができる。一般に、コード剪定器が生成した剪定されたコードは、エンコーダによって生成されたものと一致する必要はない。例えば、コード剪定器はより大きな代わりのセットを提供することができる。固定長の圧縮コードを可変長コードの代わりに使う場合、剪定の機能は、単にコードからの最下位ビットの固定数を落とすことができる。この切捨ては階層形テーブルの出力のエンコーダおよび／またはデコーダにおいて起こり得る。より洗練された方法ではエントロピー一定に基づいて選択的に剪定される。デコーダテーブル52は、コードを再生ベクトルに変換するルックアップテーブルである。コードインデックスが空間周波数領域においてコードブックベクトル (codebook vectors)を表わすので、デコードテーブル52は、再生ベクトルが画素領域にあるように計算前の逆離散コサイン変換を実現する。画像アセンブラ53は、再生ベクトルをブロックに変換しブロックから再生された画像をアセンブルする。好適にはデコーダDECは受信コンピュータにおいてソフトウェアで実現される。ソフトウェアによって忠実度対ビットレートのトレードオフが選択され得る。そしてソフトウェアは選択されたコードの精度によりコード剪定器51をセットする。ソフトウェアはコード剪定器51の各セッティングに対して別個のテーブルを有する。コード剪定器51の最新のセッティングに対応するテーブルでは、高速のメモリ(RAM)にロードされる。したがって、ルックアップテーブル52は剪定が作動されるときよりも小さい。したがって、剪定する機能によって、1)受信コンピュータの容量、あるいは2)デコードする機能に対するローカルメモリの割り当て、に整合するように高速のメモリが保護される。図２のフローチャートで示すように、テーブルの設計方法M1は、階層形ルックアップテーブルHLTの各段に対して、段が第１段S1,中間の段S2およびS3，あるいは最終段のどれであるかによっていくつかの変形を持って実行される。各段に対して、方法M1はコードブック設計手順10とテーブル挿入(fill-in)手順20とを有する。各段に対して、挿入手順20はそれぞれのコードブック設計手順10によって先行されなければならない。しかし、各段間に年代による順序(chronological o rder)が存在するわけではない。例えば、テーブルT3はテーブルT2のためのコードブックが設計される前に挿入され得る。第１の段に対して、コードブック設計手順10はステップ11でトレーニング画像 (training image)の選択を開始する。トレーニング画像は、システムA1によって圧縮される画像のタイプを表わすために選択される。システムA1が多目的の画像圧縮に使われる場合、トレーニング画像の選択は非常に多様であり得る。システムA1が特定のタイプの画像、例えば、線画あるいは写真に使われる場合、そのときはトレーニング画像はそのタイプの画像を選択し得る。それほど多様ではないトレーニング画像のセットでは、トレーニングセットによく整合した画像に対しては画像再生をより忠実に行えるが、トレーニングセットにあまり整合していない画像に対しては画像再生をより忠実には行えない。トレーニング画像は２×１のブロックに分割され、そのブロックは、ステップ 12で空間画素領域における２次元ベクトル(Vj,V(J+1)）によって表わされる。これらベクトルのそれぞれに対して、Vjは２×１のブロックの左側の画素の輝度を特徴付け、V(J+1)は２×１のブロックの右側の画素の輝度を特徴付ける。本発明の代わりの実施例では、コードブック設計およびテーブル挿入は空間画素領域において行われる。これら画素領域に対しては、ステップ13，23，および 25は、段のいずれに対しても実行はされない。画素領域の問題は、ベクトルの項はインピーダンスが等しいということである。すなわち、右側の画素の輝度より左側の画素の輝度を好む理由もなければ逆もない。可能な限り分類に関連した情報を保持しながらテーブルT1がデータを減らすことに対して、より重要な情報がより重要ではない情報に対して独立に表現されるように情報を表現することは重要である。好適な第１段のテーブルT1の設計に対して、離散コサイン変換が、画素領域における２次元ベクトルを空間周波数領域における２次元ベクトルへ変換するためにステップ13で適用される。このベクトルの第１の値は、左側および右側の画素の平均輝度に対応し、一方で、このベクトルの第２の値は、左側の画素と右側の画素との間の輝度における差に対応する。感知する人の透視図から、空間周波数領域における画像の２×１のブロックを表現することによって、画像における情報を比較的重要な項（平均輝度）と比較的重要ではない項（輝度における差）とに分割する。平均輝度のみに基づいて再生された画像は、左側あるいは右側の画素のみに基づいて再生された画像よりも歪まずに表れるであろう。後者のどちらでも輝度の差のみに基づいて再生された画像よりも歪まずに表れるであろう画像を生成するであろう。与えられた平均の精度に対して、知覚された歪みは、より重要な次元をより多くのビットに、より重要ではない次元をより少ないビットに、割り当てることによって減少させることができるであろう。コードブックはステップ14で設計される。コードブックインデックスは好適には固定長であり、この場合１０ビットである。固定した精度を最大限利用することは、コードブックのベクトルの数である２の関連する電力を選択することによって達成される。この場合、テーブルT1に対するコードブックのベクトルの数は２１０＝１０２４になる。理想的には、ステップ１４は、２×１の入力ベクトルの予期される確率分布を有する画像に対して最小の歪みを生成する１０２４のセットを決定する。理想的なコードブックのベクトルを見つけるという問題は定式化できるにもかかわらず、数値による方法によって一般に解決することはできない。しかし、本質的に任意なセットの「シード(seed)」ベクトルから「良好(good)」なセットのコードブックのベクトルへ収束するような反復方法が存在する。この手順はあるいは、「クラスタ圧縮アルゴリズム」，「Linde-Buzo-Gray」アルゴリズム，および「一般化ロイドアルゴリズム(generalized Lloyd algorithm)」(GLA)として知られている。手順はシードベクトルのセットを開始する。トレーニング画像から生成された２×１の空間周波数ベクトルのトレーニングセットは、近似ベース(proximity b asis)上でシードベクトルに割り振られる。この割り振りはシードベクトルのそれぞれの周囲のトレーニングベクトルのクラスタを定義する。各クラスタに対する重み付けられた平均値ベクトルはそれぞれのシードベクトルに取って代わる。平均値ベクトルは、シードベクトルよりもより良好な歪み性能を提供する。第１の歪み値はこの第１の平均値ベクトルに対して決定される。さらなる改良は、近似ベース状で前もって決定された平均値ベクトルの周囲でトレーニングベクトルを再クラスタ化し、クラスタに対して新しい平均値ベクトルを見つけることによって達成される。この処理は、第１の歪み値よりも第２の歪み値を少なく生成する。第１の歪み値と第２の歪み値との差は第１の歪み縮小値(distortion reduction value)である。この処理は、連続した歪み値および歪み縮小値の達成を反復することができる。歪み値および歪み縮小値は次第に減少する。一般的に歪み縮小値はゼロにはならない。その代わりとして、歪み縮小値が所定のしきい値を下回るとき、すなわち歪み値をさらに改善しようにも計算の努力が値しないとき、反復をストップすることができる。ＧＬＡアルゴリズムの制約はすべてのシードベクトルはみなそれに割り振られた少なくとも１つのトレーニングベクトルを持たなければならないということである。この状態を満たすことを保証するために、Linde、Buzo，およびGrayはＧＬＡについての「分裂(slitting)」技術を発展させた。Y.Linde，A.Buzo，R.M.G rayの「Algorithm for vector quantization Design」,IEEE Transaction on Co mmunications,COM-28:84-95，January，1980,およびAn Introduction to Data C ompression by Khalid Sayood，Morgan Kaufmann Publishers，Inc．San Franci sco，Calfornia,1996，pp.222-228を参照のこと。分裂技術はトレーニングベクトルのセットに対する手段を判定することによって開始される。このことは、まるで反復のコードブックが１つのベクトルを有するねきであるかのように単一のＧＬＡ反復を単一の任意のシードベクトルを適用するということの結果と考えられ得る。平均値ベクトルは第２の「動揺(perturb ed)」ベクトルを生成することに動揺する。平均値および動揺ベクトルは、スリッティング技術の次の反復に対して２つのシードベクトルとしての役割を果たす。その動揺は、いくつかのトレーニングベクトルが２つのシードベクトルのそれぞれに割り振られるであろうことを保証する。歪み縮小値がしきい値を下回るまで、ＧＬＡは２つのシードベクトルを動作させ続ける。その結果の２つの平均値ベクトルのそれぞれは、スリッティング技術の次の反復に対して４個のシードベクトルを生成することに動揺する。所望した数、この場合１０２４のコードブックベクトルが得られるまでスリィッテング技術は反復される。再生画像が人間によって見られ知覚した外形(perceptual profile)が入手可能である場合、ステップ14で使われる歪みおよび近似手法を知覚的に重みつけることができる。例えば、低いほうの空間周波数項は高い方の空間周波数項よりも重みを与えることができる。さらに、これはスカラー量ではなくベクトルであるので、空間周波数の次元の間での反復効果を考慮することができる。変換の漁期機が知覚的に線形である場合，知覚した外形が入手可能ではない場合，あるいは画像が人間の視野に入るまで解凍されたデータが更なる数値処理が施されるべき場合、重み付けされていないを使うことができる。ステップ14で設計されたコードブックは、空間周波数領域において１０２４個の２×１のコードブックベクトルのセットを備える。ステップ15では任意に割り振られた各10ビットインデックスが存在する。これは段S1に対する方法M1のコードブック設計手順10を完了させる。段S1に対する挿入手順20は、内容が判定されることを許すために別々の各アドレスを生成するステップ21を開始する。好適な実施例では、値がペアにおけるテーブルの各々に入力される。代わりの実施例では、いくつかのテーブルあるいは全テーブルより多くの入力を有することができる。各テーブルに対して、アドレスの数は、各入力で受信され得る可能性のある別々の値の数の積(product)である。典型的には、可能性のある別々の値の数は２つの電力である。テーブルT1への入力は、８ビットの入力VJおよび８ビットの入力V(J+1)を受信する。したがってテーブルT1に対するアドレスの数は２⁸＊２⁸＝２¹⁶＝６５，５３６である。ステップ21に続くステップはこのアドレスのそれぞれにおいて２⁸＝２５６テーブルT1インデックスWjの１つを入力するように設計される。各入力Vjは画像の各画素に割り振られた輝度に対応するスカラー値である。これら入力は、空間画素領域において２次元ベクトル(VJ,V(J+1))を定義するために、ステップ24でペアに連鎖(concatenate)される。（第１段のテーブルT1の設計のためにステップ22および23は回避される。）意味のある近似測定（meaningful prozimity measurement)のために、入力ベクトルはコードブックベクトルと同じ領域、すなわち2次元の空間周波数領域に表わされなければならない。それに応じて、ステップ25でＤＣＴはテーブルT1コードブックの空間周波数領域において２次元ベクトルを生成するために適用される。入力ベクトルに最も近いテーブルT1コードブックベクトルがステップ26で判定される。その近似測定は、重み付けられていない平均二乗値エラーである。知覚的な重み付け手法よりむしろテーブルを造っている間、近似手法として、重み付けられていない平均二乗値エラーのように目的のなる手法を使うことによりより良い性能が得られる。一方で、重み付けられていない近似測定はこのステップに対しては一般に必要ではない。しかし、好適にはステップ26におけるテーブル挿入の間に使う手法は、コードブック設計に対してステップ14が使われる手法よりも平均でおもみつけられない。テーブル16で最も近いコードブックベクトルに割り当てられたインデックスWj は、ステップ27で、入力のペア(Vj,V(j+1))に対応するアドレスにおいて内容として入れられる。システムT1が動作している間、このインデックスが入力値の当該ペアに応じてテーブルT1によって出力される。一度インデックスWjがテーブルT1の６５，５３６個の全アドレスに割り振られると、テーブルT1の方法M1の設計は完了する。第２段のテーブルT2に対して、コードブックの設計は、ちょうど第１段のテーブルT1と同じようにトレーニング画像を選択するステップ11で始まる。テーブル T1コードブックの設計に使われるトレーニング画像を第２段コードブックの設計に対してもまた使うことができる。ステップ12では、トレーニング画像は２×２の画素ブロックに分割される。２×２の画素ブロックは、画素領域において４次元ベクトル空間に画像ベクトルとして表わされる。一方で４個のベクトル値の各々は、２×２の画素ブロックの４個の画素のうちのそれぞれ１つに関係する輝度を特徴つける。ステップ13では、４次元ベクトルは空間周波数領域にＤＣＴを使って変換される。ちょうど４次元画素領域ベクトルを画素の２×２アレイとして表わすことができるように、４次元の空間周波数領域ベクトルを空間周波数関数の２×２アレイとして表わすことができる空間周波数領域の４個の値はそれぞれ次を表わす。すなわち、F00)２×２画素ブロックに対する平均輝度，F01)ブロックの左半分と右半分との輝度の差，F10) ブロックの上半分と下半分との輝度の差，F11)斜めの輝度の差である。逆ＤＣＴを空間周波数領域ベクトルに適用することによって空間画素領域を取り戻すことができるという点で、ＤＣＴ変換は損失が少ない（小さな丸め誤差を除く）。４次元周波数領域ベクトルは、ＬＢＧ／ＧＬＡアルゴリズムによる第２段のコードブック設計に対してトレーニングシーケンスとしての役割を果たす。近似および歪み手法は、テーブルT1に対するコードブックの設計に使われる手法と同じであってもよい。違いは、テーブルT2に対して、手法は２次元空間の代わりに４次元空間で実行されるという点である。８ビットインデックスXjがステップ15でコードブックベクトルに割り振られ、方法M1のコードブック設計手順10が完了する。テーブルT2に対する挿入手順20は、テーブルT2のアドレスの各々についての内容としてインデックスXjをいれることを伴う。図１に示されるように、テーブル T2への入力はテーブルT1の出力から10ビットのインデックスWjであるべきである。これらはペアで受信されるので、テーブルT2に対して２¹⁰＊２¹⁰＝２²⁰＝１，０４８，５７６個のアドレスが存在することになる。これらの各々は、２¹⁰＝１０２４個の10ビットのテーブルT2インデックスXjのそれぞれ１つが満たされるべきである。ステップ26のことを考えると、アドレスエントリは、テーブルT2コードブックが定義される空間における近似手法を使って判定されるべきである。テーブルT2 コードブックは4次元の空間周波数領域の空間で定義される。しかし、テーブルT 2に対するアドレス入力はインデックス(Wj,W(J+1))のペアであるが、このインデックスに対しては意味のある距離(metric)は適用できない。これらのインデックスの各々は、テーブルT1コードブックベクトルに対応する。ステップ22でインデックス(Wj,W(J+1))をデコードすることによって各テーブルT1コードブックベクトルを生成するが、これは距離空間において定義される。しかし、テーブルT1コードブックベクトルは２次元空間において定義されるが、４次元ベクトルが段S2に対してステップ26で必要である。４次元ベクトルを生成するために２つの２次元ベクトル周波数領域を連鎖させることができるが、その結果はこの文脈においては意味がない。その結果は、上記のように、平均輝度に対応する２つの値と左右の異なる輝度に対応する２つの値とを有するであろう。必要であろうものは、単一の平均輝度値，単一の左右の異なる値，単一の上下の異なる値，および単一の斜めの異なる値である。より高次元の空間周波数領域のベクトルを生成するために２つの空間周波数領域を結合するような、直接的で有意義な方法は存在しないので、逆ＤＣＴがステップ23において、ステップ22で生成された２次元のテーブルT1コードブックベクトルのペアのそれぞれに適用される。２×２を表わす空間画素領域において２次元ベクトルを生成するために有意義に連鎖させることができる２次元画素領域ベクトルのペアを、逆ＤＣＴは生成する。４次元周波数領域ベクトルを生成するために、４次元画素領域ベクトルにＤＣＴ変換をステップ25において適用することができる。この４次元の空間周波数領域ベクトルは、テーブルT2コードブックベクトルと同じ空間にある。したがって、最も近いテーブルT2コードブックベクトルを判定するために、ステップ26において近似手法を有意義に適用することができる。ステップ15で最も近いテーブルT2コードブックベクトルに割り振られたインデックスXjは、ステップ27で検討中のアドレスに割り振られる。インデックスXjが全テーブルT2のアドレスに割り振られたとき、テーブルT2に対するテーブル設計方法M1は完了する。中間段S3に対するテーブル設計方法１は、次元が倍になるということ以外は、中間段S2に対する方法と類似している。コード設計手順20は、ステップ11で同じあるいは類似の画像を選択することで開始される。ステップ12では、画像は８次元画素領域ベクトルに変換されるが、その各々はトレーニング画像の４×２画素ブロックを表わす。 8次元の空間周波数領域ベクトルを生成するために、ＤＣＴはステップ13で8次元画素領域ベクトルに適用される。このベクトルのアレイ表示は以下の通りである。ベース関数F00,F01,F10,およびF11は、２×２アレイに対する意味と同じ意味を概略的には有するにもかかわらず、一度アレイサイズが２×２を超えると、差のみに関してベース関数を記述するのはもはや不十分である。代わりに、その項は異なる空間周波数を表わす。関数F00,F01,F10,およびF11は、第１列において次第に増加する水平の空間周波数である。関数F00およびF01は、第１行において次第に増加する垂直の空間周波数である。残りの関数は、水平および垂直の空間周波数の産物である２次元の空間周波数を表わすものとして特徴付けられ得る。人間の知覚はより高い周波数領域に比較的集中する。したがって、知覚による近似手法は、比較的低い（１より小さい）重みをF03やF04のような高い空間周波数の項に割り当てることができる。同じ理由から、比較的高い（１より大きい）重みを低い空間周波数の項に割り当てることができる。知覚による重みは、ステップ14のコードブック割り振りの間、近似および歪み手法において使われる。ＧＬＡの分裂変化(SPlitting variation)が使われる。一度２５６語のコードブックが判定されると、インデックスYjはステップ15でコードブックベクトルに割り振られる。テーブルT3に対するテーブル挿入手順20はテーブルT2と類似している。ステップ21で生成された各アドレスは、インデックスのペア（XJ,X(J+1)）に対応する。ステップ22で４次元テーブルT2の空間周波数領域コードブックベクトルを生成するために、これらはステップ22でデコードされる。ステップ23で４次元画素領域ベクトルを生成するために、逆ＤＣＴをこれら２つのベクトルに適用する。画素領域ベクトルは、結果として画像領域における８次元ベクトルは４×２画素ブロックに対応するようにステップ24で連鎖されるような２×２画素ブロックを表わす。テーブルT3コードブックベクトルと同じ空間で８次元の空間周波数領域ベクトルを生成するために、ステップ25において、ＤＣＴを８次元画素領域ベクトルに適用する。最も近いテーブルT3のクックベクトルは、好適には平均二乗値エラーと同じ重み付けされていない近似手法を使って、ステップ26で判定される。ステップ15で最も近いテーブルT3コードブックベクトルに割り振られたテーブルT3インデックスYjは、ステップ27において、検討中のアドレスで入れられる。一度対応するエントリが全テーブルT3のアドレスに対してなされると、テーブルT3の設計は完了する。最終段のテーブルT4に対するテーブル設計方法M1は、ステップ11で同じあるいは類似のトレーニング画像のセットを選択することで開始される。ステップ12で、トレーニング画像は、４×４画素ブロック（図１のBiの形式を有する）を表わす連続した１６次元の画素領域ベクトルとして表わされる。各16次元空間周波数領域ベクトルを生成するために、ステップ13でＤＣＴを画素領域ベクトルに適用するが、その統計上の外形(statistical profile)は最終段のテーブルT4コードブックを作るのに使われる。段S1，S2，およびS3について標準のテーブルベースのＶＱコードブックステップを作る代わりに、ステップ16はツリー構造のコードブックを作る。ツリー構造コードブックと予備段に対して使われる全探索コードブック設計との主な違いは、コードブックベクトルのほとんどがトレーニング画像の各部分集合だけを使って判定されるという点である。分裂変形にあるように、図３のAに示されるように、画像ベクトルの平均が判定される。段S4に対して、トレーニングベクトルは16次元の空間周波数領域にある。この平均は２ベクトルコードブックに対してシードベクトルを生成することを動揺させる。ＧＬＡは２ベクトルコードブックに対してコードブックベクトルを判定するために動作させられる。予備セクションのコードブックの設計から離れて、２ベクトルコードブックのベクトルに対するトレーニングベクトルのクラスタは永久的なものとして扱われる。図３に示されるように、インデックス０および１は、２ベクトルコードブックのベクトルにそれぞれ割り振られる。２ベクトルコードブックのベクトルの各々は、シードベクトルの２つのペアを生成することに動揺する。各ペアに対してＧＬＡは、親コードブックベクトルに割り振られたトレーニングべクトルだけを使って動作させられる。その結果、オリジナルの２べクトルコードブックのベクトルのそれぞれに対して、子ベクトルのペアが生じる。子ベクトルにはプリフィックス(prefix)として親ベクトルとのインデックスと１ビットのサーフィス(suf fice)を有するインデックスを割り振られる。インデックス０ベクトルを割り振られたコードブックベクトルの子ベクトルは、インデックス00および01を割り振られ、１のコードブックベクトルの子ベクトルはインデックス10および11が割り振られる。もう一度、４つの子ベクトルに対してトレーニングベクトルの割り当てが永久的なものとして扱われる。決定ツリー(decision-tree)の清澄には「公平に成長する(evenly-growing)」および「どんどん成長する(greedily-growing)」変形例が存在する。いずれの場合でも、ツリーを十分成長させてその後に所望された精度のツリーに剪定し戻すことが望まれる。公平に成長する変形例では、子の双方のセットは、次の世代に対するシード(seed)を選択するのに使われる。したがって、ツリーは世代毎に成長する。所望の可変長コードの最大限可能な深さに対して公平に成長するツリーを成長させることは、実用に比べて寄り多くのメモリと計算時間を必要とする。剪定の開始点が、その剪定の結果生じるツリーと同じである一般の形状を有する場合、より少ない成長およびより少ない剪定が必要である。そのようなツリーは好適な「どんどん成長する」変形例によいって得ることができ、そこでは聖光はノード毎である。一般的には、成長は不公平であり、例えば、一方の兄弟(sib ling)はもう一方が子を持つ前に孫を有することができる。どの子ノードが次に成長させられるのを判定することは、歪みDと各子ノードでの成長の結果であるであろうエントロピーHとでの増加に対して、接続手法(joint measure)Ｄ＋λＨを計算することを伴う。成長は最も低い接続手法を有するノードにおいてだけ促進される。接続手法は成長させるべきノードを選択するのにだけ使われることに注意されたい。好適な実施例では、エントロピーは、クラスタ化に使われる近似手法においては考慮されない。しかし、本発明はエントロピーを含んだ近似手法を提供する。例では、接続エントロピーおよび歪み手法は、各々が叔母(aunt)と２つの姪(n iece)を有する２個の３ベクトルコードブックに対して判定される。一方の３ベクトルコードブックがベクトル０，10,および11を有し、もう一方の３ベクトルコードブックがベクトル１，00，および01を有する。低い方の接続手法を有する３ベクトルコードブックは２ベクトルコードブックに取って代わる。したがってテーブルT4コードブックは、（スプリティング手順に関する各反復を２倍にする代わりに）一度に１つのベクトルが成長させられる。さらに、子に取って代わられた親は序数が割り振られる。図３の例では、より低い歪みがベクトル１の子に関連する。３ベクトルコードブックはベクトル11，10 ，および０からなる。序数１（図３において括弧でくくられている）は取り替えられた親ベクトル１に割り当てられる。この序数は圧縮スケーリングの選択に使われる。ツリー成長手順の次の反復では、２つの新しいコードブックベクトル、例えば 11および10は、２つ多いペアのシードベクトルが生成されるようにそれぞれ動揺される。ＧＬＡは各親に割り振られたトレーニングベクトルだけを使って各ペアで実行される。その結果として、提案された新しいコードブックベクトル(111,1 10)および(101,100)の２つのペアが生じる。歪み手法は各ペアに対して得られる。この歪み手法は、ベクトル、例えば、２ベクトルおよび３ベクトルコードブックに共通して０に対して既に得られた歪み手法と比較される。ツリーはコードブックベクトルから成長し、これによって成長は最も少ない歪みを生成する。図３の例では、ツリーはベクトル０から成長し、それには序数２が割り振られている。次のレベルのコードブックが１つ多いすぐ前のレベルコードブックのベクトルを持つように、成長技術の各反復で１つの親ベクトルが２つの子ベクトルに取って代わられる。子ベクトルに対するインデックスは、親ベクトルに対するインデックスの終わりにそれぞれ０および１を付加することによって形成される。結果として、各世代に対するインデックスはすぐ前の世代に対するインデックスより１だけ長くなる。このように生成されるコードは「プリフィックス」コードである。図３はツリー成長手順において９回の反復の後のツリーを示している。随意的に、ツリー成長は、コードブックベクトルに対応する終端ノードが達せられるような所望の数を有するツリーで終結することができる。しかし、結果生じるツリーは典型的には最適ではない。より最適なツリーを得るために、成長は所望のコードブックに必要なサイズを十分に越して続く。例えば、十分に成長したツリーに関連するコードに対する平均ビット長は、最大精度のコードに対して使われるべきツリーに対して所望された平均ビット長の２倍であってよい。十分に成長したツリーは、所望のサイズのツリーになるまで、歪みおよびエントロピーの接続手法を使ってノード毎に剪定され得る。剪定は公平に十分成長したツリーからエントロピー形成されたツリーを得るために使われ得ることも注意されたい。より低い精度のツリーは、どんどんと成長する間に割り振られる序数によって設計され得る。ナンバリングのシーケンスにはいくつかのギャップが存在するかもしれないが、数字のオーダーはより低い精度のツリーに対してノードの選択を導くためにまだ提供される。しかし、好適には高精度のツリーは、より良い低精度のツリーを提供するために歪みおよびエントロピーの接続手法を使って剪定される。剪定という点で、序数は成長のオーダーではなく剪定のオーダーを反映するために再び割り振られてもよい。共通の先祖およびその子に対して剪定が続けられる場合、そのときは全序数は剪定のオーダーにしたがって再び割り振られてもよい。完全精度ツリー(full-precision-tree)のコードブックは、前にあったコードブックのいずれよりも低い歪みおよび低いビットレートを提供する。より高いビットレートが所望される場合、適切な序数を選択し、より高い序数を有する全コードブックベクトルを剪定することができる。結果生じる前にあったコードブックは、歪みおよびビットレートの最適に近いトレードオフを提供することができる。この場合では、１０２４ベクトルのコードブックが作られ、そのインデックスはインデックスZAに対して使われる。インデックス ZBに対しては、ツリーはより高いビットレートを生成するために序数５１２に戻るように剪定される。ZCに対しては、インデックスは一層高いビットレートを生成するために序数２２６に戻るように剪定される。デコーダDECのコード剪定器5 1は、適切なビットレート対歪みのトレードオフを作ることができるような序数に関する情報を有する。インデックスZA，ZB，およびZCがテーブルT4の各アドレスのセクションに入れられ得るとき、そのようにすることはメモリが効率的ではないであろう。代わりに、インデックスZC，Zb，およびZaが記憶される。ZbはインデックスZBを得るためにインデックスZCに加えられるビットを示す。ZaはインデックスZAを得るためにインデックスZBに加えられるビットを示す。テーブルT4に対する挿入手順20は、ステップ21で、入力(Y1,Y2)の全て可能性のある別々のペアのに対応する２²⁰アドレスの生成を開始する。各第３段のインデックスYjはステップ22で各８次元の空間周波数領域のテーブルT3のコードブックベクトルを生成するためにデコードされる。４×２画素ブロックを表わす対応する８次元の画素領域ベクトルを得るために、ステップ23で逆ＤＣＴをこれらテーブルT3コードブックベクトルに適用する。このベクトルは、それぞれ４×４画素ブロックに対応する16次元の画素領域ベクトルを形成するために、ステップ24 で連鎖される。ＤＣＴは、テーブルT4コードブックと同じ空間において16次元の各空間周波数領域ベクトルを生成するためにステップ24で適用される。３セットのコードブックベクトルのそれぞれにおいて最も近いテーブルT4コードブックベクトルはステップ26で識別され、重み付けされていない近似手法を使う。最も近いコードブックベクトルに関連する分類インデックスZA，ZB，および ZCは、検討中のテーブルT4のアドレスに割り振られる。一度この割り振りがテーブルT4の全アドレスに対して反復されると、テーブルT4の設計は完了する。一度全テーブルT1〜T4が完了すると、階層形テーブルHLTの設計は完了する。その結果生じる圧縮システムのパフォーマンスは、好適な実施例の、可変レートのツリー構造の階層形テーブルベースのベクトル量子化(variable-rate tree- structured hierachical table-based vector quantization:VRTSHVQ)の圧縮の場合に対して、図４に示される。圧縮の有効性は、非階層形の可変レートのツリー構造のテーブルベースのベクトル量子化(non-hierachical variable-rate tre e-structured table-based vector quantization:VRTSVQ)の圧縮に対するよりも少し悪い。しかし、平凡な階層形ベクトル量子化(HVQ)よりも著しく良好である。階層形VQルックアップテーブルにおける、知覚による手法，ツリー構造，およびエントロピーの制約を具体化するための方法のより詳細な説明は以下に示される。説明について複雑さが増したことに対するために、表記においていくつか変更が必要である。以下の例ではテーブル挿入の間、知覚による手法を利用する。本発明によれば、テーブル挿入に対して重み付けされない手法を使ってより低い歪みが達成可能であるということが維持される。ベクトル量子化を実現するのに使われるテーブルはまたブロック変換を実現することができる。このテーブルルックアップエンコーダにおいて、エンコーダに対する入力ベクトルが、コードワードを選ぶためのコードテーブルにおいてアドレスとして直接使用される。順変換あるいは逆変換を実行する必要はない。これらはテーブルで実現される。階層形テーブルは、段でベクトルを量子化するために大きい次元のVQに対して管理可能なテーブルサイズを保つのに使われる。エンコーダおよびデコーダの両方がテーブルの参照によって実現されるので、最終システムの実現において算数計算は必要ない。アルゴリズムは、包括的なブロック変換（DCT，Harr，WHT）と階層形ベクトル量子化の新しい結合である。これらはＶＱの設計において知覚による重み付けおよび主観的歪み手法を使う。エンコーダおよびデコーダの両方がテーブルルックアップのみで実現され、効率的なソフトウェアおよびハードウェアの解決によって受け入れられる。デコーダは簡単なテーブルルックアップとして実現することができるが、エンコーダは最小歪みコードワードに対する徹底的な探索として通常は実現されなければならないという点で、全探索(full-search)ベクトル量子化（ＶＱ）は計算的に不釣り合いである。したがって、ＶＱは、例えばＣＤＲＯＭからのビデオのソフトウェアデコードで、デコーダは非常に簡単でなければならないがエンコーダは比較的複雑であるかもしれないという問題をアプリケーションに見つける。種々の構造ベクトル量子化は、全探索エンコーダの複雑さを減らすために導入されている。例えば、変換コードは構造ベクトル量子化器であり、そこではエンコーダは、変換係数のスカラー量子化の前に線形変換を実行する。しかし、デコーダは逆変換を実行しなければならないので、この構造はまたデコーダの複雑さを増加させる。したがって、変換コーディングのとき、エンコーダおよびデコーダの計算の複雑さは本質的にバランスされており、変換コーディングは、ビデオ電話のような点対点の通信を自然のアプリケーションに見つける。変換コーディングの特別な利点は、周波数感度によって、知覚による重み付けは、変換係数の中に適切にビットを割り当てることによって簡単に実行されるという点である。他の構造ベクトル量子化スキームの多くは、エンコーダの複雑さを減少させ、同時にデコーダの複雑さを増加させない。そのようなスキームはツリー構造ＶＱ，格子ＶＱ，細かい−粗い(fine-to-coarse)ＶＱなどを有している。階層形テーブルベースベクトル量子化（HTBYQ）は、テーブルルックアップの階層形配置を有する全探索エンコーダに取って代わり、その結果、エンコードするためのサンプル毎に１テーブルの参照の最大値が生じる。その結果、バランスされたスキームが生じるが、エンコーダおよびデコーダの両方に非常に低い計算の複雑さを有する。したがって、HVQは安い多目的コンピュータの異成分からなるネットワークにわたる共同のビデオに自然のアプリケーションを見つける。知覚的に重要な歪み手法は、任意の変換の係数を重み付けることに基づいてＨＴＢＶＱに集積され得る。本質的には変換は予め計算され、エンコーダおよびデコーダのルックアップテーブルに組み込まれる。したがって、テーブルルックアップのエンコードおよびデコードの計算の簡単さを維持しながら、変換コーディングの知覚による利点が得られる。ＨＴＢＶＱはテーブルルックアップだけを使ってベクトルをエンコードする方法である。テーブルルックアップを使うエンコードの単純な方法は、入力ベクトルにおけるシンボルによって直接テーブルをアドレスすることである。例えば、各入力シンボルが（単色画像での画素に対して一般的であるような）ｒ₀＝８ビットの精度に予め量子化され、ベクトルの次元がＫ＝２であると仮定する。そのとき、Ｋｒ₀＝１６のアドレスビットを有するルックアップテーブルおよびｌｏｇ₂Ｎの出力ビット（ここでＮはコードブックにおけるコードワードの数）が、各２次元ベクトルを最も近いコードワードのインデックスへ単一のテーブルルックアップを使ってエンコードされるのに使われる。不幸なことに、この単純な方法におけるテーブルサイズは中程度のＫに対して実行不可能な大きさである。画像コーディングに対して、単一のベクトルとして画素の各８×８ブロックをコードすることができるように、６４と同じ大きさのＫが必要である。階層においてテーブルルックアップを実行することによって、より大きいベクトルは、図１に示されるように実用的な方法に適応させられる。図において、オリジナルの精度が単位シンボル当りｒ₀＝８ビットであるＫ＝８次元のベクトルが、単位ベクトル当りｒ_M＝８ビット（すなわち、８：１の圧縮比に対して単位シンボル当りレートＲ＝ｒ_M／Ｋ＝１ビットで）にテーブルルックアップのＭ＝３段を使ってエンコードされる。第１段において、Ｋ入力シンボルはサイズｋ₀ ＝２のブロックへ分割され、各ブロックのそれぞれは、ｒ₁＝８の出力ビットを生成するために、ｋ₀ｒ₀＝１６のアドレスビットを有するルックアップテーブルを直接アドレスするのに使われる。同様に、１からＭの各連続した段ｍにおいて、ｒ_mの出力ビットをブロックごとに生成するためのｋ_mｒ_m-1のアドレスビットを有するルックアップテーブルを直接アドレスするために、前段からのｒ_m−１ビットの出力は長さｋ_mのブロックに結合される。量子化器が固定レートの量子化器である場合、最終段Ｍからのｒ_mビットの出力はチャンネルを通じて直接デコーダへ送出されるかもしれず、またあるいは、例えば量子化器が可変レート量子化器である場合、ビットが可変長コードのテーブルにインデックスを付けるために使われるかもしれない。固定レートである場合、ｒ_mはして単位シンボル当りのＲ＝ｒ_m／Ｋビットが、量子化器の全体的を有する固定レート量子化器のビットレートを決定する。しかし、全ｍに対してｋ_m＝２およびｒ_m＝８の場合、階層における各段の後では、ベクトルの次元Ｋ_m が倍で、ビットレートｒ_m／Ｋ_mの半分、すなわち圧縮比が倍である。固定レート量子化器の結果生じるシーケンスは多レートコーディングに使うことができる。計算の複雑さは単位入力シンボル当り多くて１つのテーブルルックアップである。エンコーダのストレージ要件は、ｍ番目の段におけるテーブルに対する２^kmrm ^-1 ×ｒ_mビットである。全ｍに対してｋ_m＝２およびｒ_m＝８の場合、各テーブルは６４Kバイトテーブルである。段内の全テーブルが同一であると仮定すると１つだけの６４Kテーブルが、階層のＭ＝ｌｏｇ₂Ｋの段のそれぞれに対して必要である。ｋ_mおよびｒ_mに対する可能性のある多くの値が明確に可能であるが、ｋ_m＝２およびｒ_m＝８は、実現の目的に対して通常最も便利である。次の説明から他の値をカバーすることが推定される。この点においてアドレスする主な問題点は、テーブルの内容の設計についてである。段におけるテーブルは、｛０，１，．．．，２５５｝のそれぞれにおける２つの入力インデックスｉ₁ ^m-1およびｉ₂ ^m-1から｛０，１，．．．，２５５｝における出力インデックスｉ^mへの写像としてみなすことができるであろう。次元Ｋ_m＝２ _m＝２^mおよびレートｒ_m／Ｋ_m＝８／２^mビットでｉ＝０，１，．．．，２５５として、あらゆる手ごろなＶＱ設計アルゴリズム（一般化ロイドアルゴリズムのような）を使ってオリジナルデータ上でトレーニングされた、固定レートＶＱコードブックβ_m（ｉ）をトルに最も近い２^m次元コードワードのインデックスにするためにである場合、ｉ＝０，１，．．．，２５５として上で定義したｉ^mを用いて、β_m （ｉ^m）は、コードブックβ_m（ｉ）両半分をよく表わしたものであろうということである。ＨＴＢＶＱの利点は、歪み手法がテーブルに予め計算されているので、エンコーダの複雑さは歪み手法の複雑さによらないという点である。それゆえに、もし複雑ならば、ＨＴＢＶＱは知覚的に有意義な歪み手法を実現するのに理想的にあてはまる。しており、ここで、定数および１次の項はゼロであり２次の項は非負の準定符号である。それゆえに、歪み手法は、Ｘ^tはＸの転置を）の第２の導関数の行列であるとすると、入力重み付け二乗平均値。Ｍ_xは対称でありかつ非負の準定符号であるので、非負の固有値の行列に対角にされてもよく、Ｗ_x＝（Ｗ_l，．．．，Ｗ_k）で、である。（Ｗ_xの一般化された固有ベクトルの）対角行列Ｔ_xがＸによらない場合、み付けられた合計である。以下、Ｔは、Haar，Walsh-Hadamard，あるいは離散コサイン変換のような、いくつかの固定変換の変換行列であると仮定することにし、重みＷ_xはｘに対して任意に変化するようにする。これは、知覚による歪み手法の理にかなった一般的な部類である。重み付けがないとき、すなわちＷ_x＝Ｉのとき、直交変換Ｔによ交しており、したがって距離を保存する回転および／または反射であるからである。それゆえに、重み付けが均一であるとき、変換がＨａａｒ変換（ＨＴ），Ｗａｌｓｈ−Ｈａｄａｍａｒｄ変換（ＷＨＴ），離散コサイン変換（ＤＣＴ）などいずれによらず、変換された空間における二乗エラーはオリジナルの空間の二乗エラーに等しい。実際、それらのコードワードは相互の簡単な回転および／または反射であるので、異なる変換Ｔに対して平均二乗エラーを最小にするために変換空間において設計されるＶＱコードブックは全て等しい。係数のスカカー量子化に対して最良な変換を決定するのに重要であるエネルギー圧縮基準(energy compaction criterion)は、重みが均一のとき、係数のスカラー量子化に対して最良な変換を決定することは重要ではない。重みが均一ではないときは、異なる直交変換によって異なる歪み手法が生じる。それゆえ、不均一な重みは、この知覚による歪み手法の部類において欠くことのできない役割を果たす。重みは、異なる変換係数あるいは帯域における量子化エラーに対して人間の視覚の感度に反映される。重みはモデルマスキング効果(model masking effect)に対して入力依存(input-dependent)であり得る。ベクトル量子化に対する近くによる歪み手法に使われるとき、各帯域に対して、重みは効果的にステップサイズあるいはビット割り当てを制御する。例えば、ＪＰＥＧにおけるように、変換係数の均一のスカラー量子化を考える。Ｋの帯域のそれぞれに対してスカラー量子化のステップサイズｓ_l，．．．，ｓ_kをセッティングすることによって、帯域および適切な知覚モデルにおいて信号の長さによって帯域間に割り当てられる。結果として生成するコードのエンコード範囲は、ｊ＝１，．．．，Ｋとしてｊ番目の軸に沿って辺(side)ｓ_jを有する超矩形(hyper-rectangles)である。変換係数が重み付けられた二乗エラー歪み手法に関して量子化されたベクトルのとき、重みＷ_l，．．．，Ｗ_kはステップサイズに対応する役割を果たす。（変換領域において）重み付けられた歪みされるような変換の、通常の（重み付けられていない）二乗平均である。この調整された変換空間において、エントロピー制約に従う最小平均二乗エラーを有するベクトル量子化は、均一のコードワード濃度（少なくとも多数のコードワードに対して）を有するので、各エンコードセルはＫ空間において同じボリュームＶを有する。それゆえに、各エンコードセルは、調整された空間において線形の次元Ｖ^l/K（１より小さい球パッキング係数:sphere packing coefficientをかける）を有する。調整されていない空間では、各エンコる。それゆえ、ｊ＝１，．．．，Ｋとして重みＷ_jの平方根は、倍率(scale fact or)の逆数に対応し、あるいはｊ＝１，．．．，Ｋとしてｗｊ∝ｓ_j ²である。知覚による歪み手法を引き出す方法の一つとしては、変換行列に対してＤＣＴを、重みに対してはＪＰＥＧステップサイズの二乗の逆数を使うことである。ＨＴＢＶＱはＤＣＴ，Ｈａａｒ，およびＷａｌｓｈ−Ｈａｄａｍａｒｄ変換のようなブロックベースの変換に結合されることができ、視覚的な性能を改善するために知覚的に重み付けられる。ここで、その結合は、重み付けられた変換ＨＶＱ(Weighted Transform HVQ)（ＷＴＨＶＱ）として呼ばれている。ここで、ＷＴＨＶＱを画像コーディングに適用する。ＷＴＨＶＱのエンコーダはＭ段（図１に示すように）からなり、各段はルックアップテーブルによって実現される。画像コーディングに対して、分離できる変換が用いられ、奇数の段は列で動作し、偶数の段は画像の行で動作する。第１段は、第１のルックアップテーブルに対するアドレスとして、入力画像のｋ₁＝２の水平に隣接した画素を結合する。この第１段は、２５６コードワードで主観的な歪み手法を使う知覚により重み付けられたベクトル量子化の前の、入力画像上での２×１変換に対応する。それゆえ、レートはＷＴＨＶＱの各段において半減される。第１段は２：１の圧縮を与える。第２段は、第２のルックアップテーブルに対するアドレスとして、垂直に隣接した第１段のｋ₂＝２の出力を結合する。この第２段は、２５６コードワードで主観的な歪み手法を使う知覚により重み付けられたベクトル量子化の前の、入力画像上での２×２変換に対応する。２×２のベクトルが２つの段において連続的に量子化される点だけが異なる。第２段後に得られる圧縮は４：１である。１＜ｉ≦Ｍとして、段ｉでは、テーブルに対するアドレスは、前段のｋ_i＝２の隣接した出力を使うことによって構成され、アドレスされた内容は次の段に対するアドレスとして直接使われる。段ｉは、２５６コードワードを有する主観的な歪み手法を使う知覚により重み付けられたベクトル量子化の前の、ｉが偶数に対しては２^i/2×２^i/2の知覚により重み付けられた変換に、ｉが奇数に対しては２^(i+1)/2×２^(i-1)/2の変換に対応する。量子化がｉ段において連続的に実行される点だけが異なる。ｉ段後に得られる圧縮は２ある。Ｍ段後に得られる圧縮比は２^M：１である。最終段はエンコーデイングインデックスｕを生成するが、そのｕは入力（知覚的に重み付けられた変換）ベクトルに対する近似を表わし、それをデコーダに送出する。このエンコーディングインデックスは、入力重み付け歪み手法を有する直接変換ＶＱに得られるものと類似する。ＷＴＨＶＱのデコーダは、そのような変換ＶＱのデコーダと同じである。すなわち、コードワード上で逆変換がなされる時間より前におけるルックアップテーブルである。ＷＴＨＶＱの計算の要件および記憶の要件は普通のＨＶＱのそれと同じである。原則としては、ＷＴＨＶＱに対する設計アルゴリズムは普通のＨＶＱと同じであるが、知覚による歪み手法を用いる。しかし、原則としては、データを変換し変換された空間においてＷＴＨＶＱを設計することによって計算の節約がなされるが、互いに直交するように重み付けられた歪み手法ｄ_Tを使う。ＷＴＨＶＱの設計は２つの主なステップからなる。第１のステップは、各変換段に対してＶＱコードブックを設計する。各知覚により重み付けられた変換ＶＱの段は異なる次元およびレートを有するので、それらは別々に設計される。上述のような主観的に意味のある歪み手法はコードブック設計に対して使われる。ＷＴＨＶＱの各段に対するコードブックは、トレーニングシーケンスにおいて適切なオーダーの変換上で動作する一般化ロイドアルゴリズム（ＧＬＡ）によって、独立に設計される。２５６のコードワードを有する第１段のコードブックは、トレーニングシーケンスの２×１変換（ＤＣＴ，Ｈａａｒ，あるいはＷＨＴ）上でＧＬＡを動作させることによって設計される。同様に、段ｉコードブック（２５６コードワード）は、その段に対して適切なオーダーのトレーニングシーケンスの変換上でＧＬＡを使うことによって設計される。主観的な歪み手法_dTを使って変換されたデータに対して再構成されたコードワードは、によって与えられる。オリジナルのトレーニングシーケンスは、各段に対して適切なオーダーの対応する変換を使ってそれを変換することによって、前段の設計に使われる。ところが実は、各段は多くの前段を通過(go through)しなければならず、シーケンスは各段において連続的に量子化されそれゆえ各段において異なるので、各段に対して対応する入力トレーニングシーケンスは一般に異なる。ＷＴＨＶＱの設計における第２のステップは、設計されたコードブックからルックアップテーブルを作る。変換に対する各コードブックを作った後は、対応するコードブックテーブルが各段に対して作られる。第１段のテーブルは、２個の８ビット入力画素の異なる結合をすることによって作られる。２¹⁶のそのような結合が存在する。各結合に対して２×１の変換が実行される。最小歪みルール（主観的な歪み手法ｄ_T）の意味における結合に対する変換に最も近いコードワードのインデックスは、特定の入力結合に対するテーブルの出力エントリに入れられる(put in)。この手順は可能性のある入力結合全てに対して繰り返される。第１段テーブルの各出力エントリ（全部でで２¹⁶エントリ）は８ビットを有する。第２段テーブルは行で動作する。それゆえ第２段に対して２個の第１段テーブルの積結合(product combination)は、第１段テーブルからの２個の８ビット出力の積によって得られる。第２段に対して２¹⁶のそのような結合が存在する。特定のエントリに対して、連続的に量子化された２×２変換は、第１段コードブックに対するインデックスを使うことによって得られる２つのコードワード上で２ ×１の逆変換をすることによって得られる。次に、得られた２×２の生データ上で２×２の変換が実行され、主観的な歪み手法_dTの意味におけるこの変換されたベクトルに最も近いコードワードのインデックスは、対応する出力エントリに入れられる。この手順はテーブルにおける入力エントリ全てに対して繰り返される。第２段テーブルの各出力エントリもまた８ビットを有する。第３段テーブルは列で動作する。それゆえ第３段に対して２個の第２段テーブルの積結合は、第２段テーブルの出力エントリの積によって得られる。第２段テーブルの各出力エントリは８ビットを有する。第３段に対する異なる入力エントリの総数は２¹⁶である。特定のエントリに対して、連続的に量子化された４×２変換は、第２段コードブックに対するインデックスを使うことによって得られる２つのコードワード上で２×２の逆変換をすることによって得られる。次に、得られた４×２の生データ上で４×２の変換が実行され、この変換されたベクトルに主観的な歪み手法ｄ_Tの意味において最も近いコードワードのインデックスは、対応する出力エントリに入れられる。残りの段テーブルは、全て２つの逆変換を実行し、そしてデータ上での順変換を実行することによって類似の方法で作られる。主観的な歪み手法ｄ_Tの意味においてこの変換データに最も近いコードワードは、その段に対してコードブックから得られ、対応するインデックスはテーブルに入れられる。最後の段は、デコーダに送出される出力エントリとしてコードワードのインデックスを有する。デコーダは最後の段のコードブックのコピーを有し、対応するコードワードを出力するために最後の段に対してインデックスを使う。最も簡単なテーブル作成手順は、ＨａａｒおよびＷａｌｓｈ−Ｈａｄａｍａｒｄ変換に対して使われ得る。これは、ＨａａｒおよびＷＨＴの良い特性にのために、より高いオーダーの変換を分割されたデータ上でのより低いオーダーの変換の線形結合として得ることができるようにする。各段で、２つの逆変換および１つの順ＤＣＴ変換が実行されなければならないので、ＤＣＴ、すなわち逆変換の方法に対してテーブルを設計することは、ＨａａｒおよびＷＨＴよりも高価になるであろう。異なるＨＶＱアルゴリズムに対してシュミレーション結果が得られている。そのアルゴリズムはＪＰＥＧおよび全探索ＶＱについて比較されている。表IIは、ＪＰＥＧ，全探索の普通のＶＱ，全探索の重み付けしていないHaar VQ，全探索の重み付けしていないＶＱ，および全探索の重み付けしていないDCT VQについて、異なる圧縮比に対する、８ビット単色画像Lena（５１２×５１２）についてのＰＳＮＲ結果を表わす。ＶＱに対するコードブックは、５つの異なる画像（女４性１，女性２，男性，カップル，および群衆）をトレーニングすることによって生成されている。普通のＶＱと重み付けしていない変換ＶＱとのＰＳＮＲ結果が、各圧縮比に対して同じであるということが表IIから分かる。これは、変換が全て直交であり、あらゆる差はＧＬＡにおけるスプリッテリングアルゴリズムが同等のシステムに対して過敏であるということのためであるからである。ＪＰＥＧは、可変レートコードであるので、これらのスキームよりも約５ｄＢ良好に動作する。この固定レートのＶＱベースアルゴリズムは、ＪＰＥＧと比較して他の利点を有する。しかし、これらアルゴリズムに沿ってエントロピーコーディングを使うことによって、２５％多い圧縮比を得ることができる。表IIIは、ＨＶＱ，普通のHaar VQ，重み付けしていないWHT HVQ，および全探索の重み付けしていないDCT HVQについて、異なる圧縮比に対する、LenaについてのＰＳＮＲ結果を表わす。変換ＨＶＱのＰＳＮＲ結果が、同じ圧縮比に対して普通のＨＶＱの結果と同じであるということが表IIIから分かる。表IIIの結果を表IIと比較すると、ＨＶＱベースのスキームは、全探索ＶＱスキームよりも約０．７ｄＢ悪く動作することが分かる。表IVは、全探索の普通のＶＱ，知覚的に重み付けられた全探索Haar VQ，知覚的に重み付けられた全探索WHT VQ，および知覚的に重み付けられた全探索DCT VQ について、異なる圧縮比に対する、LenaについてのＰＳＮＲ結果を表わす。重み付けは、PSNRを減少させるにもかかわらず、圧縮画像の主観的な品質を増加させる。重み付けられたＶＱを使って圧縮された画像の主観的な品質は、重み付けられていないＶＱよりもずっと良好である。表IVはまた、知覚的に重み付けられた Haar VQ，WHT HVQ，およびDCT HVQについて、異なる圧縮比に対する、LenaについてのＰＳＮＲ結果を表わしている。重み付けられた変換ＨＶＱを使って得られた圧縮画像の視覚的な品質は、普通のＨＶＱよりも非常に高い。重み付けられた変換ＶＱの圧縮画像の品質は、重み付けられた変換ＨＶＱの圧縮画像のそれとほとんど同じである。表Vは、Lenaに対して、ＳＵＮのSparc-10ワークステーションにおいて、異なるアルゴリズムでのエンコード時間を表わしている。変換HVQと普通のＨＶＱとのエンコード時間が同じであるということが表Vから分かる。第１段のエンコードに対しては１２ｍｓ、第２段のエンコードに対しては２４ｍｓなどというような時間がかかっている。一方でＪＰＥＧは、全ての圧縮比において、エンコードに２５０ｍｓ必要としている。それゆえ、ＨＶＱベースのエンコーダは、ＪＰＥＧのエンコーダよりも１０〜２５倍速い。ＨＶＱベースのエンコーダはまた、全探索ＶＱベースのエンコーダよりも約５０〜１００倍速い。ＨＶＱでのこの低い計算の複雑さは、異成分からなるネットワーク上での共同ビデオに対してとても便利である。多目的ワークステーション上でソフトウェアのみでビデオエンコードできるのは毎秒３０フレームである。表VIは、Lenaに対して、ＳＵＮのSparc-10ワークステーションにおいて、異なるアルゴリズムでのデコード時間を表わしている。変換HVQ，普通のＨＶＱ，普通のＶＱ，および変換ＶＱのデコード時間が同じであるということが表VIから分かる。２：１の圧縮画像のデコードに対しては１３ｍｓ、４：１の圧縮画像のデコードに対しては１６ｍｓなどというような時間がかかっている。一方でＪＰＥＧは、全ての圧縮比において、デコードに２００ｍｓ必要としている。それゆえ、ＨＶＱベースのデコーダは、ＪＰＥＧのデコーダよりも２０〜４０倍速い。変換ＶＱのデコード時間は、変換がデコーダテーブルで予め計算され得るので普通のＶＱのデコード時間と同じである。ＨＶＱのこの計算の複雑さは低いので、ソフトウェアでのビデオデコードを毎秒30フレーム可能である。テーブルルックアップのみによって実現される一般的なブロック変換ベースのベクトル量子化器(ＷＴＨＶＱ)の設計に対して提供された技術は、全探索ＶＱエンコーダの複雑さを減少させる。知覚的に十分な歪み手法は、任意の変換の係数を重み付けることに基づいて、ＨＶＱに統合される。本質的には、変換は予め計算され、エンコーダおよびデコーダのルックアップテーブルに作成される。変換コーディングの知覚の利点は、テーブルルックアップのエンコードおよびデコードの計算上の簡単さを維持する限り、達成される。これらのアルゴリズムは、多レートの共同ビデオ環境でアプリケーションを有する。これらのアルゴリズム（ＷＴＨＶＱ）はまた効果的なソフトウェアおよびハードウェア解決策に従う。ＷＴＨＶＱの計算の複雑さは低いので、ソフトウェアでのビデオエンコードを毎秒30フレーム可能である。テーブルルックアップによって実現される一般的な制約および帰納的ベクトル量子化器のエンコーダの設計に対する技術は、エントロピー制約ＶＱ，ツリー構造ＶＱ，分類ＶＱ(classified VQ)，プロダクトＶＱ(product VQ)，平均除去ＶＱ(mean-removed VQ)，多段ＶＱ，階層形ＶＱ，非線形の補間ＶＱ(non-lenear i nterpolativeVQ)，予測ＶＱ，および重み付けられた普遍的なＶＱ(weighted uni versal VQ)を有する。これらの種々のＶＱ構造は、以下に提示されたアルゴリズムを使って階層形ルックアップテーブルベクトル量子化に結合され得る。特に、可変レートを得るためのエントロピー制約ＶＱおよび組込み形コードを得るためのツリー構造ＶＱについて考える。さらに、分類ＶＱ，プロダクトＶＱ，平均除去ＶＱ，多段ＶＱ，階層形ＶＱ，および非線形の補間ＶＱについてを非制約ＶＱの複雑性の問題を克服するために考え、それによって、より高度のベクトル次元およびより大きいコードブックサイズを利用できるようにする。予測ＶＱのような帰納的ベクトル量子化器は、一層小さいコードブックを使いながら大きなコードブックを有するメモリのないＶＱの性能を得る。重み付けられた普遍的なＶＱは多コードブックシステムを提供する。知覚的に重み付けられた階層形ルックアップテーブルＶＱは、種々の制約および帰納的なＶＱ構造に結合され得る。これらの構造の各々の本質においては、ＨＶＱエンコーダはまだテーブルルックアップのＭ段からなる。最後の段はＶＱの種々の構造について異なる。エントロピー制約ベクトル量子化（ＥＣＶＱ）は、コードワードのエントロピーにおける制約に支配される平均歪みを最小にし、可変レートシステムを得るのに使うことができる。ＥＣＨＶＱは、最後の段のコードブックおよびテーブルが可変レートであるということ以外は、ＨＶＱと同じ構造を有する。最後の段のコードブックおよびテーブルは、ＥＣＶＱアルゴリズムを使って設計され、そこでは、１Ｄ０を（上で定義された１ｄ０の予測値によって得られる）平均歪み、１Ｈ０をエントロピーとして非制約の最小化問題１ｍｉｎ（Ｄ＋λＨ）０が解決される。したがって、この修正された歪み手法は、最後の段のコードブックおよびテーブルの設計に使われる。最後の段のテーブルは、デコーダへ送出される可変長インデックスを出力する。デコーダは最後の段のコードブックのコピーを有し、対応するコードワードを出力するために最後の段の対するインデックスを使う。ＥＣＨＶＱの設計は2つの主なステップからなる。第１のステップは各段に対してＶＱコードブックを設計する。各ＶＱ段は異なる次元とレートを有しているので、それらは個別に設計される。上述のように、主観的に有意義な歪み手法は、コードブックを設計するために使われる。ＥＣＨＶＱの最後の段を除く各段に対するコードブックは、トレーニングシーケンスの適切なベクトルサイズで動作する一般化ロイドアルゴリズム（ＧＬＡ）によって独立に設計される。最後の段のコードブックは、ＥＣＶＱアルゴリズムを使って設計される。ＥＣＨＶＱの設計における第２のステップは、設計されたコードブックからルックアップテーブルを作成する。各コードブックを作成した後、対応するコードは各段に対して作成される。最後の段のテーブルを除く全テーブルは、上述の手順を使って作成される。最後の段のテーブルは、修正された歪み手法を使って設計される。一般に、最後の段のテーブルは写像を実現する。ここでｒ_M（ｉ）は最後の段のコードブックにおけるｉ^番目のコードワードを表わすビット数である。最後の段のコードブックおよびテーブルだけがラムダの異なる値について違う必要がある。ＨＶＱの最後の段におけるツリー構造ＶＱは組込み形コードを得るために使われ得る。普通のＶＱにおいては、コードワードは組織立っていないコードブック (unstructured codebook)に存在し、各入力ベクトルは最小歪みコードワードに写像される。これは入力空間の仕切りをボロノイ(Voronoi)エンコード領域に導入する。一方で、ＴＳＶＱにおいて、コードワードはツリー構造に配置され、各入力ベクトルは（ルートノードから）最小歪みの子ノードに連続的に写像される。これは、ツリーの深さが増加するので、階層形の仕切り、すなわち入力空間の微細な区別(refinement)を導入する。子の連続する微細な区別のために、リーフノード(leaf node)へ写像する入力ベクトルは、ルートからリーフの経路マップによって高精度に、あるいは経路のプリフィックスによって低精度に表わされ得る。よれゆえ、ＴＳＶＱはデータの組込み形エンコードを生成する。ツリーの深さがＲでベクトルの次元がｋの場合、ビットレート0/ｋ，......．，R/kを全て達成できる。可変レートＴＳＶＱは、ツリーの深さを変えることによって、構成し得る。これは、一度にツリーの１つのノードを「どんどん成長させる」ことによって、あるいは大きなツリーを成長させかつその平均長（ＰＴＳＶＱ）あるいはエントロピー（ＥＰＴＳＶＱ）の制約に支配されるその平均歪みを最小にするために剪定し戻されることによって、することができる。最後の段のテーブルは、デコーダへ送出する固定長あるいは可変長の組込み形インデックスを出力する。デコーダは最後の段のツリー構造コードブックのコピーを有し、対応するコードワードを出力するために最後の段の対するインデックスを使う。ＴＳＨＶＱは、最後の段のコードブックおよびテーブルがツリー構造であることを除いて、ＨＶＱと同じ構造を有する。したがってＴＳＨＶＱでは、最後の段のテーブルは、チャンネルにおいて送信される固定長あるいは可変長の組込み形インデックスを出力する。ＴＳＨＶＱの設計はまた２つの主なステップからなる。第１のステップは各段に対してＶＱコードブックを設計する。ＴＳＨＶＱの最後の段を除く各段に対するコードブックは、トレーニングシーケンスの適切なベクトルサイズで動作する一般化ロイドアルゴリズム（ＧＬＡ）によって独立に設計される。ＴＳＨＶＱの設計における第２のステップは、設計されたコードブックからルックアップテーブルを作成する。各コードブックを作成した後、対応するコードは各段に対して作成される。最後の段のテーブルを除く全テーブルは、よってエンコードされる先の可変長インデックスｉにセットすることによって設計される。分類階層形テーブルルックアップＶＱ(Classified Hierarchical Table-Looku p VQ:ＣＨＶＱ）において、分類器(classifier)は各入力ベクトルが属するクラスを決定するために使われる。各クラスは、そのクラスに対するコードブックに基づいて設計されたＨＶＱテーブルのセットを有する。分類器は、ＧＬＡあるいはアドホック（ad hoc）なエッジ分類器あるいは、例えば平均あるいは分散などのベクトルの特色に基づくあらゆる他のタイプの分類器によって設計された、最も近いの分類器であり得る。ＣＨＶＱエンコーダはどのクラスを使うべき課を決定し、付帯的な情報としてクラスに対するインデックスを送出する。慣例上、分類ＶＱの利点は、各クラスに対してより小さいコードブックを使うことによって全探索ＶＱのエンコードの複雑さを減らすことにある。ここで、ＣＨＶＱの利点は、ビット割り当ては、そのクラスの意味の重要性に基づいてクラスに対するレートを決定するためになされ得るということである。エンコーダは、入力ベクトルに対するクラスについてデコーダに付帯的情報を送出する。クラスはどのテーブルの階層を使うべきかを判定する。最後の段のテーブルは、デコーダへ送出する固定長あるいは可変長のインデックスを出力する。デコーダは種々のクラスに対する最後の段のコードブックのコピーを有し、受信した分類情報に基づいてクラスのコードブックから対応するコードワードを出力するために最後の段の対するインデックスを使う。ＣＨＶＱは、各クラスがＨＶＱテーブルの個別のセットを有するということ以外はＨＶＱと同じ構造を有する。ＣＨＶＱでは、最後の段のテーブルは、デコーダへ抄出する固定長あるいは可変長（エントロピー制約ＣＨＶＱ）のインデックスを出力する。ＣＨＶＱの設計はまた２つの主なステップからなる。第１のステップは、ＨＶＱあるいはＥＣＨＶＱに関してのように各クラスに対する各段についてのＶＱコードブックを設計する。各コードブックを作成した後、対応するコードのテーブルは、ＨＶＱあるいはＥＣＨＶＱに関してのように各クラスに対する各段について作成される。積階層形テーブルルックアップＶＱ(Product Hierarchical Table Lookup VQ) は、ベクトルを２つあるいはそれより多い要素に分裂させることによって高次元ベクトルをコーディングするような記憶の複雑さを減らし、各分裂ベクトルを独立にエンコードする。例えば、８×８のブロックを４個の４×４のブロックとしてエンコードすることができ、各エンコードは４×４のブロックに対してＨＶＱテーブルの同じセットを使う。一般に、入力ベクトルは変化する次元のサブベクトルへ分裂させることができるが、ここでは各サブベクトルはＨＶＱテーブルを使って適切な段へエンコードされるであろう。テーブルおよびコードブックはこの場合、ＨＶＱに対してと正確に同じである。平均除去階層形テーブルルックアップＶＱ（ＭＲＨＶＱ）は、エンコードおよびデコードの複雑さを減らすためにプロダクトコード(product code)の形式である。それにより、より高いレートでより高次元のベクトルのコーディングができる。ＭＲＨＶＱでは、入力ベクトルは、平均（スカラー）および残差(residual) （ベクトル）の２つの要素の形質に分裂される。ＭＲＨＶＱは全探索エンコーダがテーブルルックアップによって取って代わられるような平均除去ＶＱである。ＭＲＨＶＱエンコーダでは、第１段のテーブルは、残差に対して８ビットのインデックス、２×１ブロックに対しては８ビットの平均を出力する。残差に対する８ビットのインデックスは第２段のテーブルをインデックスするのに使われる。第２段のテーブルの出力は、第３段への有力として使われる。第１段の後、個別の２×１のブロックに対する８ビットの平均は、入力ブロックに対してさらに平均され量子化され、残差インデックスのデコーダに独立に送信される。最後の段のテーブルは、デコーダへ送出される固定長あるいは可変長（エントロピー制約ＭＲＨＶＱ）の残差インデックスを出力する。デコーダは最後の段のコードブックのコピーを有し、コードブックから対応するコードワードを出力するために最後の段の対するインデックスを使い、ブロックの受信した平均値を加える。ＭＲＨＶＱは、全てのコードブックおよびテーブルが平均除去ベクトルに対して設計されることを除いて、ＨＶＱと同じ構造を有する。ＭＲＨＶＱの設計はまた２つの主なステップからなる。第１のステップは、適切な次元の平均除去トレーニング上で、ＨＶＱあるいはＥＣＨＶＱに関してのように各段に対するＶＱコードブックを設計する。各コードブックを作成した後、対応するコードブックテーブルはＨＶＱあるいはＥＣＨＶＱにおけるときのように各段に対して作成される。多段階層形テーブルルックアップＶＱ（ＭＳＨＶＱ）はプロダクトコードの形式であり、それは、より高いレートでのより高次元のベクトルのコーディングを可能にする。ＭＳＨＶＱは、全探索エンコーダがルックアップテーブルによって取って代わられるような多段である。ＭＳＨＶＱでは、エンコードは個別の段で実行される。第１段では、入力ベクトルは、ＨＶＱテーブルのセットを使って粗く量子化される。第１段インデックスは粗いレベルの情報として送信される。第２段では、入力と第１段の量子化されたベクトルとの間の残差が、ＨＶＱテーブルの別のセットを使って再び量子化される。残差は第２段）におけるテーブルルックアップを通じて得ることができることに注意されたい。第２段のインデックスは詳細な区分の情報としてデコーダへ送出される。この手順は、連続する段の間での残差が、ＨＶＱテーブルの新しいセットを使ってエンコードされるように続けられる。ＭＳＨＶＱの異なる段の間ではビット割り当てが必要である。デコーダは、対応するコードブックを参照するために送信されたインデックスを使い、再構成されたベクトルが加えられる。ＭＳＨＶＱは、ＨＶＱの個別の段を有するということを除いて、ＨＶＱと同じ構造を有する。ＭＳＨＶＱでは、各段は、デコーダへ送出される固定長および可変長（エントロピー制約ＭＳＨＶＱ）のインデックスを出力する。ＭＳＨＶＱの設計は２つの主なステップからなる。第１段のエンコーダのコードブックはＨＶＱにおけるときのように設計される。第２段のコードブックは、第１段の後、トレーニングセットと量子化トレーニングセットとの間の残差を使って閉ループで設計される。ＨＶＱあるいはＥＣＨＶＱにおけるときのように各段に対して本質的に作成される。第２段およびその後に続く段に対するテーブルが残差ベクトルに対して設計されるという点だけが違う。階層−階層形テーブルルックアップＶＱ(Hierarchical-Hierarchical Table-L ookup VQ)（Ｈ−ＨＶＱ）はまたｔ高いレートでより高次元ベクトルのコーディングを可能にする。Ｈ−ＨＶＱは、全探索エンコーダがテーブルルックアップエンコーダに取って代わられるような階層形ＶＱである。ＭＳＨＶＱにおけるときのように、Ｈ−ＨＶＱエンコードは個別の段において実行される。第１段では、大きな入力ベクトル（スーパーベクトル）は、量子化された形質のベクトルを与えるために、ＨＶＱのセットを使って粗く量子化される。第１段のインデックスはデコーダへ送信される。第２段では、入力と第１段の量子化されたベクトルとの間の残差が、ＨＶＱテーブルの別のセットを使って再び量子化されるが、スーパーベクトルはより小さなサブベクトルに分裂される。残差は第２段におけるテーブルルックアップを通じて得ることができることに注意されたい。第２段のインデックスはまたデコーダへ送出される。スーパーベクトルを仕切り量子化するこの手順は、連続する残差をエンコードすることによって、各段に対して繰り返される。Ｈ−ＨＶＱの異なる段の間ではビット割り当てが必要である。デコーダは、対応するコードブックを参照するために送信されたインデックスを使い、再構成されたベクトルが加えられる。Ｈ−ＨＶＱの構造は、この場合、エンコードの第１段とその後に続く段とにおけるベクトルの次元が異なるということを除いて、ＭＳＨＶＱと類似している。Ｈ−ＨＶＱの設計は、その後に続く段においてベクトルの次元が減少するということがだけが違うようなＭＳＨＶＱの設計と同じである。非線形の補間テーブルルックアップＶＱ(Non-linear Interpolative Table-Lo okup VQ)（ＮＩＨＶＱ）はＨＶＱと比較してエンコードおよび記憶の複雑さを減少させることができる。ＮＩＨＶＱは、全探索エンコーダがテーブルルックアップエンコーダによって取って代わられる非線形の補間ＶＱである。ＮＩＨＶＱでは、エンコードは、形質ベクトル(feature vector)がオリジナルの入力から取り出され、かつエンコードは減少した次元の形質ベクトルで実行されるという点を除いて、ＨＶＱのときのように実行される。最後の段の出力は、デコーダへ送出される固定長および可変長（エントロピー制約ＮＩＨＶＱ）のインデックスを出力する。デコーダは、最後の段のコードブックのコピーを有し、対応するコードワードを出力するために最後の段の対するインデックスを使う。デコーダのコードブックは、入力ベクトルの次元の最適な非線形の補間コードワードを有する。ＮＩＨＶＱの設計は２つの主なステップからなる。第１のステップは、ＨＶＱあるいはＥＣＨＶＱに関してのように各段に対する形質ベクトルからエンコーダＶＱコードブックを設計する。最後の段のコードブックは非線形の補間ＶＱを使って設計される。各コードブックを作成した後、対応するコードテーブルはＨＶＱあるいはＥＣＨＶＱにおけるときのように各クラスに対する各段について作成される。予測階層形テーブルルックアップＶＱ（ＰＨＶＱ）はメモリを有するＶＱである。ＰＨＶＱと予測ＶＱ（ＰＶＱ）との間の違いは、全探索エンコーダがテーブルルックアップの階層形配置によって取って代わるということである。ＰＨＶＱは、画像におけるブロック相互の相関関数(inter-block correlation)を利用する。ＰＨＶＱは、より一層小さいコードブックを使いながら大きいコードブックを有するメモリのないＶＱの性能を達成する。ＰＨＶＱでは、カレントブロックは、線形の予測を使って予め量子化された近隣のブロックに基づいて予測され、カレントブロックとその予測との残差はＨＶＱを使ってコーディングされる。予測もまたテーブルルックアップを使って実行することができ、量子化された予測ブロックは再びテーブルルックアップを通じて残差を計算するために使われる。最後の段の出力は、デコーダへ送出される残差に対する固定長および可変長のインデックスを出力する。デコーダは、最後の段のコードブックのコピーを有し、コードブックから対応するコードワードを出力するために最後の段の対するインデックスを使う。デコーダはまたテーブルルックアップを使って近隣のブロックからカレントブロックを予測し、予測ブロックに受信した残差を加える。ＰＨＶＱでは、全てのコードブックおよびテーブルが残差ベクトルに対して設計される。ＰＨＶＱでは、最後の段の出力は、デコーダへ送出される固定長および可変長（エントロピー制約ＰＨＶＱ）のインデックスを出力する。ＰＨＶＱの設計は２つの主なステップからなる。第１のステップは、適切な次元（閉ループコードブック設計）の残差トレーニングのセットで、ＨＶＱあるいはＥＣＨＶＱに関してのように各段に対してＶＱコードブックを設計する。各コードブックを作成した後、対応するコードテーブルはＨＶＱあるいはＥＣＨＶＱにおけるときのように各段に対して作成されるが、残差は第１段のテーブルで計算され得るという点だけが違う。重み付けられた普遍的な階層形テーブルルックアップＶＱ(Weighted Universa l Hierarchical Table-Lookup VQ)（ＷＵＨＶＱ）は、スーパーベクトルがＨＶＱのセットを使ってエンコードされ、歪みを最小にするものがスーパーベクトル内で全ベクトルをエンコードするために選ばれるような、多コードブックＶＱである。付帯的情報は、どのコードブックを使うべきかについてデコーダに知らせるために送出される。ＷＵＨＶＱは、各スーパーベクトルに対するコードブックの選択およびスーパーブック内の各ベクトルのエンコードがテーブルルックアップを通じてなされるような重み付けられた普遍的なＶＱ（ＷＵＶＱ）である。最後の段の出力は、デコーダへ送出される固定長および可変長（エントロピー制約ＷＵＨＶＱ）のインデックスを出力する。デコーダは、異なるテーブルに対して最後の段のコードブックのコピーを有し、受信した付帯的情報に基づいて選択されたコードブックから対応するコードワードを出力するために最後の段の対するインデックスを使う。ＷＵＨＶＱはＨＶＱテーブルの複数のセットを有する。ＷＵＨＶＱの設計はまた２つの主なステップからなる。第１のステップは、ＨＶＱあるいはＥＣＨＶＱに関してのように各段に対してＷＵＶＱコードブックを設計する。各コードブックを作成した後、対応するＨＶＱテーブルは、ＨＶＱあるいはＥＣＨＶＱにおけるときのようにＨＶＱテーブルの各セットについて各段に対して作成される。種々のＨＶＱアルゴリズムに対してシミュレーション結果が得られている。図４〜８は、種々のアルゴリズムに対して、ビットレートの関数として、８ビット単色画像Lena（５１２×５１２）についてのＰＳＮＲ（ピーク信号雑音比:peak signal-noise-ratio）結果を表わす。ＶＱに対するコードブックは１０個の異なる画像でのトレーニングによって生成される。ＰＳＮＲ結果は重み付けられていないＶＱに対して与えられる。重み付けは、圧縮画像の主観的品質を著しく改善するにもかかわらず、ＰＳＮＲを減少させる。しかし、主観的な歪み手法を使うことによってＰＳＮＲが約２ｄＢに等しいゲインとなることに注意すべきである。図４は、どんどん成長した後に剪定された、可変レートのツリー構造階層形ベクトル量子化（ＶＲＴＳＨＶＱ）に対するLenaについてのＰＨＶＱ結果を表わす。この結果は最後の段がツリー構造であるような４×４のブロックについてである。ＶＲＴＳＨＶＱは最後の段で組込み形コードを与える。そのうえＶＲＴＳＨＶＱはＨＶＱよりも増している。そのうえ非階層形可変レートのツリー構造テーブルベースのベクトル量子化ＶＲＴＳＶＱと比較して約０．５〜０．７ｄＢの損失がある。図５は、普通のＶＱおよび普通のＨＶＱについて異なるビットレートに対する LenaについてのＰＨＶＱ結果を表わす。この結果は４×４のブロックについてである。ＨＶＱは全探索ＶＱよりも約０．５〜０．７ｄＢ悪く動作することが分かる。図４は、最後の段で２５６個のコードワードを有するエントロピー制約のＨＶＱ（ＥＣＨＶＱ）に対するLenaについてのＰＨＶＱ結果を表わす。この結果は、ＥＣＨＶＱの始めの３つの段が固定レートで最後の段が可変レートであるような４×４のブロックについてである。ＥＣＨＶＱがＨＶＱよりも約１．５ｄＢ増していることが分かる。しかしそのうえＥＣＶＱと比較して約０．５〜０．７ｄＢの損失がある。分類ＨＶＱは、レート歪みについてＨＶＱよりもわずかに悪く動作するが、各クラスに対してより小さいコードブックを使うことによって、複雑さ（エンコードおよび記憶）がより低くなるという利点を有する。そのうえプロダクトＨＶＱ (Product HVQ)は、レート歪みの複雑さにおいてＨＶＱと比較してわずかだけ悪く動作するが、入力ベクトルをより小さいサブベクトルへ仕分け、かつより小さいＨＶＱテーブルのセットを使ってそれらのうちひとつをエンコードするので、ＨＶＱと比較してより一層小さいエンコードおよび記憶の複雑さを有する。そのうえ平均除去ＨＶＱ（ＭＲＨＶＱ）は、レート歪みについてＨＶＱと比較して悪く動作するが、ＨＶＱ構造を使ってより高いレートでより高次元のベクトルをコーディングすることができる。図６は、階層形ＨＶＱ（Ｈ−ＨＶＱ）に対するLenaについてのＰＨＶＱ結果を表わす。この結果は２段のＨ−ＨＶＱについてである。第１段は８×８のブロックで動作し、ＨＶＱを使って８ビットにコーディングされる。第２の段では、残差が別のＨＶＱテーブルのセットを使って再びコーディングされる。図11は、第２段Ｈ−ＨＶＱ（各段が８ビットにコーディングされる）の異なる段での結果を示す。固定レートのＨ−ＨＶＱは、ほとんどのレートにおいて固定レートのＨＶＱよりも約０．５〜１ｄＢ増している。多段ＨＶＱ（ＭＳＨＶＱ）は、第２段がオリジナルのブロックサイズにコーディングされるようなＨ−ＨＶＱと一致している。このように、ＭＳＨＶＱの性能が図11からまたわかる。そのうえ全探索Shoham-GershoHVQの結果と比較して約０．５〜０．７ｄＢの損失がある。図７は、最後の段で２５６個のコードワードを有するエントロピー制約の予測ＨＶＱ（ＥＣＰＨＶＱ）に対するLenaについてのＰＨＶＱ結果を表わす。この結果は、ＥＣＰＨＶＱの始めの３つの段が固定レートで最後の段が可変レートであるような４×４のブロックについてである。ＥＣＰＨＶＱが、固定レートのＨＶＱよりも約２．５ｄＢ、ＥＣＨＶＱよりも１ｄＢ増していることが分かる。しかしそのうえＥＣＰＶＱと比較して約０．５〜０．７ｄＢの損失がある。図８は、エントロピー制約の重み付けられた普遍的なＨＶＱ（ＥＣＷＵＨＶＱ）に対するLenaについてのＰＨＶＱ結果を表わす。スーパーベクトルがこれらのシミュレーションに対して16×16のブロックであり、より小さいブロックは４× ４である。２５６個の４×４コードワードをそれぞれ有する６４コードブックが存在する。ＥＣＷＵＨＶＱが、固定レートのＨＶＱよりも約３ｄＢ、ＥＣＨＶＱよりも１．５ｄＢ増していることが分かる。しかしそのうえＷＵＶＱと比較して約０．５〜０．７ｄＢの損失がある。変換ＨＶＱおよび普通のＨＶＱのエンコード時間は同じである。Sparc-10ワークステーション上で、第１段のエンコードに対しては１２ｍｓ、始めの２つの段に対しては２４ｍｓ、５１２×５１２画像のエンコードの始めの４つの段に対しては３０ｍｓの時間がかかる。一方で、ＪＰＥＧは、類似の圧縮比において、エンコードに２５０ｍｓ必要としている。制約および帰納的なＨＶＱのエンコードの複雑さは、普通のＨＶＱと比較して２〜８の因子によって増加する。ＨＶＱベースのエンコーダは、これらの対応する全探索ＶＱエンコーダよりも５０〜１００倍速い。同様に、変換ＨＶＱ，普通のＨＶＱ，普通のＶＱ，および変換ＶＱのデコード時間は同じである。Sparc-10ワークステーション上で、２：１の圧縮画像のデコードに対しては１３ｍｓ、４：１の圧縮画像のデコードに対しては１６ｍｓ、１６：１の圧縮された５１２×５１２の画像のデコードに対しては６ｍｓの時間がかかっている。一方でＪＰＥＧは、類似の圧縮比において、デコードに２００ｍｓ必要としている。制約および帰納的なＨＶＱのエンコードの複雑さは、ＨＶＱのそれと比較してそれほど増加しない。それゆえ、ＨＶＱベースのデコーダは、ＪＰＥＧのデコーダよりも２０〜３０倍速い。変換ＶＱのデコード時間は、変換がデコーダテーブルで予め計算され得るので普通のＶＱのデコード時間と同じである。したがって手短に述べると、制約および帰納的なＨＶＱ構造は固定レートのメモリのないＶＱの問題点を克服する。これらのアルゴリズムの主な利点は、対応するＶＱ構造と比較して計算の複雑さがとても低いということである。エントロピー制約のＨＶＱは、可変レートのコードを与え、ＨＶＱよりも良好に動作する。ツリー構造ＨＶＱは、組込み形のコードを与え、ＨＶＱよりも良好に動作する。分類ＨＶＱ，プロダクトＨＶＱ，平均除去ＨＶＱ，多段ＨＶＱ，階層形ＨＶＱ，および非線形の補間ＨＶＱは、非制約ＶＱの複雑性についての問題点を克服すし、より高度のベクトル次元を利用できるよ４うにし、より高いレートを得る。予測ＨＶＱは、一層小さいコードブックを使いながら大きなコードブックを有するメモリのないＶＱの性能を得る。ベクトル相互の相関関数を利用することによって、より良好なレート‐歪み性能が得られる。そのうえに、重み付けられた普遍的なＨＶＱは、レート‐歪みに関してＨＶＱよりも非常に増している。主観的な歪み手法を有するこれらアルゴリズム（例えばＰＨＶＱ，ＷＵＨＶＱ）のさらにいくつかは、より低いデコードの複雑さで、レート‐歪みにおいてＪＰＥＧに対してより良好あるいは同等に動作する。上で示したように、制約および帰納的なベクトル量子化器のエンコーダは、テーブルルックアップによって実現された。これらベクトル量子化器は、エントロピー制約ＶＱ，ツリー構造ＶＱ，分類ＶＱ，プロダクトＶＱ，平均除去ＶＱ，多段ＶＱ，階層形ＶＱ，非線形の補間ＶＱ，予測ＶＱ，および重み付けられた普遍的なＶＱを有する。われわれのアルゴリズムは、これら種々のＶＱ構造を階層形ルックアップテーブルベクトル量子化に結合する。これらの結合はオリジナルのＶＱ構造の複雑さを非常に少なくする。また知覚による有意義な歪み手法を、任意の変換の係数を重み付けることに基づいてＨＶＱに統合する。本質的には、変換は予め計算され、エンコーダおよびデコーダのルックアップテーブルに入れられる。それゆえ、テーブルルックアップのエンコードおよびデコードの計算は簡単のままに変換コーディングの知覚による利点を得る。好適な実施例に対するこれらおよびその他の修正例および変形例は、本発明によって提供され、その範囲は以下の請求項によって定義される。

───────────────────────────────────────────────────── フロントページの続き (81)指定国ＥＰ(ＡＴ，ＢＥ，ＣＨ，ＤＥ，ＤＫ，ＥＳ，ＦＩ，ＦＲ，ＧＢ，ＧＲ，ＩＥ，ＩＴ，ＬＵ，ＭＣ，ＮＬ，ＰＴ，ＳＥ)，ＯＡ(ＢＦ，ＢＪ，ＣＦ，ＣＧ，ＣＩ，ＣＭ，ＧＡ，ＧＮ，ＭＬ，ＭＲ，ＮＥ，ＳＮ，ＴＤ，ＴＧ)，ＡＰ(ＧＨ，ＫＥ，ＬＳ，ＭＷ，ＳＤ，ＳＺ，ＵＧ)，ＵＡ(ＡＭ，ＡＺ，ＢＹ，ＫＧ，ＫＺ，ＭＤ，ＲＵ，ＴＪ，ＴＭ)，ＡＬ，ＡＭ，ＡＴ，ＡＵ，ＡＺ，ＢＡ，ＢＢ，ＢＧ，ＢＲ，ＢＹ，ＣＡ，ＣＨ，ＣＮ，ＣＵ，ＣＺ，ＤＥ，ＤＫ，ＥＥ，ＥＳ，ＦＩ，ＧＢ，ＧＥ，ＧＨ，ＨＵ，ＩＬ，ＩＳ，ＪＰ，ＫＥ，ＫＧ，ＫＰ，ＫＲ，ＫＺ，ＬＣ，ＬＫ，ＬＲ，ＬＳ，ＬＴ，ＬＵ，ＬＶ，ＭＤ，ＭＧ，ＭＫ，ＭＮ，ＭＷ，ＭＸ，ＮＯ，ＮＺ，ＰＬ，ＰＴ，ＲＯ，ＲＵ，ＳＤ，ＳＥ，ＳＧ，ＳＩ，ＳＫ，ＴＪ，ＴＭ，ＴＲ，ＴＴ，ＵＡ，ＵＧ，ＵＳ，ＵＺ，ＶＮ，ＹＵ

Claims

【特許請求の範囲】１．データを別個のベクトルのセットから選択されたデータベクトルのセットに変換するためのベクトライザと、前記別個のベクトルを組込み形コードのセットに、前記コードのうちの１つが前記データベクトルのそれぞれに応答して生成されるように写像させるルックアップテーブルであって、前記データベクトル変換を受信するための前記ベクトライザに結合されているような前記ルックアップテーブルと、を備えるデータ圧縮システム。２．前記組込み形コードのセットは、異なる長さのコードを有する請求項１に記載のデータ圧縮システム。３．前記組込み形コードのセットは前記コードの複数のサブセットを有し、前記サブセットのうちの２つは前記コードと同じ番号は有すさず、前記ルックアップテーブルは複数の出力を有し、前記ルックアップテーブルは、前記複数の出力のそれぞれ１つからの前記画像のベクトルのそれぞれについて各サブセットからコードを出力する請求項１に記載のデータ圧縮システム。４．最終コードブックベクトルのセットを含む最終コードブックを決定するためにルックアップテーブルの最終段に対してツリー構造コードブックを設計するステップであって、最終インデックスのセットが前記最終コードブックベクトルのセットに写像されるようなステップと、テーブルアドレスとして入力ベクトルの結合のセットを使って前記ルックアップテーブルに挿入し、前記最終コードブックベクトルのそれぞれ対する入力ベクトルの前記結合のそれぞれの近似に基づいて前記最終インデックスを前記アドレスに割り振るステップと、を含むデータ圧縮システムを設計する方法。５．前記最終コードブックは、接続歪みおよびエントロピー基準によって形成されるツリー構造を有する請求項４に記載の方法。６．前記設計するステップは、一連のツリーを定義するために、歪みおよびエントロピーの接続制約に従うツリー構造コードブックをノード毎にどんどん成長させその後剪定することを伴い、そこでは、先輩ツリーを有する各ツリーは、２つの付加的なノードを有する点で先輩ツリーと異なり、前記ツリーのそれぞれは、前記各ツリーの子ノードに対応するコードブックベクトルのそれぞれのコードブックを有し、前記コードブックのそれぞれは、第１の組込み形コードのセットと第２の組込み形コードのセットとを有する組込み形コードの各セットを有し、前記挿入するステップは、前記第１のセットからのコードと前記第２のセットからのコードとを、入力ベクトルの前記結合のそれぞれに割り振ることを伴う、請求項４に記載の方法。７．ブロック変換領域において歪み手法を最小にするためにコードブックベクトルを選択するためのステップを含むデータ圧縮テーブルを設計するコンピュータ方法。８．前記歪み手法は知覚的に重み付けられる請求項７に記載の方法。９．インデックスを前記コードブックベクトルに割り振るステップと、前記インデックスを、前記コードブックベクトルに対する前記結合のそれぞれの近似に基づいて画像ベクトル入力の結合に割り振るステップであって、前記近似は、前記歪み手法よりも重み付けられない近似手法により判定されるようなステップと、をさらに備える請求項８に記載の方法。１０．請求項７に記載の方法によって設計されるデータ圧縮テーブルを含む画像圧縮システム。１１．請求項９に記載の方法によって設計されるデータ圧縮テーブルを含む画像圧縮システム。１２．画像を画像ベクトルに変換するためのベクトライザであって、各画像ベクトルは、前記画像の画素の相互に占有的であるものうちのそれぞれ１つを表わすようなベクトライザと、前記画像ベクトルのそれぞれをコードブックベクトルに対する前記画像ベクトルのブロック変換の近似手法の関数であるインデックスに写像するためのテーブル手段と、を備える画像圧縮システム。１３．構造ベクトル量子化に対してコードブック設計手段とを使ってコードブックベクトルを設計するステップを含むデータ圧縮テーブルのコンピュータ方法。１４．請求項１３の方法により設計されるベクトル量子化テーブルを含む画像圧縮システム。１５．エントロピーおよび歪みの接続手法を使ってコードブックを設計するステップを含むベクトル量子化テーブルを設計するコンピュータ方法。１６．請求項１５の方法により設計されるベクトル量子化テーブルを含む画像圧縮システム。１７．画像をベクトルに変換するためのベクトライザと、どんな固定長コードよりも与えられた歪み手法に対して高いビットレートを提供する可変長コードを出力するベクトル量子化テーブルと、を備える画像圧縮システム。１８．重み付けされた歪み手法を使ってコードブックを設計するステップと、前記歪み手法より重み付けされない近似手法を使ってテーブル入力を前記コードブックに割り振るステップと、を含む画像圧縮テーブルを設計する方法。１９．請求項１７の方法を使って設計される画像圧縮テーブルを含む画像圧縮システム。２０．歪みを最小にする制約と比較して歪みを最小にする他の制約を連帯的に使って最終段のテーブルに対するコードブックを設計するステップを含む、階層形データ圧縮テーブルを設計するコンピュータ方法。２１．請求項２０の方法により設計される階層形データ圧縮テーブルを含む画像圧縮システム。２２．前記制約は予備的な段のテーブルに対してコードブックを設計するためには使われない請求項２１に記載のコンピュータ方法。２３．最終段のテーブルのコードブックが歪みおよび他の制約を有する接続手法を最小にするような階層形ベクトル量子化を有する画像圧縮システム。２４．付加的な制約に従わないで歪みを最小にする予備的な段のコードブックを有する請求項２３に記載の画像圧縮システム。２５．画像を画像ベクトルに変換するためのベクトル化手段と、前記ベクトルを組込み形テーブルに変換するためのテーブル手段であって、該テーブル手段は前記画像ベクトルを受信するためのアドレス入力手段を有し、前記アドレス入力手段は前記ベクトル化手段に結合されるようなテーブル手段と、を備える画像圧縮システム。２６．前記テーブル手段は多段を有し、該多段は、前記ベクトルを受信するための前記ベクトル化手段に結合される入力を有し、前記多段は、前記組込み形コードを出力するための最終段を有し、前記第１の段の他に前記多段のそれぞれが、前記多段の先行する１つからの出力を受信するための入力を有する請求項２４に記載の画像圧縮システム。２７．ディジタル画像を一連の画像ベクトルに変換するためのベクトル化手段であって、前記画像ベクトルのそれぞれは、画素空間において定義された画像ベクトルのセットから選択され、前記一連の前記画像ベクトルのそれぞれは、前記ディジタル画像を集合的に構成する相互に占有されたブロックのセットのそれぞれ１つを表わすようなベクトル化手段と、前記セットの多数対１の前記画像ベクトルをインデックスのセットからのインデックスに多数対１に写像させるためのテーブル手段であって、前記インデックスのそれぞれは、非画素領域においてベクトルを生成するためにデコード可能であるようなテーブル手段と、を備える画像圧縮システム。