JP2005517316A

JP2005517316A - 構成可能なパターン最適化器

Info

Publication number: JP2005517316A
Application number: JP2003506213A
Authority: JP
Inventors: ゴビンダスワミイ、センスィル; スヤガラジャン、カダヤム; レビン、ジェフレイ・エー
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 2001-06-15
Filing date: 2002-06-13
Publication date: 2005-06-09
Also published as: KR20040010722A; WO2002104039A1; US6870963B2; AU2002315160B2; HK1166429A1; CA2450733A1; KR100932412B1; CN1593064A; AU2002315160C1; ES2584035T3; US20030007698A1; EP1405524A1; CN102238389A; MXPA03011623A; BR0210418A; EP2405657A1; EP2405657B1; EP1405524B1; CA2450733C

Abstract

【課題】構成可能なパターン最適化器
【解決手段】ディジタルシネマシステムにおいて周波数ベースの画像データを直列化するための装置および方法が開示されている。１６×１６データブロックで表すことが可能な少なくとも一つのデータグループがコンパイルされる。あるいはまた、データフレームがコンパイルされる。データグループは４個のグループに分割され、各々は８×８ブロックで表すことが可能である。４個の８×８データブロックの各々は、ジグザグ走査、垂直走査、および／または水平走査を使用して直列化される。

Description

本発明は画像処理および圧縮に関する。より具体的には、本発明は圧縮画像用の構成可能なパターン最適化器に関する。

ディジタルピクチャ処理は、ディジタル信号処理の一般原理において重要な地位を占めている。人間の視覚認知の重要性は、ディジタルピクチャ処理の分野における多くの関心および発達を促進してきた。フィルムや動画を写すのに使用されるような、ビデオ信号の送受信の分野における画像圧縮技術に対して種々の改良がなされている。現在提案されているビデオシステムの多くはディジタル符号化技術を利用している。この分野の態様は、画像符号化、画像復元、および画像特徴選択を含んでいる。画像符号化は、必要な帯域を最小化できる程度のビットを利用して、ディジタル通信チャネルのピクチャを効率的に送信すると同時に、一定の制限内に歪みを維持しようとするものである。画像復元は、オブジェクトの正確な画像を復元しようとするものである。通信チャネル上で送信されている符号化画像は種々の要因によって歪みが生じていた。劣化の原因は元々、オブジェクトから画像を作成する際に生じていた。特徴選択とはピクチャの特定の属性の選択のことである。このような属性はより広い意味で、認識、分類、および判断において必要とされる。

デジタルカメラなどでのビデオのディジタル符号化は、改良された画像圧縮技術に恩恵を受けている分野である。ディジタル画像圧縮は一般的に、非損失性方法および損失性方法の２つのカテゴリに分類することができる。非損失性画像は情報の損失なく復元される。損失性方法は、圧縮比、圧縮アルゴリズムの品質、およびアルゴリズムの実現によっては、一部の情報について復元不可能な損失を伴っている。一般的に、損失性圧縮アプローチは費用効果的なディジタルシネマアプローチに望まれる圧縮比を得ると考えられている。ディジタルシネマの品質レベルを得るためには、圧縮アプローチは視覚的に損失のないレベルの性能を提供すべきである。従って、圧縮プロセスの結果として情報の数学的損失はあるが、この損失による画像の歪みは通常の閲覧条件下では閲覧者には知覚されないはずである。

既存のディジタル画像圧縮技術は他のアプリケーション、すなわちテレビシステムに対して開発されてきた。このような技術は目的のアプリケーションにふさわしい設計的な妥協をしてきたが、シネマ表示に必要な品質要件を満たしていない。

ディジタルシネマ圧縮技術は、映画ファンがすでに体験している視覚的品質を提供すべきである。理想的には、ディジタルシネマの視覚的品質は、高品質の公開版フィルムを超えることを目的とすべきである。同時に、圧縮技術は実用的な、高い符号化効率を有するべきである。ここに定義されているように、符号化効率とは、一定の品質レベルを満たすために、圧縮画像品質に必要なビットレートのことである。さらに、システムおよび符号化技術は異なるフォーマットに対応するための柔軟性を内蔵し、かつ費用効果的な、すなわち小型かつ効率のよい復号化または符号化プロセスであるべきである。

多数の使用可能な圧縮技術が相当な圧縮レベルを提供しているが、ビデオ信号の品質低下を招いている。一般的に、圧縮情報を送信するための技術は、圧縮情報が一定のビットレートで送信されることを要する。

ビデオ信号に所望の品質レベルを維持しつつ、相当な圧縮レベルを提供できる圧縮技術は、符号化離散コサイン変換（ＤＣＴ）係数データの適応サイズのブロックよびサブブロックを利用している。この技術は以下に、適応ブロックサイズによる離散コサイン変換（ＡＢＳＤＣＴ）方法と称される。この技術は、本発明の譲受人に譲渡され、かつ参照してここに組み込まれている、「適応ブロックサイズによる画像圧縮方法およびシステム（ＡｄａｐｔｉｖｅＢｌｏｃｋＳｉｚｅＩｍａｇｅＣｏｍｐｒｅｓｓｉｏｎＭｅｔｈｏｄａｎｄＳｙｓｔｅｍ）」と題された、米国特許第５，０２１，８９１号に開示されている。ＤＣＴ技術はまた、本発明の譲受人に譲渡され、かつ参照してここに組み込まれている、「適応ブロックサイズによる画像圧縮方法およびシステム（ＡｄａｐｔｉｖｅＢｌｏｃｋＳｉｚｅＩｍａｇｅＣｏｍｐｒｅｓｓｉｏｎＭｅｔｈｏｄａｎｄＳｙｓｔｅｍ）」と題された、米国特許第５，１０７，３４５号に開示されている。さらに、差分カッドツリー変換（ＤｉｆｆｅｒｅｎｔｉａｌＱｕａｄｔｒｅｅＴｒａｎｓｆｏｒｍ）技術と組み合わせたＡＢＳＤＣＴ技術の使用は、これもまた本発明の譲受人に譲渡され、かつ参照してここに組み込まれている、「適応ブロックサイズによる画像圧縮方法およびシステム（ＡｄａｐｔｉｖｅＢｌｏｃｋＳｉｚｅＩｍａｇｅＣｏｍｐｒｅｓｓｉｏｎＭｅｔｈｏｄａｎｄＳｙｓｔｅｍ）」と題された、米国特許第５，４５２，１０４号に説明されている。これらの特許に開示されているシステムは、画像データの各フレームが他のフレームのコンテンツに関係なく符号化される、「イントラフレーム」符号化と称されるものを利用している。ＡＢＳＤＣＴ技術を使用すると、取得可能なデータレートは、目に見える画像品質の劣化なしに、毎秒約１５億ビットから毎秒約５０００万ビットに減少することが可能である。

ＡＢＳＤＣＴ技術を使用して、白黒画像、あるいはカラー画像または画像を表す信号のいずれかを圧縮することができる。カラー入力信号はＹＩＱフォーマットであってもよく、Ｙは輝度、すなわち明度サンプルであり、ＩおよびＱは４×４画素ブロックごとの色度、すなわちカラーサンプルである。ＹＵＶ、ＹＣ_ｂＣ_ｙ、またはＲＧＢフォーマットなどの他の既知のフォーマットもまた使用することができる。色に対する目の空間感覚は低いため、多くの研究は、垂直および水平方向における係数４によるカラー成分のサブサンプルが理想的であることを示している。従って、ビデオ信号は４つの輝度成分と２つの色度成分によって表すことができる。

ＡＢＳＤＣＴを使用して、ビデオ信号は一般的に処理用に画素ブロックに分割される。ブロックごとに、輝度および色度成分がブロックインタリーバに渡される。例えば、１６×１６（画素）ブロックがブロックインタリーバに提供されてもよく、これは各１６×１６ブロック内で画像サンプルを配列または編成し、ブロックを生成して、離散コサイン変換（ＤＣＴ）分析用のデータのサブブロックを複合する。ＤＣＴ演算子は、時間／空間サンプル信号を同じ信号の周波数表示に変換するための方法である。周波数表示に変換することによって、ＤＣＴ技術は、量子化器が画像の周波数分布特徴を利用するように設計可能なように、非常に高レベルの圧縮を見込んでいると示されている。好ましい実施形態において、１個の１６×１６ＤＣＴが第一の配列に適用され、４個の８×８ＤＣＴが第二の配列に適用され、１６個の４×４ＤＣＴが第三の配列に適用され、そして６４個の２×２ＤＣＴが第四の配列に使用される。

ＤＣＴ動作はビデオソースに固有の空間冗長性を減少させる。ＤＣＴが実行された後、ビデオ信号エネルギーの多くは少数のＤＣＴ係数に集中しやすい。別の変換である、差分カッドツリー変換（ＤＱＴ）を使用して、ＤＣＴ係数間の冗長性を減少させることができる。

１６×１６ブロックと各サブブロックについて、ＤＣＴ係数値と（ＤＱＴが使用される場合には）ＤＱＴ値を分析して、ブロックやサブブロックを符号化するのに必要なビット数を判断する。そして、符号化に最小のビット数でよいブロックまたはサブブロックの組み合わせが選択されて、画像セグメントを表す。例えば、２個の８×８サブブロックと、６個の４×４サブブロックと、８個の２×２サブブロックが選択されて、画像セグメントを表すことができる。

選択されたブロック、またはサブブロックの組み合わせは、１６×１６ブロックに適切に配列される。ＤＣＴ／ＤＱＴ係数値は、送信用に周波数重み付け、量子化、および（可変長符号化）などの符号化を実行してもよい。上記のＡＢＳＤＣＴ技術は極めて良好に機能するが、計算的に集中してしまう。従って、この技術のコンパクトなハードウェアの実現は困難であろう。

可変長符号化は、ランレングス(run length)およびサイズの形態で実行されてきた。ジョイント・フォトグラフィック・エキスパーツ・グループ（ＪｏｉｎｔＰｈｏｔｏｇｒａｐｈｉｃＥｘｐｅｒｔｓＧｒｏｕｐ）（ＪＰＥＧ）やムービング・ピクチャ・エキスパーツ・グループ（ＭｏｖｉｎｇＰｉｃｔｕｒｅＥｘｐｅｒｔｓＧｒｏｕｐ）（ＭＰＥＧ−２）などの他の圧縮方法は、処理ブロックサイズ全体において標準ジグザグ走査方法を使用している。しかしながら、ＡＢＳＤＣＴを使用して、異なるブロックサイズがデータブロック内の分散に基づいて生成される。従って、標準ジグザグ走査方法は必ずしも処理ブロックサイズ全体に最適であるわけではない。さらに、各ブロックサイズに対する標準ジグザグ走査方法はハードウェアでの実現が困難である。さらに、ジグザグパターンは必ずしも所与のブロックやフレームに対して最適なパターンではない。従って、最適パターンを判断するための方法および装置が必要となる。

本発明の実施形態は、最適パターン判断のための装置および方法を提供する。一実施形態において、最適パターンはフレーム単位で構成可能である。別の実施形態においては、所定のブロックサイズのデフォルトパターンが、適応ブロックサイズによる離散コサイン変換(discrete cosine transform)（ＡＢＳＤＣＴ）技術によって決定されるような実際のブロックサイズに関係なく使用される。

本発明は、離散コサイン変換係数データおよび品質に基づく量子化スケール係数の適応サイズブロックとサブブロックとを利用する、画像圧縮用の品質に基づくシステムおよび方法である。画素データ(pixel data)のブロックは符号器に入力される。符号器は、入力された画素ブロックを処理するために分割するブロックサイズ割当(a block size assignment)（ＢＳＡ）要素を備えている。ブロックサイズ割当は入力ブロックおよびさらなる再分割ブロックの分散に基づいている。一般的に、ブロックおよびサブブロックの平均値が異なる所定の範囲にある場合、分散の大きい領域はより小さなブロックに再分割され、分散の小さい領域は再分割されない。従って、まずブロックの分散閾値がその平均値によるその名目値から修正され、次いでブロックの分散が閾値と比較され、分散が閾値より大きい場合ブロックは再分割される。

ブロックサイズ割当が、画素データを周波数ドメインデータ(frequency domain data)に変換する変換要素に提供される。変換は、ブロックサイズ割当によって選択されたブロックおよびサブブロックに対してのみ実行される。そして、変換データは量子化および直列化(serialization)によってスケーリングを実行する。変換データの量子化は、コントラスト、係数カウント、レート歪み、ブロックサイズ割当の密度、および／または過去のスケール係数に関して調整するスケール係数などの画像品質基準に基づいて実行される。直列化は同一の値の可能な最長ランレングスの生成に基づいている。一実施形態において、固定ブロックサイズでのジグザグ走査を利用して、ブロックサイズ割当に関係なくデータを直列化してデータストリームを生成する。別の実施形態においては、ブロックサイズは８×８である。データストリームは送信用に可変長符号器によって符号化されてもよい。符号化データは送信チャネルを介して復号器に送信され、ここで画素データは表示用に再構成される。

別の実施形態において、デジタルカメラシステムにおいて周波数ベースの画像データを直列化するための方法を説明する。１６×１６データブロックで表すことができる少なくとも一つのデータグループがコンパイルされる。あるいはまた、データフレームがコンパイルされる。データグループは４個のグループに分割され、各々は８×８ブロックで表されてもよい。４個の８×８データブロックの各々は、ジグザグ走査、垂直走査、および／または水平走査を使用して直列化される。

従って、実施形態の一態様は、実際のブロックサイズ割当に関係なく、８×８ブロックでの走査の固定パターンを使用してデータブロックを処理することである。

実施形態の別の態様は、フレーム単位の最適走査技術を判断し、実行することである。

実施形態の別の態様は、ユーザに構成可能な走査パターンを提供することである。

本発明の特徴および利点は以下の図面と関連してなされる詳細な説明からより明らかとなる。同一の参照番号は図面全体にわたって対応部分を示している。

好ましい実施の形態の詳細な説明

ディジタル信号のディジタル送信を容易にし、かつ相当の利益を享受するために、一般的に信号圧縮の複数の形態を採用することが必要である。生じた画像の高圧縮を得るためには、画像の高品質が維持されることもまた重要である。さらに、コンパクトな計算効率のハードウェアの実現に望まれ、これは多数のアプリケーションにおいて重要である。

本発明の一実施形態を詳細に説明する前に、本発明は、そのアプリケーションにおいて以下に説明および図示される構成要素の構成および配置の詳細に限定されないことを理解すべきである。本発明は他の実施形態も可能であり、種々の方法で実行される。また、ここで使用されている表現および専門用語は説明目的のためであり、限定とみなされるべきではない。

一実施形態の態様において用いられる画像圧縮は、本発明の譲受人に譲渡され、かつ参照してここに組み込まれている、１９９９年１１月８日に出願された、「一定の感度分散に基づく適応ブロックサイズによるＤＣＴ画像圧縮（ＣｏｎｓｔａｎｔＳｅｎｓｉｔｉｖｅＶａｒｉａｎｃｅＢａｓｅｄＡｄａｐｔｉｖｅＢｌｏｃｋＳｉｚｅＤＣＴＩｍａｇｅＣｏｍｐｒｅｓｓｉｏｎ）」という、同時係属の米国特許出願第０９／４３６，０８５号に開示されるような離散コサイン変換（ＤＣＴ）技術に基づいている。一般的に、ディジタルドメインで処理される画像は、Ｎ×Ｎサイズの非重複ブロックアレイに分割された画素データからなる。二次元ＤＣＴが各ブロックで実行されてもよい。二次元ＤＣＴは以下の関係によって定義される：

ここで、

及び、ｘ（ｍ，ｎ）はＭ×Ｍブロック内の位置（ｍ，ｎ）の画素であり、
Ｘ（ｋ，ｌ）は対応するＤＣＴ係数である。

画素値は負ではないので、ＤＣＴ成分Ｘ（０，０）は常に正であり、常に最大エネルギーを有する。実際、一般的な画像については、変換エネルギーの大半が成分Ｘ（０，０）付近に集中している。このエネルギー圧縮特徴によって、ＤＣＴ技術は非常に魅力的な圧縮方法となっている。

画像圧縮技術はコントラスト適応符号化を利用して、更なるビットレートの減少を実現する。多くの自然画像が比較的ゆっくり変化する平らな領域と、オブジェクトの境界およびハイコントラストテクスチャなどの込み入った領域とで形成されていることが分かっている。コントラスト適応符号化スキームは、込み入った領域に多数のビットを、またそれほど込み入っていない領域には少数のビットを割り当てることによってこの要因をうまく活用している。

コントラスト適応方法は、インターフレーム符号化(interframe coding)（時空処理(spatio-temporal processing)）ではなく、イントラフレーム符号化(intraframe coding)（空間処理）を利用する。インターフレーム符号化は本質的に、多数の複雑な処理回路に加えて多数のフレームバッファを必要とする。多数のアプリケーションにおいて、複雑さの減少は実行に必要である。イントラフレーム符号化はまた、時空符号化スキームが正常に機能せず、うまく行かない状況において有用である。例えば、毎秒２４個のフレームの動画は、機械的シャッターによる積分時間(integration time)が比較的短いため、このカテゴリに入る。短い積分時間はより高い時間エリアシング度(aliasing)を許容する。フレーム対フレームの相関の前提は、それが発作性になると、速い動きに対して正常に機能しない。イントラフレーム符号化はまた、５０Ｈｚおよび６０Ｈｚの電力ライン周波数の双方を伴う場合には、標準化するのがより容易である。現在テレビは５０Ｈｚと６０Ｈｚのいずれかで信号を送信している。ディジタルアプローチであるイントラフレームスキームの使用は、フレームレートと空間解像度を交換することによって、５０Ｈｚおよび６０Ｈｚの動作の双方に、または毎秒２４個のフレームの動画にさえも適応可能である。

画像処理目的のため、ＤＣＴ動作は非重複ブロックアレイに分割されている画素データで実行される。ブロックサイズはここではＮ×Ｎサイズとして論じられているが、種々のブロックサイズの使用が想定されていることに注目すべきである。例えば、Ｎ×Ｍブロックサイズを使用することができる（ここでＮおよびＭの両方とも整数であり、ＭはＮより大きくても小さくてもよい）。別の重要な態様は、ブロックが、Ｎ／ｉｘＮ／ｉ、Ｎ／ｉｘＮ／ｊ、Ｎ／ｉｘＭ／ｊなどの（ここでｉおよびｊは整数である）少なくとも一つのサブブロックレベルに分割されることである。さらに、ここで論じられている例示的ブロックサイズは、ＤＣＴ係数の対応するブロックおよびサブブロックを有する１６×１６画素ブロックである。奇数および偶数の値の両方の、他の種々の整数の使用、例えば９×９がさらに想定されている。

図１および２は、構成可能な直列化器の概念を組み込んでいる画像処理システム１００を示している。画像処理システム１００は、受信ビデオ信号を圧縮する符号器１０４を備えている。圧縮信号は送信チャネル、すなわち物理的媒体１０８を使用して送信され、復号器１１２によって受信される。復号器１１２は受信した符号化データを画像サンプルに復号化し、その後これは表示されてもよい。

一般的に、画像は処理用に画素ブロックに分割される。カラー信号はＲＢＧ／ＹＣ_１Ｃ_２コンバータ１１６を使用してＲＧＢ空間からＹＣ_１Ｃ_２空間に変換されることが可能であり、この場合、Ｙは輝度すなわち明度成分であり、Ｃ_１およびＣ_２は色度すなわちカラー成分である。色に対する目の空間感度は低いため、多数のシステムがＣ_１およびＣ_２成分を垂直および水平方向における係数４によってサブサンプリングする。しかしながら、サブサンプリングは不要である。４：４：４フォーマットとして既知の最大解像度画像は、「ディジタルシネマ」をカバーすると言われるような一部のアプリケーションにおいては非常に有用、あるいは必要であろう。２つの可能なＹＣ_１Ｃ_２表示は、双方とも当業界において既知である、ＹＩＱ表示およびＹＵＶ表示である。ＹＣｂＣｒとして知られているＹＵＶ表示の変形を用いることも可能である。これはさらに、奇数および偶数成分に分割されてもよい。従って、実施形態において、表示Ｙ−偶数、Ｙ−奇数、Ｃｂ−偶数、Ｃｂ−奇数、Ｃｒ−偶数、Ｃｒ−奇数が使用される。

好ましい実施形態において、偶数および奇数のＹ、Ｃｂ、およびＣｒ成分の各々はサブサンプリングなしで処理される。従って、１６×１６画素ブロックの６つの成分の各々の入力は符号器１０４に提供される。図示目的のために、Ｙ−偶数成分に対する符号器１０４が示されている。同様の符号器がＹ−奇数成分と、偶数および奇数のＣｂおよびＣｒ成分に使用される。符号器１０４はブロックサイズ割当要素１２０を備えており、これはビデオ圧縮用にブロックサイズ割当を実行する。ブロックサイズ割当要素１２０は、ブロックの画像の視覚的特徴に基づいて１６×１６ブロックのブロック分解を判断する。ブロックサイズ割当は各１６×１６ブロックを、１６×１６ブロック内の動きによってカッドツリー方式(a quad-tree fashion)で、８×８、４×４、および２×２などのより小さいブロックに再分割する。ブロックサイズ割当要素１２０はＰＱＲデータと呼ばれるカッドツリーデータを生成し、その長さは１〜２１ビットの間である。従って、ブロックサイズ割当が、１６×１６ブロックを分割すると決定すると、ＰＱＲデータのＲビットが設定され、４個の分割された８×８ブロックに対応するＱデータの４個のさらなるビットが続く。ブロックサイズ割当が、８×８ブロックのいずれかを再分割すると決定すると、再分割された８×８ブロックごとのＰデータの４個のさらなるビットが追加される。

次に図３を参照すると、ブロックサイズ割当要素１２０の動作の詳細を示している図が示されている。ブロックの分散が、ブロックの再分割を決定する際の基準として使用されている。ステップ２０２で開始し、１６×１６画素ブロックが読み取られる。ステップ２０４において、１６×１６ブロックの分散ｖ１６が計算される。分散は以下のように計算される：

ここで、Ｎ＝１６であり、ｘ_ｉ，ｊはＮ×Ｎブロック内のｉ行目、ｊ列目の画素である。ステップ２０６において、ブロックの平均値が２つの所定値間にある場合には、まず分散閾値Ｔ１６を変形して新たな閾値Ｔ’１６を提供し、次いでブロック分散を新たな閾値Ｔ’１６と比較する。

分散ｖ１６が閾値Ｔ１６以下の場合、ステップ２０８において、１６×１６ブロックの開始アドレスが一時的記憶装置に書き込まれ、ＰＱＲデータのＲビットが０に設定されて、１６×１６ブロックは再分割されないことを示す。そしてアルゴリズムは次の１６×１６画素ブロックを読み取る。分散ｖ１６が閾値Ｔ１６より大きい場合、ステップ２１０において、ＰＱＲデータのＲビットが１に設定されて、１６×１６ブロックが４個の８×８ブロックに分割されることを示す。

４個の８×８ブロック（ｉ＝１：４）は、ステップ２１２に示されているように、順次さらに再分割されると考えられる。８×８ブロックごとに、分散ｖ８_ｉがステップ２１４において計算される。ステップ２１６において、ブロックの平均値が２つの所定値間にある場合にはまず分散閾値Ｔ８を変形して新たな閾値Ｔ’８を提供し、次いでブロック分散をこの新たな閾値と比較する。

分散ｖ８_ｉが閾値Ｔ８以下である場合、ステップ２１８において、８×８ブロックの開始アドレスが一時的記憶装置に書き込まれ、対応するＱビットＱ_ｉが０に設定される。そして次の８×８ブロックが処理される。分散ｖ８_ｉが閾値Ｔ８より大きい場合、ステップ２２０において、対応するＱビットＱ_ｉが１に設定され、８×８ブロックが４個の４×４ブロックに再分割されることを示す。

４個の４×４ブロック（ｊ_ｉ＝１：４）は、ステップ２２２において示されているように、順次さらに再分割されると考えられる。４×４ブロックごとに、分散ｖ４_ｉｊがステップ２２４において計算される。ステップ２２６において、ブロックの平均値が２つの所定値間にある場合、まず分散閾値Ｔ４が変形されて新たな閾値Ｔ’４を提供し、次いでブロック分散がこの新たな閾値と比較される。

分散ｖ４_ｉｊが閾値Ｔ４以下である場合、ステップ２２８において、４×４ブロックのアドレスが書き込まれ、対応するＰビットＰ_ｉｊが０に設定される。そして次の４×４ブロックが処理される。分散ｖ４_ｉｊが閾値Ｔ４より大きい場合、ステップ２３０において、対応するＰビットＰ_ｉｊが１に設定され、４×４ブロックが４個の２×２ブロックに再分割されることを示す。加えて、４個の２×２ブロックのアドレスが一時的記憶装置に書き込まれる。

閾値Ｔ１６、Ｔ８、およびＴ４は所定の定数であってもよい。これは硬判定(the hard decision)として知られている。あるいはまた、適応または軟判定(adaptive or soft decision)が実行されてもよい。例えば、軟判定は２Ｎ×２Ｎブロックの平均画素値によって分散の閾値を変化させる（ここでＮは８、４、または２であってもよい）。従って、平均画素値の関数を閾値として使用することができる。

図示目的のために、以下の例を考える。Ｙ成分の所定の分散閾値を、１６×１６ブロック、８×８ブロック、および４×４ブロックに対してそれぞれ５０、１１００、および８８０とする。すなわち、Ｔ１６＝５０、Ｔ８＝１１００、およびＴ４＝８８０となる。平均値の範囲を８０〜１００とする。１６×１６ブロックに対して計算された分散は６０であるとする。６０はＴ１６より大きいため、平均値９０は８０と１００の間であり、１６×１６ブロックは４個の８×８サブブロックに再分割される。８×８ブロックに対して計算された分散は１１８０、９３５、９８０、および１２１０とする。８×８ブロックのうちの２つはＴ８以上の分散を有しているため、これら２つのブロックはさらに再分割され、合計８個の４×４サブブロックを生成する。最後に、８個の４×４ブロックの分散は６２０、６３０、６７０、６１０、５９０、５２５、９３０、および６９０であり、対応する平均値は９０、１２０、１１０、１１５であるとする。第一の４×４ブロックの平均値は範囲（８０、１００）内にあるため、その閾値は、８８０未満のＴ’４＝２００に低下する。従って、この４×４ブロックは７個の４×４ブロックと同様に再分割される。これに伴うブロックサイズ割当が図４ａに示されている。対応するカッドツリー分解は図４ｂに示されている。さらに、このブロックサイズ割当によって生成されたＰＱＲデータが図４ｃに示されている。

同様の手順を使用してブロックサイズをカラー成分Ｙ−奇数、Ｃ_ｂ−even、Ｃ_ｂ−odd、Ｃ_ｒ−evenおよびＣ_{ｒ−ｏｄｄ}に割り当てることに注目すべきである。カラー成分は水平、垂直、または両方で間引きされてもよい。

さらに、ブロックサイズ割当は、最大ブロック（本例では１６×１６ブロック）がまず評価されるトップダウンアプローチとして説明されているが、ボトムアップアプローチを使用してもよいことに注目すべきである。ボトムアップアプローチはまず最小ブロック（本例では２×２ブロック）を評価する。

図１を再び参照すると、選択ブロックのアドレスに伴うＰＱＲデータがＤＣＴ要素１２４に提供される。ＤＣＴ要素１２４はＰＱＲデータを使用して、適切なサイズの離散コサイン変換を選択ブロックに実行する。選択ブロックのみがＤＣＴ処理の実行を必要とする。

画像処理システム１００もまた、ＤＣＴのＤＣ係数間の冗長性を低下させるためのＤＱＴ要素１２８を備えている。ＤＣ係数は各ＤＣＴブロックの左上角で遭遇する。一般的にＤＣＴ係数はＡＣ係数と比較される。サイズの相違によって、効率的な可変長符号器を設計することは困難である。従って、ＤＣ係数間の冗長性を低下させることは有利なことである。

ＤＱＴ要素１２８は、一度に２×２ずつ、二次元ＤＣＴをＤＣ係数に実行する。４×４ブロック内の２×２ブロックで開始して、二次元ＤＣＴは４個のＤＣ係数に実行される。この２×２ＤＣＴは４個のＤＣ係数の差分カッドツリー変換、すなわちＤＱＴと称される。次に、８×８ブロック内の３つの隣接するＤＣ係数に伴うＤＱＴのＤＣ係数を使用して、次のレベルのＤＱＴを計算する。最後に、１６×１６ブロック内の４個の８×８ブロックのＤＣ係数を使用して、ＤＱＴを計算する。従って、１６×１６ブロックにおいて、１つの真のＤＣ係数が存在し、残りはＤＣＴおよびＤＱＴに対応するＡＣ係数である。

変換係数（ＤＣＴおよびＤＱＴ双方）が量子化用の量子化器に提供される。好ましい実施形態において、ＤＣＴ係数は周波数重みマスク(frequency weighting masks)（ＦＷＭ）および量子化スケール係数を使用して量子化される。ＦＷＭは入力されたＤＣＴ係数のブロックと同一次元の周波数重みのテーブルである。周波数重みは異なる重みを異なるＤＣＴ係数に適用する。重みは、人間の視覚または光学システムが敏感な周波数コンテンツを有する入力サンプルを強調し、かつ視覚または光学システムが敏感ではない周波数コンテンツを有するサンプルを強調しないように設計されている。重みはまた見える距離などの要因に基づいて設計されてもよい。

重みは経験上のデータに基づいて選択される。８×８ＤＣＴ係数に対する重みマスクを設計するための方法は、参照してここに組み込まれている、１９９４年の国際標準機構（ＩｎｔｅｒｎａｔｉｏｎａｌＳｔａｎｄａｒｄｓＯｒｇａｎｉｚａｔｉｏｎ）による、ＩＳＯ／ＩＥＣＪＴＣ１ＣＤ１０９１８の、「連続トーンの静止画像のディジタル圧縮および符号化（Ｄｉｇｉｔａｌｃｏｍｐｒｅｓｓｉｏｎａｎｄｅｎｃｏｄｉｎｇｏｆｃｏｎｔｉｎｕｏｕｓ−ｔｏｎｅｓｔｉｌｌｉｍａｇｅｓ）―パート１：要件および指針（Ｒｅｑｕｉｒｅｍｅｎｔａｎｄｇｕｉｄｅｌｉｎｅ）に開示されている。一般的に、２つのＦＷＭが設計され、１つは輝度成分用で、もう１つは色度成分用である。ブロックサイズ２×２と４×４のＦＷＭテーブルは間引きによって得られ、１６×１６のＦＷＭテーブルは８×８ブロックの補間によって得られる。スケール係数は量子化係数の品質およびビットレートをコントロールする。

従って、各ＤＣＴ係数は以下の関係に従って量子化される：

ここでＤＣＴ（ｉ，ｊ）は入力ＤＣＴ係数であり、ｆｗｍ（ｉ，ｊ）は周波数重みマスクであり、ｑはスケール係数であり、ＤＣＴｑ（ｉ，ｊ）は量子化係数である。ＤＣＴ係数の符号によって大括弧内の第一の項は切り上げまたは切り捨てられることに注目すべきである。ＤＱＴ係数はまた適切な重みマスクを使用して量子化される。しかしながら、複数のテーブルまたはマスクが、Ｙ、Ｃｂ、およびＣｒ成分の各々に使用および適用されてもよい。

画素データブロックおよび周波数重みマスクは量子化器１３０、すなわちスケール係数要素によってスケーリング(scaled)される。好ましい実施形態において、平均ビットレートに対応する３２個のスケール係数がある。ＭＰＥＧ２などの他の圧縮方法と異なり、平均ビットレートは、目標ビットレートおよびバッファ状態ではなく、処理画像の品質に基づいてコントロールされる。

量子化係数は走査直列化器１５２に提供される。直列化器１５２は量子化係数のブロックを走査し、量子化係数の直列化ストリームを生成する。ジグザグ走査、列走査、または行走査が用いられてもよい。ジグザグ以外のパターンならびに、多数の異なるジグザグ走査パターンもまた選択されてよい。他のサイズを使用することもできるが、好ましい技術はジグザグ走査に８×８ブロックサイズを用いる。

異なる走査技術が図４および５を参照してここに説明される。図４ｂは１６×１６ブロック４００全体のジグザグ走査を示している。ＤＣＴなどの周波数ベースのブロックにおいて、値は、ＤＣ値が左上角にあるように符号化および表示され、ＡＣ値は右下角に近づくと減少する。従って、１６×１６ブロック内のブロックサイズ割当に関係なく、１６×１６ブロック全体をジグザグ走査する走査技術は非効率な符号化を招く。すなわち、このようなジグザグ走査は同一値のより短いランレングスを招く。

図４ｃは、係数が所与のブロックにおいて配列されている順序を利用する、より最適な走査技術を示している。各ブロック４０４、４０６、４０８、４１０、４１２、４１４、４１６、４１８、４２０、４２２、４２４、４２６、および４２８は別個のジグザグ走査を用いる。一実施形態において、各ブロックは、垂直、水平、または逆ジグザグなどの異なる走査パターンを用いることができる。この実施形態は最大ランレングスの維持においてかなり最適化されているが、各ブロックの別個のジグザグ走査の計算はより集中してしまい、またハードウェアでの実現はより困難であろう。

従って、図５ａおよび５ｂに示されているような走査の実現は、ハードウェアの実現において容易に平衡化されるランレングスを最大化する最適化を平衡化するであろうと判断されている。図５ａは、ブロックサイズ割当によって、ブロック５０４、５０６、５０８、５１０、５１２、５１４、５１６、５１８、５２０、５２２、５２４、５２６、および５２８に再分割されている１６×１６ブロック５００を示している。一実施形態において、ＢＳＡブレークダウンに関係なく、１６×１６ブロックの各８×８象限に対するジグザグ走査が用いられる。従って、ブロック５０４、５０６、５０８、および５１０はジグザグ走査によって直列化され、ブロック５１２もジグザグ走査によって直列化され、ブロック５１４もジグザグ走査によって直列化され、またブロック５１６、５１８、５２０、５２２、５２４、５２６、および５２８もジグザグ走査によって直列化される。

図５ｂは、ブロックサイズ割当によって、ブロック５５４、５５６、５５８、５６０、５６２、５６４、５６６、５６８、５７０、５７２、５７４、５７６、および５７８に再分割されている１６×１６ブロック５５０を示している。この実施形態において、異なるタイプの走査が、１６×１６ブロックの各８×８象限に対して用いられる。用いられているこのタイプの走査は、８×８ブロック内の値を評価し、最も効率的な走査方法を判断することによって決定される。例えば、図５ｂにおいて、水平走査がブロック５５４、５５６、５５８、５６０に対して用いられ、ブロック５６２はジグザグ走査によって直列化され、ブロック５６４は垂直走査によって直列化され、ブロック５６６、５６８、５７０、５７２、５７４、５７６、および５７８はジグザグ走査によって直列化される。代替実施形態において、最適な走査方法は、ブロック単位ではなくフレーム単位で決定される。フレーム単位の最適な走査方法を決定することは、ブロック単位の方法とは反対に計算の集中が少ない。

図６ａは、直列化が生じるプロセス６００を示している。データグループが読み取られる（６０４）。読み取られているデータは可変ブロックサイズに基づいているので、読み込まれているデータは均一の長さではない。データはコンパイルされる(compiled)か（６０８）、あるいは１６×１６ブロックで表されることができる形態に構成される。次いでデータは４個の８×８ブロックサイズに分割される。次いで、ジグザグ走査が各８×８ブロックに実行される（６１６）。そしてデータはバッファにルーティングされる（６２０）。

図６ｂは、直列化の代替実施形態６５０を示している。データフレームが読み取られる（６５４）。データフレームが評価されて（６５８）、最適な直列化技術を決定する。評価に基づいて、ジグザグ走査６６２、垂直走査６６４、あるいは水平走査６６８が用いられる。走査方法の一つに基づいた直列化の際に、データはバッファにルーティングされる（６７２）。

再度図１を参照すると、直列化または量子化係数のストリームが可変長符号器１５６に提供される。可変長符号器１５６はハフマン符号化(Huffman encoding)に続くゼロのランレングス符号化を利用してもよい。この技術は、参照してここに込みこまれ、かつここに要約されている前述の米国特許第５，０２１，８９１号、第５，１０７，３４５号、および第５，４５２，１０４号に詳述されている。ランレングス符号器は量子化係数を用いて、非ゼロ係数からゼロを分離する。ゼロの値はランレングス値と称され、ハフマン符号化される。非ゼロ値は別個にハフマン符号化される。

量子化係数の修正ハフマン符号化もまた可能であり、好ましい実施形態において使用される。ここで、ジグザグ走査の後に、ランレングス符号器が各８×８ブロック内のランレングス／サイズ対を判断する。次いでこれらのランレングス／サイズ対はハフマン符号化される。

ハフマン符号は画像の測定または理論統計のいずれかから設計される。多くの自然画像は平らな、または比較的ゆっくりと変化する領域と、オブジェクトの境界およびハイコントラストテクスチャなどの込み入った領域とからなることが分かっている。ＤＣＴなどの周波数ドメイン変換によるハフマン符号器はこれらの特徴を、込み入った領域には多数のビットを、また平らな領域には少数のビットを割り当てることによって利用する。一般的に、ハフマン符号器はルックアップテーブルを使用してランレングスおよび非ゼロ値を符号化する。所望なら１つまたは２つのテーブルが用いられるが、複数のテーブルが一般的に使用され、本発明においては３つのテーブルが好ましい。

符号器１０４によって生成された圧縮画像信号はバッファ１６０を用いて一時的に記憶され、送信チャネル１０８を使用して復号器１１２に送信される。ブロックサイズ割当情報を含んでいるＰＱＲデータもまた復号器１１２に提供される。復号器１１２はバッファ１６４と、可変長復号器１６８とを含んでおり、これはランレングス値と非ゼロ値を復号化する。

可変長復号器１６８の出力は、用いられている走査スキームに従って係数を配列する逆直列化器１７２に提供される。例えば、ジグザグ走査、垂直走査、および水平走査の組み合わせが使用されると、逆直列化器１７２は、用いられている走査タイプの情報によって係数を適切に再配列する。逆直列化器１７２はＰＱＲデータを受信して、複合係数ブロックへの係数の適切な配列を支援する。

複合ブロックはセレクタ１７４を使用して、量子化スケール係数および周波数重みマスクの使用による処理を実行するための逆量子化器１７６に提供される。

そして、差分カッドツリー変換が適用されていれば、係数ブロックは、ＩＤＣＴ要素１８６が続くＩＤＱＴ要素１８６に提供される。そうでない場合、係数ブロックはＩＤＣＴ要素１９０に直接提供される。ＩＤＱＴ要素１８６およびＩＤＣＴ要素１９０は係数を逆変換し、画素データブロックを生成する。次いで、画素データは補間され、ＲＧＢ形態に変換され、そして更なる表示のために記憶されなければならない。

従って、画素分散に基づいてブロックサイズ割当を実行する画像圧縮のためのシステムおよび方法が提供される。分散に基づくブロックサイズ割当は複数の利点を提供する。離散コサイン変換はブロックサイズが判断された後に実行されるため、効率的な計算ができる。計算が集中的な変換は選択ブロックのみで必要とされる。さらに、ブロック選択プロセスは、画素値の分散は数学的に計算が容易であるために、効率的である。分散に基づくブロックサイズ割当のさらに別の利点は、それが知覚的に基づいたものである点である。画素分散はブロックの動きの一つの手段であり、エッジやテクスチャ(textures)などの存在を示す。それは、画素値の平均などの測定よりも良好にブロックの詳細を捕捉する。従って、本発明の分散に基づく割当はエッジの多きい領域には小さいブロックを、平らな領域には大きなブロックを割り当てる。その結果、優れた品質が再構成画像において得られる。

例として、ここに開示されている実施形態と関連して説明されている種々の説明的論理ブロック、フローチャート、およびステップがハードウェアまたはソフトウェアにおいて、特定用途向け集積回路（ＡＳＩＣ）、プログラマブル論理装置、離散ゲートまたはトランジスタ論理、レジスタおよびＦＩＦＯなどの離散ハードウェアコンポーネント、ファームウェア命令を実行するプロセッサ、従来のプログラマブルソフトウェアおよびプロセッサ、またはこれらの組み合わせによって実現または実行されることが可能である。プロセッサはマイクロプロセッサが好都合であるが、別の方法では、プロセッサは従来のプロセッサ、コントローラ、マイクロコントローラ、または状態機械であってもよい。ソフトウェアはＲＡＭメモリ、フラッシュメモリ、ＲＯＭメモリ、レジスタ、ハードディスク、リムーバブルディスク、ＣＤ−ＲＯＭ，ＤＶＤ−ＲＯＭ，または当業において既知の記憶媒体の形態であってもよい。

好ましい実施形態に関する前述の説明によって、当業者なら誰でも本発明をなし、または使用することができる。これらの実施形態に対する種々の修正は当業者には容易に明らかであり、ここで定義されている一般原理は、本発明の機能を使用せずとも他の実施形態に適用可能である。従って、本発明はここに示されている実施形態に限定されることを意図しておらず、ここに開示されている原理および新規の特徴に矛盾しない最大限の範囲を認めることになる。

本発明の他の特徴および利点は以下の請求項において示される。

図１は、本発明の分散に基づくブロックサイズ割当システムおよび方法を組み込んでいる品質に基づく画像処理システムの符号化部分のブロック図である。図２は、本発明の分散に基づくブロックサイズ割当システムおよび方法を組み込んでいる品質に基づく画像処理システムの復号化部分のブロック図である。図３は、分散に基づくブロックサイズ割当に関する処理工程を示しているフロー図である。図４ａは例示的ブロックサイズ割当を示している。図４ｂは、１６×１６ブロックサイズに対するジグザグ走査パターンを示している。図４ｃは、各可変ブロックサイズ内のジグザグ走査パターンを示している。図５ａは、実際のブロックサイズと関係ない、８×８ブロックのジグザグ走査パターンを示している。図５ｂは、実際のブロックサイズと関係ない、８×８ブロックで実現されている異なる走査パターンを示している。図６ａは、直列化プロセスの一実施形態を示している。図６ｂは、直列化プロセスの別の実施形態を示している。

Claims

ディジタルシネマシステムにおいて、周波数ベースの画像データを直列化するための方法、該方法は下記を具備する：
１６×１６ブロックで表すことが可能な少なくとも一つのデータグループをコンパイルする；
該データグループを４個の８×８ブロックで表すことが可能なグループに分割する；
該４個の８×８データブロックの各々を直列化する。
直列化することは、該４個の８×８データブロックの各々をジグザグ走査することを備えている、請求項１に記載の方法。
直列化することは、該４個の８×８データブロックの各々を垂直走査することを備えている、請求項１に記載の方法。
直列化することは、該４個の８×８データブロックの各々を水平走査することを備えている、請求項１に記載の方法。
少なくとも一つのグループをコンパイルすることは、複数の１６×１６ブロックで表すことが可能なデータフレームをコンパイルすることを備えている、請求項１に記載の方法。
該周波数ベースの画像データは、Ｙ、Ｃｂ、およびＣｒカラー成分に分離される、請求項１に記載の方法。
該Ｙ、Ｃｂ、およびＣｒカラー成分がさらに偶数および奇数のカラー成分に分離される、請求項６に記載の方法。
ディジタルシネマシステムにおいてディジタル画像を圧縮するための方法、該画像は画素データを備え、
該画素データはカラー成分に分離される、該方法は下記の動作を具備する：
画素データのカラー成分のグループを読み取る；
ブロックサイズ割当を生成して、画素のカラー成分のグループを画素データのサブブロックに分割する；
画素データのサブブロックを、対応する周波数ドメイン表示に変換する；
該周波数ドメイン表示をデータストリームにスケーリングする、ここにおいて、該スケーリング動作は該画像の品質と相関する品質基準に基づいている；
少なくとも一つのデータグループを、１６×１６ブロックで表すことが可能な該ストリームデータからコンパイルする；
該１６×１６データグループを、４個の８×８ブロックで表すことが可能なグループに分割する；
該４個の８×８データブロックの各々を直列化する。
該スケーリング動作は、さらに周波数重みマスクを該画素データのサブブロックに提供する動作を備えており、該周波数重みマスクは、人間の視覚システムがより敏感な該画像の部分を強調し、人間の視覚システムがより敏感でない該画像の部分はより低く強調する、請求項８に記載の方法。
該スケーリング動作は、さらに該画像の品質に基づいて該画素データのサブブロックを量子化する動作を備えている、請求項８に記載の方法。
該品質基準は信号対雑音比である、請求項８に記載の方法。
該変換動作は、離散コサイン変換を実行する、請求項８に記載の方法。
該変換動作は離散コサイン変換に続いて差分カッドツリー変換を実行する、請求項８に記載の方法。
該カラー成分はＹ、Ｃｂ、およびＣｒカラー成分である、請求項８に記載の方法。
該Ｙ、Ｃｂ、およびＣｒカラー成分は、偶数および奇数カラー成分に分離される、請求項１４に記載の方法。
ディジタルシネマシステムにおいて、周波数ベースの画像データを直列化するための装置、該装置は下記を具備する：
１６×１６ブロックで表すことが可能な少なくとも一つのデータグループをコンパイルするための手段；
該データグループを４個の８×８ブロックで表すことが可能な複数のグループに分割するための手段；
該４個の８×８データブロックの各々を直列化するための手段。
該直列化手段が、該４個の８×８データブロックの各々をジグザグ走査するための手段を備えている、請求項１６に記載の装置。
該直列化手段は、該４個の８×８データブロックの各々を垂直走査するための手段を備えている、請求項１６に記載の装置。
該直列化手段は、該４個の８×８データブロックの各々を水平走査するための手段を備えている、請求項１６に記載の装置。
少なくとも一つのグループをコンパイルするための手段は、複数の１６×１６ブロックで表すことが可能なデータフレームをコンパイルするための手段を備えている、請求項１６に記載の装置。
該周波数ベースの画像データは、Ｙ、ＣｂおよびＣｒカラー成分に分離される、請求項１６に記載の装置。
さらに該Ｙ、ＣｂおよびＣｒカラー成分は、偶数および奇数のカラー成分に分離される、請求項２１に記載の装置。
ディジタルシネマシステムにおいて、ディジタル画像を圧縮するための装置、該画像は画素データを備え、該画素データはカラー成分に分離される、該装置は下記を具備する：
画素データのグループを読み取るための手段；
該画素グループを画素データのサブブロックに分割するために、ブロックサイズ割当を生成するための手段；
画素データの該サブブロックを、対応する周波数ドメイン表示に変換するための手段；
該周波数ドメイン表示をデータストリームにスケーリングするための手段、ここにおいて該スケーリング動作は、該画像の品質と相関する品質基準に基づいている；
少なくとも一つのデータグループを、１６×１６ブロックで表すことが可能な該ストリームデータからコンパイルするための手段；
該１６×１６データグループを、４個の８×８ブロックで表すことが可能なグループに分割するための手段；
該４個の８×８データブロックの各々を直列化するための手段。
該変換動作は、離散コサイン変換を実行する、請求項２３に記載の装置。
該変換動作は、離散コサイン変換に続いて差分カッドツリー変換を実行する、請求項２３に記載の装置。
該カラー成分はＹ、ＣｂおよびＣｒのカラー成分である、請求項２３に記載の装置。
該Ｙ、ＣｂおよびＣｒカラー成分は、偶数および奇数のカラー成分に分離される、請求項２６に記載の装置。
ディジタルシネマシステムにおいて、周波数ベースの画像データを直列化するための装置、該装置は下記を具備する：
１６×１６ブロックで表すことが可能な少なくとも一つのデータグループをコンパイルするように構成されたコンパイラ；
該データグループを４個の８×８ブロックで表すことが可能な複数のグループに分割するように構成された分割器；
該４個の８×８データブロックの各々を直列化するように構成された直列化器。
該直列化器は、さらに、該４個の８×８データブロックの各々をジグザグ走査するように構成されたジグザグスキャナを備えている、請求項２８に記載の装置。
該直列化器は、さらに、該４個の８×８データブロックの各々を垂直走査するように構成された垂直スキャナを備えている、請求項２８に記載の装置。
該直列化器は、さらに該４個の８×８データブロックの各々を水平走査するように構成された水平スキャナを備えている、請求項２８に記載の装置。
該コンパイラは、複数の１６×１６ブロックで表すことが可能なデータフレームをコンパイルするように構成されている、請求項２８に記載の装置。
該周波数ベースの画像データは、Ｙ、ＣｂおよびＣｒカラー成分に分離される、請求項２８に記載の装置。
該Ｙ、ＣｂおよびＣｒカラー成分は、さらに偶数および奇数のカラー成分に分離される、請求項３３に記載の装置。
ディジタルシネマシステムにおいて、ディジタル画像を圧縮するように構成された装置、該画像は画素データを備えている、該装置は下記を具備する：
画素データのグループを読み取るように構成された読み取り器；
該画素グループを画素データのサブブロックに分割するためのブロックサイズ割当を生成する生成器；
該画素データのサブブロックを、対応する周波数ドメイン表示に変換するように構成された変換器；
該周波数ドメイン表示をデータストリームにスケーリングするように構成されたスケーラ、ここにおいて、該スケーリング動作は該画像の品質と相関する品質基準に基づいている；
少なくとも一つのデータグループを、１６×１６ブロックで表すことが可能な該ストリームデータからコンパイルするように構成されたコンパイラ；
該１６×１６データグループを、４個の８×８ブロックで表すことが可能な複数のグループに分割するように構成された分割器；
該４個の８×８データブロックの各々を直列化するように構成された直列化器。