JP2004528791A

JP2004528791A - インターフレーム符号化方法および装置

Info

Publication number: JP2004528791A
Application number: JP2003501944A
Authority: JP
Inventors: アービン、アン・クリス; ラビーンドラン、ビジャヤラクシュミ・アール
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 2001-06-07
Filing date: 2002-06-06
Publication date: 2004-09-16
Also published as: WO2002100102A1; EP1402729A1; US20020191695A1; CN1539239A; ZA200400075B; BR0210198A; RU2004100224A; CA2449709A1; MXPA03011169A; IL159179A0

Abstract

【課題】ディジタルビデオを符号化するためのシステムにおけるインターフレームコーディング方法および装置。
【解決手段】ディジタルビデオフレームのシーケンスは、アンカーフレームおよび少なくとも１個の組み合わせられた後続フレームとして表現することが可能である。アンカーフレームおよび各後続フレームの複数のピクセル（３０４）は、ピクセル領域エレメントから周波数領域エレメント（３１２）に変換される。エレメントは、人間の視覚システムにとってより敏感なこれらのエレメントを強調するために、そして人間の視覚システムにとってより少なく敏感であるこれらのエレメントを強調しないために量子化（３１６）される。アンカーフレームの各量子化された周波数領域エレメント、および各後続フレームの対応する量子化された周波数領域エレメント間の差が決定されそして符号化される。
【選択図】図３

Description

【技術分野】
【０００１】
本発明は、ディジタル信号処理に関する。とくに、本発明は、ディジタル画像情報を符号化することに関する損失のない方法に関する。
【背景技術】
【０００２】
ディジタル画像処理は、ディジタル信号処理に関する一般的研究分野において卓越した位置を有する。人間の視覚の重要性は、当業界およびディジタル画像処理の科学においては大きな興味と発展を促進してきている。フイルムあるいは映画の投影に対して用いられるそれらのような、ビデオ信号の伝送及び受信の分野においては、画像圧縮技術に対する種々の改良がなされてきている。従来の、そして提案されているビデオシステムの多くは、ディジタル符号化技術を使用している。この分野の観点は、画像コーディング、画像回復、および画像特徴選定を含む。画像コーディングは、ディジタル通信チャネルの画像を効率的な手段で、同時にある限界内の歪みを有しながら、必要とされる帯域幅を最小とするためにできるだけ少ないビットを使用して送信するための試みを示している。画像回復は、対象の真の画像を回復するための努力を示している。通信チャネル上に送信されている符号化された画像は、種々の要因によって歪みを与えられて来ているかもしれない。劣化の原因は、対象からの画像を作り出すときに初めから始まっているかもしれない。特徴選定は、画像のある特質の選定に帰される。このような特質は、認識、分類、およびより広い情況における決定において必要とされるかもしれない。
【０００３】
ディジタル映画におけるそれのように、ビデオのディジタル符号化は、改善された画像圧縮技術から利益を得る分野である。ディジタル画像圧縮は、一般に二つの領域、損失のないおよび損失のある方法に分類されることが可能である。損失のない画像は、情報に関するいかなる損失もなしに回復される。損失のある方法は、圧縮比、圧縮アルゴリズムの品質、およびアルゴリズムの実行によって変化する、若干の情報に関する回復困難な損失を含む。一般に、損失のある圧縮アプローチは、コスト効果のあるディジタル映画アプローチに対して、必要とされる圧縮比を得るために考慮される。ディジタル映画品質レベルを達成するために、圧縮アプローチは、特性に関する視覚的に損失のないレベルを与えなければならない。このように、圧縮処理の結果として情報に関する数学的な損失があるにも拘らず、この損失に起因する画像の歪みは、通常の観察条件の下では、見る人にとって気づかれない程度でなければならない。
【０００４】
現在のディジタル画像圧縮技術は他の応用に対して、すなわちテレビジョンシステムに対して開発されてきている。この技術は、意図された応用に対しては適切な設計的妥協がなされているが、映画上映に対して必要とされる品質要求条件を満足していない。
【０００５】
ディジタル映画圧縮技術は、映画ファンが以前に経験している視覚的品質を与えなければならない。理想的には、ディジタル映画の視覚的品質は、高品質封切りプリントフィルムのそれを超えることを試みるべきである。同時に、圧縮技術は実用的な高いコーディング効率を有しなければならない。ここに定義されたように、コーディング効率は、ある質的なレベルを満足させるために、圧縮された画像品質に必要とされるビットレートに帰せられる。
【０００６】
ビデオ圧縮技術は、典型的には差分パルスコード変調（ＤＰＣＭ；differential pulse code modulation）、ディスクリート余弦変換（ＤＣＴ；discrete cosine transform）、動き補償(ＭＣ；motion compensation)、エントロピーコーディング、フラクタル圧縮（fractual compression）、およびウエーブレット変換をもとにしている。ビデオ信号に対する品質の望ましいレベルを保ちながら、十分な圧縮レベルを提供する能力のある一つの圧縮技術は、符号化されたＤＣＴ係数データに関する適応するような大きさに作られたブロックおよびサブブロックを利用している。この技術は以後、適応ブロックサイズ差分余弦変換（ＡＢＳＤＣＴ；Adaptive Block Size Differential Cosine Transform）法として参照される。
【０００７】
ビデオ圧縮に関する重要な見地は、連続した隣接フレーム間の類似性である。この領域における有力な現存の技術は、ＭＰＥＧ（Motion Picture Experts Group）におけるような動き補償である。動き補償は連続した隣接フレームからの不完全な予測を用いて画像をコーディングすることによって行われる。このような予測および／あるいは補償体系は、最初のソースおよび復号されたビデオシーケンス間に誤差をもたらす。しばしば、これらの誤差は容認できないレベルに高まり、高い画像品質の応用において好ましくない問題をもたらす。たとえば、動きアーチファクト(motion artifact)は動画符号化エクスパートグループ（ＭＰＥＧ）の圧縮された素材の中にしばしば見られる。動きアーチファクトは、現在のフレーム上に、前のあるいは将来のフレームの影響を見ることが可能であること、すなわちゴーストに帰せられる。このような動きアーチファクトはまた、フレーム毎のビデオ編集を困難な仕事とする。したがって必要とされるものは、現在のインターフレーム（inter-frame）符号化技術の欠点を克服し、そして動きアーチファクトのような可視欠陥を最小にするインターフレーム符号化体系である。
【発明の開示】
【課題を解決するための手段】
【０００８】
本発明の実施例は、任意の変換に基づいた圧縮技術によって提供される圧縮利得を効率的に増加し、そしていかなる付加的な歪みももたらさない、インターフレームコーディング方法を利用している。ここでデルタコーダ（delta coder）、あるいはデルタコーディング処理として参照されるこれらの方法は、周波数領域におけるビデオシーケンス内の空間的なそして時間的な冗長度を利用している。それは、デルタコーダは、一つのフレームから次への小さい変化が存在するときはいつでも、時間領域に関する高い相関度が存在するシーケンスを利用しているということである。このように、ビデオシーケンス内の隣接したフレーム間には、変換領域特性が著しく一貫して残っている。
【０００９】
ディジタルビデオを符号化するためのシステムにおいては、インターフレームコーディングに関する方法が述べられる。ディジタルビデオは、アンカーフレーム(anchor frame)および少なくとも１個の後続フレームを含む。各アンカーフレームおよび各後続フレームは、複数のピクセルエレメントを含む。アンカーフレームおよび各後続フレームの複数のピクセルは、ピクセル領域エレメントから周波数領域エレメントに変換される。周波数領域エレメントは、人間の視覚システムにとってより敏感であるこれらのエレメントを強調するように、そして人間の視覚システムにとって鈍感であるこれらのエレメントを強調しないように量子化される。アンカーフレームの各量子化された周波数領域エレメントおよび、対応する各後続フレームの量子化された周波数領域エレメント間の差が決定される。一つの実施例においては、アンカーフレームは後続フレームのあらかじめ設定された数と組み合わせられる。他の実施例においては、アンカーフレームは、後続フレームとアンカーフレーム間の相関特性が容認できないレベルに達するまで、後続フレームと組み合わせられる。なお他の実施例においては、ローリングアンカーフレーム（rolling anchor frame）が利用される。
【００１０】
よって、画像データを効率的に符号化することが、本発明の特徴でありそして利点である。
動きアーチファクトの影響を最小にすることが、本発明の他の特徴でありそして利点である。
【発明を実施するための最良の形態】
【００１１】
本発明の特徴、目的、そして利点が、図面と関連させた場合に、以下に記述する詳細な説明からより明白になろう。図面において同様の参照符号は、全体を通じてそしてこの中で同一のものと認定する。
ディジタル信号のディジタル伝送を容易にしそしてそれに応じた利益を受けるために、一般的には信号圧縮の若干の形式を使用することが必要である。その結果となる画像における高分解能を達成するために画像の高品質が保持されることがまた重要である。さらに、計算上の効率がコンパクトなハードウエア実現のために望まれ、そしてそれは多くの応用において重要である。
【００１２】
一つの実施例においては、本発明の画像圧縮はディスクリート余弦変換（ＤＣＴ）技術に基づいている。一般的にディジタル領域内で処理されるべき画像は、重なり合っていないブロック、サイズＮ×Ｎのアレイに分割されたピクセルデータを含むであろう。２次元のＤＣＴは各ブロックで実現されることが可能である。２次元のＤＣＴは次の関係によって定義される。
【００１３】
【数１】

ここで、
【００１４】
【数２】

そして、
ｘ（ｍ，ｎ）はＮ×Ｍブロック内のピクセル位置（ｍ，ｎ）であり、そして
Ｘ（ｋ，ｌ）は対応するＤＣＴ係数である。
ピクセル値は負ではないのでＤＣＴ成分、Ｘ（０，０）はつねに正であり、そして通常最高のエネルギーを有している。事実、典型的な画像に対しては変換エネルギーの大部分は成分、Ｘ（０，０）の周囲に集中している。このエネルギー圧縮特性はＤＣＴ技術をこのような魅力的な圧縮方法にしている。
【００１５】
大部分の自然な画像は、単調な比較的ゆっくりと変化する領域と、対象物との境界およびコントラストの大きい組織等のたえず変化している領域からなっていることが観察されている。コントラストに適応するコーディング体系は、たえず変化している領域により多いビットを、そしてより変化の少ない領域により少ないビットを割り当てることによって、この要因に関して利点を有している。この技術は、“適応ブロックサイズ画像圧縮方法およびシステム”と題された、本発明の譲受人に譲渡されそして参照によってこの中に組み込まれている、米国特許５，０２１，８９１の中に開示されている。ＤＣＴ技術はまた、“適応ブロックサイズ画像圧縮方法およびシステム”と題された、本発明の譲受人に譲渡されそして参照によってこの中に組み込まれている、米国特許５，１０７，３４５の中に開示されている。さらに、差分カッドツリー(Differential Quadtree)変換技術とともにＡＢＳＤＣＴ技術を使用することは、“適応ブロックサイズ画像圧縮方法およびシステム”と題された、これもまた本発明の譲受人に譲渡されそして参照によってこの中に組み込まれている、米国特許５，４５２，１０４の中に論じられている。これらの特許の中に開示されたシステムは、“イントラフレーム”符号化として参照されるものを利用しており、そこでは、画像データの各フレームはいかなる他のフレームの内容も顧慮せずに符号化される。ＡＢＳＤＣＴ技術を用いると、画像品質に関する認識可能な劣化なしに到達可能なデータレートが十分に存在可能であろう。
【００１６】
ＡＢＳＤＣＴを用いて、ビデオ信号は一般に処理のためにピクセルのブロックに分けられるであろう。各ブロックに対して、輝度および色差成分はブロックインターリーバに通される。たとえば、１６×１６（ピクセル）ブロックはブロックインターリーバに与えられ、これは画像サンプルを、ディスクリート余弦変換（ＤＣＴ）解析のために、データのブロックおよび複合サブブロックを生成するため、各１６×１６ブロックの中に配列しあるいは組織化する。ＤＣＴ演算子は、時間的にサンプルされた信号を同じ信号の周波数表示に変換する一つの方法である。量子化器は画像の周波数分布特性を利用するよう設計が可能であるために、周波数表示に変換することによって、ＤＣＴ技術は非常に高い圧縮レベルを可能にすることを示して来ている。好ましい実施例においては、１個の１６×１６ＤＣＴは、１番目の順序づけに適用され、４個の８×８ＤＣＴは、２番目の順序づけに適用され、１６個の４×４ＤＣＴは、３番目の順序づけに適用され、そして６４個の２２ＤＣＴは、４番目の順序づけに適用される。
【００１７】
画像処理の目的に対しては、ＤＣＴ操作は、重なり合っていないブロックのアレイの中に分割されているピクセルデータ上で実行される。この中ではブロックサイズはサイズＮ×Ｎであるとして論じられるが、種々のブロックサイズが使用可能であることが想像されることに留意すべきである。たとえば、Ｎ×Ｍブロックサイズが利用可能であり、そこでは、ＮおよびＭの両者は整数であってＭは、Ｎよりもより大きいかあるいはより小さい何れかである。他の重要な観点は、ブロックはＮ／ｉ×Ｎ／ｉ、Ｎ／ｉ×Ｎ／ｊ、Ｎ／ｉ×Ｍ／ｊ等のように、少なくともサブブロックの１個のレベルまで分割可能であることである。ここでｉおよびｊは整数である。さらに、ここに論じられるように典型的なブロックサイズは、ＤＣＴ係数に関するブロックおよびサブブロックに対応している１６×１６ピクセルブロックである。共に偶数あるいは奇数の整数値であるような種々の他の整数、たとえば９×９が使用可能であることがさらに想像される。
【００１８】
一般に画像は、処理のためにピクセルのブロックに分割される。カラー信号はＲＧＢ空間から、輝度あるいは明るさ成分であるＹ、および色差あるいは色彩成分であるＣ_１およびＣ_２をもったＹＣ_１Ｃ_２空間に、変換が可能である。眼は色彩に対して空間的感度が低いのため、多くのシステムは水平および垂直方向に対しては４の約数（factor）によりＣ_１およびＣ_２成分をサブサンプルする。しかしながらサブサンプリングは必要ではない。４：４：４フォーマットとして知られるフルリゾリューション画像は、非常に有用であるか“ディジタル映画”カバリングとして参照されるそれらのような若干の応用において必要であるかの何れかである。二つの可能なＹＣ_１Ｃ_２表示はＹＩＱ表示およびＹＵＶ表示であり、その両者は当業界においてはよく知られている。ＹＣｂＣｒとして知られているＹＵＶ表示の変形も使用することがまた可能である。
【００１９】
さて図１を参照すると、本発明を組み入れた画像処理システム１００が示されている。画像処理システム１００は、受信されたビデオ信号を圧縮する符号器１０２を含む。圧縮された信号は物理的媒体を通して、伝送チャネル１０４を通して、送信されあるいは運ばれ、そしてそして復号器１０６によって受信される。復号器１０６は受信した信号を画像サンプルの中に復号し、そしてそれはそこで表示される。
【００２０】
望ましい実施例においては、各Ｙ、Ｃｂ、およびＣｒ成分はサブサンプリングなしに処理される。したがって、ピクセルの１６×１６ブロックの入力は符号器１０２に与えられる。符号器１０２は、ビデオ圧縮のための準備にブロックサイズ割り当てを実行するブロックサイズ割り当てエレメント１０８を含むことが可能である。ブロックサイズ割り当てエレメント１０８は、ブロック内の画像の知覚特性に基づいて１６×１６ブロックのブロック分解を決定する。ブロックサイズ割り当ては１６×１６ブロック内の活性度によって、カッドツリー様式で各１６×１６ブロックをより小さいブロックにサブ分割する。ブロックサイズ割り当てエレメント１０８は、ＰＱＲデータと呼ばれるその長さが１および２１ビットの間にあることが可能な、カッドツリーデータを発生する。このようにして、もしもブロックサイズ割り当てが１６×１６ブロックは分割されるべきであると決定した場合は、ＰＱＲデータのＲビットはセットされ、そして４個の分割された８×８ブロックに対応するＱデータの４個の付加的なビットが後に続く。もしもブロックサイズ割り当てが、８×８ブロックの何れかがサブ分割されるべきであると決定する場合は、そこで、サブ分割された各８×８ブロックに対する、Ｐデータの４個の付加的なビットが加えられる。
【００２１】
さて図２を参照して、ブロックサイズ割り当てエレメント１０８の動作に関する詳細を示しているフロー線図が与えられる。アルゴリズムはブロックをサブ分割する決定にあたって、メトリックとしてブロックの分散を使用する。ステップ２０２の最初に、ピクセルの１６×１６ブロックが読み込まれる。ステップ２０４において、１６×１６ブロックの変動（variance）ｖ１６が計算される。変動は次のようにして計算される。
【００２２】
【数３】

ここでＮ＝１６、そしてｘi,jは、Ｎ×Ｎブロック内のｉ番目の列、ｊ番目の行のピクセルである。ステップ２０６において、もしもブロックの平均値が二つのあらかじめ設定された値の間にある場合は、最初に変動しきい値Ｔ１６が、新しいしきい値Ｔ’１６を与えるために修正され、そこでブロック変数は新しいしきい値Ｔ’１６に対して比較される。
【００２３】
もしも変動ｖ１６がしきい値Ｔ１６よりも大きくない場合はそこで、ステップ２０８において１６×１６ブロックの開始アドレスが書き込まれ、そしてＰＱＲデータのＲビットは、１６×１６ブロックはサブ分割されないことを示すために０にセットされる。アルゴリズムはそこで、ピクセルの次の１６×１６ブロックを読み込む。もしも変動ｖ１６が、しきい値Ｔ１６よりも大きい場合はそこで、ステップ２１０においてＰＱＲデータのＲビットは、１６×１６ブロックは４個の８×８ブロックにサブ分割されるべきであることを示すために１にセットされる。
【００２４】
４個の８×８ブロックｉ＝１：４は、ステップ２１２に示されるように、さらなるサブ分割に対して続けて考慮される。各８×８ブロックに対して変動ｖ８_ｉが、ステップ２１４において計算される。ステップ２１６において、もしもブロックの平均値が二つのあらかじめ設定された値の間にある場合は、最初に変動しきい値Ｔ８は新しいしきい値Ｔ’８を与えるために修正される。そこで、ブロック変数はこの新しいしきい値と比較される。
【００２５】
もしも変動ｖ８_ｉが、しきい値Ｔ８よりも大きくない場合はそこで、ステップ２１８において８×８ブロックの開始アドレスが書き込まれ、そして対応するＱビット、Ｑ_ｉは０にセットされる。次の８×８ブロックがそこで処理される。もしも変動ｖ８_ｉが、しきい値Ｔ８よりも大きい場合はそこで、ステップ２２０において、対応するＱビットＱ_ｉは、８×８ブロックは４個の４×４ブロックにサブ分割されるべきであることを示すために１にセットされる。
【００２６】
４個の４×４ブロック、ｊ_ｉ＝１：４は、ステップ２２２に示されるように、さらなるサブ分割に対して続けて考慮される。各４×４ブロックに対して変動ｖ４_ijがステップ２２４において計算される。ステップ２２６において、もしもブロックの平均値が二つのあらかじめ設定された値の間にある場合は、最初に変動しきい値Ｔ４は新しいしきい値Ｔ’４を与えるために修正される。そこで、ブロック変動は、この新しいしきい値と比較される。
【００２７】
もしも変動ｖ４_ijがしきい値Ｔ４よりも大きくない場合はそこで、ステップ２２８において４×４ブロックのアドレスが書き込まれ、そして対応するＰビットＰ_ijは０にセットされる。次の４×４ブロックがそこで処理される。もしも変動ｖ４_ijがしきい値Ｔ４よりも大きい場合はそこで、ステップ２３０において、対応するＰビットＰ_ijは、４×４ブロックは４個の２×２ブロックにサブ分割されるべきであることを示すために１にセットされる。さらに、４個の２×２ブロックのアドレスが書き込まれる。
【００２８】
しきい値Ｔ１６、Ｔ８、およびＴ４は、あらかじめ設定された定数であることが可能である。このことは、ハードな決定として知られている。代わりに、適応、あるいはソフトな決定が実行されることが可能である。ソフトな決定は、２Ｎ×２Ｎブロックの平均ピクセル値によって、変動に対するしきい値を変化させる。ここで、Ｎは、８、４、あるいは２であることが可能である。このようにして、平均ピクセル値の関数はしきい値として使用可能である。
【００２９】
説明の目的のために、次の例を考慮しよう。Ｙ成分に対するあらかじめ設定された変動しきい値を、１６×１６、８×８、および４×４ブロックそれぞれに対して、５０、１１００、および８８０であるとしよう。換言すれば、Ｔ１６＝５０、Ｔ８＝１１００、そしてＴ１６＝８８０である。平均値の範囲は８０および１００であるとしよう。１６×１６ブロックに対する計算された変動は６０であると仮定する。６０およびその平均値９０はＴ１６よりも大きいので、１６×１６ブロックは４個の８×８サブブロックにサブ分割される。８×８ブロックに対する計算された変動は１１８０、９３５、９８０、および１２１０であると仮定する。８×８ブロックの２個はＴ８を超える変動を有しているので、これらの２個のブロックは、合計８個の４×４サブブロックを生成するためにさらにサブ分割される。最後に、８個の４×４ブロックの変動は、最初の４個の対応する平均値９０、１２０、１１０、１１５とともに、６２０、６３０、６７０、６１０、５９０、５２５、９３０、および６９０であると仮定する。最初の４×４ブロックの平均値は、範囲（８０、１００）の中にあるので、そのしきい値は８８０よりも小さいＴ’４＝２００に下げられるであろう。そこで、この４×４ブロックは７番目の４×４ブロックと同様にサブ分割されるであろう。
【００３０】
同様な処理が、色彩成分Ｃ_１およびＣ_２に対してブロックサイズを割り当てるために使用されることは記憶されるべきである。色彩成分は、水平方向に、垂直方向に、あるいは両方に、デシメートされることが可能である。さらにブロックサイズ割り当ては、最大のブロック（この例においては１６×１６）が最初に評価されるトップダウンアプローチとして記述されてきているが、ボトムアップアプローチが代わりに使用可能であることは記憶されるべきである。ボトムアップアプローチは、最小のブロック（この例においては２×２）を最初に評価するであろう。
【００３１】
図１に戻り参照して、画像処理システム１１０の残りが記述されるであろう。選定されたブロックのアドレスと共に、ＰＱＲデータはＤＣＴエレメント１１０に与えられる。ＤＣＴエレメント１１０はＰＱＲデータを、選定されたブロック上に適切なサイズのディスクリート余弦変換を実行するために使用する。選定されたブロックのみがＤＣＴ処理を受ける必要がある。
【００３２】
画像処理システム１００は、随意に、ＤＣＴのＤＣ係数の中の冗長度を減らすために、ＤＱＴエレメント１１２を含むことが可能である。ＤＣ係数は各ＤＣＴブロックの左上隅に見出される。ＤＣ係数は一般にＡＣ係数に比較して大きい。サイズにおけるこの不一致は、効率的な可変長コーダを設計することを困難にしている。したがって、ＤＣ係数内の冗長度を減らすことは有利である。
【００３３】
ＤＱＴエレメント１１２は、一度に２×２を取り、ＤＣ係数上に２−ＤＤＣＴを実行する。４×４ブロック内の２×２ブロックで出発して、２−ＤＤＣＴは４個のＤＣ係数上に実行される。この２×２ＤＣＴは、４個のＤＣ係数に関する差分カッドツリー変換（differential quad-tree transform）またはＤＱＴと呼ばれる。次に、８×８ブロックにおいて３個の隣接するＤＣ係数とともにＤＱＴのＤＣ係数が、次のレベルのＤＱＴを計算するために使用される。最後に、１６×１６ブロック内の４個の８×８ブロックに関するＤＣ係数がＤＱＴを計算するために使用される。このようにして、１６×１６ブロック内には１個の真のＤＣ係数が存在し、そして残りはＤＣＴおよびＤＱＴに対応するＡＣ係数である。
【００３４】
変換係数（ＤＣＴおよびＤＱＴの両者）は、量子化のために量子化器１１４に与えられる。望ましい実施例においては、ＤＣＴ係数は周波数重み付けマスク(frequency weighting masks)（ＦＷＭ）および量子化スケールファクタを用いて量子化される。ＦＷＭは、入力ＤＣＴ係数のブロックとして、同じサイズに関する周波数重み付けの表である。周波数重み付けは異なったＤＣＴ係数に対して異なった重み付けを適用することである。重み付けは人間の視覚システムがより敏感である周波数成分を有している入力サンプルを強調するように、そして視覚システムがより敏感でない周波数成分を有しているサンプルを強調しないように設計されている。重み付けはまた、見る距離等の要因に基づいて設計することが可能である。
【００３５】
ハフマン（Ｈｕｆｆｍａｎ）符号は、画像に関する測定されたあるいは理論的な統計の何れかから設計されている。最も自然な画像は、単調なあるいは比較的ゆっくり変化している領域および、対象物の境界部およびコントラストの大きい組織等のたえず変化している領域からなっていることが観察されてきている。ＤＣＴ等の周波数領域変換を伴ったハフマンコーダは、これらの特徴を、変化の激しい領域にはより多くのビットを、そして単調な領域にはより少ないビットを割り当てることによって利用している。一般にハフマンコーダは、ランレングスおよび０でない値を符号化するためにルックアップテーブルを使用している。
【００３６】
重み付けは経験的なデータに基づいて選定される。８×８ＤＣＴ係数に対する重み付けマスク設計のための方法は、ＩＳＯ／ＩＥＣＪＴＣ１ＣＤ１０９１８“連続トーン静止画像に関するディジタル圧縮および符号化‐第１部：要求およびガイドライン”、国際標準化機構、１９９４、の中に開示されている。そしてそれはここに、参照によって組み込まれている。一般に、一つは輝度成分に対するそして一つは色差成分に対する、２種類のＦＷＭが設計される。ブロックサイズ２×２、４×４に対するＦＷＭ表はデシメーションによって、そして１６×１６は８×８ブロックに対するそれの補間によって得られる。スケールファクタは、量子化された係数の品質およびビットレートを制御する。
【００３７】
このようにして、各ＤＣＴ係数は関係
【００３８】
【数４】

に従って量子化される。ここで、ＤＣＴ（i,j）は、入力ＤＣＴ係数、ｆｗｍ（i,j）は周波数重み付けマスク、ｑはスケールファクタ、そしてＤＣＴｑ（i,j）は量子化された係数である。ＤＣＴ係数の符号によって、括弧内の第１項は切り上げあるいは切り下げられることは留意するべきである。ＤＱＴ係数はまた、適切な重み付けマスクを用いて量子化される。しかしながら、複数のテーブルあるいはマスクが使用可能であり、そしてＹ、Ｃｂ、およびＣｒ成分の各々に適用される。
【００３９】
量子化された係数は、デルタコーダ１１５に与えられる。デルタコーダ１１５は、ＤＣＴあるいはＡＢＳＤＣＴ等の任意の変換に基づいた圧縮技術によって提供される圧縮利得を、いかなる付加的な歪みあるいは量子化雑音も加えない方法で効率的に増加する。デルタコーダ１１５は、隣接フレームを横切る０でない係数を形成する係数差分（coefficient differentials）を決定するよう形成されており、そして差分情報（differential information）を損失なく符号化する。他の実施例においては、差分情報は僅かの損失をともなって符号化される。このような実施例は、空間および／あるいは速度要求条件と品質考慮との平衡の点で望ましいかもしれない。
【００４０】
アンカーフレームおよび対応する後続のフレームに関するデルタ符号化された係数は、ジグザグ走査連続化器１１６に与えられる。連続化器１１６は、量子化された係数の連続化されたストリームを生成するために、ジグザグ様式で量子化された係数のブロックを走査する。ジグザグ以外のパターンと同様に、いくつかの異なったジグザグ走査パターンがまた選択可能である。３２×３２、１６×１６、４×４、２×２あるいはこれらの組み合わせ等の他のサイズが使用可能であるけれども、一つの実施例はジグザグ走査に対して８×８ブロックサイズを使用する。
【００４１】
ジグザグ走査連続化器１１６は、量子化器１１４の前あるいは後の何れかに置くことが可能である。最終の結果は同一である。
いずれの場合においても、量子化された係数のストリームは、可変長コーダ１１８に与えられる。可変長コーダ１１８は、符号化に先立って、０のランレングス符号化を使用することが可能である。この技術は、先に述べた米国特許５，０２１，８９１、５，１０７，３４５、および５，４５２，１０４の中に詳細に論じられ、そしてこの中に集約されている。ランレングスコーダは量子化された係数を取り上げ、連続していない係数から連続した係数のランを書き留める。連続した値はランレングス値として参照されそして符号化される。連続していない値は別々に符号化される。一つの実施例においては、連続した係数は０の値である。そして連続していない係数は０でない値である。典型的には、ランレングスは、０から６３ビットまでであり、そしてサイズは、１から１０のＡＣ値である。ファイル符号の一端は付加的な符号を付加し、したがって、合計６４１の可能な符号が存在する。
【００４２】
符号器１０２により発生された圧縮された画像信号は、伝送チャネル１０４を経由して復号器１０６に送信される。ブロックサイズ割り当て情報を含むＰＱＲデータはまた、復号器１０６に与えられる。復号器１０６は、ランレングス値および０でない値を復号する可変長復号器１２０を含む。
【００４３】
ＤＣＴ等の周波数領域法は、ピクセルのブロックを相関のより少ないそしてより少ない変換された係数の新しいブロックに変換する。このような周波数領域圧縮体系はまた、符号化体系のこの目的とする特性を改善するために、画像の中に知覚された歪みに関する知識を使用する。図３は、インターフレームコーダ３００に関するこのような処理を示す。符号化されたフレームデータは、最初にピクセル領域において３０４で、システム内に読み込まれる。符号化されたデータの各フレームはそこで、３０８でピクセルブロックの中に分割される。一つの実施例においては、ブロックサイズは可変であり、そして適応ブロックサイズディスクリート余弦変換（ＡＢＳＤＣＴ）技術を用いて割り当てられる。ブロックサイズは与えられた領域内の微細部の総量に基づいて変化する。２×２、４×４、８×８、１６×１６、あるいは３２×３２等の任意のブロックサイズが使用可能である。
【００４４】
符号化されたデータはそこで、３１２でピクセル領域から周波数領域におけるエレメントに変換するための処理を受ける。これは、図２の中に述べられたようにＤＣＴおよびＤＱＴ処理を含む。ＤＣＴ／ＤＱＴ処理はまた、“バタフライ処理装置を使用してディスクリート余弦変換を計算するための装置および方法”と題された、出願中の米国特許出願シリアル番号未知の、２００１年６月６日に出願された、代理人整理番号９９０４３７の中に記述されており、そしてそれは参照によって特に組み込まれている。
【００４５】
符号化された周波数領域エレメントはそこで３１６で量子化される。量子化は係数量子化に先立ってコントラスト感度に従った周波数重み付けを含むことが可能である。周波数領域において符号化されたデータの結果となるブロックは、符号化すべきはるかに少ない０でない係数を有している。隣接したフレーム内の、周波数領域において符号化されたデータの対応するブロックは、典型的には０の位置およびパターンおよび係数の大きさに関して、同様な特性を有している。量子化された周波数エレメントはそこで、３２０でデルタコード化される。デルタコーダは隣接フレームを横切る０でない係数に関する係数差分を計算し、そして情報を損失なく符号化する。情報を損失なく符号化することは、３２４の連続化および３２８のランレングス振幅コーディングによって達成される。一つの実施例においては、ランレングス振幅コーディングはハフマンコーディング等のエントロピーコーディングを伴っている。連続化処理３２４は、より長いランレングス、そしてそれによってデルタコーダの効率のさらなる増加を達成するために、関係するフレームを越えて延長することが可能である。一つの実施例においては、ジグザグ順序付けがまた利用される。
【００４６】
図４は、デルタコーダ４００の動作を示す。複数の隣接したフレームは、最初のフレームすなわちアンカーフレーム、および対応する隣接フレームすなわち後続フレームとして見なすことが可能である。最初に４０４においてアンカーフレームの周波数領域におけるエレメントのブロックが入力される。次のすなわち後続のフレームからのエレメントの対応するブロックはまた４０８において読み込まれる。一つの実施例においては、１６×１６のブロックサイズは、ＢＳＡによってブロックサイズの破壊を顧慮することなく使用される。しかしながら、任意のブロックサイズが使用可能であろうということが期待される。
【００４７】
一つの実施例においては、ＢＳＡによって定義されるように可変ブロックサイズが使用可能である。アンカーフレームおよび後続フレームに関する対応するエレメント間の差が４１２で決定される。一つの実施例においては、アンカーフレームおよび各後続フレーム内のブロックに関する対応するＡＣ値のみが比較される。他の実施例においては、ＤＣ値およびＡＣ値の両者が比較される。したがって、後続フレームは、差が適切なアンカーフレームと組み合わせられている限りは、４１６においてアンカーフレームおよび後続フレーム間の差の結果として表現されることが可能である。ブロックごとに処理して、アンカーフレームおよび後続フレームのすべての対応するエレメントは比較されそして差が計算される。そこで、他の後続フレームがあるか否かに関して質問４２０がなされる。もしもそうである場合は、アンカーフレームは、同じ方法で、次の後続フレームと比較される。この処理は、アンカーフレームおよびすべての組み合わせられた後続フレームが計算されるまで繰り返される。
【００４８】
一つの実施例においては、任意の数のフレームが使用可能であることが期待されているにもかかわらず、アンカーフレームは４個の後続フレームと組み合わせられる。他の実施例においては、アンカーフレームは、Ｎ個の後続フレームと組み合わせられる。ここで、Ｎは画像シーケンスの相関特性に依存する。換言すれば、一度アンカーフレームおよび与えられた後続フレーム間の計算された差が特定のしきい値と交われば、新しいアンカーフレームが確立される。一つの実施例においては、しきい値はあらかじめ設定されている。約９５％のフレーム間の相関は、許容可能なビットレートを維持する一方で、品質考慮と平衡していることが見出されてきている。しかしながら、これは基礎となっている素材に基づいて変化することが可能である。他の実施例においてはしきい値は任意の相関レベルに適合可能である。
【００４９】
なお他の実施例においては、ローリングアンカーフレームが利用される。最初の後続フレームに関する計算において、後続フレームは新しいアンカーフレーム４２４になり、そしてそのフレームのその隣接フレームとの比較が実行される。このようにして、アンカーフレームと後続フレームとの間の差の決定において、後続フレームが対抗して比較されるべき新しいアンカーフレームになる。たとえば、もしもフレーム１がアンカーフレームでありそしてフレーム２が後続フレームである場合、フレーム１およびフレーム２の間の差は上に記述された方法で決定される。フレーム２は、これによってフレーム３が対抗して比較される新しいアンカーフレームとなり、そして対応するエレメント間の差が再び計算される。この処理は、素材のすべてのフレームを通じて繰り返される。
【００５０】
実施例の観点における圧縮符号化アルゴリズムおよび方法は、多くの圧縮およびディジタルビデオ処理体系の中に含まれることが可能である。本発明の実施例は、計算機あるいはディジタルビデオに関する圧縮および符号化を実行するカスタム化された特定用途向け集積回路上に存在することが可能である。アルゴリズムそれ自身は、ソフトウエア内で、あるいはプログラマブルあるいはカスタムハードウエア内で実行可能である。
【００５１】
図１に戻り参照して、可変長復号器１２０の出力は、係数を使用された走査体系に従って順序づけする逆ジグザグ走査連続化器１２２に与えられる。逆ジグザグ走査連続化器１２２は、複合係数ブロックの中への係数の通常の順序付けを援助するために、ＰＱＲデータを受信する。
【００５２】
複合ブロックは、周波数重み付けマスクの使用に帰すべき処理を取り消すために、逆量子化器１２４に与えられる。結果となる係数ブロックはそこで、もしも差分カッドツリー変換が適用されている場合は、ＩＤＣＴエレメント１２８に先立って、ＩＤＱＴエレメント１２６に与えられる。そうでない場合は、係数ブロックは、直接にＩＤＣＴエレメント１２８に与えられる。ＩＤＱＴエレメント１２６およびＩＤＣＴエレメント１２８は、ピクセルデータのブロックを生成するために、係数を逆変換する。ピクセルデータはそこで、補間され、ＲＧＢ形式に変換され、そしてそこで将来の表示のために保存されなければならないことが可能である。
【００５３】
例として、種々の例となる論理ブロック、フローチャート、およびこの中に開示された実施例と関連して記述されたステップが、特定用途向け集積回路（ＡＳＩＣ）、プログラマブル論理デバイス、ディスクリートゲートあるいはトランジスタ論理、たとえば抵抗器およびＦＩＦＯ等のディスクリートハードウエア部品、一連のファームウエア命令を実行する処理装置、任意の従来のプログラマブルソフトウエアおよび処理装置、あるいは任意のこれらの組み合わせを備えたハードウエアあるいはソフトウエア内で実現されあるいは実行されることが可能である。処理装置は、好都合に、マイクロ処理装置であるかも知れず、しかし、代わりに処理装置は任意の従来の処理装置、制御器、マイクロ制御器あるいはステートマシンであるかもしれない。ソフトウエアは、ＲＡＭメモリ、フラッシュメモリ、ＲＯＭメモリ、抵抗器、ハードディスク、リムーバブルディスク、ＣＤ‐ＲＯＭ、ＤＶＤ‐ＲＯＭ、あるいは当業界において知られる記録媒体の任意の他の形式の中に存在することが可能である。
【００５４】
望ましい実施例に関する以上の記述は、当業界において熟練したいかなる人にも、本発明を作成し、あるいは使用することを可能にするために与えられる。これらの実施例に対する種々の修正は、当業界において熟練した人々には容易に明白であろうし、そしてここに定義された一般的な原理は、独創的能力を使用することなしに、他の実施例に適用可能である。したがって、本発明は、ここに示された実施例に限定されることを意図したものではなく、しかしここに開示された原理および新しい特徴と矛盾しない最も広い範囲に一致されるべきものである。
【図面の簡単な説明】
【００５５】
【図１】図１は、変動に基づいたブロックサイズ割り当てシステムおよび本発明の方法を合体した、画像処理システムのブロック線図である。
【図２】図２は、変動に基づいたブロックサイズ割り当てを伴う処理ステップを示しているフロー線図である。
【図３】図３は、インターフレームコーディングを伴う処理ステップを示しているフロー線図である。
【図４】図４は、デルタコーダの動作を伴う処理ステップを示しているフロー線図である。
【符号の説明】
【００５６】
１００…画像処理システム、１０２…符号器、１０４…伝送チャネル、１０６…復号器、１０８…エレメント、１１０…ＤＣＴエレメント、１１２…ＤＱＴエレメント、１１４…量子化器、１１５…デルタコーダ、１１６…連続化器、１１８…可変長コーダ、１２０…可変長復号器、１２２…逆ジグザグ走査連続化器、１２４…逆量子化器、１２６…ＩＤＱＴエレメント、１２８…ＩＤＣＴエレメント、３００…インターフレームコーダ、３２４…連続化処理、４００…デルタコーダ、４２０…質問、４２４…アンカーフレーム、

Claims

ディジタルビデオを符号化するためのシステムにおいて、なおディジタルビデオはアンカーフレームおよび少なくとも１個の後続フレームを含んでおり、なおアンカーフレームおよび各後続フレームは複数のピクセルエレメント、インターフレームコーディングの方法を含んでおり、方法は、
アンカーフレームおよび各後続フレームの複数のピクセルを、ピクセル領域エレメントから周波数領域エレメントに変換し、なお周波数領域エレメントはＤＣエレメントおよびＡＣエレメントとして表されることが可能であり、
周波数領域エレメントを、人間の視覚システムにとってより敏感であるこれらのエレメントを強調し、そして人間の視覚システムにとって《より少なく敏感である》これらのエレメントを《強調しない》ために量子化し、そして
アンカーフレームの各量子化された周波数領域エレメント、および各後続フレームの対応する量子化された周波数領域エレメント間の差を決定する、
ことを含む方法。
ここで、変換の動作はディスクリート余弦変換（ＤＣＴ）を利用している、請求項１記載の方法。
ここで、変換の動作はさらにディスクリートカッドツリー変換（ＤＱＴ）を利用している、請求項２記載の方法。
ここで、量子化の動作はさらに周波数重み付けマスクを使用してエレメントを重み付けすることを含む、請求項１記載の方法。
ここで、量子化の動作はさらに量子化器ステップ機能（関数？）の利用を含む、請求項４記載の方法。
ここで、４個の後続フレームはアンカーフレームに対して比較される、請求項１記載の方法。
ここで、ＡＣ量子化された周波数領域エレメント間の差のみが決定される、請求項１記載の方法。
さらに、複数のピクセルエレメントを１６×１６ブロックサイズに分類することを含む、請求項１記載の方法。
ここで、量子化の動作は損失のない周波数領域エレメントをもたらす、請求項１記載の方法。
ここで、量子化の動作は損失のある周波数領域エレメントをもたらす、請求項９記載の方法。
さらに、後続のフレームを、アンカーフレームの量子化された周波数領域エレメントおよび後続フレームの対応する周波数領域エレメント間の差として表すことを含む、請求項１記載の方法。
さらに、量子化された周波数領域エレメントを連続化することを含む、請求項１記載の方法。
さらに、連続化された、量子化された周波数領域エレメントを可変長コーディングすることを含む、請求項１２記載の方法。
ディジタルビデオを符号化するためのシステムにおいて、なおディジタルビデオは複数のフレーム、１、２、３、…、Ｎを含んでおり、なお各フレームは複数のピクセルエレメント、インターフレームコーディングの方法を含んでおり、方法は、
各フレームの複数のピクセルを、ピクセルエレメントから周波数領域エレメントに変換し、なお周波数領域エレメントは列および行の中に表されることが可能であり、
周波数領域エレメントを、人間の視覚システムにとってより敏感なこれらのエレメントを強調し《ｄｅｍｐｈａｓｉｚｅは誤りと思われる》、人間の視覚システムにとってより少なく敏感であるこれらのエレメントを強調しないために量子化し、そして
第１のフレームに関する量子化された周波数領域エレメント、および第２のフレームに関する対応する量子化された周波数領域エレメント間の差を決定し、そして
連続したフレームの量子化された周波数領域エレメント間の差を、各フレームの量子化された周波数領域エレメントがそのすぐ前に先行するフレームの量子化された周波数領域エレメントに対して比較されるようにして、決定する処理を繰り返す
ことを含む、方法。
さらに、各フレーム２からＮを、フレーム２からＮの量子化された周波数領域エレメントおよびフレーム１からＮ−１の対応する周波数領域エレメントそれぞれの間の差として表すことを含む、請求項１４記載の方法。
ここで、変換の動作はディスクリート余弦変換（ＤＣＴ）を利用する、請求項１４記載の方法。
ここで、変換の動作はさらにディスクリートカッドツリー変換（ＤＱＴ）を利用する、請求項１６記載の方法。
ここで、量子化の動作はさらに周波数重み付けマスクを使用してエレメントを重み付けすることを含む、請求項１４記載の方法。
ここで、量子化の動作はさらに量子化器ステップ機能を利用する、請求項１８記載の方法。
ここで、ＡＣ量子化された周波数領域エレメント間の差のみが決定される、請求項１４記載の方法。
さらに、複数のピクセルエレメントを１６×１６ブロックサイズに分類することを含む、請求項１４記載の方法。
ここで、決定する動作は損失のない周波数領域エレメントをもたらす、請求項１４記載の方法。
ここで、決定する動作は損失のある周波数領域エレメントをもたらす、請求項１４記載の方法。
さらに、後続するフレームを、アンカーフレームの量子化された周波数領域エレメント、および後続するフレームの対応する周波数領域エレメント間の差として表すことを含む、請求項１４記載の方法。
さらに、量子化された周波数領域エレメントを連続化することを含む、請求項１４記載の方法。
さらに、連続化された量子化された周波数領域エレメントを可変長コーディングすることを含む、請求項２５記載の方法。
ここで、可変長符号化された、連続化された量子化された周波数領域エレメントは、ハフマン符号化される、請求項２６記載の方法。
ディジタルビデオを符号化するためのシステムにおいて、なおディジタルビデオはアンカーフレームおよび少なくとも１個の後続フレームを含んでおり、なおアンカーフレームおよび各後続フレームは複数のピクセルエレメント、インターフレームコーディングのために形成された装置を含んでおり、方法は、
アンカーフレームおよび各後続フレームの複数のピクセルを、ピクセル領域エレメントから周波数領域エレメントに変換するための手段と、なお周波数領域エレメントは、ＤＣエレメントおよびＡＣエレメントとして表示されることが可能であり、
周波数領域エレメントを、人間の視覚システムにとってより敏感なこれらのエレメントを強調し、そして人間の視覚システムにとってより少なく敏感であるこれらのエレメントを強調しないために、周波数領域エレメントを量子化するための手段と、そして
アンカーフレームの各量子化された周波数領域エレメントおよび各後続フレームの対応する量子化された周波数領域エレメント間の差を決定するための手段とを含む、
方法。
ここで、変換するための手段はディスクリート余弦変換（ＤＣＴ）を利用する請求項２８記載の装置。
ここで、変換するための手段はさらにディスクリートカッドツリー変換（ＤＱＴ）を利用する、請求項２９記載の装置。
ここで、量子化するための手段はさらに周波数重み付けマスクを用いてエレメントを重み付けすることを含む、請求項２８記載の装置。
ここで、量子化するための手段はさらに量子化器ステップ機能を利用することを含む、請求項３１記載の装置。
ここで、４個の後続フレームはアンカーフレームに対して比較される、請求項２８記載の装置。
ここで、決定するための手段は、ＡＣ量子化された周波数領域エレメント間の差が決定されるかのみを決定する、請求項２８記載の装置。
さらに、複数のピクセルエレメントを１６×１６ブロックサイズに分類するための手段を含む、請求項２８記載の装置。
ここで、量子化のための手段は損失のない周波数領域エレメントをもたらす、請求項２８記載の装置。
ここで、量子化のための手段は損失のある周波数領域エレメントをもたらす、請求項３６記載の装置。
さらに、後続フレームを、アンカーフレームの量子化された周波数領域エレメント、および後続フレームの対応する周波数領域エレメント間の差として表すための手段を含む、請求項２８記載の装置。
さらに、量子化された周波数領域エレメントを連続化するための手段を含む、請求項２８記載の装置。
さらに、連続化された、量子化された周波数領域エレメントを可変長コーディングするための手段を含む、請求項３９記載の装置。
ディジタルビデオを符号化するためのシステムにおいて、なおディジタルビデオは複数のフレーム１、２、３、…、Ｎを含んでおり、なお各フレームは複数のピクセルエレメント、インターフレームコーディングの方法を含んでおり、装置は、
各フレームの複数のピクセルをピクセルエレメントから周波数領域エレメントに変換するための手段と、なお周波数領域エレメントは列および行の中に表示されることが可能であり、
周波数領域エレメントを、人間の視覚システムにとってより敏感であるこれらのエレメントを強調し、そして人間の視覚システムにとってより少なく敏感であるこれらのエレメントを強調しないために、量子化するための手段と、そして
第１のフレームの量子化された周波数領域エレメント、および第２のフレームの対応する量子化された周波数領域エレメント間の差を決定するための手段と、そして
連続したフレームの量子化された周波数領域エレメント間の差を、各フレームの量子化された周波数領域エレメントがそのすぐ前に先行するフレームの量子化された周波数領域エレメントに対して比較されるようにして、決定する処理を繰り返すための手段とを含む、
装置。
さらに、各フレーム２からＮを、フレーム２からＮの量子化された周波数領域エレメント、およびそれぞれフレーム１からＮ−１の対応する周波数領域エレメント間の差として表すための手段を含む、請求項４１記載の装置。
さらに、後続のフレームを、アンカーフレームの量子化された周波数領域エレメント、および後続フレームの対応する周波数領域エレメント間の差として表現するための手段を含む、請求項４１記載の装置。
ディジタルビデオを符号化するためのシステムにおいて、なおディジタルビデオは複数のフレーム１、２、３、…、Ｎを含んでおり、なお各フレームは複数のピクセルエレメント、インターフレームコーディングの方法を含んでおり、装置は、
各フレームの複数のピクセルをピクセルエレメントから周波数領域エレメントに変換するよう形成されたＤＣＴ／ＤＱＴ変圧器と、なお周波数領域エレメントは列および行の中に表示されることが可能であり、
人間の視覚システムにとってより敏感なこれらのエレメントを強調し、そして人間の視覚システムにとってより少なく敏感であるこれらのエレメントを強調しないために、周波数領域エレメントを量子化するよう形成された変圧器に接続された量子化器と、そして
第１のフレームの量子化された周波数領域エレメント、および第２のフレームの対応する量子化された周波数領域エレメント間の差を決定し、そして連続したフレームの量子化された周波数領域エレメント間の差を、各フレームの量子化された周波数領域エレメントは、そのすぐ前に先行するフレームの量子化された周波数領域エレメントに対して比較されるように、決定する処理を繰り返すよう形成された量子化器に接続されたデルタコーダと
を含む装置。
ここで、ＡＣ量子化された周波数領域エレメント間の差のみが決定される、請求項４４記載の装置。
さらに、複数のピクセルエレメントを可変ブロックサイズに分類するよう形成された、ブロックサイズ割り当てを含む、請求項４４記載の装置。
ここで、デルタコーダは損失のない周波数領域エレメントを生成する、請求項４４記載の装置。
ここで、デルタコーダは損失のある周波数領域エレメントを生成する、請求項４４記載の装置。
さらに、量子化された周波数領域エレメントを受信し、そして量子化された周波数領域エレメントを再配列するよう形成された量子化器に接続された連続化器を含む、請求項４４記載の装置。
さらに、量子化された周波数領域エレメントを、可変長符号化するよう形成された連続化器に接続された可変長コーダを含む、請求項４９記載の装置。