JP2004007526A

JP2004007526A - データ圧縮装置及び方法

Info

Publication number: JP2004007526A
Application number: JP2003090687A
Authority: JP
Inventors: Nicholas Ian Saunders; サウンダーズ　ニコラス　アイアン; Robert Mark Stephan Porter; ポーター　ロバート　マーク　ステファン
Original assignee: Sony United Kingdom Ltd
Current assignee: Sony Europe BV United Kingdom Branch
Priority date: 2002-03-28
Filing date: 2003-03-28
Publication date: 2004-01-08
Also published as: US20030215152A1; GB0207455D0; EP1351518A3; GB2387059A; EP1351518A2

Abstract

【課題】多世代圧縮におけるエラーを低減し、及び／又は同様の素材を量子化したときの変動を小さくする。
【解決手段】利用可能な量子化の程度のセットの中から取り出された量子化の程度でデータの量子化を実行することによって、所定のターゲット出力データ量に基づき、入力データを圧縮するデータ圧縮装置において、利用可能な量子化の程度のセットのサブセットの中から取りだされた個々の試し量子化の程度で試し量子化を実行する１以上の試し量子化器と、試し量子化器の結果に応じて、ターゲット出力データ量を超えない条件を満たす最終的な量子化の程度を利用可能な量子化の程度のセットの中から選択する選択器と、最終的な量子化の程度で入力データを量子化する最終量子化器とを備える。
【選択図】　図１

Description

【０００１】
【発明の属する技術分野】
本発明はデータ圧縮に関する。
【０００２】
【従来の技術】
データ圧縮技術は、制限された帯域幅内で動的に変化する通信チャンネルによってサポートされているビットレートでデータ通信を行うために、データ通信分野で広く採用されている。代表的には、画像データは、伝送又は適当な記憶媒体に蓄積する前に圧縮され、画像の再生に先立ち伸長される。
【０００３】
データ圧縮技術は、静止画像の場合は空間的な冗長度を利用し、動画像の場合は空間及び時間の双方の冗長度を利用する。時間的冗長度は、動画像において時系列における連続した画像、特に同一シーンに属する画像が非常に類似している場合に発生する。モーションピクチャーエキスパーツグループ（Ｍｏｔｉｏｎ　ＰｉｃｔｕｒｅＥｘｐｅｒｔｓ　ｇｒｏｕｐ：以下、ＭＰＥＧという。）は、娯楽及び放送の用途におけるビデオ圧縮符号化の国際的標準を規定している。本発明は、低いデータ圧縮率を用いて非常に高いデータレート（１Ｇｂｉｔ／ｓまで）で動作するハイエンドのビデオハードウェアに対するＭＰＥＧ４「スタジオプロファイル」規格の実現に関する（なお、本発明は、これに限定されるものではない）。
【０００４】
離散コサイン変換（Ｄｉｓｃｒｅｅｔ　Ｃｏｓｉｎｅ　Ｔｒａｎｓｆｏｒｍ：以下、ＤＣＴという）の量子化は、ビデオデータの符号化技術で広く用いられている。ＤＣＴの量子化は、データの伝送又は蓄積に先立ち、入力画像データを表すのに必要なデータのワード長を低減する画像圧縮において使用される。ＤＣＴの量子化処理において、画像は、規則的なサイズの画素値のブロックに分割され、殆どの場合、各ブロックは、横８画素、縦８画素（８_Ｈ×８_Ｖ）で構成される。従来のデータフォーマットにおいて、ビデオデータは、通常、カラー画像における赤、緑、青（ＲＧＢ）成分、あるいは輝度成分Ｙと２つの色差成分Ｃｂ、Ｃｒに対応する３つの成分を有する。全ての３つのＲＧＢ又はＹＣｂＣｒ信号成分に対応する画素ブロックのグループはマクロブロック（ＭＢ）と呼ばれる。
【０００５】
ＤＣＴは、画像の空間領域から空間周波数領域への変換を表し、画素値のブロックを同一次元を有する変換係数のブロックに有効に変換する。ＤＣＴ係数は、画像ブロックの空間周波数成分を表す。各係数は、適当な基底関数に適用される重みとみなすことができ、基底関数の重み付け和が入力画像を完全に表現している。ＤＣＴ係数の各８_Ｈ×８_Ｖブロックは、ゼロ空間周波数を表す１個の「ＤＣ」成分と６３個の「ＡＣ」成分からなる。ＤＣＴ係数の最大値は、殆どの場合、低い空間周波数のＤＣＴ係数に対応している。画像にＤＣＴを施すだけでは、必ずしも圧縮することはできず、単に画像データを空間領域から空間周波数領域に変換するだけである。圧縮を達成するためには、各ＤＣＴ係数は量子化除数（ｑｕａｎｔｉｓａｔｉｏｎ　ｄｉｖｉｓｏｒ）と呼ばれる正の整数で除算され、商は一番近い整数に切り上げ又は切り捨てすることにより丸められる。量子化除数を大きくすることにより、データをより圧縮することができるが、その代償として量子化が粗くなる。量子化を粗くするほど、再生画像の画質がより劣化する。ＤＣＴ係数の切上げ又は切捨てによる丸めの結果として、量子化によるアーティファクトが再生画像に発生する。圧縮画像の再生の際には、各ＤＣＴ係数は量子化ステップによる、当初の商ではなく、（最も近い整数に丸められた整数である）量子化係数を乗算することにより再生されるが、このことはＤＣＴ係数の当初の精度が確保されないことを意味する。したがって、量子化は「有ひずみ（ｌｏｓｓｙ）」符号化技術である。
【０００６】
画像データ圧縮システムでは、殆どの場合、所定の出力ビットレートを達成する最適の量子化除数を決定するために、一連の試し（ｔｒｉａｌ）圧縮を行っている。試し量子化は、例えば、可能な量子化除数の全範囲に亘って分散した２０個の可能な量子化除数で実行される。ターゲットビットレートの直ぐ上と直ぐ下に位置する予測出力ビットレートを与える２つの隣接した試し量子化除数を見つけ、この２つの値間で更に細かな探索を実行する。典型的には、画像圧縮を実行するために選ばれる量子化除数は、ターゲットビットレートを達成しつつ粗さが最小の量子化を与える量子化除数である。
【０００７】
粗さが最小の量子化除数を選択すると、過去に１回以上の圧縮／伸長サイクルを経験したことがない「ソース（ｓｏｕｒｃｅ）」画像データに対して、再生の際に最良の画質（すなわちノイズが最少の画像）が得られるが、このことは、「非ソース（ｎｏｎ−ｓｏｕｒｃｅ）」画像データに対しては必ずしも成立しないことが判明している。圧縮と伸長が１回行われた画像は第１世代の画像と呼ばれ、過去に２回圧縮／伸長サイクルが行れた画像は第２世代と呼ばれ、以下同様に高い世代となる。
【０００８】
第２世代の再生画像では、殆どの場合、第１世代の再生画像の対応する量子化除数でのノイズと比較して、画像ノイズが量子化除数の全範囲で体系的に高くなる。このことは、量子化の各処理（ｅａｃｈ　ｓｔａｇｅ）で生じるＤＣＴ係数の丸め誤差の問題として理解される。しかしながら、第２世代の量子化除数を第１世代の量子化除数と略等しく選んだ場合、第２世代の再生画像のノイズレベルは、第１世代の再生画像のノイズレベルと略等しくなることが知られている。したがって、非ソース入力画像データに対しては、所要のデータレートを満たし、可能な限り最小の大きさを有する量子化除数は、必ずしも再生画像の最良の画質をもたらさない。代わりに、前の圧縮／伸長サイクルで用いられた量子化除数に略等しい量子化除数により、再生画像の最良の画質が得られる可能性が高い。なお、量子化除数の選択は、特定の通信チャンネルの世代毎に変わる可能性があるターゲットビットレートによって制限される。
【０００９】
上述したように、データ圧縮処理の一処理として、一連の試し圧縮処理を実行して所定の出力ビットレートを達成する最適の量子化除数を決定する。ビット割当（ｂｉｔ　ａｌｌｏｃａｔｉｏｎ）と呼ばれる処理を実行し、各マクロブロック毎にターゲットビットカウントを算出する。このビット割当計算は、試し量子化除数に依存して発生するビット数を解析する処理を含む。ビット割当部は、試し量子化によって算出されたビットカウントに基づき、マクロブロックのターゲットビットカウントを算出する。更に、２分探索（ｂｉｎａｒｙ　ｓｅａｒｃｈ）と呼ばれる処理によって、マクロブロックのターゲットビットカウントの条件を満たす粗さが最小の量子化除数を見つけ出す。
【００１０】
【発明が解決しようとする課題】
試しビット割当点の間隔（ｓｐａｃｉｎｇ）は、マクロブロックのターゲットビットカウントの外挿値（ｅｘｔｒａｐｏｌａｔｅｄ　ｖａｌｕｅｓ）に影響を与える。このことは、最良の画像品質を確保するために世代に亘ってＭＢターゲットが反復可能でなければばならない多世代（ｍｕｌｔｉ−ｇｅｎｅｒａｔｉｏｎ）画像データを取り扱う際に大きな問題となる。また、後世代の画像のために、ビット割当処理によって適切な量子化除数を選択することも重要である。また、ビット割当処理によって選択された量子化除数を用いて、２分探索と呼ばれる高い分解能による一連の試し量子化を行うための開始点を定める。多世代の画像データに亘って正確且つ反復可能なターゲットを達成するために、試しビット割当ポイントの間隔を決定することが問題となっている。
【００１１】
【課題を解決するための手段】
本発明は、データ圧縮装置を提供する。利用可能な量子化の程度のセットの中から取り出された量子化の程度でデータの量子化を実行することによって、所定のターゲット出力データ量に基づき、入力データを圧縮するデータ圧縮装置において、利用可能な量子化の程度のセットのサブセットの中から取りだされた個々の試し量子化の程度で試し量子化を実行する１以上の試し量子化器と、試し量子化器の結果に応じて、ターゲット出力データ量を超えない条件を満たす最終的な量子化の程度を利用可能な量子化の程度のセットの中から選択する選択器と、最終的な量子化の程度で入力データを量子化する最終量子化器とを備える。
【００１２】
試し量子化処理において、利用可能な量子化の程度（ａｖａｉｌａｂｌｅ　ｄｅｇｒｅｅｓ　ｏｆ　ｑｕａｎｔｉｓａｔｉｏｎ）のサブセットから取り出した１以上の量子化の程度を使用することを確保することによって、世代に亘って等しい結果、あるいは類似のデータが得られる可能性が高くなり、結果として多世代圧縮におけるエラーを低減し、及び／又は同様の素材を量子化したときの変動を小さくすることができる。
【００１３】
【発明の実施の形態】
図１は、データ圧縮システムの構成を模式的に示す図である。このデータ圧縮システムは、符号化装置（ｅｎｃｏｄｅｒ）１０と、データ処理装置（ｄａｔａ　ｐｒｏｃｅｓｓｉｎｇｍｏｄｕｌｅ）２０と、復号装置（ｄｅｃｏｄｅｒ）３０とを備える。入力の高品位（ｈｉｇｈ　ｄｉｆｉｎｉｔｉｏｎ）ビデオ信号５は、符号化装置１０に供給される。符号化装置１０は、冗長度を除去し、その統計的性質を利用するためにビデオ画像データをモデル化し、入力画像データ５の情報を圧縮フォーマットで表現する出力データシンボルを生成する。符号化装置１０は、圧縮データ信号１５Ａを出力し、この圧縮データ信号１５Ａはデータ処理装置２０に供給され、そこで、通信チャンネルを介して伝送されるか、又は記録媒体に格納される。記録媒体から読み出された、又は通信チャンネルを介して受信された圧縮データ信号１５Ｂは、復号装置３０に供給され、復号装置３０は、圧縮データ信号１５Ｂを復号して高品位の出力画像信号３５を形成する。
【００１４】
図２は、図１のビットレートを低減する符号化装置１０の具体的な構成を示すブロック図である。高品位ビデオのフレームにおける入力ＲＧＢチャンネルに対応するデータ信号Ｄ１、Ｄ２、Ｄ３は、シャッフル部（ｓｈｕｆｆｌｅ　ｕｎｉｔ）１００に供給される。他の具体例として、データは、ＹＣｂＣｒフォーマットで供給することもできる。更に、画像は、プログレッシブフレームモードとインタレースフィールドモードのいずれでも処理することができる。シャッフル部１００は、入力データをマクロブロックユニット（Ｍａｃｒｏ−Ｂｌｏｃｋ　Ｕｎｉｔ：以下、ＭＢＵという）に分割する。この具体例では、１フレームは４０個のＭＢＵからなり、各ＭＢＵは２０４個のＭＢからなる。各入力フレームの画像サンプルは、外部ＳＤＲＡＭ２００に一時的に書き込まれる。このシャッフル書込処理中に、後続の符号化処理で必要とされる２つの量子化除数パラメータＱ＿ＳＴＡＲＴ、ＤＣＴ＿ＰＲＥＣＩＳＩＯＮの値が算出される。画素ブロックが外部ＳＤＲＡＭ２００から、入力画像フレーム内の隣接した画素ブロックがシャッフル順序では隣接した位置で読み出されないように画像データをインタリーブする所定のシャッフル順序に従って、読み出される。
【００１５】
シャッフル処理により、復号装置３０によって再生される画像におけるデータ消失の影響が軽減される。入力ビデオフレームにおいて隣接した画素ブロックは、シャッフルされたビットストリームでは、離れている。短時間のデータ消失により、ビットストリームの連続した一部が損なわれ、幾つかのデータブロックが影響を受けるが、これらのブロックは、シャッフル処理のために再生画像内では連続していない。したがって、データ隠蔽（ｃｏｎｃｅａｌｍｅｎｔ）を適切に用いて、消失したブロックを再構成することができる。シャッフル処理は、可変速再生（ｓｕｔｔｌｅ　ｐｌａｙｂａｃｋ）時の画質を改善することができる。更に、シャッフル処理は、入力ビデオデータをＭＢＵに疑似ランダム的に分配することによって画像フレームの各ＭＢＵに選択された量子化パラメータの変化の度合い（ｖａｒｉａｔｉｏｎ）を低減することができる。
【００１６】
現画像フレームは、外部ＳＤＲＡＭ２００から前フレームをシャッフルされたフォーマットで読み出している間に、外部ＳＤＲＡＭ２００に書き込まれる。シャッフル部１００は、２対の出力信号を生成し、第１の信号対は、信号Ｓ＿ＯＰ＿Ｄ１と信号Ｓ＿ＯＰ＿Ｄ２からなり、第２の信号対は、同じＭＢＵデータを含むが、第１の信号対に対して約１ＭＢＵ遅延された信号Ｓ＿ＯＰ＿ＤＤ１と信号Ｓ＿ＯＰ＿ＤＤ２からなる。この遅延は、Ｑ割当部（Ｑ　ａｌｌｏｃａｔｉｏｎ　ｕｎｉｔ）３００に内蔵されているビット割当器（ｂｉｔ　ａｌｌｏｃａｔｉｏｎ　ｍｏｄｕｌｅ）４００の処理による遅延を補償するためのものである。Ｑ割当部３００は、第１の信号対Ｓ＿ＯＰ＿Ｄ１、Ｓ＿ＯＰ＿Ｄ２を用いて、適切な符号化モードと、ＭＢＵの各ＭＢに対するＱ＿ＳＣＡＬＥパラメータと呼ばれる量子化除数を測定する（ｄｅｔｅｒｍｉｎｅ）。
【００１７】
シャッフル部１００から出力される信号は、Ｑ割当部３００に供給され、このＱ割当部３００は、ビット割当器４００と、ターゲット挿入器５００と、ＤＣＴ変換器６００と、２分探索（ｂｉｎａｒｙ　ｓｅａｒｃｈ　ｍｏｄｕｌｅ）器７００とを備える。シャッフル部１００から出力される第１の信号対Ｓ＿ＯＰ＿Ｄ１、Ｓ＿ＯＰ＿Ｄ２は、ビット割当器４００に入力される。これらの入力信号は、ラスタ走査された１２ビットビデオサンプルの８_Ｈ×８_Ｖ縦ブロックからなる。
【００１８】
ビット割当器４００は、無ひずみ（ｌｏｓｓｌｅｓｓ）の差分パルス符号変調（ｄｉｆｆｅｒｅｎｔｉａｌ　ｐｕｌｓｅ　ｃｏｄｅ　ｍｏｄｕｌａｔｉｏｎ：以下、ＤＰＣＭという）符号化とＤＣＴ量子化符号化を比較する。
【００１９】
ＤＰＣＭは、画像内の空間的に近い画素は相関が高いことを利用した簡単な画像圧縮技術である。ＤＰＣＭでは、画素値自体は伝送されない。代わりに、符号化装置により、前に送信した画素値に基づいた画素の期待値が予測される。１回のＤＰＣＭ符号化処理（ｓｉｎｇｌｅ　ＤＰＣＭ　ｅｎｃｏｄｉｎｇ　ｓｔａｇｅ）は、ＤＰＣＭリフォーマットと、ＤＰＣＭ変換と、エントロピー符号化計算を含む。
【００２０】
これに対し、ＤＣＴ量子化符号化の処理は、１回のＤＣＴ変換と、一連の量子化除数を用いた複数回の量子化処理を含み、各量子化処理の後にハフマン（Ｈｕｆｆｍａｎ）エントロピー符号化計算が行われる。この具体例では、６個の試し（ｔｒｉａｌ）量子化除数がビット割当器４００により試験される。ハフマン符号化は、既知の無ひずみ圧縮技術であり、出現頻度の高い値は短い符号で、出現頻度の低い値は長い符号で表現される。ＤＣＴ試し符号化処理は、オプションとして、画像領域の「アクティビティ（ａｃｔｉｖｉｔｙ）」に依存した量子化を含む。アクティビティは、画像ブロックの適切に正規化された画素の分散（ｖａｒｉａｎｃｅ）から算出される尺度（ｍｅａｓｕｒｅ）である。高いアクティビティを有する画像ブロックでは、量子化をより粗くしても、見る人には知覚されにくいことが知られているので、各ブロックの量子化ステップを、アクティビティのレベルに応じて適切に調整することができる。アクティビティを考慮することにより、再生画像の知覚的な画質を維持したまま、圧縮率をより高めることができる。
【００２１】
ＤＰＣＭ及びＤＣＴ量子化の試し符号処理により、所要の符号化ビットレートに基づいた所定のフレームのターゲットビット数によって制限されるＭＢのターゲットビット数を計算する。各ＭＢに対して最少の符号化ビットが得られるモード（ＤＣＴかＤＰＣＭ）が選択される。ビット割当器４００は、信号４０５をターゲット挿入器５００に出力する。この信号４０５は、各マクロブロックに対して選択された符号化モードと、２分探索器７００で使用される量子化除数Ｑ＿ＳＣＡＬＥの値Ｑ＿ＢＡＳＥと、各マクロブロックに対するターゲットビット数（ｂｉｔ　ｃｏｕｎｔ　ｔｒａｇｅｔ）とに関する情報を含んでいる。信号４０５に含まれる各マクロブロック毎のＱ＿ＢＡＳＥ値、符号化モード情報及びビットターゲットは、ターゲット挿入器５００によって、対応する遅延された画像データのビットストリームに付加される。ターゲット挿入器５００は、２つの信号５０５Ａ、５０５Ｂを出力し、これらの信号はＤＣＴ変換器６００に入力として供給される。
【００２２】
ＤＣＴ変換器６００で再びＤＣＴ係数を計算するが、今回は画像データの遅延バージョンに基づき計算を行う。ＤＣＴ変換器６００は、データを２分探索器７００に出力する。２分探索器７００は、各ＤＣＴモードのＭＢに対して２回目の（ｓｅｃｏｎｄ　ｓｔａｇｅ）Ｑ割当を実行するとともに、２分探索法を用いて、各マクロブロックに対して適切な量子化除数を測定する。２分探索器７００は、ビット割当器４００で使用された分解能より高い分解能で（使用可能な量子化除数の範囲内で）量子化除数を測定し、ビット割当部４００によって設定されたターゲットに合う最小の利用可能なＱ＿ＳＣＡＬＥを各マクロブロックに対して見つけ出す。実際には、５回の２分探索における開始点を定めるためにＱ＿ＢＡＳＥを用いて、ＤＣＴモードの各マクロブロックに対してより高い分解能の量子化ステップＱ＿ＡＬＬＯＣが選択されるようにする。ＤＰＣＭモードのマクロブロックは、バイパス機能によって２分探索器７００を通過するので、その出力においてデータは変更されてない。
【００２３】
２分探索器７００からの出力は、ＤＣＴモードの各マクロブロックに対する量子化ステップの値Ｑ＿ＡＬＬＯＣを含み、逆戻り探索（ｂａｃｋｓｅａｒｃｈ）器８００に供給される。逆戻り探索器８００は、各ＭＢに対して選択された値Ｑ＿ＡＬＬＯＣが符号化のための「最良」の量子化スケールであることを検査（ｃｈｅｃｋ）する。上述したように、前に１回以上の符号化／復号化サイクルを経験したことがある画像データについては、所定のターゲットビット数（ｔａｒｇｅｔ　ｂｉｔ　ｃｏｕｎｔ）を達成できる最も粗さが小さい量子化が必ずしもそのマクロブロックに対して可能な限り小さい量子化誤差をもたらさない。代わりに、最小の量子化誤差は、前回の符号化／復号化サイクルで使用された量子化除数に略等しい量子化除数を用いることによって達成される可能性が高い。したがって、逆戻り探索器８００は、値Ｑ＿ＡＬＬＯＣから始まり、より粗い量子化となる様々な量子化除数に対する量子化誤差を評価する。逆戻り探索器８００は、可能な限り最も小さい量子化誤差を実際に発生する量子化ステップＱ＿ＦＩＮＡＬを決定する（ｄｅｔｅｒｍｉｎｅ）。試し量子化はＤＣＴモードのマクロブロックに対してのみ行われ、ＤＰＣＭモードのマクロブロックに対してはバイパス機能が適用される。
【００２４】
逆戻り探索器８００から出力される、選択された量子化ステップＱ＿ＦＩＮＡＬと、ＤＣＴ符号化器６００で生成されたＤＣＴブロックは、量子化器９００に供給され、ここで、最終的な量子化が実行される。量子化処理は、以下のようにして行われる。
【００２５】
ＤＣＴモードの符号化では、各８_Ｈ×８_Ｖブロックの１つのＤＣ係数は、次式に従って量子化される。
【００２６】
Ｑ（ＤＣ）＝ＤＣ／（ＤＣ＿ＱＵＡＮＴ＊ＤＣＴ＿ＳＣＡＬＥＲ）
ここで、ＤＣは量子化前の係数であり、ＤＣ＿ＱＵＡＮＴは、方式（ｓｙｓｔｅｍ）によって設定されている量子化ファクタ（ｑｕａｎｔｉｓａｔｉｏｎ　ｆａｃｔｅｒ）であり、全てのＭＢを量子化するのに用いられる。ＤＣ＿ＱＵＡＮＴは、下記表に示すように、ＤＣ＿ＰＲＥＣＩＳＩＯＮから決定される。
【００２７】
【表１】

【００２８】
ＤＣ＿ＰＲＥＣＩＳＩＯＮは、各フレームに対して固定値、好ましくは００に設定されているる。
【００２９】
ＤＣＴ＿ＳＣＡＬＥＲは、量子化除数パラメータＤＣＴ＿ＰＲＥＣＩＳＩＯＮを指数とすることによって決定される量子化ファクタであり、ＤＣＴ＿ＳＣＡＬＥＲ＝２^{ＤＣＴ＿ＰＲＥＣＩＳＩＯＮ}である。この具体例では、規格（ｃｏｎｖｅｎｔｉｎ）が用いられ、量子化除数パラメータＤＣＴ＿ＰＲＥＣＩＳＩＯＮは４つの可能な値０、１、２、３を取り、３は最も粗い量子化に対応している。なお、ＭＰＥＧスタジオプロファイル標準規格では、これとは異なり、ＤＣＴ＿ＰＲＥＣＩＳＩＯＮ＝０が最も粗い量子化に対応し、ＤＣＴ＿ＰＲＥＣＩＳＩＯＮ＝３が最小粗さの量子化に対応している。
【００３０】
同様に、ブロックの６３個のＡＣ係数は、次式に従って量子化される。
【００３１】
Ｑ（ＡＣ）＝（ＡＣ＊１６）／（Ｑ＿ＭＡＴＲＩＸ＊ＡＣ＿ＱＵＡＮＴＩＳＥ＊ＤＣＴ＿ＳＣＡＬＥＲ）
ここで、ＡＣは量子化前の係数であり、Ｑ＿ＭＡＴＲＩＸは、ＤＣＴブロックの各要素に１つ１つが対応した６４個の重みの配列である。量子化除数Ｑ＿ＳＣＡＬＥは、Ｑ＿ＳＣＡＬＥ＿ＴＹＰＥによって定まる線形量子化スケール又は非線形量子化スケールに対応したファクタである。各Ｑ＿ＳＣＡＬＥ＿ＴＹＰＥは、Ｑ＿ＳＣＡＬＥ＿ＣＯＤＥ（１）〜Ｑ＿ＳＣＡＬＥ＿ＣＯＤＥ（３１）で示される３１個の可能な値からなる。図３の表は、全３１個のＱ＿ＳＣＡＬＥ＿ＣＯＤＥに対する各Ｑ＿ＳＣＡＬＥ＿ＴＹＰＥに対応した量子化除数Ｑ＿ＳＣＡＬＥの値を示したものである。上記式において、ＮＯＲＭ＿ＡＣＴは、正規化されたアクティビティファクタであり、「アクティビティオン（ａｃｔｉｖｉｔｙ　ｏｎ）」の場合に０．５〜２．０の範囲にあるが、「アクティビティオフ（ａｃｔｉｖｉｔｙ　ｏｆｆ）」の場合は１に等しくなる。
【００３２】
ＡＣ＿ＱＵＡＮＴＩＳＥ＝ＮＯＲＭ＿ＡＣＴ＊Ｑ＿ＳＣＡＬＥとし、除数の一部として組み込まれる前に、最も近い量子化除数Ｑ＿ＳＣＡＬＥ（すなわち、図３の表におけるＱ＿ＳＣＡＬＥ＿ＣＯＤＥに対応するＱ＿ＳＣＡＬＥ）に丸められる。
【００３３】
量子化の結果Ｑ（ＤＣ）、Ｑ（ＡＣ）は、正規無限丸め（ｎｏｒｍａｌ　ｉｎｆｉｎｉｔｙ　ｒｏｕｎｄｉｎｇ）と呼ばれる方法で丸められる。この方法は、０．５より小さい正数を（ゼロに）切り捨て、０．５以上の整数を正の無限大に切り上げ、−０．５より大きな負数をゼロに切り上げ、−０．５以下の負数を負の無限大に切り捨てることにより丸める。
【００３４】
ビット割当器４００、２分探索器７００及び逆戻り探索器８００のそれぞれは、量子化器９００によって実行される量子化処理と同じように、量子化処理を実行する。しかしながら、２分探索器７００及び逆戻り探索器８００では、ファクタＮＯＲＭ＿ＡＣＴは、常に１に設定される。ビット割当器４００によって実行されるビット割当処理の間のみ、ファクタＮＯＲＭ＿ＡＣＴは１以外の値を取る。ビット割当中に生成されるＭＢターゲットは、アクティビティを考慮しているので、後段でこれを考慮する必要はない。
【００３５】
量子化器９００から出力される量子化データは、エントロピー符号器１０００に供給され、ここで、無ひずみデータ圧縮が、エントロピー符号化の標準原理に基づき適用される。この具体例では、ハフマン符号化を使用している。
【００３６】
エントロピー符号器１０００の出力は、シャッフル部１００内のパッキング器１５０に供給される。パッキング器１５０は、外部ＳＤＲＡＭ２００と協働して、エントロピー符号化器１０００によって生成された可変長符号化データを固定長の同期ブロック（ｓｙｎｃ−ｂｌｏｃｋ）にパックする。同期ブロックは、画像再生の際、独立して再生される最小のデータブロックである。
【００３７】
パッキング機能は、ＳＤＲＡＭ２００の読出及び書込アドレスを操作することによって実現される。各ＭＢＵをＳＤＲＡＭ内の固定パッキング領域（ｆｉｘｅｄ　ｐａｃｋｉｎｇ　ｓｐａｃｅ）に割り当て、更にそれを、各ＭＢ用の名目パッキング領域（ｎｏｍｉｎａｌ　ｐａｃｋｉｎｇ　ｓｐａｃｅ）に分割する。個々のワード長から算出される又はエントロピー符号化器１０００から直接パッキング器１５０に供給される各ＭＢの全体の長さも記憶する必要がある。符号化装置１０からの出力は、同期ブロック１のデータ出力ＳＢ１、同期ブロック２のデータ出力ＳＢ２からなる。符号化処理で使用した量子化除数の情報も復号装置３０に送られる。
【００３８】
図４は、図１の復号装置の構成を示すブロック図である。復号装置３０は、符号化処理の逆処理を行うものであり、アンシャッフル部２０１０と、アンパック部２０２０と、外部ＳＤＲＡＭ２１００と、エントロピー復号器２２００と、逆量子化器２３００と、逆ＤＣＴ変換器２４００とを備える。同期ブロックのデータ信号ＳＢ１、ＳＢ２は、記録媒体から読み出され、あるいはデータ伝送ネットワークを介して受信されて、アンパック部２０２０に供給され、アンパック部２０２０は、外部ＳＤＲＡＭ２１００の読出及び書込により、アンパッキング機能を実行する。アンパックデータはエントロピー復号器２２００に供給され、エントロピー復号器２２００は、ハフマン符号化の逆処理を実行して量子化係数を再生し、逆量子化器２３００に供給する。逆量子化器２３００は、符号化装置１０から供給された量子化除数に関する情報を用いて、量子化係数に適切な量子化除数を乗算して元のＤＣＴ係数の近似値を得る。この逆量子化処理は、ＤＣＴ係数の元の精度を回復するものではなく、量子化は「有ひずみ（ｌｏｓｓｙ）」圧縮技術である。逆量子化器２３００の出力は、逆ＤＣＴ変換器２４００に供給され、逆ＤＣＴ変換器２４００は、離散コサイン逆変換を用い、周波数領域のＤＣＴ係数の各ブロックを処理して空間領域の画像ブロック情報を再生する。逆ＤＣＴ変換器２４００の出力は、量子化の結果には情報消失があるため、符号化前の画素ブロックと等しくない。最後に、逆ＤＣＴ変換器２４００の出力はアンシャッフル部２０１０に供給され、ここで、データはアンシャッフルされ、符号化前の画像ブロックの順序が再現される。アンシャッフル部２０１０の出力は、３つの色成分ビデオ信号ＲＧＢからなり、これから画像を再生することができる。
【００３９】
図５は、図２のビット割当器４００の具体的な構成を示すブロック図である。このビット割当器４００は、３つの主要な機能を有し、第１の機能では、各マクロブロック毎に無ひずみＤＣＰＭと有ひずみＤＣＴ符号化という２つの利用可能な選択肢の中から符号化モードを選択し、第２の機能では、マクロブロックユニットに関する同様のターゲットに基づいて、各マクロブロックに対するターゲットビット数ＭＢ＿ＴＡＲＧＥＴを算出し、第３の機能では、２分探索器７００で実行される２分探索における量子化除数Ｑ＿ＳＣＡＬＥの開始目盛り（ｓｔａｒｔｉｎｇ　ｓｃａｌｅ）となるように定義される値Ｑ＿ＢＡＳＥを算出する。２分探索器７００は、量子化除数Ｑ＿ＳＣＡＬＥの値Ｑ＿ＡＬＬＯＣを測定し、これは、開始点の値Ｑ＿ＢＡＳＥを得るのに使用したよりも高い分解能で量子化除数Ｑ＿ＳＣＡＬＥを探索することによって得られる。
【００４０】
シャッフル部１００から出力されるシャッフルされた画像データ信号Ｓ＿ＯＰ＿Ｄ１、Ｓ＿ＯＰ＿Ｄ２は、ビット割当器４００に入力として供給される。これらの入力信号は、ラスタ走査された１２ビットのビデオサンプルの８_Ｈ×８_ＶＤＣＴブロックからなる。
【００４１】
パラメータ推定回路は、図２に示す符号化装置のシャッフル部１００内に配設される。このパラメータ推定回路は、一連の試し量子化の実行に先立って設定され固定されるＤＣＴ＿ＰＲＥＣＩＳＩＯＮの値を推定すると共に、ビット割当部４００によって実行される最低分解能試し量子化（ｌｏｗｅｓｔ　ｒｅｓｏｌｕｔｉｏｎ　ｔｒｉａｌ　ｑｕａｎｔｉｓａｔｉｏｎｓ）を実行するときの量子化除数を決定する際に用いるＱ＿ＳＣＡＬＥの値Ｑ＿ＳＴＡＲＴを算出する。パラメータ予測回路により生成される最終的な量子化除数パラメータＤＣＴ＿ＰＲＥＣＩＳＩＯＮ、Ｑ＿ＳＴＡＲＴの値もビット割当器４００に入力として供給される。
【００４２】
ビット割当部４００は、ＤＰＣＭリフォーマット部４１０、ＤＰＣＭ部４２０、ゴーロン（Ｇｏｌｏｍｂ）長部４３０、ＤＣＴ部４４０、量子化部４５２とハフマン長部４５４から成る有ひずみ符号化部４５０、アクティビティ部４６０及び決定論理ユニット４７０を備える。決定論理ユニット４７０は、ターゲット挿入部５００に入力データを供給する。
【００４３】
ビット割当部４００は、この具体例においては２０４個のＭＢから成るマクロブロックユニットの試し符号化に基づいて符号化の決定を行う。符号化モード決定の際には、無ひずみＤＰＣＭあるいは有ひずみＤＣＴモード符号化のいずれかを選択する。符号化モードの決定は、単一のＤＰＣＭ符号化段（ＤＰＣＭリフォーマット部４１０、ＤＰＣＭ部４２０及びゴーロン長部４３０と連携して実行される）を実行することによって行われ、その結果は、６個のＤＣＴ試し符号化段の出力と比較される。６個のＤＣＴ試し符号化段は、ＤＣＴ部４４０における単一の離散コサイン変換と、後に続く有ひずみ符号化ユニット４５０による６サイクルとを含む。ＤＣＴモードの符号化において、アクティビティ部４６０は、量子化部４５２によってデータに適用される量子化除数を調整する。アクティビティ部４６０が実行する計算については、以下に詳細に説明する。
【００４４】
図５に示すように、決定論理器４７０には、ＤＰＣＭ符号化のエントロピー符号化処理を行うゴーロン長器４３０の出力が供給されるとともに、ＤＣＴ符号化のエントロピー符号処理を行うハフマン長器４５４の出力が供給される。決定論理ユニット４７０は、ＤＰＣＭ試し符号化とＤＣＴ試し符号化との結果を比較する。無ひずみＤＰＣＭは、マクロブロックに対して全体のビット数がより少ない場合のみ、選択される。また、決定論理ユニット４７０は、マクロブロックユニットとマクロブロックの双方についてターゲットビット数を算出する。
【００４５】
アクティビティ器４６０は、ＤＣＴモードの符号化回路の一部を構成し、画像ブロックの画素の分散に基づきアクティビティの尺度を算出する。より高いアクティビティレベルを有する画像ブロックでは、量子化をより粗くしても、見る人には知覚されにくいことが知られている。各ブロックに対する量子化ステップは、ビット割当器４００の量子化器４５２で使用される量子化除数Ｑ＿ＳＣＡＬＥを、高いアクティビティレベルのブロックが粗く量子化されるように、適切に調整することによりオフセット（ｏｆｆｓｅｔ）することができる。後述するように、ビット割当処理のために使用されるＱ＿ＳＣＡＬＥ＿ＣＯＤＥは、「アクティビティオン」か「アクティビティオフ」の状態に依存する。更に、アクティビティファクタＮＯＲＭ＿ＡＣＴは、上述のＤＣＴのＡＣ係数Ｑ（ＡＣ）の量子化の式の分母に現れている。
【００４６】
アクティビティは、各マクロブロックに対して１回ずつだけ計算される。パラメータＩｎｔｒａＭＡＤの値は、マクロブロック内の各８_Ｈ×８_ＶＤＣＴブロックに対して、ＹＣｂＣｒモードでは輝度（Ｙ）ＤＣＴブロックのみ、ＲＧＢモードではＲ、Ｇ、Ｂのブロックが計算される。パラメータＩｎｔｒａＭＡＤは次のように定義される。
【００４７】
【数１】

【００４８】
ここで、ｄｃｔ［ｉ，ｊ］は、ｊ番目のＤＣＴブロックのｉ番目の画素の画素値である。パラメータｄｃｔ＿ｄｃ［ｊ］は、８_Ｈ×８_ＶＤＣＴブロックについての（且つ所定の信号成分についての）ｄｃｔ［ｉ，ｊ］の平均値であり、次式で与えられる。
【００４９】
【数２】

【００５０】
マクロブロック内の全てのＹ又はＲＧＢのＤＣＴブロックに対するパラメータＩｎｔｒａＭＡＤの最小値は、次式で与えられる。
【００５１】
【数３】

【００５２】
アクティビティＡＣＴは、
ＡＣＴ＝１＋ＭｉｎＭＡＤ
で与えられる。
【００５３】
アクティビティＡＣＴの値は１から数千に及ぶので、アクティビティＡＣＴを正規化して所定の範囲内に収まるようにする。この具体例では、アクティビティＡＣＴを前回のマクロブロックユニットのデータによって正規化し、０．５〜２の範囲に収まるＮＯＲＭ＿ＡＣＴを得ている。
【００５４】
ＮＯＲＭ＿ＡＣＴ＝（２＊ＡＣＴ＋ＡＶＧ＿ＡＣＴ）／（ＡＣＴ＋２＊ＡＶＧ＿ＡＣＴ）
ここで、ＡＶＧ＿ＡＣＴ＝前ＭＢＵからのアクティビティＡＣＴの平均である。
【００５５】
画像シーケンスの開始時、あるいはシーンの変化を（標準的方法により）検出したときには、量子化除数パラメータＱ＿ＳＴＡＲＴ、ＤＣＴ＿ＰＲＥＣＩＳＩＯＮに依存したデフォルト値ＤＥＦＡＵＬＴ＿ＡＶＧ＿ＡＣＴをＡＶＧ＿ＡＣＴの代わりに使用する。任意のフレーム（シーケンスの最初のフレームは除く）内の最初のＭＢＵに対しては、前フレーム内の全てのＭＢＵに対するアクティビティＡＣＴの平均を表す値ＦＲＭ＿ＡＶＧ＿ＡＣＴをＡＶＧ＿ＡＣＴの代わりに使用する。この具体例では、アクティビティＡＣＴを０．５〜２の範囲に収まるように正規化しているが、代わりに次式を用いることにより、ｐ／ｑ〜ｑ／ｐである任意の範囲に正規化することができる。
【００５６】
ＮＯＲＭ＿ＡＣＴ＝（ｑ＊ＡＣＴ＋ｐ＊ＡＶＧ＿ＡＣＴ）／（ｐ＊ＡＣＴ＋ｑ＊ＡＶＧ＿ＡＣＴ）
したがって、ＮＯＲＭ＿ＡＣＴの範囲を０．５〜２となるように選択する場合、パラメータｐ、ｑは、それぞれ値１、２である。
【００５７】
符号化の多数世代に亘る反復性を良くするために、ＮＯＲＭ＿ＡＣＴは固定数のレベルに制限される。０．５〜２．０の範囲に対して、ＮＯＲＭ＿ＡＣＴは８個のレベル（４／８、５／８、６／８、７／８、１，４／３、５／３、２）に制限される。
【００５８】
図６は、図２に示す符号化装置においてビット割当ポイント（ｂｉｔ　ａｌｌｏｃａｔｉｏｎｐｏｉｎｔｓ）を割り当てるシステムを模式的に説明した図である。例えば４個の固定数のビット割当ポイントがＱ＿ＳＣＡＬＥ＿ＣＯＤＥの値Ｑ＿ＳＴＡＲＴ＿ＣＯＤＥの回りに配置される。Ｑ＿ＳＴＡＲＴ＿ＣＯＤＥは、入力画素の特性、例えば画素差の合計を用いてシャッフル部によって算出されている。図６の例では、最小粗さ値ＤＣＴ＿ＰＲＥＣＩＳＩＯＮ＝０と「アクティビティオフ」を考慮している。この場合、ビット割当に用いられる値は８Ｑ＿ＳＣＡＬＥ＿ＣＯＤＥ分だけ離れており、Ｑ＿ＳＴＡＲＴ＿ＣＯＤＥのあらゆるエラーを考慮した範囲をカバーしている。「アクティビティオン」のときには、ビット割当に用いられる４個の値は４Ｑ＿ＳＣＡＬＥ＿ＣＯＤＥ分だけ離れることになる。
【００５９】
図７は、４個のビット割当Ｑ＿ＳＣＡＬＥ＿ＣＯＤＥに対応する４個のＱ＿ＳＣＡＬＥ値に対する、発生ビット数対Ｑ＿ＳＣＡＬＥのグラフである。マクロブロックターゲットは、マクロブロックユニット（ＭＢＵ）として知られるマクロブロックのグループの対応するターゲット（ＭＢＵターゲット）から算出される。Ｑ＿ＳＣＡＬＥ＿ＣＯＤＥがＱ＿ＳＣＡＬＥ＿ＣＯＤＥ＿ＬのときはＭＢＵターゲットより大きな値のビットカウントＢｉｔｓ＿Ｌになり、一方Ｑ＿ＳＣＡＬＥ＿ＣＯＤＥ＿ＵのときはＭＢＵターゲットより小さな値のビットカウントＢｉｔｓ＿Ｕになる。このように、Ｑ＿ＳＣＡＬＥ＿ＣＯＤＥが大きいほど量子化は粗くなり、ビットカウント値は小さくなる。この２個の値の間で直線補間（ｌｉｎｅａｒ　ｉｎｔｅｒｐｏｌａｔｉｏｎ）を行うことによってＭＢターゲットの条件が満たされる。
【００６０】
ビット割当ポイントの間隔が広すぎると、第２世代の画像データについて計算したＭＢターゲットが第１世代の画像に用いられたターゲットに一致する可能性は少なくなる。第２世代画像を最良の画質で再生するためには、第１世代の符号化で用いられたＭＢターゲットを反復可能とすることが重要である。
【００６１】
図８は、第２世代画像におけるビットカウント対Ｑ＿ＳＣＡＬＥのグラフである。曲線の平坦部は、Ｑ＿ＳＣＡＬＥ＝Ｑ１のときの第１世代の圧縮の結果である。前に圧縮された画像データに対応する「ビット数対Ｑ＿ＳＣＡＬＥ」曲線の平坦部は、２／３＊Ｑ１から２＊Ｑ１まで続いている。図９は、第２世代画像データにおけるビット数対Ｑ＿ＳＣＡＬＥのプロファイルを示し、間隔が広すぎたビット割当ポイントによって起こる影響を表している。上方のＱ＿ＳＣＡＬＥビット割当値ＱＵは曲線の平坦部に対応するのに対し、下方のＱ＿ＳＣＡＬＥ割当値ＱＬは曲線の急な負の勾配部分に対応している。理想的なＱ＿ＳＣＡＬＥ値は、曲線の平坦部に対応する。しかしながら、ＱＵとＱＬ間の直線外挿（ｌｉｎｅａｒ　ｅｘｔｒａｐｏｌａｔｉｏｎ）によって、予測ＭＢターゲットは２／３＊Ｑ１〜ＱＵの範囲から選択されたＱ＿ＳＣＡＬＥを適用することによって実際に発生する実ビット数より高くなる。この結果、２分探索器７００は高すぎるＱ＿ＳＣＡＬＥを選択してしまう。２分探索器７００によって選択されたＱ＿ＳＣＡＬＥによって逆戻り探索の開始点が決まるので、２分探索のＱ＿ＳＣＡＬＥ値（Ｑ＿ＡＬＬＯＣ）が高くなりすぎると、逆戻り探索に悪影響が出て第１世代のＱ＿ＳＣＡＬＥに戻ることができなくなる。
【００６２】
図１０乃至図１２は、選択されたビット割当ポイントの変動を低減するために所定のサブセットのＱ＿ＳＣＡＬＥ＿ＣＯＤＥＳがどのように使用されるかを模式的に説明した図である。図１０（図６と同じ）は、Ｑ＿ＳＴＡＲＴ＿ＣＯＤＥが選択されたＱ＿ＳＣＡＬＥ＿ＣＯＤＥＳの範囲の中心を決定する様子を示している。この場合、Ｑ＿ＳＴＡＲＴ＿ＣＯＤＥの値が変化すると全ての４個の選択されたＱ＿ＳＣＡＬＥ＿ＣＯＤＥＳが変化する。図１１は、Ｑ＿ＳＴＡＲＴ＿ＣＯＤＥを用いて、固定且つ等間隔のＱ＿ＳＣＡＬＥ＿ＣＯＤＥＳの範囲の中からどのセットをビット割当用として選択するかを決めている。この場合、中央の２個のＱ＿ＳＣＡＬＥ＿ＣＯＤＥＳがＱ＿ＳＴＡＲＴ＿ＣＯＤＥをまたぐように４個のＱ＿ＳＣＡＬＥ＿ＣＯＤＥＳが選択されている。図１２は、ある世代から次の世代へ移行する際、又はある画像フレームから他の画像フレームへの移行に伴ってＱ＿ＳＴＡＲＴ＿ＣＯＤＥの値が変化したときに、４個中３個の選択されたＱ＿ＳＣＡＬＥ＿ＣＯＤＥＳが図１１で選択されたものと同じであることを示している。
【００６３】
図１３は、ターゲットの反復性を改善する固定ビット割当ポイントの「線形（ｌｉｎｅａｒ）」セットを示す図である。ここでは、６個のビット割当段（ｂｉｔ　ａｌｌｏｃａｔｉｏｎ　ｓｔａｇｅｓ）をアクティビティオフの場合Ｑ＿ＳＣＡＬＥ＿ＣＯＤＥＳ｛１，７，１３，１９，２５，３１｝からなるセットに含める。一方、アクティビティオンの場合には、可能な２因数の効果によって、６個のビット割当値のセットはＱ＿ＳＣＡＬＥ＿ＣＯＤＥＳ｛１，３，６，９，１２，１５｝となる。
【００６４】
固定ビット割当段の間隔を狭めることによってターゲットの反復性（ｒｅｐｅａｔａｂｉｌｉｔｙ）を更に改善することができ、ビット数対Ｑ＿ＳＣＡＬＥのグラフにおいて、曲線の折れ曲がり部に亘る補間が発生する可能性が低くなる。限定されたケースを図１４のグラフに示す。これは理想的に、
【００６５】
【数４】

【００６６】
となるが、この比率は１．５より若干高くても低くてもかまわない。この規則を非線形の固定ビット割当ポイントセットに適用した例を図１５に示し、図１５の非線形のセットはＱ＿ＳＣＡＬＥ＿ＣＯＤＥＳ｛１，２，３，５，７，１１，１５，２２，３１｝からなる。因数ＮＯＲＭ＿ＡＣＴの効果により、アクティビティオフの場合の最大の利用可能なＱ＿ＳＣＡＬＥ＿ＣＯＤＥは３１であり、アクティビティオンの場合の最大の利用可能なＱ＿ＳＣＡＬＥ＿ＣＯＤＥは１５となる。更に、ビット割当ポイントのセットはＤＣＴ＿ＰＲＥＣＩＳＩＯＮに依存するが、その理由は、後述するように、最小ビット割当ポイントが選択されたＤＣＴ＿ＰＲＥＣＩＳＩＯＮにおけるＭＩＮＩＭＵＭ＿Ｑに依存するからである。
【００６７】
図１６は、各ＭＢＵに対し、本発明の具体例に基づくビット割当器４００によって実行されるアルゴリズムを表すフローチャートである。ステップ１は、ＤＰＣＭリフォーマット器４１０、ＤＰＣＭ器４２０及びゴーロン長器４３０の協調動作で実行される。ステップ２Ａ〜２Ｄは、量子化器４５２により実行され、ステップ３〜５は、決定論理器４７０により実行される。
【００６８】
ステップ１において、ＭＢＵ内の全ＭＢに対して１回の無ひずみＤＰＣＭ試し符号化を実行し、各ＭＢについてＤＰＣＭ符号化によって生成されるビット数ＭＢ＿ＤＰＣＭ＿ＢＩＴを測定する。
【００６９】
ステップ２Ａにおいて、ＭＢＵ内の全ＭＢに対して６回の有ひずみＤＣＴ符号化を実行して、各ブロック及び６個の試し量子化除数Ｑ＿ＳＣＡＬＥ（１）〜（６）の各々について、ＭＢの有ひずみＤＣＴ符号化によって生成されるビット数ＭＢ＿ＤＣＴ＿ＢＩＴＳ（Ｑ＿ＳＣＡＬＥ）を測定する。量子化除数Ｑ＿ＳＣＡＬＥの各値は、３１個のＱ＿ＳＣＡＬＥ＿ＣＯＤＥのいずれか１つと線形又は非線形であるＱ＿ＳＣＡＬＥ＿ＴＹＰＥとの組合せにより定まる。３１個の使用可能なＱ＿ＳＣＡＬＥ＿ＣＯＤＥに関する量子化除数Ｑ＿ＳＣＡＬＥの全範囲を完全に走査する代わりに、Ｑ＿ＳＣＡＬＥ＿ＣＯＤＥのサブセット（ｓｕｂｓｅｔ：以下、ＳＳという）を選択する。ＳＳは、量子化除数パラメータＤＣＴ＿ＰＲＥＣＩＳＩＯＮの値とアクティビティがオンかオフの両方を考慮して定められる。例えば、ＤＣＴ＿ＰＲＥＣＩＳＩＯＮ＝１でアクティビティがオフの場合、サブセットは、
ＳＳ＝［２，３，５，７，１０，１５，２２，３１］
となる。一方、アクティビティがオンの場合（この場合、ＮＯＲＭ＿ＡＣＴは０．５〜２の範囲にある）、サブセットは、
ＳＳ＝［２，３，５，７，１０，１５］
で与えられる。
【００７０】
下記表２は、「アクティビティオン」と「アクティビティオフ」の両方に対する量子化除数パラメータＤＣＴ＿ＰＲＥＣＩＳＩＯＮの各値について、本発明の具体例で用いられたビット割当用サブセットを示したものである。
【００７１】
【表２】

【００７２】
試し量子化で使用する６個の量子化除数Ｑ＿ＳＣＡＬＥ（１）〜（６）は、該当するＳＳから取り出した６個のＱ＿ＳＣＡＬＥ＿ＣＯＤＥに関する量子化除数に対応している。なお、各ＳＳは、殆どの場合、６より多い数のＱ＿ＳＣＡＬＥ＿ＣＯＤＥを含んでいる。量子化除数パラメータＱ＿ＳＴＡＲＴの値を用いて、サブセットの中から試し量子化で使用する６個のＱ＿ＳＣＡＬＥ＿ＣＯＤＥを選択する。
【００７３】
サブセット内で使用可能な最小のＱ＿ＳＣＡＬＥ＿ＣＯＤＥは、下記式の量子化ファクタＭＩＮＩＭＵＭ＿Ｑを表すコードであり、
ＭＩＮＩＭＵＭ＿Ｑ＝２^{（ＤＣＴ＿ＰＲＥＣＩＳＩＯＮ）}
あるいは、このコードが存在しないときは、使用可能な最小のＱ＿ＳＣＡＬＥ＿ＣＯＤＥは、量子化ファクタＭＩＮＩＭＵＭ＿Ｑよりも大きな数の中で最も小さなＱ＿ＳＣＡＬＥ＿ＣＯＤＥである。
【００７４】
ステップ２Ｂにおいて、量子化除数パラメータＤＣＴ＿ＰＲＥＣＩＳＩＯＮの値に関係する量子化除数パラメータＱ＿ＳＴＡＲＴの誤差を算出し、この誤差は、
Ｑ＿ＳＴＡＲＴ＿ＥＲＲＯＲ＝２４／（３−２^{ＤＣＴ＿ＰＲＥＣＩＳＩＯＮ}）
で与えられるので、量子化の粗さが小さくなる量子化除数パラメータＤＣＴ＿ＰＲＥＣＩＳＩＯＮの値に対して、Ｑ＿ＳＴＡＲＴの誤差は大きくなる。
【００７５】
ステップ２Ｃにおいて、量子化除数パラメータＱ＿ＳＴＡＲＴから誤差Ｑ＿ＳＴＡＲＴ＿ＥＲＲＯＲを減算することによってＱ＿ＳＣＡＬＥ＿ＭＩＮを算出するとともに、図３のルックアップテーブルからＱ＿ＳＣＡＬＥ＿ＭＩＮに関するＱ＿ＳＣＡＬＥ＿ＣＯＤＥ及びＱ＿ＳＣＡＬＥ＿ＣＯＤＥ＿ＭＩＮを求める。サブセットの中のＱ＿ＳＣＡＬＥ＿ＣＯＤＥ＿ＭＩＮ以下の、一番近いＱ＿ＳＣＡＬＥ＿ＣＯＤＥを識別し、このＱ＿ＳＣＡＬＥ＿ＣＯＤＥに対応した量子化除数を、６個の試し量子化パラメータの中の１番目、すなわち試し量子化除数Ｑ＿ＳＣＡＬＥ（１）として定める。なお、サブセット中にＱ＿ＳＣＡＬＥ＿ＣＯＤＥ＿ＭＩＮ以下のＱ＿ＳＣＡＬＥ＿ＣＯＤＥがない場合は、試し量子化除数Ｑ＿ＳＣＡＬＥ（１）を、サブセット中の最も小さなＱ＿ＳＣＡＬＥ＿ＣＯＤＥに対応した量子化ファクタに設定する。
【００７６】
ステップ２Ｄにおいて、残る５個の試し量子化除数Ｑ＿ＳＣＡＬＥ（２）〜（６）を、サブセット中の試し量子化除数Ｑ＿ＳＣＡＬＥ（１）よりも順に大きな５個Ｑ＿ＳＣＡＬＥ＿ＣＯＤＥに割り当てる。サブセット中にこれを満足する十分な数のＱ＿ＳＣＡＬＥ＿ＣＯＤＥがないときは、試し量子化除数Ｑ＿ＳＣＡＬＥ（６）を、サブセット中の最大のＱ＿ＳＣＡＬＥ＿ＣＯＤＥに設定するとともに、試し量子化除数Ｑ＿ＳＣＡＬＥ（１）〜（５）を、サブセット中の試し量子化除数Ｑ＿ＳＣＡＬＥ（６）よりも順に小さな５個のＱ＿ＳＣＡＬＥ＿ＣＯＤＥに設定する。
【００７７】
ステップ３において、６回の試しＤＣＴ量子化を行い、マクロブロックユニット内の全てのマクロブロックに亘るＭＢ＿ＤＣＴ＿ＢＩＴＳ（Ｑ＿ＳＣＡＬＥ）の値の総和を求めて、６個の試し量子化除数Ｑ＿ＳＣＡＬＥ（１）〜（６）の各々に対する値ＭＢＵ＿ＤＣＴ＿ＢＩＴＳ（Ｑ＿ＳＣＡＬＥ）を生成する。ＭＢＵ毎のターゲットビット数は、各画像フレーム（又はフィールド）毎に定めた所定のＦＲＡＭＥ＿ＴＡＲＧＥＴから、
ＭＢＵ＿ＴＡＲＧＥＴ＝ＦＲＡＭＥ＿ＴＡＲＧＥＴ／４０
により算出される。
【００７８】
ＭＢＵ＿ＤＣＴ＿ＢＩＴＳ（Ｑ＿ＳＣＡＬＥ）の６個の値からなるセットをターゲットビット数ＭＢＵ＿ＴＡＲＧＥＴと比較し、ターゲットビット数ＭＢＵ＿ＴＡＲＧＥＴの直ぐ上と直ぐ下にある、ＭＢＵ＿ＤＣＴ＿ＢＩＴＳ（Ｑ＿ＳＣＡＬＥ）の２つの値Ｂ＿Ｕ^ＭＢＵ、Ｂ＿Ｌ^ＭＢＵをそれぞれ次のように定義する。
【００７９】
Ｂ＿Ｕ^ＭＢＵ≡ＭＢＵ＿ＤＣＴ＿ＢＩＴＳ（Ｑ＿ＳＣＡＬＥ（ｎ））＞ＭＢＵ＿ＴＡＲＧＥＴ
Ｂ＿Ｌ^ＭＢＵ≡ＭＢＵ＿ＤＣＴ＿ＢＩＴＳ（Ｑ＿ＳＣＡＬＥ（ｎ＋１））≦ＭＢＵ＿ＴＡＲＧＥＴ
図１７は、量子化除数Ｑ＿ＳＣＡＬＥに対するＭＢＵ＿ＤＣＴ＿ＢＩＴＳを示すグラフであり、量子化除数Ｑ＿ＳＣＡＬＥのコードＱ＿ＳＣＡＬＥ（ｎ）、Ｑ＿ＳＣＡＬＥ（ｎ＋１）にそれぞれ対応した２つのビット数の値Ｂ＿Ｌ^ＭＢＵ、Ｂ＿Ｕ^ＭＢＵを示している。小さい方の量子化除数Ｑ＿ＳＣＡＬＥ（ｎ）は、大きい方の量子化除数Ｑ＿ＳＣＡＬＥ（ｎ＋１）に比べて、ビット数が多くなっている。マクロユニットに関する「ビット対Ｑ＿ＳＣＡＬＥ」のグラフの性質を利用して、ＭＢＵに属する各ＭＢに対するターゲットビット数ＭＢＵ＿ＴＡＲＧＥＴを導き出す。特に、図１７に示す量Ｘ、Ｙ、Ｚは次のように定義される。
【００８０】
Ｘ≡ＭＢＵ＿ＴＡＲＧＥＴ−Ｂ＿Ｕ^ＭＢＵ
Ｙ≡Ｂ＿Ｌ^ＭＢＵ−ＭＢＵ＿ＴＡＲＧＥＴ
Ｚ≡Ｂ＿Ｕ^ＭＢＵ−Ｂ＿Ｌ^ＭＢＵ＝Ｘ＋Ｙ
したがって、
ＭＢＵ＿ＴＡＲＧＥＴ＝（Ｂ＿Ｕ^ＭＢＵＸ＋Ｂ＿Ｌ^ＭＢＵＹ）／Ｚ
したがって、図１０乃至図１２のステップ４において、ターゲットビット数ＭＢ＿ＴＡＲＧＥＴは、次のようにして算出される。
【００８１】
ＭＢ＿ＴＡＲＧＥＴ＝Ｘ＊ＭＢ＿ＤＣＴ＿ＢＩＴＳ（Ｑ＿ＳＣＡＬＥ（ｎ））／Ｚ　＋Ｙ＊ＭＢ＿ＤＣＴ＿ＢＩＴＳ（Ｑ＿ＳＣＡＬＥ（ｎ＋１））／Ｚ
そして、もしＺ＝０ならば、ゼロの除算を避けるために、ＭＢＵ＿ＴＡＲＧＥＴ＝ＭＢＵ＿ＤＣＴ＿ＢＩＴＳ（Ｑ＿ＳＣＡＬＥ（ｎ））と設定する。
【００８２】
ステップ５において、ＭＢＵ内の各ＭＢ毎に無ひずみＤＰＣＭ符号化と有ひずみＤＣＴ符号化との間で選択を行うために、ＭＢ＿ＤＰＣＭ＿ＢＩＴをターゲットビット数ＭＢ＿ＴＡＲＧＥＴと比較する。ＭＢ＿ＤＰＣＭ＿ＢＩＴがターゲットビット数ＭＢ＿ＴＡＲＧＥＴより大きいときは、そのマクロブロックに対して有ひずみＤＣＴ符号化を選択する。逆に、ＭＢ＿ＤＰＣＭ＿ＢＩＴがターゲットビット数ＭＢ＿ＴＡＲＧＥＴ以下ときは、そのマクロブロックに対して無ひずみＤＰＣＭ符号化モードを選択する。無ひずみＤＰＣＭ符号化モードがＭＢに対して選択される毎に、ターゲットビット数ＭＢＵ＿ＴＡＲＧＥＴを再計算して、ＭＢＵ＿ＴＡＲＧＥＴ＝ＭＢＵ＿ＴＡＲＧＥＴ−ＭＢ＿ＤＰＣＭ＿ＢＩＴとする。また、ＭＢＵ＿ＤＣＴ＿ＢＩＴＳ（Ｑ＿ＳＣＡＬＥ（ｎ））及びＭＢＵ＿ＤＣＴ＿ＢＩＴＳ（Ｑ＿ＳＣＡＬＥ（ｎ＋１））を次のように再計算する。
【００８３】
ＭＢＵ＿ＤＣＴ＿ＢＩＴＳ（Ｑ＿ＳＣＡＬＥ（ｎ））＝ＭＢＵ＿ＤＣＴ＿ＢＩＴＳ（Ｑ＿ＳＣＡＬＥ（ｎ））　　　　　　　　　　　　　　−ＭＢ＿ＤＣＴ＿ＢＩＴＳ（Ｑ＿ＳＣＡＬＥ（ｎ））
ＭＢＵ＿ＤＣＴ＿ＢＩＴＳ（Ｑ＿ＳＣＡＬＥ（ｎ＋１））＝ＭＢＵ＿ＤＣＴ＿ＢＩＴＳ（Ｑ＿ＳＣＡＬＥ（ｎ＋１））　　　　　　　　　　　　　　　　−ＭＢ＿ＤＣＴ＿ＢＩＴＳ（Ｑ＿ＳＣＡＬＥ（ｎ＋１））
ターゲットビット数ＭＢＵ＿ＴＡＲＧＥＴをステップ５において再計算しているので、ターゲットビット数ＭＢ＿ＴＡＲＧＥＴについても、有ひずみＤＣＴモード符号化に現在割り当てらているＭＢの個数を考慮して、再計算する必要がある。ステップ６において、ＤＰＣＭ符号化モードに切り替わるＭＢが無くなるまで、全ての有ひずみＤＣＴモードのＭＢに対してステップ４、５を繰り返す。これを達成するのに、代表的には５、６回の反復で十分である。
【００８４】
量子化除数Ｑ＿ＳＣＡＬＥに関する不正確な予測によって、適切な量子化除数Ｑ＿ＳＣＡＬＥがビット割当探索範囲（６個の量子化除数Ｑ＿ＳＣＡＬＥからなる）外に位置するような状況を検討する必要がある。このような場合、ターゲットビット数ＭＢ＿ＴＡＲＧＥＴを計算するために、上述のステップ３、４の方法に対する代わりの方法が必要となる。２つの可能な方法が考えられる。
【００８５】
先ず、ステップ３において、ＭＢＵ＿ＤＣＴ＿ＢＩＴＳ（Ｑ＿ＳＣＡＬＥ（ｎ））が、ｎが６個の全ての値についてターゲットビット数ＭＢＵ＿ＴＡＲＧＥＴ以下であり、量子化が６個の試し値の全てについて粗すぎるときは、ステップ４におけるターゲットビット数ＭＢ＿ＴＡＲＧＥＴを次のように計算する。
【００８６】
【数５】

【００８７】
この第１の方法を図１８に示す。
【００８８】
第２に、ステップ３において、ＭＢＵ＿ＤＣＴ＿ＢＩＴＳ（Ｑ＿ＳＣＡＬＥ（ｎ））が、ｎが６個の全ての値についてターゲットビット数ＭＢＵ＿ＴＡＲＧＥＴより大きく、量子化が６個の試し値のいずれについても粗すぎないときは、試し量子化除数Ｑ＿ＳＣＡＬＥ（５）、Ｑ＿ＳＣＡＬＥ（６）をステップ３におけるＱ＿ＳＣＡＬＥ（ｎ）、Ｑ＿ＳＣＡＬＥ（ｎ＋１）として選択する。この場合、ステップ４は変更されないが、今度はターゲットビット数ＭＢ＿ＴＡＲＧＥＴの外挿（ｅｘｔｒａｐｏｌａｔｉｎｇ）効果が生じる。この第２の方法を図１９に示す。
【００８９】
ターゲットビット数ＭＢ＿ＴＡＲＧＥＴの計算に加え、ビット割当器４００は、２分探索における量子化除数Ｑ＿ＳＣＡＬＥの開始点の値Ｑ＿ＢＡＳＥを設定する。量子化除数Ｑ＿ＳＣＡＬＥの開始点の値Ｑ＿ＢＡＳＥは、適切なＭＢＵ＿ＤＣＴ＿ＢＩＴＳ対Ｑ＿ＳＣＡＬＥ曲線を用いて、ターゲットビット数ＭＢ＿ＴＡＲＧＥＴから求められる。この具体例のように５回の２分探索を行う場合、開始点の値Ｑ＿ＢＡＳＥは、単にＱ＿ＳＣＡＬＥ＿ＣＯＤＥ＝１６で与えられる量子化除数Ｑ＿ＳＣＡＬＥ（すなわち量子化表の中点）である。したがって、２分探索は、この開始点の値Ｑ＿ＢＡＳＥから開始することにより、量子化除数Ｑ＿ＳＣＡＬＥの全範囲をカバーすることができる。しかしながら、２分探索の回数を少なくした具体例では、開始点の値Ｑ＿ＢＡＳＥを、各マクロブロック対してＱ＿ＳＣＡＬＥ（ｎ）とＱ＿ＳＣＡＬＥ（ｎ＋１）の中間に設定する。有ひずみＤＣＴモード符号化に割り当てられたマクロブロックに対してのみ、決定論理ユニット４７０から開始点の値Ｑ＿ＢＡＳＥ及びターゲットビット数ＭＢ＿ＴＡＲＧＥＴを出力し、ターゲット挿入器５００によって１ＭＢＵだけ遅延された画像データＩＰ＿ＤＤ１、ＩＰ＿ＤＤ２からなるビットストリームに付加する。ターゲットビット数ＭＢ＿ＴＡＲＧＥＴ及び開始点の値Ｑ＿ＢＡＳＥを２分探索器７００に供給し、２分探索器７００は、これらを最終的な量子化除数Ｑ＿ＳＣＡＬＥを決定するのに使用する。
【図面の簡単な説明】
【図１】データ記録／再生装置又はデータ送信／受信システムと共に使用される、圧縮符号化装置及び対応する復号装置の模式図である。
【図２】図１のビットレート圧縮符号化装置を模式的に説明するための図である。
【図３】図１の符号化装置のビットレート圧縮処理で使用するパラメータの表である。
【図４】図１の復号装置を模式的に示した図である。
【図５】図２の符号化装置のビット割当器を模式的に説明するための図である。
【図６】ビット割当中に試し量子化除数を割り当てるシステムを説明するための図である。
【図７】図６に対応するビット数対Ｑの曲線を模式的に説明するための図である。
【図８】第２世代の画像データに関するビット数対Ｑの曲線である。
【図９】図８の第２世代の画像データに関するターゲット外挿を示した図である。
【図１０】選択ビット割当ポイントの変動を低減するのに所定のサブセットのＱ＿ＳＣＡＬＥ＿ＣＯＤＥＳがどのように用いられるかを模式的に説明するための図である。
【図１１】選択ビット割当ポイントの変動を低減するのに所定のサブセットのＱ＿ＳＣＡＬＥ＿ＣＯＤＥＳがどのように用いられるかを模式的に説明するための図である。
【図１２】選択ビット割当ポイントの変動を低減するのに所定のサブセットのＱ＿ＳＣＡＬＥ＿ＣＯＤＥＳがどのように用いられるかを模式的に説明するための図である。
【図１３】本発明の具体例に基づく、固定割当ポイントの２個の線形セットを示した図である。
【図１４】極限ケースにおけるビット数対Ｑ＿ＳＣＡＬＥのグラフ説明図である。
【図１５】本発明の具体例に基づく、非線形セットの固定ビット割当ポイントを示した図である。
【図１６】ビット割当部によりマクロブロックユニット毎に行われるアルゴリズムを示すフローチャートである。
【図１７】Ｑ＿ＳＣＡＬＥに対するＭＢＵ＿ＤＣＴ＿ＢＩＴＳを説明するグラフである。
【図１８】全部で６個の試し量子化値について量子化が粗すぎる場合における、Ｑ＿ＳＣＡＬＥに対するＭＢＵ＿ＤＣＴ＿ＢＩＴＳのグラフである。
【図１９】６個の試し量子化値のいずれに対しても量子化が粗くない場合における、Ｑ＿ＳＣＡＬＥに対するＭＢＵ＿ＤＣＴ＿ＢＩＴＳのグラフである。

Claims

利用可能な量子化の程度のセットの中から取り出された量子化の程度でデータの量子化を実行することによって、所定のターゲット出力データ量に基づき、入力データを圧縮するデータ圧縮装置において、
上記利用可能な量子化の程度のセットのサブセットの中から取りだされた個々の試し量子化の程度で試し量子化を実行する１以上の試し量子化器と、
上記試し量子化器の結果に応じて、上記ターゲット出力データ量を超えない条件を満たす最終的な量子化の程度を上記利用可能な量子化の程度のセットの中から選択する選択器と、
上記最終的な量子化の程度で上記入力データを量子化する最終量子化器とを備えるデータ圧縮装置。
上記入力データは画像データであることを特徴とする請求項１記載のデータ圧縮装置。
上記入力データの特性から上記所定のターゲット出力データ量に適した量子化開始点を決定する量子化開始点推定器を備え、上記試し量子化の程度は上記量子化開始点に基づいて設定されることを特徴とする上記請求項１又は２記載のデータ圧縮装置。
図面を参照して説明したデータ圧縮装置。
利用可能な量子化の程度のセットの中から取り出された量子化の程度でデータの量子化を実行することによって、所定のターゲット出力データ量に基づき、入力データを圧縮するデータ圧縮方法において、
上記利用可能な量子化の程度のセットのサブセットの中から取りだされた個々の試し量子化の程度で１以上の試し量子化を実行するステップと、
上記試し量子化器の結果に応じて、上記ターゲット出力データ量を超えない条件を満たす最終的な量子化の程度を上記利用可能な量子化の程度のセットの中から選択するステップと、
上記最終的な量子化の程度で上記入力データを量子化するステップとを有するデータ圧縮方法。
図面を参照して説明したデータ圧縮方法。
請求項５又は６記載のデータ圧縮方法を実施するプログラムコードを有するコンピュータソフトウェア。
請求項７記載のコンピュータソフトウェアを提供するデータ提供媒体。
上記データ提供媒体は、伝送媒体であることを特徴とする請求項８記載のデータ提供媒体。
上記データ提供媒体は、記憶媒体であることを特徴とする請求項８記載のデータ提供媒体。