JP2651097B2

JP2651097B2 - 量子化パラメータ生成方法および装置

Info

Publication number: JP2651097B2
Application number: JP4321449A
Authority: JP
Inventors: ピュリアチュル; アラヴィンドランガラヤン; ジィオフリーハスケルバリン; ハンヒュ−ミン
Original assignee: AT&T Corp
Current assignee: AT&T Corp
Priority date: 1991-11-08
Filing date: 1992-11-06
Publication date: 1997-09-10
Anticipated expiration: 2012-09-10
Also published as: US5214507A; EP0541302A2; JPH0670311A; EP0541302A3; CA2081405A1

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、ビデオ画像処理に関
し、特に、再生画像の品質および符号化された画像のビ
ット速度を制御するための符号器量子化ステップサイズ
の調整に関する。

【０００２】

【従来の技術】ビデオ信号が量子化される態様は、符号
化される信号のビット速度およびその符号化された信号
から再生される画像の品質を決定する。おそらく、これ
に関連して最も重要なことは、量子化ステップサイズで
ある。これは、いわゆる量子化パラメータの所定のマッ
ピングから導出され、符号化信号の生成に使用される量
子化の粗密を直接制御する。従って、所定の目的ビット
速度に対する最高の画像品質を達成するためには、量子
化パラメータが適切に選択される必要がある。

【０００３】

【発明が解決しようとする課題】量子化パラメータの選
択への従来のアプローチには、統計に基づくもの、画像
全体またはその一部が複数回処理されることを必要とす
る計算を要求するもの、または、人間の視覚システムの
モデルを使用するものがある。これらの従来のアプロー
チは複雑であるか、大量のメモリを必要とするか、また
は、多大な遅延を導入するものである。さらに、このよ
うな従来の解決法は一般的に、画像の非等質領域（例え
ばエッジ）の性質を無視している。さらに、従来の解決
法には、効果的に単一の量子化パラメータを使用するも
のがない。しかし、単一の量子化パラメータは、国際標
準化機構（ＩＳＯ）標準「勧告草案１１１７３−２」に
記載された動画像専門家グループ（ＭＰＥＧ）のビデオ
符号化構文によって実際に要求される。

【０００４】

【課題を解決するための手段】従来の量子化技術にとも
なう上記の難点は、本発明の原理によれば克服される。
本発明によれば、画像の領域の符号化に使用する量子化
パラメータを、ａ）所定の複数の知覚ノイズ感度（ＰＮ
Ｓ）クラスのうちの１つへのその領域の分類、ｂ）その
画像の符号化バージョンに対して達成し得る心理視覚品
質のレベル（このレベルは、複数の所定レベルのうちか
ら選択される）、ｃ）ＰＮＳクラス、心理視覚品質レベ
ル、および量子化パラメータ値の間の関係の、事前格納
された、経験的に導出されたモデル、の３者から決定す
る。

【０００５】ＰＮＳは、領域の観察者が耐えられるノイ
ズの量、すなわち、ノイズに対するその領域の知覚的感
度を示す。ＰＮＳクラスは、画像の領域において見いだ
される視覚特性の値の範囲に基づいて決定される。ＰＮ
Ｓクラスが基にする特性には、空間的活動度、運動速
度、領域の明るさ、特定のコンテクストにおける領域の
重要性、領域内のエッジの存在、および、領域のテクス
チュア（例えば「平坦」から「高度にきめ細かい」ま
で）がある。

【０００６】画像の領域の特性の組合せを含むＰＮＳク
ラスもまた定義できる。使用されるＰＮＳクラスは、実
施者によって選択され、経験的に決定される。符号化画
像の心理視覚品質とは、符号化画像から再構成される画
像のバージョンの、観察者によって知覚される品質であ
る。これは、画像の複雑さおよび画像を符号化するのに
使用可能なビット速度から決定される。もちろん、画像
の異なる領域が異なる量子化パラメータ値で符号化され
ることも可能である。

【０００７】実施例では、領域は、画像が分割されてで
きるマクロブロックおよびサブブロックである。また、
ＰＮＳクラス、心理視覚品質レベル、量子化ステップサ
イズ、画像の複雑さ、および、使用可能ビット速度の間
の関係が経験的に導出される。さらに、これらの関係
は、テーブルの集合として符号化される。これらのテー
ブルは、所与の許容ビット速度に対する符号化画像の心
理視覚品質を最大化するように設計される。

【０００８】本発明の１目的によれば、ＰＮＳクラス、
心理視覚品質、および、量子化パラメータを関連づける
テーブルには、各心理視覚品質レベルに対し、各ＰＮＳ
クラスへの量子化パラメータの割当が格納される。特定
の心理視覚品質レベルに対する各割当は、その心理視覚
品質レベルを達成する符号化画像を生じることが期待さ
れている。しかし、異なる品質レベルに対して、符号化
画像を生じるビット数は異なることもある。従って、画
像が、意図された心理視覚品質レベルを達成するように
符号化される際には、符号化画像中の予想されるビット
数の評価が算出される。

【０００９】これらのビット数評価を算出するために、
複数の統計的活動度クラスのうちの１つへの、サブブロ
ックの独立の分類が使用される。サブブロックの偏差
が、サブブロックの統計的活動度を測定するための基準
として使用される。本発明の１目的によれば、サブブロ
ックの統計的活動度クラスおよび使用される量子化パラ
メータが与えられると、そのサブブロックを符号化する
ために生成されると予想されるビット数を決定するため
に、いわゆる「ビットテーブル」が使用される。

【００１０】このビットテーブル、および、ＰＮＳクラ
スと統計的活動度クラスの間の画像のサブブロックの分
布のヒストグラムが、意図された品質レベルに対して画
像全体を符号化するために使用されるビット数の上記の
評価を算出するために使用される。画像に対して所望さ
れる目的ビット数に最も近い、その画像に対する実際の
ビット数を生じる心理視覚品質レベルが、その画像を符
号化するために選択される。

【００１１】画像の符号化の進行中に、さらに目的に評
価を接近して整合させるように量子化パラメータの列の
調整ができるように、実際に生成されるビット数の評価
が、画像全体を符号化するための目的ビット数と比較さ
れる。この整合は、符号化信号の実際のビット速度を、
その信号に対する目的ビット速度に整合させることに対
応する。さらに、各画像に対して使用されるすべての量
子化パラメータ、および、対応する量子化ステップサイ
ズは、その画像の全ブロックを通じて１パスのみで決定
される。そのために、前画像が、現画像のサブブロック
の確率分布関数を評価するために使用される。

【００１２】

【実施例】図１には、単純化されたブロック図によっ
て、本発明の原理を使用した、運動補償予測／補間ビデ
オ符号器で使用される適応知覚量子化器１００を示す。
適応知覚量子化器１００の動作の理解を助けるため、減
算器１０１および離散コサイン変換器（ＤＣＴ）１１０
をも示す。これらは運動補償予測／補間ビデオ符号器
（図示せず）の一部である。

【００１３】原始ビデオ信号ＶＩＤＩＮは、画像を含む
フレームの列であり、減算器１０１および知覚ノイズ感
度（ＰＮＳ）分類器１０５に供給される。信号ＶＩＤＩ
Ｎのフレーム間差分符号化フレーム（これは、予測符号
化および補間符号化フレームの両方を包含する）に対し
て、減算器１０１には、信号ＶＩＤＩＮとして供給され
ているフレームの予測バージョンを表す信号ＰＲＥＤも
供給される。

【００１４】信号ＶＩＤＩＮのフレームがフレーム内符
号化されている場合、ＰＲＥＤはヌル画像、すなわち、
すべて０である。減算器１０１は、ＰＲＥＤのフレーム
を、ＰＲＥＤのフレームが表す信号ＶＩＤＩＮ内のフレ
ームから減算し、予測エラー信号ＰＲＥＤＥＲＲのフレ
ームを生成する。従って、フレーム間差分符号化フレー
ムに対して、信号ＰＲＥＤＥＲＲは、信号ＰＲＥＤに加
算される際に、画素（ペル）単位で信号ＶＩＤＩＮを生
じる画像を表す。信号ＶＩＤＩＮのフレームがフレーム
内符号化されている場合、信号ＰＲＥＤＥＲＲは信号Ｖ
ＩＤＩＮと同一である。

【００１５】信号ＶＩＤＩＮおよびＰＲＥＤＥＲＲの画
素は、画素の２次元配列であるサブブロックへとグルー
プ化される。典型的な輝度サブブロックサイズは８×８
ペルである。この８×８ペルのサブブロックはまたマク
ロブロックへとグループ化される。例えば、マクロブロ
ックは４個の、１６×１６のペル配列に配置された、隣
接する輝度サブブロック、および、その輝度サブブロッ
クと共存するすべての色サブブロックを含む。輝度マク
ロブロックおよびサブブロックのみが、下記の本発明の
実施例における処理中に使用される。

【００１６】ＤＣＴ１１０は、信号ＰＲＥＤＥＲＲを離
散コサイン領域に変換し、信号ＤＣＴＥＲＲとして量子
化器１２０に供給される変換係数を生成する。量子化器
１２０によって量子化されるのは信号ＰＲＥＤＥＲＲの
変換係数である。ＤＣＴ１１０は、この離散コサイン変
換を実行する際に、信号ＰＲＥＤＥＲＲのペルの上記の
サブブロックに作用する。ＤＣＴ１１０は、変換係数の
出力８×８サブブロックを生じる。８×８ペルのサブブ
ロックがマクロブロックに上記のようにグループ化され
るのと同様に、これらの変換係数の８×８サブブロック
もまた変換係数のマクロブロックへとグループ化され
る。

【００１７】量子化器１２０は、基底量子化器ステップ
サイズ行列を格納するメモリ１２５を含む。基底量子化
器ステップサイズは、基底量子化器ステップサイズ行列
の成分であり、１つの基底ステップサイズが、信号ＤＣ
ＴＥＲＲの各サブブロックの変換係数のうちの１つに対
応してそれを量子化するために使用されるように配列さ
れる。従って、基底量子化器ステップサイズ行列は８×
８行列である。

【００１８】信号ＤＣＴＥＲＲに加えて、量子化器１２
０は、入力として、ＰＮＳ分類器１０５から、量子化パ
ラメータｑ_pをも受信する。量子化器１２０は、基底量
子化器ステップサイズ行列および量子化パラメータｑ_p
を使用して、信号ＤＣＴＥＲＲＱを生成する。信号ＤＣ
ＴＥＲＲＱは、変換されたエラー信号ＤＣＴＥＲＲの量
子化バージョンであり、出力として供給される。信号Ｄ
ＣＴＥＲＲの各係数を量子化するために使用される実際
の量子化器ステップサイズは、ｑ_pの値に、基底量子化
器ステップサイズ行列の各成分を乗じることによって算
出される。

【００１９】ＰＮＳ分類器１０５は、信号ＶＩＤＩＮの
各マクロブロックを、所定の複数の知覚ノイズ感度（Ｐ
ＮＳ）クラスのうちの１つに分類する。ＰＮＳは、領域
の観察者が耐えられるノイズの量、すなわち、ノイズに
対するその領域の知覚的感度を示す。ＰＮＳクラスは、
画像の領域において見いだされる視覚特性の値の範囲に
基づいて決定される。その理由は、人間の眼のノイズに
対する感度は、ノイズが出現する領域の視覚的特性の性
質によって変動するためである。ＰＮＳクラスが基にす
る特性には、空間的活動度、運動速度、運動の連続性、
領域の明るさ、特定のコンテクストにおける領域の重要
性、領域内のエッジの存在、および、領域のテクスチュ
ア（例えば「平坦」から「高度にきめ細かい」まで）が
ある。画像の領域の特性の組合せを含むＰＮＳクラスも
また定義できる。

【００２０】適応知覚量子化器１００の１つの目標は、
ノイズのうちできるだけ多くの部分が最も見えにくい場
所に出現するように量子化から生じるノイズの配置を調
整しながら、同時に、画像のノイズ感度の高い領域が相
対的に精細に量子化されることを保証することである。
従って、ブロック性が生じる（すなわち、サブブロック
境界が知覚可能となる）平坦および低詳細領域は、相対
的に精細に量子化されなければならない。しかし、にぎ
やかできめ細かい領域は、ノイズが見えにくく、相対的
に粗く量子化することができる。ＭＰＥＧ標準に対応す
る実施例では、１つだけの量子化パラメータｑ_pが各マ
クロブロックに対して計算されればよい。

【００２１】本発明の原理によれば、ＰＮＳ分類器１０
５は、マクロブロックが分類されたＰＮＳ分類、およ
び、符号化されているフレーム中の画像の符号化バージ
ョンに対して達成可能と予想される所定の心理視覚品質
レベルＱの両方の関数として、各マクロブロックに対す
る量子化パラメータｑ_pを決定する。心理視覚品質レベ
ルは、ＰＮＳ分類器１０５によって、品質決定ユニット
１３０からの入力として受信される。フレーム中の画像
の心理視覚品質レベルの決定について以下でさらに説明
する。

【００２２】図示の実施例では、Ｑ、ｑ_pおよびＰＮＳ
クラスの間の関係が、ＰＮＳ分類器１０５内のｑ_pテー
ブル１３５に格納される。ｑ_pテーブルの例を表１に示
す。一般的に、このテーブルは、実施者が定義したＰＮ
Ｓ分類の数と同数の列を有する。好適な実施例では、こ
のテーブルは２０個の列を有する。実施例および本発明
の原理を説明するには、表１に示すテーブルのような少
数のクラスを有するテーブルで十分である。

【００２３】

【表１】

【００２４】表１は、行のインデックスが心理視覚品質
レベルＱであり、列のインデックスがＰＮＳクラスとな
るように配列されている。フレームに対するＱは、後で
さらに説明するように、最終的に生じる目的ビット数に
対して、生成されるビット数における不整合を保証する
ために調整されることがあるが、現時点では、説明を明
確にするため、Ｑはフレーム全体の符号化中は一定であ
ると仮定する。

【００２５】ｑ_pテーブルで使用されるＰＮＳクラスの
数および型は、通常、実際の画像による実験に基づいて
選択される。さらに、ｑ_pテーブル内のｑ_pの値は、一般
的に、個々のアプリケーションに期待される画像の品質
および型の範囲に対して実験的に決定される。このよう
な実験の目的は、特定の心理視覚品質レベルでのすべて
のＰＮＳクラスに対するｑ_pの値が、画像の内容（例え
ば、なめらかさ、運動速度、明るさなど）に関わらず、
その心理視覚品質レベルに対して符号化された画像全体
を通じてほぼ等しい知覚ノイズを生成するような、ｑ_p
テーブルを決定することである。

【００２６】ｑ_pテーブルに入れるｑ_pの値を決定するた
めのこのような実験の１つでは、符号器および復号器が
同様に、チャネルビット速度に制約を加えることなく、
固定心理視覚品質レベルで動作することを要求する。Ｑ
＝０は、ｑ_pが計算されているアプリケーションに対す
る最小の心理視覚品質である。表１のＱ＝０の行のｑ_p
値は、最初は、できる限り一様な知覚ノイズの画像が達
成されるように試行錯誤によって導出される。

【００２７】従って、代表画像に対し、観察者が、画像
中に存在するノイズが画像全体に一様に分布していると
知覚したと指示するまで、ｑ_pは、一度に１つまたは組
み合わせて調整される。各ＰＮＳクラスに対するｑ_pの
値はｑ_pテーブルに記録される。この手順は、画像の集
合にわたって、各ＰＮＳクラスに対するｑ_p値が画像ご
とに本質的に変化しないようになり、その集合の各画像
の知覚ノイズが、画像全体にわたって一様に分布してい
ると指示されるまで、反復される。

【００２８】次の高さの心理視覚品質レベル（表１のＱ
＝１）に対するｑ_p値に対する最初の推測として、前の
心理視覚品質レベルの各ｑ_p値が１だけ減少される。こ
の結果、量子化ステップサイズは効果的に減少し、再構
成画像の心理視覚品質レベルは増大する。特定のＰＮＳ
クラスに対応して、画像のある部分が、その画像の残り
の部分よりも少ないノイズを有すると知覚される場合、
そのＰＮＳの列のｑ_p値は、知覚ノイズの一様分布がそ
の画像全体にわたって達成されるまで減少される。

【００２９】同様に、特定のＰＮＳクラスに対応して、
画像のある部分が、その画像の残りの部分よりも多くの
ノイズを有すると知覚される場合、そのＰＮＳの列のｑ
_p値は、知覚ノイズの一様分布がその画像全体にわたっ
て達成されるまで増加される。知覚ノイズが、画像、ま
たは画像の集合の全体にわたって一様になると、上記の
ように、各ＰＮＳクラスに対する新しいｑ_p値がｑ_pテー
ブルに記録される。この手順は、テーブルがすべて満た
されるまで、ｑ_pテーブルの各行に対して反復される。

【００３０】符号化中に、ＰＮＳ分類器１０５は、符号
化されている信号ＶＩＤＩＮの各マクロブロックを、そ
れが最も適合する利用可能なＰＮＳクラスのうちの１つ
に分類する。スイッチ１４０は位置１にあり、本発明の
目的によれば、マクロブロックが分類されたＰＮＳクラ
スがｑ_pテーブルに供給される。スイッチ１４０の位置
は、下記のすべての他のスイッチと同様に、量子化器コ
ントローラ（図示せず）の制御下にある。

【００３１】本発明の原理によれば、品質決定ユニット
１３０からスイッチ１９０を通じて供給される、フレー
ムに対して予想されるＱ値のインデックス値を有する行
と、マクロブロックが分類されたＰＮＳクラスに等しい
インデックス値を有する列の交点が決定される。本発明
の１つの目的によれば、決定された交点におけるｑ_p値
が、上記のように、マクロブロックを符号化するために
使用され、この目的のために、その値は量子化器１２０
に供給される。

【００３２】適応知覚量子化器１００の一実施例では、
ＰＮＳクラスは、ほとんど、マクロブロック内の空間活
動度に基づく。これは、マクロブロックの偏差はそのマ
クロブロックの空間活動度の基本的指示子であり、従っ
て、マクロブロックが属するＰＮＳクラスの基本的指示
子であるためである。マクロブロックの偏差は、そのマ
クロブロック内に含まれる４個の輝度８×８サブブロッ
クの偏差を平均することによって計算することができ
る。マクロブロックの各サブブロックの偏差を、左から
右へ、および、上から下へ、それぞれ、ｖ_a、ｖ_b、ｖ_c
およびｖ_dとする。また、マクロブロックのサブブロッ
クのうちの最大および最小偏差ｖ_max、ｖ_min、ならび
に、マクロブロックの平均偏差ｖ_avが決定される。

【００３３】マクロブロックが、低詳細領域、テクスチ
ュア領域、またはエッジの存在を示す場合があるいくつ
かの異なる種類の領域を含む領域を含むか否かを決定す
るために、その中のサブブロックの偏差を検査すること
によって、マクロブロック内に存在する活動度レベルが
ＰＮＳ分類器１０５で分析される。低詳細領域またはテ
クスチュア領域のみを含むマクロブロックは等質マクロ
ブロックと呼ばれ、そのマクロブロックの偏差に基づい
て直ちにＰＮＳクラスに分類可能である。等質と宣言さ
れる条件を満たさないマクロブロックは非等質と宣言さ
れる。

【００３４】マクロブロックが等質であるかどうかを決
定するためにいくつかのテストが実行可能である。等質
マクロブロックの性質は、その中の４個のサブブロック
の偏差の値が相互に「近い」ことである。本実施例で、
マクロブロックに対して実行される第１のテストは低詳
細テストである。このテストは、マクロブロック全体が
低詳細マクロブロックのうちの１つであるかどうかを決
定する。

【００３５】低詳細テストを通過し、低詳細マクロブロ
ックとして分類されるためには、次の２つの条件がとも
に満たされなければならない。（ｉ）ｖ_av＜Ｔ₁ （ｉｉ）ｖ_max＜Ｔ₂ ただし、Ｔ₁およびＴ₂は０〜２５５の範囲の値を有する
８ビットピクセルに対する所定のしきい値である。しき
い値Ｔ₁の典型値は４５である。しきい値Ｔ₂は一般的に
Ｔ₁の４倍である。

【００３６】マクロブロックが等質性に対する低詳細テ
ストを通過しない場合、そのマクロブロックが等質テク
スチュアマクロブロックであるかどうかを決定するため
に、そのマクロブロックに対してテクスチュアテストが
実行される。テクスチュアテストを通過し、等質テクス
チュアマクロブロックとして分類されるために、条件
（ｉｉｉ）および条件（ｉｖ）または（ｖ）のいずれか
が満たされなければならない。

【００３７】（ｉｉｉ）ｖ_min＞Ｔ₁ （ｉｖ）３つの比ｖ_max／ｖ_sbkのうちの２つがｖ_max／
ｖ_sbk＜Ｔ₃であり、第３の比が＜Ｔ₄である。（ｖ）３つのすべての比が、ｖ_max／ｖ_sbk＜Ｔ₅ ただし、ｖ_sbkは、偏差がｖ_max未満である個々のサブブ
ロックの偏差の値である。

【００３８】一般的に、Ｔ₃は２．５、Ｔ₄は４．０、Ｔ
₅は３．２５である。上で実行される除算において、サ
ブブロックの偏差がしきい値Ｔ₀より小さい場合、それ
はＴ₀にセットされる。これは、０による除算を回避す
るとともに、より意味のある比テストを可能にする。Ｔ
₀の典型値は１０である。これらのテストで使用される
しきい値は、非等質と分類されるマクロブロックの数に
対して、等質と分類されるマクロブロックの数を制御す
るように修正することも可能である。しきい値Ｔ₃、Ｔ₄
およびＴ₅が増大すると、等質と宣言されるマクロブロ
ックの数は比例して増大する。

【００３９】本実施例では、等質マクロブロックには、
ほとんどその偏差に基づいてＰＮＳクラスが割り当てら
れる。マクロブロック偏差の可能範囲は所定の１６クラ
スに分割され、１つのＰＮＳクラスには各間隔が対応す
る。これらの間隔を定義するしきい値を表２に与える。
等質マクロブロックのＰＮＳクラスは、そのマクロブロ
ックの偏差が存在する間隔によって決定される。本実施
例の基本的な１６個のＰＮＳクラスをＣ₀，．．．，Ｃ
₁₅と表す。ＰＮＳしきい値は、低偏差端では接近し、そ
こでは精細な解像度が有利である。

【００４０】ＰＮＳしきい値は実験によって決定するこ
とも可能である。このような実験は、かなり接近して間
隔づけられたしきい値を有する多数のＰＮＳクラスから
開始される。そして、上記のように、ｑ_p値が決定され
る。その後、ｑ_p行列の隣接列が、ほとんど等しいか否
か検査される。ほとんど等しい場合、対応する２つのＰ
ＮＳクラスが１つに合併される。隣接列の合併は、すべ
ての列が相互に十分に異なり、さらに合併が実行できな
くなるまで継続される。

【００４１】

【表２】

【００４２】本実施例では、実験的に導出された表２の
偏差しきい値は、単純な再帰的プロセスを使用して記述
できることが分かっている。Ｌ_iを、第ｉ番目の偏差間
隔の上端の偏差しきい値とする。ただし、ｉは１〜１６
である。Δ_iは、Ｌ_i−Ｌ_i-1に等しいと定義される。初
期条件は、Ｌ₀＝０およびΔ₀＝Δ₁＝５と設定され、漸化式 Δ_i＝Δ_i-1＋Δ´_i-2 およびΔ_iの定義によってすべてのＬ_iの値が生成され
る。この式で、Δ´は次のように定義される。２〜９のｉに対して、Δ´_i-2＝Δ_i-2 １０〜１６のｉに対して、Δ´_i-2＝［Δ_i-2／１０］＊
５

【００４３】マクロブロックが低詳細テストおよびテク
スチュアテストのいずれも満たさない場合、非等質と宣
言される。非等質マクロブロックは、情景内の対象のエ
ッジまたはその付近に生じやすい。この位置での知覚ノ
イズ感度は、エッジ鮮鋭度、対象サイズ、全体の明るさ
などを含む多くの因子に依存する。従って、非等質エッ
ジマクロブロックに対しては、定義可能なさまざまのＰ
ＮＳクラスが存在する。

【００４４】しかし、このようなマクロブロックを分類
する単純であるが有効な方法は、サブブロックのＰＮＳ
クラスとして最小サブブロック偏差ｖ_minが入る偏差範
囲に対応するＰＮＳクラスを表２から使用することであ
ることが実験的に分かっている。これは、量子化プロセ
スによって引き起こされるノイズが、フレームが符号化
される心理視覚品質レベルによって許容されるようなマ
クロブロックの最もノイズ感度の高いサブブロックを量
子化するのに、このようなｑ_pで十分であるためであ
る。

【００４５】さらに、量子化されるマクロブロックの残
りのサブブロックは、実際に必要であるよりも精細に量
子化される。その理由は、それらもまた偏差ｖ_minのサ
ブブロックに対して使用されるのと同一のｑ_p値で量子
化されるためである。しかし、このような結果は、これ
ら残りのサブブロックを符号化するのに、必要以上に多
くのビットを必要とするにも関わらず、受容可能であ
る。その理由は、フレームの心理視覚品質レベルによっ
て許容される以上には、それらのサブブロック内で近く
されるノイズの増大がないためである。

【００４６】上記の技術の例として、非等質マクロブロ
ックが、隣接する２個のサブブロックを含む低詳細領
域、および、隣接する２個のサブブロックを含むテクス
チュア領域を含む場合、低詳細領域がｖ_minを有する。
その理由は、低詳細領域はテクスチュア領域よりも低い
偏差を有するためである。マクロブロックは、マクロブ
ロック全体が等質であって４個のサブブロックが低詳細
領域内のサブブロックと同一である場合、すなわち、マ
クロブロック偏差がｖ_minである場合の結果であるＰＮ
Ｓクラスに分類される。

【００４７】結果として、マクロブロック全体に対して
選択されるｑ_pは、画像が符号化される心理視覚品質レ
ベルに対して受容可能なノイズのレベル以上の付加知覚
可能ノイズを導入しないほどに必要な精細度で低詳細領
域を量子化するのに十分なものである。しかし、この同
じｑ_p値が、マクロブロックのテクスチュア領域に対し
ても使用される。テクスチュア領域は、実際に使用され
るよりも大きいｑ_p値にも耐え得るため、その心理視覚
品質レベルで実際に許容されるよりも小さいノイズを有
するように簡単に符号化される。従って、ｖ_minに対応
するＰＮＳクラスを使用することは慎重な選択である。

【００４８】等質マクロブロックの内容は、低偏差ＰＮ
Ｓクラスのうちの１つに属するマクロブロック内の滑ら
かさから、中偏差ＰＮＳクラスのうちの１つに属するマ
クロブロック内の精細テクスチュア、そして、高偏差Ｐ
ＮＳクラスのうちの１つに属するマクロブロックの粗テ
クスチュアまでの範囲にわたる。上記のように、低偏差
ＰＮＳクラスは一般的にノイズに対する感度が高い。

【００４９】しかし、こうした低偏差ＰＮＳクラスに
は、非常に低いまたは非常に高い明るさを有する場合
に、同レベルの空間的活動度を有するが普通の明るさし
か有しないＰＮＳクラスに対するよりも低いノイズ感度
を特に示すＰＮＳクラスにさらに分類可能なものもあ
る。情景中の運動速度または前景／背景のようなコンテ
クストの面などの他の因子もまた、付加ＰＮＳクラスを
定義することによって考慮に入れることができ、そのう
ちのいくつかは表２で定義されたものと重複する偏差範
囲を有することもある。

【００５０】本発明の１つの目的によれば、任意の種類
の付加ＰＮＳクラスが、表１に付加列を追加する。例え
ば、表１で、ＰＮＳクラスＣ_3aは低詳細であるが非常に
高いまたは非常に低い明るさのＰＮＳクラスに対応し、
Ｃ_3bは、Ｃ_3aと同じ空間的活動度レベルを有するが普通
の明るさであるＰＮＳクラスに対応する。このようなク
ラスを定義するために使用される方法は、上記の方法と
同様であり、作成される付加クラスは付加列として表１
に追加される。

【００５１】Ｃ_3aおよびＣ_3bのように、特定の偏差レベ
ルに対して複数のＰＮＳクラスが存在する場合には、非
等質マクロブロックが符号化される際に、ノイズに対し
て感度の高いＰＮＳクラス（例えばＰＮＳクラスＣ_3b）
が選択されるべきである。上記のように、これはさらに
慎重な選択である。その理由は、これは、最もノイズ感
度の高いサブブロックを含む、マクロブロックのすべて
のサブブロックが、フレームが符号化される心理視覚品
質レベルによって許容されるよりも高いノイズが知覚さ
れることを許容しないように符号化されることを保証す
るためである。

【００５２】予測エラー信号ＰＲＥＤＥＲＲが、ビット
評価器ユニット１１５に供給される。本発明の１つの目
的によれば、符号化される画像の心理視覚品質に対し
て、フレームを符号化するのに必要なビット数を後で評
価することができるように、信号ＰＲＥＤＥＲＲのコン
テクストに基づいて、すべてのマクロブロックの各サブ
ブロックが統計的活動度クラス（ＳＡＣ）に割り当てら
れる。

【００５３】統計的活動度クラスの１つのサブグループ
（偏差モデル活動度分類（ＶＭＡＣ）サブグループとい
う）は、信号ＰＲＥＤＥＲＲのサブブロック偏差のみに
基づく統計的活動度クラスを含む。ＶＭＡＣサブグルー
プ内の各ＳＡＣは、表３に示すように、信号ＰＲＥＤＥ
ＲＲの偏差の範囲に対応する。ＶＭＡＣサブグループ統
計的活動度クラスに対する表３は、ＰＮＳクラスに対す
る表２に類似するが、このような類似性は単なる実施時
の選択の結果である。表３は、等質マクロブロック内に
含まれるサブブロックに対するＳＡＣ分類を実行するた
めに、ＳＡＣ分類器１７０によって使用される。

【００５４】

【表３】

【００５５】ＰＲＥＤＥＲＲ信号内に鋭い不連続が存在
する場合、統計的活動度クラスのもう１つのサブグルー
プが、改善された結果を与えることができる。このよう
なサブグループ（エッジモデル活動度分類（ＥＭＡＣ）
サブグループという）は以下で定義する。従って、統計
的活動度クラスは２つのサブグループ、すなわち、相対
的に連続な領域に対するＶＭＡＣ、および、高度の不連
続性を含む領域に対するＥＭＡＣに分割される。

【００５６】本実施例では、高い不連続性の領域は、信
号ＶＩＤＩＮのサブブロックの偏差の代わりに信号ＰＲ
ＥＤＥＲＲのサブブロックの偏差が使用されることを除
いては、上記のＰＮＳ分類における等質／非等質分節化
と同様の方法を使用して検出される。連続偏差の領域で
生じるサブブロックはＶＭＡＣと指定され、そのサブブ
ロックの偏差が入る偏差領域に対応するＳＡＣを決定す
ることによってＳＡＣ分類を実行するために、ＳＡＣ分
類器１７０によって表３が使用される。不連続偏差の領
域で生じるサブブロックに対しては、さらに処理が下記
のように実行される。その他の周知の不連続／エッジ領
域の検出方法もまた使用可能である。

【００５７】高い不連続性／エッジ領域に対しては、Ｅ
ＭＡＣサブグループに属する４つの統計的活動度クラス
が定義される。最初の３つのＥＭＡＣクラス（Ｅ₀〜
Ｅ₂）は、サブブロックの偏差に依存する。Ｅ₀は、１５
０〜６４９の偏差強度を有するサブブロック内の弱エッ
ジを表し、Ｅ₁は、６５０〜１８９９の偏差強度を有す
るサブブロック内の標準エッジを表す。

【００５８】Ｅ₂は、１９００以上の偏差強度を有する
サブブロック内の強エッジを表す。第４のＥＭＡＣクラ
スＥ₃は、６５０より大きい偏差強度差を有する水平ま
たは垂直エッジに対して使用される。これらの統計的活
動度クラスを表４に示す。この表は、下記のように、高
い不連続性／エッジの領域にあるサブブロックのＳＡＣ
分類を実行するためにＳＡＣ分類器１７０によって使用
される。

【００５９】

【表４】

【００６０】サブブロック分類に使用されるプロセス
は、テクスチュアからエッジを区別することができるこ
とを必要とする。このために、４個のサブブロック偏差
が、非等質マクロブロック内の位置に関して評価され
る。

【００６１】サブブロックは、ＶＭＡＣまたはＥＭＡＣ
サブグループのいずれかのＳＡＣに属することができ
る。図２に、サブブロック２０４、２０６、２０８およ
び２１０に分割されたマクロブロック２０１の例を示
す。各サブブロック２０４、２０６、２０８および２１
０はまた、対応するＰＲＥＤＥＲＲ偏差ｖ_a、ｖ_b、
ｖ_c、およびｖ_dをもそれぞれ有する。数値例を与えるた
めに、ｖ_a＝９００、ｖ_b＝４０、ｖ_c＝２０００、およ
びｖ_d＝１００とする。

【００６２】サブブロック偏差は、サブブロック偏差の
対比較を使用することによってソートされる。６回のこ
のような比較が実行される。３回はｖ_maxを決定するた
めであり、２回はｖ_minのためであり、最後の２回はｖ
_midhおよびｖ_midl、すなわち、中の上偏差値および中の
下偏差値のためである。再び図３にマクロブロック２０
１を示す。各サブブロック２０４、２０６、２０８およ
び２１０は、上で与えられた数値例に従って、ソートさ
れた後適当にラベル付けされている。

【００６３】再び、上記のように、サブブロック偏差の
値が、上記のしきい値Ｔ₀より小さい場合、それはＴ₀に
設定される。３個の偏差比ｒ₀＝ｖ_midl／ｖ_min、ｒ₁＝
ｖ_midh／ｖ_midl、およびｒ₂＝ｖ_max／ｖ_midhが計算され
る。これらの比は、それらのうちからｒ_max、ｒ_mid、お
よびｒ_minを決定するために２回の対比較によってソー
トされる。図４に、偏差比４０３を含む配列４０１を示
す。上で与えられた数値例に対する比ソートの結果を示
す配列４０１も示されている。

【００６４】第１ステップとして、偏差ｖ_minを有する
サブブロックが最初に、その偏差および表３によって決
定されるＶＭＡＣサブグループ内の統計的活動度クラス
のうちの１つに割り当てられる。また、偏差ｖ_maxを有
するサブブロックは最初に、その偏差および表４によっ
て決定されるＥＭＡＣサブグループ内の統計的活動度ク
ラスのうちの１つに割り当てられる。従って、数値例で
は、サブブロック２０６が、ＶＭＡＣサブクラスのうち
からＶ₃というＳＡＣに割り当てられ、サブブロック２
０８が、ＥＭＡＣサブクラスのうちからＥ₂というＳＡ
Ｃに割り当てられる。

【００６５】その後、偏差比がｒ_minである２つのサブ
ブロックが合併されて第１領域を生成する。図３に、そ
の偏差の比がｒ_minであるサブブロック２０４および２
０８を合併して生成された第１領域３０１を示す。第１
領域のサブブロックのうちの１つが偏差ｖ_maxを有する
場合、この領域は最初にエッジ領域と宣言され、その中
の２つのサブブロックはいずれもＥＭＡＣサブグループ
内の統計的活動度クラスのうちの１つに割り当てられ
る。

【００６６】サブブロック２０８は偏差ｖ_maxを有する
ため、第１領域３０１はエッジ領域と宣言され、従っ
て、サブブロック２０４および２０８はＥとラベル付け
される。最初に、それぞれが分類されるＥＭＡＣサブグ
ループの特定のＳＡＣがサブブロックの偏差および表４
から決定される。しかし、この初期ＳＡＣは下記のよう
に変更され得る。数値例では、この初期ＳＡＣはＥ₃で
ある。

【００６７】また、第１領域のサブブロックのうちの１
つが偏差ｖ_minを有する場合、各サブブロックは、各偏
差および表３に従って、ＶＭＡＣクラスのうちの１つに
割り当てられる。このようなサブブロックはＶとラベル
付けされる。領域が偏差ｖ_midhおよびｖ_midlのみのサブ
ブロックを含む場合、そのサブブロックを分類するため
にさらに検査が必要となる。

【００６８】偏差比ｒ_midを有するサブブロックは第２
領域へと合併され、その２つのサブブロックには、その
うちの１つが以前に割り当てられたＶＭＡＣサブグルー
プまたはＥＭＡＣサブグループのいずれかの同じサブグ
ループの統計的活動度クラスに割り当てられる。数値例
では、ｒ₀＝ｒ_midであり、サブブロック２０６および２
１０が第２領域３０３に含められる。サブブロック２０
６は既にサブブロックＶＭＡＣのＳＡＣに分類されてい
るため、サブブロック２１０もまたそうなり、従って、
Ｖとラベル付けされる。数値例では、サブブロック２１
０はＶ₅というＳＡＣに分類される。

【００６９】偏差比がｒ_minである２つのサブブロック
がＥＭＡＣサブグループのＳＡＣに分類され、いずれの
サブグループもＥ₀クラスでなく、ｒ_min＜２であり、そ
のサブブロックが｛２０４，２０６｝、｛２０８，２１
０｝、｛２０４，２０８｝または｛２０６，２１０｝で
ある場合、強水平または垂直エッジが存在すると決定さ
れる。このような状況では、偏差比がｒ_minである各サ
ブブロックはＥ₃クラスに割り当てられる。数値例で
は、ｖ_aが９００から１９００に変化すると、垂直エッ
ジに対するすべての条件がサブブロック２０４および２
０８に存在することになる。従って、各サブブロック２
０４および２０８はＥ₃というＳＡＣに割り当てられる
ことになる。

【００７０】図５に、非等質マクロブロックの３つの可
能な型、および、マクロブロックのサブブロックのＥＭ
ＡＣ（Ｅ）およびＶＭＡＣ（Ｖ）サブグループ内の統計
的活動度クラスへの割当のすべての許容される組合せを
示す。特に、マクロブロック５０１、５０３、５０５、
５０７、５０９、５１１、５１３および５１５は、強水
平または垂直エッジを有する候補である。その理由は、
番号づけられた各マクロブロックは、ＥＭＡＣサブグル
ープの統計的活動度クラスに分類された隣接サブブロッ
クを含むためである。

【００７１】図１に戻って、現フレームに対するＱを決
定するために、ヒストグラムカウンタ（ＨＩＳＴ）１４
５は、符号化開始前に特定のＰＮＳクラスにも存在する
各ＳＡＣ内のサブブロック数の評価を含まなければなら
ない。この評価は、ＨＩＳＴ１４５とともに含まれるヒ
ストグラムテーブルＨＩＳ［ＰＮＳ］［ＳＡＣ］に保持
される。従って、評価はヒストグラムテーブルのテーブ
ルエントリであり、ヒストグラムテーブルの行はＰＮＳ
クラスによってインデックスづけられ、列は統計的活動
度クラスによってインデックスづけられる。

【００７２】実施例では、ＨＩＳＴ１４５に格納された
ヒストグラム値は、前フレームが符号化されている間に
計算される。ヒストグラムテーブルに格納されたすべて
の値が、前フレームの符号化の開始前にＨＩＳＴ１４５
によって０にクリアされる。スイッチ１４０、１５５、
１６０、１６５および１９０は、前フレームが符号化さ
れているときには位置１にある。前フレームの各マクロ
ブロックは、処理されると、スイッチ１６５を通じてＰ
ＮＳクラスをＨＩＳＴ１４５に供給するＰＮＳ分類器１
０５によって、所定のＰＮＳクラスのうちの１つに分類
される。

【００７３】同様に、各マクロブロックの各サブブロッ
クに対し、ＳＡＣ分類器１７０は、スイッチ１６０を通
じてＨＩＳＴ１４５に供給されるＳＡＣを生成する。ヒ
ストグラムテーブルの各行および列の交点には、既に処
理され、同じ特定のＰＮＳクラスおよび同じ特定の統計
的活動度クラスの両方に分類された前フレームのサブブ
ロック数が格納される。各サブブロックが処理される
と、今サブブロックが分類されたＳＡＣおよびＰＮＳク
ラスのそれぞれに対応する行および列の交点のヒストグ
ラムテーブルの位置がインクリメントされる。前フレー
ムの符号化の終了までに生成されヒストグラムテーブル
に格納される値は、その後、現フレームに対する特定の
ＰＮＳクラスにも存在する各ＳＡＣ内のサブブロック数
の評価として使用される。

【００７４】心理視覚品質レベルの選択は、各フレーム
に対し、そのフレームの符号化の開始前に１度実行され
る。その際、品質決定ユニット１３０は、運動補償予測
／補間ビデオ符号器（図示せず）から、符号化されるフ
レームの目的ビット数、および、ビット評価器１１５か
ら、可能な各心理視覚品質レベルが使用される際にフレ
ームを符号化するのに必要となるビット数の評価を、入
力として受信する。品質決定ユニット１３０は、各心理
視覚品質レベルの評価されたビット数を、フレームの目
的ビット数と比較し、目的ビット数以下で最も近い評価
に対応する心理視覚品質レベルを選択する。

【００７５】各心理視覚品質レベルで現フレームを符号
化することによって生成されるビット数を評価するため
に、ビット評価器１１５は、ａ）特定のＰＮＳクラスに
も存在する各統計的活動度クラス（ＳＡＣ）内のサブブ
ロック数の評価である、ヒストグラムテーブルに格納さ
れた値、ｂ）特定の統計的活動度クラス内のサブブロッ
クが特定のｑ_pで符号化される場合に生成される評価ビ
ット数を示す事前格納ビットテーブル１５０（表５）、
および、ｃ）ＰＮＳ分類器１０５によって供給されるｑ
_p値、を使用する。

【００７６】このような評価を決定するために、スイッ
チ１４０、１５５、１６０、１６５および１９０はすべ
て位置２にされる。特定の心理視覚品質レベルＱ´に対
して、フレームを符号化するのに必要なビット数の評価
は次式で与えられる。

【数１】ただし、ＰＮＳ_indxは、複数のＰＮＳクラス全
体を走る変数であり、ＳＡＣ_indxは、複数の統計的活動
度クラス全体を走る変数であり、ＨＩＳ［ＰＮＳ_indx］
［ＳＡＣ_indx］は、ヒストグラムテーブルからの対応す
る値である。

【００７７】ＰＮＳ_indxおよびＳＡＣ_indxの値は、すべ
てのＰＮＳクラスおよびすべての統計的活動度クラスに
わたる二重和を実行するように、それぞれＰＮＳｉｎｄ
ｘ１７５およびＳＡＣｉｎｄｘ１８０によって供給され
る。ｑ_p＿ＴＡＢＬＥ［Ｑ´］［ＰＮＳ_indx］は、心理
視覚品質レベルＱ´に対するｑ_pの値に対応する。Ｑ´
の値は、心理視覚品質レベルの全範囲にわたる。ビット
数は、各Ｑ´値に対して１度計算される。Ｑ´はＱ´ｉ
ｎｄｘ１８５によって供給される。ＰＮＳｉｎｄｘ１７
５、ＳＡＣｉｎｄｘ１８０およびＱ´ｉｎｄｘ１８５に
よる値の供給のタイミングは、コントローラ（図示せ
ず）によって同期される。このような同期は当業者に周
知である。

【００７８】表５に、省略したビットテーブル１５０の
例を示す。このようなテーブルの生成方法は当業者にと
って直ちに明らかである。

【００７９】

【表５】

【００８０】指定されたビット数以内で画像を符号化す
る最善の努力にも関わらず、実際に生成されるビット数
が仕様を（おそらく大幅に）超過することが起こり得
る。これは一般的に、ヒストグラムテーブルがＰＮＳク
ラスおよび統計的活動度クラスにおけるサブブロックの
分布の評価に過ぎず、そのような評価は、特に情景変化
の際に正しくないことがあるという事実の結果である。

【００８１】運動補償予測／補間ビデオ符号器（図示せ
ず）の一般的なバッファのオーバフローを防ぐため、バ
ッファのあふれが規則的間隔（例えばフレームごとに５
回）ＰＮＳ分類器１０５によって監視される。符号器バ
ッファのあふれの指示が信号バッファあふれとしてＰＮ
Ｓ分類器１０５によって受信される。バッファあふれに
依存して、符号化されているフレームに対するｑ_pテー
ブルへのインデックスとして使用されているＱが、累進
的かつ順序正しく調整される。Ｑに対するこの調整の性
質および方向は、バッファのあふれとともに変化する。
使用されるＱを減少させる結果、量子化が粗くなり、観
察者によって知覚される心理視覚品質を犠牲にしてより
少ないビットが生成される。しかし、心理視覚品質にお
けるこのような順序正しい減少は、バッファのオーバフ
ローを許容するよりも望ましい。

【００８２】以上は、本発明の原理の単なる例示であ
る。従って、適応知覚量子化器１００のさまざまな要素
が離散的な機能要素として示されているが、それらの各
機能は一般的に、当業者に周知の方法で、プロセッサで
実行される適当なプログラムコードによって実現され
る。

【００８３】例えば、このような一実施例では、メモリ
１２５に格納される量子化ステップサイズ行列は、各フ
レームに対して１度記憶装置（図示せず）からダウンロ
ードすることができる。従って、行列は、フレームごと
に同一である必要はない。さらに、複数のｑ_pテーブル
１３５がＰＮＳ分類器１０５に格納されることが可能で
ある。特定のフレームを符号化するのにどの格納テーブ
ルを使用するかは、その特定フレームに使用される符号
化の種類に依存することができる。

【００８４】従って、フレーム内符号化フレーム（Ｉ）
が第１ｑ_pテーブルを有し、運動補償予測（Ｐ）符号化
フレームが第２ｑ_pテーブルを有し、運動補間（Ｂ）フ
レームが第３ｑ_pテーブルを有するということが可能で
ある。他の実施例では、信号ＰＲＥＤＥＲＲがＰＮＳ分
類においてＶＩＤＩＮに加えて、またはその代わりに使
用されることができる。これは、ＰＮＳ分類器１０５へ
の破線入力によって示されている。

【００８５】また他の実施例では、符号化されるフレー
ムは２パスプロセスによって処理されることも可能であ
る。２パスを実現するため、フレームに対応する信号Ｖ
ＩＤＩＮの部分が一時的にメモリにバッファリングされ
る。第１パス中に、符号化されるフレームのＰＮＳクラ
スおよび統計的活動度クラスにおけるサブブロックの実
際の分布が決定されヒストグラムテーブルに格納され
る。

【００８６】その結果、各心理視覚品質レベルに対して
フレームを符号化するのに必要な評価ビット数が実際の
ビット数となる。従って、最適一致の心理視覚品質レベ
ルが品質決定ユニット１３０によって選択された後、フ
レームの実際の符号化（第２パス）中に生成されるビッ
ト数は、第１パス中にその心理視覚品質レベルに対して
決定された数そのものである。従って、補正の必要がな
い。

【００８７】さらに他の実施例では、ＨＩＳＴ１４５は
実際には複数のヒストグラムテーブルを含み、また、ヒ
ストグラムテーブルは複数の領域を含むことが可能であ
る。このような実施例では、１つのヒストグラムにはフ
レーム型（例えばＩ、ＰおよびＢフレーム）ごとに格納
される。特定のフレームのビット数の計算に実際に使用
されるヒストグラムは、同じ型のフレームに対して格納
されたものとなる。

【００８８】

【発明の効果】以上述べたごとく、本発明によれば、量
子化パラメータが従来よりも簡単な方法で適切に選択さ
れる。本発明によれば、大量のメモリは必要でなく、画
像が複数回処理されることも必要でなく、導入される遅
延も従来に比べて短い。また、画像の非等質領域（例え
ばエッジ）の性質も考慮される。本発明の方法および装
置は、単一の量子化パラメータを効果的に使用するた
め、ＭＰＥＧによるビデオ符号化に適したものである。

【図面の簡単な説明】

【図１】本発明の原理による、適応知覚量子化器の、単
純化したブロック図である。

【図２】サブブロックに分割されたマクロブロックの例
である。

【図３】図２に示すものと同一のマクロブロックにおい
て、そのサブブロックが、ソート後に適切にラベル付け
された図である。

【図４】偏差比を含む２つの配列である。

【図５】非等質マクロブロックの３つの可能な型、およ
び、そのサブブロックの、ＥＭＡＣおよびＶＭＡＣサブ
グループ内の統計的活動度クラスへの割当のすべての許
容される組合せである。

【符号の説明】

１００適応知覚量子化器１０１減算器１０５知覚ノイズ感度（ＰＮＳ）分類器１１０離散コサイン変換器（ＤＣＴ）１１５ビット評価器ユニット１２０量子化器１２５メモリ１３０品質決定ユニット１３５ｑ_pテーブル１４０、１５５、１６０、１６５、１９０スイッチ１４５ヒストグラムカウンタ（ＨＩＳＴ）１５０事前格納ビットテーブル１７０ＳＡＣ分類器２０１マクロブロック２０４、２０６、２０８、２１０サブブロック４０１配列４０３偏差比

───────────────────────────────────────────────────── フロントページの続き (72)発明者ランガラヤンアラヴィンドアメリカ合衆国 07747 ニュージャージーマタワン、マタワンテラス 104 (72)発明者バリンジィオフリーハスケルアメリカ合衆国 07724 ニュージャージーティントンフォールズ、グレンウッドドライヴ 82 (72)発明者ヒュ−ミンハンアメリカ合衆国 07751 ニュージャージーモルガンヴィル、ヨークシャードライヴ 135 (56)参考文献特開平３−16489（ＪＰ，Ａ) 特開平２−305191（ＪＰ，Ａ) 特表平２−503733（ＪＰ，Ａ)

Claims

(57)【特許請求の範囲】

【請求項１】ビデオ符号器が、フレームからなるビデ
オ信号の少なくとも一部を処理する際にそのビデオ符号
器によって使用される量子化パラメータを生成する際に
使用する方法において、前記フレームのうちの特定の１つを複数の領域に分割す
るステップと、各領域を所定の複数の知覚ノイズ感度クラスのうちの１
つに分類するステップと、前記フレームに対する目的心理視覚品質レベルを所定の
複数の目的心理視覚品質レベルのうちから選択するステ
ップと、前記各領域の知覚ノイズ感度クラスおよび前記目的心理
視覚品質レベルの関数として、前記各領域の量子化パラ
メータを提供するステップとからなることを特徴とする
量子化パラメータ生成方法。
【請求項２】分類ステップが、各領域に対する知覚ノイズ感度レベルを決定するステッ
プと、各知覚ノイズ感度レベルを、所定の複数の知覚ノイズ感
度クラスのうちの対応する１つにマッピングするステッ
プとからなることを特徴とする請求項１の方法。
【請求項３】選択ステップが、目的心理視覚品質レベ
ルを、フレームのビデオ信号の評価複雑度およびフレー
ムを符号化するために指定されるビット数に関連づける
所定の関数を使用することを特徴とする請求項１の方
法。
【請求項４】領域がマクロブロックであり、決定ステ
ップが、各マクロブロックに対する知覚ノイズ感度レベ
ルを決定し、それによって、付加ノイズを有するマクロ
ブロックを知覚する観察者にそのノイズの付加が与える
妨害効果に関してマクロブロックに付加することができ
るノイズの量によって各マクロブロックを特徴づけるこ
とを特徴とする請求項２の方法。
【請求項５】前記領域が２種類からなり、第１種の領
域はマクロブロックであり、第２種の領域はサブブロッ
クであり、複数のサブブロックが合わせてマクロブロッ
クを形成するようにグループ化され、選択ステップが、各サブブロックを複数の統計的活動度クラスのうちの１
つに分類するステップと、複数の心理視覚品質レベルのそれぞれにおいてフレーム
を符号化するのに必要なビット数の評価を算出するステ
ップと、前記評価を、前記フレームを符号化するのに使用可能な
所定の目的ビット数と比較するステップと、前記目的ビット数を超えない最も近い評価を心理視覚品
質レベルを取得するステップとからなることを特徴とす
る請求項１の方法。
【請求項６】算出ステップの各評価が、特定の心理視
覚品質レベルＱ´に対して、【数１】によって与えられる（ただし、ＰＮＳ_indxは、複数の知
覚ノイズ感度クラス全体を走る変数であり、ＳＡＣ_indx
は、複数の統計的活動度クラス全体を走る変数であり、
ｑ_p＿ＴＡＢＬＥ［Ｑ´］［ＰＮＳ_indx］は、心理視覚
品質レベルＱ´を達成するために符号化されなければな
らない知覚ノイズ感度クラスＰＮＳ_indxに属するマクロ
ブロックを符号化する際に使用される量子化パラメータ
の値に対応し、ＨＩＳ［ＰＮＳ_indx］［ＳＡＣ_indx］
は、知覚ノイズ感度クラスＰＮＳ_indxにも存在する統計
的活動度クラスＳＡＣ_indx内のサブブロック数の評価で
ある）ことを特徴とする請求項５の方法。
【請求項７】フレームからなるビデオ信号の少なくと
も一部の量子化に使用される装置において、前記フレームが所定の複数の知覚ノイズ感度クラスのう
ちの１つに分割される第１領域を分類する第１分類手段
（１０５）と、前記フレームを符号化するために、所定の複数の心理視
覚品質レベルから目的心理視覚品質レベルを選択する手
段（１３０、１１５）と、前記各領域に対する量子化パラメータを決定する手段
（１２０）とからなり、決定手段が、前記各領域が第１
分類手段によって分類される知覚ノイズ感度クラスに応
答し、目的心理視覚品質レベルが前記フレームに対して
選択手段によって選択されることを特徴とする量子化パ
ラメータ生成装置。
【請求項８】選択手段が、所定の複数の心理視覚品質レベルのそれぞれを有する前
記フレームを符号化するのに必要なビット数の評価を生
成する手段（１１５）と、前記フレームを符号化するのに使用可能な所定の目的ビ
ット数を受信する手段と、前記目的ビット数に最も近い評価を有する心理視覚品質
レベルを取得する手段（１３０）とからなることを特徴
とする請求項７の装置。
【請求項９】選択手段が、所定の複数の心理視覚品質レベルのそれぞれを有する前
記フレームを符号化するのに必要なビット数の評価を生
成する手段（１１５）と、前記フレームを符号化するのに使用可能な所定の目的ビ
ット数を受信する手段と、前記目的ビット数を超過せずにそれに最も近い評価を有
する心理視覚品質レベルを取得する手段（１３０）とか
らなることを特徴とする請求項７の装置。
【請求項１０】評価生成手段が、前記フレームが所定の複数の統計的活動度クラスのうち
の１つに分割される第２領域を分類する第２分類手段
（１８０）と、第１および第２分類手段に応答して、特定の心理視覚品
質レベルが達成されるように、第１領域のうちの１つの
中に含まれる第２領域のうちの１つの符号化によって生
成されるビット数を決定する手段（１５０）とからなる
ことを特徴とする請求項８または９の装置。
【請求項１１】第１領域がマクロブロックであり第２
領域がサブブロックであることを特徴とする請求項１０
の装置。
【請求項１２】前記量子化パラメータを出力として供
給する手段（１５５）と、前記量子化パラメータに応答して、前記ビデオ信号の符
号化形式の一部を量子化する量子化手段（１２０）とを
さらに有することを特徴とする請求項７の装置。