JP2010505342A - 空間アクティビティメトリックとその評価方法 - Google Patents

空間アクティビティメトリックとその評価方法 Download PDF

Info

Publication number
JP2010505342A
JP2010505342A JP2009530370A JP2009530370A JP2010505342A JP 2010505342 A JP2010505342 A JP 2010505342A JP 2009530370 A JP2009530370 A JP 2009530370A JP 2009530370 A JP2009530370 A JP 2009530370A JP 2010505342 A JP2010505342 A JP 2010505342A
Authority
JP
Japan
Prior art keywords
spatial activity
image
activity metric
metric
spatial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009530370A
Other languages
English (en)
Other versions
JP5048071B2 (ja
Inventor
リュ,シャオアン
ザイ,ジエフ
ゴミラ,クリスティーナ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of JP2010505342A publication Critical patent/JP2010505342A/ja
Application granted granted Critical
Publication of JP5048071B2 publication Critical patent/JP5048071B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/40Analysis of texture
    • G06T7/41Analysis of texture based on statistical description of texture

Abstract

画像を特徴付ける空間アクティビティメトリックが、典型的には、画像の分散、勾配又はDCT係数の1つに基づき決定される。その後、空間アクティビティメトリックは、画像における推定されたノイズの大きさだけ低減され、これにより、空間マスク処理に関する空間アクティビティメトリックにより、フィルムグレインなどのノイズの存在により引き起こされるマスク処理されていない歪みの可能性が低減される。このような空間アクティビティメトリックの有効性は、画像における類似したテクスチャの各領域の空間アクティビティメトリックにより生成される各指標の類似性を判断し、画像における異なるテクスチャの各領域の空間アクティビティメトリックにより生成される各指標の相違を判断することによって決定できる。

Description

本出願は、その教示がここに援用される、2006年9月29日に出願された米国仮特許出願第60/848,296号に対する35U.S.C.119(e)による優先権を主張する。
本発明は、空間アクティブティメトリックによる画像の特徴付けに関する。
画像処理の分野において、空間アクティビティメトリックは、画像の規定された領域内のテクスチャの指標を提供する。このテクスチャの指標を利用することにより、多くの通常の画像処理アプリケーションが人間の視覚系の空間マスキング効果を利用することが可能となる。人間の視覚系機構は画像のスムース領域よりもテクスチャ化領域に取り込まれるより大きな歪みを許容しうるため、空間マスキングが行われる。圧縮されたビデオ画像の場合、画像に取り込まれる歪みは量子化により生じるアーチファクトに対応する。ビデオ画像の透かし処理の場合、取り込まれた歪みは埋め込みデータに対応する。
多くの画像処理アプリケーションは、この空間アクティビティメトリックを用いて、取り込まれた歪みが肉眼により顕著に現れるフラット又は低詳細領域と、取り込まれた歪みがあまり顕著に表れないビジー又はテクスチャ化された領域とを区別する。既存の空間アクティビティメトリックはアニメーションに係る画像や低フィルムグレイン強度(film grain strength)などの低解像度ノイズを有する画像などのグレインフリー画像に対する良好な指標を提供するが、そのような指標は、ノイズが存在する場合に空間アクティビティを特徴化しない。このため、ノイズを含む画像について、空間マスキングはマスク処理されていない取り込まれた歪みを有する画像の部分に従ってしまう可能性がある。
既存の空間アクティビティメトリックは、(1)分散ベース、(2)勾配ベース及び(3)DCTベースの3つのカテゴリに分類することができる。それぞれの説明が以下に与えられるが、それらはすべて16×16のブロックに基づく。
[分散ベースメトリック]
このメトリックは、輝度の分散を用いた空間アクティビティを評価する。このカテゴリの代表的なメトリックは、MPEG−2リファレンスソフトウェアのレート制御アルゴリズムに用いられるメトリックである。
Figure 2010505342
ただし、varはi番目の8×8のサブブロックの分散である。このメトリックを用いて、MPEG−2リファレンスソフトウェアは、テクスチャ化された領域におけるより大きな歪みと、スムース領域におけるより小さな歪みとを許容し、これにより、同じビットレートによるピクチャ全体のより高い視覚的なクオリティが獲得される。
[勾配ベースメトリック]
このカテゴリには2つのメトリックが存在する。第1のメトリックACT grdは、水平方向と垂直方向の勾配を考慮している。
Figure 2010505342
ただし、Ii,jはピクセル(i,j)における輝度値である。第2のメトリックACT grdは、対角線方向を考慮している。
Figure 2010505342
ただし、gradi,j,nは、ピクセル(i,j)における以下の4つの5×5の方向ハイパスフィルタの1つにより計算されるローカルな勾配である[3]。
Figure 2010505342
[DCTベースメトリック]
このメトリックは、輝度値のDCT係数のAC成分を利用する。第1のメトリックは、AC係数の絶対値を考慮する。
Figure 2010505342
ただし、F(i,j)は周波数(i,j)のDCT係数である。もう1つは、DC係数によるAC係数の正規化である[3]。
Figure 2010505342
上記メトリックは、フィルムグレイン強度などの低ノイズを有する粒度フリー又は低解像度画像に対する良好な指標を提供する。しかしながら、これらのメトリックは、テクスチャなどのフィルムグレインなどのノイズを処理し、フィルムグレインなどの強いノイズを主に構成するスムース領域に相対的に大きな値を割り当てる。このため、これらのメトリックは、強いノイズを有するスムース領域をテクスチャ化された領域として誤ってみなしてしまう。このため、このようなメトリックは、スムース領域マスクすることが可能である歪みより大きな歪みを取り込む可能性がある。
従って、フィルムグレインなどのノイズが存在する領域の空間アクティビティを効果的に評価する新たな空間アクティビティメトリックが必要とされる。
表示される画像のクオリティを向上させるため、空間マスキングと共に空間アクティビティメトリック指標を適用する際、画像の視覚的クオリティはメトリックの有効性の指標として役立つ。ビデオ圧縮の場合、復号化されたピクチャは表示されるピクチャとして機能する。透かし処理アプリケーションの場合、表示されるピクチャは埋め込みデータを有する。空間アクティビティメトリックの有効性は、全体的な主観的評価を伴う。
評価時間を短縮するため、空間アクティビティメトリックのパフォーマンスを評価する客観的な方法が必要とされる。
概略的には、本原理の好適な実施例によると、画像を特徴付ける空間アクティビティメトリックを決定する方法が提供される。本方法は、まず空間アクティビティメトリックを決定することにより開始される。その後、画像内のノイズ(フィルムグレインを含みうる)が推定される。その後、空間アクティビティメトリックが推定されたノイズの大きさだけ低減され、これにより、空間マスク処理に関して空間アクティビティメトリックを利用することによって、フィルムグレインなどのノイズの存在により引き起こされるマスク処理されていない歪みの可能性が低下する。
本発明の他の特徴によると、画像におけるテクスチャの指標を提供するのに利用されるタイプの空間アクティビティメトリックの有効性を特徴付ける方法が提供される。本方法は、画像における類似したテクスチャの各領域の空間アクティビティメトリックにより生成される指標の類似性を判断することにより開始される。また、画像における異なるテクスチャの各領域の空間アクティビティメトリックにより生成される指標の相違が判断される。空間アクティビティメトリックが、類似したテクスチャ領域について類似した指標と、異なるテクスチャの各領域の指標間で大きなスプレッドとを提供する程度が、当該メトリックの高いパフォーマンスを反映する。
図1は、本原理の第1実施例により確立された空間アクティビティメトリックを画像に適用する処理の各ステップをフローチャートにより示す。 図2は、本原理の第2実施例により確立された空間アクティビティメトリックを画像に適用する処理の各ステップをフローチャートにより示す。 図3は、本原理の第3実施例により確立された空間アクティビティメトリックを画像に適用する処理の各ステップをフローチャートにより示す。 図4は、本原理の他の特徴による空間アクティビティメトリックの有効性を特徴付ける処理の各ステップをフローチャートにより示す。 図5は、エンコーダにより利用されるレート制御アルゴリズムに関して空間アクティビティメトリックがどのように適用可能であるか示す一例となるビデオエンコーダのブロック図を示す。 図6は、図5のエンコーダにおいてレート制御を実現するための本原理の他の特徴による処理の各ステップをフローチャートにより示す。 図7は、ビデオクオリティを評価するため空間アクティビティメトリックを適用する視覚的クオリティ解析手段のブロック図を示す。
既存の空間アクティビティメトリックは、フィルムグレイン強度が低いグレインフリー又は低解像度画像に対する良好な指標を提供するが、このようなメトリックは、フィルムグレインが存在する場合において空間アクティビティだけでなく輝度へもまた強い依存性を示す。説明のため、フィルムグレインは、一般にフィルム現像中に生成されるランダムテクスチャとして画像内に出現する。フィルムグレインは、フィルムストック、照明状態及び現像処理に依存してサイズ、形状及び強さの異なる加法性信号依存ノイズとして一般にみなされる。フィルムグレインの強さは、ピクセルの強さと高い相関を示し、このことは、既存の空間アクティビティメトリックが輝度に強く依存する理由を説明する。
本原理によると、輝度への依存性を大きく低減した空間アクティビティメトリックを確立する方法が提供される。本原理の方法は、(1)典型的にはモデリングを通じてフィルムグレインを推定し、(2)空間アクティビティメトリックからフィルムグレイン強度を排除することによって、輝度への依存性を低減させる。
[フィルムグレイン推定]
フィルムグレインは、以下の関係
Figure 2010505342
に従って、典型的にはモデリングによって推定可能である。ただし、g(i,j)及びf(i,j)はそれぞれ位置(i,j)における観察された及びノイズフリーピクセル値を構成し、γはフィルムストック及びシューティング条件に与えられた定数であり、n(i,j)はゼロの平均の正規分布ノイズである。f(i,j)γ*n(i,j)の積は、フィルムグレインを特徴付ける。通常、γは0.3〜0.7の範囲であり、ほとんどのケースにおいて、約0.5の値を有する。近い値のf(i,j)があるスムース領域では、式(8)は、
Figure 2010505342
により近似可能である。ただし、
Figure 2010505342
である。n(i,j)がf(i,j)から独立していると仮定すると、分散の関係式は以下のように取得できる。
Figure 2010505342
ただし、σ ,σ 及びσ はそれぞれg(i,j),f(i,j)及びn(i,j)の分散であり、σ grainはフィルムグレインの分散である。
まずフィルムに記録され、その後に高解像度ビデオに変換された画像について、通常は多くの領域はフラット又はほぼフラットに見え、すなわち、それらはテクスチャを欠いている。これらの領域の分散は、フィルムグレインにほとんど依存し、すなわち、
Figure 2010505342
となる。同様の輝度を有するフラットな領域について、グレインの特性は同質であり、テクスチャ化された領域の分散より小さく極めて近いσ をもたらす。この結果、分散のヒストグラムは通常は小さなピークを有する。従って、グレインの強さを推定するヒストグラムベースの方法は、良好な結果をもたらす。
ヒストグラムベースの方法を利用するため、画像内の各領域はまず個別の輝度範囲に従って複数のグループに分類される。各グループについて、分散のヒストグラムの計算は、第1ピークσ peak,iの特定を可能にするため行われる。すべての輝度範囲からのσ peak,iを使用して、σ grainが線形回帰を利用して輝度の線形関数として求めることができる。
フィルムグレインの効果を排除するため、フィルムグレイン項が、
Figure 2010505342
の関係式に従って既存の分散ベースメトリックACTvarから導かれる。ただし、m(σ grain)はσ grainの関数である。特定の実施例では、フィルムグレインの効果は、フィルムグレインの分散としてみなすことができ、すなわち、
Figure 2010505342
である。フィルムグレイン以外のノイズを考慮するとき、同様のモデルがノイズをモデル化し、空間アクティビティメトリックに対するそれの効果を排除するのに利用可能である。他の既存の空間アクティビティメトリックからフィルムグレインなどのノイズの効果を排除するアプローチの拡張は、ノイズを有するピクチャのパフォーマンスを向上させる。
図1は、本原理の第1実施例により確立された空間アクティビティメトリックを画像に適用する処理の各ステップをフローチャートにより示す。図1の処理はステップ100において開始され、各種変数が初期化される。ステップ100に続いて、Loop(1)として示される第1の繰り返しループを開始するためステップ110が実行される。ループインデックス値iは初期的には1に等しい。このループの各実行中、ループインデックス値iが1ずつ増加される。Loop(1)は、ステップ120〜170を含む。ステップ120は、画像から第iデータセットの読み込みを開始する。その後、ステップ130が実行され、典型的には、上述したモデリング処理によって、フィルムグレイン推定が行われる。
ステップ130の後にステップ140では、Loop(2)として示される第2の繰り返しループが開始される。ループインデックス値jは初期的には1に等しい。このループの各実行中、ループインデックス値jが1だけ増加される。Loop(2)は、ステップ150〜160を含む。ステップ150が行われ、第j領域の空間アクティビティメトリックが計算される。ステップ150の繰り返しの実行によって、第iデータセットのすべての領域について空間アクティビティメトリックの計算が可能となる。MPEG−4 AVCなどのブロックベースのビデオ圧縮アプリケーションについて、1つの領域は16×16のマクロブロックを表す。
ステップ150における空間アクティビティメトリックの計算は、典型的には、上述された既知の手法の1つを利用して、まずメトリックを確定することによって開始される。初期的に確定された空間アクティビティメトリックは、分散ベース、勾配ベース又はDCTベースメトリックを構成しうる。メトリックの初期的な確定に続いて、典型的にはモデリングから得られるフィルムグレインなどの推定されたノイズが、当該ノイズの効果を排除するためメトリックから差し引かれる。ステップ150において計算される空間アクティビティメトリックが、その後にステップ160において画像に適用される。画像に適用されると、空間アクティビティメトリックは、取り込まれた歪みが肉眼でより顕著となるフラット領域において目立たなくなるように歪みを取り込むことによって、空間マスキングを可能にするテクスチャの指標を提供する。第2ループ(Loop(2))は、ステップ170において終了する。すなわち、Loop(2)内の各ステップは、ループ変数jが合計領域数に対応するそれの最大値に到達する時点まで、再実行される。第1ループ(Loop(1))は、ステップ180において終了する。すなわち、Loop(1)内の各ステップは、ループ変数iが読み込まれるべきデータセットの総数に対応するそれの最大値に到達する時点まで、再実行される。すべてのデータセットのすべての領域が処理された後、処理全体がステップ190において終了する。
図2は、本原理の第2実施例により確立された空間アクティビティメトリックを画像に適用する処理の各ステップをフローチャートにより示す。以降においてより良好に理解されるように、図2の処理は図1と同じステップの多くを含む。しかしながら、図2の処理は、モデルが機能するデータセットと異なるデータセットを用いてフィルムグレインをモデル化する点で異なる。特定の実施例では、あるシーケンスの最初のn個のピクチャがフィルムグレインをモデル化するのに利用される一方、モデルはシーケンスのすべてのピクチャに適用される。
図2を参照するに、空間アクティビティメトリック適用処理は、初期化が行われる開始ステップ(ステップ200)を実行することにより開始される。その後、ステップ210は、フィルムグレインのモデル化に使用されるデータセットが読み込まれる処理が実行され、その後ステップ220において、ノイズを推定するためモデルパラメータ(グレインのモデル化など)が抽出される。
その後、ステップ230において、Loop(1)として示される第1の繰り返しループが開始される。ループインデックス値iは初期的には1に等しい。このループは、ステップ240〜280を含む。ステップ240は、画像から第iデータセットの読み込みを開始する。ステップ250は、Loop(2)として示される第2の繰り返しループを開始する。ループインデックス値jは、初期的には1に等しい。このループの各実行中、ループインデックス値jは1ずつ増加される。Loop(2)は、ステップ260〜270を含む。ステップ260は、第j領域の空間アクティビティメトリックを計算する。ステップ260の繰り返しの実行は、当該データセットのすべての領域の空間アクティビティメトリックの計算を保証する。
ステップ260における空間アクティビティメトリックの計算は、典型的には上述された既知の手法の1つを利用して、初期的にメトリックを確定することによって開始される。初期的には、空間アクティビティメトリックは、分散ベース、勾配ベース又はDCTベースメトリックを構成しうる。メトリックの初期的な確定の後、典型的にはモデリングから得られるフィルムグレインなどの推定されたノイズが、当該ノイズのメトリックに対する効果を排除するためメトリックから差し引かれる。ステップ260において計算される空間アクティビティメトリックが、その後にステップ270において画像に適用される。空間アクティビティメトリックは、取り込まれた歪みが肉眼でより顕著となるフラット領域において目立たなくなるように歪みを取り込むことによって、空間マスキングを可能にするテクスチャの指標を提供する。第2ループ(Loop(2))は、ステップ280において終了する。すなわち、Loop(2)内の各ステップは、ループ変数jが合計領域数に対応するそれの最大値に到達する時点まで、再実行される。第1ループ(Loop(1))は、ステップ290において終了する。すなわち、Loop(1)内の各ステップは、ループ変数iが読み込まれるべきデータセットの総数に対応するそれの最大値に到達する時点まで、再実行される。すべてのデータセットのすべての領域が処理された後、処理全体がステップ295において終了する。
図1の処理と比較した図2の処理の効果は、図2のフィルムグレインのモデル化が当該モデルが適用されるデータとおそらく異なるデータセットを用いて実行されると言うことである。モデルの精度は、モデル化のためのサンプリング数を増やすことによって向上する。モデル化のためすべてのデータセットの一部しか使用しないことは、処理のスピードを増大させることとなる。
図3は、本原理の第3実施例により確立された空間アクティビティメトリックを画像に適用する処理の各ステップをフローチャートにより示す。図3の処理は、メタデータとして提供されるフィルムグレインモデルを利用することによって、図1の処理の変形を構成する。
図3の処理は、各種変数が初期化されるステップ300において開始される。ステップ300の後、ステップ310は、メタデータからフィルムグレインモデルを取得する。その後、ステップ320において、Loop(1)として示される第1の繰り返しループが開始される。ループインデックス値iは初期的には1に等しい。当該ループの各実行中、ループインデックス値iが1ずつ増加される。このループは、ステップ330〜370を含む。ステップ330は、画像から第iデータセットの読み込みを開始する。ステップ330の後のステップ340は、Loop(2)として示される第2の繰り返しループを開始する。ループインデックス値jは、初期的には1に等しい。Loop(2)の各実行中、ループインデックス値jは1ずつ増加される。Loop(2)は、ステップ350〜360を含む。ステップ350は、第j領域の空間アクティビティメトリックを計算する。ステップ350の繰り返しの実行は、当該データセットのすべての領域の空間アクティビティメトリックの計算を保証する。
ステップ350における空間アクティビティメトリックの計算は、典型的には上述された既知の手法の1つを利用して、初期的にメトリックを確定することによって開始される。初期的には、空間アクティビティメトリックは、分散ベース、勾配ベース又はDCTベースメトリックを構成しうる。メトリックの初期的な確定の後、典型的にはモデリングから得られるフィルムグレインなどの推定されたノイズが、当該ノイズのメトリックに対する効果を排除するためメトリックから差し引かれる。ステップ350において計算される空間アクティビティメトリックが、その後にステップ360において画像に適用される。空間アクティビティメトリックは、取り込まれた歪みが肉眼でより顕著となるフラット領域において目立たなくなるように歪みを取り込むことによって、空間マスキングを可能にするテクスチャの指標を提供する。
第2ループ(Loop(2))は、ステップ370において終了する。すなわち、Loop(2)内の各ステップは、ループ変数jが合計領域数に対応するそれの最大値に到達する時点まで、再実行される。第1ループ(Loop(1))は、ステップ380において終了する。すなわち、Loop(1)内の各ステップは、ループ変数iが読み込まれるべきデータセットの総数に対応するそれの最大値に到達する時点まで、再実行される。すべてのデータセットのすべての領域が処理された後、処理全体がステップ390において終了する。
[空間アクティビティメトリックのパフォーマンス評価方法]
一般に、空間アクティビティメトリックは、空間マスキング効果を利用することに役立つ。例えば、ビデオ圧縮アプリケーションにおいて同質な高い視覚的クオリティを得るため、より小さな空間アクティビティメトリックに係る領域が、より小さな量子化ステップサイズにより圧縮される。他方、より大きな空間アクティビティメトリックに係る領域は、より大きな量子化ステップサイズにより圧縮される。従って、空間アクティビティメトリックのパフォーマンスは、表示されるピクチャの視覚的クオリティに強い影響を与えることとなる。表示されるピクチャの視覚的クオリティを評価することによって、空間アクティビティメトリックのパフォーマンスを判断することが一般的である。このような処理は、全体的な主観的評価を伴う。
本原理の他の特徴によると、空間アクティビティメトリックのパフォーマンスを評価する方法が提供される。後述されるように、当該方法は、スムースな領域とテクスチャ領域の両方についてメトリックのパフォーマンスを客観的に評価することによってこのような評価を行う。
[スムース領域集約]
好ましくは、効果的な空間アクティビティメトリックは、同様の視覚的なスムースさを有する領域に同様の評価を割り当てるべきである。すなわち、空間アクティビティメトリックは、すべてのスムース領域についてほぼ1つのレベルに集約されるべきである。
[スムース領域とビジー領域との間のスプレッド]
マスキング効果を利用し、ビデオ圧縮などの所与の画像処理アプリケーションがテクスチャ領域においてより大きな歪みを許容するため、空間アクティビティメトリック指標は、スムースとテクスチャ(ビジー領域など)の間のスプレッドを設けるべきである。
上記2つの規準から、“Smooth Busy Area Spread(SBAS)”と以降で呼ばれる評価は、空間アクティビティメトリックが、(1)同様の視覚的スムースさを有する領域にどのように評価を割り当てるか、(2)ビジー領域とスムース領域をどのように区別するかを定量化するよう定義することができる。
数学的には、SBASは、
Figure 2010505342
により表すことができる。ただし、avgpicはピクチャ全体の平均メトリックであり、avgflat及びσflatはそれぞれ、スムース領域におけるメトリックの平均と標準偏差である。スムース領域は手作業により選択され、本方法の視覚的ヒントして役立つことに留意されたい。空間アクティビティメトリックが、同様の視覚的スムースさを有する領域に同様の指標を割り当てるとき、σflatは小さくなるであろう。他方、空間アクティビティメトリックがスムース領域とテクスチャ領域とを区別するとき、|avgpic−avgflat|は大きくなる。このため、SBASの値が大きくなるほど、空間アクティビティメトリックは効果的なものとなる。
図4は、本原理の例示的な実施例による空間アクティビティメトリックの有効性を評価する方法を示す。この評価方法は、初期化が行われるステップ400の実行により開始される。その後、ステップ410において、画像データセットの読み込みが行われる。ステップ420において、画像内のスムース領域の手作業による選択が実行される。次にステップ430において、第1のループが開始される。ループインデックス値iは初期的には1に等しい。ループはステップ440を有し、ループの各実行により、空間アクティビティメトリックのすべてのうちの最後のものが後述されるように解析されるまで、インデックス値iが増やされる。
ステップ440の各実行中、式(11)に関して説明されるようなSBASの値が、各空間アクティビティメトリックiについて計算される。ループはステップ450において終了する。すなわち、当該ループ内の各ステップは、ループ変数iが評価が行われる空間アクティビティメトリックの個数に対応するそれの最大値に到達する時点まで再実行される。ステップ460において、空間アクティビティメトリックの全体評価が行われる。最大のSBASを有する空間アクティビティメトリックが、“ベスト”なメトリックとなる。
図5は、エンコーダにより利用されるレート制御アルゴリズムに関して空間アクティビティメトリックがどのように適用可能であるか示す一例となるビデオエンコーダのブロック図を示す。図5のエンコーダは、入力ビデオ信号をバッファするフレームオーダリングバッファ500を有する。フレームオーダリングバッファ500は、和ブロック502の第1入力に接続される出力を有し、和ブロック502の出力は変換及び量子化ブロック505に接続され、変換及び量子化ブロック505は、エントロピー符号化ブロック510により実行されるエントロピー符号化の前に、和ブロックからの入力ビデオ信号に変換及び量子化を実行する。エントロピー符号化ブロック510は、和ブロック515の第1入力に接続されるそれの出力を有し、和ブロック515の出力は、エンコーダによる出力前に符号化されたビデオを格納する出力バッファ520を接続される。和ブロックの第2入力は、SEI(Supplemental Enhancement Information)メッセージを、入力メタデータから当該メッセージを生成するSEI挿入手段518から受け付ける。
エントロピー符号化ブロック510により実行される符号化は、リファレンスピクチャストア527に格納されているリファレンスピクチャに対して動き推定ブロック525により実行される動き推定に依存する。動き補償ブロック530は、動き推定ブロック525により決定される動き推定に必要な動き補償量を決定する。動き推定は、インター予測モードによるエンコーダの処理中に、和ブロック502の第2入力にスイッチ535を介し適用される。マクロブロック(MB)判定ブロック540は、何れのモードが現在のマクロブロックについてベストな符号化を与えるかに基づき、インター予測符号化とイントラ予測符号化の間で選択するようスイッチ535を制御する。
イントラ予測モードにより動作するとき、スイッチ535は、和ブロック555により与えられるような、逆変換及び量子化ブロック550とマクロブロック判定ブロック540との出力信号の和に基づき、同一ピクチャ予測を提供するイントラ予測ブロック545の出力に接続される。逆変換及び量子化ブロック550は、変換及び量子化ブロック505により生成される出力信号に対して逆変換及び量子化処理を実行する。和ブロック555の出力は、リファレンスピクチャバッファ527への以降の格納のため、ピクチャに対して実行されるデブロックキングフィルタ560に接続される。
図5のエンコーダは、変換及び量子化ブロック505の量子化レベルを制御するレート制御ブロック570を有する。さらに、レート制御ブロック570はまた、符号化がなされるピクチャのタイプを制御するため、ピクチャタイプ判定ブロック580を制御するピクチャタイプ判定ブロックを制御する。さらに、レート制御ブロック570はまた、符号化ビデオへの挿入のため、和ブロックにシーケンスセットを供給するSPS(Sequence Parameter Set)及びPPS(Picture Parameter Set)挿入手段590を制御する。
図5に示されるように、レート制御ブロック570は、空間アクティビティメトリックに応じて動作する。図6は、図5のエンコーダのレート制御ブロック570内の空間アクティビティメトリックを適用する処理の各ステップをフローチャートにより示す。当該処理は、初期化が行われるステップ600から開始される。その後、ステップ610において、典型的にはオペレータによってエンコーダのセットアップが行われる。エンコーダのセットアップは、ターゲットビットレートのセットアップと共に、符号化処理に係る1以上のパラメータの特定を伴いうる。ステップ610の後のステップ620においてループが開始される。ループインデックス値iは、マクロブロック(MB)の個数に対応する。初期的には、インデックス値iは1に等しい。ループはステップ630〜650を含む。ステップ630の各実行中、第iマクロブロック(MB)の空間アクティビティメトリックACTnewの値が計算される。ステップ640の各実行中、関係式
Figure 2010505342
に従って、第iマクロブロックの量子化オフセットが計算される。このようにして、空間アクティビティメトリックは、量子化ステップサイズ又はQPパラメータオフセットにマッピングされる。ステップ650において、エンコーダは、典型的には、MPEG−2、MPEG−4 AVC又はVC−1などの既存の圧縮規格を利用して、第iマクロブロック(MB)を符号化する。ループはステップ660において終了する。すなわち、ループ変数iがマクロブロックの個数に対応するそれの最大値に到達する時点まで、上記ステップが再実行される。その後、当該処理はステップ670において終了する。
図7は、ビデオクオリティの評価において空間アクティビティメトリックを適用する視覚的クオリティ解析手段のブロック図を示す。ビデオクオリティ解析手段は、入力ピクチャに適用する空間アクティビティメトリック700を有する。空間アクティビティメトリック700により与えられるテクスチャの指標は、ブロック705により実行される空間ノイズマスキングを制御する。
入力ピクチャは、第1クオリティ解析手段710によるリファレンスピクチャに関する客観的なクオリティ解析が行われる。第2クオリティ解析手段720は、リファレンスピクチャセットに対する比較のため、ブロック705からの空間マスク処理されたピクチャと共に、第1解析手段の出力を受け付ける。第2解析手段720の出力は、クオリティ評価結果を提供する。
上記は、画像ノイズを考慮した空間アクティビティメトリックを利用して画像を特徴付ける技術について記載した。

Claims (12)

  1. 画像を特徴付けるための空間アクティビティメトリックを決定するステップと、
    前記画像内のノイズを推定するステップと、
    前記推定されたノイズに従って前記決定された空間アクティビティメトリックを変更するステップと、
    を有する方法。
  2. 前記空間アクティビティメトリックは、前記画像内の分散に従って決定される、請求項1記載の方法。
  3. 前記空間アクティビティメトリックは、画像の勾配に従って決定される、請求項1記載の方法。
  4. 前記空間アクティビティメトリックは、離散コサイン変換係数に従って決定される、請求項1記載の方法。
  5. 共通の画像データセットから、前記空間アクティビティメトリックは決定され、前記ノイズは推定される、請求項1記載の方法。
  6. 異なるデータセットから、前記空間アクティビティメトリックは決定され、前記ノイズは推定される、請求項1記載の方法。
  7. 前記ノイズは、メタデータを介し取得されるモデルを利用して推定される、請求項1記載の方法。
  8. 画像テクスチャの指標を提供するため、前記空間アクティビティメトリックを前記画像に適用するステップと、
    低いテクチャを有する領域における取り込まれた歪みの発生を低下させるため、前記空間アクティビティメトリックに従って歪みを取り込むことによって前記画像を空間マスク処理するステップと、
    をさらに有する、請求項1記載の方法。
  9. レート制御を変更するため、前記決定された空間アクティビティメトリックを低下させながらエンコーダに適用するステップをさらに有する、請求項1記載の方法。
  10. 量子化オフセットを制御するため、前記決定された空間アクティビティメトリックを低下させながらエンコーダに適用するステップをさらに有する、請求項1記載の方法。
  11. 画像におけるテクスチャを特徴付ける空間アクティビティメトリックの有効性を特徴付ける方法であって、
    前記画像における類似したテクスチャの各領域について前記空間アクティビティメトリックにより生成される指標の類似性を判断するステップと、
    前記画像における異なるテクスチャの各領域について前記空間アクティビティメトリックにより生成される前記指標の相違を判断するステップと、
    を有する方法。
  12. 前記第1の判断するステップはさらに、低いテクスチャを有する少なくとも2つの領域を手作業により選択するステップを有する、請求項11記載の方法。
JP2009530370A 2006-09-29 2007-09-18 空間アクティビティメトリックとその評価方法 Expired - Fee Related JP5048071B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US84829606P 2006-09-29 2006-09-29
US60/848,296 2006-09-29
PCT/US2007/020227 WO2008042112A2 (en) 2006-09-29 2007-09-18 Spatial activity metric and method for evaluating the same

Publications (2)

Publication Number Publication Date
JP2010505342A true JP2010505342A (ja) 2010-02-18
JP5048071B2 JP5048071B2 (ja) 2012-10-17

Family

ID=39268952

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009530370A Expired - Fee Related JP5048071B2 (ja) 2006-09-29 2007-09-18 空間アクティビティメトリックとその評価方法

Country Status (7)

Country Link
US (1) US20090268981A1 (ja)
EP (1) EP2070048B1 (ja)
JP (1) JP5048071B2 (ja)
KR (1) KR20090068222A (ja)
CN (1) CN101523441B (ja)
DE (1) DE602007010493D1 (ja)
WO (1) WO2008042112A2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015154454A (ja) * 2014-02-19 2015-08-24 株式会社メガチップス 動画像符号化装置、プログラム、および、集積回路
JP2018518885A (ja) * 2015-07-24 2018-07-12 エイチピー・インディゴ・ビー・ブイHP Indigo B.V. グレー成分置換

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102567961B (zh) * 2010-12-30 2016-05-18 意法半导体研发(深圳)有限公司 感知块屏蔽估算系统
CN103428523B (zh) * 2012-05-22 2015-07-08 华为技术有限公司 评估视频质量的方法和装置
GB2513112B (en) * 2013-04-08 2020-01-08 Snell Advanced Media Ltd Video sequence processing
WO2019057846A1 (en) * 2017-09-21 2019-03-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. CONCEPT FOR VARYING A CODING QUANTIFICATION PARAMETER IN AN IMAGE, ADJUSTING A CODING QUANTIFICATION PARAMETER AND ADAPTING A CODING QUANTITY PARAMETER OF A MULTI-CHANNEL IMAGE

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0670311A (ja) * 1991-11-08 1994-03-11 American Teleph & Telegr Co <Att> 量子化パラメータ生成方法および装置
WO2004095829A1 (en) * 2003-04-10 2004-11-04 Thomson Licensing S.A. Technique for simulating film grain on encoded video
JP2006067302A (ja) * 2004-08-27 2006-03-09 Toshiba Corp 画像符号化装置、画像符号化方法および画像符号化プログラム

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0479510B1 (en) * 1990-09-29 2000-06-28 Victor Company Of Japan, Ltd. Image signal coding/decoding system using adaptive quantization
US5764307A (en) * 1995-07-24 1998-06-09 Motorola, Inc. Method and apparatus for spatially adaptive filtering for video encoding
US5974181A (en) * 1997-03-20 1999-10-26 Motorola, Inc. Data compression system, method, and apparatus
EP1230805B1 (en) * 1999-11-11 2008-11-19 STMicroelectronics Asia Pacific Pte Ltd. Video signal noise level estimator
US6580062B2 (en) * 2001-05-29 2003-06-17 Hewlett-Packard Development Company, L.P. Contrast focus figure-of-merit method that is insensitive to scene illumination level
US7062108B2 (en) * 2001-06-12 2006-06-13 Eastman Kodak Company Method for estimating the appearance of noise in images
CN101409835B (zh) * 2002-11-08 2014-09-17 苹果公司 利用拉格朗日乘子和视觉掩蔽来控制速率-失真折中的方法和装置
GB0228556D0 (en) * 2002-12-06 2003-01-15 British Telecomm Video quality measurement
KR100584552B1 (ko) * 2003-01-14 2006-05-30 삼성전자주식회사 동영상 부호화 및 복호화 방법과 그 장치
FR2857205B1 (fr) * 2003-07-04 2005-09-23 Nextream France Dispositif et procede de codage de donnees video
FR2893738B1 (fr) * 2005-11-18 2007-12-28 Pascal Hannequin Reduction de bruit dans une image numerique par transformee en cosinus discrete.

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0670311A (ja) * 1991-11-08 1994-03-11 American Teleph & Telegr Co <Att> 量子化パラメータ生成方法および装置
WO2004095829A1 (en) * 2003-04-10 2004-11-04 Thomson Licensing S.A. Technique for simulating film grain on encoded video
JP2006067302A (ja) * 2004-08-27 2006-03-09 Toshiba Corp 画像符号化装置、画像符号化方法および画像符号化プログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015154454A (ja) * 2014-02-19 2015-08-24 株式会社メガチップス 動画像符号化装置、プログラム、および、集積回路
US10057576B2 (en) 2014-02-19 2018-08-21 Megachips Corporation Moving image coding apparatus, moving image coding method, storage medium, and integrated circuit
JP2018518885A (ja) * 2015-07-24 2018-07-12 エイチピー・インディゴ・ビー・ブイHP Indigo B.V. グレー成分置換
US10356283B2 (en) 2015-07-24 2019-07-16 Hp Indigo B.V. Gray component replacement in a digital image to generate a color transformed image
US10638019B2 (en) 2015-07-24 2020-04-28 Hp Indigo B.V. Gray component replacement in a digital image to generate a color transformed image

Also Published As

Publication number Publication date
JP5048071B2 (ja) 2012-10-17
EP2070048B1 (en) 2010-11-10
KR20090068222A (ko) 2009-06-25
WO2008042112A2 (en) 2008-04-10
CN101523441B (zh) 2012-01-18
US20090268981A1 (en) 2009-10-29
DE602007010493D1 (de) 2010-12-23
EP2070048A2 (en) 2009-06-17
WO2008042112A3 (en) 2008-05-29
CN101523441A (zh) 2009-09-02

Similar Documents

Publication Publication Date Title
JP5496914B2 (ja) 知覚上の品質を評価する方法
Eden No-reference estimation of the coding PSNR for H. 264-coded sequences
Tai et al. Deblocking filter for low bit rate MPEG-4 video
JP4613990B2 (ja) 画像処理装置、画像処理方法、プログラム
JP5048071B2 (ja) 空間アクティビティメトリックとその評価方法
US10134121B2 (en) Method and system of controlling a quality measure
JP2005166021A (ja) 画像中の画素を分類する方法
JP2013513998A (ja) オブジェクト認識ビデオ符号化ストラテジ
JP2010515362A (ja) 符号化された画像及びビデオにおけるブロックアーチファクトの検出
US10013772B2 (en) Method of controlling a quality measure and system thereof
KR20100095833A (ko) Roi 의존형 압축 파라미터를 이용하여 영상을 압축하는 장치 및 방법
JP2012520588A (ja) ブロックに基づいて圧縮された画像におけるぼやけの測定
Zhu et al. No-reference quality assessment of H. 264/AVC encoded video based on natural scene features
EP3977747A1 (en) Pre-processing for video compression
Zhang et al. Quality assessment methods for perceptual video compression
JP4033292B2 (ja) 動画像符号化のための量子化制御方式
Sun et al. Reduced-reference image quality assessment through SIFT intensity ratio
Wang et al. A human visual system-based objective video distortion measurement system
Ma et al. Video quality assessment based on adaptive block-size transform just-noticeable difference model
Gao et al. Phase congruency based edge saliency detection and rate control for perceptual image and video coding
Wiratama et al. Adaptive Gaussian low-pass pre-filtering for perceptual video coding
JP2006201983A (ja) 画質評価装置および画質評価方法
Gurav et al. Full-reference video quality assessment using structural similarity (SSIM) index
Schallauer et al. Rapid and reliable detection of film grain noise
EP2536144A1 (en) Method and device of lossy compress-encoding an image

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100628

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120130

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120214

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120514

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120710

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120718

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150727

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees