JP2010532628A - 画像中のアーチファクトを低減させる装置および方法 - Google Patents

画像中のアーチファクトを低減させる装置および方法 Download PDF

Info

Publication number
JP2010532628A
JP2010532628A JP2010514720A JP2010514720A JP2010532628A JP 2010532628 A JP2010532628 A JP 2010532628A JP 2010514720 A JP2010514720 A JP 2010514720A JP 2010514720 A JP2010514720 A JP 2010514720A JP 2010532628 A JP2010532628 A JP 2010532628A
Authority
JP
Japan
Prior art keywords
region
image
band generation
color
intensity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2010514720A
Other languages
English (en)
Inventor
グオ,ジュ
ザン,ドン−チン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of JP2010532628A publication Critical patent/JP2010532628A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/64Circuits for processing colour signals
    • H04N9/646Circuits for processing colour signals for image enhancement, e.g. vertical detail restoration, cross-colour elimination, contour correction, chrominance trapping filters
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/187Segmentation; Edge detection involving region growing; involving region merging; involving connected component labelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/90Determination of colour characteristics
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/14Picture signal circuitry for video frequency region
    • H04N5/21Circuitry for suppressing or minimising disturbance, e.g. moiré or halo
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10024Color image

Abstract

本開示の装置および方法は、色強度のなめらかな線形遷移をもち、画像処理においてバンド発生アーチファクトをもちやすい画像領域を検出するための自動バンド発生領域検出機能を提供する。本装置および方法は、バンド発生領域を検出するためにパラメトリック・モデル・ベースのアプローチを使う。本装置および方法は、少なくとも一つの第一の画像を少なくとも一つの均一色領域にセグメント分割し(304)、前記少なくとも一つの均一色領域について色強度の線形遷移を推定し(308);色強度の前記線形遷移が実質的になめらかであれば、前記少なくとも一つの均一色領域をバンド発生領域として分類する(310)ことを備える。

Description

本開示は概括的にはデジタル画像処理および表示システムに関し、より詳細には画像中のアーチファクトを低減させる装置および方法であって、アーチファクトを含む画像中の領域、たとえばバンドが生じている領域がユーザー介入なしに自動的に検出されるものに関する。
デジタル画像または映画の画像シーケンスのような複数の画像の処理の際、画像アーチファクトが目につく。一般的なアーチファクト現象は、画像のもとのなめらかな線形遷移領域上にさまざまな強度および色のレベルのバンドが表示されるバンド発生(banding)である。色補正、スケーリング、色空間変換および圧縮のような処理がバンド発生効果を導入しうる。バンド発生は、画像が高周波成分をもちかつ最小限のノイズをもつ人工の画像であるアニメーション素材において最もよく見られる。限られた帯域幅でのいかなる処理も、不可避的にエイリアス(alias)、「リンギング(ringing)」またはバンド発生を引き起こす。
現状技術は、画像中のアーチファクトを軽減するためにディザリング(dithering)または誤差拡散(error diffusion)のようにノイズを加えることである。ノイズはバンド発生現象をある程度マスクするが、画像の他の部分に望ましくないノイズを導入し、圧縮のような他の処理に追加的な負担を導入する。
関連分野において、デジタル・サンプリングされた画像の高品質表現を生成するために要求されるデータ・ファイルの大きなサイズのため、知覚される画像品質に悪影響を及ぼすことなくデータ・ファイルのサイズを小さくする試みにおいて、データ・ファイルにさまざまな形の圧縮を適用することが一般的な慣行である。この必要性に対処するためにさまざまなよく知られた技術および規格が発達してきた。これらの技術の代表的なものは、画像エンコードのための統合写真専門家グループ(JPEG: Joint Photographic Experts Group)規格である。JPEGと似ているが動画シーケンスにおいて相続くフレームの類似性を利用するフレーム間エンコードを加えたものが、動画像専門家グループ(MPEG: Moving Pictures Expert Group)規格である。ウェーブレット変換に基づいて他の規格および独自システムが開発されている。
商業的な映画DVD/HD-DVDリリースのプロセスにおいて、通常のフィルムからまたはコンピュータでアニメーション化された映画からスキャンされたデジタル画像は典型的には10ビット・データをもち、ある種の応用では16ビットまでのデータをもつ。そのデータは、圧縮のために8ビットYUVフォーマットに変換されることが必要とされる。ビット深さ精度の低下のため、単数または複数の画像のなめらかな色変化のある領域においてバンド発生アーチファクトがしばしば現れる。上記したように、バンド発生アーチファクトを軽減するために、ディザリングおよび誤差拡散アルゴリズムが一般的に使われる。たいていのディザリング・アルゴリズムでは、バンド発生効果をマスクして見えなくするために、高い空間周波数をもつデジタル信号が画像に加えられる。しかしながら、DVD/HD-DVD内部での圧縮は、高い空間周波数の信号を除去する不可逆的圧縮である。したがって、圧縮前のディザリング・プロセスによってバンド発生がマスクされて見えなくされたとしても、圧縮後にはバンド発生アーチファクトが現れることが多い。
ディザリングまたは色深さ削減(color depth reduction)のための伝統的なアプローチは、ディスプレイ・アプリケーションおよび印刷サービスについてである。ディザリングは処理チェーンにおける最終ステップなので、色深さが削減されるとき、加えられる高空間周波数はよく保存され、バンド発生効果をマスクする目的を果たす。誤差拡散はもう一つの一般的なアプローチである。この場合、マスキング効果を生じるとともに全体的な画像強度を保存するように量子化誤差が近傍ピクセルに分配される。しかしながら、これらのアプローチは、高周波数信号を削減するまたは打ち切る傾向のあるMPEG1、2、4またはH.264のような不可逆的圧縮の効果を考慮していない。したがって、ディザリングおよび誤差拡散のアプローチの大半は、圧縮プロセスにおいてビットレート効率を減らすことになる。圧縮エンコーダは、加えられたディザリング・ノイズまたは量子化誤差を表すために多くのビットを使い、当該画像を表すためのビットがより少なくなるからである。一方、マスキング信号が削減されるか打ち切られるので、圧縮後にバンド発生アーチファクトが現れやすい。
さらに、アーチファクト軽減プロセスはさらに、画像中のどこにアーチファクトが現れているかを判別するためのユーザー介入を必要とすることによって複雑になる。このために、アーチファクト軽減プロセスはユーザーまたは操作者にとって時間のかかるプロセスになる。
したがって、画像中のアーチファクトを軽減する技法であって、画像処理、たとえば不可逆的圧縮工程の後でもアーチファクトが低減または抑制されたままとなるものが必要とされている。さらに、操作者の介入を減らすため、画像中でアーチファクトを含んでいる領域を自動的に検出する技術も必要とされている。
本開示の装置および方法は、色強度のなめらかな線形遷移をもち、画像処理においてバンド発生アーチファクトをもちやすい画像領域を検出するための自動バンド発生領域検出アルゴリズムまたは機能を提供する。本装置および方法は、バンド発生領域を検出するためのパラメトリック・モデル・ベースのアプローチを使う。バンド発生領域(banding region)は、なめらかな強度または色遷移をもつ領域として定義される。この型の領域は、量子化、色補正などのような画像処理後にバンドまたは偽輪郭をもつ傾向がある。この領域中のピクセルの強度をモデル化するために、線形表面モデルが使用される。この領域がその線形表面モデルによって密接に表現できれば、この領域はバンド発生領域として分類される。
本装置および方法はまず、画像を均一色領域に分割する。エッジ領域、テクスチャー領域およびなめらかな領域のような種々の型の領域が同じ画像中に存在できるので、本装置および方法は、画像を、その色またはルミナンス強度に基づいていくつかの領域にセグメント分割する。セグメント分割された領域が、大きさ、統計的色分布などのようなある種の基準を満たせば、セグメント分割された領域はバンド発生領域の候補として選択される。その領域がバンド発生領域であるかどうかを検証するために、その領域中のピクセルの強度または色が線形表面にあてはめられる(fitted)。各領域についての色線形遷移を推定するためにパラメトリック・モデルが使用される。領域は、その領域内に色強度のなめらかな線形遷移が存在すれば、バンド発生領域として分類される。
本開示のある側面によれば、画像中のバンド発生領域を検出する方法が提供される。本方法は、少なくとも一つの第一の画像を少なくとも一つの均一色領域にセグメント分割し;前記少なくとも一つの均一色領域について色強度の線形遷移を推定し;色強度の前記線形遷移が実質的になめらかであれば、前記少なくとも一つの均一色領域をバンド発生領域として分類することを含む。
別の側面では、画像中のバンド発生領域を検出する装置が、少なくとも一つの第一の画像を少なくとも一つの均一色領域にセグメント分割するよう構成された画像セグメント分割モジュールと;前記少なくとも一つの均一色領域について色強度の線形遷移を推定するよう構成された線形遷移推定器と;色強度の前記線形遷移が実質的になめらかであれば、前記少なくとも一つの均一色領域をバンド発生領域として分類するよう構成された領域検出モジュールとを含む。
本開示の別の側面によれば、画像中のバンド発生領域を検出する装置が、少なくとも一つの第一の画像を少なくとも一つの均一色領域にセグメント分割する手段と;前記少なくとも一つの均一色領域について色強度の線形遷移を推定する手段と;色強度の前記線形遷移が実質的になめらかであれば、前記少なくとも一つの均一色領域をバンド発生領域として分類する手段とを含む。
さらにもう一つの側面では、機械によって読み取り可能なプログラム記憶デバイスであって、画像中のバンド発生領域を検出するためのステップを実行するために前記機械によって実行可能な命令のプログラムを具体的に実現しており、前記方法は、少なくとも一つの第一の画像を少なくとも一つの均一色領域にセグメント分割し;前記少なくとも一つの均一色領域について色強度の線形遷移を推定し;色強度の前記線形遷移が実質的になめらかであれば、前記少なくとも一つの均一色領域をバンド発生領域として分類する段階を含む、プログラム記憶デバイスが提供される。
本開示のこれらおよびその他の側面、特徴および利点は、付属の図面との関連で読まれるべき、好ましい実施形態の以下の詳細な記述において述べられ、該記述から明白となるであろう。
図面において、同様の参照符号は図面を通じて類似の要素を表す。
本開示のある側面に基づく画像中のアーチファクトを軽減するための装置の例示的な図解である。 本開示のある側面に基づく画像中の領域ベースの追跡のための例示的な方法の流れ図である。 本開示のある側面に基づく画像中のバンド発生領域を検出するための例示的な方法の流れ図である。 本開示のある側面に基づく画像の領域中のピクセルの強度をモデル化するための例示的な方法の流れ図である。 本開示のある側面に基づく画像中のアーチファクトを軽減するための例示的な方法の流れ図である。
図面は本開示の概念を例解する目的のためであって、必ずしも本開示を例解する唯一の可能な構成ではないことは理解しておくべきである。
図面に示された要素がハードウェア、ソフトウェアまたは両者の組み合わせのさまざまな形で実装されうることを理解しておくべきである。好ましくは、これらの要素は、プロセッサ、メモリおよび入出力インターフェースを含みうる一つまたは複数の適切にプログラムされた汎用デバイス上でのハードウェアおよびソフトウェアの組み合わせにおいて実装される。
本記載は、本開示の原理を例解する。よって、当業者には、本稿に明示的に記載や図示はされていないものの、本開示の原理を具現し、その精神および範囲内に含まれるさまざまな構成を考案できるであろうことは理解されるであろう。
本稿に記載されるあらゆる例および条件付きの言辞は、本開示の原理および発明者によって当該技術を進歩させるために寄与される概念の理解において読者を助ける教育的な目的のために意図されたものであり、そのような個別的に記載される例および条件に限定することなく解釈されるものとする。
さらに、本開示の原理、側面および実施形態ならびにその個別的な例を記載する本稿におけるあらゆる陳述は、その構造的および機能的な等価物の両方を包含することが意図されている。さらに、そのような等価物は現在知られている等価物および将来開発される等価物の両方、すなわち構造にかかわりなく同じ機能を実行する任意の開発された要素を含むことが意図されている。
よって、たとえば、当業者は、本稿に呈示されるブロック図が本開示の原理を具現する例示的な回路の概念図を表すものであることを理解するであろう。同様に、フローチャート、流れ図、状態遷移図、擬似コードなどはいずれも、コンピュータ可読媒体において実質的に表現され、コンピュータまたはプロセッサによって実行されうるさまざまなプロセスを表すことが理解されるであろう。これはそのようなコンピュータまたはプロセッサが明示的に示されているかどうかにはよらない。
図面に示されるさまざまな要素の機能は、専用ハードウェアの使用を通じて提供されても、適切なソフトウェアとの関連でソフトウェアを実行することのできるハードウェアの使用を通じて提供されてもよい。プロセッサによって提供されるとき、機能は単一の専用プロセッサによって、単一の共有されるプロセッサによって、あるいは一部が共有されていてもよい複数の個別プロセッサによって提供されうる。さらに、用語「プロセッサ」または「コントローラ」の明示的な使用は、ソフトウェアを実行することのできるハードウェアのみを指すものと解釈されるべきではなく、暗黙的に、限定なしに、デジタル信号プロセッサ(「DSP」)ハードウェア、ソフトウェアを記憶するための読み出し専用メモリ(「ROM」)、ランダム・アクセス・メモリ(「RAM」)および不揮発性記憶装置を含みうる。
通常のものおよび/またはカスタムのものを含め他のハードウェアも含まれてもよい。同様に、図面に示されるスイッチがあったとしても、それは単に概念的なものである。その機能はプログラム論理の動作を通じて、専用論理を通じて、プログラム制御と専用論理の相互作用を通じて、あるいはさらに手動で実行されてもよい。特定の技法は、コンテキストからより個別に理解されるように実装者によって選択可能である。
本願の請求項では、特定の機能を実行する手段として表現されたいかなる要素も、その機能を実行するいかなる仕方をも、たとえばa)その機能を実行する回路素子の組み合わせまたはb)任意の形の、したがってファームウェア、マイクロコードなどを含むソフトウェアであって、当該機能を実行するためにそのソフトウェアを実行するための適切な回路と組み合わされたソフトウェアを包含することが意図されている。そのような請求項によって定義される本開示は、前記さまざまな記載される手段によって提供される機能性が請求項が記載する仕方で組み合わされ、一緒にされるという事実にある。よって、これらの機能性を提供できる任意の手段が本稿で示されている手段と等価であると見なされる。
バンド発生現象は二つの範疇に分類できる。色ビット削減または色量子化のプロセスにおいては、低下した信号精度のためにバンド発生が現れうる。この型の誤差は、たいていの場合、誤差拡散アルゴリズムを使うことによって効果的に除去できる。しかしながら、色補正、スケーリングおよび色空間変換といった他のプロセスは、その限られた処理帯域幅のためにバンド発生アーチファクトに寄与する。この型のバンド発生は誤差拡散によっては効果的に対処できない。これらのバンド発生アーチファクトを隠蔽するためにマスキング信号が要求される。加えられるマスキング信号の量は、バンド発生アーチファクトの強度に直接関係する。
さらに、一般的には、画像のもとのなめらかな線形遷移領域上において、変動する強度および色レベルの諸バンドが表示される。バンドの効果的な除去のためにはバンド発生領域が識別される必要がある。バンド発生アーチファクトは、なめらかな線形遷移において最も現れやすいので、フレーム・ベースのアプローチは、バンド発生アーチファクトのない領域に無用のマスキング信号を導入し、よって画質を低下させることになる。本開示の装置および方法は、バンド発生を効果的に除去する、領域またはROIベースの(すなわち、関心領域に基づく)アプローチを提供する。このアプローチでは、加えられるマスキング信号の量は、可能な最良の画質を達成するために人間の操作者によって調節されることができる。本発明の装置および方法は、バンド発生領域の自動検出をも提供する。
本開示の装置および方法は、色強度のなめらかな線形遷移をもち、画像処理においてバンド発生アーチファクトをもちやすい画像領域を検出するための自動バンド発生領域検出アルゴリズムまたは機能を提供する。本装置および方法は、バンド発生領域を検出するためにパラメトリック・モデルに基づくアプローチを使う。バンド発生領域は、なめらかな強度または色遷移をもつ領域として定義される。この型の領域は、量子化、色補正などのような画像処理後にバンドまたは偽輪郭をもつ傾向がある。この領域中のピクセルの強度をモデル化するために、線形表面モデルが使用される。この領域がその線形表面モデルによって密接に表現できれば、この領域はバンド発生領域として分類される。
本装置および方法はまず、画像を均一色領域に分割する。エッジ領域、テクスチャー領域およびなめらかな領域のような種々の型の領域が同じ画像中に存在できるので、本装置および方法は、画像を、その色またはルミナンス強度に基づいていくつかの領域にセグメント分割する。セグメント分割された領域が、大きさ、統計的色分布などのようなある種の基準を満たせば、セグメント分割された領域はバンド発生領域の候補として選択される。その領域がバンド発生領域であるかどうかを検証するために、その領域中のピクセルの強度または色が線形表面にあてはめられる。各領域についての色線形遷移を推定するためにパラメトリック・モデルが使用される。領域は、その領域内に色強度のなめらかな線形遷移が存在すれば、バンド発生領域として分類される。
自動バンド発生領域検出は、領域ベースのバンド発生除去システムまたは装置中に組み込むことができる。本開示はまた、検出されたバンド発生領域中のバンド発生を除去するとともに他の処理、たとえば圧縮プロセスに対する副作用を最小限にするよう設計された、ROIベースの(関心領域に基づく)誤差拡散およびバンド・マスキング方式をも提供する。本装置がフィルム(film)/ビデオ(video)処理における実際的な応用のために効率的であるために、ROI、たとえば検出されたバンド発生領域をいくつかの後続フレームにまで追跡し、それにより人間の操作者の労力を軽減するために領域ベースの追跡(tracking)アルゴリズムが提供される。
ここで図面を参照すると、本開示のある実施形態に基づく例示的な装置コンポーネントが図1に示されている。フィルム・プリント104、たとえばカメラ由来のフィルム・ネガをスキャンしてデジタル・フォーマット、たとえばシネオン(Cineon)フォーマットまたはSMPTE DPXファイルにするスキャン・デバイスまたは装置103が設けられうる。スキャン装置103は、フィルムからビデオ出力を生成する、たとえばテレシネまたは任意の装置、たとえばビデオ出力をもつArri LocPro(商標)のような装置を含みうる。あるいはまた、ポストプロダクション工程またはデジタル映画106からのファイル(たとえばすでにコンピュータ可読形式のファイル)が直接使用されることもできる。コンピュータ可読ファイルのソースの可能性としては、AVID(商標)エディタ、DPXファイル、D5テープなどがある。
スキャンされたフィルム・プリントは、後処理装置102、たとえばコンピュータに入力される。コンピュータは、一つまたは複数の中央処理装置(CPU)、ランダム・アクセス・メモリ(RAM)および/または読み出し専用メモリ(ROM)といったメモリ110ならびにキーボード、カーソル制御装置(たとえばマウス、ジョイスティックなど)および表示装置といった入出力(I/O)ユーザー・インターフェース(単数または複数)112のようなハードウェアを有するさまざまな既知のコンピュータ・プラットフォームのいずれで実装されてもよい。コンピュータ・プラットフォームはまた、オペレーティング・システムおよびマイクロ命令コードをも含む。本稿に記載されるさまざまなプロセスおよび機能は、前記マイクロ命令コードの一部であっても、オペレーティング・システムを介して実行されるソフトウェア・アプリケーション・プログラムの一部であっても(あるいはそれらの組み合わせであっても)よい。ある実施形態では、ソフトウェア・アプリケーション・プログラムはプログラム記憶デバイス上に具体的に実現され、後処理装置102のような任意の好適な機械にアップロードされて該機械によって実行されうる。さらに、さまざまな他の周辺装置が、パラレル・ポート、シリアル・ポートまたはユニバーサル・シリアル・バス(USB)といったさまざまなインターフェースおよびバス構造によって、コンピュータ・プラットフォームに接続されていてもよい。他の周辺装置は追加的な記憶装置124およびプリンタ128を含みうる。プリンタ128は、前記フィルムの修正版126、たとえば前記フィルムの立体映像版をプリントするために用いられてもよい。
あるいはまた、すでにコンピュータ可読形式にあるファイル/フィルム・プリント106(たとえば、外部ハード・ドライブ124に記憶されていてもよいデジタル映画)がコンピュータ102に直接入力されてもよい。用語「フィルム(film)」は本稿ではフィルム・プリントまたはデジタル映画のいずれをも指しうることを注意しておく。
ソフトウェア・プログラムは、画像中のアーチファクトを軽減するための、メモリ110に記憶されている誤差拡散モジュール114を含む。誤差拡散モジュール114は、画像中のアーチファクトをマスクするための信号を生成するノイズまたは信号生成器116を含む。ノイズ信号は白色雑音、ガウス雑音、種々のカットオフ周波数フィルタで変調された白色雑音などでありうる。画像のブロックの量子化誤差を決定するために打ち切りモジュール118が設けられる。誤差拡散モジュール114はまた、近隣ブロックに量子化誤差を分配するよう構成された誤差分配モジュール120を含む。
少なくとも一つの画像におけるバンド発生領域を検出するために領域検出モジュール111が設けられる。領域検出モジュール111は、少なくとも一つの第一の画像を少なくとも一つの均一色領域にセグメント分割するよう構成された画像セグメント分割(image segmentation)モジュール113を含む。線形遷移推定器(linear transition estimator)115が設けられ、セグメント分割された均一色領域について色強度の線形遷移を推定するよう構成される。線形遷移推定器115は、セグメント分割された領域の表面をモデル化するために線形パラメトリック・モデルを用いる。領域検出モジュール115はさらに、色強度の線形遷移が実質的になめらかであれば均一色領域をバンド発生領域として分類するよう構成される。詳細はのちに述べる。
シーンのいくつかのフレームを通じてROI、たとえば検出されたバンド発生領域を追跡するための追跡モジュール132も設けられる。追跡モジュール132は、シーンの各画像または各フレームについての二値マスクを生成するためのマスク生成器134を含む。二値マスクは、たとえばROIのまわりに描かれたユーザー入力されたポリゴンによって、あるいは領域検出モジュール111によって画像中に定義されたROIから生成される。二値マスクは、1または0のピクセル値をもつ画像である。ROI内のすべてのピクセルは1の値をもち、他のピクセルは0の値をもつ。追跡モジュール132はさらに、ある画像から別の画像への、たとえばシーンのフレームからフレームへのROIの追跡情報を推定するための追跡モデル136を含む。
出力画像をMPEG1、2、4、h.264などといった任意の既知の圧縮規格にエンコードするためのエンコーダ122が設けられる。
図2は、本開示のある側面に基づく、画像中の関心領域(ROI)を追跡する例示的な方法の流れ図である。最初、後処理装置102は少なくとも一つの二次元(2D)画像を取得する(ステップ202)。後処理装置102は少なくとも一つの2D画像を、上記したようにコンピュータ可読フォーマットのデジタル・マスター・ビデオ・ファイルを得ることによって取得する。デジタル・ビデオ・ファイルは、デジタル・ビデオ・カメラを用いてビデオ画像の時間的シーケンスを取り込むことによって取得されてもよい。あるいはまた、ビデオ・シーケンスは通常のフィルム型カメラによって取り込まれてもよい。この筋書きでは、フィルムはスキャン装置103を介してスキャンされる。
フィルムがスキャンされるかすでにデジタル・フォーマットであるかによらず、フィルムのデジタル・ファイルはフレームの位置についての指示または情報、たとえばフレーム番号、フィルムの先頭からの時間などを含むことになる。デジタル・ビデオ・ファイルの各フレームが一つの画像を含み、たとえばI1,I2,…Inとなる。
ステップ204では、少なくとも一つの画像において関心領域Rが定義または検出される。ある実施形態では、操作者が、ユーザー・インターフェース112のような対話的なユーザー・インターフェースを使って、たとえば画像上にポリゴン領域の輪郭を描くなどして、バンド発生アーチファクトをもつ領域を定義する。別の実施形態では、領域は図3に関して述べる自動検出アルゴリズムまたは機能によって検出される。
図3を参照すると、二次元(2D)画像が取得される(ステップ302)。ステップ304では、その画像がセグメント分割モジュール113によって少なくとも一つの均一色領域にセグメント分割される。本開示の色セグメント分割(color segmentation)では、画像中の優勢な色を見出すために平均シフト(mean shift)・アルゴリズムまたは関数が使用される。平均シフト関数は、局所的な最大を見出すために色ヒストグラム空間において逐次反復的に使用される。局所的な最大に対応する色は優勢色(dominant color)として割り当てられ、ヒストグラムから除去される。このプロセスが反復されて次の優勢色が見出される。逐次反復プロセスは、それ以上優勢色がなくなったのちに停止する。画像はこれらの優勢色に基づいて領域にセグメント分割される。
画像セグメント分割後、バンド発生の候補として、サイズおよびその統計分布に基づいて諸領域のリストが選択される(ステップ306)。領域サイズ、たとえばピクセル数が所定の閾値より小さい場合、その領域は破棄される。さまざまな実施形態において、閾値は約50ピクセルから約200ピクセルに設定される。領域内でのピクセルの色分布の分散が次いで計算される。分散が所定の閾値より高ければ、その領域は破棄される。最後に、残された領域がバンド発生領域の候補として選択される。
ステップ308では、選択されたバンド発生領域候補について色強度の線形遷移が線形遷移推定器115によって推定される。線形遷移は、セグメント分割された領域内のピクセルの強度表面をモデル化することによって推定される。表面モデル化(surface modeling)は、次の線形パラメトリック・モデルを使う:
I(x,y)=ax+by+c (1)
ここで、I(x,y)は位置(x,y)における予測された色強度であり、a、b、cは定数係数である。上記の式は3D空間内での2D平面を定義する。つまり、入力画像は二次元であり、残りの次元が色強度であり、こうしてx、y、Iが三次元軸を与える。
次に、線形モデルについての表面係数が図4に示されるように推定される。表面係数は、堅牢かつ逐次反復的な推定を使って推定される。通常の最小平均二乗(Least Mean Square)推定に対して堅牢な推定(robust estimation)の利点は、突出値(outliers)(たとえばフィルムにおけるよごれまたは領域中の小さな無関係なオブジェクト)に対する堅牢さである。最初、ステップ402において、選択されたセグメント分割された領域からの3D点が、式(1)によって定義されるモデルに入力される。堅牢推定は、通常の平均二乗推定を使っての表面係数の初期推定をもって始まる(ステップ404)。次いで、2D線形表面が推定された係数を使って得られる(406)。たとえば、各ピクセル位置(x,y)において、推定されたルミナンス強度が式(1)によって計算される。点が推定された2D表面から有意に、たとえば所定の第一の閾値だけ逸れていれば、それらの点は突出値として分類され、破棄され、係数推定の次のランに参加しないことになる(ステップ408)。突出値についての閾値は、全ピクセルの平均の(average)平均二乗差(mean square difference)に基づく。ステップ410では、推定誤差が第二の閾値より小さければ(または他の停止基準を使って)、推定および突出値除去プロセスが突出値点を排除する3D点を使って繰り返され、これが推定誤差が第二の所定の閾値より小さくなるまで続けられる。ひとたび推定誤差が第二の所定の閾値より小さくなれば、表面係数が記憶される(ステップ412)。
図3に戻ると、上記の係数が得られたのち、選択されたセグメント分割された領域の色強度の線形遷移が解析されて、線形遷移がなめらかかどうかが判定され、もし遷移がなめらかであればその領域はバンド発生領域として分類される(310)。線形遷移は、表面当てはめ誤差(surface fitting error)を決定することによって解析される。表面当てはめ誤差は、画像中の真の強度表面と推定された強度表面との間の平均二乗誤差(または他の誤差計量)として次のように定義される:
Figure 2010532628
ここで、I(x,y)は画像領域R中の座標(x,y)における実際のピクセル値であり、I(x,y)は座標(x,y)において式(1)中の推定された係数(a,b,c)をもつ表面の式を評価することにより推定されたピクセル値である。表面当てはめ誤差が閾値未満でありかつa、bの両方が0に等しいのでなければ、線形遷移はなめらかであると判定され、その領域はバンド発生領域として分類される。プロセスは次いで、ステップ306からのすべての選択されたセグメント分割された領域が分類されるまで繰り返される(ステップ312)。
ステップ314では、領域検出モジュール111は、分類されたバンド発生領域のいずれかが共通の境界を共有しているかどうかを判定する。たとえば、二つの領域が所定数のピクセルを共有していれば、領域検出モジュール111はその二つの領域は共通の境界を共有していると判定することになる。少なくとも二つの分類されたバンド発生領域が共通の境界を共有する場合、領域検出モジュール111はそれら少なくとも二つの分類されたバンド発生領域を単一のバンド発生領域にマージする。このプロセスは、バンド発生領域の間に共通の境界がなくなるまで逐次反復される。
ひとたび一つまたは複数の領域が定義または検出されたら、本方法は図2のステップ206に戻る。
ROIから二値マスクが生成され、ROI、たとえば検出された領域を追跡するために本装置において使用される。二値マスクは1または0のピクセル値をもつ画像である。ユーザー定義されたポリゴン内または検出された領域内のすべてのピクセルは1の値をもち、他のピクセルは0の値をもつ。二値マスクは、ROIを表現するために使用できる。次いで、ステップ206で、シーンの次のフレームが読み込まれる。
バンド発生アーチファクトは、なめらかなカラー階調(grading)領域に現れる。しかしながら、一般的な追跡アルゴリズムは、堅牢かつ正確な追跡のためには、前記領域に存在する何らかの明確な特徴を要求する。こうして、別の追跡領域を使う追跡方式が提供される。ステップ208では、ROI Rは、追跡するための領域のより顕著な特徴を取り込むためにより大きな領域に成長または変換される。いくつかの顕著な特徴をもつ前記より大きな領域は、追跡領域(tracking region)Rtと呼ばれる。領域成長アルゴリズムは、ROIの境界ピクセルをシードとして使い、領域を成長させるために「分水界(watershed)」実装を使う。
追跡情報を推定するために、6パラメータ追跡モデル136(たとえばアフィン動きモデル)が領域を追跡するために使用される(ステップ210)。追跡領域はまず16×16ブロックに分割され、各ブロックについての動きベクトルが、ルミナンス強度を使って次のフレームにおいて最良のブロック・マッチを見出すことによって、得られる。すべてのブロックの動きベクトルが、追跡モデルにおける6つのパラメータを推定するために使われる。予測されるピクセルと実際のピクセルとの間の誤差を最小にする最良のパラメータを見出すために、線形回帰手順が使用される。この6パラメータ追跡モデルを使って、ROIの二値マスクが次のフレームに投影される(ステップ212)。ステップ214では、本装置は、シーンの最後のフレームが処理されたかどうかを判定する。まだであれば、本装置は、シーンのすべてのフレームが処理されるまで、ステップ206に戻る。ひとたびいくつかのフレームについてROIが利用可能になると、プロセスは自動的にシーンの残りの部分に容易に適用できる。
本装置は、追跡結果に対するリアルタイム・フィードバックを提供する。ステップ216において操作者が結果を評価することができ、結果が満足いくものでなければROIを修正することができる(ステップ212)。たとえば、操作者はユーザー・インターフェース112のディスプレイにおいてROIを見て、ROIが適正に追跡されたかどうかを判定することができる。操作者が満足しない場合、ROIは修正されることができ、追跡プロセスは反復されることになる。ステップ220では、各画像またはフレームについてのROIの二値マスクは二値ファイル中に記憶され、ROIベースの誤差拡散およびバンド・マスキングのためのROIとして使用される。これについてはのちに述べる。さらに、ROIの二値マスクは二値ファイル中に記憶され、次の段階に持ち越されることができる。たとえば、次の段階がMPEG4 AVCエンコードであれば、ROIの情報はエンコーダによって、ROIのための適正なビットを割り当てるために使用されることができる。このメタデータは、記憶装置124内に記憶され、他のプロセスにおいて利用されうるよう諸画像と関連付けられることができる。
ROIベースの誤差拡散およびバンド・マスキング方式のフローチャートが図5に示されている。上記したように、処理されるべき少なくとも一つの画像がステップ502で取得される。
ステップ504では、ブロック・サイズが選択される。画像は任意の数のブロックに分割されることができる。ブロックとは、長方形領域に含まれるいくつかのピクセル、たとえばBm,nであり、ここで、m,nはブロック・インデックスを表す。ブロックのすべては、たとえば2×2、3×3などといった同じサイズをもつことができる。ブロック・サイズは、局所的な画像属性に依存して変化することもできる。ブロック・サイズは、ユーザー・インターフェース112を介して操作者によって選択されることができ、あるいは種々の画像サイズについて一定の比が保たれるよう画像サイズによって決定されることもできる。本開示の誤差拡散方法は、のちに述べるように、ブロック・レベルで機能する。ひとたびブロック・サイズが選択されたら、そのブロック・サイズは同じ画像については同じに保たれる。
ブロック・サイズは、単一ピクセルから2×2、2×3、4×4といった任意のサイズまで多様でありうることは理解しておくべきである。異なるブロック・サイズの使用は、マスキング信号の空間周波数の装置制御を与える。これは、後続のプロセスが、高い空間周波数を除去する傾向のある不可逆的圧縮である場合に重要である。よく制御されたマスキング信号を加えることは、圧縮アーチファクトを軽減し、不可逆的圧縮後にバンド発生が再び現れることを回避する。
ひとたびブロック・サイズが選択されると、画像をなす全ブロックが、第一のブロックから始めて処理される(ステップ506)。最初に、本装置は、そのブロックが定義または検出された関心領域(ROI)内であるかどうかを判定する(ステップ508)。そのブロックがROI内でない場合には、単純な量子化方式が使用され、色ビット深さが削減される(ステップ516)。たとえば、そのブロックの低位ビット(the least significant bits)が消去され、量子化誤差は補償されない。ステップ516のあと、本装置は、画像中の次のブロックに進む(ステップ518)。
ステップ510では、ノイズ信号、たとえばマスキング信号がノイズ生成器116を介して画像に加えられる。ピクセルに対して、該ピクセルの領域境界までの距離、たとえば近さに基づいて、0から255までのレベルが割り当てられる。ブロック中の少なくとも一つのピクセルの前記定義された領域の境界までの距離が決定され、決定された距離に基づいて、前記少なくとも一つのピクセルに関連付けられるマスキング信号の値が割り当てられる。これらのレベルはマスキング信号の強度をスケールダウンし、それにより領域境界エリアにおけるなめらかな遷移をなすために使用される。ROIにおけるピクセル色値の平均および分散が計算される。あるピクセルの平均からの色差が分散の3倍大きければ、そのことは、バンド発生アーチファクトでありそうもない有意な特徴があることを示す。この特徴を保存するため、レベル0がこのピクセルに割り当てられる。これは、このピクセルにはノイズが加えられないということを意味する。この一例は、星がある青い空の、バンド発生アーチファクトが空に現れているシーンである。装置100は、バンド除去処理のために青い空をROIとして選択できる。空のすべての星は、その色値がROI中のピクセルの平均値から有意に異なっているので、適正に保存される。
ステップ512では、そのブロックについて量子化誤差が決定される。最初に、打ち切り(truncation)モジュール118を介して、画像中の各ブロックに対して打ち切り関数が実行される。打ち切り関数は、ブロック中の各ピクセルについてのビット深さを、該ビット深さの値を2の冪乗である一定の量子化因子Qで割ることによって、削減するために用いられる。一般に、量子化因子Qは2xに等しい。ここで、xは打ち切られるべきビット数である。たとえば、10ビット・データから8ビット・データへの打ち切りのためには、一定の量子化因子Qは4、すなわちQ=22となる。打ち切り関数は次式として定義される:
Figure 2010532628
ここで、Ii,jはブロック内のピクセル値、Ni,jはノイズ生成器116によって打ち切りの前に加えられた信号、Qは量子化因子である。I′i,jは打ち切られたピクセル値である。打ち切りプロセスにおいて、ピクセル値について配慮しなければならない丸めの問題がある。たとえば、I′i,jが1.75、すなわち7(I′i,j+Ni,j)を4(Q)で割ったものに等しいとすると、I′i,jは整数値によって表現される必要がある。I′i,jは当技術分野において知られている種々の丸め方式に基づいて、2または1となることができる。
式(3)の中において、Ni,jはノイズ、たとえば白色雑音であり、構造アーチファクトを軽減する。一般に、Ni,jはランダムな信号分布をもつ。ユーザー・インターフェース112を介して、操作者は、Ni,jの値の範囲を手動で制御できる。デフォルトでは、Ni,jの値の範囲は0からQ−1までである。画像の選択されたブロック内の各ピクセルについて同じノイズを使うことによって、ノイズ・パターンの空間周波数はブロック内で低くなり、これは画像全体におけるノイズの全体的な空間周波数を低下させる。ノイズの空間周波数が低下するので、ノイズ、すなわちマスキング信号は圧縮プロセスを生き延び、圧縮解除の際にアーチファクトを抑制する。
次に、下記の式(4)
Figure 2010532628
に示されるように、ブロック内の各ピクセルについて量子化誤差が決定され、すべての量子化誤差の総和がブロック量子化誤差Em,nを生成する。このブロック量子化誤差が誤差拡散係数に基づいて近隣ブロックに分配される。
総ブロック量子化誤差Em,nについて、該量子化誤差の一部eが、
e=c(m,n)*E (5)
によって決定されるよう、近隣ブロックに分配される。ここで、c(m,n)は誤差拡散係数である。
ステップ514では、ブロック量子化誤差は、誤差分配モジュール120を介して近隣ブロックに分配される。各ブロック内での誤差分配機能は次のように定義される。
Ii,j=Ii,j+wi,je Ii,j∈Bm,n (6)
wi,j=1/NM Ii,j∈Bm,n (7)
ここで、eはブロックBm,nへ分配される総誤差、N、Mはブロックの寸法、wi,jはブロックBm,nについての重み付け係数である。ある実施形態では、重み付け係数を計算するために、式(6)に示されるような一様分配が使用される。wi,jを計算するために、より複雑な関数が設計されることもできる。たとえば、wi,jはI(i,j)に比例して設定されることができる。
ブロックBm,nのサイズは、誤差拡散プロセスにおいて制御されることのできる空間周波数の量を決定するもので、アーチファクトを隠蔽する最良の効果を達成するよう選ばれる。しかしながら、大きなブロック・サイズは構造化されたアーチファクトを生成する傾向があり、これは誤差拡散プロセスにおいて望ましくはない。そのような構造化されたアーチファクトは、二つの異なるブロックにおける2つの隣り合うピクセルが異なる仕方で変換されるブロック境界アーチファクトを含む。式(1)におけるNi,jは、ランダムなノイズを含めることによる潜在的な構造化されたアーチファクトを破壊するためにも使用される。2×2の例示的なブロック・サイズが、目に見えるブロック・アーチファクトなしで720×480ピクセル(たとえばDVD解像度)の画像を処理するのに十分であると見出された。結果的な目に見えるアーチファクトなしで他のブロック・サイズおよび画像サイズが用いられることもありうることは理解しておくべきである。
ステップ516において、あるいはステップ510ないし514によって量子化が実行されたのち、本装置は、画像中のすべてのブロックが処理されるまで、画像中の次のブロックに進む(ステップ518)。画像が誤差分配関数によって修正されたのち、画像は後処理装置のメモリに、たとえば記憶装置124に保存されうる。ひとたび特定のフィルムの全画像が修正されたら、画像はエンコーダ122により、MPEG1、2、4、h.264などのような任意の通常の圧縮規格に従ってエンコードされうる。圧縮されたフィルム130は記憶装置、たとえば記憶装置124において記憶されてもよいし、あるいはリムーバブル記憶デバイス、たとえばDVDに転送されてもよい。
本開示の教示を組み込む実施形態について図示し、本稿で詳細に記載してきたが、当業者は、数多くの他の変形された、それでいてこれらの教示を組み込む実施形態を容易に考案できる。画像中のアーチファクトを軽減する装置および方法についての好ましい諸実施形態(限定のためでなく例解のために意図されたものである)を記載してきたが、上記の教示に照らして当業者によって修正および変形がなしうることを注意しておく。したがって、開示される本開示の個別的な実施形態に、付属の請求項によって述べられる本開示の範囲および精神内である変更がなされてもよいことは理解されるものとする。こうして本開示を特許法令によって要求される詳細さおよび具体さをもって記載してきたところで、特許請求され特許状による保護が望まれることが付属の請求項において記載される。

Claims (31)

  1. 画像中のバンド発生領域を検出する方法であって:
    少なくとも一つの第一の画像を少なくとも一つの均一色領域にセグメント分割する段階と;
    前記少なくとも一つの均一色領域について色強度の線形遷移を推定する段階と;
    色強度の前記線形遷移が実質的になめらかであれば、前記少なくとも一つの均一色領域をバンド発生領域として分類する段階とを含む、
    方法。
  2. 前記推定する段階が、セグメント分割された領域中のピクセルの強度表面を線形表面モデルを使ってモデル化することを含む、請求項1記載の方法。
  3. 前記分類する段階が、推定された強度表面を、前記少なくとも一つの第一の画像中の実際の強度表面に当てはめることを含む、請求項2記載の方法。
  4. 前記推定された強度表面と、前記少なくとも一つの第一の画像中の実際の強度表面との間の表面当てはめ誤差を決定する段階と;
    前記表面当てはめ誤差が所定の閾値より小さい場合に色強度の前記線形遷移が実質的になめらかであると判定する段階とをさらに含む、
    請求項3記載の方法。
  5. 前記セグメント分割する段階が、前記少なくとも一つの第一の画像に対して平均シフト関数を実行することを含む、請求項1記載の方法。
  6. 前記少なくとも一つのセグメント分割された領域のピクセル数を判別する段階と;
    前記ピクセル数が所定の閾値より小さい場合に前記少なくとも一つのセグメント分割された領域を破棄する段階とをさらに含む、
    請求項1記載の方法。
  7. 前記少なくとも一つのセグメント分割された領域のピクセルの色分布の分散を計算する段階と;
    計算された分散が所定の閾値より大きい場合に前記少なくとも一つのセグメント分割された領域を破棄する段階とをさらに含む、
    請求項1記載の方法。
  8. 前記少なくとも一つの分類されたバンド発生領域のそれぞれが共通の境界を共有するかどうかを判定する段階と;
    少なくとも二つの分類されたバンド発生領域が共通の境界を共有する場合に前記少なくとも二つの分類されたバンド発生領域を単一のバンド発生領域にマージする段階とをさらに含む、
    請求項1記載の方法。
  9. 検出されたバンド発生領域を少なくとも一つの第二の画像まで追跡する段階と;
    前記少なくとも一つの第一および第二の画像におけるバンド発生アーチファクトをマスクするよう、検出されたバンド発生領域に誤差拡散関数を適用する段階とをさらに含む、
    請求項1記載の方法。
  10. 前記適用する段階がさらに:
    前記少なくとも一つの画像のピクセルのブロック・サイズを選択する段階と;
    少なくとも一つのブロックが検出されたバンド発生領域内にあるかどうかを判定する段階と;
    前記少なくとも一つのブロックにマスキング信号を加える段階と;
    前記少なくとも一つの画像中の前記少なくとも一つのブロックについて量子化誤差を決定する段階と;
    前記量子化誤差を近隣ブロックに分配する段階とをさらに含む、
    請求項9記載の方法。
  11. 前記追跡する段階がさらに:
    前記少なくとも一つの第一の画像の検出されたバンド発生領域について二値マスクを生成する段階と;
    検出されたバンド発生領域を追跡するために前記少なくとも一つの第二の画像に前記二値マスクを投影する段階とを含む、
    請求項9記載の方法。
  12. 画像中のバンド発生領域を検出する装置であって:
    少なくとも一つの第一の画像を少なくとも一つの均一色領域にセグメント分割するよう構成された画像セグメント分割モジュールと;
    前記少なくとも一つの均一色領域について色強度の線形遷移を推定するよう構成された線形遷移推定器と;
    色強度の前記線形遷移が実質的になめらかであれば、前記少なくとも一つの均一色領域をバンド発生領域として分類するよう構成された領域検出モジュールとを有する、
    装置。
  13. 前記線形遷移推定器がさらに、セグメント分割された領域中のピクセルの強度表面を線形表面モデルを使ってモデル化するよう構成されている、請求項12記載の装置。
  14. 前記領域検出モジュールがさらに、推定された強度表面を、前記少なくとも一つの第一の画像中の実際の強度表面に当てはめるよう構成されている、請求項13記載の装置。
  15. 前記領域検出モジュールがさらに、前記推定された強度表面と、前記少なくとも一つの第一の画像中の実際の強度表面との間の表面当てはめ誤差を決定するよう構成されており;前記表面当てはめ誤差が所定の閾値より小さい場合に色強度の前記線形遷移が実質的になめらかであると判定する、請求項14記載の装置。
  16. 前記画像セグメント分割モジュールがさらに、前記少なくとも一つの第一の画像に対して平均シフト関数を実行するよう構成されている、請求項12記載の装置。
  17. 前記領域検出モジュールがさらに、前記少なくとも一つのセグメント分割された領域のピクセル数を判別するよう構成されており;前記ピクセル数が所定の閾値より小さい場合に前記少なくとも一つのセグメント分割された領域を破棄する、請求項12記載の装置。
  18. 前記領域検出モジュールがさらに、前記少なくとも一つのセグメント分割された領域のピクセルの色分布の分散を計算するよう構成されており;計算された分散が所定の閾値より大きい場合に前記少なくとも一つのセグメント分割された領域を破棄する、請求項12記載の装置。
  19. 前記領域検出モジュールがさらに、前記少なくとも一つの分類されたバンド発生領域のそれぞれが共通の境界を共有するかどうかを判定するよう構成されており;少なくとも二つの分類されたバンド発生領域が共通の境界を共有する場合に前記少なくとも二つの分類されたバンド発生領域を単一のバンド発生領域にマージする、請求項12記載の装置。
  20. 前記少なくとも一つの第一の画像中の検出されたバンド発生領域を少なくとも一つの第二の画像まで追跡するよう構成された追跡モジュールと;
    前記少なくとも一つの第一および第二の画像におけるバンド発生アーチファクトをマスクするよう、検出されたバンド発生領域に誤差拡散関数を適用するよう構成された誤差拡散モジュールとをさらに有する、
    請求項12記載の装置。
  21. 前記誤差拡散モジュールがさらに、少なくとも一つの画像に適用されるべきマスキング信号を生成するよう構成された信号生成器をさらに有しており;前記誤差拡散モジュールがさらに、前記少なくとも一つの画像のピクセルのブロック・サイズを選択し;少なくとも一つのブロックが検出されたバンド発生領域内にあるかどうかを判定し;前記少なくとも一つの画像中の前記少なくとも一つのブロックについて量子化誤差を決定し;前記量子化誤差を近隣ブロックに分配するよう構成されている、請求項20記載の装置。
  22. 画像中のバンド発生領域を検出する装置であって:
    少なくとも一つの第一の画像を少なくとも一つの均一色領域にセグメント分割する手段と;
    前記少なくとも一つの均一色領域について色強度の線形遷移を推定する手段と;
    色強度の前記線形遷移が実質的になめらかであれば、前記少なくとも一つの均一色領域をバンド発生領域として分類する手段とを有する、
    装置。
  23. 前記推定する手段がさらに、セグメント分割された領域中のピクセルの強度表面を線形表面モデルを使ってモデル化する手段を有する、請求項22記載の装置。
  24. 前記分類する手段がさらに、推定された強度表面を、前記少なくとも一つの第一の画像中の実際の強度表面に当てはめる手段を有する、請求項23記載の装置。
  25. 前記分類する手段がさらに、前記推定された強度表面と、前記少なくとも一つの第一の画像中の実際の強度表面との間の表面当てはめ誤差を決定する手段と;前記表面当てはめ誤差が所定の閾値より小さい場合に色強度の前記線形遷移が実質的になめらかであると判定する手段とを有する、請求項24記載の装置。
  26. 前記セグメント分割する手段がさらに、前記少なくとも一つの第一の画像に対して平均シフト関数を実行する手段を有する、請求項22記載の装置。
  27. 前記分類する手段がさらに、前記少なくとも一つのセグメント分割された領域のピクセル数を判別する手段と;前記ピクセル数が所定の閾値より小さい場合に前記少なくとも一つのセグメント分割された領域を破棄する手段とを有する、請求項22記載の装置。
  28. 前記分類する手段がさらに、前記少なくとも一つのセグメント分割された領域のピクセルの色分布の分散を計算する手段と;計算された分散が所定の閾値より大きい場合に前記少なくとも一つのセグメント分割された領域を破棄する手段とをさらに有する、請求項22記載の装置。
  29. 前記少なくとも一つの分類されたバンド発生領域のそれぞれが共通の境界を共有するかどうかを判定する手段と;少なくとも二つの分類されたバンド発生領域が共通の境界を共有する場合に前記少なくとも二つの分類されたバンド発生領域を単一のバンド発生領域にマージする手段とをさらに有する、請求項22記載の装置。
  30. 前記少なくとも一つの第一の画像中の検出されたバンド発生領域を少なくとも一つの第二の画像まで追跡する手段と;
    前記少なくとも一つの第一および第二の画像におけるバンド発生アーチファクトをマスクするよう、検出されたバンド発生領域に誤差拡散関数を適用する手段とをさらに有する、
    請求項22記載の装置。
  31. 前記分類する手段がさらに、少なくとも一つの画像に適用されるべきマスキング信号を生成する手段と;前記少なくとも一つの画像のピクセルのブロック・サイズを選択する手段と;少なくとも一つのブロックが検出されたバンド発生領域内にあるかどうかを判定する手段と;前記少なくとも一つの画像中の前記少なくとも一つのブロックについて量子化誤差を決定する手段と;前記量子化誤差を近隣ブロックに分配する手段とを有する、請求項30記載の装置。
JP2010514720A 2007-06-29 2007-06-29 画像中のアーチファクトを低減させる装置および方法 Pending JP2010532628A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/US2007/015205 WO2009005497A1 (en) 2007-06-29 2007-06-29 Apparatus and method for reducing artifacts in images

Publications (1)

Publication Number Publication Date
JP2010532628A true JP2010532628A (ja) 2010-10-07

Family

ID=39275987

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010514720A Pending JP2010532628A (ja) 2007-06-29 2007-06-29 画像中のアーチファクトを低減させる装置および方法

Country Status (7)

Country Link
US (1) US8472709B2 (ja)
EP (1) EP2171683A1 (ja)
JP (1) JP2010532628A (ja)
KR (1) KR101350853B1 (ja)
CN (1) CN101689295A (ja)
BR (1) BRPI0721839A2 (ja)
WO (1) WO2009005497A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018509708A (ja) * 2015-03-02 2018-04-05 ドルビー ラボラトリーズ ライセンシング コーポレイション ハイダイナミックレンジ画像のためのコンテンツ適応的な知覚的量子化器

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9743078B2 (en) * 2004-07-30 2017-08-22 Euclid Discoveries, Llc Standards-compliant model-based video encoding and decoding
US9532069B2 (en) 2004-07-30 2016-12-27 Euclid Discoveries, Llc Video compression repository and model reuse
US9578345B2 (en) 2005-03-31 2017-02-21 Euclid Discoveries, Llc Model-based video encoding and decoding
EP1777938A1 (en) * 2005-10-19 2007-04-25 Thomson Licensing Method, system and device for colour quality control
US8270498B2 (en) 2009-03-26 2012-09-18 Apple Inc. Dynamic dithering for video compression
KR101605832B1 (ko) * 2009-05-20 2016-03-23 마퍼 리쏘그라피 아이피 비.브이. 리소그래픽 처리를 위한 2―레벨 패턴 발생 방법 및 이를 이용한 패턴 발생기
US10477249B2 (en) 2009-06-05 2019-11-12 Apple Inc. Video processing for masking coding artifacts using dynamic noise maps
WO2011011250A1 (en) * 2009-07-24 2011-01-27 Dolby Laboratories Licensing Corporation Image control for displays
US20120144304A1 (en) * 2009-08-12 2012-06-07 Ju Guo System and method for reducing artifacts in images
US20110135011A1 (en) 2009-12-04 2011-06-09 Apple Inc. Adaptive dithering during image processing
JP2011198246A (ja) * 2010-03-23 2011-10-06 Canon Inc 画像処理方法、画像処理装置、プログラム及びプログラム記憶媒体
US8736894B2 (en) * 2011-12-20 2014-05-27 Eastman Kodak Company Producing correction data for printer
JP6342810B2 (ja) * 2011-11-17 2018-06-13 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. 画像処理
US9432694B2 (en) * 2012-03-06 2016-08-30 Apple Inc. Signal shaping techniques for video data that is susceptible to banding artifacts
US9565404B2 (en) * 2012-07-30 2017-02-07 Apple Inc. Encoding techniques for banding reduction
TW201428680A (zh) * 2013-01-02 2014-07-16 Ind Tech Res Inst 影像處理裝置及立體影像前景分離方法
US9888240B2 (en) * 2013-04-29 2018-02-06 Apple Inc. Video processors for preserving detail in low-light scenes
EP3562170A1 (en) 2013-07-29 2019-10-30 Koninklijke KPN N.V. Providing tile video streams to a client
US10097851B2 (en) 2014-03-10 2018-10-09 Euclid Discoveries, Llc Perceptual optimization for model-based video encoding
US10091507B2 (en) 2014-03-10 2018-10-02 Euclid Discoveries, Llc Perceptual optimization for model-based video encoding
US9621917B2 (en) 2014-03-10 2017-04-11 Euclid Discoveries, Llc Continuous block tracking for temporal prediction in video encoding
KR101953679B1 (ko) * 2014-06-27 2019-03-04 코닌클리즈케 케이피엔 엔.브이. Hevc-타일드 비디오 스트림을 기초로 한 관심영역 결정
US10694192B2 (en) 2014-06-27 2020-06-23 Koninklijke Kpn N.V. HEVC-tiled video streaming
US9911179B2 (en) 2014-07-18 2018-03-06 Dolby Laboratories Licensing Corporation Image decontouring in high dynamic range video processing
WO2017029400A1 (en) 2015-08-20 2017-02-23 Koninklijke Kpn N.V. Forming one or more tile streams on the basis of one or more video streams
US10674185B2 (en) 2015-10-08 2020-06-02 Koninklijke Kpn N.V. Enhancing a region of interest in video frames of a video stream
US11032446B2 (en) * 2016-11-17 2021-06-08 Sony Interactive Entertainment Inc. Image processing device, image processing method, and program for correcting color in an image
US10609372B2 (en) * 2017-09-29 2020-03-31 Dolby Laboratories Licensing Corporation Up-conversion to content adaptive perceptual quantization video signals
WO2020131494A1 (en) * 2018-12-19 2020-06-25 Dolby Laboratories Licensing Corporation Image debanding using adaptive sparse filtering
CN110268442B (zh) * 2019-05-09 2023-08-29 京东方科技集团股份有限公司 在图像中检测背景物上的外来物的计算机实现的方法、在图像中检测背景物上的外来物的设备以及计算机程序产品
CN110262819B (zh) * 2019-06-04 2021-02-26 深圳前海微众银行股份有限公司 一种联邦学习的模型参数更新方法及装置
US11523185B2 (en) 2019-06-19 2022-12-06 Koninklijke Kpn N.V. Rendering video stream in sub-area of visible display area

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07212760A (ja) * 1994-01-14 1995-08-11 Nippon Telegr & Teleph Corp <Ntt> 動画像の動き補償予測符号化方法
JPH11306334A (ja) * 1998-02-17 1999-11-05 Fuji Xerox Co Ltd 画像処理装置および画像処理方法
JPH11327497A (ja) * 1998-05-14 1999-11-26 Hitachi Ltd 映像信号処理装置および表示装置
JP2003189096A (ja) * 2001-12-21 2003-07-04 Minolta Co Ltd 画像処理装置
JP2005517162A (ja) * 2002-02-02 2005-06-09 キネティック リミテッド 頭部位置センサ
WO2005083634A1 (en) * 2004-02-20 2005-09-09 Siemens Corporate Research, Inc. Method and system for multi-modal component-based tracking of an object using robust information fusion
JP2006521150A (ja) * 2003-03-27 2006-09-21 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 医用イメージングシステム及び関心対象をセグメント化する方法

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4959730A (en) * 1990-01-02 1990-09-25 Eastman Kodak Company False density contour suppression using randomly modified input signals for comparison to threshold values
JP2812525B2 (ja) 1990-02-20 1998-10-22 日本電信電話株式会社 距離計測方法
JP3317982B2 (ja) 1991-07-15 2002-08-26 オリンパス光学工業株式会社 画像信号復号化装置
JP3242506B2 (ja) 1993-03-24 2001-12-25 富士写真フイルム株式会社 レンズ付きフイルムユニット用露光画面切替え装置
US5822464A (en) 1996-05-30 1998-10-13 Xerox Corporation Method and system for processing image information using video dependent dampened screening and error diffusion
US5949434A (en) * 1997-03-20 1999-09-07 Charlton; Paul Method and apparatus for scaling graphic images
JPH1188909A (ja) 1997-09-11 1999-03-30 Mitsubishi Electric Corp 画像圧縮伝送装置
JP3883341B2 (ja) 1999-10-29 2007-02-21 株式会社リコー 画像処理方法、装置及び記録媒体
US6958760B1 (en) 1999-11-06 2005-10-25 Samsung Electronics, Co., Ltd. False contour correction apparatus in image display system and false contour correction method
JP2003015587A (ja) * 2001-06-28 2003-01-17 Mitsubishi Electric Corp ディスプレイ装置
US8064684B2 (en) * 2003-04-16 2011-11-22 Massachusetts Institute Of Technology Methods and apparatus for visualizing volumetric data using deformable physical object
JP2005024717A (ja) * 2003-06-30 2005-01-27 Fujitsu Hitachi Plasma Display Ltd ディスプレイ装置およびディスプレイの駆動方法
US7239321B2 (en) * 2003-08-26 2007-07-03 Speech Graphics, Inc. Static and dynamic 3-D human face reconstruction
SE0402576D0 (sv) 2004-10-25 2004-10-25 Forskarpatent I Uppsala Ab Multispectral and hyperspectral imaging
US7733532B2 (en) * 2004-10-27 2010-06-08 Marvell International Technology Ltd. Laser print apparatus with dual halftones
US8078255B2 (en) * 2006-03-29 2011-12-13 University Of Georgia Research Foundation, Inc. Virtual surgical systems and methods
CN101595734A (zh) 2007-01-16 2009-12-02 汤姆逊许可证公司 用于减轻图像中的伪影的系统和方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07212760A (ja) * 1994-01-14 1995-08-11 Nippon Telegr & Teleph Corp <Ntt> 動画像の動き補償予測符号化方法
JPH11306334A (ja) * 1998-02-17 1999-11-05 Fuji Xerox Co Ltd 画像処理装置および画像処理方法
JPH11327497A (ja) * 1998-05-14 1999-11-26 Hitachi Ltd 映像信号処理装置および表示装置
JP2003189096A (ja) * 2001-12-21 2003-07-04 Minolta Co Ltd 画像処理装置
JP2005517162A (ja) * 2002-02-02 2005-06-09 キネティック リミテッド 頭部位置センサ
JP2006521150A (ja) * 2003-03-27 2006-09-21 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 医用イメージングシステム及び関心対象をセグメント化する方法
WO2005083634A1 (en) * 2004-02-20 2005-09-09 Siemens Corporate Research, Inc. Method and system for multi-modal component-based tracking of an object using robust information fusion

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JPN6012026194; Wonseok(外1名): '"FLAT-REGION DETECTION AND FALSE CONTOUR REMOVAL IN THE DIGITAL TV DISPLAY"' Multimedia and Expo, 2005. ICME 2005. IEEE International Conference on , 20050706, p.1338-1341, IEEE *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018509708A (ja) * 2015-03-02 2018-04-05 ドルビー ラボラトリーズ ライセンシング コーポレイション ハイダイナミックレンジ画像のためのコンテンツ適応的な知覚的量子化器

Also Published As

Publication number Publication date
EP2171683A1 (en) 2010-04-07
KR101350853B1 (ko) 2014-01-13
US8472709B2 (en) 2013-06-25
CN101689295A (zh) 2010-03-31
US20100135575A1 (en) 2010-06-03
BRPI0721839A2 (pt) 2013-05-21
WO2009005497A1 (en) 2009-01-08
KR20100037054A (ko) 2010-04-08

Similar Documents

Publication Publication Date Title
KR101350853B1 (ko) 이미지들에서 아티팩트들을 감소시키기 위한 장치 및 방법
JP5818404B2 (ja) 画像中のアーチファクトを軽減するシステムおよび方法
JP4740657B2 (ja) カラーセグメンテーションに基づくステレオ3次元再構成システムおよびプロセス
US9842382B2 (en) Method and device for removing haze in single image
KR20170031033A (ko) 과노출 정정을 위한 방법, 시스템 및 장치
JP2010218548A (ja) 仮想画像を合成する方法
JP5676610B2 (ja) 画像シーケンスの関心領域に基づくアーティファクト低減のためのシステム及び方法
KR102122905B1 (ko) 히스토그램 구간 교정을 이용한 스테레오 영상의 휘도 보정 방법 및 이에 이용되는 기록매체
JP2005517257A (ja) セグメント化装置及び方法
EP3139341A1 (en) Methods, systems and apparatus for specular highlight reconstruction
US9508020B2 (en) Image processing system with artifact suppression mechanism and method of operation thereof
Aydin et al. Blotch Inpainting Based On Sift Feature Extraction in Old Films
RU2560086C1 (ru) Система и способ для временного дополнения видео
JP2016165065A (ja) 画像用ノイズ低減装置、画像用符号化装置、及びプログラム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120423

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120522

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120628

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121127

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20130507