JP2006148878A - 画像中の画素を分類する方法 - Google Patents

画像中の画素を分類する方法 Download PDF

Info

Publication number
JP2006148878A
JP2006148878A JP2005300374A JP2005300374A JP2006148878A JP 2006148878 A JP2006148878 A JP 2006148878A JP 2005300374 A JP2005300374 A JP 2005300374A JP 2005300374 A JP2005300374 A JP 2005300374A JP 2006148878 A JP2006148878 A JP 2006148878A
Authority
JP
Japan
Prior art keywords
block
blocks
image
filtering
pixels
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005300374A
Other languages
English (en)
Inventor
Hao-Song Kong
ハオ−ソング・コング
Yao Nie
ヤオ・ニー
Vetro Anthony
アンソニー・ヴェトロ
Huifang Sun
ハイファン・スン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Research Laboratories Inc
Original Assignee
Mitsubishi Electric Research Laboratories Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US10/964,756 external-priority patent/US7346224B2/en
Application filed by Mitsubishi Electric Research Laboratories Inc filed Critical Mitsubishi Electric Research Laboratories Inc
Publication of JP2006148878A publication Critical patent/JP2006148878A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Image Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)

Abstract

【課題】低い計算複雑性で、より高い画像/ビデオ画質を達成する新規のフィルタリング構造を提供することが望ましい。
【解決手段】方法は、先ず画像をブロックに分割することによって、画像中の画素を分類する。各画素の強度の分散を求め、ブロック毎に最大分散を有する画素を特定する。次に、最大分散に応じてブロックをクラスに分類する。
【選択図】図1

Description

本発明は、包括的にはデジタル信号処理に関し、特に、画像中の画素を分類し、この分類に応じて画素をフィルタリングすることに関する。
圧縮は、デジタルカメラ、放送TVおよびDVDを含む多くの画像化の用途において、メモリに記憶することのできる画像数を増やすため、または送信帯域幅を減らすために用いられている。圧縮比が高い場合には、量子化および係数の打ち切りの副作用により、復元画像中に目に見えるアーチファクトが生じる可能性がある。現実的な解決策は、復元画像をフィルタリングして、目に見えるアーチファクトを抑え、復元画像の主観的な品質を保証することである。
ITU−T H.26xおよびMPEG−1/2/4等のほとんどのビデオ符号化規格は、ブロックに基づくプロセスを用いる。高い圧縮比では、基礎を成すブロックに基づく処理により、いくつかのアーチファクトが目に見える。最も一般的なアーチファクトは、ブロッキングおよびリンギングである。
ブロッキングアーチファクトは、復元画像のモノトーン領域のブロック境界に沿って格子ノイズとして現れる。ブロッキングアーチファクトは、隣接するブロックが別個に処理され、ブロック境界における画素強度が復元後に完全にそろわないために生じる。リンギングアーチファクトは、復元画像のエッジに沿って、より顕著である。この効果は、ギブス現象として知られ、量子化AC係数による高周波係数の打ち切りによって生じる。
これらの符号化アーチファクトを除去するための多くの後処理技法が知られている。
空間領域法が、Lee他に対して2003年3月25日付で発行された米国特許第6,539,060号「Image data post-processing method for reducing quantization effect, apparatus therefor」、Osaに対して2002年12月17日付で発行された米国特許第6,496,605号「Block deformation removing filter, image processing apparatus using the same, method of filtering image signal, and storage medium for storing software therefor」、Konstantinidesに対して2001年11月20日付で発行された米国特許第6,320,905号「Postprocessing system for removing blocking artifacts in block-based codecs」、Cheung他に対して2001年1月23日付で発行された米国特許第6,178,205号「Video postfiltering with motion-compensated temporal filtering and/or spatial-adaptive filtering」、Sugahara他に対して2000年12月26日付で発行された米国特許第6,167,157号「Method of reducing quantization noise generated during a decoding process of image data and device for decoding image data」、およびGupta他に対して1999年7月6日付で発行された米国特許第5,920,356号「Coding parameter adaptive transform artifact reduction process」に記載されている。
離散コサイン変換(DCT)領域法が、Triantafyllidis等著「Blocking artifact detection and reduction in compressed data」(IEEE Transactions on Circuits and Systems for Video Technology, Vol. 12, October 2002)、およびChen等著「Adaptive post-filtering of transform coefficients for the reduction of blocking artifacts」(IEEE Transactions on Circuits and Systems for Video Technology, Vol. 11, May 2001)に記載されている。
ウェーブレットに基づくフィルタリング法が、Xiong等著「A deblocking algorithm for JPEG compressed images using overcomplete wavelet representations」(IEEE Transactions on Circuits and Systems for Video Technology, Vol. 7, No. 2, August 1997)、およびLang等著「Noise reduction using an undecimated discrete wavelet transform」(Signal Processing Newsletters, Vol. 13, January 1996)に記載されている。
反復法が、Paek等著「A DCT-based spatially adaptive post-processing technique to reduce the blocking artifacts in transform coded images」(IEEE Transactions on Circuits and Systems for Video Technology, Vol. 10, February 2000)、およびPaek等著「On the POCS-based post-processing technique to reduce the blocking artifacts in transform coded images」(IEEE Transactions on Circuits and Systems for Video Technology, Vol. 8, June 1998)に記載されている。
ファジィルールに基づくフィルタリング法が、Arakawa著「Fuzzy rule-based signal processing and its application to image restoration」(IEEE Journal on selected areas in communications, Vol. 12, No. 9, December 1994)、およびGiura他に対して2001年12月18日付で発行された米国特許第6,332,136号「Fuzzy filtering method and associated fuzzy filter」に記載されている。
従来技術の方法のほとんどは、ブロッキングノイズのみを扱う。そうした方法は、リンギングノイズには効果がない。ウェーブレットに基づく方法のようないくつかの方法は、リンギングを抑えることができるが、復元画像全体をぼかしてしまう。従来技術のファジィルールに基づくフィルタリング法は、白色ガウス雑音のみを扱う。
上記の従来技術の方法は、画素に別個に作用し、各画素に同一のフィルタを適用する。そうした方法は、概して、画像の基礎を成す内容を考慮しない。したがって、それらのフィルタは、アーチファクトを除去するために画像を過度に平滑化してぼかしてしまうか、または、最小限の平滑化を適用した場合には、アーチファクトを十分に低減することができない。
そうした方法のもう1つの問題は、計算の複雑性である。例えば、ウェーブレットに基づく方法は、ウェーブレット画像を得るために8回の畳み込みに基づくローパスおよびハイパスフィルタリング操作を必要とする。次に、それらのウェーブレット画像に対してデブロッキング操作を行って、ブロッキングアーチファクトを除去する。デブロッキングされた画像を再構成するために、12回の畳み込みに基づくローパスおよびハイパスフィルタリング操作が必要となる。したがって、その方法では、合計20回の畳み込みに基づくフィルタリング操作が必要である。この計算コストは、リアルタイム処理の要件を満たすことができない。このウェーブレットに基づく方法と同様に、DCT領域法もまた、高い計算複雑性を有する。5×5のウィンドウを用いたローパスフィルタリングの場合には、単一の8×8ブロックを処理するために25回のDCT操作が必要である。このような複雑性の高さもやはり、リアルタイム処理には非現実的である。反復法の計算コストは、上記の2つの方法よりもさらに高い。ファジィルールに基づくフィルタリング法について言えば、反復法は、多数のフィルタパラメータおよび付加的な訓練データを必要とする。
従来技術の方法の問題に鑑みて、低い計算複雑性で、より高い画像/ビデオ画質を達成する新規のフィルタリング構造を提供することが望ましい。
方法は、先ず画像をブロックに分割することによって、画像中の画素を分類する。各画素の強度の分散を求め、ブロック毎に最大分散を有する画素を特定する。次に、最大分散に応じてブロックをクラスに分類する。
図1は、本発明によるシステムおよび方法100を示す。本システムは、いかなる画像またはビデオデコーダとも独立している。本システムは、圧縮された画像またはビデオに埋め込まれたいかなる符号化パラメータにも頼らない。本発明は、画像中の局所的な特徴部に重点を置いている。本発明による方法は、局所的な特徴部を抽出し、これらを分類する。次に、画像が復元画像である場合には、分類された特徴部を用いて、画素を選択的かつ適応的にフィルタリングすることができる。
入力は、画像201である。本方法は、いずれの画像形式(例えば、YUVまたはRGB)にも有効である。本システムは、ビデオにおけるような画像シーケンスを処理できることを理解すべきである。例えば、画像201は、プログレッシブビデオまたはインタレースビデオの一部であってもよい。また、入力画像は、一度も圧縮されていない原画像であっても、復元画像であってもよいことにも留意すべきである。
しかし、入力画像が圧縮画像から得られた復元画像であり、圧縮画像が、ブロックに基づく圧縮プロセスを用いて圧縮された原画像から得られたものである場合には、以前の圧縮により、復元画像201は、圧縮画像のDCT係数ブロックの別個の量子化によって生じたブロッキングアーチファクトを有する。したがって、復元画像201は、隣接するブロック間の空間値にブロック途切れがある。復元画像中のエッジに沿ってリンギングアーチファクトが生じる可能性もある。
元の原情報を保持する一方で、これらのアーチファクトを低減するために、本発明によるフィルタリングは、入力画像201中の局所的な特徴部の分類に基づく。さらに、フィルタリングはこの分類に対して適応的である。
分散画像
統計的な観点から、画素の強度値の分布は、復元画像の特徴部を示す。画像の平均強度値mは、画像のDC成分を表す。平均強度値は、次式によって測定することができる。
Figure 2006148878
ここで、MおよびNは、復元画像の画素数に換算した幅および高さであり、pxi,jは、i,jの位置に生じる画素の確率である。
復元画像の平均パワーは、次式で表される平均二乗値である。
Figure 2006148878
平均の変動は、次式で表される分散である。
Figure 2006148878
平均二乗は、画像中のDC成分の平均パワーを表し、分散は、圧縮画像201中のAC周波数成分の平均パワーを表す。したがって、強度値の分散は、画像中のエネルギーを表すACパワーの変動の尺度として用いられる。
ある画素の分散が高い場合には、その画素は、エッジに関連する可能性が高い。分散が低い場合には、その画素は、画像の均質領域、例えば、平滑な背景の一部である。したがって、分散は、画像中の局所的な特徴部の特性を示す。
ブロッキングアーチファクトとリンギングアーチファクトは、ともに局所的な特徴部の特性によるものである、すなわち、アーチファクトは、ブロック境界またはエッジ付近に現れるため、局所的な特徴部は、これらのアーチファクトを示すのに十分である。したがって、本発明による分類およびフィルタリングは、上記の式(3)に記載したような画素強度値の局所分散によって測定されるエネルギー分布に基づく。特徴部の特性は、以下のように強度値211を抽出する(210)ことによって求める。
図3に示すように、平滑3×3フィルタ301で復元画像201中の各画素302を走査する。走査は、ラスタスキャン順に行うことができる。フィルタの各中心画素301について、式(1)〜(3)に従って強度値211の平均および分散を求める(220)。分散値は、分散画像401を形成する。幾何学的な観点から、局所分散は、各画素位置における復元画像の勾配を反映する。画像中のエッジにおける勾配は、非常に高いためである。
図4に示すように、特徴部の抽出および走査は、画素が強度値211を有する空間領域の復元画像201を、画素が分散411を有するエネルギー領域の分散画像401に変換する。
画素の分類
図5に示すように、第1のしきい値_1未満の分散を有する画素211を、クラス_0 501として分類する(230)。これらの画素は、画像中の均質な、すなわち「平滑な」領域に対応する。第2のしきい値_2よりも大きい分散を有する画素を、クラス_1 502として分類する。これらの画素は、エッジに対応する可能性が最も高い。これら2つのしきい値の間の分散を有する画素を、クラス_2 503として分類する。これらの画素は、近傍画素の特性に応じてリンギングノイズまたはテクスチャとして考えることができる。本発明による適応的フィルタリングは、上記の分類に応じて実行される。
ブロックの分類
画素ブロックも、分散画像401中の分散値に応じて「平滑」ブロック241、「テクスチャ」ブロック242および「エッジ」ブロック243に分類する(240)。ブロックの分類240は、各ブロック内の総分散に基づいて、またはブロック内の各クラスの画素数を計数することによって行うことができる。例えば、ブロック内の画素が全てクラス_0である場合には、そのブロックを平滑ブロックとして分類する。ブロック内の少なくとも1つの画素がクラス_1である場合には、そのブロックをエッジブロックとして分類する。その他の、ブロックがクラス_0とクラス_2の両方の画素を有する場合には、そのブロックをテクスチャブロックとして分類する。
ブロッキングアーチファクトの検出
最もよく知られている画像およびビデオの圧縮規格は、画素ブロックのDCT符号化に基づいている。ブロックに基づく符号化は、画像を完全に、通常は、1ブロックが8×8画素である画素ブロックに分割する。各ブロックの画素は、別個にDCT係数に変換される。次に、DCT係数は、所定の量子化行列に応じて量子化される。別個の符号化のために、ブロッキングアーチファクトがブロック境界で目に見える。
図6は、8×8のブロック600上でブロッキングアーチファクトを検出する(250)方法を示す。外側の画素を星印601で示し、「内側の」画素を黒丸602で示す。内側の画素は、ブロック内の一番上の行および左の列に隣接して、それと平行に位置する。検出250は、ブロック毎に左から右へ、また上から下へ行われる。
ブロッキングアーチファクトが存在する場合には、外側の画素601の分散の勾配は、内側の画素602とほぼ同じである。ブロッキングアーチファクトがあることを判定する基準は、次の通りである。
Figure 2006148878
sign(符号)は、+1または−1のいずれかである。上記のテストは、ブロッキングアーチファクトと、ブロック境界にあるエッジとを区別する。
デブロッキングフィルタ
図7に示すように、ブロッキングアーチファクトは、復元画像中の検出されたブロック境界をフィルタリングすることによって除去される(260)。ブロッキングアーチファクトが検出された場合には、画素に対してブロック境界601に沿って1次元ローパス(平滑化)フィルタを適応的に適用する。フィルタ702、704、706のサイズ(例えば2、4、6またはそれ以上の画素数)は、ブロック境界における勾配に対応する。大きな勾配値を有する画素(すなわちエッジ画素)は、フィルタリング操作から除外し、エッジやテクスチャをぼかすことを避ける。
ファジィフィルタ
ファジィフィルタ271を適用することによって、デリンギング270は、エッジブロック243のみに作用する。本発明によるファジィフィルタは、ファジィ変換理論に基づく。Nie等著「Fuzzy transformation and its applications」(IEEE International Conference on Image Processing, Barcelona, Spain, September, 2003)を参照願いたい。
ファジィ変換において、空間サンプルx(例えば画素の強度値)と順序統計量xの関係は、実数値のガウス関数μ(a,b)によって確立され、ここで、iは空間インデックスi=1,2,...,Nであり、j=1,2,...,Nは順序統計量であり、x(1)≦x(2)≦...≦x(N)であり、観測またはフィルタリングウィンドウのサイズはNである。
メンバシップ関数は以下の制約を有する。
Figure 2006148878
これにより、次式によって定義されるN×Nのファジィ空間ランク(SR)行列が得られる。
Figure 2006148878
ファジィSR行列R(チルダ)の要素は、各対の画素間の値の差に依存するため、ファジィSR行列は、観測画素に埋め込まれた広がり情報を含む。
元のすなわち「はっきりした」空間画素は、はっきりした順序統計量ベクトルに行正規化ファジィSR行列を掛けることによって、ファジィ空間画素に「変換」することができる。結果として得られるファジィ空間画素は、広がり情報も反映する。本発明によるファジィフィルタ271の出力272は、観測またはフィルタリングウィンドウの中心画素がぼやけた(fuzzy)ものに相当する。
フィルタの出力は、以下の単純化された式を用いて得ることができる。
Figure 2006148878
ここで、xおよびx(チルダ)は、それぞれ、はっきりした中心画素およびぼやけた中心画素である。
フィルタの出力の最後の式から示唆されるように、順序付け操作は不要である。したがって、ファジィフィルタ271の計算複雑性は、線形フィルタよりもわずかに高いだけである。唯一の付加的な計算は、N−1対の画素間で関数の値を評価するためのものである。全画素についてμ(x,x)=1であるため、求める必要がないことに留意されたい。
本発明の1実施形態において、実数値の関数μ(a,b)は、次式のガウス関数によって定義される。
Figure 2006148878
ここで、広がりパラメータξは20である。
図2は、サンプルx(i=1,2,...,N)とウィンドウの中心サンプルxの値の類似性を表すガウス関数のいくつかの値の例を示す。この所与の例において、x=128、x=180、x=20、x=100である。
上記の式から、ファジィフィルタの出力は、フィルタリングウィンドウ内のサンプルの加重平均であることが分かる。ガウス関数の値、すなわち中心サンプル自体を含む各サンプルと中心サンプルの類似性の尺度は、対応するサンプルの重みとして用いられる。
したがって、サンプルの値が中心サンプルに近いほど、より大きな重みがそのサンプルに割り当てられる。これは、類似した値のサンプルは、それらの局所平均の周囲でさらにクラスタリングされ、異なる値のサンプルは、ほぼそのままとなるという効果をもたらす。これは、ファジィ変換のクラスタリング特性として知られる。
結果として、本発明によるファジィフィルタ271は、データに適応的な平滑化機能を有するため、強いエッジを完全に保持し、その一方で、目障りなリンギングアーチファクトに関連する弱いエッジを除去することができる。
図8にこの機能を示す。この例において、「ステップ」信号の入力サンプル801は、均一に分散したノイズによって破壊されている。よって、破壊された信号は、はっきりしたサンプルの2つのグループからなり、一方のグループは0の周囲に局在し、他方のグループは1の周囲に局在している。
ファジィフィルタ271によるフィルタリングの後、類似した値のサンプルを含む各グループを、そのグループの局所平均の周囲でさらに密にクラスタリングし、結果として、フィルタリングされたステップ信号802を得る。こうして、均一な領域における望ましくない摂動を平滑化し、その一方でステップエッジを回復する。この例は、強いエッジの周囲のリンギングアーチファクトを正確に模擬していることに留意されたい。したがって、この例は、ファジィフィルタが如何にこれらのアーチファクトを除去するとともにエッジを保持するかを示している。
適応的フィルタリング
上記の式(6)から、ウィンドウ内のぼやけた中心画素は、加重平均であることが分かる。各重みは、特に広がりパラメータξにより定められるようなガウス関数によって与えられる。広がりパラメータは、ガウス関数の形状、すなわちフィルタリングの範囲を制御する。広がりパラメータξが大きい場合には、ガウス関数は、比較的広い。これは、より平滑なフィルタに対応する。広がりパラメータξが小さい場合には、ガウス関数は狭く、フィルタリングの平滑さは低下する。ウィンドウサイズNは、同様の特性を有する。大きなウィンドウは、小さなウィンドウよりも強い平滑化効果を有する。
したがって、本発明は、適応的ファジィフィルタリング方法を提供する。ウィンドウサイズNおよび広がりパラメータξは、分散画像401中の値に応じて適応的に決められる。
ウィンドウサイズNと広がりパラメータξの可能な組み合わせとして以下の4つがある。
小さなウィンドウNと小さなξ
小さなウィンドウNと大きなξ
大きなウィンドウNと小さなξ
大きなウィンドウNと大きなξ
本発明の基本原則として、小さな分散は、小さなウィンドウおよび小さな広がりパラメータξに対応し、大きな分散は、大きなウィンドウおよび大きな広がりパラメータξに対応する。
図9は、本発明による適応方法のステップを示す。開始910において、本方法に対する入力は、次の分類ブロック901(終了990まで)、および対応する復元画像ブロック902である。
ステップ920において、分散画像401中の分散値が22よりも大きいかどうかを判定する。真921である場合には、対応する画素は、おそらくエッジ上にある可能性が高い。したがって、エッジの鮮明さを保持するために、この画素は、オールパスフィルタリングする。基本的なファジィフィルタリングでは、上述のように、全てのエッジ画素を、同一の広がりパラメータを有する同一のフィルタによりフィルタリングする。
反対に、偽である場合には、ステップ930により、分散値が22よりも小さく、かつ10以上であるかを判定する。真931である場合には、その画素は、おそらくリンギングノイズにより破壊されているため、大きな広がりパラメータ940(ξは30である)および大きなウィンドウサイズ941(Nは5×5である)を選択する。すなわち、強い平滑ファジィフィルタをフィルタリング970に用いて、リンギングアーチファクトを最大限に低減する。
反対に、偽である場合には、ステップ950により、分散が10以下であり、かつ4以上であるかを判定する。真951である場合には、対応する画素は「弱い」エッジ領域にあるか、リンギングノイズにより少し破壊されている可能性がある。この場合には、小さな広がりパラメータ960(ξは15である)および小さなウィンドウ961(Nは3×3である)、すなわち、弱い平滑ファジィフィルタをフィルタリング970に用いる。反対に、分散が4未満である場合には、その画素は、平滑領域にあるため、オールパスフィルタリングを適用し、次の画素を処理する。全ての画素を処理した後、フィルタリングされたブロックを出力し(980)、終了990まで次のブロック901を処理する。
分散、ウィンドウ、および広がりパラメータのさまざまな制限値、例えば(22,10,2)、(5,3)、および(30,15)は、異なる用途について変更できるが、依然として本発明の精神および範囲内にあることに留意すべきである。
デブロッキングの改善
従来のインタレースビデオでは、フレームに基づく符号化方式とフィールドに基づく符号化方式とを併用して単一のフレームを符号化することができる。これにより、アーチファクトの複雑性が高まる。より良好なアーチファクト除去および細部の保持を達成するために、本発明では、各ビデオフレームの2つのフィールドを別個に処理する。異なる方式を用いて縦方向および横方向のデブロッキングを行う。異なるウィンドウサイズを有する1Dの適応的ファジィフィルタを適用して、横方向および縦方向のブロッキングアーチファクトをそれぞれ除去する。
縦方向のブロッキングアーチファクトの検出
図10に示すように、縦方向のブロッキングアーチファクトの検出を、8×8の画素の行1011と交差する縦方向の各ブロック境界1010に沿って行う。画素強度の差G0を、G0=|x0−y7|により求める。次に、L1、L2、L3、L4およびR1、R2、R3、R4でそれぞれ示される、ブロック境界の左側および右側にある各隣接画素対の強度の差も求める。
max(L1,L2,L3,L4)<G0またはmax(R1,R2,R3,R4)<G0
である場合には、その行をマークし、その行に沿って境界ギャップを検出する。
行1011の8つの境界画素対すべてを、縦方向のブロック境界1010に沿って調べた後、マークされた行(すなわち境界ギャップ)の数が所定のしきい値TH1(例えばTH1=0)よりも大きい場合には、現在の縦方向のブロック境界においてブロッキングアーチファクトを検出し、この境界をまたいで1Dの適応的ファジィフィルタリングを行って縦方向のブロッキングアーチファクトを除去するか、またはフィルタリングを省略する。
縦方向のブロッキングアーチファクトの除去
図11に示すように、ブロック境界にまたがるマークされた行においてのみ1Dフィルタリングを行う。
MAX(L1,L2,L3,L4)<G0
である場合(境界ギャップが左側にある隣接画素間の差と比べて明らかであることを意味する)には、画素1111、すなわちy6、y7およびx0をフィルタリングする。同様に、
MAX(R1,R2,R3,R4)<G0
である場合には、画素1112、すなわちy7、x0およびx1をフィルタリングする。
境界の片側にある隣接画素対の強度差が境界ギャップよりも大きい場合(入力画像中のエッジにより生じる可能性が高い)には、境界ギャップはおそらく存在しないため、この側のおける行のフィルタリングは不要であることに留意されたい。これは、画像中のエッジを保持する一方で、エッジのように見えるブロッキングアーチファクトを依然としてフィルタリングすることにも役立つ。
1Dファジィフィルタ
縦方向のブロッキングアーチファクトの平滑化に用いるフィルタは、フィルタリングすべき各画素(例えばy6)を中心とする5タップファジィフィルタ1113である。このファジィフィルタは、ブロック境界に沿って位置する強いエッジを保持する。
ファジィフィルタの出力は、次のように表される。
Figure 2006148878
ここで、xは、フィルタウィンドウの中心画素であり、μ(・)は、以下のように定義される区分的線形関数である。
Figure 2006148878
横方向のブロッキングアーチファクトの検出
図12は、横方向のブロック境界1201と交差する画素列において横方向のブロッキングアーチファクトを検出する方法を示す。G0は、境界画素対の画像強度の差(すなわち、G0=|x0−y7|)であり、U1、U2、U3、U4およびB1、B2、B3、B4は、横方向の境界の上側および下側にある各隣接画素対の強度差である。GUL、GUR、GBLおよびGBRはそれぞれ、隣接する左上、右上、左下および右下の縦方向の境界における縦方向の境界ギャップの数である。
横方向のブロッキングアーチファクトの検出は、8×8ブロックの横方向の各境界に沿って行われる。本方法は、縦方向のブロッキングアーチファクトの検出に使用するものと同様であるが、横方向のブロッキングアーチファクトを特定する前に、追加条件を満たす必要がある。これらの条件を追加する理由は、ブロッキングアーチファクトをより正確に検出するとともに、ブロック境界に沿って存在する可能性がある画像中の横方向のエッジにまたがるフィルタリングを避けるためである。これらの本物のエッジをフィルタリングすると、目障りなアーチファクトが生じることになる。
先ず、縦方向の境界ギャップの検出および計数と同じ方法を用いて、横方向の境界ギャップを検出し計数する。しかし、今回は、全ての操作を、現在の横方向の境界にまたがる各列で行う。現在の横方向の境界に沿って検出される横方向の境界ギャップの数が所定のしきい値TH2(例えばTH2=5)未満である場合には、この境界にまたがるフィルタリングは行わない。そうでない場合には、現在の横方向の境界に隣接する4つの縦方向のブロック境界、すなわち、左上、右上、左下および右下の縦方向のブロック境界を調べて、現在の横方向の境界の周囲で大きな縦方向のブロッキングアーチファクトが生じているかどうかを確認する。
UL、GUR、GBL、GBRは、それぞれ、左上、右上、左下および右下の縦方向の境界において検出される境界ギャップの数を示すものとする。以下の条件のうち少なくとも1つが満たされる場合には、大きな縦方向のブロッキングアーチファクトも検出されているため、現在の横方向の境界において横方向のブロッキングアーチファクトが生じると仮定する。
条件
(GUL>TH2)かつ(GUR>TH2)
(GBL>TH2)かつ(GBR>TH2)
(GUL>7)または(GUR>7)または(GBL>7)または(GBR>7)
横方向の境界よりも先に縦方向の境界を処理するため、縦方向の各境界における縦方向の境界ギャップの数は既知である。
横方向のブロッキングアーチファクトの除去
図13に示すように、横方向のブロック境界にまたがるマークされた列においてのみ1Dフィルタリングを行う。MAX(U1,U2,U3,U4)<G0である場合(境界ギャップが上側にある隣接画素間の差と比べて明らかであることを意味する)には、画素1301、すなわちy6、y7をフィルタリングする。
同様に、MAX(B1,B2,B3,B4)<G0である場合には、画素1302、すなわちx0、x1をフィルタリングする。いずれの側でもx0とy7の両方をフィルタリングする縦方向の境界にまたがるフィルタリングとは異なり、いずれの側でも境界画素を1つ(x0またはy7)しかフィルタリングしないことに留意されたい。これにより、横方向のエッジにまたがるフィルタリングが低減される。横方向のブロッキングアーチファクトの平滑化に用いるフィルタは、フィルタリングすべき各画素を中心とする3タップファジィフィルタ1303である。フィルタの重みは、式(7)を用いて決定する。
ブロックの分類
上述のように、ブロックの分類により、全体的な画質を下げることなく局所アーチファクトを大幅に低減することができる。しかし、ブロックの分類が同様に役立つ画像化用途は、他にも多くある。例えば、ブロックが適切に分類されれば、異なるブロックに異なる圧縮率および圧縮技法を適用することによって、全体的により高い圧縮率を達成することができる。例えば、平滑ブロックにはより高い圧縮率およびより単純な圧縮技法を適用して、より複雑なテクスチャを有するブロックに追加の帯域幅およびより高度な圧縮を適用できるようにすることができる。同様に、先ず「関心の低い」ブロックを廃棄することによって、パターン認識およびオブジェクト追跡の効率を高めることができる。さらに、画像検索システムが、分類されたブロックを選択的に用いて、コンテンツの検索および閲覧を加速することができる。
したがって、本発明は、以下のブロック分類技法を提供する。
図14は、本発明によるブロック内の画素を分類する別の方法を示す。画像201は、上述のように、重複しない8×8のブロックに分割される。上述のように、分散画像401において、各画素の分散を求める。次に、最大の分散または標準偏差を有する画素を用いてブロックの分類を決める(分散=σであり、STD=√(分散)である)。
各ブロックを、5つのカテゴリ、すなわち、強いエッジ1401、弱いエッジ1402、強いテクスチャ1403、弱いテクスチャ1404、および平滑1405のうちの1つに分類する。
Figure 2006148878
ブロックのフィルタリング
プログレッシブビデオの場合には、各フレーム中の各ブロックについてフィルタリングを行い、インタレースビデオの場合には、各フィールド中のブロックに対してフィルタリングを行う。各ブロックのフィルタは、図14に示すように、ブロックの分類および隣接するブロックの分類に応じて選択される。さらに、フィルタリングは、フィルタの広がりパラメータが最大分散または最大標準偏差に比例する、すなわち、最大標準偏差が大きくなるほど広がりパラメータも大きくなるという点で適応的である。
強いエッジブロック1401:8つの近傍ブロック1421(上、下、左、右、左上、右上、左下、右下)がすべて強いエッジブロックである場合には、オールパスフィルタリング1461を行ってブロックを出力し(1442)、そうでない場合には、各画素を適応的ファジィフィルタにより、広がりパラメータξを20としてフィルタリング1423を行い(強い平滑ファジィフィルタリングである)、ブロックを出力する。
弱いエッジブロック1402:各画素を適応的ファジィフィルタにより、広がりパラメータξを10に設定してフィルタリング1431を行い(弱い平滑ファジィフィルタリングである)、ブロックを出力する。
強いテクスチャブロック1403:4つの隣接するブロック1441(上、下、左、右)がすべて強いエッジブロックである場合には、オールパスフィルタリングして出力する。そうでない場合には、各画素をファジィフィルタにより、広がりパラメータξを10に設定してフィルタリング1431を行う。
弱いテクスチャブロック1404:4つの隣接するブロックのうち少なくとも2つ1451(上、下、左、右)が平滑ブロックである場合には、各画素を適応的ファジィフィルタにより、広がりパラメータξを10に設定してフィルタリング1431を行う。
平滑ブロック1405:ブロックが平滑ブロックである場合には、オールパスフィルタ1461を適用し、ブロックを出力1442する。
図15Aに示すように、強いエッジブロック1501が他の強いエッジブロックに完全に囲まれている場合には、そのブロックのフィルタリングは、省略することができる。これは、大きな強いエッジ領域では、マスキング効果によりリンギングアーチファクトが顕著には現れないためである。第2に、小さなアーチファクトが顕著に現れるのは平滑領域のみであるため、弱いエッジブロック1502は、隣接する平滑ブロックがある場合にのみフィルタリングすればよい。テクスチャブロックにおけるフィルタリングは、オプションとしてもよく、圧縮率に応じて選択することができる。圧縮率が高い、例えば、量子化スケールパラメータが40を上回る場合には、復元されたテクスチャブロックにリンギングアーチファクトが現れる可能性が高い。したがって、弱い平滑ファジィフィルタリングを適用すべきである。
本発明を、好適な実施形態の例として説明してきたが、本発明の精神および範囲内でさまざまな他の適応および変更を行うことができることが理解される。したがって、添付の特許請求の範囲の目的は、本発明の真の精神および範囲に入る変形および変更をすべて網羅することである。
本発明による復元画像からアーチファクトを除去する方法およびシステムのブロック図である。 本発明による画素値の類似性を評価しファジィフィルタパラメータを生成するガウス関数のグラフである。 本発明による特徴部抽出のブロック図である。 本発明による強度画像と分散の間のマッピングのブロック図である。 本発明による画素を分類するブロック図である。 本発明によるブロッキングアーチファクトを検出するブロック図である。 本発明によるブロッキングアーチファクトをフィルタリングするブロック図である。 本発明によるファジィフィルタのデータに適応的な平滑化特性を示すグラフである。 本発明による適応的フィルタリングのフローチャートである。 縦方向のブロッキングアーチファクトの検出のブロック図である。 縦方向のブロッキングアーチファクトの除去のブロック図である。 横方向のブロッキングアーチファクトの検出のブロック図である。 横方向のブロッキングアーチファクトの除去のブロック図である。 本発明による画素の分類およびフィルタリングのフローチャートである。 8つの隣接するエッジブロックに囲まれたエッジブロックのブロック図である。 少なくとも2つの平滑ブロックに囲まれたエッジブロックのブロック図である。

Claims (17)

  1. 画像中の画素を分類する方法であって、
    入力画像中の複数の画素を複数のブロックに分割することと、
    各画素の強度の分散を求めることと、
    各ブロックにおいて、最大分散を有する特定の画素を特定することと、および
    前記最大分散に応じて各ブロックを複数のクラスのうちの1つに分類することと
    を含む画像中の画素を分類する方法。
  2. 前記複数のクラスは、エッジブロック、テクスチャブロック、および平滑ブロックを含む請求項1に記載の方法。
  3. 前記エッジブロックは、強いエッジブロックおよび弱いエッジブロックを含み、前記テクスチャブロックは、強いテクスチャブロックおよび弱いテクスチャブロックを含む請求項2に記載の方法。
  4. 各最大分散から最大標準偏差を求めることと、
    特定のブロックを分類することであって、
    前記最大標準偏差が[40,+∞)である場合に強いエッジブロック、
    前記最大標準偏差が[20,40)である場合に弱いエッジブロック、
    前記最大標準偏差が[10,20)である場合に強いテクスチャブロック、
    前記最大標準偏差が[5,10)である場合に弱いテクスチャブロック、および
    前記最大標準偏差が[0,5)である場合に平滑ブロック
    として分類することと
    をさらに含む請求項1に記載の方法。
  5. 各強いエッジブロックについて、該強いエッジブロックの8つの隣接するブロックもまた強いエッジブロックであるかどうかを判定し、真である場合には、該強いエッジブロックの画素をオールパスフィルタによりフィルタリングし、反対に偽である場合には、該強いエッジブロックの画素を強い平滑ファジィフィルタによりフィルタリングすることと、
    各弱いエッジブロックの画素を弱い平滑ファジィフィルタによりフィルタリングすることと、
    各強いテクスチャブロックについて、4つの隣接するブロックが強いエッジブロックであるかどうかを判定し、真である場合には、該強いテクスチャブロックの画素を前記オールパスフィルタによりフィルタリングし、反対に偽である場合には、該強いテクスチャブロックの画素を前記弱い平滑ファジィフィルタによりフィルタリングすることと、
    各弱いテクスチャブロックについて、少なくとも2つの隣接するブロックが平滑ブロックであるかどうかを判定し、真である場合には、該弱いテクスチャブロックの画素を前記弱い平滑ファジィフィルタによりフィルタリングし、反対に偽である場合には、該弱いテクスチャブロックの画素を前記オールパスフィルタによりフィルタリングすることと、
    各平滑ブロックの画素を前記オールパスフィルタによりフィルタリングすることと
    をさらに含む請求項3に記載の方法。
  6. 前記フィルタリングすることは、前記強い平滑ファジィフィルタの場合に前記ウィンドウのサイズNおよび前記広がりパラメータξは比較的大きく、前記弱い平滑ファジィフィルタの場合に前記ウィンドウのサイズNおよび前記広がりパラメータξは比較的小さくなるようにして、フィルタリングすべき各画素を中心とする画素ウィンドウに、ξを広がりパラメータとする
    Figure 2006148878
    のガウス関数を適用することをさらに含む請求項5に記載の方法。
  7. 前記強い平滑ファジィフィルタの場合に、Nは5×5、ξは20であり、前記弱い平滑ファジィフィルタの場合に、Nは3×3、ξは10である請求項6に記載の方法。
  8. 分類された各ブロックを該ブロックの該分類に応じてフィルタリングすることをさらに含む請求項1に記載の方法。
  9. 前記フィルタリングすることは、前記分類されたブロックの前記最大分散に比例する広がりパラメータを有するガウス関数を用いる請求項8に記載の方法。
  10. 前記入力画像は、圧縮画像から得られ、前記フィルタリングすることは、該圧縮画像の圧縮に用いられた圧縮比に選択的に依存する請求項7に記載の方法。
  11. 前記入力画像は、圧縮画像から得られ、該圧縮画像は、ブロックに基づく圧縮を用いて生成される請求項1に記載の方法。
  12. 前記入力画像は、複数の画像のビデオシーケンスから得られる請求項1に記載の方法。
  13. 前記ビデオは、圧縮ビデオから得られ、該圧縮ビデオは、ブロックに基づく圧縮を用いて生成される請求項11に記載の方法。
  14. 前記分類されたブロックを該分類に応じて圧縮することをさらに含む請求項1に記載の方法。
  15. 前記分類されたブロックに対して該分類に応じてパターン認識を行うことをさらに含む請求項1に記載の方法。
  16. 前記分類されたブロックに対して該分類に応じてオブジェクト追跡を行うことをさらに含む請求項1に記載の方法。
  17. 前記分類されたブロックに対して該分類に応じて画像検索を行うことをさらに含む請求項1に記載の方法。
JP2005300374A 2004-10-14 2005-10-14 画像中の画素を分類する方法 Pending JP2006148878A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US10/964,756 US7346224B2 (en) 2003-11-07 2004-10-14 System and method for classifying pixels in images

Publications (1)

Publication Number Publication Date
JP2006148878A true JP2006148878A (ja) 2006-06-08

Family

ID=36627987

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005300374A Pending JP2006148878A (ja) 2004-10-14 2005-10-14 画像中の画素を分類する方法

Country Status (1)

Country Link
JP (1) JP2006148878A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008084745A1 (ja) * 2007-01-09 2008-07-17 Panasonic Corporation 画像符号化装置および画像復号化装置
WO2009133844A1 (ja) * 2008-04-30 2009-11-05 株式会社 東芝 エッジを考慮したフィルタリング機能を備えた動画像符号化/復号化方法及び装置
WO2012035746A1 (ja) * 2010-09-17 2012-03-22 日本電気株式会社 映像符号化装置および映像復号装置
JPWO2011158657A1 (ja) * 2010-06-17 2013-08-19 シャープ株式会社 画像フィルタ装置、復号装置、符号化装置、および、データ構造
WO2015015681A1 (ja) * 2013-07-31 2015-02-05 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 画像符号化方法および画像符号化装置
JP2018033181A (ja) * 2009-03-12 2018-03-01 トムソン ライセンシング デイーテイーヴイー アーティファクト除去フィルタリングのための領域ベースのフィルタ・パラメータの選択を行う方法および装置
JP7393769B2 (ja) 2018-07-11 2023-12-07 ヴィリニュス ウニヴェルシテタス 生物学的サンプルの画像に対するコンピュータ実装プロセス

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0326081A (ja) * 1989-06-23 1991-02-04 Nec Home Electron Ltd 高能率画像符号化装置
JPH05290094A (ja) * 1992-04-08 1993-11-05 Mitsubishi Electric Corp 画像の類似色調検索装置
JPH0678290A (ja) * 1992-08-27 1994-03-18 Toshiba Corp 画像符号化装置
JPH06343169A (ja) * 1993-06-01 1994-12-13 Sharp Corp 画像信号復号器
JPH07212759A (ja) * 1994-01-27 1995-08-11 Sharp Corp 画像信号復号器
JPH08116450A (ja) * 1994-10-17 1996-05-07 Fuji Xerox Co Ltd 画像圧縮装置および画像伸長装置
JPH08190628A (ja) * 1994-08-25 1996-07-23 Sgs Thomson Microelettronica Spa 画像ノイズ低減のためのファジー論理装置
JPH08317255A (ja) * 1995-05-19 1996-11-29 Nec Corp 画質改善方法および画質改善装置
JPH0965330A (ja) * 1995-08-18 1997-03-07 Fuji Xerox Co Ltd 画像処理装置
JPH09130791A (ja) * 1995-10-27 1997-05-16 Toshiba Corp 画像処理装置
JPH09200760A (ja) * 1995-11-01 1997-07-31 Samsung Electron Co Ltd 映像符号化装置における量子化間隔決定方法及び回路
JP2000339470A (ja) * 1999-05-31 2000-12-08 Ricoh Co Ltd パターン辞書作成方法及び装置、パターン認識方法及び装置、並びに、記録媒体
JP2002535896A (ja) * 1999-01-15 2002-10-22 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 鮮明度を向上させる方法および装置
JP2002335409A (ja) * 2002-03-06 2002-11-22 Sharp Corp 画像符号化装置、画像復号化装置及びコンピュータ読み取り可能な記録媒体

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0326081A (ja) * 1989-06-23 1991-02-04 Nec Home Electron Ltd 高能率画像符号化装置
JPH05290094A (ja) * 1992-04-08 1993-11-05 Mitsubishi Electric Corp 画像の類似色調検索装置
JPH0678290A (ja) * 1992-08-27 1994-03-18 Toshiba Corp 画像符号化装置
JPH06343169A (ja) * 1993-06-01 1994-12-13 Sharp Corp 画像信号復号器
JPH07212759A (ja) * 1994-01-27 1995-08-11 Sharp Corp 画像信号復号器
JPH08190628A (ja) * 1994-08-25 1996-07-23 Sgs Thomson Microelettronica Spa 画像ノイズ低減のためのファジー論理装置
JPH08116450A (ja) * 1994-10-17 1996-05-07 Fuji Xerox Co Ltd 画像圧縮装置および画像伸長装置
JPH08317255A (ja) * 1995-05-19 1996-11-29 Nec Corp 画質改善方法および画質改善装置
JPH0965330A (ja) * 1995-08-18 1997-03-07 Fuji Xerox Co Ltd 画像処理装置
JPH09130791A (ja) * 1995-10-27 1997-05-16 Toshiba Corp 画像処理装置
JPH09200760A (ja) * 1995-11-01 1997-07-31 Samsung Electron Co Ltd 映像符号化装置における量子化間隔決定方法及び回路
JP2002535896A (ja) * 1999-01-15 2002-10-22 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 鮮明度を向上させる方法および装置
JP2000339470A (ja) * 1999-05-31 2000-12-08 Ricoh Co Ltd パターン辞書作成方法及び装置、パターン認識方法及び装置、並びに、記録媒体
JP2002335409A (ja) * 2002-03-06 2002-11-22 Sharp Corp 画像符号化装置、画像復号化装置及びコンピュータ読み取り可能な記録媒体

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008084745A1 (ja) * 2007-01-09 2008-07-17 Panasonic Corporation 画像符号化装置および画像復号化装置
WO2009133844A1 (ja) * 2008-04-30 2009-11-05 株式会社 東芝 エッジを考慮したフィルタリング機能を備えた動画像符号化/復号化方法及び装置
JP2018033181A (ja) * 2009-03-12 2018-03-01 トムソン ライセンシング デイーテイーヴイー アーティファクト除去フィルタリングのための領域ベースのフィルタ・パラメータの選択を行う方法および装置
JP2019198114A (ja) * 2010-06-17 2019-11-14 シャープ株式会社 復号装置、符号化装置、復号方法および符号化方法
JPWO2011158657A1 (ja) * 2010-06-17 2013-08-19 シャープ株式会社 画像フィルタ装置、復号装置、符号化装置、および、データ構造
JP2020191690A (ja) * 2010-06-17 2020-11-26 シャープ株式会社 復号装置、符号化装置、復号方法および符号化方法
JP2017085674A (ja) * 2010-06-17 2017-05-18 シャープ株式会社 画像フィルタ装置、復号装置、符号化装置、および、データ構造
JP2018157596A (ja) * 2010-06-17 2018-10-04 シャープ株式会社 画像フィルタ装置、復号装置、符号化装置、および、データ構造
WO2012035746A1 (ja) * 2010-09-17 2012-03-22 日本電気株式会社 映像符号化装置および映像復号装置
CN103109531A (zh) * 2010-09-17 2013-05-15 日本电气株式会社 视频编码设备和视频解码设备
JP5807639B2 (ja) * 2010-09-17 2015-11-10 日本電気株式会社 映像符号化装置および映像復号装置
CN103109531B (zh) * 2010-09-17 2016-06-01 日本电气株式会社 视频编码设备和视频解码设备
JPWO2015015681A1 (ja) * 2013-07-31 2017-03-02 サン パテント トラスト 画像符号化方法および画像符号化装置
US10212455B2 (en) 2013-07-31 2019-02-19 Sun Patent Trust Image coding method and image coding apparatus
US10666980B2 (en) 2013-07-31 2020-05-26 Sun Patent Trust Image coding method and image coding apparatus
WO2015015681A1 (ja) * 2013-07-31 2015-02-05 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 画像符号化方法および画像符号化装置
JP7393769B2 (ja) 2018-07-11 2023-12-07 ヴィリニュス ウニヴェルシテタス 生物学的サンプルの画像に対するコンピュータ実装プロセス

Similar Documents

Publication Publication Date Title
US7551792B2 (en) System and method for reducing ringing artifacts in images
US7346224B2 (en) System and method for classifying pixels in images
US7412109B2 (en) System and method for filtering artifacts in images
US7822286B2 (en) Filtering artifacts in images with 3D spatio-temporal fuzzy filters
US20050100235A1 (en) System and method for classifying and filtering pixels
Maggioni et al. Video denoising, deblocking, and enhancement through separable 4-D nonlocal spatiotemporal transforms
Konstantinides et al. Noise estimation and filtering using block-based singular value decomposition
Meier et al. Reduction of blocking artifacts in image and video coding
EP1146748B1 (en) A method of directional filtering for post-processing compressed video
KR101112139B1 (ko) 부호화된 영상의 확대비 및 노이즈 강도 추정장치 및 방법
WO2004038648A9 (en) Method and decoder system for reducing quantization effects of a decoded image
JPH08186714A (ja) 画像データのノイズ除去方法及びその装置
Kong et al. Edge map guided adaptive post-filter for blocking and ringing artifacts removal
JP2006148878A (ja) 画像中の画素を分類する方法
JP4850475B2 (ja) 画像中の画素をフィルタリングする方法
JP2005318614A (ja) 入力画像中のアーチファクトを低減する方法
KR100683060B1 (ko) 영상 프레임의 블록화 현상 제거 장치 및 그 방법
JP2009095004A (ja) 画像シーケンス中の画素をフィルタリングする方法
KR100669905B1 (ko) 블록 경계 영역 특성을 이용한 블록화 현상 제거 장치 및그 방법
Young et al. Psychovisually tuned attribute operators for pre-processing digital video
JP4065287B2 (ja) 画像データのノイズ除去方法及びその装置
Kim et al. Signal adaptive postprocessing for blocking effects reduction in JPEG image
Kong et al. Adaptive fuzzy post-filtering for highly compressed video
Oh et al. Film grain noise modeling in advanced video coding
US20100002147A1 (en) Method for improving the deringing filter

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080808

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110510

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110517

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110614

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110823