JP2010003298A - 画像フィルタリング方法 - Google Patents
画像フィルタリング方法 Download PDFInfo
- Publication number
- JP2010003298A JP2010003298A JP2009139014A JP2009139014A JP2010003298A JP 2010003298 A JP2010003298 A JP 2010003298A JP 2009139014 A JP2009139014 A JP 2009139014A JP 2009139014 A JP2009139014 A JP 2009139014A JP 2010003298 A JP2010003298 A JP 2010003298A
- Authority
- JP
- Japan
- Prior art keywords
- filter
- histogram
- pixel
- response
- bilateral
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 238000001914 filtration Methods 0.000 title claims description 32
- 230000004044 response Effects 0.000 claims abstract description 44
- 238000012545 processing Methods 0.000 claims abstract description 14
- 230000002146 bilateral effect Effects 0.000 claims description 65
- 238000004364 calculation method Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 238000010606 normalization Methods 0.000 description 5
- 238000009472 formulation Methods 0.000 description 4
- 239000000203 mixture Substances 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000009499 grossing Methods 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013476 bayesian approach Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000002945 steepest descent method Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/20—Image enhancement or restoration using local operators
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20024—Filtering details
- G06T2207/20028—Bilateral filtering
Landscapes
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Image Processing (AREA)
- Picture Signal Circuits (AREA)
Abstract
【課題】フィルタ半径が変化しても処理時間が変わらないフィルタを提供する。
【解決手段】強度を有する複数の画素を含む入力画像から積分ヒストグラムを構築する(310)ステップと、各画素に対して空間フィルタ330を積分ヒストグラムに適用して局所ヒストグラムを生成する(303)ステップと、各局所ヒストグラムのビン毎に画素の強度をビンの各インデックスから減算する(340)ステップと、ビン毎にレンジフィルタ341を各差分値に適用して応答を生成する(350)ステップと、各応答を対応する係数によってスケーリングする(360)ステップと、局所ヒストグラム毎にスケーリングされた応答を総和する(370)ステップと、局所ヒストグラム毎に係数を総和する(380)ステップと、画素毎に局所応答を係数の和で除算する(390)ステップとを含む。
【選択図】図3
【解決手段】強度を有する複数の画素を含む入力画像から積分ヒストグラムを構築する(310)ステップと、各画素に対して空間フィルタ330を積分ヒストグラムに適用して局所ヒストグラムを生成する(303)ステップと、各局所ヒストグラムのビン毎に画素の強度をビンの各インデックスから減算する(340)ステップと、ビン毎にレンジフィルタ341を各差分値に適用して応答を生成する(350)ステップと、各応答を対応する係数によってスケーリングする(360)ステップと、局所ヒストグラム毎にスケーリングされた応答を総和する(370)ステップと、局所ヒストグラム毎に係数を総和する(380)ステップと、画素毎に局所応答を係数の和で除算する(390)ステップとを含む。
【選択図】図3
Description
本発明は、包括的には画像のフィルタリングに関し、特に、一定のO(1)時間でのバイラテラルフィルタを用いる画像のフィルタリングに関する。
バイラテラルフィルタは、空間領域及び強度領域において画像に適用される非線形フィルタである。高速バイラテラルフィルタは、多くのコンピュータビジョン用途に重要である。非線形フィルタを分離可能な一次元フィルタ又はカスケード表現に分解して処理時間を短縮するいくつかの方法が知られている。これは、2Dフィルタカーネルの固有値展開、又は特異値分解(SVD)の適用を用いることによって行うことができる。いくつかの方法は、並列処理及び再構成可能ハードウェアを役立てようとする。
バイラテラルフィルタは、エッジの細部を保ちながら画像を平滑化する非反復的な手段である。フィルタリングは加重重畳を含み、各画素の重みは中心画素からの距離だけでなく強度にも依存する。ベイズ手法もまたバイラテラルフィルタの中核にあり、対角正規化された(diagonal normalized)最急降下法の非反復処理(a single iteration)として説明される。
バイラテラルフィルタの基本的な特性は、(空間)フィルタ半径rの関数としての画素当たりの処理時間である。これは、フィルタ半径(又はカーネルサイズ)の変化に伴う方法の性能に対応する。この性能は、バイラテラルフィルタリング方法の中の主な差別化特徴である。
空間・レンジ統合フィルタリングにより、バイラテラルフィルタは計算量が多くなる。参考のために、総当たり実施は、指数関数的なO(r2)時間で各出力画素を計算する可能性があり、中程度のフィルタ半径でも非現実的となる。既知のPhotoshop(著作権)CS2の表面ぼかしの実施はバイラテラルフィルタであり、メディアンフィルタに用いられる行列ヒストグラムと同様の線形のO(r)時間特性を有する。
バイラテラルフィルタは、離散的強度カーネルを用いて画像のサブサンプリングされたコピーをフィルタリングし、線形補間を用いてフィルタ応答を結合することによって近似することができる。言い換えれば、この方法は、強度画像を3D表面として扱い、二値の強度変調された表面にガウシアン平滑化を適用し、強度を除算して、元の表面位置におけるフィルタリングされた強度値を求める。この方法は、半径が大きいほど表面のサブサンプリング比率が高くなるため高速になる。正確な出力は、サブサンプリンググリッドの位相に依存する。しかし、打ち切りを行うと、特に高ダイナミックレンジ(HDR)画像で精度が失われることになる。
最も高速な従来技術のバイラテラルフィルタの実施の中の1つは、対数O(log r)時間に収束する(参照により本明細書中に援用される非特許文献1を参照)。その方法は、層に基づく手法において部分分布ヒストグラムの階層を用いる。複雑度は低下しているが、比較的小さなフィルタサイズ及びヒストグラムカウントに特有の実施要件により単純性は失われている。その方法は、矩形の空間カーネル及びボックスフィルタに限定される。別の懸念は、その空間ボックスフィルタの不完全な周波数応答である。
Weiss著「Fast median and bilateral filtering」(Proc. SIGGRAPH, pages 519-526 2006)
本発明の実施の形態は、サンプリングなしで一定のO(1)時間でのバイラテラルフィルタリングを可能にする。本明細書中で定義するように、一定時間は、フィルタ半径が変化してもフィルタリングの処理時間は同じであり続けることを意味する。
本発明の一実施の形態は積分ヒストグラムを利用して、空間カーネル及びレンジカーネルを用いるバイラテラルフィルタの冗長演算を避ける。
多項式型空間カーネル及びレンジカーネルによって構築されるバイラテラルフィルタの場合、別の実施の形態が、線形フィルタを画像パワーに適用することによって直接定式化を行う。
別の実施の形態によれば、フィルタ応答の顕著な低下なく、任意の空間フィルタ及びガウシアン型レンジフィルタがテイラー級数により線形フィルタとして表される。
これらの実施の形態は全て、処理時間を一定時間、例えば1MBの画像につき0.3秒に大幅に削減する一方で、45dBを超す非常に高いピーク信号対雑音比(PSNR)を達成する。計算上の利点に加え、本発明の方法は実施が簡単である。
本発明のフィルタリング方法はこれまでに開発されてきた中で最も効率的なバイラテラルフィルタであると考えられる。これは、本方法は、カーネル半径が大きくなるにつれて複雑度が増すものよりも性能が高いことを意味する。画像がより高解像度になり、それに対応してより大きなカーネル半径が必要となる傾向を考えると、大きなカーネルを用いて小さなカーネルと同じくらい高速にフィルタリングを行う点で本方法は有利となる。
積分ヒストグラムは入力画像から構築され、この積分ヒストグラムは、任意のレンジ関数により強度差に重み付けすることができる均一領域のカーネルを有する矩形ボックスフィルタのバイラテラル重畳応答を求めるために用いられる。積分ヒストグラムは、所与の画像における全ての考え得るカーネルのヒストグラムの構築を可能にする。本方法は、デカルト座標系における画素の空間的位置付けを利用し、原点画素から開始し残りの画素を走査線に沿ってジグザグ順に横断して集約関数を伝播する。
画像ウインドウのヒストグラムは、一つ一つの画素に対して別個のヒストグラムを再構築することなく、それらのウインドウの角の画素における積分ヒストグラム値を用いることによって構築することができる。
任意領域のカーネルに対するより一般的なガウシアン型レンジ関数及び多項式型レンジ関数に関しては、対応するノルムのテイラー級数展開が用いられる。これは、複雑度を増すことなくバイラテラルフィルタリングに「あらゆる」空間カーネルを使用できるようにする。このようなバイラテラルフィルタは、パワー画像に適用される線形空間フィルタで表すことができる。
本発明の実施の形態は、フィルタの半径に関係なく一定時間でのバイラテラルフィルタリングを可能にする方法を提供する。
バイラテラルフィルタリング
フィルタfはd次元のデカルト空間
フィルタfはd次元のデカルト空間
において定義される写像である。このフィルタは、N1,...,Nd及び0≦xi<Ni内を境界とする入力画像Iの各画素p=[x1,...,xd]にm次元の応答ベクトル(応答)y(p)=[y1,...,ym]を割り当てる。
通常、台S(サポートS)の領域内の小さな画素集合のみを用いてフィルタ応答が求められる。画素pを中心とする台の領域はフィルタのフットプリント又はカーネルと呼ばれる。一般性を失うことなく、画素集合はスカラー値に対応する。すなわち、m=1であり、y(p)=y1である。例示的な一実施形態は、単一のチャネル画像フィルタリング(d=2,m=1)を用いる。しかし、本方法は、より高い次元、カラー画像及び時間的なビデオのフィルタリングに拡張することができる。
画像画素pを中心とする2D画像フィルタが、係数f(k)をその下にある、カーネルk=[kx,ky]∈S内の画像画素k+pの値に適用する。
矩形カーネルの場合、中心画素の座標は原点として割り当てることができる。すなわち、S:−r/2≦kx,ky≦r/2であり、ここで、rはフィルタの半径である。係数の値が空間的な位置のみに依存する場合、フィルタは空間フィルタに該当する。
フィルタが線形演算子により、例えばカーネルに対する行列の乗算として表される場合、そのフィルタは線形である。例えば、2Dのガウシアン平滑化演算子は、中心画素からの空間的距離に応じて係数の値が変化する線形フィルタである。上記の表記が与えられると、空間フィルタの応答は次式のように表すことができる。
ここで、κ=Σf(k)は、バイアスを防ぐためのスカラー項である。なお、上記の式はf及びIの重畳と同じである。簡潔にするために、フィルタは正規化されることが多い。すなわち、Σf(k)=1となる。
図1に示すように、本発明の一実施形態によるバイラテラルフィルタ101は、空間フィルタ102及びレンジフィルタ103を結合する。空間フィルタのベクトル係数は中心画素111への距離に応じて変化し、レンジフィルタg(p,k)のベクトル係数は、中心への空間的距離ではなく、カーネル112内の中心画素と残りの画素との間の強度差103に応じて変化する。レンジフィルタは強度差の関数、すなわち、g(I(p)−I(p+k))である。
言い換えれば、バイラテラルフィルタは、カーネルS内の画像画素の強度値に、対応する空間フィルタ係数f(k)及びレンジフィルタ係数g(p,k)を乗算する。したがって、バイラテラルフィルタの応答は、
となり、ここで、正規化項
は強度差のスカラー関数である。レンジフィルタは、入力画像の各画素において異なる値を持ち得る。空間フィルタとは異なり、正規化項κbは一定でない。
上記のレンジフィルタリングの特性により、バイラテラルフィルタは非線形フィルタである。このフィルタの応答は、単純な行列の乗算では得ることができない。これが、従来のバイラテラルフィルタの計算量が多い主な理由である。
本発明の目的は、バイラテラルフィルタリングをフィルタの半径(サイズ)とは関係なく一定のO(1)時間で行うことである。
空間フィルタを用いるバイラテラルフィルタリング
式(2)は、一定の空間フィルタf(k)=c(ボックスフィルタ)及び任意のレンジフィルタg(p,k)を有するバイラテラルフィルタ(タイプIのバイラテラルフィルタと呼ぶことがある)用に
式(2)は、一定の空間フィルタf(k)=c(ボックスフィルタ)及び任意のレンジフィルタg(p,k)を有するバイラテラルフィルタ(タイプIのバイラテラルフィルタと呼ぶことがある)用に
及び
のように書き換えることができる。
この応答は、対応するカーネルの積分ヒストグラムhから、
及び
のように直接求めることができ、ここで、レンジ関数は、直接の強度差ではなくヒストグラムのビン値にわたって蓄積される。
本明細書中で説明するように、この定式はカーネル半径rに依存しない。1つの利点として、全てのスカラー項を積分ヒストグラムから一定時間で並列処理することができる。さらに、ガウシアンフィルタ関数及びより複雑なフィルタ関数を含む任意のレンジフィルタgを用いることができる。
Weiss(上記を参照)は、タイプIのバイラテラルフィルタ(空間ボックス、任意レンジ)の処理時間をO(log r)として与える。Weissのフィルタは、妥当な性能を得るために半径rが128未満に略限定されている。本発明の方法はこれを画像サイズまでのあらゆる半径rに関して一定時間O(1)に削減する。
この一定時間フィルタは、最も高速な既知のバイラテラルフィルタと考えられる。
任意の空間フィルタを用いるバイラテラルフィルタリング
積分ヒストグラムの定式は、変化する空間フィルタを有するバイラテラルフィルタには適用することができない。多項式型レンジフィルタは
積分ヒストグラムの定式は、変化する空間フィルタを有するバイラテラルフィルタには適用することができない。多項式型レンジフィルタは
であり、ここで、nは多項式の次数である。n=1の場合、対応するバイラテラルフィルタ(タイプIIのフィルタと呼ばれる)を式(2)から次のように得ることができる。
n個の画像から成る集合はI1=I(p),I2=I(p)I(p),...,(I(p))nとして示され、対応するフィルタ応答は次のようになる。
式(7)は次のように書き換えることができる。
ここで、インデックスpは簡潔にするために式の右辺から省かれる。
同様に、正規化項は次のようになる。
なお、空間フィルタfに制約はなく、任意の所望のフィルタ関数を選択することができる。
二次多項式関数(n=2)の場合(図4を参照)、式(2)のタイプIIのバイラテラルフィルタの応答は
となり、ここで、
である。
式(8)及び式(9)は、多項式型レンジフィルタを用いる対応するバイラテラルフィルタのパラメータを、空間フィルタに関して近似を用いることなく与える。
別の一般的なタイプのバイラテラルフィルタであるタイプIIIは、さらなる平滑性のためにガウシアン型レンジフィルタパラメータ511を用いる(図5を参照)。この実施形態において、ガウシアン関数のテイラー級数展開がこのようなバイラテラルフィルタを近似する。この方法もやはり、空間フィルタfに対する制約はない。ガウシアンフィルタは微分可能であり、一次変換で表すことができる。
ガウシアンレンジフィルタは
であり、ここで、αは定数である。
式(10)は次のように書くことができる。
ここで、第一項
はカーネル内で変化しない。この項は正規化項にも現れるため、別個に求める必要はない。
テイラー展開を式(11)に適用することによって、バイラテラルフィルタの展開を次式のように二次導関数まで得ることができ、
また、次式のように三次導関数まで得ることができる。
ここで、正規化項は、同一項を含む同様の形を有する。
したがって、バイラテラルフィルタは、原画像のパワーの空間フィルタリングされた応答の加重和として解釈することができる。
一定O(1)時間バイラテラルフィルタ
2Dの線形空間フィルタ応答を求める方法には様々なものがある(図3〜図5を参照)。「移動平均」としても知られる空間ボックスフィルタ330は、全てのカーネル係数が等しい矩形カーネルを有する単純な線形フィルタである。このフィルタは、積分ヒストグラム310を用いることによって一定のO(1)時間でも求めることができる。
2Dの線形空間フィルタ応答を求める方法には様々なものがある(図3〜図5を参照)。「移動平均」としても知られる空間ボックスフィルタ330は、全てのカーネル係数が等しい矩形カーネルを有する単純な線形フィルタである。このフィルタは、積分ヒストグラム310を用いることによって一定のO(1)時間でも求めることができる。
積分画像
積分画像IΣは入力画像における画素強度の累積和である。任意の画像領域の和ΣI(p)は、画像領域の角の画素p++、p−+、p+−、p−−における積分画像の画素強度値を含む3回の算術演算、例えば、
積分画像IΣは入力画像における画素強度の累積和である。任意の画像領域の和ΣI(p)は、画像領域の角の画素p++、p−+、p+−、p−−における積分画像の画素強度値を含む3回の算術演算、例えば、
によって求められる。
三角フィルタ、例えば、ランプフィルタ、バートレットフィルタ又は多項式フィルタを、同一半径を有する2つのボックスフィルタの重ね合わせとして構築することができる。ランプフィルタの計算量はボックスフィルタの計算量の2倍である。したがって、ランプフィルタもまた一定のO(1)時間で適用することができ、結果はガウシアンフィルタに視覚的に非常に似ている。
多項式フィルタf(k)=1−knの応答もまた、積分画像の集合を用いて一定のO(1)時間で求めることができる。距離二乗ノルムは次式のようになる。
ここで、Szは画素z−pを中心とする新たなカーネルである。和ΣI(z)、ΣzI(z)、Σz2I(z)は、対応する積分画像から直接求めることができる。これらの和は、積分画像における矩形領域の角の画素における一定数の演算しか必要としないため、全処理時間は領域サイズに関係ない。複雑性はここでも一定のO(1)時間である。これは、双一次補間フィルタにも有効である。
他の線形空間フィルタは、高速フーリエ変換(FFT)によって一定時間で求めることができる。基礎となるFFTの画素毎の計算量は画像のサイズのみに依存する。入力画像毎に、所定の重畳カーネルサイズから開始して、FFTに基づく重畳は単純な実施よりも有利である。正方形カーネル上のガウシアンフィルタは分離可能である、すなわち、2Dフィルタは1Dフィルタの集合に分解することができる。
フィルタ半径rが比較的小さく、例えば50画素未満である場合、フィルタ応答を求める最も高速な方法は、直接的な1D重畳によるものである。フィルタの対称性を利用して、乗算の回数を2分の1に削減することができる。フィルタ半径が比較的大きい場合、直接重畳は時間がかかるため、FFTに基づく重畳が最良の選択である。
一定の時間処理を保証するために、分離可能な1Dの線形空間フィルタが、十分に正確な15個の非対称タップ(すなわち、中心ほどタップが多い)でサブサンプリングされる。
積分ヒストグラム
積分画像を用いて、可変の矩形画像領域にわたって局所ヒストグラムを求めることができる(F. Porikli著「Integral histogram: A fast way to extract histograms in Cartesian spaces」(Conference on Computer Vision and Pattern Recognition (CVPR), 2005)、及びPorikliによって2005年2月7日に出願された米国特許出願第11/052,598号明細書「Method for Extracting and Searching Integral Histograms of Data Samples」、いずれも参照により本明細書中に援用される)。
積分画像を用いて、可変の矩形画像領域にわたって局所ヒストグラムを求めることができる(F. Porikli著「Integral histogram: A fast way to extract histograms in Cartesian spaces」(Conference on Computer Vision and Pattern Recognition (CVPR), 2005)、及びPorikliによって2005年2月7日に出願された米国特許出願第11/052,598号明細書「Method for Extracting and Searching Integral Histograms of Data Samples」、いずれも参照により本明細書中に援用される)。
図2及び図3に示すように、積分ヒストグラムは画像画素列における画素毎のヒストグラムの伝播を含み、それに続く複数のヒストグラムのインタセクション(横断)により、任意の(矩形)領域の局所ヒストグラムが求められる。
画素列p0,p1,...,pmに沿ったm番目の位置における現画像画素201における積分ヒストグラムH(pm,b)(ここでb=1,...,B)は次のように定義される。
ここで、Q(.)205は現画素201の対応するビンである。各ビンは、特定の強度範囲にある画素数を示す係数と、この係数に対するインデックスとを格納する。式(14)の和集合演算子は次のように定義される。H(pm,b)のビンbの係数値は、ジグザグ順220で以前に処理された画素210のヒストグラムビンの係数値の和、すなわち、j<mである間の全てのQ(I(pj))の和に等しい。言い換えれば、H(pm,b)は原点250と現画素201
との間の領域のヒストグラムである。
積分ヒストグラムH(pN,b)は、pN=[N1,N2]が入力画像中の最後(左下隅)の画素であるため、全ての画素のヒストグラムに等しい。したがって、積分ヒストグラムは、原点(左上隅)の画素250に関して全てのビンが空であることを意味する初期条件H(0,0,b)=0を用いて再帰的に次のように表すことができる。
ジグザグ走査220は、左、上、及び左上の近傍が走査された画素に関して積分ヒストグラムの更新を必要とする。現画素における積分ヒストグラム214は、各ビンにつき3回の算術演算によって、図2に示すように3近傍の積分ヒストグラム値211〜213を用いて得られる。前画素の積分ヒストグラム値は伝播前に現画素にコピーされる。
領域Tのヒストグラムは、その領域の境界画素
における伝播した積分ヒストグラム値を用いて次のように求めることができる。
従来のヒストグラム計算とは対照的に、積分ヒストグラム方法は、考え得る領域毎にヒストグラムの抽出を繰り返さないため、ヒストグラムの抽出はフィルタカーネルのサイズrに依存しない。したがって、処理時間はあらゆるフィルタサイズに対して一定である。
なお、積分ヒストグラムは、バイラテラルフィルタを各画像画素に適用する際に空間フィルタ半径rのサイズを制約しない。言い換えれば、入力画像を走査(220)しつつフィルタ半径rを各画素において適応的に変更することが可能である。
分布ヒストグラム
Weissは、重複カーネルを用いるため、複数の列に対して一度に作用する。複数列動作の枠組みが与えられると、Weissは画素の正の値を列iのヒストグラムには格納せず、その画素の負の値を、列i+1のヒストグラムには現れるべきでない列iのヒストグラムに格納する。この結果、正の一列及び負の一列のみを記録する基底に隣接するヒストグラム、並びに正のr列及び負のr列を記録する距離rだけ離れたヒストグラムが得られる。最も外側のヒストグラムが非常に少数の列を基底と共有しても役に立たず、部分ヒストグラム群の維持には、特にrが大きく、例えば128よりも大きい場合にオーバーヘッドがあるため、上記の処理時間はO(log r)である。
Weissは、重複カーネルを用いるため、複数の列に対して一度に作用する。複数列動作の枠組みが与えられると、Weissは画素の正の値を列iのヒストグラムには格納せず、その画素の負の値を、列i+1のヒストグラムには現れるべきでない列iのヒストグラムに格納する。この結果、正の一列及び負の一列のみを記録する基底に隣接するヒストグラム、並びに正のr列及び負のr列を記録する距離rだけ離れたヒストグラムが得られる。最も外側のヒストグラムが非常に少数の列を基底と共有しても役に立たず、部分ヒストグラム群の維持には、特にrが大きく、例えば128よりも大きい場合にオーバーヘッドがあるため、上記の処理時間はO(log r)である。
Weissの方法を拡張して基底ヒストグラムの複数の層を含めると、第1層の大きな共通基底ヒストグラム、第2層の7画素間隔のいくつかの中型のサイズの部分ヒストグラム、及び第3層の1画素刻みの多くの小さな部分ヒストグラムに対応する。大きな半径のフィルタリングの完全に理論的な分析では、7つの層に数十万の部分ヒストグラムを保つことによって、Weissの処理時間はO(log r)に収束する。Weissは、走査の中心列に大きな辞書を維持して、所与の近傍画素が中心画素からr列に入らないかどうかを判定する。しかし、これらの辞書の維持は、ヒストグラムよりも格段に遅い。辞書の管理に加え、近傍が与えられるとバイラテラルフィルタの計算には遥かに長い時間がかかる。
図3は、タイプIのバイラテラルフィルタのための方法を示す。この方法は、バイラテラルフィルタ300を用いて入力画像301をフィルタリングし、出力画像309を作成する。入力画像は複数の画素を含み、各画素は強度を有する。入力画像がカラー(RGB)である場合、3つの強度が各色に1つずつある。バイラテラルフィルタ300は、空間フィルタ330及びレンジフィルタ341を含む。積分ヒストグラム310が入力画像から構築される。
積分ヒストグラムは1度に1画素ずつ、例えば順番220で処理される(320)。画素毎に、空間フィルタが積分ヒストグラムに適用されて局所ヒストグラムが作成される(303)。各局所ヒストグラムは画素の特定の強度範囲に対してビンを有する。例えば、強度が8ビット値(0〜255)であり、32個のビンがある場合、各範囲は8レベルの強度にまたがる。各ビンには、特定範囲内の画素数を示す係数321と、この係数に対するインデックス322とが関連付けられている。
各局所ヒストグラムのビン毎に、画素の強度302が各インデックスから減算されて(340)、差分値304が生成される。ビン毎に、レンジフィルタが各差分値に適用されて(350)、ビン応答305が生成される。各応答は、対応する係数によってスケーリングされて(360)、スケーリングされた応答361が生成される。
局所ヒストグラム毎に、スケーリングされた応答が総和されて(370)、局所ヒストグラムの局所応答(371)が生成され、それらの係数(321)が総和されて(380)、係数の和(381)を生成する。次に、画素毎に、局所応答(371)を係数の和(381)で除算して(390)、バイラテラルフィルタ応答306を生成し、これが出力画像となる。
図4は、タイプIIのバイラテラルフィルタのための方法を示す。パワー画像420が入力画像401から、多項式型レンジフィルタパラメータ411を用いて構築される(410)。任意のカーネル空間フィルタ関数421がパワー画像に適用されてフィルタ応答430が生成される。これらのフィルタ応答及びパワー画像が結合されて(440)出力画像403が生成される。タイプIIのバイラテラルフィルタ応答は式(8)又は式(9)に従って求めることができる。
図5は、タイプIIIのバイラテラルフィルタのための方法を示す。パワー画像420が入力画像401から、ガウシアン型レンジフィルタパラメータ511を用いて構築される(410)。任意のカーネル空間フィルタ関数421がパワー画像に適用されてフィルタ応答430が生成される。これらのフィルタ応答及びパワー画像が結合されて(440)出力画像403が生成される。タイプIIIのバイラテラルフィルタ応答は式(12)又は式(13)に従って求めることができる。
発明の効果
本発明の実施の形態は、フィルタの半径に関係なく一定時間でのバイラテラルフィルタリングを可能にする方法を提供する。
本発明の実施の形態は、フィルタの半径に関係なく一定時間でのバイラテラルフィルタリングを可能にする方法を提供する。
任意のレンジボックス空間フィルタを有するバイラテラルフィルタのための積分ヒストグラムに基づくバイラテラルフィルタリング方法が提供される。
本方法は、重複カーネルを利用して冗長演算を避ける。本方法は正確であり(PSNR>45dB)、非常に高速である。本方法はまた、各画素における空間フィルタサイズの適応的な設定を可能にする。
タイプIIの正確なバイラテラルフィルタの定式は、多項式型レンジフィルタと、線形フィルタによる任意の空間フィルタとを有する。これらのフィルタは、正確なものとして同一の応答を与える。上記と同様に、これらのフィルタも非常に高速である。処理時間はフィルタの半径に関係なく1MBの画像に対して0.3秒未満である。
ガウシアン型レンジフィルタ及び任意の空間フィルタを有するタイプIIIのバイラテラルフィルタ(σr=0.1まで)はテイラー級数によって表すことができ、非線形バイラテラルフィルタリングを画像パワーの線形フィルタリング及び線形フィルタタップの適応的な設定に変換する。この展開は正確なフィルタ(PSNR>50dB)と略同じである。
画像がより高解像度になり、それに対応してより大きなカーネル半径が必要となる一般的な傾向を考えると、大きなカーネルを用いて小さなカーネルと同じくらい高速にフィルタリングを行う点で、説明する方法は有利となる。
本発明を好適な実施形態の例として説明してきたが、本発明の精神及び範囲内で様々な他の適応及び変更を行うことができることが理解される。したがって、添付の特許請求の範囲の目的は、本発明の真の精神及び範囲に入る変形及び変更を全て網羅することである。
Claims (6)
- バイラテラルフィルタを用いて入力画像をフィルタリングして出力画像を作成する画像フィルタリング方法であって、該バイラテラルフィルタは空間フィルタ及びレンジフィルタを含み、該方法は、
強度をそれぞれ有する複数の画素を含む入力画像から積分ヒストグラムを構築するステップと、
各画素に対して、前記空間フィルタを前記積分ヒストグラムに適用して、局所ヒストグラムを生成するステップであって、各局所ヒストグラムは前記画素の特定範囲の強度に対するビンを有し、各ビンは前記特定範囲内にある画素数を示す係数と該係数に対するインデックスとに関連付けられている、ステップと、
各局所ヒストグラムのビン毎に、前記画素の強度を前記ビンの各インデックスから減算して、差分値を生成するステップと、
ビン毎に、前記レンジフィルタを各差分値に適用して、応答を生成するステップと、
各応答を、対応する前記係数によってスケーリングして、スケーリングされた応答を生成するステップと、
局所ヒストグラム毎に、前記スケーリングされた応答を総和して、前記局所ヒストグラムの局所応答を生成するステップと、
局所ヒストグラム毎に、前記係数を総和して、該係数の和を生成するステップと、
画素毎に、前記局所応答を前記係数の前記和で除算して、前記バイラテラルフィルタの応答を生成し、該応答が出力画像となる、ステップと、
を備えたフィルタリング方法。 - 前記フィルタリングの処理時間は、所与の画像サイズに対して一定であり、前記バイラテラルフィルタの半径に依存しない、請求項1に記載の方法。
- 該方法は時間的に実施されて出力画像列を生成する、請求項1に記載の方法。
- 前記空間フィルタはf(k)=cであり、ここで、cは任意の定数であり、前記レンジフィルタはg(p,k)であり、ここで、pは前記バイラテラルフィルタの中心画素であり、kは応答である、請求項1に記載の方法。
- 前記レンジフィルタはガウシアンフィルタである、請求項1に記載の方法。
- 前記レンジフィルタは多項式フィルタである、請求項1に記載の方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/143,532 US8081836B2 (en) | 2008-06-20 | 2008-06-20 | Method for filtering of images with bilateral filters and integral histograms |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2010003298A true JP2010003298A (ja) | 2010-01-07 |
Family
ID=41431376
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009139014A Pending JP2010003298A (ja) | 2008-06-20 | 2009-06-10 | 画像フィルタリング方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US8081836B2 (ja) |
JP (1) | JP2010003298A (ja) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8189945B2 (en) * | 2009-05-27 | 2012-05-29 | Zeitera, Llc | Digital video content fingerprinting based on scale invariant interest region detection with an array of anisotropic filters |
US8195689B2 (en) | 2009-06-10 | 2012-06-05 | Zeitera, Llc | Media fingerprinting and identification system |
CN101383007B (zh) * | 2008-09-28 | 2010-10-13 | 腾讯科技(深圳)有限公司 | 基于积分直方图的图像处理方法及系统 |
KR101525251B1 (ko) * | 2008-12-29 | 2015-06-03 | 주식회사 동부하이텍 | 노이즈 필터 |
US8260076B1 (en) * | 2009-03-31 | 2012-09-04 | Hewlett-Packard Development Company, L.P. | Constant time filtering |
US8478064B2 (en) * | 2010-01-19 | 2013-07-02 | Pixar | Selective diffusion of filtered edges in images |
US8532425B2 (en) * | 2011-01-28 | 2013-09-10 | Sony Corporation | Method and apparatus for generating a dense depth map using an adaptive joint bilateral filter |
JP5777458B2 (ja) * | 2011-09-12 | 2015-09-09 | キヤノン株式会社 | パターン識別装置、パターン識別方法及びプログラム |
US20130094753A1 (en) * | 2011-10-18 | 2013-04-18 | Shane D. Voss | Filtering image data |
US8761507B1 (en) * | 2012-08-02 | 2014-06-24 | Google Inc. | Bilateral filter optimization |
EP2896198B1 (en) | 2012-09-12 | 2016-11-09 | Dolby Laboratories Licensing Corporation | Display management for images with enhanced dynamic range |
US9002133B2 (en) * | 2013-02-27 | 2015-04-07 | Sharp Laboratories Of America, Inc. | Multi layered image enhancement technique |
US10395350B2 (en) | 2013-07-26 | 2019-08-27 | Li-Cor, Inc. | Adaptive background detection and signal quantification systems and methods |
WO2015013719A1 (en) | 2013-07-26 | 2015-01-29 | Li-Cor, Inc. | Adaptive noise filter |
US9218652B2 (en) | 2013-07-26 | 2015-12-22 | Li-Cor, Inc. | Systems and methods for setting initial display settings |
TWI818065B (zh) * | 2018-08-21 | 2023-10-11 | 大陸商北京字節跳動網絡技術有限公司 | 雙邊濾波器的減小的視窗尺寸 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7454058B2 (en) | 2005-02-07 | 2008-11-18 | Mitsubishi Electric Research Lab, Inc. | Method of extracting and searching integral histograms of data samples |
US7920741B2 (en) * | 2007-05-31 | 2011-04-05 | Adobe Systems Incorporated | System and method for image processing using integral histogram convolution |
-
2008
- 2008-06-20 US US12/143,532 patent/US8081836B2/en not_active Expired - Fee Related
-
2009
- 2009-06-10 JP JP2009139014A patent/JP2010003298A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
US20090317014A1 (en) | 2009-12-24 |
US8081836B2 (en) | 2011-12-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2010003298A (ja) | 画像フィルタリング方法 | |
JP2010003297A (ja) | バイラテラルフィルタおよびパワー画像を用いて画像をフィルタリングする方法 | |
Porikli | Constant time O (1) bilateral filtering | |
CA1309502C (en) | Method and system for enhancement of a digitized image | |
US8285033B2 (en) | Bi-affinity filter: a bilateral type filter for color images | |
US7835586B2 (en) | Method for filtering images with bilateral filters | |
Jiji et al. | Single‐frame image super‐resolution using learned wavelet coefficients | |
US9652830B2 (en) | Method and apparatus for performing hierarchical super-resolution of an input image | |
Paris et al. | A fast approximation of the bilateral filter using a signal processing approach | |
Adam et al. | Image denoising using combined higher order non-convex total variation with overlapping group sparsity | |
US6272261B1 (en) | Image processing device | |
Lamberti et al. | CMBFHE: a novel contrast enhancement technique based on cascaded multistep binomial filtering histogram equalization | |
Sardy et al. | Wavelet shrinkage for unequally spaced data | |
JP2002269556A (ja) | デジタル画像からノイズを除去する複数解像度に基づく方法 | |
KR20130001213A (ko) | 입력 이미지로부터 증가된 픽셀 해상도의 출력 이미지를 생성하는 방법 및 시스템 | |
WO2014083857A1 (ja) | 画像処理装置、及び、画像処理方法 | |
Chen et al. | A novel multi-image super-resolution reconstruction method using anisotropic fractional order adaptive norm | |
Larsen et al. | Texture enhanced appearance models | |
Mohamed et al. | A collaborative adaptive Wiener filter for image restoration using a spatial-domain multi-patch correlation model | |
Wang et al. | Hyperspectral unmixing via plug-and-play priors | |
Mandal et al. | Employing structural and statistical information to learn dictionary (s) for single image super-resolution in sparse domain | |
Keren et al. | Denoising color images using regularization and “correlation terms” | |
Ling et al. | Adaptive tone-preserved image detail enhancement | |
Welk et al. | The convex-hull-stripping median approximates affine curvature motion | |
Ahmed et al. | Digital image inpainting techniques for cultural heritage preservation and restoration |