JP2008530700A - 統計的テンプレートマッチングによる高速な物体検出方法 - Google Patents

統計的テンプレートマッチングによる高速な物体検出方法 Download PDF

Info

Publication number
JP2008530700A
JP2008530700A JP2007555706A JP2007555706A JP2008530700A JP 2008530700 A JP2008530700 A JP 2008530700A JP 2007555706 A JP2007555706 A JP 2007555706A JP 2007555706 A JP2007555706 A JP 2007555706A JP 2008530700 A JP2008530700 A JP 2008530700A
Authority
JP
Japan
Prior art keywords
template
image
similarity
region
regions
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007555706A
Other languages
English (en)
Other versions
JP4739355B2 (ja
JP2008530700A5 (ja
Inventor
シビルヤコフ、アレクサンダー
ボバー、ミロスロー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Elecric Information Technology Centre Europe BV
Original Assignee
Mitsubishi Elecric Information Technology Centre Europe BV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Elecric Information Technology Centre Europe BV filed Critical Mitsubishi Elecric Information Technology Centre Europe BV
Publication of JP2008530700A publication Critical patent/JP2008530700A/ja
Publication of JP2008530700A5 publication Critical patent/JP2008530700A5/ja
Application granted granted Critical
Publication of JP4739355B2 publication Critical patent/JP4739355B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/255Detecting or recognising potential candidate objects based on visual cues, e.g. shapes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/751Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
    • G06V10/7515Shifting the patterns to accommodate for positional errors

Abstract

画像中の物体の検出方法は、テンプレートを画像の領域と比較すること、及び、類似度を求めることを含み、類似度は統計測度を用いて求められる。テンプレートは、物体の各部分及びそれらの空間的関係に対応するいくつかの領域を含む。テンプレート全体のピクセルの分散は、全ての個々の領域におけるピクセルの分散との関係により設定され、類似度が得られる。

Description

本発明は、テンプレートマッチングを用いて画像中の物体を検出又は位置特定する方法及び装置に関する。
物体検出は、コンピュータビジョンにおいて、ビデオ監視、視覚に基づく制御、人間コンピュータインタフェース、医用画像、拡張現実(augmented reality)及びロボット工学等の広範な用途を有する。また、物体検出は、3D再構成及び3D表現のようなより高レベルの視覚タスクへの入力となる。物体検出はまた、コンテンツベースのインデックス付け及び検索等のビデオデータベース用途に関して重要な役割を果たす。
ロバストで正確で高性能な手法が今日においても大きな課題である。この問題の難易度は、関心物体(object of interest)がどう定義されるかに大きく依存する。特定の物体を記述するテンプレートがあれば、物体検出は、テンプレートと解析中の画像との間で特徴を照合するプロセスとなる。完全一致による物体検出は一般に計算量が多く、照合の品質及び速度は物体テンプレートにより提供される細部及び正確さに依存する。
テンプレートマッチングにはいくつかの主要な技法が用いられてきた。
1)画像減算(image subtraction)。この技法では、テンプレートと画像中の様々な位置との間の距離関数を最小化することによってテンプレートの位置が求められる[Nicu Sebe、Michael S. Lew、及びDionysius P. Hujismans, H.著(2000)「Toward Improved Ranking Metrics」(IEEE Transactions on Pattern Analysis and Machine Intelligence, pp. 1132-1142, 22(10), 2000)]。画像減算法に必要な計算時間は、後述する相関に基づく技法よりも短いが、画像減算法は、テンプレートとこのテンプレートを含む画像との間で画像強度及び視角等の撮影条件が同じという制限された環境において良好に機能する。
2)相関。相関によるマッチングは、テンプレートと画像との間の正規化された相互相関ピークの位置を利用して最良一致を位置特定する[Chung, KL.著(2002)「Fast Stereo Matching Using Rectangular Subregioning and 3D Maximum-Surface Techniques」(International Journal of Computer Vision. vol. 47, no. 1/2/3, pp. 99-117, May 2002)]。この技法は一般に、画像中の雑音及び照明効果に強いが、テンプレート全体にわたる加算により生じる計算量が多いという欠点がある。点相関により計算量を、加算のために注意深く選択された点の小さな集合に低減することができる。
3)可変テンプレートマッチング。可変テンプレートマッチング手法は、剛性変形及び非剛性変形により物体が変化する場合により適している[A.K. Jain、Y. Zhong、S. Lakshmanan著「Object Matching Using Deformable Templates」(IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 18, Issue 3 (March 1996), 267-278)]。これらの変化は、物体自体の変形又は単にカメラに対する異なる物体姿勢により生じる場合がある。ほとんどのビデオ中の物体は可変性であるため、可変モデルは追跡タスクにおいてより魅力的である。この手法では、テンプレートは、物体形状の特徴的な輪郭/エッジを記述するビットマップとして表される。原型となる輪郭の確率的変形が適用されて、入力画像中の顕著なエッジに合わせてテンプレートが変形される。テンプレートの形状を変化させる変形パラメータを有する目的関数(objective function)が、このような変換のコストを反映して定式化される。この目的関数は、変形パラメータを物体に最も良く一致するように繰り返し更新することによって最小化される。
4)フーリエ法。計算速度の加速が必要であるか、画像が様々な条件下で取得されたか、又は画像が周波数依存性雑音により破損している場合、相関のような方法よりもフーリエ法[Y. Keller、A. Averbuch著「Unified Approach To FFT-Based Image Registration」(IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP) 2002, Orlando, USA, May 2002)]が好ましい。フーリエ法は、周波数領域における画像のフーリエ表現を利用する。位相相関法はフーリエシフトの定理に基づき、当初は平行移動画像の位置合わせのために提案された。位相相関法は、テンプレート及び画像の相互電力スペクトルを計算し、その逆スペクトルのピークの位置を探す。
本発明が取り組む課題は、低品質画像及び雑然とした背景のような複雑な環境におけるロバストな物体検出である。
本発明が取り組む別の課題は、物体検出に用いられるテンプレートマッチング方法のリアルタイムでの実施である。よく知られたテンプレートマッチング方法は、以下のようないくつかの欠点を有する。
(a)相互相関法はロバストであるが計算量が多い。M×Nサイズのテンプレートの場合、画像ピクセル毎にO(MN)回の演算、通常は乗算を必要とし、リアルタイムでの実行には適さない場合がある。
(b)高速フーリエ変換に基づく位相相関は高速であるが、画像サイズに匹敵するテンプレートサイズのみで安定して機能する。通常の用途では、関心物体が占めるのは画像サイズの1%未満である可能性があり、位相相関法の出力ははっきりしないものとなる。物体の大まかな位置がアプリオリに分かっている場合、例えば、画像シーケンスにおいて物体が追跡される場合、関心領域のサイズを縮小することができる。この場合、位相相関が適用可能であるが、2つの新たな問題が生じる:(1)領域追跡を初期化するために最初のフレーム中の物体を検出する別の方法が必要になる。(2)このアプリケーションは、物体の位置に関するアプリオリ情報がない静止画では機能しない。
既存の方法に伴う問題を克服するために、新たなテンプレートマッチング方法が提案される。本方法は、統計的仮説試験に基づき、その性能はテンプレートサイズに依存せず、テンプレートの複雑さのみに依存する。
リアルタイム実施の要件はロバスト性の要件と矛盾することが多い。本方法の実施は以下に対してロバストである:
1)スケール変更;本方法は、画像が(0.5,2)の範囲の倍率でスケーリングされても同様の結果を与える。
2)局所的な画像ワーピング;本方法は小さな幾何学的障害の影響を受けない。
3)非線形の強度変化;本方法は高圧縮画像に対して機能することができる。100分の1又は2という低い圧縮品質のJPEG画像で行った試験は成功した。
本明細書では、画像がN個の座標変数の関数I(x,x,...,x)であると仮定する。このような定義画像には以下のような様々な場合がある。
N=1;これは、例えばあらゆる実信号、2D画像から抽出されるピクセルプロファイル又は画像から導出されるあらゆる整関数(ヒストグラム、側方向投影)であり得る1D画像又は1D信号である。
N=2;これは、未処理形態又は前処理済み形態の通常の2D画像I(x,y)である。前処理は、フィルタリング、分割、エッジ又は特徴抽出等の任意の画像処理操作を含み得る。
N=3;これは、未処理形態又は前処理済み形態の体積画像(volumetric image)(ボクセル画像、画像スタックとして編成された画像シーケンス又はビデオ)である。
任意のN;応用形態はデータ表現により高い次元を用いることができ、例えば、時間的に変化する体積画像の場合にN=4を用いることができる。
本発明の態様は、添付の特許請求の範囲に記載される。提案する物体検出方法のいくつかの態様を以下に記載する。
関心物体又はその一部の記述は、領域の集合T=T∪...∪Tにより行う。この記述をこの提案ではトポロジカルテンプレート又は単にテンプレートと呼ぶ。このテンプレートは、物体のトポロジー(その各部分の空間的関係)のみを記述し、その放射分析的(色、強度等の放射線に関連する)特性は記述しない。各領域Tはいくつかの非連結領域から成る可能性がある。
提案するテンプレートマッチング方法は、ピクセル群の統計的特徴(平均及び分散)のみを解析に用いるため、統計的テンプレートマッチングと呼ばれる。マッチングプロセスにおいて、テンプレートと画像領域との間の類似度は統計的仮説試験に基づく。各ピクセルx及びその近傍R(x)に関して、2つの仮説を検討する:
:R(x)はランダムである。
:R(x)はテンプレートに類似している。
又はHを受け入れる決定規則は、(テンプレート領域により画定される)ピクセル群の特徴が互いに統計的に異なるか、及び、導出される類似度が信号対雑音比に近いかという試験に基づく。これは次のように計算される:
Figure 2008530700
ここで、σ(Q)は領域Qにおける画像値の分散であり、|Q|は領域Q内のピクセル数を示す。
統計的テンプレートマッチングは、積分画像と呼ばれるよく知られた技法を用いることによって、リアルタイム性能を達成するように容易に適用させることができる。この修正では、各テンプレート領域Tは矩形の集合から成る。この場合、2D画像に関して、(1)の各分散値は8k回のメモリ参照により計算することができ、ここで、kは矩形の数である。従来のやり方でσ(Q)を計算すると|Q|回のメモリ参照が必要となる。
統計的テンプレートマッチング出力の以下の解釈は、物体検出に用いることができる。ピクセル毎に、マッチングは類似度S及び一組の統計的特徴σ(T),...,σ(T)、m(T),...,m(T)を生成する。ここで、m(T)は、σ(T)の計算に用いられる領域平均である。類似度値は類似度マップを形成し、高い値は物体の有望な位置に対応する。したがって、類似度と閾値との比較は物体/非物体位置分類器として適用される。物体検出アルゴリズムを完成させるために、以下の手順を適用することができる:
1)非最大値の抑制により、類似度マップの極大値(local maxima)及び物体中心の整数座標を得る。
2)多項式曲面を類似度マップの極大値の近傍に当てはめて、物体のサブピクセル位置を得る。
3)統計値σ(T),...,σ(T)、m(T),...,m(T)の用途依存解析は、誤報数の削減に役立つ。物体領域の放射分析的特性が事前に分かっている(例えば、領域の一部が他の領域よりも暗いことが分かっている)場合、m(T)<m(T)のような追加条件により不要な構成を拒絶する。
提案する方法のいくつかの拡張を以下に記載する。
1)多解像度手法。本方法は、画像のいくつかの解像度を作成する場合(いわゆる画像ピラミッド)に、粗密の枠組みで適用することができ、処理は最も粗いレベルから始まり、検出結果はより細かい解像度で精緻化される。この場合、テンプレートを多解像度にしたもの(テンプレートピラミッド)を作成する。この処理は、最も粗い画像解像度における最も粗いテンプレートのマッチングから始まる。全ての考えられる物体位置を粗い類似度マップから抽出した後、処理は、関心領域(ROI)内でのみより細かい解像度で行われる。
2)物体追跡。このような用途では、方法は、シーケンスの最初の画像においてROIを初期化し、次の画像におけるその位置を予測しようとすることによって、統計的テンプレートマッチングの探索エリアを縮小する。いくつかの連続フレームから得られた結果の統計的フィルタリングを用いて、物体の存在に関する決定を行うことができる。
3)テンプレートの修正。多解像度の枠組み又は物体追跡の枠組みでは、次のステップにおける物体検出を改善するために、テンプレートを現在の検出結果の解析に基づいて調整することができる。例えば、いくつかのテンプレート領域の統合又は除外が類似度を高める場合、そのように統合又は除外することができる。また、テンプレートの全体のサイズを類似度マップのピークの幅に従って調整することができる。
4)複数のテンプレート。この状況は、いくつかのテンプレートが或る物体を表し得る場合に可能である。統計的テンプレートマッチングを適用した結果として複数の類似度マップが得られ、これらが単一の類似度マップに結合されてから、物体位置が抽出され得る。最も単純な結合方法はピクセル毎の乗算である。
本発明の実施形態を添付図面に関して説明する。
2Dの場合の提案する方法の実施を以下に記載する。
本方法のブロック図を図1に示す。まず、以下でより詳細に説明するように、関心物体を含む可能性のある入力画像を用いて積分画像を計算する(ブロック1.1)。次に、画像をピクセル毎にスキャンして取り込み(1.2)、テンプレートの中心を現ピクセルに置く(1.3)。テンプレートによって覆われた画像領域に関して一組の統計値及び類似度を計算する(1.4)。次に、計算された統計値を用いてアプリオリ情報を調べる。特定の条件を満たさない場合、現ピクセルは物体の中心ではあり得ないため、最低値の類似度を割り当てる(1.5)。テンプレートを移動させてその中心を画像中の各ピクセルに順番に置くことによって全ての類似度値を計算して類似度マップが得られたら、物体の考えられる位置を抽出するためにこのマップを後処理する(1.6)。そして最後に、検出された物体の類似度値を統計的有意水準又は用途により定義される閾値と比較する(1.7)。
提案する方法では、関心物体又はその一部を、領域の集合T=T∪...∪Tから成るテンプレートにより記述する。このテンプレートは、物体のトポロジー(その各部分の空間的関係)のみを記述し、その放射分析的特性は記述しない。6つの領域を有するトポロジカルテンプレートの一例を図2aに示す。このテンプレートは、いずれかのピクセルに位置するテンプレートによって覆われる局所画像領域をどのように解釈するかを決める。図2bに示すようにテンプレートの中心をピクセル(x,y)に置くと、M+1個の画像領域(図2のT...Tの領域)において局所統計値が計算される。これらの統計値は、画像とテンプレートとの間の類似度の計算に用いられる。
物体のテンプレートを作成する際の一般的な指針は以下の通りである。
a)領域数Mは弁別的な物体の部分の数に対応していなければならない。
b)いくつかの物体部分の放射分析的特性が類似している場合、それらはテンプレートの1つの領域に含まれなければならない。
c)物体が非常に変わりやすい領域(高周波のテクスチャ、エッジ)を含む場合、それらの領域は、方法の性能をより良くするためにテンプレートから除外することができる。
d)領域のサイズ又は形状の仮定は行わない。各領域Tはいくつかの非連結領域から成る可能性がある。各領域は穴(使用されない領域)を含み得る。
e)本方法のより良い性能は、領域の形状を単純化することによって達成することができる。したがって、各領域Tが矩形の集合として表される場合、処理時間は最短となる。
f)最良性能(リアルタイム用途に適している)は、以下の場合に達成することができる。すなわち、テンプレート形状(領域T)が矩形であり、全ての他の領域Tが矩形の集合から成り、テンプレートに穴(使用されない領域)がない場合である。
顔検出タスク用のテンプレートの例を図3に示す。これらのテンプレートは、目領域が通常は周囲の肌領域よりも暗いという観察(図3a)に基づいて作成された。各テンプレートは、黒のエリア及び白のエリアにより画定される2つの領域から成る。なお、1つのテンプレート領域(黒で示す)は2つの非連結領域から成る。図3cのテンプレートは、暗い値から明るい値への強度遷移エリアを除外するための穴(灰色で示す)も含む。図3dのテンプレートは図3bを簡略化したもので、リアルタイムでの実施に適している。
テンプレートが異なるサイズの矩形の集合として表される場合、これらの矩形内の統計的特徴(平均及び分散)の高速な計算のために特別な画像前処理を適用することができる(図1、ブロック1.1)。画像を積分表現に変換することにより、このような特徴は、後述のように矩形の角の座標の4回のピクセル参照のみで高速に計算できるようになる。
本発明では積分画像Sum(x,y)及びSumQ(x,y)を以下のように定義する。
Figure 2008530700
ここで、I(x,y)は原画像であり、x,y<0の場合にI(x,y)=0である。
テンプレートと画像領域との間の類似度は統計的仮説試験に基づく。ピクセル(x,y)及びその近傍R(x,y)毎に、2つの仮説を検討する:
:R(x,y)はランダムである。
:R(x,y)はテンプレートに類似している。
又はHを受け入れる決定規則は、M個のピクセル群の平均が互いに統計的に異なるかどうかという試験に基づく。これらのM個の群はテンプレートにより画定され、その中心はピクセル(x,y)に位置する。
まず、2つの領域の場合:T=T∪Tを検討する。よく知られた統計的t検定(t-test)を2つのピクセル群に適用すると以下の類似度が得られる(いくつかの等価変換は省く)。
Figure 2008530700
この式から定数を除去すると、(1)の形の類似度が得られる。
テンプレートが3つ以上の領域から成る場合、別の統計的技法を用いて類似度を得る。この技法は分散分析(Analysis of Variances)(ANOVA)と呼ばれ、数学的にはt検定と等価であるが、群数が2つよりも多い場合にのみ用いられる。
群間分散及び群内分散をQ(T,...,T)及びQ(T,...,T)とする。これらの分散は以下のように計算される。
Figure 2008530700
これらの分散は以下のように連結される。
Figure 2008530700
本発明では、フィッシャー基準を類似度として用いる((5)、(6)、(7)に続く等価変換は省く)。
Figure 2008530700
この式から定数を除去すると、(1)の形の類似度が得られる。
したがって、点(x,y)における統計的テンプレートマッチングの結果は次のように表すことができる。
Figure 2008530700
類似度値が計算されたら、画像領域が関心物体に類似していると言えるほどこの値が大きいかどうかという検定を、統計的閾値処理を用いて行うことができる。このような検定には統計的な有意性の表を用いることができる。有意性の検定には、リスク水準を設定しなければならない。通常、0.05のリスク水準を用いる。リスク水準及び自由度数が与えられると、t値((4)から)又はF値((8)から)を標準的な有意性の表から得られる閾値と比較して、類似度値が有意であるほど十分に大きいかどうかを判定することができる。
上記のように、積分画像の使用により構成の速度を高めることができる。積分画像を用いると、任意の矩形領域Rの|R|σ(R)の計算に必要なピクセル参照は2*|R|回ではなく2*4回となる。
Figure 2008530700
ここで、最後の等式は定義であり、(x,y)、(x,y)は矩形Rの左上及び右下の点の座標である。
矩形の集合から成る領域:T=R∪R∪...RKiの場合、|T|σ(T)の計算は同様である。
Figure 2008530700
上記の式を用いて、テンプレートと画像との間の類似度の計算は、テンプレートサイズに依存せず、テンプレートの複雑度(その中の矩形の数)に依存する。
(5)〜(7)を用いてさらなる最適化を行う。ここから、m(T)、σ(T)を計算する必要がないことは明らかである。これは、これらの値がm(T),..,m(TM−1)、σ(T),...,σ(TM−1)から導出できるためである。この最適化により、(a)少数の領域のみを用いる(M=2,3)場合、又は(b)領域Tが非常に多数の矩形から成る場合に性能を大幅に高めることができる。
図4は、提案する方法による顔検出の例を示す。図4dに示すテンプレートを統計的テンプレートマッチングに用いた。図4の上の行は顔画像を類似度の最大値の位置と共に示す。下の行は、(9)を用いて計算した類似度マップの対応するフラグメントを示す。この例示には、AT&T顔データベースからの画像を用いた。これらの画像は、AT&T Laboratories, Cambridgeのウェブサイトhttp://www.uk.research.att.com/facedatabase.htmlから入手可能である。
本提案によるテンプレートマッチング方法は、本方法を例示するために用いた顔検出タスクに特定的なものではない。本方法は、物体モデルを事前に定義及び簡略化することができる物体検出を扱うあらゆる用途に用いることができる。この方法は特に、バイモーダルの場合(明るい背景の中の暗い物体又は暗い背景の中の明るい物体)、又は物体モデルを一組の矩形から成るように簡略化することができる場合によく機能する。モデルを矩形から構成することができる場合、本方法のリアルタイム性能が達成されるが、これは相関に基づく技法には必ずしも当てはまらない。
図5は、顔特徴の検出への本方法の適用を示す。上の行は水平方向特徴(目、鼻腔、口)の検出を示す。下の行は垂直方向特徴(鼻)の検出を示す。左の列は検出結果を示す。中央の列はテンプレートを示し、右の列は類似度マップを示す。
基準マーク検出の典型的な例は、衛星画像の自動的な内部オリエンテーションであり、この場合、画像の歪みを補正するために、カメラにより作成された基準マークを検出しなければならない(図6)。図6において、(a)は衛星画像中の基準マーク(十字)を示し、(b)はテンプレート(c)〜(g)を用いた統計的テンプレートマッチングにより得られる結合された類似度マップを示す。
提案するテンプレートマッチング方法の別の用途としては、路面標示の検出が考えられる。道路画像を直交ビューに変換すると、標示ははっきりした物体となり、テンプレートマッチングにより検出することができる。図7は、(a)道路画像−車内からのビュー、(b)直交変換後の道路の「航空」ビュー、(c)標示部分の始まり、終わり及び中央部を検出するテンプレートの例を示す。
図8は、画像透かし問題への提案する方法の適用を示す。ここでは、均一な領域から成る透かしを用いる。この例の透かしは画像の最下位ビットに埋め込まれるが(図8a)、他の埋め込み法も用いることができる。透かし画像の抽出(図8b)後、透かしに符号化された情報を読み取る方法が必要となる。このような読み取りに、提案する統計的テンプレートマッチングを用いることができる。全ての考えられる透かし(その一部を図8eに示す)に対してマッチングを行い、考えられる位置及び類似度値を検出する(図8c、図8dに2つの例を示す)。最も高い類似度値を生じるテンプレートを透かしと見なす。図8は、(a)透かし入り画像、(b)透かし入り画像の最下位ビット、(c)透かしに対応するテンプレート(図(e)の左のテンプレート)を用いる統計的テンプレートマッチングの結果(類似度マップ)、(d)なんらかの任意のテンプレートを用いる統計的テンプレートマッチングの結果(類似度マップ)、(e)透かしを読み取るために用いられるテンプレートの例を示す。
上記の説明では、類似度は値が高いほど類似度が高いことを示すようになっており、極大値が検出される。しかし、使用する類似度に応じて、他の値(より低い値、等)でより近い類似度を示し、極小値を検出するようにしてもよい。高い値、極大値等への言及はそれに応じて解釈すべきである。
本明細書において、統計的という用語は、色、強度等の何らかの品質の分布に関連することを意味する。
本明細書において、「画像」という用語は、画像単位を記述するために用いられる。この画像単位は、解像度の変更、アップサンプリング、ダウンサンプリング等の処理の後のものを含み、又は積分画像と関連するものを含む。また、この用語は、フレーム、フィールド、ピクチャ等の他の同様の用語、又は画像、フレーム等のサブユニット若しくは領域にも適用される。ピクセル及びブロック又はピクセル群という用語は、適宜互換可能に用いられ得る。本明細書において、画像という用語は、文脈から明らかな場合を除いて、画像全体又は画像の一領域を意味する。同様に、画像の一領域は画像全体を意味し得る。画像は、フレーム又はフィールドを含み、静止画、フィルム若しくはビデオ等の画像シーケンス中の1つの画像、若しくは関連画像群中の1つの画像に関連する。
画像はグレースケール画像又はカラー画像であってもよく、又は別のタイプのマルチスペクトル画像、例えば、IR、UV若しくは他の電磁画像、若しくは音響画像等であってもよい。
本発明は、例えばコンピュータシステムにおいて適切なソフトウェア及び/又はハードウェアの変更を行って実施することができる。例えば、本発明は、プロセッサ又は制御装置等の制御手段又は処理手段、メモリ、磁気記憶装置、CD、DVD等といった画像記憶手段を含むデータ記憶手段、ディスプレイ若しくはモニタ又はプリンタ等のデータ出力手段、キーボード等のデータ入力手段、及びスキャナ等の画像入力手段、又はこのような構成要素の任意の組み合わせを追加構成要素と共に有する、コンピュータ等を用いて実施することができる。本発明の態様は、ソフトウェア形態及び/又はハードウェア形態で、又は特定用途向け装置において提供するか、又はマイクロチップ等の特定用途向けモジュールを提供することができる。本発明の一実施形態による装置内のシステムの構成要素は、例えばインターネットを通じて他の構成要素と離れた場所に設けてもよい。
本発明の一実施形態の方法のフロー図である。 図2aはテンプレートの一例である。図2bは本発明の一実施形態の方法のための、画像内に位置する図2aのテンプレートを示す。 図3aは関心物体としての画像領域である。図3b〜図3dは図3aの関心物体に対応するテンプレートの例である。 顔の画像の例と、対応する統計的テンプレートマッチングを示すグラフとを含む。 検出結果を含む顔の画像、顔特徴検出テンプレート、及び類似度マップを示す。 図6aは基準マークを有する衛星画像を示す。図6bは図6aに対応する類似度マップを示す。図6cは図6aに用いるテンプレートを示す。 図7aは道路画像を示す。図7bは直交変換後の図7aの画像を示す。図7cは路面標示を検出するテンプレートを示す。 図8aは透かし画像を示す。図8bは図8aの画像の最下位ビットを示す。図8cおよび図8dは統計的テンプレートマッチングの結果を示すグラフである。図8eは図8aの画像用のテンプレートを示す。

Claims (42)

  1. 画像中の物体の検出方法であって、
    テンプレートを画像の領域と比較することと、
    類似度を求めることと
    を含み、
    前記類似度は統計測度を用いて求められる、画像中の物体の検出方法。
  2. 前記統計測度は、前記テンプレートに対応する前記画像の前記領域の統計値を用いて求められる、請求項1に記載の方法。
  3. 前記領域の前記統計値は、前記テンプレートに対応する前記画像の前記領域内のピクセル値の平均及び分散を含む、請求項2に記載の方法。
  4. 前記統計測度は統計的仮説試験に関係する、請求項1〜3のいずれか一項に記載の方法。
  5. M個の領域を含むテンプレートを用い、ここで、Mは2以上であり、前記テンプレートの前記M個の領域は前記物体の各部分及び前記各部分の空間的関係に対応する、請求項1〜4のいずれか一項に記載の方法。
  6. 前記テンプレートは前記M個の領域の集合である、請求項5に記載の方法。
  7. 物体の、類似する放射分析的特性(色、強度等)を有する複数の領域が、前記テンプレートの1つの領域に結合される、請求項5又は6に記載の方法。
  8. 1つ又は複数の領域が、テンプレートマッチングに使用されない1つ又は複数のエリアを含む、請求項5〜7のいずれか一項に記載の方法。
  9. 少なくとも1つの領域が非連結のサブ領域を含む、請求項5〜8のいずれか一項に記載の方法。
  10. 前記領域は単純な形状に対応する、請求項5〜9のいずれか一項に記載の方法。
  11. 前記形状は直線エッジを有する、請求項5〜10のいずれか一項に記載の方法。
  12. 前記形状は矩形である、請求項11に記載の方法。
  13. 前記類似度は前記テンプレートの前記M個の領域の各々に関係する、請求項5〜12のいずれか一項に記載の方法。
  14. 前記類似度は、前記テンプレートの前記M個の領域の各々と、前記テンプレート全体に対応する1つの領域とに関係する、請求項13に記載の方法。
  15. 前記テンプレートの前記M個又はM+1個の領域に対応する前記画像の前記領域の各々に統計値が用いられる、請求項5〜14のいずれか一項に記載の方法。
  16. 前記統計値は平均及び分散を含む、請求項15に記載の方法。
  17. 前記統計測度の使用は、統計的t検定をピクセル群に適用することを含む、請求項16に記載の方法。
  18. 前記類似度は式(1)若しくは(4)の形であるか、又はそれに近い、請求項17に記載の方法。
  19. 前記類似度の使用は、分散分析(ANOVA)検定を適用することを含む、請求項16に記載の方法。
  20. 前記類似度は式(8)若しくは(9)の形であるか、又はそれに近い、請求項19に記載の方法。
  21. 前記類似度を閾値と比較することを含む、請求項1〜20のいずれか一項に記載の方法。
  22. 統計的閾値処理又は統計的有意水準を用いることを含む、請求項21に記載の方法。
  23. リスク水準を設定することと、
    前記リスク水準、自由度、及び有意性の表を用いることと
    を含む、請求項22に記載の方法。
  24. 前記画像から積分画像を導出することと、
    前記類似度の計算において前記積分画像を用いることと
    を含む、請求項1〜23のいずれか一項に記載の方法。
  25. 前記類似度の計算において、前記積分画像と、(10)又は(11)の関係とを用いることを含む、請求項24に記載の方法。
  26. 前記画像中の複数の領域の各々に関して類似度を導出することであって、それによって、類似度マップを導出することと、
    前記類似度に従って極大値又は極小値を特定することと
    を含む、請求項1〜25のいずれか一項に記載の方法。
  27. 極大値又は極小値を閾値と比較することを含む、請求項26に記載の方法。
  28. 物体検出において前記関心物体に関する追加の条件を用いることを含む、請求項1〜27のいずれか一項に記載の方法。
  29. 前記追加条件は、前記統計的仮説試験において導出される統計値を含む、請求項28に記載の方法。
  30. 1つの物体を表す複数のテンプレートを用いることと、
    前記複数のテンプレートの各々を用いて類似度を導出することと、
    前記複数の類似度を結合等により用いることであって、それによって、前記物体を位置特定することと
    を含む、請求項1〜29のいずれか一項に記載の方法。
  31. 前記画像の複数のバージョンを、異なる解像度で生成することと、
    前記テンプレートの複数のバージョンを、異なる解像度で生成することと、
    第1の解像度でのテンプレートマッチング及び第2のより高い解像度でのテンプレートマッチングを行うことと
    を含む、請求項1〜30のいずれか一項に記載の方法。
  32. 第1の解像度での前記マッチングは、前記物体を含む関心領域を検出するために行われ、
    第2の解像度での前記テンプレートマッチングは、前記関心領域内で行われる、請求項31に記載の方法。
  33. 前記テンプレートを1つの解像度用に調整することであって、異なる解像度での検出結果に応じて、例えばテンプレート領域を統合若しくは除外すること、又は前記テンプレート若しくはテンプレート領域のサイズ若しくは形状を変更することによって、或る解像度用に調整することを含む、請求項31又は32に記載の方法。
  34. 画像シーケンス中の物体の追跡方法であって、
    請求項1〜33のいずれか一項に記載の方法を用いて物体を検出することと、
    次の画像中の前記物体のおおよその位置を予測することと、
    前記予測を用いて、前記次の画像中の関心領域を求めることと、
    請求項1〜33のいずれか一項に記載の方法を前記関心領域において用いて、前記物体を検出することと
    を含む、画像シーケンス中の物体の追跡方法。
  35. 前記テンプレートを、前記画像シーケンス中の1つの画像用に調整することであって、前記画像シーケンス中の異なる画像における検出結果に応じて、例えばテンプレート領域を統合若しくは除外すること、又は前記テンプレート又は前記テンプレート領域のサイズ若しくは形状を変更することによって、前記画像シーケンス中の1つの画像用に調整することを含む、請求項34に記載の方法。
  36. 顔特徴及び/又は顔を検出するための、請求項1〜35のいずれか一項に記載の方法。
  37. 衛星画像、地理画像等の中の特徴を検出するための、請求項1〜36のいずれか一項に記載の方法。
  38. 基準マーク、路面標示、透かし等を検出するための、請求項1〜37のいずれか一項に記載の方法。
  39. 請求項1〜38のいずれか一項に記載の方法を実行する装置。
  40. 請求項1〜38のいずれか一項に記載の方法を実行するようにプログラムされる制御装置。
  41. 請求項40に記載の制御装置と、画像を記憶する記憶手段とを備える装置。
  42. 請求項1〜38のいずれか一項に記載の方法を実行するコンピュータプログラム、システム又はコンピュータ読み取り可能な記憶媒体。
JP2007555706A 2005-02-21 2006-02-20 統計的テンプレートマッチングによる高速な物体検出方法 Expired - Fee Related JP4739355B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP05250973.4 2005-02-21
EP05250973A EP1693783B1 (en) 2005-02-21 2005-02-21 Fast method of object detection by statistical template matching
PCT/GB2006/000590 WO2006087580A1 (en) 2005-02-21 2006-02-20 Fast method of object detection by statistical template matching

Publications (3)

Publication Number Publication Date
JP2008530700A true JP2008530700A (ja) 2008-08-07
JP2008530700A5 JP2008530700A5 (ja) 2010-10-28
JP4739355B2 JP4739355B2 (ja) 2011-08-03

Family

ID=34940486

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007555706A Expired - Fee Related JP4739355B2 (ja) 2005-02-21 2006-02-20 統計的テンプレートマッチングによる高速な物体検出方法

Country Status (6)

Country Link
US (1) US20080166016A1 (ja)
EP (1) EP1693783B1 (ja)
JP (1) JP4739355B2 (ja)
CN (1) CN101147159A (ja)
DE (1) DE602005012673D1 (ja)
WO (1) WO2006087580A1 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012143547A (ja) * 2010-12-24 2012-08-02 Canon Inc 被検体情報取得装置及び被検体情報取得方法
JP2013109658A (ja) * 2011-11-22 2013-06-06 Nippon Telegr & Teleph Corp <Ntt> 画像検索装置、画像検索方法およびプログラム
JP2013255697A (ja) * 2012-06-13 2013-12-26 Canon Inc 被検体情報取得装置およびその制御方法
JP2014233607A (ja) * 2013-06-05 2014-12-15 独立行政法人国立高等専門学校機構 画像処理装置及び医用画像診断装置
KR101592334B1 (ko) 2014-10-28 2016-02-05 국방과학연구소 위성 영상의 관심 시설 탐색 장치 및 그 방법

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4626493B2 (ja) * 2005-11-14 2011-02-09 ソニー株式会社 画像処理装置、画像処理方法、画像処理方法のプログラム及び画像処理方法のプログラムを記録した記録媒体
KR100816089B1 (ko) * 2006-07-20 2008-03-24 광운대학교 산학협력단 3차원 정보를 가지고 있는 집적영상의 요소영상을워터마크로 사용하는 워터마킹 장치 및 그 방법
GB0707192D0 (en) * 2007-04-13 2007-05-23 Mitsubishi Electric Inf Tech Generalized statistical template matching
JP4951591B2 (ja) * 2008-06-30 2012-06-13 株式会社日立ハイテクノロジーズ パターンの消失に対応したマッチング方式及びそれを用いた検査装置
KR101522985B1 (ko) * 2008-10-31 2015-05-27 삼성전자주식회사 영상처리 장치 및 방법
CN101901334B (zh) * 2009-05-31 2013-09-11 汉王科技股份有限公司 静态目标检测方法
JP5279653B2 (ja) * 2009-08-06 2013-09-04 キヤノン株式会社 画像追尾装置、画像追尾方法、及びコンピュータプログラム
US7953245B2 (en) * 2009-08-18 2011-05-31 General Electric Company System, method and program product for camera-based object analysis
JP5542530B2 (ja) * 2010-06-04 2014-07-09 株式会社日立ソリューションズ サンプリング位置決定装置
CN102447881A (zh) * 2010-10-13 2012-05-09 鸿富锦精密工业(深圳)有限公司 摄影机装置及利用其进行影像监控的方法
EP3242270B1 (en) * 2010-12-20 2021-03-03 Koninklijke Philips N.V. System and method for automatic generation of initial radiation treatment plans
AU2012219026B2 (en) * 2011-02-18 2017-08-03 Iomniscient Pty Ltd Image quality assessment
JP5773736B2 (ja) * 2011-05-10 2015-09-02 アズビル株式会社 照合装置
US8483489B2 (en) 2011-09-02 2013-07-09 Sharp Laboratories Of America, Inc. Edge based template matching
EP2662827B1 (en) * 2012-05-08 2016-01-13 Axis AB Video analysis
US9269023B2 (en) 2012-05-31 2016-02-23 Sharp Laboratories Of America, Inc. Edge based location feature index matching
CN103853794B (zh) * 2012-12-07 2017-02-08 北京瑞奥风网络技术中心 一种基于部件关联的行人检索方法
US20140160264A1 (en) * 2012-12-10 2014-06-12 The Johns Hopkins University Augmented field of view imaging system
JPWO2014203687A1 (ja) * 2013-06-17 2017-02-23 コニカミノルタ株式会社 画像処理方法、画像処理装置、および画像処理プログラム
US9349076B1 (en) 2013-12-20 2016-05-24 Amazon Technologies, Inc. Template-based target object detection in an image
JP6372198B2 (ja) * 2014-07-01 2018-08-15 セイコーエプソン株式会社 ロボットシステム及び処理装置
JP6406900B2 (ja) * 2014-07-09 2018-10-17 キヤノン株式会社 画像処理方法、画像処理装置、プログラム、記録媒体、生産装置、及び組立部品の製造方法
CN105513038B (zh) * 2014-10-20 2019-04-09 网易(杭州)网络有限公司 图像匹配方法及手机应用测试平台
CN105069488B (zh) * 2015-09-25 2018-06-29 南京信息工程大学 基于模板在线聚类的跟踪方法
US9613295B1 (en) 2016-01-07 2017-04-04 Sharp Laboratories Of America, Inc. Edge based location feature index matching
CN105956198B (zh) * 2016-06-20 2019-04-26 东北大学 一种基于病灶位置与内容的乳腺图像检索系统及方法
EP3435330B1 (en) 2017-07-24 2021-09-29 Aptiv Technologies Limited Vehicule based method of object tracking
US10699126B2 (en) * 2018-01-09 2020-06-30 Qualcomm Incorporated Adaptive object detection and recognition
CN108447045B (zh) * 2018-02-02 2022-03-25 北京理工雷科电子信息技术有限公司 一种基于sat积分图的sar遥感图像水域检测方法
CN109165600B (zh) * 2018-08-27 2021-11-26 浙江大丰实业股份有限公司 舞台演出人员智能搜索平台
CN109766752B (zh) * 2018-11-28 2023-01-03 西安电子科技大学 一种基于深度学习的目标匹配和定位方法及系统、计算机
CN109766943B (zh) * 2019-01-10 2020-08-21 哈尔滨工业大学(深圳) 一种基于全局感知多样性度量的模板匹配方法及系统
CN110084736A (zh) * 2019-04-29 2019-08-02 绍兴聚量数据技术有限公司 一种基于surf和金字塔算法的水印检测方法及系统
CN111047496A (zh) * 2019-12-13 2020-04-21 支付宝(杭州)信息技术有限公司 阈值确定方法、水印检测方法、装置和电子设备
US11562555B2 (en) * 2021-06-02 2023-01-24 The Nielsen Company (Us), Llc Methods, systems, articles of manufacture, and apparatus to extract shape features based on a structural angle template

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1021389A (ja) * 1996-07-03 1998-01-23 Mitsubishi Electric Corp テンプレートマッチング方法およびその装置
JPH11306325A (ja) * 1998-04-24 1999-11-05 Toshiba Tec Corp 対象物検出装置及び対象物検出方法
JP2003346158A (ja) * 2002-05-28 2003-12-05 Toshiba Corp 顔画像による顔領域追跡方法
JP2004265431A (ja) * 2004-04-05 2004-09-24 Konica Minolta Holdings Inc 顔抽出方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW368640B (en) * 1996-12-25 1999-09-01 Hitachi Ltd Image processor, image processing device and image processing method
AU3639699A (en) * 1998-04-13 1999-11-01 Eyematic Interfaces, Inc. Wavelet-based facial motion capture for avatar animation
US6272231B1 (en) * 1998-11-06 2001-08-07 Eyematic Interfaces, Inc. Wavelet-based facial motion capture for avatar animation
FR2831304A1 (fr) * 2001-10-23 2003-04-25 St Microelectronics Sa Detection d'un motif dans une image numerique
US7142699B2 (en) * 2001-12-14 2006-11-28 Siemens Corporate Research, Inc. Fingerprint matching using ridge feature maps

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1021389A (ja) * 1996-07-03 1998-01-23 Mitsubishi Electric Corp テンプレートマッチング方法およびその装置
JPH11306325A (ja) * 1998-04-24 1999-11-05 Toshiba Tec Corp 対象物検出装置及び対象物検出方法
JP2003346158A (ja) * 2002-05-28 2003-12-05 Toshiba Corp 顔画像による顔領域追跡方法
JP2004265431A (ja) * 2004-04-05 2004-09-24 Konica Minolta Holdings Inc 顔抽出方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012143547A (ja) * 2010-12-24 2012-08-02 Canon Inc 被検体情報取得装置及び被検体情報取得方法
JP2017104752A (ja) * 2010-12-24 2017-06-15 キヤノン株式会社 被検体情報取得装置及び被検体情報取得方法
US9741111B2 (en) 2010-12-24 2017-08-22 Canon Kabushiki Kaisha Subject information acquiring device and subject information acquiring method
JP2013109658A (ja) * 2011-11-22 2013-06-06 Nippon Telegr & Teleph Corp <Ntt> 画像検索装置、画像検索方法およびプログラム
JP2013255697A (ja) * 2012-06-13 2013-12-26 Canon Inc 被検体情報取得装置およびその制御方法
JP2014233607A (ja) * 2013-06-05 2014-12-15 独立行政法人国立高等専門学校機構 画像処理装置及び医用画像診断装置
KR101592334B1 (ko) 2014-10-28 2016-02-05 국방과학연구소 위성 영상의 관심 시설 탐색 장치 및 그 방법

Also Published As

Publication number Publication date
EP1693783B1 (en) 2009-02-11
US20080166016A1 (en) 2008-07-10
DE602005012673D1 (de) 2009-03-26
JP4739355B2 (ja) 2011-08-03
EP1693783A1 (en) 2006-08-23
CN101147159A (zh) 2008-03-19
WO2006087580A1 (en) 2006-08-24

Similar Documents

Publication Publication Date Title
JP4739355B2 (ja) 統計的テンプレートマッチングによる高速な物体検出方法
EP1693782B1 (en) Method for facial features detection
Zhang et al. Image segmentation based on 2D Otsu method with histogram analysis
EP1296279A2 (en) Method and computer program product for locating facial features
JP4894741B2 (ja) 情報処理装置および情報処理方法、プログラム、並びに記録媒体
US9129149B2 (en) Information processing apparatus, method, and program
US20230099984A1 (en) System and Method for Multimedia Analytic Processing and Display
WO2019071976A1 (zh) 基于区域增长和眼动模型的全景图像显著性检测方法
US20110013804A1 (en) Method for Normalizing Displaceable Features of Objects in Images
JP5656768B2 (ja) 画像特徴量抽出装置およびそのプログラム
Moradi et al. Deformable registration using scale space keypoints
De Smet et al. A generalized EM approach for 3D model based face recognition under occlusions
CN113436251B (zh) 一种基于改进的yolo6d算法的位姿估计系统及方法
CN111275687B (zh) 一种基于连通区域标记的细粒度图像拼接检测方法
Singh et al. Performance enhancement of 2D face recognition via mosaicing
Ahn et al. Segmenting a noisy low-depth-of-field image using adaptive second-order statistics
Jang Lip contour extraction based on active shape model and snakes
Kwon et al. Rolled fingerprint construction using MRF-based nonrigid image registration
Ye et al. Reading labels of cylinder objects for blind persons
JP2021009493A (ja) 画像処理装置、画像処理装置の制御方法及びプログラム
Nezhinsky et al. Efficient and robust shape retrieval from deformable templates
KR101426039B1 (ko) 얼굴/물체 인식을 위한 특징점 검출 장치 및 방법
Kakar Passive approaches for digital image forgery detection
Rashad et al. 3D face recognition using 2DPCA 3D face recognition using 2DPCA
Celik et al. Fast object-based image registration using principal component analysis for super-resolution imaging

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090217

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100608

A524 Written submission of copy of amendment under article 19 pct

Free format text: JAPANESE INTERMEDIATE CODE: A524

Effective date: 20100907

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101012

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110107

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110412

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110427

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140513

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees