JP5063776B2 - 幾何学変換に基づく一般化統計的テンプレートマッチング - Google Patents

幾何学変換に基づく一般化統計的テンプレートマッチング Download PDF

Info

Publication number
JP5063776B2
JP5063776B2 JP2010502558A JP2010502558A JP5063776B2 JP 5063776 B2 JP5063776 B2 JP 5063776B2 JP 2010502558 A JP2010502558 A JP 2010502558A JP 2010502558 A JP2010502558 A JP 2010502558A JP 5063776 B2 JP5063776 B2 JP 5063776B2
Authority
JP
Japan
Prior art keywords
template
image
sum
pixel values
line segments
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2010502558A
Other languages
English (en)
Other versions
JP2010524111A (ja
Inventor
シビリヤコブ、アレクサンダー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric R&D Centre Europe BV Netherlands
Original Assignee
Mitsubishi Electric R&D Centre Europe BV Netherlands
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric R&D Centre Europe BV Netherlands filed Critical Mitsubishi Electric R&D Centre Europe BV Netherlands
Publication of JP2010524111A publication Critical patent/JP2010524111A/ja
Application granted granted Critical
Publication of JP5063776B2 publication Critical patent/JP5063776B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • G06V10/507Summing image-intensity values; Histogram projection analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/758Involving statistics of pixels or of feature values, e.g. histogram matching

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Image Analysis (AREA)

Description

[発明の背景]
[発明の分野]
本発明は、画像中の物体を検出または位置特定するための方法および装置に関する。具体的には、本発明は、物体に幾何学変換が行われた場合に、テンプレートを画像にマッチングさせることでテンプレートに対応する物体を位置特定するための方法および装置に関する。本発明は、さらに、画像中の物体の幾何学変換を決定するための方法に関する。
[背景技術の説明]
テンプレートマッチング(TM)とは、画像中の物体または物体の部分を見付けるための標準的なコンピュータビジョンツールである。テンプレートマッチングは、リモートセンシング、医用画像、および産業における自動検査を含む多くの用途で用いられている。現実世界の物体を検出することは、照明および色の変化、部分遮蔽、背景におけるノイズおよびクラッタ、ならびに物体そのものにおける動的変化の存在により困難な課題となっている。
各種のテンプレートマッチングアルゴリズムが提案されている。例えば、P. Viola, M. Jones, "Rapid object detection using a boosted cascade of simple features" (IEEE CVPR、511〜518ページ、2001年;下記文献1)、および欧州特許出願公開第1693783A1号明細書(下記文献2)には、単純な矩形特徴に基づく極めて高速な計算が記載されている。他の例(Jain, Y. Zhong, S. Lakshmanan, "Object Matching Using Deformable Templates" (IEEE TPAMI、第18巻(3)、267〜278ページ、1996年;下記文献3)、およびS. Yoshimura, T. Kanade, "Fast template matching based on the normalized correlation by using multiresolution eigenimages" (IEEE/RSJ/GI Int. Conf. on Intelligent Robots and Systems (IROS '94)、第3巻、2086〜2093ページ、1994年;下記文献4)等)には、剛体変形または非剛体変形させたテンプレートを画像データに適合させることが記載されている。
テンプレートマッチングの一般的なストラテジは、以下の通りである。すなわち、可能性のあるすべての位置、回転、スケーリング、または他の幾何学変換について、各画像領域をテンプレートと比較し、最良のマッチングスコアを選択する。この計算コストが高いアプローチは、O(Nlgt)回の演算を要し、Nlは画像中の位置の数、Ngは変換サンプルの数、およびNtはマッチングスコアの計算に用いられる画素の数である。多くの方法により計算の複雑さを低減することが試みられている。NlおよびNgは、通例、多重解像度アプローチ(例えば下記文献4等)により低減される。テンプレートと画像パッチとの差異が平行移動のみによるものと仮定し、幾何学変換をまったく考慮しないマッチングストラテジも多い(下記文献11等)。
テンプレートマッチングを行う他の方法には、勾配降下または勾配上昇最適化法を用いてテンプレートを直接適合させることで、最良のマッチが見付かるまで幾何学変換を反復的に調整するというものがある。かかる手法は、Lucas, T. Kanade, "An iterative image registration technique with an application to stereo vision" (Proc. of Imaging understanding workshop, 121〜130ページ、1981年;下記文献10)に記載されている。これらの手法には、正しい解に近い初期近似が必要である。
高速テンプレートマッチング法(下記文献1、2、5、6、7に記載のもの等)において、上で定義した計算の複雑さにおけるNt項は、テンプレートの単純化、例えばテンプレートを矩形の組み合わせとして表すことにより低減される。特別な画像前処理手法(いわゆるインテグラルイメージ(integral images))を用い、かつ単純化された類似度スコア(すなわちテンプレートにより定義された「正」および「負」の画像領域間の正規化されたコントラスト)を計算することで、高速テンプレートマッチングの計算速度は、テンプレートのサイズと無関係になり、テンプレートの複雑さ(テンプレートを構成する矩形の数)のみに依存するようになる。しかし、ハールライク特徴(Haar-like特徴)は回転に対して不変ではなく、画像回転を扱うようにこの枠組みを拡張したものがいくつか提案されている。例えば、M. Jones, P. Viola, "Fast Multi-view Face Detection" (IEEE CVPR、2003年6月;下記文献5)には、対角矩形テンプレートの追加セットが提案されている。R. Lienhart, J. Maydt, "An extended set of Haar-like features for rapid object detection" (ICIP '02、900〜903ページ、第1巻、2002年;下記文献6)には、45°回転させたインテグラルイメージを介して計算された45°ねじれたハールライク特徴が提案されている。Messom, C. H. および Barczak, A. L. "Fast and Efficient Rotated Haar-like Features using Rotated Integral Images" (Australasian Conf. on Robotics and Automation、2006年;下記文献7)では、この考えをさらに拡張し、全体の整数画素に基づく回転を行ったハールライク特徴およびインテグラルイメージの多数のセットを用いている。
上記の高速テンプレートマッチングの枠組みには、計算コストが高い相関ベースのTM法においては現れない、いくつかの潜在的な欠点がある。
第1の欠点は、2領域のハールライク特徴を3つ以上の画素グループの場合に一般化することが容易でないことである。加えて、矩形ベースの表現は、曲線的な物体の形状、例えば円などについては冗長である。かかる場合は、矩形テンプレートの代わりに曲線テンプレートを使用した方が、より高いマッチングスコア、ひいてはより良好な検出性能が得られるはずである。
その上、ブースティングに基づく強力な分類子を用いることによりハールライク特徴で印象的な結果が得られる(下記文献1におけるように)が、かかる手法は、大規模なデータベース上でのトレーニングを要する。そのため、単一の物体テンプレートを用いるマッチング(グレースケールのテンプレートを用いる相関ベースのテンプレートマッチングにおいて追加コストなしで実現可能)は、この枠組みにおいて容易に行うことができず、また、単純な形状およびバイモーダルな輝度分布を有する物体についてしか行うことができない。
本願は、計算の複雑さおよびこのマッチング速度の点において、高速テンプレートマッチング法と標準的な相関ベースのテンプレートマッチング法との間に位置付けられる新しいアプローチを提案する。提案するアプローチは、上記の既存手法の制限のいくつかに対処し、また、オプションで、物体の位置および変換を精密に推定するための反復的に精緻化を行う枠組みにも拡張可能である。
[発明の要約]
テンプレートが注目物体を任意形状の画素グループのセットにより簡潔に表現したものであり、テンプレートと画像領域との類似度がいわゆるF検定統計量から導出される、新しいテンプレートマッチングの枠組みを提案する。
幾何学変換された物体をマッチングさせるため、一実施形態では、テンプレートの幾何学変換されたバージョンのセット(例えば、パラメータの所定の離散的なセットを用いる回転およびスケーリングから得られるもの)を、画像中の各位置において適用し、最良のマッチングスコアを与える幾何学変換されたテンプレートの幾何学パラメータを、対応する位置に関連付ける。
本発明の実施形態によれば、インテグラルイメージの1D相似(1D analogue)(本明細書では「インテグラルライン(integral line)」と言う)を用いて、効率的なマッチングが達成される。これにより、マッチングスコアの計算に要される演算の数が、テンプレートのサイズに対して線形になる。これに比して、従来のテンプレートマッチングでは、二次関数的に依存している。この1Dのインテグラルラインの手法は、2Dのインテグラルイメージの特定の場合として見ることもできるが、本発明者らは、テンプレートマッチングの適用可能エリアが、インテグラルイメージを用いる場合よりもインテグラルラインを用いる場合の方がはるかに広いことを期せずして認識した。特に、インテグラルイメージの手法は、物体形状が矩形の組み合わせから形成されていることを要求する一方、本発明のインテグラルラインの方法は、線分の組み合わせのみを要求する。いずれのラスター化された2D形状も線分の組み合わせとして表すことが可能であるため、線分の組み合わせの方がより一般的である。
実施形態では、テンプレートとテンプレートの幾何学変換された各バージョンとをラスター化して線分のセットを得る(線分の各セットは、テンプレートの1つの領域のラスター化されたバージョンである)。類似度スコア(下記数式(9)により定義される類似度スコア等)を用いて、最大数の線分を有する1つ以上の複雑な領域を計算から除外する。回転対称なテンプレート(その外側領域が円形である場合)については、外側領域について計算された中間項を格納することにより、類似度スコアをさらに単純化することができる。
一実施形態では、テンプレートが幾何学変換された複数のバージョンの離散的なセット(所定のスケーリングおよび回転パラメータのみに対応する)を用いて、類似度スコアを計算する。幾何学変形が十分に小さくスケーリングおよび回転により近似が得られるという仮定は制約的であるが、適応的サブピクセル精緻化法を用いて、任意なパラメトリック2D変換に基づく物体のマッチングの正確性を高めることができる。マッチングスコアを最大化するパラメータは、いわゆる「勾配上昇/降下法」により求めることができる。一実施形態では、これを、等価な固有値問題の解を求めることにまで簡素化可能である。
後続の説明および付帯の請求項から、本発明のさらなる好適な特徴およびオプションの特徴が明らかになろう。
以下、添付の図面を参照して、本発明の実施形態を例示により説明する。
本発明の実施形態による方法の各ステップを説明するフロー図である。 (a)は円形の3領域で構成されるテンプレートを示す図である。(b)は画像中の注目している第1の領域(R1)を示す図である。(c)は画像中の第2の領域(R2)を示す図である。(d)は画素グループが類似しているテンプレートによりR1を3領域に分解した状態を示す図である。(e)は異なる画素グループでR2を分解した状態を示す図である。 射影モデルにおける物体変換の説明図である。 本発明に従い、2領域のテンプレートを45°回転させた状態、およびそれを線のセットにより表現したものを示す説明図である。 (a)はテスト画像を示す図である。(b)は2領域のテンプレートを示す図である。(c)は、本発明の実施形態の方法に従い図5(b)の2領域テンプレートを図5(a)の画像に適用した際のマッチングスコアマップを示す図である。 (a)は射影変換が行われたテスト画像を示す図である。(b)は2領域のテンプレートを示す図である。(c)は本発明の実施形態の方法に従い図6(a)の画像に規制解除を行った状態の説明図である。(d)は本発明の実施形態の方法に従い画像パッチ変換を反復した状態の説明図である。
以下の説明において、画像に対応する信号および画像中の検出対象物体のテンプレートの処理に関わるテンプレートマッチングについて説明する。この処理は、いかなる好適なシステムまたは装置によっても行うことが可能であり、また、ソフトウェアの形態で実装することが可能である。テンプレートマッチング処理では、画像中のテンプレートの各位置に対して「マッチングスコア」(「類似度スコア」とも言う)が生成される。
本発明による方法は、欧州特許出願公開第1693783号明細書(下記文献2;その内容は参照により本明細書に組み込まれる)において最初に紹介された、いわゆる統計的テンプレートマッチング(STM)に基づくものである。統計的テンプレートマッチングの枠組みは、上述の高速テンプレートマッチングの枠組みに非常に類似している。主たる差異は、統計的テンプレートマッチングがF検定統計量から導出される異なるマッチングスコアを用いることにより、複数の画素グループに対応している点である。統計的テンプレートマッチング法を以下で概説する。
以下の説明において、本発明の実施形態による一般化統計的テンプレートマッチングを用いる方法を説明する。その後、本方法を実装する際に用いる特定の実施形態を詳細に説明する。本発明の第1の実施形態は、回転およびスケーリングされた物体をマッチングさせるための統計的テンプレートマッチングの新しい拡張に関するものである。この拡張は、以下でより詳細に説明するように、「インテグラルライン」の使用に基づく。また、第2の実施形態は、物体のパラメトリック2D変換を正確に推定するために好適な、「適応的サブピクセル(AS)STM」と称される他の新しい拡張に関するものである。第3の実施形態は、ハールライクテンプレートの特定の場合についての効率的な解決法に関するものである。
従来技術の統計的テンプレートマッチングアプローチの概説
「統計的テンプレートマッチング」の名称は、画素グループの統計的特性(平均および分散等)のみが解析に用いられるという事実に由来している。これらの画素グループは、トポロジテンプレート(2グループの場合におけるハールライク特徴に類似したものである)により決定される。トポロジテンプレートは、物体の各部分の空間的関係を表すN個の領域のセット(T0=T1∪...∪TN)である。各領域Tiは、任意の形状からなる互いに隔たった複数のサブ領域で構成されてもよい。複数のテンプレート領域により定義される、画像の複数の画素グループが、互いに統計的に異なるならば、これら複数の画素グループは注目物体に属する可能性が高い。この原理は、図2に示す単純化された例により実証可能である。図2(a)は、円形の3領域T1、T2、およびT3で構成されるテンプレートを示す。図2(b)および図2(c)は、それぞれ、注目している第1および第2の領域R1およびR2を示す。テンプレートT0=T1∪T2∪T3を、画像領域R1およびR2とマッチングさせる。第1の場合、すなわちテンプレートT0を画像領域R1とマッチングさせるとき、図2(d)に示すように3つの画素グループは類似しているので、3つの画素グループは概ね同じ平均値を有する。第2の場合、すなわちテンプレートT0を画像領域R2とマッチングさせるときは、図2(e)に示すように、画素グループが異なる(それぞれ黒、ダークグレー、およびライトグレーという平均色になる)。このことから、画像領域R2はテンプレートに類似していると結論付けることが可能である。
形式的には、テンプレートT0と画像領域
Figure 0005063776
(画素
Figure 0005063776
を中心とする)との間のかかる類似度(マッチングスコア)は、いわゆるF検定統計量から導出される。領域Ti(i=0,...,N)における画素数、画素値の平均、および画素値の分散を、それぞれni、mi、およびσi 2と表す。画素値は正規分布かつ等分散であると仮定し、標準的な分散分析(ANOVA)手法を用いると、グループ間分散VBGおよびグループ内分散VWGは、次式で定義される:
Figure 0005063776
BGおよびVWGの自由度ならびに関係VBG+VWG=n0σ0 2を考慮に入れ、等価変換を適用すると、F変数は次式になる:
Figure 0005063776
数式(2)における定数項を除去すると、マッチングスコア(または類似度スコア)についての式は、次式として得られる:
Figure 0005063776
すべての画素
Figure 0005063776
について計算すると、数式(3)を用いて導出されるマッチングスコアは信頼度マップを形成し、そのマップ内の極大値は、尤度が高い物体位置に対応する。統計量miおよびσiを用途毎に分析することで、誤検出の数を低減する一助となる。物体の部分の測光的性質(例えば、一部の領域が他の領域よりも暗い、またはテクスチャ感が少ない)が予め与えられているときは、追加の制約(関係式(4)等)により誤った極大値が排除される。
i<mj、σi<σj(4)
ハールライク特徴(N=2)については、数式(3)におけるマッチングスコアは、T検定統計量の2乗からも導出可能である。この値は、信号対雑音比(SNR)の2乗であり、1(雑音;すべてのグループが類似している場合に対応する)から無限大(純粋な信号;テンプレートが画素グループのレイアウトを厳密に決定し、グループ内のすべての画素が等しい場合に対応する)までの範囲である。画像パッチにおける画素値の分布は、任意である可能性があり、通例、上記仮定(正規分布、等分散)を満たさない。そのため、実際には、数式(3)におけるマッチングスコアをSNRとして解釈するのが便利である。F変数についての統計表を用いる代わりに、1よりも大きい妥当なSNR閾値により、テンプレートと画像領域との間の数式(3)における類似度が十分に大きいかどうかを判定可能である。
欧州特許出願公開第1693783号明細書(下記文献2)によるSTMのリアルタイム実装では、矩形の集合で構成される領域Tiを有するテンプレートが用いられる。以下の説明から、本発明に従い、インテグラルイメージを用いることで、8ki回のメモリ参照(kiはTiにおける矩形の数である)のみにより数式(3)から得られる画素の分散が算出される、ということが理解されよう。
一般化STMを用いる方法
図1は、本発明の実施形態による、上記の原理を一般化する統計的テンプレートマッチングの方法を示す。ステップ100で、注目物体についてのテンプレートを受け取り、幾何学変換の所定のセットを適用して幾何学変換されたテンプレートのセットを導出する。ステップ110で、幾何学変換されたテンプレートの各々をラスター化して、幾何学変換されたテンプレートの各々について線分のセットを生成する(テンプレートの各領域は、線分のサブセットを含む)。ステップ120で、オプションとして、ラスター化されたテンプレートの最も複雑な領域(例えば、線分の数が最大または閾値数の領域に対応する)の1つ以上を破棄して、幾何学変換されたテンプレートの各々について低減された線分のセットを得る。次いで、これらを用いて統計的テンプレートマッチングを行う。
ステップ200において、テスト画像を画素単位で走査し、画像の現在位置において以下のようにテンプレートマッチングを行う。ステップ130では、テンプレートが円形テンプレートであるかを判定する。テンプレートが円形であれば、テンプレート全体の回転を考慮に入れない単純化されたマッチングスコア計算を用いてテンプレートマッチングを行う。あるいは、テンプレートが円形でなければ、以下で説明する標準的なマッチングスコア計算を用いてテンプレートマッチングを行う。
テンプレートが円形であれば、ステップ140において、テスト画像の現在位置で単純化されたマッチングスコア計算を行い、画像の現在位置におけるそのテンプレートについてのマッチングスコアのセット(つまり、そのテンプレートが幾何学変換された各バージョンについてのマッチングスコア)を生成する。テンプレートが円形でなければ、ステップ150で、テスト画像の現在位置で標準的なマッチングスコア計算を行い、画像の現在位置におけるマッチングスコアのセットを生成する。
ステップ160では、ステップ140またはステップ150のいずれかから得たマッチングスコアのセットを受け取り、最良のマッチングスコア(例えば、最大のスコア)を選択し、画像の現在位置についての、マッチングスコアが最良となるテンプレートの幾何学変換に対応する、最良の幾何学パラメータを出力する。
次いで、すべての画像位置について、上記のようにステップ140〜160に従って統計的テンプレートマッチングを行い、画像のすべての位置についてのマッチングスコアマップおよび幾何学パラメータマップをステップ170に出力する。
ステップ170で、マッチングスコアの極大値を選択し、極大値に対応する物体の位置および変換を出力する。オプションとして、ステップ180で、本発明の代替的な実施形態に従い、適応的サブピクセル統計的テンプレートマッチングにより位置および変換の精緻化を行う。下記の説明から理解されるであろうように、ステップ180により、より複雑な幾何学変換の場合に、正確な物体の位置および変換が得ることが可能になる。
当業者が理解するであろうように、図1に説明する本発明の実施形態の方法は、画像に対応する信号を処理するためのプロセッサと、画像およびテンプレートについてのデータを格納するためのメモリとを含むいかなる好適な装置により行ってもよい。本方法は、プロセッサにより実行可能な命令を有するコンピュータ可読媒体上に格納されたコンピュータプログラムの形態で実装してもよい。
ステップ150におけるマッチングスコア計算およびステップ140における単純化されたマッチングスコア計算を行うための手法を、以下で説明する。加えて、代替的な実施形態の適応的サブピクセル統計的テンプレートマッチング手法を、その後で説明する。
幾何学変換に基づく一般化STM
本発明による一般化STM(GSTM)では、未知のパラメータ
Figure 0005063776
を有する変換
Figure 0005063776
により変換された注目物体について考える。これを図3に概略的に示す。物体を正確にマッチングさせるために、テンプレートは同じモデル
Figure 0005063776
を用いて変換すべきである。パラメータが未知であるため、それらの離散値pi (j)=pi min+jΔpiのすべての組み合わせ
Figure 0005063776
を用いてテンプレートを変換し、最良のマッチングスコアを次式で計算する:
Figure 0005063776
次式の最良のパラメータの組み合わせのインデックスを格納することにより、
Figure 0005063776
近似した物体のポーズを復元可能である。パラメータの組み合わせの数および計算時間は、パラメータの数に対して指数関数的に増大する。そのため、最小数のパラメータを使用することが不可欠である。下記文献4〜7などのような多くのアプローチでは、回転およびスケーリングのために2つの追加パラメータのみを要する相似変換(similarity transform)により、中程度のアフィン歪みおよび射影歪みの良好な近似が得られるという事実が用いられている。本発明の実施形態による方法では、図1に示すように、ステップ100で、相似変換の所定のセットをテンプレートに適用し、各位置について、最良のマッチングスコアを与えるテンプレートならびに対応する回転およびスケーリングパラメータを、上記数式(5)〜(6)を用いて選択する。
この手法は、幾何学変形が十分に小さく相似変換により近似が得られるという仮定に基づくものである、ということが理解されよう。しかし、場合により、この仮定は制約的である。このため、下記で説明する代替的な実施形態では、フルパラメトリック2D変換を復元するために反復的手法を用い、その初期近似として第1の実施形態の相似変換が用いられる。
本実施形態によれば、および図1を再び参照して、ステップ110で、変換された各テンプレートをラスター化し、各テンプレート領域を、図4に示すように線分のセット{si,j|si,j=(x1,x2,y)i,j}により表す:
i=si,1∪si,2∪si,3∪...
図4に示すように、各線分は、高さ1画素の矩形であり、従って、インテグラルイメージ手法を用いることで、統計的テンプレートマッチングを用いて数式(3)におけるように分散を計算可能である。しかし、本発明によれば、線分を効率的に扱うより最適な計算方法は、次式のように定義されるインテグラルイメージの一次元相似、すなわちインテグラルラインを用いる:
Figure 0005063776
y軸に沿って積分を行う垂直インテグラルライン(integral vertical line)についても、同様に定義することが可能である。数式(3)における分散の計算に要求される合計を、インテグラルラインを介して次式のように計算可能である:
Figure 0005063776
式中、I1(−1,y)=I2(−1,y)=0である。従って、メモリ参照の回数は、「画素の数」から「ラスター化されたテンプレートにおける線の数」まで低減される。
効率的に実装するため、数式(3)をより便利な形式で、数式(8)の定義を用いて次式(9)により表現可能である:
Figure 0005063776
このように、アルゴリズムは、マッチングスコアを計算するために画素値viの2乗を複数回合計することを要さない。テンプレートT0全体における画素値の2乗の合計、およびT0,T1,...,TN-1における画素のN個の合計のみを計算すれば十分である。その上、回転対称なテンプレート(円形のT0等)については、v0およびu0が各回転角度について一定であり、u1,...,uM-1のみに再計算が必要である。TNは最大数の線で構成される最も複雑な領域を表し得るため、計算から1つの領域TNを排除することで、計算速度における追加の利点が与えられる。テンプレートの回転中に線の構成が変化することで、各回転角度における最も複雑な領域が替わる。
当業者が理解するであろうように、欧州特許出願公開第1693783号明細書(下記文献2)に記載の高速統計的テンプレートマッチングは、テンプレートのサイズとは無関係にΣ8ki回のメモリ参照(kiは領域Tiにおける矩形の数である)を要する。相関ベースのテンプレートマッチングは、Nt(画素数)回のメモリ参照を要し、テンプレートのサイズに二次関数的に依存する。本発明の一般化STMにおいて、メモリ参照の回数は、4k0+2k1+...+2kN-1回である(kiはテンプレート領域Tiにおける線の数である)。線の総数は、テンプレートの高さに領域数Nを乗算したものに概ね比例する。そのため、テンプレートのサイズに線形的に依存する。従って、本発明による方法の計算効率は、高速テンプレートマッチング法と相関ベースのテンプレートマッチング法との間である。
図5は、上記の本発明の一般化統計的テンプレートマッチング(GSTM)手法を用いる画像マッチング例の説明図である。図5(a)は、注目画像を示し、この画像は、図5(b)に示すテンプレートにより表現される物体(象)の幾何学変換された多数の異なるバージョンを含んでいる。GSTM手法により、画像中のすべての位置について最良の類似度スコアを与える類似度マップが出力される。図5(c)は、図5(b)のテンプレートを用いた図5(a)の画像についてのかかる類似度マップの説明図であり、類似度スコアの大きい値は白色、小さい値は黒色で表されている。図5(c)に見られるように、類似度マップにおけるピーク値が識別され、それらは、元画像中の物体の位置に対応している。
適応的サブピクセル統計的テンプレートマッチング
一般的な場合
上で述べたように、本発明の代替的な実施形態は、回転およびスケーリングのみに制限されず、全変換(full transformation)
Figure 0005063776
(図3)を用いて高い正確性で、物体の位置および変換を反復的に推定する。本実施形態では、すべてのシミュレーションについて、8つの変換パラメータ
Figure 0005063776
を有する射影モデルが用いられるが、他の任意のパラメトリック変換も適用可能である。この反復的STM法の目標は、画像データから適応的に変換パラメータ
Figure 0005063776
を計算することで、特定の物体位置
Figure 0005063776
でのマッチングスコア
Figure 0005063776
を最大化することである。上記の第1の実施形態の離散的方法を用いることで、物体位置の初期近似
Figure 0005063776
および初期変換パラメータ
Figure 0005063776
を求めることが可能である。標準的な反復的画像位置合わせ手法(下記文献10に記載)に従って、初期位置(x0,y0)の近くに、変換後の画素(x’0,y’0)の線形近似を得ることが可能である。かかる近似は、次式により与えられる:
Figure 0005063776
式中、
Figure 0005063776
はパラメータ補正のベクトルであり、さらに
Figure 0005063776
である。
数式(12)は、座標についての画像関数の偏導関数を含む。本実施形態では、それらを、付録1に示す離散的近似を用いて計算する。数式(12)は、また、変換のパラメータについての変換された座標の偏導関数も含む。変換モデルが与えられれば、それらは解析的表現を有する。本実施形態では、射影モデルが用いられ、かかる導関数を付録1に提示する。
数式(8)から、ui 2およびviについての線形化された表現は、次式の行列形式を有する:
Figure 0005063776
数式(13)および(14)を数式(9)に代入すると、線形化されたマッチングスコアがレイリー商(Rayleigh quotient)の形式で得られる:
Figure 0005063776
式中、
Figure 0005063776
である。行列
Figure 0005063776
および
Figure 0005063776
は、同じ共分散行列
Figure 0005063776
を1階数変更したもの(one-rank modification)である。それらは、定義により対称的であり、および正定値(positive-definit)である。これは、商(15)における分子および分母がともに画像分散であるという事実による。
レイリー商(15)を最大化することは、次式の一般化された固有値問題の解を求めることと等価である:
Figure 0005063776
線形代数に基づくいずれかの従来技術による方法を用いて、最大の固有値S(最大化されたマッチングスコアでもある)および対応する固有ベクトル
Figure 0005063776
(画像変換パラメータに対する補正)を求めることが可能である。かかる方法の例には、べき乗反復および逆反復がある(詳細な検討については下記文献8を参照)。固有ベクトル
Figure 0005063776
が求められたら、
Figure 0005063776
の形式の任意のベクトルが数式(16)の解となる。収束性を改善し、最大値周辺における解の振動を防止する最適なαを選択することが可能である。この直線探索(Linesearch)ストラテジは、ロバストな解を提供することが見出されている。このストラテジおよび他のストラテジは、下記文献9において詳細に検討されている。
元の非線形問題は、線形化された解法を反復的に適用することにより解を求めることが可能である。マッチングスコア、画像パッチの中心、および/またはパラメータ補正が大きく変化しなくなったら、反復を終了する。以下はASSTMアルゴリズムの概説である。
ASSTM
1.GSTM法により得られる初期値S0
Figure 0005063776
から反復n=0にて開始する。
2.現在のパラメータ
Figure 0005063776
を用いて座標
Figure 0005063776
を中心とする画像パッチを再サンプリングする。
3.再サンプリングされた画像パッチf(xn’,yn’)から画像の導関数を計算;{pi}の現在の値を用いて(12)における変換モデル
Figure 0005063776
の偏導関数を計算する。
4.行列
Figure 0005063776
を計算し、(16)の最大の固有値Smaxおよび固有ベクトル
Figure 0005063776
を求めることにより最適化問題(15)の解を求める。
5.直線探索ストラテジを用いて
Figure 0005063776
を最大化するαnを求める。
6.パラメータを更新:
Figure 0005063776
新しい物体位置は
Figure 0005063776
とする。
7.
Figure 0005063776
および/または|Sn+1−Sn|<ε2であれば、終了する。そうでなければ、ステップ2に進み、次の反復n=n+1を行う。
このアルゴリズムのステップ2、3では、画像処理が行われ、その詳細を付録1に提示する。他のステップでは、従来技術の線形代数法に基づく算術演算のみが行われる。
当業者が認識するであろうように、上記アルゴリズムは、勾配上昇法における幾何学変換の初期近似としてGSTMの結果を用いる、ASSTM法を実装する一例を提供しているにすぎない。他の例も可能である。加えて、最良のマッチが最小となるように類似度スコアが定義される場合は、勾配降下法が用いられよう。
2領域の場合における効率的な解決法
テンプレートが2つの領域で構成される(T0=T1∪T2)場合は、反復を要さない固有値問題(16)の解析解が存在する。この場合、行列
Figure 0005063776
は、
Figure 0005063776
である。それらの行列には、
Figure 0005063776
(14)の定義から導出される
Figure 0005063776
の関係があり、式中、α=n12/n3、および
Figure 0005063776
である。
ベクトル
Figure 0005063776
は、領域T1と領域T2との間のコントラストを線形化したものである。(16)の解は、次の数式(18)、(19)により与えられる:
Figure 0005063776
説明を完全なものにするため、数式(18)、(19)の証明を付録2に提示する。これらの結果を用いて、ASSTMアルゴリズムのステップ4を以下のように実施する。
4.1)行列
Figure 0005063776
およびベクトル
Figure 0005063776
を計算する。
4.2)効率的なCholecky分解法により系
Figure 0005063776
の解を次のように求める:
4.2.1)Cholecky分解
Figure 0005063776
Figure 0005063776
は下三角行列である)を適用し、
4.2.2)単純化された線形系
Figure 0005063776
の解を求め、中間ベクトル
Figure 0005063776
を求め、
4.2.3)単純化された線形系
Figure 0005063776
の解を求め、要求されるベクトル
Figure 0005063776
を求める。
図6は、合成画像データに対して、上記の本発明の適応的サブピクセル統計的テンプレートマッチング(ASSTM)手法を用いる例の説明図である。図6(a)は、注目画像を示し、この画像は、図6(b)に示すテンプレートにより表される物体(象)の幾何学変換された単一のバージョンを含んでいる。GSTM手法により、画像についての最良の類似度スコアを発生させる幾何学変換されたテンプレートに対応する、幾何学変換の初期近似が出力される。次いで、適応的サブピクセル統計的テンプレートマッチング(ASSTM)手法を図6(c)の初期近似に適用し、物体の幾何学変換の反復を導出する。図6(d)は、幾何学変換のこのような反復を用いて導出された画像パッチ(図6(c)の画像が変換されている)を示す。18回目の反復が図6(b)のテンプレートに対応していることが分かる。
代替的な用途
提案した方法を用いて、下記文献1の高速な物体検出の枠組みを、以下のものに一般化することも可能である:
・非ハールライク特徴
・複雑な形状の特徴
・任意に配向された特徴
本方法は、標準的なテンプレートマッチング法が通例適用される状況であれば、いかなる場合においても、用途別のトポロジテンプレートに適切な設計を用いて適用可能である。
他の用途には、映像符号化がある。映像符号化では、局所動きベクトルがブロックマッチング法により抽出される。これらの方法は、テンプレートのサイズに対して二次関数的な複雑さを有する相関ベースのテンプレートマッチングの枠組みの変形である。テンプレートを等価なトポロジテンプレートで置換し、数式9のマッチングスコアを計算すると、アルゴリズムの複雑さがテンプレートのサイズに対して線形的となるため、映像の符号化をより高速かつより正確なものにすることが可能である。
他の用途には、マルチモーダル画像の位置合わせがある。かかるデータの例には、例えば光学カメラおよび合成開口レーダ(SAR)などの異なるセンサにより撮影された同じシーンの複数の画像がある。このような場合、対応画素の大半は無相関であることが多く、標準的なテンプレートマッチング手法では失敗する。同時に、解析者は、両方の種類のデータ中に現れる複数の領域で構成されるいくつかの高レベル構造を検出することが可能である。リモートセンシングデータにおいて、これらは、川、湖、野原、道路などであり得る。1つの画像中に現れる領域の集合としてトポロジテンプレートを定義することにより、未知のパラメータを有する幾何学変換により変換された他の画像を、提案した方法により位置合わせすることが可能である。
従来技術の参照
1. P. Viola, M. Jones, "Rapid object detection using a boosted cascade of simple features" (IEEE CVPR、511〜518ページ、2001年)
2. Sibiryakov, M. Bober, "Fast method of object detection by statistical template matching" (欧州特許出願第05250973.4号)
3. Jain, Y. Zhong, S. Lakshmanan, "Object Matching Using Deformable Templates" (IEEE TPAMI, 第18巻(3)、267〜278ページ、1996年)
4. S. Yoshimura, T. Kanade, "Fast template matching based on the normalized correlation by using multiresolution eigenimages" (IEEE/RSJ/GI Int. Conf. on Intelligent Robots and Systems (IROS '94), 第3巻、2086〜2093ページ、1994年)
5. M. Jones, P. Viola, "Fast Multi-view Face Detection"(IEEE CVPR、2003年6月)
6. R. Lienhart, J. Maydt, "An extended set of Haar-like features for rapid object detection" (ICIP '02、900〜903ページ、第1巻、2002年)
7. Messom, C. H. および Barczak, A. L., "Fast and Efficient Rotated Haar-like Features using Rotated Integral Images" Australasian Conf. on Robotics and Automation、2006年)
8. Golub, C. Van Loan, "Matrix computations" (Johns Hopkins University Press、メリーランド州ボルティモア市、1996年、ISBN:0-8018-5414-8)
9. N. Gould, S. Leyffer, "An introduction to algorithms for nonlinear optimization" (J. F. Blowey, A. W. Craig, および T. Shardlow, "Frontiers in Numerical Analysis" (109〜197ページ、Springer Verlag, ベルリン市、2003年)において)
10. Lucas, T. Kanade, "An iterative image registration technique with an application to stereo vision" (Proc. of Imaging understanding workshop、121〜130ページ、1981年)
11. Zitova, J. Flusser, "Image Registration Methods: a Survey, Image and Vision Computing" (第24巻、977〜1000ページ、2003年)
当業者が理解するであろうように、記載の実施形態には、多くの変形および修正を行うことが可能である。例えば、本発明は、他の既存の関連手法、例えば上で挙げた文献において教示されている実装を組み合わせた実施形態で実装することが可能である。かかる既存の関連技術の組み合わせは、当業者により直ちに理解されるものであり、すべてのかかる組み合わせ、ならびに本発明の範囲に該当する記載の実施形態のすべてのかかる修正および均等物を含むことが意図される。
付録1:ASSTMアルゴリズムにおける画像処理ステップ
ASSTMアルゴリズムにおける画像処理ステップ2および3を、数式(20)により与えられる射影変換モデルを用いて実証する。図3の概略表現も参照のこと。
Figure 0005063776
いくつかの他の変換モデルも、数式(20)により表され、例えば、アフィンモデルにおいてはp7=p8=0、類似度モデル(回転およびスケーリングのみ)においてはp1=p5、p2=−p4、p7=p8=0となる。そのため、かかるモデルも、暗黙的に記載の実施形態により扱われる。
ステップ2において、現在位置を中心とする画像パッチを、(20)を用いて変換する。これは正変換(forward transformation)であり、整数座標が浮動小数点座標にマッピングされるため、変換画像の計算にはそれほど好適でない。整数座標(x’,y’)における画素値f(x’,y’)は、変換式(20)を反転させたものを用いることにより、および整数座標(x,y)における既知の画素f(x,y)を補間することにより求められる。これは、周知の反転マッピング法である。整数座標(x’,y’)の規則格子における画像f(x’,y’)を得た後、数式(12)に含まれる画像の導関数を、それらの離散的近似により数式(21)として得る:
Figure 0005063776
式中、簡潔さのため座標(x’,y’)は(x,y)に置換されている。
数式(12)における偏導関数の他のセットは、方程式(20)を微分して計算され、例えば:
Figure 0005063776
式中、a=p7x+p8y+1である。
付録2:2領域テンプレートについての固有値問題すなわち数式(16)の解
命題:固有値問題(16)の最大の固有値および対応する固有ベクトルは、
Figure 0005063776
となる。
証明:数式(16)と同じ固有ベクトルを持ち、かつλ=S−1として変換される固有値λを有する等価な固有値問題
Figure 0005063776
について考える。Cholecky分解
Figure 0005063776
Figure 0005063776
は下三角行列である)を用いて、およびベクトル変換
Figure 0005063776
を導入して、別の等価な固有値問題
Figure 0005063776
Figure 0005063776
)を得る。サイズが(k+1)×(k+1)である階数1の行列
Figure 0005063776
は、λ1=0に対応するk次元の固有空間を有する。この固有空間からのベクトル
Figure 0005063776
は、
Figure 0005063776
を満たす。直交性条件
Figure 0005063776
から、λ2≠0に対応する残りの固有ベクトル
Figure 0005063776
を求めることが可能である。そのため、
Figure 0005063776
となり、ここから、要求される固有ベクトル
Figure 0005063776
は、
Figure 0005063776
となる。
Figure 0005063776
を固有値方程式に代入すると、
Figure 0005063776
が得られ、ここから、
Figure 0005063776
となる。
Figure 0005063776
は正定値であるため、λ2>0であり、問題(16)の最大の固有値は、
Figure 0005063776
である。

Claims (26)

  1. 画像中の物体を前記画像に対応する信号を処理することにより検出するための方法であって、
    前記物体についての複数の線分を含むテンプレートを画像の領域と比較するステップと、
    類似度測定値
    Figure 0005063776
    を決定するステップであって、前記類似度測定値は、前記テンプレートの前記線分の各々に対応する前記画像の線分の画素値の合計と画素値の2乗の合計とに基づく統計的測定値を用いて決定される、そのような類似度測定値を決定するステップと
    を含む方法。
  2. 前記物体についてのテンプレートを処理することで前記テンプレートを導出するステップをさらに含み、このステップにおいて、前記テンプレートは、前記物体についての前記テンプレートがより簡潔に表されたものである、請求項1に記載の方法。
  3. 前記処理ステップは、水平または垂直のいずれかの方向において最大数の線分を有する前記物体についての前記テンプレートの複雑な表現を除去するステップを含む、請求項2に記載の方法。
  4. 前記物体についてのテンプレートを領域(T)でラスター化することにより、複数の線分sijを含む前記テンプレートを導出するステップを含み、
    =si,1∪si,2∪si,3∪...
    は、領域(T)を線分(sij)により表現したものである、請求項1、2、または3に記載の方法。
  5. 前記画像を一次元インテグラルラインで表現したものを用いて、すなわち、
    水平な線分を有するテンプレートについては
    Figure 0005063776
    を用いて、
    垂直な線分を有するテンプレートについては
    Figure 0005063776
    (式中、aは前記画像画素の変数座標である)を用いて、
    前記テンプレートの線分に対応する前記画像f(x,y)の前記線分における画素値の合計と画素値の2乗の合計とを計算する、請求項1〜4のいずれか一項に記載の方法。
  6. 数式
    Figure 0005063776
    (式中、
    =領域における画素値の合計であり、
    =領域における画素値の2乗の合計であり、
    は前記テンプレートのi番目の領域であり、
    (x,x,y)は画素(x,y)(x≦x≦x)で構成される水平な線分である)を用いて、または
    垂直な線分についてのこの数式と等価な数式を用いて、
    画素値の合計と画素値の2乗の合計とを計算するステップをさらに含む、請求項5に記載の方法。
  7. 前記方法は、類似度測定値を決定する前記ステップの前に、前記テンプレートが実質的に円形であるかを判定するステップを含み、
    前記方法は、
    前記テンプレートが実質的に円形である場合は、前記類似度測定値を、前記テンプレートの前記線分の各々に対応する前記画像の線分の画素値の合計に基づいて決定するステップか、または、
    そうでない場合に、前記類似度測定値を、前記テンプレートの前記線分の各々に対応する前記画像の線分の画素値の合計と前記テンプレートに対応する前記画像の画素値の2乗の合計とに基づいて決定するステップ
    を含む、請求項1〜6のいずれか一項に記載の方法。
  8. 前記類似度測定値は、前記テンプレート(v)に対応する前記画像の画素値の2乗の合計と複数のテンプレート領域(u)に対応する前記画像の画素値の合計とを用いて決定され、数式
    Figure 0005063776
    (式中、nはi番目の領域における画素の数)により与えられる、請求項1〜7のいずれか一項に記載の方法。
  9. 複数の線分を含む幾何学変換されたテンプレートを導出するために、前記テンプレートの幾何学変換されたバージョンを導出し、前記幾何学変換されたテンプレートをラスター化するステップをさらに含む、請求項1〜8のいずれか一項に記載の方法。
  10. 複数の線分を含む前記幾何学変換されたテンプレートを前記画像の領域と比較するステップと、
    類似度測定値
    Figure 0005063776
    を決定するステップであって、前記類似度測定値は、前記幾何学変換されたテンプレートの前記線分の各々に対応する前記画像の線分の画素値の合計と画素値の2乗の合計とに基づく統計的測定値を用いて決定されるステップと
    をさらに含む、請求項9に記載の方法。
  11. 複数の所定の幾何学変換を用いて、前記テンプレートの複数の幾何学変換されたバージョンを導出するステップを含む、請求項9または10に記載の方法。
  12. 前記複数の幾何学変換されたテンプレートは、2つのパラメータの関数である変換を用い、好ましくは回転およびスケーリングの関数である変換を用いる、請求項11に記載の方法。
  13. 前記複数の幾何学変換されたテンプレートは、所定の相似変換のセットを前記テンプレートに適用することにより導出される、請求項12に記載の方法。
  14. 複数の線分を含む前記幾何学変換されたテンプレートの各々を前記画像の領域と比較するステップと、
    前記テンプレートの前記複数の幾何学変換されたバージョンの各々について前記類似度測定値を決定するステップと、
    前記画像の少なくとも1つの領域について、前記類似度測定値についてのピーク値を有する前記テンプレートの幾何学変換されたバージョンを1つ以上導出するステップと
    をさらに含む、請求項11、12、または13に記載の方法。
  15. 前記類似度測定値についてのピーク値を有する前記テンプレートの前記導出された幾何学変換されたバージョンまたはそのようなバージョンの各々は、前記画像中の前記物体の変換の近似として用いられる、請求項14に記載の方法。
  16. 前記ピーク値が最大の場合は勾配上昇法を用いて、または前記ピーク値が最小の場合は勾配降下法を用いて、前記画像中の前記物体の前記変換の最適な近似を導出するステップを含む、請求項15に記載の方法。
  17. 前記画像中の前記物体の前記変換は、2つ以上のパラメータの関数であり、好ましくは8パラメータの射影変換である、請求項16に記載の方法。
  18. 最適化されたピーク類似度測定値を有する変換を導出するために、ピーク値を有する前記導出された幾何学変換されたテンプレートの変換またはそのようなテンプレートの各々の変換を前記画像に基づいて反復するステップをさらに含む、請求項15、16、または17に記載の方法。
  19. 前記反復するステップは、多次元パラメータ空間におけるベクトルの反復を含む、請求項18に記載の方法。
  20. 前記テンプレートは、領域の和集合を含むトポロジテンプレートである、請求項1〜19のいずれか一項に記載の方法。
  21. 画像中の物体を前記画像に対応する信号を処理することにより検出するための方法であって、
    前記物体についての複数の線分を含むテンプレートを画像の領域と比較するステップと、
    類似度測定値
    Figure 0005063776
    を決定するステップであって、前記類似度測定値は、数式
    Figure 0005063776
    (式中、
    は画素値の合計を介してインテグラルラインを表現したものであり、
    は画素値の2乗の合計を介してインテグラルラインを表現したものであり、
    f(x,y)は前記画像であり、
    aは線分についての前記画像画素の変数座標である)により定義されるインテグラルラインの関数である統計的測定値を用いて決定される、そのような類似度測定値を決定するステップと
    を含む方法。
  22. 画像中の幾何学変換された物体を前記画像に対応する信号を処理することにより検出するための方法であって、
    前記物体のテンプレートの幾何学変換されたバージョンを前記画像の領域と比較するステップであって、前記幾何学変換されたテンプレートは複数の線分を含む、そのようなステップと、
    類似度測定値
    Figure 0005063776
    を決定するステップであって、前記類似度測定値は、前記幾何学変換されたテンプレートの前記線分の各々に対応する前記画像の線分の画素値の合計と画素値の2乗の合計とに基づく統計的測定値を用いて決定される、そのような類似度測定値を決定するステップと
    を含む方法。
  23. 画像中の幾何学変換された物体を前記画像に対応する信号を処理することにより検出するための方法であって、
    前記物体のテンプレートの幾何学変換されたバージョンを前記画像の領域と比較するステップであって、前記幾何学変換されたテンプレートは複数の線分を含む、そのようなステップと、
    類似度測定値
    Figure 0005063776
    を決定するステップであって、前記類似度測定値は、
    Figure 0005063776
    (式中、
    は画素値の合計を介してインテグラルラインを表現したものであり、
    は画素値の2乗の合計を介してインテグラルラインを表現したものであり、
    f(x,y)は前記画像であり、
    aは線分についての前記画像画素値の変数座標である)により定義されるインテグラルラインの関数である統計的測定値を用いて決定される、そのような類似度測定値を決定するステップと
    を含む方法。
  24. 画像中の物体の幾何学変換を前記画像に対応する信号を処理することにより決定するための方法であって、
    前記物体のテンプレートの複数の幾何学変換されたバージョンを前記画像の領域と比較するステップと、
    各テンプレートについて類似度測定値を決定し、前記類似度測定値の少なくとも1つのピーク値を導出するステップと、
    前記画像中の前記物体についての最適な幾何学変換を導出するために、前記幾何学変換されたテンプレートの前記幾何学変換を、勾配上昇法における前記幾何学変換の初期近似として用いるステップと
    を含み、
    各幾何学変換されたテンプレートは、複数の線分を含み、
    前記類似度測定値は、前記幾何学変換されたテンプレートの前記線分の各々に対応する前記画像の線分の画素値の合計と画素値の2乗の合計とに基づく統計的測定値を用いて決定される、方法。
  25. 請求項1〜24のいずれか一項に記載の方法を行うためのプロセッサおよびメモリを備える装置。
  26. 実行されると請求項1〜24のいずれか一項に記載の方法を行う命令を含む、コンピュータ可読媒体。
JP2010502558A 2007-04-13 2008-03-20 幾何学変換に基づく一般化統計的テンプレートマッチング Active JP5063776B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GB0707192.1 2007-04-13
GBGB0707192.1A GB0707192D0 (en) 2007-04-13 2007-04-13 Generalized statistical template matching
PCT/GB2008/001006 WO2008125799A2 (en) 2007-04-13 2008-03-20 Generalized statistical template matching under geometric transformations

Publications (2)

Publication Number Publication Date
JP2010524111A JP2010524111A (ja) 2010-07-15
JP5063776B2 true JP5063776B2 (ja) 2012-10-31

Family

ID=38116716

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010502558A Active JP5063776B2 (ja) 2007-04-13 2008-03-20 幾何学変換に基づく一般化統計的テンプレートマッチング

Country Status (5)

Country Link
US (1) US8478051B2 (ja)
EP (1) EP2153379A2 (ja)
JP (1) JP5063776B2 (ja)
GB (1) GB0707192D0 (ja)
WO (1) WO2008125799A2 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8963959B2 (en) * 2011-01-18 2015-02-24 Apple Inc. Adaptive graphic objects
US20120328160A1 (en) * 2011-06-27 2012-12-27 Office of Research Cooperation Foundation of Yeungnam University Method for detecting and recognizing objects of an image using haar-like features
US8483489B2 (en) 2011-09-02 2013-07-09 Sharp Laboratories Of America, Inc. Edge based template matching
US8651615B2 (en) 2011-12-19 2014-02-18 Xerox Corporation System and method for analysis of test pattern image data in an inkjet printer using a template
US8774510B2 (en) * 2012-09-11 2014-07-08 Sharp Laboratories Of America, Inc. Template matching with histogram of gradient orientations
US9569501B2 (en) * 2013-07-12 2017-02-14 Facebook, Inc. Optimizing electronic layouts for media content
EP3048558A1 (en) * 2015-01-21 2016-07-27 Application Solutions (Electronics and Vision) Ltd. Object detecting method and object detecting apparatus
EP3417617A4 (en) * 2016-02-17 2019-02-27 Telefonaktiebolaget LM Ericsson (publ) METHOD AND DEVICES FOR CODING AND DECODING VIDEO IMAGES
CN106296706B (zh) * 2016-08-17 2018-12-21 大连理工大学 一种联合全局建模和非局部滤波的深度计算重建方法
CN107066989B (zh) * 2017-05-04 2020-04-24 中国科学院遥感与数字地球研究所 一种同步卫星遥感序列影像的积雪识别方法及系统
JP6943338B2 (ja) * 2018-05-18 2021-09-29 日本電気株式会社 画像処理装置、システム、方法及びプログラム

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW368640B (en) * 1996-12-25 1999-09-01 Hitachi Ltd Image processor, image processing device and image processing method
US6330353B1 (en) * 1997-12-18 2001-12-11 Siemens Corporate Research, Inc. Method of localization refinement of pattern images using optical flow constraints
US6546137B1 (en) * 1999-01-25 2003-04-08 Siemens Corporate Research, Inc. Flash system for fast and accurate pattern localization
US6993156B1 (en) * 2000-02-18 2006-01-31 Microsoft Corporation System and method for statistically comparing and matching plural sets of digital data
US7142718B2 (en) * 2002-10-28 2006-11-28 Lee Shih-Jong J Fast pattern searching
US7639896B2 (en) * 2004-08-09 2009-12-29 Carestream Health, Inc. Multimodal image registration using compound mutual information
DE602005012673D1 (de) * 2005-02-21 2009-03-26 Mitsubishi Electric Corp Schnelles Verfahren zum Detektieren von Objekten durch statistischen Mustervergleich

Also Published As

Publication number Publication date
GB0707192D0 (en) 2007-05-23
EP2153379A2 (en) 2010-02-17
WO2008125799A2 (en) 2008-10-23
US20100119160A1 (en) 2010-05-13
US8478051B2 (en) 2013-07-02
JP2010524111A (ja) 2010-07-15
WO2008125799A3 (en) 2009-03-19

Similar Documents

Publication Publication Date Title
JP5063776B2 (ja) 幾何学変換に基づく一般化統計的テンプレートマッチング
CN108765458B (zh) 基于相关滤波的高海况无人艇海面目标尺度自适应跟踪方法
Liu et al. Infrared point target detection with improved template matching
US10643101B2 (en) Window grouping and tracking for fast object detection
US9117111B2 (en) Pattern processing apparatus and method, and program
US9053388B2 (en) Image processing apparatus and method, and computer-readable storage medium
Zeisl et al. Estimation of Location Uncertainty for Scale Invariant Features Points.
Cheng et al. A novel dynamic system in the space of SPD matrices with applications to appearance tracking
CN112036339B (zh) 人脸检测的方法、装置和电子设备
WO2018049704A1 (en) Vehicle detection, tracking and localization based on enhanced anti-perspective transformation
JP7439153B2 (ja) 全方位場所認識のためのリフトされたセマンティックグラフ埋め込み
US20180336699A1 (en) System and method for model adaptation
Talker et al. Efficient sliding window computation for nn-based template matching
Sahin et al. A learning-based variable size part extraction architecture for 6D object pose recovery in depth images
Ji et al. Automatic calibration of camera sensor networks based on 3D texture map information
Chen et al. Experimental feature-based SAR ATR performance evaluation under different operational conditions
EP2672425A1 (en) Method and apparatus with deformable model fitting using high-precision approximation
CN111126508A (zh) 一种基于hopc改进的异源图像匹配方法
Mohr et al. Bayesian decision versus voting for image retrieval
CN116758419A (zh) 针对遥感图像的多尺度目标检测方法、装置和设备
Tal et al. An accurate method for line detection and manhattan frame estimation
Marghes et al. Background modeling via incremental maximum margin criterion
Dong et al. Ellipse regression with predicted uncertainties for accurate multi-view 3d object estimation
Favorskaya et al. Accurate spatio-temporal reconstruction of missing data in dynamic scenes
Bryner et al. Bayesian active contours with affine-invariant, elastic shape prior

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110318

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111222

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120110

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120224

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120710

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120807

R150 Certificate of patent or registration of utility model

Ref document number: 5063776

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150817

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250