JP2007066025A

JP2007066025A - 画像検索方法及び装置

Info

Publication number: JP2007066025A
Application number: JP2005251726A
Authority: JP
Inventors: Katsuhiro Sakai; 克弘坂井; Ondrej Chum; フムオンドレイ; Jiri Matas; マタスユリ
Original assignee: Czech Technical University In Prague; Toyota Motor Corp
Current assignee: Czech Technical University In Prague; Toyota Motor Corp
Priority date: 2005-08-31
Filing date: 2005-08-31
Publication date: 2007-03-15
Anticipated expiration: 2025-08-31
Also published as: EP1933270A4; EP1933270A1; US8295604B2; US20090290798A1; WO2007026948A1; EP1933270B1; JP4721830B2

Abstract

【課題】本発明の目的は、ロバストかつ高速(モデル数に対し対数オーダーの計算量)な画像検索方法を提供すること。
【解決手段】一枚又は複数枚の学習画像からそのアフィン変換に関わらず形状を正規化できる性質を持つ複数の特定領域をアフィン不変領域として抽出する抽出工程と、基準となるアフィン不変領域に対してその近傍にある他のアフィン不変領域を集合として算出する算出工程と、近傍にあるアフィン不変領域を、基準となるアフィン不変領域の形状を正規化する変換を利用して変形する変形工程と、基準となるアフィン不変領域及び近傍にあるアフィン不変領域の組み合わせと共に、近傍にあるアフィン不変領域の変形された形状を出力する出力工程とを備えていることを特徴としている。
【選択図】図１

Description

本発明は、明るさなどが変化する画像においても確実な画像検索を行うことが可能な画像検索方法及び装置に関する。

複数の画像間で対応関係にある小領域を算出することは、対象認識、三次元情報復元、画像検索など様々な画像処理アプリケーションによって重要な問題である。画像内の局所的な領域をアフィン変換や回転変換に対して正規化した状態で抽出し（以降、アフィン不変領域と呼ぶこととする）、それらのアフィン不変領域間の対応関係を利用する画像認識手段は、認識対象に対する視点変化を幾何学的にモデリングできるという利点がある。また、局所的なアフィン不変領域を利用するため、認識対象の部分隠れに対する対応能力が高いという利点もある。
Ｗ．Ｍ．Ｗｅｌｌｓ，Ｐ．Ｖｉｏｌａ，Ｈ．Ａｔｓｕｍｉ，Ｓ．Ｎａｋａｊｉｍａ，ａｎｄＲ．Ｋｉｋｉｎｓ， "Ｍｕｌｔｉ−ＭｏｄａｌＶｏｌｕｍｅＲｅｇｉｓｔｒａｔｉｏｎＭａｘｉｍａｚａｔｉｏｎｏｆＭｕｔｕａｌＩｎｆｏｒｍａｔｉｏｎ" ＭｅｄｉｃａｌＩｍａｇｅＡｎａｌｙｓｉｓ，１９９６Ｄ．Ｇ．Ｌｏｗｅ "Ｄｉｓｔｉｎｃｔｉｖｅｉｍａｇｅｆｅａｔｕｒｅｓｆｒｏｍｓｃａｌｅ−ｉｎｖａｒｉａｎｔｋｅｙｐｏｉｎｔｓ" Ｉｎｔ．Ｊ．Ｃｏｍｐｔ．Ｖｉｓｉｏｎ，６０（２）：９１−１１０，２００４Ｊ．Ｍａｔｅｓ，Ｏ．Ｃｈｕｍ，Ｍ．Ｕｒｂａｎ，ａｎｄＴ．Ｐａｊｄｌａ "ＲｏｂｕｓｔＷｉｄｅＢａｓｅｌｉｎｅＳｔｅｒｅｏｆｒｏｍＥｘｔｒｅｍａｌＲｅｇｉｏｎｓ" ＢＭＶＣ０２，２００２

これらの手法は、一般に下記の三段階の処理によって実現される（図６参照）。（１）一枚又は複数枚のモデル画像及び検索対象画像（供試画像）からアフィン不変領域を抽出する。（２）抽出したアフィン不変領域の対応関係を局所的な情報に基づいて算出する。（３）大局的な情報を利用して上記（２）で算出した対応関係を検証する。

ここで、上記（２）のアフィン不変領域間の対応関係を算出する際に、ロバスト性とともに実行速度も重要な問題となる。例えば、複数の対象を認識する場合、図９に示すように、複数のモデル画像から抽出したアフィン不変領域と検索対象画像から抽出したアフィン不変領域との一致を逐次比較するような方法では、モデル画像数（即ち、それらから抽出されるアフィン不変領域数）が増加した場合、計算負荷も線形的に増大し，実時間アプリケーションにとって致命的である。従って、本発明の目的は，ロバストかつ高速(モデル数に対し対数オーダーの計算量)な画像検索方法及び装置を提供することにある。

また、上述した［非特許文献１］では、相互情報量を指標として二画像間の類似度を算出することで、単調関数でない光度変化にも頑強な対応検索を提案している。この手法をアフィン不変領域間の対応検索に当てはめた場合、全てのアフィン不変領域の組み合わせに対して類似度算出が必要であり、アフィン不変領域の数に伴い計算負荷が増大してしまう。

請求項１に記載の画像検索方法は、一枚又は複数枚の学習画像からそのアフィン変換に関わらず形状を正規化できる性質を持つ複数の特定領域をアフィン不変領域として抽出する抽出工程と、基準となるアフィン不変領域に対してその近傍にある他のアフィン不変領域を集合として算出する算出工程と、近傍にあるアフィン不変領域を、基準となるアフィン不変領域の形状を正規化する変換を利用して変形する変形工程と、基準となるアフィン不変領域及び近傍にあるアフィン不変領域の組み合わせと共に、近傍にあるアフィン不変領域の変形された形状を出力する出力工程とを備えていることを特徴としている。

請求項２に記載の発明は、請求項１に記載の画像検索方法において、アフィン不変領域が、局所座標系として設定されることを特徴としている。

請求項３に記載の発明は、請求項１又は２に記載の画像検索方法において、検索対象となる対象画像が入力される入力工程と、対象画像からそのアフィン変換に関わらず形状を正規化できる性質を持つ複数の特定領域をアフィン不変領域として抽出し、基準となるアフィン不変領域に対してその近傍にある他のアフィン不変領域を集合として算出し、近傍にあるアフィン不変領域を、基準となるアフィン不変領域の形状を正規化する変換を利用して変形する対象変形工程と、対象画像における基準となるアフィン不変領域及び近傍にあるアフィン不変領域の組み合わせ、近傍にあるアフィン不変領域の変形された形状、及び、出力工程によって出力された出力結果に基づいて、学習画像から抽出されたアフィン不変領域と対象画像から抽出されたアフィン不変領域とを対応づける検索工程とをさらに備えることを特徴としている。

請求項４に記載の画像検索装置は、一枚又は複数枚の学習画像からそのアフィン変換に関わらず形状を正規化できる性質を持つ複数の特定領域をアフィン不変領域として抽出する抽出手段と、基準となるアフィン不変領域に対してその近傍にある他のアフィン不変領域を集合として算出する算出手段と、近傍にあるアフィン不変領域を、基準となるアフィン不変領域の形状を正規化する変換を利用して変形する変形手段と、基準となるアフィン不変領域及び近傍にあるアフィン不変領域の組み合わせと共に、近傍にあるアフィン不変領域の変形された形状を出力する出力手段とを備えていることを特徴としている。

請求項５に記載の発明は、請求項４に記載の画像検索装置において、アフィン不変領域が、局所座標系として設定されることを特徴としている。

請求項６に記載の発明は、請求項４又は５に記載の画像検索装置において、検索対象となる対象画像が入力される入力手段と、対象画像からそのアフィン変換に関わらず形状を正規化できる性質を持つ複数の特定領域をアフィン不変領域として抽出し、基準となるアフィン不変領域に対してその近傍にある他のアフィン不変領域を集合として算出し、近傍にあるアフィン不変領域を、基準となるアフィン不変領域の形状を正規化する変換を利用して変形する対象変形手段と、対象画像における基準となるアフィン不変領域及び近傍にあるアフィン不変領域の組み合わせ、近傍にあるアフィン不変領域の変形された形状、及び、出力手段によって出力された出力結果に基づいて、学習画像から抽出されたアフィン不変領域と対象画像から抽出されたアフィン不変領域とを対応づける検索手段とをさらに備えることを特徴としている。

本発明の画像検索方法又は画像検索装置によれば、基準となるアフィン不変領域及び近傍にあるアフィン不変領域の組み合わせと共に、近傍にあるアフィン不変領域の変形された形状を分類することで、ロバストかつ高速な検索が可能な画像データベースを構築することができる。そして、検索対象となる対象画像が与えられたときには、上述したデータベースを利用して、対象画像における基準となるアフィン不変領域及び近傍にあるアフィン不変領域の組み合わせと共に、近傍にあるアフィン不変領域の変形された形状を利用して、ロバストかつ高速な検索を行うことができる。

本発明の画像検索装置は、検索対象となる対象画像とこの対象画像と比較するためのデータベースとなる学習画像とを入力する入力部、入力された画像に対してアフィン不変領域などを求める演算や検索のための比較対象を行うを行う演算部、構築したデータベースや検索結果を出力する出力部、演算に必要なプログラムや途中の演算内容・構築したデータベースなどを記憶しておく記憶部などを備えている。

入力部は、カメラであったり、スキャナであったり、データとして画像を入力する入出力ドライブであったりする。演算部は、ＣＰＵやＧＰＵ・ＲＯＭ・ＲＡＭなどであったりする。出力部は、モニタディスプレイであったりプリンタであったり入出力ドライブであったりする。記憶部は、ハードディスクやＲＡＭその他のストレージデバイスであったりする。

本実施形態における画像検索方法（データベース構築方法）についての概要を説明する。同一種類ではあるが異なる色の車両では，白色車両のテールランプはボデー色に対して暗く、黒色車両のテールランプはボデー色に対して明るい。また、昼間の窓は建物のその他の部分に対して暗いが、夜間では電灯の影響で明るくなる。このような対象の認識には、光学的な属性が単調でなく変化する対象間の対応関係の算出が必要である。ここでは、アフィン不変領域によって定義される局所座標系を指標として、高速かつ単調でない光度変化にも頑強な対応探索を実現する。本発明の基底となる考えを解説する。

画像Ａから抽出したアフィン不変領域の集合をＳ^Ａ＝｛ｓ_１ ^Ａ，ｓ_２ ^Ａ，…，ｓ_Ｎ ^Ａ｝とする。ここで，各アフィン不変領域はアフィン変換行列で一意に表現され、画像上に一つの局所座標系として定義されることとする。以降の数式計算では、ｓ_ｉ ^Ａをアフィン変換行列として扱う。ここで，アフィン変換行列を利用した表現は、幾何変換の指標であり、光学的特性を明には含まない。よって、アフィン不変領域の抽出自体が光度変化の影響を受けなければ、アフィン変換行列も光度変化の影響を受けない。光度変化の影響を受けないアフィン不変領域の抽出は、例えば、上述した［非特許文献３］でＭＳＥＲ＋(周辺より明るい領域)，ＭＳＥＲ−(周辺より暗い領域)を区別せず扱うことで実現できる。以降、議論の対象であるアフィン不変領域は光度変化の影響を受けない形で抽出されているとする。

画像Ａと同一の対象を別視点から撮影した画像Ｂに対して同様に抽出したアフィン変換領域の集合をＳ^Ｂ＝｛ｓ_１ ^Ｂ，ｓ_２ ^Ｂ，…，ｓ_Ｎ ^Ｂ｝とする。簡略化のため、１≦ｉ≦Ｎを満たす全てのｉに対して，ｓ_ｉ ^Ｂとｓ_ｉ ^Ａは対応するアフィン不変領域であるとする。さらに、対象が平面物体であると仮定し、画像Ａ中の対象を基準とした画像Ｂ中の対象へのアフィン変換行列をＰとする。この場合、明らかに１≦ｉ≦Ｎを満たす全てのｉに対して下式が成立する。
ｓ_ｉ ^Ｂ＝Ｐｓ_ｉ ^Ａ
よって、１≦ｉ≦Ｎ，１≦ｊ≦Ｎを満たす全てのｉ，ｊの組み合わせに関して下記式が成立する。
（ｓ_ｊ ^Ｂ）^−１ｓ_ｉ ^Ｂ＝（Ｐｓ_ｊ ^Ａ）^−１Ｐｓ_ｉ ^Ａ＝（ｓ_ｊ ^Ａ）^−１Ｐ^−１Ｐｓ_ｉ ^Ａ＝（ｓ_ｊ ^Ａ）^−１ｓ_ｉ ^Ａ

つまり、アフィン不変領域ｓ_ｊ ^Ａを基準に幾何的に正規化したｓ_ｉ ^Ａは、ｓ_ｊ ^Ｂを基準に正規化したｓ_ｉ ^Ｂに一致する(図１参照)。換言すれば、正規化された近傍のアフィン不変領域（周辺アフィン不変領域）の座標系の画像間での一致度は、正規化の基準となったアフィン不変領域間の対応度評価の指標となる。例えば、一対の周辺アフィン不変領域の座標系が一致した場合に、正規化の基準となったアフィン不変領域対の対応(一致した周辺アフィン不変領域の対応も可)に対して投票を行い、最終的な投票数から対応を判断すること等が可能である。以上の議論は対象を平面物体に限定して行ったが、それ以外の物体も局所的領域に着目すれば近似的に平面と見なすことができ、上記議論をそのまま適応できる。さらに，正規化されたアフィン不変領域の座標系を離散化して扱うことで、データベース探索の原理を応用して計算量がＯ（ｌｏｇＮ）(アフィン不変領域数Ｎ)である高速な対応探索を実現できる。

以下、実施形態について説明する。ここでは、一枚もしくは複数枚の画像を含む集合Ａ＝｛ａ_１，ａ_２，…，ａ_Ｎ｝より抽出した複数のアフィン不変領域と、一枚の画像ｂから抽出した複数のアフィン不変領域の対応関係を算出する例を利用し、本発明の実装方法を解説する。集合Ａ中の各画像ａ_ｉ｛１≦ｉ≦Ｎ｝は、対象認識の例では認識対象である各モデルに対応する。ステレオ画像間の対応探索は、対象認識のＮ＝１である特別な例として考えることができ、基本的な処理の流れは対象認識と同等である。ここで，対象認識の慣例に習い、集合Ａからアフィン不変領域を抽出し効率的な対応探索が可能な形に記述することを学習と呼び、画像ｂからアフィン不変特徴を抽出し、対応する集合Ａから抽出したアフィン不変特徴を算出することを認識と呼ぶこととする。

複数の対象を認識する例では、そのモデル数Ｎに対する計算量の変化が重要である。集合Ａから抽出したアフィン不変領域数はモデル数に比例するため、これに対する計算量変化は重要である。画像サイズが一定であれば、画像ｂから抽出したアフィン不変領域数は対象認識ではほぼ一定と見なすことができ問題とならない。以下、学習時の手順を図２のフローチャートを参照して説明する。

ステップ２００では、集合Ａ＝｛ａ_１，ａ_２，…，ａ_Ｎ｝の各画像から複数のアフィン不変領域を抽出し、光度変化によらない幾何的な特徴としてアフィン変換行列を抽出する。本発明は、以降の処理をアフィン変換行列に対して行なうものであり、この行列抽出のステップが光度変化に影響を受けない形で実装できれば処理全体が光度変化に影響を受けないことが保証される。上述した［非特許文献３］の例で、ＭＳＥＲ＋（定性的な表現では周辺より明るい領域）とＭＳＥＲ−（同じく周辺より暗い領域）を区別することなく扱うことで光度変化によらないアフィン不変領域の抽出が実現できる。ここで，算出したアフィン不変領域（変換行列）の集合をＳ＝｛ｓ_１，ｓ_２，…，ｓ_Ｎ｝とする。

ステップ２０５では、１≦ｉ≦Ｎなるｉをまず１に初期化する。次いで、ステップ２１０では、画像中でｓ_ｉの近傍にあるアフィン不変領域の集合Ｓ^ｉ＝｛ｓ^ｉ _１，ｓ^ｉ _２，…，ｓ^ｉ _Ｎ｝を算出する。ステップ２１５では、１≦ｊ≦Ｎなるｊを１に初期化する。ｓ_ｉを幾何的に正規化する変換行列ｓ_ｉ ^−１によって，ｓ_ｊを幾何的に変換した場合のｓ_ｉ座標系の原点とｓ_ｊの原点との距離をｄ_ｓｉ ^ｓｊと定義すると、ｄ_ｓｉ ^ｓｊは下記式によって得られる。
ただし、ｘ，ｙは以下の式を満たす。

Ｓ^ｉはｓ_ｉに対し距離ｄ_ｓｉ ^ｓｊが閾値以下であるアフィン不変領域ｓ_ｊの集合であり，一般的にｓ_ｉと同一の画像ａ_ｋから抽出した全てのｓ_ｊに対し、距離ｄ_ｓｉ ^ｓｊを計算することで算出することが出来る。この処理の計算負荷は、同一画像から抽出したアフィン不変領域数Ｐを用いＯ（ＮＰ^２）となる。対象認識ではこのステップはオフラインで実施され（学習段階）、計算負荷は重要な問題ではない。ステレオの対応点探索（Ｎ＝１）では，このステップはオンライン処理され計算量評価の対象だが、一定サイズの画像を扱う限りではＰは一定と見なすことができるため計算負荷はＯ（１）となり問題ではない。この処理は、図３に示すように、画像を複数のサブ領域に分割し、距離ｄ_ｓｉ ^ｓｊを算出すべきｓ_ｊの探索範囲をｓ_ｉ周辺の幾つかのサブ領域に限定することで、さらに効率的に計算できる。また、各ｓ_ｉに対する近傍のアフィン不変領域数は、距離ｄ_ｓｉ ^ｓｊの閾値をコントロールすることで定数と見なすことが出来る。逆に、近傍のアフィン不変領域数を一定数抽出することは、対応点探索に必要な手掛かりを一定数抽出することであり、合理的な仮定である。

ステップ２２０では、図４に示されるように、ｓ_ｉを幾何的に正規化する変換行列ｓ_ｉ ^−１によりｓ_ｊを変換する。ステップ２２５では、下記［表１］に示すような学習テーブルに，離散化したｓ_ｉ，ｓ_ｉ ^−１の座標系とｉ，ｊとを同時に出力する。ｓ_ｉ，ｓ_ｉ ^−１が貼る座標系３点のｘ−ｙ座標を直接利用してテーブルを作成した例を［表１］に示したが、応用範囲としてはこの限りでなく、極座標など様々な座標系に対して処理が可能である。

ステップ２３０，２３５では、ｉはそのままで順次ｊをインクリメントして、ステップ２２０，２２５を繰り返し行う。ステップ２４０，２４５では、ｉをインクリメントして、ステップ２１０〜２３５を繰り返し行う。この繰り返しの中でｉ＝ｉ＋１で順次ｊがインクリメントされて処理される。

ステップ２５０では、学習テーブルの各行をｉ，ｊを除いた座標値を基準とし、一定の順番に並べ替える。例えば、ｘ_０を最上位、ｙ_０を第二番目、・・・、ｙ_ｂを最下位とし、最上位から比較を開始して上位の値が同一の場合下位の値を比較する戦略を並べ替えの基準とできる。なお、固有の順序を決定できる評価基準であれば任意に選ぶことも可能である。並べ替えには、クイックソートなどの既存手法が利用できる。このステップで作成した並べ替え済みの学習テーブルが、最終的な学習結果となる。

次に、図５のフローチャートを参照しつつ、認識時の処理を学習時と異なる部分を中心に説明する。ステップ５００〜５２０までは、図２のフローチャートにおけるステップ２００〜２２０と同等の処理であり、これら処理の計算量は認識対象数Ｎによらない。

ステップ５２５では、画像ｂから抽出したアフィン不変領域に対し，離散化したｓ_ｉ ^−１ｓ_ｊの座標系と一致するエントリを学習テーブルから選出する。この処理は簡単な検索技術を利用し、Ｏ（ｌｏｇＮ）の計算量で実現できる。画像ｂから抽出したアフィン不変領域ｉと、画像集合Ａから抽出したアフィン不変領域中で一致した学習テーブルエントリ（行）の項目ｉ（列）をＩＤにもつアフィン不変領域との一致をサポートする。よって、下記［表２］に示すような投票テーブルを作成し、これらの一致に投票を行なう。

エントリの一致は同様に画像ｂから抽出したアフィン不変領域ｊと、画像集合Ａから抽出したアフィン不変領域中で一致した学習テーブルエントリ（行）の項目ｊ（列）をＩＤにもつアフィン不変領域との一致もサポートするため、これらの一致に対して投票を行なうことも可能である。ステップ５３０，５３５では、ｉはそのままで順次ｊをインクリメントして、ステップ５２０，５２５を繰り返し行う。ステップ５４０，５４５では、ｉをインクリメントして、ステップ５１０〜５３５を繰り返し行う。この繰り返しの中でｉ＝ｉ＋１で順次ｊがインクリメントされて処理される。

ステップ５５０では、作成した投票テーブルを利用して集合Ａから抽出したアフィン不変領域、画像ｂから抽出したアフィン不変領域の対応関係を算出する。その際、各行に対して最高の投票を与える、あるいは、投票数が閾値以上である、などアプリケーションに望ましい性質によって様々な指標で対応算出を行なうことが出来る。ここで、投票テーブルの全てのエントリを投票後に調査する手法では、集合Ａから抽出たアフィン不変領域数（対象認識のモデル数）Ｎに比例して計算量が増大する。しかし、投票テーブル作成時に各行（列）で最高の投票を与えるものを逐次更新しながら記憶しておくなどの工夫で、モデル数によらない効率的な計算を実現できる。

本発明の画像検索方法及び装置における学習の概要を示す説明図である。本発明の画像検索方法及び装置における学習の流れを示すフローチャートである。サブ領域を利用した近傍探索範囲限定を模式的に示す説明図である。対応表（離散化されたテーブル）に出力する特徴量を示す説明図である。本発明の画像検索方法及び装置における認識（検索）の流れを示すフローチャートである。画像内の局所的な領域をアフィン変換や回転変換に対して正規化した状態で抽出する状態を示す説明図である。

Claims

一枚又は複数枚の学習画像からそのアフィン変換に関わらず形状を正規化できる性質を持つ複数の特定領域をアフィン不変領域として抽出する抽出工程と、
基準となるアフィン不変領域に対してその近傍にある他のアフィン不変領域を集合として算出する算出工程と、
近傍にあるアフィン不変領域を、基準となるアフィン不変領域の形状を正規化する変換を利用して変形する変形工程と、
基準となるアフィン不変領域及び近傍にあるアフィン不変領域の組み合わせと共に、近傍にあるアフィン不変領域の変形された形状を出力する出力工程とを備えていることを特徴とする画像検索方法。
前記アフィン不変領域が、局所座標系として設定されることを特徴とする請求項１に記載の画像検索方法。
検索対象となる対象画像が入力される入力工程と、
前記対象画像からそのアフィン変換に関わらず形状を正規化できる性質を持つ複数の特定領域をアフィン不変領域として抽出し、基準となるアフィン不変領域に対してその近傍にある他のアフィン不変領域を集合として算出し、近傍にあるアフィン不変領域を、基準となるアフィン不変領域の形状を正規化する変換を利用して変形する対象変形工程と、
前記対象画像における基準となるアフィン不変領域及び近傍にあるアフィン不変領域の組み合わせ、近傍にあるアフィン不変領域の変形された形状、及び、前記出力工程によって出力された出力結果に基づいて、前記学習画像から抽出されたアフィン不変領域と前記対象画像から抽出されたアフィン不変領域とを対応づける検索工程とをさらに備えることを特徴とする請求項１又は２に記載の画像検索方法。
一枚又は複数枚の学習画像からそのアフィン変換に関わらず形状を正規化できる性質を持つ複数の特定領域をアフィン不変領域として抽出する抽出手段と、
基準となるアフィン不変領域に対してその近傍にある他のアフィン不変領域を集合として算出する算出手段と、
近傍にあるアフィン不変領域を、基準となるアフィン不変領域の形状を正規化する変換を利用して変形する変形手段と、
基準となるアフィン不変領域及び近傍にあるアフィン不変領域の組み合わせと共に、近傍にあるアフィン不変領域の変形された形状を出力する出力手段とを備えていることを特徴とする画像検索装置。
前記アフィン不変領域が、局所座標系として設定されることを特徴とする請求項４に記載の画像検索装置。
検索対象となる対象画像が入力される入力手段と、
前記対象画像からそのアフィン変換に関わらず形状を正規化できる性質を持つ複数の特定領域をアフィン不変領域として抽出し、基準となるアフィン不変領域に対してその近傍にある他のアフィン不変領域を集合として算出し、近傍にあるアフィン不変領域を、基準となるアフィン不変領域の形状を正規化する変換を利用して変形する対象変形手段と、
前記対象画像における基準となるアフィン不変領域及び近傍にあるアフィン不変領域の組み合わせ、近傍にあるアフィン不変領域の変形された形状、及び、前記出力手段によって出力された出力結果に基づいて、前記学習画像から抽出されたアフィン不変領域と前記対象画像から抽出されたアフィン不変領域とを対応づける検索手段とをさらに備えることを特徴とする請求項４又は５に記載の画像検索装置。