JP5164222B2 - Image search method and system - Google Patents

Image search method and system Download PDF

Info

Publication number
JP5164222B2
JP5164222B2 JP2009151020A JP2009151020A JP5164222B2 JP 5164222 B2 JP5164222 B2 JP 5164222B2 JP 2009151020 A JP2009151020 A JP 2009151020A JP 2009151020 A JP2009151020 A JP 2009151020A JP 5164222 B2 JP5164222 B2 JP 5164222B2
Authority
JP
Japan
Prior art keywords
image
point
query image
local
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009151020A
Other languages
Japanese (ja)
Other versions
JP2011008507A (en
Inventor
智史 上野
真幸 橋本
暁夫 米山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2009151020A priority Critical patent/JP5164222B2/en
Publication of JP2011008507A publication Critical patent/JP2011008507A/en
Application granted granted Critical
Publication of JP5164222B2 publication Critical patent/JP5164222B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)
  • Processing Or Creating Images (AREA)
  • Image Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、クエリ画像に類似した画像を多数の検索対象画像の中から検索する画像検索方法およびシステムに係り、特に各画像の局所特徴量同士を比較して対応点を求め、その個数に基づいて画像間の類似性を判断する画像検索方法およびシステムに関する。   The present invention relates to an image search method and system for searching an image similar to a query image from among a large number of search target images, and in particular, compares local feature amounts of each image to obtain corresponding points, and based on the number of the corresponding points The present invention relates to an image search method and system for determining similarity between images.

建物など剛体の画像をロバストに検出する手法の一つとして、非特許文献1にSIFT(Scale Invariant Feature Transform)が開示されている。このSIFTでは、クエリ画像および検索対象画像の双方から予め局所特徴量が抽出され、各画像の局所特徴量間のユークリッド距離Lに基づいて最近傍探索が実行される。そして、距離の近い局所特徴量同士が対応点ペアとされ、最終的に対応点ペアの多い検索対象画像が検索結果とされる。このとき、最近傍の特徴点の対応点マッチング精度を高めるために、最も近い距離L1のみならず2番目に近い距離L2も求められ、両者の比(L1/L2:ratio of distances)が所定の閾値t以下であれば対応点とされるが、閾値tよりも大きければ対応点とされない。   Non-Patent Document 1 discloses SIFT (Scale Invariant Feature Transform) as one method for robustly detecting an image of a rigid body such as a building. In this SIFT, local feature amounts are extracted in advance from both the query image and the search target image, and the nearest neighbor search is executed based on the Euclidean distance L between the local feature amounts of each image. Then, local feature quantities having a short distance are used as corresponding point pairs, and finally, a search target image having many corresponding point pairs is used as a search result. At this time, not only the nearest distance L1 but also the second nearest distance L2 is obtained in order to improve the matching point matching accuracy of the nearest feature point, and the ratio (L1 / L2: ratio of distances) of both is predetermined. If it is less than or equal to the threshold value t, it is regarded as a corresponding point, but if it is larger than the threshold value t, it is not regarded as a corresponding point.

非特許文献1では、予備実験においてt=0.85で急激な誤対応点増加が確認されたことからt=0.8としている。しかしながら、閾値tを小さな値に設定すれば、対応点の精度は高くなる傾向を示すものの、対応点ペアが少なくなるので検索精度を高くできるとは限らない。すなわち、非特許文献1では閾値tを適正値に設定することが難しかった。   In Non-Patent Document 1, t = 0.8 because a rapid increase in false correspondence points was confirmed at t = 0.85 in a preliminary experiment. However, if the threshold value t is set to a small value, the accuracy of corresponding points tends to increase, but the number of corresponding point pairs decreases, so the search accuracy cannot always be increased. That is, in Non-Patent Document 1, it is difficult to set the threshold value t to an appropriate value.

このような技術課題に対して、特許文献1には、所定数の対応点ペアが得られるように、対応点ペアが少なければ閾値tを段階的に上げ、多ければ閾値tを段階的に下げるといったように、抽出される対応点ペアの個数に応じて閾値tを適応的に変更する技術が開示されている。   In response to such a technical problem, Patent Document 1 discloses that a threshold t is increased stepwise if there are few corresponding point pairs and a threshold t is decreased stepwise if there are many, so that a predetermined number of corresponding point pairs can be obtained. As described above, a technique for adaptively changing the threshold value t according to the number of corresponding point pairs to be extracted is disclosed.

特開2007−140613号公報JP 2007-140613 A

David G. Lowe,"Distinctive image features from scale-invariant keypoints" International Journal of Computer Vision, 60, 2 (2004), pp.91-110.David G. Lowe, "Distinctive image features from scale-invariant keypoints" International Journal of Computer Vision, 60, 2 (2004), pp.91-110.

上記の従来技術では、所定の閾値tで得られる対応点ペアが少ないと、閾値tが適応的に上昇するので対応点ペアが増える。しかしながら、もともと同一物体が画像内に含まれていないために対応点ペアが少ないクエリ画像および検索対象画像のペアについても閾値tが上げられてしまうので、本来であれば対応点ペアとされない特徴点同士までもが対応点ペアとされてしまうという問題があった。   In the above-described conventional technique, when the number of corresponding point pairs obtained with the predetermined threshold value t is small, the threshold value t increases adaptively, so the number of corresponding point pairs increases. However, since the same object is not originally included in the image, the threshold value t is also raised for a pair of query image and search target image with few corresponding point pairs. There was a problem that even a pair of points would be a corresponding point pair.

また、上記の従来技術では、特徴点ごとに、その局所特徴量の類似性のみに基づいて対応点が決定されていたため、例えば建物の画像における窓やチェーン展開している店の看板のように、類似した形状の被写体がクエリ画像および検索対象画像のそれぞれに含まれていると、類似度の高い多数の特徴点が対応点として誤って抽出されてしまうという問題があった。   Further, in the above-described conventional technology, for each feature point, the corresponding point is determined based only on the similarity of the local feature amount. For example, like a window in a building image or a signboard of a store developing a chain When similar-shaped subjects are included in each of the query image and the search target image, there is a problem that many feature points with high similarity are erroneously extracted as corresponding points.

本発明の目的は、上記した従来技術の課題を解決し、クエリ画像および検索対象画像の類似性を、各特徴点の局所特徴量の類似性のみならず、被写体が同一であるか否かも考慮して判定できる画像検索方法およびシステムを提供することにある。   The object of the present invention is to solve the above-described problems of the prior art and consider the similarity between the query image and the search target image, not only the similarity of the local feature amount of each feature point, but also whether or not the subject is the same. It is an object of the present invention to provide an image search method and system that can be determined.

上記の目的を達成するために、本発明は、クエリ画像に類似した画像を検索対象画像の集合から検索する画像検索システムにおいて、クエリ画像および各検索対象画像の特徴点から局所特徴量を抽出する局所特徴量抽出手段と、クエリ画像および検索対象画像の各特徴点から抽出した局所特徴量を比較し、クエリ画像の特徴点ごとに、類似度が上位Nベストの対応点を抽出するNベスト抽出手段と、Nベスト対応点の局所特徴量をクエリ画像の対応する特徴点の局所特徴量と比較し、両者の局所領域の相違に関する分布を算出する相違分布算出手段と、相違分布に基づいて、対応点としての尤度が高い複数の対応点候補を抽出する対応点候補抽出手段と、対応点候補の局所特徴量をクエリ画像の対応する特徴点の局所特徴量と比較し、各局所領域の位置座標を正規化する正規化手段と、前記正規化された対応点候補の位置座標をクエリ画像の対応する特徴点の位置座標と比較し、各位置座標の相対的な位置関係の分布を算出する相対位置分布算出手段と、相対位置分布に基づいて、対応点としての尤度が高い複数の対応点を抽出する対応点抽出手段と、前記抽出された対応点に基づいて、クエリ画像に類似した検索対象画像を決定する類似画像決定手段とを具備したことを特徴とする。   In order to achieve the above object, the present invention extracts a local feature amount from a query image and feature points of each search target image in an image search system that searches an image similar to a query image from a set of search target images. Compares local feature values extracted from each feature point of the query image and the search target image with the local feature value extraction means, and extracts the corresponding points with the highest similarity in the top N best for each feature point of the query image And a difference distribution calculation means for comparing the local feature amount of the N best corresponding point with the local feature amount of the corresponding feature point of the query image, and calculating a distribution regarding the difference between the local regions of the two, based on the difference distribution, Corresponding point candidate extracting means for extracting a plurality of corresponding point candidates having high likelihood as corresponding points, comparing the local feature amount of the corresponding point candidate with the local feature amount of the corresponding feature point of the query image, and each local region Normalizing means for normalizing the position coordinates, and comparing the normalized position coordinates of the corresponding point candidates with the position coordinates of the corresponding feature points of the query image, and calculating the distribution of the relative positional relationship of each position coordinate A relative position distribution calculating means, a corresponding point extracting means for extracting a plurality of corresponding points having a high likelihood as corresponding points based on the relative position distribution, and a query image based on the extracted corresponding points And a similar image determination means for determining the search target image.

本発明によれば、特徴点の局所特徴量に基づいて対応点を抽出する際に、従来のように特徴点同士の個々の類似性に基づいて厳しい抽出条件で少数の対応点を抽出するのではなく、初めは抽出条件を緩めて多数の対応点候補を抽出し、次いで、この多数の対応点候補の局所特徴量の相対的な関係に基づいて尤度の高い対応点を抽出するようにした。したがって、建物画像の窓やチェーン展開している店の看板を含む画像のように、被写体が異なるにもかかわらず局所特徴量が類似する特徴点が数多く存在する画像同士の比較でも、これらの特徴点が対応点として誤抽出されにくくなる。   According to the present invention, when extracting corresponding points based on local feature amounts of feature points, a small number of corresponding points are extracted under strict extraction conditions based on individual similarities between feature points as in the past. Rather, the extraction condition is relaxed to extract a large number of corresponding point candidates, and then the corresponding points with high likelihood are extracted based on the relative relationship of the local feature amounts of the large number of corresponding point candidates. did. Therefore, even when comparing images that have many feature points with similar local features despite different subjects, such as a building image window or an image of a chained store sign, these features can be compared. A point is less likely to be erroneously extracted as a corresponding point.

本発明の一実施形態に係る画像検索システムのブロック図である。1 is a block diagram of an image search system according to an embodiment of the present invention. 相違分布の算出方法を模式的に示した図である。It is the figure which showed the calculation method of difference distribution typically. 相違分布の一例を示した図である。It is the figure which showed an example of difference distribution. 対応点候補の抽出方法の一例を示した図である。It is the figure which showed an example of the extraction method of a corresponding point candidate. 正規化および相対位置分布の算出方法を模式的に示した図である。It is the figure which showed typically the calculation method of normalization and a relative position distribution. 相対位置分布の一例を示した図である。It is the figure which showed an example of relative position distribution. 対応点の抽出方法の一例を示した図である。It is the figure which showed an example of the extraction method of a corresponding point. 本発明の一実施形態の動作を示したメインフローである。It is the main flow which showed operation | movement of one Embodiment of this invention. 対応点候補抽出処理の手順を示したフローチャートである。It is the flowchart which showed the procedure of the corresponding point candidate extraction process. 対応点抽出処理の手順を示したフローチャートである。It is the flowchart which showed the procedure of the corresponding point extraction process.

以下、図面を参照して本発明の実施形態について詳細に説明する。図1は、本発明の一実施形態に係る画像検索システムの主要部の構成を示したブロック図であり、ここでは、本発明の説明に不要な構成は図示が省略されている。   Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings. FIG. 1 is a block diagram showing a configuration of a main part of an image search system according to an embodiment of the present invention. Here, illustrations of components unnecessary for the description of the present invention are omitted.

局所特徴量抽出部1は、クエリ画像Iqおよび多数の検索対象画像Iw(k)の各特徴点を基準にして局所特徴量fq(i),fw(k,j)を抽出する。なお、符号kは検索対象画像の識別子である。本実施形態では、SIFTを利用して特徴点の抽出および対応付けが行われる。すなわち、局所領域の特定には、非特許文献1に開示されているDifference of Gaussian (DoG)によるスケールスペース内の極値に基づく特徴点抽出が用いられる。この特徴点抽出の結果、特徴点の位置およびその局所領域の範囲が算出され、この局所領域の特徴記述子として、輝度勾配の方向ヒストグラムが用いられる。   The local feature quantity extraction unit 1 extracts local feature quantities fq (i) and fw (k, j) with reference to each feature point of the query image Iq and a large number of search target images Iw (k). Note that the symbol k is an identifier of the search target image. In this embodiment, feature points are extracted and associated using SIFT. That is, for specifying the local region, feature point extraction based on the extreme value in the scale space by Difference of Gaussian (DoG) disclosed in Non-Patent Document 1 is used. As a result of the feature point extraction, the position of the feature point and the range of the local region are calculated, and a luminance gradient direction histogram is used as the feature descriptor of the local region.

このような方向ヒストグラムは、特徴領域の各ピクセルの輝度勾配を算出し、それに重みを付けてヒストグラムを生成し、最も多いbin領域の方向を基準にして、その方向に特徴領域の回転(オリエンテーション)を行い、再度輝度方向の方向ヒストグラムを作成し、さらに前記ヒストグラムをブロックに分割し、各ブロック内で方向ヒストグラムを算出し、これを正規化してベクトル化することにより得られる。本実施形態では、ブロック内の輝度方向を8方向、対象領域内を16分割しているため、一つの特徴記述子は8*16=128次元となる。   Such a direction histogram calculates the luminance gradient of each pixel in the feature region, weights it to generate a histogram, and rotates the feature region in that direction based on the direction of the most bin region (orientation) The direction histogram in the luminance direction is generated again, the histogram is further divided into blocks, the direction histogram is calculated in each block, and this is normalized and vectorized. In this embodiment, since the luminance direction in the block is divided into 8 directions and the target area is divided into 16 areas, one feature descriptor has 8 * 16 = 128 dimensions.

これら特徴記述子の特徴として、局所領域の特徴を生成するのでオクルージョンに耐性があり、特徴点に対してスケールを決定するので画像サイズに不変であり、また輝度勾配に基づき画像平面内でオリエンテーションを行うので、画像平面に対する回転に不変であることなどが挙げられる。さらに、エッジ成分を利用しているので輝度変化に耐性がある。このような特徴点検出が画像の全てのピクセルに対して行われるが、ある特徴点が極値を取った場合でも特徴点として不適な場合は特徴領域から除外される。   As feature of these feature descriptors, local region features are generated, so it is resistant to occlusion, scales are determined for feature points, and the image size is unchanged, and orientation is set in the image plane based on the luminance gradient. Since it is performed, it is invariable to rotation with respect to the image plane. Furthermore, since edge components are used, it is resistant to luminance changes. Such feature point detection is performed on all pixels of the image, but even if a certain feature point takes an extreme value, it is excluded from the feature region if it is inappropriate as a feature point.

本実施形態では、クエリ画像Iqの各局所特徴量fq(i)が次式(1)で表される。pq(i)は同次座標で表した特徴点の位置、op(i)は特徴点のオリエンテーション、σq(i)は特徴点が発見されたスケール、dq(i)は特徴記述子であり、符号iはクエリ画像Iqの特徴点識別子である。   In the present embodiment, each local feature quantity fq (i) of the query image Iq is expressed by the following equation (1). pq (i) is the position of the feature point expressed in homogeneous coordinates, op (i) is the orientation of the feature point, σq (i) is the scale at which the feature point was found, dq (i) is the feature descriptor, A symbol i is a feature point identifier of the query image Iq.

fq(i)={pq(i),op(i), σq(i),dq(i)} ・・・(1)         fq (i) = {pq (i), op (i), σq (i), dq (i)} (1)

同様に、各検索対象画像Iw(k)の局所特徴量fw(k,j)は次式(2)で表される。pw(k,j)は同次座標で表した特徴点の位置、ow(k,j)は特徴点のオリエンテーション、σw(k,j)は特徴点が発見されたスケール、dw(k,j)は特徴記述子であり、符号jは検索対象画像Iw(k)の特徴点識別子である。   Similarly, the local feature quantity fw (k, j) of each search target image Iw (k) is expressed by the following equation (2). pw (k, j) is the position of the feature point expressed in homogeneous coordinates, ow (k, j) is the orientation of the feature point, σw (k, j) is the scale where the feature point was found, dw (k, j ) Is a feature descriptor, and symbol j is a feature point identifier of the search target image Iw (k).

fw(k,j)={pw(k,j),ow(k,j),σw(k,j),dw(k,j)} ・・・(2)         fw (k, j) = {pw (k, j), ow (k, j), σw (k, j), dw (k, j)} (2)

Nベスト抽出部2は、クエリ画像Iqの各特徴点の局所特徴量と全ての検索対象画像Iw(k)の各特徴点の局所特徴量とを比較し、抽出条件を従来技術よりも緩めて、クエリ画像Iqの特徴点ごとに、各検索対象画像Iw(k)から局所特徴量の類似度が高い上位N個の特徴点をNベスト対応点として抽出する。したがって、クエリ画像Iqにm個の特徴点が設定されていれば、(m×N)個のNベスト対応点が全ての検索対象画像Iw(k)から抽出されることになる。   The N best extraction unit 2 compares the local feature amount of each feature point of the query image Iq with the local feature amount of each feature point of all the search target images Iw (k), and relaxes the extraction condition than the conventional technique. For each feature point of the query image Iq, the top N feature points with high local feature similarity are extracted as N best corresponding points from each search target image Iw (k). Therefore, if m feature points are set in the query image Iq, (m × N) N best corresponding points are extracted from all the search target images Iw (k).

本実施形態では、クエリ画像Iqの各特徴点について、全ての検索対象画像Iw(k)の各特徴点を対象に局所特徴量の最近傍探索を行い、検索対象画像ごとに、局所特徴量間の距離に基づいて類似度を算出する。本実施形態では、各特徴点の局所特徴量fq(i),fw(k,j)間の類似度が、次式(3)で与えられる各特徴記述子dq(i),dw(k,j)間のユークリッド距離Lで代表される。   In the present embodiment, for each feature point of the query image Iq, a local feature closest search is performed for each feature point of all the search target images Iw (k), and for each search target image, The similarity is calculated based on the distance. In this embodiment, the similarity between the local feature quantities fq (i) and fw (k, j) of each feature point is represented by the feature descriptors dq (i), dw (k, represented by Euclidean distance L between j).

L=|dq(i)−dw(k,j)| ・・・(3)         L = | dq (i) −dw (k, j) | (3)

相違分布算出部3は、Nベスト対応点の局所特徴量をクエリ画像の対応する特徴点の局所特徴量と比較し、各局所領域の相違に関する分布を算出する。本実施形態では、局所領域のスケール比(または差)、およびオリエンテーションの角度差(または角度比)に関する分布を算出する。本実施形態では、図2に一例を示したように、Nベスト対応点ごとに、その局所特徴量とクエリ画像Iqの対応する局所特徴量との局所領域(スケール)のサイズ比およびオリエンテーションの角度差を算出して対応付け、これを全てのNベスト対応点について実施してプロットすることにより、図3に一例を示した相違分布を算出する。   The difference distribution calculation unit 3 compares the local feature amount of the N best corresponding point with the local feature amount of the corresponding feature point of the query image, and calculates a distribution relating to the difference of each local region. In this embodiment, the distribution regarding the scale ratio (or difference) of the local region and the angular difference (or angle ratio) of the orientation is calculated. In this embodiment, as shown in an example in FIG. 2, for each N best corresponding point, the size ratio of the local region (scale) between the local feature amount and the corresponding local feature amount of the query image Iq, and the angle of orientation The difference distribution shown in the example of FIG. 3 is calculated by calculating and associating the differences, and performing and plotting the differences for all N best corresponding points.

対応点候補抽出部4は、前記相違分布に基づいて、対応点としての尤度が高い複数の対応点候補を抽出する。図4は、対応点候補の抽出方法の一例を示した図であり、本実施形態では、分布密度の最も高い位置を中心に所定の範囲内に存在するNベスト対応点が対応点候補とされ、それ以外のNベスト対応点はノイズとして除去される。   The corresponding point candidate extraction unit 4 extracts a plurality of corresponding point candidates having a high likelihood as corresponding points based on the difference distribution. FIG. 4 is a diagram showing an example of a corresponding point candidate extraction method. In this embodiment, N best corresponding points existing within a predetermined range centering on a position having the highest distribution density are set as corresponding point candidates. The other N best corresponding points are removed as noise.

正規化部5は、前記対応点候補の局所特徴量、特に局所領域のサイズに基づいて、各検索対象画像およびクエリ画像の一方を他方に合わせて拡縮することで両者の位置座標を正規化する。本実施形態では、前記分布密度の最も高い位置の対応点に基づいてクエリ画像Iqのサイズと検索対象画像Iw(k)のサイズとの差を算出し、これに基づいて前記各対応点候補の位置座標が変換される。   The normalization unit 5 normalizes the position coordinates of both of the search target images and the query image based on the local feature amount of the corresponding point candidate, in particular, the size of the local region, by scaling one of the search target images and the query image. . In the present embodiment, the difference between the size of the query image Iq and the size of the search target image Iw (k) is calculated based on the corresponding point at the position with the highest distribution density, and based on this, the corresponding point candidate is calculated. The position coordinates are converted.

相対位置分布算出部6は、前記正規化された対応点候補の位置座標とクエリ画像の対応する特徴点の位置座標との相対的な位置関係の分布を算出する。   The relative position distribution calculation unit 6 calculates a relative positional relationship distribution between the normalized position coordinates of the corresponding point candidate and the position coordinates of the corresponding feature point of the query image.

図5は、前記正規化および分布算出の一例を模式的に表現した図であり、本実施形態では、正規化された対応点候補の位置座標をクエリ画像の対応する特徴点の位置座標と比較し、各位置座標のX方向およびY方向に関する相対位置の差を求め、これを全ての対応点候補について実施してプロットすることにより、図6に一例を示した相対位置分布を算出する。   FIG. 5 is a diagram schematically showing an example of the normalization and distribution calculation. In the present embodiment, the normalized position coordinates of the corresponding point candidates are compared with the position coordinates of the corresponding feature points of the query image. Then, the relative position distribution of each position coordinate in the X direction and the Y direction is obtained, and this is performed for all corresponding point candidates and plotted, thereby calculating the relative position distribution shown in FIG.

対応点抽出部7は、前記相対位置分布に基づいて、対応点としての尤度が高い複数の対応点を抽出する。図7は、対応点の抽出方法の一例を示した図であり、本実施形態では、分布密度の最も高い位置を中心に所定の範囲内に存在する対応点候補が対応点とされ、それ以外の対応点候補はノイズとして除去される。また、クエリ画像Iqの各特徴点に複数の対応点が抽出されていると、最尤の対応点以外は除去される。   The corresponding point extraction unit 7 extracts a plurality of corresponding points having high likelihood as corresponding points based on the relative position distribution. FIG. 7 is a diagram showing an example of a method for extracting corresponding points. In this embodiment, corresponding point candidates existing within a predetermined range centering on a position having the highest distribution density are used as the corresponding points. The corresponding point candidates are removed as noise. Further, when a plurality of corresponding points are extracted for each feature point of the query image Iq, other than the most likely corresponding points are removed.

類似画像決定部8は、対応点が最も多い検索対象画像Iw(k)を抽出し、これを検索結果として出力する。あるいは更に、前記抽出された複数の対応点を利用して射影変換を行い、このうち、射影変換できた対応点の個数が最も多い検索対象画像Iw(k)を検索結果とするようにしても良い。   The similar image determination unit 8 extracts the search target image Iw (k) having the most corresponding points, and outputs this as a search result. Alternatively, projective transformation is performed using the plurality of extracted corresponding points, and the search target image Iw (k) having the largest number of corresponding points that can be projectively transformed is used as the search result. good.

次いで、フローチャートを参照して本発明の一実施形態の動作を詳細に説明する。図8は、本発明の一実施形態の動作を示したメインフローである。   Next, the operation of the embodiment of the present invention will be described in detail with reference to a flowchart. FIG. 8 is a main flow showing the operation of one embodiment of the present invention.

ステップS1では、局所特徴量抽出部1において、クエリ画像Iqから各特徴点を基準にした局所領域の特徴量fq(i)が抽出され、さらに全ての検索対象画像Iw(k)から各特徴点を基準にした局所領域の特徴量fw(k,j)が抽出される。ステップS2では、検索対象画像Iw(k)の一つが、今回の比較対照として選択される。ステップS3では、クエリ画像Iqの各特徴点と局所特徴量が一致または類似する検索対象画像Iw(k)の特徴点を対応点候補として抽出する対応点候補抽出処理が実行される。   In step S1, the local feature quantity extraction unit 1 extracts a local area feature quantity fq (i) based on each feature point from the query image Iq, and further extracts each feature point from all search target images Iw (k). The feature quantity fw (k, j) of the local region with reference to is extracted. In step S2, one of the search target images Iw (k) is selected as the current comparison control. In step S3, a corresponding point candidate extraction process is performed in which the feature points of the search target image Iw (k) whose local feature amounts match or similar to the feature points of the query image Iq are extracted as corresponding point candidates.

図9は、前記ステップS3で実行される対応点候補抽出処理の手順を示したフローチャートであり、ステップS101では、クエリ画像Iqから抽出された多数の特徴点の中の一つの局所特徴量fq(i)が選択される。ステップS102では、今回の検索対象画像Iw(k)の全ての特徴点の局所特徴量fwとクエリ画像Iqの今回の局所特徴量fq(i)との類似度が、各特徴量間の距離(ユークリッド距離)として算出される。ステップS103では、局所特徴量の距離が近い上位N個の対応点(Nベスト対応点)が抽出される。ステップS104では、クエリ画像Iqの全ての特徴点についてNベスト対応点の抽出が完了したか否かが判定され、完了するまではステップS101へ戻って上記の各処理が繰り返される。   FIG. 9 is a flowchart showing the procedure of the corresponding point candidate extraction process executed in step S3. In step S101, one local feature quantity fq (of many feature points extracted from the query image Iq is shown. i) is selected. In step S102, the similarity between the local feature quantity fw of all feature points of the current search target image Iw (k) and the current local feature quantity fq (i) of the query image Iq is determined by the distance between the feature quantities ( Euclidean distance). In step S103, the top N corresponding points (N best corresponding points) with a short local feature distance are extracted. In step S104, it is determined whether or not the extraction of the N best corresponding points has been completed for all the feature points of the query image Iq, and the process returns to step S101 and is repeated until completion.

ステップS105では、抽出されたNベスト対応点の一つと、これに対応するクエリ画像Iqの特徴点とのペアが取得される。ステップS106では、前記取得されたペアの局所特徴量同士が比較され、そのサイズ比およびオリエンテーションの角度差が算出される。ステップS107では、前記図2を参照して説明したように、今回のNベスト対応点が、前記サイズ比およびオリエンテーション角度差に基づいてプロットされる。ステップS108では、全てのNベスト対応点に関してプロットが完了したか否かが判定される。完了していなければステップS105へ戻り、残りのNベスト対応点について同様の手順が繰り返される。   In step S105, a pair of one of the extracted N best corresponding points and the corresponding feature point of the query image Iq is acquired. In step S106, the acquired local feature values of the pair are compared with each other, and the size ratio and the angle difference between the orientations are calculated. In step S107, as described with reference to FIG. 2, the current N best corresponding points are plotted based on the size ratio and the orientation angle difference. In step S108, it is determined whether or not plotting has been completed for all N best corresponding points. If not completed, the process returns to step S105, and the same procedure is repeated for the remaining N best corresponding points.

全てのNベスト対応点に関してプロットが完了して前記図3の位相分布が完成するとステップS109へ進み、分布密度の最大位置が検出される。ステップS110では、前記図4に示したように、前記最大位置から所定の範囲内のNベスト対応点が対応点候補とされ、それ以外のNベスト対応点はノイズとして破棄される。   When plotting is completed for all N best corresponding points and the phase distribution of FIG. 3 is completed, the process proceeds to step S109, and the maximum position of the distribution density is detected. In step S110, as shown in FIG. 4, N best corresponding points within a predetermined range from the maximum position are taken as corresponding point candidates, and other N best corresponding points are discarded as noise.

図8へ戻り、ステップS4では、前記対応点候補の中から対応点を抽出する対応点抽出処理が実行される。図10は、この対応点抽出処理の手順を示したフローチャートである。   Returning to FIG. 8, in step S4, a corresponding point extraction process for extracting corresponding points from the corresponding point candidates is executed. FIG. 10 is a flowchart showing the procedure of the corresponding point extraction process.

ステップS201では、前記分布密度の最大位置の局所特徴量と、この最大位置と対応するクエリ画像Iqの特徴点の局所特徴量とが比較され、両者のスケールに基づいてクエリ画像Iqに対する検索対象画像Iw(k)の拡縮倍率が算出される。ステップS202では、クエリ画像Iqに合わせて検索対象画像Iw(k)の位置座標を正規化すべく、前記対応点候補の位置座標が前記拡縮倍率に基づいて変換される。   In step S201, the local feature amount at the maximum position of the distribution density is compared with the local feature amount of the feature point of the query image Iq corresponding to the maximum position, and the search target image for the query image Iq based on the scale of both. The scaling factor of Iw (k) is calculated. In step S202, in order to normalize the position coordinates of the search target image Iw (k) in accordance with the query image Iq, the position coordinates of the corresponding point candidates are converted based on the scaling factor.

ステップS203では、対応点候補の一つに注目し、前記図5を参照して説明したように、その正規化後の位置座標と、これに対応するクエリ画像Iqの特徴点の位置座標とのズレ量が、X方向およびY方向に関して算出される。ステップS204では、前記X方向およびY方向のズレ量がプロットされる。ステップS205では、全ての対応点候補に関してプロットが完了したか否かが判定される。完了していなければステップS203へ戻り、残りの対応点候補について同様の手順が繰り返される。   In step S203, attention is paid to one of the corresponding point candidates, and as described with reference to FIG. 5, the normalized position coordinates and the position coordinates of the characteristic points of the query image Iq corresponding thereto are calculated. A deviation amount is calculated for the X direction and the Y direction. In step S204, the amount of deviation in the X and Y directions is plotted. In step S205, it is determined whether plotting has been completed for all corresponding point candidates. If not completed, the process returns to step S203, and the same procedure is repeated for the remaining corresponding point candidates.

全ての対応点候補に関してプロットが完了し、前記図6に示した相対位置分布が完成するとステップS206へ進み、前記図7に示したように、分布密度が最大となる位置を中心に所定の抽出範囲が設定される。ステップS207では、前記抽出範囲内の対応点候補が対応点とされ、それ以外の対応点候補はノイズとして破棄される。   When plotting is completed for all the corresponding point candidates and the relative position distribution shown in FIG. 6 is completed, the process proceeds to step S206. As shown in FIG. 7, a predetermined extraction is performed around the position where the distribution density is maximum. A range is set. In step S207, the corresponding point candidates in the extraction range are set as corresponding points, and the other corresponding point candidates are discarded as noise.

図8へ戻り、ステップS5では、全ての検索対象画像Iw(k)に関して上記の対応点抽出処理が完了したか否かが判定される。完了していなければステップS2へ戻り、注目する検索対象画像Iw(k)を切り換えながら上記の各処理が繰り返される。ステップS6では、前記類似画像決定部8において、検索対象画像Iw(k)が前記対応点の個数でソートされ、対応点数が最多である唯一の検索対象画像、あるいは対応点数が上位の複数の検索対象画像が検索結果として出力される。   Returning to FIG. 8, in step S <b> 5, it is determined whether or not the corresponding point extraction processing has been completed for all the search target images Iw (k). If not completed, the process returns to step S2, and the above processes are repeated while switching the target search target image Iw (k). In step S6, the similar image determination unit 8 sorts the search target images Iw (k) by the number of corresponding points, and is the only search target image having the largest number of corresponding points, or a plurality of searches with the highest number of corresponding points. The target image is output as a search result.

なお、以上のようにして抽出された対応点を用いて、検索対象画像Iw(k)ごとにクエリ画像Iqからの射影変換を実施し、射影変換行列の構築に実際に利用できた対応点の個数が最多である唯一あるいは上位の複数の検索対象画像が検索結果として出力されるようにしても良い。   Using the corresponding points extracted as described above, projective transformation from the query image Iq is performed for each search target image Iw (k), and the corresponding points that can actually be used for constructing the projective transformation matrix. A single or upper plurality of search target images having the largest number may be output as search results.

1…局所特徴量抽出部,2…Nベスト抽出部,3…相違分布算出部,4…対応点候補抽出部,5…正規化部,6…相対位置分布算出部,7…対応点抽出部,8…類似画像決定部   DESCRIPTION OF SYMBOLS 1 ... Local feature-value extraction part, 2 ... N best extraction part, 3 ... Difference distribution calculation part, 4 ... Corresponding point candidate extraction part, 5 ... Normalization part, 6 ... Relative position distribution calculation part, 7 ... Corresponding point extraction part , 8 ... Similar image determination unit

Claims (5)

クエリ画像に類似した画像を検索対象画像の集合から検索する画像検索システムにおいて、
クエリ画像および各検索対象画像の特徴点から局所特徴量を抽出する局所特徴量抽出手段と、
クエリ画像および検索対象画像の各特徴点から抽出した局所特徴量を比較し、クエリ画像の特徴点ごとに、類似度が上位Nベストの対応点を抽出するNベスト抽出手段と、
前記Nベスト対応点の局所特徴量をクエリ画像の対応する特徴点の局所特徴量と比較し、両者の局所領域の相違に関する分布を算出する相違分布算出手段と、
前記相違分布に基づいて、対応点としての尤度が高い複数の対応点候補を抽出する対応点候補抽出手段と、
前記対応点候補の局所特徴量をクエリ画像の対応する特徴点の局所特徴量と比較し、各局所領域の位置座標を正規化する正規化手段と、
前記正規化された対応点候補の位置座標をクエリ画像の対応する特徴点の位置座標と比較し、各位置座標の相対的な位置関係の分布を算出する相対位置分布算出手段と、
前記相対位置分布に基づいて、対応点としての尤度が高い複数の対応点を抽出する対応点抽出手段と、
前記抽出された対応点に基づいて、クエリ画像に類似した検索対象画像を決定する類似画像決定手段とを具備したことを特徴とする画像検索システム。
In an image search system that searches an image similar to a query image from a set of search target images,
A local feature amount extraction means for extracting a local feature amount from the query image and feature points of each search target image;
N best extraction means for comparing local feature amounts extracted from each feature point of the query image and the search target image, and extracting corresponding points of the highest N best similarity for each feature point of the query image;
Comparing the local feature amount of the N best corresponding point with the local feature amount of the corresponding feature point of the query image, and calculating a distribution regarding the difference between the local regions of both,
Corresponding point candidate extracting means for extracting a plurality of corresponding point candidates with high likelihood as corresponding points based on the difference distribution;
Normalizing means for comparing the local feature amount of the corresponding point candidate with the local feature amount of the corresponding feature point of the query image, and normalizing the position coordinates of each local region;
A relative position distribution calculating unit that compares the normalized position coordinates of the corresponding point candidate with the position coordinates of the corresponding feature point of the query image, and calculates a relative positional relationship distribution of each position coordinate;
Corresponding point extraction means for extracting a plurality of corresponding points having a high likelihood as corresponding points based on the relative position distribution;
An image search system comprising: similar image determination means for determining a search target image similar to a query image based on the extracted corresponding points.
前記相違分布算出手段は、前記Nベスト対応点の局所特徴量をクエリ画像の対応する特徴点の局所特徴量と比較し、両者の局所領域のスケールおよびオリエンテーションの相違に関する分布を算出することを特徴とする請求項1に記載の画像検索システム。   The difference distribution calculating means compares the local feature amount of the N best corresponding point with the local feature amount of the corresponding feature point of the query image, and calculates a distribution related to the difference in scale and orientation of the local regions of both. The image search system according to claim 1. 前記相対位置分布算出手段は、前記正規化された対応点候補の位置座標をクエリ画像の対応する特徴点の位置座標と比較し、各位置座標のX方向およびY方向に関する位置ズレの分布を算出することを特徴とする請求項1に記載の画像検索システム。   The relative position distribution calculating means compares the normalized position coordinates of the corresponding point candidate with the position coordinates of the corresponding feature points of the query image, and calculates a distribution of position shifts in the X direction and Y direction of each position coordinate. The image search system according to claim 1, wherein: 前記類似画像決定手段は、前記抽出された複数の対応点に基づいて、クエリ画像と各検索対象画像との射影変換を行い、射影変換に用いられた対応点に基づいて、クエリ画像に類似した検索対象画像を決定することを特徴とする請求項1ないし3のいずれかに記載の画像検索システム。   The similar image determining means performs a projective transformation between the query image and each search target image based on the plurality of extracted corresponding points, and is similar to the query image based on the corresponding points used for the projective transformation. 4. The image search system according to claim 1, wherein a search target image is determined. クエリ画像に類似した画像を検索対象画像の集合から検索する画像検索方法において、
クエリ画像および各検索対象画像の特徴点から局所特徴量を抽出する手順と、
クエリ画像および検索対象画像の各特徴点から抽出した局所特徴量を比較し、クエリ画像の特徴点ごとに、類似度が上位Nベストの対応点を抽出する手順と、
前記Nベスト対応点の局所特徴量をクエリ画像の対応する特徴点の局所特徴量と比較し、両者の局所領域の相違に関する分布を算出する手順と、
前記相違分布に基づいて、対応点としての尤度が高い複数の対応点候補を抽出する手順と、
前記対応点候補の局所特徴量をクエリ画像の対応する特徴点の局所特徴量と比較し、各局所領域の位置座標を正規化する手順と、
前記正規化された対応点候補の位置座標をクエリ画像の対応する特徴点の位置座標と比較し、各位置座標の相対的な位置関係の分布を算出する手順と、
前記相対位置分布に基づいて、対応点としての尤度が高い複数の対応点を抽出する手順と、
前記抽出された対応点に基づいて、クエリ画像に類似した検索対象画像を決定する手順とを具備したことを特徴とする画像検索方法。
In an image search method for searching an image similar to a query image from a set of search target images,
A procedure for extracting a local feature amount from a feature point of a query image and each search target image;
A procedure for comparing local feature amounts extracted from each feature point of the query image and the search target image, and extracting a corresponding point with the highest N similarity for each feature point of the query image,
Comparing the local feature amount of the N best corresponding point with the local feature amount of the corresponding feature point of the query image, and calculating a distribution regarding the difference between the local regions of the two,
A procedure for extracting a plurality of corresponding point candidates having a high likelihood as corresponding points based on the difference distribution;
Comparing the local feature amount of the corresponding point candidate with the local feature amount of the corresponding feature point of the query image, and normalizing the position coordinates of each local region;
Comparing the normalized position coordinates of the corresponding point candidate with the position coordinates of the corresponding feature points of the query image, and calculating a relative positional relationship distribution of the position coordinates;
A procedure for extracting a plurality of corresponding points having high likelihood as corresponding points based on the relative position distribution;
A method for determining an image to be searched similar to a query image based on the extracted corresponding points.
JP2009151020A 2009-06-25 2009-06-25 Image search method and system Expired - Fee Related JP5164222B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009151020A JP5164222B2 (en) 2009-06-25 2009-06-25 Image search method and system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009151020A JP5164222B2 (en) 2009-06-25 2009-06-25 Image search method and system

Publications (2)

Publication Number Publication Date
JP2011008507A JP2011008507A (en) 2011-01-13
JP5164222B2 true JP5164222B2 (en) 2013-03-21

Family

ID=43565091

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009151020A Expired - Fee Related JP5164222B2 (en) 2009-06-25 2009-06-25 Image search method and system

Country Status (1)

Country Link
JP (1) JP5164222B2 (en)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9036925B2 (en) 2011-04-14 2015-05-19 Qualcomm Incorporated Robust feature matching for visual search
KR101130817B1 (en) 2011-09-27 2012-04-16 (주)올라웍스 Face recognition method, apparatus, and computer-readable recording medium for executing the method
JP5780127B2 (en) * 2011-11-18 2015-09-16 カシオ計算機株式会社 Image processing apparatus, image processing method, and program
JP6153086B2 (en) * 2011-12-14 2017-06-28 日本電気株式会社 Video processing system, video processing method, video processing apparatus for portable terminal or server, and control method and control program therefor
JP2015062090A (en) * 2011-12-15 2015-04-02 日本電気株式会社 Video processing system, video processing method, video processing device for portable terminal or server, and control method and control program of the same
JP2015062089A (en) * 2011-12-15 2015-04-02 日本電気株式会社 Video processing system, video processing method, video processing device for portable terminal or server, and control method and control program of the same
JP6041156B2 (en) * 2011-12-16 2016-12-07 日本電気株式会社 Information processing system, information processing method, and information processing program
JP6153087B2 (en) * 2011-12-16 2017-06-28 日本電気株式会社 Information processing system, information processing method, information processing apparatus and control method and control program thereof, communication terminal and control method and control program thereof
WO2013089146A1 (en) * 2011-12-16 2013-06-20 日本電気株式会社 Information processing system, information processing method, communication terminal, and method for controlling and program for controlling same
WO2013115203A1 (en) * 2012-01-30 2013-08-08 日本電気株式会社 Information processing system, information processing method, information processing device, and control method and control program therefor, and communication terminal, and control method and control program therefor
JP6131859B2 (en) * 2012-01-30 2017-05-24 日本電気株式会社 Information processing system, information processing method, information processing apparatus and control method and control program thereof, communication terminal and control method and control program thereof
JP6226187B2 (en) * 2012-01-30 2017-11-08 日本電気株式会社 Information processing system, information processing method, information processing apparatus and control method and control program thereof, communication terminal and control method and control program thereof
US9792528B2 (en) 2012-01-30 2017-10-17 Nec Corporation Information processing system, information processing method, information processing apparatus and control method and control program thereof, and communication terminal and control method and control program thereof
JP2015092302A (en) * 2012-01-30 2015-05-14 日本電気株式会社 Video processing system, video processing method, video processing device, and control method and control program thereof
KR101191172B1 (en) * 2012-02-15 2012-10-15 (주)올라웍스 Method, apparatus and computer-readable recording medium for managing images in image database
JP5533988B2 (en) * 2012-11-30 2014-06-25 株式会社デンソーアイティーラボラトリ Image processing system
JP6017343B2 (en) * 2013-02-25 2016-10-26 Kddi株式会社 Database generation device, camera posture estimation device, database generation method, camera posture estimation method, and program
JP6399518B2 (en) * 2014-12-18 2018-10-03 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation Processing device, processing method, and program
JP6757203B2 (en) * 2016-08-02 2020-09-16 キヤノン株式会社 Image detector, its control method, and program
JP2018124798A (en) * 2017-02-01 2018-08-09 東芝テック株式会社 Image search device and image search program
JP7220062B2 (en) 2018-11-29 2023-02-09 富士通株式会社 LEARNING DATA GENERATION PROGRAM, LEARNING DATA GENERATION DEVICE, AND LEARNING DATA GENERATION METHOD
CN111339846B (en) * 2020-02-12 2022-08-12 深圳市商汤科技有限公司 Image recognition method and device, electronic equipment and storage medium

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4492036B2 (en) * 2003-04-28 2010-06-30 ソニー株式会社 Image recognition apparatus and method, and robot apparatus
JP5096776B2 (en) * 2007-04-04 2012-12-12 キヤノン株式会社 Image processing apparatus and image search method
JP5018404B2 (en) * 2007-11-01 2012-09-05 ソニー株式会社 Image identification apparatus, image identification method, and program

Also Published As

Publication number Publication date
JP2011008507A (en) 2011-01-13

Similar Documents

Publication Publication Date Title
JP5164222B2 (en) Image search method and system
Zhang et al. A robust point-matching algorithm for remote sensing image registration
JP5385105B2 (en) Image search method and system
US20140072217A1 (en) Template matching with histogram of gradient orientations
EP2946338B1 (en) Describing objects using edge-pixel-feature descriptors
CN106682700B (en) Block rapid matching method based on key point description operator
US20140226906A1 (en) Image matching method and apparatus
CN111242221B (en) Image matching method, system and storage medium based on image matching
KR20100008886A (en) The method of automatic geometric correction for multi-resolution satellite images using scale invariant feature transform
US9269023B2 (en) Edge based location feature index matching
Chen et al. Rapid detection of multi-QR codes based on multistage stepwise discrimination and a compressed MobileNet
Vaikundam et al. Anomaly region detection and localization in metal surface inspection
Feng et al. A coarse-to-fine image registration method based on visual attention model
Zhou et al. Discarding wide baseline mismatches with global and local transformation consistency
CN110704667B (en) Rapid similarity graph detection method based on semantic information
JP2015007919A (en) Program, apparatus, and method of realizing high accuracy geometric inspection for images different in point of view
JP5249088B2 (en) Image search system
Kumar et al. Face recognition using sift by varying distance calculation matching method
Mentzer et al. Self-calibration of wide baseline stereo camera systems for automotive applications
Ren et al. SAR image matching method based on improved SIFT for navigation system
de Trazegnies et al. Planar shape indexing and retrieval based on Hidden Markov Models
Clark et al. Perspective correction for improved visual registration using natural features.
Yuan-ming et al. Enhanced mean shift tracking algorithm based on evolutive asymmetric kernel
Yan et al. A method for recognition of work-pieces based on improved sift characteristics matching
Qi et al. Pose-indexed based multi-view method for face alignment

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120224

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20121205

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121212

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121214

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151228

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees