JP2016018444A - 画像検索装置、方法、及びプログラム - Google Patents
画像検索装置、方法、及びプログラム Download PDFInfo
- Publication number
- JP2016018444A JP2016018444A JP2014141549A JP2014141549A JP2016018444A JP 2016018444 A JP2016018444 A JP 2016018444A JP 2014141549 A JP2014141549 A JP 2014141549A JP 2014141549 A JP2014141549 A JP 2014141549A JP 2016018444 A JP2016018444 A JP 2016018444A
- Authority
- JP
- Japan
- Prior art keywords
- image
- centroid
- local feature
- unit
- reference image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Processing Or Creating Images (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
【課題】クエリ画像と類似するリファレンス画像を精度よく取得することができるようにする。
【解決手段】局所特徴量抽出部20が、クエリ画像に対して、回転又は拡大率の変化を含む複数の変換を行って複数の変換画像を生成し、クエリ画像及び複数の変換画像の各々から、局所特徴量及び幾何特徴を抽出する。セントロイド取得部28が、クエリ画像の局所特徴量に対応するセントロイドを取得する。投票部30が、取得されたセントロイドに対応してインデクス格納部26に格納されたリファレンス画像に対する幾何特徴との比率又は差分を算出し、リファレンス画像に対する幾何特徴との比率又は差分に対して設けられた投票箱に投票する。スコア部32が、投票結果に基づいて、クエリ画像とリファレンス画像との類似度を示すスコアを算出する。類似画像出力部34が、スコアに基づいて、クエリ画像と類似するリファレンス画像を出力する。
【選択図】図2
【解決手段】局所特徴量抽出部20が、クエリ画像に対して、回転又は拡大率の変化を含む複数の変換を行って複数の変換画像を生成し、クエリ画像及び複数の変換画像の各々から、局所特徴量及び幾何特徴を抽出する。セントロイド取得部28が、クエリ画像の局所特徴量に対応するセントロイドを取得する。投票部30が、取得されたセントロイドに対応してインデクス格納部26に格納されたリファレンス画像に対する幾何特徴との比率又は差分を算出し、リファレンス画像に対する幾何特徴との比率又は差分に対して設けられた投票箱に投票する。スコア部32が、投票結果に基づいて、クエリ画像とリファレンス画像との類似度を示すスコアを算出する。類似画像出力部34が、スコアに基づいて、クエリ画像と類似するリファレンス画像を出力する。
【選択図】図2
Description
本発明は、画像検索装置、方法、及びプログラムに係り、特に、クエリ画像と類似するリファレンス画像を検索する画像検索装置、方法、及びプログラムに関する。
従来より、画像中に同一の被写体が写っているかを高速に分析するための技術として、画像から抽出した局所特徴量をあらかじめ作成しておいたクラスタに分類し、同一クラスタの局所特徴量をより多く含む画像ほど、同一の被写体が写っている可能性が高いと判定するbag of visual wordsなどと呼ばれる手法がある(例えば、非特許文献1)。この手法では、局所特徴量1つ1つを比較するのではなく、同じクラスタに分類された局所特徴量のみを処理し、カウントすることにより画像の類似度を算出することができるため、高速に類似する画像を発見することができる。
また、局所特徴量の回転角度および拡大・縮小の比率の一貫性を検証する手法がある。例えば、非特許文献2に記載の技術では、図14に示すクエリ画像1とリファレンス画像とは、3点ともが回転角度135度、拡大率が0.5であるのに対し、クエリ画像2とリファレンス画像とは2点が回転角度90度、拡大率2であるが、もう一点は回転角度、拡大率ともに異なる。従って、回転角度および拡大率が一貫している点の多いクエリ画像1の方が、クエリ画像2よりも類似度が高いとして判定することができる。
Sivic,Josef,and Andrew Zisserman,"Video Google: A text retrieval approach to object matching in videos.",Computer Vision,2003,Proceedings,Ninth IEEE International Conference on,IEEE,2003.
Jegou,Herve,Matthijs Douze,and Cordelia Schmid,"Improving bag-of-features for large scale image search.",International Journal of Computer Vision 87.3,2010,p.316-336.
しかし、非特許文献1の手法では、各局所特徴量の幾何的な情報が失われているため対応しない部分から抽出された局所特徴量を対応していると判定してしまい、類似画像抽出の精度が低下してしまう。例えば、上記図14に示したリファレンス画像の三角形から抽出された3つの局所特徴量は、クエリ画像1だけでなく、異なる図形であるクエリ画像2とも3点がマッチすると判定され、類似度が高いと判断されてしまう。
また、非特許文献2の手法では、回転方向を1軸しか考慮していないため、3次元方向の回転に対応することができない。例えば、図15に示すようにリファレンス画像を二次元平面内で回転したクエリ画像1は、リファレンス画像とマッチすると判定することができるが、三次元空間において上下方向や左右方向から見た画像であるクエリ画像2については、それらの軸に対する回転を局所特徴量に付随する情報として取得していないため、幾何的な一貫性を検証することができず、同一物体であっても類似度が高いと判定することができないという問題があった。そのため、三次元空間における幾何的な一貫性を検証可能にすることが課題となる。
本発明は、上記事情に鑑みて成されたものであり、クエリ画像と類似するリファレンス画像を精度よく取得することができる画像検索装置、方法、及びプログラムを提供することを目的とする。
上記目的を達成するために、本発明に係る画像検索装置は、複数のリファレンス画像から、クエリ画像と類似するリファレンス画像を検索する画像検索装置であって、前記複数のリファレンス画像の各々について、前記リファレンス画像に対して回転又は拡大率の変化を含む複数の変換を行って生成された複数の変換画像、及び前記リファレンス画像の各々から抽出された局所特徴量に対してクラスタリングを行って前記局所特徴量の各々が分類された複数のクラスタの各々に対して求められたセントロイドの特徴量を格納したセントロイド格納部と、前記複数のリファレンス画像の各々に対し、前記複数の変換画像、及び前記リファレンス画像の各々から抽出された局所特徴量の各々について、前記局所特徴量が属するクラスタのセントロイド、及び前記変換を表す幾何特徴を格納したインデクス格納部と、入力された前記クエリ画像に基づいて、前記クエリ画像に対して前記複数の変換を行って複数の変換画像を生成し、前記クエリ画像及び前記複数の変換画像の各々から、前記局所特徴量及び前記幾何特徴を抽出する局所特徴量抽出部と、前記局所特徴量抽出部によって抽出された前記クエリ画像の局所特徴量の各々について、前記セントロイド格納部に格納された前記複数のクラスタの各々に対するセントロイドの各々の特徴量と、前記クエリ画像の局所特徴量との類似度を算出し、前記クエリ画像の局所特徴量に対応する前記セントロイドを取得するセントロイド取得部と、前記局所特徴量抽出部によって抽出された前記クエリ画像の局所特徴量の各々について、前記セントロイド取得部によって取得された前記セントロイドに対応して前記インデクス格納部に格納された前記リファレンス画像に対する前記幾何特徴との比率又は差分を算出し、前記複数のリファレンス画像の各々について前記幾何特徴の比率又は差分の各々に対して設けられた投票箱のうち、前記算出された前記リファレンス画像に対する前記幾何特徴との比率又は差分に対して設けられた前記リファレンス画像についての投票箱に投票する投票部と、前記複数のリファレンス画像の各々に対し、前記リファレンス画像についての前記投票箱の投票結果に基づいて、前記クエリ画像と前記リファレンス画像との類似度を示すスコアを算出するスコア部と、前記スコア部によって算出された前記スコアに基づいて、前記クエリ画像と類似する前記リファレンス画像を出力する類似画像出力部と、を含んで構成されている。
本発明に係る画像検索方法は、局所特徴量抽出部、セントロイド取得部、投票部、スコア部、及び類似画像出力部を含み、複数のリファレンス画像の各々について、前記リファレンス画像に対して回転又は拡大率の変化を含む複数の変換を行って生成された複数の変換画像、及び前記リファレンス画像の各々から抽出された局所特徴量に対してクラスタリングを行って前記局所特徴量の各々が分類された複数のクラスタの各々に対して求められたセントロイドの特徴量を格納したセントロイド格納部、及び前記複数のリファレンス画像の各々に対し、前記複数の変換画像、及び前記リファレンス画像の各々から抽出された局所特徴量の各々について、前記局所特徴量が属するクラスタのセントロイド、及び前記変換を表す幾何特徴を格納したインデクス格納部を用いて、複数のリファレンス画像から、クエリ画像と類似するリファレンス画像を検索する画像検索装置における画像検索方法であって、前記局所特徴量抽出部が、入力された前記クエリ画像に基づいて、前記クエリ画像に対して前記複数の変換を行って複数の変換画像を生成し、前記クエリ画像及び前記複数の変換画像の各々から、前記局所特徴量及び前記幾何特徴を抽出するステップと、前記セントロイド取得部が、前記局所特徴量抽出部によって抽出された前記クエリ画像の局所特徴量の各々について、前記セントロイド格納部に格納された前記複数のクラスタの各々に対するセントロイドの各々の特徴量と、前記クエリ画像の局所特徴量との類似度を算出し、前記クエリ画像の局所特徴量に対応する前記セントロイドを取得するステップと、前記投票部が、前記局所特徴量抽出部によって抽出された前記クエリ画像の局所特徴量の各々について、前記セントロイド取得部によって取得された前記セントロイドに対応して前記インデクス格納部に格納された前記リファレンス画像に対する前記幾何特徴との比率又は差分を算出し、前記複数のリファレンス画像の各々について前記幾何特徴の比率又は差分の各々に対して設けられた投票箱のうち、前記算出された前記リファレンス画像に対する前記幾何特徴との比率又は差分に対して設けられた前記リファレンス画像についての投票箱に投票するステップと、前記スコア部が、前記複数のリファレンス画像の各々に対し、前記リファレンス画像についての前記投票箱の投票結果に基づいて、前記クエリ画像と前記リファレンス画像との類似度を示すスコアを算出するステップと、前記類似画像出力部が、前記スコア部によって算出された前記スコアに基づいて、前記クエリ画像と類似する前記リファレンス画像を出力するステップと、を含んで構成されている。
本発明の前記局所特徴量抽出部は、画像の拡大率及び画像の三軸の各々の回転角を、前記幾何特徴として抽出するようにすることができる。
本発明の前記スコア部は、前記複数のリファレンス画像の各々に対し、前記リファレンス画像についての前記投票箱の各々の投票数のうち、最大の投票数を、前記リファレンス画像との類似度を示す前記スコアとして算出するようにすることができる。
本発明の前記投票部は、前記局所特徴量抽出部によって抽出された前記クエリ画像の局所特徴量の各々について、前記セントロイド取得部によって取得された前記セントロイドに対応して前記インデクス格納部に格納された前記リファレンス画像に対する前記幾何特徴との比率又は差分を算出し、前記複数のリファレンス画像の各々について前記幾何特徴の比率又は差分の各々に対して設けられた投票箱のうち、前記算出された前記リファレンス画像に対する前記幾何特徴との比率又は差分に対して設けられた前記リファレンス画像についての投票箱に、前記セントロイド取得部によって取得された前記セントロイドに対応する、前記クエリ画像または前記リファレンス画像の局所特徴量の数に応じた票数、前記セントロイド取得部によって取得された前記セントロイドに対応する局所特徴量を有する前記リファレンス画像の数に応じた票数、又は前記リファレンス画像から抽出された局所特徴量の数に応じた票数を投票するようにすることができる。
本発明のプログラムは、コンピュータを、本発明の画像検索装置の各部として機能させるためのプログラムである。
本発明の画像検索装置、方法、及びプログラムによれば、複数のリファレンス画像の各々について、当該リファレンス画像に対して回転及び拡大率の変化を含む複数の変換を行って生成された複数の変換画像、及びリファレンス画像の各々から抽出された局所特徴量に対してクラスタリングを行って局所特徴量の各々が分類された複数のクラスタの各々に対して求められたセントロイドの特徴量を格納し、抽出された局所特徴量の各々について、局所特徴量が属するクラスタのセントロイド、及び幾何特徴を格納し、クエリ画像に対して複数の変換を行って複数の変換画像を生成し、クエリ画像及び複数の変換画像の各々から、局所特徴量及び幾何特徴を抽出し、抽出されたクエリ画像の局所特徴量の各々について、複数のクラスタの各々に対するセントロイドの各々の特徴量と、クエリ画像の局所特徴量との類似度を算出し、クエリ画像の局所特徴量に対応するセントロイドを取得し、抽出されたクエリ画像の局所特徴量の各々について、取得されたセントロイドに対応して格納されたリファレンス画像に対する幾何特徴との比率又は差分を算出し、複数のリファレンス画像の各々について幾何特徴の比率又は差分の各々に対して設けられた投票箱のうち、算出されたリファレンス画像に対する幾何特徴との比率又は差分に対して設けられたリファレンス画像についての投票箱に投票し、リファレンス画像についての投票箱の投票結果に基づいて、クエリ画像とリファレンス画像との類似度を示すスコアを算出し、算出されたスコアに基づいて、クエリ画像と類似するリファレンス画像を出力することで、クエリ画像と類似するリファレンス画像を精度よく取得することができる、という効果が得られる。
以下、図面を参照して本発明の実施の形態を詳細に説明する。以下では、まず本発明の実施の形態の概要について説明する。
<本発明の実施の形態の概要>
本発明の実施の形態では、まず画像から局所特徴量を抽出する。次に、図1に示すように、画像を上下方向、左右方向、及び二次元平面内で回転させると共に、拡大率を変化させた複数の変換画像を作成し、変換画像からも局所特徴量を抽出しておく。これにより、例えば、上記図15におけるクエリ画像2から抽出した局所特徴量は、上記図1におけるリファレンス画像5から抽出した局所特徴量と多くマッチし、クエリ画像2とリファレンス画像との類似度が高いと判定することができる。
本発明の実施の形態では、まず画像から局所特徴量を抽出する。次に、図1に示すように、画像を上下方向、左右方向、及び二次元平面内で回転させると共に、拡大率を変化させた複数の変換画像を作成し、変換画像からも局所特徴量を抽出しておく。これにより、例えば、上記図15におけるクエリ画像2から抽出した局所特徴量は、上記図1におけるリファレンス画像5から抽出した局所特徴量と多くマッチし、クエリ画像2とリファレンス画像との類似度が高いと判定することができる。
具体的には、本発明の実施の形態では、まず、事前処理として、予め登録する各リファレンス画像について、局所特徴量及び当該局所特徴量の幾何特徴を抽出しておく。また、抽出した局所特徴量をクラスタリングしておく。そして、クエリ画像が入力されたとき、クエリ画像からも局所特徴量及び当該局所特徴量の幾何特徴を抽出し、各局所特徴量に対応するクラスタに属するリファレンス画像の局所特徴量について、幾何特徴の比率又は差分の一貫性を検証する。クエリ画像の局所特徴量に対して、幾何特徴の比率又は差分の一貫性の高い局所特徴量を持つリファレンス画像を、クエリ画像との類似度が高いとして出力する。
[第1の実施の形態]
<画像検索装置100の構成>
第1の実施の形態に係る画像検索装置100の構成について説明する。第1の実施の形態では、複数のリファレンス画像から、クエリ画像と類似するリファレンス画像を検索する画像検索装置に本発明を適用させた場合について説明する。図2に示すように、本発明に係る画像検索装置100は、CPUと、RAMと、後述する学習処理ルーチン及び画像検索処理ルーチンを実行するためのプログラムや各種データを記憶したROMと、を含むコンピュータで構成することが出来る。この画像検索装置100は、機能的には図2に示すように、入力部1と、演算部2と、出力部3とを備えている。
<画像検索装置100の構成>
第1の実施の形態に係る画像検索装置100の構成について説明する。第1の実施の形態では、複数のリファレンス画像から、クエリ画像と類似するリファレンス画像を検索する画像検索装置に本発明を適用させた場合について説明する。図2に示すように、本発明に係る画像検索装置100は、CPUと、RAMと、後述する学習処理ルーチン及び画像検索処理ルーチンを実行するためのプログラムや各種データを記憶したROMと、を含むコンピュータで構成することが出来る。この画像検索装置100は、機能的には図2に示すように、入力部1と、演算部2と、出力部3とを備えている。
入力部1は、複数のリファレンス画像を含むリファレンス画像集合と、クエリ画像との入力を受け付ける。
演算部2は、局所特徴量抽出部20と、クラスタリング部22と、セントロイド格納部24と、インデクス格納部26と、セントロイド取得部28と、投票部30と、スコア部32と、類似画像出力部34とを備えている。
局所特徴量抽出部20は、入力部1により入力された複数のリファレンス画像の各々について、当該リファレンス画像に対して回転又は拡大率の変化を含む複数の変換を行って、複数の変換画像を生成する。そして、局所特徴量抽出部20は、生成された複数の変換画像、及びリファレンス画像の各々から、局所特徴量及び幾何特徴を抽出する。
また、局所特徴量抽出部20は、入力部1により入力されたクエリ画像に基づいて、リファレンス画像と同様に、クエリ画像に対して回転又は拡大率の変化を含む複数の変換を行って、複数の変換画像を生成する。そして、局所特徴量抽出部20は、クエリ画像及び複数の変換画像の各々から、局所特徴量及び幾何特徴を抽出する。本発明の実施の形態では、画像の拡大率及び三軸の画像の回転角を、幾何特徴として抽出する。
具体的には、局所特徴量抽出部20は、リファレンス画像集合が入力された際、まず複数のリファレンス画像の各々から局所特徴量を抽出する。局所特徴量としては、例えば、回転パラメータ及びスケールパラメータを用いない場合のSIFT(Scale Invariant Feature Transform)を用いることができる。局所特徴量は、リファレンス画像だけでなく、リファレンス画像を上下方向、左右方向および二次元平面内で回転させ、拡大率を変化させた変換画像からも抽出する。なお、局所特徴量は、ベクトル形式で表現される。リファレンス画像を回転させた変換画像は、例えば、リファレンス画像のアフィン変換により生成することができる。
アフィン変換によって、変換前の画像における点(x,y)は、変換後の画像において以下の式(1)に示す点(x’,y’)に対応する。図3に、リファレンス画像をアフィン変換によって回転させる処理の一例を示す概念図を示す。
ただし、sはクエリ画像及びリファレンス画像の拡大率、θ、φ、ψは上記図3に示した3軸の回転角度である。拡大率s、及び回転角度θ、φ、ψは幾何特徴の一例である。
また、局所特徴量抽出部20は、クエリ画像が入力された際、リファレンス画像集合が入力された際と同様に、クエリ画像から局所特徴量及び対応する幾何特徴を抽出する。
なお、利用する局所特徴量が回転角を表すパラメータが算出される局所特徴量であった場合、ψを変化させたリファレンス画像を作成せず、ψの値として局所特徴量の回転角を表すパラメータを使用してもよい。また、利用する局所特徴量が拡大率(スケール)を表すパラメータが算出される局所特徴量であった場合、sを変化させたリファレンス画像を作成せず、sの値として局所特徴量の拡大率を表すパラメータを使用してもよい。
クラスタリング部22は、入力部1により入力された複数のリファレンス画像の各々について生成された複数の変換画像、及びリファレンス画像の各々から抽出された局所特徴量に対してクラスタリングを行い、局所特徴量の各々を複数のクラスタに分類する。クラスタリングの際のクラスタ数は、任意の値に予め設定してよい。また、クラスタリング部22は、複数のクラスタの各々について、当該クラスタのセントロイドを求める。セントロイドとは、例えば、クラスタに属する局所特徴量の重心を求めた特徴量である。そして、クラスタリング部22は、複数のクラスタの各々について求めたセントロイドの特徴量を、クラスタリング結果として、後述するセントロイド格納部24に格納する。
また、クラスタリング部22は、入力部1により入力された複数のリファレンス画像の各々に対し、複数の変換画像、及び当該リファレンス画像の各々から抽出された局所特徴量の各々について、当該局所特徴量が属するクラスタのセントロイド、及び当該局所特徴量に対応する幾何特徴を、後述するインデクス格納部26に格納する。
セントロイド格納部24には、クラスタリング部22によって求められた複数のクラスタの各々についてのセントロイドの特徴量が格納される。セントロイド格納部24に格納されるクラスタリング結果の一例を図4に示す。図4に示すクラスタリング結果は、セントロイドIDと特徴量との組み合わせを示すデータである。
なお、セントロイドIDはクラスタのセントロイドを識別するIDである。上記図4に示したセントロイド格納部24に格納されるクラスタリング結果は一例であり、格納される属性や名称が異なっていてもよい。また、テキストファイル形式など、テーブル以外の形式で保存されていてもよい。
インデクス格納部26には、複数のリファレンス画像の各々に対し、当該リファレンス画像から抽出された局所特徴量が属するクラスタのセントロイド、及び当該局所特徴量に対応する幾何特徴が格納される。インデクス格納部26に格納されるデータの一例を図5に示す。上記図5に示すデータは、リファレンス画像の画像IDと局所特徴量IDとセントロイドIDと幾何特徴の各々との組み合わせを示すデータである。画像ID及び局所特徴量IDは、リファレンス画像及び局所特徴量を識別するIDである。また、上記図5に示したインデクス格納部26に格納されるデータは一例であり、格納される属性や名称が異なっていてもよい。また、テキストファイル形式など、テーブル以外の形式で保存されていてもよい。
セントロイド取得部28は、局所特徴量抽出部20によって抽出されたクエリ画像の局所特徴量の各々について、セントロイド格納部24に格納された複数のクラスタの各々に対するセントロイドの各々の特徴量と、当該クエリ画像の局所特徴量との類似度を算出し、当該クエリ画像の局所特徴量に対応するセントロイドを取得する。
具体的には、セントロイド取得部28は、局所特徴量抽出部20によって抽出されたクエリ画像の局所特徴量の各々を、セントロイド格納部24に格納された各セントロイドの特徴量と比較し、当該局所特徴量と最も類似度の高いセントロイドを選択し、当該局所特徴量を当該セントロイドに対応するセントロイドIDに割り当てる。局所特徴量をセントロイドに割り当てるための類似度としては、例えば、局所特徴量とセントロイドの特徴量との距離を用いればよい。
投票部30は、局所特徴量抽出部20によって抽出されたクエリ画像の局所特徴量の各々について、セントロイド取得部28によって取得されたセントロイドに対応してインデクス格納部26に格納されたリファレンス画像に対する幾何特徴との比率又は差分を算出する。なお、本発明の実施の形態では、幾何特徴のうち拡大率については比率を算出し、回転角度については差分を算出する。
そして、投票部30は、複数のリファレンス画像の各々について幾何特徴の比率又は差分の各々に対して設けられた投票箱のうち、算出されたリファレンス画像に対する幾何特徴との比率又は差分に対して設けられたリファレンス画像についての投票箱に投票する。
具体的には、投票部30は、投票に際し、まずは投票対象となる投票箱を予め準備する。投票箱は、各リファレンス画像の画像IDに対し、拡大率の比率、θの差分、φの差分、ψの差分の4次元空間を格子状に区切ることによって作成する。例えば、図6に示すように拡大率を8段階、θを6段階、φを6段階、ψを6段階に分けると、8×6×6×6=1728個の投票箱を、各リファレンス画像に対して作成する。
投票は、同一のセントロイドIDに対応する、リファレンス画像とクエリ画像との局所特徴量の各組み合わせについて行う。例えば、図7に示すようにID1及びID2のリファレンス画像からR1,R2,R3,R4、クエリ画像からQ1とQ2との局所特徴量が抽出されたとすると、投票の対象はR1とQ1、R3とQ1、R2とQ2、R4とQ2の組み合わせとなる。投票の結果の一例を図8に示す。
図8に示すように、画像ID1についての投票箱Aには、R1とQ1及びR2とQ2の組み合わせより2票が投票される。また、画像ID2についての投票箱BにはR3とQ1との組み合わせより1票、投票箱CにはR4とQ2との組み合わせより1票が投票され、その他の投票箱に投票された票数は0である。画像ID1についての投票箱の中で最も多く投票された投票箱の票数は2、画像ID2についての投票箱の中で最も多く投票された投票箱の票数は1であり、これが各画像IDのスコアとなる。クエリ画像はリファレンス画像ID1ともID2とも、セントロイドIDが共通する局所特徴量を2つ有しているが、以上のようにして、リファレンス画像ID1の方がID2に比べてクエリ画像との類似度が高いと判定することができる。
また、1回あたりの投票の投票数を、クエリ画像又はリファレンス画像における、同一セントロイドに対応する局所特徴量の数によって重みづけしてもよい。例えば、クエリ画像の局所特徴量に対応するセントロイドについて、当該セントロイドに対応する局所特徴量が、クエリ画像にnq個、リファレンス画像にnr個あった場合、当該セントロイドについての投票における投票数wvを以下の式(2)の値とすることができる。
上記式(2)に示した投票数を用いることにより、例えば、ビルの画像における窓のように同じセントロイドに対応する局所特徴量が大量に含まれる場合に、画像の類似度が窓の個数だけで決定されてしまうのを避け、窓以外の局所特徴量も考慮して類似する画像を取得することが可能になる。
また、クエリ画像の局所特徴量に対応するセントロイドについて、当該セントロイドに対応する局所特徴量が、クエリ画像にnq個あった場合、当該セントロイドについての投票における投票数wvを以下の式(3)の値とすることができる。
また、クエリ画像の局所特徴量に対応するセントロイドについて、当該セントロイドに対応する局所特徴量が、リファレンス画像にnr個あった場合、当該セントロイドについての投票における投票数wvを以下の式(4)の値とすることができる。
また、1回あたりの投票の投票数を、リファレンス画像集合において各セントロイドに対応する局所特徴量が何枚のリファレンス画像に含まれていたかによって重みづけしてもよい。例えば、全画像数がNであり、クエリ画像の局所特徴量に対応するセントロイドについて、当該セントロイドに対応する局所特徴量がnf枚のリファレンス画像から抽出されていた場合、当該セントロイドについての投票における投票数wvを以下の式(5)の値とすることができる。
上記式(5)に示した投票数を用いることにより、多くの画像に含まれるセントロイドに関する投票で類似度が決まってしまうのを避け、珍しいセントロイドが対応したときにはより類似していると判定されやすくすることが可能になる。
また、1回あたりの投票の投票数を、リファレンス画像における局所特徴量の数によって重みづけしてもよい。例えば、あるリファレンス画像から抽出された局所特徴量の数がNr個であった場合、当該リファレンス画像についての投票箱に対する投票における投票数wvを以下の式の値とすることができる。
上記式(6)に示した票数を用いることにより、リファレンス画像から大量の局所特徴量が抽出された場合に類似度が高くなりやすく、一方で少量の局所特徴量が抽出された場合には類似度が低くなりやすくなるのを避け、クエリ画像とリファレンス画像とにおいて局所特徴量のセントロイドIDが共通する割合を考慮して類似度を算出することが可能になる。
上記式(2)、式(5)及び式(6)の重みづけはそれぞれ同時に用いることができ、3つの重みづけを同時に用いた場合、投票における投票数wvは以下の式(7)の値となる。
スコア部32は、複数のリファレンス画像の各々に対し、当該リファレンス画像についての投票箱の投票結果に基づいて、クエリ画像とリファレンス画像との類似度を示すスコアを算出する。具体的には、スコア部32は、リファレンス画像の画像IDに対応する複数の投票箱の投票結果を集約することにより、リファレンス画像のスコアを算出する。
例えば、スコア部32は、複数のリファレンス画像の各々に対し、当該リファレンス画像についての投票箱の各々の投票数のうち、最大の投票数を当該リファレンス画像のスコアとして算出する。
類似画像出力部34は、スコア部32によって算出されたスコアに基づいて、クエリ画像と類似するリファレンス画像を出力する。具体的には、類似画像出力部34は、算出したリファレンス画像のスコアを高い順にソートし、スコアの高いリファレンス画像の画像IDを出力する。
出力部3は、類似画像出力部34によって出力されたリファレンス画像の画像IDをリストとして出力する。
<画像検索装置100の作用>
次に、第1の実施の形態に係る画像検索装置100の作用について、まず、リファレンス画像を登録する学習処理ルーチンについて説明する。入力部1において複数のリファレンス画像を含むリファレンス画像集合の入力を受け付けると、画像検索装置100は、図9に示す学習処理ルーチンを実行する。
次に、第1の実施の形態に係る画像検索装置100の作用について、まず、リファレンス画像を登録する学習処理ルーチンについて説明する。入力部1において複数のリファレンス画像を含むリファレンス画像集合の入力を受け付けると、画像検索装置100は、図9に示す学習処理ルーチンを実行する。
まず、ステップS100では、入力部1において受け付けたリファレンス画像集合を取得する。
次に、ステップS102では、上記ステップS100で取得したリファレンス画像集合から、1つのリファレンス画像を設定する。
次に、ステップS104において、局所特徴量抽出部20によって、上記ステップS102で設定したリファレンス画像に対して、回転又は拡大率の変化を含む複数の変換を行って、複数の変換画像を生成する。
ステップS106において、局所特徴量抽出部20によって、上記ステップS104で生成された複数の変換画像、及び上記ステップS102で設定されたリファレンス画像の各々から局所特徴量及び幾何特徴を抽出する。
ステップS108において、上記ステップS100で取得したリファレンス画像集合に含まれる全てのリファレンス画像について上記ステップS102〜上記ステップS106の処理が終了したかを判定し、終了していなければステップS102へ戻って処理を繰り返し、終了していればステップS110へ移行する。
ステップS110において、クラスタリング部22によって、上記ステップS106で抽出された局所特徴量に対してクラスタリングを行い、局所特徴量の各々を複数のクラスタに分類する。
ステップS112において、クラスタリング部22によって、上記ステップS110で求められた複数のクラスタの各々について、当該クラスタのセントロイドを求める。そして、クラスタリング部22によって、複数のクラスタの各々について求めたセントロイドの特徴量を、セントロイド格納部24に格納する。
ステップS114において、クラスタリング部22によって、上記ステップS106で抽出された複数の局所特徴量のうち、1つの局所特徴量を設定する。
ステップS116において、クラスタリング部22によって、上記ステップS114で設定された局所特徴量について、当該局所特徴量に対応するリファレンス画像の画像ID、当該局所特徴量が属するクラスタのセントロイドID、及び当該局所特徴量に対応する幾何特徴(拡大率s、及び回転角度θ、φ、ψ)を、インデクス格納部26に格納する。
ステップS118において、上記ステップS106で抽出された全ての局所特徴量について上記ステップS114〜上記ステップS116の処理が終了したかを判定し、終了していなければステップS114へ戻って処理を繰り返し、終了していれば、処理を終了する。学習処理ルーチンの終了により、リファレンス画像の登録は完了となる。
次に、クエリ画像を入力し、クエリ画像と類似するリファレンス画像を取得する画像検索処理ルーチンについて説明する。入力部1においてクエリ画像の入力を受け付けると、画像検索装置100は、図10及び図11に示す画像検索処理ルーチンを実行する。
まず、ステップS200では、入力部1において入力を受け付けたクエリ画像を取得する。
次に、ステップS202では、局所特徴量抽出部20によって、上記ステップS200で取得したクエリ画像に対し、回転又は拡大率の変化を含む複数の変換を行って、複数の変換画像を生成する。
ステップS204では、局所特徴量抽出部20によって、上記ステップS200で取得したクエリ画像及び上記ステップS202で生成された複数の変換画像の各々から、局所特徴量及び幾何特徴を抽出する。
ステップS206では、上記ステップS204で抽出された局所特徴量の各々のうち、1つの局所特徴量を設定する。
ステップS208では、セントロイド取得部28によって、上記ステップS206で設定されたクエリ画像の局所特徴量について、セントロイド格納部24に格納された複数のクラスタの各々に対するセントロイドの各々と、上記ステップS206で設定されたクエリ画像の局所特徴量との類似度を算出し、上記ステップS206で設定されたクエリ画像の局所特徴量に対応するセントロイドを取得する。そして、セントロイド取得部28は、上記ステップS206で設定されたクエリ画像の局所特徴量に対して、取得されたセントロイドに対応するセントロイドIDを割り当てる。
ステップS210では、投票部30によって、上記ステップS208で割り当てられたセントロイドIDに対応してインデクス格納部26に格納されたリファレンス画像の1つの局所特徴量を設定する。
そして、ステップS212では、投票部30によって、上記ステップS210で設定された局所特徴量の局所特徴量IDに対応する、インデクス格納部26に格納された画像IDと幾何特徴とを取得する。
ステップS214では、投票部30によって、上記ステップS210で設定された局所特徴量に対応する幾何特徴と、上記ステップS212で取得された画像IDに対応するリファレンス画像の幾何特徴との比率又は差分を算出する。そして、投票部30によって、上記ステップS212で取得された画像IDに対応するリファレンス画像について幾何特徴の比率又は差分の各々に対して設けられた投票箱のうち、算出された比率又は差分に対して設けられたリファレンス画像についての投票箱に投票する。
ステップS216では、上記ステップS208で割り当てられたセントロイドIDに対応する全ての局所特徴量について上記ステップS212〜上記ステップS214の処理が終了したか否かを判定し、終了していなければステップS210へ戻って処理を繰り返し、終了していれば、ステップS218へ移行する。
ステップS218では、上記ステップS204で抽出されたクエリ画像の全ての局所特徴量について上記ステップS206〜上記ステップS216の処理が終了したか否かを判定し、終了していなければステップS206へ戻って処理を繰り返し、終了していれば、ステップS220へ移行する。
ステップS220では、リファレンス画像集合から、1つのリファレンス画像を設定する。
ステップS222では、スコア部32によって、上記ステップS220で設定されたリファレンス画像についての投票箱の各々の投票数のうち、最大の投票数を当該リファレンス画像のスコアとして算出する。
ステップS224では、リファレンス画像集合に含まれる全てのリファレンス画像について、上記ステップS220〜ステップS222の処理が終了したか否かを判定し、終了していなければステップS220へ戻って処理を繰り返し、終了していれば、ステップS226へ移行する。
ステップS226では、類似画像出力部34によって、上記ステップS222で算出したリファレンス画像のスコアを高い順にソートし、スコアの高いリファレンス画像の画像IDを出力する。
ステップS228では、類似画像出力部34によって出力されたリファレンス画像IDをリストとして出力部3により出力し、処理を終了する。
以上説明したように、第1の実施の形態に係る画像検索装置100によれば、複数のリファレンス画像の各々について、当該リファレンス画像に対して回転又は拡大率の変化を含む複数の変換を行って生成された複数の変換画像、及びリファレンス画像の各々から抽出された局所特徴量に対してクラスタリングを行って局所特徴量の各々が分類された複数のクラスタの各々に対して求められたセントロイドの特徴量を格納し、抽出された局所特徴量の各々について、局所特徴量が属するクラスタのセントロイド、及び幾何特徴を格納し、クエリ画像に対して複数の変換を行って複数の変換画像を生成し、クエリ画像及び複数の変換画像の各々から、局所特徴量及び幾何特徴を抽出し、抽出されたクエリ画像の局所特徴量の各々について、複数のクラスタの各々に対するセントロイドの各々の特徴量と、クエリ画像の局所特徴量との類似度を算出し、クエリ画像の局所特徴量に対応するセントロイドを取得し、抽出されたクエリ画像の局所特徴量の各々について、取得されたセントロイドに対応して格納されたリファレンス画像に対する幾何特徴との比率又は差分を算出し、複数のリファレンス画像の各々について幾何特徴の比率又は差分の各々に対して設けられた投票箱のうち、算出されたリファレンス画像に対する幾何特徴との比率又は差分に対して設けられたリファレンス画像についての投票箱に投票し、リファレンス画像についての投票箱の投票結果に基づいて、クエリ画像とリファレンス画像との類似度を示すスコアを算出し、算出されたスコアに基づいて、クエリ画像と類似するリファレンス画像を出力することで、クエリ画像と類似するリファレンス画像を精度よく取得することができる。
また、クエリ画像について、同一の被写体が写っている画像をあらかじめ登録しておいたリファレンス画像中から高速かつ高精度に取得することができる。
また、画像の各局所特徴量について、局所特徴量の類似度及び幾何特徴の比率又は差分に基づいて、対応する投票箱に投票し、リファレンス画像の画像IDに対応する複数の投票箱に投票された結果を集約し、より多くの投票がなされたリファレンス画像を類似度が高いと判定することにより、同一物体で視点方向や拡大率の異なる画像を類似度が高いと判定することが可能になる。
また、幾何特徴として局所特徴量の拡大率及び三次元空間での各回転角を抽出することにより、二次元平面内だけでなく、上下方向や左右方向に視点が変化した場合にも、画像間の類似度が高いと判定することが可能になる。
また、リファレンス画像1枚につき、拡大率の比率および3軸の各回転角の差分の4次元空間を格子状に区切った各領域の投票箱を作成し、各リファレンス画像に対応する投票箱の投票結果で最大の値をリファレンス画像のスコアとすることにより、三次元空間において、どの視点から見ている可能性が最も高いかを判別し、その方向から見た場合の局所特徴量との幾何的な一貫性を検証することが可能になる。
また、クエリ画像又はリファレンス画像において同一セントロイドに対応する局所特徴量数、リファレンス画像集合において各セントロイドが何枚の画像に含まれていたか、及びリファレンス画像における局所特徴量の総数の少なくとも1つ以上を用いて投票の投票数を重みづけすることにより、ある画像に同じセントロイドに対応する局所特徴量が大量に含まれる場合に類似度が当該セントロイドに対応する局所特徴量だけで決定されてしまうのを避ける、または、多くの画像に含まれるセントロイドに関する投票で類似度が決まってしまうのを避ける、または、リファレンス画像から大量の局所特徴量が抽出された場合に類似度が高く、少量の局所特徴量が抽出された場合には類似度が低くなりやすくなるのを避けることが可能になる。
[第2の実施の形態]
次に、第2の実施の形態について説明する。第2の実施の形態では、リファレンス画像の各々から抽出された局所特徴量に対してクラスタリングを行う処理と、クエリ画像とリファレンス画像との類似度を示すスコアを算出し、算出されたスコアに基づいて、クエリ画像と類似するリファレンス画像を出力する処理とを別々の装置で行う点が、第1の実施の形態と異なっている。
次に、第2の実施の形態について説明する。第2の実施の形態では、リファレンス画像の各々から抽出された局所特徴量に対してクラスタリングを行う処理と、クエリ画像とリファレンス画像との類似度を示すスコアを算出し、算出されたスコアに基づいて、クエリ画像と類似するリファレンス画像を出力する処理とを別々の装置で行う点が、第1の実施の形態と異なっている。
第2の実施の形態では、クラスタリング装置200が学習処理ルーチンを実行し、画像検索装置210が画像検索処理ルーチンを実行する。なお、第1の実施の形態に係る画像検索装置100と同一の構成となる部分については、同一符号を付して、詳細な説明を省略する。
<クラスタリング装置200の構成>
図12に示すように、第2の実施の形態に係るクラスタリング装置200は、入力部4と、演算部5とを備えている。
図12に示すように、第2の実施の形態に係るクラスタリング装置200は、入力部4と、演算部5とを備えている。
入力部4は、複数のリファレンス画像を含むリファレンス画像集合を受け付ける。
演算部5は、局所特徴量抽出部50と、クラスタリング部22と、セントロイド格納部24と、インデクス格納部26とを備えている。
局所特徴量抽出部50は、局所特徴量抽出部20と同様に、入力部1により入力された複数のリファレンス画像の各々について、当該リファレンス画像に対して回転又は拡大率の変化を含む複数の変換を行って、複数の変換画像を生成する。そして、局所特徴量抽出部20は、生成された複数の変換画像、及びリファレンス画像の各々から、局所特徴量及び幾何特徴を抽出する。
<画像検索装置210の構成>
図13に示すように、第2の実施の形態に係る画像検索装置210は、入力部6と、演算部7と、出力部3とを備えている。
図13に示すように、第2の実施の形態に係る画像検索装置210は、入力部6と、演算部7と、出力部3とを備えている。
入力部6は、クエリ画像の入力を受け付ける。
演算部7は、局所特徴量抽出部70と、セントロイド格納部74と、インデクス格納部76と、セントロイド取得部28と、投票部30と、スコア部32と、類似画像出力部34とを備えている。
局所特徴量抽出部70は、局所特徴量抽出部20と同様に、入力部1により入力されたクエリ画像に基づいて、クエリ画像に対して回転又は拡大率の変化を含む複数の変換を行って、複数の変換画像を生成する。そして、局所特徴量抽出部70は、クエリ画像及び複数の変換画像の各々から、局所特徴量及び幾何特徴を抽出する。
セントロイド格納部74には、クラスタリング装置200のクラスタリング部22によって求められた複数のクラスタの各々についてのセントロイドの特徴量が格納される。
インデクス格納部76には、複数のリファレンス画像の各々に対し、クラスタリング装置200のクラスタリング部22によって求められた局所特徴量が属するクラスタのセントロイド、及び当該局所特徴量に対応する幾何特徴が格納される。
次に、第2の実施の形態に係るクラスタリング装置200及び画像検索装置210の作用について説明する。
<クラスタリング装置200の作用>
まず、クラスタリング装置200の作用について説明する。入力部1において複数のリファレンス画像を含むリファレンス画像集合の入力を受け付けると、クラスタリング装置200は、上記図9に示す学習処理ルーチンを実行し、セントロイド格納部24には、複数のクラスタの各々についてのセントロイドの特徴量が格納され、インデクス格納部26には、複数のリファレンス画像の各々に対しての局所特徴量が属するクラスタのセントロイド、及び当該局所特徴量に対応する幾何特徴が格納される。
まず、クラスタリング装置200の作用について説明する。入力部1において複数のリファレンス画像を含むリファレンス画像集合の入力を受け付けると、クラスタリング装置200は、上記図9に示す学習処理ルーチンを実行し、セントロイド格納部24には、複数のクラスタの各々についてのセントロイドの特徴量が格納され、インデクス格納部26には、複数のリファレンス画像の各々に対しての局所特徴量が属するクラスタのセントロイド、及び当該局所特徴量に対応する幾何特徴が格納される。
<画像検索装置210の作用>
次に、画像検索装置210の作用について説明する。まず、クラスタリング装置200のセントロイド格納部24に格納されている複数のクラスタの各々についてのセントロイドの特徴量が、画像検索装置210に入力されると、セントロイド格納部74に格納される。また、クラスタリング装置200のインデクス格納部26に格納されている複数のリファレンス画像の各々に対しての局所特徴量が属するクラスタのセントロイド、及び当該局所特徴量に対応する幾何特徴が入力されると、インデクス格納部76に格納される。そして、入力部6においてクエリ画像の入力を受け付けると、画像検索装置210によって、図10及び図11に示す画像検索処理ルーチンが実行され、クエリ画像と類似するリファレンス画像の画像IDが出力される。
次に、画像検索装置210の作用について説明する。まず、クラスタリング装置200のセントロイド格納部24に格納されている複数のクラスタの各々についてのセントロイドの特徴量が、画像検索装置210に入力されると、セントロイド格納部74に格納される。また、クラスタリング装置200のインデクス格納部26に格納されている複数のリファレンス画像の各々に対しての局所特徴量が属するクラスタのセントロイド、及び当該局所特徴量に対応する幾何特徴が入力されると、インデクス格納部76に格納される。そして、入力部6においてクエリ画像の入力を受け付けると、画像検索装置210によって、図10及び図11に示す画像検索処理ルーチンが実行され、クエリ画像と類似するリファレンス画像の画像IDが出力される。
なお、第2の実施の形態に係るクラスタリング装置200及び画像検索装置210の他の構成及び作用については、第1の実施の形態と同様であるため、説明を省略する。
以上説明したように、第2の実施の形態に係るクラスタリング装置200及び画像検索装置210によれば、クエリ画像と類似するリファレンス画像を精度よく取得することができる。
なお、本発明は、上述した実施形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。
例えば、上記第1の実施の形態に係る画像検索装置100及び第2の実施の形態に係るクラスタリング装置200は、セントロイド格納部24、及びインデクス格納部26を備えている場合について説明したが、例えばセントロイド格納部24、及びインデクス格納部26の少なくとも1つが画像検索装置100の外部装置に設けられ、画像検索装置100は、外部装置と通信手段を用いて通信することにより、セントロイド格納部24、及びインデクス格納部26の少なくとも1つを参照するようにしてもよい。
また、上記第2の実施の形態に係る画像検索装置210は、セントロイド格納部74、及びインデクス格納部76を備えている場合について説明したが、例えばセントロイド格納部74、及びインデクス格納部76の少なくとも1つが画像検索装置210の外部装置に設けられ、画像検索装置210は、外部装置と通信手段を用いて通信することにより、セントロイド格納部74、及びインデクス格納部76の少なくとも1つを参照するようにしてもよい。
また、上述の画像検索装置100、クラスタリング装置200、及び画像検索装置210は、内部にコンピュータシステムを有しているが、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、本願明細書中において、プログラムが予めインストールされている実施形態として説明したが、当該プログラムを、コンピュータ読み取り可能な記録媒体に格納して提供することも可能である。
1,4,6 入力部
2,5,7 演算部
3 出力部
20,50,70 局所特徴量抽出部
22 クラスタリング部
24,74 セントロイド格納部
26,76 インデクス格納部
28 セントロイド取得部
32 スコア部
30 投票部
34 類似画像出力部
100 画像検索装置
200 クラスタリング装置
210 画像検索装置
2,5,7 演算部
3 出力部
20,50,70 局所特徴量抽出部
22 クラスタリング部
24,74 セントロイド格納部
26,76 インデクス格納部
28 セントロイド取得部
32 スコア部
30 投票部
34 類似画像出力部
100 画像検索装置
200 クラスタリング装置
210 画像検索装置
Claims (9)
- 複数のリファレンス画像から、クエリ画像と類似するリファレンス画像を検索する画像検索装置であって、
前記複数のリファレンス画像の各々について、前記リファレンス画像に対して回転又は拡大率の変化を含む複数の変換を行って生成された複数の変換画像、及び前記リファレンス画像の各々から抽出された局所特徴量に対してクラスタリングを行って前記局所特徴量の各々が分類された複数のクラスタの各々に対して求められたセントロイドの特徴量を格納したセントロイド格納部と、
前記複数のリファレンス画像の各々に対し、前記複数の変換画像、及び前記リファレンス画像の各々から抽出された局所特徴量の各々について、前記局所特徴量が属するクラスタのセントロイド、及び前記変換を表す幾何特徴を格納したインデクス格納部と、
入力された前記クエリ画像に基づいて、前記クエリ画像に対して前記複数の変換を行って複数の変換画像を生成し、前記クエリ画像及び前記複数の変換画像の各々から、前記局所特徴量及び前記幾何特徴を抽出する局所特徴量抽出部と、
前記局所特徴量抽出部によって抽出された前記クエリ画像の局所特徴量の各々について、前記セントロイド格納部に格納された前記複数のクラスタの各々に対するセントロイドの各々の特徴量と、前記クエリ画像の局所特徴量との類似度を算出し、前記クエリ画像の局所特徴量に対応する前記セントロイドを取得するセントロイド取得部と、
前記局所特徴量抽出部によって抽出された前記クエリ画像の局所特徴量の各々について、前記セントロイド取得部によって取得された前記セントロイドに対応して前記インデクス格納部に格納された前記リファレンス画像に対する前記幾何特徴との比率又は差分を算出し、前記複数のリファレンス画像の各々について前記幾何特徴の比率又は差分の各々に対して設けられた投票箱のうち、前記算出された前記リファレンス画像に対する前記幾何特徴との比率又は差分に対して設けられた前記リファレンス画像についての投票箱に投票する投票部と、
前記複数のリファレンス画像の各々に対し、前記リファレンス画像についての前記投票箱の投票結果に基づいて、前記クエリ画像と前記リファレンス画像との類似度を示すスコアを算出するスコア部と、
前記スコア部によって算出された前記スコアに基づいて、前記クエリ画像と類似する前記リファレンス画像を出力する類似画像出力部と、
を含む画像検索装置。 - 前記局所特徴量抽出部は、画像の拡大率及び画像の三軸の各々の回転角を、前記幾何特徴として抽出する
請求項1記載の画像検索装置。 - 前記スコア部は、前記複数のリファレンス画像の各々に対し、前記リファレンス画像についての前記投票箱の各々の投票数のうち、最大の投票数を、前記リファレンス画像との類似度を示す前記スコアとして算出する
請求項1又は2記載の画像検索装置。 - 前記投票部は、前記局所特徴量抽出部によって抽出された前記クエリ画像の局所特徴量の各々について、前記セントロイド取得部によって取得された前記セントロイドに対応して前記インデクス格納部に格納された前記リファレンス画像に対する前記幾何特徴との比率又は差分を算出し、前記複数のリファレンス画像の各々について前記幾何特徴の比率又は差分の各々に対して設けられた投票箱のうち、前記算出された前記リファレンス画像に対する前記幾何特徴との比率又は差分に対して設けられた前記リファレンス画像についての投票箱に、前記セントロイド取得部によって取得された前記セントロイドに対応する、前記クエリ画像または前記リファレンス画像の局所特徴量の数に応じた票数、前記セントロイド取得部によって取得された前記セントロイドに対応する局所特徴量を有する前記リファレンス画像の数に応じた票数、又は前記リファレンス画像から抽出された局所特徴量の数に応じた票数を投票する
請求項1〜請求項3の何れか1項記載の画像検索装置。 - 局所特徴量抽出部、セントロイド取得部、投票部、スコア部、及び類似画像出力部を含み、
複数のリファレンス画像の各々について、前記リファレンス画像に対して回転又は拡大率の変化を含む複数の変換を行って生成された複数の変換画像、及び前記リファレンス画像の各々から抽出された局所特徴量に対してクラスタリングを行って前記局所特徴量の各々が分類された複数のクラスタの各々に対して求められたセントロイドの特徴量を格納したセントロイド格納部、及び前記複数のリファレンス画像の各々に対し、前記複数の変換画像、及び前記リファレンス画像の各々から抽出された局所特徴量の各々について、前記局所特徴量が属するクラスタのセントロイド、及び前記変換を表す幾何特徴を格納したインデクス格納部を用いて、複数のリファレンス画像から、クエリ画像と類似するリファレンス画像を検索する画像検索装置における画像検索方法であって、
前記局所特徴量抽出部が、入力された前記クエリ画像に基づいて、前記クエリ画像に対して前記複数の変換を行って複数の変換画像を生成し、前記クエリ画像及び前記複数の変換画像の各々から、前記局所特徴量及び前記幾何特徴を抽出するステップと、
前記セントロイド取得部が、前記局所特徴量抽出部によって抽出された前記クエリ画像の局所特徴量の各々について、前記セントロイド格納部に格納された前記複数のクラスタの各々に対するセントロイドの各々の特徴量と、前記クエリ画像の局所特徴量との類似度を算出し、前記クエリ画像の局所特徴量に対応する前記セントロイドを取得するステップと、
前記投票部が、前記局所特徴量抽出部によって抽出された前記クエリ画像の局所特徴量の各々について、前記セントロイド取得部によって取得された前記セントロイドに対応して前記インデクス格納部に格納された前記リファレンス画像に対する前記幾何特徴との比率又は差分を算出し、前記複数のリファレンス画像の各々について前記幾何特徴の比率又は差分の各々に対して設けられた投票箱のうち、前記算出された前記リファレンス画像に対する前記幾何特徴との比率又は差分に対して設けられた前記リファレンス画像についての投票箱に投票するステップと、
前記スコア部が、前記複数のリファレンス画像の各々に対し、前記リファレンス画像についての前記投票箱の投票結果に基づいて、前記クエリ画像と前記リファレンス画像との類似度を示すスコアを算出するステップと、
前記類似画像出力部が、前記スコア部によって算出された前記スコアに基づいて、前記クエリ画像と類似する前記リファレンス画像を出力するステップと、
を含む画像検索方法。 - 前記局所特徴量抽出部が前記幾何特徴を抽出するステップは、画像の拡大率及び画像の三軸の各々の回転角を、前記幾何特徴として抽出する
請求項5記載の画像検索方法。 - 前記スコア部が前記スコアを算出するステップは、前記複数のリファレンス画像の各々に対し、前記リファレンス画像についての前記投票箱の各々の投票数のうち、最大の投票数を、前記リファレンス画像との類似度を示す前記スコアとして算出する
請求項6記載の画像検索方法。 - 前記投票部が投票するステップは、前記局所特徴量抽出部によって抽出された前記クエリ画像の局所特徴量の各々について、前記セントロイド取得部によって取得された前記セントロイドに対応して前記インデクス格納部に格納された前記リファレンス画像に対する前記幾何特徴との比率又は差分を算出し、前記複数のリファレンス画像の各々について前記幾何特徴の比率又は差分の各々に対して設けられた投票箱のうち、前記算出された前記リファレンス画像に対する前記幾何特徴との比率又は差分に対して設けられた前記リファレンス画像についての投票箱に、前記セントロイド取得部によって取得された前記セントロイドに対応する、前記クエリ画像または前記リファレンス画像の局所特徴量の数に応じた票数、前記セントロイド取得部によって取得された前記セントロイドに対応する局所特徴量を有する前記リファレンス画像の数に応じた票数、又は前記リファレンス画像から抽出された局所特徴量の数に応じた票数を投票する
請求項5〜請求項7の何れか1項記載の画像検索方法。 - コンピュータを、請求項1〜請求項4の何れか1項記載の画像検索装置の各部として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014141549A JP5995916B2 (ja) | 2014-07-09 | 2014-07-09 | 画像検索装置、方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014141549A JP5995916B2 (ja) | 2014-07-09 | 2014-07-09 | 画像検索装置、方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016018444A true JP2016018444A (ja) | 2016-02-01 |
JP5995916B2 JP5995916B2 (ja) | 2016-09-21 |
Family
ID=55233610
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014141549A Active JP5995916B2 (ja) | 2014-07-09 | 2014-07-09 | 画像検索装置、方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5995916B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018142074A (ja) * | 2017-02-27 | 2018-09-13 | 三菱重工業株式会社 | 特徴量算出装置、画像類似度判定装置、画像検索装置、特徴量算出方法及びプログラム |
WO2020099985A1 (ja) * | 2018-11-13 | 2020-05-22 | 株式会社半導体エネルギー研究所 | 画像検索システム、及び画像検索方法 |
CN112749652A (zh) * | 2020-12-31 | 2021-05-04 | 浙江大华技术股份有限公司 | 身份信息确定的方法和装置、存储介质及电子设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006011622A (ja) * | 2004-06-23 | 2006-01-12 | Nippon Telegr & Teleph Corp <Ntt> | 部分画像検索システム及び方法並びにプログラム |
JP2013101423A (ja) * | 2011-11-07 | 2013-05-23 | Nippon Telegr & Teleph Corp <Ntt> | 画像マッチング装置及び画像マッチングプログラム |
WO2013147170A1 (ja) * | 2012-03-29 | 2013-10-03 | 楽天株式会社 | 画像検索装置、画像検索方法、プログラムおよびコンピュータ読取り可能な記憶媒体 |
JP2014041560A (ja) * | 2012-08-23 | 2014-03-06 | Canon Inc | 画像処理装置、画像処理方法 |
-
2014
- 2014-07-09 JP JP2014141549A patent/JP5995916B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006011622A (ja) * | 2004-06-23 | 2006-01-12 | Nippon Telegr & Teleph Corp <Ntt> | 部分画像検索システム及び方法並びにプログラム |
JP2013101423A (ja) * | 2011-11-07 | 2013-05-23 | Nippon Telegr & Teleph Corp <Ntt> | 画像マッチング装置及び画像マッチングプログラム |
WO2013147170A1 (ja) * | 2012-03-29 | 2013-10-03 | 楽天株式会社 | 画像検索装置、画像検索方法、プログラムおよびコンピュータ読取り可能な記憶媒体 |
JP2014041560A (ja) * | 2012-08-23 | 2014-03-06 | Canon Inc | 画像処理装置、画像処理方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018142074A (ja) * | 2017-02-27 | 2018-09-13 | 三菱重工業株式会社 | 特徴量算出装置、画像類似度判定装置、画像検索装置、特徴量算出方法及びプログラム |
WO2020099985A1 (ja) * | 2018-11-13 | 2020-05-22 | 株式会社半導体エネルギー研究所 | 画像検索システム、及び画像検索方法 |
CN112749652A (zh) * | 2020-12-31 | 2021-05-04 | 浙江大华技术股份有限公司 | 身份信息确定的方法和装置、存储介质及电子设备 |
CN112749652B (zh) * | 2020-12-31 | 2024-02-20 | 浙江大华技术股份有限公司 | 身份信息确定的方法和装置、存储介质及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
JP5995916B2 (ja) | 2016-09-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10013636B2 (en) | Image object category recognition method and device | |
JP5167442B2 (ja) | 画像識別装置およびプログラム | |
CN105005760B (zh) | 一种基于有限混合模型的行人再识别方法 | |
US20150287211A1 (en) | Method for classification and segmentation and forming 3d models from images | |
JP2010272092A (ja) | 画像検索装置およびその方法 | |
TWI536186B (zh) | 三維圖檔搜尋方法與三維圖檔搜尋系統 | |
JPWO2014155715A1 (ja) | 物体認識装置および物体認識方法並びにプログラム | |
Yang et al. | Ranking 3D feature correspondences via consistency voting | |
CN108764157B (zh) | 基于法向量高斯分布的建筑物激光脚点提取方法及系统 | |
CN109241901A (zh) | 一种对具有孔洞的三维点云的检测与识别方法 | |
CN109887009B (zh) | 一种点云局部匹配方法 | |
JP5995916B2 (ja) | 画像検索装置、方法、及びプログラム | |
CN107316328A (zh) | 一种基于二维激光扫描仪角点特征的闭环检测方法 | |
CN105205135A (zh) | 一种基于主题模型的3d模型检索方法及其检索装置 | |
JP2016099835A (ja) | 画像処理装置、画像処理方法、及びプログラム | |
Ng et al. | Matching of interest point groups with pairwise spatial constraints | |
Liu et al. | Method for extraction of airborne LiDAR point cloud buildings based on segmentation | |
CN108765446B (zh) | 基于随机场和随机森林的电力线点云分割方法及系统 | |
JP6598480B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
JP2007066019A (ja) | 画像検索方法及び装置 | |
JP6623126B2 (ja) | 物体検索装置、三次元物体モデル化装置、方法、及びプログラム | |
CN116310194A (zh) | 一种配电站房三维模型重建方法、系统、设备和存储介质 | |
Ren et al. | A multi-scale UAV image matching method applied to large-scale landslide reconstruction | |
JP6355372B2 (ja) | 三次元モデル特徴抽出方法、及び三次元モデル・アノテーションシステム | |
JP6399651B2 (ja) | 登録装置及び検索装置並びに方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160722 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160809 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160823 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5995916 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |