JP5094830B2 - 画像検索装置、画像検索方法及びプログラム - Google Patents

画像検索装置、画像検索方法及びプログラム Download PDF

Info

Publication number
JP5094830B2
JP5094830B2 JP2009285157A JP2009285157A JP5094830B2 JP 5094830 B2 JP5094830 B2 JP 5094830B2 JP 2009285157 A JP2009285157 A JP 2009285157A JP 2009285157 A JP2009285157 A JP 2009285157A JP 5094830 B2 JP5094830 B2 JP 5094830B2
Authority
JP
Japan
Prior art keywords
image
cluster
feature
distance
partial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009285157A
Other languages
English (en)
Other versions
JP2011128773A (ja
Inventor
ゾラン ステイチ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2009285157A priority Critical patent/JP5094830B2/ja
Publication of JP2011128773A publication Critical patent/JP2011128773A/ja
Application granted granted Critical
Publication of JP5094830B2 publication Critical patent/JP5094830B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、画像データの有する特徴量に基づいて類似画像を検索する画像検索装置、画像検索方法及びプログラムに関する。
画像を検索キーとして入力し、画像の特徴量(配色、テクスチャ、形状等の画像の特徴を数値化して表現したもの)を比較することにより、検索キーである画像(以下「クエリ画像」という)に類似する画像を検索する技術が知られている。ユーザがクエリ画像を入力すると、クエリ画像から特徴量を抽出して、検索対象の画像の特徴量との類似度を算出することで、類似画像を検索する(例えば、特許文献1)。
1枚の画像から抽出される特徴量は、その画像全体の特徴を示すものであるため、全体的に類似している画像を検索する際に有効である。これに対し、画像を構成する部分的な領域による画像(以下「部分画像」という)が類似している画像を検索する場合には、一枚の画像が複数の領域により構成されていると捉えて、その部分画像毎の特徴量によって画像の特徴を表すことで、部分画像を重要視した類似画像検索が可能になる。
但し、画像を部分画像に分割して、その部分画像毎から算出した特徴量を単に比較するとなると、例えば、100分割した画像であれば、100×100通りのパターンで特徴量を比較し類似度を算出するため、計算量が膨大となる。
そこで、部分画像を用いた計算量を抑えて類似度の算出が可能な部分画像ビジュアルキーワードという手法が考案された。ビジュアルキーワードでは、1枚の画像が複数の部分画像により構成されていると捉え、画像から部分画像を抽出して、予め画像がクラスタリングされて形成されたクラスタに対して、その部分画像を特徴量に基づいて分類し、各部分画像が属するクラスタの数に基づいて特徴ベクトルが生成される。
特開2001−52175号公報
このように、ビジュアルキーワードでは、クラスタに基づいて画像が特徴付けされ、各クラスタの特徴量に基づいて類似度を算出するため、クラスタ数分の計算処理で類似度が求められる。
しかし、特徴ベクトルの生成は、クラスタリングやクラスタに対する分類の性能に影響を受ける。即ち、部分画像は何れかのクラスタに必ず分類されるため、そのクラスタと部分画像との類似性が低かったとしても、その類似性の低いクラスタに部分画像が属するとして計上されて特徴ベクトルが生成されることとなる。
このため、クラスタとの類似性の低い部分画像によって特徴ベクトルが生成されると、特許文献1のように特徴ベクトルの類似度を算出する際に、類似しない部分画像を有する画像同士の類似度が高く算出されてしまう可能性があった。従って、ビジュアルキーワードを用いた画像検索の精度が悪くなってしまった。
本発明は、上述の課題に鑑みて為されたものであり、その目的とするところは、ビジュアルキーワードにより画像から生成する特徴ベクトルの精度を高めることである。
上記目的を達成するため、第1の発明は、画像データから特徴ベクトルを生成し、その特徴ベクトル間の類似度に基づいて類似画像を検索する画像検索装置において、
前記画像データから複数の部分画像を抽出する部分画像抽出手段と、
前記抽出された部分画像が有する特徴量に基づいて前記複数の部分画像を予め形成されたクラスタに分類する分類手段と、
前記部分画像が有する特徴量と、該部分画像が分類されたクラスタが有する特徴量との特徴量空間における距離を算出する距離算出手段と、
前記算出された距離に基づいた重み値を前記部分画像が属するクラスタ毎に加算し、該クラスタ毎に加算した値をスカラ値とした特徴ベクトルを生成する特徴ベクトル生成手段と、を備えることを特徴としている。
第1の発明によれば、画像データから抽出した部分画像の特徴量と、その部分画像が属するクラスタの特徴量との距離に基づいた重み値で特徴ベクトルの各クラスタのスカラ値を加算するため、部分画像が属するクラスタに対応するスカラ値を、そのクラスタとの類似性に応じて重み付けすることができる。これにより、画像データ間の類似度の算出において、各画像データの部分画像が属するクラスタとの類似性を加味した類似度が算出されるようになる。従って、ビジュアルキーワードにより生成される特徴ベクトルの精度を高めることができる。
また、第2の発明は、画像データの有する特徴量に基づいて複数の画像データを予めクラスタリングすることで形成したクラスタが有する特徴量を該クラスタ毎に対応付けて記憶するクラスタ記憶手段を更に備え、
前記分類手段は、
前記部分画像が有する特徴量と、前記クラスタ記憶手段に記憶されたクラスタの特徴量との距離を算出し、その距離に基づいて該部分画像の分類を行い、
前記特徴ベクトル生成手段は、
前記算出された距離と、前記形成されたクラスタの特徴量から該クラスタに属する画像データの特徴量までの距離とに基づいて前記重み値を求めることを特徴としている。
第2の発明によれば、画像データが予めクラスタリングされて形成されたクラスタの特徴量から、該クラスタに属する画像データまでの距離を重み値の算出の指標に加えることにより、分類の基準となったクラスタの特性を加味した特徴ベクトルを生成できる。
また、第3の発明における前記特徴ベクトル生成手段は、前記距離算出手段により算出された前記クラスタの特徴量の距離が、前記クラスタリングされた該クラスタの特徴量から最遠の画像データの特徴量までの距離以上である場合には、前記重み値を0とすることを特徴としている。
第3の発明によれば、クラスタの特徴量から部分画像の特徴量までの距離が離れている場合に、該部分画像がクラスタに属さないと見なしたことに相当する0に重み値を設定することで、クラスタとの類似性を有さない部分画像についてのスカラ値への加算を行わず、クラスタ毎のスカラ値を有する特徴ベクトルの特徴づけを際立たせることができる。
また、第4の発明における前記特徴ベクトル生成手段は、
前記距離算出手段により算出された前記クラスタの特徴量の距離が、前記クラスタリングされた該クラスタの特徴量から直近の画像データまでの距離以下である場合には、前記重み値を1とすることを特徴としている。
第4の発明によれば、クラスタの特徴量から部分画像の特徴量までの距離が近い場合に、該部分画像がクラスタに属していると見なしたことに相当する1に重み値を設定することで、クラスタと類似性の高い部分画像についてのスカラ値を確実に高めて、クラスタ毎のスカラ値を有する特徴ベクトルの特徴づけを際立たせることができる。
また、第5の発明における前記特徴ベクトル生成手段は、前記クラスタリングにより形成されたクラスタのうち、その前記特徴量空間におけるクラスタの大きさが最小であるクラスタの大きさに基づいて、前記重み値を正規化することを特徴としている。
第5の発明によれば、形成されたクラスタのうち、クラスタの大きさが最小であるクラスタの大きさに基づいて重み値を正規化するため、クラスタ間の大きさの違いによる重み値のブレを低めることができる。
また、第6の発明は、コンピュータが、画像データから特徴ベクトルを生成し、その特徴ベクトル間の類似度に基づいて類似画像を検索する画像検索方法において、
前記画像データから複数の部分画像を抽出する部分画像抽出ステップと、
前記抽出された部分画像が有する特徴量に基づいて前記複数の部分画像を予め形成されたクラスタに分類する分類ステップと、
前記部分画像が有する特徴量と、該部分画像が分類されたクラスタが有する特徴量との特徴量空間における距離を算出する距離算出ステップと、
前記算出された距離に基づいた重み値を前記部分画像が属するクラスタ毎に加算し、該クラスタ毎に加算した値をスカラ値とした特徴ベクトルを生成する特徴ベクトル生成ステップと、
を行うことを特徴としている。
また、第7の発明は、第6の発明の画像検索方法を前記コンピュータに実行させるためのプログラムである。
第6及び7の発明によれば、第1の発明と同様の効果が得られる。
本発明によれば、ビジュアルキーワードにより画像から生成する特徴ベクトルの精度を高めることができる。
本発明に係る画像検索装置の機能構成を示すブロック図。 特徴ベクトル生成処理の処理フローを示すフローチャート。 画像データからの部分画像の抽出とクラスタリングの様子を示す図。 クラスタの特徴量と、部分画像の特徴量とに基づく特徴ベクトル生成を説明するための概念図。 距離に基づいた重み値を求めるための式を示す第1のグラフ。 距離に基づいた重み値を求めるための式を示す第2のグラフ。 距離に基づいた重み値を求めるための式を示す第3のグラフ。
[画像検索装置の構成]
以下、本発明の実施の形態を図面に基づいて説明する。
図1は、本発明を適用した画像検索装置1の機能ブロック図である。画像検索装置1には、図示しないクライアント端末が通信ネットワーク(インターネットや電話回線網等)を介して接続され、互いにデータ通信可能となっている。
画像検索装置1は、通信ネットワークを介して接続されたパーソナルコンピュータや携帯端末等のクライアント端末から送信されるクエリ画像を検索要求として受信する。そして、その検索要求に応じた類似画像検索を行って、類似度順にランキングした検索結果をクライアント端末に返送する。
本実施形態における画像検索装置1は、ビジュアルキーワードの手法を用いて画像をインデックス化する。ビジュアルキーワードによる画像検索とは、画像を複数の画像領域の集合として表現し、各画像を構成する画像領域(以下、適宜「部分画像」という)から得られる特徴量に基づいて画像のインデックス(特徴ベクトル)を生成する技術であり、テキスト中のキーワードから文章の特徴量を求めるテキスト検索技術の応用といえる。
このため、ビジュアルキーワードによる画像検索では、画像中の画像領域をキーワードとして扱うことでテキスト検索技術(転置インデックスやベクトル空間モデル、単語の出現頻度等)における技術を画像領域検索へ適用して、大規模且つ高速性を実現することができる。ビジュアルキーワードによる画像検索についての参考技術文献としては、
・Sivic and Zisserman:“Efficient visual search for objects in videos”, Proceedings of the IEEE, Vol.96,No.4.,pp.548-566,Apr 2008.
・Yang and Hauptmann:“A text categorization approach to video scene classification using keypoint features”,Carnegie Mellon University Technical Report,pp.25,Oct 2006.
・Jiang and Ngo:“Bag-of-visual-words expansion using visual relatedness for video indexing”,Proc.31st ACM SIGIR Conf.,pp.769-770,Jul 2008.
・Jiang, Ngo, andYang:“Towards optimal bag-of-features for object categorization and semantic video retrieval”,Proc.6th ACM CIVR Conf.,pp.494-501,Jul.2007.
・Yang, Jiang, Hauptmann, and Ngo:“Evaluating bag-of-visual-words representations in scene classification”,Proc.15th ACM MM Conf., Workshop onMMIR,pp.197-206,Sep. 2007.
等が挙げられる。
また、ある一つの画像を複数の部分画像の集合として表現することによって、一般的な類似画像検索とは異なり、画像中の一部分を任意大きさや位置で切り出した部分画像をクエリ画像とした検索が可能となる。このため、ユーザは、所望の検索結果を得るために、画像の一部分を指定するといった操作により、より直接・正確にクエリを表現することができる。
図1に示すように、画像検索装置1は、クエリ画像受付部10、特徴ベクトル生成部20、類似度算出部30、検索結果出力部40、クラスタリング部50、クラスタDB55、インデクシング部60、インデックスDB65及び検索対象画像DB70を備えて構成される。これらの機能部は、所謂コンピュータにより構成され、演算/制御装置としてのCPU(Central Processing Unit)、記憶媒体としてのRAM(Random Access Memory)及びROM(Read Only Memory)、通信インターフェイス等が連関することで実現される。
クエリ画像受付部10は、クライアント端末から送信される類似画像検索の検索キーとなるクエリ画像を受信して受け付ける。このクエリ画像は、検索対象画像DB70に格納されている画像や、その画像データの一部分の領域を指定する操作により切り出された画像、新たに受信した画像がある。また、クエリ画像としては、1つの画像であってもよいし、複数の画像の組み合わせでもよい。
特徴ベクトル生成部20は、クエリ画像から部分画像を抽出し、その部分画像の特徴量に基づいて特徴ベクトルを生成する特徴ベクトル生成処理(図2参照)を行って、クエリ画像から特徴ベクトルを生成する。特徴ベクトル生成処理については後述する。
類似度算出部30は、インデックスDB65に記憶された検索対象の画像毎の特徴ベクトルと、クエリ画像の特徴ベクトルとの類似度を算出する。この類似度の算出には、コサイン距離やBhattacharyya距離等の公知技術が用いられる。
検索結果出力部40は、類似度算出部30により算出された類似度に基づいて、検索対象の画像をランク付けしたデータを生成する。この検索結果出力部40が出力するデータは、例えば、検索対象画像の画像IDを類似度に基づいてソートしたデータである。画像IDには、検索対象画像DB70にアクセスするためのアドレス(URL)を付加してもよい。
検索対象画像DB70は、クエリ画像に対して類似する画像を検索する対象となる画像データ(以下適宜「検索対象画像」という)を記憶するデータベースである。例えば、画像を識別するための識別情報である画像IDと、画像データとを対応付けて記憶する。
クラスタリング部50は、検索対象画像DB70に記憶された画像データから複数の部分画像を抽出し、その部分画像の有する特徴量に基づいて複数の部分画像をクラスタリングする。尚、クラスタリングの標準的な手法としては、k-means, Hierarchical Agglomerative Clustering(HAC)などが用いられる。尚、クラスタリング部50がクラスタリングの対象とする画像は、検索対象画像DB70に記憶された画像から抽出した部分画像であってもよいし、学習用に予め用意した画像から抽出した部分画像であってもよい。
クラスタDB55は、クラスタリング部50によるクラスタリングにより形成されたクラスタを識別するクラスタIDと、そのクラスタの特徴量空間での中心点の座標である中心座標とを対応付けて記憶するデータベースである。この中心座標は、各クラスタに属する画像の特徴量の平均値を示す値であり、特徴量空間上での多次元の座標により示される。
インデクシング部60は、検索対象画像DB70に記憶された画像データについての特徴ベクトルを生成して、この生成した特徴ベクトルを画像データのインデックスとしてインデックスDB65に対応付けて記憶する。尚、このインデクシング部60による特徴ベクトルの生成も図2に示す特徴ベクトル生成処理に基づいて行われる。
インデックスDB65は、検索対象画像DB70に記憶された画像データの画像IDと、この画像データから生成した特徴ベクトルとを対応付けて記憶するデータベースである。
[特徴ベクトル生成処理]
次に、特徴ベクトル生成部20及びインデクシング部60が行う特徴ベクトル生成処理について、図2の特徴ベクトル生成処理の処理フローを示すフローチャートと、図3〜図5の概要図とを参照しながら説明する。尚、特徴ベクトル生成部20はクエリ画像に対して、インデクシング部60は検索対象画像DB70に記憶された画像データに対してそれぞれ特徴ベクトル生成処理を行う。
先ず、特徴ベクトル生成部20及びインデクシング部60は、クエリ画像又は検索対象画像DB70の画像データから、部分画像を抽出する。(ステップS11)。この部分画像の抽出方法としては、画像中の特徴的な領域(特徴領域)を抽出する手法と、画像を所定領域で分割することで抽出する手法とがある。
画像中の特徴的な領域を抽出する手法としては、
・Harris−affine
・Hessian−affine
・Maximally stable extremal regions(MSER)
・Difference of Gaussians(DoG)
・Laplacian of Gaussian(LoG)
・Determinant of Hessian(DoH)
等がある。
また、特徴領域を抽出する手法としては、画像中のランダムな大きさ・位置の画像領域を選択する手法も知られている。
また、特徴領域の検出技術については、“Local Invariant Feature Detectors: A Survey”(Foundations and Trends in Computer Graphics and Vision,Vol.3,No.3,pp.177-280,2007.)等において公開されており、適宜公知技術を採用可能である。
また、画像を所定領域で分割して抽出する手法としては、例えば、予め定めたM×Nブロックに分割したり、分割後のブロックの大きさが予め定めたm×n画素となるように分割したりする手法がある。例えば、画像を10×10のブロックに分割する場合、画像の大きさが640×480画素であれば、1ブロックの大きさは64×48画素となる。
図3では、画像を所定領域に分割した例を示しており、No.0001の画像については7×6ブロックに分割されている。また、No.0002の画像については5×7ブロック、No.0003の画像については6×6ブロックに分割されている。尚、図示の例では、説明の簡略化のために数ブロックに分割しているが、数万のブロックに分割される。
次に、特徴ベクトル生成部20及びインデクシング部60は、抽出した部分画像が有する特徴量を算出する(ステップS12)。尚、特徴領域を抽出している場合には、スケール変化や回転、角度変化等のアフィン変換に耐性を持つ局所特徴量を抽出する。局所特徴量の一例としては、例えば次のものが挙げられる。
・SIFT
・gradient location and orientation histogram
・shape context
・PCA−SIFT
・spin images
・steerable filters
・differential invariants
・complex filters
・moment invariants
局所特徴量の抽出については、“A performance evaluation of local descriptors”(IEEE Trans. Pattern Analysis and Machine Intelligence, Vol.27, No.10,pp.1615-1630,2005.)等において公開されており、適宜公知技術を採用可能である。
この特徴領域から抽出した部分画像の特徴量に基づいて生成した特徴ベクトルは、オブジェクト(物体)の存在する可能性の高い特徴領域から生成されるため、画像中のオブジェクトの特徴を示す指標として有効である。
また、領域分割により部分画像を抽出している場合には、画像の配色やテクスチャ、形状等の各画像の特徴を数値化して表現した画像特徴量を用いる。
画像特徴量についての参考文献は、
“Content-based image retrieval at the end of the early years”,IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol.22,No.12,pp.1349-1380.Dec 2000.
が知られている。
この領域分割により抽出した部分画像の特徴量から生成した特徴ベクトルは、画像を構成する各部分から生成されるため、画像の全体的な構成を示す指標として有効である。
そして、特徴ベクトル生成部20及びインデクシング部60は、画像データから抽出した複数の部分画像の集合を、その部分画像が有する特徴量に基づいてクラスタDB55のクラスタに分類する(ステップS13)。クラスタへの分類は、クラスタリング部50により画像データが予めクラスタリングされることで形成されたクラスタの中心点と、部分画像の特徴量との特徴量空間における距離に基づいて、該部分画像が属するクラスタを決定する。
以下、各クラスタを識別するIDを‘#’を付して説明する。図3では、抽出した部分画像T1、T3〜T6がクラスタ#1、部分画像T2がクラスタ#2、部分画像T12〜T14がクラスタ#3、部分画像T11及びT21がクラスタ#4、部分画像T24〜T26がクラスタ#5、部分画像T22及びT23がクラスタ#6に分類されている。
特徴ベクトル生成部20及びインデクシング部60は、各部分画像をクラスタに分類すると、そのクラスタリングした部分画像の中から1つの部分画像を選択する(ステップS14)。そして、その選択した部分画像が属するクラスタ(所属クラスタ)のクラスタDB55における中心点と、部分画像の特徴量との特徴量空間上での距離を算出する(ステップS15)。
図4においては、クエリ画像G1から抽出された部分画像G10がクラスタ#2に分類され、その部分画像G10の特徴量と、クラスタ#2の中心点Cとの距離d1が算出される例が図示されている。
そして、部分画像毎の距離に基づいて重み値を求め、その重み値を該部分画像が属するクラスタ毎に加算する(ステップS16)。
この重み値の設定は、例えば、図5に示すグラフに基づいて行われる。同図の重み値は、次の式により求められる。
重み値=1−(1/D)×d
尚、Dは、クラスタの半径であり、例えば、クラスタに属する部分画像のうちの中心点Cからの距離が最遠の部分画像と中心点Cとの距離である。
特徴ベクトルは、図4に示すように、クラスタ毎にスカラ値を有し、図示しないメモリに一時的に格納される。上述のように選択した部分画像について重み値を求めると、その重み値を、該部分画像が属するクラスタのスカラ値に加算する。
このように、部分画像が属するクラスタのスカラ値に、距離に基づく重み値が加算されるため、部分画像が出現するクラスタに0〜1の範囲の値が加算される。従って、特徴ベクトルのクラスタ毎のスカラ値は、部分画像の各クラスタに属する(出現する)数そのものではなく、部分画像がクラスタに出現する数と、そのクラスタの中心点からの距離との両方に基づいて算出されることとなる。
特徴ベクトル生成部20及びインデクシング部60は、画像データから抽出した部分画像を全て選択されている場合には(ステップS17;No)、所属クラスタ毎の重み値をスカラ値とした特徴ベクトルを生成する(ステップS18)。
また、ステップS17において、画像データから抽出した部分画像のうち、選択していない残りの部分画像がある場合には(ステップS17;Yes)、ステップS14に処理を移行して、ステップS14〜S16の処理を繰り返す。
特徴ベクトル生成部20は、特徴ベクトル生成処理により生成したクエリ画像の特徴ベクトルを類似度算出部30に出力する。また、インデクシング部60は、生成した特徴ベクトルをインデックスとして、検索対象画像の画像IDに対応付けてインデックスDB65に記憶する。
以上のように、本実施形態によれば、クエリ画像や検索対象画像から抽出した複数の部分画像を各クラスタに分類し、その部分画像が属するクラスタの中心点と、部分画像の特徴量との距離に基づいた重み値によって、特徴ベクトルのクラスタ毎のスカラ値を加算して、特徴ベクトルを生成する。
図4に示すような大きく分けて空、山、海という構成の画像(クエリ画像G1、検索対象画像G3、G5)離間の類似度を算出するとする。視覚的に、空と海の部分については、検索対象画像G5よりも検索対象画像G3のほうがクエリ画像G1に類似しているとする。また、山の部分は、検索対象画像G3と検索対象画像G5とで同等であるとする。
図4に示すようにクエリ画像G1と、検索対象画像G3、G5との間の類似度を算出する際、同一のクラスタに属する部分画像が画像間にあるとしても、クラスタとの中心点との距離、即ちクラスタとの類似性を加味した特徴ベクトルが生成される。
例えば、クエリ画像G1の部分画像G10が属するクラスタ#2に、検索対象画像G3及びG5から抽出した部分画像G30及びG50も属する場合、クエリ画像G1、検索対象画像G3、G5の特徴ベクトルのクラスタ#2に対応したスカラ値は、中心点Cからの距離に応じてそれぞれ加算される。
各画像の特徴ベクトルのクラスタ#2に対応したスカラ値には、クエリ画像G1では距離d1、検索対象画像G3では距離d3、検索対象画像G5では距離d5にそれぞれ基づいた重み値が加算される。
この加算する重み値は、部分画像がクラスタに属する際に0〜1の範囲で設定されるため、出現頻度に対して重み付けした値といえ、部分画像が属するクラスタに対する類似性に相当する。例えば、「空」の画像がクラスタリングされているクラスタに属すると判断された部分画像ついて、重み値は、部分画像が「空」にどれだけ類似しているかを示す指標となる。
このように、重み値の加算により生成される特徴ベクトルは、部分画像がどの程度、各クラスタに類似しているかを示すこととなる。これに対して逆の観点からは、クラスタに属しながらも、該クラスタに類似していないものについては重み値が低められるので、この重み値は、どの程度、各クラスタに類似していないかを示す指標であるともいえる。
このような重み値を用いることで、あるクラスタに類似する(距離の近い)部分画像を有する画像同士の類似度を高め、類似しない部分画像を有する画像同士の類似度を低めることができる。したがって、その分類先のクラスタと類似性が低い場合には、重み値を低めることで、クラスタに対する分類の精度を吸収し、特徴ベクトルへの影響を抑えることができる。
従って、部分画像とクラスタとの距離(類似性)が加味した精度の高い特徴ベクトルを生成することができ、ビジュアルキーワードの手法による類似画像検索における類似度の精度を高めることができる。
尚、上述した実施形態により本発明が限定されるものではなく、その要旨を逸脱しない範囲で変更可能である。
[変形例1]
例えば、部分画像と中心点との距離に基づいて図5に示すグラフの式に基づいた重み値を設定することとしたが、この式は適宜変更可能である。即ち、クラスタリング部50で形成されたクラスタの平均特徴量から該クラスタに属する検索対象画像DB70の画像データから抽出した部分画像の特徴量までの距離に基づいて重み値を求めることとしてもよい。
例えば、図6に示すグラフに基づいた式で重み値を設定することとしてもよい。この場合、クラスタリング部50がクラスタリングを行う際に、各クラスタに分類された部分画像の中で、該クラスタの中心点からの距離が最も遠い部分画像との該距離をMax、距離が最も近い部分画像との該距離をMinとして設定して、クラスタ毎にクラスタDB55に記憶しておく。
そして、特徴ベクトルを生成する対象となるクエリ画像又は検索対象画像について、各画像から抽出した部分画像と、クラスタの中心点との距離がMax以上である場合には、重み値を0、Min以下である場合には重み値を1として設定する。
また、部分画像とクラスタの中心点との距離がMin以上、Max以上でる場合には、次式に基づいて重み値が設定される。
重み値=1−(d−Min)/(Max−Min)
このように、クラスタリングにより予め分類された各クラスタの中心点からの距離が最も遠い部分画像に基づいて重み値を設定することで、クラスタに属しながらも類似性を有しない部分画像については特徴ベクトルのスカラ値を加算しないため、類似性を有さない部分画像による特徴ベクトルへの影響を抑えることができる。
また、最も近い部分画像との距離に応じて重み値を設定することで、クラスタの中心点、即ち、そのクラスタの平均的な特徴量に近い部分画像については重み値を1として高めることができるので、類似性を有する部分画像によって特徴ベクトルを際立たせることができる。
尚、部分画像とクラスタの中心点との距離がMin以上、Max以上である場合の重み値を求める式は、図7のグラフに基づいた次式にしてもよい。
重み値=1−(d−Min)/(Max−Min)
この式により求めた重み値によれば、クラスタの中心点と、部分画像との距離が近いほど、重み値が高まるため、類似性を有する部分画像によって特徴ベクトルを更に際立たせることができる。
[変形例2]
また、クラスタリング部50が形成したクラスタのうち、該クラスタの大きさ(例えば、直径)が最小のものを選択して、そのクラスタの大きさによって重み値の値を正規化することとしてもよい。
具体的には、クラスタリング部50のクラスタリングによりクラスタを形成した際に、そのクラスタの平均特徴量と、該クラスタ内に属する部分画像のうちの該平均特徴量から最遠の部分画像の特徴量との距離を取得する。そして、クラスタリング部50が形成したクラスタの中でその距離が最小となるもの(SmallestMaxDistance)、即ち、クラスタの大きさが最小となったクラスタの半径によって、重み値を正規化する。
上述した実施形態における重み値の算出式は、
重み値=1−(1/(SmallestMaxDistance/D))×d
となる。
また、変形例1における算出式それぞれは、
重み値=1−(d−Min)/((SmallestMaxDistance/Max)−Min)
重み値=1−(d−Min)/((SmallestMaxDistance/Max)−Min)
となる。
これにより、クラスタリング部50によって形成されたクラスタの間に大きさのばらつきが生じた場合にも、最小のクラスタの大きさに基づいて、そのばらつきを抑えることができる。
[変形例3]
また、テキスト検索における単語の重み付け手法であるTF/IDF(term frequency-inverse document frequency)により更に重み付けを行って特徴ベクトルを生成することとしてもよい。
TF/IDFに関する参考資料としては、
C.D.Manning, P.Raghavan and H.Schutze:" Introduction to Information Retrieval",Cambridge University Press.2008.
が知られている。
TF/IDFは、文章中の特徴的な単語を抽出するためのアルゴリズムであり、単語の出現頻度であるTFと、逆出現頻度であるIDFとの二つの指標により算出される。具体的には、次式により求められる。
TF/IDF=TF(i,j)/T(i)*IDF(j)
IDF(i)=log(N/DF(i))
ここで、
TF(i,j)は、キーワード抽出対象のドキュメントi中でのキーワードjの出現数
T(i)は、ドキュメントi中の全ての単語の数
Nは、全てのドキュメント数
DF(j)は、キーワードjが含まれるドキュメントの数
である。
これを、ドキュメントを画像、単語を同一のクラスタに属する部分画像(ビジュアルキーワード)として捉え、各画像のクラスタ毎のTF/IDF値を求めて、このTF/IDF値をクラスタ毎に加算することで、特徴ベクトルを生成する。
このとき、画像IDをi、各クラスタkとしてビジュアルキーワードに適用した重み値のTF/IDF(i,k)は以下の式により算出する。
TF/IDF(i,k)=TF(i,k)/T(i)*IDF(k)
IDF(k) =log(N/DF(k))
尚、TF(i,k)は、画像iから抽出した部分画像がクラスタkで出現する数に重み付けを行ったものであり、各クラスタk内に属する(出現する)部分画像と、クラスタkの中心点との距離に基づく上述した重み値(0〜1)となる。
また、T(i)は、画像iから抽出した部分画像の総数に、クラスタとの距離に基づく重み付けをした値であり、画像iから抽出した各部分画像が属するクラスタとの距離に基づいた重み値を合計したものである。
また、DF(k)は、クラスタリングにより各クラスタkに分類した部分画像が、各クラスタkに出現する数に、クラスタとの距離に基づく重み付けを行った値である。また、Nは、検索対象画像DB70の画像総数である。
このように、TF/IDFにおけるドキュメントを画像とみなし、ドキュメント内の単語を同一のクラスタに属する部分画像(ビジュアルキーワード)とみなして重み付けを行うことで、各画像に出現する部分画像の重要度を下げ、特定の画像に際立って出現する特徴的な部分画像についての重要度を上げるように特徴ベクトルのスカラ値に重み付けを行うことができる。
[変形例4]
また、上述では、一つのクエリ画像が受け付けられた場合を例示して説明したが、クエリ画像が複数受け付けることとしてもよい。この場合は、特徴ベクトルの生成を各クエリ画像に対して行う。そして、特徴ベクトル生成部が各クエリ画像から生成した複数の特徴ベクトルを加算することで一つの特徴ベクトルに合成して、インデックスDB65の特徴ベクトルと比較し類似度を算出する。
このように、複数の特徴ベクトルを加算することで一つの特徴ベクトルに合成できるのは、画像を複数の部分画像の集合として表現するというビジュアルキーワード固有の技術による。即ち、クエリ画像が複数である場合には、その複数のクエリ画像から検出される部分画像の集合を、1つのクエリ(検索要求)に対する部分画像の集合と見なすことができるため、特徴ベクトルの合成が可能となる。
これにより、ユーザが検索時に入力するクエリ画像が複数であった場合にも、複数のクエリ画像から統合した各クエリ画像の特徴を重要視した特徴ベクトルを生成することができ、ユーザの検索意図を考慮した類似画像検索のランキングを生成することができる。
[変形例5]
また、上述では、重み値を求める際の「クラスタの有する特徴量」として「クラスタに属する画像の特徴量の平均値」を用いることとして説明したが、これに限られない。
例えば、各クラスタにクラスタリングされた部分画像それぞれの特徴量を用いることとしてもよい。この場合、クラスタに属する部分画像の特徴量それぞれと、特徴ベクトル生成対象の画像から抽出した部分画像の特徴量との距離を算出して、その距離の平均値に基づいて重み値を設定する。クラスタに属する画像の特徴量の平均値を用いた場合、クラスタ内での特徴量のばらつきが直接その平均値の値を左右するが、クラスタリングされた部分画像それぞれの特徴量との距離の平均値を用いることで、特徴ベクトル生成におけるクラスタ内での画像のばらつきの影響を抑制できる。
また、各クラスタにクラスタリングされた部分画像それぞれの特徴量を用いる場合に、各クラスタに属する部分画像の特徴量それぞれと、特徴ベクトル生成対象の画像から抽出した部分画像の特徴量との距離が最も短い部分画像をクラスタ内から選択し、その部分画像との距離に基づいて重み値を設定する。この場合、クラスタ内で最も類似する部分画像との距離を用いて、どの程度クラスタに類似しているかという指標を特徴ベクトルに加えることができる。
尚、同様に、各クラスタに属する部分画像の特徴量それぞれと、特徴ベクトル生成対象の画像から抽出した部分画像の特徴量との距離が最も遠い部分画像をクラスタ内から選択し、その部分画像との距離に基づいて重み値を設定することとしてもよい。
今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
1 画像検索装置
10 クエリ画像受付部
20 特徴ベクトル生成部
30 類似度算出部
40 検索結果出力部
50 クラスタリング部
60 インデクシング部
C 中心点
d1 距離
d3 距離
d5 距離
55 クラスタDB
65 インデックスDB
DB70 検索対象画像
G1 クエリ画像
G10 部分画像
G3 検索対象画像
G30 部分画像
G5 検索対象画像
G50 部分画像

Claims (7)

  1. 画像データから特徴ベクトルを生成し、その特徴ベクトル間の類似度に基づいて類似画像を検索する画像検索装置において、
    前記画像データから複数の部分画像を抽出する部分画像抽出手段と、
    前記抽出された部分画像が有する特徴量に基づいて前記複数の部分画像を予め形成されたクラスタに分類する分類手段と、
    前記部分画像が有する特徴量と、該部分画像が分類されたクラスタが有する特徴量との特徴量空間における距離を算出する距離算出手段と、
    前記算出された距離に基づいた重み値を前記部分画像が属するクラスタ毎に加算し、該クラスタ毎に加算した値をスカラ値とした特徴ベクトルを生成する特徴ベクトル生成手段と、
    を備えることを特徴とする画像検索装置。
  2. 画像データの有する特徴量に基づいて複数の画像データを予めクラスタリングすることで形成したクラスタが有する特徴量を該クラスタ毎に対応付けて記憶するクラスタ記憶手段を更に備え、
    前記分類手段は、
    前記部分画像が有する特徴量と、前記クラスタ記憶手段に記憶されたクラスタの特徴量との距離を算出し、その距離に基づいて該部分画像の分類を行い、
    前記特徴ベクトル生成手段は、
    前記算出された距離と、前記形成されたクラスタの特徴量から該クラスタに属する画像データの特徴量までの距離とに基づいて前記重み値を求めることを特徴とする請求項1に記載の画像検索装置。
  3. 前記特徴ベクトル生成手段は、
    前記距離算出手段により算出された前記クラスタの特徴量の距離が、前記クラスタリングされた該クラスタの特徴量から最遠の画像データの特徴量までの距離以上である場合には、前記重み値を0とすることを特徴とする請求項2に記載の画像検索装置。
  4. 前記特徴ベクトル生成手段は、
    前記距離算出手段により算出された前記クラスタの特徴量の距離が、前記クラスタリングされた該クラスタの特徴量から直近の画像データまでの距離以下である場合には、前記重み値を1とすることを特徴とする請求項2又は3に記載の画像検索装置。
  5. 前記特徴ベクトル生成手段は、
    前記クラスタリングにより形成されたクラスタのうち、その前記特徴量空間におけるクラスタの大きさが最小であるクラスタの大きさに基づいて、前記重み値を正規化することを特徴とする請求項2〜4の何れか一項に記載の画像検索装置。
  6. コンピュータが、画像データから特徴ベクトルを生成し、その特徴ベクトル間の類似度に基づいて類似画像を検索する画像検索方法において、
    前記画像データから複数の部分画像を抽出する部分画像抽出ステップと、
    前記抽出された部分画像が有する特徴量に基づいて前記複数の部分画像を予め形成されたクラスタに分類する分類ステップと、
    前記部分画像が有する特徴量と、該部分画像が分類されたクラスタが有する特徴量との特徴量空間における距離を算出する距離算出ステップと、
    前記算出された距離に基づいた重み値を前記部分画像が属するクラスタ毎に加算し、該クラスタ毎に加算した値をスカラ値とした特徴ベクトルを生成する特徴ベクトル生成ステップと、
    を行うことを特徴とする画像検索方法。
  7. 請求項6に記載の画像検索方法を前記コンピュータに実行させるためのプログラム。
JP2009285157A 2009-12-16 2009-12-16 画像検索装置、画像検索方法及びプログラム Active JP5094830B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009285157A JP5094830B2 (ja) 2009-12-16 2009-12-16 画像検索装置、画像検索方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009285157A JP5094830B2 (ja) 2009-12-16 2009-12-16 画像検索装置、画像検索方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2011128773A JP2011128773A (ja) 2011-06-30
JP5094830B2 true JP5094830B2 (ja) 2012-12-12

Family

ID=44291330

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009285157A Active JP5094830B2 (ja) 2009-12-16 2009-12-16 画像検索装置、画像検索方法及びプログラム

Country Status (1)

Country Link
JP (1) JP5094830B2 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5548655B2 (ja) * 2011-06-30 2014-07-16 ヤフー株式会社 画像検索装置、画像検索システム、画像検索方法、及び画像検索プログラム
JP5430636B2 (ja) * 2011-11-15 2014-03-05 ヤフー株式会社 データ取得装置、方法及びプログラム
CN103714077B (zh) * 2012-09-29 2017-10-20 日电(中国)有限公司 物体检索的方法、检索校验的方法及装置
GB2516037A (en) * 2013-07-08 2015-01-14 Univ Surrey Compact and robust signature for large scale visual search, retrieval and classification
JP6375706B2 (ja) * 2014-06-11 2018-08-22 富士ゼロックス株式会社 属性推定プログラム及び情報処理装置
JP6378855B1 (ja) * 2017-01-20 2018-08-22 楽天株式会社 画像検索システム、画像検索方法およびプログラム
CN110609916A (zh) * 2019-09-25 2019-12-24 四川东方网力科技有限公司 视频图像数据检索方法、装置、设备和存储介质
CN113656373A (zh) * 2021-08-16 2021-11-16 百度在线网络技术(北京)有限公司 构建检索数据库的方法、装置、设备以及存储介质
EP4160434A4 (en) 2021-08-16 2023-12-13 Baidu Online Network Technology (Beijing) Co., Ltd METHOD AND DEVICE FOR CONSTRUCTING A SEARCH DATABASE AND DEVICE AND STORAGE MEDIUM

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3936822B2 (ja) * 1999-08-19 2007-06-27 日本放送協会 静止画像検索装置
JP4376145B2 (ja) * 2004-07-22 2009-12-02 日立ソフトウエアエンジニアリング株式会社 画像分類学習処理システム及び画像識別処理システム
JP2006119723A (ja) * 2004-10-19 2006-05-11 Canon Inc 画像処理装置、画像処理方法

Also Published As

Publication number Publication date
JP2011128773A (ja) 2011-06-30

Similar Documents

Publication Publication Date Title
US10922350B2 (en) Associating still images and videos
JP5094830B2 (ja) 画像検索装置、画像検索方法及びプログラム
JP5121917B2 (ja) 画像検索装置、画像検索方法及びプログラム
Bhagat et al. Image annotation: Then and now
US7502780B2 (en) Information storage and retrieval
US20160188633A1 (en) A method and apparatus for tracking microblog messages for relevancy to an entity identifiable by an associated text and an image
JP4937395B2 (ja) 特徴ベクトル生成装置、特徴ベクトル生成方法及びプログラム
JP4906900B2 (ja) 画像検索装置、画像検索方法及びプログラム
JP5014479B2 (ja) 画像検索装置、画像検索方法及びプログラム
Dharani et al. Content based image retrieval system using feature classification with modified KNN algorithm
Martinet et al. A relational vector space model using an advanced weighting scheme for image retrieval
Yuan et al. Utilizing related samples to enhance interactive concept-based video search
Liu et al. Research of commodity recommendation workflow based on LSH algorithm
JP6017277B2 (ja) 特徴ベクトルの集合で表されるコンテンツ間の類似度を算出するプログラム、装置及び方法
JP5833499B2 (ja) 高次元の特徴ベクトル集合で表現されるコンテンツを高精度で検索する検索装置及びプログラム
Tian et al. Exploration of image search results quality assessment
Bouhlel et al. Hypergraph learning with collaborative representation for image search reranking
Kesorn et al. Visual content representation using semantically similar visual words
Foncubierta-Rodríguez et al. From visual words to a visual grammar: using language modelling for image classification
Lin et al. Effective and efficient video high-level semantic retrieval using associations and correlations
Sumathy et al. Image Retrieval and Analysis Using Text and Fuzzy Shape Features: Emerging Research and Opportunities: Emerging Research and Opportunities
Su et al. Effective image semantic annotation by discovering visual-concept associations from image-concept distribution model
Doulamis et al. 3D modelling of cultural heritage objects from photos posted over the Twitter
Barbu CONTENT-BASED IMAGE RETRIEVAL FRAMEWORK USING MULTI-SCALE DEEP-LEARNING-BASED FEATURE EXTRACTION AND GRAPH-BASED CLUSTERING
Shi et al. Exploring spatial correlation for visual object retrieval

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120809

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120821

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120918

R150 Certificate of patent or registration of utility model

Ref document number: 5094830

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150928

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250