JP5094830B2 - 画像検索装置、画像検索方法及びプログラム - Google Patents
画像検索装置、画像検索方法及びプログラム Download PDFInfo
- Publication number
- JP5094830B2 JP5094830B2 JP2009285157A JP2009285157A JP5094830B2 JP 5094830 B2 JP5094830 B2 JP 5094830B2 JP 2009285157 A JP2009285157 A JP 2009285157A JP 2009285157 A JP2009285157 A JP 2009285157A JP 5094830 B2 JP5094830 B2 JP 5094830B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- cluster
- feature
- distance
- partial
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 32
- 239000013598 vector Substances 0.000 claims description 106
- 238000004364 calculation method Methods 0.000 claims description 13
- 238000000605 extraction Methods 0.000 claims description 6
- 230000000007 visual effect Effects 0.000 description 18
- 230000008569 process Effects 0.000 description 8
- 238000012545 processing Methods 0.000 description 8
- 238000012986 modification Methods 0.000 description 7
- 230000004048 modification Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 239000012925 reference material Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
- DQJCHOQLCLEDLL-UHFFFAOYSA-N tricyclazole Chemical compound CC1=CC=CC2=C1N1C=NN=C1S2 DQJCHOQLCLEDLL-UHFFFAOYSA-N 0.000 description 1
Images
Landscapes
- Processing Or Creating Images (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
前記画像データから複数の部分画像を抽出する部分画像抽出手段と、
前記抽出された部分画像が有する特徴量に基づいて前記複数の部分画像を予め形成されたクラスタに分類する分類手段と、
前記部分画像が有する特徴量と、該部分画像が分類されたクラスタが有する特徴量との特徴量空間における距離を算出する距離算出手段と、
前記算出された距離に基づいた重み値を前記部分画像が属するクラスタ毎に加算し、該クラスタ毎に加算した値をスカラ値とした特徴ベクトルを生成する特徴ベクトル生成手段と、を備えることを特徴としている。
前記分類手段は、
前記部分画像が有する特徴量と、前記クラスタ記憶手段に記憶されたクラスタの特徴量との距離を算出し、その距離に基づいて該部分画像の分類を行い、
前記特徴ベクトル生成手段は、
前記算出された距離と、前記形成されたクラスタの特徴量から該クラスタに属する画像データの特徴量までの距離とに基づいて前記重み値を求めることを特徴としている。
前記距離算出手段により算出された前記クラスタの特徴量の距離が、前記クラスタリングされた該クラスタの特徴量から直近の画像データまでの距離以下である場合には、前記重み値を1とすることを特徴としている。
前記画像データから複数の部分画像を抽出する部分画像抽出ステップと、
前記抽出された部分画像が有する特徴量に基づいて前記複数の部分画像を予め形成されたクラスタに分類する分類ステップと、
前記部分画像が有する特徴量と、該部分画像が分類されたクラスタが有する特徴量との特徴量空間における距離を算出する距離算出ステップと、
前記算出された距離に基づいた重み値を前記部分画像が属するクラスタ毎に加算し、該クラスタ毎に加算した値をスカラ値とした特徴ベクトルを生成する特徴ベクトル生成ステップと、
を行うことを特徴としている。
以下、本発明の実施の形態を図面に基づいて説明する。
図1は、本発明を適用した画像検索装置1の機能ブロック図である。画像検索装置1には、図示しないクライアント端末が通信ネットワーク(インターネットや電話回線網等)を介して接続され、互いにデータ通信可能となっている。
・Sivic and Zisserman:“Efficient visual search for objects in videos”, Proceedings of the IEEE, Vol.96,No.4.,pp.548-566,Apr 2008.
・Yang and Hauptmann:“A text categorization approach to video scene classification using keypoint features”,Carnegie Mellon University Technical Report,pp.25,Oct 2006.
・Jiang and Ngo:“Bag-of-visual-words expansion using visual relatedness for video indexing”,Proc.31st ACM SIGIR Conf.,pp.769-770,Jul 2008.
・Jiang, Ngo, andYang:“Towards optimal bag-of-features for object categorization and semantic video retrieval”,Proc.6th ACM CIVR Conf.,pp.494-501,Jul.2007.
・Yang, Jiang, Hauptmann, and Ngo:“Evaluating bag-of-visual-words representations in scene classification”,Proc.15th ACM MM Conf., Workshop onMMIR,pp.197-206,Sep. 2007.
等が挙げられる。
次に、特徴ベクトル生成部20及びインデクシング部60が行う特徴ベクトル生成処理について、図2の特徴ベクトル生成処理の処理フローを示すフローチャートと、図3〜図5の概要図とを参照しながら説明する。尚、特徴ベクトル生成部20はクエリ画像に対して、インデクシング部60は検索対象画像DB70に記憶された画像データに対してそれぞれ特徴ベクトル生成処理を行う。
・Harris−affine
・Hessian−affine
・Maximally stable extremal regions(MSER)
・Difference of Gaussians(DoG)
・Laplacian of Gaussian(LoG)
・Determinant of Hessian(DoH)
等がある。
また、特徴領域を抽出する手法としては、画像中のランダムな大きさ・位置の画像領域を選択する手法も知られている。
・gradient location and orientation histogram
・shape context
・PCA−SIFT
・spin images
・steerable filters
・differential invariants
・complex filters
・moment invariants
“Content-based image retrieval at the end of the early years”,IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol.22,No.12,pp.1349-1380.Dec 2000.
が知られている。
重み値=1−(1/D)×d
尚、Dは、クラスタの半径であり、例えば、クラスタに属する部分画像のうちの中心点Cからの距離が最遠の部分画像と中心点Cとの距離である。
例えば、部分画像と中心点との距離に基づいて図5に示すグラフの式に基づいた重み値を設定することとしたが、この式は適宜変更可能である。即ち、クラスタリング部50で形成されたクラスタの平均特徴量から該クラスタに属する検索対象画像DB70の画像データから抽出した部分画像の特徴量までの距離に基づいて重み値を求めることとしてもよい。
重み値=1−(d−Min)/(Max−Min)
重み値=1−(d2−Min)/(Max−Min)
また、クラスタリング部50が形成したクラスタのうち、該クラスタの大きさ(例えば、直径)が最小のものを選択して、そのクラスタの大きさによって重み値の値を正規化することとしてもよい。
重み値=1−(1/(SmallestMaxDistance/D))×d
となる。
重み値=1−(d−Min)/((SmallestMaxDistance/Max)−Min)
重み値=1−(d2−Min)/((SmallestMaxDistance/Max)−Min)
となる。
また、テキスト検索における単語の重み付け手法であるTF/IDF(term frequency-inverse document frequency)により更に重み付けを行って特徴ベクトルを生成することとしてもよい。
C.D.Manning, P.Raghavan and H.Schutze:" Introduction to Information Retrieval",Cambridge University Press.2008.
が知られている。
TF/IDF=TF(i,j)/T(i)*IDF(j)
IDF(i)=log(N/DF(i))
TF(i,j)は、キーワード抽出対象のドキュメントi中でのキーワードjの出現数
T(i)は、ドキュメントi中の全ての単語の数
Nは、全てのドキュメント数
DF(j)は、キーワードjが含まれるドキュメントの数
である。
IDF(k) =log(N/DF(k))
また、上述では、一つのクエリ画像が受け付けられた場合を例示して説明したが、クエリ画像が複数受け付けることとしてもよい。この場合は、特徴ベクトルの生成を各クエリ画像に対して行う。そして、特徴ベクトル生成部が各クエリ画像から生成した複数の特徴ベクトルを加算することで一つの特徴ベクトルに合成して、インデックスDB65の特徴ベクトルと比較し類似度を算出する。
また、上述では、重み値を求める際の「クラスタの有する特徴量」として「クラスタに属する画像の特徴量の平均値」を用いることとして説明したが、これに限られない。
10 クエリ画像受付部
20 特徴ベクトル生成部
30 類似度算出部
40 検索結果出力部
50 クラスタリング部
60 インデクシング部
C 中心点
d1 距離
d3 距離
d5 距離
55 クラスタDB
65 インデックスDB
DB70 検索対象画像
G1 クエリ画像
G10 部分画像
G3 検索対象画像
G30 部分画像
G5 検索対象画像
G50 部分画像
Claims (7)
- 画像データから特徴ベクトルを生成し、その特徴ベクトル間の類似度に基づいて類似画像を検索する画像検索装置において、
前記画像データから複数の部分画像を抽出する部分画像抽出手段と、
前記抽出された部分画像が有する特徴量に基づいて前記複数の部分画像を予め形成されたクラスタに分類する分類手段と、
前記部分画像が有する特徴量と、該部分画像が分類されたクラスタが有する特徴量との特徴量空間における距離を算出する距離算出手段と、
前記算出された距離に基づいた重み値を前記部分画像が属するクラスタ毎に加算し、該クラスタ毎に加算した値をスカラ値とした特徴ベクトルを生成する特徴ベクトル生成手段と、
を備えることを特徴とする画像検索装置。 - 画像データの有する特徴量に基づいて複数の画像データを予めクラスタリングすることで形成したクラスタが有する特徴量を該クラスタ毎に対応付けて記憶するクラスタ記憶手段を更に備え、
前記分類手段は、
前記部分画像が有する特徴量と、前記クラスタ記憶手段に記憶されたクラスタの特徴量との距離を算出し、その距離に基づいて該部分画像の分類を行い、
前記特徴ベクトル生成手段は、
前記算出された距離と、前記形成されたクラスタの特徴量から該クラスタに属する画像データの特徴量までの距離とに基づいて前記重み値を求めることを特徴とする請求項1に記載の画像検索装置。 - 前記特徴ベクトル生成手段は、
前記距離算出手段により算出された前記クラスタの特徴量の距離が、前記クラスタリングされた該クラスタの特徴量から最遠の画像データの特徴量までの距離以上である場合には、前記重み値を0とすることを特徴とする請求項2に記載の画像検索装置。 - 前記特徴ベクトル生成手段は、
前記距離算出手段により算出された前記クラスタの特徴量の距離が、前記クラスタリングされた該クラスタの特徴量から直近の画像データまでの距離以下である場合には、前記重み値を1とすることを特徴とする請求項2又は3に記載の画像検索装置。 - 前記特徴ベクトル生成手段は、
前記クラスタリングにより形成されたクラスタのうち、その前記特徴量空間におけるクラスタの大きさが最小であるクラスタの大きさに基づいて、前記重み値を正規化することを特徴とする請求項2〜4の何れか一項に記載の画像検索装置。 - コンピュータが、画像データから特徴ベクトルを生成し、その特徴ベクトル間の類似度に基づいて類似画像を検索する画像検索方法において、
前記画像データから複数の部分画像を抽出する部分画像抽出ステップと、
前記抽出された部分画像が有する特徴量に基づいて前記複数の部分画像を予め形成されたクラスタに分類する分類ステップと、
前記部分画像が有する特徴量と、該部分画像が分類されたクラスタが有する特徴量との特徴量空間における距離を算出する距離算出ステップと、
前記算出された距離に基づいた重み値を前記部分画像が属するクラスタ毎に加算し、該クラスタ毎に加算した値をスカラ値とした特徴ベクトルを生成する特徴ベクトル生成ステップと、
を行うことを特徴とする画像検索方法。 - 請求項6に記載の画像検索方法を前記コンピュータに実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009285157A JP5094830B2 (ja) | 2009-12-16 | 2009-12-16 | 画像検索装置、画像検索方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009285157A JP5094830B2 (ja) | 2009-12-16 | 2009-12-16 | 画像検索装置、画像検索方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011128773A JP2011128773A (ja) | 2011-06-30 |
JP5094830B2 true JP5094830B2 (ja) | 2012-12-12 |
Family
ID=44291330
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009285157A Active JP5094830B2 (ja) | 2009-12-16 | 2009-12-16 | 画像検索装置、画像検索方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5094830B2 (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5548655B2 (ja) * | 2011-06-30 | 2014-07-16 | ヤフー株式会社 | 画像検索装置、画像検索システム、画像検索方法、及び画像検索プログラム |
JP5430636B2 (ja) * | 2011-11-15 | 2014-03-05 | ヤフー株式会社 | データ取得装置、方法及びプログラム |
CN103714077B (zh) * | 2012-09-29 | 2017-10-20 | 日电(中国)有限公司 | 物体检索的方法、检索校验的方法及装置 |
GB2516037A (en) * | 2013-07-08 | 2015-01-14 | Univ Surrey | Compact and robust signature for large scale visual search, retrieval and classification |
JP6375706B2 (ja) * | 2014-06-11 | 2018-08-22 | 富士ゼロックス株式会社 | 属性推定プログラム及び情報処理装置 |
JP6378855B1 (ja) * | 2017-01-20 | 2018-08-22 | 楽天株式会社 | 画像検索システム、画像検索方法およびプログラム |
CN110609916A (zh) * | 2019-09-25 | 2019-12-24 | 四川东方网力科技有限公司 | 视频图像数据检索方法、装置、设备和存储介质 |
CN113656373A (zh) * | 2021-08-16 | 2021-11-16 | 百度在线网络技术(北京)有限公司 | 构建检索数据库的方法、装置、设备以及存储介质 |
EP4160434A4 (en) | 2021-08-16 | 2023-12-13 | Baidu Online Network Technology (Beijing) Co., Ltd | METHOD AND DEVICE FOR CONSTRUCTING A SEARCH DATABASE AND DEVICE AND STORAGE MEDIUM |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3936822B2 (ja) * | 1999-08-19 | 2007-06-27 | 日本放送協会 | 静止画像検索装置 |
JP4376145B2 (ja) * | 2004-07-22 | 2009-12-02 | 日立ソフトウエアエンジニアリング株式会社 | 画像分類学習処理システム及び画像識別処理システム |
JP2006119723A (ja) * | 2004-10-19 | 2006-05-11 | Canon Inc | 画像処理装置、画像処理方法 |
-
2009
- 2009-12-16 JP JP2009285157A patent/JP5094830B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2011128773A (ja) | 2011-06-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10922350B2 (en) | Associating still images and videos | |
JP5094830B2 (ja) | 画像検索装置、画像検索方法及びプログラム | |
JP5121917B2 (ja) | 画像検索装置、画像検索方法及びプログラム | |
Bhagat et al. | Image annotation: Then and now | |
US7502780B2 (en) | Information storage and retrieval | |
US20160188633A1 (en) | A method and apparatus for tracking microblog messages for relevancy to an entity identifiable by an associated text and an image | |
JP4937395B2 (ja) | 特徴ベクトル生成装置、特徴ベクトル生成方法及びプログラム | |
JP4906900B2 (ja) | 画像検索装置、画像検索方法及びプログラム | |
JP5014479B2 (ja) | 画像検索装置、画像検索方法及びプログラム | |
Dharani et al. | Content based image retrieval system using feature classification with modified KNN algorithm | |
Martinet et al. | A relational vector space model using an advanced weighting scheme for image retrieval | |
Yuan et al. | Utilizing related samples to enhance interactive concept-based video search | |
Liu et al. | Research of commodity recommendation workflow based on LSH algorithm | |
JP6017277B2 (ja) | 特徴ベクトルの集合で表されるコンテンツ間の類似度を算出するプログラム、装置及び方法 | |
JP5833499B2 (ja) | 高次元の特徴ベクトル集合で表現されるコンテンツを高精度で検索する検索装置及びプログラム | |
Tian et al. | Exploration of image search results quality assessment | |
Bouhlel et al. | Hypergraph learning with collaborative representation for image search reranking | |
Kesorn et al. | Visual content representation using semantically similar visual words | |
Foncubierta-Rodríguez et al. | From visual words to a visual grammar: using language modelling for image classification | |
Lin et al. | Effective and efficient video high-level semantic retrieval using associations and correlations | |
Sumathy et al. | Image Retrieval and Analysis Using Text and Fuzzy Shape Features: Emerging Research and Opportunities: Emerging Research and Opportunities | |
Su et al. | Effective image semantic annotation by discovering visual-concept associations from image-concept distribution model | |
Doulamis et al. | 3D modelling of cultural heritage objects from photos posted over the Twitter | |
Barbu | CONTENT-BASED IMAGE RETRIEVAL FRAMEWORK USING MULTI-SCALE DEEP-LEARNING-BASED FEATURE EXTRACTION AND GRAPH-BASED CLUSTERING | |
Shi et al. | Exploring spatial correlation for visual object retrieval |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120809 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120821 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120918 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5094830 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150928 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |