JP2011113130A - 画像検索装置、画像検索方法及び画像検索プログラム - Google Patents
画像検索装置、画像検索方法及び画像検索プログラム Download PDFInfo
- Publication number
- JP2011113130A JP2011113130A JP2009266476A JP2009266476A JP2011113130A JP 2011113130 A JP2011113130 A JP 2011113130A JP 2009266476 A JP2009266476 A JP 2009266476A JP 2009266476 A JP2009266476 A JP 2009266476A JP 2011113130 A JP2011113130 A JP 2011113130A
- Authority
- JP
- Japan
- Prior art keywords
- image
- search
- images
- unit
- feature amount
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Processing Or Creating Images (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】キーワードを指定することでHTML内の画像を検索し、テキスト解析に基づいてキーワードとの関連度を算出し、関連度により順位が付与された複数の検索画像を入力するWeb画像入力部10と、前記検索画像から画像信号値を測定して画像特徴量として出力する特徴量変換部1と、前記特徴量変換部で出力された画像特徴量を一時的に保管する蓄積部3と、前記関連度が大きい検索画像の上位から信頼件数分を適合画像として判定し前記適合画像以外の検索画像の中から適合画像の画像特徴量との相違度が小さい検索画像についてしきい値に基づいて再度の適合画像を探索する探索制御部4と、前記蓄積部3から各検索画像の画像特徴量を読み込み前記各検索画像の画像特徴量に対する前記適合画像の画像特徴量の相違度を測定する相違度測定部5を備えて構成する。
【選択図】図1
Description
例えば、非特許文献1及び非特許文献2に示された装置は、画像へのリンクタグ周辺のテキストに指定されたキーワードが含まれているHTMLを特定し、そのHTML内でリンクされた画像を検索する。その際、検索された画像には、キーワードとの関連度合いの高い順に検索順位を付けることが行われる。
また、非特許文献2で示された装置では、キーワードにより検索された複数画像を表示し、その中から所望の画像に近い画像をユーザが選択することで、更に画像を絞り込んで検索することが行われている。
また、Google(Google Inc.の商標名)のホームページにおいて既に運用されている実際の検索システムでは、その画像に対する評価結果(閲覧回数、そのページへの被参照リンク数等)も使って、検索された画像とキーワードとの関連度合いを複合的に推定することが行われている。
すなわち、非特許文献2の装置によれば、キーワードを指定して検索された画像の中からユーザが指定した画像と色の分布特徴が似ている画像を絞り込み画像を検索する。具体的には、各画像から抽出されるヒストグラムの類似性を考慮することにより実現するものである。
キーワードを指定することでHTML内の画像を検索し、前記画像に付与されたテキスト情報に対するテキスト解析に基づいて前記キーワードとの関連度を算出し、該関連度により順位が付与された複数の検索画像をWebから入力するWeb画像入力部。
前記Web画像入力部から収集した検索画像から色,形,模様といった低次元の画像信号値を測定して画像特徴量として出力する特徴量変換部。
前記特徴量変換部で出力された画像特徴量を一時的に保管する蓄積部。
前記関連度が大きい検索画像の上位から予め与えられた信頼件数の画像数を適合画像として判定し、前記適合画像以外の検索画像の中から適合画像の画像特徴量との相違度が小さい検索画像について与えられたしきい値に基づいて再度の適合画像を探索する探索制御部。
前記探索制御部による適合画像の探索結果に基づいて、前記蓄積部から各検索画像の画像特徴量を読み込み、前記各検索画像の画像特徴量に対する前記適合画像の画像特徴量との相違度を測定する相違度測定部。
前記特徴量変換部は、
画像から色,形,模様といった低次元の画像信号値を測定する信号測定部と、
前記信号測定部で測定された画像信号値の出現頻度の分布を計測し画像特徴量として出力する分布測定部と
を備えたことを特徴としている。
前記特徴量変換部は、
予め前記信号測定部に入力された様々な画像から測定された画像信号値の集合を、指定されたクラスタ数でクラスタリングし、各クラスタの代表ベクトルを算出するクラスタリング部と、
前記クラスタリング部で算出された代表ベクトルをCodebookとし、前記信号測定部で測定された前記検索画像の画像信号値を最近傍の代表ベクトルへと量子化するベクトル量子化部とを備え、
前記分布測定部は、前記ベクトル量子化部にて量子化された画像信号値の出現頻度の分布を計測して画像特徴量として出力することを特徴としている。
前記特徴量変換部から出力される画像特徴量の大きさを一定に正規化する正規化部を具備して成ることを特徴としている。
キーワードを指定することでHTML内の画像を検索し、前記画像に付与されたテキスト情報に対するテキスト解析に基づいて前記キーワードとの関連度を算出し、該関連度により順位が付与された複数の検索画像を取得する検索画像取得ステップ。
前記各検索画像から色,形,模様といった低次元の画像信号値を測定して画像特徴量として出力する特徴量取得ステップ。
前記関連度が大きい検索画像の上位から予め与えられた信頼件数の画像数を適合画像として判定する適合画像判定ステップ。
前記各検索画像の画像特徴量に対する前記各適合画像の画像特徴量との相違度を測定する相違度測定ステップ。
前記適合画像以外の検索画像の中から適合画像の画像特徴量との相違度が小さい検索画像について与えられたしきい値に基づいて再度の適合画像を探索する探索ステップ。
前記適合画像及び再度の適合画像を検索結果として出力する出力ステップ。
本発明の画像検索装置は、ネットワークを介してHTMLページに接続可能とすることで、HTMLファイルの内容を手掛かりとして、Web上から所望の画像を得るものである。
Web上のサーバには多数のHTMLファイルが蓄積されており、それらはネットワークを介して接続されている。HTMLはテキストと画像から構成され、同じHTML内のテキストの中に、画像の内容を的確に表すキーワードが含まれている場合が多い。
本発明は、キーワードを指定することでWeb上から所望の画像を検索するに際して、HTML内のテキストのみを解析して画像を検索する従来の画像検索方法に付加的に作用する画像検索方法を新たに提供することで、誤差の少ない検索結果となるように補正する。
また、Web画像入力部10では、後述する画像信号値の量子化のため、ユーザによるキーワードの入力に伴う画像入力とは別に、Web画像もしくは別途撮影された画像から予め様々な種類の画像を収集画像として画像特徴部変換部1に取り込むことが行われる。
また、予め取り込む収集画像は、Web画像入力部10によりWebから取り込むのではなく、例えば記録媒体等に記録された多数のサンプル画像を呼び出し、画像特徴部変換部1の信号測定部11に直接入力するような構成であってもよい。
この信号測定部11で行われる画像信号値の算出は、公知の技術で実現される。具体的な実現手段としては、例えば、Loweらによって提案されたSIFT(Scale-Invariant Feature Transform, Lowe, D. "Distinctive Image Features from scale-invariant keypoints," International journal of Computer Vision, Vol.60, No.2, pp. 91-110, 2004)を用いることができる。この場合、図2のSIFT特徴量に示されるように、画像信号値は128次元のベクトルとして出力される。
(A)キーポイントの検出
(a)キーポイント候補点の検出
(b)キーポイントのローカライズ
(B)特徴ベクトルの抽出
(c)オリエンテーションの算出
(d)特徴量の抽出
記録部13は、クラスタリング部12で算出されたセントロイド(代表ベクトル)をCodebookとして記憶するものである。
(1)データを指定された任意の数であるk個のクラスタに分割する。
(2)各クラスタについて重心を計算する。
(3)全てのデータについて、重心との距離を最小にするクラスタを求め、各データを最小のクラスタに割り当てる。
(4)前回のクラスタから変化がなければ終了する。変化がある場合は、(2)に戻る。
例えば、Web画像入力部10で検索された複数(検索総数)の検索画像の一つが図4のような画像であった場合、信号測定部11で特徴点を抽出して画像信号値を算出し、この画像信号値が図5(b)に示されるように量子化される。
この際、様々な収集画像から抽出された画像信号値を用いることにより、自然画像として出現しうる画像信号値の分布を求め、その中から代表的な画像信号値を各クラスタのセントロイド(代表ベクトル)として抽出することになる。
ベクトル量子化部14において、信号測定部11で算出した検索画像の画像信号値をベクトル量子化することにより、分布測定部15で得られる画像特徴量について、雑音の影響による僅かな画像特徴量の変動であれば許容し、雑音の影響に耐性を持たせ、かつ画像の種類により明確な差がはっきりと識別されるようにした画像特徴量に変換することが可能となる。
適合画像の抽出処理は、次のようにして行われる。
Web画像入力部10において、テキスト解析に基づいて検索された検索画像の中の検索上位の画像には、統計的に下位よりも指定されたキーワードに適合している画像が多く含まれる。蓄積部3に蓄積されたキーワードとの関連度が上位の検索画像と画像特徴量が類似している画像についても、指定されたキーワードに適合している画像であると考えられる。そこで、テキスト解析に基づいて検索された検索画像の中からこれらの画像だけを検索結果として提示することによって、より誤りの少ない結果に補正できると考えられる。
検索総数nは、キーワード入力によるテキスト解析に基づいて検索され、画像特徴量変換部1により画像特徴量を算出し、蓄積部3に一時的に蓄積された検索画像の総数である。
初期信頼画像数(信頼件数)mは、テキスト解析に基づいて検索された検索画像の関連度の上位から指定されたキーワードに適合していると判定する検索画像の数である。
しきい値tは、キーワードに適合していると判定された検索画像以外の検索画像の中から、適合画像(適合していると判定された画像)の画像特徴量との相違度が小さい画像を探索する場合における指標であり、画像同士の画像特徴量の相違度がしきい値tより小さい場合に、両者の画像が似ていると判断する。
相違度算出の信号を出力するテキスト解析に基づいて検索された検索画像の関連度の上位から与えられた初期信頼画像数(信頼件数m)の分だけを適合画像と判定する。
初期信頼画像数(信頼件数m)による適合画像以外の検索画像の中から適合画像の画像特徴量との相違度が小さい画像を、与えられたしきい値tに基づいて探索する各処理が行われる。
また、各検索画像に対する画像特徴量は正規化部2で正規化されているので、画像特徴量間の相違度に対する判定を常に一定の尺度で行うことができる。
図6における×印は画像特徴量を示し、関連度の順位を示す数字を合わせて記述している。初期信頼画像数(信頼件数)m=3であることから、上位1〜3の数字は指定されたキーワードに適合した適合画像とし、○で印した。
すなわち、適合画像と判断された1〜3の検索画像のそれぞれを中心として、適合画像の球体に対して一定範囲(半径がしきい値t=0.10)内に存在する検索画像を新たな適合画像として抽出する。
図7中、円弧は探索範囲の球体を示し、円弧の半径はしきい値t=0.10の長さを有している。相違度測定部5では、図7中の表に示されるように、適合画像1〜3に対する各検索画像1〜10の相違度がそれぞれ算出される。
例えば、適合画像1と検索画像4の画像特徴量の相違度は0.39であることを示している。なお、表内で()で示される相違度は、既にそれまでに算出済みであるため、新たに算出する必要はない。
探索制御部4からは、適合画像と判定された検索画像1,2,3,5,7,9が検索結果として提示(出力)される。
t´=t/Cnt
と設定することにより(Cntは探索回数)、探索が進むほど探索範囲は狭くなり、指定されたキーワードに一致していない画像が適合画像と判定されるのを防止することができる。この例では、Cntを探索回数(整数)としたが、探索回数に比例する数であればよく、整数でなくともよい。
画像検索装置は、ネットワークを介してHTML内の画像にアクセス可能なパーソナルコンピュータ(PC)に画像検索プログラムがインストールされることで構築されている。
取り込んだ複数の収集画像について、指定クラスタ数が入力されたクラスタリング部12で指定クラスタ数に応じた複数のセントロイド(代表ベクトル)を算出し、それぞれCodebookとして記録部13に記録する。
図13の画像検索装置では、クラスタリング部12,記録部13及びベクトル量子化部14を省略した構成となっている。
この例によれば、画像信号値についてのベクトル量子化を行わないため、Web画像入力部10により、様々な種類の画像を収集画像として取り込むこと(収集画像取込ステップ)も不要となる。
その後の正規化部2による正規化、蓄積部3への検索画像の各画像特徴量の一時的な蓄積、探索制御部4による適合画像の抽出、相違度測定部5における相違度の算出については、図1の画像検索装置と同様の処理が行われる。
すなわち本発明によれば、HTML内のテキストのみを解析して画像を検索する従来の画像検索装置等によりキーワードを指定して検索された画像の中から、キーワードとの関連度が高い検索上位の画像と画像特徴量が類似している画像を検索結果として提示することにより、誤差の少ない検索結果に補正することができ、キーワードの入力だけで精度良好に画像検索を行うことが可能となる。
Claims (8)
- ネットワークを介してHTMLページに接続可能としたシステムにおいて、
キーワードを指定することでHTML内の画像を検索し、前記画像に付与されたテキスト情報に対するテキスト解析に基づいて前記キーワードとの関連度を算出し、該関連度により順位が付与された複数の検索画像をWebから入力するWeb画像入力部と、
前記Web画像入力部から収集した検索画像から色,形,模様といった低次元の画像信号値を測定して画像特徴量として出力する特徴量変換部と、
前記特徴量変換部で出力された画像特徴量を一時的に保管する蓄積部と、
前記関連度が大きい検索画像の上位から予め与えられた信頼件数の画像数を適合画像として判定し、前記適合画像以外の検索画像の中から適合画像の画像特徴量との相違度が小さい検索画像について与えられたしきい値に基づいて再度の適合画像を探索する探索制御部と、
前記探索制御部による適合画像の探索結果に基づいて、前記蓄積部から各検索画像の画像特徴量を読み込み、前記各検索画像の画像特徴量に対する前記適合画像の画像特徴量との相違度を測定する相違度測定部と
を具備することを特徴とする画像検索装置。 - 前記特徴量変換部は、
画像から色,形,模様といった低次元の画像信号値を測定する信号測定部と、
前記信号測定部で測定された画像信号値の出現頻度の分布を計測し画像特徴量として出力する分布測定部と
を備えた請求項1に記載の画像検索装置。 - 前記特徴量変換部は、
予め前記信号測定部に入力された様々な収集画像から測定された画像信号値の集合を、指定されたクラスタ数でクラスタリングし、各クラスタの代表ベクトルを算出するクラスタリング部と、
前記クラスタリング部で算出された代表ベクトルをCodebookとし、前記信号測定部で測定された前記検索画像の画像信号値を最近傍の代表ベクトルへと量子化するベクトル量子化部とを備え、
前記分布測定部は、前記ベクトル量子化部にて量子化された画像信号値の出現頻度の分布を計測して画像特徴量として出力する
請求項2に記載の画像検索装置。 - 前記特徴量変換部から出力される画像特徴量の大きさを一定に正規化する正規化部を具備して成る請求項1乃至請求項3のいずれかに記載の画像検索装置。
- ネットワークを介してHTMLページに接続可能としたシステムにおいて、
キーワードを指定することでHTML内の画像を検索し、前記画像に付与されたテキスト情報に対するテキスト解析に基づいて前記キーワードとの関連度を算出し、該関連度により順位が付与された複数の検索画像を取得する検索画像取得ステップと、
前記各検索画像から色,形,模様といった低次元の画像信号値を測定して画像特徴量として出力する特徴量取得ステップと、
前記関連度が大きい検索画像の上位から予め与えられた信頼件数の画像数を適合画像として判定する適合画像判定ステップと、
前記各検索画像の画像特徴量に対する前記各適合画像の画像特徴量の相違度を測定する相違度測定ステップと、
前記適合画像以外の検索画像の中から適合画像の画像特徴量との相違度が小さい検索画像について与えられたしきい値に基づいて再度の適合画像を探索する探索ステップと、
前記適合画像及び再度の適合画像を検索結果として出力する出力ステップと
を具備することを特徴とする画像検索方法。 - 前記相違度測定ステップ及び探索ステップは、新たな適合画像が探索されなくなるまで、複数回繰り返して行う請求項5に記載の画像検索方法。
- 前記探索ステップを繰り返して行うに際して、前記しきい値を順次小さく設定する請求項6に記載の画像検索方法。
- 請求項5に記載した各ステップをコンピュータに実行させる画像検索プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009266476A JP5435566B2 (ja) | 2009-11-24 | 2009-11-24 | 画像検索装置、画像検索方法及び画像検索プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009266476A JP5435566B2 (ja) | 2009-11-24 | 2009-11-24 | 画像検索装置、画像検索方法及び画像検索プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011113130A true JP2011113130A (ja) | 2011-06-09 |
JP5435566B2 JP5435566B2 (ja) | 2014-03-05 |
Family
ID=44235444
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009266476A Expired - Fee Related JP5435566B2 (ja) | 2009-11-24 | 2009-11-24 | 画像検索装置、画像検索方法及び画像検索プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5435566B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013175771A1 (ja) * | 2012-05-24 | 2013-11-28 | パナソニック株式会社 | 画像検索システム及び画像検索方法 |
JP2013246544A (ja) * | 2012-05-24 | 2013-12-09 | Hitachi Ltd | 画像検索装置、画像検索方法 |
JP2015001884A (ja) * | 2013-06-17 | 2015-01-05 | 新日鉄住金ソリューションズ株式会社 | 候補提示装置、候補提示方法及びプログラム |
JP2016167236A (ja) * | 2015-03-10 | 2016-09-15 | 富士ゼロックス株式会社 | 画像処理装置及びプログラム |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0944518A (ja) * | 1995-08-02 | 1997-02-14 | Adoin Kenkyusho:Kk | 画像データベースの構築方法と、画像データベースの検索方法及び検索装置 |
JPH10289240A (ja) * | 1997-04-14 | 1998-10-27 | Canon Inc | 画像処理装置及びその制御方法 |
JP2005107931A (ja) * | 2003-09-30 | 2005-04-21 | Ricoh Co Ltd | 画像検索装置 |
-
2009
- 2009-11-24 JP JP2009266476A patent/JP5435566B2/ja not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0944518A (ja) * | 1995-08-02 | 1997-02-14 | Adoin Kenkyusho:Kk | 画像データベースの構築方法と、画像データベースの検索方法及び検索装置 |
JPH10289240A (ja) * | 1997-04-14 | 1998-10-27 | Canon Inc | 画像処理装置及びその制御方法 |
JP2005107931A (ja) * | 2003-09-30 | 2005-04-21 | Ricoh Co Ltd | 画像検索装置 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013175771A1 (ja) * | 2012-05-24 | 2013-11-28 | パナソニック株式会社 | 画像検索システム及び画像検索方法 |
JP2013246544A (ja) * | 2012-05-24 | 2013-12-09 | Hitachi Ltd | 画像検索装置、画像検索方法 |
JP2013246550A (ja) * | 2012-05-24 | 2013-12-09 | Panasonic Corp | 画像検索システム及び画像検索方法 |
CN104380288A (zh) * | 2012-05-24 | 2015-02-25 | 松下知识产权经营株式会 | 图像检索系统以及图像检索方法 |
JP2015001884A (ja) * | 2013-06-17 | 2015-01-05 | 新日鉄住金ソリューションズ株式会社 | 候補提示装置、候補提示方法及びプログラム |
JP2016167236A (ja) * | 2015-03-10 | 2016-09-15 | 富士ゼロックス株式会社 | 画像処理装置及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP5435566B2 (ja) | 2014-03-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Bagri et al. | A comparative study on feature extraction using texture and shape for content based image retrieval | |
Demir et al. | Hashing-based scalable remote sensing image search and retrieval in large archives | |
JP5503046B2 (ja) | 形状に基づく画像検索 | |
US8787680B2 (en) | Scalable near duplicate image search with geometric constraints | |
US7813561B2 (en) | Automatic classification of objects within images | |
US8892542B2 (en) | Contextual weighting and efficient re-ranking for vocabulary tree based image retrieval | |
JP5294342B2 (ja) | 物体認識用画像データベースの作成方法、処理装置および処理用プログラム | |
JP2014029732A (ja) | 画像の検索および読み出しに関する基準を用いて画像内容の描写を生成する方法 | |
KR20010053788A (ko) | 내용기반 이미지 검색 시스템 및 그 방법 | |
KR100706389B1 (ko) | 이미지 상호간의 유사도를 고려한 이미지 검색 방법 및장치 | |
JP5346756B2 (ja) | 画像分類装置 | |
Iakovidou et al. | Localizing global descriptors for content-based image retrieval | |
JP5094830B2 (ja) | 画像検索装置、画像検索方法及びプログラム | |
CN112818162B (zh) | 图像检索方法、装置、存储介质和电子设备 | |
JP5435566B2 (ja) | 画像検索装置、画像検索方法及び画像検索プログラム | |
Fengzi et al. | Neural networks for fashion image classification and visual search | |
Li et al. | Neural networks for fashion image classification and visual search | |
JP2007164633A (ja) | コンテンツ検索方法及び装置及びプログラム | |
JP6314071B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP6793925B2 (ja) | 検証装置、方法、及びプログラム | |
CN113343920A (zh) | 人脸识别照片的分类方法、装置、电子设备和存储介质 | |
JPH11250106A (ja) | 内容基盤の映像情報を利用した登録商標の自動検索方法 | |
KR20190023503A (ko) | 이미지 기반 특허 검색 장치 | |
AbdElrazek | A comparative study of image retrieval algorithms for enhancing a content-based image retrieval system | |
Sumathy et al. | Image Retrieval and Analysis Using Text and Fuzzy Shape Features: Emerging Research and Opportunities: Emerging Research and Opportunities |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120831 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130814 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130821 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131018 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131113 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131115 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131204 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131204 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5435566 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |