JP6445738B2 - 類似画像検索方法およびシステム - Google Patents

類似画像検索方法およびシステム Download PDF

Info

Publication number
JP6445738B2
JP6445738B2 JP2018507912A JP2018507912A JP6445738B2 JP 6445738 B2 JP6445738 B2 JP 6445738B2 JP 2018507912 A JP2018507912 A JP 2018507912A JP 2018507912 A JP2018507912 A JP 2018507912A JP 6445738 B2 JP6445738 B2 JP 6445738B2
Authority
JP
Japan
Prior art keywords
image
search
similarity
partial
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018507912A
Other languages
English (en)
Other versions
JPWO2017168601A1 (ja
Inventor
廣池 敦
敦 廣池
裕樹 渡邉
裕樹 渡邉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Publication of JPWO2017168601A1 publication Critical patent/JPWO2017168601A1/ja
Application granted granted Critical
Publication of JP6445738B2 publication Critical patent/JP6445738B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Processing Or Creating Images (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、画像を対象とした情報検索技術に関する。
近年、ネットワークのブロードバンド化、各種記憶装置の大規模化により、大規模な画像・映像を蓄積、管理し、それらを配信するサービスを実施することが可能となった。
このような大規模コンテンツを扱うシステムで重要となるのが検索技術である。検索技術として一般的なのは、画像・映像コンテンツと関連する付けられたテキスト情報に対する検索技術である。文書情報の検索技術では、1つ、ないしは、複数個のキーワードをクエリとして入力し、それが含まれるテキスト情報と関連づいた画像・映像を検索結果として返す形式が一般的である。また、画像自体から情報を抽出し検索する技術も存在する。特許文献1、特許文献2等に記載されているように、類似画像検索では、事前に、検索対象となる画像から、画像の持つ特徴を数値化した画像特徴量を抽出し、データベース化することによって高速の検索を実現している。
特許文献1には、検索対象画像を分割する複数の領域とクエリ画像を分割する複数の領域との組み合わせ毎に領域の類似性を示す領域類似度を算出し、クエリ画像内の領域毎に該領域に対応する領域類似度に基づき該領域の重要度を算出し、検索対象画像毎に該検索対象画像における各領域とクエリ画像における各領域との組み合わせに対応する領域類似度及び重要度に基づきクエリ画像との類似性を示す画像類似度を算出する構成が開示されている。
特開2013−254367号公報
特許文献1に開示された技術では、クエリ画像の部分領域の面積が相対的に小さい場合には、検索意図から外れた画像が多数ヒットしてしまう。
上記課題を解決するため、本発明は、クエリ画像に含まれる複数の部分領域を検出するステップと、検出された部分領域の特徴量を複数抽出するステップと、抽出された複数の特徴量とDBに予め複数格納される画像部分領域の特徴量とをそれぞれ対応付け、対応付けられた特徴量の類似度をそれぞれ算出するステップと、算出されたそれぞれの類似度に、クエリ画像に含まれる各部分領域の面積に応じて重み付けをするステップと、それぞれの部分領域の類似度に重み付け処理をした値の合計値に基づき、クエリ画像と検索対象画像との類似度を算出するステップと、を備える方法を提供する。
本発明によれば、クエリ画像の部分領域の面積が相対的に小さい場合には重みが小さくなる結果、検索意図から外れた画像がヒットする可能性を低減することが可能となる。
本発明の実施例のシステム構成図である。 本発明の実施例のシステム構成の詳細図である。 本発明の実施例で用いた着目領域検出技術の説明図である。 本発明の実施例で用いた着目領域検出技術おける対称軸の説明図である。 微分フィルタの例である。 輝度勾配強度分布特徴量の説明図である。 本発明の実施例における着目領域検出処理の流れを示す図である。 着目領域検出処理の詳細を説明する図である。 着目領域検出処理おける詳細化処理の説明図である。 着目領域検出結果を示すための模式図である。 部分領域に関してデータベース化される項目の一覧である。 類似検索処理の流れである。 部分領域に関する類似検索の結果を示すための模式図である。 方式1による部分領域の対応付けを行った結果を示すための模式図である。 方式2による部分領域の対応付けを行った結果を示すための模式図である。 実施例2のサービスを実現するシステムのシステム構成図である。 実施例2のサービスにおいて画像に関してデータベース化される項目の一覧である。 実施例2のアプリケーションの画面構成の模式図である。
図1は、本発明の方式を画像検索サービスに適用した場合のシステム構成である。図1の100は、検索サービスを提供するための計算機システムである。検索サービスが提供する各種機能は、ネットワークシステム110を経由して、端末計算機120を用いるユーザに対して提供される。
図2は、検索サービスを提供するための計算機システム100の内部構成である。この図を用いて本発明が対象とする画像検索システムの処理フローを説明する。
まず、画像を登録する際の処理を説明する。画像を登録する際には、検索対象となる登録画像210を画像登録部211が受け付けた後、着目領域検出部212において、登録画像210から、着目するべき部分領域の集合が検出される。着目領域検出処理の詳細は図7で後述する。検出された各部分領域に対して、検索用特徴量抽出部213において画像特徴量が抽出される。抽出された画像特徴量は、部分領域と対応付けられた形式でデータベース220に保存される。
次に、画像を検索する際の処理を説明する。画像を検索する際には、与えられたクエリ画像230をクエリ画像受領部231が受け付けた後、着目領域検出部232において、クエリ画像230から、着目するべき部分領域の集合が抽出される。着目領域検出処理の詳細は、図7で後述する。次に、検出された各部分領域に対して、検索用特徴量抽出部213において画像特徴量が抽出される。なお、図2では説明の便宜のため着目領域検出部212と着目領域検出部232を分けて記載しているが、これらが計算機内の同一の処理部であっても良い。検索用特徴量抽出部213と検索用特徴量抽出部233についても同様である。
本発明の方式が適用されるのは、類似検索部234である。類似検索部234では、クエリ画像230の部分領域の画像特徴量の集合と、データベース220に格納された登録画像210の部分領域の画像特徴量の集合とから、類似画像検索の結果を構成する。最後に、検索結果出力部235において、類似画像検索の結果、および、データベース220に格納された各種情報を用いて、検索要求元に返すべき情報を生成し、検索結果240として検索要求元に送信する。
本実施例では、登録画像210の着目領域検出部212およびクエリ画像230の着目領域検出部222において、対象を限定しない着目領域の検出方式として、局所的な対称性を用いた検出方式を用いている。当該検出方法の詳細については図3で後述する。
図3は、局所的な対称性を評価するための画像特徴量の抽出に関する説明図である。画像301の中の任意の矩形部分領域302に対して、更に、3×3のブロック状に分割することによって、各ブロック領域の画像特徴量ベクトル群303を抽出する。。この9つの画像特徴量ベクトルをf00、f10、f20、f01、f11、f21、f02、f12、f22で示す。ここで、1番目の添え字は、各ブロックのx方向の位置、2番目の添え字は、y方向の位置である。
図4は、着目領域検出技術おける対称軸を示す図である。各ブロックの画像特徴量ベクトルに対して4つの軸を中心とした鏡映変換を考える。ここで、各軸を中心とした鏡映変換を画像特徴量ベクトルに対して適用するための行列を、T0、T1、T3、T4で表す。すなわち、T0は、左右に鏡映変換するための行列であり、T1は、右上45度の軸を中心に鏡映変換するための行列であり、T3は、上下に鏡映変換するための行列であり、T4は、右下45度の軸を中心に鏡映変換するための行列である。
各ブロック領域で抽出された画像特徴量ベクトルに対して、上記の変換行列を適用することによって、矩形部分領域内の対称性を評価することができる。例えば、左右対称性を評価するためには、y軸を中心として対称な位置に存在するf00とf20について、f20を左右に鏡映変換したベクトル、すなわち、f20にT0をかけたベクトルがf00と近ければ、対称性が高いと考えられる。同様に、f01とf21については、f21にT0をかけたベクトル、f02とf22については、f22にT0をかけたベクトルがそれぞれ近ければ、対称性が高いと考えられる。このようにして、左右対称性は、[数1]に示すような3つのベクトル間2乗距離から構成されるベクトルD0として表現することができる。
Figure 0006445738
同様に、右上45度の軸を中心とする対称性は、[数2]のD1として表現される。
Figure 0006445738
同様に、上下対称性は、[数3]のD2として表現される。
Figure 0006445738
同様に、右下45度の軸を中心とする対称性は、[数4]のD3として表現される。
Figure 0006445738
一方、本検出方式では、特徴量ベクトルの変換によって対称性が増大する時に対称性が高いと評価する。例えば、D0の算出で用いられるf00とf02が、元々、左右の鏡映変換に関して変動が小さい場合は、左右対称性が大きいとは考えない。このような性質を定量的に表現する補正項として、[数5]に示すような、鏡映変換を適用しない場合の対応するブロック領域間での特徴量ベクトル間の2乗距離から構成されるベクトルE0を定義する。
Figure 0006445738
同様に、D1に対する補正項E1は、次の[数6]のように表される。
Figure 0006445738
同様に、D2に対する補正項E2は、次の[数7]のように表される。
Figure 0006445738
同様に、D3に対する補正項E3は、次の[数8]のように表される。
Figure 0006445738
D0、D1、D2、D3、および、E0、E1、E2、E3を用いて、矩形部分領域の対称性を評価する。具体的な評価関数としては、[数9]を用いる。
Figure 0006445738
上記の評価関数では、4方向ごとの対称性を評価した後、その最大値を用いている。
次に、本方式で用いる輝度勾配ベクトルの強度分布に基づく画像特徴量について説明する。
図5は、数値微分を行うためのフィルタの例である。輝度勾配ベクトルは、白黒濃淡画像に対して、2次元の数値微分を適用することによって導出される。微分フィルタによって求められた画素位置(x,y)上の輝度勾配ベクトル(gx,gy)から、[数10]のように、ベクトルの方向θとベクトルの2乗ノルムpを算出することができる。
Figure 0006445738
ベクトルの方向θは、0度から360度の範囲に分布する。これを適切なレベルに等間隔に量子化し、2乗ノルムpを矩形領域内で集計することによって、輝度勾配ベクトル方向の強度分布をヒストグラム状のデータとして表現することができる。
図6は、輝度勾配強度分布特徴量を算出の概念を表現した模式図である。まず、画像から輝度勾配ベクトル601を抽出する。次に、集計処理によってヒストグラム状のデータ602を算出する。なお、本実施例では、量子化のレベル数は8とする。また、最初の量子化の値域の中心をx 軸方向に一致させる。
本特徴量において量子化のレベル数を8とすれば、各ブロック領域から8次元の画像特徴量ベクトルを抽出することとなる。この時の左右対称性を評価するための鏡映変換行列T0は[数11]のようになる。
Figure 0006445738
同様に、右上45度方向の軸を中心とする対称性を評価するための鏡映変換行列T1は[数12]のようになる。
Figure 0006445738
同様に、上下対称性を評価するための鏡映変換行列T2は[数13]のようになる。
Figure 0006445738
同様に、右下45度方向の軸を中心とする対称性を評価するための鏡映変換行列T3は[数14]のようになる。
Figure 0006445738
次に、図7を用いて、着目領域検出部212および着目領域検出部232の処理について説明する。
図7は、着目領域検出部の処理の流れを示した図である。
S701は、入力画像から、適切なスケールおよびアスペクトに変換した複数個の画像を生成する処理である。
S702は、生成した複数個の画像を、多重解像度化する処理である。
S703は、多重解像度化された画像に対して、走査処理によって、着目部分領域の候補となる矩形部分領域を生成し、各部分領域の対称性を算出する処理である。S701〜703の詳細は、図8で後述する。
S704は、走査処理によって生成される多数個の部分領域を、対称性の評価値に基づきソートし、着目すべき部分領域の候補を上位の所定件数に絞り込む処理である。
S705は、収束判定をする処理である。
S706は、S705にて収束しないと判定された場合に、詳細化処理によって、その時点の着目領域候補から新たに部分領域を生成し、各部分領域の対称性を算出することによって、着目領域候補の追加を行う処理である。S706の詳細は、図9で後述する。このようにして構成された着目領域候補に対して、再び対称性評価に基づく絞り込み(S704)を行う。収束判定705で着目領域の変動がない場合には、収束すると判定して処理を終了する。なお、S704からS706の繰り返し回数が一定数を越えた場合に収束すると判定し処理を終了してもよい。
図8は、図7のS701〜S703を図解したものである。
着目領域の検出では、応用分野に応じて、画像中の部分領域の大きさを適切に見積もる必要がある。特に、必要以上に小さな領域を部分領域として含めて考えると、不必要な部分領域が検出される結果、誤検出が増大するばかりではなく、処理時間も増大する。例えば、本方式の対称性評価における1ブロックの大きさを8×8画素とすれば、部分領域の大きさは24×24画素となる。仮に、着目するべき部分領域が、画像の大きさの10%程度までで十分とすれば、画像の大きさは、240×240画素程度で十分となる。
また、着目部分領域の形状は、必ずしも正方形のみではなく、横長、縦長の矩形領域の抽出が必要な場合も多い。本実施例では、横長の矩形を抽出する必要がある場合は、元画像のアスペクトを縦長に変形した上で、正方格子状のブロック分割による対称性の評価を行う。このような処理によって生成された矩形領域を元の画像上の座標系に戻せば、横長の矩形となる。同様に、縦長の矩形を抽出する必要がある場合は、元画像のアスペクトを横長に変形して処理を行う。
802は、上述の2つの観点から行われる処理がを示したものである。入力画像801に対して、画像の幅を半分に縮小した上でスケール変換した画像、アスペクト比を保持してスケール変換した画像、画像の高さを半分に縮小した上でスケール変換した画像、計3つの画像が生成されていることが示されている。
803は、多重解像度処理を示すものである。この処理では、各画像を1/2ずつ2段階まで縮小した画像を生成する。
810は、このようにして生成された9つの画像に対する走査処理を示すものである。この処理では、各画像内の矩形状の窓を一定画素数ずつ平行移動することによって、矩形領域を粗く生成する。 図9は、図7のS706を図解したものである。
S706では、ある着目部分領域の候補に対して、微小に縦横に平行移動した矩形領域910、微小に拡大縮小を行った矩形領域920、および、拡大縮小された矩形領域を更に縦横に平行移動した矩形領域を、新たな着目部分領域の候補として生成する。平行移動によって生成される矩形領域の数は、上下、左右、斜めの移動で8パターンである。拡大縮小で生成される矩形領域は2パターンで、拡大縮小それぞれの矩形領域の平行移動で、それぞれについて8パターンの矩形領域が生成される。合わせて、1つの種となる矩形領域に対して、最大で26パターンの新たな矩形領域が生成され、その対称性が評価される。
なお、先述したように、詳細化処理706は繰り返し実行される。各繰り返し処理における各微小変動量は、[数15]によって定義される。
Figure 0006445738
ここで、qは、詳細化処理の繰り返しの回数、sx、syは、それぞれ走査処理(S703)において平行移動を行った際の横方向、縦方向のステップ幅、dx、dyは、それぞれq回目の詳細化処理での横方向、縦方向の変動量である。一方、dzは、q回目の詳細化処理での拡大率で、縮小する場合の縮小率は、1/dzである。上式から明らかなように、変動の大きさは、本処理の繰り返しの回数に応じて小さくなる。対象となる画像は離散的なデジタル画像であるから、本処理を十分に繰り返せば、微小変動によって新たな領域候補が生成されることはなくなる。S704〜S706は、少なくとも新たな領域候補が生成されることがなくなれば、S705で収束と判定されて終了となる。
図10は、登録画像の着目領域検出部212およびクエリ画像の着目領域検出部232における部分領域検出結果を模式的に示したものである。画像1010から大きさが異なる多様な部分領域が検出される。1020はそれぞれの部分領域の集合である。部分領域の集合1020には、面積が小さい部分領域1021、面積が大きい部分領域1022が含まれる。これらについては、図15の説明中の数18の説明で後述する。
なお、部分領域の1つとして、元画像全体の領域を加えてもよい。これにより、画像全体の類似性を加味した検索を可能することもできる。
登録画像210の検索用特徴量抽出部213、および、クエリ画像230の検索用特徴量抽出部233において用いられる画像特徴量は、色分布、輝度勾配ベクトルの分布等に基づいて算出する。具体的な画像特徴量の定義例は、非特許文献1、非特許文献3等に開示されている。
このようにして登録画像210から抽出された部分領域に関する情報は、データベース220に格納される。
図11は、各部分領域に対して保存される情報のうち、本実施例における類似検索処理に関わる項目を列挙したものである。
項目1101は各部分領域がどの画像に含まれていたかを特定するための情報であり、整数値の画像IDとして表現する。項目1102は各矩形部分領域の座標値であり、左上端点、右下端点それぞれの座標値を4個の整数値として格納する。項目1103は各部分領域が元の画像の中で占める面積の比率である。例えば部分領域が元の画像と一致する場合には、最大値1.0となる。項目1004は形状情報を表現する画像特徴量、項目1005は色分布情報を表現する画像特徴量を、それぞれ示している。本実施例では、この2種の特徴量を用いているが、1種でも良いし、3種以上の特徴量を設定してもよい。
なお、クエリ画像に関する情報も、図11に示したのと同様の情報が抽出される。クエリ画像に関する情報は、メモリ上に一時的に保持する形式で、本実施例のアプリケーションは稼動可能である。ただし、同一のクエリ画像を用いて、検索条件が異なる検索要求が複数回発生する事態を想定した場合、毎回、クエリ画像の解析を行うのは効率が悪い。従って、クエリ画像に関する情報は、1つの検索処理を越えてキャッシュされていることが望ましい。一方、同時に多数の検索要求を受領するような規模の大きな運用を考えた場合、メモリ上でキャッシュを行うとメモリ消費が増大し適切ではない。そのような場合は、クエリ画像に関しても、一時的にデータベース上に情報を保存する形式を採用すると好適である。
なお、本実施例では、部分領域が矩形領域として定義されている例について説明するが、図12に示す方式では、部分領域の形状が矩形である必要はない。この場合に部分領域が必要とする要件は、画像特徴量が抽出可能であることと、領域の面積が定義されていることである。
図12は、類似検索部234における処理の流れを示したものである。S1201は、類似検索部234が、部分領域特徴量データベースを対象として類似検索を実行する処理である。本処理では、クエリ画像から検出された各部分領域の特徴量をクエリとする類似検索が、クエリ画像の部分領域の数だけ行われる。
S1202は、S1201で取得された検索結果の集合に基づき、クエリ画像の部分領域と各画像の部分領域との対応付けを行う処理である。詳細は図13で後述する。
S1203は、処理1202における対応付けの結果から、クエリ画像と各画像との距離を構成する処理である。
S1204は、処理1203で構成された距離をソートすることによって、類似画像検索結果を構成する処理である。
S1205は、検索結果出力部235に対して、その結果を引き渡す処理である。
なお、S1201では、クエリ画像の部分領域とデータベース上の部分領域との間の特徴量間の2乗距離を非類似性の指標として用いた類似検索結果を行う。クエリ画像のi番目の矩形領域と、データベース上に格納されたj番目の部分領域との特徴量空間上での2乗距離は[数16]のようになる。
Figure 0006445738
ここで、q_ikは、i番目の部分領域の画像特徴量のk番目の要素、f_jkは、データベース上のj番目の部分領域の画像特徴量のk番目の要素、Mは、画像特徴量の次元数である。
なお、本2乗距離は、データベース上の全部分領域に対して算出されるわけではない。本実施例では、類似検索の高速化のために、クラスタリング処理に基づく近似近傍ベクトル探索アルゴリズムを用いている。近似近傍ベクトル探索とは、データベース上のベクトル中で、クエリとなるベクトルの近傍範囲に存在すると想定されるベクトルを絞り込むことによって、探索の高速化を実現するものである。本実施例で用いているアルゴリズムは、クエリ近傍のN個のベクトルの近似解を2乗距離が小さい順序にソートした形式で検索結果として返す。従って、N個の結果中に含まれないデータベース上の部分領域との2乗距離の値は、その時点では不明である。
本発明の方式では、部分領域に関する類似検索の結果から、クエリ画像とデータベース上に格納された画像間の類似度を構成する。本構成は、クエリ画像の部分領域とデータベース上の各画像の部分領域間で対応付けを行い、部分領域ごとの類似度を画像ごとに集計することによって実現される。以下、図13を用いてその具体的な方法について説明する。
図13は、部分領域に関する類似検索の結果を示す模式図である。クエリ画像から検出された部分領域数をL、各部分領域に関する類似検索結果の件数をNとすれば、前述Sの1201により、L×N件の類似検索結果が取得される。図を分かりやすくするために、L=4、N=5としているが、実際には、より多数のクエリ画像の部分領域について、より多数の検索結果を取得する場合が多い。本実施例における類似検索の各結果1300は、算出された2乗距離、部分領域のID、および、その部分領域を含む画像のIDから構成される。なお、画像IDに関しては、類似検索を実施した後、部分領域IDを用いて、データベース上の情報を参照することによって、その値が取得される。図13中の表の各行は、クエリ画像の各部分領域をクエリとした類似検索の結果である。各行中の検索結果は、データベース上の部分領域がどの画像に含まれるかとは関係なく、2乗距離が小さい順序、すなわち、類似性が高い順序に整列されている。
前述のS1202では、この類似検索結果の集合から、クエリ画像の部分領域とデータベース上の各画像の部分領域の対応付けを行う。本実施例では、対応付けの方式として以下の2つの方式を備えており、システムの運用者、ないしは、検索するユーザが、どちらかを選択する。
第1の方式では、クエリ画像の各部分領域について、データベース上の各画像に含まれる部分領域の検索結果の集合中で1番距離が小さい検索結果を採用する。クエリ画像の異なる部分領域の検索結果に、同一のデータベース上の部分領域が含まれることがある。従って、第1の方式では、クエリ画像の異なる部分領域が、同一のデータベース上の部分領域と対応付けられる可能性がある。第1の方式の詳細は、図14で説明する。
図14は、図13に示した検索結果から、第1の方式によって行われた対応付けの結果である。検索結果には、1、2、5、6,7の画像IDが含まれているため、その5つの画像について、それぞれ、クエリ画像の部分領域と最も類似性が高い検索結果が選択されている。
第2の方式は、第1の方式とは異なり、同一のデータベース上の部分領域が多重に対応付けされることはない。第2の方式では、データベース上の画像ごとに、クエリ画像の全部分領域による検索結果を集めた集合を構成し、その集合を2乗距離が小さい順序にソートした上で、上位から順番に対応付けを行う。この時、対応付けに採用されたデータベース上の部分領域のIDを保持することによって、既に対応付けに採用された部分領域を排除して処理を進める。このようにして、2乗距離が小さい、すなわち、類似性が高いクエリ画像の部分領域とデータベース上の画像の部分領域の組を優先した、重複のない対応付けが可能となる。第2の方式の詳細は、図15で説明する。
図15は、図13に示した検索結果から、第2の方式によって行われた対応付けの結果である。例えば、3番目の部分領域の画像IDが1である画像に含まれる部分領域の対応付けでは、類似度がより上位であった部分領域のIDが2である部分領域が、1番目の部分領域との対応付けで使われているため、下位にあった部分領域の画像IDが3である部分領域と対応付けが行われている。また、4番目の部分領域では、該当する部分領域が存在しないため、画像IDが1の画像では対応付けが行われていない。
あるデータベース上の画像に着目した場合、クエリ画像の全ての部分領域について対応付けが行われることは一般的ではない。先に述べたように、部分領域の検索結果には、全ての部分領域との評価結果が含まれているわけではない。また、検出する部分領域の数は画像によって異なるため、重複した対応付けを行わない第2の方式では、原理的に、全ての対応付けが行われることはない。部分領域ごとの類似度からクエリ画像と各画像との類似度を構成する際に、部分領域ごとの類似度が確定していたなら、部分領域ごとの類似度の総和が高いものが、画像としての類似度も高いとする自然な仮定が成立する。部分領域ごとの類似度が部分的に不定で、かつ、不定となる部分領域の数が画像間で異なる場合、この不定となる部分領域の扱いが問題となる。
ある類似検索を行った場合に検索結果に含まれなかったデータは、検索結果中で最も類似性が低いデータよりも類似性が低いと推定するのは妥当である。そこで、本実施例では、不定となる部分領域に対して、各部分領域の検索結果中の最下位の検索結果の2乗距離の値を設定する。図13に示した類似検索結果の場合では、1番目の部分領域で不定の場合は、2乗距離0.80を、2番目の部分領域で不定の場合は、2乗距離0.60を、3番目の部分領域で不定の場合は、2乗距離0.50を、4番目の部分領域で不定の場合は、2乗距離0.70を、それぞれが不定となる場合の2乗距離として設定されている。
なお、別の設定方式としては、十分大きなデータベース上で統計的に2乗距離の統計量、例えば平均と分散を求め、その統計量に基づいた値を設定する方式もある。
上記一連の処理によって、クエリ画像に含まれる各部分領域とデータベース上の画像との2乗距離を、対応付けられた部分領域の2乗距離として定義することができる。このように定義されたクエリ画像の部分領域とデータベース上の画像との2乗距離に用いて、クエリ画像とデータベース上の画像との距離を[数17]のように定義する。
Figure 0006445738
ここで、D_iは、クエリ画像とデータベース上のi番目の画像との合成された2乗距離、Lはクエリ画像に含まれる部分領域の数、d_jiは、クエリ画像のj番目の部分領域とi番目の画像との2乗距離、S_jは、j番目の部分領域の面積がクエリ画像の面積に占める比率、Pは、S_jの効果を制御するパラメータである。一方、Zは、次式のように定義される正規化項である。
Figure 0006445738
本正規化項は、アプリケーション側でD_iの値を扱いやすくするためのもので、検索処理自体に影響を与えるものではない。
数17における制御パラメータPは、以下のような機能を果たす。
P=0.0の場合、全てのd_jiは、等価に重み付けられてD_iが算出される。Pを大きく設定すれば、面積比S_jが大きな部分領域のd_jiの値が重視されてD_iが算出される。図10の部分領域検出結果1020の例では、面積が小さい部分領域1021の類似性は低く評価され、面積が大きい1022部分領域の類似性が重視されることとなる。
なお、本実施例では、類似性の比較に非類似度である2乗距離を用いているが、類似性が高いと大きくなる類似度を用いる場合もある。類似度の例としては、例えば[数19]のような負の2乗距離を指数変換したものがある。
Figure 0006445738
数19の類似度は、2乗距離dが0.0で最大値1.0となり、dが大きくなると0.0に近づく。このような類似度を用いた場合でも、数16に示した方式が適用可能である。すなわち、画像間の類似度は、基本的には、部分領域間の類似度の総和として算出され、部分領域間の類似度が高いものが多ければ、画像間の類似度は高くなる。クエリ画像の部分領域の面積による重み付け加算の効果も、数17の場合と全く変わらない。
部分領域に対する類似検索結果に含まれる部分領域を含む全てのデータベース上の画像について、上記のD_iを算出した後で、D_iの値でソートすることによって、類似画像検索の結果を構成する。
なお、上述の説明では、検索クエリとして画像が与えられた場合について述べたが、データベース上に既に登録されている画像をクエリとして検索する場合もある。この場合は、図11に示した情報がデータベース上から取得可能なため、クエリ画像の解析は不要となる。従って、図2の類似検索部234から処理を開始することができる。
図16は、本実施例で説明する検索サービスのシステム構成図である。本サービスは、検索システム1600が具備する機能をWebAPI1602によってユーザに提供するものである。検索システム1600のハードウェア構成に、検索対象の規模、および、検索要求頻度に応じて、適切なCPU数、メモリ量、ハードディスク量等の計算資源が割り当てられる。本システム上で稼動する各種プログラムは、プロセス間通信により、情報のやりとりを行う。
ユーザは、Webブラウザ1601を用いて、検索要求を発行する。検索要求は、本サービスのWebAPI1602によって受領され、その結果は、WebAPI1602のレスポンスとしてWebブラウザ1601に返される。図2の検索に関わる処理231、232、233、234、235は、Webサーバ1603上で行われる。Webサーバ1603は、受領しクエリ画像の解析結果を一時DBサーバ1604に送付し、一時DBサーバ1604は、その内容をファイルシステム上に保存する。一時DBサーバ1604については、システムの安定稼動のために冗長化が必要な場合は、複数個のプロセスを稼動させることができる。複数個の一時DBサーバのプロセスが稼動している場合は、Webサーバ1603は、最も負荷が小さい一時DBサーバを登録先として選択することができる。
図2の類似検索処理部234が行う処理の内、図12の「部分領域特徴量DBを対象とする類似検索」1201に相当する処理は、Webサーバ1603ではなく、検索サーバ1605で行われる。大規模データを対象とする場合は、検索サーバ1605を複数プロセス稼動させることによって、並列分散処理を行う。
図2の画像の登録に関わる処理211、212、213に相当する処理は、データ登録プログラム1606上で行われる。データ登録プログラム1606は、取得した登録画像の解析結果を検索サーバ1605送付し、検索サーバ1605は、その内容をファイルシステム上に保存する。
検索サーバ1605、および、一時DBサーバ1604において、部分領域に関して管理される情報は、図11に示したものと同様である。
図17は、各画像についてデータベース上で管理される項目の一覧である。項目1701は、その画像に含まれる部分領域IDの配列で、可変長の整数配列として管理される。項目1702は、画像の大きさで、縦横の画素数が2つの整数値として保存される。項目1703は、画像が登録された年月日で、整数値として管理される。項目1704は、絞り込み検索を行うためのキーワードである。項目1703と1704は、一時DBサーバ1604では使用されない。項目1705は、画像データ、項目1706は、サムネール画像で、両者ともに、検索結果画面の表示に用いられる。
本実施例では、単純な類似画像検索だけではなく、登録年月日1703、および、キーワード1704による検索対象の絞り込みと組み合わせた類似画像検索機能が提供される。本機能は、先ず、対象となる画像を検索条件式を評価することによって絞り込んだ後、部分領域IDの配列1701を参照することによって、部分領域の検索対象の絞り込みを行う。これによって、効率的な検索が可能となる。
図18は、Webブラウザ1601上に表示される検索用の画面の模式図である。
図18の1810は、検索条件設定のための画面である。1811は、クエリ画像を設定する領域であり、ユーザは、ドラッグアンドドロップ操作によって、自らのファイルシステム上に存在する任意の画像ファイルを画面上の領域1811に置くことにより、類似検索のクエリを設定する。ユーザが検索ボタン1812をクリックすると、画面遷移が発生し、検索結果画面1820が表示される。検索結果画面1820では、1811で指定したクエリ画像がサムネール画像化されて1821に表示され、類似検索の結果の一覧が、1822に表示される。ボタンの列1823は、ページ送りをするためのもので、より順位が低い、すなわち、類似性が低かった画像を閲覧するためのものである。また、1822に表示された画像をクリックすると、クリックされた画像をクエリとした類似検索が実行され、検索結果画面1820の内容が更新される。これによって、データベース上に登録された画像をクエリとした類似検索を行うことができる。
検索条件設定画面1810上の1813は、検索対象となる画像を登録年月日によって絞り込むためのGUI部品である。ユーザは、登録年月日の範囲を下限と上限を表す2つの数値によって入力することができる。入力がない場合は、登録年月日による絞り込みは行われない。また、例えば、下限のみを設定した場合は、入力された年月日以降から最新の登録画像までが検索対象となる。1814は、キーワードによる絞り込み条件を設定するためのGUI部品である。ユーザは、任意の文字列をテキストフィールドに入力することができる。入力がない場合は、キーワードによる絞り込みは行われない。なお、登録年月日による条件とキーワードによる条件の両者を設定した場合は、その論理積(AND)が絞り込み条件となる。
2つのトグルボタンから構成されるGUI部品1815は、類似検索に使用する画像特徴量を選択するためのものである。ユーザは、形状の類似性を重視した検索を行いたい場合は、「SHAPE」のラベルのついたボタンをチェックし、色の類似性を重視した検索を行いたい場合は、「COLOR」のラベルのついたボタンをチェックする。
スライドバー1816は、数16で示した、部分領域の面積の効果を制御するパラメータPの値を指定するためのGUI部品である。本実施例では、その値を0.0〜1.0の範囲で、ユーザが自由に設定することができる。ユーザは、クエリ画像を部分的に含むような画像を検索したい場合は、1.0に近い値を設定する。クエリ画像中に含む部分と共通するような部分を含む画像を検索したい場合は、0.0に近い値を設定する。
なお、本実施例では、本機能を実現するためのGUI部品として、連続量を指定するのに適したスライドバー1816を用いているが、実際に指定可能なのは、適切なレベルに量子化した値である。Pの値が変わると類似検索の結果は変化する。Webサーバ1603は、ページ切り替えボタン1823の操作に伴う画面遷移等への対応のために、同一の検索条件の検索結果をキャッシュしている。検索条件が変化した場合、新たなキャッシュを生成する必要があり、本質的な効果がないような微妙なPの変化に追随してキャッシュを生成することは、システム運用上から効率的ではない。本実施例では、WebAPIで受領したPの値を適切に量子化した上で、類似検索処理を行っている。また、量子化処理されることが前提なので、GUI部品としては、スライドバーでなく、量子化された値と対応したボタン列上での値の選択等の方式でも問題はない。
検索結果画面1820の領域1824には、検索条件設定画面1810の1813、1814、1815、1816と同様のGUI部品が配置されている。ユーザは、これらのGUI部品によって、クエリ画像を変えずに、他の検索条件のみを変更して検索を実施することができる。本検索は、検索ボタン1825をクリックすると実行され、検索結果画面1820の内容が更新される。
100:計算機システム 110:ネットワーク 120:端末計算機 210:登録画像 211:画像登録部 212:着目領域検出部 213:検索用特徴量抽出部 220:データベース 230:クエリ画像 231:クエリ画像受領部 232:着目領域検出部 233:検索用特徴量抽出部 234:類似検索部 235:検索結果出力部 240:検索結果 301:検出対象画像 302:矩形部分領域 303:ブロックごとの画像特徴量 601:輝度勾配ベクトル 602:輝度勾配ベクトルの強度分布 801:入力画像 802:スケールとアスペクトの変換 803:多重解像度化 810:走査処理 910:平行移動 920:拡大縮小 1010:画像 1020:部分領域検出結果 1021:面積が小さい部分領域の例 1022:面積が大きい部分領域の例 1101:画像ID 1102:矩形の座標値 1103:矩形の相対面積 1104:画像特徴量(形状) 1105:画像特徴量(色) 1600:検索システム 1601:Web ブラウザ 1602:Web API 1603:Webサーバ 1604:一時DBサーバ 1605:検索サーバ 1606:データ登録プログラム 1701:部分領域IDの配列 1702:画像サイズ 1703:登録年月日 1704:絞り込み用キーワード 1705:画像データ 1706:サムネール画像 1810:検索条件設定画面 1811:クエリ画像表示領域 1812:検索ボタン 1813:登録年月日範囲指定 1814:キーワード指定 1815:画像特徴量選択 1816:部分領域の面積の効果を制御するパラメータの設定 1920:検索結果表示画面 1921:クエリ画像表示領域 1922:検索結果表示領域 1923:ページ遷移ボタン 1924:検索条件指定 1925:検索ボタン

Claims (4)

  1. 着目領域検出部が、クエリ画像に含まれる複数の部分領域を検出する第1のステップと、
    特徴量抽出部が、検出された部分領域の特徴量を複数抽出する第2のステップと、
    類似検索部が、抽出された複数の特徴量とDBに予め複数格納される画像部分領域の特徴量とをそれぞれ対応付け、当該対応付けられた特徴量の類似度をそれぞれ算出する第3のステップと、
    類似検索部が、算出されたそれぞれの類似度に、クエリ画像に含まれる各部分領域の面積に応じて重み付けをする第4のステップと、
    類似検索部が、それぞれの部分領域の類似度に重み付け処理をした値の合計値に基づき、クエリ画像と検索対象画像との類似度を算出する第5のステップと、
    検索結果出力部が、第5のステップで算出した類似度に基づき検索した結果を表示部に出力する第6のステップと、
    を備え
    前記第1のステップは、前記クエリ画像を多重解像度化する処理と、複数の部分領域を生成する処理と、生成された複数の部分領域を対称性評価に基づき絞り込む処理と、を含む
    ことを特徴とする類似画像検索方法。
  2. 請求項に記載の類似画像検索方法において、
    前記第1のステップは、対称性評価に基づき絞り込まれた複数の部分領域の数が所定値以上である場合に詳細化された部分領域を生成して前記対称性評価の対象に追加する処理を含み、
    前記第2のステップは、対称性評価に基づき絞り込まれた複数の部分領域の数が所定値を下回る場合に実施される、ことを特徴とする類似画像検索方法。
  3. 請求項に記載の類似画像検索方法において、
    前記第2のステップは、前記対称性評価に基づく絞り込み試行回数が所定値以上になった場合に実施される、ことを特徴とする類似画像検索方法。
  4. クエリ画像に含まれる複数の部分領域を検出する着目領域検出部と、
    検出された部分領域の特徴量を複数抽出する特徴量抽出部と、
    抽出された複数の特徴量とDBに予め複数格納される画像部分領域の特徴量とをそれぞれ対応付け、対応付けられた特徴量の類似度をそれぞれ算出し、算出されたそれぞれの類似度に、クエリ画像に含まれる各部分領域の面積に応じて重み付けをし、重み付けをした値の合計値に基づきクエリ画像と検索対象画像との類似度を算出する類似検索部と、
    算出された類似度に基づき検索した結果を表示部に出力する検索結果出力部と、
    を備え
    前記着目領域検出部は、前記クエリ画像を多重解像度化する処理と、複数の部分領域を生成する処理と、生成された複数の部分領域を対称性評価に基づき絞り込む処理と、を行う
    ことを特徴とする類似画像検索システム。
JP2018507912A 2016-03-30 2016-03-30 類似画像検索方法およびシステム Active JP6445738B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2016/060291 WO2017168601A1 (ja) 2016-03-30 2016-03-30 類似画像検索方法およびシステム

Publications (2)

Publication Number Publication Date
JPWO2017168601A1 JPWO2017168601A1 (ja) 2018-08-16
JP6445738B2 true JP6445738B2 (ja) 2018-12-26

Family

ID=59963680

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018507912A Active JP6445738B2 (ja) 2016-03-30 2016-03-30 類似画像検索方法およびシステム

Country Status (2)

Country Link
JP (1) JP6445738B2 (ja)
WO (1) WO2017168601A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11481431B2 (en) 2019-10-18 2022-10-25 Fujifilm Business Innovation Corp. Search criterion determination system, search system, and computer readable medium

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7333894B2 (ja) * 2021-09-01 2023-08-25 三菱電機株式会社 部品特定装置、部品特定方法及び部品特定プログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5230525B2 (ja) * 2009-05-25 2013-07-10 キヤノン株式会社 画像検索装置およびその方法
JP2010286960A (ja) * 2009-06-10 2010-12-24 Nippon Telegr & Teleph Corp <Ntt> 食事log作成装置、食事log作成方法および食事log作成プログラム
JP6336827B2 (ja) * 2014-06-05 2018-06-06 株式会社日立製作所 画像検索装置、画像検索方法および検索システム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11481431B2 (en) 2019-10-18 2022-10-25 Fujifilm Business Innovation Corp. Search criterion determination system, search system, and computer readable medium

Also Published As

Publication number Publication date
JPWO2017168601A1 (ja) 2018-08-16
WO2017168601A1 (ja) 2017-10-05

Similar Documents

Publication Publication Date Title
Da Silva et al. Active learning paradigms for CBIR systems based on optimum-path forest classification
JP4859025B2 (ja) 類似画像検索装置、類似画像検索処理方法、プログラム及び情報記録媒体
JP6393230B2 (ja) オブジェクト検出方法及び画像検索システム
Liu et al. RGB-D joint modelling with scene geometric information for indoor semantic segmentation
JP6680956B1 (ja) 検索ニーズ評価装置、検索ニーズ評価システム、及び検索ニーズ評価方法
CN102902807A (zh) 使用多个视觉输入模态的视觉搜索
CN109299305A (zh) 一种基于多特征融合的空间图像检索系统及检索方法
CN101556611B (zh) 一种基于视觉特征的图片搜索方法
JP2019057329A (ja) 高速直交射影
WO2023221790A1 (zh) 图像编码器的训练方法、装置、设备及介质
JP5337673B2 (ja) 画像検索システム
Pedronette et al. A graph-based ranked-list model for unsupervised distance learning on shape retrieval
Adate et al. Understanding single image super-resolution techniques with generative adversarial networks
JP6445738B2 (ja) 類似画像検索方法およびシステム
CN107622071A (zh) 通过间接相关反馈在无查源下的衣服图像检索系统及方法
CN114821140A (zh) 基于曼哈顿距离的图像聚类方法、终端设备及存储介质
CN110135769A (zh) 货品属性填充方法及装置、存储介质及电子终端
KR100849631B1 (ko) 문서 그룹화 시스템과 그 그룹화 방법 및 이를 기록한기록매체
Guo Research on sports video retrieval algorithm based on semantic feature extraction
Xia et al. Clothing classification using transfer learning with squeeze and excitation block
Guo et al. Saliency detection on sampled images for tag ranking
JP6924450B2 (ja) 検索ニーズ評価装置、検索ニーズ評価システム、及び検索ニーズ評価方法
JP2016014990A (ja) 動画像検索方法、動画像検索装置及びそのプログラム
Phadikar et al. A comprehensive assessment of content-based image retrieval using selected full reference image quality assessment algorithms
JP6336827B2 (ja) 画像検索装置、画像検索方法および検索システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180301

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20181002

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181030

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20181120

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181129

R150 Certificate of patent or registration of utility model

Ref document number: 6445738

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150