JPWO2016147260A1 - 画像検索装置、及び画像を検索する方法 - Google Patents

画像検索装置、及び画像を検索する方法 Download PDF

Info

Publication number
JPWO2016147260A1
JPWO2016147260A1 JP2017505775A JP2017505775A JPWO2016147260A1 JP WO2016147260 A1 JPWO2016147260 A1 JP WO2016147260A1 JP 2017505775 A JP2017505775 A JP 2017505775A JP 2017505775 A JP2017505775 A JP 2017505775A JP WO2016147260 A1 JPWO2016147260 A1 JP WO2016147260A1
Authority
JP
Japan
Prior art keywords
image
propagation
query
feature
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017505775A
Other languages
English (en)
Other versions
JP6371465B2 (ja
Inventor
裕樹 渡邉
裕樹 渡邉
廣池 敦
敦 廣池
健一 米司
健一 米司
信尾 額賀
信尾 額賀
直人 秋良
直人 秋良
智明 吉永
智明 吉永
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Publication of JPWO2016147260A1 publication Critical patent/JPWO2016147260A1/ja
Application granted granted Critical
Publication of JP6371465B2 publication Critical patent/JP6371465B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5838Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Processing Or Creating Images (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

登録済み画像と、前記登録済み画像の1種類以上の特徴量と、前記登録済み画像の同種の特徴量間のリンクを示す伝搬情報と、を保持する画像データベースから画像を検索する画像検索装置は、第1画像及び第1画像の1種類以上の特徴量を取得し、画像データベースに登録し、第1画像の各種類の特徴量について、登録済み画像の当該種類の特徴量それぞれと、の間の類似同一性を示す伝搬強度を算出し、第1画像の当該種類の特徴量と、第1画像の当該種類の特徴量との間の伝搬強度が最大である登録済み画像の当該種類の特徴量と、のリンクを、伝搬情報に含める。

Description

本発明は、画像検索装置、及び画像を検索する方法に関する。
テレビ画像のデジタルアーカイブ化やインターネット上の動画配信サービスの普及により、大規模な画像データを高速に検索・分類する必要性が増加している。また、セキュリティ向けに蓄積された監視画像の解析に対する期待が高まっている。これらの膨大な画像に対して人手でテキスト情報を付与することが困難なことから、画像中の特徴量を用いた画像検索技術が求められている。
これまでに大規模、高速な類似画像検索システムが実用化されつつあり、事前に画像特徴量を抽出してデータベース化することで、クエリ画像に見た目の類似する画像を高速に探し出す技術が提案されている。
本技術分野の背景技術として、特開2010−250529(特許文献1)がある。特許文献1には、「画像検索装置は、画像データベースと、クエリ画像を受け付ける検索要求受付手段と、画像データベースに登録されている画像の中から、クエリ画像と類似する類似画像を抽出する類似画像検索手段と、クエリ画像の周囲に類似画像を配置するとともに、クエリ画像と類似画像間を連結表示した検索結果を表示手段に提示する検索結果提示手段と、を備える。そして、検索結果提示手段は、前記検索要求受付手段によって新たなクエリ画像が受け付けられた場合には、表示手段に過去に提示した検索結果の連結表示を保持しつつ、その検索結果に新たなクエリ画像による検索結果を追加して表示手段に提示する。」と記載されている(要約参照)。
特開2010−250529号公報
特許文献1に記載の検索システムは、ユーザとのインタラクションによって検索結果を更新していく。具体的には、特許文献1に記載の検索システムは、ユーザが指定したクエリ画像によって得られた検索結果に含まれる画像を、新たなクエリ画像とする検索を繰り返す。これにより、ユーザが適切にクエリ画像を指定すれば目的の検索対象に関するバリエーションに富んだ検索結果が得られる可能性がある。
しかし、特許文献1に記載の検索システムにおいて、ユーザが、特定の見た目の画像ばかりをクエリとして選択してしまう場合には、検索対象を網羅的に見つけ出すことがかえって困難になるおそれがある、つまり検索の網羅性がユーザ操作に影響される。
上記課題を解決するために、本発明は例えば請求の範囲に記載の構成を採用する。本願は上記課題を解決する手段を複数含んでいるが、その一例を挙げるならば、登録済み画像と、前記登録済み画像の第1種類を含む1種類以上の特徴量と、前記登録済み画像の同種の特徴量間のリンクを示す伝搬情報と、を保持する画像データベースから画像を検索する、画像検索装置であって、第1画像及び前記第1画像の前記1種類以上の特徴量を取得し、前記画像データベースに登録する画像取得部と、前記第1画像の各種類の特徴量について、前記登録済み画像の当該種類の特徴量それぞれと、の間の類似同一性を示す伝搬強度を算出し、前記第1画像の当該種類の特徴量と、前記第1画像の当該種類の特徴量との間の伝搬強度が最大である登録済み画像の当該種類の特徴量と、のリンクを、前記伝搬情報に含める属性伝搬部と、前記画像データベースが保持する前記登録済み画像の特徴量から第1種類の第1特徴量を取得し、前記第1特徴量を含む入力クエリを生成するクエリ入力部と、前記伝搬情報が示す対応に基づいて、前記第1特徴量を出発点とした、前記登録済み画像の特徴量をたどる探索を行い、前記探索における経路上の特徴量を有する登録済み画像の第1種類の特徴量を含む追加クエリを生成する、クエリ補強部と、前記入力クエリ及び前記追加クエリを使用して、前記画像データベースから画像を検索する、画像検索部と、を含む画像検索装置。
本発明の一態様によれば、高精度かつ網羅的に画像を検索することができる。上記した以外の課題、構成及び効果は、以下の実施形態の説明により明らかにされる。
実施例1において、画像検索システムの構成例を示すブロック図である。 実施例1において、画像検索システムのハードウェア構成例を示すブロック図である。 実施例1における画像データベースの構造例を示す図である。 実施例1において、属性伝搬情報の生成する過程の例を説明する図である。 実施例1において、属性伝搬情報の生成する過程の例を説明する図である。 実施例1において、属性伝搬情報の生成する過程の例を説明する図である。 実施例1において、属性伝搬情報の生成処理の一例を示すフローチャートである。 実施例1において、属性伝搬情報を用いた画像検索の例を説明する図である。 実施例1において、属性伝搬情報を用いた画像検索の処理の一例を示すフローチャートである。 実施例1における検索画面の一例を示す図である。 実施例1において、システム全体の処理の一例を示すシーケンス図である。 実施例2において、画像検索システムの構成例を示すブロック図である。 実施例2におけるアノテーション画面の構成例である。 実施例2において、アノテーション処理の一例を示すフローチャートである。 実施例1において、クラスタリングと属性伝搬について説明する図である。
以下、添付図面を参照して本発明の実施形態を説明する。本実施形態は本発明を実現するための一例に過ぎず、本発明の技術的範囲を限定するものではないことに注意すべきである。各図において共通の構成については同一の参照符号が付されている。
<本実施形態例の概要>
本実施形態の画像検索装置は、新規に登録する画像から所定の1種類以上の属性の特徴量を抽出し、抽出した各種類の属性の特徴量と、登録済み画像それぞれの同種の属性の特徴量と、を比較する。画像検索装置は、当該比較によって、類似性が高い又は特徴量が同一であると判定した特徴量間のリンクを含む伝搬情報、を蓄積する。当該リンクは、同一種類の特徴量を介した、画像間のリンクと考えることもできる。本実施形態において、特に区別する必要が無い場合においては、特徴量間のリンク(伝搬)を、画像間のリンク(伝搬)として記載することもある。なお、本実施形態における画像とは、動画及び静止画を含む概念である。
なお、属性とは、画像を構成するパーツを示し、例えば、画像に人物が含まれる場合、当該人物の腕や頭などの部位それぞれは、属性の一例である。特徴量とは、各属性が有する画像の特徴を示す値である。特徴量の具体例については、後述する。本実施形態において、属性の特徴量を、単に特徴量と呼ぶこともある。
伝搬情報は、例えば、伝搬元の画像と伝搬先の画像を示す情報、特徴量の種類、及び伝搬強度を含む。伝搬強度については後述する。この結果、画像間のリンクを表すグラフ構造が形成される。本実施形態において、グラフはツリーを含む概念である。画像検索装置は、グラフ構造をたどることにより、クエリ画像に直接は類似していない画像を探索することができる。
画像検索装置は、検索時にこの伝搬情報を利用し、例えば、与えられたクエリのクエリ画像にリンクする複数の画像をデータベースから取得し、取得した画像をクエリ画像としたクエリを当該与えられたクエリに加えることにより、検索クエリを補強する。画像検索装置は、補強されたクエリを使用して類似画像検索を行い、その検索結果を統合することで、検索精度、及び網羅率を向上することができる。
<システム構成>
図1は、実施例1の画像検索システム100の構成例を示すブロック図である。画像検索システム100は、入力画像の1種類以上の特徴量に対して、類似性の高い当該種類の特徴量を有する登録済み画像とのリンクを伝搬情報として蓄積し、伝搬情報を用いてクエリを補強し、補強したクエリによる検索を行うことで検索精度及び網羅率を向上させる。
画像検索システム100は、例えば、画像記憶装置101、入力装置102、表示装置103、及び画像検索装置104を含む。画像記憶装置101は、静止画データまたは動画データを保存する記憶媒体であり、例えば、コンピュータ内蔵のハードディスクドライブ、または、NAS(Network Attached Storage)もしくはSAN(Storage Area Network)などのネットワークで接続されたストレージシステムを用いて構成される。また、画像記憶装置101は、例えば、カメラから継続的に入力される画像データを一時的に保持するキャッシュメモリであってもよい。
入力装置102は、例えば、マウス、キーボード、タッチデバイスなどの、ユーザの操作を画像検索装置104に伝えるための入力インタフェースである。表示装置103は、例えば、液晶ディスプレイなどの出力インタフェースであり、画像検索装置104の認識結果の表示、ユーザとの対話的操作などのために用いられる。
<各部の動作>
画像検索装置104は、画像記憶装置101に蓄積された画像から検索に必要な情報を抽出しデータベース化する、登録処理を行う。また、画像検索装置104は、ユーザが入力装置102から指定した検索クエリを用いて、画像データベース108から検索クエリに類似する画像を検索し、表示装置103に情報提示する、検索処理を行う。
画像検索装置104は、画像から1種類以上の属性の特徴量を抽出し、画像データベース108に登録する。また、画像検索装置104は、登録した画像の特徴量と登録済みの他の画像との同種の特徴量とを比較し、類似性の高い又は同一の特徴量間に伝搬情報を付与して画像データベースに蓄積する。
画像検索装置104は、画像入力部105、特徴量抽出部106、属性伝搬部107、画像データベース108、伝搬情報蓄積部109、クエリ入力部110、クエリ補強部111、及び画像検索部112を含む。
画像入力部105は、画像記憶装置101から、静止画データまたは動画データの入力を受け付け、入力されたデータのデータ形式に応じて、入力されたデータを画像検索装置104内部で使用するデータ形式に変換する。例えば、画像入力部105は、動画データの入力を受け付けた場合、画像入力部105は、例えば、フレーム(静止画データ形式)に分解する動画デコード処理を行う。
また、画像入力部105は、必要に応じて、例えばユーザからの指示等に従って、入力された画像から部分領域の抽出処理を行ってもよい。具体的には、例えば、画像入力部105は各フレームから人物の領域を抽出し、抽出した領域の画像を内部で使用するデータとしてもよい。画像入力部105によって処理された画像データは、特徴量抽出部106へ送られる。なお、画像入力部105は特徴量の入力を併せて受け付け、入力された特徴量を画像データベース108に登録してもよい。このとき、画像検索装置104は、特徴量抽出部106を含まなくてもよい。
特徴量抽出部106は、入力された各画像から、1種類以上の属性の特徴量を抽出する。特徴量は、画像の特徴を示す画像間で比較可能な値であり、例えば、固定長のベクトルで表現される。画像の色や形状などの見た目の情報を数値化したデータである画像特徴量は、属性の特徴量の一例である。また、画像間で比較可能な値であれば任意の画像情報を特徴量とすることができる。前述の人物画像の例であれば、人物画像の形状や色などの画像特徴量に加えて、フレーム間の動体追跡によって得られる動体IDを属性の特徴量として用いてもよい。画像と特徴量を含む画像情報は、画像データベース108に登録される。
特徴量抽出部106は、例えば、画像データベース108に画像特徴量を登録する際に、高速検索を目的として、データのクラスタリング処理を行ってもよい。特徴量抽出部106は、例えば、k−meansアルゴリズムなどのクラスタリング処理によって、類似度の高い特徴量を有する1以上の登録データからなるクラスタを生成する。類似度は、同種の2つの特徴量間の類似性を示す指標であり、例えば、値域が[0,1]の所定の減少関数に2つの特徴量間の距離を代入することにより得られる。
画像データベース108は、例えば、クラスタの代表値(例えばクラスタメンバの平均ベクトル)とクラスタメンバのIDを記録する。画像検索装置104は、検索時において、例えば、検索クエリの特徴量とクラスタの代表値とを比較し、類似度の高いクラスタに対してのみ、検索クエリと当該クラスタのメンバとの間で特徴量比較を行うことで、処理回数を削減し高速に探索することができる。
属性伝搬部107は、登録済みの各画像の特徴量と、新規に登録された画像の同種の特徴量と、を比較し、例えば、伝搬強度の高い特徴量間のリンクを伝搬情報として画像データベース108に記録する。伝搬強度は、同種の2つの特徴量間の類似性、又は同一性を示す指標である。例えば、2つの特徴量が一致する場合の値が1、2つの特徴量が一致しない場合の値が0、となる関数によって与えられる値は、伝搬強度の一例である。従って、特徴量間に類似性が定義できない場合であっても、伝搬強度を定義することができる。また、上述した類似度も伝搬強度の一例である。画像が複数の属性を持つ場合は、属性伝搬部107は、例えば、属性の数だけ伝搬情報を生成する。以下に、属性の特徴量の例を挙げる。
(1)上述したように、色や形状など画像そのものの見た目の情報を数値化した画像特徴量は特徴量の一例である。例えば、画像特徴量間の類似度が所定の閾値以上である場合に、属性伝搬部107は当該画像間に伝搬情報を生成し、当該類似度を伝搬強度とする。
(2)動体トラッキングなどの時系列画像認識結果における、物体IDは特徴量の一例である。連続フレームにおける同一物体は、同一のIDを有する。例えば、属性伝搬部107は、同一物体IDを含む2つのフレームが存在する場合、各フレームの同一物体IDにおいて伝搬情報を生成し、伝搬強度を1.0とする。
(3)定点観測画像における、位置を示す情報は特徴量の一例である。例えば、定点観測画像が所定のグリッドで区切られている場合、属性伝搬部107は、別時刻間の同一位置のセルにおいて伝搬情報を生成し、伝搬強度を1.0とする。
(4)ユーザ指定のタグは、特徴量の一例である。属性伝搬部107は、例えば、ユーザ指定のタグが付与された画像と、当該画像のタグ付けの手がかりにした参照画像との間に伝搬情報を生成する。属性伝搬部107は、例えば、当該画像と参照画像との間における、他の特徴量の類似度を算出し、算出した類似度を当該伝搬強度とする。属性伝搬部107は、例えば、同一のタグを有する画像間に伝搬情報を生成し、伝搬強度を1.0としてもよい。タグによる伝搬情報の生成処理についての詳細は後述する。
(5)検索履歴は特徴量の一例である。属性伝搬部107は、例えば、繰り返し検索の操作ログを参照し、検索クエリ画像と検索結果画像との間に伝搬情報を生成し、例えば、画像の検索に用いられた特徴量間の類似度を伝搬強度とする。
図13は、属性伝搬及びクラスタリングによる特徴量空間の構造化を比較するための図である。クラスタリングは代表ベクトルを中心とした特徴量グループを形成するのに対して、属性伝搬は特徴量間のリンクを表すグラフを形成する。画像検索装置104は、属性伝搬を用いることにより、特徴量空間上で離れた場所にある画像間のリンクを得ることができる。伝搬情報の生成方法については、図4A〜図4Cを用いて後述する。
画像データベース108は、上記した登録処理で得られた画像情報を保持する。また、画像データベース108は、伝搬情報を蓄積する伝搬情報蓄積部109を含む。伝搬情報蓄積部109は、画像データベース108の外に配置されてもよい。例えば、クライアント装置の主記憶が伝搬情報を蓄積してもよく、このとき画像検索装置104は、ユーザ毎に一時的にことなる伝搬情報を利用することができる。
画像データベース108は、特徴量を保存し、画像検索部112は、その特徴量を用いた類似画像検索行う。類似画像検索は、クエリと特徴量が近い順にデータを並び替えて出力する機能である。画像検索部112は、例えば、ベクトル間のユークリッド距離を用いて特徴量を比較する。画像データベース108の構造について、詳しくは図3を用いて後述する。以上が、画像検索装置104の登録処理における各部の動作である。次に、画像検索装置104の検索処理における各部の動作を説明する。
クエリ入力部110は、ユーザが入力装置102を介して指定したクエリを受け付ける。クエリが登録済みデータのIDである場合は、画像データベース108から特徴量を取得し、クエリとして外部から画像が与えられた場合は、特徴量抽出部106と同様の処理により画像から特徴量を得る。クエリ補強部111は、画像データベース108に蓄積された伝搬情報を用いて、入力クエリに関連する登録データを取得し、追加クエリとする。
画像検索部112は、入力クエリ及びクエリ補強部111で得られた追加クエリを用いて、画像データベース108に対して類似画像検索処理を行う。画像検索部112は、各クエリから得られた検索結果を、類似度順に並び替え、同一のIDのデータに関しては順位の低い結果のみを残すなどの集約処理を行う。またこの際、クエリ補強部111で追加されたクエリの結果については、必要に応じて類似度に重み付けをしてもよい。クエリ補強と画像検索に関しては、図6を用いて後述する。表示装置103は、以上の検索処理によって得られた検索結果を表示することで、検索結果をユーザに提示する。
図2は、本実施例の画像検索システム100のハードウェア構成例を示すブロック図である。画像検索装置104は、例えば、一般的な計算機によって実現される。例えば、画像検索装置104は、相互に接続されたプロセッサ201及び記憶装置202を有してもよい。記憶装置202は、任意の種類の記憶媒体によって構成される。例えば、記憶装置202は、半導体メモリと、ハードディスクドライブとの組み合わせによって構成されてもよい。
なお、画像入力部105、特徴量抽出部106、属性伝搬部107、画像データベース108及び伝搬情報蓄積部109、クエリ入力部110、クエリ補強部111、並びに画像検索部112といった機能部は、例えば、プロセッサ201が記憶装置202に格納された処理プログラム203を実行することによって実現される。言い換えると、上記の各機能部が実行する処理は、処理プログラム203に基づいて、プロセッサ201によって実行される。また、画像データベース108のデータは、例えば記憶装置202に含まれる。
画像検索装置104は、さらに、プロセッサ201に接続されたネットワークインターフェース装置(NIF)204を含む。画像記憶装置101は、例えば、ネットワークインターフェース装置204を介して画像検索装置104に接続された、NASまたはSANであってもよい。画像記憶装置101は、記憶装置202に含まれてもよい。
図3は、本実施例の画像データベース108の構成及びデータ例を示す説明図である。なお、本実施形態において、システムが使用する情報は、データ構造に依存せずどのようなデータ構造で表現されていてもよい。図3はテーブル形式の例を示しているが、例えば、テーブル、リスト、データベース又はキューから適切に選択したデータ構造体が、情報を格納することができる。
画像データベース108は、例えば、画像情報を保持する画像テーブル300と、画像間のリンクを保持する伝搬情報テーブル310と、を含む。図3の各テーブル構成及び各テーブルのフィールド構成は、あくまで一例であり、例えばアプリケーションに応じてテーブル及びフィールドが追加されてもよい。また、同様の情報を保持していれば、テーブル構成を変えてもよい。例えば、画像テーブル300と伝搬情報テーブル310とが結合されひとつのテーブルであってもよい。
画像テーブル300は、例えば、画像IDフィールド301、画像データフィールド302、及び属性1特徴量フィールド303を含む。また特徴量抽出部106が画像から複数種類の属性の特徴量を抽出する場合は、画像テーブル300は複数の特徴量フィールドを含む。図3の画像テーブル300は、2つの属性の特徴量が抽出された例であり、属性2特徴量フィールド304を含む。
画像IDフィールド301は、各画像データの識別番号を保持する。画像データフィールド302は、例えば、検索結果を表示する際に用いられる画像データをバイナリで保持する。属性1特徴量フィールド303及び属性2特徴量フィールド304それぞれは、該当する種類の特徴量を保持する。特徴量は、例えば、固定長のベクトルデータで与えられる。また、特徴量は、例えば、属性2特徴量フィールド304が保持する特徴量のように、画像間を比較可能であればスカラーデータであってもよい。
伝搬情報テーブル310は、例えば、伝搬情報IDフィールド311、属性IDフィールド312、伝搬元フィールド313、伝搬先フィールド314、及び伝搬強度フィールド315を含む。伝搬情報IDフィールド311は、画像間の属性伝搬の識別番号を保持する。属性IDフィールド312は、伝搬対象となる属性の特徴量のIDを保持する。属性の特徴量のIDは、アプリケーションで管理されてもよいし、テーブルを含むデータベースで管理されてもよい。
伝搬元フィールド313は、属性の伝搬元となる画像IDを保持する。伝搬先フィールド314は、属性の伝搬先となる画像IDを保持する。伝搬強度フィールド315は、伝搬の強度もしくは信頼度の数値を保持する。伝搬強度は、例えば伝搬元と伝搬先の特徴量ベクトル間の距離が近いほど大きな値となる。なお、伝搬情報テーブル310は、例えば伝搬が生成された時刻を記録するフィールドをさらに含んでもよい。
本実施例の画像検索装置104は、登録時に構築された伝搬情報を用いて追加クエリを生成し、入力クエリに追加クエリを加えた検索クエリを用いて検索を行うことで、画像検索の網羅性を高めることができ、画像検索や画像データベース108の分析の効率を向上させることができる。
図4A〜図4Cは、登録処理において伝搬情報が生成される過程を説明する図である。図4A〜図4Cは、画像の追加による画像データベース108の状態が状態1〜状態3に変化する過程を示す。また、図4A〜図4Cは、2つの特徴量間に類似度が定義でき、類似度を伝搬強度として採用する例を示す。以下、画像IDがN(Nは自然数)の画像を、画像Nと表現する。
図4Aは、画像データベース108の状態が状態1である例を示す。状態1は、画像1が登録済みの画像テーブル300に対して、画像2が追加された状態を示す。属性伝搬部107は、同種の特徴量を比較し、類似度が所定の閾値以上であれば、伝搬情報を伝搬情報テーブル310に記録する。
図4Aの例において、属性1特徴量に関しては類似度が閾値以下であるため、属性伝搬部107は伝搬を行わない。また、属性2特徴量に関しては特徴量が一致している、即ち類似度が閾値以上であるため、属性伝搬部107は、伝搬情報411を記録する。具体的には、属性伝搬部107は、属性IDフィールド312に属性2特徴量の識別子を示す2を、伝搬元フィールド313に登録済み画像の画像IDである2を、伝搬先フィールド314に追加された画像の画像IDである1を、伝搬強度フィールド315に類似度1.0を、それぞれ格納する。
図4Bは、画像データベース108の状態が状態2である例を示す。状態2は、画像3が画像テーブル300に新たに登録された状態を示す。属性伝搬部107は、画像3と画像1の間の特徴量比較、及び画像3と画像2の間の特徴量比較を行う。図4Bの例では、画像3と画像1との間における属性1特徴量についての伝搬のみが起きる。従って、属性伝搬部107は、属性1特徴量に関して伝搬情報421を記録する。この結果、画像1と画像2の間で属性2特徴量に関する伝搬情報411が記録されており、さらに画像1と画像3の間で属性1特徴量に関する伝搬情報421が記録されているため、2つの伝搬情報により画像3と画像2に関係があることが示される。
図4Cは、画像データベース108の状態が状態3である例を示す。状態3は、さらに画像4、画像5、及び画像6が登録された状態を示す。図4Cに示すように属性の特徴量による伝搬情報で連結された複数のグラフ構造が形成される。なお、以上の処理において画像検索装置104は、前述のクラスタリングを用いて特徴量比較回数を削減したり、画像の登録時刻などの書誌データを用いて特徴量比較の対象となる画像を絞り込んだりしてもよく、このとき登録処理速度を向上させることができる。
図5は、本実施例の画像検索装置104が、画像記憶装置101から入力された動画または静止画から画像特徴量と画像間の伝搬情報を抽出し、画像データベース108に登録する処理の一例を示すフローチャートである。
画像入力部105は、画像記憶装置101から画像データを取得し、取得した画像データを必要に応じてシステム内部で利用可能な形式に変換し、画像データを画像テーブル300に記録する(S501)。画像入力部105は、例えば、動画データの入力を受け付けた場合、動画データをフレーム(静止画データ形式)に分解する動画デコード処理を行う。また、画像入力部105は、必要に応じて、部分領域の抽出処理を行ってもよい。
画像検索装置104は、例えばシステム設計事項として与えられた所定種類の各属性の特徴量について、ステップS503からステップS507の処理を繰り返す(S502)。特徴量抽出部106は、入力された画像から、当該種類の特徴量を計算する(S503)。特徴量抽出部106は、ステップS503で得られた特徴量を、画像テーブル300に登録する(S504)。特徴量抽出部106は、必要に応じて、例えば、画像テーブル300のレコード数が所定の閾値以上である場合、特徴量によるクラスタリング処理を行ってもよい。
属性伝搬部107は、ステップS503で得られた特徴量と、画像テーブル300に登録済みの各画像の同種の特徴量と、の間の伝搬強度を算出し、伝搬強度が閾値以上であるか否かを判定する(S505)。属性伝搬部107は、伝搬強度が閾値以上である登録済みの画像が存在すれば(S505:YES)、ステップS507を実行し、そうでなければ(S505:NO)、ステップS508に移動する。
属性伝搬部107は、伝搬強度が閾値である登録済み画像の特徴量と入力画像の特徴量とのリンク、を示す伝搬情報を伝搬情報テーブル310に記録する(S507)。ステップS503〜ステップS507の処理が実行されていない属性の特徴量があればステップS502に移動し、他の属性の特徴量に関する処理が行われる(S508)。全ての属性の特徴量に対してのステップS503〜ステップS507の処理が実行済みであれば、図5の処理が終了する。
図6は、本実施例の画像検索装置104が、ユーザから指定されたクエリを用いて画像データベース108に登録された画像を検索する処理の一例を示す図である。ユーザは、画像データベース108から所望の画像を検索するための、入力クエリを生成するための情報を入力する。入力クエリは、画像テーブル300が保持する画像の特徴量を含む。
クエリ入力部110は、例えば、画像テーブル300に含まれる画像の画像IDと特徴量の種類を示す情報との入力を受け付け、画像テーブル300から取得した当該画像IDと特徴量とからなる組み合わせを入力クエリとする。なお、入力クエリに含まれる画像IDに対応する画像をクエリ画像と呼ぶ。
また、クエリ入力部110は、例えば、外部から新たに与えられた画像と特徴量の種類との入力を受け付けてもよい。このとき、クエリ入力部110は、例えば、特徴量抽出部106と同様の処理により、当該与えられた画像から当該種類の特徴量を抽出し、例えば、画像テーブル300から、抽出した特徴量と最も類似度の高い特徴量を有する登録済み画像を1つ特定する。クエリ入力部110は、例えば、特定した登録済み画像の画像IDと当該登録済み画像の当該種類の特徴量とからなる組み合わせを、入力クエリとする。
図6は、入力クエリ601の画像IDが6、特徴量の種類が属性1特徴量である例を示す。なお、入力クエリ601は、複数種類の特徴量を含んでもよい。また、複数の画像がクエリ画像として指定されていてもよい。画像検索装置104は、伝搬情報テーブル310で定義された登録済み画像間のリンクを示す情報、即ち1以上のグラフからなるグラフ集合430の情報を保持している。クエリ補強部111は、入力クエリ601で指定されたクエリ画像の情報を含むグラフをグラフ集合430から選択し、クエリ画像の入力クエリ601で指定された特徴量を出発点として、リンクをたどることにより選択したグラフを探索する。
クエリ補強部111は、入力クエリ601で指定された画像6の属性1特徴量からリンク602をたどることにより、画像3を得る。クエリ補強部111は、得られた画像の特徴量から順にリンクをたどった経路上にある、画像6、画像3、画像1、及び画像2からなる一連の画像集合を得る。
なお、クエリ補強部111は、リンクをたどる際に、同一の画像内で、属性切り替え603を行って、切り替え先の特徴量のリンクをたどってもよい。クエリ補強部111が同一画像内で属性切り替え603を行うことにより、特徴量間の関連を維持しつつ検索の網羅率を向上させることができる。また、図6ではリンクを有向辺で表現しているが、リンクは無向辺であってもよい。つまり、画像検索装置104は、方向に従った探索を行ってもよいし、図6に示したように方向を無視した探索を行ってもよい。クエリ補強部111は、例えば、ダイクストラ法等の探索アルゴリズムを用いて、上述の探索を行う。
クエリ補強部111は、上述した探索によって得られた一連の画像の画像IDそれぞれと、当該画像における入力クエリと同種の特徴量と、からなる組み合わせである追加クエリを、入力クエリ601に加えたクエリを、検索クエリ604とする。なお、入力クエリ601が複数種類の特徴量を含む場合、クエリ補強部111は各特徴量を出発点とした探索を行い、各特徴量について補強クエリを生成する。
次に、画像検索部112は、検索クエリ604に含まれる各特徴量について、類似する特徴量を有する画像を画像テーブル300から検索する類似画像検索を行う。なお、検索クエリ604の各クエリが複数種類の特徴量を含む場合、画像検索部112は、例えば、複数種類の特徴量それぞれについて、当該種類の特徴量が類似する画像を検索してもよいし、当該複数種類の特徴量を総合して得られる特徴量が類似する画像を検索してもよい。画像検索部112は、画像IDと、当該画像IDの画像と検索元となったクエリ画像IDとの類似度と、の組み合わせとして、検索結果を得る。
画像検索部112は、例えば、得られた全ての検索結果を、類似度順に並び替えて、表示装置103に出力する。このとき、画像検索部112は、例えば、同一の画像IDの検索結果のうち、類似度が所定の閾値以上のもののみを出力してもよい。
また、画像検索部112は、検索結果を類似度順に並び替える際に、使用されたクエリ画像の入力クエリ画像からの伝搬強度に応じて、検索結果の類似度に重みを付けてもよい。画像3から画像6への伝搬強度は0.9であるため、画像検索部112は、例えば、画像3をクエリ画像とした検索結果の類似度に対して0.9を当該重みとして掛ける。
また、画像検索部112は、入力クエリ601のクエリ画像である画像6から複数の伝搬情報をたどって得られた検索結果の類似度に対して、例えば、当該複数の伝搬情報における伝搬強度の積を当該重みとして掛ける。また、画像検索部112は、属性切り替えが行われて得られた検索結果の類似度に対して、例えば、入力クエリである画像6の特徴量と当該検索結果の画像の特徴量との伝搬強度を算出し、算出した伝搬強度を当該重みとして掛けてもよい。画像検索部112が類似度に重みを付与することにより、ユーザが最初に指定した入力クエリ601のクエリ画像に近い画像の類似度が高くなる。
図7は、本実施の画像検索装置104が、ユーザから指定されたクエリを用いて画像データベース108に登録された画像を検索する処理の一例を説明するフローチャートである。以下、図7の各ステップについて説明する。
クエリ入力部110は、ユーザから入力クエリを生成するための情報を受け付け、入力クエリを生成する(S701)。クエリ入力部110は、登録済み画像IDと特徴量の種類との入力を受け付けた場合、画像テーブル300から当該画像IDを有する画像の当該種類の特徴量を取得する。クエリ入力部110は、外部の画像データと特徴量の種類の入力とを受け付けた場合、当該画像から抽出した当該種類の特徴量に類似する特徴量を有する画像の画像IDと、当該画像IDを有する画像の当該種類の特徴量と、を画像テーブル300から取得する。クエリ入力部110は、クエリ画像の画像IDとクエリ画像の所定の特徴量との組み合わせを入力クエリとして得る。
クエリ補強部111は、ステップS701で得られた入力クエリを、空のクエリ集合に追加する(S702)。クエリ補強部111は、クエリ集合に含まれる各クエリに対してステップS704からステップS706の処理を実行する(S703)。クエリ補強部111は、クエリ画像を伝搬元及び伝搬先とし、当該種類の特徴量に対応する属性IDを有する伝搬情報を伝搬情報テーブル310から取得する(S704)。
クエリ補強部111は、取得した伝搬情報に伝搬強度が閾値以上であるものが含まれるか否かを判定する(S705)。伝搬強度が閾値以上の伝搬情報があれば(S705:YES)、ステップS706を実行し、そうでなければ(S705:NO)ステップS707に移動する。クエリ補強部111は、例えば、システム所定の値か、ユーザが検索パラメータとして与えた値を、当該閾値として使用する。なお、当該閾値は、例えば、属性IDごとに異なる値であってもよい。
クエリ補強部111は、伝搬強度が閾値以上である画像をクエリ画像とするクエリをクエリ集合に追加する(S706)。なお、伝搬情報テーブル310に、伝搬が生成された時刻が記録されている場合、クエリ補強部111は、伝搬が生成された時刻が、現在時刻から所定時間以内である画像をクエリ集合から除外してもよい。
クエリ集合の全てのクエリに対してステップS704〜ステップS706の処理が実行済みであれば、ステップS708に移動し、ステップS704〜ステップS706の処理が実行されていないクエリがあればステップS704に戻り当該クエリに対して処理が行われる(S707)。
画像検索部112は、クエリ集合に含まれるすべてのクエリに対してステップS709からステップS710の処理を実行する(S708)。なお、画像検索部112は、例えば、伝搬強度が所定の閾値以上(当該閾値はステップS705の閾値より大きい値)のクエリ(類似性の高いクエリ)に関しては、ランダムに選択した所定数のクエリのみを処理し、残りのクエリに関してはステップS708〜ステップS709の処理をスキップしてもよい。伝搬強度が極端に高い2つのクエリそれぞれによる類似画像検索結果は、互いに酷似している可能性が高い。従って、画像検索部112は、例えば、伝搬強度が閾値より高い2つのクエリについては、一方のクエリのみについて検索処理を行うことにより、検索網羅率の低下を抑えつつ、検索時間を短縮することができる。
画像検索部112は、当該クエリを用いて画像検索を行い画像データベース108から類似画像を取得する。画像検索部112は、例えば、検索結果として類似画像IDと、当該クエリ画像の特徴量と類似画像の特徴量との類似度の組み合わせと、を得る(S709)。
画像検索部112は、ステップS709で得られた類似画像に入力クエリと該当クエリ間の伝搬強度に応じた重みを付与し、検索結果の集合に追加する(S710)。画像検索部112は、例えば、ユーザから指定された検索パラメータに従い、ステップS710の処理を実行するか否かを切り替えてもよい。
クエリ集合に含まれる全てのクエリに対して、ステップS709〜ステップS710の処理が実行済みであれば、ステップS712に移動し、ステップS709〜ステップS710の処理が実行されていないクエリがあれば、ステップS709に戻り当該クエリに対して処理が行われる(S711)。
画像検索部112は、検索結果を類似度(類似度に重みが付与された場合は、重み付与後の類似度)の高い順に並び替え、表示装置103に表示して処理を終了する(S712)。この際、画像検索部112は、同一画像IDの画像を含む複数の検索結果を得た場合、例えば、類似度が高い順に所定個数の検索結果のみを残して集約してもよい。
図8は、本実施例の画像検索装置104を用いて、画像検索を行うための操作画面の構成例を示す図である。操作画面は、例えば、表示装置103上でユーザに提示される。ユーザは、例えば入力装置102を用いて、画面上に表示されたカーソル800を操作することで、画像検索装置104に処理の指示を与える。
操作画面は、例えば、クエリ画像表示領域801、詳細オプション表示ボタン802、追加クエリ表示領域803、伝搬情報表示領域804、検索ボタン805、及び検索結果表示領域806を含む。クエリ画像表示領域801に表示される情報は、例えば、クエリ入力部110によって表示装置103に出力される。追加クエリ表示領域803及び伝搬情報表示領域804に表示される情報は、例えば、クエリ補強部111によって表示装置103に出力される。検索結果表示領域806に表示される情報は、例えば、画像検索部112によって表示装置103に出力される。
まず、ユーザは検索の手がかりとなる画像を指定する。操作画面は、例えば、登録画像選択のためのダイアログを表示してもよいし、外部の画像を入力するインタフェースを含んでもよい。ユーザが指定した画像は、クエリ画像表示領域801に表示される。
クエリ補強部111は、ユーザが指定したクエリ画像の伝搬情報を用いて、追加クエリ生成する。追加クエリ表示領域803は、例えば、生成した追加クエリの情報、例えば追加クエリのクエリ画像、特徴量等を表示する。追加クエリ表示領域803が追加クエリの情報を表示することにより、ユーザは追加クエリが適切であるかを判断することができる。なお、例えば、ユーザが詳細オプション表示ボタン802にチェックを入れた場合に、追加クエリ表示領域803は追加クエリの情報を表示してもよい。
伝搬情報表示領域804は、例えば、クエリ画像が伝搬元又は伝搬先である伝搬情報を表示する。伝搬情報表示領域804が伝搬情報を表示することにより、追加クエリがどのような経緯で得られたかを直感的にユーザに伝えることができる。追加クエリ表示領域803に表示された追加クエリが、追加クエリとして適切でないとユーザが判断した場合に、例えば、ユーザが追加クエリ表示領域803や伝搬情報表示領域804を操作してクエリを除外できるように、操作画面が構成されてもよい。
ユーザが検索ボタン805をクリックすると、画像検索部112は、画像データベース108に対して入力クエリ及び検索クエリを使用した類似画像検索を行う。検索結果は、例えば、類似度順に並び替えられ、同一画像IDを有する検索結果は集約されて、検索結果表示領域806に表示される。
図9は、本実施例の画像検索システム100の処理の一例を説明するシーケンス図である。図9は、具体的には上記した画像検索システム100の画像登録及び画像検索処理における、ユーザ900、画像記憶装置101、計算機901、及び画像データベース108間の処理シーケンスを示す。なお、計算機901は、画像検索装置104を実現する計算機である。ユーザ900は、例えば、入力装置102を介して、計算機901に対する要求及び指示の送信、並びにデータの入力等を行い、表示装置103を介して計算機901からの処理結果等の提示を受ける。
図9において、S910は登録処理を、S920は検索処理を示す。登録処理S910は、ステップS911〜ステップS916に示す処理を含む。ユーザ900が登録開始要求を出すと(S911)、計算機901は画像記憶装置101に画像データ取得要求を出し(S912)、画像記憶装置101から画像データを取得する(S913)。
以下に述べるステップS914〜ステップS916の処理は、図5において説明した一連の登録処理に相当する。計算機901は、取得した画像から特徴量を抽出し、特徴量と画像データとを画像データベース108に登録する(S914)。次に、計算機901は、取得した画像の特徴量と画像データベース108に登録済みの画像の同種の特徴量とを比較し、伝搬強度の高い特徴量同士のリンク及び当該リンクにおける伝搬強度を伝搬情報として画像データベース108に記録する(S915)。登録処理が終了すると、計算機901はユーザ900に対して登録完了の通知を行う(S916)。
検索処理S920は、ステップS921〜ステップS928に示す処理を含み、図7において説明した一連の検索処理に相当する。ユーザ900が、計算機901に対して検索要求を出すと(S921)、計算機901は、画像データベース108からクエリ画像のデータを読み出す(S922)。また、計算機901は、検索要求において外部から画像が与えられた場合、当該画像の特徴量を抽出し、例えば、当該特徴量における類似度が高い画像を画像データベース108から選択し、選択した画像をクエリ画像とする。
次に、計算機901は、伝搬情報を用いて画像データベース108を探索し、探索によって得られた画像をクエリ集合に追加する(S923)。追加されたクエリはユーザ900に提示され(S924)、ユーザ900は必要に応じてクエリを訂正し検索実行要求を計算機901に送る(S925)。計算機901は、クエリ集合の各画像特徴量を用いて類似画像検索を実行する(S926)。計算機901は、得られた検索結果を、類似度順に並び替え、同一画像IDを有する検索結果に関しては集約して(S927)、検索結果をユーザ900に提示する(S928)。
本実施例の画像検索装置104は、入力された画像の1種類以上の特徴量と登録済みの画像の特徴量とを比較し、類似性の高い画像間のリンクを表す伝搬情報を生成し、画像データベース108に記録する。画像検索装置104は、伝搬情報に基づいて入力クエリを補強することにより得られた検索クエリを用いて、類似画像検索を行うことで、検索精度を確保しつつ検索の網羅率を高めることができる。
実施例1の画像検索装置104は、画像の登録時に伝搬情報を生成するが、本実施例の画像検索装置104は、画像の登録後に伝搬情報を更新したり、新たな属性に対する伝搬情報を付与したりすることができる。
図10は、本実施例の画像検索システムの構成例を示すブロック図である。画像検索システム100は、画像検索を用いて属性の付与及び伝搬情報の更新を行う。本実施例の画像検索システム100は、実施例1の画像検索システム100の構成に加え、伝搬情報更新部1001を含む。伝搬情報更新部1001は、例えば、画像検索部112による検索処理において得られた検索結果に含まれる画像に対して属性及び伝搬情報を付与する。伝搬情報更新部1001は、クエリ画像と画像検索部112で得られた検索結果の画像との間に、例えばユーザの指示に従い、伝搬情報を付与する。
図11は、伝搬情報の追加機能を利用して画像に対するアノテーションを行うための画面構成例である。アノテーションは、画像を説明する単語や文章などのタグを画像に対して付与していく作業であり、タグによる画像の分類や検索、及びデータベースの解析等を目的として行われる。また、十分な数の画像とタグの組が得られれば、機械学習を用いることで未知の画像を認識する画像識別器を作ることができる。図11のアノテーション支援画面は、画像の類似性の自動判定だけでは正しいタグの付与が期待できない場合に、人の判断によってタグを伝搬させるための画面である。
アノテーション画面は、タグ入力領域1101、検索ボタン1102、参照画像表示領域1103、伝搬情報表示領域1104、タグ付け候補表示領域1105、及びタグ付けボタン1106を含む。参照画像表示領域1103及び伝搬情報表示領域1104に表示される情報は、例えば、クエリ補強部111によって表示装置103に出力される。タグ付け候補表示領域1105に表示される情報は、例えば、画像検索部112によって表示装置103に出力される。
ユーザがタグ入力領域1101にタグを入力し、検索ボタン1102をクリックすると、クエリ補強部111は、入力タグを持つ画像を参照画像として取得する。参照画像表示領域1103は参照画像を表示する。続いて画像検索部112は、各参照画像をクエリとした、入力タグ以外の所定の特徴量による類似画像検索を行い、入力タグが付与されていない類似画像を画像データベース108から取得する。
画像検索部112は、類似画像と類似度の組み合わせを含む検索結果を、例えば、類似度順に並び替える。検索結果は、タグ付与済みの画像に類似するため、同一のタグを付与すべき候補画像と考えることができる。タグ付け候補表示領域1105は、当該検索結果を表示する。また、例えば、クエリ補強部111は、伝搬情報テーブル310を参照して、参照画像と候補画像との間に伝搬情報を取得してもよい。伝搬情報表示領域1104は、クエリ補強部111が取得した伝搬情報を表示する。
伝搬情報表示領域1104が伝搬情報を可視化することで、例えば、ユーザが誤った候補提示の要因となる参照画像を発見しやすくなる。図11の例では、候補画像c、g、及びhは参照画像4との間に伝搬関係があり、参照画像4自体に誤ったタグが付与されている可能性がある。アノテーション画面はこのような画像をハイライト表示してもよい。
ユーザは、タグ付け候補表示領域1105に表示された画像をチェックし、入力タグを付与すべき画像を選択する。選択操作はマウスのドラッグ操作によって行われてもよいし、チェックボックスのクリックによって行われてもよい。次に、ユーザはタグ付けボタン1106をクリックし、選択された画像に対してタグを付与する。画像検索装置104は、選択された画像に対して入力タグを属性の特徴量として書き込み、参照画像との間に伝搬情報を追加する。
図12は、アノテーションの処理の一例を示すフローチャートである。以下、図12の各ステップについて説明する。クエリ入力部110は、ユーザが入力したタグを取得する(S1201)。
クエリ補強部111は、画像データベース108から入力タグが付与された画像を所定数取得し、取得した画像の画像IDと当該入力タグ以外の所定種類の特徴量との組み合わせからなる当該所定数のクエリをクエリ集合とする(S1202)。この際、クエリ補強部111は、伝搬情報を用いて、クエリ集合に含めるクエリ画像を選択してもよい。例えば、伝搬情報のある特徴量間における類似度は高いため、タグ付けの当該特徴量を有する画像は参照画像として冗長である可能性が高い。そこで、クエリ補強部111は、例えば、伝搬情報のグラフ構造上で隣接する画像については、例えば、当該画像の一方のみをクエリ画像として選択する。これにより、クエリ補強部111は、同一のタグを持つバリエーションに富んだ参照画像を得ることができる。
画像検索部112は、ステップS1202で得られた参照画像の所定種類の特徴量を用いて、類似画像検索を実行する(S1203)。画像検索部112は、例えば、類似度の高い順に検索結果を並び替え、同一の画像IDを有する検索結果を集約する。また、画像検索部112は、互いに類似する検索結果を集約して出力してもよく、これにより画像検索部112は、検索結果のバリエーションを確保しつつ、表示する検索結果の数を減らすことができる。
画像検索部112は、検索結果に含まれる画像をタグ付けの候補画像として表示装置103に表示する(S1204)。ユーザは、候補画像からタグ付け対象の画像を選択し、システムに伝える。この時、表示装置103は、候補画像が選択された時に、伝搬元又は伝搬先となる参照画像をハイライトするなどしてもよく、このときユーザが伝搬情報を確認しやすくなる。また、実施例1の方法で自動構築された伝搬情報と、ユーザが指定した伝搬情報が食い違った場合に、画像検索装置104は、アラートを出すようにしてもよい。
伝搬情報更新部1001は、ユーザが選択した画像に対してタグを付与する(S1205)。また、伝搬情報更新部1001は、参照画像それぞれに付与されたタグと、新規に付与されたタグと、の間に伝搬情報を追加する。即ち、伝搬情報更新部1001は、例えば、伝搬情報テーブル310の、属性IDフィールド312に入力タグを示すIDを、伝搬元フィールド313にクエリ画像の画像IDを、伝搬先フィールド314に当該選択した画像を、伝搬強度にユーザが指定した値(例えば1.0)を、格納する。
本実施例の画像検索装置104は、画像登録後に伝搬情報を更新することができる。特に、本実施例の画像検索装置104は、アノテーション作業におけるタグ付け候補画像を高精度かつ網羅的に検索することができる。
なお、本発明は上記した実施例に限定されるものではなく、様々な変形例が含まれる。例えば、上記した実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、ある実施例の構成の一部を他の実施例の構成に置き換えることも可能であり、また、ある実施例の構成に他の実施例の構成を加えることも可能である。また、各実施例の構成の一部について、他の構成の追加・削除・置換をすることが可能である。
また、上記の各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、上記の各構成、機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現してもよい。各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリや、ハードディスク、SSD(Solid State Drive)等の記録装置、または、ICカード、SDカード、DVD等の記録媒体に置くことができる。
また、制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。実際には殆ど全ての構成が相互に接続されていると考えてもよい。

Claims (14)

  1. 登録済み画像と、前記登録済み画像の第1種類を含む1種類以上の特徴量と、前記登録済み画像の同種の特徴量間のリンクを示す伝搬情報と、を保持する画像データベースから画像を検索する、画像検索装置であって、
    第1画像及び前記第1画像の前記1種類以上の特徴量を取得し、前記画像データベースに登録する画像取得部と、
    前記第1画像の各種類の特徴量について、前記登録済み画像の当該種類の特徴量それぞれと、の間の類似同一性を示す伝搬強度を算出し、前記第1画像の当該種類の特徴量と、前記第1画像の当該種類の特徴量との間の伝搬強度が最大である登録済み画像の当該種類の特徴量と、のリンクを、前記伝搬情報に含める属性伝搬部と、
    前記画像データベースが保持する前記登録済み画像の特徴量から、第1種類の第1特徴量を取得し、前記第1特徴量を含む入力クエリを生成するクエリ入力部と、
    前記伝搬情報が示す対応に基づいて、前記第1特徴量を出発点とした、前記登録済み画像の特徴量をたどる探索を行い、前記探索における経路上の特徴量を有する登録済み画像の第1種類の特徴量を含む追加クエリを生成する、クエリ補強部と、
    前記入力クエリ及び前記追加クエリを使用して、前記画像データベースから画像を検索する、画像検索部と、を含む画像検索装置。
  2. 請求項1に記載の画像検索装置であって、
    前記クエリ補強部は、前記探索において、同じ登録済み画像の異なる種類の特徴量をたどる、画像検索装置。
  3. 請求項1に記載の画像検索装置であって、
    前記画像データベースが保持する伝搬情報は、前記登録済み画像の同種の特徴量間のリンクそれぞれにおける伝搬強度を含み、
    前記属性伝搬部は、前記伝搬情報に含めたリンクにおける伝搬強度を、前記伝搬情報に含め、
    前記画像検索部は、
    前記入力クエリ及び前記追加クエリの特徴量それぞれと、前記登録済み画像の前記第1種類の特徴量それぞれと、の間の類似性を示す類似度を算出し、
    前記算出した類似度それぞれに、前記探索における経路上において、当該類似度の算出に用いられた前記入力クエリ及び前記追加クエリの特徴量と、前記第1特徴量と、の間に存在する前記伝搬情報が示す伝搬強度、に基づく重みを付与し、
    前記重みが付与された類似度に基づいて、前記画像データベースから画像を検索する、画像検索装置。
  4. 請求項1に記載の画像検索装置であって、
    前記画像データベースが保持する伝搬情報は、前記登録済み画像の同種の特徴量間のリンクそれぞれにおける伝搬強度を含み、
    前記属性伝搬部は、前記伝搬情報に含めたリンクにおける伝搬強度を、前記伝搬情報に含め、
    前記画像検索部は、前記入力クエリ又は前記追加クエリに含まれる特徴量の組み合わせであって、前記探索における経路上において、前記伝搬情報が示す伝搬強度が閾値以上である特徴量の組み合わせ、が存在する場合、前記組み合わせに含まれる特徴量の一方を使用して、前記画像データベースから画像を検索する、画像検索装置。
  5. 請求項1に記載の画像検索装置であって、
    前記クエリ補強部は、
    前記追加クエリの特徴量を有する登録済み画像それぞれを前記画像データベースから取得し、
    前記取得した登録済み画像それぞれと、前記探索における経路を示す情報と、を出力する、画像検索装置。
  6. 請求項1に記載の画像検索装置であって、
    前記1種類以上の特徴量は、画像に第1タグが付与されているか否かを示す第2種類の特徴量と、前記第2種類と異なる第3種類の特徴量と、を含み、
    前記クエリ補強部は、前記画像データベースから前記第1タグが付与されている登録済み画像を特定し、前記特定した登録済み画像それぞれの前記第3種類の特徴量を取得し、
    前記画像検索部は、前記取得した第3種類の特徴量それぞれを含むクエリを用いて、前記画像データベースからタグ付け候補画像を検索し、
    前記画像検索装置は、
    前記タグ付け候補画像に含まれる第2画像に前記第1タグを付与し、前記第2画像に付与された第1タグと、前記特定した登録済み画像に付与されている第1タグそれぞれと、のリンクを前記伝搬情報に含める、伝搬情報更新部を含む、画像検索装置。
  7. 請求項6に記載の画像検索装置であって、
    前記クエリ補強部は、
    前記特定した登録済み画像それぞれと、前記タグ付け候補画像の前記第3種類の特徴量と、を前記画像データベースから取得し、
    前記伝搬情報を参照して、前記取得した第3種類の特徴量それぞれと、前記タグ付け候補画像の前記第3種類の特徴量それぞれと、のリンクを取得し、
    前記特定した登録済み画像それぞれと、前記取得したリンクを示す情報と、を出力し、
    前記画像検索部は、前記タグ付け候補画像を出力する、画像検索装置。
  8. 画像検索装置が、登録済み画像と、前記登録済み画像の第1種類を含む1種類以上の特徴量と、前記登録済み画像の同種の特徴量間のリンクを示す伝搬情報と、を保持する画像データベースから、画像を検索する方法、であって、
    前記方法は、
    前記画像装置が、
    第1画像及び前記第1画像の前記1種類以上の特徴量を取得し、前記画像データベースに登録する手順と、
    前記第1画像の各種類の特徴量について、前記登録済み画像の当該種類の特徴量それぞれと、の間の類似同一性を示す伝搬強度を算出し、前記第1画像の当該種類の特徴量と、前記第1画像の当該種類の特徴量との間の伝搬強度が最大である登録済み画像の当該種類の特徴量と、のリンクを、前記伝搬情報に含める手順と、
    前記画像データベースが保持する前記登録済み画像の特徴量から第1種類の第1特徴量を取得し、前記第1特徴量を含む入力クエリを生成する手順と、
    前記伝搬情報が示す対応に基づいて、前記第1特徴量を出発点とした、前記登録済み画像の特徴量をたどる探索を行い、前記探索における経路上の特徴量を有する登録済み画像の第1種類の特徴量を含む追加クエリを生成する手順と、
    前記入力クエリ及び前記追加クエリを使用して、前記画像データベースから画像を検索する手順と、を含む方法。
  9. 請求項8に記載の方法であって、
    前記画像検索装置が、
    前記追加クエリを生成する手順において、前記探索において、同じ登録済み画像の異なる種類の特徴量をたどる、方法。
  10. 請求項8に記載の方法であって、
    前記画像データベースが保持する伝搬情報は、前記登録済み画像の同種の特徴量間のリンクそれぞれにおける伝搬強度を含み、
    前記方法は、
    前記画像検索装置が、
    前記含める手順において、前記伝搬情報に含めたリンクにおける伝搬強度を、前記伝搬情報に含め、
    前記検索する手順において、
    前記入力クエリ及び前記追加クエリの特徴量それぞれと、前記登録済み画像の前記第1種類の特徴量それぞれと、の間の類似性を示す類似度を算出し、
    前記算出した類似度それぞれに、前記探索における経路上において、当該類似度の算出に用いられた前記入力クエリ及び前記追加クエリの特徴量と、前記第1特徴量と、の間に存在する前記伝搬情報が示す伝搬強度、に基づく重みを付与し、
    前記重みが付与された類似度に基づいて、前記画像データベースから画像を検索する、方法。
  11. 請求項8に記載の方法であって、
    前記画像データベースが保持する伝搬情報は、前記登録済み画像の同種の特徴量間のリンクそれぞれにおける伝搬強度を含み、
    前記方法は、
    前記画像検索装置が、
    前記含める手順において、前記伝搬情報に含めたリンクにおける伝搬強度を、前記伝搬情報に含め、
    前記検索する手順において、前記入力クエリ又は前記追加クエリに含まれる特徴量の組み合わせであって、前記探索における経路上において、前記伝搬情報が示す伝搬強度が閾値以上である特徴量の組み合わせ、が存在する場合、前記組み合わせに含まれる特徴量の一方を使用して、前記画像データベースから画像を検索する、方法。
  12. 請求項8に記載の方法であって、
    前記画像検索装置が、
    前記追加クエリの特徴量を有する登録済み画像それぞれを前記画像データベースから取得する手順と、
    前記取得した登録済み画像それぞれと、前記探索における経路を示す情報と、を出力する手順と、をさらに含む方法。
  13. 請求項8に記載の方法であって、
    前記1種類以上の特徴量は、画像に第1タグが付与されているか否かを示す第2種類の特徴量と、前記第2種類と異なる第3種類の特徴量と、を含み、
    前記方法は、
    前記画像検索装置が、
    前記画像データベースから前記第1タグが付与されている登録済み画像を特定し、前記特定した登録済み画像それぞれの前記第3種類の特徴量を取得する手順と、
    前記取得した第3種類の特徴量それぞれを含むクエリを用いて、前記画像データベースからタグ付け候補画像を検索する手順と、
    前記タグ付け候補画像に含まれる第2画像に前記第1タグを付与し、前記第2画像に付与された第1タグと、前記特定した登録済み画像に付与されている第1タグそれぞれと、のリンクを前記伝搬情報に含める、手順と、をさらに含む方法。
  14. 請求項13に記載の方法であって、
    前記画像検索装置が、
    前記特定した登録済み画像それぞれと、前記タグ付け候補画像の前記第3種類の特徴量と、を前記画像データベースから取得する手順と、
    前記伝搬情報を参照して、前記取得した第3種類の特徴量それぞれと、前記タグ付け候補画像の前記第3種類の特徴量それぞれと、のリンクを取得する手順と、
    前記特定した登録済み画像それぞれと、前記取得したリンクを示す情報と、を出力する手順と、
    前記画像検索部は、前記タグ付け候補画像を出力する手順と、をさらに含む方法。
JP2017505775A 2015-03-13 2015-03-13 画像検索装置、及び画像を検索する方法 Active JP6371465B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2015/057516 WO2016147260A1 (ja) 2015-03-13 2015-03-13 画像検索装置、及び画像を検索する方法

Publications (2)

Publication Number Publication Date
JPWO2016147260A1 true JPWO2016147260A1 (ja) 2017-09-28
JP6371465B2 JP6371465B2 (ja) 2018-08-08

Family

ID=56918489

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017505775A Active JP6371465B2 (ja) 2015-03-13 2015-03-13 画像検索装置、及び画像を検索する方法

Country Status (4)

Country Link
US (1) US10657171B2 (ja)
JP (1) JP6371465B2 (ja)
CN (1) CN107004025B (ja)
WO (1) WO2016147260A1 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106354885A (zh) * 2016-10-14 2017-01-25 百度在线网络技术(北京)有限公司 搜索方法和装置
JP6811645B2 (ja) * 2017-02-28 2021-01-13 株式会社日立製作所 画像検索装置及び画像検索方法
CN112352230B (zh) * 2018-06-28 2021-08-27 三菱电机株式会社 检索装置、检索方法及机器学习装置
JP7018001B2 (ja) * 2018-09-20 2022-02-09 株式会社日立製作所 情報処理システム、情報処理システムを制御する方法及びプログラム
US20220164381A1 (en) * 2019-03-29 2022-05-26 Semiconductor Energy Laboratory Co., Ltd. Image retrieval system and image retrieval method
CN111125410A (zh) * 2019-12-19 2020-05-08 湖北南楚网络传媒有限公司 一种海量图形图像智能识别检索系统
JP7227934B2 (ja) * 2020-02-20 2023-02-22 株式会社日立製作所 車両運用支援装置、及び車両運用支援方法
CN113609335B (zh) * 2021-08-12 2023-02-03 北京滴普科技有限公司 一种目标对象查找方法、系统、电子设备及存储介质
CN114119989B (zh) * 2021-11-29 2023-08-11 北京百度网讯科技有限公司 图像特征提取模型的训练方法、装置及电子设备
JP2023160104A (ja) * 2022-04-21 2023-11-02 株式会社日立製作所 空間可視化システム及び空間可視化方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007323319A (ja) * 2006-05-31 2007-12-13 Nippon Telegr & Teleph Corp <Ntt> 類似検索処理方法及び装置及びプログラム
US20080069480A1 (en) * 2006-09-14 2008-03-20 Parham Aarabi Method, system and computer program for interactive spatial link-based image searching, sorting and/or displaying
JP2008129942A (ja) * 2006-11-22 2008-06-05 Hitachi Ltd コンテンツ検索装置
JP2009245304A (ja) * 2008-03-31 2009-10-22 Fujitsu Ltd 画像間対応付けプログラム、画像間対応付け装置および画像間対応付け方法
WO2012101697A1 (ja) * 2011-01-26 2012-08-02 パナソニック株式会社 画像管理装置、画像管理方法、プログラム、記録媒体、集積回路
JP2014032656A (ja) * 2012-08-03 2014-02-20 Fuji Xerox Co Ltd コンテンツ・リンクを生成する方法、装置およびプログラム

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3505393B2 (ja) * 1998-06-19 2004-03-08 日本電信電話株式会社 類似オブジェクト検索方法、装置、および類似オブジェクト検索プログラムを記録した記録媒体
JP2003316819A (ja) * 2002-04-22 2003-11-07 Shinkichi Himeno オブジェクト分類検索装置及びそれを実行するためのプログラム
US20040015777A1 (en) * 2002-07-22 2004-01-22 International Business Machines Corporation System and method for sorting embedded content in Web pages
JP4989308B2 (ja) * 2007-05-16 2012-08-01 キヤノン株式会社 画像処理装置及び画像検索方法
JP5199939B2 (ja) 2009-04-15 2013-05-15 ヤフー株式会社 画像検索装置、画像検索方法及びプログラム
JP2012208553A (ja) * 2011-03-29 2012-10-25 Sony Corp 画像処理装置、および画像処理方法、並びにプログラム
CN102136007B (zh) * 2011-03-31 2013-07-10 石家庄铁道大学 基于小世界特性的工程信息组织方法
US9317904B2 (en) * 2011-12-12 2016-04-19 Nec Corporation Image processing system and image processing method
JP5955199B2 (ja) * 2011-12-20 2016-07-20 富士フイルム株式会社 画像処理装置および画像処理方法、並びに、画像処理プログラム
WO2013175608A1 (ja) * 2012-05-24 2013-11-28 株式会社日立製作所 画像解析装置、画像解析システム、画像解析方法
CN103995831B (zh) * 2014-04-18 2017-04-12 新浪网技术(中国)有限公司 基于物品间相似度的物品处理方法、系统和装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007323319A (ja) * 2006-05-31 2007-12-13 Nippon Telegr & Teleph Corp <Ntt> 類似検索処理方法及び装置及びプログラム
US20080069480A1 (en) * 2006-09-14 2008-03-20 Parham Aarabi Method, system and computer program for interactive spatial link-based image searching, sorting and/or displaying
JP2008129942A (ja) * 2006-11-22 2008-06-05 Hitachi Ltd コンテンツ検索装置
JP2009245304A (ja) * 2008-03-31 2009-10-22 Fujitsu Ltd 画像間対応付けプログラム、画像間対応付け装置および画像間対応付け方法
WO2012101697A1 (ja) * 2011-01-26 2012-08-02 パナソニック株式会社 画像管理装置、画像管理方法、プログラム、記録媒体、集積回路
JP2014032656A (ja) * 2012-08-03 2014-02-20 Fuji Xerox Co Ltd コンテンツ・リンクを生成する方法、装置およびプログラム

Also Published As

Publication number Publication date
US10657171B2 (en) 2020-05-19
US20180060356A1 (en) 2018-03-01
CN107004025B (zh) 2020-07-14
WO2016147260A1 (ja) 2016-09-22
CN107004025A (zh) 2017-08-01
JP6371465B2 (ja) 2018-08-08

Similar Documents

Publication Publication Date Title
JP6371465B2 (ja) 画像検索装置、及び画像を検索する方法
JP6811645B2 (ja) 画像検索装置及び画像検索方法
JP6190887B2 (ja) 画像検索システムおよび情報記録媒体
US20190251471A1 (en) Machine learning device
US9928295B2 (en) Document relationship analysis system
CN106095738B (zh) 推荐表单片段
JP2008102594A (ja) コンテンツの検索方法及び検索装置
JP6615225B2 (ja) 画像処理装置、画像検索インタフェース表示装置、及び画像検索インタフェースの表示方法
JP2022037955A (ja) 学習モデルを選択するシステム
US10346450B2 (en) Automatic datacenter state summarization
JP6434162B2 (ja) データ管理システム、データ管理方法およびプログラム
US11080173B2 (en) Boundary search test support device and boundary search test support method
JP5515117B2 (ja) データ処理装置
US20190265954A1 (en) Apparatus and method for assisting discovery of design pattern in model development environment using flow diagram
US9990444B2 (en) Apparatus and method for supporting visualization of connection relationship
JP5954742B2 (ja) 文書を検索する装置及び方法
JP4189251B2 (ja) キーワード解析方法及びそれに使用するプログラム
JP2016081132A (ja) 分析プログラム、分析方法及び分析装置
JP2024033123A (ja) 文書分析装置、及び文書分析用プログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170612

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170612

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180710

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180712

R150 Certificate of patent or registration of utility model

Ref document number: 6371465

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150