JP2014211730A - 画像検索システム、画像検索装置および画像検索方法 - Google Patents

画像検索システム、画像検索装置および画像検索方法 Download PDF

Info

Publication number
JP2014211730A
JP2014211730A JP2013087043A JP2013087043A JP2014211730A JP 2014211730 A JP2014211730 A JP 2014211730A JP 2013087043 A JP2013087043 A JP 2013087043A JP 2013087043 A JP2013087043 A JP 2013087043A JP 2014211730 A JP2014211730 A JP 2014211730A
Authority
JP
Japan
Prior art keywords
image
search
image feature
feature amount
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013087043A
Other languages
English (en)
Other versions
JP6173754B2 (ja
Inventor
大輔 松原
Daisuke Matsubara
大輔 松原
廣池 敦
Atsushi Hiroike
敦 廣池
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2013087043A priority Critical patent/JP6173754B2/ja
Publication of JP2014211730A publication Critical patent/JP2014211730A/ja
Application granted granted Critical
Publication of JP6173754B2 publication Critical patent/JP6173754B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • G06F17/30
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis

Abstract

【課題】
ユーザが検索したい対象の特徴を表すキーワードを入力して、該当する画像を検索する。
【解決手段】
ユーザによって指定されたキーワードを表す画像を検索する画像検索システムであって、辞書画像から抽出した辞書画像特徴量と辞書画像を表す文字情報を保持した辞書データベースと、検索対象画像から抽出した検索対象画像特徴量を保持した検索データベースを備え、ユーザがキーワードを入力すると、辞書データベースから文字情報に基づいた検索を行って該当する辞書画像特徴量を取得し、前記辞書画像特徴量を分類してグループを作成し、前記グループの代表値を計算し、前記代表値を検索クエリとして検索データベースを対象に類似画像検索を行う。
【選択図】 図4

Description

本発明は、画像検索システムに関し、特に計算機上での情報検索に関する。
近年、凶悪犯罪の増加やセキュリティ意識の向上に伴い、店舗や空港、道路などの人が集まる場所に、多くの監視カメラが設置されつつある。これらの監視カメラで撮影された映像は、監視レコーダなどの蓄積装置に格納され、必要に応じて閲覧される。しかしながら、IPカメラの普及によってネットワーク経由で多数のカメラが接続可能になり、また蓄積装置の大容量化が進んだことも相まって、膨大な量の映像が蓄積されつつある。したがって、従来のように目視で全映像データを確認することは非常に困難になっている。
そこで、大量の映像データの中から、特定の人物や物体が映っている場面を検索して提示するために、様々な類似検索技術が提案されている。ここで、類似検索技術とは、ユーザが指定した検索クエリと類似したデータを対象データ内から探して、その結果を提示する技術を指す。特に、類似画像検索技術とは、画像自体から抽出される色合いや形状、構図等の特徴量を用いて、類似度が大きいデータを検索する技術である。例えば、人物を検索する際には、顔画像や服の色などを検索クエリとして用いることができる。
しかしながら,クエリとなる画像をユーザが用意するのは困難な場合が多い。そこで、ユーザが検索したい対象の特徴を表すキーワードを入力して、画像を検索可能なシステムが考えられる。例えば、車両を検索する際には、セダンや軽自動車といった車種や、白や赤といった車色をキーワードとして入力することになる。
特許文献1では、ユーザがキーワードを入力すると、画像に付与されている文字情報に基づいた検索を行い(一次検索)、検索結果画像の部分領域から画像特徴量を抽出して、それを検索クエリとして類似画像検索を行う(二次検索)ことが可能なシステムが開示されている。一次検索結果の確からしさは、検索対象データである文字情報内のキーワード出現位置などにより判断している。
特許文献2では、辞書内で知りたい項目に関しユーザが複数のキーワードを入力すると、全項目の見出し語および説明情報を対象に全文検索が実行される(一次検索)と共に、各キーワードの項目内出現位置および相対位置に基づいて各項目の評価を行い、最高評価の項目画像のうち、検索キーワードに対応する部分画像から抽出した画像特徴量を検索クエリとして、類似画像検索を行う(二次検索)ことが可能な装置が開示されている。
特開2010−49300号公報 特開2012−230544号公報
このようにユーザがキーワードを入力して、所望の物体や人物の画像を探すことを目的とする従来の画像検索システムには、以下に示す問題点が存在している。
特許文献1では、ユーザがキーワードを入力して文字情報に基づく一次検索を行った結果として大量の画像が得られた場合に対する処理についての記載がなく、全ての画像から画像特徴量を抽出して検索クエリとした場合、検索クエリの数が多いため二次検索を何度も繰り返すことになり、処理時間が増大するといった問題が存在する。
特許文献2では、最高評価の項目画像のみから画像特徴量を抽出しているため、二次検索の処理時間は増大しない。しかしながら、最高評価以外の画像から抽出した画像特徴量をクエリにすることはできないため、二次検索結果の多様性が失われ、高精度な画像検索ができないといった問題が存在する。
そこで本発明は、一次検索で得られた大量の画像に基づいて、二次検索に使用するための適切な検索クエリを生成する検索システムを提供することを目的とする。本方式は、物体検索のみならず人物検索にも有効である。
本発明の代表的な一例を示せば以下のとおりである。すなわち、画像検索システムであって、入力された文字に対応する画像特徴量を取得する特徴量取得部と、複数の画像特徴量を分類してグループを作成する分類部と、グループの代表値と類似する画像特徴量を持つ画像を検索する画像検索部と、を有することを特徴とする。
または、コンピュータ読み取り可能な記録媒体であって、コンピュータに、入力された文字に対応する画像特徴量を取得する特徴量取得ステップと、複数の画像特徴量を分類してグループを作成する分類ステップと、グループの代表値と類似する画像特徴量を持つ画像を検索する画像検索ステップと、を実行させるためのプログラムを記録していることを特徴とする。
本発明によれば、ユーザが所望する物体や人物を効率的に検索することができる。
第1の実施形態の画像検索システムの構成を示すブロック図である。 第1の実施形態のキーワード管理情報を示す説明図である。 第1の実施形態の特徴量管理情報を示す説明図である。 第1の実施形態の検索処理を示すブロック図である。 第1の実施形態のクエリ画像特徴量分類処理と代表値計算処理の概念を示す説明図である。 第1の実施形態のクエリ画像特徴量取得部402、クエリ画像特徴量分類部403、検索クエリ生成部404の処理内容を示すフローチャートである。 第1の実施形態において、サーバ計算機110が辞書データベース140と検索データベース150を備える場合のデータの流れを示す説明図である。 第1の実施形態において、サーバ計算機110が検索データベース150を備え、クライアント計算機130が辞書データベース140を備える場合のデータの流れを示す説明図である。 第1の実施形態において、サーバ計算機110が辞書データベース140を備え、クライアント計算機130が検索データベース150を備える場合のデータの流れを示す説明図である。 第2の実施形態の画像検索システムの構成を示すブロック図である。 第2の実施形態の代表値管理情報を示す説明図である。 第2の実施形態の中間データベース作成処理を示すブロック図である。 第2の実施形態の画像特徴量分類処理と代表値計算処理の概念を示す説明図である。 第2の実施形態の画像特徴量取得部802、画像特徴量分類部803、代表特徴量生成部804の処理内容を示すフローチャートである。 第2の実施形態の検索処理を示すブロック図である。
以下、本発明の実施形態を、図面を参照して説明する。
(実施例1)
以下、本発明の第1の実施形態の画像検索システムについて、図面に従って説明する。
図1は、第1の実施形態の画像検索システムの構成を示すブロック図である。
第1の実施形態の画像検索システムは、サーバ計算機110、クライアント計算機130、辞書データベース140、及び検索データベース150を備える。各装置は、通信基盤120によって相互に接続される。
サーバ計算機110は、外部インタフェース111、中央処理演算装置(CPU)112、メモリ113及び大容量外部記憶装置(HD)114を備える。サーバ計算機110は、検索エンジンが稼動する計算機であり、通信基盤120を経由し、クライアント計算機130に検索のサービスを提供する。
外部インタフェース111は、サーバ計算機110を通信基盤120に接続するためのインタフェース(I/F)である。CPU112は、サーバ計算機の処理を制御するプロセッサである。メモリ113は、CPU112によって実行される制御処理のための作業領域であり、各種データ、及び、HD114からロードされたプログラムを格納する。HD114は、ハードディスクなどの大容量記憶装置であり、CPU112によって実行されるプログラム、データなどを格納する。
クライアント計算機130は、通信基盤120に接続される計算機である。図1には2つのクライアント計算機130を示すが、任意の数のクライアント計算機130を備えてもよい。尚、クライアント計算機130と同等の機能をサーバ計算機110が備えている場合、全ての処理をサーバ計算機で行っても良い。
クライアント計算機130は、いかなる構成の計算機であってもよい。図1には、典型的なクライアント計算機130の構成を示す。すなわち、図1のクライアント計算機130は、CPU131、メモリ132、I/F133、入力装置134及び出力装置135を備える。
CPU131は、メモリ132に格納されたプログラムを実行するプロセッサである。メモリ132は、CPU131によって実行されるプログラム等を格納する記憶装置である。I/F133は、通信基盤120に接続され、クライアント計算機130とサーバ計算機110との間の通信に使用されるインタフェースである。入力装置134は、クライアント計算機130のユーザから入力を受け付ける装置である。入力装置134は、例えば、キーボード又はマウス等である。出力装置135は、クライアント計算機130のユーザに情報を表示する装置である。例えばCRT又は液晶ディスプレイのような画像表示装置である。
なお、本実施形態の画像検索システムは、ネットワークを介して接続されたサーバ計算機110とクライアント計算機130とがサービスを提供する構成であるが、一般的なパーソナルコンピュータが画像検索のアプリケーションによって検索のサービスを提供する構成であってもよい。
辞書データベース140は、キーワードと検索クエリ用の画像特徴量又は画像を格納するためのデータベースであり、例えば、キーワード管理情報200(図2参照)を格納する。また、検索データベース150は、検索対象とする画像から抽出された画像特徴量を格納するためのデータベースであり、例えば、特徴量管理情報300(図3参照)を格納する。辞書データベース140と検索データベース150は、クライアント計算機130内に格納されていても良い。
図2は、第1の実施形態のキーワード管理情報200を示す説明図である。
キーワード管理情報200は、キーワード201Aからキーワード201N、及びクエリ画像特徴量202を含む。以下、キーワード201Aから201Nのいずれにも共通する説明をする場合、その説明において、キーワード201Aから201Nを総称してキーワード201と記載する。また、各レコードのキーワードの数は異なっても良い。
キーワード201は、クエリ画像特徴量202が抽出された画像の特徴を表すキーワードである。例えば、車両画像の場合は、車種、車名、及び車色の3つのキーワードをキーワード201に格納する。
クエリ画像特徴量202は、画像から抽出された特徴量ベクトルである。特徴量ベクトルとは、色ヒストグラムやエッジパターンに基づいて作成される多次元ベクトルである。
図3は、第1の実施形態の特徴量管理情報300を示す説明図である。
特徴量管理情報300は、検索データID301、及び検索対象画像特徴量302を含む。検索データID301は、特徴量を識別するための識別子である。検索対象画像特徴量302は、画像から抽出された特徴量ベクトルである。
なお、辞書データベース140及び検索データベース150は、サーバ計算機110が備えるHD114に格納されてもよいし、HD114とは異なる他のハードディスクに格納されてもよい。
以下に、検索処理について説明する。
図4は、第1の実施形態の検索処理を示すブロック図である。
本実施形態の画像検索システムは、キーワード入力部401、クエリ画像特徴量取得部402、クエリ画像特徴量分類部403、検索クエリ生成部404、類似画像検索部405、及び検索結果出力部406によって、画像検索処理を実行する。さらに、検索クエリを生成するためのクエリ画像特徴量202とキーワード201からなるキーワード管理情報200を辞書データベース140に格納し、検索データID301と検索対象となる検索対象画像特徴量302からなる特徴量管理情報300を検索データベース150に格納する。なお、図1に示したCPU112は、HD114に格納された各種プログラムをメモリ113にロードし、メモリ113にロードされた各種プログラムを読み出し、読み出された各種プログラムを実行することによって、キーワード入力部401、クエリ画像特徴量取得部402、クエリ画像特徴量分類部403、検索クエリ生成部404、類似画像検索部405、及び検索結果出力部406の処理を実現する。
まず、キーワード入力部401は、ユーザによって入力されたキーワードを取得する。入力されるキーワードは複数でも良い。
次に、クエリ画像特徴量取得部402では、入力されたキーワードを用いて、辞書データベース140に格納されているキーワード201を対象としたテキスト検索を行い、合致するキーワードに紐付いているクエリ画像特徴量202を取得する。入力されたキーワードが複数存在する場合は、全てのキーワードに合致するクエリ画像特徴量202を取得する。
次に、クエリ画像特徴量分類部403では、取得したクエリ画像特徴量202に対してクラスタリング処理を行い、複数のグループに分類する。クラスタリング処理として、例えばK−means法やK−medians法を用いることができる。
次に、検索クエリ生成部404では、作成した各グループの代表値を計算し、検索クエリとする。例えば、各グループに含まれるクエリ画像特徴量の平均値や中央値を代表値として用いることができる。平均値を使用する場合は,クエリ画像特徴量の次元ごとに平均値を計算し,それらを並べたベクトルデータを代表値とする。中央値を使用する場合は,クエリ画像特徴量の次元ごとに中央値を計算し,それらを並べたベクトルデータを代表値とする。
次に、類似画像検索部405では、計算した代表値をクエリとして、検索データベース150に格納されている検索対象画像特徴量302を対象とした類似画像検索を行い、検索データID301を検索結果として取得する。
最後に、検索結果出力部406は、検索結果として検索データID301を出力する。なお、検索データID301に画像データが紐付いている場合は、画像データを検索結果として出力しても良い。
図5は、本実施例におけるクエリ画像特徴量分類処理と検索クエリ生成処理の概念を示す説明図であり、図6は、本実施例におけるクエリ画像特徴量取得部402、クエリ画像特徴量分類部403、検索クエリ生成部404の処理内容を示すフローチャートである。以下、図5と図6を使用して、クエリ画像特徴量分類処理と検索クエリ生成処理について詳細に説明する。
まず、クエリ画像特徴量取得部402において、キーワード入力部401でユーザが入力した文字列に合致する画像特徴量を辞書データベース140から取得する(S101)。図5の白丸印は、取得したクエリ画像特徴量202を模擬的に2次元のベクトル空間上にマッピングした状態を表している。また、キーワード入力部401で入力されたキーワードと合致しなかったレコードを白三角印で示している。
次に、クエリ画像特徴量分類部403において、取得したクエリ画像特徴量を対象にクラスタリング処理を実行する(S102)。本クラスタリング処理で生成されたクラスタを図5の破線の楕円で示す。
最後に、検索クエリ生成部404において、各クラスタの代表値を計算し、検索クエリとする。図5の黒星印が各クラスタの平均値を示している。
図7は、サーバ計算機110が辞書データベース140と検索データベース150を備える場合のデータの流れを示す説明図である。
ユーザがクライアント計算機130にキーワードを入力すると、クライアント計算機130はサーバ計算機110にキーワードを送信する。次に、サーバ計算機は図4の検索処理に従って401から406の全ての処理を行い、検索データIDをクライアント計算機130に返す。クライアント計算機130は検索結果をユーザに表示する。
また、検索結果として画像データを返したい場合は、クライアント計算機130が画像データベース510を備えていても良い。この画像データベース510は検索データベース150の検索データID301と画像データの組合せを保持している。また、サーバ計算機110が画像データベース510を備えても良い。その場合は、サーバ計算機110は検索処理後に画像データベース510から画像データを取得し、画像データをクライアント計算機110に返すことになる。また、サーバ計算機110はクラウド上に設置されていても良い。
図8は、サーバ計算機110が検索データベース150を備え、クライアント計算機130が辞書データベース140を備える場合のデータの流れを示す説明図である。
ユーザがクライアント計算機130にキーワードを入力すると、クライアント計算機130は、図4の処理の内、キーワード入力部401、クエリ画像特徴量取得部402、クエリ画像特徴量分類部403、代表値計算部404の処理を行い、サーバ計算機110に代表値を送信する。次に、サーバ計算機110は、残りの類似画像検索部405、検索結果出力部406の処理を行い、検索データIDをクライアント計算機130に返す。
このような構成の利点として、ユーザが辞書データベース140へのデータ追加や削除といったメンテナンスを行いやすいことが挙げられる。また、検索対象が膨大な場合は検索処理が非常に重くなるため、高価なサーバを用意する必要がある。その場合に、クラウド上にサーバ計算機を用意して検索処理を行えば、ユーザ側の負担が軽くなることも利点である。
図9は、サーバ計算機110が辞書データベース140を備え、クライアント計算機130が検索データベース150を備える場合のデータの流れを示す説明図である。
サーバ計算機110が辞書データベース140を備え、クライアント計算機130が検索データベース150を備える場合のデータの流れを示す説明図である。
ユーザがクライアント計算機130にキーワードを入力すると、クライアント計算機130はサーバ計算機110にキーワードを送信する。次に、サーバ計算機は図4の検索処理の内、キーワード入力部401、クエリ画像特徴量取得部402、クエリ画像特徴量分類部403、検索クエリ生成部404の処理を行い、クライアント計算機130に代表値を返す。次に、クライアント計算機130は、残りの類似画像検索部405、検索結果出力部406の処理を行い、検索結果をユーザに返す。
このような構成の利点として、サーバ計算機110にある辞書データベース140を複数のユーザで共有できる点が挙げられる。また、サーバ計算機110がクラウド上にある場合は、ユーザではなく別事業者が辞書データベース140のメンテナンスを行うサービスを実施することも可能である。また、検索データベース150をクライアント計算機130が保持することによって、ユーザのデータを外部に出さないといったセキュリティ面での利点も存在する。 以上を踏まえ、本実施例に記載の画像検索システムは、入力された文字に対応する画像特徴量を取得する特徴量取得部と、複数の画像特徴量を分類してグループを作成する分類部と、グループの代表値と類似する画像特徴量を持つ画像を検索する画像検索部と、を有することを特徴とする。
かかる特徴によりユーザが入力したキーワードが表す画像を高速に検索することができる。
(実施例2)
以下、本発明の第2の実施形態の画像検索システムについて、図面に従って説明する。
図10は、第2の実施形態の画像検索システムの構成を示すブロック図である。
第2の実施形態の画像検索システムは、サーバ計算機110、クライアント計算機130、中間データベース610、及び検索データベース150を備える。各装置は、通信基盤120によって相互に接続される。サーバ計算機110、クライアント計算機130、検索データベース150、及び通信基盤120は第1の実施形態と同一である。
中間データベース610は、キーワードと検索クエリ用の代表特徴量を格納するためのデータベースであり、例えば、代表特徴量管理情報700(図11参照)を格納する。
図11は、第2の実施形態の代表特徴量管理情報700を示す説明図である。
代表特徴量管理情報700は、キーワード701Aからキーワード701N、及び代表特徴量702を含む。以下、キーワード701Aから701Nのいずれにも共通する説明をする場合、その説明において、キーワード701Aから701Nを総称してキーワード701と記載する。また、各レコードのキーワードの数は異なっても良い。
キーワード701は、画像の特徴を表すキーワードである。例えば、車両画像の場合は、車種、車名、及び車色の3つのキーワードをキーワード701に格納する。
代表特徴量702は、画像から抽出された特徴量ベクトルである。例えば、色ヒストグラムやエッジパターンに基づいて作成される多次元ベクトルである。
図12は、第2の実施形態の中間データベース作成処理を示すブロック図である。
本実施形態の代表特徴量生成システムは、キーワード入力部801、画像特徴量取得部802、画像特徴量分類部803、及び代表特徴量生成部804によって、画像検索用の検索クエリとなる代表特徴量702を生成する。検索クエリを生成するためのクエリ画像特徴量202とキーワード201からなるキーワード管理情報200を辞書データベース140に格納し、生成した代表特徴量702とキーワード701からなる代表特徴量管理情報700を中間データベース610に格納する。なお、図10に示したCPU112は、HD114に格納された各種プログラムをメモリ113にロードし、メモリ113にロードされた各種プログラムを読み出し、読み出された各種プログラムを実行することによって、キーワード入力部801、画像特徴量取得部802、画像特徴量分類部803、及び代表特徴量生成部804の処理を実現する。
まず、キーワード入力部801は、ユーザによって入力されたキーワードを取得する。入力されるキーワードは複数でも良い。また、ユーザがキーワードを入力するのではなく、辞書データベース140に格納されているキーワード201を参照し、全てのキーワードや一部のキーワードに対して画像特徴量取得部802以降の処理を行っても良い。
次に、画像特徴量取得部802では、入力されたキーワードを用いて、辞書データベース140に格納されているキーワード201を対象としたテキスト検索を行い、合致するキーワードに紐付いているクエリ画像特徴量202を取得する。入力されたキーワードが複数存在する場合は、全てのキーワードに合致するクエリ画像特徴量202を取得する。
次に、画像特徴量分類部803では、取得したクエリ画像特徴量202に対してクラスタリング処理を行い、複数のグループに分類する。クラスタリング処理として、例えばK−means法を用いることができる。
このとき、クラスタリング処理を行う対象となるクエリ画像特徴量202を限定しても良い。クエリ画像特徴量202を限定する処理の詳細は図13の説明と合わせて後述する。
次に、代表特徴量生成部804では、作成した各グループの代表値を計算して代表特徴量702とし、中間データベース610にキーワード701と代表特徴量702を格納する。例えば、各グループに含まれるクエリ画像特徴量の平均値を計算し、中間データベース610に格納することができる
このとき、代表特徴量生成部804において、計算したグループの代表値の全てを代表特徴量としなくても良い。例えば、計算したグループの代表値(以後、評価対象代表値と呼ぶ)について、クエリ画像特徴量202とのベクトル間距離を計算する。次に、一定のベクトル間距離以内に含まれるクエリ画像特徴量202に紐付いているキーワード201を辞書データベース140から取得し、ユーザ入力に合致しているかどうかを判定する。最後に、ユーザ入力に合致していないデータ数が一定以上の場合、評価対象代表値を検索クエリから除外する。以上の処理を行うことにより、ノイズや外れ値を除去することが可能になり、検索精度の向上を図ることができる。
中間データベース610は、サーバ計算機610で作成しても良いし、クライアント計算機130で作成してサーバ計算機610に置いても良い。また、顧客の別計算機でも良い。
図13は、本実施例におけるクエリ画像特徴量分類処理と検索クエリ生成処理の概念を示す説明図である。
図14は、本実施例における画像特徴量取得部802、画像特徴量分類部803、代表特徴量生成部804の処理内容を示すフローチャートである。
以下、図13と図14を使用して、本実施例における画像特徴量分類処理と代表特徴量生成処理について詳細に説明する。
まず、画像特徴量取得部802において、キーワード入力部801でユーザが入力した文字列を取得し(S201)、それに合致する画像特徴量を辞書データベース140から取得する(S202)。図13の白丸印は、取得したクエリ画像特徴量202を模擬的に2次元のベクトル空間上にマッピングした状態を表している。また、キーワード入力部801で入力されたキーワードと合致しなかった画像特徴量レコードを白三角印で示している。図13(a)は、画像特徴量取得部802の処理が終わった状態を表している。
次に、画像特徴量分類部803において、図13中の白丸印のひとつ(評価対象画像特徴量)について、評価対象画像特徴量の周囲に一定数以上の白丸印が存在するか、つまり、評価対象画像特徴量に類似する画像特徴量のうち、キーワードに合致する画像特徴量がどの程度あるかを判断する。その後のクラスタリング処理で用いる評価対象画像特徴量(白丸印)には、キーワードに合致する画像特徴量(白丸印)の数が閾値を超える評価対象画像特徴量を選択する(S203)。逆に、キーワードに合致する画像特徴量の数が少ない場合には、その評価対象画像特徴量はクラスタリング処理の対象としては選択されない。図13(b)において、選択されなかった評価対象画像特徴量(白丸印)を点線で示している。この選択処理(S203)を、キーワードに合致したすべての画像特徴量(白丸)に対して行う。
次に、選択した評価対象画像特徴量(白丸印)のみを対象にクラスタリング処理を実行する(S204)。本クラスタリング処理で生成されたクラスタを図13(c)の破線の楕円で示す。また、黒星印が各クラスタの代表値を示している。本実施例では代表値は平均値として計算している。ここまでの処理で生成されたクラスタの代表値で類似画像検索を行っても良いし、さらに精度を向上させたければ、以下のように、生成したクラスタを限定して検索に用いても良い。
図13(c)に示されたクラスタに対し、代表特徴量生成部804において、各クラスタの代表値を計算する。クラスタ代表値の周囲に存在する三角の数が閾値を超えないクラスタのみを選択し、画像検索に用いる。図13(d)の破線で示すのが、選択されたクラスタである(S205)。
最後に、これらのクラスタの代表値を中間データベースに格納する(S206)。
図15は、検索処理を示すブロック図である。
本実施形態の画像検索システムは、キーワード入力部901、代表特徴量取得部902、類似画像検索部903、及び検索結果出力部904によって、画像検索処理を実行する。また、中間データベース610と検索データベース150を備える。検索データベース150は実施例1と同一である。
まず、キーワード入力部901は、ユーザによって入力されたキーワードを取得する。入力されるキーワードは複数でも良い。
次に、代表特徴量取得部902では、入力されたキーワードを用いて、中間データベース610に格納されているキーワード701を対象としたテキスト検索を行い、合致するキーワードに紐付いている代表画像特徴量702を取得する。入力されたキーワードが複数存在する場合は、全てのキーワードに合致する代表特徴量702を取得する。
次に、類似画像検索部903では、取得した代表値特徴量702をクエリとして、検索データベース150に格納されている検索対象画像特徴量302を対象とした類似画像検索を行い、検索データID301を検索結果として取得する。
最後に、検索結果出力部904は、検索結果として検索データID301を出力する。なお、検索データID301に画像データが紐付いている場合は、画像データを検索結果として出力しても良い。
以上のように、本実施例は、実施例1の構成に加え、クラスタリング処理を行う際に、クエリ画像特徴量202の選別を行い、代表値を中間データベース610に登録する構成を採用している。
かかる特徴により、実施例1の効果に加え、検索精度の向上と、処理の高速化を実現できる。
110:サーバ計算機、
111:外部インタフェース、
112:中央処理演算装置、
113:主記憶装置、
114:大容量外部記憶装置、
120:通信基盤、
130:クライアント計算機、
131:中央処理演算装置、
132:主記憶装置、
133:外部インタフェース、
134:入力装置、
135:出力装置、
140:辞書データベース、
150:検索データベース、
200:キーワード管理情報、
201A〜201N:キーワード、
202:クエリ画像特徴量、
300:特徴量管理情報、
301:検索データID、
302:検索対象画像特徴量、
401:キーワード入力部、
402:クエリ画像特徴量取得部、
403:クエリ画像特徴量分類部、
404:検索クエリ生成部、
405:類似画像検索部、
406:検索結果出力部、
510:画像データベース、
610:中間データベース
700:代表特徴量管理情報、
701A〜701N:キーワード、
702:代表特徴量、
801:キーワード入力部、
802:画像特徴量取得部、
803:画像特徴量分類部、
804:代表特徴量生成部、
901:キーワード入力部、
902:代表特徴量取得部、
903:類似画像検索部、
904:検索結果出力部。

Claims (15)

  1. 入力された文字に対応する画像特徴量を取得する特徴量取得部と、
    複数の前記画像特徴量を分類してグループを作成する分類部と、
    前記グループの代表値と類似する画像特徴量を持つ画像を検索する画像検索部と、を有することを特徴とする画像検索システム。
  2. 請求項1記載の画像検索システムであって、
    前記グループの代表値を計算する代表特徴量生成部、をさらに有することを特徴とする画像検索システム。
  3. 請求項2記載の画像検索システムであって、
    複数のテンプレート画像と前記テンプレート画像の画像特徴量と前記テンプレート画像に対応した文字と、が蓄積された記憶部、をさらに有し、
    前記特徴量取得部は、入力された文字と一致する文字に対応するテンプレート画像の画像特徴量を取得することを特徴とする画像検索システム。
  4. 請求項3に記載の画像検索システムであって、
    前記分類部は、前記特徴量取得部で取得された画像特徴量に類似する画像特徴量のうち、前記入力された文字と一致する文字に対応する画像特徴量の数が閾値を超える場合には、前記画像特徴量を用いてグループ作成を行い、前記入力された文字と一致する文字に対応するテンプレート画像の画像特徴量の数が閾値を超えない場合には、前記画像特徴量を用いずにグループ作成を行うことを特徴とする画像検索システム。
  5. 請求項4に記載の画像検索システムであって、
    前記検索部は、前記代表値に類似する画像特徴量のうち、前記入力された文字と一致しない文字に対応する画像特徴量の数が閾値未満の場合には、前記代表値を用いて検索を行い、前記入力された文字と一致しない文字に対応するテンプレート画像の画像特徴量の割合が閾値を超える場合には、前記代表値を検索に用いないことを特徴とする画像検索システム。
  6. ネットワークを介して接続された端末からの入力を受け付ける入力部と、
    入力された文字に対応する画像特徴量を取得する特徴量取得部と、
    複数の前記画像特徴量を分類してグループを作成する分類部と、
    前記グループの代表値と類似する画像特徴量を持つ画像を検索する画像検索部と、
    前記画像検索部が検索した結果を前記端末に出力する出力部と、を有することを特徴とする画像検索装置。
  7. 請求項6記載の画像検索装置であって、
    前記グループの代表値を計算する代表特徴量生成部、をさらに有することを特徴とする画像検索装置。
  8. 請求項7記載の画像検索装置であって、
    複数のテンプレート画像と前記テンプレート画像の画像特徴量と前記テンプレート画像に対応した文字列と、が蓄積された記憶部、をさらに有し、
    前記特徴量取得部は、入力された文字と一致する文字列に対応するテンプレート画像の画像特徴量を取得することを特徴とする画像検索装置。
  9. 請求項8に記載の画像検索装置であって、
    前記分類部は、前記特徴量取得部で取得された画像特徴量に類似する画像特徴量のうち、前記入力された文字と一致する文字に対応する画像特徴量の数が閾値を超える場合には、前記の画像特徴量を用いてグループ作成を行い、前記入力された文字と一致する文字に対応するテンプレート画像の画像特徴量の数が閾値を超えない場合には、前記画像特徴量を用いずにグループ作成を行うことを特徴とする画像検索装置。
  10. 請求項9に記載の画像検索装置であって、
    前記検索部は、前記代表値に類似する画像特徴量のうち、前記入力された文字と一致しない文字に対応する画像特徴量の数が閾値を超えない場合には、前記代表値を用いて検索を行い、前記入力された文字と一致しない文字に対応するテンプレート画像の画像特徴量の数が閾値を超える場合には、前記代表値を検索に用いないことを特徴とする画像検索装置。
  11. コンピュータに、
    入力された文字に対応する画像特徴量を取得する特徴量取得ステップと、
    複数の前記画像特徴量を分類してグループを作成する分類ステップと、
    前記グループの代表値と類似する画像特徴量を持つ画像を検索する画像検索ステップと、を実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
  12. 請求項11記載の記録媒体であって、
    前記グループの代表値を計算する代表特徴量生成ステップ、をさらに有することを特徴とするコンピュータ読み取り可能な記録媒体。
  13. 請求項12記載の記録媒体であって、
    複数のテンプレート画像と前記テンプレート画像の画像特徴量と前記テンプレート画像に対応した文字列と、が蓄積された記憶ステップ、をさらに有し、
    前記特徴量取得ステップは、入力された文字と一致する文字列に対応するテンプレート画像の画像特徴量を取得することを特徴とするコンピュータ読み取り可能な記録媒体。
  14. 請求項13に記載の記録媒体であって、
    前記分類ステップは、前記特徴量取得ステップで取得された画像特徴量に類似する画像特徴量のうち、前記入力された文字と一致する文字に対応する画像特徴量の数が閾値を超える場合には、前記の画像特徴量を用いてグループ作成を行い、前記入力された文字と一致する文字に対応するテンプレート画像の画像特徴量の数が閾値を超えない場合には、前記画像特徴量を用いずにグループ作成を行うことを特徴とする記録媒体。
  15. 請求項14に記載の記録媒体であって、
    前記検索ステップは、前記代表値に類似する画像特徴量のうち、前記入力された文字と一致しない文字に対応する画像特徴量の数が閾値を超えない場合には、前記代表値を用いて検索を行い、前記入力された文字と一致しない文字に対応するテンプレート画像の画像特徴量の数が閾値を超える場合には、前記代表値を検索に用いないことを特徴とする記録媒体。
JP2013087043A 2013-04-18 2013-04-18 画像検索システム、画像検索装置および画像検索方法 Expired - Fee Related JP6173754B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013087043A JP6173754B2 (ja) 2013-04-18 2013-04-18 画像検索システム、画像検索装置および画像検索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013087043A JP6173754B2 (ja) 2013-04-18 2013-04-18 画像検索システム、画像検索装置および画像検索方法

Publications (2)

Publication Number Publication Date
JP2014211730A true JP2014211730A (ja) 2014-11-13
JP6173754B2 JP6173754B2 (ja) 2017-08-02

Family

ID=51931458

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013087043A Expired - Fee Related JP6173754B2 (ja) 2013-04-18 2013-04-18 画像検索システム、画像検索装置および画像検索方法

Country Status (1)

Country Link
JP (1) JP6173754B2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016103084A (ja) * 2014-11-27 2016-06-02 株式会社 日立産業制御ソリューションズ 画像検索装置、及び画像検索システム
JP2020061147A (ja) * 2018-10-11 2020-04-16 ネイバー コーポレーションNAVER Corporation Cnn基盤イメージ検索方法および装置
JP2022037891A (ja) * 2020-08-25 2022-03-09 株式会社セルシス 3次元ポーズデータ生成システム、方法、プログラム
CN114328884A (zh) * 2021-12-03 2022-04-12 腾讯科技(深圳)有限公司 一种图文去重方法及装置
US11347739B2 (en) 2016-02-15 2022-05-31 Kabushiki Kaisha Toshiba Performing a chained search function
CN116662588A (zh) * 2023-08-01 2023-08-29 山东省大数据中心 一种海量数据智能搜索方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010218181A (ja) * 2009-03-17 2010-09-30 Yahoo Japan Corp 画像検索装置
JP2010286861A (ja) * 2009-06-09 2010-12-24 Yahoo Japan Corp 画像検索装置
JP2011070412A (ja) * 2009-09-25 2011-04-07 Seiko Epson Corp 画像検索装置および画像検索方法
JP2011197892A (ja) * 2010-03-18 2011-10-06 Hitachi Ltd 画像検索システム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010218181A (ja) * 2009-03-17 2010-09-30 Yahoo Japan Corp 画像検索装置
JP2010286861A (ja) * 2009-06-09 2010-12-24 Yahoo Japan Corp 画像検索装置
JP2011070412A (ja) * 2009-09-25 2011-04-07 Seiko Epson Corp 画像検索装置および画像検索方法
JP2011197892A (ja) * 2010-03-18 2011-10-06 Hitachi Ltd 画像検索システム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
獅々堀 正幹: "画像知識データベースを用いたWWW画像検索システムの開発", 電子情報通信学会論文誌, vol. 第J87-D-I NO.2, JPN6016040720, 1 February 2004 (2004-02-01), JP, pages 154 - 163, ISSN: 0003425549 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016103084A (ja) * 2014-11-27 2016-06-02 株式会社 日立産業制御ソリューションズ 画像検索装置、及び画像検索システム
US11347739B2 (en) 2016-02-15 2022-05-31 Kabushiki Kaisha Toshiba Performing a chained search function
JP2020061147A (ja) * 2018-10-11 2020-04-16 ネイバー コーポレーションNAVER Corporation Cnn基盤イメージ検索方法および装置
JP2022037891A (ja) * 2020-08-25 2022-03-09 株式会社セルシス 3次元ポーズデータ生成システム、方法、プログラム
JP7212908B2 (ja) 2020-08-25 2023-01-26 株式会社セルシス 3次元ポーズデータ生成システム、方法、プログラム
CN114328884A (zh) * 2021-12-03 2022-04-12 腾讯科技(深圳)有限公司 一种图文去重方法及装置
CN116662588A (zh) * 2023-08-01 2023-08-29 山东省大数据中心 一种海量数据智能搜索方法及系统
CN116662588B (zh) * 2023-08-01 2023-10-10 山东省大数据中心 一种海量数据智能搜索方法及系统

Also Published As

Publication number Publication date
JP6173754B2 (ja) 2017-08-02

Similar Documents

Publication Publication Date Title
KR102422977B1 (ko) 자연어 이미지 검색 기법
JP5830784B2 (ja) 画像認識システムを組込んだ関連性検索によるインタレスト・グラフ収集システム
Yuan et al. Sentribute: image sentiment analysis from a mid-level perspective
CN102609434B (zh) 使用社交数据的面部识别
US9218364B1 (en) Monitoring an any-image labeling engine
EP2805262B1 (en) Image index generation based on similarities of image features
JP6173754B2 (ja) 画像検索システム、画像検索装置および画像検索方法
JP5917719B2 (ja) 画像データベースにおける画像管理のための方法、装置、および、コンピュータで読取り可能な記録媒体
CN113939813A (zh) 生成和应用针对图像的对象级关系索引
US9037600B1 (en) Any-image labeling engine
US20150178321A1 (en) Image-based 3d model search and retrieval
Leng et al. 3D object retrieval with multitopic model combining relevance feedback and LDA model
JP5121917B2 (ja) 画像検索装置、画像検索方法及びプログラム
CN105378763A (zh) 推断实体属性值
US8582872B1 (en) Place holder image detection via image clustering
JP4937395B2 (ja) 特徴ベクトル生成装置、特徴ベクトル生成方法及びプログラム
Martinet et al. A relational vector space model using an advanced weighting scheme for image retrieval
CN107315984B (zh) 一种行人检索的方法及装置
JP5014479B2 (ja) 画像検索装置、画像検索方法及びプログラム
CN110956213A (zh) 遥感影像特征库生成、遥感影像检索方法及装置
CN113313170A (zh) 基于人工智能的全时全域训练大数据平台
JP2011070244A (ja) 画像検索装置、画像検索方法及びプログラム
JP2021131783A (ja) 情報処理装置、情報処理方法及び情報処理プログラム
Kim et al. Classification and indexing scheme of large-scale image repository for spatio-temporal landmark recognition
JP6341843B2 (ja) 画像検索装置、及び画像検索システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160115

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161025

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20161028

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161226

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20170110

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20170112

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170405

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170524

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170606

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170705

R150 Certificate of patent or registration of utility model

Ref document number: 6173754

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees