JP5794036B2 - 画像検索装置、画像検索方法、およびプログラム - Google Patents

画像検索装置、画像検索方法、およびプログラム Download PDF

Info

Publication number
JP5794036B2
JP5794036B2 JP2011180190A JP2011180190A JP5794036B2 JP 5794036 B2 JP5794036 B2 JP 5794036B2 JP 2011180190 A JP2011180190 A JP 2011180190A JP 2011180190 A JP2011180190 A JP 2011180190A JP 5794036 B2 JP5794036 B2 JP 5794036B2
Authority
JP
Japan
Prior art keywords
search
image
image data
keyword
composition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011180190A
Other languages
English (en)
Other versions
JP2013045122A (ja
Inventor
紋宏 中島
紋宏 中島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP2011180190A priority Critical patent/JP5794036B2/ja
Publication of JP2013045122A publication Critical patent/JP2013045122A/ja
Application granted granted Critical
Publication of JP5794036B2 publication Critical patent/JP5794036B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は画像検索装置、画像検索方法、およびプログラムに関する。
画像データを検索キーとして設定し、類似する画像データの検索を行う画像検索方法が知られている(たとえば、特許文献1)。特許文献1に示される画像検索方法によれば、検索キーとして設定された画像データ(以下、「クエリ画像」という。)および各検索対象画像の各特徴点から局所特徴量を抽出し、類似度が比較的厳しい第1の条件を満足する特徴点の第1対応点ペアと、第1対応点ペアに基づいて比較領域をさらに限定して、類似度が比較的緩やかな第2の条件を満足する特徴点の第2対応点ペアとを抽出し、この第2対応点ペアの個数に基づいて類似する画像データを抽出し、画像検索結果として出力している。この特許文献1による画像検索方法によれば、第1対応点ペアが得られない検索対象画像はクエリ画像とは非類似であるとして予め排除されるため、高精度の類似画像検索を実現することができる。
特開2010−204908号公報(要約、図1参照)
ところで、図12に示すように、青色のりんごが写っている画像データAをユーザが所持していたとする。ここで、ユーザが画像データAと同じ構図の赤色のりんごが写っている画像データBを探している場合がある。このような場合において、特許文献1に開示される画像検索方法で画像データBを検索したい場合に、画像データAをクエリ画像に設定して画像検索を行っても、色相が異なるため類似度が比較的厳しい第1の条件を満足する特徴点が画像データBとの間で得られない可能性が高く、検索結果として出力されないか、あるいは検索結果の上位に出力させることはできない。そのため、大量の画像検索結果の中から画像データBを目視で探し出すこととなり、ユーザにとっては所望の画像データを検索する手間がかかる。
また、図13に示すように、名前を知らない人物aが写っている画像データCをユーザが所持していたとする。ここで、ユーザが、写真は持っていないが名前を知っているBさんと、ある人物aとが一緒に写っている画像データDを探している場合がある。このような場合において、特許文献1に開示される画像検索方法で画像データCをクエリ画像に設定して画像検索を行っても、特徴点に異なる部分が多いため、類似度が比較的厳しい第1の条件を満足する特徴点が画像データDとの間で得られない可能性が高く、検索結果として出力されないか、あるいは検索結果の上位に出力させることはできない。そのため、大量の画像検索結果の中から画像データDを目視で探し出すこととなり、ユーザにとっては所望の画像データを検索する手間がかかる。
すなわち、特許文献1に開示される画像検索方法は上述のようなユーザの所望する画像データを検索する場合には非常に使い勝手が悪いものとなってしまう。
本発明は、上述した課題の少なくとも1つを鑑みてなされたものであり、ユーザが所望する画像データを検索する際に利便性のよい画像検索装置、画像検索方法、およびプログラムを提供することを目的とする。
本発明の一側面としての画像検索装置は、検索条件として設定されたキーワードおよび画像データを取得する検索条件取得手段と、検索条件取得手段で取得した画像データに含まれる所定のオブジェクトを含み、かつ、キーワードで指定された条件を満たす画像データを検索する画像検索手段と、画像検索手段によって検索された画像データを出力する画像出力手段と、を備えるものである。
画像検索装置を上述の構成とすることで、単一の画像データによる類似画像検索では指定することができない検索条件をキーワードによって設定することができるため、図12および図13で示したようなユーザが所望する画像データを検索結果として出力させることができる。そのため、図12および図13で示したような場合であっても、ユーザは大量の画像検索結果から所望する画像データを目視で確認する手間が不要となり、利便性のよいものとなる。
また、キーワードは、所定のオブジェクトの色、形、および構図のいずれかを意味する言葉であり、画像検索手段は、所定のオブジェクトを含み、かつキーワードで指定された色、形、および構図のいずれかを満たす画像データを検索すること好ましい。
画像検索装置を上述の構成とすることで、検索条件として設定された画像データと類似する画像データであって、かつ、キーワードとして指定された、所定のオブジェクトの色、形、および構図のいずれかを満たす画像データが出力されるため、ユーザは、その出力された画像データの中から所望する画像データを探し出すだけで済み、所持している画像データを用いて、所定のオブジェクトの色、形、および画像の構図のいずれかが異なる画像データを検索したい場合には、特に利便性のよいものとなる。
また、検索手段は、キーワードが指定する画像の構図を意味する言葉に数値が含まれる場合に、所定のオブジェクトの個数をその数値分増加させた画像データを検索することが好ましい。
画像検索装置を上述の構成とすることで、キーワードとして指定された構図を満たし、かつ、検索条件として設定された画像データに含まれる所定のオブジェクトの個数が、検索条件として指定された構図が意味する数値分増加させた画像データを検索対象として画像検索が行われるため、ユーザは、検索結果として出力される画像データの中からユーザが所望する画像データを探し出すだけで済み、所持している画像データから、所定のオブジェクトの個数を指定された構図が意味する数値分増加させた画像データを検索したい場合には、特に利便性がよいものとなる。
また、キーワードは、名詞、または固有名詞に分類される言葉であり、画像検索手段は、所定のオブジェクトを含み、かつキーワードで指定された名詞または固有名詞と関連付けられ多画像データを検索することが好ましい。
画像検索装置を上述の構成とすることで、検索条件として設定された画像データと類似する画像データであって、かつ、キーワードとして指定された名詞、または固有名詞と関連付けられている画像データが出力されるため、ユーザは、その出力された画像データの中から所望する画像データを探し出すだけで済み、所持している画像データから、キーワードとして指定された名詞、または固有名詞と関連する画像データを検索したい場合には、特に利便性のよいものとなる。
また、本発明は、画像検索装置のみならず、画像検索装置を構成する各手段が実行する各工程を有する画像検索方法においても実現することができる。さらに、画像検索装置を構成する各手段に相当する機能をコンピューターに実行させるプログラムにおいても本発明を実現することができる。そのため、本発明の一側面である画像検索方法、プログラムについても、上述した画像検索装置と同様の効果を奏することができる。
本発明の実施の形態に係るサーバーとクライアント端末の概略構成を示す説明図である。 図1に示すサーバーの内部構成の機能を機能ブロック図にて模式的に示す説明図である。 図2に示す画像データベースに記憶されている情報の一例を示す図である。 図2に示す画像データベース内に生成されるクラスタの概念を説明する図である。 図1に示すサーバーが備えるメモリーに格納されている各種プログラム、モジュールを示す説明図である。 図5に示す画像検索モジュールの詳細機能を示す図である。 図1に示すクライアント端末の内部構成を機能ブロック図にて模式的に示す説明図である。 図1に示すクライアント端末が備えるメモリーに格納されている各種プログラム、モジュールを示す説明図である。 図1に示すクライアント端末およびサーバー間において実行される画像検索処理を示すフローチャートである。 図9に示す画像検索処理により出力される画像データの一例を示す図である。 本発明の第2実施形態における ユーザが所持する画像データと欲しい画像データとの関係を説明するための図である。 ユーザが所持する画像データと欲しい画像データとの関係を説明するための図である。
以下、本発明に係る画像検索装置、画像検索方法、およびプログラムについて、図面を参照しつつ、実施の形態に基づいて説明する。なお、本発明に係る画像検索方法については画像検索装置の動作を例として説明し、本発明に係るプログラムについては、画像検索装置にインストールされているプログラムを例として説明する。
図1は、本発明の実施の形態に係るサーバー1とクライアント端末2の概略構成を示す説明図である。サーバー1と、クライアント端末2とはネットワーク3を介して双方向通信可能に接続されている。ネットワーク3は、インターネット、イントラネット、WAN(Wide Area Network)、LAN(Local Area Network)などのいずれであってもよい。
サーバー1は、ネットワーク3を介して接続された不図示のコンピューター上に存在する数多くの画像データを格納し、クライアント端末2からの検索要求に応じて類似・一致する画像データの検索を実行すると共に、検索結果として抽出された画像データを送信する、画像検索装置の一例である。
(サーバー1の構成)
図2は、図1に示すサーバー1の内部構成の機能を機能ブロック図にて模式的に示す説明図である。
サーバー1は、互いに通信可能に接続されている中央処理装置(CPU)11、メモリー12、記憶装置13、および入出力インターフェース14を備えている。
CPU11は、メモリー12に格納されているOS(不図示)、各種プログラム、モジュールを実行する。
メモリー12は、CPU11によって実行されるプログラム、モジュールを不揮発的に記憶すると共に、CPU11による処理実行時にプログラム、モジュールが展開される揮発的な作業領域を有する。なお、メモリー12としては、たとえば、プログラムなどを不揮発的に記憶するリードオンリメモリー、プログラム実行時における揮発的な作業領域を提供するランダムアクセスメモリーといった半導体記憶装置が用いられ得る。
記憶装置13は、たとえば、ハードディスクドライブ、フラッシュメモリードライブといった大容量記憶装置によって構成されている。記憶装置13には、画像データベース13Aが構築されている。
図3は、図2に示す画像データベース13Aに記憶されている情報の一例を示す図である。図3に示すように、画像データ毎に所属する所属クラスタ、画像特徴量、キーワードが記憶されている。所属クラスタとは、画像データに関連付けられている画像特徴量またはキーワードに応じて分類されているクラスタのことである。なお、画像データが所属する所属クラスタは1つのみ示しているが、複数の所属クラスタと関連付けられていてもよい。また、図示しないが、各クラスタには各画像データの画像特徴量の代表値(たとえば、各画像データの特徴量、または各画像データに含まれる局所特徴量の平均値)が関連付けられており、画像検索の際に、各クラスタの代表値の単位で画像検索が行われ、その後に類似する代表値に属する各画像データとの比較が行われるようになっている。
図4は、図2に示す画像データベース13A内に生成されるクラスタの概念を説明する図である。図4に示す例では、正規化された画像特徴量、またはキーワードに基づいて、画像データの色相、形、構図といった様々な特徴によって画像データが分類される。たとえば、図4(A)に示す色相に関するクラスタについては、色相青を示す正規化された特徴量が所定値以上(図4(A)では青)であるか所定値未満(図4(A)ではそれ以外)であるかに基づいて分類される。色相青において、それ以外の分類については、色相緑を示す正規化された特徴量が所定値以上(図4(A)では緑)であるか所定値未満(図4(A)ではそれ以外)であるかに基づいてさらに分類される。また、図4(B)に示す例では、形に関するクラスタについては、丸い形のパターンを示す正規化された特徴量に該当するか(図4(B)では丸い)、該当しないか(図4(B)ではそれ以外)に基づいて分類される。丸い形において、それ以外の分類については、四角(四角い)のパターンを示す正規化された特徴量に該当するか(図4(B)では四角い)であるか該当しないか(図4(B)ではそれ以外)に基づいてさらに分類される。また、図4(C)に示す例では、構図に関するクラスタについては、日の丸構図のパターンを示す正規化された特徴量に該当するか(図4(C)では日の丸)、該当しないか(図4(C)ではそれ以外)に基づいて分類される。日の丸構図において、それ以外の分類については、三角構図のパターンを示す正規化された特徴量に該当するか(図4(C)では三角構図)であるか該当しないか(図4(C)ではそれ以外)に基づいてさらに分類される。なお、図4に示す複数のクラスタはあくまでも一例であり、これらのクラスタの構成方法、および分類方法に限定されるものではない。
クラスタリングは、画像データベース13Aに対して画像インデックスを作成する最初のタイミングにて、あるいは、画像データベース13Aに所定量の新規な画像データが追加されたタイミングにてサーバー1によって実行される。なお、クラスタリングの手法としては、階層型クラスタリング手法の他、K−平均法、自己組織化マップ(SOM)などの非階層型クラスタリング手法なども知られているが、それらのいずれを採用してもよい。
なお、記憶装置13は、複数の画像データのみを格納するデータ格納部として機能してもよい。この場合には、記憶装置13に格納されている各画像データの特徴量、各画像データの管理情報はメモリー12に格納される。
さらに、本実施の形態では、記憶装置13が画像データおよび管理情報を単に格納するデータベースを例として説明しているが、記憶装置13に検索処理機能を備える制御部を備えさせて、外部からの検索処理要求に応じて検索結果の画像データを出力する独立型のデータベースシステムであってもよい。この場合には、サーバー1の外部にデータベースシステムが配置され、入出力インターフェース14を介して両者の間で検索要求および検索結果の送受信が実行される。いずれの場合にも、データベース検索用のプログラムはメモリー12に格納され、CPU11によって実行される。
入出力インターフェース14は、外部装置、たとえば、クライアント端末2との間で、周知の通信プロトコルに従って検索要求の受信および検索結果の送信を実行する。なお、図示しないが、入出力インターフェース14は、キーボードなどの操作部としての機能、ディスプレイなどの表示部としての機能を有するものであってもよい。
図5は、図1に示すサーバー1が備えるメモリー12に格納されている各種プログラム、モジュールを示す説明図である。図5に示すように、メモリー12には画像検索プログラムSP1が格納されている。
画像検索プログラムSP1は、記憶装置13から画像データを検索するプログラムであり、検索条件取得モジュールSM11および画像検索モジュールSM12を備えている。
検索条件取得モジュールSM11は、クライアント端末2によりネットワーク3を介して送信されてきた、ユーザにより検索条件として設定されている検索画像データおよび検索キーワードを取得するモジュールである。
画像検索モジュールSM12は、検索条件取得モジュールSM11により取得した検索画像データおよび検索キーワードを用いて、ユーザが探している画像データと類似または一致する画像データを画像データベース13Aから検索するモジュールである。
図6は、図5に示す画像検索モジュールSM12の詳細機能を示す図である。図6に示すように、画像検索モジュールSM12は、サブモジュールとして検索対象設定モジュールSM13、検索特徴量算出モジュールSM14および類似画像検索モジュールSM15を更に備えている。
検索対象設定モジュールSM13は、検索条件取得モジュールSM11により取得した検索画像キーワードを用いて検索対象とする画像データ群を設定するモジュールである。具体的には、検索キーワードとして入力された、色、形、構図を表す言葉に応じて、画像データベース13Aに構築されるクラスタから合致する言葉を抽出して、その言葉により分類されているクラスタを特定する。なお、クラスタには一意に識別可能なIDが付与されているものとする。
検索特徴量算出モジュールSM14は、検索条件取得モジュールSM11により取得した検索画像データから所定のオブジェクトを抽出して、そのオブジェクトの特徴量を算出するモジュールである。なお、オブジェクトの識別方法としては特に限定しないが、ニューラルネットワーク、SVM(Support Vector Machine)などの既存の認識技術を用いればよい。
類似画像検索モジュールSM15は、検索特徴量算出モジュールSM14により算出された特徴量と、検索対象設定モジュールSM13により特定されたクラスタに属する画像データの特徴量とを用いて類似する画像データを検索し、その検索結果を出力するモジュールである。
(クライアント端末2の構成)
図7は、図1に示すクライアント端末2の内部構成を機能ブロック図にて模式的に示す説明図である。
クライアント端末2は、互いに通信可能に接続されている中央処理装置(CPU)21、メモリー22、記憶装置23、および入出力インターフェース24を備えている。
CPU21は、メモリー21に格納されているOS(不図示)、各種プログラム、モジュールを実行する。
メモリー21は、CPU21によって実行されるプログラム、モジュールを不揮発的に記憶すると共に、CPU21による処理実行時にプログラム、モジュールが展開される揮発的な作業領域を有する。なお、メモリー21としては、たとえば、プログラムなどを不揮発的に記憶するリードオンリメモリー、プログラム実行時における揮発的な作業領域を提供するランダムアクセスメモリーといった半導体記憶装置が用いられ得る。
記憶装置23は、たとえば、ハードディスクドライブ、フラッシュメモリードライブといった大容量記憶装置によって構成されている。記憶装置13には、ユーザが検索条件として設定可能な画像データDが複数記憶されている。
入出力インターフェース24は、外部装置、たとえば、サーバー1との間で、周知の通信プロトコルに従って検索要求の送信、検索結果の受信を実行する機能を有する。また、図示しないが、入出力インターフェース24は、サーバー1に対してユーザが画像検索指示を入力するための操作部としての機能を有し、たとえば、ボタン、ホイールによって実現され得る。また、入出力インターフェース24には、表示部としての機能を有し、ユーザに対して検索した画像データに基づく画像の表示、ユーザに対する各種情報の表示を行う。
図8は、図1に示すクライアント端末2が備えるメモリー22に格納されている各種プログラム、モジュールを示す説明図である。
メモリー21は、画像検索要求プログラムCP1と、WebブラウザプログラムCP2とを備える。
画像検索要求プログラムCP1は、サーバー1に対して画像検索処理を要求するプログラムであり、画像特定モジュールCM11、検索要求モジュールCM12、検索結果取得モジュールCM13を備えている。
検索条件特定モジュールCM11は、検索対象となる画像データDおよびキーワードを特定するモジュールである。
検索要求モジュールCM12は、画像特定モジュールCM11により抽出された画像データDとキーワードが設定された検索要求をサーバー1に対して送信するモジュールである。なお、ここでいうキーワードには、色、形、構図を表す言葉であり、たとえば、色であれば、赤い、白っぽいなどであり、形であれば、丸い、四角いなどであり、構図であれば、日の丸構図、三角構図などが挙げられる。
検索結果取得モジュールCM13は、サーバー1から検索結果としての画像データを取得するモジュールである。
WebブラウザプログラムCP2は、検索結果取得モジュールCM13が取得したデータを用いて表示部に検索結果を表示させるプログラムである。
(画像データの検索処理)
図9は、図1に示すクライアント端末2およびサーバー1間において実行される画像検索処理を示すフローチャートである。
クライアント端末2のCPU21は、ユーザによって特定された画像(検索画像)およびキーワードが選択されると(START)、その検索画像に対応する検索画像データおよび検索条件を特定する(ステップS10)。検索画像データは、たとえば、記憶装置13に格納されている画像データDであり、ユーザによって不図示の操作部を介して選択される。また、検索条件は、たとえば、上述したような色、形、構図を表す言葉であり、たとえば、色であれば、赤い、白っぽいなどであり、形であれば、丸い、四角いなどであり、構図であれば、日の丸構図、三角構図などのキーワードが挙げられる。
CPU21は、検索処理要求(検索クエリー)として、検索画像データおよびその検索条件を示すキーワード情報をサーバー1に送信する(ステップS11)。具体的には、入出力インターフェース24、ネットワーク3を介してサーバー1に送信される。
サーバー1のCPU11は、ステップS11の検索画像データおよび検索キーワード情報を示す情報を含む画像検索処理要求をクライアント端末2から受信すると、画像検索プログラムSP1を実行する。すなわち、CPU11は、画像検索プログラムSP1の検索条件取得モジュールSM11を実行して、画像検索条件として設定された検索画像データおよびキーワード情報を取得する(ステップS12)。具体的には、入出力インターフェース14を介して検索画像データおよびキーワード情報がサーバー1内に取り込まれ、メモリー12に格納される。
CPU11は、ステップS12が完了すると、検索対象設定モジュールSM12を実行して、検索処理要求に含まれるキーワード情報から、画像データベース13Aに構築されたクラスタを検索し、その検索結果に応じたクラスタに属する画像データ郡を検索対象として設定する。(ステップS13)。なお、ステップS12とステップS13の処理については前後が逆であっても構わない。
CPU11は、ステップS13が完了すると、検索特徴量算出モジュールSM14を実行して、検索画像データからオブジェクトを抽出すると共にそのオブジェクトの特徴量を算出する(ステップS14)。
CPU11は、ステップS14が完了すると、類似画像検索モジュールSM15を実行する。類似画像検索モジュールSM15は、画像データベース13Aを参照し、ステップS14で算出された特徴量と、ステップS13で設定されたクラスタに属する画像データ郡から、ユーザが探している画像データと類似・一致する画像データを検索する(ステップS15)。
具体的には、算出した各特徴量の値と、各画像データの各特徴量の値とを用いて類似する画像データが検索される。なお、ユーザが探している画像データと類似・一致するか否かは、たとえば、ユークリッド距離、マハラノビス距離といった距離算出方法によって算出された、算出した各特徴量の値と、各画像データに対応付けられている特徴量の値との間の距離、すなわち、各特徴量の値と各クラスタの代表値によって表される多元ベクトル間の距離を用いて判断され、得られた距離が短いほど類似・一致していると判断される。なお、これら類似度を算出するための各距離の算出手法および内積の演算式は、画像認識技術分野における当業者にとって周知であるから説明を省略する。
また、ユーザが探している画像データと類似・一致した複数の画像データの選択方法としては、閾値としての距離を予め決めておいて、その閾値に含まれる画像データを選択する、あるいは、選択画像データ数を予め設定しておき、類似である画像データの上位から順番に選択画像データ数までを選択するようにすればよい。
CPU11は、ステップS15において検索された画像データを、検索要求の送信元であるクライアント端末2に対して送信する(ステップS16)。
クライアント端末2のCPU21は、ステップS16の送信によって画像データを受信すると、検索結果取得モジュールCM13を実行して、メモリー21に格納する(ステップS17)。
CPU21は、ステップS17を完了すると、WebブラウザプログラムCP2を実行して、メモリー21に格納されている複数の画像データを表示部に表示させ(ステップS18)、画像検索処理を終了する(END)。
図10は、図9に示す画像検索結果として出力される画像の一例を図である。図10に示す例では、検索画像としては、りんごの画像を設定し、キーワードとしては構図に関する言葉を設定している。図10(A)に示す例では、キーワードとして「三角構図」を設定したことにより、検索画像としては、オブジェクトであるりんごを三角形に配置された構図となっている画像データが検索される。なお、図10(A)に示す例では、三角構図を指定した場合に、オブジェクトであるりんごの数が3倍されて3つ表示されている画像が検索されたが、必ずしもオブジェクトが3つ同じもので表現されているものでなくてもよく、たとえば、りんご、みかん、バナナの配置関係が三角形に配置されている画像データなども検索結果として出力されてもよい。
また、図10(B)に示す例では、キーワードとして「対称構図」を設定したことにより、検索画像としては、オブジェクトであるりんごを上下対称、または左右対称に配置された構図となっている画像データが検索される。
また、図10(C)に示す例では、キーワードとして「日の丸構図」を設定したことにより、検索画像としては、オブジェクトであるりんごが画像の中心に配置された構図となっている画像データが検索される。
なお、図示しないが、構図としては、上述以外の構図、たとえば対角構図、曲線構図、水平構図、垂直構図、放射構図、枠構図、斜線構図、点構図、パターン構図などを指定できるようにしてもよい。
(第1実施形態の効果)
以上のように、本実施の形態におけるサーバー1では、検索条件取得モジュールSM11が画像データおよび検索キーワードを取得し、検索対象設定モジュールSM13が検索キーワードにしたがった検索対象画像を抽出し、類似画像検索モジュールSM15が、検索対象設定モジュールSM13により抽出された検索対象画像に含まれる画像データの中から類似する画像データを検索して出力するようにしている。
特に、キーワードは、所定のオブジェクトの色、形、または構図のいずれかを意味する言葉であり、類似画像検索モジュールSM15が、キーワードで指定される色、形、または構図のいずれかを満たすクラスタに属する画像データ郡の中から類似する画像データを検索して出力するようにしているため、たとえば、図12に示したように、ユーザが青いりんごの画像データを所持しており、赤いりんごの画像データを探している場合であっても、キーワードに赤いと入力して検索するだけで所望の画像データが検索結果として出力されるので利便性がよいものとなる。
(第1実施形態の変形例)
なお、検索対象設定モジュールSM12は、図10(A)のような画像検索処理を行ってもよい。すなわち、キーワードが指定する画像の構図を意味する言葉に数値が含まれる場合(図10(A)の示す「三角構図」が指定された場合)、所定のオブジェクトの個数をその数値分増加させた画像データ(つまり、オブジェクトが3つ写っている画像データ)を検索結果として出力するようにしてもよい。
このようにすることで、単一の画像データとの類似判定のみでは表示され得ないものについても、検索条件を指定することで、ユーザが所望する画像データを検索結果として出力させることができる。
〔第2実施形態〕
上述した第1実施形態では、キーワード情報として色、形、構図のいずれかを表す言葉が設定されていたが、第2実施形態では、キーワード情報として名詞または固有名詞に分類される言葉が設定されるものである。そのため、第2実施形態の画像データベースでは、クラスタリングの際に、被検索画像データに関連付けられているタグ情報についても分類されており、名詞、または固有名詞についても検索可能となるように構成されているものとする。なお、第1実施形態とはキーワード情報としての設定される言葉の種類が異なるのみであるため、サーバーの構成および図9に示した画像検索処理と同様であるため、図示は省略する。
図11は、第2実施形態の画像検索結果として出力される画像の一例を図である。図11に示す例では、検索画像として、ある人物が写っている画像データを設定し、キーワードとしてはBさんの名称を設定している。その結果、検索画像として設定された、ある人物とBさんが一緒に写っている画像データが検索される。
このように、第2実施形態では、キーワードは、名詞、または固有名詞を表す言葉であり、第2実施形態の類似画像検索モジュールが、キーワードで指定される名詞、または固有名詞を満たすクラスタに属する画像データ群の中から類似する画像データを検索して出力するようにしているため、たとえば、図13に示したように、名前を知らない人物aが写っている画像データCをユーザが所持しており、ユーザが、写真は持っていないが名前を知っているBさんと、画像データCに写っている人物aとが一緒に写っている画像データDを探している場合であっても、画像データCとキーワードとしてBさんの名称を入力して検索するだけで所望の画像データが検索結果として出力されるため、利便性がよいものとなる。
〔その他の実施形態〕
なお、上述した各実施形態は例示に過ぎず、本発明は、以下に例示するもの、それ以外の他の実施態様も含むものである。たとえば、第1実施形態に、第2実施形態を組み合わせたものとしてもよい。すなわち、第1実施形態におけるキーワード情報として色、形、構図のいずれかを表す言葉が設定できる項目と、第2実施形態におけるキーワード情報として名詞、または固有名詞を表す言葉が設定できる項目の2つを設け、ユーザの探している画像データによって、それらの2つの項目のいずれかにキーワードを入力させるようにしてもよい。または、1つの項目でキーワードをユーザに入力させて、入力されたキーワードに応じて、サーバー側で色、形、構図のいずれかを表す言葉なのか、名詞、または固有名詞を表す言葉なのかを判別可能なデータベースを参照して、検索対象となるクラスタを決定し、画像検索を行うようにしてもよい。
また、上述した実施形態では、キーワードによる画像検索対象の絞込み(すなわちクラスタの特定)を行ってから、検索画像データの画像検索処理を行うようにしているが、検索画像データの画像検索処理を最初に行って、その後に、キーワードと一致するクラスタに属する画像データのみを抽出して、画像検索処理結果として出力するようにしてもよい。あるいは、検索画像データの画像検索処理結果と、キーワードと一致するクラスタに属する画像データの検索結果の両方を画像検索結果として出力するようにしてもよい。
CP1…画像検索要求プログラム
CP2…Webブラウザプログラム
CM11…画像特定モジュール
CM12…検索要求モジュール
CM13…検索結果取得モジュール
SP1…画像検索プログラム(プログラムの一例)
SM11…検索条件取得モジュール(検索条件取得手段の一例)
SM12…画像検索モジュール
SM13…検索対象設定モジュール(検索条件取得手段の一例)
SM14…検索特徴量算出モジュール
SM15…類似画像検索モジュール(画像検索手段、画像出力手段の一例)
1…サーバー(画像検索装置の一例)
2…クライアント端末
11…CPU
12…メモリー
13…記憶装置
13…画像データベース
14…入出力インターフェース
21…CPU
22…メモリー
23…記憶装置
24…入出力インターフェース

Claims (3)

  1. 検索条件として設定されたオブジェクトの色、形、および構図のいずれかを意味する言葉であるキーワードおよび検索条件として設定された画像データを取得する検索条件取得手段と、
    前記検索条件取得手段で取得した前記画像データに含まれる所定のオブジェクトを含み
    、かつ、前記キーワードで指定された前記所定のオブジェクトの色、形、および構図のいずれかを満たす画像データを検索する画像検索手段と、
    前記画像検索手段によって検索された前記画像データを出力する画像出力手段と、を備え、
    前記画像検索手段は、
    前記キーワードが指定する画像の構図を意味する言葉に数値が含まれる場合に、前記所
    定のオブジェクトの個数をその数値分増加させた画像データを検索する
    ことを特徴とする画像検索装置。
  2. 画像検索装置画像データを検索する画像検索方法であって、
    検索条件として設定されたオブジェクトの色、形、および構図のいずれかを意味する言葉であるキーワードおよび検索条件として設定された画像データを取得する検索条件取得ステップと、
    前記検索条件取得ステップで取得した前記画像データに含まれる所定のオブジェクトを含み、かつ、前記キーワードで指定された前記所定のオブジェクトの色、形、および構図のいずれかを満たす画像データを検索する画像検索ステップと、
    前記画像検索ステップによって検索された前記画像データを出力する画像出力ステップと、を有し、
    前記画像検索ステップでは、
    前記キーワードが指定する画像の構図を意味する言葉に数値が含まれる場合に、前記所
    定のオブジェクトの個数をその数値分増加させた画像データを検索する
    ことを特徴とする画像検索方法。
  3. コンピューターを、
    検索条件として設定されたオブジェクトの色、形、および構図のいずれかを意味する言葉であるキーワードおよび検索条件として設定された画像データを取得する検索条件取得手段と、
    前記検索条件取得手段で取得した前記画像データに含まれる所定のオブジェクトを含み
    、かつ、前記キーワードで指定された前記所定のオブジェクトの色、形、および構図のいずれかを満たす画像データを検索する画像検索手段と、
    前記画像検索手段によって検索された前記画像データを出力する画像出力手段、として機能させ、
    前記画像検索手段は、
    前記キーワードが指定する画像の構図を意味する言葉に数値が含まれる場合に、前記所定のオブジェクトの個数をその数値分増加させた画像データを検索する
    ことを特徴とするプログラム。
JP2011180190A 2011-08-22 2011-08-22 画像検索装置、画像検索方法、およびプログラム Active JP5794036B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011180190A JP5794036B2 (ja) 2011-08-22 2011-08-22 画像検索装置、画像検索方法、およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011180190A JP5794036B2 (ja) 2011-08-22 2011-08-22 画像検索装置、画像検索方法、およびプログラム

Publications (2)

Publication Number Publication Date
JP2013045122A JP2013045122A (ja) 2013-03-04
JP5794036B2 true JP5794036B2 (ja) 2015-10-14

Family

ID=48009017

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011180190A Active JP5794036B2 (ja) 2011-08-22 2011-08-22 画像検索装置、画像検索方法、およびプログラム

Country Status (1)

Country Link
JP (1) JP5794036B2 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015122162A1 (ja) * 2014-02-14 2015-08-20 日本電気株式会社 映像検索装置
JP6316447B2 (ja) * 2014-05-15 2018-04-25 華為技術有限公司Huawei Technologies Co.,Ltd. オブジェクト検索方法および装置
US11748978B2 (en) 2016-10-16 2023-09-05 Ebay Inc. Intelligent online personal assistant with offline visual search database
US10860898B2 (en) 2016-10-16 2020-12-08 Ebay Inc. Image analysis and prediction based visual search
US11004131B2 (en) 2016-10-16 2021-05-11 Ebay Inc. Intelligent online personal assistant with multi-turn dialog based on visual search
US10970768B2 (en) 2016-11-11 2021-04-06 Ebay Inc. Method, medium, and system for image text localization and comparison
JP6810780B2 (ja) * 2018-10-11 2021-01-06 ネイバー コーポレーションNAVER Corporation Cnn基盤イメージ検索方法および装置
JP2020086733A (ja) 2018-11-20 2020-06-04 キヤノン株式会社 情報処理装置、制御方法およびプログラム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4748656B2 (ja) * 2005-06-14 2011-08-17 キヤノン株式会社 画像管理装置及びその制御方法、並びにプログラム及び記憶媒体
JP2011039944A (ja) * 2009-08-17 2011-02-24 Seiko Epson Corp 画像処理装置、画像処理方法および画像処理プログラム

Also Published As

Publication number Publication date
JP2013045122A (ja) 2013-03-04

Similar Documents

Publication Publication Date Title
JP5794036B2 (ja) 画像検索装置、画像検索方法、およびプログラム
US10043109B1 (en) Attribute similarity-based search
JP6544756B2 (ja) 画像の高次元特徴の類似性を比較するための方法及びデバイス
US11657084B2 (en) Correlating image annotations with foreground features
Whang et al. Overlapping community detection using neighborhood-inflated seed expansion
US9633045B2 (en) Image ranking based on attribute correlation
JP6228307B2 (ja) オンライン製品を推薦するための方法及びシステム
US9489401B1 (en) Methods and systems for object recognition
US8762390B2 (en) Query specific fusion for image retrieval
TW201909112A (zh) 圖像特徵獲取
US10380461B1 (en) Object recognition
US8582872B1 (en) Place holder image detection via image clustering
US20150161147A1 (en) Associating still images and videos
KR102113813B1 (ko) 정합 쌍을 이용한 신발 영상 검색 장치 및 방법
KR20010053788A (ko) 내용기반 이미지 검색 시스템 및 그 방법
Tang et al. Fusion similarity-based reranking for SAR image retrieval
JP2008102594A (ja) コンテンツの検索方法及び検索装置
WO2014118978A1 (ja) 学習方法、情報処理装置および学習プログラム
JP6377917B2 (ja) 画像検索装置及び画像検索プログラム
JP2014211730A (ja) 画像検索システム、画像検索装置および画像検索方法
JP2023130409A (ja) 情報処理装置、情報処理方法及びプログラム
JP6601965B2 (ja) 探索木を用いて量子化するプログラム、装置及び方法
JP7416091B2 (ja) 映像検索システム、映像検索方法、及びコンピュータプログラム
KR20130059263A (ko) 상품 판매 업체 관련 글 판단 방법 및 그 장치
JP2014146207A (ja) コンテンツをバイナリ特徴ベクトルの集合で表現することによって高速に検索する検索装置、プログラム及び方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140804

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20150107

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150217

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150218

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150416

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150512

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150624

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150714

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150727

R150 Certificate of patent or registration of utility model

Ref document number: 5794036

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350