JP2015099534A - 検索装置、検索方法、及びプログラム - Google Patents

検索装置、検索方法、及びプログラム Download PDF

Info

Publication number
JP2015099534A
JP2015099534A JP2013239802A JP2013239802A JP2015099534A JP 2015099534 A JP2015099534 A JP 2015099534A JP 2013239802 A JP2013239802 A JP 2013239802A JP 2013239802 A JP2013239802 A JP 2013239802A JP 2015099534 A JP2015099534 A JP 2015099534A
Authority
JP
Japan
Prior art keywords
region
image
similarity
unit
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2013239802A
Other languages
English (en)
Inventor
正志 西山
Masashi Nishiyama
正志 西山
英貴 大平
Hideki Ohira
英貴 大平
関根 真弘
Masahiro Sekine
真弘 関根
佑典 田副
Yusuke Tazoe
佑典 田副
馨 杉田
Kaoru Sugita
馨 杉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2013239802A priority Critical patent/JP2015099534A/ja
Priority to US14/543,289 priority patent/US20150139558A1/en
Publication of JP2015099534A publication Critical patent/JP2015099534A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content

Landscapes

  • Engineering & Computer Science (AREA)
  • Library & Information Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Processing Or Creating Images (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

【課題】逐次的且つ対話的な検索を行う。【解決手段】検索装置10は、取得部26と、受付部28と、算出部30と、決定部32と、を備える。取得部26は、第1画像を取得する。受付部28は、第1画像に含まれる第1領域の選択を受け付ける。算出部30は、検索対象の複数の第2画像の各々について、該第1領域との第1類似度と、該第1領域より前に受付部28が受け付けた第1領域としての第2領域との第2類似度と、を算出する。決定部32は、複数の第2画像の各々に対する第1類似度と第2類似度との論理演算の演算結果に基づいて、複数の第2画像の内、提示する第3画像を決定する。【選択図】図1

Description

本発明は、検索装置、検索方法、及びプログラムに関する。
目的とする商品を検索するために、画像中の領域を指定し、その領域に類似する領域を含む画像を検索する技術が開示されている。
特開2012−79186号公報
しかしながら、従来技術は、単に、指定された領域に類似する領域を含む画像を検索するのみであり、ユーザの興味の推移を反映させた逐次的且つ対話的な検索を行うことは出来なかった。
本発明が解決しようとする課題は、逐次的且つ対話的な検索を行うことができる、検索装置、検索方法、及びプログラムを提供することである。
実施形態の検索装置は、取得部と、受付部と、算出部と、決定部と、を備える。取得部は、第1画像を取得する。受付部は、第1画像に含まれる第1領域の選択を受け付ける。算出部は、検索対象の複数の第2画像の各々について、該第1領域との第1類似度と、該第1領域より前に受付部が受け付けた第1領域としての第2領域との第2類似度と、を算出する。決定部は、複数の第2画像の各々に対する第1類似度と第2類似度との論理演算の演算結果に基づいて、複数の第2画像の内、提示する第3画像を決定する。
検索装置の機能的構成を示すブロック図。 第2画像、第1画像、第1領域、及び第2領域の説明図。 画像上の位置の説明図。 第3画像の決定方法の説明図。 第3画像の決定方法の説明図。 検索処理の手順を示すフローチャート。 画像の推移を示す説明図。 表示制御の説明図。
以下に添付図面を参照して、検索装置、検索方法、及びプログラムの一の実施形態を詳細に説明する。
図1は、本実施の形態の検索装置10の機能的構成を示すブロック図である。検索装置10は、制御部12、撮像部13、入力部22、表示部24、第1記憶部16、第2記憶部18、及び第3記憶部20を備える。
本実施の形態では、検索装置10は、制御部12、撮像部13、入力部22、表示部24、第1記憶部16、第2記憶部18、及び第3記憶部20が一体的に設けられた携帯型端末(例えば、スマートフォンやタブレット型のPC(パーソナルコンピュータ)等)である場合を説明する。なお、検索装置10は、携帯型端末に限られない。例えば、検索装置10は、撮像部13、入力部22、表示部24、第1記憶部16、第2記憶部18、及び第3記憶部20の少なくとも1つと、制御部12と、が別体として設けられた構成であってもよい。この場合、例えば、検索装置10としては、PCが挙げられる。
以下、検索装置10について詳細に説明する。
表示部24は、各種画像を表示する(詳細後述)。表示部24としては、公知のLCD(Liquid Crystal Display)、CRT(Cathode Ray Tube)、PDP(Plasma Display Panel)等が挙げられる。
入力部22は、ユーザが各種の操作入力を行うための手段である。入力部22には、例えば、マウス、ボタン、リモコン、キーボード、及びマイク等の音声認識装置等が挙げられる。
なお、入力部22及び表示部24は、一体的に構成されていてもよい。具体的には、入力部22及び表示部24は、入力機能及び表示機能の双方を備えたUI(User Interface)部14として構成されていてもよい。UI部14には、タッチパネル付LCD等がある。
撮像部13は、撮像によって、第1画像を得る。撮像部13は、公知のデジタルカメラ、デジタルビデオカメラ等である。撮像部13は、ユーザによるUI部14の操作指示によって撮像指示が入力されると、被写体を撮像し、第1画像を得る。撮像部13は、撮像によって得た第1画像を、制御部12へ出力する。
第1画像は、第1領域を含む画像である。
第1領域は、第1画像に含まれる領域である。第1領域は、第1画像における一定の範囲を占める領域であり、且つ対比可能な領域である。第1領域は、第1画像の全体を示す領域であってもよいし、一部の領域であってもよい。本実施の形態では、第1領域は、第1画像の一部の領域である場合を説明する。
第1画像が衣服の画像である場合、第1領域は、例えば、襟、袖、ボタン、模様、ロゴ、マーク等である。第1領域は、ユーザによるUI部14の操作指示によって選択される。すなわち、ユーザは、UI部14の表示部24に表示された第1画像を確認しながら、入力部22を操作することにより、第1画像における第1領域を指示する。
第1画像は、検索装置10において、ユーザが第1領域を指示するときに用いる画像である。第1画像は、第1領域を含む画像であれはよい。
具体的には、第1画像は、服飾に関する画像、家具に関する画像、旅行に関する画像、家電に関する画像等であるが、これらに限られない。
服飾に関する画像とは、具体的には、服飾品、美容に関する物、等の、服飾に用いる物や髪型等であって、且つ視認可能な画像である。服飾品とは、衣服や装飾品を示す。衣服としては、例えば、上着、スカート、ズボン、靴、帽子等が挙げられる。装飾品は、例えば、指輪、ネックレス、ペンダント、イヤリングなど、身を飾るための工芸品である。美容に関する物とは、髪型、皮膚等に塗布する物である化粧品、等を示す。
本実施の形態では、一例として、第1画像が、衣服の画像である場合を説明する。
第1記憶部16は、ハードディスクドライブ装置(HDD)等の記憶媒体である。第1記憶部16は、複数の第2画像を予め記憶する。第2画像は、検索装置10における検索対象の画像である。第2画像は、例えば、商品や、商品に関する画像であるが、これらに限定されない。更に具体的には、第2画像は、服飾に関する画像、家具に関する画像、旅行に関する画像、家電に関する画像等であるが、これらに限られない。本実施の形態では、一例として、第2画像は、衣服の画像である場合を説明する。
第2記憶部18は、ハードディスクドライブ装置(HDD)等の記憶媒体である。第2記憶部18は、第1領域と、第2領域と、を記憶する。第2領域とは、制御部12がUI部14から最後に受け付けた第1領域より前に、UI部14から受け付けた第1領域である。すなわち、第2記憶部18は、制御部12がUI部14から受け付けた最新の第1領域を第1領域として記憶し、制御部12がUI部14から該第1領域より前に受け付けた第1領域を第2領域として記憶する。
具体的には、第2記憶部18は、第1領域と、第1領域を示す第1識別情報と、該第1領域が選択された日時と、を対応づけて記憶する。また、第2記憶部18は、第2領域と、第2領域を示す第2識別情報と、該第2領域が第1領域として選択された日時と、を対応づけて記憶する。
第3記憶部20は、ハードディスクドライブ装置(HDD)等の記憶媒体である。第3記憶部20は、第2領域と、該第2領域が第1領域として選択された日時と、を対応づけて記憶する。
なお、本実施の形態では、第1記憶部16、第2記憶部18、及び第3記憶部20は、別体として設けられている場合を説明する。しかし、第1記憶部16、第2記憶部18、及び第3記憶部20の少なくとも2つが、一体的に設けられた構成であってもよい。この場合、1の記憶部を複数のメモリ領域に分割し、各メモリ領域に、第1記憶部16、第2記憶部18、及び第3記憶部20の少なくとも1つに記憶されている情報の各々を個別に記憶すればよい。
制御部12は、CPU(Central Processing Unit)、ROM(Read Only Memory)、及びRAM(Random Access Memory)などを含んで構成されるコンピュータである。制御部12は、検索装置10全体を制御する。また、制御部12は、撮像部13、第1記憶部16、第2記憶部18、第3記憶部20、及びUI部14に電気的に接続されている。
制御部12は、取得部26、受付部28、算出部30、決定部32、第1制御部34、及び第2制御部36を備える。取得部26、受付部28、算出部30、決定部32、第1制御部34、及び第2制御部36の一部または全ては、例えば、CPUなどの処理装置にプログラムを実行させること、すなわち、ソフトウェアにより実現してもよいし、IC(Integrated Circuit)などのハードウェアにより実現してもよいし、ソフトウェアおよびハードウェアを併用して実現してもよい。
取得部26は、第1画像を取得する。本実施の形態では、取得部26は、撮像部13から第1画像を取得する。
なお、取得部26は、第1記憶部16に記憶されている複数の第2画像の内の1つを、第1画像として取得してもよい。この場合、例えば、ユーザによるUI部14の操作指示によって、第1記憶部16に記憶されている複数の第2画像の内の1つが選択される。取得部26は、該選択された第2画像を第1画像として取得すればよい。
また、後述する検索処理によって、表示部24に第3画像(詳細後述)が表示されている場合には、取得部26は、1つの第3画像を第1画像として取得する。具体的には、表示部24に複数の第3画像が表示されている場合、取得部26は、複数の第3画像の内、ユーザによるUI部14の操作指示によって選択された1つの第3画像を、第1画像として取得する。
第1制御部34は、各種画像やデータ等を表示部24へ表示する制御を行う。第1制御部34は、例えば、取得部26で取得した第1画像を表示部24へ表示する制御を行う。
受付部28は、第1画像における第1領域の選択を受け付ける。ユーザによるUI部14の操作指示によって、表示部24に表示された第1画像に含まれる第1領域が選択される。すると、UI部14は、選択された第1領域を制御部12へ出力する。
詳細には、例えば、第1制御部34は、第1画像を表示部24へ表示する制御を行った後に、入力部22の操作指示がなされると、バウンダリボックスを表示部24へ表示する制御を行う。そして、ユーザは、入力部22の操作指示によって、表示部24に表示された第1画像における所望の第1領域を、該バウンダリボックスの設定により選択する。すると、UI部14は、選択された第1領域を制御部12へ出力する。
受付部28は、UI部14から第1領域を受信することで、第1領域の選択を受け付ける。なお、上記第2領域は、具体的には、受付部28が第1領域の選択を受け付けたときに、該第1領域より前に受付部28が受け付けた第1領域である。
また、UI部14は、ユーザによる入力部22の操作指示によって選択された、第1画像上の位置を示す位置情報を受付部28へ出力してもよい。この場合、位置情報を受け付けた受付部28は、第1画像における該位置情報によって特定される位置からセグメンテーションにより自動領域切出し処理を実行することで、第1領域を受け付けてもよい。
第2制御部36は、各種情報を、第1記憶部16、第2記憶部18、または第3記憶部20へ記憶する制御を行う。また、第2制御部36は、各種情報を、第1記憶部16、第2記憶部18、または第3記憶部20から削除、更新する制御を行う。
本実施の形態では、第2制御部36は、受付部28が第1領域の選択を受け付けたときに、該第1領域を第1識別情報に対応づけて第2記憶部18へ記憶する制御を行う。また、第2制御部36は、後述する決定部32によって第3画像が決定されたときに、該第1領域を第2領域として、第2記憶部18へ記憶する制御を行う。
図2は、第2画像、第1画像、第1領域、及び第2領域の説明図である。例えば、第1記憶部16が、衣服の画像である複数の第2画像40〜43を予め記憶する(図2(A)参照)。例えば、取得部26が、中央に熊のマークの入った衣服の画像である第1画像55を取得する(図2(B)参照)。また、受付部28が、UI部14から第1画像55における熊のマークの領域55Aの選択(図2(B)中、P参照)を、第1領域の選択として受け付けたとする。
この場合、第2制御部36は、第1領域としての領域55Aを、第1領域を示す第1識別情報に対応づけて第2記憶部18へ記憶する制御を行う(図2(C)参照)。また、第2制御部36は、第2記憶部18に記憶されている、受付部28が該第1領域より前に受け付けた第1領域としての領域44Aを、第2領域を示す第2識別情報に対応づけて第2記憶部18へ記憶する制御を行う(図2(C)参照)。これにより、第2制御部36は、受付部28が受け付けた最新の第1領域より前に受け付けた第1領域を、第2領域として第2記憶部18に記憶する制御を行う。
図1に戻り、算出部30は、第1記憶部16に記憶されている検索対象の複数の第2画像の各々について、第1類似度及び第2類似度を算出する。第1類似度は、第2画像と、第1領域と、の類似度を示す。第2類似度は、第2画像と、第2領域と、の類似度を示す。
具体的には、算出部30は、第1領域の第1特徴量、第2画像における第1領域に対応する第3領域の第3特徴量を算出する。そして、算出部30は、第1特徴量及び第2特徴量を用いて、第1類似度を算出する。また、算出部30は、第2領域の第2特徴量、第2画像における第2領域に対応する第4領域の第4特徴量を算出する。そして、算出部30は、第2特徴量及び第4特徴量を用いて、第2類似度を算出する。
第2画像における第3領域の特定には、公知の方法を用いればよい。同様に、第2画像における第4領域の特定には、公知の方法を用いればよい。
上記第1特徴量、第2特徴量、第3特徴量、及び第4特徴量の各特徴量は、各領域を解析することにより得られる数値である。各領域とは、上述した、第1領域、第2領域、第3領域、及び第4領域である。この数値は、各領域の特徴に対応する数値またはその組み合わせである。なお、以下では、第1特徴量、第2特徴量、第3特徴量、及び第4特徴量を総称する場合には、単に、特徴量と称して説明する。
具体的には、算出部30は、特徴量算出のための第1条件を予め定める。この第1条件は、例えば、領域の色、領域の形状、及び領域を予め定めた条件で分類した種類等である。
算出部30は、例えば、第1領域の色(R、G、Bの画素値)、第1領域の形状、及び第1領域の種類の各々を数値化した値を、第1特徴量として算出する。また、算出部30は、第3領域の色(R、G、Bの画素値)、第3領域の形状、及び第3領域の種類の各々を数値化した値を、第3特徴量として算出する。
同様に、算出部30は、例えば、第2領域の色(R、G、Bの画素値)、第2領域の形状、及び第2領域の種類の各々を数値化した値を、第2特徴量として算出する。また、算出部30は、第4領域の色(R、G、Bの画素値)、第4領域の形状、及び第4領域の種類の各々を数値化した値を、第4特徴量として算出する。
すなわち、算出部30は、第1条件に応じて、HoG特徴量や、SIFT特徴量、またはこれらの組合せを、特徴量として算出する。なお、第1条件は、適宜設定すればよく、上記条件に限定されない。
なお、算出部30は、第2記憶部18から、第2領域に対応する第2特徴量を読取ることによって、第2特徴量を算出してもよい。この場合、第2制御部36は、算出部30によって第1領域の第1特徴量が算出される度に、第1特徴量を、第1領域と第1識別情報とに対応づけて第2記憶部18に記憶する。この第1領域は、上述したように、第2制御部36によって、後述する決定部32によって第3画像が決定されたときに、第2領域として第2記憶部18へ記憶される。このため、第2制御部36によって、第2記憶部18には、第2領域と、第2領域の第2特徴量と、第2識別情報と、が対応づけて記憶された状態となる。そして、算出部30は、この第2特徴量を第2記憶部18から読取ることによって、第2特徴量を算出すればよい。
次に、算出部30は、第1特徴量と、第3特徴量と、の類似度を算出することによって、第1類似度を算出する。また、算出部30は、第2特徴量と、第4特徴量と、の類似度を算出することによって、第2類似度を算出する。
例えば、算出部30は、第1特徴量と第3特徴量とが一致する場合を第1類似度「1」とし、第1特徴量と第3特徴量とが予め定めた値以上異なる場合を第1類似度「0」として、第1特徴量と第3特徴量との値が近いほど第1類似度「0」から第1類似度「1」に向かって大きくなるように、第1類似度を算出する。
同様に、算出部30は、第2特徴量と第4特徴量とが一致する場合を第2類似度「1」とし、第2特徴量と第4特徴量とが予め定めた値以上異なる場合を第2類似度「0」として、第2特徴量と第4特徴量との値が近いほど第2類似度「0」から第2類似度「1」に向かって大きくなるように、第2類似度を算出する。
具体的には、算出部30は、SSD(Sum of Squared Difference)、SAD(Sum of Absolute Difference)、正規化相互相関などを用いて、第1類似度、及び第2類似度を算出すればよい。
なお、算出部30は、各領域の画像上における幾何学的な関係を加味して、第1類似度及び第2類似度を算出してもよい。幾何学的な関係とは、各領域の画像上における位置、各領域の画像上における大きさ(比率)、各領域の画像上における範囲(占める割合)、各領域の画像上における色ヒストグラムの相関値、及び各領域の画像上における輝度勾配ヒストグラムの相関値、の少なくとも1つである。
この場合、算出部30は、第1特徴量、第1画像における第1領域の幾何学的な関係、第3特徴量、及び第2画像における第3領域の幾何学的な関係を用いて、複数の第2画像毎に第1類似度を算出する。また、算出部30は、第2特徴量、第1画像における第2領域の幾何学的な関係、第4特徴量、及び第2画像における第4領域の幾何学的な関係を用いて、複数の第2画像毎に第2類似度を算出する。
なお、第1画像における第1領域の幾何学的な関係、第2画像における第3領域の幾何学的な関係、第1画像における第2領域の幾何学的な関係、及び第2画像における第4領域の幾何学的な関係は、各々の画像における各領域の幾何学的な関係であってもよいし、各々の画像に含まれる衣服領域における各領域の幾何学的な関係であってもよい。
図3は、幾何学的な関係の一例として、各領域の画像上における位置の説明図である。図3に示すように、例えば、第2画像45における第4領域55Aの位置は、第2画像45における特定の位置(例えば、位置Q)を原点とする位置座標である。なお、第2画像45における第4領域55Aの位置は、第2画像45に含まれる衣服領域45Aにおける相対位置を示す情報であってもよい。
幾何学的な関係として、各領域の画像上における大きさ(比率)を用いる場合、図3中、第2画像45における第4領域55Aの大きさは、第2画像45の幅と第4領域55Aの幅との比率で表せばよい。また、また、第2画像45における第4領域55Aの大きさは、第2画像45の高さと第4領域55Aの高さとの比率であってもよい。また、第2画像45における第4領域55Aの大きさは、第2画像45の高さと幅との比率と、第4領域55Aの高さと幅との比率と、の比率であってもよい。
また、第1画像における第1領域の位置や大きさ、第2画像における第3領域の位置や大きさ、及び第1画像における第2領域の位置や大きさについても同様である。
なお、算出部30は、各領域の画像上における幾何学的な関係として、各領域の画像上における位置、各領域の画像上における大きさ(比率)、各領域の画像上における範囲(占める割合)、各領域の画像上における色ヒストグラムの相関値、各領域の画像上における輝度勾配ヒストグラムの相関値、の少なくとも1つを用いればよく、これらの値(位置、大きさ、範囲、色ヒストグラムの相関値、輝度勾配ヒストグラムの相関値)の内の複数を組み合わせて用いてもよい。
図1に戻り、この場合、算出部30は、第1特徴量と第3特徴量とが一致し、且つ、第1画像における第1領域の位置と第2画像における第3領域の位置とが一致する場合を、第1類似度「1」とする。算出部30は、第1特徴量と第3特徴量とが予め定めた値以上異なり、且つ、第1画像における第1領域の位置と第2画像における第3領域の位置とが予め定めた値以上異なる場合を第1類似度「0」とする。そして、算出部30は、第1特徴量と第3特徴量との値が近く、且つ第1画像における第1領域の位置と第2画像における第3領域の位置とが近いほど、第1類似度「0」から第1類似度「1」に向かって大きくなるように、第1類似度を算出する。
同様に、算出部30は、第2特徴量と第4特徴量とが一致し、且つ、第1画像における第2領域の位置と第2画像における第4領域の位置とが一致する場合を第2類似度「1」とする。また、算出部30は、第2特徴量と第4特徴量とが予め定めた値以上異なり、且つ、第1画像における第2領域の位置と第2画像における第4領域の位置とが予め定めた値以上異なる場合を第2類似度「0」とする。そして、算出部30は、第2特徴量と第4特徴量との値が近く、且つ、第1画像における第2領域の位置と第2画像における第4領域の位置が近いほど、第2類似度「0」から第2類似度「1」に向かって大きくなるように、第2類似度を算出する。
決定部32は、複数の第2画像の内、第1領域と、第2領域と、の双方に類似、または非類似の第2画像を、ユーザへ提示する第3画像として決定する。第3画像は、第2画像の内、ユーザへ提示する画像として決定された画像である。
本実施の形態では、決定部32は、複数の第2画像の各々に対する、第1類似度と第2類似度との論理演算を行う。決定部32は、この論理演算の演算結果に基づいて、複数の第2画像の内、ユーザへ提示する第3画像を決定する。
決定部32は、論理積(AND)、論理和(OR)、否定(NOT)、及び排他的論理和(XOR)の少なくとも1つを用いた論理演算を行う。
決定部32には、例えば、予め、何れの種類の論理演算を用いるかが設定されている。例えば、決定部32の図示を省略するメモリには、論理積(AND)、論理和(OR)、否定(NOT)、及び排他的論理和(XOR)の内の何れかの種類が記憶されている。この論理演算の種類は、UI部14の操作指示によって適宜変更可能である。
そして、決定部32は、予め設定された種類の論理演算を行うことにより、複数の第2画像毎に、第1類似度と第2類似度との論理演算の演算結果を算出する。
なお、第2記憶部18に第2領域が記憶されていない場合には、算出部30は、第1類似度のみを算出する。この場合、決定部32は、第1類似度を演算結果として用いればよい。すなわち、この場合、決定部32は、第2類似度を空集合として、複数の第2画像毎に、第1類似度と第2類似度との論理演算の演算結果を算出すればよい。
なお、複数の第2領域が第2記憶部18に記憶されていたとする。この場合、算出部30は、第2画像毎に、複数の第2領域との、複数の第2類似度を算出する。決定部32は、各第2画像について、第1類似度と、複数の第2類似度の各々と、の論理演算の演算結果を算出する。
このため、第2記憶部18に、複数の第2領域が記憶されている場合には、決定部32は、第1類似度と複数の第2類似度の各々との論理演算の演算結果として、1つの第2画像に対して、複数の演算結果を算出することとなる。
なお、各第2画像について、複数の第2領域が第2記憶部18に記憶されており、算出部30によって複数の第2類似度が算出された場合に、算出部30が、1つの第2画像に対して1つの演算結果を算出してもよい。
この場合、決定部32の図示を省略するメモリは、例えば、論理演算の演算順と、論理演算の種類と、を対応づけて予め記憶する。
例えば、メモリは、論理演算の演算順「1」に対応する論理演算の種類「論理積(AND)」、論理演算の演算順「2」に対応する論理演算の種類「論理和(OR)」、論理演算の演算順「3」に対応する論理演算の種類「論理積(AND)」を予め記憶する。なお、論理演算の演算順及び対応する論理演算の種類は、ユーザによるUI部14の操作指示によって適宜変更可能である。
そして、決定部32は、各第2画像について、第1類似度と、複数の第2類似度の内の論理演算を未実行の1つの第2類似度と、について、論理演算の演算順「1」に対応する種類の論理演算を行う。そして、決定部32は、論理演算を行う度に、論理演算の演算順を1ずつカウントアップし、前回演算した演算結果と、複数の第2類似度の内の論理演算を未実行の1つの第2類似度と、について、論理演算の演算順に対応する種類の論理演算を行う、一連の処理を繰り返し実行する。そして、決定部32は、最終的に得られた演算結果を、第2画像に対応する演算結果として用いる。これにより、決定部32は、1つの第2画像について、複数の第2類似度が算出された場合であっても、1つの演算結果を得ることができる。
決定部32は、複数の第2画像毎に算出された第1類似度と第2類似度との論理演算の演算結果が大きい順または小さい順に予め定めた数の第2画像を、第3画像として決定する。
決定部32は、例えば、昇順または降順を示す情報と、該予め定めた数(以下、表示数と称する)を示す情報と、を、図示を省略するメモリに予め記憶する。そして、決定部32は、該メモリに、「降順」を示す情報が記憶されている場合、複数の第2画像毎に算出された第1類似度と第2類似度との論理演算の演算結果が大きい順に、該表示数分の第2画像を、第3画像として決定する。
一方、決定部32は、該メモリに、「昇順」を示す情報が記憶されている場合、複数の第2画像毎に算出された第1類似度と第2類似度との論理演算の演算結果が小さい順に、該表示数分の第2画像を、第3画像として決定する。
なお、決定部32の図示を省略するメモリに記憶する、上記「昇順」または「降順」を示す情報は、ユーザによるUI部14の操作指示によって適宜変更可能である。
例えば、第1制御部34が、第1画像内の気に入った第1領域を指示することを示す第1ボタン、及び、第1画像内の気に入らない第1領域を指示することを示す第2ボタンを、表示部24に表示する制御を行う。そして、ユーザによる入力部22の操作指示によって、第1ボタンが指示されたときに、UI部14は、第1ボタンが指示されたことを示す情報を制御部12へ出力する。また、ユーザによる入力部22の操作指示によって第2ボタンが指示されたときに、UI部14は、第2ボタンが指示されたことを示す情報を制御部12へ出力する。
制御部12の決定部32は、第1ボタンが指示されたことを示す情報をUI部14から受け付けると、「降順」を示す情報を、図示を省略するメモリに記憶する。一方、決定部32は、第2ボタンが指示されたことを示す情報をUI部14から受け付けると、「昇順」を示す情報を、図示を省略するメモリに記憶すればよい。
決定部32が、「昇順」を示す情報に基づいて、複数の第2画像毎に算出された第1類似度と第2類似度との論理演算の演算結果が小さい順に、予め定められた表示数分の第2画像を、第3画像として決定したとする。この場合、決定部32は、複数の第2画像の内、第1領域と、第2領域と、の双方に非類似の第2画像を、ユーザへ提示する第3画像として決定することとなる。
一方、決定部32が、「降順」を示す情報に基づいて、複数の第2画像毎に算出された第1類似度と第2類似度との論理演算の演算結果が大きい順に、予め定められた表示数分の第2画像を、第3画像として決定したとする。この場合、決定部32は、複数の第2画像の内、第1領域と、第2領域と、の双方に類似の第2画像を、ユーザへ提示する第3画像として決定することとなる。
表示数についても同様に、ユーザによるUI部14の操作指示によって適宜変更可能である。
第3画像の決定方法について、更に具体的に説明する。
図4は、第3画像の決定方法の説明図である。図4に示すように、例えば、第2画像として、衣服の画像である複数の第2画像40〜43が、予め第1記憶部16に記憶されていたとする。また、例えば、取得部26が取得した第1領域が、熊のマークの領域55Aであったとする。また、第2領域が、水玉模様の領域44Aであったとする。
この場合、算出部30は、複数の第2画像40〜43の各々について、第1領域である領域55Aとの第1類似度、及び第2領域である領域44Aとの第2類似度を算出する。
図4に示す例では、第2画像40における、領域55Aとの第1類似度は「0.9」であり、領域44Aとの第2類似度は「0.2」である。また、第2画像41における、領域55Aとの第1類似度は「0.8」であり、領域44Aとの第2類似度は「0.8」である。また、第2画像42における、領域55Aとの第1類似度は「0.8」であり、領域44Aとの第2類似度は「0.7」である。また、第2画像43における、領域55Aとの第1類似度は「0.1」であり、領域44Aとの第2類似度は「0.2」である。
次に、決定部32が、複数の第2画像40〜43の各々について、第1類似度と第2類似度との論理演算の演算結果を算出する。
例えば、決定部32の図示を省略するメモリに、論理演算の種類として「論理積(AND)」を示す情報が予め記憶されていたとする。
この場合、決定部32は、複数の第2画像40〜43の各々について、第1類似度と第2類似度との論理積(AND)の演算結果を算出する。これにより、第2画像40〜43の各々の演算結果は、「0.18」、「0.64」、「0.56」、「0.02」となる。そして、決定部32は、図示を省略するメモリに「降順」及び表示数「2」が記憶されている場合、演算結果の大きい順に2つの第2画像41、42を、ユーザへ提示する第3画像として決定する。
また、例えば、決定部32の図示を省略するメモリに、論理演算の種類として「論理和(OR)」を示す情報が予め記憶されていたとする。
この場合、決定部32は、複数の第2画像40〜43の各々について、第1類似度と第2類似度との論理和(OR)の演算結果を算出する。これにより、第2画像40〜43の各々の演算結果は、「0.9」、「0.8」、「0.8」、「0.2」となる。そして、決定部32は、図示を省略するメモリに「降順」及び表示数「3」が記憶されている場合、演算結果の大きい順に3つの第2画像40、41、42を、ユーザへ提示する第3画像として決定する。
また、例えば、決定部32の図示を省略するメモリに、論理演算の種類として「否定(NOT)」を示す情報が予め記憶されていたとする。
この場合、決定部32は、複数の第2画像40〜43の各々について、第1類似度と第2類似度との否定(NOT)の演算結果を算出する。これにより、第2画像40〜43の各々の演算結果は、「0.72」、「0.16」、「0.24」、「0.08」となる。そして、決定部32は、図示を省略するメモリに「降順」及び表示数「2」が記憶されている場合、演算結果の大きい順に2つの第2画像40、42を、ユーザへ提示する第3画像として決定する。
なお、決定部32は、真理値を用いて、第3画像を決定してもよい。
具体的には、決定部32は、第1類似度が第1閾値を超える場合に該第1類似度を真とし、第1類似度が第1閾値以下である場合に第1類似度を偽とする第1真理値を設定する。また、決定部32は、第2類似度が第2閾値を超える場合に該第2類似度を真とし、第2類似度が第2閾値以下である場合に該第2類似度を偽とする第2真理値を設定する。これらの第1閾値及び第2閾値は、適宜調整すればよく、同じ値であってもよいし、異なる値であってもよい。
更に、決定部32は、第1類似度としての第1真理値と、第2類似度としての第2真理値との演算結果に基づいて、第3画像を決定してもよい。
図5は、真理値を用いた、第3画像の決定方法の説明図である。図5に示すように、例えば、第2画像として、衣服の画像である複数の第2画像40〜43が、予め第1記憶部16に記憶されていたとする。また、例えば、取得部26が取得した第1領域が、熊のマークの領域55Aであったとする。また、第2領域が、水玉模様の領域44Aであったとする。
この場合、算出部30は、複数の第2画像40〜43の各々について、領域55Aとの第1類似度としての第1真理値、及び領域44Aとの第2類似度としての第2真理値を算出する。
図5に示す例では、一例として、第1閾値及び第2閾値は、0.5である場合を示した。また、図5に示す例では、第2画像40における、領域55Aとの第1類似度は「0.9」、第1真理値は「1」、領域44Aとの第2類似度は「0.2」、第2真理値は「0」である。また、第2画像41における、領域55Aとの第1類似度は「0.8」、第1真理値は「1」、領域44Aとの第2類似度は「0.8」、第2真理値は「1」である。また、第2画像42における、領域55Aとの第1類似度は「0.8」、第1真理値は「1」、領域44Aとの第2類似度は「0.7」、第2真理値は「1」である。また、第2画像43における、領域55Aとの第1類似度は「0.1」、第1真理値は「0」、領域44Aとの第2類似度は「0.2」、第2真理値は「0」である。
次に、決定部32が、複数の第2画像40〜43の各々について、第1真理値と第2真理値との論理演算の演算結果を算出する。
例えば、決定部32の図示を省略するメモリに、論理演算の種類として「論理積(AND)」を示す情報が予め記憶されていたとする。
この場合、決定部32は、複数の第2画像40〜43の各々について、第1真理値と第2真理値との論理積(AND)の演算結果を算出する。そして、決定部32は、演算結果が「1」となる第2画像41、42を、第3画像として決定する。
また、例えば、決定部32の図示を省略するメモリに、論理演算の種類として「論理和(OR)」を示す情報が予め記憶されていたとする。
この場合、決定部32は、複数の第2画像40〜43の各々について、第1真理値と第2真理値との論理和(OR)の演算結果を算出する。そして、決定部32は、演算結果が「1」となる第2画像40、41、42を、ユーザへ提示する第3画像として決定する。
また、例えば、決定部32の図示を省略するメモリに、論理演算の種類として「否定(NOT)」を示す情報が予め記憶されていたとする。
この場合、決定部32は、複数の第2画像40〜43の各々について、第1真理値と第2真理値との否定(NOT)の演算結果を算出する。これにより、決定部32は、演算結果が「1」になる第2画像40を、ユーザへ提示する第3画像として決定する。
第1制御部34は、上記制御に加えて、決定部32で決定された第3画像を、表示部24へ表示する制御を行う。
次に、制御部12で実行する検索処理を説明する。
図6は、本実施の形態の検索装置10で実行する検索処理の手順を示すフローチャートである。
まず、取得部26が撮像部13から第1画像を取得する(ステップS100)。次に、受付部28が、ステップS100で取得した第1画像における第1領域の選択を受け付けたか否かを判断する(ステップS102)。
例えば、第1制御部34が、ステップS100で取得した第1画像を表示部24へ表示する制御を行う。ユーザは、表示部24に表示された第1画像を確認しながら、入力部22を操作することにより、第1画像における第1領域を入力する。UI部14は、入力部22によって入力された第1領域を、制御部12へ出力する。受付部28は、UI部14から第1領域を受け付けたか否かを判別することによって、ステップS102の判断を行う。
受付部28が、第1領域の選択を受け付けない場合には(ステップS102:No)、後述するステップS124へ進む。一方、受付部28が、第1領域の選択を受け付けると(ステップS102:Yes)、ステップS104へ進む。
ステップS104では、第2制御部36が、ステップS102(または後述するステップS122)で受け付けた第1領域を、第1領域であることを示す第1識別情報と、該第1領域が選択された日時と、に対応づけて第2記憶部18に記憶する(ステップS104)。なお、第2制御部36は、第1領域、第1識別情報、及び該第1領域が選択された日時と共に、該第1領域が選択されたときの検索装置10の位置情報や、該第1領域が選択されたときに検索装置10を操作していたユーザのユーザ名等の詳細情報を対応づけて第2記憶部18に記憶してもよい。
次に、算出部30が、第2記憶部18に記憶されている第2領域を読取る(ステップS106)。第2記憶部18は、第2識別情報に対応づけて、第2領域を記憶している。このため、算出部30は、第2識別情報に対応する第2領域を読取ることによって、ステップS106の処理を行う。
算出部30は、第1記憶部16に記憶されている複数の第2画像の各々について、特徴量を算出する(ステップS108)。詳細には、算出部30は、ステップS102(または後述するステップS122)で受け付けた第1領域の第1特徴量、及び、複数の第2画像の各々における該第1領域に対応する第3領域の第3特徴量を算出する。また、算出部30は、ステップS106で読取った第2領域の第2特徴量、及び、複数の第2画像の各々における該第2領域に対応する第4領域の第4特徴量を算出する。
次に、算出部30は、第1記憶部16に記憶されている複数の第2画像毎に、第1類似度と第2類似度とを算出する(ステップS110)。詳細には、算出部30は、ステップS108で算出した第1特徴量及び第3特徴量を用いて、複数の第2画像毎に、第1類似度を算出する。また、算出部30は、ステップS108で算出した第2特徴量及び第4特徴量を用いて、複数の第2画像毎に、第2類似度を算出する。
次に、決定部32が、複数の第2画像毎に算出された第1類似度と第2類似度との論理演算を行う(ステップS112)。そして、決定部32は、ステップS112の論理演算の演算結果に基づいて、複数の第2画像の内、ユーザへ提示する第3画像を決定する(ステップS114)。
次に、第1制御部34が、ステップS114で決定された第3画像を、表示部24へ表示する制御を行う(ステップS116)。
次に、第2制御部36が、ステップS102で受け付けた第1領域を、第2領域として、第2記憶部18に記憶する(ステップS118)。第2制御部36は、ステップS104で第2記憶部18に記憶した第1領域を、第2領域として該第2記憶部18に記憶する。具体的には、第2制御部36は、ステップS104で、第1領域に対応づけて記憶した第1識別情報を、第2領域を示す第2識別情報に変更することによって、ステップS118の処理を行う。このため、第2領域は、該第2領域が第1領域として選択された日時と、該第2領域を示す第2識別情報と、に対応づけて第2記憶部18に記憶された状態となる。
なお、第2制御部36は、ステップS114の処理の後で、且つステップS122の処理の前に、ステップS118の処理を実行すればよい。
次に、取得部26が、ステップS116で表示部24に表示された第3画像の内の1つを、第1画像として取得する(ステップS120)。次に、受付部28は、ステップS120で取得した第1画像における第1領域の選択を受け付けたか否かを判断する(ステップS122)。
例えば、ユーザは、表示部24に表示された1または複数の第3画像を確認しながら、入力部22を操作することにより、1つの第3画像に含まれる第1領域を入力する。UI部14は、入力部22によって入力された第3画像及び第1領域を、制御部12へ出力する。ステップS120の処理において、取得部26は、UI部14から受け付けた第3画像を、第1画像として取得する。また、受付部28は、UI部14から第1領域を受け付けたか否かを判別することによって、ステップS122の判断を行う。
なお、ユーザによる、表示部24に表示された1または複数の第3画像の内の1つの選択と、第1領域の選択と、は、上述のように同時に行う形態に限られず、別々のステップで行うようにしてもよい。
受付部28が、第1領域の選択を受け付けた場合には(ステップS122:Yes)、上記ステップS104へ進む。一方、受付部28が、第1領域の選択を受け付けない場合(ステップS122:No)、ステップS124へ進む。
制御部12は、検索処理の終了を示す終了指示をUI部14から受け付けたか否かを判断する(ステップS124)。例えば、第1制御部34は、ステップS116において第3画像を表示部24へ表示する制御を行うときに、検索処理の終了を指示するための指示ボタン画像を表示部24へ表示する制御を行う。そして、ユーザによる入力部22の操作指示によって、該指示ボタン画像の領域が指示されると、UI部14は、検索処理の終了を示す信号を制御部12へ出力する。UI部14は、この信号を受信したか否かを判別することによって、ステップS124の判断を行う。
制御部12が、終了指示を受け付けない場合(ステップS124:No)、ステップS100へ進む。一方、制御部12が、終了指示を受け付けた場合(ステップS124:Yes)、ステップS126へ進む。
ステップS126では、第2制御部36が、ステップS100〜ステップS124:Yesまでの一連の処理によって第2記憶部18に記憶された、第1領域及び該第1領域が選択された日時と、第2領域及び該第2領域が第1領域として選択された日時と、を該一連の処理を1単位として、第3記憶部20に記憶する。このとき、第2制御部36は、第1領域については、対応する第1識別情報を第2識別情報に変更する。このため、第2記憶部18に記憶されていた第1領域は、第2領域として第3記憶部20に記憶される。
なお、第2制御部36は、第2記憶部18に記憶されている第2領域が第1領域として選択された日時と共に、該第2領域が第1領域として選択されたときの検索装置10の位置情報や、該第2領域が第1領域として選択されたときに検索装置10を操作していたユーザのユーザ名等の詳細情報を、第2領域に対応づけて第3記憶部20に記憶してもよい。
このように、第3記憶部20は、第2領域と、第2領域が第1領域として選択された日時と、該第2領域が第1領域として選択されたときの検索装置10の位置情報、及び該第2領域が第1領域として選択されたときに検索装置10を操作していたユーザのユーザ名等の詳細情報と、を対応づけて記憶する。このため、第3記憶部20は、検索装置10における検索履歴を記憶することができる。
次に、第2制御部36は、第2記憶部18をクリアし(ステップS128)、本ルーチンを終了する。
制御部12が、ステップS100〜ステップS128の処理を実行することによって、ユーザの興味の推移を反映させた逐次的且つ対話的な検索を行うことができる。
図7は、検索処理によって表示部24に表示される画像の推移を示す説明図である。なお、図7では、決定部32は、演算結果が大きい順に予め定めた数の第2画像を、第3画像として決定する場合を示した。
例えば、取得部26が、撮像部13から第1画像55を取得したとする。第1制御部34は、この第1画像55を表示部24に表示する制御を行う(図7(A))。
そして、ユーザによるUI部14の操作指示によって、第1画像55における熊のマークの領域55Aが選択される(図7(A)中、P参照)。これにより、受付部28は、第1画像55における熊のマークの領域55Aを第1領域として受け付ける。第2制御部36は、領域55Aを、第1領域を示す第1識別情報に対応づけて第2記憶部18に記憶する制御を行う。
そして、図6に示すステップS100〜ステップS116の処理が実行されることによって、決定部32は、例えば、第3画像44、45、40を決定する。第1制御部34は、これらの第3画像44、45、40を、表示部24に表示する制御を行う(図7(B)参照)。これらの第3画像44、45、40には、第1領域として受け付けた領域55A、または該領域55Aに類似する領域が含まれている。そして、第2制御部36は、領域55Aに対応する第1識別情報を、第2領域を示す第2識別情報に変更することによって、領域55Aを第2領域として第2記憶部18に記憶する制御を行う。
さらに、ユーザによるUI部14の操作指示によって、複数の第3画像44、45、40の内の、第3画像44について、水玉模様の領域44Aが選択される(図7(B)中、P参照)。これにより、取得部26は、第3画像44を第1画像44として取得し、受付部28は、第1画像44における水玉模様の領域44Aを第1領域として受け付ける。第2制御部36は、領域44Aを、第1領域を示す第1識別情報に対応づけて第2記憶部18に記憶する制御を行う。
そして、図6に示すステップS100〜ステップS116の処理が実行されることによって、算出部30が、第2記憶部18に記憶されている第1領域としての領域44A及び第2領域としての領域55Aを用いて、各第2画像について、第1類似度及び第2類似度を算出する。そして、決定部32は、第1類似度と第2類似度との論理演算の演算結果に基づいて、例えば、第3画像42、46、41、47を決定する。第1制御部34は、これらの第3画像42、46、41、47を、表示部24に表示する制御を行う(図7(C)参照)。
これらの第3画像42、46、41、47には、第1領域として受け付けた領域44Aまたは該領域44Aに類似する領域と、第2領域としての領域55Aまたは該領域55Aに類似する領域と、の双方が含まれている。そして、第2制御部36は、領域44Aに対応する第1識別情報を、第2領域を示す第2識別情報に変更することによって、領域44Aを第2領域として第2記憶部18に記憶する制御を行う。
さらに、ユーザによるUI部14の操作指示によって、複数の第3画像42、46、41、47の内の、第3画像42について、襟の領域42Aが選択される(図7(C)中、P参照)。これにより、取得部26は、第3画像42を第1画像42として取得し、受付部28は、第1画像42における襟の領域42Aを第1領域として受け付ける。第2制御部36は、領域42Aを、第1領域を示す第1識別情報に対応づけて第2記憶部18に記憶する制御を行う。
そして、図6に示すステップS100〜ステップS116の処理が実行されることによって、算出部30が、第2記憶部18に記憶されている第1領域としての領域44A、及び第2領域としての領域55A、領域44Aを用いて、各第2画像について、第1類似度及び第2類似度を算出する。そして、決定部32は、第1類似度と第2類似度との論理演算の演算結果に基づいて、例えば、第3画像48、49、50を決定する。第1制御部34は、これらの第3画像48、49、50を、表示部24に表示する制御を行う(図7(D)参照)。
これらの第3画像48、49、50には、第1領域として受け付けた領域42Aまたは該領域42Aに類似する領域と、第2領域としての領域55Aまたは該領域55Aに類似する領域と、第2領域としての領域44Aまたは該領域44Aに類似する領域と、の全てが含まれている。そして、第2制御部36は、領域42Aに対応する第1識別情報を、第2領域を示す第2識別情報に変更することによって、領域42Aを第2領域として第2記憶部18に記憶する制御を行う。
このように、ユーザは、表示部24に第3画像が表示される度に、第1領域を選択する。検索装置10は、選択された第1領域と、第2領域と、の双方に類似または非類似の第2画像を、ユーザに提示する第3画像として決定し、表示部24に表示する。このため、ユーザは、第1領域を順次指定することで、複数の第2画像の中から、最終的に目的とする第2画像を表示部24に表示させることができる。
以上説明したように、本実施の形態の検索装置10は、取得部26が、第1画像を取得する。受付部28は、第1画像に含まれる第1領域の選択を受け付ける。算出部30は、検索対象の複数の第2画像の各々について、第1領域との第1類似度と、第2領域との第2類似度と、を算出する。決定部32は、第1類似度と第2類似度との論理演算の演算結果に基づいて、複数の第2画像の内、ユーザへ提示する第3画像を決定する。
このように、検索装置10は、第1類似度のみではなく、第1類似度と第2類似度との双方を用いた論理演算の演算結果に基づいて、第3画像を決定する。
従って、本実施の形態の検索装置10は、ユーザの興味の推移を反映させた、逐次的且つ対話的な検索を行うことができる。
なお、上記実施の形態では、第1制御部34は、第3画像を表示部24へ表示する制御を行う形態を説明した。しかし、第1制御部34は、第3画像と共に、第1画像、第1領域、第2領域、及び論理演算に用いた論理演算の種類の少なくとも1つを、表示部24へ表示する制御を行ってもよい。
図8は、第1制御部34による表示制御の説明図である。例えば、第1制御部34は、第3画像44、45が決定されると、表示部24の領域A1に、第1画像55を表示し、表示部24の領域A2に第3画像44、45を表示し、表示部24の領域A3に第1領域として領域55Aを表示する制御を行う(図8(A)参照)。
次に、ユーザによるUI部14の操作指示によって第3画像44、45の内、第3画像44について、水玉模様の領域44Aが選択される(図8(B)参照)。そして、決定部32によって、第3画像41、42が決定されたとする。すると、第1制御部34は、第3画像44を第1画像44として表示部24の領域A1に表示し、表示部24の領域A2に第3画像41、42を表示し、表示部24の領域A3に、論理演算に用いた第1領域としての領域55Aと、第2領域としての領域44Aと、論理演算の種類「AND」を表示する制御を行う(図8(B)参照)。
次に、ユーザによるUI部14の操作指示によって第3画像41、42の内、第3画像42について、襟の領域42Aが選択される(図8(C)参照)。そして、決定部32によって、第3画像41、50が決定されたとする。すると、第1制御部34は、第3画像42を第1画像42として表示部24の領域A1に表示し、表示部24の領域A2に第3画像41、50を表示し、表示部24の領域A3に、論理演算に用いた第1領域としての領域42Aと、第2領域としての領域44A及び領域55Aと、論理演算の種類「AND」を表示する制御を行う(図8(C)参照)。
このように、第1制御部34は、第3画像と共に、第1画像、第1領域、第2領域、及び論理演算に用いた論理演算の種類の少なくとも1つを、表示部24へ表示する制御を行ってもよい。これにより、ユーザに対して、第3画像の決定方法等を容易に提供することができる。
なお、本実施の形態では、取得部26は、撮像部13または第1記憶部16から第1画像を取得する場合を説明した。しかし、取得部26が第1画像を取得する形態は、撮像部13または第1記憶部16から取得する形態に限られない。
例えば、取得部26は、図示を省略するI/F部(インターフェース部)や、インターネット等の通信回線を介して、外部装置から第1画像を取得してもよい。外部装置としては、公知のPCや、WEBサーバー等が挙げられる。
また、取得部26は、以下の方法で第1画像を取得してもよい。詳細には、まず、取得部26を、図示を省略する放送局からの放送電波をコンテンツデータとして受信するテレビチューナや、インターネットからコンテンツデータを受信するネットワークインターフェース等の機能を更に備えた構成とする。
そして、制御部12は、コンテンツデータに含まれる番組を表示部24に表示する。そして、ユーザによる操作指示によって入力部22から画像の取り込みが指示される。すなわち、ユーザは、表示部24に表示された番組を確認しながら入力部22を操作することにより、表示部24に表示された番組から画像の取り込み指示を入力することができる。
そして、取得部26では、該画像の取り込み指示を入力部22から受け付けたときに、該画像の取り込み指示の受け付け時に表示部24に表示されているコマ画像(フレームと称する場合もある)を、第1画像として取得してもよい。また、取得部26は、該画像の取り込み指示の受け付け時に表示部24に表示されているコマ画像より前(例えば、数秒前)のコマ画像を、第1画像として取り込んでもよい。
なお、上記実施の形態では、記憶部16、記憶部18、及び記憶部20が、検索装置10に設けられている場合を説明した。しかし、これらの記憶部16、記憶部18、及び記憶部20の少なくとも1つを、検索装置10に通信回線を介して接続された記憶装置として構成してもよい。
上記実施の形態の検索装置10で実行される上記検索処理を実行するためのプログラムは、ROM等に予め組み込んで提供される。
なお、上記実施の形態の検索装置10で実行される上記検索処理を実行するためのプログラムは、検索装置10にインストール可能な形式又は実行可能な形式のファイルでCD−ROM、フレキシブルディスク(FD)、CD−R、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録されて提供するように構成してもよい。
また、上記実施の形態の検索装置10で実行される上記検索処理を実行するためのプログラムを、インターネット等のネットワークに接続されたコンピュータ上に記憶し、ネットワーク経由でダウンロードさせることにより提供するように構成してもよい。また、上記実施の形態の検索装置10で実行される上記検索処理を実行するためのプログラムを、インターネット等のネットワーク経由で提供または配布するように構成してもよい。
上記実施の形態の検索装置10で実行される上記検索処理を実行するためのプログラムは、上述した各部(取得部26、受付部28、算出部30、決定部32、第1制御部34、第2制御部36)を含むモジュール構成となっている。実際のハードウェアとしてはCPU(プロセッサ)がROM等の記憶媒体から、上記検索処理を実行するためのプログラムを読み出して実行することにより上記各部が主記憶装置上にロードされ、上記各部が主記憶装置上に生成されるようになっている。
なお、上記には、本発明の実施の形態を説明したが、この実施の形態は、例として提示したものであり、発明の範囲を限定することは意図していない。この新規な実施の形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。この実施の形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
10 検索装置
26 取得部
28 受付部
30 算出部
32 決定部
34 第1制御部
36 第2制御部

Claims (15)

  1. 第1画像を取得する取得部と、
    前記第1画像に含まれる第1領域の選択を受け付ける受付部と、
    検索対象の複数の第2画像の各々について、前記第1領域との第1類似度と、該第1領域より前に前記受付部が受け付けた前記第1領域としての第2領域との第2類似度と、を算出する算出部と、
    前記複数の第2画像の各々に対する前記第1類似度と前記第2類似度との論理演算の演算結果に基づいて、前記複数の第2画像の内、提示する第3画像を決定する決定部と、
    を備えた検索装置。
  2. 前記取得部は、1の前記第3画像を前記第1画像として取得する、請求項1に記載の検索装置。
  3. 前記決定部は、前記演算結果が大きい順または小さい順に予め定めた数の前記第2画像を、前記第3画像として決定する、請求項1に記載の検索装置。
  4. 前記決定部は、論理積、論理和、否定、及び排他的論理和の少なくとも1つを用いた論理演算の前記演算結果に基づいて、前記第3画像を決定する、請求項1に記載の検索装置。
  5. 前記決定部は、前記第1類似度と複数の前記第2類似度の各々とを、予め定めた演算順に対応する種類の論理演算を順次用いて演算した前記演算結果に基づいて、前記第3画像を決定する、請求項1に記載の検索装置。
  6. 前記決定部は、
    前記第1類似度が第1閾値を超える場合該第1類似度を真とし、前記第1類似度が前記第1閾値以下である場合該第1類似度を偽とする第1真理値を設定し、前記第2類似度が第2閾値を超える場合該第2類似度を真とし、前記第2類似度が前記第2閾値以下である場合該第2類似度を偽とする第2真理値を設定し、
    前記複数の第2画像の各々に対する、前記第1類似度としての前記第1真理値と、前記第2類似度としての前記第2真理値と、の演算結果に基づいて、前記第3画像を決定する、
    請求項1に記載の検索装置。
  7. 前記算出部は、前記第1領域の第1特徴量、前記第1画像における該第1領域の幾何学的な関係、前記第2画像における前記第1領域に対応する第3領域の第3特徴量、及び前記第2画像における前記第3領域の幾何学的な関係を用いて、前記第1類似度を算出する、請求項1に記載の検索装置。
  8. 前記算出部は、前記第2領域の第2特徴量、前記第1画像における該第2領域の幾何学的な関係、前記第2画像における前記第2領域に対応する第4領域の第4特徴量、及び前記第2画像における前記第4領域の幾何学的な関係を用いて、前記第2類似度を算出する、請求項1に記載の検索装置。
  9. 前記第3画像を表示部へ表示する制御を行う第1制御部を更に備えた、請求項1に記載の検索装置。
  10. 前記第1制御部は、前記第3画像と、前記第1画像、前記第1領域、前記第2領域、及び前記演算結果の演算に用いた論理演算の種類の少なくとも1つと、を前記表示部へ表示する制御を行う、請求項9に記載の検索装置。
  11. 前記第1領域の選択を受け付けたときに、該第1領域を第2記憶部へ記憶する制御を行い、前記第3画像が決定されたときに、該第1領域を前記第2領域として該第2記憶部へ記憶する制御を行う第2制御部を備えた、請求項1に記載の検索装置。
  12. 前記第2制御部は、前記第2記憶部に記憶されている前記第2領域を該第2領域が前記第1領域として選択された日時に対応づけて第3記憶部に記憶する制御を行う、請求項11に記載の検索装置。
  13. 第1画像に含まれる第1領域の選択を受け付ける受付部と、
    検索対象の複数の第2画像の内、該第1領域と、該第1領域より前に前記受付部が受け付けた前記第1領域としての第2領域と、の双方に類似または非類似の第2画像を、前記複数の第2画像の各々に対する、前記第1領域との第1類似度と、前記第2領域との第2類似度と、の論理演算の演算結果に基づいて、提示する第3画像として決定する決定部と、
    を備えた検索装置。
  14. 第1画像を取得するステップと、
    前記第1画像に含まれる第1領域の選択を受け付けるステップと、
    検索対象の複数の第2画像の各々について、該第1領域との第1類似度と、該第1領域より前に受け付けた前記第1領域としての第2領域との第2類似度と、を算出するステップと、
    前記複数の第2画像の各々に対する前記第1類似度と前記第2類似度との論理演算の演算結果に基づいて、前記複数の第2画像の内、提示する第3画像を決定するステップと、
    を有する検索方法。
  15. コンピュータに、
    第1画像を取得するステップと、
    前記第1画像に含まれる第1領域の選択を受け付けるステップと、
    検索対象の複数の第2画像の各々について、該第1領域との第1類似度と、該第1領域より前に受け付けた前記第1領域としての第2領域との第2類似度と、を算出するステップと、
    前記複数の第2画像の各々に対する前記第1類似度と前記第2類似度との論理演算の演算結果に基づいて、前記複数の第2画像の内、提示する第3画像を決定するステップと、
    を実行させるためのプログラム。
JP2013239802A 2013-11-20 2013-11-20 検索装置、検索方法、及びプログラム Pending JP2015099534A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2013239802A JP2015099534A (ja) 2013-11-20 2013-11-20 検索装置、検索方法、及びプログラム
US14/543,289 US20150139558A1 (en) 2013-11-20 2014-11-17 Searching device, searching method, and computer program product

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013239802A JP2015099534A (ja) 2013-11-20 2013-11-20 検索装置、検索方法、及びプログラム

Publications (1)

Publication Number Publication Date
JP2015099534A true JP2015099534A (ja) 2015-05-28

Family

ID=53173388

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013239802A Pending JP2015099534A (ja) 2013-11-20 2013-11-20 検索装置、検索方法、及びプログラム

Country Status (2)

Country Link
US (1) US20150139558A1 (ja)
JP (1) JP2015099534A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018018430A (ja) * 2016-07-29 2018-02-01 ヤフー株式会社 抽出装置、抽出方法、及び抽出プログラム
JP2020101946A (ja) * 2018-12-20 2020-07-02 ヤフー株式会社 情報処理装置、制御プログラム、情報処理方法及び情報処理プログラム

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10366404B2 (en) * 2015-09-10 2019-07-30 The Nielsen Company (Us), Llc Methods and apparatus to group advertisements by advertisement campaign

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018018430A (ja) * 2016-07-29 2018-02-01 ヤフー株式会社 抽出装置、抽出方法、及び抽出プログラム
JP2020101946A (ja) * 2018-12-20 2020-07-02 ヤフー株式会社 情報処理装置、制御プログラム、情報処理方法及び情報処理プログラム

Also Published As

Publication number Publication date
US20150139558A1 (en) 2015-05-21

Similar Documents

Publication Publication Date Title
US11657084B2 (en) Correlating image annotations with foreground features
JP5358083B2 (ja) 人物画像検索装置及び画像検索装置
US10019779B2 (en) Browsing interface for item counterparts having different scales and lengths
KR102244561B1 (ko) 이미지 특징 데이터 추출 및 사용
US9111255B2 (en) Methods, apparatuses and computer program products for determining shared friends of individuals
US11972506B2 (en) Product image generation system
US10949654B2 (en) Terminal and server for providing video call service
US10026176B2 (en) Browsing interface for item counterparts having different scales and lengths
US20160147795A1 (en) Methods of recognizing an object within an image by use of templates
US20230401271A1 (en) Information processing device, information processing method, and recording medium
US20180330199A1 (en) Fashion analysis device and fashion analysis method
JP2015099534A (ja) 検索装置、検索方法、及びプログラム
US10438085B2 (en) Image analysis apparatus, image analysis method, and storage medium
US11086925B2 (en) Fashion by trend user interfaces
US20150269189A1 (en) Retrieval apparatus, retrieval method, and computer program product
US9600495B2 (en) Image search system, image search method, image search device, program, and information recording medium
JP2024045460A (ja) 情報処理システム、情報処理装置、情報処理方法、およびプログラム
US20170278265A1 (en) Video processing apparatus and control method
KR101724143B1 (ko) 검색 서비스 제공 장치, 시스템, 방법 및 컴퓨터 프로그램
JPWO2019181441A1 (ja) 情報処理装置、及び制御方法
JP2016218578A (ja) 画像検索装置、画像検索システム、画像検索方法、及び画像検索プログラム
KR20150100113A (ko) 영상 처리 장치 및 이의 영상 처리 방법
JP2023065024A (ja) 検索処理装置、検索処理方法及びプログラム
US20160162752A1 (en) Retrieval apparatus, retrieval method, and computer program product
CN111767925A (zh) 物品图片的特征提取和处理方法、装置、设备和存储介质

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20151102