以下に添付図面を参照して、商品検索装置、方法、及びプログラムの一の実施形態を詳細に説明する。
(実施の形態1)
図1は、本実施の形態の商品検索装置10の機能的構成を示すブロック図である。商品検索装置10は、制御部12、撮像部13、記憶部14、入力部16、及び表示部18を備える。
本実施の形態では、商品検索装置10は、制御部12、撮像部13、記憶部14、入力部16、及び表示部18が一体的に設けられた携帯型端末(例えば、スマートフォンやタブレット型のPC(パーソナルコンピュータ)等)である場合を説明する。なお、商品検索装置10は、携帯型端末に限られない。例えば、商品検索装置10は、記憶部14、入力部16、及び表示部18の少なくとも1つと、制御部12と、が別体として設けられた構成であってもよい。この場合、例えば、商品検索装置10としては、撮像部13を備えたPCが挙げられる。
以下、商品検索装置10について詳細に説明する。
撮像部13は、撮像によって、第1画像を得る。
第1画像は、複数のアイテムを含む画像である。アイテムとは、商品検索装置10における検索対象を示す。具体的には、アイテムは、検索対象の商品や、検索対象の商品に関するものである。更に具体的には、アイテムは、服飾に関するアイテム、家具に関するアイテム、旅行に関するアイテム、家電に関するアイテム等であるが、これらに限られない。
第1画像は、複数のアイテムを含む画像であればよい。第1画像としては、例えば、複数のアイテムを装着した被写体の撮像画像や、複数のアイテムの掲載された雑誌の撮像画像や、表示装置に表示された画像の撮像画像等が挙げられる。なお、被写体は、実際の人物に限られず、犬や猫等のペット、人体やペットの形状を模したマネキン、及び人体はペットの形状を模した絵、等も含む。また、該表示装置には、公知のLCD(Liquid Crystal Display)、CRT(Cathode Ray Tube)、PDP(Plasma Display Panel)等が挙げられる。
本実施の形態では、第1画像が、服飾に関する複数のアイテムを含む画像である場合を説明する。
服飾に関するアイテムとは、本実施の形態の商品検索装置10における検索対象である。具体的には、服飾に関するアイテムとは、服飾品、美容に関する物、等の、服飾に用いる物や髪型等であって、且つ視認可能な検索対象を示す。服飾品とは、衣服や装飾品を示す。衣服とは、被写体が着用可能な物である。衣服としては、例えば、上着、スカート、ズボン、靴、帽子等が挙げられる。装飾品は、例えば、指輪、ネックレス、ペンダント、イヤリングなど、身を飾るための工芸品である。美容に関する物とは、髪型、皮膚等に塗布する物である化粧品、等を示す。
撮像部13は、公知のデジタルカメラ、デジタルビデオカメラ等である。撮像部13は、撮像によって得た第1画像を、制御部12へ出力する。
記憶部14は、ハードディスクドライブ装置(HDD)等の記憶媒体である。図2は、記憶部14に記憶されるデータのデータ構造の一例を示す図である。
記憶部14は、識別情報と、グループと、第2画像と、を対応づけて記憶する。第2画像は、アイテムに関連する商品を示す画像である。商品とは、商取引対象のアイテムを示す。本実施の形態では、第2画像は、服飾に関する商品の各々を示す画像である場合を説明する。なお、服飾に関する商品とは、服飾に関するアイテムの内、商取引の対象とするアイテムを示す。このため、第2画像としては、上述した、コート、スカート、上着、等の各商品の画像が挙げられる。図2に示す例では、第2画像として、第2画像42A〜第2画像42Fが記憶部14に記憶されている場合を示した。なお、記憶部14に記憶される第2画像は、これらの第2画像42A〜第2画像42Fに限られない。また、記憶部14に記憶される第2画像の数も、特定の数に限定されない。
識別情報は、第2画像によって示される商品を一意に識別する情報である。図2に示す例では、識別情報が、対応する第2画像の示す商品の名称、対応する第2画像の示す商品の価格、及び対応する第2画像の示す商品の発売日を含む場合を示した。なお、識別情報は、各第2画像によって示される商品を一意に識別する情報であればよく、名称、価格、発売日以外の情報であってもよいし、これらの名称、価格、発売日以外の情報を含んでもよい。
第2画像によって示される商品は、予め定められた分類条件に従って複数のグループに分類される。分類条件は、任意の条件を予め設定すればよい。分類条件には、例えば、商品の色、商品の種類、商品の製造元、商品の発売日、商品の価格帯、等がある。商品の種類には、商品を装着する部位、商品の素材、商品の形状等がある。商品の種類としては、例えば、トップス、コート、シャツ、ボトム、スカート、小物、時計等がある。
図2に示す例では、グループが、トップス、コート、シャツ、ボトム、スカート、小物、時計、靴、及び色(赤、黒、茶、ベージュ)である場合を示した。なお、各グループを、更に複数の小グループに分類してもよい。なお、図2中、「○」は、対応する第2画像の示す商品が、「○」の列に示されるグループに属することを示す。例えば、図2に示す例では、第2画像42Aは、グループ「トップス」、及びグループ「シャツ」に属している。
なお、図2に示す例では、記憶部14は、各第2画像に対応するグループとして、各第2画像の商品が各グループに属するか否かを記憶する場合を示した。しかし、記憶部14は、各第2画像の商品が、各グループに属する確率を記憶してもよい。
なお、分類条件は、1種類に限られず、複数種類の分類条件を設定してもよい。また、分類条件によって、1の商品画像の商品が1のグループのみに属する場合もあるし、1の商品画像の商品が複数のグループに属する場合もある。
図2に示す例では、例えば、第2画像42Aの商品は、“トップス”、“シャツ”、及び“赤”の各々のグループに属している。第2画像42Bの商品は、“トップス”、“コート”、及び“茶”の各々のグループに属している。第2画像42Cの商品は、“ボトム”、“スカート”、及び“黒”の各々のグループに属している。第2画像42Eの商品は、“ボトム”のグループに属している。第2画像42Fの商品は、“小物”、“靴”、及び“ベージュ”のグループに属している。
図1に戻り、表示部18は、制御部12で取得した第1画像、制御部12で検索されたグループ、制御部12で検索された第2画像、等の各種画像を表示する(詳細後述)。表示部18としては、LCD、CRT、PDP等の公知の表示装置が挙げられる。
入力部16は、ユーザーが各種の操作入力を行うための手段である。入力部16には、例えば、マウス、ボタン、リモコン、キーボード、及びマイク等の音声認識装置等が挙げられる。
なお、入力部16及び表示部18は、一体的に構成されていてもよい。具体的には、入力部16及び表示部18は、入力機能及び表示機能の双方を備えたUI(User Interface)部17として構成されていてもよい。UI部17には、タッチパネル付LCD等がある。
制御部12は、CPU(Central Processing Unit)、ROM(Read Only Memory)、及びRAM(Random Access Memory)などを含んで構成されるコンピュータである。制御部12は、商品検索装置10全体を制御する。また、制御部12は、撮像部13、記憶部14、入力部16、及び表示部18に電気的に接続されている。
制御部12は、取得部20、判定部22、第1制御部24、受付部26、検索部28、第2制御部30、及び更新部31を備える。
取得部20は、服飾に関する複数のアイテムを含む第1画像を取得する。本実施の形態では、取得部20は、撮像部13から第1画像を取得する場合を説明する。
判定部22は、取得部20で取得した第1画像に含まれるアイテムの各々が、何れのグループに属するかを判定する。
例えば、判定部22は、最近傍探索や、k近傍法を用いて、取得部20で取得した第1画像に含まれるアイテムの各々が、上記各グループの何れに属するかを判定する。
まず、判定部22が、最近傍探索を用いて上記判定を行う場合について説明する。この場合、判定部22は、まず、第1画像に含まれるアイテムに対する候補領域の特徴量を算出する。候補領域とは、探索の際に用いられる探索窓内に含まれる画像領域をいう。また、判定部22は、記憶部14に記憶されている各第2画像の示す商品の各々について、特徴量を算出する。なお、第2画像の商品の特徴量は、予め算出してもよい。そして、記憶部14は、算出した特徴量を対応する第2画像に対応づけて予め記憶してもよい。この場合には、判定部22は、記憶部14に記憶されている各第2画像に対応する特徴量を読取ることで、各第2画像の示す商品の特徴量を算出すればよい。
各アイテムの特徴量は、第1画像における各アイテムに対応する領域の各々を解析することにより得られる数値である。この数値は、すなわち、各アイテムの特徴に対応する数値またはその組み合わせである。判定部22は、第1画像における各アイテムが属するグループを検出するために、大きさや位置を様々に変更した候補領域を第1画像から設定し、それら候補領域の特徴量を算出する。
具体的には、判定部22は、記憶部14に記憶されているグループの分類条件に対応する特徴量を算出する。分類条件が、商品の色、及び商品の種類である場合には、判定部22は、例えば、第1画像における候補領域の色(R、G、Bの画素値)、及び候補領域内の輪郭形状、の各々を数値化した値を、各アイテムの特徴量として算出する。すなわち、判定部22は、分類条件に応じて、HoG特徴量や、SIFT特徴量、またはこれらの組合せを、特徴量として算出する。
第2画像の示す商品の特徴量は、第2画像を解析することにより得られる数値である。この数値は、すなわち、第2画像の示す商品の特徴に対応する数値またはその組み合わせである。判定部22は、第2画像を解析することで商品の特徴量を得る。
なお、判定部22は、第2画像について、第1画像と同じ分類条件に対応する特徴量を算出する。例えば、判定部22が、第1画像における候補領域の色(R、G、Bの画素値)、及び候補領域の輪郭形状、の各々を予め定めた規則に沿って数値化した値を、各アイテムの特徴量として算出する。この場合には、判定部22は、第2画像についても、第2画像の色(R、G、Bの画素値)、及び第2画像によって示される商品の輪郭形状、の各々を数値化した値を、第2画像の示す商品の特徴量として算出する。
次に、判定部22は、第1画像に含まれる候補領域の特徴量と、記憶部14に記憶されている第2画像の示す商品の特徴量と、の類似度を算出する。例えば、判定部22は、特徴量が一致する場合を類似度「1」とし、特徴量が予め定めた値以上異なる場合を類似度「0」として、特徴量の値が近いほど類似度「0」から類似度「1」に向かって大きくなるように、類似度を算出する。
具体的には、判定部22は、SSD(Sum of Squared Difference)、SAD(Sum of Absolute Difference)、正規化相互相関などを用いて類似度を算出すればよい。
そして、判定部22は、第1画像に含まれるアイテム毎に、各アイテムとの類似度が第1閾値以上の類似度の第2画像を記憶部14から検索する。そして、さらに、判定部22は、アイテム毎に検索した第1閾値以上の類似度の第2画像の内、最も高い類似度の第2画像をアイテム毎に検索する。そして、検索した一つの第2画像に対応づけられたグループを、各アイテムの属するグループとして判定する。なお、第1閾値は、予め任意の値を設定すればよい。そして、判定部22は、この第1閾値を予め記憶しておけばよい。
なお、検索した1の第2画像に対応づけられたグループが、複数有る場合には、判定部22は、検索した1の第2画像に対応づけられた複数のグループの内の一つまたは複数を、各アイテムの属するグループとして判定すればよい。
次に、判定部22が、k近傍法を用いて判定を行う場合について説明する。なお、判定部22は、k近傍法を用いる場合についても、最近傍探索を用いる場合と同様にして、第1画像に含まれる商品や商品以外の背景を囲んだ候補領域の特徴量と、記憶部14に記憶されている第2画像の示す商品の特徴量と、を算出する。また、判定部22は、k近傍法を用いる場合についても、最近傍探索を用いる場合と同様にして類似度を算出する。
ここで、最近傍探索を用いる場合には、判定部22は、第1画像に含まれる候補領域毎との類似度が、第1閾値以上の類似度となる第2画像を記憶部14から検索した。そして、さらに、判定部22は、アイテム毎に検索した第1閾値以上の類似度の第2画像の内、最も高い類似度となる一つの第2画像をアイテム毎に検索した。そして、検索した1の第2画像に対応づけられたグループを、各アイテムの属するグループとして判定した。
一方、k近傍法を用いる場合には、判定部22は、第1画像に含まれる候補領域毎に、各アイテムとの類似度が最も高い第2画像から順に、k枚の第2画像を記憶部14から検索する。なお、kは、2以上の整数である。また、このkを示す数値は、予め判定部22に記憶しておけばよい。そして、判定部22は、第1画像に含まれる候補領域の各々について、各アイテムとの類似度の高い順にk枚の第2画像を読み取る。そして、判定部22は、読み取った第2画像に対応するグループを記憶部14から読み取る。そして、判定部22は、読み取ったグループの数を、同じグループ毎に加算した加算値を算出することで、ヒストグラムを作成する。
なお、ヒストグラムは、類似度を用いた値であってもよい。具体的には、判定部22は、各グループに属する商品の各々について、各グループに属することを示す値(例えば、「1」とする)に、類似度を乗算した乗算値を算出する。そして、判定部22は、k近傍法を用いて第1画像に含まれるアイテム毎に検索した全ての第2商品について、グループ毎に上記乗算値を加算した加算値を、ヒストグラムとして用いてもよい。
そして、判定部22は、ヒストグラムよって示される各グループの内、上記加算値が予め定めた第2閾値を超えるグループを、第1画像に含まれる各アイテムの属するグループとして判定すればよい。この第2閾値は、予め設定し、判定部22に記憶しておけばよい。
図3は、判定部22による、k近傍法を用いた判定を示す模式図である。図3(A)に示すように、第1画像40が、アイテム40F、アイテム40G、アイテム40Hを含む画像であったとする。そして、記憶部14には、図3(B)に示すように、第2画像42G〜第2画像42Lと、各第2画像に対応するグループと、図3(B)では図示を省略する識別情報と、が対応づけて記憶されているとする。
この場合、判定部22は、まず、第1画像40において、各アイテム40F〜アイテム40Hが含まれる候補領域や背景が含まれる候補領域の特徴量と、記憶部14に記憶されている第2画像42G〜第2画像42Lの示す商品の特徴量と、を算出する。そして、判定部22は、各候補領域と、各第2画像42G〜第2画像42Lの各々と、の類似度を算出する。
図3(B)には、一例として、アイテム40Gが含まれる候補領域に対する、第2画像42G、第2画像42H、第2画像42I、及び第2画像42Lの各々の類似度を示した。すなわち、アイテム40Gが含まれる候補領域と、第2画像42G、第2画像42H、第2画像42I、及び第2画像42Lの各々と、の類似度が、各々、0.93、0.89、0.77、0.70である場合を示した。また、図3(B)には、アイテム40Fが含まれる候補領域に対する、第2画像42J及び第2画像42Kの各々と、の類似度を示した。すなわち、アイテム40Fが含まれる候補領域と、第2画像42J及び第2画像42Kの各々と、の類似度が、各々、0.76、0.74である場合を示した。図3(B)には、候補領域との類似度が高い第2画像のみを示している。
なお、図3には、判定部22が、第1画像40に含まれるアイテム40Gの候補領域については、k近傍法における上記kを「4」枚とし、アイテム40Fの候補領域については、上記kを「2」枚として判定を行った場合を示した。しかし、判定部22が第1画像40に含まれる各アイテムにおいて適用するk近傍法のkの値は、第1画像に含まれる各アイテム間で同じ値に設定することが好ましい。
そして、判定部22は、第1画像40に含まれるアイテム40F〜アイテム40Hの各候補領域について、各アイテム40F〜アイテム40Hとの類似度の高い順にk枚の第2画像を読み取る。例えば、判定部22は、アイテム40Gの候補領域に対応する第2画像として、第2画像42G、第2画像42H、第2画像42I、及び第2画像42Lを記憶部14から読み取る。また、例えば、判定部22は、アイテム40Fの候補領域に対応する第2画像として、第2画像42J及び第2画像42Kを記憶部14から読み取る。さらに、判定部22は、候補領域毎に読み取った第2画像(図3に示す例では、第2画像42G〜第2画像42L)に対応するグループを、記憶部14から読み取る。そして、判定部22は、候補領域毎に読み取った第2画像42G〜第2画像42Lに対応するグループを、記憶部14から読み取る。図3に示す例では、判定部22は、第2画像42Gに対応するグループとして、「アウター」、及び「コート」を読み取る。また、判定部22は、第2画像42Hに対応するグループとして、「アウター」及び「コート」を読み取る。また、判定部22は、第2画像42Iに対応するグループとして、「トップス」を読み取る。また、判定部22は、第2画像42Jに対応するグループとして、「小物」を読み取る。また、判定部22は、第2画像42Kに対応するグループとして、「小物」を読み取る。また、判定部22は、第2画像42Jに対応するグループとして、「アウター」、及び「コート」を読み取る。
そして、判定部22は、これらの読み取ったグループの数を、同じグループ毎に加算した加算値を算出することで、ヒストグラムを作成する。例えば、図3(C)に示すように、グループ「アウター」には、第2画像42G、第2画像42H、第2画像42Lの各々によって示される商品が属するので、該グループにおける加算値は「3」となる(図3(C)中、線図44参照)。同様に、図3(C)に示すように、グループ「コート」には、第2画像42G、第2画像42H、及び第2画像42Lの各々によって示される商品が属するので、該グループにおける加算値は「3」となる(図3(C)中、線図45参照)。
また、図3(C)に示すように、グループ「トップス」には、第2画像42Iによって示される商品が属するので、該グループにおける加算値は「1」となる(図3(C)中、線図46参照)。また、図3(C)に示すように、グループ「小物」には、第2画像42J、及び第2画像42Kの各々によって示される商品が属するので、該グループにおける加算値は「2」となる(図3(C)中、線図48参照)。
さらに、判定部22は、これらの加算値によって示されるヒストグラム49によって示される各グループの内、各加算値が予め定めた第2閾値を超えるグループを、第1画像40に含まれる各アイテム40F〜アイテム40Hの候補領域が属するグループとして判定する。
なお、判定部22は、k近傍法、及び最近傍探索の内、k近傍法を用いることが好ましい。判定部22が、k近傍法を用いて、第1画像に含まれる候補領域の各々が上記各グループの何れに属するかを判定することで、最近傍探索を用いる場合に比べて、第1画像に含まれる候補領域の各々の属するグループを、より的確に判定することができるためである。これは、最近傍探索を用いる場合には、第1画像に含まれる候補領域の特徴量との類似度の高い第2画像が記憶部14に記憶されている必要があるためである。一方、k近傍法を用いた場合には、上記ヒストグラムを用いた判定を行う。このため、判定部22が、k近傍法を用いて判定を行うことで、最近傍探索を用いる場合に比べて、第1画像に含まれる候補領域の各々の属するグループを、より的確に判定することができる。
なお、判定部22による判定方法は、最近傍探索や、k近傍法に限られない。例えば、判定部22は、各アイテムが各グループに属するか否かを識別するための識別器を予め生成してもよい。この場合には、記憶部14に記憶されている第2画像を、対応するグループ毎にまとめ、各々を訓練サンプルとして、SVM(Support vector machine)やBoostingにより、識別器を予め学習させてもよい。また、識別器に替えて、回帰分析をもちいてもよい。
図1に戻り、第1制御部24は、判定部22で判定された、第1画像に含まれるアイテムの各々が属するグループを、表示部18に表示する制御を行う。
受付部26は、各種指示入力を受け付ける。例えば、ユーザーの入力部16による操作指示によって、表示部18に表示されたグループの内の少なくとも1つが選択される。すると、受付部26は、表示部18に表示されたグループの内の少なくとも1つに対する指示入力を受け付ける。
すなわち、ユーザーは、表示部18に表示されたグループを確認しながら入力部16を操作することにより、表示部18に表示されたグループの内の少なくとも1つを入力することができる。
検索部28は、記憶部14を検索し、受付部26が受け付けた、指示されたグループに対応する第2画像を記憶部14から検索する。
なお、検索部28は、受付部26が受け付けたグループに対応する第2画像の内、該第2画像に対応する識別情報に基づいて、表示部18に表示する対象の第2画像を選択してもよい。そして、検索部28は、選択した第2画像を表示部18に表示してもよい。
この場合には、検索部28は、例えば、識別情報に含まれる発売日が新しい順、識別情報に含まれる価格が高い順、識別情報に含まれる価格が低い順に、予め定めた数の第2画像を選択する。また、識別情報に、上記判定部22で判定した類似度を含めた構成とし、検索部28は、類似度の高い順に、予め定めた数の第2画像を表示対象として選択してもよい。
第2制御部30は、検索部28で検索された第2画像を、表示部18に表示する制御を行う。
更新部31は、記憶部14を更新する。例えば、入力部16の操作指示等によって記憶部14の更新指示が入力され、受付部26が、図示を省略するI/F部等を介して外部装置から識別情報、グループ、及び第2画像を受け付けるとする。このときに、更新部31は、受け付けた識別情報、グループ、及び第2画像を記憶部14へ記憶することで、該記憶部14を更新すればよい。
また、取得部20が、図示を省略するI/F部及び通信回線を介して、コンテンツデータを受信する。この場合、取得部20は、図示を省略する放送局からの放送電波をコンテンツデータとして受信するテレビチューナや、インターネットからコンテンツデータを受信するネットワークインターフェース等の機能を更に備えた構成とすればよい。
コンテンツデータは、番組、及び番組の内容を示すメタデータ等を含むデータである。番組の例としては、TV(television)放送番組、DVD(digital versatile disk)などの記録媒体やVOD(Video On Demand)サービスの形態等で配信、販売、配布されている映画・ビデオクリップ、WEB(World Wide Web)上で配信されている動画像、カメラや携帯電話で撮影した動画像、ビデオレコーダ、HDDレコーダ、DVDレコーダ、録画機能付きTVやPCなどで録画された録画番組などが挙げられる。
メタデータとは、番組の内容を示すデータであり、本実施の形態では、少なくとも、番組中の各位置(フレーム)の画像に含まれる商品を示す情報や、該画像に含まれる商品の識別情報や、該画像に含まれるグループを含む。
この場合、更新部31では、コンテンツデータから、各第2画像と、識別情報と、グループと、を抽出する。そして、更新部31は、抽出した第2画像、識別情報、及びグループを対応づけて記憶部14へ記憶することで、記憶部14を更新すればよい。
次に、商品検索装置10で実行する商品検索処理を説明する。
図4は、本実施の形態の商品検索装置10で実行する商品検索処理の手順を示すフローチャートである。なお、図4に示す例では、判定部22が、最近傍探索を用いて判定を行う場合を説明する。
まず、取得部20が撮像部13から第1画像を取得する(ステップS100)。次に、判定部22が、第1画像に含まれる候補領域の各々の特徴量を算出する(ステップS102)。なお、記憶部14に記憶されている各第2画像の示す商品の各々の特徴量は、予め算出され、記憶部14に記憶してあるものとして説明する。
次に、判定部22が、第1画像に含まれる各候補領域の特徴量と、記憶部14に記憶されている第2画像の示す商品の特徴量と、の類似度を、候補領域毎に算出する(ステップS104)。
次に、判定部22は、ステップS104で算出した、第1画像に含まれる候補領域毎の類似度の全てが上記第1閾値以上であるか否かを判別する(ステップS106)。ステップS106で否定判断すると(ステップS106:No)、本ルーチンを終了する。
一方、ステップS106で肯定判断すると(ステップS106:Yes)、ステップS107へ進む。ステップS107において、判定部22は、上記ステップS100で取得した第1画像に含まれる各アイテムが属するグループを判定する(ステップS107)。
次に、判定部22は、ステップS107の処理によって判定した、第1画像に含まれる各アイテムの属するグループを、RAMまたはROMに記憶する(ステップS108)。なお、ステップS108の処理において、判定部22は、該グループを記憶部14に記憶してもよい。
次に、第1制御部24が、上記ステップS108で記憶したグループの全てまたは少なくとも一部を、表示部18に表示する(ステップS109)。ステップS109によって表示部18にグループが表示されると、ユーザーは、表示部18に表示されたグループを確認しながら入力部16を操作する。これによって、ユーザーは、表示部18に表示されたグループの内の少なくとも1つを選択し、入力することができる。
次に、受付部26が、入力部16からグループを受け付けたか否かを判断する(ステップS110)。ステップS110で肯定判断すると(ステップS110:Yes)、ステップS112へ進む。
ステップS112では、ステップS110で受け付けたグループに対応する第2画像を、記憶部14から検索する(ステップS112)。次に、第2制御部30が、ステップS112で検索された第2画像を表示部18に表示し(ステップS114)、本ルーチンを終了する。
なお、ステップS114に表示された第2画像の内の少なくとも1つが、ユーザーによる入力部16の操作指示によって選択された場合、第2制御部30は、選択された第2画像に対応するWEBサイトを更に表示部18に表示してもよい。この場合には、各第2画像を販売する販売サイト等のWEBサイトを示す情報を、対応する第2画像に対応づけて予め記憶部14に記憶しておけばよい。そして、第2制御部30は、選択された第2画像に対応するWEBサイトを示す情報を記憶部14から読み取り、表示部18に表示すればよい。
また、さらに、表示部18に表示されたWEBサイトを示す情報が、ユーザーによる入力部16の操作指示によって指示されたときに、該WEBサイトへアクセスしてもよい。
一方、上記ステップS110で否定判断すると(ステップS110:No)、ステップS116へ進む。
ステップS116では、切替指示を受け付けたか否かを判断する(ステップS116)。ステップS116の判断は、以下の方法で行えばよい。例えば、第1制御部24は、ステップS109の処理によってグループを表示部18へ表示する時に、表示されているグループの切替えを指示するための指示ボタンを併せて表示する制御を行う。そして、ユーザーによる入力部16の操作指示によって、該指示ボタンの表示された領域が指示されることで、切替指示が入力されるようにすればよい。そして、受付部26では、該切替指示を受け付けたか否かを判別することで、ステップS116の判断を行えばよい。
また、第1制御部24は、ステップS116の判断を以下の方法で行ってもよい。例えば、商品検索装置10に、商品検索装置10の傾きを検知するセンサ(図示省略)を備えた構成とする。そして、受付部26は、該センサによる傾きを示す信号を更に受け付けるとする。そして、商品検索装置10を携帯したユーザーが、商品検索装置10を予め定めた角度に傾けたことを示す信号が該センサから受付部26に送信され、センサで該信号を受け付けたときに、第1制御部24は、ステップS116で肯定判断してもよい。
ステップS116で否定判断すると(ステップS116:No)、本ルーチンを終了する。また、ステップS116で肯定判断すると(ステップS116:Yes)、上記ステップS118へ進む。
なお、ステップS116で否定判断した場合(ステップS116:No)、受付部26が、グループの非表示を示す信号を受け付けたか否かを判断してもよい。そして、該非表示を示す信号を受け付けた場合には、該グループが表示部18への表示対象外であることを示す情報を、記憶部14に記憶してもよい。この場合には、第1制御部24は、判定部22で判定されたグループの内、表示対象のグループを表示部18に表示すればよい。なお、受付部26が、グループの非表示を示す信号を受け付けない場合には、本ルーチンを終了すればよい。
なお、該非表示を示す信号は、例えば、UI部17の表示部18に表示されたグループにおける、各グループの表示領域がユーザーによる入力部16の操作指示によって一定時間以上連続して押圧されたときに、UI部17から受付部26に入力されるようにすればよい。
ステップS118では、第2制御部30が、ステップS108で記憶したグループの内、前回表示部18に表示したグループ以外のグループを読取る(ステップS118)。そして、第2制御部30が、ステップS118で読み取ったグループを、表示部18に表示する制御を行い(ステップS120)、上記ステップS110へ戻る。
上記商品検索処理が実行されることによって、第1画像に含まれる複数のアイテムの各々の属するグループが表示部18に表示され、さらに、表示されたグループの内、ユーザーによって選択されたグループに対応する商品の第2画像が表示部18に表示される。
次に、本実施の形態における商品検索処理の具体例を説明する。図5は、第1画像の一例を示す模式図である。また、図6は、表示部18に表示されたグループの一例を示す模式図である。
図5に示すように、複数のアイテムとして、アイテム40A〜アイテム40Fを含む第1画像40を取得部20が取得したとする。この場合、商品検索装置10が上記商品検索処理を実行し、判定部22で判定された各アイテムのグループを第1制御部24が表示部18に表示する。これによって、図6に示すように、表示部18には、例えば、アイテム40B(図5参照)のグループ「トップス」の文字を含む画像54が表示される。また、表示部18には、例えば、アイテム40A(図5参照)のグループ「コート」の文字を含む画像50が表示される。また、表示部18には、例えば、アイテム40C(図5参照)のグループ「小物」の文字を含む画像56が表示される。また、表示部18には、例えば、アイテム40D(図5参照)のグループ「スカート」の文字を含む画像52が表示される。
なお、図6に示すように、第1制御部24は、判定部22で判定されたグループを表示部18に表示すればよい。このため、表示されるグループの表示形態は、どのような表示形態であってもよい。例えば、図6に示すように、第1制御部24は、「コート」、「トップス」、「スカート」、「小物」等のグループを示す文字情報や、グループに属する代表的な商品を示す第2画像等を含むアイコン等を表示することで、判定されたグループを表示部18に表示する。なお、第1制御部24は、グループを示す文字情報のみを表示部18に表示してもよいし、グループに属する代表的な商品を示す第2画像のみを、表示部18に表示してもよい。
なお、図6に示すように、第1制御部24は、取得部20で取得した第1画像40上に重ねて、各グループを示す画像(画像50〜画像56)を表示するように制御することが好ましい。また、これらの各グループを示す画像(画像50〜画像56)の、表示部18の表示画面上における表示位置は、該表示画面の四隅であってもよいし、中央であってもよく、何れの位置であってもよい。また、これらの各グループを示す画像(画像50〜画像56)は、ある方向に並べて表示してもよいし、判定部22で算出したヒストグラムによって示される値の大きい順に並べて表示してもよい。
また、第1制御部24は、表示部18の表示画面上における、グループの配置順序を予め定め、該定めた配置順序に従って、判定部22で判定されたグループを表示部18に表示してもよい。なお、この配置順序は、ユーザーによる入力部16の操作指示によって受付部26で受けつけ、第1制御部24の図示を省略する記憶部に予め記憶すればよい。
また、第1制御部24は、記憶部14に記憶さている複数グループの内、表示部18に表示する対象のグループと、表示部18に表示する対象外のグループと、を予め定めて記憶しておいてもよい。そして、第1制御部24は、判定部22で判定されたグループの内、表示部18に表示する対象のグループを、表示部18に表示する制御を行ってもよい。
以上説明したように、本実施の形態の商品検索装置10では、服飾に関する複数のアイテムを含む第1画像に基づいて、該第1画像に含まれるアイテムの各々の属するグループを判定し、判定したグループを表示部18に表示する。そして、表示部18に表示したグループの内、ユーザーの操作指示によって選択されたグループに対応する商品の第1画像を記憶部14から検索し、表示部18へ表示する。
従って、本実施の形態の商品検索装置10によれば、ユーザーが注目する商品を効率よく検索することができる。
また、判定部22は、第1画像を複数の候補領域に分割し最近傍識別を行うことで、第1画像に含まれる複数のアイテムの各々の属するグループを判定する。このため、第1画像が、複数のアイテムが互いに重なった状態で撮影された画像である場合であっても、第1画像に含まれるアイテムの各々のグループを的確に判定することができる。
なお、本実施の形態では、取得部20は、撮像部13から第1画像を取得する場合を説明した。しかし、取得部20が第1画像を取得する形態は、撮像部13から取得する形態に限られない。
例えば、取得部20は、図示を省略するI/F部(インターフェース部)や、インターネット等の通信回線を介して、外部装置から第1画像を取得してもよい。外部装置としては、公知のPCや、WEBサーバー等が挙げられる。また、取得部20は、予め第1画像を記憶部14または図示を省略するRAM等に記憶しておいて、これらの記憶部14やRAM等から第1画像を取得してもよい。
また、取得部20は、以下の方法で第1画像を取得してもよい。詳細には、まず、取得部20を、図示を省略する放送局からの放送電波をコンテンツデータとして受信するテレビチューナや、インターネットからコンテンツデータを受信するネットワークインターフェース等の機能を更に備えた構成とする。なお、コンテンツデータについては上述したので説明を省略する。
そして、制御部12は、コンテンツデータに含まれる番組を表示部18に表示する。そして、ユーザーによる操作指示によって入力部16から画像の取り込みが指示される。すなわち、ユーザーは、表示部18に表示された番組を確認しながら入力部16を操作することにより、表示部18に表示された番組から画像の取り込み指示を入力することができる。
そして、取得部20では、該画像の取り込み指示を入力部16から受け付けたときに、該画像の取り込み指示の受け付け時に表示部18に表示されているコマ画像(フレームと称する場合もある)を、第1画像として取得してもよい。また、取得部20は、該画像の取り込み指示の受け付け時に表示部18に表示されているコマ画像より前(例えば、数秒前)のコマ画像を、第1画像として取り込んでもよい。
なお、本実施の形態では、第2制御部30は、検索部28で検索された商品の第1画像を表示部18に表示する場合を説明した。しかし、第2制御部30は、検索部28で検索された商品の第1画像と、被写体の画像である第3画像と、を合成した合成画像である第4画像を、表示部18に表示してもよい。
被写体の第3画像は、撮像部13で撮像され、取得部20で取得すればよい。なお、取得部20は、通信回線を介して被写体の第3画像を取得してもよい。また、取得部20は、被写体の第3画像を記憶部14から取得してもよい。この場合には、記憶部14は、被写体の第3画像を予め記憶すればよい。
そして、第2制御部30は、取得部20で取得した被写体の第3画像と、検索部28で検索された商品の第1画像と、を合成することで、第4画像を生成すればよい。なお、第4画像の生成には、公知の方法を用いればよい。例えば、第4画像の生成には、特開2011−48461号公報や、特開2006−249618号方向に記載の方法を用いればよい。
(実施の形態2)
上記実施の形態では、第1画像が、服飾に関する複数のアイテムを含む画像である場合を説明した。本実施の形態では、第1画像が、家具に関する複数のアイテムを含む画像である場合を説明する。また、第2画像は、家具に関する商品の各々を示す画像である場合を説明する。
家具に関するアイテムとは、本実施の形態の商品検索装置10B(図1参照)における検索対象であって、テーブル、椅子、棚、ソファア、等の家具や、これらの家具に関係する物であって、且つ、視認可能な検索対象を示す。
図1は、本実施の形態の商品検索装置10Bの機能的構成を示すブロック図である。商品検索装置10Bは、制御部12B、撮像部13、記憶部14B、入力部16、及び表示部18を備える。撮像部13は、撮像によって、家具に関するアイテムを含む第1画像を得る以外は、実施の形態1の撮像部13と同様である。また、入力部16及び表示部18は、実施の形態1と同様である。
なお、商品検索装置10Bは、実施の形態1の商品検索装置10と同様に、制御部12B、撮像部13、記憶部14B、入力部16、及び表示部18が一体的に設けられた携帯型端末である場合を説明する。また、商品検索装置10Bは、携帯型端末に限られず、撮像部13を備えたPCであってもよい。
記憶部14Bは、ハードディスクドライブ装置等の記憶媒体である。図7は、記憶部14Bに記憶されるデータのデータ構造の一例を示す図である。
記憶部14Bは、識別情報と、グループと、第2画像と、を対応づけて記憶する。第2画像は、本実施の形態では、家具に関する商品の各々を示す画像である。家具に関する商品とは、家具に関するアイテムの内、商取引の対象とするアイテムを示す。このため、第2画像としては、上述した、棚、ソファア、テーブル、等の各商品の画像が挙げられる。
図7に示す例では、第2画像として、第2画像80A〜第2画像80Eが記憶部14Bに記憶されている場合を示した。なお、記憶部14Bに記憶される第2画像は、これらの第2画像80A〜第2画像80Eに限られない。また、記憶部14Bに記憶される第2画像の数も、特定の数に限定されない。
識別情報、及びグループの定義は、実施の形態1と同様である。なお、図7に示す例では、識別情報が、対応する第2画像の示す商品の名称、対応する第2画像の示す商品の価格、及び対応する第2画像の示す商品の発売日を含む場合を示した。また、図7に示す例では、グループの分類条件として、更に、商品の設置場所を含む場合を説明する。
図7に示す例では、グループの分類条件の1つである商品の種類が、棚、ソファア、テーブル、椅子、収納、である場合を示した。また、図7に示す例では、グループの分類条件の1つである設置場所が、リビング、ダイニング、キッチンである場合を示した。また、分類条件の1つである商品の色が、白、黒、茶、緑、である場合を示した。
なお、図7中、「○」は、対応する第2画像の示す商品が、「○」の列に示されるグループに属することを示す。
例えば、図7に示す例では、第2画像80Aは、「棚」、「収納」、及び「白」の各々のグループに属している。また、第2画像80Bの商品は、「棚」、「収納」、及び「茶」の各々のグループに属している。第2画像80Cの商品は、「ソファア」、「リビング」、及び「緑」の各々のグループに属している。第2画像80Dの商品は、「ソファア」、「リビング」、及び「白」の各々のグループに属している。第2画像80Eの商品は、「テーブル」、「リビング」、及び「茶」のグループに属している。
図1に戻り、制御部12Bは、CPU、ROM、及びRAMなどを含んで構成されるコンピュータである。制御部12Bは、商品検索装置10B全体を制御する。また、制御部12Bは、撮像部13、記憶部14B、入力部16、及び表示部18に電気的に接続されている。
制御部12Bは、取得部20B、判定部22B、第1制御部24、受付部26、検索部28、第2制御部30、及び更新部31を備える。第1制御部24、受付部26、検索部28、第2制御部30、及び更新部31は、実施の形態1と同様である。
取得部20Bは、家具に関する複数のアイテムを含む第1画像を取得する。本実施の形態では、取得部20Bは、撮像部13から第1画像を取得する場合を説明する。
判定部22Bは、取得部20Bで取得した第1画像に含まれるアイテムの各々が、何れのグループに属するかを判定する。
例えば、判定部22Bは、最近傍探索や、k近傍法を用いて、取得部20Bで取得した第1画像に含まれるアイテムの各々が、上記各グループの何れに属するかを判定する。なお、判定部22Bが最近傍探索によって類似度を算出し、該類似度に応じて該判定を行う方法は、探索対象が記憶部14Bに記憶されている第2画像である以外は、実施の形態1と同様である。同様に、判定部22Bがk近傍法を用いてヒストグラムを作成し、該ヒストグラムを用いて該判定を行う方法は、探索対象が記憶部14Bに記憶されている第2画像である以外は、実施の形態1と同様である。
図8は、判定部22Bによる、k近傍法を用いた判定を示す模式図である。図8(A)に示すように、第1画像82が、アイテム82A、アイテム82B、アイテム82Cを含む画像であったとする。そして、記憶部14Bには、図8(B)に示すように、第2画像80G〜第2画像80Fと、各第2画像に対応するグループと、図8(B)では図示を省略する識別情報と、が対応づけて記憶されているとする。
この場合、判定部22Bは、まず、第1画像82において、各アイテム82A〜アイテム82Cが含まれる候補領域や背景が含まれる候補領域の特徴量と、記憶部14Bに記憶されている第2画像80A〜第2画像80Fの示す商品の特徴量と、を算出する。そして、判定部22Bは、各候補領域と、各第2画像80A〜第2画像80Fの各々と、の類似度を算出する。
図8(B)には、一例として、アイテム82Aが含まれる候補領域に対する、第2画像80A、及び第2画像80Bの各々の類似度を示した。すなわち、アイテム82Aが含まれる候補領域と、第2画像80A、及び第2画像80Bの各々と、の類似度が、各々、0.93、0.89である場合を示した。
また、図8(B)には、アイテム82Bが含まれる候補領域に対する、第2画像80C、第2画像80F、及び第2画像80Dの各々の類似度を示した。すなわち、アイテム82Bが含まれる候補領域と、第2画像80C、第2画像80F、及び第2画像80Dの各々と、の類似度が、各々、0.77、0.76、及び0.70である場合を示した。また、図8(B)には、アイテム82Cが含まれる候補領域に対する、第2画像80Eの類似度を示した。すなわち、アイテム82Cが含まれる候補領域と、第2画像80Eと、の類似度が、0.74である場合を示した。
なお、図8には、判定部22Bが、第1画像82に含まれるアイテム82Aの候補領域については、k近傍法における上記kを「2」枚とし、アイテム82Bの候補領域については、上記kを「3」枚とし、アイテム82Cの候補領域については、上記kを「1」枚として判定を行った場合を示した。しかし、判定部22Bが第1画像82に含まれる各アイテムにおいて適用するk近傍法のkの値は、第1画像に含まれる各アイテム間で同じ値に設定することが好ましい。
そして、判定部22Bは、第1画像82に含まれるアイテム82A〜アイテム82Cの各候補領域について、各アイテム82A〜アイテム82Cとの類似度の高い順にk枚の第2画像を読み取る。例えば、判定部22Bは、アイテム82Aの候補領域に対応する第2画像として、第2画像80A、及び第2画像80Bを記憶部14Bから読み取る。また、例えば、判定部22Bは、アイテム82Bの候補領域に対応する第2画像として、第2画像80C、第2画像80F、及び第2画像80Dを記憶部14Bから読み取る。また、判定部22Bは、アイテム82Cの候補領域に対応する第2画像として、第2画像80Eを記憶部14Bから読み取る。
さらに、判定部22Bは、候補領域毎に読み取った第2画像(図8に示す例では、第2画像80A〜第2画像80F)に対応するグループを、記憶部14Bから読み取る。そして、判定部22Bは、候補領域毎に読み取った第2画像80A〜第2画像80Fに対応するグループを、記憶部14Bから読み取る。図8に示す例では、判定部22Bは、第2画像80Aに対応するグループとして、「棚」を読み取る。判定部22Bは、第2画像80B〜第2画像80Fについても、同様にして、対応するグループを読取る。
そして、判定部22Bは、これらの読み取ったグループの数を、同じグループ毎に加算した加算値を算出することで、ヒストグラムを作成する。例えば、図8(C)に示すように、グループ「ソファア」には、第2画像80C、第2画像80F、第2画像80Dの各々によって示される商品が属するので、該グループにおける加算値は「3」となる(図8(C)中、線図81A参照)。同様に、図8(C)に示すように、グループ「棚」には、第2画像80A、第2画像80Bの各々によって示される商品が属するので、該グループにおける加算値は「2」となる(図8(C)中、線図81B参照)。
また、図8(C)に示すように、グループ「テーブル」には、第2画像80Eによって示される商品が属するので、該グループにおける加算値は「1」となる(図8(C)中、線図81C参照)。また、図8(C)に示すように、グループ「茶」には、第2画像80B、及び第2画像80Eの各々によって示される商品が属するので、該グループにおける加算値は「2」となる(図8(C)中、線図81D参照)。
さらに、判定部22Bは、これらの加算値によって示されるヒストグラム81によって示される各グループの内、各加算値が予め定めた第2閾値を超えるグループを、第1画像82に含まれる各アイテム82A〜アイテム82Cの候補領域が属するグループとして判定する。
なお、判定部22Bによる判定方法は、実施の形態1と同様に、最近傍探索や、k近傍法に限られない。
図1に戻り、第1制御部24は、実施の形態1と同様に、判定部22Bで判定された、第1画像に含まれるアイテムの各々が属するグループを、表示部18に表示する制御を行う。
本実施の形態の商品検索装置10Bの制御部12Bは、判定部22Bにおいて判定に用いる第2画像が記憶部14Bに格納されている第2画像であり、第1画像が家具に関する複数のアイテムを含む画像である以外は、実施の形態1と同様にして、商品検索処理を実行する。
本実施の形態において、制御部12Bが上記商品検索処理を実行することによって、第1画像に含まれる複数のアイテムの各々の属するグループが表示部18に表示され、さらに、表示されたグループの内、ユーザーによって選択されたグループに対応する商品の第2画像が表示部18に表示される。
次に、本実施の形態における商品検索処理の具体例を説明する。図9は、表示部18に表示される画像の一例を示す模式図である。
図9(A)は、第1画像82の一例を示す模式図である。また、図9(B)及び図9(C)は、表示部18に表示されたグループの一例を示す模式図である。
図9(A)に示すように、複数のアイテムとして、アイテム82A〜アイテム82Dを含む第1画像82を取得部20Bが取得したとする。この場合、商品検索装置10Bが上記商品検索処理を実行し、判定部22Bで判定された各アイテムのグループを第1制御部24が表示部18に表示する。
これによって、図9(B)に示すように、表示部18には、例えば、判定部22Bで判定された、アイテム82A(図9(A)参照)のグループ「棚」の文字を含む画像83Aが表示される。また、表示部18には、例えば、判定部22Bで判定された、アイテム82B(図9(A)参照)のグループ「ソファア」の文字を含む画像83Bが表示される。また、表示部18には、例えば、判定部22Bで判定された、アイテム82C(図9(A)参照)のグループ「テーブル」の文字を含む画像83Cが表示される。また、表示部18には、例えば、判定部22Bで判定された、アイテム82D(図9(A)参照)のグループ「クッション」の文字を含む画像83Dが表示される。
なお、図9(B)に示すように、第1制御部24は、判定部22Bで判定されたグループを表示部18に表示すればよい。このため、表示されるグループの表示形態は、どのような表示形態であってもよい。
また、図9(C)に示すように、判定部22Bで判定されたグループが表示部18に表示された状態で、ユーザPによる入力部16の操作指示によって表示されたグループの何れかが選択されたとする。
この場合、受付部26は、表示部18に表示されたグループの内の少なくとも1つに対する指示入力を受け付ける。検索部28は、記憶部14Bを検索し、受付部26が受け付けた、指示されたグループに対応する第2画像を記憶部14Bから検索する。そして、第2制御部30は、検索部28で検索された第2画像を、表示部18に表示する制御を行う。
以上説明したように、本実施の形態の商品検索装置10Bでは、家具に関する複数のアイテムを含む第1画像に基づいて、該第1画像に含まれるアイテムの各々の属するグループを判定し、判定したグループを表示部18に表示する。そして、表示部18に表示したグループの内、ユーザーの操作指示によって選択されたグループに対応する商品の第1画像を記憶部14Bから検索し、表示部18へ表示する。
従って、本実施の形態の商品検索装置10Bによれば、ユーザーが注目する商品を効率よく検索することができる。
(実施の形態3)
上記実施の形態1では、第1画像が、服飾に関する複数のアイテムを含む画像である場合を説明した。本実施の形態では、第1画像が、旅行に関する複数のアイテムを含む画像である場合を説明する。また、第2画像は、旅行に関する商品の各々を示す画像である場合を説明する。
旅行に関するアイテムとは、本実施の形態の商品検索装置10C(図1参照)における検索対象であって、旅行に関係する検索対象を示す。
旅行に関するアイテムは、例えば、旅行先を地理的に特定可能な情報や、旅行先を地形的に特定可能な情報や、旅行先に存在する建物や、旅行先に旅行するのに適した季節等である。
旅行先を地理的に特定可能な情報は、例えば、アメリカ、ヨーロッパ、アジア、諸島、アフリカ、等である。また、旅行先を地形的に特定可能な情報は、例えば、ビーチ、山、等である。また、旅行先に存在する建物は、例えば、ホテル、等である。また、旅行先に旅行するのに適した季節は、例えば、春、夏、秋、冬である。
図1は、本実施の形態の商品検索装置10Cの機能的構成を示すブロック図である。商品検索装置10Cは、制御部12C、撮像部13、記憶部14C、入力部16、及び表示部18を備える。撮像部13は、撮像によって、旅行に関するアイテムを含む第1画像を得る以外は、実施の形態1の撮像部13と同様である。また、入力部16及び表示部18は、実施の形態1と同様である。
なお、商品検索装置10Cは、実施の形態1の商品検索装置10と同様に、制御部12C、撮像部13、記憶部14C、入力部16、及び表示部18が一体的に設けられた携帯型端末である場合を説明する。また、商品検索装置10Cは、携帯型端末に限られず、撮像部13を備えたPCであってもよい。
記憶部14Cは、ハードディスクドライブ装置等の記憶媒体である。図10は、記憶部14Cに記憶されるデータのデータ構造の一例を示す図である。
記憶部14Cは、識別情報と、グループと、第2画像と、を対応づけて記憶する。第2画像は、本実施の形態では、旅行に関する商品を示す画像である。本実施の形態では、第2画像としては、各旅行先の風景を示す画像を用いる場合を説明する。
図10に示す例では、第2画像として、第2画像84A〜第2画像84Eが記憶部14Cに記憶されている場合を示した。なお、記憶部14Cに記憶される第2画像は、これらの第2画像84A〜第2画像84Eに限られない。また、記憶部14Cに記憶される第2画像の数も、特定の数に限定されない。
識別情報、及びグループの定義は、実施の形態1と同様である。なお、図10に示す例では、識別情報が、対応する第2画像の示す商品の名称、対応する第2画像の示す商品の価格、及び対応する第2画像の示す商品の発売日を含む場合を示した。また、図10に示す例では、グループの分類条件が、旅行先を地理的に特定可能な情報、旅行先を地形的に特定可能な情報、旅行先に存在する建物、及び旅行先に旅行するのに適した季節である場合を示した。
なお、図10中、「○」は、対応する第2画像の示す商品が、「○」の列に示されるグループに属することを示す。
例えば、図10に示す例では、第2画像84Aは、「ビーチ」、「アジア」、及び「夏」の各々のグループに属している。また、第2画像84Bの商品は、「ビーチ」、「アメリカ」、及び「冬」の各々のグループに属している。第2画像84Cの商品は、「アメリカ」、及び「夏」の各々のグループに属している。第2画像84Dの商品は、「ホテル」、「欧州」、及び「春」の各々のグループに属している。第2画像84Eの商品は、「ビーチ」、「ホテル」、「諸島」、及び「冬」のグループに属している。
図1に戻り、制御部12Cは、CPU、ROM、及びRAMなどを含んで構成されるコンピュータである。制御部12Cは、商品検索装置10C全体を制御する。また、制御部12Cは、撮像部13、記憶部14C、入力部16、及び表示部18に電気的に接続されている。
制御部12Cは、取得部20C、判定部22C、第1制御部24、受付部26、検索部28、第2制御部30、及び更新部31を備える。第1制御部24、受付部26、検索部28、第2制御部30、及び更新部31は、実施の形態1と同様である。
取得部20Cは、旅行に関する複数のアイテムを含む第1画像を取得する。本実施の形態では、取得部20Cは、撮像部13から第1画像を取得する場合を説明する。
判定部22Cは、取得部20Cで取得した第1画像に含まれるアイテムの各々が、何れのグループに属するかを判定する。
例えば、判定部22Cは、最近傍探索や、k近傍法を用いて、取得部20Cで取得した第1画像に含まれるアイテムの各々が、上記各グループの何れに属するかを判定する。なお、判定部22Cが最近傍探索によって類似度を算出し、該類似度に応じて該判定を行う方法は、探索対象が記憶部14Cに記憶されている第2画像である以外は、実施の形態1と同様である。同様に、判定部22Cがk近傍法を用いてヒストグラムを作成し、該ヒストグラムを用いて該判定を行う方法は、探索対象が記憶部14Cに記憶されている第2画像である以外は、実施の形態1と同様である。
図11は、判定部22Cによる、k近傍法を用いた判定を示す模式図である。図11(A)に示すように、第1画像86が、アイテム86A、アイテム86B、アイテム86Cを含む画像であったとする。
なお、アイテム86Aは、旅行先に存在する建物である「ホテル」を示すものとして説明する。また、アイテム86Bは、旅行先を地形的に特定可能な情報である「ビーチ」を示すものとして説明する。また、アイテム86Cは、旅行先を地理的に特定可能な情報である「アメリカ」を示すものとして説明する。
そして、記憶部14Cには、図11(B)に示すように、第2画像84A〜第2画像84Fと、各第2画像に対応するグループと、図11(B)では図示を省略する識別情報と、が対応づけて記憶されているとする。
この場合、判定部22Cは、まず、第1画像86において、各アイテム86A〜アイテム86Cが含まれる候補領域や背景が含まれる候補領域の特徴量と、記憶部14Cに記憶されている第2画像84A〜第2画像84Fの示す商品の特徴量と、を算出する。そして、判定部22Cは、実施の形態1と同様にして、各候補領域と、各第2画像84A〜第2画像84Fの各々と、の類似度を算出する。
図11(B)には、一例として、アイテム86A〜86Cの各々が含まれる候補領域に対する、第2画像84A〜第2画像84Fの各々の類似度を示した。
そして、判定部22Cは、実施の形態と同様にして、第1画像86に含まれるアイテム86A〜アイテム86Cの各候補領域について、各アイテム86A〜アイテム86Fとの類似度の高い順にk枚の第2画像を読み取る。
さらに、判定部22Cは、候補領域毎に読み取った第2画像(図11に示す例では、第2画像84A〜第2画像84F)に対応するグループを、記憶部14Cから読み取る。そして、判定部22Cは、候補領域毎に読み取った第2画像84A〜第2画像84Fに対応するグループを、記憶部14Cから読み取る。なお、判定部22Cによるグループの読出しは、実施の形態1と同様である。
そして、判定部22Cは、これらの読み取ったグループの数を、同じグループ毎に加算した加算値を算出することで、ヒストグラムを作成する。例えば、図11(C)に示すように、グループ「ビーチ」には、第2画像84B、第2画像84F、第2画像84E、第2画像84A、の各々によって示される商品が属するので、該グループにおける加算値は「34」となる(図11(C)中、線図85A参照)。同様に、図11(C)に示すように、グループ「ホテル」には、第2画像84D、第2画像84C、第2画像84Eの各々によって示される商品が属するので、該グループにおける加算値は「3」となる(図11(C)中、線図85B参照)。
また、図11(C)に示すように、グループ「アメリカ」には、第2画像84Bによって示される商品が属するので、該グループにおける加算値は「1」となる(図11(C)中、線図85C参照)。また、図11(C)に示すように、グループ「夏」には、第2画像84F、及び第2画像84Dの各々によって示される商品が属するので、該グループにおける加算値は「2」となる(図11(C)中、線図85D参照)。また、図11(C)に示すように、グループ「冬」には、第2画像84B、及び第2画像84Eの各々によって示される商品が属するので、該グループにおける加算値は「2」となる(図11(C)中、線図85E参照)。
さらに、判定部22Cは、これらの加算値によって示されるヒストグラム85によって示される各グループの内、各加算値が予め定めた第2閾値を超えるグループを、第1画像82に含まれる各アイテム86A〜アイテム86Cの候補領域が属するグループとして判定する。
なお、判定部22Cによる判定方法は、実施の形態1と同様に、最近傍探索や、k近傍法に限られない。
図1に戻り、第1制御部24は、実施の形態1と同様に、判定部22Cで判定された、第1画像に含まれるアイテムの各々が属するグループを、表示部18に表示する制御を行う。
本実施の形態の商品検索装置10Cの制御部12Cは、判定部22Cにおいて判定に用いる第2画像が記憶部14Cに格納されている第2画像であり、第1画像が旅行に関する複数のアイテムを含む画像である以外は、実施の形態1と同様にして、商品検索処理を実行する。
本実施の形態において、制御部12Cが上記商品検索処理を実行することによって、第1画像に含まれる複数のアイテムの各々の属するグループが表示部18に表示され、さらに、表示されたグループの内、ユーザーによって選択されたグループに対応する商品の第2画像が表示部18に表示される。
次に、本実施の形態における商品検索処理の具体例を説明する。図12は、表示部18に表示される画像の一例を示す模式図である。
図12(A)は、第1画像86の一例を示す模式図である。また、図12(B)及び図12(C)は、表示部18に表示されたグループの一例を示す模式図である。
図12(A)に示すように、複数のアイテムとして、アイテム86A〜アイテム86Cを含む第1画像86を取得部20Cが取得したとする。この場合、商品検索装置10Cが上記商品検索処理を実行し、判定部22Cで判定された各アイテムのグループを第1制御部24が表示部18に表示する。
これによって、図12(B)に示すように、表示部18には、例えば、判定部22Cで判定された、アイテム86A(図12(A)参照)のグループ「ホテル」の文字を含む画像87Aが表示される。また、表示部18には、例えば、判定部22Cで判定された、アイテム86B(図11(A)参照)のグループ「ビーチ」の文字を含む画像87Bが表示される。また、表示部18には、例えば、判定部22Cで判定された、アイテム86C(図11(A)参照)のグループ「アメリカ」の文字を含む画像87Cが表示される。
なお、図11(B)に示すように、第1制御部24は、判定部22Cで判定されたグループを表示部18に表示すればよい。このため、表示されるグループの表示形態は、どのような表示形態であってもよい。
また、図11(B)に示すように、判定部22Cで判定されたグループが表示部18に表示された状態で、ユーザPによる入力部16の操作指示によって表示されたグループの何れかが選択されたとする(図11(C)参照)。
この場合、受付部26は、表示部18に表示されたグループの内の少なくとも1つに対する指示入力を受け付ける。検索部28は、記憶部14Cを検索し、受付部26が受け付けた、指示されたグループに対応する第2画像を記憶部14Cから検索する。そして、第2制御部30は、検索部28で検索された第2画像を、表示部18に表示する制御を行う。
以上説明したように、本実施の形態の商品検索装置10Cでは、旅行に関する複数のアイテムを含む第1画像に基づいて、該第1画像に含まれるアイテムの各々の属するグループを判定し、判定したグループを表示部18に表示する。そして、表示部18に表示したグループの内、ユーザーの操作指示によって選択されたグループに対応する商品の第1画像を記憶部14Cから検索し、表示部18へ表示する。
従って、本実施の形態の商品検索装置10Cによれば、ユーザーが注目する商品を効率よく検索することができる。
なお、実施の形態1〜実施の形態3による商品検索処理を1台の商品検索装置で実行してもよい。この場合、実施の形態1〜実施の形態3の記憶部14、記憶部14B、記憶部14Cに記憶した上記データを、同じ記憶部14に記憶し、判定部22が、上述した判定部22、判定部22B、及び判定部22Cの処理を実行すればよい。
(実施の形態4)
図13は、本実施の形態の商品検索装置10Aの機能的構成を示すブロック図である。商品検索装置10Aは、制御部12A、撮像部13、記憶部14、入力部16、及び表示部18を備える。入力部16及び表示部18は、UI部17として一体的に構成されている。
制御部12Aは、CPU、ROM、及びRAMなどを含んで構成されるコンピュータである。制御部12Aは、商品検索装置10A全体を制御する。また、制御部12Aは、撮像部13、記憶部14、入力部16、及び表示部18に電気的に接続されている。制御部12Aは、取得部20、推定部21A、判定部22A、第1制御部24、受付部26A、検索部28、第2制御部30、及び更新部31を備える。
なお、本実施の形態では、実施の形態1における商品検索装置10と同じ機能の部分には同じ符号を付与して詳細な説明を省略する。商品検索装置10Aでは、実施の形態1の商品検索装置10(図1参照)の制御部12に替えて、制御部12Aを備えた点が、実施の形態1と異なる。また、制御部12Aは、実施の形態1の制御部12(図1参照)における判定部22及び受付部26に替えて、判定部22A及び受付部26Aを備える。また、制御部12Aは、推定部21Aを更に備える。
受付部26Aは、各種指示入力を受け付ける。実施の形態1と同様に、ユーザーの入力部16による操作指示によって、表示部18に表示されたグループの内の少なくとも1つが選択される。すると、受付部26Aは、表示部18に表示されたグループの内の少なくとも1つに対する指示入力を受け付ける。
また、受付部26Aは、取得部20で取得された第1画像における、判定部22による判定対象の第1位置を求める。この第1位置は、例えば、第1画像上における二次元座標によって示される。
図14は、第1位置の受け付けを示す模式図である。例えば、第1制御部24が、取得部20で取得した第1画像をUI部17の表示部18に表示する制御を行う。ユーザーは、表示部18に表示された第1画像を参照しながら、入力部16を操作指示することによって、表示部18に表示された第1画像における任意の位置を、第1位置として指定する。例えば、UI部17の表示部18に表示された第1画像上のある位置62、ユーザー60の指で示す。これによって、受付部26は、該指示された位置62を示す第1位置を、UI部17の入力部16を介して受け付ける。
なお、ユーザーは、UI部17としてのタッチパネルを、指でなぞる、タッチする、ピンチイン、ピンチアウト、等の操作によって、第1位置を指定すればよい。そして、受付部26Aでは、UI部17を介して指定された第1位置の入力を受け付ければよい。
図13に戻り、推定部21Aは、第1画像における、受付部26Aで受け付けた第1位置に基づいて、第1画像中における判定部22Aによる判定対象領域を推定する。
例えば、推定部21Aは、図14に示すように、ユーザーによって第1画像64上の位置62が第1位置として指示されたときに、該位置62(第1位置)を含む領域66を、判定対象領域として推定する。
この推定部21Aによる推定は、人物検出、顔検出、アイテム検出、saliency mapなどの公知の検出方式の一つまたは複数を組み合わせることで行えばよい。具体的には、推定部21Aは、第1画像における第1位置及び該第1位置の周辺領域を、上記検出方式の一つまたは複数を組み合わせることで検索し、人物、顔、アイテム等が検出されたときに、第1位置を含む該検出された領域を、判定対象領域として推定すればよい。
判定部22Aは、取得部20で取得した第1画像における、推定部21Aで推定された判定対象領域に含まれるアイテムの各々が、上記各グループの何れに属するかを判定する。なお、判定部22Aは、アイテムの判定対象の領域が、第1画像における判定対象領域である以外は、実施の形態1の判定部22と同様にして、判定を行う。
次に、商品検索装置10Aで実行する商品検索処理を説明する。
図15は、本実施の形態の商品検索装置10Aで実行する商品検索処理の手順を示すフローチャートである。なお、図4に示す実施の形態1の商品検索処理と同じ処理には、同じ符号を付与して、詳細な説明を省略する。
図15に示すように、まず、取得部20が撮像部13から第1画像を取得する(ステップS100)。次に、受付部26Aが第1位置を受け付ける(ステップS201)。
次に、推定部21Aが、ステップS201で受け付けられた第1位置に基づいて、ステップS100で受け付けた第1画像における判定対象領域を推定する(ステップS202)。
次に、判定部22Aが、第1画像の該判定対象領域に含まれる候補領域の各々の特徴量を算出する(ステップS203)。次に、判定部22Aが、判定対象領域に含まれる各候補領域の特徴量と、記憶部14に記憶されている第2画像の示す商品の特徴量と、の類似度を、該アイテム毎に算出する(ステップS204)。
次に、判定部22Aは、ステップS204で算出した、判定対象領域に含まれる候補領域毎の類似度の全てが上記第1閾値以上であるか否かを判別する(ステップS206)。ステップS206で否定判断すると(ステップS206:No)、本ルーチンを終了する。
一方、ステップS206で肯定判断すると(ステップS206:Yes)、ステップS207へ進む。
ステップS207において、判定部22Aは、判定対象領域に含まれる各アイテムの各々のグループを判定する(ステップS207)。次に、判定部22Aは、ステップS207の処理によって判別した、第1画像の判定対象領域に含まれる各候補領域中の商品が属するグループを、RAMまたはROMに記憶する(ステップS208)。なお、ステップS208の処理において、判定部22は、該グループを記憶部14に記憶してもよい。
次に、第1制御部24が、上記ステップS208で記憶したグループの一欄または少なくとも一部を、表示部18に表示する(ステップS109)。次に、受付部26Aが、入力部16からグループを受け付けたか否かを判断する(ステップS110)。ステップS110で肯定判断すると(ステップS110:Yes)、ステップS112へ進む。
ステップS112では、ステップS110で受け付けたグループに対応する第2画像を、記憶部14から検索する(ステップS112)。次に、第2制御部30が、ステップS112で検索された第2画像を表示部18に表示し(ステップS114)、本ルーチンを終了する。
一方、上記ステップS110で否定判断すると(ステップS110:No)、ステップS116へ進む。ステップS116では、切替指示を受け付けたか否かを判断する(ステップS116)。ステップS116で否定判断すると(ステップS116:No)、本ルーチンを終了する。また、ステップS116で肯定判断すると(ステップS116:Yes)、ステップS118へ進む。
ステップS118では、第2制御部30が、ステップS108で記憶したグループの内、前回表示部18に表示したグループ以外のグループ読取る(ステップS118)。そして、第2制御部30が、ステップS118で読み取ったグループを、表示部18に表示する制御を行い(ステップS120)、上記ステップS110へ戻る。
上記商品検索処理が実行されることによって、第1画像の判定対象領域に含まれる複数のアイテムの各々の属するグループが表示部18に表示され、さらに、表示されたグループの内、ユーザーによって選択されたグループに対応する商品の第2画像が表示部18に表示される。
このように、本実施の形態の商品検索装置10Aでは、第1画像における、ユーザーの指示した第1位置に基づいて推定した判定対象領域に基づいて、該判定対象領域に含まれる候補領域の属するグループから、商品の第2画像を検索する。従って、本実施の形態の商品検索装置10Aでは、ユーザーが注目する商品を、更に効率よく検索することができる。
なお、本実施の形態では、商品検索装置10Aでは、実施の形態1の商品検索装置10の記憶部14を備えた構成である場合を説明したが、記憶部14に替えて、実施の形態2で説明した記憶部14B、実施の形態3で説明した記憶部14Cを備えた構成としてもよい。また、記憶部14に、記憶部14、記憶部14B、記憶部14Cの各々に記憶しているデータを記憶した構成としてもよい。
このような構成とすることで、ユーザが注目する商品として、服飾に関する商品に限られず、家具に関する商品、旅行に関する商品についても同様に、効率良く検索することができる。
(実施の形態5)
なお、上記実施の形態1〜実施の形態4では、記憶部14、記憶部14B、及び記憶部14Cが、商品検索装置10、商品検索装置10A、商品検索装置10B、商品検索装置10Cの各々に設けられている場合を説明した。実施の形態5では、記憶部14、記憶部14B、及び記憶部14Cが、商品検索装置10、商品検索装置10A、商品検索装置10B、または商品検索装置10Cに通信回線を介して接続された記憶装置に設けられている場合を説明する。
図16は、商品検索システム70を示す模式図である。商品検索システム70は、商品検索装置10Dと、記憶装置72と、が通信回線74を介して接続されている。
商品検索装置10Dは、実施の形態1における商品検索装置10、実施の形態2における商品検索装置10B、実施の形態3における商品検索装置10C、及び実施の形態4における商品検索装置10Aが、記憶部14(記憶部14B、記憶部14C)を備えない構成である。すなわち、商品検索装置10Dは、制御部12(制御部12A、制御部12B、制御部12C)と、入力部16と、表示部18と、を備える。なお、実施の形態1〜実施の形態4と同じ機能部には同じ符号を付与して詳細な説明を省略する。
通信回線74は、有線通信回線や、無線通信回線がある。記憶装置72は、記憶部14を備えた装置であり、公知のPCや各種サーバー等が挙げられる。
図16に示すように、記憶部14(記憶部14B、記憶部14C)を、商品検索装置10Dとは別体として構成し、通信回線74を介して接続された記憶装置72に設けた構成とすることで、複数の商品検索装置10Dから同じ記憶部14(記憶部14B、記憶部14C)にアクセスすることができ、記憶部14(記憶部14B、記憶部14C)に記憶されているデータの一元管理が可能となる。
実施の形態1〜実施の形態5の商品検索装置10、商品検索装置10A、商品検索装置10B、商品検索装置10C、及び商品検索装置10Dで実行される上記商品検索処理を実行するためのプログラムは、ROM等に予め組み込んで提供される。
なお、実施の形態1〜実施の形態5の商品検索装置10、商品検索装置10A、商品検索装置10B、商品検索装置10C、及び商品検索装置10Dで実行される上記商品検索処理を実行するためのプログラムは、これらの装置にインストール可能な形式又は実行可能な形式のファイルでCD−ROM、フレキシブルディスク(FD)、CD−R、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録されて提供するように構成してもよい。
また、実施の形態1〜実施の形態5の商品検索装置10、商品検索装置10A、商品検索装置10B、商品検索装置10C、及び商品検索装置10Dで実行される上記商品検索処理を実行するためのプログラムを、インターネット等のネットワークに接続されたコンピュータ上に記憶し、ネットワーク経由でダウンロードさせることにより提供するように構成してもよい。また、実施の形態1〜実施の形態5の商品検索装置10、商品検索装置10A、商品検索装置10B、商品検索装置10C、及び商品検索装置10Dで実行される上記商品検索処理を実行するためのプログラムを、インターネット等のネットワーク経由で提供または配布するように構成してもよい。
実施の形態1〜実施の形態5の商品検索装置10、商品検索装置10A、商品検索装置10B、商品検索装置10C、及び商品検索装置10Dで実行される上記商品検索処理を実行するためのプログラムは、上述した各部(取得部20、取得部20B、取得部20C、判定部22、判定部22B、判定部22C、第1制御部24、受付部26、検索部28、第2制御部30、更新部31、推定部21A、判定部22A、受付部26A)を含むモジュール構成となっている。実際のハードウェアとしてはCPU(プロセッサ)がROM等の記憶媒体から、上記商品検索処理を実行するためのプログラムを読み出して実行することにより上記各部が主記憶装置上にロードされ、上記各部が主記憶装置上に生成されるようになっている。
なお、上記には、本発明のいくつかの実施の形態を説明したが、これらの実施の形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施の形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施の形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。