JP2017167759A - コーディネート推薦装置、及びプログラム - Google Patents
コーディネート推薦装置、及びプログラム Download PDFInfo
- Publication number
- JP2017167759A JP2017167759A JP2016051562A JP2016051562A JP2017167759A JP 2017167759 A JP2017167759 A JP 2017167759A JP 2016051562 A JP2016051562 A JP 2016051562A JP 2016051562 A JP2016051562 A JP 2016051562A JP 2017167759 A JP2017167759 A JP 2017167759A
- Authority
- JP
- Japan
- Prior art keywords
- feature amount
- topic
- image
- coordination
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010276 construction Methods 0.000 claims abstract description 18
- 239000000284 extract Substances 0.000 claims abstract description 14
- 238000000605 extraction Methods 0.000 claims abstract description 14
- 238000000034 method Methods 0.000 description 15
- 230000037237 body shape Effects 0.000 description 13
- 238000009826 distribution Methods 0.000 description 10
- 238000004364 calculation method Methods 0.000 description 8
- 230000000007 visual effect Effects 0.000 description 7
- 230000008569 process Effects 0.000 description 6
- 230000008859 change Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 208000020221 Short stature Diseases 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
【課題】ユーザの属性に応じたコーディネートを推薦する装置及びプログラムを提供する。【解決手段】特徴量抽出部130が、学習用のコーディネート画像の各々から、ファッションのコーディネート対象となるパーツ領域を抽出する。確率モデル構築部132が、パーツ領域の各々についての各特徴量の頻度を表すヒストグラムを並べた特徴量ヒストグラムを抽出し、学習用のコーディネート画像の各々の特徴量ヒストグラムと、学習用のコーディネート画像の各々が表す人物の属性とに基づいて、属性毎に、属性の人物が各トピックを好む確率、及び属性の人物において各トピックから各特徴量が出現する確率を含む確率モデルを構築する。コーディネート推薦部134が、ユーザが入力した画像と、構築された確率モデルとに基づいて、入力した画像のトピック比率を算出し、算出されたトピック比率に対応するコーディネートを推薦する。【選択図】図2
Description
本発明は、コーディネート推薦装置、及びプログラムに係り、特に、ユーザにコーディネートを推薦するためのコーディネート推薦装置、及びプログラムに関する。
従来より、コーディネートを推薦する手法に関する技術が提案されている。非特許文献1には、日々のコーディネートを天気や会う人といった情報とともに記録し、これらの情報をもとに天気予報や、スケジュール、会う人などに応じて過去の履歴を参照しコーディネートを推薦する技術が提案されている。
非特許文献2には、鏡の前に立つとその日のコーディネートが撮影・記録され、それらの過去のユーザの履歴からコーディネートを推薦する技術が提案されている。
辻田 眸,北村 香織,神原 啓介,塚田 浩二,椎尾 一郎,「Asa1-coordinator:履歴情報を利用したファッションコーディネート支援」ヒューマンインターフェースシンポジウム2009
佐藤 彩夏,渡邊 恵太,安村 通晃,「姿を利用したファッションコーディネート支援システムsuGATALOG」情報処理学会インタラクション2011
しかし、非特許文献1、及び非特許文献2では、過去の履歴のデータがユーザに適しているのか、客観的にみてより似合ったものになっているのかは考慮されていない。ファッションは、時と場所、場合、また各アイテムの組合せ、それらコーディネートの雰囲気への好みといった観点以外に、ユーザの年齢や体型を考慮し、そもそもユーザの体型にあっているのか判断する必要があるが、そのような推薦をするシステムはこれまでに存在しなかった。ユーザの体型にあっているかは、サイズを測り、サイズにあったものを着るだけで克服できるものではなく、例えば、柄の細かいデザインの服を着ることで、相対的に体を細く見せるなど、視覚効果をねらったコーディネートが必要となり、その推薦をすることができるシステムは存在しなかった。また、一般に、ファッションアイテムを購買する際には、テレビや雑誌で気になるファッションコーディネートをチェックし、それを参考にする。しかし、そのファッションを身に着けているモデルと体型が違えば、テレビや雑誌での映像、画像で気に入ったからといってそれと同じものを購入しても、結局似合わずに着られない場合は多々でてくる。
本発明は、上記事情を鑑みて成されたものであり、ユーザの属性に応じたコーディネートを推薦することができるコーディネート推薦装置、及びプログラムを提供することを目的とする。
上記目的を達成するために、第1の発明に係るコーディネート推薦装置は、ユーザの属性にあったコーディネートを提示するコーディネート推薦装置であって、学習用のコーディネート画像の各々から、ファッションのコーディネート対象となるパーツ領域を抽出し、パーツ領域の各々についての各特徴量の頻度を表すヒストグラムを並べた特徴量ヒストグラムを抽出する特徴量抽出部と、前記特徴量抽出部により抽出された学習用のコーディネート画像の各々の前記特徴量ヒストグラムと、学習用のコーディネート画像の各々が表す人物の属性とに基づいて、前記属性毎に、前記属性の人物が各トピックを好む確率、及び前記属性の人物において各トピックから各特徴量が出現する確率を含む確率モデルを構築する確率モデル構築部と、前記ユーザが入力したクエリ画像と、前記確率モデル構築部により構築された前記確率モデルとに基づいて、前記入力したクエリ画像のトピック比率を算出し、算出された前記トピック比率に対応するコーディネートを推薦するコーディネート推薦部と、を含んで構成されている。
また、第1の発明に係るコーディネート推薦装置において、前記コーディネート推薦部は、前記ユーザが入力したコーディネートを表すクエリ画像から、前記特徴量ヒストグラムを抽出し、前記抽出された特徴量ヒストグラムと、前記構築された前記確率モデルにおける、前記クエリ画像が表す人物の属性において各トピックから各特徴量が出現する確率とに基づいて、前記クエリ画像のトピック比率を算出し、
予め用意された複数のコーディネート画像の各々についての、前記コーディネート画像から抽出された特徴量ヒストグラムと、前記構築された前記確率モデルにおける、前記ユーザの属性において各トピックから各特徴量が出現する確率とに基づいて算出される前記コーディネート画像のトピック比率と、算出された前記入力したクエリ画像のトピック比率とに基づいて、前記入力したクエリ画像のトピック比率に対応するコーディネートを推薦するようにしてもよい。
また、第1の発明に係るコーディネート推薦装置において、前記コーディネート推薦部は、前記ユーザが入力したアイテムを表すクエリ画像から、前記特徴量ヒストグラムを抽出し、前記抽出された特徴量ヒストグラムと、前記構築された前記確率モデルにおける、前記ユーザが入力した前記ユーザの属性において各トピックから各特徴量が出現する確率とに基づいて、前記クエリ画像のトピック比率を算出し、予め用意された前記クエリ画像が表すアイテムのパーツとは異なるパーツのアイテムを表す複数の画像の各々についての、前記画像から抽出された特徴量ヒストグラムと、前記構築された前記確率モデルにおける、前記ユーザの属性において各トピックから各特徴量が出現する確率とに基づいて算出される前記画像のトピック比率と、算出された前記クエリ画像の前記トピック比率とに基づいて、前記クエリ画像のトピック比率に対応する、前記クエリ画像が表すアイテムのパーツとは異なるパーツのアイテムを推薦するようにしてもよい。
また、第1の発明に係るコーディネート推薦装置において、前記確率モデル構築部は、前記特徴量抽出部により抽出された学習用のコーディネート画像の各々の前記特徴量ヒストグラムと、学習用のコーディネート画像の各々が表す人物の属性とに基づいて、前記確率モデルとして、ダイナミックトピックモデルを構築するようにしてもよい。
また、第1の発明に係るコーディネート推薦装置において、前記属性は、身長、肩幅、ウエスト幅、又は年齢の値とするようにしてもよい。
第2の発明に係るプログラムは、コンピュータを、第1の発明に係るコーディネート推薦装置の各部として機能させるためのプログラムである。
本発明のコーディネート推薦装置、及びプログラムによれば、学習用のコーディネート画像の各々から、ファッションのコーディネート対象となるパーツ領域を抽出し、パーツ領域の各々についての各特徴量の頻度を表すヒストグラムを並べた特徴量ヒストグラムを抽出し、学習用のコーディネート画像の各々の特徴量ヒストグラムと、学習用のコーディネート画像の各々が表す人物の属性とに基づいて、属性毎に、属性の人物が各トピックを好む確率、及び属性の人物において各トピックから各特徴量が出現する確率を含む確率モデルを構築し、クエリ画像と、構築された確率モデルとに基づいて、クエリ画像のトピック比率を算出し、算出されたトピック比率に対応するコーディネートを推薦することにより、ユーザの属性に応じたコーディネートを推薦することができる、という効果が得られる。
以下、図面を参照して本発明の実施の形態を詳細に説明する。
<本発明の実施の形態に係る概要>
まず、本発明の実施の形態における概要を説明する。コーディネートの推薦においては、気に入ったファッションコーデを考慮するだけでなく、ユーザの年齢や体型といった属性にあうようにアレンジした商品をレコメンドすることにより、よりユーザの満足度を高めることができると考えられる。例えば、ユーザの体型にあうようなアレンジとは、小柄な体型が気になるならば、柄は小さいものを選択する、足を長く見せたければ、ウエストより少し上にベルトをまき、重心を高くするなど、体型にあわせたコーディネートのテクニックがファッションに関する雑誌などでは紹介されている。しかし、それらのアレンジを、ファッションコーディネータではない一般の人が考慮しようとしても、なかなかうまく適用するのは難しい。そこで、本発明の実施の形態に係るシステムでは、身長など体型ごとに、どのようなコーディネートが適しているのか、配色やデザインといった観点からコーディネートのモデルを作成する。これにより、ユーザの希望するスタイルでユーザの体型にあったアイテムを推薦することも可能となり、ユーザの希望するアイテムにどのような他のアイテムを組み合わせれば、ユーザの体型にあったものになるのかなどの算出も可能となる。
<本発明の実施形態に係るコーディネート推薦システムの構成>
まず、本発明の実施形態に係るコーディネート推薦システムの構成について説明する。図1に示すように、実施形態に係るコーディネート推薦システム1は、クライアント端末50と、ネットワーク80と、コーディネート推薦装置100(200)とを含んで構成されている。
クライアント端末50は、ユーザからコーディネート画像の入力を受け付け、当該コーディネート画像を、ネットワーク80を介して、コーディネート推薦装置100に送信する。また、クライアント端末50は、ネットワーク80を介して、コーディネート推薦装置100から受信したコーディネートの推薦結果を当該クライアント端末50のディスプレイ等に表示する。
コーディネート推薦装置100は、ネットワーク80を介して、クライアント端末50から受信したコーディネート画像に基づいて、コーディネートを推薦し、推薦するコーディネートを、ネットワーク80を介して、クライアント端末50に送信する。
<本発明の第1の実施の形態に係るコーディネート推薦装置の構成>
次に、本発明の第1の実施の形態に係るコーディネート推薦装置の構成について説明する。図1に示すように、本発明の第1の実施の形態に係るコーディネート推薦装置100は、CPUと、RAMと、後述するコーディネート推薦処理ルーチンを実行するためのプログラムや各種データを記憶したROMと、を含むコンピュータで構成することが出来る。このコーディネート推薦装置100は、機能的には図1に示すように入力部110と、演算部120と、出力部150とを備えている。
入力部110は、学習用のコーディネート画像の各々と、学習用のコーディネート画像の各々が表す人物の身長とを受け付ける。コーディネート画像は、モデルなどファッションに関する知見のある人物のファッションのコーディネート例の画像を、モデルの身長の情報とともに多数収集したものである。また、入力部110は、ユーザが入力したコーディネート画像、及びユーザの身長を表す情報を受け付ける。
演算部120は、画像DB122と、ファッションコーディネートDB124と、特徴量抽出部130と、確率モデル構築部132と、コーディネート推薦部134とを含んで構成されている。
画像DB122には、年齢別、体型別といった人物の属性ごとに、コーディネートを表す画像が格納されている。コーディネート画像は、可能であればサイズごとに用意しておき、ユーザが着用可能なサイズのコーディネート画像を取得できるようにしておく。
ファッションコーディネートDB124には、体型によるコーディネートについて考慮するため、後述する確率モデル構築部132で学習した、体型に応じたファッションコーディネートを確率モデルで表現するためのパラメータ、及び後述する特徴量抽出部130で抽出する画像の特徴量に関する情報等が記憶されている。
特徴量抽出部130は、入力部110で受け付けた学習用のコーディネート画像の各々から、ファッションのコーディネート対象となるパーツ領域を抽出し、パーツ領域の各々についての各特徴量の頻度を表すヒストグラムを並べた特徴量ヒストグラムを抽出する。
特徴量抽出部130は、具体的には、まず、入力されたコーディネート画像から人物領域を抽出し、トップス、ボトムスなどのパーツ領域ごとに分割する。参考文献1のように大量の学習用画像をもとにポーズ推定をおこない、パーツの位置推定をおこなってもよい。
[参考文献1]Kota Yamaguchi, M Hadi Kiapour, Luis E Ortiz, Tamara L Berg, "Parsing Clothing in Fashion Photographs", CVPR 2012
特徴量抽出部130は、次に、抽出したパーツ領域ごとに特徴量ヒストグラムを算出する。
特徴量はどのようなものでもよいが、形状、柄、カラーといったファッションに関する特徴を捉える特徴量をもちいることが好ましい。例えば、参考文献2に記載のLBPや、カラー特徴量、参考文献3に記載のBag of visual wordsなどを用いる。
[参考文献2]T. Ojala, M. Pietikainen, and D. Harwood (1996), "A Comparative Study of Texture Measures with Classification Based on Feature Distributions", Pattern Recognition, vol. 29, pp. 51-59.
[参考文献3]八木康史・齋藤英雄編,「コンピュータビジョン最先端ガイド3」“4章 Bag-of-Featuresに基づく物体認識(2) - 一般物体認識 -”,アドコム・メディア株式会社,2010年6月発行.
ここでは、一例としてカラー特徴量について述べる。カラー画像では各ピクセル(画素)はR,G,Bがそれぞれ0から255までの値を取るのでカラー値は256×256×256個ある。これを、例えば4×4×4の64色に落とす。落とし方は、まず、R,G,Bそれぞれについて、0から255の区間を、0から63、64から127、128から191、192から255の4つの区間に分ける。0から63の区間の場合、カラー値0とし、64から127の区間の場合、カラー値1、128から191の区間の場合カラー値2、192から255の区間の場合カラー値を3とする。これにより、Rのカラー値×4×4+Gのカラー値×4+Bのカラー値で、カラー特徴量を表現する。たとえば(R,G,B)=(60,189,214)のとき、Rのカラー値は0、Gのカラー値2、Bのカラー値3となり、0×16+2×4+3となり、カラー特徴量は11と表現される。このように、各ピクセルごとに、64までの値で、カラー特徴量が表現される。
特徴量抽出部130は、上記の特徴量をパーツ領域ごとに抽出し、パーツ領域ごとに、各カラー特徴量の値の出現頻度を表すヒストグラムを生成する。
参考文献2に記載のLBPは、注目する画素の近傍8画素について、注目画素との差が正ならば1を、0以下ならば0を割り当て、8近傍を8ビットの1と0の2進数で表現する特徴量である。得られた8ビットの数を10進数になおし、各画素での値をLBP特徴量とし、パーツ領域ごとに、各LBP特徴量の値の出現頻度を表すヒストグラムを算出する。また、参考文献3に記載のBag of visual wordsを用いて、パーツ領域ごとに、Bag of visual wordsを表すヒストグラムを算出する。
これらのパーツ領域ごとのヒストグラムを、パーツ領域ごとに並べることで特徴量ヒストグラムを作成する。たとえば、パーツ領域のうち、左肩領域から抽出した、LBP特徴量のヒストグラム、Bag of visual wordsを表すヒストグラム、カラー特徴量のヒストグラムを並べ、次に右肩領域のLBP特徴量のヒストグラム、Bag of visual wordsを表すヒストグラム、カラー特徴量のヒストグラム、次に足領域のLBP特徴量のヒストグラム、Bag of visual wordsを表すヒストグラム、カラー特徴量のヒストグラムの順に格納するといったように、パーツ領域ごとに決まった順番にヒストグラムを並べ、並べられたヒストグラムを学習用画像の特徴量ヒストグラムとする。
確率モデル構築部132は、特徴量抽出部130により抽出された学習用のコーディネート画像の各々の特徴量ヒストグラムと、学習用のコーディネート画像の各々が表す人物の身長とに基づいて、身長毎に、身長の人物が各トピックを好む確率、及び当該身長の人物において各トピックから各特徴量が出現する確率を含む確率モデルを構築する。本実施の形態では、確率モデルとして、ダイナミックトピックモデルを構築する。また、本実施の形態では、属性として身長を用いたが、属性としては身長の他に、例えば、肩幅、ウエスト幅、又は年齢の値とすることができる。
本実施の形態では、参考文献4に記載のダイナミックトピックモデルを構築する。
[参考文献4]Blei, David M; Lafferty, John D (2006). "Dynamic topic models". Proceedings of the ICML. ICML'06: 113-120. ISBN 1-59593-383-2.
参考文献4記載のダイナミックトピックモデルにおけるパラメータ時刻が、ユーザの体型つまり身長にあたり、トピックは、ファッションのスタイルにあたると想定され、たとえば、通勤、スポーティ、コンサバ、フェミニンといったような用語で表現されるものである。
また、参考文献4記載のダイナミックトピックモデルにおけるワードは、特徴量、つまりデザインにあたり、たとえば、柄の大きさやえりまわりのかたち、配色などの出現の仕方にあたる。
ダイナミックトピックモデルは、次のようなトピックの段階的な変化を考慮したモデルである。身長によって興味のあるファッションのスタイル(ダイナミックトピックモデルにおけるトピック)はおのずと変わってくる。例えば、高い身長の人たちにはスポーティ、クールといったようなスタイルが好まれ、身長の低い人たちにはガーリーやフェミニンといったスタイルが好まれるといったような傾向があると想定される。それを身長tごとに異なるスタイル分布αtzをもつとする。身長ごとにランダムに異なるわけではなく、身長ごとに少しずつ好みのスタイルが変化すると期待され、隣の身長の分布から少しだけ移動させながら推測する。また、好みのスタイルと同様に、同じスタイルに分類されても、身長によって着こなせるデザイン(ダイナミックトピックモデルにおけるワード)も少しずつ変わってくると考えられる。同じフェミニンでも、高い身長の人は大きな柄のデザインを好み、低い身長の人は小さい柄のデザインを好むなど、身長tごとに各ファッションのトピック(スタイル)zから出現しやすい画像特徴量(デザイン)vの分布(画像特徴量vの出現確率)βtzvの傾向が異なると推定され、その分布を表すパラメータαtz、及びβtzvを学習する。
つまり、学習用のコーディネート画像の各々から、上記参考文献4に記載の手法によって学習されるパラメータαtzは、身長tの人物がトピックzを好む確率であり、βtzvは、身長tの人物のトピックzから画像特徴量(デザイン)vが出現する出現確率である。
ここで、ダイナミックトピックモデルによる、身長tにおけるトピック及び画像特徴量の生成過程を以下に説明する。なお、各身長tについて順に生成されるものとする。
まず、トピックk(k=1,…,Z)について、画像特徴量分布βt,zを以下の式に従って生成する。
βt,z|βt-1,z〜N(βt-1,z,σ2I
次に、トピックk(k=1,…,Z)について、トピックの事前分布αt,zを以下の式に従って生成する。
αt,z|αt-1,z〜N(αt-1,z,δ2I)
また、画像(d=1,…,D)について、画像特徴量(v=1,…,V)毎に、以下の式に従って、トピックZt,v,nを生成する。
Zt,v,n〜Mult(π(ηt,d))
ただし、
ηt,v〜N(αt,a2I)
ただし、
ηt,v〜N(αt,a2I)
また、以下の式に従って、画像特徴量Wt,v,nを生成する。
ここで、Nはガウシアン分布、Multは多項分布である。
確率モデル構築部132は、各身長tについて順に上記の生成過程でトピック及び画像特徴量を生成するダイナミックトピックモデルにおける、身長tごとのパラメータαtz、及びβtzvを学習し、ファッションコーディネートDB124に格納する。
また、雑誌に出てくるモデルの身長は高い傾向にあると思われるので、たとえば、学習用データの中で一番高い身長から順次低い身長のトピックを推定していくように学習してもよい。ダイナミックトピックモデルにより、高い身長のモデルのコーディネートを目標にしつつ、各身長にあうように少しずつデザインをアレンジしている様子がトピックのなかの特徴量の変化に現れると思われる。身長別に独立にスタイルやデザインが選択されるわけではなく、模倣したい身長のコーディネートモデルにおけるトピックから、少しずつ真似しつつ各身長に合うように変化しているはずであり、その関連性もファッションコーディネートモデルで表現することができる。
例えば、オフィスというスタイルを表すトピックで、高身長のモデルはパンツ姿が多くても、小柄になるにつれ、同じオフィスのスタイルの雰囲気でも着用するものはタイトスカートを好むなどの好みのデザイン(画像特徴量)が変化してくる傾向が表れるなどの例があげられる。
上記のようにファッションコーディネートをダイナミックトピックモデルで記述する。
ファッションコーディネートDB124には、各画像特徴量の算出方法、各身長の好みのトピック分布や各トピックからのデザイン(画像特徴量)の出現確率等とともに、後述する類似度を算出するための式も記憶しておく。
コーディネート推薦部134は、入力部110で受け付けたユーザが入力したコーディネート画像と、確率モデル構築部132により構築された確率モデルとに基づいて、入力した画像のトピック比率を算出し、算出されたトピック比率に対応するコーディネート画像を画像DB122から取得して出力部150に出力し、ネットワーク80を介して、クライアント端末50にコーディネート推薦結果として送信する。
コーディネート推薦部134は、具体的には以下に説明するように、ユーザが入力したコーディネートを表すクエリ画像から、特徴量ヒストグラムを抽出し、抽出された特徴量ヒストグラムと、構築された確率モデルにおける、クエリ画像が表す人物の身長tにおいて各トピックから各特徴量が出現する確率とに基づいて、クエリ画像のトピック比率を算出し、画像DB122に記憶された複数のコーディネート画像の各々についての、当該コーディネート画像から抽出された特徴量ヒストグラムと、確率モデルにおける、ユーザの属性において各トピックから各特徴量が出現する確率とに基づいて算出されるコーディネート画像のトピック比率と、算出されたクエリ画像のトピック比率とに基づいて、クエリ画像のトピック比率に対応するコーディネートを推薦する。
ここでは、ユーザが入力した、ユーザの真似したい全身のファッションを表すコーディネート画像(以下クエリ画像とする)と、ユーザの身長とをもとに推薦画像を検索する方法について説明する。
まず、上記確率モデル構築部132と同様の手法で、クエリ画像から人の領域を切り出し、パーツ領域ごとに分割する。パーツ領域ごとに学習時に用いたものと同じ特徴量を抽出し、パーツ領域ごとのヒストグラムを並べた特徴量ヒストグラムを算出する。
次に、クエリ画像のトピック比率を算出する。クエリ画像が表す人物(モデル)の身長がわかればその身長の値を用い、わからなければ、雑誌の女性モデルの身長のだいたい平均にあたる168cmをデフォルトで入力してもよい。例えば、デフォルトの身長で作られた各トピックの確率Pzからなるトピック比率Pを以下(1)式で計算する。
zはトピック、vは特徴量、mvは特徴量ヒストグラムの特徴量vのビンの出現頻度を表し、βtzvは、入力した身長tのトピックzにおける画像特徴量vの出現確率である。βtzvは、ファンションコーディネートDB124に格納されている確率モデルから得られる。上記(2)式で表されるトピック比率が、どのようなスタイルのコーディネートが望ましいかを示した数値と考えられる。そのため、ユーザが望んでいるのは、どのようなスタイルのコーディネートなのか、例えば、オフィススタイルでかつフェミニンな雰囲気がいいのか(この場合は、オフィススタイルを表現するトピックとフェミニンを表現するトピックの比率が高くなる)、オフィススタイルでクールな雰囲気がいいのかなどを判定することが可能となる。
また、画像DB122に記憶されているコーディネート画像から、ユーザの属性に対応するコーディネート画像を、推薦用のコーディネート画像として取得し、推薦用のコーディネート画像の各々において、トピック比率を算出する。このとき、以下(2)式のように、ユーザの身長のトピックzにおける画像特徴量vの出現確率を用いて、各トピックの確率P´zを算出する。
そして、画像DB122のコーディネート画像の各々のトピック比率と、クエリ画像のトピック比率との照合を行い、画像DB122のコーディネート画像のうち類似度の高いコーディネート画像を推薦画像として決定する。
学習時に同じ身長のモデルのコーディネート画像を用いて身長tごとに独立にトピックモデルを学習した場合、トピックも独立に生成されてしまうため、ユーザと異なる身長のモデルのコーディネート画像を用いてこのような推薦をすることはできない。しかし、前述のように、どの身長であっても似通ったスタイルが生成され、そのスタイルから出現するデザインが少しずつ変化するといった前提をもとに学習したダイナミックトピックモデルを用いていることにより、ユーザ自身とは身長の異なるモデルのコーディネート画像のスタイルから、ユーザ自身の身長にあったアレンジがされたコーディネート画像を検索することを可能にしている。
<本発明の実施の形態に係るコーディネート推薦装置の作用>
次に、本発明の実施の形態に係るコーディネート推薦装置100の作用について説明する。入力部110において学習用のコーディネート画像の各々及び学習用のコーディネート画像の各々が表す人物の身長と、ユーザが入力したコーディネートを表すクエリ画像、及びユーザの身長を表す情報とを受け付けると、コーディネート推薦装置100は、図3に示すコーディネート推薦処理ルーチンを実行する。
まず、ステップS100では、入力部110で受け付けた学習用のコーディネート画像の各々と、学習用のコーディネート画像の各々が表す人物の身長とに基づいて、確率モデルを構築する。
ステップS102では、入力部110で受け付けたユーザが入力したクエリ画像と、ステップS100により構築された確率モデルと、ユーザの身長を表す情報とに基づいて、コーディネートを推薦する。
上記ステップS100は、図4に示す確率モデル構築処理ルーチンによって実行される。
ステップS200では、入力部110で受け付けた入力された学習用のコーディネート画像の各々から人物領域を抽出し、トップス、ボトムスなどのパーツ領域ごとに分割する。
ステップS202では、ステップS200で分割したパーツ領域ごとに特徴量を抽出する。
ステップS204では、パーツ領域ごとに、ステップS202で抽出した特徴量から算出されるヒストグラムを並べて、特徴量ヒストグラムを生成する。
ステップS206では、ステップS204で生成した学習用のコーディネート画像の各々の特徴量ヒストグラムと、学習用のコーディネート画像の各々が表す人物の身長とに基づいて、身長毎に、身長の人物が各トピックを好む確率、及び当該身長の人物において各トピックから各特徴量が出現する確率を含む確率モデルを構築する。
上記ステップS102は、図5に示す推薦処理ルーチンによって実行される。
ステップS300では、上記確率モデル構築部132と同様の手法で、ユーザが入力したクエリ画像から人の領域を切り出し、パーツ領域ごとに分割する。
ステップS302では、パーツ領域ごとに、学習時に用いたものと同じ特徴量を抽出してヒストグラムを算出し、パーツ領域ごとにヒストグラムを並べた特徴量ヒストグラムを抽出する。
ステップS304では、ステップS302で抽出された特徴量ヒストグラムと、ステップS100で構築された確率モデルにおける、入力したクエリ画像が表す人物の身長tにおいて各トピックから各特徴量が出現する確率とに基づいて、上記(1)式に従って、ユーザが入力したクエリ画像のトピック比率を算出する。
ステップS306では、画像DB122に記憶されているコーディネート画像から、ユーザの属性に対応するコーディネート画像を、推薦用のコーディネート画像として取得し、推薦用のコーディネート画像の各々について、上記(2)式に従って、ユーザの身長において各トピックから各特徴量が出現する確率を用いて、トピック比率を算出する。
ステップS308では、推薦用のコーディネート画像の各々のトピック比率と、ユーザが入力したクエリ画像のトピック比率との照合を行い、推薦用のコーディネート画像のうち類似度の高いコーディネート画像を推薦画像として決定する。
ステップS310では、ステップS310で推薦画像として決定したコーディネート画像を画像DB122から取得して出力部150に出力し、ネットワーク80を介して、クライアント端末50にコーディネート推薦結果として送信する。
以上説明したように、第1の実施の形態に係るコーディネート推薦装置によれば、学習用のコーディネート画像の各々から、ファッションのコーディネート対象となるパーツ領域を抽出し、パーツ領域の各々についての各特徴量の頻度を表すヒストグラムを並べた特徴量ヒストグラムを抽出し、学習用のコーディネート画像の各々の特徴量ヒストグラムと、学習用のコーディネート画像の各々が表す人物の身長とに基づいて、身長毎に、身長の人物が各トピックを好む確率、及び身長の人物において各トピックから各特徴量が出現する確率を含む確率モデルを構築し、ユーザが入力したクエリ画像と、構築された確率モデルとに基づいて、入力したクエリ画像のトピック比率を算出し、算出されたトピック比率に対応するコーディネートを推薦することにより、ユーザの身長に応じたコーディネートを推薦することができる。
また、ユーザが自分と異なる体型のモデルの着用しているファッションコーディネートを真似したい場合、学習により得られたファッションの確率モデルから当該ユーザの体型にあうようにアレンジされたコーディネートを推薦することができる。
<本発明の第2の実施の形態に係るコーディネート推薦装置の構成>
次に、本発明の第2の実施の形態に係るコーディネート推薦装置の構成について説明する。なお、第1の実施の形態と同様となる箇所については同一符号を付して説明を省略する。
図6に示すように、本発明の第2の実施の形態に係るコーディネート推薦装置200は、CPUと、RAMと、後述するコーディネート推薦処理ルーチンを実行するためのプログラムや各種データを記憶したROMと、を含むコンピュータで構成することが出来る。このコーディネート推薦装置200は、機能的には図6に示すように入力部210と、演算部220と、出力部250とを備えている。
入力部210は、学習用のコーディネート画像の各々と、学習用のコーディネート画像の各々が表す人物の身長とを受け付ける。また、入力部210は、ユーザが入力したアイテムを表す画像、及びユーザの身長を表す情報を受け付ける。ここで、アイテムとは、人物が各パーツ領域において着用しているトップス、ボトムス等のファッションアイテムを示す。
演算部120は、画像DB222と、ファッションコーディネートDB124と、特徴量抽出部130と、確率モデル構築部132と、コーディネート推薦部234とを含んで構成されている。
画像DB222には、年齢別、体型別といった人物の属性ごとに、パーツごとのアイテムを表す画像(トップスだけ、あるいはボトムスだけなどのアイテムを表す画像)が格納されている。
コーディネート推薦部234は、入力部210で受け付けたユーザが入力したアイテムを表すクエリ画像から、特徴量ヒストグラムを抽出し、抽出された特徴量ヒストグラムと、構築された確率モデルにおける、ユーザが入力したユーザの身長において各トピックから各特徴量が出現する確率とに基づいて、入力したアイテムを表すクエリ画像のトピック比率を算出する。そして、画像DB222に記憶されたクエリ画像が表すアイテムのパーツとは異なるパーツのアイテムを表す複数の画像の各々についての、当該画像から抽出された特徴量ヒストグラムと、確率モデルにおける、ユーザの身長において各トピックから各特徴量が出現する確率とに基づいて算出される当該画像のトピック比率と、算出されたクエリ画像のトピック比率とに基づいて、クエリ画像のトピック比率に対応する、クエリ画像が表すアイテムのパーツとは異なるパーツのアイテムを表す画像を画像DB222から取得して出力部150に出力し、ネットワーク80を介して、クライアント端末50にコーディネート推薦結果として送信する。
例えば、ユーザが入力したアイテムを表すクエリ画像が、トップスのアイテムを表す画像であれば、当該トップスに合うボトムスのアイテムを表す画像を画像DB222から取得する。
まず、入力されたアイテムを表すクエリ画像(以下、クエリ画像とする)から、参考文献5に記載のGrabcutの手法などでアイテム領域を抽出し、学習に用いられた画像特徴量と同じ特徴量を抽出し、アイテム領域のヒストグラムを並べた特徴量ヒストグラムを算出する。次に、クエリ画像のトピック比率を算出する。トップスの各トピックのトピック比率を算出する場合は、トピック毎に、当該トップスの各特徴量の、ユーザの身長における当該トピックからの出現確率を、トップスの各特徴量のビンの頻度と掛け合わせ、加算することで得られる。ボトムスの場合も同様に算出する。
[参考文献5]“GrabCut”-Interactive Foreground Extraction using Iterated Graph Cuts SIGGRAPH '04 ACM SIGGRAPH 2004 Papers P.309-314
また、画像DB222に記憶されているアイテムを表す画像から、ユーザの属性に対応するアイテムを表す画像であって、クエリ画像とは異なるパーツのアイテムを表す画像を、推薦用のアイテムを表す画像として取得し、推薦用のアイテムを表す画像の各々において、クエリ画像と同様に、トピック比率を算出する。そして、画像DB222のアイテムを表す画像の各々のトピック比率と、クエリ画像のトピック比率との照合を行い、画像DB222のコーディネート画像のうち類似度の高いコーディネート画像を推薦画像として決定する。類似度の算出には何を用いてもよいが、ユークリッド距離やコサイン類似度、KLダイバージェンスなどがあげられる。データベースに保存された類似度算出式を用い、類似度が高いと判定された画像を推薦する。身長ごとに、トピックからの画像特徴量の出現確率等が少しずつ異なるため、アイテム画像が同じデザインでも、身長ごとに異なるトピック比率となり、身長ごとに適したアイテムを推薦することを可能にする。
なお、第2の実施の形態に係るコーディネート推薦装置200の他の構成は第1の実施の形態と同様であるため詳細な説明を省略する。
<本発明の第2の実施の形態に係るコーディネート推薦装置の作用>
次に、本発明の第2の実施の形態に係るコーディネート推薦装置200の作用について説明する。入力部210において学習用のコーディネート画像の各々及び学習用のコーディネート画像の各々が表す人物の身長と、ユーザが入力したアイテムを表すクエリ画像と、ユーザの身長を表す情報とを受け付けると、コーディネート推薦装置200は、上記図3に示すコーディネート推薦処理ルーチンを実行する。
ただし、第2の実施の形態のステップS102は、図7に示す推薦処理ルーチンによって実行される。
ステップS400では、アイテムを表すクエリ画像について、学習時に用いたものと同じ特徴量を抽出してヒストグラムを算出し、ヒストグラムを並べた特徴量ヒストグラムを抽出する。
ステップS402では、ステップS302で抽出された特徴量ヒストグラムと、ステップS100で構築された確率モデルにおける、ユーザが入力したユーザの属性(身長t)において各トピックから各特徴量が出現する確率とに基づいて、ユーザが入力したクエリ画像のトピック比率を算出する。
ステップS404では、画像DB222に記憶されているアイテムを表す画像から、ユーザの属性に対応するアイテムを表す画像であって、クエリ画像とは異なるパーツのアイテムを表す画像を、推薦用のアイテムを表す画像として取得し、推薦用のアイテムを表す画像の各々について、クエリ画像と同様に、ユーザの身長において各トピックから各特徴量が出現する確率を用いて、トピック比率を算出する。
ステップS406では、推薦用のアイテムを表す画像の各々のトピック比率と、ユーザが入力したクエリ画像のトピック比率との照合を行い、推薦用のアイテムを表す画像のうち類似度の高いアイテムを表す画像を推薦画像として決定する。
ステップS408では、ステップS310で推薦画像として決定したアイテムを表す画像を画像DB222から取得して出力部250に出力し、ネットワーク80を介して、クライアント端末50にコーディネート推薦結果として送信する。
以上説明したように、第2の実施の形態に係るコーディネート推薦装置によれば、学習用のコーディネート画像の各々から、ファッションのコーディネート対象となるパーツ領域を抽出し、パーツ領域の各々についての各特徴量の頻度を表すヒストグラムを並べた特徴量ヒストグラムを抽出し、学習用のコーディネート画像の各々の特徴量ヒストグラムと、学習用のコーディネート画像の各々が表す人物の身長とに基づいて、身長毎に、身長の人物が各トピックを好む確率、及び身長の人物において各トピックから各特徴量が出現する確率を含む確率モデルを構築し、クエリ画像と、構築された確率モデルとに基づいて、クエリ画像のトピック比率を算出し、算出されたトピック比率に対応するアイテムを推薦することにより、ユーザの身長に応じたコーディネートを推薦することができる。
なお、本発明は、上述した実施の形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。
50 クライアント端末
80 ネットワーク
100、200 コーディネート推薦装置
110、210 入力部
120、220 演算部
130 特徴量抽出部
132 確率モデル構築部
134、234 コーディネート推薦部
150 出力部
80 ネットワーク
100、200 コーディネート推薦装置
110、210 入力部
120、220 演算部
130 特徴量抽出部
132 確率モデル構築部
134、234 コーディネート推薦部
150 出力部
Claims (6)
- ユーザの属性にあったコーディネートを提示するコーディネート推薦装置であって、
学習用のコーディネート画像の各々から、ファッションのコーディネート対象となるパーツ領域を抽出し、パーツ領域の各々についての各特徴量の頻度を表すヒストグラムを並べた特徴量ヒストグラムを抽出する特徴量抽出部と、
前記特徴量抽出部により抽出された学習用のコーディネート画像の各々の前記特徴量ヒストグラムと、学習用のコーディネート画像の各々が表す人物の属性とに基づいて、前記属性毎に、前記属性の人物が各トピックを好む確率、及び前記属性の人物において各トピックから各特徴量が出現する確率を含む確率モデルを構築する確率モデル構築部と、
前記ユーザが入力したクエリ画像と、前記確率モデル構築部により構築された前記確率モデルとに基づいて、前記入力したクエリ画像のトピック比率を算出し、算出された前記トピック比率に対応するコーディネートを推薦するコーディネート推薦部と、
を含むコーディネート推薦装置。 - 前記コーディネート推薦部は、前記ユーザが入力したコーディネートを表すクエリ画像から、前記特徴量ヒストグラムを抽出し、前記抽出された特徴量ヒストグラムと、前記構築された前記確率モデルにおける、前記クエリ画像が表す人物の属性において各トピックから各特徴量が出現する確率とに基づいて、前記クエリ画像のトピック比率を算出し、
予め用意された複数のコーディネート画像の各々についての、前記コーディネート画像から抽出された特徴量ヒストグラムと、前記構築された前記確率モデルにおける、前記ユーザの属性において各トピックから各特徴量が出現する確率とに基づいて算出される前記コーディネート画像のトピック比率と、算出された前記入力したクエリ画像のトピック比率とに基づいて、前記入力したクエリ画像のトピック比率に対応するコーディネートを推薦する請求項1に記載のコーディネート推薦装置。 - 前記コーディネート推薦部は、前記ユーザが入力したアイテムを表すクエリ画像から、前記特徴量ヒストグラムを抽出し、前記抽出された特徴量ヒストグラムと、前記構築された前記確率モデルにおける、前記ユーザが入力した前記ユーザの属性において各トピックから各特徴量が出現する確率とに基づいて、前記クエリ画像のトピック比率を算出し、
予め用意された前記クエリ画像が表すアイテムのパーツとは異なるパーツのアイテムを表す複数の画像の各々についての、前記画像から抽出された特徴量ヒストグラムと、前記構築された前記確率モデルにおける、前記ユーザの属性において各トピックから各特徴量が出現する確率とに基づいて算出される前記画像のトピック比率と、算出された前記クエリ画像の前記トピック比率とに基づいて、前記クエリ画像のトピック比率に対応する、前記クエリ画像が表すアイテムのパーツとは異なるパーツのアイテムを推薦する請求項1に記載のコーディネート推薦装置。 - 前記確率モデル構築部は、前記特徴量抽出部により抽出された学習用のコーディネート画像の各々の前記特徴量ヒストグラムと、学習用のコーディネート画像の各々が表す人物の属性とに基づいて、前記確率モデルとして、ダイナミックトピックモデルを構築する請求項1〜請求項3のいずれか1項に記載のコーディネート推薦装置。
- 前記属性は、身長、肩幅、ウエスト幅、又は年齢の値とする請求項1〜請求項4のいずれか1項に記載のコーディネート推薦装置。
- コンピュータを、請求項1〜請求項5のいずれか1項に記載のコーディネート推薦装置の各部として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016051562A JP2017167759A (ja) | 2016-03-15 | 2016-03-15 | コーディネート推薦装置、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016051562A JP2017167759A (ja) | 2016-03-15 | 2016-03-15 | コーディネート推薦装置、及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2017167759A true JP2017167759A (ja) | 2017-09-21 |
Family
ID=59909092
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016051562A Pending JP2017167759A (ja) | 2016-03-15 | 2016-03-15 | コーディネート推薦装置、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2017167759A (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2022153196A (ja) * | 2021-03-29 | 2022-10-12 | 株式会社Zozo | 情報処理装置、情報処理方法及び情報処理プログラム |
JP2022153197A (ja) * | 2021-03-29 | 2022-10-12 | 株式会社Zozo | 情報処理装置、情報処理方法及び情報処理プログラム |
JP2022153195A (ja) * | 2021-03-29 | 2022-10-12 | 株式会社Zozo | 情報表示装置、情報表示方法及び情報表示プログラム |
JP7366201B1 (ja) | 2022-07-13 | 2023-10-20 | 株式会社Zozo | 情報処理装置、情報処理方法及び情報処理プログラム |
-
2016
- 2016-03-15 JP JP2016051562A patent/JP2017167759A/ja active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2022153196A (ja) * | 2021-03-29 | 2022-10-12 | 株式会社Zozo | 情報処理装置、情報処理方法及び情報処理プログラム |
JP2022153197A (ja) * | 2021-03-29 | 2022-10-12 | 株式会社Zozo | 情報処理装置、情報処理方法及び情報処理プログラム |
JP2022153195A (ja) * | 2021-03-29 | 2022-10-12 | 株式会社Zozo | 情報表示装置、情報表示方法及び情報表示プログラム |
JP7366201B1 (ja) | 2022-07-13 | 2023-10-20 | 株式会社Zozo | 情報処理装置、情報処理方法及び情報処理プログラム |
JP2024010826A (ja) * | 2022-07-13 | 2024-01-25 | 株式会社Zozo | 情報処理装置、情報処理方法及び情報処理プログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3493138A1 (en) | Recommendation system based on a user's physical features | |
US20180308149A1 (en) | Systems and methods to curate, suggest and maintain a wardrobe | |
CN110246011B (zh) | 可解释时尚服装个性化推荐方法 | |
US9727620B2 (en) | System and method for item and item set matching | |
US20170262959A1 (en) | Browsing interface for item counterparts having different scales and lengths | |
KR102316723B1 (ko) | 인공지능을 이용한 신체 맞춤형 코디 시스템 | |
JP2020522072A (ja) | 服飾コーディネーションの推薦方法および装置、電子デバイス、記憶媒体 | |
JP6199685B2 (ja) | ファッションコーディネート支援装置及びファッションコーディネート支援システム | |
US9460342B1 (en) | Determining body measurements | |
JP2017167759A (ja) | コーディネート推薦装置、及びプログラム | |
CN106354768B (zh) | 基于颜色的用户与商品的匹配方法及商品匹配推荐方法 | |
EP4220577A1 (en) | Prospective object search techniques based on removed objects | |
CN111028029B (zh) | 一种线下商品推荐方法、装置和电子设备 | |
KR102550214B1 (ko) | 인공지능 기반의 신체부위 및 상황별 스타일링 추천 시스템 | |
CN110084657A (zh) | 一种推荐服饰的方法和装置 | |
US20210160018A1 (en) | Automated customization with compatible objects | |
US20170262991A1 (en) | Browsing interface for item counterparts having different scales and lengths | |
CN108932260A (zh) | 服饰搭配推荐方法及装置 | |
CN108876930A (zh) | 一种个人形象管理应用方法及系统 | |
Vuruskan et al. | Intelligent fashion styling using genetic search and neural classification | |
JP6178487B1 (ja) | コーディネートシステム、コーディネート装置、及びプログラム | |
JP2014229129A (ja) | 組み合わせ提示装置及びコンピュータプログラム | |
US20160292770A1 (en) | System, method, and apparatus for remote sizing and shopping | |
US10346901B1 (en) | Computer generation of composite images | |
KR102323861B1 (ko) | 온라인 의류 판매 시스템 |