JP5775425B2 - 購買データ解析装置、方法、及びプログラム - Google Patents

購買データ解析装置、方法、及びプログラム Download PDF

Info

Publication number
JP5775425B2
JP5775425B2 JP2011252583A JP2011252583A JP5775425B2 JP 5775425 B2 JP5775425 B2 JP 5775425B2 JP 2011252583 A JP2011252583 A JP 2011252583A JP 2011252583 A JP2011252583 A JP 2011252583A JP 5775425 B2 JP5775425 B2 JP 5775425B2
Authority
JP
Japan
Prior art keywords
topic
purchase data
product
user
consideration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011252583A
Other languages
English (en)
Other versions
JP2013109470A (ja
Inventor
具治 岩田
具治 岩田
澤田 宏
宏 澤田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2011252583A priority Critical patent/JP5775425B2/ja
Publication of JP2013109470A publication Critical patent/JP2013109470A/ja
Application granted granted Critical
Publication of JP5775425B2 publication Critical patent/JP5775425B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、購買データ解析装置、方法、及びプログラムに係り、特に、購買データに基づいて、ユーザが購入する商品を選択するモデルを推定する購買データ解析装置、方法、及びプログラムに関する。
ユーザが商品を購入する際、全ての商品に関する情報を収集し、評価するわけではない。ユーザは、全商品(入手可能集合)から考慮対象となる商品(考慮集合)を絞り込み、考慮集合内の商品を評価・検討することによって、最終的な購入商品を選択する。
また、ユーザが購入する商品を選択する購買行動をモデル化した購入商品選択モデルが提案されている(非特許文献1)。
岩田具治、渡部晋治、山田武士、上田修功、「購買行動解析のためのトピック追跡モデル」、電子情報通信学会、Vol.J93-D、No.6、pp.978-987、2010(発行日:2010年6月1日).
上記非特許文献1では、入手可能集合、考慮集合、及び選択という、購買プロセスが反映されていない、という問題点がある。入手可能集合から考慮集合への絞り込みと、考慮集合からの選択とで、異なる基準が用いられる場合がある。例えば、値段を基準に考慮集合を絞り込み、デザインを基準に考慮集合から選択することがある。そのため、考慮集合からの選択をモデル化することは重要な課題である。
本発明は上記事情に鑑みてなされたものであり、考慮集合が与えられた時のユーザの購買行動に基づき、ユーザが購入する商品を選択するモデルを推定することができる購買データ解析装置、方法、及びプログラムを提供することを目的とする。
上記目的を達成するために、本発明の購買データ解析装置は、ユーザを識別するための識別情報、及び該ユーザが購入した商品の種類を示す情報を含む購買データの集合である入力された購買データ集合と、各ユーザに対する、ユーザを識別するための識別情報、及び入手可能な商品の種類の集合のうち、該ユーザの考慮対象となる商品の種類の集合である考慮集合を含む入力された考慮集合データとを読み込む読み込み手段と、前記購買データ集合及び前記考慮集合データに基づいて、前記考慮集合に含まれない商品は購入されないと仮定したときの、各ユーザが前記考慮集合から購入する商品を選択するモデルのモデルパラメータを推定する推定手段と、前記推定手段によって推定されたモデルパラメータを出力する出力手段と、を含む購買データ解析装置であって、前記推定手段は、前記購買データ集合の各購買データに、複数のトピックのいずれかのトピックを割り当てる割当手段と、前記割当手段により各購買データに割り当てられたトピックの尤もらしさを示す尤度が高くなるように、前記トピック及び前記商品の種類の各組み合わせに対する、前記トピックにおける前記考慮集合の中からの前記商品の種類の選択されやすさを表わすパラメータを推定するパラメータ推定手段と、を含み、前記割当手段による前記トピックの割り当て、及び前記パラメータ推定手段による前記パラメータの推定を、所定の終了条件を満たすまで繰り返したときの、各購買データに割り当てられたトピックの集合と、前記トピック及び前記商品の種類の各組み合わせに対する前記パラメータの集合とを、前記モデルパラメータの推定結果とする
本発明の購買データ解析装置によれば、読み込み手段によって、ユーザを識別するための識別情報、及び該ユーザが購入した商品の種類を示す情報を含む購買データの集合である入力された購買データ集合と、各ユーザに対する、ユーザを識別するための識別情報、及び入手可能な商品の種類の集合のうち、該ユーザの考慮対象となる商品の種類の集合である考慮集合を含む入力された考慮集合データとを読み込む。
そして、推定手段によって、前記購買データ集合及び前記考慮集合データに基づいて、前記考慮集合に含まれない商品は購入されないと仮定したときの、各ユーザが前記考慮集合から購入する商品を選択するモデルのモデルパラメータを推定する。出力手段によって、前記推定手段によって推定されたモデルパラメータを出力する。
このように、購買データ集合及び考慮集合データに基づいて、考慮集合に含まれない商品は購入されないと仮定したときの、各ユーザが考慮集合から購入する商品を選択するモデルのモデルパラメータを推定することにより、考慮集合が与えられた時のユーザの購買行動に基づき、ユーザが購入する商品を選択するモデルを推定することができる。
また、本発明の購買データ解析方法は、読み込み手段によって、ユーザを識別するための識別情報、及び該ユーザが購入した商品の種類を示す情報を含む購買データの集合である入力された購買データ集合と、各ユーザに対する、ユーザを識別するための識別情報、及び入手可能な商品の種類の集合のうち、該ユーザの考慮対象となる商品の種類の集合である考慮集合を含む入力された考慮集合データとを読み込むステップと、推定手段によって、前記購買データ集合及び前記考慮集合データに基づいて、前記考慮集合に含まれない商品は購入されないと仮定したときの、各ユーザが前記考慮集合から購入する商品を選択するモデルのモデルパラメータを推定するステップと、出力手段によって、前記推定手段によって推定されたモデルパラメータを出力するステップと、を含む購買データ解析方法であって、前記推定手段によって前記モデルパラメータを推定するステップは、割当手段によって、前記購買データ集合の各購買データに、複数のトピックのいずれかのトピックを割り当てるステップと、パラメータ推定手段によって、前記割当手段により各購買データに割り当てられたトピックの尤もらしさを示す尤度が高くなるように、前記トピック及び前記商品の種類の各組み合わせに対する、前記トピックにおける前記考慮集合の中からの前記商品の種類の選択されやすさを表わすパラメータを推定するステップと、を含み、前記割当手段による前記トピックの割り当て、及び前記パラメータ推定手段による前記パラメータの推定を、所定の終了条件を満たすまで繰り返したときの、各購買データに割り当てられたトピックの集合と、前記トピック及び前記商品の種類の各組み合わせに対する前記パラメータの集合とを、前記モデルパラメータの推定結果とする。
また、本発明の購買データ解析プログラムは、コンピュータを、上記の購買データ解析装置を構成する各手段として機能させるためのプログラムである。
以上説明したように、本発明の購買データ解析装置、方法、及びプログラムによれば、購買データ集合及び考慮集合データに基づいて、考慮集合に含まれない商品は購入されないと仮定したときの、各ユーザが考慮集合から購入する商品を選択するモデルのモデルパラメータを推定することにより、考慮集合が与えられた時のユーザの購買行動に基づき、ユーザが購入する商品を選択するモデルを推定することができる、という効果が得られる。
本発明の第1の実施の形態の購買データ解析装置の機能的構成を示すブロック図である。 本発明の第1の実施の形態の購買データ解析装置における購買データ解析処理ルーチンの内容を示すフローチャートである。 本発明の第1の実施の形態の購買データ解析装置におけるトピック集合及びパラメータ集合を推定する処理の流れを示すフローチャートである。 本実施の形態の購買データ解析装置と他の手法との精度比較結果を示す図である。 トピック抽出の一例を示す図である。 トピック抽出の一例を示す図である。
以下、図面を参照して本発明の実施の形態を詳細に説明する。
〔第1の実施の形態〕
<モデルの概要>
まず、表1に表記法を示す。
Figure 0005775425
入手可能な商品集合{i}i=1 Iのうち、該ユーザuの考慮対象となる商品集合である考慮集合をsu=(sum)m=1 Muとする。考慮集合として、オンラインストアにおいて見た商品の集合、ユーザの条件に合う商品の集合、などが考えられる。考慮集合suが与えられたとき、ユーザuが商品iを選択する確率を以下の(1)式で表わす。
Figure 0005775425
ここでz∈{1,...,K}はトピックであり、P(z|u)はユーザuがトピックzに属する商品に興味がある確率を表す。また、P(i|z,su)は、トピックzおよび考慮集合suが与えられた時に、商品iを選択する確率であり、例えば、以下の(2)式で表される。
Figure 0005775425
ここで、λziはトピックzにおける考慮集合からの商品iの選択されやすさを表す。上記(2)式右辺の分母は、総和が1という確率値の性質を満たすために必要な正規化項である。
上記(1)式に示されるように、購入商品は、ユーザの興味P(z|u)と、トピック毎の商品の選択されやすさP(i|z,su)とによって決定され、また、考慮集合に含まれない商品が選択される確率は0である。
ここでは、トピックモデルに基づいてモデル化を行う場合を例に説明したが、最大エントロピーモデルや類似度ベースの協調フィルタリングモデルなど、他の購買商品選択モデル基づき、考慮集合に含まれない商品の選択確率は0とし、確率値にするために正規化項を加えてモデルしてもよい。
<システム構成>
第1の実施の形態に係る購買データ解析装置100は、CPU(Central Processing Unit)と、RAM(Random Access Memory)と、後述する購買データ解析処理ルーチンを実行するためのプログラムを記憶したROM(Read Only Memory)とを備えたコンピュータで構成されている。このコンピュータは、機能的には、図1に示すように、読み込み部10、記憶部20、推定部30、及び出力部40を含んだ構成で表すことができる。
読み込み部10は、考慮集合読み込み部11と、購買集合読み込み部12とを備えている。
考慮集合読み込み部11は、入力された全ユーザの考慮集合S={su} u=1 Uを読み込む。購買集合読み込み部12は、全ユーザの購買データ集合X={xu}u=1 ,xu=(xun)n=1 Nuを読み込む。以下では、ユーザuのn番目の購買データxunを「ユーザuの購買n」ともいう。
記憶部20には、読み込まれた全ユーザの考慮集合S={su}U u=1が記憶される考慮集合記憶部21、読み込まれた全ユーザの購買データ集合X={xu} u=1が記憶される購買集合記憶部22、トピック集合Zが記憶されるトピック集合記憶部23、及びパラメータ集合Λが記憶されるパラメータ集合記憶部24が設けられている。
推定部30は、初期化部31と、トピック推定部32と、パラメータ推定部33とを備えている。
初期化部31は、購買集合読み込み部12で読み込んだ購買集合の購買データの各々に、ランダムにトピックを付与して、トピック集合Zを初期化する。トピックは、例えばユーザの興味に相当し、購買データが表わすユーザuの購買nが、トピックkの商品に興味があることを表わす。トピック集合Zは、Z={zu=1 (z={zunn=1 Nu)である。また、初期化部31は、パラメータ集合の各パラメータに、ランダムに値を設定して初期化する。パラメータ集合は、Λ={λzz=1 Z(λz={λzii=1 I)である。
また、ハイパーパラメータも適当に初期化する。例えば、ディリクレ分布のハイパーパラメータはα=1と設定し、正規分布のハイパーパラメータはβ=1と設定する.
トピック推定部32は、各ユーザu=1,...,Uの各購買n=1,...,Nuがどのトピックに帰属するかを表す帰属度を計算する。帰属度は、入力として、ユーザのトピック比率、トピック毎の商品購買確率、および考慮集合をとり、これらの値を考慮したものである必要がある。例えば、以下の(3)式により、ユーザuの購買nを表わす購買データxunがトピックkに帰属する帰属度が計算される。
Figure 0005775425
ここで、\unはユーザuのn番目の購買を除くことを表す。Nukは、ユーザuの購買データのうち、トピックkが割り当てられた購買データの数を表わす。
トピック推定部32は、計算された帰属度に基づいて、新たなトピックzunを割り当てる。例えば、上記(3)式により算出された、購買データxunの各トピックk(k=1,・・・,K)への帰属度のうち、最も高い帰属度となるトピックがトピック1であった場合には、トピック1を、購買データxunのトピックとして割り当てる。
次に、パラメータ推定部33は、データが与えられた時のパラメータの事後確率が最大になるように、パラメータ集合Λを推定する。パラメータ集合Λの推定における最大化すべき目的関数は、以下の(4)式で表される。
Figure 0005775425
ここで、第二項は正則化項であり、βはそのハイパーパラメータを表す。準ニュートン法などの最適化法を用いることにより、目的関数を最大化する大域的最適解を得ることができる。
トピック推定部32とパラメータ推定部33とを終了条件が満たされるまで繰り返すことにより、トピック集合Zおよびパラメータ集合Λを推定する。なお、トピック集合Zおよびパラメータ集合Λが、モデルパラメータの一例である。
終了条件としては、例えば、トピック集合Z=(zu) u=1 U,zu=(zun)n=1 Nu,およびパラメータ集合Λ=(λz) z=1 Zz=(λzi)i=1 Iの現在の推定値が、どのくらい入力データを尤もらしく説明できているか、すなわち、各購買データに割り当てられたトピックの尤もらしさを表す、尤度が収束することである。尤度の特性としては、(a)あるユーザの購買データに割り当てられるトピック種数が少ない場合に尤度は高くなること、及び(b)あるトピックが付与される購買データの商品が特定の商品集合である場合に尤度は高くなることを要する。なお、尤度の代わりに、事後確率など同等の性質を持つ値を用いることも可能である。
また、終了条件として、繰り返し回数、計算時間などが所定値に到達することを用いることができる。
出力部40は、トピック比率出力部41と、パラメータ出力部42とを備えている。トピック比率出力部41は、推定されたトピック集合Zを用いて、以下の(5)式に従ってユーザu及びトピックkの各組み合わせについて、トピック比率θukを計算し、計算したトピック比率集合を出力する。
Figure 0005775425
また、トピック比率出力部41は、計算したトピック比率集合を用いることにより、購買行動が似たユーザのクラスタリングを行い、クラスタリング結果を出力する。例えば、各ユーザuを、最も高いトピック比率θukを持つトピックkに割り当てることにより、ユーザのクラスタリングを行ない、ユーザのクラスタリング結果(各トピックkに割り当てられたユーザ群)を出力する。
パラメータ出力部42は、推定したパラメータ集合Λを出力する。パラメータ出力部42は、このパラメータ集合Λを用いることにより、同時に購入されやすい商品のクラスタリングを行い、クラスタリング結果を出力する。例えば、例えば、各商品iを、最も高いパラメータλkiを持つトピックkに割り当てることにより、商品のクラスタリングを行ない、商品のクラスタリング結果(各トピックkに割り当てられた商品群)を出力する。
また、パラメータ出力部42は、トピック比率集合、パラメータ集合Λ、および考慮集合Sを用いることにより、各ユーザについて、ユーザの購買行動に適した商品(推薦される商品)を求め、各ユーザの推薦商品を出力する。例えば、トピック比率θukの集合、パラメータ集合Λ、および考慮集合Sを上記(1)式に代入することにより(ここでP(z|u)=θuzとする)、各ユーザの各商品を購入する確率を推定し、各ユーザについて、この確率が高い商品を、推薦商品として求める。
<購買データ解析装置の作用>
本実施の形態の購買データ解析装置100に、各ユーザの考慮集合S及び全ユーザの購買データ集合Xが入力されると、購買データ解析装置100において、図2に示す、購買データ解析処理ルーチンが実行される。
まず、ステップS101で、読み込み部10によって、入力された考慮集合S及び購買データ集合Xを読みこみ、考慮集合記憶部21及び購買集合記憶部22に格納する。
次のステップS102では、推定部30によって、購買データ集合の各購買データに対するトピックの集合Z、及びパラメータ集合Λを推定する。
ここで、上記ステップS102は、図3に示す処理ルーチンによって実現される。
ステップS110において、初期化部31によって、購買データ集合Xの購買データxの各々に、ランダムにトピックzを付与して、トピック集合Zを初期化すると共に、パラメータ集合Λの各パラメータに対してランダムに値を付与してパラメータ集合Λを初期化する。初期化されたトピック集合Zは、トピック集合記憶部23に格納され、初期化されたパラメータ集合Λは、パラメータ集合記憶部24に格納される。また、ハイパーパラメータα、βに適当な値を設定する。
次のステップS111では、ユーザを識別する変数uを初期値である1に設定し、ステップS112では、購買を識別する変数nを初期値である1に設定する。
そして、ステップS113では、トピック推定部32によって、購買データxunについて、上記ステップS110で初期化されたトピック集合Z及びパラメータ集合Λ、又は前回推定されたトピック集合Z及びパラメータ集合Λを用いて、上記(3)式に従って、当該購買データxunの各トピックkへの帰属度を算出し、算出した帰属度に基づいて、購買データxunに新たなトピックを割り当て、トピック集合記憶部23の内容を更新する。
次のステップS114では、変数nが、N以上であるか否かを判定し、変数nが、N未満である場合には、ステップS115において、nを1インクリメントして、上記数テップS113に戻る。一方、変数nが、N以上である場合には、ユーザuの全ての購買データについてトピックを割り当てたと判断し、ステップS116へ移行する。
ステップS116では、変数uが、ユーザ数を示す定数U以上であるか否かを判定し、変数uが、U未満である場合には、ステップS117において、uを1インクリメントして、上記数テップS112に戻る。一方、変数uが、U以上である場合には、全ユーザの購買データについてトピックを割り当てたと判断し、ステップS118へ移行する。
ステップS118では、上記ステップS113で求めたトピック集合Zを用いて、上記(4)式に示す目的関数を最大化する大域的最適解を求め、解として求められたパラメータ集合Λを、パラメータ集合Λの推定結果とし、パラメータ集合記憶部24の内容を更新する。
そして、ステップS119では、繰り返しの終了条件を満たすか否かを判定する。例えば、上記ステップS113で求めたトピック集合Zに基づいて算出される尤度が収束したか否かを判定する。尤度が収束していない場合には、ステップS111へ戻って、上記ステップS111〜S118の処理を繰り返す。一方、尤度が収束したと判定された場合には、上記ステップS102の処理を終了する。トピック集合記憶部23に最終的に記憶されているトピック集合Zが、トピック集合の推定結果であり、パラメータ集合記憶部24に最終的に記憶されているパラメータ集合Λが、パラメータ集合の推定結果である。
次に、図2のステップS103で、トピック比率出力部41によって、上記ステップS102で推定されたトピック集合Zを用いて、上記(5)式に従って、トピック比率集合を計算して出力する。また、トピック比率出力部41は、計算したトピック比率集合を用いて、ユーザをクラスタリングして、ユーザのクラスタリング結果を出力する。
そして、ステップS104で、パラメータ出力部42によって、上記ステップS102で推定されたパラメータ集合Λを出力する。また、パラメータ出力部42は、パラメータ集合Λを用いて、商品をクラスタリングして、商品のクラスタリング結果を出力する。パラメータ出力部42は、パラメータ集合Λを用いて、各ユーザについて各商品の購入確率を算出して、推薦商品を決定し、各ユーザの推薦商品を出力して、処理を終了する。
以上説明したように、第1の実施の形態に係る購買データ解析装置によれば、購買データ集合及び各ユーザの考慮集合に基づいて、考慮集合に含まれない商品は購入されない仮定の下での、各ユーザが考慮集合から購入する商品を選択するモデルのモデルパラメータを推定することにより、考慮集合が与えられた時のユーザの購買行動に基づき、ユーザが購入する商品を選択するモデルを推定することができる。
また、考慮集合を用いない従来技術より精緻なモデルを推定することができ、予測精度を向上させることが可能となる。
また、購買データを解析することによって、同時に購入されやすい商品のクラスタリング、似た購買行動を持つユーザのクラスタリング、及びユーザの購買行動に適した商品を推薦することが可能となる。
〔第2の実施の形態〕
次に、第2の実施の形態について説明する。なお、第1の実施の形態と同様の構成となる部分については、同一符号を付して説明を省略する。
第2の実施の形態では、考慮集合のデータとして、ユーザにおいて各商品が考慮集合に含まれる確率が入力される点が、第1の実施の形態と異なっている。
第2の実施の形態に係る購買データ解析装置の考慮集合読み込み部11は、考慮集合S の代わりに入力された、各ユーザuにおいて各商品が考慮集合に含まれる確率の集合qu={quii=1 Iを読み込み、考慮集合記憶部21に格納する。
ここで、ユーザuにおける各商品が考慮集合に含まれる確率の集合qu={quii=1 Iが与えられたとき、ユーザuが商品iを選択する確率は、上記(1)式の代わりに、以下の(6)式で表される。
Figure 0005775425
ここでquiは商品iがユーザuの考慮集合に含まれる確率を表す。確率集合qはデータから推定したものでもよい。
パラメータ出力部42では、トピック比率集合、パラメータ集合Λ、および各ユーザuにおいて各商品が考慮集合に含まれる確率の集合quを、上記(6)式に代入することにより(ここでP(z|u)=θuzとする)、各ユーザの各商品を購入する確率を推定し、各ユーザについて、この確率が高い商品を、推薦商品として求める。
なお、第2の実施の形態に係る購買データ解析装置の他の構成及び作用については、第1の実施の形態と同様であるため、説明を省略する。
<実施例>
本発明を評価するため、オンラインストアにおける購買データを用いた実験を行った。2010年11月19日から2011年2月28日まで、3月31日まで、5月9日までの3つの購買履歴データを用いて提案法の有効性を確認した。各購買履歴データのユーザ数、ブランド数、総購買数、及び総考慮数(ページビュー)を、以下の表2に示す。なお二回以上の購買がないユーザは省いた。また、オンラインストアにおいてユーザが見た商品を考慮集合と考えた。ブランドを、購買データが表わす商品の種類とした。
Figure 0005775425
10%のユーザについて、ランダムに選んだ1つの購買をテストデータとし、それ以外の購買を学習データとし、学習データを用いて、テストデータに含まれる購買のブランドを予測した。そのときの正答率(accuracy)を、評価指標とした。図4(A)〜(C)に結果を示す。比較手法として、考慮集合を用いない通常のトピックモデル(LDA:Latent Dirichlet Allocation)を用いた。なおLDAにおいては、考慮集合の内で最も購入確率の高い商品を予測商品とした。本発明(proposed)は全データセットにおいて正答率が高く、考慮集合を組み込むことにより、より正確に購買ブランド(購買商品)を予測できることが分かった。
また、ファッションおよび化粧品で商品を分けて実験した場合のトピック抽出結果を図5、図6に示す。なお、トピック抽出結果として、トピック毎に、当該トピックが割り当てられた購買データの商品の集合のなかで、出現確率が高い商品の集合を示している。図5では、ファッションに分けられた商品について実験した結果を示し、図6では、化粧品に分けられた商品について実験した結果を示す。以上より、関連する商品に、同じトピックが割り当てられていることが分かった。
また、本発明は、上記実施の形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。
上記の実施の形態では、トピックのギブスサンプリングとパラメータに関する完全尤度最大化を交互に繰り返すことにより、トピック集合及びパラメータ集合を推定する方法について説明したが、これに限定されるものではない。例えば、マルコフ連鎖モンテカルロ法や変分ベイズ法、事後確率最大化法などを用いて、トピック集合及びパラメータ集合を推定することも可能である.
また、上述の購買データ解析装置は、内部にコンピュータシステムを有しているが、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、本願明細書中において、プログラムが予めインストールされている実施形態として説明したが、当該プログラムを、コンピュータ読み取り可能な記録媒体に格納して提供することも可能である。
10 読み込み部
20 記憶部
30 推定部
31 初期化部
32 トピック推定部
33 パラメータ推定部
40 出力部
41 トピック比率出力部
42 パラメータ出力部
100 購買データ解析装置

Claims (7)

  1. ユーザを識別するための識別情報、及び該ユーザが購入した商品の種類を示す情報を含む購買データの集合である入力された購買データ集合と、各ユーザに対する、ユーザを識別するための識別情報、及び入手可能な商品の種類の集合のうち、該ユーザの考慮対象となる商品の種類の集合である考慮集合を含む入力された考慮集合データとを読み込む読み込み手段と、
    前記購買データ集合及び前記考慮集合データに基づいて、前記考慮集合に含まれない商品は購入されないと仮定したときの、各ユーザが前記考慮集合から購入する商品を選択するモデルのモデルパラメータを推定する推定手段と、
    前記推定手段によって推定されたモデルパラメータを出力する出力手段と、
    を含む購買データ解析装置であって、
    前記推定手段は、
    前記購買データ集合の各購買データに、複数のトピックのいずれかのトピックを割り当てる割当手段と、
    前記割当手段により各購買データに割り当てられたトピックの尤もらしさを示す尤度が高くなるように、前記トピック及び前記商品の種類の各組み合わせに対する、前記トピックにおける前記考慮集合の中からの前記商品の種類の選択されやすさを表わすパラメータを推定するパラメータ推定手段と、を含み、
    前記割当手段による前記トピックの割り当て、及び前記パラメータ推定手段による前記パラメータの推定を、所定の終了条件を満たすまで繰り返したときの、各購買データに割り当てられたトピックの集合と、前記トピック及び前記商品の種類の各組み合わせに対する前記パラメータの集合とを、前記モデルパラメータの推定結果とする購買データ解析装置。
  2. 前記出力手段は、前記推定手段によって推定された前記モデルパラメータを用いて、購買行動が類似するユーザ群を求めるユーザのクラスタリング、及び同時に購入され易い商品群を求める商品のクラスタリングの少なくとも一方を行い、前記クラスタリングの結果を出力する請求項1記載の購買データ解析装置。
  3. 前記割当手段は、各購買データに割り当てられたトピックの集合と、前記トピック及び前記商品の種類の各組み合わせに対する前記パラメータの集合と、各ユーザの前記考慮集合を用いて、前記購買データが各トピックに帰属する確率を示す帰属度を算出し、該帰属度に基づいて、前記購買データに前記トピックを割り当てる請求項1又は2記載の購買データ解析装置。
  4. 読み込み手段によって、ユーザを識別するための識別情報、及び該ユーザが購入した商品の種類を示す情報を含む購買データの集合である入力された購買データ集合と、各ユーザに対する、ユーザを識別するための識別情報、及び入手可能な商品の種類の集合のうち、該ユーザの考慮対象となる商品の種類の集合である考慮集合を含む入力された考慮集合データとを読み込むステップと、
    推定手段によって、前記購買データ集合及び前記考慮集合データに基づいて、前記考慮集合に含まれない商品は購入されないと仮定したときの、各ユーザが前記考慮集合から購入する商品を選択するモデルのモデルパラメータを推定するステップと、
    出力手段によって、前記推定手段によって推定されたモデルパラメータを出力するステップと、
    を含む購買データ解析方法であって、
    前記推定手段によって前記モデルパラメータを推定するステップは、
    割当手段によって、前記購買データ集合の各購買データに、複数のトピックのいずれかのトピックを割り当てるステップと、
    パラメータ推定手段によって、前記割当手段により各購買データに割り当てられたトピックの尤もらしさを示す尤度が高くなるように、前記トピック及び前記商品の種類の各組み合わせに対する、前記トピックにおける前記考慮集合の中からの前記商品の種類の選択されやすさを表わすパラメータを推定するステップと、を含み、
    前記割当手段による前記トピックの割り当て、及び前記パラメータ推定手段による前記パラメータの推定を、所定の終了条件を満たすまで繰り返したときの、各購買データに割り当てられたトピックの集合と、前記トピック及び前記商品の種類の各組み合わせに対する前記パラメータの集合とを、前記モデルパラメータの推定結果とする購買データ解析方法。
  5. 前記出力手段によって出力するステップは、前記推定手段によって推定された前記モデルパラメータを用いて、購買行動が類似するユーザ群を求めるユーザのクラスタリング、及び同時に購入され易い商品群を求める商品のクラスタリングの少なくとも一方を行い、前記クラスタリングの結果を出力する請求項記載の購買データ解析方法。
  6. 前記割当手段によって割り当てるステップは、各購買データに割り当てられたトピックの集合と、前記トピック及び前記商品の種類の各組み合わせに対する前記パラメータの集合と、各ユーザの前記考慮集合とを用いて、前記購買データが各トピックに帰属する確率を示す帰属度を算出し、該帰属度に基づいて、前記購買データに前記トピックを割り当てる請求項4又は5記載の購買データ解析方法。
  7. コンピュータを、請求項1〜請求項のいずれか1項記載の購買データ解析装置を構成する各手段として機能させるための購買データ解析プログラム。
JP2011252583A 2011-11-18 2011-11-18 購買データ解析装置、方法、及びプログラム Active JP5775425B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011252583A JP5775425B2 (ja) 2011-11-18 2011-11-18 購買データ解析装置、方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011252583A JP5775425B2 (ja) 2011-11-18 2011-11-18 購買データ解析装置、方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2013109470A JP2013109470A (ja) 2013-06-06
JP5775425B2 true JP5775425B2 (ja) 2015-09-09

Family

ID=48706180

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011252583A Active JP5775425B2 (ja) 2011-11-18 2011-11-18 購買データ解析装置、方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP5775425B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107679946A (zh) * 2017-09-28 2018-02-09 平安科技(深圳)有限公司 基金产品推荐方法、装置、终端设备及存储介质

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5984150B2 (ja) 2014-08-21 2016-09-06 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 情報処理装置、情報処理方法、及びプログラム
JP6443858B2 (ja) 2014-11-20 2018-12-26 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 算出装置、算出方法、学習装置、学習方法、及びプログラム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006221329A (ja) * 2005-02-09 2006-08-24 Toshiba Corp 行動予測装置、行動予測方法および行動予測プログラム
JP2007280047A (ja) * 2006-04-06 2007-10-25 Fuji Xerox Co Ltd 商品情報提供の評価方法
JP2008282132A (ja) * 2007-05-09 2008-11-20 Promise Co Ltd Ecサイト管理装置及びコンピュータプログラム
JP4839358B2 (ja) * 2008-09-04 2011-12-21 日本電信電話株式会社 購入予測方法、購入予測装置、購入予測プログラム、および、記録媒体

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107679946A (zh) * 2017-09-28 2018-02-09 平安科技(深圳)有限公司 基金产品推荐方法、装置、终端设备及存储介质
CN107679946B (zh) * 2017-09-28 2021-09-10 平安科技(深圳)有限公司 基金产品推荐方法、装置、终端设备及存储介质

Also Published As

Publication number Publication date
JP2013109470A (ja) 2013-06-06

Similar Documents

Publication Publication Date Title
Jacobs et al. Model-based purchase predictions for large assortments
Jacobs et al. Product Recommendations Based on Latent Purchase Motivations
Sarstedt et al. Treating unobserved heterogeneity in PLS-SEM: A multi-method approach
Malsiner-Walli et al. Model-based clustering based on sparse finite Gaussian mixtures
Xiong et al. Temporal collaborative filtering with bayesian probabilistic tensor factorization
Gagliolo et al. Learning dynamic algorithm portfolios
Lemmens et al. Dynamics in the international market segmentation of new product growth
JP6414363B2 (ja) 予測システム、方法およびプログラム
KR101329904B1 (ko) 다변량 데이터의 혼합 모델 추정 장치, 혼합 모델 추정 방법 및 혼합 모델 추정 프로그램을 기록한 컴퓨터 판독가능 기록 매체
Zhang et al. Prediction uncertainty in collaborative filtering: Enhancing personalized online product ranking
CN108665311B (zh) 一种基于深度神经网络的电商用户时变特征相似性计算推荐方法
Maldonado et al. Advanced conjoint analysis using feature selection via support vector machines
JP6311851B2 (ja) 共クラスタリングシステム、方法およびプログラム
Zhu et al. Portfolio management with robustness in both prediction and decision: A mixture model based learning approach
Chen et al. Single-cell transcriptome data clustering via multinomial modeling and adaptive fuzzy k-means algorithm
Burtini et al. Improving online marketing experiments with drifting multi-armed bandits
Liu et al. Diverse personalized recommendations with uncertainty from implicit preference data with the Bayesian Mallows model
Bezáková et al. Graph model selection using maximum likelihood
JP5775425B2 (ja) 購買データ解析装置、方法、及びプログラム
CN111861605A (zh) 业务对象推荐方法
Maldonado et al. Embedded heterogeneous feature selection for conjoint analysis: A SVM approach using L1 penalty
CN111209469A (zh) 一种个性化推荐方法、装置、计算机设备及存储介质
Nevo et al. Identifying a Minimal Class of Models for High--dimensional Data
JP5530394B2 (ja) 購買データ解析装置、方法、及びプログラム
Linero et al. Multi-rubric models for ordinal spatial data with application to online ratings data

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140220

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20141007

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20141021

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141222

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150609

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150703

R150 Certificate of patent or registration of utility model

Ref document number: 5775425

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150