JP2012221469A - 購買データ解析装置、方法、及びプログラム - Google Patents

購買データ解析装置、方法、及びプログラム Download PDF

Info

Publication number
JP2012221469A
JP2012221469A JP2011090140A JP2011090140A JP2012221469A JP 2012221469 A JP2012221469 A JP 2012221469A JP 2011090140 A JP2011090140 A JP 2011090140A JP 2011090140 A JP2011090140 A JP 2011090140A JP 2012221469 A JP2012221469 A JP 2012221469A
Authority
JP
Japan
Prior art keywords
topic
likelihood
purchase data
assigned
indicating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011090140A
Other languages
English (en)
Other versions
JP5530394B2 (ja
Inventor
Tomoharu Iwata
具治 岩田
Hiroshi Sawada
宏 澤田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2011090140A priority Critical patent/JP5530394B2/ja
Publication of JP2012221469A publication Critical patent/JP2012221469A/ja
Application granted granted Critical
Publication of JP5530394B2 publication Critical patent/JP5530394B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】同時に購入され易い商品に関する推定を適切に行う。
【解決手段】トピック割当部33で、初期化部32でトピックが付与された購買データ、及びハイパーパラメータの初期値を用いて、ハイパーパラメータを更新し、各購買データの各クラスに対する帰属度を算出し、算出した帰属度に基づいて、各購買データに新たなトピックを割り当て、尤度算出部34で、購買データに割り当てられたトピックの尤もらしさを示す尤度を算出する。判定部35で、尤度が収束していないと判定された場合には、再度トピックの割り当て及び尤度の算出を行い、尤度が収束するまで繰り返す。尤度が収束したと判定された際のトピック集合Z及びハイパーパラメータ集合φを用いて、同時に購入され易い商品のクラスタリング、各クラスでの各商品の価格帯、ユーザの特徴を推定するためのモデルの特徴パラメータを推定する。
【選択図】図1

Description

本発明は、購買データ解析装置、方法、及びプログラムに係り、特に、同時に購入され易い商品のクラスタリング、各クラスでの各商品の価格帯、ユーザの特徴を解析する購買データ解析装置、方法、及びプログラムに関する。
従来、どのユーザがどの商品を購入したかを示す購買データを解析することにより、商品の自動推薦や流行を解析することが行われている。例えば、購買データを購買順序に着目した協調フィルタリング手法により解析し、ユーザが興味を持つと思われる商品を推薦する手法が提案されている(例えば、非特許文献1参照)。
また、購買データを時間変化も考慮したトピックモデル推定により解析し、ユーザの興味や流行を解析する手法が提案されている(例えば、非特許文献2参照)。
岩田具治、山田武士、上田修功、「購買順序を効率的に用いた協調フィルタリング」、情報処理学会論文誌、数理モデル化と応用、Vol.49、No.SIG4 (TOM20)、125-134、2008. 岩田具治、渡部晋治、山田武士、上田修功、「購買行動解析のためのトピック追跡モデル」、電子情報通信学会、Vol.J93-D、No.6、pp.978-987、2010(発行日:2010年6月1日).
上記非特許文献1及び2の手法で用いられる購買データには、価格情報が含まれていないが、同時に購入され易い商品は、対象商品の価格によって異なることが想定される。例えば、高級ワインはハムやチーズと同時に購入され易いが、安いワインは料理用として用いられるため野菜と同時に購入され易い、といった傾向がある。また、ユーザは価格によって商品を購入するか否かを決めることもあるため、商品を推薦する際、価格情報を考慮することは重要である。従って、非特許文献1及び2の手法では、購買データに価格情報を利用していないため、同時に購入され易い商品に関する推定を適切に行うことができない、という問題点がある。
本発明は上記問題点に鑑みてなされたものであり、同時に購入され易い商品に関する推定を適切に行うことができる購買データ解析装置、方法、及びプログラムを提供することを目的とする。
上記目的を達成するために、本発明の購買データ解析装置は、ユーザを識別するための識別情報、該ユーザが購入した商品の種類を示す情報、及び該商品の価格を示す情報を含む購買データに、複数のクラスのいずれかのクラスを示すトピックを割り当てる割当手段と、前記割当手段によりトピックが割り当てられた購買データ、及びハイパーパラメータを用いた確率分布で表され、かつ前記割当手段により購買データに割り当てられたトピックの尤もらしさを示す尤度を算出する尤度算出手段と、前記尤度算出手段により算出された尤度が高くなるように、前記ハイパーパラメータの更新、前記トピックの割り当て、及び前記尤度の算出を、前記尤度が収束するまで繰り返すように前記割当手段及び前記尤度算出手段を制御する制御手段と、前記尤度が収束したときの前記トピックが割り当てられた購買データ、及び前記ハイパーパラメータに基づいて、同時に購入され易い商品群、前記トピックに関連した前記ユーザの特徴を示す第1特徴パラメータ、前記トピックが示すクラスに含まれる商品の分布を示す第2特徴パラメータ、及び前記トピックが示すクラスに含まれる商品の価格の特徴を示す第3特徴パラメータの少なくとも1つを推定する推定手段と、を含んで構成されている。
本発明の購買データ解析装置によれば、割当手段が、ユーザを識別するための識別情報、ユーザが購入した商品の種類を示す情報、及びその商品の価格を示す情報を含む購買データに、複数のクラスのいずれかのクラスを示すトピックを割り当て、尤度算出手段が、割当手段によりトピックが割り当てられた購買データ、及びハイパーパラメータを用いた確率分布で表され、かつ割当手段により購買データに割り当てられたトピックの尤もらしさを示す尤度を算出する。そして、制御手段が、尤度算出手段により算出された尤度が高くなるように、ハイパーパラメータの更新、トピックの割り当て、及び尤度の算出を、尤度が収束するまで繰り返すように割当手段及び尤度算出手段を制御する。推定手段は、尤度が収束したときのトピックが割り当てられた購買データ、及びハイパーパラメータに基づいて、同時に購入され易い商品群、トピックに関連したユーザの特徴を示す第1特徴パラメータ、トピックが示すクラスに含まれる商品の分布を示す第2特徴パラメータ、及びトピックが示すクラスに含まれる商品の価格の特徴を示す第3特徴パラメータの少なくとも1つを推定する。
このように、商品の価格を示す情報を含む購買データを用いて、各購買データにクラスを示すトピックを割り当て、購買データに割り当てられたトピックの尤もらしさを示す尤度が高くなるようにトピックの割り当てを繰り返すことにより、同時に購入され易い商品に関する推定を適切に行うことができる。
また、前記割当手段は、前記ユーザ毎に割り当てられた前記トピックの比率、前記トピックが示すクラスに含まれる商品の比率、及び前記トピックが示すクラスにおける商品の価格帯を用いて、前記購買データが各クラスに帰属する確率を示す帰属度を算出し、該帰属度に基づいて、前記購買データに前記トピックを割り当てることができる。
また、前記尤度算出手段は、前記ユーザに割り当てられたトピックの数が少ないほど高く、前記トピックが示すクラスに含まれる商品の分布が特定の商品集合であることを示すほど高く、及び前記トピックが示すクラスに含まれる商品の価格帯が近似しているほど高くなる尤度を算出することができる。
また、本発明の購買データ解析方法は、割当手段と、尤度算出手段と、制御手段と、推定手段とを含む購買データ解析装置における購買データ解析方法であって、前記割当手段は、ユーザを識別するための識別情報、該ユーザが購入した商品の種類を示す情報、及び該商品の価格を示す情報を含む購買データに、複数のクラスのいずれかのクラスを示すトピックを割り当て、前記尤度算出手段は、前記割当手段によりトピックが割り当てられた購買データ、及びハイパーパラメータを用いた確率分布で表され、かつ前記割当手段により購買データに割り当てられたトピックの尤もらしさを示す尤度を算出し、前記制御手段は、前記尤度算出手段により算出された尤度が高くなるように、前記ハイパーパラメータの更新、前記トピックの割り当て、及び前記尤度の算出を、前記尤度が収束するまで繰り返すように前記割当手段及び前記尤度算出手段を制御し、前記推定手段は、前記尤度が収束したときの前記トピックが割り当てられた購買データ、及び前記ハイパーパラメータに基づいて、同時に購入され易い商品群、前記トピックに関連した前記ユーザの特徴を示す第1特徴パラメータ、前記トピックが示すクラスに含まれる商品の分布を示す第2特徴パラメータ、及び前記トピックが示すクラスに含まれる商品の価格の特徴を示す第3特徴パラメータの少なくとも1つを推定する方法である。
また、本発明の購買データ解析プログラムは、コンピュータを、上記の購買データ解析装置を構成する各手段として機能させるためのプログラムである。
以上説明したように、本発明の購買データ解析装置、方法、及びプログラムによれば、商品の価格を示す情報を含む購買データを用いて、各購買データにクラスを示すトピックを割り当て、購買データに割り当てられたトピックの尤もらしさを示す尤度が高くなるようにトピックの割り当てを繰り返すことにより、同時に購入され易い商品に関する推定を適切に行うことができる、という効果が得られる。
本実施の形態の購買データ解析装置の機能的構成を示すブロック図である。 本実施の形態の購買データ解析装置における購買データ解析処理ルーチンの内容を示すフローチャートである。 本実施の形態の購買データ解析装置と他の手法との精度比較結果を示す図である。 トピック抽出の一例を示す図である。
以下、図面を参照して本発明の実施の形態を詳細に説明する。
本実施の形態に係る購買データ解析装置10は、CPU(Central Processing Unit)と、RAM(Random Access Memory)と、後述する購買データ解析処理ルーチンを実行するためのプログラムを記憶したROM(Read Only Memory)とを備えたコンピュータで構成されている。このコンピュータは、機能的には、図1に示すように、記憶部20、トピック推定部30、及びパラメータ推定部40を含んだ構成で表すことができる。
記憶部20には、価格付き購買データ集合(X,V)が記憶される価格付き購買データ記憶部21、トピック集合Zが記憶されるトピック記憶部22、ハイパーパラメータ集合φが記憶されるハイパーパラメータ記憶部23、及び特徴パラメータ集合Λが記憶される特徴パラメータ記憶部24が設けられている。
トピック推定部30は、更に、入力データ読込部31、初期化部32、トピック割当部33、尤度算出部34、判定部35、及びトピック集合書込部36を含んだ構成で表すことができる。トピック推定部30は、マルコフ連鎖モンテカルロ法に基づいてトピック推定を行う。
入力データ読込部31は、価格付き購買データ記憶部21に記憶された価格付き購買データ集合(X,V)を読み込む。価格付き購買データ集合(X,V)は、ユーザ数Uのユーザ毎の購買データの集合であり、ユーザuの購買データは、ユーザuが購入した商品の種類を示す情報の集合とその商品の価格を示す情報の集合との組(x、v)から成る。ここで、x={xunn=1 Nuはユーザuに購入された商品集合、v={vunn=1 Nuはそれらの価格の集合を表す。すなわち、全ユーザの購買商品集合XはX={xu=1 、全ユーザの購買商品の価格集合VはV={vu=1 である。このように、本実施の形態で用いられる購買データには、価格情報が含まれている。下記表1に表記法を示す。
Figure 2012221469
従って、ユーザu、ユーザuのn番目の購買商品xun、及びユーザuのn番目の購買商品の価格vunで1つの購買データ(u,xun,vun)が構成される。以下では、ユーザuのn番目の購買データに含まれる(xun,vun)を「ユーザuの購買n」ともいう。
初期化部32は、入力データ読込部31で読み込んだ購買データの各々に、ランダムにトピックを付与して、トピック集合Zを初期化する。トピックは、購買データを同時に購入され易い商品群のクラスにクラスタリングした際の各クラスに付与されるラベルである。トピック集合Zは、Z={zu=1 (z={zunn=1 Nu)である。また、初期化部32は、後述する尤度を表す確率モデルのハイパーパラメータ集合に適当な値を設定して初期化する。
トピック割当部33は、購買データが各クラスに帰属する確率で表される帰属度(詳細は後述)を算出し、各購買データがどのクラスに帰属するかに基づいて、各購買データに帰属するクラスを示すトピックを割り当てる。トピックの割り当ては、尤度算出部34で算出される尤度が高くなるように割り当てられる。
ここで、尤度算出部34で算出される尤度について説明する。尤度は、トピック集合Zの現在の推定値がどのくらい入力データを尤もらしく説明できているかを表す指標、すなわち各購買データに割り当てられたトピックの尤もらしさを表す指標である。尤度の特性としては、(a)あるユーザの購買データに割り当てられるトピック種数が少ない場合に高くなる、(b)あるトピックが付与される商品が特定の商品集合である場合に高くなる、及び(c)その商品の価格帯が似ている場合に高くなることを要する。例えば、下記(1)式を尤度として用いることができる。
Figure 2012221469
ここで、P(・)は確率分布を表し、α、β、a={ai=1 、b={bi=1 、η={ηi=1 、γ={γi=1 はハイパーパラメータを表す。なお、ハイパーパラメータ集合をφ={α,β,a,b,η,γ}とする。
(1)式の右辺第1項は、上記の尤度の特性(a)を表すものであり、ユーザ毎のトピック生成分布として多項分布、その事前分布としてハイパーパラメータαを持つディリクレ分布を用いた場合、下記(2)式で表すことができる。
Figure 2012221469
ここで、Γ(・)はガンマ関数、Nkuはユーザuにトピックkが割り当てられた数を表す。
また、(1)式の右辺第2項は、上記の尤度の特性(b)を表すものであり、トピック毎の商品生成分布として多項分布、その事前分布としてハイパーパラメータβを持つディリクレ分布を用いた場合、下記(3)式で表すことができる。
Figure 2012221469
ここで、Nkiは商品iがトピックkに割り当てられた数を表し、N=Σkiである。
また、(1)式の右辺第3項は、上記の尤度の特性(c)を表すものであり、トピック毎の価格生成分布を正規分布、その事前分布としてハイパーパラメータη、γ、a、bを持つ正規ガンマ分布を用いた場合、下記(4)式で表すことができる。
Figure 2012221469
ここで、Vkiはトピックkが割り当てられた商品iの価格の集合を表し、下記(5)式となる。
Figure 2012221469
ここで、ηki及びγkiはトピックkでの商品iの価格の平均μkiの事後確率のハイパーパラメータを表し、aki及びbkiはトピックkでの商品iの価格の精度(分散の逆数)λkiの事後確率のハイパーパラメータを表し、下記(6)〜(9)式で計算できる。
Figure 2012221469
従って、トピック割当部33では、上記(1)式で示す尤度が高くなるように、各購買データにトピックを割り当てる。具体的には、初期化部32によりトピックが付与された購買データ、または1つ前の処理でトピック割当部33によりトピックが割り当てられた各購買データを用いて、各購買データがどのクラスに帰属するかを表す帰属度を計算する。帰属度は、各購買データが各クラスに帰属する確率、すなわち各購買データにあるトピックが割り当てられる確率である。帰属度は、入力として、(i)あるユーザの購買データにどのトピックがどれくらいの比率で割り当てられているかを示すユーザのトピック比率、(ii)あるトピックが示すクラスにどの商品がどれくらいの比率で含まれているかを示す商品購買確率、及び(iii)あるトピックが示すクラスに含まれるある商品の価格帯を考慮した値である必要がある。これらを考慮することにより、同じトピックが割り当てられた商品は、同時に購入され易いことを示すことになる。帰属度は、例えば、下記(10)式により計算することができる。
Figure 2012221469
ここで、jは1つの購買データを示し、j=(u,n)である。また、\jは購買データjを除いたときのカウントまたはハイパーパラメータを表し、/jは購買データjをトピックkに加えたときのハイパーパラメータを表す。なお、(10)式の右辺第1項は、上記の帰属殿入力として考慮する値(i)を、第2項は(ii)、第3〜5項は(iii)を表すものである。従って、トピック割当部33では、上記(6)式〜(9)式に従って、各ユーザu=1,・・・,U、各購買n=1,・・・,N、各トピックk=1,・・・,K毎に、各購買データを除いた場合または加えた場合について、ハイパーパラメータの値を更新し、更新したハイパーパラメータを上記(10)式に適用して帰属度を算出する。
また、トピック割当部33は、算出された帰属度に基づいて、各購買データに新たなトピックzを割り当てる。例えば、(10)式により算出された、購買データjの各トピックk(k=1,・・・,K)への帰属度のうち、尤も高い帰属度となるトピックがトピック1であった場合には、トピック1を購買データjのトピックzとして割り当てる。
判定部35は、尤度算出部34で算出された尤度が収束したか否かを判定する。収束判定は、例えば、1つ前の実行時に算出された尤度と更新後の尤度とを比較して、誤差が所定の閾値以下となったときに収束したと判定してもよいし、繰り返し回数が所定の回数に到達したときに収束したと判定してもよい。尤度が収束していない場合には、1つ前の処理でトピックが割り当てられた購買データをトピック割当部33へ戻して、ハイパーパラメータを更新し、再度トピックの割り当てを実行するように、トピック割当部33を制御する。また、新たにトピックが割り当てられた購買データを用いて再度尤度を算出するように、尤度算出部34を制御する。このハイパーパラメータの更新、トピック割り当て、及び尤度の算出を尤度が収束するまで繰り返す。
なお、判定部35が、本発明の制御手段の一例である。
トピック集合書込部36は、判定部35において尤度が収束したと判定された際のトピック集合Zをトピック記憶部22に格納すると共に、尤度が収束したと判定された際のハイパーパラメータ集合φをハイパーパラメータ記憶部23に格納する。
パラメータ推定部40は、更に、トピック集合読込部41、推定部42、及び特徴パラメータ書込部43を含んだ構成で表すことができる。
トピック集合読込部41は、価格付き購買データ記憶部21に記憶された購買データ集合(X,V)、トピック記憶部22に記憶されたトピック集合Z、及びハイパーパラメータ記憶部23に記憶されたハイパーパラメータ集合φを読み込む。
推定部42は、トピック集合読込部41により読み込まれたデータを用いて、同時に購入され易い商品のクラスタリング、各クラスでの各商品の価格帯、ユーザの特徴を推定するためのモデルの特徴パラメータを推定する。特徴パラメータは、下記(11)式により推定することができる。
Figure 2012221469
{^θukk=1 はユーザuの特徴を表し、{^φki,^μki,^λkii=1 はトピックkで購入される商品の分布、その商品の平均価格、及び価格のばらつきのなさ(価格の分散の逆数)を表す。μとλをあわせると、商品の価格帯が推定できる。なお、^は推定値を意味する。
特徴パラメータ書込部43は、推定部42により推定した特徴パラメータの集合Λ={{{^θukk=1 u=1 、{{^φki、^μki、^λkii=1 k=1 }を特徴パラメータ記憶部24に格納する。
次に、図2を参照して、本実施の形態の購買データ解析装置10において実行される購買データ解析処理ルーチンについて説明する。
ステップ100で、価格付き購買データ記憶部21に記憶された価格付き購買データ集合(X,V)を読み込む。
次に、ステップ102で、上記ステップ100で読み込んだ購買データの各々に、ランダムにトピックを付与して、トピック集合Zを初期化する。また、ハイパーパラメータ集合φに適当な値を設定して初期化する。例えば、ディリクレ分布のハイパーパラメータはα=1、β=1と設定し、正規ガンマ分布のハイパーパラメータはη= ̄μ、γ=1、a=1、b=1+ ̄σ と設定することができる。ここで、 ̄μ、 ̄σ はそれぞれ商品iの経験的期待価格及びその分散を表す。
次に、ステップ104で、上記ステップ102でトピックが付与された購買データ、及びハイパーパラメータの初期値を用いて、上記(6)式〜(9)式によりハイパーパラメータを更新し、(10)式に従って、各購買データの各クラスに対する帰属度を算出し、算出した帰属度に基づいて、各購買データに新たなトピックを割り当てる。
次に、ステップ106で、上記ステップ104でトピックが割り当てられた購買データ、及び上記ステップ104で更新されたハイパーパラメータを用いて、(1)式により尤度を算出する。
次に、ステップ108で、上記ステップ106で算出した尤度が収束したか否かを判定する。尤度が収束していない場合には、ステップ104へ戻って、1つ前のステップ104における処理でトピックが割り当てられた購買データを用いてハイパーパラメータを更新して、再度トピックの割り当てを実行し、次に、ステップ106で、新たにトピックが割り当てられた購買データを用いて再度尤度を算出する。
上記ステップ108で、尤度が収束したと判定された場合には、ステップ110へ移行して、上記ステップ108で尤度が収束したと判定された際の(現在の)トピック集合Zをトピック記憶部22に格納すると共に、ハイパーパラメータ集合φをハイパーパラメータ記憶部23に格納する。
次に、ステップ112で、価格付き購買データ記憶部21に記憶された購買データ集合(X,V)、及び上記ステップ110でトピック記憶部22に記憶されたトピック集合Z、及びハイパーパラメータ記憶部23に記憶されたハイパーパラメータ集合φを読み込む。
次に、ステップ114で、上記ステップ112で読み込まれたデータを用いて、同時に購入され易い商品のクラスタリング、各クラスでの各商品の価格帯、ユーザの特徴を推定するためのモデルの特徴パラメータを、(11)式を用いて推定する。
次に、ステップ116で、上記ステップ112で推定した特徴パラメータ集合Λを特徴パラメータ記憶部24に格納して、処理を終了する。
なお、上記では、ハイパーパラメータは適当な値で初期化しているものとするが、(1)式で算出される尤度を最大化することで更新してもよい。
以上説明したように、本実施の形態の購買データ解析装置によれば、価格情報を含む購買データを用いて、各購買データがいずれのクラスに帰属するかを示す帰属度を算出し、この帰属度に基づいた各購買データにクラスを示すトピックを割り当て、購買データに割り当てられたトピックの尤もらしさを示す尤度が高くなるようにトピックの割当を更新していくことにより、同時に購入され易い商品を適切にクラスタリングすることができ、ユーザの特徴や商品の価格の特徴などの同時に購入され易い商品に関連する情報を推定することができる。
なお、上記実施の形態では、(1)式で算出される尤度を用いる場合について説明したが、これに限定されず、事後確率など同等の性質を持つ値を用いてもよい。
また、上記の実施の形態では、マルコフ連鎖モンテカルロ法に基づいてトピック推定を行う場合について説明したが、これに限定されず、例えば、変分ベイズ法などを用いてもよい。
また、本発明は、上記実施の形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。
また、上述の購買データ解析装置は、内部にコンピュータシステムを有しているが、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、本願明細書中において、プログラムが予めインストールされている実施形態として説明したが、当該プログラムを、コンピュータ読み取り可能な記録媒体に格納して提供することも可能である。
ここで、本発明を評価するため、価格情報付き購買データを用いた実験について説明する。比較手法として価格情報を用いないトピックモデル(LDA:Latent Dirichlet Allocation)とk近傍法(baseline)とを用いた。両者を用いてユーザの年代を予測したところ、図3のようになった。なお、ユーザの年代は、年代が既知の^θとの比較により予測した。この結果は、本発明を用いて価格情報を利用することにより、的確にユーザの特徴を抽出できることを示す。
また、図4にトピック抽出結果を示す。同時に購入され易い商品群がクラスタリングされており、さらに、各クラスに含まれる商品は、例えば、Topic1では飲料、Topic2ではベビー用品、Topic3では食料品など、トピック毎に特定の商品集合となっている。また、商品の価格帯も適切に推定できていることが分かる。ある商品は、トピックにより価格帯が異なっている。例えば、Topic6においてランチは1189円であるが、Topic9では757円である。Topic6に含まれる商品は、女性ファッション関連の商品が多く、この結果から、ファッションに関心を持つ女性はランチにより多くのお金をかけることが示唆される。また、ラーメンの価格はTopic5で726円、Topic11で174 円である。この価格とトピック内の他の商品(同時に購入され易い商品)との関係からTopic5のラーメンは外食した場合の価格であり、Topic11のラーメンはスーパーで購入した場合の価格であることが分かる。このように、本発明により、同一のラベルをもつ商品でも、異なる性質のものを区別することが可能になる。
10 購買データ解析装置
20 記憶部
21 価格付き購買データ記憶部
22 トピック記憶部
23 ハイパーパラメータ記憶部
24 特徴パラメータ記憶部
30 トピック推定部
31 入力データ読込部
32 初期化部
33 トピック割当部
34 尤度算出部
35 判定部
36 トピック集合書込部
40 パラメータ推定部
41 トピック集合読込部
42 推定部
43 特徴パラメータ書込部

Claims (5)

  1. ユーザを識別するための識別情報、該ユーザが購入した商品の種類を示す情報、及び該商品の価格を示す情報を含む購買データに、複数のクラスのいずれかのクラスを示すトピックを割り当てる割当手段と、
    前記割当手段によりトピックが割り当てられた購買データ、及びハイパーパラメータを用いた確率分布で表され、かつ前記割当手段により購買データに割り当てられたトピックの尤もらしさを示す尤度を算出する尤度算出手段と、
    前記尤度算出手段により算出された尤度が高くなるように、前記ハイパーパラメータの更新、前記トピックの割り当て、及び前記尤度の算出を、前記尤度が収束するまで繰り返すように前記割当手段及び前記尤度算出手段を制御する制御手段と、
    前記尤度が収束したときの前記トピックが割り当てられた購買データ、及び前記ハイパーパラメータに基づいて、同時に購入され易い商品群、前記トピックに関連した前記ユーザの特徴を示す第1特徴パラメータ、前記トピックが示すクラスに含まれる商品の分布を示す第2特徴パラメータ、及び前記トピックが示すクラスに含まれる商品の価格の特徴を示す第3特徴パラメータの少なくとも1つを推定する推定手段と、
    を含む購買データ解析装置。
  2. 前記割当手段は、前記ユーザ毎に割り当てられた前記トピックの比率、前記トピックが示すクラスに含まれる商品の比率、及び前記トピックが示すクラスにおける商品の価格帯を用いて、前記購買データが各クラスに帰属する確率を示す帰属度を算出し、該帰属度に基づいて、前記購買データに前記トピックを割り当てる請求項1記載の購買データ解析装置。
  3. 前記尤度算出手段は、前記ユーザに割り当てられたトピックの数が少ないほど高く、前記トピックが示すクラスに含まれる商品の分布が特定の商品集合であることを示すほど高く、及び前記トピックが示すクラスに含まれる商品の価格帯が近似しているほど高くなる尤度を算出する請求項1または請求項2記載の購買データ解析装置。
  4. 割当手段と、尤度算出手段と、制御手段と、推定手段とを含む購買データ解析装置における購買データ解析方法であって、
    前記割当手段は、ユーザを識別するための識別情報、該ユーザが購入した商品の種類を示す情報、及び該商品の価格を示す情報を含む購買データに、複数のクラスのいずれかのクラスを示すトピックを割り当て、
    前記尤度算出手段は、前記割当手段によりトピックが割り当てられた購買データ、及びハイパーパラメータを用いた確率分布で表され、かつ前記割当手段により購買データに割り当てられたトピックの尤もらしさを示す尤度を算出し、
    前記制御手段は、前記尤度算出手段により算出された尤度が高くなるように、前記ハイパーパラメータの更新、前記トピックの割り当て、及び前記尤度の算出を、前記尤度が収束するまで繰り返すように前記割当手段及び前記尤度算出手段を制御し、
    前記推定手段は、前記尤度が収束したときの前記トピックが割り当てられた購買データ、及び前記ハイパーパラメータに基づいて、同時に購入され易い商品群、前記トピックに関連した前記ユーザの特徴を示す第1特徴パラメータ、前記トピックが示すクラスに含まれる商品の分布を示す第2特徴パラメータ、及び前記トピックが示すクラスに含まれる商品の価格の特徴を示す第3特徴パラメータの少なくとも1つを推定する
    購買データ解析方法。
  5. コンピュータを、請求項1〜請求項3のいずれか1項記載の購買データ解析装置を構成する各手段として機能させるための購買データ解析プログラム。
JP2011090140A 2011-04-14 2011-04-14 購買データ解析装置、方法、及びプログラム Active JP5530394B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011090140A JP5530394B2 (ja) 2011-04-14 2011-04-14 購買データ解析装置、方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011090140A JP5530394B2 (ja) 2011-04-14 2011-04-14 購買データ解析装置、方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2012221469A true JP2012221469A (ja) 2012-11-12
JP5530394B2 JP5530394B2 (ja) 2014-06-25

Family

ID=47272848

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011090140A Active JP5530394B2 (ja) 2011-04-14 2011-04-14 購買データ解析装置、方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP5530394B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015095120A (ja) * 2013-11-12 2015-05-18 日本電信電話株式会社 購買予測装置、方法、及びプログラム
CN104915734A (zh) * 2015-06-25 2015-09-16 深圳市腾讯计算机系统有限公司 基于时间序列的商品热度预测方法和系统
JP2017215670A (ja) * 2016-05-30 2017-12-07 日本電信電話株式会社 確率密度関数推定装置、連続値予測装置、方法、及びプログラム
JP7248858B1 (ja) 2022-11-08 2023-03-29 株式会社博報堂 情報処理システム、コンピュータプログラム、及び情報処理方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005222390A (ja) * 2004-02-06 2005-08-18 Matsushita Electric Ind Co Ltd お薦め情報提供装置
JP2009163615A (ja) * 2008-01-09 2009-07-23 Nippon Telegr & Teleph Corp <Ntt> 共クラスタリング装置、共クラスタリング方法、共クラスタリングプログラム、および、そのプログラムを記録した記録媒体
JP2011048667A (ja) * 2009-08-27 2011-03-10 Activecore Inc レコメンド装置、レコメンド方法およびレコメンドプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005222390A (ja) * 2004-02-06 2005-08-18 Matsushita Electric Ind Co Ltd お薦め情報提供装置
JP2009163615A (ja) * 2008-01-09 2009-07-23 Nippon Telegr & Teleph Corp <Ntt> 共クラスタリング装置、共クラスタリング方法、共クラスタリングプログラム、および、そのプログラムを記録した記録媒体
JP2011048667A (ja) * 2009-08-27 2011-03-10 Activecore Inc レコメンド装置、レコメンド方法およびレコメンドプログラム

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
CSNG200800302012; 岩田 具治 ほか: '購買順序を効率的に用いた協調フィルタリング' 情報処理学会論文誌 第49巻 第SIG4(TOM20号), 20080315, 125-134頁, 社団法人情報処理学会 *
CSNG201000565029; 岩田 具治 ほか: '購買行動解析のためのトピック追跡モデル' 電子情報通信学会論文誌(J93-D) 第J93-D巻 第6号, 20100601, 978-987頁, 社団法人電子情報通信学会 *
JPN6014015423; 岩田 具治 ほか: '購買行動解析のためのトピック追跡モデル' 電子情報通信学会論文誌(J93-D) 第J93-D巻 第6号, 20100601, 978-987頁, 社団法人電子情報通信学会 *
JPN6014015425; 岩田 具治 ほか: '購買順序を効率的に用いた協調フィルタリング' 情報処理学会論文誌 第49巻 第SIG4(TOM20号), 20080315, 125-134頁, 社団法人情報処理学会 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015095120A (ja) * 2013-11-12 2015-05-18 日本電信電話株式会社 購買予測装置、方法、及びプログラム
CN104915734A (zh) * 2015-06-25 2015-09-16 深圳市腾讯计算机系统有限公司 基于时间序列的商品热度预测方法和系统
CN104915734B (zh) * 2015-06-25 2017-03-22 深圳市腾讯计算机系统有限公司 基于时间序列的商品热度预测方法和系统
JP2017215670A (ja) * 2016-05-30 2017-12-07 日本電信電話株式会社 確率密度関数推定装置、連続値予測装置、方法、及びプログラム
JP7248858B1 (ja) 2022-11-08 2023-03-29 株式会社博報堂 情報処理システム、コンピュータプログラム、及び情報処理方法
JP2024068560A (ja) * 2022-11-08 2024-05-20 株式会社博報堂 情報処理システム、コンピュータプログラム、及び情報処理方法

Also Published As

Publication number Publication date
JP5530394B2 (ja) 2014-06-25

Similar Documents

Publication Publication Date Title
Jacobs et al. Product Recommendations Based on Latent Purchase Motivations
Jacobs et al. Model-based purchase predictions for large assortments
Carriero et al. Realtime nowcasting with a Bayesian mixed frequency model with stochastic volatility
Song et al. A discrete–continuous model for multicategory purchase behavior of households
Xiong et al. Temporal collaborative filtering with bayesian probabilistic tensor factorization
US11315164B2 (en) Complementary product recommendation systems
US11468472B2 (en) Systems and methods for scalable, adaptive, real-time personalized offers generation
Kumar et al. Social popularity based SVD++ recommender system
Dew et al. Modeling dynamic heterogeneity using Gaussian processes
US11210681B2 (en) Methods and apparatus to forecast new product launch sourcing
Singh et al. Comment volume prediction using neural networks and decision trees
JP7210958B2 (ja) 商品推薦装置及びプログラム
JP5530394B2 (ja) 購買データ解析装置、方法、及びプログラム
Verma et al. Predicting bollywood movies success using machine learning technique
Chan et al. Continuous model selection for large-scale recommender systems
US12118482B2 (en) Method and system for optimizing an objective having discrete constraints
Raval et al. A semiparametric discrete choice model: An application to hospital mergers
Demuynck Statistical inference for measures of predictive success
Lythgoe et al. Latent class modeling with a time-to-event distal outcome: a comparison of one, two and three-step approaches
Chan et al. A biased random key genetic algorithm approach for inventory-based multi-item lot-sizing problem
Rezaei et al. A clustering-based feature selection method for automatically generated relational attributes
Othayoth et al. Customer segmentation using various machine learning techniques
US20190340670A1 (en) Clustering system, method, and program, and recommendation system
CN111127074A (zh) 一种数据推荐方法
Cao et al. Web apis recommendation for mashup development based on hierarchical dirichlet process and factorization machines

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130729

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140320

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140415

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140418

R150 Certificate of patent or registration of utility model

Ref document number: 5530394

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150