JP5775425B2 - Purchase data analysis apparatus, method, and program - Google Patents

Purchase data analysis apparatus, method, and program Download PDF

Info

Publication number
JP5775425B2
JP5775425B2 JP2011252583A JP2011252583A JP5775425B2 JP 5775425 B2 JP5775425 B2 JP 5775425B2 JP 2011252583 A JP2011252583 A JP 2011252583A JP 2011252583 A JP2011252583 A JP 2011252583A JP 5775425 B2 JP5775425 B2 JP 5775425B2
Authority
JP
Japan
Prior art keywords
topic
purchase data
product
user
consideration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011252583A
Other languages
Japanese (ja)
Other versions
JP2013109470A (en
Inventor
具治 岩田
具治 岩田
澤田 宏
宏 澤田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2011252583A priority Critical patent/JP5775425B2/en
Publication of JP2013109470A publication Critical patent/JP2013109470A/en
Application granted granted Critical
Publication of JP5775425B2 publication Critical patent/JP5775425B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、購買データ解析装置、方法、及びプログラムに係り、特に、購買データに基づいて、ユーザが購入する商品を選択するモデルを推定する購買データ解析装置、方法、及びプログラムに関する。   The present invention relates to a purchase data analysis apparatus, method, and program, and more particularly, to a purchase data analysis apparatus, method, and program for estimating a model for selecting a product purchased by a user based on purchase data.

ユーザが商品を購入する際、全ての商品に関する情報を収集し、評価するわけではない。ユーザは、全商品(入手可能集合)から考慮対象となる商品(考慮集合)を絞り込み、考慮集合内の商品を評価・検討することによって、最終的な購入商品を選択する。   When a user purchases a product, information about all the products is not collected and evaluated. The user selects the final purchase product by narrowing down the products (consideration set) to be considered from all the products (available set), and evaluating and examining the products in the consideration set.

また、ユーザが購入する商品を選択する購買行動をモデル化した購入商品選択モデルが提案されている(非特許文献1)。   In addition, a purchased product selection model that models purchase behavior in which a user selects a product to be purchased has been proposed (Non-Patent Document 1).

岩田具治、渡部晋治、山田武士、上田修功、「購買行動解析のためのトピック追跡モデル」、電子情報通信学会、Vol.J93-D、No.6、pp.978-987、2010(発行日:2010年6月1日).Tomoharu Iwata, Junji Watanabe, Takeshi Yamada, Nobuo Ueda, "Topic Tracking Model for Purchasing Behavior Analysis", IEICE, Vol.J93-D, No.6, pp.978-987, 2010 (issue date) : June 1, 2010).

上記非特許文献1では、入手可能集合、考慮集合、及び選択という、購買プロセスが反映されていない、という問題点がある。入手可能集合から考慮集合への絞り込みと、考慮集合からの選択とで、異なる基準が用いられる場合がある。例えば、値段を基準に考慮集合を絞り込み、デザインを基準に考慮集合から選択することがある。そのため、考慮集合からの選択をモデル化することは重要な課題である。   In the said nonpatent literature 1, there exists a problem that the purchasing process of an available set, a consideration set, and selection is not reflected. Different criteria may be used for narrowing the available set to the consideration set and selecting from the consideration set. For example, the consideration set may be narrowed down based on the price and selected from the consideration set based on the design. Therefore, modeling selection from a consideration set is an important issue.

本発明は上記事情に鑑みてなされたものであり、考慮集合が与えられた時のユーザの購買行動に基づき、ユーザが購入する商品を選択するモデルを推定することができる購買データ解析装置、方法、及びプログラムを提供することを目的とする。   The present invention has been made in view of the above circumstances, and a purchase data analysis apparatus and method capable of estimating a model for selecting a product to be purchased by a user based on the purchase behavior of the user when a consideration set is given. And to provide a program.

上記目的を達成するために、本発明の購買データ解析装置は、ユーザを識別するための識別情報、及び該ユーザが購入した商品の種類を示す情報を含む購買データの集合である入力された購買データ集合と、各ユーザに対する、ユーザを識別するための識別情報、及び入手可能な商品の種類の集合のうち、該ユーザの考慮対象となる商品の種類の集合である考慮集合を含む入力された考慮集合データとを読み込む読み込み手段と、前記購買データ集合及び前記考慮集合データに基づいて、前記考慮集合に含まれない商品は購入されないと仮定したときの、各ユーザが前記考慮集合から購入する商品を選択するモデルのモデルパラメータを推定する推定手段と、前記推定手段によって推定されたモデルパラメータを出力する出力手段と、を含む購買データ解析装置であって、前記推定手段は、前記購買データ集合の各購買データに、複数のトピックのいずれかのトピックを割り当てる割当手段と、前記割当手段により各購買データに割り当てられたトピックの尤もらしさを示す尤度が高くなるように、前記トピック及び前記商品の種類の各組み合わせに対する、前記トピックにおける前記考慮集合の中からの前記商品の種類の選択されやすさを表わすパラメータを推定するパラメータ推定手段と、を含み、前記割当手段による前記トピックの割り当て、及び前記パラメータ推定手段による前記パラメータの推定を、所定の終了条件を満たすまで繰り返したときの、各購買データに割り当てられたトピックの集合と、前記トピック及び前記商品の種類の各組み合わせに対する前記パラメータの集合とを、前記モデルパラメータの推定結果とするIn order to achieve the above object, the purchase data analysis apparatus of the present invention provides an input purchase that is a set of purchase data including identification information for identifying a user and information indicating the type of product purchased by the user. Among the set of data sets, identification information for identifying each user, and available product types, an input including a consideration set that is a set of product types to be considered by the user is input. Product that each user purchases from the consideration set on the assumption that reading means for reading the consideration set data and the purchase data set and the consideration set data are not purchased based on the purchase data set and estimating means for estimating the model parameters of the model for selecting the output means and the including of outputting the model parameters estimated by the estimating means The purchase data analyzing apparatus, wherein the estimation means assigns each topic of the plurality of topics to each purchase data of the purchase data set, and calculates a topic assigned to each purchase data by the assignment means. A parameter for estimating a parameter representing the ease of selection of the product type from the consideration set in the topic for each combination of the topic and the product type so that the likelihood indicating likelihood is high. A set of topics assigned to each purchase data when the topic assignment by the assignment means and the parameter estimation by the parameter estimation means are repeated until a predetermined end condition is satisfied. And the parameters for each combination of the topic and the product type. A set of data, the estimation results of the model parameters.

本発明の購買データ解析装置によれば、読み込み手段によって、ユーザを識別するための識別情報、及び該ユーザが購入した商品の種類を示す情報を含む購買データの集合である入力された購買データ集合と、各ユーザに対する、ユーザを識別するための識別情報、及び入手可能な商品の種類の集合のうち、該ユーザの考慮対象となる商品の種類の集合である考慮集合を含む入力された考慮集合データとを読み込む。   According to the purchase data analysis apparatus of the present invention, an input purchase data set which is a set of purchase data including identification information for identifying the user and information indicating the type of the product purchased by the user by the reading means. And an input consideration set including a consideration set that is a set of product types to be considered by the user among a set of identification information for identifying the user and available product types for each user. Read data and.

そして、推定手段によって、前記購買データ集合及び前記考慮集合データに基づいて、前記考慮集合に含まれない商品は購入されないと仮定したときの、各ユーザが前記考慮集合から購入する商品を選択するモデルのモデルパラメータを推定する。出力手段によって、前記推定手段によって推定されたモデルパラメータを出力する。   A model for selecting products to be purchased by each user from the consideration set when it is assumed by the estimation means that the products not included in the consideration set are not purchased based on the purchase data set and the consideration set data. Estimate model parameters. The output unit outputs the model parameter estimated by the estimation unit.

このように、購買データ集合及び考慮集合データに基づいて、考慮集合に含まれない商品は購入されないと仮定したときの、各ユーザが考慮集合から購入する商品を選択するモデルのモデルパラメータを推定することにより、考慮集合が与えられた時のユーザの購買行動に基づき、ユーザが購入する商品を選択するモデルを推定することができる。   Thus, based on the purchase data set and the consideration set data, when it is assumed that the products not included in the consideration set are not purchased, the model parameters of the model for selecting the products to be purchased by each user from the consideration set are estimated. Thus, a model for selecting a product to be purchased by the user can be estimated based on the purchase behavior of the user when the consideration set is given.

また、本発明の購買データ解析方法は、読み込み手段によって、ユーザを識別するための識別情報、及び該ユーザが購入した商品の種類を示す情報を含む購買データの集合である入力された購買データ集合と、各ユーザに対する、ユーザを識別するための識別情報、及び入手可能な商品の種類の集合のうち、該ユーザの考慮対象となる商品の種類の集合である考慮集合を含む入力された考慮集合データとを読み込むステップと、推定手段によって、前記購買データ集合及び前記考慮集合データに基づいて、前記考慮集合に含まれない商品は購入されないと仮定したときの、各ユーザが前記考慮集合から購入する商品を選択するモデルのモデルパラメータを推定するステップと、出力手段によって、前記推定手段によって推定されたモデルパラメータを出力するステップと、を含む購買データ解析方法であって、前記推定手段によって前記モデルパラメータを推定するステップは、割当手段によって、前記購買データ集合の各購買データに、複数のトピックのいずれかのトピックを割り当てるステップと、パラメータ推定手段によって、前記割当手段により各購買データに割り当てられたトピックの尤もらしさを示す尤度が高くなるように、前記トピック及び前記商品の種類の各組み合わせに対する、前記トピックにおける前記考慮集合の中からの前記商品の種類の選択されやすさを表わすパラメータを推定するステップと、を含み、前記割当手段による前記トピックの割り当て、及び前記パラメータ推定手段による前記パラメータの推定を、所定の終了条件を満たすまで繰り返したときの、各購買データに割り当てられたトピックの集合と、前記トピック及び前記商品の種類の各組み合わせに対する前記パラメータの集合とを、前記モデルパラメータの推定結果とする。 Further, the purchase data analysis method of the present invention is an input purchase data set which is a set of purchase data including identification information for identifying a user and information indicating the type of product purchased by the user by the reading means. And an input consideration set including a consideration set that is a set of product types to be considered by the user among a set of identification information for identifying the user and available product types for each user. Each user purchases from the consideration set when it is assumed that a product not included in the consideration set is not purchased based on the purchase data set and the consideration set data by the step of reading data and the estimation means Estimating a model parameter of a model for selecting a product; and a model parameter estimated by the estimating means by an output means. A purchase data analyzing method comprising the steps of outputting over data, a step of estimating the model parameters by the estimating means, the assignment means and the purchase data of the purchase data set, any of a plurality of topics For each combination of the topic and the product type so that the likelihood indicating the likelihood of the topic assigned to each purchase data by the assigning means is increased by the step of assigning the topic and the parameter estimating means. Estimating a parameter indicating the ease of selection of the product type from the consideration set in the topic, and allocating the topic by the allocating means and estimating the parameter by the parameter estimating means Is repeated until a predetermined end condition is satisfied. Kino, a set of topics assigned to each purchase data, and said set of parameters for each combination of type of the topic and the product, the estimation results of the model parameters.

また、本発明の購買データ解析プログラムは、コンピュータを、上記の購買データ解析装置を構成する各手段として機能させるためのプログラムである。   Moreover, the purchase data analysis program of this invention is a program for functioning a computer as each means which comprises said purchase data analysis apparatus.

以上説明したように、本発明の購買データ解析装置、方法、及びプログラムによれば、購買データ集合及び考慮集合データに基づいて、考慮集合に含まれない商品は購入されないと仮定したときの、各ユーザが考慮集合から購入する商品を選択するモデルのモデルパラメータを推定することにより、考慮集合が与えられた時のユーザの購買行動に基づき、ユーザが購入する商品を選択するモデルを推定することができる、という効果が得られる。   As described above, according to the purchase data analysis apparatus, method, and program of the present invention, each product when it is assumed that a product not included in the consideration set is not purchased based on the purchase data set and the consideration set data. Estimating a model for selecting a product to be purchased by the user based on the purchase behavior of the user when the consideration set is given by estimating a model parameter of a model for the user to select a product to purchase from the consideration set The effect of being able to be obtained is obtained.

本発明の第1の実施の形態の購買データ解析装置の機能的構成を示すブロック図である。It is a block diagram which shows the functional structure of the purchase data analysis apparatus of the 1st Embodiment of this invention. 本発明の第1の実施の形態の購買データ解析装置における購買データ解析処理ルーチンの内容を示すフローチャートである。It is a flowchart which shows the content of the purchase data analysis process routine in the purchase data analysis apparatus of the 1st Embodiment of this invention. 本発明の第1の実施の形態の購買データ解析装置におけるトピック集合及びパラメータ集合を推定する処理の流れを示すフローチャートである。It is a flowchart which shows the flow of the process which estimates the topic set and parameter set in the purchase data analysis apparatus of the 1st Embodiment of this invention. 本実施の形態の購買データ解析装置と他の手法との精度比較結果を示す図である。It is a figure which shows the accuracy comparison result of the purchase data analysis apparatus of this Embodiment, and another method. トピック抽出の一例を示す図である。It is a figure which shows an example of topic extraction. トピック抽出の一例を示す図である。It is a figure which shows an example of topic extraction.

以下、図面を参照して本発明の実施の形態を詳細に説明する。   Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.

〔第1の実施の形態〕
<モデルの概要>
まず、表1に表記法を示す。
[First Embodiment]
<Outline of model>
First, Table 1 shows the notation.

Figure 0005775425
Figure 0005775425

入手可能な商品集合{i}i=1 Iのうち、該ユーザuの考慮対象となる商品集合である考慮集合をsu=(sum)m=1 Muとする。考慮集合として、オンラインストアにおいて見た商品の集合、ユーザの条件に合う商品の集合、などが考えられる。考慮集合suが与えられたとき、ユーザuが商品iを選択する確率を以下の(1)式で表わす。 Among the available items set {i} i = 1 I, the considerations set is a product set of the consideration of the user u and s u = (s um) m = 1 Mu. As a set to be considered, a set of products viewed in an online store, a set of products that meet user conditions, and the like can be considered. When a consideration set s u is given, the probability that the user u selects the product i is expressed by the following equation (1).

Figure 0005775425
Figure 0005775425

ここでz∈{1,...,K}はトピックであり、P(z|u)はユーザuがトピックzに属する商品に興味がある確率を表す。また、P(i|z,su)は、トピックzおよび考慮集合suが与えられた時に、商品iを選択する確率であり、例えば、以下の(2)式で表される。 Here, z∈ {1,..., K} is a topic, and P (z | u) represents the probability that the user u is interested in a product belonging to the topic z. P (i | z, s u ) is a probability of selecting the product i when the topic z and the consideration set su are given, and is represented by, for example, the following expression (2).

Figure 0005775425
Figure 0005775425

ここで、λziはトピックzにおける考慮集合からの商品iの選択されやすさを表す。上記(2)式右辺の分母は、総和が1という確率値の性質を満たすために必要な正規化項である。 Here, λ zi represents the ease of selection of the product i from the consideration set in topic z. The denominator on the right side of the above equation (2) is a normalization term necessary to satisfy the probability value property that the sum is 1.

上記(1)式に示されるように、購入商品は、ユーザの興味P(z|u)と、トピック毎の商品の選択されやすさP(i|z,su)とによって決定され、また、考慮集合に含まれない商品が選択される確率は0である。 As shown in the above equation (1), the purchased product is determined by the user's interest P (z | u) and the ease of selecting the product for each topic P (i | z, s u ). The probability that a product not included in the consideration set is selected is zero.

ここでは、トピックモデルに基づいてモデル化を行う場合を例に説明したが、最大エントロピーモデルや類似度ベースの協調フィルタリングモデルなど、他の購買商品選択モデル基づき、考慮集合に含まれない商品の選択確率は0とし、確率値にするために正規化項を加えてモデルしてもよい。   Here, the case of modeling based on a topic model has been explained as an example, but selection of products not included in the consideration set based on other purchased product selection models such as maximum entropy model and similarity-based collaborative filtering model The probability may be 0, and a normalization term may be added and modeled to obtain a probability value.

<システム構成>
第1の実施の形態に係る購買データ解析装置100は、CPU(Central Processing Unit)と、RAM(Random Access Memory)と、後述する購買データ解析処理ルーチンを実行するためのプログラムを記憶したROM(Read Only Memory)とを備えたコンピュータで構成されている。このコンピュータは、機能的には、図1に示すように、読み込み部10、記憶部20、推定部30、及び出力部40を含んだ構成で表すことができる。
<System configuration>
A purchase data analysis apparatus 100 according to the first embodiment includes a CPU (Central Processing Unit), a RAM (Random Access Memory), and a ROM (Read Read) that stores a program for executing a purchase data analysis processing routine to be described later. Only memory). This computer can be functionally represented by a configuration including a reading unit 10, a storage unit 20, an estimation unit 30, and an output unit 40, as shown in FIG.

読み込み部10は、考慮集合読み込み部11と、購買集合読み込み部12とを備えている。   The reading unit 10 includes a consideration set reading unit 11 and a purchase set reading unit 12.

考慮集合読み込み部11は、入力された全ユーザの考慮集合S={su} u=1 Uを読み込む。購買集合読み込み部12は、全ユーザの購買データ集合X={xu}u=1 ,xu=(xun)n=1 Nuを読み込む。以下では、ユーザuのn番目の購買データxunを「ユーザuの購買n」ともいう。 The consideration set reading unit 11 reads the input consideration set S = {s u } u = 1 U of all users. The purchase set reading unit 12 reads purchase data sets X = {x u } u = 1 U and x u = (x un ) n = 1 Nu for all users. Hereinafter, the nth purchase data xun of the user u is also referred to as “purchase n of the user u”.

記憶部20には、読み込まれた全ユーザの考慮集合S={su}U u=1が記憶される考慮集合記憶部21、読み込まれた全ユーザの購買データ集合X={xu} u=1が記憶される購買集合記憶部22、トピック集合Zが記憶されるトピック集合記憶部23、及びパラメータ集合Λが記憶されるパラメータ集合記憶部24が設けられている。 The storage unit 20 includes a consideration set storage unit 21 in which the read consideration set S = {s u } U u = 1 of all the users is read, and a purchase data set X = {x u } U of all the read users. A purchase set storage unit 22 storing u = 1, a topic set storage unit 23 storing topic set Z, and a parameter set storage unit 24 storing parameter set Λ are provided.

推定部30は、初期化部31と、トピック推定部32と、パラメータ推定部33とを備えている。   The estimation unit 30 includes an initialization unit 31, a topic estimation unit 32, and a parameter estimation unit 33.

初期化部31は、購買集合読み込み部12で読み込んだ購買集合の購買データの各々に、ランダムにトピックを付与して、トピック集合Zを初期化する。トピックは、例えばユーザの興味に相当し、購買データが表わすユーザuの購買nが、トピックkの商品に興味があることを表わす。トピック集合Zは、Z={zu=1 (z={zunn=1 Nu)である。また、初期化部31は、パラメータ集合の各パラメータに、ランダムに値を設定して初期化する。パラメータ集合は、Λ={λzz=1 Z(λz={λzii=1 I)である。 The initialization unit 31 initializes the topic set Z by randomly assigning a topic to each purchase data of the purchase set read by the purchase set reading unit 12. The topic corresponds to the user's interest, for example, and indicates that the purchase n of the user u represented by the purchase data is interested in the product of the topic k. The topic set Z is Z = {z u } u = 1 U (z u = {z un } n = 1 Nu ). The initialization unit 31 initializes each parameter of the parameter set by setting values at random. The parameter set is Λ = {λ z } z = 1 Zz = {λ zi } i = 1 I ).

また、ハイパーパラメータも適当に初期化する。例えば、ディリクレ分布のハイパーパラメータはα=1と設定し、正規分布のハイパーパラメータはβ=1と設定する.   In addition, hyper parameters are also initialized appropriately. For example, the hyperparameter for the Dirichlet distribution is set to α = 1, and the hyperparameter for the normal distribution is set to β = 1.

トピック推定部32は、各ユーザu=1,...,Uの各購買n=1,...,Nuがどのトピックに帰属するかを表す帰属度を計算する。帰属度は、入力として、ユーザのトピック比率、トピック毎の商品購買確率、および考慮集合をとり、これらの値を考慮したものである必要がある。例えば、以下の(3)式により、ユーザuの購買nを表わす購買データxunがトピックkに帰属する帰属度が計算される。 The topic estimation unit 32 calculates the degree of attribution indicating to which topic each purchase n = 1,..., N u of each user u = 1,. The degree of attribution needs to take the values of the user's topic ratio, merchandise purchase probability for each topic, and a consideration set as inputs. For example, the degree of belonging to which the purchase data xun representing the purchase n of the user u belongs to the topic k is calculated by the following equation (3).

Figure 0005775425
Figure 0005775425

ここで、\unはユーザuのn番目の購買を除くことを表す。Nukは、ユーザuの購買データのうち、トピックkが割り当てられた購買データの数を表わす。 Here, \ un represents that the nth purchase of user u is excluded. N uk represents the number of purchase data to which the topic k is assigned among the purchase data of the user u.

トピック推定部32は、計算された帰属度に基づいて、新たなトピックzunを割り当てる。例えば、上記(3)式により算出された、購買データxunの各トピックk(k=1,・・・,K)への帰属度のうち、最も高い帰属度となるトピックがトピック1であった場合には、トピック1を、購買データxunのトピックとして割り当てる。 The topic estimation unit 32 assigns a new topic z un based on the calculated degree of attribution. For example, the topic with the highest degree of attribution among topics belonging to each topic k (k = 1,..., K) of the purchase data xun calculated by the above equation (3) is topic 1. If the is the topic 1, assigned as the topic of the purchase data x un.

次に、パラメータ推定部33は、データが与えられた時のパラメータの事後確率が最大になるように、パラメータ集合Λを推定する。パラメータ集合Λの推定における最大化すべき目的関数は、以下の(4)式で表される。   Next, the parameter estimation unit 33 estimates the parameter set Λ so that the posterior probability of the parameter when data is given is maximized. The objective function to be maximized in the estimation of the parameter set Λ is expressed by the following equation (4).

Figure 0005775425
Figure 0005775425

ここで、第二項は正則化項であり、βはそのハイパーパラメータを表す。準ニュートン法などの最適化法を用いることにより、目的関数を最大化する大域的最適解を得ることができる。   Here, the second term is a regularization term, and β represents the hyperparameter. By using an optimization method such as the quasi-Newton method, a global optimal solution that maximizes the objective function can be obtained.

トピック推定部32とパラメータ推定部33とを終了条件が満たされるまで繰り返すことにより、トピック集合Zおよびパラメータ集合Λを推定する。なお、トピック集合Zおよびパラメータ集合Λが、モデルパラメータの一例である。   By repeating the topic estimation unit 32 and the parameter estimation unit 33 until the end condition is satisfied, the topic set Z and the parameter set Λ are estimated. The topic set Z and the parameter set Λ are examples of model parameters.

終了条件としては、例えば、トピック集合Z=(zu) u=1 U,zu=(zun)n=1 Nu,およびパラメータ集合Λ=(λz) z=1 Zz=(λzi)i=1 Iの現在の推定値が、どのくらい入力データを尤もらしく説明できているか、すなわち、各購買データに割り当てられたトピックの尤もらしさを表す、尤度が収束することである。尤度の特性としては、(a)あるユーザの購買データに割り当てられるトピック種数が少ない場合に尤度は高くなること、及び(b)あるトピックが付与される購買データの商品が特定の商品集合である場合に尤度は高くなることを要する。なお、尤度の代わりに、事後確率など同等の性質を持つ値を用いることも可能である。 As termination conditions, for example, topic set Z = (z u ) u = 1 U , z u = (z un ) n = 1 Nu , and parameter set Λ = (λ z ) z = 1 Z , λ z = ( The likelihood that the current estimate of λ zi ) i = 1 I can explain the input data reasonably, that is, the likelihood converges, which represents the likelihood of the topic assigned to each purchase data. As characteristics of likelihood, (a) the likelihood increases when the number of topic types allocated to purchase data of a certain user is small, and (b) the product of purchase data to which a certain topic is assigned is a specific product. When it is a set, the likelihood needs to be high. Note that a value having an equivalent property such as a posteriori probability can be used instead of the likelihood.

また、終了条件として、繰り返し回数、計算時間などが所定値に到達することを用いることができる。   Further, as the termination condition, it can be used that the number of repetitions, the calculation time, etc. reach a predetermined value.

出力部40は、トピック比率出力部41と、パラメータ出力部42とを備えている。トピック比率出力部41は、推定されたトピック集合Zを用いて、以下の(5)式に従ってユーザu及びトピックkの各組み合わせについて、トピック比率θukを計算し、計算したトピック比率集合を出力する。 The output unit 40 includes a topic ratio output unit 41 and a parameter output unit 42. The topic ratio output unit 41 calculates the topic ratio θ uk for each combination of the user u and the topic k according to the following equation (5) using the estimated topic set Z, and outputs the calculated topic ratio set. .

Figure 0005775425
Figure 0005775425

また、トピック比率出力部41は、計算したトピック比率集合を用いることにより、購買行動が似たユーザのクラスタリングを行い、クラスタリング結果を出力する。例えば、各ユーザuを、最も高いトピック比率θukを持つトピックkに割り当てることにより、ユーザのクラスタリングを行ない、ユーザのクラスタリング結果(各トピックkに割り当てられたユーザ群)を出力する。 Further, the topic ratio output unit 41 uses the calculated topic ratio set to perform clustering of users with similar purchasing behavior and outputs a clustering result. For example, by assigning each user u to the topic k having the highest topic ratio θ uk , user clustering is performed, and the user clustering result (user group assigned to each topic k) is output.

パラメータ出力部42は、推定したパラメータ集合Λを出力する。パラメータ出力部42は、このパラメータ集合Λを用いることにより、同時に購入されやすい商品のクラスタリングを行い、クラスタリング結果を出力する。例えば、例えば、各商品iを、最も高いパラメータλkiを持つトピックkに割り当てることにより、商品のクラスタリングを行ない、商品のクラスタリング結果(各トピックkに割り当てられた商品群)を出力する。 The parameter output unit 42 outputs the estimated parameter set Λ. The parameter output unit 42 uses the parameter set Λ to cluster products that are easily purchased at the same time, and outputs a clustering result. For example, by assigning each product i to the topic k having the highest parameter λ ki , the products are clustered, and the product clustering result (the product group assigned to each topic k) is output.

また、パラメータ出力部42は、トピック比率集合、パラメータ集合Λ、および考慮集合Sを用いることにより、各ユーザについて、ユーザの購買行動に適した商品(推薦される商品)を求め、各ユーザの推薦商品を出力する。例えば、トピック比率θukの集合、パラメータ集合Λ、および考慮集合Sを上記(1)式に代入することにより(ここでP(z|u)=θuzとする)、各ユーザの各商品を購入する確率を推定し、各ユーザについて、この確率が高い商品を、推薦商品として求める。 Further, the parameter output unit 42 uses the topic ratio set, the parameter set Λ, and the consideration set S to obtain a product (recommended product) suitable for the user's purchase behavior for each user, and recommends each user. Output the product. For example, by substituting the set of topic ratios θ uk , parameter set Λ, and consideration set S into the above equation (1) (where P (z | u) = θ uz ), The probability of purchasing is estimated, and for each user, a product with a high probability is obtained as a recommended product.

<購買データ解析装置の作用>
本実施の形態の購買データ解析装置100に、各ユーザの考慮集合S及び全ユーザの購買データ集合Xが入力されると、購買データ解析装置100において、図2に示す、購買データ解析処理ルーチンが実行される。
<Operation of purchasing data analyzer>
When the consideration set S of each user and the purchase data set X of all users are input to the purchase data analysis apparatus 100 of this embodiment, the purchase data analysis processing routine shown in FIG. Executed.

まず、ステップS101で、読み込み部10によって、入力された考慮集合S及び購買データ集合Xを読みこみ、考慮集合記憶部21及び購買集合記憶部22に格納する。   First, in step S <b> 101, the input consideration set S and purchase data set X are read by the reading unit 10 and stored in the consideration set storage unit 21 and the purchase set storage unit 22.

次のステップS102では、推定部30によって、購買データ集合の各購買データに対するトピックの集合Z、及びパラメータ集合Λを推定する。   In the next step S102, the estimation unit 30 estimates a topic set Z and a parameter set Λ for each purchase data in the purchase data set.

ここで、上記ステップS102は、図3に示す処理ルーチンによって実現される。   Here, step S102 is realized by the processing routine shown in FIG.

ステップS110において、初期化部31によって、購買データ集合Xの購買データxの各々に、ランダムにトピックzを付与して、トピック集合Zを初期化すると共に、パラメータ集合Λの各パラメータに対してランダムに値を付与してパラメータ集合Λを初期化する。初期化されたトピック集合Zは、トピック集合記憶部23に格納され、初期化されたパラメータ集合Λは、パラメータ集合記憶部24に格納される。また、ハイパーパラメータα、βに適当な値を設定する。   In step S110, the initialization unit 31 initializes the topic set Z by randomly assigning the topic z to each purchase data x of the purchase data set X, and randomly sets each parameter of the parameter set Λ. Is assigned a value to initialize the parameter set Λ. The initialized topic set Z is stored in the topic set storage unit 23, and the initialized parameter set Λ is stored in the parameter set storage unit 24. Also, appropriate values are set for the hyper parameters α and β.

次のステップS111では、ユーザを識別する変数uを初期値である1に設定し、ステップS112では、購買を識別する変数nを初期値である1に設定する。   In the next step S111, a variable u for identifying the user is set to 1 which is an initial value, and in step S112, a variable n for identifying purchase is set to 1 which is an initial value.

そして、ステップS113では、トピック推定部32によって、購買データxunについて、上記ステップS110で初期化されたトピック集合Z及びパラメータ集合Λ、又は前回推定されたトピック集合Z及びパラメータ集合Λを用いて、上記(3)式に従って、当該購買データxunの各トピックkへの帰属度を算出し、算出した帰属度に基づいて、購買データxunに新たなトピックを割り当て、トピック集合記憶部23の内容を更新する。 In step S113, the topic estimation unit 32 uses the topic set Z and parameter set Λ initialized in step S110 or the previously estimated topic set Z and parameter set Λ for the purchase data xun . According to the above equation (3), the degree of attribution of the purchase data xun to each topic k is calculated, a new topic is assigned to the purchase data xun based on the calculated degree of attribution, and the contents of the topic set storage unit 23 Update.

次のステップS114では、変数nが、N以上であるか否かを判定し、変数nが、N未満である場合には、ステップS115において、nを1インクリメントして、上記数テップS113に戻る。一方、変数nが、N以上である場合には、ユーザuの全ての購買データについてトピックを割り当てたと判断し、ステップS116へ移行する。 In the next step S114, it is determined whether or not the variable n is greater than or equal to N u . If the variable n is less than N u , n is incremented by 1 in step S115, and the above-mentioned number of steps S113 is performed. Return to. Meanwhile, the variable n is, when it is more than N u determines that assigned the topic for all purchase data of the user u, the process proceeds to step S116.

ステップS116では、変数uが、ユーザ数を示す定数U以上であるか否かを判定し、変数uが、U未満である場合には、ステップS117において、uを1インクリメントして、上記数テップS112に戻る。一方、変数uが、U以上である場合には、全ユーザの購買データについてトピックを割り当てたと判断し、ステップS118へ移行する。   In step S116, it is determined whether or not the variable u is greater than or equal to a constant U indicating the number of users. If the variable u is less than U, u is incremented by 1 in step S117, and the above-mentioned number step. Return to S112. On the other hand, if the variable u is greater than or equal to U, it is determined that a topic has been assigned to purchase data for all users, and the process proceeds to step S118.

ステップS118では、上記ステップS113で求めたトピック集合Zを用いて、上記(4)式に示す目的関数を最大化する大域的最適解を求め、解として求められたパラメータ集合Λを、パラメータ集合Λの推定結果とし、パラメータ集合記憶部24の内容を更新する。   In step S118, a global optimum solution that maximizes the objective function shown in the above equation (4) is obtained using the topic set Z obtained in step S113, and the parameter set Λ obtained as the solution is obtained as the parameter set Λ. The contents of the parameter set storage unit 24 are updated.

そして、ステップS119では、繰り返しの終了条件を満たすか否かを判定する。例えば、上記ステップS113で求めたトピック集合Zに基づいて算出される尤度が収束したか否かを判定する。尤度が収束していない場合には、ステップS111へ戻って、上記ステップS111〜S118の処理を繰り返す。一方、尤度が収束したと判定された場合には、上記ステップS102の処理を終了する。トピック集合記憶部23に最終的に記憶されているトピック集合Zが、トピック集合の推定結果であり、パラメータ集合記憶部24に最終的に記憶されているパラメータ集合Λが、パラメータ集合の推定結果である。   In step S119, it is determined whether or not a repetitive end condition is satisfied. For example, it is determined whether or not the likelihood calculated based on the topic set Z obtained in step S113 has converged. If the likelihood has not converged, the process returns to step S111 and the processes of steps S111 to S118 are repeated. On the other hand, if it is determined that the likelihood has converged, the process of step S102 is terminated. The topic set Z finally stored in the topic set storage unit 23 is the estimation result of the topic set, and the parameter set Λ finally stored in the parameter set storage unit 24 is the estimation result of the parameter set. is there.

次に、図2のステップS103で、トピック比率出力部41によって、上記ステップS102で推定されたトピック集合Zを用いて、上記(5)式に従って、トピック比率集合を計算して出力する。また、トピック比率出力部41は、計算したトピック比率集合を用いて、ユーザをクラスタリングして、ユーザのクラスタリング結果を出力する。   Next, in step S103 of FIG. 2, the topic ratio output unit 41 calculates and outputs the topic ratio set according to the above equation (5) using the topic set Z estimated in step S102. Also, the topic ratio output unit 41 clusters users using the calculated topic ratio set, and outputs the user clustering result.

そして、ステップS104で、パラメータ出力部42によって、上記ステップS102で推定されたパラメータ集合Λを出力する。また、パラメータ出力部42は、パラメータ集合Λを用いて、商品をクラスタリングして、商品のクラスタリング結果を出力する。パラメータ出力部42は、パラメータ集合Λを用いて、各ユーザについて各商品の購入確率を算出して、推薦商品を決定し、各ユーザの推薦商品を出力して、処理を終了する。   In step S104, the parameter output unit 42 outputs the parameter set Λ estimated in step S102. Further, the parameter output unit 42 clusters the products using the parameter set Λ and outputs the clustering result of the products. The parameter output unit 42 calculates the purchase probability of each product for each user using the parameter set Λ, determines the recommended product, outputs the recommended product for each user, and ends the process.

以上説明したように、第1の実施の形態に係る購買データ解析装置によれば、購買データ集合及び各ユーザの考慮集合に基づいて、考慮集合に含まれない商品は購入されない仮定の下での、各ユーザが考慮集合から購入する商品を選択するモデルのモデルパラメータを推定することにより、考慮集合が与えられた時のユーザの購買行動に基づき、ユーザが購入する商品を選択するモデルを推定することができる。   As described above, according to the purchase data analysis apparatus according to the first embodiment, based on the purchase data set and the consideration set of each user, products not included in the consideration set are assumed to be not purchased. Estimating a model for selecting a product to be purchased by a user based on the purchase behavior of the user when a consideration set is given by estimating model parameters of a model for each user to select a product to purchase from the consideration set be able to.

また、考慮集合を用いない従来技術より精緻なモデルを推定することができ、予測精度を向上させることが可能となる。   In addition, it is possible to estimate a more precise model than the conventional technique that does not use a consideration set, and it is possible to improve prediction accuracy.

また、購買データを解析することによって、同時に購入されやすい商品のクラスタリング、似た購買行動を持つユーザのクラスタリング、及びユーザの購買行動に適した商品を推薦することが可能となる。   Further, by analyzing the purchase data, it is possible to recommend clustering of products that are easily purchased at the same time, clustering of users having similar purchasing behavior, and products suitable for the purchasing behavior of the user.

〔第2の実施の形態〕
次に、第2の実施の形態について説明する。なお、第1の実施の形態と同様の構成となる部分については、同一符号を付して説明を省略する。
[Second Embodiment]
Next, a second embodiment will be described. In addition, about the part which becomes the structure similar to 1st Embodiment, the same code | symbol is attached | subjected and description is abbreviate | omitted.

第2の実施の形態では、考慮集合のデータとして、ユーザにおいて各商品が考慮集合に含まれる確率が入力される点が、第1の実施の形態と異なっている。   The second embodiment is different from the first embodiment in that the probability that each product is included in the consideration set is input as the consideration set data.

第2の実施の形態に係る購買データ解析装置の考慮集合読み込み部11は、考慮集合S の代わりに入力された、各ユーザuにおいて各商品が考慮集合に含まれる確率の集合qu={quii=1 Iを読み込み、考慮集合記憶部21に格納する。 The consideration set reading unit 11 of the purchase data analyzing apparatus according to the second embodiment receives a set of probabilities q u = {q for each user u included in the consideration set, instead of the consideration set S 1. ui } i = 1 I is read and stored in the consideration set storage unit 21.

ここで、ユーザuにおける各商品が考慮集合に含まれる確率の集合qu={quii=1 Iが与えられたとき、ユーザuが商品iを選択する確率は、上記(1)式の代わりに、以下の(6)式で表される。 Here, when a set of probabilities q u = {q ui } i = 1 I in which each product of the user u is included in the consideration set, the probability that the user u selects the product i is expressed by the above equation (1). Instead of, it is expressed by the following equation (6).

Figure 0005775425
Figure 0005775425

ここでquiは商品iがユーザuの考慮集合に含まれる確率を表す。確率集合qはデータから推定したものでもよい。 Here, q ui represents the probability that the product i is included in the consideration set of the user u. The probability set q may be estimated from data.

パラメータ出力部42では、トピック比率集合、パラメータ集合Λ、および各ユーザuにおいて各商品が考慮集合に含まれる確率の集合quを、上記(6)式に代入することにより(ここでP(z|u)=θuzとする)、各ユーザの各商品を購入する確率を推定し、各ユーザについて、この確率が高い商品を、推薦商品として求める。 The parameter output unit 42 substitutes a topic ratio set, a parameter set Λ, and a set q u of probabilities that each product u is included in the consideration set in the above equation (6) (where P (z | u) = θ uz ), the probability of purchasing each product of each user is estimated, and for each user, a product with a high probability is obtained as a recommended product.

なお、第2の実施の形態に係る購買データ解析装置の他の構成及び作用については、第1の実施の形態と同様であるため、説明を省略する。   In addition, about the other structure and effect | action of the purchase data analyzer which concerns on 2nd Embodiment, since it is the same as that of 1st Embodiment, description is abbreviate | omitted.

<実施例>
本発明を評価するため、オンラインストアにおける購買データを用いた実験を行った。2010年11月19日から2011年2月28日まで、3月31日まで、5月9日までの3つの購買履歴データを用いて提案法の有効性を確認した。各購買履歴データのユーザ数、ブランド数、総購買数、及び総考慮数(ページビュー)を、以下の表2に示す。なお二回以上の購買がないユーザは省いた。また、オンラインストアにおいてユーザが見た商品を考慮集合と考えた。ブランドを、購買データが表わす商品の種類とした。
<Example>
In order to evaluate the present invention, an experiment using purchase data in an online store was conducted. The effectiveness of the proposed method was confirmed using three purchase history data from November 19, 2010 to February 28, 2011, March 31, and May 9. Table 2 below shows the number of users, the number of brands, the total number of purchases, and the total number of considerations (page view) of each purchase history data. Users who did not purchase more than once were omitted. In addition, the product viewed by the user in the online store was considered as a consideration set. The brand is the type of product represented by the purchase data.

Figure 0005775425
Figure 0005775425

10%のユーザについて、ランダムに選んだ1つの購買をテストデータとし、それ以外の購買を学習データとし、学習データを用いて、テストデータに含まれる購買のブランドを予測した。そのときの正答率(accuracy)を、評価指標とした。図4(A)〜(C)に結果を示す。比較手法として、考慮集合を用いない通常のトピックモデル(LDA:Latent Dirichlet Allocation)を用いた。なおLDAにおいては、考慮集合の内で最も購入確率の高い商品を予測商品とした。本発明(proposed)は全データセットにおいて正答率が高く、考慮集合を組み込むことにより、より正確に購買ブランド(購買商品)を予測できることが分かった。   For 10% of users, one randomly selected purchase was used as test data, the other purchases were used as learning data, and the purchase brand included in the test data was predicted using the learning data. The correct answer rate at that time was used as an evaluation index. The results are shown in FIGS. As a comparison method, a normal topic model (LDA: Latent Dirichlet Allocation) that does not use a consideration set was used. In LDA, the product with the highest purchase probability in the set to be considered is set as the predicted product. The present invention (proposed) has a high percentage of correct answers in all data sets, and it has been found that a purchase brand (purchased product) can be predicted more accurately by incorporating a consideration set.

また、ファッションおよび化粧品で商品を分けて実験した場合のトピック抽出結果を図5、図6に示す。なお、トピック抽出結果として、トピック毎に、当該トピックが割り当てられた購買データの商品の集合のなかで、出現確率が高い商品の集合を示している。図5では、ファッションに分けられた商品について実験した結果を示し、図6では、化粧品に分けられた商品について実験した結果を示す。以上より、関連する商品に、同じトピックが割り当てられていることが分かった。   Moreover, the topic extraction result at the time of experimenting by dividing goods by fashion and cosmetics is shown in FIGS. As a topic extraction result, for each topic, a set of products having a high appearance probability is shown in a set of products of purchase data to which the topic is assigned. FIG. 5 shows the results of experiments performed on products classified into fashion, and FIG. 6 shows the results of experiments performed on products classified into cosmetics. From the above, it was found that the same topic was assigned to related products.

また、本発明は、上記実施の形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。   The present invention is not limited to the above-described embodiment, and various modifications and applications are possible without departing from the gist of the present invention.

上記の実施の形態では、トピックのギブスサンプリングとパラメータに関する完全尤度最大化を交互に繰り返すことにより、トピック集合及びパラメータ集合を推定する方法について説明したが、これに限定されるものではない。例えば、マルコフ連鎖モンテカルロ法や変分ベイズ法、事後確率最大化法などを用いて、トピック集合及びパラメータ集合を推定することも可能である.   In the above embodiment, the method of estimating the topic set and the parameter set by alternately repeating the Gibbs sampling of the topic and the full likelihood maximization regarding the parameter has been described. However, the present invention is not limited to this. For example, it is possible to estimate the topic set and parameter set using Markov chain Monte Carlo method, variational Bayes method, posterior probability maximization method, etc.

また、上述の購買データ解析装置は、内部にコンピュータシステムを有しているが、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。   Moreover, although the above-mentioned purchase data analysis apparatus has a computer system inside, if a "computer system" is using the WWW system, it shall include a homepage provision environment (or display environment). .

また、本願明細書中において、プログラムが予めインストールされている実施形態として説明したが、当該プログラムを、コンピュータ読み取り可能な記録媒体に格納して提供することも可能である。   In the present specification, the embodiment has been described in which the program is installed in advance. However, the program can be provided by being stored in a computer-readable recording medium.

10 読み込み部
20 記憶部
30 推定部
31 初期化部
32 トピック推定部
33 パラメータ推定部
40 出力部
41 トピック比率出力部
42 パラメータ出力部
100 購買データ解析装置
DESCRIPTION OF SYMBOLS 10 Reading part 20 Storage part 30 Estimation part 31 Initialization part 32 Topic estimation part 33 Parameter estimation part 40 Output part 41 Topic ratio output part 42 Parameter output part 100 Purchasing data analysis apparatus

Claims (7)

ユーザを識別するための識別情報、及び該ユーザが購入した商品の種類を示す情報を含む購買データの集合である入力された購買データ集合と、各ユーザに対する、ユーザを識別するための識別情報、及び入手可能な商品の種類の集合のうち、該ユーザの考慮対象となる商品の種類の集合である考慮集合を含む入力された考慮集合データとを読み込む読み込み手段と、
前記購買データ集合及び前記考慮集合データに基づいて、前記考慮集合に含まれない商品は購入されないと仮定したときの、各ユーザが前記考慮集合から購入する商品を選択するモデルのモデルパラメータを推定する推定手段と、
前記推定手段によって推定されたモデルパラメータを出力する出力手段と、
を含む購買データ解析装置であって、
前記推定手段は、
前記購買データ集合の各購買データに、複数のトピックのいずれかのトピックを割り当てる割当手段と、
前記割当手段により各購買データに割り当てられたトピックの尤もらしさを示す尤度が高くなるように、前記トピック及び前記商品の種類の各組み合わせに対する、前記トピックにおける前記考慮集合の中からの前記商品の種類の選択されやすさを表わすパラメータを推定するパラメータ推定手段と、を含み、
前記割当手段による前記トピックの割り当て、及び前記パラメータ推定手段による前記パラメータの推定を、所定の終了条件を満たすまで繰り返したときの、各購買データに割り当てられたトピックの集合と、前記トピック及び前記商品の種類の各組み合わせに対する前記パラメータの集合とを、前記モデルパラメータの推定結果とする購買データ解析装置。
Identification information for identifying the user, input purchase data set that is a set of purchase data including information indicating the type of product purchased by the user, and identification information for identifying the user for each user, Reading means for reading input consideration set data including a consideration set which is a set of product types to be considered by the user among a set of available product types;
Based on the purchase data set and the consideration set data, a model parameter of a model for selecting a product to be purchased by each user from the consideration set when it is assumed that a product not included in the consideration set is not purchased is estimated. An estimation means;
Output means for outputting the model parameters estimated by the estimation means;
A purchasing data analysis device including a,
The estimation means includes
Assigning means for assigning any one of a plurality of topics to each purchase data of the purchase data set;
The product from the consideration set in the topic for each combination of the topic and the product type so that the likelihood indicating the likelihood of the topic assigned to each purchase data by the assigning means is high. Parameter estimation means for estimating a parameter indicating the ease of selection of the type, and
A set of topics assigned to each purchase data, the topic, and the product when the topic assignment by the assignment means and the parameter estimation by the parameter estimation means are repeated until a predetermined end condition is satisfied. A purchase data analyzing apparatus that uses the set of parameters for each combination of types as an estimation result of the model parameters.
前記出力手段は、前記推定手段によって推定された前記モデルパラメータを用いて、購買行動が類似するユーザ群を求めるユーザのクラスタリング、及び同時に購入され易い商品群を求める商品のクラスタリングの少なくとも一方を行い、前記クラスタリングの結果を出力する請求項1記載の購買データ解析装置。   The output means performs at least one of user clustering for a user group with similar purchasing behavior and product clustering for a product group that is easily purchased using the model parameter estimated by the estimating unit, The purchase data analysis apparatus according to claim 1, wherein the clustering result is output. 前記割当手段は、各購買データに割り当てられたトピックの集合と、前記トピック及び前記商品の種類の各組み合わせに対する前記パラメータの集合と、各ユーザの前記考慮集合を用いて、前記購買データが各トピックに帰属する確率を示す帰属度を算出し、該帰属度に基づいて、前記購買データに前記トピックを割り当てる請求項1又は2記載の購買データ解析装置。 The assigning means uses the set of topics assigned to each purchase data, the set of parameters for each combination of the topic and the product type, and the consideration set of each user, and calculating a degree of membership indicating a probability of belonging to the topic, based on the membership, purchase data analyzing apparatus according to claim 1 or 2, wherein allocating the topic to the purchasing data. 読み込み手段によって、ユーザを識別するための識別情報、及び該ユーザが購入した商品の種類を示す情報を含む購買データの集合である入力された購買データ集合と、各ユーザに対する、ユーザを識別するための識別情報、及び入手可能な商品の種類の集合のうち、該ユーザの考慮対象となる商品の種類の集合である考慮集合を含む入力された考慮集合データとを読み込むステップと、
推定手段によって、前記購買データ集合及び前記考慮集合データに基づいて、前記考慮集合に含まれない商品は購入されないと仮定したときの、各ユーザが前記考慮集合から購入する商品を選択するモデルのモデルパラメータを推定するステップと、
出力手段によって、前記推定手段によって推定されたモデルパラメータを出力するステップと、
を含む購買データ解析方法であって、
前記推定手段によって前記モデルパラメータを推定するステップは、
割当手段によって、前記購買データ集合の各購買データに、複数のトピックのいずれかのトピックを割り当てるステップと、
パラメータ推定手段によって、前記割当手段により各購買データに割り当てられたトピックの尤もらしさを示す尤度が高くなるように、前記トピック及び前記商品の種類の各組み合わせに対する、前記トピックにおける前記考慮集合の中からの前記商品の種類の選択されやすさを表わすパラメータを推定するステップと、を含み、
前記割当手段による前記トピックの割り当て、及び前記パラメータ推定手段による前記パラメータの推定を、所定の終了条件を満たすまで繰り返したときの、各購買データに割り当てられたトピックの集合と、前記トピック及び前記商品の種類の各組み合わせに対する前記パラメータの集合とを、前記モデルパラメータの推定結果とする購買データ解析方法。
In order to identify the user for each user and the input purchase data set which is a set of purchase data including identification information for identifying the user and information indicating the type of product purchased by the user by the reading means Reading the input consideration set data including a consideration set that is a set of product types to be considered by the user among the set of identification information and available product types;
A model of a model in which each user selects a product to be purchased from the consideration set based on the purchase data set and the consideration set data, assuming that the product not included in the consideration set is not purchased. Estimating the parameters;
Outputting a model parameter estimated by the estimating means by an output means;
A purchasing data analysis methods, including,
The step of estimating the model parameter by the estimating means includes
Assigning any one of a plurality of topics to each purchase data of the purchase data set by an assigning means;
In the set of considerations in the topic for each combination of the topic and the product type, the parameter estimation unit increases the likelihood indicating the likelihood of the topic allocated to each purchase data by the allocation unit. Estimating a parameter representing the ease of selection of the product type from
A set of topics assigned to each purchase data, the topic, and the product when the topic assignment by the assignment means and the parameter estimation by the parameter estimation means are repeated until a predetermined end condition is satisfied. A purchase data analysis method using the set of parameters for each combination of types as an estimation result of the model parameters.
前記出力手段によって出力するステップは、前記推定手段によって推定された前記モデルパラメータを用いて、購買行動が類似するユーザ群を求めるユーザのクラスタリング、及び同時に購入され易い商品群を求める商品のクラスタリングの少なくとも一方を行い、前記クラスタリングの結果を出力する請求項記載の購買データ解析方法。 The step of outputting by the output means includes at least clustering of users for obtaining a user group having similar purchasing behavior using the model parameter estimated by the estimating means and clustering of products for obtaining a product group that is easily purchased at the same time. The purchase data analysis method according to claim 4 , wherein one is performed and the clustering result is output. 前記割当手段によって割り当てるステップは、各購買データに割り当てられたトピックの集合と、前記トピック及び前記商品の種類の各組み合わせに対する前記パラメータの集合と、各ユーザの前記考慮集合とを用いて、前記購買データが各トピックに帰属する確率を示す帰属度を算出し、該帰属度に基づいて、前記購買データに前記トピックを割り当てる請求項4又は5記載の購買データ解析方法。  The step of assigning by the assigning means uses the set of topics assigned to each purchase data, the set of parameters for each combination of the topic and the product type, and the consideration set of each user. The purchase data analysis method according to claim 4 or 5, wherein a degree of attribution indicating a probability that the data belongs to each topic is calculated, and the topic is assigned to the purchase data based on the degree of attribution. コンピュータを、請求項1〜請求項のいずれか1項記載の購買データ解析装置を構成する各手段として機能させるための購買データ解析プログラム。 The purchase data analysis program for functioning a computer as each means which comprises the purchase data analysis apparatus of any one of Claims 1-3 .
JP2011252583A 2011-11-18 2011-11-18 Purchase data analysis apparatus, method, and program Active JP5775425B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011252583A JP5775425B2 (en) 2011-11-18 2011-11-18 Purchase data analysis apparatus, method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011252583A JP5775425B2 (en) 2011-11-18 2011-11-18 Purchase data analysis apparatus, method, and program

Publications (2)

Publication Number Publication Date
JP2013109470A JP2013109470A (en) 2013-06-06
JP5775425B2 true JP5775425B2 (en) 2015-09-09

Family

ID=48706180

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011252583A Active JP5775425B2 (en) 2011-11-18 2011-11-18 Purchase data analysis apparatus, method, and program

Country Status (1)

Country Link
JP (1) JP5775425B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107679946A (en) * 2017-09-28 2018-02-09 平安科技(深圳)有限公司 Fund Products Show method, apparatus, terminal device and storage medium

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5984150B2 (en) 2014-08-21 2016-09-06 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation Information processing apparatus, information processing method, and program
JP6443858B2 (en) 2014-11-20 2018-12-26 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation Calculation device, calculation method, learning device, learning method, and program

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006221329A (en) * 2005-02-09 2006-08-24 Toshiba Corp Behavior prediction device, behavior prediction method, and behavior prediction program
JP2007280047A (en) * 2006-04-06 2007-10-25 Fuji Xerox Co Ltd Method for evaluating merchandise information provision
JP2008282132A (en) * 2007-05-09 2008-11-20 Promise Co Ltd Electric commerce site management device and computer program
JP4839358B2 (en) * 2008-09-04 2011-12-21 日本電信電話株式会社 Purchase prediction method, purchase prediction apparatus, purchase prediction program, and recording medium

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107679946A (en) * 2017-09-28 2018-02-09 平安科技(深圳)有限公司 Fund Products Show method, apparatus, terminal device and storage medium
CN107679946B (en) * 2017-09-28 2021-09-10 平安科技(深圳)有限公司 Fund product recommendation method and device, terminal equipment and storage medium

Also Published As

Publication number Publication date
JP2013109470A (en) 2013-06-06

Similar Documents

Publication Publication Date Title
Jacobs et al. Model-based purchase predictions for large assortments
Jacobs et al. Product Recommendations Based on Latent Purchase Motivations
Sarstedt et al. Treating unobserved heterogeneity in PLS-SEM: A multi-method approach
Malsiner-Walli et al. Model-based clustering based on sparse finite Gaussian mixtures
Xiong et al. Temporal collaborative filtering with bayesian probabilistic tensor factorization
Gagliolo et al. Learning dynamic algorithm portfolios
Lemmens et al. Dynamics in the international market segmentation of new product growth
JP6414363B2 (en) Prediction system, method and program
KR101329904B1 (en) Multivariate data mixture model estimation device, mixture model estimation method, and computer-readable recording medium recording mixture model estimation program
Zhang et al. Prediction uncertainty in collaborative filtering: Enhancing personalized online product ranking
CN108665311B (en) Electric commercial user time-varying feature similarity calculation recommendation method based on deep neural network
Maldonado et al. Advanced conjoint analysis using feature selection via support vector machines
JP6311851B2 (en) Co-clustering system, method and program
Chen et al. Single-cell transcriptome data clustering via multinomial modeling and adaptive fuzzy k-means algorithm
Zhu et al. Portfolio management with robustness in both prediction and decision: A mixture model based learning approach
Burtini et al. Improving online marketing experiments with drifting multi-armed bandits
Bezáková et al. Graph model selection using maximum likelihood
JP5775425B2 (en) Purchase data analysis apparatus, method, and program
CN111861605A (en) Business object recommendation method
Liu et al. Diverse personalized recommendations with uncertainty from implicit preference data with the Bayesian Mallows model
Maldonado et al. Embedded heterogeneous feature selection for conjoint analysis: A SVM approach using L1 penalty
CN111209469A (en) Personalized recommendation method and device, computer equipment and storage medium
Nevo et al. Identifying a Minimal Class of Models for High--dimensional Data
JP5530394B2 (en) Purchase data analysis apparatus, method, and program
Linero et al. Multi-rubric models for ordinal spatial data with application to online ratings data

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140220

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20141007

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20141021

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141222

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150609

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150703

R150 Certificate of patent or registration of utility model

Ref document number: 5775425

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150