JP5860795B2 - 生存率推定装置、方法、及びプログラム - Google Patents

生存率推定装置、方法、及びプログラム Download PDF

Info

Publication number
JP5860795B2
JP5860795B2 JP2012244693A JP2012244693A JP5860795B2 JP 5860795 B2 JP5860795 B2 JP 5860795B2 JP 2012244693 A JP2012244693 A JP 2012244693A JP 2012244693 A JP2012244693 A JP 2012244693A JP 5860795 B2 JP5860795 B2 JP 5860795B2
Authority
JP
Japan
Prior art keywords
parameter
user
purchase
cluster
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012244693A
Other languages
English (en)
Other versions
JP2014093042A (ja
Inventor
翔一 長野
翔一 長野
裕介 市川
裕介 市川
典子 高屋
典子 高屋
内山 匡
匡 内山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2012244693A priority Critical patent/JP5860795B2/ja
Publication of JP2014093042A publication Critical patent/JP2014093042A/ja
Application granted granted Critical
Publication of JP5860795B2 publication Critical patent/JP5860795B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、生存率推定装置、方法、プログラムに係り、特に、店舗での購買履歴があるユーザの生存率を推定する生存率推定装置、方法、プログラムに関する。
EC(電子商取引)サイトのマーケティングにおいて、ユーザの生存確率(買い続けてくれる確率)を推定し、それを高めていくために商品ラインナップ、DMメール、値引き等の施策を打つことは重要である。
従来技術として、生存離脱に関する3仮説をもとに構築されたモデルから得られた観測データの尤度が最大となるパラメータを推定し、生存率を推定することが知られている(非特許文献1)。また、HBモデルが提案されている(例えば、非特許文献2)。HBモデルは、生存率分析のパラメータ推定にマーケティング変数を組み込むことで、ユーザ属性と潜在変数(購買サイクル、離脱のしやすさ)が線形の関係を有するとき、高い精度での推定が期待できる。
Counting your customers: Who are they and what will they do next?, D. C. Schmitteinほか, Marketing Science, Vol.33, No.1, pp.1--24, 1987. " Counting Your Customers" One by One: A Hierarchical Bayes Extension to the Pareto/NBD Model, M. Abe, Marketing Science, Vol.28, No.3, pp. 541--553, 2009.
しかしながら、HBモデルはユーザ全体の係数として推定を行うため、ユーザにより反応が異なるマーケティング変数、潜在変数と非線形な関係を有するマーケティング変数を扱うと推定精度が下がるという問題がある。
本発明では、上記問題点を解決するために成されたものであり、高精度にユーザの生存率を推定する生存率推定装置、方法、プログラムを提供することを目的とする。
上記目的を達成するために、第1の発明の生存率推定装置は、店舗での購買履歴があるユーザの生存率を推定する生存率推定装置であって、複数のユーザの各々について収集された、前記店舗での前記ユーザの購買に関する購買履歴を取得する履歴取得手段と、前記複数のユーザの各々について、前記ユーザの購買履歴に基づいて、前記ユーザの初回購買から最終購買までの購買期間、前記ユーザの初回購買から観測終了までの観測期間、及び前記ユーザに関する所定のマーケティング変数を求める前処理手段と、前記複数のユーザの各々について、前記ユーザの購買サイクルパラメータλと離脱パラメータμと前記ユーザの所属するクラスタとの初期値を設定する初期設定手段と、前記複数のユーザの各々について、前記前処理手段によって求められた前記ユーザの前記所定のマーケティング変数、前記ユーザの前記購買サイクルパラメータλの初期値又は前回決定された前記購買サイクルパラメータλ、前記ユーザの前記離脱パラメータμの初期値又は前回決定された前記離脱パラメータμ、及び前回決定された前記ユーザの所属するクラスタsegについて前回決定された、前記所定のマーケティング変数の各々に対する前記購買サイクルパラメータλ及び前記離脱パラメータμの各々の影響を示す係数からなる係数マトリクスβsegに基づいて、前記ユーザの購買サイクルパラメータλと、前記ユーザの離脱パラメータμとを決定するパラメータ決定手段と、前記複数のユーザの各々について、前記ユーザの前記購買サイクルパラメータλ及び前記離脱パラメータμに基づいて、前記ユーザの各クラスタ及び新規クラスタへの所属しやすさを示す値を算出し、前記算出した各クラスタ及び新規クラスタへの所属しやすさを示す値に基づいて、各クラスタ及び前記新規クラスタの中から、前記ユーザの所属するクラスタを決定するクラスタ決定手段と、各クラスタsegについて、前記クラスタに所属するユーザの前記購買サイクルパラメータλと前記離脱パラメータμとに基づいて、前記係数マトリクスβsegを推定する係数マトリクス推定手段と、予め定められた反復終了条件を満足するまで、前記パラメータ決定手段による決定、前記クラスタ決定手段による決定、及び前記係数マトリクス推定手段による推定を繰り返す反復判定手段と、前記複数のユーザ各々について、前記パラメータ決定手段によって繰り返し決定された前記ユーザの前記購買サイクルパラメータλの値の各々と前記離脱パラメータμの値の各々とに基づいて、前記ユーザの所定時間内の期待購買数を各々計算し、前記計算された前記ユーザの前記期待購買数に基づいて、前記ユーザの前記期待購買数を推定する期待購買数推定手段と、前記複数のユーザ各々について、前記パラメータ決定手段によって繰り返し決定された前記ユーザの前記購買サイクルパラメータλの値の各々及び前記離脱パラメータμの値の各々と、前記ユーザの前記購買期間と、前記ユーザの前記観測期間とに基づいて、前記ユーザの生存率を各々計算し、前記計算された前記ユーザの生存率に基づいて、前記ユーザの生存率を推定する生存率推定手段と、を含んで構成されている。
第2の発明の生存率推定方法は、履歴取得手段と、前処理手段と、初期設定手段と、パラメータ決定手段と、クラスタ決定手段と、係数マトリクス推定手段と、反復判定手段と、期待購買数推定手段と、生存率推定手段とを含み、店舗での購買履歴があるユーザの生存率を推定する生存率推定装置における生存率推定方法であって、前記履歴取得手段により、複数のユーザの各々について収集された、前記店舗での前記ユーザの購買に関する購買履歴を取得し、前記前処理手段により、前記複数のユーザの各々について、前記ユーザの購買履歴に基づいて、前記ユーザの初回購買から最終購買までの購買期間、前記ユーザの初回購買から観測終了までの観測期間、及び前記ユーザに関する所定のマーケティング変数を求め、前記初期設定手段により、前記複数のユーザの各々について、前記ユーザの購買サイクルパラメータλと離脱パラメータμと前記ユーザの所属するクラスタとの初期値を設定し、前記パラメータ決定手段により、前記複数のユーザの各々について、前記前処理手段によって求められた前記ユーザの前記所定のマーケティング変数、前記ユーザの前記購買サイクルパラメータλの初期値又は前回決定された前記購買サイクルパラメータλ、前記ユーザの前記離脱パラメータμの初期値又は前回決定された前記離脱パラメータμ、及び前回決定された前記ユーザの所属するクラスタsegについて前回決定された、前記所定のマーケティング変数の各々に対する前記購買サイクルパラメータλ及び前記離脱パラメータμの各々の影響を示す係数からなる係数マトリクスβsegに基づいて、前記ユーザの購買サイクルパラメータλと、前記ユーザの離脱パラメータμとを決定し、前記クラスタ決定手段により、前記複数のユーザの各々について、前記ユーザの前記購買サイクルパラメータλ及び前記離脱パラメータμに基づいて、前記ユーザの各クラスタ及び新規クラスタへの所属しやすさを示す値を算出し、前記算出した各クラスタ及び新規クラスタへの所属しやすさを示す値に基づいて、各クラスタ及び前記新規クラスタの中から、前記ユーザの所属するクラスタを決定し、前記係数マトリクス推定手段により、各クラスタsegについて、前記クラスタに所属するユーザの前記購買サイクルパラメータλと前記離脱パラメータμとに基づいて、前記係数マトリクスβsegを推定し、前記反復判定手段により、予め定められた反復終了条件を満足するまで、前記パラメータ決定手段による決定、前記クラスタ決定手段による決定、及び前記係数マトリクス推定手段による推定を繰り返し、前記期待購買数推定手段により、前記複数のユーザ各々について、前記パラメータ決定手段によって繰り返し決定された前記ユーザの前記購買サイクルパラメータλの値の各々と前記離脱パラメータμの値の各々とに基づいて、前記ユーザの所定時間内の期待購買数を各々計算し、前記計算された前記ユーザの前記期待購買数に基づいて、前記ユーザの前記期待購買数を推定し、前記生存率推定手段により、前記複数のユーザ各々について、前記パラメータ決定手段によって繰り返し決定された前記ユーザの前記購買サイクルパラメータλの値の各々及び前記離脱パラメータμの値の各々と、前記ユーザの前記購買期間と、前記ユーザの前記観測期間とに基づいて、前記ユーザの生存率を各々計算し、前記計算された前記ユーザの生存率に基づいて、前記ユーザの生存率を推定する。
このように、ユーザの所属するクラスタの、所定のマーケティング変数の各々に対する係数マトリクスに基づいて、各ユーザの購買サイクルパラメータλと各ユーザの離脱パラメータμとを決定し、各ユーザの所属するクラスタを決定し、各クラスタについて係数マトリクスを推定することを繰り返し、繰り返し決定したユーザの購買サイクルパラメータλと離脱パラメータμとに基づいてユーザの生存率を推定することにより、高精度にユーザの生存率を推定することができる。
また、第1の発明の生存率推定装置は、前記前処理手段は、前記複数のユーザの各々について、前記購買履歴に基づいて、前記ユーザによる購買のリピート数を求めるとともに、前記ユーザの前記購買期間、前記ユーザの前記観測期間、及び前記ユーザに関する所定のマーケティング変数を求め、前記パラメータ決定手段は、前記複数のユーザの各々について、前記購買サイクルパラメータλの初期値又は前回決定された前記購買サイクルパラメータλ、前記離脱パラメータμの初期値又は前回決定された前記離脱パラメータμ、前記購買期間、及び前記観測期間に基づいて前記ユーザが離脱していると判断される場合、前記購買サイクルパラメータλの初期値又は前回決定された購買サイクルパラメータλを用いて定められる、初回購買から離脱までの期間の確率分布を表す指数分布に従って、前記観測期間の値を決定する観測期間決定手段と、前記複数のユーザの各々について、予め定められた前記購買サイクルパラメータλの確率分布に従って、前記購買サイクルパラメータλの値の候補λtmpを決定するλパラメータ候補決定手段と、前記複数のユーザの各々について、前記購買サイクルパラメータλの確率分布と、前記離脱パラメータμ、前記観測期間決定手段によって決定された前記観測期間の値、前記リピート数、及び前記前処理手段によって求められた前記観測期間に基づいて計算される前記購買サイクルパラメータλの尤度と、前回決定された前記ユーザの所属するクラスタsegについて前回決定された前記係数マトリクスβsegに基づく前記購買サイクルパラメータλの事前分布とに基づいて、前記購買サイクルパラメータλの初期値又は前回決定された購買サイクルパラメータλ、及び前記λパラメータ候補決定手段によって決定された前記購買サイクルパラメータλの値の候補λtmpの何れか一方を採用するλパラメータ決定手段と、前記複数のユーザの各々について、予め定められた前記離脱パラメータμの確率分布に従って、前記離脱パラメータμの値の候補μtmpを決定するμパラメータ候補決定手段と、前記複数のユーザの各々について、前記離脱パラメータμの確率分布と、前記購買サイクルパラメータλ、前記観測期間決定手段によって決定された前記観測期間の値、前記リピート数、及び前記前処理手段によって求められた前記観測期間に基づいて計算される前記離脱パラメータμの尤度と、前回決定された前記ユーザの所属するクラスタsegについて前回決定された前記係数マトリクスβsegに基づく前記離脱パラメータμの事前分布とに基づいて、前記離脱パラメータμの初期値又は前回決定された離脱パラメータμ、及び前記μパラメータ候補決定手段によって決定された前記離脱パラメータμの値の候補μtmpの何れか一方を採用するμパラメータ決定手段とを含むことができる。
また、第1の発明の生存率推定装置は、
前記複数のユーザの各々について、前記λパラメータ決定手段によって繰り返し決定された前記ユーザの前記購買サイクルパラメータλの各々に基づいて、前記ユーザの前記購買サイクルパラメータλの値を計算するλパラメータ計算手段と、前記複数のユーザ各々について、前記μパラメータ決定手段によって繰り返し決定された前記ユーザの前記離脱パラメータμの値の各々に基づいて、前記ユーザの前記離脱パラメータμの値を計算するμパラメータ計算手段と、前記複数のユーザ各々について、前記クラスタ決定手段によって繰り返し決定された前記ユーザの前記所属するクラスタに対し、前記係数マトリクス推定手段によって繰り返し推定された前記クラスタの係数マトリクスβseg各々とに基づいて、前記ユーザの前記係数マトリクスを計算する係数マトリクス計算手段とを更に含むことができる。
また、第2の発明の生存率推定方法において、前記前処理手段によって求めることは、前記複数のユーザの各々について、前記購買履歴に基づいて、前記ユーザによる購買のリピート数を求めるとともに、前記ユーザの前記購買期間、前記ユーザの前記観測期間、及び前記ユーザに関する所定のマーケティング変数を求め、前記パラメータ決定手段によって求めることは、観測期間決定手段により、前記複数のユーザの各々について、前記購買サイクルパラメータλの初期値又は前回決定された前記購買サイクルパラメータλ、前記離脱パラメータμの初期値又は前回決定された前記離脱パラメータμ、前記購買期間、及び前記観測期間に基づいて前記ユーザが離脱していると判断される場合、前記購買サイクルパラメータλの初期値又は前回決定された購買サイクルパラメータλを用いて定められる、初回購買から離脱までの期間の確率分布を表す指数分布に従って、前記観測期間の値を決定し、λパラメータ候補決定手段により、前記複数のユーザの各々について、予め定められた前記購買サイクルパラメータλの確率分布に従って、前記購買サイクルパラメータλの値の候補λtmpを決定し、λパラメータ決定手段により、前記複数のユーザの各々について、前記購買サイクルパラメータλの確率分布と、前記離脱パラメータμ、前記観測期間決定手段によって決定された前記観測期間の値、前記リピート数、及び前記前処理手段によって求められた前記観測期間に基づいて計算される前記購買サイクルパラメータλの尤度と、前回決定された前記ユーザの所属するクラスタsegについて前回決定された前記係数マトリクスβsegに基づく前記購買サイクルパラメータλの事前分布とに基づいて、前記購買サイクルパラメータλの初期値又は前回決定された購買サイクルパラメータλ、及び前記λパラメータ候補決定手段によって決定された前記購買サイクルパラメータλの値の候補λtmpの何れか一方を採用し、μパラメータ候補決定手段により、前記複数のユーザの各々について、予め定められた前記離脱パラメータμの確率分布に従って、前記離脱パラメータμの値の候補μtmpを決定し、μパラメータ決定手段により、前記複数のユーザの各々について、前記離脱パラメータμの確率分布と、前記購買サイクルパラメータλ、前記観測期間決定手段によって決定された前記観測期間の値、前記リピート数、及び前記前処理手段によって求められた前記観測期間に基づいて計算される前記離脱パラメータμの尤度と、前回決定された前記ユーザの所属するクラスタsegについて前回決定された前記係数マトリクスβsegに基づく前記離脱パラメータμの事前分布とに基づいて、前記離脱パラメータμの初期値又は前回決定された離脱パラメータμ、及び前記μパラメータ候補決定手段によって決定された前記離脱パラメータμの値の候補μtmpの何れか一方を採用することができる。
また、第2の発明の生存率推定方法は、λパラメータ計算手段により、前記複数のユーザの各々について、前記λパラメータ決定手段によって繰り返し決定された前記ユーザの前記購買サイクルパラメータλの各々に基づいて、前記ユーザの前記購買サイクルパラメータλの値を計算し、μパラメータ計算手段により、前記複数のユーザ各々について、前記μパラメータ決定手段によって繰り返し決定された前記ユーザの前記離脱パラメータμの値の各々に基づいて、前記ユーザの前記離脱パラメータμの値を計算し、係数マトリクス計算手段により、前記複数のユーザ各々について、前記クラスタ決定手段によって繰り返し決定された前記ユーザの前記所属するクラスタに対し、前記係数マトリクス推定手段によって繰り返し推定された前記クラスタの係数マトリクスβseg各々とに基づいて、前記ユーザの前記係数マトリクスを計算することができる。
また、本発明のプログラムは、コンピュータを、上記の生存率推定装置又は生存率推定方法を構成する各手段として機能させるためのプログラムである。
以上説明したように、本発明の生存率推定装置、方法、及びプログラムによれば、ユーザの所属するクラスタの、所定のマーケティング変数の各々に対する係数マトリクスに基づいて、各ユーザの購買サイクルパラメータλと各ユーザの離脱パラメータμとを決定し、各ユーザの所属するクラスタを決定し、各クラスタについて係数マトリクスを推定することを繰り返し、繰り返し決定したユーザの購買サイクルパラメータλと離脱パラメータμとに基づいてユーザの生存率を推定することにより、高精度にユーザの生存率を推定することができる。
本実施の形態の生存率推定装置の機能的構成を示すブロック図である。 入力データを示す図である。 購買履歴からリピート購買数等を求める図である。 出力データを示す図である。 本実施の形態の生存率推定装置における生存率推定処理ルーチンの内容を示すフローチャートである。 本実施の形態の生存率推定装置におけるパラメータ及び係数マトリクス推定処理の内容を示すフローチャートである。 本実施の形態の生存率推定装置における各ユーザのパラメータ及び係数マトリクス計算処理の内容を示すフローチャートである。 ケースの例を示す図である。 HBモデルにおける係数マトリクスを推定するイメージ図である。 本実施の形態の生存率推定装置における係数マトリクスを推定するイメージ図である。
以下、図面を参照して本発明の実施の形態を詳細に説明する。
<システム構成>
図1に示すように、本発明の実施の形態に係る生存率推定装置100は、ユーザ端末1と、購買履歴保存装置4と、後述する生存率推定処理ルーチンを実行するコンピュータ10と、を備えている。
ユーザ端末1は、分析者(例えばマーケター、商品開発者)が利用する端末装置であり、例えば、パーソナルコンピュータやワークステーション、家庭用ゲーム機、インターネットTVや、PDA(Personal Digital Assistants)、携帯電話、PHS(Personal Handyphone System)などであり、携帯端末であってもよい。また、ユーザ端末1はネットワークを通じてコンピュータ10にアクセスする。
購買履歴保存装置4は、ネットワークを介してコンピュータ10に接続されている電子商取引用のウェブサーバそれぞれから、各ユーザの購買履歴を収集し、収集した購買履歴を、購買履歴蓄積部(図示省略)に格納する。例えば、収集した購買履歴を、購買サイトごと、ユーザごとに分類して購買履歴蓄積部に格納する。
ここで、購買履歴には、例えば、購買サイトの情報、当該購買サイトの購買日時、及びユーザIDが含まれる。
コンピュータ10は、CPU(Central Processing Unit)と、RAM(Random Access Memory)と、後述する生存率推定処理ルーチンを実行するためのプログラムを記憶したROM(Read Only Memory)とを備えたコンピュータで構成されている。このコンピュータは、機能的には、図2に示すように、条件入力部32、情報取得部34、前処理部36、パラメータ推定部38、クラスタ特定部40、統計値算出部42、及び表示部44を含んだ構成で表すことができる。なお、パラメータ推定部38がパラメータ決定手段の一例であり、クラスタ特定部がクラスタ決定手段及び係数マトリクス推定手段の一例であり、統計値算出部がλパラメータ計算手段、μパラメータ計算手段、係数マトリクス計算手段、期待購買数計算手段、及び生存率計算手段の一例である。
条件入力部32は、ユーザ端末1から、推定対象の生存率に関する条件情報の入力を受け付ける。条件情報において、例えば、少なくとも1人以上の推定対象ユーザ、推定対象サイト、推定対象期間、使用するマーケティング変数が指定される。本実施の形態では、推定対象サイトが1つ及び推定対象ユーザが複数指定される場合を例に説明する。
情報取得部34は、指定された推定対象ユーザの各々の購買履歴であって、推定対象サイトに関する購買履歴を購買履歴保存装置4から取得する。
前処理部36は、取得した購買履歴に基づいて、生存率推定処理の入力データとなるデータを生成する。生成されるデータには、図2に示すように、各推定対象ユーザについての、リピート購買の回数x、初回購買から最終購買までの期間t、初回購買から観測終了までの期間T、マーケティング変数Mnを求めたデータが含まれる。例えば、図3に示すように、user1の購買履歴から、リピート購買の回数x、初回購買から最終購買までの期間t、初回購買から観測終了までの期間Tが、前処理部36によって計算される。なお、本実施例では、リピート購買の回数xとして、リピート購買の日数xを用いる。
また、リピート購買の日数がリピート数の一例であり、初回購買から最終購買までの期間が購買期間の一例であり、初回購買から観測終了までの期間が、観測期間の一例である。
また、生成されるデータには、条件入力部32において指定された推定対象ユーザごとに求めた各種のマーケティング変数が含まれる。マーケティング変数の一例として、PV、特定ブランドの閲覧シェア、デモグラフィック情報などがあり、サービス提供者が任意に設定することができる。なお、すべて1となるダミー変数を設定してもよい。
パラメータ推定部38は、マルコフ連鎖モンテカルロ法(MCMC:Markovchain Monte Carlo methods)に従って、推定対象ユーザ毎の購買サイクルパラメータλ、及び離脱パラメータμを推定する。ここで、λ及びμは生存率を求めるためのユーザ毎のパラメータであり、λは、期間あたりの購買頻度を示し、μは離脱のしやすさを表す。
パラメータ推定処理では、購買サイクルパラメータλが大きいほど購買する間隔が長くなる傾向を示す。また、離脱パラメータμが大きいほど離脱する間隔が短くなる傾向を示す。
クラスタ特定部40は、CRP(Chinese restaurant process)に従って、推定対象ユーザ毎の所属するクラスタを決定する。また、各クラスタについて、所属ユーザのパラメータλ及びパラメータμを使用し、ベイズ回帰により係数マトリクスと分散値を更新する。なお、係数マトリクスと共分散Sを求める他の回帰式を適用してもよい。ここで、係数マトリクスの数値は、各マーケティング変数がパラメータλ、μに与える影響(係数)を表す。
パラメータ推定部38による推定処理、クラスタ特定部40によるクラスタ決定処理は、繰り返し終了条件を満足するまで、繰り返し行われる。
統計値算出部42は、推定対象ユーザ毎に、当該推定対象ユーザについて繰り返し推定されたパラメータλを用いて、その平均を取得し、当該推定対象ユーザのパラメータλの推定値とする。また、推定対象ユーザ毎に、当該推定対象ユーザについて推定されたパラメータμを用いて、その平均を取得し、当該推定対象ユーザのパラメータμの推定値とする。さらに、推定対象ユーザ毎に、当該推定対象ユーザについて繰り返し決定された所属するクラスタについて求められた係数マトリクスを平均し、当該推定対象ユーザの係数マトリクスを算出する。また、推定対象ユーザ毎に、当該推定対象ユーザについて繰り返し推定されたパラメータλ及びパラメータμに基づいて期待購買数及び生存率を算出する。なお、係数マトリクスは、ユーザ数だけ作成される。
表示部44は、図4に示すような統計値算出部42による算出結果を、条件入力を行ったユーザ端末1に送信する。ユーザ端末1は、受信したデータをモニタ(図示せず)に表示する。
<生存率推定システムの作用>
本実施の形態のコンピュータ10に、推定対象ユーザ、推定対象サイト、推定対象期間、及び使用する複数のマーケティング変数を含む条件情報がユーザ端末1により入力されると、コンピュータ10において、図5に示す、生存率推定処理ルーチンが実行される。
まず、ステップS100で、ユーザ端末1により入力された条件情報を取得する。そして、ステップS102において、上記ステップS100で取得した条件情報に含まれる各推定対象ユーザ及び推定対象サイトに関する購買履歴を、購買履歴保存装置4から取得する。
そして、ステップS104において、上記ステップS102で取得した購買履歴に基づいて、推定処理の入力データとして、各推定対象ユーザ及び推定対象サイトに関するリピート購買の日数x、初回購買から最終購買までの期間t、初回購買から観測終了までの期間T、及び複数のマーケティング変数を計算する。
次のステップS106では、上記ステップS104での計算結果を用いて、推定対象ユーザ毎のパラメータλ及びパラメータμを推定する。
ここで、ステップS106の処理は、図6に示す処理ルーチンによって実現される。
ステップS200において、すべての推定対象ユーザiに関して、パラメータλ、パラメータμ、及び所属クラスタSegの初期値を決定すると共に、各クラスタsegの係数マトリクスβseg、βnew、分散値Sの初期値を決定する。なお、クラスタSegの初期値は、ユーザ全員が異なるクラスタに所属する状態を初期状態とするように決定されることから、係数マトリクスβsegの初期値もユーザ数設定する必要がある。また、初期値は、サービス提供者が任意に設定すればよく、本実施の形態では、全ユーザiについてのλ及びμの初期値を0.5とする。
次のステップS202では、繰り返し回数を表す変数kを0に設定する。以下、毎サイクルλ及びμを発生させるが、kサイクル目のλをλ、kサイクル目のμをμと表す。すなわち、λ=0.5、μ=0.5となる。
そして、ステップS204では、kを1だけインクリメントする。ステップS206では、推定対象ユーザのうちの何れかを、計算対象のユーザiとして設定する。
ステップS208では、ステップS204において設定したユーザiのz及びyを求める。下記式(1)に後述するステップS214において前回求められたλi,k−1又はλi,0、後述するステップS220において前回求められたμi,k−1又はμi,0、上記ステップS104において求められたT、tを代入し算出した値が、0〜1の一様分布から発生させた値より大きい場合にはz=1とし、そうでない場合にはz=0とする。ここで、z=0の場合、ユーザiのλi,k−1を代入した下記(2)の指数分布式に基づいた乱数発生により発生した値をyとする。ただし、t<y<Tとする。


このように、購買サイクルパラメータλの初期値又は前回決定された購買サイクルバラメータλ、離脱パラメータμの初期値又は前回決定された離脱パラメータμ、購買期間、及び観測期間に基づいてユーザが離脱していると判断される場合(z=0)、購買サイクルパラメータλの初期値又は前回決定された購買サイクルパラメータλを用いて定められる、初回購買から離脱までの期間の確率分布を表す指数分布に従って、観測期間の値yを決定する。
ステップS210では、推定対象ユーザiについて、下記(3)式に示すような、λについて仮定した提案分布(対数正規分布)に基づいて、乱数を発生させ、購買サイクルパラメータλの値の候補λtmpとする。



ただし、パラメータD1、σ1はサービス提供者が任意に設定すればよい。なお、提案分布が対数正規分布である場合を例に説明したが、一様分布、正規分布など他の分布を適用しても良い。
そして、ステップS212では、上記ステップS104においてユーザiについて求められたリピート購買の日数x、期間T、上記ステップS208で求められたz、y、後述するステップS214において前回求められたλi,k−1又はステップS104において求められたλi,0、ステップS210において求められたλtmp、後述するステップS236において前回求められたβ、及びSに基づいて、下記(4)式に従って、αを求める。ただしk=1のときは下記(6)式を省く。
(if(k=1)
→ α = (Q(λi,k−1)/Q(λtmp))* (L(λtmp)/L(λi,k−1))
otherwise
→ α = (Q(λi,k−1)/Q(λtmp))* (L(λtmp)/L(λi,k−1))*(Prior(λtmp)/Prior(λi,k−1)))
・・・(4)

ただし、L(λ)は尤度式であり、下記(5)式で表される。なお、下記(5)式中のμはステップS220において前回求められたμi,k−1又は上記ステップS104において求められるμi,0の値を用いて計算を行う。


また、Prior(λ)は、事前分布であり、下記(6)式であらわされる。
ただし、dはステップS104で求めたユーザiのマーケティング変数からなるマーケティング変数行列1行n列(M1、M2、、、Mn)であり、β’は、2行n列係数行列であるβを転置したn行2列の行列であり、Sは分散値であり、βとSは、推定対象ユーザiについて前回決定された所属するクラスタSegのβとSを使用する。なお、上記(6)式中のμはステップS220において前回求められたμi,k−1又は上記ステップS104において求められるμi,0の値を用いて計算を行う。
そして、ステップS214において、0〜1の一様乱数Rを発生させ、R<αが成立していれば、λi,kとして、上記ステップS210において求めた候補λtmpを採用し、そうでなければλi,kとして、前回の値λi,k−1を採用し、λi,kの値をメモリに保存しておく。
次に、ステップS216において、推定対象ユーザiについて、下記(7)式に示すような、μについて仮定した提案分布(対数正規分布)に基づいて、乱数を発生させ、離脱パラメータμの値の候補μtmpとする。

ただし、パラメータD2、σ2はサービス提供者が任意に設定すればよい。なお、提案分布が対数正規分布である場合を例に説明したが、一様分布、正規分布など他の分布を適用しても良い。
そして、ステップS218では、上記ステップS104において求められたT、上記ステップS208で求められたz、y、後述するステップS220において前回求められたμi,k−1又は上記ステップS104において求められたμi,0、上記ステップS216において求められたμtmp、ステップS236において前回求められたβ、及びSに基づいて、下記(8)式に従って、αを求める。ただしk=1のときは下記(9)式を省く。
(if(k=1)
→ α = (Q(μi,k−1)/Q(μtmp))* (L(μtmp)/L(μi,k−1))
otherwise
→ α = (Q(μi,k−1)/Q(μtmp))* (L(μtmp)/L(μi,k−1))*(Prior(μtmp)/Prior(μi,k−1)))
・・・(8)

ただし、L(μ)は尤度式であり、上記(5)式で表される。なお、上記(5)式中のλとして、上記ステップ214で決定されたλを用いて計算を行う。
また、Prior(μ)は、事前分布であり、下記(9)式で表される。

ただし、dはステップS104で求めたユーザiのマーケティング変数からなるマーケティング変数行列1行n列(M1、M2、、、Mn)であり、β’は、2行n列係数行列であるβを転置したn行2列の行列であり、Sは分散値であり、βとSは推定対象ユーザiについて前回決定された所属するクラスタSegのβとSを使用する。なお、上記(9)式中のλとして、上記ステップ214で決定されたλを用いて計算を行う。
そして、ステップS220において、0〜1の一様乱数Rを発生させ、R<αが成立していれば、μi,kとして、ステップS216において求めた候補μtmpを採用し、そうでなければμi,kとして、前回の値μi,k−1を採用し、μi,kの値をメモリに保存しておく。
次のステップS222において、推定対象のすべてのユーザについて、上記ステップS206〜S220の処理を実行したか否かを判定する。上記ステップS206〜S220の処理を実行していないユーザが存在する場合には、上記ステップS206へ戻り、当該ユーザを、計算対象ユーザiとして設定する。一方、推定対象の全てのユーザについて上記ステップS206〜S220の処理を実行した場合には、推定対象の全ユーザについてのλi,k及びμi,kの値を推定したと判断し、ステップS224へ移行する。
ステップS224では、推定対象ユーザのうちの何れかを、計算対象のユーザpとして設定する。
ステップS226において、ステップS224において設定した計算対象ユーザpを、後述するステップS232で前回決定されたクラスタSegの所属から外す。これにより当該クラスタSegに所属するユーザが0人となった場合には、当該クラスタSegは消える。
次に、ステップS228において、上記ステップS214、S220で決定された購買サイクルパラメータλp,k、離脱パラメータμp,kに基づいて、計算対象ユーザpのクラスタSeg_cへの所属しやすさBE(p、c)を、下記(10)式に従って、算出する。

ただし、上記(10)式はCRP(Chinese restaurant process)によるユーザp所属決定式であり、P(p、c)の値は平均M共分散行列Sの二変量正規分布に(λp,k、μp,k)を代入した確率値を指す。また、Ncは、クラスタseg_cに所属するユーザ数であり、Nkは、クラスタseg_kに所属するユーザ数である。
次に、ステップS230において、全クラスタ及び新規クラスタとして形成されるクラスタの各々についてBE(p、c)を算出したか否かを判定する。BE(p、c)を算出していないクラスタがある場合にはステップS228に戻り、一方、全てのクラスタ及び新規クラスタについてBE(p、c)を算出している場合には、ステップS232へ移行する。
ステップS232において、計算対象ユーザpの所属クラスタSegをランダムサンプリングにより求める。例えば、BE(p、c)値の全クラスタ総和sumを求め、0からsumの一様分布から発生させた乱数randについて、0<=rand<BE(p、1)であればSeg_1へ、BE(p、1)<=rand<BE(p、1)+BE(p、2)であればSeg_2へ、と同様の分岐を繰り返し、所属クラスタSegを決定し、メモリに保存しておく。
次のステップS234において、計算対象のすべてのユーザについて、上記ステップS224〜S232の処理を実行したか否かを判定する。上記ステップS224〜S232の処理を実行していないユーザが存在する場合には、上記ステップS224へ戻り、当該ユーザを、計算対象ユーザpとして設定する。一方、計算対象の全てのユーザについて上記ステップS224〜S232の処理を実行した場合には、計算対象の全ユーザについての所属クラスタSegを推定したと判断し、ステップS236へ移行する。
ステップS236において、クラスタ毎に、当該クラスタsegに所属する全ユーザのλ、μを使用し、ベイズ回帰によりβseg(n行2列)、S(2行2列)を更新しメモリに保存する。なお、係数マトリクスβと共分散Sを求める他の回帰式を適用しても良い。
次のステップS238では、繰り返し回数kが、予め定められた上限回数(本実施例では14000とする)より大きくなったか否かを判定し、k>14000であれば、図5のステップS108へ移行し、そうでなければ、上記ステップS204へ戻る。ただし、14000という数値はサービス提供者が設定すれば良い。
図5のステップS108では、各ユーザのパラメータλ、μ及び係数マトリクスを計算する。ここで、ステップS108の処理は、図7に示す処理ルーチンによって実現される。
ステップS300において、推定対象ユーザのうちの何れかを、計算対象のユーザqとして設定する。
次に、ステップS302において、ステップS300において設定されたユーザqについて上記ステップS106において繰り返し推定されたλq,k(4000<k<14000)に基づいて、その平均値を、ユーザqの購買サイクルパラメータλuserとして算出する。また、同様に、ユーザqについて上記ステップS106において推定されたμq,k(4000<k<14000)に基づいて、その平均値を、ユーザqの離脱パラメータμuserとして算出する。
次に、ステップS304において、上記の繰り返しk(4000<k<14000)毎に、ユーザqについて上記ステップS232において決定された所属クラスタSegに対して上記ステップS106において推定されたβk,seg及びに基づいて、その平均値を、ユーザqの係数マトリクスβq,userとして算出する。
次にステップS306において、上記の繰り返しk(4000<k<14000)毎に、ユーザqについて上記ステップS106において推定されたλq,k及びμq,kに基づいて、下記(11)式に従って、ユーザqの指定期間xにおける期待購買数を各々計算し、期待購買数の平均値を、ユーザpの期待購買数expとして計算する。


ただし、xは指定期間を表し、サービス提供者により設定される。
次にステップS308において、上記の繰り返しk(4000<k<14000)毎に、ユーザqについて上記ステップS106において推定されたλq,k及びμq,kと、上記ステップS104で計算されたユーザpの期間t及び期間Tとに基づいて、下記(12)式に従って、ユーザqの生存率を各々計算し、生存率の平均値を、ユーザpの生存率s_rateとして計算する。

次のステップS310において、対象のすべてのユーザについて、上記ステップS300〜S308の処理を実行したか否かを判定する。上記ステップS300〜S308の処理を実行していないユーザが存在する場合には、上記ステップS300へ戻り、当該ユーザを、対象ユーザqとして設定する。一方、対象の全てのユーザについて上記ステップS300〜S308の処理を実行した場合には、対象の全ユーザについてのパラメータλ、パラメータμ、期待購買数、生存率、係数マトリクスを推定したと判断し、図5のステップS110へ移行する。
図5のステップS110では、上記ステップS108で推定された結果を、条件情報を入力したユーザ端末1に送信し、当該ユーザ端末1により、出力され、生存率推定処理ルーチンを終了する。
以上、説明したように、本発明の実施の形態に係る生存率推定装置によれば、ユーザの所属するクラスタの、所定のマーケティング変数の各々に対する係数マトリクスに基づいて、各ユーザの購買サイクルパラメータλと各ユーザの離脱パラメータμとを決定し、各ユーザの所属するクラスタを決定し、各クラスタについて係数マトリクスを推定することを繰り返し、繰り返し決定したユーザの購買サイクルパラメータλと離脱パラメータμとに基づいてユーザの生存率を推定することにより、高精度にユーザの生存率を推定することができる。
また、HBモデルをベースとし、各顧客を代表とした顧客クラスタを作成し、クラスタごとに線形なマーケティング変数を扱うため、顧客により反応が異なるマーケティング変数、潜在変数と非線形な関係を有するマーケティング変数を扱うことで、高精度に生存率を推定することができる。
また、HBモデルにおける係数マトリクスの更新の前処理としてCRPクラスタリング(Chinese restaurant process)を行い、毎MCMCステップで所属していたクラスタの係数を推定することから、複数の線形関係を有するケースにおいても自動的に線形関係の数を推定し、生存率推定の精度を向上させることができる。
また、サンプリング手法(MCMC法)の1ステップとして顧客集合(クラスタ)の推定と係数マトリクス作成を行うことから、生存率推定、クラス分類、係数推定を別個に行う場合と異なり、以下の式に示すように、異なる尤度関数をもつことはなく、それぞれの誤差が別個に扱われないため、正確な誤差を算出、検定することができる。

また、既存の手法(HBモデル)では生存率を求めるための2つの潜在パラメータ(λ、μ)とマーケティング変数の関係を1つの線形モデルで定義しているが、本発明では両者を複数の線形モデルにより定義しているため、図8に示すような単一の線形モデルで定義しにくいケースでも高い精度で生存率を推定できる。このようなケースでは、定義された複数の線形モデルがどの要素に支配的であるかを特定する必要があるが、本発明では混合ディレクレ過程により、各要素が複数の線形モデルに確率的に所属することを許容することで、問題を解決している。
また、既存の手法(HBモデル)は、図9に示すようにMCMCプロセスにおいて(λμ)事前分布として組み込むことで以下の式に示すように、ユーザ全体に対する係数マトリクスを推定している。


一方、本発明では、図10に示すように顧客集合毎に支配的な複数の係数の存在が存在し、各顧客が複数の集合に確率的に所属していることを仮定している。
また、本発明は、上記実施の形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。
また、上述の生存率推定装置100は、内部にコンピュータシステムを有しているが、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、本願明細書中において、プログラムが予めインストールされている実施形態として説明したが、当該プログラムを、コンピュータ読み取り可能な記録媒体に格納して提供することも可能であるし、ネットワークを介して提供することも可能である。また、本実施の形態の生存率推定装置100の各部をハードウエアにより構成してもよい。また、購買履歴が記憶されるデータベースとしては、ハードディスク装置やファイルサーバ等に例示される記憶手段によって実現可能であり、生存率推定装置100内部にデータベースを設けても良いし、外部装置に設けてもよい。
1 ユーザ端末
4 購買履歴保存装置
10 コンピュータ
32 条件入力部
34 情報取得部
36 前処理部
38 パラメータ推定部
40 クラスタ特定部
42 統計値算出部
44 表示部
100 生存率推定装置

Claims (7)

  1. 店舗での購買履歴があるユーザの生存率を推定する生存率推定装置であって、
    複数のユーザの各々について収集された、前記店舗での前記ユーザの購買に関する購買履歴を取得する履歴取得手段と、
    前記複数のユーザの各々について、前記ユーザの購買履歴に基づいて、前記ユーザの初回購買から最終購買までの購買期間、前記ユーザの初回購買から観測終了までの観測期間、及び前記ユーザに関する所定のマーケティング変数を求める前処理手段と、
    前記複数のユーザの各々について、前記ユーザの購買サイクルパラメータλと離脱パラメータμと前記ユーザの所属するクラスタとの初期値を設定する初期設定手段と、
    前記複数のユーザの各々について、前記前処理手段によって求められた前記ユーザの前記所定のマーケティング変数、前記ユーザの前記購買サイクルパラメータλの初期値又は前回決定された前記購買サイクルパラメータλ、前記ユーザの前記離脱パラメータμの初期値又は前回決定された前記離脱パラメータμ、及び前回決定された前記ユーザの所属するクラスタsegについて前回決定された、前記所定のマーケティング変数の各々に対する前記購買サイクルパラメータλ及び前記離脱パラメータμの各々の影響を示す係数からなる係数マトリクスβsegに基づいて、前記ユーザの購買サイクルパラメータλと、前記ユーザの離脱パラメータμとを決定するパラメータ決定手段と、
    前記複数のユーザの各々について、前記ユーザの前記購買サイクルパラメータλ及び前記離脱パラメータμに基づいて、前記ユーザの各クラスタ及び新規クラスタへの所属しやすさを示す値を算出し、前記算出した各クラスタ及び新規クラスタへの所属しやすさを示す値に基づいて、各クラスタ及び前記新規クラスタの中から、前記ユーザの所属するクラスタを決定するクラスタ決定手段と、
    各クラスタsegについて、前記クラスタに所属するユーザの前記購買サイクルパラメータλと前記離脱パラメータμとに基づいて、前記係数マトリクスβsegを推定する係数マトリクス推定手段と、
    予め定められた反復終了条件を満足するまで、前記パラメータ決定手段による決定、前記クラスタ決定手段による決定、及び前記係数マトリクス推定手段による推定を繰り返す反復判定手段と、
    前記複数のユーザ各々について、前記パラメータ決定手段によって繰り返し決定された前記ユーザの前記購買サイクルパラメータλの値の各々と前記離脱パラメータμの値の各々とに基づいて、前記ユーザの所定時間内の期待購買数を各々計算し、前記計算された前記ユーザの前記期待購買数に基づいて、前記ユーザの前記期待購買数を推定する期待購買数推定手段と、
    前記複数のユーザ各々について、前記パラメータ決定手段によって繰り返し決定された前記ユーザの前記購買サイクルパラメータλの値の各々及び前記離脱パラメータμの値の各々と、前記ユーザの前記購買期間と、前記ユーザの前記観測期間とに基づいて、前記ユーザの生存率を各々計算し、前記計算された前記ユーザの生存率に基づいて、前記ユーザの生存率を推定する生存率推定手段と、
    を含む生存率推定装置。
  2. 前記前処理手段は、前記複数のユーザの各々について、前記購買履歴に基づいて、前記ユーザによる購買のリピート数を求めるとともに、前記ユーザの前記購買期間、前記ユーザの前記観測期間、及び前記ユーザに関する所定のマーケティング変数を求め、
    前記パラメータ決定手段は、
    前記複数のユーザの各々について、前記購買サイクルパラメータλの初期値又は前回決定された前記購買サイクルパラメータλ、前記離脱パラメータμの初期値又は前回決定された前記離脱パラメータμ、前記購買期間、及び前記観測期間に基づいて前記ユーザが離脱していると判断される場合、前記購買サイクルパラメータλの初期値又は前回決定された購買サイクルパラメータλを用いて定められる、初回購買から離脱までの期間の確率分布を表す指数分布に従って、前記観測期間の値を決定する観測期間決定手段と、
    前記複数のユーザの各々について、予め定められた前記購買サイクルパラメータλの確率分布に従って、前記購買サイクルパラメータλの値の候補λtmpを決定するλパラメータ候補決定手段と、
    前記複数のユーザの各々について、前記購買サイクルパラメータλの確率分布と、前記離脱パラメータμ、前記観測期間決定手段によって決定された前記観測期間の値、前記リピート数、及び前記前処理手段によって求められた前記観測期間に基づいて計算される前記購買サイクルパラメータλの尤度と、前回決定された前記ユーザの所属するクラスタsegについて前回決定された前記係数マトリクスβsegに基づく前記購買サイクルパラメータλの事前分布とに基づいて、前記購買サイクルパラメータλの初期値又は前回決定された購買サイクルパラメータλ、及び前記λパラメータ候補決定手段によって決定された前記購買サイクルパラメータλの値の候補λtmpの何れか一方を採用するλパラメータ決定手段と、
    前記複数のユーザの各々について、予め定められた前記離脱パラメータμの確率分布に従って、前記離脱パラメータμの値の候補μtmpを決定するμパラメータ候補決定手段と、
    前記複数のユーザの各々について、前記離脱パラメータμの確率分布と、前記購買サイクルパラメータλ、前記観測期間決定手段によって決定された前記観測期間の値、前記リピート数、及び前記前処理手段によって求められた前記観測期間に基づいて計算される前記離脱パラメータμの尤度と、前回決定された前記ユーザの所属するクラスタsegについて前回決定された前記係数マトリクスβsegに基づく前記離脱パラメータμの事前分布とに基づいて、前記離脱パラメータμの初期値又は前回決定された離脱パラメータμ、及び前記μパラメータ候補決定手段によって決定された前記離脱パラメータμの値の候補μtmpの何れか一方を採用するμパラメータ決定手段と、
    を含む請求項1の生存率推定装置。
  3. 前記複数のユーザの各々について、前記λパラメータ決定手段によって繰り返し決定された前記ユーザの前記購買サイクルパラメータλの各々に基づいて、前記ユーザの前記購買サイクルパラメータλの値を計算するλパラメータ計算手段と、
    前記複数のユーザ各々について、前記μパラメータ決定手段によって繰り返し決定された前記ユーザの前記離脱パラメータμの値の各々に基づいて、前記ユーザの前記離脱パラメータμの値を計算するμパラメータ計算手段と、
    前記複数のユーザ各々について、前記クラスタ決定手段によって繰り返し決定された前記ユーザの前記所属するクラスタに対し、前記係数マトリクス推定手段によって繰り返し推定された前記クラスタの係数マトリクスβseg各々とに基づいて、前記ユーザの前記係数マトリクスを計算する係数マトリクス計算手段とを更に含む請求項1又は2記載の生存率推定装置。
  4. 履歴取得手段と、前処理手段と、初期設定手段と、パラメータ決定手段と、クラスタ決定手段と、係数マトリクス推定手段と、反復判定手段と、期待購買数推定手段と、生存率推定手段とを含み、店舗での購買履歴があるユーザの生存率を推定する生存率推定装置における生存率推定方法であって、
    前記履歴取得手段により、複数のユーザの各々について収集された、前記店舗での前記ユーザの購買に関する購買履歴を取得し、
    前記前処理手段により、前記複数のユーザの各々について、前記ユーザの購買履歴に基づいて、前記ユーザの初回購買から最終購買までの購買期間、前記ユーザの初回購買から観測終了までの観測期間、及び前記ユーザに関する所定のマーケティング変数を求め、
    前記初期設定手段により、前記複数のユーザの各々について、前記ユーザの購買サイクルパラメータλと離脱パラメータμと前記ユーザの所属するクラスタとの初期値を設定し、
    前記パラメータ決定手段により、前記複数のユーザの各々について、前記前処理手段によって求められた前記ユーザの前記所定のマーケティング変数、前記ユーザの前記購買サイクルパラメータλの初期値又は前回決定された前記購買サイクルパラメータλ、前記ユーザの前記離脱パラメータμの初期値又は前回決定された前記離脱パラメータμ、及び前回決定された前記ユーザの所属するクラスタsegについて前回決定された、前記所定のマーケティング変数の各々に対する前記購買サイクルパラメータλ及び前記離脱パラメータμの各々の影響を示す係数からなる係数マトリクスβsegに基づいて、前記ユーザの購買サイクルパラメータλと、前記ユーザの離脱パラメータμとを決定し、
    前記クラスタ決定手段により、前記複数のユーザの各々について、前記ユーザの前記購買サイクルパラメータλ及び前記離脱パラメータμに基づいて、前記ユーザの各クラスタ及び新規クラスタへの所属しやすさを示す値を算出し、前記算出した各クラスタ及び新規クラスタへの所属しやすさを示す値に基づいて、各クラスタ及び前記新規クラスタの中から、前記ユーザの所属するクラスタを決定し、
    前記係数マトリクス推定手段により、各クラスタsegについて、前記クラスタに所属するユーザの前記購買サイクルパラメータλと前記離脱パラメータμとに基づいて、前記係数マトリクスβsegを推定し、
    前記反復判定手段により、予め定められた反復終了条件を満足するまで、前記パラメータ決定手段による決定、前記クラスタ決定手段による決定、及び前記係数マトリクス推定手段による推定を繰り返し、
    前記期待購買数推定手段により、前記複数のユーザ各々について、前記パラメータ決定手段によって繰り返し決定された前記ユーザの前記購買サイクルパラメータλの値の各々と前記離脱パラメータμの値の各々とに基づいて、前記ユーザの所定時間内の期待購買数を各々計算し、前記計算された前記ユーザの前記期待購買数に基づいて、前記ユーザの前記期待購買数を推定し、
    前記生存率推定手段により、前記複数のユーザ各々について、前記パラメータ決定手段によって繰り返し決定された前記ユーザの前記購買サイクルパラメータλの値の各々及び前記離脱パラメータμの値の各々と、前記ユーザの前記購買期間と、前記ユーザの前記観測期間とに基づいて、前記ユーザの生存率を各々計算し、前記計算された前記ユーザの生存率に基づいて、前記ユーザの生存率を推定する
    生存率推定方法。
  5. 前記前処理手段によって求めることは、前記複数のユーザの各々について、前記購買履歴に基づいて、前記ユーザによる購買のリピート数を求めるとともに、前記ユーザの前記購買期間、前記ユーザの前記観測期間、及び前記ユーザに関する所定のマーケティング変数を求め、
    前記パラメータ決定手段によって求めることは、
    観測期間決定手段により、前記複数のユーザの各々について、前記購買サイクルパラメータλの初期値又は前回決定された前記購買サイクルパラメータλ、前記離脱パラメータμの初期値又は前回決定された前記離脱パラメータμ、前記購買期間、及び前記観測期間に基づいて前記ユーザが離脱していると判断される場合、前記購買サイクルパラメータλの初期値又は前回決定された購買サイクルパラメータλを用いて定められる、初回購買から離脱までの期間の確率分布を表す指数分布に従って、前記観測期間の値を決定し、
    λパラメータ候補決定手段により、前記複数のユーザの各々について、予め定められた前記購買サイクルパラメータλの確率分布に従って、前記購買サイクルパラメータλの値の候補λtmpを決定し、
    λパラメータ決定手段により、前記複数のユーザの各々について、前記購買サイクルパラメータλの確率分布と、前記離脱パラメータμ、前記観測期間決定手段によって決定された前記観測期間の値、前記リピート数、及び前記前処理手段によって求められた前記観測期間に基づいて計算される前記購買サイクルパラメータλの尤度と、前回決定された前記ユーザの所属するクラスタsegについて前回決定された前記係数マトリクスβsegに基づく前記購買サイクルパラメータλの事前分布とに基づいて、前記購買サイクルパラメータλの初期値又は前回決定された購買サイクルパラメータλ、及び前記λパラメータ候補決定手段によって決定された前記購買サイクルパラメータλの値の候補λtmpの何れか一方を採用し、
    μパラメータ候補決定手段により、前記複数のユーザの各々について、予め定められた前記離脱パラメータμの確率分布に従って、前記離脱パラメータμの値の候補μtmpを決定し、
    μパラメータ決定手段により、前記複数のユーザの各々について、前記離脱パラメータμの確率分布と、前記購買サイクルパラメータλ、前記観測期間決定手段によって決定された前記観測期間の値、前記リピート数、及び前記前処理手段によって求められた前記観測期間に基づいて計算される前記離脱パラメータμの尤度と、前回決定された前記ユーザの所属するクラスタsegについて前回決定された前記係数マトリクスβsegに基づく前記離脱パラメータμの事前分布とに基づいて、前記離脱パラメータμの初期値又は前回決定された離脱パラメータμ、及び前記μパラメータ候補決定手段によって決定された前記離脱パラメータμの値の候補μtmpの何れか一方を採用する
    請求項4の生存率推定方法。
  6. λパラメータ計算手段により、前記複数のユーザの各々について、前記λパラメータ決定手段によって繰り返し決定された前記ユーザの前記購買サイクルパラメータλの各々に基づいて、前記ユーザの前記購買サイクルパラメータλの値を計算し、
    μパラメータ計算手段により、前記複数のユーザ各々について、前記μパラメータ決定手段によって繰り返し決定された前記ユーザの前記離脱パラメータμの値の各々に基づいて、前記ユーザの前記離脱パラメータμの値を計算し、
    係数マトリクス計算手段により、前記複数のユーザ各々について、前記クラスタ決定手段によって繰り返し決定された前記ユーザの前記所属するクラスタに対し、前記係数マトリクス推定手段によって繰り返し推定された前記クラスタの係数マトリクスβseg各々とに基づいて、前記ユーザの前記係数マトリクスを計算することを更に含む請求項5又は6記載の生存率推定方法。
  7. コンピュータを、請求項1〜3の何れか1項記載の生存率推定装置を構成する各手段として機能させるためのプログラム。
JP2012244693A 2012-11-06 2012-11-06 生存率推定装置、方法、及びプログラム Expired - Fee Related JP5860795B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012244693A JP5860795B2 (ja) 2012-11-06 2012-11-06 生存率推定装置、方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012244693A JP5860795B2 (ja) 2012-11-06 2012-11-06 生存率推定装置、方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2014093042A JP2014093042A (ja) 2014-05-19
JP5860795B2 true JP5860795B2 (ja) 2016-02-16

Family

ID=50937047

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012244693A Expired - Fee Related JP5860795B2 (ja) 2012-11-06 2012-11-06 生存率推定装置、方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP5860795B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6315698B2 (ja) * 2014-10-29 2018-04-25 日本電信電話株式会社 指標値算出装置、指標値算出方法、及びプログラム
JP6302828B2 (ja) * 2014-12-03 2018-03-28 日本電信電話株式会社 異常抽出装置、方法、及びプログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010055320A (ja) * 2008-08-27 2010-03-11 Shogyo Kaihatsu Kenkyusho:Kk 購買管理予測装置及びその方法
JP4839358B2 (ja) * 2008-09-04 2011-12-21 日本電信電話株式会社 購入予測方法、購入予測装置、購入予測プログラム、および、記録媒体
JP2011138194A (ja) * 2009-12-25 2011-07-14 Sony Corp 情報処理装置、情報処理方法およびプログラム

Also Published As

Publication number Publication date
JP2014093042A (ja) 2014-05-19

Similar Documents

Publication Publication Date Title
Shmueli et al. Predictive model assessment in PLS-SEM: guidelines for using PLSpredict
Talagala et al. Meta-learning how to forecast time series
US10628435B2 (en) Extracting seasonal, level, and spike components from a time series of metrics data
Groen et al. Methods for global sensitivity analysis in life cycle assessment
US10417650B1 (en) Distributed and automated system for predicting customer lifetime value
McMahan et al. Ad click prediction: a view from the trenches
Smith et al. Estimation of copula models with discrete margins via Bayesian data augmentation
CN108305094B (zh) 一种用户行为预测方法及装置,电子设备
Kim et al. Analysis of directional dependence using asymmetric copula-based regression models
US8954910B1 (en) Device mismatch contribution computation with nonlinear effects
Ciavolino et al. Comparing generalised maximum entropy and partial least squares methods for structural equation models
Dharmasena et al. A new process capability index for multiple quality characteristics based on principal components
Tyralis et al. On the prediction of persistent processes using the output of deterministic models
JP2023043703A (ja) データ解析装置、方法およびプログラム
JP5745388B2 (ja) コンテンツ推薦装置及び方法及びプログラム
Matilainen et al. Employing a Monte Carlo algorithm in expectation maximization restricted maximum likelihood estimation of the linear mixed model
Jones et al. Improved probabilistic prediction of healthcare performance indicators using bidirectional smoothing models
JP5860795B2 (ja) 生存率推定装置、方法、及びプログラム
Tan Monotonic quantile regression with Bernstein polynomials for stochastic simulation
Strickland et al. Parameterisation and efficient MCMC estimation of non-Gaussian state space models
Williams Building hydrologic foundations for applications of ELOHA: How long a record should you have?
CN112183875A (zh) 一种基于用户和产品层面的多因子在线购买行为转化预测方法
Pousi et al. Simulation metamodelling with Bayesian networks
De Neve et al. Goodness-of-fit methods for probabilistic index models
Singham et al. Density estimation of simulation output using exponential epi-splines

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150205

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20151125

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151208

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20151221

R150 Certificate of patent or registration of utility model

Ref document number: 5860795

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees