JP5860828B2 - 行動確率推定装置、方法、及びプログラム - Google Patents

行動確率推定装置、方法、及びプログラム Download PDF

Info

Publication number
JP5860828B2
JP5860828B2 JP2013043507A JP2013043507A JP5860828B2 JP 5860828 B2 JP5860828 B2 JP 5860828B2 JP 2013043507 A JP2013043507 A JP 2013043507A JP 2013043507 A JP2013043507 A JP 2013043507A JP 5860828 B2 JP5860828 B2 JP 5860828B2
Authority
JP
Japan
Prior art keywords
topic
item
probability
attribute
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2013043507A
Other languages
English (en)
Other versions
JP2014174567A (ja
Inventor
健司 江崎
健司 江崎
勝彦 石黒
勝彦 石黒
典子 高屋
典子 高屋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2013043507A priority Critical patent/JP5860828B2/ja
Publication of JP2014174567A publication Critical patent/JP2014174567A/ja
Application granted granted Critical
Publication of JP5860828B2 publication Critical patent/JP5860828B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、行動確率推定装置、方法、及びプログラムに係り、特にユーザがアイテムについて閲覧行動又は購買行動をとる確率を推定する行動確率推定装置、方法、及びプログラムに関する。
近年、実店舗に加えてEC(electronic commerce)サイトでも出店する企業が増えてきている。そのためECサイトの市場規模は増大し、ECサイトでの売り上げを向上する事が必要である。
ECサイトでの売り上げを向上するためには、顧客ごとのECサイトの閲覧予測、及び購買する商品の予測をしたうえで、その商品をレコメンデーションすること、また顧客のプロファイルを把握し適切な商品の仕入れを行うことが重要になる。
閲覧(または購買)を予測する方法として、エントロピー最大化モデルや潜在トピックモデルほか多くの手法がある(例えば、非特許文献1、2)。その中でもエントロピー最大化モデルや、潜在トピックモデルなどは、閲覧予測のために獲得したモデルからユーザの傾向や特徴の分析を行うことができる。
エントロピー最大化モデルは、特徴量の係数が大きいものが閲覧の要因であるとする。一方、潜在トピックモデルではユーザと商品が帰属する潜在トピック中に共通する要因を見つけ出す。そして、それらの要因を閲覧者のユーザプロファイルとすることで、閲覧者が閲覧するであろう商品の開発のための知見を得ることができる。また潜在トピックモデルの一例としては、LDA(Latent Dirchlet Allocation)がある(例えば、非特許文献3、4)。
岩田具治ほか3名、「購買行動解析のためのトピック追跡モデル」、電子情報通信学会誌D Vol.J93-D No.6 、2010年、p.978-987 朝野煕彦、「最新マーケティングサイエンスの基礎」、講談社 、2010年、p96-108 David M. Blei, Andrew Y. Ng, Michael I. Jordan,「Latent Dirichlet Allocation」,Journal of Machine Learning Research 3 、2003、p.993-1022. 北島 理沙, 小林 一郎、「文書上の事象に基づいた潜在的トピック推定」2011年度人工知能学会全国大会、2011-5-27
しかし、従来技術では、ECサイト上のショップを訪問しないと商品を閲覧することができない、又は事前に欲しいカテゴリが決まっているなど、閲覧する商品が事前に絞り込まれるプロセスを考慮していない。
本発明は、上記問題を解決するためになされたもので、ユーザがアイテムについて閲覧行動又は購買行動をとる確率を精度よく推定することができる行動確率推定装置、方法、及びプログラムを提供することを目的とする。
上記目的を達成するために、第1の発明に係る行動確率推定装置は、複数のユーザdの各々について、各アイテムvに対して購買行動及び閲覧行動の何れか一方である行動をとる確率を推定する行動確率推定装置であって、前記複数のユーザdの各々について前記行動をとったアイテムvの前記行動毎の履歴、及び前記複数のユーザdの各々について前記行動をとったアイテムの属性sの前記行動毎の履歴を示すアイテム情報に基づいて、前記ユーザdの各々について、前記ユーザdがi番目に前記行動を取ったアイテムが属するトピックが、予め定められたK個のトピックkの何れであるかを示す変数zd,iを初期化する初期化手段と、(k、s、v)の全ての組み合わせについて、前記アイテム情報と前記変数zd,iとに基づいて、前記トピックkに属し、かつ前記属性sに属す前記アイテムvに対する前記行動の総数を表すアイテム統計量Nk,s,vを算出するアイテム統計量算出手段と、(k、s)の全ての組み合わせについて、前記アイテム情報と前記変数zd,iとに基づいて、前記トピックk及び前記属性sに関する前記行動の総数を表す属性統計量Lk,sを算出する属性統計量算出手段と、(d、k)の全ての組み合わせについて、前記変数zd,iに基づいて、前記トピックkに関する前記ユーザdの前記行動の総数を表すトピック統計量Md,kを算出するトピック統計量算出手段と、(d、i)の全ての組み合わせについて、前記トピックkの各々について、前記トピックk、及び前記ユーザdがi番目に前記行動をとったアイテムの前記属性sに関する前記アイテム統計量Nk,s,vの各々と、前記トピックkに関する前記属性統計量Lk,sの各々と、前記ユーザdに関する前記トピック統計量Md,kの各々とに基づいて、前記ユーザdがi番目に前記行動をとったアイテムのトピックを表わす前記変数zd,iが前記トピックkである確率を算出し、前記トピックkの各々について算出した前記確率に従って、前記変数zd,iの値をサンプリングにより更新するトピック算出手段と、繰り返し終了条件を満足するまで、前記アイテム統計量算出手段による算出、前記属性統計量算出手段による算出、前記トピック統計量算出手段による算出、及び前記トピック算出手段による更新を繰り返す反復判定手段と、前記複数のユーザdの各々に対し、前記ユーザd及び各トピックkについて算出された前記トピック統計量Md,kの各々に基づくディリクレ分布に従って、前記ユーザdが各トピックkに属する確率を表すθd,kをサンプリングにより各々算出するユーザ・トピック混合確率算出手段と、(k、s)の全ての組み合わせに対し、前記トピックk、前記属性s、及び各アイテムvについて算出された前記アイテム統計量Nk,s,vの各々に基づくディリクレ分布に従って、前記トピックkにおいて前記属性sの各アイテムvが選択される確率を表すβk,s,vをサンプリングにより各々算出するトピック・アイテム混合確率算出手段と、
前記K個のトピックkの各々に対し、前記トピックk及び各属性sについて算出された前記属性統計量Lk,sの各々に基づくディリクレ分布に従って、前記トピックkにおいて前記属性sが選択される確率を表すψk,sをサンプリングにより各々算出するトピック・属性混合確率算出手段と、前記複数のユーザdの各々について、前記アイテムv毎に、(s、k)の全ての組み合わせについての、前記θd,kと、前記ψs,kと、前記βk,s,vとの積の総和を算出して、前記ユーザdが前記アイテムvについて前記行動をとる確率を表すユーザアイテム確率vを算出し、又は、前記複数のユーザdの各々について、アイテムvと属性sとの組み合わせ毎に、各トピックkについて、前記θd,kと、前記ψs,kと、前記βk,s,vとの積の総和を算出して、前記ユーザdが前記属性sの前記アイテムvについて前記行動をとる確率を表すユーザ属性アイテム確率vd,sを算出するアイテム確率算出手段と、を備えている。
また、第2の発明に係る行動確率推定装置は、複数のユーザdの各々について、各アイテムvに対して購買行動及び閲覧行動の何れか一方である行動をとる確率を推定する行動確率推定装置であって、前記複数のユーザdの各々について前記行動をとったアイテムvの前記行動毎の履歴、及び前記複数のユーザdの各々について前記行動をとったアイテムの属性sの前記行動毎の履歴を示すアイテム情報に基づいて、前記ユーザdの各々について、前記ユーザdがi番目に前記行動を取ったアイテムvが属するトピックが、予め定められたK個のトピックkの何れであるかを示す変数zd,iを初期化する初期化手段と、(k、s、v)の全ての組み合わせについて、前記アイテム情報と前記変数zd,iとに基づいて、前記トピックkに属し、かつ前記属性sに属す前記アイテムvに対する前記行動の総数を表すアイテム統計量Nk,s,vを算出するアイテム統計量算出手段と、(d、k)の全ての組み合わせについて、前記変数zd,iに基づいて、前記トピックkに関する前記ユーザdの前記行動の総数を表すトピック統計量Md,kを算出するトピック統計量算出手段と、(d、i)の全ての組み合わせについて、前記トピックkの各々について、前記トピックk、及び前記ユーザdがi番目に前記行動をとったアイテムの前記属性sに関する前記アイテム統計量Nk,s,vの各々と、前記ユーザdに関する前記トピック統計量Md,kの各々とに基づいて、前記ユーザdがi番目に前記行動をとったアイテムのトピックを表わす前記変数zd,iが前記トピックkである確率を算出し、前記トピックkの各々について算出した前記確率に従って、前記変数zd,iの値をサンプリングにより更新するトピック算出手段と、繰り返し終了条件を満足するまで、前記アイテム統計量算出手段による算出、前記トピック統計量算出手段による算出、及び前記トピック算出手段による更新を繰り返す反復判定手段と、前記複数のユーザdの各々に対し、前記ユーザd及び各トピックkについて算出された前記トピック統計量Md,kの各々に基づくディリクレ分布に従って、前記ユーザdが各トピックkに属する確率を表すθd,kをサンプリングにより各々算出するユーザ・トピック混合確率算出手段と、(k、s)の全ての組み合わせに対し、前記トピックk、前記属性s、及び各アイテムvについて算出された前記アイテム統計量Nk,s,vの各々に基づくディリクレ分布に従って、前記トピックkにおいて前記属性sの各アイテムvが選択される確率を表すβk,s,vをサンプリングにより各々算出するトピック・アイテム混合確率算出手段と、前記複数のユーザdの各々について、前記アイテムv毎に、(s、k)の全ての組み合わせについての、前記θd,kと、前記βk,s,vとの積の総和を算出して、前記ユーザdが前記アイテムvについて前記行動をとる確率を表すユーザアイテム確率vを算出し、又は、前記複数のユーザdの各々について、アイテムvと属性sとの組み合わせ毎に、各トピックkについて、前記θd,kと、前記βk,s,vとの積の総和を算出して、前記ユーザdが前記属性sの前記アイテムvについて前記行動をとる確率を表すユーザ属性アイテム確率vd,sを算出するアイテム確率算出手段と、を備えている。
また、第3の発明に係る行動確率推定方法は、初期化手段、アイテム統計量算出手段、属性統計量算出手段、トピック統計量算出手段、トピック算出手段、反復判定手段、ユーザ・トピック混合確率算出手段、トピック・アイテム混合確率算出手段、トピック・属性混合確率算出手段、アイテム確率算出手段、及びユーザ属性確率算出手段を含み、複数のユーザdの各々について、各アイテムvに対して購買行動及び閲覧行動の何れか一方である行動をとる確率を推定する行動確率推定装置における行動確率推定方法であって、前記初期化手段によって、前記複数のユーザdの各々について前記行動をとったアイテムvの履歴、及び前記複数のユーザdの各々について前記行動をとったアイテムvの属性sの履歴を示すアイテム情報に基づいて、前記ユーザdの各々について、前記ユーザdがi番目に前記行動を取ったアイテムvが属するトピックが、予め定められたK個のトピックkの何れであるかを示す変数zd,iを初期化するステップと、前記アイテム統計量算出手段によって、(k、s、v)の全ての組み合わせについて、前記アイテム情報と前記変数zd,iとに基づいて、前記トピックkに属し、かつ前記属性sに属す前記アイテムvに対する前記行動の総数を表すアイテム統計量Nk,s,vを算出するステップと、前記属性統計量算出手段によって、(k、s)の全ての組み合わせについて、前記アイテム情報と前記変数zd,iとに基づいて、前記トピックk及び前記属性sに関する前記行動の総数を表す属性統計量Lk,sを算出するステップと、前記トピック統計量算出手段によって、(d、k)の全ての組み合わせについて、前記変数zd,iに基づいて、前記トピックkに関する前記ユーザdの前記行動の総数を表すトピック統計量Md,kを算出するステップと、前記トピック算出手段によって、前記複数のユーザdの各々に対し、前記トピックkの各々について、前記トピックk、及び前記ユーザdがi番目に前記行動をとったアイテムの前記属性sに関する前記アイテム統計量Nk,s,vの各々と、前記トピックkに関する前記属性統計量Lk,sの各々と、前記ユーザdに関する前記トピック統計量Md,kの各々と前記ユーザdがi番目に前記行動をとったアイテムのトピックを表わす前記変数zd,iが前記トピックkである確率を算出し、前記トピックkについて算出した前記確率に従って、前記変数zd,iの値をサンプリングにより更新するステップと、前記反復判定手段によって、繰り返し終了条件を満足するまで、前記アイテム統計量算出手段による算出、前記属性統計量算出手段による算出、前記トピック統計量算出手段による算出、及び前記トピック算出手段による更新を繰り返すステップと、前記ユーザ・トピック混合確率算出手段によって、前記複数のユーザdの各々に対し、前記ユーザd及び各トピックkについて算出された前記トピック統計量Md,kの各々に基づくディリクレ分布に従って、前記ユーザdが各トピックkに属する確率を表すθd,kをサンプリングにより各々算出するステップと、前記トピック・アイテム混合確率算出手段によって、(k、s)の全ての組み合わせに対し、前記トピックk、前記属性s、及び各アイテムvについて算出された前記アイテム統計量Nk,s,vの各々に基づくディリクレ分布に従って、前記トピックkにおいて前記属性sの各アイテムvが選択される確率を表すβk,s,vをサンプリングにより各々算出するステップと、前記トピック・属性混合確率算出手段によって、前記K個のトピックkの各々に対し、前記トピックk及び各属性sについて算出された前記属性統計量Lk,sの各々に基づくディリクレ分布に従って、前記トピックkにおいて前記属性sが選択される確率を表すψk,sをサンプリングにより各々算出するステップと、前記アイテム確率算出手段によって、前記複数のユーザdの各々について、前記アイテムv毎に、(s、k)の全ての組み合わせについての、前記θd,kと、前記ψs,kと、前記βk,s,vとの積の総和を算出して、前記ユーザdが前記アイテムvについて前記行動をとる確率を表すユーザアイテム確率vを算出し、又は、前記複数のユーザdの各々について、アイテムvと属性sとの組み合わせ毎に、各トピックkについて、前記θd,kと、前記ψs,kと、前記βk,s,vとの積の総和を算出して、前記ユーザdが前記属性sの前記アイテムvについて前記行動をとる確率を表すユーザ属性アイテム確率vd,sを算出するステップと、前記ユーザ属性確率算出手段によって、前記複数のユーザdの各々について、前記属性s毎に、各トピックkについて、前記θd,kと、前記ψs,kとの積の総和を算出して、前記ユーザdが前記属性sの任意のアイテムについて前記行動をとる確率を表すユーザ属性確率sを算出するステップと、を含む。
また、第4の発明に係る行動確率推定方法は、初期化手段、アイテム統計量算出手段、トピック統計量算出手段、トピック算出手段、反復判定手段、ユーザ・トピック混合確率算出手段、トピック・アイテム混合確率算出手段、アイテム確率算出手段、及びユーザ属性確率算出手段を含み、複数のユーザdの各々について、各アイテムvに対して購買行動及び閲覧行動の何れか一方である行動をとる確率を推定する行動確率推定装置における行動確率推定方法であって、前記初期化手段によって、前記複数のユーザdの各々について前記行動をとったアイテムvの履歴、及び前記複数のユーザdの各々について前記行動をとったアイテムvの属性sの履歴を示すアイテム情報に基づいて、前記ユーザdの各々について、前記ユーザdがi番目に前記行動を取ったアイテムvが属するトピックが、予め定められたK個のトピックkの何れであるかを示す変数zd,iを初期化するステップと、前記アイテム統計量算出手段によって、(k、s、v)の全ての組み合わせについて、前記アイテム情報と前記変数zd,iとに基づいて、前記トピックkに属し、かつ前記属性sに属す前記アイテムvに対する前記行動の総数を表すアイテム統計量Nk,s,vを算出するステップと、前記トピック統計量算出手段によって、(d、k)の全ての組み合わせについて、前記変数zd,iに基づいて、前記トピックkに関する前記ユーザdの前記行動の総数を表すトピック統計量Md,kを算出するステップと、前記トピック算出手段によって、前記複数のユーザdの各々に対し、前記トピックkの各々について、前記トピックk、及び前記ユーザdがi番目に前記行動をとったアイテムの前記属性sに関する前記アイテム統計量Nk,s,vの各々と、前記トピックkに関する前記属性統計量Lk,sの各々と、前記ユーザdに関する前記トピック統計量Md,kの各々と前記ユーザdがi番目に前記行動をとったアイテムのトピックを表わす前記変数zd,iが前記トピックkである確率を算出し、前記トピックkについて算出した前記確率に従って、前記変数zd,iの値をサンプリングにより更新するステップと、前記反復判定手段によって、繰り返し終了条件を満足するまで、前記アイテム統計量算出手段による算出、前記トピック統計量算出手段による算出、及び前記トピック算出手段による更新を繰り返すステップと、前記ユーザ・トピック混合確率算出手段によって、前記複数のユーザdの各々に対し、前記ユーザd及び各トピックkについて算出された前記トピック統計量Md,kの各々に基づくディリクレ分布に従って、前記ユーザdが各トピックkに属する確率を表すθd,kをサンプリングにより各々算出するステップと、前記トピック・アイテム混合確率算出手段によって、(k、s)の全ての組み合わせに対し、前記トピックk、前記属性s、及び各アイテムvについて算出された前記アイテム統計量Nk,s,vの各々に基づくディリクレ分布に従って、前記トピックkにおいて前記属性sの各アイテムvが選択される確率を表すβk,s,vをサンプリングにより各々算出するステップと、前記アイテム確率算出手段によって、前記複数のユーザdの各々について、前記アイテムv毎に、(s、k)の全ての組み合わせについての、前記θd,kと、前記βk,s,vとの積の総和を算出して、前記ユーザdが前記アイテムvについて前記行動をとる確率を表すユーザアイテム確率vを算出し、又は、前記複数のユーザdの各々について、アイテムvと属性sとの組み合わせ毎に、各トピックkについて、前記θd,kと、前記βk,s,vとの積の総和を算出して、前記ユーザdが前記属性sの前記アイテムvについて前記行動をとる確率を表すユーザ属性アイテム確率vd,sを算出するステップと、前記ユーザ属性確率算出手段によって、前記複数のユーザdの各々について、前記属性s毎に、各トピックkについて、前記θd,kの総和を算出して、前記ユーザdが前記属性sの任意のアイテムについて前記行動をとる確率を表すユーザ属性確率sを算出するステップと、を含む。
また、本発明のプログラムは、コンピュータを、上記の行動確率推定装置を構成する各手段として機能させるためのプログラムである。
以上説明したように、本発明の行動確率推定装置、方法、及びプログラムによれば、ユーザdが、トピックkに属し、かつ属性sに属するアイテムvに対する当該行動の総数を表すアイテム統計量Nk,s,vを算出し、トピックk及び属性sに関する当該行動の総数を表す属性統計量Lk,sを算出し、トピックkに関するユーザdの当該行動の総数を表すトピック統計量Md,kを算出し、変数zd,iがトピックkである確率を算出し変数zd,iの値をサンプリングにより更新し、繰り返し終了条件を満足するまで、各処理を繰り返し行い、ユーザdが各トピックkに属する確率を表すθd,kをサンプリングにより算出し、トピックkにおいて属性sの各アイテムvが選択される確率を表すβk,s,vをサンプリングにより算出し、トピックkにおいて属性sが選択される確率を表すψk,sをサンプリングにより算出し、θd,k、βk,s,v、ψk,sに基づいて、ユーザdがアイテムvについて当該行動をとる確率を表すユーザアイテム確率vを算出し、又は、ユーザdが属性sのアイテムvについて当該行動をとる確率を表すユーザ属性アイテム確率vd,sを算出することにより、ユーザの行動確率を精度よく推定することができる、という効果が得られる。
本発明の実施の形態の概要を説明するための概念図である。 本発明の第1及び第3の実施の形態に係る行動確率推定装置の構成の一例を示す図である。 本発明の実施の形態に係る行動確率推定装置の商品情報バッファと属性情報バッファに格納されるテーブルデータの一例を示す図である。 本発明の第1の実施の形態におけるShop−LDAのモデルを表す概念図である。 本発明の実施の形態に係る行動確率推定装置のトピックバッファに格納されるテーブルデータの一例を示す図である。 本発明の実施の形態に係る行動確率推定装置の商品統計量バッファと属性統計量バッファとトピック統計量バッファに格納されるテーブルデータの一例を示す図である。 本発明の実施の形態に係る行動確率推定装置のユーザ・トピック混合確率バッファとトピック・商品混合確率バッファとトピック・属性混合確率バッファに格納されるテーブルデータの一例を示す図である。 本発明の実施の形態に係る行動確率推定装置のユーザ・商品出力確率バッファとユーザ・属性出力確率バッファに格納されるテーブルデータの一例を示す図である。 本発明の第1及び第3の実施の形態に係る行動確率推定処理ルーチンのフローチャートの一例である。 本発明の第2の実施の形態に係る行動確率推定装置の構成の一例を示す図である。 本発明の第2の実施の形態のモデルを表す概念図である。 本発明の第2の実施の形態に係る行動確率推定処理ルーチンのフローチャートの一例である。 本発明の第3の実施の形態のモデルを表す概念図である。
<概要>
まず、本発明の実施の形態の概要について説明する。
本発明の実施の形態では、閲覧者の閲覧プロセスを考慮することによって予測精度の向上や閲覧プロセスに関する閲覧者のユーザプロファイル情報を獲得することを目標とする。
ここで閲覧プロセスとは、全商品の中から選択するという従来のものではなく、まず、ある属性で絞り込みをした後に、絞り込んだ商品の中から閲覧するという絞り込みのプロセスを考慮する。例えば、自分の好みに合った商品を閲覧しようとする場合、自分の好みにあったショップを選択し、そのショップの中に存在する絞り込まれた商品の中から閲覧するというプロセスが考えられる。これは、まずショップを訪れないと商品を閲覧することができないこと、同じ商品でもショップごとに商品の価格などが異なることため閲覧する条件をショップによっては満たさないということを反映したことになる。本実施の形態では、商品を絞り込む際に用いた条件を属性と呼ぶ事にする。
本発明に係る実施の形態の概要を説明するための概念図を、図1に示す。閲覧した商品を予測する場合に、閲覧者が全商品から閲覧した商品を選択したことをモデル化する方法が考えられる。しかし、ショップを訪問しないと商品を閲覧することができない、事前に欲しいカテゴリが決まっているなどの閲覧する商品が事前に絞り込まれるプロセスを考慮していない。
そこで本発明に係る実施の形態では、全商品からサイトやカテゴリなどの属性で商品を絞り込んだ後に、その絞り込んだ商品の中から閲覧する商品を選択するプロセスをモデル化することで、閲覧する商品の予測精度を向上させると共に、閲覧者が閲覧しやすい商品の傾向や絞り込みに用いる属性の傾向などをユーザプロファイルとして抽出する。
[第1の実施の形態]
<システム構成>
以下、図面を参照して本発明の第1の実施の形態を詳細に説明する。図2は、本実施の形態に係る行動確率推定装置の構成の一例を示す図である。
本実施の形態に係る行動確率推定装置10は、CPUと、RAMと、後述する行動確率推定処理ルーチンを実行するためのプログラム及び各種データを記憶したROMとを備えたコンピュータで構成されている。また、記憶手段としてHDDを設けてもよい。
このコンピュータは、機能的には、図2に示すように、入力部1、ユーザプロファイル・閲覧予測算出部2、及び出力部3を含んだ構成で表わすことができる。
入力部1は、商品履歴情報と属性履歴情報とを入力として受け付ける。商品履歴情報及び属性履歴情報は、アイテム情報の一例である。商品履歴情報は、図3に示すように、ある閲覧者(以下、ユーザと称する)を識別するための固有のユーザIDの各々に対し、当該ユーザIDのユーザが閲覧した商品の商品IDを閲覧毎に格納したテーブルデータであり、後述する商品情報バッファ200に格納される。ここで、商品には固有のIDが振られており、あるユーザが同一商品を閲覧したとしても区別して記憶される。また、上記図3の商品情報バッファ200のxd,iは、ユーザdがi番目に閲覧した商品を表す。例えば、上記図3の商品情報バッファ200の左上の商品01について考えると、xユーザ01,1=商品01となる。ここで全ユーザ数をD、全アイテム数をVとする。なお、商品は、アイテムの一例である。
属性履歴情報は、上記図3に示すように、ユーザIDの各々に対し、当該ユーザIDのユーザが閲覧した商品の属性を閲覧毎に格納したテーブルデータであり、後述する属性情報バッファ202に格納される。ここで属性には固有のIDが振られている。また、上記図3の属性情報バッファ202のyd,iはユーザdがi番目の閲覧した商品の属性を表す。上記図3の属性情報バッファ202の左上の属性01を考えるとyユーザ01,1=属性01となる。ここで全属性数をSとする。なお、ECサイトにおけるショップが、属性の一例である。
ユーザプロファイル・閲覧予測算出部2は、図4に示すように、Latent Dirichlet Allocation(LDA)を拡張したShop−LDAのモデルを用いる。LDAはユーザが好みを持ち、その好みにあった商品を選択するというモデルである。また、LDAでは好みをトピックと呼ばれるクラスタIDで表現し各ユーザや商品はこのトピックに帰属する。Shop−LDAが、属性で絞り込みを行い、その絞り込んだ商品の中から商品を選択するというプロセスをモデル化したものであり、本実施の形態の基礎モデルである。図4のモデルを数式で表現したものを以下に示す。
まず、ユーザd=ユーザ01、ユーザ02、…、ユーザDの中のi=1,2,…,Nd番目の観測をxd,i=vとする。ここでNはユーザdの閲覧行動の総数とする。これは上記図3の商品情報バッファ200の内容と同じである。同様にyd,i=sは属性情報バッファ202の内容と同じである。zd,iはユーザdがi番目に閲覧した商品が所属するトピックである。ここで、トピック数を予め定められたKとする。なお、商品分野はトピックの一例である。
θ^はθ^=(θd,1,θd,2,…,θd,K)であり、ユーザdがトピックkに属する確率分布である。
βk,s^はβk,s^=(βk,s,1,βk,s,2,…,βk,s,V)であり、トピックkにおいて属性sの商品vが選択される確率分布である。
ψ^はψ^=(ψk,1,ψk,2,…,ψk,S)であり、トピックkにおいて属性sが選択される確率分布である。
α^はα^=(α,α,…,α) であり、ユーザのトピックkへの帰属確率の事前分布である。
λ^はλ^=(λ,λ,…,λ) であり、トピックにおいて商品vが選択される確率の事前分布である。
η^はη^=(η,η,…,η) であり、トピックにおいて属性sが選択される確率の事前分布である。
なお、記号の後ろに付された「^」は、当該記号が行列または多次元配列またはベクトルであることを示す。
上記の事前分布は、事前に適切な値を設定しておき、メモリ(図示省略)に格納されるものとする。ここで、Multi(A)はパラメータAに基づく多項分布を示す。また、Dirchlet(B)はパラメータBに基づくディリクレ分布を示す。また、Rは実数とする。
また、統計量として以下の3つを定義する。Nk,s,vは、属性sであり、トピックkの中から選択された商品vについての閲覧行動の総数とする。Lk,sは、トピックkの中から選択された属性sである任意の商品についての閲覧行動の総数とする。Md,kは、ユーザdのうちトピックkである任意の商品についての閲覧行動の総数とする。ここで、I(a)はaとなる期待値である。
また、ユーザプロファイル・閲覧予測算出部2は、情報記憶部20と、初期化部21と、統計量算出部22と、トピック算出部23と、反復判定部24と、混合確率算出部25と、出力確率算出部26とから構成されている。
なお、統計量算出部22は、アイテム統計量算出手段、属性統計量算出手段、及びトピック統計量算出手段の一例である。また、混合確率算出部25は、ユーザ・トピック混合確率算出手段、トピック・アイテム混合確率算出手段、及びトピック・属性混合確率算出手段の一例である。出力確率算出部26は、アイテム確率算出手段、及びユーザ属性確率算出手段の一例である。
情報記憶部20は、商品情報バッファ200と、属性情報バッファ202と、トピックバッファ204とから構成されている。
商品情報バッファ200には、上記図3に示すように、入力部1により入力された商品履歴情報が格納される。また、属性情報バッファ202には、上記図3に示すように、入力部1により入力された属性履歴情報が格納される。
初期化部21は、後述するトピックバッファ204に格納されているテーブルデータについて、(d、i)のすべての組み合わせに対して、zd,iを1〜Kの間の値でランダムに初期化する。
トピックバッファ204には、図5に示すように、ユーザIDの各々に対し、当該ユーザIDのユーザdがi番目に閲覧した商品が所属するトピックzd,iが閲覧毎に格納されたテーブルデータが格納される。商品履歴情報と、属性履歴情報とが入力部1により入力されたときには、トピックバッファ204の各zd,iに、初期化部21によって、1〜Kの間の値でランダムに初期化された値が格納される。また、トピックバッファ204の各zd,iに、後述するトピック算出部23で算出されたトピックzd,iの値が格納される。
統計量算出部22は、上記(7)〜(9)式を計算し、商品統計量Nk,s,vと、属性統計量Lk,sと、トピック統計量Md,kを算出する。また、統計量算出部22は、商品統計量バッファ220と、属性統計量バッファ222と、トピック統計量バッファ224とを備えている。
具体的には、統計量算出部22は、(k、s、v)の全ての組み合わせについて、商品情報バッファ200に格納されている商品履歴情報から得られる、xd,iが商品vとなる期待値xd,i,vと、属性情報バッファ202に格納されている属性履歴情報から得られる、yd,iが属性sとなる期待値yd,i,sと、トピックバッファ204に格納されているテーブルデータから得られる、zd,iがトピックkとなる期待値zd,i,kとに基づいて、上記(7)式に従って、Nk,s,vを算出して、商品統計量バッファ220に格納する。商品統計量バッファ220には、図6上段に示すようなテーブルデータが格納される。
また、統計量算出部22は、(d、i、k、v)の各組合せについて、商品統計量
に基づいて、
を算出して、商品統計量バッファ220に格納する。
また、統計量算出部22は、(k、s)の全ての組み合わせについて、属性情報バッファ202に格納されている属性履歴情報から得られる、yd,iが属性sとなる期待値yd,i,sと、トピックバッファ204に格納されているテーブルデータから得られる、zd,iがトピックkとなる期待値zd,i,kとに基づいて、上記(8)式に従って、属性統計量Lk,sを算出して、属性統計量バッファ222に格納する。属性統計量バッファ222には、図6中段に示すようなテーブルデータが格納される。
また、統計量算出部22は、(d、i、k、s)の各組合せについて、属性統計量Lk,sに基づいて、後述するLk,s \(d,i)を算出して、属性統計量バッファ222に格納する。
また、統計量算出部22は、(d、k)の全ての組み合わせについて、トピックバッファ204に格納されているテーブルデータから得られる、zd,iがトピックkとなる期待値zd,i,kに基づいて、上記(9)式に従って、トピック統計量Md,kを算出して、トピック統計量バッファ224に格納する。トピック統計量バッファ224には、図6下段に示すようなテーブルデータが格納される。
また、統計量算出部22は、(d、i、k)の各組合せについて、トピック統計量Md,kに基づいて、後述するMd,k \(d,i)を算出して、トピック統計量バッファ224に格納する。
また、統計量算出部22は、(d,i,k,v)の各組み合わせについて、事前に設定されているλ^の要素であるλと、上記の商品統計量バッファ220に格納されている
とに基づいて、後述する(11)式に従って、
を算出し、商品統計量バッファ220に格納する。次に、統計量算出部22は、(d,i,k,s)の各組み合わせについて、事前に設定されているη^の要素であるηと、上記の属性統計量バッファ222に格納されているLk,s \(d,i)とに基づいて、後述する(12)式に従って、^ηk,sを算出して、属性統計量バッファ222に格納する。そして、統計量算出部22は、(d,i,k)の各組み合わせについて、事前に設定されているα^の要素であるαk’と、上記のトピック統計量バッファ224に格納されているMd,k \(d,i)とに基づいて、後述する(13)式に従って、^αd,k’を算出して、トピック統計量バッファ224に格納する。
トピック算出部23は、以下の(10)式を計算し、(d、i)の全ての組み合わせについて、zd,iを算出する。
ここで、
は、ユーザdのi番目の商品の閲覧を除いた場合の、属性yd,iであって、かつトピックkに属する商品vについての閲覧行動の総数である。また、Lk,s \(d,i)は、ユーザdのi番目の商品の閲覧を除いた場合の、トピックkに属し、かつ、属性sである任意の商品について閲覧行動の総数である。また、Md,k \(d,i)は、ユーザdのi番目の商品の閲覧を除いた場合の、トピックkに属する任意の商品についてユーザdが閲覧した閲覧行動の総数である。
具体的には、トピック算出部23は、(d、i)の全ての組み合わせについて、統計量算出部22によって算出された各
、各^ηk,s、及び各^αd,k’に基づいて、上記(10)式に従って、トピックk毎に、zd,i=kである確率p(zd,i=k)を算出する。そして、トピックkの各々について算出した当該確率に従って、zd,iの値をサンプリングして更新し、トピックバッファ204に格納する。
反復判定部24は、予め設定した更新回数Nを繰り返し終了条件として設定し、統計量算出部22による各統計量の算出、及びトピック算出部23による各トピックの算出処理が、N回繰り返されたか否かを判定する。N回繰り返されたと判定されるまで、統計量算出部22による各統計量の算出、及びトピック算出部23による各トピックの算出処理が繰り返される。
混合確率算出部25は、以下の(14)〜(19)式を計算し、ユーザ・トピック混合確率θ^と、トピック・商品混合確率βk,s^と、トピック・属性混合確率ψ^とを算出する。
ここで、上記(14)〜(19)式におけるX^は、商品情報バッファ200に格納されているxd,iを要素とする二次元配列、Y^は、属性情報バッファ202に格納されているyd,iを要素とする二次元配列、Z^は、トピックバッファ204に格納されているzd,iを要素とする二次元配列を表す。
また、混合確率算出部25は、ユーザ・トピック混合確率バッファ250と、トピック・商品混合確率バッファ252と、トピック・属性混合確率バッファ254とを備えている。
具体的には、混合確率算出部25は、ユーザdの各々に対し、上記(14)及び(15)式に示すように、トピックkの各々についての、事前に設定されたα^の要素であるαと、トピック統計量バッファ224に格納されている、当該ユーザd及び当該トピックkについて算出されたトピック統計量Md,kとの和^αd,kの各々をパラメータとするディレクレ分布に従って、ユーザ・トピック混合確率θd,kの各々をサンプリングして求め、ユーザ・トピック混合確率バッファ250に格納する。ユーザ・トピック混合確率バッファ250には、図7上段に示すようなテーブルデータが格納される。
また、混合確率算出部25は、(k、s)の組み合わせの各々に対し、上記(16)及び(17)式に示すように、商品vの各々についての、事前に設定されたλ^の要素であるλと、商品統計量バッファ220に格納されている、当該トピックk、当該属性s、及び当該アイテムvについて算出された商品統計量Nk,s,vとの和^λk,s,vの各々をパラメータとするディレクレ分布に従ってトピック・商品混合確率βk,s,vの各々をサンプリングして求め、トピック・商品混合確率バッファ252に格納する。トピック・商品混合確率バッファ252には、図7中段に示すようなテーブルデータが格納される。
また、混合確率算出部25は、トピックkの各々に対し、上記(18)及び(19)式に示すように、属性sの各々についての、事前に設定されたη^の要素であるηと、属性統計量バッファ222に格納されている、当該トピックk及び当該属性sについて算出された属性統計量Lk,sとの和^ηk,sの各々をパラメータとするディレクレ分布に従って、トピック・属性混合確率ψk,sの各々をサンプリングして求め、トピック・属性混合確率バッファ254に格納する。トピック・属性混合確率バッファ254には、図7下段に示すようなテーブルデータが格納される。
出力確率算出部26は、以下に示す(20)〜(22)式に従って、ユーザdが商品vを閲覧する確率を表すユーザ・商品出力確率vと、ユーザdが属性sの商品vを閲覧する確率を表すユーザ・属性・商品出力確率vd,sと、ユーザdが属性sの任意の商品を閲覧する確率を表すユーザ・属性出力確率sとを算出する。また、出力確率算出部26は、ユーザ・商品出力確率バッファ260と、ユーザ・属性出力確率バッファ262とを備えている。
具体的には、出力確率算出部26は、複数のユーザdの各々について、商品v毎に、ユーザ・トピック混合確率バッファ250に格納された当該ユーザd及び各トピックkのθd,kと、トピック・商品混合確率バッファ252に格納された当該商品vの(s、k)の全ての組み合わせのβk,s,vと、トピック・属性混合確率バッファ254に格納された(s、k)の全ての組み合わせについてのψs,kとに基づいて、上記(20)式に従って、当該ユーザdが当該商品vを閲覧する確率を表すユーザ・商品出力確率vを算出して、当該ユーザ・商品出力確率vをユーザ・商品出力確率バッファ260に格納する。ユーザ・商品出力確率バッファ260には、図8上段に示すようなテーブルデータが格納される。
また、出力確率算出部26は、複数のユーザdの各々について、商品vと属性sとの組み合わせ毎に、ユーザ・トピック混合確率バッファ250に格納された当該ユーザd及び各トピックkについてのθd,kの各々と、トピック・商品混合確率バッファ252に格納された当該商品v、当該属性s、及び各トピックkについてのβk,s,vと、トピック・属性混合確率バッファ254に格納された当該属性s及び各トピックkについてのψs,kの各々とに基づいて、上記(21)式に従って、当該ユーザdが当該属性sの当該商品vを閲覧する確率を表すユーザ・属性・商品出力確率vd,sを算出して、当該ユーザ・属性・商品出力確率vd,sをユーザ・商品出力確率バッファ260に格納する。
また、出力確率算出部26は、複数のユーザdの各々について、属性s毎に、ユーザ・トピック混合確率バッファ250に格納された当該ユーザd及び各トピックkについてのθd,kの各々と、トピック・属性混合確率バッファ254に格納された当該属性s及び各トピックkについてのψs,kの各々とに基づいて、上記(22)式に従って、当該ユーザdが当該属性sの任意の商品を閲覧する確率を表すユーザ・属性出力確率sを算出して、当該ユーザ・属性出力確率sをユーザ・属性出力確率バッファ262に格納する。ユーザ・属性出力確率バッファ262には、図8下段に示すようなテーブルデータが格納される。
出力部3は、ユーザ・商品出力確率バッファ260に格納されているv、及びvd,s、ユーザ・属性出力確率バッファ262に格納されているsを結果として出力する。
出力部3によって出力されたv、vd,s、及びsに基づいて、特定のユーザdの行動を予測することができる。
例えば、ユーザ・商品出力確率vに基づいて、当該ユーザに対して推薦すべき商品を予測することができる。また、ユーザ・属性・商品出力確率vd,sに基づいて、属性(ショップ)毎に、当該ユーザに対して推薦すべき商品を予測することができる。また、ユーザ・属性出力確率sに基づいて、当該ユーザに対して推薦すべき属性(ショップ)を予測することができる。
<行動確率推定装置の動作>
次に、本実施の形態に係る行動確率推定装置10の作用について説明する。上記図3に示すような商品履歴情報と、属性履歴情報とが行動確率推定装置10に入力されると、行動確率推定装置10によって、図9に示す行動確率推定処理ルーチンが実行される。
まず、ステップS100において、入力部1によって、商品履歴情報と、属性履歴情報との入力を受け付ける。
次に、ステップS102において、上記ステップS100で入力された商品履歴情報を、商品情報バッファ200へ格納すると共に、上記ステップS100で入力された属性履歴情報を、属性情報バッファ202へ格納する。
そして、ステップS104において、初期化部21によって、トピックバッファ204に格納されているテーブルデータについて、(d、i)のすべての組み合わせに対して、zd,iを1〜Kの間の値でランダムに初期化する。
ステップS106において、統計量算出部22によって、上記ステップS102で商品情報バッファ200に格納された商品履歴情報から得られる、xd,iが商品vとなる期待値xd,i,vと、属性情報バッファ202に格納された属性履歴情報から得られる、yd,iが属性sとなる期待値yd,i,sと、上記ステップS104で初期化又は後述するステップS114で前回算出されたzd,iから得られる、zd,iがトピックkとなる期待値zd,i,kとに基づいて、上記(7)〜(9)式に従って、商品統計量Nk,s,vと、属性統計量Lk,sと、トピック統計量Md,kを算出する。そして、統計量算出部22によって、商品統計量Nk,s,vを商品統計量バッファ220へ、属性統計量Lk,sを属性統計量バッファ222へ、トピック統計量Md,kをトピック統計量バッファ224へ、それぞれ格納する。また、算出された商品統計量Nk,s,vと、属性統計量Lk,sと、トピック統計量Md,kと、事前に設定されたα^、λ^、及びη^とに基づいて、上記(11)〜(13)式に従って、パラメータ
、^ηk,s、及び^αd,k’を算出して、商品統計量バッファ220、属性統計量バッファ222、及びトピック統計量バッファ224に格納する。
次に、ステップS108において、対象ユーザd(≦D)を設定する。
次に、ステップS110において、対象の閲覧i(≦N)を設定する。
ステップS112において、トピック算出部23によって、上記ステップS106で算出された各パラメータに基づいて、上記(10)式に従って、対象ユーザd及び対象の閲覧iについて、トピックk毎に、zd,i=kである確率p(zd,i=k)を算出する。そして、トピックk毎に算出した当該確率に従って、zd,iの値をサンプリングして更新し、トピックバッファ204に格納する。
ステップS114において、対象ユーザdについて、全ての閲覧について上記ステップS112の処理を実行したか否かを判定する。そして、上記ステップS112の処理を実行していない閲覧が存在する場合には、上記ステップS110へ戻り、当該閲覧を対象閲覧に設定する。一方、全ての閲覧について、上記ステップS112の処理を実行した場合には、ステップS116へ進む。
ステップS116において、全てのユーザについて上記ステップS110〜S114の処理を実行したか否かを判定する。そして、上記ステップ記ステップS110〜S114の処理を実行していないユーザが存在する場合には、上記ステップS108へ戻り、当該商品を対象ユーザに設定する。一方、全てのユーザについて、上記ステップ記ステップS110〜S114の処理を実行した場合には、ステップS118へ進む。
ステップS118において、上記ステップS106〜S116の処理をN回以上繰り返したか否かを判定する。そして、上記ステップS106〜S116の処理をN回以上繰り返していない場合には、上記ステップS106へ戻り、上記ステップS106〜S116の処理を実行する。一方、上記ステップS106〜S116の処理をN回以上繰り返した場合には、ステップS120へ進む。
次に、ステップS120において、混合確率算出部25によって、上記ステップS106で算出された各統計量と、事前に設定されたα^、λ^、及びη^とに基づいて、上記(14)〜(19)式に従って、(d、k)の各組み合わせについてのユーザ・トピック混合確率θd,kと、(k、s、v)の各組み合わせについてトピック・商品混合確率βk,s,vと、(s、k)の各組み合わせについてトピック・属性混合確率ψs,kとを算出する。そして、混合確率算出部25によって、ユーザ・トピック混合確率θd,kをユーザ・トピック混合確率バッファ250へ、トピック・商品混合確率βk,s,vをトピック・商品混合確率バッファ252へ、トピック・属性混合確率ψs,kをトピック・属性混合確率バッファ254へ、それぞれ格納する。
ステップS122において、出力確率算出部26によって、上記ステップS120で算出されたユーザ・トピック混合確率θd,k、トピック・商品混合確率βk,s,v、及びトピック・属性混合確率ψs,kに基づいて、上記(20)〜(22)式を計算し、ユーザ・商品出力確率vと、ユーザ・属性・商品出力確率vd,sと、ユーザ・属性出力確率sとを算出する。そして、出力確率算出部26によって、ユーザ・商品出力確率v及びユーザ・属性・商品出力確率vd,sを、ユーザ・商品出力確率バッファ260へ、ユーザ・属性出力確率sをユーザ・属性出力確率バッファ262へそれぞれ格納する。
ステップS124において、出力部3によって、上記ステップS122で算出したユーザ・商品出力確率vと、ユーザ・属性・商品出力確率vd,sと、ユーザ・属性出力確率sとを結果として出力して、行動確率推定処理ルーチンを終了する。
以上説明したように、本発明の実施の形態に係る行動確率推定装置によれば、ユーザdが、トピックkに属し、かつ属性sに属する商品vに対する閲覧行動の総数を表す商品統計量Nk,s,vを算出し、トピックk及び属性sに関する閲覧行動の総数を表す属性統計量Lk,sを算出し、トピックkに関するユーザdの閲覧行動の総数を表すトピック統計量Md,kを算出し、変数zd,iがトピックkである確率を算出して変数zd,iの値をサンプリングにより更新し、繰り返し終了条件を満足するまで、各処理を繰り返し行い、ユーザdが各トピックkに属する確率を表すθd,kをサンプリングにより算出し、トピックkにおいて属性sの各商品vが選択される確率を表すβk,s,vをサンプリングにより算出し、トピックkにおいて属性sが選択される確率を表すψk,sをサンプリングにより算出し、θd,k、βk,s,v、ψk,sに基づいて、ユーザdが商品vについて閲覧行動をとる確率を表すユーザ商品確率v、及びユーザdが属性sの商品vについて閲覧行動をとる確率を表すユーザ属性商品確率vd,sを算出することにより、ユーザが閲覧行動をとる確率を精度よく推定することができる。また、θd,k、ψk,sに基づいて、ユーザdが属性sの任意の商品について閲覧行動をとる確率を表すユーザ属性確率sを算出することにより、属性ごとにユーザが閲覧行動をとる確率を精度よく推定することができる。
また、ユーザ・商品出力確率vに基づいて、当該ユーザに対して推薦すべき商品を精度よく予測することができる。
また、ユーザ・属性・商品出力確率vd,sに基づいて、属性(ショップ)毎に、当該ユーザに対して推薦すべき商品を精度よく予測することができる。
また、ユーザ・属性出力確率sに基づいて、当該ユーザが推薦するであろう属性(ショップ)を精度よく予測することができる。
また、ユーザdがトピックkに属する確率分布θ^は、ショップ(属性s)毎に作成されるわけではないため、他のショップの情報に基づいて算出されたθ^を、目的のショップのθ^として利用することができる。
また、あるユーザが商品を閲覧する確率を高精度に抽出する事で、あるユーザが閲覧する商品の予測精度を向上させることができる。
また、ユーザが商品の絞り込みに用いる属性の確率を推定することで、それをユーザの特徴とし、それを基にユーザプロファイルを作成する事で戦略立案への理解が可能になる。
また、複数の属性において本実施の形態のモデルを適用し、ユーザの閲覧を最も高精度に予測した属性がそのユーザの絞り込み属性であると判定することで、ユーザが商品を絞り込む際に用いる属性の推定が可能になり、ユーザのより詳細な行動理解が可能になる。
[第2の実施の形態]
<システム構成>
次に、図10を参照して、本発明の第2の実施の形態について説明する。なお、第1の実施の形態と同様の構成となる部分については、同一符号を付して説明を省略する。
第2の実施の形態では、トピックkと属性sとが独立している点が、第1の実施の形態と異なっている。すなわち、第2の実施の形態では、ショップ(属性s)を選択する際に、商品分野(トピックk)を考慮していない。
第2の実施の形態に係る行動確率推定装置100において用いるモデルの概念図を、図11に示す。上記図11に示すモデルを数式で表すと以下のようになる。
この場合、トピック・属性出力確率は、ユーザが選択した属性のみで一様な確率とする。ここで、上記(24)式におけるUniformは一様分布を示す。
また、統計量算出部40は、以下の式に従って、各統計量を算出する。
上記(28)〜(29)式からわかるように、統計量算出部40では、属性統計量Lk,sは算出しない。そのため、統計量算出部40は、商品統計量バッファ220と、トピック統計量バッファ224とを備えている。
統計量算出部40は、上記(28)〜(29)式を計算し、商品統計量Nk,s,vと、トピック統計量Md,kを算出する。
具体的には、統計量算出部40は、(k、s、v)の全ての組み合わせについて、商品情報バッファ200に格納されている商品履歴情報から得られる、xd,iが商品vとなる期待値xd,i,vと、属性情報バッファ202に格納されている属性履歴情報から得られる、yd,iが属性sとなる期待値yd,i,sと、トピックバッファ204に格納されているテーブルデータから得られる、zd,iがトピックkとなる期待値zd,i,kとに基づいて、上記(28)式に従って、Nk,s,vを算出して、商品統計量バッファ220に格納する。
また、統計量算出部40は、(d、i、k、v)の各組合せについて、商品統計量
に基づいて、
を算出して、商品統計量バッファ220に格納する。
また、統計量算出部40は、(d、k)の全ての組み合わせについて、トピックバッファ204に格納されているテーブルデータから得られる、zd,iがトピックkとなる期待値zd,i,kに基づいて、上記(29)式に従って、トピック統計量Md,kを算出して、トピック統計量バッファ224に格納する。
また、統計量算出部40は、(d、i、k)の各組合せについて、トピック統計量Md,kに基づいて、Md,k \(d,i)を算出して、トピック統計量バッファ224に格納する。
また、統計量算出部40は、(d,i,k,v)の各組み合わせについて、事前に設定されているλ^の要素であるλと、上記の商品統計量バッファ220に格納されている
とに基づいて、後述する(31)式に従って、
を算出し、商品統計量バッファ220に格納する。次に、統計量算出部40は、(d,i,k)の各組み合わせについて、事前に設定されているα^の要素であるαk’と、上記のトピック統計量バッファ224に格納されているMd,k \(d,i)とに基づいて、後述する(32)式に従って、^αd,k’を算出して、トピック統計量バッファ224に格納する。
トピック算出部42は、以下の(30)式を計算し、(d、i)の全ての組み合わせについて、zd,iを算出する。
ここで、
は、ユーザdのi番目の商品の閲覧を除いた場合の、属性yd,iであって、かつトピックkに属する商品vについての閲覧行動の総数である。また、Md,k \(d,i)は、ユーザdのi番目の商品の閲覧を除いた場合の、トピックkに属する任意の商品についてユーザdが閲覧した閲覧行動の総数である。
具体的には、トピック算出部42は、(d、i)の全ての組み合わせについて、統計量算出部40によって算出された各
、及び各^αd,k’に基づいて、上記(30)式に従って、トピックk毎に、zd,i=kである確率p(zd,i=k)を算出する。そして、トピックkの各々について算出した当該確率に従って、zd,iの値をサンプリングして更新し、トピックバッファ204に格納する。
混合確率算出部44は、以下の(33)〜(36)式を計算し、ユーザ・トピック混合確率θ^と、トピック・商品混合確率βk,s^とを算出する。
ここで、上記(33)〜(36)式におけるX^は、商品情報バッファ200に格納されているxd,iを要素とする二次元配列、Y^は、属性情報バッファ202に格納されているyd,iを要素とする二次元配列、Z^は、トピックバッファ204に格納されているzd,iを要素とする二次元配列を表す。
具体的には、混合確率算出部44は、ユーザdの各々に対し、上記(33)及び(34)式に示すように、トピックkの各々についての、事前に設定されたα^の要素であるαと、トピック統計量バッファ224に格納されている、当該ユーザd及び当該トピックkについて算出されたトピック統計量Md,kとの和^αd,kの各々をパラメータとするディレクレ分布に従って、ユーザ・トピック混合確率θd,kの各々をサンプリングして求め、ユーザ・トピック混合確率バッファ250に格納する。
また、混合確率算出部44は、(k、s)の組み合わせの各々に対し、上記(35)及び(36)式に示すように、商品vの各々についての、事前に設定されたλ^の要素であるλと、トピック統計量バッファ224に格納されている、当該トピックk、当該属性s、及び当該アイテムvについて算出された商品統計量Nk,s,vとの和^λk,s,vの各々をパラメータとするディレクレ分布に従ってトピック・商品混合確率βk,s,vの各々をサンプリングして求め、トピック・商品混合確率バッファ252に格納する。
出力確率算出部46は、以下に示す(37)〜(38)式に従って、ユーザdが商品vを閲覧する確率を表すユーザ・商品出力確率vと、ユーザdが属性sの商品vを閲覧する確率を表すユーザ・属性・商品出力確率vd,sとを算出する。また、出力確率算出部26は、ユーザ・商品出力確率バッファ260と、ユーザ・属性出力確率バッファ262とを備えている。
具体的には、出力確率算出部26は、複数のユーザdの各々について、商品v毎に、ユーザ・トピック混合確率バッファ250に格納された当該ユーザd及び各トピックkのθd,kと、トピック・商品混合確率バッファ252に格納された当該商品v及び(s、k)の全ての組み合わせの各々のβk,s,vとに基づいて、上記(37)式に従って、当該ユーザdが当該商品vを閲覧する確率を表すユーザ・商品出力確率vを算出して、当該ユーザ・商品出力確率vをユーザ・商品出力確率バッファ260に格納する。
また、出力確率算出部26は、複数のユーザdの各々について、商品vと属性sとの組み合わせ毎に、ユーザ・トピック混合確率バッファ250に格納された当該ユーザd及び各トピックkについてのθd,kの各々と、トピック・商品混合確率バッファ252に格納された当該商品v、当該属性s、及び各トピックkについてのβk,s,vとに基づいて、上記(38)式に従って、当該ユーザdが当該属性sの当該商品vを閲覧する確率を表すユーザ・属性・商品出力確率vd,sを算出して、当該ユーザ・属性・商品出力確率vd,sをユーザ・商品出力確率バッファ260に格納する。
<行動確率推定装置100の動作>
次に、行動確率推定装置100の作用について図12を参照して詳細に説明する。
ステップS1062において、統計量算出部40によって、上記ステップS102で商品情報バッファ200に格納された商品履歴情報から得られる、xd,iが商品vとなる期待値xd,i,vと、属性情報バッファ202に格納された属性履歴情報から得られる、yd,iが属性sとなる期待値yd,i,sと、上記ステップS104で初期化又は後述するステップS114で前回算出されたzd,iから得られる、zd,iがトピックkとなる期待値zd,i,kとに基づいて、上記(28)〜(29)式に従って、商品統計量Nk,s,vと、トピック統計量Md,kを算出する。そして、統計量算出部40によって、商品統計量Nk,s,vを商品統計量バッファ220へ、トピック統計量Md,kをトピック統計量バッファ224へ、それぞれ格納する。また、算出された商品統計量Nk,s,vと、トピック統計量Md,kと、事前に設定されたα^、及びλ^とに基づいて、上記(31)〜(32)式に従って、パラメータ
、及び^αd,k’を算出して、商品統計量バッファ220、及びトピック統計量バッファ224に格納する。
ステップS1122において、トピック算出部42によって、上記ステップS1062で算出された各パラメータに基づいて、上記(30)式に従って、対象ユーザd及び対象の閲覧iについて、トピックk毎にzd,i=kである確率p(zd,i=k)を算出する。そして、トピックk毎に算出した当該確率に従って、zd,iの値をサンプリングして更新し、トピックバッファ204に格納する。
次に、ステップS1202において、混合確率算出部44によって、上記ステップS1062で算出された各統計量と、事前に設定されたα^、及びλ^とに基づいて、上記(33)〜(36)式に従って、(d、k)の各組み合わせについてのユーザ・トピック混合確率θd,kと、(k、s、v)の各組み合わせについてトピック・商品混合確率βk,s,vとを算出する。そして、混合確率算出部25によって、ユーザ・トピック混合確率θd,kをユーザ・トピック混合確率バッファ250へ、トピック・商品混合確率βk,s,vをトピック・商品混合確率バッファ252へ、それぞれ格納する。
ステップS1222において、出力確率算出部46によって、上記ステップS1202で算出されたトピック混合確率θd,k、及びトピック・商品混合確率βk,s,vに基づいて、上記(37)〜(38)式を計算し、ユーザ・商品出力確率vと、ユーザ・属性・商品出力確率vd,sとを算出する。そして、出力確率算出部46によって、ユーザ・商品出力確率v及びユーザ・属性・商品出力確率vd,sを、ユーザ・商品出力確率バッファ260へそれぞれ格納する。
なお、第2の実施の形態に係る行動確率推定装置100の他の構成及び作用については、第1の実施の形態と同様であるため、説明を省略する。
以上説明したように、第2の実施の形態に係る行動確率推定装置100によれば、ユーザdが、トピックkに属し、かつ属性sに属する商品vに対する閲覧行動の総数を表す商品統計量Nk,s,vを算出し、トピックkに関するユーザdの閲覧行動の総数を表すトピック統計量Md,kを算出し、変数zd,iがトピックkである確率を算出して変数zd,iの値をサンプリングにより更新し、繰り返し終了条件を満足するまで、各処理を繰り返し行い、ユーザdが各トピックkに属する確率を表すθd,kをサンプリングにより算出し、トピックkにおいて属性sの各商品vが選択される確率を表すβk,s,vをサンプリングにより算出し、θd,k、βk,s,vに基づいて、ユーザdが商品vについて閲覧行動をとる確率を表すユーザ商品確率v、及びユーザdが属性sの商品vについて閲覧行動をとる確率を表すユーザ属性商品確率vd,sを算出することにより、ユーザが閲覧行動をとる確率を精度よく推定することができる。
[第3の実施の形態]
<システム構成>
次に、本発明の第3の実施の形態について説明する。なお、第3の実施の形態に係る行動確率推定装置150の構成は、第1の実施の形態と同様の構成となるため、同一符号を付して説明を省略する。
第3の実施の形態では、ユーザdがi番目に閲覧した商品xd,iが、商品の属性yd,iに依存していない点が、第1の実施の形態と異なっている。すなわち、商品を選択する際に、ショップ(属性s)を考慮していないが、別個独立に商品の属性yd,iを算出している点が、第1の実施の形態と異なる。
第3の実施の形態に係る行動確率推定装置150において用いるモデルの概念図を、図13に示す。図13からわかるように、商品xd,iは商品の属性yd,iに依存していない。上記図13に示すモデルを数式で表すと以下のようになる。
この場合、後述するユーザ・商品出力確率は全属性で同一となる。商品xd,iは商品の属性yd,iに依存しないため、上記(40)、(41)式のβ^が第1の実施の形態における式(1)、(5)式と異なる。β^=(βk,1,βk,2,…,βk,V)であり、トピックkにおいて商品vが選択される確率分布である。
そこで、本実施の形態では、統計量算出部22は、以下の式に従って、各統計量を算出する。以下の(46)式では、商品統計量は属性の違いを考慮せず総和をとる。
統計量算出部22は、上記(46)〜(48)式を計算し、商品統計量Nk,vと、属性統計量Lk,sと、トピック統計量Md,kを算出する。
具体的には、統計量算出部22は、(k、s、v)の全ての組み合わせについて、商品情報バッファ200に格納されている商品履歴情報、及びトピックバッファ204に格納されているテーブルデータに基づいて、上記(46)式に従って、商品統計量Nk,vを算出して、商品統計量バッファ220に格納する。
また、統計量算出部22は、(d、i、k、v)の各組合せについて、商品統計量Nk,vに基づいて、Nk,v \(d,i)を算出して、商品統計量バッファ220に格納する。
また、統計量算出部22は、(k、s)の全ての組み合わせについて、属性情報バッファ202に格納されている属性履歴情報、及びトピックバッファ204に格納されているテーブルデータに基づいて、上記(47)式に従って、属性統計量Lk,sを算出して、属性統計量バッファ222に格納する。
また、統計量算出部22は、(d、i、k、s)の各組合せについて、属性統計量Lk,sに基づいて、Lk,s \(d,i)を算出して、属性統計量バッファ222に格納する。
また、統計量算出部22は、(d、k)の全ての組み合わせについて、トピックバッファ204に格納されているテーブルデータに基づいて、上記(48)式に従って、トピック統計量Md,kを算出して、トピック統計量バッファ224に格納する。
また、統計量算出部22は、(d、i、k)の各組合せについて、トピック統計量Md,kに基づいて、Md,k \(d,i)を算出して、トピック統計量バッファ224に格納する。
また、統計量算出部22は、(d,i,k,v)の各組み合わせについて、事前に設定されているλ^の要素であるλと、上記の商品統計量バッファ220に格納されているNk,v \(d,i)とに基づいて、後述する(50)式に従って、^λk,vを算出する。次に、統計量算出部22は、(d,i,k,s)の各組み合わせについて、事前に設定されているη^の要素であるηと、上記の属性統計量バッファ222に格納されているLk,s \(d,i)とに基づいて、後述する(51)式に従って、^ηk,sを算出する。そして、統計量算出部22は、(d,i,k)の各組み合わせについて、事前に設定されているα^の要素であるαk’と、上記のトピック統計量バッファ224に格納されているMd,k \(d,i)とに基づいて、後述する(52)式に従って、^αd,k’を算出する。
トピック算出部23は、以下の(49)式を計算し、(d、i)の全ての組み合わせについて、zd,iを算出する。
ここで、Nk,v \(d,i)は、ユーザdのi番目の商品の閲覧を除いた場合の、属性yd,iであって、かつトピックkに属する商品vについての閲覧行動の総数である。また、Lk,s \(d,i)は、ユーザdのi番目の商品の閲覧を除いた場合の、トピックkに属し、かつ、属性sである任意の商品について閲覧行動の総数である。また、Md,k \(d,i)は、ユーザdのi番目の商品の閲覧を除いた場合の、トピックkに属する任意の商品についてユーザdが閲覧した閲覧行動の総数である。
具体的には、トピック算出部23は、(d、i)の全ての組み合わせについて、統計量算出部22によって算出された各
、各^ηk,s、及び各^αd,k’に基づいて、上記(49)式に従って、トピックk毎に、zd,i=kである確率p(zd,i=k)を算出する。そして、トピックkの各々について算出した当該確率に従って、zd,iの値をサンプリングして更新し、トピックバッファ204に格納する。
混合確率算出部25は、以下の(53)〜(58)式を計算し、ユーザ・トピック混合確率θ^と、トピック・商品混合確率βk,s^と、トピック・属性混合確率ψ^とを算出する。
ここで、上記(53)〜(58)式におけるX^は、商品情報バッファ200に格納されているxd,iを要素とする二次元配列、Y^は、属性情報バッファ202に格納されているyd,iを要素とする二次元配列、Z^は、トピックバッファ204に格納されているzd,iを要素とする二次元配列を表す。
具体的には、混合確率算出部25は、ユーザdの各々に対し、上記(53)及び(54)式に示すように、トピックkの各々について、ユーザ・トピック混合確率θd,kの各々をサンプリングして求め、ユーザ・トピック混合確率バッファ250に格納する。
また、混合確率算出部25は、(k、s)の組み合わせの各々に対し、上記(55)及び(56)式に示すように、商品vの各々について、トピック・商品混合確率βk,vの各々をサンプリングして求め、トピック・商品混合確率バッファ252に格納する。
また、混合確率算出部25は、トピックkの各々に対し、上記(57)及び(58)式に示すように、属性sの各々について、トピック・属性混合確率ψk,sの各々をサンプリングして求め、トピック・属性混合確率バッファ254に格納する。
出力確率算出部26は、以下に示す(59)〜(60)式に従って、ユーザdが商品vを閲覧する確率を表すユーザ・商品出力確率vと、ユーザdが属性sの任意の商品を閲覧する確率を表すユーザ・属性出力確率sとを算出する。
具体的には、出力確率算出部26は、複数のユーザdの各々について、商品v毎に、ユーザ・トピック混合確率バッファ250に格納された当該ユーザd及び各トピックkのθd,kと、トピック・商品混合確率バッファ252に格納された当該商品vの各トピックkの全ての組み合わせのβk,vとに基づいて、上記(59)式に従って、当該ユーザdが当該商品vを閲覧する確率を表すユーザ・商品出力確率vを算出して、当該ユーザ・商品出力確率vをユーザ・商品出力確率バッファ260に格納する。
また、出力確率算出部26は、複数のユーザdの各々について、属性s毎に、ユーザ・トピック混合確率バッファ250に格納された当該ユーザd及び各トピックkについてのθd,kの各々と、トピック・属性混合確率バッファ254に格納された当該属性s及び各トピックkについてのψs,kの各々とに基づいて、上記(60)式に従って、当該ユーザdが当該属性sの任意の商品を閲覧する確率を表すユーザ・属性出力確率sを算出して、当該ユーザ・属性出力確率sをユーザ・属性出力確率バッファ262に格納する。
なお、第3の実施の形態に係る行動確率推定装置150の作用については、第1の実施の形態と同様であるため、説明を省略する。
以上説明したように、第3の実施の形態に係る行動確率推定装置150によれば、ユーザdが、各商品vに対して閲覧行動をとった商品vの履歴、及び閲覧行動をとった商品vの属性sの履歴を示す商品情報に基づいて、トピックkに属する商品vに対する閲覧行動の総数を表す商品統計量Nk,vを算出し、トピックk及び属性sに関する閲覧行動の総数を表す属性統計量Lk,sを算出し、トピックkに関するユーザdの閲覧行動の総数を表すトピック統計量Md,kを算出し、変数zd,iがトピックkである確率を算出し変数zd,iの値をサンプリングにより更新し、繰り返し終了条件を満足するまで、各処理を繰り返し行い、商品統計量Nk,v、属性統計量Lk,s、トピック統計量Md,k、変数zd,iの値を決定し、ユーザdが各トピックkに属する確率を表すθd,kをサンプリングにより算出し、トピックkにおいて各商品vが選択される確率を表すβk,vをサンプリングにより算出し、トピックkにおいて属性sが選択される確率を表すψk,sをサンプリングにより算出し、ユーザdが商品vについて閲覧行動をとる確率を表すユーザ商品確率vを算出し、ユーザdが属性sの任意の商品について閲覧行動をとる確率を表すユーザ属性確率sを算出することにより、ユーザの行動確率を精度よく推定することができる。
なお、本発明は、上述した実施形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。
例えば、本実施の形態に係る行動確率推定装置では、ユーザの閲覧行動に対して行動確率を推定する場合を例に説明したが、これに限定されるものではなく、購買行動をとる行動確率を推定してもよい。この場合には、ユーザdが、各商品vに対して購買行動をとった商品vの履歴、及び購買行動をとった商品vの属性sの履歴を示す商品情報に基づいて、トピックkに属する商品vに対する購買行動の総数を表す商品統計量Nk,vを算出し、トピックk及び属性sに関する購買行動の総数を表す属性統計量Lk,sを算出し、トピックkに関するユーザdの購買行動の総数を表すトピック統計量Md,kを算出するようにすればよい。
また、上述の行動確率推定装置は、各バッファを備えている場合を例に説明したが、例えば各バッファが行動確率推定装置の外部装置に設けられ、行動確率推定装置は、外部装置と通信手段を用いて通信することにより、各バッファを参照するようにしてもよい。
また、上述の行動確率推定装置は、内部にコンピュータシステムを有しているが、コンピュータシステムは、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、本願明細書中において、プログラムが予めインストールされている実施形態として説明したが、当該プログラムを、コンピュータ読取り可能な記録媒体に格納して提供することも可能である。
1 入力部
2 ユーザプロファイル・閲覧予測算出部
3 出力部
10、100、150 行動確率推定装置
20 情報記憶部
21 初期化部
22、40 統計量算出部
23、42 トピック算出部
24 反復判定部
25、44 混合確率算出部
26、46 出力確率算出部
200 商品情報バッファ
202 属性情報バッファ
204 トピックバッファ
220 商品統計量バッファ
222 属性統計量バッファ
224 トピック統計量バッファ
250 ユーザ・トピック混合確率バッファ
252 トピック・商品混合確率バッファ
254 トピック・属性混合確率バッファ
260 ユーザ・商品出力確率バッファ
262 ユーザ・属性出力確率バッファ

Claims (6)

  1. 複数のユーザdの各々について、各アイテムvに対して購買行動及び閲覧行動の何れか一方である行動をとる確率を推定する行動確率推定装置であって、
    前記複数のユーザdの各々について前記行動をとったアイテムvの前記行動毎の履歴、及び前記複数のユーザdの各々について前記行動をとったアイテムの属性sの前記行動毎の履歴を示すアイテム情報に基づいて、前記ユーザdの各々について、前記ユーザdがi番目に前記行動を取ったアイテムが属するトピックが、予め定められたK個のトピックkの何れであるかを示す変数zd,iを初期化する初期化手段と、
    (k、s、v)の全ての組み合わせについて、前記アイテム情報と前記変数zd,iとに基づいて、前記トピックkに属し、かつ前記属性sに属す前記アイテムvに対する前記行動の総数を表すアイテム統計量Nk,s,vを算出するアイテム統計量算出手段と、
    (k、s)の全ての組み合わせについて、前記アイテム情報と前記変数zd,iとに基づいて、前記トピックk及び前記属性sに関する前記行動の総数を表す属性統計量Lk,sを算出する属性統計量算出手段と、
    (d、k)の全ての組み合わせについて、前記変数zd,iに基づいて、前記トピックkに関する前記ユーザdの前記行動の総数を表すトピック統計量Md,kを算出するトピック統計量算出手段と、
    (d、i)の全ての組み合わせについて、前記トピックkの各々について、前記トピックk、及び前記ユーザdがi番目に前記行動をとったアイテムの前記属性sに関する前記アイテム統計量Nk,s,vの各々と、前記トピックkに関する前記属性統計量Lk,sの各々と、前記ユーザdに関する前記トピック統計量Md,kの各々とに基づいて、前記ユーザdがi番目に前記行動をとったアイテムのトピックを表わす前記変数zd,iが前記トピックkである確率を算出し、前記トピックkの各々について算出した前記確率に従って、前記変数zd,iの値をサンプリングにより更新するトピック算出手段と、
    繰り返し終了条件を満足するまで、前記アイテム統計量算出手段による算出、前記属性統計量算出手段による算出、前記トピック統計量算出手段による算出、及び前記トピック算出手段による更新を繰り返す反復判定手段と、
    前記複数のユーザdの各々に対し、前記ユーザd及び各トピックkについて算出された前記トピック統計量Md,kの各々に基づくディリクレ分布に従って、前記ユーザdが各トピックkに属する確率を表すθd,kをサンプリングにより各々算出するユーザ・トピック混合確率算出手段と、
    (k、s)の全ての組み合わせに対し、前記トピックk、前記属性s、及び各アイテムvについて算出された前記アイテム統計量Nk,s,vの各々に基づくディリクレ分布に従って、前記トピックkにおいて前記属性sの各アイテムvが選択される確率を表すβk,s,vをサンプリングにより各々算出するトピック・アイテム混合確率算出手段と、
    前記K個のトピックkの各々に対し、前記トピックk及び各属性sについて算出された前記属性統計量Lk,sの各々に基づくディリクレ分布に従って、前記トピックkにおいて前記属性sが選択される確率を表すψk,sをサンプリングにより各々算出するトピック・属性混合確率算出手段と、
    前記複数のユーザdの各々について、前記アイテムv毎に、(s、k)の全ての組み合わせについての、前記θd,kと、前記ψs,kと、前記βk,s,vとの積の総和を算出して、前記ユーザdが前記アイテムvについて前記行動をとる確率を表すユーザアイテム確率vを算出し、又は、前記複数のユーザdの各々について、アイテムvと属性sとの組み合わせ毎に、各トピックkについて、前記θd,kと、前記ψs,kと、前記βk,s,vとの積の総和を算出して、前記ユーザdが前記属性sの前記アイテムvについて前記行動をとる確率を表すユーザ属性アイテム確率vd,sを算出するアイテム確率算出手段と、
    を含む行動確率推定装置。
  2. 前記複数のユーザdの各々について、前記属性s毎に、各トピックkについて、前記θd,kと、前記ψs,kとの積の総和を算出して、前記ユーザdが前記属性sの任意のアイテムについて前記行動をとる確率を表すユーザ属性確率sを算出するユーザ属性確率算出手段を更に含む請求項1記載の行動確率推定装置。
  3. 複数のユーザdの各々について、各アイテムvに対して購買行動及び閲覧行動の何れか一方である行動をとる確率を推定する行動確率推定装置であって、
    前記複数のユーザdの各々について前記行動をとったアイテムvの前記行動毎の履歴、及び前記複数のユーザdの各々について前記行動をとったアイテムの属性sの前記行動毎の履歴を示すアイテム情報に基づいて、
    前記ユーザdの各々について、前記ユーザdがi番目に前記行動を取ったアイテムvが属するトピックが、予め定められたK個のトピックkの何れであるかを示す変数zd,iを初期化する初期化手段と、
    (k、s、v)の全ての組み合わせについて、前記アイテム情報と前記変数zd,iとに基づいて、前記トピックkに属し、かつ前記属性sに属す前記アイテムvに対する前記行動の総数を表すアイテム統計量Nk,s,vを算出するアイテム統計量算出手段と、
    (d、k)の全ての組み合わせについて、前記変数zd,iに基づいて、前記トピックkに関する前記ユーザdの前記行動の総数を表すトピック統計量Md,kを算出するトピック統計量算出手段と、
    (d、i)の全ての組み合わせについて、前記トピックkの各々について、前記トピックk、及び前記ユーザdがi番目に前記行動をとったアイテムの前記属性sに関する前記アイテム統計量Nk,s,vの各々と、前記ユーザdに関する前記トピック統計量Md,kの各々とに基づいて、前記ユーザdがi番目に前記行動をとったアイテムのトピックを表わす前記変数zd,iが前記トピックkである確率を算出し、前記トピックkの各々について算出した前記確率に従って、前記変数zd,iの値をサンプリングにより更新するトピック算出手段と、
    繰り返し終了条件を満足するまで、前記アイテム統計量算出手段による算出、前記トピック統計量算出手段による算出、及び前記トピック算出手段による更新を繰り返す反復判定手段と、
    前記複数のユーザdの各々に対し、前記ユーザd及び各トピックkについて算出された前記トピック統計量Md,kの各々に基づくディリクレ分布に従って、前記ユーザdが各トピックkに属する確率を表すθd,kをサンプリングにより各々算出するユーザ・トピック混合確率算出手段と、
    (k、s)の全ての組み合わせに対し、前記トピックk、前記属性s、及び各アイテムvについて算出された前記アイテム統計量Nk,s,vの各々に基づくディリクレ分布に従って、前記トピックkにおいて前記属性sの各アイテムvが選択される確率を表すβk,s,vをサンプリングにより各々算出するトピック・アイテム混合確率算出手段と、
    前記複数のユーザdの各々について、前記アイテムv毎に、(s、k)の全ての組み合わせについての、前記θd,kと、前記βk,s,vとの積の総和を算出して、前記ユーザdが前記アイテムvについて前記行動をとる確率を表すユーザアイテム確率vを算出し、又は、前記複数のユーザdの各々について、アイテムvと属性sとの組み合わせ毎に、各トピックkについて、前記θd,kと、前記βk,s,vとの積の総和を算出して、前記ユーザdが前記属性sの前記アイテムvについて前記行動をとる確率を表すユーザ属性アイテム確率vd,sを算出するアイテム確率算出手段と、
    を含む行動確率推定装置。
  4. 初期化手段、アイテム統計量算出手段、属性統計量算出手段、トピック統計量算出手段、トピック算出手段、反復判定手段、ユーザ・トピック混合確率算出手段、トピック・アイテム混合確率算出手段、トピック・属性混合確率算出手段、アイテム確率算出手段、及びユーザ属性確率算出手段を含み、複数のユーザdの各々について、各アイテムvに対して購買行動及び閲覧行動の何れか一方である行動をとる確率を推定する行動確率推定装置における行動確率推定方法であって、
    前記初期化手段によって、前記複数のユーザdの各々について前記行動をとったアイテムvの履歴、及び前記複数のユーザdの各々について前記行動をとったアイテムvの属性sの履歴を示すアイテム情報に基づいて、
    前記ユーザdの各々について、前記ユーザdがi番目に前記行動を取ったアイテムvが属するトピックが、予め定められたK個のトピックkの何れであるかを示す変数zd,iを初期化するステップと、
    前記アイテム統計量算出手段によって、(k、s、v)の全ての組み合わせについて、前記アイテム情報と前記変数zd,iとに基づいて、前記トピックkに属し、かつ前記属性sに属す前記アイテムvに対する前記行動の総数を表すアイテム統計量Nk,s,vを算出するステップと、
    前記属性統計量算出手段によって、(k、s)の全ての組み合わせについて、前記アイテム情報と前記変数zd,iとに基づいて、前記トピックk及び前記属性sに関する前記行動の総数を表す属性統計量Lk,sを算出するステップと、
    前記トピック統計量算出手段によって、(d、k)の全ての組み合わせについて、前記変数zd,iに基づいて、前記トピックkに関する前記ユーザdの前記行動の総数を表すトピック統計量Md,kを算出するステップと、
    前記トピック算出手段によって、前記複数のユーザdの各々に対し、前記トピックkの各々について、前記トピックk、及び前記ユーザdがi番目に前記行動をとったアイテムの前記属性sに関する前記アイテム統計量Nk,s,vの各々と、前記トピックkに関する前記属性統計量Lk,sの各々と、前記ユーザdに関する前記トピック統計量Md,kの各々と前記ユーザdがi番目に前記行動をとったアイテムのトピックを表わす前記変数zd,iが前記トピックkである確率を算出し、前記トピックkについて算出した前記確率に従って、前記変数zd,iの値をサンプリングにより更新するステップと、
    前記反復判定手段によって、繰り返し終了条件を満足するまで、前記アイテム統計量算出手段による算出、前記属性統計量算出手段による算出、前記トピック統計量算出手段による算出、及び前記トピック算出手段による更新を繰り返すステップと、
    前記ユーザ・トピック混合確率算出手段によって、前記複数のユーザdの各々に対し、前記ユーザd及び各トピックkについて算出された前記トピック統計量Md,kの各々に基づくディリクレ分布に従って、前記ユーザdが各トピックkに属する確率を表すθd,kをサンプリングにより各々算出するステップと、
    前記トピック・アイテム混合確率算出手段によって、(k、s)の全ての組み合わせに対し、前記トピックk、前記属性s、及び各アイテムvについて算出された前記アイテム統計量Nk,s,vの各々に基づくディリクレ分布に従って、前記トピックkにおいて前記属性sの各アイテムvが選択される確率を表すβk,s,vをサンプリングにより各々算出するステップと、
    前記トピック・属性混合確率算出手段によって、前記K個のトピックkの各々に対し、前記トピックk及び各属性sについて算出された前記属性統計量Lk,sの各々に基づくディリクレ分布に従って、前記トピックkにおいて前記属性sが選択される確率を表すψk,sをサンプリングにより各々算出するステップと、
    前記アイテム確率算出手段によって、前記複数のユーザdの各々について、前記アイテムv毎に、(s、k)の全ての組み合わせについての、前記θd,kと、前記ψs,kと、前記βk,s,vとの積の総和を算出して、前記ユーザdが前記アイテムvについて前記行動をとる確率を表すユーザアイテム確率vを算出し、又は、前記複数のユーザdの各々について、アイテムvと属性sとの組み合わせ毎に、各トピックkについて、前記θd,kと、前記ψs,kと、前記βk,s,vとの積の総和を算出して、前記ユーザdが前記属性sの前記アイテムvについて前記行動をとる確率を表すユーザ属性アイテム確率vd,sを算出するステップと、
    前記ユーザ属性確率算出手段によって、前記複数のユーザdの各々について、前記属性s毎に、各トピックkについて、前記θd,kと、前記ψs,kとの積の総和を算出して、前記ユーザdが前記属性sの任意のアイテムについて前記行動をとる確率を表すユーザ属性確率sを算出するステップと、
    を含む行動確率推定方法。
  5. 初期化手段、アイテム統計量算出手段、トピック統計量算出手段、トピック算出手段、反復判定手段、ユーザ・トピック混合確率算出手段、トピック・アイテム混合確率算出手段、アイテム確率算出手段、及びユーザ属性確率算出手段を含み、複数のユーザdの各々について、各アイテムvに対して購買行動及び閲覧行動の何れか一方である行動をとる確率を推定する行動確率推定装置における行動確率推定方法であって、
    前記初期化手段によって、前記複数のユーザdの各々について前記行動をとったアイテムvの履歴、及び前記複数のユーザdの各々について前記行動をとったアイテムvの属性sの履歴を示すアイテム情報に基づいて、
    前記ユーザdの各々について、前記ユーザdがi番目に前記行動を取ったアイテムvが属するトピックが、予め定められたK個のトピックkの何れであるかを示す変数zd,iを初期化するステップと、
    前記アイテム統計量算出手段によって、(k、s、v)の全ての組み合わせについて、前記アイテム情報と前記変数zd,iとに基づいて、前記トピックkに属し、かつ前記属性sに属す前記アイテムvに対する前記行動の総数を表すアイテム統計量Nk,s,vを算出するステップと、
    前記トピック統計量算出手段によって、(d、k)の全ての組み合わせについて、前記変数zd,iに基づいて、前記トピックkに関する前記ユーザdの前記行動の総数を表すトピック統計量Md,kを算出するステップと、
    前記トピック算出手段によって、前記複数のユーザdの各々に対し、前記トピックkの各々について、前記トピックk、及び前記ユーザdがi番目に前記行動をとったアイテムの前記属性sに関する前記アイテム統計量Nk,s,vの各々と、前記トピックkに関する前記属性統計量Lk,sの各々と、前記ユーザdに関する前記トピック統計量Md,kの各々と前記ユーザdがi番目に前記行動をとったアイテムのトピックを表わす前記変数zd,iが前記トピックkである確率を算出し、前記トピックkについて算出した前記確率に従って、前記変数zd,iの値をサンプリングにより更新するステップと、
    前記反復判定手段によって、繰り返し終了条件を満足するまで、前記アイテム統計量算出手段による算出、前記トピック統計量算出手段による算出、及び前記トピック算出手段による更新を繰り返すステップと、
    前記ユーザ・トピック混合確率算出手段によって、前記複数のユーザdの各々に対し、前記ユーザd及び各トピックkについて算出された前記トピック統計量Md,kの各々に基づくディリクレ分布に従って、前記ユーザdが各トピックkに属する確率を表すθd,kをサンプリングにより各々算出するステップと、
    前記トピック・アイテム混合確率算出手段によって、(k、s)の全ての組み合わせに対し、前記トピックk、前記属性s、及び各アイテムvについて算出された前記アイテム統計量Nk,s,vの各々に基づくディリクレ分布に従って、前記トピックkにおいて前記属性sの各アイテムvが選択される確率を表すβk,s,vをサンプリングにより各々算出するステップと、
    前記アイテム確率算出手段によって、前記複数のユーザdの各々について、前記アイテムv毎に、(s、k)の全ての組み合わせについての、前記θd,kと、前記βk,s,vとの積の総和を算出して、前記ユーザdが前記アイテムvについて前記行動をとる確率を表すユーザアイテム確率vを算出し、又は、前記複数のユーザdの各々について、アイテムvと属性sとの組み合わせ毎に、各トピックkについて、前記θd,kと、前記βk,s,vとの積の総和を算出して、前記ユーザdが前記属性sの前記アイテムvについて前記行動をとる確率を表すユーザ属性アイテム確率vd,sを算出するステップと、
    前記ユーザ属性確率算出手段によって、前記複数のユーザdの各々について、前記属性s毎に、各トピックkについて、前記θd,kの総和を算出して、前記ユーザdが前記属性sの任意のアイテムについて前記行動をとる確率を表すユーザ属性確率sを算出するステップと、
    を含む行動確率推定方法。
  6. コンピュータを、請求項1〜請求項3の何れか1項に記載の行動確率推定装置の各手段として機能させるためのプログラム。
JP2013043507A 2013-03-05 2013-03-05 行動確率推定装置、方法、及びプログラム Expired - Fee Related JP5860828B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013043507A JP5860828B2 (ja) 2013-03-05 2013-03-05 行動確率推定装置、方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013043507A JP5860828B2 (ja) 2013-03-05 2013-03-05 行動確率推定装置、方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2014174567A JP2014174567A (ja) 2014-09-22
JP5860828B2 true JP5860828B2 (ja) 2016-02-16

Family

ID=51695771

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013043507A Expired - Fee Related JP5860828B2 (ja) 2013-03-05 2013-03-05 行動確率推定装置、方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP5860828B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6025796B2 (ja) * 2014-10-07 2016-11-16 日本電信電話株式会社 行動予測装置、行動予測方法及びプログラム
JP7018857B2 (ja) * 2018-09-18 2022-02-14 ヤフー株式会社 情報処理装置、情報処理方法、及び情報処理プログラム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002117048A (ja) * 2000-10-10 2002-04-19 D Tank:Kk 購買動機顕在化方法と適合商品・顧客抽出方法とその為の装置
US20070271141A1 (en) * 2006-03-01 2007-11-22 Storm Paul V Method and System for Predicting Purchases
JP5056803B2 (ja) * 2009-06-30 2012-10-24 株式会社Jvcケンウッド 情報提供サーバ及び情報提供方法
JP5331159B2 (ja) * 2011-05-17 2013-10-30 日本電信電話株式会社 商品推薦方法、商品推薦装置及び商品推薦プログラム
JP5801257B2 (ja) * 2012-06-13 2015-10-28 日本電信電話株式会社 商品多様化推薦装置及び方法及びプログラム

Also Published As

Publication number Publication date
JP2014174567A (ja) 2014-09-22

Similar Documents

Publication Publication Date Title
Jacobs et al. Model-based purchase predictions for large assortments
JP5988419B2 (ja) 予測方法、予測システムおよびプログラム
JP6352798B2 (ja) マーケティング施策最適化装置、方法、及びプログラム
CN111815415A (zh) 一种商品推荐方法、系统及设备
CN106251174A (zh) 信息推荐方法及装置
WO2018200996A1 (en) Method and system of managing item assortment based on demand transfer
US9727653B2 (en) System and method for identifying and ranking user preferences
CN108205775A (zh) 一种业务对象的推荐方法、装置和客户端
Alexopoulos et al. DESYMA: assessing flexibility for the lifecycle of manufacturing systems
CN108572984A (zh) 一种实时用户兴趣识别方法及装置
Jia et al. Users' brands preference based on SVD++ in recommender systems
WO2020221022A1 (zh) 业务对象推荐方法
KR101639656B1 (ko) 광고 제공 방법 및 서버 장치
Yi et al. Scalable demand-aware recommendation
Zhang et al. Application and research of improved probability matrix factorization techniques in collaborative filtering
JP6101620B2 (ja) 購買予測装置、方法、及びプログラム
Cinicioglu et al. A new heuristic for learning Bayesian networks from limited datasets: a real-time recommendation system application with RFID systems in grocery stores
JP2009244981A (ja) 解析装置、解析方法及び解析プログラム
Lopes et al. A comparison of estimation methods in non-stationary ARFIMA processes
JP4386973B2 (ja) 階層的予測モデル構築装置及びその方法
JP5860828B2 (ja) 行動確率推定装置、方法、及びプログラム
Crönert et al. Inverse optimization of integer programming games for parameter estimation arising from competitive retail location selection
Diwandari et al. Research Methodology for Analysis of E-Commerce User Activity Based on User Interest using Web Usage Mining.
JP2012194741A (ja) 行列形データの欠損値予測装置、欠損値予測計算方法および欠損値予測プログラム
WO2023120126A1 (ja) 販売数量予測システム、販売数量予測方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150205

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20151125

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151208

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20151221

R150 Certificate of patent or registration of utility model

Ref document number: 5860828

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees