JP6025796B2 - 行動予測装置、行動予測方法及びプログラム - Google Patents
行動予測装置、行動予測方法及びプログラム Download PDFInfo
- Publication number
- JP6025796B2 JP6025796B2 JP2014206241A JP2014206241A JP6025796B2 JP 6025796 B2 JP6025796 B2 JP 6025796B2 JP 2014206241 A JP2014206241 A JP 2014206241A JP 2014206241 A JP2014206241 A JP 2014206241A JP 6025796 B2 JP6025796 B2 JP 6025796B2
- Authority
- JP
- Japan
- Prior art keywords
- domain
- topic
- user
- probability
- action
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 21
- 230000006399 behavior Effects 0.000 claims description 88
- 230000009471 action Effects 0.000 claims description 71
- 239000000203 mixture Substances 0.000 claims description 21
- 238000004364 calculation method Methods 0.000 claims description 15
- 230000006870 function Effects 0.000 claims description 5
- 238000010606 normalization Methods 0.000 claims description 2
- 238000000605 extraction Methods 0.000 description 15
- 238000010586 diagram Methods 0.000 description 10
- 235000013305 food Nutrition 0.000 description 7
- 239000000284 extract Substances 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 235000012054 meals Nutrition 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000010411 cooking Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
本発明は、行動予測装置、行動予測方法及びプログラムに関する。特に、本発明は、複数のドメインにおけるユーザの行動履歴を用いて、同一のユーザプロファイルを適用するドメイン群を抽出し、ユーザの行動を予測する行動予測装置に関する。
近年個人の行動履歴を蓄積する技術が進み、パーソナライズしたサービスの重要性が高まってきている。例えば、ユーザごとにWebサイトの表示を変えたり、携帯端末のアプリの表示を変えたり、ウェアラブルコンピュータへの表示を変えたりするサービスなどが挙げられる。パーソナライズしない場合には、全体の人気を用いた表示をする方法がある。例えば、最近一番売れている商品群を提示することや、今一番利用されているキーワード群を提示することなどが挙げられる。
パーソナライズの方法の一つとして、トピックモデルを用いたユーザプロファイルを使った方法がある。トピックモデルはZ個の代表的な行動確率を考える。購買を例にすると、買われる商品群のパタンと購買される確率をZ個用意する。トピックモデルは各ユーザをZ個のパタンの混合であらわすとモデル化し、その混合率はユーザプロファイルとみなす。以降、ユーザプロファイルをトピック混合率とも呼ぶ。例えば、どれか一つのパタンであらわされる極端なユーザを考えた場合(混合率がどれか一つだけ1で他は0の場合)、そのユーザの行動をもっとも説明するZ個の購買傾向のうち一つのパタンを用いてパーソナライズする。これは、ユーザがZ個のどのセグメントに属するかを判断し、そのセグメントで人気の商品群を提示しパーソナライズすることと同義である。トピック混合率を用いることで、ある商品が売れやすいトピックに属するユーザを抽出してターゲットユーザとすることや、トピック混合率で各トピックの行動確率を混合したモデルを用いて、ユーザの行動を予測することが可能になる(非特許文献1参照)。
岩田具治ほか 「購買行動解析のためのトピック追跡モデル」 電子情報通信学会誌 DVol.J93-D, No.6, pp.978-987
Gui-Rong Xueほか 「Topic-bridged PLSA for Cross-Domain Text Classification」SIGIR '08 Proceedings of the 31st annual international ACM SIGIR conference on Research and development in information retrieval, Pages 627-634
一方で、最近マルチドメインのデータが手に入るようになってきている。例えば、ポータルサイトにおいて同一IDを利用して音楽、ファッション、食事、検索などの複数ドメインを利用したデータが取得可能になっている。この場合、各ドメインにおいてパーソナライズした結果をユーザに提示することになる。パーソナライズしない場合では、あるドメインにおける全体の人気を用いた表示を行うことになる。そこで、この場合も同様にドメインごとにZ個の代表的な行動パタンとその確率を考え、そのドメインでのユーザの行動をその混合でモデル化する。しかし、この場合にはユーザのトピック混合率をドメインごとに算出することになるが、ユーザは全ドメインを利用するわけではないのでユーザが未利用のドメインではパーソナライズすることができない。そこで、もっとも基本的なモデルとしてユーザの混合率は全ドメインで同一とする方法がある。こうすれば、他のドメインの行動から算出されたトピック混合率を用いて、未知のドメインでのパーソナライズを実現できる。
ここで、ドメインとは、トピックモデルにおいてユーザの行動を分析するための予め決められた範囲を表す。ドメインの例は次のものが考えられる。例えば複数サイトでの行動履歴を考えれば、ドメインはサイトと考えられる。以下、ドメインをサイトで置き換えることとする。ドメインは、ショップ、カテゴリ、地域、ジャンルなど行動履歴によって様々なものが考えられる。以下はドメインをサイトと置き換えた例とし、ドメインをサイトと呼ぶこととする。
ドメインをサイトと置き換えた例において、どれか一つのパタンであらわされる極端なユーザを再び考えると、そのユーザはどのサイトでも同一のトピック混合率でモデル化することになる。しかし、ユーザはサイトによって行動傾向を変えることが考えられるため、正しくモデル化できない。
例えば、音楽配信サイト、CD販売サイト、CDレンタルサイトなどの音楽サイトでユーザが選択する行動傾向は近いと考えられる。例えばクラシック好きな人が選ぶ曲には傾向が存在する。また、グルメ検索サイト、飲食店評価サイト、料理レシピサイトなどの食事関連サイトでユーザが選択する行動も近いと考えられる。しかし、クラシック好きの人が洋食好きである場合もあれば、和食好きである場合もあるように、異なるサイト群では傾向が異なる可能性がある。
本発明は、複数のドメインにおけるユーザの行動履歴を用いて、同一のユーザプロファイルを適用するドメイン群を抽出し、ユーザの行動を予測する行動予測装置、行動予測方法及びプログラムを提供することを目的とする。
本発明の一形態に係る行動予測装置は、
複数のドメインにおけるユーザの行動履歴を用いて、ユーザの行動を予測する行動予測装置であって、
ユーザごと且つドメインごとにユーザの行動が集計されたユーザ行動履歴群を取得するデータ入力部と、
前記ユーザ行動履歴群から、あるユーザがあるドメインである行動を選択した回数を算出する統計量算出部と、
前記算出された回数から、ユーザのドメイン利用を1つ以上のパタンの混合でモデル化した場合のトピックであるドメイントピックと、ユーザの行動を1つ以上のパタンの混合で表した場合のトピックとを決定し、ドメイントピックごとのドメインの利用確率を示すドメイントピック−ドメイン利用確率と、ドメイントピックごとのユーザのトピック混合率を示すドメイン別ユーザ−トピック帰属確率と、ドメインにおけるユーザの行動確率を示すドメイン別トピック−行動選択確率とを学習するモデル学習部と、
前記ドメイントピック−ドメイン利用確率、前記ドメイン別ユーザ−トピック帰属確率及び前記ドメイン別トピック−行動選択確率を出力するデータ出力部と、
を有することを特徴とする。
複数のドメインにおけるユーザの行動履歴を用いて、ユーザの行動を予測する行動予測装置であって、
ユーザごと且つドメインごとにユーザの行動が集計されたユーザ行動履歴群を取得するデータ入力部と、
前記ユーザ行動履歴群から、あるユーザがあるドメインである行動を選択した回数を算出する統計量算出部と、
前記算出された回数から、ユーザのドメイン利用を1つ以上のパタンの混合でモデル化した場合のトピックであるドメイントピックと、ユーザの行動を1つ以上のパタンの混合で表した場合のトピックとを決定し、ドメイントピックごとのドメインの利用確率を示すドメイントピック−ドメイン利用確率と、ドメイントピックごとのユーザのトピック混合率を示すドメイン別ユーザ−トピック帰属確率と、ドメインにおけるユーザの行動確率を示すドメイン別トピック−行動選択確率とを学習するモデル学習部と、
前記ドメイントピック−ドメイン利用確率、前記ドメイン別ユーザ−トピック帰属確率及び前記ドメイン別トピック−行動選択確率を出力するデータ出力部と、
を有することを特徴とする。
また、本発明の一形態に係る行動予測方法は、
複数のドメインにおけるユーザの行動履歴を用いて、ユーザの行動を予測する行動予測装置における行動予測方法であって、
ユーザごと且つドメインごとにユーザの行動が集計されたユーザ行動履歴群を取得するステップと、
前記ユーザ行動履歴群から、あるユーザがあるドメインである行動を選択した回数を算出するステップと、
前記算出された回数から、ユーザのドメイン利用を1つ以上のパタンの混合でモデル化した場合のトピックであるドメイントピックと、ユーザの行動を1つ以上のパタンの混合で表した場合のトピックとを決定し、ドメイントピックごとのドメインの利用確率を示すドメイントピック−ドメイン利用確率と、ドメイントピックごとのユーザのトピック混合率を示すドメイン別ユーザ−トピック帰属確率と、ドメインにおけるユーザの行動確率を示すドメイン別トピック−行動選択確率とを学習するステップと、
前記ドメイントピック−ドメイン利用確率、前記ドメイン別ユーザ−トピック帰属確率及び前記ドメイン別トピック−行動選択確率を出力するステップと、
を有することを特徴とする。
複数のドメインにおけるユーザの行動履歴を用いて、ユーザの行動を予測する行動予測装置における行動予測方法であって、
ユーザごと且つドメインごとにユーザの行動が集計されたユーザ行動履歴群を取得するステップと、
前記ユーザ行動履歴群から、あるユーザがあるドメインである行動を選択した回数を算出するステップと、
前記算出された回数から、ユーザのドメイン利用を1つ以上のパタンの混合でモデル化した場合のトピックであるドメイントピックと、ユーザの行動を1つ以上のパタンの混合で表した場合のトピックとを決定し、ドメイントピックごとのドメインの利用確率を示すドメイントピック−ドメイン利用確率と、ドメイントピックごとのユーザのトピック混合率を示すドメイン別ユーザ−トピック帰属確率と、ドメインにおけるユーザの行動確率を示すドメイン別トピック−行動選択確率とを学習するステップと、
前記ドメイントピック−ドメイン利用確率、前記ドメイン別ユーザ−トピック帰属確率及び前記ドメイン別トピック−行動選択確率を出力するステップと、
を有することを特徴とする。
また、本発明の一形態に係るプログラムは、
複数のドメインにおけるユーザの行動履歴を用いて、ユーザの行動を予測するために、コンピュータを、
ユーザごと且つドメインごとにユーザの行動が集計されたユーザ行動履歴群を取得するデータ入力手段、
前記ユーザ行動履歴群から、あるユーザがあるドメインである行動を選択した回数を算出する統計量算出手段、
前記算出された回数から、ユーザのドメイン利用を1つ以上のパタンの混合でモデル化した場合のトピックであるドメイントピックと、ユーザの行動を1つ以上のパタンの混合で表した場合のトピックとを決定し、ドメイントピックごとのドメインの利用確率を示すドメイントピック−ドメイン利用確率と、ドメイントピックごとのユーザのトピック混合率を示すドメイン別ユーザ−トピック帰属確率と、ドメインにおけるユーザの行動確率を示すドメイン別トピック−行動選択確率とを学習するモデル学習手段、及び
前記ドメイントピック−ドメイン利用確率、前記ドメイン別ユーザ−トピック帰属確率及び前記ドメイン別トピック−行動選択確率を出力するデータ出力手段、
として機能させるためのプログラム。
複数のドメインにおけるユーザの行動履歴を用いて、ユーザの行動を予測するために、コンピュータを、
ユーザごと且つドメインごとにユーザの行動が集計されたユーザ行動履歴群を取得するデータ入力手段、
前記ユーザ行動履歴群から、あるユーザがあるドメインである行動を選択した回数を算出する統計量算出手段、
前記算出された回数から、ユーザのドメイン利用を1つ以上のパタンの混合でモデル化した場合のトピックであるドメイントピックと、ユーザの行動を1つ以上のパタンの混合で表した場合のトピックとを決定し、ドメイントピックごとのドメインの利用確率を示すドメイントピック−ドメイン利用確率と、ドメイントピックごとのユーザのトピック混合率を示すドメイン別ユーザ−トピック帰属確率と、ドメインにおけるユーザの行動確率を示すドメイン別トピック−行動選択確率とを学習するモデル学習手段、及び
前記ドメイントピック−ドメイン利用確率、前記ドメイン別ユーザ−トピック帰属確率及び前記ドメイン別トピック−行動選択確率を出力するデータ出力手段、
として機能させるためのプログラム。
として機能させることを特徴とする。
本発明によれば、複数のドメインにおけるユーザの行動履歴を用いて、同一のユーザプロファイルを適用するドメイン群を抽出し、ユーザの行動を予測することが可能になる。
以下、図面を参照して本発明の実施形態を詳細に説明する。
<本発明の実施形態の概要>
ユーザの行動を支援する方法として人気順に行動を提示することが考えられる。それをパーソナライズするために、トピックモデルを用いた方法がある。その方法では、代表的なZ個の行動確率をトピックとして抽出し、その混合率でユーザプロファイルを記述する。本発明の実施形態では、ドメインごとに人気順をパーソナライズするが、その際ドメイン群ごとに異なるユーザプロファイルを抽出する。それによりユーザが未利用なドメインであっても、他のユーザのドメインの利用履歴を用いて抽出された同一のドメイン群のユーザプロファイルを用いて、高精度な予測を可能にするとともに、同一ユーザプロファイルを用いるドメイン群を抽出することも可能にする。
ユーザの行動を支援する方法として人気順に行動を提示することが考えられる。それをパーソナライズするために、トピックモデルを用いた方法がある。その方法では、代表的なZ個の行動確率をトピックとして抽出し、その混合率でユーザプロファイルを記述する。本発明の実施形態では、ドメインごとに人気順をパーソナライズするが、その際ドメイン群ごとに異なるユーザプロファイルを抽出する。それによりユーザが未利用なドメインであっても、他のユーザのドメインの利用履歴を用いて抽出された同一のドメイン群のユーザプロファイルを用いて、高精度な予測を可能にするとともに、同一ユーザプロファイルを用いるドメイン群を抽出することも可能にする。
図1は、本発明の実施形態に係るユーザのサイト利用のモデル化の概念図である。各ドメインA,B,C,...において商品群IA,IB,IC,...を扱っており、ドメインAの商品群IAがドメインCの商品群ICに類似している場合には、ドメインAのトピック混合率はドメインCのトピック混合率と類似していると想定できる。
すなわち、本発明の実施形態では、ユーザは複数のトピック混合率を持っているがサイト群、各サイトごとではなく類似するサイト群ごとにトピック混合率を持っていると仮定する。そして、その類似するサイト群はユーザのサイト利用をトピックモデルを用いてモデル化した場合に同一トピックである場合とする。これ以降、サイト利用をモデル化した場合のトピックをドメイントピック(以降DomainTopicと呼ぶ)と呼び、ユーザの行動を1つ以上のパタンの混合でモデル化する際のトピックと区別する。DomainTopicの例として音楽サイト、食事関連サイト、書籍関連サイトなどが挙げられる。また、トピックの例としてクラッシック、ジャズ、洋食、和食、コミック、文庫本などが挙げられる。
本発明の実施形態では、類似するサイト群はK個あるとし、ユーザのサイト利用をK個の代表的なパタンの混合でモデル化した場合のDomainTopicごとにユーザはトピック混合率を持つとする。これ以降、同一DomainTopicで利用されるサイト群を、同一のユーザプロファイルを適用するドメイン群と呼ぶ。あるDomainTopicにおいてサイトを利用する確率を記述したものを共通プロファイル利用ドメイン群12と呼び、DomainTopicごとのユーザのトピック混合率をマルチユーザプロファイル13と呼ぶ。また、ユーザごとにDomainTopicを利用する確率11も求められる。
このモデル化は、ユーザが同時に利用しやすいサイト群は同一のトピック混合率を用いるとモデル化するため、サイトごとにトピック混合率が異なるモデル化と、全サイトでトピック混合率が同一なモデルの中間を実現できる。これにより、各サイトにおけるユーザの行動(ドメイン別の行動確率)を適切に予測することが可能になる。
<本発明の実施形態に係る購買予測装置の構成>
図2は、本発明の実施形態に係るマルチドメインユーザプロファイル抽出・行動予測装置100の構成を示すブロック図である。マルチドメインユーザプロファイル抽出・行動予測装置100は、複数のドメインにおけるユーザの行動履歴を用いて、同一のユーザプロファイルを適用するドメイン群を抽出し、ユーザの行動を予測する装置である。マルチドメインユーザプロファイル抽出・行動予測装置100は、複数サイトでの商品の購買データを用いて、購買予測を行う購買予測装置としても実現可能である。
図2は、本発明の実施形態に係るマルチドメインユーザプロファイル抽出・行動予測装置100の構成を示すブロック図である。マルチドメインユーザプロファイル抽出・行動予測装置100は、複数のドメインにおけるユーザの行動履歴を用いて、同一のユーザプロファイルを適用するドメイン群を抽出し、ユーザの行動を予測する装置である。マルチドメインユーザプロファイル抽出・行動予測装置100は、複数サイトでの商品の購買データを用いて、購買予測を行う購買予測装置としても実現可能である。
マルチドメインユーザプロファイル抽出・行動予測装置100は、プロセッサ等のCPU(Central Processing Unit)、RAM(Random Access Memory)やROM(Read Only Memory)等のメモリ装置、ハードディスク等の記憶装置等から構成されたコンピュータでもよい。例えば、以下に説明するマルチドメインユーザプロファイル抽出・行動予測装置100の各機能及び処理は、記憶装置又はメモリ装置に格納されているデータやプログラムをCPUが実行することによって実現される。
マルチドメインユーザプロファイル抽出・行動予測装置100は、データ入力部10、統計量算出部20、モデル学習部30、及びデータ出力部40を有する。
データ入力部10は、ユーザ行動履歴群511とモデルパラメータ512を入力として受け付ける。ユーザ行動履歴群511は、ユーザごと且つドメインごとにユーザの行動が集計されたデータであり、複数サイトにおける商品の購買履歴などを集計することにより生成される。モデルパラメータ512はマルチドメインユーザプロファイル抽出・行動予測装置100の周辺機器又は外部装置から入力されてもよく、システム内で予め決められてもよい。
ユーザ行動履歴群511は図3に示す通り、あるユーザに固有のID(ユーザID)と、その履歴が残った時刻、そのユーザが行った行動の種類に固有のID(行動種類)、その行動が行われたドメインに固有のID(ドメイン)が含まれる。あるユーザが同一時刻に複数の行動(同一IDの行動の場合も含む)をした場合には、異なる行として履歴が保存され区別する。商品の購買予測の場合には、例えば、ユーザが購入した商品に固有のIDが行動種類に保存され、商品を購入したサイトに固有のIDがドメインに保存される。
モデルパラメータ512は図4に示す通り、トピック数とDomainTopic数が与えられる。上記のように、DomainTopicの例として音楽サイト、食事関連サイト、書籍関連サイトなどが挙げられる。また、トピックの例としてクラッシック、ジャズ、洋食、和食、コミック、文庫本などが挙げられる。以降、トピック数はZ個、DomainTopic数はK個であるとする。これは、ユーザの行動履歴をトピックモデルを用いてトピック数(Z)次元の低ランク表現でモデル化することと、ユーザのドメイン利用履歴をトピックモデルを用いて、DomainTopic数(K)次元の低ランク表現でモデル化することを示す。
統計量算出部20は、モデル学習部30で利用するユーザ・ドメイン・行動頻度を算出する。ユーザ・ドメイン・行動頻度は図5に示す通り、あるユーザuがあるドメインsである行動iを選択した回数ni,s,uであり、ユーザ・ドメイン・行動頻度バッファ211に格納される。
モデル学習部30は、DomainTopicとドメインとを決定し、訪問傾向が似ているサイト群を抽出するためのユーザごとのDomainTopicの帰属確率を示すユーザ−DomainTopic帰属確率と、DomainTopicごとのサイトの利用確率を示すDomainTopic−ドメイン利用確率と、マルチユーザプロファイルであるドメイン別ユーザ−トピック帰属確率と、行動予測のためのドメインにおけるユーザの行動確率を示すドメイン別トピック−行動選択確率とを学習するパラメータ算出部310と、パラメータの算出に必要なDomainTopic−トピック生成確率を学習する潜在変数確率算出部320とを有する。
ユーザ−DomainTopic帰属確率は図6に示す通り、あるユーザuがDomainTopic k(k=0,...,K-1)を選択する確率を示しており、ユーザ−DomainTopic帰属確率バッファ311に格納される。
DomainTopic−ドメイン利用確率は図7に示す通り、あるDomainTopic kがドメインsを利用する確率を示しており、DomainTopic−ドメイン利用確率バッファ312に格納される。
ドメイン別ユーザ−トピック帰属確率は図8に示す通り、あるユーザuがあるDomainTopic kにおいてトピックz(z=0,...,Z-1)を選択する確率を示しており、ドメイン別ユーザ−トピック帰属確率バッファ313に格納される。
ドメイン別トピック−行動選択確率は図9に示す通り、あるドメインsのあるトピックzにおいて行動iを選択する確率を示しており、ドメイン別トピック−行動選択確率バッファ314に格納される。
潜在変数確率算出部320は、ユーザ−DomainTopic帰属確率バッファ311、DomainTopic−ドメイン利用確率バッファ312、ドメイン別ユーザ−トピック帰属確率バッファ313及びドメイン別トピック−行動選択確率バッファ314にそれぞれ格納された値から、パラメータの算出に必要なDomainTopic−トピック生成確率を学習する。DomainTopic−トピック生成確率は図10に示す通り、あるユーザuがあるドメインsで選択する行動iをDomainTopic k及びトピックz別に示しており、DomainTopic−トピック生成確率バッファ321に格納される。
パラメータ算出部310は、ユーザ・ドメイン・行動頻度バッファ211に格納された回数ni,s,uと、DomainTopic−トピック生成確率バッファ321に格納されたDomainTopic−トピック生成確率とに基づいて、ユーザ−DomainTopic帰属確率バッファ311、DomainTopic−ドメイン利用確率バッファ312、ドメイン別ユーザ−トピック帰属確率バッファ313及びドメイン別トピック−行動選択確率バッファ314を更新する。
データ出力部40は、DomainTopic−ドメイン利用確率バッファ312に格納された値を、図11に示す通り共通のプロファイルを利用するドメイン群を示す共通プロファイル利用ドメイン群521として出力する。また、データ出力部40は、ドメイン別ユーザ−トピック帰属確率バッファ313に格納された値を、図12に示す通りマルチユーザプロファイル522として出力し、ドメイン別トピック−行動選択確率バッファ314に格納された値を、図13に示す通りドメイン別トピック−行動確率523として出力する。
<本発明の実施形態に係る購買予測装置の動作>
図14は、本発明の実施形態に係るマルチドメインユーザプロファイル抽出・行動予測装置の動作を示すフローチャートである。
図14は、本発明の実施形態に係るマルチドメインユーザプロファイル抽出・行動予測装置の動作を示すフローチャートである。
まずステップS101において、データ入力部10がユーザ行動履歴群511、モデルパラメータ512を読み込む。
次にステップS102において、統計量算出部20がデータ入力部10からユーザ行動履歴群511を入力として受け付ける。そして統計量算出部20はユーザ・ドメイン・行動頻度バッファ211を更新する。ここで、ユーザ・ドメイン・行動頻度バッファ211はユーザ行動履歴群511からユーザuがあるドメインsである行動iをとった回数をni,s,uとして抽出する。これは、時刻を考えずユーザ・ドメイン・行動種類がユニークになるように行数を数えることに対応する。
モデル学習部30はトピックモデルを用いて、あるユーザuがあるドメインsである行動iをとる確率を下記式でモデル化する。
また、モデル学習部30は潜在変数の生成確率として次のパラメータを定義する。P(z,k|i,s,u)は、あるユーザuがドメインsで行動iの選択が、DomainTopic kでトピックzから生成する確率である。
次にステップS103において、モデル学習部30のパラメータ算出部310がユーザ−DomainTopic帰属確率バッファ311、DomainTopic−ドメイン利用確率バッファ312、ドメイン別ユーザ−トピック帰属確率バッファ313、ドメイン別トピック−行動選択確率バッファ314をランダムに初期化する。各バッファは確率値を持つので正規化し確率値に変換する。ここで、図6に示す通りユーザ−DomainTopic帰属確率バッファ311はあるユーザuがK個のDomainTopic kを選ぶ確率P(k|u)が記述されており、ある固有のユーザIDとDomainTopicIDの確率を含んでいる。また、図7に示す通りDomainTopic−ドメイン利用確率バッファ312はあるDomainTopic kにおいてドメインsを利用する確率P(s|k)が記述されており、ある固有のDomainTopicIDとドメインIDの確率を含んでいる。また、図8に示す通りドメイン別ユーザ−トピック帰属確率バッファ313はあるユーザuがZ個のTopic zを選ぶ確率P(z|k,u)が記述されており、あるDomainTopicIDにおける固有のユーザIDとトピックIDの確率を含んでいる。ただし、ドメイン別と名うってあるがユーザプロファイルは異なるドメインであってもDomainTopicが同一であれば同じユーザプロファイルを利用するためDomainTopicIDごとに記述される。また、図9に示す通りドメイン別トピック−行動選択確率バッファ314はあるドメインsでトピックzにおける行動iの選択確率P(i|z,s)が記述されており、ある固有ドメインIDとトピックIDと行動種類IDの確率を含んでいる。
次にステップS104において、モデル学習部30の潜在変数確率算出部320がDomainTopic−トピック生成確率バッファ321を下記式に従って更新する。ここで、図10に示す通りDomainTopic−トピック生成確率バッファ321はあるユーザuのドメインsでの行動iの選択がDomainTopic kでトピックzから生成する確率P(z,k|i,s,u)が記述されており、ある固有のユーザIDとドメインIDと行動種類IDとDomainTopicIDとトピックIDの確率を含んでいる。このパラメータの更新式は、モデル学習部30の確率を用いて次のようにあらわされる。
次にステップS105において、モデル学習部30のパラメータ算出部310がユーザ−DomainTopic帰属確率バッファ311、DomainTopic−ドメイン利用確率バッファ312、ドメイン別ユーザ−トピック帰属確率バッファ313、ドメイン別トピック−行動選択確率バッファ314を下記式に従って更新する。
次に、ステップS107でデータ出力部40が図11に示す共通プロファイル利用ドメイン群521、図12に示すマルチユーザプロファイル522、図13に示すドメイン別トピック−行動確率523に、それぞれDomainTopic−ドメイン利用確率バッファ312、ドメイン別ユーザ−トピック帰属確率バッファ313、ドメイン別トピック−行動選択確率バッファ314の値を出力し動作を終了する。
<本発明の実施形態の効果>
以上説明したように、本発明の実施形態によれば、ドメイン群ごとに異なるユーザプロファイルを抽出することで行動予測精度が向上し、各ドメインでプロファイルを構成するトピックごとの行動確率を抽出することで行動予測精度が向上し、同一のユーザプロファイルを利用するドメイン群を抽出することでドメイン間の関係やユーザにとって未知のドメインでの行動予測精度が向上するという効果が得られる。
以上説明したように、本発明の実施形態によれば、ドメイン群ごとに異なるユーザプロファイルを抽出することで行動予測精度が向上し、各ドメインでプロファイルを構成するトピックごとの行動確率を抽出することで行動予測精度が向上し、同一のユーザプロファイルを利用するドメイン群を抽出することでドメイン間の関係やユーザにとって未知のドメインでの行動予測精度が向上するという効果が得られる。
本発明の実施形態に係るマルチドメインユーザプロファイル抽出・行動予測装置は、複数サイトでの商品の購買データを用いて、購買予測を行う購買予測装置としても適用可能である。
説明の便宜上、本発明の実施形態に係るマルチドメインユーザプロファイル抽出・行動予測装置は機能的なブロック図を用いて説明しているが、本発明の実施形態に係るマルチドメインユーザプロファイル抽出・行動予測装置は、ハードウェア、ソフトウェアまたはそれらの組み合わせで実現されてもよい。例えば、本発明の実施形態は、コンピュータに対して本発明の実施形態に係るマルチドメインユーザプロファイル抽出・行動予測装置の各機能を実現させるプログラム、コンピュータに対して本発明の実施形態に係る方法の各手順を実行させるプログラム等により、実現されてもよい。また、各機能部が必要に応じて組み合わせて使用されてもよい。また、本発明の実施形態に係る方法は、実施形態に示す順序と異なる順序で実施されてもよい。
以上、複数のドメインにおけるユーザの行動履歴を用いて、同一のユーザプロファイルを適用するドメイン群を抽出し、ユーザの行動を予測するための手法について説明したが、本発明は、上記の実施形態に限定されることなく、特許請求の範囲内において、種々の変更・応用が可能である。
100 マルチドメインユーザプロファイル抽出・行動予測装置
10 データ入力部
20 統計量算出部
30 モデル学習部
40 データ出力部
211 ユーザ・ドメイン・行動頻度バッファ
311 ユーザ−DomainTopic帰属確率バッファ
312 DomainTopic−ドメイン利用確率バッファ
313 ドメイン別ユーザ−トピック帰属確率バッファ
314 ドメイン別トピック−行動選択確率バッファ
321 DomainTopic−トピック生成確率バッファ
511 ユーザ行動履歴群
512 モデルパラメータ
521 共通プロファイル利用ドメイン群
522 マルチユーザプロファイル
523 ドメイン別トピック−行動確率
10 データ入力部
20 統計量算出部
30 モデル学習部
40 データ出力部
211 ユーザ・ドメイン・行動頻度バッファ
311 ユーザ−DomainTopic帰属確率バッファ
312 DomainTopic−ドメイン利用確率バッファ
313 ドメイン別ユーザ−トピック帰属確率バッファ
314 ドメイン別トピック−行動選択確率バッファ
321 DomainTopic−トピック生成確率バッファ
511 ユーザ行動履歴群
512 モデルパラメータ
521 共通プロファイル利用ドメイン群
522 マルチユーザプロファイル
523 ドメイン別トピック−行動確率
Claims (6)
- 複数のドメインにおけるユーザの行動履歴を用いて、ユーザの行動を予測する行動予測装置であって、
ユーザごと且つドメインごとにユーザの行動が集計されたユーザ行動履歴群を取得するデータ入力部と、
前記ユーザ行動履歴群から、あるユーザがあるドメインである行動を選択した回数を算出する統計量算出部と、
前記算出された回数から、ユーザのドメイン利用を1つ以上のパタンの混合でモデル化した場合のトピックであるドメイントピックと、ユーザの行動を1つ以上のパタンの混合で表した場合のトピックとを決定し、ドメイントピックごとのドメインの利用確率を示すドメイントピック−ドメイン利用確率と、ドメイントピックごとのユーザのトピック混合率を示すドメイン別ユーザ−トピック帰属確率と、ドメインにおけるユーザの行動確率を示すドメイン別トピック−行動選択確率とを学習するモデル学習部と、
前記ドメイントピック−ドメイン利用確率、前記ドメイン別ユーザ−トピック帰属確率及び前記ドメイン別トピック−行動選択確率を出力するデータ出力部と、
を有する行動予測装置。 - 前記モデル学習部は、
あるユーザがドメイントピックを選択する確率を示すユーザ−ドメイントピック帰属確率を格納するユーザ−ドメイントピック帰属確率バッファと、
あるドメイントピックがドメインを利用する確率を示すドメイントピック−ドメイン利用確率を格納するドメイントピック−ドメイン利用確率バッファと、
あるユーザがあるドメイントピックにおいてトピックを選択する確率を示すドメイン別ユーザ−トピック帰属確率を格納するドメイン別ユーザ−トピック帰属確率バッファと、
あるドメインのあるトピックにおいて行動を選択する確率を示すドメイン別トピック−行動選択確率を格納するドメイン別トピック−行動選択確率バッファと、
前記ユーザ−ドメイントピック帰属確率バッファ、前記ドメイントピック−ドメイン利用確率バッファ、前記ドメイン別ユーザ−トピック帰属確率バッファ及び前記ドメイン別トピック−行動選択確率バッファにそれぞれ格納された値から、あるユーザがあるドメインで選択する行動をドメイントピック及びトピック別に示すドメイントピック−トピック生成確率を求める潜在変数確率算出部と、
前記算出された回数と、前記ドメイントピック−トピック生成確率とに基づいて、前記ユーザ−ドメイントピック帰属確率バッファ、前記ドメイントピック−ドメイン利用確率バッファ、前記ドメイン別ユーザ−トピック帰属確率バッファ及び前記ドメイン別トピック−行動選択確率バッファを更新するパラメータ算出部と、
を有する、請求項1に記載の行動予測装置。 - 前記ユーザ−ドメイントピック帰属確率を、ユーザuがドメイントピックkを選択する確率P(k|u)で表し、前記ドメイントピック−ドメイン利用確率を、ドメイントピックkがドメインsを利用する確率P(s|k)で表し、前記ドメイン別ユーザ−トピック帰属確率を、ユーザuがドメイントピックkにおいてトピックzを選択する確率P(z|k,u)で表し、前記ドメイン別トピック−行動選択確率を、ドメインsのトピックzにおいて行動iを選択する確率P(i|z,s)としたとき、
前記潜在変数確率算出部は、
前記パラメータ算出部は、
- 前記潜在変数確率算出部は、所定回数に達するまで、前記ユーザ−ドメイントピック帰属確率バッファ、前記ドメイントピック−ドメイン利用確率バッファ、前記ドメイン別ユーザ−トピック帰属確率バッファ及び前記ドメイン別トピック−行動選択確率バッファを更新する、請求項2又は3に記載の行動予測装置。
- 複数のドメインにおけるユーザの行動履歴を用いて、ユーザの行動を予測する行動予測装置における行動予測方法であって、
ユーザごと且つドメインごとにユーザの行動が集計されたユーザ行動履歴群を取得するステップと、
前記ユーザ行動履歴群から、あるユーザがあるドメインである行動を選択した回数を算出するステップと、
前記算出された回数から、ユーザのドメイン利用を1つ以上のパタンの混合でモデル化した場合のトピックであるドメイントピックと、ユーザの行動を1つ以上のパタンの混合で表した場合のトピックとを決定し、ドメイントピックごとのドメインの利用確率を示すドメイントピック−ドメイン利用確率と、ドメイントピックごとのユーザのトピック混合率を示すドメイン別ユーザ−トピック帰属確率と、ドメインにおけるユーザの行動確率を示すドメイン別トピック−行動選択確率とを学習するステップと、
前記ドメイントピック−ドメイン利用確率、前記ドメイン別ユーザ−トピック帰属確率及び前記ドメイン別トピック−行動選択確率を出力するステップと、
を有する行動予測方法。 - 複数のドメインにおけるユーザの行動履歴を用いて、ユーザの行動を予測するために、コンピュータを、
ユーザごと且つドメインごとにユーザの行動が集計されたユーザ行動履歴群を取得するデータ入力手段、
前記ユーザ行動履歴群から、あるユーザがあるドメインである行動を選択した回数を算出する統計量算出手段、
前記算出された回数から、ユーザのドメイン利用を1つ以上のパタンの混合でモデル化した場合のトピックであるドメイントピックと、ユーザの行動を1つ以上のパタンの混合で表した場合のトピックとを決定し、ドメイントピックごとのドメインの利用確率を示すドメイントピック−ドメイン利用確率と、ドメイントピックごとのユーザのトピック混合率を示すドメイン別ユーザ−トピック帰属確率と、ドメインにおけるユーザの行動確率を示すドメイン別トピック−行動選択確率とを学習するモデル学習手段、及び
前記ドメイントピック−ドメイン利用確率、前記ドメイン別ユーザ−トピック帰属確率及び前記ドメイン別トピック−行動選択確率を出力するデータ出力手段、
として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014206241A JP6025796B2 (ja) | 2014-10-07 | 2014-10-07 | 行動予測装置、行動予測方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014206241A JP6025796B2 (ja) | 2014-10-07 | 2014-10-07 | 行動予測装置、行動予測方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016076097A JP2016076097A (ja) | 2016-05-12 |
JP6025796B2 true JP6025796B2 (ja) | 2016-11-16 |
Family
ID=55951451
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014206241A Active JP6025796B2 (ja) | 2014-10-07 | 2014-10-07 | 行動予測装置、行動予測方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6025796B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7010870B2 (ja) * | 2019-03-20 | 2022-01-26 | ヤフー株式会社 | 決定装置、決定方法及び決定プログラム |
CN114925273B (zh) * | 2022-05-23 | 2023-01-10 | 厦门亿加网络科技有限公司 | 基于大数据分析的用户行为预测方法及ai预测分析系统 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4822317B2 (ja) * | 2005-10-03 | 2011-11-24 | Kddi株式会社 | レコメンド方法およびシステムならびにレコメンドプログラムおよびその記憶媒体 |
JP5860828B2 (ja) * | 2013-03-05 | 2016-02-16 | 日本電信電話株式会社 | 行動確率推定装置、方法、及びプログラム |
-
2014
- 2014-10-07 JP JP2014206241A patent/JP6025796B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2016076097A (ja) | 2016-05-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105247507B (zh) | 用于确定品牌的影响力得分的方法、系统和存储介质 | |
Singer et al. | Detecting memory and structure in human navigation patterns using Markov chain models of varying order | |
Aghdam | Context-aware recommender systems using hierarchical hidden Markov model | |
CN106251174A (zh) | 信息推荐方法及装置 | |
CN108537567A (zh) | 一种目标用户群体的确定方法和装置 | |
Rafeh et al. | An adaptive approach to dealing with unstable behaviour of users in collaborative filtering systems | |
US20140288999A1 (en) | Social character recognition (scr) system | |
Bentley et al. | Word diffusion and climate science | |
CN111967914A (zh) | 基于用户画像的推荐方法、装置、计算机设备和存储介质 | |
KR101639656B1 (ko) | 광고 제공 방법 및 서버 장치 | |
Misztal-Radecka et al. | Meta-User2Vec model for addressing the user and item cold-start problem in recommender systems | |
JP2020098388A (ja) | 需要予測方法、需要予測プログラムおよび需要予測装置 | |
JP5745388B2 (ja) | コンテンツ推薦装置及び方法及びプログラム | |
US9201968B2 (en) | System and method for finding mood-dependent top selling/rated lists | |
JP6025796B2 (ja) | 行動予測装置、行動予測方法及びプログラム | |
KR20200065793A (ko) | 도서 큐레이션 서비스 제공 방법, 장치 및 컴퓨터-판독가능 기록매체 | |
CN108595395B (zh) | 一种昵称的生成方法、装置及设备 | |
CN114756758B (zh) | 一种混合推荐方法和系统 | |
Gao et al. | Service recommendation from the evolution of composition patterns | |
JP7073557B2 (ja) | 生成装置、生成方法、及び生成プログラム | |
Das et al. | Adaptive web personalization system using splay tree | |
Zhang et al. | Estimating online review helpfulness with probabilistic distribution and confidence | |
Mizzaro et al. | A context-aware retrieval system for mobile applications | |
JP5613699B2 (ja) | 商品推薦装置及び方法及びプログラム | |
Pomerantz et al. | Context dependent movie recommendations using a hierarchical bayesian model |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160926 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20161004 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20161011 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6025796 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |