JP6025796B2 - 行動予測装置、行動予測方法及びプログラム - Google Patents

行動予測装置、行動予測方法及びプログラム Download PDF

Info

Publication number
JP6025796B2
JP6025796B2 JP2014206241A JP2014206241A JP6025796B2 JP 6025796 B2 JP6025796 B2 JP 6025796B2 JP 2014206241 A JP2014206241 A JP 2014206241A JP 2014206241 A JP2014206241 A JP 2014206241A JP 6025796 B2 JP6025796 B2 JP 6025796B2
Authority
JP
Japan
Prior art keywords
domain
topic
user
probability
action
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014206241A
Other languages
English (en)
Other versions
JP2016076097A (ja
Inventor
健司 江崎
健司 江崎
澤田 宏
宏 澤田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2014206241A priority Critical patent/JP6025796B2/ja
Publication of JP2016076097A publication Critical patent/JP2016076097A/ja
Application granted granted Critical
Publication of JP6025796B2 publication Critical patent/JP6025796B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、行動予測装置、行動予測方法及びプログラムに関する。特に、本発明は、複数のドメインにおけるユーザの行動履歴を用いて、同一のユーザプロファイルを適用するドメイン群を抽出し、ユーザの行動を予測する行動予測装置に関する。
近年個人の行動履歴を蓄積する技術が進み、パーソナライズしたサービスの重要性が高まってきている。例えば、ユーザごとにWebサイトの表示を変えたり、携帯端末のアプリの表示を変えたり、ウェアラブルコンピュータへの表示を変えたりするサービスなどが挙げられる。パーソナライズしない場合には、全体の人気を用いた表示をする方法がある。例えば、最近一番売れている商品群を提示することや、今一番利用されているキーワード群を提示することなどが挙げられる。
パーソナライズの方法の一つとして、トピックモデルを用いたユーザプロファイルを使った方法がある。トピックモデルはZ個の代表的な行動確率を考える。購買を例にすると、買われる商品群のパタンと購買される確率をZ個用意する。トピックモデルは各ユーザをZ個のパタンの混合であらわすとモデル化し、その混合率はユーザプロファイルとみなす。以降、ユーザプロファイルをトピック混合率とも呼ぶ。例えば、どれか一つのパタンであらわされる極端なユーザを考えた場合(混合率がどれか一つだけ1で他は0の場合)、そのユーザの行動をもっとも説明するZ個の購買傾向のうち一つのパタンを用いてパーソナライズする。これは、ユーザがZ個のどのセグメントに属するかを判断し、そのセグメントで人気の商品群を提示しパーソナライズすることと同義である。トピック混合率を用いることで、ある商品が売れやすいトピックに属するユーザを抽出してターゲットユーザとすることや、トピック混合率で各トピックの行動確率を混合したモデルを用いて、ユーザの行動を予測することが可能になる(非特許文献1参照)。
岩田具治ほか 「購買行動解析のためのトピック追跡モデル」 電子情報通信学会誌 DVol.J93-D, No.6, pp.978-987 Gui-Rong Xueほか 「Topic-bridged PLSA for Cross-Domain Text Classification」SIGIR '08 Proceedings of the 31st annual international ACM SIGIR conference on Research and development in information retrieval, Pages 627-634
一方で、最近マルチドメインのデータが手に入るようになってきている。例えば、ポータルサイトにおいて同一IDを利用して音楽、ファッション、食事、検索などの複数ドメインを利用したデータが取得可能になっている。この場合、各ドメインにおいてパーソナライズした結果をユーザに提示することになる。パーソナライズしない場合では、あるドメインにおける全体の人気を用いた表示を行うことになる。そこで、この場合も同様にドメインごとにZ個の代表的な行動パタンとその確率を考え、そのドメインでのユーザの行動をその混合でモデル化する。しかし、この場合にはユーザのトピック混合率をドメインごとに算出することになるが、ユーザは全ドメインを利用するわけではないのでユーザが未利用のドメインではパーソナライズすることができない。そこで、もっとも基本的なモデルとしてユーザの混合率は全ドメインで同一とする方法がある。こうすれば、他のドメインの行動から算出されたトピック混合率を用いて、未知のドメインでのパーソナライズを実現できる。
ここで、ドメインとは、トピックモデルにおいてユーザの行動を分析するための予め決められた範囲を表す。ドメインの例は次のものが考えられる。例えば複数サイトでの行動履歴を考えれば、ドメインはサイトと考えられる。以下、ドメインをサイトで置き換えることとする。ドメインは、ショップ、カテゴリ、地域、ジャンルなど行動履歴によって様々なものが考えられる。以下はドメインをサイトと置き換えた例とし、ドメインをサイトと呼ぶこととする。
ドメインをサイトと置き換えた例において、どれか一つのパタンであらわされる極端なユーザを再び考えると、そのユーザはどのサイトでも同一のトピック混合率でモデル化することになる。しかし、ユーザはサイトによって行動傾向を変えることが考えられるため、正しくモデル化できない。
例えば、音楽配信サイト、CD販売サイト、CDレンタルサイトなどの音楽サイトでユーザが選択する行動傾向は近いと考えられる。例えばクラシック好きな人が選ぶ曲には傾向が存在する。また、グルメ検索サイト、飲食店評価サイト、料理レシピサイトなどの食事関連サイトでユーザが選択する行動も近いと考えられる。しかし、クラシック好きの人が洋食好きである場合もあれば、和食好きである場合もあるように、異なるサイト群では傾向が異なる可能性がある。
本発明は、複数のドメインにおけるユーザの行動履歴を用いて、同一のユーザプロファイルを適用するドメイン群を抽出し、ユーザの行動を予測する行動予測装置、行動予測方法及びプログラムを提供することを目的とする。
本発明の一形態に係る行動予測装置は、
複数のドメインにおけるユーザの行動履歴を用いて、ユーザの行動を予測する行動予測装置であって、
ユーザごと且つドメインごとにユーザの行動が集計されたユーザ行動履歴群を取得するデータ入力部と、
前記ユーザ行動履歴群から、あるユーザがあるドメインである行動を選択した回数を算出する統計量算出部と、
前記算出された回数から、ユーザのドメイン利用を1つ以上のパタンの混合でモデル化した場合のトピックであるドメイントピックと、ユーザの行動を1つ以上のパタンの混合で表した場合のトピックとを決定し、ドメイントピックごとのドメインの利用確率を示すドメイントピック−ドメイン利用確率と、ドメイントピックごとのユーザのトピック混合率を示すドメイン別ユーザ−トピック帰属確率と、ドメインにおけるユーザの行動確率を示すドメイン別トピック−行動選択確率とを学習するモデル学習部と、
前記ドメイントピック−ドメイン利用確率、前記ドメイン別ユーザ−トピック帰属確率及び前記ドメイン別トピック−行動選択確率を出力するデータ出力部と、
を有することを特徴とする。
また、本発明の一形態に係る行動予測方法は、
複数のドメインにおけるユーザの行動履歴を用いて、ユーザの行動を予測する行動予測装置における行動予測方法であって、
ユーザごと且つドメインごとにユーザの行動が集計されたユーザ行動履歴群を取得するステップと、
前記ユーザ行動履歴群から、あるユーザがあるドメインである行動を選択した回数を算出するステップと、
前記算出された回数から、ユーザのドメイン利用を1つ以上のパタンの混合でモデル化した場合のトピックであるドメイントピックと、ユーザの行動を1つ以上のパタンの混合で表した場合のトピックとを決定し、ドメイントピックごとのドメインの利用確率を示すドメイントピック−ドメイン利用確率と、ドメイントピックごとのユーザのトピック混合率を示すドメイン別ユーザ−トピック帰属確率と、ドメインにおけるユーザの行動確率を示すドメイン別トピック−行動選択確率とを学習するステップと、
前記ドメイントピック−ドメイン利用確率、前記ドメイン別ユーザ−トピック帰属確率及び前記ドメイン別トピック−行動選択確率を出力するステップと、
を有することを特徴とする。
また、本発明の一形態に係るプログラムは、
複数のドメインにおけるユーザの行動履歴を用いて、ユーザの行動を予測するために、コンピュータを、
ユーザごと且つドメインごとにユーザの行動が集計されたユーザ行動履歴群を取得するデータ入力手段、
前記ユーザ行動履歴群から、あるユーザがあるドメインである行動を選択した回数を算出する統計量算出手段、
前記算出された回数から、ユーザのドメイン利用を1つ以上のパタンの混合でモデル化した場合のトピックであるドメイントピックと、ユーザの行動を1つ以上のパタンの混合で表した場合のトピックとを決定し、ドメイントピックごとのドメインの利用確率を示すドメイントピック−ドメイン利用確率と、ドメイントピックごとのユーザのトピック混合率を示すドメイン別ユーザ−トピック帰属確率と、ドメインにおけるユーザの行動確率を示すドメイン別トピック−行動選択確率とを学習するモデル学習手段、及び
前記ドメイントピック−ドメイン利用確率、前記ドメイン別ユーザ−トピック帰属確率及び前記ドメイン別トピック−行動選択確率を出力するデータ出力手段、
として機能させるためのプログラム。
として機能させることを特徴とする。
本発明によれば、複数のドメインにおけるユーザの行動履歴を用いて、同一のユーザプロファイルを適用するドメイン群を抽出し、ユーザの行動を予測することが可能になる。
本発明の実施形態に係るユーザのサイト利用のモデル化の概念図 本発明の実施形態に係るマルチドメインユーザプロファイル抽出・行動予測装置の構成を示すブロック図 ユーザ行動履歴群の例を示す図 モデルパラメータの例を示す図 ユーザ・ドメイン・行動頻度の例を示す図 ユーザ−DomainTopic帰属確率の例を示す図 DomainTopic−ドメイン利用確率の例を示す図 ドメイン別ユーザ−トピック帰属確率の例を示す図 ドメイン別トピック−行動選択確率の例を示す図 DomainTopic−トピック生成確率の例を示す図 共通プロファイル利用ドメイン群の例を示す図 マルチユーザプロファイルの例を示す図 ドメイン別トピック−行動選択確率の例を示す図 本発明の実施形態に係るマルチドメインユーザプロファイル抽出・行動予測装置の動作を示すフローチャート
以下、図面を参照して本発明の実施形態を詳細に説明する。
<本発明の実施形態の概要>
ユーザの行動を支援する方法として人気順に行動を提示することが考えられる。それをパーソナライズするために、トピックモデルを用いた方法がある。その方法では、代表的なZ個の行動確率をトピックとして抽出し、その混合率でユーザプロファイルを記述する。本発明の実施形態では、ドメインごとに人気順をパーソナライズするが、その際ドメイン群ごとに異なるユーザプロファイルを抽出する。それによりユーザが未利用なドメインであっても、他のユーザのドメインの利用履歴を用いて抽出された同一のドメイン群のユーザプロファイルを用いて、高精度な予測を可能にするとともに、同一ユーザプロファイルを用いるドメイン群を抽出することも可能にする。
図1は、本発明の実施形態に係るユーザのサイト利用のモデル化の概念図である。各ドメインA,B,C,...において商品群IA,IB,IC,...を扱っており、ドメインAの商品群IAがドメインCの商品群ICに類似している場合には、ドメインAのトピック混合率はドメインCのトピック混合率と類似していると想定できる。
すなわち、本発明の実施形態では、ユーザは複数のトピック混合率を持っているがサイト群、各サイトごとではなく類似するサイト群ごとにトピック混合率を持っていると仮定する。そして、その類似するサイト群はユーザのサイト利用をトピックモデルを用いてモデル化した場合に同一トピックである場合とする。これ以降、サイト利用をモデル化した場合のトピックをドメイントピック(以降DomainTopicと呼ぶ)と呼び、ユーザの行動を1つ以上のパタンの混合でモデル化する際のトピックと区別する。DomainTopicの例として音楽サイト、食事関連サイト、書籍関連サイトなどが挙げられる。また、トピックの例としてクラッシック、ジャズ、洋食、和食、コミック、文庫本などが挙げられる。
本発明の実施形態では、類似するサイト群はK個あるとし、ユーザのサイト利用をK個の代表的なパタンの混合でモデル化した場合のDomainTopicごとにユーザはトピック混合率を持つとする。これ以降、同一DomainTopicで利用されるサイト群を、同一のユーザプロファイルを適用するドメイン群と呼ぶ。あるDomainTopicにおいてサイトを利用する確率を記述したものを共通プロファイル利用ドメイン群12と呼び、DomainTopicごとのユーザのトピック混合率をマルチユーザプロファイル13と呼ぶ。また、ユーザごとにDomainTopicを利用する確率11も求められる。
このモデル化は、ユーザが同時に利用しやすいサイト群は同一のトピック混合率を用いるとモデル化するため、サイトごとにトピック混合率が異なるモデル化と、全サイトでトピック混合率が同一なモデルの中間を実現できる。これにより、各サイトにおけるユーザの行動(ドメイン別の行動確率)を適切に予測することが可能になる。
<本発明の実施形態に係る購買予測装置の構成>
図2は、本発明の実施形態に係るマルチドメインユーザプロファイル抽出・行動予測装置100の構成を示すブロック図である。マルチドメインユーザプロファイル抽出・行動予測装置100は、複数のドメインにおけるユーザの行動履歴を用いて、同一のユーザプロファイルを適用するドメイン群を抽出し、ユーザの行動を予測する装置である。マルチドメインユーザプロファイル抽出・行動予測装置100は、複数サイトでの商品の購買データを用いて、購買予測を行う購買予測装置としても実現可能である。
マルチドメインユーザプロファイル抽出・行動予測装置100は、プロセッサ等のCPU(Central Processing Unit)、RAM(Random Access Memory)やROM(Read Only Memory)等のメモリ装置、ハードディスク等の記憶装置等から構成されたコンピュータでもよい。例えば、以下に説明するマルチドメインユーザプロファイル抽出・行動予測装置100の各機能及び処理は、記憶装置又はメモリ装置に格納されているデータやプログラムをCPUが実行することによって実現される。
マルチドメインユーザプロファイル抽出・行動予測装置100は、データ入力部10、統計量算出部20、モデル学習部30、及びデータ出力部40を有する。
データ入力部10は、ユーザ行動履歴群511とモデルパラメータ512を入力として受け付ける。ユーザ行動履歴群511は、ユーザごと且つドメインごとにユーザの行動が集計されたデータであり、複数サイトにおける商品の購買履歴などを集計することにより生成される。モデルパラメータ512はマルチドメインユーザプロファイル抽出・行動予測装置100の周辺機器又は外部装置から入力されてもよく、システム内で予め決められてもよい。
ユーザ行動履歴群511は図3に示す通り、あるユーザに固有のID(ユーザID)と、その履歴が残った時刻、そのユーザが行った行動の種類に固有のID(行動種類)、その行動が行われたドメインに固有のID(ドメイン)が含まれる。あるユーザが同一時刻に複数の行動(同一IDの行動の場合も含む)をした場合には、異なる行として履歴が保存され区別する。商品の購買予測の場合には、例えば、ユーザが購入した商品に固有のIDが行動種類に保存され、商品を購入したサイトに固有のIDがドメインに保存される。
モデルパラメータ512は図4に示す通り、トピック数とDomainTopic数が与えられる。上記のように、DomainTopicの例として音楽サイト、食事関連サイト、書籍関連サイトなどが挙げられる。また、トピックの例としてクラッシック、ジャズ、洋食、和食、コミック、文庫本などが挙げられる。以降、トピック数はZ個、DomainTopic数はK個であるとする。これは、ユーザの行動履歴をトピックモデルを用いてトピック数(Z)次元の低ランク表現でモデル化することと、ユーザのドメイン利用履歴をトピックモデルを用いて、DomainTopic数(K)次元の低ランク表現でモデル化することを示す。
統計量算出部20は、モデル学習部30で利用するユーザ・ドメイン・行動頻度を算出する。ユーザ・ドメイン・行動頻度は図5に示す通り、あるユーザuがあるドメインsである行動iを選択した回数ni,s,uであり、ユーザ・ドメイン・行動頻度バッファ211に格納される。
モデル学習部30は、DomainTopicとドメインとを決定し、訪問傾向が似ているサイト群を抽出するためのユーザごとのDomainTopicの帰属確率を示すユーザ−DomainTopic帰属確率と、DomainTopicごとのサイトの利用確率を示すDomainTopic−ドメイン利用確率と、マルチユーザプロファイルであるドメイン別ユーザ−トピック帰属確率と、行動予測のためのドメインにおけるユーザの行動確率を示すドメイン別トピック−行動選択確率とを学習するパラメータ算出部310と、パラメータの算出に必要なDomainTopic−トピック生成確率を学習する潜在変数確率算出部320とを有する。
ユーザ−DomainTopic帰属確率は図6に示す通り、あるユーザuがDomainTopic k(k=0,...,K-1)を選択する確率を示しており、ユーザ−DomainTopic帰属確率バッファ311に格納される。
DomainTopic−ドメイン利用確率は図7に示す通り、あるDomainTopic kがドメインsを利用する確率を示しており、DomainTopic−ドメイン利用確率バッファ312に格納される。
ドメイン別ユーザ−トピック帰属確率は図8に示す通り、あるユーザuがあるDomainTopic kにおいてトピックz(z=0,...,Z-1)を選択する確率を示しており、ドメイン別ユーザ−トピック帰属確率バッファ313に格納される。
ドメイン別トピック−行動選択確率は図9に示す通り、あるドメインsのあるトピックzにおいて行動iを選択する確率を示しており、ドメイン別トピック−行動選択確率バッファ314に格納される。
潜在変数確率算出部320は、ユーザ−DomainTopic帰属確率バッファ311、DomainTopic−ドメイン利用確率バッファ312、ドメイン別ユーザ−トピック帰属確率バッファ313及びドメイン別トピック−行動選択確率バッファ314にそれぞれ格納された値から、パラメータの算出に必要なDomainTopic−トピック生成確率を学習する。DomainTopic−トピック生成確率は図10に示す通り、あるユーザuがあるドメインsで選択する行動iをDomainTopic k及びトピックz別に示しており、DomainTopic−トピック生成確率バッファ321に格納される。
パラメータ算出部310は、ユーザ・ドメイン・行動頻度バッファ211に格納された回数ni,s,uと、DomainTopic−トピック生成確率バッファ321に格納されたDomainTopic−トピック生成確率とに基づいて、ユーザ−DomainTopic帰属確率バッファ311、DomainTopic−ドメイン利用確率バッファ312、ドメイン別ユーザ−トピック帰属確率バッファ313及びドメイン別トピック−行動選択確率バッファ314を更新する。
データ出力部40は、DomainTopic−ドメイン利用確率バッファ312に格納された値を、図11に示す通り共通のプロファイルを利用するドメイン群を示す共通プロファイル利用ドメイン群521として出力する。また、データ出力部40は、ドメイン別ユーザ−トピック帰属確率バッファ313に格納された値を、図12に示す通りマルチユーザプロファイル522として出力し、ドメイン別トピック−行動選択確率バッファ314に格納された値を、図13に示す通りドメイン別トピック−行動確率523として出力する。
<本発明の実施形態に係る購買予測装置の動作>
図14は、本発明の実施形態に係るマルチドメインユーザプロファイル抽出・行動予測装置の動作を示すフローチャートである。
まずステップS101において、データ入力部10がユーザ行動履歴群511、モデルパラメータ512を読み込む。
次にステップS102において、統計量算出部20がデータ入力部10からユーザ行動履歴群511を入力として受け付ける。そして統計量算出部20はユーザ・ドメイン・行動頻度バッファ211を更新する。ここで、ユーザ・ドメイン・行動頻度バッファ211はユーザ行動履歴群511からユーザuがあるドメインsである行動iをとった回数をni,s,uとして抽出する。これは、時刻を考えずユーザ・ドメイン・行動種類がユニークになるように行数を数えることに対応する。
モデル学習部30はトピックモデルを用いて、あるユーザuがあるドメインsである行動iをとる確率を下記式でモデル化する。
Figure 0006025796
この式はPLSA(Probabilistic Latent Semantic Analysis)を元にしたもので(非特許文献2参照)、ドメインの利用確率とドメインごとの行動確率をモデル化している。ここで、P(k|u)はあるユーザuがDomainTopic kを選択する確率である。また、P(s|k)はあるDomainTopic kがドメインsを利用する確率である。また、P(z|k,u)はあるユーザuがDomainTopic kでトピックzを選択する確率である。また、P(i|z,s)はあるドメインsのトピックzで行動iを選択する確率である。
また、モデル学習部30は潜在変数の生成確率として次のパラメータを定義する。P(z,k|i,s,u)は、あるユーザuがドメインsで行動iの選択が、DomainTopic kでトピックzから生成する確率である。
次にステップS103において、モデル学習部30のパラメータ算出部310がユーザ−DomainTopic帰属確率バッファ311、DomainTopic−ドメイン利用確率バッファ312、ドメイン別ユーザ−トピック帰属確率バッファ313、ドメイン別トピック−行動選択確率バッファ314をランダムに初期化する。各バッファは確率値を持つので正規化し確率値に変換する。ここで、図6に示す通りユーザ−DomainTopic帰属確率バッファ311はあるユーザuがK個のDomainTopic kを選ぶ確率P(k|u)が記述されており、ある固有のユーザIDとDomainTopicIDの確率を含んでいる。また、図7に示す通りDomainTopic−ドメイン利用確率バッファ312はあるDomainTopic kにおいてドメインsを利用する確率P(s|k)が記述されており、ある固有のDomainTopicIDとドメインIDの確率を含んでいる。また、図8に示す通りドメイン別ユーザ−トピック帰属確率バッファ313はあるユーザuがZ個のTopic zを選ぶ確率P(z|k,u)が記述されており、あるDomainTopicIDにおける固有のユーザIDとトピックIDの確率を含んでいる。ただし、ドメイン別と名うってあるがユーザプロファイルは異なるドメインであってもDomainTopicが同一であれば同じユーザプロファイルを利用するためDomainTopicIDごとに記述される。また、図9に示す通りドメイン別トピック−行動選択確率バッファ314はあるドメインsでトピックzにおける行動iの選択確率P(i|z,s)が記述されており、ある固有ドメインIDとトピックIDと行動種類IDの確率を含んでいる。
次にステップS104において、モデル学習部30の潜在変数確率算出部320がDomainTopic−トピック生成確率バッファ321を下記式に従って更新する。ここで、図10に示す通りDomainTopic−トピック生成確率バッファ321はあるユーザuのドメインsでの行動iの選択がDomainTopic kでトピックzから生成する確率P(z,k|i,s,u)が記述されており、ある固有のユーザIDとドメインIDと行動種類IDとDomainTopicIDとトピックIDの確率を含んでいる。このパラメータの更新式は、モデル学習部30の確率を用いて次のようにあらわされる。
Figure 0006025796
ただし、Cは正規化項で
Figure 0006025796
である。
次にステップS105において、モデル学習部30のパラメータ算出部310がユーザ−DomainTopic帰属確率バッファ311、DomainTopic−ドメイン利用確率バッファ312、ドメイン別ユーザ−トピック帰属確率バッファ313、ドメイン別トピック−行動選択確率バッファ314を下記式に従って更新する。
Figure 0006025796
Figure 0006025796
Figure 0006025796
Figure 0006025796
次に、ステップS106で予め設定した学習回数Nに達していなかったらステップS1104へ進み、達していたらS107に進む。
次に、ステップS107でデータ出力部40が図11に示す共通プロファイル利用ドメイン群521、図12に示すマルチユーザプロファイル522、図13に示すドメイン別トピック−行動確率523に、それぞれDomainTopic−ドメイン利用確率バッファ312、ドメイン別ユーザ−トピック帰属確率バッファ313、ドメイン別トピック−行動選択確率バッファ314の値を出力し動作を終了する。
<本発明の実施形態の効果>
以上説明したように、本発明の実施形態によれば、ドメイン群ごとに異なるユーザプロファイルを抽出することで行動予測精度が向上し、各ドメインでプロファイルを構成するトピックごとの行動確率を抽出することで行動予測精度が向上し、同一のユーザプロファイルを利用するドメイン群を抽出することでドメイン間の関係やユーザにとって未知のドメインでの行動予測精度が向上するという効果が得られる。
本発明の実施形態に係るマルチドメインユーザプロファイル抽出・行動予測装置は、複数サイトでの商品の購買データを用いて、購買予測を行う購買予測装置としても適用可能である。
説明の便宜上、本発明の実施形態に係るマルチドメインユーザプロファイル抽出・行動予測装置は機能的なブロック図を用いて説明しているが、本発明の実施形態に係るマルチドメインユーザプロファイル抽出・行動予測装置は、ハードウェア、ソフトウェアまたはそれらの組み合わせで実現されてもよい。例えば、本発明の実施形態は、コンピュータに対して本発明の実施形態に係るマルチドメインユーザプロファイル抽出・行動予測装置の各機能を実現させるプログラム、コンピュータに対して本発明の実施形態に係る方法の各手順を実行させるプログラム等により、実現されてもよい。また、各機能部が必要に応じて組み合わせて使用されてもよい。また、本発明の実施形態に係る方法は、実施形態に示す順序と異なる順序で実施されてもよい。
以上、複数のドメインにおけるユーザの行動履歴を用いて、同一のユーザプロファイルを適用するドメイン群を抽出し、ユーザの行動を予測するための手法について説明したが、本発明は、上記の実施形態に限定されることなく、特許請求の範囲内において、種々の変更・応用が可能である。
100 マルチドメインユーザプロファイル抽出・行動予測装置
10 データ入力部
20 統計量算出部
30 モデル学習部
40 データ出力部
211 ユーザ・ドメイン・行動頻度バッファ
311 ユーザ−DomainTopic帰属確率バッファ
312 DomainTopic−ドメイン利用確率バッファ
313 ドメイン別ユーザ−トピック帰属確率バッファ
314 ドメイン別トピック−行動選択確率バッファ
321 DomainTopic−トピック生成確率バッファ
511 ユーザ行動履歴群
512 モデルパラメータ
521 共通プロファイル利用ドメイン群
522 マルチユーザプロファイル
523 ドメイン別トピック−行動確率

Claims (6)

  1. 複数のドメインにおけるユーザの行動履歴を用いて、ユーザの行動を予測する行動予測装置であって、
    ユーザごと且つドメインごとにユーザの行動が集計されたユーザ行動履歴群を取得するデータ入力部と、
    前記ユーザ行動履歴群から、あるユーザがあるドメインである行動を選択した回数を算出する統計量算出部と、
    前記算出された回数から、ユーザのドメイン利用を1つ以上のパタンの混合でモデル化した場合のトピックであるドメイントピックと、ユーザの行動を1つ以上のパタンの混合で表した場合のトピックとを決定し、ドメイントピックごとのドメインの利用確率を示すドメイントピック−ドメイン利用確率と、ドメイントピックごとのユーザのトピック混合率を示すドメイン別ユーザ−トピック帰属確率と、ドメインにおけるユーザの行動確率を示すドメイン別トピック−行動選択確率とを学習するモデル学習部と、
    前記ドメイントピック−ドメイン利用確率、前記ドメイン別ユーザ−トピック帰属確率及び前記ドメイン別トピック−行動選択確率を出力するデータ出力部と、
    を有する行動予測装置。
  2. 前記モデル学習部は、
    あるユーザがドメイントピックを選択する確率を示すユーザ−ドメイントピック帰属確率を格納するユーザ−ドメイントピック帰属確率バッファと、
    あるドメイントピックがドメインを利用する確率を示すドメイントピック−ドメイン利用確率を格納するドメイントピック−ドメイン利用確率バッファと、
    あるユーザがあるドメイントピックにおいてトピックを選択する確率を示すドメイン別ユーザ−トピック帰属確率を格納するドメイン別ユーザ−トピック帰属確率バッファと、
    あるドメインのあるトピックにおいて行動を選択する確率を示すドメイン別トピック−行動選択確率を格納するドメイン別トピック−行動選択確率バッファと、
    前記ユーザ−ドメイントピック帰属確率バッファ、前記ドメイントピック−ドメイン利用確率バッファ、前記ドメイン別ユーザ−トピック帰属確率バッファ及び前記ドメイン別トピック−行動選択確率バッファにそれぞれ格納された値から、あるユーザがあるドメインで選択する行動をドメイントピック及びトピック別に示すドメイントピック−トピック生成確率を求める潜在変数確率算出部と、
    前記算出された回数と、前記ドメイントピック−トピック生成確率とに基づいて、前記ユーザ−ドメイントピック帰属確率バッファ、前記ドメイントピック−ドメイン利用確率バッファ、前記ドメイン別ユーザ−トピック帰属確率バッファ及び前記ドメイン別トピック−行動選択確率バッファを更新するパラメータ算出部と、
    を有する、請求項1に記載の行動予測装置。
  3. 前記ユーザ−ドメイントピック帰属確率を、ユーザuがドメイントピックkを選択する確率P(k|u)で表し、前記ドメイントピック−ドメイン利用確率を、ドメイントピックkがドメインsを利用する確率P(s|k)で表し、前記ドメイン別ユーザ−トピック帰属確率を、ユーザuがドメイントピックkにおいてトピックzを選択する確率P(z|k,u)で表し、前記ドメイン別トピック−行動選択確率を、ドメインsのトピックzにおいて行動iを選択する確率P(i|z,s)としたとき、
    前記潜在変数確率算出部は、
    Figure 0006025796
    ただし、Cは以下の正規化項
    Figure 0006025796
    によって、前記ドメイントピック−トピック生成確率P(z,k|i,s,u)を求め、
    前記パラメータ算出部は、
    Figure 0006025796
    Figure 0006025796
    Figure 0006025796
    Figure 0006025796
    によって、それぞれ前記ユーザ−ドメイントピック帰属確率バッファ、前記ドメイントピック−ドメイン利用確率バッファ、前記ドメイン別ユーザ−トピック帰属確率バッファ及び前記ドメイン別トピック−行動選択確率バッファを更新する、請求項2に記載の行動予測装置。
  4. 前記潜在変数確率算出部は、所定回数に達するまで、前記ユーザ−ドメイントピック帰属確率バッファ、前記ドメイントピック−ドメイン利用確率バッファ、前記ドメイン別ユーザ−トピック帰属確率バッファ及び前記ドメイン別トピック−行動選択確率バッファを更新する、請求項2又は3に記載の行動予測装置。
  5. 複数のドメインにおけるユーザの行動履歴を用いて、ユーザの行動を予測する行動予測装置における行動予測方法であって、
    ユーザごと且つドメインごとにユーザの行動が集計されたユーザ行動履歴群を取得するステップと、
    前記ユーザ行動履歴群から、あるユーザがあるドメインである行動を選択した回数を算出するステップと、
    前記算出された回数から、ユーザのドメイン利用を1つ以上のパタンの混合でモデル化した場合のトピックであるドメイントピックと、ユーザの行動を1つ以上のパタンの混合で表した場合のトピックとを決定し、ドメイントピックごとのドメインの利用確率を示すドメイントピック−ドメイン利用確率と、ドメイントピックごとのユーザのトピック混合率を示すドメイン別ユーザ−トピック帰属確率と、ドメインにおけるユーザの行動確率を示すドメイン別トピック−行動選択確率とを学習するステップと、
    前記ドメイントピック−ドメイン利用確率、前記ドメイン別ユーザ−トピック帰属確率及び前記ドメイン別トピック−行動選択確率を出力するステップと、
    を有する行動予測方法。
  6. 複数のドメインにおけるユーザの行動履歴を用いて、ユーザの行動を予測するために、コンピュータを、
    ユーザごと且つドメインごとにユーザの行動が集計されたユーザ行動履歴群を取得するデータ入力手段、
    前記ユーザ行動履歴群から、あるユーザがあるドメインである行動を選択した回数を算出する統計量算出手段、
    前記算出された回数から、ユーザのドメイン利用を1つ以上のパタンの混合でモデル化した場合のトピックであるドメイントピックと、ユーザの行動を1つ以上のパタンの混合で表した場合のトピックとを決定し、ドメイントピックごとのドメインの利用確率を示すドメイントピック−ドメイン利用確率と、ドメイントピックごとのユーザのトピック混合率を示すドメイン別ユーザ−トピック帰属確率と、ドメインにおけるユーザの行動確率を示すドメイン別トピック−行動選択確率とを学習するモデル学習手段、及び
    前記ドメイントピック−ドメイン利用確率、前記ドメイン別ユーザ−トピック帰属確率及び前記ドメイン別トピック−行動選択確率を出力するデータ出力手段、
    として機能させるためのプログラム。
JP2014206241A 2014-10-07 2014-10-07 行動予測装置、行動予測方法及びプログラム Active JP6025796B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014206241A JP6025796B2 (ja) 2014-10-07 2014-10-07 行動予測装置、行動予測方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014206241A JP6025796B2 (ja) 2014-10-07 2014-10-07 行動予測装置、行動予測方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2016076097A JP2016076097A (ja) 2016-05-12
JP6025796B2 true JP6025796B2 (ja) 2016-11-16

Family

ID=55951451

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014206241A Active JP6025796B2 (ja) 2014-10-07 2014-10-07 行動予測装置、行動予測方法及びプログラム

Country Status (1)

Country Link
JP (1) JP6025796B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7010870B2 (ja) * 2019-03-20 2022-01-26 ヤフー株式会社 決定装置、決定方法及び決定プログラム
CN114925273B (zh) * 2022-05-23 2023-01-10 厦门亿加网络科技有限公司 基于大数据分析的用户行为预测方法及ai预测分析系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4822317B2 (ja) * 2005-10-03 2011-11-24 Kddi株式会社 レコメンド方法およびシステムならびにレコメンドプログラムおよびその記憶媒体
JP5860828B2 (ja) * 2013-03-05 2016-02-16 日本電信電話株式会社 行動確率推定装置、方法、及びプログラム

Also Published As

Publication number Publication date
JP2016076097A (ja) 2016-05-12

Similar Documents

Publication Publication Date Title
CN105247507B (zh) 用于确定品牌的影响力得分的方法、系统和存储介质
Singer et al. Detecting memory and structure in human navigation patterns using Markov chain models of varying order
Aghdam Context-aware recommender systems using hierarchical hidden Markov model
CN106251174A (zh) 信息推荐方法及装置
CN108537567A (zh) 一种目标用户群体的确定方法和装置
Rafeh et al. An adaptive approach to dealing with unstable behaviour of users in collaborative filtering systems
US20140288999A1 (en) Social character recognition (scr) system
Bentley et al. Word diffusion and climate science
CN111967914A (zh) 基于用户画像的推荐方法、装置、计算机设备和存储介质
KR101639656B1 (ko) 광고 제공 방법 및 서버 장치
Misztal-Radecka et al. Meta-User2Vec model for addressing the user and item cold-start problem in recommender systems
JP2020098388A (ja) 需要予測方法、需要予測プログラムおよび需要予測装置
JP5745388B2 (ja) コンテンツ推薦装置及び方法及びプログラム
US9201968B2 (en) System and method for finding mood-dependent top selling/rated lists
JP6025796B2 (ja) 行動予測装置、行動予測方法及びプログラム
KR20200065793A (ko) 도서 큐레이션 서비스 제공 방법, 장치 및 컴퓨터-판독가능 기록매체
CN108595395B (zh) 一种昵称的生成方法、装置及设备
CN114756758B (zh) 一种混合推荐方法和系统
Gao et al. Service recommendation from the evolution of composition patterns
JP7073557B2 (ja) 生成装置、生成方法、及び生成プログラム
Das et al. Adaptive web personalization system using splay tree
Zhang et al. Estimating online review helpfulness with probabilistic distribution and confidence
Mizzaro et al. A context-aware retrieval system for mobile applications
JP5613699B2 (ja) 商品推薦装置及び方法及びプログラム
Pomerantz et al. Context dependent movie recommendations using a hierarchical bayesian model

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160926

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161004

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161011

R150 Certificate of patent or registration of utility model

Ref document number: 6025796

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150