本発明の実施の形態は、個人の移動履歴情報に基づいて、その人が将来的に訪れるランドマークを予測する装置に関連し、また、各ランドマークを訪れた場合の滞在時間を予測する装置に関連する。
以下、図面を参照して本発明の実施の形態を詳細に説明する。
<概要>
図1に、本発明の実施の形態の技術分野を説明するための図を示す。図1に示すように、本発明の実施の形態では、動作主u∈Uの移動履歴から、動作主uが次に訪問するランドマークを予測する。学習データとしては、全動作主Uの移動履歴の情報を用いる。
図2に、本実施の形態で用いる仮定を説明するための図を示す。図2に示すように、本実施の形態では、動作主uが次に訪れるランドマークiは、以下の2つの要因で決まると仮定する。
(1)現在のランドマークjからのアクセスしやすさを表すP(ランドマークi|ランドマークj)
(2)動作主uの興味zを表すP(ランドマークi|興味z)
従来技術1では、図3に示すように、動作主が滞在するランドマークCから遷移しやすい場所が、動作主の移動予測結果として出力される。この場合には、「ランドマークCに行ったからついでに近くのランドマークDも行く」という行動は予測することができる。しかし、「動作主uだからランドマークEに行く」という予測をすることができない。例えば、動作主uはアニメが好きだからアニメショップに行くという予測をすることができない。
従来技術2では、図4に示すように、動作主uの興味zから選ばれやすいランドマークが、動作主の移動予測結果として出力される。この場合には、移動履歴が“興味があるから行った”の記録である場合にのみ有効であり、ただ単に“現在地から近いから訪れた”の記録を多く含むほど、興味推定の際のノイズとなり、予測精度が低下する。
本発明の実施の形態では、“現在地から近いから訪れた”と“興味があるため訪れた”とが混在して観測される場合でも、二つの影響成分を分離して推定することにより、動作主が次に訪れるランドマークを高精度に予測することを目的とする。また、各ランドマークにどの程度滞在するかを予測することを目的とする。
具体的には、図5に示すように、現在地に依存した項(近いから行く)と、ユーザに依存した項(興味があるから行く)とを分離して推定する。これにより、“近いから訪れた”と“興味があるため訪れた”が混在して観測された場合でも頑健で高精度な予測が実現される。
本実施形態によれば、図6に示すように、現在地に依存した項(近いから行く)と、動作主に依存した項(興味があるから行く)とを考慮して、動作主の行動を予測することができる。
[第1の実施の形態]
<第1の実施の形態に係る予測装置の構成>
次に、本発明の第1の実施の形態に係る予測装置の構成について説明する。図7に示すように、本発明の実施の形態に係る予測装置100は、CPUと、RAMと、後述する各処理ルーチンを実行するためのプログラムや各種データを記憶したROMと、を含むコンピュータで構成することが出来る。この予測装置100は、機能的には図7に示すように、操作部10と、演算部20と、移動履歴情報格納部22と、ランドマーク情報格納部24と、出力部40とを備えている。操作部10及び演算部20は、移動履歴情報格納部22及びランドマーク情報格納部24と接続されている。
操作部10は、後述する移動履歴情報格納部22及びランドマーク情報格納部24に格納されているデータに対する操作者からの各種操作を受け付ける。各種操作とは、移動履歴情報格納部22及びランドマーク情報格納部24に格納された情報を登録、修正、削除する操作等である。また、操作部10は、移動履歴情報格納部22及びランドマーク情報格納部24に記憶された情報を操作者に提示することも可能である。
また、操作部10は、ユーザによって入力された特定の動作主uに関する情報を受け付ける。特定の動作主は、予測対象となる動作主を表す。
動作主uに関する情報とは、移動履歴情報格納部22に格納されている動作主を一意に識別するIDなどである。
また、操作部10は、ユーザによって指定された潜在トピック数Zを受け付ける。潜在トピック数Zは、後述するパラメータ推定部26で用いられる変数である。
操作部10及び後述する出力部40の構成例を図8に示す。図8は、操作部10でランドマークのみの問い合わせを行う場合であり、ランドマークとランドマークを訪問する確率を表す選択確率との組み合わせが出力部40により出力され、例えば、選択確率の降順でソートして提示される。
本実施の形態では、予測装置100は、操作部10により指定された特定の動作主に関する予測を行う。第1の実施の形態では、操作部10により、指定された動作主が将来的に訪れる可能性が高いランドマークの問い合わせが行われ、ランドマークとそのランドマークを訪問する確率値の組み合わせを要求することができる。
操作部10の入力手段は、キーボードやマウスやメニュー画面やタッチパネルによるもの等、何でもよい。操作部10は、マウス等の入力手段のデバイスドライバや、メニュー画面の制御ソフトウェアで実現され得る。
移動履歴情報格納部22には、複数の動作主の各々についての、当該動作主が訪問したランドマークを表す移動履歴情報が格納されている。
移動履歴情報格納部22には、予測装置の演算部20によって解析され得る移動履歴情報が格納されており、演算部20からの要求に従って、移動履歴情報を読み出し、当該移動履歴情報を演算部20に送信する。
ここで、解析され得る動作主の集合をU、ランドマークの集合をIと表す。ある動作主u∈Uがm番目に訪れたランドマークをxum∈Iとすると、動作主uの移動履歴情報はxu={xu1,…,xuMu}と表される。なお、Muは動作主が過去に訪れたランドマークの数である。
図9に、本発明の実施の形態における移動履歴情報格納部22に格納される移動履歴情報の一例を示す。
例えば、図9に格納された情報から、動作主IDがU1とU2の動作主の移動履歴情報は以下のように表される。
xu1={i3,i2,i10,i5,i1}
xu2={i2,i3,i1}
移動履歴情報格納部22は、例えば、Webページを保持するWebサーバや、データベースを具備するデータベースサーバ等である。
ランドマーク情報格納部24には、ランドマークに関する情報であるランドマーク情報が格納されている。
ランドマーク情報格納部24には、予測装置の演算部20によって解析され得るランドマーク情報が格納されており、演算部20からの要求に従って、ランドマーク情報を読み出し、当該ランドマーク情報を演算部20に送信する。各ランドマーク情報は、たとえば、ランドマークを一意に識別するためのID、ランドマークの名称、位置座標(緯度・経度)を含む情報である。
図10に、本発明の実施の形態におけるランドマーク情報格納部24に格納されているランドマーク情報の一例を示す。
ランドマーク情報格納部24は、例えば、Webページを保持するWebサーバや、データベースを具備するデータベースサーバ等である。
演算部20は、パラメータ推定部26、推定パラメータ格納部28、及び算出部30を備えている。
説明の簡略化のため、演算部20のパラメータ推定部26及び推定パラメータ格納部28の説明の前に、算出部30について説明する。
算出部30は、操作部10により入力された特定の動作主uに関する情報と、移動履歴情報格納部22に格納された特定の動作主uが現在の時間tに訪問しているランドマークと、推定パラメータ格納部28に格納されたパラメータΨ(例えば、後述する、Θ、Φ、及びΛ)とに基づいて、特定の動作主uが時間t+1に訪問するランドマークの選択確率を、特定の動作主uが、それぞれのランドマークiを将来的に訪れる確率値として算出する。算出部30は、操作部10により特定の動作主についての問い合わせがあった場合に呼び出される手段である。
ここで、算出部30によって算出される、動作主uがそれぞれのランドマークiを将来的に訪れる確率値のモデルについて説明する。
本実施の形態において、動作主の行動を予測するモデルは、複数の動作主の各々について、“動作主uの興味に対応する潜在トピックzが当該動作主uに固有の潜在トピック比率に応じて選択され、選択された潜在トピックzに固有のランドマークの確率分布と、動作主uが時間tに訪問しているランドマークitに固有のランドマークの確率分布とに従って、動作主uが時間t+1に訪問するランドマークit+1が生成される”という仮定に基づくモデルである。
つまり、本実施の形態では、潜在トピック数Zが与えられたもとで、時間tにランドマークitにいる動作主uが時間t+1にランドマークit+1に存在する確率P(it+1|u,it)を以下の式(1)に従って計算する。
ここで、潜在トピックzは「スポーツ」、「アート」などのランドマークの特徴を表現するために用意された潜在変数である。P(z|u)=θuzは、動作主に固有な興味を表し、動作主uが潜在トピックzに興味を持つ確率を表す。
また、P(it+1|z,it)は、潜在トピックzにおいてランドマークiが選択される確率P(i|z)=φziと、時間tにおいて選択されたランドマークitからのアクセスしやすさP(it+1|it)とから導かれたランドマークの選択確率である。
例えば、P(it+1|z,it)は、以下の式(2)に従って計算される。
Cは正規化項であり、以下の式(3)で計算することができる。
上記式におけるP(i|z)=φziは、潜在トピックzにおけるトレンドを示しており、例えば、潜在トピックzが「アート」に関連するランドマーク群をグループ化する変数として推定された場合は、「東京▽▼美術館」や「京都●○美術館」などのアートに関連するランドマークの出現確率が高くなる、つまり、潜在トピックzから選ばれやすくなる。
なお、潜在トピックzは典型的には「スポーツ」や「アート」などのランドマークの特徴を表すために用意された変数であるが、移動履歴情報格納部22に格納された移動履歴情報に応じて、後述するパラメータ推定部26によって自動的に決定されるため、ユーザは当該変数が実際にどのようなトピックを表すかを指定する必要はない。
また、時間tにおいて選択されたランドマークitからのアクセスされやすさP(it+1|it)は、以下の式(4)で計算することができる。
ここで、
は、時間tにおいてランドマークitが選択された場合、次の時間t+1にランドマークit+1が選択される確率である。この確率は、ランドマークitとランドマークit+1とが物理的に近くに存在する場合や、アクセスが容易である場合に高い値を持つ。
例えば、ランドマークitが東京駅だった場合、P(it+1=”品川駅”|it=”東京駅”)の方が、P(it+1=”京都駅”|it=”東京駅”)より高い値を持つ。ただし、各動作主が最初に選択するランドマーク(t=1の場合)に関しては、一つ前に訪れたランドマークが存在しない(未観測である状態)ため、上記式(4)の影響は無視し、例えばP(it+1|it)=1と設定する。
パラメータ推定部26は、操作部10により入力された潜在トピック数Zと、移動履歴情報格納部22に格納された移動履歴情報とに基づいて、上記した算出部30で用いるパラメータΨとして、複数の動作主の各々に対する、複数の潜在トピックの各々を動作主が選択する確率を表す動作主固有潜在トピック出現確率と、複数の潜在トピックの各々に対する、潜在トピックにおける複数のランドマークの各々の選択されやすさを表す潜在トピック固有ランドマーク出現確率と、複数のランドマークの各々に対する、ランドマークから複数のランドマークの各々への移動しやすさを表すランドマーク間遷移確率とを推定する。
ここで、全動作主数をN、全ランドマーク数をI、動作主uが潜在トピックzを選択する確率を表す動作主固有潜在トピック出現確率をθuz、動作主uの潜在トピック分布をθu={θuz}、潜在トピックzからランドマークiが選択される確率を表す潜在トピック固有ランドマーク出現確率をφzi、潜在トピックzに固有のランドマークの確率分布をφz={φzi}、ランドマークiの後にランドマークjが選択される確率を表すランドマーク間遷移確率をλij、ランドマークiに固有のランドマーク分布をλi={λij}と表すこととする。パラメータ推定部26が推定するパラメータは、Θ={θu},Φ={φz},Λ={λi}である。
移動履歴情報格納部22に格納されている移動履歴情報をX={xu}、パラメータをΨ={Θ,Φ,Λ}と表すと、以下の式(5)に示す対数尤度を最大化することにより、パラメータを推定する。
上記式(2)、上記式(4)を、上記式(5)の表記に基づいて書き直すと、それぞれ以下の式(6)、(7)のように表される。
本実施の形態では、パラメータ推定部26は、上記式(5)の対数尤度関数を最大化するパラメータΨを逐次反復的に見つけていく。この最大化問題は、EMアルゴリズムにより、以下の式(8)に示すQ関数を最大化する問題に置き換えて解くことができる。
EMアルゴリズムでは、最初にパラメータに適当な初期値を与える。次に、パラメータが収束するまで以下のE−stepとM−stepを繰り返す。
E−stepにおいて、パラメータ推定部26は、以下の式(9)に示すベイズ則に従って、パラメータの現在の推定値Ψ^が与えられたもとでのトピック事後確率P(z|u,m;Ψ^)を計算する。
M−stepでは、パラメータ推定部26は、トピック事後確率P(z|u,m;Ψ^)に基づいて、上記式(8)に示すQ関数を最大化する、新たなパラメータの値を求める。例えば、θuzに関しては、
を解き、以下の式(10)に従って、Q関数をθuzに関して最大化することで、θuzを求めることができる。
また、記号「^」が付与されているのはパラメータの次の推定値であることを示しており、記号「^」が付与されていないのはパラメータの現在の推定値を示している。
また、φziとλijに関しては、閉形式で直接求めることができないため、準ニュートン法などの最適化手法を用いて求める。準ニュートン法で用いる勾配ベクトルはそれぞれ、以下の式(11)、(12)である。
パラメータ推定部26は、EステップとMステップとをパラメータが収束するまで繰り返すことで、上記式(5)で示した尤度関数を最大化するパラメータΨを得ることができる。
推定パラメータ格納部28には、パラメータ推定部26によって推定されたパラメータΨであるΘ、Φ、及びΛが格納される。
推定パラメータ格納部28には、潜在トピック数Zとパラメータ推定部26で推定したパラメータΨが格納される。推定パラメータ格納部28には、これらの情報が保存され、保存された情報が復元可能なものであればなんでもよい。例えば、データベースや、予め備えられた汎用的な記憶装置(メモリやハードディスク装置)の特定領域に記憶される。
出力部40は、算出部30によって算出された、特定の動作主が時間t+1に訪問するランドマークの選択確率を結果として出力する。
具体的には、出力部40は、操作部10により指定される特定の動作主が将来的に訪れる可能性が高いランドマークの問い合わせがあった場合、算出部30の結果に基づいてランドマークと当該ランドマークを訪問する確率値の組み合わせを出力する。
ここで、出力部30における出力とは、ディスプレイへの表示、プリンタへの印字、音出力、外部装置への送信等を含む概念である。出力部30は、ディスプレイやスピーカ等の出力デバイスを含むと考えても含まないと考えてもよい。出力部30は、出力デバイスのドライバソフトまたは、出力デバイスのドライバソフトと出力デバイス等で実現され得る。
<第1の実施の形態に係る予測装置の作用>
次に、本発明の実施の形態に係る予測装置100の作用について説明する。本実施の形態では、特定の動作主の行動の予測を行う前に、パラメータの推定を実行する必要がある。そのため、予測装置100は、パラメータ推定処理を行った後に、特定の動作主の行動の予測処理を行う。
<パラメータ推定処理ルーチン>
予測装置100は、移動履歴情報が入力されると、移動履歴情報格納部22に格納する。また、ランドマーク情報が入力されると、予測装置100は、ランドマーク情報格納部24に格納する。そして、予測装置100は、潜在トピック数Zが操作部10により入力されると、図11に示すパラメータ推定処理ルーチンを実行する。
まず、ステップS100において、パラメータ推定部26は、移動履歴情報格納部22に格納された移動履歴情報を取得する。また、パラメータ推定部26は、操作部10によって受け付けた潜在トピック数Zを取得する。
次に、ステップS102において、パラメータ推定部26は、パラメータΨの初期値を設定する。
ステップS104において、パラメータ推定部26は、E−stepとして、上記ステップS100で取得した移動履歴情報及び潜在トピック数Zと、上記ステップS102で設定されたパラメータΨの初期値又は前回のステップS106で推定されたパラメータΨ^とに基づいて、上記式(9)に従って、トピック事後確率P(z|u,m;Ψ^)を計算する。
ステップS106において、パラメータ推定部26は、M−stepとして、上記ステップS100で取得した移動履歴情報及び潜在トピック数Zと、上記ステップS104で計算されたトピック事後確率P(z|u,m;Ψ^)とに基づいて、上記式(10)、(11)、(12)に従って、上記式(8)に示すQ関数を最大化する、新たなパラメータΨを推定する。
ステップS108において、パラメータ推定部26は、パラメータΨの値が収束したか否かを判定する。パラメータΨの値が収束したと判定した場合には、ステップS110へ進む。一方、パラメータΨの値が収束していないと判定した場合には、ステップS104へ戻る。
ステップS110において、パラメータ推定部26は、上記ステップS106で推定されたパラメータΨであるΘ、Φ、及びΛと、上記ステップS100で取得した潜在トピック数Zとを、推定パラメータ格納部28に格納して、パラメータ推定処理ルーチンを終了する。
<予測処理ルーチン>
次に、特定の動作主に関する情報が、操作部10によりユーザによって入力されると、予測装置100は、図12に示す予測処理ルーチンを実行する。
まず、ステップS200において、算出部30は、操作部10により入力された特定の動作主uに関する情報を取得する。
ステップS202において、算出部30は、移動履歴情報格納部22に格納されている、上記ステップS200で取得した特定の動作主uが現在の時間tに訪問しているランドマークの情報を取得する。また、算出部30は、推定パラメータ格納部28に格納されたパラメータΨと潜在トピック数Zとを取得する。
ステップS204において、算出部30は、1つのランドマークを設定する。
ステップS206において、算出部30は、時間tにランドマークitにいる動作主uが時間t+1にランドマークit+1に存在する確率P(it+1|u,it)に0を代入する。
ステップS208において、算出部30は、一時変数zに1を代入し、初期化する。
ステップS210において、算出部30は、上記ステップS208で初期化された一時変数z又は前回のステップS214で更新された一時変数zが、上記ステップS202で取得された潜在トピック数Z以下であるか否かを判定する。一時変数zが潜在トピック数Z以下である場合には、ステップS212へ進む。一方、一時変数zが潜在トピック数Zより大きい場合には、ステップS216へ進む。
ステップS212において、上記式(1)を計算するため、算出部30は、上記ステップS206で初期化された確率P(it+1|u,it)又は前回の本ステップS212で更新された確率P(it+1|u,it)と、上記ステップS202で取得したパラメータΨのうちΘから得られる確率P(z|u)と、パラメータΨのうちΦ及びΛから上記式(2)〜(4)に従い算出される確率P(it+1|z,it)とに基づいて、以下の算出式に従って、確率P(it+1|u,it)を更新する。
ステップS214において、算出部30は、一時変数zを1インクリメントし、ステップS210へ戻る。
ステップS216において、算出部30は、予測対象の全てのランドマークについて、上記ステップS204〜ステップS214の処理を実行したか否かを判定する。全てのランドマークについて、上記ステップS204〜ステップS214の処理を実行したと判定した場合には、ステップS218へ進む。一方、上記ステップS204〜ステップS214の処理を実行していないランドマークが存在する場合には、ステップS204へ戻る。
ステップS218において、出力部40は、上記ステップS212で算出された、特定の動作主uが時間t+1に訪問する各ランドマークの選択確率P(it+1|u,it)を結果として出力し、予測処理ルーチンを終了する。
図13に、第1の実施の形態の予測装置100の基本的な動作の一例を示す。図13では、動作主uが過去にランドマークa,b,cを訪問し、現在、ランドマークcに存在しているとする。また、潜在トピック数Zは3であるとし、パラメータ推定部26の推定結果から、それぞれの潜在トピックに含まれやすいランドマークをそれぞれ丸、四角、三角で示してある。
厳密には、予測装置100により、潜在トピック固有のランドマーク出現確率を算出できるため、各ランドマークは複数の潜在トピックから同程度に支持される可能性もあるが、説明の簡略化のため、各ランドマークはいずれかの潜在トピックに含まれるとして説明を進める。
また、図13中の矢印に付与された値はλjiである。例えば、λcd=0.1である。予測装置100は、上記式(1)〜式(4)により、動作主uが現在いる(最後に訪問した)ランドマークから近いランドマークほど高いスコアを与える。つまり、λの高いランドマークを優先する。さらに、動作主が支持する潜在トピックに含まれるランドマークほどスコアが高くなる。
ここで、対象となる動作主は四角形で示される潜在トピックに優先的に訪問する傾向があるため、四角形に含まれるランドマークほどスコアが高くなる。上記図13の例では、ランドマークd,e,fの中では、eが最もスコアが高くなる。ランドマークh,gの中では、hが最もスコアが高くなる。ランドマークeは、λの値も大きく、かつ、潜在トピックに合致するため、ランドマークd,e,f,h,gの中で最もスコアが高くなる。ランドマークd,fは潜在トピックには該当しないがλが大きいため、ランドマークhはλは小さいが潜在トピックに該当するため、同程度のスコアを持つことになる。
このように、本実施の形態に係る予測装置100は、現在地からのアクセスしやすさに加え、動作主が訪問しやすいランドマークの種類(潜在トピック)を加味して高精度に次に訪れるランドマークを予測することができる。
以上説明したように、第1の実施の形態に係る予測装置によれば、動作主の興味に対応する潜在トピックが該動作主に固有の潜在トピック比率に応じて選択され、選択された潜在トピックに固有のランドマークの確率分布と、当該動作主が時間tに訪問しているランドマークに固有のランドマークの確率分布とに従って、動作主が時間t+1に訪問するランドマークが生成されることを表すモデルのパラメータを推定することにより、動作主の行動を精度よく予測するためのパラメータを得ることができる。
また、特定の動作主に関する情報と、特定の動作主が時間tに訪問しているランドマークと、推定されたパラメータとに基づいて、特定の動作主が時間t+1に訪問するランドマークの選択確率を算出することにより、動作主の行動を精度よく予測することができる。
また、“動作主が訪れるランドマークは、動作主固有のトピック比率に従ってある潜在トピックを選択した後、その潜在トピックと動作主が最後に訪れたランドマークからのアクセスしやすさとを加味して決定した”という実態にあった仮定に基づく行動モデルを学習することで、“近いから訪れる”と“興味があるからわざわざ訪れる”の影響成分を分離することができる。これにより、“現在地から近いから訪れた”と“興味があるため訪れた”が混在して観測されるような場合でも高精度に次に訪れるランドマークを予測することができる。
[第2の実施の形態]
次に、本発明の第2の実施の形態について説明する。なお、第2の実施の形態に係る予測装置の構成は、第1の実施の形態と同様の構成となるため、同一符号を付して説明を省略する。
第2の実施の形態では、特定の動作主が時間t+1に訪問するランドマークの選択確率と当該ランドマークでの滞在時間との組み合わせが起こる確率を算出する点が、第1の実施の形態と異なっている。
第2の実施の形態では、図14に示すように、動作主u∈Uの移動履歴と滞在時間履歴とから、動作主uが次に訪問するランドマークとその滞在時間を予測する。学習データとしては、全動作主Uの移動履歴と滞在時間履歴とを用いる。
第2の実施の形態では、図15に示すように、興味zに分類される人々は場所の選び方だけでなく、滞在時間の傾向も近いことを利用して、パラメータを推定する。
第2の実施の形態の予測装置に係る操作部10は、第1の実施の形態と同様に、特定の動作主に関する情報と、潜在トピック数Zとを受け付ける。
図16に、第2の実施の形態に係る操作部10及び出力部40の構成例を示す。図16は、操作部10でランドマークと滞在時間との組み合わせの問い合わせを行う場合であり、ランドマークと滞在時間の組み合わせと、当該組み合わせが起こる確率値が出力部40により出力される。
第2の実施の形態の予測装置に係る移動履歴情報格納部22には、動作主が訪問したランドマークでの滞在時間に関する情報を含む移動履歴情報が格納されている。
図17に、第2の実施の形態における移動履歴情報格納部22に格納されている移動履歴情報の一例を示す。移動履歴情報格納部22には、それぞれのランドマークにどれくらいの時間、滞在したかの情報も格納されている。uがm番目に訪れたランドマークxumの滞在時間をsumとすると、uの滞在時間履歴情報はsu={su1,…,suMu}となる。
図17に示すように、移動履歴情報に、滞在時間履歴情報が含まれている。例えば、滞在時間履歴情報は以下のようになる。
su1={3000,600,300,1800,60}
su2={6000,1800,60}
第2の実施の形態の予測装置に係る算出部30は、操作部10により入力された特定の動作主uに関する情報と、移動履歴情報格納部22に格納された特定の動作主uが現在の時間tに訪問しているランドマーク及び滞在時間と、推定パラメータ格納部28に格納されたパラメータΨ(後述するΘ、Φ、Λ、及びΩ)とに基づいて、特定の動作主uが時間t+1に訪問するランドマークと当該ランドマークでの滞在時間との組み合わせが起こる確率を算出する。
第2の実施の形態において、動作主の行動を予測するモデルは、複数の動作主の各々について、“動作主uの興味に対応する潜在トピックzが当該動作主uに固有の潜在トピック比率に応じて選択され、選択された潜在トピックzに固有のランドマークの確率分布と、動作主uが時間tに訪問しているランドマークitに固有のランドマークの確率分布とに従って、動作主uが時間t+1に訪問するランドマークit+1が生成されることを表し、かつ、選択された潜在トピックと、動作主が時間t+1に訪問するランドマークとの組み合わせに固有の滞在時間の確率分布とに従って、動作主が時間t+1に訪問するランドマークの滞在時間が生成される”という仮定に基づくモデルである。
具体的には、算出部30は、時間tにランドマークitにいる動作主uが時間t+1で訪れるランドマークの候補の各々に対し、当該ランドマークit+1と、当該ランドマークit+1での各滞在時間st+1との組み合わせの各々について、当該組み合わせが起こる確率P(it+1,st+1|u,it)を、以下の式(13)に従って計算する。算出部30は、操作部10により特定の動作主について、ランドマークと滞在時間との組み合わせに対する問い合わせがあった場合に呼び出される手段である。
上記式(1)と同様に、P(z|u)、P(it+1|z,it)については、上記式(2)〜上記式(4)に従って計算する。また、ある潜在トピックzに属する動作主が、もし、ランドマークit+1を訪れる場合の滞在時間st+1は以下の式(14)に示すガンマ分布に基づく式で計算する。
ここで、αとβとは、それぞれガンマ分布のパラメータである。上記式(13)により、行き先と滞在時間との両方を予測することができる。一般的に滞在時間は動作主の興味の程度を反映しているため、滞在時間の長くなるであろう(動作主が強く興味を持つであろう)ランドマークに絞り込んだ予測をすることができる。
第2の実施の形態の予測装置に係るパラメータ推定部26は、操作部10により入力された潜在トピック数Zと、移動履歴情報格納部22に格納された移動履歴情報とに基づいて、上記した算出部30で用いるパラメータΨとして、複数の動作主の各々に対する、複数の潜在トピックの各々を動作主が選択する確率を表す動作主固有潜在トピック出現確率と、複数の潜在トピックの各々に対する、潜在トピックにおける複数のランドマークの各々の選択されやすさを表す潜在トピック固有ランドマーク出現確率と、複数のランドマークの各々に対する、ランドマークから複数のランドマークの各々への移動しやすさを表すランドマーク間遷移確率と、潜在トピックとランドマークとの組み合わせの各々に対する、当該潜在トピックにおいて、動作主が時間t+1に訪問する当該ランドマークの滞在時間の確率分布のパラメータとを推定する。
第1の実施の形態と同様に、全動作主数をN、全ランドマーク数をI、動作主uが潜在トピックzを選択する確率を表す動作主固有潜在トピック出現確率をθuz、動作主uの潜在トピック分布をθu={θuz}、潜在トピックzからランドマークiが選択される確率を表す潜在トピック固有ランドマーク出現確率をφzi、潜在トピックzのランドマーク分布をφz={φzi}、ランドマークiの後にランドマークjが選択される確率を表すランドマーク間遷移確率をλij,ランドマークiに固有のランドマーク分布をλi={λij}と表し、また、潜在トピックzとランドマークiが与えられたときのランドマークの滞在時間の確率分布のパラメータ(ガンマ分布のパラメータ)をαziとβzi、潜在トピックzのパラメータをαz={αzi}とβz={βzi}と表すこととする。従って、第2の実施の形態に係るパラメータ推定部26が推定するパラメータは、Θ={θu},Φ={φz},Λ={λi},Ω={αz,βz}である。
移動履歴情報格納部22に格納されている移動履歴情報をX={xu,su}、パラメータをΨ={Θ,Φ,Λ,Ω}と表すと、以下の式(15)に示す対数尤度を最大化することにより、パラメータを推定する。
ここで、動作主uがm番目に訪れたランドマークがxum、その滞在時間がsumである。また、上記式(14)を上記式(15)の表記に基づいて書き直すと以下のようになる。
第2の実施の形態では、パラメータ推定部26は、上記式(15)の対数尤度関数を最大化するパラメータΨを逐次反復的に見つけていく。この最大化問題は、EMアルゴリズムにより、以下の式(16)に示すQ関数を最大化する問題に置き換えて解くことができる。
E−stepにおいて、パラメータ推定部26は、以下の式(17)に示すベイズ則に従って、パラメータの現在の推定値Ψ^が与えられたもとでのトピック事後確率を計算する。
M−stepでは、パラメータ推定部26は、第1の実施の形態と同様に、上記式(16)に示すQ関数を最大化する、新たなパラメータθuz,φzi,λijの値を求める。
また、パラメータ推定部26は、M−stepの中で以下に示す式(18)、(19)に従って、パラメータαとβとを更新する。
ここで、
である。
第2の実施の形態の予測装置に係る出力部40は、算出部30によって算出された、特定の動作主が時間t+1に訪問するランドマークと当該ランドマークでの滞在時間との組み合わせが起こる確率を結果として出力する。
具体的には、出力部40は、操作部10により指定される特定の動作主が将来的に訪れるランドマークと滞在時間の組み合わせに対する問い合わせがあった場合、算出部30の結果に基づいてランドマークと滞在時間との組み合わせと、当該組み合わせが起こる確率値を出力する。また、滞在時間に対する問い合わせである場合には、滞在時間とそれが起こる確率値を出力する。例えば、出力部40は、ランドマークと滞在時間との組み合わせと当該組み合わせが起こる確率値を、確率値の降順でソートして出力する。
<第2の実施の形態に係る予測装置の作用>
次に、第2の実施の形態に係る予測装置100の作用について説明する。第1の実施の形態と同様に、予測装置100は、パラメータ推定処理を行った後に、特定の動作主の行動の予測処理を行う。
まず、上記図11に示すパラメータ推定処理ルーチンが実行され、パラメータΨ={Θ,Φ,Λ,Ω}が推定パラメータ格納部28に格納される。
<予測処理ルーチン>
次に、特定の動作主uに関する情報が、操作部10によりユーザによって入力されると、予測装置100は、図18に示す予測処理ルーチンを実行する。
ステップS306において、算出部30は、時間tにランドマークitにいる動作主uが時間t+1にランドマークit+1に各時間st+1滞在する確率P(it+1,st+1|u,it)に0を代入する。
ステップS312において、上記式(13)を計算するため、算出部30は、各時間st+1について、上記ステップS306で初期化された確率P(it+1,st+1|u,it)又は前回の本ステップS212で更新された確率P(it+1,st+1|u,it)と、上記ステップS202で取得したパラメータΨのうちΘから得られる確率P(z|u)と、パラメータΨのうちΦ及びΛから上記式(2)〜(4)に従い算出される確率P(it+1|z,it)と、パラメータΨのうちα及びβから上記式(14)に従い算出される確率P(st+1|z,it+1)とに基づいて、以下の算出式に従って、確率P(it+1,st+1|u,it)を更新する。
ステップS318において、出力部40は、上記ステップS312で算出された、特定の動作主uが時間t+1に訪問する各ランドマークと当該ランドマークでの各滞在時間との組み合わせが起こる確率P(it+1,st+1|u,it)を結果として出力し、予測処理ルーチンを終了する。
なお、第2の実施の形態に係る予測装置の他の構成及び作用については、第1の実施の形態と同様であるため、説明を省略する。
以上説明したように、第2の実施の形態に係る予測装置によれば、動作主の興味に対応する潜在トピックが該動作主に固有の潜在トピック比率に応じて選択され、選択された潜在トピックに固有のランドマークの確率分布と、当該動作主が時間tに訪問しているランドマークに固有のランドマークの確率分布とに従って、動作主が時間t+1に訪問するランドマークが生成され、かつ、選択された潜在トピックと、動作主が時間t+1に訪問するランドマークとの組み合わせに固有の滞在時間の確率分布とに従って、動作主が時間t+1に訪問するランドマークの滞在時間が生成されることを表すモデルのパラメータを推定することにより、ランドマークでの滞在時間を含む動作主の行動を精度よく予測するためのパラメータを得ることができる。
また、特定の動作主に関する情報と、特定の動作主が時間tに訪問しているランドマークと、推定されたパラメータとに基づいて、特定の動作主が時間t+1に訪問するランドマークの選択確率と、当該ランドマークでの滞在時間とを算出することにより、ランドマークでの滞在時間を含む動作主の行動を精度よく予測することができる。
また、動作主の興味を反映した潜在トピックに固有な滞在時間の傾向を推定することで、高精度に滞在時間を予測することもできる。
[第3の実施の形態]
次に、本発明の第3の実施の形態について説明する。なお、第3の実施の形態に係る予測装置の構成は、第1の実施の形態と同様の構成となるため、同一符号を付して説明を省略する。
第3の実施の形態では、ランドマークから複数のランドマークの各々への移動しやすさとして、ランドマーク間の距離を用いる点が、第1又は第2の実施の形態と異なっている。
第3の実施の形態に係る予測装置100のパラメータ推定部26は、ランドマーク情報格納部24に格納された、各ランドマーク間の空間的な距離を補助情報として用い、空間的な距離を反映するようにλijを推定する。その場合、上記式(8)又は上記式(16)のQ関数に、以下の式(20)に示す項を加算した値を最適化することで、空間的な距離を反映するようにλijを推定することができる。
ここで、rijはランドマークjとiとの空間的な距離を表し、ランドマーク情報格納部24に格納された情報に基づき計算される。ランドマークjとiとの空間的な距離が近いほど、λijは大きな値として推定される。なお,γはユーザによって指定されるパラメータであり、実際の距離をどの程度、パラメータλijに強く反映させるかをコントロールするためのものである。上記式(20)で示した項をQ関数に含める場合、上記式(12)で示した準ニュートン法で用いる勾配ベクトルは、以下の式(21)に示すようになる。
なお、第3の実施の形態に係る予測装置の他の構成及び作用については、第1の実施の形態と同様であるため、説明を省略する。
以上説明したように、第3の実施の形態に係る予測装置によれば、ランドマーク間の距離を考慮してパラメータを推定することにより、ランドマーク間の距離に応じた動作主の行動を精度よく予測するためのパラメータを得ることができる。
また、推定されたパラメータに基づいて、特定の動作主が時間t+1に訪問するランドマークの選択確率を算出することにより、ランドマーク間の距離に応じた動作主の行動を精度よく予測することができる。
なお、本発明は、上述した実施形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。
例えば、上記実施の形態においては、予測装置100によって、パラメータを推定し、特定の動作主の行動を予測する場合を例に説明したが、これに限定されるものではなく、予測装置100とは別の装置(例えば、パラメータ推定装置)によって、パラメータを推定するようにしてもよい。この場合には、パラメータ推定装置は、操作部10、移動履歴情報格納部22、ランドマーク情報格納部24、パラメータ推定部26、及び推定パラメータ格納部28を備えるようにすればよい。
また、移動履歴情報格納部22、ランドマーク情報格納部24、及び推定パラメータ格納部28の少なくとも1つは、外部に設けられ、予測装置100とネットワークで接続されていてもよい。
また、上述の予測装置100は、内部にコンピュータシステムを有しているが、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、本願明細書中において、プログラムが予めインストールされている実施形態として説明したが、当該プログラムを、コンピュータ読み取り可能な記録媒体に格納して提供することも可能であるし、ネットワークを介して提供することも可能である。