JP6433876B2

JP6433876B2 - パラメータ推定装置、予測装置、方法、及びプログラム

Info

Publication number: JP6433876B2
Application number: JP2015209244A
Authority: JP
Inventors: 倉島　健; 健倉島
Original assignee: Nippon Telegraph and Telephone Corp; NTT Inc USA
Current assignee: NTT Inc; NTT Inc USA
Priority date: 2015-10-23
Filing date: 2015-10-23
Publication date: 2018-12-05
Anticipated expiration: 2035-10-23
Also published as: JP2017083963A

Description

本発明は、パラメータ推定装置、予測装置、方法、及びプログラムに関する。

従来技術１として、動作主がランドマークを訪れた移動履歴情報の集合を学習データとして、トピックモデルを用いて動作主の行動をモデル化し、動作主が次に訪れるランドマークを予測する方法がある。トピックモデルにおいては、学習データが“ある動作主が訪れる各場所は、ユーザ固有の潜在トピック比率に従ってある潜在トピックを選択した後、その潜在トピックに固有のランドマーク出現確率分布に従って生成された”と仮定して、動作主の行動を確率モデルで表現することで、次に訪れる地点を予測する（非特許文献１）。

また、従来技術２として、例えば、複数人に関する移動履歴情報集合の傾向から、ランドマークＡを訪れた人の多くはその近くのランドマークＢを訪れる、とったランドマーク間の遷移のしやすさをマルコフモデルでモデル化することで、動作主が次に訪れるランドマークを予測する方法がある（非特許文献２）。

なお、ランドマークとは、屋内外を問わず、位置座標（緯度・経度など）に関連づけられた建物、寺社・仏閣、レストラン、商業施設、展示などの場所を意味する総称とする。

T. Hofmann.，"Probabilistic Latent Semantic Analysis", in Proc. Conf. on Uncertainty in Artificial Intelligence (UAI), pp. 289-296 (1999). D. Ashbrook and T. starner, "Using GPS to Learn Significant Locations and Predict Movement Across Multiple User"s, in Personal and ubiquitous computing, Vol.7, No. 5, pp.275-286 (2003).

上記非特許文献２に記載の従来技術２は、距離的な近さを反映したランドマーク間の遷移のモデル化である。従って、あるランドマークＡを訪れた人が、その近辺に存在するランドマークＢも“近いから訪れた”場合には、うまく予測を行うことができる。しかし、あるランドマークＡを訪れた人が、ランドマークＡからは遠いけれど“興味があるためランドマークＣをわざわざ訪れた”といった場合に、うまく予測を行うことができなかった。

一方で、上記非特許文献１に記載の従来技術１であるトピックモデルは、「アート」、「スポーツ」、「人気」、「おしゃれ」といったランドマークの“特徴”でつながるランドマーク集合をまとめる潜在トピックと、潜在トピックに対する動作主の興味（重み）を学習することを目的とした技術である。従来技術１により、潜在トピックとそれに対する動作主の興味がうまく学習できれば、遠いけれど、興味があるため訪れたランドマークＣを予測することができる。しかし、従来技術１は、すべてのランドマーク訪問が動作主に固有の興味によって生成されたと仮定している。つまり、すべてのランドマーク訪問事象は、“興味があるためわざわざ訪れた”の記録である場合にのみ有効な技術である。実際の移動履歴は、“近いから訪れた”と“興味があるためわざわざ訪れた”が混在して観測される。従来技術１はその二つの影響成分を分離する方法がないため、“近いから訪れた”観測データがノイズとして混入し、潜在トピック、及び、動作主固有の興味情報の抽出精度を低下させていた。従って、動作主が次に訪れるランドマークの予測精度も低かった。

また、従来技術１、及び、従来技術２は、次に訪れるランドマークを予測するが、そのランドマークにどれくらいの時間、滞在するかを予測することはできなかった。

本発明は、上記の点に鑑みてなされたものであり、動作主の行動を精度よく予測するためのパラメータを得ることができるパラメータ推定装置、方法、及びプログラムを提供することを目的とする。
また、動作主の行動を精度よく予測する予測装置、方法、及びプログラムを提供することを目的とする。

上記目的を達成するために、本発明に係るパラメータ推定装置は、複数の動作主の各々についての、前記動作主が訪問したランドマークを表す移動履歴情報に基づいて、前記複数の動作主の各々について、前記動作主の興味に対応する潜在トピックが該動作主に固有の潜在トピック比率に応じて選択され、選択された前記潜在トピックに固有のランドマークの確率分布と、前記動作主が時間ｔに訪問しているランドマークに固有のランドマークの確率分布とに従って、前記動作主が時間ｔ＋１に訪問するランドマークが生成されることを表すモデルのパラメータとして、前記複数の動作主の各々に対する、複数の前記潜在トピックの各々を前記動作主が選択する確率を表す動作主固有潜在トピック出現確率と、複数の前記潜在トピックの各々に対する、前記潜在トピックにおける複数の前記ランドマークの各々の選択されやすさを表す潜在トピック固有ランドマーク出現確率と、複数の前記ランドマークの各々に対する、前記ランドマークから複数の前記のランドマークの各々への移動しやすさを表すランドマーク間遷移確率とを推定するパラメータ推定部を含んで構成されている。

本発明に係るパラメータ推定方法は、パラメータ推定部を含むパラメータ推定装置におけるパラメータ推定方法であって、前記パラメータ推定部が、複数の動作主の各々についての、前記動作主が訪問したランドマークを表す移動履歴情報に基づいて、前記複数の動作主の各々について、前記動作主の興味に対応する潜在トピックが該動作主に固有の潜在トピック比率に応じて選択され、選択された前記潜在トピックに固有のランドマークの確率分布と、前記動作主が時間ｔに訪問しているランドマークに固有のランドマークの確率分布とに従って、前記動作主が時間ｔ＋１に訪問するランドマークが生成されることを表すモデルのパラメータとして、前記複数の動作主の各々に対する、複数の前記潜在トピックの各々を前記動作主が選択する確率を表す動作主固有潜在トピック出現確率と、複数の前記潜在トピックの各々に対する、前記潜在トピックにおける複数の前記ランドマークの各々の選択されやすさを表す潜在トピック固有ランドマーク出現確率と、複数の前記ランドマークの各々に対する、前記ランドマークから複数の前記のランドマークの各々への移動しやすさを表すランドマーク間遷移確率とを推定するステップを含む。

本発明に係る予測装置は、入力された特定の動作主に関する情報と、前記特定の動作主が時間ｔに訪問しているランドマークと、上記のパラメータ推定装置によって推定された、前記動作主固有潜在トピック出現確率、前記潜在トピック固有ランドマーク出現確率、及び前記ランドマーク間遷移確率とに基づいて、前記特定の動作主が時間ｔ＋１に訪問するランドマークの選択確率を算出する算出部を含んで構成されている。

本発明に係る予測方法は、算出部を含む予測装置における予測方法であって、前記算出部が、入力された特定の動作主に関する情報と、前記特定の動作主が時間ｔに訪問しているランドマークと、上記のパラメータ推定方法によって推定された、前記動作主固有潜在トピック出現確率、前記潜在トピック固有ランドマーク出現確率、及び前記ランドマーク間遷移確率とに基づいて、前記特定の動作主が時間ｔ＋１に訪問するランドマークの選択確率を算出するステップを含む。

また、本発明に係るパラメータ推定装置は、前記移動履歴情報は、前記動作主が訪問した前記ランドマークでの滞在時間に関する情報を含み、前記モデルは、前記複数の動作主の各々について、前記動作主の興味に対応する潜在トピックが該動作主に固有の潜在トピック比率に応じて選択され、選択された前記潜在トピックに固有のランドマークの確率分布と、前記動作主が時間ｔに訪問しているランドマークに固有のランドマークの確率分布とに従って、前記動作主が時間ｔ＋１に訪問するランドマークが生成されることを表し、かつ、前記複数の動作主の各々について、前記選択された前記潜在トピックと、前記動作主が時間ｔ＋１に訪問するランドマークとの組み合わせに固有の滞在時間の確率分布とに従って、前記動作主が時間ｔ＋１に訪問するランドマークの滞在時間が生成されることを表し、前記パラメータ推定部は、前記移動履歴情報に基づいて、前記モデルのパラメータとして、前記複数の動作主の各々に対する前記動作主固有潜在トピック出現確率と、複数の前記潜在トピックの各々に対する前記潜在トピック固有ランドマーク出現確率と、複数の前記ランドマークの各々に対する前記ランドマーク間遷移確率と、前記潜在トピックと前記ランドマークとの組み合わせの各々に対する、前記潜在トピックにおいて、前記動作主が時間ｔ＋１に訪問する前記ランドマークの滞在時間の確率分布のパラメータとを推定するようにすることができる。

また、本発明に係る予測装置は、入力された特定の動作主に関する情報と、前記特定の動作主が時間ｔに訪問しているランドマークと、上記のパラメータ推定装置によって推定された、前記動作主固有潜在トピック出現確率、前記潜在トピック固有ランドマーク出現確率、前記ランドマーク間遷移確率、及び前記ランドマークの滞在時間の確率分布のパラメータとに基づいて、前記特定の動作主が時間ｔ＋１に訪問するランドマークと該ランドマークでの滞在時間との組み合わせが起こる確率を算出する算出部を含んで構成されている。

また、本発明に係るパラメータ推定装置において、前記パラメータ推定部は、前記移動履歴情報と、前記モデルのパラメータとに基づいて、前記移動履歴情報に対する、前記モデルのパラメータの対数尤度関数を最大化するように、前記モデルのパラメータを推定することを繰り返すようにすることができる。

また、本発明のプログラムは、コンピュータを、上記のパラメータ推定装置、あるいは上記の予測装置の各部として機能させるためのプログラムである。

以上説明したように、本発明のパラメータ推定装置、方法、及びプログラムによれば、動作主の興味に対応する潜在トピックが該動作主に固有の潜在トピック比率に応じて選択され、選択された潜在トピックに固有のランドマークの確率分布と、当該動作主が時間ｔに訪問しているランドマークに固有のランドマークの確率分布とに従って、動作主が時間ｔ＋１に訪問するランドマークが生成されることを表すモデルのパラメータを推定することにより、動作主の行動を精度よく予測するためのパラメータを得ることができる、という効果が得られる。

また、本発明の予測装置、方法、及びプログラムによれば、特定の動作主に関する情報と、特定の動作主が時間ｔに訪問しているランドマークと、推定されたパラメータとに基づいて、特定の動作主が時間ｔ＋１に訪問するランドマークの選択確率を算出することにより、動作主の行動を精度よく予測することができる、という効果が得られる。

動作主の移動履歴から動作主が次に訪問する場所を予測する処理を説明するための説明図である。本発明の実施の形態で用いる仮定を説明するための説明図である。従来技術の一例を説明するための説明図である。従来技術の一例を説明するための説明図である。本発明の第１の実施の形態におけるモデルを説明するための説明図である。本発明の実施の形態におけるモデルと従来技術との関係を説明するための説明図である。本発明の実施の形態における予測装置のブロック図である。本発明の第１の実施の形態における操作部及び出力部の構成例である。本発明の第１の実施の形態における移動履歴情報格納部に格納されている移動履歴情報の一例である。本発明の実施の形態におけるランドマーク情報格納部に格納されているランドマーク情報の一例である。本発明の実施の形態における予測装置のパラメータ推定処理ルーチンを示すフローチャートである。本発明の第１の実施の形態における予測装置の予測処理ルーチンを示すフローチャートである。本発明の第１の実施の形態における予測装置の動作の一例を説明するための説明図である。動作主の移動履歴から動作主が次に訪問する場所と滞在時間とを予測する処理を説明するための説明図である。本発明の第２の実施の形態におけるモデルを説明するための説明図である。本発明の第２の実施の形態における操作部及び出力部の構成例である。本発明の第２の実施の形態における移動履歴情報格納部に格納されている移動履歴情報の一例である。本発明の第２の実施の形態における予測装置の予測処理ルーチンを示すフローチャートである。

本発明の実施の形態は、個人の移動履歴情報に基づいて、その人が将来的に訪れるランドマークを予測する装置に関連し、また、各ランドマークを訪れた場合の滞在時間を予測する装置に関連する。

以下、図面を参照して本発明の実施の形態を詳細に説明する。

＜概要＞
図１に、本発明の実施の形態の技術分野を説明するための図を示す。図１に示すように、本発明の実施の形態では、動作主ｕ∈Ｕの移動履歴から、動作主ｕが次に訪問するランドマークを予測する。学習データとしては、全動作主Ｕの移動履歴の情報を用いる。

図２に、本実施の形態で用いる仮定を説明するための図を示す。図２に示すように、本実施の形態では、動作主ｕが次に訪れるランドマークｉは、以下の２つの要因で決まると仮定する。

（１）現在のランドマークｊからのアクセスしやすさを表すＰ（ランドマークｉ|ランドマークｊ）
（２）動作主ｕの興味ｚを表すＰ（ランドマークｉ|興味ｚ）

従来技術１では、図３に示すように、動作主が滞在するランドマークＣから遷移しやすい場所が、動作主の移動予測結果として出力される。この場合には、「ランドマークＣに行ったからついでに近くのランドマークＤも行く」という行動は予測することができる。しかし、「動作主ｕだからランドマークＥに行く」という予測をすることができない。例えば、動作主ｕはアニメが好きだからアニメショップに行くという予測をすることができない。

従来技術２では、図４に示すように、動作主ｕの興味ｚから選ばれやすいランドマークが、動作主の移動予測結果として出力される。この場合には、移動履歴が“興味があるから行った”の記録である場合にのみ有効であり、ただ単に“現在地から近いから訪れた”の記録を多く含むほど、興味推定の際のノイズとなり、予測精度が低下する。

本発明の実施の形態では、“現在地から近いから訪れた”と“興味があるため訪れた”とが混在して観測される場合でも、二つの影響成分を分離して推定することにより、動作主が次に訪れるランドマークを高精度に予測することを目的とする。また、各ランドマークにどの程度滞在するかを予測することを目的とする。

具体的には、図５に示すように、現在地に依存した項（近いから行く）と、ユーザに依存した項（興味があるから行く）とを分離して推定する。これにより、“近いから訪れた”と“興味があるため訪れた”が混在して観測された場合でも頑健で高精度な予測が実現される。

本実施形態によれば、図６に示すように、現在地に依存した項（近いから行く）と、動作主に依存した項（興味があるから行く）とを考慮して、動作主の行動を予測することができる。

[第１の実施の形態]
＜第１の実施の形態に係る予測装置の構成＞
次に、本発明の第１の実施の形態に係る予測装置の構成について説明する。図７に示すように、本発明の実施の形態に係る予測装置１００は、ＣＰＵと、ＲＡＭと、後述する各処理ルーチンを実行するためのプログラムや各種データを記憶したＲＯＭと、を含むコンピュータで構成することが出来る。この予測装置１００は、機能的には図７に示すように、操作部１０と、演算部２０と、移動履歴情報格納部２２と、ランドマーク情報格納部２４と、出力部４０とを備えている。操作部１０及び演算部２０は、移動履歴情報格納部２２及びランドマーク情報格納部２４と接続されている。

操作部１０は、後述する移動履歴情報格納部２２及びランドマーク情報格納部２４に格納されているデータに対する操作者からの各種操作を受け付ける。各種操作とは、移動履歴情報格納部２２及びランドマーク情報格納部２４に格納された情報を登録、修正、削除する操作等である。また、操作部１０は、移動履歴情報格納部２２及びランドマーク情報格納部２４に記憶された情報を操作者に提示することも可能である。

また、操作部１０は、ユーザによって入力された特定の動作主ｕに関する情報を受け付ける。特定の動作主は、予測対象となる動作主を表す。

動作主ｕに関する情報とは、移動履歴情報格納部２２に格納されている動作主を一意に識別するＩＤなどである。

また、操作部１０は、ユーザによって指定された潜在トピック数Ｚを受け付ける。潜在トピック数Ｚは、後述するパラメータ推定部２６で用いられる変数である。

操作部１０及び後述する出力部４０の構成例を図８に示す。図８は、操作部１０でランドマークのみの問い合わせを行う場合であり、ランドマークとランドマークを訪問する確率を表す選択確率との組み合わせが出力部４０により出力され、例えば、選択確率の降順でソートして提示される。

本実施の形態では、予測装置１００は、操作部１０により指定された特定の動作主に関する予測を行う。第１の実施の形態では、操作部１０により、指定された動作主が将来的に訪れる可能性が高いランドマークの問い合わせが行われ、ランドマークとそのランドマークを訪問する確率値の組み合わせを要求することができる。

操作部１０の入力手段は、キーボードやマウスやメニュー画面やタッチパネルによるもの等、何でもよい。操作部１０は、マウス等の入力手段のデバイスドライバや、メニュー画面の制御ソフトウェアで実現され得る。

移動履歴情報格納部２２には、複数の動作主の各々についての、当該動作主が訪問したランドマークを表す移動履歴情報が格納されている。

移動履歴情報格納部２２には、予測装置の演算部２０によって解析され得る移動履歴情報が格納されており、演算部２０からの要求に従って、移動履歴情報を読み出し、当該移動履歴情報を演算部２０に送信する。

ここで、解析され得る動作主の集合をＵ、ランドマークの集合をＩと表す。ある動作主ｕ∈Ｕがｍ番目に訪れたランドマークをｘ_ｕｍ∈Ｉとすると、動作主ｕの移動履歴情報はｘ_ｕ＝｛ｘ_ｕ１，…，ｘ_ｕＭｕ｝と表される。なお、Ｍ_ｕは動作主が過去に訪れたランドマークの数である。

図９に、本発明の実施の形態における移動履歴情報格納部２２に格納される移動履歴情報の一例を示す。

例えば、図９に格納された情報から、動作主ＩＤがＵ１とＵ２の動作主の移動履歴情報は以下のように表される。

ｘ_ｕ１＝｛ｉ_３，ｉ_２，ｉ_１０，ｉ_５，ｉ_１｝
ｘ_ｕ２＝｛ｉ_２，ｉ_３，ｉ_１｝

移動履歴情報格納部２２は、例えば、Ｗｅｂページを保持するＷｅｂサーバや、データベースを具備するデータベースサーバ等である。

ランドマーク情報格納部２４には、ランドマークに関する情報であるランドマーク情報が格納されている。

ランドマーク情報格納部２４には、予測装置の演算部２０によって解析され得るランドマーク情報が格納されており、演算部２０からの要求に従って、ランドマーク情報を読み出し、当該ランドマーク情報を演算部２０に送信する。各ランドマーク情報は、たとえば、ランドマークを一意に識別するためのＩＤ、ランドマークの名称、位置座標（緯度・経度）を含む情報である。

図１０に、本発明の実施の形態におけるランドマーク情報格納部２４に格納されているランドマーク情報の一例を示す。

ランドマーク情報格納部２４は、例えば、Ｗｅｂページを保持するＷｅｂサーバや、データベースを具備するデータベースサーバ等である。

演算部２０は、パラメータ推定部２６、推定パラメータ格納部２８、及び算出部３０を備えている。

説明の簡略化のため、演算部２０のパラメータ推定部２６及び推定パラメータ格納部２８の説明の前に、算出部３０について説明する。

算出部３０は、操作部１０により入力された特定の動作主ｕに関する情報と、移動履歴情報格納部２２に格納された特定の動作主ｕが現在の時間ｔに訪問しているランドマークと、推定パラメータ格納部２８に格納されたパラメータΨ（例えば、後述する、Θ、Φ、及びΛ）とに基づいて、特定の動作主ｕが時間ｔ＋１に訪問するランドマークの選択確率を、特定の動作主ｕが、それぞれのランドマークｉを将来的に訪れる確率値として算出する。算出部３０は、操作部１０により特定の動作主についての問い合わせがあった場合に呼び出される手段である。

ここで、算出部３０によって算出される、動作主ｕがそれぞれのランドマークｉを将来的に訪れる確率値のモデルについて説明する。

本実施の形態において、動作主の行動を予測するモデルは、複数の動作主の各々について、“動作主ｕの興味に対応する潜在トピックｚが当該動作主ｕに固有の潜在トピック比率に応じて選択され、選択された潜在トピックｚに固有のランドマークの確率分布と、動作主ｕが時間ｔに訪問しているランドマークｉ_ｔに固有のランドマークの確率分布とに従って、動作主ｕが時間ｔ＋１に訪問するランドマークｉ_ｔ＋１が生成される”という仮定に基づくモデルである。

つまり、本実施の形態では、潜在トピック数Ｚが与えられたもとで、時間ｔにランドマークｉ_ｔにいる動作主ｕが時間ｔ＋１にランドマークｉ_ｔ＋１に存在する確率Ｐ（ｉ_ｔ＋１｜ｕ，ｉ_ｔ）を以下の式（１）に従って計算する。

ここで、潜在トピックｚは「スポーツ」、「アート」などのランドマークの特徴を表現するために用意された潜在変数である。Ｐ（ｚ｜ｕ）＝θ_ｕｚは、動作主に固有な興味を表し、動作主ｕが潜在トピックｚに興味を持つ確率を表す。

また、Ｐ（ｉ_ｔ＋１｜ｚ，ｉ_ｔ）は、潜在トピックｚにおいてランドマークｉが選択される確率Ｐ（ｉ｜ｚ）＝φ_ｚｉと、時間ｔにおいて選択されたランドマークｉ_ｔからのアクセスしやすさＰ（ｉ_ｔ＋１｜ｉ_ｔ）とから導かれたランドマークの選択確率である。

例えば、Ｐ（ｉ_ｔ＋１｜ｚ，ｉ_ｔ）は、以下の式（２）に従って計算される。

Ｃは正規化項であり、以下の式（３）で計算することができる。

上記式におけるＰ（ｉ｜ｚ）＝φ_ｚｉは、潜在トピックｚにおけるトレンドを示しており、例えば、潜在トピックｚが「アート」に関連するランドマーク群をグループ化する変数として推定された場合は、「東京▽▼美術館」や「京都●○美術館」などのアートに関連するランドマークの出現確率が高くなる、つまり、潜在トピックｚから選ばれやすくなる。

なお、潜在トピックｚは典型的には「スポーツ」や「アート」などのランドマークの特徴を表すために用意された変数であるが、移動履歴情報格納部２２に格納された移動履歴情報に応じて、後述するパラメータ推定部２６によって自動的に決定されるため、ユーザは当該変数が実際にどのようなトピックを表すかを指定する必要はない。

また、時間ｔにおいて選択されたランドマークｉ_ｔからのアクセスされやすさＰ（ｉ_ｔ＋１｜ｉ_ｔ）は、以下の式（４）で計算することができる。

ここで、

は、時間ｔにおいてランドマークｉ_ｔが選択された場合、次の時間ｔ＋１にランドマークｉ_ｔ＋１が選択される確率である。この確率は、ランドマークｉ_ｔとランドマークｉ_ｔ＋１とが物理的に近くに存在する場合や、アクセスが容易である場合に高い値を持つ。

例えば、ランドマークｉ_ｔが東京駅だった場合、Ｐ（ｉ_ｔ＋１＝”品川駅”|ｉ_ｔ＝”東京駅”）の方が、Ｐ（ｉ_ｔ＋１＝”京都駅”｜ｉ_ｔ＝”東京駅”）より高い値を持つ。ただし、各動作主が最初に選択するランドマーク（ｔ＝１の場合）に関しては、一つ前に訪れたランドマークが存在しない（未観測である状態）ため、上記式（４）の影響は無視し、例えばＰ（ｉ_ｔ＋１｜ｉ_ｔ）＝１と設定する。

パラメータ推定部２６は、操作部１０により入力された潜在トピック数Ｚと、移動履歴情報格納部２２に格納された移動履歴情報とに基づいて、上記した算出部３０で用いるパラメータΨとして、複数の動作主の各々に対する、複数の潜在トピックの各々を動作主が選択する確率を表す動作主固有潜在トピック出現確率と、複数の潜在トピックの各々に対する、潜在トピックにおける複数のランドマークの各々の選択されやすさを表す潜在トピック固有ランドマーク出現確率と、複数のランドマークの各々に対する、ランドマークから複数のランドマークの各々への移動しやすさを表すランドマーク間遷移確率とを推定する。

ここで、全動作主数をＮ、全ランドマーク数をＩ、動作主ｕが潜在トピックｚを選択する確率を表す動作主固有潜在トピック出現確率をθ_ｕｚ、動作主ｕの潜在トピック分布をθ_ｕ＝｛θ_ｕｚ｝、潜在トピックｚからランドマークｉが選択される確率を表す潜在トピック固有ランドマーク出現確率をφ_ｚｉ、潜在トピックｚに固有のランドマークの確率分布をφ_ｚ＝｛φ_ｚｉ｝、ランドマークｉの後にランドマークｊが選択される確率を表すランドマーク間遷移確率をλ_ｉｊ、ランドマークｉに固有のランドマーク分布をλ_ｉ＝｛λ_ｉｊ｝と表すこととする。パラメータ推定部２６が推定するパラメータは、Θ＝｛θ_ｕ｝，Φ＝｛φ_ｚ｝，Λ＝｛λ_ｉ｝である。

移動履歴情報格納部２２に格納されている移動履歴情報をＸ＝｛ｘ_ｕ｝、パラメータをΨ＝｛Θ，Φ，Λ｝と表すと、以下の式（５）に示す対数尤度を最大化することにより、パラメータを推定する。

上記式（２）、上記式（４）を、上記式（５）の表記に基づいて書き直すと、それぞれ以下の式（６）、（７）のように表される。

本実施の形態では、パラメータ推定部２６は、上記式（５）の対数尤度関数を最大化するパラメータΨを逐次反復的に見つけていく。この最大化問題は、ＥＭアルゴリズムにより、以下の式（８）に示すＱ関数を最大化する問題に置き換えて解くことができる。

ＥＭアルゴリズムでは、最初にパラメータに適当な初期値を与える。次に、パラメータが収束するまで以下のＥ−ｓｔｅｐとＭ−ｓｔｅｐを繰り返す。

Ｅ−ｓｔｅｐにおいて、パラメータ推定部２６は、以下の式（９）に示すベイズ則に従って、パラメータの現在の推定値Ψ＾が与えられたもとでのトピック事後確率Ｐ（ｚ｜ｕ，ｍ；Ψ＾）を計算する。

Ｍ−ｓｔｅｐでは、パラメータ推定部２６は、トピック事後確率Ｐ（ｚ｜ｕ，ｍ；Ψ＾）に基づいて、上記式（８）に示すＱ関数を最大化する、新たなパラメータの値を求める。例えば、θ_ｕｚに関しては、

を解き、以下の式（１０）に従って、Ｑ関数をθ_ｕｚに関して最大化することで、θ_ｕｚを求めることができる。

また、記号「＾」が付与されているのはパラメータの次の推定値であることを示しており、記号「＾」が付与されていないのはパラメータの現在の推定値を示している。

また、φ_ｚｉとλ_ｉｊに関しては、閉形式で直接求めることができないため、準ニュートン法などの最適化手法を用いて求める。準ニュートン法で用いる勾配ベクトルはそれぞれ、以下の式（１１）、（１２）である。

パラメータ推定部２６は、ＥステップとＭステップとをパラメータが収束するまで繰り返すことで、上記式（５）で示した尤度関数を最大化するパラメータΨを得ることができる。

推定パラメータ格納部２８には、パラメータ推定部２６によって推定されたパラメータΨであるΘ、Φ、及びΛが格納される。

推定パラメータ格納部２８には、潜在トピック数Ｚとパラメータ推定部２６で推定したパラメータΨが格納される。推定パラメータ格納部２８には、これらの情報が保存され、保存された情報が復元可能なものであればなんでもよい。例えば、データベースや、予め備えられた汎用的な記憶装置（メモリやハードディスク装置）の特定領域に記憶される。

出力部４０は、算出部３０によって算出された、特定の動作主が時間ｔ＋１に訪問するランドマークの選択確率を結果として出力する。

具体的には、出力部４０は、操作部１０により指定される特定の動作主が将来的に訪れる可能性が高いランドマークの問い合わせがあった場合、算出部３０の結果に基づいてランドマークと当該ランドマークを訪問する確率値の組み合わせを出力する。

ここで、出力部３０における出力とは、ディスプレイへの表示、プリンタへの印字、音出力、外部装置への送信等を含む概念である。出力部３０は、ディスプレイやスピーカ等の出力デバイスを含むと考えても含まないと考えてもよい。出力部３０は、出力デバイスのドライバソフトまたは、出力デバイスのドライバソフトと出力デバイス等で実現され得る。

＜第１の実施の形態に係る予測装置の作用＞
次に、本発明の実施の形態に係る予測装置１００の作用について説明する。本実施の形態では、特定の動作主の行動の予測を行う前に、パラメータの推定を実行する必要がある。そのため、予測装置１００は、パラメータ推定処理を行った後に、特定の動作主の行動の予測処理を行う。

＜パラメータ推定処理ルーチン＞
予測装置１００は、移動履歴情報が入力されると、移動履歴情報格納部２２に格納する。また、ランドマーク情報が入力されると、予測装置１００は、ランドマーク情報格納部２４に格納する。そして、予測装置１００は、潜在トピック数Ｚが操作部１０により入力されると、図１１に示すパラメータ推定処理ルーチンを実行する。

まず、ステップＳ１００において、パラメータ推定部２６は、移動履歴情報格納部２２に格納された移動履歴情報を取得する。また、パラメータ推定部２６は、操作部１０によって受け付けた潜在トピック数Ｚを取得する。

次に、ステップＳ１０２において、パラメータ推定部２６は、パラメータΨの初期値を設定する。

ステップＳ１０４において、パラメータ推定部２６は、Ｅ−ｓｔｅｐとして、上記ステップＳ１００で取得した移動履歴情報及び潜在トピック数Ｚと、上記ステップＳ１０２で設定されたパラメータΨの初期値又は前回のステップＳ１０６で推定されたパラメータΨ＾とに基づいて、上記式（９）に従って、トピック事後確率Ｐ（ｚ｜ｕ，ｍ；Ψ＾）を計算する。

ステップＳ１０６において、パラメータ推定部２６は、Ｍ−ｓｔｅｐとして、上記ステップＳ１００で取得した移動履歴情報及び潜在トピック数Ｚと、上記ステップＳ１０４で計算されたトピック事後確率Ｐ（ｚ｜ｕ，ｍ；Ψ＾）とに基づいて、上記式（１０）、（１１）、（１２）に従って、上記式（８）に示すＱ関数を最大化する、新たなパラメータΨを推定する。

ステップＳ１０８において、パラメータ推定部２６は、パラメータΨの値が収束したか否かを判定する。パラメータΨの値が収束したと判定した場合には、ステップＳ１１０へ進む。一方、パラメータΨの値が収束していないと判定した場合には、ステップＳ１０４へ戻る。

ステップＳ１１０において、パラメータ推定部２６は、上記ステップＳ１０６で推定されたパラメータΨであるΘ、Φ、及びΛと、上記ステップＳ１００で取得した潜在トピック数Ｚとを、推定パラメータ格納部２８に格納して、パラメータ推定処理ルーチンを終了する。

＜予測処理ルーチン＞
次に、特定の動作主に関する情報が、操作部１０によりユーザによって入力されると、予測装置１００は、図１２に示す予測処理ルーチンを実行する。

まず、ステップＳ２００において、算出部３０は、操作部１０により入力された特定の動作主ｕに関する情報を取得する。

ステップＳ２０２において、算出部３０は、移動履歴情報格納部２２に格納されている、上記ステップＳ２００で取得した特定の動作主ｕが現在の時間ｔに訪問しているランドマークの情報を取得する。また、算出部３０は、推定パラメータ格納部２８に格納されたパラメータΨと潜在トピック数Ｚとを取得する。

ステップＳ２０４において、算出部３０は、１つのランドマークを設定する。

ステップＳ２０６において、算出部３０は、時間ｔにランドマークｉ_ｔにいる動作主ｕが時間ｔ＋１にランドマークｉ_ｔ＋１に存在する確率Ｐ（ｉ_ｔ＋１｜ｕ，ｉ_ｔ）に０を代入する。

ステップＳ２０８において、算出部３０は、一時変数ｚに１を代入し、初期化する。

ステップＳ２１０において、算出部３０は、上記ステップＳ２０８で初期化された一時変数ｚ又は前回のステップＳ２１４で更新された一時変数ｚが、上記ステップＳ２０２で取得された潜在トピック数Ｚ以下であるか否かを判定する。一時変数ｚが潜在トピック数Ｚ以下である場合には、ステップＳ２１２へ進む。一方、一時変数ｚが潜在トピック数Ｚより大きい場合には、ステップＳ２１６へ進む。

ステップＳ２１２において、上記式（１）を計算するため、算出部３０は、上記ステップＳ２０６で初期化された確率Ｐ（ｉ_ｔ＋１｜ｕ，ｉ_ｔ）又は前回の本ステップＳ２１２で更新された確率Ｐ（ｉ_ｔ＋１｜ｕ，ｉ_ｔ）と、上記ステップＳ２０２で取得したパラメータΨのうちΘから得られる確率Ｐ（ｚ｜ｕ）と、パラメータΨのうちΦ及びΛから上記式（２）〜（４）に従い算出される確率Ｐ（ｉ_ｔ＋１｜ｚ，ｉ_ｔ）とに基づいて、以下の算出式に従って、確率Ｐ（ｉ_ｔ＋１｜ｕ，ｉ_ｔ）を更新する。

ステップＳ２１４において、算出部３０は、一時変数ｚを１インクリメントし、ステップＳ２１０へ戻る。

ステップＳ２１６において、算出部３０は、予測対象の全てのランドマークについて、上記ステップＳ２０４〜ステップＳ２１４の処理を実行したか否かを判定する。全てのランドマークについて、上記ステップＳ２０４〜ステップＳ２１４の処理を実行したと判定した場合には、ステップＳ２１８へ進む。一方、上記ステップＳ２０４〜ステップＳ２１４の処理を実行していないランドマークが存在する場合には、ステップＳ２０４へ戻る。

ステップＳ２１８において、出力部４０は、上記ステップＳ２１２で算出された、特定の動作主ｕが時間ｔ＋１に訪問する各ランドマークの選択確率Ｐ（ｉ_ｔ＋１｜ｕ，ｉ_ｔ）を結果として出力し、予測処理ルーチンを終了する。

図１３に、第１の実施の形態の予測装置１００の基本的な動作の一例を示す。図１３では、動作主ｕが過去にランドマークａ，ｂ，ｃを訪問し、現在、ランドマークｃに存在しているとする。また、潜在トピック数Ｚは３であるとし、パラメータ推定部２６の推定結果から、それぞれの潜在トピックに含まれやすいランドマークをそれぞれ丸、四角、三角で示してある。

厳密には、予測装置１００により、潜在トピック固有のランドマーク出現確率を算出できるため、各ランドマークは複数の潜在トピックから同程度に支持される可能性もあるが、説明の簡略化のため、各ランドマークはいずれかの潜在トピックに含まれるとして説明を進める。

また、図１３中の矢印に付与された値はλ_ｊｉである。例えば、λ_ｃｄ＝０．１である。予測装置１００は、上記式（１）〜式（４）により、動作主ｕが現在いる（最後に訪問した）ランドマークから近いランドマークほど高いスコアを与える。つまり、λの高いランドマークを優先する。さらに、動作主が支持する潜在トピックに含まれるランドマークほどスコアが高くなる。

ここで、対象となる動作主は四角形で示される潜在トピックに優先的に訪問する傾向があるため、四角形に含まれるランドマークほどスコアが高くなる。上記図１３の例では、ランドマークｄ，ｅ，ｆの中では、ｅが最もスコアが高くなる。ランドマークｈ，ｇの中では、ｈが最もスコアが高くなる。ランドマークｅは、λの値も大きく、かつ、潜在トピックに合致するため、ランドマークｄ，ｅ，ｆ，ｈ，ｇの中で最もスコアが高くなる。ランドマークｄ，ｆは潜在トピックには該当しないがλが大きいため、ランドマークｈはλは小さいが潜在トピックに該当するため、同程度のスコアを持つことになる。

このように、本実施の形態に係る予測装置１００は、現在地からのアクセスしやすさに加え、動作主が訪問しやすいランドマークの種類（潜在トピック）を加味して高精度に次に訪れるランドマークを予測することができる。

以上説明したように、第１の実施の形態に係る予測装置によれば、動作主の興味に対応する潜在トピックが該動作主に固有の潜在トピック比率に応じて選択され、選択された潜在トピックに固有のランドマークの確率分布と、当該動作主が時間ｔに訪問しているランドマークに固有のランドマークの確率分布とに従って、動作主が時間ｔ＋１に訪問するランドマークが生成されることを表すモデルのパラメータを推定することにより、動作主の行動を精度よく予測するためのパラメータを得ることができる。

また、特定の動作主に関する情報と、特定の動作主が時間ｔに訪問しているランドマークと、推定されたパラメータとに基づいて、特定の動作主が時間ｔ＋１に訪問するランドマークの選択確率を算出することにより、動作主の行動を精度よく予測することができる。

また、“動作主が訪れるランドマークは、動作主固有のトピック比率に従ってある潜在トピックを選択した後、その潜在トピックと動作主が最後に訪れたランドマークからのアクセスしやすさとを加味して決定した”という実態にあった仮定に基づく行動モデルを学習することで、“近いから訪れる”と“興味があるからわざわざ訪れる”の影響成分を分離することができる。これにより、“現在地から近いから訪れた”と“興味があるため訪れた”が混在して観測されるような場合でも高精度に次に訪れるランドマークを予測することができる。

[第２の実施の形態]
次に、本発明の第２の実施の形態について説明する。なお、第２の実施の形態に係る予測装置の構成は、第１の実施の形態と同様の構成となるため、同一符号を付して説明を省略する。

第２の実施の形態では、特定の動作主が時間ｔ＋１に訪問するランドマークの選択確率と当該ランドマークでの滞在時間との組み合わせが起こる確率を算出する点が、第１の実施の形態と異なっている。

第２の実施の形態では、図１４に示すように、動作主ｕ∈Ｕの移動履歴と滞在時間履歴とから、動作主ｕが次に訪問するランドマークとその滞在時間を予測する。学習データとしては、全動作主Ｕの移動履歴と滞在時間履歴とを用いる。

第２の実施の形態では、図１５に示すように、興味ｚに分類される人々は場所の選び方だけでなく、滞在時間の傾向も近いことを利用して、パラメータを推定する。

第２の実施の形態の予測装置に係る操作部１０は、第１の実施の形態と同様に、特定の動作主に関する情報と、潜在トピック数Ｚとを受け付ける。

図１６に、第２の実施の形態に係る操作部１０及び出力部４０の構成例を示す。図１６は、操作部１０でランドマークと滞在時間との組み合わせの問い合わせを行う場合であり、ランドマークと滞在時間の組み合わせと、当該組み合わせが起こる確率値が出力部４０により出力される。

第２の実施の形態の予測装置に係る移動履歴情報格納部２２には、動作主が訪問したランドマークでの滞在時間に関する情報を含む移動履歴情報が格納されている。

図１７に、第２の実施の形態における移動履歴情報格納部２２に格納されている移動履歴情報の一例を示す。移動履歴情報格納部２２には、それぞれのランドマークにどれくらいの時間、滞在したかの情報も格納されている。ｕがｍ番目に訪れたランドマークｘ_ｕｍの滞在時間をｓ_ｕｍとすると、ｕの滞在時間履歴情報はｓ_ｕ＝｛ｓ_ｕ１，…，ｓ_ｕＭｕ｝となる。

図１７に示すように、移動履歴情報に、滞在時間履歴情報が含まれている。例えば、滞在時間履歴情報は以下のようになる。

ｓ_ｕ１＝｛３０００，６００，３００，１８００，６０｝
ｓ_ｕ２＝｛６０００，１８００，６０｝

第２の実施の形態の予測装置に係る算出部３０は、操作部１０により入力された特定の動作主ｕに関する情報と、移動履歴情報格納部２２に格納された特定の動作主ｕが現在の時間ｔに訪問しているランドマーク及び滞在時間と、推定パラメータ格納部２８に格納されたパラメータΨ（後述するΘ、Φ、Λ、及びΩ）とに基づいて、特定の動作主ｕが時間ｔ＋１に訪問するランドマークと当該ランドマークでの滞在時間との組み合わせが起こる確率を算出する。

第２の実施の形態において、動作主の行動を予測するモデルは、複数の動作主の各々について、“動作主ｕの興味に対応する潜在トピックｚが当該動作主ｕに固有の潜在トピック比率に応じて選択され、選択された潜在トピックｚに固有のランドマークの確率分布と、動作主ｕが時間ｔに訪問しているランドマークｉ_ｔに固有のランドマークの確率分布とに従って、動作主ｕが時間ｔ＋１に訪問するランドマークｉ_ｔ＋１が生成されることを表し、かつ、選択された潜在トピックと、動作主が時間ｔ＋１に訪問するランドマークとの組み合わせに固有の滞在時間の確率分布とに従って、動作主が時間ｔ＋１に訪問するランドマークの滞在時間が生成される”という仮定に基づくモデルである。

具体的には、算出部３０は、時間ｔにランドマークｉ_ｔにいる動作主ｕが時間ｔ＋１で訪れるランドマークの候補の各々に対し、当該ランドマークｉ_ｔ＋１と、当該ランドマークｉ_ｔ＋１での各滞在時間ｓ_ｔ＋１との組み合わせの各々について、当該組み合わせが起こる確率Ｐ（ｉ_ｔ＋１，ｓ_ｔ＋１｜ｕ，ｉ_ｔ）を、以下の式（１３）に従って計算する。算出部３０は、操作部１０により特定の動作主について、ランドマークと滞在時間との組み合わせに対する問い合わせがあった場合に呼び出される手段である。

上記式（１）と同様に、Ｐ（ｚ｜ｕ）、Ｐ（ｉ_ｔ＋１｜ｚ，ｉ_ｔ）については、上記式（２）〜上記式（４）に従って計算する。また、ある潜在トピックｚに属する動作主が、もし、ランドマークｉ_ｔ＋１を訪れる場合の滞在時間ｓ_ｔ＋１は以下の式（１４）に示すガンマ分布に基づく式で計算する。

ここで、αとβとは、それぞれガンマ分布のパラメータである。上記式（１３）により、行き先と滞在時間との両方を予測することができる。一般的に滞在時間は動作主の興味の程度を反映しているため、滞在時間の長くなるであろう（動作主が強く興味を持つであろう）ランドマークに絞り込んだ予測をすることができる。

第２の実施の形態の予測装置に係るパラメータ推定部２６は、操作部１０により入力された潜在トピック数Ｚと、移動履歴情報格納部２２に格納された移動履歴情報とに基づいて、上記した算出部３０で用いるパラメータΨとして、複数の動作主の各々に対する、複数の潜在トピックの各々を動作主が選択する確率を表す動作主固有潜在トピック出現確率と、複数の潜在トピックの各々に対する、潜在トピックにおける複数のランドマークの各々の選択されやすさを表す潜在トピック固有ランドマーク出現確率と、複数のランドマークの各々に対する、ランドマークから複数のランドマークの各々への移動しやすさを表すランドマーク間遷移確率と、潜在トピックとランドマークとの組み合わせの各々に対する、当該潜在トピックにおいて、動作主が時間ｔ＋１に訪問する当該ランドマークの滞在時間の確率分布のパラメータとを推定する。

第１の実施の形態と同様に、全動作主数をＮ、全ランドマーク数をＩ、動作主ｕが潜在トピックｚを選択する確率を表す動作主固有潜在トピック出現確率をθ_ｕｚ、動作主ｕの潜在トピック分布をθ_ｕ＝｛θ_ｕｚ｝、潜在トピックｚからランドマークｉが選択される確率を表す潜在トピック固有ランドマーク出現確率をφ_ｚｉ、潜在トピックｚのランドマーク分布をφ_ｚ＝｛φ_ｚｉ｝、ランドマークｉの後にランドマークｊが選択される確率を表すランドマーク間遷移確率をλ_ｉｊ，ランドマークｉに固有のランドマーク分布をλ_ｉ＝｛λ_ｉｊ｝と表し、また、潜在トピックｚとランドマークｉが与えられたときのランドマークの滞在時間の確率分布のパラメータ（ガンマ分布のパラメータ）をα_ｚｉとβ_ｚｉ、潜在トピックｚのパラメータをα_ｚ＝｛α_ｚｉ｝とβ_ｚ＝｛β_ｚｉ｝と表すこととする。従って、第２の実施の形態に係るパラメータ推定部２６が推定するパラメータは、Θ＝｛θ_ｕ｝，Φ＝｛φ_ｚ｝，Λ＝｛λ_ｉ｝，Ω＝｛α_ｚ，β_ｚ｝である。

移動履歴情報格納部２２に格納されている移動履歴情報をＸ＝｛ｘ_ｕ，ｓ_ｕ｝、パラメータをΨ＝｛Θ，Φ，Λ，Ω｝と表すと、以下の式（１５）に示す対数尤度を最大化することにより、パラメータを推定する。

ここで、動作主ｕがｍ番目に訪れたランドマークがｘ_ｕｍ、その滞在時間がｓ_ｕｍである。また、上記式（１４）を上記式（１５）の表記に基づいて書き直すと以下のようになる。

第２の実施の形態では、パラメータ推定部２６は、上記式（１５）の対数尤度関数を最大化するパラメータΨを逐次反復的に見つけていく。この最大化問題は、ＥＭアルゴリズムにより、以下の式（１６）に示すＱ関数を最大化する問題に置き換えて解くことができる。

Ｅ−ｓｔｅｐにおいて、パラメータ推定部２６は、以下の式（１７）に示すベイズ則に従って、パラメータの現在の推定値Ψ＾が与えられたもとでのトピック事後確率を計算する。

Ｍ−ｓｔｅｐでは、パラメータ推定部２６は、第１の実施の形態と同様に、上記式（１６）に示すＱ関数を最大化する、新たなパラメータθ_ｕｚ，φ_ｚｉ，λ_ｉｊの値を求める。

また、パラメータ推定部２６は、Ｍ−ｓｔｅｐの中で以下に示す式（１８）、（１９）に従って、パラメータαとβとを更新する。

ここで、

である。

第２の実施の形態の予測装置に係る出力部４０は、算出部３０によって算出された、特定の動作主が時間ｔ＋１に訪問するランドマークと当該ランドマークでの滞在時間との組み合わせが起こる確率を結果として出力する。

具体的には、出力部４０は、操作部１０により指定される特定の動作主が将来的に訪れるランドマークと滞在時間の組み合わせに対する問い合わせがあった場合、算出部３０の結果に基づいてランドマークと滞在時間との組み合わせと、当該組み合わせが起こる確率値を出力する。また、滞在時間に対する問い合わせである場合には、滞在時間とそれが起こる確率値を出力する。例えば、出力部４０は、ランドマークと滞在時間との組み合わせと当該組み合わせが起こる確率値を、確率値の降順でソートして出力する。

＜第２の実施の形態に係る予測装置の作用＞
次に、第２の実施の形態に係る予測装置１００の作用について説明する。第１の実施の形態と同様に、予測装置１００は、パラメータ推定処理を行った後に、特定の動作主の行動の予測処理を行う。

まず、上記図１１に示すパラメータ推定処理ルーチンが実行され、パラメータΨ＝｛Θ，Φ，Λ，Ω｝が推定パラメータ格納部２８に格納される。

＜予測処理ルーチン＞
次に、特定の動作主ｕに関する情報が、操作部１０によりユーザによって入力されると、予測装置１００は、図１８に示す予測処理ルーチンを実行する。

ステップＳ３０６において、算出部３０は、時間ｔにランドマークｉ_ｔにいる動作主ｕが時間ｔ＋１にランドマークｉ_ｔ＋１に各時間ｓ_ｔ＋１滞在する確率Ｐ（ｉ_ｔ＋１，ｓ_ｔ＋１｜ｕ，ｉ_ｔ）に０を代入する。

ステップＳ３１２において、上記式（１３）を計算するため、算出部３０は、各時間ｓ_ｔ＋１について、上記ステップＳ３０６で初期化された確率Ｐ（ｉ_ｔ＋１，ｓ_ｔ＋１｜ｕ，ｉ_ｔ）又は前回の本ステップＳ２１２で更新された確率Ｐ（ｉ_ｔ＋１，ｓ_ｔ＋１｜ｕ，ｉ_ｔ）と、上記ステップＳ２０２で取得したパラメータΨのうちΘから得られる確率Ｐ（ｚ｜ｕ）と、パラメータΨのうちΦ及びΛから上記式（２）〜（４）に従い算出される確率Ｐ（ｉ_ｔ＋１｜ｚ，ｉ_ｔ）と、パラメータΨのうちα及びβから上記式（１４）に従い算出される確率Ｐ（ｓ_ｔ＋１｜ｚ，ｉ_ｔ＋１）とに基づいて、以下の算出式に従って、確率Ｐ（ｉ_ｔ＋１，ｓ_ｔ＋１｜ｕ，ｉ_ｔ）を更新する。

ステップＳ３１８において、出力部４０は、上記ステップＳ３１２で算出された、特定の動作主ｕが時間ｔ＋１に訪問する各ランドマークと当該ランドマークでの各滞在時間との組み合わせが起こる確率Ｐ（ｉ_ｔ＋１，ｓ_ｔ＋１｜ｕ，ｉ_ｔ）を結果として出力し、予測処理ルーチンを終了する。

なお、第２の実施の形態に係る予測装置の他の構成及び作用については、第１の実施の形態と同様であるため、説明を省略する。

以上説明したように、第２の実施の形態に係る予測装置によれば、動作主の興味に対応する潜在トピックが該動作主に固有の潜在トピック比率に応じて選択され、選択された潜在トピックに固有のランドマークの確率分布と、当該動作主が時間ｔに訪問しているランドマークに固有のランドマークの確率分布とに従って、動作主が時間ｔ＋１に訪問するランドマークが生成され、かつ、選択された潜在トピックと、動作主が時間ｔ＋１に訪問するランドマークとの組み合わせに固有の滞在時間の確率分布とに従って、動作主が時間ｔ＋１に訪問するランドマークの滞在時間が生成されることを表すモデルのパラメータを推定することにより、ランドマークでの滞在時間を含む動作主の行動を精度よく予測するためのパラメータを得ることができる。

また、特定の動作主に関する情報と、特定の動作主が時間ｔに訪問しているランドマークと、推定されたパラメータとに基づいて、特定の動作主が時間ｔ＋１に訪問するランドマークの選択確率と、当該ランドマークでの滞在時間とを算出することにより、ランドマークでの滞在時間を含む動作主の行動を精度よく予測することができる。

また、動作主の興味を反映した潜在トピックに固有な滞在時間の傾向を推定することで、高精度に滞在時間を予測することもできる。

[第３の実施の形態]
次に、本発明の第３の実施の形態について説明する。なお、第３の実施の形態に係る予測装置の構成は、第１の実施の形態と同様の構成となるため、同一符号を付して説明を省略する。

第３の実施の形態では、ランドマークから複数のランドマークの各々への移動しやすさとして、ランドマーク間の距離を用いる点が、第１又は第２の実施の形態と異なっている。

第３の実施の形態に係る予測装置１００のパラメータ推定部２６は、ランドマーク情報格納部２４に格納された、各ランドマーク間の空間的な距離を補助情報として用い、空間的な距離を反映するようにλ_ｉｊを推定する。その場合、上記式（８）又は上記式（１６）のＱ関数に、以下の式（２０）に示す項を加算した値を最適化することで、空間的な距離を反映するようにλ_ｉｊを推定することができる。

ここで、ｒ_ｉｊはランドマークｊとｉとの空間的な距離を表し、ランドマーク情報格納部２４に格納された情報に基づき計算される。ランドマークｊとｉとの空間的な距離が近いほど、λ_ｉｊは大きな値として推定される。なお，γはユーザによって指定されるパラメータであり、実際の距離をどの程度、パラメータλ_ｉｊに強く反映させるかをコントロールするためのものである。上記式（２０）で示した項をＱ関数に含める場合、上記式（１２）で示した準ニュートン法で用いる勾配ベクトルは、以下の式（２１）に示すようになる。

なお、第３の実施の形態に係る予測装置の他の構成及び作用については、第１の実施の形態と同様であるため、説明を省略する。

以上説明したように、第３の実施の形態に係る予測装置によれば、ランドマーク間の距離を考慮してパラメータを推定することにより、ランドマーク間の距離に応じた動作主の行動を精度よく予測するためのパラメータを得ることができる。

また、推定されたパラメータに基づいて、特定の動作主が時間ｔ＋１に訪問するランドマークの選択確率を算出することにより、ランドマーク間の距離に応じた動作主の行動を精度よく予測することができる。

なお、本発明は、上述した実施形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。

例えば、上記実施の形態においては、予測装置１００によって、パラメータを推定し、特定の動作主の行動を予測する場合を例に説明したが、これに限定されるものではなく、予測装置１００とは別の装置（例えば、パラメータ推定装置）によって、パラメータを推定するようにしてもよい。この場合には、パラメータ推定装置は、操作部１０、移動履歴情報格納部２２、ランドマーク情報格納部２４、パラメータ推定部２６、及び推定パラメータ格納部２８を備えるようにすればよい。

また、移動履歴情報格納部２２、ランドマーク情報格納部２４、及び推定パラメータ格納部２８の少なくとも１つは、外部に設けられ、予測装置１００とネットワークで接続されていてもよい。

また、上述の予測装置１００は、内部にコンピュータシステムを有しているが、「コンピュータシステム」は、ＷＷＷシステムを利用している場合であれば、ホームページ提供環境（あるいは表示環境）も含むものとする。

また、本願明細書中において、プログラムが予めインストールされている実施形態として説明したが、当該プログラムを、コンピュータ読み取り可能な記録媒体に格納して提供することも可能であるし、ネットワークを介して提供することも可能である。

１０操作部
２０演算部
２２移動履歴情報格納部
２４ランドマーク情報格納部
２６パラメータ推定部
２８推定パラメータ格納部
３０算出部
４０出力部
１００予測装置

Claims

複数の動作主の各々についての、前記動作主が訪問したランドマークを表す移動履歴情報に基づいて、
前記複数の動作主の各々について、前記動作主の興味に対応する潜在トピックが該動作主に固有の潜在トピック比率に応じて選択され、選択された前記潜在トピックに固有のランドマークの確率分布と、前記動作主が時間ｔに訪問しているランドマークに固有のランドマークの確率分布とに従って、前記動作主が時間ｔ＋１に訪問するランドマークが生成されることを表すモデルのパラメータとして、前記複数の動作主の各々に対する、複数の前記潜在トピックの各々を前記動作主が選択する確率を表す動作主固有潜在トピック出現確率と、複数の前記潜在トピックの各々に対する、前記潜在トピックにおける複数の前記ランドマークの各々の選択されやすさを表す潜在トピック固有ランドマーク出現確率と、複数の前記ランドマークの各々に対する、前記ランドマークから複数の前記のランドマークの各々への移動しやすさを表すランドマーク間遷移確率とを推定するパラメータ推定部
を含むパラメータ推定装置。
入力された特定の動作主に関する情報と、前記特定の動作主が時間ｔに訪問しているランドマークと、請求項１に記載のパラメータ推定装置によって推定された、前記動作主固有潜在トピック出現確率、前記潜在トピック固有ランドマーク出現確率、及び前記ランドマーク間遷移確率とに基づいて、
前記特定の動作主が時間ｔ＋１に訪問するランドマークの選択確率を算出する算出部
を含む予測装置。
前記移動履歴情報は、前記動作主が訪問した前記ランドマークでの滞在時間に関する情報を含み、
前記モデルは、
前記複数の動作主の各々について、前記動作主の興味に対応する潜在トピックが該動作主に固有の潜在トピック比率に応じて選択され、選択された前記潜在トピックに固有のランドマークの確率分布と、前記動作主が時間ｔに訪問しているランドマークに固有のランドマークの確率分布とに従って、前記動作主が時間ｔ＋１に訪問するランドマークが生成されることを表し、かつ、
前記複数の動作主の各々について、前記選択された前記潜在トピックと、前記動作主が時間ｔ＋１に訪問するランドマークとの組み合わせに固有の滞在時間の確率分布とに従って、前記動作主が時間ｔ＋１に訪問するランドマークの滞在時間が生成されることを表し、
前記パラメータ推定部は、
前記移動履歴情報に基づいて、前記モデルのパラメータとして、
前記複数の動作主の各々に対する前記動作主固有潜在トピック出現確率と、複数の前記潜在トピックの各々に対する前記潜在トピック固有ランドマーク出現確率と、複数の前記ランドマークの各々に対する前記ランドマーク間遷移確率と、前記潜在トピックと前記ランドマークとの組み合わせの各々に対する、前記潜在トピックにおいて、前記動作主が時間ｔ＋１に訪問する前記ランドマークの滞在時間の確率分布のパラメータとを推定する
請求項１に記載のパラメータ推定装置。
入力された特定の動作主に関する情報と、前記特定の動作主が時間ｔに訪問しているランドマークと、請求項３に記載のパラメータ推定装置によって推定された、前記動作主固有潜在トピック出現確率、前記潜在トピック固有ランドマーク出現確率、前記ランドマーク間遷移確率、及び前記ランドマークの滞在時間の確率分布のパラメータとに基づいて、
前記特定の動作主が時間ｔ＋１に訪問するランドマークと該ランドマークでの滞在時間との組み合わせが起こる確率を算出する算出部
を含む予測装置。
前記パラメータ推定部は、
前記移動履歴情報と、前記モデルのパラメータとに基づいて、前記移動履歴情報に対する、前記モデルのパラメータの対数尤度関数を最大化するように、前記モデルのパラメータを推定することを繰り返す
請求項１又は請求項３に記載のパラメータ推定装置。
パラメータ推定部を含むパラメータ推定装置におけるパラメータ推定方法であって、
前記パラメータ推定部が、
複数の動作主の各々についての、前記動作主が訪問したランドマークを表す移動履歴情報に基づいて、
前記複数の動作主の各々について、前記動作主の興味に対応する潜在トピックが該動作主に固有の潜在トピック比率に応じて選択され、選択された前記潜在トピックに固有のランドマークの確率分布と、前記動作主が時間ｔに訪問しているランドマークに固有のランドマークの確率分布とに従って、前記動作主が時間ｔ＋１に訪問するランドマークが生成されることを表すモデルのパラメータとして、前記複数の動作主の各々に対する、複数の前記潜在トピックの各々を前記動作主が選択する確率を表す動作主固有潜在トピック出現確率と、複数の前記潜在トピックの各々に対する、前記潜在トピックにおける複数の前記ランドマークの各々の選択されやすさを表す潜在トピック固有ランドマーク出現確率と、複数の前記ランドマークの各々に対する、前記ランドマークから複数の前記のランドマークの各々への移動しやすさを表すランドマーク間遷移確率とを推定するステップ
を含むパラメータ推定方法。
算出部を含む予測装置における予測方法であって、
前記算出部が、入力された特定の動作主に関する情報と、前記特定の動作主が時間ｔに訪問しているランドマークと、請求項６に記載のパラメータ推定方法によって推定された、前記動作主固有潜在トピック出現確率、前記潜在トピック固有ランドマーク出現確率、及び前記ランドマーク間遷移確率とに基づいて、
前記特定の動作主が時間ｔ＋１に訪問するランドマークの選択確率を算出するステップ
を含む予測方法。
コンピュータを、請求項１、請求項３、及び請求項５の何れか１項に記載のパラメータ推定装置、あるいは請求項２又は請求項４に記載の予測装置の各部として機能させるためのプログラム。