JP2017083963A - パラメータ推定装置、予測装置、方法、及びプログラム - Google Patents

パラメータ推定装置、予測装置、方法、及びプログラム Download PDF

Info

Publication number
JP2017083963A
JP2017083963A JP2015209244A JP2015209244A JP2017083963A JP 2017083963 A JP2017083963 A JP 2017083963A JP 2015209244 A JP2015209244 A JP 2015209244A JP 2015209244 A JP2015209244 A JP 2015209244A JP 2017083963 A JP2017083963 A JP 2017083963A
Authority
JP
Japan
Prior art keywords
landmark
probability
specific
time
topic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015209244A
Other languages
English (en)
Other versions
JP6433876B2 (ja
Inventor
健 倉島
Takeshi Kurashima
健 倉島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2015209244A priority Critical patent/JP6433876B2/ja
Publication of JP2017083963A publication Critical patent/JP2017083963A/ja
Application granted granted Critical
Publication of JP6433876B2 publication Critical patent/JP6433876B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】動作主の行動を精度よく予測するためのパラメータを得ることができるパラメータ推定装置、方法、及びプログラム、また、動作主の行動を精度よく予測する予測装置、方法、及びプログラムを提供する。
【解決手段】推定装置100のパラメータ推定部26は、移動履歴情報格納部22に格納された移動履歴情報に基づいて、動作主の興味に対応する潜在トピックに固有のランドマークの確率分布と、動作主が時間tに訪問しているランドマークに固有のランドマークの確率分布とに従って、動作主が時間t+1に訪問するランドマークが生成されることを表すモデルのパラメータとして、動作主固有潜在トピック出現確率と、潜在トピック固有ランドマーク出現確率と、ランドマーク間遷移確率とを推定する。
【選択図】図7

Description

本発明は、パラメータ推定装置、予測装置、方法、及びプログラムに関する。
従来技術1として、動作主がランドマークを訪れた移動履歴情報の集合を学習データとして、トピックモデルを用いて動作主の行動をモデル化し、動作主が次に訪れるランドマークを予測する方法がある。トピックモデルにおいては、学習データが“ある動作主が訪れる各場所は、ユーザ固有の潜在トピック比率に従ってある潜在トピックを選択した後、その潜在トピックに固有のランドマーク出現確率分布に従って生成された”と仮定して、動作主の行動を確率モデルで表現することで、次に訪れる地点を予測する(非特許文献1)。
また、従来技術2として、例えば、複数人に関する移動履歴情報集合の傾向から、ランドマークAを訪れた人の多くはその近くのランドマークBを訪れる、とったランドマーク間の遷移のしやすさをマルコフモデルでモデル化することで、動作主が次に訪れるランドマークを予測する方法がある(非特許文献2)。
なお、ランドマークとは、屋内外を問わず、位置座標(緯度・経度など)に関連づけられた建物、寺社・仏閣、レストラン、商業施設、展示などの場所を意味する総称とする。
T. Hofmann.,"Probabilistic Latent Semantic Analysis", in Proc. Conf. on Uncertainty in Artificial Intelligence (UAI), pp. 289-296 (1999). D. Ashbrook and T. starner, "Using GPS to Learn Significant Locations and Predict Movement Across Multiple User"s, in Personal and ubiquitous computing, Vol.7, No. 5, pp.275-286 (2003).
上記非特許文献2に記載の従来技術2は、距離的な近さを反映したランドマーク間の遷移のモデル化である。従って、あるランドマークAを訪れた人が、その近辺に存在するランドマークBも“近いから訪れた”場合には、うまく予測を行うことができる。しかし、あるランドマークAを訪れた人が、ランドマークAからは遠いけれど“興味があるためランドマークCをわざわざ訪れた”といった場合に、うまく予測を行うことができなかった。
一方で、上記非特許文献1に記載の従来技術1であるトピックモデルは、「アート」、「スポーツ」、「人気」、「おしゃれ」といったランドマークの“特徴”でつながるランドマーク集合をまとめる潜在トピックと、潜在トピックに対する動作主の興味(重み)を学習することを目的とした技術である。従来技術1により、潜在トピックとそれに対する動作主の興味がうまく学習できれば、遠いけれど、興味があるため訪れたランドマークCを予測することができる。しかし、従来技術1は、すべてのランドマーク訪問が動作主に固有の興味によって生成されたと仮定している。つまり、すべてのランドマーク訪問事象は、“興味があるためわざわざ訪れた”の記録である場合にのみ有効な技術である。実際の移動履歴は、“近いから訪れた”と“興味があるためわざわざ訪れた”が混在して観測される。従来技術1はその二つの影響成分を分離する方法がないため、“近いから訪れた”観測データがノイズとして混入し、潜在トピック、及び、動作主固有の興味情報の抽出精度を低下させていた。従って、動作主が次に訪れるランドマークの予測精度も低かった。
また、従来技術1、及び、従来技術2は、次に訪れるランドマークを予測するが、そのランドマークにどれくらいの時間、滞在するかを予測することはできなかった。
本発明は、上記の点に鑑みてなされたものであり、動作主の行動を精度よく予測するためのパラメータを得ることができるパラメータ推定装置、方法、及びプログラムを提供することを目的とする。
また、動作主の行動を精度よく予測する予測装置、方法、及びプログラムを提供することを目的とする。
上記目的を達成するために、本発明に係るパラメータ推定装置は、複数の動作主の各々についての、前記動作主が訪問したランドマークを表す移動履歴情報に基づいて、前記複数の動作主の各々について、前記動作主の興味に対応する潜在トピックが該動作主に固有の潜在トピック比率に応じて選択され、選択された前記潜在トピックに固有のランドマークの確率分布と、前記動作主が時間tに訪問しているランドマークに固有のランドマークの確率分布とに従って、前記動作主が時間t+1に訪問するランドマークが生成されることを表すモデルのパラメータとして、前記複数の動作主の各々に対する、複数の前記潜在トピックの各々を前記動作主が選択する確率を表す動作主固有潜在トピック出現確率と、複数の前記潜在トピックの各々に対する、前記潜在トピックにおける複数の前記ランドマークの各々の選択されやすさを表す潜在トピック固有ランドマーク出現確率と、複数の前記ランドマークの各々に対する、前記ランドマークから複数の前記のランドマークの各々への移動しやすさを表すランドマーク間遷移確率とを推定するパラメータ推定部を含んで構成されている。
本発明に係るパラメータ推定方法は、パラメータ推定部を含むパラメータ推定装置におけるパラメータ推定方法であって、前記パラメータ推定部が、複数の動作主の各々についての、前記動作主が訪問したランドマークを表す移動履歴情報に基づいて、前記複数の動作主の各々について、前記動作主の興味に対応する潜在トピックが該動作主に固有の潜在トピック比率に応じて選択され、選択された前記潜在トピックに固有のランドマークの確率分布と、前記動作主が時間tに訪問しているランドマークに固有のランドマークの確率分布とに従って、前記動作主が時間t+1に訪問するランドマークが生成されることを表すモデルのパラメータとして、前記複数の動作主の各々に対する、複数の前記潜在トピックの各々を前記動作主が選択する確率を表す動作主固有潜在トピック出現確率と、複数の前記潜在トピックの各々に対する、前記潜在トピックにおける複数の前記ランドマークの各々の選択されやすさを表す潜在トピック固有ランドマーク出現確率と、複数の前記ランドマークの各々に対する、前記ランドマークから複数の前記のランドマークの各々への移動しやすさを表すランドマーク間遷移確率とを推定するステップを含む。
本発明に係る予測装置は、入力された特定の動作主に関する情報と、前記特定の動作主が時間tに訪問しているランドマークと、上記のパラメータ推定装置によって推定された、前記動作主固有潜在トピック出現確率、前記潜在トピック固有ランドマーク出現確率、及び前記ランドマーク間遷移確率とに基づいて、前記特定の動作主が時間t+1に訪問するランドマークの選択確率を算出する算出部を含んで構成されている。
本発明に係る予測方法は、算出部を含む予測装置における予測方法であって、前記算出部が、入力された特定の動作主に関する情報と、前記特定の動作主が時間tに訪問しているランドマークと、上記のパラメータ推定方法によって推定された、前記動作主固有潜在トピック出現確率、前記潜在トピック固有ランドマーク出現確率、及び前記ランドマーク間遷移確率とに基づいて、前記特定の動作主が時間t+1に訪問するランドマークの選択確率を算出するステップを含む。
また、本発明に係るパラメータ推定装置は、前記移動履歴情報は、前記動作主が訪問した前記ランドマークでの滞在時間に関する情報を含み、前記モデルは、前記複数の動作主の各々について、前記動作主の興味に対応する潜在トピックが該動作主に固有の潜在トピック比率に応じて選択され、選択された前記潜在トピックに固有のランドマークの確率分布と、前記動作主が時間tに訪問しているランドマークに固有のランドマークの確率分布とに従って、前記動作主が時間t+1に訪問するランドマークが生成されることを表し、かつ、前記複数の動作主の各々について、前記選択された前記潜在トピックと、前記動作主が時間t+1に訪問するランドマークとの組み合わせに固有の滞在時間の確率分布とに従って、前記動作主が時間t+1に訪問するランドマークの滞在時間が生成されることを表し、前記パラメータ推定部は、前記移動履歴情報に基づいて、前記モデルのパラメータとして、前記複数の動作主の各々に対する前記動作主固有潜在トピック出現確率と、複数の前記潜在トピックの各々に対する前記潜在トピック固有ランドマーク出現確率と、複数の前記ランドマークの各々に対する前記ランドマーク間遷移確率と、前記潜在トピックと前記ランドマークとの組み合わせの各々に対する、前記潜在トピックにおいて、前記動作主が時間t+1に訪問する前記ランドマークの滞在時間の確率分布のパラメータとを推定するようにすることができる。
また、本発明に係る予測装置は、入力された特定の動作主に関する情報と、前記特定の動作主が時間tに訪問しているランドマークと、上記のパラメータ推定装置によって推定された、前記動作主固有潜在トピック出現確率、前記潜在トピック固有ランドマーク出現確率、前記ランドマーク間遷移確率、及び前記ランドマークの滞在時間の確率分布のパラメータとに基づいて、前記特定の動作主が時間t+1に訪問するランドマークと該ランドマークでの滞在時間との組み合わせが起こる確率を算出する算出部を含んで構成されている。
また、本発明に係るパラメータ推定装置において、前記パラメータ推定部は、前記移動履歴情報と、前記モデルのパラメータとに基づいて、前記移動履歴情報に対する、前記モデルのパラメータの対数尤度関数を最大化するように、前記モデルのパラメータを推定することを繰り返すようにすることができる。
また、本発明のプログラムは、コンピュータを、上記のパラメータ推定装置、あるいは上記の予測装置の各部として機能させるためのプログラムである。
以上説明したように、本発明のパラメータ推定装置、方法、及びプログラムによれば、動作主の興味に対応する潜在トピックが該動作主に固有の潜在トピック比率に応じて選択され、選択された潜在トピックに固有のランドマークの確率分布と、当該動作主が時間tに訪問しているランドマークに固有のランドマークの確率分布とに従って、動作主が時間t+1に訪問するランドマークが生成されることを表すモデルのパラメータを推定することにより、動作主の行動を精度よく予測するためのパラメータを得ることができる、という効果が得られる。
また、本発明の予測装置、方法、及びプログラムによれば、特定の動作主に関する情報と、特定の動作主が時間tに訪問しているランドマークと、推定されたパラメータとに基づいて、特定の動作主が時間t+1に訪問するランドマークの選択確率を算出することにより、動作主の行動を精度よく予測することができる、という効果が得られる。
動作主の移動履歴から動作主が次に訪問する場所を予測する処理を説明するための説明図である。 本発明の実施の形態で用いる仮定を説明するための説明図である。 従来技術の一例を説明するための説明図である。 従来技術の一例を説明するための説明図である。 本発明の第1の実施の形態におけるモデルを説明するための説明図である。 本発明の実施の形態におけるモデルと従来技術との関係を説明するための説明図である。 本発明の実施の形態における予測装置のブロック図である。 本発明の第1の実施の形態における操作部及び出力部の構成例である。 本発明の第1の実施の形態における移動履歴情報格納部に格納されている移動履歴情報の一例である。 本発明の実施の形態におけるランドマーク情報格納部に格納されているランドマーク情報の一例である。 本発明の実施の形態における予測装置のパラメータ推定処理ルーチンを示すフローチャートである。 本発明の第1の実施の形態における予測装置の予測処理ルーチンを示すフローチャートである。 本発明の第1の実施の形態における予測装置の動作の一例を説明するための説明図である。 動作主の移動履歴から動作主が次に訪問する場所と滞在時間とを予測する処理を説明するための説明図である。 本発明の第2の実施の形態におけるモデルを説明するための説明図である。 本発明の第2の実施の形態における操作部及び出力部の構成例である。 本発明の第2の実施の形態における移動履歴情報格納部に格納されている移動履歴情報の一例である。 本発明の第2の実施の形態における予測装置の予測処理ルーチンを示すフローチャートである。
本発明の実施の形態は、個人の移動履歴情報に基づいて、その人が将来的に訪れるランドマークを予測する装置に関連し、また、各ランドマークを訪れた場合の滞在時間を予測する装置に関連する。
以下、図面を参照して本発明の実施の形態を詳細に説明する。
<概要>
図1に、本発明の実施の形態の技術分野を説明するための図を示す。図1に示すように、本発明の実施の形態では、動作主u∈Uの移動履歴から、動作主uが次に訪問するランドマークを予測する。学習データとしては、全動作主Uの移動履歴の情報を用いる。
図2に、本実施の形態で用いる仮定を説明するための図を示す。図2に示すように、本実施の形態では、動作主uが次に訪れるランドマークiは、以下の2つの要因で決まると仮定する。
(1)現在のランドマークjからのアクセスしやすさを表すP(ランドマークi|ランドマークj)
(2)動作主uの興味zを表すP(ランドマークi|興味z)
従来技術1では、図3に示すように、動作主が滞在するランドマークCから遷移しやすい場所が、動作主の移動予測結果として出力される。この場合には、「ランドマークCに行ったからついでに近くのランドマークDも行く」という行動は予測することができる。しかし、「動作主uだからランドマークEに行く」という予測をすることができない。例えば、動作主uはアニメが好きだからアニメショップに行くという予測をすることができない。
従来技術2では、図4に示すように、動作主uの興味zから選ばれやすいランドマークが、動作主の移動予測結果として出力される。この場合には、移動履歴が“興味があるから行った”の記録である場合にのみ有効であり、ただ単に“現在地から近いから訪れた”の記録を多く含むほど、興味推定の際のノイズとなり、予測精度が低下する。
本発明の実施の形態では、“現在地から近いから訪れた”と“興味があるため訪れた”とが混在して観測される場合でも、二つの影響成分を分離して推定することにより、動作主が次に訪れるランドマークを高精度に予測することを目的とする。また、各ランドマークにどの程度滞在するかを予測することを目的とする。
具体的には、図5に示すように、現在地に依存した項(近いから行く)と、ユーザに依存した項(興味があるから行く)とを分離して推定する。これにより、“近いから訪れた”と“興味があるため訪れた”が混在して観測された場合でも頑健で高精度な予測が実現される。
本実施形態によれば、図6に示すように、現在地に依存した項(近いから行く)と、動作主に依存した項(興味があるから行く)とを考慮して、動作主の行動を予測することができる。
[第1の実施の形態]
<第1の実施の形態に係る予測装置の構成>
次に、本発明の第1の実施の形態に係る予測装置の構成について説明する。図7に示すように、本発明の実施の形態に係る予測装置100は、CPUと、RAMと、後述する各処理ルーチンを実行するためのプログラムや各種データを記憶したROMと、を含むコンピュータで構成することが出来る。この予測装置100は、機能的には図7に示すように、操作部10と、演算部20と、移動履歴情報格納部22と、ランドマーク情報格納部24と、出力部40とを備えている。操作部10及び演算部20は、移動履歴情報格納部22及びランドマーク情報格納部24と接続されている。
操作部10は、後述する移動履歴情報格納部22及びランドマーク情報格納部24に格納されているデータに対する操作者からの各種操作を受け付ける。各種操作とは、移動履歴情報格納部22及びランドマーク情報格納部24に格納された情報を登録、修正、削除する操作等である。また、操作部10は、移動履歴情報格納部22及びランドマーク情報格納部24に記憶された情報を操作者に提示することも可能である。
また、操作部10は、ユーザによって入力された特定の動作主uに関する情報を受け付ける。特定の動作主は、予測対象となる動作主を表す。
動作主uに関する情報とは、移動履歴情報格納部22に格納されている動作主を一意に識別するIDなどである。
また、操作部10は、ユーザによって指定された潜在トピック数Zを受け付ける。潜在トピック数Zは、後述するパラメータ推定部26で用いられる変数である。
操作部10及び後述する出力部40の構成例を図8に示す。図8は、操作部10でランドマークのみの問い合わせを行う場合であり、ランドマークとランドマークを訪問する確率を表す選択確率との組み合わせが出力部40により出力され、例えば、選択確率の降順でソートして提示される。
本実施の形態では、予測装置100は、操作部10により指定された特定の動作主に関する予測を行う。第1の実施の形態では、操作部10により、指定された動作主が将来的に訪れる可能性が高いランドマークの問い合わせが行われ、ランドマークとそのランドマークを訪問する確率値の組み合わせを要求することができる。
操作部10の入力手段は、キーボードやマウスやメニュー画面やタッチパネルによるもの等、何でもよい。操作部10は、マウス等の入力手段のデバイスドライバや、メニュー画面の制御ソフトウェアで実現され得る。
移動履歴情報格納部22には、複数の動作主の各々についての、当該動作主が訪問したランドマークを表す移動履歴情報が格納されている。
移動履歴情報格納部22には、予測装置の演算部20によって解析され得る移動履歴情報が格納されており、演算部20からの要求に従って、移動履歴情報を読み出し、当該移動履歴情報を演算部20に送信する。
ここで、解析され得る動作主の集合をU、ランドマークの集合をIと表す。ある動作主u∈Uがm番目に訪れたランドマークをxum∈Iとすると、動作主uの移動履歴情報はx={xu1,…,xuMu}と表される。なお、Mは動作主が過去に訪れたランドマークの数である。
図9に、本発明の実施の形態における移動履歴情報格納部22に格納される移動履歴情報の一例を示す。
例えば、図9に格納された情報から、動作主IDがU1とU2の動作主の移動履歴情報は以下のように表される。
u1={i,i,i10,i,i
u2={i,i,i
移動履歴情報格納部22は、例えば、Webページを保持するWebサーバや、データベースを具備するデータベースサーバ等である。
ランドマーク情報格納部24には、ランドマークに関する情報であるランドマーク情報が格納されている。
ランドマーク情報格納部24には、予測装置の演算部20によって解析され得るランドマーク情報が格納されており、演算部20からの要求に従って、ランドマーク情報を読み出し、当該ランドマーク情報を演算部20に送信する。各ランドマーク情報は、たとえば、ランドマークを一意に識別するためのID、ランドマークの名称、位置座標(緯度・経度)を含む情報である。
図10に、本発明の実施の形態におけるランドマーク情報格納部24に格納されているランドマーク情報の一例を示す。
ランドマーク情報格納部24は、例えば、Webページを保持するWebサーバや、データベースを具備するデータベースサーバ等である。
演算部20は、パラメータ推定部26、推定パラメータ格納部28、及び算出部30を備えている。
説明の簡略化のため、演算部20のパラメータ推定部26及び推定パラメータ格納部28の説明の前に、算出部30について説明する。
算出部30は、操作部10により入力された特定の動作主uに関する情報と、移動履歴情報格納部22に格納された特定の動作主uが現在の時間tに訪問しているランドマークと、推定パラメータ格納部28に格納されたパラメータΨ(例えば、後述する、Θ、Φ、及びΛ)とに基づいて、特定の動作主uが時間t+1に訪問するランドマークの選択確率を、特定の動作主uが、それぞれのランドマークiを将来的に訪れる確率値として算出する。算出部30は、操作部10により特定の動作主についての問い合わせがあった場合に呼び出される手段である。
ここで、算出部30によって算出される、動作主uがそれぞれのランドマークiを将来的に訪れる確率値のモデルについて説明する。
本実施の形態において、動作主の行動を予測するモデルは、複数の動作主の各々について、“動作主uの興味に対応する潜在トピックzが当該動作主uに固有の潜在トピック比率に応じて選択され、選択された潜在トピックzに固有のランドマークの確率分布と、動作主uが時間tに訪問しているランドマークiに固有のランドマークの確率分布とに従って、動作主uが時間t+1に訪問するランドマークit+1が生成される”という仮定に基づくモデルである。
つまり、本実施の形態では、潜在トピック数Zが与えられたもとで、時間tにランドマークiにいる動作主uが時間t+1にランドマークit+1に存在する確率P(it+1|u,i)を以下の式(1)に従って計算する。
ここで、潜在トピックzは「スポーツ」、「アート」などのランドマークの特徴を表現するために用意された潜在変数である。P(z|u)=θuzは、動作主に固有な興味を表し、動作主uが潜在トピックzに興味を持つ確率を表す。
また、P(it+1|z,i)は、潜在トピックzにおいてランドマークiが選択される確率P(i|z)=φziと、時間tにおいて選択されたランドマークiからのアクセスしやすさP(it+1|i)とから導かれたランドマークの選択確率である。
例えば、P(it+1|z,i)は、以下の式(2)に従って計算される。
Cは正規化項であり、以下の式(3)で計算することができる。
上記式におけるP(i|z)=φziは、潜在トピックzにおけるトレンドを示しており、例えば、潜在トピックzが「アート」に関連するランドマーク群をグループ化する変数として推定された場合は、「東京▽▼美術館」や「京都●○美術館」などのアートに関連するランドマークの出現確率が高くなる、つまり、潜在トピックzから選ばれやすくなる。
なお、潜在トピックzは典型的には「スポーツ」や「アート」などのランドマークの特徴を表すために用意された変数であるが、移動履歴情報格納部22に格納された移動履歴情報に応じて、後述するパラメータ推定部26によって自動的に決定されるため、ユーザは当該変数が実際にどのようなトピックを表すかを指定する必要はない。
また、時間tにおいて選択されたランドマークiからのアクセスされやすさP(it+1|i)は、以下の式(4)で計算することができる。
ここで、
は、時間tにおいてランドマークiが選択された場合、次の時間t+1にランドマークit+1が選択される確率である。この確率は、ランドマークiとランドマークit+1とが物理的に近くに存在する場合や、アクセスが容易である場合に高い値を持つ。
例えば、ランドマークiが東京駅だった場合、P(it+1=”品川駅”|i=”東京駅”)の方が、P(it+1=”京都駅”|i=”東京駅”)より高い値を持つ。ただし、各動作主が最初に選択するランドマーク(t=1の場合)に関しては、一つ前に訪れたランドマークが存在しない(未観測である状態)ため、上記式(4)の影響は無視し、例えばP(it+1|i)=1と設定する。
パラメータ推定部26は、操作部10により入力された潜在トピック数Zと、移動履歴情報格納部22に格納された移動履歴情報とに基づいて、上記した算出部30で用いるパラメータΨとして、複数の動作主の各々に対する、複数の潜在トピックの各々を動作主が選択する確率を表す動作主固有潜在トピック出現確率と、複数の潜在トピックの各々に対する、潜在トピックにおける複数のランドマークの各々の選択されやすさを表す潜在トピック固有ランドマーク出現確率と、複数のランドマークの各々に対する、ランドマークから複数のランドマークの各々への移動しやすさを表すランドマーク間遷移確率とを推定する。
ここで、全動作主数をN、全ランドマーク数をI、動作主uが潜在トピックzを選択する確率を表す動作主固有潜在トピック出現確率をθuz、動作主uの潜在トピック分布をθ={θuz}、潜在トピックzからランドマークiが選択される確率を表す潜在トピック固有ランドマーク出現確率をφzi、潜在トピックzに固有のランドマークの確率分布をφ={φzi}、ランドマークiの後にランドマークjが選択される確率を表すランドマーク間遷移確率をλij、ランドマークiに固有のランドマーク分布をλ={λij}と表すこととする。パラメータ推定部26が推定するパラメータは、Θ={θ},Φ={φ},Λ={λ}である。
移動履歴情報格納部22に格納されている移動履歴情報をX={x}、パラメータをΨ={Θ,Φ,Λ}と表すと、以下の式(5)に示す対数尤度を最大化することにより、パラメータを推定する。
上記式(2)、上記式(4)を、上記式(5)の表記に基づいて書き直すと、それぞれ以下の式(6)、(7)のように表される。
本実施の形態では、パラメータ推定部26は、上記式(5)の対数尤度関数を最大化するパラメータΨを逐次反復的に見つけていく。この最大化問題は、EMアルゴリズムにより、以下の式(8)に示すQ関数を最大化する問題に置き換えて解くことができる。
EMアルゴリズムでは、最初にパラメータに適当な初期値を与える。次に、パラメータが収束するまで以下のE−stepとM−stepを繰り返す。
E−stepにおいて、パラメータ推定部26は、以下の式(9)に示すベイズ則に従って、パラメータの現在の推定値Ψ^が与えられたもとでのトピック事後確率P(z|u,m;Ψ^)を計算する。
M−stepでは、パラメータ推定部26は、トピック事後確率P(z|u,m;Ψ^)に基づいて、上記式(8)に示すQ関数を最大化する、新たなパラメータの値を求める。例えば、θuzに関しては、
を解き、以下の式(10)に従って、Q関数をθuzに関して最大化することで、θuzを求めることができる。
また、記号「^」が付与されているのはパラメータの次の推定値であることを示しており、記号「^」が付与されていないのはパラメータの現在の推定値を示している。
また、φziとλijに関しては、閉形式で直接求めることができないため、準ニュートン法などの最適化手法を用いて求める。準ニュートン法で用いる勾配ベクトルはそれぞれ、以下の式(11)、(12)である。
パラメータ推定部26は、EステップとMステップとをパラメータが収束するまで繰り返すことで、上記式(5)で示した尤度関数を最大化するパラメータΨを得ることができる。
推定パラメータ格納部28には、パラメータ推定部26によって推定されたパラメータΨであるΘ、Φ、及びΛが格納される。
推定パラメータ格納部28には、潜在トピック数Zとパラメータ推定部26で推定したパラメータΨが格納される。推定パラメータ格納部28には、これらの情報が保存され、保存された情報が復元可能なものであればなんでもよい。例えば、データベースや、予め備えられた汎用的な記憶装置(メモリやハードディスク装置)の特定領域に記憶される。
出力部40は、算出部30によって算出された、特定の動作主が時間t+1に訪問するランドマークの選択確率を結果として出力する。
具体的には、出力部40は、操作部10により指定される特定の動作主が将来的に訪れる可能性が高いランドマークの問い合わせがあった場合、算出部30の結果に基づいてランドマークと当該ランドマークを訪問する確率値の組み合わせを出力する。
ここで、出力部30における出力とは、ディスプレイへの表示、プリンタへの印字、音出力、外部装置への送信等を含む概念である。出力部30は、ディスプレイやスピーカ等の出力デバイスを含むと考えても含まないと考えてもよい。出力部30は、出力デバイスのドライバソフトまたは、出力デバイスのドライバソフトと出力デバイス等で実現され得る。
<第1の実施の形態に係る予測装置の作用>
次に、本発明の実施の形態に係る予測装置100の作用について説明する。本実施の形態では、特定の動作主の行動の予測を行う前に、パラメータの推定を実行する必要がある。そのため、予測装置100は、パラメータ推定処理を行った後に、特定の動作主の行動の予測処理を行う。
<パラメータ推定処理ルーチン>
予測装置100は、移動履歴情報が入力されると、移動履歴情報格納部22に格納する。また、ランドマーク情報が入力されると、予測装置100は、ランドマーク情報格納部24に格納する。そして、予測装置100は、潜在トピック数Zが操作部10により入力されると、図11に示すパラメータ推定処理ルーチンを実行する。
まず、ステップS100において、パラメータ推定部26は、移動履歴情報格納部22に格納された移動履歴情報を取得する。また、パラメータ推定部26は、操作部10によって受け付けた潜在トピック数Zを取得する。
次に、ステップS102において、パラメータ推定部26は、パラメータΨの初期値を設定する。
ステップS104において、パラメータ推定部26は、E−stepとして、上記ステップS100で取得した移動履歴情報及び潜在トピック数Zと、上記ステップS102で設定されたパラメータΨの初期値又は前回のステップS106で推定されたパラメータΨ^とに基づいて、上記式(9)に従って、トピック事後確率P(z|u,m;Ψ^)を計算する。
ステップS106において、パラメータ推定部26は、M−stepとして、上記ステップS100で取得した移動履歴情報及び潜在トピック数Zと、上記ステップS104で計算されたトピック事後確率P(z|u,m;Ψ^)とに基づいて、上記式(10)、(11)、(12)に従って、上記式(8)に示すQ関数を最大化する、新たなパラメータΨを推定する。
ステップS108において、パラメータ推定部26は、パラメータΨの値が収束したか否かを判定する。パラメータΨの値が収束したと判定した場合には、ステップS110へ進む。一方、パラメータΨの値が収束していないと判定した場合には、ステップS104へ戻る。
ステップS110において、パラメータ推定部26は、上記ステップS106で推定されたパラメータΨであるΘ、Φ、及びΛと、上記ステップS100で取得した潜在トピック数Zとを、推定パラメータ格納部28に格納して、パラメータ推定処理ルーチンを終了する。
<予測処理ルーチン>
次に、特定の動作主に関する情報が、操作部10によりユーザによって入力されると、予測装置100は、図12に示す予測処理ルーチンを実行する。
まず、ステップS200において、算出部30は、操作部10により入力された特定の動作主uに関する情報を取得する。
ステップS202において、算出部30は、移動履歴情報格納部22に格納されている、上記ステップS200で取得した特定の動作主uが現在の時間tに訪問しているランドマークの情報を取得する。また、算出部30は、推定パラメータ格納部28に格納されたパラメータΨと潜在トピック数Zとを取得する。
ステップS204において、算出部30は、1つのランドマークを設定する。
ステップS206において、算出部30は、時間tにランドマークiにいる動作主uが時間t+1にランドマークit+1に存在する確率P(it+1|u,i)に0を代入する。
ステップS208において、算出部30は、一時変数zに1を代入し、初期化する。
ステップS210において、算出部30は、上記ステップS208で初期化された一時変数z又は前回のステップS214で更新された一時変数zが、上記ステップS202で取得された潜在トピック数Z以下であるか否かを判定する。一時変数zが潜在トピック数Z以下である場合には、ステップS212へ進む。一方、一時変数zが潜在トピック数Zより大きい場合には、ステップS216へ進む。
ステップS212において、上記式(1)を計算するため、算出部30は、上記ステップS206で初期化された確率P(it+1|u,i)又は前回の本ステップS212で更新された確率P(it+1|u,i)と、上記ステップS202で取得したパラメータΨのうちΘから得られる確率P(z|u)と、パラメータΨのうちΦ及びΛから上記式(2)〜(4)に従い算出される確率P(it+1|z,i)とに基づいて、以下の算出式に従って、確率P(it+1|u,i)を更新する。
ステップS214において、算出部30は、一時変数zを1インクリメントし、ステップS210へ戻る。
ステップS216において、算出部30は、予測対象の全てのランドマークについて、上記ステップS204〜ステップS214の処理を実行したか否かを判定する。全てのランドマークについて、上記ステップS204〜ステップS214の処理を実行したと判定した場合には、ステップS218へ進む。一方、上記ステップS204〜ステップS214の処理を実行していないランドマークが存在する場合には、ステップS204へ戻る。
ステップS218において、出力部40は、上記ステップS212で算出された、特定の動作主uが時間t+1に訪問する各ランドマークの選択確率P(it+1|u,i)を結果として出力し、予測処理ルーチンを終了する。
図13に、第1の実施の形態の予測装置100の基本的な動作の一例を示す。図13では、動作主uが過去にランドマークa,b,cを訪問し、現在、ランドマークcに存在しているとする。また、潜在トピック数Zは3であるとし、パラメータ推定部26の推定結果から、それぞれの潜在トピックに含まれやすいランドマークをそれぞれ丸、四角、三角で示してある。
厳密には、予測装置100により、潜在トピック固有のランドマーク出現確率を算出できるため、各ランドマークは複数の潜在トピックから同程度に支持される可能性もあるが、説明の簡略化のため、各ランドマークはいずれかの潜在トピックに含まれるとして説明を進める。
また、図13中の矢印に付与された値はλjiである。例えば、λcd=0.1である。予測装置100は、上記式(1)〜式(4)により、動作主uが現在いる(最後に訪問した)ランドマークから近いランドマークほど高いスコアを与える。つまり、λの高いランドマークを優先する。さらに、動作主が支持する潜在トピックに含まれるランドマークほどスコアが高くなる。
ここで、対象となる動作主は四角形で示される潜在トピックに優先的に訪問する傾向があるため、四角形に含まれるランドマークほどスコアが高くなる。上記図13の例では、ランドマークd,e,fの中では、eが最もスコアが高くなる。ランドマークh,gの中では、hが最もスコアが高くなる。ランドマークeは、λの値も大きく、かつ、潜在トピックに合致するため、ランドマークd,e,f,h,gの中で最もスコアが高くなる。ランドマークd,fは潜在トピックには該当しないがλが大きいため、ランドマークhはλは小さいが潜在トピックに該当するため、同程度のスコアを持つことになる。
このように、本実施の形態に係る予測装置100は、現在地からのアクセスしやすさに加え、動作主が訪問しやすいランドマークの種類(潜在トピック)を加味して高精度に次に訪れるランドマークを予測することができる。
以上説明したように、第1の実施の形態に係る予測装置によれば、動作主の興味に対応する潜在トピックが該動作主に固有の潜在トピック比率に応じて選択され、選択された潜在トピックに固有のランドマークの確率分布と、当該動作主が時間tに訪問しているランドマークに固有のランドマークの確率分布とに従って、動作主が時間t+1に訪問するランドマークが生成されることを表すモデルのパラメータを推定することにより、動作主の行動を精度よく予測するためのパラメータを得ることができる。
また、特定の動作主に関する情報と、特定の動作主が時間tに訪問しているランドマークと、推定されたパラメータとに基づいて、特定の動作主が時間t+1に訪問するランドマークの選択確率を算出することにより、動作主の行動を精度よく予測することができる。
また、“動作主が訪れるランドマークは、動作主固有のトピック比率に従ってある潜在トピックを選択した後、その潜在トピックと動作主が最後に訪れたランドマークからのアクセスしやすさとを加味して決定した”という実態にあった仮定に基づく行動モデルを学習することで、“近いから訪れる”と“興味があるからわざわざ訪れる”の影響成分を分離することができる。これにより、“現在地から近いから訪れた”と“興味があるため訪れた”が混在して観測されるような場合でも高精度に次に訪れるランドマークを予測することができる。
[第2の実施の形態]
次に、本発明の第2の実施の形態について説明する。なお、第2の実施の形態に係る予測装置の構成は、第1の実施の形態と同様の構成となるため、同一符号を付して説明を省略する。
第2の実施の形態では、特定の動作主が時間t+1に訪問するランドマークの選択確率と当該ランドマークでの滞在時間との組み合わせが起こる確率を算出する点が、第1の実施の形態と異なっている。
第2の実施の形態では、図14に示すように、動作主u∈Uの移動履歴と滞在時間履歴とから、動作主uが次に訪問するランドマークとその滞在時間を予測する。学習データとしては、全動作主Uの移動履歴と滞在時間履歴とを用いる。
第2の実施の形態では、図15に示すように、興味zに分類される人々は場所の選び方だけでなく、滞在時間の傾向も近いことを利用して、パラメータを推定する。
第2の実施の形態の予測装置に係る操作部10は、第1の実施の形態と同様に、特定の動作主に関する情報と、潜在トピック数Zとを受け付ける。
図16に、第2の実施の形態に係る操作部10及び出力部40の構成例を示す。図16は、操作部10でランドマークと滞在時間との組み合わせの問い合わせを行う場合であり、ランドマークと滞在時間の組み合わせと、当該組み合わせが起こる確率値が出力部40により出力される。
第2の実施の形態の予測装置に係る移動履歴情報格納部22には、動作主が訪問したランドマークでの滞在時間に関する情報を含む移動履歴情報が格納されている。
図17に、第2の実施の形態における移動履歴情報格納部22に格納されている移動履歴情報の一例を示す。移動履歴情報格納部22には、それぞれのランドマークにどれくらいの時間、滞在したかの情報も格納されている。uがm番目に訪れたランドマークxumの滞在時間をsumとすると、uの滞在時間履歴情報はs={su1,…,suMu}となる。
図17に示すように、移動履歴情報に、滞在時間履歴情報が含まれている。例えば、滞在時間履歴情報は以下のようになる。
u1={3000,600,300,1800,60}
u2={6000,1800,60}
第2の実施の形態の予測装置に係る算出部30は、操作部10により入力された特定の動作主uに関する情報と、移動履歴情報格納部22に格納された特定の動作主uが現在の時間tに訪問しているランドマーク及び滞在時間と、推定パラメータ格納部28に格納されたパラメータΨ(後述するΘ、Φ、Λ、及びΩ)とに基づいて、特定の動作主uが時間t+1に訪問するランドマークと当該ランドマークでの滞在時間との組み合わせが起こる確率を算出する。
第2の実施の形態において、動作主の行動を予測するモデルは、複数の動作主の各々について、“動作主uの興味に対応する潜在トピックzが当該動作主uに固有の潜在トピック比率に応じて選択され、選択された潜在トピックzに固有のランドマークの確率分布と、動作主uが時間tに訪問しているランドマークiに固有のランドマークの確率分布とに従って、動作主uが時間t+1に訪問するランドマークit+1が生成されることを表し、かつ、選択された潜在トピックと、動作主が時間t+1に訪問するランドマークとの組み合わせに固有の滞在時間の確率分布とに従って、動作主が時間t+1に訪問するランドマークの滞在時間が生成される”という仮定に基づくモデルである。
具体的には、算出部30は、時間tにランドマークiにいる動作主uが時間t+1で訪れるランドマークの候補の各々に対し、当該ランドマークit+1と、当該ランドマークit+1での各滞在時間st+1との組み合わせの各々について、当該組み合わせが起こる確率P(it+1,st+1|u,i)を、以下の式(13)に従って計算する。算出部30は、操作部10により特定の動作主について、ランドマークと滞在時間との組み合わせに対する問い合わせがあった場合に呼び出される手段である。
上記式(1)と同様に、P(z|u)、P(it+1|z,i)については、上記式(2)〜上記式(4)に従って計算する。また、ある潜在トピックzに属する動作主が、もし、ランドマークit+1を訪れる場合の滞在時間st+1は以下の式(14)に示すガンマ分布に基づく式で計算する。
ここで、αとβとは、それぞれガンマ分布のパラメータである。上記式(13)により、行き先と滞在時間との両方を予測することができる。一般的に滞在時間は動作主の興味の程度を反映しているため、滞在時間の長くなるであろう(動作主が強く興味を持つであろう)ランドマークに絞り込んだ予測をすることができる。
第2の実施の形態の予測装置に係るパラメータ推定部26は、操作部10により入力された潜在トピック数Zと、移動履歴情報格納部22に格納された移動履歴情報とに基づいて、上記した算出部30で用いるパラメータΨとして、複数の動作主の各々に対する、複数の潜在トピックの各々を動作主が選択する確率を表す動作主固有潜在トピック出現確率と、複数の潜在トピックの各々に対する、潜在トピックにおける複数のランドマークの各々の選択されやすさを表す潜在トピック固有ランドマーク出現確率と、複数のランドマークの各々に対する、ランドマークから複数のランドマークの各々への移動しやすさを表すランドマーク間遷移確率と、潜在トピックとランドマークとの組み合わせの各々に対する、当該潜在トピックにおいて、動作主が時間t+1に訪問する当該ランドマークの滞在時間の確率分布のパラメータとを推定する。
第1の実施の形態と同様に、全動作主数をN、全ランドマーク数をI、動作主uが潜在トピックzを選択する確率を表す動作主固有潜在トピック出現確率をθuz、動作主uの潜在トピック分布をθ={θuz}、潜在トピックzからランドマークiが選択される確率を表す潜在トピック固有ランドマーク出現確率をφzi、潜在トピックzのランドマーク分布をφ={φzi}、ランドマークiの後にランドマークjが選択される確率を表すランドマーク間遷移確率をλij,ランドマークiに固有のランドマーク分布をλ={λij}と表し、また、潜在トピックzとランドマークiが与えられたときのランドマークの滞在時間の確率分布のパラメータ(ガンマ分布のパラメータ)をαziとβzi、潜在トピックzのパラメータをα={αzi}とβ={βzi}と表すこととする。従って、第2の実施の形態に係るパラメータ推定部26が推定するパラメータは、Θ={θ},Φ={φ},Λ={λ},Ω={α,β}である。
移動履歴情報格納部22に格納されている移動履歴情報をX={x,s}、パラメータをΨ={Θ,Φ,Λ,Ω}と表すと、以下の式(15)に示す対数尤度を最大化することにより、パラメータを推定する。
ここで、動作主uがm番目に訪れたランドマークがxum、その滞在時間がsumである。また、上記式(14)を上記式(15)の表記に基づいて書き直すと以下のようになる。
第2の実施の形態では、パラメータ推定部26は、上記式(15)の対数尤度関数を最大化するパラメータΨを逐次反復的に見つけていく。この最大化問題は、EMアルゴリズムにより、以下の式(16)に示すQ関数を最大化する問題に置き換えて解くことができる。
E−stepにおいて、パラメータ推定部26は、以下の式(17)に示すベイズ則に従って、パラメータの現在の推定値Ψ^が与えられたもとでのトピック事後確率を計算する。
M−stepでは、パラメータ推定部26は、第1の実施の形態と同様に、上記式(16)に示すQ関数を最大化する、新たなパラメータθuz,φzi,λijの値を求める。
また、パラメータ推定部26は、M−stepの中で以下に示す式(18)、(19)に従って、パラメータαとβとを更新する。
ここで、
である。
第2の実施の形態の予測装置に係る出力部40は、算出部30によって算出された、特定の動作主が時間t+1に訪問するランドマークと当該ランドマークでの滞在時間との組み合わせが起こる確率を結果として出力する。
具体的には、出力部40は、操作部10により指定される特定の動作主が将来的に訪れるランドマークと滞在時間の組み合わせに対する問い合わせがあった場合、算出部30の結果に基づいてランドマークと滞在時間との組み合わせと、当該組み合わせが起こる確率値を出力する。また、滞在時間に対する問い合わせである場合には、滞在時間とそれが起こる確率値を出力する。例えば、出力部40は、ランドマークと滞在時間との組み合わせと当該組み合わせが起こる確率値を、確率値の降順でソートして出力する。
<第2の実施の形態に係る予測装置の作用>
次に、第2の実施の形態に係る予測装置100の作用について説明する。第1の実施の形態と同様に、予測装置100は、パラメータ推定処理を行った後に、特定の動作主の行動の予測処理を行う。
まず、上記図11に示すパラメータ推定処理ルーチンが実行され、パラメータΨ={Θ,Φ,Λ,Ω}が推定パラメータ格納部28に格納される。
<予測処理ルーチン>
次に、特定の動作主uに関する情報が、操作部10によりユーザによって入力されると、予測装置100は、図18に示す予測処理ルーチンを実行する。
ステップS306において、算出部30は、時間tにランドマークiにいる動作主uが時間t+1にランドマークit+1に各時間st+1滞在する確率P(it+1,st+1|u,i)に0を代入する。
ステップS312において、上記式(13)を計算するため、算出部30は、各時間st+1について、上記ステップS306で初期化された確率P(it+1,st+1|u,i)又は前回の本ステップS212で更新された確率P(it+1,st+1|u,i)と、上記ステップS202で取得したパラメータΨのうちΘから得られる確率P(z|u)と、パラメータΨのうちΦ及びΛから上記式(2)〜(4)に従い算出される確率P(it+1|z,i)と、パラメータΨのうちα及びβから上記式(14)に従い算出される確率P(st+1|z,it+1)とに基づいて、以下の算出式に従って、確率P(it+1,st+1|u,i)を更新する。
ステップS318において、出力部40は、上記ステップS312で算出された、特定の動作主uが時間t+1に訪問する各ランドマークと当該ランドマークでの各滞在時間との組み合わせが起こる確率P(it+1,st+1|u,i)を結果として出力し、予測処理ルーチンを終了する。
なお、第2の実施の形態に係る予測装置の他の構成及び作用については、第1の実施の形態と同様であるため、説明を省略する。
以上説明したように、第2の実施の形態に係る予測装置によれば、動作主の興味に対応する潜在トピックが該動作主に固有の潜在トピック比率に応じて選択され、選択された潜在トピックに固有のランドマークの確率分布と、当該動作主が時間tに訪問しているランドマークに固有のランドマークの確率分布とに従って、動作主が時間t+1に訪問するランドマークが生成され、かつ、選択された潜在トピックと、動作主が時間t+1に訪問するランドマークとの組み合わせに固有の滞在時間の確率分布とに従って、動作主が時間t+1に訪問するランドマークの滞在時間が生成されることを表すモデルのパラメータを推定することにより、ランドマークでの滞在時間を含む動作主の行動を精度よく予測するためのパラメータを得ることができる。
また、特定の動作主に関する情報と、特定の動作主が時間tに訪問しているランドマークと、推定されたパラメータとに基づいて、特定の動作主が時間t+1に訪問するランドマークの選択確率と、当該ランドマークでの滞在時間とを算出することにより、ランドマークでの滞在時間を含む動作主の行動を精度よく予測することができる。
また、動作主の興味を反映した潜在トピックに固有な滞在時間の傾向を推定することで、高精度に滞在時間を予測することもできる。
[第3の実施の形態]
次に、本発明の第3の実施の形態について説明する。なお、第3の実施の形態に係る予測装置の構成は、第1の実施の形態と同様の構成となるため、同一符号を付して説明を省略する。
第3の実施の形態では、ランドマークから複数のランドマークの各々への移動しやすさとして、ランドマーク間の距離を用いる点が、第1又は第2の実施の形態と異なっている。
第3の実施の形態に係る予測装置100のパラメータ推定部26は、ランドマーク情報格納部24に格納された、各ランドマーク間の空間的な距離を補助情報として用い、空間的な距離を反映するようにλijを推定する。その場合、上記式(8)又は上記式(16)のQ関数に、以下の式(20)に示す項を加算した値を最適化することで、空間的な距離を反映するようにλijを推定することができる。
ここで、rijはランドマークjとiとの空間的な距離を表し、ランドマーク情報格納部24に格納された情報に基づき計算される。ランドマークjとiとの空間的な距離が近いほど、λijは大きな値として推定される。なお,γはユーザによって指定されるパラメータであり、実際の距離をどの程度、パラメータλijに強く反映させるかをコントロールするためのものである。上記式(20)で示した項をQ関数に含める場合、上記式(12)で示した準ニュートン法で用いる勾配ベクトルは、以下の式(21)に示すようになる。
なお、第3の実施の形態に係る予測装置の他の構成及び作用については、第1の実施の形態と同様であるため、説明を省略する。
以上説明したように、第3の実施の形態に係る予測装置によれば、ランドマーク間の距離を考慮してパラメータを推定することにより、ランドマーク間の距離に応じた動作主の行動を精度よく予測するためのパラメータを得ることができる。
また、推定されたパラメータに基づいて、特定の動作主が時間t+1に訪問するランドマークの選択確率を算出することにより、ランドマーク間の距離に応じた動作主の行動を精度よく予測することができる。
なお、本発明は、上述した実施形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。
例えば、上記実施の形態においては、予測装置100によって、パラメータを推定し、特定の動作主の行動を予測する場合を例に説明したが、これに限定されるものではなく、予測装置100とは別の装置(例えば、パラメータ推定装置)によって、パラメータを推定するようにしてもよい。この場合には、パラメータ推定装置は、操作部10、移動履歴情報格納部22、ランドマーク情報格納部24、パラメータ推定部26、及び推定パラメータ格納部28を備えるようにすればよい。
また、移動履歴情報格納部22、ランドマーク情報格納部24、及び推定パラメータ格納部28の少なくとも1つは、外部に設けられ、予測装置100とネットワークで接続されていてもよい。
また、上述の予測装置100は、内部にコンピュータシステムを有しているが、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、本願明細書中において、プログラムが予めインストールされている実施形態として説明したが、当該プログラムを、コンピュータ読み取り可能な記録媒体に格納して提供することも可能であるし、ネットワークを介して提供することも可能である。
10 操作部
20 演算部
22 移動履歴情報格納部
24 ランドマーク情報格納部
26 パラメータ推定部
28 推定パラメータ格納部
30 算出部
40 出力部
100 予測装置

Claims (8)

  1. 複数の動作主の各々についての、前記動作主が訪問したランドマークを表す移動履歴情報に基づいて、
    前記複数の動作主の各々について、前記動作主の興味に対応する潜在トピックが該動作主に固有の潜在トピック比率に応じて選択され、選択された前記潜在トピックに固有のランドマークの確率分布と、前記動作主が時間tに訪問しているランドマークに固有のランドマークの確率分布とに従って、前記動作主が時間t+1に訪問するランドマークが生成されることを表すモデルのパラメータとして、前記複数の動作主の各々に対する、複数の前記潜在トピックの各々を前記動作主が選択する確率を表す動作主固有潜在トピック出現確率と、複数の前記潜在トピックの各々に対する、前記潜在トピックにおける複数の前記ランドマークの各々の選択されやすさを表す潜在トピック固有ランドマーク出現確率と、複数の前記ランドマークの各々に対する、前記ランドマークから複数の前記のランドマークの各々への移動しやすさを表すランドマーク間遷移確率とを推定するパラメータ推定部
    を含むパラメータ推定装置。
  2. 入力された特定の動作主に関する情報と、前記特定の動作主が時間tに訪問しているランドマークと、請求項1に記載のパラメータ推定装置によって推定された、前記動作主固有潜在トピック出現確率、前記潜在トピック固有ランドマーク出現確率、及び前記ランドマーク間遷移確率とに基づいて、
    前記特定の動作主が時間t+1に訪問するランドマークの選択確率を算出する算出部
    を含む予測装置。
  3. 前記移動履歴情報は、前記動作主が訪問した前記ランドマークでの滞在時間に関する情報を含み、
    前記モデルは、
    前記複数の動作主の各々について、前記動作主の興味に対応する潜在トピックが該動作主に固有の潜在トピック比率に応じて選択され、選択された前記潜在トピックに固有のランドマークの確率分布と、前記動作主が時間tに訪問しているランドマークに固有のランドマークの確率分布とに従って、前記動作主が時間t+1に訪問するランドマークが生成されることを表し、かつ、
    前記複数の動作主の各々について、前記選択された前記潜在トピックと、前記動作主が時間t+1に訪問するランドマークとの組み合わせに固有の滞在時間の確率分布とに従って、前記動作主が時間t+1に訪問するランドマークの滞在時間が生成されることを表し、
    前記パラメータ推定部は、
    前記移動履歴情報に基づいて、前記モデルのパラメータとして、
    前記複数の動作主の各々に対する前記動作主固有潜在トピック出現確率と、複数の前記潜在トピックの各々に対する前記潜在トピック固有ランドマーク出現確率と、複数の前記ランドマークの各々に対する前記ランドマーク間遷移確率と、前記潜在トピックと前記ランドマークとの組み合わせの各々に対する、前記潜在トピックにおいて、前記動作主が時間t+1に訪問する前記ランドマークの滞在時間の確率分布のパラメータとを推定する
    請求項1に記載のパラメータ推定装置。
  4. 入力された特定の動作主に関する情報と、前記特定の動作主が時間tに訪問しているランドマークと、請求項3に記載のパラメータ推定装置によって推定された、前記動作主固有潜在トピック出現確率、前記潜在トピック固有ランドマーク出現確率、前記ランドマーク間遷移確率、及び前記ランドマークの滞在時間の確率分布のパラメータとに基づいて、
    前記特定の動作主が時間t+1に訪問するランドマークと該ランドマークでの滞在時間との組み合わせが起こる確率を算出する算出部
    を含む予測装置。
  5. 前記パラメータ推定部は、
    前記移動履歴情報と、前記モデルのパラメータとに基づいて、前記移動履歴情報に対する、前記モデルのパラメータの対数尤度関数を最大化するように、前記モデルのパラメータを推定することを繰り返す
    請求項1又は請求項3に記載のパラメータ推定装置。
  6. パラメータ推定部を含むパラメータ推定装置におけるパラメータ推定方法であって、
    前記パラメータ推定部が、
    複数の動作主の各々についての、前記動作主が訪問したランドマークを表す移動履歴情報に基づいて、
    前記複数の動作主の各々について、前記動作主の興味に対応する潜在トピックが該動作主に固有の潜在トピック比率に応じて選択され、選択された前記潜在トピックに固有のランドマークの確率分布と、前記動作主が時間tに訪問しているランドマークに固有のランドマークの確率分布とに従って、前記動作主が時間t+1に訪問するランドマークが生成されることを表すモデルのパラメータとして、前記複数の動作主の各々に対する、複数の前記潜在トピックの各々を前記動作主が選択する確率を表す動作主固有潜在トピック出現確率と、複数の前記潜在トピックの各々に対する、前記潜在トピックにおける複数の前記ランドマークの各々の選択されやすさを表す潜在トピック固有ランドマーク出現確率と、複数の前記ランドマークの各々に対する、前記ランドマークから複数の前記のランドマークの各々への移動しやすさを表すランドマーク間遷移確率とを推定するステップ
    を含むパラメータ推定方法。
  7. 算出部を含む予測装置における予測方法であって、
    前記算出部が、入力された特定の動作主に関する情報と、前記特定の動作主が時間tに訪問しているランドマークと、請求項6に記載のパラメータ推定方法によって推定された、前記動作主固有潜在トピック出現確率、前記潜在トピック固有ランドマーク出現確率、及び前記ランドマーク間遷移確率とに基づいて、
    前記特定の動作主が時間t+1に訪問するランドマークの選択確率を算出するステップ
    を含む予測方法。
  8. コンピュータを、請求項1、請求項3、及び請求項5の何れか1項に記載のパラメータ推定装置、あるいは請求項2又は請求項4に記載の予測装置の各部として機能させるためのプログラム。
JP2015209244A 2015-10-23 2015-10-23 パラメータ推定装置、予測装置、方法、及びプログラム Active JP6433876B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015209244A JP6433876B2 (ja) 2015-10-23 2015-10-23 パラメータ推定装置、予測装置、方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015209244A JP6433876B2 (ja) 2015-10-23 2015-10-23 パラメータ推定装置、予測装置、方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2017083963A true JP2017083963A (ja) 2017-05-18
JP6433876B2 JP6433876B2 (ja) 2018-12-05

Family

ID=58711168

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015209244A Active JP6433876B2 (ja) 2015-10-23 2015-10-23 パラメータ推定装置、予測装置、方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP6433876B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021251056A1 (ja) * 2020-06-08 2021-12-16 株式会社Nttドコモ 学習装置
CN117555815A (zh) * 2024-01-11 2024-02-13 腾讯科技(深圳)有限公司 参数预测方法、模型训练方法和相关装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012079120A (ja) * 2010-10-01 2012-04-19 Nippon Telegr & Teleph Corp <Ntt> ランドマーク推薦装置及び方法及びプログラム
JP2012133583A (ja) * 2010-12-21 2012-07-12 Nippon Telegr & Teleph Corp <Ntt> ランドマーク推薦装置及び方法及びプログラム
JP2015014878A (ja) * 2013-07-04 2015-01-22 株式会社Nttドコモ 滞在推定装置、及び滞在推定方法
JP2015095084A (ja) * 2013-11-12 2015-05-18 日本電信電話株式会社 訪問poi推定装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012079120A (ja) * 2010-10-01 2012-04-19 Nippon Telegr & Teleph Corp <Ntt> ランドマーク推薦装置及び方法及びプログラム
JP2012133583A (ja) * 2010-12-21 2012-07-12 Nippon Telegr & Teleph Corp <Ntt> ランドマーク推薦装置及び方法及びプログラム
JP2015014878A (ja) * 2013-07-04 2015-01-22 株式会社Nttドコモ 滞在推定装置、及び滞在推定方法
JP2015095084A (ja) * 2013-11-12 2015-05-18 日本電信電話株式会社 訪問poi推定装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
倉島 健: "行動範囲と興味の同時推定モデルによる地域情報推薦", 情報処理学会論文誌 論文誌トランザクション 2012(平成24)年度▲2▼ [CD−ROM], vol. 第6巻, JPN6018042400, 15 April 2013 (2013-04-15), JP, pages 第30−41ページ *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021251056A1 (ja) * 2020-06-08 2021-12-16 株式会社Nttドコモ 学習装置
CN117555815A (zh) * 2024-01-11 2024-02-13 腾讯科技(深圳)有限公司 参数预测方法、模型训练方法和相关装置
CN117555815B (zh) * 2024-01-11 2024-04-30 腾讯科技(深圳)有限公司 参数预测方法、模型训练方法和相关装置

Also Published As

Publication number Publication date
JP6433876B2 (ja) 2018-12-05

Similar Documents

Publication Publication Date Title
US10783450B2 (en) Learning user preferences using sequential user behavior data to predict user behavior and provide recommendations
JP5917719B2 (ja) 画像データベースにおける画像管理のための方法、装置、および、コンピュータで読取り可能な記録媒体
Xu et al. Collaborative APIs recommendation for artificial intelligence of things with information fusion
US20100111372A1 (en) Determining user similarities based on location histories
JP6911603B2 (ja) ユーザによって訪問される施設のカテゴリの予測モデルを生成する方法、プログラム、サーバ装置、及び処理装置
JP5389688B2 (ja) 場所存在確率算出装置及び方法及びプログラム及びトラベルルート推薦装置及び方法及びプログラム
JP6749282B2 (ja) 人流量予測装置、人流量予測方法、及び人流量予測プログラム
Xie et al. Graph-based metric embedding for next poi recommendation
US11954590B2 (en) Artificial intelligence job recommendation neural network machine learning training based on embedding technologies and actual and synthetic job transition latent information
CN102135983A (zh) 基于网络用户行为的群体划分方法和装置
Xu et al. Robust and automatic modeling of tunnel structures based on terrestrial laser scanning measurement
US20190287121A1 (en) Speculative check-ins and importance reweighting to improve venue coverage
CN115774819B (zh) 一种基于层次循环神经网络的兴趣点推荐方法及系统
JP6744767B2 (ja) 人流予測装置、パラメータ推定装置、方法、及びプログラム
JP6433876B2 (ja) パラメータ推定装置、予測装置、方法、及びプログラム
JP6807822B2 (ja) 人流量予測装置、方法、及びプログラム
Guo et al. Cosolorec: Joint factor model with content, social, location for heterogeneous point-of-interest recommendation
US11842299B2 (en) System and method using deep learning machine vision to conduct product positioning analyses
CN117435819A (zh) 时空动态感知的兴趣点推荐方法、系统和存储介质
JP5425050B2 (ja) ランドマーク推薦装置及び方法及びプログラム
JP6174527B2 (ja) 移動手段推定装置、その動作方法およびプログラム
RU2658876C1 (ru) Способ и сервер для обработки данных датчика беспроводного устройства для создания вектора объекта, связанного с физическим положением
CN113591986B (zh) 用于生成推荐模型的对象权值的方法和个性化推荐方法
JP6276722B2 (ja) 行動予測装置、行動予測方法及び行動予測プログラム
WO2019235370A1 (ja) 学習装置、予測装置、方法、及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20171214

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20181030

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20181026

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181107

R150 Certificate of patent or registration of utility model

Ref document number: 6433876

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150