JP2018180721A - 予測装置、方法、及びプログラム - Google Patents

予測装置、方法、及びプログラム Download PDF

Info

Publication number
JP2018180721A
JP2018180721A JP2017075884A JP2017075884A JP2018180721A JP 2018180721 A JP2018180721 A JP 2018180721A JP 2017075884 A JP2017075884 A JP 2017075884A JP 2017075884 A JP2017075884 A JP 2017075884A JP 2018180721 A JP2018180721 A JP 2018180721A
Authority
JP
Japan
Prior art keywords
probability
target
operator
prediction
topic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017075884A
Other languages
English (en)
Other versions
JP6723187B2 (ja
Inventor
翔一 長野
Shoichi Nagano
翔一 長野
塩原 寿子
Toshiko Shiobara
寿子 塩原
宮本 勝
Masaru Miyamoto
勝 宮本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2017075884A priority Critical patent/JP6723187B2/ja
Publication of JP2018180721A publication Critical patent/JP2018180721A/ja
Application granted granted Critical
Publication of JP6723187B2 publication Critical patent/JP6723187B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】動作主の特徴量に欠損がある場合や、特徴量の種類が変化した場合であっても、学習プロセスを再計算することなく、動作主の行動を精度よく予測することができるようにする。【解決手段】推薦部30が、予測対象の動作主の特徴量を入力とし、各動作主から、予測対象の動作主の特徴量が示す複数の特徴のうちの少なくとも1つが同じ値となる動作主を規定数分だけ選択し、選択した前記規定数分の動作主の各々が各潜在トピックを選択する確率に基づいて、予測対象の動作主が各潜在トピックを選択する確率を推定し、予測対象の動作主が各潜在トピックを選択する確率と、予測対象の動作主の現在位置と、ある訪問場所の次に各訪問場所が選択される確率と、各潜在トピックにおける各訪問場所の選択確率と、に基づいて、予測対象の動作主が次に訪問する訪問場所を予測する。【選択図】図3

Description

本発明は、予測装置、方法、及びプログラムに関する。
従来技術1として、動作主が訪問場所を訪れた移動履歴情報の集合を学習データとして、トピックモデルを用いて動作主の行動をモデル化し、動作主が次に訪れる訪問場所を予測する方法がある。トピックモデルにおいては、学習データが“ある動作主が訪れる各場所は、ユーザ固有の潜在トピック比率に従ってある潜在トピックを選択した後、その潜在トピックに固有の訪問場所出現確率分布に従って生成された”と仮定して、動作主の行動を確率モデルで表現することで、次に訪れる地点を予測する(非特許文献1)。
また、従来技術2として、例えば、複数人に関する移動履歴情報集合の傾向から、訪問場所Aを訪れた人の多くはその近くの訪問場所Bを訪れる、とった訪問場所間の遷移のしやすさをマルコフモデルでモデル化することで、動作主が次に訪れる訪問場所を予測する方法がある(非特許文献2)。
なお、訪問場所とは、屋内外を問わず、位置座標(緯度・経度など)に関連づけられた建物、寺社・仏閣、レストラン、商業施設、展示などの場所を意味する総称とする。
T. Hofmann.,"Probabilistic Latent Semantic Analysis", in Proc. Conf. on Uncertainty in Artificial Intelligence (UAI), pp. 289-296 (1999). D. Ashbrook and T. starner, "Using GPS to Learn Significant Locations and Predict Movement Across Multiple User"s, in Personal and ubiquitous computing, Vol.7, No. 5, pp.275-286 (2003).
上記非特許文献2に記載の従来技術2は、距離的な近さを反映した訪問場所間の遷移のモデル化である。従って、ある訪問場所Aを訪れた人が、その近辺に存在する訪問場所Bも“近いから訪れた”場合には、うまく予測を行うことができる。しかし、ある訪問場所Aを訪れた人が、訪問場所Aからは遠いけれど“興味があるため訪問場所Cをわざわざ訪れた”といった場合に、うまく予測を行うことができなかった。
一方で、上記非特許文献1に記載の従来技術1であるトピックモデルは、「アート」、「スポーツ」、「人気」、「おしゃれ」といった訪問場所の“特徴”でつながる訪問場所集合をまとめる潜在トピックと、潜在トピックに対する動作主の興味(重み)を学習することを目的とした技術である。従来技術1により、潜在トピックとそれに対する動作主の興味がうまく学習できれば、遠いけれど、興味があるため訪れた訪問場所Cを予測することができる。しかし、従来技術1は、すべての訪問場所の訪問が動作主に固有の興味によって生成されたと仮定している。つまり、すべての訪問場所の訪問事象は、“興味があるためわざわざ訪れた”の記録である場合にのみ有効な技術である。実際の移動履歴は、“近いから訪れた”と“興味があるためわざわざ訪れた”が混在して観測される。従来技術1はその二つの影響成分を分離する方法がないため、“近いから訪れた”観測データがノイズとして混入し、潜在トピック、及び、動作主固有の興味情報の抽出精度を低下させていた。従って、動作主が次に訪れる訪問場所の予測精度も低かった。
また、既知のユーザ特徴量を機械学習のパラメータ推定プロセスに組み込むことが考えられる。
この様にユーザ特徴量を利用して情報推薦を行う場合、次のような問題点がある。
ユーザ特徴量が多種である場合や学習元のユーザ集団にユーザ特徴量の欠損がある場合、多重共線性により、従来技術は推薦精度が低下する、という問題点がある。
また、ユーザ特徴量の種類が変化したとき、従来技術は学習プロセスを再計算する必要があるため、計算時間がかかる、という問題点がある。
本発明は、上記の点に鑑みてなされたものであり、動作主の特徴量に欠損がある場合や、特徴量の種類が変化した場合であっても、学習プロセスを再計算することなく、動作主の行動を精度よく予測することができる予測装置、方法、及びプログラムを提供することを目的とする。
上記目的を達成するために、本発明に係る予測装置は、予測対象の動作主が次に訪問する訪問場所を予測する予測装置であって、各動作主の複数の特徴を示す特徴量と、ある訪問場所の次に各訪問場所が選択される確率と、興味に対応する各潜在トピックにおける各訪問場所の選択確率と、各動作主が各潜在トピックを選択する確率と、を記憶する推定パラメータ記憶部と、前記予測対象の動作主の前記特徴量を入力とし、各動作主から、前記予測対象の動作主の特徴量が示す複数の特徴のうちの少なくとも1つが同じ値となる動作主を規定数分だけ選択し、前記選択した前記規定数分の動作主の各々が各潜在トピックを選択する確率に基づいて、前記予測対象の動作主が各潜在トピックを選択する確率を推定し、前記予測対象の動作主が各潜在トピックを選択する確率と、前記予測対象の動作主の現在位置と、ある訪問場所の次に各訪問場所が選択される確率と、各潜在トピックにおける各訪問場所の選択確率と、に基づいて、前記予測対象の動作主が次に訪問する訪問場所を予測し、推薦結果として出力する推薦部と、を含んで構成されている。
本発明に係る予測方法は、各動作主の複数の特徴を示す特徴量と、ある訪問場所の次に各訪問場所が選択される確率と、興味に対応する各潜在トピックにおける各訪問場所の選択確率と、各動作主が各潜在トピックを選択する確率と、を記憶する推定パラメータ記憶部と、推薦部とを含み、予測対象の動作主が次に訪問する訪問場所を予測する予測装置における予測方法であって、前記推薦部が、前記予測対象の動作主の前記特徴量を入力とし、各動作主から、前記予測対象の動作主の特徴量が示す複数の特徴のうちの少なくとも1つが同じ値となる動作主を規定数分だけ選択し、前記選択した前記規定数分の動作主の各々が各潜在トピックを選択する確率に基づいて、前記予測対象の動作主が各潜在トピックを選択する確率を推定し、前記予測対象の動作主が各潜在トピックを選択する確率と、前記予測対象の動作主の現在位置と、ある訪問場所の次に各訪問場所が選択される確率と、各潜在トピックにおける各訪問場所の選択確率と、に基づいて、前記予測対象の動作主が次に訪問する訪問場所を予測し、推薦結果として出力する。
また、本発明のプログラムは、コンピュータを、上記の予測装置の各部として機能させるためのプログラムである。
以上説明したように、本発明の予測装置、方法、及びプログラムによれば、各動作主から、前記予測対象の動作主の特徴量が示す複数の特徴のうちの少なくとも1つが同じ値となる動作主を規定数分だけ選択し、前記選択した前記規定数分の動作主の各々が各潜在トピックを選択する確率に基づいて、前記予測対象の動作主が各潜在トピックを選択する確率を推定し、前記予測対象の動作主が次に訪問する訪問場所を予測することにより、動作主の特徴量に欠損がある場合や、特徴量の種類が変化した場合であっても、学習プロセスを再計算することなく、動作主の行動を精度よく予測することができる、という効果が得られる。
動作主が次に訪問する場所を予測する処理の入力データを説明するための説明図である。 本発明の実施の形態における予測装置の入出力を説明するための説明図である。 本発明の実施の形態における予測装置のブロック図である。 本発明の実施の形態における予測装置の入出力の具体例を説明するための説明図である。 本発明の実施の形態における予測装置の予測処理ルーチンを示すフローチャートである。 本発明の実施の形態における予測装置のパラメータ推定処理の処理ルーチンを示すフローチャートである。 本発明の実施の形態における予測装置の推薦処理の処理ルーチンを示すフローチャートである。 本発明の実施の形態における予測装置の新規ユーザのトピック選択確率を算出する処理の処理ルーチンを示すフローチャートである。 本発明の実施の形態における予測装置のフィードバック処理の処理ルーチンを示すフローチャートである。
本発明の実施の形態は、個人の移動履歴情報に基づいて、その人が将来的に訪れる訪問場所を予測する装置に関連する。
以下、図面を参照して本発明の実施の形態を詳細に説明する。
<概要>
本発明の実施の形態に係る予測装置では、新たな動作主のユーザ特徴量から、新たな動作主が次に訪問する訪問場所を予測し、推薦結果として出力する。学習データとしては、過去の動作主群の訪問履歴及び特徴量の情報を用いる。
また、予測装置は、推薦の際、ユーザ特徴量と動作主群をランダムに削ぎ落とし、複数の推薦結果を一時的に作成、統合する機構を有している。すなわち、図1に示すように、ユーザ特徴量の一部、動作主群の一部をサンプルした弱い学習器(データA、B、C)を複数作ることで、多種のユーザ特徴量に対応する。そのため、多重共線性の問題を回避できる。
また、推薦のプロセスが学習プロセスと独立に存在するため、新たなユーザ特徴量を扱う場合も学習プロセスを再計算する必要がない。
<本発明の実施の形態に係る予測装置の構成>
次に、本発明の実施の形態に係る予測装置の構成について説明する。図2に示すように、本発明の実施の形態に係る予測装置100は、過去の動作主群の訪問履歴及びユーザ特徴量と、訪問場所間の距離情報である地理情報と、新規の動作主の訪問履歴及びユーザ特徴量と、を入力とし、当該新規の動作主が次に訪問する訪問場所の予測訪問リストを、推薦結果として出力する。
本発明の実施の形態に係る予測装置100は、CPUと、RAMと、後述する各処理ルーチンを実行するためのプログラムや各種データを記憶したROMと、を含むコンピュータで構成することが出来る。この予測装置100は、機能的には図3に示すように、入力部10と、演算部20と、出力部40とを備えている。
入力部10は、過去の動作主群の訪問履歴及びユーザ特徴量と、訪問場所間の距離情報である地理情報と、新規の動作主の訪問履歴及びユーザ特徴量と、を受け付ける。
また、入力部10は、ユーザによって指定された潜在トピック数Zを受け付ける。潜在トピック数Zは、後述するパラメータ推定部26で用いられる変数である。
演算部20は、訪問履歴ユーザ特徴量記憶部22と、地理情報記憶部24と、パラメータ推定部26と、推定パラメータ記憶部28と、推薦部30と、フィードバック部32とを備えている。
訪問履歴ユーザ特徴量記憶部22は、入力された過去の動作主群の訪問履歴及び新規の動作主の訪問履歴を格納した訪問履歴D1と、入力された過去の動作主群のユーザ特徴量及び新規の動作主のユーザ特徴量を格納したユーザ特徴量D2を記憶している(図4参照)。
地理情報記憶部24は、入力された、訪問場所間の距離情報を含む地理情報D3を記憶している(図4参照)。
この訪問履歴D1、ユーザ特徴量D2、及び地理情報D3に基づき、新規ユーザの予測訪問ランキングD4が作成され、出力部40により提示される。
ここで訪問履歴D1には、過去の動作主群及び新規の動作主であるユーザ毎に訪問場所リストが記録され、訪問場所リストにはユーザの訪問場所が時系列に記録されている。例えばユーザ1については訪問場所A→B→Cと記録され、ユーザ2については訪問場所A→Dと記録されている。
ユーザ特徴量D2には、過去の動作主群及び新規の動作主であるユーザ毎に性別フラグ・年齢・アンケート結果などの個人を数値で表現できるデータが記録されている。例えばユーザ1については性別フラグ「1(男性)」・年齢「33」・アンケート回答「1」などが記録され、ユーザ2については性別フラグ「0(女性)」・年齢「27」・アンケート結果「0」などが記録されている。なお、訪問履歴D1、ユーザ特徴量D2については、各ユーザの所有する個人端末から入力された情報を用いてもよく、あるいは図示省略のデータベースに格納された情報を用いてもよい。
地理情報D3は、訪問場所(ランドマークなど)毎に他の訪問場所との間の距離情報が記録されている。例えば訪問場所Aについては訪問場所Bとの距離情報「2」が記録され、訪問場所Bについては訪問場所Aとの距離情報「2」が記録されている。
新規ユーザの予測訪問ランキングD4には新規の動作主について予測される訪問場所が記録されている。例えば1位の予測訪問場所Eと2位の予測訪問場所Cが記録されている。
<予測装置100の処理内容>
予測装置100は、図5に示すように、処理を開始すると動作主の次に訪れる訪問場所を予測するためのパラメータを推定するパラメータ推定処理(S01)と、推定されたパラメータに基づき新規ユーザの予測訪問ランキングD4を作成する推薦処理(S02)と、推薦結果に対するユーザからのフィードバックに応じて所定のパラメータを更新するフィードバック処理(S03)とを実行する。このS01の処理は、パラメータ推定部26にて実行する。なお、処理の開始は、基本的には新規の動作主の要請を受けて開始するが、定期的にバッチ処理してもよいものとする。
(1)パラメータ推定処理(S01)
パラメータ推定部26によるパラメータ推定処理では、入力された潜在トピック数Zと、訪問履歴ユーザ特徴量記憶部22に記憶された過去の動作主群の訪問履歴D1、ユーザ特徴量D2と、地理情報記憶部24に記憶された地理情報D3とに基づいて、ある訪問場所の次に各訪問場所が選択される確率Λと、興味に対応する各潜在トピックにおける各訪問場所の選択確率Фと、各動作主が各潜在トピックを選択する確率θと、動作主が各潜在トピックを選択する確率の分布を表すパラメータであって、かつ、ユーザ特徴量と潜在トピックとの関係を表わすパラメータαとを推定する。
図6に基づきパラメータ推定処理(S01)の詳細を説明する。本実施の形態では、MCMC(Markov chain Monte Carlo methods)を用いて、パラメータを推定する場合を例に説明する。
表1は、パラメータの記号を示している。なお、パラメータ(Z,ФΛ,α)については、事前に初期値が決定されているものとする。
S11:処理が開始されると、パラメータ推定部26は、「Z(トピック集合)」を更新する。すなわち、過去の動作主群に含まれる各動作主の各時点における訪問の潜在トピックを一つ一つランダム発生(ギブスサンプル)で更新する。
この更新手順を説明すれば、初回の更新時のみ、各動作主の訪問「wum」に対して、ランダムに潜在トピック「Zum」を決定する(S11−0)。ここで訪問「wum」は動作主「u」の「m」番目の訪問場所を示し、潜在トピック「Zum」は訪問「wum」時の興味(トピック)を示している。
また、ある動作主のある訪問「wum」をピックアップし(S11−1)、さらに所与のトピックそれぞれの確からしさ「post1,post2,...,postZ」を算出する(S11−2)。ここでは確からしさを示す尤度、厳密には尤度比を式1により算出する。

・・・式1
なお、式1の左項は式1−1のように展開され、式1の右項は式1−2のように展開される。ここでは定数を省くと枠部分のみが残る。これら3つの積が「post」となる(他の定数部分を含めても結果は同じとなる。)。

・・・式1左項

・・・式1右項
その後に「0」から「sum(post1, post2,...,postZ)」までの一様乱数Rを発生させ、「sum(post1, post2,...,postH)<R<sum(post1, post2,...,)postH+1」となる「H」を探索する(S11−3)。このとき、0<R<post1であれば「H」を0とする。
続いて訪問「wum」の潜在トピック「Zum」を「H+1」とし、過去の動作主に含まれる全ユーザの訪問「X」に対してS11−1〜S11−の処理を行ったか否かを確認し(S11−4)、確認の結果、該処理を行っていなければS11−1に戻る。
一方、該処理を行っていれば式2に基づいて各動作主u及び各トピックzに対して「θuz(動作主uがトピックzを選択する確率)」を算出し(S11−5)、S11の処理を終了する。

・・・式2
S12:つぎに最適化アルゴリズムにより「ФΛ(各トピックに対する各訪問場所の選択確率,ある訪問場所の次に各訪問場所が選択される確率)」を更新する。ここで「Φzi」と「λij」に関しては、閉形式で直接求めることができないため、準ニュートン法などの最適化手法を用いて求める。最適化手法で用いる式3(対数尤度関数)で、これを最大化する(式3中の左項は式1を参照、式3中の右項は式4を参照)。

・・・式3

・・・式4
なお、L−BFGS法(準ニュートン法)を使用する場合の「λij」と「Φki」の勾配は、式5と式6とで計算する。

・・・式5

・・・式6
S13:さらにMHアルゴリズムにより、「α」の各要素を更新する。この「α」は、「特徴数×トピック数」の要素で構成され、ここではそれぞれ「αDZ」と表す。
この更新の手順を説明すれば、まず「α」要素の一つの「αDZ」をピックアップする(S13−1)。ここでピックアップされた「αDZ+e」を「αnew」に代入し、要素の更新候補を作成する(S13−2)。これ以降はピックアップされた「αDZ」を「αold」と表す。なお、「e」は「0」を平均とした正規分布ノイズを示し、分散は任意の設定でよいものとする。
その後、「αnew」と「αold」とを式6に代入し、採択率Uを求める(S13−3)。なお、式7では、「α」の「z」にかかる係数行列(α1z,α2z,...,αDz)を「αz」と表記し、「αnew」の「αz」を「αnew z」と表記し、採択率Uをf(αnewαold)と表記している。

・・・式7
また、「0〜1」の一様乱数Rを発生させ、「R<U」が成立するか否かを確認する(S13−4)。この確認の結果、成立していれば「αnew」を「αDZ」として採用する一方、成立していなければ「αold」を「αDZ」に戻す。
さらに全ての「α」要素に対してS13−1〜S13-4の処理を行ったか否かを確認する(S13−5)。確認の結果、行っていなければS13−1に戻る一方、行っていればS13の処理、即ち「α」の更新を終了してS14に進む。なお、「α」の各要素の更新は、S13-1〜S13-5には限定されず、複数の「α」要素を同時に更新してもよく、あるいは独立連鎖MHによる方法でもよい。
S14,S15:S11〜S13の更新回数がバーンイン規定値(例えば60000回)に達したか否かを確認する(S14)。確認の結果、バーンイン規定値に達していなければS11に戻る一方、バーンイン規定値に達していればパラメータ(Z,ФΛ,α)を推定パラメータ記憶部28に保存する(S15)。
S16:S15で保存されたパラメータ(Z,ФΛ,α)の更新回数がサイクル規定値に達したか否かを確認する。確認の結果、サイクル規定値に達していなければS11に戻る一方、サイクル規定値に達していれば処理を終了する。
(2)推薦処理(S02)
推薦部30による推薦処理では、新規の動作主のユーザ特徴量を入力とし、過去の動作主群から、新規の動作主の欠損でないユーザ特徴量のうちの選択された規定数分のユーザ特徴量が同じ値となる動作主を規定数分だけ選択し、選択した規定数分の動作主の各々が各潜在トピックを選択する確率θuzに基づいて、新規の動作主が各潜在トピックを選択する確率を推定する。また、新規の動作主が各潜在トピックを選択する確率と、新規の動作主の現在位置と、ある訪問場所の次に各訪問場所が選択される確率Λと、各潜在トピックにおける各訪問場所の選択確率Фと、に基づいて、新規の動作主が次に訪問する訪問場所を予測し、推薦結果として出力する。
図7に基づき推薦部30による推薦処理を説明する。ここではパラメータ推定処理(S01)において推定されたパラメータ(θuz,ФΛ)を用いる。
S21:まず、処理が開始されると、推薦部30は、パラメータ推定処理(S01)にて取得した過去の動作主群のパラメータθuzに基づいて、新規の動作主についてのパラメータθuzを作成する。
図8に基づき推薦部30によるパラメータ作成処理(S21)の詳細を説明する。
S31:新規の動作主のユーザ特徴量から欠損のないものを取得する。
S32:上記S31で取得したユーザ特徴量から、規定数分の種類のユーザ特徴量をランダムに選出する。本実施の形態では、選出されるユーザ特徴量に重みRを設け、重みRに従って、規定数分の種類のユーザ特徴量を選出する。ここで、重みRは、ユーザ特徴量の種類数の要素を持つ行列であり、要素の値に比例して当該ユーザ特徴量が選出されやすくなることを示している。また、後述するフィードバック処理が行われていない場合、重みRにデフォルト値が設定されている。たとえば重みR=(1,1,...,1)である。
S33:過去の動作主群のうちの、上記S32で選出されたユーザ特徴量の全てが、新規の動作主と同じ値となる動作主から、規定数分の動作主を選出し、Uとおく。
S34:上記S32で選出された規定数分のユーザ特徴量profd∈(prof1,...,profend)と選出された規定数分の動作主u∈Uを用いて、上記式8、9に基づき、新規の動作主のユーザ特徴量profを条件とした潜在トピックzの選択確率P(z|prof)を計算し、行列Μを作成する。

・・・式8

・・・式9
ただし、Prof1,・・・Profdは、ユーザ特徴量を示しており、例えば、性別=男性などを示している。また、式9の上項はprofdを有する選択された全ユーザ(U(profd))のθzの総積であり、下項は上項の総和が1となるように掛ける正規化項である。
S35:行列Mの各行の総積に正規化項を掛けたものを新規ユーザのθ新規ユーザ,Zとする(式10)。

・・・式10
S36:規定数分のループに達していない(または、規定の処理時間以内)の場合、S31に戻り、再度ランダムサンプルを行う。規定数分のループを回した場合(または、規定の処理時間に到達した場合)、各ループのθ新規ユーザ,Zの平均値を、最終的なθ新規ユーザ,Zとする。また、このとき使用したユーザ特徴量の各ループ累積値Cを保存しておく。
S22:推薦部30は、パラメータ推定処理(S01)にて取得したパラメータ(Ф,Λ)と、上記S21で求めたθ新規ユーザ,Zと、現在位置Xとを式11に代入し、各移動先の訪問場所itへの確率を算出し、移動先の訪問場所itへの確率ランキングを作成する。ただし、現在位置Xが欠損であれば、枠部分は削除する。

・・・式11
そして、ランキング順に規定数の移動先の訪問場所を出力部40により出力する。
(3)フィードバック処理(S03)
図9に基づきフィードバック部32によるフィードバック処理を説明する。ここでは上記S36で得られたユーザ特徴量の各ループ累積値Cを用いる。
S41:まず、処理が開始されると、フィードバック部32は、新規ユーザから、出力部40により出力された推薦結果(移動先の訪問場所のランキング)に対して、入力部10を介して、ポジティブなフィードバックを得たか否かを判定し、ポジティブなフィードバックを得たときには、上記S36で得られたユーザ特徴量の各ループ累積値Cを取得する。例えば、移動先の訪問場所のランキングの上位の移動先の訪問場所に新規の動作主が移動することを示す入力があった場合や、移動先の訪問場所のランキングに対して、「いいね」を示すフィードバック入力があった場合に、ポジティブなフィードバックを得たと判断する。
S42:フィードバック部32は、ユーザ特徴量の各ループ累積値Cと、重みR(式5ではRold)、フィードバック補正値w(例えば、w=0.5)を用いて、式12に従って重みRnewを算出し、重みRに再設定する。
new=Rold+wC ・・・式12
以上説明したように、本発明の実施の形態に係る予測装置によれば、パラメータを推定した過去の動作主群から、新規の動作主についての欠損でないユーザ特徴量のうちの選択された規定数分のユーザ特徴量が同じ値となる動作主を規定数分だけ選択し、選択した規定数分の動作主の各々が各潜在トピックを選択する確率に基づいて、新規の動作主が各潜在トピックを選択する確率を推定する。また、新規の動作主が各潜在トピックを選択する確率と、新規の動作主の現在位置と、ある訪問場所の次に各訪問場所が選択される確率と、各潜在トピックにおける各訪問場所の選択確率と、に基づいて、新規の動作主が次に訪問する訪問場所を予測することにより、新規の動作主のユーザ特徴量に欠損がある場合であっても、学習プロセスを再計算することなく、動作主の行動を精度よく予測することができる。
また、ユーザ特徴量の種類が追加される等、ユーザ特徴量の種類が変化した場合であっても、学習プロセスを再計算することなく、動作主の行動を精度よく予測することができる。この場合には、過去の動作主群、新規の動作主のそれぞれについて同様に、ユーザ特徴量の種類が追加されることになる。
また、多種のユーザ特徴量を扱うことができ、かつ、扱うユーザ特徴量の変化に計算時間を要しない、頑健な推薦を行うことができる。
また、過去の動作主群のパラメータ推定結果を用いて、新規の動作主の訪問場所を予測して、推薦することができる。
また、新規の動作主のパラメータを推定する際に利用するユーザ特徴量と動作主群を制限した弱い学習を複数実施し、統合するため、欠損データ、無効な特徴量に強い、訪問場所の推薦を行うことができる。
また、有効性が担保されない多数のユーザ特徴量を扱う案件において、高い精度の推薦を行うことができる。例えば、性別、年齢、身長制限、希望アトラクション、同伴者、出身県、回遊タイプなど多数のユーザ特徴量を扱う案件にも適用することができる。
なお、本発明は、上述した実施形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。
例えば、上記実施の形態においては、MCMC(Markov chain Monte Carlo methods)を用いて、過去の動作主群のパラメータを推定する場合を例に説明したが、これに限定されるものではない。例えば、EMアルゴリズムを用いて、過去の動作主群のパラメータを推定するようにしてもよい。
また、過去の動作主群のパラメータを推定する際に、訪問場所と当該訪問場所での滞在時間との組み合わせが起こる確率を含むパラメータを推定するようにしてもよい。
また、訪問履歴から得られる「訪問場所Aを訪問した」という特徴量も、ユーザ特徴量として扱ってもよい。この場合には、上記式9ではなく、P(topic|訪問場所Aを訪問した)をEXP(Φtopic,訪問場所A)とすればよい。
また、上記実施の形態においては、予測装置100によって、パラメータを推定し、新規の動作主の訪問場所を予測する場合を例に説明したが、これに限定されるものではなく、予測装置100とは別の装置(例えば、パラメータ推定装置)によって、パラメータを推定するようにしてもよい。この場合には、パラメータ推定装置は、入力部10、訪問履歴ユーザ特徴量記憶部22、地理情報記憶部24、パラメータ推定部26、及び推定パラメータ記憶部28を備えるようにすればよい。
また、訪問履歴ユーザ特徴量記憶部22、地理情報記憶部24、及び推定パラメータ記憶部28の少なくとも1つは、外部に設けられ、予測装置100とネットワークで接続されていてもよい。
また、上述の予測装置100は、内部にコンピュータシステムを有しているが、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、本願明細書中において、プログラムが予めインストールされている実施形態として説明したが、当該プログラムを、コンピュータ読み取り可能な記録媒体に格納して提供することも可能であるし、ネットワークを介して提供することも可能である。
10 入力部
20 演算部
22 訪問履歴ユーザ特徴量記憶部
24 地理情報記憶部
26 パラメータ推定部
28 推定パラメータ記憶部
30 推薦部
32 フィードバック部
40 出力部
100 予測装置

Claims (7)

  1. 予測対象の動作主が次に訪問する訪問場所を予測する予測装置であって、
    各動作主の複数の特徴を示す特徴量と、ある訪問場所の次に各訪問場所が選択される確率と、興味に対応する各潜在トピックにおける各訪問場所の選択確率と、各動作主が各潜在トピックを選択する確率と、を記憶する推定パラメータ記憶部と、
    前記予測対象の動作主の前記特徴量を入力とし、各動作主から、前記予測対象の動作主の特徴量が示す複数の特徴のうちの少なくとも1つが同じ値となる動作主を規定数分だけ選択し、前記選択した前記規定数分の動作主の各々が各潜在トピックを選択する確率に基づいて、前記予測対象の動作主が各潜在トピックを選択する確率を推定し、
    前記予測対象の動作主が各潜在トピックを選択する確率と、前記予測対象の動作主の現在位置と、ある訪問場所の次に各訪問場所が選択される確率と、各潜在トピックにおける各訪問場所の選択確率と、に基づいて、前記予測対象の動作主が次に訪問する訪問場所を予測し、推薦結果として出力する推薦部と、
    を含む予測装置。
  2. 前記推薦部は、
    前記予測対象の動作主の特徴量が示す複数の特徴のうちの規定数分の特徴を選択し、各動作主から、前記選択された規定数分の特徴が前記予測対象の動作主と同じ値となる動作主を規定数分だけ選択し、前記選択した前記規定数分の動作主が各潜在トピックを選択する確率に基づいて、前記予測対象の動作主が各潜在トピックを選択する確率を推定することを繰り返し、
    繰り返し推定された前記予測対象の動作主が各潜在トピックを選択する確率に基づいて、前記予測対象の動作主が各潜在トピックを選択する確率を推定する請求項1記載の予測装置。
  3. 前記推薦部は、前記予測対象の動作主の特徴量が示す複数の特徴のうちの規定数分の特徴を選択する際に、前記複数の特徴の各々が選択される確率に従って、前記規定数分の特徴を選択し、
    前記推薦結果の出力に対して良いフィードバックが入力された場合、前記推薦部による繰り返し推定において前記複数の特徴の各々が選択された回数を用いて、前記複数の特徴の各々が選択される確率を更新するフィードバック部を更に含む請求項2記載の予測装置。
  4. 各動作主が訪問した訪問場所を表す移動履歴情報に基づいて、ある訪問場所の次に各訪問場所が選択される確率と、興味に対応する各潜在トピックにおける各訪問場所の選択確率と、各動作主が各潜在トピックを選択する確率とを推定するパラメータ推定部を更に含む請求項1〜請求項3の何れか1項記載の予測装置。
  5. 各動作主の複数の特徴を示す特徴量と、ある訪問場所の次に各訪問場所が選択される確率と、興味に対応する各潜在トピックにおける各訪問場所の選択確率と、各動作主が各潜在トピックを選択する確率と、を記憶する推定パラメータ記憶部と、推薦部とを含み、予測対象の動作主が次に訪問する訪問場所を予測する予測装置における予測方法であって、
    前記推薦部が、前記予測対象の動作主の前記特徴量を入力とし、各動作主から、前記予測対象の動作主の特徴量が示す複数の特徴のうちの少なくとも1つが同じ値となる動作主を規定数分だけ選択し、前記選択した前記規定数分の動作主の各々が各潜在トピックを選択する確率に基づいて、前記予測対象の動作主が各潜在トピックを選択する確率を推定し、
    前記予測対象の動作主が各潜在トピックを選択する確率と、前記予測対象の動作主の現在位置と、ある訪問場所の次に各訪問場所が選択される確率と、各潜在トピックにおける各訪問場所の選択確率と、に基づいて、前記予測対象の動作主が次に訪問する訪問場所を予測し、推薦結果として出力する
    予測方法。
  6. 前記推薦部が推定することでは、前記予測対象の動作主の特徴量が示す複数の特徴のうちの規定数分の特徴を選択し、各動作主から、前記選択された規定数分の特徴が前記予測対象の動作主と同じ値となる動作主を規定数分だけ選択し、前記選択した前記規定数分の動作主が各潜在トピックを選択する確率に基づいて、前記予測対象の動作主が各潜在トピックを選択する確率を推定することを繰り返し、
    繰り返し推定された前記予測対象の動作主が各潜在トピックを選択する確率に基づいて、前記予測対象の動作主が各潜在トピックを選択する確率を推定する請求項5記載の予測方法。
  7. コンピュータを、請求項1〜請求項4の何れか1項に記載の予測装置の各部として機能させるためのプログラム。
JP2017075884A 2017-04-06 2017-04-06 予測装置、方法、及びプログラム Active JP6723187B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017075884A JP6723187B2 (ja) 2017-04-06 2017-04-06 予測装置、方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017075884A JP6723187B2 (ja) 2017-04-06 2017-04-06 予測装置、方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2018180721A true JP2018180721A (ja) 2018-11-15
JP6723187B2 JP6723187B2 (ja) 2020-07-15

Family

ID=64276648

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017075884A Active JP6723187B2 (ja) 2017-04-06 2017-04-06 予測装置、方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP6723187B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7358567B1 (ja) 2022-06-16 2023-10-10 楽天グループ株式会社 情報処理装置、情報処理方法、およびプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7358567B1 (ja) 2022-06-16 2023-10-10 楽天グループ株式会社 情報処理装置、情報処理方法、およびプログラム
JP2023183462A (ja) * 2022-06-16 2023-12-28 楽天グループ株式会社 情報処理装置、情報処理方法、およびプログラム

Also Published As

Publication number Publication date
JP6723187B2 (ja) 2020-07-15

Similar Documents

Publication Publication Date Title
Fonte et al. Assessing VGI data quality
CN105532030B (zh) 用于分析目标实体的移动的装置、系统和方法
Liu et al. Predicting the next location: A recurrent model with spatial and temporal contexts
Bagci et al. Context-aware friend recommendation for location based social networks using random walk
JP6761789B2 (ja) 人流予測装置、システムおよびプログラム
Farah et al. Bayesian emulation and calibration of a dynamic epidemic model for A/H1N1 influenza
CN110309434B (zh) 一种轨迹数据处理方法、装置以及相关设备
US11205128B2 (en) Inferred profiles on online social networking systems using network graphs
CN110543935B (zh) 处理交互序列数据的方法及装置
JP6570031B2 (ja) 漁場予測装置、漁場予測システム、海洋環境データ共有装置および海洋環境データ共有システム
CN109948066A (zh) 一种基于异构信息网络的兴趣点推荐方法
CN110689110B (zh) 处理交互事件的方法及装置
CN111651671A (zh) 用户对象推荐方法、装置、计算机设备和存储介质
CN115238173B (zh) 基于大数据的行为分析与医疗服务推送方法、设备及介质
CN111783810A (zh) 用于确定用户的属性信息的方法和装置
CN113139140A (zh) 基于时空感知gru并结合用户关系偏好的旅游景点推荐方法
Doan et al. An attentive spatio-temporal neural model for successive point of interest recommendation
Yu et al. Multi-hop mobility prediction
JP6744767B2 (ja) 人流予測装置、パラメータ推定装置、方法、及びプログラム
JP6853968B2 (ja) パラメータ推定システム、パラメータ推定方法およびパラメータ推定プログラム
JP5798983B2 (ja) 場所評価システム、装置、方法及びプログラム
JP6723187B2 (ja) 予測装置、方法、及びプログラム
JP2017091511A (ja) 特定の空間領域内に位置する訪問者の関係網を分析する方法およびシステム
Liu et al. Efficient offline policy optimization with a learned model
CN113449176A (zh) 基于知识图谱的推荐方法及装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190722

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200529

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200616

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200623

R150 Certificate of patent or registration of utility model

Ref document number: 6723187

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150