JP2016018237A - 訪問poi推定装置およびその動作方法 - Google Patents

訪問poi推定装置およびその動作方法 Download PDF

Info

Publication number
JP2016018237A
JP2016018237A JP2014138548A JP2014138548A JP2016018237A JP 2016018237 A JP2016018237 A JP 2016018237A JP 2014138548 A JP2014138548 A JP 2014138548A JP 2014138548 A JP2014138548 A JP 2014138548A JP 2016018237 A JP2016018237 A JP 2016018237A
Authority
JP
Japan
Prior art keywords
poi
score
visit
visited
parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014138548A
Other languages
English (en)
Other versions
JP6190331B2 (ja
Inventor
良彦 数原
Yoshihiko Kazuhara
良彦 数原
浩之 戸田
Hiroyuki Toda
浩之 戸田
義昌 小池
Yoshimasa Koike
義昌 小池
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2014138548A priority Critical patent/JP6190331B2/ja
Publication of JP2016018237A publication Critical patent/JP2016018237A/ja
Application granted granted Critical
Publication of JP6190331B2 publication Critical patent/JP6190331B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】低コストで滞留点抽出と訪問POI推定の精度を向上させる。
【解決手段】重みパラメータ推定部11は、滞留点候補DB4における確信度、遷移スコアDB7におけるスコア、訪問POI数スコアDB8におけるスコア、ならびに、カテゴリ滞在時間パラメータDB9におけるパラメータを用いた整数計画問題のコードを生成し、コードの解と訪問POIDB5を用いて解の評価値を求め、評価値が高まるように重みパラメータを変更する。同時推定部13は、最後に求められた重みパラメータを用いて同じ整数計画問題のコードを生成し、コードの解を求め、ユーザが滞留した滞留点と訪問したPOIを解に基づいて推定する。
【選択図】図1

Description

本発明は、訪問POI推定装置およびその動作方法に関するものである。
ユーザがGPSロガー等の装置で蓄積したGPSログ履歴を利用して、どのような場所で滞在し、またどのような場所(Point Of Interest; POI)に訪問したのかを推定する技術がある(非特許文献1、2)。
このような分野では、GPSログを用いてユーザが一定時間滞在した履歴の集合を滞留点として抽出し、行動分析や行動予測に用いる。例えば、非特許文献2においてはこのように抽出された滞留点について、ユーザ自身がシステムに入力した訪問POI履歴を併せて利用し、整数計画法を用いることで、滞留点抽出と訪問POIの同時推定を実現している。これにより、従来の滞留点抽出、訪問POI推定という二段階手法に比べて高精度な予測が可能となる。
Zheng, Y., Zhang, L., Xie, X., and Ma, W.-Y., \Mining interest-ing locations and travel sequences from GPS trajectories", Proceedings of the 18thinternational conference on World wide web, pp.791-800, 2009. 数原良彦, 戸田浩之, 西川仁, 鷲崎誠司, \整数計画法を用いたGPS ログからの滞留点と訪問POI の同時推定", IPSJ DBS 研究会, 2013. Comaniciu, D. & Meer, P., "Mean Shift: A Robust Approach Toward Feature Space Analysis", IEEE Trans. Pattern Anal. Mach. Intell., Vol.24, pp.603-619, 2002,15 ILOG CPLEX 10.0 User’s Manual, ILOG, 2006. Och, F. J. \Minimum error rate training in statistical machine trans lation", Proc. ACL, pp.160{167, 2003.
しかしながら、従来技術においては目的関数の特徴パラメータにかかる重み係数をあらかじめ人手で設定する必要があり、事前に最適な値に設定するためには、多数の嗜好が必要となるため、滞留点抽出と訪問POI 推定の精度向上に高いコストを要するという課題があった。
本発明は、上記の課題に鑑みてなされたものであり、その目的とするところは、低コストで滞留点抽出と訪問POI推定の精度を向上できる訪問POI推定装置とその動作方法を提供することにある。
上記の課題を解決するために、本発明の訪問POI推定装置は、ユーザが滞留した滞留点と訪問したPOIを推定する訪問POI推定装置であって、滞留点候補の滞留点らしさを表す確信度を格納する滞留点候補DB(4)と、ユーザが実際に訪問したPOIの情報を格納する訪問POIDB(5)と、あるPOIを訪問したのちに別のPOIを訪問する確率に基づいたスコアを格納する遷移スコアDB(7)と、1つの系列において訪問されるPOIの数のもっともらしさを表すスコアを格納する訪問POI数スコアDB(8)と、POIのカテゴリごとに当該カテゴリのPOIでの滞在時間のパラメータを格納するカテゴリ滞在時間パラメータDB(9)と、前記滞留点候補DB(4)に格納された確信度、前記遷移スコアDB(7)に格納されたスコア、前記訪問POI数スコアDB(8)に格納されたスコア、前記カテゴリ滞在時間パラメータDB(9)に格納されたパラメータ、ならびに、重みパラメータを用いた整数計画問題のコードを生成し、前記コードの解を求め、前記解と前記訪問POIDB(5)を用いて前記解の評価値を求め、前記評価値が高まるように前記重みパラメータを変更しながら評価値を繰り返し求める重みパラメータ推定部(11)と、前記重みパラメータと前記評価値が格納される重みパラメータ評価値DB(10)と、前記滞留点候補DB(4)に格納された確信度、前記遷移スコアDB(7)に格納されたスコア、前記訪問POI数スコアDB(8)に格納されたスコア、前記カテゴリ滞在時間パラメータDB(9)に格納されたパラメータ、ならびに、最後に求められた重みパラメータを用いて前記整数計画問題のコードを生成し、当該コードの解を求め、前記ユーザが滞留した滞留点と前記訪問したPOIを当該解に基づいて推定する同時推定部(13)とを備えることを特徴とする。
本発明に係る訪問POI推定装置の動作方法は、ユーザが滞留した滞留点と訪問したPOIを推定する訪問POI推定装置の動作方法であって、前記訪問POI推定装置は、滞留点候補の滞留点らしさを表す確信度を格納する滞留点候補DB(4)と、ユーザが実際に訪問したPOIの情報を格納する訪問POIDB(5)と、あるPOIを訪問したのちに別のPOIを訪問する確率に基づいたスコアを格納する遷移スコアDB(7)と、1つの系列において訪問されるPOIの数のもっともらしさを表すスコアを格納する訪問POI数スコアDB(8)と、POIのカテゴリごとに当該カテゴリのPOIでの滞在時間のパラメータを格納するカテゴリ滞在時間パラメータDB(9)と、前記重みパラメータと前記評価値が格納される重みパラメータ評価値DB(10)とを備え、前記動作方法は、前記訪問POI推定装置の重みパラメータ推定部(11)が、前記滞留点候補DB(4)に格納された確信度、前記遷移スコアDB(7)に格納されたスコア、前記訪問POI数スコアDB(8)に格納されたスコア、前記カテゴリ滞在時間パラメータDB(9)に格納されたパラメータ、ならびに、重みパラメータを用いた整数計画問題のコードを生成し、前記コードの解を求め、前記解と前記訪問POIDB(5)を用いて前記解の評価値を求め、前記評価値が高まるように前記重みパラメータを変更しながら評価値を繰り返し求め、前記訪問POI推定装置の同時推定部(13)が、前記滞留点候補DB(4)に格納された確信度、前記遷移スコアDB(7)に格納されたスコア、前記訪問POI数スコアDB(8)に格納されたスコア、前記カテゴリ滞在時間パラメータDB(9)に格納されたパラメータ、ならびに、最後に求められた重みパラメータを用いて前記整数計画問題のコードを生成し、当該コードの解を求め、前記ユーザが滞留した滞留点と前記訪問したPOIを当該解に基づいて推定することを特徴とする。
本発明の訪問POI推定装置およびその動作方法によれば、低コストで滞留点抽出と訪問POI推定の精度を向上させることができる。
本実施の形態に係る訪問POI推定装置の概略構成を示すブロック図である。 訪問POI推定装置を汎用コンピュータで構成した場合の図である。 訪問POI推定装置の処理の流れを示す図である。 滞留点候補抽出部の処理の流れを示す図である。 パラメータ計算部の処理の流れを示す図である。 重みパラメータ推定部の処理の流れを示す図である。 図6におけるステップS3‐7の詳細を示す図である。 同時推定部の処理の流れを示す図である。
以下、本発明の実施の形態について図面を参照して説明する。
図1に示すように、本実施の形態に係る訪問POI推定装置は、ユーザが訪問するPOI(Point Of Interest)を推定する装置であって、GPSログデータベース(以下、データベースをDBと略す)1、POIDB2、滞留点候補抽出部3、滞留点候補DB4、訪問POIDB5、パラメータ計算部6、遷移スコアDB7、訪問POI数スコアDB8、カテゴリ滞在時間パラメータDB9、重みパラメータ評価値DB10、重みパラメータ推定部11、重みパラメータDB12、同時推定部13および推定結果DB14を備える。POIは、訪問対象となる場所であり、例えば、店舗である。
図2に示すように、訪問POI推定装置を汎用コンピュータで構成した場合、GPSログDB1、POIDB2、滞留点候補DB4、訪問POIDB5、遷移スコアDB7、訪問POI数スコアDB8、カテゴリ滞在時間パラメータDB9、重みパラメータ評価値DB10、重みパラメータDB12および推定結果DB14以外の滞留点候補抽出部3、パラメータ計算部6および重みパラメータ推定部11は、CPUとメモリで構成され、例えば、さらに表示部が設けられる。
GPSログDB1のデータ構造の例を表1に示す。
Figure 2016018237
GPSログDB1には、あるユーザについてGPSロガーによって取得されたログ情報(ID、日時、経度、緯度)が蓄積されている。
POIDB2のデータ構造の例を表2に示す。
Figure 2016018237
POIDB2には、ユーザが訪問したPOIについて、そのIDであるPOIID、そのPOIの名称、そのPOIのカテゴリ、そのPOIの経度、緯度などが蓄積されている。POIDB2としては既存のものを利用できる。
滞留点候補DB4のデータ構造の例を表3に示す。
Figure 2016018237
滞留点候補DB4には、ユーザが滞留した領域(滞留点という)について、そのIDである滞留点ID、その滞留点の中心経度、中心緯度、GPSログDB1における対応するログ情報に含まれる最小のIDである開始ID、最大のIDである終了ID、その滞留点に滞留した時間(長さ)である滞留時間、その滞留点の次に訪問可能なPOIを示すPOIIDからなる訪問POI候補、滞留点候補の滞留点らしさを表す確信度が蓄積される。
図3は、訪問POI推定装置の処理の流れを示す図である。
(T1)まず、滞留点候補抽出部3が滞留点候補DB4を生成する。
(T3)次に、パラメータ計算部6が遷移スコアDB7、訪問POI数スコアDB8、カテゴリ滞在時間パラメータDB9を生成する。
(T5)次に、パラメータ推定部11が重みパラメータDB12を生成する。
(T7)次に、同時推定部13が推定結果DB14を生成し、処理を終える。
図4は、滞留点候補抽出部3の処理(T1)の流れを示す。
(S1−1)滞留点候補抽出部3は、GPSログDB1を読み込み、滞留点を抽出する。この滞留点の抽出には、例えば、非特許文献1や非特許文献2記載の方法を用いることができる。この際、網羅的に滞留点候補を抽出するため、誤検出を許容しても可能な限り多くの滞留点候補を抽出するようなパラメータを利用する。これにより、各滞留点候補につき、中心経度、中心緯度、開始ID、終了ID、滞留時間などが得られる。
(S1−2)次に、各滞留点候補につき、POIDB2から、その滞留点候補の次に訪問可能なPOIを示すPOIIDからなる訪問POI候補を取得する。ここでは、例えば、滞留点候補の中心座標から一定距離の座標をもつPOIのPOIIDを取得する方法や、中心座標から近傍のPOIを一定数選択し、そのPOIIDを取得するなどの方法が考えられる。座標間の距離計算には、例えば、Hubenyの公式やVincentyの公式を用いることができる(非特許文献2)。
(S1−3)各滞留点候補について、滞留点候補の滞留点らしさを表す確信度を計算する。この確信度の計算には、例えば、滞留点候補の経度、緯度に対する分布推定を行った場合にデータのあてはまりのよさを表す尤度などを利用することができる。具体的には非特許文献2や非特許文献3記載の方法などを用いて分布推定を行い、尤度を計算することが可能である。
(S1−4)各滞留点候補に滞留点IDを付与し、各滞留点候補につき、滞留点ID、中心経度、中心緯度、開始ID、終了ID、滞留時間、訪問POI候補、確信度を滞留点DB4に出力する。
パラメータ計算部6は、POIDB2と訪問POIDB5を入力として受け取り、遷移確率DB7、訪問POI数スコアDB8、カテゴリ滞在時間パラメータDB9を出力する。
訪問POIDB5のデータ構造の例を表4に示す。
Figure 2016018237
訪問POIDB5は、予め記録されたGPS履歴と、抽出された滞留点に対して、予めユーザが実際に訪問したPOIの情報を保持している。訪問POIIDは、訪問したPOIのID、中心経度、中心緯度は、対応する滞留点の中心経度、中心緯度、開始時刻、終了時刻は、対応する滞留点の開始時刻、終了時刻、滞在時間は、終了時刻から開始時刻を引いた値である。
遷移確率DB7のデータ構造の例を表5に示す。
Figure 2016018237
遷移確率DB7は、FromカテゴリのPOIを訪問したのち、ToカテゴリのPOIを訪問する確率に基づいてスコアを格納している。
訪問POI数スコアDB8のデータ構造の例を表6に示す。
Figure 2016018237
訪問POI数スコアDB8は、1つの系列において訪問されるPOIの数のもっともらしさを表すスコアを格納する。具体的には、各数につき、その数を示す訪問POI数と、対応するスコアとが格納される。
カテゴリ滞在時間パラメータDB9のデータ構造の例を表7に示す。
Figure 2016018237
カテゴリ滞在時間パラメータDB9には、POIについての各カテゴリに対し、滞在時間の対数値の平均(後述の対数平均パラメータμ)と分散(後述の対数分散パラメータσ )が格納される。
図5は、パラメータ計算部6の処理(T3)の流れを示す。
(S2−1)パラメータ計算部6は、訪問POIDB5から未処理の連接POIを取得する。連接POIとは、例えば、同一系列においてPOI「A」を訪問したあとにPOI「B」を訪問した場合のABのペアを表す。その他にも、Aの直後に訪問したPOIのみを対象にすることもできる。ここで同一系列は、例えば同じ日付を用いる。その他にも事前に設定された時刻で区切るなどの方法を用いることができる。本実施例では1日を1系列とする例を用いる。
パラメータ計算部6は、POIDB2を基に、取得した連接POIに含まれるPOIのカテゴリを取得し、遷移確率DB7のスコアを更新する。スコアの計算には、例えば、条件付き確率P(Toカテゴリ/Fromカテゴリ)を用いることができる。ここでP(Toカテゴリ/Fromカテゴリ)は、FromカテゴリのPOIを訪問したのち、ToカテゴリのPOIを訪問する確率を表す。
具体的には、以下の手続きで条件付き確率P(Toカテゴリ/Fromカテゴリ)を計算する。
(S2−1−a)全ての連接POIに対してPOIDB2を用いてカテゴリを取得する。ここで、POI「A」を訪問したあとにPOI「B」を訪問した場合、AのカテゴリをFromカテゴリ、BのカテゴリをToカテゴリという。
(S2−1−b)各Fromカテゴリを対象に(S2−1−c)の処理を行う。
(S2−1−c)対象のFromカテゴリをCFromとする。FromカテゴリがCFrom
である連接POIを取得して総数を求める。これをNCFromとする。また、当該CFromを用いて取得された連接POIのうち、各Toカテゴリが含まれる数をそれぞれNCFrom→CToとする。条件付き確率P(CTo/CFrom)は、例えば、(NCFrom→CTo)/NCFromによって計算することができる。訪問がない場合にスコアがゼロになることを防ぐため、例えば予め設定した係数βを用いて、(NCFrom→CTo+β)/(NCFrom+β|CTo|)によって計算することもできる。ここで|CTo|は、Toカテゴリの異なり数(種類数)である。以上の処理によって条件付き確率P(Toカテゴリ/Fromカテゴリ)を求める。
ここでは、スコアについてはPOIのカテゴリを用いた例を使って述べているが、同じ枠組みでPOIそのもののスコアを用いる方法も考えられる。その場合には、Fromカテゴリのカラムに対応するPOIの情報を保持し、Toカテゴリのカラムに対応するPOIの情報を保持すればよい。
(S2−2)未処理の連接POIが存在する場合には(S2−1)に戻り、そうでない場合には(S2−3)に進む。
(S2−3)結果を遷移確率DB7に出力する。
(S2−4)訪問POIDB5から未処理の日付を取得し、該当日に訪問したPOIの数(訪問POI数)を計算する。訪問POI数は、訪問POIDB5において同じ日付を持つレコード数として取得することができる。次に、訪問POI数を基に訪問POI数スコアを計算する。この計算には例えば正規分布を用いることができる。日付dにおける訪問POI数をvとする。
(S2−5)未処理の日付がある場合には(S2−4)に戻り、そうでない場合には(S2−6)に進む。
(S2−6)日ごとの訪問POI数が正規分布に従っていると仮定し、訪問POI数からパラメータ推定を行い、その結果を利用して訪問POI数スコアを計算する。
平均パラメータμは、
Figure 2016018237
によって計算する。ここでDは日付の総異なり数を表す。
分散パラメータσは、
Figure 2016018237
によって計算する。
平均パラメータと分散パラメータを利用し、k回の訪問POI数に対する訪問POI数スコアαは、例えば正規分布の確率密度関数を用いて、
Figure 2016018237
によって計算する。
そして、各訪問POI数スコアを訪問POI数スコアDB8に出力する。
なお、ここでは訪問POI数スコアを正規分布の最尤推定を用いて計算したが、他にも多項分布やその他の確率分布を用いて計算する方法や各訪問POI数に対して人手で訪問POI数スコアを設定する方法が考えられる。
(S2−7)訪問POIDB5に含まれるPOIの集合に対応するPOIのカテゴリの集合のうち、未処理のカテゴリを選択する。ここで対応するカテゴリは、POIDB2から取得する。そして、訪問POIDB5から、当該カテゴリに該当するレコードを選択し、当該レコードの集合に含まれる滞在時間の情報から、当該カテゴリの平均滞在時間のパラメータを対数正規分布の最尤推定によって求める。あるカテゴリaに対応する滞留点候補DB4のレコードの滞在時間の集合を
Figure 2016018237
と表現すると (ここでNaはカテゴリaに対応するレコードの総数を表す)、カテゴリaの対数正規分布における対数平均パラメータμは、
Figure 2016018237
によって計算する。
また、対数分散パラメータσ は、
Figure 2016018237
によって求めることができる。
これらのパラメータを用いることで、推定時に与えられた滞留点候補に対して滞在時間の観点で当該 POIカテゴリ訪問のもっともらしさを評価する。ここでは対数正規分布を用いる例を示したが、例えば正規分布やガンマ分布など対数正規分布以外の分布を用いることもできる。その際には、それぞれの分布の最尤推定を用いる。なお、最尤推定に限らず事前分布を用いるMAP推定など他の推定手法も利用することができる。そして、得られた対数平均パラメータと対数分散パラメータをカテゴリ滞在時間パラメータDB9に出力する。
(S2−8)未処理のPOIのカテゴリがある場合には(S2−7)に戻り、そうでない場合には処理を終了する。
重みパラメータ評価値DB10のデータ構造を表8に示す。
Figure 2016018237
重みパラメータ評価値DB10には、重みパラメータw、w、w、w、w および評価値が時系列で記憶される。重みパラメータおよび評価値に対応づけて時刻を示すIDが付与される。これらの重みパラメータは、後述の整数計画問題コードの目的関数計算に利用される。パラメータ計算部6により計算される滞在時間の平均と分散は、一旦計算されたなら、その後には再計算されないのに対し、重みパラメータは再計算され、時系列で記憶されていく。なお、重みパラメータの数は、3以下または6以上でもよい.
重みパラメータDB12のデータ構造の例を表9に示す。
Figure 2016018237
重みパラメータDB12は、重みパラメータ評価値DB10における最後の時刻の重みパラメータw、w、w、w、wが記憶される。
図6は、重みパラメータ推定部11の処理の流れを示す。
(S3−1)まず、重みパラメータ推定部11は、重みパラメータw、w、w、w、wを初期化する。例えば、それぞれを1とする。
(S3−2)次に、滞留点候補DB4に記録された滞留点(実際には滞留点ID、中心経度、中心緯度、開始ID、終了ID、滞留時間、訪問POI候補、確信度の各情報)を、訪問POI候補DB5に記録されたPOIの中心経度および中心緯度と同じ中心経度および中心緯度を含むものに絞り込み、その後の滞留点候補DB4から未処理の系列を選択する。ここで系列は予め設定した単位を用いることができる。たとえば午前0時を区切りとする1日単位であったり、予め開始終了の時刻を設定した朝、昼、晩という単位を用いることができる。
(S3−3)次に、重みパラメータ推定部11は、滞留点候補DB4、遷移スコアDB7、訪問POI数スコアDB8、カテゴリ滞在時間パラメータDB9を読み込み、現在の重みパラメータw、w、w、w、wを用いて以下の整数計画問題のコード(問題P) を生成する。
Figure 2016018237
・s(i=1,…,N):滞留点候補iが滞留点であるかを表す変数。ここでNは滞留点候補iの総数を表す。
・xik(i=1,…,N,k=1,…,K):滞留点候補iにおいて訪問したPOIがkであることを表す変数。ここでKはPOIの総種類数を表す。
・Tij(i=1,…,N−1,j=i+1,…,N):滞留点候補iから滞留点候補jに対して遷移が存在することを表す変数。
・tijkl(i=1,…,N−1,j=i+1,…,N,k=1,…,K,l=1,…,K):滞留点候補iにおいてPOIkを訪問し、滞留点候補jにおいてPOIlを訪問したことを表す変数。
上記決定変数については,整数計画コード上では区別可能な記号であれば,必ずしも上記の記法に限定されない。
次に、上記変数の重み係数に利用されている記号の概要とその計算方法について説明する。
・p(i=1,…,N):滞留点候補iの滞留点らしさを表す重み係数。pの計算には、例えば滞留点候補DB4の確信度を用いることができる。
・qik(i=1,…,N,k=1,…,K):滞留点候補iにおいてあるPOI(訪問POI候補という)kを訪問する確からしさを表す重み係数。ここでは、滞留点候補DB4のうち、滞留点候補iに該当するレコードの訪問POI候補に含まれるPOIを対象とする。qikの推定には、例えば、例えばカテゴリ滞在時間パラメータDB9が保持する対数正規分布のパラメータを用いて、滞留点候補iの滞在時間に訪問POI候補kが属するカテゴリの尤度を用いることができる。それ以外にも、例えば非特許文献2によって推定された値を用いることができる。訪問POI候補に含まれていないPOIについては、候補から外すためにqikを0に設定するか、−999999のような絶対値が大きい負の値を設定する。
・rkl(i=1,…,N,k=1,…,K,l=1,…,K):訪問POI候補kを訪問した後にPOIlを訪問する確からしさを表す重み係数。この重み係数の計算には、遷移スコアDB7において、POIkが属するカテゴリをFromカテゴリ、POIlが属するカテゴリをToカテゴリとしたレコードのスコアを用いることができる。ここでは、このようにカテゴリの推移に対応するスコアを用いるが、前述の「POIそのもののスコア」を用いてもよい。つまり、カテゴリ分けをしないで、あるPOIから別のPOIを訪問する確からしさのスコアをデータベースに保持し、rklには、訪問POI候補kを訪問した後にPOIlを訪問する場合の当該スコアを用いることもできる。
・α(m=1,…,N):系列の滞留点数mの確からしさを表す重み係数。この重み係数には、訪問POI数スコアDB8に格納されたスコアを用いることができる
つまり、訪問POI数スコアDB8において、滞留点数mの同数の訪問POI数に対応するスコアをαとして利用する。
重みパラメータ推定部11は、重み係数については上記の計算方法によって得た実数値を代入してコードを生成する。コードには、例えば、LP形式やMPS形式(非特許文献4)を利用することが可能であり、(S3−4)で用いるソルバが利用可能な形式であれば特に形式は限定しない。
(S3−4)次に、重みパラメータ推定部11は、(S3−3)で生成した整数計画問題のコードをソルバを用いて求解する。
(S3−5)次に、重みパラメータ推定部11は、求解した結果を用いた推定結果を所定の記憶領域(推定結果集合Rという)に追加する。つまり、s=1(i=1,…,N)である滞留点候補iを滞留点として抽出し、また、xik=1(i=1,…,N,k=1,…,K)であるPOIkを当該滞留点において訪問したPOIとして解釈し、例えば、これらPOIに関する情報を推定結果集合Rに出力する。
(S3−6)未処理の系列がある場合は(S3−2)に戻り、そうでない場合には(S3−7)に進む。
(S3−7)重みパラメータ推定部11は、推定結果集合Rと訪問POIDB5を用いて評価値を計算し、これを重みパラメータ評価値DB10の最新の評価値と比較し、新たな重みパラメータを重みパラメータ評価値DB10に記憶させる。
図7は、図6におけるステップS3−7の詳細を示す。
(S3−7−1)重みパラメータ推定部11は、推定結果集合Rと訪問POIDB5を用いて評価値を計算する。
評価値は、訪問POIDB5内にある中心経度および中心緯度の組数を推定結果集合R内にある中心経度および中心緯度の組数との比較で示す値(正解率)、正解率をある系列に限って求めたものなどである。
(S3−7−2)重みパラメータ推定部11は、重みパラメータ評価値DB10に評価値がない場合は、(S3−7−3)に進み、ある場合は、(S3−7−4)に進む。
(S3−7−3)変数k =1とする。
(S3−7−4)重みパラメータ推定部11は、(S3−7−1)で計算した評価値(今回の評価値)と重みパラメータ評価値DB10における最新の評価値(前回の評価値)を比較し、今回の方が高い場合は、(S3−7−6)に進み、そうでない場合は、(S3−7−5)に進む。
(S3−7−5)変数k=k+1とする。
(S3−7−6)(S3−7−1)で計算した評価値と現在の重みパラメータを重みパラメータ評価値DB10に最新のものとして記憶させる。これらの評価値と重みパラメータには、最新のIDが付与される。
(S3−7−7)変数kを用いて各重みパラメータを変更する。この変更方法としては、例えば、非特許文献5の技術を用いることができる。それ以外にも評価値の差分を勾配として利用可能な教師あり学習手法を用いることができる。
ここで、ステップS3−7の作用について説明する。
(S3−7−1)において訪問POIDB5に格納されたデータに対する評価値を計算し、(S3−7−4)において、それが前回の評価値より高い(向上している)か否かを判定し、現在の重みパラメータが良いのかという結果が得られる。その結果から、現在の変数kの変化方向(増加か減少か)で効果が得られているか判断することができる。そのため、評価値が向上している場合には、変数kを維持する。
また,評価値が減少している場合には、(S3−7−5)において、変数kを変更する。このような(S3−7)を実行することにより、高い評価値が得られる重みパラメータを得ることができる。よって、この重みパラメータを用いれば、予測精度が高い推定が可能となる。
図6に戻り、説明を続ける。
(S3−8)重みパラメータ推定部11は、重みパラメータの収束判定を行う。重みパラメータ推定部11は、例えば、前回の重みパラメータとの差分が予め設定した閾値以下なら、または重みパラメータが予め設定した回数変更されたなら、重みパラメータは収束したと判定する。収束したと判定されたなら、(S3−9)に進み、そうでない場合は、S3−2に戻る。
(S3−9)現在の重みパラメータを重みパラメータDB12に格納する。
同時推定部13は、POIDB2、滞留点候補DB4、遷移確率DB7、訪問POI数スコアDB8、カテゴリ滞在時間パラメータDB9を入力として、推定結果DB14を出力する。
推定結果DB14のデータ構造の例を表10に示す。
Figure 2016018237
推定結果DB14には、POIに関する情報、例えば、名称、中心経度、中心緯度、訪問の開始時刻、終了時刻などが格納される。
図8は、同時推定部13の処理の流れを示す。
(S4−1)同時推定部13は、滞留点候補DB4から未処理の系列を選択する。ここで系列は予め設定した単位を用いることができる。たとえば午前0時を区切りとする1日単位であったり、予め開始終了の時刻を設定した朝、昼、晩という単位を用いることができる。ここでは1日を単位とする例で説明する。
(S4−2)同時推定部13は、滞留点候補DB4、遷移スコアDB7、訪問POI数スコアDB8、カテゴリ滞在時間パラメータDB9、重みパラメータDB12を読み込み、前述の問題Pに対応した整数計画問題のコードを生成する。
(S4−3)(S4−2)で生成した整数計画問題のコードをソルバを用いて求解する。このソルバには、例えばGurobi Optimizer(http://www.octobersky.jp/products/gurobi/gurobi.html)やCPLEX(http://www-01.ibm.com/software/commerce/optimization/cplex-optimizer/)といった汎用整数計画ソルバを用いることができる。
(S3−4)求解した結果を用いた推定結果を推定結果DB14に出力する。つまり、s
=1(i=1,…,N)である滞留点候補iを滞留点として抽出し、また、xik=1(i=1,…,N,k=1,…,K)であるPOIkを当該滞留点において訪問したPOIとして解釈し、例えば、これらPOIに関する情報を推定結果DB14に出力する。
(S3−5)未処理の系列がある場合は(S3−1)に戻り、そうでない場合には処理を終了する。
以上のように、本実施の形態の訪問POI推定装置によれば、滞留点候補の滞留点らしさを表す確信度を格納する滞留点候補DB4と、ユーザが実際に訪問したPOIの情報を格納する訪問POIDB5と、あるPOIを訪問したのちに別のPOIを訪問する確率に基づいたスコアを格納する遷移スコアDB7と、1つの系列において訪問されるPOIの数のもっともらしさを表すスコアを格納する訪問POI数スコアDB8と、POIのカテゴリごとに当該カテゴリのPOIでの滞在時間のパラメータを格納するカテゴリ滞在時間パラメータDB9と、滞留点候補DB4に格納された確信度、遷移スコアDB7に格納されたスコア、訪問POI数スコアDB8に格納されたスコア、ならびに、カテゴリ滞在時間パラメータDB9に格納されたパラメータを用いた整数計画問題のコードを生成し(S3−2)、コードの解を求め(S3−3)、解と訪問POIDB5を用いて解の評価値を求め、評価値が高まるように重みパラメータを変更しながら評価値を繰り返し求める(S3−7)重みパラメータ推定部11と、重みパラメータと評価値が格納される重みパラメータ評価値DB10と、滞留点候補DB4に格納された確信度、遷移スコアDB7に格納されたスコア、訪問POI数スコアDB8に格納されたスコア、カテゴリ滞在時間パラメータDB9に格納されたパラメータ、ならびに、最後に求められた重みパラメータを用いて前記整数計画問題のコードを生成し(S4−2)、当該コードの解を求め(S4−3)、ユーザが滞留した滞留点(xik=1)と訪問したPOI(xik=1)を当該解に基づいて推定する(S4−4)同時推定部13とを備えることで、滞留点抽出と訪問POI推定を行え、しかも、パイプライン処理でなく、整数計画問題のコードを求解しているので、滞留点抽出の誤りの影響で訪問POI推定の精度が低下することがなく、また、解と訪問POIDB5を用いて解の評価値を求め、評価値が高まるように重みパラメータを変更しながら評価値を繰り返し求め、滞留点候補DB4に格納された確信度、遷移スコアDB7に格納されたスコア、訪問POI数スコアDB8に格納されたスコア、カテゴリ滞在時間パラメータDB9に格納されたパラメータ、ならびに、最後に求められた重みパラメータを用いて、同じ整数計画問題のコードを生成し、当該コードの解を求め、ユーザが滞留した滞留点(xik=1)と訪問したPOI(xik=1)を当該解に基づいて推定するので、低コストで、滞留点抽出と訪問POI推定の精度を向上させることができる。
つまり、重みパラメータ推定部11の処理と重みパラメータ評価値DB10を用いることにより、訪問POIDB5に格納された情報を正解とみなした現在の重みパラメータにおける評価値を計算し、重みパラメータを更新することで、重みパラメータを適切な値に設定することが可能となる。これにより、自動的に高精度な予測を実現する重みパラメータの設定が可能となる。そして、同時推定部13による訪問POIの予測精度を向上でき、推定精度向上に伴う演算量の削減が可能となる。
なお、本実施の形態の訪問POI推定装置としてコンピュータを機能させるためのコンピュータプログラムは、半導体メモリ、磁気ディスク、光ディスク、光磁気ディスク、磁気テープなどのコンピュータ読み取り可能な記録媒体に記録でき、また、インターネットなどの通信網を介して伝送させて、広く流通させることができる。
1 GPSログDB
2 POIDB
3 滞留点候補抽出部
4 滞留点候補DB
5 訪問POIDB
6 パラメータ計算部
7 遷移スコアDB
8 訪問POI数スコアDB
9 カテゴリ滞在時間パラメータDB
10 重みパラメータ評価値DB
11 重みパラメータ推定部
12 重みパラメータDB
13 同時推定部
14 推定結果DB

Claims (4)

  1. ユーザが滞留した滞留点と訪問したPOIを推定する訪問POI推定装置であって、
    滞留点候補の滞留点らしさを表す確信度を格納する滞留点候補DB(4)と、
    ユーザが実際に訪問したPOIの情報を格納する訪問POIDB(5)と、
    あるPOIを訪問したのちに別のPOIを訪問する確率に基づいたスコアを格納する遷移スコアDB(7)と、
    1つの系列において訪問されるPOIの数のもっともらしさを表すスコアを格納する訪問POI数スコアDB(8)と、
    POIのカテゴリごとに当該カテゴリのPOIでの滞在時間のパラメータを格納するカテゴリ滞在時間パラメータDB(9)と、
    前記滞留点候補DB(4)に格納された確信度、前記遷移スコアDB(7)に格納されたスコア、前記訪問POI数スコアDB(8)に格納されたスコア、前記カテゴリ滞在時間パラメータDB(9)に格納されたパラメータ、ならびに、重みパラメータを用いた整数計画問題のコードを生成し、前記コードの解を求め、前記解と前記訪問POIDB(5)を用いて前記解の評価値を求め、前記評価値が高まるように前記重みパラメータを変更しながら評価値を繰り返し求める重みパラメータ推定部(11)と、
    前記重みパラメータと前記評価値が格納される重みパラメータ評価値DB(10)と、
    前記滞留点候補DB(4)に格納された確信度、前記遷移スコアDB(7)に格納されたスコア、前記訪問POI数スコアDB(8)に格納されたスコア、前記カテゴリ滞在時間パラメータDB(9)に格納されたパラメータ、ならびに、最後に求められた重みパラメータを用いて前記整数計画問題のコードを生成し、当該コードの解を求め、前記ユーザが滞留した滞留点と前記訪問したPOIを当該解に基づいて推定する同時推定部(13)と
    を備えることを特徴とする訪問POI推定装置。
  2. 前記整数計画問題のコードは、
    Figure 2016018237
    であり、
    、w、w、w、wは、それぞれ重みパラメータであり、
    (i=1,…,N)は、滞留点候補iが滞留点であるかを表す変数であり、Nは滞留点候補iの総数を表すものであり、
    ik(i=1,…,N,k=1,…,K)は、滞留点候補iにおいて訪問したPOIがkであることを表す変数であり、KはPOIの総種類数を表すものであり、
    ij(i=1,…,N−1,j=i+1,…,N)は、滞留点候補iから滞留点候補jに対して遷移が存在することを表す変数であり、
    ijkl(i=1,…,N−1,j=i+1,…,N,k=1,…,K,l=1,…,K)は、滞留点候補iにおいてPOIkを訪問し、滞留点候補jにおいてPOIlを訪問したことを表す変数であり、
    (i=1,…,N)は、滞留点候補iの滞留点らしさを表す重み係数であり、pの計算には、滞留点候補DB4の確信度を用い、
    ik(i=1,…,N,k=1,…,K)は、滞留点候補iにおいてあるPOI(訪問POI候補という)kを訪問する確からしさを表す重み係数であり、qikの計算には、カテゴリ滞在時間パラメータDB(9)のパラメータを用い、
    kl(i=1,…,N,k=1,…,K,l=1,…,K)は、訪問POI候補kを訪問した後にPOIlを訪問する確からしさを表す重み係数であり、rklの計算には、遷移スコアDB(7)のスコアを用い、
    α(m=1,…,N)は、系列の滞留点数mの確からしさを表す重み係数であり、αには、訪問POI数スコアDB(8)に格納されたスコアを用いる
    ことを特徴とする請求項1記載の訪問POI推定装置。
  3. ユーザが滞留した滞留点と訪問したPOIを推定する訪問POI推定装置の動作方法であって、
    前記訪問POI推定装置は、
    滞留点候補の滞留点らしさを表す確信度を格納する滞留点候補DB(4)と、ユーザが実際に訪問したPOIの情報を格納する訪問POIDB(5)と、あるPOIを訪問したのちに別のPOIを訪問する確率に基づいたスコアを格納する遷移スコアDB(7)と、1つの系列において訪問されるPOIの数のもっともらしさを表すスコアを格納する訪問POI数スコアDB(8)と、POIのカテゴリごとに当該カテゴリのPOIでの滞在時間のパラメータを格納するカテゴリ滞在時間パラメータDB(9)と、前記重みパラメータと前記評価値が格納される重みパラメータ評価値DB(10)とを備え、
    前記動作方法は、
    前記訪問POI推定装置の重みパラメータ推定部(11)が、前記滞留点候補DB(4)に格納された確信度、前記遷移スコアDB(7)に格納されたスコア、前記訪問POI数スコアDB(8)に格納されたスコア、前記カテゴリ滞在時間パラメータDB(9)に格納されたパラメータ、ならびに、重みパラメータを用いた整数計画問題のコードを生成し、前記コードの解を求め、前記解と前記訪問POIDB(5)を用いて前記解の評価値を求め、前記評価値が高まるように前記重みパラメータを変更しながら評価値を繰り返し求め、
    前記訪問POI推定装置の同時推定部(13)が、前記滞留点候補DB(4)に格納された確信度、前記遷移スコアDB(7)に格納されたスコア、前記訪問POI数スコアDB(8)に格納されたスコア、前記カテゴリ滞在時間パラメータDB(9)に格納されたパラメータ、ならびに、最後に求められた重みパラメータを用いて前記整数計画問題のコードを生成し、当該コードの解を求め、前記ユーザが滞留した滞留点と前記訪問したPOIを当該解に基づいて推定する
    ことを特徴とする訪問POI推定装置の動作方法。
  4. 請求項1または2記載の訪問POI推定装置としてコンピュータを機能させるためのコンピュータプログラム。
JP2014138548A 2014-07-04 2014-07-04 訪問poi推定装置およびその動作方法 Active JP6190331B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014138548A JP6190331B2 (ja) 2014-07-04 2014-07-04 訪問poi推定装置およびその動作方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014138548A JP6190331B2 (ja) 2014-07-04 2014-07-04 訪問poi推定装置およびその動作方法

Publications (2)

Publication Number Publication Date
JP2016018237A true JP2016018237A (ja) 2016-02-01
JP6190331B2 JP6190331B2 (ja) 2017-08-30

Family

ID=55233454

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014138548A Active JP6190331B2 (ja) 2014-07-04 2014-07-04 訪問poi推定装置およびその動作方法

Country Status (1)

Country Link
JP (1) JP6190331B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110659433A (zh) * 2019-08-01 2020-01-07 北京百度网讯科技有限公司 Poi价值评估的方法、装置、设备和计算机存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10134027A (ja) * 1996-10-29 1998-05-22 Toyota Motor Corp 販売予測支援方法およびその装置
JP2008014743A (ja) * 2006-07-05 2008-01-24 Japan Advanced Institute Of Science & Technology Hokuriku 移動体位置推定システム、及び、移動体位置推定方法
JP2012164227A (ja) * 2011-02-08 2012-08-30 Nippon Telegr & Teleph Corp <Ntt> 行動及び属性推定装置及び方法及びプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10134027A (ja) * 1996-10-29 1998-05-22 Toyota Motor Corp 販売予測支援方法およびその装置
JP2008014743A (ja) * 2006-07-05 2008-01-24 Japan Advanced Institute Of Science & Technology Hokuriku 移動体位置推定システム、及び、移動体位置推定方法
JP2012164227A (ja) * 2011-02-08 2012-08-30 Nippon Telegr & Teleph Corp <Ntt> 行動及び属性推定装置及び方法及びプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
数原 良彦: "整数計画法を用いたGPSログからの滞留点と訪問POIの同時推定", 情報処理学会 研究報告 データベースシステム(DBS) 2013−DBS−158 [ONLINE], JPN6017028660, 19 November 2013 (2013-11-19), ISSN: 0003609780 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110659433A (zh) * 2019-08-01 2020-01-07 北京百度网讯科技有限公司 Poi价值评估的方法、装置、设备和计算机存储介质
US11468349B2 (en) 2019-08-01 2022-10-11 Beijing Baidu Netcom Science And Technology Co., Ltd. POI valuation method, apparatus, device and computer storage medium

Also Published As

Publication number Publication date
JP6190331B2 (ja) 2017-08-30

Similar Documents

Publication Publication Date Title
US11645581B2 (en) Meaningfully explaining black-box machine learning models
Foody et al. Accurate attribute mapping from volunteered geographic information: issues of volunteer quantity and quality
Tong et al. A linear road object matching method for conflation based on optimization and logistic regression
JP6162781B2 (ja) 新しい興味のある地点の位置を決定する方法及び装置
KR101524971B1 (ko) 개인 성향 예측 방법 및 그 장치
CN109460520B (zh) 基于地理-社会关系与深隐式兴趣挖掘的兴趣点推荐方法
CN109858683B (zh) 确定店铺的营业状态的方法、装置、电子设备及存储介质
CN113139140B (zh) 基于时空感知gru并结合用户关系偏好的旅游景点推荐方法
Chehreghan et al. A geometric-based approach for road matching on multi-scale datasets using a genetic algorithm
CN114462616A (zh) 用于防止敏感数据在线公开的机器学习模型
WO2018188509A1 (zh) 楼盘信息处理方法、装置、计算机设备及存储介质
JP2016177377A (ja) 学習装置、学習方法、及び学習プログラム
Zhang et al. An improved probabilistic relaxation method for matching multi-scale road networks
CN115296984A (zh) 异常网络节点的检测方法及装置、设备、存储介质
JP6126516B2 (ja) 訪問poi推定装置
CN115774819A (zh) 一种基于层次循环神经网络的兴趣点推荐方法及系统
JP6744767B2 (ja) 人流予測装置、パラメータ推定装置、方法、及びプログラム
İlhan An Application On mobile devices with android and IOS operating systems using google maps APIs for the traveling salesman problem
Liu et al. Enhancing fine-grained intra-urban dengue forecasting by integrating spatial interactions of human movements between urban regions
CN112883133B (zh) 基于时序数据和功能演变数据的流量预测方法
Aung et al. A novel bidirectional LSTM deep learning approach for COVID-19 forecasting
CN107909498B (zh) 基于最大化接受者操作特征曲线下方面积的推荐方法
JP6190331B2 (ja) 訪問poi推定装置およびその動作方法
JP6591638B1 (ja) 情報処理装置、情報処理方法および情報処理プログラム
Frisén et al. Semiparametric estimation of outbreak regression

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160913

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170724

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170801

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170804

R150 Certificate of patent or registration of utility model

Ref document number: 6190331

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150