JP6174527B2 - 移動手段推定装置、その動作方法およびプログラム - Google Patents

移動手段推定装置、その動作方法およびプログラム Download PDF

Info

Publication number
JP6174527B2
JP6174527B2 JP2014139441A JP2014139441A JP6174527B2 JP 6174527 B2 JP6174527 B2 JP 6174527B2 JP 2014139441 A JP2014139441 A JP 2014139441A JP 2014139441 A JP2014139441 A JP 2014139441A JP 6174527 B2 JP6174527 B2 JP 6174527B2
Authority
JP
Japan
Prior art keywords
storage unit
case
prediction model
moving means
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014139441A
Other languages
English (en)
Other versions
JP2016018308A (ja
Inventor
良彦 数原
良彦 数原
浩之 戸田
浩之 戸田
義昌 小池
義昌 小池
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Inc
NTT Inc USA
Original Assignee
Nippon Telegraph and Telephone Corp
NTT Inc USA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp, NTT Inc USA filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2014139441A priority Critical patent/JP6174527B2/ja
Publication of JP2016018308A publication Critical patent/JP2016018308A/ja
Application granted granted Critical
Publication of JP6174527B2 publication Critical patent/JP6174527B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Navigation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、利用者がどのような移動手段を利用したかを推定する移動手段推定装置、その方法およびプログラムに関する。
ユーザの位置をGPSロガー等の装置で蓄積したGPS履歴情報を利用して、ユーザがどのような移動手段を利用したかを推定する技術がある(例えば非特許文献1)。ユーザの利用した移動手段を推定するには、GPS履歴情報から異なる移動手段を利用したと想定される区間(セグメント)に分割して当該区間を抽出する前処理を行う。そして、抽出されたセグメントに対してGPS履歴情報から特徴を抽出する。その特徴を分類器で分類して移動手段の判定を行う。
ここで、移動手段判定の分類器については、予め人手によって用意された正解データを利用して、教師あり機械学習(例えば非特許文献2)の枠組みで生成することが可能である(非特許文献1)。
Zheng, Y., Liu, L., Wang, L., Xie, X., "Learning transportation mode from raw gps data for geographic applications on the web", Proc. The 17th international conference on World Wide Web, pp.247-256, 2008. Crammer, K., Dekel, O. Keshet, J., Shalev-Shwartz, S. and Singer, Y., "Online Passive-Aggressive Algorithm", Journal of Machine Learning, Vol.7, pp.551-585, 2006.
しかしながら、正解データを作成するコストが高いため、限られた数の正解データしか用意することができないという課題がある。そのため、予測モデルの予測精度が低下し、移動モード判定の判定精度が悪化してしまう課題がある。
本発明は、この課題に鑑みてなされたものであり、限られた数の正解データしかなくても予測モデルの予測精度を劣化させないようにした移動手段推定装置、その動作方法およびプログラムを提供することを目的とする。
本願発明の移動手段推定装置は、ユーザの位置をGPSで記録したGPS履歴情報に基づいて移動手段を推定する移動手段推定装置であって、時空間頻度記憶部と訓練事例記憶部とラベルなし事例記憶部と予測モデル生成機能部とを具備する。時空間頻度記憶部は、ユーザを識別するユーザIDと、地図上の一定領域を表すメッシュIDと、1日内の時間帯と、時間帯にユーザが一定領域内に立ち入った頻度とを記憶する。訓練事例記憶部は、移動手段の事例を正しく表す正解ラベルと、GPS履歴情報から求めた事例の特徴ベクトルとを記憶する。ラベルなし事例記憶部は、正解ラベルが与えられていない事例の特徴ベクトルを記憶する。予測モデル生成機能部は、訓練事例記憶部に記憶した全ての事例から、移動手段を予測する予測モデルを生成し、ラベルなし事例記憶部に記憶した事例の数が閾値以下の場合に、予測モデルを出力し、ラベルなし事例記憶部に記憶した事例の数が閾値より大きい場合に、正解ラベルが与えられていない事例に正解ラベルを付与したときに予測モデルの信頼度が向上する程度を表す選択スコアを、時空間頻度記憶部に記憶したデータを用いて求め、当該選択スコアがスコア閾値よりも大きい事例をラベルなし事例記憶部から抽出し、当該抽出した事例を外部に提示して注釈を要求し、入力された注釈を正解ラベルとした抽出した事例を、訓練事例記憶部に追加し、訓練事例記憶部に記憶した全ての事例を用いて、移動手段を予測する予測モデルを再計算する処理を、ラベルなし事例記憶部に記憶した事例の数が閾値以下になるまで繰り返す。
また、本願発明の移動手段推定装置の動作方法は、ユーザの位置をGPSで記録したGPS履歴情報から移動手段を推定する移動手段推定装置の動作方法であって、予測モデル生成機能部が、移動手段推定装置の訓練事例記憶部に記憶した全ての事例から、移動手段を予測する予測モデルを生成し、移動手段推定装置のラベルなし事例記憶部に記憶した事例の数が閾値以下の場合に、予測モデルを出力し、ラベルなし事例記憶部に記憶した事例の数が閾値より大きい場合に、正解ラベルが与えられていない事例に正解ラベルを付与したときに予測モデルの信頼度が向上する程度を表す選択スコアを、移動手段推定装置の時空間頻度記憶部に記憶したデータを用いて求め、当該選択スコアがスコア閾値よりも大きい事例をラベルなし事例記憶部から抽出し、当該抽出した事例を外部に提示して注釈を要求し、入力された注釈を正解ラベルとした抽出した事例を、訓練事例記憶部に追加し、訓練事例記憶部に記憶した全ての事例を用いて、移動手段を予測する予測モデルを再計算する処理を、ラベルなし事例記憶部に記憶した事例の数が閾値以下になるまで繰り返す。
また、本発明のプログラムは、上記の移動手段推定装置の各機能部をコンピュータに機能させるためのプログラムである。
本発明の移動手段推定装置とその方法とプログラムによれば、移動手段を正しく表すラベルが与えられた事例の数が少なくても、予測モデルの予測精度を向上させることができ、ユーザの移動手段の推定精度を向上させることが可能である。
本発明の実施形態の移動手段推定装置100の機能構成例を示す図。 移動手段推定装置100をコンピュータで構成した場合の機能構成例を示す図。 移動手段推定装置100が、予測モデルを生成する動作フローを示す図。 移動手段推定装置100の時空間頻度計算部10の動作フローを示す図。 移動手段推定装置100のGPS履歴情報記憶部60に記憶された情報の例を示す図。 移動手段推定装置100の正解アノテーション記憶部85に記憶された情報の例を示す図。 移動手段推定装置100の時空間頻度記憶部20に記憶された情報の例を示す図。 移動手段推定装置100のセグメント抽出機能部70の動作フローを示す図。 移動手段推定装置100のセグメント記憶部65に記憶された情報の例を示す図。 移動手段推定装置100の事例生成機能部60の動作フローを示す図。 移動手段推定装置100の訓練事例記憶部40に記憶された情報の例を示す図。 移動手段推定装置100のラベルなし事例記憶部30に記憶された情報の例を示す図。 移動手段推定装置100の予測モデル生成機能部50の機能構成例を示す図。 予測モデル生成機能部50の動作フローを示す図。 移動手段推定装置100の予測モデル記憶部90に記憶された情報の例を示す図。
以下、この発明の実施の形態を図面を参照して説明する。複数の図面中同一のものには
同じ参照符号を付し、説明は繰り返さない。
図1に、本実施形態の移動手段推定装置100の機能構成例を示す。移動手段推定装置100は、ユーザの位置をGPSで記録したGPS履歴情報に基づいて移動手段を推定するものである。
移動手段とは、ユーザが移動するのに用いる徒歩、車、電車、バスなどのことである。移動手段が正しく推定できれば、ユーザが携帯する機器において適切なサービスを提供することが可能である。例えば、ユーザが車を運転中の場合と電車で移動中の場合で、提供するサービスを異ならせることができる。
移動手段推定装置100は、時空間頻度計算部10、時空間頻度記憶部20、ラベルなし事例記憶部30、訓練事例記憶部40、予測モデル生成機能部50、事例生成機能部60、セグメント記憶部65、セグメント抽出機能部70、GPS履歴情報記憶部80、正解アノテーション記憶部85、予測モデル記憶部90を具備する。移動手段推定装置100は、例えば、コンピュータで実現することができる。
移動手段推定装置100をコンピュータで実現した場合の機構構成例を図2に示す。図2において、時空間頻度記憶部20、ラベルなし事例記憶部30、訓練事例記憶部40、セグメント記憶部65、GPS履歴情報記憶部80、正解アノテーション記憶部85、予測モデル記憶部90、の各記憶部は、図1との対応を分かり易くする目的でそれぞれを個別に表記している。なお、各記憶部はメモリ6に全て集約してもよい。
時空間頻度計算部10と予測モデル生成機能部50と事例生成機能部60の各機能部で行う処理は、CPU5がプログラムを実行することで実現される。入力部7は例えばキーボードであり、本実施形態では入力部7からユーザの操作によって注釈が入力される。表示部8には、推定した移動手段が例えば地図情報と共に表示される。
図3に、移動手段推定装置100が予測モデルを生成する全体の動作フローを示す。図1と図3を参照して予測モデルを生成する全体の流れを説明する。
時空間頻度計算部10は、GPS履歴情報記憶部80に記憶されたログ情報と、正解アノテーション記憶部85に記憶されたある時間区間において利用した移動手段の情報を用いて、ユーザIDと、地図上の一定領域を表すメッシュIDと、1日内の時間帯と、ある時間帯にあるユーザがある一定領域に入った頻度を計算し、それらの情報を時空間頻度記憶部20に記憶する(ステップS10)。
事例生成機能部60は、GPS履歴情報記憶部80に記憶されたログ情報と、正解アノテーション記憶部85に記憶されたある時間区間において利用した移動手段の情報と、セグメント記憶部65に記憶された移動手段が同一の区間を表すセグメント情報から、予測モデルを生成するための移動手段の事例を正しく表す正解ラベルと特徴量の訓練事例を生成し、訓練事例記憶部40に記憶する(ステップS20)。また、事例生成機能部60は、正解ラベルが与えられていない事例の特徴量を生成し、ラベルなし事例記憶部30に記憶する(ステップS30)。
予測モデル生成機能部50は、訓練事例記憶部40に記憶した全ての事例から、移動手段を予測する予測モデルを生成し、ラベルなし事例記憶部30に記憶した事例の数が閾値以下の場合に、予測モデルを出力し、ラベルなし事例記憶部30に記憶した事例の数が閾値より大きい場合に、正解ラベルが与えられていない事例に正解ラベルを付与したときに予測モデルの信頼度が向上する程度を表す選択スコアを、時空間頻度記憶部20に記憶したデータを用いて求め、当該選択スコアがスコア閾値よりも大きい事例をラベルなし事例記憶部30から抽出し、当該抽出した事例を外部に提示して注釈を要求し、入力された注釈を正解ラベルとした抽出した事例を、訓練事例記憶部40に追加し、訓練事例記憶部40に記憶した全ての事例を用いて、移動手段を予測する予測モデルを再計算する処理を、ラベルなし事例記憶部30に記憶した事例の数が閾値以下になるまで繰り返して予測モデルを生成する(ステップS40)。
以降、図面を参照して移動手段推定装置100の各機能構成部の動作を詳しく説明する。
〔時空間頻度計算部〕
図4に、時空間頻度計算部10の動作フローを示す。時空間頻度計算部10は、ユーザの位置をGPSで記録したGPS履歴情報記憶部80から未処理のユーザIDを取得してuとする(ステップS11)。
図5に、GPS履歴情報記憶部60に記憶されたGPS履歴情報の例を示す。図5の1行はGPS履歴情報の1レコードを表す。1レコードは、ログIDとユーザIDとGPSロガーによって取得された取得時刻、緯度、経度、の情報を含む。図5は、ログIDの時間間隔を3秒で示すように3秒周期でGPS履歴情報が記憶される例を示す。
レコードはログIDで識別できる。ログIDは全ユーザに渡って一意である。ユーザID=1が未処理であれば、ユーザID=1をuとする。
次に、時空間頻度計算部10は、正解アノテーション記憶部85からユーザID=uに該当するレコードを取得する(ステップS12)。正解アノテーション記憶部85は、各ユーザについて、ある時間区間においてどのような移動手段(正解ラベル)を利用したのかを正しく表す情報を記憶する。
図6に、正解アノテーション記憶部85に記憶された情報を例示する。図6の1行は正解アノテーション情報の1レコードを表す。1レコードは、ユーザIDと、開始時刻と終了時刻によって特定される時間区間と、当該時間区間に利用した移動手段(正解ラベル)の情報を含む。なお、正解アノテーション記憶部85には、GPS履歴情報記憶部80に記憶されたGPS履歴情報に対応する全ての情報が記憶されている必要はない。また、ある時間区間に対して、複数の異なる正解ラベルが付与されていることはないものとする。
時空間頻度計算部10は、正解アノテーション情報の時間区間に対応する同一ユーザの測位点を、GPS履歴情報の経度/緯度情報を用いて求め、その測位点の集合に対応するメッシュIDの集合を取得して時間帯ごとの頻度情報を計算する(ステップS13)。頻度情報は、当該時間帯にメッシュIDの領域をユーザが訪問した頻度を表す。なお、頻度情報は、ユーザが訪問したら必ず1を加算するのではなく、ある1日の側位点集合に対して1しか加算しないなど他のカウント方法を用いて計算してもよい。
メッシュIDは、地理上の一定領域を表すメッシュに対応するIDで、例えば標準地域メッシュ(JISX0410地域メッシュコード)などを用いることができる。時間帯には例えば24時間を4分割した単位を用いることができる。他にも1時間ごとの単位や、朝、昼、晩、といった単位を用いることもできる。
時空間頻度計算部10は、計算した頻度情報を、時空間頻度記憶部20に記憶する(ステップS14)。そして、未処理のユーザが無くなるまでステップS11〜S14までの処理を繰り返し(ステップS15のYES)、未処理のユーザが無くなった時点で上記の処理を終了する(ステップS15のNO)。
図7に、時空間頻度記憶部20に記憶された時空間頻度情報の例を示す。ユーザID=1のユーザが、1日を4分割した時間帯にメッシュIDで表される一定領域に訪問した頻度が記憶される。図7に示す例は、ユーザID=1のユーザがAM6時−12時の時間帯に5438-2343のメッシュIDで表される領域に3回訪問したことを表している。
〔セグメント抽出機能部〕
図8に、セグメント抽出機能部70の動作フローを示す。セグメント抽出機能部70は、GPS履歴情報記憶部80から、同じ移動手段で移動した連続する軌跡の最小単位であるセグメントを抽出する。
セグメントは、GPS履歴情報記憶部60に記憶された連続する複数のレコード(図5の1行)で構成され、複数のセグメントは連続するGPS軌跡(GPS Trajectory)の単位を構成する。1つのセッションは、例えば、バスで移動したセグメントと、徒歩で移動したセグメントと、バイクで移動したセグメントの3つのセグメントで構成される。
セグメント抽出機能部70は、GPS履歴情報記憶部80から未処理のユーザIDを取得してuとする(ステップS71)。そして、例えばユーザID=1をuとして、該当するレコード集合をGPS履歴情報記憶部80から取得し、当該レコード集合をセッションに分割する(ステップS72)。セッション分割の方法としては、連続するレコードの時刻に、閾値θs秒以上の差がある場合に分割点とする。閾値θsは予め設定されているものとする。セッション分割の他の方法としては、例えば非特許文献1に記載されている方法を用いることができる。
次に、セグメント抽出機能部70は、セッションをセグメントに分割する(ステップS73)。セグメント分割の方法としては、非特許文献1に記載された公知の方法を用いることができる。
セグメント抽出機能部70は、セッションを分割して抽出したセグメントを、セグメント記憶部65に記憶する(ステップS74)。そして、未処理のユーザが無くなるまでステップS71〜S74までの処理を繰り返し(ステップS75のYES)、未処理のユーザが無くなった時点で上記の処理を終了する(ステップS75のNO)。
図9に、セグメント記憶部65に記憶されたセグメント情報の例を示す。セグメント情報は、セグメントID、セッションID、ユーザID、開始ログID、終了ログIDからなる。開始ログIDと終了ログIDは、GPS履歴情報記憶部80に記憶されたログIDのID番号と対応している。
この例では、開始ログID=1〜終了ログID=10までのセグメントID=1と、開始ログID=11〜終了ログID=204までのセグメントID=2の2つで、1つのセッション1が構成される。
〔事例生成機能部〕
図10に、事例生成機能部60の動作フローを示す。事例生成機能部60は、GPS履歴情報と正解アノテーション情報とセグメント情報を入力として、移動手段の事例を正しく表す正解ラベルと当該事例の特徴ベクトルと、正解ラベルが与えられていない事例の特徴ベクトルを生成する。
事例生成機能部60は、セグメント記憶部65に記憶されたセグメント情報から未処理のセグメント情報を選択してsとする(ステップS61)。次に、選択したセグメント情報sの開始ログIDと終了ログIDの区間に該当するレコードを、GPS履歴情報記憶部80から読み出す。そして、読み出したレコードからセグメント情報sの特徴を抽出する(ステップS62)。
特徴には、例えばセグメント情報sの開始ログID〜終了ログID間における平均速度などを利用する。特徴抽出には、例えば非特許文献1に記載された公知の方法を用いることができる。抽出された特徴はM次元のベクトルx,x,…,xで表現される。
次に、事例生成機能部60は、セグメント情報sに対応するラベル(移動手段)を、正解アノテーション記憶部85から読み込む(ステップS63)。具体的に説明する。
正解アノテーション情報のうち、セグメント情報sのユーザIDと同じユーザIDを持つ各レコード(図6の1行)の開始時刻と終了時刻の時刻範囲に対する、セグメント情報sの開始ログIDがGPS履歴情報記憶部80で持つ時刻(開始時刻)と、終了ログIDがGPS履歴情報記憶部80で持つ時刻(終了時刻)とで決まる時刻範囲の被覆率が、最大のレコードを選択し、そのレコードが持つ移動手段を正解ラベルとして採用する。
正解アノテーション情報の移動手段(正解ラベル)を、セグメント情報sから求めた特徴に与えるか否かは、被覆率で判定する。被覆率が閾値θc以上で且つ最大のセグメント情報sの特徴は、移動手段の事例を正しく表すものとして、当該特徴に正解ラベルを与える。ラベルが与えられた特徴は、訓練事例として訓練事例記憶部40に記憶する(ステップS65)。
被覆率が閾値θc未満のセグメント情報sは正解ラベルがないものとして、当該セグメント情報sのユーザID、セッションID、特徴、メッシュID、時間帯、をラベルなし事例としてラベルなし事例記憶部30に記憶する(ステップS66)。ここでのメッシュIDは、セグメントの開始位置又は終了位置又は中間位置に対応するメッシュIDを用いることができる。また、時簡帯についても開始位置又は終了位置又は中間位置に対応する時簡帯などを用いることができる。
事例生成機能部60は、未処理のセグメント情報sが無くなるまでステップS61〜S66までの処理を繰り返し(ステップS67のYES)、未処理のセグメント情報sが無くなった時点で上記の処理を終了する(ステップS67のNO)。
図11に、事例生成機能部60が生成した訓練事例の例を示す。移動手段(正解ラベル)に対応する特徴ベクトルが記憶されている。図12に、事例生成機能部60が生成したラベルなし事例の例を示す。セッションIDごとに特徴ベクトルとメッシュIDと時間帯が、ユーザIDごとに記憶されている。
〔予測モデル生成機能部〕
図13に、予測モデル生成機能部50のより具体的な機能構成例を示す。予測モデル生成部機能50は、予測モデル生成部52と、予測モデル出力部53と、選択スコア計算部54と、アノテーション要求部55と、ラベルなし事例記憶更新部56と、予測モデル再計算部57とを具備する。
図14に、予測モデル生成機能部50の動作フローを示す。図13と図14を参照して予測モデル生成機能部50の動作を説明する。予測モデル生成部52は、訓練事例記憶部40に記憶された全ての訓練事例を読み込み訓練事例集合Tとする(ステップS51)。そして、訓練事例集合Tを用いて予測モデルCを生成する(ステップS52)。予測モデルCは、訓練事例記憶部40に記憶した全ての事例を用いたマルチクラス分類によって生成される。
マルチクラス分類とは、複数のクラスの中から一つを予測する分類法である。その予測モデルの構築は、例えば非特許文献2に記載された公知の方法を用いて行う。この方法以外でも、マルチクラス分類が可能な教師あり機械学習方法であれば任意の方法を利用することができる。本実施形態では、特徴ベクトルと同じ次元の重みベクトルの内積によって予測を行う線形識別モデルの例で説明を行うが、本実施形態に利用可能なアルゴリズムは線形識別モデルに限定されない。非線形モデルを適用する場合には、予測モデルを記憶する記憶部のデータ構造にアルゴリズムに合わせたスキーマを用いる。
予測モデル出力部53は、ラベルなし事例記憶部30に記憶したラベルなし事例集合Uの要素数(事例の数)が閾値θ以下の場合に、予測モデルCを外部に出力(ステップS53のYES)し、予測モデル記憶部90に記憶(ステップS58)して動作を終了する。当該事例の数が閾値θより大きい場合に、予測モデルCを選択スコア計算部54に出力する(ステップS53のNO)。閾値θは予め設定されているものとする。
選択スコア計算部54は、予測モデルCを用いてラベルなし事例記憶部30に記憶した各事例について移動手段の予測を行い、当該予測の確からしさの程度を表す確信度Fと、時空間頻度記憶部20に記憶したメッシュIDと時間帯とから時空間的な珍しさの程度を表す地理スコアGを求め、確信度Fと地理スコアGから、予測モデルの性能が向上する程度を表す選択スコアSを計算する(ステップS54)。確信度Fには、線形識別モデルの場合、例えば特徴ベクトルと重みベクトルの内積の値の最大値などを用いることができる。他には、例えば非特許文献2に記載された公知の方法を用いることができる。このような確信度Fを計算できない予測モデルを利用する場合には、確信度Fは1であるものとする。
地理スコアGは、ラベルなし事例のメッシュIDと時間帯情報を用いて計算する。ラベルなし事例集合Uに含まれるある事例のユーザIDをu、メッシュIDをm、時間帯をt、とすると地理スコアGは式(1)で算出する。
Figure 0006174527
ここでc(u,m,t)は、時空間頻度記憶部20におけるユーザu,メッシュID,時間帯
tの頻度を表す。同様にc(u,m)はユーザu,メッシュIDの頻度、c(u,t)はユーザu,時間帯tの頻度、c(m,t)はメッシュID, 時間帯tの頻度、c(u)はユーザuの頻度、c(m)はメッシュIDの頻度、c(t)は時間帯tの頻度を表す。また、λ,…,λは各頻度の重み係数でありλ+…+λ=1となるように予め設定されているものとする。
確信度Fと地理スコアGを用いて選択スコアSは、例えば式(2)で算出できる。
Figure 0006174527
ここでαは重みパラメータであり予め設定されているものとする。選択スコアSが大きいほど、現在の予測モデルCでは正確な移動手段の予測が困難であることを表す。
選択には、例えば選択スコアSに対する閾値θs以上の事例のみを選択する方法を用いることができる。閾値θsは予め設定されているものとする。また、同じユーザIDを持つラベルなし事例集合Uに対する選択スコアSの最小値に対して閾値θsを設けてもよい。選択された事例集合を追加事例集合Vとし、ラベルなし事例集合Uから取り除く(式(3))。
Figure 0006174527
更新したラベルなし事例集合Uをラベルなし事例記憶部30に出力する(式(4))。
Figure 0006174527
アノテーション要求部55は、選択スコアSがスコア閾値θs以上のラベルなし事例記憶部30に記憶した各事例を抽出し、当該抽出した事例を外部に提示してアノテーションを要求する(ステップS55)。アノテーションを要求するとは、例えばユーザに事例を提示して、当該事例でユーザが利用した移動手段(注釈:正解ラベル)の入力を要求することである。選択された追加事例集合Vをユーザに提示し、アノテーションを要求する。追加事例集合Vの提示方法としては、セグメントに対応する事例を地図上に可視化するなどの方法を用いることができる。ユーザによって入力されたアノテーションを正解ラベルとして採用する。
ラベルなし事例記憶更新部56は、入力されたアノテーションをラベルとした抽出した事例を、ラベルなし事例記憶部30から削除すると共に、抽出した事例を訓練事例記憶部40に追加する(ステップS56)。追加する事例は、選択スコアSを用いてラベルなし事例記憶部30の事例集合Uの中から追加学習に用いる事例を選択する。
予測モデル再計算部57は、訓練事例記憶部40に記憶した全ての事例(訓練事例集合T)から、移動手段を予測する予測モデルCを再計算して予測モデル出力部53に出力する(ステップS57)。予測モデル再計算部57は、新たに設定された訓練事例集合Tを用いて予測モデルCの生成を行う。ここで予測モデルCを再計算する方法は、上記のステップS52と同じアルゴリズムを用いる。
予測モデル出力部53は、ラベルなし事例記憶部30に記憶した事例の数が閾値θ以下になるまで上記のステップS53〜ステップS57の処理を繰り返す。したがって、ラベルなし事例記憶部30に記憶した事例の数が、所定の数より少なってから予測モデルCが出力される。つまり、所定の数より多い訓練事例から生成した予測モデルCが出力されることになる。
以上説明したように本実施形態の移動手段推定装置100によれば、少量の正解ラベルが与えられている状況において、ラベルが与えられていないラベルなし事例集合から予測モデルの性能を向上させる観点で事例を選択することが可能になる。そして、その選択したラベルなし事例に対してアノテーションを要求し正解ラベルを追加することで予測モデルの性能向上が可能となる。その結果、ユーザの移動手段の推定精度を向上させることができる。
これらの効果を奏する本実施形態の作用をまとめると次のようになる。移動手段推定装置100の予測モデル生成機能部50が、現在の訓練事例に含まれていない事例に対して、現在の予測モデルの確からしさの程度を表す確信度Fと、時空間頻度記憶部20を用いて時空間の観点で予測モデルの構築に既に同じ事例が利用されたかという観点を表す地理スコアを計算し、これらの2つの観点を用いることで予測モデルの性能が向上する程度を表す選択スコアを計算する。この選択スコアは、移動手段を推定する予測モデルの性能が向上する程度を表す。
予測モデル生成機能部50のアノテーション要求部55は、予測モデルの性能が向上する程度の高い事例をユーザに提示してアノテーションを要求する。そして、ラベルなし事例記憶更新部56が、入力されたアノテーションを正解ラベルとした事例を訓練事例記憶部40に追加する。この訓練事例が追加される処理は、ラベルなし事例の数が所定数より少なくなるまで繰り返される。予測モデル再計算部57は、このように追加された訓練事例集合から予測モデルを再計算する。したがって、移動手段を推定する予測モデルの予測精度を向上させることができる。
なお、本実施形態では、アノテーションをユーザに対して要求する例で説明を行ったが、正解ラベルが例えば行動ログに記憶されていれば、その行動ログを参照して正解ラベルを自動的に取得するように構成してもよい。このように、本発明は、その要旨の範囲内で変形が可能である。
上記装置における処理部をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、各装置における処理部がコンピュータ上で実現される。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記録装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としても良い。
また、各手段は、コンピュータ上で所定のプログラムを実行させることにより構成することにしてもよいし、これらの処理内容の少なくとも一部をハードウェア的に実現することとしても良い。
10 :時空間頻度計算部
20 :時空間頻度記憶部
30 :ラベルなし事例記憶部
40 :訓練事例記憶部
50 :予測モデル生成機能部
52 :予測モデル生成部
53 :予測モデル出力部
54 :選択スコア計算部
55 :アノテーション要求部
56 :ラベルなし事例記憶更新部
57 :予測モデル再計算部
60 :事例生成機能部
65 :セグメント記憶部
70 :セグメント抽出機能部
80 :GPS履歴情報記憶部
85 :正解アノテーション記憶部
100:移動手段推定装置

Claims (5)

  1. ユーザの位置をGPSで記録したGPS履歴情報に基づいて移動手段を推定する移動手段推定装置であって、
    ユーザを識別するユーザIDと、地図上の一定領域を表すメッシュIDと、1日内の時間帯と、前記時間帯に前記ユーザが前記一定領域内に立ち入った頻度とを記憶した時空間頻度記憶部と、
    前記移動手段の事例を正しく表す正解ラベルと、前記GPS履歴情報から求めた前記事例の特徴ベクトルとを記憶した訓練事例記憶部と、
    前記正解ラベルが与えられていない前記事例の特徴ベクトルを記憶したラベルなし事例記憶部と、
    前記訓練事例記憶部に記憶した全ての前記事例から、前記移動手段を予測する予測モデルを生成し、前記ラベルなし事例記憶部に記憶した前記事例の数が閾値以下の場合に、前記予測モデルを出力し、前記ラベルなし事例記憶部に記憶した前記事例の数が前記閾値より大きい場合に、前記正解ラベルが与えられていない前記事例に前記正解ラベルを付与したときに前記予測モデルの信頼度が向上する程度を表す選択スコアを、前記時空間頻度記憶部に記憶したデータを用いて求め、当該選択スコアがスコア閾値よりも大きい前記事例を前記ラベルなし事例記憶部から抽出し、当該抽出した事例を外部に提示して注釈を要求し、入力された注釈を前記正解ラベルとした前記抽出した事例を、前記訓練事例記憶部に追加し、前記訓練事例記憶部に記憶した全ての前記事例を用いて、前記移動手段を予測する予測モデルを再計算する処理を、前記ラベルなし事例記憶部に記憶した前記事例の数が前記閾値以下になるまで繰り返す予測モデル生成機能部とを具備することを特徴とする移動手段推定装置。
  2. 請求項1に記載した移動手段推定装置において、
    前記予測モデル生成機能部は、
    前記訓練事例記憶部に記憶した全ての前記事例を用いたマルチクラス分類を行って予測モデルを生成する予測モデル生成部と、
    前記ラベルなし事例記憶部に記憶した前記事例の数が閾値以下の場合に、前記予測モデルを外部に出力し、前記事例の数が閾値より大きい場合に、前記予測モデルを選択スコア計算部に出力する予測モデル出力部と、
    前記予測モデルを用いて前記ラベルなし事例記憶部に記憶した各事例について前記移動手段の予測を行い、当該予測の確からしさの程度を表す確信度と、前記時空間頻度記憶部に記憶した前記メッシュIDと前記時間帯とから時空間的な珍しさの程度を表す地理スコアを求め、前記確信度と前記地理スコアとから、予測モデルの性能が向上する程度を表す選択スコアを計算する選択スコア計算部と、
    前記選択スコアがスコア閾値以上の前記ラベルなし事例記憶部に記憶した各事例を抽出し、当該抽出した事例を外部に提示してアノテーションを要求するアノテーション要求部と、
    入力された前記アノテーションを正解ラベルとした前記抽出した前記事例を、前記ラベルなし事例記憶部から削除すると共に、前記抽出した前記事例を前記訓練事例記憶部に追加するラベルなし事例記憶更新部と、
    前記訓練事例記憶部に記憶した全ての前記事例から、前記移動手段を予測する予測モデルを再計算して前記予測モデル生成部に出力する予測モデル再計算部とを具備することを特徴とする移動手段推定装置。
  3. 請求項2に記載した移動手段推定装置において、
    前記地理スコアは次式で計算し、
    Figure 0006174527
    ここでGは地理スコア、c(u,m,t)は前記時空間頻度記憶部におけるユーザu,メッシュ
    ID,時間帯tの頻度、c(u,m)はユーザu,メッシュIDの頻度、c(u,t)はユーザu,時間帯tの頻度、c(m,t)はメッシュID, 時間帯tの頻度、c(u)はユーザuの頻度、c(m)はメッシュIDの頻度、c(t)は時間帯tの頻度を表し、λはλ+…+λ=1となる重み係数であり、
    前記選択スコアは次式で計算し、
    Figure 0006174527
    ここでSは選択スコア、Fは前記確信度、αは重みパラメータであることを特徴とする移動手段推定装置。
  4. ユーザの位置をGPSで記録したGPS履歴情報から移動手段を推定する移動手段推定装置の動作方法であって、
    前記移動手段推定装置の予測モデル生成機能部が、前記移動手段推定装置の訓練事例記憶部に記憶した全ての事例から、前記移動手段を予測する予測モデルを生成し、前記移動手段推定装置のラベルなし事例記憶部に記憶した前記事例の数が閾値以下の場合に、前記予測モデルを出力し、前記ラベルなし事例記憶部に記憶した前記事例の数が前記閾値より大きい場合に、前記移動手段の事例を正しく表す正解ラベルが与えられていない前記事例に当該正解ラベルを付与したときに前記予測モデルの信頼度が向上する程度を表す選択スコアを、前記移動手段推定装置の時空間頻度記憶部に記憶したデータを用いて求め、当該選択スコアがスコア閾値よりも大きい前記事例を前記ラベルなし事例記憶部から抽出し、当該抽出した事例を外部に提示して注釈を要求し、入力された注釈を前記正解ラベルとした前記抽出した事例を、前記訓練事例記憶部に追加し、当該訓練事例記憶部に記憶した全ての前記事例を用いて、前記移動手段を予測する予測モデルを再計算する処理を、前記ラベルなし事例記憶部に記憶した前記事例の数が前記閾値以下になるまで繰り返すことを特徴とする移動手段推定装置の動作方法。
  5. 請求項1乃至3の何れかに記載した移動手段推定装置としてコンピュータを機能させるためのプログラム。
JP2014139441A 2014-07-07 2014-07-07 移動手段推定装置、その動作方法およびプログラム Active JP6174527B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014139441A JP6174527B2 (ja) 2014-07-07 2014-07-07 移動手段推定装置、その動作方法およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014139441A JP6174527B2 (ja) 2014-07-07 2014-07-07 移動手段推定装置、その動作方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2016018308A JP2016018308A (ja) 2016-02-01
JP6174527B2 true JP6174527B2 (ja) 2017-08-02

Family

ID=55233510

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014139441A Active JP6174527B2 (ja) 2014-07-07 2014-07-07 移動手段推定装置、その動作方法およびプログラム

Country Status (1)

Country Link
JP (1) JP6174527B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109978491B (zh) * 2019-02-12 2024-02-06 平安科技(深圳)有限公司 提醒预测方法、装置、计算机设备及存储介质
JP7419035B2 (ja) * 2019-11-22 2024-01-22 キヤノン株式会社 学習モデル管理システム、学習モデル管理方法、およびプログラム
CN112016633B (zh) * 2020-09-25 2024-09-06 北京百度网讯科技有限公司 一种模型训练方法、装置、电子设备及存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008276453A (ja) * 2007-04-27 2008-11-13 Toshiba Corp 行動識別装置および行動識別方法
US8015144B2 (en) * 2008-02-26 2011-09-06 Microsoft Corporation Learning transportation modes from raw GPS data
JP5222189B2 (ja) * 2009-03-19 2013-06-26 株式会社エヌ・ティ・ティ・ドコモ 移動手段推定装置及び移動手段推定方法
WO2013179359A1 (ja) * 2012-06-01 2013-12-05 株式会社日立製作所 移動手段判別システム、移動手段判別装置、及び移動手段判別プログラム

Also Published As

Publication number Publication date
JP2016018308A (ja) 2016-02-01

Similar Documents

Publication Publication Date Title
CN110235148B (zh) 训练动作选择神经网络
JP7203769B2 (ja) ボクセルベースのグランド平面推定およびオブジェクト区分化
CN102203729B (zh) 用于基于位置历史确定用户相似性的方法和系统
KR102033050B1 (ko) 시간차 모델을 위한 비지도 학습 기법
CN110704741B (zh) 基于时空点过程的兴趣点预测方法
JP7218754B2 (ja) 空き家判定装置、空き家判定方法およびプログラム
CN113742580B (zh) 目标类型数据的召回方法、装置、电子设备及存储介质
JP2011170453A (ja) 場所存在確率算出装置及び方法及びプログラム及びトラベルルート推薦装置及び方法及びプログラム
JP6749282B2 (ja) 人流量予測装置、人流量予測方法、及び人流量予測プログラム
CN115774819B (zh) 一种基于层次循环神经网络的兴趣点推荐方法及系统
JP6174527B2 (ja) 移動手段推定装置、その動作方法およびプログラム
JP6807822B2 (ja) 人流量予測装置、方法、及びプログラム
Cortez et al. Forecasting store foot traffic using facial recognition, time series and support vector machines
JP2015099467A (ja) 移動手段予測モデル生成装置、移動手段予測モデル生成方法及び移動手段予測モデル生成プログラム
JP6038857B2 (ja) 移動手段推定モデル生成装置、移動手段推定モデル生成方法、移動手段推定モデル生成プログラム
CN115564800A (zh) 行动轨迹预测方法和装置
JP5422539B2 (ja) 行動予測方法、装置及びプログラム
JP2014115911A (ja) 情報推薦装置、情報推薦方法、及び情報推薦プログラム
JP6414321B2 (ja) 人数予測システム、人数予測方法および人数予測プログラム
JP6433876B2 (ja) パラメータ推定装置、予測装置、方法、及びプログラム
JP6126516B2 (ja) 訪問poi推定装置
JP7617980B2 (ja) 教師モデルによる知識の抽出を用いた、自動車のアプリケーションのためのフェデレーテッドラーニングのためのシステム及び方法
Ogawa et al. Distress image retrieval for infrastructure maintenance via self-Trained deep metric learning using experts’ knowledge
JP2018077656A (ja) パラメータ推定装置、予測装置、方法、及びプログラム
JP6149024B2 (ja) 移動手段推定モデル生成装置、移動手段推定モデル生成方法、移動手段推定モデル生成プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160913

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170616

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170704

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170706

R150 Certificate of patent or registration of utility model

Ref document number: 6174527

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350