JP6174527B2 - Moving means estimation apparatus, operation method thereof, and program - Google Patents
Moving means estimation apparatus, operation method thereof, and program Download PDFInfo
- Publication number
- JP6174527B2 JP6174527B2 JP2014139441A JP2014139441A JP6174527B2 JP 6174527 B2 JP6174527 B2 JP 6174527B2 JP 2014139441 A JP2014139441 A JP 2014139441A JP 2014139441 A JP2014139441 A JP 2014139441A JP 6174527 B2 JP6174527 B2 JP 6174527B2
- Authority
- JP
- Japan
- Prior art keywords
- storage unit
- case
- prediction model
- moving means
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Navigation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、利用者がどのような移動手段を利用したかを推定する移動手段推定装置、その方法およびプログラムに関する。 The present invention relates to a moving means estimating apparatus, a method and a program for estimating what moving means a user has used.
ユーザの位置をGPSロガー等の装置で蓄積したGPS履歴情報を利用して、ユーザがどのような移動手段を利用したかを推定する技術がある(例えば非特許文献1)。ユーザの利用した移動手段を推定するには、GPS履歴情報から異なる移動手段を利用したと想定される区間(セグメント)に分割して当該区間を抽出する前処理を行う。そして、抽出されたセグメントに対してGPS履歴情報から特徴を抽出する。その特徴を分類器で分類して移動手段の判定を行う。 There is a technique for estimating what moving means a user has used by using GPS history information accumulated by a device such as a GPS logger (for example, Non-Patent Document 1). In order to estimate the moving means used by the user, preprocessing is performed to divide the GPS history information into sections (segments) assumed to use different moving means and extract the sections. Then, a feature is extracted from the GPS history information for the extracted segment. The features are classified by a classifier and the moving means is determined.
ここで、移動手段判定の分類器については、予め人手によって用意された正解データを利用して、教師あり機械学習(例えば非特許文献2)の枠組みで生成することが可能である(非特許文献1)。 Here, the classifier for moving means determination can be generated in the framework of supervised machine learning (for example, Non-Patent Document 2) using correct data prepared in advance by hand (Non-Patent Document 2). 1).
しかしながら、正解データを作成するコストが高いため、限られた数の正解データしか用意することができないという課題がある。そのため、予測モデルの予測精度が低下し、移動モード判定の判定精度が悪化してしまう課題がある。 However, since the cost of creating correct data is high, there is a problem that only a limited number of correct data can be prepared. Therefore, there is a problem that the prediction accuracy of the prediction model is lowered and the determination accuracy of the movement mode is deteriorated.
本発明は、この課題に鑑みてなされたものであり、限られた数の正解データしかなくても予測モデルの予測精度を劣化させないようにした移動手段推定装置、その動作方法およびプログラムを提供することを目的とする。 The present invention has been made in view of this problem, and provides a moving means estimation device, an operation method thereof, and a program that do not deteriorate the prediction accuracy of a prediction model even when there is a limited number of correct answer data. For the purpose.
本願発明の移動手段推定装置は、ユーザの位置をGPSで記録したGPS履歴情報に基づいて移動手段を推定する移動手段推定装置であって、時空間頻度記憶部と訓練事例記憶部とラベルなし事例記憶部と予測モデル生成機能部とを具備する。時空間頻度記憶部は、ユーザを識別するユーザIDと、地図上の一定領域を表すメッシュIDと、1日内の時間帯と、時間帯にユーザが一定領域内に立ち入った頻度とを記憶する。訓練事例記憶部は、移動手段の事例を正しく表す正解ラベルと、GPS履歴情報から求めた事例の特徴ベクトルとを記憶する。ラベルなし事例記憶部は、正解ラベルが与えられていない事例の特徴ベクトルを記憶する。予測モデル生成機能部は、訓練事例記憶部に記憶した全ての事例から、移動手段を予測する予測モデルを生成し、ラベルなし事例記憶部に記憶した事例の数が閾値以下の場合に、予測モデルを出力し、ラベルなし事例記憶部に記憶した事例の数が閾値より大きい場合に、正解ラベルが与えられていない事例に正解ラベルを付与したときに予測モデルの信頼度が向上する程度を表す選択スコアを、時空間頻度記憶部に記憶したデータを用いて求め、当該選択スコアがスコア閾値よりも大きい事例をラベルなし事例記憶部から抽出し、当該抽出した事例を外部に提示して注釈を要求し、入力された注釈を正解ラベルとした抽出した事例を、訓練事例記憶部に追加し、訓練事例記憶部に記憶した全ての事例を用いて、移動手段を予測する予測モデルを再計算する処理を、ラベルなし事例記憶部に記憶した事例の数が閾値以下になるまで繰り返す。 The movement means estimation apparatus of the present invention is a movement means estimation apparatus that estimates movement means based on GPS history information in which a user's position is recorded by GPS, and includes a spatio-temporal frequency storage unit, a training case storage unit, and an unlabeled case A storage unit and a prediction model generation function unit are provided. The spatiotemporal frequency storage unit stores a user ID for identifying a user, a mesh ID representing a certain area on the map, a time zone within a day, and a frequency at which the user has entered the certain area during the time zone. The training case storage unit stores a correct answer label that correctly represents the case of the moving means and a feature vector of the case obtained from the GPS history information. The unlabeled case storage unit stores a feature vector of a case that is not given a correct answer label. The prediction model generation function unit generates a prediction model for predicting the moving means from all cases stored in the training case storage unit, and when the number of cases stored in the unlabeled case storage unit is equal to or less than a threshold value, the prediction model This is a selection that represents the degree to which the reliability of the prediction model is improved when a correct label is assigned to a case that is not given a correct answer label when the number of cases stored in the unlabeled case storage unit is larger than a threshold. The score is obtained using the data stored in the spatio-temporal frequency storage unit, the case where the selected score is larger than the score threshold is extracted from the unlabeled case storage unit, and the extracted case is presented to the outside to request an annotation. A prediction model that adds an extracted case with the input annotation as a correct answer label to the training case storage unit and predicts the moving means using all cases stored in the training case storage unit The process of recalculating is repeated until the number of cases stored in the unlabeled example storage unit falls below the threshold value.
また、本願発明の移動手段推定装置の動作方法は、ユーザの位置をGPSで記録したGPS履歴情報から移動手段を推定する移動手段推定装置の動作方法であって、予測モデル生成機能部が、移動手段推定装置の訓練事例記憶部に記憶した全ての事例から、移動手段を予測する予測モデルを生成し、移動手段推定装置のラベルなし事例記憶部に記憶した事例の数が閾値以下の場合に、予測モデルを出力し、ラベルなし事例記憶部に記憶した事例の数が閾値より大きい場合に、正解ラベルが与えられていない事例に正解ラベルを付与したときに予測モデルの信頼度が向上する程度を表す選択スコアを、移動手段推定装置の時空間頻度記憶部に記憶したデータを用いて求め、当該選択スコアがスコア閾値よりも大きい事例をラベルなし事例記憶部から抽出し、当該抽出した事例を外部に提示して注釈を要求し、入力された注釈を正解ラベルとした抽出した事例を、訓練事例記憶部に追加し、訓練事例記憶部に記憶した全ての事例を用いて、移動手段を予測する予測モデルを再計算する処理を、ラベルなし事例記憶部に記憶した事例の数が閾値以下になるまで繰り返す。 The operation method of the moving means estimating apparatus of the present invention is an operating method of the moving means estimating apparatus that estimates the moving means from GPS history information in which the position of the user is recorded by GPS, and the prediction model generation function unit moves When all cases stored in the training example storage unit of the means estimation device generate a prediction model for predicting the movement means, and the number of cases stored in the unlabeled case storage unit of the movement means estimation device is less than or equal to the threshold, When the number of cases stored in the unlabeled case storage unit is larger than the threshold, the degree to which the reliability of the prediction model is improved when a correct label is assigned to a case that is not given a correct answer label. A selection score to be expressed is obtained using data stored in the spatio-temporal frequency storage unit of the moving means estimation device, and a case where the selection score is greater than the score threshold is stored as an unlabeled case storage unit The extracted case is presented to the outside, an annotation is requested, the extracted case with the input annotation as the correct answer label is added to the training case storage unit, and all the cases stored in the training case storage unit are stored. Using the cases, the process of recalculating the prediction model for predicting the moving means is repeated until the number of cases stored in the unlabeled case storage unit is equal to or less than the threshold value.
また、本発明のプログラムは、上記の移動手段推定装置の各機能部をコンピュータに機能させるためのプログラムである。 Moreover, the program of this invention is a program for making a computer function each function part of said moving means estimation apparatus.
本発明の移動手段推定装置とその方法とプログラムによれば、移動手段を正しく表すラベルが与えられた事例の数が少なくても、予測モデルの予測精度を向上させることができ、ユーザの移動手段の推定精度を向上させることが可能である。 According to the moving means estimation apparatus, the method, and the program of the present invention, the prediction accuracy of the prediction model can be improved even if the number of cases given labels correctly representing the moving means is small, and the moving means of the user It is possible to improve the estimation accuracy.
以下、この発明の実施の形態を図面を参照して説明する。複数の図面中同一のものには
同じ参照符号を付し、説明は繰り返さない。
Embodiments of the present invention will be described below with reference to the drawings. The same reference numerals are given to the same components in a plurality of drawings, and the description will not be repeated.
図1に、本実施形態の移動手段推定装置100の機能構成例を示す。移動手段推定装置100は、ユーザの位置をGPSで記録したGPS履歴情報に基づいて移動手段を推定するものである。 In FIG. 1, the function structural example of the moving means estimation apparatus 100 of this embodiment is shown. The moving means estimation apparatus 100 estimates moving means based on GPS history information in which a user's position is recorded by GPS.
移動手段とは、ユーザが移動するのに用いる徒歩、車、電車、バスなどのことである。移動手段が正しく推定できれば、ユーザが携帯する機器において適切なサービスを提供することが可能である。例えば、ユーザが車を運転中の場合と電車で移動中の場合で、提供するサービスを異ならせることができる。 A moving means is a walk, a car, a train, a bus, or the like used by a user to move. If the moving means can be estimated correctly, it is possible to provide an appropriate service in the device carried by the user. For example, the service to be provided can be different depending on whether the user is driving a car or traveling on a train.
移動手段推定装置100は、時空間頻度計算部10、時空間頻度記憶部20、ラベルなし事例記憶部30、訓練事例記憶部40、予測モデル生成機能部50、事例生成機能部60、セグメント記憶部65、セグメント抽出機能部70、GPS履歴情報記憶部80、正解アノテーション記憶部85、予測モデル記憶部90を具備する。移動手段推定装置100は、例えば、コンピュータで実現することができる。
The movement means estimation device 100 includes a spatiotemporal
移動手段推定装置100をコンピュータで実現した場合の機構構成例を図2に示す。図2において、時空間頻度記憶部20、ラベルなし事例記憶部30、訓練事例記憶部40、セグメント記憶部65、GPS履歴情報記憶部80、正解アノテーション記憶部85、予測モデル記憶部90、の各記憶部は、図1との対応を分かり易くする目的でそれぞれを個別に表記している。なお、各記憶部はメモリ6に全て集約してもよい。
FIG. 2 shows an example of the mechanism configuration when the moving means estimating apparatus 100 is realized by a computer. In FIG. 2, each of the spatiotemporal
時空間頻度計算部10と予測モデル生成機能部50と事例生成機能部60の各機能部で行う処理は、CPU5がプログラムを実行することで実現される。入力部7は例えばキーボードであり、本実施形態では入力部7からユーザの操作によって注釈が入力される。表示部8には、推定した移動手段が例えば地図情報と共に表示される。
The processing performed by the functional units of the spatiotemporal
図3に、移動手段推定装置100が予測モデルを生成する全体の動作フローを示す。図1と図3を参照して予測モデルを生成する全体の流れを説明する。 FIG. 3 shows an overall operation flow in which the moving means estimation apparatus 100 generates a prediction model. The overall flow of generating a prediction model will be described with reference to FIGS.
時空間頻度計算部10は、GPS履歴情報記憶部80に記憶されたログ情報と、正解アノテーション記憶部85に記憶されたある時間区間において利用した移動手段の情報を用いて、ユーザIDと、地図上の一定領域を表すメッシュIDと、1日内の時間帯と、ある時間帯にあるユーザがある一定領域に入った頻度を計算し、それらの情報を時空間頻度記憶部20に記憶する(ステップS10)。
The spatio-temporal
事例生成機能部60は、GPS履歴情報記憶部80に記憶されたログ情報と、正解アノテーション記憶部85に記憶されたある時間区間において利用した移動手段の情報と、セグメント記憶部65に記憶された移動手段が同一の区間を表すセグメント情報から、予測モデルを生成するための移動手段の事例を正しく表す正解ラベルと特徴量の訓練事例を生成し、訓練事例記憶部40に記憶する(ステップS20)。また、事例生成機能部60は、正解ラベルが与えられていない事例の特徴量を生成し、ラベルなし事例記憶部30に記憶する(ステップS30)。
The case
予測モデル生成機能部50は、訓練事例記憶部40に記憶した全ての事例から、移動手段を予測する予測モデルを生成し、ラベルなし事例記憶部30に記憶した事例の数が閾値以下の場合に、予測モデルを出力し、ラベルなし事例記憶部30に記憶した事例の数が閾値より大きい場合に、正解ラベルが与えられていない事例に正解ラベルを付与したときに予測モデルの信頼度が向上する程度を表す選択スコアを、時空間頻度記憶部20に記憶したデータを用いて求め、当該選択スコアがスコア閾値よりも大きい事例をラベルなし事例記憶部30から抽出し、当該抽出した事例を外部に提示して注釈を要求し、入力された注釈を正解ラベルとした抽出した事例を、訓練事例記憶部40に追加し、訓練事例記憶部40に記憶した全ての事例を用いて、移動手段を予測する予測モデルを再計算する処理を、ラベルなし事例記憶部30に記憶した事例の数が閾値以下になるまで繰り返して予測モデルを生成する(ステップS40)。
The prediction model
以降、図面を参照して移動手段推定装置100の各機能構成部の動作を詳しく説明する。 Hereinafter, the operation of each functional component of the moving means estimating apparatus 100 will be described in detail with reference to the drawings.
〔時空間頻度計算部〕
図4に、時空間頻度計算部10の動作フローを示す。時空間頻度計算部10は、ユーザの位置をGPSで記録したGPS履歴情報記憶部80から未処理のユーザIDを取得してuとする(ステップS11)。
[Spatial frequency calculation part]
FIG. 4 shows an operation flow of the spatiotemporal
図5に、GPS履歴情報記憶部60に記憶されたGPS履歴情報の例を示す。図5の1行はGPS履歴情報の1レコードを表す。1レコードは、ログIDとユーザIDとGPSロガーによって取得された取得時刻、緯度、経度、の情報を含む。図5は、ログIDの時間間隔を3秒で示すように3秒周期でGPS履歴情報が記憶される例を示す。
FIG. 5 shows an example of GPS history information stored in the GPS history
レコードはログIDで識別できる。ログIDは全ユーザに渡って一意である。ユーザID=1が未処理であれば、ユーザID=1をuとする。 Records can be identified by log IDs. The log ID is unique across all users. If user ID = 1 is unprocessed, user ID = 1 is set to u.
次に、時空間頻度計算部10は、正解アノテーション記憶部85からユーザID=uに該当するレコードを取得する(ステップS12)。正解アノテーション記憶部85は、各ユーザについて、ある時間区間においてどのような移動手段(正解ラベル)を利用したのかを正しく表す情報を記憶する。
Next, the spatio-temporal
図6に、正解アノテーション記憶部85に記憶された情報を例示する。図6の1行は正解アノテーション情報の1レコードを表す。1レコードは、ユーザIDと、開始時刻と終了時刻によって特定される時間区間と、当該時間区間に利用した移動手段(正解ラベル)の情報を含む。なお、正解アノテーション記憶部85には、GPS履歴情報記憶部80に記憶されたGPS履歴情報に対応する全ての情報が記憶されている必要はない。また、ある時間区間に対して、複数の異なる正解ラベルが付与されていることはないものとする。
FIG. 6 illustrates information stored in the correct
時空間頻度計算部10は、正解アノテーション情報の時間区間に対応する同一ユーザの測位点を、GPS履歴情報の経度/緯度情報を用いて求め、その測位点の集合に対応するメッシュIDの集合を取得して時間帯ごとの頻度情報を計算する(ステップS13)。頻度情報は、当該時間帯にメッシュIDの領域をユーザが訪問した頻度を表す。なお、頻度情報は、ユーザが訪問したら必ず1を加算するのではなく、ある1日の側位点集合に対して1しか加算しないなど他のカウント方法を用いて計算してもよい。
The spatio-temporal
メッシュIDは、地理上の一定領域を表すメッシュに対応するIDで、例えば標準地域メッシュ(JISX0410地域メッシュコード)などを用いることができる。時間帯には例えば24時間を4分割した単位を用いることができる。他にも1時間ごとの単位や、朝、昼、晩、といった単位を用いることもできる。 The mesh ID is an ID corresponding to a mesh representing a certain geographical area. For example, a standard area mesh (JISX0410 area mesh code) can be used. For the time zone, for example, a unit obtained by dividing 24 hours into four can be used. Other units such as an hourly unit or morning, noon, and evening can also be used.
時空間頻度計算部10は、計算した頻度情報を、時空間頻度記憶部20に記憶する(ステップS14)。そして、未処理のユーザが無くなるまでステップS11〜S14までの処理を繰り返し(ステップS15のYES)、未処理のユーザが無くなった時点で上記の処理を終了する(ステップS15のNO)。
The spatiotemporal
図7に、時空間頻度記憶部20に記憶された時空間頻度情報の例を示す。ユーザID=1のユーザが、1日を4分割した時間帯にメッシュIDで表される一定領域に訪問した頻度が記憶される。図7に示す例は、ユーザID=1のユーザがAM6時−12時の時間帯に5438-2343のメッシュIDで表される領域に3回訪問したことを表している。
FIG. 7 shows an example of the spatiotemporal frequency information stored in the spatiotemporal
〔セグメント抽出機能部〕
図8に、セグメント抽出機能部70の動作フローを示す。セグメント抽出機能部70は、GPS履歴情報記憶部80から、同じ移動手段で移動した連続する軌跡の最小単位であるセグメントを抽出する。
[Segment Extraction Function]
FIG. 8 shows an operation flow of the segment
セグメントは、GPS履歴情報記憶部60に記憶された連続する複数のレコード(図5の1行)で構成され、複数のセグメントは連続するGPS軌跡(GPS Trajectory)の単位を構成する。1つのセッションは、例えば、バスで移動したセグメントと、徒歩で移動したセグメントと、バイクで移動したセグメントの3つのセグメントで構成される。
The segment is composed of a plurality of continuous records (one line in FIG. 5) stored in the GPS history
セグメント抽出機能部70は、GPS履歴情報記憶部80から未処理のユーザIDを取得してuとする(ステップS71)。そして、例えばユーザID=1をuとして、該当するレコード集合をGPS履歴情報記憶部80から取得し、当該レコード集合をセッションに分割する(ステップS72)。セッション分割の方法としては、連続するレコードの時刻に、閾値θs秒以上の差がある場合に分割点とする。閾値θsは予め設定されているものとする。セッション分割の他の方法としては、例えば非特許文献1に記載されている方法を用いることができる。
The segment
次に、セグメント抽出機能部70は、セッションをセグメントに分割する(ステップS73)。セグメント分割の方法としては、非特許文献1に記載された公知の方法を用いることができる。
Next, the segment
セグメント抽出機能部70は、セッションを分割して抽出したセグメントを、セグメント記憶部65に記憶する(ステップS74)。そして、未処理のユーザが無くなるまでステップS71〜S74までの処理を繰り返し(ステップS75のYES)、未処理のユーザが無くなった時点で上記の処理を終了する(ステップS75のNO)。
The segment
図9に、セグメント記憶部65に記憶されたセグメント情報の例を示す。セグメント情報は、セグメントID、セッションID、ユーザID、開始ログID、終了ログIDからなる。開始ログIDと終了ログIDは、GPS履歴情報記憶部80に記憶されたログIDのID番号と対応している。
FIG. 9 shows an example of segment information stored in the
この例では、開始ログID=1〜終了ログID=10までのセグメントID=1と、開始ログID=11〜終了ログID=204までのセグメントID=2の2つで、1つのセッション1が構成される。
In this example, one
〔事例生成機能部〕
図10に、事例生成機能部60の動作フローを示す。事例生成機能部60は、GPS履歴情報と正解アノテーション情報とセグメント情報を入力として、移動手段の事例を正しく表す正解ラベルと当該事例の特徴ベクトルと、正解ラベルが与えられていない事例の特徴ベクトルを生成する。
[Case generation function part]
FIG. 10 shows an operation flow of the case
事例生成機能部60は、セグメント記憶部65に記憶されたセグメント情報から未処理のセグメント情報を選択してsとする(ステップS61)。次に、選択したセグメント情報sの開始ログIDと終了ログIDの区間に該当するレコードを、GPS履歴情報記憶部80から読み出す。そして、読み出したレコードからセグメント情報sの特徴を抽出する(ステップS62)。
The case
特徴には、例えばセグメント情報sの開始ログID〜終了ログID間における平均速度などを利用する。特徴抽出には、例えば非特許文献1に記載された公知の方法を用いることができる。抽出された特徴はM次元のベクトルx1,x2,…,xMで表現される。
As the feature, for example, an average speed between the start log ID and the end log ID of the segment information s is used. For the feature extraction, for example, a known method described in
次に、事例生成機能部60は、セグメント情報sに対応するラベル(移動手段)を、正解アノテーション記憶部85から読み込む(ステップS63)。具体的に説明する。
Next, the case
正解アノテーション情報のうち、セグメント情報sのユーザIDと同じユーザIDを持つ各レコード(図6の1行)の開始時刻と終了時刻の時刻範囲に対する、セグメント情報sの開始ログIDがGPS履歴情報記憶部80で持つ時刻(開始時刻)と、終了ログIDがGPS履歴情報記憶部80で持つ時刻(終了時刻)とで決まる時刻範囲の被覆率が、最大のレコードを選択し、そのレコードが持つ移動手段を正解ラベルとして採用する。
Among the correct annotation information, the start log ID of the segment information s for the time range of the start time and end time of each record (one line in FIG. 6) having the same user ID as the user ID of the segment information s is stored in the GPS history information. The record having the maximum coverage in the time range determined by the time (start time) held by the
正解アノテーション情報の移動手段(正解ラベル)を、セグメント情報sから求めた特徴に与えるか否かは、被覆率で判定する。被覆率が閾値θc以上で且つ最大のセグメント情報sの特徴は、移動手段の事例を正しく表すものとして、当該特徴に正解ラベルを与える。ラベルが与えられた特徴は、訓練事例として訓練事例記憶部40に記憶する(ステップS65)。
Whether or not to give the correct annotation information moving means (correct label) to the feature obtained from the segment information s is determined by the coverage. The feature of the segment information s with the coverage ratio equal to or greater than the threshold value θc and correctly representing the case of the moving means is given a correct answer label. The feature given the label is stored in the training
被覆率が閾値θc未満のセグメント情報sは正解ラベルがないものとして、当該セグメント情報sのユーザID、セッションID、特徴、メッシュID、時間帯、をラベルなし事例としてラベルなし事例記憶部30に記憶する(ステップS66)。ここでのメッシュIDは、セグメントの開始位置又は終了位置又は中間位置に対応するメッシュIDを用いることができる。また、時簡帯についても開始位置又は終了位置又は中間位置に対応する時簡帯などを用いることができる。
The segment information s whose coverage is less than the threshold θc has no correct answer label, and the user ID, session ID, feature, mesh ID, and time zone of the segment information s are stored in the unlabeled
事例生成機能部60は、未処理のセグメント情報sが無くなるまでステップS61〜S66までの処理を繰り返し(ステップS67のYES)、未処理のセグメント情報sが無くなった時点で上記の処理を終了する(ステップS67のNO)。
The case
図11に、事例生成機能部60が生成した訓練事例の例を示す。移動手段(正解ラベル)に対応する特徴ベクトルが記憶されている。図12に、事例生成機能部60が生成したラベルなし事例の例を示す。セッションIDごとに特徴ベクトルとメッシュIDと時間帯が、ユーザIDごとに記憶されている。
In FIG. 11, the example of the training example which the example
〔予測モデル生成機能部〕
図13に、予測モデル生成機能部50のより具体的な機能構成例を示す。予測モデル生成部機能50は、予測モデル生成部52と、予測モデル出力部53と、選択スコア計算部54と、アノテーション要求部55と、ラベルなし事例記憶更新部56と、予測モデル再計算部57とを具備する。
[Prediction model generation function]
FIG. 13 shows a more specific functional configuration example of the prediction model
図14に、予測モデル生成機能部50の動作フローを示す。図13と図14を参照して予測モデル生成機能部50の動作を説明する。予測モデル生成部52は、訓練事例記憶部40に記憶された全ての訓練事例を読み込み訓練事例集合Tとする(ステップS51)。そして、訓練事例集合Tを用いて予測モデルCを生成する(ステップS52)。予測モデルCは、訓練事例記憶部40に記憶した全ての事例を用いたマルチクラス分類によって生成される。
FIG. 14 shows an operation flow of the prediction model
マルチクラス分類とは、複数のクラスの中から一つを予測する分類法である。その予測モデルの構築は、例えば非特許文献2に記載された公知の方法を用いて行う。この方法以外でも、マルチクラス分類が可能な教師あり機械学習方法であれば任意の方法を利用することができる。本実施形態では、特徴ベクトルと同じ次元の重みベクトルの内積によって予測を行う線形識別モデルの例で説明を行うが、本実施形態に利用可能なアルゴリズムは線形識別モデルに限定されない。非線形モデルを適用する場合には、予測モデルを記憶する記憶部のデータ構造にアルゴリズムに合わせたスキーマを用いる。
Multi-class classification is a classification method that predicts one of a plurality of classes. The prediction model is constructed using a known method described in
予測モデル出力部53は、ラベルなし事例記憶部30に記憶したラベルなし事例集合Uの要素数(事例の数)が閾値θ以下の場合に、予測モデルCを外部に出力(ステップS53のYES)し、予測モデル記憶部90に記憶(ステップS58)して動作を終了する。当該事例の数が閾値θより大きい場合に、予測モデルCを選択スコア計算部54に出力する(ステップS53のNO)。閾値θは予め設定されているものとする。
The prediction
選択スコア計算部54は、予測モデルCを用いてラベルなし事例記憶部30に記憶した各事例について移動手段の予測を行い、当該予測の確からしさの程度を表す確信度Fと、時空間頻度記憶部20に記憶したメッシュIDと時間帯とから時空間的な珍しさの程度を表す地理スコアGを求め、確信度Fと地理スコアGから、予測モデルの性能が向上する程度を表す選択スコアSを計算する(ステップS54)。確信度Fには、線形識別モデルの場合、例えば特徴ベクトルと重みベクトルの内積の値の最大値などを用いることができる。他には、例えば非特許文献2に記載された公知の方法を用いることができる。このような確信度Fを計算できない予測モデルを利用する場合には、確信度Fは1であるものとする。
The selection
地理スコアGは、ラベルなし事例のメッシュIDと時間帯情報を用いて計算する。ラベルなし事例集合Uに含まれるある事例のユーザIDをu、メッシュIDをm、時間帯をt、とすると地理スコアGは式(1)で算出する。 The geographic score G is calculated using the mesh ID of the unlabeled case and the time zone information. If the user ID of a case included in the unlabeled case set U is u, the mesh ID is m, and the time zone is t, the geographic score G is calculated by the equation (1).
tの頻度を表す。同様にc(u,m)はユーザu,メッシュIDmの頻度、c(u,t)はユーザu,時間帯tの頻度、c(m,t)はメッシュIDm, 時間帯tの頻度、c(u)はユーザuの頻度、c(m)はメッシュIDmの頻度、c(t)は時間帯tの頻度を表す。また、λ1,…,λ7は各頻度の重み係数でありλ1+…+λ7=1となるように予め設定されているものとする。
確信度Fと地理スコアGを用いて選択スコアSは、例えば式(2)で算出できる。 Using the certainty factor F and the geographic score G, the selection score S can be calculated by, for example, Expression (2).
選択には、例えば選択スコアSに対する閾値θs以上の事例のみを選択する方法を用いることができる。閾値θsは予め設定されているものとする。また、同じユーザIDを持つラベルなし事例集合Uに対する選択スコアSの最小値に対して閾値θsを設けてもよい。選択された事例集合を追加事例集合Vとし、ラベルなし事例集合Uから取り除く(式(3))。 For the selection, for example, a method of selecting only cases having a threshold value θs or more with respect to the selection score S can be used. It is assumed that the threshold value θs is set in advance. Further, a threshold value θs may be provided for the minimum value of the selection score S for the unlabeled case set U having the same user ID. The selected case set is set as an additional case set V and removed from the unlabeled case set U (formula (3)).
ラベルなし事例記憶更新部56は、入力されたアノテーションをラベルとした抽出した事例を、ラベルなし事例記憶部30から削除すると共に、抽出した事例を訓練事例記憶部40に追加する(ステップS56)。追加する事例は、選択スコアSを用いてラベルなし事例記憶部30の事例集合Uの中から追加学習に用いる事例を選択する。
The unlabeled case
予測モデル再計算部57は、訓練事例記憶部40に記憶した全ての事例(訓練事例集合T)から、移動手段を予測する予測モデルCを再計算して予測モデル出力部53に出力する(ステップS57)。予測モデル再計算部57は、新たに設定された訓練事例集合Tを用いて予測モデルCの生成を行う。ここで予測モデルCを再計算する方法は、上記のステップS52と同じアルゴリズムを用いる。
The prediction
予測モデル出力部53は、ラベルなし事例記憶部30に記憶した事例の数が閾値θ以下になるまで上記のステップS53〜ステップS57の処理を繰り返す。したがって、ラベルなし事例記憶部30に記憶した事例の数が、所定の数より少なってから予測モデルCが出力される。つまり、所定の数より多い訓練事例から生成した予測モデルCが出力されることになる。
The prediction
以上説明したように本実施形態の移動手段推定装置100によれば、少量の正解ラベルが与えられている状況において、ラベルが与えられていないラベルなし事例集合から予測モデルの性能を向上させる観点で事例を選択することが可能になる。そして、その選択したラベルなし事例に対してアノテーションを要求し正解ラベルを追加することで予測モデルの性能向上が可能となる。その結果、ユーザの移動手段の推定精度を向上させることができる。 As described above, according to the moving unit estimation apparatus 100 of the present embodiment, in a situation where a small amount of correct answer labels are given, from the viewpoint of improving the performance of the prediction model from the unlabeled case set to which no labels are given. A case can be selected. The prediction model performance can be improved by requesting an annotation for the selected unlabeled case and adding a correct label. As a result, the estimation accuracy of the user's moving means can be improved.
これらの効果を奏する本実施形態の作用をまとめると次のようになる。移動手段推定装置100の予測モデル生成機能部50が、現在の訓練事例に含まれていない事例に対して、現在の予測モデルの確からしさの程度を表す確信度Fと、時空間頻度記憶部20を用いて時空間の観点で予測モデルの構築に既に同じ事例が利用されたかという観点を表す地理スコアを計算し、これらの2つの観点を用いることで予測モデルの性能が向上する程度を表す選択スコアを計算する。この選択スコアは、移動手段を推定する予測モデルの性能が向上する程度を表す。
The actions of the present embodiment exhibiting these effects are summarized as follows. The prediction model
予測モデル生成機能部50のアノテーション要求部55は、予測モデルの性能が向上する程度の高い事例をユーザに提示してアノテーションを要求する。そして、ラベルなし事例記憶更新部56が、入力されたアノテーションを正解ラベルとした事例を訓練事例記憶部40に追加する。この訓練事例が追加される処理は、ラベルなし事例の数が所定数より少なくなるまで繰り返される。予測モデル再計算部57は、このように追加された訓練事例集合から予測モデルを再計算する。したがって、移動手段を推定する予測モデルの予測精度を向上させることができる。
The
なお、本実施形態では、アノテーションをユーザに対して要求する例で説明を行ったが、正解ラベルが例えば行動ログに記憶されていれば、その行動ログを参照して正解ラベルを自動的に取得するように構成してもよい。このように、本発明は、その要旨の範囲内で変形が可能である。 In this embodiment, an example is described in which an annotation is requested from the user. However, if the correct answer label is stored in, for example, the action log, the correct answer label is automatically acquired with reference to the action log. You may comprise. Thus, the present invention can be modified within the scope of the gist thereof.
上記装置における処理部をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、各装置における処理部がコンピュータ上で実現される。 When the processing unit in the above apparatus is realized by a computer, the processing contents of the functions that each apparatus should have are described by a program. Then, by executing this program on the computer, the processing unit in each device is realized on the computer.
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記録装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としても良い。 The program is distributed by selling, transferring, or lending a portable recording medium such as a DVD or CD-ROM in which the program is recorded. Further, the program may be distributed by storing the program in a recording device of the server computer and transferring the program from the server computer to another computer via a network.
また、各手段は、コンピュータ上で所定のプログラムを実行させることにより構成することにしてもよいし、これらの処理内容の少なくとも一部をハードウェア的に実現することとしても良い。 Each means may be configured by executing a predetermined program on a computer, or at least a part of these processing contents may be realized by hardware.
10 :時空間頻度計算部
20 :時空間頻度記憶部
30 :ラベルなし事例記憶部
40 :訓練事例記憶部
50 :予測モデル生成機能部
52 :予測モデル生成部
53 :予測モデル出力部
54 :選択スコア計算部
55 :アノテーション要求部
56 :ラベルなし事例記憶更新部
57 :予測モデル再計算部
60 :事例生成機能部
65 :セグメント記憶部
70 :セグメント抽出機能部
80 :GPS履歴情報記憶部
85 :正解アノテーション記憶部
100:移動手段推定装置
10: Spatiotemporal frequency calculation unit 20: Spatiotemporal frequency storage unit 30: Unlabeled case storage unit 40: Training case storage unit 50: Prediction model generation function unit 52: Prediction model generation unit 53: Prediction model output unit 54: Selection score Calculation unit 55: Annotation request unit 56: Unlabeled case storage update unit 57: Prediction model recalculation unit 60: Case generation function unit 65: Segment storage unit 70: Segment extraction function unit 80: GPS history information storage unit 85: Correct answer annotation Storage unit 100: moving means estimation device
Claims (5)
ユーザを識別するユーザIDと、地図上の一定領域を表すメッシュIDと、1日内の時間帯と、前記時間帯に前記ユーザが前記一定領域内に立ち入った頻度とを記憶した時空間頻度記憶部と、
前記移動手段の事例を正しく表す正解ラベルと、前記GPS履歴情報から求めた前記事例の特徴ベクトルとを記憶した訓練事例記憶部と、
前記正解ラベルが与えられていない前記事例の特徴ベクトルを記憶したラベルなし事例記憶部と、
前記訓練事例記憶部に記憶した全ての前記事例から、前記移動手段を予測する予測モデルを生成し、前記ラベルなし事例記憶部に記憶した前記事例の数が閾値以下の場合に、前記予測モデルを出力し、前記ラベルなし事例記憶部に記憶した前記事例の数が前記閾値より大きい場合に、前記正解ラベルが与えられていない前記事例に前記正解ラベルを付与したときに前記予測モデルの信頼度が向上する程度を表す選択スコアを、前記時空間頻度記憶部に記憶したデータを用いて求め、当該選択スコアがスコア閾値よりも大きい前記事例を前記ラベルなし事例記憶部から抽出し、当該抽出した事例を外部に提示して注釈を要求し、入力された注釈を前記正解ラベルとした前記抽出した事例を、前記訓練事例記憶部に追加し、前記訓練事例記憶部に記憶した全ての前記事例を用いて、前記移動手段を予測する予測モデルを再計算する処理を、前記ラベルなし事例記憶部に記憶した前記事例の数が前記閾値以下になるまで繰り返す予測モデル生成機能部とを具備することを特徴とする移動手段推定装置。 A moving means estimating device for estimating a moving means based on GPS history information in which a user's position is recorded by GPS,
Spatio-temporal frequency storage unit that stores a user ID for identifying a user, a mesh ID representing a certain area on the map, a time zone within a day, and a frequency at which the user has entered the certain area during the time zone When,
A training case storage unit that stores a correct answer label that correctly represents a case of the moving means, and a feature vector of the case obtained from the GPS history information;
An unlabeled case storage unit that stores feature vectors of the case that are not given the correct answer label;
A prediction model for predicting the moving means is generated from all the cases stored in the training case storage unit, and when the number of cases stored in the unlabeled case storage unit is equal to or less than a threshold, the prediction model is When the number of cases stored in the unlabeled case storage unit is greater than the threshold, the reliability of the prediction model is determined when the correct label is assigned to the case that is not given the correct label. A selection score representing the degree of improvement is obtained using data stored in the spatio-temporal frequency storage unit, the case where the selection score is larger than the score threshold is extracted from the unlabeled case storage unit, and the extracted case Is added to the training case storage unit, and the extracted case with the input annotation as the correct answer label is added to the training case storage unit. A prediction model generation function that repeats the process of recalculating the prediction model for predicting the moving means using all the stored cases until the number of cases stored in the unlabeled case storage unit is equal to or less than the threshold value A moving means estimation device.
前記予測モデル生成機能部は、
前記訓練事例記憶部に記憶した全ての前記事例を用いたマルチクラス分類を行って予測モデルを生成する予測モデル生成部と、
前記ラベルなし事例記憶部に記憶した前記事例の数が閾値以下の場合に、前記予測モデルを外部に出力し、前記事例の数が閾値より大きい場合に、前記予測モデルを選択スコア計算部に出力する予測モデル出力部と、
前記予測モデルを用いて前記ラベルなし事例記憶部に記憶した各事例について前記移動手段の予測を行い、当該予測の確からしさの程度を表す確信度と、前記時空間頻度記憶部に記憶した前記メッシュIDと前記時間帯とから時空間的な珍しさの程度を表す地理スコアを求め、前記確信度と前記地理スコアとから、予測モデルの性能が向上する程度を表す選択スコアを計算する選択スコア計算部と、
前記選択スコアがスコア閾値以上の前記ラベルなし事例記憶部に記憶した各事例を抽出し、当該抽出した事例を外部に提示してアノテーションを要求するアノテーション要求部と、
入力された前記アノテーションを正解ラベルとした前記抽出した前記事例を、前記ラベルなし事例記憶部から削除すると共に、前記抽出した前記事例を前記訓練事例記憶部に追加するラベルなし事例記憶更新部と、
前記訓練事例記憶部に記憶した全ての前記事例から、前記移動手段を予測する予測モデルを再計算して前記予測モデル生成部に出力する予測モデル再計算部とを具備することを特徴とする移動手段推定装置。 In the movement means estimation apparatus according to claim 1,
The prediction model generation function unit
A prediction model generation unit that generates a prediction model by performing multi-class classification using all the cases stored in the training case storage unit;
When the number of cases stored in the unlabeled case storage unit is less than or equal to a threshold, the prediction model is output to the outside, and when the number of cases is greater than the threshold, the prediction model is output to a selection score calculation unit. A prediction model output unit,
Predicting the moving means for each case stored in the unlabeled case storage unit using the prediction model, a certainty factor representing the degree of certainty of the prediction, and the mesh stored in the spatio-temporal frequency storage unit Selection score calculation that obtains a geographic score representing the degree of spatiotemporal rarity from the ID and the time zone, and calculates a selection score that represents the degree of improvement in the performance of the prediction model from the certainty factor and the geographic score And
Extracting each case stored in the unlabeled case storage unit having the selection score equal to or higher than a score threshold, and presenting the extracted case to the outside and requesting an annotation;
The extracted case with the input annotation as a correct label is deleted from the unlabeled case storage unit, and the unlabeled case storage update unit adds the extracted case to the training case storage unit;
And a prediction model recalculation unit that recalculates a prediction model for predicting the moving means from all the cases stored in the training case storage unit and outputs the prediction model to the prediction model generation unit. Means estimation device.
前記地理スコアは次式で計算し、
IDm,時間帯tの頻度、c(u,m)はユーザu,メッシュIDmの頻度、c(u,t)はユーザu,時間帯tの頻度、c(m,t)はメッシュIDm, 時間帯tの頻度、c(u)はユーザuの頻度、c(m)はメッシュIDmの頻度、c(t)は時間帯tの頻度を表し、λはλ1+…+λ7=1となる重み係数であり、
前記選択スコアは次式で計算し、
The geographic score is calculated by the following formula:
The selection score is calculated by the following formula:
前記移動手段推定装置の予測モデル生成機能部が、前記移動手段推定装置の訓練事例記憶部に記憶した全ての事例から、前記移動手段を予測する予測モデルを生成し、前記移動手段推定装置のラベルなし事例記憶部に記憶した前記事例の数が閾値以下の場合に、前記予測モデルを出力し、前記ラベルなし事例記憶部に記憶した前記事例の数が前記閾値より大きい場合に、前記移動手段の事例を正しく表す正解ラベルが与えられていない前記事例に当該正解ラベルを付与したときに前記予測モデルの信頼度が向上する程度を表す選択スコアを、前記移動手段推定装置の時空間頻度記憶部に記憶したデータを用いて求め、当該選択スコアがスコア閾値よりも大きい前記事例を前記ラベルなし事例記憶部から抽出し、当該抽出した事例を外部に提示して注釈を要求し、入力された注釈を前記正解ラベルとした前記抽出した事例を、前記訓練事例記憶部に追加し、当該訓練事例記憶部に記憶した全ての前記事例を用いて、前記移動手段を予測する予測モデルを再計算する処理を、前記ラベルなし事例記憶部に記憶した前記事例の数が前記閾値以下になるまで繰り返すことを特徴とする移動手段推定装置の動作方法。 An operation method of a moving means estimating device for estimating a moving means from GPS history information in which a user's position is recorded by GPS,
The prediction model generation function unit of the moving unit estimation device generates a prediction model for predicting the moving unit from all the cases stored in the training case storage unit of the moving unit estimation device, and the label of the moving unit estimation device When the number of cases stored in the none case storage unit is less than or equal to a threshold, the prediction model is output, and when the number of cases stored in the unlabeled case storage unit is greater than the threshold, the moving means A selection score representing the degree of improvement in reliability of the prediction model when the correct label is assigned to the case that is not given a correct label that correctly represents the case is stored in the spatio-temporal frequency storage unit of the moving means estimating device. Using the stored data, find the case where the selection score is greater than the score threshold from the unlabeled case storage unit, and present the extracted case to the outside Requesting an annotation, adding the extracted case with the input annotation as the correct answer label to the training case storage unit, and using all the cases stored in the training case storage unit, the moving means The operation method of the moving means estimating apparatus is characterized in that the process of recalculating the prediction model for predicting is repeated until the number of cases stored in the unlabeled case storage unit becomes equal to or less than the threshold value.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014139441A JP6174527B2 (en) | 2014-07-07 | 2014-07-07 | Moving means estimation apparatus, operation method thereof, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014139441A JP6174527B2 (en) | 2014-07-07 | 2014-07-07 | Moving means estimation apparatus, operation method thereof, and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016018308A JP2016018308A (en) | 2016-02-01 |
JP6174527B2 true JP6174527B2 (en) | 2017-08-02 |
Family
ID=55233510
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014139441A Active JP6174527B2 (en) | 2014-07-07 | 2014-07-07 | Moving means estimation apparatus, operation method thereof, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6174527B2 (en) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109978491B (en) * | 2019-02-12 | 2024-02-06 | 平安科技(深圳)有限公司 | Reminding prediction method, reminding prediction device, computer equipment and storage medium |
JP7419035B2 (en) | 2019-11-22 | 2024-01-22 | キヤノン株式会社 | Learning model management system, learning model management method, and program |
CN112016633A (en) * | 2020-09-25 | 2020-12-01 | 北京百度网讯科技有限公司 | Model training method and device, electronic equipment and storage medium |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008276453A (en) * | 2007-04-27 | 2008-11-13 | Toshiba Corp | Behavior identification device and method |
US8015144B2 (en) * | 2008-02-26 | 2011-09-06 | Microsoft Corporation | Learning transportation modes from raw GPS data |
JP5222189B2 (en) * | 2009-03-19 | 2013-06-26 | 株式会社エヌ・ティ・ティ・ドコモ | Moving means estimation apparatus and moving means estimation method |
WO2013179359A1 (en) * | 2012-06-01 | 2013-12-05 | 株式会社日立製作所 | Transportation means determination system, transportation means determination device, and transportation means determination program |
-
2014
- 2014-07-07 JP JP2014139441A patent/JP6174527B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2016018308A (en) | 2016-02-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7203769B2 (en) | Voxel-based ground plane estimation and object segmentation | |
CN105532030B (en) | For analyzing the devices, systems, and methods of the movement of target entity | |
CN110235148B (en) | Training action selection neural network | |
JP6892389B2 (en) | Selection of representative video frames for video | |
US10217033B2 (en) | System and method for generating a map from activity data | |
JP6455113B2 (en) | Object tracking method and apparatus | |
KR102033050B1 (en) | Unsupervised Learning Technique for Time Difference Model | |
US20170116530A1 (en) | Generating prediction models in accordance with any specific data sets | |
JP2011252844A (en) | Data processing device, data processing method and program | |
US20160364472A1 (en) | Functional space-time trajectory clustering | |
US10592786B2 (en) | Generating labeled data for deep object tracking | |
JP7218754B2 (en) | Vacant house determination device, vacant house determination method and program | |
KR101813805B1 (en) | Method and Apparatus for purchase probability prediction of user using machine learning | |
JP6174527B2 (en) | Moving means estimation apparatus, operation method thereof, and program | |
JP6110281B2 (en) | Moving unit prediction model generation apparatus, moving unit prediction model generation method, and moving unit prediction model generation program | |
JP2011170453A (en) | Device, method and program for calculation of location existence probability, and travel route recommendation device, method and program | |
CN110263250B (en) | Recommendation model generation method and device | |
CN115774819A (en) | Interest point recommendation method and system based on hierarchical recurrent neural network | |
JP6038857B2 (en) | Moving means estimation model generation apparatus, moving means estimation model generation method, moving means estimation model generation program | |
US20160148223A1 (en) | Forecasting web metrics using statistical causality based feature selection | |
JP2019095895A (en) | Human flow predicting device, method, and program | |
JP6433876B2 (en) | Parameter estimation apparatus, prediction apparatus, method, and program | |
JP2014115911A (en) | Information recommendation apparatus, information recommendation method, and information recommendation program | |
JP6360000B2 (en) | Moving means estimation model generation apparatus, moving means estimation model generation method, moving means estimation model generation program | |
JP6149024B2 (en) | Moving means estimation model generation apparatus, moving means estimation model generation method, moving means estimation model generation program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160913 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170616 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170704 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170706 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6174527 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |