JP6174527B2 - Moving means estimation apparatus, operation method thereof, and program - Google Patents

Moving means estimation apparatus, operation method thereof, and program Download PDF

Info

Publication number
JP6174527B2
JP6174527B2 JP2014139441A JP2014139441A JP6174527B2 JP 6174527 B2 JP6174527 B2 JP 6174527B2 JP 2014139441 A JP2014139441 A JP 2014139441A JP 2014139441 A JP2014139441 A JP 2014139441A JP 6174527 B2 JP6174527 B2 JP 6174527B2
Authority
JP
Japan
Prior art keywords
storage unit
case
prediction model
moving means
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014139441A
Other languages
Japanese (ja)
Other versions
JP2016018308A (en
Inventor
良彦 数原
良彦 数原
浩之 戸田
浩之 戸田
義昌 小池
義昌 小池
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2014139441A priority Critical patent/JP6174527B2/en
Publication of JP2016018308A publication Critical patent/JP2016018308A/en
Application granted granted Critical
Publication of JP6174527B2 publication Critical patent/JP6174527B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Navigation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、利用者がどのような移動手段を利用したかを推定する移動手段推定装置、その方法およびプログラムに関する。   The present invention relates to a moving means estimating apparatus, a method and a program for estimating what moving means a user has used.

ユーザの位置をGPSロガー等の装置で蓄積したGPS履歴情報を利用して、ユーザがどのような移動手段を利用したかを推定する技術がある(例えば非特許文献1)。ユーザの利用した移動手段を推定するには、GPS履歴情報から異なる移動手段を利用したと想定される区間(セグメント)に分割して当該区間を抽出する前処理を行う。そして、抽出されたセグメントに対してGPS履歴情報から特徴を抽出する。その特徴を分類器で分類して移動手段の判定を行う。   There is a technique for estimating what moving means a user has used by using GPS history information accumulated by a device such as a GPS logger (for example, Non-Patent Document 1). In order to estimate the moving means used by the user, preprocessing is performed to divide the GPS history information into sections (segments) assumed to use different moving means and extract the sections. Then, a feature is extracted from the GPS history information for the extracted segment. The features are classified by a classifier and the moving means is determined.

ここで、移動手段判定の分類器については、予め人手によって用意された正解データを利用して、教師あり機械学習(例えば非特許文献2)の枠組みで生成することが可能である(非特許文献1)。   Here, the classifier for moving means determination can be generated in the framework of supervised machine learning (for example, Non-Patent Document 2) using correct data prepared in advance by hand (Non-Patent Document 2). 1).

Zheng, Y., Liu, L., Wang, L., Xie, X., “Learning transportation mode from raw gps data for geographic applications on the web”, Proc. The 17th international conference on World Wide Web, pp.247-256, 2008.Zheng, Y., Liu, L., Wang, L., Xie, X., “Learning transportation mode from raw gps data for geographic applications on the web”, Proc. The 17th international conference on World Wide Web, pp.247 -256, 2008. Crammer, K., Dekel, O. Keshet, J., Shalev-Shwartz, S. and Singer, Y., “Online Passive-Aggressive Algorithm”, Journal of Machine Learning, Vol.7, pp.551-585, 2006.Crammer, K., Dekel, O. Keshet, J., Shalev-Shwartz, S. and Singer, Y., “Online Passive-Aggressive Algorithm”, Journal of Machine Learning, Vol.7, pp.551-585, 2006 .

しかしながら、正解データを作成するコストが高いため、限られた数の正解データしか用意することができないという課題がある。そのため、予測モデルの予測精度が低下し、移動モード判定の判定精度が悪化してしまう課題がある。   However, since the cost of creating correct data is high, there is a problem that only a limited number of correct data can be prepared. Therefore, there is a problem that the prediction accuracy of the prediction model is lowered and the determination accuracy of the movement mode is deteriorated.

本発明は、この課題に鑑みてなされたものであり、限られた数の正解データしかなくても予測モデルの予測精度を劣化させないようにした移動手段推定装置、その動作方法およびプログラムを提供することを目的とする。   The present invention has been made in view of this problem, and provides a moving means estimation device, an operation method thereof, and a program that do not deteriorate the prediction accuracy of a prediction model even when there is a limited number of correct answer data. For the purpose.

本願発明の移動手段推定装置は、ユーザの位置をGPSで記録したGPS履歴情報に基づいて移動手段を推定する移動手段推定装置であって、時空間頻度記憶部と訓練事例記憶部とラベルなし事例記憶部と予測モデル生成機能部とを具備する。時空間頻度記憶部は、ユーザを識別するユーザIDと、地図上の一定領域を表すメッシュIDと、1日内の時間帯と、時間帯にユーザが一定領域内に立ち入った頻度とを記憶する。訓練事例記憶部は、移動手段の事例を正しく表す正解ラベルと、GPS履歴情報から求めた事例の特徴ベクトルとを記憶する。ラベルなし事例記憶部は、正解ラベルが与えられていない事例の特徴ベクトルを記憶する。予測モデル生成機能部は、訓練事例記憶部に記憶した全ての事例から、移動手段を予測する予測モデルを生成し、ラベルなし事例記憶部に記憶した事例の数が閾値以下の場合に、予測モデルを出力し、ラベルなし事例記憶部に記憶した事例の数が閾値より大きい場合に、正解ラベルが与えられていない事例に正解ラベルを付与したときに予測モデルの信頼度が向上する程度を表す選択スコアを、時空間頻度記憶部に記憶したデータを用いて求め、当該選択スコアがスコア閾値よりも大きい事例をラベルなし事例記憶部から抽出し、当該抽出した事例を外部に提示して注釈を要求し、入力された注釈を正解ラベルとした抽出した事例を、訓練事例記憶部に追加し、訓練事例記憶部に記憶した全ての事例を用いて、移動手段を予測する予測モデルを再計算する処理を、ラベルなし事例記憶部に記憶した事例の数が閾値以下になるまで繰り返す。   The movement means estimation apparatus of the present invention is a movement means estimation apparatus that estimates movement means based on GPS history information in which a user's position is recorded by GPS, and includes a spatio-temporal frequency storage unit, a training case storage unit, and an unlabeled case A storage unit and a prediction model generation function unit are provided. The spatiotemporal frequency storage unit stores a user ID for identifying a user, a mesh ID representing a certain area on the map, a time zone within a day, and a frequency at which the user has entered the certain area during the time zone. The training case storage unit stores a correct answer label that correctly represents the case of the moving means and a feature vector of the case obtained from the GPS history information. The unlabeled case storage unit stores a feature vector of a case that is not given a correct answer label. The prediction model generation function unit generates a prediction model for predicting the moving means from all cases stored in the training case storage unit, and when the number of cases stored in the unlabeled case storage unit is equal to or less than a threshold value, the prediction model This is a selection that represents the degree to which the reliability of the prediction model is improved when a correct label is assigned to a case that is not given a correct answer label when the number of cases stored in the unlabeled case storage unit is larger than a threshold. The score is obtained using the data stored in the spatio-temporal frequency storage unit, the case where the selected score is larger than the score threshold is extracted from the unlabeled case storage unit, and the extracted case is presented to the outside to request an annotation. A prediction model that adds an extracted case with the input annotation as a correct answer label to the training case storage unit and predicts the moving means using all cases stored in the training case storage unit The process of recalculating is repeated until the number of cases stored in the unlabeled example storage unit falls below the threshold value.

また、本願発明の移動手段推定装置の動作方法は、ユーザの位置をGPSで記録したGPS履歴情報から移動手段を推定する移動手段推定装置の動作方法であって、予測モデル生成機能部が、移動手段推定装置の訓練事例記憶部に記憶した全ての事例から、移動手段を予測する予測モデルを生成し、移動手段推定装置のラベルなし事例記憶部に記憶した事例の数が閾値以下の場合に、予測モデルを出力し、ラベルなし事例記憶部に記憶した事例の数が閾値より大きい場合に、正解ラベルが与えられていない事例に正解ラベルを付与したときに予測モデルの信頼度が向上する程度を表す選択スコアを、移動手段推定装置の時空間頻度記憶部に記憶したデータを用いて求め、当該選択スコアがスコア閾値よりも大きい事例をラベルなし事例記憶部から抽出し、当該抽出した事例を外部に提示して注釈を要求し、入力された注釈を正解ラベルとした抽出した事例を、訓練事例記憶部に追加し、訓練事例記憶部に記憶した全ての事例を用いて、移動手段を予測する予測モデルを再計算する処理を、ラベルなし事例記憶部に記憶した事例の数が閾値以下になるまで繰り返す。   The operation method of the moving means estimating apparatus of the present invention is an operating method of the moving means estimating apparatus that estimates the moving means from GPS history information in which the position of the user is recorded by GPS, and the prediction model generation function unit moves When all cases stored in the training example storage unit of the means estimation device generate a prediction model for predicting the movement means, and the number of cases stored in the unlabeled case storage unit of the movement means estimation device is less than or equal to the threshold, When the number of cases stored in the unlabeled case storage unit is larger than the threshold, the degree to which the reliability of the prediction model is improved when a correct label is assigned to a case that is not given a correct answer label. A selection score to be expressed is obtained using data stored in the spatio-temporal frequency storage unit of the moving means estimation device, and a case where the selection score is greater than the score threshold is stored as an unlabeled case storage unit The extracted case is presented to the outside, an annotation is requested, the extracted case with the input annotation as the correct answer label is added to the training case storage unit, and all the cases stored in the training case storage unit are stored. Using the cases, the process of recalculating the prediction model for predicting the moving means is repeated until the number of cases stored in the unlabeled case storage unit is equal to or less than the threshold value.

また、本発明のプログラムは、上記の移動手段推定装置の各機能部をコンピュータに機能させるためのプログラムである。   Moreover, the program of this invention is a program for making a computer function each function part of said moving means estimation apparatus.

本発明の移動手段推定装置とその方法とプログラムによれば、移動手段を正しく表すラベルが与えられた事例の数が少なくても、予測モデルの予測精度を向上させることができ、ユーザの移動手段の推定精度を向上させることが可能である。   According to the moving means estimation apparatus, the method, and the program of the present invention, the prediction accuracy of the prediction model can be improved even if the number of cases given labels correctly representing the moving means is small, and the moving means of the user It is possible to improve the estimation accuracy.

本発明の実施形態の移動手段推定装置100の機能構成例を示す図。The figure which shows the function structural example of the moving means estimation apparatus 100 of embodiment of this invention. 移動手段推定装置100をコンピュータで構成した場合の機能構成例を示す図。The figure which shows the function structural example at the time of comprising the moving means estimation apparatus 100 with a computer. 移動手段推定装置100が、予測モデルを生成する動作フローを示す図。The figure which shows the operation | movement flow in which the movement means estimation apparatus 100 produces | generates a prediction model. 移動手段推定装置100の時空間頻度計算部10の動作フローを示す図。The figure which shows the operation | movement flow of the spatio-temporal frequency calculation part 10 of the movement means estimation apparatus 100. 移動手段推定装置100のGPS履歴情報記憶部60に記憶された情報の例を示す図。The figure which shows the example of the information memorize | stored in the GPS historical information storage part 60 of the movement means estimation apparatus 100. FIG. 移動手段推定装置100の正解アノテーション記憶部85に記憶された情報の例を示す図。The figure which shows the example of the information memorize | stored in the correct annotation memory | storage part 85 of the movement means estimation apparatus 100. FIG. 移動手段推定装置100の時空間頻度記憶部20に記憶された情報の例を示す図。The figure which shows the example of the information memorize | stored in the spatiotemporal frequency memory | storage part 20 of the movement means estimation apparatus 100. FIG. 移動手段推定装置100のセグメント抽出機能部70の動作フローを示す図。The figure which shows the operation | movement flow of the segment extraction function part 70 of the movement means estimation apparatus 100. FIG. 移動手段推定装置100のセグメント記憶部65に記憶された情報の例を示す図。The figure which shows the example of the information memorize | stored in the segment memory | storage part 65 of the moving means estimation apparatus 100. FIG. 移動手段推定装置100の事例生成機能部60の動作フローを示す図。The figure which shows the operation | movement flow of the case generation function part 60 of the moving means estimation apparatus 100. 移動手段推定装置100の訓練事例記憶部40に記憶された情報の例を示す図。The figure which shows the example of the information memorize | stored in the training example memory | storage part 40 of the movement means estimation apparatus 100. FIG. 移動手段推定装置100のラベルなし事例記憶部30に記憶された情報の例を示す図。The figure which shows the example of the information memorize | stored in the unlabeled example memory | storage part 30 of the moving means estimation apparatus 100. FIG. 移動手段推定装置100の予測モデル生成機能部50の機能構成例を示す図。The figure which shows the function structural example of the prediction model production | generation function part 50 of the movement means estimation apparatus 100. FIG. 予測モデル生成機能部50の動作フローを示す図。The figure which shows the operation | movement flow of the prediction model production | generation function part 50. FIG. 移動手段推定装置100の予測モデル記憶部90に記憶された情報の例を示す図。The figure which shows the example of the information memorize | stored in the prediction model memory | storage part 90 of the movement means estimation apparatus 100. FIG.

以下、この発明の実施の形態を図面を参照して説明する。複数の図面中同一のものには
同じ参照符号を付し、説明は繰り返さない。
Embodiments of the present invention will be described below with reference to the drawings. The same reference numerals are given to the same components in a plurality of drawings, and the description will not be repeated.

図1に、本実施形態の移動手段推定装置100の機能構成例を示す。移動手段推定装置100は、ユーザの位置をGPSで記録したGPS履歴情報に基づいて移動手段を推定するものである。   In FIG. 1, the function structural example of the moving means estimation apparatus 100 of this embodiment is shown. The moving means estimation apparatus 100 estimates moving means based on GPS history information in which a user's position is recorded by GPS.

移動手段とは、ユーザが移動するのに用いる徒歩、車、電車、バスなどのことである。移動手段が正しく推定できれば、ユーザが携帯する機器において適切なサービスを提供することが可能である。例えば、ユーザが車を運転中の場合と電車で移動中の場合で、提供するサービスを異ならせることができる。   A moving means is a walk, a car, a train, a bus, or the like used by a user to move. If the moving means can be estimated correctly, it is possible to provide an appropriate service in the device carried by the user. For example, the service to be provided can be different depending on whether the user is driving a car or traveling on a train.

移動手段推定装置100は、時空間頻度計算部10、時空間頻度記憶部20、ラベルなし事例記憶部30、訓練事例記憶部40、予測モデル生成機能部50、事例生成機能部60、セグメント記憶部65、セグメント抽出機能部70、GPS履歴情報記憶部80、正解アノテーション記憶部85、予測モデル記憶部90を具備する。移動手段推定装置100は、例えば、コンピュータで実現することができる。   The movement means estimation device 100 includes a spatiotemporal frequency calculation unit 10, a spatiotemporal frequency storage unit 20, an unlabeled case storage unit 30, a training case storage unit 40, a prediction model generation function unit 50, a case generation function unit 60, and a segment storage unit. 65, a segment extraction function unit 70, a GPS history information storage unit 80, a correct annotation storage unit 85, and a prediction model storage unit 90. The moving means estimation apparatus 100 can be realized by a computer, for example.

移動手段推定装置100をコンピュータで実現した場合の機構構成例を図2に示す。図2において、時空間頻度記憶部20、ラベルなし事例記憶部30、訓練事例記憶部40、セグメント記憶部65、GPS履歴情報記憶部80、正解アノテーション記憶部85、予測モデル記憶部90、の各記憶部は、図1との対応を分かり易くする目的でそれぞれを個別に表記している。なお、各記憶部はメモリ6に全て集約してもよい。   FIG. 2 shows an example of the mechanism configuration when the moving means estimating apparatus 100 is realized by a computer. In FIG. 2, each of the spatiotemporal frequency storage unit 20, the unlabeled case storage unit 30, the training case storage unit 40, the segment storage unit 65, the GPS history information storage unit 80, the correct annotation storage unit 85, and the prediction model storage unit 90. Each of the storage units is individually described for the purpose of making the correspondence with FIG. 1 easy to understand. Note that all the storage units may be consolidated in the memory 6.

時空間頻度計算部10と予測モデル生成機能部50と事例生成機能部60の各機能部で行う処理は、CPU5がプログラムを実行することで実現される。入力部7は例えばキーボードであり、本実施形態では入力部7からユーザの操作によって注釈が入力される。表示部8には、推定した移動手段が例えば地図情報と共に表示される。   The processing performed by the functional units of the spatiotemporal frequency calculation unit 10, the prediction model generation function unit 50, and the case generation function unit 60 is realized by the CPU 5 executing a program. The input unit 7 is, for example, a keyboard. In this embodiment, an annotation is input from the input unit 7 by a user operation. The display unit 8 displays the estimated moving means together with, for example, map information.

図3に、移動手段推定装置100が予測モデルを生成する全体の動作フローを示す。図1と図3を参照して予測モデルを生成する全体の流れを説明する。   FIG. 3 shows an overall operation flow in which the moving means estimation apparatus 100 generates a prediction model. The overall flow of generating a prediction model will be described with reference to FIGS.

時空間頻度計算部10は、GPS履歴情報記憶部80に記憶されたログ情報と、正解アノテーション記憶部85に記憶されたある時間区間において利用した移動手段の情報を用いて、ユーザIDと、地図上の一定領域を表すメッシュIDと、1日内の時間帯と、ある時間帯にあるユーザがある一定領域に入った頻度を計算し、それらの情報を時空間頻度記憶部20に記憶する(ステップS10)。   The spatio-temporal frequency calculation unit 10 uses the log information stored in the GPS history information storage unit 80 and the information on the moving means used in a certain time interval stored in the correct annotation storage unit 85, the user ID, the map The mesh ID representing the upper certain area, the time zone within a day, and the frequency at which the user in a certain time zone enters the certain area are calculated, and the information is stored in the spatio-temporal frequency storage unit 20 (step S10).

事例生成機能部60は、GPS履歴情報記憶部80に記憶されたログ情報と、正解アノテーション記憶部85に記憶されたある時間区間において利用した移動手段の情報と、セグメント記憶部65に記憶された移動手段が同一の区間を表すセグメント情報から、予測モデルを生成するための移動手段の事例を正しく表す正解ラベルと特徴量の訓練事例を生成し、訓練事例記憶部40に記憶する(ステップS20)。また、事例生成機能部60は、正解ラベルが与えられていない事例の特徴量を生成し、ラベルなし事例記憶部30に記憶する(ステップS30)。   The case generation function unit 60 stores the log information stored in the GPS history information storage unit 80, the information on the moving means used in a certain time interval stored in the correct answer storage unit 85, and the segment storage unit 65. A training example of a correct answer label and a feature amount that correctly represents a case of the moving means for generating a prediction model is generated from the segment information representing the same section by the moving means, and is stored in the training case storage unit 40 (step S20). . Further, the case generation function unit 60 generates a feature amount of a case that is not given a correct answer label and stores it in the unlabeled case storage unit 30 (step S30).

予測モデル生成機能部50は、訓練事例記憶部40に記憶した全ての事例から、移動手段を予測する予測モデルを生成し、ラベルなし事例記憶部30に記憶した事例の数が閾値以下の場合に、予測モデルを出力し、ラベルなし事例記憶部30に記憶した事例の数が閾値より大きい場合に、正解ラベルが与えられていない事例に正解ラベルを付与したときに予測モデルの信頼度が向上する程度を表す選択スコアを、時空間頻度記憶部20に記憶したデータを用いて求め、当該選択スコアがスコア閾値よりも大きい事例をラベルなし事例記憶部30から抽出し、当該抽出した事例を外部に提示して注釈を要求し、入力された注釈を正解ラベルとした抽出した事例を、訓練事例記憶部40に追加し、訓練事例記憶部40に記憶した全ての事例を用いて、移動手段を予測する予測モデルを再計算する処理を、ラベルなし事例記憶部30に記憶した事例の数が閾値以下になるまで繰り返して予測モデルを生成する(ステップS40)。   The prediction model generation function unit 50 generates a prediction model for predicting the moving means from all cases stored in the training case storage unit 40, and the number of cases stored in the unlabeled case storage unit 30 is equal to or less than a threshold value. When a prediction model is output and the number of cases stored in the unlabeled case storage unit 30 is larger than the threshold, the reliability of the prediction model is improved when a correct label is assigned to a case that is not given a correct answer label. A selection score representing the degree is obtained using data stored in the spatio-temporal frequency storage unit 20, a case where the selection score is larger than the score threshold is extracted from the unlabeled case storage unit 30, and the extracted case is externally provided. Annotation is presented to request an annotation, and the extracted case with the input annotation as a correct answer label is added to the training case storage unit 40, and all cases stored in the training case storage unit 40 are used. The process of recalculating the prediction model for predicting the moving means, the number of cases stored in the unlabeled example storage unit 30 is repeated to generate a predictive model until below a threshold value (step S40).

以降、図面を参照して移動手段推定装置100の各機能構成部の動作を詳しく説明する。   Hereinafter, the operation of each functional component of the moving means estimating apparatus 100 will be described in detail with reference to the drawings.

〔時空間頻度計算部〕
図4に、時空間頻度計算部10の動作フローを示す。時空間頻度計算部10は、ユーザの位置をGPSで記録したGPS履歴情報記憶部80から未処理のユーザIDを取得してuとする(ステップS11)。
[Spatial frequency calculation part]
FIG. 4 shows an operation flow of the spatiotemporal frequency calculation unit 10. The spatio-temporal frequency calculation unit 10 acquires an unprocessed user ID from the GPS history information storage unit 80 that records the user's position by GPS and sets it as u (step S11).

図5に、GPS履歴情報記憶部60に記憶されたGPS履歴情報の例を示す。図5の1行はGPS履歴情報の1レコードを表す。1レコードは、ログIDとユーザIDとGPSロガーによって取得された取得時刻、緯度、経度、の情報を含む。図5は、ログIDの時間間隔を3秒で示すように3秒周期でGPS履歴情報が記憶される例を示す。   FIG. 5 shows an example of GPS history information stored in the GPS history information storage unit 60. One line in FIG. 5 represents one record of GPS history information. One record includes information of a log ID, a user ID, and an acquisition time, latitude, and longitude acquired by a GPS logger. FIG. 5 shows an example in which GPS history information is stored in a cycle of 3 seconds so that the log ID time interval is 3 seconds.

レコードはログIDで識別できる。ログIDは全ユーザに渡って一意である。ユーザID=1が未処理であれば、ユーザID=1をuとする。   Records can be identified by log IDs. The log ID is unique across all users. If user ID = 1 is unprocessed, user ID = 1 is set to u.

次に、時空間頻度計算部10は、正解アノテーション記憶部85からユーザID=uに該当するレコードを取得する(ステップS12)。正解アノテーション記憶部85は、各ユーザについて、ある時間区間においてどのような移動手段(正解ラベル)を利用したのかを正しく表す情報を記憶する。   Next, the spatio-temporal frequency calculation unit 10 acquires a record corresponding to the user ID = u from the correct annotation storage unit 85 (step S12). The correct answer annotation storage unit 85 stores information that correctly indicates what moving means (correct answer label) is used in a certain time interval for each user.

図6に、正解アノテーション記憶部85に記憶された情報を例示する。図6の1行は正解アノテーション情報の1レコードを表す。1レコードは、ユーザIDと、開始時刻と終了時刻によって特定される時間区間と、当該時間区間に利用した移動手段(正解ラベル)の情報を含む。なお、正解アノテーション記憶部85には、GPS履歴情報記憶部80に記憶されたGPS履歴情報に対応する全ての情報が記憶されている必要はない。また、ある時間区間に対して、複数の異なる正解ラベルが付与されていることはないものとする。   FIG. 6 illustrates information stored in the correct annotation storage unit 85. One line in FIG. 6 represents one record of correct answer information. One record includes information on the user ID, the time interval specified by the start time and the end time, and the moving means (correct answer label) used for the time interval. The correct answer storage unit 85 need not store all information corresponding to the GPS history information stored in the GPS history information storage unit 80. Further, it is assumed that a plurality of different correct answer labels are not given to a certain time section.

時空間頻度計算部10は、正解アノテーション情報の時間区間に対応する同一ユーザの測位点を、GPS履歴情報の経度/緯度情報を用いて求め、その測位点の集合に対応するメッシュIDの集合を取得して時間帯ごとの頻度情報を計算する(ステップS13)。頻度情報は、当該時間帯にメッシュIDの領域をユーザが訪問した頻度を表す。なお、頻度情報は、ユーザが訪問したら必ず1を加算するのではなく、ある1日の側位点集合に対して1しか加算しないなど他のカウント方法を用いて計算してもよい。   The spatio-temporal frequency calculation unit 10 obtains the positioning point of the same user corresponding to the time interval of the correct annotation information using the longitude / latitude information of the GPS history information, and obtains a set of mesh IDs corresponding to the set of positioning points. Obtain and calculate frequency information for each time zone (step S13). The frequency information represents the frequency with which the user visited the mesh ID area during the time period. Note that the frequency information is not necessarily incremented when the user visits, but may be calculated using another counting method such as adding only 1 to a set of side points for a certain day.

メッシュIDは、地理上の一定領域を表すメッシュに対応するIDで、例えば標準地域メッシュ(JISX0410地域メッシュコード)などを用いることができる。時間帯には例えば24時間を4分割した単位を用いることができる。他にも1時間ごとの単位や、朝、昼、晩、といった単位を用いることもできる。   The mesh ID is an ID corresponding to a mesh representing a certain geographical area. For example, a standard area mesh (JISX0410 area mesh code) can be used. For the time zone, for example, a unit obtained by dividing 24 hours into four can be used. Other units such as an hourly unit or morning, noon, and evening can also be used.

時空間頻度計算部10は、計算した頻度情報を、時空間頻度記憶部20に記憶する(ステップS14)。そして、未処理のユーザが無くなるまでステップS11〜S14までの処理を繰り返し(ステップS15のYES)、未処理のユーザが無くなった時点で上記の処理を終了する(ステップS15のNO)。   The spatiotemporal frequency calculation unit 10 stores the calculated frequency information in the spatiotemporal frequency storage unit 20 (step S14). Then, the processes from step S11 to S14 are repeated until there are no unprocessed users (YES in step S15), and the above process is terminated when there are no unprocessed users (NO in step S15).

図7に、時空間頻度記憶部20に記憶された時空間頻度情報の例を示す。ユーザID=1のユーザが、1日を4分割した時間帯にメッシュIDで表される一定領域に訪問した頻度が記憶される。図7に示す例は、ユーザID=1のユーザがAM6時−12時の時間帯に5438-2343のメッシュIDで表される領域に3回訪問したことを表している。   FIG. 7 shows an example of the spatiotemporal frequency information stored in the spatiotemporal frequency storage unit 20. The frequency with which the user with the user ID = 1 visits a certain area represented by the mesh ID in the time period obtained by dividing the day into four is stored. The example shown in FIG. 7 represents that the user with the user ID = 1 visited the area represented by the mesh ID of 5438-2343 three times in the time zone from 6 am to 12 am.

〔セグメント抽出機能部〕
図8に、セグメント抽出機能部70の動作フローを示す。セグメント抽出機能部70は、GPS履歴情報記憶部80から、同じ移動手段で移動した連続する軌跡の最小単位であるセグメントを抽出する。
[Segment Extraction Function]
FIG. 8 shows an operation flow of the segment extraction function unit 70. The segment extraction function unit 70 extracts, from the GPS history information storage unit 80, a segment that is the minimum unit of continuous trajectories moved by the same moving means.

セグメントは、GPS履歴情報記憶部60に記憶された連続する複数のレコード(図5の1行)で構成され、複数のセグメントは連続するGPS軌跡(GPS Trajectory)の単位を構成する。1つのセッションは、例えば、バスで移動したセグメントと、徒歩で移動したセグメントと、バイクで移動したセグメントの3つのセグメントで構成される。   The segment is composed of a plurality of continuous records (one line in FIG. 5) stored in the GPS history information storage unit 60, and the plurality of segments constitutes a unit of a continuous GPS trajectory (GPS Trajectory). One session is composed of, for example, three segments: a segment moved by bus, a segment moved by foot, and a segment moved by motorcycle.

セグメント抽出機能部70は、GPS履歴情報記憶部80から未処理のユーザIDを取得してuとする(ステップS71)。そして、例えばユーザID=1をuとして、該当するレコード集合をGPS履歴情報記憶部80から取得し、当該レコード集合をセッションに分割する(ステップS72)。セッション分割の方法としては、連続するレコードの時刻に、閾値θs秒以上の差がある場合に分割点とする。閾値θsは予め設定されているものとする。セッション分割の他の方法としては、例えば非特許文献1に記載されている方法を用いることができる。   The segment extraction function unit 70 acquires an unprocessed user ID from the GPS history information storage unit 80 and sets it as u (step S71). Then, for example, with user ID = 1 as u, the corresponding record set is acquired from the GPS history information storage unit 80, and the record set is divided into sessions (step S72). As a session division method, a division point is set when there is a difference of the threshold θs seconds or more in the time of successive records. It is assumed that the threshold value θs is set in advance. As another method of session division, for example, the method described in Non-Patent Document 1 can be used.

次に、セグメント抽出機能部70は、セッションをセグメントに分割する(ステップS73)。セグメント分割の方法としては、非特許文献1に記載された公知の方法を用いることができる。   Next, the segment extraction function unit 70 divides the session into segments (step S73). As a segment dividing method, a known method described in Non-Patent Document 1 can be used.

セグメント抽出機能部70は、セッションを分割して抽出したセグメントを、セグメント記憶部65に記憶する(ステップS74)。そして、未処理のユーザが無くなるまでステップS71〜S74までの処理を繰り返し(ステップS75のYES)、未処理のユーザが無くなった時点で上記の処理を終了する(ステップS75のNO)。   The segment extraction function unit 70 stores the segment extracted by dividing the session in the segment storage unit 65 (step S74). Then, the processes in steps S71 to S74 are repeated until there are no unprocessed users (YES in step S75), and the above process is terminated when there are no unprocessed users (NO in step S75).

図9に、セグメント記憶部65に記憶されたセグメント情報の例を示す。セグメント情報は、セグメントID、セッションID、ユーザID、開始ログID、終了ログIDからなる。開始ログIDと終了ログIDは、GPS履歴情報記憶部80に記憶されたログIDのID番号と対応している。   FIG. 9 shows an example of segment information stored in the segment storage unit 65. The segment information includes a segment ID, a session ID, a user ID, a start log ID, and an end log ID. The start log ID and the end log ID correspond to the ID number of the log ID stored in the GPS history information storage unit 80.

この例では、開始ログID=1〜終了ログID=10までのセグメントID=1と、開始ログID=11〜終了ログID=204までのセグメントID=2の2つで、1つのセッション1が構成される。   In this example, one session 1 has two segment IDs = 1, starting log ID = 1 to ending log ID = 10 and segment ID = 2 starting log ID = 11 to ending log ID = 204. Composed.

〔事例生成機能部〕
図10に、事例生成機能部60の動作フローを示す。事例生成機能部60は、GPS履歴情報と正解アノテーション情報とセグメント情報を入力として、移動手段の事例を正しく表す正解ラベルと当該事例の特徴ベクトルと、正解ラベルが与えられていない事例の特徴ベクトルを生成する。
[Case generation function part]
FIG. 10 shows an operation flow of the case generation function unit 60. The case generation function unit 60 receives the GPS history information, the correct answer annotation information, and the segment information, and inputs the correct label that correctly represents the case of the moving means, the feature vector of the case, and the feature vector of the case that is not given the correct answer label. Generate.

事例生成機能部60は、セグメント記憶部65に記憶されたセグメント情報から未処理のセグメント情報を選択してsとする(ステップS61)。次に、選択したセグメント情報sの開始ログIDと終了ログIDの区間に該当するレコードを、GPS履歴情報記憶部80から読み出す。そして、読み出したレコードからセグメント情報sの特徴を抽出する(ステップS62)。   The case generation function unit 60 selects unprocessed segment information from the segment information stored in the segment storage unit 65 and sets it as s (step S61). Next, the record corresponding to the section of the start log ID and the end log ID of the selected segment information s is read from the GPS history information storage unit 80. Then, the feature of the segment information s is extracted from the read record (step S62).

特徴には、例えばセグメント情報sの開始ログID〜終了ログID間における平均速度などを利用する。特徴抽出には、例えば非特許文献1に記載された公知の方法を用いることができる。抽出された特徴はM次元のベクトルx,x,…,xで表現される。 As the feature, for example, an average speed between the start log ID and the end log ID of the segment information s is used. For the feature extraction, for example, a known method described in Non-Patent Document 1 can be used. The extracted feature vector x 1 M-dimensional, x 2, ..., expressed in x M.

次に、事例生成機能部60は、セグメント情報sに対応するラベル(移動手段)を、正解アノテーション記憶部85から読み込む(ステップS63)。具体的に説明する。   Next, the case generation function unit 60 reads a label (moving means) corresponding to the segment information s from the correct annotation storage unit 85 (step S63). This will be specifically described.

正解アノテーション情報のうち、セグメント情報sのユーザIDと同じユーザIDを持つ各レコード(図6の1行)の開始時刻と終了時刻の時刻範囲に対する、セグメント情報sの開始ログIDがGPS履歴情報記憶部80で持つ時刻(開始時刻)と、終了ログIDがGPS履歴情報記憶部80で持つ時刻(終了時刻)とで決まる時刻範囲の被覆率が、最大のレコードを選択し、そのレコードが持つ移動手段を正解ラベルとして採用する。   Among the correct annotation information, the start log ID of the segment information s for the time range of the start time and end time of each record (one line in FIG. 6) having the same user ID as the user ID of the segment information s is stored in the GPS history information. The record having the maximum coverage in the time range determined by the time (start time) held by the section 80 and the time (end time) whose end log ID is held by the GPS history information storage section 80 is selected, and the movement that the record has The means is adopted as the correct answer label.

正解アノテーション情報の移動手段(正解ラベル)を、セグメント情報sから求めた特徴に与えるか否かは、被覆率で判定する。被覆率が閾値θc以上で且つ最大のセグメント情報sの特徴は、移動手段の事例を正しく表すものとして、当該特徴に正解ラベルを与える。ラベルが与えられた特徴は、訓練事例として訓練事例記憶部40に記憶する(ステップS65)。   Whether or not to give the correct annotation information moving means (correct label) to the feature obtained from the segment information s is determined by the coverage. The feature of the segment information s with the coverage ratio equal to or greater than the threshold value θc and correctly representing the case of the moving means is given a correct answer label. The feature given the label is stored in the training example storage unit 40 as a training example (step S65).

被覆率が閾値θc未満のセグメント情報sは正解ラベルがないものとして、当該セグメント情報sのユーザID、セッションID、特徴、メッシュID、時間帯、をラベルなし事例としてラベルなし事例記憶部30に記憶する(ステップS66)。ここでのメッシュIDは、セグメントの開始位置又は終了位置又は中間位置に対応するメッシュIDを用いることができる。また、時簡帯についても開始位置又は終了位置又は中間位置に対応する時簡帯などを用いることができる。   The segment information s whose coverage is less than the threshold θc has no correct answer label, and the user ID, session ID, feature, mesh ID, and time zone of the segment information s are stored in the unlabeled case storage unit 30 as unlabeled cases. (Step S66). As the mesh ID here, a mesh ID corresponding to the start position, end position, or intermediate position of the segment can be used. Also, the time zone corresponding to the start position, the end position, or the intermediate position can be used for the time zone.

事例生成機能部60は、未処理のセグメント情報sが無くなるまでステップS61〜S66までの処理を繰り返し(ステップS67のYES)、未処理のセグメント情報sが無くなった時点で上記の処理を終了する(ステップS67のNO)。   The case generation function unit 60 repeats the processing from step S61 to S66 until there is no unprocessed segment information s (YES in step S67), and ends the above processing when there is no unprocessed segment information s ( NO of step S67).

図11に、事例生成機能部60が生成した訓練事例の例を示す。移動手段(正解ラベル)に対応する特徴ベクトルが記憶されている。図12に、事例生成機能部60が生成したラベルなし事例の例を示す。セッションIDごとに特徴ベクトルとメッシュIDと時間帯が、ユーザIDごとに記憶されている。   In FIG. 11, the example of the training example which the example generation function part 60 produced | generated is shown. A feature vector corresponding to the moving means (correct answer label) is stored. FIG. 12 shows an example of an unlabeled case generated by the case generation function unit 60. A feature vector, a mesh ID, and a time zone are stored for each user ID for each session ID.

〔予測モデル生成機能部〕
図13に、予測モデル生成機能部50のより具体的な機能構成例を示す。予測モデル生成部機能50は、予測モデル生成部52と、予測モデル出力部53と、選択スコア計算部54と、アノテーション要求部55と、ラベルなし事例記憶更新部56と、予測モデル再計算部57とを具備する。
[Prediction model generation function]
FIG. 13 shows a more specific functional configuration example of the prediction model generation function unit 50. The prediction model generation unit function 50 includes a prediction model generation unit 52, a prediction model output unit 53, a selection score calculation unit 54, an annotation request unit 55, an unlabeled case storage update unit 56, and a prediction model recalculation unit 57. It comprises.

図14に、予測モデル生成機能部50の動作フローを示す。図13と図14を参照して予測モデル生成機能部50の動作を説明する。予測モデル生成部52は、訓練事例記憶部40に記憶された全ての訓練事例を読み込み訓練事例集合Tとする(ステップS51)。そして、訓練事例集合Tを用いて予測モデルCを生成する(ステップS52)。予測モデルCは、訓練事例記憶部40に記憶した全ての事例を用いたマルチクラス分類によって生成される。   FIG. 14 shows an operation flow of the prediction model generation function unit 50. The operation of the prediction model generation function unit 50 will be described with reference to FIGS. 13 and 14. The prediction model generation unit 52 reads all the training cases stored in the training case storage unit 40 and sets it as a training case set T (step S51). And the prediction model C is produced | generated using the training example set T (step S52). The prediction model C is generated by multi-class classification using all cases stored in the training case storage unit 40.

マルチクラス分類とは、複数のクラスの中から一つを予測する分類法である。その予測モデルの構築は、例えば非特許文献2に記載された公知の方法を用いて行う。この方法以外でも、マルチクラス分類が可能な教師あり機械学習方法であれば任意の方法を利用することができる。本実施形態では、特徴ベクトルと同じ次元の重みベクトルの内積によって予測を行う線形識別モデルの例で説明を行うが、本実施形態に利用可能なアルゴリズムは線形識別モデルに限定されない。非線形モデルを適用する場合には、予測モデルを記憶する記憶部のデータ構造にアルゴリズムに合わせたスキーマを用いる。   Multi-class classification is a classification method that predicts one of a plurality of classes. The prediction model is constructed using a known method described in Non-Patent Document 2, for example. Other than this method, any method can be used as long as it is a supervised machine learning method capable of multi-class classification. In the present embodiment, an example of a linear identification model that performs prediction based on an inner product of weight vectors of the same dimension as a feature vector will be described. However, an algorithm that can be used in the present embodiment is not limited to a linear identification model. When a nonlinear model is applied, a schema that matches the algorithm is used for the data structure of the storage unit that stores the prediction model.

予測モデル出力部53は、ラベルなし事例記憶部30に記憶したラベルなし事例集合Uの要素数(事例の数)が閾値θ以下の場合に、予測モデルCを外部に出力(ステップS53のYES)し、予測モデル記憶部90に記憶(ステップS58)して動作を終了する。当該事例の数が閾値θより大きい場合に、予測モデルCを選択スコア計算部54に出力する(ステップS53のNO)。閾値θは予め設定されているものとする。   The prediction model output unit 53 outputs the prediction model C to the outside when the number of elements (number of cases) of the unlabeled case set U stored in the unlabeled case storage unit 30 is equal to or less than the threshold θ (YES in step S53). And it memorize | stores in the prediction model memory | storage part 90 (step S58), and operation | movement is complete | finished. When the number of cases is larger than the threshold θ, the prediction model C is output to the selection score calculation unit 54 (NO in step S53). The threshold value θ is set in advance.

選択スコア計算部54は、予測モデルCを用いてラベルなし事例記憶部30に記憶した各事例について移動手段の予測を行い、当該予測の確からしさの程度を表す確信度Fと、時空間頻度記憶部20に記憶したメッシュIDと時間帯とから時空間的な珍しさの程度を表す地理スコアGを求め、確信度Fと地理スコアGから、予測モデルの性能が向上する程度を表す選択スコアSを計算する(ステップS54)。確信度Fには、線形識別モデルの場合、例えば特徴ベクトルと重みベクトルの内積の値の最大値などを用いることができる。他には、例えば非特許文献2に記載された公知の方法を用いることができる。このような確信度Fを計算できない予測モデルを利用する場合には、確信度Fは1であるものとする。   The selection score calculation unit 54 performs prediction of the moving means for each case stored in the unlabeled case storage unit 30 using the prediction model C, and a certainty factor F indicating the degree of certainty of the prediction and a spatio-temporal frequency storage. The geographic score G representing the degree of spatiotemporal rarity is obtained from the mesh ID and time zone stored in the unit 20, and the selection score S representing the degree to which the prediction model performance is improved from the certainty factor F and the geographic score G. Is calculated (step S54). For the certainty factor F, in the case of the linear identification model, for example, the maximum value of the inner product of the feature vector and the weight vector can be used. In addition, the well-known method described in the nonpatent literature 2, for example can be used. When such a prediction model that cannot calculate the certainty factor F is used, the certainty factor F is assumed to be 1.

地理スコアGは、ラベルなし事例のメッシュIDと時間帯情報を用いて計算する。ラベルなし事例集合Uに含まれるある事例のユーザIDをu、メッシュIDをm、時間帯をt、とすると地理スコアGは式(1)で算出する。   The geographic score G is calculated using the mesh ID of the unlabeled case and the time zone information. If the user ID of a case included in the unlabeled case set U is u, the mesh ID is m, and the time zone is t, the geographic score G is calculated by the equation (1).

Figure 0006174527
ここでc(u,m,t)は、時空間頻度記憶部20におけるユーザu,メッシュID,時間帯
tの頻度を表す。同様にc(u,m)はユーザu,メッシュIDの頻度、c(u,t)はユーザu,時間帯tの頻度、c(m,t)はメッシュID, 時間帯tの頻度、c(u)はユーザuの頻度、c(m)はメッシュIDの頻度、c(t)は時間帯tの頻度を表す。また、λ,…,λは各頻度の重み係数でありλ+…+λ=1となるように予め設定されているものとする。
Figure 0006174527
Here, c (u, m, t) represents the frequency of the user u, mesh ID m , and time zone t in the spatio-temporal frequency storage unit 20. Similarly, c (u, m) is the frequency of user u and mesh ID m , c (u, t) is the frequency of user u and time zone t, and c (m, t) is the frequency of mesh ID m and time zone t. , C (u) represents the frequency of user u, c (m) represents the frequency of mesh ID m , and c (t) represents the frequency of time zone t. In addition, λ 1 ,..., Λ 7 are weighting coefficients for each frequency, and are set in advance so that λ 1 +... + Λ 7 = 1.

確信度Fと地理スコアGを用いて選択スコアSは、例えば式(2)で算出できる。   Using the certainty factor F and the geographic score G, the selection score S can be calculated by, for example, Expression (2).

Figure 0006174527
ここでαは重みパラメータであり予め設定されているものとする。選択スコアSが大きいほど、現在の予測モデルCでは正確な移動手段の予測が困難であることを表す。
Figure 0006174527
Here, α is a weight parameter and is set in advance. The larger the selection score S, the more difficult it is to accurately predict the moving means in the current prediction model C.

選択には、例えば選択スコアSに対する閾値θs以上の事例のみを選択する方法を用いることができる。閾値θsは予め設定されているものとする。また、同じユーザIDを持つラベルなし事例集合Uに対する選択スコアSの最小値に対して閾値θsを設けてもよい。選択された事例集合を追加事例集合Vとし、ラベルなし事例集合Uから取り除く(式(3))。   For the selection, for example, a method of selecting only cases having a threshold value θs or more with respect to the selection score S can be used. It is assumed that the threshold value θs is set in advance. Further, a threshold value θs may be provided for the minimum value of the selection score S for the unlabeled case set U having the same user ID. The selected case set is set as an additional case set V and removed from the unlabeled case set U (formula (3)).

Figure 0006174527
更新したラベルなし事例集合Uをラベルなし事例記憶部30に出力する(式(4))。
Figure 0006174527
The updated unlabeled case set U is output to the unlabeled case storage unit 30 (formula (4)).

Figure 0006174527
アノテーション要求部55は、選択スコアSがスコア閾値θs以上のラベルなし事例記憶部30に記憶した各事例を抽出し、当該抽出した事例を外部に提示してアノテーションを要求する(ステップS55)。アノテーションを要求するとは、例えばユーザに事例を提示して、当該事例でユーザが利用した移動手段(注釈:正解ラベル)の入力を要求することである。選択された追加事例集合Vをユーザに提示し、アノテーションを要求する。追加事例集合Vの提示方法としては、セグメントに対応する事例を地図上に可視化するなどの方法を用いることができる。ユーザによって入力されたアノテーションを正解ラベルとして採用する。
Figure 0006174527
The annotation request unit 55 extracts each case stored in the unlabeled case storage unit 30 with the selection score S equal to or greater than the score threshold θs, presents the extracted case to the outside, and requests an annotation (step S55). Requesting an annotation means, for example, presenting a case to the user and requesting input of moving means (annotation: correct answer label) used by the user in the case. The selected additional case set V is presented to the user and an annotation is requested. As a method for presenting the additional case set V, a method of visualizing a case corresponding to a segment on a map can be used. The annotation entered by the user is adopted as the correct answer label.

ラベルなし事例記憶更新部56は、入力されたアノテーションをラベルとした抽出した事例を、ラベルなし事例記憶部30から削除すると共に、抽出した事例を訓練事例記憶部40に追加する(ステップS56)。追加する事例は、選択スコアSを用いてラベルなし事例記憶部30の事例集合Uの中から追加学習に用いる事例を選択する。   The unlabeled case storage update unit 56 deletes the extracted case using the input annotation as a label from the unlabeled case storage unit 30 and adds the extracted case to the training case storage unit 40 (step S56). For the case to be added, a case to be used for additional learning is selected from the case set U of the unlabeled case storage unit 30 using the selection score S.

予測モデル再計算部57は、訓練事例記憶部40に記憶した全ての事例(訓練事例集合T)から、移動手段を予測する予測モデルCを再計算して予測モデル出力部53に出力する(ステップS57)。予測モデル再計算部57は、新たに設定された訓練事例集合Tを用いて予測モデルCの生成を行う。ここで予測モデルCを再計算する方法は、上記のステップS52と同じアルゴリズムを用いる。   The prediction model recalculation unit 57 recalculates the prediction model C that predicts the moving means from all cases (training case set T) stored in the training case storage unit 40 and outputs the prediction model C to the prediction model output unit 53 (step). S57). The prediction model recalculation unit 57 generates a prediction model C using the newly set training case set T. Here, a method for recalculating the prediction model C uses the same algorithm as in step S52.

予測モデル出力部53は、ラベルなし事例記憶部30に記憶した事例の数が閾値θ以下になるまで上記のステップS53〜ステップS57の処理を繰り返す。したがって、ラベルなし事例記憶部30に記憶した事例の数が、所定の数より少なってから予測モデルCが出力される。つまり、所定の数より多い訓練事例から生成した予測モデルCが出力されることになる。   The prediction model output unit 53 repeats the processes of steps S53 to S57 until the number of cases stored in the unlabeled case storage unit 30 becomes equal to or less than the threshold θ. Therefore, the prediction model C is output after the number of cases stored in the unlabeled case storage unit 30 is less than the predetermined number. That is, the prediction model C generated from more training cases than the predetermined number is output.

以上説明したように本実施形態の移動手段推定装置100によれば、少量の正解ラベルが与えられている状況において、ラベルが与えられていないラベルなし事例集合から予測モデルの性能を向上させる観点で事例を選択することが可能になる。そして、その選択したラベルなし事例に対してアノテーションを要求し正解ラベルを追加することで予測モデルの性能向上が可能となる。その結果、ユーザの移動手段の推定精度を向上させることができる。   As described above, according to the moving unit estimation apparatus 100 of the present embodiment, in a situation where a small amount of correct answer labels are given, from the viewpoint of improving the performance of the prediction model from the unlabeled case set to which no labels are given. A case can be selected. The prediction model performance can be improved by requesting an annotation for the selected unlabeled case and adding a correct label. As a result, the estimation accuracy of the user's moving means can be improved.

これらの効果を奏する本実施形態の作用をまとめると次のようになる。移動手段推定装置100の予測モデル生成機能部50が、現在の訓練事例に含まれていない事例に対して、現在の予測モデルの確からしさの程度を表す確信度Fと、時空間頻度記憶部20を用いて時空間の観点で予測モデルの構築に既に同じ事例が利用されたかという観点を表す地理スコアを計算し、これらの2つの観点を用いることで予測モデルの性能が向上する程度を表す選択スコアを計算する。この選択スコアは、移動手段を推定する予測モデルの性能が向上する程度を表す。   The actions of the present embodiment exhibiting these effects are summarized as follows. The prediction model generation function unit 50 of the moving means estimation apparatus 100 has a certainty factor F representing the degree of certainty of the current prediction model for a case not included in the current training case, and a spatio-temporal frequency storage unit 20. Use this to calculate a geographic score that represents whether the same case has already been used to build a prediction model from a spatio-temporal perspective, and use these two perspectives to indicate the degree to which the performance of the prediction model is improved Calculate the score. This selection score represents the degree to which the performance of the prediction model for estimating the moving means is improved.

予測モデル生成機能部50のアノテーション要求部55は、予測モデルの性能が向上する程度の高い事例をユーザに提示してアノテーションを要求する。そして、ラベルなし事例記憶更新部56が、入力されたアノテーションを正解ラベルとした事例を訓練事例記憶部40に追加する。この訓練事例が追加される処理は、ラベルなし事例の数が所定数より少なくなるまで繰り返される。予測モデル再計算部57は、このように追加された訓練事例集合から予測モデルを再計算する。したがって、移動手段を推定する予測モデルの予測精度を向上させることができる。   The annotation request unit 55 of the prediction model generation function unit 50 requests an annotation by presenting a user with a high degree of improvement in the performance of the prediction model. Then, the unlabeled case storage update unit 56 adds a case in which the input annotation is a correct label to the training case storage unit 40. This process of adding training cases is repeated until the number of unlabeled cases is less than a predetermined number. The prediction model recalculation unit 57 recalculates the prediction model from the training case set added in this way. Therefore, the prediction accuracy of the prediction model for estimating the moving means can be improved.

なお、本実施形態では、アノテーションをユーザに対して要求する例で説明を行ったが、正解ラベルが例えば行動ログに記憶されていれば、その行動ログを参照して正解ラベルを自動的に取得するように構成してもよい。このように、本発明は、その要旨の範囲内で変形が可能である。   In this embodiment, an example is described in which an annotation is requested from the user. However, if the correct answer label is stored in, for example, the action log, the correct answer label is automatically acquired with reference to the action log. You may comprise. Thus, the present invention can be modified within the scope of the gist thereof.

上記装置における処理部をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、各装置における処理部がコンピュータ上で実現される。   When the processing unit in the above apparatus is realized by a computer, the processing contents of the functions that each apparatus should have are described by a program. Then, by executing this program on the computer, the processing unit in each device is realized on the computer.

また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記録装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としても良い。   The program is distributed by selling, transferring, or lending a portable recording medium such as a DVD or CD-ROM in which the program is recorded. Further, the program may be distributed by storing the program in a recording device of the server computer and transferring the program from the server computer to another computer via a network.

また、各手段は、コンピュータ上で所定のプログラムを実行させることにより構成することにしてもよいし、これらの処理内容の少なくとも一部をハードウェア的に実現することとしても良い。   Each means may be configured by executing a predetermined program on a computer, or at least a part of these processing contents may be realized by hardware.

10 :時空間頻度計算部
20 :時空間頻度記憶部
30 :ラベルなし事例記憶部
40 :訓練事例記憶部
50 :予測モデル生成機能部
52 :予測モデル生成部
53 :予測モデル出力部
54 :選択スコア計算部
55 :アノテーション要求部
56 :ラベルなし事例記憶更新部
57 :予測モデル再計算部
60 :事例生成機能部
65 :セグメント記憶部
70 :セグメント抽出機能部
80 :GPS履歴情報記憶部
85 :正解アノテーション記憶部
100:移動手段推定装置
10: Spatiotemporal frequency calculation unit 20: Spatiotemporal frequency storage unit 30: Unlabeled case storage unit 40: Training case storage unit 50: Prediction model generation function unit 52: Prediction model generation unit 53: Prediction model output unit 54: Selection score Calculation unit 55: Annotation request unit 56: Unlabeled case storage update unit 57: Prediction model recalculation unit 60: Case generation function unit 65: Segment storage unit 70: Segment extraction function unit 80: GPS history information storage unit 85: Correct answer annotation Storage unit 100: moving means estimation device

Claims (5)

ユーザの位置をGPSで記録したGPS履歴情報に基づいて移動手段を推定する移動手段推定装置であって、
ユーザを識別するユーザIDと、地図上の一定領域を表すメッシュIDと、1日内の時間帯と、前記時間帯に前記ユーザが前記一定領域内に立ち入った頻度とを記憶した時空間頻度記憶部と、
前記移動手段の事例を正しく表す正解ラベルと、前記GPS履歴情報から求めた前記事例の特徴ベクトルとを記憶した訓練事例記憶部と、
前記正解ラベルが与えられていない前記事例の特徴ベクトルを記憶したラベルなし事例記憶部と、
前記訓練事例記憶部に記憶した全ての前記事例から、前記移動手段を予測する予測モデルを生成し、前記ラベルなし事例記憶部に記憶した前記事例の数が閾値以下の場合に、前記予測モデルを出力し、前記ラベルなし事例記憶部に記憶した前記事例の数が前記閾値より大きい場合に、前記正解ラベルが与えられていない前記事例に前記正解ラベルを付与したときに前記予測モデルの信頼度が向上する程度を表す選択スコアを、前記時空間頻度記憶部に記憶したデータを用いて求め、当該選択スコアがスコア閾値よりも大きい前記事例を前記ラベルなし事例記憶部から抽出し、当該抽出した事例を外部に提示して注釈を要求し、入力された注釈を前記正解ラベルとした前記抽出した事例を、前記訓練事例記憶部に追加し、前記訓練事例記憶部に記憶した全ての前記事例を用いて、前記移動手段を予測する予測モデルを再計算する処理を、前記ラベルなし事例記憶部に記憶した前記事例の数が前記閾値以下になるまで繰り返す予測モデル生成機能部とを具備することを特徴とする移動手段推定装置。
A moving means estimating device for estimating a moving means based on GPS history information in which a user's position is recorded by GPS,
Spatio-temporal frequency storage unit that stores a user ID for identifying a user, a mesh ID representing a certain area on the map, a time zone within a day, and a frequency at which the user has entered the certain area during the time zone When,
A training case storage unit that stores a correct answer label that correctly represents a case of the moving means, and a feature vector of the case obtained from the GPS history information;
An unlabeled case storage unit that stores feature vectors of the case that are not given the correct answer label;
A prediction model for predicting the moving means is generated from all the cases stored in the training case storage unit, and when the number of cases stored in the unlabeled case storage unit is equal to or less than a threshold, the prediction model is When the number of cases stored in the unlabeled case storage unit is greater than the threshold, the reliability of the prediction model is determined when the correct label is assigned to the case that is not given the correct label. A selection score representing the degree of improvement is obtained using data stored in the spatio-temporal frequency storage unit, the case where the selection score is larger than the score threshold is extracted from the unlabeled case storage unit, and the extracted case Is added to the training case storage unit, and the extracted case with the input annotation as the correct answer label is added to the training case storage unit. A prediction model generation function that repeats the process of recalculating the prediction model for predicting the moving means using all the stored cases until the number of cases stored in the unlabeled case storage unit is equal to or less than the threshold value A moving means estimation device.
請求項1に記載した移動手段推定装置において、
前記予測モデル生成機能部は、
前記訓練事例記憶部に記憶した全ての前記事例を用いたマルチクラス分類を行って予測モデルを生成する予測モデル生成部と、
前記ラベルなし事例記憶部に記憶した前記事例の数が閾値以下の場合に、前記予測モデルを外部に出力し、前記事例の数が閾値より大きい場合に、前記予測モデルを選択スコア計算部に出力する予測モデル出力部と、
前記予測モデルを用いて前記ラベルなし事例記憶部に記憶した各事例について前記移動手段の予測を行い、当該予測の確からしさの程度を表す確信度と、前記時空間頻度記憶部に記憶した前記メッシュIDと前記時間帯とから時空間的な珍しさの程度を表す地理スコアを求め、前記確信度と前記地理スコアとから、予測モデルの性能が向上する程度を表す選択スコアを計算する選択スコア計算部と、
前記選択スコアがスコア閾値以上の前記ラベルなし事例記憶部に記憶した各事例を抽出し、当該抽出した事例を外部に提示してアノテーションを要求するアノテーション要求部と、
入力された前記アノテーションを正解ラベルとした前記抽出した前記事例を、前記ラベルなし事例記憶部から削除すると共に、前記抽出した前記事例を前記訓練事例記憶部に追加するラベルなし事例記憶更新部と、
前記訓練事例記憶部に記憶した全ての前記事例から、前記移動手段を予測する予測モデルを再計算して前記予測モデル生成部に出力する予測モデル再計算部とを具備することを特徴とする移動手段推定装置。
In the movement means estimation apparatus according to claim 1,
The prediction model generation function unit
A prediction model generation unit that generates a prediction model by performing multi-class classification using all the cases stored in the training case storage unit;
When the number of cases stored in the unlabeled case storage unit is less than or equal to a threshold, the prediction model is output to the outside, and when the number of cases is greater than the threshold, the prediction model is output to a selection score calculation unit. A prediction model output unit,
Predicting the moving means for each case stored in the unlabeled case storage unit using the prediction model, a certainty factor representing the degree of certainty of the prediction, and the mesh stored in the spatio-temporal frequency storage unit Selection score calculation that obtains a geographic score representing the degree of spatiotemporal rarity from the ID and the time zone, and calculates a selection score that represents the degree of improvement in the performance of the prediction model from the certainty factor and the geographic score And
Extracting each case stored in the unlabeled case storage unit having the selection score equal to or higher than a score threshold, and presenting the extracted case to the outside and requesting an annotation;
The extracted case with the input annotation as a correct label is deleted from the unlabeled case storage unit, and the unlabeled case storage update unit adds the extracted case to the training case storage unit;
And a prediction model recalculation unit that recalculates a prediction model for predicting the moving means from all the cases stored in the training case storage unit and outputs the prediction model to the prediction model generation unit. Means estimation device.
請求項2に記載した移動手段推定装置において、
前記地理スコアは次式で計算し、
Figure 0006174527
ここでGは地理スコア、c(u,m,t)は前記時空間頻度記憶部におけるユーザu,メッシュ
ID,時間帯tの頻度、c(u,m)はユーザu,メッシュIDの頻度、c(u,t)はユーザu,時間帯tの頻度、c(m,t)はメッシュID, 時間帯tの頻度、c(u)はユーザuの頻度、c(m)はメッシュIDの頻度、c(t)は時間帯tの頻度を表し、λはλ+…+λ=1となる重み係数であり、
前記選択スコアは次式で計算し、
Figure 0006174527
ここでSは選択スコア、Fは前記確信度、αは重みパラメータであることを特徴とする移動手段推定装置。
In the movement means estimation apparatus according to claim 2,
The geographic score is calculated by the following formula:
Figure 0006174527
Here, G is the geographic score, c (u, m, t) is the frequency of user u, mesh ID m and time zone t in the spatio-temporal frequency storage unit, and c (u, m) is the user u and mesh ID m . Frequency, c (u, t) is frequency of user u, time zone t, c (m, t) is mesh ID m , frequency of time zone t, c (u) is frequency of user u, c (m) is The frequency of the mesh ID m , c (t) represents the frequency of the time zone t, λ is a weighting factor that becomes λ 1 +... + Λ 7 = 1,
The selection score is calculated by the following formula:
Figure 0006174527
Here, S is a selection score, F is the certainty factor, and α is a weight parameter.
ユーザの位置をGPSで記録したGPS履歴情報から移動手段を推定する移動手段推定装置の動作方法であって、
前記移動手段推定装置の予測モデル生成機能部が、前記移動手段推定装置の訓練事例記憶部に記憶した全ての事例から、前記移動手段を予測する予測モデルを生成し、前記移動手段推定装置のラベルなし事例記憶部に記憶した前記事例の数が閾値以下の場合に、前記予測モデルを出力し、前記ラベルなし事例記憶部に記憶した前記事例の数が前記閾値より大きい場合に、前記移動手段の事例を正しく表す正解ラベルが与えられていない前記事例に当該正解ラベルを付与したときに前記予測モデルの信頼度が向上する程度を表す選択スコアを、前記移動手段推定装置の時空間頻度記憶部に記憶したデータを用いて求め、当該選択スコアがスコア閾値よりも大きい前記事例を前記ラベルなし事例記憶部から抽出し、当該抽出した事例を外部に提示して注釈を要求し、入力された注釈を前記正解ラベルとした前記抽出した事例を、前記訓練事例記憶部に追加し、当該訓練事例記憶部に記憶した全ての前記事例を用いて、前記移動手段を予測する予測モデルを再計算する処理を、前記ラベルなし事例記憶部に記憶した前記事例の数が前記閾値以下になるまで繰り返すことを特徴とする移動手段推定装置の動作方法。
An operation method of a moving means estimating device for estimating a moving means from GPS history information in which a user's position is recorded by GPS,
The prediction model generation function unit of the moving unit estimation device generates a prediction model for predicting the moving unit from all the cases stored in the training case storage unit of the moving unit estimation device, and the label of the moving unit estimation device When the number of cases stored in the none case storage unit is less than or equal to a threshold, the prediction model is output, and when the number of cases stored in the unlabeled case storage unit is greater than the threshold, the moving means A selection score representing the degree of improvement in reliability of the prediction model when the correct label is assigned to the case that is not given a correct label that correctly represents the case is stored in the spatio-temporal frequency storage unit of the moving means estimating device. Using the stored data, find the case where the selection score is greater than the score threshold from the unlabeled case storage unit, and present the extracted case to the outside Requesting an annotation, adding the extracted case with the input annotation as the correct answer label to the training case storage unit, and using all the cases stored in the training case storage unit, the moving means The operation method of the moving means estimating apparatus is characterized in that the process of recalculating the prediction model for predicting is repeated until the number of cases stored in the unlabeled case storage unit becomes equal to or less than the threshold value.
請求項1乃至3の何れかに記載した移動手段推定装置としてコンピュータを機能させるためのプログラム。   The program for functioning a computer as a moving means estimation apparatus in any one of Claims 1 thru | or 3.
JP2014139441A 2014-07-07 2014-07-07 Moving means estimation apparatus, operation method thereof, and program Active JP6174527B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014139441A JP6174527B2 (en) 2014-07-07 2014-07-07 Moving means estimation apparatus, operation method thereof, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014139441A JP6174527B2 (en) 2014-07-07 2014-07-07 Moving means estimation apparatus, operation method thereof, and program

Publications (2)

Publication Number Publication Date
JP2016018308A JP2016018308A (en) 2016-02-01
JP6174527B2 true JP6174527B2 (en) 2017-08-02

Family

ID=55233510

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014139441A Active JP6174527B2 (en) 2014-07-07 2014-07-07 Moving means estimation apparatus, operation method thereof, and program

Country Status (1)

Country Link
JP (1) JP6174527B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109978491B (en) * 2019-02-12 2024-02-06 平安科技(深圳)有限公司 Reminding prediction method, reminding prediction device, computer equipment and storage medium
JP7419035B2 (en) 2019-11-22 2024-01-22 キヤノン株式会社 Learning model management system, learning model management method, and program
CN112016633A (en) * 2020-09-25 2020-12-01 北京百度网讯科技有限公司 Model training method and device, electronic equipment and storage medium

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008276453A (en) * 2007-04-27 2008-11-13 Toshiba Corp Behavior identification device and method
US8015144B2 (en) * 2008-02-26 2011-09-06 Microsoft Corporation Learning transportation modes from raw GPS data
JP5222189B2 (en) * 2009-03-19 2013-06-26 株式会社エヌ・ティ・ティ・ドコモ Moving means estimation apparatus and moving means estimation method
WO2013179359A1 (en) * 2012-06-01 2013-12-05 株式会社日立製作所 Transportation means determination system, transportation means determination device, and transportation means determination program

Also Published As

Publication number Publication date
JP2016018308A (en) 2016-02-01

Similar Documents

Publication Publication Date Title
JP7203769B2 (en) Voxel-based ground plane estimation and object segmentation
CN105532030B (en) For analyzing the devices, systems, and methods of the movement of target entity
CN110235148B (en) Training action selection neural network
JP6892389B2 (en) Selection of representative video frames for video
US10217033B2 (en) System and method for generating a map from activity data
JP6455113B2 (en) Object tracking method and apparatus
KR102033050B1 (en) Unsupervised Learning Technique for Time Difference Model
US20170116530A1 (en) Generating prediction models in accordance with any specific data sets
JP2011252844A (en) Data processing device, data processing method and program
US20160364472A1 (en) Functional space-time trajectory clustering
US10592786B2 (en) Generating labeled data for deep object tracking
JP7218754B2 (en) Vacant house determination device, vacant house determination method and program
KR101813805B1 (en) Method and Apparatus for purchase probability prediction of user using machine learning
JP6174527B2 (en) Moving means estimation apparatus, operation method thereof, and program
JP6110281B2 (en) Moving unit prediction model generation apparatus, moving unit prediction model generation method, and moving unit prediction model generation program
JP2011170453A (en) Device, method and program for calculation of location existence probability, and travel route recommendation device, method and program
CN110263250B (en) Recommendation model generation method and device
CN115774819A (en) Interest point recommendation method and system based on hierarchical recurrent neural network
JP6038857B2 (en) Moving means estimation model generation apparatus, moving means estimation model generation method, moving means estimation model generation program
US20160148223A1 (en) Forecasting web metrics using statistical causality based feature selection
JP2019095895A (en) Human flow predicting device, method, and program
JP6433876B2 (en) Parameter estimation apparatus, prediction apparatus, method, and program
JP2014115911A (en) Information recommendation apparatus, information recommendation method, and information recommendation program
JP6360000B2 (en) Moving means estimation model generation apparatus, moving means estimation model generation method, moving means estimation model generation program
JP6149024B2 (en) Moving means estimation model generation apparatus, moving means estimation model generation method, moving means estimation model generation program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160913

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170616

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170704

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170706

R150 Certificate of patent or registration of utility model

Ref document number: 6174527

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150