JP6464849B2 - Moving path data anonymization apparatus and method - Google Patents

Moving path data anonymization apparatus and method Download PDF

Info

Publication number
JP6464849B2
JP6464849B2 JP2015056147A JP2015056147A JP6464849B2 JP 6464849 B2 JP6464849 B2 JP 6464849B2 JP 2015056147 A JP2015056147 A JP 2015056147A JP 2015056147 A JP2015056147 A JP 2015056147A JP 6464849 B2 JP6464849 B2 JP 6464849B2
Authority
JP
Japan
Prior art keywords
data
movement
route data
anonymization
route
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015056147A
Other languages
Japanese (ja)
Other versions
JP2016177452A (en
Inventor
正 柳原
正 柳原
敏朗 疋田
敏朗 疋田
隆文 西山
隆文 西山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Motor Corp
Original Assignee
Toyota Motor Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Motor Corp filed Critical Toyota Motor Corp
Priority to JP2015056147A priority Critical patent/JP6464849B2/en
Publication of JP2016177452A publication Critical patent/JP2016177452A/en
Application granted granted Critical
Publication of JP6464849B2 publication Critical patent/JP6464849B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Traffic Control Systems (AREA)

Description

本発明は、移動経路データを匿名化する技術に関する。   The present invention relates to a technique for anonymizing travel route data.

数多くの車両からサーバにデータを送信し、サーバにおいてデータを加工することで種々のサービスを提供することができる。例えば、特許文献1では、災害時に車両の走行履歴を収集することで、その時点で走行可能な避難ルートマップを作成することが開示されている。このように、車両の移動経路データは有効なデータであり、種々のサービスに利用可能である。   Various services can be provided by transmitting data from a large number of vehicles to a server and processing the data in the server. For example, Patent Document 1 discloses that an evacuation route map that can be traveled at that time is created by collecting a travel history of a vehicle at the time of a disaster. As described above, the moving route data of the vehicle is effective data and can be used for various services.

ただし、移動経路データから個人を特定することが可能であるため、移動経路データは個人保護法によって規定される個人情報に該当し、そのままでは情報提供者の同意なく第三者に提供することはできない。したがって、個人を特定できないように移動経路データを匿名化することが望まれている。   However, since it is possible to identify an individual from the travel route data, the travel route data falls under the personal information stipulated by the Personal Protection Law, and as it is, it cannot be provided to a third party without the consent of the information provider. Can not. Therefore, it is desired to anonymize the travel route data so that an individual cannot be specified.

特許文献2は、ユーザの移動履歴のうち、軌跡データに含まれるそれぞれの位置を存在確率に変換するとともに、一定時間が経過していればデータを消滅させることで個人特定を防いでいる。しかしながら、軌跡が抽象化されたエリアにぼかされてしまうので、経路案内等のサービスに応用することが困難になってしまうという問題がある。   In Patent Document 2, each position included in the trajectory data in the user's movement history is converted into an existence probability, and the personal identification is prevented by erasing the data if a predetermined time has elapsed. However, since the locus is blurred in the abstracted area, there is a problem that it becomes difficult to apply to a service such as route guidance.

特許文献3は、ユーザの位置情報を取得してよい領域と取得してはいけないパーソナルエリア領域とを設定し、ユーザの移動経路情報を取得する際に、パーソナルエリア領域の移動履歴は削除したり利用禁止にしたりすることで、ユーザのプライバシーに配慮している。しかしながら、パーソナルエリア領域の移動経路が削除されても、その他の経路が他のユーザと比べてユニークであれば、経路から個人を特定できてしまうという問題がある。   Patent Literature 3 sets areas where user position information may be acquired and personal area areas that should not be acquired. When acquiring user movement route information, the movement history of the personal area area is deleted. The user's privacy is considered by prohibiting the use. However, even if the movement route of the personal area area is deleted, there is a problem that an individual can be specified from the route if the other route is unique compared to other users.

特許文献4は、k−匿名化の手法を用いて、ユーザのプライバシーを保護することを開示する。しかしながら、k−匿名性を担保するために位置情報の精度を落とすと、移動経路がぼかされてしまう。また、位置情報の精度を落とさずにk−匿名性を担保しようとすると、数多くのユーザが通る経路のみしか利用できないことになってしまう。   Patent document 4 discloses protecting a user's privacy using the technique of k-anonymization. However, if the accuracy of the position information is lowered in order to ensure k-anonymity, the movement route will be blurred. Further, if k-anonymity is to be secured without reducing the accuracy of the position information, only the route through which many users pass can be used.

特許文献5は、車両情報を収集する際に、個人を特定できる情報と個人を特定できない情報とを異なるセッションで送信することで、ユーザのプライバシーに配慮している。しかしながら、移動経路自体が個人を特定できる情報であるため、この手法では移動経路の匿名化はできない。   Patent Document 5 considers user privacy by collecting information that can identify an individual and information that cannot identify an individual in different sessions when collecting vehicle information. However, since the travel route itself is information that can identify an individual, this method cannot make the travel route anonymous.

特開2011−95850号公報JP 2011-95850 A 特開2013−222305号公報JP 2013-222305 A 特開2010−34784号公報JP 2010-34784 A 特開2012−128859号公報JP 2012-128859 A 特開2014−102680号公報JP 2014-102680 A

上記のような問題を考慮して、本発明は、個人の特定を避けつつ有効活用可能な形式で移動経路データを匿名化可能な技術を提供することを目的とする。   In view of the above problems, an object of the present invention is to provide a technique capable of anonymizing travel route data in a format that can be effectively used while avoiding individual identification.

上記目的を達成するために、本発明に係る移動経路データ匿名化装置は、以下の構成を備える。すなわち、本発明にかかる移動経路データ匿名化装置は、移動経路と移動が行われた時間帯とを含む移動経路データを取得する経路データ取得手段と、前記複数の移動経路データを、移動経路の類似度に基づいて同一クラス内の移動経路データ数が第1閾値以上となるようにクラス分けし、同一クラス内の移動経路データの移動経路を代表移動経路に統一する経路匿名化手段と、同一クラス内の移動経路データについて同じ時間帯に行われた移動が第2閾値以上となるように前記移動経路データにおける移動が行われた時間帯を抽象化する時刻匿名化手段と、経路匿名化手段と時刻匿名化手段による処理後の移動経路データを出力する出力手段と、を備える。   In order to achieve the above object, a movement path data anonymization device according to the present invention comprises the following arrangement. That is, the movement route data anonymization device according to the present invention includes route data acquisition means for acquiring movement route data including a movement route and a time zone during which the movement has been performed, and the plurality of movement route data. Same as route anonymization means that classifies so that the number of movement route data in the same class is equal to or more than the first threshold based on the similarity, and unifies the movement route of the movement route data in the same class to the representative movement route Time anonymization means for abstracting a time zone in which movement in the movement route data is performed so that movement performed in the same time zone for the movement route data in the class is equal to or greater than a second threshold; and route anonymization means And output means for outputting movement route data after processing by the time anonymization means.

このような構成によれば、移動経路および移動時刻(時間帯)が抽象化されて、出力結果に含まれる移動経路データにおいてある時間帯にある移動経路をとったユーザの数が閾値以上であることが担保でき、出力された移動経路から個人を特定することが困難となる。また、出力される移動経路データは位置範囲がぼかされたデータではないため、種々のサービスに有効活用することができる。   According to such a configuration, the movement route and the movement time (time zone) are abstracted, and the number of users who took the movement route in a certain time zone in the movement route data included in the output result is equal to or greater than the threshold value. It is difficult to specify an individual from the output travel route. Further, since the output travel route data is not data with a blurred location range, it can be effectively used for various services.

移動経路データは、例えば、通過したリンクの集合として表すことができるし、通過したノードの集合として表すこともできる。移動が行われた時間帯は、リンクあるいはノードに進入した時刻や退出した時刻として表すことができる。   The travel route data can be represented, for example, as a set of passed links or as a set of passed nodes. The time zone in which the movement is performed can be expressed as a time when the user enters or leaves the link or node.

経路匿名化手段による経路データのクラス分けは、移動経路の類似度に基づく処理であれば、特に限定されない。移動経路の類似度は、例えば、レーベンシュタイン距離やジャカード(Jaccard)距離などの尺度を用いて測ることができる。なお、本明細書では、類
似している場合を類似度が高いと表現し、類似していない場合を類似度が低いと表現するが、実装においては類似度として類似しているほど小さい数値を割り当てても構わない。例えば、距離を類似度として採用する場合には、値が小さいほど類似度が高いことになる。
The classification of route data by the route anonymization means is not particularly limited as long as it is processing based on the similarity of moving routes. The similarity of travel paths can be measured, for example, using a scale such as a Levenshtein distance or a Jaccard distance. In this specification, a case where they are similar is expressed as a high degree of similarity, and a case where they are not similar is expressed as a low degree of similarity. You can assign it. For example, when the distance is adopted as the similarity, the similarity is higher as the value is smaller.

本発明において、前記経路匿名化手段は、前記移動経路データにクラスタリング処理を施し、クラスタ内のデータ数が前記第1閾値よりも小さなクラスタ内の移動経路データは削除することができる。このようにすれば、同一クラス(クラスタ)内の移動経路データの数が第1閾値以上とすることができ、移動経路データから個人を特定することが困難になる。   In the present invention, the route anonymization means can perform a clustering process on the travel route data, and delete the travel route data in the cluster whose number of data in the cluster is smaller than the first threshold. In this way, the number of travel route data in the same class (cluster) can be set to the first threshold value or more, and it becomes difficult to specify an individual from the travel route data.

本発明において、前記経路匿名化手段は、移動経路データを逐次的にクラスタリング処理を施すものであり、処理対象の移動経路データと、処理済みのクラスタの代表移動経路データとの類似度を算出し、前記類似度のいずれかが前記所定値以上であれば、処理対象の移動経路データは前記類似度が最も高い代表移動経路データのクラスタに属すると判断し、前記類似度のいずれもが前記所定値よりも低ければ、処理対象の移動経路データは、新たなクラスタの代表移動経路データであると判断する、ことができる。このような構成によれば、比較的少ない演算によりクラスタリングが可能である。   In the present invention, the route anonymization means sequentially performs the clustering process on the travel route data, and calculates the similarity between the travel route data to be processed and the representative travel route data of the processed cluster. If any of the similarities is equal to or greater than the predetermined value, it is determined that the travel route data to be processed belongs to a cluster of representative travel route data having the highest similarity, and any of the similarities is the predetermined value. If it is lower than the value, it can be determined that the movement path data to be processed is representative movement path data of a new cluster. According to such a configuration, clustering is possible with relatively few operations.

上記の手法によってクラスタリングを行う場合には、前記経路匿名化手段は、それぞれのクラスタについて、クラスタ内のその他の移動経路データとの類似度が最も高い移動経路データを、代表移動経路データに設定しなおす、ことも好ましい。なお、クラスタ内のその他の移動経路データとの類似度は、同一クラスタ内の他のデータとの距離の二乗和や
絶対値和などによって評価できる。上述のように移動経路データを逐次的に処理してクラスタリングする場合、後から入力された移動経路データの方が代表移動経路として相応しい場合も生じる。代表移動経路データを設定し直すことで、より適切な経路を代表移動経路とすることができる。
When clustering is performed by the above method, the route anonymization means sets, for each cluster, the travel route data having the highest similarity to the other travel route data in the cluster as the representative travel route data. In addition, it is also preferable. Note that the degree of similarity with other travel route data in the cluster can be evaluated by the sum of squares of distances to other data in the same cluster, the sum of absolute values, or the like. When the movement route data is sequentially processed and clustered as described above, the movement route data input later may be more suitable as the representative movement route. By resetting the representative movement route data, a more appropriate route can be set as the representative movement route.

また、前記経路匿名化手段は、前記移動経路データに階層型クラスタリング処理を施すこともできる。階層型クラスタリングは、具体的にはどのようなものであってもよく、分岐型および凝集型のいずれも採用可能である。また、クラスタ間の距離として、最短距離、最長距離、群平均距離、ウォード距離などの基準を採用可能である。階層型クラスタリング処理を採用する場合、前記経路匿名化手段は、クラスタ内類似度が所定値以上でありかつクラス内のデータ数が前記第1閾値以上となるようにクラス分けを決定するものであり、クラス内類似度が前記所定値以上でありかつクラス内のデータ数が前記第1閾値以上となるようにクラス分けできない移動経路データは削除する、ことも好ましい。このようにしても、同一クラス内の移動経路の類似性を担保しつつ、同一クラス内のデータ数を第1閾値以上とすることができる。   Further, the route anonymization means can perform a hierarchical clustering process on the travel route data. The hierarchical clustering may be anything concretely, and any of a branching type and an aggregation type can be adopted. Further, as the distance between the clusters, standards such as the shortest distance, the longest distance, the group average distance, and the ward distance can be adopted. In the case of employing hierarchical clustering processing, the path anonymization means determines classification so that the intra-cluster similarity is equal to or greater than a predetermined value and the number of data in the class is equal to or greater than the first threshold. It is also preferable to delete travel route data that cannot be classified so that the intraclass similarity is equal to or greater than the predetermined value and the number of data in the class is equal to or greater than the first threshold. Even in this case, it is possible to make the number of data in the same class equal to or more than the first threshold while ensuring the similarity of the movement routes in the same class.

また、前記経路匿名化手段は、出発地と目的地のペアが同じ移動経路データごとに、上記のクラス分けおよび移動経路の統一を行うことが好ましい。なお、出発地と目的地は、後述するようにある程度の範囲を有するエリアとして表されてもよく、この場合は、出発地エリアと目的地エリアのペアが同じ移動経路データごとに処理が行われることになる。上述したように、クラス分けおよび移動経路を統一する処理では、出発地と目的地のペアが一致している方が、処理が容易であるとともに得られる結果が有効活用しやすいという効果が得られる。   Moreover, it is preferable that the said route anonymization means performs said classification and unification of a movement route for every movement route data with the same starting point and destination pair. The starting point and the destination may be represented as an area having a certain range as will be described later. In this case, the pair of the starting point area and the destination area is processed for each movement route data. It will be. As described above, in the process of classifying and unifying moving routes, it is easier to process and the results obtained can be more effectively used when the pair of the starting point and the destination match. .

また、本発明における前記時刻匿名化手段は、同一クラス内の移動経路データについて、同じ時間帯に行われた移動が前記第2閾値よりも少なければ、当該時間帯に行われた移動経路データを削除することができる。あるいは、前記時刻匿名化手段は、同一クラス内の移動経路データについて、同じ時間帯に行われた移動が前記第2閾値よりも少なければ、時間帯を広げる処理を行うこともできる。このようにすれば、ある時間帯に行われた移動の数が第2閾値以上となることを担保でき、移動が行われた時間帯から個人を特定することが困難になる。   In addition, the time anonymization means in the present invention, for movement route data in the same class, if the movement made in the same time zone is less than the second threshold, the movement route data in the time zone is Can be deleted. Alternatively, the time anonymization means can perform a process of widening the time zone if movement made in the same time zone is less than the second threshold for the travel route data in the same class. If it does in this way, it can be guaranteed that the number of movements performed in a certain time zone will become more than the 2nd threshold, and it will become difficult to specify an individual from the time zone in which movement was performed.

また、本発明は、移動経路データにおける出発地と目的地を、抽象化された領域に置き換える地点抽象化手段をさらに備えることも好ましい。出発地と目的地によって個人の特定が容易になるため、これらの地点をある程度の範囲を有するエリアに置き換えることで、個人の特定を困難にできる。なお、必ずしも全ての出発地と目的地を、抽象化する必要はなく、出発地および目的地が個人を特定する地点であるパーソナルエリアに該当するか否か判断し、パーソナルエリアに該当する出発地および目的地を抽象化された領域に置き換えてもよい。パーソナルエリアに該当するか否かは、移動経路データの提供者が明示的に指示してもよいし、同一ユーザの移動履歴から統計処理によって判断してもよい。   The present invention preferably further comprises point abstracting means for replacing the starting point and destination in the travel route data with the abstracted area. Since identification of an individual becomes easy depending on the starting point and the destination, identification of the individual can be made difficult by replacing these points with areas having a certain range. Note that it is not always necessary to abstract all starting points and destinations, and it is determined whether the starting point and the destination correspond to a personal area that is a point for identifying an individual, and the starting point corresponding to the personal area is determined. And the destination may be replaced with an abstracted area. Whether or not it corresponds to a personal area may be explicitly instructed by the provider of the movement route data, or may be determined by statistical processing from the movement history of the same user.

出発地および目的地の抽象化処理は、経路および時刻の抽象化処理の前に行われても後に行われてもよい。すなわち、前記経路匿名化手段および前記時刻匿名化手段が、前記地点抽象化手段による処理後の移動経路データを対象として処理を行ってもよいし、前記地点抽象化手段が、前記経路匿名化手段および前記時刻匿名化手段による処理後の移動経路データを対象として処理を行ってもよい。   The departure point and destination abstraction processing may be performed before or after the route and time abstraction processing. That is, the route anonymization means and the time anonymization means may perform processing on the movement route data after the processing by the point abstraction means, or the point abstraction means includes the route anonymization means. And you may process for the movement route data after the processing by the time anonymization means.

本発明において、移動経路データ匿名化装置は、移動経路データをどのように取得してもよい。例えば、移動経路データ自体の入力を受け付けてもよい。あるいは、移動経路データ匿名化装置は、位置情報と時刻情報を複数含む移動履歴データを複数取得する移動履
歴取得手段をさらに備え、前記移動経路取得手段は、前記移動履歴データから前記移動経路データを生成する、こともできる。
In the present invention, the movement route data anonymization device may obtain the movement route data in any way. For example, input of movement route data itself may be accepted. Alternatively, the movement route data anonymization device further includes movement history acquisition means for acquiring a plurality of movement history data including a plurality of position information and time information, and the movement route acquisition means obtains the movement route data from the movement history data. It can also be generated.

なお、本発明は、上記手段の少なくとも一部を備える移動経路データ匿名化装置として捉えることができる。また、本発明は、上記手段が行う処理の少なくとも一部を実行する移動経路データ匿名化方法として捉えることもできる。また、本発明は、この方法をコンピュータに実行させるためのコンピュータプログラム、あるいはこのコンピュータプログラムを非一時的に記憶したコンピュータ可読記憶媒体として捉えることもできる。上記手段および処理の各々は可能な限り互いに組み合わせて本発明を構成することができる。   In addition, this invention can be grasped | ascertained as a movement path | route data anonymization apparatus provided with at least one part of the said means. Moreover, this invention can also be grasped | ascertained as the movement path | route data anonymization method which performs at least one part of the process which the said means performs. The present invention can also be understood as a computer program for causing a computer to execute this method, or a computer-readable storage medium in which this computer program is stored non-temporarily. Each of the above means and processes can be combined with each other as much as possible to constitute the present invention.

本発明によれば、個人の特定を避けつつ有効活用可能な形式で移動経路データを匿名化できる。   According to the present invention, travel route data can be anonymized in a format that can be effectively used while avoiding individual identification.

第1の実施形態にかかる(a)移動経路データ収集システムの構成、(b)車載端末の機能ブロック図、(c)経路データ処理装置20の機能ブロック図である。It is (a) composition of a movement course data collection system concerning a 1st embodiment, (b) a functional block diagram of an in-vehicle terminal, and (c) a functional block diagram of course data processing device 20. 第1の実施形態において車載端末によって行われる移動履歴データの取得・送信処理を表すフローチャートである。It is a flowchart showing the acquisition / transmission process of the movement history data performed by the vehicle-mounted terminal in the first embodiment. 第1の実施形態において経路データ処理装置によって行われる移動経路匿名化処理の全体の流れを示すフローチャートである。It is a flowchart which shows the whole flow of the movement path | route anonymization process performed by the path | route data processing apparatus in 1st Embodiment. 第1の実施形態における移動経路データのデータフォーマット例を示す図である。It is a figure which shows the data format example of the movement path | route data in 1st Embodiment. 第1の実施形態の移動経路匿名化処理における出発地/目的地匿名化処理の詳細を示すフローチャートである。It is a flowchart which shows the detail of the origin / destination anonymization process in the movement path | route anonymization process of 1st Embodiment. 第1の実施形態における出発地/目的地匿名化処理を説明する図である。It is a figure explaining the origin / destination anonymization process in 1st Embodiment. 第1の実施形態の移動経路匿名化処理における経路匿名化処理の詳細を示すフローチャートである。It is a flowchart which shows the detail of the path | route anonymization process in the movement path | route anonymization process of 1st Embodiment. 第1の実施形態における経路匿名化処理を説明する図である。It is a figure explaining the path | route anonymization process in 1st Embodiment. 第1の実施形態の移動経路匿名化処理における時刻匿名化処理の詳細を示すフローチャートである。It is a flowchart which shows the detail of the time anonymization process in the movement path | route anonymization process of 1st Embodiment. 第1の実施形態の移動経路匿名化処理における時刻匿名化処理の変形例を示すフローチャートである。It is a flowchart which shows the modification of the time anonymization process in the movement path | route anonymization process of 1st Embodiment. 第1の実施形態における時刻匿名化処理を説明する図である。It is a figure explaining the time anonymization process in 1st Embodiment. 第2の実施形態における経路匿名化処理の詳細を示すフローチャートである。It is a flowchart which shows the detail of the path | route anonymization process in 2nd Embodiment. 第2の実施形態における経路匿名化処理を説明する図である。It is a figure explaining the path | route anonymization process in 2nd Embodiment. 第3の実施形態における移動経路匿名化処理の全体の流れを示すフローチャートである。It is a flowchart which shows the whole flow of the movement path | route anonymization process in 3rd Embodiment.

(第1の実施形態)
<システム構成>
図1(a)は、本実施形態にかかる移動経路データ収集システムの構成を示す図である。移動経路データ収集システムは、車両1に搭載された車載端末10と、車載端末10とネットワーク30を介して接続された経路データ処理装置20とから構成される。図では1台の車両しか示していないが、移動経路データ収集システムは実際には複数の車両を含む。車載端末10は、定期的に時刻時報と位置情報を取得し、経路データ処理装置20に送信する。経路データ処理装置20は、車載端末10から収集した位置の履歴情報から移動経路データを生成し、移動経路データから個人を特定できないように移動経路データに
対して匿名化処理を施す。
(First embodiment)
<System configuration>
FIG. 1A is a diagram illustrating a configuration of a movement route data collection system according to the present embodiment. The movement route data collection system includes an in-vehicle terminal 10 mounted on the vehicle 1 and a route data processing device 20 connected to the in-vehicle terminal 10 via a network 30. Although only one vehicle is shown in the figure, the movement route data collection system actually includes a plurality of vehicles. The in-vehicle terminal 10 periodically acquires a time signal and position information and transmits them to the route data processing device 20. The route data processing device 20 generates travel route data from position history information collected from the in-vehicle terminal 10 and performs anonymization processing on the travel route data so that an individual cannot be identified from the travel route data.

車載端末10は、CPUやMPUなどの演算装置、主記憶装置や補助記憶装置などの記憶装置、入出力装置、通信インタフェースなどを含む。車載端末10は、記憶装置に格納されたプログラムを演算装置が実行することによって、図1(b)に示す各機能を実現する。すなわち、車載端末10は、位置情報取得部11、時刻情報取得部12、履歴情報送信部13として機能する。なお、これらの機能部の一部または全部について専用のハードウェア回路によって実現しても構わない。   The in-vehicle terminal 10 includes an arithmetic device such as a CPU and an MPU, a storage device such as a main storage device and an auxiliary storage device, an input / output device, a communication interface, and the like. The in-vehicle terminal 10 realizes each function illustrated in FIG. 1B by executing a program stored in the storage device by the arithmetic device. That is, the in-vehicle terminal 10 functions as the position information acquisition unit 11, the time information acquisition unit 12, and the history information transmission unit 13. Note that some or all of these functional units may be realized by dedicated hardware circuits.

位置情報取得部11は、車両1に搭載された位置情報取得装置から現在位置の情報を取得する。位置情報取得装置は、典型的には、全地球航法衛星システム(GNSS:Global
Navigation Satellite System)の衛星信号に基づいて位置情報を算出する装置であり、例えば、GPS(Global Positioning System)、ガリレオ、GLONASS、北斗など
を挙げることができる。ただし、位置情報の取得は、無線基地局からの電波に基づく基地局測位によって行われてもよい。
The position information acquisition unit 11 acquires information on the current position from a position information acquisition device mounted on the vehicle 1. The position information acquisition device is typically a global navigation satellite system (GNSS).
A device that calculates position information based on a satellite signal of a navigation satellite system (GPS), such as GPS (Global Positioning System), Galileo, GLONASS, Hokuto, and the like. However, acquisition of position information may be performed by base station positioning based on radio waves from the radio base station.

時刻情報取得部12は、現在時刻の情報を取得する。位置情報取得装置は時刻情報を取得可能であるため、位置情報取得装置と時刻情報取得装置は同じ装置であっても構わない。また、時刻情報取得部12は、車両1に搭載された内部クロックから時刻情報を取得してもよい。   The time information acquisition unit 12 acquires current time information. Since the position information acquisition device can acquire time information, the position information acquisition device and the time information acquisition device may be the same device. Further, the time information acquisition unit 12 may acquire time information from an internal clock mounted on the vehicle 1.

履歴情報送信部13は、位置情報取得部11が取得した位置情報と、時刻情報取得部12が取得した時刻情報とを、経路データ処理装置20に送信する機能部である。履歴情報送信部13は、位置情報や時刻情報を取得する度に経路データ処理装置20に送信してもよいし、位置情報や時刻情報を一時的に蓄積してからまとめて経路データ処理装置20に送信してもよい。履歴情報送信部13は、位置情報と時刻情報を含む送信データを生成して、無線通信によりネットワーク3を介して送信データを経路データ処理装置20に送信する。   The history information transmission unit 13 is a functional unit that transmits the position information acquired by the position information acquisition unit 11 and the time information acquired by the time information acquisition unit 12 to the route data processing device 20. The history information transmitting unit 13 may transmit the position information and time information to the route data processing device 20 every time it acquires the position information and time information, or after temporarily storing the position information and time information, the route data processing device 20 May be sent to. The history information transmission unit 13 generates transmission data including position information and time information, and transmits the transmission data to the route data processing device 20 via the network 3 by wireless communication.

経路データ処理装置20は、CPUやMPUなどの演算装置、主記憶装置や保持記憶装置などの記憶装置、入出力装置、通信インタフェースなどを有するコンピュータである。経路データ処理装置20は、必ずしも1台のコンピュータによって構成される必要はなく、ネットワークを介して通信可能な複数のコンピュータから構成されてもよい。経路データ処理装置20は、演算装置がプログラムを実行することで、図1(c)に示す各機能を実現する。すなわち、経路データ処理装置20は、履歴情報受信部21、ID変換部22、移動経路データ生成部23、経路匿名化部24、時刻匿名化部25、出発地/目的地匿名化部26、移動経路データ出力部27として機能する。経路データ処理装置20は、本発明における移動経路データ匿名化装置に相当する。これらの各機能部が行う処理については、以下でフローチャートともに詳細に説明する。なお、これらの機能のうち一部または全部について専用のハードウェア回路によって実現しても構わない。   The path data processing device 20 is a computer having an arithmetic device such as a CPU and MPU, a storage device such as a main storage device and a holding storage device, an input / output device, a communication interface, and the like. The route data processing device 20 is not necessarily configured by a single computer, and may be configured by a plurality of computers that can communicate via a network. The route data processing device 20 implements each function shown in FIG. 1C by the arithmetic device executing a program. That is, the route data processing device 20 includes a history information receiving unit 21, an ID converting unit 22, a moving route data generating unit 23, a route anonymizing unit 24, a time anonymizing unit 25, a departure / destination anonymizing unit 26, and a movement. It functions as the route data output unit 27. The route data processing device 20 corresponds to the moving route data anonymization device in the present invention. The processing performed by each of these functional units will be described in detail below along with the flowcharts. Note that some or all of these functions may be realized by a dedicated hardware circuit.

<処理>
以下、本実施形態における経路データ収集システムにおいて行われる処理を詳細に説明する。
<Processing>
Hereinafter, processing performed in the route data collection system in the present embodiment will be described in detail.

[1.移動履歴データ送信処理]
まず、図2(a)を参照して、車載端末10によって行われる移動履歴データの送信処理について説明する。車両1のエンジンが始動されると(S201)、履歴情報送信部13は、位置情報取得部11が取得した位置情報と、時刻情報取得部12が取得した時刻情報を、経路データ処理装置20に送信する(S202)。この際、現在位置がトリップの
出発地であることが分かるフラグ(出発地フラグ)を付けてこれらの情報を送信することが好ましい。
[1. Movement history data transmission processing]
First, the movement history data transmission process performed by the in-vehicle terminal 10 will be described with reference to FIG. When the engine of the vehicle 1 is started (S201), the history information transmission unit 13 sends the position information acquired by the position information acquisition unit 11 and the time information acquired by the time information acquisition unit 12 to the route data processing device 20. Transmit (S202). At this time, it is preferable to transmit these pieces of information with a flag (starting place flag) indicating that the current position is the starting place of the trip.

履歴情報送信部13が送信する移動履歴データのデータフォーマットの例を図2(b)に示す。図2(b)に示すように、移動履歴データは、車両ID201、位置情報202、位置情報属性203、時刻情報204を含む。車両ID201は、車両を特定するIDである。なお、車両IDの代わりに、運転者を特定するIDを採用してもよい。位置情報202は、位置情報取得部11によって取得された位置情報である。位置情報202は、緯度・経度によって表されてもよいし、エリアIDなどの形式で表されてもよい。位置情報属性203は、位置情報202の属性を示す情報である。属性の例として、例えば、位置情報202によって表される位置が出発地・目的地・パーソナルエリアであるといった情報が含まれる。時刻情報204は、時刻情報取得部12によって取得された位置情報である。   An example of the data format of the movement history data transmitted by the history information transmitting unit 13 is shown in FIG. As shown in FIG. 2B, the movement history data includes a vehicle ID 201, position information 202, position information attributes 203, and time information 204. The vehicle ID 201 is an ID that identifies the vehicle. In addition, you may employ | adopt ID which identifies a driver | operator instead of vehicle ID. The position information 202 is position information acquired by the position information acquisition unit 11. The position information 202 may be expressed by latitude / longitude, or may be expressed in a format such as area ID. The position information attribute 203 is information indicating the attribute of the position information 202. Examples of attributes include information that the position represented by the position information 202 is a departure point, a destination, or a personal area. The time information 204 is position information acquired by the time information acquisition unit 12.

エンジン始動後、車載端末10は、定期的に移動履歴データを送信する。すなわち、位置情報および時刻情報の取得タイミングが到来したか判定し(S203)、取得タイミングが到来していれば(S203−YES)、位置情報と時刻情報を取得して経路データ処理装置20に送信する(S204)。なお、データの取得タイミングは、前回の取得タイミングから所定の時間が経過したタイミングであってもよいし、前回の取得タイミングから所定の距離を移動したタイミングであってもよい。移動履歴データの送信は、エンジンが始動している間(S205−NO)継続される。   After the engine is started, the in-vehicle terminal 10 periodically transmits movement history data. That is, it is determined whether the acquisition timing of position information and time information has arrived (S203). If the acquisition timing has arrived (S203—YES), the position information and time information are acquired and transmitted to the route data processing apparatus 20. (S204). The data acquisition timing may be a timing at which a predetermined time has elapsed from the previous acquisition timing, or may be a timing at which a predetermined distance has been moved from the previous acquisition timing. The transmission of the movement history data is continued while the engine is started (S205—NO).

車両1のエンジンが停止すると(S205−YES)、履歴情報送信部13は、位置情報取得部11が取得した位置情報と、時刻情報取得部12が取得した時刻情報を、経路データ処理装置20に送信する(S206)。この際、現在位置がトリップの目的地であることが分かるフラグ(目的地フラグ)を付けてこれらの情報を送信することが好ましい。   When the engine of the vehicle 1 stops (S205—YES), the history information transmission unit 13 sends the position information acquired by the position information acquisition unit 11 and the time information acquired by the time information acquisition unit 12 to the route data processing device 20. Transmit (S206). At this time, it is preferable to transmit these pieces of information with a flag (destination flag) indicating that the current position is the destination of the trip.

ここでの説明では、車載端末10が位置情報と時刻情報を取得する度に経路データ処理装置20に送信しているが、これらの情報を蓄積してまとめて経路データ処理装置20に送信してもよい。また、蓄積した移動履歴データに処理を施してから経路データ処理装置20に送信してもよい。例えば、移動履歴データを、移動経路を表す移動経路データに変換してから経路データ処理装置20に送信してもよい。   In this description, every time the in-vehicle terminal 10 acquires position information and time information, it transmits to the route data processing device 20, but these information is accumulated and transmitted to the route data processing device 20 together. Also good. Alternatively, the accumulated movement history data may be processed and transmitted to the route data processing device 20. For example, the movement history data may be converted into movement route data representing a movement route and then transmitted to the route data processing device 20.

また、ここでの説明では、エンジンが始動された位置をトリップの出発地、エンジンが停止された位置をトリップの目的地としているが、これは処理の一例である。エンジンが停止されてもすぐにエンジンが再始動された場合には、目的地であると判断しなくてもよい。また、エンジンが停止しなくても、長期間停車されたり、停車後に出発地に戻ったりした場合には、その地点を目的地としてもよい。   In the description here, the starting position of the engine is the starting place of the trip, and the stopping position is the position where the engine is stopped. This is an example of processing. If the engine is restarted immediately after the engine is stopped, it may not be determined that the destination is the destination. Even if the engine does not stop, when the vehicle is stopped for a long time or after returning to the departure place, the point may be set as the destination.

[2.移動経路匿名化処理]
次に、経路データ処理装置20が行う移動経路匿名化処理の全体の流れを図3を参照して説明する。経路データ処理装置20の履歴情報受信部21は、車載端末10から送信される移動履歴データを受信して一時的に蓄積する。出発地から目的地までの一連の移動履歴データが取得できたら、移動経路データ生成部23は、移動履歴データから移動経路データを生成する(S301)。図4は、移動経路データのデータフォーマットの一例を示す図である。移動経路データは、車両ID、出発地、出発時刻、通過したリンクとリンク進入時刻、目的地、到着時刻を含む。なお、ここでは移動経路をリンクの集合として表す例を挙げているが、移動経路をノード(交差点)の集合として表してもよいし、リンクとノードの集合として表してもよい。
[2. Travel route anonymization process]
Next, the overall flow of the movement route anonymization process performed by the route data processing apparatus 20 will be described with reference to FIG. The history information receiving unit 21 of the route data processing device 20 receives the movement history data transmitted from the in-vehicle terminal 10 and temporarily accumulates it. When a series of movement history data from the departure point to the destination is acquired, the movement route data generation unit 23 generates movement route data from the movement history data (S301). FIG. 4 is a diagram illustrating an example of a data format of movement route data. The travel route data includes a vehicle ID, a departure place, a departure time, a passed link and a link entry time, a destination, and an arrival time. In addition, although the example which represents a movement route as a set of links is given here, a movement route may be represented as a set of nodes (intersections) or may be represented as a set of links and nodes.

ステップS302において、ID変換部22は、移動経路データにおける車両IDを仮想IDに変換する。ID変換部22は、車両IDの一意性を保ちつつ、変換後の仮想IDから変換前の車両IDを決定できない(決定困難)なようにIDの変換を行う。具体的には、ID変換部22は、乱数などをシードとするハッシュ関数や、特定のパスワードを用いた共通鍵暗号、データベースの標準機能によって生成可能なユニークID(UUID)などを仮想IDとして用いる。   In step S302, the ID conversion unit 22 converts the vehicle ID in the travel route data into a virtual ID. The ID conversion unit 22 converts the ID so that the vehicle ID before conversion cannot be determined from the converted virtual ID (difficult to determine) while maintaining the uniqueness of the vehicle ID. Specifically, the ID conversion unit 22 uses a hash function using a random number or the like as a seed, a common key encryption using a specific password, a unique ID (UUID) that can be generated by a standard function of a database, or the like as a virtual ID. .

ステップS303において、出発地/目的地匿名化部26は、移動経路データにおける出発地と目的地を匿名化する処理を行う。ステップS303の出発地/目的地匿名化処理の詳細を、図5に示す。図5に示される処理は、それぞれの移動経路データの出発地と目的地について実行されるが、以下では出発地を処理対象とする場合を例に説明する。出発地/目的地匿名化部26は、出発地がパーソナルエリアであるか否か判定する(S501)。パーソナルエリアは、個人を特定する可能性が高い場所であり、例えば、自宅、職場、学校などが含まれる。出発地がパーソナルエリアであるか否かは、例えば、車載端末10から送信される移動履歴データに出発地がパーソナルエリアであることを示すフラグ(属性)が付けられているか否かによって判定できる。あるいは、当該車両IDについての蓄積されている過去の移動履歴データから、同じ場所を出発地または目的地とした移動が多く行われていることが分かる場合には、その場所はパーソナルエリアであると判定できる。出発地がパーソナルエリアである場合には処理はステップS502に進み、そうでなければ処理を終了する。なお、出発地/目的地匿名化部26は、全ての出発地および目的地はパーソナルエリアであるとして、全ての経路データについてステップS502以降の処理を施してもよい。   In step S303, the departure point / destination anonymization unit 26 performs processing for anonymizing the departure point and the destination in the travel route data. Details of the departure point / destination anonymization process in step S303 are shown in FIG. The processing shown in FIG. 5 is executed for the starting point and destination of each moving route data. Hereinafter, a case where the starting point is a processing target will be described as an example. The departure place / destination anonymization unit 26 determines whether or not the departure place is a personal area (S501). The personal area is a place where there is a high possibility of identifying an individual, and includes, for example, a home, a workplace, a school, and the like. Whether or not the departure place is a personal area can be determined, for example, by whether or not a flag (attribute) indicating that the departure place is a personal area is attached to the movement history data transmitted from the in-vehicle terminal 10. Alternatively, when it is understood from the past movement history data stored for the vehicle ID that a lot of movements are performed with the same place as the starting point or destination, the place is a personal area. Can be judged. If the departure place is a personal area, the process proceeds to step S502; otherwise, the process ends. Note that the departure point / destination anonymization unit 26 may perform the processing from step S502 on all route data, assuming that all departure points and destinations are personal areas.

ステップS502において、出発地/目的地匿名化部26は、出発地が示す位置(範囲)を、出発地を中心とし所定の半径を有するエリア(領域)に拡張する。そして、ステップS503において、この拡張されたエリア内を出発地とする移動経路データの数が閾値k1以上であるか否か判定する。この条件を満たす場合には(S503−YES)、当該出発地についての抽象化処理はここで終了する。その際、このエリアに含まれる出発地は、全てこのエリアを表すように変更する。この条件を満たさない場合(S503−NO)は、エリア範囲が拡張上限であるか否か判定する(S504)。エリア半径の上限は、匿名化後のデータの使用目的に応じて適宜決定すればよいが、例えば、1km、2km、5kmなどとすることができる。エリア範囲が拡張の上限に達していなければ(S504−NO)、ステップS502に戻ってエリア半径を増加させる。エリア半径の増加のさせ方は、あらかじめ定められた手法で行えばよい。   In step S502, the departure place / destination anonymization unit 26 expands the position (range) indicated by the departure place to an area (region) having a predetermined radius with the departure place as the center. In step S503, it is determined whether or not the number of travel route data starting from the expanded area is greater than or equal to the threshold value k1. When this condition is satisfied (S503-YES), the abstraction process for the departure place ends here. At that time, all the departure points included in this area are changed to represent this area. When this condition is not satisfied (S503-NO), it is determined whether or not the area range is the expansion upper limit (S504). Although the upper limit of an area radius should just be determined suitably according to the intended purpose of the data after anonymization, it can be set to 1 km, 2 km, 5 km, etc., for example. If the area range has not reached the upper limit of expansion (S504-NO), the process returns to step S502 to increase the area radius. The area radius may be increased by a predetermined method.

エリアを上限まで拡張しても、エリア内を出発地とする移動経路データの数が閾値k1に達しない場合(S503−NOかつS504−YES)は、処理対象の移動経路データを削除する(S505)。   If the number of travel route data starting from the area does not reach the threshold value k1 even when the area is expanded to the upper limit (S503-NO and S504-YES), the travel route data to be processed is deleted (S505). ).

図6(a)〜(d)を参照して、出発地/目的地匿名化処理の処理例を説明する。図6(a)は、移動経路データに含まれる出発地を示す図である。ここでは、8つの出発地が含まれているが、以下では3つの出発地N1〜N3に着目して説明する。最初のエリア拡張により、図6(b)に示すように、出発地N1〜N3を中心とする所定の半径のエリアA1〜A3が設定される。ここで、閾値k1が「3」であるとする。エリアA1には4つの出発地が含まれるので、匿名化の条件を満たす。エリアA1に含まれる4つの出発地の位置情報は、エリアA1を表す情報に統一する。エリアA2,A3については、そのエリアに含まれる出発地の数が閾値k1より少ないため、図6(c)に示すように、エリアB2,B3にさらに拡張される。エリアB2に含まれる出発地の数は3つであり、閾値k1以上であるため、匿名化の条件を満たす。そこで、エリアB2に含まれる3つの出発地の位置情報を、エリアB2を表す情報に統一する。エリアB3に含まれる出発地の数は閾値
k1より少ないため、図6(d)に示すようにエリアC3にさらに拡張される。エリアC3の大きさ(半径)は、エリアの拡張上限であるとする。拡張上限までエリアの大きさを拡張しても、そのエリアに含まれる出発地の数を閾値k1以上にならないので、出発地N3を含む移動経路データは破棄される。
A processing example of the departure point / destination anonymization process will be described with reference to FIGS. FIG. 6A is a diagram illustrating a departure place included in the travel route data. Here, eight starting points are included, but the following description will be given focusing on three starting points N1 to N3. By the first area expansion, as shown in FIG. 6B, areas A1 to A3 having a predetermined radius centering on the departure points N1 to N3 are set. Here, it is assumed that the threshold value k1 is “3”. Since area A1 includes four departure points, the condition for anonymization is satisfied. The position information of the four departure points included in the area A1 is unified into information representing the area A1. Areas A2 and A3 are further expanded to areas B2 and B3 as shown in FIG. 6C because the number of departure points included in the areas is smaller than the threshold value k1. Since the number of departure points included in area B2 is three and is equal to or greater than threshold value k1, the condition for anonymization is satisfied. Therefore, the position information of the three departure points included in area B2 is unified to information representing area B2. Since the number of departure points included in the area B3 is less than the threshold value k1, the area B3 is further expanded to the area C3 as shown in FIG. It is assumed that the size (radius) of the area C3 is the upper limit of area expansion. Even if the size of the area is expanded to the expansion upper limit, the number of departure points included in the area does not exceed the threshold value k1, so the travel route data including the departure point N3 is discarded.

上記では、出発地を例にして説明を行ったが、目的地についても同様の処理が行われる。全ての移動経路データの出発地と目的地について、上記の処理が実施されたら出発地/目的地匿名化処理は終了する。   In the above description, the departure place is described as an example, but the same processing is performed for the destination. When the above processing is performed for the departure point and destination of all travel route data, the departure point / destination anonymization process ends.

次に、ステップS304において、経路匿名化部24が経路の匿名化処理を行う。経路の匿名化処理は、移動経路データをクラスタリング(クラス分け)し、同一クラスタ内のデータ数が閾値(k2)より少なければそのクラスタ内のデータを破棄し、同一クラスタ内のデータ数が閾値以上であればこのクラスタ内のデータを1つの代表経路に統一する処理である。これにより、同じ経路を有するデータの数が閾値以上となり、経路から個人を特定することが困難となる。経路匿名化部24は、出発地と目的地のペアが同一の移動経路データにごとに、経路匿名化処理を実施する。図7は、1つの出発地・目的地ペアを有する移動経路データ群に対する経路匿名化処理の詳細を示すフローチャートである。以下、図7を参照しながら、経路匿名化処理S304について説明する。   Next, in step S304, the route anonymization unit 24 performs route anonymization processing. The route anonymization process performs clustering (classification) of travel route data, and discards the data in the cluster if the number of data in the same cluster is less than the threshold (k2), and the number of data in the same cluster exceeds the threshold If so, the process is to unify the data in this cluster into one representative route. As a result, the number of data having the same route becomes equal to or greater than the threshold value, and it becomes difficult to identify an individual from the route. The route anonymization unit 24 performs route anonymization processing for each travel route data having the same starting point and destination pair. FIG. 7 is a flowchart showing details of route anonymization processing for a travel route data group having one departure / destination pair. Hereinafter, the route anonymization process S304 will be described with reference to FIG.

経路匿名化部24は、記憶している移動経路データのそれぞれについて逐次的に(順番に)ループL1の処理を実行する。まず、処理対象の移動経路データと、それまでの処理によりクラスタの代表データであると判定された移動経路との類似度が算出される(S701)。以下の説明では、類似しているほど類似度が高いと表現するが、実装において類似度の数値は類似しているほど小さな数値で表されてもよい。移動経路データの類似度は任意の基準により算出されて良いが、移動経路データがリンクの集合として表されている場合には、レーベンシュタイン距離を用いることができる。レーベンシュタイン距離は、ある移動経路データを別の移動経路データと一致させるために必要な要素(リンク)の置換・挿入・削除の回数に基づいて決定される距離測度である。この他にも、ジャカード距離などを用いて移動経路データの類似度を算出することもできる。   The route anonymization unit 24 executes the process of the loop L1 sequentially (in order) for each of the stored movement route data. First, the similarity between the movement route data to be processed and the movement route determined to be representative data of the cluster by the processing so far is calculated (S701). In the following description, the similarity is expressed as the similarity is higher. However, in the implementation, the numerical value of the similarity may be expressed as a smaller value as the similarity is higher. The similarity of the movement route data may be calculated according to an arbitrary criterion, but when the movement route data is expressed as a set of links, the Levenshtein distance can be used. The Levenshtein distance is a distance measure that is determined based on the number of replacements, insertions, and deletions of elements (links) necessary to match one travel route data with another travel route data. In addition to this, the similarity of the movement route data can be calculated using the Jacquard distance or the like.

経路匿名化部24は、ステップS701において算出された類似度が閾値R以上となるような代表データが存在するか判定する(S702)。そのような代表データが存在する場合(S702−YES)には、処理対象の移動経路データは、最も類似する代表データのクラスタに属するものと判定される(S703)。一方、類似度が閾値R以上となるような代表データが存在しない場合(S702−NO)には、処理対象の移動経路データは既存のいずれのクラスタに属しないと判定され、この移動経路データを代表データとする新規のクラスタが生成される(S704)。   The route anonymization unit 24 determines whether there is representative data whose similarity calculated in step S701 is equal to or greater than the threshold value R (S702). If such representative data exists (S702-YES), it is determined that the movement path data to be processed belongs to the most similar cluster of representative data (S703). On the other hand, if there is no representative data whose similarity is equal to or higher than the threshold value R (S702-NO), it is determined that the movement path data to be processed does not belong to any existing cluster, and this movement path data is A new cluster as representative data is generated (S704).

図8を参照して上記の処理を例示的に説明する。図8(a)は、ある処理時点で処理されたデータを模式的に表す図であり、黒丸で示すデータN1,N2がクラスタの代表データであり、各代表データに接続して示された白丸のデータがクラスタ内のデータである。ここで、図8(b)に示すように新規のデータが処理されて、最も類似する既存の代表データ(ここでデータN2)との類似度が閾値R以上であると場合は、この新規の移動経路データは代表データN2と同じクラスタに属するものと判定される。一方、図8(c)に示すように、新規のデータがいずれの代表データN1,N2との類似度も閾値Rよりも低い場合には、新規のデータを代表データとする新たなクラスタが生成される。   The above processing will be described by way of example with reference to FIG. FIG. 8A is a diagram schematically showing data processed at a certain processing point. Data N1 and N2 indicated by black circles are representative data of clusters, and white circles connected to the representative data are shown. Is the data in the cluster. Here, when new data is processed as shown in FIG. 8B and the similarity with the most similar existing representative data (here, data N2) is equal to or greater than the threshold value R, the new data is processed. It is determined that the movement route data belongs to the same cluster as the representative data N2. On the other hand, as shown in FIG. 8C, if the new data is lower in the similarity with any of the representative data N1 and N2 than the threshold value R, a new cluster having the new data as representative data is generated. Is done.

なお、ここでは一度クラスタの代表データであると判断された移動経路データは常に代表データであり続けるが、データの増加に伴って代表データを変更する処理を行っても良い。例えば、ステップS703およびS704の後に、代表データの変更処理を行うこと
ができる。この処理では、(1)代表データとの類似度に基づく各移動経路データの再クラスタリングと、(2)各クラスタ内の代表データの再決定とを、代表データが変化しなくなるまで行われる。上記(2)の代表データの決定処理では、同一クラスタ内の他のデータとの類似度が最も高い移動経路データを代表データとすることできる。同一クラスタ内の他のデータとの類似度は、他のデータとの距離の二乗和や絶対値和などによって評価できる。このような処理を追加することで、処理量は増えるがより適切なクラスタリングが可能となる。
Here, the travel route data once determined to be the representative data of the cluster is always the representative data, but a process of changing the representative data as the data increases may be performed. For example, representative data change processing can be performed after steps S703 and S704. In this process, (1) re-clustering of each travel route data based on the similarity to the representative data and (2) redetermination of the representative data in each cluster are performed until the representative data does not change. In the representative data determination process of (2) above, the movement route data having the highest similarity with other data in the same cluster can be used as the representative data. Similarity with other data in the same cluster can be evaluated by a sum of squares of distances to other data or an absolute value sum. By adding such processing, the amount of processing increases, but more appropriate clustering becomes possible.

移動経路データのクラスタリングが終了すると、経路匿名化部24は、各クラスタについてループL2の処理を実行する。経路匿名化部24は、クラスタ内のデータ数が閾値k2以上であるか否か判定し(S705)、閾値k2以上であれば、このクラスタ内の移動経路データを代表データの経路で置換する(S706)。なお、代表データは上記のループL1の処理によって決定されたものであっても良いし、この段階でクラスタ内の他のデータとの類似度が最も高いデータを代表データとして選択し直しても良い。一方、クラスタ内のデータ数が閾値k2よりも少なければ(S705−NO)、経路匿名化部24は、このクラスタ内の移動経路データを破棄する(S707)。   When the clustering of the movement route data is finished, the route anonymization unit 24 executes the process of the loop L2 for each cluster. The route anonymization unit 24 determines whether or not the number of data in the cluster is equal to or greater than the threshold value k2 (S705). If the number of data in the cluster is equal to or greater than the threshold value k2, the route data in this cluster is replaced with the route of the representative data ( S706). The representative data may be determined by the processing of the loop L1, and data having the highest degree of similarity with other data in the cluster may be selected again as representative data at this stage. . On the other hand, if the number of data in the cluster is less than the threshold value k2 (S705-NO), the route anonymization unit 24 discards the movement route data in this cluster (S707).

経路匿名化部24は、全ての出発地・目的地ペアの移動経路データに対する上記の処理を実行する。   The route anonymization unit 24 executes the above-described processing for the movement route data of all departure / destination pairs.

経路匿名化処理S304が終了すると、ステップS305において、時刻匿名化部25が時刻情報の匿名化処理を行う。時刻情報の匿名化処理は、上記の経路匿名化処理におけるクラスタごとに実行され、同じ時間帯に行われた移動のデータ数が閾値以上となるように、時間情報を抽象化する処理である。図9は、時刻情報匿名化処理S305の詳細を示すフローチャートである。以下、図9を参照しながら、時刻情報匿名化処理S305について説明する。   When the route anonymization process S304 ends, in step S305, the time anonymization unit 25 performs anonymization processing of time information. The time information anonymization process is performed for each cluster in the above path anonymization process, and is a process of abstracting the time information so that the number of data of movement performed in the same time zone is equal to or greater than a threshold value. FIG. 9 is a flowchart showing details of the time information anonymization process S305. Hereinafter, the time information anonymization process S305 will be described with reference to FIG.

時刻匿名化部25は、移動経路データのそれぞれのクラスについてループL3の処理を実行する。まず、移動経路データにおける出発地の出発時刻および目的地への到着時刻から、この移動経路データによって表される移動が行われた時刻を時間帯で表す(S901)。例えば、図11(a)に示すように3つの移動経路データ1101〜1103がある場合を考える。ここでは、出発時刻および到着時刻を1時間単位の時間帯で表すものとすると、移動経路データ1101および1102は、7時台(7時台に出発、7時台に到着)に行われた移動であると表現される。一方、移動経路データ1103は、7時台〜8時台(7時台に出発、8時台に到着)に行われた移動であると表現される。   The time anonymization unit 25 executes the process of the loop L3 for each class of the movement route data. First, from the departure time of the departure point and the arrival time at the destination in the movement route data, the time when the movement represented by the movement route data is performed is expressed in a time zone (S901). For example, consider a case where there are three travel route data 1101 to 1103 as shown in FIG. Here, assuming that the departure time and the arrival time are expressed in a time zone of one hour unit, the movement route data 1101 and 1102 are travels performed at 7 o'clock (departing at 7 o'clock and arriving at 7 o'clock). It is expressed as On the other hand, the movement route data 1103 is expressed as a movement performed between 7 o'clock and 8 o'clock (departing at 7 o'clock and arriving at 8 o'clock).

時刻匿名化部25は、次に、同一の時間帯を有する移動経路データごとにループL4の処理を実行する。時刻匿名化部25は、同一時間帯を有する移動経路データ数が閾値k3以上であるか否か判定する(S902)。データ数が閾値k3以上であれば(S902−YES)、移動経路データの出発時刻および時刻情報を、上記の時間帯に置き換える(S903)。一方、データ数が閾値k3より少なければ(S902−NO)、これらの移動経路データを削除する。閾値k3が「2」の場合の例を図11(b)を参照して説明する。ここでは、7時台に行われた移動経路データの数は「2」であり閾値k3(2)以上であるので、これらの移動経路データの出発時刻および到着時刻を、上記の時間帯に置換する。一方、7時台〜8時台に行われた移動経路データの数は「1」であり閾値k3(2)よりも少ないので、この移動経路データは削除される。   Next, the time anonymization unit 25 executes the process of the loop L4 for each movement route data having the same time zone. The time anonymization unit 25 determines whether or not the number of travel route data having the same time zone is equal to or greater than the threshold value k3 (S902). If the number of data is greater than or equal to the threshold value k3 (S902-YES), the departure time and time information of the travel route data are replaced with the above time zone (S903). On the other hand, if the number of data is less than the threshold value k3 (S902-NO), these movement route data are deleted. An example in which the threshold value k3 is “2” will be described with reference to FIG. Here, since the number of travel route data performed at 7 o'clock is “2” and is equal to or greater than the threshold value k3 (2), the departure time and arrival time of these travel route data are replaced with the above time zones. To do. On the other hand, since the number of movement route data performed between 7 o'clock and 8 o'clock is “1”, which is smaller than the threshold value k3 (2), this movement route data is deleted.

なお、同一の時間帯に含まれる移動経路データの数が閾値k3より少ない場合に、単純にデータを削除するのではなく、時間帯の幅を大きくして同一時間帯に含まれるデータ数を増やす処理を行うことも好ましい。この変形例では、図9のステップS904の処理が
図10のフローチャートに示す処理に変更される。時刻匿名化部25は、時間帯が最大時間幅であるか否か判定する(S1001)。時間帯が最大時間幅より狭い場合(S1001−NO)、すなわち、時間幅を拡張可能な場合には、移動経路データにおける時間幅を拡張する(S1002)。そして拡張した時間幅内の移動経路データの数が閾値k3以上であるか否か判定し(S1003)、閾値k3以上であれば時間帯の拡張処理を終了する。一方、時間帯の拡張後もデータ数が閾値k3より少ない場合には、ステップS1001に戻って時間幅の再拡張を試みる。
When the number of travel route data included in the same time zone is smaller than the threshold k3, the data is not simply deleted, but the time zone width is increased to increase the number of data included in the same time zone. It is also preferable to carry out the treatment. In this modification, the process of step S904 in FIG. 9 is changed to the process shown in the flowchart of FIG. The time anonymization unit 25 determines whether or not the time zone is the maximum time width (S1001). When the time zone is narrower than the maximum time width (S1001-NO), that is, when the time width can be expanded, the time width in the movement route data is expanded (S1002). Then, it is determined whether or not the number of travel route data within the expanded time width is equal to or greater than a threshold value k3 (S1003). On the other hand, if the number of data is less than the threshold value k3 even after the expansion of the time zone, the process returns to step S1001 to attempt to re-expand the time width.

閾値k3が「3」、最大時間幅が3時間の場合の例を図11(c)を参照して説明する。ここでは、7時台および7時台〜8時台に行われた移動経路データの数はそれぞれ「2」および「1」であり閾値k3より少ない。それぞれの時間幅は1時間および2時間であるため時間幅の拡張が可能である。ここでは、7時台の移動経路データを7時台〜8時台に拡張することにより、7時台〜8時台に行われた移動経路データの数を閾値k3以上とすることができる。   An example in which the threshold value k3 is “3” and the maximum time width is 3 hours will be described with reference to FIG. Here, the numbers of movement route data performed at 7 o'clock and 7 o'clock to 8 o'clock are “2” and “1”, respectively, which are smaller than the threshold value k3. Since each time width is 1 hour and 2 hours, the time width can be expanded. Here, by expanding the movement route data at 7 o'clock to 7 o'clock to 8 o'clock, the number of movement route data performed from 7 o'clock to 8 o'clock can be made the threshold value k3 or more.

なお、図11(c)に示す例において、閾値k3が「2」の場合に、データ1133を削除してデータ1121および1122のみを7時台の移動として出力しても良いし、データ1121〜1122を7時台〜8時台の移動として出力しても良い。選択基準として、できるだけデータを削除しないように時間幅を大きくするようにしても良いし、データの精度を保つようにデータ数が閾値k3以上となる範囲で最小の時間幅とするようにしてもよいし、時間幅を拡張しない場合の削除データ数と時間幅の拡張に伴う時間の精度の低下の度合いを評価して評価結果に基づいて時間幅を拡張するか否かを決定しても良い。   In the example shown in FIG. 11C, when the threshold value k3 is “2”, the data 1133 may be deleted, and only the data 1121 and 1122 may be output as movement at 7 o'clock. 1122 may be output as a movement from 7 o'clock to 8 o'clock. As a selection criterion, the time width may be increased so as not to delete data as much as possible, or the minimum time width may be set in a range where the number of data is equal to or greater than the threshold value k3 so as to maintain the accuracy of the data. Alternatively, it may be determined whether to extend the time width based on the evaluation result by evaluating the number of deleted data in the case where the time width is not expanded and the degree of deterioration of time accuracy due to the time width expansion. .

時刻情報の匿名化処理S305が終了すると、ステップS306において、移動経路データ出力部27は、以上の匿名化処理後の移動経路データを出力する。出力する移動経路のデータは、出発地、目的地、移動経路(リンクの列)、出発時刻、到着時刻である。ここで、出発地および目的地は、出発地/目的地匿名化処理S303によって拡張されたエリアを示す情報である。また、移動経路は経路匿名化処理S304によって統一された移動経路である。出発時刻および到着時刻は、時刻匿名化処理S305によって拡張された時間帯を表すものである。   When the time information anonymization process S305 is completed, in step S306, the movement route data output unit 27 outputs the movement route data after the above anonymization processing. The travel route data to be output includes a departure point, a destination, a travel route (link string), a departure time, and an arrival time. Here, the departure place and the destination are information indicating the area expanded by the departure place / destination anonymization process S303. The travel route is a travel route unified by the route anonymization process S304. The departure time and arrival time represent the time zone expanded by the time anonymization process S305.

匿名化された移動経路データの出力先は、特に限定されない。例えば、外部の装置にネットワークを介して送信しても良いし、データベース装置に格納してもよいし、他の処理の入力として用いても良い。匿名化された移動経路データは、例えば、災害時などにおいて実測データに基づいて通行可能な経路を示す災害時交通マップの生成をはじめ種々のサービスにために活用することができる。   The output destination of the anonymized movement route data is not particularly limited. For example, it may be transmitted to an external device via a network, stored in a database device, or used as an input for other processing. The anonymized travel route data can be used for various services including, for example, generation of a disaster-time traffic map indicating routes that can be traveled based on actual measurement data in the event of a disaster.

<本実施形態の作用・効果>
以上の処理により、同一の出発地・目的地ペアの間を、同一の時間帯に行われた移動データが閾値k3以上となる。したがって、出力される移動経路データから個人を匿名化することが困難である。移動経路は、類似する複数の移動経路の代表経路であるので、存在確率のような曖昧な情報ではなく経路データとして出力が可能であるとともに、匿名化に伴うデータ精度の低下を最小限にできる。また、複数の経路の共通部分だけを出力するのではなく、出発地と目的地の情報を残したままで経路を出力できるので、匿名化データをより有効に活用することができる。
<Operation and effect of this embodiment>
With the above processing, the movement data performed in the same time zone between the same starting point / destination pair becomes the threshold value k3 or more. Therefore, it is difficult to anonymize individuals from the output travel route data. Since the travel route is a representative route of a plurality of similar travel routes, it can be output as route data instead of ambiguous information such as the existence probability, and the decrease in data accuracy due to anonymization can be minimized. . In addition, since the route can be output while leaving only the common part of the plurality of routes, the information of the departure place and the destination is left, anonymized data can be used more effectively.

(第2の実施形態)
第2の実施形態にかかる移動経路データ収集システムについて説明する。本実施形態の構成は、基本的に第1の実施形態と同様であり、経路データ処理装置20における経路匿名化処理S304の処理内容が異なる。その他の構成や処理内容は第1の実施形態と同様
であるので説明を省略して、本実施形態における経路匿名化処理S304について、図12を参照しながら以下で説明する。
(Second Embodiment)
A travel route data collection system according to the second embodiment will be described. The configuration of this embodiment is basically the same as that of the first embodiment, and the processing content of the route anonymization processing S304 in the route data processing device 20 is different. Since other configurations and processing contents are the same as those in the first embodiment, a description thereof will be omitted, and the route anonymization processing S304 in this embodiment will be described below with reference to FIG.

本実施形態では、経路匿名化部24は、移動経路データに対して階層型クラスタリング処理を施して、移動経路データをクラスタリングする(S1201)。階層型クラスタリング処理の具体的なアルゴリズムは特に限定されず、分岐型アルゴリズムであっても凝集型アルゴリズムであっても良い。また、クラスタ間の距離として、最短距離、最長距離、群平均距離、ウォード距離などの基準を採用可能である。移動経路データ間の類似度には、第1の実施形態と同様にレーベンシュタイン距離などを用いることができる。階層型クラスタリング処理によって、図13(a)に示すように、移動経路データは二分木(樹形図)で表現されるようにクラスタリングされる。   In the present embodiment, the route anonymization unit 24 performs hierarchical clustering processing on the travel route data to cluster the travel route data (S1201). The specific algorithm of the hierarchical clustering process is not particularly limited, and may be a branching algorithm or an aggregation algorithm. Further, as the distance between the clusters, standards such as the shortest distance, the longest distance, the group average distance, and the ward distance can be adopted. The Levenshtein distance or the like can be used for the similarity between the movement route data as in the first embodiment. By the hierarchical clustering process, as shown in FIG. 13A, the movement route data is clustered so as to be expressed by a binary tree (a tree diagram).

次に、経路匿名化部24は、クラスタ内の類似度が閾値R以上であり、かつ、クラスタ内のデータ数が閾値k2以上となるように、クラスタ数を決定する。具体的には、経路匿名化部24は、下位クラスタから順番にループL5の処理を実施する。経路匿名化部24は、まず、クラスタ内のデータ数が閾値k2以上であるか否か判定する(S1202)。データ数が閾値k2以上であれば(S1202−YES)、そのクラスタは1つのクラスタとして扱い、当該クラスタ内の移動経路データを代表経路データで置き換える(S1203)。クラスタにおける代表移動経路の決定方法は第1の実施形態と同様に、クラスタ内の他の移動経路との類似度が最も高い経路を選択することができる。   Next, the path anonymization unit 24 determines the number of clusters so that the similarity in the cluster is equal to or greater than the threshold value R, and the number of data in the cluster is equal to or greater than the threshold value k2. Specifically, the route anonymization unit 24 performs the processing of the loop L5 in order from the lower cluster. The route anonymization unit 24 first determines whether or not the number of data in the cluster is equal to or greater than the threshold value k2 (S1202). If the number of data is greater than or equal to the threshold value k2 (S1202-YES), the cluster is treated as one cluster, and the movement route data in the cluster is replaced with representative route data (S1203). As in the first embodiment, a method for determining a representative movement route in a cluster can select a route having the highest degree of similarity with other movement routes in the cluster.

一方、クラスタ内のデータ数が閾値k2よりも少ない場合(S1202−NO)には、経路匿名化部24は、より上位のクラスタで移動経路データを統一しようとする。そのために、まず、上位クラスタ内の全移動経路データのクラスタ内類似度を算出する(S1204)。クラスタ内類似度は、例えば、クラスタ内の移動経路データの類似度の最小値(最大距離)、平均値(平均距離)などによって評価できる。クラスタ内類似度が閾値R以上であれば(S1205−YES)、上位クラスタに含まれる移動経路データを統一しても経路の精度が保たれると判断できる。したがって、経路匿名化部24は上位クラスタに対して、ステップS1202からの処理を再度適用する。逆に、クラスタ内類似度が閾値Rよりも低ければ(S1205−NO)、クラスタ内の移動経路があまり類似しないことになるので、上位クラスタへの統一は中止し、クラスタ内に含まれる移動経路データを破棄する(S1206)。   On the other hand, when the number of data in the cluster is smaller than the threshold value k2 (S1202-NO), the route anonymization unit 24 tries to unify the movement route data in the higher cluster. For this purpose, first, the intra-cluster similarity of all travel route data in the upper cluster is calculated (S1204). The intra-cluster similarity can be evaluated by, for example, the minimum value (maximum distance) and the average value (average distance) of the similarity of the movement route data in the cluster. If the intra-cluster similarity is equal to or greater than the threshold value R (S1205-YES), it can be determined that the accuracy of the route is maintained even if the movement route data included in the upper cluster is unified. Therefore, the route anonymization unit 24 again applies the processing from step S1202 to the upper cluster. On the other hand, if the intra-cluster similarity is lower than the threshold value R (S1205-NO), the movement paths in the cluster are not very similar, so the unification to the upper cluster is stopped, and the movement paths included in the cluster The data is discarded (S1206).

図13(a)に示す階層型クラスタリングの結果を例にとって説明する。なお、ここでは、閾値k2は「3」であるとする。まず、データA、Bを含むクラスタX1に着目すると、クラスタX1内のデータ数は「2」であり閾値k2未満である。したがって、経路匿名化部24は、これらのデータを上位クラスタによって統一しようとする。クラスタX1の上位クラスタX2はデータA,B,C,Dを含み、ここではクラスタ内類似度が閾値R以上であるとする。クラスタX2のクラスタ内類似度は閾値R以上であり、データ数が閾値k2以上であるため、経路匿名化部24はデータA,B,C,Dを、クラスタX2内の代表移動経路Xで置換する。データE,Fを含むクラスタY1に着目すると、クラスタY1内のデータ数は「2」であり閾値k2未満であるため、経路匿名化部24はこれらのデータを上位クラスタによって統一しようとする。クラスタY1の上位クラスタY2は、データE,F,Gを含むが、クラスタ内類似度は閾値Rよりも低いものとする。すると、経路匿名化部24は、データE,F,Gを削除する。最終的に図13(d)に示すように、クラスタX2で統一された4つの移動経路データのみが出力されることになる。   An example of the result of hierarchical clustering shown in FIG. Here, the threshold value k2 is assumed to be “3”. First, focusing on the cluster X1 including data A and B, the number of data in the cluster X1 is “2”, which is less than the threshold value k2. Therefore, the route anonymization unit 24 tries to unify these data by the upper cluster. The upper cluster X2 of the cluster X1 includes data A, B, C, and D. Here, it is assumed that the intra-cluster similarity is greater than or equal to the threshold value R. Since the intra-cluster similarity of the cluster X2 is equal to or greater than the threshold value R and the number of data is equal to or greater than the threshold value k2, the route anonymization unit 24 replaces the data A, B, C, and D with the representative movement route X in the cluster X2. To do. Focusing on the cluster Y1 including the data E and F, the number of data in the cluster Y1 is “2”, which is less than the threshold value k2. Therefore, the path anonymization unit 24 tries to unify these data by the upper cluster. The upper cluster Y2 of the cluster Y1 includes data E, F, and G, but the intra-cluster similarity is assumed to be lower than the threshold value R. Then, the route anonymization unit 24 deletes the data E, F, and G. Finally, as shown in FIG. 13 (d), only the four movement route data unified in the cluster X2 are output.

本実施形態によっても、第1の実施形態と同様の効果を得ることができる。階層型クラスタリングを採用することで、クラスタ内の類似度とデータ数に条件を設けて移動経路のクラス分けが可能である。   Also according to this embodiment, the same effect as that of the first embodiment can be obtained. By adopting hierarchical clustering, it is possible to classify moving routes by setting conditions for similarity and the number of data in the cluster.

(第3の実施形態)
第3の実施形態にかかる移動経路データ収集システムについて説明する。本実施形態の構成は、基本的に第1の実施形態と同様であり、経路データ処理装置20における移動経路匿名化処理内の処理の順序が異なる。本実施形態における移動経路匿名化処理のフローチャートを図14に示す。第1の実施形態では、出発地/目的地匿名化処理S303を行ってから、移動経路匿名化処理S304および時刻匿名化処理S305を行っているが、本実施形態では、移動経路匿名化処理S304および時刻匿名化処理S305を行ってから出発地/目的地匿名化処理S303を行う点が異なる。なお、図14のフローチャートに示すそれぞれの処理の内容は、第1の実施形態と同様であるため詳しい説明は省略する。本実施形態によっても、第1の実施形態と同様の効果を得ることができる。
(Third embodiment)
A travel route data collection system according to the third embodiment will be described. The configuration of this embodiment is basically the same as that of the first embodiment, and the order of processing in the movement route anonymization processing in the route data processing device 20 is different. A flowchart of the movement route anonymization process in this embodiment is shown in FIG. In the first embodiment, after the departure point / destination anonymization process S303 is performed, the movement route anonymization process S304 and the time anonymization process S305 are performed. In the present embodiment, the movement route anonymization process S304 is performed. The difference is that the departure point / destination anonymization process S303 is performed after the time anonymization process S305 is performed. Note that the content of each process shown in the flowchart of FIG. 14 is the same as that of the first embodiment, and thus detailed description thereof is omitted. Also according to this embodiment, the same effect as that of the first embodiment can be obtained.

1:車両 10:車載端末 20:経路データ処理装置
11:位置情報取得部 12:時刻情報取得部 13:履歴情報送信部
21:履歴情報受信部 22:ID変換部 23:移動経路データ生成部
24:経路匿名化部 25:時刻匿名化部
26:出発地/目的地匿名化部 27:移動経路データ出力部
1: Vehicle 10: In-vehicle terminal 20: Route data processing device 11: Location information acquisition unit 12: Time information acquisition unit 13: History information transmission unit 21: History information reception unit 22: ID conversion unit 23: Movement route data generation unit 24 : Route anonymization unit 25: time anonymization unit 26: departure point / destination anonymization unit 27: travel route data output unit

Claims (15)

移動経路と移動が行われた時間帯とを含む移動経路データを取得する経路データ取得手段と、
数の前記移動経路データを、移動経路の類似度に基づいて同一クラス内の移動経路データ数が第1閾値以上となるようにクラス分けし、同一クラス内の移動経路データの移動経路を代表移動経路に統一する経路匿名化手段と、
同一クラス内の移動経路データについて、所定の時間幅を持つ同一の時間帯において完結する移動の数が第2閾値以上となるように前記移動経路データにおける移動が行われた時間帯を抽象化する時刻匿名化手段と、
経路匿名化手段と時刻匿名化手段による処理後の移動経路データを出力する出力手段と、
を備える、移動経路データ匿名化装置。
Route data acquisition means for acquiring movement route data including a movement route and a time zone during which the movement is performed;
Said movement path data for multiple, classifies as movement path number of data within the same class is the first threshold value or more based on the similarity of the movement path, representative of the movement path of the moving path data in the same class A route anonymization means to unify the travel route;
For moving path data in the same class, as the number of mobile that Oite completed in the same time zone having a predetermined time width is smaller than the second threshold value, the time period during which movement is performed in the moving path data Abstracting time anonymization means,
An output means for outputting travel route data after processing by the route anonymization means and the time anonymization means;
A travel route data anonymization device comprising:
前記経路匿名化手段は、前記移動経路データにクラスタリング処理を施し、クラスタ内のデータ数が前記第1閾値よりも小さなクラスタ内の移動経路データは削除する、
請求項1に記載の移動経路データ匿名化装置。
The route anonymization means performs a clustering process on the travel route data, and deletes travel route data in a cluster whose number of data in the cluster is smaller than the first threshold.
The travel route data anonymization device according to claim 1.
前記経路匿名化手段は、移動経路データを逐次的にクラスタリング処理を施すものであり、
処理対象の移動経路データと、処理済みのクラスタの代表移動経路データとの類似度を算出し、
前記類似度のいずれかが所定値以上であれば、処理対象の移動経路データは前記類似度が最も高い代表移動経路データのクラスタに属すると判断し、
前記類似度のいずれもが前記所定値よりも低ければ、処理対象の移動経路データは、新たなクラスタの代表移動経路データであると判断する、
請求項2に記載の移動経路データ匿名化装置。
The route anonymization means sequentially performs a clustering process on movement route data,
Calculate the similarity between the travel route data to be processed and the representative travel route data of the processed cluster,
If any of the similarities is equal to or greater than a predetermined value, it is determined that the travel route data to be processed belongs to a cluster of representative travel route data having the highest similarity,
If any of the similarities is lower than the predetermined value, it is determined that the movement path data to be processed is representative movement path data of a new cluster.
The travel route data anonymization device according to claim 2.
前記経路匿名化手段は、それぞれのクラスタについて、クラスタ内のその他の移動経路データとの類似度が最も高い移動経路データを、代表移動経路データに設定しなおす、
請求項3に記載の移動経路データ匿名化装置。
The route anonymization means resets the travel route data having the highest similarity to the other travel route data in the cluster for each cluster, as the representative travel route data.
The travel route data anonymization device according to claim 3.
前記経路匿名化手段は、前記移動経路データに階層型クラスタリング処理を施し、
クラス内類似度が所定値以上でありかつクラス内のデータ数が前記第1閾値以上となるようにクラス分けを決定するものであり、クラス内類似度が前記所定値以上でありかつクラス内のデータ数が前記第1閾値以上となるようにクラス分けできない移動経路データは削除する、
請求項1に記載の移動経路データ匿名化装置。
The route anonymization means performs a hierarchical clustering process on the travel route data,
The classification is determined so that the intraclass similarity is equal to or greater than a predetermined value and the number of data in the class is equal to or greater than the first threshold, and the intraclass similarity is equal to or greater than the predetermined value and within the class The travel route data that cannot be classified so that the number of data is equal to or greater than the first threshold is deleted.
The travel route data anonymization device according to claim 1.
前記経路匿名化手段は、出発地と目的地のペアが同じ移動経路データごとに、前記クラス分けおよび移動経路の統一を行う、
請求項1から5のいずれか1項に記載の移動経路データ匿名化装置。
The route anonymization means performs the classification and movement route unification for each movement route data in which the pair of the starting point and the destination is the same.
The movement route data anonymization device according to any one of claims 1 to 5.
前記時刻匿名化手段は、同一クラス内の移動経路データについて、同じ時間帯に行われた移動が前記第2閾値よりも少なければ、当該時間帯に行われた移動経路データを削除する、
請求項1から6のいずれか1項に記載の移動経路データ匿名化装置。
The time anonymization means deletes the movement route data performed in the time zone if the movement performed in the same class is less than the second threshold for the movement route data in the same class,
The movement route data anonymization device according to any one of claims 1 to 6.
前記時刻匿名化手段は、同一クラス内の移動経路データについて、同じ時間帯に行われた移動が前記第2閾値よりも少なければ、時間帯を広げる処理を行う、
請求項1から6のいずれか1項に記載の移動経路データ匿名化装置。
The time anonymization means performs a process of expanding the time zone if the movement made in the same time zone is less than the second threshold for the movement route data in the same class,
The movement route data anonymization device according to any one of claims 1 to 6.
移動経路データにおける出発地と目的地を、抽象化された領域に置き換える地点抽象化手段をさらに備える、
請求項1から8のいずれか1項に記載の移動経路データ匿名化装置。
It further comprises point abstraction means for replacing the starting point and destination in the travel route data with the abstracted area.
The movement path data anonymization device according to any one of claims 1 to 8.
前記地点抽象化手段は、出発地および目的地が個人を特定する地点であるパーソナルエリアに該当するか否か判断し、パーソナルエリアに該当する出発地および目的地を抽象化された領域に置き換える、
請求項9に記載の移動経路データ匿名化装置。
The point abstraction means determines whether the starting point and the destination correspond to a personal area that is a point for identifying an individual, and replaces the starting point and the destination corresponding to the personal area with an abstracted region.
The travel route data anonymization device according to claim 9.
前記経路匿名化手段および前記時刻匿名化手段は、前記地点抽象化手段による処理後の移動経路データを対象として処理を行う、
請求項9または10に記載の移動経路データ匿名化装置。
The route anonymization means and the time anonymization means perform processing on the movement route data after processing by the point abstraction means,
The movement route data anonymization device according to claim 9 or 10.
前記地点抽象化手段は、前記経路匿名化手段および前記時刻匿名化手段による処理後の移動経路データを対象として処理を行う、
請求項9または10に記載の移動経路データ匿名化装置。
The point abstraction means performs processing on the movement route data after processing by the route anonymization means and the time anonymization means,
The movement route data anonymization device according to claim 9 or 10.
位置情報と時刻情報を複数含む移動履歴データを複数取得する移動履歴取得手段をさらに備え、
前記経路データ取得手段は、前記移動履歴データから前記移動経路データを生成する、
請求項1から12のいずれか1項に記載の移動経路データ匿名化装置。
It further comprises movement history acquisition means for acquiring a plurality of movement history data including a plurality of position information and time information,
The route data acquisition means generates the travel route data from the travel history data.
The travel route data anonymization device according to any one of claims 1 to 12.
コンピュータが行う移動経路データ匿名化方法であって、
移動経路と移動が行われた時間帯とを含む移動経路データを取得する経路データ取得ステップと、
数の前記移動経路データを、移動経路の類似度に基づいて同一クラス内の移動経路
データ数が第1閾値以上となるようにクラス分けし、同一クラス内の移動経路データの移動経路を代表移動経路に統一する経路匿名化ステップと、
同一クラス内の移動経路データについて、所定の時間幅を持つ同一の時間帯において完結する移動の数が第2閾値以上となるように前記移動経路データにおける移動が行われ
た時間帯を抽象化する時刻匿名化ステップと、
経路匿名化ステップと時刻匿名化ステップによる処理後の移動経路データを出力する出力ステップと、
を含む、移動経路データ匿名化方法。
A method of anonymizing travel route data performed by a computer,
A route data acquisition step for acquiring travel route data including a travel route and a time zone during which the travel was performed;
Said movement path data for multiple, classifies as movement path number of data within the same class is the first threshold value or more based on the similarity of the movement path, representative of the movement path of the moving path data in the same class A route anonymization step that unifies the travel route;
For moving path data in the same class, as the number of mobile that Oite completed in the same time zone having a predetermined time width is smaller than the second threshold value, the time period during which movement is performed in the moving path data An abstract time anonymization step;
An output step for outputting travel route data after processing by the route anonymization step and the time anonymization step;
A method for anonymizing travel route data, including:
請求項14に記載の方法の各ステップをコンピュータに実行させるためのプログラム。   The program for making a computer perform each step of the method of Claim 14.
JP2015056147A 2015-03-19 2015-03-19 Moving path data anonymization apparatus and method Active JP6464849B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015056147A JP6464849B2 (en) 2015-03-19 2015-03-19 Moving path data anonymization apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015056147A JP6464849B2 (en) 2015-03-19 2015-03-19 Moving path data anonymization apparatus and method

Publications (2)

Publication Number Publication Date
JP2016177452A JP2016177452A (en) 2016-10-06
JP6464849B2 true JP6464849B2 (en) 2019-02-06

Family

ID=57071356

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015056147A Active JP6464849B2 (en) 2015-03-19 2015-03-19 Moving path data anonymization apparatus and method

Country Status (1)

Country Link
JP (1) JP6464849B2 (en)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6570869B2 (en) * 2015-04-30 2019-09-04 株式会社Nttドコモ Information processing device
JP6748612B2 (en) * 2017-07-13 2020-09-02 日本電信電話株式会社 Anonymity evaluation device, anonymity evaluation method, and program
JP7056127B2 (en) * 2017-12-14 2022-04-19 富士通株式会社 Analytical methods, analyzers and analytical programs
JP7073775B2 (en) * 2018-02-16 2022-05-24 富士通株式会社 Information processing equipment, behavior support methods, and behavior support programs
JP2019159773A (en) * 2018-03-13 2019-09-19 本田技研工業株式会社 Data distribution control device, information processing device, and data distribution control method
JP7188416B2 (en) * 2020-06-22 2022-12-13 トヨタ自動車株式会社 Data collection device and data collection method
WO2023276048A1 (en) * 2021-06-30 2023-01-05 日本電信電話株式会社 Anonymization device, anonymization method, and program
JP7171962B1 (en) * 2022-04-26 2022-11-15 朝日航洋株式会社 Route statistical data management device, route statistical data management method, and route statistical data management program

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4422173B2 (en) * 2007-06-15 2010-02-24 大日本印刷株式会社 Advertisement information delivery system and delivery method for mobile terminals
JP5162978B2 (en) * 2007-06-28 2013-03-13 Necソフト株式会社 Route search method, route search system, and program
JP2010164319A (en) * 2009-01-13 2010-07-29 Sanyo Electric Co Ltd Navigation system
JP2014009948A (en) * 2012-06-27 2014-01-20 Denso Corp Route information service system and navigation device

Also Published As

Publication number Publication date
JP2016177452A (en) 2016-10-06

Similar Documents

Publication Publication Date Title
JP6464849B2 (en) Moving path data anonymization apparatus and method
Arain et al. Location monitoring approach: multiple mix-zones with location privacy protection based on traffic flow over road networks
JP5846548B2 (en) Information protection apparatus and information protection method
Qu et al. A cost-effective recommender system for taxi drivers
CN104596531B (en) A kind of generation method of navigation routine, device and server
Yu et al. Modeling user activity patterns for next-place prediction
JP6435978B2 (en) Location information anonymization method, movement information anonymization method, and apparatus
US10798238B2 (en) System and method for tracking a mobile device user
Chen et al. Efficient solution algorithm for finding spatially dependent reliable shortest path in road networks
Rezaie et al. Semi-supervised travel mode detection from smartphone data
JP6277709B2 (en) Route information processing method, apparatus, and program
EP4002763A1 (en) Method, apparatus, and computer program product for identifying privacy risks in datasets
Wang et al. Protecting the location privacy of mobile social media users
Martelli et al. The price of privacy control in mobility sharing
JP6355577B2 (en) Anonymization device, method and program
CN114166229B (en) Healthy travel route planning system based on redundancy defense evasion algorithm
JP5615777B2 (en) Route guidance device and route guidance method
Wang et al. Ropriv: Road network-aware privacy-preserving framework in spatial crowdsourcing
US10341978B2 (en) Mobile management system, mobile management server, mobile management method and mobile management program
JP6316597B2 (en) Information processing server, information processing method, and information processing program
Huck et al. Challenges in geocoding sociallygenerated data
JPWO2012043300A1 (en) Information providing server, information providing system, information providing method, and program
S. de Sousa et al. A cluster-based framework for predicting large scale road-network constrained trajectories
Comito Mining pattern similarity for mobility prediction in location-based social networks
JP6458537B2 (en) POSITION ESTIMATION METHOD, POSITION ESTIMATION PROGRAM, AND POSITION ESTIMATION DEVICE

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20171201

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180925

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180919

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181113

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20181211

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181224

R151 Written notification of patent or utility model registration

Ref document number: 6464849

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151