JP6464849B2 - Moving path data anonymization apparatus and method - Google Patents
Moving path data anonymization apparatus and method Download PDFInfo
- Publication number
- JP6464849B2 JP6464849B2 JP2015056147A JP2015056147A JP6464849B2 JP 6464849 B2 JP6464849 B2 JP 6464849B2 JP 2015056147 A JP2015056147 A JP 2015056147A JP 2015056147 A JP2015056147 A JP 2015056147A JP 6464849 B2 JP6464849 B2 JP 6464849B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- movement
- route data
- anonymization
- route
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Traffic Control Systems (AREA)
Description
本発明は、移動経路データを匿名化する技術に関する。 The present invention relates to a technique for anonymizing travel route data.
数多くの車両からサーバにデータを送信し、サーバにおいてデータを加工することで種々のサービスを提供することができる。例えば、特許文献1では、災害時に車両の走行履歴を収集することで、その時点で走行可能な避難ルートマップを作成することが開示されている。このように、車両の移動経路データは有効なデータであり、種々のサービスに利用可能である。 Various services can be provided by transmitting data from a large number of vehicles to a server and processing the data in the server. For example, Patent Document 1 discloses that an evacuation route map that can be traveled at that time is created by collecting a travel history of a vehicle at the time of a disaster. As described above, the moving route data of the vehicle is effective data and can be used for various services.
ただし、移動経路データから個人を特定することが可能であるため、移動経路データは個人保護法によって規定される個人情報に該当し、そのままでは情報提供者の同意なく第三者に提供することはできない。したがって、個人を特定できないように移動経路データを匿名化することが望まれている。 However, since it is possible to identify an individual from the travel route data, the travel route data falls under the personal information stipulated by the Personal Protection Law, and as it is, it cannot be provided to a third party without the consent of the information provider. Can not. Therefore, it is desired to anonymize the travel route data so that an individual cannot be specified.
特許文献2は、ユーザの移動履歴のうち、軌跡データに含まれるそれぞれの位置を存在確率に変換するとともに、一定時間が経過していればデータを消滅させることで個人特定を防いでいる。しかしながら、軌跡が抽象化されたエリアにぼかされてしまうので、経路案内等のサービスに応用することが困難になってしまうという問題がある。
In
特許文献3は、ユーザの位置情報を取得してよい領域と取得してはいけないパーソナルエリア領域とを設定し、ユーザの移動経路情報を取得する際に、パーソナルエリア領域の移動履歴は削除したり利用禁止にしたりすることで、ユーザのプライバシーに配慮している。しかしながら、パーソナルエリア領域の移動経路が削除されても、その他の経路が他のユーザと比べてユニークであれば、経路から個人を特定できてしまうという問題がある。
特許文献4は、k−匿名化の手法を用いて、ユーザのプライバシーを保護することを開示する。しかしながら、k−匿名性を担保するために位置情報の精度を落とすと、移動経路がぼかされてしまう。また、位置情報の精度を落とさずにk−匿名性を担保しようとすると、数多くのユーザが通る経路のみしか利用できないことになってしまう。 Patent document 4 discloses protecting a user's privacy using the technique of k-anonymization. However, if the accuracy of the position information is lowered in order to ensure k-anonymity, the movement route will be blurred. Further, if k-anonymity is to be secured without reducing the accuracy of the position information, only the route through which many users pass can be used.
特許文献5は、車両情報を収集する際に、個人を特定できる情報と個人を特定できない情報とを異なるセッションで送信することで、ユーザのプライバシーに配慮している。しかしながら、移動経路自体が個人を特定できる情報であるため、この手法では移動経路の匿名化はできない。 Patent Document 5 considers user privacy by collecting information that can identify an individual and information that cannot identify an individual in different sessions when collecting vehicle information. However, since the travel route itself is information that can identify an individual, this method cannot make the travel route anonymous.
上記のような問題を考慮して、本発明は、個人の特定を避けつつ有効活用可能な形式で移動経路データを匿名化可能な技術を提供することを目的とする。 In view of the above problems, an object of the present invention is to provide a technique capable of anonymizing travel route data in a format that can be effectively used while avoiding individual identification.
上記目的を達成するために、本発明に係る移動経路データ匿名化装置は、以下の構成を備える。すなわち、本発明にかかる移動経路データ匿名化装置は、移動経路と移動が行われた時間帯とを含む移動経路データを取得する経路データ取得手段と、前記複数の移動経路データを、移動経路の類似度に基づいて同一クラス内の移動経路データ数が第1閾値以上となるようにクラス分けし、同一クラス内の移動経路データの移動経路を代表移動経路に統一する経路匿名化手段と、同一クラス内の移動経路データについて同じ時間帯に行われた移動が第2閾値以上となるように前記移動経路データにおける移動が行われた時間帯を抽象化する時刻匿名化手段と、経路匿名化手段と時刻匿名化手段による処理後の移動経路データを出力する出力手段と、を備える。 In order to achieve the above object, a movement path data anonymization device according to the present invention comprises the following arrangement. That is, the movement route data anonymization device according to the present invention includes route data acquisition means for acquiring movement route data including a movement route and a time zone during which the movement has been performed, and the plurality of movement route data. Same as route anonymization means that classifies so that the number of movement route data in the same class is equal to or more than the first threshold based on the similarity, and unifies the movement route of the movement route data in the same class to the representative movement route Time anonymization means for abstracting a time zone in which movement in the movement route data is performed so that movement performed in the same time zone for the movement route data in the class is equal to or greater than a second threshold; and route anonymization means And output means for outputting movement route data after processing by the time anonymization means.
このような構成によれば、移動経路および移動時刻(時間帯)が抽象化されて、出力結果に含まれる移動経路データにおいてある時間帯にある移動経路をとったユーザの数が閾値以上であることが担保でき、出力された移動経路から個人を特定することが困難となる。また、出力される移動経路データは位置範囲がぼかされたデータではないため、種々のサービスに有効活用することができる。 According to such a configuration, the movement route and the movement time (time zone) are abstracted, and the number of users who took the movement route in a certain time zone in the movement route data included in the output result is equal to or greater than the threshold value. It is difficult to specify an individual from the output travel route. Further, since the output travel route data is not data with a blurred location range, it can be effectively used for various services.
移動経路データは、例えば、通過したリンクの集合として表すことができるし、通過したノードの集合として表すこともできる。移動が行われた時間帯は、リンクあるいはノードに進入した時刻や退出した時刻として表すことができる。 The travel route data can be represented, for example, as a set of passed links or as a set of passed nodes. The time zone in which the movement is performed can be expressed as a time when the user enters or leaves the link or node.
経路匿名化手段による経路データのクラス分けは、移動経路の類似度に基づく処理であれば、特に限定されない。移動経路の類似度は、例えば、レーベンシュタイン距離やジャカード(Jaccard)距離などの尺度を用いて測ることができる。なお、本明細書では、類
似している場合を類似度が高いと表現し、類似していない場合を類似度が低いと表現するが、実装においては類似度として類似しているほど小さい数値を割り当てても構わない。例えば、距離を類似度として採用する場合には、値が小さいほど類似度が高いことになる。
The classification of route data by the route anonymization means is not particularly limited as long as it is processing based on the similarity of moving routes. The similarity of travel paths can be measured, for example, using a scale such as a Levenshtein distance or a Jaccard distance. In this specification, a case where they are similar is expressed as a high degree of similarity, and a case where they are not similar is expressed as a low degree of similarity. You can assign it. For example, when the distance is adopted as the similarity, the similarity is higher as the value is smaller.
本発明において、前記経路匿名化手段は、前記移動経路データにクラスタリング処理を施し、クラスタ内のデータ数が前記第1閾値よりも小さなクラスタ内の移動経路データは削除することができる。このようにすれば、同一クラス(クラスタ)内の移動経路データの数が第1閾値以上とすることができ、移動経路データから個人を特定することが困難になる。 In the present invention, the route anonymization means can perform a clustering process on the travel route data, and delete the travel route data in the cluster whose number of data in the cluster is smaller than the first threshold. In this way, the number of travel route data in the same class (cluster) can be set to the first threshold value or more, and it becomes difficult to specify an individual from the travel route data.
本発明において、前記経路匿名化手段は、移動経路データを逐次的にクラスタリング処理を施すものであり、処理対象の移動経路データと、処理済みのクラスタの代表移動経路データとの類似度を算出し、前記類似度のいずれかが前記所定値以上であれば、処理対象の移動経路データは前記類似度が最も高い代表移動経路データのクラスタに属すると判断し、前記類似度のいずれもが前記所定値よりも低ければ、処理対象の移動経路データは、新たなクラスタの代表移動経路データであると判断する、ことができる。このような構成によれば、比較的少ない演算によりクラスタリングが可能である。 In the present invention, the route anonymization means sequentially performs the clustering process on the travel route data, and calculates the similarity between the travel route data to be processed and the representative travel route data of the processed cluster. If any of the similarities is equal to or greater than the predetermined value, it is determined that the travel route data to be processed belongs to a cluster of representative travel route data having the highest similarity, and any of the similarities is the predetermined value. If it is lower than the value, it can be determined that the movement path data to be processed is representative movement path data of a new cluster. According to such a configuration, clustering is possible with relatively few operations.
上記の手法によってクラスタリングを行う場合には、前記経路匿名化手段は、それぞれのクラスタについて、クラスタ内のその他の移動経路データとの類似度が最も高い移動経路データを、代表移動経路データに設定しなおす、ことも好ましい。なお、クラスタ内のその他の移動経路データとの類似度は、同一クラスタ内の他のデータとの距離の二乗和や
絶対値和などによって評価できる。上述のように移動経路データを逐次的に処理してクラスタリングする場合、後から入力された移動経路データの方が代表移動経路として相応しい場合も生じる。代表移動経路データを設定し直すことで、より適切な経路を代表移動経路とすることができる。
When clustering is performed by the above method, the route anonymization means sets, for each cluster, the travel route data having the highest similarity to the other travel route data in the cluster as the representative travel route data. In addition, it is also preferable. Note that the degree of similarity with other travel route data in the cluster can be evaluated by the sum of squares of distances to other data in the same cluster, the sum of absolute values, or the like. When the movement route data is sequentially processed and clustered as described above, the movement route data input later may be more suitable as the representative movement route. By resetting the representative movement route data, a more appropriate route can be set as the representative movement route.
また、前記経路匿名化手段は、前記移動経路データに階層型クラスタリング処理を施すこともできる。階層型クラスタリングは、具体的にはどのようなものであってもよく、分岐型および凝集型のいずれも採用可能である。また、クラスタ間の距離として、最短距離、最長距離、群平均距離、ウォード距離などの基準を採用可能である。階層型クラスタリング処理を採用する場合、前記経路匿名化手段は、クラスタ内類似度が所定値以上でありかつクラス内のデータ数が前記第1閾値以上となるようにクラス分けを決定するものであり、クラス内類似度が前記所定値以上でありかつクラス内のデータ数が前記第1閾値以上となるようにクラス分けできない移動経路データは削除する、ことも好ましい。このようにしても、同一クラス内の移動経路の類似性を担保しつつ、同一クラス内のデータ数を第1閾値以上とすることができる。 Further, the route anonymization means can perform a hierarchical clustering process on the travel route data. The hierarchical clustering may be anything concretely, and any of a branching type and an aggregation type can be adopted. Further, as the distance between the clusters, standards such as the shortest distance, the longest distance, the group average distance, and the ward distance can be adopted. In the case of employing hierarchical clustering processing, the path anonymization means determines classification so that the intra-cluster similarity is equal to or greater than a predetermined value and the number of data in the class is equal to or greater than the first threshold. It is also preferable to delete travel route data that cannot be classified so that the intraclass similarity is equal to or greater than the predetermined value and the number of data in the class is equal to or greater than the first threshold. Even in this case, it is possible to make the number of data in the same class equal to or more than the first threshold while ensuring the similarity of the movement routes in the same class.
また、前記経路匿名化手段は、出発地と目的地のペアが同じ移動経路データごとに、上記のクラス分けおよび移動経路の統一を行うことが好ましい。なお、出発地と目的地は、後述するようにある程度の範囲を有するエリアとして表されてもよく、この場合は、出発地エリアと目的地エリアのペアが同じ移動経路データごとに処理が行われることになる。上述したように、クラス分けおよび移動経路を統一する処理では、出発地と目的地のペアが一致している方が、処理が容易であるとともに得られる結果が有効活用しやすいという効果が得られる。 Moreover, it is preferable that the said route anonymization means performs said classification and unification of a movement route for every movement route data with the same starting point and destination pair. The starting point and the destination may be represented as an area having a certain range as will be described later. In this case, the pair of the starting point area and the destination area is processed for each movement route data. It will be. As described above, in the process of classifying and unifying moving routes, it is easier to process and the results obtained can be more effectively used when the pair of the starting point and the destination match. .
また、本発明における前記時刻匿名化手段は、同一クラス内の移動経路データについて、同じ時間帯に行われた移動が前記第2閾値よりも少なければ、当該時間帯に行われた移動経路データを削除することができる。あるいは、前記時刻匿名化手段は、同一クラス内の移動経路データについて、同じ時間帯に行われた移動が前記第2閾値よりも少なければ、時間帯を広げる処理を行うこともできる。このようにすれば、ある時間帯に行われた移動の数が第2閾値以上となることを担保でき、移動が行われた時間帯から個人を特定することが困難になる。 In addition, the time anonymization means in the present invention, for movement route data in the same class, if the movement made in the same time zone is less than the second threshold, the movement route data in the time zone is Can be deleted. Alternatively, the time anonymization means can perform a process of widening the time zone if movement made in the same time zone is less than the second threshold for the travel route data in the same class. If it does in this way, it can be guaranteed that the number of movements performed in a certain time zone will become more than the 2nd threshold, and it will become difficult to specify an individual from the time zone in which movement was performed.
また、本発明は、移動経路データにおける出発地と目的地を、抽象化された領域に置き換える地点抽象化手段をさらに備えることも好ましい。出発地と目的地によって個人の特定が容易になるため、これらの地点をある程度の範囲を有するエリアに置き換えることで、個人の特定を困難にできる。なお、必ずしも全ての出発地と目的地を、抽象化する必要はなく、出発地および目的地が個人を特定する地点であるパーソナルエリアに該当するか否か判断し、パーソナルエリアに該当する出発地および目的地を抽象化された領域に置き換えてもよい。パーソナルエリアに該当するか否かは、移動経路データの提供者が明示的に指示してもよいし、同一ユーザの移動履歴から統計処理によって判断してもよい。 The present invention preferably further comprises point abstracting means for replacing the starting point and destination in the travel route data with the abstracted area. Since identification of an individual becomes easy depending on the starting point and the destination, identification of the individual can be made difficult by replacing these points with areas having a certain range. Note that it is not always necessary to abstract all starting points and destinations, and it is determined whether the starting point and the destination correspond to a personal area that is a point for identifying an individual, and the starting point corresponding to the personal area is determined. And the destination may be replaced with an abstracted area. Whether or not it corresponds to a personal area may be explicitly instructed by the provider of the movement route data, or may be determined by statistical processing from the movement history of the same user.
出発地および目的地の抽象化処理は、経路および時刻の抽象化処理の前に行われても後に行われてもよい。すなわち、前記経路匿名化手段および前記時刻匿名化手段が、前記地点抽象化手段による処理後の移動経路データを対象として処理を行ってもよいし、前記地点抽象化手段が、前記経路匿名化手段および前記時刻匿名化手段による処理後の移動経路データを対象として処理を行ってもよい。 The departure point and destination abstraction processing may be performed before or after the route and time abstraction processing. That is, the route anonymization means and the time anonymization means may perform processing on the movement route data after the processing by the point abstraction means, or the point abstraction means includes the route anonymization means. And you may process for the movement route data after the processing by the time anonymization means.
本発明において、移動経路データ匿名化装置は、移動経路データをどのように取得してもよい。例えば、移動経路データ自体の入力を受け付けてもよい。あるいは、移動経路データ匿名化装置は、位置情報と時刻情報を複数含む移動履歴データを複数取得する移動履
歴取得手段をさらに備え、前記移動経路取得手段は、前記移動履歴データから前記移動経路データを生成する、こともできる。
In the present invention, the movement route data anonymization device may obtain the movement route data in any way. For example, input of movement route data itself may be accepted. Alternatively, the movement route data anonymization device further includes movement history acquisition means for acquiring a plurality of movement history data including a plurality of position information and time information, and the movement route acquisition means obtains the movement route data from the movement history data. It can also be generated.
なお、本発明は、上記手段の少なくとも一部を備える移動経路データ匿名化装置として捉えることができる。また、本発明は、上記手段が行う処理の少なくとも一部を実行する移動経路データ匿名化方法として捉えることもできる。また、本発明は、この方法をコンピュータに実行させるためのコンピュータプログラム、あるいはこのコンピュータプログラムを非一時的に記憶したコンピュータ可読記憶媒体として捉えることもできる。上記手段および処理の各々は可能な限り互いに組み合わせて本発明を構成することができる。 In addition, this invention can be grasped | ascertained as a movement path | route data anonymization apparatus provided with at least one part of the said means. Moreover, this invention can also be grasped | ascertained as the movement path | route data anonymization method which performs at least one part of the process which the said means performs. The present invention can also be understood as a computer program for causing a computer to execute this method, or a computer-readable storage medium in which this computer program is stored non-temporarily. Each of the above means and processes can be combined with each other as much as possible to constitute the present invention.
本発明によれば、個人の特定を避けつつ有効活用可能な形式で移動経路データを匿名化できる。 According to the present invention, travel route data can be anonymized in a format that can be effectively used while avoiding individual identification.
(第1の実施形態)
<システム構成>
図1(a)は、本実施形態にかかる移動経路データ収集システムの構成を示す図である。移動経路データ収集システムは、車両1に搭載された車載端末10と、車載端末10とネットワーク30を介して接続された経路データ処理装置20とから構成される。図では1台の車両しか示していないが、移動経路データ収集システムは実際には複数の車両を含む。車載端末10は、定期的に時刻時報と位置情報を取得し、経路データ処理装置20に送信する。経路データ処理装置20は、車載端末10から収集した位置の履歴情報から移動経路データを生成し、移動経路データから個人を特定できないように移動経路データに
対して匿名化処理を施す。
(First embodiment)
<System configuration>
FIG. 1A is a diagram illustrating a configuration of a movement route data collection system according to the present embodiment. The movement route data collection system includes an in-
車載端末10は、CPUやMPUなどの演算装置、主記憶装置や補助記憶装置などの記憶装置、入出力装置、通信インタフェースなどを含む。車載端末10は、記憶装置に格納されたプログラムを演算装置が実行することによって、図1(b)に示す各機能を実現する。すなわち、車載端末10は、位置情報取得部11、時刻情報取得部12、履歴情報送信部13として機能する。なお、これらの機能部の一部または全部について専用のハードウェア回路によって実現しても構わない。
The in-
位置情報取得部11は、車両1に搭載された位置情報取得装置から現在位置の情報を取得する。位置情報取得装置は、典型的には、全地球航法衛星システム(GNSS:Global
Navigation Satellite System)の衛星信号に基づいて位置情報を算出する装置であり、例えば、GPS(Global Positioning System)、ガリレオ、GLONASS、北斗など
を挙げることができる。ただし、位置情報の取得は、無線基地局からの電波に基づく基地局測位によって行われてもよい。
The position
A device that calculates position information based on a satellite signal of a navigation satellite system (GPS), such as GPS (Global Positioning System), Galileo, GLONASS, Hokuto, and the like. However, acquisition of position information may be performed by base station positioning based on radio waves from the radio base station.
時刻情報取得部12は、現在時刻の情報を取得する。位置情報取得装置は時刻情報を取得可能であるため、位置情報取得装置と時刻情報取得装置は同じ装置であっても構わない。また、時刻情報取得部12は、車両1に搭載された内部クロックから時刻情報を取得してもよい。
The time
履歴情報送信部13は、位置情報取得部11が取得した位置情報と、時刻情報取得部12が取得した時刻情報とを、経路データ処理装置20に送信する機能部である。履歴情報送信部13は、位置情報や時刻情報を取得する度に経路データ処理装置20に送信してもよいし、位置情報や時刻情報を一時的に蓄積してからまとめて経路データ処理装置20に送信してもよい。履歴情報送信部13は、位置情報と時刻情報を含む送信データを生成して、無線通信によりネットワーク3を介して送信データを経路データ処理装置20に送信する。
The history
経路データ処理装置20は、CPUやMPUなどの演算装置、主記憶装置や保持記憶装置などの記憶装置、入出力装置、通信インタフェースなどを有するコンピュータである。経路データ処理装置20は、必ずしも1台のコンピュータによって構成される必要はなく、ネットワークを介して通信可能な複数のコンピュータから構成されてもよい。経路データ処理装置20は、演算装置がプログラムを実行することで、図1(c)に示す各機能を実現する。すなわち、経路データ処理装置20は、履歴情報受信部21、ID変換部22、移動経路データ生成部23、経路匿名化部24、時刻匿名化部25、出発地/目的地匿名化部26、移動経路データ出力部27として機能する。経路データ処理装置20は、本発明における移動経路データ匿名化装置に相当する。これらの各機能部が行う処理については、以下でフローチャートともに詳細に説明する。なお、これらの機能のうち一部または全部について専用のハードウェア回路によって実現しても構わない。
The path
<処理>
以下、本実施形態における経路データ収集システムにおいて行われる処理を詳細に説明する。
<Processing>
Hereinafter, processing performed in the route data collection system in the present embodiment will be described in detail.
[1.移動履歴データ送信処理]
まず、図2(a)を参照して、車載端末10によって行われる移動履歴データの送信処理について説明する。車両1のエンジンが始動されると(S201)、履歴情報送信部13は、位置情報取得部11が取得した位置情報と、時刻情報取得部12が取得した時刻情報を、経路データ処理装置20に送信する(S202)。この際、現在位置がトリップの
出発地であることが分かるフラグ(出発地フラグ)を付けてこれらの情報を送信することが好ましい。
[1. Movement history data transmission processing]
First, the movement history data transmission process performed by the in-
履歴情報送信部13が送信する移動履歴データのデータフォーマットの例を図2(b)に示す。図2(b)に示すように、移動履歴データは、車両ID201、位置情報202、位置情報属性203、時刻情報204を含む。車両ID201は、車両を特定するIDである。なお、車両IDの代わりに、運転者を特定するIDを採用してもよい。位置情報202は、位置情報取得部11によって取得された位置情報である。位置情報202は、緯度・経度によって表されてもよいし、エリアIDなどの形式で表されてもよい。位置情報属性203は、位置情報202の属性を示す情報である。属性の例として、例えば、位置情報202によって表される位置が出発地・目的地・パーソナルエリアであるといった情報が含まれる。時刻情報204は、時刻情報取得部12によって取得された位置情報である。
An example of the data format of the movement history data transmitted by the history
エンジン始動後、車載端末10は、定期的に移動履歴データを送信する。すなわち、位置情報および時刻情報の取得タイミングが到来したか判定し(S203)、取得タイミングが到来していれば(S203−YES)、位置情報と時刻情報を取得して経路データ処理装置20に送信する(S204)。なお、データの取得タイミングは、前回の取得タイミングから所定の時間が経過したタイミングであってもよいし、前回の取得タイミングから所定の距離を移動したタイミングであってもよい。移動履歴データの送信は、エンジンが始動している間(S205−NO)継続される。
After the engine is started, the in-
車両1のエンジンが停止すると(S205−YES)、履歴情報送信部13は、位置情報取得部11が取得した位置情報と、時刻情報取得部12が取得した時刻情報を、経路データ処理装置20に送信する(S206)。この際、現在位置がトリップの目的地であることが分かるフラグ(目的地フラグ)を付けてこれらの情報を送信することが好ましい。
When the engine of the vehicle 1 stops (S205—YES), the history
ここでの説明では、車載端末10が位置情報と時刻情報を取得する度に経路データ処理装置20に送信しているが、これらの情報を蓄積してまとめて経路データ処理装置20に送信してもよい。また、蓄積した移動履歴データに処理を施してから経路データ処理装置20に送信してもよい。例えば、移動履歴データを、移動経路を表す移動経路データに変換してから経路データ処理装置20に送信してもよい。
In this description, every time the in-
また、ここでの説明では、エンジンが始動された位置をトリップの出発地、エンジンが停止された位置をトリップの目的地としているが、これは処理の一例である。エンジンが停止されてもすぐにエンジンが再始動された場合には、目的地であると判断しなくてもよい。また、エンジンが停止しなくても、長期間停車されたり、停車後に出発地に戻ったりした場合には、その地点を目的地としてもよい。 In the description here, the starting position of the engine is the starting place of the trip, and the stopping position is the position where the engine is stopped. This is an example of processing. If the engine is restarted immediately after the engine is stopped, it may not be determined that the destination is the destination. Even if the engine does not stop, when the vehicle is stopped for a long time or after returning to the departure place, the point may be set as the destination.
[2.移動経路匿名化処理]
次に、経路データ処理装置20が行う移動経路匿名化処理の全体の流れを図3を参照して説明する。経路データ処理装置20の履歴情報受信部21は、車載端末10から送信される移動履歴データを受信して一時的に蓄積する。出発地から目的地までの一連の移動履歴データが取得できたら、移動経路データ生成部23は、移動履歴データから移動経路データを生成する(S301)。図4は、移動経路データのデータフォーマットの一例を示す図である。移動経路データは、車両ID、出発地、出発時刻、通過したリンクとリンク進入時刻、目的地、到着時刻を含む。なお、ここでは移動経路をリンクの集合として表す例を挙げているが、移動経路をノード(交差点)の集合として表してもよいし、リンクとノードの集合として表してもよい。
[2. Travel route anonymization process]
Next, the overall flow of the movement route anonymization process performed by the route
ステップS302において、ID変換部22は、移動経路データにおける車両IDを仮想IDに変換する。ID変換部22は、車両IDの一意性を保ちつつ、変換後の仮想IDから変換前の車両IDを決定できない(決定困難)なようにIDの変換を行う。具体的には、ID変換部22は、乱数などをシードとするハッシュ関数や、特定のパスワードを用いた共通鍵暗号、データベースの標準機能によって生成可能なユニークID(UUID)などを仮想IDとして用いる。
In step S302, the
ステップS303において、出発地/目的地匿名化部26は、移動経路データにおける出発地と目的地を匿名化する処理を行う。ステップS303の出発地/目的地匿名化処理の詳細を、図5に示す。図5に示される処理は、それぞれの移動経路データの出発地と目的地について実行されるが、以下では出発地を処理対象とする場合を例に説明する。出発地/目的地匿名化部26は、出発地がパーソナルエリアであるか否か判定する(S501)。パーソナルエリアは、個人を特定する可能性が高い場所であり、例えば、自宅、職場、学校などが含まれる。出発地がパーソナルエリアであるか否かは、例えば、車載端末10から送信される移動履歴データに出発地がパーソナルエリアであることを示すフラグ(属性)が付けられているか否かによって判定できる。あるいは、当該車両IDについての蓄積されている過去の移動履歴データから、同じ場所を出発地または目的地とした移動が多く行われていることが分かる場合には、その場所はパーソナルエリアであると判定できる。出発地がパーソナルエリアである場合には処理はステップS502に進み、そうでなければ処理を終了する。なお、出発地/目的地匿名化部26は、全ての出発地および目的地はパーソナルエリアであるとして、全ての経路データについてステップS502以降の処理を施してもよい。
In step S303, the departure point /
ステップS502において、出発地/目的地匿名化部26は、出発地が示す位置(範囲)を、出発地を中心とし所定の半径を有するエリア(領域)に拡張する。そして、ステップS503において、この拡張されたエリア内を出発地とする移動経路データの数が閾値k1以上であるか否か判定する。この条件を満たす場合には(S503−YES)、当該出発地についての抽象化処理はここで終了する。その際、このエリアに含まれる出発地は、全てこのエリアを表すように変更する。この条件を満たさない場合(S503−NO)は、エリア範囲が拡張上限であるか否か判定する(S504)。エリア半径の上限は、匿名化後のデータの使用目的に応じて適宜決定すればよいが、例えば、1km、2km、5kmなどとすることができる。エリア範囲が拡張の上限に達していなければ(S504−NO)、ステップS502に戻ってエリア半径を増加させる。エリア半径の増加のさせ方は、あらかじめ定められた手法で行えばよい。
In step S502, the departure place /
エリアを上限まで拡張しても、エリア内を出発地とする移動経路データの数が閾値k1に達しない場合(S503−NOかつS504−YES)は、処理対象の移動経路データを削除する(S505)。 If the number of travel route data starting from the area does not reach the threshold value k1 even when the area is expanded to the upper limit (S503-NO and S504-YES), the travel route data to be processed is deleted (S505). ).
図6(a)〜(d)を参照して、出発地/目的地匿名化処理の処理例を説明する。図6(a)は、移動経路データに含まれる出発地を示す図である。ここでは、8つの出発地が含まれているが、以下では3つの出発地N1〜N3に着目して説明する。最初のエリア拡張により、図6(b)に示すように、出発地N1〜N3を中心とする所定の半径のエリアA1〜A3が設定される。ここで、閾値k1が「3」であるとする。エリアA1には4つの出発地が含まれるので、匿名化の条件を満たす。エリアA1に含まれる4つの出発地の位置情報は、エリアA1を表す情報に統一する。エリアA2,A3については、そのエリアに含まれる出発地の数が閾値k1より少ないため、図6(c)に示すように、エリアB2,B3にさらに拡張される。エリアB2に含まれる出発地の数は3つであり、閾値k1以上であるため、匿名化の条件を満たす。そこで、エリアB2に含まれる3つの出発地の位置情報を、エリアB2を表す情報に統一する。エリアB3に含まれる出発地の数は閾値
k1より少ないため、図6(d)に示すようにエリアC3にさらに拡張される。エリアC3の大きさ(半径)は、エリアの拡張上限であるとする。拡張上限までエリアの大きさを拡張しても、そのエリアに含まれる出発地の数を閾値k1以上にならないので、出発地N3を含む移動経路データは破棄される。
A processing example of the departure point / destination anonymization process will be described with reference to FIGS. FIG. 6A is a diagram illustrating a departure place included in the travel route data. Here, eight starting points are included, but the following description will be given focusing on three starting points N1 to N3. By the first area expansion, as shown in FIG. 6B, areas A1 to A3 having a predetermined radius centering on the departure points N1 to N3 are set. Here, it is assumed that the threshold value k1 is “3”. Since area A1 includes four departure points, the condition for anonymization is satisfied. The position information of the four departure points included in the area A1 is unified into information representing the area A1. Areas A2 and A3 are further expanded to areas B2 and B3 as shown in FIG. 6C because the number of departure points included in the areas is smaller than the threshold value k1. Since the number of departure points included in area B2 is three and is equal to or greater than threshold value k1, the condition for anonymization is satisfied. Therefore, the position information of the three departure points included in area B2 is unified to information representing area B2. Since the number of departure points included in the area B3 is less than the threshold value k1, the area B3 is further expanded to the area C3 as shown in FIG. It is assumed that the size (radius) of the area C3 is the upper limit of area expansion. Even if the size of the area is expanded to the expansion upper limit, the number of departure points included in the area does not exceed the threshold value k1, so the travel route data including the departure point N3 is discarded.
上記では、出発地を例にして説明を行ったが、目的地についても同様の処理が行われる。全ての移動経路データの出発地と目的地について、上記の処理が実施されたら出発地/目的地匿名化処理は終了する。 In the above description, the departure place is described as an example, but the same processing is performed for the destination. When the above processing is performed for the departure point and destination of all travel route data, the departure point / destination anonymization process ends.
次に、ステップS304において、経路匿名化部24が経路の匿名化処理を行う。経路の匿名化処理は、移動経路データをクラスタリング(クラス分け)し、同一クラスタ内のデータ数が閾値(k2)より少なければそのクラスタ内のデータを破棄し、同一クラスタ内のデータ数が閾値以上であればこのクラスタ内のデータを1つの代表経路に統一する処理である。これにより、同じ経路を有するデータの数が閾値以上となり、経路から個人を特定することが困難となる。経路匿名化部24は、出発地と目的地のペアが同一の移動経路データにごとに、経路匿名化処理を実施する。図7は、1つの出発地・目的地ペアを有する移動経路データ群に対する経路匿名化処理の詳細を示すフローチャートである。以下、図7を参照しながら、経路匿名化処理S304について説明する。
Next, in step S304, the
経路匿名化部24は、記憶している移動経路データのそれぞれについて逐次的に(順番に)ループL1の処理を実行する。まず、処理対象の移動経路データと、それまでの処理によりクラスタの代表データであると判定された移動経路との類似度が算出される(S701)。以下の説明では、類似しているほど類似度が高いと表現するが、実装において類似度の数値は類似しているほど小さな数値で表されてもよい。移動経路データの類似度は任意の基準により算出されて良いが、移動経路データがリンクの集合として表されている場合には、レーベンシュタイン距離を用いることができる。レーベンシュタイン距離は、ある移動経路データを別の移動経路データと一致させるために必要な要素(リンク)の置換・挿入・削除の回数に基づいて決定される距離測度である。この他にも、ジャカード距離などを用いて移動経路データの類似度を算出することもできる。
The
経路匿名化部24は、ステップS701において算出された類似度が閾値R以上となるような代表データが存在するか判定する(S702)。そのような代表データが存在する場合(S702−YES)には、処理対象の移動経路データは、最も類似する代表データのクラスタに属するものと判定される(S703)。一方、類似度が閾値R以上となるような代表データが存在しない場合(S702−NO)には、処理対象の移動経路データは既存のいずれのクラスタに属しないと判定され、この移動経路データを代表データとする新規のクラスタが生成される(S704)。
The
図8を参照して上記の処理を例示的に説明する。図8(a)は、ある処理時点で処理されたデータを模式的に表す図であり、黒丸で示すデータN1,N2がクラスタの代表データであり、各代表データに接続して示された白丸のデータがクラスタ内のデータである。ここで、図8(b)に示すように新規のデータが処理されて、最も類似する既存の代表データ(ここでデータN2)との類似度が閾値R以上であると場合は、この新規の移動経路データは代表データN2と同じクラスタに属するものと判定される。一方、図8(c)に示すように、新規のデータがいずれの代表データN1,N2との類似度も閾値Rよりも低い場合には、新規のデータを代表データとする新たなクラスタが生成される。 The above processing will be described by way of example with reference to FIG. FIG. 8A is a diagram schematically showing data processed at a certain processing point. Data N1 and N2 indicated by black circles are representative data of clusters, and white circles connected to the representative data are shown. Is the data in the cluster. Here, when new data is processed as shown in FIG. 8B and the similarity with the most similar existing representative data (here, data N2) is equal to or greater than the threshold value R, the new data is processed. It is determined that the movement route data belongs to the same cluster as the representative data N2. On the other hand, as shown in FIG. 8C, if the new data is lower in the similarity with any of the representative data N1 and N2 than the threshold value R, a new cluster having the new data as representative data is generated. Is done.
なお、ここでは一度クラスタの代表データであると判断された移動経路データは常に代表データであり続けるが、データの増加に伴って代表データを変更する処理を行っても良い。例えば、ステップS703およびS704の後に、代表データの変更処理を行うこと
ができる。この処理では、(1)代表データとの類似度に基づく各移動経路データの再クラスタリングと、(2)各クラスタ内の代表データの再決定とを、代表データが変化しなくなるまで行われる。上記(2)の代表データの決定処理では、同一クラスタ内の他のデータとの類似度が最も高い移動経路データを代表データとすることできる。同一クラスタ内の他のデータとの類似度は、他のデータとの距離の二乗和や絶対値和などによって評価できる。このような処理を追加することで、処理量は増えるがより適切なクラスタリングが可能となる。
Here, the travel route data once determined to be the representative data of the cluster is always the representative data, but a process of changing the representative data as the data increases may be performed. For example, representative data change processing can be performed after steps S703 and S704. In this process, (1) re-clustering of each travel route data based on the similarity to the representative data and (2) redetermination of the representative data in each cluster are performed until the representative data does not change. In the representative data determination process of (2) above, the movement route data having the highest similarity with other data in the same cluster can be used as the representative data. Similarity with other data in the same cluster can be evaluated by a sum of squares of distances to other data or an absolute value sum. By adding such processing, the amount of processing increases, but more appropriate clustering becomes possible.
移動経路データのクラスタリングが終了すると、経路匿名化部24は、各クラスタについてループL2の処理を実行する。経路匿名化部24は、クラスタ内のデータ数が閾値k2以上であるか否か判定し(S705)、閾値k2以上であれば、このクラスタ内の移動経路データを代表データの経路で置換する(S706)。なお、代表データは上記のループL1の処理によって決定されたものであっても良いし、この段階でクラスタ内の他のデータとの類似度が最も高いデータを代表データとして選択し直しても良い。一方、クラスタ内のデータ数が閾値k2よりも少なければ(S705−NO)、経路匿名化部24は、このクラスタ内の移動経路データを破棄する(S707)。
When the clustering of the movement route data is finished, the
経路匿名化部24は、全ての出発地・目的地ペアの移動経路データに対する上記の処理を実行する。
The
経路匿名化処理S304が終了すると、ステップS305において、時刻匿名化部25が時刻情報の匿名化処理を行う。時刻情報の匿名化処理は、上記の経路匿名化処理におけるクラスタごとに実行され、同じ時間帯に行われた移動のデータ数が閾値以上となるように、時間情報を抽象化する処理である。図9は、時刻情報匿名化処理S305の詳細を示すフローチャートである。以下、図9を参照しながら、時刻情報匿名化処理S305について説明する。
When the route anonymization process S304 ends, in step S305, the
時刻匿名化部25は、移動経路データのそれぞれのクラスについてループL3の処理を実行する。まず、移動経路データにおける出発地の出発時刻および目的地への到着時刻から、この移動経路データによって表される移動が行われた時刻を時間帯で表す(S901)。例えば、図11(a)に示すように3つの移動経路データ1101〜1103がある場合を考える。ここでは、出発時刻および到着時刻を1時間単位の時間帯で表すものとすると、移動経路データ1101および1102は、7時台(7時台に出発、7時台に到着)に行われた移動であると表現される。一方、移動経路データ1103は、7時台〜8時台(7時台に出発、8時台に到着)に行われた移動であると表現される。
The
時刻匿名化部25は、次に、同一の時間帯を有する移動経路データごとにループL4の処理を実行する。時刻匿名化部25は、同一時間帯を有する移動経路データ数が閾値k3以上であるか否か判定する(S902)。データ数が閾値k3以上であれば(S902−YES)、移動経路データの出発時刻および時刻情報を、上記の時間帯に置き換える(S903)。一方、データ数が閾値k3より少なければ(S902−NO)、これらの移動経路データを削除する。閾値k3が「2」の場合の例を図11(b)を参照して説明する。ここでは、7時台に行われた移動経路データの数は「2」であり閾値k3(2)以上であるので、これらの移動経路データの出発時刻および到着時刻を、上記の時間帯に置換する。一方、7時台〜8時台に行われた移動経路データの数は「1」であり閾値k3(2)よりも少ないので、この移動経路データは削除される。
Next, the
なお、同一の時間帯に含まれる移動経路データの数が閾値k3より少ない場合に、単純にデータを削除するのではなく、時間帯の幅を大きくして同一時間帯に含まれるデータ数を増やす処理を行うことも好ましい。この変形例では、図9のステップS904の処理が
図10のフローチャートに示す処理に変更される。時刻匿名化部25は、時間帯が最大時間幅であるか否か判定する(S1001)。時間帯が最大時間幅より狭い場合(S1001−NO)、すなわち、時間幅を拡張可能な場合には、移動経路データにおける時間幅を拡張する(S1002)。そして拡張した時間幅内の移動経路データの数が閾値k3以上であるか否か判定し(S1003)、閾値k3以上であれば時間帯の拡張処理を終了する。一方、時間帯の拡張後もデータ数が閾値k3より少ない場合には、ステップS1001に戻って時間幅の再拡張を試みる。
When the number of travel route data included in the same time zone is smaller than the threshold k3, the data is not simply deleted, but the time zone width is increased to increase the number of data included in the same time zone. It is also preferable to carry out the treatment. In this modification, the process of step S904 in FIG. 9 is changed to the process shown in the flowchart of FIG. The
閾値k3が「3」、最大時間幅が3時間の場合の例を図11(c)を参照して説明する。ここでは、7時台および7時台〜8時台に行われた移動経路データの数はそれぞれ「2」および「1」であり閾値k3より少ない。それぞれの時間幅は1時間および2時間であるため時間幅の拡張が可能である。ここでは、7時台の移動経路データを7時台〜8時台に拡張することにより、7時台〜8時台に行われた移動経路データの数を閾値k3以上とすることができる。 An example in which the threshold value k3 is “3” and the maximum time width is 3 hours will be described with reference to FIG. Here, the numbers of movement route data performed at 7 o'clock and 7 o'clock to 8 o'clock are “2” and “1”, respectively, which are smaller than the threshold value k3. Since each time width is 1 hour and 2 hours, the time width can be expanded. Here, by expanding the movement route data at 7 o'clock to 7 o'clock to 8 o'clock, the number of movement route data performed from 7 o'clock to 8 o'clock can be made the threshold value k3 or more.
なお、図11(c)に示す例において、閾値k3が「2」の場合に、データ1133を削除してデータ1121および1122のみを7時台の移動として出力しても良いし、データ1121〜1122を7時台〜8時台の移動として出力しても良い。選択基準として、できるだけデータを削除しないように時間幅を大きくするようにしても良いし、データの精度を保つようにデータ数が閾値k3以上となる範囲で最小の時間幅とするようにしてもよいし、時間幅を拡張しない場合の削除データ数と時間幅の拡張に伴う時間の精度の低下の度合いを評価して評価結果に基づいて時間幅を拡張するか否かを決定しても良い。
In the example shown in FIG. 11C, when the threshold value k3 is “2”, the data 1133 may be deleted, and only the
時刻情報の匿名化処理S305が終了すると、ステップS306において、移動経路データ出力部27は、以上の匿名化処理後の移動経路データを出力する。出力する移動経路のデータは、出発地、目的地、移動経路(リンクの列)、出発時刻、到着時刻である。ここで、出発地および目的地は、出発地/目的地匿名化処理S303によって拡張されたエリアを示す情報である。また、移動経路は経路匿名化処理S304によって統一された移動経路である。出発時刻および到着時刻は、時刻匿名化処理S305によって拡張された時間帯を表すものである。
When the time information anonymization process S305 is completed, in step S306, the movement route
匿名化された移動経路データの出力先は、特に限定されない。例えば、外部の装置にネットワークを介して送信しても良いし、データベース装置に格納してもよいし、他の処理の入力として用いても良い。匿名化された移動経路データは、例えば、災害時などにおいて実測データに基づいて通行可能な経路を示す災害時交通マップの生成をはじめ種々のサービスにために活用することができる。 The output destination of the anonymized movement route data is not particularly limited. For example, it may be transmitted to an external device via a network, stored in a database device, or used as an input for other processing. The anonymized travel route data can be used for various services including, for example, generation of a disaster-time traffic map indicating routes that can be traveled based on actual measurement data in the event of a disaster.
<本実施形態の作用・効果>
以上の処理により、同一の出発地・目的地ペアの間を、同一の時間帯に行われた移動データが閾値k3以上となる。したがって、出力される移動経路データから個人を匿名化することが困難である。移動経路は、類似する複数の移動経路の代表経路であるので、存在確率のような曖昧な情報ではなく経路データとして出力が可能であるとともに、匿名化に伴うデータ精度の低下を最小限にできる。また、複数の経路の共通部分だけを出力するのではなく、出発地と目的地の情報を残したままで経路を出力できるので、匿名化データをより有効に活用することができる。
<Operation and effect of this embodiment>
With the above processing, the movement data performed in the same time zone between the same starting point / destination pair becomes the threshold value k3 or more. Therefore, it is difficult to anonymize individuals from the output travel route data. Since the travel route is a representative route of a plurality of similar travel routes, it can be output as route data instead of ambiguous information such as the existence probability, and the decrease in data accuracy due to anonymization can be minimized. . In addition, since the route can be output while leaving only the common part of the plurality of routes, the information of the departure place and the destination is left, anonymized data can be used more effectively.
(第2の実施形態)
第2の実施形態にかかる移動経路データ収集システムについて説明する。本実施形態の構成は、基本的に第1の実施形態と同様であり、経路データ処理装置20における経路匿名化処理S304の処理内容が異なる。その他の構成や処理内容は第1の実施形態と同様
であるので説明を省略して、本実施形態における経路匿名化処理S304について、図12を参照しながら以下で説明する。
(Second Embodiment)
A travel route data collection system according to the second embodiment will be described. The configuration of this embodiment is basically the same as that of the first embodiment, and the processing content of the route anonymization processing S304 in the route
本実施形態では、経路匿名化部24は、移動経路データに対して階層型クラスタリング処理を施して、移動経路データをクラスタリングする(S1201)。階層型クラスタリング処理の具体的なアルゴリズムは特に限定されず、分岐型アルゴリズムであっても凝集型アルゴリズムであっても良い。また、クラスタ間の距離として、最短距離、最長距離、群平均距離、ウォード距離などの基準を採用可能である。移動経路データ間の類似度には、第1の実施形態と同様にレーベンシュタイン距離などを用いることができる。階層型クラスタリング処理によって、図13(a)に示すように、移動経路データは二分木(樹形図)で表現されるようにクラスタリングされる。
In the present embodiment, the
次に、経路匿名化部24は、クラスタ内の類似度が閾値R以上であり、かつ、クラスタ内のデータ数が閾値k2以上となるように、クラスタ数を決定する。具体的には、経路匿名化部24は、下位クラスタから順番にループL5の処理を実施する。経路匿名化部24は、まず、クラスタ内のデータ数が閾値k2以上であるか否か判定する(S1202)。データ数が閾値k2以上であれば(S1202−YES)、そのクラスタは1つのクラスタとして扱い、当該クラスタ内の移動経路データを代表経路データで置き換える(S1203)。クラスタにおける代表移動経路の決定方法は第1の実施形態と同様に、クラスタ内の他の移動経路との類似度が最も高い経路を選択することができる。
Next, the
一方、クラスタ内のデータ数が閾値k2よりも少ない場合(S1202−NO)には、経路匿名化部24は、より上位のクラスタで移動経路データを統一しようとする。そのために、まず、上位クラスタ内の全移動経路データのクラスタ内類似度を算出する(S1204)。クラスタ内類似度は、例えば、クラスタ内の移動経路データの類似度の最小値(最大距離)、平均値(平均距離)などによって評価できる。クラスタ内類似度が閾値R以上であれば(S1205−YES)、上位クラスタに含まれる移動経路データを統一しても経路の精度が保たれると判断できる。したがって、経路匿名化部24は上位クラスタに対して、ステップS1202からの処理を再度適用する。逆に、クラスタ内類似度が閾値Rよりも低ければ(S1205−NO)、クラスタ内の移動経路があまり類似しないことになるので、上位クラスタへの統一は中止し、クラスタ内に含まれる移動経路データを破棄する(S1206)。
On the other hand, when the number of data in the cluster is smaller than the threshold value k2 (S1202-NO), the
図13(a)に示す階層型クラスタリングの結果を例にとって説明する。なお、ここでは、閾値k2は「3」であるとする。まず、データA、Bを含むクラスタX1に着目すると、クラスタX1内のデータ数は「2」であり閾値k2未満である。したがって、経路匿名化部24は、これらのデータを上位クラスタによって統一しようとする。クラスタX1の上位クラスタX2はデータA,B,C,Dを含み、ここではクラスタ内類似度が閾値R以上であるとする。クラスタX2のクラスタ内類似度は閾値R以上であり、データ数が閾値k2以上であるため、経路匿名化部24はデータA,B,C,Dを、クラスタX2内の代表移動経路Xで置換する。データE,Fを含むクラスタY1に着目すると、クラスタY1内のデータ数は「2」であり閾値k2未満であるため、経路匿名化部24はこれらのデータを上位クラスタによって統一しようとする。クラスタY1の上位クラスタY2は、データE,F,Gを含むが、クラスタ内類似度は閾値Rよりも低いものとする。すると、経路匿名化部24は、データE,F,Gを削除する。最終的に図13(d)に示すように、クラスタX2で統一された4つの移動経路データのみが出力されることになる。
An example of the result of hierarchical clustering shown in FIG. Here, the threshold value k2 is assumed to be “3”. First, focusing on the cluster X1 including data A and B, the number of data in the cluster X1 is “2”, which is less than the threshold value k2. Therefore, the
本実施形態によっても、第1の実施形態と同様の効果を得ることができる。階層型クラスタリングを採用することで、クラスタ内の類似度とデータ数に条件を設けて移動経路のクラス分けが可能である。 Also according to this embodiment, the same effect as that of the first embodiment can be obtained. By adopting hierarchical clustering, it is possible to classify moving routes by setting conditions for similarity and the number of data in the cluster.
(第3の実施形態)
第3の実施形態にかかる移動経路データ収集システムについて説明する。本実施形態の構成は、基本的に第1の実施形態と同様であり、経路データ処理装置20における移動経路匿名化処理内の処理の順序が異なる。本実施形態における移動経路匿名化処理のフローチャートを図14に示す。第1の実施形態では、出発地/目的地匿名化処理S303を行ってから、移動経路匿名化処理S304および時刻匿名化処理S305を行っているが、本実施形態では、移動経路匿名化処理S304および時刻匿名化処理S305を行ってから出発地/目的地匿名化処理S303を行う点が異なる。なお、図14のフローチャートに示すそれぞれの処理の内容は、第1の実施形態と同様であるため詳しい説明は省略する。本実施形態によっても、第1の実施形態と同様の効果を得ることができる。
(Third embodiment)
A travel route data collection system according to the third embodiment will be described. The configuration of this embodiment is basically the same as that of the first embodiment, and the order of processing in the movement route anonymization processing in the route
1:車両 10:車載端末 20:経路データ処理装置
11:位置情報取得部 12:時刻情報取得部 13:履歴情報送信部
21:履歴情報受信部 22:ID変換部 23:移動経路データ生成部
24:経路匿名化部 25:時刻匿名化部
26:出発地/目的地匿名化部 27:移動経路データ出力部
1: Vehicle 10: In-vehicle terminal 20: Route data processing device 11: Location information acquisition unit 12: Time information acquisition unit 13: History information transmission unit 21: History information reception unit 22: ID conversion unit 23: Movement route data generation unit 24 : Route anonymization unit 25: time anonymization unit 26: departure point / destination anonymization unit 27: travel route data output unit
Claims (15)
複数の前記移動経路データを、移動経路の類似度に基づいて同一クラス内の移動経路データ数が第1閾値以上となるようにクラス分けし、同一クラス内の移動経路データの移動経路を代表移動経路に統一する経路匿名化手段と、
同一クラス内の移動経路データについて、所定の時間幅を持つ同一の時間帯において完結する移動の数が第2閾値以上となるように、前記移動経路データにおける移動が行われた時間帯を抽象化する時刻匿名化手段と、
経路匿名化手段と時刻匿名化手段による処理後の移動経路データを出力する出力手段と、
を備える、移動経路データ匿名化装置。 Route data acquisition means for acquiring movement route data including a movement route and a time zone during which the movement is performed;
Said movement path data for multiple, classifies as movement path number of data within the same class is the first threshold value or more based on the similarity of the movement path, representative of the movement path of the moving path data in the same class A route anonymization means to unify the travel route;
For moving path data in the same class, as the number of mobile that Oite completed in the same time zone having a predetermined time width is smaller than the second threshold value, the time period during which movement is performed in the moving path data Abstracting time anonymization means,
An output means for outputting travel route data after processing by the route anonymization means and the time anonymization means;
A travel route data anonymization device comprising:
請求項1に記載の移動経路データ匿名化装置。 The route anonymization means performs a clustering process on the travel route data, and deletes travel route data in a cluster whose number of data in the cluster is smaller than the first threshold.
The travel route data anonymization device according to claim 1.
処理対象の移動経路データと、処理済みのクラスタの代表移動経路データとの類似度を算出し、
前記類似度のいずれかが所定値以上であれば、処理対象の移動経路データは前記類似度が最も高い代表移動経路データのクラスタに属すると判断し、
前記類似度のいずれもが前記所定値よりも低ければ、処理対象の移動経路データは、新たなクラスタの代表移動経路データであると判断する、
請求項2に記載の移動経路データ匿名化装置。 The route anonymization means sequentially performs a clustering process on movement route data,
Calculate the similarity between the travel route data to be processed and the representative travel route data of the processed cluster,
If any of the similarities is equal to or greater than a predetermined value, it is determined that the travel route data to be processed belongs to a cluster of representative travel route data having the highest similarity,
If any of the similarities is lower than the predetermined value, it is determined that the movement path data to be processed is representative movement path data of a new cluster.
The travel route data anonymization device according to claim 2.
請求項3に記載の移動経路データ匿名化装置。 The route anonymization means resets the travel route data having the highest similarity to the other travel route data in the cluster for each cluster, as the representative travel route data.
The travel route data anonymization device according to claim 3.
クラス内類似度が所定値以上でありかつクラス内のデータ数が前記第1閾値以上となるようにクラス分けを決定するものであり、クラス内類似度が前記所定値以上でありかつクラス内のデータ数が前記第1閾値以上となるようにクラス分けできない移動経路データは削除する、
請求項1に記載の移動経路データ匿名化装置。 The route anonymization means performs a hierarchical clustering process on the travel route data,
The classification is determined so that the intraclass similarity is equal to or greater than a predetermined value and the number of data in the class is equal to or greater than the first threshold, and the intraclass similarity is equal to or greater than the predetermined value and within the class The travel route data that cannot be classified so that the number of data is equal to or greater than the first threshold is deleted.
The travel route data anonymization device according to claim 1.
請求項1から5のいずれか1項に記載の移動経路データ匿名化装置。 The route anonymization means performs the classification and movement route unification for each movement route data in which the pair of the starting point and the destination is the same.
The movement route data anonymization device according to any one of claims 1 to 5.
請求項1から6のいずれか1項に記載の移動経路データ匿名化装置。 The time anonymization means deletes the movement route data performed in the time zone if the movement performed in the same class is less than the second threshold for the movement route data in the same class,
The movement route data anonymization device according to any one of claims 1 to 6.
請求項1から6のいずれか1項に記載の移動経路データ匿名化装置。 The time anonymization means performs a process of expanding the time zone if the movement made in the same time zone is less than the second threshold for the movement route data in the same class,
The movement route data anonymization device according to any one of claims 1 to 6.
請求項1から8のいずれか1項に記載の移動経路データ匿名化装置。 It further comprises point abstraction means for replacing the starting point and destination in the travel route data with the abstracted area.
The movement path data anonymization device according to any one of claims 1 to 8.
請求項9に記載の移動経路データ匿名化装置。 The point abstraction means determines whether the starting point and the destination correspond to a personal area that is a point for identifying an individual, and replaces the starting point and the destination corresponding to the personal area with an abstracted region.
The travel route data anonymization device according to claim 9.
請求項9または10に記載の移動経路データ匿名化装置。 The route anonymization means and the time anonymization means perform processing on the movement route data after processing by the point abstraction means,
The movement route data anonymization device according to claim 9 or 10.
請求項9または10に記載の移動経路データ匿名化装置。 The point abstraction means performs processing on the movement route data after processing by the route anonymization means and the time anonymization means,
The movement route data anonymization device according to claim 9 or 10.
前記経路データ取得手段は、前記移動履歴データから前記移動経路データを生成する、
請求項1から12のいずれか1項に記載の移動経路データ匿名化装置。 It further comprises movement history acquisition means for acquiring a plurality of movement history data including a plurality of position information and time information,
The route data acquisition means generates the travel route data from the travel history data.
The travel route data anonymization device according to any one of claims 1 to 12.
移動経路と移動が行われた時間帯とを含む移動経路データを取得する経路データ取得ステップと、
複数の前記移動経路データを、移動経路の類似度に基づいて同一クラス内の移動経路
データ数が第1閾値以上となるようにクラス分けし、同一クラス内の移動経路データの移動経路を代表移動経路に統一する経路匿名化ステップと、
同一クラス内の移動経路データについて、所定の時間幅を持つ同一の時間帯において完結する移動の数が第2閾値以上となるように、前記移動経路データにおける移動が行われ
た時間帯を抽象化する時刻匿名化ステップと、
経路匿名化ステップと時刻匿名化ステップによる処理後の移動経路データを出力する出力ステップと、
を含む、移動経路データ匿名化方法。 A method of anonymizing travel route data performed by a computer,
A route data acquisition step for acquiring travel route data including a travel route and a time zone during which the travel was performed;
Said movement path data for multiple, classifies as movement path number of data within the same class is the first threshold value or more based on the similarity of the movement path, representative of the movement path of the moving path data in the same class A route anonymization step that unifies the travel route;
For moving path data in the same class, as the number of mobile that Oite completed in the same time zone having a predetermined time width is smaller than the second threshold value, the time period during which movement is performed in the moving path data An abstract time anonymization step;
An output step for outputting travel route data after processing by the route anonymization step and the time anonymization step;
A method for anonymizing travel route data, including:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015056147A JP6464849B2 (en) | 2015-03-19 | 2015-03-19 | Moving path data anonymization apparatus and method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015056147A JP6464849B2 (en) | 2015-03-19 | 2015-03-19 | Moving path data anonymization apparatus and method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016177452A JP2016177452A (en) | 2016-10-06 |
JP6464849B2 true JP6464849B2 (en) | 2019-02-06 |
Family
ID=57071356
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015056147A Active JP6464849B2 (en) | 2015-03-19 | 2015-03-19 | Moving path data anonymization apparatus and method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6464849B2 (en) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6570869B2 (en) * | 2015-04-30 | 2019-09-04 | 株式会社Nttドコモ | Information processing device |
JP6748612B2 (en) * | 2017-07-13 | 2020-09-02 | 日本電信電話株式会社 | Anonymity evaluation device, anonymity evaluation method, and program |
JP7056127B2 (en) * | 2017-12-14 | 2022-04-19 | 富士通株式会社 | Analytical methods, analyzers and analytical programs |
JP7073775B2 (en) * | 2018-02-16 | 2022-05-24 | 富士通株式会社 | Information processing equipment, behavior support methods, and behavior support programs |
JP2019159773A (en) * | 2018-03-13 | 2019-09-19 | 本田技研工業株式会社 | Data distribution control device, information processing device, and data distribution control method |
JP7188416B2 (en) * | 2020-06-22 | 2022-12-13 | トヨタ自動車株式会社 | Data collection device and data collection method |
WO2023276048A1 (en) * | 2021-06-30 | 2023-01-05 | 日本電信電話株式会社 | Anonymization device, anonymization method, and program |
JP7171962B1 (en) * | 2022-04-26 | 2022-11-15 | 朝日航洋株式会社 | Route statistical data management device, route statistical data management method, and route statistical data management program |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4422173B2 (en) * | 2007-06-15 | 2010-02-24 | 大日本印刷株式会社 | Advertisement information delivery system and delivery method for mobile terminals |
JP5162978B2 (en) * | 2007-06-28 | 2013-03-13 | Necソフト株式会社 | Route search method, route search system, and program |
JP2010164319A (en) * | 2009-01-13 | 2010-07-29 | Sanyo Electric Co Ltd | Navigation system |
JP2014009948A (en) * | 2012-06-27 | 2014-01-20 | Denso Corp | Route information service system and navigation device |
-
2015
- 2015-03-19 JP JP2015056147A patent/JP6464849B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2016177452A (en) | 2016-10-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6464849B2 (en) | Moving path data anonymization apparatus and method | |
Arain et al. | Location monitoring approach: multiple mix-zones with location privacy protection based on traffic flow over road networks | |
JP5846548B2 (en) | Information protection apparatus and information protection method | |
Qu et al. | A cost-effective recommender system for taxi drivers | |
CN104596531B (en) | A kind of generation method of navigation routine, device and server | |
Yu et al. | Modeling user activity patterns for next-place prediction | |
JP6435978B2 (en) | Location information anonymization method, movement information anonymization method, and apparatus | |
US10798238B2 (en) | System and method for tracking a mobile device user | |
Chen et al. | Efficient solution algorithm for finding spatially dependent reliable shortest path in road networks | |
Rezaie et al. | Semi-supervised travel mode detection from smartphone data | |
JP6277709B2 (en) | Route information processing method, apparatus, and program | |
EP4002763A1 (en) | Method, apparatus, and computer program product for identifying privacy risks in datasets | |
Wang et al. | Protecting the location privacy of mobile social media users | |
Martelli et al. | The price of privacy control in mobility sharing | |
JP6355577B2 (en) | Anonymization device, method and program | |
CN114166229B (en) | Healthy travel route planning system based on redundancy defense evasion algorithm | |
JP5615777B2 (en) | Route guidance device and route guidance method | |
Wang et al. | Ropriv: Road network-aware privacy-preserving framework in spatial crowdsourcing | |
US10341978B2 (en) | Mobile management system, mobile management server, mobile management method and mobile management program | |
JP6316597B2 (en) | Information processing server, information processing method, and information processing program | |
Huck et al. | Challenges in geocoding sociallygenerated data | |
JPWO2012043300A1 (en) | Information providing server, information providing system, information providing method, and program | |
S. de Sousa et al. | A cluster-based framework for predicting large scale road-network constrained trajectories | |
Comito | Mining pattern similarity for mobility prediction in location-based social networks | |
JP6458537B2 (en) | POSITION ESTIMATION METHOD, POSITION ESTIMATION PROGRAM, AND POSITION ESTIMATION DEVICE |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20171201 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180925 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180919 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181113 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20181211 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20181224 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6464849 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |