JP6588880B2 - Anonymization device, anonymization method, and program - Google Patents

Anonymization device, anonymization method, and program Download PDF

Info

Publication number
JP6588880B2
JP6588880B2 JP2016194245A JP2016194245A JP6588880B2 JP 6588880 B2 JP6588880 B2 JP 6588880B2 JP 2016194245 A JP2016194245 A JP 2016194245A JP 2016194245 A JP2016194245 A JP 2016194245A JP 6588880 B2 JP6588880 B2 JP 6588880B2
Authority
JP
Japan
Prior art keywords
information
dimensionless
time
unit
position information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016194245A
Other languages
Japanese (ja)
Other versions
JP2018055610A (en
Inventor
彰伍 正木
彰伍 正木
千田 浩司
浩司 千田
長谷川 聡
聡 長谷川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2016194245A priority Critical patent/JP6588880B2/en
Publication of JP2018055610A publication Critical patent/JP2018055610A/en
Application granted granted Critical
Publication of JP6588880B2 publication Critical patent/JP6588880B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

この発明は、パーソナルデータの匿名化技術に関し、特に、位置情報の時系列データである軌跡情報をk-匿名化する技術に関する。   The present invention relates to a technique for anonymizing personal data, and particularly to a technique for k-anonymizing trajectory information, which is time-series data of position information.

非特許文献1には、パーソナルデータを匿名化する方法として、k-匿名化という方法が記載されている。k-匿名化は、パーソナルデータの集合の中に同じ属性をもつデータが必ずk件以上存在するようにして、個体が特定される確率を1/k以下に抑える匿名化技術である。非特許文献2〜5には、位置情報の時系列データである軌跡情報に対して、k-匿名化を適用する方法が記載されている。例えば、非特許文献5では、まず、緯度・経度・時刻で表される位置情報を地図上のメッシュへマッピングすることにより、緯度・経度の汎化を行う。次に、すべての時刻で同じ緯度・経度である(すなわち同じ軌跡情報を持つ)ユーザーがk人以上いないユーザーを削除する。これにより、ある軌跡情報については必ずk人以上のユーザーが存在することになり、軌跡情報のk-匿名化を実現している。   Non-Patent Document 1 describes a method called k-anonymization as a method for anonymizing personal data. k-anonymization is an anonymization technique in which there is always k or more data having the same attribute in a set of personal data, and the probability that an individual is specified is suppressed to 1 / k or less. Non-Patent Documents 2 to 5 describe a method of applying k-anonymization to trajectory information that is time-series data of position information. For example, in Non-Patent Document 5, first, latitude / longitude is generalized by mapping position information represented by latitude / longitude / time to a mesh on a map. Next, the user who has the same latitude and longitude at all times (that is, has the same trajectory information) and has no more than k users is deleted. As a result, there are always k or more users for certain trajectory information, and the trajectory information is k-anonymized.

L. Sweeney, "k-Anonymity: A Model for Protecting Privacy", International Journal of Uncertainty, Fuzziness and Knowledge-Based Systems, vol. 10(5), pp. 557-570, October 2002.L. Sweeney, "k-Anonymity: A Model for Protecting Privacy", International Journal of Uncertainty, Fuzziness and Knowledge-Based Systems, vol. 10 (5), pp. 557-570, October 2002. O. Abul, F. Bonchi, and M. Nanni, "Never Walk Alone: Uncertainty for Anonymity in Moving Objects Databases", ICDE '08 Proceedings of the 2008 IEEE 24th International Conference on Data Engineering, Pages 376-385, 2008.O. Abul, F. Bonchi, and M. Nanni, "Never Walk Alone: Uncertainty for Anonymity in Moving Objects Databases", ICDE '08 Proceedings of the 2008 IEEE 24th International Conference on Data Engineering, Pages 376-385, 2008. M. E. Nergiz et al., "Towards Trajectory Anonymization: a Generalization-Based Approach", Transactions on Data Privacy, vol. 2(1), pp. 47-75, 2009.M. E. Nergiz et al., "Towards Trajectory Anonymization: a Generalization-Based Approach", Transactions on Data Privacy, vol. 2 (1), pp. 47-75, 2009. C.-Y. Chow and M. F. Mokbel, "Trajectory Privacy in Location-based Services and Data Publication", ACM SIGKDD Explorations Newsletter, vol. 13(1), pp. 19-29, June 2011.C.-Y. Chow and M. F. Mokbel, "Trajectory Privacy in Location-based Services and Data Publication", ACM SIGKDD Explorations Newsletter, vol. 13 (1), pp. 19-29, June 2011. R. Shigetomi-Yamaguchi et al., "Applicability of Existing Anonymization Methods to Large Location History Data in Urban Travel", IEEE International Conference on Systems, Man, and Cybernetics, 2012.R. Shigetomi-Yamaguchi et al., "Applicability of Existing Anonymization Methods to Large Location History Data in Urban Travel", IEEE International Conference on Systems, Man, and Cybernetics, 2012.

従来技術によってk-匿名化された軌跡情報は、比較的人通りが少ない領域を通ったユーザーが削除され、常時人通りが多い領域を通ったユーザーのみで構成されることになるため、ユーザー数が大きく減少してしまう傾向がある。これは、たとえ緯度・経度を汎化させても、比較的人通りが少ない領域では、複数時刻で同じ緯度・経度の組合せを持つユーザーは見出しにくいためである。   Since the trajectory information that has been k-anonymized by the prior art is composed of only users who have passed through areas with relatively high traffic, the number of users is always deleted. Tend to decrease significantly. This is because even if the latitude and longitude are generalized, a user having the same combination of latitude and longitude at a plurality of times is difficult to find in an area where the traffic is relatively low.

この発明の目的は、上記のような点に鑑みて、匿名化後の軌跡情報により多くのユーザーが含まれるようにk-匿名化することができる匿名化技術を提供することである。   In view of the above points, an object of the present invention is to provide an anonymization technique capable of k-anonymization so that more users are included in trajectory information after anonymization.

上記の課題を解決するために、この発明の匿名化装置は、ユーザーを特定する識別子と時刻を示す情報および位置を示す情報からなる複数の位置情報とを含む軌跡情報を入力とし、その軌跡情報の時刻を示す情報および位置を示す情報それぞれを最大値と最小値との差に基づいて無次元化した無次元化位置情報を生成する無次元化部と、無次元化位置情報を複数のクラスターにクラスタリングするクラスタリング部と、無次元化位置情報に含まれる時刻を示す情報および位置を示す情報を、その無次元化位置情報が所属するクラスターの中心値に置き換えて汎化した汎化無次元化位置情報を生成する汎化部と、汎化無次元化位置情報の時刻を示す情報および位置を示す情報それぞれを最大値と最小値の差に基づいて元の次元に戻した汎化位置情報を生成する逆無次元化部と、軌跡情報から時刻を示す情報および位置を示す情報により特定されるユーザーが所定の数未満となるユーザーに関する汎化位置情報を削除した匿名化軌跡情報を生成する削除部と、を含む。   In order to solve the above-described problem, the anonymization device according to the present invention receives, as input, trajectory information including an identifier for identifying a user, a plurality of pieces of position information including information indicating time and information indicating position. A non-dimensionalization unit that generates non-dimensional position information obtained by making the non-dimensional information based on the difference between the maximum value and the minimum value, and the non-dimensional position information into a plurality of clusters. The generalization and non-dimensionalization is performed by replacing the clustering unit that performs clustering into the non-dimensionalized position information and the information indicating the time and the information indicating the position with the central value of the cluster to which the non-dimensionalized position information belongs. Generalization position that generates position information, and generalized position that returns the information indicating the time of generalized non-dimensionalized position information and the information indicating position to the original dimension based on the difference between the maximum value and the minimum value Generates anonymized trajectory information by deleting generalized position information related to users whose number of users specified by information indicating time and position is less than a predetermined number from the trajectory information and an inverse dimensionless unit that generates information And a deletion unit.

この発明によれば、位置を示す情報および時刻を示す情報について汎化して軌跡情報を匿名化することができる。これにより、従来のk-匿名化法では削除されやすかった、人通りが少ない領域を通ったユーザーのデータが維持され易くなり、結果としてk-匿名化された軌跡情報に含まれるユーザー数が増加する。   According to the present invention, the trajectory information can be anonymized by generalizing the information indicating the position and the information indicating the time. This makes it easier to maintain user data that has been easily removed by the conventional k-anonymization method and passes through a low-traffic area, resulting in an increase in the number of users included in the k-anonymized trajectory information. To do.

図1は、匿名化装置の機能構成を例示する図である。FIG. 1 is a diagram illustrating a functional configuration of the anonymization device. 図2は、匿名化方法の処理手続きを例示する図である。FIG. 2 is a diagram illustrating a processing procedure of the anonymization method.

以下、この発明の実施の形態について詳細に説明する。なお、図面中において同じ機能を有する構成部には同じ番号を付し、重複説明を省略する。   Hereinafter, embodiments of the present invention will be described in detail. In addition, the same number is attached | subjected to the component which has the same function in drawing, and duplication description is abbreviate | omitted.

上述の課題を解決するためには、緯度・経度だけでなく、時刻についても汎化することが1つの方策となる。この発明の実施形態は、入力された軌跡情報をk-匿名化して匿名化軌跡情報を出力する匿名化装置である。実施形態の匿名化装置は、時刻・緯度・経度の三次元空間において近接する位置情報をグルーピングし、あるグループに属する位置情報の時刻・緯度・経度を統一し、汎化を行う。例えば、「14時59分に、A駅南口にいた」「15時01分に、A駅北口にいた」という位置情報であれば、どちらも「15時00分に、A駅にいた」のように加工する。そのために、時刻・緯度・経度の三次元空間において位置情報のクラスタリングを行い、位置情報の各属性を、所属するクラスターの中心値に置き換えるという方法を取る。   In order to solve the above-mentioned problem, one measure is to generalize not only latitude and longitude but also time. The embodiment of the present invention is an anonymization device that outputs anonymized trajectory information by k-anonymizing input trajectory information. The anonymization device of the embodiment groups position information that is close in a three-dimensional space of time, latitude, and longitude, unifies the time, latitude, and longitude of position information that belongs to a certain group, and performs generalization. For example, if the location information is “I was at the south exit of A station at 14:59” or “I was at the north exit of A station at 15:01”, both of them were “I was at A station at 15:00” To be processed. For this purpose, a method is used in which position information is clustered in a three-dimensional space of time, latitude, and longitude, and each attribute of the position information is replaced with the central value of the cluster to which it belongs.

実施形態の匿名化装置は、図1に例示するように、入力部1、無次元化部2、クラスタリング部3、汎化部4、逆無次元化部5、削除部6、および出力部7を含む。この匿名化装置が、図2に例示する各ステップの処理を行うことにより実施形態の匿名化方法が実現される。   As illustrated in FIG. 1, the anonymization device according to the embodiment includes an input unit 1, a dimensionless unit 2, a clustering unit 3, a generalization unit 4, an inverse dimensionless unit 5, a deletion unit 6, and an output unit 7. including. This anonymization apparatus performs the process of each step illustrated in FIG. 2, thereby realizing the anonymization method of the embodiment.

匿名化装置は、例えば、中央演算処理装置(CPU: Central Processing Unit)、主記憶装置(RAM: Random Access Memory)などを有する公知又は専用のコンピュータに特別なプログラムが読み込まれて構成された特別な装置である。匿名化装置は、例えば、中央演算処理装置の制御のもとで各処理を実行する。匿名化装置に入力されたデータや各処理で得られたデータは、例えば、主記憶装置に格納され、主記憶装置に格納されたデータは必要に応じて中央演算処理装置へ読み出されて他の処理に利用される。匿名化装置の各処理部は、少なくとも一部が集積回路等のハードウェアによって構成されていてもよい。   An anonymization device is, for example, a special program configured by reading a special program into a known or dedicated computer having a central processing unit (CPU), a main storage device (RAM: Random Access Memory), and the like. Device. For example, the anonymization device executes each process under the control of the central processing unit. The data input to the anonymization device and the data obtained in each process are stored in the main storage device, for example, and the data stored in the main storage device is read out to the central processing unit as necessary. It is used for processing. At least a part of each processing unit of the anonymization device may be configured by hardware such as an integrated circuit.

図2を参照して、実施形態の匿名化方法の処理手続きを説明する。   With reference to FIG. 2, the process procedure of the anonymization method of embodiment is demonstrated.

ステップS1において、入力部1へ、匿名化処理の対象となる軌跡情報が入力される。軌跡情報は無次元化部2へ送られる。軌跡情報は、ユーザーの位置情報の時系列データであり、例えば、ユーザーを特定する識別子、時刻を示す情報、および位置を示す情報を含む。この実施形態では、位置を示す情報は緯度および経度で表すものとして、軌跡情報は、例えば次表に示すように、ユーザーID、時刻、緯度、経度の4つの属性で構成されるものとする。例えば、次表のヘッダーを除いた1〜2行目では、ユーザーIDが「3」であるユーザーが時刻「08:00:18」には緯度「35.68367342」、経度「139.47106963」の位置にいたが、5分後の時刻「08:05:18」には緯度「35.68302667」、経度「139.47132593」の位置へ移動していたことを示している。   In step S1, trajectory information to be anonymized is input to the input unit 1. The trajectory information is sent to the dimensionless unit 2. The trajectory information is time-series data of user position information, and includes, for example, an identifier that identifies the user, information indicating time, and information indicating position. In this embodiment, it is assumed that the information indicating the position is expressed by latitude and longitude, and the trajectory information is configured by four attributes of user ID, time, latitude, and longitude, as shown in the following table, for example. For example, in the first and second lines excluding the header in the following table, the user with the user ID “3” was at the position of latitude “35.68367342” and longitude “139.47106963” at time “08:00:18”. , 5 minutes later, at time “08:05:18”, it has been moved to the position of latitude “35.68302667” and longitude “139.47132593”.

Figure 0006588880
Figure 0006588880

ステップS2において、無次元化部2は、入力部1から軌跡情報を受け取り、軌跡情報に含まれる時刻・緯度・経度それぞれを最大値と最小値との差に基づいて無次元化する。無次元化部2は、無次元化した位置情報(以下、無次元化位置情報と呼ぶ)をクラスタリング部3へ出力する。   In step S2, the dimensionless unit 2 receives the trajectory information from the input unit 1, and performs dimensionless processing based on the difference between the maximum value and the minimum value for each of the time, latitude, and longitude included in the trajectory information. The dimensionless unit 2 outputs dimensionless position information (hereinafter referred to as dimensionless position information) to the clustering unit 3.

無次元化を行うのは、時刻・緯度・経度は次元(単位)が異なるため、単純に三次元空間を定義することができないからである。具体的には、tを無次元化前の時刻、t'を無次元化後の時刻、latを無次元化前の緯度、lat'を無次元化後の緯度、lonを無次元化前の経度、lon'を無次元化後の経度として、次式のように、それぞれ(最大値−最小値)により除算することで無次元化する。なお、時刻tについては、例えば0時0分0秒など基準となる時刻からの経過時間を秒単位に変換して次式の計算を行う。   Non-dimensionalization is performed because time, latitude, and longitude have different dimensions (units), and thus a three-dimensional space cannot be simply defined. Specifically, t is the time before dimensionless, t 'is the time after dimensionless, lat is the latitude before dimensionless, lat' is the dimension after dimensionless, lon is before dimensionless The longitude and lon ′ are made dimensionless by dividing them by (maximum value−minimum value), respectively, as shown in the following formula, with the longitude after dimensionlessness. For the time t, for example, the following equation is calculated by converting the elapsed time from the reference time such as 0 hours 0 minutes 0 seconds into seconds.

Figure 0006588880
Figure 0006588880

ただし、tmaxは時刻tの最大値、tminは時刻tの最小値、latmaxは緯度latの最大値、latminは緯度latの最小値、lonmaxは経度lonの最大値、lonminは経度lonの最小値、αt,αlat,αlonは予め与えられた所定の実数である。αt,αlat,αlonは、要求される匿名性および有用性のレベルを満たすように設定すればよく、例えばαtlatlon=1とする。 Where t max is the maximum value at time t, t min is the minimum value at time t, lat max is the maximum value at latitude lat, lat min is the minimum value at latitude lat, lon max is the maximum value at longitude lon, and lon min is The minimum values of longitude lon, α t , α lat , α lon are predetermined real numbers given in advance. α t , α lat , and α lon may be set so as to satisfy the required levels of anonymity and usefulness. For example, α t = α lat = α lon = 1.

ステップS3において、クラスタリング部3は、無次元化部2が出力する無次元化位置情報を受け取り、その無次元化位置情報をNcls(>1)個のクラスターにクラスタリングする。クラスターの個数Nclsは、要求される匿名性および有用性のレベルを満たすように設定する。クラスタリング部3は、クラスタリング後の無次元化位置情報を汎化部4へ出力する。クラスタリングの手法は、既存のいかなる方法を用いてもよいが、例えば、下記参考文献1に記載されたk-平均法を用いることができる。
〔参考文献1〕J. A. Hartigan and M. A. Wong, "Algorithm AS 136: A K-Means Clustering Algorithm", Journal of the Royal Statistical Society. Series C (Applied Statistics), Vol. 28, No. 1 (1979), pp. 100-108.
In step S3, the clustering unit 3 receives the non-dimensionalized position information output from the non-dimensionalized unit 2, and clusters the non-dimensionalized positional information into N cls (> 1) clusters. The number of clusters N cls is set to satisfy the required level of anonymity and usefulness. The clustering unit 3 outputs the dimensionless position information after clustering to the generalization unit 4. As the clustering method, any existing method may be used. For example, the k-average method described in Reference Document 1 below may be used.
[Reference 1] JA Hartigan and MA Wong, "Algorithm AS 136: A K-Means Clustering Algorithm", Journal of the Royal Statistical Society. Series C (Applied Statistics), Vol. 28, No. 1 (1979), pp 100-108.

ステップS4において、汎化部4は、クラスタリング部3が出力するクラスタリング後の無次元化位置情報を受け取り、無次元化位置情報に含まれる時刻・緯度・経度を、その無次元化位置情報が所属するクラスターの中心値に置き換えて統一し、汎化する。汎化部4は、汎化した無次元化位置情報(以下、汎化無次元化位置情報と呼ぶ)を逆無次元化部5へ出力する。   In step S4, the generalization unit 4 receives the non-dimensionalized position information after clustering output from the clustering unit 3, and the time / latitude / longitude included in the non-dimensionalized position information belongs to the non-dimensionalized position information. Replace with the central value of the cluster to be unified and generalize. The generalization unit 4 outputs the generalized non-dimensional position information (hereinafter referred to as generalized non-dimensional position information) to the inverse non-dimensionalization unit 5.

ステップS5において、逆無次元化部5は、汎化部4が出力する汎化無次元化位置情報を受け取り、汎化無次元化位置情報の時刻・緯度・経度それぞれを最大値と最小値の差に基づいて元の次元に戻す。逆無次元化部5は、次元を元に戻した汎化無次元化位置情報(以下、汎化位置情報と呼ぶ)を削除部6へ出力する。具体的には、t'を逆無次元化前の時刻、tを逆無次元化後の時刻、lat'を逆無次元化前の緯度、latを逆無次元化後の緯度、lon'を無次元化後の経度、lonを逆無次元化後の経度として、次式のように、それぞれ(最大値−最小値)を乗算することで次元を元に戻す。   In step S5, the inverse dimensionless unit 5 receives the generalized dimensionless position information output from the generalization unit 4, and sets the time, latitude, and longitude of the generalized dimensionless position information as the maximum value and the minimum value, respectively. Revert to the original dimension based on the difference. The inverse dimensionless unit 5 outputs generalized dimensionless position information (hereinafter referred to as generalized position information) whose dimensions have been restored to the deletion unit 6. Specifically, t 'is the time before reverse dimensionless, t is the time after reverse dimensionless, lat' is the latitude before reverse dimensionless, lat is the latitude after reverse dimensionless, lon ' The dimension is restored to the original by multiplying (maximum value−minimum value), respectively, by using the dimensionless longitude and lon as the inverse dimensionless longitude.

Figure 0006588880
Figure 0006588880

ステップS6において、削除部6は、逆無次元化部5が出力する汎化位置情報を受け取り、時刻・緯度・経度により特定されるユーザーが所定の数k(>1)以上となるように汎化位置情報を削除する。所定の数kは、要求される匿名性および有用性のレベルを満たすように設定する。具体的には、まず、前処理として、各ユーザーについて、時刻・緯度・経度が複数連続して同じものになった場合、1つのみを残して削除する。これは、時刻を汎化することで、同じユーザーが同じ時刻に複数の同じ位置に存在する位置情報をもつ状態が起こり得るが、その場合正しく匿名化ができないからである。次に、時刻・緯度・経度がすべて一致するユーザー数を集計し、そのユーザー数が所定の数k未満であるユーザーに関する汎化位置情報を削除する。これにより、ある軌跡情報を持つユーザーは必ずk人以上となり、削除後の汎化位置情報からなる軌跡情報はk-匿名性を満たすようになる。削除部6は、削除後の汎化位置情報からなる軌跡情報(以下、匿名化軌跡情報と呼ぶ)を出力部7へ出力する。   In step S6, the deletion unit 6 receives the generalized position information output by the inverse dimensionless unit 5, and the generalized position information is determined so that the number of users specified by time, latitude, and longitude is equal to or greater than a predetermined number k (> 1). Delete the location information. The predetermined number k is set to satisfy the required level of anonymity and usefulness. Specifically, first, as a preprocessing, when a plurality of times, latitudes, and longitudes are continuously the same for each user, only one is deleted and deleted. This is because, by generalizing the time, a state in which the same user has position information existing at a plurality of the same positions at the same time may occur, but in this case, anonymization cannot be performed correctly. Next, the number of users whose time, latitude, and longitude all match is totaled, and generalized position information related to users whose number of users is less than a predetermined number k is deleted. As a result, there are always k or more users having certain trajectory information, and trajectory information including generalized position information after deletion satisfies k-anonymity. The deletion unit 6 outputs trajectory information including the generalized position information after deletion (hereinafter referred to as anonymized trajectory information) to the output unit 7.

ステップS7において、出力部7は、削除部6が出力する匿名化軌跡情報を受け取り、その匿名化軌跡情報を出力する。   In step S7, the output unit 7 receives the anonymized trajectory information output by the deleting unit 6 and outputs the anonymized trajectory information.

この発明の第一のポイントは、緯度・経度のみでなく、時刻についても統一化を行い、汎化することにより、k-匿名化された軌跡情報に含まれるユーザー数が増加することである。これは、所属するクラスターの中心値へ置き換えることによる時刻・緯度・経度の汎化により実現されるものである。この発明の第二のポイントは、位置情報のクラスタリングを行うためには、時刻・緯度・経度の三次元空間を定義することが必要であるところ、時刻・緯度・経度の各属性を無次元化することで三次元空間を定義したことである。   The first point of the present invention is that the number of users included in the k-anonymized trajectory information is increased by unifying and generalizing not only latitude and longitude but also time. This is realized by generalization of time, latitude, and longitude by replacing with the central value of the cluster to which it belongs. The second point of this invention is that it is necessary to define a three-dimensional space of time, latitude, and longitude in order to perform clustering of position information. By doing so, we defined a three-dimensional space.

以上、この発明の実施の形態について説明したが、具体的な構成は、これらの実施の形態に限られるものではなく、この発明の趣旨を逸脱しない範囲で適宜設計の変更等があっても、この発明に含まれることはいうまでもない。実施の形態において説明した各種の処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。   As described above, the embodiments of the present invention have been described, but the specific configuration is not limited to these embodiments, and even if there is a design change or the like as appropriate without departing from the spirit of the present invention, Needless to say, it is included in this invention. The various processes described in the embodiments are not only executed in time series according to the description order, but may also be executed in parallel or individually as required by the processing capability of the apparatus that executes the processes.

[プログラム、記録媒体]
上記実施形態で説明した各装置における各種の処理機能をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記各装置における各種の処理機能がコンピュータ上で実現される。
[Program, recording medium]
When various processing functions in each device described in the above embodiment are realized by a computer, the processing contents of the functions that each device should have are described by a program. Then, by executing this program on a computer, various processing functions in each of the above devices are realized on the computer.

この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。   The program describing the processing contents can be recorded on a computer-readable recording medium. As the computer-readable recording medium, for example, any recording medium such as a magnetic recording device, an optical disk, a magneto-optical recording medium, and a semiconductor memory may be used.

また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD-ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。   This program is distributed by selling, transferring, or lending a portable recording medium such as a DVD or CD-ROM in which the program is recorded. Furthermore, the program may be distributed by storing the program in a storage device of the server computer and transferring the program from the server computer to another computer via a network.

このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。   A computer that executes such a program first stores, for example, a program recorded on a portable recording medium or a program transferred from a server computer in its own storage device. When executing the process, the computer reads a program stored in its own recording medium and executes a process according to the read program. As another execution form of the program, the computer may directly read the program from a portable recording medium and execute processing according to the program, and the program is transferred from the server computer to the computer. Each time, the processing according to the received program may be executed sequentially. A configuration in which the above-described processing is executed by a so-called ASP (Application Service Provider) type service that realizes a processing function only by an execution instruction and result acquisition without transferring a program from the server computer to the computer. It is good. Note that the program in this embodiment includes information that is used for processing by an electronic computer and that conforms to the program (data that is not a direct command to the computer but has a property that defines the processing of the computer).

また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、本装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。   In this embodiment, the present apparatus is configured by executing a predetermined program on a computer. However, at least a part of these processing contents may be realized by hardware.

1 入力部
2 無次元化部
3 クラスタリング部
4 汎化部
5 逆無次元化部
6 削除部
7 出力部
DESCRIPTION OF SYMBOLS 1 Input part 2 Nondimensionalization part 3 Clustering part 4 Generalization part 5 Reverse dimensionless part 6 Deletion part 7 Output part

Claims (5)

ユーザーを特定する識別子と時刻を示す情報および位置を示す情報からなる複数の位置情報とを含む軌跡情報を入力とし、その軌跡情報の時刻を示す情報および位置を示す情報それぞれを最大値と最小値との差に基づいて無次元化した無次元化位置情報を生成する無次元化部と、
上記無次元化位置情報を複数のクラスターにクラスタリングするクラスタリング部と、
上記無次元化位置情報に含まれる時刻を示す情報および位置を示す情報を、その無次元化位置情報が所属する上記クラスターの中心値に置き換えて汎化した汎化無次元化位置情報を生成する汎化部と、
上記汎化無次元化位置情報の時刻を示す情報および位置を示す情報それぞれを最大値と最小値の差に基づいて元の次元に戻した汎化位置情報を生成する逆無次元化部と、
上記軌跡情報から時刻を示す情報および位置を示す情報により特定されるユーザーが所定の数未満となるユーザーに関する汎化位置情報を削除した匿名化軌跡情報を生成する削除部と、
を含む匿名化装置。
The trajectory information including an identifier for identifying the user, a plurality of position information composed of information indicating the time and information indicating the position is input, and the information indicating the time and the information indicating the position of the trajectory information are respectively the maximum value and the minimum value. A dimensionless unit that generates dimensionless position information that is dimensionless based on the difference between
A clustering unit that clusters the non-dimensional position information into a plurality of clusters;
Generate generalized non-dimensionalized position information by replacing information indicating time and information included in the non-dimensionalized position information with the center value of the cluster to which the non-dimensionalized position information belongs. A generalization section;
An inverse dimensionless unit that generates generalized position information in which the information indicating the time of the generalized non-dimensionalized position information and the information indicating the position are returned to the original dimensions based on the difference between the maximum value and the minimum value,
A deletion unit that generates anonymized trajectory information obtained by deleting generalized position information related to a user whose number of users specified by information indicating time and information indicating position is less than a predetermined number from the trajectory information;
Anonymization device including
請求項1に記載の匿名化装置であって、
上記位置を示す情報は緯度および経度からなり、tを無次元化前の時刻とし、t'を無次元化後の時刻とし、latを無次元化前の緯度とし、lat'を無次元化後の緯度とし、lonを無次元化前の経度とし、lon'を無次元化後の経度とし、tmaxを時刻tの最大値とし、tminを時刻tの最小値とし、latmaxを緯度latの最大値とし、latminを緯度latの最小値とし、lonmaxを経度lonの最大値とし、lonminを経度lonの最小値とし、αt,αlat,αlonを所定の実数とし、
上記無次元化部は、次式により、上記位置情報を無次元化するものであり、
Figure 0006588880

上記逆無次元化部は、次式により、上記汎化無次元化位置情報を元の次元に戻すものである、
Figure 0006588880

匿名化装置。
The anonymization device according to claim 1,
The information indicating the above position consists of latitude and longitude, t is the time before non-dimensionalization, t 'is the time after non-dimensionalization, lat is the latitude before non-dimensionalization, and lat' is non-dimensional Lon is the longitude before dimensionless, lon 'is the longitude after dimensionlessness, t max is the maximum value at time t, t min is the minimum value at time t, and lat max is the latitude lat Lat min is the minimum value of latitude lat, lon max is the maximum value of longitude lon, lon min is the minimum value of longitude lon, and α t , α lat , α lon are predetermined real numbers,
The dimensionless unit is configured to dimensionless the position information by the following equation:
Figure 0006588880

The inverse dimensionless unit returns the generalized dimensionless position information to the original dimension according to the following equation:
Figure 0006588880

Anonymization device.
請求項1または2に記載の匿名化装置であって、
上記削除部は、各ユーザーについて位置情報が複数同じものが連続する場合は1つを残して削除した上で、時刻を示す情報および位置を示す情報がすべて一致するユーザーが上記所定の数未満となる上記汎化位置情報を削除するものである、
匿名化装置。
The anonymization device according to claim 1 or 2,
When the same location information continues for a plurality of users, the deletion unit deletes all but one, and the number of users whose time information and location information all match is less than the predetermined number. The generalized position information is deleted.
Anonymization device.
無次元化部とクラスタリング部と汎化部と逆無次元化部と削除部とを含む匿名化装置が実行する匿名化方法であって、
上記無次元化部が、ユーザーを特定する識別子と時刻を示す情報および位置を示す情報からなる複数の位置情報とを含む軌跡情報を入力とし、その軌跡情報の時刻を示す情報および位置を示す情報それぞれを最大値と最小値との差に基づいて無次元化した無次元化位置情報を生成する無次元化ステップと、
上記クラスタリング部が、上記無次元化位置情報を複数のクラスターにクラスタリングするクラスタリングステップと、
上記汎化部が、上記無次元化位置情報に含まれる時刻を示す情報および位置を示す情報を、その無次元化位置情報が所属する上記クラスターの中心値に置き換えて汎化した汎化無次元化位置情報を生成する汎化ステップと、
上記逆無次元化部が、上記汎化無次元化位置情報の時刻を示す情報および位置を示す情報それぞれを最大値と最小値の差に基づいて元の次元に戻した汎化位置情報を生成する逆無次元化ステップと、
上記削除部が、上記軌跡情報から時刻を示す情報および位置を示す情報により特定されるユーザーが所定の数未満となるユーザーに関する汎化位置情報を削除した匿名化軌跡情報を生成する削除ステップと、
を含む匿名化方法。
An anonymization method executed by an anonymization device including a non-dimensionalization unit, a clustering unit, a generalization unit, an inverse non-dimensionalization unit, and a deletion unit,
The dimensionless unit receives, as input, trajectory information including an identifier for identifying a user, a plurality of position information including information indicating time and information indicating position, and information indicating the time and information of the trajectory information A dimensionless step for generating dimensionless position information that is dimensionless based on the difference between the maximum value and the minimum value,
The clustering section, and clustering step of clustering the dimensionless position information into a plurality of clusters,
The generalization unit, the information indicating information and position indicating the time included in the dimensionless position information, generalization dimensionless was generalized by replacing the center value of the cluster to which the dimensionless position information belongs A generalization step for generating generalized position information;
The inverse dimensionless unit generates generalized position information in which the information indicating the time of the generalized dimensionless position information and the information indicating the position are returned to the original dimensions based on the difference between the maximum value and the minimum value. An inverse dimensionless step to
A deletion step of the deleting unit generates the anonymous locus information user deletes the generalization positional information about the user to be less than the predetermined number specified by information indicating information and position representing the time from the trajectory information,
Anonymization methods including:
請求項1から3のいずれかに記載の匿名化装置としてコンピュータを機能させるためのプログラム。   The program for functioning a computer as an anonymization apparatus in any one of Claim 1 to 3.
JP2016194245A 2016-09-30 2016-09-30 Anonymization device, anonymization method, and program Active JP6588880B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016194245A JP6588880B2 (en) 2016-09-30 2016-09-30 Anonymization device, anonymization method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016194245A JP6588880B2 (en) 2016-09-30 2016-09-30 Anonymization device, anonymization method, and program

Publications (2)

Publication Number Publication Date
JP2018055610A JP2018055610A (en) 2018-04-05
JP6588880B2 true JP6588880B2 (en) 2019-10-09

Family

ID=61836824

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016194245A Active JP6588880B2 (en) 2016-09-30 2016-09-30 Anonymization device, anonymization method, and program

Country Status (1)

Country Link
JP (1) JP6588880B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7096145B2 (en) * 2018-12-12 2022-07-05 Kddi株式会社 Clustering device, clustering method and clustering program
CN112651431B (en) * 2020-12-16 2023-07-07 北方工业大学 Clustering and sorting method for retired power batteries

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2487639A4 (en) * 2009-10-09 2017-05-24 Nec Corporation Information management device, data processing method thereof, and computer program
JP5422539B2 (en) * 2010-11-10 2014-02-19 日本電信電話株式会社 Action prediction method, apparatus, and program
CA2821438A1 (en) * 2010-12-27 2012-07-05 Nec Corporation Information protection device and information protection method
JP6125153B2 (en) * 2012-04-27 2017-05-10 Kddi株式会社 Position information anonymization device, position information anonymization method and program
US9146988B2 (en) * 2012-06-05 2015-09-29 King Fahd University Of Petroleum And Minerals Hierarchal clustering method for large XML data
JP6097774B2 (en) * 2015-02-13 2017-03-15 ソフトバンク株式会社 Anonymization processing method, anonymization processing program, and anonymization processing device

Also Published As

Publication number Publication date
JP2018055610A (en) 2018-04-05

Similar Documents

Publication Publication Date Title
Feng et al. PMF: A privacy-preserving human mobility prediction framework via federated learning
Jagadish et al. Big data and its technical challenges
US9230132B2 (en) Anonymization for data having a relational part and sequential part
Al-Hussaeni et al. Privacy-preserving trajectory stream publishing
JP6398724B2 (en) Information processing apparatus and information processing method
Chai et al. Analysis of spatiotemporal mobility of shared‐bike usage during COVID‐19 pandemic in Beijing
Sui et al. A privacy-preserving approach for multimodal transaction data integrated analysis
JP6588880B2 (en) Anonymization device, anonymization method, and program
Naghizade et al. Privacy-and context-aware release of trajectory data
JP6445415B2 (en) Anonymization device, anonymization method, program
Attaullah et al. Fuzzy-logic-based privacy-aware dynamic release of IoT-enabled healthcare data
Brito et al. A distributed approach for privacy preservation in the publication of trajectory data
Cho et al. Privacy-preserving similarity measurement for access control policies
Podhoranyi et al. Social media data processing infrastructure by using Apache spark big data platform: Twitter data analysis
Acs et al. Privacy-preserving release of spatio-temporal density
Menandas et al. Data mining with parallel processing technique for complexity reduction and characterization of big data
Selvi et al. A review of big data and anonymization algorithms
Hassoon et al. Privacy of Clients' Locations in Big Data and Cloud Computing
JP7179795B2 (en) Anonymization device, anonymization method and anonymization program
Le Thi Bao et al. Semantic bob-tree: A new obfuscation technique for location privacy protection
Nakamura et al. TMk-anonymity: Perturbation-based data anonymization method for improving effectiveness of secondary use
JP2014191431A (en) Anonymity system, possession device, anonymity device, user device, anonymity method and program
Templ et al. Practical applications in statistical disclosure control using R
Saxena et al. Mintra: Mining anonymized trajectories with annotations
KR102651303B1 (en) Apparatus and method for de-identifying and restoring face image

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180903

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190612

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190723

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190829

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190910

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190913

R150 Certificate of patent or registration of utility model

Ref document number: 6588880

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150