JP2015170169A - Personal information anonymization program and personal information anonymization device - Google Patents

Personal information anonymization program and personal information anonymization device Download PDF

Info

Publication number
JP2015170169A
JP2015170169A JP2014045022A JP2014045022A JP2015170169A JP 2015170169 A JP2015170169 A JP 2015170169A JP 2014045022 A JP2014045022 A JP 2014045022A JP 2014045022 A JP2014045022 A JP 2014045022A JP 2015170169 A JP2015170169 A JP 2015170169A
Authority
JP
Japan
Prior art keywords
anonymization
data
information
calculation
loss rate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2014045022A
Other languages
Japanese (ja)
Inventor
和明 井堀
Kazuaki Ihori
和明 井堀
中村 雄一
Yuichi Nakamura
雄一 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Solutions Ltd
Original Assignee
Hitachi Solutions Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Solutions Ltd filed Critical Hitachi Solutions Ltd
Priority to JP2014045022A priority Critical patent/JP2015170169A/en
Publication of JP2015170169A publication Critical patent/JP2015170169A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a personal information anonymization technic allowing a user to correctly determining the usefulness of an anonymized data by providing the information loss ratio significant for the user.SOLUTION: The personal information anonymization program sets a boundary between a part of the personal information on which a simple anonymization is made and a part on which the simple anonymization is not made, and calculates information loss ratio by using the former as a reference.

Description

本発明は、パーソナル情報を匿名化する技術に関する。   The present invention relates to a technique for anonymizing personal information.

クラウドコンピューティングや分散処理技術の発展により、これまで企業や団体で蓄積されてきた大量のデータの分析や利活用が現実的な時間内で可能となってきている。一方で、これらのデータは多くの場合、氏名や住所のような個人を特定できる情報や、年齢・職業・学歴のように必ずしも個人を特定できないが個人に関する情報を含んでいる。例えば、医療分野における患者への投薬データや、流通分野における個人の購買履歴などがこれにあたる。このような情報はパーソナル情報と呼ばれる。パーソナル情報を利活用するに際してはプライバシー侵害への懸念があるため、プライバシー保護に配慮する必要がある。   With the development of cloud computing and distributed processing technology, it has become possible to analyze and utilize a large amount of data accumulated by companies and organizations so far in a realistic time. On the other hand, in many cases, these data include information that can identify an individual such as a name and address, and information about an individual that cannot be identified, such as age, occupation, and educational background. For example, this includes medication data for patients in the medical field and personal purchase history in the distribution field. Such information is called personal information. When using personal information, there is a concern about privacy infringement, so it is necessary to consider privacy protection.

匿名化技術は、パーソナル情報の一部または全部の情報に曖昧化などの加工を施すことによってプライバシー流出を防止する技術である。匿名化技術は大きく単純匿名化と統合匿名化の2つに分けられる。単純匿名化は、健康保険の保険者番号や氏名といった個人情報の除去や置き換え、年齢や日付情報の丸めなど、レコードが持つ個人に関する情報を曖昧化するのに用いる。しかしながら、パーソナル情報を単純匿名化することにより得られるデータから真に個人の識別性が失われているかどうかは、一般的には定量的に保証されていない。統合匿名化は、個人の識別性が失われているかどうかを表す指標が所定の条件を満たすように個人に関する情報を曖昧化する。   The anonymization technique is a technique for preventing leakage of privacy by performing processing such as obscuration on part or all of personal information. Anonymization technology can be broadly divided into two types: simple anonymization and integrated anonymization. Simple anonymization is used to obscure information about individuals in records, such as the removal and replacement of personal information such as health insurance insurer numbers and names, and rounding of age and date information. However, it is generally not quantitatively guaranteed whether or not personal identification is truly lost from data obtained by simply anonymizing personal information. Integrated anonymization blurs information about an individual so that an index indicating whether or not the individual's identity is lost satisfies a predetermined condition.

プライバシーの保護は、個人情報保護法で定める個人情報を削除するだけでは不十分であるといわれている。例えば医療分野においては、患者の年齢・居住地域・職業・性別などの、それ単独では個人を特定できない属性を組み合わせることにより個人を特定できることがある。このような、組み合わせることで個人特定が可能になる属性は、準識別子と呼ばれる。k匿名化は統合匿名化の代表的な技術であり、パーソナル情報内に同じ準識別子の組み合わせがk件(匿名化閾値と呼ぶ)以上現れるように属性値を曖昧化する。例えば、「31歳・神奈川県・システムエンジニア」という属性値の組み合わせを「30代・神奈川県・IT」というように曖昧化する。k匿名化は、パーソナル情報の準識別子の属性値を曖昧化する、一般化階層というデータ構造を使用する。   It is said that it is not sufficient to protect privacy by simply deleting personal information defined by the Personal Information Protection Law. For example, in the medical field, an individual may be identified by combining attributes such as the age, residence area, occupation, and sex of a patient that cannot be identified by themselves. Such attributes that can be identified by combining them are called quasi-identifiers. k anonymization is a typical technique of integrated anonymization, and attribute values are made ambiguous so that k or more combinations of the same quasi-identifier appear in personal information (referred to as anonymization threshold). For example, the attribute value combination of “31 years old, Kanagawa Prefecture, system engineer” is obscured as “30s, Kanagawa Prefecture, IT”. k anonymization uses a data structure called a generalized hierarchy that obfuscates attribute values of quasi-identifiers of personal information.

下記特許文献1は、パーソナル情報の準識別子の属性値の出現頻度を利用して一般化階層を生成することより、理論的に情報損失が最小になる一般化階層を得る技術を開示している。   Patent Document 1 below discloses a technique for obtaining a generalized hierarchy that theoretically minimizes information loss by generating a generalized hierarchy using the frequency of appearance of attribute values of quasi-identifiers of personal information. .

WO2011145401号公報WO2011145401 gazette

k匿名化を実施することによる情報損失がユーザにとって許容できるか否かは、例えばk匿名化による情報損失率をユーザに対して提示してユーザ自身に判断させることができる。このときユーザに対して提示する値によっては、情報損失率が適切であるか否かをユーザが正しく判断することができない可能性がある。この理由について以下に説明する。   Whether or not the information loss due to the k anonymization is acceptable for the user can be determined by presenting the information loss rate due to the k anonymization to the user, for example. At this time, depending on the value presented to the user, the user may not be able to correctly determine whether or not the information loss rate is appropriate. The reason for this will be described below.

パーソナル情報を匿名化するときは、まず単純匿名化を実施した後にk匿名化を実施する。つまり、パーソナル情報の匿名化においては通常、個人情報の削除や切り落とし、日付や数値項目の丸めなどを実施してからk匿名化を実施する。したがって、情報損失率を計算する基準点によっては、ユーザから見ると情報が過剰に損なわれたように見えたり、あるいは匿名化が不十分であるように見えたりする可能性がある。   When anonymizing personal information, first anonymization is performed after simple anonymization. That is, in the anonymization of personal information, the anonymization is usually performed after the personal information is deleted or cut off, the date or numerical items are rounded. Therefore, depending on the reference point for calculating the information loss rate, the information may appear to be excessively damaged from the viewpoint of the user, or the anonymization may appear to be insufficient.

本発明は、上記のような状況に鑑みてなされたものであり、ユーザにとって意味のある情報損失率を提供することにより、匿名化されたデータの有用性をユーザが正しく判断することができるパーソナル情報匿名化技術を提供することを目的とする。   The present invention has been made in view of the above situation, and by providing an information loss rate that is meaningful to the user, the user can correctly determine the usefulness of the anonymized data. The purpose is to provide information anonymization technology.

本発明のパーソナル情報匿名化プログラムは、パーソナル情報に対して単純匿名化を実施する部分と実施しない部分との間の境界を設定し、前者を基準として情報損失率を算出する。   The personal information anonymization program of this invention sets the boundary between the part which implements simple anonymization with respect to personal information, and the part which does not implement, and calculates an information loss rate on the basis of the former.

本発明に係るパーソナル情報匿名化プログラムによれば、あらかじめ単純匿名化を実施することによって不要な情報をフィルタリングした結果を基準として情報損失率を算出するので、ユーザにとって意味のある情報損失率を提示することができる。これにより、ユーザは匿名化データの有用性をより正しく判断することができる。   According to the personal information anonymization program according to the present invention, since the information loss rate is calculated based on the result of filtering unnecessary information by executing simple anonymization in advance, an information loss rate meaningful to the user is presented. can do. Thereby, the user can judge the usefulness of anonymization data more correctly.

パーソナル情報匿名化装置の構成を示す図である。It is a figure which shows the structure of a personal information anonymization apparatus. 受付部200が表示する匿名化メイン画面300の画面イメージである。It is a screen image of the anonymization main screen 300 which the reception part 200 displays. 匿名化対象データ取込画面400の画面イメージである。It is a screen image of the anonymization object data acquisition screen 400. FIG. 匿名化対象データ取込画面400を介して匿名化対象データ241を取り込む手順を説明するフローチャートである。It is a flowchart explaining the procedure which takes in the anonymization object data 241 via the anonymization object data acquisition screen. 単純匿名化実行画面500の画面イメージである。It is a screen image of the simple anonymization execution screen 500. 設定ガジェット561の例を示す図である。5 is a diagram illustrating an example of a setting gadget 561. FIG. 設定ガジェット561の例を示す図である。5 is a diagram illustrating an example of a setting gadget 561. FIG. 設定ガジェット561の例を示す図である。5 is a diagram illustrating an example of a setting gadget 561. FIG. 設定ガジェット561の例を示す図である。5 is a diagram illustrating an example of a setting gadget 561. FIG. 単純匿名化実行画面500を介して単純匿名化を実施する手順を説明するフローチャートである。It is a flowchart explaining the procedure of implementing simple anonymization via the simple anonymization execution screen 500. k匿名化設定画面600の画面イメージである。It is a screen image of k anonymization setting screen 600. FIG. k匿名化設定画面600を介してk匿名化に関するパラメータを設定する手順を説明するフローチャートである。12 is a flowchart for explaining a procedure for setting parameters relating to k anonymization via a k anonymization setting screen 600. 一般化階層編集画面700の画面イメージである。7 is a screen image of a generalized hierarchy editing screen 700. k匿名化実行画面800の画面イメージである。It is a screen image of k anonymization execution screen 800. k匿名化実行画面800を介してk匿名化を実行する手順を説明するフローチャートである。10 is a flowchart illustrating a procedure for executing k anonymization via a k anonymization execution screen 800. 匿名化データ出力画面900の画面イメージである。It is a screen image of the anonymization data output screen 900. FIG. 匿名化データ出力画面900を介して匿名化データ246を出力する手順を説明するフローチャートである。10 is a flowchart illustrating a procedure for outputting anonymized data 246 via an anonymized data output screen 900. 計算設定画面1000の画面イメージである。It is a screen image of the calculation setting screen 1000. 計算定義ファイル1100の記載例である。This is a description example of the calculation definition file 1100. 情報量を計算する手順を実装する計算クラスの実装規約を説明するクラス図である。It is a class diagram explaining the implementation rule of the calculation class which implements the procedure which calculates the amount of information. 計算設定画面1000を用いてカスタム計算クラスを登録する手順を説明するフローチャートである。10 is a flowchart illustrating a procedure for registering a custom calculation class using a calculation setting screen 1000. 情報損失率算出部239が各データの情報量を計算する手順を説明するフローチャートである。It is a flowchart explaining the procedure in which the information loss rate calculation part 239 calculates the information amount of each data. 匿名化管理データ243の構成例を示す図である。It is a figure which shows the structural example of the anonymization management data 243. FIG. 匿名化属性管理データ244の構成例を示す図である。It is a figure which shows the structural example of the anonymization attribute management data 244. FIG. 匿名化対象データ241の構成例を示す図である。It is a figure which shows the structural example of the anonymization object data 241. FIG. 一般化階層データ247の構成例を示す図である。6 is a diagram illustrating a configuration example of generalized hierarchical data 247. FIG.

以下、添付図面を参照して本発明の実施形態について説明する。ただし、本実施形態は本発明を実現するための一例に過ぎず、本発明の技術的範囲を限定するものではないことに注意すべきである。本実施形態では、匿名化対象データとしてはアンケートデータを想定するが、これに限るものではない。   Hereinafter, embodiments of the present invention will be described with reference to the accompanying drawings. However, it should be noted that this embodiment is merely an example for realizing the present invention, and does not limit the technical scope of the present invention. In the present embodiment, questionnaire data is assumed as the anonymization target data, but is not limited thereto.

図1は、本発明に係るパーソナル情報匿名化装置の構成を示す図である。パーソナル情報匿名化装置は、受付部200、計算定義設定部210、匿名化装置230、情報管理装置240を備える。受付部200は、ユーザが匿名化の設定や実行などを指示するユーザインタフェースである。計算定義設定部210は、匿名化に伴って発生する情報損失を計算する方法をユーザが定義するユーザインタフェースである。これら装置および機能部はネットワーク220によって接続されている。   FIG. 1 is a diagram showing a configuration of a personal information anonymization apparatus according to the present invention. The personal information anonymization device includes a reception unit 200, a calculation definition setting unit 210, an anonymization device 230, and an information management device 240. The accepting unit 200 is a user interface that instructs the user to set or execute anonymization. The calculation definition setting unit 210 is a user interface that allows a user to define a method for calculating information loss that occurs with anonymization. These devices and functional units are connected by a network 220.

匿名化装置230は、制御部231、データ取込部232、単純匿名化部233、k匿名化部234、k匿名化設定部235、一般化階層編集部236、情報量計算設定部237、匿名化データ出力部238、情報損失率算出部239を備える。   The anonymization device 230 includes a control unit 231, a data capturing unit 232, a simple anonymization unit 233, a k anonymization unit 234, a k anonymization setting unit 235, a generalized hierarchy editing unit 236, an information amount calculation setting unit 237, and anonymity. A data output unit 238 and an information loss rate calculation unit 239.

制御部231は、ユーザの操作を受け付けて各処理を実施する演算機能部である。データ取込部232は、匿名化対象データを取り込んで名前や属性情報などを設定する。単純匿名化部233は、単純匿名化を実施する。k匿名化部234は、匿名化対象データ241を匿名化して匿名化データ246として出力する。k匿名化設定部235は、単純匿名化後のデータに対して実施するk匿名化のパラメータを設定する。一般化階層編集部236は、ユーザが指定した準識別子の一般化階層を編集し保存する。情報量計算設定部237は、計算定義設定部210が受け付けた設定に基づいて情報量の計算方法を設定する。匿名化データ出力部238は、k匿名化されたデータをファイルに出力する。情報損失率算出部239は、情報量計算設定部237による設定に基づいて情報損失率を計算する。   The control unit 231 is an arithmetic function unit that receives a user operation and performs each process. The data capturing unit 232 captures anonymization target data and sets name, attribute information, and the like. The simple anonymization unit 233 performs simple anonymization. The k anonymization unit 234 anonymizes the anonymization target data 241 and outputs it as anonymization data 246. The k anonymization setting unit 235 sets k anonymization parameters to be performed on the data after simple anonymization. The generalized hierarchy editing unit 236 edits and stores the generalized hierarchy of the quasi-identifier specified by the user. The information amount calculation setting unit 237 sets an information amount calculation method based on the setting received by the calculation definition setting unit 210. The anonymized data output unit 238 outputs k anonymized data to a file. The information loss rate calculation unit 239 calculates the information loss rate based on the setting by the information amount calculation setting unit 237.

情報管理装置240は、ハードディスク装置などの記憶装置を用いて構成され、匿名化対象データ241、計算起点データ242、匿名化管理データ243、匿名化属性管理データ244、単純匿名化データ245、匿名化データ246、一般化階層データ247を格納する。   The information management device 240 is configured using a storage device such as a hard disk device, and includes anonymization target data 241, calculation origin data 242, anonymization management data 243, anonymization attribute management data 244, simple anonymization data 245, and anonymization. Data 246 and generalized hierarchical data 247 are stored.

匿名化対象データ241は、匿名化処理前のオリジナルのパーソナル情報である。計算起点データ242は、情報損失率を計算する基準点となるデータである。匿名化管理データ243は、匿名化結果を格納するテーブル名などのメタデータやk匿名化の設定パラメータを保持する。匿名化属性管理データ244は、匿名化対象データ241の属性情報、当該属性に対する準識別子指定、情報量の計算方法などについての設定データである。単純匿名化データ245は、匿名化対象データ241に対して単純匿名化を実施して得られるデータである。匿名化データ246は、単純匿名化データ245に対してk匿名化を実施して得られるデータである。一般化階層データ247は、k匿名化において用いる一般化階層を定義したデータである。   The anonymization target data 241 is original personal information before anonymization processing. The calculation starting point data 242 is data serving as a reference point for calculating the information loss rate. The anonymization management data 243 holds metadata such as a table name for storing an anonymization result and k anonymization setting parameters. The anonymization attribute management data 244 is setting data regarding the attribute information of the anonymization target data 241, the quasi-identifier designation for the attribute, the information amount calculation method, and the like. The simple anonymization data 245 is data obtained by performing simple anonymization on the anonymization target data 241. The anonymization data 246 is data obtained by performing k anonymization on the simple anonymization data 245. The generalized hierarchy data 247 is data defining a generalized hierarchy used in k anonymization.

受付部200は、例えばWebページとして実装してもよいし、Javaのグラフィカルユーザインタフェース部品であるSWT(SWing Toolkit)を用いたクライアントサーバアプリケーションとして実装してもよい。匿名化装置230は、例えば制御部231以外の各機能部をソフトウェアモジュールとして実装し、制御部231がこれを実行することによって実現することもできるし、同様の機能を回路デバイスなどのハードウェアによって実装することにより実現することもできる。情報管理装置240は、例えば関係データベース、キーバリュー型分散データベースなどの形態で実装することができる。   The accepting unit 200 may be implemented as, for example, a Web page, or may be implemented as a client server application using SWT (Swing Talkit), which is a Java graphical user interface component. The anonymization device 230 can be implemented by, for example, mounting each functional unit other than the control unit 231 as a software module, and the control unit 231 executing the same, or a similar function can be realized by hardware such as a circuit device. It can also be realized by mounting. The information management device 240 can be implemented, for example, in the form of a relational database, a key-value type distributed database, or the like.

<受付部200>
図2は、受付部200が表示する匿名化メイン画面300の画面イメージである。匿名化メイン画面300は、データメニュー310、匿名化メニュー320、画面表示エリア330を有する。データメニュー310は、データの入出力を取り扱う操作メニューである。匿名化メニュー320は、匿名化の設定や実行を指示する操作メニューである。画面表示エリア330は、各メニューの選択内容に応じて子画面を表示する。
<Reception unit 200>
FIG. 2 is a screen image of the anonymization main screen 300 displayed by the reception unit 200. The anonymization main screen 300 includes a data menu 310, an anonymization menu 320, and a screen display area 330. The data menu 310 is an operation menu that handles data input / output. The anonymization menu 320 is an operation menu that instructs setting and execution of anonymization. The screen display area 330 displays a sub-screen according to the selection contents of each menu.

データメニュー310は、匿名化対象データ241を取り込むメニュー311と、匿名化データ246をファイル出力するメニュー312とを有する。匿名化メニュー320は、単純匿名化を実行するよう指示するメニュー321、k匿名化のパラメータを設定するよう指示するメニュー322、一般化階層の編集を開始するメニュー323、k匿名化を実行するよう指示するメニュー324を有する。   The data menu 310 includes a menu 311 for importing the anonymization target data 241 and a menu 312 for outputting the anonymization data 246 as a file. The anonymization menu 320 includes a menu 321 for instructing to execute simple anonymization, a menu 322 for instructing to set a parameter for k anonymization, a menu 323 for starting editing of the generalized hierarchy, and an execution of k anonymization. It has a menu 324 for indicating.

<匿名化対象データ取込画面400>
図3は、匿名化対象データ取込画面400の画面イメージである。ユーザが図2におけるメニュー311を選択すると、受付部200は画面表示エリア330内に匿名化対象データ取込画面400を表示する。ユーザは匿名化対象データ取込画面400を用いて、匿名化対象データ241の元データを取り込むとともに、データの名称、データに含まれる列情報、分析対象とする列、分析対象の各列に対する情報量の計算方法などを設定する。画面上の各項目については図4と併せて説明する。
<Anonymization target data capture screen 400>
FIG. 3 is a screen image of the anonymization target data capture screen 400. When the user selects the menu 311 in FIG. 2, the reception unit 200 displays the anonymization target data capture screen 400 in the screen display area 330. The user captures the original data of the anonymization target data 241 using the anonymization target data capture screen 400, and the data name, column information included in the data, columns to be analyzed, information on each column to be analyzed Set the amount calculation method. Each item on the screen will be described in conjunction with FIG.

図4は、匿名化対象データ取込画面400を介して匿名化対象データ241を取り込む手順を説明するフローチャートである。以下図4の各ステップについて説明する。   FIG. 4 is a flowchart for explaining a procedure for fetching the anonymization target data 241 via the anonymization target data fetch screen 400. Hereinafter, each step of FIG. 4 will be described.

(図4:ステップS401〜S402)
ユーザは、匿名化メイン画面300のデータメニュー310からメニュー311(取込)を選択する(S401)。受付部200は、画面表示エリア330内に匿名化対象データ取込画面400を表示する(S402)。
(FIG. 4: Steps S401 to S402)
The user selects the menu 311 (capture) from the data menu 310 of the anonymization main screen 300 (S401). The accepting unit 200 displays the anonymization target data capture screen 400 in the screen display area 330 (S402).

(図4:ステップS403)
ユーザは、匿名化対象データ取込画面400上で、データ名410、データファイル420、列情報430を入力する。データ名410は、取り込むデータを区別するため任意に付与する名称である。データファイル420は、取り込むパーソナル情報を記述したデータファイルのパス名である。列情報430は、データァイル内に含まれるカラムを表示および編集する欄である。データファイル420は、例えばファイルダイアログを開いて取り込むデータファイルを選択することにより指定してもよい。
(FIG. 4: Step S403)
The user inputs a data name 410, a data file 420, and column information 430 on the anonymization target data capture screen 400. The data name 410 is a name arbitrarily given to distinguish the data to be captured. The data file 420 is a path name of a data file describing personal information to be imported. The column information 430 is a column for displaying and editing columns included in the data file. The data file 420 may be specified by, for example, opening a file dialog and selecting a data file to be imported.

(図4:ステップS403:列情報430の詳細)
列情報430は、列名431、型432、分析対象指定433を有する。取り込んだデータファイルが例えばCSV(Comma Separated Value)ファイルである場合、データファイル自身は生のデータのみを記述し、カラムの属性については記述していない。そこでユーザは、列情報430上においてこれら属性情報を指定し、匿名化装置230へ通知する。列名431は各カラムの名称である。型432は各カラムのデータ型である。分析対象指定433は各カラムを分析対象とするか否かを指定する。分析対象指定433をオンにした列についてはさらに、情報量計算方法434と係数435を指定する。情報量計算方法434は、各カラムが有する情報量を計算する方法を指定する欄であり、既定の計算方法のほか、計算定義設定部210を介して設定されたカスタム計算方法を選択することもできる。カスタム計算方法を指定する手順については後述する。係数435は匿名化処理において用いる係数であり、正の実数を指定する。
(FIG. 4: Step S403: Details of the column information 430)
The column information 430 includes a column name 431, a type 432, and an analysis target designation 433. When the captured data file is, for example, a CSV (Comma Separated Value) file, the data file itself describes only raw data and does not describe column attributes. Therefore, the user designates the attribute information on the column information 430 and notifies the anonymization device 230. The column name 431 is the name of each column. A type 432 is a data type of each column. The analysis target designation 433 designates whether or not each column is to be analyzed. An information amount calculation method 434 and a coefficient 435 are further specified for the column for which the analysis target specification 433 is turned on. The information amount calculation method 434 is a field for designating a method for calculating the amount of information included in each column. In addition to the default calculation method, a custom calculation method set via the calculation definition setting unit 210 can be selected. it can. The procedure for specifying the custom calculation method will be described later. The coefficient 435 is a coefficient used in the anonymization process, and specifies a positive real number.

(図4:ステップS404〜S405)
ユーザが各情報を入力した後に取込ボタン440を押すと、受付部200は、データ名410、データファイル420の本体、列情報430を匿名化装置230へ送信し、制御部231はこれらを受信する(S404)。データ取込部232は、データファイル420の本体を匿名化対象データ241として格納する(S405)。
(FIG. 4: Steps S404 to S405)
When the user presses the capture button 440 after inputting each information, the reception unit 200 transmits the data name 410, the main body of the data file 420, and the column information 430 to the anonymization device 230, and the control unit 231 receives them. (S404). The data capturing unit 232 stores the main body of the data file 420 as the anonymization target data 241 (S405).

(図4:ステップS406)
データ取込部232は、匿名化対象データ取込画面400上に入力された値を、匿名化管理データ243と匿名化属性管理データ244に書き込む。これらデータの構成については後述する。本ステップにおいては、匿名化管理データ243にはテーブル名とデータ名だけが書き込まれ、匿名化属性管理データ244には匿名化管理データ243と同じテーブル名を用いて列情報が書き込まれる。テーブル名は、パーソナル情報匿名化装置全体で一意になる名称を自動的に設定する。その他のテーブル名についても同様である。
(FIG. 4: Step S406)
The data capture unit 232 writes the values input on the anonymization target data capture screen 400 in the anonymization management data 243 and the anonymization attribute management data 244. The configuration of these data will be described later. In this step, only the table name and data name are written in the anonymization management data 243, and column information is written in the anonymization attribute management data 244 using the same table name as the anonymization management data 243. As the table name, a name that is unique for the entire personal information anonymization apparatus is automatically set. The same applies to other table names.

(図4:ステップS407〜S408)
データ取込部232は、制御部231に対して処理完了を通知する(S407)。制御部231は、ネットワーク220を経由して受付部200に対して処理完了を通知する(S408)。
(FIG. 4: Steps S407 to S408)
The data fetch unit 232 notifies the control unit 231 of the completion of processing (S407). The control unit 231 notifies the reception unit 200 of the completion of processing via the network 220 (S408).

<単純匿名化実行画面500>
図5Aは、単純匿名化実行画面500の画面イメージである。ユーザが図2におけるメニュー321を選択すると、受付部200は画面表示エリア330内に単純匿名化実行画面500を表示する。ユーザは単純匿名化実行画面500を用いて、単純匿名化に関するパラメータ等を設定し、その設定に基づいて単純匿名化を実行する。画面上の各項目については図6と併せて説明する。
<Simple anonymization execution screen 500>
FIG. 5A is a screen image of the simple anonymization execution screen 500. When the user selects the menu 321 in FIG. 2, the receiving unit 200 displays the simple anonymization execution screen 500 in the screen display area 330. Using the simple anonymization execution screen 500, the user sets parameters related to simple anonymization and executes simple anonymization based on the setting. Each item on the screen will be described in conjunction with FIG.

図5B〜図5Eは、後述する設定ガジェット561の例を示す図である。設定ガジェット561において設定することができる項目は、単純匿名化手法毎に異なる。ただしいずれの手法においても、その手法を適用するカラムを指定する点は共通である。   5B to 5E are diagrams illustrating an example of a setting gadget 561 described later. Items that can be set in the setting gadget 561 differ for each simple anonymization method. However, in any method, the point to specify the column to which the method is applied is common.

図6は、単純匿名化実行画面500を介して単純匿名化を実施する手順を説明するフローチャートである。以下図6の各ステップについて説明する。   FIG. 6 is a flowchart illustrating a procedure for performing simple anonymization via the simple anonymization execution screen 500. Hereinafter, each step of FIG. 6 will be described.

(図6:ステップS601〜S602)
ユーザは、匿名化メイン画面300の匿名化メニュー320からメニュー321を選択する(S601)。受付部200は、画面表示エリア330内に単純匿名化実行画面500を表示する(S602)。
(FIG. 6: Steps S601 to S602)
The user selects the menu 321 from the anonymization menu 320 of the anonymization main screen 300 (S601). The accepting unit 200 displays the simple anonymization execution screen 500 in the screen display area 330 (S602).

(図6:ステップS603)
ユーザは、入力データ名510を入力する。入力データ名510は、匿名化管理データ243が格納している「データ名」の中から選択するようにすることもできる。ユーザは、単純匿名化の結果として出力するデータの名称を、出力データ名520に入力する。ユーザは、単純匿名化において適用する匿名化手法を匿名化手法540から選択して追加ボタン550を押す。選択された単純匿名化手法の設定ガジェット561が匿名化設定560に追加される。
(FIG. 6: Step S603)
The user inputs the input data name 510. The input data name 510 may be selected from “data names” stored in the anonymization management data 243. The user inputs the name of data to be output as a result of simple anonymization in the output data name 520. The user selects an anonymization method to be applied in simple anonymization from the anonymization method 540 and presses the add button 550. The setting gadget 561 of the selected simple anonymization method is added to the anonymization setting 560.

(図6:ステップS603:設定ガジェット561の詳細)
設定ガジェット561は、個々の単純匿名化手法に関するパラメータを設定するGUI(Graphical User Interface)である。設定ガジェット561のタイトル部分をクリックすることにより、設定対象を切り替えることができる。匿名化手法540の中には各匿名化手法に加えて境界564が含まれており、匿名化設定560内に1個(または複数)追加することができる。計算起点データ242は、匿名化対象データ241の最初のカラムから境界564によって区切られる前のカラムまでに対して単純匿名化を実施した結果得られるデータである。ユーザは上ボタン562と下ボタン563を用いて、各匿名化設定や境界564の順番を入れ替えることができる。各匿名化設定を削除するときは、削除する設定ガジェット561を選択して削除ボタン551を押す。ユーザは単純匿名化に関する設定を完了すると、実行ボタン570を押す。
(FIG. 6: Step S603: Details of Setting Gadget 561)
The setting gadget 561 is a GUI (Graphical User Interface) for setting parameters regarding each simple anonymization method. By clicking the title part of the setting gadget 561, the setting target can be switched. The anonymization method 540 includes a boundary 564 in addition to each anonymization method, and one (or a plurality) can be added to the anonymization setting 560. The calculation starting point data 242 is data obtained as a result of performing simple anonymization from the first column of the anonymization target data 241 to the column before being delimited by the boundary 564. The user can change the order of each anonymization setting and the boundary 564 using the upper button 562 and the lower button 563. When deleting each anonymization setting, the setting gadget 561 to be deleted is selected and the delete button 551 is pressed. When the user completes the setting related to simple anonymization, the user presses the execution button 570.

(図6:ステップS604〜S605)
受付部200は、ユーザが単純匿名化実行画面500上で入力した設定パラメータと併せて、単純匿名化を実行するよう指示する命令を、匿名化装置230に対してネットワーク220を経由して送信する(S604)。制御部231は、その命令と設定パラメータを受信し、単純匿名化部233に引き渡す(S605)。
(FIG. 6: Steps S604 to S605)
The receiving unit 200 transmits a command for instructing to execute simple anonymization to the anonymization device 230 via the network 220 together with the setting parameters input by the user on the simple anonymization execution screen 500. (S604). The control unit 231 receives the command and the setting parameter, and delivers them to the simple anonymization unit 233 (S605).

(図6:ステップS606)
単純匿名化部233は、設定ガジェット561が表示されている順にしたがって、境界564以前に設定されている匿名化対象データ241内のカラムに対して単純匿名化を実施し、その結果を計算起点データ242として格納する。計算起点データ242はデータベースのテーブル形式で格納される。単純匿名化部233は、テーブル名を匿名化管理データ243の起点テーブル名として書き込む。
(FIG. 6: Step S606)
In accordance with the order in which the setting gadget 561 is displayed, the simple anonymization unit 233 performs simple anonymization on the column in the anonymization target data 241 set before the boundary 564, and calculates the result as the calculation origin data. Store as 242. The calculation starting point data 242 is stored in a database table format. The simple anonymization unit 233 writes the table name as the starting table name of the anonymization management data 243.

(図6:ステップS607)
単純匿名化部233は、設定ガジェット561が表示されている順にしたがって、境界以後に設定されている計算起点データ242内のカラムに対して単純匿名化処理を実施し、その結果を単純匿名化データ245として格納する。単純匿名化データ245はデータベースのテーブル形式で格納される。単純匿名化部233は、テーブル名と単純匿名化実行画面500上で入力されたデータ名を、それぞれ匿名化管理データ243の単純匿名化テーブル名と単純匿名化データ名として書き込む。
(FIG. 6: Step S607)
In accordance with the order in which the setting gadget 561 is displayed, the simple anonymization unit 233 performs simple anonymization processing on the columns in the calculation origin data 242 set after the boundary, and uses the result as simple anonymization data. Stored as H.245. The simple anonymization data 245 is stored in a database table format. The simple anonymization unit 233 writes the table name and the data name input on the simple anonymization execution screen 500 as the simple anonymization table name and the simple anonymization data name of the anonymization management data 243, respectively.

(図6:ステップS608)
情報損失率算出部239は、計算起点データ242と単純匿名化データ245それぞれの情報量を求め、情報損失率を計算する。情報量の計算手順については後述する。情報損失率は、下記式によって求める。
(FIG. 6: Step S608)
The information loss rate calculation unit 239 calculates the information loss rate by obtaining the information amounts of the calculation origin data 242 and the simple anonymization data 245, respectively. The information amount calculation procedure will be described later. The information loss rate is obtained by the following formula.

Figure 2015170169
Figure 2015170169

(図6:ステップS609〜S611)
単純匿名化部233は、制御部231に対して情報損失率を通知する(S609)。制御部231は、ネットワーク220を経由して、受付部200に対して情報損失率を通知する(S610)。受付部200は、受信した情報損失率を単純匿名化実行画面500の処理結果:情報損失率530に表示する(S611)。
(FIG. 6: Steps S609 to S611)
The simple anonymization unit 233 notifies the control unit 231 of the information loss rate (S609). The control unit 231 notifies the information loss rate to the reception unit 200 via the network 220 (S610). The receiving unit 200 displays the received information loss rate in the processing result of the simple anonymization execution screen 500: the information loss rate 530 (S611).

計算起点データ242の意義について説明する。例えば、匿名化対象データ241が個人の職業に関する情報を保持しており、その職業が業種によって細かく分類されているとする。このとき、分析者は匿名化対象データ241内に含まれる細かい業種の分類を必要とせず、より粗い分類レベルで足りる場合がある。このとき匿名化対象データ241を基準として情報量を計算すると、分析者の想定以上に情報量が大きく損なわれたかのように見える場合がある。分析者の立場からすれば必要なのは粗い分類レベルの業種に関する情報なので、そのレベルまで業種を一般化したとしても、情報量損失はないと考えるのが適切である。計算起点データ242を基準として情報損失率を算出することにより、分析者の立場で必要かつ十分なレベルの情報が確保されている状態を起点として、分析者にとって適切な情報損失率を計算することができる。   The significance of the calculation starting point data 242 will be described. For example, it is assumed that the anonymization target data 241 holds information related to an individual occupation, and the occupation is finely classified according to the type of business. At this time, the analyst does not need to classify the detailed business types included in the anonymization target data 241 and may need a coarser classification level. At this time, if the amount of information is calculated based on the anonymization target data 241, it may appear as if the amount of information is greatly impaired more than the analyst expects. From the analyst's point of view, what is needed is information about the industry at a rough classification level, so even if the industry is generalized to that level, it is appropriate to think that there is no information loss. By calculating the information loss rate on the basis of the calculation starting point data 242, the information loss rate appropriate for the analyst is calculated starting from a state in which the necessary and sufficient level of information is secured from the viewpoint of the analyst. Can do.

<k匿名化設定画面600>
図7は、k匿名化設定画面600の画面イメージである。ユーザが図2におけるメニュー322を選択すると、受付部200は画面表示エリア330内にk匿名化設定画面600を表示する。ユーザはk匿名化設定画面600を用いて、k匿名化に関するパラメータ等を設定する。画面上の各項目については図8と併せて説明する。
<K anonymization setting screen 600>
FIG. 7 is a screen image of the k anonymization setting screen 600. When the user selects the menu 322 in FIG. 2, the reception unit 200 displays the k anonymization setting screen 600 in the screen display area 330. The user uses the k anonymization setting screen 600 to set parameters related to k anonymization. Each item on the screen will be described in conjunction with FIG.

図8は、k匿名化設定画面600を介してk匿名化に関するパラメータを設定する手順を説明するフローチャートである。以下図8の各ステップについて説明する。   FIG. 8 is a flowchart for explaining a procedure for setting parameters relating to k anonymization via the k anonymization setting screen 600. Hereinafter, each step of FIG. 8 will be described.

(図8:ステップS801〜S802)
ユーザは、匿名化メイン画面300の匿名化メニュー320からメニュー322を選択する(S801)。受付部200は、画面表示エリア330内にk匿名化設定画面600を表示する(S802)。
(FIG. 8: Steps S801 to S802)
The user selects the menu 322 from the anonymization menu 320 of the anonymization main screen 300 (S801). The accepting unit 200 displays the k anonymization setting screen 600 in the screen display area 330 (S802).

(図8:ステップS803)
ユーザは、処理対象データ名610を入力する。処理対象データ名610は、匿名化管理データ243が格納している「単純匿名化データ名」の中から選択するようにすることもできる。ユーザは、k匿名化閾値620(2以上の整数)を入力する。ユーザは準識別子として用いるカラムを準識別子634のチェックボックスによって選択し、選択したカラムについてはさらに優先順位635を入力する。連番631、名前632、型633は読取専用である。優先順位635は、k匿名化を実行するときに匿名化処理前の値を保存する優先順位である。言い換えると、一般化階層によって値を置き換えるときに、遷移する階層数をできるだけ小さくしたい準識別子を優先順に指定するものである。準識別子の値は1以上の整数で、値が小さいほど高優先順位となる。ユーザは全ての値を入力すると設定ボタン640を押す。
(FIG. 8: Step S803)
The user inputs the processing target data name 610. The processing target data name 610 may be selected from “simple anonymized data names” stored in the anonymization management data 243. The user inputs k anonymization threshold 620 (an integer of 2 or more). The user selects a column to be used as a quasi-identifier by a check box of the quasi-identifier 634, and inputs a priority 635 for the selected column. The serial number 631, the name 632, and the mold 633 are read-only. The priority order 635 is a priority order for storing values before anonymization processing when k anonymization is executed. In other words, when replacing values by the generalized hierarchy, quasi-identifiers that want to make the number of hierarchy levels to be transitioned as small as possible are specified in order of priority. The value of the quasi-identifier is an integer greater than or equal to 1, and the lower the value, the higher the priority. When the user inputs all values, the user presses the setting button 640.

(図8:ステップS804)
受付部200は、ユーザがk匿名化設定画面600上で入力した各設定パラメータと併せて、これら設定パラメータを記録するよう指示する命令を、匿名化装置230に対してネットワーク220を経由して送信する。制御部231は、その命令と設定パラメータを受信し、k匿名化設定部235に引き渡す。
(FIG. 8: Step S804)
The receiving unit 200 transmits an instruction to record the setting parameters to the anonymization device 230 via the network 220 together with the setting parameters input by the user on the k anonymization setting screen 600. To do. The control unit 231 receives the command and the setting parameter, and passes them to the k anonymization setting unit 235.

(図8:ステップS805)
k匿名化設定部235は、ユーザがk匿名化設定画面600上で入力したk匿名化設定パラメータを各データに書き込む。具体的には以下の通りである。k匿名化閾値620は匿名化管理データ243のk値に書き込まれる。準識別子634によって選択されたカラムについては優先順位635を匿名化属性管理データ244の優先順位に書き込む。準識別子634によって選択されなかったカラムについては0(ゼロ)を匿名化属性管理データ244の優先順位に書き込む。
(FIG. 8: Step S805)
The k anonymization setting unit 235 writes the k anonymization setting parameters input by the user on the k anonymization setting screen 600 in each data. Specifically, it is as follows. The k anonymization threshold 620 is written in the k value of the anonymization management data 243. For the column selected by the quasi-identifier 634, the priority 635 is written in the priority of the anonymized attribute management data 244. For columns not selected by the quasi-identifier 634, 0 (zero) is written in the priority order of the anonymized attribute management data 244.

(図8:ステップS806)
一般化階層編集部236は、準識別子634によって選択されたカラムについて一般化階層を自動生成し、一般化階層データ247として書き込む。具体的な手順としては、例えば特許文献1に示す技術を用いることができる。
(FIG. 8: Step S806)
The generalized hierarchy editing unit 236 automatically generates a generalized hierarchy for the column selected by the semi-identifier 634 and writes it as generalized hierarchy data 247. As a specific procedure, for example, the technique disclosed in Patent Document 1 can be used.

(図8:ステップS807〜S808)
k匿名化設定部235は制御部231に対してk匿名化設定完了を通知する(S807)。制御部231は受付部200に対してネットワーク220経由でk匿名化設定完了を通知する(S808)。
(FIG. 8: Steps S807 to S808)
The k anonymization setting unit 235 notifies the control unit 231 of the completion of k anonymization setting (S807). The control unit 231 notifies the accepting unit 200 of the completion of the k anonymization setting via the network 220 (S808).

<一般化階層編集画面700>
図9は、一般化階層編集画面700の画面イメージである。ユーザが図2におけるメニュー323を選択すると、受付部200は画面表示エリア330内に一般化階層編集画面700を表示する。ユーザは一般化階層編集画面700を用いて、分析に適した匿名化データ246が得られるように一般化階層247を編集し、一般化階層データ247に改めて格納する。
<Generalized hierarchy editing screen 700>
FIG. 9 is a screen image of the generalized hierarchy editing screen 700. When the user selects the menu 323 in FIG. 2, the receiving unit 200 displays the generalized hierarchy editing screen 700 in the screen display area 330. Using the generalized hierarchy editing screen 700, the user edits the generalized hierarchy 247 so as to obtain anonymized data 246 suitable for analysis, and stores it again in the generalized hierarchy data 247.

<k匿名化実行画面800>
図10は、k匿名化実行画面800の画面イメージである。ユーザが図2におけるメニュー324を選択すると、受付部200は画面表示エリア330内にk匿名化実行画面800を表示する。ユーザはk匿名化実行画面800を用いてk匿名化を実行し、その結果を匿名化データ246として出力する。画面上の各項目については図11と併せて説明する。
<K anonymization execution screen 800>
FIG. 10 is a screen image of the k anonymization execution screen 800. When the user selects menu 324 in FIG. 2, reception unit 200 displays k anonymization execution screen 800 in screen display area 330. The user executes k anonymization using the k anonymization execution screen 800 and outputs the result as anonymized data 246. Each item on the screen will be described in conjunction with FIG.

図11は、k匿名化実行画面800を介してk匿名化を実行する手順を説明するフローチャートである。以下図11の各ステップについて説明する。   FIG. 11 is a flowchart illustrating a procedure for executing k anonymization via the k anonymization execution screen 800. Hereinafter, each step of FIG. 11 will be described.

(図11:ステップS1101〜S1102)
ユーザは、匿名化メイン画面300の匿名化メニュー320からメニュー324を選択する(S1101)。受付部200は、画面表示エリア330にk匿名化実行画面800を表示する(S1102)。
(FIG. 11: Steps S1101 to S1102)
The user selects the menu 324 from the anonymization menu 320 of the anonymization main screen 300 (S1101). The accepting unit 200 displays the k anonymization execution screen 800 in the screen display area 330 (S1102).

(図11:ステップS1103)
ユーザは、処理対象データ名810を入力する。処理対象データ名810は、匿名化管理データ243が保持している「単純匿名化データ名」の中から選択するようにすることもできる。ユーザは出力される匿名化データ246のデータ名820を入力し、実行ボタン840を押す。
(FIG. 11: Step S1103)
The user inputs a processing target data name 810. The processing target data name 810 can be selected from “simple anonymized data names” held in the anonymization management data 243. The user inputs the data name 820 of the anonymized data 246 to be output and presses the execution button 840.

(図11:ステップS1104)
受付部200は、ユーザがk匿名化実行画面800上で入力した処理対象データ名810と出力データ名820と併せて、k匿名化を実行するよう指示する命令を、匿名化装置230に対してネットワーク220を経由して送信する。制御部231は、その命令と各データ名を受信し、k匿名化部234に引き渡す。
(FIG. 11: Step S1104)
The receiving unit 200 instructs the anonymization device 230 to instruct to perform k anonymization together with the processing target data name 810 and the output data name 820 input on the k anonymization execution screen 800 by the user. Transmit via the network 220. The control unit 231 receives the command and each data name, and delivers it to the k anonymization unit 234.

(図11:ステップS1105)
k匿名化部234は、匿名化管理データ243のレコードの中から、単純匿名化データ名が処理対象データ名810と合致するレコードを特定する。k匿名化部234は、そのレコードのk値(k匿名化閾値)を満たすような一般化階層のレイヤの組み合わせを算出する。
(FIG. 11: Step S1105)
The k anonymization unit 234 specifies a record whose simple anonymized data name matches the processing target data name 810 from among the records of the anonymization management data 243. The k anonymization unit 234 calculates a combination of layers in the generalized hierarchy that satisfies the k value (k anonymization threshold) of the record.

(図11:ステップS1106)
k匿名化部234は、算出した組み合わせに従って単純匿名化データ245の準識別子の属性値を置き換えたレコードを作成し、匿名化データ246に書き出す。k匿名化閾値を満たすような一般化階層のレイヤの組み合わせについては、公知の技術を用いて求めることができる。匿名化データ246はデータベースのテーブル形式で格納される。k匿名化部234は、テーブル名とk匿名化実行画面800上で入力された出力データ名820を、それぞれ匿名化管理データ243の匿名化テーブル名と匿名化データ名として書き込む。
(FIG. 11: Step S1106)
The k anonymization unit 234 creates a record in which the attribute value of the quasi-identifier of the simple anonymization data 245 is replaced according to the calculated combination, and writes it in the anonymization data 246. A combination of layers in the generalized hierarchy that satisfies the k anonymization threshold can be obtained using a known technique. Anonymized data 246 is stored in a database table format. The k anonymization unit 234 writes the table name and the output data name 820 input on the k anonymization execution screen 800 as the anonymization table name and the anonymization data name of the anonymization management data 243, respectively.

(図11:ステップS1107)
情報損失率算出部239は、計算起点データ242と匿名化データ246それぞれの情報量を求め、情報損失率を計算する。情報量の計算手順については後述する。情報損失率は、下記式によって求める。
(FIG. 11: Step S1107)
The information loss rate calculation unit 239 calculates the information loss rate by obtaining the information amounts of the calculation starting point data 242 and the anonymized data 246, respectively. The information amount calculation procedure will be described later. The information loss rate is obtained by the following formula.

Figure 2015170169
Figure 2015170169

(図11:ステップS1108〜S1110)
k匿名化部234は、制御部231に対して情報損失率を通知する(S1108)。制御部231は、ネットワーク220を経由して、受付部200に対して情報損失率を通知する(S1109)。受付部200は、受信した情報損失率をk匿名化実行画面800の処理結果:情報損失率830に表示する(S1110)。
(FIG. 11: Steps S1108 to S1110)
The k anonymization unit 234 notifies the control unit 231 of the information loss rate (S1108). The control unit 231 notifies the information loss rate to the reception unit 200 via the network 220 (S1109). The accepting unit 200 displays the received information loss rate in the processing result of the k anonymization execution screen 800: information loss rate 830 (S1110).

<匿名化データ出力画面900>
図12は、匿名化データ出力画面900の画面イメージである。ユーザが図2におけるメニュー312を選択すると、受付部200は画面表示エリア330内に匿名化データ出力画面900を表示する。ユーザは匿名化データ出力画面900を用いてk匿名化が完了した匿名化データ246(例えばCSV形式)を出力する。画面上の各項目については図13と併せて説明する。
<Anonymized data output screen 900>
FIG. 12 is a screen image of the anonymized data output screen 900. When the user selects the menu 312 in FIG. 2, the receiving unit 200 displays the anonymized data output screen 900 in the screen display area 330. Using the anonymized data output screen 900, the user outputs anonymized data 246 (for example, CSV format) for which k anonymization has been completed. Each item on the screen will be described in conjunction with FIG.

図13は、匿名化データ出力画面900を介して匿名化データ246を出力する手順を説明するフローチャートである。以下図13の各ステップについて説明する。   FIG. 13 is a flowchart for explaining the procedure for outputting the anonymized data 246 via the anonymized data output screen 900. Hereinafter, each step of FIG. 13 will be described.

(図13:ステップS1301〜S1303)
ユーザは、匿名化メイン画面300のデータメニュー310からメニュー312を選択する(S1301)。受付部200は、画面表示エリア330に匿名化データ出力画面900を表示する(S1302)。ユーザは、出力対象データ名910を入力して出力ボタン920を押す(S1303)。出力対象データ名910は、k匿名化が完了した匿名化データ246の名称から選択できるようにしてもよい。
(FIG. 13: Steps S1301 to S1303)
The user selects the menu 312 from the data menu 310 of the anonymization main screen 300 (S1301). The accepting unit 200 displays the anonymized data output screen 900 in the screen display area 330 (S1302). The user inputs the output target data name 910 and presses the output button 920 (S1303). The output target data name 910 may be selected from the name of the anonymized data 246 for which k anonymization has been completed.

(図13:ステップS1304)
受付部200は、ユーザが匿名化データ出力画面900上で入力した出力対象データ名910と併せて、ネットワーク220を経由してデータ出力命令を匿名化装置230に対して送信する。制御部231は、その命令と出力対象データ名910を受信し、匿名化データ出力部238に引き渡す。
(FIG. 13: Step S1304)
The receiving unit 200 transmits a data output command to the anonymization device 230 via the network 220 together with the output target data name 910 input on the anonymized data output screen 900 by the user. The control unit 231 receives the command and the output target data name 910 and passes them to the anonymized data output unit 238.

(図13:ステップS1305〜S1307)
匿名化データ出力部238は、出力対象データ名910によって指定される匿名化データ246のレコードを読み出してファイル出力する(S1305)。匿名化データ出力部238は、出力したファイルを制御部231に返す(S1306)。制御部231は、匿名化データ出力部238から受信したファイルを、ネットワーク220を経由して受付部200へ転送する(S1307)。
(FIG. 13: Steps S1305 to S1307)
The anonymized data output unit 238 reads the record of the anonymized data 246 designated by the output target data name 910 and outputs the file (S1305). The anonymized data output unit 238 returns the output file to the control unit 231 (S1306). The control unit 231 transfers the file received from the anonymized data output unit 238 to the reception unit 200 via the network 220 (S1307).

(図13:ステップS1308)
受付部200は、転送されたファイルを受信し、匿名化データ出力画面900上でファイル保存ダイアログを開く。ユーザはファイル保存ダイアログ上でファイルの保存先を指定する。受付部200は、指定されたファイル名でファイルを保存する。
(FIG. 13: Step S1308)
The accepting unit 200 receives the transferred file and opens a file save dialog on the anonymized data output screen 900. The user designates a file save destination on the file save dialog. The accepting unit 200 saves the file with the specified file name.

<計算設定画面1000>
図14は、計算設定画面1000の画面イメージである。計算定義設定部210は、受付部200と同様に例えばWebアプリケーションとして実装することができる。計算定義設定部210は、計算設定画面1000を提供する。計算設定画面1000は、情報量を計算する手順を実装したカスタム計算モジュールを登録するために用いる画面である。画面上の各項目については図17と併せて説明する。
<Calculation setting screen 1000>
FIG. 14 is a screen image of the calculation setting screen 1000. The calculation definition setting unit 210 can be implemented as a Web application, for example, as with the receiving unit 200. The calculation definition setting unit 210 provides a calculation setting screen 1000. The calculation setting screen 1000 is a screen used for registering a custom calculation module that implements a procedure for calculating the amount of information. Each item on the screen will be described in conjunction with FIG.

<計算定義ファイル1100>
図15は、計算定義ファイル1100の記載例である。計算定義ファイル1100は、情報量の計算方法の名称とその計算方法を実装したJavaクラス名を記述するテキストファイルである。計算方法の名称は、”anonymize.calculation.class.”に、計算設定画面1000上で入力された計算方法の名称1010を連結したものである。計算方法を実装したJavaクラスは、後述するICalculatorインタフェースを実装しており、完全修飾名で記述される。
<Calculation definition file 1100>
FIG. 15 is a description example of the calculation definition file 1100. The calculation definition file 1100 is a text file that describes the name of the information amount calculation method and the Java class name that implements the calculation method. The name of the calculation method is obtained by concatenating the name of the calculation method 1010 input on the calculation setting screen 1000 to “anonymize.calculation.class.”. The Java class that implements the calculation method implements an ICalculator interface, which will be described later, and is described with a fully qualified name.

<計算クラスの実装規約>
図16は、情報量を計算する手順を実装する計算クラスの実装規約を説明するクラス図である。計算クラスは、情報量を計算するメソッドを定義するICalculatorインタフェースを実装する必要がある。このインタフェースはメソッドcalculateを持つ。このメソッドは、テーブル名と列名を引数として受け取り、引数によって指定されたテーブル:列の情報量を計算して倍精度浮動小数点数として返す。DefaultCalculatorクラスは、ICalculatorインタフェースを実装した上で既定の計算方法を実装したクラスである。カスタム計算方法を用いることを指定しなかったカラムについては、情報量計算設定部237はDefaultCalculatorクラスを用いて情報量を計算する。
<Calculation class implementation rules>
FIG. 16 is a class diagram for explaining an implementation rule of a calculation class that implements a procedure for calculating an information amount. The calculation class needs to implement an ICalculator interface that defines a method for calculating the amount of information. This interface has a method calculate. This method receives the table name and column name as arguments, calculates the information amount of the table: column specified by the argument, and returns it as a double-precision floating point number. The DefaultCalculator class is a class that implements a predetermined calculation method after implementing the ICalculator interface. For columns that are not designated to use the custom calculation method, the information amount calculation setting unit 237 calculates the information amount by using the DefaultCalculator class.

<計算設定画面1000の動作>
図17は、計算設定画面1000を用いてカスタム計算クラスを登録する手順を説明するフローチャートである。以下図17の各ステップについて説明する。
<Operation of calculation setting screen 1000>
FIG. 17 is a flowchart illustrating a procedure for registering a custom calculation class using the calculation setting screen 1000. Hereinafter, each step of FIG. 17 will be described.

(図17:ステップS1701〜S1702)
ユーザは、計算方法名1010、計算モジュール1020、計算クラス名1030を入力する(S1701)。計算方法名1010は、カスタム計算方法の識別名であり、情報量計算方法434に対応する。計算モジュール1020は、計算方法を実装したJavaクラスを含むjarファイルである。計算クラス名1030は、そのjarファイル内に含まれる、計算方法を実装したJavaクラスの完全修飾名である。ユーザは各項目を入力し、登録ボタン1040を押す(S1702)。
(FIG. 17: Steps S1701 to S1702)
The user inputs a calculation method name 1010, a calculation module 1020, and a calculation class name 1030 (S1701). The calculation method name 1010 is an identification name of the custom calculation method, and corresponds to the information amount calculation method 434. The calculation module 1020 is a jar file including a Java class that implements a calculation method. The calculation class name 1030 is a fully qualified name of the Java class that includes the calculation method and is included in the jar file. The user inputs each item and presses the registration button 1040 (S1702).

(図17:ステップS1703)
計算定義設定部210は、ネットワーク220を経由して、各項目を匿名化装置230へ転送する。情報量計算設定部237は、計算モジュール1020で指定したファイルを匿名化装置230のJavaクラスライブラリに追加する。
(FIG. 17: Step S1703)
The calculation definition setting unit 210 transfers each item to the anonymization device 230 via the network 220. The information amount calculation setting unit 237 adds the file specified by the calculation module 1020 to the Java class library of the anonymization device 230.

(図17:ステップS1704)
情報量計算設定部237は、計算定義ファイル1100にエントリを追加する。エントリのキーは、anonymize.calculation.class.<計算方法名1010>である。エントリの値は、計算クラス名1030である。
(FIG. 17: Step S1704)
The information amount calculation setting unit 237 adds an entry to the calculation definition file 1100. The key of the entry is anonymous. calculation. class. <Calculation method name 1010>. The value of the entry is a calculation class name 1030.

(図17:ステップS1705〜S1706)
情報量計算設定部237は、制御部231に処理完了を通知する(S1705)。制御部231は、計算定義設定部210に対してネットワーク220を経由して処理完了を通知する(S1706)。
(FIG. 17: Steps S1705 to S1706)
The information amount calculation setting unit 237 notifies the control unit 231 of the completion of processing (S1705). The control unit 231 notifies the calculation definition setting unit 210 of the completion of processing via the network 220 (S1706).

<カスタム計算クラスの実装例>
以下ではCustomCalculatorクラスのメソッドcalculateの実装例を説明する。例えば医療分野において、年齢は分析に意味のある項目であるので情報量の計算対象として考えられる。一方で、年齢の数値を四捨五入するような単純匿名化を施すことを考えたとき、単純匿名化後に年齢の数値が取る値の個数は、匿名化前に比べて10分の1程度になる。この条件下で情報量を計算した場合、情報損失が大きくなりすぎる場合がある。そこで、匿名化前後の年齢誤差を情報量に盛り込んだ情報量を考える。肉体の成長という観点からは、同じ1歳差でも高齢ほど誤差が小さいと考えられるので、年齢の逆数を利用し、以下のような情報量を考えることができる。この式のlogは2を底とする対数関数であるが、パーソナル情報匿名化装置全体で統一されていれば1を超える任意の実数を底として用いてもよい。
<Custom calculation class implementation example>
Hereinafter, an implementation example of the method “calculate” of the CustomCalculator class will be described. For example, in the medical field, age is a meaningful item for analysis, and thus can be considered as an information amount calculation target. On the other hand, when considering the simple anonymization that rounds off the numerical value of the age, the number of values that the numerical value of the age takes after the simple anonymization is about 1/10 of that before the anonymization. If the amount of information is calculated under these conditions, information loss may become too large. Therefore, consider an information amount that incorporates the age error before and after anonymization into the information amount. From the viewpoint of the growth of the body, the error is considered to be smaller as the age increases even with the same age difference, so the following information amount can be considered using the reciprocal of age. The log in this equation is a logarithmic function with 2 as the base, but any real number exceeding 1 may be used as the base as long as it is unified throughout the personal information anonymization apparatus.

Figure 2015170169
Figure 2015170169

<情報量を計算する手順>
図18は、情報損失率算出部239が各データの情報量を計算する手順を説明するフローチャートである。以下図18の各ステップについて説明する。
<Procedure for calculating the amount of information>
FIG. 18 is a flowchart for explaining a procedure by which the information loss rate calculation unit 239 calculates the information amount of each data. Hereinafter, each step of FIG. 18 will be described.

(図18:ステップS1801)
情報損失率算出部239は、各カラムの情報量の計算方法を匿名化属性管理データ244から取得する。例えば、匿名化データ246に対する情報量を計算したいときは、該当する匿名化データ246のテーブル名をキーにして、匿名化管理データ243から計算対象データを格納したテーブル名を取得し、そのテーブル名をキーにして匿名化属性管理データ244からレコードを取得する。
(FIG. 18: Step S1801)
The information loss rate calculation unit 239 obtains the information amount calculation method for each column from the anonymized attribute management data 244. For example, when calculating the amount of information for the anonymized data 246, the table name storing the calculation target data is obtained from the anonymized management data 243 using the table name of the corresponding anonymized data 246 as a key, and the table name As a key, a record is acquired from the anonymized attribute management data 244.

(図18:ステップS1802〜S1803)
情報損失率算出部239は、情報量の値を0で初期化する(S1802)。情報損失率算出部239は、匿名化属性管理データ244から取得した各カラムについて、ステップS1804〜S1807を実施する(S1803)。
(FIG. 18: Steps S1802 to S1803)
The information loss rate calculation unit 239 initializes the information amount value to 0 (S1802). The information loss rate calculation unit 239 performs Steps S1804 to S1807 for each column acquired from the anonymized attribute management data 244 (S1803).

(図18:ステップS1804〜S1805)
情報損失率算出部239は、匿名化属性管理データ244のレコードからテーブル名、属性名、計算方法、係数を読み出す(S1804)。情報損失率算出部239は、ステップS1804で読み出した計算方法をキーにして、計算定義ファイル1100から計算方法を実装するクラスの完全修飾名を取得する(S1805)。
(FIG. 18: Steps S1804 to S1805)
The information loss rate calculation unit 239 reads the table name, attribute name, calculation method, and coefficient from the record of the anonymized attribute management data 244 (S1804). The information loss rate calculation unit 239 acquires the fully qualified name of the class implementing the calculation method from the calculation definition file 1100 using the calculation method read in step S1804 as a key (S1805).

(図18:ステップS1806)
情報損失率算出部239は、ステップS1805で取得したクラスの完全修飾名を用いて、ICalculatorインタフェースを実装するカスタム計算クラスのインスタンスを取得する。
(FIG. 18: Step S1806)
The information loss rate calculation unit 239 acquires an instance of a custom calculation class that implements the ICalculator interface using the fully qualified name of the class acquired in step S1805.

(図18:ステップS1807)
情報損失率算出部239は、そのインスタンスに対して、ステップS1804で取得したテーブル名と属性名を渡し、計算結果を得る。情報損失率算出部239は、その結果に対してステップS1804で取得した係数を乗じて得られる値を、現在の情報量値に加算する。
(FIG. 18: Step S1807)
The information loss rate calculation unit 239 passes the table name and attribute name acquired in step S1804 to the instance, and obtains a calculation result. The information loss rate calculation unit 239 adds a value obtained by multiplying the result by the coefficient acquired in step S1804 to the current information amount value.

(図18:ステップS1808)
情報損失率算出部239は、ステップS1804からステップS1807までのループの処理が完了したあと、最終的な情報量の値を返す。
(FIG. 18: Step S1808)
The information loss rate calculation unit 239 returns the final information amount value after the loop processing from step S1804 to step S1807 is completed.

<テーブル構成>
図19は、匿名化管理データ243の構成例を示す図である。匿名化対象データ241などの各データは、処理の便宜上、関係データベースのテーブル形式で格納することが望ましい。匿名化装置230の各機能部は、これらデータを格納する一意のテーブル名を自動的に生成し、そのテーブルに各データを格納する。匿名化管理データ243は、どのテーブルにどのデータが格納されているかを管理するために用いられる。
<Table configuration>
FIG. 19 is a diagram illustrating a configuration example of the anonymization management data 243. Each data such as the anonymization target data 241 is preferably stored in a table format of a relational database for convenience of processing. Each functional unit of the anonymization device 230 automatically generates a unique table name for storing these data, and stores each data in the table. The anonymization management data 243 is used for managing which data is stored in which table.

図20は、匿名化属性管理データ244の構成例を示す図である。匿名化属性管理データ244は、匿名化対象データ取込画面400とk匿名化設定画面600で設定したパラメータを管理するテーブルである。   FIG. 20 is a diagram illustrating a configuration example of the anonymized attribute management data 244. The anonymization attribute management data 244 is a table for managing parameters set on the anonymization target data capture screen 400 and the k anonymization setting screen 600.

図21は、匿名化対象データ241の構成例を示す図である。ここではテーブル形式で格納した後のデータ形式を例示した。計算起点データ242、単純匿名化データ245、匿名化データ246も同様の構成を有する。これらテーブルの構成は、取り込むデータのカラム数などによって異なる。   FIG. 21 is a diagram illustrating a configuration example of the anonymization target data 241. Here, the data format after being stored in the table format is illustrated. The calculation starting point data 242, the simple anonymization data 245, and the anonymization data 246 have the same configuration. The configuration of these tables differs depending on the number of columns of data to be captured.

図22は、一般化階層データ247の構成例を示す図である。一般化階層データ247は、図9で例示した一般化階層の構成を記録するデータである。   FIG. 22 is a diagram illustrating a configuration example of the generalized hierarchy data 247. As illustrated in FIG. The generalized hierarchy data 247 is data for recording the configuration of the generalized hierarchy exemplified in FIG.

本発明は上記した実施形態に限定されるものではなく、様々な変形例が含まれる。上記実施形態は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。   The present invention is not limited to the embodiments described above, and includes various modifications. The above embodiment has been described in detail for easy understanding of the present invention, and is not necessarily limited to the one having all the configurations described.

上記各構成、機能、処理部、処理手段等は、それらの一部や全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、上記の各構成、機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現してもよい。各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリ、ハードディスク、SSD(Solid State Drive)等の記録装置、ICカード、SDカード、DVD等の記録媒体に格納することができる。   Each of the above-described configurations, functions, processing units, processing means, and the like may be realized in hardware by designing a part or all of them, for example, with an integrated circuit. Each of the above-described configurations, functions, and the like may be realized by software by interpreting and executing a program that realizes each function by the processor. Information such as programs, tables, and files for realizing each function can be stored in a recording device such as a memory, a hard disk, an SSD (Solid State Drive), or a recording medium such as an IC card, an SD card, or a DVD.

本実施形態においては、境界564を1つのみ追加する例を説明したが、複数の境界564を設定できるようにしてもよい。この場合は、例えば単純匿名化実行画面500上において計算起点データ242の対象とするカラムとそうでないカラムを選択できるようにしてもよい。   In the present embodiment, an example in which only one boundary 564 is added has been described, but a plurality of boundaries 564 may be set. In this case, for example, on the simple anonymization execution screen 500, a column that is the target of the calculation origin data 242 and a column that is not so may be selected.

200:受付部、210:計算定義設定部、230:匿名化装置、231:制御部、232:データ取込部、233:単純匿名化部、234:k匿名化部、235:k匿名化設定部、236:一般化階層編集部、237:情報量計算設定部、238:匿名化データ出力部、239:情報損失率算出部、240:情報管理装置、241:匿名化対象データ、242:計算起点データ、243:匿名化管理データ、244:匿名化属性管理データ、245:単純匿名化データ、246:匿名化データ、247:一般化階層データ。   200: reception unit, 210: calculation definition setting unit, 230: anonymization device, 231: control unit, 232: data capture unit, 233: simple anonymization unit, 234: k anonymization unit, 235: k anonymization setting 236: Generalized hierarchy editing unit 237: Information amount calculation setting unit 238: Anonymized data output unit 239: Information loss rate calculation unit 240: Information management device 241: Anonymization target data 242: Calculation Origin data, 243: Anonymized management data, 244: Anonymized attribute management data, 245: Simple anonymized data, 246: Anonymized data, 247: Generalized hierarchical data.

Claims (6)

パーソナル情報を匿名化する処理をコンピュータに実行させるプログラムであって、前記コンピュータに、
前記パーソナル情報に対して単純匿名化を実施することにより得られる単純匿名化データを出力する単純匿名化ステップ、
前記単純匿名化データに対してk匿名化を実施することにより得られるk匿名化データを出力するk匿名化ステップ、
匿名化を実施することにより損なわれる情報の損失率を算出するための基準点を設定する情報量計算設定ステップ、
前記損失率を算出する情報損失率算出ステップ、
を実行させ、
前記情報量計算設定ステップにおいては、前記コンピュータに、
前記パーソナル情報のうち前記単純匿名化ステップにおいて単純匿名化を実施する部分と実施しない部分との間の境界を前記基準点として設定させ、
前記情報損失率算出ステップにおいては、前記コンピュータに、
前記k匿名化ステップにおける前記損失率を算出するときは、前記基準点にしたがって単純匿名化を実施することにより得られる計算起点データの情報量と、前記k匿名化データの情報量との間の比率に基づき、前記損失率を算出させる
ことを特徴とするパーソナル情報匿名化プログラム。
A program for causing a computer to execute processing for anonymizing personal information, wherein the computer
A simple anonymization step for outputting simple anonymization data obtained by performing simple anonymization on the personal information;
K anonymization step for outputting k anonymization data obtained by performing k anonymization on the simple anonymization data;
Information amount calculation setting step for setting a reference point for calculating a loss rate of information lost by carrying out anonymization,
An information loss rate calculating step for calculating the loss rate;
And execute
In the information amount calculation setting step, in the computer,
In the personal information, in the simple anonymization step, the boundary between the portion that performs simple anonymization and the portion that does not perform is set as the reference point,
In the information loss rate calculating step, the computer
When calculating the loss rate in the k anonymization step, between the information amount of the calculation origin data obtained by carrying out simple anonymization according to the reference point and the information amount of the k anonymization data The personal information anonymization program characterized by calculating said loss rate based on a ratio.
前記情報損失率算出ステップにおいては、前記コンピュータに、
前記単純匿名化ステップにおける前記損失率を算出するときは、前記計算起点データの情報量と、前記境界によらず前記パーソナル情報全体に対して単純匿名化を実施することにより得られる前記単純匿名化データの情報量との間の比率に基づき、前記損失率を算出させる
ことを特徴とする請求項1記載のパーソナル情報匿名化プログラム。
In the information loss rate calculating step, the computer
When calculating the loss rate in the simple anonymization step, the amount of information of the calculation origin data and the simple anonymization obtained by performing simple anonymization on the entire personal information regardless of the boundary The personal information anonymization program according to claim 1, wherein the loss rate is calculated based on a ratio between the amount of data information.
前記単純匿名化データまたは前記k匿名化データは、1以上のカラムを有しており、
前記パーソナル情報匿名化プログラムは、前記コンピュータに、
前記単純匿名化データの情報量または前記k匿名化データの情報量を計算する手順を前記カラム毎に定義する計算手順定義ステップを実行させる
ことを特徴とする請求項1記載のパーソナル情報匿名化プログラム。
The simple anonymization data or the k anonymization data has one or more columns,
The personal information anonymization program is stored in the computer.
The personal information anonymization program according to claim 1, wherein a calculation procedure defining step for defining a procedure for calculating an information amount of the simple anonymization data or an information amount of the k anonymization data is executed for each column. .
前記計算手順定義ステップにおいては、前記コンピュータに、
前記手順を実装したカスタム計算プログラムモジュールを前記カラム毎に指定する指示を受け取りその指示にしたがって前記カスタム計算プログラムモジュールを前記手順に反映するステップを実行させる
ことを特徴とする請求項3記載のパーソナル情報匿名化プログラム。
In the calculation procedure definition step, the computer
4. The personal information according to claim 3, wherein an instruction to specify a custom calculation program module that implements the procedure for each column is received and a step of reflecting the custom calculation program module in the procedure is executed according to the instruction. Anonymization program.
前記パーソナル情報匿名化プログラムは、前記単純匿名化データの情報量または前記k匿名化データの情報量を計算する処理を実装した計算プログラムモジュールを備え、
前記計算プログラムモジュールは、前記単純匿名化データの情報量または前記k匿名化データの情報量を計算する処理を呼び出すプログラムインターフェースと、前記プログラムインターフェースを介して規定の計算手順を実施する処理を実装したデフォルト計算プログラムモジュールと、を備え、
前記計算手順定義ステップにおいては、前記コンピュータに、
前記プログラムインターフェースを介して前記単純匿名化データの情報量または前記k匿名化データの情報量を計算する処理を実装した前記カスタム計算プログラムを、前記デフォルト計算プログラムモジュールに代えて用いさせる
ことを特徴とする請求項4記載のパーソナル情報匿名化プログラム。
The personal information anonymization program includes a calculation program module that implements a process for calculating the information amount of the simple anonymization data or the information amount of the k anonymization data,
The calculation program module implements a program interface for calling a process for calculating the information amount of the simple anonymized data or the information amount of the k anonymized data, and a process for executing a prescribed calculation procedure via the program interface. A default calculation program module, and
In the calculation procedure definition step, the computer
The custom calculation program in which the processing for calculating the information amount of the simple anonymization data or the information amount of the k anonymization data is implemented via the program interface is used instead of the default calculation program module. The personal information anonymization program according to claim 4.
パーソナル情報を匿名化する装置であって、
前記パーソナル情報に対して単純匿名化を実施することにより得られる単純匿名化データを出力する単純匿名化部、
前記単純匿名化データに対してk匿名化を実施することにより得られるk匿名化データを出力するk匿名化部、
匿名化を実施することにより損なわれる情報の損失率を算出するための基準点を設定する情報量計算設定部、
前記損失率を算出する情報損失率算出部、
を備え、
前記情報量計算設定部は、前記パーソナル情報のうち前記単純匿名化部が単純匿名化を実施する部分と実施しない部分との間の境界を前記基準点として設定し、
前記情報損失率算出部は、
前記k匿名化部による前記損失率を算出するときは、前記基準点にしたがって単純匿名化を実施することにより得られる計算起点データの情報量と、前記k匿名化データの情報量との間の比率に基づき、前記損失率を算出する
ことを特徴とするパーソナル情報匿名化装置。
A device for anonymizing personal information,
A simple anonymization unit that outputs simple anonymization data obtained by performing simple anonymization on the personal information;
K anonymization unit that outputs k anonymization data obtained by performing k anonymization on the simple anonymization data;
An information amount calculation setting unit that sets a reference point for calculating a loss rate of information that is impaired by anonymization,
An information loss rate calculation unit for calculating the loss rate,
With
The information amount calculation setting unit sets, as the reference point, a boundary between a portion of the personal information where the simple anonymization unit performs simple anonymization and a portion where it is not performed,
The information loss rate calculation unit
When calculating the loss rate by the k anonymization unit, between the information amount of the calculation origin data obtained by carrying out simple anonymization according to the reference point, and the information amount of the k anonymization data The personal information anonymization device, wherein the loss rate is calculated based on a ratio.
JP2014045022A 2014-03-07 2014-03-07 Personal information anonymization program and personal information anonymization device Pending JP2015170169A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014045022A JP2015170169A (en) 2014-03-07 2014-03-07 Personal information anonymization program and personal information anonymization device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014045022A JP2015170169A (en) 2014-03-07 2014-03-07 Personal information anonymization program and personal information anonymization device

Publications (1)

Publication Number Publication Date
JP2015170169A true JP2015170169A (en) 2015-09-28

Family

ID=54202847

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014045022A Pending JP2015170169A (en) 2014-03-07 2014-03-07 Personal information anonymization program and personal information anonymization device

Country Status (1)

Country Link
JP (1) JP2015170169A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2020235017A1 (en) * 2019-05-21 2020-11-26
WO2020235015A1 (en) * 2019-05-21 2020-11-26 日本電信電話株式会社 Information processing device, information processing method, and program
CN112119470A (en) * 2018-03-28 2020-12-22 伊坎西奈山医学院 System and method for processing connectivity values between sub-processing regions

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112119470A (en) * 2018-03-28 2020-12-22 伊坎西奈山医学院 System and method for processing connectivity values between sub-processing regions
JP2021519173A (en) * 2018-03-28 2021-08-10 アイカーン スクール オブ メディスン アット マウント シナイ Systems and methods for processing association values between sub-processing areas
JP7331005B2 (en) 2018-03-28 2023-08-22 アイカーン スクール オブ メディスン アット マウント シナイ Systems and methods for processing association values between sub-processing regions
US11862338B2 (en) 2018-03-28 2024-01-02 Click Therapeutics, Inc. Systems and methods for processing connectivity values between sub-processing regions
CN112119470B (en) * 2018-03-28 2024-03-12 伊坎西奈山医学院 System and method for processing connectivity values between sub-processing regions
JPWO2020235017A1 (en) * 2019-05-21 2020-11-26
WO2020235017A1 (en) * 2019-05-21 2020-11-26 日本電信電話株式会社 Information processing device, information processing method, and program
WO2020235015A1 (en) * 2019-05-21 2020-11-26 日本電信電話株式会社 Information processing device, information processing method, and program
JPWO2020235015A1 (en) * 2019-05-21 2020-11-26
JP7151886B2 (en) 2019-05-21 2022-10-12 日本電信電話株式会社 Information processing device, information processing method and program
JP7168076B2 (en) 2019-05-21 2022-11-09 日本電信電話株式会社 Information processing device, information processing method and program

Similar Documents

Publication Publication Date Title
US9230132B2 (en) Anonymization for data having a relational part and sequential part
Al-Sai et al. Big data impacts and challenges: a review
US10848501B2 (en) Real time pivoting on data to model governance properties
CN109074537A (en) The lazy of template generates
US10037315B2 (en) Using form fields as dimensions to define consumer segments for which form interactivity metrics can be analyzed
US20220188217A1 (en) Methods and systems for content management and testing
CN107004008A (en) Recognized using the associated documents of the automation inquiry to different data storage locations
US20160306999A1 (en) Systems, methods, and computer-readable media for de-identifying information
US9304746B2 (en) Creating a user model using component based approach
Forsberg et al. Analyzing PACS usage patterns by means of process mining: steps toward a more detailed workflow analysis in radiology
US20160147840A1 (en) System for retrieving, visualizing and editing semantic annotations
CN107908657A (en) Querying method, device, computer equipment and the storage medium of bordereau
US11120200B1 (en) Capturing unstructured information in application pages
JP2015046030A (en) Personal information anonymization system
US10628796B2 (en) Systems and processes of importing and comparing benefit options
US20140208437A1 (en) Anonymization device, anonymization method and recording medium recording program therefor
Sha M et al. Cloud-based Healthcare data management Framework
Ramezani et al. Supporting domain experts to select and configure precise compliance rules
JP2015170169A (en) Personal information anonymization program and personal information anonymization device
CN105868216A (en) Method for realizing object expiration operation and device and equipment
US9990348B2 (en) System and method for managing data using a spreadsheet model
Martin Using indoor location system data to enhance the quality of healthcare event logs: opportunities and challenges
US20180101571A1 (en) Data flow modeling and execution
US11751800B2 (en) Seizure detection using contextual motion
US11978542B2 (en) Enabling the centralization of medical derived data for artificial intelligence implementations