JP2013161428A - 個人情報匿名化装置および方法 - Google Patents
個人情報匿名化装置および方法 Download PDFInfo
- Publication number
- JP2013161428A JP2013161428A JP2012025203A JP2012025203A JP2013161428A JP 2013161428 A JP2013161428 A JP 2013161428A JP 2012025203 A JP2012025203 A JP 2012025203A JP 2012025203 A JP2012025203 A JP 2012025203A JP 2013161428 A JP2013161428 A JP 2013161428A
- Authority
- JP
- Japan
- Prior art keywords
- attribute
- personal information
- value
- anonymization
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
一つの属性に対して複数の属性値を持つ属性が含まれる個人情報の匿名化装置ならびに方法を提供する。
【解決手段】
一つの属性に複数の属性値が格納される属性を含む個人情報の識別情報と、複数の属性値を有する属性の識別情報との対応関係を示す情報に基づいて、複数の属性値を含む個人の情報を単独の属性値のみで構成される複数のレコードに分割したデータを生成し、当該データに対して匿名化を実施し、さらに、匿名化後のデータを、複数属性値をもつ属性に対しては匿名化後の情報を連結し、属性値が一つのみであった属性に対しては最も抽象化レベルが大きい属性値にあわせて情報を統合する。
【選択図】 図1
Description
図1を参照し、実施例1の技術を実現する装置の構成例を説明する。
図1において、計算機100は、例えばPC(Personal Computer)やサーバ、ワークステーション等の任意の情報処理装置である。計算機100はCPU(Central Processing Unit)101、メモリ102、ストレージ103、入力装置104、出力装置105、通信装置106等を有する。これらは全て、バスなどの内部通信線107により互いに接続されている。
図2において、個人情報テーブル131は複数のレコードを有する。個人情報テーブル131の左側に示したNoは、各レコード、即ち、各個人情報を識別する番号である。各レコードは属性201、属性202、属性203の属性値のタプルとして表される。
匿名化数601は、匿名情報テーブル132の各レコードに対して、同一タプルを持つレコードが少なくとも何件存在するように匿名化するかを示す。匿名化数の値は任意でよく、値が大きくなるほど匿名性は高くなる。この数値は求められる匿名性の強さに応じて外部から与えることができる。
一般化階層木テーブル134は、匿名化部122が個人情報分割テーブル124の情報を抽象化する際に利用するものであり、属性値をどのように階層的に(段階的に)抽象化するかを示す情報を格納する。図7Aは属性201「年齢」に対する一般化階層木134の概念図、図7Bは一般化階層木テーブル134の一例を示す。
一般化階層木テーブル134は属性711、及び属性712を持つ。一般化階層木テーブル134のレコードは一般化階層木の1つの節点を示す。属性711は当該節点のラベル、属性712は当該節点の親節点のラベルを意味する。例えば、レコード713は節点702に対応する。根は親を持たないため、属性712にはNULLを格納する。
ステップS1010では、iにi+1を代入し、ステップS1002の判定処理に戻る。
ステップS1011では、匿名情報テーブル132に匿名情報分割テーブル126の統合結果を格納する。
次に、実施例2について説明する。
実施例2は、メモリ使用量を軽減するものである。以下、実施例2を説明する場合、実施例1と重複する構成に対しては同じ符号を付与して説明を省略する。また、実施例2の動作のほとんどは実施例1と同様である。実施例1と同様の動作に対しては、同じ符号を付与して説明を省略する。
図11において、計算機100のストレージ103は、多値情報フラグテーブル125の代わりに多値情報テーブル1125を、プログラム135の代わりにプログラム1102を有する。プログラム1135がメモリ上にロードされ、CPU101がレコード分解部1121と匿名化部122とレコード統合部1123とを実現する。
多値情報テーブル1125はレコードNo(1201、i=1〜m)と多値属性No(1202、j=1〜n)から構成される。1つのレコードに複数の多値属性が含まれる場合は、多値属性No(1202)に複数の属性に対応した列の番号が格納される。ここで、多値属性Noは個人情報テーブル124における列番号を表し、多値属性Noに「3」が記録されていた場合は、属性203の「傷病名」が多値属性であることを表す。実施例1の図3Bの多値属性フラグテーブル125が個人情報テーブル124のレコード及び属性と1対1対応し、多値属性かどうかを格納していたのに対し、多値属性テーブル1125は多値属性であったセルの情報のみを格納する。
レコード分割部1121では実施例1のステップS906の代わりにステップS1306の処理が実行される。また、ステップS1306において、j番目に格納された値の要素分割処理は実施例1と同様であり、多値属性情報の格納のしかたが異なる。ステップS1306では、多値属性情報のみを多値属性テーブル1125に格納する。具体的には、多値属性であったセルのレコードNoと属性名(個人情報テーブル131の列番号)を多値属性テーブル1125に格納する。例えば、レコード212の場合は全ての属性が単値属性であるため多値属性テーブル1125にはレコード212に関する情報は格納されず、レコード211は傷病名が多値属性であるためレコード1211のようにレコード211のレコード識別No「3」と多値属性情報「3」が格納される。
レコード統合部1123では実施例1のステップS1006の代わりにS1406が実行される。ステップS1406では、多値属性テーブル1125を参照し、当該属性が多値属性か単値属性かを判定する。具体的にはレコード識別Noと多値属性列Noが一致する情報が多値属性テーブル1125に格納されているかどうかを判定する。
Claims (7)
- 一つの属性に複数の属性値が格納される属性を含む個人情報から、各属性が一つの属性値しかもたない複数の個人情報を生成する個人情報分割手段と、
該個人情報分割手段によって生成された分割個人情報と属性値の抽象化方針を示す一般化階層木とを用いて該分割個人情報を抽象化する匿名化手段と、
該匿名化手段によって得られた匿名個人情報を、分割前の個人情報に合わせて統合する個人情報統合手段と、
を有することを特徴とする個人情報匿名化装置。 - 請求項1に記載の個人情報匿名化装置であって、
該個人情報統合手段が、一つの属性値からなる属性に対しては該匿名化手段によって抽象化された複数の属性値のうち最も抽象度の高いものを統合結果とし、複数の属性値からなる属性に対しては該匿名化手段によって抽象化された複数の属性値を区切り文字により連結したものを統合結果とする
ことを特徴とする個人情報匿名化装置。 - 計算機を用いた個人情報匿名化方法であって、
一つの属性に複数の属性値が格納される属性を含む個人情報から、各属性が一つの属性値しかもたない複数の個人情報を生成する個人情報分割ステップと、
該個人情報分割ステップによって生成された分割個人情報と属性値の抽象化方針を示す一般化階層木とを用いて該分割個人情報を抽象化する匿名化ステップと、
該匿名化ステップによって得られた匿名個人情報を、分割前の個人情報に合わせて統合する個人情報統合ステップと、
を有することを特徴とする個人情報匿名化方法。 - 請求項3に記載の個人情報匿名化方法であって、
該個人情報統合ステップが、一つの属性値からなる属性に対しては該匿名化ステップによって抽象化された複数の属性値のうち最も抽象度の高いものを統合結果とし、複数の属性値からなる属性に対しては該匿名化ステップによって抽象化された複数の属性値を区切り文字により連結したものを統合結果とする
ことを特徴とする個人情報匿名化方法。 - 前記個人情報分割ステップにおいて、
一つの属性に複数の属性値が格納される属性を含む個人情報の識別情報と、複数の属性値を有する属性の識別情報との対応関係を示す情報に基づいて、一つの属性に複数の属性値が格納される属性を含む個人情報から、各属性が一つの属性値しかもたない複数の個人情報を生成することを特徴とする請求項3記載の個人情報匿名化方法。 - 計算機によって実行されるプログラムであって、請求項3記載の個人情報匿名化方法を実行することを特徴とするプログラム。
- 計算機で読み取り可能な記憶媒体であって、請求項3記載の個人情報匿名化方法を実行するためのプログラムを格納したことを特徴とする記憶媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012025203A JP5684165B2 (ja) | 2012-02-08 | 2012-02-08 | 個人情報匿名化装置および方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012025203A JP5684165B2 (ja) | 2012-02-08 | 2012-02-08 | 個人情報匿名化装置および方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013161428A true JP2013161428A (ja) | 2013-08-19 |
JP5684165B2 JP5684165B2 (ja) | 2015-03-11 |
Family
ID=49173580
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012025203A Active JP5684165B2 (ja) | 2012-02-08 | 2012-02-08 | 個人情報匿名化装置および方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5684165B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9317716B2 (en) | 2013-05-22 | 2016-04-19 | Hitachi, Ltd. | Privacy protection-type data providing system |
WO2018004236A1 (ko) * | 2016-06-30 | 2018-01-04 | 주식회사 파수닷컴 | 개인정보의 비식별화 방법 및 장치 |
WO2018128207A1 (ko) * | 2017-01-06 | 2018-07-12 | 경희대학교 산학협력단 | 왜곡된 데이터에 대한 프라이버시 보호 시스템 및 방법{system and method for privacy presevation in skewed data} |
CN113544684A (zh) * | 2019-03-11 | 2021-10-22 | 日本电信电话株式会社 | 数据置换装置、数据置换方法、程序 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011113285A (ja) * | 2009-11-26 | 2011-06-09 | Kddi Corp | 公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラム |
US20110277037A1 (en) * | 2010-05-10 | 2011-11-10 | International Business Machines Corporation | Enforcement Of Data Privacy To Maintain Obfuscation Of Certain Data |
-
2012
- 2012-02-08 JP JP2012025203A patent/JP5684165B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011113285A (ja) * | 2009-11-26 | 2011-06-09 | Kddi Corp | 公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラム |
US20110277037A1 (en) * | 2010-05-10 | 2011-11-10 | International Business Machines Corporation | Enforcement Of Data Privacy To Maintain Obfuscation Of Certain Data |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9317716B2 (en) | 2013-05-22 | 2016-04-19 | Hitachi, Ltd. | Privacy protection-type data providing system |
WO2018004236A1 (ko) * | 2016-06-30 | 2018-01-04 | 주식회사 파수닷컴 | 개인정보의 비식별화 방법 및 장치 |
US11354436B2 (en) | 2016-06-30 | 2022-06-07 | Fasoo.Com Co., Ltd. | Method and apparatus for de-identification of personal information |
WO2018128207A1 (ko) * | 2017-01-06 | 2018-07-12 | 경희대학교 산학협력단 | 왜곡된 데이터에 대한 프라이버시 보호 시스템 및 방법{system and method for privacy presevation in skewed data} |
CN113544684A (zh) * | 2019-03-11 | 2021-10-22 | 日本电信电话株式会社 | 数据置换装置、数据置换方法、程序 |
Also Published As
Publication number | Publication date |
---|---|
JP5684165B2 (ja) | 2015-03-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2573699B1 (en) | Identity information de-identification device | |
Gursoy et al. | Privacy-preserving learning analytics: challenges and techniques | |
Li et al. | Reasoning human emotional responses from large-scale social and public media | |
Martínez et al. | A semantic framework to protect the privacy of electronic health records with non-numerical attributes | |
Stieglitz et al. | Social positions and collective sense-making in crisis communication | |
Csányi et al. | Challenges and open problems of legal document anonymization | |
CN104714999B (zh) | 整合来自多个源的时间感知的数据的系统和方法 | |
Ficek et al. | Differential privacy in health research: A scoping review | |
US11449674B2 (en) | Utility-preserving text de-identification with privacy guarantees | |
Silahtaroğlu et al. | Data analysis in health and big data: a machine learning medical diagnosis model based on patients’ complaints | |
Wickett et al. | Identifying content and levels of representation in scientific data | |
Zhang et al. | An intelligent early warning system of analyzing Twitter data using machine learning on COVID-19 surveillance in the US | |
JP5684165B2 (ja) | 個人情報匿名化装置および方法 | |
CN109074858A (zh) | 没有明显准标识符的去识别的健康护理数据库的医院匹配 | |
Canbay et al. | Big data anonymization with spark | |
US11783079B2 (en) | Privacy protection for regulated computing environments | |
Khan et al. | Clustering based privacy preserving of big data using fuzzification and anonymization operation | |
CN112381598A (zh) | 产品服务信息推送方法及装置 | |
Luthfi et al. | A conceptual model of decision-making support for opening data | |
JP2016119082A (ja) | ソーシャルネットワーク状況内での選択的なコンテキスト公開を提供するためのコンピュータ実装システム及び方法 | |
Yousef | Big data analytics in health care: a review paper | |
Agarwal et al. | Dense vector embedding based approach to identify prominent disseminators from Twitter data amid COVID-19 outbreak | |
Radaoui et al. | Knowledge guided integration of structured and unstructured data in health decision process | |
Olawoyin et al. | Preserving privacy integration and mining for big temporal co-occurrence patterns | |
Ramya Shree et al. | Sensitivity context-aware privacypreserving sentiment analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140317 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20140908 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20141113 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20141118 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20141126 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20141216 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150114 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5684165 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |