JP6825016B2 - 個人情報の非識別化方法および装置 - Google Patents
個人情報の非識別化方法および装置 Download PDFInfo
- Publication number
- JP6825016B2 JP6825016B2 JP2018569022A JP2018569022A JP6825016B2 JP 6825016 B2 JP6825016 B2 JP 6825016B2 JP 2018569022 A JP2018569022 A JP 2018569022A JP 2018569022 A JP2018569022 A JP 2018569022A JP 6825016 B2 JP6825016 B2 JP 6825016B2
- Authority
- JP
- Japan
- Prior art keywords
- personal information
- record
- primitive
- node
- recorded
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 56
- 230000001629 suppression Effects 0.000 claims description 94
- 238000013503 de-identification Methods 0.000 claims description 40
- 230000035945 sensitivity Effects 0.000 claims description 14
- 230000000873 masking effect Effects 0.000 claims description 9
- 230000014509 gene expression Effects 0.000 description 31
- 230000007704 transition Effects 0.000 description 30
- 238000010586 diagram Methods 0.000 description 20
- 201000010099 disease Diseases 0.000 description 10
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 6
- 238000003672 processing method Methods 0.000 description 6
- 206010035664 Pneumonia Diseases 0.000 description 3
- 206010006451 bronchitis Diseases 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 208000007882 Gastritis Diseases 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 238000005204 segregation Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000002496 gastric effect Effects 0.000 description 1
- 206010025482 malaise Diseases 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
- G06F21/6254—Protecting personal data, e.g. for financial or medical purposes by anonymising data, e.g. decorrelating personal data from the owner's identification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
- G06F16/2379—Updates performed during online database operations; commit processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Bioethics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Computer Hardware Design (AREA)
- Computer Security & Cryptography (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Medical Informatics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Storage Device Security (AREA)
Description
非識別化装置100は、原始ラティスで選択ノードBが属した階層−2と最下位階層(すなわち、階層−0)の間の1/2地点に該当する階層−1に属するノードのうち任意のノードを交差ノードと設定することができ、階層−2に属するノードのうち選択ノードBを除いた任意のノードを変移ノードと設定することができる(S263−1)。例えば、非識別化装置100は階層−1に属する「a0、b1、c0」ノードを交差ノードと設定することができ、階層−2に属する「a0、b2、c0」ノードを変移ノードと設定することができる。
非識別化装置100は、原始ラティスで選択ノードAが属した階層−4と選択ノードBが属した階層−2の間の1/2地点に該当する階層−3に属するノードのうち任意のノードを交差ノードと設定することができ、階層−4に属するノードのうち選択ノードAを除いた任意のノードを変移ノードと設定することができる(S264−1)。例えば、非識別化装置100は階層−3に属する「a1、b1、c1」ノードを交差ノードと設定することができ、階層−4に属する「a2、b1、c1」ノードを変移ノードと設定することができる。
非識別化装置100は原始ラティスで選択ノードAが属した階層−4と最上位階層(すなわち、階層−6)の間の1/2地点に該当する階層−5に属するノードのうち任意のノードを交差ノードと設定することができ、階層−4に属するノードのうち選択ノードAを除いた任意のノードを変移ノードと設定することができる(S265−1)。例えば、非識別化装置100は階層−5に属する「a3、b1、c1」ノードを交差ノードと設定することができ、階層−4に属する「a2、b1、c1」ノードを変移ノードと設定することができる。
Claims (16)
- 個人情報非識別化装置によって実行される個人情報非識別化方法であって、
データベースから個人情報を指示する原始データが記録されたレコードを含む原始テーブルを獲得する段階;
前記原始テーブルに含まれるそれぞれのレコードの属性を設定する段階;
一般化レベルに基づいて前記原始テーブルに含まれるそれぞれのレコードに記録された原始データを一般化することによって、一般化されたデータを生成する段階;
前記原始データおよび前記一般化されたデータで構成される一般化階層モデルを設定する段階;
前記一般化階層モデルによって指示される階層構造に基づいて、個人情報の種類別の一般化レベルを指示するテーブルを指示する複数の候補ノードを含む原始ラティスを生成する段階;および
前記原始ラティスに含まれる前記複数の候補ノードのうちあらかじめ設定された基準を満足する少なくとも一つの候補ノードを含む最終ラティスを設定する段階;
を含み、
前記属性は、ID、QI、SAおよびIAに分類され、
特定個人が明示的に識別される個人情報を指示する原始データが記録されたレコードはIDに設定され、
特定個人が暗黙的に識別される個人情報を指示する原始データが記録されたレコードはQIに設定され、
あらかじめ設定された基準以上の敏感度を有する個人情報を指示する原始データが記録されたレコードはSAに設定され、
SAより低い敏感度を有する個人情報を指示する原始データが記録されたレコードはIAに設定される、
個人情報非識別化方法。 - 当該個人情報非識別化方法は、
前記原始テーブルに含まれるレコードのうち前記属性がIDに設定されたレコードをマスキング処理する段階をさらに含む、請求項1に記載の個人情報非識別化方法。 - 当該個人情報非識別化方法は、
前記原始テーブルに含まれるレコードのうち前記属性がQIに設定されたレコードに記録された原始データによって指示される個人情報の種類によって前記一般化レベルを設定する段階をさらに含む、請求項1に記載の個人情報非識別化方法。 - 前記原始テーブルに含まれるレコードのうち前記属性がQIに設定されたレコードに記録された原始データは、一般化レベルに基づいて一般化される、請求項1に記載の個人情報非識別化方法。
- 前記最終ラティスを設定する段階は、
前記原始ラティスに含まれる前記複数の候補ノードのうち少なくとも一つの候補ノードを選択する段階;
前記少なくとも一つの候補ノードによって指示される一般化レベルに基づいて前記原始テーブルに対する非識別化を遂行することによって非識別化されたテーブルを生成する段階;
あらかじめ設定された抑制基準を満足する非識別化されたテーブルに対応する候補ノードを最終ノードに設定する段階;および
前記あらかじめ設定された基準を満足する候補ノードに対応する前記最終ノードを含む前記最終ラティスを設定する段階を含む、請求項1に記載の個人情報非識別化方法。 - 前記非識別化されたテーブルは、K−匿名性に基づいて生成されるか、前記K−匿名性およびL−多様性に基づいて生成されるか、または前記K−匿名性およびT−近接性に基づいて生成される、請求項5に記載の個人情報非識別化方法。
- 前記あらかじめ設定された抑制基準は、前記非識別化されたテーブルを構成する同等クラスのうち前記あらかじめ設定されたK−匿名性を満足しない同等クラスの比率を指示する、請求項6に記載の個人情報非識別化方法。
- 当該個人情報非識別化方法は、
前記最終ラティスに含まれる少なくとも一つの最終ノードに対応する非識別化されたテーブルの再識別化危険性および有用性を計算する段階をさらに含む、請求項1に記載の個人情報非識別化方法。 - 個人情報非識別化装置であって、
プロセッサ;および
前記プロセッサを通じて実行される少なくとも一つの命令が保存されたメモリを含み、
前記少なくとも一つの命令は、
データベースから個人情報を指示する原始データが記録されたレコードを含む原始テーブルを獲得し;
前記原始テーブルに含まれるそれぞれのレコードの属性を設定し;
一般化レベルに基づいて前記原始テーブルに含まれるそれぞれのレコードに記録された原始データを一般化することによって一般化されたデータを生成し;
前記原始データおよび前記一般化されたデータで構成される一般化階層モデルを設定し;
前記一般化階層モデルによって指示される階層構造に基づいて、個人情報の種類別の一般化レベルを指示するテーブルを指示する複数の候補ノードを含む原始ラティスを生成し;
前記原始ラティスに含まれる前記複数の候補ノードのうちあらかじめ設定された基準を満足する少なくとも一つの候補ノードを含む最終ラティスを設定するように実行可能であり、
前記属性は、ID、QI、SAおよびIAに分類され、
特定個人が明示的に識別される個人情報を指示する原始データが記録されたレコードはIDに設定され、
特定個人が暗黙的に識別される個人情報を指示する原始データが記録されたレコードはQIに設定され、
あらかじめ設定された基準以上の敏感度を有する個人情報を指示する原始データが記録されたレコードはSAに設定され、
SAより低い敏感度を有する個人情報を指示する原始データが記録されたレコードはIAに設定される、
個人情報非識別化装置。 - 前記少なくとも一つの命令は、
前記原始テーブルに含まれるレコードのうち前記属性がIDに設定されたレコードをマスキング処理するようにさらに実行可能である、請求項9に記載の個人情報非識別化装置。 - 前記少なくとも一つの命令は、
前記原始テーブルに含まれるレコードのうち前記属性がQIに設定されたレコードに記録された原始データによって指示される個人情報の種類によって前記一般化レベルを設定するようにさらに実行可能である、請求項9に記載の個人情報非識別化装置。 - 前記原始テーブルに含まれるレコードのうち前記属性がQIに設定されたレコードに記録された原始データは、一般化レベルに基づいて一般化される、請求項9に記載の個人情報非識別化装置。
- 前記少なくとも一つの命令は、前記最終ラティスを設定する場合、
前記原始ラティスに含まれる複数の候補ノードのうち少なくとも一つの候補ノードを選択し;
前記少なくとも一つの候補ノードによって指示される一般化レベルに基づいて前記原始テーブルに対する非識別化を遂行することによって非識別化されたテーブルを生成し;
あらかじめ設定された抑制基準を満足する非識別化されたテーブルに対応する候補ノードを最終ノードに設定し;
前記あらかじめ設定された基準を満足する候補ノードに対応する前記最終ノードを含む前記最終ラティスを設定するように実行可能である、請求項9に記載の個人情報非識別化装置。 - 前記非識別化されたテーブルは、K−匿名性に基づいて生成されるか、前記K−匿名性およびL−多様性に基づいて生成されるか、または前記K−匿名性およびT−近接性に基づいて生成される、請求項13に記載の個人情報非識別化装置。
- 前記あらかじめ設定された抑制基準は、前記非識別化されたテーブルを構成する同等クラスのうち前記あらかじめ設定されたK−匿名性を満足しない同等クラスの比率を指示する、請求項14に記載の個人情報非識別化装置。
- 前記少なくとも一つの命令は、
前記最終ラティスに含まれる少なくとも一つの最終ノードに対応する非識別化されたテーブルの再識別化危険性および有用性を計算するようにさらに実行可能である、請求項9に記載の個人情報非識別化装置。
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020160082839A KR101798377B1 (ko) | 2016-06-30 | 2016-06-30 | 개인정보의 비식별화 방법 및 장치 |
KR10-2016-0082860 | 2016-06-30 | ||
KR1020160082878A KR101821219B1 (ko) | 2016-06-30 | 2016-06-30 | 개인정보를 포함하는 테이블의 속성 설정 방법 및 장치 |
KR10-2016-0082839 | 2016-06-30 | ||
KR1020160082860A KR101798378B1 (ko) | 2016-06-30 | 2016-06-30 | 유전 알고리즘에 기초한 개인정보의 비식별화 방법 및 장치 |
KR10-2016-0082878 | 2016-06-30 | ||
PCT/KR2017/006765 WO2018004236A1 (ko) | 2016-06-30 | 2017-06-27 | 개인정보의 비식별화 방법 및 장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019527409A JP2019527409A (ja) | 2019-09-26 |
JP6825016B2 true JP6825016B2 (ja) | 2021-02-03 |
Family
ID=60787333
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018569022A Active JP6825016B2 (ja) | 2016-06-30 | 2017-06-27 | 個人情報の非識別化方法および装置 |
Country Status (5)
Country | Link |
---|---|
US (2) | US11354436B2 (ja) |
EP (1) | EP3480721A4 (ja) |
JP (1) | JP6825016B2 (ja) |
CN (1) | CN109564616A (ja) |
WO (1) | WO2018004236A1 (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11036884B2 (en) * | 2018-02-26 | 2021-06-15 | International Business Machines Corporation | Iterative execution of data de-identification processes |
US10970418B2 (en) * | 2018-08-23 | 2021-04-06 | Servicenow, Inc. | System and method for anonymized data repositories |
US20200074101A1 (en) * | 2018-08-28 | 2020-03-05 | Koninklijke Philips N.V. | De-identification of protected information in multiple modalities |
US11196750B2 (en) * | 2019-07-18 | 2021-12-07 | International Business Machines Corporation | Fine-grained data masking according to classifications of sensitive data |
US11593511B2 (en) * | 2019-10-10 | 2023-02-28 | International Business Machines Corporation | Dynamically identifying and redacting data from diagnostic operations via runtime monitoring of data sources |
TWI728553B (zh) * | 2019-11-14 | 2021-05-21 | 財團法人資訊工業策進會 | 資料去識別處理裝置及方法 |
EP3832559A1 (en) * | 2019-12-03 | 2021-06-09 | Accenture Global Solutions Limited | Controlling access to de-identified data sets based on a risk of re-identification |
KR102504531B1 (ko) * | 2020-11-20 | 2023-02-28 | (주)디지탈쉽 | 데이터 통합 분석을 위한 데이터 수집 처리 장치 및 방법 |
US20220180226A1 (en) * | 2020-12-09 | 2022-06-09 | Accenture Global Solutions Limited | Applying a k-anonymity model to protect node level privacy in knowledge graphs and a differential privacy model to protect edge level privacy in knowledge graphs |
US11755778B2 (en) | 2021-04-26 | 2023-09-12 | Snowflake Inc. | Horizontally-scalable data de-identification |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2002254564A1 (en) * | 2001-04-10 | 2002-10-28 | Latanya Sweeney | Systems and methods for deidentifying entries in a data source |
US20070255704A1 (en) * | 2006-04-26 | 2007-11-01 | Baek Ock K | Method and system of de-identification of a record |
WO2008069011A1 (ja) | 2006-12-04 | 2008-06-12 | Nec Corporation | 情報管理システム、匿名化方法、及び記憶媒体 |
CA2679800A1 (en) | 2008-09-22 | 2010-03-22 | University Of Ottawa | Re-identification risk in de-identified databases containing personal information |
CA2690788C (en) * | 2009-06-25 | 2018-04-24 | University Of Ottawa | System and method for optimizing the de-identification of datasets |
JP5452187B2 (ja) * | 2009-11-26 | 2014-03-26 | Kddi株式会社 | 公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラム |
EP2573699B1 (en) * | 2010-05-19 | 2017-06-07 | Hitachi, Ltd. | Identity information de-identification device |
CN102156755A (zh) * | 2011-05-06 | 2011-08-17 | 天津大学 | 一种k-匿名改进方法 |
JP5626733B2 (ja) | 2011-10-04 | 2014-11-19 | 株式会社日立製作所 | 個人情報匿名化装置及び方法 |
JP5684165B2 (ja) * | 2012-02-08 | 2015-03-11 | 株式会社日立製作所 | 個人情報匿名化装置および方法 |
TW201426578A (zh) * | 2012-12-27 | 2014-07-01 | Ind Tech Res Inst | 匿名資料集的產生方法及裝置與風險評估方法及裝置 |
US9460311B2 (en) * | 2013-06-26 | 2016-10-04 | Sap Se | Method and system for on-the-fly anonymization on in-memory databases |
CN103425771B (zh) * | 2013-08-12 | 2016-12-28 | 深圳市华傲数据技术有限公司 | 一种数据正则表达式的挖掘方法及装置 |
JP6040194B2 (ja) * | 2014-04-08 | 2016-12-07 | 日本電信電話株式会社 | アクセス権限処理システム、アクセス権限処理方法、及びプログラム |
US9990515B2 (en) * | 2014-11-28 | 2018-06-05 | Privacy Analytics Inc. | Method of re-identification risk measurement and suppression on a longitudinal dataset |
US10685138B2 (en) * | 2015-07-15 | 2020-06-16 | Privacy Analytics Inc. | Re-identification risk measurement estimation of a dataset |
-
2017
- 2017-06-27 JP JP2018569022A patent/JP6825016B2/ja active Active
- 2017-06-27 CN CN201780048000.0A patent/CN109564616A/zh active Pending
- 2017-06-27 EP EP17820512.6A patent/EP3480721A4/en not_active Withdrawn
- 2017-06-27 US US16/314,202 patent/US11354436B2/en active Active
- 2017-06-27 WO PCT/KR2017/006765 patent/WO2018004236A1/ko unknown
-
2022
- 2022-05-14 US US17/744,630 patent/US12189819B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2019527409A (ja) | 2019-09-26 |
US20190228183A1 (en) | 2019-07-25 |
US12189819B2 (en) | 2025-01-07 |
US11354436B2 (en) | 2022-06-07 |
EP3480721A4 (en) | 2020-01-15 |
WO2018004236A1 (ko) | 2018-01-04 |
US20220277106A1 (en) | 2022-09-01 |
EP3480721A1 (en) | 2019-05-08 |
CN109564616A (zh) | 2019-04-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6825016B2 (ja) | 個人情報の非識別化方法および装置 | |
CN110476159A (zh) | 信息处理系统、特征值说明方法和特征值说明程序 | |
CN109299133A (zh) | 数据查询方法、计算机系统及非暂时性计算机可读介质 | |
Moen et al. | An analysis of patient-sharing physician networks and implantable cardioverter defibrillator therapy | |
US9983890B2 (en) | Collaborative generation of configuration technical data for a product to be manufactured | |
JP2018534679A (ja) | 動的な自律トランザクションアイデンティティ管理のためのシステム及び方法 | |
CN107423911A (zh) | 软件成功度评价方法/系统、计算机可读存储介质及设备 | |
CN114372564B (zh) | 用于对象分级的模型训练方法、对象分级方法及装置 | |
JP7151759B2 (ja) | 情報処理装置、情報処理方法、及び、プログラム | |
JP2020144421A (ja) | 情報処理システム及び情報処理方法 | |
WO2017192094A1 (en) | Computer systems and methods for implementing in-memory data structures | |
JP2021532483A (ja) | グラフ計算技術に基づく請求不正防止方法、装置、機器及び記憶媒体 | |
CN105389192B (zh) | 一种基于加权q2指数的软件类重要性度量方法 | |
CN101192220A (zh) | 标签建构方法及系统 | |
KR101798377B1 (ko) | 개인정보의 비식별화 방법 및 장치 | |
TW201032136A (en) | Apparatus, method, and computer program for supporting data linkage between multiple applications | |
CN114429387A (zh) | 一种保险数据的处理方法、装置、设备及存储介质 | |
CN114282002A (zh) | 基于人工智能的知识生成方法、装置、设备及存储介质 | |
CN111258743A (zh) | 基于离散编码的云任务调度方法、装置、设备及存储介质 | |
CN115905864A (zh) | 异常数据检测模型训练方法、装置、计算机设备 | |
KR101821219B1 (ko) | 개인정보를 포함하는 테이블의 속성 설정 방법 및 장치 | |
CN115758271A (zh) | 数据处理方法、装置、计算机设备和存储介质 | |
WO2022220982A1 (en) | Database query execution on multiple databases | |
Laha et al. | Improved inference for vaccine-induced immune responses via shape-constrained methods | |
KR101798378B1 (ko) | 유전 알고리즘에 기초한 개인정보의 비식별화 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190221 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200130 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200212 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20200511 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200710 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201215 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210113 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6825016 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |