JP7106643B2 - データを非特定化する方法、データを非特定化するためのシステム、および非データを特定化するためのコンピュータ・プログラム - Google Patents
データを非特定化する方法、データを非特定化するためのシステム、および非データを特定化するためのコンピュータ・プログラム Download PDFInfo
- Publication number
- JP7106643B2 JP7106643B2 JP2020531745A JP2020531745A JP7106643B2 JP 7106643 B2 JP7106643 B2 JP 7106643B2 JP 2020531745 A JP2020531745 A JP 2020531745A JP 2020531745 A JP2020531745 A JP 2020531745A JP 7106643 B2 JP7106643 B2 JP 7106643B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- generated
- dataset
- identification
- identifiers
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 200
- 238000004590 computer program Methods 0.000 title claims description 7
- 230000008569 process Effects 0.000 claims description 158
- 238000013503 de-identification Methods 0.000 claims description 119
- 230000000873 masking effect Effects 0.000 claims description 58
- 238000012545 processing Methods 0.000 claims description 49
- 238000011156 evaluation Methods 0.000 claims description 36
- 230000001629 suppression Effects 0.000 claims description 2
- 230000006870 function Effects 0.000 description 15
- 238000010586 diagram Methods 0.000 description 13
- 238000004891 communication Methods 0.000 description 11
- 230000015654 memory Effects 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000001902 propagating effect Effects 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000009545 invasion Effects 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 229920001690 polydopamine Polymers 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
- G06F21/6254—Protecting personal data, e.g. for financial or medical purposes by anonymising data, e.g. decorrelating personal data from the owner's identification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/50—Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems
- G06F21/57—Certifying or maintaining trusted computer platforms, e.g. secure boots or power-downs, version controls, system software checks, secure updates or assessing vulnerabilities
- G06F21/577—Assessing vulnerabilities and evaluating computer system security
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2221/00—Indexing scheme relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F2221/03—Indexing scheme relating to G06F21/50, monitoring users, programs or devices to maintain the integrity of platforms
- G06F2221/033—Test or assess software
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Computer Hardware Design (AREA)
- Computer Security & Cryptography (AREA)
- Health & Medical Sciences (AREA)
- Bioethics (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Storage Device Security (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
Claims (10)
- プロセッサを含むコンピュータ・システムによりデータを非特定化する方法であって、
前記プロセッサを介して、
データセットの実体を識別する1つまたは複数の識別子を決定することと、
前記決定された1つ又は複数の識別子に関連付けられた1つ又は複数のデータ非特定化プロセスを識別することであって、各データ非特定化プロセスが、前記データセット内の保存すべき情報を示す構成の選択肢の1つまたは 複数のセットに関連付けられている、前記識別することと、
前記構成の関連付けられた構成の選択肢のセットに従って、前記データセットに対して前記識別されたデータ非特定化プロセスを実行し、保存される情報が異なるデータセットを生成することと、
前記生成されたデータセットの2つ以上の属性を統合された属性に置き換えることであって、前記統合された属性は、2つ以上の属性のうち、より正確または詳細な情報を含む、前記置き換えることと、
前記生成されたデータセットのプライバシーの脆弱性を評価することと、
前記評価に基づいて、プライバシーの脆弱性が最も少ない生成されたデータセットを生成するデータ非特定化プロセス及び関連付けられた構成の選択肢のセットを選択することと、
前記選択されたデータ非特定化プロセスを、関連付けられた構成の選択肢のセットに従って、前記データセットに対して実行し、結果として非特定化データセットを生成することと、
を含む、方法。 - 前記1つまたは複数の識別子を決定することが、
1つまたは複数の直接識別子を決定することをさらに含み、前記関連付けられたデータ非特定化プロセスがデータ・マスキング・プロセスを含む、請求項1に記載の方法。 - 前記1つまたは複数の識別子を決定することが、
複数の準識別子を決定することをさらに含み、前記関連付けられたデータ非特定化プロセスがデータの一般化またはデータの抑制を含む、請求項1または2に記載の方法。 - 前記生成されたデータセットがテーブルの形態であり、前記識別されたデータ非特定化
プロセスを実行することが、
生成されたデータセットの2つ以上の列を統合して、前記2つ以上の列より詳細な情報を含む列を生成することをさらに含む、請求項1乃至3のいずれかに記載の方法。 - プライバシーの脆弱性に関して前記生成されたデータセットを評価することが、
生成されたデータセット内の実体のデータと公開されているデータセット内の既知の実体のデータとの間のリンクの存在を決定して、前記生成されたデータセットのプライバシーの脆弱性を示すことをさらに含む、請求項1乃至4のいずれかに記載の方法。 - プライバシーの脆弱性に関して前記生成されたデータセットを評価することが、
対応するデータ非特定化プロセスおよび構成の選択肢の関連付けられたセットによって導入された、生成されたデータセット内の準識別子のセットの存在を決定して、前記生成されたデータセットのプライバシーの脆弱性を示すことをさらに含む、請求項1乃至5のいずれかに記載の方法。 - データ非特定化プロセスごとに一連のテンプレートを生成することをさらに含み、各テンプレートが、前記データ非特定化プロセスの構成の選択肢の関連付けられたセットを指定する、請求項1乃至6のいずれかに記載の方法。
- 生成されたデータセットにプライバシーの脆弱性がないことを識別し、前記識別された生成されたデータセットより一般化され情報を含むデータセットを生成する、対応するデータ非特定化プロセスの構成の選択肢の他の関連付けられたセットに関する処理を終了することによって、前記非特定化の処理時間を減らすことをさらに含む、請求項1乃至7のいずれかに記載の方法。
- 請求項1乃至7に記載の何れか1項に記載の方法を、コンピュータ・ハードウェアによって実行する、システム。
- 請求項1乃至7に記載の何れか1項に記載の方法を、コンピュータに実行させる、コンピュータ・プログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US15/843,049 US10915662B2 (en) | 2017-12-15 | 2017-12-15 | Data de-identification based on detection of allowable configurations for data de-identification processes |
US15/843,049 | 2017-12-15 | ||
PCT/IB2018/059453 WO2019116137A1 (en) | 2017-12-15 | 2018-11-29 | Data de-identification based on detection of allowable configurations for data de-identification processes |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2021507360A JP2021507360A (ja) | 2021-02-22 |
JP2021507360A5 JP2021507360A5 (ja) | 2021-04-01 |
JP7106643B2 true JP7106643B2 (ja) | 2022-07-26 |
Family
ID=66816142
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020531745A Active JP7106643B2 (ja) | 2017-12-15 | 2018-11-29 | データを非特定化する方法、データを非特定化するためのシステム、および非データを特定化するためのコンピュータ・プログラム |
Country Status (6)
Country | Link |
---|---|
US (1) | US10915662B2 (ja) |
JP (1) | JP7106643B2 (ja) |
CN (1) | CN111417954B (ja) |
DE (1) | DE112018005725T5 (ja) |
GB (1) | GB2581762A (ja) |
WO (1) | WO2019116137A1 (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10915662B2 (en) * | 2017-12-15 | 2021-02-09 | International Business Machines Corporation | Data de-identification based on detection of allowable configurations for data de-identification processes |
GB2584910A (en) * | 2019-06-21 | 2020-12-23 | Imperial College Innovations Ltd | Assessing likelihood of re-identification |
EP3817002A1 (en) * | 2019-10-30 | 2021-05-05 | Gotthardt Healthgroup AG | System for anonymizing patient data |
CN110929494A (zh) * | 2019-12-06 | 2020-03-27 | 宏图智能物流股份有限公司 | 一种基于层次树的报表下拉框的生成方法 |
US11456996B2 (en) | 2019-12-10 | 2022-09-27 | International Business Machines Corporation | Attribute-based quasi-identifier discovery |
CN112446597B (zh) * | 2020-11-14 | 2024-01-12 | 西安电子科技大学 | 贮箱质量评估方法、系统、存储介质、计算机设备及应用 |
US11392487B2 (en) * | 2020-11-16 | 2022-07-19 | International Business Machines Corporation | Synthetic deidentified test data |
US20220318669A1 (en) * | 2021-04-01 | 2022-10-06 | Salesforce.Com, Inc. | Training a machine learning model using structured data |
US11763026B2 (en) * | 2021-05-11 | 2023-09-19 | International Business Machines Corporation | Enabling approximate linkage of datasets over quasi-identifiers |
US12038833B2 (en) | 2021-11-23 | 2024-07-16 | The Toronto-Dominion Bank | Test and validation of privacy protection quality of anonymization solutions |
CN117370827A (zh) * | 2023-12-07 | 2024-01-09 | 飞特质科(北京)计量检测技术有限公司 | 一种基于深度聚类模型的风机质量等级评估方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008217425A (ja) | 2007-03-05 | 2008-09-18 | Hitachi Ltd | 情報出力装置、情報出力方法、及び、情報出力プログラム |
JP2010086179A (ja) | 2008-09-30 | 2010-04-15 | Oki Electric Ind Co Ltd | 情報処理装置、コンピュータプログラムおよび記録媒体 |
JP2017041048A (ja) | 2015-08-19 | 2017-02-23 | Kddi株式会社 | プライバシ保護装置、方法及びプログラム |
JP2017174458A (ja) | 2017-05-29 | 2017-09-28 | Keepdata株式会社 | 情報匿名化方法 |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050038788A1 (en) * | 2003-08-14 | 2005-02-17 | International Business Machines Corporation | Annotation security to prevent the divulgence of sensitive information |
EP1723596A1 (en) * | 2004-02-27 | 2006-11-22 | Accenture Global Services GmbH | System for individualized customer interaction |
US8132259B2 (en) * | 2007-01-04 | 2012-03-06 | International Business Machines Corporation | System and method for security planning with soft security constraints |
CA2679800A1 (en) * | 2008-09-22 | 2010-03-22 | University Of Ottawa | Re-identification risk in de-identified databases containing personal information |
US8209342B2 (en) * | 2008-10-31 | 2012-06-26 | At&T Intellectual Property I, Lp | Systems and associated computer program products that disguise partitioned data structures using transformations having targeted distributions |
US8326849B2 (en) * | 2009-06-25 | 2012-12-04 | University Of Ottawa | System and method for optimizing the de-identification of data sets |
US20110258206A1 (en) * | 2010-03-19 | 2011-10-20 | University Of Ottawa | System and method for evaluating marketer re-identification risk |
JP6007969B2 (ja) * | 2012-02-17 | 2016-10-19 | 日本電気株式会社 | 匿名化装置及び匿名化方法 |
WO2013130946A1 (en) | 2012-03-01 | 2013-09-06 | Sys-Tech Solutions, Inc. | Unique identification information from marked features |
US9665722B2 (en) * | 2012-08-10 | 2017-05-30 | Visa International Service Association | Privacy firewall |
TW201426578A (zh) * | 2012-12-27 | 2014-07-01 | Ind Tech Res Inst | 匿名資料集的產生方法及裝置與風險評估方法及裝置 |
US9665883B2 (en) * | 2013-09-13 | 2017-05-30 | Acxiom Corporation | Apparatus and method for bringing offline data online while protecting consumer privacy |
US10043035B2 (en) * | 2013-11-01 | 2018-08-07 | Anonos Inc. | Systems and methods for enhancing data protection by anonosizing structured and unstructured data and incorporating machine learning and artificial intelligence in classical and quantum computing environments |
CA2852253A1 (en) * | 2014-05-23 | 2015-11-23 | University Of Ottawa | System and method for shifting dates in the de-identification of datesets |
US9870381B2 (en) | 2015-05-22 | 2018-01-16 | International Business Machines Corporation | Detecting quasi-identifiers in datasets |
US10395059B2 (en) * | 2015-07-15 | 2019-08-27 | Privacy Analytics Inc. | System and method to reduce a risk of re-identification of text de-identification tools |
WO2017008144A1 (en) * | 2015-07-15 | 2017-01-19 | Privacy Analytics Inc. | Re-identification risk measurement estimation of a dataset |
US10423803B2 (en) * | 2015-07-15 | 2019-09-24 | Privacy Analytics Inc. | Smart suppression using re-identification risk measurement |
US10380381B2 (en) * | 2015-07-15 | 2019-08-13 | Privacy Analytics Inc. | Re-identification risk prediction |
US10915662B2 (en) * | 2017-12-15 | 2021-02-09 | International Business Machines Corporation | Data de-identification based on detection of allowable configurations for data de-identification processes |
-
2017
- 2017-12-15 US US15/843,049 patent/US10915662B2/en active Active
-
2018
- 2018-11-29 GB GB2009760.6A patent/GB2581762A/en active Pending
- 2018-11-29 CN CN201880073512.7A patent/CN111417954B/zh active Active
- 2018-11-29 DE DE112018005725.9T patent/DE112018005725T5/de active Pending
- 2018-11-29 WO PCT/IB2018/059453 patent/WO2019116137A1/en active Application Filing
- 2018-11-29 JP JP2020531745A patent/JP7106643B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008217425A (ja) | 2007-03-05 | 2008-09-18 | Hitachi Ltd | 情報出力装置、情報出力方法、及び、情報出力プログラム |
JP2010086179A (ja) | 2008-09-30 | 2010-04-15 | Oki Electric Ind Co Ltd | 情報処理装置、コンピュータプログラムおよび記録媒体 |
JP2017041048A (ja) | 2015-08-19 | 2017-02-23 | Kddi株式会社 | プライバシ保護装置、方法及びプログラム |
JP2017174458A (ja) | 2017-05-29 | 2017-09-28 | Keepdata株式会社 | 情報匿名化方法 |
Also Published As
Publication number | Publication date |
---|---|
WO2019116137A1 (en) | 2019-06-20 |
US20190188416A1 (en) | 2019-06-20 |
CN111417954B (zh) | 2024-01-05 |
US10915662B2 (en) | 2021-02-09 |
JP2021507360A (ja) | 2021-02-22 |
GB2581762A (en) | 2020-08-26 |
CN111417954A (zh) | 2020-07-14 |
GB202009760D0 (en) | 2020-08-12 |
DE112018005725T5 (de) | 2020-08-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7106643B2 (ja) | データを非特定化する方法、データを非特定化するためのシステム、および非データを特定化するためのコンピュータ・プログラム | |
US11188791B2 (en) | Anonymizing data for preserving privacy during use for federated machine learning | |
US20210019674A1 (en) | Risk profiling and rating of extended relationships using ontological databases | |
CN111344708B (zh) | 基于演进的数据流的自适应统计数据去标识 | |
US9785795B2 (en) | Identifying and securing sensitive data at its source | |
US11017764B1 (en) | Predicting follow-on requests to a natural language request received by a natural language processing system | |
US9350747B2 (en) | Methods and systems for malware analysis | |
US20170154188A1 (en) | Context-sensitive copy and paste block | |
CN111344721A (zh) | 使用认知计算的异常检测 | |
US10897452B2 (en) | Systems and methods for implementing a privacy firewall | |
US20220188359A1 (en) | Computer-implemented methods, systems comprising computer-readable media, and electronic devices for expanded entity and activity mapping within a network computing environment | |
US20200320202A1 (en) | Privacy vulnerability scanning of software applications | |
US20230281249A1 (en) | Computer-implemented methods, systems comprising computer-readable media, and electronic devices for enabled intervention into a network computing environment | |
US20210385252A1 (en) | Dynamic, Runtime Application Programming Interface Parameter Labeling, Flow Parameter Tracking and Security Policy Enforcement Using API Call Graph | |
US20160344743A1 (en) | User Interface Driven Translation, Comparison, Unification, and Deployment of Device Neutral Network Security Policies | |
CN115455046A (zh) | 图中的重复确定 | |
WO2022179441A1 (en) | Standardization in the context of data integration | |
US11403577B2 (en) | Assisting and automating workflows using structured log events | |
JP7567070B2 (ja) | 組織のセキュリティポリシーに対するユーザコンプライアンスの信頼度のスコアリング | |
US11429783B2 (en) | Augmented natural language generation platform | |
Racheed et al. | Object detection and object classification using machine learning Algorithms | |
US20170163676A1 (en) | Security and Authentication Daisy Chain Analysis and Warning System | |
JP6287436B2 (ja) | 情報処理装置、情報処理システム、情報処理方法およびプログラム | |
Michalas et al. | Mem tri: Memory forensics triage tool | |
WO2024213987A1 (en) | System and method to treat identified security risk to artificial intelligence platform |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210128 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210423 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220228 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220301 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20220502 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220509 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220705 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220713 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7106643 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |