JP2021507360A5 - - Google Patents
Download PDFInfo
- Publication number
- JP2021507360A5 JP2021507360A5 JP2020531745A JP2020531745A JP2021507360A5 JP 2021507360 A5 JP2021507360 A5 JP 2021507360A5 JP 2020531745 A JP2020531745 A JP 2020531745A JP 2020531745 A JP2020531745 A JP 2020531745A JP 2021507360 A5 JP2021507360 A5 JP 2021507360A5
- Authority
- JP
- Japan
- Prior art keywords
- data
- dataset
- identifiers
- generated
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 claims 39
- 238000004590 computer program Methods 0.000 claims 7
- 230000000875 corresponding Effects 0.000 claims 6
- 230000000873 masking Effects 0.000 claims 3
- 230000000717 retained Effects 0.000 claims 3
- 230000001629 suppression Effects 0.000 claims 3
Claims (24)
- プロセッサを含むコンピュータ・システムによりデータを非特定化する方法であって、
前記プロセッサを介して、
データセットの実体を識別する1つまたは複数の識別子を決定することと、
前記決定された1つまたは複数の識別子に関連付けられた1つまたは複数のデータ非特定化プロセスを識別することであって、各データ非特定化プロセスが、前記データセット内の保つべき情報を示す構成の選択肢の1つまたは複数のセットに関連付けられている、前記識別することと、
前記構成の選択肢の関連付けられたセットに従って、前記データセットに対して前記識別されたデータ非特定化プロセスを実行し、変化する保たれた情報を含むデータセットを生成することと、
プライバシーの脆弱性に関して、前記生成されたデータセットを評価し、前記評価に基づいて、データ非特定化プロセスおよび構成の選択肢の関連付けられたセットを選択することと、
前記構成の選択肢の関連付けられたセットに従って、前記データセットに対して前記選択されたデータ非特定化プロセスを実行し、結果として得られる非特定化されたデータセットを生成することとを含む、方法。 - 前記1つまたは複数の識別子を決定することが、
1つまたは複数の直接識別子を決定することをさらに含み、前記関連付けられたデータ非特定化プロセスがデータ・マスキング・プロセスを含む、請求項1に記載の方法。 - 前記1つまたは複数の識別子を決定することが、
複数の準識別子を決定することをさらに含み、前記関連付けられたデータ非特定化プロセスがデータの一般化またはデータの抑制を含む、請求項1または2に記載の方法。 - 前記生成されたデータセットがテーブルの形態であり、前記識別されたデータ非特定化プロセスを実行することが、
生成されたデータセットの2つ以上の列を統合して、前記2つ以上の列より詳細な情報を含む列を生成することをさらに含む、請求項1乃至3のいずれかに記載の方法。 - プライバシーの脆弱性に関して前記生成されたデータセットを評価することが、
生成されたデータセット内の実体のデータと公開されているデータセット内の既知の実体のデータとの間のリンクの存在を決定して、前記生成されたデータセットのプライバシーの脆弱性を示すことをさらに含む、請求項1乃至4のいずれかに記載の方法。 - プライバシーの脆弱性に関して前記生成されたデータセットを評価することが、
対応するデータ非特定化プロセスおよび構成の選択肢の関連付けられたセットによって導入された、生成されたデータセット内の準識別子のセットの存在を決定して、前記生成されたデータセットのプライバシーの脆弱性を示すことをさらに含む、請求項1乃至5のいずれかに記載の方法。 - データ非特定化プロセスごとに一連のテンプレートを生成することをさらに含み、各テンプレートが、前記データ非特定化プロセスの構成の選択肢の関連付けられたセットを指定する、請求項1乃至6のいずれかに記載の方法。
- 生成されたデータセットにプライバシーの脆弱性がないことを識別し、前記識別された生成されたデータセットより一般化され情報を含むデータセットを生成する、対応するデータ非特定化プロセスの構成の選択肢の他の関連付けられたセットに関する処理を終了することによって、前記非特定化の処理時間を減らすことをさらに含む、請求項1乃至7のいずれかに記載の方法。
- データを非特定化するためのシステムであって、
データセットの実体を識別する1つまたは複数の識別子を決定することと、
前記決定された1つまたは複数の識別子に関連付けられた1つまたは複数のデータ非特定化プロセスを識別することであって、各データ非特定化プロセスが、前記データセット内の保つべき情報を示す構成の選択肢の1つまたは複数のセットに関連付けられている、前記識別することと、
前記構成の選択肢の関連付けられたセットに従って、前記データセットに対して前記識別されたデータ非特定化プロセスを実行し、変化する保たれた情報を含むデータセットを生成することと、
プライバシーの脆弱性に関して、前記生成されたデータセットを評価し、前記評価に基づいて、データ非特定化プロセスおよび構成の選択肢の関連付けられたセットを選択することと、
前記構成の選択肢の関連付けられたセットに従って、前記データセットに対して前記選択されたデータ非特定化プロセスを実行し、結果として得られる非特定化されたデータセットを生成することとを実行するように構成された少なくとも1つのプロセッサを備えている、システム。 - 前記1つまたは複数の識別子を決定することが、
1つまたは複数の直接識別子を決定することをさらに含んでおり、前記関連付けられたデータ非特定化プロセスがデータ・マスキング・プロセスを含む、請求項9に記載のシステム。 - 前記1つまたは複数の識別子を決定することが、
複数の準識別子を決定することをさらに含んでおり、前記関連付けられたデータ非特定化プロセスがデータの一般化またはデータの抑制を含む、請求項9又は10に記載のシステム。 - 前記生成されたデータセットがテーブルの形態であり、前記識別されたデータ非特定化プロセスを実行することが、
生成されたデータセットの2つ以上の列を統合して、前記2つ以上の列より詳細な情報を含む列を生成することをさらに含む、請求項9乃至11のいずれかに記載のシステム。 - プライバシーの脆弱性に関して前記生成されたデータセットを評価することが、
生成されたデータセット内の実体のデータと公開されているデータセット内の既知の実体のデータとの間のリンクの存在を決定して、前記生成されたデータセットのプライバシーの脆弱性を示すことをさらに含む、請求項9乃至12のいずれかに記載のシステム。 - プライバシーの脆弱性に関して前記生成されたデータセットを評価することが、
対応するデータ非特定化プロセスおよび構成の選択肢の関連付けられたセットによって導入された、生成されたデータセット内の準識別子のセットの存在を決定して、前記生成されたデータセットのプライバシーの脆弱性を示すことをさらに含む、請求項9乃至13のいずれかに記載のシステム。 - 前記少なくとも1つのプロセッサが、
データ非特定化プロセスごとに一連のテンプレートを生成するようにさらに構成されており、各テンプレートが、前記データ非特定化プロセスの構成の選択肢の関連付けられたセットを指定する、請求項9乃至14のいずれかに記載のシステム。 - 前記少なくとも1つのプロセッサが、
生成されたデータセットにプライバシーの脆弱性がないことを識別し、前記識別された生成されたデータセットより一般化され情報を含むデータセットを生成する、対応するデータ非特定化プロセスの構成の選択肢の他の関連付けられたセットに関する処理を終了することによって、前記非特定化の処理時間を減らすようにさらに構成されている、請求項9乃至15のいずれかに記載のシステム。 - データを非特定化するためのコンピュータ・プログラムであって、少なくとも1つのプロセッサを含むコンピュータにより実行されることで、前記少なくとも1つのプロセッサに、
データセットの実体を識別する1つまたは複数の識別子を決定することと、
前記決定された1つまたは複数の識別子に関連付けられた1つまたは複数のデータ非特定化プロセスを識別することであって、各データ非特定化プロセスが、前記データセット内の保つべき情報を示す構成の選択肢の1つまたは複数のセットに関連付けられている、前記識別することと、
前記構成の選択肢の関連付けられたセットに従って、前記データセットに対して前記識別されたデータ非特定化プロセスを実行し、変化する保たれた情報を含むデータセットを生成することと、
プライバシーの脆弱性に関して、前記生成されたデータセットを評価し、前記評価に基づいて、データ非特定化プロセスおよび構成の選択肢の関連付けられたセットを選択することと、
前記構成の選択肢の関連付けられたセットに従って、前記データセットに対して前記選択されたデータ非特定化プロセスを実行し、結果として得られる非特定化されたデータセットを生成することとを実行させる、コンピュータ・プログラム。 - 前記1つまたは複数の識別子を決定することが、
1つまたは複数の直接識別子を決定することをさらに含んでおり、前記関連付けられたデータ非特定化プロセスがデータ・マスキング・プロセスを含む、請求項17に記載のコンピュータ・プログラム。 - 前記1つまたは複数の識別子を決定することが、
複数の準識別子を決定することをさらに含んでおり、前記関連付けられたデータ非特定化プロセスがデータの一般化またはデータの抑制を含む、請求項17又は18に記載のコンピュータ・プログラム。 - 前記生成されたデータセットがテーブルの形態であり、前記識別されたデータ非特定化プロセスを実行することが、
生成されたデータセットの2つ以上の列を統合して、前記2つ以上の列より詳細な情報を含む列を生成することをさらに含む、請求項17乃至19のいずれかに記載のコンピュータ・プログラム。 - プライバシーの脆弱性に関して前記生成されたデータセットを評価することが、
生成されたデータセット内の実体のデータと公開されているデータセット内の既知の実体のデータとの間のリンクの存在を決定して、前記生成されたデータセットのプライバシーの脆弱性を示すことをさらに含む、請求項17乃至20のいずれかに記載のコンピュータ・プログラム。 - プライバシーの脆弱性に関して前記生成されたデータセットを評価することが、
対応するデータ非特定化プロセスおよび構成の選択肢の関連付けられたセットによって導入された、生成されたデータセット内の準識別子のセットの存在を決定して、前記生成されたデータセットのプライバシーの脆弱性を示すことをさらに含む、請求項17乃至21のいずれかに記載のコンピュータ・プログラム。 - 前記コンピュータ可読プログラム・コードが、前記少なくとも1つのプロセッサに、
データ非特定化プロセスごとに一連のテンプレートを生成させ、各テンプレートが、前記データ非特定化プロセスの構成の選択肢の関連付けられたセットを指定する、請求項17乃至22のいずれかに記載のコンピュータ・プログラム。 - 前記コンピュータ可読プログラム・コードが、前記少なくとも1つのプロセッサに、
生成されたデータセットにプライバシーの脆弱性がないことを識別し、前記識別された生成されたデータセットより一般化され情報を含むデータセットを生成する、対応するデータ非特定化プロセスの構成の選択肢の他の関連付けられたセットに関する処理を終了することによって、前記非特定化の処理時間を減らすことをさらに実行させる、請求項17乃至23のいずれかに記載のコンピュータ・プログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US15/843,049 US10915662B2 (en) | 2017-12-15 | 2017-12-15 | Data de-identification based on detection of allowable configurations for data de-identification processes |
US15/843,049 | 2017-12-15 | ||
PCT/IB2018/059453 WO2019116137A1 (en) | 2017-12-15 | 2018-11-29 | Data de-identification based on detection of allowable configurations for data de-identification processes |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2021507360A JP2021507360A (ja) | 2021-02-22 |
JP2021507360A5 true JP2021507360A5 (ja) | 2021-04-01 |
JP7106643B2 JP7106643B2 (ja) | 2022-07-26 |
Family
ID=66816142
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020531745A Active JP7106643B2 (ja) | 2017-12-15 | 2018-11-29 | データを非特定化する方法、データを非特定化するためのシステム、および非データを特定化するためのコンピュータ・プログラム |
Country Status (6)
Country | Link |
---|---|
US (1) | US10915662B2 (ja) |
JP (1) | JP7106643B2 (ja) |
CN (1) | CN111417954B (ja) |
DE (1) | DE112018005725T5 (ja) |
GB (1) | GB2581762A (ja) |
WO (1) | WO2019116137A1 (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10915662B2 (en) * | 2017-12-15 | 2021-02-09 | International Business Machines Corporation | Data de-identification based on detection of allowable configurations for data de-identification processes |
GB2584910A (en) * | 2019-06-21 | 2020-12-23 | Imperial College Innovations Ltd | Assessing likelihood of re-identification |
EP3817002A1 (en) * | 2019-10-30 | 2021-05-05 | Gotthardt Healthgroup AG | System for anonymizing patient data |
CN110929494A (zh) * | 2019-12-06 | 2020-03-27 | 宏图智能物流股份有限公司 | 一种基于层次树的报表下拉框的生成方法 |
US11456996B2 (en) | 2019-12-10 | 2022-09-27 | International Business Machines Corporation | Attribute-based quasi-identifier discovery |
CN112446597B (zh) * | 2020-11-14 | 2024-01-12 | 西安电子科技大学 | 贮箱质量评估方法、系统、存储介质、计算机设备及应用 |
US11392487B2 (en) * | 2020-11-16 | 2022-07-19 | International Business Machines Corporation | Synthetic deidentified test data |
US20220318669A1 (en) * | 2021-04-01 | 2022-10-06 | Salesforce.Com, Inc. | Training a machine learning model using structured data |
US11763026B2 (en) * | 2021-05-11 | 2023-09-19 | International Business Machines Corporation | Enabling approximate linkage of datasets over quasi-identifiers |
CN117370827A (zh) * | 2023-12-07 | 2024-01-09 | 飞特质科(北京)计量检测技术有限公司 | 一种基于深度聚类模型的风机质量等级评估方法 |
Family Cites Families (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050038788A1 (en) * | 2003-08-14 | 2005-02-17 | International Business Machines Corporation | Annotation security to prevent the divulgence of sensitive information |
EP1723596A1 (en) * | 2004-02-27 | 2006-11-22 | Accenture Global Services GmbH | System for individualized customer interaction |
US8132259B2 (en) * | 2007-01-04 | 2012-03-06 | International Business Machines Corporation | System and method for security planning with soft security constraints |
JP5042667B2 (ja) * | 2007-03-05 | 2012-10-03 | 株式会社日立製作所 | 情報出力装置、情報出力方法、及び、情報出力プログラム |
CA2679800A1 (en) * | 2008-09-22 | 2010-03-22 | University Of Ottawa | Re-identification risk in de-identified databases containing personal information |
JP2010086179A (ja) * | 2008-09-30 | 2010-04-15 | Oki Electric Ind Co Ltd | 情報処理装置、コンピュータプログラムおよび記録媒体 |
US8209342B2 (en) * | 2008-10-31 | 2012-06-26 | At&T Intellectual Property I, Lp | Systems and associated computer program products that disguise partitioned data structures using transformations having targeted distributions |
CA2690788C (en) * | 2009-06-25 | 2018-04-24 | University Of Ottawa | System and method for optimizing the de-identification of datasets |
US20110258206A1 (en) * | 2010-03-19 | 2011-10-20 | University Of Ottawa | System and method for evaluating marketer re-identification risk |
WO2013121739A1 (ja) * | 2012-02-17 | 2013-08-22 | 日本電気株式会社 | 匿名化装置及び匿名化方法 |
KR101581196B1 (ko) | 2012-03-01 | 2015-12-30 | 시스-테크 솔루션스 인코포레이티드 | 마킹된 특징부에서 유래된 고유 식별 정보 |
US9665722B2 (en) * | 2012-08-10 | 2017-05-30 | Visa International Service Association | Privacy firewall |
TW201426578A (zh) * | 2012-12-27 | 2014-07-01 | Ind Tech Res Inst | 匿名資料集的產生方法及裝置與風險評估方法及裝置 |
US9665883B2 (en) * | 2013-09-13 | 2017-05-30 | Acxiom Corporation | Apparatus and method for bringing offline data online while protecting consumer privacy |
US10043035B2 (en) * | 2013-11-01 | 2018-08-07 | Anonos Inc. | Systems and methods for enhancing data protection by anonosizing structured and unstructured data and incorporating machine learning and artificial intelligence in classical and quantum computing environments |
CA2852253A1 (en) * | 2014-05-23 | 2015-11-23 | University Of Ottawa | System and method for shifting dates in the de-identification of datesets |
US9870381B2 (en) | 2015-05-22 | 2018-01-16 | International Business Machines Corporation | Detecting quasi-identifiers in datasets |
US10395059B2 (en) * | 2015-07-15 | 2019-08-27 | Privacy Analytics Inc. | System and method to reduce a risk of re-identification of text de-identification tools |
US10380381B2 (en) * | 2015-07-15 | 2019-08-13 | Privacy Analytics Inc. | Re-identification risk prediction |
US10685138B2 (en) * | 2015-07-15 | 2020-06-16 | Privacy Analytics Inc. | Re-identification risk measurement estimation of a dataset |
US10423803B2 (en) * | 2015-07-15 | 2019-09-24 | Privacy Analytics Inc. | Smart suppression using re-identification risk measurement |
JP6584861B2 (ja) * | 2015-08-19 | 2019-10-02 | Kddi株式会社 | プライバシ保護装置、方法及びプログラム |
JP2017174458A (ja) * | 2017-05-29 | 2017-09-28 | Keepdata株式会社 | 情報匿名化方法 |
US10915662B2 (en) * | 2017-12-15 | 2021-02-09 | International Business Machines Corporation | Data de-identification based on detection of allowable configurations for data de-identification processes |
-
2017
- 2017-12-15 US US15/843,049 patent/US10915662B2/en active Active
-
2018
- 2018-11-29 CN CN201880073512.7A patent/CN111417954B/zh active Active
- 2018-11-29 DE DE112018005725.9T patent/DE112018005725T5/de active Pending
- 2018-11-29 GB GB2009760.6A patent/GB2581762A/en active Pending
- 2018-11-29 WO PCT/IB2018/059453 patent/WO2019116137A1/en active Application Filing
- 2018-11-29 JP JP2020531745A patent/JP7106643B2/ja active Active
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2021507360A5 (ja) | ||
GB2581762A (en) | Data de-identification based on detection of allowable configurations for data de-identification processes | |
Han et al. | Malware analysis using visualized image matrices | |
US8468605B2 (en) | Identifying security vulnerability in computer software | |
US8914890B2 (en) | Determining the vulnerability of computer software applications to privilege-escalation attacks | |
US8806648B2 (en) | Automatic classification of security vulnerabilities in computer software applications | |
JP2015508549A5 (ja) | モバイル環境用のトロイの木馬化されたアプリケーション(アプリ)を特定するためのコンピュータ実装方法、非一時コンピュータ読み取り可能な媒体およびコンピュータシステム | |
MX2020007870A (es) | Sistema de creacion de sitio web para crear sitios web que tienen al menos una serie de paginas web direccionales y metodos relacionados. | |
WO2020253351A1 (zh) | 一种点击劫持漏洞检测方法、装置及计算机设备 | |
Mercaldo et al. | Hey malware, i can find you! | |
US9471790B2 (en) | Remediation of security vulnerabilities in computer software | |
US9716700B2 (en) | Code analysis for providing data privacy in ETL systems | |
KR102427782B1 (ko) | 인접 행렬 기반의 악성 코드 탐지 및 분류 장치와 악성 코드 탐지 및 분류 방법 | |
CN114282256B (zh) | 一种基于秘密分享的排序打乱方法和恢复方法 | |
US10313369B2 (en) | Blocking malicious internet content at an appropriate hierarchical level | |
SG10201710656YA (en) | Program, information processing apparatus and method | |
CN114153808A (zh) | 一种基于秘密分享的排序方法和系统 | |
EP3186723A1 (en) | Static program analysis in an object-relational mapping framework | |
US10902135B1 (en) | Thwarting data leakage from a webpage | |
Nakamura et al. | Towards detection and analysis of interlanguage clones for multilingual web applications | |
US11381596B1 (en) | Analyzing and mitigating website privacy issues by automatically classifying cookies | |
ATE493705T1 (de) | Deterministische regelbasierte verteilung von objekten an objektverarbeitenden code | |
CN114338017A (zh) | 一种基于秘密分享的排序方法和系统 | |
JP6710716B2 (ja) | 脅威情報評価装置、脅威情報評価方法およびプログラム | |
JP6740184B2 (ja) | 付与装置、付与方法および付与プログラム |