JP2021507360A5 - - Google Patents

Download PDF

Info

Publication number
JP2021507360A5
JP2021507360A5 JP2020531745A JP2020531745A JP2021507360A5 JP 2021507360 A5 JP2021507360 A5 JP 2021507360A5 JP 2020531745 A JP2020531745 A JP 2020531745A JP 2020531745 A JP2020531745 A JP 2020531745A JP 2021507360 A5 JP2021507360 A5 JP 2021507360A5
Authority
JP
Japan
Prior art keywords
data
dataset
identifiers
generated
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020531745A
Other languages
English (en)
Other versions
JP2021507360A (ja
JP7106643B2 (ja
Filing date
Publication date
Priority claimed from US15/843,049 external-priority patent/US10915662B2/en
Application filed filed Critical
Publication of JP2021507360A publication Critical patent/JP2021507360A/ja
Publication of JP2021507360A5 publication Critical patent/JP2021507360A5/ja
Application granted granted Critical
Publication of JP7106643B2 publication Critical patent/JP7106643B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Claims (24)

  1. プロセッサを含むコンピュータ・システムによりデータを非特定化する方法であって、
    前記プロセッサを介して、
    データセットの実体を識別する1つまたは複数の識別子を決定することと、
    前記決定された1つまたは複数の識別子に関連付けられた1つまたは複数のデータ非特定化プロセスを識別することであって、各データ非特定化プロセスが、前記データセット内の保つべき情報を示す構成の選択肢の1つまたは複数のセットに関連付けられている、前記識別することと、
    前記構成の選択肢の関連付けられたセットに従って、前記データセットに対して前記識別されたデータ非特定化プロセスを実行し、変化する保たれた情報を含むデータセットを生成することと、
    プライバシーの脆弱性に関して、前記生成されたデータセットを評価し、前記評価に基づいて、データ非特定化プロセスおよび構成の選択肢の関連付けられたセットを選択することと、
    前記構成の選択肢の関連付けられたセットに従って、前記データセットに対して前記選択されたデータ非特定化プロセスを実行し、結果として得られる非特定化されたデータセットを生成することとを含む、方法。
  2. 前記1つまたは複数の識別子を決定することが、
    1つまたは複数の直接識別子を決定することをさらに含み、前記関連付けられたデータ非特定化プロセスがデータ・マスキング・プロセスを含む、請求項1に記載の方法。
  3. 前記1つまたは複数の識別子を決定することが、
    複数の準識別子を決定することをさらに含み、前記関連付けられたデータ非特定化プロセスがデータの一般化またはデータの抑制を含む、請求項1または2に記載の方法。
  4. 前記生成されたデータセットがテーブルの形態であり、前記識別されたデータ非特定化プロセスを実行することが、
    生成されたデータセットの2つ以上の列を統合して、前記2つ以上の列より詳細な情報を含む列を生成することをさらに含む、請求項1乃至3のいずれかに記載の方法。
  5. プライバシーの脆弱性に関して前記生成されたデータセットを評価することが、
    生成されたデータセット内の実体のデータと公開されているデータセット内の既知の実体のデータとの間のリンクの存在を決定して、前記生成されたデータセットのプライバシーの脆弱性を示すことをさらに含む、請求項1乃至4のいずれかに記載の方法。
  6. プライバシーの脆弱性に関して前記生成されたデータセットを評価することが、
    対応するデータ非特定化プロセスおよび構成の選択肢の関連付けられたセットによって導入された、生成されたデータセット内の準識別子のセットの存在を決定して、前記生成されたデータセットのプライバシーの脆弱性を示すことをさらに含む、請求項1乃至5のいずれかに記載の方法。
  7. データ非特定化プロセスごとに一連のテンプレートを生成することをさらに含み、各テンプレートが、前記データ非特定化プロセスの構成の選択肢の関連付けられたセットを指定する、請求項1乃至6のいずれかに記載の方法。
  8. 生成されたデータセットにプライバシーの脆弱性がないことを識別し、前記識別された生成されたデータセットより一般化され情報を含むデータセットを生成する、対応するデータ非特定化プロセスの構成の選択肢の他の関連付けられたセットに関する処理を終了することによって、前記非特定化の処理時間を減らすことをさらに含む、請求項1乃至7のいずれかに記載の方法。
  9. データを非特定化するためのシステムであって、
    データセットの実体を識別する1つまたは複数の識別子を決定することと、
    前記決定された1つまたは複数の識別子に関連付けられた1つまたは複数のデータ非特定化プロセスを識別することであって、各データ非特定化プロセスが、前記データセット内の保つべき情報を示す構成の選択肢の1つまたは複数のセットに関連付けられている、前記識別することと、
    前記構成の選択肢の関連付けられたセットに従って、前記データセットに対して前記識別されたデータ非特定化プロセスを実行し、変化する保たれた情報を含むデータセットを生成することと、
    プライバシーの脆弱性に関して、前記生成されたデータセットを評価し、前記評価に基づいて、データ非特定化プロセスおよび構成の選択肢の関連付けられたセットを選択することと、
    前記構成の選択肢の関連付けられたセットに従って、前記データセットに対して前記選択されたデータ非特定化プロセスを実行し、結果として得られる非特定化されたデータセットを生成することとを実行するように構成された少なくとも1つのプロセッサを備えている、システム。
  10. 前記1つまたは複数の識別子を決定することが、
    1つまたは複数の直接識別子を決定することをさらに含んでおり、前記関連付けられたデータ非特定化プロセスがデータ・マスキング・プロセスを含む、請求項9に記載のシステム。
  11. 前記1つまたは複数の識別子を決定することが、
    複数の準識別子を決定することをさらに含んでおり、前記関連付けられたデータ非特定化プロセスがデータの一般化またはデータの抑制を含む、請求項9又は10に記載のシステム。
  12. 前記生成されたデータセットがテーブルの形態であり、前記識別されたデータ非特定化プロセスを実行することが、
    生成されたデータセットの2つ以上の列を統合して、前記2つ以上の列より詳細な情報を含む列を生成することをさらに含む、請求項9乃至11のいずれかに記載のシステム。
  13. プライバシーの脆弱性に関して前記生成されたデータセットを評価することが、
    生成されたデータセット内の実体のデータと公開されているデータセット内の既知の実体のデータとの間のリンクの存在を決定して、前記生成されたデータセットのプライバシーの脆弱性を示すことをさらに含む、請求項9乃至12のいずれかに記載のシステム。
  14. プライバシーの脆弱性に関して前記生成されたデータセットを評価することが、
    対応するデータ非特定化プロセスおよび構成の選択肢の関連付けられたセットによって導入された、生成されたデータセット内の準識別子のセットの存在を決定して、前記生成されたデータセットのプライバシーの脆弱性を示すことをさらに含む、請求項9乃至13のいずれかに記載のシステム。
  15. 前記少なくとも1つのプロセッサが、
    データ非特定化プロセスごとに一連のテンプレートを生成するようにさらに構成されており、各テンプレートが、前記データ非特定化プロセスの構成の選択肢の関連付けられたセットを指定する、請求項9乃至14のいずれかに記載のシステム。
  16. 前記少なくとも1つのプロセッサが、
    生成されたデータセットにプライバシーの脆弱性がないことを識別し、前記識別された生成されたデータセットより一般化され情報を含むデータセットを生成する、対応するデータ非特定化プロセスの構成の選択肢の他の関連付けられたセットに関する処理を終了することによって、前記非特定化の処理時間を減らすようにさらに構成されている、請求項9乃至15のいずれかに記載のシステム。
  17. データを非特定化するためのコンピュータ・プログラムであって、少なくとも1つのプロセッサを含むコンピュータにより実行されることで、前記少なくとも1つのプロセッサに、
    データセットの実体を識別する1つまたは複数の識別子を決定することと、
    前記決定された1つまたは複数の識別子に関連付けられた1つまたは複数のデータ非特定化プロセスを識別することであって、各データ非特定化プロセスが、前記データセット内の保つべき情報を示す構成の選択肢の1つまたは複数のセットに関連付けられている、前記識別することと、
    前記構成の選択肢の関連付けられたセットに従って、前記データセットに対して前記識別されたデータ非特定化プロセスを実行し、変化する保たれた情報を含むデータセットを生成することと、
    プライバシーの脆弱性に関して、前記生成されたデータセットを評価し、前記評価に基づいて、データ非特定化プロセスおよび構成の選択肢の関連付けられたセットを選択することと、
    前記構成の選択肢の関連付けられたセットに従って、前記データセットに対して前記選択されたデータ非特定化プロセスを実行し、結果として得られる非特定化されたデータセットを生成することとを実行させる、コンピュータ・プログラム
  18. 前記1つまたは複数の識別子を決定することが、
    1つまたは複数の直接識別子を決定することをさらに含んでおり、前記関連付けられたデータ非特定化プロセスがデータ・マスキング・プロセスを含む、請求項17に記載のコンピュータ・プログラム
  19. 前記1つまたは複数の識別子を決定することが、
    複数の準識別子を決定することをさらに含んでおり、前記関連付けられたデータ非特定化プロセスがデータの一般化またはデータの抑制を含む、請求項17又は18に記載のコンピュータ・プログラム
  20. 前記生成されたデータセットがテーブルの形態であり、前記識別されたデータ非特定化プロセスを実行することが、
    生成されたデータセットの2つ以上の列を統合して、前記2つ以上の列より詳細な情報を含む列を生成することをさらに含む、請求項17乃至19のいずれかに記載のコンピュータ・プログラム
  21. プライバシーの脆弱性に関して前記生成されたデータセットを評価することが、
    生成されたデータセット内の実体のデータと公開されているデータセット内の既知の実体のデータとの間のリンクの存在を決定して、前記生成されたデータセットのプライバシーの脆弱性を示すことをさらに含む、請求項17乃至20のいずれかに記載のコンピュータ・プログラム
  22. プライバシーの脆弱性に関して前記生成されたデータセットを評価することが、
    対応するデータ非特定化プロセスおよび構成の選択肢の関連付けられたセットによって導入された、生成されたデータセット内の準識別子のセットの存在を決定して、前記生成されたデータセットのプライバシーの脆弱性を示すことをさらに含む、請求項17乃至21のいずれかに記載のコンピュータ・プログラム
  23. 前記コンピュータ可読プログラム・コードが、前記少なくとも1つのプロセッサに、
    データ非特定化プロセスごとに一連のテンプレートを生成させ、各テンプレートが、前記データ非特定化プロセスの構成の選択肢の関連付けられたセットを指定する、請求項17乃至22のいずれかに記載のコンピュータ・プログラム
  24. 前記コンピュータ可読プログラム・コードが、前記少なくとも1つのプロセッサに、
    生成されたデータセットにプライバシーの脆弱性がないことを識別し、前記識別された生成されたデータセットより一般化され情報を含むデータセットを生成する、対応するデータ非特定化プロセスの構成の選択肢の他の関連付けられたセットに関する処理を終了することによって、前記非特定化の処理時間を減らすことをさらに実行させる、請求項17乃至23のいずれかに記載のコンピュータ・プログラム
JP2020531745A 2017-12-15 2018-11-29 データを非特定化する方法、データを非特定化するためのシステム、および非データを特定化するためのコンピュータ・プログラム Active JP7106643B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US15/843,049 US10915662B2 (en) 2017-12-15 2017-12-15 Data de-identification based on detection of allowable configurations for data de-identification processes
US15/843,049 2017-12-15
PCT/IB2018/059453 WO2019116137A1 (en) 2017-12-15 2018-11-29 Data de-identification based on detection of allowable configurations for data de-identification processes

Publications (3)

Publication Number Publication Date
JP2021507360A JP2021507360A (ja) 2021-02-22
JP2021507360A5 true JP2021507360A5 (ja) 2021-04-01
JP7106643B2 JP7106643B2 (ja) 2022-07-26

Family

ID=66816142

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020531745A Active JP7106643B2 (ja) 2017-12-15 2018-11-29 データを非特定化する方法、データを非特定化するためのシステム、および非データを特定化するためのコンピュータ・プログラム

Country Status (6)

Country Link
US (1) US10915662B2 (ja)
JP (1) JP7106643B2 (ja)
CN (1) CN111417954B (ja)
DE (1) DE112018005725T5 (ja)
GB (1) GB2581762A (ja)
WO (1) WO2019116137A1 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10915662B2 (en) * 2017-12-15 2021-02-09 International Business Machines Corporation Data de-identification based on detection of allowable configurations for data de-identification processes
GB2584910A (en) * 2019-06-21 2020-12-23 Imperial College Innovations Ltd Assessing likelihood of re-identification
EP3817002A1 (en) * 2019-10-30 2021-05-05 Gotthardt Healthgroup AG System for anonymizing patient data
CN110929494A (zh) * 2019-12-06 2020-03-27 宏图智能物流股份有限公司 一种基于层次树的报表下拉框的生成方法
US11456996B2 (en) 2019-12-10 2022-09-27 International Business Machines Corporation Attribute-based quasi-identifier discovery
CN112446597B (zh) * 2020-11-14 2024-01-12 西安电子科技大学 贮箱质量评估方法、系统、存储介质、计算机设备及应用
US11392487B2 (en) * 2020-11-16 2022-07-19 International Business Machines Corporation Synthetic deidentified test data
US20220318669A1 (en) * 2021-04-01 2022-10-06 Salesforce.Com, Inc. Training a machine learning model using structured data
US11763026B2 (en) * 2021-05-11 2023-09-19 International Business Machines Corporation Enabling approximate linkage of datasets over quasi-identifiers
CN117370827A (zh) * 2023-12-07 2024-01-09 飞特质科(北京)计量检测技术有限公司 一种基于深度聚类模型的风机质量等级评估方法

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050038788A1 (en) * 2003-08-14 2005-02-17 International Business Machines Corporation Annotation security to prevent the divulgence of sensitive information
EP1723596A1 (en) * 2004-02-27 2006-11-22 Accenture Global Services GmbH System for individualized customer interaction
US8132259B2 (en) * 2007-01-04 2012-03-06 International Business Machines Corporation System and method for security planning with soft security constraints
JP5042667B2 (ja) * 2007-03-05 2012-10-03 株式会社日立製作所 情報出力装置、情報出力方法、及び、情報出力プログラム
CA2679800A1 (en) * 2008-09-22 2010-03-22 University Of Ottawa Re-identification risk in de-identified databases containing personal information
JP2010086179A (ja) * 2008-09-30 2010-04-15 Oki Electric Ind Co Ltd 情報処理装置、コンピュータプログラムおよび記録媒体
US8209342B2 (en) * 2008-10-31 2012-06-26 At&T Intellectual Property I, Lp Systems and associated computer program products that disguise partitioned data structures using transformations having targeted distributions
CA2690788C (en) * 2009-06-25 2018-04-24 University Of Ottawa System and method for optimizing the de-identification of datasets
US20110258206A1 (en) * 2010-03-19 2011-10-20 University Of Ottawa System and method for evaluating marketer re-identification risk
WO2013121739A1 (ja) * 2012-02-17 2013-08-22 日本電気株式会社 匿名化装置及び匿名化方法
KR101581196B1 (ko) 2012-03-01 2015-12-30 시스-테크 솔루션스 인코포레이티드 마킹된 특징부에서 유래된 고유 식별 정보
US9665722B2 (en) * 2012-08-10 2017-05-30 Visa International Service Association Privacy firewall
TW201426578A (zh) * 2012-12-27 2014-07-01 Ind Tech Res Inst 匿名資料集的產生方法及裝置與風險評估方法及裝置
US9665883B2 (en) * 2013-09-13 2017-05-30 Acxiom Corporation Apparatus and method for bringing offline data online while protecting consumer privacy
US10043035B2 (en) * 2013-11-01 2018-08-07 Anonos Inc. Systems and methods for enhancing data protection by anonosizing structured and unstructured data and incorporating machine learning and artificial intelligence in classical and quantum computing environments
CA2852253A1 (en) * 2014-05-23 2015-11-23 University Of Ottawa System and method for shifting dates in the de-identification of datesets
US9870381B2 (en) 2015-05-22 2018-01-16 International Business Machines Corporation Detecting quasi-identifiers in datasets
US10395059B2 (en) * 2015-07-15 2019-08-27 Privacy Analytics Inc. System and method to reduce a risk of re-identification of text de-identification tools
US10380381B2 (en) * 2015-07-15 2019-08-13 Privacy Analytics Inc. Re-identification risk prediction
US10685138B2 (en) * 2015-07-15 2020-06-16 Privacy Analytics Inc. Re-identification risk measurement estimation of a dataset
US10423803B2 (en) * 2015-07-15 2019-09-24 Privacy Analytics Inc. Smart suppression using re-identification risk measurement
JP6584861B2 (ja) * 2015-08-19 2019-10-02 Kddi株式会社 プライバシ保護装置、方法及びプログラム
JP2017174458A (ja) * 2017-05-29 2017-09-28 Keepdata株式会社 情報匿名化方法
US10915662B2 (en) * 2017-12-15 2021-02-09 International Business Machines Corporation Data de-identification based on detection of allowable configurations for data de-identification processes

Similar Documents

Publication Publication Date Title
JP2021507360A5 (ja)
GB2581762A (en) Data de-identification based on detection of allowable configurations for data de-identification processes
Han et al. Malware analysis using visualized image matrices
US8468605B2 (en) Identifying security vulnerability in computer software
US8914890B2 (en) Determining the vulnerability of computer software applications to privilege-escalation attacks
US8806648B2 (en) Automatic classification of security vulnerabilities in computer software applications
JP2015508549A5 (ja) モバイル環境用のトロイの木馬化されたアプリケーション(アプリ)を特定するためのコンピュータ実装方法、非一時コンピュータ読み取り可能な媒体およびコンピュータシステム
MX2020007870A (es) Sistema de creacion de sitio web para crear sitios web que tienen al menos una serie de paginas web direccionales y metodos relacionados.
WO2020253351A1 (zh) 一种点击劫持漏洞检测方法、装置及计算机设备
Mercaldo et al. Hey malware, i can find you!
US9471790B2 (en) Remediation of security vulnerabilities in computer software
US9716700B2 (en) Code analysis for providing data privacy in ETL systems
KR102427782B1 (ko) 인접 행렬 기반의 악성 코드 탐지 및 분류 장치와 악성 코드 탐지 및 분류 방법
CN114282256B (zh) 一种基于秘密分享的排序打乱方法和恢复方法
US10313369B2 (en) Blocking malicious internet content at an appropriate hierarchical level
SG10201710656YA (en) Program, information processing apparatus and method
CN114153808A (zh) 一种基于秘密分享的排序方法和系统
EP3186723A1 (en) Static program analysis in an object-relational mapping framework
US10902135B1 (en) Thwarting data leakage from a webpage
Nakamura et al. Towards detection and analysis of interlanguage clones for multilingual web applications
US11381596B1 (en) Analyzing and mitigating website privacy issues by automatically classifying cookies
ATE493705T1 (de) Deterministische regelbasierte verteilung von objekten an objektverarbeitenden code
CN114338017A (zh) 一种基于秘密分享的排序方法和系统
JP6710716B2 (ja) 脅威情報評価装置、脅威情報評価方法およびプログラム
JP6740184B2 (ja) 付与装置、付与方法および付与プログラム