JP6829762B2 - ビッグデータの非識別化処理方法 - Google Patents
ビッグデータの非識別化処理方法 Download PDFInfo
- Publication number
- JP6829762B2 JP6829762B2 JP2019517743A JP2019517743A JP6829762B2 JP 6829762 B2 JP6829762 B2 JP 6829762B2 JP 2019517743 A JP2019517743 A JP 2019517743A JP 2019517743 A JP2019517743 A JP 2019517743A JP 6829762 B2 JP6829762 B2 JP 6829762B2
- Authority
- JP
- Japan
- Prior art keywords
- abstraction
- value
- field
- data
- record
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims description 15
- 238000013503 de-identification Methods 0.000 title claims description 12
- 238000000034 method Methods 0.000 claims description 31
- 238000012545 processing Methods 0.000 claims description 30
- 238000004891 communication Methods 0.000 claims description 13
- 238000006243 chemical reaction Methods 0.000 claims description 10
- 238000007619 statistical method Methods 0.000 description 28
- 238000012937 correction Methods 0.000 description 16
- 238000004458 analytical method Methods 0.000 description 13
- 230000002441 reversible effect Effects 0.000 description 12
- 230000008520 organization Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000005070 sampling Methods 0.000 description 6
- 230000002411 adverse Effects 0.000 description 4
- 230000000873 masking effect Effects 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000005315 distribution function Methods 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 230000002427 irreversible effect Effects 0.000 description 2
- 239000003921 oil Substances 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000004883 computer application Methods 0.000 description 1
- 239000010779 crude oil Substances 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
- G06F21/6254—Protecting personal data, e.g. for financial or medical purposes by anonymising data, e.g. decorrelating personal data from the owner's identification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Bioethics (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Software Systems (AREA)
- Computer Security & Cryptography (AREA)
- Computer Hardware Design (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Data Mining & Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Storage Device Security (AREA)
Description
f(x): 無作為関数、ハッシュドメイン: (0...m−1)
前記テータ抽象化段階は、更に、前記抽象化身元テーブルに識別フィールドを付加する段階と、抽象化身元レコードの識別フィールドに識別値を割り当てる段階と、前記抽象化身元レコードに含まれる個人を特定するフィールドの値を前記識別値に対応させることで、該当識別値に該当する抽象化身元レコードに含まれた個人を特定する抽象化対象リストを生成する段階とを含み、前記テータ抽象化段階において、前記ログテーブルの複数のログレコードを、1つの抽象化ログレコードに抽象化することで、前記抽象化ログテーブルを生成し、
前記テータ抽象化段階は、前記抽象化ログテーブルに識別フィールドを付加する段階と、前記抽象化対象リストを参照して、前記ログテーブルのそれぞれのレコードのうち、前記抽象化身元レコードに含まれる複数の個人に対するログレコードを、1つの抽象化ログレコードに抽象化する段階と、該当抽象化身元レコードに割り当てられた識別値を含む識別値を、前記識別フィールドに割り当てる段階とを含むことにある。
前記テータ抽象化段階は、前記抽象化身元テーブルに識別フィールドを付加する段階と、前記抽象化対象リストを参照して、前記身元テーブルのそれぞれのレコードのうち、前記抽象化ログレコードに含まれる複数の個人に対する身元レコードを、1つの抽象化身元レコードに抽象化する段階と、該当抽象化ログレコードに割り当てられた識別値を含む識別値を、前記識別フィールドに割り当てる段階とを含むことにある。
111 処理部
112 格納部
113 通信部
120 ユーザ端末
Claims (4)
- 通信部、処理部、及び格納部を備えるデータサーバで行なわれるビッグデータの非識別化処理方法であって、
前記処理部が、有無線ネットワークを介して連結された端末から、前記通信部を介して収集されるデータを、前記データサーバの格納部に格納する段階と、
前記処理部が、前記格納部に格納された原本データを構成する原本レコードのうち、少なくとも2以上のレコードを組み合わせて、前記原本レコードとは異なるレコードを生成して抽象化データを生成するデータ抽象化段階とを含み、
前記データ抽象化段階は、
前記原本データを構成する前記原本レコードのそれぞれのフィールドの少なくとも1以上のフィールドを、抽象化基準フィールドに設定し、前記抽象化基準フィールド以外のフィールドの少なくとも1以上のフィールドを、抽象化対象フィールドに設定する段階と、
前記原本レコードのうち、前記抽象化基準フィールドの値が同一のレコードを少なくとも2以上選択する段階と、
前記選択された複数のレコードを、前記抽象化基準フィールドと前記抽象化対象フィールドを含む1つの抽象化レコードに抽象化し、前記抽象化レコードの前記抽象化基準フィールドの値は、前記選択された複数レコードの共通する該当フィールド値に割り当て、前記抽象化レコードの前記抽象化対象フィールドの値は、前記選択された複数レコードの該当フィールド値を代表する代表値に変換した後、これを該当抽象化対象フィールドの値に割り当てる段階と、
前記処理部が、前記抽象化レコードを、前記抽象化データのレコードとして前記格納部に格納する段階とを備え、
前記代表値を、該当抽象化対象フィールドの値に割り当てる前に、前記選択された原本レコードのうち、該当抽象化対象フィールドの値が、前記代表値と同一値を有するレコードがあるか否かを判断して、同一値を有するレコードがあると、前記選択された原本レコードの該当抽象化対象フィールドの値にはない他の値に該当代表値を補正して割り当てることを特徴とするビッグデータの非識別化処理方法。 - 前記データ抽象化段階の前に、更に、
前記処理部が、前記原本レコードを、前記抽象化基準フィールドの値を基準に整列する段階と、
前記整列された原本レコードを基に、前記抽象化基準フィールドの値が同一のレコードのうち、抽象化対象フィールドの値が、他のレコードの該当抽象化対象フィールドの値と比較して、所定の基準以上の偏差があると判断される場合、該当レコードを、抽象化対象から除く段階とを、備えることを特徴とする請求項1に記載のビッグデータの非識別化処理方法。 - 前記抽象化レコードは、更に、前記抽象化レコードに含まれる複数の原本レコードの前記抽象化基準フィールドのフィールド値の分布情報をフィールド値として有する分布値フィールド、又は前記抽象化レコードに含まれる複数の原本レコードの前記抽象化対象フィールドのフィールド値の分布情報をフィールド値として有する分布値フィールドの少なくともいずれか1つを含むことを特徴とする請求項1に記載のビッグデータの非識別化処理方法。
- 前記抽象化基準フィールド及び抽象化対象フィールド設定段階の以後に、前記原本レコードを、前記抽象化基準フィールドを基準に整列した後、整列順序に沿って、抽象化基準フィールドの値が同一の複数のレコードを選択し、前記データ抽象化段階を行って、前記抽象化データを生成し、
前記抽象化基準フィールドのいずれか1つの整列方式に従う抽象化データ生成が完了した後、前記抽象化基準フィールドの他の整列方式を適用して、前記原本レコードを整列した後、該当整列順序に沿って、前記抽象化基準フィールドの値が同一の複数のレコードを選択して、前記データ抽象化段階を再び行うことで、いずれか1つの原本レコードが、複数の抽象化レコードに含まれるように抽象化されることを特徴とする請求項1に記載のビッグデータの非識別化処理方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2016-0071747 | 2016-06-09 | ||
KR1020160071747A KR101784265B1 (ko) | 2016-06-09 | 2016-06-09 | 빅데이터의 비식별화 처리 방법 |
PCT/KR2016/006206 WO2017213281A1 (ko) | 2016-06-09 | 2016-06-10 | 빅데이터의 비식별화 처리 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019523958A JP2019523958A (ja) | 2019-08-29 |
JP6829762B2 true JP6829762B2 (ja) | 2021-02-10 |
Family
ID=60141322
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019517743A Active JP6829762B2 (ja) | 2016-06-09 | 2016-06-10 | ビッグデータの非識別化処理方法 |
Country Status (3)
Country | Link |
---|---|
JP (1) | JP6829762B2 (ja) |
KR (1) | KR101784265B1 (ja) |
WO (1) | WO2017213281A1 (ja) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019189969A1 (ko) * | 2018-03-30 | 2019-10-03 | 주식회사 그리즐리 | 빅데이터 개인정보 익명화 및 익명 데이터 결합 방법 |
KR102035796B1 (ko) * | 2018-07-26 | 2019-10-24 | 주식회사 딥핑소스 | 데이터를 비식별 처리하는 방법, 시스템 및 비일시성의 컴퓨터 판독 가능 기록 매체 |
US11941153B2 (en) * | 2019-05-31 | 2024-03-26 | Boala Co., Ltd. | De-identification method for big data |
KR102260039B1 (ko) * | 2019-08-13 | 2021-06-03 | 주식회사 딥핑소스 | 개인 정보 보호를 위하여 원본 데이터를 컨실링 처리하는 변조 네트워크를 학습하는 방법 및 테스트하는 방법, 그리고, 이를 이용한 학습 장치 및 테스트 장치 |
US10621378B1 (en) * | 2019-10-24 | 2020-04-14 | Deeping Source Inc. | Method for learning and testing user learning network to be used for recognizing obfuscated data created by concealing original data to protect personal information and learning device and testing device using the same |
US10621379B1 (en) * | 2019-10-24 | 2020-04-14 | Deeping Source Inc. | Method for training and testing adaption network corresponding to obfuscation network capable of processing data to be concealed for privacy, and training device and testing device using the same |
CN111182488B (zh) * | 2019-12-05 | 2022-09-16 | 诺得物流股份有限公司 | 一种基于时间信道的溯源数据节能传输方法 |
CN111382952B (zh) * | 2020-03-23 | 2022-06-28 | 福建省特种设备检验研究院 | 一种基于全面覆盖原则的电梯质量检查抽取方法 |
KR20220013314A (ko) | 2020-07-24 | 2022-02-04 | (주)이노코어 | 빅데이터 환경에서의 개인정보 비식별화 처리를 위한 데이터 필드 자동 분류 시스템 및 방법 |
US11023777B1 (en) * | 2020-09-25 | 2021-06-01 | Deeping Source Inc. | Methods for training and testing obfuscation network capable of performing distinct concealing processes for distinct regions of original image and learning and testing devices using the same |
US11244248B1 (en) * | 2020-10-21 | 2022-02-08 | Deeping Source Inc. | Method for training and testing user learning network to be used for recognizing obfuscated data created by obfuscating original data to protect personal information and user learning device and testing device using the same |
US11200342B1 (en) * | 2020-10-21 | 2021-12-14 | Deeping Source Inc. | Method for training and testing obfuscation network capable of processing data to be obfuscated for privacy, and training device and testing device using the same |
KR102504531B1 (ko) * | 2020-11-20 | 2023-02-28 | (주)디지탈쉽 | 데이터 통합 분석을 위한 데이터 수집 처리 장치 및 방법 |
CN115118458B (zh) * | 2022-05-31 | 2024-04-19 | 腾讯科技(深圳)有限公司 | 数据处理方法、装置、计算机设备及存储介质 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4146634B2 (ja) * | 2001-11-21 | 2008-09-10 | エヌ・シー・エル・コミュニケーション株式会社 | 2次情報利用システム |
JP3660667B2 (ja) * | 2003-07-29 | 2005-06-15 | 株式会社東芝 | データ処理装置、データ処理方法およびプログラム |
JP5048417B2 (ja) * | 2007-08-07 | 2012-10-17 | 株式会社富士通ビー・エス・シー | データベース管理プログラム及びデータベース管理装置 |
KR101021763B1 (ko) * | 2008-01-11 | 2011-03-15 | 주식회사 케이티 | Ims 기반의 유무선 복합망에서의 지능형 개인화 정보 생성 장치, 시스템 및 방법 |
JP2010086179A (ja) * | 2008-09-30 | 2010-04-15 | Oki Electric Ind Co Ltd | 情報処理装置、コンピュータプログラムおよび記録媒体 |
WO2010134440A1 (ja) * | 2009-05-19 | 2010-11-25 | 株式会社エヌ・ティ・ティ・ドコモ | データ結合システム及びデータ結合方法 |
WO2014050027A1 (ja) * | 2012-09-28 | 2014-04-03 | パナソニック株式会社 | 情報管理方法および情報管理システム |
KR101463974B1 (ko) * | 2014-05-26 | 2014-11-26 | (주)시엠아이코리아 | 마케팅을 위한 빅데이터 분석 시스템 및 방법 |
-
2016
- 2016-06-09 KR KR1020160071747A patent/KR101784265B1/ko active IP Right Grant
- 2016-06-10 JP JP2019517743A patent/JP6829762B2/ja active Active
- 2016-06-10 WO PCT/KR2016/006206 patent/WO2017213281A1/ko active Application Filing
Also Published As
Publication number | Publication date |
---|---|
JP2019523958A (ja) | 2019-08-29 |
KR101784265B1 (ko) | 2017-10-12 |
WO2017213281A1 (ko) | 2017-12-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6829762B2 (ja) | ビッグデータの非識別化処理方法 | |
KR101630752B1 (ko) | 유통용 비식별 빅데이터 처리 방법 | |
Zimmer et al. | A topology of Twitter research: disciplines, methods, and ethics | |
US20200005327A1 (en) | Email communication analysis | |
US20170330197A1 (en) | Methods and systems for managing compliance plans | |
US8819212B1 (en) | Delegation of data classification using common language | |
US20140006332A1 (en) | Scientometric Methods for Identifying Emerging Technologies | |
Mansouri et al. | IoT data quality issues and potential solutions: a literature review | |
CN115687787A (zh) | 产业政策目标群画像构建方法、系统及存储介质 | |
US8396877B2 (en) | Method and apparatus for generating a fused view of one or more people | |
CN105893212A (zh) | 审计数据安全管控及展示系统 | |
Fountzoula et al. | Decision‐Making Methods in the Public Sector during 2010–2020: A Systematic Review | |
KR101959213B1 (ko) | 침해 사고 예측 방법 및 그 장치 | |
Borradaile et al. | Whose tweets are surveilled for the police: an audit of a social-media monitoring tool via log files | |
McClure et al. | Conservation Letter: Monitoring Raptor Populations–A Call for Increased Global Collaboration and Survey Standardization | |
US11196751B2 (en) | System and method for controlling security access | |
Baumann et al. | Who Runs the Internet?-Classifying Autonomous Systems into Industries. | |
Li et al. | Quality factory and quality notification service in data warehouse | |
Shepherd et al. | Are ISO 15489‐1: 2001 and ISAD (G) compatible? Part 1 | |
KR102640123B1 (ko) | 빅데이터의 비식별화 처리방법 | |
KR101752259B1 (ko) | 고부가 가치화 콘텐츠 관리 장치 및 방법, 이를 구현하기 위한 프로그램이 저장된 기록매체 및 이를 구현하기 위해 매체에 저장된 컴퓨터프로그램 | |
Shrestha et al. | High-performance classification of phishing URLs using a multi-modal approach with MapReduce | |
CN112966024A (zh) | 一种基于大数据的金融风控数据分析系统 | |
CN109726178B (zh) | 非结构化文件的交互应用方法、装置、计算机设备和存储介质 | |
US20150324813A1 (en) | System and method for determining by an external entity the human hierarchial structure of an rganization, using public social networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20181207 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20191226 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200114 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20200121 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20200121 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200414 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200923 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201204 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210104 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210122 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6829762 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |