KR20180060390A - 목적에 따라 비식별화된 데이터를 최적화하는 방법 및 장치 - Google Patents
목적에 따라 비식별화된 데이터를 최적화하는 방법 및 장치 Download PDFInfo
- Publication number
- KR20180060390A KR20180060390A KR1020160159827A KR20160159827A KR20180060390A KR 20180060390 A KR20180060390 A KR 20180060390A KR 1020160159827 A KR1020160159827 A KR 1020160159827A KR 20160159827 A KR20160159827 A KR 20160159827A KR 20180060390 A KR20180060390 A KR 20180060390A
- Authority
- KR
- South Korea
- Prior art keywords
- data
- condition
- size class
- level
- class
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 66
- 238000005457 optimization Methods 0.000 claims abstract description 61
- 230000003247 decreasing effect Effects 0.000 claims abstract description 22
- 238000010586 diagram Methods 0.000 description 16
- 230000008569 process Effects 0.000 description 7
- 230000014509 gene expression Effects 0.000 description 4
- 230000015556 catabolic process Effects 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- 230000000873 masking effect Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000001629 suppression Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013503 de-identification Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000012850 discrimination method Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000004984 smart glass Substances 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
- G06F21/6254—Protecting personal data, e.g. for financial or medical purposes by anonymising data, e.g. decorrelating personal data from the owner's identification
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W12/00—Security arrangements; Authentication; Protecting privacy or anonymity
- H04W12/02—Protecting privacy or anonymity, e.g. protecting personally identifiable information [PII]
Landscapes
- Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Computer Security & Cryptography (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Bioethics (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Signal Processing (AREA)
- Computer Hardware Design (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
도 2는 일반화 및 일반화 단계(level)를 설명하기 위한 제1 예시도이다.
도 3은 일반화 및 일반화 단계를 설명하기 위한 제2 예시도이다.
도 4는 비식별화된 테이블에 대한 예시도이다.
도 5는 최적화 대상 테이블에 대한 예시도이다.
도 6은 본 발명의 일 실시예에 따른 비식별화된 데이터를 최적화하는 제1 방법에 대한 흐름도이다.
도 7은 빅 사이즈 클래스에 대하여 일반화 레벨을 감소한 결과를 설명하기 위한 예시도이다.
도 8은 익명화 알고리즘의 조건을 만족하지 않게된 레코드에 대한 처리 방법을 설명하는 예시도이다.
도 9는 일반화 레벨을 감소하여 재구성된 비식별화 테이블에 대한 정보를 사용자에게 제공하는 사용자 인터페이스에 대한 예시도이다.
도 10은 본 발명의 일 실시예에 따른 비식별화된 데이터를 최적화하는 제1 방법에 따라 재구성된 비식별화 테이블에 관한 예시도이다.
도 11은 본 발명의 일 실시예에 따른 비식별화된 데이터를 최적화하는 제2 방법에 대한 흐름도이다.
도 12는 본 발명의 일 실시예에 따른 비식별화된 데이터의 최적화 장치에 대한 구성도이다.
Claims (20)
- 익명화 알고리즘의 조건을 만족하도록 선택된 일반화 레벨(selected level)로 비식별화된 최적화 대상 테이블을 획득하는 단계;
상기 최적화 대상 테이블에서 빅 사이즈 클래스(big size class)를 선정하는 단계;
상기 빅 사이즈 클래스에 포함된 레코드에 대하여, 일반화 레벨을 감소시켜 상기 익명화 알고리즘의 조건을 만족하는 제1 데이터를 도출하는 단계; 및
상기 빅 사이즈 클래스 내에서 상기 제1 데이터를 제외한 나머지 데이터에 대하여, 상기 선택된 일반화 레벨(selected level)로 비식별화하여 제2 데이터를 도출하는 단계를 포함하는, 비식별화된 데이터의 최적화 방법. - 청구항 1에 있어서,
상기 빅 사이즈 클래스는,
상기 최적화 대상 테이블에 존재하는 동등 클래스(equivalence class) 중에서 상기 익명화 알고리즘의 조건을 기초로 결정된 빅 사이즈 임계 조건을 만족하는 클래스를 포함하는, 비식별화된 데이터의 최적화 방법. - 청구항 1에 있어서,
상기 제1 데이터를 도출하는 단계는,
사용자로부터 입력된 속성 우선순위를 고려하여 익명화 레벨을 감소시키는, 비식별화된 데이터의 최적화 방법. - 청구항 3에 있어서,
상기 제1 데이터를 도출하는 단계는,
상기 속성 우선순위가 높은 속성에 대한 일반화 레벨을 우선적으로 감소시키는, 비식별화된 데이터의 최적화 방법. - 청구항 1에 있어서,
상기 최적화 대상 테이블에 대하여 상기 빅 사이즈 클래스 내의 데이터를 상기 제1 데이터 및 상기 제2 데이터로 치환하여 재구성된 비식별화 테이블을 획득하는 단계를 더 포함하는, 비식별화된 데이터의 최적화 방법. - 청구항 5에 있어서,
상기 제2 데이터 중에서, 상기 익명화 알고리즘의 조건을 만족하는 제3 데이터 및 상기 익명화 알고리즘의 조건을 만족하지 않는 제4 데이터를 확인하는 단계; 및
상기 제1 데이터, 상기 제3 데이터 및 상기 제4 데이터가 각각 상기 재구성된 비식별화 테이블에서 차지하는 비율을 사용자에게 제공하는 단계를 더 포함하는, 비식별화된 데이터의 최적화 방법. - 청구항 5에 있어서,
상기 재구성된 비식별화 테이블을 상기 최적화 대상 테이블로 하여 상기 빅 사이즈 클래스를 선정하는 단계부터 재수행하는 단계를 더 포함하는, 비식별화된 데이터의 최적화 방법. - 익명화 알고리즘의 조건을 만족하도록 선택된 일반화 레벨(selected level)로 비식별화된 최적화 대상 테이블을 획득하는 단계;
상기 최적화 대상 테이블에서 스몰 사이즈 클래스(small size class)를 선정하는 단계; 및
상기 스몰 사이즈 클래스에 포함된 레코드에 대하여, 일반화 레벨을 증가시켜 상기 익명화 알고리즘의 조건을 만족하는 제1 데이터 및 상기 익명화 알고리즘의 조건을 만족하지 않는 제2 데이터를 도출하는 단계를 포함하는, 비식별화된 데이터의 최적화 방법. - 청구항 8에 있어서,
상기 제2 데이터를 도출하는 단계는,
사용자로부터 입력된 속성 우선순위를 고려하여 일반화 레벨을 증가시키는, 비식별화된 데이터의 최적화 방법. - 청구항 8에 있어서,
상기 제2 데이터를 도출하는 단계는,
사용자로부터 입력된 타겟 속성(target attribute)는 제외하고 나머지 속성에 대해서 일반화 레벨을 증가시키는, 비식별화된 데이터의 최적화 방법. - 청구항 8에 있어서,
상기 스몰 사이즈 클래스는,
상기 최적화 대상 테이블에 존재하는 동등 클래스(equivalence class) 중에서 상기 익명화 알고리즘의 조건을 기초로 결정된 스몰 사이즈 임계 조건을 만족하는 클래스를 포함하는, 비식별화된 데이터의 최적화 방법. - 청구항 8에 있어서,
상기 최적화 대상 테이블에 대하여 상기 스몰 사이즈 클래스 내의 데이터를 상기 제1 데이터 및 상기 제2 데이터로 치환하여 재구성된 비식별화 테이블을 획득하는 단계를 더 포함하는, 비식별화된 데이터의 최적화 방법. - 청구항 12에 있어서,
상기 재구성된 비식별화 테이블을 상기 최적화 대상 테이블로 하여 상기 스몰 사이즈 클래스를 선정하는 단계부터 상기 재구성된 비식별화 테이블을 획득하는 단계까지 재수행하는 단계를 더 포함하는, 비식별화된 데이터의 최적화 방법. - 적어도 하나의 명령어를 실행하는 프로세서(processor, 11) 및
상기 적어도 하나의 명령어를 저장하는 메모리(memory, 12)를 포함하는 비식별화된 데이터의 최적화 장치에서,
상기 프로세서는,
익명화 알고리즘의 조건을 만족하도록 선택된 일반화 레벨(selected level)로 비식별화된 최적화 대상 테이블을 획득하고, 상기 최적화 대상 테이블에서 빅 사이즈 클래스(big size class)를 선정하고, 상기 빅 사이즈 클래스에 포함된 레코드에 대하여, 일반화 레벨을 감소시켜 상기 익명화 알고리즘의 조건을 만족하는 제1 데이터를 도출하고, 상기 빅 사이즈 클래스 내에서 상기 제1 데이터를 제외한 나머지 데이터에 대하여, 상기 선택된 일반화 레벨(selected level)로 비식별화하여 제2 데이터를 도출하는, 비식별화된 데이터의 최적화 장치. - 청구항 14에 있어서,
상기 프로세서는,
상기 최적화 대상 테이블에 대하여 상기 빅 사이즈 클래스 내의 데이터를 상기 제1 데이터 및 상기 제2 데이터로 치환하여 재구성된 비식별화 테이블을 획득하는, 비식별화된 데이터의 최적화 장치. - 청구항 15에 있어서,
상기 프로세서는,
상기 재구성된 비식별화 테이블에서 스몰 사이즈 클래스(small size class)를 선정하고, 상기 스몰 사이즈 클래스에 포함된 레코드에 대하여, 일반화 레벨을 증가시켜 상기 익명화 알고리즘의 조건을 만족하는 제3 데이터 및 상기 익명화 알고리즘의 조건을 만족하지 않는 제4 데이터를 도출하는, 비식별화된 데이터의 최적화 장치. - 청구항 16에 있어서,
상기 프로세서는,
상기 재구성된 비식별화 테이블에 대하여 상기 스몰 사이즈 클래스 내의 데이터를 상기 제1 데이터 및 상기 제2 데이터로 치환하여 2차 재구성된 비식별화 테이블을 획득하는, 비식별화된 데이터의 최적화 장치. - 청구항 14에 있어서,
상기 빅 사이즈 클래스는,
상기 최적화 대상 테이블에 존재하는 동등 클래스(equivalence class) 중에서 상기 익명화 알고리즘의 조건을 기초로 결정된 빅 사이즈 임계 조건을 만족하는 클래스를 포함하는, 비식별화된 데이터의 최적화 장치. - 청구항 16에 있어서,
상기 스몰 사이즈 클래스는,
상기 재구성된 비식별화 테이블에 존재하는 동등 클래스(equivalence class) 중에서 상기 익명화 알고리즘의 조건을 기초로 결정된 스몰 사이즈 임계 조건을 만족하는 클래스를 포함하는, 비식별화된 데이터의 최적화 장치. - 청구항 16에 있어서,
상기 프로세서는,
사용자로부터 입력된 속성 우선순위를 고려하여 익명화 레벨을 증가시키거나 감소시키는, 비식별화된 데이터의 최적화 장치.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020160159827A KR101973949B1 (ko) | 2016-11-29 | 2016-11-29 | 목적에 따라 비식별화된 데이터를 최적화하는 방법 및 장치 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020160159827A KR101973949B1 (ko) | 2016-11-29 | 2016-11-29 | 목적에 따라 비식별화된 데이터를 최적화하는 방법 및 장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20180060390A true KR20180060390A (ko) | 2018-06-07 |
KR101973949B1 KR101973949B1 (ko) | 2019-04-30 |
Family
ID=62621450
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020160159827A KR101973949B1 (ko) | 2016-11-29 | 2016-11-29 | 목적에 따라 비식별화된 데이터를 최적화하는 방법 및 장치 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101973949B1 (ko) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20200026559A (ko) * | 2018-09-03 | 2020-03-11 | (주)아이알컴퍼니 | K-익명성 모델 이용 데이터 셋 비식별화 방법 및 장치 |
KR102129031B1 (ko) * | 2020-02-27 | 2020-07-02 | 주식회사 지란지교데이터 | 동영상 내의 보안정보 비식별화 방법 및 장치 |
WO2020241943A1 (ko) * | 2019-05-31 | 2020-12-03 | 주식회사 보아라 | 빅데이터의 비식별화 처리방법 |
KR20230029048A (ko) | 2021-08-23 | 2023-03-03 | 한국전자통신연구원 | 운전자 이미지 데이터셋 비식별화 방법 및 장치 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011113285A (ja) * | 2009-11-26 | 2011-06-09 | Kddi Corp | 公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラム |
JP2011128862A (ja) * | 2009-12-17 | 2011-06-30 | Kddi Corp | 公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラム |
WO2013031997A1 (ja) * | 2011-09-02 | 2013-03-07 | 日本電気株式会社 | 匿名化装置、及び、匿名化方法 |
WO2013121739A1 (ja) * | 2012-02-17 | 2013-08-22 | 日本電気株式会社 | 匿名化装置及び匿名化方法 |
JP2015046030A (ja) * | 2013-08-28 | 2015-03-12 | 株式会社日立ソリューションズ | パーソナル情報匿名化システム |
-
2016
- 2016-11-29 KR KR1020160159827A patent/KR101973949B1/ko active IP Right Grant
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011113285A (ja) * | 2009-11-26 | 2011-06-09 | Kddi Corp | 公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラム |
JP2011128862A (ja) * | 2009-12-17 | 2011-06-30 | Kddi Corp | 公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラム |
WO2013031997A1 (ja) * | 2011-09-02 | 2013-03-07 | 日本電気株式会社 | 匿名化装置、及び、匿名化方法 |
WO2013121739A1 (ja) * | 2012-02-17 | 2013-08-22 | 日本電気株式会社 | 匿名化装置及び匿名化方法 |
JP2015046030A (ja) * | 2013-08-28 | 2015-03-12 | 株式会社日立ソリューションズ | パーソナル情報匿名化システム |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20200026559A (ko) * | 2018-09-03 | 2020-03-11 | (주)아이알컴퍼니 | K-익명성 모델 이용 데이터 셋 비식별화 방법 및 장치 |
WO2020241943A1 (ko) * | 2019-05-31 | 2020-12-03 | 주식회사 보아라 | 빅데이터의 비식별화 처리방법 |
KR20220027961A (ko) * | 2019-05-31 | 2022-03-08 | 주식회사 보아라 | 빅데이터의 비식별화 처리방법 |
US11941153B2 (en) | 2019-05-31 | 2024-03-26 | Boala Co., Ltd. | De-identification method for big data |
KR102129031B1 (ko) * | 2020-02-27 | 2020-07-02 | 주식회사 지란지교데이터 | 동영상 내의 보안정보 비식별화 방법 및 장치 |
KR20230029048A (ko) | 2021-08-23 | 2023-03-03 | 한국전자통신연구원 | 운전자 이미지 데이터셋 비식별화 방법 및 장치 |
Also Published As
Publication number | Publication date |
---|---|
KR101973949B1 (ko) | 2019-04-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI718643B (zh) | 異常群體識別方法及裝置 | |
US10817621B2 (en) | Anonymization processing device, anonymization processing method, and program | |
US11449674B2 (en) | Utility-preserving text de-identification with privacy guarantees | |
US9892278B2 (en) | Focused personal identifying information redaction | |
US10360405B2 (en) | Anonymization apparatus, and program | |
KR101973949B1 (ko) | 목적에 따라 비식별화된 데이터를 최적화하는 방법 및 장치 | |
US10289869B2 (en) | Personal information anonymization method, recording medium, and information processing apparatus | |
US10565399B2 (en) | Bottom up data anonymization in an in-memory database | |
US20150033356A1 (en) | Anonymization device, anonymization method and computer readable medium | |
US10810377B2 (en) | Method and system for information retreival | |
KR102345142B1 (ko) | 개인정보 보호를 위한 비식별화 방법 및 장치 | |
US10528761B2 (en) | Data anonymization in an in-memory database | |
US20220019689A1 (en) | Privacy Preserving Server-Side Personalized Content Selection | |
EP3040900B1 (en) | Data securing device, data securing program, and data securing method | |
WO2021169217A1 (zh) | 摘要提取方法、装置、设备及计算机可读存储介质 | |
KR102227593B1 (ko) | 학습-기반 그룹 태깅을 위한 시스템 및 방법 | |
JP2015114871A (ja) | 公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラム | |
CN107491484B (zh) | 一种数据匹配方法、装置及设备 | |
JP2019204246A (ja) | 学習データ作成方法及び学習データ作成装置 | |
EP4427146A1 (en) | Query-based database redaction | |
US11874951B2 (en) | System and method for risk aware data anonymization | |
CN112182116B (zh) | 数据探查方法及装置 | |
KR101948603B1 (ko) | 데이터의 유용성 보존을 위한 익명화 장치 및 그 방법 | |
CN103488693A (zh) | 数据处理装置和数据处理方法 | |
CN108062379B (zh) | 数据处理方法、平台、装置和计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20161129 |
|
PA0201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20180110 Patent event code: PE09021S01D |
|
PG1501 | Laying open of application | ||
E90F | Notification of reason for final refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Final Notice of Reason for Refusal Patent event date: 20180710 Patent event code: PE09021S02D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20190128 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20190424 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20190424 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20220405 Start annual number: 4 End annual number: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20230417 Start annual number: 5 End annual number: 5 |
|
PR1001 | Payment of annual fee |
Payment date: 20240402 Start annual number: 6 End annual number: 6 |