KR20150012226A - Anonymity management system for privacy information in bigdata having fixed form and free style data - Google Patents

Anonymity management system for privacy information in bigdata having fixed form and free style data Download PDF

Info

Publication number
KR20150012226A
KR20150012226A KR1020140117449A KR20140117449A KR20150012226A KR 20150012226 A KR20150012226 A KR 20150012226A KR 1020140117449 A KR1020140117449 A KR 1020140117449A KR 20140117449 A KR20140117449 A KR 20140117449A KR 20150012226 A KR20150012226 A KR 20150012226A
Authority
KR
South Korea
Prior art keywords
personal information
anonymized
data
converting
map
Prior art date
Application number
KR1020140117449A
Other languages
Korean (ko)
Other versions
KR101708014B1 (en
Inventor
이창하
Original Assignee
주식회사 바넷정보기술
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 바넷정보기술 filed Critical 주식회사 바넷정보기술
Priority to KR1020140117449A priority Critical patent/KR101708014B1/en
Publication of KR20150012226A publication Critical patent/KR20150012226A/en
Application granted granted Critical
Publication of KR101708014B1 publication Critical patent/KR101708014B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Databases & Information Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • Storage Device Security (AREA)

Abstract

The present invention relates to an anonymity management system for privacy information in big data having structured data and unstructured data. The anonymity management system includes: a storage unit to store big data having privacy information; a conversion unit to convert the privacy information included in the big data to anonymized data (anonymized privacy data) in order to distinguish between anonymized data and non-anonymized data; and a detection unit to detect the anonymized data and the non-anonymized data from the big data.

Description

정형 및 비정형 데이터를 포함하는 빅데이터에서의 개인정보 익명화 관리 시스템{ANONYMITY MANAGEMENT SYSTEM FOR PRIVACY INFORMATION IN BIGDATA HAVING FIXED FORM AND FREE STYLE DATA}BACKGROUND OF THE INVENTION 1. Field of the Invention [0001] The present invention relates to personal information anonymization management system for large data including fixed and unstructured data,

본 발명은 정형 및 비정형 데이터를 포함하는 빅데이터에서의 개인정보 익명화 관리 시스템에 관한 것이다. The present invention relates to a personal information anonymization management system in big data including fixed and unstructured data.

최근 빅데이터(bigdata)가 IT 기술의 트랜드로 급부상함에 따라 보호 이슈가 산업의 걸림돌이 되고 있다. 이러한 문제를 해결하여 관련 산업과 기업 간 데이터의 유통이 가능하도록 하기 위하여 정형 비정형 데이터 내에 포함된 개인정보를 검출하고 익명화하는 방법을 필요로 한다. 또한, 개인정보 보호법이 발효되면서 기존 DBMS 시스템 내에 컬럼으로 정의되어 저장하고 있는 수많은 정보들 중 개인정보가 저장된 컬럼들의 현황을 조사하고 IT 시스템이 지속적으로 변화함에 따라 개인정보들을 지속적으로 파악하고 관리할 필요성이 대두되었으며 수많은 DBMS의 카탈로그내에서 개인정보를 일일이 눈으로 파악하고 수작업으로 관리하는데 한계가 있어 개인정보보호를 위한 솔루션을 도입하더라도 관리비용이 현저히 증가하여 시스템을 잘 관리하는데 어려움을 안고 있다Recently, big data (bigdata) has emerged as a trend of IT technology, and protection issues are becoming a stumbling block to the industry. To solve this problem, it is necessary to detect and anonymize the personal information included in the stereotyped unstructured data in order to make it possible to distribute the data between related industries and companies. In addition, as the Personal Information Protection Act came into effect, we investigated the status of the columns in which personal information was stored among the numerous information defined and stored in the existing DBMS system, and constantly identify and manage personal information as the IT system continuously changes. The necessity has arisen and it is difficult to manage personal information in a lot of catalogs of DBMS because there is a limit to manage the personal information visually and manually, and even if a solution for protecting personal information is introduced, the management cost is remarkably increased and it is difficult to manage the system well

본 발명의 일 실시예에 따르면, 정형 및 비정형 데이터로 이루어진 빅데이터에 포함된 개인정보가 익명화되었는지 여부를 자동으로 검출하여 서면으로 보고할 수 있도록 함으로써, 개인정보 익명화 여부 조사 및 관리 비용을 최소화할 수 있는 빅데이터에서의 개인정보 익명화 관리 시스템과 개인정보 익명화 관리 프로그램이 제공될 수 있다.According to an embodiment of the present invention, it is possible to automatically detect whether personal information included in big data composed of fixed and unstructured data is anonymized and to report it in writing, thereby minimizing the cost of investigating and managing personal information anonymization A personal information anonymization management system and a personal information anonymization management program in a big data which can be provided.

본 발명의 다른 실시예에 따르면, 정형 및 비정형 데이터로 이루어진 빅데이터에 포함된 개인정보를, 원본 유추가 불가능한 방법으로 익명화하되, 익명화하지 않은 데이터와 익명화한 데이터를 구별할 수 있도록 익명화함으로써, 익명화하지 않은 데이터만 선별적으로 익명화를 할 수 있는 빅데이터에서의 개인정보 익명화 관리 시스템과 개인정보 익명화 관리 프로그램이 제공될 수 있다.According to another embodiment of the present invention, personal information included in big data composed of fixed and unstructured data is anonymized in a way that can not be guessed from the original, but anonymized so as to distinguish data that is not anonymized from data that is not anonymized, A personal information anonymization management system and a personal information anonymization management program in Big Data which can selectively anonymize data that is not available can be provided.

본 발명의 일 실시예에 따르면, 개인정보가 포함된 빅데이터를 저장하는 저장부; According to an embodiment of the present invention, there is provided an information processing apparatus comprising: a storage unit for storing big data including personal information;

익명화된 데이터와 익명화되지 않은 데이터를 구별할 수 있는 방법으로, 상기 빅데이터에 포함된 개인 정보를 익명화된 데이터('익명화된 개인 정보'라고 함)로 변환하는 변환부; 및 상기 빅데이터에 익명화된 개인정보와 익명화되지 않은 개인정보를 검출하는 검출부;를 포함하는 정형 및 비정형 데이터를 포함하는 빅데이터에서의 개인정보 익명화 관리 시스템이 제공될 수 있다. A conversion unit for converting the personal information included in the big data into anonymized data (referred to as 'anonymized personal information') as a method for distinguishing between anonymized data and non-anonymized data; And a detector for detecting personal information anonymized in the big data and non-anonymous personal information. The personal information anonymization management system in the big data including the fixed and unstructured data can be provided.

상기 검출부가, 상기 빅데이터에 익명화되지 않은 개인정보를 검출한 경우, 상기 변환부는 상기 검출부에 의해 검출된 익명화되지 않은 개인정보를, 익명화된 데이터와 익명화되지 않은 데이터를 구별할 수 있는 방법으로 변환하는 것일 수 있다. When the detecting unit detects the personal information that is not anonymized in the big data, the converting unit transforms the non-anonymized personal information detected by the detecting unit into a method capable of distinguishing the anonymous data from the non-anonymous data .

본 시스템은, 상기 검출부가 검출한 결과를 보고서로서 작성하는 보고서 작성부;를 더 포함하는 것일 수 있다. The system may further include a report preparation unit for preparing a result of the detection by the detection unit as a report.

상기 개인정보는 이름, 전화번호, 여권번호, 주소, 및 주민번호 중 적어도 어느 하나를 포함하는 것일 수 있다. The personal information may include at least one of a name, a telephone number, a passport number, an address, and a resident number.

상기 변환부는, 익명화할 개인정보의 일부('익명화 파트')만을 변환하되, 상기 익명화할 개인정보의 나머지 부분('비 익명화 파트') 중 적어도 일부를 이용하여, 변환하는 것일 수 있다. The conversion unit may convert only a part of the personal information to be anonymized ('anonymization part'), but convert at least a part of the remaining part of the personal information to be anonymized ('non-anonymized part').

상기 변환부에 의해 사용되는 맵(MAP)을 랜덤하게 생성하는 랜덤 맵(MAP) 발생부; 를 더 포함하며, 상기 변환부는, 상기 랜덤 맵 발생부에 의해 생성된 맵(MAP)을 사용하여 변환 동작을 수행하는 것일 수 있다. A random map generating unit for randomly generating a map used by the converting unit; And the converting unit may perform a converting operation using a map (MAP) generated by the random map generating unit.

상기 개인정보가 n(여기서, n은 자연수임)자리로 이루어진 데이터인 경우, If the personal information is data consisting of n (where n is a natural number)

상기 랜덤 맵 발생부는 상기 맵을 n개 생성하며,The random map generator generates n maps,

상기 변환부는 상기 개인정보의 자리별로 상기 n개의 맵을 각각 사용하여 변환하는 것일 수 있다. And the converting unit may use the n maps for each place of the personal information and convert the maps.

상기 랜덤 맵 발생부에 의해 생성된 맵(MAP)을 암호화하거나 복호화하는 암복호화부; 를 더 포함하며, 상기 랜덤 맵(MAP) 발생부에 의해 생성된 맵(MAP)은 상기 암복호화부에 의해 암호화되어 상기 저장부에 저장되어 있다가, 상기 변환부에 의해 사용될 때에만 상기 암복화부에 의해 복호화된 후에 사용되는 것일 수 있다. An encryption / decryption unit for encrypting or decrypting a map (MAP) generated by the random map generation unit; (MAP) generated by the random map generation unit is encrypted by the encryption / decryption unit and stored in the storage unit, and only when used by the conversion unit, And may be used after being decoded by < RTI ID = 0.0 >

상기 변환부는, 상기 주민번호를 익명화된 데이터로 변환할 때는, 상기 주민번호의 일부를 유효하지 않은 데이터로 대치하는 것일 수 있다. The conversion unit may replace part of the resident number with invalid data when converting the resident number into anonymized data.

상기 변환부는, 상기 개인 정보를 익명화 데이터로 변환할 때, 체크 디지트를 추가하는 것일 수 있다. The conversion unit may add a check digit when converting the personal information into anonymized data.

상기 변환부는, 상기 개인 정보를 익명화 데이터로 변환할 때, 상기 개인 정보의 일부를 캐릭터-문자, 숫자, 및/또는 기호-로 대치하는 것일 수 있다. The converting unit may replace part of the personal information with a character-character, a number, and / or a symbol when converting the personal information into anonymized data.

상기 변환부는, 상기 n개의 맵에 의해 변환된 익명화 데이터에, 체크 디지트를 추가하는 것일 수 있다. The conversion unit may add a check digit to the anonymized data converted by the n maps.

상기 변환부는, 상기 n개의 맵에 의해 변환된 익명화 데이터의 일부를 캐릭터-문자, 숫자, 및/또는 기호-로 대치하는 것일 수 있다. The conversion unit may replace a part of the anonymized data converted by the n maps with a character-character, a number, and / or a symbol.

본 발명의 다른 실시예에 따르면, 컴퓨터에, 익명화된 데이터와 익명화되지 않은 데이터를 구별할 수 있는 방법으로, 빅데이터에 포함된 개인 정보를 익명화된 데이터('익명화된 개인 정보'라고 함)로 변환하는 단계; 상기 빅데이터에 익명화된 개인정보와 익명화되지 않은 개인정보를 검출하는 단계;를 포함하는 방법을 실행시키기 위한 개인정보 익명화 관리 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체가 제공될 수 있다.According to another embodiment of the present invention, the personal information included in the big data is classified into anonymized data (referred to as 'anonymized personal information') in a manner that allows the computer to distinguish between the anonymized data and the non- Converting; And detecting personal information anonymized in the big data and personal information that is not anonymized. A computer-readable recording medium having recorded thereon a personal information anonymization management program for executing the method may be provided.

상기 검출하는 단계에서, 상기 빅데이터에 익명화되지 않은 개인정보를 검출한 경우, 상기 변환하는 단계는, 상기 검출하는 단계에서 검출된 익명화되지 않은 개인정보를, 익명화된 데이터와 익명화되지 않은 데이터를 구별할 수 있는 방법으로 변환하는 단계일 수 있다.Wherein, in the detecting step, when personal information that is not anonymized in the big data is detected, the converting step distinguishes the anonymized data and the anonymized data from the anonymized personal information detected in the detecting step And converting it into a method that can be performed.

상기 개인정보는 이름, 전화번호, 여권번호, 주소, 및 주민번호 중 적어도 어느 하나를 포함할 수 있다.The personal information may include at least one of a name, a telephone number, a passport number, an address, and a resident number.

상기 변환하는 단계는, 익명화할 개인정보의 일부('익명화 파트')만을 변환하되, 상기 익명화할 개인정보의 나머지 부분('비 익명화 파트') 중 적어도 일부를 이용하여, 변환하는 단계일 수 있다.The converting step may be a step of converting only a part of the personal information to be anonymized ('anonymizing part'), using at least part of the remaining part of the personal information to be anonymized ('non-anonymizing part') .

상기 변환하는 단계에서 사용되는 맵(MAP)을 랜덤하게 생성하는 랜덤 맵(MAP) 발생 단계; 를 더 포함하며, 상기 변환하는 단계는, 상기 랜덤 맵 발생부에 의해 생성된 맵(MAP)을 사용하여 변환 동작을 수행할 수 있다.A random map generating step of randomly generating a map used in the converting step; And the converting step may perform a converting operation using a map (MAP) generated by the random map generating unit.

상기 개인정보가 n(여기서, n은 자연수임)자리로 이루어진 데이터인 경우, If the personal information is data consisting of n (where n is a natural number)

상기 랜덤 맵 발생 단계는, 상기 맵을 n개 생성하며,Wherein the random map generating step generates n maps,

상기 변환하는 단계는, 상기 개인정보의 자리별로 상기 n개의 맵을 각각 사용하여 변환하는 것일 수 있다. The converting may be performed using the n maps for each place of the personal information.

상기 랜덤 맵 발생 단계에서 생성된 맵(MAP)을 암호화하거나 복호화하는 암복호화하는 단계; 를 더 포함하며, 상기 랜덤 맵(MAP) 발생 단계에서 생성된 맵(MAP)은 상기 암복호화 단계에 의해 암호화되어 저장되어 있다가, 상기 변환하는 단계에서 사용될 때에만 상기 암복호화하는 단계에서 복호화된 후에 사용되는 것일 수 있다. Encrypting or decrypting a map (MAP) generated in the random map generating step; (MAP) generated in the random MAP generation step is encrypted and stored in the encryption / decryption step, and only when the MAP is decrypted in the encryption / decryption step, It may be used later.

상기 변환하는 단계는, 상기 주민번호를 익명화된 데이터로 변환할 때는, 상기 주민번호의 일부를 유효하지 않은 데이터로 대치하는 것일 수 있다. The converting may replace part of the resident number with invalid data when converting the resident number into anonymized data.

상기 변환하는 단계는, 상기 개인 정보를 익명화 데이터로 변환할 때, 체크 디지트를 추가하는 것일 수 있다. The converting step may be to add a check digit when converting the personal information into anonymized data.

상기 변환하는 단계는, 상기 개인 정보를 익명화 데이터로 변환할 때, 상기 개인 정보의 일부를 캐릭터-문자, 숫자, 및/또는 기호-로 대치하는 것일 수 있다. The converting step may replace part of the personal information with a character-character, a number, and / or a symbol when converting the personal information into anonymized data.

상기 변환하는 단계는, 상기 n개의 맵에 의해 변환된 익명화 데이터에, 체크 디지트를 추가하는 것일 수 있다. The converting step may be to add a check digit to the anonymized data converted by the n maps.

상기 변환하는 단계는, 상기 n개의 맵에 의해 변환된 익명화 데이터의 일부를 캐릭터-문자, 숫자, 및/또는 기호-로 대치하는 것일 수 있다. The converting step may replace part of the anonymized data converted by the n maps with a character-character, a number, and / or a symbol.

본 발명의 하나 이상의 실시예에 따르면, 정형 및 비정형 데이터로 이루어진 빅데이터에 포함된 개인정보가 익명화되었는지 여부를 자동으로 검출하여 서면으로 보고할 수 있도록 함으로써, 개인정보 익명화 여부 조사 및 관리 비용을 최소화할 수 있다. According to one or more embodiments of the present invention, it is possible to automatically detect whether personal information included in big data composed of fixed and unstructured data is anonymized and to report it in writing, thereby minimizing the cost of investigating and managing personal information anonymization can do.

또한, 정형 및 비정형 데이터로 이루어진 빅데이터에 포함된 개인정보를, 원본 유추가 불가능한 방법으로 익명화하되, 익명화하지 않은 데이터와 익명화한 데이터를 구별할 수 있도록 익명화함으로써, 익명화하지 않은 데이터만 선별적으로 익명화를 할 수 있게 된다. 따라서, 대용량의 빅데이터에 포함된 개인정보라도 익명화 작업에 소요되는 시간을 획기적으로 단출할 수 있다. In addition, personal information contained in big data made up of stereotyped and unstructured data can be anonymized in a way that can not be deduced from the original, but anonymized so as to distinguish between anonymized data and anonymized data, Anonymization can be done. Therefore, the time required for the anonymization work can be drastically reduced even if the personal information included in the large data is large.

도 1은 본 발명의 일 실시예에 따른 빅데이터에서의 개인정보 익명화 관리 시스템을 설명하기 위한 도면이다.
도 2는 본 발명의 일 실시예에 따른 빅데이터에서의 개인정보 익명화 관리 방법을 설명하기 위한 도면이다.
도 3은 본 발명의 일 실시예에 사용되는 빅데이터에서의 개인정보 변환 방법을 설명하기 위한 도면이다.
도 4는 본 발명의 일 실시예에 사용되는 랜덤 맵을 설명하기 위한 도면이다.
도 5는 본 발명의 일 실시예에 따른 개인정보 익명화 관리 프로그램의 예시적 구성을 설명하기 위한 도면이다.
FIG. 1 is a diagram for explaining a personal information anonymization management system in big data according to an embodiment of the present invention.
FIG. 2 is a diagram for explaining a personal information anonymization management method in big data according to an embodiment of the present invention.
FIG. 3 is a diagram for explaining a method of converting personal information in big data used in an embodiment of the present invention.
4 is a diagram for explaining a random map used in an embodiment of the present invention.
5 is a diagram for explaining an exemplary configuration of a personal information anonymization management program according to an embodiment of the present invention.

이상의 본 발명의 목적들, 다른 목적들, 특징들 및 이점들은 첨부된 도면과 관련된 이하의 바람직한 실시예들을 통해서 쉽게 이해될 것이다. 그러나 본 발명은 여기서 설명되는 실시예들에 한정되지 않고 다른 형태로 구체화될 수도 있다. 오히려, 여기서 소개되는 실시예들은 개시된 내용이 철저하고 완전해질 수 있도록 그리고 당업자에게 본 발명의 사상이 충분히 전달될 수 있도록 하기 위해 제공되는 것이다.BRIEF DESCRIPTION OF THE DRAWINGS The above and other objects, features, and advantages of the present invention will become more readily apparent from the following description of preferred embodiments with reference to the accompanying drawings. However, the present invention is not limited to the embodiments described herein but may be embodied in other forms. Rather, the embodiments disclosed herein are provided so that the disclosure can be thorough and complete, and will fully convey the scope of the invention to those skilled in the art.

본 명세서에서, 어떤 구성요소가 다른 구성요소 상에 있다고 언급되는 경우에 그것은 다른 구성요소 상에 직접 형성될 수 있거나 또는 그들 사이에 제 3의 구성요소가 개재될 수도 있다는 것을 의미한다. 또한, 도면들에 있어서, 구성요소들의 두께는 기술적 내용의 효과적인 설명을 위해 과장된 것이다.In this specification, when an element is referred to as being on another element, it may be directly formed on another element, or a third element may be interposed therebetween. Further, in the drawings, the thickness of the components is exaggerated for an effective description of the technical content.

본 명세서에서 제1, 제2 등의 용어가 구성요소들을 기술하기 위해서 사용된 경우, 이들 구성요소들이 이 같은 용어들에 의해서 한정되어서는 안 된다. 이들 용어들은 단지 어느 구성요소를 다른 구성요소와 구별시키기 위해서 사용되었을 뿐이다. 여기에 설명되고 예시되는 실시예들은 그것의 상보적인 실시예들도 포함한다.Where the terms first, second, etc. are used herein to describe components, these components should not be limited by such terms. These terms have only been used to distinguish one component from another. The embodiments described and exemplified herein also include their complementary embodiments.

또한, 제1 엘리먼트 (또는 구성요소)가 제2 엘리먼트(또는 구성요소) 상(ON)에서 동작 또는 실행된다고 언급될 때, 제1 엘리먼트(또는 구성요소)는 제2 엘리먼트(또는 구성요소)가 동작 또는 실행되는 환경에서 동작 또는 실행되거나 또는 제2 엘리먼트(또는 구성요소)와 직접 또는 간접적으로 상호 작용을 통해서 동작 또는 실행되는 것으로 이해되어야 할 것이다.Also, when it is mentioned that the first element (or component) is operated or executed on the second element (or component) ON, the first element (or component) It should be understood that it is operated or executed in an operating or running environment or is operated or executed through direct or indirect interaction with a second element (or component).

어떤 엘리먼트, 구성요소, 장치, 또는 시스템이 프로그램 또는 소프트웨어로 이루어진 구성요소를 포함한다고 언급되는 경우, 명시적인 언급이 없더라도, 그 엘리먼트, 구성요소, 장치, 또는 시스템은 그 프로그램 또는 소프트웨어가 실행 또는 동작하는데 필요한 하드웨어(예를 들면, 메모리, CPU 등)나 다른 프로그램 또는 소프트웨어(예를 들면 운영체제나 하드웨어를 구동하는데 필요한 드라이버 등)를 포함하는 것으로 이해되어야 할 것이다.It is to be understood that when an element, component, apparatus, or system is referred to as comprising a program or a component made up of software, it is not explicitly stated that the element, component, (E.g., memory, CPU, etc.) or other programs or software (e.g., drivers necessary to run an operating system or hardware, etc.)

또한 어떤 엘리먼트(또는 구성요소)가 구현됨에 있어서 특별한 언급이 없다면, 그 엘리먼트(또는 구성요소)는 소프트웨어, 하드웨어, 또는 소프트웨어 및 하드웨어 어떤 형태로도 구현될 수 있는 것으로 이해되어야 할 것이다.It is also to be understood that the elements (or components) may be implemented in software, hardware, or any form of software and hardware, unless the context clearly dictates otherwise.

또한, 본 명세서에서 사용된 용어는 실시예들을 설명하기 위한 것이며 본 발명을 제한하고자 하는 것은 아니다. 본 명세서에서, 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함한다. 명세서에서 사용되는 '포함한다(comprises)' 및/또는 '포함하는(comprising)'은 언급된 구성요소는 하나 이상의 다른 구성요소의 존재 또는 추가를 배제하지 않는다.Also, terms used herein are for the purpose of illustrating embodiments and are not intended to limit the invention. In the present specification, the singular form includes plural forms unless otherwise specified in the specification. The terms "comprises" and / or "comprising" used in the specification do not exclude the presence or addition of one or more other elements.

이하, 도면을 참조하여 본 발명을 상세히 설명하도록 한다. 아래의 특정 실시예들을 기술하는데 있어서, 여러 가지의 특정적인 내용들은 발명을 더 구체적으로 설명하고 이해를 돕기 위해 작성되었다. 하지만 본 발명을 이해할 수 있을 정도로 이 분야의 지식을 갖고 있는 독자는 이러한 여러 가지의 특정적인 내용들이 없어도 사용될 수 있다는 것을 인지할 수 있다. 어떤 경우에는, 발명을 기술하는 데 있어서 흔히 알려졌으면서 발명과 크게 관련 없는 부분들은 본 발명을 설명하는 데 있어 별 이유 없이 혼돈이 오는 것을 막기 위해 기술하지 않음을 미리 언급해 둔다. Hereinafter, the present invention will be described in detail with reference to the drawings. In describing the specific embodiments below, various specific details have been set forth in order to explain the invention in greater detail and to assist in understanding it. However, it will be appreciated by those skilled in the art that the present invention may be understood by those skilled in the art without departing from such specific details. In some instances, it should be noted that portions of the invention that are not commonly known in the description of the invention and are not significantly related to the invention do not describe confusing reasons for explaining the present invention.

도 1은 본 발명의 일 실시예에 따른 빅데이터에서의 개인정보 익명화 관리 시스템을 설명하기 위한 도면이다.FIG. 1 is a diagram for explaining a personal information anonymization management system in big data according to an embodiment of the present invention.

도 1을 참조하면, 본 발명의 일 실시예에 따른 빅데이터에서의 개인정보 익명화 관리 시스템(이하, '개인정보 익명화 관리 시스템')은 컴퓨터 프로세서(1), 개인정보가 포함된 빅데이터를 저장하는 저장부(3), 메모리(5), 및 컴퓨터 프로세서(1)의 제어하에 메모리(5)에 로딩되어 빅데이터에 포함된 개인정보를 보호하기 위한 개인정보 익명화 관리 프로그램(7)을 포함할 수 있다. Referring to FIG. 1, a personal information anonymization management system (hereinafter referred to as a 'personal information anonymization management system') in Big Data according to an embodiment of the present invention includes a computer processor 1, And a personal information anonymization management program 7 loaded on the memory 5 under the control of the computer processor 1 to protect the personal information contained in the big data .

저장부(3)에 저장된 빅데이터는 예를 들면 DBMS 내의 컬럼으로 정의되어 저장되는 데이터나 파일(ex)텍스트, XML, HWP, DOC, XLS)등과 같이 각종 정형 또는 비정형 데이터를 포함하며, 이름, 전화번호, 여권번호, 주소, 및 주민번호와 같은 개인정보를 적어도 하나 이상 포함한다. 저장부(3)에 저장되는 빅데이터는 수시로 갱신될 수 있다. Big data stored in the storage unit 3 includes various types of fixed or unstructured data such as data defined in a DBMS column and stored in a file (ex) text, XML, HWP, DOC, XLS, Personal information such as a telephone number, a passport number, an address, and a resident registration number. Big data stored in the storage unit 3 can be updated from time to time.

메모리(5)에는, 개인정보 익명화 관리 프로그램(7)이 컴퓨터 프로세서(1)의 제어하에 로딩되어 동작한다. In the memory 5, a personal information anonymization management program 7 is loaded under the control of the computer processor 1 and operates.

또한, 메모리(5)에는 적어도 하나 이상의 랜덤 맵(MAP)이 로딩되며, 개인정보 익명화 관리 프로그램(7)은 메모리(5)에 로딩된 적어도 하나 이상의 랜덤 맵(MAP)을 이용하여 개인정보를 익명화하는 동작을 수행한다. 개인정보 익명화 관리 프로그램(7)은 메모리(5)에 로딩되는 랜덤 맵(MAP)이 암호화된 경우에는, 복호화한 후에 사용할 수 있다.At least one random map (MAP) is loaded into the memory 5 and the personal information anonymization management program 7 uses the at least one random map (MAP) loaded in the memory 5 to anonymize the personal information . When the random map (MAP) loaded in the memory 5 is encrypted, the personal information anonymization management program 7 can use it after decryption.

본원 명세서에서는 설명의 편의를 위해서, 개인정보를 익명화한 데이터를 '익명화된 개인 정보'라고 언급하기로 한다. In the present specification, data for anonymizing personal information will be referred to as 'anonymized personal information' for convenience of explanation.

개인정보 익명화 관리 프로그램(7)은, 본 발명의 일 실시예에 따른 익명화 관리 방법을 수행할 수 있다. 예를 들면, 개인정보 익명화 관리 프로그램(7)은, 도 2에 예시적으로 도시된 익명화 관리 방법을 수행할 수 있다. The personal information anonymization management program 7 can perform the anonymization management method according to an embodiment of the present invention. For example, the personal information anonymization management program 7 can perform the anonymization management method exemplarily shown in Fig.

도 2를 참조하여, 개인정보 익명화 관리 프로그램(7)의 동작을 설명하면, 빅데이터에 포함된 개인정보를 '익명화된 개인 정보'로 변환하고(S201), 주기적 또는 비주기적 또는 사용자의 요청이 있는 경우에 개인정보 익명화 관리 프로그램(7)은 빅데이터에 포함된 개인정보들 중에서 익명화되지 않은 개인정보(이하, '비익명화된 개인정보'라고 함)가 있는지를 모니터링한다(S203).Referring to FIG. 2, the operation of the personal information anonymization management program 7 will be described. The personal information included in the big data is converted into 'anonymized personal information' (S201), and the periodic or non- The personal information anonymization management program 7 monitors whether any personal information included in the big data is not anonymized (hereinafter referred to as "unprofessional personal information") (S203).

개인정보 익명화 관리 프로그램(7)은, S203 단계의 모니터링 결과, 저장부(3)에 저장된 빅데이터에서 비익명화된 개인정보를 검출하면(S205: Y), 검출한 비익명화된 개인정보를 익명화된 정보로 변환한다(S201단계). When the personal information anonymization management program 7 detects the personal information unprofitable from the big data stored in the storage unit 3 as a result of the monitoring in step S203 (S205: Y), the personal information anonymization management program 7 stores the detected unprovoked personal information as an anonymous Information (step S201).

한편, 개인정보 익명화 관리 프로그램(7)은, S203 단계의 모니터링 결과, 저장부(3)에 저장된 빅데이터내에 익명화되지 않은 개인정보가 존재하지 않으면, S203의 단계를 수행한다. On the other hand, if the personal information unanimated management program 7 does not exist in the big data stored in the storage unit 3 as a result of the monitoring in step S203, the personal information anonymization management program 7 performs step S203.

이제, S201 단계의 변환 동작을 도 3을 참조하여 보다 상세히 설명하기로 한다. Now, the conversion operation of step S201 will be described in detail with reference to FIG.

도 3은 본 발명의 일 실시예에 사용되는 빅데이터에서의 개인정보 변환 방법을 설명하기 위한 도면이다.FIG. 3 is a diagram for explaining a method of converting personal information in big data used in an embodiment of the present invention.

도 3을 참조하면, 개인정보 익명화 관리 프로그램(7)은 개인정보를 랜덤 맵을 이용하여 변환하는 동작(S301)을 수행할 수 있다. 도 4에 예시적으로 도시된 랜덤 맵을 참조하여 설명하면, 개인정보 익명화 관리 프로그램(7)은, 도 4에 예시적으로 도시된 바와 같은 복수의 랜덤 맵을 이용하여 변환하는 동작을 수행할 수 있다. 도 4에 도시된 랜덤 맵들은 예시적인 것이므로 본원 발명이 그러한 것들에만 한정되는 것이 아님을 알아야 한다. Referring to FIG. 3, the personal information anonymization management program 7 can perform an operation (S301) of converting personal information using a random map. Referring to the random map exemplarily shown in FIG. 4, the personal information anonymization management program 7 can perform an operation of converting using a plurality of random maps as exemplarily shown in FIG. 4 have. It should be noted that the random maps shown in FIG. 4 are exemplary and that the present invention is not limited to such.

예를 들면, 개인정보가 n(여기서, n은 자연수임)자리로 이루어진 데이터라고 가정하면, 개인정보 익명화 관리 프로그램(7)은, 각 자리수의 값을 변환함에 있어서 도 4에 예시적으로 도시된 맵들을 사용할 수 있다.For example, if it is assumed that the personal information is composed of n (where n is a natural number) digit, the personal information anonymization management program 7, Maps can be used.

도 1에 도시하지는 않았지만, 복수의 랜덤 맵을 생성하는 랜덤 맵 발생부를 개인정보 익명화 관리 시스템(10)은 포함할 수 있으며, 이러한 랜덤 맵 발생부는 개인정보 익명화 관리 프로그램(7)에 내장되어 있거나 또는 개인정보 익명화 관리 시스템(10)에 소프트웨어 및/또는 하드웨어의 형태로 구성되어 포함될 수 있다. 1, the personal information anonymization management system 10 may include a random map generator for generating a plurality of random maps, and the random map generator may be embedded in the personal information anonymization management program 7, And may be included in the personal information anonymization management system 10 in the form of software and / or hardware.

도 4를 참조하면, 총 n개의 맵들이 예시적으로 도시되어 있으며, 이들 맵들은, 개인정보를 구성하는 각 자리수의 값을 다른 값으로 변환하는데 사용된다. 즉, 맵들 각각은 개인정보를 구성하는 각 자리수에 일대일로 대응되어 변환되는데 사용된다.Referring to FIG. 4, a total of n maps are illustrated by way of example, and these maps are used to convert the value of each digit constituting private information to another value. That is, each of the maps is used to correspond to each digit constituting the personal information on a one-to-one basis and to be converted.

도 3을 계속 참조하면, 개인정보 익명화 관리 프로그램(7)은, S301 단계를 수행한 후에 S303 단계를 더 수행할 수 있다. With continued reference to FIG. 3, the personal information anonymization management program 7 may further perform step S303 after performing step S301.

예를 들면, S301 단계에서 도 4에 예시된 맵을 사용하여 781123-2253647과 651106-1253647를 변환하였다고 가정하면, 각각 다음과 같이 된다. For example, assuming that the map illustrated in FIG. 4 is used to transform 781123-2253647 and 651106-1253647 in step S301, they are as follows.

1) 781123-2253647 --> 781123-2297820 1) 781123-2 253647 -> 781123-2 297820

2) 651206-1253647 --> 651206-1297820 2) 651206-1 253647 -> 651206-1 297820

S303 단계에서는, 변환의 대상이 되는 개인 정보 중 변환되지 않는 부분을 이용하여, 변환할 부분에 적용한다. 예를 들면, 781123-2297820에서, 변환하지 않은 데이터에 대하여 다음과 같은 값을 산출한다. In step S303, the non-converted part of the personal information to be converted is applied to the part to be converted. For example, in 781123-2 297820, the following values are calculated for untransformed data.

(7+8+1+1+2+3+2) % 10 = 4 (7 + 8 + 1 + 1 + 2 + 3 + 2)% 10 = 4

이처럼 '개인 정보 중 변환되지 않은 부분'으로부터 산출된 값을, '개인 정보 중 변환할 부분'에 적용한다.  The value calculated from the 'unconverted part of personal information' is applied to the 'part of personal information to be converted'.

(2+4) % 10 = 6(2 + 4) 10% = 6

(9+4) % 10 = 3(9 + 4) 10% = 3

(7+4) % 10 = 1(7 + 4) 10% = 1

(8+4) % 10 = 2(8 + 4) 10% = 2

(2+4) % 10 = 6(2 + 4) 10% = 6

(0+4) % 10 = 4
(0 + 4) 10% = 4

최종적으로, S302 단계를 거친후에는, 781123-2297820는 781123-2631264로 변환된다. Finally, after step S302, 781123-2 297820 is converted to 781123-2 631264 .

651206-1253647에 대하여도 S303 단계를 적용하면, 동일 또는 유사한 방식으로 다음과 같이 변환된다. 651206-1 253647 are also transformed in the same or similar way as follows.

(6+5+1+2+0+6+1) % 10 = 1(6 + 5 + 1 + 2 + 0 + 6 + 1) 10% = 1

(2+1) % 10 = 3(2 + 1) 10% = 3

(5+1) % 10 = 6(5 + 1) 10% = 6

(3+1) % 10 = 4(3 + 1) 10% = 4

(6+1) % 10 = 7(6 + 1) 10% = 7

(4+1) % 10 = 5(4 + 1) 10% = 5

(7+1) % 10 = 8(7 + 1) 10% = 8

최종적으로, S303 단계를 거친 후에는, 651206-1253647는 651206-1354758로 변환된다. Finally, after the step S303, 651206-1 253647 is converted to 651206-1 354758 .

이처럼, S303 단계를 거친 후에는, 서로 다른 데이터는 반드시 다른 데이터로 변환되게 된다. As described above, after step S303, different data are always converted to different data.

도 3을 계속 참조하면, 개인정보 익명화 관리 프로그램(7)은, S303 단계를 수행한 후에 S305 단계를 더 수행할 수 있다. S305 단계는, 개인정보가 익명화되었는지 여부를 판단할 수 있도록 하기 위해서, 수행된다. 3, the personal information anonymization management program 7 may further perform step S305 after performing step S303. Step S305 is performed in order to be able to judge whether or not the personal information has been anonymized.

S305 단계는 예를 들면 (각자리수 * 웨이트)의 합계 %10에 의해 체크 디지트를 생성하여 익명화된 개인 정보에 부가할 수 있다.In step S305, the check digit may be generated by adding 10% of the sum of (number of digits * weight) and added to the anonymized personal information.

예를 들어 S303단계를 거쳐 변환된 데이터가 651206-1354758라고 하면For example, if the converted data through step S303 is 651206-1354758

각 자리 웨이트는 랜덤맵에서 가져올 수 있다. 그 값이 1 7 3 8 5 9 2 6 4 0라고 하면Each spot weight can be fetched from a random map. If the value is 1 7 3 8 5 9 2 6 4 0

6 * 1 = 76 * 1 = 7

5 * 7 = 355 * 7 = 35

1 * 3 = 31 * 3 = 3

2 * 8 = 162 * 8 = 16

0 * 5 = 00 * 5 = 0

6 * 9 = 546 * 9 = 54

1 * 2 = 21 * 2 = 2

3 * 6 = 183 * 6 = 18

5 * 4 = 205 * 4 = 20

7 * 1 = 77 * 1 = 7

5 * 7 = 355 * 7 = 35

8 * 3 = 248 * 3 = 24

7 + 35 + 3 + 16 + 0 + 54 + 2 + 18 + 20 + 7 + 35 + 24 = 221 % 10 = 17 + 35 + 3 + 16 + 0 + 54 + 2 + 18 + 20 + 7 + 35 + 24 = 221 10% = 1

만들어진 체크디지트를 마지막 자리에 치환하면 651206-1354751가 된다.Substituting the last digit of the generated check digit results in 651206-1354751.

익명화가 된 데이터를 검사할 때 위의 계산을 동일하게 수행하여 변환된 데이터인지 여부를 확인할 수 있으며 반드시 동일한 자리수의 값으로 변환할 필요가 없는 경우 651206-1354758 [221] 과 같이 변환된 값을 표현하기 위한 일정한 형식의 체크디지트를 덧붙여 데이터를 작성할 수도 있다. 또한 익명화 후의 데이터가 반드시 유효할 필요가 없는 경우에는 651206-1******과 같이 데이터의 일부를 임의의 문자로 치환하여 숨기는(마스킹) 방식으로 치환할 수도 있다.
When checking the anonymized data, it is possible to check whether the converted data is the same by performing the above calculation. If it is not necessary to convert the same value to the same value, the converted value is represented by 651206-1354758 [221] It is also possible to create data by adding a check digit of a certain format for this purpose. If the data after the anonymization does not necessarily need to be valid, a part of the data may be replaced with a certain character such as 651206-1 ****** for masking.

체크 디지트를 부가하는 방법은 파일 또는 테이블 단위로 익명화되었는지 여부를 검토하는데 유효할 수 있다. The method of adding the check digit may be useful for examining whether it has been anonymized on a file or table basis.

S305 단계는 도 3에서는 체크 디지트를 부가하는 것으로 구현되었지만, 익명화할 개인정보의 타입에 따라서 다른 형태로 변형되어 구현될 수 있다. 예를 들면, S305 단계는, 개인정보가 이름인 경우, 아래 예와 같이 그 일부를 문자, 숫자, 및/또는 기호와 같은 것으로 대치하는 동작으로 변형 구현될 수 있다.Although the step S305 is implemented by adding the check digit in FIG. 3, the step S305 may be modified and implemented according to the type of the personal information to be anonymized. For example, if the personal information is a name, step S305 may be modified to replace the part with a character, number, and / or symbol, as shown in the following example.

예) 바넷정보기술 --> 하수나바소*Ex) Barnett Information Technology -> Sewer or Basso *

이와 같은 동작에 의해, 개인정보가 이름인 경우 문자, 숫자, 및/또는 기호가 포함되어 있는지를 판단하여 익명화되었는지 여부를 알수 있게 된다. By this operation, it is judged whether the personal information includes a character, a number, and / or a symbol if it is a name, so that it can be known whether or not it is anonymized.

한편, 도 3의 실시예에서, S301 단계를 수행한 후에 S303 단계를 수행하는 것으로 설명하였지만, S303 단계를 먼저 수행한 후에 S301단계를 수행하는 것도 가능할 것이다. In the embodiment of FIG. 3, step S303 is performed after step S301. However, step S301 may be performed after step S303.

본 발명의 일 실시예에 따른 개인정보 익명화 관리 프로그램은, 또한, 빅데이터의 익명화 현황을 보고서의 형태로 자동적으로 작성할 수 있다. 도 2를 다시 참조하면, 개인정보 익명화 관리 프로그램은, S205 단계에서 익명화되지 않은 정보를 검출한 경우, S201 단계를 다시 수행하기 전에, 개인정보 익명화 현황을 보고서의 형태로 구성할 수 있다. 개인정보 익명화 현황은, 익명화된 개인정보와 익명화되지 않은 개인정보의 현황을 포함한다. The personal information anonymization management program according to the embodiment of the present invention can also automatically create anonymization status of the big data in the form of a report. Referring back to FIG. 2, if the personal information anonymization management program detects information that is not anonymized in step S205, the personal information anonymization management program may configure the personal information anonymization status in the form of a report before performing step S201 again. The status of personal information anonymization includes the status of anonymized personal information and non-anonymous personal information.

개인정보 익명화 관리 프로그램은, 또한 사용자의 요청이 있는 경우에도 개인정보 익명화 현황을 보고서의 형태로 구성할 수 있다. 빅데이터에 포함된 개인 정보가 익명화되었는지 여부를 사람이 일일이 확인하는 것은 비효율적이며, 본원 발명에서는 개인정보를 익명화할 때 익명화 여부를 식별할 수 있는 방식으로 변환함으로써, 차후 익명화된 개인정보를 구별할 수 있게 된다. The personal information anonymization management program can also organize the status of personal information anonymization in the form of a report even when the user requests it. It is inefficient for a person to individually confirm whether personal information included in big data is anonymized. In the present invention, when anonymizing personal information, it is converted into a manner of identifying whether or not anonymization is to be performed, .

도 5는 본 발명의 일 실시예에 따른 개인정보 익명화 관리 프로그램의 예시적 구성을 설명하기 위한 도면이다. 5 is a diagram for explaining an exemplary configuration of a personal information anonymization management program according to an embodiment of the present invention.

도 5를 참조하면, 본 발명의 일 실시예에 따른 개인정보 익명화 관리 프로그램은, 변환부(9), 검출부(11), 보고서 작성부(13), 랜덤 맵 발생부(15)를 포함할 수 있다. 5, a personal information anonymization management program according to an embodiment of the present invention may include a conversion unit 9, a detection unit 11, a report creation unit 13, and a random map generation unit 15 have.

변환부(9)는 빅데이터에 포함된 개인정보를 익명화하는 동작을 수행한다.The conversion unit 9 performs an operation of anonymizing the personal information included in the big data.

예를 들면, 변환부(9)는, 도 2와 도 3을 참조하여 설명하였던 변환 동작을 수행할 수 있다. 변환부(9)에 의해 익명화된 개인정보는 저장부(3)에 저장된다. For example, the converting unit 9 can perform the converting operation described with reference to Figs. 2 and 3. Fig. The personal information that has been anonymized by the conversion unit 9 is stored in the storage unit 3. [

검출부(11)는, 저장부(3)에 저장된 빅데이터에 포함된 개인정보 중에서 익명화되지 않은 개인정보 및/또는 익명화된 개인정보를 검출할 수 있다. The detection unit 11 can detect unnamed personal information and / or anonymized personal information from the personal information included in the big data stored in the storage unit 3. [

예를 들면, 검출부(11)는 도 2를 참조하여 설명하였던 검출 동작(S205)을 수행할 수 있다. For example, the detection unit 11 can perform the detection operation (S205) described with reference to Fig.

보고서 작성부(13)는, 검출부(11)가 검출한 결과를 기초로 보고서를 작성할 수 있다. 예를 들면, 보고서 작성부(13)는 사용자의 요청이 있거나 또는 주기적 또는 수시로 검출부(11)가 검출한 결과를 이용하여 보고서를 작성할 수 있다. 본 보고서에는 익명화된 개인정보 및/또는 익명화되지 않은 개인정보가 포함된다. The report creating unit 13 can create a report based on the result detected by the detecting unit 11. [ For example, the report creating unit 13 may generate a report using a result of a request from the user or periodically or occasionally detected by the detecting unit 11. This report includes anonymized personal information and / or non-anonymous personal information.

랜덤 맵 발생부(14)는, 변환부(9)가 개인정보를 익명화할 때 사용하는 랜덤 맵을 생성한다. 랜덤 맵 발생부(14)는, 예를 들면, 익명화할 개인정보의 자리수와 같거나 그 이상의 랜덤 맵을 생성할 수 있다.  The random map generation unit 14 generates a random map used when the conversion unit 9 anonymizes the personal information. The random map generation unit 14 can generate a random map equal to or more than the number of digits of the personal information to be anonymized, for example.

한편, 도 5에서, 암복호화부를 표시하지 않았지만, 개인정보 익명화 관리 프로그램은, 랜덤 맵을 암호화하고 암호화된 랜덤 맵을 복호화하는 암복호화부를 더 포함할 수 있다. On the other hand, although the encryption / decryption unit is not shown in Fig. 5, the personal information anonymization management program may further include an encryption / decryption unit for encrypting the random map and decrypting the encrypted random map.

상기와 같이 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다. 그러므로, 본 발명의 범위는 설명된 실시예에 국한되어 정해져서는 아니 되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등한 것들에 의해 정해져야 한다.While the present invention has been described with reference to the particular embodiments and drawings, it is to be understood that the invention is not limited to the disclosed embodiments, but, on the contrary, is intended to cover various modifications and equivalent arrangements included within the spirit and scope of the appended claims. This is possible. Therefore, the scope of the present invention should not be limited to the described embodiments, but should be determined by the equivalents of the claims, as well as the claims.

1: 컴퓨터 프로세서
3: 저장부
5: 메모리
7: 개인정보 익명화 관리 프로그램
9: 변환부
11: 검출부
13: 보고서 작성부
15: 랜덤 맵 발생부
1: Computer processor
3:
5: Memory
7: Personal information anonymization management program
9:
11:
13: Report writing section
15: random map generator

Claims (23)

개인정보가 포함된 빅데이터를 저장하는 저장부;
익명화된 데이터와 익명화되지 않은 데이터를 구별할 수 있는 방법으로, 상기 빅데이터에 포함된 개인 정보를 익명화된 데이터('익명화된 개인 정보'라고 함)로 변환하는 변환부; 및
상기 빅데이터에 익명화된 개인정보와 익명화되지 않은 개인정보를 검출하는 검출부;를 포함하는 정형 및 비정형 데이터를 포함하는 빅데이터에서의 개인정보 익명화 관리 시스템.
A storage unit for storing big data including personal information;
A conversion unit for converting the personal information included in the big data into anonymized data (referred to as 'anonymized personal information') as a method for distinguishing between anonymized data and non-anonymized data; And
And a detector for detecting personal information anonymized in the big data and non-anonymous personal information in the big data.
제1항에 있어서,
상기 검출부가, 상기 빅데이터에 익명화되지 않은 개인정보를 검출한 경우, 상기 변환부는 상기 검출부에 의해 검출된 익명화되지 않은 개인정보를, 익명화된 데이터와 익명화되지 않은 데이터를 구별할 수 있는 방법으로 변환하는 것을 특징으로 하는 정형 및 비정형 데이터를 포함하는 빅데이터에서의 개인정보 익명화 관리 시스템.
The method according to claim 1,
When the detecting unit detects the personal information that is not anonymized in the big data, the converting unit transforms the non-anonymized personal information detected by the detecting unit into a method capable of distinguishing the anonymous data from the non-anonymous data Wherein the personal information anonymization management system comprises:
제2항에 있어서,
상기 검출부가 검출한 결과를 보고서로서 작성하는 보고서 작성부;를 더 포함하는 것을 특징으로 하는 정형 및 비정형 데이터를 포함하는 빅데이터에서의 개인정보 익명화 관리 시스템.
3. The method of claim 2,
And a report creating unit that creates a report as a result of the detection by the detecting unit. The personal information anonymization management system of claim 1, wherein the personal information anonymization management information includes formatted and unstructured data.
제1항에 있어서,
상기 변환부에 의해 사용되는 맵(MAP)을 랜덤하게 생성하는 랜덤 맵(MAP) 발생부; 를 더 포함하며,
상기 변환부는, 상기 랜덤 맵 발생부에 의해 생성된 맵(MAP)을 사용하여 변환 동작을 수행하는 것을 특징으로 하는 빅데이터에서의 개인정보 익명화 관리 시스템.
The method according to claim 1,
A random map generating unit for randomly generating a map used by the converting unit; Further comprising:
Wherein the conversion unit performs a conversion operation using a map (MAP) generated by the random map generation unit.
제4항에 있어서,
상기 개인정보가 n(여기서, n은 자연수임)자리로 이루어진 데이터인 경우,
상기 랜덤 맵 발생부는 상기 맵을 n개 생성하며,
상기 변환부는 상기 개인정보의 자리별로 상기 n개의 맵을 각각 사용하여 변환하는 것을 특징으로 하는 빅데이터에서의 개인정보 익명화 관리 시스템.
5. The method of claim 4,
If the personal information is data consisting of n (where n is a natural number)
The random map generator generates n maps,
Wherein the conversion unit uses the n maps for each place of the personal information and converts the map.
제5항에 있어서,
상기 랜덤 맵 발생부에 의해 생성된 맵(MAP)을 암호화하거나 복호화하는 암복호화부; 를 더 포함하며,
상기 랜덤 맵(MAP) 발생부에 의해 생성된 맵(MAP)은 상기 암복호화부에 의해 암호화되어 상기 저장부에 저장되어 있다가, 상기 변환부에 의해 사용될 때에만 상기 암복화부에 의해 복호화된 후에 사용되는 것을 특징으로 하는 빅데이터에서의 개인정보 익명화 관리 시스템.
6. The method of claim 5,
An encryption / decryption unit for encrypting or decrypting a map (MAP) generated by the random map generation unit; Further comprising:
(MAP) generated by the random map generation unit is encrypted by the encryption / decryption unit and stored in the storage unit, and is decrypted by the tampering unit only when used by the conversion unit Wherein said personal information anonymization management system comprises:
제6항에 있어서,
상기 변환부는, 익명화할 개인정보의 일부('익명화 파트')만을 변환하되, 상기 익명화할 개인정보의 나머지 부분('비 익명화 파트') 중 적어도 일부를 이용하여, 변환하는 것을 특징으로 하는 빅데이터에서의 개인정보 익명화 관리 시스템.
The method according to claim 6,
Wherein the converting unit transforms only a part of the personal information to be anonymized ('anonymizing part'), using at least a part of the remaining part of the personal information to be anonymized ('unneeded part'), Personal information anonymization management system in.
제4항에 있어서,
상기 개인정보는 이름, 전화번호, 여권번호, 주소, 및 주민번호 중 적어도 어느 하나를 포함하며,
상기 변환부는, 상기 주민번호를 익명화된 데이터로 변환할 때는, 상기 주민번호의 일부를 유효하지 않은 데이터로 대치하는 것을 특징으로 하는 빅데이터에서의 개인정보 익명화 관리 시스템.
5. The method of claim 4,
The personal information includes at least one of a name, a telephone number, a passport number, an address, and a resident number,
Wherein the conversion unit replaces part of the resident number with invalid data when converting the resident number into anonymized data.
제1항에 있어서,
상기 변환부는, 상기 개인 정보를 익명화 데이터로 변환할 때, 체크 디지트를 추가하는 것을 특징으로 하는 빅데이터에서의 개인정보 익명화 관리 시스템.
The method according to claim 1,
Wherein the conversion unit adds a check digit when converting the personal information into anonymized data.
제1항에 있어서,
상기 변환부는, 상기 개인 정보를 익명화 데이터로 변환할 때, 상기 개인 정보의 일부를 캐릭터-문자, 숫자, 및/또는 기호-로 대치하는 것을 특징으로 하는 빅데이터에서의 개인정보 익명화 관리 시스템.
The method according to claim 1,
Wherein the conversion unit replaces a part of the personal information with a character-character, a number, and / or a symbol when converting the personal information into anonymized data.
제6항에 있어서,
상기 변환부는, 상기 n개의 맵에 의해 변환된 익명화 데이터에, 체크 디지트를 추가하는 것을 특징으로 하는 빅데이터에서의 개인정보 익명화 관리 시스템.
The method according to claim 6,
Wherein the conversion unit adds the check digit to the anonymization data converted by the n maps.
제6항에 있어서,
상기 변환부는, 상기 n개의 맵에 의해 변환된 익명화 데이터의 일부를 캐릭터-문자, 숫자, 및/또는 기호-로 대치하는 것을 특징으로 하는 빅데이터에서의 개인정보 익명화 관리 시스템.
The method according to claim 6,
Wherein the conversion unit replaces a part of the anonymized data converted by the n maps with a character-character, a number, and / or a symbol -.
컴퓨터에,
익명화된 데이터와 익명화되지 않은 데이터를 구별할 수 있는 방법으로, 빅데이터에 포함된 개인 정보를 익명화된 데이터('익명화된 개인 정보'라고 함)로 변환하는 단계;
상기 빅데이터에 익명화된 개인정보와 익명화되지 않은 개인정보를 검출하는 단계;를 포함하는 방법을 실행시키기 위한 개인정보 익명화 관리 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
On the computer,
Converting the personal information included in the big data into anonymized data (referred to as 'anonymized personal information') in a way that can distinguish between anonymized data and non-anonymous data;
Detecting personal information that is anonymized in the big data and personal information that is not anonymized. The computer-readable recording medium according to claim 1, wherein the personal information is anonymized.
제13항에 있어서,
상기 검출하는 단계에서, 상기 빅데이터에 익명화되지 않은 개인정보를 검출한 경우, 상기 변환하는 단계는, 상기 검출하는 단계에서 검출된 익명화되지 않은 개인정보를, 익명화된 데이터와 익명화되지 않은 데이터를 구별할 수 있는 방법으로 변환하는 단계인 것을 특징으로 하는 개인정보 익명화 관리 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
14. The method of claim 13,
Wherein, in the detecting step, when personal information that is not anonymized in the big data is detected, the converting step distinguishes the anonymized data and the anonymized data from the anonymized personal information detected in the detecting step Wherein the step of converting the personal information anonymization management program is a step of converting a personal information anonymization management program into a method capable of performing personal information anonymization management.
제12항에 있어서,
상기 변환하는 단계에서 사용되는 맵(MAP)을 랜덤하게 생성하는 랜덤 맵(MAP) 발생 단계; 를 더 포함하며,
상기 변환하는 단계는, 상기 랜덤 맵 발생부에 의해 생성된 맵(MAP)을 사용하여 변환 동작을 수행하는 것을 특징으로 하는 개인정보 익명화 관리 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
13. The method of claim 12,
A random map generating step of randomly generating a map used in the converting step; Further comprising:
Wherein the converting step performs a converting operation using a map (MAP) generated by the random map generating unit. ≪ Desc / Clms Page number 19 >
제15항에 있어서,
상기 개인정보가 n(여기서, n은 자연수임)자리로 이루어진 데이터인 경우,
상기 랜덤 맵 발생 단계는, 상기 맵을 n개 생성하며,
상기 변환하는 단계는, 상기 개인정보의 자리별로 상기 n개의 맵을 각각 사용하여 변환하는 것을 특징으로 하는 개인정보 익명화 관리 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
16. The method of claim 15,
If the personal information is data consisting of n (where n is a natural number)
Wherein the random map generating step generates n maps,
Wherein the conversion is performed using each of the n maps for each place of the personal information.
제16항에 있어서,
상기 랜덤 맵 발생 단계에서 생성된 맵(MAP)을 암호화하거나 복호화하는 암복호화하는 단계; 를 더 포함하며,
상기 랜덤 맵(MAP) 발생 단계에서 생성된 맵(MAP)은 상기 암복호화 단계에 의해 암호화되어 저장되어 있다가, 상기 변환하는 단계에서 사용될 때에만 상기 암복호화하는 단계에서 복호화된 후에 사용되는 것을 특징으로 하는 개인정보 익명화 관리 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
17. The method of claim 16,
Encrypting or decrypting a map (MAP) generated in the random map generating step; Further comprising:
The map (MAP) generated in the random MAP generation step is encrypted and stored in the encryption / decryption step, and is used after being decrypted in the encryption / decryption step only when it is used in the conversion step A personal information anonymization management program recorded on a computer-readable recording medium.
제17항에 있어서,
상기 변환하는 단계는, 익명화할 개인정보의 일부('익명화 파트')만을 변환하되, 상기 익명화할 개인정보의 나머지 부분('비 익명화 파트') 중 적어도 일부를 이용하여, 변환하는 단계인 것을 특징으로 하는 개인정보 익명화 관리 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
18. The method of claim 17,
The converting step is a step of converting only a part of the personal information to be anonymized ('anonymizing part') using at least a part of the remaining part of the personal information to be anonymized ('non-anonymizing part') A personal information anonymization management program recorded on a computer-readable recording medium.
제14항에 있어서,
상기 개인정보는 이름, 전화번호, 여권번호, 주소, 및 주민번호 중 적어도 어느 하나를 포함하며,
상기 변환하는 단계는, 상기 주민번호를 익명화된 데이터로 변환할 때는, 상기 주민번호의 일부를 유효하지 않은 데이터로 대치하는 것을 특징으로 하는 개인정보 익명화 관리 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
15. The method of claim 14,
The personal information includes at least one of a name, a telephone number, a passport number, an address, and a resident number,
Wherein said converting step replaces part of said resident number with invalid data when said resident number is converted into anonymized data. ≪ Desc / Clms Page number 20 >
제12항에 있어서,
상기 변환하는 단계는, 상기 개인 정보를 익명화 데이터로 변환할 때, 체크 디지트를 추가하는 것을 특징으로 하는 개인정보 익명화 관리 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
13. The method of claim 12,
Wherein said conversion step adds a check digit when converting said personal information into anonymized data. ≪ Desc / Clms Page number 19 >
제12항에 있어서,
상기 변환하는 단계는, 상기 개인 정보를 익명화 데이터로 변환할 때, 상기 개인 정보의 일부를 캐릭터-문자, 숫자, 및/또는 기호-로 대치하는 것을 특징으로 하는 개인정보 익명화 관리 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
13. The method of claim 12,
Wherein the converting step replaces a part of the personal information with a character, a character, a number, and / or a symbol when converting the personal information into anonymized data. Readable recording medium.
제19항에 있어서,
상기 변환하는 단계는, 상기 n개의 맵에 의해 변환된 익명화 데이터에, 체크 디지트를 추가하는 것을 특징으로 하는 개인정보 익명화 관리 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
20. The method of claim 19,
Wherein the converting step adds a check digit to the anonymized data converted by the n maps. ≪ Desc / Clms Page number 19 >
제20항에 있어서,
상기 변환하는 단계는, 상기 n개의 맵에 의해 변환된 익명화 데이터의 일부를 캐릭터-문자, 숫자, 및/또는 기호-로 대치하는 것을 특징으로 하는 개인정보 익명화 관리 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
21. The method of claim 20,
Wherein the converting step replaces a part of the anonymized data converted by the n maps with a character-character, a number, and / or a symbol -. The computer-readable recording medium storing the personal information anonymization management program media.
KR1020140117449A 2014-09-04 2014-09-04 Anonymity management system for privacy information in bigdata having fixed form and free style data KR101708014B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020140117449A KR101708014B1 (en) 2014-09-04 2014-09-04 Anonymity management system for privacy information in bigdata having fixed form and free style data

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020140117449A KR101708014B1 (en) 2014-09-04 2014-09-04 Anonymity management system for privacy information in bigdata having fixed form and free style data

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020140111037A Division KR20150012225A (en) 2014-08-25 2014-08-25 Anonymity management system for privacy information in bigdata having fixed form and free style data

Publications (2)

Publication Number Publication Date
KR20150012226A true KR20150012226A (en) 2015-02-03
KR101708014B1 KR101708014B1 (en) 2017-02-17

Family

ID=52488365

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020140117449A KR101708014B1 (en) 2014-09-04 2014-09-04 Anonymity management system for privacy information in bigdata having fixed form and free style data

Country Status (1)

Country Link
KR (1) KR101708014B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101704702B1 (en) * 2016-04-18 2017-02-08 (주)케이사인 Tagging based personal data de-identification system and de-identification method of personal data

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110022104A (en) * 2009-08-27 2011-03-07 (주)소만사 System and method for securing dbms with data obfuscation

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110022104A (en) * 2009-08-27 2011-03-07 (주)소만사 System and method for securing dbms with data obfuscation

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
이재식, "빅데이터 환경에서 개인정보보호를 위한 기술", Internet & security focus 통권 제3호 (2013년 3월) pp.79-104 *
최희식 외 1인, "빅데이터 개인정보 취급에 따른 문제점 분석", 디지털산업정보학회지 제10권 제1호 (2014.03) pp.89-97 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101704702B1 (en) * 2016-04-18 2017-02-08 (주)케이사인 Tagging based personal data de-identification system and de-identification method of personal data

Also Published As

Publication number Publication date
KR101708014B1 (en) 2017-02-17

Similar Documents

Publication Publication Date Title
US8204213B2 (en) System and method for performing a similarity measure of anonymized data
Sedayao et al. Enhancing cloud security using data anonymization
JP5181139B2 (en) Computer program, shared object control apparatus, and shared object control method
JP4716260B2 (en) Personal information / secret information management system
CN108885672B (en) Access management method, information processing device, program, and recording medium
KR101704702B1 (en) Tagging based personal data de-identification system and de-identification method of personal data
US8776258B2 (en) Providing access rights to portions of a software application
WO2020132012A1 (en) Systems and methods for data lifecycle protection
JP6119766B2 (en) Intermediate server, database query processing method and program
EP4198786A1 (en) Rule-based targeted extraction and encryption of sensitive document features
US10303885B2 (en) Methods and systems for securely executing untrusted software
KR101499064B1 (en) Anonymity management system for privacy information in bigdata having fixed form and free style data
KR101708014B1 (en) Anonymity management system for privacy information in bigdata having fixed form and free style data
US9507922B1 (en) System, method, and computer program for conditionally implementing protected content
KR20110016227A (en) Method and apparatus for protection of data by using virtual environment, and computer readable media storing program for method therefor
Hutton Immunizing files against ransomware with koalafied immunity
CN111092872A (en) Privacy protection method, device and equipment
KR20150012225A (en) Anonymity management system for privacy information in bigdata having fixed form and free style data
JP6192601B2 (en) Personal information management system and personal information anonymization device
Boumezbeur et al. Privacy Preserving Requirements for Sharing Health Data in Cloud
De la Torre et al. Analysis of security in big data related to healthcare
WO2012128389A1 (en) Permit issuance apparatus and permit issuance method
Kishore et al. Client and data confidentiality in cloud computing using fragmentation method
US20220123930A1 (en) Process object re-keying during process creation in cryptographic computing
Priyadharshini et al. Data Governance on Local Storage in Offsite

Legal Events

Date Code Title Description
A107 Divisional application of patent
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20200210

Year of fee payment: 4