KR20200121583A - 데이터 비식별화처리를 이용한 데이터 분산처리 장치 및 방법 - Google Patents

데이터 비식별화처리를 이용한 데이터 분산처리 장치 및 방법 Download PDF

Info

Publication number
KR20200121583A
KR20200121583A KR1020190044314A KR20190044314A KR20200121583A KR 20200121583 A KR20200121583 A KR 20200121583A KR 1020190044314 A KR1020190044314 A KR 1020190044314A KR 20190044314 A KR20190044314 A KR 20190044314A KR 20200121583 A KR20200121583 A KR 20200121583A
Authority
KR
South Korea
Prior art keywords
data
hash
confidential
unit
divided
Prior art date
Application number
KR1020190044314A
Other languages
English (en)
Inventor
문인식
Original Assignee
주식회사 바스랩
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 바스랩 filed Critical 주식회사 바스랩
Priority to KR1020190044314A priority Critical patent/KR20200121583A/ko
Publication of KR20200121583A publication Critical patent/KR20200121583A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • G06F21/6254Protecting personal data, e.g. for financial or medical purposes by anonymising data, e.g. decorrelating personal data from the owner's identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/602Providing cryptographic facilities or services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/06Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols the encryption apparatus using shift registers or memories for block-wise or stream coding, e.g. DES systems or RC4; Hash functions; Pseudorandom sequence generators
    • H04L9/0643Hash functions, e.g. MD5, SHA, HMAC or f9 MAC
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/50Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols using hash chains, e.g. blockchains or hash trees
    • H04L2209/38

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Power Engineering (AREA)
  • Storage Device Security (AREA)

Abstract

본 발명에 따르면, 사용자 단말로부터 입력된 원시 데이터에 임의로 생성한 페이크 데이터를 추가하고, 상기 페이크 데이터가 추가된 원시 데이터를 암호화하여 비식별 데이터를 생성하는 암호화부, 분산형 데이터 처리부로부터 생성된 상기 기밀 해시를 분할하여 상기 사용자 단말과 블록체인에 저장하는 기밀 해시 저장부를 포함하여 보안이 요구되는 정보에 대한 접근, 훼손, 유출을 방지하는 데이터 비식별화처리를 이용한 데이터 분산처리 장치 및 방법이 개시된다.

Description

데이터 비식별화처리를 이용한 데이터 분산처리 장치 및 방법{Method and Apparatus for Distributed Processing of Data using De-identification of Data}
본 발명은 데이터 분산처리 장치 및 방법에 관한 것으로, 특히 데이터 비식별화처리를 이용하여 개인정보 데이터를 분산 처리하는 장치 및 방법에 관한 것이다.
현재, 인터넷 서비스에는 수많은 인터넷 서비스 공급자(ISP), 온라인 서비스 공급자(OSP), 공공기관 등에서 다양한 형태의 개인 정보가 저장되고 사용되며 이를 기반으로 로그인, 각종 인증, 쇼핑, 금융 결제 등 인터넷상의 중요 행위가 끊임없이 일어나고 있다.
온라인에서는 서비스를 제공하기 위하여 사용자를 식별해야만 하는데, 이를 위해 계정과 개인정보 입력을 요구하고 중앙화된 데이터베이스로 보관하여 처리하고 있다. 이때, 데이터베이스에 대한 암호화 및 보안 장비의 도입, 백업 정책 등 어떠한 방식을 사용하더라도 실제 많은 내 외적인 요인 즉, 관리자의 실수 또는 고의로 인한 유출과 해킹을 통해 유, 무형의 막대한 피해가 발생하게 된다.
이에 따라, 실질적으로 실수 또는 고의에 의한 유출과 악의적인 목적의 해킹이 발생하였더라도 개인정보 데이터 원본이 존재하지 않기에 유출의 피해가 없으며, 설령 처리되는 데이터가 일부 또는 전체가 노출되더라도 그 어떤 시스템이나 방법으로도 식별이 불가능하여, 궁극적으로 모든 악의적 상황을 무의미하게 만드는 정보 처리 시스템의 구현이 필요하다.
본 발명은 데이터 비식별화처리를 이용한 데이터 분산처리 장치 및 방법으로 사용자 단말로부터 입력된 원시 데이터에 임의로 생성한 페이크 데이터를 추가하고, 상기 페이크 데이터가 추가된 원시 데이터를 암호화하여 비식별 데이터를 생성하는 암호화부, 분산형 데이터 처리부로부터 생성된 상기 기밀 해시를 분할하여 상기 사용자 단말과 블록체인에 저장하는 기밀 해시 저장부를 포함하여 보안이 요구되는 정보에 대한 접근, 훼손, 유출을 방지하는데 그 목적이 있다.
또한, 개인정보 데이터 원본이 존재하지 않기에 유출의 피해가 없으며, 처리되는 데이터가 일부 또는 전체가 노출되더라도 식별이 불가능하도록 하는데 또 다른 목적이 있다.
본 발명의 명시되지 않은 또 다른 목적들은 하기의 상세한 설명 및 그 효과로부터 용이하게 추론할 수 있는 범위 내에서 추가적으로 고려될 수 있다.
상기 과제를 해결하기 위해, 본 발명의 일 실시예에 따른 데이터 비식별화처리를 이용한 데이터 분산처리 장치는, 사용자 단말로부터 입력된 원시 데이터에 임의로 생성한 페이크 데이터를 추가하고, 상기 페이크 데이터가 추가된 원시 데이터를 암호화하여 비식별 데이터를 생성하는 암호화부, 상기 비식별 데이터를 다수의 조각들로 분할하여 다수의 비식별 데이터 조각들을 생성하는 데이터 분할부, 상기 비식별 데이터 조각들을 분산 저장 노드 각각에 분산 배포하여 저장하고, 상기 분산 저장 노드로부터 상기 분산 저장 노드 각각에 저장된 상기 비식별 데이터 조각에 매칭되는 N개의 해시값을 각각 호출하여 기밀 해시를 생성하는 분산형 데이터 처리부 및 상기 분산형 데이터 처리부로부터 생성된 상기 기밀 해시를 분할하여 상기 사용자 단말과 블록체인에 저장하는 기밀 해시 저장부를 포함한다.
여기서, 상기 분산 저장 노드는, IPFS(Inter-Planetary File System)를 기반으로 하여 상기 분산형 데이터 처리부와 네트워크로 연결된다.
여기서, 상기 암호화부는, 상기 입력된 원시 데이터가 디지털 데이터로 변환이 가능한 조건인 데이터 입력 조건에 부합하는가를 검증하는 데이터 검증부, 상기 입력된 원시 데이터가 상기 데이터 입력 조건에 부합하는 경우, 임의의 페이크 데이터를 생성하는 페이크 데이터 생성부 및 상기 원시 데이터에 상기 페이크 데이터를 추가하여 디지털 코드를 생성하고, 상기 디지털 코드를 암호화하여 상기 비식별 데이터를 생성하는 비식별화 처리부를 포함한다.
여기서, 상기 분산형 데이터 처리부는, 상기 데이터 분할부에서 생성된 상기 비식별 데이터 조각들을 분산 저장 노드 각각에 분산 배포하여 저장하고, 저장된 상기 비식별 데이터 조각 각각의 해시값을 N개(여기서, N은 자연수) 생성하는 노드 저장부, 상기 분산 저장 노드로부터 상기 분산 저장 노드 각각에 저장된 상기 비식별 데이터 조각에 매칭되는 N개의 해시값을 각각 호출하여 1개의 해시로 조합하여 1차 조합 해시를 생성하는 1차 해시 생성부 및 상기 1차 조합 해시의 해시값의 조합을 변경하는 재 해싱 과정을 수행하여 상기 기밀 해시를 생성하는 기밀 해시 생성부를 포함한다.
여기서, 상기 기밀 해시 저장부는, 상기 기밀 해시 생성부로부터 생성된 상기 기밀 해시의 해시값을 제1 분할 기밀 해시와 제2 분할 기밀 해시로 2분할하는 기밀 해시 분할부, 분할된 상기 제1 분할 기밀 해시를 상기 사용자 단말에 할당하여 저장하는 사용자 단말 할당부 및 분할된 상기 제2 분할 기밀 해시를 상기 블록체인에 할당하여 저장하는 블록체인 할당부를 포함한다.
여기서, 상기 기밀 해시 분할부는, 상기 기밀 해시를 서로 다른 길이를 갖도록 2분할하되, 상기 제1 분할 기밀 해시의 길이가 제2 분할 기밀 해시의 길이보다 크다.
여기서, 상기 블록체인 할당부는, 상기 블록체인의 우성 노드(Dominant Node)를 임의로 M개(여기서, M은 자연수) 선출하여 선출된 상기 M개의 노드에 상기 제2 분할 기밀 해시를 저장한다.
또한, 상기 사용자 단말로부터 복원 요청을 입력 받으면, 상기 기밀 해시를 복원하고, 복원된 상기 기밀 해시를 이용하여 상기 분산 저장 노드 각각에 저장된 상기 비식별 데이터 조각을 검색하는 데이터 복원부 및 상기 비식별 데이터 조각들을 병합하여 상기 비식별 데이터를 생성하고, 상기 비식별 데이터를 복호화한 후 상기 페이크 데이터를 제거하여 상기 원시 데이터를 복원하여 상기 사용자 단말로 회신하는 복호화부를 더 포함한다.
여기서, 상기 데이터 복원부는, 상기 사용자 단말로부터 복원 요청을 입력 받으면, 상기 사용자 단말과 블록체인에 각각 저장된 상기 제1 분할 기밀 해시와 제2 분할 기밀 해시를 호출하여 상기 기밀 해시를 복원하는 기밀 해시 복원부, 복원된 상기 기밀 해시를 이용하여 상기 1차 조합 해시를 검색하는 1차 해시 검색부, 상기 1차 조합 해시를 N개(여기서, N은 자연수)의 해시값으로 분할하는 1차 해시 분할부 및 상기 N개의 해시값을 이용하여 상기 분산 저장 노드 각각에 저장된 상기 비식별 데이터 조각에서 상기 해시값과 각각 매칭되는 조각을 검색하는 비식별 데이터 조각 검색부를 포함한다.
여기서, 상기 복호화부는, 상기 데이터 복원부에서 검색한 상기 비식별 데이터 조각들을 병합하여 상기 비식별 데이터를 생성하는 데이터 조각 병합부 및 상기 비식별 데이터를 복호화한 후 상기 페이크 데이터를 제거하여 상기 원시 데이터를 복원하는 페이크 데이터 제거부를 포함한다.
본 발명의 일 실시예에 따른 데이터 비식별화처리를 이용한 데이터 분산처리 방법은, 암호화부가 사용자 단말로부터 입력된 원시 데이터에 임의로 생성한 페이크 데이터를 추가하고, 상기 페이크 데이터가 추가된 원시 데이터를 암호화하여 비식별 데이터를 생성하는 단계, 데이터 분할부가 상기 비식별 데이터를 다수의 조각들로 분할하여 다수의 비식별 데이터 조각들을 생성하는 단계, 분산형 데이터 처리부가 상기 비식별 데이터 조각들을 분산 저장 노드 각각에 분산 배포하여 저장하고, 상기 분산 저장 노드로부터 상기 분산 저장 노드 각각에 저장된 상기 비식별 데이터 조각에 매칭되는 N개의 해시값을 각각 호출하여 기밀 해시를 생성하는 단계 및 기밀 해시 저장부가 상기 분산형 데이터 처리부로부터 생성된 상기 기밀 해시를 분할하여 상기 사용자 단말과 블록체인에 저장하는 단계를 포함한다.
여기서, 상기 비식별 데이터를 생성하는 단계는, 상기 입력된 원시 데이터가 디지털 데이터로 변환이 가능한 조건인 데이터 입력 조건에 부합하는가를 검증하는 단계, 상기 입력된 원시 데이터가 상기 데이터 입력 조건에 부합하는 경우, 임의의 페이크 데이터를 생성하는 단계 및 상기 원시 데이터에 상기 페이크 데이터를 추가하여 디지털 코드를 생성하고, 상기 디지털 코드를 암호화하여 상기 비식별 데이터를 생성하는 단계를 포함한다.
여기서, 상기 기밀 해시를 생성하는 단계는, 상기 데이터 분할부에서 생성된 상기 비식별 데이터 조각들을 분산 저장 노드 각각에 분산 배포하여 저장하고, 저장된 상기 비식별 데이터 조각 각각의 해시값을 N개(여기서, N은 자연수) 생성하는 단계, 상기 분산 저장 노드로부터 상기 분산 저장 노드 각각에 저장된 상기 비식별 데이터 조각에 매칭되는 N개의 해시값을 각각 호출하여 1개의 해시로 조합하여 1차 조합 해시를 생성하는 단계 및 상기 1차 조합 해시의 해시값의 조합을 변경하는 재 해싱 과정을 수행하여 상기 기밀 해시를 생성하는 단계를 포함한다.
여기서, 상기 기밀 해시를 분할하여 상기 사용자 단말과 블록체인에 저장하는 단계는, 상기 기밀 해시의 해시값을 제1 분할 기밀 해시와 제2 분할 기밀 해시로 2분할하는 단계, 분할된 상기 제1 분할 기밀 해시를 상기 사용자 단말에 할당하여 저장하는 단계 및 분할된 상기 제2 분할 기밀 해시를 상기 블록체인에 할당하여 저장한다.
여기서, 상기 기밀 해시의 해시값을 제1 분할 기밀 해시와 제2 분할 기밀 해시로 2분할하는 단계는, 상기 기밀 해시를 서로 다른 길이를 갖도록 2분할하되, 상기 제1 분할 기밀 해시의 길이가 제2 분할 기밀 해시의 길이보다 크다.
이상에서 설명한 바와 같이 본 발명의 실시예들에 의하면, 사용자 단말로부터 입력된 원시 데이터에 임의로 생성한 페이크 데이터를 추가하고, 상기 페이크 데이터가 추가된 원시 데이터를 암호화하여 비식별 데이터를 생성하는 암호화부, 분산형 데이터 처리부로부터 생성된 상기 기밀 해시를 분할하여 상기 사용자 단말과 블록체인에 저장하는 기밀 해시 저장부를 포함하여 보안이 요구되는 정보에 대한 접근, 훼손, 유출을 방지할 수 있다.
또한, 개인정보 데이터 원본이 존재하지 않기에 유출의 피해가 없으며, 처리되는 데이터가 일부 또는 전체가 노출되더라도 식별이 불가능하도록 할 수 있다.
여기에서 명시적으로 언급되지 않은 효과라 하더라도, 본 발명의 기술적 특징에 의해 기대되는 이하의 명세서에서 기재된 효과 및 그 잠정적인 효과는 본 발명의 명세서에 기재된 것과 같이 취급된다.
도 1은 본 발명의 일 실시예에 따른 데이터 비식별화처리를 이용한 데이터 분산처리 장치를 나타낸 블록도이다.
도 2는 본 발명의 일 실시예에 따른 데이터 비식별화처리를 이용한 데이터 분산처리 장치의 암호화부를 나타낸 블록도이다.
도 3은 본 발명의 일 실시예에 따른 데이터 비식별화처리를 이용한 데이터 분산처리 장치의 분산형 데이터 처리부를 나타낸 블록도이다.
도 4는 본 발명의 일 실시예에 따른 데이터 비식별화처리를 이용한 데이터 분산처리 장치의 기밀 해시 저장부를 나타낸 블록도이다.
도 5는 본 발명의 일 실시예에 따른 데이터 비식별화처리를 이용한 데이터 분산처리 장치의 데이터 복원부를 나타낸 블록도이다.
도 6은 본 발명의 일 실시예에 따른 데이터 비식별화처리를 이용한 데이터 분산처리 장치의 복호화부를 나타낸 블록도이다.
도 7은 본 발명의 일 실시예에 따른 데이터 비식별화처리를 이용한 데이터 분산처리 장치의 구성을 나타낸 도면이다.
도 8은 본 발명의 일 실시예에 따른 데이터 비식별화처리를 이용한 데이터 분산처리 장치의 분산 저장 노드의 구성을 나타낸 도면이다.
도 9 내지 도 13은 본 발명의 일 실시예에 따른 데이터 비식별화처리를 이용한 데이터 분산처리 방법을 나타낸 흐름도이다.
이하, 본 발명에 관련된 데이터 비식별화처리를 이용한 데이터 분산처리 장치 및 방법에 대하여 도면을 참조하여 보다 상세하게 설명한다. 그러나, 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며, 설명하는 실시예에 한정되는 것이 아니다. 그리고, 본 발명을 명확하게 설명하기 위하여 설명과 관계없는 부분은 생략되며, 도면의 동일한 참조부호는 동일한 부재임을 나타낸다.
이하의 설명에서 사용되는 구성요소에 대한 접미사 "모듈" 및 "부"는 명세서 작성의 용이함만이 고려되어 부여되거나 혼용되는 것으로서, 그 자체로 서로 구별되는 의미 또는 역할을 갖는 것은 아니다.
본 발명은 데이터 비식별화처리를 이용한 데이터 분산처리 장치 및 방법에 관한 것이다.
도 1은 본 발명의 일 실시예에 따른 데이터 비식별화처리를 이용한 데이터 분산처리 장치를 나타낸 블록도이다.
도 1을 참조하면, 본 발명의 일 실시예에 따른 데이터 비식별화처리를 이용한 데이터 분산처리 장치(10)는 암호화부(100), 데이터 분할부(200), 분산형 데이터 처리부(300), 기밀 해시 저장부(400), 데이터 복원부(500), 복호화부(600)를 포함한다.
본 발명의 일 실시예에 따른 데이터 비식별화처리를 이용한 데이터 분산처리 장치(10)는 개인정보 데이터를 사용자 단말에 분산 처리하고, 인증 및 데이터 복원 요청 시 이를 조합하는 장치이다.
구체적으로, 개인정보 데이터에 시스템에서 자동으로 생성하는 페이크 데이터(FAKE Data)를 포함시켜 암호화 후 조각내어, 조각난 데이터는 IPFS 에 조각의 해시정보는 블록체인과 사용자단말에 분산처리하여 인증 및 데이터 복원 요청 시 이를 조합한다.
본 발명의 일 실시예에 따른 데이터 비식별화처리를 이용한 데이터 분산처리 장치(10)는 IPFS, 블록체인 등 P2P(Peer to Peer) 네트워크의 공개(Public) 및 비공개(Private) 노드(Node)를 기반으로 하는 것이 바람직하다.
데이터 비식별화처리를 이용한 데이터 분산처리 장치(10)는 개인정보를 암호화 통신(SSL)을 통하여 입력 받거나 복원이 요청 될 때, 사람이 파악할 수 없는 페이크 데이터를 시스템에서 자동으로 발생시켜 포함한 후, 이를 고급암호화표준(AES-256) 처리하여 IPFS, 블록체인에서 해시로 처리하는 개인정보 입력단계 전과정을 거치며, 복원이 요구될때는 개인정보 복원단계 전과정을 거치게 된다.
암호화부(100)는 사용자 단말로부터 입력된 원시 데이터에 임의로 생성한 페이크 데이터를 추가하고, 상기 페이크 데이터가 추가된 원시 데이터를 암호화하여 비식별 데이터를 생성한다.
여기서, 사용자 단말로부터 입력되는 원시 데이터는 개인 정보 데이터이다. 개인정보는, 성명, 주민등록번호, 사회보장번호, 주소, 휴대전화 번호, 아이디, 패스워드, 국적, 직장 명 등 그 자체만으로 개인을 알아볼 수 있거나, 자체만으로 알아볼 수 없어도 결합하여 개인을 특정, 식별할 수 있는 민감한 정보이다. 개인 정보는 타인에게 유출되는 경우 개인의 인격, 재산상의 손실뿐만 아니라 기업, 국가적으로도 막대한 손실을 입게 되는 매우 중요한 정보이므로, 철저한 유출 방지가 필요하다.
비식별 데이터는 개인 정보를 공유가 가능한 데이터로 처리한 데이터로써, 마스킹, 치환, 반식별화, 유형화 등을 통해 개인 속성을 비식별화하는 방법을 이용한다.
데이터 분할부(200)는 상기 비식별 데이터를 다수의 조각들로 분할하여 다수의 비식별 데이터 조각들을 생성한다.
구체적으로, 입력된 비식별암호화 데이터를 수신 하여, 이를 수천개 또는 임의의 크기로 선정하여 잘게 조각화 한다.
분산형 데이터 처리부(300)는 비식별 데이터 조각들을 분산 저장 노드 각각에 분산 배포하여 저장하고, 상기 분산 저장 노드로부터 상기 분산 저장 노드 각각에 저장된 상기 비식별 데이터 조각에 매칭되는 N개의 해시값을 각각 호출하여 기밀 해시를 생성한다.
여기서, 분산 저장 노드는, IPFS(Inter-Planetary File System)를 기반으로 하여 상기 분산형 데이터 처리부와 네트워크로 연결되는 다수의 사용자 노드들이다.
기밀 해시 저장부(400)는 분산형 데이터 처리부로부터 생성된 상기 기밀 해시를 분할하여 상기 사용자 단말과 블록체인에 저장한다.
데이터 복원부(500)는 사용자 단말로부터 복원 요청을 입력 받으면, 상기 기밀 해시를 복원하고, 복원된 상기 기밀 해시를 이용하여 상기 분산 저장 노드 각각에 저장된 상기 비식별 데이터 조각을 검색한다.
복호화부(600)는 비식별 데이터 조각들을 병합하여 상기 비식별 데이터를 생성하고, 상기 비식별 데이터를 복호화한 후 상기 페이크 데이터를 제거하여 상기 원시 데이터를 복원하여 상기 사용자 단말로 회신한다.
본 발명의 일 실시예에 따른 데이터 비식별화처리를 이용한 데이터 분산처리 장치는 조각화 및 배포 모듈을 통하여 잘게 쪼개어진 디지털 조각 코드를 추적하기 위해 매개체인 IPFS와 블록체인 노드, 사용자 단말에 각각 조각화 저장된 메타코드를 이용하고, IPFS에 분산 저장된 디지털 조각과 해시를 복원 모듈 및 병합&복호화 모듈을 통하여 복원, 병합 함으로써, 보안이 요구되는 정보에 대한 접근, 훼손, 유출을 방지할 수 있다.
도 2는 본 발명의 일 실시예에 따른 데이터 비식별화처리를 이용한 데이터 분산처리 장치의 암호화부를 나타낸 블록도이다.
도 2를 참조하면, 본 발명의 일 실시예에 따른 데이터 비식별화처리를 이용한 데이터 분산처리 장치(10)의 암호화부(100)는 데이터 검증부(110), 데이터 생성부(120), 비식별화 처리부(130)를 포함한다.
암호화부(100)는 사용자 단말로부터 입력된 원시 데이터에 임의로 생성한 페이크 데이터를 추가하고, 상기 페이크 데이터가 추가된 원시 데이터를 암호화하여 비식별 데이터를 생성한다.
데이터 검증부(110)는 상기 입력된 원시 데이터가 디지털 데이터로 변환이 가능한 조건인 데이터 입력 조건에 부합하는가를 검증한다.
데이터 생성부(120)는 상기 등록된 개인정보 데이터가 상기 데이터 입력 조건에 부합하는 경우, 임의의 페이크 데이터를 생성한다.
비식별화 처리부(130)는 상기 원시 데이터에 상기 페이크 데이터를 추가하여 디지털 코드를 생성하고, 상기 디지털 코드를 암호화하여 상기 비식별 데이터를 생성한다.
사용자 단말을 통하여 개인정보 데이터를 암호화 통신을 통하여 등록되면, 데이터 검증부(110)는 데이터 입력조건에 부합하는가를 검증한다. 이때, 데이터 입력조건은 알파벳, 한글, 숫자, 특수문자 등 디지털데이터로 변환이 가능한 것과 일정의 길이 등을 시스템이 정한 규정한 따라 결정된다. 입력 조건에 부합하면, 데이터 생성부(120)가 임의의 페이크 데이터를 발생시켜 포함한 후, 비식별화 처리부(130)가 이를 개인정보 데이터와 합쳐 디지털 코드로 생성한다. 생성된 디지털 코드는 암호화 하여, 개인정보 원본 데이터를 식별할 수 없는 암호화된 디지털 데이터를 생성한다. 이때, 비식별화 처리를 위한 페이크 데이터는 10킬로바이트(KB) 이내의 기계적으로 발생시킨 데이터이다.
도 3은 본 발명의 일 실시예에 따른 데이터 비식별화처리를 이용한 데이터 분산처리 장치의 분산형 데이터 처리부를 나타낸 블록도이다.
도 3을 참조하면, 본 발명의 일 실시예에 따른 데이터 비식별화처리를 이용한 데이터 분산처리 장치(10)의 분산형 데이터 처리부(300)는 노드 저장부(310), 1차 해시 생성부(320), 기밀 해시 생성부(330)를 포함한다.
분산형 데이터 처리부(300)는 비식별 데이터 조각들을 분산 저장 노드 각각에 분산 배포하여 저장하고, 상기 분산 저장 노드로부터 상기 분산 저장 노드 각각에 저장된 상기 비식별 데이터 조각에 매칭되는 N개의 해시값을 각각 호출하여 기밀 해시를 생성한다.
여기서, 분산 저장 노드는, IPFS(Inter-Planetary File System)를 기반으로 하여 상기 분산형 데이터 처리부와 네트워크로 연결되는 다수의 사용자 노드들이다.
노드 저장부(310)는 데이터 분할부에서 생성된 상기 비식별 데이터 조각들을 분산 저장 노드 각각에 분산 배포하여 저장하고, 저장된 상기 비식별 데이터 조각 각각의 해시값을 N개(여기서, N은 자연수) 생성한다.
1차 해시 생성부(320)는 상기 분산 저장 노드로부터 상기 분산 저장 노드 각각에 저장된 상기 비식별 데이터 조각에 매칭되는 N개의 해시값을 각각 호출하여 1개의 해시로 조합하여 1차 조합 해시를 생성한다.
기밀 해시 생성부(330)는 상기 1차 조합 해시의 해시값의 조합을 변경하는 재 해싱 과정을 수행하여 상기 기밀 해시를 생성한다.
분산형 데이터 처리부(300)는 IPFS의 각 노드 상태를 확인하고, 각 노드 중에서 성능이 우수한 N개 노드를 시스템이 자동으로 선정하도록 한다. 선정된 N개 노드로 각 조각 데이터를 배포하며, IPFS 알고리즘을 통해 해당 N개 노드와 연결된 다수의 M개 노드에 자동으로 분산 저장 된다. 분산 저장되는 각 조각은 즉시 각각의 해시 값을 생성하며, 1차 해시 생성부(320)는 이 조각의 해시들을 호출하여 일렬로 조합 후 1개의 1차 해시를 생성하고, 기밀 해시 생성부(330)는 해당 해시의 복잡성과 기밀성 유지를 위해 재 해싱 처리하여 2차 해시를 생성한다.
도 4는 본 발명의 일 실시예에 따른 데이터 비식별화처리를 이용한 데이터 분산처리 장치의 기밀 해시 저장부를 나타낸 블록도이다.
도 4를 참조하면, 본 발명의 일 실시예에 따른 데이터 비식별화처리를 이용한 데이터 분산처리 장치(10)의 기밀 해시 저장부(400)는 기밀 해시 분할부(410), 사용자 단말 할당부(420), 블록체인 할당부(430)를 포함한다.
기밀 해시 저장부(400)는 분산형 데이터 처리부로부터 생성된 상기 기밀 해시를 분할하여 상기 사용자 단말과 블록체인에 저장한다.
기밀 해시 분할부(410)는 상기 기밀 해시 생성부로부터 생성된 상기 기밀 해시의 해시값을 제1 분할 기밀 해시와 제2 분할 기밀 해시로 2분할한다.
기밀 해시 분할부(410)는 상기 기밀 해시를 서로 다른 길이를 갖도록 2분할하되, 상기 제1 분할 기밀 해시의 길이가 제2 분할 기밀 해시의 길이보다 크다.
사용자 단말 할당부(420)는 분할된 상기 제1 분할 기밀 해시를 상기 사용자 단말에 할당하여 저장한다.
블록체인 할당부(430)는 분할된 상기 제2 분할 기밀 해시를 상기 블록체인에 할당하여 저장한다.
블록체인 할당부(430)는 상기 블록체인의 우성 노드(Dominant Node)를 임의로 M개(여기서, M은 자연수) 선출하여 선출된 상기 M개의 노드에 상기 제2 분할 기밀 해시를 저장한다.
기밀 해시 저장부(400)는 생성된 2차 해시인 기밀 해시를 호출하여, 이 값을 2개로 분할 후 큰 값은 사용자 단말에 전송, 저장토록 하고, 작은 값은 블록체인 노드에 분산하여 저장하도록 한다. 이때, 블록체인 제어부는 2차 해시를 51%와 49% 또는 60%와 40% 등의 방법으로 반드시 한쪽이 크도록 계산하여 분할 한다.
도 5는 본 발명의 일 실시예에 따른 데이터 비식별화처리를 이용한 데이터 분산처리 장치의 데이터 복원부를 나타낸 블록도이다.
도 5를 참조하면, 본 발명의 일 실시예에 따른 데이터 비식별화처리를 이용한 데이터 분산처리 장치(10)의 데이터 복원부(500)는 기밀 해시 복원부(510), 1차 해시 검색부(520), 1차 해시 분할부(530), 비식별 데이터 조각 검색부(540)를 포함한다.
데이터 복원부(500)는 사용자 단말로부터 복원 요청을 입력 받으면, 상기 기밀 해시를 복원하고, 복원된 상기 기밀 해시를 이용하여 상기 분산 저장 노드 각각에 저장된 상기 비식별 데이터 조각을 검색한다.
기밀 해시 복원부(510)는 상기 사용자 단말로부터 복원 요청을 입력 받으면, 상기 사용자 단말과 블록체인에 각각 저장된 상기 제1 분할 기밀 해시와 제2 분할 기밀 해시를 호출하여 상기 기밀 해시를 복원한다.
1차 해시 검색부(520)는 복원된 상기 기밀 해시를 이용하여 상기 1차 조합 해시를 검색한다.
1차 해시 분할부(530)는 상기 1차 조합 해시를 N개(여기서, N은 자연수)의 해시값으로 분할한다.
비식별 데이터 조각 검색부(540)는 상기 N개의 해시값을 이용하여 상기 분산 저장 노드 각각에 저장된 상기 비식별 데이터 조각에서 상기 해시값과 각각 매칭되는 조각을 검색한다.
사용자 단말을 통하여 개인정보 데이터에 대한 복원 요청이 접수되면, 기밀 해시 복원부(510)는 즉시 기밀 해시가 분할 된 큰 값과 작은 값을 각각 사용자 단말과 블록체인 노드에서 호출하여 2차 해시인 기밀 해시로 복원한다.
이후, 데이터 복원부(500)의 1차 해시 검색부(520)는 분산형 데이터 처리부(300)를 호출하여 2차 해시를 이용하여 IPFS의 각 노드에서 1차 해시를 검색하여 찾아 낸다. 다시 1차 해시 분할부(530)는, 검색결과로 찾아낸 1차 해시를 N개 해시로 분할하고, 비식별 데이터 조각 검색부(540)는 해당 해시를 토대로 분산형 데이터 처리부(300)를 호출하여 IPFS각 노드에 존재하는 조각을 찾아온다.
도 6은 본 발명의 일 실시예에 따른 데이터 비식별화처리를 이용한 데이터 분산처리 장치의 복호화부를 나타낸 블록도이다.
도 6을 참조하면, 본 발명의 일 실시예에 따른 데이터 비식별화처리를 이용한 데이터 분산처리 장치(10)의 복호화부(600)는 데이터 조각 병합부(610), 페이크 데이터 제거부(620)를 포함한다.
복호화부(600)는 비식별 데이터 조각들을 병합하여 상기 비식별 데이터를 생성하고, 상기 비식별 데이터를 복호화한 후 상기 페이크 데이터를 제거하여 상기 원시 데이터를 복원하여 상기 사용자 단말로 회신한다.
데이터 조각 병합부(610)는 상기 데이터 복원부에서 검색한 상기 비식별 데이터 조각들을 병합하여 상기 비식별 데이터를 생성한다.
페이크 데이터 제거부(620)는 상기 비식별 데이터를 복호화한 후 상기 페이크 데이터를 제거하여 상기 원시 데이터를 복원한다.
복호화부(600)는 분산 저장 노드(실시예에서는 IPFS 노드)에서 찾아낸 각각의 데이터 조각들을 하나로 병합한 후, 복호화 처리하고, 처리된 내용을 확인하여 페이크 데이터를 제거 후, 개인정보 데이터 원본을 복원하여 사용자 단말에 회신한다.
도 7은 본 발명의 일 실시예에 따른 데이터 비식별화처리를 이용한 데이터 분산처리 장치의 구성을 나타낸 도면이다.
사용자 단말(20)로부터 데이터 분산처리 장치(10)에 입력되는 원시 데이터는 개인 정보 데이터이다. 개인정보는, 성명, 주민등록번호, 사회보장번호, 주소, 휴대전화 번호, 아이디, 패스워드, 국적, 직장 명 등 그 자체만으로 개인을 알아볼 수 있거나, 자체만으로 알아볼 수 없어도 결합하여 개인을 특정, 식별할 수 있는 민감한 정보이다. 개인 정보는 타인에게 유출되는 경우 개인의 인격, 재산상의 손실뿐만 아니라 기업, 국가적으로도 막대한 손실을 입게 되는 매우 중요한 정보이므로, 철저한 유출 방지가 필요하다.
인터넷 서비스에는 수많은 인터넷 서비스 공급자(ISP), 온라인 서비스 공급자(OSP), 공공기관 등에서 다양한 형태의 개인 정보가 저장되고 사용되며 이를 기반으로 로그인, 각종 인증, 쇼핑, 금융 결제 등 인터넷상의 중요 행위가 끊임없이 일어난다.
도 7을 참조하면, 온라인에서는 서비스를 제공하기 위하여 사용자를 식별해야만 하는데, 이를 위해 계정과 개인정보 입력을 요구하고 중앙화된 데이터베이스로 보관하여 처리해야 한다. 이때, 데이터베이스에 대한 암호화 및 보안 장비의 도입, 백업 정책 등 어떠한 방식을 사용하더라도 실제 많은 내 외적인 요인 즉, 관리자의 실수 또는 고의로 인한 유출과 해킹을 통해 유, 무형의 막대한 피해는 계속해서 발생하게 된다. 이에 따라, 본 발명의 일 실시예에 따른 분산형 데이터 처리부(300)는 중앙화된 데이터베이스 대신, IPFS(Inter-Planetary File System)를 기반으로 하여 비식별 데이터 조각들을 분산 저장 노드(30) 각각에 분산 배포하여 저장하고, 상기 분산 저장 노드로부터 상기 분산 저장 노드 각각에 저장된 상기 비식별 데이터 조각에 매칭되는 N개의 해시값을 각각 호출하여 기밀 해시를 생성한다.
이에 따라, 실질적으로 실수 또는 고의에 의한 유출과 악의적인 목적의 해킹이 발생하였더라도 개인정보 데이터 원본이 존재하지 않기에 유출의 피해가 없으며, 설령 처리되는 데이터가 일부 또는 전체가 노출되더라도 그 어떤 시스템이나 방법으로도 식별이 불가능하여, 궁극적으로 모든 악의적 상황을 무의미하게 만드는 정보처리시스템을 구현할 수 있다.
도 8은 본 발명의 일 실시예에 따른 데이터 비식별화처리를 이용한 데이터 분산처리 장치의 분산 저장 노드의 구성을 나타낸 도면이다.
본 발명의 일 실시예에 따른 데이터 비식별화처리를 이용한 데이터 분산처리 장치(10)는 IPFS(Inter-Planetary File System)를 기반으로 하여 비식별 데이터 조각들을 네트워크 상으로 연결된 분산 저장 노드를 구성하는 각각의 사용자(31, 32, 33, 34)에게 분산 배포하여 저장하고, 상기 분산 저장 노드로부터 상기 분산 저장 노드 각각에 저장된 상기 비식별 데이터 조각에 매칭되는 N개의 해시값을 각각 호출하여 기밀 해시를 생성한다.
IPFS(Inter-Planetary File System)는 사진, 글 그리고 영상 등과 같은 객체들을 저장하거나 조회를 할 때 특정 서버를 이용하지 않고도 모든 데이터를 파일의 해쉬(Hash)로 조회할 수 있다.
전체 네트워크에서 해쉬값을 가진 파일을 갖는 사용자를 검색하면, 해당 IPFS 노드가 파일을 반환하게 된다.
기존의 경우 데이터가 저장된 위치(Location)로 접근했다면, IPFS는 특정 데이터가 가지고 있는 내용(Contents)으로 접근하며, 전체 네트워크에 요청하기 때문에, IPFS가 HTTP에 비해 빠른 라우팅이 가능해진다.
본 발명의 일 실시예에 따른 데이터 비식별화처리를 이용한 데이터 분산처리 장치(10)는 IPFS를 이용하여 대용량 데이터를 별도 보관, 탐색할 수 있는 블록체인을 구성하게 된다.
도 8을 참조하면, 예를 들어 각각의 사용자(31, 32, 33, 34)가 내용이 동일한 파일(11)을 각각 가지고 있다고 했을 때, HTTP 방식에서 다운로드를 위해서는 각각의 주소에 접근해야 하지만 IPFS는 각각의 사용자(31, 32, 33, 34)의 파일을 동일한 것으로 간주하며, 다른 사람이 다운로드를 요청했을 때, 각각의 사용자의 파일에 동시에 접근해 각각의 파일을 동시에 다운로드 받는다. 이 때 다운로드 받는 파일을 작은 블록들(11a, 11b, 11c, 11d)로 나누어 블록 조각들을 각각의 사용자(31, 32, 33, 34)로부터 나눠서 받게 될 수 있다.
이에 따라, 실질적으로 실수 또는 고의에 의한 유출과 악의적인 목적의 해킹이 발생하였더라도 개인정보 데이터 원본이 존재하지 않기에 유출의 피해가 없으며, 설령 처리되는 데이터가 일부 또는 전체가 노출되더라도 그 어떤 시스템이나 방법으로도 식별이 불가능하여, 궁극적으로 모든 악의적 상황을 무의미하게 만드는 정보처리시스템을 구현할 수 있다.
도 9 내지 도 13은 본 발명의 일 실시예에 따른 데이터 비식별화처리를 이용한 데이터 분산처리 방법을 나타낸 흐름도이다.
도 9를 참조하면, 본 발명의 일 실시예에 따른 데이터 비식별화처리를 이용한 데이터 분산처리 방법은, 암호화부가 사용자 단말로부터 입력된 원시 데이터에 임의로 생성한 페이크 데이터를 추가하고, 상기 페이크 데이터가 추가된 원시 데이터를 암호화하여 비식별 데이터를 생성하는 단계(S100)에서 시작한다.
단계 S200에서 데이터 분할부가 상기 비식별 데이터를 다수의 조각들로 분할하여 다수의 비식별 데이터 조각들을 생성한다.
단계 S300에서 분산형 데이터 처리부가 상기 비식별 데이터 조각들을 분산 저장 노드 각각에 분산 배포하여 저장하고, 상기 분산 저장 노드로부터 상기 분산 저장 노드 각각에 저장된 상기 비식별 데이터 조각에 매칭되는 N개의 해시값을 각각 호출하여 기밀 해시를 생성한다.
단계 S400에서 기밀 해시 저장부가 상기 분산형 데이터 처리부로부터 생성된 상기 기밀 해시를 분할하여 상기 사용자 단말과 블록체인에 저장한다.
도 10에 나타난 바와 같이, 비식별 데이터를 생성하는 단계(S100)는,
단계 S110에서 개인정보 데이터를 등록하고, 단계 S120에서 입력된 원시 데이터가 디지털 데이터로 변환이 가능한 조건인 데이터 입력 조건에 부합하는가를 검증한다.
단계 S130에서 상기 등록된 개인정보 데이터가 상기 데이터 입력 조건에 부합하는 경우, 임의의 페이크 데이터를 생성한다.
단계 S140에서 원시 데이터에 상기 페이크 데이터를 추가하여 디지털 코드를 생성하고, 단계 S150에서 상기 디지털 코드를 암호화하여 상기 비식별 데이터를 생성한다.
도 11에 나타난 바와 같이, 기밀 해시를 생성하는 단계(S300)는,
단계 S310에서 분산 저장 노드를 확인하고, 단계 S320에서 성능이 우수한 순서대로 N개의 노드를 선정한다.
단계 S330에서 상기 데이터 분할부에서 생성된 상기 비식별 데이터 조각들을 분산 저장 노드 각각에 분산 배포하여 저장 하고, 단계 S340에서 저장된 상기 비식별 데이터 조각 각각의 해시값을 N개(여기서, N은 자연수) 생성한다.
단계 S350에서 상기 분산 저장 노드로부터 상기 분산 저장 노드 각각에 저장된 상기 비식별 데이터 조각에 매칭되는 N개의 해시값을 각각 호출하여 1개의 해시로 조합하여 1차 조합 해시를 생성한다.
단계 S360에서 상기 1차 조합 해시의 해시값의 조합을 변경하는 재 해싱 과정을 수행하여 상기 기밀 해시를 생성한다.
도 12에 나타난 바와 같이, 기밀 해시를 분할하여 상기 사용자 단말과 블록체인에 저장하는 단계(S400)는,
단계S410에서 상기 기밀 해시의 해시값을 제1 분할 기밀 해시와 제2 분할 기밀 해시로 2분할한다.
단계S420에서 제1 분할 기밀 해시의 길이와 제2 분할 기밀 해시의 길이를 비교한다.
단계S430에서 분할된 상기 제1 분할 기밀 해시를 상기 사용자 단말에 할당하여 저장한다.
단계S440에서 분할된 상기 제2 분할 기밀 해시를 상기 블록체인에 할당하여 저장한다.
또한, 도 13에 나타난 바와 같이, 사용자 데이터를 복원하여 사용자 단말로 회신하는 단계는,
단계 S510에서 상기 사용자 단말로부터 복원 요청을 입력 받으면 사용자단말과 블록체인에서 기밀해시를 호출하고, 단계 S520에서 사용자 단말과 블록체인에 각각 저장된 상기 제1 분할 기밀 해시와 제2 분할 기밀 해시를 호출하여 상기 기밀 해시를 복원한다.
단계 S530에서 복원된 상기 기밀 해시를 이용하여 상기 1차 조합 해시를 검색한다.
단계 S540에서 상기 1차 조합 해시를 N개(여기서, N은 자연수)의 해시값으로 분할한다.
단계 S550에서 N개의 해시값을 이용하여 상기 분산 저장 노드 각각에 저장된 상기 비식별 데이터 조각에서 상기 해시값과 각각 매칭되는 조각을 검색한다.
단계 S560 에서 데이터 복원부에서 검색한 상기 비식별 데이터 조각들을 병합하여 상기 비식별 데이터를 생성한다.
단계 S570 에서 상기 비식별 데이터를 복호화한 후 상기 페이크 데이터를 제거하여 상기 원시 데이터를 복원한다.
또한, 데이터 비식별화처리를 이용한 데이터 분산처리 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공한다.
이러한 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 기록 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(Floptical disk)와 같은 자기-광매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상의 설명은 본 발명의 일 실시예에 불과할 뿐, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명의 본질적 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현할 수 있을 것이다. 따라서 본 발명의 범위는 전술한 실시예에 한정되지 않고 특허 청구 범위에 기재된 내용과 동등한 범위 내에 있는 다양한 실시 형태가 포함되도록 해석되어야 할 것이다.
10: 데이터 비식별화처리를 이용한 데이터 분산처리 장치
100: 암호화부
200: 데이터 분할부
300: 분산형 데이터 처리부
400: 기밀 해시 저장부
500: 데이터 복원부
600: 복호화부

Claims (15)

  1. 사용자 단말로부터 입력된 원시 데이터에 임의로 생성한 페이크 데이터를 추가하고, 상기 페이크 데이터가 추가된 원시 데이터를 암호화하여 비식별 데이터를 생성하는 암호화부;
    상기 비식별 데이터를 다수의 조각들로 분할하여 다수의 비식별 데이터 조각들을 생성하는 데이터 분할부;
    상기 비식별 데이터 조각들을 분산 저장 노드 각각에 분산 배포하여 저장하고, 상기 분산 저장 노드로부터 상기 분산 저장 노드 각각에 저장된 상기 비식별 데이터 조각에 매칭되는 N개의 해시값을 각각 호출하여 기밀 해시를 생성하는 분산형 데이터 처리부; 및
    상기 분산형 데이터 처리부로부터 생성된 상기 기밀 해시를 분할하여 상기 사용자 단말과 블록체인에 저장하는 기밀 해시 저장부;를 포함하는 것을 특징으로 하는 데이터 분산처리 장치.
  2. 제1항에 있어서,
    상기 분산 저장 노드는,
    IPFS(Inter-Planetary File System)를 기반으로 하여 상기 분산형 데이터 처리부와 네트워크로 연결되는 것을 특징으로 하는 데이터 분산처리 장치.
  3. 제1항에 있어서,
    상기 암호화부는,
    상기 입력된 원시 데이터가 디지털 데이터로 변환이 가능한 조건인 데이터 입력 조건에 부합하는가를 검증하는 데이터 검증부;
    상기 입력된 원시 데이터가 상기 데이터 입력 조건에 부합하는 경우, 임의의 페이크 데이터를 생성하는 페이크 데이터 생성부; 및
    상기 원시 데이터에 상기 페이크 데이터를 추가하여 디지털 코드를 생성하고, 상기 디지털 코드를 암호화하여 상기 비식별 데이터를 생성하는 비식별화 처리부;를 포함하는 것을 특징으로 하는 데이터 분산처리 장치.
  4. 제1항에 있어서,
    상기 분산형 데이터 처리부는,
    상기 데이터 분할부에서 생성된 상기 비식별 데이터 조각들을 분산 저장 노드 각각에 분산 배포하여 저장하고, 저장된 상기 비식별 데이터 조각 각각의 해시값을 N개(여기서, N은 자연수) 생성하는 노드 저장부;
    상기 분산 저장 노드로부터 상기 분산 저장 노드 각각에 저장된 상기 비식별 데이터 조각에 매칭되는 N개의 해시값을 각각 호출하여 1개의 해시로 조합하여 1차 조합 해시를 생성하는 1차 해시 생성부; 및
    상기 1차 조합 해시의 해시값의 조합을 변경하는 재 해싱 과정을 수행하여 상기 기밀 해시를 생성하는 기밀 해시 생성부;를 포함하는 것을 특징으로 하는 데이터 분산처리 장치.
  5. 제4항에 있어서,
    상기 기밀 해시 저장부는,
    상기 기밀 해시 생성부로부터 생성된 상기 기밀 해시의 해시값을 제1 분할 기밀 해시와 제2 분할 기밀 해시로 2분할하는 기밀 해시 분할부;
    분할된 상기 제1 분할 기밀 해시를 상기 사용자 단말에 할당하여 저장하는 사용자 단말 할당부; 및
    분할된 상기 제2 분할 기밀 해시를 상기 블록체인에 할당하여 저장하는 블록체인 할당부;를 포함하는 것을 특징으로 하는 데이터 분산처리 장치.
  6. 제5항에 있어서,
    상기 기밀 해시 분할부는, 상기 기밀 해시를 서로 다른 길이를 갖도록 2분할하되, 상기 제1 분할 기밀 해시의 길이가 제2 분할 기밀 해시의 길이보다 큰 것을 특징으로 하는 데이터 분산처리 장치.
  7. 제5항에 있어서,
    상기 블록체인 할당부는,
    상기 블록체인의 우성 노드(Dominant Node)를 임의로 M개(여기서, M은 자연수) 선출하여 선출된 상기 M개의 노드에 상기 제2 분할 기밀 해시를 저장하는 것을 특징으로 하는 데이터 분산처리 장치.
  8. 제5항에 있어서,
    상기 사용자 단말로부터 복원 요청을 입력 받으면, 상기 기밀 해시를 복원하고, 복원된 상기 기밀 해시를 이용하여 상기 분산 저장 노드 각각에 저장된 상기 비식별 데이터 조각을 검색하는 데이터 복원부; 및
    상기 비식별 데이터 조각들을 병합하여 상기 비식별 데이터를 생성하고, 상기 비식별 데이터를 복호화한 후 상기 페이크 데이터를 제거하여 상기 원시 데이터를 복원하여 상기 사용자 단말로 회신하는 복호화부;를 더 포함하는 것을 특징으로 하는 데이터 분산처리 장치.
  9. 제8항에 있어서,
    상기 데이터 복원부는,
    상기 사용자 단말로부터 복원 요청을 입력 받으면, 상기 사용자 단말과 블록체인에 각각 저장된 상기 제1 분할 기밀 해시와 제2 분할 기밀 해시를 호출하여 상기 기밀 해시를 복원하는 기밀 해시 복원부;
    복원된 상기 기밀 해시를 이용하여 상기 1차 조합 해시를 검색하는 1차 해시 검색부;
    상기 1차 조합 해시를 N개(여기서, N은 자연수)의 해시값으로 분할하는 1차 해시 분할부; 및
    상기 N개의 해시값을 이용하여 상기 분산 저장 노드 각각에 저장된 상기 비식별 데이터 조각에서 상기 해시값과 각각 매칭되는 조각을 검색하는 비식별 데이터 조각 검색부;를 포함하는 것을 특징으로 하는 데이터 분산처리 장치.
  10. 제8항에 있어서,
    상기 복호화부는,
    상기 데이터 복원부에서 검색한 상기 비식별 데이터 조각들을 병합하여 상기 비식별 데이터를 생성하는 데이터 조각 병합부; 및
    상기 비식별 데이터를 복호화한 후 상기 페이크 데이터를 제거하여 상기 원시 데이터를 복원하는 페이크 데이터 제거부;를 포함하는 것을 특징으로 하는 데이터 분산처리 장치.
  11. 암호화부가 사용자 단말로부터 입력된 원시 데이터에 임의로 생성한 페이크 데이터를 추가하고, 상기 페이크 데이터가 추가된 원시 데이터를 암호화하여 비식별 데이터를 생성하는 단계;
    데이터 분할부가 상기 비식별 데이터를 다수의 조각들로 분할하여 다수의 비식별 데이터 조각들을 생성하는 단계;
    분산형 데이터 처리부가 상기 비식별 데이터 조각들을 분산 저장 노드 각각에 분산 배포하여 저장하고, 상기 분산 저장 노드로부터 상기 분산 저장 노드 각각에 저장된 상기 비식별 데이터 조각에 매칭되는 N개의 해시값을 각각 호출하여 기밀 해시를 생성하는 단계; 및
    기밀 해시 저장부가 상기 분산형 데이터 처리부로부터 생성된 상기 기밀 해시를 분할하여 상기 사용자 단말과 블록체인에 저장하는 단계;를 포함하는 것을 특징으로 하는 데이터 분산처리 방법.
  12. 제11항에 있어서,
    상기 비식별 데이터를 생성하는 단계는,
    상기 입력된 원시 데이터가 디지털 데이터로 변환이 가능한 조건인 데이터 입력 조건에 부합하는가를 검증하는 단계;
    상기 입력된 원시 데이터가 상기 데이터 입력 조건에 부합하는 경우, 임의의 페이크 데이터를 생성하는 단계; 및
    상기 원시 데이터에 상기 페이크 데이터를 추가하여 디지털 코드를 생성하고, 상기 디지털 코드를 암호화하여 상기 비식별 데이터를 생성하는 단계;를 포함하는 것을 특징으로 하는 데이터 분산처리 방법.
  13. 제11항에 있어서,
    상기 기밀 해시를 생성하는 단계는,
    상기 데이터 분할부에서 생성된 상기 비식별 데이터 조각들을 분산 저장 노드 각각에 분산 배포하여 저장하고, 저장된 상기 비식별 데이터 조각 각각의 해시값을 N개(여기서, N은 자연수) 생성하는 단계;
    상기 분산 저장 노드로부터 상기 분산 저장 노드 각각에 저장된 상기 비식별 데이터 조각에 매칭되는 N개의 해시값을 각각 호출하여 1개의 해시로 조합하여 1차 조합 해시를 생성하는 단계; 및
    상기 1차 조합 해시의 해시값의 조합을 변경하는 재 해싱 과정을 수행하여 상기 기밀 해시를 생성하는 단계;를 포함하는 것을 특징으로 하는 데이터 분산처리 방법.
  14. 제13항에 있어서,
    상기 기밀 해시를 분할하여 상기 사용자 단말과 블록체인에 저장하는 단계는,
    상기 기밀 해시의 해시값을 제1 분할 기밀 해시와 제2 분할 기밀 해시로 2분할하는 단계;
    분할된 상기 제1 분할 기밀 해시를 상기 사용자 단말에 할당하여 저장하는 단계; 및
    분할된 상기 제2 분할 기밀 해시를 상기 블록체인에 할당하여 저장하는 단계;를 포함하는 것을 특징으로 하는 데이터 분산처리 방법.
  15. 제14항에 있어서,
    상기 기밀 해시의 해시값을 제1 분할 기밀 해시와 제2 분할 기밀 해시로 2분할하는 단계는,
    상기 기밀 해시를 서로 다른 길이를 갖도록 2분할하되, 상기 제1 분할 기밀 해시의 길이가 제2 분할 기밀 해시의 길이보다 큰 것을 특징으로 하는 데이터 분산처리 방법.
KR1020190044314A 2019-04-16 2019-04-16 데이터 비식별화처리를 이용한 데이터 분산처리 장치 및 방법 KR20200121583A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190044314A KR20200121583A (ko) 2019-04-16 2019-04-16 데이터 비식별화처리를 이용한 데이터 분산처리 장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190044314A KR20200121583A (ko) 2019-04-16 2019-04-16 데이터 비식별화처리를 이용한 데이터 분산처리 장치 및 방법

Publications (1)

Publication Number Publication Date
KR20200121583A true KR20200121583A (ko) 2020-10-26

Family

ID=73006405

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190044314A KR20200121583A (ko) 2019-04-16 2019-04-16 데이터 비식별화처리를 이용한 데이터 분산처리 장치 및 방법

Country Status (1)

Country Link
KR (1) KR20200121583A (ko)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170299202A1 (en) * 2016-04-13 2017-10-19 Trane International Inc. Multi-functional heat pump apparatus
CN112632075A (zh) * 2020-12-25 2021-04-09 创新科技术有限公司 集群元数据的存储、读取方法和装置
KR102286016B1 (ko) * 2020-12-23 2021-08-04 주식회사 지에이치비 블록체인 기반의 클라우드 서비스 제공 시스템
KR102423284B1 (ko) * 2021-11-15 2022-07-19 백종윤 분산형 파일 시스템 기반의 파일 분산 저장 시스템
CN114978744A (zh) * 2022-06-08 2022-08-30 廖鼎 一种基于区块链的安防信息传输方法及系统
KR20230079709A (ko) * 2021-11-29 2023-06-07 성균관대학교산학협력단 클라우드 서버 기반의 헬스케어 데이터 관리 방법 및 장치
CN116645067A (zh) * 2023-07-19 2023-08-25 江西微博科技有限公司 一种基于事务知识的服务集成模型和服务集成方法
WO2024094075A1 (zh) * 2022-11-01 2024-05-10 中国移动通信集团设计院有限公司 基于区块链的数据交易方法及装置、计算设备及存储介质

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170299202A1 (en) * 2016-04-13 2017-10-19 Trane International Inc. Multi-functional heat pump apparatus
KR102286016B1 (ko) * 2020-12-23 2021-08-04 주식회사 지에이치비 블록체인 기반의 클라우드 서비스 제공 시스템
CN112632075A (zh) * 2020-12-25 2021-04-09 创新科技术有限公司 集群元数据的存储、读取方法和装置
KR102423284B1 (ko) * 2021-11-15 2022-07-19 백종윤 분산형 파일 시스템 기반의 파일 분산 저장 시스템
KR20230079709A (ko) * 2021-11-29 2023-06-07 성균관대학교산학협력단 클라우드 서버 기반의 헬스케어 데이터 관리 방법 및 장치
CN114978744A (zh) * 2022-06-08 2022-08-30 廖鼎 一种基于区块链的安防信息传输方法及系统
CN114978744B (zh) * 2022-06-08 2024-05-17 北京多正科技有限公司 一种基于区块链的安防信息传输方法及系统
WO2024094075A1 (zh) * 2022-11-01 2024-05-10 中国移动通信集团设计院有限公司 基于区块链的数据交易方法及装置、计算设备及存储介质
CN116645067A (zh) * 2023-07-19 2023-08-25 江西微博科技有限公司 一种基于事务知识的服务集成模型和服务集成方法
CN116645067B (zh) * 2023-07-19 2023-10-10 江西微博科技有限公司 一种基于事务知识的服务集成模型和服务集成方法

Similar Documents

Publication Publication Date Title
KR20200121583A (ko) 데이터 비식별화처리를 이용한 데이터 분산처리 장치 및 방법
Arora et al. Cloud security ecosystem for data security and privacy
US20200344218A1 (en) Secure message search
KR102219277B1 (ko) 인증된 컨텐츠 전달 제어를 위한 시스템 및 방법
Razaque et al. Privacy preserving model: a new scheme for auditing cloud stakeholders
Kapil et al. Attribute based honey encryption algorithm for securing big data: Hadoop distributed file system perspective
CN113067699B (zh) 基于量子密钥的数据共享方法、装置和计算机设备
WO2020123926A1 (en) Decentralized computing systems and methods for performing actions using stored private data
CN102821098A (zh) 云环境下即时通讯消息自溶解系统及方法
US20200145389A1 (en) Controlling Access to Data
Yadav et al. Mobile cloud computing issues and solution framework
Neela et al. An improved RSA technique with efficient data integrity verification for outsourcing database in cloud
US20230131640A1 (en) A data migration framework
Wale Amol et al. Data integrity auditing of cloud storage
Hamrioui et al. A systematic review of security mechanisms for big data in health and new alternatives for hospitals
JP2022523068A (ja) 安全な電子データ転送のためのシステムと方法
Nahar et al. Application of blockchain for the security of decentralized cloud computing
Kim et al. Data block management scheme based on secret sharing for HDFS
Roy et al. A Hybrid Security Framework to Preserve Multilevel Security on Public Cloud Networks
Raja et al. An enhanced study on cloud data services using security technologies
Krishna et al. Security on Data Auditing Protocols for Cloud Storage Data
Gagged et al. Improved secure dynamic bit standard technique for a private cloud platform to address security challenges
Sivasankari et al. IPFS Enabled Robust Mechanism for File Storage and Retrieval Using Block Chain
Elganzoury et al. A Provably Secure Android-Based Mobile Banking Protocol
Semwal et al. A Three Level Cryptographic Security Module To Ensure Security Of Health Care Data Stored In The Cloud

Legal Events

Date Code Title Description
E601 Decision to refuse application