KR20200064623A - System for providing block chain Solution on Data Integrity of Public data-set, and process method thereof - Google Patents

System for providing block chain Solution on Data Integrity of Public data-set, and process method thereof Download PDF

Info

Publication number
KR20200064623A
KR20200064623A KR1020180150935A KR20180150935A KR20200064623A KR 20200064623 A KR20200064623 A KR 20200064623A KR 1020180150935 A KR1020180150935 A KR 1020180150935A KR 20180150935 A KR20180150935 A KR 20180150935A KR 20200064623 A KR20200064623 A KR 20200064623A
Authority
KR
South Korea
Prior art keywords
dataset
data
owner
terminal
public
Prior art date
Application number
KR1020180150935A
Other languages
Korean (ko)
Other versions
KR102179076B1 (en
Inventor
유스투스 에코 옥티엔
이상곤
이훈재
Original Assignee
동서대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 동서대학교 산학협력단 filed Critical 동서대학교 산학협력단
Priority to KR1020180150935A priority Critical patent/KR102179076B1/en
Publication of KR20200064623A publication Critical patent/KR20200064623A/en
Application granted granted Critical
Publication of KR102179076B1 publication Critical patent/KR102179076B1/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/32Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols including means for verifying the identity or authority of a user of the system or for message authentication, e.g. authorization, entity authentication, data integrity or data verification, non-repudiation, key authentication or verification of credentials
    • H04L9/3236Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols including means for verifying the identity or authority of a user of the system or for message authentication, e.g. authorization, entity authentication, data integrity or data verification, non-repudiation, key authentication or verification of credentials using cryptographic hash functions
    • H04L67/2804
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/56Provisioning of proxy services
    • H04L67/561Adding application-functional data or data for application control, e.g. adding metadata
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/50Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols using hash chains, e.g. blockchains or hash trees
    • H04L2209/38

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Library & Information Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

The present invention relates to a system for providing a blockchain solution for guaranteeing data integrity of a public dataset, and a processing method thereof. According to the present invention, a method for processing a blockchain solution for guaranteeing data integrity of a public dataset comprises: a first step of registering, by one of data-set owner′s terminals (100-1 to 100-N) (N is a natural number of 2 or more), data-set metadata in a blockchain through a smart contract module (200); a second step of validating, by the smart contract module (200), the metadata to verify the data set registration; a third step of requesting, by a data collector module (300) which is an object that wants to acquire a dataset corresponding to another node, a dataset to the registered dataset owner′s terminal (100) for the dataset registered with the smart contract module (200); and a fourth step of transmitting the dataset to the data collector module (300) by the dataset owner′s terminal (100), while allowing the dataset owner′s terminal (100) to know that the dataset is from a correct owner by signing the dataset with a unique private key by the dataset owner′s terminal (100) before the transmission. Accordingly, openness, and efficiency and integrity of the dataset can be increased.

Description

공개 데이터셋의 데이터 무결성 보장을 위한 블록체인 솔루션 제공 시스템, 이의 처리 방법{System for providing block chain Solution on Data Integrity of Public data-set, and process method thereof}System for providing block chain solution on data integrity of public data-set, and process method thereof

본 발명은 공개 데이터셋의 데이터 무결성 보장을 위한 블록체인 솔루션 제공 시스템, 이의 처리 방법에 관한 것으로, 보다 구체적으로는, 개방성과 누구든지 시스템에 데이터셋 소유자 자신의 데이터셋을 제공할 수 있고, 동일한 데이터셋의 중복을 허락하지 않으므로, 데이터셋의 효율성과 무결성을 증가시킬 수 있을 뿐만 아니라, 원래의 데이터셋 소유자가 아닌 데이터셋을 훔쳐 자신의 것이라고 주장하는 것을 방지할 수 있도록 하기 위한 공개 데이터셋의 데이터 무결성 보장을 위한 블록체인 솔루션 제공 시스템, 이의 처리 방법에 관한 것이다. The present invention relates to a system for providing a blockchain solution for ensuring data integrity of a public dataset, and a method for processing the same, more specifically, openness and anyone can provide their own dataset to the system, and the same By not allowing duplicate datasets, it is possible to increase the efficiency and integrity of the dataset, as well as to prevent the stealing of the dataset from the original dataset owner and claiming to be theirs. A system for providing a blockchain solution for ensuring data integrity, and a method for processing the same.

비트코인과 같은 분산화된 트랜잭션 시스템의 출현은 블록체인으로서 알려져 있는 디지털값을 통해 소유권을 기록하는 신뢰할 수 있게 보안적인 프로토콜을 인터넷에 제공하였다. 시스템은 사람이 그러한 디지털값을 행사하는 것을 가능하게 하는 개인 키에 근원을 둔다. 그러나, 이러한 키가 디지털 방식으로 저장될 때, 그리고 특히 이러한 키가 트랜잭션될 때, 이러한 키는 실질적 손실을 야기할 수 있는 절도에 취약하다. 산업은 엔드포인트 디바이스에서의 높은 보장 작동에 대한 필요를 수년간 예상하였다. 이미 활용된 하드웨어 보안은 사람과 블록체인 사이의 상호 작용에 대한 보안 및 프라이버시를 강화시키는데 사용될 수 있다.The advent of decentralized transaction systems such as Bitcoin has provided the Internet with a reliably secure protocol for recording ownership through digital values known as blockchains. The system is rooted in a private key that enables a person to exercise such digital values. However, when these keys are stored digitally, and especially when these keys are transacted, these keys are vulnerable to theft that can cause substantial loss. The industry has anticipated the need for high guaranteed operation on endpoint devices for years. Hardware security that has already been utilized can be used to enhance security and privacy for interactions between people and blockchain.

대한민국 특허출원 출원번호 제10-2017-0014325호Republic of Korea Patent Application No. 10-2017-0014325

본 발명은 상기의 문제점을 해결하기 위한 것으로, 개방성과 누구든지 시스템에 데이터셋 소유자 자신의 데이터셋을 제공할 수 있고, 동일한 데이터셋의 중복을 허락하지 않으므로, 데이터셋의 효율성과 무결성을 증가시킬 수 있을 뿐만 아니라, 원래의 데이터셋 소유자가 아닌 데이터셋을 훔쳐 자신의 것이라고 주장하는 것을 방지할 수 있도록 하기 위한 공개 데이터셋의 데이터 무결성 보장을 위한 블록체인 솔루션 제공 시스템, 이의 처리 방법을 제공하기 위한 것이다.The present invention is to solve the above problems, openness and anyone can provide the dataset owner's own dataset to the system, and does not allow duplication of the same dataset, thereby increasing the efficiency and integrity of the dataset. In addition, it is possible to steal datasets that are not the original dataset owner and prevent them from claiming that it is their own.Blockchain solution providing system to ensure data integrity of public datasets, to provide a method for processing them will be.

또한, 본 발명은 데이터셋을 제공받은 사용자가 데이터셋을 품평(reviewing)하고 등급을 부여(rating)하도록 함으로써, 다른 사용자에게 데이터셋 질에 관한 정보를 제공할 수 있도록 하기 위한 공개 데이터셋의 데이터 무결성 보장을 위한 블록체인 솔루션 제공 시스템, 이의 처리 방법을 제공하기 위한 것이다.In addition, according to the present invention, data of a public dataset is provided so that a user who receives a dataset can provide information about the quality of the dataset to other users by reviewing and rating the dataset. It is to provide a blockchain solution providing system for guaranteeing integrity and its processing method.

그러나 본 발명의 목적들은 상기에 언급된 목적으로 제한되지 않으며, 언급되지 않은 또 다른 목적들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.However, the objects of the present invention are not limited to the above-mentioned objects, and other objects not mentioned will be clearly understood by those skilled in the art from the following description.

상기의 목적을 달성하기 위해 본 발명의 실시예에 따른 공개 데이터셋의 데이터 무결성 보장을 위한 블록체인 솔루션 처리 방법은, 데이터셋 소유자 단말(data-set owners terminal)(100-1 내지 100-N)(N은 2 이상의 자연수) 중 하나가 스마트 계약 모듈(smart contract module)(200)을 통하여 블록체인(block chain)에 데이터셋 메타데이터(data-set metadata)를 등록하는 제 1 단계; 스마트 계약 모듈(smart contract module)(200)이 메타데이터를 입증(validate)하여 데이타셋 등록을 확인(verify)하는 제 2 단계; 다른 노드(node)에 해당하는 데이터셋 획득을 원하는 개체인 데이터 수집 모듈(Data collector module)(300)이 스마트 계약 모듈(smart contract module)(200)로 등록한 데이터셋에 대해서 등록한 데이터셋 소유자 단말(data-set owners terminal)(100)에게 데이터셋을 요청하는 제 3 단계; 및 데이터셋 소유자 단말(data-set owners terminal)(100)이 데이터 수집 모듈(Data collector module)(300)로 데이터셋을 전송하되, 데이터셋 소유자 단말(data-set owners terminal)(100)이 전송 전 고유의 비밀키(private key)로 데이터셋에 서명함으로써, 데이터 수집 모듈(Data collector module)(300)에 의해 데이터셋이 올바른 소유자가 보낸 것임을 알 수 있도록 하는 제 4 단계; 를 포함하는 것을 특징으로 한다.In order to achieve the above object, a method for processing a blockchain solution for ensuring data integrity of a public dataset according to an embodiment of the present invention is a data-set owners terminal (100-1 to 100-N) A first step in which one of (N is a natural number of 2 or more) registers data-set metadata in a block chain through a smart contract module 200; A second step in which the smart contract module 200 validates the metadata and verifies the dataset registration; A dataset owner terminal registered for a dataset registered by the data collector module 300, which is an object that wants to acquire a dataset corresponding to another node, as a smart contract module 200 a third step of requesting a data set from the data-set owners terminal) 100; And the data-set owners terminal 100 transmits the data set to the data collector module 300, but the data-set owners terminal 100 transmits the data set. A fourth step of signing the dataset with a unique private key, so that the dataset is sent by the correct owner by the data collector module 300; It characterized in that it comprises.

이때, 상기 제 1 단계의 데이터셋 메타데이터는, 데이터셋_소유자의 공개키(public key), 데이터셋_이름, 데이터셋_기재사항(description), 인스턴스(instance)_개수, 속성(attibute)_개수, 데이터셋_URL, 데이터셋_해쉬(hash), 데이터셋_등급을 포함하는 것을 특징으로 한다.At this time, the data set metadata of the first step, dataset_owner's public key, dataset_name, dataset_description, instance_number, attribute (attibute) It is characterized by including _count, dataset_URL, dataset_hash, dataset_grade.

또한, 상기 제 2 단계는, 스마트 계약 모듈(smart contract module)(200)이, 이미 블록체인에 저장되어 있는 것과 동일한 해쉬를 갖는 새로운 데이터의 등록을 기각하며, 무효한 URL을 갖는 새로운 데이타셋의 등록을 기각하는 것을 특징으로 한다. In addition, in the second step, the smart contract module 200 rejects the registration of new data having the same hash already stored in the blockchain, and the new dataset having an invalid URL is rejected. It is characterized by dismissing the registration.

본 발명의 실시예에 따른 공개 데이터셋의 데이터 무결성 보장을 위한 블록체인 솔루션 제공 시스템, 이의 처리 방법은, 개방성과 누구든지 시스템에 데이터셋 소유자 자신의 데이터셋을 제공할 수 있고, 동일한 데이터셋의 중복을 허락하지 않으므로, 데이터셋의 효율성과 무결성을 증가시킬 수 있을 뿐만 아니라, 원래의 데이터셋 소유자가 아닌 데이터셋을 훔쳐 자신의 것이라고 주장하는 것을 방지할 수 있도록 하는 효과를 제공할 수 있다. A blockchain solution providing system for guaranteeing data integrity of a public dataset according to an embodiment of the present invention, and its processing method, are open and anyone can provide their own dataset to the system, and of the same dataset By not allowing redundancy, it can not only increase the efficiency and integrity of the dataset, but also provide the effect of stealing a dataset that is not the owner of the original dataset and preventing it from claiming it's own.

뿐만 아니라, 본 발명의 다른 실시예에 따른 공개 데이터셋의 데이터 무결성 보장을 위한 블록체인 솔루션 제공 시스템, 이의 처리 방법은, 데이터셋을 제공받은 사용자가 데이터셋을 품평(reviewing)하고 등급을 부여(rating)하도록 함으로써, 다른 사용자에게 데이터셋 질에 관한 정보를 제공할 수 있도록 하는 효과를 제공한다.In addition, a system for providing a blockchain solution for guaranteeing data integrity of a public dataset according to another embodiment of the present invention, and a processing method thereof, a user who receives the dataset reviews and ratings the dataset ( rating), it provides an effect of providing information about dataset quality to other users.

도 1은 본 발명의 실시예에 따른 공개 데이터셋의 데이터 무결성 보장을 위한 블록체인 솔루션 제공 시스템(1)의 기초가 되는 AI 시스템의 구조적 데이터 흐름(Architectural Data Flow of AI System)을 나타내는 도면이다.
도 2는 본 발명의 실시예에 따른 공개 데이터셋의 데이터 무결성 보장을 위한 블록체인 솔루션 제공 시스템(1)을 나타내는 도면이다.
도 3은 본 발명의 실시예에 따른 공개 데이터셋의 데이터 무결성 보장을 위한 블록체인 솔루션 제공 시스템(1)에서 스마트 계약 모듈(Smart contract module)(200)에 등록되는 블록체인의 데이터스토어 단위를 나타내는 도면이다.
도 4는 본 발명의 실시예에 따른 공개 데이터셋의 데이터 무결성 보장을 위한 블록체인 솔루션 제공 시스템(1)에서 스마트 계약 모듈(Smart contract module)(200)에 등록되는 데이터셋 등급의 예시를 나타내는 도면이다.
도 5는 본 발명의 실시예에 따른 공개 데이터셋의 데이터 무결성 보장을 위한 블록체인 처리 방법을 나타내는 흐름도이다.
1 is a diagram showing the structural data flow (Architectural Data Flow of AI System) of the AI system that is the basis of the blockchain solution providing system 1 for ensuring data integrity of a public dataset according to an embodiment of the present invention.
2 is a view showing a blockchain solution providing system 1 for ensuring data integrity of a public dataset according to an embodiment of the present invention.
3 shows a datastore unit of a blockchain registered in a smart contract module 200 in a blockchain solution providing system 1 for guaranteeing data integrity of a public dataset according to an embodiment of the present invention It is a drawing.
4 is a diagram illustrating an example of a dataset class registered in a smart contract module 200 in a blockchain solution providing system 1 for guaranteeing data integrity of a public dataset according to an embodiment of the present invention to be.
5 is a flowchart illustrating a blockchain processing method for guaranteeing data integrity of a public dataset according to an embodiment of the present invention.

이하, 본 발명의 바람직한 실시예의 상세한 설명은 첨부된 도면들을 참조하여 설명할 것이다. 하기에서 본 발명을 설명함에 있어서, 관련된 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략할 것이다.Hereinafter, a detailed description of a preferred embodiment of the present invention will be described with reference to the accompanying drawings. In the following description of the present invention, when it is determined that a detailed description of related known functions or configurations may unnecessarily obscure the subject matter of the present invention, the detailed description will be omitted.

본 명세서에 있어서는 어느 하나의 구성요소가 다른 구성요소로 데이터 또는 신호를 '전송'하는 경우에는 구성요소는 다른 구성요소로 직접 상기 데이터 또는 신호를 전송할 수 있고, 적어도 하나의 또 다른 구성요소를 통하여 데이터 또는 신호를 다른 구성요소로 전송할 수 있음을 의미한다.In the present specification, when one component'transmits' data or a signal to another component, the component may directly transmit the data or signal to another component, and through at least one other component This means that data or signals can be transmitted to other components.

도 1은 본 발명의 실시예에 따른 공개 데이터셋의 데이터 무결성 보장을 위한 블록체인 솔루션 제공 시스템(1)의 기초가 되는 AI 시스템의 구조적 데이터 흐름(Architectural Data Flow of AI System)을 나타내는 도면이다. 도 1을 참조하면, 본 발명에서의 데이터셋은 유투브, 페이스북, 그리고 정부 데이터 등과 같은 공개 데이터셋과 다양한 IoT 장치로부터 수동으로 수집된 개인용 데이터인 비공개 데이터셋을 포함할 수 있다. 1 is a diagram showing the structural data flow (Architectural Data Flow of AI System) of the AI system that is the basis of the blockchain solution providing system 1 for ensuring data integrity of a public dataset according to an embodiment of the present invention. Referring to FIG. 1, the data set in the present invention may include public data sets such as YouTube, Facebook, and government data, and private data sets, which are personal data collected manually from various IoT devices.

이에 따라 본 발명의 실시예에 따른 공개 데이터셋의 데이터 무결성 보장을 위한 블록체인 솔루션 제공 시스템(1)에서의 데이터 수집 모듈(100)은 비공개 데이터셋에 대해서는 게이트웨이를 통해 데이터 정규화 및 AI 시스템으로 일괄적인 트레이닝 작업 분배를 제공받을 수 있으며, 데이터 센터에 해당하는 AI 시스템으로 트레이닝 데이터를 병렬 일괄 처리하도록 데이터셋을 제공할 수 있다.Accordingly, the data collection module 100 in the blockchain solution providing system 1 for ensuring data integrity of a public dataset according to an embodiment of the present invention is batched into a data normalization and AI system through a gateway for a private dataset You can be provided with a distribution of training tasks, and you can provide a dataset to process the training data in parallel with the AI system corresponding to the data center.

도 2는 본 발명의 실시예에 따른 공개 데이터셋의 데이터 무결성 보장을 위한 블록체인 솔루션 제공 시스템(1)을 나타내는 도면이다. 도 3은 본 발명의 실시예에 따른 공개 데이터셋의 데이터 무결성 보장을 위한 블록체인 솔루션 제공 시스템(1)에서 스마트 계약 모듈(Smart contract module)(200)에 등록되는 블록체인의 데이터스토어 단위를 나타내는 도면이다. 도 4는 본 발명의 실시예에 따른 공개 데이터셋의 데이터 무결성 보장을 위한 블록체인 솔루션 제공 시스템(1)에서 스마트 계약 모듈(Smart contract module)(200)에 등록되는 데이터셋 등급의 예시를 나타내는 도면이다.2 is a view showing a blockchain solution providing system 1 for ensuring data integrity of a public dataset according to an embodiment of the present invention. 3 shows a datastore unit of a blockchain registered in a smart contract module 200 in a blockchain solution providing system 1 for guaranteeing data integrity of a public dataset according to an embodiment of the present invention It is a drawing. 4 is a diagram illustrating an example of a dataset class registered in a smart contract module 200 in a blockchain solution providing system 1 for guaranteeing data integrity of a public dataset according to an embodiment of the present invention to be.

먼저, 도 2를 참조하면, 공개 데이터셋의 데이터 무결성 보장을 위한 블록체인 솔루션 제공 시스템(1)은 제 1 내지 제 N 데이터셋 소유자 단말(100-1 내지 100-N, N은 2 이상의 자연수), 스마트 계약 모듈(Smart contract module)(200) 및 데이터 수집 모듈(Data collector module)(300)을 포함할 수 있다.First, referring to FIG. 2, the blockchain solution providing system 1 for guaranteeing data integrity of a public dataset is the first to Nth dataset owner terminals (100-1 to 100-N, where N is a natural number of 2 or more) , A smart contract module 200 and a data collector module 300.

제 1 내지 제 N 데이터셋 소유자 단말(100-1 내지 100-N, N은 2 이상의 자연수)은 블록체인 네트워크에 해당하는 스마트 계약 모듈(smart contract module)(200)을 통하여 블록체인(block chain)에 데이터셋 메타데이터(data-set metadata)를 등록할 수 있다.The first to Nth dataset owner terminals (100-1 to 100-N, where N is a natural number of 2 or more) are blocked through a smart contract module 200 corresponding to the blockchain network. Data-set metadata can be registered in.

여기서 스마트 계약 모듈(smart contract module)(200)에 등록되는 데이터셋 메타데이터는 도 3과 같이 다음과 같은 정보를 포함하나 이것으로 제한되지 않는다. 즉, 데이터셋_소유자의 공개키(public key), 데이터셋_이름(name), 데이터셋_기재사항(description), 인스턴스(instance)_개수, 속성(attibute)_개수, 데이터셋_URL, 데이터셋_해쉬(hash), 데이터셋_등급을 포함할 수 있다.Here, the dataset metadata registered in the smart contract module 200 includes the following information as shown in FIG. 3, but is not limited thereto. That is, dataset_owner's public key, dataset_name, dataset_description, instance_number, attribute_number, dataset_URL, Dataset_hash, dataset_class may be included.

데이터셋_소유자 공개키(public key)는 데이터셋 소유자의 공개키 정보로 제 1 내지 제 N 데이터셋 소유자 단말(100-1 내지 100-N)을 구성하는 각 소유자가 서명하여 보낸 데이터셋의 서명확인에 사용된다. 데이터셋_이름(name)은 데이터셋 이름으로 예를 들어 "Youtube-8M"일 수 있다. 데이터셋_기재사항(description)은 데이터셋에 관한 상세 설명을 의미한다. 인스턴스_개수(number)은 데이터셋에서 이용 가능한 인스턴스 개수를 의미한다. 속성(attibute)_개수는 데이터셋에서 이용 가능한 속성 개수를 의미한다. 데이터셋_URL은 데이터 수집 모듈(Data collector module)(300)을 운영하는 사용자가 데이터셋을 다운로드 할 수 있는 URL을 의미한다. 데이터셋_해쉬(hash)는 전체 데이터셋의 해쉬를 의미한다. 데이셋_등급(rate)은 데이터셋의 품질(quality)과 확실성(authenticity)을 나타내는 사용자가 부여하는 1과 5사이의 등급 번호(rating number)를 의미한다. Dataset_owner public key is the public key information of the dataset owner. Used for verification. The dataset_name is a dataset name, for example, "Youtube-8M". Dataset_description means a detailed description of the dataset. The instance_number refers to the number of instances available in the dataset. The number of attributes (attibute)_ means the number of attributes available in the dataset. Dataset_URL means a URL that allows a user who operates the data collector module 300 to download the dataset. Dataset_hash means the hash of the entire dataset. The dataset_rate refers to a rating number between 1 and 5 given by the user indicating the quality and authenticity of the dataset.

스마트 계약 모듈(smart contract module)(200)은 데이터셋 메타데이터를 입증(validate)하여 데이타셋 등록을 확인(verify)할 수 있다.The smart contract module 200 may verify dataset registration by validating dataset metadata.

보다 구체적으로, 스마트 계약 모듈(smart contract module)(200)은 기본적으로 다음과 같은 사항을 만족하면 등록을 기각할 수 있다. More specifically, the smart contract module 200 may basically dismiss registration if the following matters are satisfied.

첫 번째로, 데이터셋 메타데이터 중 데이터셋_해쉬(hash)를 확인하여 이미 블록체인에 저장되어 있는 것과 동일한 해쉬를 갖는 새로운 데이터의 등록을 기각하는데 이는 훔친 데이터셋의 중복 제거를 위함이다.First, by checking the dataset_hash of the dataset metadata, the registration of new data with the same hash already stored in the blockchain is dismissed, for the purpose of deduplication of the stolen dataset.

두 번째로, 데이터셋 메타데이터 중 데이터셋_URL에 대한 입증을 통해 무효한 URL을 갖는 새로운 데이타셋의 등록을 기각할 수 있다.Second, registration of a new dataset having an invalid URL may be rejected through verification of the dataset_URL among the dataset metadata.

데이터 수집 모듈(Data collector module)(300)은, 제 1 내지 제 N 데이터셋 소유자 단말(100-1 내지 100-N, N은 2 이상의 자연수)와 구분되는 다른 노드(node)에 해당하는 데이터셋 획득을 원하는 개체로 사용자가 운영하는 단말에 포함됨으로써, 스마트 계약 모듈(smart contract module)(200)에 등록한 데이터셋에 대해서 등록한 데이터셋 소유자 단말(data-set owners terminal)(100)에게 데이터셋을 요청함으로써, 데이터셋 소유자 단말(data-set owners terminal)(100)으로부터 데이터셋을 수신할 수 있다.The data collector module 300 is a data set corresponding to another node separated from the first to Nth dataset owner terminals (100-1 to 100-N, where N is a natural number of 2 or more). By being included in the terminal operated by the user as the object desired to acquire, the data set is registered to the registered data set owner terminal (data-set owners terminal) 100 for the data set registered in the smart contract module (smart contract module) (200) By requesting, a dataset can be received from a data-set owners terminal 100.

이 경우, 데이터 수집 모듈(Data collector module)(300)은 데이터셋 소유자 단말(data-set owners terminal)(100)에 의한 메타데이터 중 고유의 비밀키(private key)에 해당하는 데이터셋_소유자 공개키(public key)로 데이터셋에 서명된 상태로 데이터셋을 수신함으로써, 스마트 계약 모듈(Smart contract module)(200)에 등록된 블록체인 중 데이터셋_소유자 공개키(public key)를 통해 데이터셋이 올바른 소유자가 보낸 것임을 알 수 있다.In this case, the data collector module 300 discloses the dataset_owner corresponding to a unique private key among metadata by the data-set owners terminal 100. By receiving the dataset while the dataset is signed with the public key, the dataset through the dataset_owner public key among the blockchains registered in the smart contract module 200 You can see that this is from the right owner.

즉, 데이터 수집 모듈(Data collector module)(300)은 데이터셋의 서명(signature)을 검사(verify)하고, 또 블록체인에 저장된 데이터셋_해쉬(hash)와 데이터셋의 해쉬를 비교하여 데이터셋의 무결성(integrity)을 확인(virify)한다.That is, the data collector module 300 verifies the signature of the dataset, and also compares the dataset_hash stored in the blockchain with the hash of the dataset to set the dataset. Verify the integrity of the.

데이터 수집 모듈(Data collector module)(300)은 데이터셋이 유효하다고 판명하면, 데이터셋에 유효 등급(rate)을 부여한다(S16). 여기서 데이터 수집 모듈(Data collector module)(300)은 도 4와 같이 1부터 5까지 점수를 부여할 수 있으며, 큰 점수가 더 양질의 데이터셋임을 의미할 수 있다. When it is determined that the data set is valid, the data collector module 300 gives an effective rate to the data set (S16). Here, the data collector module 300 may assign a score from 1 to 5 as shown in FIG. 4, and may mean that a larger score is a higher quality dataset.

이러한 본 발명의 실시예에 따른 공개 데이터셋의 데이터 무결성 보장을 위한 블록체인 솔루션 제공 시스템(1)을 통해서 개방성과 누구든지 시스템에 데이터셋 소유자 자신의 데이터셋을 제공할 수 있다. 또한, 동일한 데이터셋의 중복을 허락하지 않으므로, 데이터셋의 효율성과 무결성을 증가시킬 수 있다. 또한, 원래의 데이터셋 소유자가 아닌 데이터셋을 훔쳐 자신의 것이라고 주장하는 것을 방지할 수 있다.Through the blockchain solution providing system 1 for guaranteeing data integrity of the public dataset according to the embodiment of the present invention, openness and anyone can provide the dataset owner's own dataset to the system. In addition, since duplication of the same dataset is not allowed, efficiency and integrity of the dataset can be increased. It can also prevent you from stealing a dataset that isn't the original dataset owner and claiming it's yours.

또한, 데이터셋을 제공받은 사용자가 데이터셋을 품평(reviewing)하고 등급을 부여(rating)하도록 함으로써, 다른 사용자에게 데이터셋 질에 관한 정보를 제공한다. 단, 대부분의 사용자는 정직하게 품평함을 가정한다.In addition, by providing the user who received the data set to review and rate the data set, information about the quality of the data set is provided to other users. However, most users are assumed to be honest.

도 5는 본 발명의 실시예에 따른 공개 데이터셋의 데이터 무결성 보장을 위한 블록체인 처리 방법을 나타내는 흐름도이다. 도 5를 참조하면, 데이터셋 소유자 단말(data-set owners terminal)(100-1 내지 100-N)(N은 2 이상의 자연수)은 스마트 계약 모듈(smart contract module)(200)을 통하여 블록체인(block chain)에 데이터셋 메타데이터(data-set metadata)를 등록한다(S11). 여기서 데이터셋 메타데이터는 데이터셋_소유자의 공개키(public key), 데이터셋_이름, 데이터셋_기재사항(description), 인스턴스(instance)_개수, 속성(attibute)_개수, 데이터셋_URL, 데이터셋_해쉬(hash), 데이터셋_등급을 포함할 수 있다.5 is a flowchart illustrating a blockchain processing method for guaranteeing data integrity of a public dataset according to an embodiment of the present invention. Referring to FIG. 5, a data-set owners terminal (100-1 to 100-N) (N is a natural number of 2 or more) is a blockchain through a smart contract module 200. Data-set metadata is registered in the block chain (S11). Here, the dataset metadata includes dataset_owner's public key, dataset_name, dataset_description, instance_number, attribute_number, dataset_URL , Dataset_hash, dataset_grade.

단계(S11) 이후, 스마트 계약 모듈(smart contract module)(200)은 메타데이터를 입증(validate)하여 데이타셋 등록을 확인(verify)한다(S12). 보다 구체적으로, 스마트 계약 모듈(smart contract module)(200)은 기본적으로 다음과 같은 사항을 만족하면 기각한다. 첫 번째로, 이미 블록체인에 저장되어 있는 것과 동일한 해쉬를 갖는 새로운 데이터의 등록을 기각하는데 이는 훔친 데이터셋의 중복 제거를 위함이다. 두 번째로, 무효한 URL을 갖는 새로운 데이타셋의 등록을 기각할 수 있다.After the step S11, the smart contract module 200 verifies the metadata and verifies the dataset registration (S12). More specifically, the smart contract module 200 is basically dismissed when the following matters are satisfied. First, the registration of new data with the same hash already stored in the blockchain is dismissed, for the purpose of deduplication of the stolen dataset. Second, the registration of new datasets with invalid URLs can be rejected.

단계(S12) 이후, 다른 노드(node)에 해당하는 데이터셋 획득을 원하는 개체인 데이터 수집 모듈(Data collector module)(300)은 스마트 계약 모듈(smart contract module)(200)로 등록한 데이터셋에 대해서 등록한 데이터셋 소유자 단말(data-set owners terminal)(100)에게 데이터셋을 요청한다(S13).After the step S12, the data collector module 300, which is an object that wants to acquire a data set corresponding to another node, is for a data set registered as a smart contract module 200. The data set is requested from the registered data-set owners terminal 100 (S13).

단계(S13)의 요청에 따라, 데이터셋 소유자 단말(data-set owners terminal)(100)은 데이터 수집 모듈(Data collector module)(300)로 데이터셋을 전송한다(S14). 이 경우, 데이터셋 소유자 단말(data-set owners terminal)(100)은 고유의 비밀키(private key)로 데이터셋에 서명함으로써, 데이터 수집 모듈(Data collector module)(300)에 의해 데이터셋이 올바른 소유자가 보낸 것임을 알 수 있도록 한다.According to the request of step S13, the data-set owners terminal 100 transmits the data set to the data collector module 300 (S14). In this case, the data-set owners terminal 100 signs the data set with a unique private key, so that the data set is correct by the data collector module 300. Make sure the owner knows it was sent.

단계(S14)에 따라 데이터셋의 내용을 받으면, 데이터 수집 모듈(Data collector module)(300)은 데이터셋의 서명(signature)을 검사(verify)하고, 또 블록체인에 저장된 해쉬와 데이터셋의 해쉬를 비교하여 이 데이터셋의 무결성(integrity)을 확인(virify)한다(S15).Upon receiving the contents of the dataset according to step S14, the data collector module 300 verifies the signature of the dataset, and hashes stored in the blockchain and hashes of the dataset Compare to verify the integrity of this dataset (S15).

단계(S15) 이후, 데이터 수집 모듈(Data collector module)(300)은 데이터셋이 유효하다고 판명하면, 데이터셋에 등급(rate)을 부여한다(S16). 여기서 데이터 수집 모듈(Data collector module)(300)은 1부터 5까지 점수를 부여하는데 큰 점수가 더 양질의 데이터셋임을 의미할 수 있다. After the step S15, the data collector module 300 determines that the data set is valid, and gives a rate to the data set (S16). Here, the data collector module 300 gives a score from 1 to 5, which may mean that a larger score is a higher quality dataset.

본 발명은 또한 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 장치를 포함한다.The present invention can also be embodied as computer readable codes on a computer readable recording medium. The computer-readable recording medium includes all types of recording devices in which data readable by a computer system is stored.

컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기테이프, 플로피 디스크, 광 데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어, 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. Examples of computer-readable recording media include ROM, RAM, CD-ROM, magnetic tapes, floppy disks, optical data storage devices, etc., which are also implemented in the form of carrier waves (for example, transmission over the Internet). Also includes.

또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다. 그리고 본 발명을 구현하기 위한 기능적인(functional) 프로그램, 코드 및 코드 세그먼트들은 본 발명이 속하는 기술 분야의 프로그래머들에 의해 용이하게 추론될 수 있다.In addition, the computer-readable recording medium may be distributed over network-connected computer systems so that the computer-readable code is stored and executed in a distributed manner. And functional programs, codes, and code segments for implementing the present invention can be easily inferred by programmers in the technical field to which the present invention pertains.

이상과 같이, 본 명세서와 도면에는 본 발명의 바람직한 실시예에 대하여 개시하였으며, 비록 특정 용어들이 사용되었으나, 이는 단지 본 발명의 기술 내용을 쉽게 설명하고 발명의 이해를 돕기 위한 일반적인 의미에서 사용된 것이지, 본 발명의 범위를 한정하고자 하는 것은 아니다. 여기에 개시된 실시예 외에도 본 발명의 기술적 사상에 바탕을 둔 다른 변형 예들이 실시 가능하다는 것은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 자명한 것이다.As described above, in the present specification and drawings, preferred embodiments of the present invention have been disclosed, and although specific terms are used, they are merely used in a general sense to easily describe the technical contents of the present invention and to help understand the invention. , It is not intended to limit the scope of the present invention. It is apparent to those skilled in the art to which the present invention pertains that other modified examples based on the technical idea of the present invention can be implemented in addition to the embodiments disclosed herein.

1 : 공개 데이터셋의 데이터 무결성 보장을 위한 블록체인 솔루션 제공 시스템
100-1 내지 100-N : 제 1 내지 제 N 데이터셋 소유자 단말
200 : 스마트 계약 모듈(Smart contract module)
300 : 데이터 수집 모듈(Data collector module)
1: Blockchain solution provision system to guarantee data integrity of public dataset
100-1 to 100-N: first to Nth dataset owner terminals
200: smart contract module
300: Data collector module

Claims (3)

데이터셋 소유자 단말(data-set owners terminal)(100-1 내지 100-N)(N은 2 이상의 자연수) 중 하나가 스마트 계약 모듈(smart contract module)(200)을 통하여 블록체인(block chain)에 데이터셋 메타데이터(data-set metadata)를 등록하는 제 1 단계;
스마트 계약 모듈(smart contract module)(200)이 메타데이터를 입증(validate)하여 데이타셋 등록을 확인(verify)하는 제 2 단계;
다른 노드(node)에 해당하는 데이터셋 획득을 원하는 개체인 데이터 수집 모듈(Data collector module)(300)이 스마트 계약 모듈(smart contract module)(200)로 등록한 데이터셋에 대해서 등록한 데이터셋 소유자 단말(data-set owners terminal)(100)에게 데이터셋을 요청하는 제 3 단계; 및
데이터셋 소유자 단말(data-set owners terminal)(100)이 데이터 수집 모듈(Data collector module)(300)로 데이터셋을 전송하되, 데이터셋 소유자 단말(data-set owners terminal)(100)이 전송 전 고유의 비밀키(private key)로 데이터셋에 서명함으로써, 데이터 수집 모듈(Data collector module)(300)에 의해 데이터셋이 올바른 소유자가 보낸 것임을 알 수 있도록 하는 제 4 단계; 를 포함하는 것을 특징으로 하는 공개 데이터셋의 데이터 무결성 보장을 위한 블록체인 솔루션 처리 방법.
One of the data-set owners terminal (100-1 to 100-N) (N is a natural number of 2 or more) is connected to the block chain through the smart contract module 200. A first step of registering data-set metadata;
A second step in which the smart contract module 200 validates the metadata and verifies the dataset registration;
A dataset owner terminal registered for a dataset registered by the data collector module 300, which is an object that wants to acquire a dataset corresponding to another node, as a smart contract module 200 a third step of requesting a data set from the data-set owners terminal) 100; And
The data-set owners terminal 100 transmits the data set to the data collector module 300, before the data-set owners terminal 100 transmits the data set. A fourth step of signing the dataset with a unique private key, so that the dataset is sent by the correct owner by the data collector module 300; Blockchain solution processing method for ensuring data integrity of a public data set, characterized in that it comprises a.
청구항 1에 있어서, 상기 제 1 단계의 데이터셋 메타데이터는,
데이터셋_소유자의 공개키(public key), 데이터셋_이름, 데이터셋_기재사항(description), 인스턴스(instance)_개수, 속성(attibute)_개수, 데이터셋_URL, 데이터셋_해쉬(hash), 데이터셋_등급을 포함하는 것을 특징으로 하는 공개 데이터셋의 데이터 무결성 보장을 위한 블록체인 솔루션 처리 방법.
The method according to claim 1, Data set metadata of the first step,
Dataset_owner's public key, dataset_name, dataset_description, instance_number, attribute_number, dataset_URL, dataset_hash( hash), a method of processing a blockchain solution for ensuring data integrity of a public data set, which includes a data set_class.
청구항 1에 있어서, 상기 제 2 단계는,
스마트 계약 모듈(smart contract module)(200)이, 이미 블록체인에 저장되어 있는 것과 동일한 해쉬를 갖는 새로운 데이터의 등록을 기각하며, 무효한 URL을 갖는 새로운 데이타셋의 등록을 기각하는 것을 특징으로 하는 공개 데이터셋의 데이터 무결성 보장을 위한 블록체인 솔루션 처리 방법.
The method according to claim 1, The second step,
The smart contract module 200 rejects the registration of new data with the same hash already stored in the blockchain, and rejects the registration of a new dataset with an invalid URL. Blockchain solution processing method to ensure data integrity of public datasets.
KR1020180150935A 2018-11-29 2018-11-29 System for providing block chain Solution on Data Integrity of Public data-set, and process method thereof KR102179076B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180150935A KR102179076B1 (en) 2018-11-29 2018-11-29 System for providing block chain Solution on Data Integrity of Public data-set, and process method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180150935A KR102179076B1 (en) 2018-11-29 2018-11-29 System for providing block chain Solution on Data Integrity of Public data-set, and process method thereof

Publications (2)

Publication Number Publication Date
KR20200064623A true KR20200064623A (en) 2020-06-08
KR102179076B1 KR102179076B1 (en) 2020-11-16

Family

ID=71090057

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180150935A KR102179076B1 (en) 2018-11-29 2018-11-29 System for providing block chain Solution on Data Integrity of Public data-set, and process method thereof

Country Status (1)

Country Link
KR (1) KR102179076B1 (en)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101680260B1 (en) * 2015-12-14 2016-11-29 주식회사 코인플러그 Certificate issuance system and method based on block chain
KR20170014325A (en) 2015-07-29 2017-02-08 황봉선 agricultural liner for drawing line and making method of furrow
US20170287068A1 (en) * 2016-03-31 2017-10-05 Thomson Reuters Global Resources Unlimited Company Systems and methods for providing financial data to financial instruments in a distributed ledger system
KR101816650B1 (en) * 2017-02-21 2018-01-09 주식회사 코인플러그 Method for providing simplified account registration service and authentication service, and authentication server using the same
JP2018022258A (en) * 2016-08-02 2018-02-08 Kddi株式会社 Duplication detection device, duplication detection method, and duplication detection program

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20170014325A (en) 2015-07-29 2017-02-08 황봉선 agricultural liner for drawing line and making method of furrow
KR101680260B1 (en) * 2015-12-14 2016-11-29 주식회사 코인플러그 Certificate issuance system and method based on block chain
US20170287068A1 (en) * 2016-03-31 2017-10-05 Thomson Reuters Global Resources Unlimited Company Systems and methods for providing financial data to financial instruments in a distributed ledger system
JP2018022258A (en) * 2016-08-02 2018-02-08 Kddi株式会社 Duplication detection device, duplication detection method, and duplication detection program
KR101816650B1 (en) * 2017-02-21 2018-01-09 주식회사 코인플러그 Method for providing simplified account registration service and authentication service, and authentication server using the same

Also Published As

Publication number Publication date
KR102179076B1 (en) 2020-11-16

Similar Documents

Publication Publication Date Title
US11784791B2 (en) Verifying an identity based on multiple distributed data sources using a blockchain to safeguard the identity
CN110336797B (en) Enterprise authentication and authentication tracing method, device and equipment based on block chain
US11050690B2 (en) Method for providing recording and verification service for data received and transmitted by messenger service, and server using method
US11151236B2 (en) File verification database system
US20200084045A1 (en) Establishing provenance of digital assets using blockchain system
CN101251881B (en) Device, system and method for recognizing content
JP2020511059A (en) Information authentication method and system
CN110879903A (en) Evidence storage method, evidence verification method, evidence storage device, evidence verification device, evidence storage equipment and evidence verification medium
CN110675144A (en) Enhancing non-repudiation of blockchain transactions
CN111800268A (en) Zero knowledge proof for block chain endorsements
CN111951003A (en) Cognitive system for managing consent to user data
JP6785808B2 (en) Policy forced delay
US11025430B2 (en) File provenance database system
WO2019177298A1 (en) Method and apparatus for managing user authentication in a blockchain network
KR101937188B1 (en) Method for managing information using merkle tree based on blockchain, server and terminal using the same
US11139960B2 (en) File redaction database system
US20220269754A1 (en) Decentralized system and method for asset registry and authentication
US10282461B2 (en) Structure-based entity analysis
CA3088147C (en) Data isolation in distributed hash chains
US11258771B2 (en) Systems and methods for sending user data from a trusted party to a third party using a distributed registry
CN111709860B (en) Method, device, equipment and storage medium for processing heritage
CN111666332A (en) Automatically evolving database endorsement policy
US20190139133A1 (en) System for periodically updating backings for resource requests
JP2023527713A (en) Filtering blockchain transactions
US20220092104A1 (en) System for automatic management and depositing of documents (images) hash in block-chain technology

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant