KR20210065565A - Data Privacy-Preserving Distributed Knowledge Discovery system based on the Blockchain and Method thereof - Google Patents

Data Privacy-Preserving Distributed Knowledge Discovery system based on the Blockchain and Method thereof Download PDF

Info

Publication number
KR20210065565A
KR20210065565A KR1020190154456A KR20190154456A KR20210065565A KR 20210065565 A KR20210065565 A KR 20210065565A KR 1020190154456 A KR1020190154456 A KR 1020190154456A KR 20190154456 A KR20190154456 A KR 20190154456A KR 20210065565 A KR20210065565 A KR 20210065565A
Authority
KR
South Korea
Prior art keywords
model
builder
builders
data
performance
Prior art date
Application number
KR1020190154456A
Other languages
Korean (ko)
Other versions
KR102309024B1 (en
Inventor
이건명
이용주
유상록
Original Assignee
충북대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 충북대학교 산학협력단 filed Critical 충북대학교 산학협력단
Priority to KR1020190154456A priority Critical patent/KR102309024B1/en
Publication of KR20210065565A publication Critical patent/KR20210065565A/en
Application granted granted Critical
Publication of KR102309024B1 publication Critical patent/KR102309024B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/13File access structures, e.g. distributed indices
    • G06F16/137Hash-based
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/13File access structures, e.g. distributed indices
    • G06F16/134Distributed indices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/1865Transactional file systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/08Key distribution or management, e.g. generation, sharing or updating, of cryptographic keys or passwords
    • H04L9/0816Key establishment, i.e. cryptographic processes or cryptographic protocols whereby a shared secret becomes available to two or more parties, for subsequent use
    • H04L9/0819Key transport or distribution, i.e. key establishment techniques where one party creates or otherwise obtains a secret value, and securely transfers it to the other(s)
    • H04L9/0825Key transport or distribution, i.e. key establishment techniques where one party creates or otherwise obtains a secret value, and securely transfers it to the other(s) using asymmetric-key encryption or public key infrastructure [PKI], e.g. key signature or public key certificates
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/32Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols including means for verifying the identity or authority of a user of the system or for message authentication, e.g. authorization, entity authentication, data integrity or data verification, non-repudiation, key authentication or verification of credentials
    • H04L9/3236Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols including means for verifying the identity or authority of a user of the system or for message authentication, e.g. authorization, entity authentication, data integrity or data verification, non-repudiation, key authentication or verification of credentials using cryptographic hash functions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/50Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols using hash chains, e.g. blockchains or hash trees
    • H04L2209/38

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Security & Cryptography (AREA)
  • Databases & Information Systems (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Medical Informatics (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

Disclosed is a distributed knowledge discovery system for providing data privacy based on blockchain. The system of the present invention comprises: a contract manager having an application logic to register a distributed data knowledge discovery contract and set initial parameters; an ML model builder having an application logic to subscribe to a blockchain group and register a model, as an ML model developer having its own data; an ML model data set which is not made public for privacy as the data owned by the ML model builder; an ML model developed by the ML model builder by using the ML model data set; and blockchain having a contract which is a software logic for registering an ML builder and managing an incentive system, as distributed ledger technology which cannot be modified once registered and whose record will last permanently. According to the present invention, knowledge can be discovered through a model shared in a distribution environment by third persons who do not trust each other by using blockchain.

Description

블록체인 기반의 데이터 프라이버시를 제공하는 분산 지식 발견 시스템 및 방법{Data Privacy-Preserving Distributed Knowledge Discovery system based on the Blockchain and Method thereof}Data Privacy-Preserving Distributed Knowledge Discovery system based on the Blockchain and Method thereof

본 발명은 훈련 데이터를 공개하지 않고 자신의 모델을 개발하여 블록체인을 통해 공유하고 모델 향상을 추구하기 위한 블록체인 기반의 분산 지식의 발견 시스템 및 방법에 관한 것으로서, 더욱 상세하게는 서로 신뢰하지 않는 복수의 당사자가 자신의 자체 데이터를 가지고 각자의 기계 모델을 개발한 후 블록체인을 통하여 서로의 학습 모델을 공유하여 모델 개선에 활용할 수 있도록 하는 블록체인 기반의 데이터 프라이버시를 제공하는 분산 지식 발견 시스템 및 방법에 관한 것이다.The present invention relates to a blockchain-based distributed knowledge discovery system and method for developing and sharing a model without disclosing training data and pursuing model improvement. A distributed knowledge discovery system that provides blockchain-based data privacy so that multiple parties can develop their own machine models with their own data and then share each other's learning models through blockchain and use them for model improvement; it's about how

종래의 기술로 ML 모델을 개발하고자 한다면, 양질의 모델을 개발하기 위해 대량의 데이터가 필요한데 관심 분야의 데이터는 잠재적인 가치를 지니므로 매우 중요한 자산이고 공개를 꺼리게 되어 공유가 어려운 문제가 있다. 동일한 수준의 모델 개발자는 자신의 ML 모델의 향상을 위한 공유 방법이 필요하지만 서로 신뢰하지 않는 제 3자들과 공유한다는 것은 어려운 일이다. If you want to develop an ML model with the prior art, a large amount of data is needed to develop a high-quality model. Data in the field of interest has potential value, so it is a very important asset and it is difficult to share it because it is reluctant to disclose it. Model developers at the same level need a shared way to improve their ML models, but it is difficult to share with third parties who do not trust each other.

그럼에도 불구하고 분산환경에서 지식의 발견을 위해 서로 자신의 모델과 데이터를 공유한다면, 먼저 공유하고 나중에 공유하지 않는 빌더가 발생할 수 있고, 모델을 등록하지 않는 ML 빌더가 발생할 경우, 먼저 모델을 공유한 빌더가 손해를 보게 되며, 모두 공유했다 하더라고 성능이 떨어지는 모델을 공유하게 됐을 경우 정직한 빌더가 손해를 보게 된다. Nevertheless, if their models and data are shared with each other for knowledge discovery in a distributed environment, builders who share first and do not share later may occur, and when ML builders who do not register a model occur, first share the model. Builders lose money, and honest builders lose if they all share a poorly performing model.

이러한 문제점을 해결하면서, 서로 신뢰하지 않는 제 3자간, 분산환경에서 공유된 모델을 통해 지식을 발견하는 방법을 블록체인을 이용해 제안하고자 하는 것이다. While solving these problems, it is intended to propose a method of discovering knowledge through a shared model in a distributed environment between third parties who do not trust each other using blockchain.

1. 대한민국 공개특허공보 제10-2019-0086301호(2019.07.22)1. Republic of Korea Patent Publication No. 10-2019-0086301 (2019.07.22) 2. 대한민국 공개특허공보 제10-2019-0041784호(2019.04.23)2. Republic of Korea Patent Publication No. 10-2019-0041784 (2019.04.23)

본 발명의 목적은 블록체인을 이용하여 서로 신뢰하지 않는 제 3자간, 분산환경에서 공유된 모델을 통해 지식을 발견할 수 있도록 한 블록체인 기반의 데이터 프라이버시를 제공하는 분산 지식 발견 시스템 및 방법을 제공하는 데 있다.It is an object of the present invention to provide a distributed knowledge discovery system and method that provides blockchain-based data privacy so that knowledge can be discovered through a model shared between third parties who do not trust each other and in a distributed environment using blockchain. is to do

본 발명의 다른 목적은 데이터 소유자 간의 신뢰를 바탕으로 하지 않는 다양한 문제를 해결하기 위하여 블록체인 기반의 인센티브 그룹 평가 방법 또는 벌금 부과를 포함하는 보증금 예치 방법 등을 이용할 수 있도록 한 블록체인 기반의 데이터 프라이버시를 제공하는 분산 지식 발견 시스템 및 방법을 제공하는 데 있다.Another object of the present invention is to use the blockchain-based incentive group evaluation method or the deposit deposit method including the imposition of fines to solve various problems that are not based on trust between data owners. It is to provide a distributed knowledge discovery system and method that provides

상기 목적을 달성하기 위하여, 본 발명의 일 실시예에 따른 블록체인 기반의 데이터 프라이버시를 제공하는 분산 지식 발견 시스템은,In order to achieve the above object, a distributed knowledge discovery system that provides data privacy based on a block chain according to an embodiment of the present invention,

분산 데이터 지식 발견 컨트랙트를 등록하고 초기 파라미터를 셋팅하는 컨트랙트 관리자이며, 어플리케이션 로직을 구비하는 컨트랙트 관리자; 자체 데이터를 가지고 있는 ML 모델 개발자를 의미하며, 블록체인에 그룹에 가입하고 모델을 등록할 수 있는 어플리케이션 로직을 구비하는 ML 모델 빌더; 상기 ML 모델 빌더가 소유한 자체 데이터로서, 프라이버시를 위해 공개하지 않는 ML 모델 데이터 셋; 상기 ML 모델 빌더가 상기 ML 모델 데이터 셋을 가지고 개발한 ML 모델; 및 한번 등록하면 변조할 수 없고 기록이 영구적으로 지속되는 분산 원장 기술이며, ML 빌더가 ML 모델을 등록하고, 인센티브 시스템 등을 관리하는 소프트웨어 로직인 컨트랙트를 구비하는 블록체인;을 포함하는 것을 특징으로 한다.A contract manager for registering a distributed data knowledge discovery contract and setting initial parameters, the contract manager having an application logic; means an ML model developer with its own data, and an ML model builder with application logic that can join a group and register a model on the blockchain; an ML model data set that is not disclosed for privacy as its own data owned by the ML model builder; an ML model developed by the ML model builder using the ML model data set; and a blockchain having a contract, which is a distributed ledger technology that cannot be tampered with and records are permanently maintained once registered, a software logic that ML builder registers ML models, and manages incentive systems, etc. do.

본 발명의 다른 실시예에 따른 블록체인 기반의 데이터 프라이버시를 제공하는 분산 지식 발견 방법은,A distributed knowledge discovery method that provides blockchain-based data privacy according to another embodiment of the present invention,

(a) 분산지식발견을 수행하기 위한 초기화 작업에 해당하는 분산지식발견 컨트랙트 초기화 단계; (b) ML 빌더를 모집하여 그룹을 형성하는 ML 빌더 그룹 형성 단계; (c) 등록한 ML 빌더가 자체 데이터를 이용하여 개발한 ML 모델을 암호화하여 블록체인에 등록하는 ML 모델 등록 단계; (d) 같은 그룹에 속한 다른 ML 빌더가 등록한 ML 모델을 블록체인으로 부터 다운로드하여 복호화하고 ML 모델을 복구하는 ML 모델 복구 단계; (e) ML 모델 빌더가 등록한 모델이 모두 동일한 모델인지 해시를 통해 유효성을 검사하는 ML 모델 유효성 검사 단계; (f) 다른 ML 빌더가 생성한 ML 모델을 복구하여 성능을 테스트하고 결과를 보고하는 ML 모델 성능 보고 단계; 및 (g) ML 성능 보고가 모두 완료되고 해당 절차에 따라 보증금 정산이 완료되는 ML 모델 태스크 완료 단계;를 포함하는 것을 특징으로 한다.(a) an initialization step of a distributed knowledge discovery contract corresponding to an initialization task for performing distributed knowledge discovery; (b) forming a group of ML builders by recruiting ML builders; (c) ML model registration step in which the registered ML builder encrypts the developed ML model using its own data and registers it in the blockchain; (d) ML model recovery step of downloading and decrypting ML models registered by other ML builders belonging to the same group from the blockchain and recovering the ML models; (e) an ML model validation step of validating whether the models registered by the ML model builder are all the same model through a hash; (f) ML model performance reporting step of repairing the ML model generated by other ML builders to test the performance and report the result; and (g) ML model task completion step in which all ML performance reports are completed and deposit settlement is completed according to the corresponding procedure.

상기 (a) 분산지식발견 초기화 단계는, 블록체인에 컨트랙트를 등록할 때 초기화하는 파라미터로 모델 공유 후 앙상블 접근법으로 훈련할 경우 '빌더의 보증금 액수', '부실모델벌금 액수', '부실데이터벌금 액수', '최소 빌더 수', '최대 빌더 수', '빌더 모집 기간', '최소 성능 점수'를 구비하는 단계; 및 재훈련 접근법으로 훈련할 경우 계층과 노드 수, 커널 크기 등을 포함하는 'ML 모델의 유형과 아키텍처'를 추가 파라미터로 구비하는 단계;를 포함하는 것을 특징으로 한다.In the (a) distributed knowledge discovery initialization step, when training in an ensemble approach after sharing a model as a parameter to initialize when registering a contract in the block chain, ‘builder’s deposit amount’, ‘bad model penalty amount’, ‘bad data penalty’ providing 'amount', 'minimum number of builders', 'maximum number of builders', 'builder recruitment period', and 'minimum performance score'; and providing as additional parameters 'type and architecture of the ML model' including the number of layers, the number of nodes, and the size of the kernel when training with the retraining approach.

상기 (b) ML 빌더 그룹 형성 단계는, '빌더 모집 기간'중에 참여를 원하는 빌더는 '빌더의 보증금액수'를 블록체인에 암호화폐로 예치금으로 송금하고 신청을 받는 예치금 설정 단계; 예치금을 설정한 빌더의 수가 '빌더 모집 기간'중에 '최소 빌더 수' 미만이면, ML 빌더 그룹 형성이 취소되고 받은 예치금은 모두 신청자에게 반환하는 ML 빌더 그룹 형성 취소 단계; 및 신청한 빌더 수가 '최소 빌더 수' 이상이면 ML 빌더 그룹이 성공적으로 형성되고, '빌더 모집 기간'이 만료되지 않았더라도 그룹의 제한 인원인 '최대 빌더 수' 빌더가 신청을 완료했으면, ML 빌더 그룹 형성이 성공되어 완료되는 단계;를 포함하는 것을 특징으로 한다.The (b) ML builder group formation step includes: a builder who wants to participate during the 'builder recruitment period' sends the 'builder's guarantee amount' to the block chain as a deposit in cryptocurrency and receives an application; If the number of builders who have set a deposit is less than the 'minimum number of builders' during the 'builder recruitment period', the ML builder group formation is canceled and the received deposit is all returned to the applicant; And if the number of builders applied is more than the 'minimum number of builders', the ML builder group is successfully formed, and even if the 'builder recruitment period' has not expired, if the group's limited number of 'maximum number of builders' builders complete the application, ML builders It is characterized in that it includes; a step in which the group formation is successful and complete.

상기 (c) ML 모델 등록 단계는, 모델 형성이 성공되면 'ML 모델의 유형과 아키텍터'를 확인하고 모델 훈련을 시작하며, 훈련 모델이 '최소 성능 점수' 이상에 도달하면 훈련을 완료하는 모델 훈련 완료 단계; 및 모델 훈련이 완료되면 블록체인에 등록하는데 이때 암호화키로 암호화한 훈련 모델과 수신 빌더의 공개키로 암호화한 복호화 키, 훈련 모델의 해시 값을 포함하는 메시지의 조합을 등록하는 단계;를 포함하는 것을 특징으로 한다.In the (c) ML model registration step, when the model formation is successful, the 'ML model type and architect' is checked and model training is started, and when the training model reaches the 'minimum performance score' or higher, the training is completed. completion stage; and registering a combination of the training model encrypted with the encryption key, the decryption key encrypted with the public key of the receiving builder, and a message including the hash value of the training model when the model training is completed. do it with

상기 (d) ML 모델 복구 단계는, 블록체인에 등록된 암호화된 메시지를 다운로드하여 ML 모델을 복구화 함에 있어서, 수신 빌더의 비밀키로 복호화한 복호화 키로 훈련 모델을 복호화하여 복구하는 단계를 포함하는 것을 특징으로 한다.The (d) ML model recovery step includes the step of recovering the training model by decrypting the training model with the decryption key decrypted with the private key of the receiving builder in recovering the ML model by downloading the encrypted message registered in the block chain. characterized.

상기 (e) ML 모델 유효성 검사 단계는, 복구된 모델의 해시 값을 생성하고 생성된 해시값과 블록체인에 등록된 메시지에 들어있는 해시 값(

Figure pat00001
을 비교하여 동일 성을 확인하는 단계; 동일성이 확인되면 동일함을 그룹의 모든 빌더들에게 보고하고, 동일성이 확인되지 않으면 비동일함을 보고하는 단계; 그룹에서 비동일함을 보고한 빌더들이 한명이라도 있으면 모델의 개발자에게 재 등록을 요구하는 단계; 재 등록 하지 않거나, 재 등록된 모델을 재검사하여 동일성이 확인되지 않을 경우, 비동일 함을 최종 보고하는 단계; 및 최종 비동일함이 보고되는 빌더는 그룹에서 제외하고, 제외된 빌더의 보증금은 기부금으로 전환되는 단계;를 포함하는 것을 특징으로 한다.In the (e) ML model validation step, a hash value of the restored model is generated, and the hash value contained in the generated hash value and the message registered in the block chain (
Figure pat00001
verifying identity by comparing them; Reporting the same to all builders in the group if the identity is confirmed, and reporting non-identity if the identity is not confirmed; requesting re-registration from the developer of the model if there is at least one builder reporting non-identity in the group; Final reporting of non-identity if not re-registration or re-inspection of re-registered models to confirm identity; And the final non-identity reported builder is excluded from the group, and the deposit of the excluded builder is converted into a donation; characterized in that it comprises a.

상기 (f) ML 모델 성능 보고 단계는 모델 유효성 검사가 끝난 모델에 대해서 모델의 성능검사를 시행하고, '최소성능점수'에 도달하지 못하는 성능을 신고한 모델에 대해서는 모델 개발자에게는 '부실모델벌금'을 부여하고, 성능을 검사한 빌더에게는 '부실데이터벌금'을 부여하는 단계; 제대로 된 성능이 나오지 않은 것에는 성능 데이터가 부실할 가능성도 있고, 제대로 된 성능이 나왔음에도 거짓을 고하는 경우가 있으므로 성능 검사자에게도 벌금을 부과하되, '부실데이터벌금'의 액수가 '부실모델벌금'의 금액보다 적게 설정하는 단계; 및 상기 '부실데이터벌금'은 기부금에 포함시키는 단계;를 포함하는 것을 특징으로 한다.In the (f) ML model performance reporting step, model performance checks are performed on models that have completed model validation, and for models that report performance that does not reach the 'minimum performance score', a 'poor model penalty' is given to the model developer. and granting a 'bad data penalty' to the builders who have checked the performance; There is a possibility that performance data may be poor when the performance does not come out properly, and there are cases where the performance data is false even when the performance is correct. Therefore, a fine is imposed on the performance inspector, but the amount of the 'bad data penalty' is a set less than the amount of '; and the step of including the 'incorrect data penalty' in the donation.

상기 (g) ML 태스크 완료 단계는, 모든 작업이 완료되면, 첫째로 보증금을 제출한 빌더들의 금액을 정산하는 단계; 각자에게 부여된 벌금을 제외한 금액을 반환하며 벌금으로 모인 금액은 기부금에 포함시키는 단계; 및 성능 검사에 통과된 양질의 모델들은 모델 공유를 통해 앙상블 혹은 재훈련 방법을 통해 학습모델 향상 절차에 들어가는 단계;를 포함하는 것을 특징으로 한다.The (g) ML task completion step, when all the work is completed, the steps of first setting the amount of the builders who submitted the deposit; Returning the amount excluding the fine granted to each and including the amount collected as a penalty in the donation; and the step of entering the learning model improvement procedure through ensemble or retraining methods through model sharing through which high-quality models that have passed the performance test are shared.

본 발명에 따르면, 신뢰하지 않는 제 3자간의 모델 공유를 통해 자신의 ML 모델 성능을 향상시킬 수 있다. 즉 더 좋은 성능의 모델을 개발하기 위해 더 많은 데이터가 필요하지만, 이러한 모델 공유방법을 통해 한정된 자신의 데이터로 더 뛰어난 기계학습 모델을 개발할 수 있게 된다. 다른 공유자의 모델만 취하려는 정직하지 않은 모델 공유자에게는 합당한 벌금을 부과하여 사회에 환원할 수 있게 되므로, 정직한 모델 공유자는 신뢰하지 않는 제 3자와의 모델 공유에 대해 고려하지 않아도 되는 장점이 있다. According to the present invention, it is possible to improve the performance of one's own ML model through model sharing among untrusted third parties. In other words, more data is needed to develop a model with better performance, but through this model sharing method, a better machine learning model can be developed with limited own data. An honest model sharer has the advantage of not having to consider sharing a model with a third party who does not trust it, since it is possible to give back to society by giving a reasonable fine to the dishonest model sharer who only wants to take the model of other sharers.

또한 성능이 떨어지는 모델 공유자는 참여하는 다른 빌더들과 합동하여 검증하게 되므로 이러한 검증 방법을 통해 검증된 양질의 ML 모델과의 협업은 모델의 성능 및 가치를 향상시키게 되고 이는 향후 기계학습 발전에 기여할 것이다. In addition, since the model sharer with poor performance will be jointly verified with other participating builders, collaboration with high-quality ML models verified through this verification method will improve the performance and value of the model, which will contribute to the development of machine learning in the future. .

도 1은 본 발명에 따른 블록체인 기반의 데이터 프라이버시를 제공하는 분산 지식 발견 시스템의 전체 구성을 보여주는 블록 다이어그램이다.
도 2는 본 발명에 따른 블록체인 기반의 데이터 프라이버시를 제공하는 분산 지식 발견 방법을 개략적으로 도시한 도면이다.
1 is a block diagram showing the overall configuration of a distributed knowledge discovery system that provides blockchain-based data privacy according to the present invention.
2 is a diagram schematically illustrating a distributed knowledge discovery method that provides data privacy based on a block chain according to the present invention.

이하, 첨부된 도면을 참조하여 본 발명에 따른 블록체인 기반의 데이터 프라이버시를 제공하는 분산 지식 발견 시스템 및 방법에 대하여 상세히 설명한다.Hereinafter, a distributed knowledge discovery system and method for providing blockchain-based data privacy according to the present invention will be described in detail with reference to the accompanying drawings.

본 발명은 데이터를 공개하지 않고 분산된 지식의 발견을 하기 위해 블록체인을 통해 관리하는 방법에 관한 것으로서, 복수의 당사자가 자신의 자체 데이터를 가지고 각자의 기계 모델을 개발한 후 블록체인을 통하여 서로의 학습 모델을 공유하여 모델 개선에 활용하는 방법에 관한 것이다. The present invention relates to a method of managing through a blockchain to discover distributed knowledge without disclosing data, wherein a plurality of parties develop their own machine models with their own data and then each other through the blockchain It is about a method of sharing the learning model of the model and using it to improve the model.

이때 데이터 소유자 간의 신뢰를 바탕으로 하지 않는 다양한 문제를 해결하기 위하여 블록체인 기반의 인센티브 그룹 평가 방법, 벌금 부과를 포함하는 보증금 예치 방법 등을 이용하는 방법을 포함하며, 부정과 부실을 방지하기 위한 벌금은 최종 기부금으로 전환하는 인센티브방식을 적용한다. At this time, in order to solve various problems that are not based on trust between data owners, it includes a method of using a block chain-based incentive group evaluation method and a deposit deposit method including the imposition of a fine. Incentive method that converts to final donation is applied.

분산 환경에서 모델 개발이 가능한 빌더들은 서로의 신뢰도에 상관없이 자유롭게 그룹에 가입하여 모델 공유에 합류할 수 있어야 하며, 데이터의 프라이버시를 제공하면서 최소한의 당사자에게만 모델을 공유할 수 있어야 하며, 합류한 빌더들 중에 자신의 모델을 제때 공유하지 않고 다른 빌더들이 공유한 모델 만을 취하려 하는 정직하지 않은 빌더 들을 제한할 수 있어야 하며, 모델을 공유했다고 하더라도 성능이 떨어져 다른 모델에게 도움을 주지 못하는 모델을 공유하지 못하게 할 수 있어야 한다.Builders who can develop models in a distributed environment should be able to freely join groups and join model sharing regardless of mutual trust, and should be able to share models with the minimum number of parties while providing data privacy. Among them, it should be possible to limit dishonest builders who do not share their own models in a timely manner and want to take only the models shared by other builders, and even if the model is shared, do not share models that do not help other models due to poor performance. should be able to prevent

또한, 모든 행위들을 결과가 변조되지 않고 영원히 지속되는 블록체인의 컨트랙트를 이용하여 진행하고, 부정한 행위를 한 빌더와 성능이 떨어지는 모델의 공유로 정상적인 빌더에게 손해를 입힐 수 있는 빌더들을 제한하기 위하여, 보증금을 받고 벌금을 부과하고 정산된 금액을 돌려받는 블록체인 기반의 인센티브 메커니즘을 제안하며, 프라이버시를 제공하면서 필요에 의해 특정 대상에게만 특정 데이터를 공유할 수 있도록 암호화와 키분배 방식을 이용한 모델 공유 방법을 제시한다.In addition, all actions are carried out using a block chain contract that lasts forever without tampering with the results, and in order to limit builders who can harm normal builders by sharing models with poor performance with builders who have done fraudulent actions, We propose a blockchain-based incentive mechanism that receives a deposit, imposes a fine, and returns the settled amount. A model sharing method using encryption and key distribution so that specific data can be shared only with specific targets as needed while providing privacy. to present

하기 영문 약자 중에서 ML은 기계학습을 의미하고, MLSP는 기계학습 모델 개발자를 의미하며, MLC는 기계학습 모델 고객을 의미한다.Among the English abbreviations below, ML stands for machine learning, MLSP stands for machine learning model developer, and MLC stands for machine learning model customer.

도 1은 본 발명에 따른 블록체인 기반의 데이터 프라이버시를 제공하는 분산 지식 발견 시스템의 전체 구성을 보여주는 블록 다이어그램이다.1 is a block diagram showing the overall configuration of a distributed knowledge discovery system that provides blockchain-based data privacy according to the present invention.

도 1을 참조하면, 본 발명에 따른 블록체인 기반의 데이터 프라이버시를 제공하는 분산 지식 발견 시스템은, 컨트랙트 관리자(1), ML 모델 빌더(2), ML 모델 데이터 셋(3), ML 모델(4) 및 블록체인(5)을 포함한다.Referring to FIG. 1, the distributed knowledge discovery system that provides data privacy based on the block chain according to the present invention is a contract manager (1), ML model builder (2), ML model data set (3), ML model (4). ) and blockchain (5).

상기 컨트랙트 관리자(1)는 분산 데이터 지식 발견 컨트랙트를 등록하고 초기 파라미터를 셋팅하는 컨트랙트 관리자이며, 어플리케이션 로직을 포함한다.The contract manager 1 is a contract manager that registers a distributed data knowledge discovery contract and sets initial parameters, and includes application logic.

상기 ML 모델 빌더(

Figure pat00002
: 2)는 자체 데이터(
Figure pat00003
)를 가지고 있는 ML 모델 개발자를 의미하며, 블록체인에 그룹에 가입하고 모델을 등록할 수 있는 어플리케이션 로직을 포함한다.The ML model builder (
Figure pat00002
: 2) own data (
Figure pat00003
), which includes application logic that can join groups and register models on the blockchain.

상기 ML 모델 데이터 셋(

Figure pat00004
: 3)은 ML 모델 빌더(
Figure pat00005
: 2)가 소유한 자체 데이터를 의미하며, 프라이버시를 위해 공개하지 않는다.The ML model data set (
Figure pat00004
: 3) is the ML Model Builder (
Figure pat00005
: 2) means its own data, which is not disclosed for privacy.

상기 ML 모델(

Figure pat00006
: 4)은 ML 모델 빌더(
Figure pat00007
가 상기 ML 모델 데이터 셋(
Figure pat00008
을 가지고 개발한 ML 모델 (
Figure pat00009
)을 의미한다.The ML model (
Figure pat00006
: 4) is the ML Model Builder (
Figure pat00007
is the ML model data set (
Figure pat00008
ML model developed with
Figure pat00009
) means

상기 블록체인(Blockchain: 5)는 한번 등록하면 변조할 수 없고 기록이 영구적으로 지속되는 분산 원장 기술이며, ML 빌더가 ML 모델을 등록하고, 인센티브 시스템 등을 관리하는 소프트웨어 로직인 컨트랙트를 포함한다.The blockchain (Blockchain: 5) is a distributed ledger technology that cannot be tampered with and records are permanently maintained once registered, and includes a contract that is a software logic for ML builders to register ML models and manage incentive systems.

도 2는 본 발명에 따른 블록체인 기반의 데이터 프라이버시를 제공하는 분산 지식 발견 방법을 개략적으로 도식한 도면이다.2 is a diagram schematically illustrating a distributed knowledge discovery method that provides data privacy based on a block chain according to the present invention.

도 2를 참조하면, 본 발명에 따른 블록체인 기반의 데이터 프라이버시를 제공하는 분산 지식 발견 방법은, 분산지식발견을 수행하기 위한 초기화 작업에 해당하는 분산지식발견 컨트랙트 초기화 단계(a), ML 빌더를 모집하여 그룹을 형성하는 ML 빌더 그룹 형성 단계(b), 등록한 ML 빌더가 자체 데이터를 이용하여 개발한 ML 모델을 암호화하여 블록체인에 등록하는 ML 모델 등록 단계(c), 같은 그룹에 속한 다른 ML 빌더가 등록한 ML 모델을 블록체인으로 부터 다운로드하여 복호화하고 ML 모델을 복구하는 ML 모델 복구 단계(d), ML 모델 빌더가 등록한 모델이 모두 동일한 모델인지 해시를 통해 유효성을 검사하는 ML 모델 유효성 검사 단계(e), 다른 ML 빌더가 생성한 ML 모델을 복구하여 성능을 테스트하고 결과를 보고하는 ML 모델 성능 보고 단계(f) 및 ML 성능 보고가 모두 완료되고 해당 절차에 따라 보증금 정산이 완료되는 ML 모델 태스크 완료 단계(g)를 포함한다.Referring to FIG. 2 , the distributed knowledge discovery method for providing data privacy based on the block chain according to the present invention includes an initialization step (a) of a distributed knowledge discovery contract corresponding to an initialization task for performing distributed knowledge discovery, and an ML builder. ML builder group formation step (b) of recruiting and forming a group, ML model registration step (c) in which the registered ML builder encrypts the ML model developed using its own data and registers it in the blockchain (c), other ML belonging to the same group ML model recovery step (d) to download and decrypt the ML model registered by the builder from the block chain and recover the ML model, ML model validation step to validate whether the models registered by the ML model builder are all the same model through hash (e), ML model performance reporting step (f), in which the ML model generated by other ML builders is restored to test the performance and report the result, and the ML model in which the ML performance reporting is completed and deposit settlement is completed according to the corresponding procedure task completion step (g).

상기 분산지식발견 초기화 단계(a)는 분산지식발견 메커니즘을 시작하는 단계로 분산지식발견 컨트랙트를 컨트랙트 관리자가 블록체인에 등록하는 단계이다. 재훈련 접근법일 경우, 초기화 파라미터는 'ML 모델의 유형과 아키텍처', '빌더의 보증금 액수', '부실모델벌금 액수', '부실데이터벌금 액수', '최소 빌더 수', '최대 빌즉, 상기 분산지식발견 초기화 단계(a)는, 블록체인에 컨트랙트를 등록할 때 초기화하는 파라미터로 모델 공유 후 앙상블 접근법으로 훈련할 경우 '빌더의 보증금 액수', '부실모델벌금 액수', '부실데이터벌금 액수', '최소 빌더 수', '최대 빌더 수', '빌더 모집 기간', '최소 성능 점수'를 구비하는 단계; 및 재훈련 접근법으로 훈련할 경우 계층과 노드 수, 커널 크기 등을 포함하는 'ML 모델의 유형과 아키텍처'를 추가 파라미터로 구비하는 단계를 포함한다.The distributed knowledge discovery initialization step (a) is a step of starting the distributed knowledge discovery mechanism, and is a step in which the contract manager registers the distributed knowledge discovery contract in the block chain. In the case of the retraining approach, the initialization parameters are 'type and architecture of ML model', 'deposit amount of builders', 'amount of bad model fine', 'amount of bad data fine', 'minimum number of builders', 'maximum bill i.e. above Distributed knowledge discovery initialization step (a) is a parameter that is initialized when registering a contract in the block chain. When training in an ensemble approach after sharing the model, 'builder's deposit amount', 'bad model fine amount', 'bad data fine amount' ', 'minimum number of builders', 'maximum number of builders', 'builder recruitment period', and 'minimum performance score'; and providing 'type and architecture of the ML model', including layers, number of nodes, kernel size, and the like, as additional parameters when training with the retraining approach.

상기 ML 빌더 그룹 형성 단계(b)는 분산된 빌더가 자유롭게 그룹에 참여할 수 있는 단계이다. 그룹에 참여하는 빌더는 '빌더의 보증금 액수'에 맞는 금액을 예치하여야 하며, '빌더 모집 기간'중에 '최소 빌더 수'를 만족하는 빌더가 참여하면 그룹이 형성되고 '빌더 모집 기간'이 마감되지 않았더라도 '최대 빌더 수'가 그룹에 참여하면, ML 빌더 그룹은 형성되고 모집 종료한다. '빌더 모집기간'내에 '최소 빌더 수'를 만족하지 못하여 ML 빌더 그룹 형성에 실패하면, 모집된 보증금은 그대로 반환한다.The ML builder group formation step (b) is a step in which distributed builders can freely participate in the group. Builders participating in the group must deposit an amount that matches the 'builder's deposit amount', and if builders who satisfy the 'minimum number of builders' participate during the 'builder recruitment period', a group is formed and the 'builder recruitment period' is not closed. Even if not, if the 'maximum number of builders' joins the group, the ML builders group is formed and recruitment ends. If the ML builder group formation fails because the 'minimum number of builders' is not satisfied within the 'builder recruitment period', the collected deposit will be returned as it is.

즉, 상기 ML 빌더 그룹 형성 단계(b)는, '빌더 모집 기간'중에 참여를 원하는 빌더는 '빌더의 보증금액수'를 블록체인에 암호화폐로 예치금으로 송금하고 신청을 받는 예치금 설정 단계; 예치금을 설정한 빌더의 수가 '빌더 모집 기간'중에 '최소 빌더 수' 미만이면, ML 빌더 그룹 형성이 취소되고 받은 예치금은 모두 신청자에게 반환하는 ML 빌더 그룹 형성 취소 단계; 및 신청한 빌더 수가 '최소 빌더 수' 이상이면 ML 빌더 그룹이 성공적으로 형성되고, '빌더 모집 기간'이 만료되지 않았더라도 그룹의 제한 인원이 '최대 빌더 수' 빌더가 신청을 완료했으면, ML 빌더 그룹 형성이 성공되어 완료되는 단계를 포함한다.That is, the ML builder group formation step (b) includes: a builder who wants to participate during the 'builder recruitment period' sends the 'builder's guarantee amount' to the block chain as a deposit in cryptocurrency and receives an application; If the number of builders who have set a deposit is less than the 'minimum number of builders' during the 'builder recruitment period', the ML builder group formation is canceled and the received deposit is all returned to the applicant; And if the number of applied builders is greater than or equal to the 'minimum number of builders', the ML builder group is successfully formed, and even if the 'builder recruitment period' has not expired, if the 'maximum number of builders' builder has completed the application, the ML builder group and a step in which group formation is successful and complete.

상기 ML 모델 등록 단계(c)는 모델 형성이 성공하면, 'ML모델의 유형과 아키텍처'를 확인하고 모델 훈련을 시작한다. 훈련시킨 모델의 성능이 '최소 성능 점수' 이상에 도달하면, 훈련을 완료하고 모든 빌더 들에게 전송하기 위해 블록체인에 등록한다. 등록 시에는 비밀키로 암호화한 훈련 모델과 수신 빌더의 공개키로 암호화한 복호화 키, 훈련 모델의 해시값을 포함하는 메시지의 조합(

Figure pat00010
으로 등록한다.In the ML model registration step (c), if the model formation is successful, 'type and architecture of the ML model' is checked and model training is started. When the performance of the trained model reaches more than the 'minimum performance score', the training is completed and registered in the blockchain for transmission to all builders. At the time of registration, a combination of the training model encrypted with the private key, the decryption key encrypted with the public key of the receiving builder, and a message containing the hash value of the training model (
Figure pat00010
register as

Figure pat00011
Figure pat00011

즉, 상기 ML 모델 등록 단계(c)는, 모델 형성이 성공되면 'ML 모델의 유형과 아키텍터'를 확인하고 모델 훈련을 시작하며, 훈련 모델이 '최소 성능 점수' 이상에 도달하면 훈련을 완료하는 모델 훈련 완료 단계; 및 모델 훈련이 완료되면 블록체인에 등록하는데 이때 암호화키로 암호화한 훈련 모델과 수신 빌더의 공개키로 암호화한 복호화 키, 훈련 모델의 해시 값을 포함하는 메시지의 조합을 등록하는 단계를 포함한다.That is, in the ML model registration step (c), when the model formation is successful, the 'ML model type and architect' is checked and model training is started, and when the training model reaches the 'minimum performance score' or higher, training is completed. model training completion stage; And when the model training is completed, it is registered in the block chain, at this time registering a combination of a training model encrypted with an encryption key, a decryption key encrypted with the public key of the receiving builder, and a message including a hash value of the training model.

상기 ML 모델 복구 단계(d)는 블록체인에 등록된 암호화된 메시지(

Figure pat00012
를 다운로드 하여 ML 모델을 다운로드하여 복호화 한다. 복화화 절차는 먼저 비밀키로 복호화키(s)를 복구한다.The ML model recovery step (d) is an encrypted message (
Figure pat00012
Download and decrypt the ML model. The decryption procedure first recovers the decryption key (s) with the secret key.

Figure pat00013
Figure pat00013

즉, 상기 ML 모델 복구 단계(d)는 블록체인에 등록된 암호화된 메시지를 다운로드하여 ML 모델을 복구화 함에 있어서, 수신 빌더의 비밀키로 복호화한 복호화 키로 훈련 모델을 복호화하여 복구하는 단계를 포함한다.That is, the ML model recovery step (d) includes the step of restoring the training model by downloading the encrypted message registered in the block chain and restoring the training model with the decryption key decrypted with the private key of the receiving builder. .

상기 ML 모델 유효성 검사 단계(e)는 복구된 복호화키로 모델(

Figure pat00014
를 복호화하여 해시 값을 생성하고, 생성된 해시 값과 메시지(
Figure pat00015
로부터 복호화된 해시 값(
Figure pat00016
을 비교하여 동일성을 확인하고 동일함을 보고함. 모든 빌더가 해시값의 동일함을 확인하고 동일하지 않음이 보고된 빌더는 그룹에서 제외하고, 제외된 빌더의 보증금은 기부금에 포함한다.In the ML model validation step (e), the model (
Figure pat00014
decrypts to generate a hash value, and the generated hash value and message (
Figure pat00015
hash value decrypted from
Figure pat00016
by comparing them to confirm the identity and report the identity. All builders confirm that the hash value is the same, and builders reporting non-identity are excluded from the group, and the deposit of the excluded builders is included in the donation.

즉, 상기 ML 모델 유효성 검사 단계(e)는, 복구된 모델의 해시 값을 생성하고 생성된 해시값과 블록체인에 등록된 메시지에 들어있는 해시 값(

Figure pat00017
과 메시지(
Figure pat00018
를 비교하여 동일 성을 확인하는 단계; 동일성이 확인되면 동일함을 그룹의 모든 빌더들에게 보고하고, 동일성이 확인되지 않으면 비동일함을 보고하는 단계; 그룹에서 비동일함을 보고한 빌더들이 한명이라도 있으면 모델의 개발자에게 재 등록을 요구하는 단계; 재 등록 하지 않거나, 재 등록된 모델을 재검사하여 동일성이 확인되지 않을 경우, 비동일 함을 최종 보고하는 단계; 및 최종 비동일함이 보고되는 빌더는 그룹에서 제외하고, 제외된 빌더의 보증금은 기부금으로 전환되는 단계를 포함한다.That is, the ML model validation step (e) generates a hash value of the restored model and includes the generated hash value and the hash value (
Figure pat00017
and message (
Figure pat00018
verifying identity by comparing them; Reporting the same to all builders in the group if the identity is confirmed, and reporting non-identity if the identity is not confirmed; requesting re-registration from the developer of the model if there is at least one builder reporting non-identity in the group; Final reporting of non-identity if not re-registration or re-inspection of re-registered models to confirm identity; And the final non-identity is reported builder is excluded from the group, and the deposit of the excluded builder is converted into a donation.

상기 ML 모델 성능 보고 단계(f)는 모델 유효성 검사가 끝난 모델에 대해서 모델의 성능검사를 시행하고, '최소성능점수'에 도달하지 못하는 성능을 신고한 모델에 대해서는 모델 개발자에게는 '부실모델벌금'을 부여하고, 성능을 검사한 빌더에게는 '부실데이터벌금'을 부여한다. 제대로 된 성능이 나오지 않은 것에는 성능 데이터가 부실할 가능성도 있고, 제대로 된 성능이 나왔음에도 거짓을 고하는 경우가 있으므로 성능 검사자 에게도 벌금을 부과하되, '부실데이터벌금'의 액수가 '부실모델벌금'의 금액보다 적게 설정하고, '부실데이터벌금'은 기부금에 포함한다.In the ML model performance reporting step (f), the model performance check is performed on the model for which the model validation has been completed, and for the model reporting the performance that does not reach the 'minimum performance score', the model developer is subject to a 'poor model penalty'. , and a 'bad data penalty' is given to builders who have inspected their performance. There is a possibility that performance data may be poor when proper performance is not obtained, and there are cases when false performance is reported even when proper performance is obtained. Therefore, a fine is imposed on the performance inspector, but the amount of 'bad data fine' is 'bad model fine'. Set it to be less than the amount of ', and 'penalty for bad data' is included in the donation.

상기 ML 태스크 완료 단계(g)는 모든 작업이 완료되면, 첫째로 보증금을 제출한 빌더들의 금액을 정산한다. 각자에게 부여된 벌금을 제외한 금액을 반환하며 벌금으로 모인 금액은 기부금에 포함된다. 성능 검사에 통과된 양질의 모델들은 모델 공유를 통해 앙상블 혹은 재훈련 방법을 통해 학습모델 향상 절차에 들어간다.In the ML task completion step (g), when all the work is completed, first, the amount of the builders who submitted the deposit is settled. The amount excluding the fine imposed on each individual is returned, and the amount collected from the fine is included in the donation. High-quality models that have passed the performance test enter the learning model improvement process through ensemble or retraining methods through model sharing.

이상 본 발명자에 의해서 이루어진 발명을 상기 실시 예에 따라 구체적으로 설명하였지만, 본 발명은 상기 실시 예에 한정되는 것은 아니고 그 요지를 이탈하지 않는 범위에서 여러 가지로 변경 가능한 것은 이 기술분야에서 통상의 지식을 가진 자에게 자명하다.Although the invention made by the present inventor has been described in detail according to the above embodiment, the present invention is not limited to the above embodiment, and it is common knowledge in the art that various changes can be made without departing from the gist of the present invention. self-evident to those who have

1: 컨트랙트 관리자
2: ML 모델 빌더
3: ML 모델 데이터 셋
4: ML 모델
5: 블록체인
1: Contract Manager
2: ML Model Builder
3: ML model dataset
4: ML model
5: Blockchain

Claims (9)

블록체인 기반의 데이터 프라이버시를 제공하는 분산 지식 발견 시스템으로서,
분산 데이터 지식 발견 컨트랙트를 등록하고 초기 파라미터를 셋팅하는 컨트랙트 관리자이며, 어플리케이션 로직을 구비하는 컨트랙트 관리자;
자체 데이터를 가지고 있는 ML 모델 개발자를 의미하며, 블록체인에 그룹에 가입하고 모델을 등록할 수 있는 어플리케이션 로직을 구비하는 ML 모델 빌더;
상기 ML 모델 빌더가 소유한 자체 데이터로서, 프라이버시를 위해 공개하지 않는 ML 모델 데이터 셋;
상기 ML 모델 빌더가 상기 ML 모델 데이터 셋을 가지고 개발한 ML 모델; 및
한번 등록하면 변조할 수 없고 기록이 영구적으로 지속되는 분산 원장 기술이며, ML 빌더가 ML 모델을 등록하고, 인센티브 시스템 등을 관리하는 소프트웨어 로직인 컨트랙트를 구비하는 블록체인;을 포함하는 것을 특징으로 하는 블록체인 기반의 데이터 프라이버시를 제공하는 분산 지식 발견 시스템.
As a distributed knowledge discovery system that provides blockchain-based data privacy,
A contract manager for registering a distributed data knowledge discovery contract and setting initial parameters, the contract manager having an application logic;
means an ML model developer with its own data, and an ML model builder with application logic that can join a group and register a model on the blockchain;
an ML model data set that is not disclosed for privacy as its own data owned by the ML model builder;
an ML model developed by the ML model builder using the ML model data set; and
It is a distributed ledger technology that cannot be tampered with and records are permanently maintained once registered, and a block chain having a contract, a software logic that ML builders registers ML models, and manages incentive systems, etc. A distributed knowledge discovery system that provides blockchain-based data privacy.
블록체인 기반의 데이터 프라이버시를 제공하는 분산 지식 발견 방법으로서,
(a) 분산지식발견을 수행하기 위한 초기화 작업에 해당하는 분산지식발견 컨트랙트 초기화 단계;
(b) ML 빌더를 모집하여 그룹을 형성하는 ML 빌더 그룹 형성 단계;
(c) 등록한 ML 빌더가 자체 데이터를 이용하여 개발한 ML 모델을 암호화하여 블록체인에 등록하는 ML 모델 등록 단계;
(d) 같은 그룹에 속한 다른 ML 빌더가 등록한 ML 모델을 블록체인으로 부터 다운로드하여 복호화하고 ML 모델을 복구하는 ML 모델 복구 단계;
(e) ML 모델 빌더가 등록한 모델이 모두 동일한 모델인지 해시를 통해 유효성을 검사하는 ML 모델 유효성 검사 단계;
(f) 다른 ML 빌더가 생성한 ML 모델을 복구하여 성능을 테스트하고 결과를 보고하는 ML 모델 성능 보고 단계; 및
(g) ML 성능 보고가 모두 완료되고 해당 절차에 따라 보증금 정산이 완료되는 ML 모델 태스크 완료 단계;를 포함하는 것을 특징으로 하는 블록체인 기반의 데이터 프라이버시를 제공하는 분산 지식 발견 방법.
As a distributed knowledge discovery method that provides blockchain-based data privacy,
(a) a distributed knowledge discovery contract initialization step corresponding to an initialization task for performing distributed knowledge discovery;
(b) forming a group of ML builders by recruiting ML builders;
(c) ML model registration step in which the registered ML builder encrypts the developed ML model using its own data and registers it in the blockchain;
(d) ML model recovery step of downloading and decrypting ML models registered by other ML builders belonging to the same group from the blockchain and recovering the ML models;
(e) an ML model validation step of validating through a hash whether the models registered by the ML model builder are all the same model;
(f) ML model performance reporting step of repairing the ML model generated by other ML builders to test the performance and report the result; and
(g) ML model task completion step in which all ML performance reporting is completed and deposit settlement is completed according to the corresponding procedure; Distributed knowledge discovery method providing block chain-based data privacy, comprising: a.
제 2항에 있어서,
상기 (a) 분산지식발견 초기화 단계는,
블록체인에 컨트랙트를 등록할 때 초기화하는 파라미터로 모델 공유 후 앙상블 접근법으로 훈련할 경우 '빌더의 보증금 액수', '부실모델벌금 액수', '부실데이터벌금 액수', '최소 빌더 수', '최대 빌더 수', '빌더 모집 기간', '최소 성능 점수'를 구비하는 단계; 및 재훈련 접근법으로 훈련할 경우 계층과 노드 수, 커널 크기 등을 포함하는 'ML 모델의 유형과 아키텍처'를 추가 파라미터로 구비하는 단계;를 포함하는 것을 특징으로 하는 블록체인 기반의 데이터 프라이버시를 제공하는 분산 지식 발견 방법.
3. The method of claim 2,
In the (a) distributed knowledge discovery initialization step,
It is a parameter to initialize when registering a contract on the blockchain. When training in an ensemble approach after sharing a model, 'Amount of Builder's Deposit', 'Amount of Bad Model Fine', 'Amount of Bad Data Fine', 'Minimum Number of Builders', 'Maximum Number of Builders' providing a 'number of builders', a 'builder recruitment period', and a 'minimum performance score'; and providing 'type and architecture of the ML model' including layers, number of nodes, and kernel size as additional parameters when training with the retraining approach; providing data privacy based on block chain comprising: distributed knowledge discovery method.
제 2항에 있어서,
상기 (b) ML 빌더 그룹 형성 단계는,
'빌더 모집 기간'중에 참여를 원하는 빌더는 '빌더의 보증금액수'를 블록체인에 암호화폐로 예치금으로 송금하고 신청을 받는 예치금 설정 단계;
예치금을 설정한 빌더의 수가 '빌더 모집 기간'중에 '최소 빌더 수' 미만이면, ML 빌더 그룹 형성이 취소되고 받은 예치금은 모두 신청자에게 반환하는 ML 빌더 그룹 형성 취소 단계; 및
신청한 빌더 수가 '최소 빌더 수' 이상이면 ML 빌더 그룹이 성공적으로 형성되고, '빌더 모집 기간'이 만료되지 않았더라도 그룹의 제한 인원인 '최대 빌더 수' 빌더가 신청을 완료했으면, ML 빌더 그룹 형성이 성공되어 완료되는 단계;를 포함하는 것을 특징으로 하는 블록체인 기반의 데이터 프라이버시를 제공하는 분산 지식 발견 방법.
3. The method of claim 2,
The (b) ML builder group formation step,
Builders who want to participate during the 'builder recruitment period' send the 'builder's guarantee amount' to the block chain as a deposit in cryptocurrency and receive an application deposit setting step;
If the number of builders who have set a deposit is less than the 'minimum number of builders' during the 'builder recruitment period', the ML builder group formation is canceled and the received deposit is all returned to the applicant. and
If the number of builders applied is greater than or equal to the 'minimum number of builders', the ML builder group is successfully formed, and even if the 'builder recruitment period' has not expired, if the 'maximum number of builders', the group's limited number of builders, complete the application, the ML builder group A distributed knowledge discovery method that provides data privacy based on a block chain, characterized in that it comprises a step of successful formation and completion.
제 2항에 있어서,
상기 (c) ML 모델 등록 단계는,
모델 형성이 성공되면 'ML 모델의 유형과 아키텍터'를 확인하고 모델 훈련을 시작하며, 훈련 모델이 '최소 성능 점수' 이상에 도달하면 훈련을 완료하는 모델 훈련 완료 단계; 및
모델 훈련이 완료되면 블록체인에 등록하는데 이때 암호화키로 암호화한 훈련 모델과 수신 빌더의 공개키로 암호화한 복호화 키, 훈련 모델의 해시 값을 포함하는 메시지의 조합을 등록하는 단계;를 포함하는 것을 특징으로 하는 블록체인 기반의 데이터 프라이버시를 제공하는 분산 지식 발견 방법.
3. The method of claim 2,
The (c) ML model registration step is,
When the model formation is successful, the 'ML model type and architect' is checked and model training is started, and when the training model reaches the 'minimum performance score' or higher, the training is completed; and
When the model training is completed, it is registered in the block chain, and at this time, registering a combination of the training model encrypted with the encryption key, the decryption key encrypted with the public key of the receiving builder, and a message including the hash value of the training model; A distributed knowledge discovery method that provides blockchain-based data privacy.
제 2항에 있어서,
상기 (d) ML 모델 복구 단계는,
블록체인에 등록된 암호화된 메시지를 다운로드하여 ML 모델을 복구화 함에 있어서, 수신 빌더의 비밀키로 복호화한 복호화 키로 훈련 모델을 복호화하여 복구하는 단계를 포함하는 것을 특징으로 하는 블록체인 기반의 데이터 프라이버시를 제공하는 분산 지식 발견 방법.
3. The method of claim 2,
The (d) ML model recovery step is,
In restoring the ML model by downloading the encrypted message registered in the block chain, it comprises the step of decrypting and restoring the training model with the decryption key decrypted with the receiving builder's private key. distributed knowledge discovery method.
제 2항에 있어서,
상기 (e) ML 모델 유효성 검사 단계는,
복구된 모델의 해시 값을 생성하고 생성된 해시값과 메시지(
Figure pat00019
로부터 블록체인에 등록된 메시지에 들어있는 해시 값(
Figure pat00020
을 비교하여 동일성을 확인하는 단계;
동일성이 확인되면 동일함을 그룹의 모든 빌더들에게 보고하고, 동일성이 확인되지 않으면 비동일함을 보고하는 단계;
그룹에서 비동일함을 보고한 빌더들이 한명이라도 있으면 모델의 개발자에게 재 등록을 요구하는 단계;
재 등록 하지 않거나, 재 등록된 모델을 재검사하여 동일성이 확인되지 않을 경우, 비동일 함을 최종 보고하는 단계; 및
최종 비동일함이 보고되는 빌더는 그룹에서 제외하고, 제외된 빌더의 보증금은 기부금으로 전환되는 단계;를 포함하는 것을 특징으로 하는 블록체인 기반의 데이터 프라이버시를 제공하는 분산 지식 발견 방법.
3. The method of claim 2,
The (e) ML model validation step is,
Generate a hash value of the recovered model, and generate hash value and message (
Figure pat00019
The hash value contained in the message registered in the blockchain from
Figure pat00020
confirming identity by comparing them;
Reporting the same to all builders in the group if the identity is confirmed, and reporting non-identity if the identity is not confirmed;
requesting re-registration from the developer of the model if there is at least one builder reporting non-identity in the group;
Final reporting of non-identity if not re-registration or re-inspection of re-registered models to confirm identity; and
A distributed knowledge discovery method that provides data privacy based on a block chain, comprising: excluding builders reporting final non-identity from the group, and converting the excluded builders' deposits into donations.
제 2항에 있어서,
상기 (f) ML 모델 성능 보고 단계는 모델 유효성 검사가 끝난 모델에 대해서 모델의 성능검사를 시행하고, '최소성능점수'에 도달하지 못하는 성능을 신고한 모델에 대해서는 모델 개발자에게는 '부실모델벌금'을 부여하고, 성능을 검사한 빌더에게는 '부실데이터벌금'을 부여하는 단계;
제대로 된 성능이 나오지 않은 것에는 성능 데이터가 부실할 가능성도 있고, 제대로 된 성능이 나왔음에도 거짓을 고하는 경우가 있으므로 성능 검사자에게도 벌금을 부과하되, '부실데이터벌금'의 액수가 '부실모델벌금'의 금액보다 적게 설정하는 단계; 및
상기 '부실데이터벌금'은 기부금에 포함시키는 단계;를 포함하는 것을 특징으로 하는 블록체인 기반의 데이터 프라이버시를 제공하는 분산 지식 발견 방법.
3. The method of claim 2,
In the (f) ML model performance reporting step, a model performance check is performed on a model that has completed model validation, and a 'poor model penalty' for a model reporting a performance that does not reach the 'minimum performance score' and granting a 'bad data penalty' to the builders who have checked the performance;
There is a possibility that performance data may be poor when the performance is not good, and there are cases where the performance data is false even when the performance is correct, so a fine is imposed on the performance inspector, but the amount of the 'bad data fine' is the 'bad model fine' set less than the amount of '; and
The distributed knowledge discovery method for providing data privacy based on a block chain, characterized in that it includes; including the 'fine data penalty' in the donation.
제 2항에 있어서,
상기 (g) ML 태스크 완료 단계는,
모든 작업이 완료되면, 첫째로 보증금을 제출한 빌더들의 금액을 정산하는 단계;
각자에게 부여된 벌금을 제외한 금액을 반환하며 벌금으로 모인 금액은 기부금에 포함시키는 단계; 및
성능 검사에 통과된 양질의 모델들은 모델 공유를 통해 앙상블 혹은 재훈련 방법을 통해 학습모델 향상 절차에 들어가는 단계;를 포함하는 것을 특징으로 하는 블록체인 기반의 데이터 프라이버시를 제공하는 분산 지식 발견 방법.
3. The method of claim 2,
The (g) ML task completion step is,
When all the work is completed, first settling the amount of the builders who submitted the deposit;
Returning the amount excluding the fine granted to each and including the amount collected as a penalty in the donation; and
A distributed knowledge discovery method that provides data privacy based on a block chain, characterized in that the high-quality models that have passed the performance test enter the learning model improvement procedure through an ensemble or retraining method through model sharing.
KR1020190154456A 2019-11-27 2019-11-27 Data Privacy-Preserving Distributed Knowledge Discovery system based on the Blockchain and Method thereof KR102309024B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190154456A KR102309024B1 (en) 2019-11-27 2019-11-27 Data Privacy-Preserving Distributed Knowledge Discovery system based on the Blockchain and Method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190154456A KR102309024B1 (en) 2019-11-27 2019-11-27 Data Privacy-Preserving Distributed Knowledge Discovery system based on the Blockchain and Method thereof

Publications (2)

Publication Number Publication Date
KR20210065565A true KR20210065565A (en) 2021-06-04
KR102309024B1 KR102309024B1 (en) 2021-10-07

Family

ID=76391845

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190154456A KR102309024B1 (en) 2019-11-27 2019-11-27 Data Privacy-Preserving Distributed Knowledge Discovery system based on the Blockchain and Method thereof

Country Status (1)

Country Link
KR (1) KR102309024B1 (en)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030025963A (en) * 2002-03-19 2003-03-29 문의선 A systetm of remunerating contribution of data processing units and a method thereof
JP2019003402A (en) * 2017-06-15 2019-01-10 Kddi株式会社 Management device, management method, and program
KR101941200B1 (en) * 2018-06-26 2019-01-22 박윤곤 Social network system based on block chain that can deal with idea
KR20190041784A (en) 2017-10-13 2019-04-23 주식회사 포스링크 System and method for controlling distribution synchronization access based on blockchain in multicloud environment
CN109829326A (en) * 2018-11-20 2019-05-31 西安电子科技大学 Cross-domain certification and fair audit duplicate removal cloud storage system based on block chain
KR20190086301A (en) 2018-01-12 2019-07-22 인제대학교 산학협력단 System and method for distributed database using block chain
US20190236485A1 (en) * 2018-01-26 2019-08-01 Cisco Technology, Inc. Orchestration system for distributed machine learning engines
CN110288346A (en) * 2019-06-28 2019-09-27 杭州复杂美科技有限公司 Block chain distributed storage method for down loading, equipment and storage medium
JP6599065B1 (en) * 2018-12-26 2019-10-30 connectome.design株式会社 Machine learning model co-creation system, machine learning model co-creation method, and program

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030025963A (en) * 2002-03-19 2003-03-29 문의선 A systetm of remunerating contribution of data processing units and a method thereof
JP2019003402A (en) * 2017-06-15 2019-01-10 Kddi株式会社 Management device, management method, and program
KR20190041784A (en) 2017-10-13 2019-04-23 주식회사 포스링크 System and method for controlling distribution synchronization access based on blockchain in multicloud environment
KR20190086301A (en) 2018-01-12 2019-07-22 인제대학교 산학협력단 System and method for distributed database using block chain
US20190236485A1 (en) * 2018-01-26 2019-08-01 Cisco Technology, Inc. Orchestration system for distributed machine learning engines
KR101941200B1 (en) * 2018-06-26 2019-01-22 박윤곤 Social network system based on block chain that can deal with idea
CN109829326A (en) * 2018-11-20 2019-05-31 西安电子科技大学 Cross-domain certification and fair audit duplicate removal cloud storage system based on block chain
JP6599065B1 (en) * 2018-12-26 2019-10-30 connectome.design株式会社 Machine learning model co-creation system, machine learning model co-creation method, and program
CN110288346A (en) * 2019-06-28 2019-09-27 杭州复杂美科技有限公司 Block chain distributed storage method for down loading, equipment and storage medium

Also Published As

Publication number Publication date
KR102309024B1 (en) 2021-10-07

Similar Documents

Publication Publication Date Title
US11689362B2 (en) Distributed ledger for generating and verifying random sequence
US11388010B2 (en) Blockchain account migration
Macdonald et al. The blockchain: a comparison of platforms and their uses beyond bitcoin
US20200051041A1 (en) System and method for arbitrating a blockchain transaction
CN108846673B (en) Block data processing method, device, equipment and storage medium
CN111066283A (en) System and method for communicating, storing and processing data provided by entities on a blockchain network
US20220329436A1 (en) Token-based identity validation via blockchain
CN110275891A (en) Artificial intelligence software market
CN111369730B (en) Voting processing method and device based on block chain
US20230059580A1 (en) Blockchain with random committee selection
US20230070625A1 (en) Graph-based analysis and visualization of digital tokens
US20220276996A1 (en) Assessment node and token assessment container
US11924348B2 (en) Honest behavior enforcement via blockchain
CN112908442A (en) Medical data sharing method, device, equipment and computer readable medium
CN113221191B (en) Block chain-based data evidence storage method, device, equipment and storage medium
US20230043223A1 (en) Methods for Securely Adding Data to a Blockchain Using Dynamic Time Quanta and Version Authentication
CN112052474A (en) Blu-ray copy service
KR102324155B1 (en) Method and apparatus for autonomous guarantee verification for p2p loan service based on blockchain
Dash et al. Artificial intelligence models for blockchain-based intelligent networks systems: Concepts, methodologies, tools, and applications
Mijoska et al. Possibilities for applying blockchain technology–a survey
KR102309024B1 (en) Data Privacy-Preserving Distributed Knowledge Discovery system based on the Blockchain and Method thereof
CN110852887A (en) Method and device for acquiring transaction processing state in decentralized application cluster
Liu A hybrid blockchain-based event ticketing system
US11887146B2 (en) Product exploration-based promotion
Stampernas Blockchain technologies and smart contracts in the context of the Internet of Things

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant