KR102309024B1 - 블록체인 기반의 데이터 프라이버시를 제공하는 분산 지식 발견 시스템 및 방법 - Google Patents

블록체인 기반의 데이터 프라이버시를 제공하는 분산 지식 발견 시스템 및 방법 Download PDF

Info

Publication number
KR102309024B1
KR102309024B1 KR1020190154456A KR20190154456A KR102309024B1 KR 102309024 B1 KR102309024 B1 KR 102309024B1 KR 1020190154456 A KR1020190154456 A KR 1020190154456A KR 20190154456 A KR20190154456 A KR 20190154456A KR 102309024 B1 KR102309024 B1 KR 102309024B1
Authority
KR
South Korea
Prior art keywords
model
builders
builder
blockchain
knowledge discovery
Prior art date
Application number
KR1020190154456A
Other languages
English (en)
Other versions
KR20210065565A (ko
Inventor
이건명
이용주
유상록
Original Assignee
충북대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 충북대학교 산학협력단 filed Critical 충북대학교 산학협력단
Priority to KR1020190154456A priority Critical patent/KR102309024B1/ko
Publication of KR20210065565A publication Critical patent/KR20210065565A/ko
Application granted granted Critical
Publication of KR102309024B1 publication Critical patent/KR102309024B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/13File access structures, e.g. distributed indices
    • G06F16/137Hash-based
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/13File access structures, e.g. distributed indices
    • G06F16/134Distributed indices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/1865Transactional file systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/08Key distribution or management, e.g. generation, sharing or updating, of cryptographic keys or passwords
    • H04L9/0816Key establishment, i.e. cryptographic processes or cryptographic protocols whereby a shared secret becomes available to two or more parties, for subsequent use
    • H04L9/0819Key transport or distribution, i.e. key establishment techniques where one party creates or otherwise obtains a secret value, and securely transfers it to the other(s)
    • H04L9/0825Key transport or distribution, i.e. key establishment techniques where one party creates or otherwise obtains a secret value, and securely transfers it to the other(s) using asymmetric-key encryption or public key infrastructure [PKI], e.g. key signature or public key certificates
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/32Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols including means for verifying the identity or authority of a user of the system or for message authentication, e.g. authorization, entity authentication, data integrity or data verification, non-repudiation, key authentication or verification of credentials
    • H04L9/3236Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols including means for verifying the identity or authority of a user of the system or for message authentication, e.g. authorization, entity authentication, data integrity or data verification, non-repudiation, key authentication or verification of credentials using cryptographic hash functions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/50Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols using hash chains, e.g. blockchains or hash trees
    • H04L2209/38

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Databases & Information Systems (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

블록체인 기반의 데이터 프라이버시를 제공하는 분산 지식 발견 시스템이 개시되어 있다. 본 발명은, 분산 데이터 지식 발견 컨트랙트를 등록하고 초기 파라미터를 셋팅하는 컨트랙트 관리자이며, 어플리케이션 로직을 구비하는 컨트랙트 관리자; 자체 데이터를 가지고 있는 ML 모델 개발자를 의미하며, 블록체인에 그룹에 가입하고 모델을 등록할 수 있는 어플리케이션 로직을 구비하는 ML 모델 빌더; 상기 ML 모델 빌더가 소유한 자체 데이터로서, 프라이버시를 위해 공개하지 않는 ML 모델 데이터 셋; 상기 ML 모델 빌더가 상기 ML 모델 데이터 셋을 가지고 개발한 ML 모델; 및 한번 등록하면 변조할 수 없고 기록이 영구적으로 지속되는 분산 원장 기술이며, ML 빌더를 등록하고, 인센티브 시스템 등을 관리하는 소프트웨어 로직인 컨트랙트를 구비하는 블록체인;을 포함하는 것을 특징으로 한다.

Description

블록체인 기반의 데이터 프라이버시를 제공하는 분산 지식 발견 시스템 및 방법{Data Privacy-Preserving Distributed Knowledge Discovery system based on the Blockchain and Method thereof}
본 발명은 훈련 데이터를 공개하지 않고 자신의 모델을 개발하여 블록체인을 통해 공유하고 모델 향상을 추구하기 위한 블록체인 기반의 분산 지식의 발견 시스템 및 방법에 관한 것으로서, 더욱 상세하게는 서로 신뢰하지 않는 복수의 당사자가 자신의 자체 데이터를 가지고 각자의 기계 모델을 개발한 후 블록체인을 통하여 서로의 학습 모델을 공유하여 모델 개선에 활용할 수 있도록 하는 블록체인 기반의 데이터 프라이버시를 제공하는 분산 지식 발견 시스템 및 방법에 관한 것이다.
종래의 기술로 ML 모델을 개발하고자 한다면, 양질의 모델을 개발하기 위해 대량의 데이터가 필요한데 관심 분야의 데이터는 잠재적인 가치를 지니므로 매우 중요한 자산이고 공개를 꺼리게 되어 공유가 어려운 문제가 있다. 동일한 수준의 모델 개발자는 자신의 ML 모델의 향상을 위한 공유 방법이 필요하지만 서로 신뢰하지 않는 제 3자들과 공유한다는 것은 어려운 일이다.
그럼에도 불구하고 분산환경에서 지식의 발견을 위해 서로 자신의 모델과 데이터를 공유한다면, 먼저 공유하고 나중에 공유하지 않는 빌더가 발생할 수 있고, 모델을 등록하지 않는 ML 빌더가 발생할 경우, 먼저 모델을 공유한 빌더가 손해를 보게 되며, 모두 공유했다 하더라고 성능이 떨어지는 모델을 공유하게 됐을 경우 정직한 빌더가 손해를 보게 된다.
이러한 문제점을 해결하면서, 서로 신뢰하지 않는 제 3자간, 분산환경에서 공유된 모델을 통해 지식을 발견하는 방법을 블록체인을 이용해 제안하고자 하는 것이다.
1. 대한민국 공개특허공보 제10-2019-0086301호(2019.07.22) 2. 대한민국 공개특허공보 제10-2019-0041784호(2019.04.23)
본 발명의 목적은 블록체인을 이용하여 서로 신뢰하지 않는 제 3자간, 분산환경에서 공유된 모델을 통해 지식을 발견할 수 있도록 한 블록체인 기반의 데이터 프라이버시를 제공하는 분산 지식 발견 시스템 및 방법을 제공하는 데 있다.
본 발명의 다른 목적은 데이터 소유자 간의 신뢰를 바탕으로 하지 않는 다양한 문제를 해결하기 위하여 블록체인 기반의 인센티브 그룹 평가 방법 또는 벌금 부과를 포함하는 보증금 예치 방법 등을 이용할 수 있도록 한 블록체인 기반의 데이터 프라이버시를 제공하는 분산 지식 발견 시스템 및 방법을 제공하는 데 있다.
상기 목적을 달성하기 위하여, 본 발명의 일 실시예에 따른 블록체인 기반의 데이터 프라이버시를 제공하는 분산 지식 발견 시스템은,
분산 데이터 지식 발견 컨트랙트를 등록하고 초기 파라미터를 셋팅하는 컨트랙트 관리자이며, 어플리케이션 로직을 구비하는 컨트랙트 관리자; 자체 데이터를 가지고 있는 ML 모델 개발자를 의미하며, 블록체인에 그룹에 가입하고 모델을 등록할 수 있는 어플리케이션 로직을 구비하는 ML 모델 빌더; 상기 ML 모델 빌더가 소유한 자체 데이터로서, 프라이버시를 위해 공개하지 않는 ML 모델 데이터 셋; 상기 ML 모델 빌더가 상기 ML 모델 데이터 셋을 가지고 개발한 ML 모델; 및 한번 등록하면 변조할 수 없고 기록이 영구적으로 지속되는 분산 원장 기술이며, ML 빌더가 ML 모델을 등록하고, 인센티브 시스템 등을 관리하는 소프트웨어 로직인 컨트랙트를 구비하는 블록체인;을 포함하는 것을 특징으로 한다.
본 발명의 다른 실시예에 따른 블록체인 기반의 데이터 프라이버시를 제공하는 분산 지식 발견 방법은,
(a) 분산지식발견을 수행하기 위한 초기화 작업에 해당하는 분산지식발견 컨트랙트 초기화 단계; (b) ML 빌더를 모집하여 그룹을 형성하는 ML 빌더 그룹 형성 단계; (c) 등록한 ML 빌더가 자체 데이터를 이용하여 개발한 ML 모델을 암호화하여 블록체인에 등록하는 ML 모델 등록 단계; (d) 같은 그룹에 속한 다른 ML 빌더가 등록한 ML 모델을 블록체인으로 부터 다운로드하여 복호화하고 ML 모델을 복구하는 ML 모델 복구 단계; (e) ML 모델 빌더가 등록한 모델이 모두 동일한 모델인지 해시를 통해 유효성을 검사하는 ML 모델 유효성 검사 단계; (f) 다른 ML 빌더가 생성한 ML 모델을 복구하여 성능을 테스트하고 결과를 보고하는 ML 모델 성능 보고 단계; 및 (g) ML 성능 보고가 모두 완료되고 해당 절차에 따라 보증금 정산이 완료되는 ML 모델 태스크 완료 단계;를 포함하는 것을 특징으로 한다.
상기 (a) 분산지식발견 초기화 단계는, 블록체인에 컨트랙트를 등록할 때 초기화하는 파라미터로 모델 공유 후 앙상블 접근법으로 훈련할 경우 '빌더의 보증금 액수', '부실모델벌금 액수', '부실데이터벌금 액수', '최소 빌더 수', '최대 빌더 수', '빌더 모집 기간', '최소 성능 점수'를 구비하는 단계; 및 재훈련 접근법으로 훈련할 경우 계층과 노드 수, 커널 크기 등을 포함하는 'ML 모델의 유형과 아키텍처'를 추가 파라미터로 구비하는 단계;를 포함하는 것을 특징으로 한다.
상기 (b) ML 빌더 그룹 형성 단계는, '빌더 모집 기간'중에 참여를 원하는 빌더는 '빌더의 보증금액수'를 블록체인에 암호화폐로 예치금으로 송금하고 신청을 받는 예치금 설정 단계; 예치금을 설정한 빌더의 수가 '빌더 모집 기간'중에 '최소 빌더 수' 미만이면, ML 빌더 그룹 형성이 취소되고 받은 예치금은 모두 신청자에게 반환하는 ML 빌더 그룹 형성 취소 단계; 및 신청한 빌더 수가 '최소 빌더 수' 이상이면 ML 빌더 그룹이 성공적으로 형성되고, '빌더 모집 기간'이 만료되지 않았더라도 그룹의 제한 인원인 '최대 빌더 수' 빌더가 신청을 완료했으면, ML 빌더 그룹 형성이 성공되어 완료되는 단계;를 포함하는 것을 특징으로 한다.
상기 (c) ML 모델 등록 단계는, 모델 형성이 성공되면 'ML 모델의 유형과 아키텍터'를 확인하고 모델 훈련을 시작하며, 훈련 모델이 '최소 성능 점수' 이상에 도달하면 훈련을 완료하는 모델 훈련 완료 단계; 및 모델 훈련이 완료되면 블록체인에 등록하는데 이때 암호화키로 암호화한 훈련 모델과 수신 빌더의 공개키로 암호화한 복호화 키, 훈련 모델의 해시 값을 포함하는 메시지의 조합을 등록하는 단계;를 포함하는 것을 특징으로 한다.
상기 (d) ML 모델 복구 단계는, 블록체인에 등록된 암호화된 메시지를 다운로드하여 ML 모델을 복구화 함에 있어서, 수신 빌더의 비밀키로 복호화한 복호화 키로 훈련 모델을 복호화하여 복구하는 단계를 포함하는 것을 특징으로 한다.
상기 (e) ML 모델 유효성 검사 단계는, 복구된 모델의 해시 값을 생성하고 생성된 해시값과 블록체인에 등록된 메시지에 들어있는 해시 값(
Figure 112019122387861-pat00001
을 비교하여 동일 성을 확인하는 단계; 동일성이 확인되면 동일함을 그룹의 모든 빌더들에게 보고하고, 동일성이 확인되지 않으면 비동일함을 보고하는 단계; 그룹에서 비동일함을 보고한 빌더들이 한명이라도 있으면 모델의 개발자에게 재 등록을 요구하는 단계; 재 등록 하지 않거나, 재 등록된 모델을 재검사하여 동일성이 확인되지 않을 경우, 비동일 함을 최종 보고하는 단계; 및 최종 비동일함이 보고되는 빌더는 그룹에서 제외하고, 제외된 빌더의 보증금은 기부금으로 전환되는 단계;를 포함하는 것을 특징으로 한다.
상기 (f) ML 모델 성능 보고 단계는 모델 유효성 검사가 끝난 모델에 대해서 모델의 성능검사를 시행하고, '최소성능점수'에 도달하지 못하는 성능을 신고한 모델에 대해서는 모델 개발자에게는 '부실모델벌금'을 부여하고, 성능을 검사한 빌더에게는 '부실데이터벌금'을 부여하는 단계; 제대로 된 성능이 나오지 않은 것에는 성능 데이터가 부실할 가능성도 있고, 제대로 된 성능이 나왔음에도 거짓을 고하는 경우가 있으므로 성능 검사자에게도 벌금을 부과하되, '부실데이터벌금'의 액수가 '부실모델벌금'의 금액보다 적게 설정하는 단계; 및 상기 '부실데이터벌금'은 기부금에 포함시키는 단계;를 포함하는 것을 특징으로 한다.
상기 (g) ML 태스크 완료 단계는, 모든 작업이 완료되면, 첫째로 보증금을 제출한 빌더들의 금액을 정산하는 단계; 각자에게 부여된 벌금을 제외한 금액을 반환하며 벌금으로 모인 금액은 기부금에 포함시키는 단계; 및 성능 검사에 통과된 양질의 모델들은 모델 공유를 통해 앙상블 혹은 재훈련 방법을 통해 학습모델 향상 절차에 들어가는 단계;를 포함하는 것을 특징으로 한다.
본 발명에 따르면, 신뢰하지 않는 제 3자간의 모델 공유를 통해 자신의 ML 모델 성능을 향상시킬 수 있다. 즉 더 좋은 성능의 모델을 개발하기 위해 더 많은 데이터가 필요하지만, 이러한 모델 공유방법을 통해 한정된 자신의 데이터로 더 뛰어난 기계학습 모델을 개발할 수 있게 된다. 다른 공유자의 모델만 취하려는 정직하지 않은 모델 공유자에게는 합당한 벌금을 부과하여 사회에 환원할 수 있게 되므로, 정직한 모델 공유자는 신뢰하지 않는 제 3자와의 모델 공유에 대해 고려하지 않아도 되는 장점이 있다.
또한 성능이 떨어지는 모델 공유자는 참여하는 다른 빌더들과 합동하여 검증하게 되므로 이러한 검증 방법을 통해 검증된 양질의 ML 모델과의 협업은 모델의 성능 및 가치를 향상시키게 되고 이는 향후 기계학습 발전에 기여할 것이다.
도 1은 본 발명에 따른 블록체인 기반의 데이터 프라이버시를 제공하는 분산 지식 발견 시스템의 전체 구성을 보여주는 블록 다이어그램이다.
도 2는 본 발명에 따른 블록체인 기반의 데이터 프라이버시를 제공하는 분산 지식 발견 방법을 개략적으로 도시한 도면이다.
이하, 첨부된 도면을 참조하여 본 발명에 따른 블록체인 기반의 데이터 프라이버시를 제공하는 분산 지식 발견 시스템 및 방법에 대하여 상세히 설명한다.
본 발명은 데이터를 공개하지 않고 분산된 지식의 발견을 하기 위해 블록체인을 통해 관리하는 방법에 관한 것으로서, 복수의 당사자가 자신의 자체 데이터를 가지고 각자의 기계 모델을 개발한 후 블록체인을 통하여 서로의 학습 모델을 공유하여 모델 개선에 활용하는 방법에 관한 것이다.
이때 데이터 소유자 간의 신뢰를 바탕으로 하지 않는 다양한 문제를 해결하기 위하여 블록체인 기반의 인센티브 그룹 평가 방법, 벌금 부과를 포함하는 보증금 예치 방법 등을 이용하는 방법을 포함하며, 부정과 부실을 방지하기 위한 벌금은 최종 기부금으로 전환하는 인센티브방식을 적용한다.
분산 환경에서 모델 개발이 가능한 빌더들은 서로의 신뢰도에 상관없이 자유롭게 그룹에 가입하여 모델 공유에 합류할 수 있어야 하며, 데이터의 프라이버시를 제공하면서 최소한의 당사자에게만 모델을 공유할 수 있어야 하며, 합류한 빌더들 중에 자신의 모델을 제때 공유하지 않고 다른 빌더들이 공유한 모델 만을 취하려 하는 정직하지 않은 빌더 들을 제한할 수 있어야 하며, 모델을 공유했다고 하더라도 성능이 떨어져 다른 모델에게 도움을 주지 못하는 모델을 공유하지 못하게 할 수 있어야 한다.
또한, 모든 행위들을 결과가 변조되지 않고 영원히 지속되는 블록체인의 컨트랙트를 이용하여 진행하고, 부정한 행위를 한 빌더와 성능이 떨어지는 모델의 공유로 정상적인 빌더에게 손해를 입힐 수 있는 빌더들을 제한하기 위하여, 보증금을 받고 벌금을 부과하고 정산된 금액을 돌려받는 블록체인 기반의 인센티브 메커니즘을 제안하며, 프라이버시를 제공하면서 필요에 의해 특정 대상에게만 특정 데이터를 공유할 수 있도록 암호화와 키분배 방식을 이용한 모델 공유 방법을 제시한다.
하기 영문 약자 중에서 ML은 기계학습을 의미하고, MLSP는 기계학습 모델 개발자를 의미하며, MLC는 기계학습 모델 고객을 의미한다.
도 1은 본 발명에 따른 블록체인 기반의 데이터 프라이버시를 제공하는 분산 지식 발견 시스템의 전체 구성을 보여주는 블록 다이어그램이다.
도 1을 참조하면, 본 발명에 따른 블록체인 기반의 데이터 프라이버시를 제공하는 분산 지식 발견 시스템은, 컨트랙트 관리자(1), ML 모델 빌더(2), ML 모델 데이터 셋(3), ML 모델(4) 및 블록체인(5)을 포함한다.
상기 컨트랙트 관리자(1)는 분산 데이터 지식 발견 컨트랙트를 등록하고 초기 파라미터를 셋팅하는 컨트랙트 관리자이며, 어플리케이션 로직을 포함한다.
상기 ML 모델 빌더(
Figure 112019122387861-pat00002
: 2)는 자체 데이터(
Figure 112019122387861-pat00003
)를 가지고 있는 ML 모델 개발자를 의미하며, 블록체인에 그룹에 가입하고 모델을 등록할 수 있는 어플리케이션 로직을 포함한다.
상기 ML 모델 데이터 셋(
Figure 112019122387861-pat00004
: 3)은 ML 모델 빌더(
Figure 112019122387861-pat00005
: 2)가 소유한 자체 데이터를 의미하며, 프라이버시를 위해 공개하지 않는다.
상기 ML 모델(
Figure 112019122387861-pat00006
: 4)은 ML 모델 빌더(
Figure 112019122387861-pat00007
가 상기 ML 모델 데이터 셋(
Figure 112019122387861-pat00008
을 가지고 개발한 ML 모델 (
Figure 112019122387861-pat00009
)을 의미한다.
상기 블록체인(Blockchain: 5)는 한번 등록하면 변조할 수 없고 기록이 영구적으로 지속되는 분산 원장 기술이며, ML 빌더가 ML 모델을 등록하고, 인센티브 시스템 등을 관리하는 소프트웨어 로직인 컨트랙트를 포함한다.
도 2는 본 발명에 따른 블록체인 기반의 데이터 프라이버시를 제공하는 분산 지식 발견 방법을 개략적으로 도식한 도면이다.
도 2를 참조하면, 본 발명에 따른 블록체인 기반의 데이터 프라이버시를 제공하는 분산 지식 발견 방법은, 분산지식발견을 수행하기 위한 초기화 작업에 해당하는 분산지식발견 컨트랙트 초기화 단계(a), ML 빌더를 모집하여 그룹을 형성하는 ML 빌더 그룹 형성 단계(b), 등록한 ML 빌더가 자체 데이터를 이용하여 개발한 ML 모델을 암호화하여 블록체인에 등록하는 ML 모델 등록 단계(c), 같은 그룹에 속한 다른 ML 빌더가 등록한 ML 모델을 블록체인으로 부터 다운로드하여 복호화하고 ML 모델을 복구하는 ML 모델 복구 단계(d), ML 모델 빌더가 등록한 모델이 모두 동일한 모델인지 해시를 통해 유효성을 검사하는 ML 모델 유효성 검사 단계(e), 다른 ML 빌더가 생성한 ML 모델을 복구하여 성능을 테스트하고 결과를 보고하는 ML 모델 성능 보고 단계(f) 및 ML 성능 보고가 모두 완료되고 해당 절차에 따라 보증금 정산이 완료되는 ML 모델 태스크 완료 단계(g)를 포함한다.
상기 분산지식발견 초기화 단계(a)는 분산지식발견 메커니즘을 시작하는 단계로 분산지식발견 컨트랙트를 컨트랙트 관리자가 블록체인에 등록하는 단계이다. 재훈련 접근법일 경우, 초기화 파라미터는 'ML 모델의 유형과 아키텍처', '빌더의 보증금 액수', '부실모델벌금 액수', '부실데이터벌금 액수', '최소 빌더 수', '최대 빌즉, 상기 분산지식발견 초기화 단계(a)는, 블록체인에 컨트랙트를 등록할 때 초기화하는 파라미터로 모델 공유 후 앙상블 접근법으로 훈련할 경우 '빌더의 보증금 액수', '부실모델벌금 액수', '부실데이터벌금 액수', '최소 빌더 수', '최대 빌더 수', '빌더 모집 기간', '최소 성능 점수'를 구비하는 단계; 및 재훈련 접근법으로 훈련할 경우 계층과 노드 수, 커널 크기 등을 포함하는 'ML 모델의 유형과 아키텍처'를 추가 파라미터로 구비하는 단계를 포함한다.
상기 ML 빌더 그룹 형성 단계(b)는 분산된 빌더가 자유롭게 그룹에 참여할 수 있는 단계이다. 그룹에 참여하는 빌더는 '빌더의 보증금 액수'에 맞는 금액을 예치하여야 하며, '빌더 모집 기간'중에 '최소 빌더 수'를 만족하는 빌더가 참여하면 그룹이 형성되고 '빌더 모집 기간'이 마감되지 않았더라도 '최대 빌더 수'가 그룹에 참여하면, ML 빌더 그룹은 형성되고 모집 종료한다. '빌더 모집기간'내에 '최소 빌더 수'를 만족하지 못하여 ML 빌더 그룹 형성에 실패하면, 모집된 보증금은 그대로 반환한다.
즉, 상기 ML 빌더 그룹 형성 단계(b)는, '빌더 모집 기간'중에 참여를 원하는 빌더는 '빌더의 보증금액수'를 블록체인에 암호화폐로 예치금으로 송금하고 신청을 받는 예치금 설정 단계; 예치금을 설정한 빌더의 수가 '빌더 모집 기간'중에 '최소 빌더 수' 미만이면, ML 빌더 그룹 형성이 취소되고 받은 예치금은 모두 신청자에게 반환하는 ML 빌더 그룹 형성 취소 단계; 및 신청한 빌더 수가 '최소 빌더 수' 이상이면 ML 빌더 그룹이 성공적으로 형성되고, '빌더 모집 기간'이 만료되지 않았더라도 그룹의 제한 인원이 '최대 빌더 수' 빌더가 신청을 완료했으면, ML 빌더 그룹 형성이 성공되어 완료되는 단계를 포함한다.
상기 ML 모델 등록 단계(c)는 모델 형성이 성공하면, 'ML모델의 유형과 아키텍처'를 확인하고 모델 훈련을 시작한다. 훈련시킨 모델의 성능이 '최소 성능 점수' 이상에 도달하면, 훈련을 완료하고 모든 빌더 들에게 전송하기 위해 블록체인에 등록한다. 등록 시에는 비밀키로 암호화한 훈련 모델과 수신 빌더의 공개키로 암호화한 복호화 키, 훈련 모델의 해시값을 포함하는 메시지의 조합(
Figure 112019122387861-pat00010
으로 등록한다.
Figure 112019122387861-pat00011
즉, 상기 ML 모델 등록 단계(c)는, 모델 형성이 성공되면 'ML 모델의 유형과 아키텍터'를 확인하고 모델 훈련을 시작하며, 훈련 모델이 '최소 성능 점수' 이상에 도달하면 훈련을 완료하는 모델 훈련 완료 단계; 및 모델 훈련이 완료되면 블록체인에 등록하는데 이때 암호화키로 암호화한 훈련 모델과 수신 빌더의 공개키로 암호화한 복호화 키, 훈련 모델의 해시 값을 포함하는 메시지의 조합을 등록하는 단계를 포함한다.
상기 ML 모델 복구 단계(d)는 블록체인에 등록된 암호화된 메시지(
Figure 112019122387861-pat00012
를 다운로드 하여 ML 모델을 다운로드하여 복호화 한다. 복화화 절차는 먼저 비밀키로 복호화키(s)를 복구한다.
Figure 112019122387861-pat00013
즉, 상기 ML 모델 복구 단계(d)는 블록체인에 등록된 암호화된 메시지를 다운로드하여 ML 모델을 복구화 함에 있어서, 수신 빌더의 비밀키로 복호화한 복호화 키로 훈련 모델을 복호화하여 복구하는 단계를 포함한다.
상기 ML 모델 유효성 검사 단계(e)는 복구된 복호화키로 모델(
Figure 112019122387861-pat00014
를 복호화하여 해시 값을 생성하고, 생성된 해시 값과 메시지(
Figure 112019122387861-pat00015
로부터 복호화된 해시 값(
Figure 112019122387861-pat00016
을 비교하여 동일성을 확인하고 동일함을 보고함. 모든 빌더가 해시값의 동일함을 확인하고 동일하지 않음이 보고된 빌더는 그룹에서 제외하고, 제외된 빌더의 보증금은 기부금에 포함한다.
즉, 상기 ML 모델 유효성 검사 단계(e)는, 복구된 모델의 해시 값을 생성하고 생성된 해시값과 블록체인에 등록된 메시지에 들어있는 해시 값(
Figure 112019122387861-pat00017
과 메시지(
Figure 112019122387861-pat00018
를 비교하여 동일 성을 확인하는 단계; 동일성이 확인되면 동일함을 그룹의 모든 빌더들에게 보고하고, 동일성이 확인되지 않으면 비동일함을 보고하는 단계; 그룹에서 비동일함을 보고한 빌더들이 한명이라도 있으면 모델의 개발자에게 재 등록을 요구하는 단계; 재 등록 하지 않거나, 재 등록된 모델을 재검사하여 동일성이 확인되지 않을 경우, 비동일 함을 최종 보고하는 단계; 및 최종 비동일함이 보고되는 빌더는 그룹에서 제외하고, 제외된 빌더의 보증금은 기부금으로 전환되는 단계를 포함한다.
상기 ML 모델 성능 보고 단계(f)는 모델 유효성 검사가 끝난 모델에 대해서 모델의 성능검사를 시행하고, '최소성능점수'에 도달하지 못하는 성능을 신고한 모델에 대해서는 모델 개발자에게는 '부실모델벌금'을 부여하고, 성능을 검사한 빌더에게는 '부실데이터벌금'을 부여한다. 제대로 된 성능이 나오지 않은 것에는 성능 데이터가 부실할 가능성도 있고, 제대로 된 성능이 나왔음에도 거짓을 고하는 경우가 있으므로 성능 검사자 에게도 벌금을 부과하되, '부실데이터벌금'의 액수가 '부실모델벌금'의 금액보다 적게 설정하고, '부실데이터벌금'은 기부금에 포함한다.
상기 ML 태스크 완료 단계(g)는 모든 작업이 완료되면, 첫째로 보증금을 제출한 빌더들의 금액을 정산한다. 각자에게 부여된 벌금을 제외한 금액을 반환하며 벌금으로 모인 금액은 기부금에 포함된다. 성능 검사에 통과된 양질의 모델들은 모델 공유를 통해 앙상블 혹은 재훈련 방법을 통해 학습모델 향상 절차에 들어간다.
이상 본 발명자에 의해서 이루어진 발명을 상기 실시 예에 따라 구체적으로 설명하였지만, 본 발명은 상기 실시 예에 한정되는 것은 아니고 그 요지를 이탈하지 않는 범위에서 여러 가지로 변경 가능한 것은 이 기술분야에서 통상의 지식을 가진 자에게 자명하다.
1: 컨트랙트 관리자
2: ML 모델 빌더
3: ML 모델 데이터 셋
4: ML 모델
5: 블록체인

Claims (9)

  1. 삭제
  2. 소프트웨어에 의한 정보처리가 하드웨어를 이용하여 구현 가능하도록 된 시스템에 의해 수행되는 블록체인 기반의 데이터 프라이버시를 제공하는 분산 지식 발견 방법으로서,
    (a) 분산지식발견을 수행하기 위한 초기화 작업에 해당하는 분산지식발견 컨트랙트 초기화 단계;
    (b) 상기 시스템이 ML(Machine Learning) 빌더를 모집하여 그룹을 형성하는 ML 빌더 그룹 형성 단계;
    (c) 등록한 ML 빌더가 자체적으로 개발한 ML 모델을 암호화하여 블록체인에 등록하는 ML 모델 등록 단계;
    (d) 같은 그룹에 속한 다른 ML 빌더가 등록한 ML 모델을 블록체인으로 부터 다운로드하여 복호화하고 ML 모델을 복구하는 ML 모델 복구 단계;
    (e) ML 모델 빌더가 등록한 모델이 모두 동일한 모델인지 해시를 통해 유효성을 검사하는 ML 모델 유효성 검사 단계;
    (f) 상기 시스템이 상기 모델 유효성 검사가 끝난 모델에 대해서 모델의 성능검사를 시행하고, '최소성능점수'에 도달하지 못하는 성능을 신고한 모델에 대해서는 모델 개발자에게는 '부실모델벌금'을 부여하고, 성능을 검사한 빌더에게는 '부실데이터벌금'을 부여하는 ML 모델 성능 보고 단계; 및
    (g) ML 성능 보고가 모두 완료되고 해당 절차에 따라 보증금 정산이 완료되는 ML 모델 태스크 완료 단계;를 포함하는 것을 특징으로 하는 블록체인 기반의 데이터 프라이버시를 제공하는 분산 지식 발견 방법.
  3. 제 2항에 있어서,
    상기 (a) 분산지식발견 컨트랙트 초기화 단계는,
    블록체인에 컨트랙트를 등록할 때 초기화하는 파라미터로 모델 공유 후 앙상블 접근법으로 훈련할 경우 '빌더의 보증금 액수', '부실모델벌금 액수', '부실데이터벌금 액수', '최소 빌더 수', '최대 빌더 수', '빌더 모집 기간', '최소 성능 점수'를 구비하는 단계; 및 재훈련 접근법으로 훈련할 경우 계층과 노드 수, 커널 크기 중 적어도 어느 하나를 포함하는 'ML 모델의 유형과 아키텍처'를 추가 파라미터로 구비하는 단계;를 포함하는 것을 특징으로 하는 블록체인 기반의 데이터 프라이버시를 제공하는 분산 지식 발견 방법.
  4. 삭제
  5. 제 2항에 있어서,
    상기 (c) ML 모델 등록 단계는,
    모델 형성이 성공되면 'ML 모델의 유형과 아키텍터'를 확인하고 모델 훈련을 시작하며, 훈련 모델이 '최소 성능 점수' 이상에 도달하면 훈련을 완료하는 모델 훈련 완료 단계; 및
    모델 훈련이 완료되면 블록체인에 등록하는데 이때 암호화키로 암호화한 훈련 모델과 수신 빌더의 공개키로 암호화한 복호화 키, 훈련 모델의 해시 값을 포함하는 메시지의 조합을 등록하는 단계;를 포함하는 것을 특징으로 하는 블록체인 기반의 데이터 프라이버시를 제공하는 분산 지식 발견 방법.
  6. 제 2항에 있어서,
    상기 (d) ML 모델 복구 단계는,
    블록체인에 등록된 암호화된 메시지를 다운로드하여 ML 모델을 복구화 함에 있어서, 수신 빌더의 비밀키로 복호화한 복호화 키로 훈련 모델을 복호화하여 복구하는 단계를 포함하는 것을 특징으로 하는 블록체인 기반의 데이터 프라이버시를 제공하는 분산 지식 발견 방법.
  7. 제 2항에 있어서,
    상기 (e) ML 모델 유효성 검사 단계는,
    복구된 모델의 해시 값을 생성하고 생성된 해시값과 메시지(
    Figure 112021068087837-pat00019
    로부터 블록체인에 등록된 메시지에 들어있는 해시 값(
    Figure 112021068087837-pat00020
    을 비교하여 동일성을 확인하는 단계;
    동일성이 확인되면 동일함을 그룹의 모든 빌더들에게 보고하고, 동일성이 확인되지 않으면 비동일함을 보고하는 단계;
    그룹에서 비동일함을 보고한 빌더들이 한명이라도 있으면 모델의 개발자에게 재 등록을 요구하는 단계;
    재 등록 하지 않거나, 재 등록된 모델을 재검사하여 동일성이 확인되지 않을 경우, 비동일 함을 의미하는 메시지를 송신하는 단계; 및
    상기 비동일함을 의미하는 메시지가 송신된 빌더는 그룹에서 제외하고, 제외된 빌더의 보증금은 기부금으로 전환되는 단계;를 포함하는 것을 특징으로 하는 블록체인 기반의 데이터 프라이버시를 제공하는 분산 지식 발견 방법.
  8. 삭제
  9. 제 2항에 있어서,
    상기 (g) ML 모델 태스크 완료 단계는,
    모든 작업이 완료되면, 첫째로 보증금을 제출한 빌더들의 금액을 정산하는 단계;
    각자에게 부여된 벌금을 제외한 금액을 반환하며 벌금으로 모인 금액은 기부금에 포함시키는 단계; 및
    상기 성능검사에 통과된 양질의 모델들은 모델 공유를 통해 앙상블 혹은 재훈련 방법을 통해 학습모델 향상 절차에 들어가는 단계;를 포함하는 것을 특징으로 하는 블록체인 기반의 데이터 프라이버시를 제공하는 분산 지식 발견 방법.
KR1020190154456A 2019-11-27 2019-11-27 블록체인 기반의 데이터 프라이버시를 제공하는 분산 지식 발견 시스템 및 방법 KR102309024B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190154456A KR102309024B1 (ko) 2019-11-27 2019-11-27 블록체인 기반의 데이터 프라이버시를 제공하는 분산 지식 발견 시스템 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190154456A KR102309024B1 (ko) 2019-11-27 2019-11-27 블록체인 기반의 데이터 프라이버시를 제공하는 분산 지식 발견 시스템 및 방법

Publications (2)

Publication Number Publication Date
KR20210065565A KR20210065565A (ko) 2021-06-04
KR102309024B1 true KR102309024B1 (ko) 2021-10-07

Family

ID=76391845

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190154456A KR102309024B1 (ko) 2019-11-27 2019-11-27 블록체인 기반의 데이터 프라이버시를 제공하는 분산 지식 발견 시스템 및 방법

Country Status (1)

Country Link
KR (1) KR102309024B1 (ko)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019003402A (ja) 2017-06-15 2019-01-10 Kddi株式会社 管理装置、管理方法及びプログラム
KR101941200B1 (ko) 2018-06-26 2019-01-22 박윤곤 아이디어 거래가 가능한 블록체인 기반의 소셜 네트워크 시스템
CN109829326A (zh) 2018-11-20 2019-05-31 西安电子科技大学 基于区块链的跨域认证与公平审计去重云存储系统
US20190236485A1 (en) * 2018-01-26 2019-08-01 Cisco Technology, Inc. Orchestration system for distributed machine learning engines
CN110288346A (zh) 2019-06-28 2019-09-27 杭州复杂美科技有限公司 区块链分布式存储下载方法、设备和存储介质
JP6599065B1 (ja) 2018-12-26 2019-10-30 connectome.design株式会社 機械学習モデル共創システム、機械学習モデル共創方法、及びプログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020048319A (ko) * 2002-03-19 2002-06-22 문의선 분산컴퓨팅에 사용된 정보처리기에 대한 보상 방법 및 장치
KR20190041784A (ko) 2017-10-13 2019-04-23 주식회사 포스링크 멀티클라우드 환경에서 블록체인 기반의 분산동기화 접근 제어 시스템 및 그 방법
KR102181098B1 (ko) 2018-01-12 2020-11-20 인제대학교 산학협력단 블록 체인을 이용한 분산 데이터베이스 시스템 및 방법

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019003402A (ja) 2017-06-15 2019-01-10 Kddi株式会社 管理装置、管理方法及びプログラム
US20190236485A1 (en) * 2018-01-26 2019-08-01 Cisco Technology, Inc. Orchestration system for distributed machine learning engines
KR101941200B1 (ko) 2018-06-26 2019-01-22 박윤곤 아이디어 거래가 가능한 블록체인 기반의 소셜 네트워크 시스템
CN109829326A (zh) 2018-11-20 2019-05-31 西安电子科技大学 基于区块链的跨域认证与公平审计去重云存储系统
JP6599065B1 (ja) 2018-12-26 2019-10-30 connectome.design株式会社 機械学習モデル共創システム、機械学習モデル共創方法、及びプログラム
CN110288346A (zh) 2019-06-28 2019-09-27 杭州复杂美科技有限公司 区块链分布式存储下载方法、设备和存储介质

Also Published As

Publication number Publication date
KR20210065565A (ko) 2021-06-04

Similar Documents

Publication Publication Date Title
US11388010B2 (en) Blockchain account migration
US11689362B2 (en) Distributed ledger for generating and verifying random sequence
JP7181232B2 (ja) 一般的な計算のためのブロックチェーン
Macdonald et al. The blockchain: a comparison of platforms and their uses beyond bitcoin
US11360963B2 (en) Tracking and verification of physical assets
US20200051041A1 (en) System and method for arbitrating a blockchain transaction
US11556925B2 (en) Ensuring information fairness and input privacy using a blockchain in a competitive scenario governed by a smart contract
CN108846673B (zh) 一种区块数据的处理方法、装置、设备和存储介质
JP2020534733A (ja) 分散協調を用いるスマートコントラクトの実行
CN109478298A (zh) 区块链实现的方法和系统
CN114365116A (zh) 来自私有区块链的更新的链外通知
US20230004970A1 (en) Distributed Ledgers with Ledger Entries Containing Redactable Payloads
US20220329436A1 (en) Token-based identity validation via blockchain
CN112908442A (zh) 医疗数据共享方法、装置、设备及计算机可读介质
CN115943411A (zh) 用于保护数据的噪声交易
Pop et al. Blockchain based decentralized applications: Technology review and development guidelines
Dash et al. Artificial intelligence models for blockchain-based intelligent networks systems: Concepts, methodologies, tools, and applications
US11924348B2 (en) Honest behavior enforcement via blockchain
US20220276996A1 (en) Assessment node and token assessment container
CN110852887B (zh) 获取去中心化应用集群中的交易处理状态的方法及装置
KR102309024B1 (ko) 블록체인 기반의 데이터 프라이버시를 제공하는 분산 지식 발견 시스템 및 방법
US20230043223A1 (en) Methods for Securely Adding Data to a Blockchain Using Dynamic Time Quanta and Version Authentication
US20230070625A1 (en) Graph-based analysis and visualization of digital tokens
Yi et al. Digital rights management scheme based on redactable blockchain and perceptual hash
US11887146B2 (en) Product exploration-based promotion

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant