KR20190115323A - System for machine learning of encyrpted data using non-interactive communication - Google Patents

System for machine learning of encyrpted data using non-interactive communication Download PDF

Info

Publication number
KR20190115323A
KR20190115323A KR1020180038223A KR20180038223A KR20190115323A KR 20190115323 A KR20190115323 A KR 20190115323A KR 1020180038223 A KR1020180038223 A KR 1020180038223A KR 20180038223 A KR20180038223 A KR 20180038223A KR 20190115323 A KR20190115323 A KR 20190115323A
Authority
KR
South Korea
Prior art keywords
data
machine learning
user
classification result
encrypted
Prior art date
Application number
KR1020180038223A
Other languages
Korean (ko)
Other versions
KR102103731B1 (en
Inventor
박희진
평 김
이윤호
Original Assignee
서울과학기술대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 서울과학기술대학교 산학협력단 filed Critical 서울과학기술대학교 산학협력단
Priority to KR1020180038223A priority Critical patent/KR102103731B1/en
Publication of KR20190115323A publication Critical patent/KR20190115323A/en
Application granted granted Critical
Publication of KR102103731B1 publication Critical patent/KR102103731B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

The present invention relates to a system for machine learning of encrypted data using non-interactive communication. The system comprises: a user encrypting input data, receiving a classification result generated according to the encrypted input data from the outside, and decrypting the classification result to extract a classification value; and a server configured generating a machine learning model from a data provider, receiving the encrypted input data from the user, classifying the input data in the machine learning model, generating a classification result, and transmitting the generated classification result to the user. As a result, the accuracy of a result of processing the data encrypted in the server using machine learning may be improved. In addition, since the data exists in the encrypted data state in the server, the operating cost of the server may be reduced.

Description

비대화식 통신을 이용한 암호화 데이터의 기계학습 시스템{SYSTEM FOR MACHINE LEARNING OF ENCYRPTED DATA USING NON-INTERACTIVE COMMUNICATION}Machine learning system of encrypted data using non-interactive communication {SYSTEM FOR MACHINE LEARNING OF ENCYRPTED DATA USING NON-INTERACTIVE COMMUNICATION}

본 발명은 비대화식 통신을 이용한 암호화 데이터의 기계학습 시스템에 관한 것이다.The present invention relates to a machine learning system for encrypted data using non-interactive communication.

데이터들을 수집하고, 수집된 데이터를 기계학습(machine learning)하여 데이터로부터 분류결과를 산출하는 기술이 개시되고 있다.Disclosed is a technique for collecting data and machine learning the collected data to generate a classification result from the data.

그러나, 의료 데이터와 같이 프라이버시가 보존되어야 하는 데이터의 기계학습을 수행함에 있어서, 프라이버시 보존을 위해 암호화된 데이터를 기계학습하는 경우 원 데이터의 정확도를 떨어뜨리거나, 암호 알고리즘이 적용된 데이터에 대해서는 기계학습이 제한되고, 데이터의 소유자들간에 있어 많은 상호 작용이 발생하는 문제점이 있다.However, in performing machine learning of data whose privacy must be preserved, such as medical data, when machine learning encrypted data for privacy preservation, the accuracy of the original data is reduced or machine learning is performed on data to which encryption algorithm is applied. This is limited and there is a problem that many interactions occur between the owners of the data.

이에 따라, 시스템을 이용하는 사용자간 상호작용을 줄일 수 있고, 기계학습에 따라 도출되는 결과의 정확성을 향상할 수 있는 기계학습 시스템의 개발이 필요한 실정이다.Accordingly, it is necessary to develop a machine learning system that can reduce the interaction between users using the system and improve the accuracy of the results obtained by the machine learning.

대한민국 공개특허공보 제10-2014-7014500(의료 진단 절차들에 관한 정보를 수집하고 보고하고 관리하는 방법들 및 기법들)Republic of Korea Patent Publication No. 10-2014-7014500 (methods and techniques for collecting, reporting and managing information about medical diagnostic procedures)

본 발명이 이루고자 하는 기술적 과제는 암호 알고리즘이 적용된 데이터를 기계학습할 때의 정확성을 향상하고, 데이터 소유자간 상호작용을 줄인 기계학습 시스템을 제공하는 것이다.The technical problem to be achieved by the present invention is to provide a machine learning system that improves the accuracy when machine learning the data to which the encryption algorithm is applied, and reduces the interaction between data owners.

본 발명의 한 실시예에 따른 비대화식 통신을 이용한 암호화 데이터의 기계학습 시스템은 입력 데이터를 암호화하고, 암호화된 입력 데이터에 따라 생성된 분류결과를 외부로부터 전달받아 해독하여 분류 값을 추출하는 사용자; 그리고, 데이터 제공자로부터 기계학습 모델을 생성하고 있고, 상기 사용자로부터 암호화된 입력 데이터를 전달받아, 이를 기계학습 모델에서 분류하여 분류 결과를 생성하고, 생성된 상기 분류 결과를 상기 사용자에게 전달하는 서버;를 포함하는 것을 특징으로 한다.Machine learning system of encrypted data using non-interactive communication according to an embodiment of the present invention is a user for encrypting the input data, receiving the classification result generated according to the encrypted input data from the outside to decrypt and extract the classification value; A server configured to generate a machine learning model from a data provider, receive encrypted input data from the user, classify it in a machine learning model, generate a classification result, and transmit the generated classification result to the user; Characterized in that it comprises a.

상기 서버는 FHE(fully homomorphic encryption)의 자기동형을 이용하고, 의료 데이터를 상기 입력 데이터로서 생성하며, 상기 서버는 암호화된 상기 의료 데이터에 따라 진단결과를 분류 결과로서 생성하는 것을 특징으로 한다.The server uses self-type of fully homomorphic encryption (FHE), generates medical data as the input data, and the server generates a diagnosis result as a classification result according to the encrypted medical data.

상기 서버는 암호문 형태의 데이터를 이용하여 상기 암호화된 입력 데이터로부터 분류결과를 생성하는 것을 특징으로 한다.The server may generate a classification result from the encrypted input data using data in the form of cipher text.

본 발명의 다른 한 실시예에 따른 비대화식 통신을 이용한 암호화 데이터의 기계학습 시스템은 데이터 제공자로부터 기계학습 모델을 생성하고 있고, 입력 데이터에 따라, 이를 기계학습 모델에서 분류하여 분류 결과를 생성하고, 생성된 상기 분류 결과를 상기 외부로 전달하는 사용자; 그리고, 상기 사용자로부터 상기 분류 결과를 전달받아 순환시켜 상기 사용자에게 다시 전달하는 서버;를 포함하고, 상기 사용자는 상기 서버로부터 다시 전달받은 분류 결과로부터 최종 분류 결과를 추출하는 것을 특징으로 한다.Machine learning system of encrypted data using non-interactive communication according to another embodiment of the present invention is generating a machine learning model from the data provider, according to the input data, classify it in the machine learning model to generate a classification result, A user for delivering the generated classification result to the outside; And a server that receives the classification result from the user, circulates it, and delivers it back to the user, wherein the user extracts a final classification result from the classification result received from the server.

상기 사용자는 FHE(fully homomorphic encryption)의 자기동형을 이용하고, 의료 데이터를 상기 입력 데이터로서 생성하며, 상기 사용자는 암호화된 상기 의료 데이터에 따라 진단결과를 분류 결과로서 생성하는 것을 특징으로 한다.The user uses self-type of fully homomorphic encryption (FHE), generates medical data as the input data, and the user generates a diagnosis result as a classification result according to the encrypted medical data.

상기 사용자는 암호문 형태의 데이터를 이용하여 상기 입력 데이터로부터 분류결과를 생성하는 것을 특징으로 한다.The user may generate a classification result from the input data using data in the form of cipher text.

이러한 특징에 따르면, 본원 발명의 한 실시예에 따른 비대화식 통신을 이용한 암호화 데이터의 기계학습 시스템의 서버에서 암호화된 데이터를 기계학습을 이용하여 처리한 결과의 정확성이 향상되는 효과가 있다.According to this feature, the accuracy of the result of processing the encrypted data using the machine learning in the server of the machine learning system of the encrypted data using non-interactive communication according to an embodiment of the present invention is improved.

또한, 본원 발명의 한 실시예에 따른 비대화식 통신을 이용한 암호화 데이터의 기계학습 시스템에서, 서버 내에 데이터가 암호화된 데이터 상태로 존재하는 구조를 가지므로, 서버의 운영 비용이 절감되는 효과가 있다. In addition, in the machine learning system of encrypted data using non-interactive communication according to an embodiment of the present invention, since the data exists in the encrypted data state in the server, the operating cost of the server is reduced.

도 1은 본 발명의 한 실시예에 따른 비대화식 통신을 이용한 암호화 데이터의 기계학습 시스템의 개략적인 구조를 나타낸 도면이다.
도 2는 본 발명의 한 실시예에 따른 비대화식 통신을 이용한 암호화 데이터의 기계학습 시스템에서 이용하는 데이터 생성 구조를 나타낸 도면이다.
도 3은 본 발명의 한 실시예에 따른 비대화식 통신을 이용한 암호화 데이터의 기계학습 시스템에서 이용하는 데이터 암호화 구조를 나타낸 도면이다.
도 4는 발명의 한 실시예에 따른 비대화식 통신을 이용한 암호화 데이터의 기계학습 시스템에서 이용하는 데이터 구조를 나타낸 도면이다.
도 5는 발명의 한 실시예에 따른 비대화식 통신을 이용한 암호화 데이터의 기계학습 시스템에서 이용하는 데이터 구조를 나타낸 도면이다.
도 6은 발명의 한 실시예에 따른 비대화식 통신을 이용한 암호화 데이터의 기계학습 시스템의 선택부의 개략적인 구조를 나타낸 도면이다.
도 7은 발명의 한 실시예에 따른 비대화식 통신을 이용한 암호화 데이터의 기계학습 시스템의 선택부의 개략적인 구조를 나타낸 도면이다.
도 8은 발명의 한 실시예에 따른 비대화식 통신을 이용한 암호화 데이터의 기계학습 시스템의 선택부의 개략적인 구조를 나타낸 도면이다.
도 9는 발명의 한 실시예에 따른 비대화식 통신을 이용한 암호화 데이터의 기계학습 시스템의 선택부의 개략적인 구조를 나타낸 도면이다.
도 10은 발명의 한 실시예에 따른 비대화식 통신을 이용한 암호화 데이터의 기계학습 시스템의 선택부의 개략적인 구조를 나타낸 도면이다.
도 11은 발명의 한 실시예에 따른 비대화식 통신을 이용한 암호화 데이터의 기계학습 시스템의 분류부의 개략적인 구조를 나타낸 도면이다.
도 12는 발명의 한 실시예에 따른 비대화식 통신을 이용한 암호화 데이터의 기계학습 시스템의 분류부의 개략적인 구조를 나타낸 도면이다.
도 13은 발명의 한 실시예에 따른 비대화식 통신을 이용한 암호화 데이터의 기계학습 시스템의 분류부의 개략적인 구조를 나타낸 도면이다.
도 14는 본 발명의 한 실시예에 따른 비대화식 통신을 이용한 암호화 데이터의 기계학습 시스템의 전체적인 구조를 나타낸 도면이다.
도 15는 본 발명의 다른 한 실시예에 따른 비대화식 통신을 이용한 암호화 데이터의 기계학습 시스템의 개략적인 구조를 나타낸 도면이다.
1 is a view showing a schematic structure of a machine learning system of encrypted data using non-interactive communication according to an embodiment of the present invention.
2 is a diagram illustrating a data generation structure used in a machine learning system for encrypted data using non-interactive communication according to an embodiment of the present invention.
3 is a diagram illustrating a data encryption structure used in a machine learning system for encrypting data using non-interactive communication according to an embodiment of the present invention.
4 is a diagram illustrating a data structure used in a machine learning system of encrypted data using non-interactive communication according to an embodiment of the present invention.
5 is a diagram illustrating a data structure used in a machine learning system of encrypted data using non-interactive communication according to an embodiment of the present invention.
6 is a diagram illustrating a schematic structure of a selection unit of a machine learning system of encrypted data using non-interactive communication according to an embodiment of the present invention.
7 is a diagram illustrating a schematic structure of a selection unit of a machine learning system of encrypted data using non-interactive communication according to an embodiment of the present invention.
8 is a diagram illustrating a schematic structure of a selection unit of a machine learning system of encrypted data using non-interactive communication according to an embodiment of the present invention.
9 is a diagram illustrating a schematic structure of a selection unit of a machine learning system of encrypted data using non-interactive communication according to an embodiment of the present invention.
10 is a diagram illustrating a schematic structure of a selection unit of a machine learning system of encrypted data using non-interactive communication according to an embodiment of the present invention.
11 is a diagram illustrating a schematic structure of a classification unit of a machine learning system for encrypted data using non-interactive communication according to an embodiment of the present invention.
12 is a diagram illustrating a schematic structure of a classification unit of a machine learning system for encrypting data using non-interactive communication according to an embodiment of the present invention.
13 is a diagram illustrating a schematic structure of a classification unit of a machine learning system for encrypting data using non-interactive communication according to an embodiment of the present invention.
14 is a view showing the overall structure of a machine learning system of encrypted data using non-interactive communication according to an embodiment of the present invention.
15 is a view showing a schematic structure of a machine learning system of encrypted data using non-interactive communication according to another embodiment of the present invention.

아래에서는 첨부한 도면을 참고로 하여 본 발명의 실시예에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.DETAILED DESCRIPTION Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings so that those skilled in the art may easily implement the present invention. As those skilled in the art would realize, the described embodiments may be modified in various different ways, all without departing from the spirit or scope of the present invention. In the drawings, parts irrelevant to the description are omitted in order to clearly describe the present invention, and like reference numerals designate like parts throughout the specification.

도 1은 본 발명의 한 실시예에 따른 비대화식 통신을 이용한 암호화 데이터의 기계학습 시스템의 개략적인 구조를 나타낸 도면이고, 도 2는 본 발명의 한 실시예에 따른 비대화식 통신을 이용한 암호화 데이터의 기계학습 시스템에서 이용하는 데이터 생성 구조를 나타낸 도면이고, 도 3은 본 발명의 한 실시예에 따른 비대화식 통신을 이용한 암호화 데이터의 기계학습 시스템에서 이용하는 데이터 암호화 구조를 나타낸 도면이고, 도 4는 발명의 한 실시예에 따른 비대화식 통신을 이용한 암호화 데이터의 기계학습 시스템에서 이용하는 데이터 구조를 나타낸 도면이고, 도 5는 발명의 한 실시예에 따른 비대화식 통신을 이용한 암호화 데이터의 기계학습 시스템에서 이용하는 데이터 구조를 나타낸 도면이고, 도 6은 발명의 한 실시예에 따른 비대화식 통신을 이용한 암호화 데이터의 기계학습 시스템의 선택부의 개략적인 구조를 나타낸 도면이고, 도 7은 발명의 한 실시예에 따른 비대화식 통신을 이용한 암호화 데이터의 기계학습 시스템의 선택부의 개략적인 구조를 나타낸 도면이고, 도 8은 발명의 한 실시예에 따른 비대화식 통신을 이용한 암호화 데이터의 기계학습 시스템의 선택부의 개략적인 구조를 나타낸 도면이고, 도 9는 발명의 한 실시예에 따른 비대화식 통신을 이용한 암호화 데이터의 기계학습 시스템의 선택부의 개략적인 구조를 나타낸 도면이고, 도 10은 발명의 한 실시예에 따른 비대화식 통신을 이용한 암호화 데이터의 기계학습 시스템의 선택부의 개략적인 구조를 나타낸 도면이고, 도 11은 발명의 한 실시예에 따른 비대화식 통신을 이용한 암호화 데이터의 기계학습 시스템의 분류부의 개략적인 구조를 나타낸 도면이고, 도 12는 발명의 한 실시예에 따른 비대화식 통신을 이용한 암호화 데이터의 기계학습 시스템의 분류부의 개략적인 구조를 나타낸 도면이고, 도 13은 발명의 한 실시예에 따른 비대화식 통신을 이용한 암호화 데이터의 기계학습 시스템의 분류부의 개략적인 구조를 나타낸 도면이고, 도 14는 본 발명의 한 실시예에 따른 비대화식 통신을 이용한 암호화 데이터의 기계학습 시스템의 전체적인 구조를 나타낸 도면이다.1 is a view showing a schematic structure of a machine learning system of encrypted data using non-interactive communication according to an embodiment of the present invention, Figure 2 is a view of the encrypted data using non-interactive communication according to an embodiment of the present invention 3 is a diagram showing a data generation structure used in a machine learning system, FIG. 3 is a diagram showing a data encryption structure used in a machine learning system for encrypting data using non-interactive communication according to an embodiment of the present invention, and FIG. FIG. 5 is a diagram illustrating a data structure used in a machine learning system of encrypted data using non-interactive communication, and FIG. 5 is a diagram illustrating a data structure used in a machine learning system of encrypted data using non-interactive communication, according to an exemplary embodiment. 6 is a non-interactive barrel according to an embodiment of the present invention. FIG. 7 is a diagram illustrating a schematic structure of a selection unit of a machine learning system of encrypted data using a scene, and FIG. 7 is a diagram illustrating a schematic structure of a selection unit of a machine learning system of encrypted data using a non-interactive communication according to an embodiment of the present invention. 8 is a diagram illustrating a schematic structure of a selection unit of a machine learning system of encrypted data using non-interactive communication according to an embodiment of the present invention, and FIG. 9 is a diagram of encrypted data using non-interactive communication according to an embodiment of the present invention. FIG. 10 is a diagram illustrating a schematic structure of a selection unit of a machine learning system of FIG. 10, and FIG. 10 is a diagram illustrating a schematic structure of a selection unit of a machine learning system of encrypted data using non-interactive communication according to an embodiment of the present invention. Classification of machine learning system of encrypted data using non-interactive communication according to an embodiment of the present invention 12 is a diagram showing a schematic structure of FIG. 12 is a diagram showing a schematic structure of a classification unit of a machine learning system of encrypted data using non-interactive communication according to an embodiment of the present invention, and FIG. FIG. 14 is a diagram illustrating a schematic structure of a classification unit of a machine learning system for encrypted data using non-interactive communication, and FIG. 14 is a diagram illustrating an overall structure of a machine learning system for encrypted data using non-interactive communication according to an embodiment of the present invention. Drawing.

본 실시예에 따른 비대화식 통신을 이용한 암호화 데이터의 기계학습 시스템(S)은 서버 중심 개념으로서, 서버(100)와 사용자(200)를 포함하고, 서버(100)와 사용자(200)는 네트워크로 연결되도록 구성될 수 있다.The machine learning system (S) of encrypted data using non-interactive communication according to the present embodiment is a server-centric concept, and includes a server 100 and a user 200, and the server 100 and the user 200 are connected to a network. It may be configured to be connected.

한 예에서, 서버(100)와 사용자(200)는 인터넷을 통해 연결될 수 있고, 사용자(200)는 서버(100)에 접속되는 단말일 수 있다. In one example, the server 100 and the user 200 may be connected through the Internet, and the user 200 may be a terminal connected to the server 100.

서버(100)는 사용자의 공개키(pk, public key)를 이용하여 암호화된 정보를 저장하는 부분으로서, 제1 암호화부(110)와 선택부(120), 그리고 분류부(130)를 포함한다. 제1 암호화부(110)는 데이터 제공자(DP; Data Provider)로부터 수집한 정보를 기계학습하여 모델(w)을 생성하고 이를 암호화하여 선택부(120) 및 분류부(130)로 각각 전달한다.The server 100 stores information encrypted using a user's public key (pk, public key), and includes a first encryption unit 110, a selection unit 120, and a classification unit 130. . The first encryption unit 110 machine-learns the information collected from the data provider (DP) to generate a model (w), encrypts it, and transmits it to the selection unit 120 and the classification unit 130, respectively.

선택부(120)는 사용자(220)의 제2 암호화부(210)로부터 전달받은 사용자 데이터(U)를 테이블(T)로 생성하여 분류부(130)로 전달한다. 이때, 선택부(120)는 제1 암호화부(110)로부터 전달받은 암호화된 모델정보를 이용하여 테이블을 생성한다.The selector 120 generates the user data U received from the second encryption unit 210 of the user 220 as a table T and transmits the generated user data U to the classification unit 130. In this case, the selector 120 generates a table by using the encrypted model information received from the first encryption unit 110.

분류부(130)는 제1 암호화부(110)로부터 전달받은 암호화된 모델정보(S)와 선택부(120)로부터 전달받은 테이블(XT)을 이용하여 분류결과를 생성하고, 이를 사용자(200)의 해독부(220)로 전달한다.The classification unit 130 generates a classification result using the encrypted model information S transmitted from the first encryption unit 110 and the table XT received from the selection unit 120, and the user 200 generates the classification result. Delivered to the decryption unit 220.

사용자(200)는 제2 암호화부(210)와 해독부(220)를 포함하며, 제2 암호화부(210)는 사용자 입력정보를 암호화하여 서버(100)로 전달하고, 해독부(220)는 서버(100)로부터 전달받은 분류결과를 해독한다.The user 200 includes a second encryption unit 210 and a decryption unit 220. The second encryption unit 210 encrypts user input information and transmits the encrypted information to the server 100, and the decryption unit 220 The classification result received from the server 100 is decrypted.

사용자(200)의 해독부(220)는 사용자의 보안키(sk, private key)와 공개키(pk)를 이용하여 서버(100)로부터 전달받은 분류결과 값 R1로부터 분류결과

Figure pat00001
를 추출한다.The decryption unit 220 of the user 200 classifies the classification result from the classification result value R1 received from the server 100 using the user's security key (sk, private key) and public key (pk).
Figure pat00001
Extract

한 예에서, 서버(100)는 암호문(ciphertext) 형태의 데이터를 이용하여 사용자 정보로부터 분류결과를 생성할 수 있으며, 한 예에서, 도 2에 도시한 데이터 구조와 같이, q-bit의 정수에 대해 암호문 구조가 생성될 수 있다.In one example, the server 100 may generate a classification result from the user information using ciphertext data. In one example, as shown in FIG. 2, the server 100 may generate an integer of q-bit. A ciphertext structure can be created for this.

이때, FHE(Fully homomorphic encryption)의 자기동형(automorphism)을 사용함에 따라, q-bit의 정수를 로테이션 하여 암호문을 형성하더라도 노이즈가 발생되지 않고, 로테이션 알고리즘에서 최소한의 슬롯 이동을 위해 u 슬롯의 간격에 1 비트를 삽입하여 암호문을 생성한다. At this time, according to the automorphism of Fully homomorphic encryption (FHE), even if the ciphertext is formed by rotating the integer of q-bit, no noise is generated, and the interval of the u slot for the minimum slot movement in the rotation algorithm Create a ciphertext by inserting 1 bit into the.

그리고 이때, 암호문의 q-bit 데이터는 첫 번째 슬롯의 최하위비트(LSB; least significant bit) 순서에 저장되고, (q-1)?u+1번째 슬롯에서는 최상위비트(MSB; most significant bit) 순서에 저장된다. In this case, the q-bit data of the ciphertext is stored in the least significant bit (LSB) order of the first slot, and in the (q-1)? U + 1th slot, the most significant bit (MSB) order. Are stored in.

자세한 예로써, 분류부(130)의 모델 w는 분류부(130)에서 사용되는 모든 사용 가능한 사용자 입력(

Figure pat00002
)을 참조하고, 분류부(130)는 Cw로 정의되고,
Figure pat00003
로 정의된다. 분류부(130)의 분류결과는 Cw(x)이다.As a detailed example, the model w of the classifier 130 may include all available user inputs used in the classifier 130.
Figure pat00002
), The classification unit 130 is defined as Cw,
Figure pat00003
Is defined as The classification result of the classification unit 130 is Cw (x).

분류부(130)는 도 3 및 다음의 식으로부터 같이 테이블(T)과 모델정보(S)를 생성한다. The classification unit 130 generates the table T and the model information S as shown in FIG. 3 and the following equation.

[식 1][Equation 1]

Figure pat00004
Figure pat00004

분류부(130)에서 생성한 테이블의 암호화된 인자들은 인덱스를 이용하여 접근 가능하고, 인자들의 실제 값들은 해독 전까지는 얻을 수 없다.The encrypted factors of the table generated by the classifier 130 may be accessed by using an index, and actual values of the factors may not be obtained until decryption.

분류부(130)가 분류하는 입력 데이터인 사용자 데이터(U)는 도 4와 같은 형식을 갖는다. User data U, which is input data classified by the classification unit 130, has a format as shown in FIG.

분류부(130)의 분류결과

Figure pat00005
는 도 5와 같이 R1 또는 R2의 구조를 가질 수 있는데, R1 구조는 서버 중심의 분류에서 이용될 수 있고, R2 구조는 이후에서 도 15를 참고하여 설명할 사용자중심의 분류에서 이용될 수 있다.Classification result of the classification unit 130
Figure pat00005
5 may have a structure of R1 or R2, the R1 structure may be used in a server-centric classification, and the R2 structure may be used in a user-centric classification which will be described later with reference to FIG. 15.

분류부(130)는 무작위 숫자 r을 발생하고, 생성한 실제 분류 결과를 숨기기 위해 r?u 슬롯을 이용하여 로테이트 라이트(rotate-right) 연산을 수행하여 R2 구조를 생성한다. 이때, 무작위 숫자 r은

Figure pat00006
이다.The classification unit 130 generates a random number r, and generates a rotate-right operation by using a r? U slot to hide the generated real classification result. Where the random number r is
Figure pat00006
to be.

선택부(120)는 위에서 설명한 것처럼, 도 6과 같이 테이블(T)과 사용자 데이터(U), 그리고 테이블(T)로부터 생성한 매트릭스 테이블(XT)를 취득한다. 이때, 매트릭스 테이블(XT)의 각 구성요소

Figure pat00007
Figure pat00008
As described above, the selector 120 acquires the table T, the user data U, and the matrix table XT generated from the table T as shown in FIG. 6. At this time, each component of the matrix table XT
Figure pat00007
Is
Figure pat00008

Figure pat00009
Figure pat00010
를 암호화한 것에 대응된다. 선택부(120)는 도 7의 구조로부터 사용자 데이터(U)를 이용하여 각
Figure pat00011
로부터 실제 데이터를 취득한다. 이때, 테이블(T)은
Figure pat00012
이다.
Figure pat00009
Figure pat00010
Corresponds to the encryption. The selection unit 120 uses the user data U from the structure of FIG.
Figure pat00011
Get actual data from At this time, the table T is
Figure pat00012
to be.

선택부(120)는 마스크젠(maskgen) 처리를 수행하기 위해 어사인(assign) 처리부, 그리고 슬롯카피(slot copy) 처리부를 포함하는데, 마스크젠 처리부는 도 8에 도시한 것처럼

Figure pat00013
슬롯 사이에 0 또는 1을 삽입한다.The selector 120 includes an assign process and a slot copy process to perform a maskgen process, as shown in FIG. 8.
Figure pat00013
Insert 0 or 1 between the slots.

어사인 처리부는 도 9에 도시한 것처럼 각 슬롯의 값에 상응하는 bit 값을 추출하고, 상응하는 값은 쉬프트 동작을 이용하여 최하위 위치의 슬롯으로 옮기는 처리를 수행한다. The assigning processing unit extracts a bit value corresponding to the value of each slot as shown in FIG. 9, and performs a process of moving the corresponding value to the slot of the lowest position by using a shift operation.

슬롯카피 처리부는 도 10에 도시한 것처럼, 어사인 처리부에서 추출한 상응하는 비트를 다른 슬롯으로 복사하여, 최종적으로 마스크젠의 처리결과를 생성한다.As shown in FIG. 10, the slot copy processing unit copies the corresponding bits extracted by the assigning processing unit to another slot, and finally generates a maskzen processing result.

분류부(130)는 선택부(120)로부터 전달받은 테이블(XT[][])을 이용하여 실제 분류 결과를 취득하는 부분으로, 테이블(S)와 도 11의 선택부 회로로부터 실제 분류 결과를 얻는다.The classifier 130 obtains the actual classification result using the table XT [] [] received from the selector 120. The classification unit 130 obtains the actual classification result from the table S and the selection circuit of FIG. Get

분류부(130)는 멀티플추가부(MULTIPLE ADDER)와 ARGMAX 모듈을 포함한다.The classification unit 130 includes a multiple adder and an ARGMAX module.

도 11을 참고로 하면, 분류부(130)는 도 12에 도시된 멀티플추가부 회로와

Figure pat00014
Figure pat00015
를 이용하여 구동하여 하기의 식 2의 결과를 얻는다.Referring to FIG. 11, the classifying unit 130 may include the multiple adding unit circuit shown in FIG. 12.
Figure pat00014
And
Figure pat00015
Is driven to obtain the result of Equation 2 below.

[식2][Equation 2]

Figure pat00016
Figure pat00017
Figure pat00016
Figure pat00017

분류부(130)는 멀티플추가부 회로를 통해 모든 R[i]를 얻은 뒤, 도 13에 도시된 ARGMAX 모듈과 모든 R[i]를 이용하여 분류 결과 R1을 취득한다. 이때, 사용자는 R1을 해독하여 분류 결과를 취득할 수 있다.The classifying unit 130 obtains all R [i] through the multiple adding unit circuit, and then obtains the classification result R1 using the ARGMAX module and all R [i] shown in FIG. At this time, the user may decrypt R1 to obtain a classification result.

이처럼, 도 1 내지 도 13을 참고로 하여 설명한 구조를 갖는 본 발명의 한 실시예에 따른 비대화식 통신을 이용한 암호화 데이터의 기계학습 시스템(S)은 도 14에 도시한 것처럼 전체적인 구조를 가질 수 있고, 사용자 및 서버간 대화가 없더라도 상호간 송수신된 데이터를 이용한 기계학습 효율이 좋고, 종래의 대화식 통신을 이용한 기계학습 시스템보다 서버의 유지비용 및 데이터 송수신에 소요되는 시간이 절감되는 효과가 있다.As such, the machine learning system S of encrypted data using non-interactive communication according to an embodiment of the present invention having the structure described with reference to FIGS. 1 to 13 may have an overall structure as shown in FIG. Even if there is no dialogue between the user and the server, machine learning efficiency using the data transmitted and received between each other is good, and the maintenance cost of the server and the time required for data transmission and reception are reduced compared to the machine learning system using the conventional interactive communication.

그리고, 서버(100)와 사용자(200)간 송수신되는 데이터는 암호화된 데이터이므로 서버(100)에서 데이터 암호화를 위해 소요되는 비용을 절감할 수 있고, 데이터의 보안성이 증대된다.In addition, since data transmitted and received between the server 100 and the user 200 is encrypted data, the cost required for data encryption in the server 100 may be reduced, and the security of the data is increased.

이처럼, 기계학습 결과 또는 입력 데이터를 암호화하여 상호간 송수신하므로, 데이터의 보안성이 중요한 의료 서비스 시스템에서 환자의 정보를 토대로 진단서비스를 제공함에 효율적으로 적용할 수 있다.As such, since machine learning results or input data are encrypted and transmitted to each other, it can be efficiently applied to provide a diagnostic service based on patient information in a medical service system where data security is important.

도 15는 본 발명의 다른 한 실시예에 따른 비대화식 통신을 이용한 암호화 데이터의 기계학습 시스템의 개략적인 구조를 나타낸 도면이다. 15 is a view showing a schematic structure of a machine learning system of encrypted data using non-interactive communication according to another embodiment of the present invention.

도 15를 참고로 하는 본 발명의 다른 한 예에 따른 비대화식 통신을 이용한 암호화 데이터의 기계학습 시스템(S')은 사용자 중심 개념으로서, 서버(100')와 사용자(200')를 포함한다.The machine learning system S 'of encrypted data using non-interactive communication according to another embodiment of the present invention with reference to FIG. 15 is a user-centric concept, and includes a server 100' and a user 200 '.

사용자(200')는 사용자의 공개키(pk)를 이용하고, 제1에서 도시한 분류부(130)와 동일한 동작을 수행하는 제2 분류부(203)를 포함하고, 제2 분류부(203)로 테이블(T)을 생성하여 전달하는 테이블 생성부(201), 그리고 제2 분류부(203)에서 생성된 정보를 로테이션하는 로테이션부(202)를 포함하며, 서버(100')로부터 전달받은 R2 값을 로테이션하여 분류결과

Figure pat00018
를 얻는다.The user 200 ′ includes a second classification unit 203 using the user's public key pk and performing the same operation as the classification unit 130 shown in the first, and the second classification unit 203. Table generation unit 201 for generating and transmitting the table (T) and a rotation unit 202 for rotating the information generated by the second classification unit 203, received from the server 100 ' Classification result by rotating R2 value
Figure pat00018
Get

서버(100')의 제2 해독부(101)는 사용자(200)로부터 전달받은 R1 값을 로테이션하여 R2 값을 생성하고 이를 사용자(200')로 전달한다.The second decryption unit 101 of the server 100 'rotates the R1 value received from the user 200 to generate an R2 value and delivers it to the user 200'.

이상에서 본 발명의 실시예에 대하여 상세하게 설명하였지만 본 발명의 권리범위는 이에 한정되는 것은 아니고 다음의 청구범위에서 정의하고 있는 본 발명의 기본 개념을 이용한 당업자의 여러 변형 및 개량 형태 또한 본 발명의 권리범위에 속하는 것이다.Although the embodiments of the present invention have been described in detail above, the scope of the present invention is not limited thereto, and various modifications and improvements of those skilled in the art using the basic concepts of the present invention defined in the following claims are also provided. It belongs to the scope of rights.

S : 비대화식 통신을 이용한 암호화 데이터의 기계학습 시스템
100 : 서버 110 : 제1 암호화부
120 : 선택부 130 : 분류부
200 : 사용자 210 : 해독부
S: Machine learning system of encrypted data using non-interactive communication
100: server 110: first encryption unit
120: selection unit 130: classification unit
200: user 210: decryption unit

Claims (6)

입력 데이터를 암호화하고, 암호화된 입력 데이터에 따라 생성된 분류결과를 외부로부터 전달받아 해독하여 분류 값을 추출하는 사용자; 그리고,
데이터 제공자로부터 기계학습 모델을 생성하고 있고, 상기 사용자로부터 암호화된 입력 데이터를 전달받아, 이를 기계학습 모델에서 분류하여 분류 결과를 생성하고, 생성된 상기 분류 결과를 상기 사용자에게 전달하는 서버;
를 포함하는 것을 특징으로 하는 비대화식 통신을 이용한 암호화 데이터의 기계학습 시스템.
A user encrypting the input data, receiving a classification result generated according to the encrypted input data from the outside, and decrypting the extracted data to extract the classification value; And,
A server configured to generate a machine learning model from a data provider, receive encrypted input data from the user, classify it in the machine learning model, generate a classification result, and deliver the generated classification result to the user;
Machine learning system of encrypted data using non-interactive communication, comprising a.
제1항에 있어서,
상기 서버는 FHE(fully homomorphic encryption)의 자기동형을 이용하고, 의료 데이터를 상기 입력 데이터로서 생성하며, 상기 서버는 암호화된 상기 의료 데이터에 따라 진단결과를 분류 결과로서 생성하는 것을 특징으로 하는 비대화식 통신을 이용한 암호화 데이터의 기계학습 시스템.
The method of claim 1,
The server uses self-type of fully homomorphic encryption (FHE), generates medical data as the input data, and the server generates a diagnosis result as a classification result according to the encrypted medical data. Machine learning system of encrypted data using communication.
제1항에 있어서,
상기 서버는 암호문 형태의 데이터를 이용하여 상기 암호화된 입력 데이터로부터 분류결과를 생성하는 것을 특징으로 하는 비대화식 통신을 이용한 암호화 데이터의 기계학습 시스템.
The method of claim 1,
And the server generates a classification result from the encrypted input data using cipher text data.
데이터 제공자로부터 기계학습 모델을 생성하고 있고, 입력 데이터에 따라, 이를 기계학습 모델에서 분류하여 분류 결과를 생성하고, 생성된 상기 분류 결과를 상기 외부로 전달하는 사용자; 그리고,
상기 사용자로부터 상기 분류 결과를 전달받아 순환시켜 상기 사용자에게 다시 전달하는 서버;
를 포함하고, 상기 사용자는 상기 서버로부터 다시 전달받은 분류 결과로부터 최종 분류 결과를 추출하는 것을 특징으로 하는 비대화식 통신을 이용한 암호화 데이터의 기계학습 시스템.
A user who generates a machine learning model from a data provider, generates a classification result by classifying it in the machine learning model according to the input data, and delivers the generated classification result to the outside; And,
A server which receives the classification result from the user and circulates it and delivers it back to the user;
And wherein the user extracts a final classification result from the classification result received from the server again.
제4항에 있어서,
상기 사용자는 FHE(fully homomorphic encryption)의 자기동형을 이용하고, 의료 데이터를 상기 입력 데이터로서 생성하며, 상기 사용자는 암호화된 상기 의료 데이터에 따라 진단결과를 분류 결과로서 생성하는 것을 특징으로 하는 비대화식 통신을 이용한 암호화 데이터의 기계학습 시스템.
The method of claim 4, wherein
The user uses a self-morphotype of fully homomorphic encryption (FHE), generates medical data as the input data, and the user generates a diagnosis result as a classification result according to the encrypted medical data. Machine learning system of encrypted data using communication.
제4항에 있어서,
상기 사용자는 암호문 형태의 데이터를 이용하여 상기 입력 데이터로부터 분류결과를 생성하는 것을 특징으로 하는 비대화식 통신을 이용한 암호화 데이터의 기계학습 시스템.

The method of claim 4, wherein
And the user generates a classification result from the input data using the cipher text data.

KR1020180038223A 2018-04-02 2018-04-02 System for machine learning of encyrpted data using non-interactive communication KR102103731B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180038223A KR102103731B1 (en) 2018-04-02 2018-04-02 System for machine learning of encyrpted data using non-interactive communication

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180038223A KR102103731B1 (en) 2018-04-02 2018-04-02 System for machine learning of encyrpted data using non-interactive communication

Publications (2)

Publication Number Publication Date
KR20190115323A true KR20190115323A (en) 2019-10-11
KR102103731B1 KR102103731B1 (en) 2020-05-29

Family

ID=68210309

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180038223A KR102103731B1 (en) 2018-04-02 2018-04-02 System for machine learning of encyrpted data using non-interactive communication

Country Status (1)

Country Link
KR (1) KR102103731B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210130048A (en) 2020-04-21 2021-10-29 삼성에스디에스 주식회사 Method and apparatus for training analysis model

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160350648A1 (en) * 2014-11-07 2016-12-01 Microsoft Technology Licensing, Llc. Neural networks for encrypted data
US20170134156A1 (en) * 2015-11-05 2017-05-11 Microsoft Technology Licensing, Llc Homomorphic Encryption with Optimized Parameter Selection
WO2017177313A1 (en) * 2016-04-12 2017-10-19 The Governing Council Of The University Of Toronto System and methods for validating and performing operations on homomorphically encrypted data
KR20190011180A (en) * 2017-07-24 2019-02-01 삼성전자주식회사 Electronic device and Method for controlling the electronic device

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160350648A1 (en) * 2014-11-07 2016-12-01 Microsoft Technology Licensing, Llc. Neural networks for encrypted data
US20170134156A1 (en) * 2015-11-05 2017-05-11 Microsoft Technology Licensing, Llc Homomorphic Encryption with Optimized Parameter Selection
WO2017177313A1 (en) * 2016-04-12 2017-10-19 The Governing Council Of The University Of Toronto System and methods for validating and performing operations on homomorphically encrypted data
KR20190011180A (en) * 2017-07-24 2019-02-01 삼성전자주식회사 Electronic device and Method for controlling the electronic device

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Jiawei Yuan 외 1명. Privacy Preserving Back-Propagation Neural Network Learning Made Practical with Cloud Computing. 2014년 1월 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210130048A (en) 2020-04-21 2021-10-29 삼성에스디에스 주식회사 Method and apparatus for training analysis model
US12008443B2 (en) 2020-04-21 2024-06-11 Samsung Sds Co., Ltd. Method and apparatus with ciphertext training analysis model

Also Published As

Publication number Publication date
KR102103731B1 (en) 2020-05-29

Similar Documents

Publication Publication Date Title
US11509457B2 (en) Method for secure classification using a transcryption operation
JP4981072B2 (en) Method and system for decryptable and searchable encryption
US5781635A (en) Method and apparatus for improved digital message transaction model
EP3038316B1 (en) Identity authentication system, apparatus, and method, and identity authentication request apparatus
US20110145576A1 (en) Secure method of data transmission and encryption and decryption system allowing such transmission
US20090307490A1 (en) Electronic data communication system
US8467526B2 (en) Key evolution method and system of block ciphering
US20040037424A1 (en) Information distribution and processing
CN115422570B (en) Data processing method and system for distributed storage
CN1778065A (en) Security method and apparatus using biometric data
WO1998036520A1 (en) Cryptographic key split combiner
JP2007114494A (en) Secrecy computing method and device
JP5135070B2 (en) Ciphertext decryption authority delegation system
CN112787822B (en) SM 9-based attribute encryption method and system under large attribute set
KR102103731B1 (en) System for machine learning of encyrpted data using non-interactive communication
Alsalami et al. Utilizing public blockchains for censorship-circumvention and IoT communication
WO2021094821A1 (en) System and method for securing sensor data in internet of things (iot) network
JP2011118387A (en) Method and system for determining result of applying function to signal
US11727125B2 (en) Emergent language based data encryption
Wazery et al. A hybrid technique based on RSA and data hiding for securing handwritten signature
Patel et al. Secure data transmission in a real-time network for a tele-training education system
Navamani et al. Secure transmission of DICOM images by comparing different cryptographic algorithms
Adebayo et al. Data Privacy System Using Steganography and Cryptography
CN110912673B (en) Additive homomorphic encryption and decryption method with double decryption mechanisms
Dixit et al. Multilevel network security combining cryptography and steganography on ARM platform

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right