KR102437715B1 - Distributed processing device and operating method thereof - Google Patents

Distributed processing device and operating method thereof Download PDF

Info

Publication number
KR102437715B1
KR102437715B1 KR1020210073666A KR20210073666A KR102437715B1 KR 102437715 B1 KR102437715 B1 KR 102437715B1 KR 1020210073666 A KR1020210073666 A KR 1020210073666A KR 20210073666 A KR20210073666 A KR 20210073666A KR 102437715 B1 KR102437715 B1 KR 102437715B1
Authority
KR
South Korea
Prior art keywords
analysis
data
module
request message
distributed
Prior art date
Application number
KR1020210073666A
Other languages
Korean (ko)
Inventor
이일구
한연주
이선진
최선미
Original Assignee
성신여자대학교 연구 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 성신여자대학교 연구 산학협력단 filed Critical 성신여자대학교 연구 산학협력단
Priority to KR1020210073666A priority Critical patent/KR102437715B1/en
Application granted granted Critical
Publication of KR102437715B1 publication Critical patent/KR102437715B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/70Protecting specific internal or peripheral components, in which the protection of a component leads to protection of the entire computer
    • G06F21/78Protecting specific internal or peripheral components, in which the protection of a component leads to protection of the entire computer to assure secure storage of data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/182Distributed file systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/04Payment circuits
    • G06Q20/06Private payment circuits, e.g. involving electronic currency used among participants of a common payment scheme
    • G06Q20/065Private payment circuits, e.g. involving electronic currency used among participants of a common payment scheme using e-cash
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/008Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols involving homomorphic encryption

Abstract

In accordance with an embodiment of the present invention, a data distributed processing device can include a user device, a distributed analysis module and a database. The user device can provide an analysis request message corresponding to analysis which a user wants. The distributed analysis module can provide an analysis result by calculating and analyzing homomorphic encryption data corresponding to homomorphically encrypted data through a plurality of analysis agent modules in accordance with the analysis request message. The database can store the analysis result. In accordance with the present invention, the data distributed processing device provides the analysis result by calculating and analyzing homomorphic encryption data through the plurality of analysis agent modules included in the distributed analysis module, and verifies a transaction record through a blockchain module recording an event occurring in the distributed analysis module by generating a block from the event, thereby mitigating a speed issue of homomorphic encryption, and mitigating a reliability issue of bigdata.

Description

데이터 분산처리 장치 및 이의 동작방법{DISTRIBUTED PROCESSING DEVICE AND OPERATING METHOD THEREOF}Data distribution processing device and its operating method

본 발명은 데이터 분산처리 장치 및 이의 동작방법에 관한 것이다. The present invention relates to a data distribution processing apparatus and an operating method thereof.

최근 국내에서는 데이터 3법 개정으로 인해 가명처리한 개인정보일 경우, 개인의 동의를 받지 않고도 여러 분야에서 활용할 수 있는 상황이다. 이에 따라 개인정보에 대한 데이터 보안을 보장하면서 효율적으로 빅데이터를 활용할 수 있는 다양한 연구들이 진행되고 있다.In the case of personal information that has been processed under a pseudonym due to the recent revision of the Data 3 Act in Korea, it can be used in various fields without the consent of the individual. Accordingly, various studies are being conducted to efficiently utilize big data while ensuring data security for personal information.

(한국등록특허) 제10-1600016호 (등록일자, 2016.02.26)(Korean Patent) No. 10-1600016 (Registration Date, 2016.02.26)

본 발명에서 이루고자 하는 기술적 과제는 분산분석 모듈에 포함되는 복수의 분석 에이전트 모듈들을 이용하여 동형암호화 데이터를 연산 및 분석하여 분석결과를 제공함으로써 동형암호화의 속도문제를 개선하고, 분산분석 모듈에서 발생하는 이벤트를 블록으로 생성하여 기록한 블록체인 모듈을 이용하여 거래내역을 검증함으로써 빅데이터의 신뢰성문제를 개선할 수 있는 데이터 분산처리 장치를 제공하는 것이다. The technical task to be achieved in the present invention is to improve the speed problem of homogeneous encryption by providing analysis results by calculating and analyzing homomorphic encryption data using a plurality of analysis agent modules included in the ANOVA module, and It is to provide a data distributed processing device that can improve the reliability problem of big data by verifying transaction details using a block chain module that creates and records events in blocks.

이러한 과제를 해결하기 위하여 본 발명의 실시예에 따른 데이터 분산처리 장치는 사용자 장치, 분산분석 모듈 및 데이터 베이스를 포함할 수 있다. 사용자 장치는 사용자가 원하는 분석에 상응하는 분석요청 메시지를 제공할 수 있다. 분산분석 모듈은 상기 분석요청 메시지에 따라 복수의 분석 에이전트 모듈들을 이용하여 동형암호화 된 데이터에 해당하는 동형암호화 데이터를 분석하여 분석결과를 제공할 수 있다. 데이터 베이스는 상기 분석결과를 저장할 수 있다. In order to solve this problem, the data distribution processing apparatus according to an embodiment of the present invention may include a user device, a distribution analysis module, and a database. The user device may provide an analysis request message corresponding to the analysis desired by the user. The distributed analysis module may use a plurality of analysis agent modules according to the analysis request message to analyze homomorphic-encrypted data corresponding to the homogeneously-encrypted data and provide an analysis result. The database may store the analysis result.

일 실시예에 있어서, 상기 사용자 장치는 상기 데이터 중 사용자 장치 데이터를 동형암호화 한 제1 동형암호화 데이터를 상기 동형암호화 데이터로 상기 분산분석 모듈에 제공할 수 있다. In an embodiment, the user device may provide first isomorphic encryption data obtained by homogeneously encrypting user device data among the data as the homomorphic encryption data to the ANOVA module.

일 실시예에 있어서, 상기 사용자 장치가 상기 제1 동형암호화 데이터를 제공하면서 상기 분석요청 메시지를 제공하는 경우, 상기 제1 동형암호화 데이터는 상기 데이터 분산처리 장치에서 생성되는 공개키를 사용하여 동형암호화 될 수 있다. In an embodiment, when the user device provides the analysis request message while providing the first isomorphic encrypted data, the first isomorphic encrypted data is homogeneously encrypted using a public key generated by the data distribution processing device can be

일 실시예에 있어서, 상기 분석요청 메시지는 상기 분석의 방식, 상기 분석의 대상이 되는 분석 데이터, 상기 분석을 요청한 상기 사용자의 정보를 포함할 수 있다. In an embodiment, the analysis request message may include the analysis method, analysis data to be analyzed, and information of the user who requested the analysis.

일 실시예에 있어서, 상기 분석요청 메시지는 상기 동형암호화 데이터의 단순 결합을 요청하는 제1 요청 메시지 및 상기 동형암호화 데이터를 분석한 통계에 해당하는 비식별화 된 통계 데이터를 요청하는 제2 요청 메시지 중 하나를 포함할 수 있다. In one embodiment, the analysis request message is a first request message for requesting a simple combination of the homomorphic encryption data and a second request message for requesting de-identified statistical data corresponding to the analysis of the homomorphic encryption data may contain one of

일 실시예에 있어서, 상기 데이터 베이스는 상기 데이터 베이스에 동형암호화 되어 저장되는 제2 동형암호화 데이터를 상기 분산분석 모듈에 제공할 수 있다. In an embodiment, the database may provide the ANOVA module with the second isomorphic encrypted data stored after being homomorphically encrypted in the database.

일 실시예에 있어서, 상기 데이터 베이스에 포함되는 복수의 저장 모듈들의 각각은 상기 분산분석 모듈에 포함되는 복수의 분석 에이전트 모듈들의 각각에 상응할 수 있다. In one embodiment, each of the plurality of storage modules included in the database may correspond to each of the plurality of analysis agent modules included in the ANOVA module.

일 실시예에 있어서, 상기 복수의 분석 에이전트 모듈들의 각각은 복수의 분야들의 각각을 인공지능 학습할 수 있다. In an embodiment, each of the plurality of analysis agent modules may learn AI in each of a plurality of fields.

일 실시예에 있어서, 상기 데이터 분산처리 장치는 상기 사용자 장치 및 상기 분산분석 모듈에서 발생하는 이벤트를 블록으로 생성하여 기록하는 블록체인 모듈을 더 포함할 수 있다. In an embodiment, the data distribution processing apparatus may further include a block chain module for generating and recording events occurring in the user device and the distribution analysis module in blocks.

일 실시예에 있어서, 상기 블록에 기록되는 내용에 대한 검증작업이 완료되는 경우, 상기 검증작업에 참여한 클라이언트들에게 암호화폐가 보상으로 지급될 수 있다. In one embodiment, when the verification operation for the contents recorded in the block is completed, cryptocurrency may be paid as a reward to the clients participating in the verification operation.

일 실시예에 있어서, 상기 분산분석 모듈은 상기 복수의 분석 에이전트 모듈들의 각각을 제어하는 제어신호를 제공하는 제어부를 포함할 수 있다. In one embodiment, the ANOVA module may include a control unit that provides a control signal for controlling each of the plurality of analysis agent modules.

일 실시예에 있어서, 상기 제어부는 상기 제어신호 중 제1 제어신호에 따라 동형암호화 된 제2 동형암호화 데이터를 상기 데이터 베이스에 포함되는 복수의 저장 모듈들 로부터 상기 분산분석 모듈에 전달할 수 있다. In an embodiment, the control unit may transmit second homomorphic encryption data homomorphically encrypted according to a first control signal among the control signals to the ANOVA module from a plurality of storage modules included in the database.

일 실시예에 있어서, 상기 제어부는 상기 제어신호 중 제2 제어신호에 따라 상기 동형암호화 데이터를 상기 복수의 분석 에이전트 모듈들 간에 전달할 수 있다. In an embodiment, the control unit may transmit the isomorphic encryption data between the plurality of analysis agent modules according to a second control signal among the control signals.

이러한 과제를 해결하기 위하여 본 발명의 실시예에 따른 분산처리 장치의 동작방법에서는, 사용자 장치가 사용자가 원하는 분석에 상응하는 분석요청 메시지를 제공할 수 있다. 분산분석 모듈이 상기 분석요청 메시지에 따라 복수의 분석 에이전트 모듈들을 이용하여 동형암호화 된 데이터에 해당하는 동형암호화 데이터를 분석하여 분석결과를 제공할 수 있다. 데이터 베이스가 상기 분석결과를 저장할 수 있다. In order to solve this problem, in the method of operating a distributed processing device according to an embodiment of the present invention, the user device may provide an analysis request message corresponding to the analysis desired by the user. The distributed analysis module may analyze homomorphic-encrypted data corresponding to homogeneously-encrypted data using a plurality of analysis agent modules according to the analysis request message to provide an analysis result. A database may store the analysis result.

위에서 언급된 본 발명의 기술적 과제 외에도, 본 발명의 다른 특징 및 이점들이 이하에서 기술되거나, 그러한 기술 및 설명으로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.In addition to the technical problems of the present invention mentioned above, other features and advantages of the present invention will be described below, or will be clearly understood by those skilled in the art from such description and description.

이상과 같은 본 발명에 따르면 다음과 같은 효과가 있다.According to the present invention as described above, there are the following effects.

본 발명에 따른 데이터 분산처리 장치는 분산분석 모듈에 포함되는 복수의 분석 에이전트 모듈들을 이용하여 동형암호화 데이터를 연산 및 분석하여 분석결과를 제공하고, 분산분석 모듈에서 발생하는 이벤트를 블록으로 생성하여 기록한 블록체인 모듈을 이용하여 거래내역을 검증함으로써 동형암호화의 속도문제를 개선하고, 빅데이터의 신뢰성문제를 개선할 수 있다. The data distribution processing apparatus according to the present invention provides analysis results by calculating and analyzing homomorphic encryption data using a plurality of analysis agent modules included in the distributed analysis module, and generates and records events occurring in the distributed analysis module as blocks. By verifying transaction details using the block chain module, the speed problem of homomorphic encryption can be improved and the reliability problem of big data can be improved.

본 발명은 데이터 암호화 및 분산 분석을 한 후 안전한 관리를 위해 동형암호 및 블록체인 기술을 상호 보완적으로 활용함으로써, 데이터에 무결성 기밀성, 가용성 등이 보장될 수 있다.The present invention can ensure data integrity, confidentiality, availability, etc. by complementary use of homomorphic encryption and block chain technology for secure management after data encryption and distributed analysis.

이 밖에도, 본 발명의 실시 예들을 통해 본 발명의 또 다른 특징 및 이점들이 새롭게 파악될 수도 있을 것이다.In addition, other features and advantages of the present invention may be newly recognized through embodiments of the present invention.

도 1은 본 발명의 실시예들에 따른 데이터 분산처리 장치를 나타내는 도면이다.
도 2는 도 1의 데이터 분산처리 장치에서 사용되는 제1 동형암호화 데이터를 설명하기 위한 도면이다.
도 3은 도 1의 데이터 분산처리 장치에 적용되는 분석요청 메시지에 포함되는 요청 메시지를 설명하기 위한 도면이다.
도 4는 도 1의 데이터 분산처리 장치에서 사용되는 제2 동형암호화 데이터를 설명하기 위한 도면이다.
도 5 및 6은 도 1의 데이터 분산처리 장치에 포함되는 분산분석 모듈 및 데이터 베이스 사이의 데이터 전달을 설명하기 위한 도면들이다.
도 7은 도 1의 데이터 분산처리 장치에 블록체인을 적용한 실시예를 설명하기 위한 도면이다.
도 8 및 9는 도 1의 데이터 분산처리 장치에 포함되는 분산분석 모듈에 포함되는 제어부의 동작을 설명하기 위한 도면들이다.
도 10은 본 발명의 실시예들에 따른 데이터 분산처리 장치의 동작방법을 나타내는 순서도이다.
1 is a diagram illustrating an apparatus for distributing data according to embodiments of the present invention.
FIG. 2 is a diagram for explaining the first homomorphic encryption data used in the data distribution processing apparatus of FIG. 1 .
FIG. 3 is a diagram for explaining a request message included in an analysis request message applied to the data distribution processing apparatus of FIG. 1 .
FIG. 4 is a diagram for explaining the second homomorphic encryption data used in the data distribution processing apparatus of FIG. 1 .
5 and 6 are diagrams for explaining data transfer between the ANOVA module and the database included in the data distribution processing apparatus of FIG. 1 .
7 is a diagram for explaining an embodiment in which a block chain is applied to the data distribution processing apparatus of FIG. 1 .
8 and 9 are diagrams for explaining the operation of the control unit included in the ANOVA module included in the data distribution processing apparatus of FIG. 1 .
10 is a flowchart illustrating a method of operating a data distribution processing apparatus according to embodiments of the present invention.

본 명세서에서 각 도면의 구성 요소들에 참조번호를 부가함에 있어서 동일한 구성 요소들에 한해서는 비록 다른 도면상에 표시되더라도 가능한한 동일한 번호를 가지도록 하고 있음에 유의하여야 한다.In the present specification, it should be noted that, in adding reference numbers to the components of each drawing, the same numbers are used only for the same components even though they are indicated on different drawings.

한편, 본 명세서에서 서술되는 용어의 의미는 다음과 같이 이해되어야 할 것이다.On the other hand, the meaning of the terms described in this specification should be understood as follows.

단수의 표현은 문맥상 명백하게 다르게 정의하지 않는 한, 복수의 표현을 포함하는 것으로 이해되어야 하는 것으로, 이들 용어들에 의해 권리범위가 한정되어서는 아니 된다.The singular expression is to be understood as including the plural expression unless the context clearly defines otherwise, and the scope of rights should not be limited by these terms.

"포함하다" 또는 "가지다" 등의 용어는 하나 또는 그 이상의 다른 특징이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.It should be understood that terms such as “comprise” or “have” do not preclude the possibility of addition or existence of one or more other features or numbers, steps, operations, components, parts, or combinations thereof.

이하, 첨부되는 도면을 참고하여 상기 문제점을 해결하기 위해 고안된 본 발명의 바람직한 실시예들에 대해 상세히 설명한다.Hereinafter, preferred embodiments of the present invention designed to solve the above problems will be described in detail with reference to the accompanying drawings.

도 1은 본 발명의 실시예들에 따른 데이터 분산처리 장치를 나타내는 도면이고, 도 2는 도 1의 데이터 분산처리 장치에서 사용되는 제1 동형암호화 데이터를 설명하기 위한 도면이고, 도 3은 도 1의 데이터 분산처리 장치에 적용되는 분석요청 메시지에 포함되는 요청 메시지를 설명하기 위한 도면이고, 도 4는 도 1의 데이터 분산처리 장치에서 사용되는 제2 동형암호화 데이터를 설명하기 위한 도면이다.1 is a diagram illustrating a data distribution processing apparatus according to embodiments of the present invention, FIG. 2 is a diagram for explaining the first homomorphic encryption data used in the data distribution processing apparatus of FIG. 1, and FIG. 3 is FIG. It is a view for explaining a request message included in an analysis request message applied to the data distribution processing apparatus of

도 1 내지 4를 참조하면, 본 발명의 실시예에 따른 데이터 분산처리 장치(10)는 사용자 장치(100), 분산분석 모듈(200) 및 데이터 베이스(300)를 포함할 수 있다. 사용자 장치(100)는 사용자가 원하는 분석에 상응하는 분석요청 메시지(QM)를 제공할 수 있다. 예를 들어, 복수의 사용자 장치들(100)은 제1 사용자 장치(110), 제2 사용자 장치(120) 내지 제N 사용자 장치(130)를 포함할 수 있다. 사용자가 원하는 분석결과(AR)를 얻기 위해서 제1 사용자 장치(110)를 이용해서 분산분석 모듈(200)에 분석요청 메시지(QM)를 제공할 수 있다. 이 경우, 분석요청 메시지(QM)는 동형암호화 방식에 따라 암호화된 동형암호화 데이터(DA)의 형태로 분산분석 모듈(200)에 제공될 수도 있다. 동형암호화 데이터(DA)는 제1 동형암호화 데이터(DA1) 및 제2 동형암호화 데이터(DA2)를 포함할 수 있다. 제1 동형암호화 데이터(DA1)는 사용자 장치(100)로부터 분산분석 모듈(200)로 제공되는 동형암호화 된 데이터일 수 있고, 제2 동형암호화 데이터(DA2)는 데이터 베이스(300)로부터 분산분석 모듈(200)로 제공되는 동형암호화 된 데이터일 수 있다. 제1 동형암호화 데이터(DA1) 및 제2 동형암호화 데이터(DA2)는 동형암호화 방식에 따라 암호화된 상태에서 연산 및 분석이 가능하여 프라이빗 정보를 포함한 빅데이터의 신뢰성을 높일 수 있다. 일 실시예에 있어서, 사용자 장치(100)는 분석요청 메시지(QM) 및 동형 암호화된 동형암호화 데이터(DA)를 분산분석 모듈(200)에 같이 전송할 수도 있고, 분석요청 메시지(QM) 및 동형암호화 데이터(DA) 중 하나만을 분산분석 모듈(200)에 전송할 수도 있다. 1 to 4 , the data distribution processing apparatus 10 according to an embodiment of the present invention may include a user device 100 , a variance analysis module 200 , and a database 300 . The user device 100 may provide an analysis request message QM corresponding to the analysis desired by the user. For example, the plurality of user devices 100 may include a first user device 110 , a second user device 120 , and an Nth user device 130 . In order to obtain the analysis result AR desired by the user, the analysis request message QM may be provided to the ANOVA module 200 using the first user device 110 . In this case, the analysis request message QM may be provided to the ANOVA module 200 in the form of homomorphic encryption data DA encrypted according to the homomorphic encryption method. The homomorphic encrypted data DA may include the first isomorphic encrypted data DA1 and the second isomorphic encrypted data DA2. The first isomorphic encrypted data DA1 may be homomorphic encrypted data provided from the user device 100 to the ANOVA module 200 , and the second isomorphic encrypted data DA2 is obtained from the database 300 by the ANOVA module It may be homomorphic encrypted data provided as (200). The first homomorphic encrypted data DA1 and the second homogeneous encrypted data DA2 can be calculated and analyzed in an encrypted state according to the homogeneous encryption method, thereby increasing the reliability of big data including private information. In one embodiment, the user device 100 may transmit the analysis request message (QM) and the homomorphic-encrypted homomorphic encryption data (DA) to the distributed analysis module 200 together, and the analysis request message (QM) and the homomorphic encryption Only one of the data DA may be transmitted to the ANOVA module 200 .

분산분석 모듈(200)은 분석요청 메시지(QM)에 따라 복수의 분석 에이전트 모듈들을 이용하여 동형암호화 된 데이터에 해당하는 동형암호화 데이터(DA)를 분석하여 분석결과(AR)를 제공할 수 있다. 예를 들어, 분산분석 모듈(200)은 복수의 분석 에이전트 모듈들을 포함할 수 있다. 복수의 분석 에이전트 모듈들은 제1 분석 에이전트 모듈(210), 제2 분석 에이전트 모듈(220) 내지 제N 분석 에이전트 모듈(230)을 포함할 수 있다. 분산분석 모듈(200)은 제1 분석 에이전트 모듈(210) 내지 제N 분석 에이전트 모듈(230)을 이용하여 동형암호화 데이터(DA)를 분산하여 연산 및 분석함으로써 데이터 처리속도를 증가시킬 수 있다. 일 실시예에 있어서, 분산분석 모듈(200)은 사용자 장치(100)로부터 제공되는 제1 동형암호화 데이터(DA1)만을 이용하여 분석할 수도 있고, 데이터 베이스(300)로부터 제공되는 제2 동형암호화 데이터(DA2)만을 이용하여 분석할 수도 있다. 또한, 분산분석 모듈(200)은 제1 동형암호화 데이터(DA1) 및 제2 동형암호화 데이터(DA2)를 모두 이용하여 분석할 수도 있다. The ANOVA module 200 may provide an analysis result AR by analyzing the homomorphic encryption data DA corresponding to the homomorphic encryption data using a plurality of analysis agent modules according to the analysis request message QM. For example, the ANOVA module 200 may include a plurality of analysis agent modules. The plurality of analysis agent modules may include a first analysis agent module 210 , a second analysis agent module 220 to an Nth analysis agent module 230 . The distributed analysis module 200 can increase the data processing speed by distributing, calculating and analyzing the homomorphic encrypted data (DA) using the first analysis agent module 210 to the Nth analysis agent module 230 . In an embodiment, the ANOVA module 200 may analyze using only the first isomorphic encryption data DA1 provided from the user device 100 , and the second isomorphic encryption data provided from the database 300 . (DA2) alone can also be used for analysis. In addition, the ANOVA module 200 may analyze using both the first homomorphic encryption data DA1 and the second homomorphic encryption data DA2.

데이터 베이스(300)는 분석결과(AR)를 저장할 수 있다. 예를 들어, 분석 결과(AR)는 동형암호화 된 상태로 데이터 베이스(300)에 저장될 수 있다. The database 300 may store the analysis result AR. For example, the analysis result AR may be stored in the database 300 in a homomorphic-encrypted state.

일 실시예에 있어서, 사용자 장치(100)는 데이터 중 사용자 장치 데이터(TA)를 동형암호화 한 제1 동형암호화 데이터(DA1)를 동형암호화 데이터(DA)로 분산분석 모듈(200)에 제공할 수 있다. 예를 들어, 사용자는 제1 사용자 장치(110)를 이용해서 사용자 장치 데이터(TA)를 제1 동형암호화 데이터(DA1)로 암호화하여 분산분석 모듈(200)에 제공할 수 있다. 제1 사용자 장치(110)에서 제공되는 사용자 장치 데이터(TA)는 지적재산 문서 데이터(TA1), 공공행정 문서 데이터(TA2) 및 사물 인터넷 데이터(TA3)를 포함할 수 있다. 이 경우, 지적재산 문서 데이터(TA1)를 동형암호화 한 데이터는 제1_1 동형암호화 데이터(DA1_1)일 수 있고, 공공행정 문서 데이터(TA2)를 동형암호화 한 데이터는 제1_2 동형암호화 데이터(DA1_2)일 수 있고, 사물 인터넷 데이터(TA3)를 동형암호화 한 데이터는 제1_3 동형암호화 데이터(DA1_3)일 수 있다. 제1_1 동형암호화 데이터(DA1_1), 제1_2 동형암호화 데이터(DA1_2) 및 제1_3 동형암호화 데이터(DA1_3)는 제1 사용자 장치(110)로부터 분산분석 모듈(200)에 제공되는 제1 동형암호화 데이터(DA1)에 포함될 수 있다. In an embodiment, the user device 100 may provide the first homomorphic encryption data DA1 obtained by homogeneously encrypting the user device data TA among the data to the ANOVA module 200 as the homomorphic encryption data DA. have. For example, the user may use the first user device 110 to encrypt the user device data TA into the first homomorphic encrypted data DA1 and provide it to the ANOVA module 200 . The user device data TA provided from the first user device 110 may include intellectual property document data TA1 , public administration document data TA2 , and Internet of Things data TA3 . In this case, the homomorphic encryption data of the intellectual property document data (TA1) may be the first_1 homomorphic encryption data (DA1_1), and the homomorphic encryption data of the public administration document data (TA2) is the first_2 homomorphic encryption data (DA1_2) Also, the data obtained by homomorphic encryption of the IoT data TA3 may be the first_3 homomorphic encryption data DA1_3. The first isomorphic encryption data (DA1_1), the first isomorphic encryption data (DA1_1), the first isomorphic encryption data (DA1_2), and the first isomorphism encryption data (DA1_3) are the first isomorphic encryption data provided from the first user device 110 to the ANOVA module 200 ( DA1) may be included.

일 실시예에 있어서, 사용자 장치(100)가 제1 동형암호화 데이터(DA1)를 제공하면서 분석요청 메시지(QM)를 제공하는 경우, 제1 동형암호화 데이터(DA1)는 데이터 분산처리 장치(10)에서 생성되는 공개키를 사용하여 동형암호화 될 수 있다. 예를 들어, 제1 사용자 장치(110)는 지적재산 문서 데이터(TA1), 공공행정 문서 데이터(TA2) 및 사물 인터넷 데이터(TA3)를 동형암호 공개키로 암호화하여 제1_1 동형암호화 데이터(DA1_1), 제1_2 동형암호화 데이터(DA1_2) 및 제1_3 동형암호화 데이터(DA1_3)를 제공할 수 있다. In an embodiment, when the user device 100 provides the analysis request message QM while providing the first isomorphic encrypted data DA1, the first isomorphic encrypted data DA1 is the data distributed processing apparatus 10 It can be homomorphic encryption using the public key generated in For example, the first user device 110 encrypts the intellectual property document data TA1, the public administration document data TA2, and the Internet of Things data TA3 with the homomorphic encryption public key to encrypt the first_1 homomorphic encryption data DA1_1, The first_2 isomorphic encrypted data DA1_2 and the first_3 isomorphic encrypted data DA1_3 may be provided.

일 실시예에 있어서, 분석요청 메시지(QM)는 분석의 방식, 분석의 대상이 되는 분석 데이터, 분석을 요청한 사용자의 정보를 포함할 수 있고, 분석요청 메시지(QM)는 동형암호화 데이터(DA)의 단순 결합을 요청하는 제1 요청 메시지(RM1) 및 동형암호화 데이터(DA)를 분석한 통계에 해당하는 비식별화 된 통계 데이터를 요청하는 제2 요청 메시지(RM2) 중 하나를 포함할 수 있다. 예를 들어, 사용자가 제1 사용자 장치(110)를 통해서 제1 요청 메시지(RM1)를 포함하는 분석요청 메시지(QM)를 분산분석 모듈(200)에 제공하는 경우, 분산분석 모듈(200)은 제1 사용자 장치(110)로부터 제공되는 제1 동형암호화 데이터(DA1) 및 데이터 베이스(300)로부터 제공되는 제2 동형암호화 데이터(DA2)를 단순히 결합하여 분석결과(AR)로 제1 사용자 장치(110)에 제공할 수 있다. 또한, 사용자가 제1 사용자 장치(110)를 통해서 제2 요청 메시지(RM2)를 포함하는 분석요청 메시지(QM)를 분산분석 모듈(200)에 제공하는 경우, 분산분석 모듈(200)은 제1 사용자 장치(110)로부터 제공되는 제1 동형암호화 데이터(DA1) 및 데이터 베이스(300)로부터 제공되는 제2 동형암호화 데이터(DA2)를 연산 및 분석하여 프라이빗 정보가 파악할 수 없는 비식별화 된 통계 데이터를 그래프의 형태로 제1 사용자 장치(110)에 제공할 수 있다. 통계데이터 비식별화 기법으로는 가명처리, 식별데이터 값 삭제, 데이터 마스킹 등을 포함하지만, 이에 한정되지 않고 다양한 비식별화 기법을 사용할 수 있다.In an embodiment, the analysis request message (QM) may include an analysis method, analysis data to be analyzed, and information of a user requesting analysis, and the analysis request message (QM) is a homomorphic encryption data (DA) It may include one of the first request message RM1 for requesting a simple combination of , and the second request message RM2 for requesting de-identified statistical data corresponding to the analyzed statistics of the homomorphic encryption data DA. . For example, when the user provides the analysis request message QM including the first request message RM1 through the first user device 110 to the ANOVA module 200, the ANOVA module 200 is The first isomorphic encryption data DA1 provided from the first user device 110 and the second homomorphic encryption data DA2 provided from the database 300 are simply combined to obtain the analysis result AR as the first user device ( 110) can be provided. In addition, when the user provides the analysis request message QM including the second request message RM2 to the ANOVA module 200 through the first user device 110 , the ANOVA module 200 performs the first De-identified statistical data that cannot be grasped by private information by calculating and analyzing the first homomorphic encryption data DA1 provided from the user device 110 and the second homomorphic encryption data DA2 provided from the database 300 . may be provided to the first user device 110 in the form of a graph. Statistical data de-identification techniques include, but are not limited to, pseudonymization, identification data value deletion, data masking, and the like, and various de-identification techniques can be used.

일 실시예에 있어서, 데이터 베이스(300)는 데이터 베이스(300)에 동형암호화 되어 저장되는 제2 동형암호화 데이터(DA2)를 분산분석 모듈(200)에 제공할 수 있다.In an embodiment, the database 300 may provide the second homomorphic encrypted data DA2 stored after being homomorphically encrypted in the database 300 to the ANOVA module 200 .

본 발명에 따른 데이터 분산처리 장치(10)는 분산분석 모듈(200)에 포함되는 복수의 분석 에이전트 모듈들을 이용하여 동형암호화 데이터(DA)를 연산 및 분석하여 분석결과(AR)를 제공할 수 있다. The data distribution processing apparatus 10 according to the present invention may provide an analysis result AR by calculating and analyzing the homomorphic encryption data DA using a plurality of analysis agent modules included in the distributed analysis module 200 . .

도 5 및 6은 도 1의 데이터 분산처리 장치에 포함되는 분산분석 모듈 및 데이터 베이스 사이의 데이터 전달을 설명하기 위한 도면들이다.5 and 6 are diagrams for explaining data transfer between the distributed analysis module and the database included in the data distribution processing apparatus of FIG. 1 .

도 1 내지 6을 참조하면, 데이터 베이스(300)에 포함되는 복수의 저장 모듈들의 각각은 분산분석 모듈(200)에 포함되는 복수의 분석 에이전트 모듈들의 각각에 상응할 수 있다. 예를 들어, 복수의 분석 에이전트 모듈들은 제1 분석 에이전트 모듈(210), 제2 분석 에이전트 모듈(220) 내지 제N 분석 에이전트 모듈(230)을 포함할 수 있고, 복수의 저장 모듈들은 제1 저장 모듈(310), 제2 저장 모듈(320) 내지 제N 저장 모듈(330)을 포함할 수 있다. 경우에 따라서, 제1 분석 에이전트 모듈(210)을 통해서 연산 및 분석되는 동형암호화 데이터(DA)(분석결과 포함)는 제1 저장 모듈(310)에 저장될 수 있고, 제2 분석 에이전트 모듈(220)을 통해서 연산 및 분석되는 동형암호화 데이터(DA)(분석결과 포함)는 제2 저장 모듈(320)에 저장될 수 있다. 또한, 제N 분석 에이전트 모듈(230)을 통해서 연산 및 분석되는 동형암호화 데이터(DA)(분석결과 포함)는 제N 저장 모듈(330)에 저장될 수 있다.1 to 6 , each of the plurality of storage modules included in the database 300 may correspond to each of the plurality of analysis agent modules included in the ANOVA module 200 . For example, the plurality of analysis agent modules may include a first analysis agent module 210 , a second analysis agent module 220 to an Nth analysis agent module 230 , and the plurality of storage modules include a first storage The module 310 may include a second storage module 320 to an N-th storage module 330 . In some cases, the homomorphic encryption data DA (including the analysis result) calculated and analyzed through the first analysis agent module 210 may be stored in the first storage module 310, and the second analysis agent module 220 ), the isomorphic encryption data DA (including the analysis result) calculated and analyzed through the operation and analysis may be stored in the second storage module 320 . In addition, the homomorphic encryption data DA (including the analysis result) calculated and analyzed through the N-th analysis agent module 230 may be stored in the N-th storage module 330 .

또한, 경우에 따라서, 제1 분석 에이전트 모듈(210)은 제1 저장 모듈(310) 뿐만 아니라 제2 저장 모듈(320) 내지 제N 저장 모듈(330)로부터 동형암호화 데이터(DA)를 전달받아 연산 및 분석할 수 있다. 제1 분석 에이전트 모듈(210)은 제1 저장 모듈(310) 내지 제N 저장 모듈(330)로부터 전달받은 동형암호화 데이터(DA)에 기초하여 연산 및 분석한 분석결과(AR)를 제1 저장 모듈(310) 뿐만 아니라, 제2 저장 모듈(320) 내지 제N 저장 모듈(330)에 분산해서 저장할 수도 있다. In addition, in some cases, the first analysis agent module 210 receives the homomorphic encryption data DA from the first storage module 310 as well as the second storage module 320 to the N-th storage module 330 and operates and analysis. The first analysis agent module 210 stores the analysis result (AR) calculated and analyzed based on the homomorphic encryption data (DA) received from the first storage module 310 to the N-th storage module 330 to the first storage module In addition to 310 , it may be distributed and stored in the second storage module 320 to the N-th storage module 330 .

일 실시예에 있어서, 복수의 분석 에이전트 모듈들의 각각은 복수의 분야들의 각각을 인공지능 학습할 수 있다. 예를 들어, 복수의 분야들은 지적재산 분야, 공공행정 분야, 사물인터넷 분야를 포함할 수 있다. 제1 분석 에이전트 모듈(210)은 지적재산 분야의 빅데이터를 학습한 분석 에이전트 모듈일 수 있다. 제1 사용자 장치(110)로부터 제공되는 제1 동형암호화 데이터(DA1)가 지적재산 분야의 데이터인 경우, 제1 분석 에이전트 모듈(210)은 분석요청 메시지(QM)에 따라 지적재산 분야의 데이터를 분석하여 분석결과(AR)를 제1 사용자 장치(110)에 제공할 수 있다. 또한, 제2 분석 에이전트 모듈(220)은 공공행정 분야에 전문화된 분석 에이전트 모듈로서 공공행정 분야와 관련되는 분석을 위와 같은 방식으로 전담할 수 있고, 제N 분석 에이전트 모듈(230)은 사물인터넷 분야에 전문화된 분석 에이전트 모듈로서 사물인터넷 분야와 관련되는 분석을 전담할 수 있다. In one embodiment, each of the plurality of analysis agent modules may learn AI in each of the plurality of fields. For example, the plurality of fields may include an intellectual property field, a public administration field, and an Internet of Things field. The first analysis agent module 210 may be an analysis agent module that has learned big data in the field of intellectual property. When the first homomorphic encryption data DA1 provided from the first user device 110 is data in the field of intellectual property, the first analysis agent module 210 receives the data in the field of intellectual property according to the analysis request message QM. By analyzing, the analysis result AR may be provided to the first user device 110 . In addition, the second analysis agent module 220 is an analysis agent module specialized in the public administration field, and can be dedicated to the analysis related to the public administration field in the above manner, and the Nth analysis agent module 230 is the Internet of Things field. As a specialized analysis agent module, it can be dedicated to analysis related to the IoT field.

또한, 일 실시예에 있어서, 분산분석 모듈(200)은 분산분석 처리단위를 설정하여 복수의 분석 에이전트 모듈들에 할당하여 분석할 수도 있다. 또한, 일 실시예에 있어서, 데이터 분석 알고리즘에는 통계적 방법과 인공지능 방법이 있을 수 있으며 알고리즘을 이용하여 데이터에 대한 규칙을 분석할 수 있다. 데이터 분석 과정에는 데이터 전 처리 과정, 분석 과정이 포함될 수 있다. 데이터 전 처리 과정에서 본 발명은 데이터의 결측 값, 이상치, 중복 값 등을 처리할 수 있고 분석 과정에서는 데이터 간의 상관성, 유사도를 계산하여 데이터의 특성을 파악하고 분류 및 최적의 목표 결과를 생성할 수 있다. 이 외에도 백그라운드에서는 모델 최적화 과정과 평가 과정이 포함될 수 있다. 모델 최적화 과정에서는 생성된 모델의 학습을 통해 모델의 성능을 향상시키고 평가 과정에서는 평가 결과를 바탕으로 다시 학습하여 최적의 모델을 구축할 수 있다.Also, in one embodiment, the ANOVA module 200 may set a ANOVA processing unit and allocate it to a plurality of analysis agent modules for analysis. Also, according to an embodiment, the data analysis algorithm may include a statistical method and an artificial intelligence method, and rules for data may be analyzed using the algorithm. The data analysis process may include a data pre-processing process and an analysis process. In the data pre-processing process, the present invention can process missing values, outliers, duplicate values, etc. of data, and in the analysis process, correlation and similarity between data are calculated to identify characteristics of data, and classification and optimal target results can be generated. have. In addition to this, the model optimization process and evaluation process may be included in the background. In the model optimization process, the performance of the model is improved by learning the generated model, and in the evaluation process, an optimal model can be built by re-learning based on the evaluation results.

도 7은 도 1의 데이터 분산처리 장치에 블록체인을 적용한 실시예를 설명하기 위한 도면이다.7 is a diagram for explaining an embodiment in which a block chain is applied to the data distribution processing apparatus of FIG. 1 .

도 1 내지 7를 참조하면, 본 발명의 실시예에 따른 데이터 분산처리 장치(10)는 사용자 장치(100), 분산분석 모듈(200), 데이터 베이스(300) 및 블록체인 모듈(400)을 포함할 수 있다. 사용자 장치(100)는 사용자가 원하는 분석에 상응하는 분석요청 메시지(QM)를 제공할 수 있다. 분산분석 모듈(200)은 분석요청 메시지(QM)에 따라 복수의 분석 에이전트 모듈들을 이용하여 동형암호화 된 데이터에 해당하는 동형암호화 데이터(DA)를 분석하여 분석결과(AR)를 제공할 수 있다. 데이터 베이스(300)는 분석결과(AR)를 저장할 수 있다. 블록체인 모듈(400)은 사용자 장치(100) 및 분산분석 모듈(200)에서 발생하는 이벤트를 블록으로 생성하여 기록 및 검증할 수 있다. 1 to 7 , the data distributed processing apparatus 10 according to an embodiment of the present invention includes a user device 100 , a distributed analysis module 200 , a database 300 , and a block chain module 400 . can do. The user device 100 may provide an analysis request message QM corresponding to the analysis desired by the user. The ANOVA module 200 may provide an analysis result AR by analyzing the homomorphic encryption data DA corresponding to the homomorphic encryption data using a plurality of analysis agent modules according to the analysis request message QM. The database 300 may store the analysis result AR. The block chain module 400 may generate, record, and verify events occurring in the user device 100 and the distributed analysis module 200 as a block.

블록체인 모듈(400)은 분산분석 모듈(200)에서 처리되고 최종적으로 출력된 분석 결과(AR)를 함축적으로 블록에 기록할 수 있다. 블록에 기록되는 내용은 블록 해시 값, 버전, 머클루트, 이전 블록 해시, 타임, 난이도 목표, 논스 값을 헤더에 포함할 수 있으며 바디 영역에는 분석요청 메시지(QM)과 분석결과(AR)에 대한 요약 정보를 기록할 수 있다. 일 실시예에 있어서, 블록에 기록되는 내용에 대한 검증작업이 완료되는 경우, 검증작업에 참여한 클라이언트들에게 암호화폐가 보상으로 지급될 수 있다. The block chain module 400 may implicitly record the analysis result (AR) processed and finally output by the distributed analysis module 200 in a block. The content recorded in the block may include the block hash value, version, merkroot, previous block hash, time, difficulty target, and nonce value in the header. Summary information can be recorded. In one embodiment, when the verification operation for the contents recorded in the block is completed, cryptocurrency may be paid as a reward to the clients participating in the verification operation.

일 실시예에 있어서, 사용자 장치(100)와 분석 에이전트 모듈 간의 거래 내역을 블록체인의 노드에 기록될 때, 기록되는 내용은 거래한 사실, 거래자 프로필 정보, 분석 데이터의 요약 정보를 포함할 수 있다. 정보가 하나의 노드에 기록되면 노드는 비트코인 네트워크 상에 있는 모든 노드에게 해당 정보를 제공할 수 있으며 전파되는 과정에서 특정 노드에 의해 채굴 및 검증될 수 있다. In one embodiment, when the transaction details between the user device 100 and the analysis agent module are recorded in the node of the block chain, the recorded contents may include the fact of the transaction, trader profile information, and summary information of analysis data. . When information is recorded in one node, the node can provide that information to all nodes on the Bitcoin network, and in the process of propagation, it can be mined and verified by a specific node.

일 실시예에 있어서, 블록체인에 기록된 요약 정보는 사용자를 통해 검증될 수 있으며, 이때 통상적으로 널리 알려진 랜덤으로 정해진 숫자를 가장 먼저 찾은 사람이 검증하는 방식인 제비뽑기 방법을 사용할 수 있다. 제비뽑기 방법을 수행할 때 비용을 많이 지불한 사용자일수록 많은 제비를 뽑을 수 있으므로 정해진 랜덤 숫자를 가장 먼저 찾을 확률을 높일 수 있다. In one embodiment, the summary information recorded in the block chain can be verified by the user, and in this case, the lottery method, which is a method in which the person who first finds a commonly known, randomly determined number first verifies, can be used. When performing the lottery method, users who pay a lot more can draw more lots, so the probability of finding a fixed random number first can be increased.

데이터 분석을 원하는 사용자가 데이터 결합을 요청하면 에이전트는 데이터 분석을 위한 계획을 설정하고, 이에 대한 분산 계획을 생성할 수 있다. 예를 들어, 기업 'A'가 본 발명에 당사의 고객 소비 품목 데이터와 당사의 고객 연령 데이터를 제공하면서 연령층에 따른 소비 패턴에 대한 분석을 요청한다고 하면 제공받은 두 개의 데이터를 본 시스템에서 제공하는 동형암호 공개키로 암호화한 후 오픈 API를 통해 분석요청 메시지(QM)과 함께 제공할 수 있다. When a user who wants data analysis requests data binding, the agent can set a plan for data analysis and create a distributed plan for it. For example, if company 'A' requests analysis of consumption patterns according to age group while providing our customer consumption item data and our customer age data to the present invention, the system provides the two data provided by the system. After encryption with the homomorphic encryption public key, it can be provided along with an analysis request message (QM) through the open API.

분산분석 모듈(200)은 제공받은 두 개의 데이터에서의 분야를 확립하고 현재 시스템에 있는 분석 에이전트 모듈들의 수를 고려하여 이에 대한 분산 계획을 수립할 수 있다. 분석 에이전트 모듈들의 수가 2개라고 할 때, 제1 분석 에이전트 모듈(210)은 숫자 분석에 심화적으로 학습되어 있는 모듈이고, 제2 분석 에이전트 모듈(220)은 분류 알고리즘에 최적화된 에이전트라고 가정할 수 있다. 각각의 동형암호화 된 데이터베이스는 태그 등을 통해 분야와 종류를 확인할 수 있고 이에 따라 제1 분석 에이전트 모듈(210)은 고객 연령 데이터의 분석을 책임지고, 제2 분석 에이전트 모듈(220)은 고객 소비 품목 데이터의 분석을 할당 받게 된다. 이와 같은 방식으로 생성된 분산 계획을 기반으로 제1 분석 에이전트 모듈(210) 및 제2 분석 에이전트 모듈(220)은 분석을 수행할 수 있다. 이 경우, 분석은 신경망과 같은 데이터 분석 알고리즘을 사용할 수 있다. 제1 분석 에이전트 모듈(210)은 고객 연령 데이터베이스에 접근하여 동형암호화 된 상태에서 블랙박스 알고리즘 내에서 분석을 수행하고 제2 분석 에이전트 모듈(220)은 고객 소비 품목 데이터베이스에 접근하여 분류 알고리즘을 통해 기업에서 요구한 카테고리를 바탕으로 품목을 분류할 수 있다. 제1 분석 에이전트 모듈(210) 및 제2 분석 에이전트 모듈(220) 각각의 분석이 완료된 후 두 개의 분석 에이전트 모듈은 서로의 분석 결과를 바탕으로 최종적인 연산을 수행할 수 있다. 연산이 완료되고 결합 데이터가 생성되면 해당 데이터를 사용자 장치(100)에 전달할 수 있다. 사용자 장치(100)는 동형암호화 된 상태에서 결합 데이터를 받게 되며, 통계데이터는 시스템에서 제공하는 비밀키로 복호화 하여 열람할 수 있다. 사용자 장치(100)와 분산분석 모듈(200) 간의 거래 내역은 블록체인의 노드에 기록되며, 선정된 채굴자는 해당 노드를 검증할 수 있다. 블록체인 노드 'node1'에는 기업 A와 분석 시스템의 프로필 정보, 요약된 분석 정보 등이 기록되며 '갑'이 제비뽑기 방식을 통해 채굴자로 선정되었다고 가정하면 '갑'이 'node1'을 검증하고 이에 대한 보상을 지급받을 수 있다. 데이터 분석 내용을 히스토리와 같은 방식으로 간단히 기록하기 때문에 거래 내용을 모든 클라이언트가 증명할 수 있고 이를 통해 본 발명에서는 신뢰성을 확보할 수 있다. 또한 위와 같은 절차가 반복될수록 전체 시스템의 분석 수준을 증명할 수 있다. The ANOVA module 200 may establish a field in the provided two data and establish a distribution plan for it in consideration of the number of analysis agent modules in the current system. When the number of analysis agent modules is two, it is assumed that the first analysis agent module 210 is a module that is deeply learned in numerical analysis, and the second analysis agent module 220 is an agent optimized for a classification algorithm. can Each homomorphic-encrypted database can check the field and type through a tag, etc. Accordingly, the first analysis agent module 210 is responsible for analyzing customer age data, and the second analysis agent module 220 is a customer consumption item. You will be assigned an analysis of the data. Based on the distributed plan generated in this way, the first analysis agent module 210 and the second analysis agent module 220 may perform analysis. In this case, the analysis may use a data analysis algorithm such as a neural network. The first analysis agent module 210 accesses the customer age database and performs analysis within the black box algorithm in a homomorphic encryption state, and the second analysis agent module 220 accesses the customer consumption item database and enters the enterprise through a classification algorithm. Items can be classified based on the categories required by After each analysis of the first analysis agent module 210 and the second analysis agent module 220 is completed, the two analysis agent modules may perform a final operation based on each other's analysis results. When the operation is completed and combined data is generated, the corresponding data may be transmitted to the user device 100 . The user device 100 receives the combined data in the homomorphic encryption state, and the statistical data can be read by decrypting it with the secret key provided by the system. The transaction details between the user device 100 and the distributed analysis module 200 are recorded in a node of the block chain, and the selected miner can verify the node. The block chain node 'node1' records the profile information of Company A and the analysis system and summarized analysis information. Assuming that 'A' is selected as a miner through a lottery method, 'A' verifies 'node1' and may be compensated for. Since the data analysis content is simply recorded in the same way as a history, all clients can verify the transaction content, and through this, reliability can be secured in the present invention. In addition, as the above procedure is repeated, the level of analysis of the entire system can be proven.

도 8 및 9는 도 1의 데이터 분산처리 장치에 포함되는 분산분석 모듈에 포함되는 제어부의 동작을 설명하기 위한 도면들이다.8 and 9 are diagrams for explaining the operation of the control unit included in the ANOVA module included in the data distribution processing apparatus of FIG. 1 .

도 1 내지 9를 참조하면, 분산분석 모듈(200)은 복수의 분석 에이전트 모듈들의 각각을 제어하는 제어신호를 제공하는 제어부(250)을 포함할 수 있다. 제어부(250)는 제어신호 중 제1 제어신호(CS1)에 따라 동형암호화 된 제2 동형암호화 데이터(DA2)를 데이터 베이스(300)에 포함되는 복수의 저장 모듈들 로부터 분산분석 모듈(200)에 전달할 수 있다. 1 to 9 , the ANOVA module 200 may include a control unit 250 that provides a control signal for controlling each of a plurality of analysis agent modules. The control unit 250 transfers, from a plurality of storage modules included in the database 300, the second homogeneous encryption data DA2 homomorphically encrypted according to the first control signal CS1 to the ANOVA module 200 among the control signals. can transmit

예를 들어, 복수의 분석 에이전트 모듈들은 제1 분석 에이전트 모듈(210), 제2 분석 에이전트 모듈(220) 내지 제N 분석 에이전트 모듈(230)을 포함할 수 있고, 복수의 저장 모듈들은 제1 저장 모듈(310), 제2 저장 모듈(320) 내지 제N 저장 모듈(330)을 포함할 수 있다. 또한, 제어신호는 제1 제어신호(CS1) 및 제2 제어신호(CS2)를 포함할 수 있다. 제1 제어신호(CS1)는 복수의 분석 에이전트 모듈들 및 복수의 저장 모듈들 사이의 데이터 전달을 제어하기 위해 사용될 수 있고, 제2 제어신호(CS2)는 복수의 에이전트 모듈들 사이의 데이터 전달을 제어하기 위해 사용될 수 있다. For example, the plurality of analysis agent modules may include a first analysis agent module 210 , a second analysis agent module 220 to an Nth analysis agent module 230 , and the plurality of storage modules include a first storage The module 310 may include a second storage module 320 to an N-th storage module 330 . In addition, the control signal may include a first control signal CS1 and a second control signal CS2. The first control signal CS1 may be used to control data transfer between the plurality of analysis agent modules and the plurality of storage modules, and the second control signal CS2 controls data transfer between the plurality of agent modules. can be used to control.

예를 들어, 제어부(250)로부터 제공되는 제1 제어신호(CS1)에 기초하여 제2 분석 에이전트 모듈(220)은 제2 저장 모듈(320)로부터 제2 동형암호화 데이터(DA2)를 전달받을 수 있다. 또한, 제어부(250)로부터 제공되는 제1 제어신호(CS1)에 기초하여 제2 분석 에이전트 모듈(220)은 제2 저장 모듈(320)에 분석결과(AR)를 전달할 수도 있다.For example, based on the first control signal CS1 provided from the control unit 250, the second analysis agent module 220 may receive the second homomorphic encryption data DA2 from the second storage module 320. have. Also, based on the first control signal CS1 provided from the control unit 250 , the second analysis agent module 220 may transmit the analysis result AR to the second storage module 320 .

일 실시예에 있어서, 제어부(250)는 제어신호 중 제2 제어신호(CS2)에 따라 동형암호화 데이터(DA)를 복수의 분석 에이전트 모듈들 간에 전달할 수 있다. 예를 들어, 제어부(250)로부터 제공되는 제2 제어신호(CS2)에 기초하여 제2 분석 에이전트 모듈(220)은 제2 분석 에이전트 모듈(220)에서 분석한 동형암호화 데이터(DA)를 제1 분석 에이전트 모듈(210)에 제공할 수도 있다. In an embodiment, the control unit 250 may transmit the homomorphic encrypted data DA between the plurality of analysis agent modules according to the second control signal CS2 among the control signals. For example, based on the second control signal CS2 provided from the control unit 250, the second analysis agent module 220 transmits the homomorphic encryption data DA analyzed by the second analysis agent module 220 to the first It may be provided to the analysis agent module 210 .

도 10은 본 발명의 실시예들에 따른 데이터 분산처리 장치의 동작방법을 나타내는 순서도이다.10 is a flowchart illustrating a method of operating a data distribution processing apparatus according to embodiments of the present invention.

도 1 내지 10을 참조하면, 본 발명의 실시예에 따른 분산처리 장치의 동작방법에서는, 사용자 장치(100)가 사용자가 원하는 분석에 상응하는 분석요청 메시지(QM)를 제공할 수 있다(S100). 분산분석 모듈(200)이 분석요청 메시지(QM)에 따라 복수의 분석 에이전트 모듈들을 이용하여 동형암호화 된 데이터에 해당하는 동형암호화 데이터(DA)를 분석하여 분석결과(AR)를 제공할 수 있다(S200). 데이터 베이스(300)가 분석결과(AR)를 저장할 수 있다(S300).1 to 10 , in the operating method of the distributed processing apparatus according to the embodiment of the present invention, the user apparatus 100 may provide an analysis request message QM corresponding to the analysis desired by the user (S100). . The ANOVA module 200 may provide an analysis result (AR) by analyzing the homomorphic encryption data (DA) corresponding to the homomorphic encryption data using a plurality of analysis agent modules according to the analysis request message (QM) ( S200). The database 300 may store the analysis result AR (S300).

본 발명에 따른 데이터 분산처리 장치(10)의 동작방법에서는 분산분석 모듈(200)에 포함되는 복수의 분석 에이전트 모듈들을 이용하여 동형암호화 데이터(DA)를 연산 및 분석하여 분석결과(AR)를 제공하고, 분산분석 모듈(200)에서 발생하는 이벤트를 블록으로 생성하여 기록한 블록체인 모듈(400)을 이용하여 거래내역을 검증함으로써 동형암호화의 속도문제를 개선하고, 빅데이터의 신뢰성문제를 개선할 수 있다.In the operating method of the data distribution processing apparatus 10 according to the present invention, the analysis result (AR) is provided by calculating and analyzing the homomorphic encryption data (DA) using a plurality of analysis agent modules included in the distributed analysis module 200 . And, by verifying the transaction history using the block chain module 400 that generates and records events occurring in the distributed analysis module 200 as a block, the speed problem of homogeneous encryption can be improved, and the reliability problem of big data can be improved. have.

또한, 본 발명은 데이터의 생성, 거래 또는 분석 중에 데이터가 분실, 도난, 유출, 변조 또는 훼손되지 않도록 모든 데이터를 동형암호화 하여 저장하고, 실제 동형암호화 된 데이터를 분산 분석하여 데이터 베이스(300)에 저장함으로써 데이터의 기밀성과 보안성이 보장할 수 있다.In addition, the present invention homomorphically-encrypts all data so that data is not lost, stolen, leaked, tampered with or damaged during data generation, transaction or analysis, and is stored in the database 300 by distributing the actual homomorphic-encrypted data. By storing it, confidentiality and security of data can be guaranteed.

또한, 본 발명은 통계 데이터의 생성, 변경 또는 거래 등에 관련된 주요 정보를 블록체인에 저장하고 거래내역을 검증함으로써 통계 데이터의 투명성 및 보안성 및 신뢰성이 보장할 수 있다.In addition, the present invention can ensure the transparency, security and reliability of statistical data by storing key information related to the generation, change, or transaction of statistical data in the block chain and verifying the transaction details.

또한, 본 발명은 분산분석 모듈(200)을 활용해 기존 동형암호의 속도 문제를 보완하고 신속성을 보장할 수 있다. 본 발명에 따른 효과는 이상에서 예시된 내용에 의해 제한되지 않으며, 더욱 다양한 효과들이 본 명세서 내에 포함되어 있다.In addition, the present invention can supplement the speed problem of the existing homomorphic encryption by utilizing the ANOVA module 200 and ensure speed. The effect according to the present invention is not limited by the contents exemplified above, and more various effects are included in the present specification.

10: 데이터 분산처리 장치 100: 사용자 장치
200: 분산분석 모듈 300: 데이터 베이스 400: 블록체인 모듈
10: data distributed processing unit 100: user device
200: distributed analysis module 300: database 400: block chain module

Claims (14)

사용자가 원하는 분석에 상응하는 분석요청 메시지를 제공하는 사용자 장치;
상기 분석요청 메시지에 따라 복수의 분석 에이전트 모듈들을 이용하여 동형암호화 된 데이터에 해당하는 동형암호화 데이터를 분석하여 분석결과를 제공하는 분산분석 모듈; 및
상기 분석결과를 저장하는 데이터 베이스를 포함하고,
상기 분석요청 메시지는 상기 분석의 방식, 상기 분석의 대상이 되는 분석 데이터, 상기 분석을 요청한 상기 사용자의 정보를 포함하는 것을 특징으로 하는 데이터 분산처리 장치.
a user device providing an analysis request message corresponding to the analysis desired by the user;
a distributed analysis module that analyzes isomorphic-encrypted data corresponding to isomorphic-encrypted data using a plurality of analysis agent modules according to the analysis request message and provides an analysis result; and
It includes a database for storing the analysis result,
The analysis request message is a data distribution processing apparatus, characterized in that it includes the analysis method, the analysis data to be analyzed, and the information of the user who requested the analysis.
제1항에 있어서,
상기 사용자 장치는 상기 데이터 중 사용자 장치 데이터를 동형암호화 한 제1 동형암호화 데이터를 상기 동형암호화 데이터로 상기 분산분석 모듈에 제공하는 것을 특징으로 하는 데이터 분산처리 장치.
According to claim 1,
and the user device provides first isomorphic encrypted data obtained by homomorphically encrypted user device data among the data to the ANOVA module as the isomorphic encrypted data.
제2항에 있어서,
상기 사용자 장치가 상기 제1 동형암호화 데이터를 제공하면서 상기 분석요청 메시지를 제공하는 경우, 상기 제1 동형암호화 데이터는 상기 데이터 분산처리 장치에서 생성되는 공개키를 사용하여 동형암호화 되는 것을 특징으로 하는 데이터 분산처리 장치.
3. The method of claim 2,
When the user device provides the analysis request message while providing the first isomorphic encrypted data, the first isomorphic encrypted data is homomorphically encrypted using a public key generated by the data distribution processing device. Distributed processing unit.
삭제delete 제3항에 있어서,
상기 분석요청 메시지는 상기 동형암호화 데이터의 단순 결합을 요청하는 제1 요청 메시지 및 상기 동형암호화 데이터를 분석한 통계에 해당하는 비식별화 된 통계 데이터를 요청하는 제2 요청 메시지 중 하나를 포함하는 것을 특징으로 하는 데이터 분산처리 장치.
4. The method of claim 3,
The analysis request message includes one of a first request message for requesting simple combination of the homomorphic encryption data and a second request message for requesting de-identified statistical data corresponding to statistics analyzed by analyzing the homomorphic encryption data Distributed data processing device, characterized.
제1항에 있어서,
상기 데이터 베이스는 상기 데이터 베이스에 동형암호화 되어 저장되는 제2 동형암호화 데이터를 상기 분산분석 모듈에 제공하는 것을 특징으로 하는 데이터 분산처리 장치.
According to claim 1,
The data distribution processing apparatus, characterized in that the database provides the second homomorphic encrypted data stored in the database homomorphically encrypted to the ANOVA module.
제6항에 있어서,
상기 데이터 베이스에 포함되는 복수의 저장 모듈들의 각각은,
상기 분산분석 모듈에 포함되는 복수의 분석 에이전트 모듈들의 각각에 상응하는 것을 특징으로 하는 데이터 분산처리 장치.
7. The method of claim 6,
Each of the plurality of storage modules included in the database,
Data distributed processing apparatus, characterized in that it corresponds to each of the plurality of analysis agent modules included in the distributed analysis module.
제7항에 있어서,
상기 복수의 분석 에이전트 모듈들의 각각은 복수의 분야들의 각각을 인공지능 학습하는 것을 특징으로 하는 데이터 분산처리 장치.
8. The method of claim 7,
Each of the plurality of analysis agent modules is a data distributed processing apparatus, characterized in that the artificial intelligence learning each of a plurality of fields.
제1항에 있어서,
상기 데이터 분산처리 장치는,
상기 사용자 장치 및 상기 분산분석 모듈에서 발생하는 이벤트를 블록으로 생성하여 기록하는 블록체인 모듈을 더 포함하는 것을 특징으로 하는 데이터 분산처리 장치.
According to claim 1,
The data distribution processing device,
The data distribution processing apparatus according to claim 1, further comprising a block chain module for generating and recording events occurring in the user device and the distributed analysis module in blocks.
제9항에 있어서,
상기 블록에 기록되는 내용에 대한 검증작업이 완료되는 경우, 상기 검증작업에 참여한 클라이언트들에게 암호화폐가 보상으로 지급되는 것을 특징으로 하는 데이터 분산처리 장치.
10. The method of claim 9,
When the verification operation for the contents recorded in the block is completed, cryptocurrency is paid as a reward to the clients participating in the verification operation.
제1항에 있어서,
상기 분산분석 모듈은,
상기 복수의 분석 에이전트 모듈들의 각각을 제어하는 제어신호를 제공하는 제어부를 포함하는 것을 특징으로 하는 데이터 분산처리 장치.
According to claim 1,
The ANOVA module is
and a control unit for providing a control signal for controlling each of the plurality of analysis agent modules.
제11항에 있어서,
상기 제어부는,
상기 제어신호 중 제1 제어신호에 따라 동형암호화 된 제2 동형암호화 데이터를 상기 데이터 베이스에 포함되는 복수의 저장 모듈들 로부터 상기 분산분석 모듈에 전달하는 것을 특징으로 하는 데이터 분산처리 장치.
12. The method of claim 11,
The control unit is
The apparatus for distributing data, characterized in that, from a plurality of storage modules included in the database to the ANOVA module, the second homomorphic encryption data homomorphically encrypted according to a first control signal among the control signals.
제12항에 있어서,
상기 제어부는,
상기 제어신호 중 제2 제어신호에 따라 상기 동형암호화 데이터를 상기 복수의 분석 에이전트 모듈들 간에 전달하는 것을 특징으로 하는 데이터 분산처리 장치.
13. The method of claim 12,
The control unit is
The apparatus for distributing data, characterized in that it transfers the homomorphic encryption data between the plurality of analysis agent modules according to a second control signal among the control signals.
삭제delete
KR1020210073666A 2021-06-07 2021-06-07 Distributed processing device and operating method thereof KR102437715B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020210073666A KR102437715B1 (en) 2021-06-07 2021-06-07 Distributed processing device and operating method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210073666A KR102437715B1 (en) 2021-06-07 2021-06-07 Distributed processing device and operating method thereof

Publications (1)

Publication Number Publication Date
KR102437715B1 true KR102437715B1 (en) 2022-08-26

Family

ID=83113284

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210073666A KR102437715B1 (en) 2021-06-07 2021-06-07 Distributed processing device and operating method thereof

Country Status (1)

Country Link
KR (1) KR102437715B1 (en)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101600016B1 (en) 2014-12-10 2016-03-15 서울대학교기술지주 주식회사 method of encrypting data using Homomorphic Encryption and Computing device performing the method
KR20190117286A (en) * 2018-04-06 2019-10-16 서울대학교산학협력단 User device and electronic device for sharing data based on block chain and homomorphic encryption technology and methods thereof
US20200311300A1 (en) * 2019-03-26 2020-10-01 The Regents Of The University Of California Distributed privacy-preserving computing on protected data
WO2021007047A1 (en) * 2019-07-08 2021-01-14 Tencent America LLC Distributed and collaborative analytics of encrypted data using deep polynomial networks

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101600016B1 (en) 2014-12-10 2016-03-15 서울대학교기술지주 주식회사 method of encrypting data using Homomorphic Encryption and Computing device performing the method
KR20190117286A (en) * 2018-04-06 2019-10-16 서울대학교산학협력단 User device and electronic device for sharing data based on block chain and homomorphic encryption technology and methods thereof
US20200311300A1 (en) * 2019-03-26 2020-10-01 The Regents Of The University Of California Distributed privacy-preserving computing on protected data
WO2021007047A1 (en) * 2019-07-08 2021-01-14 Tencent America LLC Distributed and collaborative analytics of encrypted data using deep polynomial networks

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
천정희 외 2인, ‘개인정보가 보호되는 동형암호기반 금융데이터분석’, 금융정보연구 2018, vol.7, no.1, pp.33-60.* *

Similar Documents

Publication Publication Date Title
CN108830601B (en) Smart city information safe use method and system based on block chain
US11632238B2 (en) Traceability of edits to digital documents via distributed ledgers
CN109417478A (en) Multilink cryptologic block chain
CN108389059A (en) Digital copyrighted work protection, transaction and distributing method based on ownership and system
US9712327B1 (en) System and method for remote storage auditing
CN111666460A (en) User portrait generation method and device based on privacy protection and storage medium
CN111274599A (en) Data sharing method based on block chain and related device
CN109428892A (en) Multistage rewritable block chain
CN111339201B (en) Evaluation method and system based on block chain
US20220337392A1 (en) Automatic digital media authenticator
US20230254299A1 (en) Apparatus and methods for credentialing users across user devices
Weng et al. Golden grain: Building a secure and decentralized model marketplace for MLaaS
CN103973698A (en) User access right revoking method in cloud storage environment
Li Combination of blockchain and AI for music intellectual property protection
KR102014647B1 (en) Electronic voting method based on blockchain
Fragkos et al. Enhancing privacy in PUF-cash through multiple trusted third parties and reinforcement learning
US20230254148A1 (en) Apparatus and methods for selectively revealing data
KR102437715B1 (en) Distributed processing device and operating method thereof
CN116432193A (en) Financial database data protection transformation method and financial data protection system thereof
WO2020112104A1 (en) Blockchain-based accountable data publishing and usage
CN116361823A (en) Selective audit processing of blockchains for privacy protection
CN112883425B (en) Block chain-based data processing method and block chain link point
Wang et al. Blockchain-Enabled Lightweight Fine-Grained Searchable Knowledge Sharing for Intelligent IoT
CN110445756B (en) Method for realizing searchable encryption audit logs in cloud storage
Patel et al. An approach to analyze data corruption and identify misbehaving server

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant