KR102092617B1 - 단방향 데이터 변환을 이용한 프라이버시 보장형 기계 학습 방법 - Google Patents

단방향 데이터 변환을 이용한 프라이버시 보장형 기계 학습 방법 Download PDF

Info

Publication number
KR102092617B1
KR102092617B1 KR1020180078104A KR20180078104A KR102092617B1 KR 102092617 B1 KR102092617 B1 KR 102092617B1 KR 1020180078104 A KR1020180078104 A KR 1020180078104A KR 20180078104 A KR20180078104 A KR 20180078104A KR 102092617 B1 KR102092617 B1 KR 102092617B1
Authority
KR
South Korea
Prior art keywords
data
machine learning
client
service
transform
Prior art date
Application number
KR1020180078104A
Other languages
English (en)
Other versions
KR20200005003A (ko
Inventor
이문규
권희용
Original Assignee
인하대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 인하대학교 산학협력단 filed Critical 인하대학교 산학협력단
Priority to KR1020180078104A priority Critical patent/KR102092617B1/ko
Publication of KR20200005003A publication Critical patent/KR20200005003A/ko
Application granted granted Critical
Publication of KR102092617B1 publication Critical patent/KR102092617B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Medical Informatics (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Bioethics (AREA)
  • Mathematical Physics (AREA)
  • Databases & Information Systems (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

일 실시예에 따른 서버에서 수행되는 프라이버시 보장형 기계 학습 방법은, 클라이언트로부터 전달받은 변환 데이터에 대한 기계 학습을 수행하는 단계; 상기 클라이언트로부터 서비스의 요청을 수신하는 단계; 및 상기 수신된 서비스의 요청과 관련된 서비스 데이터를 상기 기계 학습에 기반하여 분류한 분류 결과를 제공하는 단계를 포함할 수 있다.

Description

단방향 데이터 변환을 이용한 프라이버시 보장형 기계 학습 방법{PRIVACY-PRESERVING MACHINE LEARNING METHOD USING ONE-WAY DATA TRANSFORMATION}
아래의 설명은 기계 학습 기술에 관한 것으로, 단방향 데이터 변환을 이용한 프라이버시 보장형 기계 학습 방법에 관한 것이다.
기계 학습 기술의 발전과 더불어 기존에 존재하던 다양한 분야의 어플리케이션들에 기계 학습 기술이 적용되기 시작하였다. 기계 학습 기술이 적용됨에 따라 기존의 기술보다 더 좋은 효과를 보이는 어플리케이션들이 다수 등장하였고, 이에 기계 학습은 다양한 분야의 연구에 적용되며 중요한 기술로 평가되고 있다.
기계 학습은 회귀, 분류, 예측 등을 필요로 하는 어플리케이션들에 적용될 수 있다. 이를 위해, 기계 학습은 어플리케이션의 다양한 입력들을 바탕으로 해결하고자 하는 문제의 모델을 학습시키고, 학습된 모델은 새로운 입력에 대응하는 출력을 제공하는 형식으로 동작한다.
기계 학습 모델의 한 예시로, 클라이언트의 데이터를 바탕으로 원격 서버에서 기계 학습을 수행하고 원격 서비스를 제공하는 모델을 고려할 수 있다. 이러한 기계 학습 모델에서는, 서버가 악의적인 동작을 수행할 경우 클라이언트의 프라이버시를 침해하는 문제가 발생할 수 있다. 예를 들어 클라이언트가 스마트 미터를 보유한 일반 주택이고, 서버가 클라이언트의 미터로부터 측정되어 전송된 과거 전력 사용 패턴을 기반으로 향후의 전력 사용량을 예측하기 위한 기계 학습 서비스를 제공하는 사례를 고려해 보면, 서버는 클라이언트가 제공하는 전력 사용 패턴을 분석하여 현재 주택에 거주자가 상주하고 있는지, 거주자가 어떤 가전제품을 사용하고 있는지 등의 정보를 획득할 수 있다. 다양한 연구들에 의해 여러가지 문제가 존재할 수 있음이 입증되었으며, 이러한 위협을 방지하기 위해 클라이언트의 프라이버시를 보장하며, 서버에서의 기계 학습을 수행하는 방법들이 연구되고 있다.
참고자료: 비특허문헌 1< Ratha, N. K., Chikkerur, S., Connell, J. H., & Bolle, R. M. (2007). Generating cancelable fingerprint templates. IEEE Transactions on pattern analysis and machine intelligence, 29(4), 561-572.>,
비특허문헌 2 <Hartigan, John A., and Manchek A. Wong. "Algorithm AS 136: A k-means clustering algorithm." Journal of the Royal Statistical Society. Series C (Applied Statistics) 28.1 (1979): 100-108.>
비특허문헌 3 <Shin, S. W., Lee, M. K., Moon, D., & Moon, K. (2009). Dictionary Attack on Functional Transform-Based Cancelable Fingerprint Templates. ETRI journal, 31(5), 628-630.>,
비특허문헌 4 <Alvarez, F. M., Troncoso, A., Riquelme, J. C., & Ruiz, J. S. A. (2011). Energy time series forecasting based on pattern sequence similarity. IEEE Transactions on Knowledge and Data Engineering, 23(8), 1230-1243.>
단방향 데이터 변환을 이용한 프라이버시 보장형 기계 학습 방법 및 서버를 제공할 수 있다.
클라이언트의 데이터를 보호하는 동시에 기계 학습을 기반으로 유용한 서비스를 제공하는 방법을 제시한다.
서버에서 수행되는 프라이버시 보장형 기계 학습 방법은, 클라이언트로부터 전달받은 변환 데이터(D)에 대한 기계 학습을 수행하는 단계; 상기 클라이언트로부터 서비스의 요청을 수신하는 단계; 및 상기 수신된 서비스의 요청과 관련된 서비스 데이터(s')를 상기 기계 학습에 기반하여 분류한 분류 결과를 제공하는 단계를 포함할 수 있다.
상기 클라이언트는, 변환 함수(F)에 상기 원본 데이터(d)와 변환 파라미터(p)를 사용하여 변환 데이터(D)를 생성하는 것을 포함하고, 상기 클라이언트로부터 전달받은 변환 데이터에 대한 기계 학습을 수행하는 단계는, 상기 클라이언트에서 원본 데이터(d)에 대한 변환이 수행됨에 따라 변환 데이터(D)가 생성되고, 상기 생성된 변환 데이터(D)가 전달됨을 수신하여 기계 학습을 수행하는 단계를 포함할 수 있다.
상기 클라이언트로부터 전달받은 변환 데이터에 대한 기계 학습을 수행하는 단계는, 원본 데이터(d)를 대신하여 상기 변환 데이터(D)에 대한 기계 학습을 수행하는 단계를 포함할 수 있다. 상기 기계 학습의 일례로, k-means 클러스터링 또는 인공신경망을 기반으로 구축한 기계 학습 기술인 딥 러닝을 수행할 수 있다.
상기 클라이언트에서 수행하는 데이터 변환은, 상기 원본 데이터(d)에 특정 파라미터(p)를 사용하여 데이터의 위치, 방향 또는 크기 중 적어도 하나 이상을 변환하는 변환 함수가 사용되는 것을 포함한다.
상기 클라이언트로부터 서비스의 요청을 수신하는 단계는, 상기 클라이언트에서 상기 서비스를 위한 원본 서비스 데이터(s)에 변환 함수(F)를 사용하여 또 다른 변환 데이터(s')가 생성되고, 상기 생성된 또 다른 변환 데이터(s')가 전달됨을 수신하는 단계를 포함할 수 있다.
상기 수신된 서비스의 요청과 관련된 서비스 데이터를 상기 기계 학습에 기반하여 분류한 분류 결과를 제공하는 단계는, 상기 클라이언트로부터 수신된 상기 서비스의 요청과 관련된 원본 서비스 데이터(s)를 변환한 또 다른 변환 데이터(s')를 상기 기계 학습에 기반하여 분류함에 따라 획득된 분류 결과를 상기 클라이언트에게 전달하는 단계를 포함할 수 있다.
프라이버시 보장형 기계 학습을 위한 서버는, 클라이언트로부터 전달받은 변환 데이터(D)에 대한 기계 학습을 수행하는 학습부; 상기 클라이언트로부터 서비스의 요청을 수신하는 수신부; 및 상기 수신된 서비스의 요청과 관련된 서비스 데이터(s')를 상기 기계 학습에 기반하여 분류한 분류 결과를 제공하는 제공부를 포함할 수 있다.
본 발명은 사전 공격의 위협으로부터 안전하고 클라이언트의 원본 데이터를 보호하며 서버에서 원격 기계 학습을 수행할 수 있는 프라이버시 보장형 기계 학습이 가능하다.
도 1은 일 실시예에 따른 프라이버시 보장형 기계 학습 모델을 설명하기 위한 도면이다.
도 2는 일 실시예에 따른 서버의 구성을 설명하기 위한 도면이다.
도 3은 일 실시예에 따른 프라이버시 보장형 기계 학습 프로토콜을 설명하기 위한 도면이다.
이하, 실시예를 첨부한 도면을 참조하여 상세히 설명한다.
도 1은 일 실시예에 따른 프라이버시 보장형 기계 학습 모델을 설명하기 위한 도면이다.
서버(100)는 클라이언트와 네트워크를 통해 통신하여 명령, 코드, 파일, 컨텐츠, 서비스 등을 제공하는 컴퓨터 장치 또는 복수의 컴퓨터 장치들로 구현될 수 있다. 일례로, 서버(100)는 클라우드 서버일 수 있으며, 데이터를 인터넷과 연결된 중앙컴퓨터에 저장하여 인터넷에 접속하기만 하면 언제 어디서든 데이터를 이용할 수 있도록 클라우드 서비스를 제공할 수 있다.
클라이언트(110)는 컴퓨터 장치로 구현되는 고정형 단말이거나 이동형 단말일 수 있다. 클라이언트(110)의 예를 들면, 스마트폰(smart phone), 휴대폰, 네비게이션, 컴퓨터, 노트북, 디지털방송용 단말, PDA(Personal Digital Assistants), PMP(Portable Multimedia Player), 태블릿 PC, 스마트 미터 등이 있다. 일례로 클라이언트(110)는 무선 또는 유선 통신 방식을 이용하여 네트워크를 통해 다른 전자 기기들 및/또는 서버(100)와 통신할 수 있다.
도 1은 프라이버시 보장형 기계 학습을 위한 기계 학습 모델을 나타낸 것이다. 실시예에서 제공하는 기계 학습은, 알려진 데이터들을 기반으로 어느 부류(class)에 속하는지를 학습(training) 후, 추후 입력 데이터에 대해 어느 부류인지를 분류(classification)하는 서비스에 적용된다. 도 1의 기계 학습 모델에서 클라이언트가 원본 데이터를 보호하며 서버에서의 기계 학습을 수행하기 위한 순서는 다음과 같다.
먼저, 클라이언트는 다음의 제약 조건을 만족하는 함수를 설정할 수 있다.
1. 원본 데이터에서 작은 변화가 변환 후의 데이터의 작은 변화로 나타나도록 보장하기 위해 지역적으로 부드러워야 한다(Locally smooth).
2. ①에 의해 지역적으로 부드럽지만, 전역적으로 부드럽지 않아야 한다(Globally not smooth).
3. ①, ②의 제약 조건을 만족하며 원본 데이터에서 변환된 변환 데이터로부터 원본 데이터를 복원하는 것이 불가능하도록 다-대-일(many-to-one)이어야 한다. 다시 말해서, 비가역적(noninvertible)이다.
이러한 제약 조건을 만족하는 함수(이하, 변환 함수로 기재하기로 함)를 F라 할 때, 학습(training) 과정에서 클라이언트는 변환 함수 F에 클라이언트의 원본 데이터 d와 변환 파라미터 p를 사용하여,
D=F(d, p)
로 변환된 변환 데이터 D를 도출하고, 도출된 변환 데이터 D를 서버로 전달할 수 있다. 기계 학습이 완료된 후, 클라이언트는 분류(classification) 서비스를 받고자 하는 서비스 데이터에 대한 변환을 수행할 수 있다. 구체적으로, 클라이언트는 서비스를 위한 원본 서비스 데이터s를 변환 함수 F를 이용하여 또 다른 변환 데이터 s' 로 변환하고, 변환된 또 다른 변환 데이터 s'를 서버에게 전달할 수 있다. 서버는 또 다른 변환 데이터 s'에 대한 분류 결과 r을 클라이언트에게 전달할 수 있다. 이러한 과정을 도 3의 여섯 단계로 표현할 수 있으며, 이에 대한 설명은 도 3에서 상세하게 설명하기로 한다.
도 2는 일 실시예에 따른 서버의 구성을 설명하기 위한 도면이다.
서버(100)의 프로세서는 학습부(210), 수신부(220) 및 제공부(230)를 포함할 수 있다. 이러한 프로세서의 구성요소들은 서버에 저장된 프로그램 코드가 제공하는 제어 명령에 따라 프로세서에 의해 수행되는 서로 다른 기능들(different functions)의 표현들일 수 있다. 이때, 프로세서 및 프로세서의 구성요소들은 메모리가 포함하는 운영체제의 코드와 적어도 하나의 프로그램의 코드에 따른 명령(instruction)을 실행하도록 구현될 수 있다.
학습부(210)는 클라이언트로부터 전달받은 변환 데이터에 대한 기계 학습을 수행할 수 있다. 학습부(210)는 클라이언트에서 원본 데이터(d)에 대한 변환이 수행됨에 따라 변환 데이터(D)가 생성되고, 생성된 변환 데이터(D)가 전달됨을 수신하여 기계 학습을 수행할 수 있다. 학습부(210)는 변환 데이터에 대한 기계 학습을 수행할 수 있으며, 일례로 k-means 클러스터링 또는 인공 신경망을 기반으로 구축한 기계 학습 기술인 딥 러닝을 수행할 수 있다.
수신부(220)는 클라이언트로부터 서비스의 요청을 수신할 수 있다. 수신부(220)는 클라이언트에서 분류 서비스를 위한 원본 서비스 데이터(s)에 변환 함수(F)를 사용하여 또 다른 변환 데이터(s')가 생성되고, 생성된 또 다른 변환 데이터(s')가 전달됨을 수신할 수 있다.
제공부(230)는 수신된 서비스의 요청과 관련된 서비스 데이터를 기계 학습에 기반하여 분류한 분류 결과를 제공할 수 있다. 제공부(230)는 클라이언트로부터 수신된 서비스의 요청과 관련된 원본 서비스 데이터(s)를 변환한 또 다른 변환 데이터(s')를 기계 학습에 기반하여 분류한 분류 결과를 제공할 수 있다.
도 3은 일 실시예에 따른 프라이버시 보장형 기계 학습 프로토콜을 설명하기 위한 도면이다.
클라이언트(110)와 서버(100) 사이의 동작을 통하여 프라이버시 보장형 기계 학습 프로토콜을 설명하기로 한다. 프라이버시 보장형 기계 학습 프로토콜은 Setup 단계(310), Transform 단계(320), Transfer 단계(330), Training 단계(340), Request 단계(350), Response 단계(360)를 포함할 수 있다.
단계(310)에서 클라이언트(110)는 변환 함수(F)에 사용될 파라미터(p)를 생성할 수 있다. 단계(320)에서 클라이언트는 변환 함수(F)에 파라미터(p)를 사용하여 원본 데이터(d)를 변환 데이터(D)로 변환할 수 있다. 이때, 원본 데이터를 변형하는 변형 함수(F)의 예로, 비특허문헌 1<Ratha, N. K., Chikkerur, S., Connell, J. H., & Bolle, R. M. (2007). Generating cancelable fingerprint templates. IEEE Transactions on pattern analysis and machine intelligence, 29(4), 561-572.>에서 소개된 변환 함수를 사용할 수 있다. 상기 비특허문헌 1에서는 취소 가능한 지문 템플릿 생성을 위하여 원본 지문 데이터(예를 들면, 지문의 특징점들의 좌표 및 방향 벡터)에 특정 파라미터를 사용하여 위치 및 방향을 변환하는 변환 함수가 소개된 바 있다. 본 발명에서 제안하는 변환 방법은 상기 비특허문헌 1의 데이터 변환 함수를 변형한 것으로, 원본 데이터 d의 위치 및 방향 또는 크기 중 적어도 하나 이상을 변환하는 다음과 같은 함수를 사용할 수 있다.
D=F(d, p)
이때, p는 변환에 사용되는 파라미터, F는 변환 함수를 의미한다.
단계(330)에서 클라이언트는 변환 데이터(D)를 서버(100)로 전달할 수 있다. 서버(100)는 클라이언트(110)로부터 전달받은 변환 데이터(D)를 수신할 수 있다. 단계(340)에서 서버(100)는 클라이언트(110)로부터 전달받은 변환 데이터(D)를 사용하여 기계 학습을 수행할 수 있다. 기계 학습은 인공지능의 한 분야로 새로운 정보를 학습하고, 학습을 수행함에 따라 습득된 정보를 효율적으로 사용할 수 있는 능력과 결부시키는 지식을 습득할 수 있고, 작업을 반복적으로 수행함으로써 결과를 획득하는 기술의 개선 과정이다. 상기의 변환 데이터를 사용한 기계 학습은 서비스(예를 들면, 분류 서비스)를 위한 임의의 기계 학습 방법에 적용될 수 있다. 일례로, 비특허문헌 2 <Hartigan, John A., and Manchek A. Wong. "Algorithm AS 136: A k-means clustering algorithm." Journal of the Royal Statistical Society. Series C (Applied Statistics) 28.1 (1979): 100-108.>는 k-means 클러스터링에 관한 것이다. 실시예에 따른 단방향 데이터 변환을 이용한 프라이버시 보장형 기계 학습이 k-means 클러스터링에 적용됨으로써, 서버(100)는 원본 데이터(d)에 대한 클러스터링을 수행하는 대신, 변환 데이터(D)에 대하여 클러스터링을 수행할 수 있다. 이를 통하여 k-means 클러스터링을 사용하여 변환 데이터(D)에 대한 기계 학습을 수행할 수 있다. 예를 들면, 비특허문헌 4 <Alvarez, F. M., Troncoso, A., Riquelme, J. C., & Ruiz, J. S. A. (2011). Energy time series forecasting based on pattern sequence similarity. IEEE Transactions on Knowledge and Data Engineering, 23(8), 1230-1243.에서 제안된 패턴 시퀀스 기반 예측 방법(Pattern Sequence-based Forecasting: PSF)>과 같이 k-means 클러스터링을 사용하는 다양한 어플리케이션들에서 클라이언트의 데이터를 보호하며 기계 학습을 수행할 수 있다.
상기의 변환 데이터를 사용한 기계 학습의 또 다른 일례로, 서버(100)는 컴퓨터가 여러 데이터를 이용하여 마치 사람처럼 스스로 학습할 수 있게 하기 위하여 인공신경망을 기반으로 구축한 기계 학습 기술인 딥 러닝을 수행할 수 있다. 이러한 딥 러닝은 인간의 두뇌가 수많은 데이터 속에서 패턴을 발견한 뒤 사물을 구분하는 정보처리 방식을 모방하여 컴퓨터가 사물을 분별할 수 있도록 기계 학습을 시킨다. 딥 러닝 기술을 적용하여 사람이 모든 판단 기준을 정해주지 않아도 컴퓨터가 스스로 인지, 추론 및 판단할 수 있게 된다. 이에, 서버(100)는 딥 러닝의 예로 CNN, RNN 등의 인공신경망을 이용하여 기계 학습을 수행할 수 있으며, 원본 데이터(d)에 대한 딥 러닝을 수행하는 대신, 클라이언트(110)로부터 전달받은 변환 데이터(D)를 사용하여 딥 러닝을 수행할 수 있다.
단계(350)에서 클라이언트(110)는 분류 서비스를 받고자 하는 서비스 데이터(s')를 서버(100)에게 전달할 수 있다. 구체적으로, 클라이언트는 분류 서비스를 위한 원본 서비스 데이터(s)를 변환함에 따라 생성된 또 다른 변환 데이터(s')를 서버(100)에게 전달할 수 있다. 여기서, 서비스 데이터(s')는 원본 서비스 데이터(s)를 변환한 또 다른 변환 데이터(s')를 의미한다. 서비스 데이터가 전달됨에 따라 서버(100)는 클라이언트(110)로부터 또 다른 변환 데이터(s')를 수신할 수 있다.
단계(360)에서 서버(100)는 클라이언트(110)로부터 수신된 서비스의 요청과 관련된 서비스 데이터(s')를 기계 학습에 기반하여 분류한 분류 결과를 클라이언트(110)에게 전달할 수 있다. 이 때, 서버(100)는 단방향 데이터 변환을 이용한 프라이버시 보장형 기계 학습 모델을 구성할 수 있다. 예를 들면, 서버(100)는 클라이언트(110)로부터 수신된 서비스 데이터(s')를 기계 학습을 통하여 클러스터링을 수행함에 따른 클러스터링 결과와 비교함으로써 분류 결과(r)를 도출할 수 있다. 또는, 서버(100)는 서비스 데이터(s')를 기계 학습시킴으로써 분류 결과(r)를 도출할 수 있다.
상기 변환 데이터를 사용한 딥 러닝의 일례로, 전력 시스템의 이상 유무 탐지를 고려할 수 있다. 예를 들어, 원본 데이터 d가 전력 시스템의 전력 패턴일 때 전력 시스템은 단계(320)에서 원본 데이터 d를 변환된 변환 데이터 D로 변환할 수 있다. 다음으로 변환된 변환 데이터들은 단계(330)에서 서버로 전달되고 서버는 이를 수신함에 따라 단계(340)에서 딥 러닝을 수행하여, 전력 시스템의 이상 상태를 탐지하는 모델을 학습할 수 있다. 이 후, 단계(350)에서 전력 시스템은 현재 시스템의 상태s를 변환 함수를 사용하여 s'으로 변환한 후 서버로 전달할 수 있다. 마지막으로 단계(360)에서는 단계(340)에서 학습된 모델에 대하여 수신된 변환된 서비스 데이터s'에 따라 분류된 현재 전력 시스템의 상태를 전력 시스템으로 전달할 수 있다.
실시예에서 제안하는 원본 데이터를 변환하는 방법은 변환 함수의 비가역적인 성질에 의존한다. 다시 말해서, 악의적인 서버 또는 공격자가 클라이언트의 변환된 학습 데이터를 획득하더라도, 클라이언트의 원본 데이터가 아닌 변환된 데이터이므로 클라이언트의 민감한 정보를 알아내는 데 도움이 되지 않는다.
한편, 비특허문헌 3<Shin, S. W., Lee, M. K., Moon, D., & Moon, K. (2009). Dictionary Attack on Functional Transform-Based Cancelable Fingerprint Templates. ETRI journal, 31(5), 628-630.>에 의하면, 악의적인 공격자가 변환 방법에 사용된 클라이언트의 변환 파라미터(p)와 변환 데이터(D) 모두를 획득한 경우, 일종의 사전 공격(dictionary attack)을 수행할 수 있다. 즉, 변환식 D=F(d, p)에서 파라미터(p)를 고정하고 가능성 높은 원본 데이터(d)들을 순차적으로 대입하여 변환 데이터(D)가 도출될 경우 원본 데이터(d)임을 알아내는 방식이다. 이를 통하여 비특허문헌 1의 데이터 변환 방법도 공격된 사례가 있으나, 실시예에서 제안하는 기계 학습 모델에서는 사전 공격이 적용되지 않는다. 클라이언트는 변환 파라미터(p)를 사용하여 원본 데이터(d)를 변환하고, 서버는 변환 데이터(D)만을 가지고 기계 학습을 수행하므로, 공격자가 클라이언트와 서버를 동시에 공격하지 않는 한 변환 파라미터(p)와 변환 데이터(D) 가 동시에 알려지지는 않으므로 사전 공격을 수행할 수 없어 상기 위협으로부터 안전하다.
이에 따라 본 발명은 사전 공격의 위협으로부터 안전하고 클라이언트의 원본 데이터를 보호하며 서버에서 원격 기계 학습을 수행할 수 있는 프라이버시 보장형 기계 학습이 가능하게 된다.
이상에서 설명된 장치는 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPGA(field programmable gate array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 애플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.
소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치에 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.
실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다.
이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.
그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.

Claims (8)

  1. 서버에서 수행되는 프라이버시 보장형 기계 학습 방법에 있어서,
    클라이언트로부터 전달받은 변환 데이터(D)에 대한 기계 학습을 수행하는 단계;
    상기 클라이언트로부터 서비스의 요청을 수신하는 단계; 및
    상기 수신된 서비스의 요청과 관련된 서비스 데이터(s')를 상기 기계 학습에 기반하여 분류한 분류 결과를 제공하는 단계
    를 포함하고,
    상기 클라이언트는, 변환 함수(F)에 원본 데이터(d)와 변환 파라미터(p)를 사용하여 변환 데이터(D)를 생성하는
    것을 포함하고,
    상기 클라이언트로부터 전달받은 변환 데이터에 대한 기계 학습을 수행하는 단계는,
    상기 클라이언트에서 원본 데이터(d)에 대한 변환이 수행됨에 따라 변환 데이터(D)가 생성되고, 상기 생성된 변환 데이터(D)가 전달됨을 수신하여 기계 학습을 수행하는 단계
    를 포함하는 기계 학습 방법.
  2. 삭제
  3. 제1항에 있어서,
    상기 클라이언트로부터 전달받은 변환 데이터에 대한 기계 학습을 수행하는 단계는,
    상기 변환 데이터(D)에 대한 k-means 클러스터링을 수행하는 단계
    를 포함하는 기계 학습 방법.
  4. 제1항에 있어서,
    상기 클라이언트로부터 전달받은 변환 데이터에 대한 기계 학습을 수행하는 단계는,
    상기 변환 데이터(D)에 대한 딥 러닝을 수행하는 단계
    를 포함하는 기계 학습 방법.
  5. 제1항에 있어서,
    상기 클라이언트는,
    상기 원본 데이터(d)에 변환 함수에 사용하기 위하여 생성된 파라미터를 사용하여 위치, 방향 또는 크기 중 적어도 하나 이상을 변환하는 변환 함수가 사용되는 것을 포함하는 기계 학습 방법.
  6. 서버에서 수행되는 프라이버시 보장형 기계 학습 방법에 있어서,
    클라이언트로부터 전달받은 변환 데이터(D)에 대한 기계 학습을 수행하는 단계;
    상기 클라이언트로부터 서비스의 요청을 수신하는 단계; 및
    상기 수신된 서비스의 요청과 관련된 서비스 데이터(s')를 상기 기계 학습에 기반하여 분류한 분류 결과를 제공하는 단계
    를 포함하고,
    상기 클라이언트로부터 서비스의 요청을 수신하는 단계는,
    상기 클라이언트에서 상기 서비스를 위한 원본 서비스 데이터(s)에 변환 함수(F)를 사용하여 또 다른 변환 데이터(s')가 생성되고, 상기 생성된 또 다른 변환 데이터(s')가 전달됨을 수신하는 단계
    를 포함하는 기계 학습 방법.
  7. 서버에서 수행되는 프라이버시 보장형 기계 학습 방법에 있어서,
    클라이언트로부터 전달받은 변환 데이터(D)에 대한 기계 학습을 수행하는 단계;
    상기 클라이언트로부터 서비스의 요청을 수신하는 단계; 및
    상기 수신된 서비스의 요청과 관련된 서비스 데이터(s')를 상기 기계 학습에 기반하여 분류한 분류 결과를 제공하는 단계
    를 포함하고,
    상기 수신된 서비스의 요청과 관련된 서비스 데이터를 상기 기계 학습에 기반하여 분류한 분류 결과를 제공하는 단계는,
    상기 클라이언트로부터 수신된 상기 서비스의 요청과 관련된 원본 서비스 데이터(s)를 변환한 또 다른 변환 데이터(s')를 상기 기계 학습에 기반하여 분류함에 따라 획득된 분류 결과를 상기 클라이언트에게 전달하는 단계
    를 포함하는 기계 학습 방법.
  8. 프라이버시 보장형 기계 학습을 위한 서버에 있어서,
    클라이언트로부터 전달받은 변환 데이터(D)에 대한 기계 학습을 수행하는 학습부;
    상기 클라이언트로부터 서비스의 요청을 수신하는 수신부; 및
    상기 수신된 서비스의 요청과 관련된 서비스 데이터(s')를 상기 기계 학습에 기반하여 분류한 분류 결과를 제공하는 제공부
    를 포함하고,
    상기 클라이언트는, 변환 함수(F)에 원본 데이터(d)와 변환 파라미터(p)를 사용하여 변환 데이터(D)를 생성하는 것을 포함하고,
    상기 학습부는,
    상기 클라이언트에서 원본 데이터(d)에 대한 변환이 수행됨에 따라 변환 데이터(D)가 생성되고, 상기 생성된 변환 데이터(D)가 전달됨을 수신하여 기계 학습을 수행하는
    서버.
KR1020180078104A 2018-07-05 2018-07-05 단방향 데이터 변환을 이용한 프라이버시 보장형 기계 학습 방법 KR102092617B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180078104A KR102092617B1 (ko) 2018-07-05 2018-07-05 단방향 데이터 변환을 이용한 프라이버시 보장형 기계 학습 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180078104A KR102092617B1 (ko) 2018-07-05 2018-07-05 단방향 데이터 변환을 이용한 프라이버시 보장형 기계 학습 방법

Publications (2)

Publication Number Publication Date
KR20200005003A KR20200005003A (ko) 2020-01-15
KR102092617B1 true KR102092617B1 (ko) 2020-05-22

Family

ID=69156670

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180078104A KR102092617B1 (ko) 2018-07-05 2018-07-05 단방향 데이터 변환을 이용한 프라이버시 보장형 기계 학습 방법

Country Status (1)

Country Link
KR (1) KR102092617B1 (ko)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170220817A1 (en) * 2016-01-29 2017-08-03 Samsung Electronics Co., Ltd. System and method to enable privacy-preserving real time services against inference attacks
JP2017530435A (ja) 2014-06-30 2017-10-12 アマゾン・テクノロジーズ・インコーポレーテッド 機械学習モデル評価のための対話型インターフェース

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3074877A4 (en) * 2013-11-27 2017-09-06 NTT Docomo, Inc. Automatic task classification based upon machine learning
US9594741B1 (en) * 2016-06-12 2017-03-14 Apple Inc. Learning new words

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017530435A (ja) 2014-06-30 2017-10-12 アマゾン・テクノロジーズ・インコーポレーテッド 機械学習モデル評価のための対話型インターフェース
US20170220817A1 (en) * 2016-01-29 2017-08-03 Samsung Electronics Co., Ltd. System and method to enable privacy-preserving real time services against inference attacks

Also Published As

Publication number Publication date
KR20200005003A (ko) 2020-01-15

Similar Documents

Publication Publication Date Title
Popoola et al. Hybrid deep learning for botnet attack detection in the internet-of-things networks
Ullah et al. Cyber security threats detection in internet of things using deep learning approach
Zhou et al. Edge intelligence: Paving the last mile of artificial intelligence with edge computing
Moustafa et al. A new threat intelligence scheme for safeguarding industry 4.0 systems
EP4369229A2 (en) Securing systems employing artificial intelligence
Zhao et al. ECRT: An edge computing system for real-time image-based object tracking
US20190130272A1 (en) Generating compressed representation neural networks having high degree of accuracy
Yan et al. A survey of adversarial attack and defense methods for malware classification in cyber security
Aljawarneh et al. A recent survey on challenges in security and privacy in internet of things
Wang et al. Electromagnetic radiation based continuous authentication in edge computing enabled internet of things
Pathak et al. A distributed framework to orchestrate video analytics across edge and cloud: a use case of smart doorbell
Om Kumar et al. Effective intrusion detection system for IoT using optimized capsule auto encoder model
Wang et al. Fcnn: An efficient intrusion detection method based on raw network traffic
CN114334036A (zh) 一种模型训练的方法、相关装置、设备以及存储介质
KR102092617B1 (ko) 단방향 데이터 변환을 이용한 프라이버시 보장형 기계 학습 방법
Zhou et al. Deep cycle autoencoder for unsupervised domain adaptation with generative adversarial networks
Wu et al. Improving convolutional neural network-based webshell detection through reinforcement learning
CN117113266A (zh) 基于图同构网络的无人工厂异常检测方法、装置
Liu et al. Partwise bag‐of‐words‐based multi‐task learning for human action recognition
Chauhan et al. A framework for ddos attack detection in sdn-based iot using hybrid classifier
Xu et al. Work-in-progress: Making machine learning real-time predictable
CN116070257A (zh) 使用去中心化数据上的堆叠集成来训练异构模型的系统和方法
Hossain et al. A Vision Based Three-Layer Access Management System with IoT Integration
Lee et al. Mutual authentication method for hash chain based sensors in IoT environment
Tan et al. Acceleration for proximal stochastic dual coordinate ascent algorithm in solving regularised loss minimisation with norm

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant