KR102395452B1 - 개인 정보 보호를 위하여 원본 데이터를 비식별 처리한 변조 데이터를 인식하기 위한 사용자 러닝 네트워크를 학습하는 방법 및 테스팅하는 방법, 그리고, 이를 이용한 학습 장치 및 테스팅 장치 - Google Patents

개인 정보 보호를 위하여 원본 데이터를 비식별 처리한 변조 데이터를 인식하기 위한 사용자 러닝 네트워크를 학습하는 방법 및 테스팅하는 방법, 그리고, 이를 이용한 학습 장치 및 테스팅 장치 Download PDF

Info

Publication number
KR102395452B1
KR102395452B1 KR1020210139275A KR20210139275A KR102395452B1 KR 102395452 B1 KR102395452 B1 KR 102395452B1 KR 1020210139275 A KR1020210139275 A KR 1020210139275A KR 20210139275 A KR20210139275 A KR 20210139275A KR 102395452 B1 KR102395452 B1 KR 102395452B1
Authority
KR
South Korea
Prior art keywords
learning
data
original data
network
user
Prior art date
Application number
KR1020210139275A
Other languages
English (en)
Other versions
KR20220052839A (ko
Inventor
김태훈
Original Assignee
주식회사 딥핑소스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 딥핑소스 filed Critical 주식회사 딥핑소스
Publication of KR20220052839A publication Critical patent/KR20220052839A/ko
Application granted granted Critical
Publication of KR102395452B1 publication Critical patent/KR102395452B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • G06F21/6254Protecting personal data, e.g. for financial or medical purposes by anonymising data, e.g. decorrelating personal data from the owner's identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2155Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the incorporation of unlabelled data, e.g. multiple instance learning [MIL], semi-supervised techniques using expectation-maximisation [EM] or naïve labelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/088Non-supervised learning, e.g. competitive learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30196Human being; Person
    • G06T2207/30201Face

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Medical Informatics (AREA)
  • Bioethics (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Multimedia (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Probability & Statistics with Applications (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Digital Transmission Methods That Use Modulated Carrier Waves (AREA)

Abstract

본 발명은 개인 정보 보호를 위하여 원본 데이터를 비식별 처리한 변조 데이터를 인식하기 위한 사용자 러닝 네트워크를 학습하는 방법에 있어서, (a) 학습 장치가, 원본 데이터를 변조하여, 원본 데이터를 구분할 수 없으며 러닝 네트워크에서는 원본 데이터와 동일한 것으로 인식되는 변조 데이터를 생성하도록 학습된 변조 네트워크를 통해 제1_1 학습용 원본 데이터 내지 제1_m - 상기 m은 1 이상의 정수임 - 학습용 원본 데이터 각각을 변조한 제1 학습용 변조 데이터 내지 제m 학습용 변조 데이터를 데이터 제공자로부터 획득하고, 상기 제1_1 학습용 변조 데이터 내지 상기 제1_m 학습용 변조 데이터에서의 제1_i - 상기 i는 1 이상이며 상기 m 이하인 정수임 - 학습용 변조 데이터를 사용자 러닝 네트워크에 입력하여 상기 사용자 러닝 네트워크로 하여금 적어도 하나의 태스크 레이어(task layer)와, 상기 적어도 하나의 태스크 레이어의 출력에서의 평균과 분산을 조정하는 적어도 하나의 제1 배치 노멀라이즈 레이어를 통해 상기 제1_i 학습용 변조 데이터를 러닝 연산하여 제1 학습용 특징 정보를 생성하도록 하며, 상기 제1 학습용 특징 정보 또는 상기 제1 학습용 특징 정보를 이용하여 생성한 제1 학습용 태스크 특정 출력과, 상기 제1_i 학습용 변조 데이터에 대한 제1 그라운드 트루스를 참조하여 생성한 제1 에러를 최소화하도록 상기 적어도 하나의 제1 배치 노멀라이즈 레이어와 상기 적어도 하나의 태스크 레이어의 파라미터를 업데이트하여 상기 사용자 러닝 네트워크를 학습시키는 단계; 및 (b) 상기 학습 장치가, 제2_1 학습용 원본 데이터 내지 제2_n - 상기 n은 1 이상의 정수임 - 학습용 원본 데이터를 사용자로부터 획득하고, 상기 제2_1 학습용 원본 데이터 내지 상기 제2_n 학습용 원본 데이터에서의 제2_j - 상기 j는 1 이상이며 상기 n 이하인 정수임 - 학습용 원본 데이터를 상기 사용자 러닝 네트워크에 입력하여 상기 사용자 러닝 네트워크로 하여금 상기 적어도 하나의 태스크 레이어와, 상기 적어도 하나의 태스크 레이어의 출력에서의 평균과 분산을 조정하는 적어도 하나의 제2 배치 노멀라이즈 레이어를 통해 상기 제2_j 학습용 원본 데이터를 러닝 연산하여 제2 학습용 특징 정보를 생성하도록 하며, 상기 제2 학습용 특징 정보 또는 상기 제2 학습용 특징 정보를 이용하여 생성한 제2 학습용 태스크 특정 출력과, 상기 제2_j 학습용 원본 데이터에 대한 제2 그라운드 트루스를 참조하여 생성한 제2 에러를 최소화하도록 상기 적어도 하나의 제2 배치 노멀라이즈 레이어와 상기 적어도 하나의 태스크 레이어의 파라미터를 업데이트하여 상기 사용자 러닝 네트워크를 학습시키는 단계; 를 포함하는 방법에 관한 것이다.

Description

개인 정보 보호를 위하여 원본 데이터를 비식별 처리한 변조 데이터를 인식하기 위한 사용자 러닝 네트워크를 학습하는 방법 및 테스팅하는 방법, 그리고, 이를 이용한 학습 장치 및 테스팅 장치{METHOD FOR LEARNING AND TESTING USER LEARNING NETWORK TO BE USED FOR RECOGNIZING OBFUSCATED DATA CREATED BY CONCEALING ORIGINAL DATA TO PROTECT PERSONAL INFORMATION AND LEARNING DEVICE AND TESTING DEVICE USING THE SAME}
본 발명은 사용자 러닝 네트워크(user learning network)의 학습에 관한 것으로, 보다 상세하게는, 개인 정보 보호를 위하여 원본 데이터를 변조한 변조 데이터를 인식하기 위한 사용자 러닝 네트워크를 학습하는 방법 및 이를 이용한 학습 장치, 그리고, 학습된 사용자 러닝 네트워크를 테스팅하는 방법 및 이를 이용한 테스팅 장치에 관한 것이다.
빅데이터(big data)란, 기존의 기업 환경이나 공공 기관에서 사용되는 정형화된 데이터는 물론, 전자 상거래 데이터, 메타 데이터, 웹 로그 데이터, 무선 식별(RFID: Radio Frequency Identification) 데이터, 센서 네트워크 데이터, 소셜 네트워크 데이터, 인터넷 텍스트와 문서에 관한 데이터, 인터넷 검색 인덱싱 데이터 등 기존에 미처 활용하지 못하던 비정형화 또는 반정형화된 데이터를 모두 포함하는 데이터로서, 이와 같은 데이터는 일반적으로 보통의 소프트웨어 툴 및 컴퓨터 시스템으로는 다루기 어려운 수준의 데이터 양을 갖게 된다는 의미에서 빅데이터라 칭하고 있다.
또한, 이러한 빅데이터는 그 자체만으로는 의미가 없을 수 있으나, 패턴 등에 대한 기계 학습을 통해 다양한 분야에서 새로운 데이터를 만들어내거나 판단 또는 예측을 하는데 유용하게 사용될 수 있다.
근래에 들어, 개인 정보 보호법 강화 등으로 인해 이러한 빅데이터를 거래 또는 공유하기 위해서는 해당 데이터의 개인 식별이 가능한 정보를 삭제하거나 해당 개인의 동의를 받는 것이 요구된다. 하지만, 상당한 양의 빅데이터 중 개인 식별이 가능한 정보가 있는지 여부를 일일이 확인하기도 어려울 뿐만 아니라 개인의 동의를 일일이 받는 것도 불가능하였기 때문에 이를 지원하기 위한 다양한 기술들이 등장하고 있다.
이에 관한 종래 기술의 일 예로서, 한국등록특허공보 제10-1861520호에 개시된 기술을 예로 들 수 있는데, 이에 따르면, 입력된 변형 대상 이미지에서 사람의 얼굴 영역을 검출하는 검출 단계, 상기 변형 대상 이미지에서 사람이 비식별 되도록 상기 검출된 얼굴 영역을 사람의 얼굴 형상이 아닌 왜곡된 제1 이미지로 변형하는 제1 비식별화 단계, 및 상기 제1 이미지를 토대로 소정의 얼굴 형성을 갖는 제2 이미지를 생성하고, 상기 변형 대상 이미지에서 상기 제1 이미지를 상기 제2 이미지로 변형시키되, 상기 제2 이미지는 상기 검출 단계에서 검출된 얼굴 영역의 형상과 상이한 얼굴 형상을 갖도록 생성되는 제2 식별화 단계를 포함하는 얼굴 비식별화 방법이 제공된다.
하지만, 위와 같은 종래 기술을 비롯하여 지금까지 소개된 기술에 의하면, 데이터 상에 얼굴, 텍스트 등의 식별 정보를 포함하는지 여부를 확인하고, 식별 정보에 해당하는 부분을 마스킹(masking) 또는 블러(blur) 처리하여 지우거나 가리는 방식이었기 때문에, 원본 데이터의 손상으로 인해 기계 학습에서 사용되기 어려웠고, 데이터 상에 예측하지 못한 식별 정보가 포함되어 이를 비식별화하지 못하는 경우도 종종 발생하였다. 특히, 종래의 보안 카메라(security camera)는 영상 이미지 내에 프레임 간 변화가 있는 모든 픽셀을 블러(blur) 처리하는 방식으로 비식별 처리를 수행하게 되는 데, 이러한 방식으로 비식별 처리를 수행하게 되면, 비식별된 얼굴의 표정 등 주요 정보가 원본 영상 이미지에 담긴 정보와 달라지게 될 뿐만 아니라 얼굴 검출 과정에서 누락된 개인 식별 정보가 원본 영상 이미지 상에 그대로 남게 되는 문제가 있었다.
따라서, 최근에는 원본 데이터와 상이하게 변조(obfuscation)된 변조 데이터를 생성하되, 학습 모델에 원본 데이터가 입력됨에 따라 출력되는 결과와 해당 학습 모델에 위의 변조 데이터가 입력됨에 따라 출력되는 결과가 서로 동일하거나 유사하게 되도록 하는 데이터 변조 기술이 개발되고 있다.
하지만, 이러한 변조 데이터를 인식하기 위하여 변조 데이터를 이용하여 사용자 러닝 네트워크를 학습할 경우, 변조 데이터를 이용하여 학습된 사용자 러닝 네트워크는 원본 데이터를 처리할 수 없게 되는 문제점이 있다.
또한, 변조 데이터를 이용하여 학습된 사용자 러닝 네트워크를 이용하여 원본 데이터를 인퍼런스(inference)하거나, 원본 데이터를 이미 상당 수 보유하고 있는 상황에서 변조 데이터와 함께 사용하여 사용자 러닝 네트워크를 학습시키는 등과 같은 상황에서, 원본 데이터와 변조 데이터를 동시에 이용하지 못하는 문제점이 있다.
본 발명은, 전술한 종래 기술의 문제점을 모두 해결하는 것을 그 목적으로 한다.
또한, 본 발명은 변조 데이터를 이용하여 학습된 사용자 러닝 네트워크에서 원본 데이터를 인퍼런스할 수 있도록 하는 것을 다른 목적으로 한다.
또한, 본 발명은 변조 데이터와 원본 데이터를 동시에 사용하여 사용자 러닝 네트워크를 학습시킬 수 있도록 하는 것을 또 다른 목적으로 한다.
상기 목적을 달성하기 위한 본 발명의 대표적인 구성은 다음과 같다.
본 발명의 일 실시예에 따르면, 개인 정보 보호를 위하여 원본 데이터를 비식별 처리한 변조 데이터를 인식하기 위한 사용자 러닝 네트워크를 학습하는 방법에 있어서, (a) 학습 장치가, 원본 데이터를 변조하여, 원본 데이터를 구분할 수 없으며 러닝 네트워크에서는 원본 데이터와 동일한 것으로 인식되는 변조 데이터를 생성하도록 학습된 변조 네트워크를 통해 제1_1 학습용 원본 데이터 내지 제1_m - 상기 m은 1 이상의 정수임 - 학습용 원본 데이터 각각을 변조한 제1 학습용 변조 데이터 내지 제m 학습용 변조 데이터를 데이터 제공자로부터 획득하고, 상기 제1_1 학습용 변조 데이터 내지 상기 제1_m 학습용 변조 데이터에서의 제1_i - 상기 i는 1 이상이며 상기 m 이하인 정수임 - 학습용 변조 데이터를 사용자 러닝 네트워크에 입력하여 상기 사용자 러닝 네트워크로 하여금 적어도 하나의 태스크 레이어(task layer)와, 상기 적어도 하나의 태스크 레이어의 출력에서의 평균과 분산을 조정하는 적어도 하나의 제1 배치 노멀라이즈 레이어를 통해 상기 제1_i 학습용 변조 데이터를 러닝 연산하여 제1 학습용 특징 정보를 생성하도록 하며, 상기 제1 학습용 특징 정보 또는 상기 제1 학습용 특징 정보를 이용하여 생성한 제1 학습용 태스크 특정 출력과, 상기 제1_i 학습용 변조 데이터에 대한 제1 그라운드 트루스를 참조하여 생성한 제1 에러를 최소화하도록 상기 적어도 하나의 제1 배치 노멀라이즈 레이어와 상기 적어도 하나의 태스크 레이어의 파라미터를 업데이트하여 상기 사용자 러닝 네트워크를 학습시키는 단계; 및 (b) 상기 학습 장치가, 제2_1 학습용 원본 데이터 내지 제2_n - 상기 n은 1 이상의 정수임 - 학습용 원본 데이터를 사용자로부터 획득하고, 상기 제2_1 학습용 원본 데이터 내지 상기 제2_n 학습용 원본 데이터에서의 제2_j - 상기 j는 1 이상이며 상기 n 이하인 정수임 - 학습용 원본 데이터를 상기 사용자 러닝 네트워크에 입력하여 상기 사용자 러닝 네트워크로 하여금 상기 적어도 하나의 태스크 레이어와, 상기 적어도 하나의 태스크 레이어의 출력에서의 평균과 분산을 조정하는 적어도 하나의 제2 배치 노멀라이즈 레이어를 통해 상기 제2_j 학습용 원본 데이터를 러닝 연산하여 제2 학습용 특징 정보를 생성하도록 하며, 상기 제2 학습용 특징 정보 또는 상기 제2 학습용 특징 정보를 이용하여 생성한 제2 학습용 태스크 특정 출력과, 상기 제2_j 학습용 원본 데이터에 대한 제2 그라운드 트루스를 참조하여 생성한 제2 에러를 최소화하도록 상기 적어도 하나의 제2 배치 노멀라이즈 레이어와 상기 적어도 하나의 태스크 레이어의 파라미터를 업데이트하여 상기 사용자 러닝 네트워크를 학습시키는 단계; 를 포함하는 방법이 제공된다.
상기에서, (c) 상기 학습 장치가, 상기 제1_1 학습용 원본 데이터 내지 상기 제1_m 학습용 원본 데이터 중 일부인 제3_1 학습용 원본 데이터 내지 제3_o - 상기 o는 1 이상이며 상기 m 이하인 정수임 - 학습용 원본 데이터를 상기 데이터 제공자로부터 획득하고, 상기 제3_1 학습용 원본 데이터 내지 상기 제3_o 학습용 원본 데이터에서의 제3_k - 상기 k는 1 이상이며 상기 o 이하인 정수임 - 학습용 원본 데이터를 상기 사용자 러닝 네트워크에 입력하여 상기 사용자 러닝 네트워크로 하여금 상기 적어도 하나의 태스크 레이어와, 상기 적어도 하나의 제2 배치 노멀라이즈 레이어를 통해 상기 제3_k 학습용 원본 데이터를 러닝 연산하여 제3 학습용 특징 정보를 생성하도록 하며, 상기 제3 학습용 특징 정보 또는 상기 제3 학습용 특징 정보를 이용하여 생성한 제3 학습용 태스크 특정 출력과, 상기 제3_k 학습용 원본 데이터에 대한 제3 그라운드 트루스를 참조하여 생성한 제3 에러를 최소화하도록 상기 적어도 하나의 제2 배치 노멀라이즈 레이어와 상기 적어도 하나의 태스크 레이어의 파라미터를 업데이트하여 상기 사용자 러닝 네트워크를 학습시키는 단계; 를 더 포함할 수 있다.
상기에서, (d) 상기 학습 장치가, 제4_1 학습용 원본 데이터 내지 제4_p - 상기 p는 1 이상의 정수임 - 학습용 원본 데이터를 상기 사용자로부터 획득하고, 상기 제4_1 학습용 원본 데이터 내지 상기 제4_p 학습용 원본 데이터에서의 제4_s - 상기 s는 1 이상이며 상기 p 이하인 정수임 - 학습용 원본 데이터를 상기 사용자 러닝 네트워크에 입력하여 상기 사용자 러닝 네트워크로 하여금 상기 적어도 하나의 태스크 레이어와, 상기 적어도 하나의 제2 배치 노멀라이즈 레이어를 통해 상기 제4_s 학습용 원본 데이터를 러닝 연산하여 제4 학습용 특징 정보를 생성하도록 하며, 상기 제4_s 학습용 원본 데이터를 상기 변조 네트워크에 입력하여 상기 변조 네트워크로 하여금 상기 제4_s 학습용 원본 데이터를 변조하여 제4_s 학습용 변조 데이터를 생성하도록 하고, 상기 제4_s 학습용 변조 데이터를 학습된 러닝 네트워크에 입력하여 상기 학습된 러닝 네트워크로 하여금 상기 제4_s 학습용 변조 데이터를 러닝 연산하여 제5 학습용 특징 정보를 생성하도록 하며, 상기 제4 학습용 특징 정보와 상기 제5 학습용 특징 정보를 참조하거나, 상기 제4 학습용 특징 정보를 이용하여 생성한 제4 학습용 태스크 특정 출력과 상기 제5 학습용 특징 정보를 이용하여 생성한 제5 학습용 태스크 특정 출력을 참조하여 생성한 제4 에러를 최소화하도록 상기 적어도 하나의 제2 배치 노멀라이즈 레이어와 상기 적어도 하나의 태스크 레이어의 파라미터를 업데이트하여 상기 사용자 러닝 네트워크를 학습시키는 단계; 를 더 포함할 수 있다.
상기에서, 상기 제4_1 학습용 원본 데이터 내지 상기 제4_p 학습용 원본 데이터는 그라운드 트루스가 라벨링되지 않은 언라벨드 데이터이며, 상기 학습 장치는, 제5 학습용 특징 정보 또는 상기 제5 학습용 태스크 특정 출력을, 언라벨드 데이터인 상기 제4_s 학습용 원본 데이터에 대한 슈도 그라운드 트루스로 이용할 수 있다.
상기에서, 상기 변조 네트워크는 타 학습 장치에 의해 학습된 상태이며, 상기 타 학습 장치에 의해, (i) 제6 학습용 원본 데이터가 상기 변조 네트워크에 입력되어 상기 변조 네트워크를 통해 상기 제6 학습용 원본 데이터가 변조되어 제6 학습용 변조 데이터가 생성되며, (ii) 상기 제6 학습용 변조 데이터가 학습된 러닝 네트워크에 입력되어 상기 학습된 러닝 네트워크를 통해 상기 제6 학습용 변조 데이터가 러닝 연산되어 제6 학습용 특징 정보가 생성되고, 상기 제6 학습용 원본 데이터가 상기 학습된 러닝 네트워크에 입력되어 상기 학습된 러닝 네트워크를 통해 상기 제6 학습용 원본 데이터가 러닝 연산되어 제7 학습용 특징 정보가 생성되며, (iii) 상기 제6 학습용 특징 정보와 상기 제7 학습용 특징 정보를 참조하거나 상기 제6 학습용 특징 정보를 이용하여 생성한 제6 학습용 태스크 특정 출력을 참조하여 획득된 제6 에러가 최소화되며, 상기 제6 학습용 원본 데이터와 상기 제6 학습용 변조 데이터를 참조하여 획득된 제7 에러가 최대화되도록 상기 변조 네트워크가 학습된 상태일 수 있다.
상기에서, 상기 학습된 러닝 네트워크는 서로 다른 태스크를 수행하는 복수의 학습된 러닝 네트워크들을 포함하며, 상기 타 학습 장치에 의해, 상기 복수의 학습된 러닝 네트워크들 각각에 대응되는 에러들을 평균한 평균 에러를 이용하여 상기 변조 네트워크가 학습되거나, 상기 복수의 학습된 러닝 네트워크들 각각을 순차적으로 이용하여 상기 변조 네트워크가 순차적으로 학습되도록 할 수 있다.
상기에서, 상기 변조 네트워크는 타 학습 장치에 의해 학습된 상태이며, 상기 타 학습 장치에 의해, (i) 제8 학습용 원본 데이터가 상기 변조 네트워크에 입력되어 상기 변조 네트워크를 통해 상기 제8 학습용 원본 데이터가 변조되어 제8 학습용 변조 데이터가 생성되며, (ii) 상기 제8 학습용 변조 데이터가 학습된 러닝 네트워크에 입력되어 상기 학습된 러닝 네트워크의 적어도 하나의 학습된 태스크 레이어와, 상기 적어도 하나의 학습된 태스크 레이어의 출력에서의 평균과 분산을 조정하는 적어도 하나의 학습된 제3 배치 노멀라이즈 레이어를 통해 상기 제8 학습용 변조 데이터를 러닝 연산하여 제8 학습용 특징 정보를 생성하도록 하며, 상기 제8 학습용 원본 데이터가 상기 학습된 러닝 네트워크에 입력되어 상기 학습된 러닝 네트워크의 상기 적어도 하나의 학습된 태스크 레이어와, 상기 적어도 하나의 학습된 태스크 레이어의 출력에서의 평균과 분산을 조정하는 적어도 하나의 학습된 제4 배치 노멀라이즈 레이어를 통해 상기 제8 학습용 원본 데이터를 러닝 연산하여 제9 학습용 특징 정보를 생성하도록 하며, (iii) 상기 제8 학습용 특징 정보와 상기 제9 학습용 특징 정보를 참조하여 생성한 제8 에러 및 상기 제8 학습용 특징 정보를 이용하여 생성한 제8 학습용 태스크 특정 출력을 참조하여 획득된 제9 에러 중 적어도 하나가 최소화되며, 상기 제8 학습용 원본 데이터와 상기 제8 학습용 변조 데이터를 참조하여 획득된 제10 에러가 최대화되도록 상기 변조 네트워크가 학습된 상태일 수 있다.
상기에서 상기 사용자 러닝 네트워크는 서로 다른 태스크를 수행하는 복수의 사용자 러닝 네트워크들을 포함하며, 상기 학습 장치는, 상기 복수의 사용자 러닝 네트워크들 각각에 대응되는 에러들 각각을 최소화하도록 상기 에러들 각각에 대응되는 상기 복수의 사용자 러닝 네트워크들 각각을 학습시키거나, 상기 복수의 사용자 러닝 네트워크들 각각에 대응되는 에러들을 평균한 평균 에러를 최소화하도록 상기 복수의 사용자 러닝 네트워크들을 학습시킬 수 있다.
또한, 본 발명의 일 실시예에 따르면, 개인 정보 보호를 위하여 원본 데이터를 비식별 처리한 변조 데이터를 인식하도록 학습된 사용자 러닝 네트워크를 테스트하는 방법에 있어서, (a) 학습 장치에 의해, (i) 원본 데이터를 변조하여, 원본 데이터를 구분할 수 없으며 러닝 네트워크에서는 원본 데이터와 동일한 것으로 인식되는 변조 데이터를 생성하도록 학습된 변조 네트워크를 통해 제1_1 학습용 원본 데이터 내지 제1_m - 상기 m은 1 이상의 정수임 - 학습용 원본 데이터 각각을 변조한 제1 학습용 변조 데이터 내지 제m 학습용 변조 데이터를 데이터 제공자로부터 획득하고, 상기 제1_1 학습용 변조 데이터 내지 상기 제1_m 학습용 변조 데이터에서의 제1_i - 상기 i는 1 이상이며 상기 m 이하인 정수임 - 학습용 변조 데이터를 사용자 러닝 네트워크에 입력하여 상기 사용자 러닝 네트워크로 하여금 적어도 하나의 태스크 레이어(task layer)와, 상기 적어도 하나의 태스크 레이어의 출력에서의 평균과 분산을 조정하는 적어도 하나의 제1 배치 노멀라이즈 레이어를 통해 상기 제1_i 학습용 변조 데이터를 러닝 연산하여 제1 학습용 특징 정보를 생성하도록 하며, 상기 제1 학습용 특징 정보 또는 상기 제1 학습용 특징 정보를 이용하여 생성한 제1 학습용 태스크 특정 출력과, 상기 제1_i 학습용 변조 데이터에 대한 제1 그라운드 트루스를 참조하여 생성한 제1 에러를 최소화하도록 상기 적어도 하나의 제1 배치 노멀라이즈 레이어와 상기 적어도 하나의 태스크 레이어의 파라미터를 업데이트하여 상기 사용자 러닝 네트워크를 학습시키는 프로세스, 및 제2_1 학습용 원본 데이터 내지 제2_n 학습용 원본 데이터를 사용자로부터 획득하고, 상기 제2_1 학습용 원본 데이터 내지 상기 제2_m 학습용 원본 데이터에서의 제2_j - 상기 j는 1 이상이며 상기 n 이하인 정수임 - 학습용 원본 데이터를 상기 사용자 러닝 네트워크에 입력하여 상기 사용자 러닝 네트워크로 하여금 상기 적어도 하나의 태스크 레이어와, 상기 적어도 하나의 태스크 레이어의 출력에서의 평균과 분산을 조정하는 적어도 하나의 제2 배치 노멀라이즈 레이어를 통해 상기 제2_j 학습용 원본 데이터를 러닝 연산하여 제2 학습용 특징 정보를 생성하도록 하며, 상기 제2 학습용 특징 정보 또는 상기 제2 학습용 특징 정보를 이용하여 생성한 제2 학습용 태스크 특정 출력과, 상기 제2_j 학습용 원본 데이터에 대한 제2 그라운드 트루스를 참조하여 생성한 제2 에러를 최소화하도록 상기 적어도 하나의 제2 배치 노멀라이즈 레이어와 상기 적어도 하나의 태스크 레이어의 파라미터를 업데이트하여 상기 사용자 러닝 네트워크를 학습시키는 프로세스를 통해 상기 사용자 러닝 네트워크를 학습시킨 상태에서, 테스트 장치가, 테스트용 데이터를 획득하는 단계; 및 (b) 상기 테스트 장치가, 상기 테스트용 데이터가 테스트용 원본 데이터일 경우에는, 상기 테스트용 데이터를 상기 사용자 러닝 네트워크로 입력하여 상기 사용자 러닝 네트워크로 하여금 상기 적어도 하나의 태스크 레이어(task layer)와 상기 적어도 하나의 제2 배치 노멀라이즈 레이어를 통해 상기 테스트용 데이터를 러닝 연산하여 제1 테스트용 특징 정보를 생성하도록 하는 프로세스와, 상기 테스트용 데이터가 테스트용 변조 데이터일 경우에는, 상기 테스트용 데이터를 상기 사용자 러닝 네트워크로 입력하여 상기 사용자 러닝 네트워크로 하여금 상기 적어도 하나의 태스크 레이어(task layer)와 상기 적어도 하나의 제1 배치 노멀라이즈 레이어를 통해 상기 테스트용 데이터를 러닝 연산하여 제2 테스트용 특징 정보를 생성하도록 하는 프로세스를 수행하는 단계; 를 포함하는 방법이 제공된다.
또한, 본 발명의 일 실시예에 따르면, 개인 정보 보호를 위하여 원본 데이터를 비식별 처리한 변조 데이터를 인식하기 위한 사용자 러닝 네트워크를 학습하는 학습 장치에 있어서, 개인 정보 보호를 위하여 원본 데이터를 비식별 처리한 변조 데이터를 인식하기 위한 사용자 러닝 네트워크를 학습하기 위한 인스트럭션들이 저장된 메모리; 및 상기 메모리에 저장된 인스트럭션들에 따라 개인 정보 보호를 위하여 원본 데이터를 비식별 처리한 변조 데이터를 인식하기 위한 상기 사용자 러닝 네트워크를 학습하는 동작을 수행하는 프로세서; 를 포함하며, 상기 프로세서는, (I) 원본 데이터를 변조하여, 원본 데이터를 구분할 수 없으며 러닝 네트워크에서는 원본 데이터와 동일한 것으로 인식되는 변조 데이터를 생성하도록 학습된 변조 네트워크를 통해 제1_1 학습용 원본 데이터 내지 제1_m - 상기 m은 1 이상의 정수임 - 학습용 원본 데이터 각각을 변조한 제1 학습용 변조 데이터 내지 제m 학습용 변조 데이터를 데이터 제공자로부터 획득하고, 상기 제1_1 학습용 변조 데이터 내지 상기 제1_m 학습용 변조 데이터에서의 제1_i - 상기 i는 1 이상이며 상기 m 이하인 정수임 - 학습용 변조 데이터를 사용자 러닝 네트워크에 입력하여 상기 사용자 러닝 네트워크로 하여금 적어도 하나의 태스크 레이어(task layer)와, 상기 적어도 하나의 태스크 레이어의 출력에서의 평균과 분산을 조정하는 적어도 하나의 제1 배치 노멀라이즈 레이어를 통해 상기 제1_i 학습용 변조 데이터를 러닝 연산하여 제1 학습용 특징 정보를 생성하도록 하며, 상기 제1 학습용 특징 정보 또는 상기 제1 학습용 특징 정보를 이용하여 생성한 제1 학습용 태스크 특정 출력과, 상기 제1_i 학습용 변조 데이터에 대한 제1 그라운드 트루스를 참조하여 생성한 제1 에러를 최소화하도록 상기 적어도 하나의 제1 배치 노멀라이즈 레이어와 상기 적어도 하나의 태스크 레이어의 파라미터를 업데이트하여 상기 사용자 러닝 네트워크를 학습시키는 프로세스, 및 (II) 제2_1 학습용 원본 데이터 내지 제2_n - 상기 n은 1 이상의 정수임 - 학습용 원본 데이터를 사용자로부터 획득하고, 상기 제2_1 학습용 원본 데이터 내지 상기 제2_n 학습용 원본 데이터에서의 제2_j - 상기 j는 1 이상이며 상기 n 이하인 정수임 - 학습용 원본 데이터를 상기 사용자 러닝 네트워크에 입력하여 상기 사용자 러닝 네트워크로 하여금 상기 적어도 하나의 태스크 레이어와, 상기 적어도 하나의 태스크 레이어의 출력에서의 평균과 분산을 조정하는 적어도 하나의 제2 배치 노멀라이즈 레이어를 통해 상기 제2_j 학습용 원본 데이터를 러닝 연산하여 제2 학습용 특징 정보를 생성하도록 하며, 상기 제2 학습용 특징 정보 또는 상기 제2 학습용 특징 정보를 이용하여 생성한 제2 학습용 태스크 특정 출력과, 상기 제2_j 학습용 원본 데이터에 대한 제2 그라운드 트루스를 참조하여 생성한 제2 에러를 최소화하도록 상기 적어도 하나의 제2 배치 노멀라이즈 레이어와 상기 적어도 하나의 태스크 레이어의 파라미터를 업데이트하여 상기 사용자 러닝 네트워크를 학습시키는 프로세스를 수행하는 학습 장치가 제공된다.
상기 프로세서는, (III) 상기 제1_1 학습용 원본 데이터 내지 상기 제1_m 학습용 원본 데이터 중 일부인 제3_1 학습용 원본 데이터 내지 제3_o - 상기 o는 1 이상이며 상기 m 이하인 정수임 - 학습용 원본 데이터를 상기 데이터 제공자로부터 획득하고, 상기 제3_1 학습용 원본 데이터 내지 상기 제3_o 학습용 원본 데이터에서의 제3_k - 상기 k는 1 이상이며 상기 o 이하인 정수임 - 학습용 원본 데이터를 상기 사용자 러닝 네트워크에 입력하여 상기 사용자 러닝 네트워크로 하여금 상기 적어도 하나의 태스크 레이어와, 상기 적어도 하나의 제2 배치 노멀라이즈 레이어를 통해 상기 제3_k 학습용 원본 데이터를 러닝 연산하여 제3 학습용 특징 정보를 생성하도록 하며, 상기 제3 학습용 특징 정보 또는 상기 제3 학습용 특징 정보를 이용하여 생성한 제3 학습용 태스크 특정 출력과, 상기 제3_k 학습용 원본 데이터에 대한 제3 그라운드 트루스를 참조하여 생성한 제3 에러를 최소화하도록 상기 적어도 하나의 제2 배치 노멀라이즈 레이어와 상기 적어도 하나의 태스크 레이어의 파라미터를 업데이트하여 상기 사용자 러닝 네트워크를 학습시키는 프로세스를 더 수행할 수 있다.
상기 프로세서는, (IV) 제4_1 학습용 원본 데이터 내지 제4_p - 상기 p는 1 이상의 정수임 - 학습용 원본 데이터를 상기 사용자로부터 획득하고, 상기 제4_1 학습용 원본 데이터 내지 상기 제4_p 학습용 원본 데이터에서의 제4_s - 상기 s는 1 이상이며 상기 p 이하인 정수임 - 학습용 원본 데이터를 상기 사용자 러닝 네트워크에 입력하여 상기 사용자 러닝 네트워크로 하여금 상기 적어도 하나의 태스크 레이어와, 상기 적어도 하나의 제2 배치 노멀라이즈 레이어를 통해 상기 제4_s 학습용 원본 데이터를 러닝 연산하여 제4 학습용 특징 정보를 생성하도록 하며, 상기 제4_s 학습용 원본 데이터를 상기 변조 네트워크에 입력하여 상기 변조 네트워크로 하여금 상기 제4_s 학습용 원본 데이터를 변조하여 제4_s 학습용 변조 데이터를 생성하도록 하고, 상기 제4_s 학습용 변조 데이터를 학습된 러닝 네트워크에 입력하여 상기 학습된 러닝 네트워크로 하여금 상기 제4_s 학습용 변조 데이터를 러닝 연산하여 제5 학습용 특징 정보를 생성하도록 하며, 상기 제4 학습용 특징 정보와 상기 제5 학습용 특징 정보를 참조하거나, 상기 제4 학습용 특징 정보를 이용하여 생성한 제4 학습용 태스크 특정 출력과 상기 제5 학습용 특징 정보를 이용하여 생성한 제5 학습용 태스크 특정 출력을 참조하여 생성한 제4 에러를 최소화하도록 상기 적어도 하나의 제2 배치 노멀라이즈 레이어와 상기 적어도 하나의 태스크 레이어의 파라미터를 업데이트하여 상기 사용자 러닝 네트워크를 학습시키는 프로세스를 더 수행할 수 있다.
상기에서, 상기 제4_1 학습용 원본 데이터 내지 상기 제4_p 학습용 원본 데이터는 그라운드 트루스가 라벨링되지 않은 언라벨드 데이터이며, 상기 프로세서는, 제5 학습용 특징 정보 또는 상기 제5 학습용 태스크 특정 출력을, 언라벨드 데이터인 상기 제4_s 학습용 원본 데이터에 대한 슈도 그라운드 트루스로 이용할 수 있다.
상기에서, 상기 변조 네트워크는 타 학습 장치에 의해 학습된 상태이며, 상기 타 학습 장치에 의해, (i) 제6 학습용 원본 데이터가 상기 변조 네트워크에 입력되어 상기 변조 네트워크를 통해 상기 제6 학습용 원본 데이터가 변조되어 제6 학습용 변조 데이터가 생성되며, (ii) 상기 제6 학습용 변조 데이터가 학습된 러닝 네트워크에 입력되어 상기 학습된 러닝 네트워크를 통해 상기 제6 학습용 변조 데이터가 러닝 연산되어 제6 학습용 특징 정보가 생성되고, 상기 제6 학습용 원본 데이터가 상기 학습된 러닝 네트워크에 입력되어 상기 학습된 러닝 네트워크를 통해 상기 제6 학습용 원본 데이터가 러닝 연산되어 제7 학습용 특징 정보가 생성되며, (iii) 상기 제6 학습용 특징 정보와 상기 제7 학습용 특징 정보를 참조하거나 상기 제6 학습용 특징 정보를 이용하여 생성한 제6 학습용 태스크 특정 출력을 참조하여 획득된 제6 에러가 최소화되며, 상기 제6 학습용 원본 데이터와 상기 제6 학습용 변조 데이터를 참조하여 획득된 제7 에러가 최대화되도록 상기 변조 네트워크가 학습된 상태일 수 있다.
상기에서, 상기 학습된 러닝 네트워크는 서로 다른 태스크를 수행하는 복수의 학습된 러닝 네트워크들을 포함하며, 상기 타 학습 장치에 의해, 상기 복수의 학습된 러닝 네트워크들 각각에 대응되는 에러들을 평균한 평균 에러를 이용하여 상기 변조 네트워크가 학습되거나, 상기 복수의 학습된 러닝 네트워크들 각각을 순차적으로 이용하여 상기 변조 네트워크가 순차적으로 학습되도록 한 것일 수 있다.
상기에서, 상기 변조 네트워크는 타 학습 장치에 의해 학습된 상태이며, 상기 타 학습 장치에 의해, (i) 제8 학습용 원본 데이터가 상기 변조 네트워크에 입력되어 상기 변조 네트워크를 통해 상기 제8 학습용 원본 데이터가 변조되어 제8 학습용 변조 데이터가 생성되며, (ii) 상기 제8 학습용 변조 데이터가 학습된 러닝 네트워크에 입력되어 상기 학습된 러닝 네트워크의 적어도 하나의 학습된 태스크 레이어와, 상기 적어도 하나의 학습된 태스크 레이어의 출력에서의 평균과 분산을 조정하는 적어도 하나의 학습된 제3 배치 노멀라이즈 레이어를 통해 상기 제8 학습용 변조 데이터를 러닝 연산하여 제8 학습용 특징 정보를 생성하도록 하며, 상기 제8 학습용 원본 데이터가 상기 학습된 러닝 네트워크에 입력되어 상기 학습된 러닝 네트워크의 상기 적어도 하나의 학습된 태스크 레이어와, 상기 적어도 하나의 학습된 태스크 레이어의 출력에서의 평균과 분산을 조정하는 적어도 하나의 학습된 제4 배치 노멀라이즈 레이어를 통해 상기 제8 학습용 원본 데이터를 러닝 연산하여 제9 학습용 특징 정보를 생성하도록 하며, (iii) 상기 제8 학습용 특징 정보와 상기 제9 학습용 특징 정보를 참조하여 생성한 제8 에러 및 상기 제8 학습용 특징 정보를 이용하여 생성한 제8 학습용 태스크 특정 출력을 참조하여 획득된 제9 에러 중 적어도 하나가 최소화되며, 상기 제8 학습용 원본 데이터와 상기 제8 학습용 변조 데이터를 참조하여 획득된 제10 에러가 최대화되도록 상기 변조 네트워크가 학습된 상태일 수 있다.
상기에서, 상기 사용자 러닝 네트워크는 서로 다른 태스크를 수행하는 복수의 사용자 러닝 네트워크들을 포함하며, 상기 프로세서는, 상기 복수의 사용자 러닝 네트워크들 각각에 대응되는 에러들 각각을 최소화하도록 상기 에러들 각각에 대응되는 상기 복수의 사용자 러닝 네트워크들 각각을 학습시키거나, 상기 복수의 사용자 러닝 네트워크들 각각에 대응되는 에러들을 평균한 평균 에러를 최소화하도록 상기 복수의 사용자 러닝 네트워크들을 학습시킬 수 있다.
또한, 본 발명의 일 실시예에 따르면, 개인 정보 보호를 위하여 원본 데이터를 비식별 처리한 변조 데이터를 인식하도록 학습된 사용자 러닝 네트워크를 테스트하는 테스팅 장치에 있어서, 개인 정보 보호를 위하여 원본 데이터를 비식별 처리한 변조 데이터를 인식하도록 학습된 사용자 러닝 네트워크를 테스트하는 인스트럭션들이 저장된 메모리; 및 상기 메모리에 저장된 인스트럭션들에 따라 개인 정보 보호를 위하여 원본 데이터를 비식별 처리한 변조 데이터를 인식하도록 학습된 상기 사용자 러닝 네트워크를 테스트하는 동작을 수행하는 프로세서; 를 포함하며, 상기 프로세서는, (I) 학습 장치에 의해, (i) 원본 데이터를 변조하여, 원본 데이터를 구분할 수 없으며 러닝 네트워크에서는 원본 데이터와 동일한 것으로 인식되는 변조 데이터를 생성하도록 학습된 변조 네트워크를 통해 제1_1 학습용 원본 데이터 내지 제1_m - 상기 m은 1 이상의 정수임 - 학습용 원본 데이터 각각을 변조한 제1 학습용 변조 데이터 내지 제m 학습용 변조 데이터를 데이터 제공자로부터 획득하고, 상기 제1_1 학습용 변조 데이터 내지 상기 제1_m 학습용 변조 데이터에서의 제1_i - 상기 i는 1 이상이며 상기 m 이하인 정수임 - 학습용 변조 데이터를 사용자 러닝 네트워크에 입력하여 상기 사용자 러닝 네트워크로 하여금 적어도 하나의 태스크 레이어(task layer)와, 상기 적어도 하나의 태스크 레이어의 출력에서의 평균과 분산을 조정하는 적어도 하나의 제1 배치 노멀라이즈 레이어를 통해 상기 제1_i 학습용 변조 데이터를 러닝 연산하여 제1 학습용 특징 정보를 생성하도록 하며, 상기 제1 학습용 특징 정보 또는 상기 제1 학습용 특징 정보를 이용하여 생성한 제1 학습용 태스크 특정 출력과, 상기 제1_i 학습용 변조 데이터에 대한 제1 그라운드 트루스를 참조하여 생성한 제1 에러를 최소화하도록 상기 적어도 하나의 제1 배치 노멀라이즈 레이어와 상기 적어도 하나의 태스크 레이어의 파라미터를 업데이트하여 상기 사용자 러닝 네트워크를 학습시키는 프로세스, 및 제2_1 학습용 원본 데이터 내지 제2_n 학습용 원본 데이터를 사용자로부터 획득하고, 상기 제2_1 학습용 원본 데이터 내지 상기 제2_m 학습용 원본 데이터에서의 제2_j - 상기 j는 1 이상이며 상기 n 이하인 정수임 - 학습용 원본 데이터를 상기 사용자 러닝 네트워크에 입력하여 상기 사용자 러닝 네트워크로 하여금 상기 적어도 하나의 태스크 레이어와, 상기 적어도 하나의 태스크 레이어의 출력에서의 평균과 분산을 조정하는 적어도 하나의 제2 배치 노멀라이즈 레이어를 통해 상기 제2_j 학습용 원본 데이터를 러닝 연산하여 제2 학습용 특징 정보를 생성하도록 하며, 상기 제2 학습용 특징 정보 또는 상기 제2 학습용 특징 정보를 이용하여 생성한 제2 학습용 태스크 특정 출력과, 상기 제2_j 학습용 원본 데이터에 대한 제2 그라운드 트루스를 참조하여 생성한 제2 에러를 최소화하도록 상기 적어도 하나의 제2 배치 노멀라이즈 레이어와 상기 적어도 하나의 태스크 레이어의 파라미터를 업데이트하여 상기 사용자 러닝 네트워크를 학습시키는 프로세스를 통해 상기 사용자 러닝 네트워크를 학습시킨 상태에서, 테스트용 데이터를 획득하는 프로세스, 및 (II) 상기 테스트용 데이터가 테스트용 원본 데이터일 경우에는, 상기 테스트용 데이터를 상기 사용자 러닝 네트워크로 입력하여 상기 사용자 러닝 네트워크로 하여금 상기 적어도 하나의 태스크 레이어(task layer)와 상기 적어도 하나의 제2 배치 노멀라이즈 레이어를 통해 상기 테스트용 데이터를 러닝 연산하여 제1 테스트용 특징 정보를 생성하도록 하는 프로세스와, 상기 테스트용 데이터가 테스트용 변조 데이터일 경우에는, 상기 테스트용 데이터를 상기 사용자 러닝 네트워크로 입력하여 상기 사용자 러닝 네트워크로 하여금 상기 적어도 하나의 태스크 레이어(task layer)와 상기 적어도 하나의 제1 배치 노멀라이즈 레이어를 통해 상기 테스트용 데이터를 러닝 연산하여 제2 테스트용 특징 정보를 생성하도록 하는 프로세스를 수행하는 테스팅 장치가 제공된다.
이 외에도, 본 발명의 방법을 실행하기 위한 컴퓨터 프로그램을 기록하기 위한 컴퓨터 판독 가능한 기록 매체가 더 제공된다.
본 발명에 의하면, 변조 데이터를 이용하여 학습된 사용자 러닝 네트워크에서 원본 데이터를 인퍼런스할 수 있게 된다.
또한, 본 발명에 의하면 변조 데이터와 원본 데이터를 동시에 사용하여 사용자 러닝 네트워크를 학습시킬 수 있게 된다.
본 발명의 실시예의 설명에 이용되기 위하여 첨부된 아래 도면들은 본 발명의 실시예들 중 단지 일부일 뿐이며, 본 발명이 속한 기술분야에서 통상의 지식을 가진 자(이하 "통상의 기술자")에게 있어서는 발명적 작업이 이루어짐 없이 이 도면들에 기초하여 다른 도면들이 얻어질 수 있다.
도 1은 본 발명의 일 실시예에 따라 개인 정보 보호를 위하여 원본 데이터를 비식별 처리한 변조 데이터를 인식하기 위한 사용자 러닝 네트워크를 학습하는 학습 장치를 개략적으로 도시한 것이고,
도 2는 본 발명의 일 실시예에 따라 개인 정보 보호를 위하여 원본 데이터를 비식별 처리한 변조 데이터를 인식하기 위한 사용자 러닝 네트워크를 학습하는 방법을 개략적으로 도시한 것이고,
도 3은 본 발명의 다른 실시예에 따라 개인 정보 보호를 위하여 원본 데이터를 비식별 처리한 변조 데이터를 인식하기 위한 사용자 러닝 네트워크를 학습하는 방법을 개략적으로 도시한 것이고,
도 4는 본 발명의 일 실시예에 따라 개인 정보 보호를 위하여 원본 데이터를 비식별 처리하는 변조 네트워크를 학습시키는 방법을 개략적으로 도시한 것이고,
도 5는 본 발명의 일 실시예에 따라 개인 정보 보호를 위하여 원본 데이터를 비식별 처리하는 변조 데이터를 학습시키는 다른 방법을 개략적으로 도시한 것이고,
도 6은 본 발명의 일 실시예에 따라 개인 정보 보호를 위하여 원본 데이터를 비식별 처리한 변조 데이터를 인식하도록 학습된 사용자 러닝 네트워크를 테스팅하는 테스팅 장치를 개략적으로 도시한 것이고,
도 7은 본 발명의 일 실시예에 따라 개인 정보 보호를 위하여 원본 데이터를 비식별 처리한 변조 데이터를 인식하도록 학습된 사용자 러닝 네트워크를 테스팅하는 방법을 개략적으로 도시한 것이다.
후술하는 본 발명에 대한 상세한 설명은, 본 발명이 실시될 수 있는 특정 실시예를 예시로서 도시하는 첨부 도면을 참조한다. 이들 실시예는 당업자가 본 발명을 실시할 수 있기에 충분하도록 상세히 설명된다. 본 발명의 다양한 실시예는 서로 다르지만 상호 배타적일 필요는 없음이 이해되어야 한다. 예를 들어, 여기에 기재되어 있는 특정 형상, 구조 및 특성은 본 발명의 정신과 범위를 벗어나지 않으면서 일 실시예로부터 다른 실시예로 변경되어 구현될 수 있다. 또한, 각각의 실시예 내의 개별 구성요소의 위치 또는 배치는 본 발명의 정신과 범위를 벗어나지 않으면서 변경될 수 있음이 이해되어야 한다. 따라서, 후술하는 상세한 설명은 한정적인 의미로서 취하려는 것이 아니며, 본 발명의 범위는, 특허청구범위의 청구항들이 청구하는 범위 및 그와 균등한 모든 범위를 포괄하는 것으로 받아들여져야 한다. 도면에서 유사한 참조부호는 여러 측면에 걸쳐서 동일하거나 유사한 구성요소를 나타낸다.
이하에서는, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명을 용이하게 실시할 수 있도록 하기 위하여, 본 발명의 여러 바람직한 실시예에 관하여 첨부된 도면을 참조하여 상세히 설명하기로 한다.
도 1은 본 발명의 일 실시예에 따라 개인 정보 보호를 위하여 원본 데이터를 비식별 처리한 변조 데이터를 인식하기 위한 사용자 러닝 네트워크를 학습하는 학습 장치를 개략적으로 도시한 것이다.
도 1을 참조하면, 학습 장치(1000)는 개인 정보 보호를 위하여 원본 데이터를 비식별 처리한 변조 데이터를 인식하기 위한 사용자 러닝 네트워크를 학습시키기 위한 인스트럭션들이 저장된 메모리(1001)와 메모리(1001)에 저장된 인스트럭션들에 따라 개인 정보 보호를 위하여 원본 데이터를 비식별 처리한 변조 데이터를 인식하기 위한 사용자 러닝 네트워크를 학습시키는 동작을 수행하는 프로세서(1002)를 포함할 수 있다.
구체적으로, 학습 장치(1000)는 전형적으로 컴퓨팅 장치(예컨대, 컴퓨터 프로세서, 메모리, 스토리지, 입력 장치 및 출력 장치, 기타 기존의 컴퓨팅 장치의 구성요소들을 포함할 수 있는 장치; 라우터, 스위치 등과 같은 전자 통신 장치; 네트워크 부착 스토리지(NAS) 및 스토리지 영역 네트워크(SAN)와 같은 전자 정보 스토리지 시스템)와 컴퓨터 소프트웨어(즉, 컴퓨팅 장치로 하여금 특정의 방식으로 기능하게 하는 인스트럭션들)의 조합을 이용하여 원하는 시스템 성능을 달성하는 것일 수 있다.
또한, 컴퓨팅 장치의 프로세서는 MPU(Micro Processing Unit) 또는 CPU(Central Processing Unit), 캐쉬 메모리(Cache Memory), 데이터 버스(Data Bus) 등의 하드웨어 구성을 포함할 수 있다. 또한, 컴퓨팅 장치는 운영체제, 특정 목적을 수행하는 애플리케이션의 소프트웨어 구성을 더 포함할 수도 있다.
그러나, 컴퓨팅 장치가 본 발명을 실시하기 위한 미디엄, 프로세서 및 메모리가 통합된 형태인 integrated 프로세서를 포함하는 경우를 배제하는 것은 아니다.
이와 같이 구성된 본 발명의 일 실시예에 따른 학습 장치(1000)를 이용하여 개인 정보 보호를 위하여 원본 데이터를 비식별 처리한 변조 데이터를 인식하기 위한 사용자 러닝 네트워크를 학습하는 방법을 설명하면 다음과 같다.
도 2는 본 발명의 일 실시예에 따라 개인 정보 보호를 위하여 원본 데이터를 비식별 처리한 변조 데이터를 인식하기 위한 사용자 러닝 네트워크를 학습하는 방법을 개략적으로 도시한 것이다.
먼저, 학습 장치(1000)는 데이터 제공자(data-provider)로부터 제1 학습용 변조 데이터 내지 제m 학습용 변조 데이터를 획득할 수 있다. 상기 m은 1 이상의 정수일 수 있다.
이때, 제1 학습용 변조 데이터 내지 제m 학습용 변조 데이터는 개인 정보를 위하여 제1 학습용 원본 데이터 내지 제m 학습용 원본 데이터를 비식별 처리한 것일 수 있다.
그리고, 제1 학습용 원본 데이터 내지 제m 학습용 원본 데이터를 비식별 처리하기 위하여 변조 네트워크가 이용될 수 있으며, 변조 네트워크는 원본 데이터를 변조하여, 원본 데이터를 구분할 수 없으며 학습된 러닝 네트워크에서는 원본 데이터와 동일한 것으로 인식되는 변조 데이터를 생성하도록 학습된 딥 러닝 네트워크일 수 있다. 상기 변조 네트워크를 학습하는 방법에 대해서는 다음에 설명하기로 한다.
즉, 데이터 제공자는 변조 네트워크를 통해 제1 학습용 원본 데이터 내지 제m 학습용 원본 데이터 각각을 변조한 제1 학습용 변조 데이터 내지 제m 학습용 변조 데이터를 생성하고, 제1 학습용 변조 데이터 내지 제m 학습용 변조 데이터를 사용자 러닝 네트워크(100)를 학습시키고자 하는 사용자에게 전송하여 줌으로써, 학습 장치가 사용자 러닝 네트워크(100)의 학습에 사용하기 위한 제1 학습용 변조 데이터 내지 제m 학습용 변조 데이터를 획득하도록 할 수 있다.
또한, 학습 장치(1000)는 데이터 제공자로부터 제1 학습용 변조 데이터 내지 제m 학습용 변조 데이터 각각에 대한 제1 그라운드 트루스(ground truth)들을 획득할 수 있다. 이때, 제1 그라운드 트루스들은 제1 학습용 원본 데이터 내지 제m 학습용 원본 데이터 각각에 대한 그라운드 트루스들일 수 있다.
다음으로, 학습 장치(1000)는 제2_1 학습용 원본 데이터 내지 제2_n 학습용 원본 데이터를 사용자로부터 획득할 수 있다. 상기 n 은 1 이상의 정수일 수 있다.
이때, 제2_1 학습용 원본 데이터 내지 제2_n 학습용 원본 데이터는 사용자 러닝 네트워크(100)를 학습시키기 위하여 사용자가 보유한 학습 데이터들일 수 있으며, 제2_1 학습용 원본 데이터 내지 제2_n 학습용 원본 데이터 각각에 대한 제2 그라운드 트루스들이 생성되어 있을 수 있다.
다음으로, 학습 장치(1000)는 데이터 제공자로부터 획득한 제1_1 학습용 변조 데이터 내지 제1_m 학습용 변조 데이터와, 사용자로부터 획득한 제2_1 학습용 원본 데이터 내지 제2_n 학습용 원본 데이터를 이용하여 사용자 러닝 네트워크(100)를 학습시킬 수 있다.
즉, 학습 장치(1000)는 데이터 제공자로부터 획득한 제1_1 학습용 변조 데이터 내지 제1_m 학습용 변조 데이터에서의 제1_i 학습용 변조 데이터를 사용자 러닝 네트워크(100)에 입력하여 사용자 러닝 네트워크(100)로 하여금 적어도 하나의 태스크 레이어(task layer)(110)와, 적어도 하나의 태스크 레이어(110)의 출력에서의 평균을 분산을 조정하는 적어도 하나의 제1 배치 노멀라이즈 레이어(120)를 통해 제1_i 학습용 변조 데이터를 러닝 연산하여 제1 학습용 특징 정보를 생성하도록 할 수 있다. 상기 i는 1 이상이며 m 이하인 정수일 수 있다. 그리고, 학습 장치(1000)는 제1 학습용 특징 정보 또는 제1 학습용 특징 정보를 이용하여 생성한 제1 학습용 태스크 특정 출력(task specific output)과 제1_i 학습용 변조 데이터에 대한 제1 그라운드 트루스를 참조하여 생성한 제1 에러를 최소화하도록 적어도 하나의 제1 배치 노멀라이즈 레이어(120)와 적어도 하나의 태스크 레이어(110)의 파라미터를 업데이트하여 사용자 러닝 네트워크(100)를 학습시킬 수 있다. 이때, 사용자 러닝 네트워크(100)의 학습은 제1 에러를 이용하여 생성한 로스 함수(loss function)에 따른 백프로파게이션을 통해 수행될 수 있다.
또한, 학습 장치(1000)는 사용자로부터 획득한 제2_1 학습용 원본 데이터 내지 제2_n 학습용 원본 데이터에서의 제2_j 학습용 원본 데이터를 사용자 러닝 네트워크(100)에 입력하여 사용자 러닝 네트워크(100)로 하여금 적어도 하나의 태스크 레이어(task layer)(110)와, 적어도 하나의 태스크 레이어(110)의 출력에서의 평균을 분산을 조정하는 적어도 하나의 제2 배치 노멀라이즈 레이어(130)를 통해 제1_j 학습용 원본 데이터를 러닝 연산하여 제2 학습용 특징 정보를 생성하도록 할 수 있다. 상기 j는 1 이상이며 n 이하인 정수일 수 있다. 그리고, 학습 장치(1000)는 제2 학습용 특징 정보 또는 제2 학습용 특징 정보를 이용하여 생성한 제2 학습용 태스크 특정 출력과, 제2_j 학습용 원본 데이터에 대한 제2 그라운드 트루스를 참조하여 생성한 제2 에러를 최소화하도록 적어도 하나의 제2 배치 노멀라이즈 레이어(130)와 적어도 하나의 태스크 레이어(110)의 파라미터를 업데이트하여 사용자 러닝 네트워크(100)를 학습시킬 수 있다. 이때, 사용자 러닝 네트워크(100)의 학습은 제2 에러를 이용하여 생성한 로스 함수에 따른 백프로파게이션을 통해 수행될 수 있다.
이와 같은 사용자 러닝 네트워크(100)의 학습에 의해, 제1_i 학습용 변조 데이터와 제2_j 학습용 원본 데이터가 공통적으로 가지고 있는 특징 정보는 공통 레이어인 태스크 레이어(110)가 학습하도록 하고, 제1_i 학습용 변조 데이터와 제2_j 학습용 원본 데이터의 차이, 일 예로, 시각적으로 자연스러운 RGB 영상과 노이즈와 같은 차이는 제1 배치 노멀라이즈 레이어(120)와 제2 배치 노멀라이즈 레이어(130)가 각각 학습하도록 할 수 있다. 따라서, 학습된 러닝 네트워크(100)는 원본 데이터와 변조 데이터 각각에 대한 러닝 연산을 수행할 수 있게 된다.
이때, 사용자 러닝 네트워크(100)는 머신 러닝 네트워크를 포함할 수 있으나, 이에 한정되지 않으며, 원본 데이터 또는 변조 데이터를 러닝 연산하여 특징 정보를 출력하는 모든 러닝 네트워크를 포함할 수 있다. 그리고, 머신 러닝 네트워크는 K-최근접 이웃(k-Nearest Neighbors), 선형 회귀(Linear Regression), 로지스틱 회귀(Logistic Regression), 서포트 벡터 머신(SVM, Support Vector Machine), 결정 트리(Decision Tree)와 랜덤 포레스트(Random Forest), 신경망(Neural Network), 군집(Clustering), 시각화(Visualization)와 차원 축소(Dimensionality Reduction), 연관 규칙 학습(Association Rule Learning), 심층 신뢰 신경망(Deep Belief Network), 강화 학습(Reinforcement Learning), 및 딥 러닝(deep learning 알고리즘 중 적어도 하나를 포함할 수 있으나, 머신 러닝 네트워크는 이에 한정되지 않으며 다양한 러닝 알고리즘을 포함할 수 있다.
그리고, 특징 정보는 원본 데이터 또는 변조 데이터에 대한 피처(feature) 또는 로짓(logits) 일 수 있다. 또한, 특징 정보는 원본 데이터 또는 변조 데이터 내의 소정 특징과 연관된 피처 값, 또는 소정 특징과 관련한 벡터(vector), 행렬(matrix) 및 좌표(coordinate) 중 적어도 하나에 관한 값을 포함하는 로짓일 수 있다. 예를 들어, 원본 데이터가 얼굴 이미지 데이터인 경우에, 위의 결과는 얼굴 인식을 위한 클래스, 얼굴 특징, 일 예로, 웃음에 대한 상태, 얼굴 특징점(landmark point, 예를 들어, 눈의 양 끝점)에 관한 좌표일 수 있다.
또한, 태스크 특정 출력은 사용자 러닝 네트워크(100)가 수행하고자 하는 태스크에 대한 출력으로, 클래스 분류를 위한 클래스에 대한 프러바빌리티(probability), 위치 검출을 위한 리그레이션에 대한 좌표값 등 사용자 러닝 네트워크(100)의 설계된 태스크에 따른 다양한 결과값을 가질 수 있으며, 사용자 러닝 네트워크(100)에서 출력되는 특징 정보를 액티베이션 유닛(activation unit)의 액티베이션 함수(activation function)을 이용하여 연산하여 사용자 러닝 네트워크(100)에서 수행하고자 하는 태스크에 대응하여 태스크 특정 출력을 생성할 수 있다. 이때, 액티베이션 함수로는 sigmoid, linear, softmax, rlinear, square, sqrt, srlinear, abs, tanh, brlinear 등이 사용될 수 있으나, 본원발명이 이에 한정되지는 않는다.
일 예로, 사용자 러닝 네트워크(100)가 클래스 분류를 위한 태스크를 수행하는 경우, 학습 장치(1000)는 사용자 러닝 네트워크(100)에서 출력되는 특징 정보를 클래스별로 맵핑하여 원본 데이터 또는 변조 데이터에 대한 클래스별 프로바빌리티를 생성할 수 있다. 이때, 클래스별 프로바빌리티는 설정된 클래스별로 사용자 러닝 네트워크(100)에서 출력되는 특징 정보가 정답일 확률을 나타낼 수 있다. 예를 들어, 원본 데이터가 얼굴 이미지 데이터인 경우에, 얼굴이 웃는 상태일 프로바빌리티는 0.75, 웃지 않는 상태일 프로바빌리티는 0.25 등과 같이 출력될 수 있다. 이때, 사용자 러닝 네트워크(100)에서 출력되는 특징 정보를 클래스별로 매핑하는 데 softmax를 사용할 수 있으나, 이에 한정되지 않으며, 특징 정보를 클래스별로 매핑하는 다양한 알고리즘이 이용될 수 있다.
또한, 사용자 러닝 네트워크(100)에서의 태스크 레이어(110)는 원본 데이터 또는 변조 데이터로부터 특징 정보를 추출하기 위한 러닝 연산을 수행하는 것으로, 컨볼루션 레이어, 디컨볼루션 레이어, 리니어(linear) 레이어 등 수행하고자 하는 태스크에 따른 다양한 딥 러닝 레이어를 포함할 수 있다.
한편, 상기에서는 데이터 제공자로부터 획득한 제1_1 학습용 변조 데이터 내지 제1_m 학습용 변조 데이터와 사용자로부터 획득한 제2_1 학습용 원본 데이터 내지 제2_n 학습용 원본 데이터를 이용하여 사용자 러닝 네트워크(100)를 학습시켰으나, 이에 더하여, 데이터 제공자로부터 제1_1 학습용 변조 데이터 내지 제1_m 학습용 변조 데이터의 생성에 사용된 제1_1 학습용 원본 데이터 내지 제1_m 학습용 원본 데이터 중 일부를 획득하여 사용자 러닝 네트워크(100)의 학습에 이용할 수도 있다.
즉, 학습 장치(1000)는 제1_1 학습용 원본 데이터 내지 제1_m 학습용 원본 데이터 중 일부인 제3_1 학습용 원본 데이터 내지 제3_o 학습용 원본 데이터를 데이터 제공자로부터 획득할 수 있다. 상기 o는 1 이상이며 상기 m 이하인 정수일 수 있다. 그리고, 학습 장치(1000)는 제3_1 학습용 원본 데이터 내지 제3_o 학습용 원본 데이터에서의 제3_k 학습용 원본 데이터를 사용자 러닝 네트워크(100)에 입력하여 사용자 러닝 네트워크(100)로 하여금 적어도 하나의 태스크 레이어(110)와 적어도 하나의 제2 배치 노멀라이즈 레이어(130)를 통해 제3_k 학습용 원본 데이터를 러닝 연산하여 제3 학습용 특징 정보를 생성하도록 할 수 있다. 상기 k는 1 이상이며 상기 o 이하인 정수일 수 있다. 이후, 학습 장치(1000)는 제3 학습용 특징 정보 또는 제3 학습용 특징 정보를 이용하여 생성한 제3 학습용 태스크 특정 출력과, 제3_k 학습용 원본 데이터에 대한 제3 그라운드 트루스를 참조하여 생성한 제3 에러를 최소화하도록 적어도 하나의 제2 배치 노멀라이즈 레이어(130)와 적어도 하나의 태스크 레이어(110)의 파라미터를 업데이트하여 사용자 러닝 네트워크(100)를 학습시킬 수 있다.
또한, 상기에서는 하나의 사용자 러닝 네트워크를 학습시키는 과정에 대하여 설명하였으나, 서로 다른 태스크를 수행하는 복수의 사용자 네트워크를 학습시킬 수도 있다.
즉, 사용자 러닝 네트워크(100)를 적어도 하나의 태스크 레이어와 적어도 하나의 배치 노멀라이즈 레이어를 각각 포함하는 복수의 사용자 러닝 네트워크들(G1, G2, ??, Gt)로 형성한 상태에서, 학습 장치(1000)가, 복수의 사용자 러닝 네트워크들(G1, G2, ??, Gt) 각각에 대응되는 에러들 각각을 최소화하도록 에러들 각각에 대응되는 복수의 사용자 러닝 네트워크들(G1, G2, ??, Gt) 각각을 학습시키거나, 복수의 사용자 러닝 네트워크들(G1, G2, ??, Gt) 각각에 대응되는 에러들을 평균한 평균 에러를 최소화하도록 복수의 사용자 러닝 네트워크들(G1, G2, ??, Gt)을 학습시킬 수 있다.
상기에서는 학습용 원본 데이터 및 학습용 변조 데이터를 사용자 러닝 네트워크(100)로 입력하고, 사용자 러닝 네트워크(100)에서 출력되는 학습용 특징 정보 또는 학습용 특징 정보를 이용하여 생성한 학습용 태스크 특정 출력들을 참조하여 사용자 러닝 네트워크(100)를 학습시켰으나, 이와는 달리, 배치 데이터를 이용하여 사용자 러닝 네트워크(100)를 학습시킬 수도 있다. 즉, 복수의 학습용 변조 데이터들을 이용하여 학습용 변조 데이터 배치를 생성하며, 복수의 학습용 원본 데이터들을 이용하여 학습용 원본 데이터를 생성하고, 학습용 변조 데이터 배치와 학습용 원본 데이터 배치를 사용자 러닝 네트워크(100)로 입력하며, 학습용 변조 데이터 배치와 학습용 원본 데이터 각각에 대응되는 로스 함수를 이용하여 사용자 러닝 네트워크(100)를 학습시킬 수 있다.
도 3은 본 발명의 다른 실시예에 따라 개인 정보 보호를 위하여 원본 데이터를 비식별 처리한 변조 데이터를 인식하기 위한 사용자 러닝 네트워크를 학습하는 방법을 개략적으로 도시한 것으로, 사용자 러닝 네트워크를 학습하는 방법을 설명하면 다음과 같다.
도 3에서의 방법은 도 2에서의 방법에 더하여, 사용자가 소유하고 있거나 새로이 획득된 언라벨드(unlabeled) 데이터, 즉, 그라운드 트루스가 생성되지 않은 학습용 원본 데이터를 이용하여 사용자 러닝 네트워크를 학습시키는 방법일 수 있다. 이하에서는, 도 2에서 설명한 학습용 변조 데이터 및 학습용 원본 데이터를 이용한 학습에 대해서는 설명을 생략하며, 언라벨드 데이터를 이용한 학습에 대해서만 설명하도록 한다.
먼저, 학습 장치(1000)는 언라벨드 데이터인 제4_1 학습용 원본 데이터 내지 제4_p 학습용 원본 데이터를 상기 사용자로부터 획득할 수 있다. 상기 p는 1 이상의 정수일 수 있다.
다음으로, 학습 장치(1000)는 제4_1 학습용 원본 데이터 내지 제4_p 학습용 원본 데이터에서의 제4_s 학습용 원본 데이터를 사용자 러닝 네트워크(100)에 입력하여 사용자 러닝 네트워크(100)로 하여금 적어도 하나의 태스크 레이어(110)와 적어도 하나의 제2 배치 노멀라이즈 레이어(130)를 통해 제4_s 학습용 원본 데이터를 러닝 연산하여 제4 학습용 특징 정보를 생성하도록 할 수 있다. 상기 s는 1 이상이며 p 이하인 정수일 수 있다.
또한, 학습 장치(1000)는 제4_s 학습용 원본 데이터를 슈도(pseudo) 그라운드 트루스 생성 네트워크(200)이 입력하여 슈도 그라운드 트루스 생성 네트워크(200)로 하여금 제4_s 학습용 원본 데이터에 대한 슈도 그라운드 트루스를 생성하도록 할 수 있다. 이때, 슈도 그라운드 트루스 생성 네트워크(200)는 사용자가 데이터 제공자로부터 획득한 것일 수 있으며, 슈도 그라운드 트루스 생성 네트워크(200)는 원본 데이터를 변조하여 변조 데이터를 생성하는 변조 네트워크와 변조 네트워크의 학습에 사용된 학습된 러닝 네트워크를 포함할 수 있다.
즉, 학습 장치(1000)는 제4_s 학습용 원본 데이터를 변조 네트워크에 입력하여 변조 네트워크로 하여금 제4_s 학습용 원본 데이터를 변조하여 제4_s 학습용 변조 데이터를 생성하도록 한다. 그리고, 학습 장치(1000)는 제4_s 학습용 변조 데이터를 학습된 러닝 네트워크에 입력하여 학습된 러닝 네트워크로 하여금 제4_s 학습용 변조 데이터를 러닝 연산하여 제5 학습용 특징 정보를 생성하도록 할 수 있다.
다음으로, 학습 장치(1000)는 제4 학습용 특징 정보와 제5 학습용 특징 정보를 참조하거나, 제4 학습용 특징 정보를 이용하여 생성한 제4 학습용 태스크 특정 출력과 제5 학습용 특징 정보를 이용하여 생성한 제5 학습용 태스크 특정 출력을 참조하여 생성한 제4 에러를 최소화하도록 적어도 하나의 제2 배치 노멀라이즈 레이어(130)와 적어도 하나의 태스크 레이어(110)의 파라미터를 업데이트하여 사용자 러닝 네트워크(100)를 학습시킬 수 있다. 이때, 제5 학습용 특징 정보 또는 제5 학습용 태스크 특정 출력은, 언라벨드 데이터인 제4_s 학습용 원본 데이터에 대한 슈도 그라운드 트루스일 수 있다. 즉, 학습 장치(1000)는 사용자 러닝 네트워크(100)에서 제4_s 학습용 원본 데이터를 러닝 연산한 결과와 슈도 그라운드 트루스를 이용한 로스 함수를 통해 사용자 러닝 네트워크(100)를 학습시킬 수 있다.
도 4는 본 발명의 일 실시예에 따라 개인 정보 보호를 위하여 원본 데이터를 비식별 처리하는 변조 데이터를 학습시키는 방법을 개략적으로 도시한 것으로, 도 4를 참조하여 변조 네트워크를 학습하는 방법을 설명하면 다음과 같다. 변조 네트워크의 학습은 데이터 제공자에 의해 수행될 수 있다.
제6 학습용 원본 데이터가 획득되면, 학습 장치(2000)가, 제6 학습용 원본 데이터를 변조 네트워크(300)에 입력하여 변조 네트워크(300)로 하여금 제6 학습용 원본 데이터를 변조하여 제6 학습용 변조 데이터를 생성하도록 할 수 있다.
이때, 제6 학습용 원본 데이터는 학습에 이용하기 위한 원본 데이터인 학습용 원본 데이터 또는 학습용 원본 데이터를 변환(modify)한 학습용 변환 데이터일 수 있으며, 학습용 변환 데이터는 학습용 원본 데이터에 랜덤 노이즈 생성 네트워크(미도시)를 통해 생성된 랜덤 노이즈를 부가하여 생성할 수 있다. 일 예로, 랜덤 노이즈 생성 네트워크로 하여금 정규분포 N(0, σ)에 따른 랜덤 노이즈를 생성하도록 하며, 생성된 노이즈를 학습용 원본 데이터에 추가하여 학습용 변환 데이터를 생성할 수 있다. 또한, 학습용 변환 데이터는 랜덤 노이즈 이외에도, 학습용 원본 데이터를 블루(blur) 처리하거나 학습용 원본 데이터의 해상도를 변경하여 생성할 수 있으나, 이에 한정되지 않으며, 학습용 원본 데이터를 변환하는 다양한 방법이 적용될 수 있다.
또한, 제6 학습용 변조 데이터는, 사람에게는 제6 학습용 데이터와 다르게 인식되나, 학습된 러닝 네트워크(400)에서는 제6 학습용 원본 데이터와 동일하거나 유사한 것으로 인식될 수 있다.
한편, 변조 네트워크(300)는 일 예로, 입력되는 학습용 데이터로 이미지를 컨볼루션 연산하는 다수의 컨볼루션 레이어들을 포함하는 엔코더(encoder)와, 엔코더에서 출력되는 피처맵을 디컨볼루션하여 학습용 변조 데이터를 출력하는 다수의 디컨볼루션 레이어들을 포함하는 디코더(decoder)를 포함할 수 있으나, 이에 한정되지 않으며, 입력되는 제6 학습용 원본 데이터를 제6 학습용 변조 데이터로 변조하는 다양한 구조의 러닝 네트워크를 포함할 수 있다.
그리고, 학습 장치(2000)는 제6 학습용 변조 데이터를 학습된 파라미터를 가지는 학습된 러닝 네트워크(400)에 입력하여 학습된 러닝 네트워크(400)로 하여금 제6 학습용 변조 데이터를 러닝 연산하여 제6 학습용 특징 정보를 생성하도록 할 수 있다.
또한, 학습 장치(2000)는 제6 학습용 원본 데이터를 학습된 러닝 네트워크(400)에 입력하여 학습된 러닝 네트워크(400)로 하여금 제6 학습용 원본 데이터를 러닝 연산하여 제7 학습용 특징 정보를 생성하도록 할 수 있다.
이때, 학습된 러닝 네트워크(400)는 머신 러닝 네트워크를 포함할 수 있으나, 이에 한정되지 않으며, 학습된 파라미터에 따라 입력되는 제6 학습용 변조 데이터를 러닝 연산하여 제6 학습용 특징 정보를 출력하며, 제6 학습용 원본 데이터를 러닝 연산하여 제7 학습용 특징 정보를 출력하도록 하는 모든 러닝 네트워크를 포함할 수 있다. 그리고, 머신 러닝 네트워크는 K-최근접 이웃(k-Nearest Neighbors), 선형 회귀(Linear Regression), 로지스틱 회귀(Logistic Regression), 서포트 벡터 머신(SVM, Support Vector Machine), 결정 트리(Decision Tree)와 랜덤 포레스트(Random Forest), 신경망(Neural Network), 군집(Clustering), 시각화(Visualization)와 차원 축소(Dimensionality Reduction), 연관 규칙 학습(Association Rule Learning), 심층 신뢰 신경망(Deep Belief Network), 강화 학습(Reinforcement Learning), 및 딥 러닝(deep learning) 알고리즘 중 적어도 하나를 포함할 수 있으나, 머신 러닝 네트워크는 이에 한정되지 않으며 다양한 러닝 알고리즘을 포함할 수 있다. 또한, 비식별 처리를 위한 대상은 원본 데이터에 포함된 개인 정보일 수 있으며, 개인 정보는 개인 식별 정보, 개인의 의료 정보, 생체 정보, 행동 정보 등 개인과 관련한 모든 정보를 포함할 수 있다.
그리고, 제6 학습용 특징 정보와 제7 학습용 특징 정보는 각각 제6 학습용 변조 데이터와 제6 학습용 원본 데이터에 대한 피처 또는 로짓 일 수 있다. 또한, 제6 학습용 특징 정보와 제7 학습용 특징 정보는 각각 제6 학습용 변조 데이터와 제6 학습용 원본 데이터 내 소정 특징과 연관된 피처 값, 또는 소정 특징과 관련한 벡터(vector), 행렬(matrix) 및 좌표(coordinate) 중 적어도 하나에 관한 값을 포함하는 로짓일 수 있다. 예를 들어, 제6 학습용 원본 데이터가 얼굴 이미지 데이터인 경우에, 위의 결과는 얼굴 인식을 위한 클래스, 얼굴 특징, 일 예로, 웃음에 대한 상태, 얼굴 특징점(landmark point, 예를 들어, 눈의 양 끝점)에 관한 좌표일 수 있다.
이후, 학습 장치(2000)는 제6 학습용 특징 정보와 제7 학습용 특징 정보를 참조하거나, 제6 학습용 특징 정보를 이용하여 생성한 제6 학습용 태스크 특정 출력을 참조하여 획득한 제6 에러가 최소화되며, 제6 학습용 원본 데이터와 제6 학습용 변조 데이터를 참조하여 획득된 제7 에러가 최대화되도록 변조 네트워크(300)를 학습시킬 수 있다.
즉, 학습 장치(2000)는 제6 학습용 특징 정보와 제7 학습용 특징 정보를 참조하여 획득한 제6_1 에러와, 제6 학습용 특징 정보를 이용하여 생성한 제6 학습용 태스크 특정 출력과 이에 대응되는 그라운드 트루스를 참조하여 획득한 변조(obfuscation) 로스인 제6_2 에러 중 적어도 하나를 참조한 제6 에러를 최소화하며, 제6 학습용 원본 데이터와 제6 학습용 변조 데이터를 참조하여 획득한 제7 에러를 최대화하도록 변조 네트워크(300)를 학습시킬 수 있다. 이를 좀 더 상세히 설명하면, 학습 장치(2000)는 변조 네트워크(300)를 학습시킴에 있어서, 제7 에러를 이용하여 변조 네트워크(300)가 제6 학습용 원본 데이터와는 차이가 많은 제6 학습용 변조 데이터를 출력하도록 학습시키며, 제6 에러를 이용하여 학습된 러닝 네트워크(400)에서 제6 학습용 원본 데이터와 동일하거나 유사하게 인식되도록 제6 학습용 원본 데이터를 변조하여 제6 학습용 변조 데이터를 출력하도록 학습시킨다.
이때, 학습 장치(2000)는 제6 학습용 특징 정보와 제7 학습용 특징 정보의 차이와, 제6 학습용 태스크 특정 출력과 이에 대응되는 그라운드 트루스의 차이인 변조 로스 중 적어도 하나를 참조하여 제6 에러를 획득할 수 있다. 일 예로, 학습 장치(2000)는 제6 학습용 특징 정보와 제7 학습용 특징 정보의 노름(norm) 또는 코사인 유사도(cosine similarity)에 제6 에러를 획득할 수 있으나, 이에 한정되지 않으며, 제6 학습용 특징 정보와 제7 학습용 특징 정보의 차이를 산출할 수 있는 다양한 알고리즘을 적용할 수 있다. 또한, 학습 장치(2000)는 제6 학습용 원본 데이터와 제6 학습용 변조 데이터의 차이에 의해 제2 에러를 획득할 수 있다.
또한, 학습 장치(2000)는 제6 학습용 변조 데이터의 엔트로피, 노이즈 정도 중 적어도 일부를 참조로 하여 퀄리티(quality)를 측정하고, 측정된 퀄리티를 더 참조하여 제6 에러를 획득할 수 있다. 즉, 학습 장치(2000)는 제6 학습용 변조 데이터의 퀄리티를 최소화, 일 예로, 제6 학습용 변조 데이터의 엔트로피, 노이즈 등을 최대화하도록 변조 네트워크(300)를 학습시킬 수 있다.
그리고, 학습 장치(2000)는 제6 에러를 최소화하도록 하며, 제7 에러를 최대화하도록 변조 네트워크(300)를 학습시킬 경우, 학습된 러닝 네트워크(400)의 학습된 파라미터는 고정하여 업데이트하지 않으며, 변조 네트워크(400)에 대해서만 학습을 진행할 수 있다.
한편, 제6 학습용 태스크 특정 출력은 학습된 러닝 네트워크(400)가 수행하고자 하는 태스크에 대한 출력으로, 클래스 분류를 위한 클래스에 대한 프로바빌리티, 위치 검출을 위한 리그레이션에 대한 좌표값 등 학습된 러닝 네트워크(400)의 학습된 태스크에 따른 다양한 결과값을 가질 수 있으며, 학습된 러닝 네트워크(400)에서 출력되는 제6 학습용 특징 정보를 액티베이션 유닛의 액티베이션 함수를 이용하여 연산하여 학습된 러닝 네트워크(400)에서 수행하고자 하는 태스크에 대응하여 제6 학습용 태스크 특정 출력을 생성할 수 있다. 이때, 액티베이션 함수로는 sigmoid, linear, softmax, rlinear, square, sqrt, srlinear, abs, tanh, brlinear 등이 사용될 수 있으나, 본원발명이 이에 한정되지는 않는다.
일 예로, 학습된 러닝 네트워크(400)가 클래스 분류를 위한 태스크를 수행하는 경우, 학습 장치(200)는 학습된 러닝 네트워크(400)에서 출력되는 제6 학습용 특징 정보를 클래스별로 맵핑하여 제6 학습용 변조 데이터에 대한 클래스별 프로바빌리티를 생성할 수 있다. 이때, 클래스별 프로바빌리티는 설정된 클래스별로 학습된 러닝 네트워크(400)에서 출력되는 제6 학습용 특징 정보가 정답일 확률을 나타낼 수 있다. 예를 들어, 제6 학습용 원본 데이터가 얼굴 이미지 데이터인 경우에, 얼굴이 웃는 상태일 프로바빌리티는 0.75, 웃지 않는 상태일 프로바빌리티는 0.25 등과 같이 출력될 수 있다. 이때, 학습된 러닝 네트워크(400)에서 출력되는 제6 학습용 특징 정보를 클래스별로 매핑하는 데 softmax를 사용할 수 있으나, 이에 한정되지 않으며, 제6 학습용 특징 정보를 클래스별로 매핑하는 다양한 알고리즘이 이용될 수 있다.
한편, 상기에서는 제6 학습용 원본 데이터와 제6 학습용 변조 데이터를 이용하여 제7 에러를 획득하였으나, 이와는 달리, GAN(generative adversarial network)의 디스크리미네터(discriminator)를 이용하여 획득할 수도 있다. 즉, 제6 학습용 변조 데이터를 디스크리미네터에 입력하여 디스크리미네터로 하여금 제6 학습용 변조 데이터를 페이크(fake)로 인식한 변조 로스를 출력하도록 할 수 있다.
또한, 상기에서는 하나의 학습된 러닝 네트워크(400)를 이용하여 변조 네트워크(300)를 학습하는 과정을 설명하였으나, 이와는 달리, 서로 다른 태스크를 수행하는 복수의 학습된 러닝 네트워크들을 이용하여 변조 데이터(300)를 학습할 수도 있다.
즉, 학습 장치(2000)는 복수의 학습된 러닝 네트워크들 각각에 대응되는 에러들을 평균한 평균 에러를 이용하여 변조 네트워크(300)를 학습하거나, 복수의 학습된 러닝 네트워크들 각각을 순차적으로 이용하여 변조 네트워크(300)를 학습할 수 있다.
도 5는 본 발명의 일 실시예에 따라 개인 정보 보호를 위하여 원본 데이터를 비식별 처리하는 변조 데이터를 학습시키는 다른 방법을 개략적으로 도시한 것으로, 도 5를 참조하여 변조 네트워크를 학습하는 방법을 설명하면 다음과 같다. 변조 네트워크의 학습은 데이터 제공자에 의해 수행될 수 있다. 이하의 설명에서는, 상기 도 4를 참조한 설명으로부터 용이하게 이해 가능한 부분에 대해서는 상세한 설명을 생략하기로 한다.
제8 학습용 원본 데이터가 획득되면, 학습 장치(2000)가, 제8 학습용 원본 데이터를 변조 네트워크(300)에 입력하여 변조 네트워크(300)로 하여금 제8 학습용 원본 데이터를 변조하여 제9 학습용 변조 데이터를 생성하도록 할 수 있다.
그리고, 학습 장치(2000)는 제8 학습용 변조 데이터를 학습된 러닝 네트워크(500)에 입력하여 학습된 러닝 네트워크(500)로 하여금 적어도 하나의 학습된 태스크 레이어(510)와 적어도 하나의 학습된 태스크 레이어(510)의 출력에서의 평균가 분산을 조정하는 적어도 하나의 학습된 제3 배치 노멀라이즈 레이어(520)를 통해 제8 학습용 변조 데이터를 러닝 연산하여 제8 학습용 특징 정보를 생성하도록 할 수 있다.
또한, 학습 장치(2000)는 제8 학습용 원본 데이터를 학습된 러닝 네트워크(500)에 입력하여 학습된 러닝 네트워크(500)로 하여금 적어도 하나의 학습된 태스크 레이어(510)와 적어도 하나의 태스크 레이어(510)의 출력에서의 평균과 분산을 조정하는 적어도 하나의 학습된 제4 배치 노멀라이즈 레이어를 통해 제8 학습용 원본 데이터를 러닝 연산하여 제9 학습용 특징 정보를 생성하도록 할 수 있다.
이후, 학습 장치(2000)는 제8 학습용 특징 정보와 제9 학습용 특징 정보를 참조하여 생성한 제8 에러 및 제8 학습용 특징 정보를 이용하여 생성한 제8 학습용 태스크 특정 출력을 참조하여 획득된 제9 에러 중 적어도 하나가 최소화되며, 제8 학습용 원본 데이터와 제8 학습용 변조 데이터를 참조하여 획득된 제10 에러가 최대화되도록 변조 네트워크(300)를 학습시킬 수 있다.
이와 같이 변조 네트워크(300)의 학습 과정에서, 학습된 러닝 네트워크(500)가 공통 레이어인 적어도 하나의 태스크 레이어를 통해 태스크를 수행하도록 하고, 제8 학습용 변조 데이터에 대해서는 적어도 하나의 제3 배치 노멀라이즈 레이어를 이용하며, 제8 학습용 원본 데이터에 대해서는 적어도 하나의 제4 배치 노멀라이즈 레이어를 이용하여 배치 노멀라이징을 수행하도록 함으로써, 이를 통해 학습된 변조 네트워크(300)를 이용하여, 생성된 학습용 변조 데이터는 원본 데이터와 변조 데이터를 모두 러닝 연산할 수 있도록 하기 위한 사용자 러닝 네트워크의 학습 성능을 향상시킬 수 있게 된다.
도 6은 본 발명의 일 실시예에 따라 개인 정보 보호를 위하여 원본 데이터를 비식별 처리한 변조 데이터를 인식하도록 학습된 사용자 러닝 네트워크를 테스팅하는 테스팅 장치를 개략적으로 도시한 것이다.
도 6을 참조하면, 테스팅 장치(3000)는 개인 정보 보호를 위하여 원본 데이터를 비식별 처리한 변조 데이터를 인식하도록 학습된 사용자 러닝 네트워크를 테스팅하기 위한 인스트럭션들이 저장된 메모리(3001)와 메모리(3001)에 저장된 인스트럭션들에 따라 개인 정보 보호를 위하여 원본 데이터를 비식별 처리한 변조 데이터를 인식하도록 학습된 사용자 러닝 네트워크를 테스팅하는 동작을 수행하는 프로세서(3002)를 포함할 수 있다.
구체적으로, 학습 장치(1000)는 전형적으로 컴퓨팅 장치(예컨대, 컴퓨터 프로세서, 메모리, 스토리지, 입력 장치 및 출력 장치, 기타 기존의 컴퓨팅 장치의 구성요소들을 포함할 수 있는 장치; 라우터, 스위치 등과 같은 전자 통신 장치; 네트워크 부착 스토리지(NAS) 및 스토리지 영역 네트워크(SAN)와 같은 전자 정보 스토리지 시스템)와 컴퓨터 소프트웨어(즉, 컴퓨팅 장치로 하여금 특정의 방식으로 기능하게 하는 인스트럭션들)의 조합을 이용하여 원하는 시스템 성능을 달성하는 것일 수 있다.
또한, 컴퓨팅 장치의 프로세서는 MPU(Micro Processing Unit) 또는 CPU(Central Processing Unit), 캐쉬 메모리(Cache Memory), 데이터 버스(Data Bus) 등의 하드웨어 구성을 포함할 수 있다. 또한, 컴퓨팅 장치는 운영체제, 특정 목적을 수행하는 애플리케이션의 소프트웨어 구성을 더 포함할 수도 있다.
그러나, 컴퓨팅 장치가 본 발명을 실시하기 위한 미디엄, 프로세서 및 메모리가 통합된 형태인 integrated 프로세서를 포함하는 경우를 배제하는 것은 아니다.
이와 같이 구성된 본 발명의 일 실시예에 따른 테스팅 장치(3000)를 이용하여 개인 정보 보호를 위하여 원본 데이터를 비식별 처리한 변조 데이터를 인식하도록 학습된 사용자 러닝 네트워크를 테스팅하는 방법을 설명하면 다음과 같다. 이하에서는, 도 2와 도 3을 참조한 설명으로 용이하게 이해 가능한 부분에 대해서는 상세한 설명을 생략하기로 한다.
도 2와 도 3을 참조하여 설명한 학습 방법에 의해 사용자 러닝 네트워크(100)가 학습된 상태에서, 테스트 장치(3000)가, 테스트용 데이터를 획득할 수 있다.
그리고, 테스트 장치(3000)는 획득한 테스트용 데이터가 테스트용 원본 데이터일 경우에는, 테스트용 데이터를 사용자 러닝 네트워크(100)로 입력하여 사용자 러닝 네트워크(100)로 하여금 적어도 하나의 태스크 레이어(110)와 적어도 하나의 제2 배치 노멀라이즈 레이어(130)를 통해 테스트용 데이터를 러닝 연산하여 제1 테스트용 특징 정보를 생성하도록 할 수 있다.
또한, 테스팅 장치(3000)는 테스트용 데이터가 테스트용 변조 데이터일 경우에는, 테스트용 데이터를 사용자 러닝 네트워크(100)로 입력하여 사용자 러닝 네트워크(100)로 하여금 적어도 하나의 태스크 레이어(110)와 적어도 하나의 제1 배치 노멀라이즈 레이어를 통해 테스트용 데이터를 러닝 연산하여 제2 테스트용 특징 정보를 생성하도록 할 수 있다.
이상 설명된 본 발명에 따른 실시예는 다양한 컴퓨터 구성요소를 통하여 실행될 수 있는 프로그램 명령어의 형태로 구현되어 컴퓨터 판독 가능한 기록 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능한 기록 매체는 프로그램 명령어, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 컴퓨터 판독 가능한 기록 매체에 기록되는 프로그램 명령어는 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 분야의 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능한 기록 매체의 예에는, 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM, DVD와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 ROM, RAM, 플래시 메모리 등과 같은 프로그램 명령어를 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령어의 예에는, 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드도 포함된다. 상기 하드웨어 장치는 본 발명에 따른 처리를 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상에서 본 발명이 구체적인 구성요소 등과 같은 특정 사항들과 한정된 실시예 및 도면에 의해 설명되었으나, 이는 본 발명의 보다 전반적인 이해를 돕기 위해서 제공된 것일 뿐, 본 발명이 상기 실시예들에 한정되는 것은 아니며, 본 발명이 속하는 기술분야에서 통상적인 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형을 꾀할 수 있다.
따라서, 본 발명의 사상은 상기 설명된 실시예에 국한되어 정해져서는 아니 되며, 후술하는 특허청구범위뿐만 아니라 이 특허청구범위와 균등하게 또는 등가적으로 변형된 모든 것들은 본 발명의 사상의 범주에 속한다고 할 것이다.
1000: 학습 장치,
1001: 메모리,
1002: 프로세서,
2000: 학습 장치,
3000: 테스팅 장치,
3001: 메모리,
3002: 프로세서

Claims (18)

  1. 개인 정보 보호를 위하여 원본 데이터를 비식별 처리한 변조 데이터를 인식하기 위한 사용자 러닝 네트워크를 학습하는 방법에 있어서,
    (a) 학습 장치가, 원본 데이터를 변조하여, 원본 데이터를 구분할 수 없으며 러닝 네트워크에서는 원본 데이터와 동일한 것으로 인식되는 변조 데이터를 생성하도록 학습된 변조 네트워크를 통해 제1_1 학습용 원본 데이터 내지 제1_m - 상기 m은 1 이상의 정수임 - 학습용 원본 데이터 각각을 변조한 제1 학습용 변조 데이터 내지 제m 학습용 변조 데이터를 데이터 제공자로부터 획득하고, 상기 제1_1 학습용 변조 데이터 내지 상기 제1_m 학습용 변조 데이터에서의 제1_i - 상기 i는 1 이상이며 상기 m 이하인 정수임 - 학습용 변조 데이터를 사용자 러닝 네트워크에 입력하여 상기 사용자 러닝 네트워크로 하여금 적어도 하나의 태스크 레이어(task layer)와, 상기 적어도 하나의 태스크 레이어의 출력에서의 평균과 분산을 조정하는 적어도 하나의 제1 배치 노멀라이즈 레이어를 통해 상기 제1_i 학습용 변조 데이터를 러닝 연산하여 제1 학습용 특징 정보를 생성하도록 하며, 상기 제1 학습용 특징 정보 또는 상기 제1 학습용 특징 정보를 이용하여 생성한 제1 학습용 태스크 특정 출력(task specific output)과, 상기 제1_i 학습용 변조 데이터에 대한 제1 그라운드 트루스(ground truth)를 참조하여 생성한 제1 에러를 최소화하도록 상기 적어도 하나의 제1 배치 노멀라이즈 레이어와 상기 적어도 하나의 태스크 레이어의 파라미터를 업데이트하여 상기 사용자 러닝 네트워크를 학습시키는 단계; 및
    (b) 상기 학습 장치가, 제2_1 학습용 원본 데이터 내지 제2_n - 상기 n은 1 이상의 정수임 - 학습용 원본 데이터를 사용자로부터 획득하고, 상기 제2_1 학습용 원본 데이터 내지 상기 제2_n 학습용 원본 데이터에서의 제2_j - 상기 j는 1 이상이며 상기 n 이하인 정수임 - 학습용 원본 데이터를 상기 사용자 러닝 네트워크에 입력하여 상기 사용자 러닝 네트워크로 하여금 상기 적어도 하나의 태스크 레이어와, 상기 적어도 하나의 태스크 레이어의 출력에서의 평균과 분산을 조정하는 적어도 하나의 제2 배치 노멀라이즈 레이어를 통해 상기 제2_j 학습용 원본 데이터를 러닝 연산하여 제2 학습용 특징 정보를 생성하도록 하며, 상기 제2 학습용 특징 정보 또는 상기 제2 학습용 특징 정보를 이용하여 생성한 제2 학습용 태스크 특정 출력과, 상기 제2_j 학습용 원본 데이터에 대한 제2 그라운드 트루스를 참조하여 생성한 제2 에러를 최소화하도록 상기 적어도 하나의 제2 배치 노멀라이즈 레이어와 상기 적어도 하나의 태스크 레이어의 파라미터를 업데이트하여 상기 사용자 러닝 네트워크를 학습시키는 단계;
    를 포함하는 방법.
  2. 제1항에 있어서,
    (c) 상기 학습 장치가, 상기 제1_1 학습용 원본 데이터 내지 상기 제1_m 학습용 원본 데이터 중 일부인 제3_1 학습용 원본 데이터 내지 제3_o - 상기 o는 1 이상이며 상기 m 이하인 정수임 - 학습용 원본 데이터를 상기 데이터 제공자로부터 획득하고, 상기 제3_1 학습용 원본 데이터 내지 상기 제3_o 학습용 원본 데이터에서의 제3_k - 상기 k는 1 이상이며 상기 o 이하인 정수임 - 학습용 원본 데이터를 상기 사용자 러닝 네트워크에 입력하여 상기 사용자 러닝 네트워크로 하여금 상기 적어도 하나의 태스크 레이어와, 상기 적어도 하나의 제2 배치 노멀라이즈 레이어를 통해 상기 제3_k 학습용 원본 데이터를 러닝 연산하여 제3 학습용 특징 정보를 생성하도록 하며, 상기 제3 학습용 특징 정보 또는 상기 제3 학습용 특징 정보를 이용하여 생성한 제3 학습용 태스크 특정 출력과, 상기 제3_k 학습용 원본 데이터에 대한 제3 그라운드 트루스를 참조하여 생성한 제3 에러를 최소화하도록 상기 적어도 하나의 제2 배치 노멀라이즈 레이어와 상기 적어도 하나의 태스크 레이어의 파라미터를 업데이트하여 상기 사용자 러닝 네트워크를 학습시키는 단계;
    를 더 포함하는 방법.
  3. 제1항에 있어서,
    (d) 상기 학습 장치가, 제4_1 학습용 원본 데이터 내지 제4_p - 상기 p는 1 이상의 정수임 - 학습용 원본 데이터를 상기 사용자로부터 획득하고, 상기 제4_1 학습용 원본 데이터 내지 상기 제4_p 학습용 원본 데이터에서의 제4_s - 상기 s는 1 이상이며 상기 p 이하인 정수임 - 학습용 원본 데이터를 상기 사용자 러닝 네트워크에 입력하여 상기 사용자 러닝 네트워크로 하여금 상기 적어도 하나의 태스크 레이어와, 상기 적어도 하나의 제2 배치 노멀라이즈 레이어를 통해 상기 제4_s 학습용 원본 데이터를 러닝 연산하여 제4 학습용 특징 정보를 생성하도록 하며, 상기 제4_s 학습용 원본 데이터를 상기 변조 네트워크에 입력하여 상기 변조 네트워크로 하여금 상기 제4_s 학습용 원본 데이터를 변조하여 제4_s 학습용 변조 데이터를 생성하도록 하고, 상기 제4_s 학습용 변조 데이터를 학습된 러닝 네트워크에 입력하여 상기 학습된 러닝 네트워크로 하여금 상기 제4_s 학습용 변조 데이터를 러닝 연산하여 제5 학습용 특징 정보를 생성하도록 하며, 상기 제4 학습용 특징 정보와 상기 제5 학습용 특징 정보를 참조하거나, 상기 제4 학습용 특징 정보를 이용하여 생성한 제4 학습용 태스크 특정 출력과 상기 제5 학습용 특징 정보를 이용하여 생성한 제5 학습용 태스크 특정 출력을 참조하여 생성한 제4 에러를 최소화하도록 상기 적어도 하나의 제2 배치 노멀라이즈 레이어와 상기 적어도 하나의 태스크 레이어의 파라미터를 업데이트하여 상기 사용자 러닝 네트워크를 학습시키는 단계;
    를 더 포함하는 방법.
  4. 제3항에 있어서,
    상기 제4_1 학습용 원본 데이터 내지 상기 제4_p 학습용 원본 데이터는 그라운드 트루스가 라벨링되지 않은 언라벨드(unlabeled) 데이터이며,
    상기 학습 장치는, 제5 학습용 특징 정보 또는 상기 제5 학습용 태스크 특정 출력을, 언라벨드 데이터인 상기 제4_s 학습용 원본 데이터에 대한 슈도(pseudo) 그라운드 트루스로 이용하는 방법.
  5. 제1항에 있어서,
    상기 변조 네트워크는 타 학습 장치에 의해 학습된 상태이며,
    상기 타 학습 장치에 의해, (i) 제6 학습용 원본 데이터가 상기 변조 네트워크에 입력되어 상기 변조 네트워크를 통해 상기 제6 학습용 원본 데이터가 변조되어 제6 학습용 변조 데이터가 생성되며, (ii) 상기 제6 학습용 변조 데이터가 학습된 러닝 네트워크에 입력되어 상기 학습된 러닝 네트워크를 통해 상기 제6 학습용 변조 데이터가 러닝 연산되어 제6 학습용 특징 정보가 생성되고, 상기 제6 학습용 원본 데이터가 상기 학습된 러닝 네트워크에 입력되어 상기 학습된 러닝 네트워크를 통해 상기 제6 학습용 원본 데이터가 러닝 연산되어 제7 학습용 특징 정보가 생성되며, (iii) 상기 제6 학습용 특징 정보와 상기 제7 학습용 특징 정보를 참조하거나 상기 제6 학습용 특징 정보를 이용하여 생성한 제6 학습용 태스크 특정 출력을 참조하여 획득된 제6 에러가 최소화되며, 상기 제6 학습용 원본 데이터와 상기 제6 학습용 변조 데이터를 참조하여 획득된 제7 에러가 최대화되도록 상기 변조 네트워크가 학습된 상태인 방법.
  6. 제5항에 있어서,
    상기 학습된 러닝 네트워크는 서로 다른 task를 수행하는 복수의 학습된 러닝 네트워크들을 포함하며,
    상기 타 학습 장치에 의해, 상기 복수의 학습된 러닝 네트워크들 각각에 대응되는 에러들을 평균한 평균 에러를 이용하여 상기 변조 네트워크가 학습되거나, 상기 복수의 학습된 러닝 네트워크들 각각을 순차적으로 이용하여 상기 변조 네트워크가 순차적으로 학습되도록 하는 방법.
  7. 제1항에 있어서,
    상기 변조 네트워크는 타 학습 장치에 의해 학습된 상태이며,
    상기 타 학습 장치에 의해, (i) 제8 학습용 원본 데이터가 상기 변조 네트워크에 입력되어 상기 변조 네트워크를 통해 상기 제8 학습용 원본 데이터가 변조되어 제8 학습용 변조 데이터가 생성되며, (ii) 상기 제8 학습용 변조 데이터가 학습된 러닝 네트워크에 입력되어 상기 학습된 러닝 네트워크의 적어도 하나의 학습된 태스크 레이어와, 상기 적어도 하나의 학습된 태스크 레이어의 출력에서의 평균과 분산을 조정하는 적어도 하나의 학습된 제3 배치 노멀라이즈 레이어를 통해 상기 제8 학습용 변조 데이터를 러닝 연산하여 제8 학습용 특징 정보를 생성하도록 하며, 상기 제8 학습용 원본 데이터가 상기 학습된 러닝 네트워크에 입력되어 상기 학습된 러닝 네트워크의 상기 적어도 하나의 학습된 태스크 레이어와, 상기 적어도 하나의 학습된 태스크 레이어의 출력에서의 평균과 분산을 조정하는 적어도 하나의 학습된 제4 배치 노멀라이즈 레이어를 통해 상기 제8 학습용 원본 데이터를 러닝 연산하여 제9 학습용 특징 정보를 생성하도록 하며, (iii) 상기 제8 학습용 특징 정보와 상기 제9 학습용 특징 정보를 참조하여 생성한 제8 에러 및 상기 제8 학습용 특징 정보를 이용하여 생성한 제8 학습용 태스크 특정 출력을 참조하여 획득된 제9 에러 중 적어도 하나가 최소화되며, 상기 제8 학습용 원본 데이터와 상기 제8 학습용 변조 데이터를 참조하여 획득된 제10 에러가 최대화되도록 상기 변조 네트워크가 학습된 상태인 방법.
  8. 제1항에 있어서,
    상기 사용자 러닝 네트워크는 서로 다른 태스크를 수행하는 복수의 사용자 러닝 네트워크들을 포함하며,
    상기 학습 장치는, 상기 복수의 사용자 러닝 네트워크들 각각에 대응되는 에러들 각각을 최소화하도록 상기 에러들 각각에 대응되는 상기 복수의 사용자 러닝 네트워크들 각각을 학습시키거나, 상기 복수의 사용자 러닝 네트워크들 각각에 대응되는 에러들을 평균한 평균 에러를 최소화하도록 상기 복수의 사용자 러닝 네트워크들을 학습시키는 방법.
  9. 개인 정보 보호를 위하여 원본 데이터를 비식별 처리한 변조 데이터를 인식하도록 학습된 사용자 러닝 네트워크를 테스트하는 방법에 있어서,
    (a) 학습 장치에 의해, (i) 원본 데이터를 변조하여, 원본 데이터를 구분할 수 없으며 러닝 네트워크에서는 원본 데이터와 동일한 것으로 인식되는 변조 데이터를 생성하도록 학습된 변조 네트워크를 통해 제1_1 학습용 원본 데이터 내지 제1_m - 상기 m은 1 이상의 정수임 - 학습용 원본 데이터 각각을 변조한 제1 학습용 변조 데이터 내지 제m 학습용 변조 데이터를 데이터 제공자로부터 획득하고, 상기 제1_1 학습용 변조 데이터 내지 상기 제1_m 학습용 변조 데이터에서의 제1_i - 상기 i는 1 이상이며 상기 m 이하인 정수임 - 학습용 변조 데이터를 사용자 러닝 네트워크에 입력하여 상기 사용자 러닝 네트워크로 하여금 적어도 하나의 태스크 레이어(task layer)와, 상기 적어도 하나의 태스크 레이어의 출력에서의 평균과 분산을 조정하는 적어도 하나의 제1 배치 노멀라이즈 레이어를 통해 상기 제1_i 학습용 변조 데이터를 러닝 연산하여 제1 학습용 특징 정보를 생성하도록 하며, 상기 제1 학습용 특징 정보 또는 상기 제1 학습용 특징 정보를 이용하여 생성한 제1 학습용 태스크 특정 출력과, 상기 제1_i 학습용 변조 데이터에 대한 제1 그라운드 트루스를 참조하여 생성한 제1 에러를 최소화하도록 상기 적어도 하나의 제1 배치 노멀라이즈 레이어와 상기 적어도 하나의 태스크 레이어의 파라미터를 업데이트하여 상기 사용자 러닝 네트워크를 학습시키는 프로세스, 및 제2_1 학습용 원본 데이터 내지 제2_n 학습용 원본 데이터를 사용자로부터 획득하고, 상기 제2_1 학습용 원본 데이터 내지 상기 제2_m 학습용 원본 데이터에서의 제2_j - 상기 j는 1 이상이며 상기 n 이하인 정수임 - 학습용 원본 데이터를 상기 사용자 러닝 네트워크에 입력하여 상기 사용자 러닝 네트워크로 하여금 상기 적어도 하나의 태스크 레이어와, 상기 적어도 하나의 태스크 레이어의 출력에서의 평균과 분산을 조정하는 적어도 하나의 제2 배치 노멀라이즈 레이어를 통해 상기 제2_j 학습용 원본 데이터를 러닝 연산하여 제2 학습용 특징 정보를 생성하도록 하며, 상기 제2 학습용 특징 정보 또는 상기 제2 학습용 특징 정보를 이용하여 생성한 제2 학습용 태스크 특정 출력과, 상기 제2_j 학습용 원본 데이터에 대한 제2 그라운드 트루스를 참조하여 생성한 제2 에러를 최소화하도록 상기 적어도 하나의 제2 배치 노멀라이즈 레이어와 상기 적어도 하나의 태스크 레이어의 파라미터를 업데이트하여 상기 사용자 러닝 네트워크를 학습시키는 프로세스를 통해 상기 사용자 러닝 네트워크를 학습시킨 상태에서, 테스트 장치가, 테스트용 데이터를 획득하는 단계; 및
    (b) 상기 테스트 장치가, 상기 테스트용 데이터가 테스트용 원본 데이터일 경우에는, 상기 테스트용 데이터를 상기 사용자 러닝 네트워크로 입력하여 상기 사용자 러닝 네트워크로 하여금 상기 적어도 하나의 태스크 레이어(task layer)와 상기 적어도 하나의 제2 배치 노멀라이즈 레이어를 통해 상기 테스트용 데이터를 러닝 연산하여 제1 테스트용 특징 정보를 생성하도록 하는 프로세스와, 상기 테스트용 데이터가 테스트용 변조 데이터일 경우에는, 상기 테스트용 데이터를 상기 사용자 러닝 네트워크로 입력하여 상기 사용자 러닝 네트워크로 하여금 상기 적어도 하나의 태스크 레이어(task layer)와 상기 적어도 하나의 제1 배치 노멀라이즈 레이어를 통해 상기 테스트용 데이터를 러닝 연산하여 제2 테스트용 특징 정보를 생성하도록 하는 프로세스를 수행하는 단계;
    를 포함하는 방법.
  10. 개인 정보 보호를 위하여 원본 데이터를 비식별 처리한 변조 데이터를 인식하기 위한 사용자 러닝 네트워크를 학습하는 학습 장치에 있어서,
    개인 정보 보호를 위하여 원본 데이터를 비식별 처리한 변조 데이터를 인식하기 위한 사용자 러닝 네트워크를 학습하기 위한 인스트럭션들이 저장된 메모리; 및
    상기 메모리에 저장된 인스트럭션들에 따라 개인 정보 보호를 위하여 원본 데이터를 비식별 처리한 변조 데이터를 인식하기 위한 상기 사용자 러닝 네트워크를 학습하는 동작을 수행하는 프로세서;
    를 포함하며,
    상기 프로세서는, (I) 원본 데이터를 변조하여, 원본 데이터를 구분할 수 없으며 러닝 네트워크에서는 원본 데이터와 동일한 것으로 인식되는 변조 데이터를 생성하도록 학습된 변조 네트워크를 통해 제1_1 학습용 원본 데이터 내지 제1_m - 상기 m은 1 이상의 정수임 - 학습용 원본 데이터 각각을 변조한 제1 학습용 변조 데이터 내지 제m 학습용 변조 데이터를 데이터 제공자로부터 획득하고, 상기 제1_1 학습용 변조 데이터 내지 상기 제1_m 학습용 변조 데이터에서의 제1_i - 상기 i는 1 이상이며 상기 m 이하인 정수임 - 학습용 변조 데이터를 사용자 러닝 네트워크에 입력하여 상기 사용자 러닝 네트워크로 하여금 적어도 하나의 태스크 레이어(task layer)와, 상기 적어도 하나의 태스크 레이어의 출력에서의 평균과 분산을 조정하는 적어도 하나의 제1 배치 노멀라이즈 레이어를 통해 상기 제1_i 학습용 변조 데이터를 러닝 연산하여 제1 학습용 특징 정보를 생성하도록 하며, 상기 제1 학습용 특징 정보 또는 상기 제1 학습용 특징 정보를 이용하여 생성한 제1 학습용 태스크 특정 출력과, 상기 제1_i 학습용 변조 데이터에 대한 제1 그라운드 트루스를 참조하여 생성한 제1 에러를 최소화하도록 상기 적어도 하나의 제1 배치 노멀라이즈 레이어와 상기 적어도 하나의 태스크 레이어의 파라미터를 업데이트하여 상기 사용자 러닝 네트워크를 학습시키는 프로세스, 및 (II) 제2_1 학습용 원본 데이터 내지 제2_n - 상기 n은 1 이상의 정수임 - 학습용 원본 데이터를 사용자로부터 획득하고, 상기 제2_1 학습용 원본 데이터 내지 상기 제2_n 학습용 원본 데이터에서의 제2_j - 상기 j는 1 이상이며 상기 n 이하인 정수임 - 학습용 원본 데이터를 상기 사용자 러닝 네트워크에 입력하여 상기 사용자 러닝 네트워크로 하여금 상기 적어도 하나의 태스크 레이어와, 상기 적어도 하나의 태스크 레이어의 출력에서의 평균과 분산을 조정하는 적어도 하나의 제2 배치 노멀라이즈 레이어를 통해 상기 제2_j 학습용 원본 데이터를 러닝 연산하여 제2 학습용 특징 정보를 생성하도록 하며, 상기 제2 학습용 특징 정보 또는 상기 제2 학습용 특징 정보를 이용하여 생성한 제2 학습용 태스크 특정 출력과, 상기 제2_j 학습용 원본 데이터에 대한 제2 그라운드 트루스를 참조하여 생성한 제2 에러를 최소화하도록 상기 적어도 하나의 제2 배치 노멀라이즈 레이어와 상기 적어도 하나의 태스크 레이어의 파라미터를 업데이트하여 상기 사용자 러닝 네트워크를 학습시키는 프로세스를 수행하는 학습 장치.
  11. 제10항에 있어서,
    상기 프로세서는, (III) 상기 제1_1 학습용 원본 데이터 내지 상기 제1_m 학습용 원본 데이터 중 일부인 제3_1 학습용 원본 데이터 내지 제3_o - 상기 o는 1 이상이며 상기 m 이하인 정수임 - 학습용 원본 데이터를 상기 데이터 제공자로부터 획득하고, 상기 제3_1 학습용 원본 데이터 내지 상기 제3_o 학습용 원본 데이터에서의 제3_k - 상기 k는 1 이상이며 상기 o 이하인 정수임 - 학습용 원본 데이터를 상기 사용자 러닝 네트워크에 입력하여 상기 사용자 러닝 네트워크로 하여금 상기 적어도 하나의 태스크 레이어와, 상기 적어도 하나의 제2 배치 노멀라이즈 레이어를 통해 상기 제3_k 학습용 원본 데이터를 러닝 연산하여 제3 학습용 특징 정보를 생성하도록 하며, 상기 제3 학습용 특징 정보 또는 상기 제3 학습용 특징 정보를 이용하여 생성한 제3 학습용 태스크 특정 출력과, 상기 제3_k 학습용 원본 데이터에 대한 제3 그라운드 트루스를 참조하여 생성한 제3 에러를 최소화하도록 상기 적어도 하나의 제2 배치 노멀라이즈 레이어와 상기 적어도 하나의 태스크 레이어의 파라미터를 업데이트하여 상기 사용자 러닝 네트워크를 학습시키는 프로세스를 더 수행하는 학습 장치.
  12. 제10항에 있어서,
    상기 프로세서는, (IV) 제4_1 학습용 원본 데이터 내지 제4_p - 상기 p는 1 이상의 정수임 - 학습용 원본 데이터를 상기 사용자로부터 획득하고, 상기 제4_1 학습용 원본 데이터 내지 상기 제4_p 학습용 원본 데이터에서의 제4_s - 상기 s는 1 이상이며 상기 p 이하인 정수임 - 학습용 원본 데이터를 상기 사용자 러닝 네트워크에 입력하여 상기 사용자 러닝 네트워크로 하여금 상기 적어도 하나의 태스크 레이어와, 상기 적어도 하나의 제2 배치 노멀라이즈 레이어를 통해 상기 제4_s 학습용 원본 데이터를 러닝 연산하여 제4 학습용 특징 정보를 생성하도록 하며, 상기 제4_s 학습용 원본 데이터를 상기 변조 네트워크에 입력하여 상기 변조 네트워크로 하여금 상기 제4_s 학습용 원본 데이터를 변조하여 제4_s 학습용 변조 데이터를 생성하도록 하고, 상기 제4_s 학습용 변조 데이터를 학습된 러닝 네트워크에 입력하여 상기 학습된 러닝 네트워크로 하여금 상기 제4_s 학습용 변조 데이터를 러닝 연산하여 제5 학습용 특징 정보를 생성하도록 하며, 상기 제4 학습용 특징 정보와 상기 제5 학습용 특징 정보를 참조하거나, 상기 제4 학습용 특징 정보를 이용하여 생성한 제4 학습용 태스크 특정 출력과 상기 제5 학습용 특징 정보를 이용하여 생성한 제5 학습용 태스크 특정 출력을 참조하여 생성한 제4 에러를 최소화하도록 상기 적어도 하나의 제2 배치 노멀라이즈 레이어와 상기 적어도 하나의 태스크 레이어의 파라미터를 업데이트하여 상기 사용자 러닝 네트워크를 학습시키는 프로세스를 더 수행하는 학습 장치.
  13. 제12항에 있어서,
    상기 제4_1 학습용 원본 데이터 내지 상기 제4_p 학습용 원본 데이터는 그라운드 트루스가 라벨링되지 않은 언라벨드 데이터이며,
    상기 프로세서는, 제5 학습용 특징 정보 또는 상기 제5 학습용 태스크 특정 출력을, 언라벨드 데이터인 상기 제4_s 학습용 원본 데이터에 대한 슈도 그라운드 트루스로 이용하는 학습 장치.
  14. 제10항에 있어서,
    상기 변조 네트워크는 타 학습 장치에 의해 학습된 상태이며,
    상기 타 학습 장치에 의해, (i) 제6 학습용 원본 데이터가 상기 변조 네트워크에 입력되어 상기 변조 네트워크를 통해 상기 제6 학습용 원본 데이터가 변조되어 제6 학습용 변조 데이터가 생성되며, (ii) 상기 제6 학습용 변조 데이터가 학습된 러닝 네트워크에 입력되어 상기 학습된 러닝 네트워크를 통해 상기 제6 학습용 변조 데이터가 러닝 연산되어 제6 학습용 특징 정보가 생성되고, 상기 제6 학습용 원본 데이터가 상기 학습된 러닝 네트워크에 입력되어 상기 학습된 러닝 네트워크를 통해 상기 제6 학습용 원본 데이터가 러닝 연산되어 제7 학습용 특징 정보가 생성되며, (iii) 상기 제6 학습용 특징 정보와 상기 제7 학습용 특징 정보를 참조하거나 상기 제6 학습용 특징 정보를 이용하여 생성한 제6 학습용 태스크 특정 출력을 참조하여 획득된 제6 에러가 최소화되며, 상기 제6 학습용 원본 데이터와 상기 제6 학습용 변조 데이터를 참조하여 획득된 제7 에러가 최대화되도록 상기 변조 네트워크가 학습된 상태인 학습 장치.
  15. 제14항에 있어서,
    상기 학습된 러닝 네트워크는 서로 다른 태스크를 수행하는 복수의 학습된 러닝 네트워크들을 포함하며,
    상기 타 학습 장치에 의해, 상기 복수의 학습된 러닝 네트워크들 각각에 대응되는 에러들을 평균한 평균 에러를 이용하여 상기 변조 네트워크가 학습되거나, 상기 복수의 학습된 러닝 네트워크들 각각을 순차적으로 이용하여 상기 변조 네트워크가 순차적으로 학습되도록 한 학습 장치.
  16. 제10항에 있어서,
    상기 변조 네트워크는 타 학습 장치에 의해 학습된 상태이며,
    상기 타 학습 장치에 의해, (i) 제8 학습용 원본 데이터가 상기 변조 네트워크에 입력되어 상기 변조 네트워크를 통해 상기 제8 학습용 원본 데이터가 변조되어 제8 학습용 변조 데이터가 생성되며, (ii) 상기 제8 학습용 변조 데이터가 학습된 러닝 네트워크에 입력되어 상기 학습된 러닝 네트워크의 적어도 하나의 학습된 태스크 레이어와, 상기 적어도 하나의 학습된 태스크 레이어의 출력에서의 평균과 분산을 조정하는 적어도 하나의 학습된 제3 배치 노멀라이즈 레이어를 통해 상기 제8 학습용 변조 데이터를 러닝 연산하여 제8 학습용 특징 정보를 생성하도록 하며, 상기 제8 학습용 원본 데이터가 상기 학습된 러닝 네트워크에 입력되어 상기 학습된 러닝 네트워크의 상기 적어도 하나의 학습된 태스크 레이어와, 상기 적어도 하나의 학습된 태스크 레이어의 출력에서의 평균과 분산을 조정하는 적어도 하나의 학습된 제4 배치 노멀라이즈 레이어를 통해 상기 제8 학습용 원본 데이터를 러닝 연산하여 제9 학습용 특징 정보를 생성하도록 하며, (iii) 상기 제8 학습용 특징 정보와 상기 제9 학습용 특징 정보를 참조하여 생성한 제8 에러 및 상기 제8 학습용 특징 정보를 이용하여 생성한 제8 학습용 태스크 특정 출력을 참조하여 획득된 제9 에러 중 적어도 하나가 최소화되며, 상기 제8 학습용 원본 데이터와 상기 제8 학습용 변조 데이터를 참조하여 획득된 제10 에러가 최대화되도록 상기 변조 네트워크가 학습된 상태인 학습 장치.
  17. 제10항에 있어서,
    상기 사용자 러닝 네트워크는 서로 다른 태스크를 수행하는 복수의 사용자 러닝 네트워크들을 포함하며,
    상기 프로세서는, 상기 복수의 사용자 러닝 네트워크들 각각에 대응되는 에러들 각각을 최소화하도록 상기 에러들 각각에 대응되는 상기 복수의 사용자 러닝 네트워크들 각각을 학습시키거나, 상기 복수의 사용자 러닝 네트워크들 각각에 대응되는 에러들을 평균한 평균 에러를 최소화하도록 상기 복수의 사용자 러닝 네트워크들을 학습시키는 학습 장치.
  18. 개인 정보 보호를 위하여 원본 데이터를 비식별 처리한 변조 데이터를 인식하도록 학습된 사용자 러닝 네트워크를 테스트하는 테스팅 장치에 있어서,
    개인 정보 보호를 위하여 원본 데이터를 비식별 처리한 변조 데이터를 인식하도록 학습된 사용자 러닝 네트워크를 테스트하는 인스트럭션들이 저장된 메모리; 및
    상기 메모리에 저장된 인스트럭션들에 따라 개인 정보 보호를 위하여 원본 데이터를 비식별 처리한 변조 데이터를 인식하도록 학습된 상기 사용자 러닝 네트워크를 테스트하는 동작을 수행하는 프로세서;
    를 포함하며,
    상기 프로세서는, (I) 학습 장치에 의해, (i) 원본 데이터를 변조하여, 원본 데이터를 구분할 수 없으며 러닝 네트워크에서는 원본 데이터와 동일한 것으로 인식되는 변조 데이터를 생성하도록 학습된 변조 네트워크를 통해 제1_1 학습용 원본 데이터 내지 제1_m - 상기 m은 1 이상의 정수임 - 학습용 원본 데이터 각각을 변조한 제1 학습용 변조 데이터 내지 제m 학습용 변조 데이터를 데이터 제공자로부터 획득하고, 상기 제1_1 학습용 변조 데이터 내지 상기 제1_m 학습용 변조 데이터에서의 제1_i - 상기 i는 1 이상이며 상기 m 이하인 정수임 - 학습용 변조 데이터를 사용자 러닝 네트워크에 입력하여 상기 사용자 러닝 네트워크로 하여금 적어도 하나의 태스크 레이어(task layer)와, 상기 적어도 하나의 태스크 레이어의 출력에서의 평균과 분산을 조정하는 적어도 하나의 제1 배치 노멀라이즈 레이어를 통해 상기 제1_i 학습용 변조 데이터를 러닝 연산하여 제1 학습용 특징 정보를 생성하도록 하며, 상기 제1 학습용 특징 정보 또는 상기 제1 학습용 특징 정보를 이용하여 생성한 제1 학습용 태스크 특정 출력과, 상기 제1_i 학습용 변조 데이터에 대한 제1 그라운드 트루스를 참조하여 생성한 제1 에러를 최소화하도록 상기 적어도 하나의 제1 배치 노멀라이즈 레이어와 상기 적어도 하나의 태스크 레이어의 파라미터를 업데이트하여 상기 사용자 러닝 네트워크를 학습시키는 프로세스, 및 제2_1 학습용 원본 데이터 내지 제2_n 학습용 원본 데이터를 사용자로부터 획득하고, 상기 제2_1 학습용 원본 데이터 내지 상기 제2_m 학습용 원본 데이터에서의 제2_j - 상기 j는 1 이상이며 상기 n 이하인 정수임 - 학습용 원본 데이터를 상기 사용자 러닝 네트워크에 입력하여 상기 사용자 러닝 네트워크로 하여금 상기 적어도 하나의 태스크 레이어와, 상기 적어도 하나의 태스크 레이어의 출력에서의 평균과 분산을 조정하는 적어도 하나의 제2 배치 노멀라이즈 레이어를 통해 상기 제2_j 학습용 원본 데이터를 러닝 연산하여 제2 학습용 특징 정보를 생성하도록 하며, 상기 제2 학습용 특징 정보 또는 상기 제2 학습용 특징 정보를 이용하여 생성한 제2 학습용 태스크 특정 출력과, 상기 제2_j 학습용 원본 데이터에 대한 제2 그라운드 트루스를 참조하여 생성한 제2 에러를 최소화하도록 상기 적어도 하나의 제2 배치 노멀라이즈 레이어와 상기 적어도 하나의 태스크 레이어의 파라미터를 업데이트하여 상기 사용자 러닝 네트워크를 학습시키는 프로세스를 통해 상기 사용자 러닝 네트워크를 학습시킨 상태에서, 테스트용 데이터를 획득하는 프로세스, 및 (II) 상기 테스트용 데이터가 테스트용 원본 데이터일 경우에는, 상기 테스트용 데이터를 상기 사용자 러닝 네트워크로 입력하여 상기 사용자 러닝 네트워크로 하여금 상기 적어도 하나의 태스크 레이어(task layer)와 상기 적어도 하나의 제2 배치 노멀라이즈 레이어를 통해 상기 테스트용 데이터를 러닝 연산하여 제1 테스트용 특징 정보를 생성하도록 하는 프로세스와, 상기 테스트용 데이터가 테스트용 변조 데이터일 경우에는, 상기 테스트용 데이터를 상기 사용자 러닝 네트워크로 입력하여 상기 사용자 러닝 네트워크로 하여금 상기 적어도 하나의 태스크 레이어(task layer)와 상기 적어도 하나의 제1 배치 노멀라이즈 레이어를 통해 상기 테스트용 데이터를 러닝 연산하여 제2 테스트용 특징 정보를 생성하도록 하는 프로세스를 수행하는 테스팅 장치.
KR1020210139275A 2020-10-21 2021-10-19 개인 정보 보호를 위하여 원본 데이터를 비식별 처리한 변조 데이터를 인식하기 위한 사용자 러닝 네트워크를 학습하는 방법 및 테스팅하는 방법, 그리고, 이를 이용한 학습 장치 및 테스팅 장치 KR102395452B1 (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
KR20200137124 2020-10-21
KR1020200137124 2020-10-21
US17/244,991 2021-04-30
US17/244,991 US11244248B1 (en) 2020-10-21 2021-04-30 Method for training and testing user learning network to be used for recognizing obfuscated data created by obfuscating original data to protect personal information and user learning device and testing device using the same

Publications (2)

Publication Number Publication Date
KR20220052839A KR20220052839A (ko) 2022-04-28
KR102395452B1 true KR102395452B1 (ko) 2022-05-10

Family

ID=80215645

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210139275A KR102395452B1 (ko) 2020-10-21 2021-10-19 개인 정보 보호를 위하여 원본 데이터를 비식별 처리한 변조 데이터를 인식하기 위한 사용자 러닝 네트워크를 학습하는 방법 및 테스팅하는 방법, 그리고, 이를 이용한 학습 장치 및 테스팅 장치

Country Status (4)

Country Link
US (1) US11244248B1 (ko)
EP (1) EP4232994A4 (ko)
KR (1) KR102395452B1 (ko)
WO (1) WO2022086147A1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021006404A1 (ko) * 2019-07-11 2021-01-14 엘지전자 주식회사 인공지능 서버
US11423643B1 (en) * 2021-11-29 2022-08-23 Deeping Source Inc. Method for generating obfuscated image to be used in training learning net work and labeling device using the same
EP4266216A1 (en) * 2022-04-20 2023-10-25 Deeping Source Inc. Learning method and learning device for training obfuscation network capable of obfuscating original data for privacy to achieve information restriction obfuscation and testing method and testing device using the same

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101784265B1 (ko) 2016-06-09 2017-10-12 주식회사 그리즐리 빅데이터의 비식별화 처리 방법
KR102035796B1 (ko) 2018-07-26 2019-10-24 주식회사 딥핑소스 데이터를 비식별 처리하는 방법, 시스템 및 비일시성의 컴퓨터 판독 가능 기록 매체

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9087195B2 (en) * 2009-07-10 2015-07-21 Kaspersky Lab Zao Systems and methods for detecting obfuscated malware
US9058813B1 (en) * 2012-09-21 2015-06-16 Rawles Llc Automated removal of personally identifiable information
WO2016134782A1 (en) * 2015-02-26 2016-09-01 Longsand Limited Obfuscating training data
US9847974B2 (en) * 2016-04-28 2017-12-19 Xerox Corporation Image document processing in a client-server system including privacy-preserving text recognition
US10535120B2 (en) * 2017-12-15 2020-01-14 International Business Machines Corporation Adversarial learning of privacy protection layers for image recognition services
EP3682415B1 (en) * 2017-12-26 2022-04-27 Samsung Electronics Co., Ltd. Image acquisition device and method of controlling the same
US11347865B2 (en) * 2019-03-29 2022-05-31 Blackberry Limited Determining security risks in binary software code
US11636334B2 (en) * 2019-08-20 2023-04-25 Micron Technology, Inc. Machine learning with feature obfuscation
US10621378B1 (en) * 2019-10-24 2020-04-14 Deeping Source Inc. Method for learning and testing user learning network to be used for recognizing obfuscated data created by concealing original data to protect personal information and learning device and testing device using the same

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101784265B1 (ko) 2016-06-09 2017-10-12 주식회사 그리즐리 빅데이터의 비식별화 처리 방법
KR102035796B1 (ko) 2018-07-26 2019-10-24 주식회사 딥핑소스 데이터를 비식별 처리하는 방법, 시스템 및 비일시성의 컴퓨터 판독 가능 기록 매체

Also Published As

Publication number Publication date
WO2022086147A1 (en) 2022-04-28
EP4232994A4 (en) 2024-04-17
US11244248B1 (en) 2022-02-08
KR20220052839A (ko) 2022-04-28
EP4232994A1 (en) 2023-08-30

Similar Documents

Publication Publication Date Title
KR102184787B1 (ko) 개인 정보를 보호하기 위하여 원본 데이터를 컨실링 처리하여 생성된 변조 데이터를 인식하기 위해 사용되는 사용자 러닝 네트워크를 학습하는 방법 및 테스트하는 방법, 그리고 이를 이용한 학습 장치 및 테스트 장치
US10635788B2 (en) Method for training and testing obfuscation network capable of processing data to be concealed for privacy, and training device and testing device using the same
EP3812988A1 (en) Method for training and testing adaption network corresponding to obfuscation network capable of processing data to be concealed for privacy, and training device and testing device using the same
KR102395452B1 (ko) 개인 정보 보호를 위하여 원본 데이터를 비식별 처리한 변조 데이터를 인식하기 위한 사용자 러닝 네트워크를 학습하는 방법 및 테스팅하는 방법, 그리고, 이를 이용한 학습 장치 및 테스팅 장치
Chakraborty et al. Adversarial attacks and defences: A survey
KR102412832B1 (ko) 개인 정보 보호를 위하여 원본 데이터를 변조하는 변조 네트워크를 학습하는 방법 및 테스팅하는 방법, 그리고, 이를 이용한 학습 장치 및 테스팅 장치
KR102412829B1 (ko) 개인 정보 보호를 위하여 원본 데이터를 변조하는 변조 네트워크를 학습하는 방법 및 테스팅하는 방법, 그리고, 이를 이용한 학습 장치 및 테스팅 장치
US11017319B1 (en) Method for training obfuscation network which conceals original data to be used for machine learning and training surrogate network which uses obfuscated data generated by obfuscation network and method for testing trained obfuscation network and learning device and testing device using the same
US11308359B1 (en) Methods for training universal discriminator capable of determining degrees of de-identification for images and obfuscation network capable of obfuscating images and training devices using the same
EP3471060B1 (en) Apparatus and methods for determining and providing anonymized content within images
CN110874471B (zh) 保护隐私安全的神经网络模型的训练方法和装置
KR102570955B1 (ko) 러닝 네트워크의 학습에 이용하기 위한 익명화 이미지를 생성하는 방법 및 이를 이용한 라벨링 장치
US11366930B1 (en) Method for training and testing obfuscation network capable of obfuscating data to protect personal information, and learning device and testing device using the same
KR20230121974A (ko) 개인 정보 보호를 위하여 원본 데이터를 변조하는 변조네트워크를 학습하는 방법 및 테스트하는 방법, 그리고, 이를 이용한 학습 장치 및 테스트 장치
KR20220073582A (ko) 원본 의료 이미지의 영역별로 서로 다른 컨실링 프로세스가 수행되도록 하여 원본 의료 이미지를 컨실링 처리하는 변조 네트워크를 학습하는 방법 및 테스트하는 방법, 그리고 이를 이용한 학습 장치 및 테스트 장치
KR102260039B1 (ko) 개인 정보 보호를 위하여 원본 데이터를 컨실링 처리하는 변조 네트워크를 학습하는 방법 및 테스트하는 방법, 그리고, 이를 이용한 학습 장치 및 테스트 장치
KR102244190B1 (ko) 데이터를 컨실링 처리하는 방법 및 이를 이용한 데이터 변조 장치
EP4266216A1 (en) Learning method and learning device for training obfuscation network capable of obfuscating original data for privacy to achieve information restriction obfuscation and testing method and testing device using the same
CN117852029A (zh) 神经网络后门检测方法及装置

Legal Events

Date Code Title Description
GRNT Written decision to grant