CN111373403A - 一种用于隐藏原始数据以保护个人信息的混淆网络的学习方法和测试方法,以及其学习装置和测试装置 - Google Patents

一种用于隐藏原始数据以保护个人信息的混淆网络的学习方法和测试方法,以及其学习装置和测试装置 Download PDF

Info

Publication number
CN111373403A
CN111373403A CN201980005836.1A CN201980005836A CN111373403A CN 111373403 A CN111373403 A CN 111373403A CN 201980005836 A CN201980005836 A CN 201980005836A CN 111373403 A CN111373403 A CN 111373403A
Authority
CN
China
Prior art keywords
training data
learning
network
obfuscated
feature information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201980005836.1A
Other languages
English (en)
Other versions
CN111373403B (zh
Inventor
金泰勋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Deep Source Co
Original Assignee
Deep Source Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Deep Source Co filed Critical Deep Source Co
Publication of CN111373403A publication Critical patent/CN111373403A/zh
Application granted granted Critical
Publication of CN111373403B publication Critical patent/CN111373403B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • G06F21/6254Protecting personal data, e.g. for financial or medical purposes by anonymising data, e.g. decorrelating personal data from the owner's identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2148Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/10Protecting distributed programs or content, e.g. vending or licensing of copyrighted material ; Digital rights management [DRM]
    • G06F21/12Protecting executable software
    • G06F21/14Protecting executable software against software analysis or reverse engineering, e.g. by obfuscation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/606Protecting data by securing the transmission between two devices or processes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/14Transformations for image registration, e.g. adjusting or mapping for alignment of images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06V10/7747Organisation of the process, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/52Surveillance or monitoring of activities, e.g. for recognising suspicious objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L2209/00Additional information or applications relating to cryptographic mechanisms or cryptographic arrangements for secret or secure communication H04L9/00
    • H04L2209/16Obfuscation or hiding, e.g. involving white box

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • Medical Informatics (AREA)
  • Bioethics (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Multimedia (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Technology Law (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Facsimile Transmission Control (AREA)
  • Digital Transmission Methods That Use Modulated Carrier Waves (AREA)
  • Image Analysis (AREA)
  • Filters That Use Time-Delay Elements (AREA)

Abstract

本发明提供一种学习用于隐藏(Concealing)原始数据以保护个人信息的混淆网络(Obfuscation Network)的方法,所述方法包括:学习装置指示混淆网络对输入的训练数据进行混淆,将混淆后的训练数据输入到学习网络中,并使学习网络将网络运算应用于混淆后的训练数据,从而生成第1特征信息;使学习网络将网络运算应用于输入的训练数据,从而生成第2特征信息;以及学习混淆网络,以使通过参考将第1特征信息和第2特征信息作为参考而获得的错误与将任务特定输出(Task Specific Output)和其对应的真实数据(Ground Truth)作为参考而获得的错误中的至少一部分来计算出的错误最小化,并使通过参考训练数据和混淆的训练数据来计算出的错误最大化。

Description

一种用于隐藏原始数据以保护个人信息的混淆网络的学习方 法和测试方法,以及其学习装置和测试装置
技术领域
本发明涉及一种用于隐藏(Concealing)原始数据以保护个人信息的混淆网络的学习方法以及其学习装置,并还涉及一种用于隐藏原始数据以保护个人信息的学习的混淆网络的测试方法以及其测试装置。
背景技术
大数据(Big Data)是指包括现有企业环境或公共机构中使用的所有结构化数据以及尚未使用的所有非结构化或半结构化数据的数据,例如电子商务数据、元数据、Web日志数据、射频识别(RFID,Radio Frequency Identification)数据、传感器网络数据、社交网络数据、互联网文本和文档上的数据、互联网搜索索引数据等。从普通软件工具和计算机系统难以处理如此大量数据的意义上来说,此类数据通常被称为大数据。
大数据本身可能毫无意义,但如果对模式等进行机器学习,则对在各个领域中生成新数据或做出判断或预测会很有用。
近年来,由于加强了《个人信息保护法》等,因此为了交易或共享这样的大数据,需要从该数据中删除个人可识别信息或者获得该个人的同意。然而,不仅难以一一检查大量大数据中是否存在个人可识别信息,而且还无法获得每个人的同意,因此支持解决这一问题的各种技术正在出现。
作为相关现有技术的一例,可以举出例如韩国注册专利公报第1861520号中公开的技术,该技术提供了一种面部隐藏方法,其包括:检测步骤,其用于检测要变换的输入图像中人的面部区域;第一隐藏步骤,其将所检测到的面部区域转换为不具有人脸形状的变形的第一图像,以便从所述输入图像中隐藏人;以及第二隐藏步骤,其基于所述第一图像生成具有预定面部形状的第二图像,并在所述输入图像中将所述第一图像转换为所述第二图像,其中所述第二图像生成为具有与所述检测步骤中检测到的面部区域的形状不同的面部形状。
然而,根据包括上述技术的现有技术,确定数据中是否包括面部、文本等的识别信息,并通过掩蔽(Masking)或模糊(Blur)来擦除或隐藏与识别信息相对应的部分。由于原始数据的损坏,该方法难以在机器学习中使用,并且经常出现数据包括不可预测的识别信息且无法隐藏(例如,匿名化)的情况。尤其,常规的安全摄像机(Security Camera)通过模糊视频图像中帧之间具有变化的所有像素来进行匿名化处理,当以这种方式进行匿名化处理时,其问题在于,不仅诸如匿名化面部的面部表情之类的主要信息变得不同于原始视频图像中包括的信息,而且在面部检测期间丢失的个人识别信息也保留在原始视频图像上。另外,可以使用现有的视频去模糊(Deblurring)技术之一将模糊的视频图像恢复为原始状态。
因此,本发明人提出了一种混淆(Obfuscation)数据的生成方法,使得混淆数据不同于原始数据,其中,将原始数据输入到机器学习模型中的输出结果和将所述混淆数据输入到该机器学习模型中的输出结果彼此相同或相似。
发明内容
【要解决的技术问题】
本发明的目的在于解决上述现有技术的所有问题。
本发明的另一目的在于使得可以进行简单且准确的隐藏(Concealing)操作而无需在数据中查找个人识别信息的过程。
另外,本发明的另一目的还在于对原始数据进行不可逆地混淆(Obfuscation)以生成隐藏数据,从而保护原始数据的安全性和私密性。
另外,本发明的另一目的还在于生成被计算机识别为相似或相同但被人识别为不同的数据。
此外,本发明的另一目的还在于进一步振兴大数据交易市场。
【技术方案】
用于实现上述目的的本发明的代表性构造如下。
根据本发明的一方面,本发明提供一种学习用于隐藏(Concealing)原始数据以保护个人信息的混淆网络(Obfuscation Network)的方法,所述方法包括:(a)当获取训练数据时,学习装置将所述训练数据输入到混淆网络中,以使所述混淆网络对所述训练数据进行混淆,从而生成混淆的训练数据;(b)所述学习装置(i)将所述混淆的训练数据输入到具有至少一个学习参数的学习网络中,以使所述学习网络(i-1)用所述学习参数将网络运算应用于所述混淆的训练数据,(i-2)从而生成与所述混淆的训练数据相对应的第1特征信息,(ii)并将所述训练数据输入到所述学习网络中,以使所述学习网络(ii-1)用所述学习参数将网络运算应用于所述训练数据,(ii-2)从而生成与所述训练数据相对应的第2特征信息;以及(c)所述学习装置学习所述混淆网络,(i)(i-1)以使通过参考将所述第1特征信息和所述第2特征信息作为参考而获得的至少一个第1_1错误与(i-2)将使用所述第1特征信息来生成的任务特定输出(Task Specific Output)和其对应的至少一个真实数据(Ground Truth)作为参考而获得的至少一个第1_2错误中的至少一部分来计算出的至少一个第1错误最小化,(ii)并使通过参考所述训练数据和所述混淆的训练数据来计算出的至少一个第2错误最大化。
根据本发明一实施例,所述学习网络包括具有至少一个第1学习参数至至少一个第n学习参数的第1学习网络至第n学习网络,其中,当所述n为1或更大的整数时,在所述步骤(b)中,所述学习装置(i)将所述混淆的训练数据输入到每个所述第1学习网络至所述第n学习网络中,以使每个所述第1学习网络至所述第n学习网络(i-1)用每个所述第1学习网络至所述第n学习网络的所述第1学习参数至所述第n学习参数将与每个网络相对应的网络运算应用于所述混淆的训练数据,(i-2)从而输出关于所述混淆的训练数据的每个第1_1特征信息至第1_n特征信息,(ii)并将所述训练数据输入到每个所述第1学习网络至所述第n学习网络中,以使每个所述第1学习网络至所述第n学习网络(ii-1)用每个所述第1学习参数至所述第n学习参数将与每个网络相对应的网络运算应用于所述训练数据,(ii-2)从而输出关于所述训练数据的每个第2_1特征信息至第2_n特征信息,在所述步骤(c)中,所述学习装置学习所述混淆网络,(i)(i-1)以使通过参考作为将所述第1_1特征信息和所述第2_1特征信息作为参考而获得的第(1_1)_1错误至将所述第1_n特征信息和所述第2_n特征信息作为参考而获得的第(1_1)_n错误的平均值的所述第1_1错误与(i-2)(i-2a)作为将用所述第1_1特征信息生成的至少一个第1任务特定输出和(i-2b)其对应的至少一个第1真实数据作为参考而获得的第(1_2)_1错误至(i-2a)将用所述第1_n特征信息生成的至少一个第n任务特定输出和(i-2b)其对应的至少一个第n真实数据作为参考而获得的第(1_2)_n错误的平均值的所述第1_2错误中至少一部分来计算出的所述第1错误最小化,(ii)并使通过参考所述训练数据和所述混淆的训练数据来计算出的所述第2错误最大化。
根据本发明一实施例,所述学习网络包括具有至少一个第1学习参数至至少一个第n学习参数的第1学习网络至第n学习网络,其中,当所述n为1或更大的整数时,在所述步骤(a)中,所述学习装置将所述训练数据输入到所述混淆网络中,以使所述混淆网络对所述训练数据进行混淆,从而生成第1混淆的训练数据,在所述步骤(b)中,所述学习装置(i)将所述第1混淆的训练数据输入到所述第1学习网络中,以使所述第1学习网络(i-1)用所述第1学习网络的所述第1学习参数将网络运算应用于所述第1混淆的训练数据,(i-2)从而输出与所述第1混淆的训练数据相对应的第1_1特征信息,(ii)并将所述训练数据输入到所述第1学习网络中,以使所述第1学习网络(ii-1)用所述第1学习参数将网络运算应用于所述训练数据,(ii-2)从而输出与所述训练数据相对应的第2_1特征信息,在所述步骤(c)中,所述学习装置学习所述混淆网络,(i)以使通过参考(i-1)将所述第1_1特征信息和所述第2_1特征信息作为参考而获得的至少一个第(1_1)_1错误与(i-2)将用所述第1_1特征信息生成的至少一个第1任务特定输出和其对应的至少一个第1真实数据作为参考而获得的至少一个第(1_2)_1错误中至少一部分来计算出的至少一个第1_1错误最小化,(ii)并使通过参考所述训练数据和所述第1混淆的训练数据来计算出的至少一个所述第2_1错误最大化,从而使所述混淆网络成为第1学习的混淆网络,所述学习装置在将整数k从2增加到n的同时,(i)将所述训练数据输入到所述第k-1学习的混淆网络中,以使所述第k-1学习的混淆网络对所述训练数据进行混淆,从而生成第k混淆的训练数据,(ii)(ii-1)将所述第k混淆的训练数据输入到第k学习网络中,以使所述第k学习网络用所述第k学习网络中至少一个第k学习参数将网络运算应用于所述第k混淆的训练数据,从而输出关于所述第k混淆的训练数据的第1_k特征信息,(ii-2)将所述训练数据输入到所述第k学习网络中,以使所述第k学习网络用所述第k学习参数将网络运算应用于所述训练数据,从而输出关于所述训练数据的第2_k特征信息,(iii)学习所述第k-1学习的混淆网络,(iii-1)(iii-1a)以使通过参考将所述第1_k特征信息和所述第2_k特征信息作为参考而获得的至少一个第(1_1)_k错误与(iii-1b)将用所述第1_k特征信息生成的至少一个第k任务特定输出和其对应的至少一个第k真实数据作为参考而获得的至少一个第(1_2)_k错误中至少一部分来计算出的至少一个第1_k错误最小化,(iii-2)并使通过参考所述训练数据和所述第k混淆的训练数据来计算出的至少一个所述第2_k错误最大化,从而使所述k-1学习的混淆网络成为第k学习的混淆网络。
根据本发明一实施例,在所述步骤(c)中,在获得与输入到鉴别器(Discriminator)的所述混淆的训练数据相对应的至少一个混淆的训练数据分数(Obfuscated Training Data Score)作为所述第2错误的状态下,其中所述鉴别器鉴别所输入数据的真实性,所述学习装置(i)在学习所述混淆网络以最小化所述第1错误并最大化所述第2错误的同时,(ii)学习所述鉴别器,以使与输入到所述鉴别器的修改训练数据或混淆的修改训练数据相对应的至少一个修改训练数据分数或至少一个混淆的修改训练数据分数最大化并使所述混淆的训练数据分数最小化,其中所述修改训练数据或所述混淆的修改训练数据为分别通过修改所述训练数据或所述混淆的训练数据而生成的数据。
根据本发明一实施例,所述学习网络包括具有至少一个第1学习参数至至少一个第n学习参数的第1学习网络至第n学习网络,其中,当所述n为1或更大的整数时,在所述步骤(b)中,所述学习装置(i)将所述混淆的训练数据输入到每个所述第1学习网络至所述第n学习网络中,以使每个所述第1学习网络至所述第n学习网络(i-1)用每个所述第1学习网络至所述第n学习网络的所述第1学习参数至所述第n学习参数将与每个网络相对应的网络运算应用于所述混淆的训练数据,(i-2)从而输出关于所述混淆的训练数据的每个第1_1特征信息至第1_n特征信息,(ii)并将所述训练数据输入到每个所述第1学习网络至所述第n学习网络中,以使每个所述第1学习网络至所述第n学习网络(ii-1)用每个所述第1学习参数至所述第n学习参数将与每个网络相对应的网络运算应用于所述训练数据,(ii-2)从而输出关于所述训练数据的每个第2_1特征信息至第2_n特征信息,在所述步骤(c)中,所述学习装置(i)学习所述混淆网络,(i-1)以使通过参考作为将所述第1_1特征信息和所述第2_1特征信息作为参考而获得的第(1_1)_1错误至将所述第1_n特征信息和所述第2_n特征信息作为参考而获得的第(1_1)_n错误的平均值的所述第1_1错误与(i-2)(i-2a)作为将用所述第1_1特征信息生成的至少一个第1任务特定输出和(i-2b)其对应的至少一个第1真实数据作为参考而获得的第(1_2)_1错误至(i-2a)将用所述第1_n特征信息生成的至少一个第n任务特定输出和(i-2b)其对应的至少一个第n真实数据作为参考而获得的第(1_2)_n错误的平均值的所述第1_2错误中至少一部分来计算出的所述第1错误最小化,且使作为与输入到所述鉴别器的所述混淆的训练数据相对应的所述混淆的训练数据分数的所述第2错误最大化,(ii)并且学习所述鉴别器,以使与输入到所述鉴别器的所述修改训练数据或所述混淆的修改训练数据相对应的所述修改训练数据分数或所述混淆的修改训练数据分数最大化且使所述混淆的训练数据分数最小化。
根据本发明一实施例,所述学习网络包括分别具有第1学习参数至第n学习参数的第1学习网络至第n学习网络,其中,当所述n为1或更大的整数时,在所述步骤(a)中,所述学习装置将所述训练数据输入到所述混淆网络中,以使所述混淆网络对所述训练数据进行混淆,从而生成第1混淆的训练数据,在所述步骤(b)中,所述学习装置(i)将所述第1混淆的训练数据输入到所述第1学习网络中,以使所述第1学习网络(i-1)用所述第1学习网络的所述第1学习参数将网络运算应用于所述第1混淆的训练数据,(i-2)从而输出与所述第1混淆的训练数据相对应的第1_1特征信息,(ii)并将所述训练数据输入到所述第1学习网络中,以使所述第1学习网络(ii-1)用所述第1学习参数将网络运算应用于所述训练数据,(ii-2)从而输出与所述训练数据相对应的第2_1特征信息,在所述步骤(c)中,所述学习装置学习所述混淆网络,(i)(i-1)以使通过参考将所述第1_1特征信息和所述第2_1特征信息作为参考而获得的至少一个第(1_1)_1错误与(i-2)(i-2a)将用所述第1_1特征信息生成的至少一个第1任务特定输出和(i-2b)其对应的至少一个第1真实数据作为参考而获得的第(1_2)_1错误中至少一部分来计算出的至少一个第1_1错误最小化,(ii)并使作为与输入到所述鉴别器的所述第1混淆的训练数据相对应的至少一个第1混淆的训练数据分数的至少一个所述第2_1错误最大化,从而使所述混淆网络成为第1学习的混淆网络,所述学习装置学习所述鉴别器,(i)以使与输入到所述鉴别器的所述修改训练数据或所述混淆的修改训练数据相对应的至少一个第1修改训练数据分数或至少一个第1混淆的修改训练数据分数最大化,(ii)并使所述第1混淆的训练数据分数最小化,从而使所述鉴别器成为第1学习的鉴别器,所述学习装置在将整数k从2增加到n的同时,(i)将所述训练数据输入到所述第k-1学习的混淆网络中,以使所述第k-1学习的混淆网络对所述训练数据进行混淆,从而生成第k混淆的训练数据,(ii)(ii-1)将所述第k混淆的训练数据输入到第k学习网络中,以使所述第k学习网络用所述第k学习网络中至少一个第k学习参数将网络运算应用于所述第k混淆的训练数据,从而输出关于所述第k混淆的训练数据的第1_k特征信息,(ii-2)将所述训练数据输入到所述第k学习网络中,以使所述第k学习网络用所述第k学习参数将网络运算应用于所述训练数据,从而输出关于所述训练数据的第2_k特征信息,(iii)学习所述第k-1学习的混淆网络,(iii-1)以使通过参考将所述第1_k特征信息和所述第2_k特征信息作为参考而获得的至少一个第(1_1)_k错误与(iii-2)将用所述第1_k特征信息生成的至少一个第k任务特定输出和其对应的至少一个第k真实数据作为参考而获得的至少一个第(1_2)_k错误中至少一部分来计算出的至少一个第1_k错误最小化,并使作为与输入到所述第k-1学习的鉴别器的所述第k混淆的训练数据相对应的至少一个第k混淆的训练数据分数的至少一个第2_k错误最大化,从而使所述k-1学习的混淆网络成为第k学习的混淆网络,(iv)学习所述第k-1学习的鉴别器,以使与输入到所述第k-1学习的鉴别器的所述修改训练数据或所述混淆的修改训练数据相对应的至少一个第k修改训练数据分数或至少一个第k混淆的修改训练数据分数最大化,并使所述第k混淆的训练数据分数最小化,从而使所述k-1学习的鉴别器成为第k学习的鉴别器。
根据本发明一实施例,分别与输入到所述鉴别器的所述修改训练数据或所述混淆的修改训练数据相对应的所述修改训练数据分数或所述混淆的修改训练数据分数的最大值为1,作为用于鉴别所述修改训练数据或所述混淆的修改训练数据为真的值,并与输入到所述鉴别器的所述混淆的训练数据相对应的所述混淆的训练数据分数的最小值为0,作为用于鉴别所述混淆的训练数据为假的值。
根据本发明一实施例,在所述步骤(c)中,所述学习装置通过参考(i)所述第1特征信息和所述第2特征信息之间的差异与(ii)所述任务特定输出和所述真实数据之间的至少一个差异中的至少一部分来获取所述第1错误,并通过参考所述训练数据和所述混淆的训练数据之间的至少一个差异来获取第2错误。
根据本发明一实施例,所述学习装置通过参考所述第1特征信息和所述第2特征信息之间的范数(Norm)或余弦相似度(Cosine Similarity)来获取所述第1错误。
根据本发明一实施例,在所述步骤(c)中,所述学习装置通过参考所述混淆的训练数据的熵值和干扰程度中至少一部分来测量至少一种质量(Quality),并通过进一步参考测量的所述质量来获取所述第1错误。
根据本发明的另一方面,本发明提供一种学习用于隐藏原始数据以保护个人信息的混淆网络(Obfuscation Network)的测试方法,所述方法包括:(a)测试装置在学习装置已经执行以下过程的条件下获取测试数据:(i)获取训练数据并将其输入到混淆网络中,以使所述混淆网络对所述训练数据进行混淆,从而生成混淆的训练数据;(ii)将所述混淆的训练数据输入到具有至少一个学习参数的所述学习网络中,以使所述学习网络(ii-1)用所述学习参数将网络运算应用于所述混淆的训练数据,(ii-2)从而生成与所述混淆的训练数据相对应的第1特征信息;(iii)将所述训练数据输入到所述学习网络中,以使所述学习网络(iii-1)用所述学习参数将网络运算应用于所述训练数据,(iii-2)从而生成与所述训练数据相对应的第2特征信息;以及(iv)学习所述混淆网络,(iv-1)以使通过参考(iv-1a)将所述第1特征信息和所述第2特征信息作为参考而获得的至少一个第1_1错误与(iv-1b)将用所述第1特征信息生成的至少一个任务特定输出和其对应的至少一个真实数据作为参考而获得的至少一个第1_2错误中的至少一部分来计算出的至少一个第1错误最小化,(iv-2)使通过参考所述训练数据和所述混淆的训练数据来计算出的至少一个第2错误最大化;以及(b)所述测试装置将所述测试数据输入到所述混淆网络中,以使所述混淆网络使用所述混淆网络的所述学习参数来混淆所述测试数据,从而将混淆的测试数据输出为隐藏的测试数据。
根据本发明一实施例,在所述步骤(a)中,所述学习网络包括具有至少一个第1学习参数至至少一个第n学习参数的第1学习网络至第n学习网络,其中,当所述n为1或更大的整数时,所述学习装置(i)将所述混淆的训练数据输入到每个所述第1学习网络至所述第n学习网络中,以使每个所述第1学习网络至所述第n学习网络(i-1)用每个所述第1学习网络至所述第n学习网络的所述第1学习参数至所述第n学习参数将与每个网络相对应的网络运算应用于所述混淆的训练数据,(i-2)从而输出关于所述混淆的训练数据的每个第1_1特征信息至第1_n特征信息;(ii)并将所述训练数据输入到每个所述第1学习网络至所述第n学习网络中,以使每个所述第1学习网络至所述第n学习网络(ii-1)用每个所述第1学习网络至所述第n学习网络的所述第1学习参数至所述第n学习参数将与每个网络相对应的网络运算应用于所述训练数据,(ii-2)从而输出关于所述训练数据的每个第2_1特征信息至第2_n特征信息;(iii)学习所述混淆网络,(iii-1)以使通过参考(iii-1a)作为将所述第1_1特征信息和所述第2_1特征信息作为参考而获得的第(1_1)_1错误至将所述第1_n特征信息和所述第2_n特征信息作为参考而获得的第(1_1)_n错误的平均值的所述第1_1错误与(iii-1b)作为将用所述第1_1特征信息生成的至少一个第1任务特定输出和其对应的至少一个第1真实数据作为参考而获得的第(1_2)_1错误至将用所述第1_n特征信息生成的至少一个第n任务特定输出和其对应的至少一个第n真实数据作为参考而获得的第(1_2)_n错误的平均值的所述第1_2错误中至少一部分来计算出的所述第1错误最小化,(iii-2)并使通过参考所述训练数据和所述混淆的训练数据来计算出的所述第2错误最大化。
根据本发明一实施例,在所述步骤(a)中,所述学习装置(i)获得与输入到鉴别器的所述混淆的训练数据相对应的至少一个混淆的训练数据分数作为所述第2错误,其中所述鉴别器鉴别所输入数据的真实性,(ii)在学习所述混淆网络以最小化所述第1错误并最大化所述第2错误的同时,(iii)学习所述鉴别器,以使分别与输入到所述鉴别器的修改训练数据或混淆的修改训练数据相对应的至少一个修改训练数据分数或至少一个混淆的修改训练数据分数最大化并使所述混淆的训练数据分数最小化,其中所述修改训练数据或所述混淆的修改训练数据为分别通过修改所述训练数据或所述混淆的训练数据而生成的数据。
根据本发明一实施例,在所述步骤(a)中,所述学习网络包括具有至少一个第1学习参数至至少一个第n学习参数的第1学习网络至第n学习网络,其中,当所述n为1或更大的整数时,所述学习装置(i)将所述混淆的训练数据输入到每个所述第1学习网络至所述第n学习网络中,以使每个所述第1学习网络至所述第n学习网络(i-1)用每个所述第1学习网络至所述第n学习网络的所述第1学习参数至所述第n学习参数将与每个网络相对应的网络运算应用于所述混淆的训练数据,(i-2)从而输出关于所述混淆的训练数据的每个第1_1特征信息至第1_n特征信息;(ii)并将所述训练数据输入到每个所述第1学习网络至所述第n学习网络中,以使每个所述第1学习网络至所述第n学习网络(ii-1)用每个所述第1学习网络至所述第n学习网络的所述第1学习参数至所述第n学习参数将与每个网络相对应的网络运算应用于所述训练数据,(ii-2)从而输出关于所述训练数据的每个第2_1特征信息至第2_n特征信息;(iii)学习所述混淆网络,(iii-1)以使通过参考(iii-1a)作为将所述第1_1特征信息和所述第2_1特征信息作为参考而获得的第(1_1)_1错误至将所述第1_n特征信息和所述第2_n特征信息作为参考而获得的第(1_1)_n错误的平均值的所述第1_1错误与(iii-1b)作为将用所述第1_1特征信息生成的至少一个第1任务特定输出和其对应的至少一个第1真实数据作为参考而获得的第(1_2)_1错误至将用所述第1_n特征信息生成的至少一个第n任务特定输出和其对应的至少一个第n真实数据作为参考而获得的第(1_2)_n错误的平均值的所述第1_2错误中至少一部分来计算出的所述第1错误最小化,(iii-2)使作为与输入到所述鉴别器的所述混淆的训练数据相对应的所述修改训练数据分数的所述第2错误最大化;以及(iv)学习所述鉴别器,以使分别与输入到所述鉴别器的所述修改训练数据或所述混淆的修改训练数据相对应的所述修改训练数据分数或所述混淆的修改训练数据分数最大化并使所述修改训练数据分数最小化。
根据本发明的另一方面,本发明提供一种学习用于隐藏原始数据以保护个人信息的混淆网络(Obfuscation Network)的学习装置,所述装置包括:至少一个存储指令的存储器;以及至少一个处理器,其直接执行或使另一装置执行用于执行以下过程的指令:(I)当获取训练数据时,(i)将所述训练数据输入到混淆网络中,以使所述混淆网络对所述训练数据进行混淆,从而生成混淆的训练数据;(II)(i)将所述混淆的训练数据输入到具有至少一个学习参数的所述学习网络中,以使所述学习网络(i-1)用所述学习参数将网络运算应用于所述混淆的训练数据,(i-2)从而生成与所述混淆的训练数据相对应的第1特征信息,(ii)将所述训练数据输入到所述学习网络中,以使所述学习网络(ii-1)用所述学习参数将网络运算应用于所述训练数据,(ii-2)从而生成与所述训练数据相对应的第2特征信息;以及(III)学习所述混淆网络,(i)以使通过参考(i-1)将所述第1特征信息和所述第2特征信息作为参考而获得的至少一个第1_1错误与(i-2)将用所述第1特征信息生成的至少一个任务特定输出和其对应的至少一个真实数据作为参考而获得的至少一个第1_2错误中的至少一部分来计算出的至少一个第1错误最小化,(ii)使通过参考所述训练数据和所述混淆的训练数据来计算出的至少一个第2错误最大化。
根据本发明一实施例,所述学习网络包括具有至少一个第1学习参数至至少一个第n学习参数的第1学习网络至第n学习网络,其中,当所述n为1或更大的整数时,在所述步骤(II)中,所述处理器(i)将所述混淆的训练数据输入到每个所述第1学习网络至所述第n学习网络中,以使每个所述第1学习网络至所述第n学习网络(i-1)用每个所述第1学习网络至所述第n学习网络的所述第1学习参数至所述第n学习参数将与每个网络相对应的网络运算应用于所述混淆的训练数据,(i-2)从而输出关于所述混淆的训练数据的每个第1_1特征信息至第1_n特征信息,(ii)并将所述训练数据输入到每个所述第1学习网络至所述第n学习网络中,以使每个所述第1学习网络至所述第n学习网络(ii-1)用每个所述第1学习参数至所述第n学习参数将与每个网络相对应的网络运算应用于所述训练数据,(ii-2)从而输出关于所述训练数据的每个第2_1特征信息至第2_n特征信息,在所述步骤(III)中,所述处理器学习所述混淆网络,(i)(i-1)以使通过参考作为将所述第1_1特征信息和所述第2_1特征信息作为参考而获得的第(1_1)_1错误至将所述第1_n特征信息和所述第2_n特征信息作为参考而获得的第(1_1)_n错误的平均值的所述第1_1错误与(i-2)作为将用所述第1_1特征信息生成的至少一个第1任务特定输出和其对应的至少一个第1真实数据作为参考而获得的第(1_2)_1错误至将用所述第1_n特征信息生成的至少一个第n任务特定输出和其对应的至少一个第n真实数据作为参考而获得的第(1_2)_n错误的平均值的所述第1_2错误中至少一部分来计算出的所述第1错误最小化,(ii)并使通过参考所述训练数据和所述混淆的训练数据来计算出的所述第2错误最大化。
根据本发明一实施例,所述学习网络包括具有至少一个第1学习参数至至少一个第n学习参数的第1学习网络至第n学习网络,其中,当所述n为1或更大的整数时,在所述步骤(I)中,所述处理器将所述训练数据输入到所述混淆网络中,以使所述混淆网络对所述训练数据进行混淆,从而生成第1混淆的训练数据,在所述步骤(II)中,所述处理器(i)将所述第1混淆的训练数据输入到所述第1学习网络中,以使所述第1学习网络(i-1)用所述第1学习网络的所述第1学习参数将网络运算应用于所述第1混淆的训练数据,(i-2)从而输出与所述第1混淆的训练数据相对应的第1_1特征信息,(ii)并将所述训练数据输入到所述第1学习网络中,以使所述第1学习网络(ii-1)用所述第1学习参数将网络运算应用于所述训练数据,(ii-2)从而输出与所述训练数据相对应的第2_1特征信息,在所述步骤(III)中,所述处理器学习所述混淆网络,(i)以使通过参考(i-1)将所述第1_1特征信息和所述第2_1特征信息作为参考而获得的至少一个第(1_1)_1错误与(i-2)将用所述第1_1特征信息生成的至少一个第1任务特定输出和其对应的至少一个第1真实数据作为参考而获得的至少一个第(1_2)_1错误中至少一部分来计算出的至少一个第1_1错误最小化,(ii)并使通过参考所述训练数据和所述第1混淆的训练数据来计算出的至少一个所述第2_1错误最大化,从而使所述混淆网络成为第1学习的混淆网络,所述处理器在将整数k从2增加到n的同时,(i)将所述训练数据输入到所述第k-1学习的混淆网络中,以使所述第k-1学习的混淆网络对所述训练数据进行混淆,从而生成第k混淆的训练数据,(ii)(ii-1)将所述第k混淆的训练数据输入到第k学习网络中,以使所述第k学习网络用所述第k学习网络中至少一个第k学习参数将网络运算应用于所述第k混淆的训练数据,从而输出关于所述第k混淆的训练数据的第1_k特征信息,(ii-2)将所述训练数据输入到所述第k学习网络中,以使所述第k学习网络用所述第k学习参数将网络运算应用于所述训练数据,从而输出关于所述训练数据的第2_k特征信息,(iii)学习所述第k-1学习的混淆网络,(iii-1)(iii-1a)以使通过参考将所述第1_k特征信息和所述第2_k特征信息作为参考而获得的至少一个第(1_1)_k错误与(iii-1b)将用所述第1_k特征信息生成的至少一个第k任务特定输出和其对应的至少一个第k真实数据作为参考而获得的至少一个第(1_2)_k错误中至少一部分来计算出的至少一个第1_k错误最小化,(iii-2)并使通过参考所述训练数据和所述第k混淆的训练数据来计算出的至少一个所述第2_k错误最大化,从而使所述k-1学习的混淆网络成为第k学习的混淆网络。
根据本发明一实施例,在所述步骤(III)中,在获得与输入到鉴别器(Discriminator)的所述混淆的训练数据相对应的至少一个混淆的训练数据分数(Obfuscated Training Data Score)作为所述第2错误的状态下,其中所述鉴别器鉴别所输入数据的真实性,所述处理器(i)在学习所述混淆网络以最小化所述第1错误并最大化所述第2错误的同时,(ii)学习所述鉴别器,以使与输入到所述鉴别器的修改训练数据或混淆的修改训练数据相对应的至少一个修改训练数据分数或至少一个混淆的修改训练数据分数最大化并使所述混淆的训练数据分数最小化,其中所述修改训练数据或所述混淆的修改训练数据为分别通过修改所述训练数据或所述混淆的训练数据而生成的数据。
根据本发明一实施例,所述学习网络包括具有至少一个第1学习参数至至少一个第n学习参数的第1学习网络至第n学习网络,其中,当所述n为1或更大的整数时,在所述步骤(II)中,所述处理器置(i)将所述混淆的训练数据输入到每个所述第1学习网络至所述第n学习网络中,以使每个所述第1学习网络至所述第n学习网络(i-1)用每个所述第1学习网络至所述第n学习网络的所述第1学习参数至所述第n学习参数将与每个网络相对应的网络运算应用于所述混淆的训练数据,(i-2)从而输出关于所述混淆的训练数据的每个第1_1特征信息至第1_n特征信息,(ii)并将所述训练数据输入到每个所述第1学习网络至所述第n学习网络中,以使每个所述第1学习网络至所述第n学习网络(ii-1)用每个所述第1学习参数至所述第n学习参数将与每个网络相对应的网络运算应用于所述训练数据,(ii-2)从而输出关于所述训练数据的每个第2_1特征信息至第2_n特征信息,在所述步骤(III)中,所述处理器(i)学习所述混淆网络,(i-1)以使通过参考作为将所述第1_1特征信息和所述第2_1特征信息作为参考而获得的第(1_1)_1错误至将所述第1_n特征信息和所述第2_n特征信息作为参考而获得的第(1_1)_n错误的平均值的所述第1_1错误与(i-2)作为将用所述第1_1特征信息生成的至少一个第1任务特定输出和其对应的至少一个第1真实数据作为参考而获得的第(1_2)_1错误至将用所述第1_n特征信息生成的至少一个第n任务特定输出和其对应的至少一个第n真实数据作为参考而获得的第(1_2)_n错误的平均值的所述第1_2错误中至少一部分来计算出的所述第1错误最小化,且使作为与输入到所述鉴别器的所述混淆的训练数据相对应的所述混淆的训练数据分数的所述第2错误最大化,(ii)并且学习所述鉴别器,以使与输入到所述鉴别器的所述修改训练数据或所述混淆的修改训练数据相对应的所述修改训练数据分数或所述混淆的修改训练数据分数最大化且使所述混淆的训练数据分数最小化。
根据本发明一实施例,所述学习网络包括分别具有第1学习参数至第n学习参数的第1学习网络至第n学习网络,其中,当所述n为1或更大的整数时,在所述步骤(I)中,所述处理器将所述训练数据输入到所述混淆网络中,以使所述混淆网络对所述训练数据进行混淆,从而生成第1混淆的训练数据,在所述步骤(II)中,所述处理器(i)将所述第1混淆的训练数据输入到所述第1学习网络中,以使所述第1学习网络(i-1)用所述第1学习网络的所述第1学习参数将网络运算应用于所述第1混淆的训练数据,(i-2)从而输出与所述第1混淆的训练数据相对应的第1_1特征信息,(ii)并将所述训练数据输入到所述第1学习网络中,以使所述第1学习网络(ii-1)用所述第1学习参数将网络运算应用于所述训练数据,(ii-2)从而输出与所述训练数据相对应的第2_1特征信息,在所述步骤(III)中,所述处理器学习所述混淆网络,(i)以使通过参考(i-1)将所述第1_1特征信息和所述第2_1特征信息作为参考而获得的至少一个第(1_1)_1错误与(i-2)(i-2a)将用所述第1_1特征信息生成的至少一个第1任务特定输出和(i-2b)其对应的至少一个第1真实数据作为参考而获得的第(1_2)_1错误中至少一部分来计算出的至少一个第1_1错误最小化,(ii)并使作为与输入到所述鉴别器的所述第1混淆的训练数据相对应的至少一个第1混淆的训练数据分数的至少一个第2_1错误最大化,从而使所述混淆网络成为第1学习的混淆网络,所述处理器学习所述鉴别器,(i)以使与输入到所述鉴别器的所述修改训练数据或所述混淆的修改训练数据相对应的至少一个第1修改训练数据分数或至少一个第1混淆的修改训练数据分数最大化,(ii)并使所述第1混淆的训练数据分数最小化,从而使所述鉴别器成为第1学习的鉴别器,所述处理器在将整数k从2增加到n的同时,(i)将所述训练数据输入到所述第k-1学习的混淆网络中,以使所述第k-1学习的混淆网络对所述训练数据进行混淆,从而生成第k混淆的训练数据,(ii)(ii-1)将所述第k混淆的训练数据输入到第k学习网络中,以使所述第k学习网络用所述第k学习网络中至少一个第k学习参数将网络运算应用于所述第k混淆的训练数据,从而输出关于所述第k混淆的训练数据的第1_k特征信息,(ii-2)将所述训练数据输入到所述第k学习网络中,以使所述第k学习网络用所述第k学习参数将网络运算应用于所述训练数据,从而输出关于所述训练数据的第2_k特征信息,(iii)学习所述第k-1学习的混淆网络,(iii-1)以使通过参考将所述第1_k特征信息和所述第2_k特征信息作为参考而获得的至少一个第(1_1)_k错误与(iii-2)将用所述第1_k特征信息生成的至少一个第k任务特定输出和其对应的至少一个第k真实数据作为参考而获得的至少一个第(1_2)_k错误中至少一部分来计算出的至少一个第1_k错误最小化,并使作为与输入到所述第k-1学习的鉴别器的所述第k混淆的训练数据相对应的至少一个第k混淆的训练数据分数的至少一个第2_k错误最大化,从而使所述k-1学习的混淆网络成为第k学习的混淆网络,(iv)学习所述第k-1学习的鉴别器,以使与输入到所述第k-1学习的鉴别器的所述修改训练数据或所述混淆的修改训练数据相对应的至少一个第k修改训练数据分数或至少一个第k混淆的修改训练数据分数最大化,并使所述第k混淆的训练数据分数最小化,从而使所述k-1学习的鉴别器成为第k学习的鉴别器。
根据本发明一实施例,分别与输入到所述鉴别器的所述修改训练数据或所述混淆的修改训练数据相对应的所述修改训练数据分数或所述混淆的修改训练数据分数的最大值为1,作为用于鉴别所述修改训练数据或所述混淆的修改训练数据为真的值,并与输入到所述鉴别器的所述混淆的训练数据相对应的所述混淆的训练数据分数的最小值为0,作为用于鉴别所述混淆的训练数据为假的值。
根据本发明一实施例,在所述步骤(III)中,所述处理器通过参考(i)所述第1特征信息和所述第2特征信息之间的差异与(ii)所述任务特定输出和所述真实数据之间的至少一个差异中的至少一部分来获取所述第1错误,并通过参考所述训练数据和所述混淆的训练数据之间的至少一个差异来获取第2错误。
根据本发明一实施例,所述处理器通过参考所述第1特征信息和所述第2特征信息之间的范数(Norm)或余弦相似度(Cosine Similarity)来获取所述第1错误。
根据本发明一实施例,在所述步骤(III)中,所述处理器通过参考所述混淆的训练数据的熵值和干扰程度中至少一部分来测量至少一种质量(Quality),并通过进一步参考测量的所述质量来获取所述第1错误。
根据本发明的另一方面,本发明提供一种学习用于隐藏原始数据以保护个人信息的混淆网络(Obfuscation Network)的测试装置,所述装置包括:至少一个存储指令的存储器;以及至少一个处理器,其直接执行或使另一装置执行用于执行以下过程的指令:(I)学习装置在已经执行以下过程的条件下获取测试数据:(i)获取训练数据并将其输入到混淆网络中,以使所述混淆网络对所述训练数据进行混淆,从而生成混淆的训练数据;(ii)将所述混淆的训练数据输入到具有至少一个学习参数的所述学习网络中,以使所述学习网络(ii-1)用所述学习参数将网络运算应用于所述混淆的训练数据,(ii-2)从而生成与所述混淆的训练数据相对应的第1特征信息;(iii)将所述训练数据输入到所述学习网络中,以使所述学习网络(iii-1)用所述学习参数将网络运算应用于所述训练数据,(iii-2)从而生成与所述训练数据相对应的第2特征信息;以及(iv)学习所述混淆网络,(iv-1)以使通过参考(iv-1a)将所述第1特征信息和所述第2特征信息作为参考而获得的至少一个第1_1错误与(iv-1b)将用所述第1特征信息生成的至少一个任务特定输出和其对应的至少一个真实数据作为参考而获得的至少一个第1_2错误中的至少一部分来计算出的至少一个第1错误最小化,(iv-2)使通过参考所述训练数据和所述混淆的训练数据来计算出的至少一个第2错误最大化;以及(II)将所述测试数据输入到所述混淆网络中,以使所述混淆网络使用所述混淆网络的所述学习参数来混淆所述测试数据,从而将混淆的测试数据输出为隐藏的测试数据。
根据本发明一实施例,在所述步骤(I)中,所述学习网络包括具有至少一个第1学习参数至至少一个第n学习参数的第1学习网络至第n学习网络,其中,当所述n为1或更大的整数时,所述学习装置(i)将所述混淆的训练数据输入到每个所述第1学习网络至所述第n学习网络中,以使每个所述第1学习网络至所述第n学习网络(i-1)用每个所述第1学习网络至所述第n学习网络的所述第1学习参数至所述第n学习参数将与每个网络相对应的网络运算应用于所述混淆的训练数据,(i-2)从而输出关于所述混淆的训练数据的每个第1_1特征信息至第1_n特征信息;(ii)并将所述训练数据输入到每个所述第1学习网络至所述第n学习网络中,以使每个所述第1学习网络至所述第n学习网络(ii-1)用每个所述第1学习网络至所述第n学习网络的所述第1学习参数至所述第n学习参数将与每个网络相对应的网络运算应用于所述训练数据,(ii-2)从而输出关于所述训练数据的每个第2_1特征信息至第2_n特征信息;(iii)学习所述混淆网络,(iii-1)以使通过参考(iii-1a)作为将所述第1_1特征信息和所述第2_1特征信息作为参考而获得的第(1_1)_1错误至将所述第1_n特征信息和所述第2_n特征信息作为参考而获得的第(1_1)_n错误的平均值的所述第1_1错误与(iii-1b)作为将用所述第1_1特征信息生成的至少一个第1任务特定输出和其对应的至少一个第1真实数据作为参考而获得的第(1_2)_1错误至将用所述第1_n特征信息生成的至少一个第n任务特定输出和其对应的至少一个第n真实数据作为参考而获得的第(1_2)_n错误的平均值的所述第1_2错误中至少一部分来计算出的所述第1错误最小化,(iii-2)并使通过参考所述训练数据和所述混淆的训练数据来计算出的所述第2错误最大化。
根据本发明一实施例,在所述步骤(I)中,所述学习装置(i)获得与输入到鉴别器的所述混淆的训练数据相对应的至少一个混淆的训练数据分数作为所述第2错误,其中所述鉴别器鉴别所输入数据的真实性,(ii)在学习所述混淆网络以最小化所述第1错误并最大化所述第2错误的同时,(iii)学习所述鉴别器,以使分别与输入到所述鉴别器的修改训练数据或混淆的修改训练数据相对应的至少一个修改训练数据分数或至少一个混淆的修改训练数据分数最大化并使所述混淆的训练数据分数最小化,其中所述修改训练数据或所述混淆的修改训练数据为分别通过修改所述训练数据或所述混淆的训练数据而生成的数据。
根据本发明一实施例,在所述步骤(I)中,所述学习网络包括具有至少一个第1学习参数至至少一个第n学习参数的第1学习网络至第n学习网络,其中,当所述n为1或更大的整数时,所述学习装置(i)将所述混淆的训练数据输入到每个所述第1学习网络至所述第n学习网络中,以使每个所述第1学习网络至所述第n学习网络(i-1)用每个所述第1学习网络至所述第n学习网络的所述第1学习参数至所述第n学习参数将与每个网络相对应的网络运算应用于所述混淆的训练数据,(i-2)从而输出关于所述混淆的训练数据的每个第1_1特征信息至第1_n特征信息;(ii)并将所述训练数据输入到每个所述第1学习网络至所述第n学习网络中,以使每个所述第1学习网络至所述第n学习网络(ii-1)用每个所述第1学习网络至所述第n学习网络的所述第1学习参数至所述第n学习参数将与每个网络相对应的网络运算应用于所述训练数据,(ii-2)从而输出关于所述训练数据的每个第2_1特征信息至第2_n特征信息;(iii)学习所述混淆网络,(iii-1)以使通过参考(iii-1a)作为将所述第1_1特征信息和所述第2_1特征信息作为参考而获得的第(1_1)_1错误至将所述第1_n特征信息和所述第2_n特征信息作为参考而获得的第(1_1)_n错误的平均值的所述第1_1错误与(iii-1b)作为将用所述第1_1特征信息生成的至少一个第1任务特定输出和其对应的至少一个第1真实数据作为参考而获得的第(1_2)_1错误至将用所述第1_n特征信息生成的至少一个第n任务特定输出和其对应的至少一个第n真实数据作为参考而获得的第(1_2)_n错误的平均值的所述第1_2错误中至少一部分来计算出的所述第1错误最小化,(iii-2)使作为与输入到所述鉴别器的所述混淆的训练数据相对应的所述修改训练数据分数的所述第2错误最大化;以及(iv)学习所述鉴别器,以使分别与输入到所述鉴别器的所述修改训练数据或所述混淆的修改训练数据相对应的所述修改训练数据分数或所述混淆的修改训练数据分数最大化并使所述修改训练数据分数最小化。
除此之外,本发明还提供一种计算机可读记录介质,其用于记录执行本发明的方法的计算机程序。
【有益效果】
本发明的效果在于使得可以进行简单且准确的隐藏(Concealing)操作而无需在数据中查找个人识别信息的过程。
本发明的另一效果在于对原始数据进行不可逆地混淆(Obfuscation)以生成隐藏数据,从而保护原始数据的安全性和私密性。
另外,本发明的另一效果还在于可以生成被计算机识别为相似或相同但被人识别为不同的数据。
此外,本发明的另一效果还在于可以进一步振兴大数据交易市场。
附图说明
用于描述本发明实施例的以下附图仅为本发明实施例的一部分,并且本发明所属领域的普通技术人员(以下称为“普通技术人员”)可以基于这些附图获得其他附图,而无需进行任何创造性工作。
图1示出了根据本发明一实施例的用于学习隐藏(Concealing)原始数据的混淆网络的学习装置。
图2示出了根据本发明一实施例的用于学习隐藏原始数据的混淆网络的学习方法。
图3示出了根据本发明一实施例的用于学习隐藏原始数据的混淆网络的另一学习方法。
图4示出了根据本发明另一实施例的用于学习隐藏原始数据的混淆网络的学习方法。
图5示出了根据本发明另一实施例的用于学习隐藏原始数据的混淆网络的另一学习方法。
图6示出了根据本发明一实施例的用于测试学习的混淆网络的测试装置。
图7示出了根据本发明一实施例的用于测试学习的混淆网络的测试方法。
【附图标记说明】
100:学习装置
110:存储器
120:处理器
200:测试装置
210:存储器
220:处理器
具体实施方式
下面将参考附图描述本发明的详细内容,该附图示例性地示出可以实施本发明的特定实施例。足够详细地描述这些实施例,以使本领域技术人员可以实施本发明。应当理解,本发明的各种实施例尽管不同,但不一定互斥。例如,在不脱离本发明的精神和范围的情况下,本文中描述的特定特征、结构或特性可以通过从一实施例改变为另一实施例来实现。另外,应当理解,在不脱离本发明的精神和范围的情况下,可以改变每个实施例中的各个元件的位置或布置。因此,以下详细描述不应被理解为限制性的,并且本发明的范围应被认为包括所附的权利要求以及这些权利要求所享有的等同物的所有范围。附图中的相似附图标记贯穿多个方面表示相同或相似的元件。
下面,在本发明的详细描述和权利要求中,术语“包括”及其各种表达方式并不意味着排除其他技术特征、添加、元件或步骤。部分地从说明书中或部分地从本发明的实施中,本发明的其他目的、益处和特征对于本领域技术人员而言将是显而易见的。以下实施例和附图作为示例提供,但本发明不限于此。
为了使本领域普通技术人员能够容易地实施本发明,将参考附图详细描述本发明的各种优选实施例。
图1示出了根据本发明一实施例的用于学习隐藏(Concealing)(例如,匿名化)原始数据的混淆网络的学习装置。
参照图1,根据本发明一实施例的学习装置100可以包括:存储器110,其用于存储用于学习混淆网络的指令,其中,所述混淆网络用于混淆训练数据,以使学习网络100通过输入混淆的训练数据来计算出与通过输入训练数据来计算出的结果相同或相似的结果;以及处理器120,其用于根据存储在存储器110中的指令学习混淆网络。
具体而言,学习装置100通常可以使用至少一个计算装置(例如,计算机处理器、内存、存储器、输入设备、输出设备或其他现有计算装置的组件;诸如路由器或交换机等的电子通信设备;诸如网络附加存储(NAS)和存储区域网络(SAN)等的电子信息存储系统)和至少一个计算机装置(即,指示计算装置以特定方式运行的指令)的组合来实现期望的系统性能。
另外,计算装置的处理器可以包括诸如微处理单元(MPU,Micro ProcessingUnit)、中央处理单元(CPU,Central Processing Unit)、高速缓存(Cache Memory)和数据总线(Data Bus)等的硬件配置。此外,计算装置还可以包括执行特定目的的操作系统和应用程序的软件配置。
然而,计算装置不排除包括用于实施本发明的处理器、存储器、介质或其他计算元件的任何组合的集成装置。
另一方面,当获取学习数据时,学习装置100的处理器120根据存储在存储器110中的指令将训练数据输入到混淆网络(Obfuscation Network)中,以使混淆网络对训练数据进行混淆,从而生成混淆的训练数据。并且,学习装置100(i)将混淆的训练数据输入到具有至少一个学习参数的学习网络中,以使学习网络(i-1)用学习参数将网络运算应用于混淆的训练数据,(i-2)从而生成与混淆的训练数据相对应的第1特征信息(CharacteristicInformation),(ii)并将训练数据输入到学习网络中,以使学习网络(ii-1)用学习参数将网络运算应用于训练数据,(ii-2)从而生成与训练数据相对应的第2特征信息。然后,学习装置100可以学习混淆网络,(i)(i-1)以使通过参考将第1特征信息和第2特征信息作为参考而获得的至少一个第1_1错误与(i-2)将使用所述第1特征信息来生成的至少一个任务特定输出(Task Specific Output)和其对应的至少一个真实数据作为参考而获得的至少一个第1_2错误中的至少一部分来计算出的至少一个第1错误最小化,(ii)并使通过参考训练数据和混淆的训练数据来计算出的至少一个第2错误最大化。
另外,在获得与输入到鉴别器的混淆的训练数据相对应的至少一个混淆的训练数据分数作为第2错误的状态下,其中所述鉴别器鉴别所输入数据的真实性,学习装置(i)在学习混淆网络以最小化第1错误并最大化第2错误的同时,(ii)可以学习鉴别器,以使与输入到鉴别器的修改训练数据或混淆的修改训练数据相对应的至少一个修改训练数据分数或至少一个混淆的修改训练数据分数最大化并使混淆的训练数据分数最小化。
如下将参考图2至图5描述一种学习混淆网络的方法,所述方法可以通过使用根据如上所述配置的本发明一实施例的学习装置100来隐藏(例如,匿名化)原始数据以保护个人信息。
图2示出了根据本发明一实施例的用于学习隐藏原始数据的混淆网络的方法。
首先,当获取训练数据x时,学习装置100将训练数据x输入到混淆网络0中,以使混淆网络0对训练数据x进行混淆,从而生成混淆的训练数据x'(即,O(x))。
此时,训练数据x可以为作为用于学习的原始数据的原始训练数据,或者可以为通过修改(Modifying)原始训练数据来生成的修改训练数据,并且可以通过将用随机干扰产生网络(未示出)产生的至少一个随机干扰添加到原始训练数据来生成修改训练数据。作为一示例,可以指示随机干扰产生网络产生具有正态分布N(0,σ)的随机干扰,并且可以将所产生的干扰添加到原始训练数据以生成修改训练数据。另外,除了随机干扰之外,可以通过模糊(Blur)原始训练数据或改变原始训练数据的分辨率来生成修改训练数据,但不限于此,并且可以应用修改原始训练数据的各种方法。
另外,混淆的训练数据x'可以被人识别为与训练数据x不同的数据,但可以被学习网络识别为与训练数据x相同或相似的数据。
另一方面,作为一示例,混淆网络O可以包括:编码器(Encoder),其将至少一个卷积运算应用于图像作为训练数据x,以具有至少一个卷积层;以及解码器(Decoder),其将至少一个反卷积运算应用于从编码器输出的至少一个特征图并生成混淆的训练数据x',以具有至少一个反卷积层,但不限于此,而可以包括对输入的训练数据进行混淆的各种结构的学习网络。
接下来,学习装置100(i)将混淆的训练数据x'输入到具有至少一个学习参数的学习网络F中,以使学习网络F(i-1)用学习参数将网络运算应用于混淆的训练数据x',(i-2)从而生成与混淆的训练数据x'相对应的第1特征信息F(x'),(ii)并将训练数据x输入到学习网络F中,以使学习网络F(ii-1)用学习参数将网络运算应用于训练数据x,(ii-2)从而生成与训练数据x相对应的第2特征信息F(x)。
此时,学习网络F可以包括机器学习网络,但不限于此,并且可以包括通过将网络运算应用于用学习参数混淆的训练数据x'来输出第1特征信息F(x')且通过将网络运算应用于训练数据x来输出第2特征信息F(x)的所有训练数据。此外,机器学习网络可以包括k个最近邻居(k-Nearest Neighbors)、线性回归(Linear Regression)、逻辑回归(LogisticRegression)、支持向量机(SVM,Support Vector Machine)、决策树(Decision Tree)和随机森林(Random Forest)、神经网络(Neural Network)、聚类(Clustering)、可视化(Visualization)和降维(Dimensionality Reduction)、关联规则学习(Association RuleLearning)、深度信念网络(Deep Belief Network)、强化学习(Reinforcement Learning)和深度学习算法(Deep Learning Algorithm)中的至少一种,但机器学习网络不限于此,而可以包括各种学习算法。另外,用于隐藏处理的对象(例如,匿名对象)可以为原始数据x中包括的个人信息,其中,个人信息可以包括与个人有关的任何信息,例如个人识别信息、个人医疗信息、个人生物特征信息、个人行为信息等。
另外,第1特征信息F(x′)和第2特征信息F(x)可以为分别与混淆的训练数据x′和训练数据x相对应的特征(Feature)或Logit。另外,第1特征信息F(x')和第2特征信息F(x)可以为分别与混淆的训练数据x'和训练数据x中的预定特征相关的特征值,或者可以为包括与预定特征相关的向量(Vector)、矩阵(Matrix)和坐标(Coordinate)中的至少一个有关的值的Logit。例如,当训练数据x为面部图像数据时,上述结果可以为用于面部识别的类别、面部特征,例如笑脸表情、面部界标点(Landmark Point,例如眼睛的两个端点)的坐标。
接下来,学习装置100可以学习混淆网络0,(i)(i-1)以使通过参考将第1特征信息F(x′)和第2特征信息F(x)作为参考而获得的至少一个第1_1错误与(i-2)将使用第1特征信息F(x′)来生成的至少一个任务特定输出其对应的至少一个真实数据作为参考而获得的至少一个第1_2错误中的至少一部分来计算出的至少一个第1错误最小化,(ii)并使通过参考训练数据x和混淆的训练数据x'来计算出的至少一个第2错误最大化。即,在学习装置100学习混淆网络O时,使得混淆网络O通过使用第2错误来输出与训练数据x有很大不同的混淆的训练数据x',并使得学习网络F通过使用第1错误来将混淆的训练数据x'识别为与训练数据x相同或相似,从而输出混淆的训练数据x'。
此时,学习装置100可以通过参考(i)第1特征信息F(x′)和第2特征信息F(x)之间的差异与(ii)任务特定输出和其对应的真实数据之间的差异中的至少一部分来获得第1错误。作为一示例,学习装置100可以通过参考第1特征信息F(x')和第2特征信息F(x)之间的范数(Norm)或余弦相似度(Cosine Similarity)来获取第1错误,但不限于此,而可以应用能够计算第1特征信息F(x')和第2特征信息F(x)之间的差异的各种算法。另外,学习装置100可以通过参考训练数据x和混淆的训练数据x'之间的至少一个差异来获取第2错误。
此外,学习装置100通过参考混淆的训练数据x'的熵值和干扰程度中的至少一部分来测量至少一种质量(Quality),并通过进一步参考测量的质量来获取第1错误。即,学习装置100可以学习混淆网络O,以使混淆的训练数据x'的质量最小化,作为一示例,以使混淆的训练数据x'的熵值、干扰等最大化。
并且,当学习装置100学习混淆网络O以使第1错误最小化并以使第2错误最大化时,学习装置100可以固定而不更新学习网络F的学习参数,而可以仅继续学习混淆网络O。
另一方面,任务特定输出可以为学习网络F要执行的任务的输出,并可以具有根据学习网络F所学习的任务的各种结果,例如用于类别分类的类别的概率、从用于检测位置的回归中获得的坐标结果等,并且可以将激活单元(Activation Unit)的激励函数(Activation Function)应用于从学习网络F输出的特征信息,从而根据要由学习网络F执行的任务来生成任务特定输出。此时,激励函数可以包括但不限于S型(Sigmoid)函数、线性(Linear)函数、Softmax函数、ReLU(Rlinear)函数、平方(Square)函数、SQRT函数、Srlinear函数、ABS函数、TANH函数、Brlinear函数等。
作为一示例,当学习网络F执行用于类别分类的任务时,学习装置100可以将从学习网络F输出的第1特征信息映射到每个类别上,从而针对每个类别生成有关混淆的训练数据的概率。
此时,每个类别的概率可以表示从学习网络F为每个类别输出的第1特征信息F(x′)正确的概率。例如,当训练数据为面部图像数据时,可以将面部处于微笑状态的概率输出为0.75,而将面部处于不微笑状态的概率输出为0.25。此时,可以使用softmax算法将从学习网络F输出的第1特征信息F(x')映射到每个类别上,但不限于此,而各种算法可以用于将第1特征信息F(x')映射到每个类上。
图3示出了根据本发明一实施例的用于隐藏原始数据的混淆网络的另一学习方法,即,图2中的学习网络F由多个具有学习参数的学习网络F1、F2、...、Fn组成。此时,多个学习网络F1、F2、...、Fn中的每一个可以处于学习以执行至少一些彼此不同任务的状态。在下面的描述中,将省略从所述图2的描述中容易理解的部分。
首先,当获取训练数据x时,学习装置100将训练数据x输入到混淆网络0中,以使混淆网络0对训练数据x进行混淆,从而生成混淆的训练数据x'(即,O(x))。
此时,训练数据x可以为作为用于学习的原始数据的原始训练数据,或者可以为通过修改原始训练数据来生成的修改训练数据x',修改训练数据x'可以被人识别为与训练数据x不同的数据,但可以被学习网络识别为与训练数据x相同或相似的数据。
接下来,学习装置100将混淆的训练数据x'输入到每个第1学习网络F1至第n学习网络Fn中,以使每个第1学习网络F1至第n学习网络Fn(i)用每个第1学习网络F1至第n学习网络Fn的第1学习参数至第n学习参数将与每个网络相对应的网络运算应用于混淆的训练数据x',(ii)从而分别生成与混淆的训练数据x'相对应的第1_1特征信息F1(x′)至第1_n特征信息Fn(x′)。并且,学习装置100将训练数据x输入到每个第1学习网络F1至第n学习网络Fn中,以使每个第1学习网络F1至第n学习网络Fn(i)用每个第1学习网络F1至第n学习网络Fn的第1学习参数至第n学习参数将与每个网络相对应的网络运算应用于训练数据x,(ii)从而分别生成与训练数据x相对应的第1_1特征信息F1(x)至第1_n特征信息Fn(x)。
然后,学习装置100可以学习混淆网络0,(i)(i-1)以使通过参考作为将第1_1特征信息F1(x')和第2_1特征信息F1(x)作为参考而获得的第(1_1)_1错误至将第1_n特征信息Fn(x')和第2_n特征信息Fn(x)作为参考而获得的第(1_1)_n错误的平均值的第1_1错误与(i-2)作为将用第1_1特征信息F1(x')生成的至少一个第1任务特定输出和其对应的至少一个第1真实数据作为参考而获得的第(1_2)_1错误至将用所述第1_n特征信息生成的至少一个第n任务特定输出和其对应的至少一个第n真实数据作为参考而获得的第(1_2)_n错误的平均值的所述第1_2错误中至少一部分来计算出的第1错误最小化,(ii)并使通过参考训练数据x和混淆的训练数据x'来计算出的第2错误最大化。
即,学习装置100获得通过参考第1_1特征信息F1(x')和第2_1特征信息F1(x)来计算出的第(1_1)_1错误,并获得通过参考第1_2特征信息F2(x')和第2_2特征信息F2(x)来计算出的第(1_1)_2错误,与此类似地,获得通过参考第1_n特征信息Fn(x')和第2_n特征信息Fn(x)来计算出的第(1_1)_n错误,从而获得作为所述第(1_1)_1错误至所述第(1_1)_n错误的平均值的第1_1错误。另外,学习装置100获得将用第1_1特征信息F1(x')生成的第1任务特定输出和其对应的第1真实数据作为参考而获得的第(1_2)_1错误至将用所述第1_n特征信息Fn(x')生成的第n任务特定输出和其对应的第n真实数据作为参考而获得的第(1_2)_n错误,从而获得作为所述第(1_2)_1错误至第(1_2)_n错误的平均值的第1_2错误。此外,学习装置100可以学习混淆网络0,以使通过参考第1_1错误和第1_2错误中至少一部分来计算出的第1错误最小化且使第2错误最大化。即,第1错误可以为第1_1错误、第1_2错误,以及第1_1错误和第1_2错误的和中的任何一个,但本发明不限于此。
此外,学习装置100通过参考混淆的训练数据x'的熵值和干扰程度中的至少一部分来测量至少一种质量,并通过进一步参考测量的质量来获取第1错误。即,学习装置100可以学习混淆网络O,以使混淆的训练数据x'的质量最小化,作为一示例,以使混淆的训练数据x'的熵值、干扰等最大化。
并且,当学习装置100学习混淆网络O以使第1错误最小化并以使第2错误最大化时,学习装置100可以固定而不更新学习网络F的学习参数,而可以仅继续学习混淆网络O。
另一方面,学习装置100可以学习混淆网络,(i)(i-1)以使通过参考作为将第1_1特征信息F1(x')和第2_1特征信息F1(x)作为参考而获得的第(1_1)_1错误至将第1_n特征信息Fn(x')和第2_n特征信息Fn(x)作为参考而获得的第(1_1)_n错误的平均值的第1_1错误与(i-2)作为将用第1_1特征信息F1(x')生成的第1任务特定输出和其对应的第1真实数据作为参考而获得的第(1_2)_1错误至将用第1_n特征信息Fn(x')生成的第n任务特定输出和其对应的第n真实数据作为参考而获得的第(1_2)_n错误的平均值的第1_2错误中至少一部分来计算出的第1错误最小化,(ii)并使通过参考训练数据和混淆的训练数据x'来计算出的第2错误最大化。作为一示例,还可以顺序地学习混淆网络O,以使通过参考第(1_1)_1错误与第(1_2)_1错误中至少一部分来计算出的第1_1错误至通过参考第(1_1)_n错误与第(1_2)_n错误中至少一部分来计算出的第1_n错误最小化。
即,学习装置100将训练数据x输入到混淆网络O中,以使混淆网络O对训练数据x进行混淆,从而生成第1混淆的训练数据x1'。然后,学习装置100可以执行或使另一装置执行以下过程:(i)将第1混淆的训练数据x1'输入到第1学习网络F1中,以使第1学习网络F1(i-1)用第1学习网络F1的第1学习参数将网络运算应用于第1混淆的训练数据x1',(i-2)从而输出与第1混淆的训练数据x1'相对应的第1_1特征信息F1(x1');以及(ii)将训练数据x输入到第1学习网络F1中,以使第1学习网络F1(ii-1)用第1学习参数将网络运算应用于训练数据x,(ii-2)从而输出与训练数据x相对应的第2_1特征信息F1(x)。然后,学习装置100学习混淆网络0,(i)以使通过参考(i-1)将第1_1特征信息F1(x1')和第2_1特征信息F1(x)作为参考而获得的至少一个第(1_1)_1错误与(i-2)将用第1_1特征信息F1(x1')生成的至少一个第1任务特定输出和其对应的至少一个第1真实数据作为参考而获得的至少一个第(1_2)_1错误中至少一部分来计算出的至少一个第1_1错误最小化,(ii)并使通过参考训练数据x和第1混淆的训练数据x1'来计算出的至少一个第2_1错误最大化,从而使混淆网络0成为第1学习的混淆网络01。
另外,学习装置100在将整数k从2增加到n的同时,可以重复所述过程直到第n学习网络Fn,从而获得第n混淆网络On。
即,学习装置100将训练数据x输入到第k-1学习的混淆网络0(k-1)中,以使第k-1学习的混淆网络0(k-1)对训练数据x进行混淆,从而可以生成第k混淆的训练数据xk'。另外,学习装置100(i)将第k混淆的训练数据xk'输入到第k学习网络Fk中,以使第k学习网络Fk用第k学习网络Fk中至少一个第k学习参数将网络运算应用于第k混淆的训练数据xk',从而输出与第k混淆的训练数据xk'相对应的第1_k特征信息Fk(xk'),(ii)将训练数据x输入到第k学习网络Fk中,以使第k学习网络Fk用第k学习参数将网络运算应用于训练数据x,从而输出与训练数据x相对应的第2_k特征信息Fk(xk)。然后,学习装置100学习第k-1学习的混淆网络0(k-1),(i)以使通过参考(i-1)将第1_k特征信息Fk(xk')和第2_k特征信息Fk(x)作为参考而获得的至少一个第(1_1)_k错误与(i-2)将用所述第1_k特征信息生成的至少一个第1任务特定输出和其对应的至少一个第k真实数据作为参考而获得的至少一个第(1_2)_k错误中至少一部分来计算出的至少一个第1_k错误最小化,(ii)并使通过参考训练数据x和第k混淆的训练数据xk'来计算出的至少一个第2_k错误最大化,从而使第k-1学习的混淆网络0(k-1)成为第k学习的混淆网络0k。
图4示出了根据本发明另一实施例的用于学习隐藏原始数据的混淆网络的方法。在下面的描述中,将省略从所述图2和图3的描述中容易理解的部分。
首先,当获取训练数据x时,学习装置100将训练数据x输入到混淆网络0中,以使混淆网络0对训练数据x进行混淆,从而生成混淆的训练数据x'(即,O(x))。
接下来,学习装置100可以执行或辅助另一装置执行以下过程:(i)将混淆的训练数据x'输入到具有学习参数的学习网络F中,以使学习网络F(i-1)用学习参数将网络运算应用于混淆的训练数据x',(i-2)从而生成与混淆的训练数据x'相对应的第1特征信息F(x');以及(ii)并将训练数据x输入到学习网络F中,以使学习网络F(ii-1)用学习参数将网络运算应用于训练数据x,(ii-2)从而生成与训练数据x相对应的第2特征信息F(x)。
接下来,在获得与输入到鉴别器D的混淆的训练数据x'相对应的至少一个混淆的训练数据分数作为第2错误的状态下,其中所述鉴别器D鉴别所输入数据的真实性,学习装置(i)在学习混淆网络0以最小化第1错误并最大化第2错误的同时,(ii)可以学习鉴别器D,以使与输入到鉴别器D的修改训练数据或混淆的修改训练数据相对应的至少一个修改训练数据分数或至少一个混淆的修改训练数据分数最大化并使混淆的训练数据分数最小化。此时,可以通过将用随机干扰产生网络(未示出)产生的至少一个随机干扰添加到训练数据x或混淆的训练数据x'来分别生成修改训练数据或混淆的修改训练数据。作为一示例,可以指示随机干扰产生网络产生具有正态分布N(0,σ)的随机干扰,并且可以将所产生的干扰添加到训练数据x或混淆的训练数据x'以分别生成修改训练数据或混淆的修改训练数据。另外,可以通过模糊(Blur)训练数据x或混淆的训练数据x',或改变训练数据x或混淆的训练数据x'的分辨率来生成修改训练数据或混淆的修改训练数据,但不限于此,并且可以应用修改训练数据x或混淆的训练数据x'的各种方法。
即,学习装置100可以学习混淆网络O,以使得学习网络F通过使用第1错误来混淆训练数据x,从而输出被识别为与训练数据x相同或相似的混淆的训练数据x',并且使得学习网络F通过使用第2错误来输出与训练数据x不同但难以区分的混淆的训练数据x'。
此时,与输入到鉴别器D的修改训练数据或混淆的修改训练数据相对应的修改训练数据分数或混淆的修改训练数据分数的最大值可以为1,作为用于鉴别修改训练数据或混淆的修改训练数据为真的值,并与输入到鉴别器D的混淆的训练数据x'相对应的混淆的训练数据分数的最小值可以为0,作为用于鉴别混淆的训练数据x'为假的值。即,可以学习鉴别器D以将混淆的训练数据x'识别为修改的训练数据或混淆的修改训练数据。
图5示出了根据本发明另一实施例的用于隐藏原始数据的混淆网络的另一学习方法,图4中的学习网络F由多个具有学习参数的学习网络F1、F2、...、Fn组成。在下面的描述中,将省略从所述图2至图4的描述中容易理解的部分。
首先,当获取训练数据x时,学习装置100将训练数据x输入到混淆网络0中,以使混淆网络0对训练数据x进行混淆,从而生成混淆的训练数据x'(即,O(x))。
接下来,学习装置100将混淆的训练数据x'输入到每个第1学习网络F1至第n学习网络Fn中,以使每个第1学习网络F1至第n学习网络Fn(i)用每个第1学习网络F1至第n学习网络Fn的第1学习参数至第n学习参数将与每个网络相对应的网络运算应用于混淆的训练数据x',(ii)从而生成与混淆的训练数据x'相对应的第1_1特征信息F1(x′)至第1_n特征信息Fn(x′)。并且,学习装置100将训练数据x输入到每个第1学习网络F1至第n学习网络Fn中,以使每个第1学习网络F1至第n学习网络Fn(i)用每个第1学习网络F1至第n学习网络Fn的第1学习参数至第n学习参数将与每个网络相对应的网络运算应用于训练数据x,(ii)从而分别生成与训练数据x相对应的第1_1特征信息F1(x)至第1_n特征信息Fn(x)。
然后,学习装置100可以学习混淆网络0,(i)(i-1)以使通过参考作为将第1_1特征信息F1(x')和第2_1特征信息F1(x)作为参考而获得的第(1_1)_1错误至将第1_n特征信息Fn(x')和第2_n特征信息Fn(x)作为参考而获得的第(1_1)_n错误的平均值的第1_1错误与(i-2)作为将用第1_1特征信息F1(x')生成的至少一个第1任务特定输出和其对应的至少一个第1真实数据作为参考而获得的第(1_2)_1错误至将用第1_n特征信息Fn(x')生成的至少一个第n任务特定输出和其对应的至少一个第n真实数据作为参考而获得的第(1_2)_n错误的平均值的第1_2错误中至少一部分来计算出的第1错误最小化,(ii)并使作为与输入到鉴别器D的混淆的训练数据x'相对应的混淆的训练数据分数的第2错误最大化。并且,学习装置100可以学习鉴别器D,以使与输入到鉴别器D的修改训练数据或混淆的修改训练数据相对应的修改训练数据分数或混淆的修改训练数据分数最大化。
即,学习装置100可以获得通过参考第1_1特征信息F1(x')和第2_1特征信息F1(x)来计算出的第(1_1)_1错误,并可以获得通过参考第1_2特征信息F2(x')和第2_2特征信息F2(x)来计算出的第(1_1)_2错误,与此类似地,可以获得通过参考第1_n特征信息Fn(x')和第2_n特征信息Fn(x)来计算出的第(1_1)_n错误,从而获得作为所述第(1_1)_1错误至所述第(1_1)_n错误的平均值的第1_1错误。另外,学习装置100获得将用第1_1特征信息F1(x')生成的第1任务特定输出和其对应的第1真实数据作为参考而获得的第(1_2)_1错误至将用所述第1_n特征信息Fn(x')生成的第n任务特定输出和其对应的第n真实数据作为参考而获得的第(1_2)_n错误,从而可以获得作为所述第(1_2)_1错误至第(1_2)_n错误的平均值的第1_2错误。此外,学习装置100可以学习混淆网络0,以使通过参考第1_1错误和第1_2错误中至少一部分来计算出的第1错误最小化且使第2错误最大化。
另一方面,学习装置100学习混淆网络,(i)(i-1)以使通过参考作为将第1_1特征信息F1(x')和第2_1特征信息F1(x)作为参考而获得的第(1_1)_1错误至将第1_n特征信息Fn(x')和第2_n特征信息Fn(x)作为参考而获得的第(1_1)_n错误的平均值的第1_1错误与(i-2)作为将用第1_1特征信息F1(x')生成的第1任务特定输出和其对应的第1真实数据作为参考而获得的第(1_2)_1错误至将用第1_n特征信息Fn(x')生成的第n任务特定输出和其对应的第n真实数据作为参考而获得的第(1_2)_n错误的平均值的第1_2错误中至少一部分来计算出的第1错误最小化,(ii)使作为与输入到鉴别器的混淆的训练数据相对应的混淆的训练数据分数的第2错误最大化。作为另一示例,还可以顺序地学习混淆网络O,以使通过参考第(1_1)_1错误与第(1_2)_1错误中至少一部分来计算出的第1_1错误至通过参考第(1_1)_n错误与第(1_2)_n错误中至少一部分来计算出的第1_n错误最小化。
即,学习装置100将训练数据x输入到混淆网络O中,以使混淆网络O对训练数据x进行混淆,从而生成第1混淆的训练数据x1'。然后,学习装置100可以执行或辅助另一装置执行以下过程:(i)将第1混淆的训练数据x1'输入到第1学习网络F1中,以使第1学习网络F1(i-1)用第1学习网络F1的第1学习参数将网络运算应用于第1混淆的训练数据x1',(i-2)从而输出与第1混淆的训练数据x1'相对应的第1_1特征信息F1(x1');以及(ii)将训练数据x输入到第1学习网络F1中,以使第1学习网络F1(ii-1)用第1学习参数将网络运算应用于训练数据x,(ii-2)从而输出与训练数据x相对应的第2_1特征信息F1(x)。然后,学习装置100可以学习混淆网络0,(i)以使通过参考(i-1)将第1_1特征信息F1(x1')和第2_1特征信息F1(x)作为参考而获得的至少一个第(1_1)_1错误与(i-2)将用第1_1特征信息F1(x')生成的至少一个第1任务特定输出和其对应的至少一个第1真实数据作为参考而获得的至少一个第(1_2)_1错误中至少一部分来计算出的至少一个第1_1错误最小化,(ii)并使作为与输入到鉴别器D的第1混淆的训练数据x1'相对应的至少一个第1混淆的训练数据分数的至少一个第2_1错误最大化,从而使混淆网络0成为第1学习的混淆网络01。并且,学习装置100学习鉴别器D,以使与输入到鉴别器D的修改训练数据或混淆的修改训练数据相对应的至少一个第1修改训练数据分数或至少一个第1混淆的修改训练数据分数最大化,并使至少一个第1混淆的训练数据分数最小化,从而可以使鉴别器D成为第1学习的鉴别器D1。
另外,学习装置100在将整数k从2增加到n的同时,可以重复所述过程直到第n学习网络Fn,从而获得第n学习的混淆网络On。
即,学习装置100将训练数据x输入到第k-1学习的混淆网络0(k-1)中,以使第k-1混淆网络0(k-1)对训练数据x进行混淆,从而生成第k混淆的训练数据xk'。另外,学习装置100(i)将第k混淆的训练数据xk'输入到第k学习网络Fk中,以使第k学习网络Fk用第k学习网络Fk中至少一个第k学习参数将网络运算应用于第k混淆的训练数据xk',从而可以输出与第k混淆的训练数据xk'相对应的第1_k特征信息Fk(xk'),(ii)将训练数据x输入到第k学习网络Fk中,以使第k学习网络Fk用第k学习参数将网络运算应用于训练数据x,从而可以输出与训练数据x相对应的第2_k特征信息Fk(xk)。然后,学习装置100可以学习第k-1学习的混淆网络0(k-1),(i)以使通过参考(i-1)将第1_k特征信息Fk(xk')和第2_k特征信息Fk(x)作为参考而获得的至少一个第(1_1)_k错误与(i-2)将用第1_k特征信息Fk(x')生成的至少一个第1任务特定输出和其对应的至少一个第k真实数据作为参考而获得的至少一个第(1_2)_k错误中至少一部分来计算出的至少一个第1_k错误最小化,(ii)并使作为与输入到第k-1学习的鉴别器D(k-1)的第k混淆的训练数据xk'相对应的至少一个第k混淆的训练数据分数的至少一个第2_1错误最大化,从而使第k-1学习的混淆网络0(k-1)成为第k学习的混淆网络0k。另外,学习装置100可以学习第k-1学习的鉴别器D(k-1),以使与输入到第k-1学习的鉴别器D(k-1)的修改训练数据或混淆的修改训练数据相对应的至少一个第k修改训练数据分数或至少一个第k混淆的修改训练数据分数最大化,并使至少一个第k混淆的训练数据分数最小化,从而使第k-1学习的鉴别器D(k-1)成为第k学习的鉴别器Dk。
图6示出了根据本发明一实施例的用于测试学习的混淆网络0的测试装置。
参照图6,根据本发明的一实施例的测试装置200可以包括:存储器210,其用于存储用于测试学习的混淆网络的指令,其中,所述学习的混淆网络已经学习以使得学习网络通过使用混淆的测试数据来计算出与通过使用测试数据来计算出的结果相同或相似的结果;以及处理器120,其用于根据存储在存储器210中的指令测试学习的混淆网络。
具体而言,测试装置200通常可以使用至少一个计算装置(例如,计算机处理器、内存、存储器、输入设备、输出设备或其他现有计算装置的组件;诸如路由器或交换机等的电子通信设备;诸如网络附加存储(NAS)和存储区域网络(SAN)等的电子信息存储系统)和计算机装置(即,指示计算装置以特定方式运行的指令)的组合来实现期望的系统性能。
另外,计算装置的处理器可以包括诸如微处理单元(MPU,Micro ProcessingUnit)、中央处理单元(CPU,Central Processing Unit)、高速缓存(Cache Memory)和数据总线(Data Bus)等的硬件配置。此外,计算装置还可以包括执行特定目的的操作系统和应用程序的软件配置。
然而,计算装置不排除包括用于实施本发明的处理器、存储器、介质或其他计算元件的任何组合的集成处理器。
另一方面,学习装置(i)将训练数据输入到混淆网络中,以使混淆网络对训练数据进行混淆,从而生成混淆的训练数据;(ii)将混淆的训练数据输入到具有学习参数的学习网络中,以使学习网络用学习参数将网络运算应用于混淆的训练数据,从而生成与混淆的训练数据相对应的第1特征信息,并将训练数据输入到学习网络中,以使学习网络用学习参数将网络运算应用于训练数据,从而生成与训练数据相对应的第2特征信息,(iii)学习混淆网络,(iii-1)以使通过参考将第1特征信息和第2特征信息作为参考而获得的第1_1错误与(iii-2)将用第1特征信息生成的任务特定输出和其对应的真实数据作为参考而获得的第1_2错误中的至少一部分来计算出的第1错误最小化,并使通过参考训练数据和混淆的训练数据来计算出的第2错误最大化,当获取测试数据时,根据存储在存储器210中的指令,处理器220将测试数据输入到混淆网络中,以使混淆网络用混淆网络的学习参数来对测试数据进行混淆而输出混淆的测试数据,从而可以获得混淆的测试数据作为测试数据的经隐藏处理的数据。
另外,学习装置(i)将训练数据输入到混淆网络中,以使混淆网络对训练数据进行混淆,从而生成混淆的训练数据;(ii)将混淆的训练数据输入到具有学习参数的学习网络中,以使学习网络用学习参数将网络运算应用于混淆的训练数据,从而生成与混淆的训练数据相对应的第1特征信息,并将训练数据输入到学习网络中,以使学习网络用学习参数将网络运算应用于训练数据,从而生成与训练数据相对应的第2特征信息,(iii)学习混淆网络,(iii-1)以使通过参考将第1特征信息和第2特征信息作为参考而获得的第1_1错误与(iii-2)将用第1特征信息生成的任务特定输出和其对应的真实数据作为参考而获得的第1_2错误中的至少一部分来计算出的第1错误最小化,并使作为与输入到鉴别器的混淆的训练数据相对应的混淆的训练数据分数的第2错误最大化,其中所述鉴别器鉴别所输入数据的真实性,(iv)学习鉴别器,以使与输入到鉴别器的修改训练数据或混淆的修改训练数据相对应的修改训练数据分数或混淆的修改训练数据分数最大化并使混淆的训练数据分数最小化,当获取测试数据时,根据存储在存储器210中的指令,处理器220将测试数据输入到混淆网络中,以使混淆网络用混淆网络的学习参数来对测试数据进行混淆而输出混淆的测试数据,从而可以获得混淆的测试数据作为测试数据的经隐藏处理的数据。
图7示出了根据本发明一实施例的用于测试学习的混淆网络的方法。
参考图7,测试装置200可以将测试数据(例如,图7的左边上的原始图像)输入到已经学会对原始数据进行混淆的混淆网络O中,以输出与在学习网络中使用原始数据生成的结果相同或相似的混淆数据,并且指示混淆网络O根据学习参数对测试数据进行混淆,从而输出混淆的测试数据(例如,图7的右边上的混淆图像)。
作为参考,图7示例性地示出从CIFAR-10数据集中选择的64个图像样本,该数据集为由加拿大高级研究所(CIFAR,anadian Institute for Advanced Research)收集和整理的用于解决图像分类问题的数据。
使用图7的左边的图像样本作为原始数据,根据本发明实施例进行隐藏的混淆数据在图7的右边上示出。
参考图7,根据本发明实施例进行隐藏的位于图7的右边的64个混淆数据在视觉上不同于位于图7的左边的64个原始数据,但在输入到学习网络中时,学习网络输出与原始数据相同或相似的结果。
另一方面,学习的混淆网络O可以处于通过如图2至图5的描述中的方法学习的状态。
即,学习装置(i)将训练数据输入到混淆网络中,以使混淆网络对训练数据进行混淆,从而生成混淆的训练数据;(ii)将混淆的训练数据输入到具有学习参数的学习网络中,以使学习网络用学习参数将网络运算应用于混淆的训练数据,从而生成与混淆的训练数据相对应的第1特征信息,并将训练数据输入到学习网络中,以使学习网络用学习参数将网络运算应用于训练数据,从而生成与训练数据相对应的第2特征信息,(iii)学习混淆网络0,(iii-1)以使通过参考将第1特征信息和第2特征信息作为参考而获得的第1_1错误与(iii-2)将用第1特征信息生成的任务特定输出和其对应的真实数据作为参考而获得的第1_2错误中的至少一部分来计算出的第1错误最小化,并使通过参考训练数据和混淆的训练数据来计算出的第2错误最大化。
另外,所述学习网络可以包括分别具有第1学习参数到第n学习参数的第1学习网络到第n学习网络,学习装置(i)将混淆的训练数据输入到每个第1学习网络至第n学习网络中,以使每个第1学习网络至第n学习网络(i-1)用每个第1学习网络至第n学习网络的第1学习参数至第n学习参数将与每个网络相对应的网络运算应用于混淆的训练数据,(i-2)从而输出与混淆的训练数据相对应的每个第1_1特征信息至第1_n特征信息,(ii)并将训练数据输入到每个第1学习网络至第n学习网络中,以使每个第1学习网络至第n学习网络(ii-1)用每个第1学习网络至第n学习网络的第1学习参数至第n学习参数将与每个网络相对应的网络运算应用于训练数据,(ii-2)从而输出关于训练数据的每个第2_1特征信息至第2_n特征信息;(iii)学习混淆网络,(iii-1)以使通过参考(iii-1a)作为将第1_1特征信息和第2_1特征信息作为参考而获得的第(1_1)_1错误至将第1_n特征信息和第2_n特征信息作为参考而获得的第(1_1)_n错误的平均值的第1_1错误与(iii-1b)作为将用第1_1特征信息生成的至少一个第1任务特定输出和其对应的至少一个第1真实数据作为参考而获得的第(1_2)_1错误至将用第1_n特征信息生成的至少一个第n任务特定输出和其对应的至少一个第n真实数据作为参考而获得的第(1_2)_n错误的平均值的第1_2错误中至少一部分来计算出的第1错误最小化,(iii-2)并使通过参考训练数据和混淆的训练数据来计算出的第2错误最大化。
另外,学习装置(i)将训练数据输入到混淆网络中,以使混淆网络对训练数据进行混淆,从而生成混淆的训练数据,(ii)将混淆的训练数据输入到具有学习参数的学习网络中,以使学习网络用学习参数将网络运算应用于混淆的训练数据,从而生成与混淆的训练数据相对应的第1特征信息,并将训练数据输入到学习网络中,以使学习网络用学习参数将网络运算应用于训练数据,从而生成与训练数据相对应的第2特征信息,(iii)学习混淆网络0,(iii-1)以使通过参考作为将第1_1特征信息和第2_1特征信息作为参考而获得的第(1_1)_1错误至将第1_n特征信息和第2_n特征信息作为参考而获得的第(1_1)_n错误的平均值的第1_1错误与(iii-2)作为将用第1_1特征信息生成的至少一个第1任务特定输出和其对应的至少一个第1真实数据作为参考而获得的第(1_2)_1错误至将用第1_n特征信息生成的至少一个第n任务特定输出和其对应的至少一个第n真实数据作为参考而获得的第(1_2)_n错误的平均值的第1_2错误中至少一部分来计算出的第1错误最小化,并使作为与输入到鉴别器的混淆的训练数据相对应的混淆的训练数据分数的第2错误最大化,其中所述鉴别器鉴别所输入数据的真实性,(iv)学习鉴别器,以使与输入到鉴别器的修改训练数据或混淆的修改训练数据相对应的修改训练数据分数或混淆的修改训练数据分数最大化并使混淆的训练数据分数最小化。
另外,所述学习网络可以包括分别具有第1学习参数到第n学习参数的第1学习网络到第n学习网络,学习装置(i)将混淆的训练数据输入到每个第1学习网络至第n学习网络中,以使每个第1学习网络至第n学习网络(i-1)用每个第1学习网络至第n学习网络的第1学习参数至第n学习参数将与每个网络相对应的网络运算应用于混淆的训练数据,(i-2)从而输出与混淆的训练数据相对应的每个第1_1特征信息至第1_n特征信息,(ii)并将训练数据输入到每个第1学习网络至第n学习网络中,以使每个第1学习网络至第n学习网络(ii-1)用每个第1学习网络至第n学习网络的第1学习参数至第n学习参数将与每个网络相对应的网络运算应用于训练数据,(ii-2)从而输出关于训练数据的每个第2_1特征信息至第2_n特征信息;(iii)学习混淆网络,(iii-1)以使通过参考(iii-1a)作为将第1_1特征信息和第2_1特征信息作为参考而获得的第(1_1)_1错误至将第1_n特征信息和第2_n特征信息作为参考而获得的第(1_1)_n错误的平均值的第1_1错误与(iii-1b)作为将用第1_1特征信息生成的至少一个第1任务特定输出和其对应的至少一个第1真实数据作为参考而获得的第(1_2)_1错误至将用第1_n特征信息生成的至少一个第n任务特定输出和其对应的至少一个第n真实数据作为参考而获得的第(1_2)_n错误的平均值的第1_2错误中至少一部分来计算出的第1错误最小化,(iii-2)并以使作为与输入到鉴别器的混淆的训练数据相对应的混淆的训练数据分数的第2错误最大化,(iv)学习鉴别器,以使与输入到鉴别器的修改训练数据或混淆的修改训练数据相对应的修改训练数据分数或混淆的修改训练数据分数最大化并使混淆的训练数据分数最小化。
另一方面,根据本发明的实施例,可以将由学习的混淆网络隐藏的修改数据提供或出售给大数据购买者。
另外,根据本发明的一实施例,当向所述购买者提供或出售隐藏后的图像数据时,以可以通过各种计算机组件执行的程序指令的形式实现用于学习的混淆网络的测试方法,并可以通过记录在计算机可读记录介质上来提供。根据本发明的一实施例,购买者可以通过使用计算机装置来执行记录在计算机可读介质中的程序指令,从而从自己拥有的或从其他来源获取的原始数据生成隐藏的数据,并且将隐藏后的数据用于自己的学习网络。另外,购买者还可以在自己的学习网络中一起使用其隐藏后的数据、自己拥有的或从其他来源获取的原始图像数据、和提供给或出售给自己的隐藏后的图像数据中的至少两个。
另一方面,根据本发明的一实施例,当以可以通过各种计算机组件执行的程序指令的形式实现用于学习的混淆网络的测试方法时,由于将精度设置得很高,所以可以产生购买者计算装置的计算开销(Computational Overhead),从而购买者可以通过设置来降低精度以防止计算开销。
此外,在本说明书中提到的“平均值”是指加权平均值,但不限于此。
如上所述的本发明实施例可以通过各种计算机组件执行的程序指令的形式实现并记录在计算机可读记录介质上。所述计算机可读记录介质可以单独地或组合地包括程序指令、数据文件和数据结构等。记录在所述计算机可读记录介质中的程序指令可以为针对本发明专门设计和配置的,或者对于计算机软件领域的技术人员来说是已知而可以使用的。计算机可读记录介质的示例包括诸如硬盘、软盘和磁带的磁性介质,诸如CD-ROM、DVD的光学记录介质,诸如软盘(floptical disk)的磁光介质(magneto-optical media)以及专门配置用于存储和执行程序指令的硬件装置,例如ROM、RAM、闪存等。程序指令的示例不仅包括由编译器产生的机器语言代码,而且包括可由计算机使用解释器等执行的高级语言代码。所述硬件装置可以配置为作为一个或多个软件模块操作以执行根据本发明的处理,反之亦然。
如上所述,已经通过诸如具体组件等的特定事项以及有限的实施例和附图描述了本发明,但提供所述内容仅是为了帮助更全面地理解本发明,所以本发明不限于以上实施例,并且本发明所属领域的技术人员可以根据这些描述进行各种修改和变更。
因此,本发明的精神不限于上述实施例,不仅是后述的权利要求书,而且与权利要求书等同或等同变形的所有内容均属于本发明的精神范围内。

Claims (28)

1.一种用于隐藏原始数据以保护个人信息的混淆网络的学习方法,所述方法包括:
(a)当获取训练数据时,学习装置将所述训练数据输入到混淆网络中,以使所述混淆网络对所述训练数据进行混淆,从而生成混淆的训练数据;
(b)所述学习装置(i)将所述混淆的训练数据输入到具有至少一个学习参数的学习网络中,以使所述学习网络(i-1)用所述学习参数将网络运算应用于所述混淆的训练数据,(i-2)从而生成与所述混淆的训练数据相对应的第1特征信息,(ii)并将所述训练数据输入到所述学习网络中,以使所述学习网络(ii-1)用所述学习参数将网络运算应用于所述训练数据,(ii-2)从而生成与所述训练数据相对应的第2特征信息;以及
(c)所述学习装置学习所述混淆网络,(i)以对通过参考(i-1)将所述第1特征信息和所述第2特征信息作为参考而获得的至少一个第1_1错误与(i-2)将使用所述第1特征信息来生成的任务特定输出和与所述任务特定输出对应的至少一个真实数据作为参考而获得的至少一个第1_2错误中的至少一部分来计算出的至少一个第1错误进行最小化,(ii)并对通过参考所述训练数据和所述混淆的训练数据来计算出的至少一个第2错误进行最大化。
2.根据权利要求l所述的方法,其中,
所述学习网络包括具有至少一个第1学习参数至至少一个第n学习参数的第1学习网络至第n学习网络,其中,当所述n为1或更大的整数时,
在所述步骤(b)中,
所述学习装置(i)将所述混淆的训练数据输入到每个所述第1学习网络至所述第n学习网络中,以使每个所述第1学习网络至所述第n学习网络(i-1)用每个所述第1学习网络至所述第n学习网络的所述第1学习参数至所述第n学习参数将与每个网络相对应的网络运算应用于所述混淆的训练数据,(i-2)从而输出关于所述混淆的训练数据的每个第1_1特征信息至第1_n特征信息,(ii)并将所述训练数据输入到每个所述第1学习网络至所述第n学习网络中,以使每个所述第1学习网络至所述第n学习网络(ii-1)用每个所述第1学习参数至所述第n学习参数将与每个网络相对应的网络运算应用于所述训练数据,(ii-2)从而输出关于所述训练数据的每个第2_1特征信息至第2_n特征信息,
在所述步骤(c)中,
所述学习装置学习所述混淆网络,(i)以对通过参考(i-1)将所述第1_1特征信息和所述第2_1特征信息作为参考而获得的第(1_1)_1错误至将所述第1_n特征信息和所述第2_n特征信息作为参考而获得的第(1_1)_n错误的平均值的所述第1_1错误与(i-2)(i-2a)将用所述第1_1特征信息生成的至少一个第1任务特定输出和(i-2b)与所述第1任务特定输对应的至少一个第1真实数据作为参考而获得的第(1_2)_1错误至(i-2a)将用所述第1_n特征信息生成的至少一个第n任务特定输出和(i-2b)与所述第n任务特定输出对应的至少一个第n真实数据作为参考而获得的第(1_2)_n错误的平均值的所述第1_2错误中至少一部分来计算出的所述第1错误进行最小化,(ii)并对通过参考所述训练数据和所述混淆的训练数据来计算出的所述第2错误进行最大化。
3.根据权利要求l所述的方法,其中,
所述学习网络包括具有至少一个第1学习参数至至少一个第n学习参数的第1学习网络至第n学习网络,其中,当所述n为1或更大的整数时,
在所述步骤(a)中,
所述学习装置将所述训练数据输入到所述混淆网络中,以使所述混淆网络对所述训练数据进行混淆,从而生成第1混淆的训练数据,
在所述步骤(b)中,
所述学习装置(i)将所述第1混淆的训练数据输入到所述第1学习网络中,以使所述第1学习网络(i-1)用所述第1学习网络的所述第1学习参数将网络运算应用于所述第1混淆的训练数据,(i-2)从而输出与所述第1混淆的训练数据相对应的第1_1特征信息,(ii)并将所述训练数据输入到所述第1学习网络中,以使所述第1学习网络(ii-1)用所述第1学习参数将网络运算应用于所述训练数据,(ii-2)从而输出与所述训练数据相对应的第2_1特征信息,
在所述步骤(c)中,
所述学习装置学习所述混淆网络,(i)以对通过参考(i-1)将所述第1_1特征信息和所述第2_1特征信息作为参考而获得的至少一个第(1_1)_1错误与(i-2)将用所述第1_1特征信息生成的至少一个第1任务特定输出和与所述第1任务特定输出对应的至少一个第1真实数据作为参考而获得的至少一个第(1_2)_1错误中至少一部分来计算出的至少一个第1_1错误进行最小化,(ii)并对通过参考所述训练数据和所述第1混淆的训练数据来计算出的至少一个所述第2_1错误进行最大化,从而使所述混淆网络成为第1学习的混淆网络,
所述学习装置在将整数k从2增加到n的同时,(i)将所述训练数据输入到所述第k-1学习的混淆网络中,以使所述第k-1学习的混淆网络对所述训练数据进行混淆,从而生成第k混淆的训练数据,(ii)(ii-1)将所述第k混淆的训练数据输入到第k学习网络中,以使所述第k学习网络用所述第k学习网络中至少一个第k学习参数将网络运算应用于所述第k混淆的训练数据,从而输出关于所述第k混淆的训练数据的第1_k特征信息,(ii-2)将所述训练数据输入到所述第k学习网络中,以使所述第k学习网络用所述第k学习参数将网络运算应用于所述训练数据,从而输出关于所述训练数据的第2_k特征信息,(iii)学习所述第k-1学习的混淆网络,(iii-1)以对通过参考(iii-1a)将所述第1_k特征信息和所述第2_k特征信息作为参考而获得的至少一个第(1_1)_k错误与(iii-1b)将用所述第1_k特征信息生成的至少一个第k任务特定输出和与所述第k任务特定输出对应的至少一个第k真实数据作为参考而获得的至少一个第(1_2)_k错误中至少一部分来计算出的至少一个第1_k错误进行最小化,(iii-2)并对通过参考所述训练数据和所述第k混淆的训练数据来计算出的至少一个所述第2_k错误进行最大化,从而使所述k-1学习的混淆网络成为第k学习的混淆网络。
4.根据权利要求l所述的方法,其中,
在所述步骤(c)中,
在获得与输入到鉴别器的所述混淆的训练数据相对应的至少一个混淆的训练数据分数作为所述第2错误的状态下,其中所述鉴别器鉴别所输入数据的真实性,所述学习装置(i)在学习所述混淆网络以最小化所述第1错误并最大化第2错误的同时,(ii)学习所述鉴别器,以对与输入到所述鉴别器的修改训练数据或混淆的修改训练数据相对应的至少一个修改训练数据分数或至少一个混淆的修改训练数据分数进行最大化,并对所述混淆的训练数据分数进行最小化,其中所述修改训练数据或所述混淆的修改训练数据为分别通过修改所述训练数据或所述混淆的训练数据而生成的数据。
5.根据权利要求4所述的方法,其中,
所述学习网络包括具有至少一个第1学习参数至至少一个第n学习参数的第1学习网络至第n学习网络,其中,当所述n为1或更大的整数时,
在所述步骤(b)中,
所述学习装置(i)将所述混淆的训练数据输入到每个所述第1学习网络至所述第n学习网络中,以使每个所述第1学习网络至所述第n学习网络(i-1)用每个所述第1学习网络至所述第n学习网络的所述第1学习参数至所述第n学习参数将与每个网络相对应的网络运算应用于所述混淆的训练数据,(i-2)从而输出关于所述混淆的训练数据的每个第1_1特征信息至第1_n特征信息,(ii)并将所述训练数据输入到每个所述第1学习网络至所述第n学习网络中,以使每个所述第1学习网络至所述第n学习网络(ii-1)用每个所述第1学习参数至所述第n学习参数将与每个网络相对应的网络运算应用于所述训练数据,(ii-2)从而输出关于所述训练数据的每个第2_1特征信息至第2_n特征信息,
在所述步骤(c)中,
所述学习装置(i)学习所述混淆网络,以对通过参考(i-1)将所述第1_1特征信息和所述第2_1特征信息作为参考而获得的第(1_1)_1错误至将所述第1_n特征信息和所述第2_n特征信息作为参考而获得的第(1_1)_n错误的平均值的所述第1_1错误与(i-2)(i-2a)将用所述第1_1特征信息生成的至少一个第1任务特定输出和(i-2b)与所述第1任务特定输出对应的至少一个第1真实数据作为参考而获得的第(1_2)_1错误至(i-2a)将用所述第1_n特征信息生成的至少一个第n任务特定输出和(i-2b)与所述第n任务特定输出对应的至少一个第n真实数据作为参考而获得的第(1_2)_n错误的平均值的所述第1_2错误中至少一部分来计算出的所述第1错误进行最小化,且对作为与输入到所述鉴别器的所述混淆的训练数据相对应的所述混淆的训练数据分数的所述第2错误进行最大化,(ii)并且学习所述鉴别器,以对与输入到所述鉴别器的所述修改训练数据或所述混淆的修改训练数据相对应的所述修改训练数据分数或所述混淆的修改训练数据分数进行最大化且对所述混淆的训练数据分数进行最小化。
6.根据权利要求4所述的方法,其中,
所述学习网络包括分别具有第1学习参数至第n学习参数的第1学习网络至第n学习网络,其中,当所述n为1或更大的整数时,
在所述步骤(a)中,
所述学习装置将所述训练数据输入到所述混淆网络中,以使所述混淆网络对所述训练数据进行混淆,从而生成第1混淆的训练数据,
在所述步骤(b)中,
所述学习装置(i)将所述第1混淆的训练数据输入到所述第1学习网络中,以使所述第1学习网络(i-1)用所述第1学习网络的所述第1学习参数将网络运算应用于所述第1混淆的训练数据,(i-2)从而输出与所述第1混淆的训练数据相对应的第1_1特征信息,(ii)并将所述训练数据输入到所述第1学习网络中,以使所述第1学习网络(ii-1)用所述第1学习参数将网络运算应用于所述训练数据,(ii-2)从而输出与所述训练数据相对应的第2_1特征信息,
在所述步骤(c)中,
所述学习装置学习所述混淆网络,(i)以对通过参考(i-1)将所述第1_1特征信息和所述第2_1特征信息作为参考而获得的至少一个第(1_1)_1错误与(i-2)(i-2a)将用所述第1_1特征信息生成的至少一个第1任务特定输出和(i-2b)与所述第1任务特定输出对应的至少一个第1真实数据作为参考而获得的第(1_2)_1错误中至少一部分来计算出的至少一个第1_1错误进行最小化,(ii)并对作为与输入到所述鉴别器的所述第1混淆的训练数据相对应的至少一个第1混淆的训练数据分数的至少一个第2_1错误进行最大化,从而使所述混淆网络成为第1学习的混淆网络,所述学习装置学习所述鉴别器,(i)以对与输入到所述鉴别器的所述修改训练数据或所述混淆的修改训练数据相对应的至少一个第1修改训练数据分数或至少一个第1混淆的修改训练数据分数进行最大化,(ii)并对所述第1混淆的训练数据分数进行最小化,从而使所述鉴别器成为第1学习的鉴别器,
所述学习装置在将整数k从2增加到n的同时,(i)将所述训练数据输入到所述第k-1学习的混淆网络中,以使所述第k-1学习的混淆网络对所述训练数据进行混淆,从而生成第k混淆的训练数据,(ii)(ii-1)将所述第k混淆的训练数据输入到第k学习网络中,以使所述第k学习网络用所述第k学习网络中至少一个第k学习参数将网络运算应用于所述第k混淆的训练数据,从而输出关于所述第k混淆的训练数据的第1_k特征信息,(ii-2)将所述训练数据输入到所述第k学习网络中,以使所述第k学习网络用所述第k学习参数将网络运算应用于所述训练数据,从而输出关于所述训练数据的第2_k特征信息,(iii)学习所述第k-1学习的混淆网络,以对通过参考(iii-1)将所述第1_k特征信息和所述第2_k特征信息作为参考而获得的至少一个第(1_1)_k错误与(iii-2)将用所述第1_k特征信息生成的至少一个第k任务特定输出和与所述第k任务特定输出对应的至少一个第k真实数据作为参考而获得的至少一个第(1_2)_k错误中至少一部分来计算出的至少一个第1_k错误进行最小化,并对作为与输入到所述第k-1学习的鉴别器的所述第k混淆的训练数据相对应的至少一个第k混淆的训练数据分数的至少一个第2_k错误进行最大化,从而使所述k-1学习的混淆网络成为第k学习的混淆网络,(iv)学习所述第k-1学习的鉴别器,以对与输入到所述第k-1学习的鉴别器的所述修改训练数据或所述混淆的修改训练数据相对应的至少一个第k修改训练数据分数或至少一个第k混淆的修改训练数据分数进行最大化,并对所述第k混淆的训练数据分数进行最小化,从而使所述k-1学习的鉴别器成为第k学习的鉴别器。
7.根据权利要求4所述的方法,其中,
分别与输入到所述鉴别器的所述修改训练数据或所述混淆的修改训练数据相对应的所述修改训练数据分数或所述混淆的修改训练数据分数的最大值为1,作为分别用于鉴别所述修改训练数据或所述混淆的修改训练数据为真的值,并与输入到所述鉴别器的所述混淆的训练数据相对应的所述混淆的训练数据分数的最小值为0,作为用于鉴别所述混淆的训练数据为假的值。
8.根据权利要求l所述的方法,其中,
在所述步骤(c)中,
所述学习装置通过参考(i)所述第1特征信息和所述第2特征信息之间的差异与(ii)所述任务特定输出和所述真实数据之间的至少一个差异中的至少一部分来获取所述第1错误,并通过参考所述训练数据和所述混淆的训练数据之间的至少一个差异来获取第2错误。
9.根据权利要求8所述的方法,其中,
所述学习装置通过参考所述第1特征信息和所述第2特征信息之间的范数或余弦相似度来获取所述第1错误。
10.根据权利要求l所述的方法,其中,
在所述步骤(c)中,
所述学习装置通过参考所述混淆的训练数据的熵值和干扰程度中至少一部分来测量至少一种质量,并通过参考测量的所述质量来获取所述第1错误。
11.一种学习用于隐藏原始数据以保护个人信息的混淆网络的测试方法,所述方法包括:
(a)测试装置在学习装置已经执行以下过程的条件下执行获取测试数据的过程:(i)获取训练数据并将其输入到混淆网络中,以使所述混淆网络对所述训练数据进行混淆,从而生成混淆的训练数据;(ii)将所述混淆的训练数据输入到具有至少一个学习参数的所述学习网络中,以使所述学习网络(ii-1)用所述学习参数将网络运算应用于所述混淆的训练数据,(ii-2)从而生成与所述混淆的训练数据相对应的第1特征信息;(iii)将所述训练数据输入到所述学习网络中,以使所述学习网络(iii-1)用所述学习参数将网络运算应用于所述训练数据,(iii-2)从而生成与所述训练数据相对应的第2特征信息;以及(iv)学习所述混淆网络,(iv-1)以对通过参考(iv-1a)将所述第1特征信息和所述第2特征信息作为参考而获得的至少一个第1_1错误与(iv-1b)将用所述第1特征信息生成的至少一个任务特定输出和与所述任务特定输出对应的至少一个真实数据作为参考而获得的至少一个第1_2错误中的至少一部分来计算出的至少一个第1错误进行最小化,(iv-2)对通过参考所述训练数据和所述混淆的训练数据来计算出的至少一个第2错误进行最大化;以及
(b)所述测试装置将所述测试数据输入到所述混淆网络中,以使所述混淆网络使用所述混淆网络的所述学习参数来混淆所述测试数据,从而将混淆的测试数据输出为隐藏的测试数据。
12.根据权利要求l1所述的方法,其中,
在所述步骤(a)中,
所述学习网络包括具有至少一个第1学习参数至至少一个第n学习参数的第1学习网络至第n学习网络,其中,当所述n为1或更大的整数时,
所述学习装置(i)将所述混淆的训练数据输入到每个所述第1学习网络至所述第n学习网络中,以使每个所述第1学习网络至所述第n学习网络(i-1)用每个所述第1学习网络至所述第n学习网络的所述第1学习参数至所述第n学习参数将与每个网络相对应的网络运算应用于所述混淆的训练数据,(i-2)从而输出关于所述混淆的训练数据的每个第1_1特征信息至第1_n特征信息;(ii)并将所述训练数据输入到每个所述第1学习网络至所述第n学习网络中,以使每个所述第1学习网络至所述第n学习网络(ii-1)用每个所述第1学习网络至所述第n学习网络的所述第1学习参数至所述第n学习参数将与每个网络相对应的网络运算应用于所述训练数据,(ii-2)从而输出关于所述训练数据的每个第2_1特征信息至第2_n特征信息;(iii)学习所述混淆网络,(iii-1)以对通过参考(iii-1a)将所述第1_1特征信息和所述第2_1特征信息作为参考而获得的第(1_1)_1错误至将所述第1_n特征信息和所述第2_n特征信息作为参考而获得的第(1_1)_n错误的平均值的所述第1_1错误与(iii-1b)将用所述第1_1特征信息生成的至少一个第1任务特定输出和与所述第1任务特定输出对应的至少一个第1真实数据作为参考而获得的第(1_2)_1错误至将用所述第1_n特征信息生成的至少一个第n任务特定输出和与所述第n任务特定输出对应的至少一个第n真实数据作为参考而获得的第(1_2)_n错误的平均值的所述第1_2错误中至少一部分来计算出的所述第1错误进行最小化,(iii-2)并对通过参考所述训练数据和所述混淆的训练数据来计算出的所述第2错误进行最大化。
13.根据权利要求l1所述的方法,其中,
在所述步骤(a)中,
所述学习装置(i)获得与输入到鉴别器的所述混淆的训练数据相对应的至少一个混淆的训练数据分数作为所述第2错误,其中所述鉴别器鉴别所输入数据的真实性,(ii)在学习所述混淆网络以最小化所述第1错误并最大化所述第2错误的同时,(iii)学习所述鉴别器,以对与输入到所述鉴别器的修改训练数据或混淆的修改训练数据相对应的至少一个修改训练数据分数或至少一个混淆的修改训练数据分数进行最大化,并对所述混淆的训练数据分数进行最小化,其中所述修改训练数据或所述混淆的修改训练数据为分别通过修改所述训练数据或所述混淆的训练数据而生成的数据。
14.根据权利要求l3所述的方法,其中,
在所述步骤(a)中,
所述学习网络包括具有至少一个第1学习参数至至少一个第n学习参数的第1学习网络至第n学习网络,其中,当所述n为1或更大的整数时,
所述学习装置(i)将所述混淆的训练数据输入到每个所述第1学习网络至所述第n学习网络中,以使每个所述第1学习网络至所述第n学习网络(i-1)用每个所述第1学习网络至所述第n学习网络的所述第1学习参数至所述第n学习参数将与每个网络相对应的网络运算应用于所述混淆的训练数据,(i-2)从而输出关于所述混淆的训练数据的每个第1_1特征信息至第1_n特征信息;(ii)并将所述训练数据输入到每个所述第1学习网络至所述第n学习网络中,以使每个所述第1学习网络至所述第n学习网络(ii-1)用每个所述第1学习网络至所述第n学习网络的所述第1学习参数至所述第n学习参数将与每个网络相对应的网络运算应用于所述训练数据,(ii-2)从而输出关于所述训练数据的每个第2_1特征信息至第2_n特征信息;(iii)学习所述混淆网络,(iii-1)以对通过参考(iii-1a)将所述第1_1特征信息和所述第2_1特征信息作为参考而获得的第(1_1)_1错误至将所述第1_n特征信息和所述第2_n特征信息作为参考而获得的第(1_1)_n错误的平均值的所述第1_1错误与(iii-1b)将用所述第1_1特征信息生成的至少一个第1任务特定输出和与所述第1任务特定输出对应的至少一个第1真实数据作为参考而获得的第(1_2)_1错误至将用所述第1_n特征信息生成的至少一个第n任务特定输出和与所述第n任务特定输出对应的至少一个第n真实数据作为参考而获得的第(1_2)_n错误的平均值的所述第1_2错误中至少一部分来计算出的所述第1错误进行最小化,(iii-2)对作为与输入到所述鉴别器的所述混淆的训练数据相对应的所述修改训练数据分数的所述第2错误进行最大化;以及(iv)学习所述鉴别器,以对分别与输入到所述鉴别器的所述修改训练数据或所述混淆的修改训练数据相对应的所述修改训练数据分数或所述混淆的修改训练数据分数进行最大化,并对所述修改训练数据分数进行最小化。
15.一种学习用于隐藏原始数据以保护个人信息的混淆网络的学习装置,其包括:
至少一个存储指令的存储器;以及
至少一个处理器,其直接执行或使另一装置执行用于执行以下过程的指令:(I)当获取训练数据时,将所述训练数据输入到混淆网络中,以使所述混淆网络对所述训练数据进行混淆,从而生成混淆的训练数据;(II)(i)将所述混淆的训练数据输入到具有至少一个学习参数的所述学习网络中,以使所述学习网络(i-1)用所述学习参数将网络运算应用于所述混淆的训练数据,(i-2)从而生成与所述混淆的训练数据相对应的第1特征信息,(ii)将所述训练数据输入到所述学习网络中,以使所述学习网络(ii-1)用所述学习参数将网络运算应用于所述训练数据,(ii-2)从而生成与所述训练数据相对应的第2特征信息;以及(III)学习所述混淆网络,(i)以对通过参考(i-1)将所述第1特征信息和所述第2特征信息作为参考而获得的至少一个第1_1错误与(i-2)将用所述第1特征信息生成的至少一个任务特定输出和与所述任务特定输出对应的至少一个真实数据作为参考而获得的至少一个第1_2错误中的至少一部分来计算出的至少一个第1错误进行最小化,(ii)对通过参考所述训练数据和所述混淆的训练数据来计算出的至少一个第2错误进行最大化。
16.根据权利要求l5所述的学习装置,其中,
所述学习网络包括具有至少一个第1学习参数至至少一个第n学习参数的第1学习网络至第n学习网络,其中,当所述n为1或更大的整数时,
在所述过程(II)中,
所述处理器(i)将所述混淆的训练数据输入到每个所述第1学习网络至所述第n学习网络中,以使每个所述第1学习网络至所述第n学习网络(i-1)用每个所述第1学习网络至所述第n学习网络的所述第1学习参数至所述第n学习参数将与每个网络相对应的网络运算应用于所述混淆的训练数据,(i-2)从而输出关于所述混淆的训练数据的每个第1_1特征信息至第1_n特征信息,(ii)并将所述训练数据输入到每个所述第1学习网络至所述第n学习网络中,以使每个所述第1学习网络至所述第n学习网络(ii-1)用每个所述第1学习参数至所述第n学习参数将与每个网络相对应的网络运算应用于所述训练数据,(ii-2)从而输出关于所述训练数据的每个第2_1特征信息至第2_n特征信息,
在所述过程(III)中,
所述处理器学习所述混淆网络,(i)以对通过参考(i-1)将所述第1_1特征信息和所述第2_1特征信息作为参考而获得的第(1_1)_1错误至将所述第1_n特征信息和所述第2_n特征信息作为参考而获得的第(1_1)_n错误的平均值的所述第1_1错误与(i-2)将用所述第1_1特征信息生成的至少一个第1任务特定输出和与所述第1任务特定输出对应的至少一个第1真实数据作为参考而获得的第(1_2)_1错误至将用所述第1_n特征信息生成的至少一个第n任务特定输出和与所述第n任务特定输出对应的至少一个第n真实数据作为参考而获得的第(1_2)_n错误的平均值的所述第1_2错误中至少一部分来计算出的所述第1错误进行最小化,(ii)并对通过参考所述训练数据和所述混淆的训练数据来计算出的所述第2错误进行最大化。
17.根据权利要求l5所述的学习装置,其中,
所述学习网络包括具有至少一个第1学习参数至至少一个第n学习参数的第1学习网络至第n学习网络,其中,当所述n为1或更大的整数时,
在所述过程(I)中,
所述处理器将所述训练数据输入到所述混淆网络中,以使所述混淆网络对所述训练数据进行混淆,从而生成第1混淆的训练数据,
在所述过程(II)中,
所述处理器(i)将所述第1混淆的训练数据输入到所述第1学习网络中,以使所述第1学习网络(i-1)用所述第1学习网络的所述第1学习参数将网络运算应用于所述第1混淆的训练数据,(i-2)从而输出与所述第1混淆的训练数据相对应的第1_1特征信息,(ii)并将所述训练数据输入到所述第1学习网络中,以使所述第1学习网络(ii-1)用所述第1学习参数将网络运算应用于所述训练数据,(ii-2)从而输出与所述训练数据相对应的第2_1特征信息,
在所述过程(III)中,
所述处理器学习所述混淆网络,(i)以对通过参考(i-1)将所述第1_1特征信息和所述第2_1特征信息作为参考而获得的至少一个第(1_1)_1错误与(i-2)将用所述第1_1特征信息生成的至少一个第1任务特定输出和与所述第1任务特定输出对应的至少一个第1真实数据作为参考而获得的至少一个第(1_2)_1错误中至少一部分来计算出的至少一个第1_1错误进行最小化,(ii)并对通过参考所述训练数据和所述第1混淆的训练数据来计算出的至少一个所述第2_1错误进行最大化,从而使所述混淆网络成为第1学习的混淆网络,
所述处理器在将整数k从2增加到n的同时,(i)将所述训练数据输入到所述第k-1学习的混淆网络中,以使所述第k-1学习的混淆网络对所述训练数据进行混淆,从而生成第k混淆的训练数据,(ii)(ii-1)将所述第k混淆的训练数据输入到第k学习网络中,以使所述第k学习网络用所述第k学习网络中至少一个第k学习参数将网络运算应用于所述第k混淆的训练数据,从而输出关于所述第k混淆的训练数据的第1_k特征信息,(ii-2)将所述训练数据输入到所述第k学习网络中,以使所述第k学习网络用所述第k学习参数将网络运算应用于所述训练数据,从而输出关于所述训练数据的第2_k特征信息,(iii)学习所述第k-1学习的混淆网络,(iii-1)以对通过参考(iii-1a)将所述第1_k特征信息和所述第2_k特征信息作为参考而获得的至少一个第(1_1)_k错误与(iii-1b)将用所述第1_k特征信息生成的至少一个第k任务特定输出和与所述第k任务特定输出对应的至少一个第k真实数据作为参考而获得的至少一个第(1_2)_k错误中至少一部分来计算出的至少一个第1_k错误进行最小化,(iii-2)并对通过参考所述训练数据和所述第k混淆的训练数据来计算出的至少一个所述第2_k错误进行最大化,从而使所述k-1学习的混淆网络成为第k学习的混淆网络。
18.根据权利要求l5所述的学习装置,其中,
在所述过程(III)中,
在获得与输入到鉴别器的所述混淆的训练数据相对应的至少一个混淆的训练数据分数作为所述第2错误的状态下,其中所述鉴别器鉴别所输入数据的真实性,所述处理器(i)在学习所述混淆网络以最小化所述第1错误并最大化所述第2错误的同时,(ii)学习所述鉴别器,以对与输入到所述鉴别器的修改训练数据或混淆的修改训练数据相对应的至少一个修改训练数据分数或至少一个混淆的修改训练数据分数进行最大化,并对所述混淆的训练数据分数进行最小化,其中所述修改训练数据或所述混淆的修改训练数据为分别通过修改所述训练数据或所述混淆的训练数据而生成的数据。
19.根据权利要求l8所述的学习装置,其中,
所述学习网络包括具有至少一个第1学习参数至至少一个第n学习参数的第1学习网络至第n学习网络,其中,当所述n为1或更大的整数时,
在所述过程(II)中,
所述处理器(i)将所述混淆的训练数据输入到每个所述第1学习网络至所述第n学习网络中,以使每个所述第1学习网络至所述第n学习网络(i-1)用每个所述第1学习网络至所述第n学习网络的所述第1学习参数至所述第n学习参数将与每个网络相对应的网络运算应用于所述混淆的训练数据,(i-2)从而输出关于所述混淆的训练数据的每个第1_1特征信息至第1_n特征信息,(ii)并将所述训练数据输入到每个所述第1学习网络至所述第n学习网络中,以使每个所述第1学习网络至所述第n学习网络(ii-1)用每个所述第1学习参数至所述第n学习参数将与每个网络相对应的网络运算应用于所述训练数据,(ii-2)从而输出关于所述训练数据的每个第2_1特征信息至第2_n特征信息,
在所述过程(III)中,
所述处理器(i)学习所述混淆网络,以对通过参考(i-1)将所述第1_1特征信息和所述第2_1特征信息作为参考而获得的第(1_1)_1错误至将所述第1_n特征信息和所述第2_n特征信息作为参考而获得的第(1_1)_n错误的平均值的所述第1_1错误与(i-2)作为将用所述第1_1特征信息生成的至少一个第1任务特定输出和与所述第1任务特定输出对应的至少一个第1真实数据作为参考而获得的第(1_2)_1错误至将用所述第1_n特征信息生成的至少一个第n任务特定输出和与所述第n任务特定输出对应的至少一个第n真实数据作为参考而获得的第(1_2)_n错误的平均值的所述第1_2错误中至少一部分来计算出的所述第1错误进行最小化,且对作为与输入到所述鉴别器的所述混淆的训练数据相对应的所述混淆的训练数据分数的所述第2错误进行最大化,(ii)并且学习所述鉴别器,以对与输入到所述鉴别器的所述修改训练数据或所述混淆的修改训练数据相对应的所述修改训练数据分数或所述混淆的修改训练数据分数进行最大化,且对所述混淆的训练数据分数进行最小化。
20.根据权利要求l8所述的学习装置,其中,
所述学习网络包括分别具有第1学习参数至第n学习参数的第1学习网络至第n学习网络,其中,当所述n为1或更大的整数时,
在所述过程(I)中,
所述处理器将所述训练数据输入到所述混淆网络中,以使所述混淆网络对所述训练数据进行混淆,从而生成第1混淆的训练数据,
在所述过程(II)中,
所述处理器(i)将所述第1混淆的训练数据输入到所述第1学习网络中,以使所述第1学习网络(i-1)用所述第1学习网络的所述第1学习参数将网络运算应用于所述第1混淆的训练数据,(i-2)从而输出与所述第1混淆的训练数据相对应的第1_1特征信息,(ii)并将所述训练数据输入到所述第1学习网络中,以使所述第1学习网络(ii-1)用所述第1学习参数将网络运算应用于所述训练数据,(ii-2)从而输出与所述训练数据相对应的第2_1特征信息,
在所述过程(III)中,
所述处理器学习所述混淆网络,(i)以对通过参考(i-1)将所述第1_1特征信息和所述第2_1特征信息作为参考而获得的至少一个第(1_1)_1错误与(i-2)(i-2a)将用所述第1_1特征信息生成的至少一个第1任务特定输出和(i-2b)与所述第1任务特定输出对应的至少一个第1真实数据作为参考而获得的第(1_2)_1错误中至少一部分来计算出的至少一个第1_1错误进行最小化,(ii)并对作为与输入到所述鉴别器的所述第1混淆的训练数据相对应的至少一个第1混淆的训练数据分数的至少一个第2_1错误进行最大化,从而使所述混淆网络成为第1学习的混淆网络,所述处理器学习所述鉴别器,(i)以对与输入到所述鉴别器的所述修改训练数据或所述混淆的修改训练数据相对应的至少一个第1修改训练数据分数或至少一个第1混淆的修改训练数据分数进行最大化,(ii)并对所述第1混淆的训练数据分数进行最小化,从而使所述鉴别器成为第1学习的鉴别器,
所述处理器在将整数k从2增加到n的同时,(i)将所述训练数据输入到所述第k-1学习的混淆网络中,以使所述第k-1学习的混淆网络对所述训练数据进行混淆,从而生成第k混淆的训练数据,(ii)(ii-1)将所述第k混淆的训练数据输入到第k学习网络中,以使所述第k学习网络用所述第k学习网络中至少一个第k学习参数将网络运算应用于所述第k混淆的训练数据,从而输出关于所述第k混淆的训练数据的第1_k特征信息,(ii-2)将所述训练数据输入到所述第k学习网络中,以使所述第k学习网络用所述第k学习参数将网络运算应用于所述训练数据,从而输出关于所述训练数据的第2_k特征信息,(iii)学习所述第k-1学习的混淆网络,以对通过参考(iii-1)将所述第1_k特征信息和所述第2_k特征信息作为参考而获得的至少一个第(1_1)_k错误与(iii-2)将用所述第1_k特征信息生成的至少一个第k任务特定输出和与所述第k任务特定输出对应的至少一个第k真实数据作为参考而获得的至少一个第(1_2)_k错误中至少一部分来计算出的至少一个第1_k错误进行最小化,并使作为与输入到所述第k-1学习的鉴别器的所述第k混淆的训练数据相对应的至少一个第k混淆的训练数据分数的至少一个第2_k错误进行最大化,从而使所述k-1学习的混淆网络成为第k学习的混淆网络,(iv)学习所述第k-1学习的鉴别器,以对与输入到所述第k-1学习的鉴别器的所述修改训练数据或所述混淆的修改训练数据相对应的至少一个第k修改训练数据分数或至少一个第k混淆的修改训练数据分数进行最大化,并对所述第k混淆的训练数据分数进行最小化,从而使所述k-1学习的鉴别器成为第k学习的鉴别器。
21.根据权利要求l8所述的学习装置,其中,
分别与输入到所述鉴别器的所述修改训练数据或所述混淆的修改训练数据相对应的所述修改训练数据分数或所述混淆的修改训练数据分数的最大值为1,作为用于鉴别所述修改训练数据或所述混淆的修改训练数据为真的值,并与输入到所述鉴别器的所述混淆的训练数据相对应的所述混淆的训练数据分数的最小值为0,作为用于鉴别所述混淆的训练数据为假的值。
22.根据权利要求l5所述的学习装置,其中,
在所述过程(III)中,
所述处理器通过参考(i)所述第1特征信息和所述第2特征信息之间的差异与(ii)所述任务特定输出和所述真实数据之间的至少一个差异中的至少一部分来获取所述第1错误,并通过参考所述训练数据和所述混淆的训练数据之间的至少一个差异来获取第2错误。
23.根据权利要求22所述的学习装置,其中,
所述处理器通过参考所述第1特征信息和所述第2特征信息之间的范数或余弦相似度来获取所述第1错误。
24.根据权利要求l5所述的学习装置,其中,
在所述过程(III)中,
所述处理器通过参考所述混淆的训练数据的熵值和干扰程度中至少一部分来测量至少一种质量,并通过进一步参考测量的所述质量来获取所述第1错误。
25.一种学习用于隐藏原始数据以保护个人信息的混淆网络的测试装置,所述装置包括:
至少一个存储指令的存储器;以及
至少一个处理器,其直接执行或使另一装置执行用于执行以下过程的指令:(I)学习装置在已经执行以下过程的条件下获取测试数据:(i)获取训练数据并将其输入到混淆网络中,以使所述混淆网络对所述训练数据进行混淆,从而生成混淆的训练数据;(ii)将所述混淆的训练数据输入到具有至少一个学习参数的所述学习网络中,以使所述学习网络(ii-1)用所述学习参数将网络运算应用于所述混淆的训练数据,(ii-2)从而生成与所述混淆的训练数据相对应的第1特征信息;(iii)将所述训练数据输入到所述学习网络中,以使所述学习网络(iii-1)用所述学习参数将网络运算应用于所述训练数据,(iii-2)从而生成与所述训练数据相对应的第2特征信息;以及(iv)学习所述混淆网络,(iv-1)以对通过参考(iv-1a)将所述第1特征信息和所述第2特征信息作为参考而获得的至少一个第1_1错误与(iv-1b)将用所述第1特征信息生成的至少一个任务特定输出和与所述任务特定输出对应的至少一个真实数据作为参考而获得的至少一个第1_2错误中的至少一部分来计算出的至少一个第1错误进行最小化,(iv-2)对通过参考所述训练数据和所述混淆的训练数据来计算出的至少一个第2错误进行最大化;以及(II)将所述测试数据输入到所述混淆网络中,以使所述混淆网络使用所述混淆网络的所述学习参数来混淆所述测试数据,从而将混淆的测试数据输出为隐藏的测试数据。
26.根据权利要求25所述的测试装置,其中,
在所述过程(I)中,
所述学习网络包括具有至少一个第1学习参数至至少一个第n学习参数的第1学习网络至第n学习网络,其中,当所述n为1或更大的整数时,
所述学习装置(i)将所述混淆的训练数据输入到每个所述第1学习网络至所述第n学习网络中,以使每个所述第1学习网络至所述第n学习网络(i-1)用每个所述第1学习网络至所述第n学习网络的所述第1学习参数至所述第n学习参数将与每个网络相对应的网络运算应用于所述混淆的训练数据,(i-2)从而输出关于所述混淆的训练数据的每个第1_1特征信息至第1_n特征信息;(ii)并将所述训练数据输入到每个所述第1学习网络至所述第n学习网络中,以使每个所述第1学习网络至所述第n学习网络(ii-1)用每个所述第1学习网络至所述第n学习网络的所述第1学习参数至所述第n学习参数将与每个网络相对应的网络运算应用于所述训练数据,(ii-2)从而输出关于所述训练数据的每个第2_1特征信息至第2_n特征信息;(iii)学习所述混淆网络,(iii-1)以对通过参考(iii-1a)将所述第1_1特征信息和所述第2_1特征信息作为参考而获得的第(1_1)_1错误至将所述第1_n特征信息和所述第2_n特征信息作为参考而获得的第(1_1)_n错误的平均值的所述第1_1错误与(iii-1b)作为将用所述第1_1特征信息生成的至少一个第1任务特定输出和与所述第1任务特定输出对应的至少一个第1真实数据作为参考而获得的第(1_2)_1错误至将用所述第1_n特征信息生成的至少一个第n任务特定输出和与所述第n任务特定输出对应的至少一个第n真实数据作为参考而获得的第(1_2)_n错误的平均值的所述第1_2错误中至少一部分来计算出的所述第1错误进行最小化,(iii-2)并对通过参考所述训练数据和所述混淆的训练数据来计算出的所述第2错误进行最大化。
27.根据权利要求25所述的测试装置,其中,
在所述步骤(I)中,
所述学习装置(i)获得与输入到鉴别器的所述混淆的训练数据相对应的至少一个混淆的训练数据分数作为所述第2错误,其中所述鉴别器鉴别所输入数据的真实性,(ii)在学习所述混淆网络以最小化所述第1错误并最大化所述第2错误的同时,(iii)学习所述鉴别器,以对与输入到所述鉴别器的修改训练数据或混淆的修改训练数据相对应的至少一个修改训练数据分数或至少一个混淆的修改训练数据分数进行最大化,并对所述混淆的训练数据分数进行最小化,其中所述修改训练数据或所述混淆的修改训练数据为分别通过修改所述训练数据或所述混淆的训练数据而生成的数据。
28.根据权利要求27所述的测试装置,其中,
在所述过程(I)中,
所述学习网络包括具有至少一个第1学习参数至至少一个第n学习参数的第1学习网络至第n学习网络,其中,当所述n为1或更大的整数时,
所述学习装置(i)将所述混淆的训练数据输入到每个所述第1学习网络至所述第n学习网络中,以使每个所述第1学习网络至所述第n学习网络(i-1)用每个所述第1学习网络至所述第n学习网络的所述第1学习参数至所述第n学习参数将与每个网络相对应的网络运算应用于所述混淆的训练数据,(i-2)从而输出关于所述混淆的训练数据的每个第1_1特征信息至第1_n特征信息;(ii)并将所述训练数据输入到每个所述第1学习网络至所述第n学习网络中,以使每个所述第1学习网络至所述第n学习网络(ii-1)用每个所述第1学习网络至所述第n学习网络的所述第1学习参数至所述第n学习参数将与每个网络相对应的网络运算应用于所述训练数据,(ii-2)从而输出关于所述训练数据的每个第2_1特征信息至第2_n特征信息;(iii)学习所述混淆网络,(iii-1)以对通过参考(iii-1a)将所述第1_1特征信息和所述第2_1特征信息作为参考而获得的第(1_1)_1错误至将所述第1_n特征信息和所述第2_n特征信息作为参考而获得的第(1_1)_n错误的平均值的所述第1_1错误与(iii-1b)作为将用所述第1_1特征信息生成的至少一个第1任务特定输出和与所述第1任务特定输出对应的至少一个第1真实数据作为参考而获得的第(1_2)_1错误至将用所述第1_n特征信息生成的至少一个第n任务特定输出和与所述一个第n任务特定输出对应的至少一个第n真实数据作为参考而获得的第(1_2)_n错误的平均值的所述第1_2错误中至少一部分来计算出的所述第1错误进行最小化,(iii-2)对作为与输入到所述鉴别器的所述混淆的训练数据相对应的所述修改训练数据分数的所述第2错误进行最大化;以及(iv)学习所述鉴别器,以对分别与输入到所述鉴别器的所述修改训练数据或所述混淆的修改训练数据相对应的所述修改训练数据分数或所述混淆的修改训练数据分数进行最大化,并对所述修改训练数据分数进行最小化。
CN201980005836.1A 2018-07-26 2019-07-19 一种用于隐藏原始数据以保护个人信息的混淆网络的学习方法和测试方法,以及其学习装置和测试装置 Active CN111373403B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR10-2018-0086929 2018-07-26
KR1020180086929A KR102035796B1 (ko) 2018-07-26 2018-07-26 데이터를 비식별 처리하는 방법, 시스템 및 비일시성의 컴퓨터 판독 가능 기록 매체
PCT/KR2019/008939 WO2020022704A1 (en) 2018-07-26 2019-07-19 Method for training and testing obfuscation network capable of processing data to be concealed for privacy, and training device and testing device using the same

Publications (2)

Publication Number Publication Date
CN111373403A true CN111373403A (zh) 2020-07-03
CN111373403B CN111373403B (zh) 2024-04-23

Family

ID=68423357

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980005836.1A Active CN111373403B (zh) 2018-07-26 2019-07-19 一种用于隐藏原始数据以保护个人信息的混淆网络的学习方法和测试方法,以及其学习装置和测试装置

Country Status (6)

Country Link
US (3) US10635788B2 (zh)
EP (2) EP3827366B1 (zh)
JP (2) JP7040712B2 (zh)
KR (1) KR102035796B1 (zh)
CN (1) CN111373403B (zh)
WO (3) WO2020022619A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112019502A (zh) * 2020-07-20 2020-12-01 北京邮电大学 一种环形守卫网络用户节点匿名保护方法及电子设备
CN116049840A (zh) * 2022-07-25 2023-05-02 荣耀终端有限公司 一种数据保护方法、装置、相关设备及系统

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7353032B2 (ja) * 2018-11-15 2023-09-29 株式会社Preferred Networks データ生成装置、データ生成方法及びプログラム
JP7209378B2 (ja) * 2018-12-26 2023-01-20 国立大学法人 筑波大学 分散データ統合装置、分散データ統合解析装置、分散データ統合方法、及びプログラム
JP7268368B2 (ja) * 2019-01-30 2023-05-08 富士通株式会社 学習装置、学習方法および学習プログラム
US11562134B2 (en) * 2019-04-02 2023-01-24 Genpact Luxembourg S.à r.l. II Method and system for advanced document redaction
KR102260039B1 (ko) * 2019-08-13 2021-06-03 주식회사 딥핑소스 개인 정보 보호를 위하여 원본 데이터를 컨실링 처리하는 변조 네트워크를 학습하는 방법 및 테스트하는 방법, 그리고, 이를 이용한 학습 장치 및 테스트 장치
US10621378B1 (en) * 2019-10-24 2020-04-14 Deeping Source Inc. Method for learning and testing user learning network to be used for recognizing obfuscated data created by concealing original data to protect personal information and learning device and testing device using the same
CN111078825A (zh) * 2019-12-20 2020-04-28 北京百度网讯科技有限公司 结构化处理方法、装置、计算机设备及介质
US11321430B2 (en) * 2020-01-08 2022-05-03 Bank Of America Corporation Big data distributed processing and secure data transferring with obfuscation
US11334408B2 (en) * 2020-01-08 2022-05-17 Bank Of America Corporation Big data distributed processing and secure data transferring with fault handling
US11363029B2 (en) * 2020-01-08 2022-06-14 Bank Of America Corporation Big data distributed processing and secure data transferring with hyper fencing
US11314874B2 (en) * 2020-01-08 2022-04-26 Bank Of America Corporation Big data distributed processing and secure data transferring with resource allocation and rebate
US11379603B2 (en) * 2020-01-08 2022-07-05 Bank Of America Corporation Big data distributed processing and secure data transferring with fallback control
CA3174627A1 (en) * 2020-03-06 2021-09-10 The Regents Of The University Of California Methods of providing data privacy for neural network based inference
US20210303662A1 (en) * 2020-03-31 2021-09-30 Irdeto B.V. Systems, methods, and storage media for creating secured transformed code from input code using a neural network to obscure a transformation function
US10956598B1 (en) * 2020-04-24 2021-03-23 Deeping Source Inc. Method for preventing breach of original data for deep learning and data breach preventing device using them
EP3905087B1 (en) * 2020-04-27 2023-01-18 Brighter AI Technologies GmbH Method and system for selective and privacy-preserving anonymization
US11709954B2 (en) * 2020-05-01 2023-07-25 Microsoft Technology Licensing, Llc Image content obfuscation using a neural network
US11017319B1 (en) * 2020-06-23 2021-05-25 Deeping Source Inc. Method for training obfuscation network which conceals original data to be used for machine learning and training surrogate network which uses obfuscated data generated by obfuscation network and method for testing trained obfuscation network and learning device and testing device using the same
US11017320B1 (en) * 2020-06-24 2021-05-25 Deeping Source Inc. Method for training obfuscation network which conceals original data to be used for machine learning and training surrogate network which uses obfuscated data generated by obfuscation network and learning device using the same and method for testing trained obfuscation network and testing device using the same
US11334773B2 (en) 2020-06-26 2022-05-17 Amazon Technologies, Inc. Task-based image masking
US11023777B1 (en) * 2020-09-25 2021-06-01 Deeping Source Inc. Methods for training and testing obfuscation network capable of performing distinct concealing processes for distinct regions of original image and learning and testing devices using the same
US11200342B1 (en) * 2020-10-21 2021-12-14 Deeping Source Inc. Method for training and testing obfuscation network capable of processing data to be obfuscated for privacy, and training device and testing device using the same
US11244248B1 (en) * 2020-10-21 2022-02-08 Deeping Source Inc. Method for training and testing user learning network to be used for recognizing obfuscated data created by obfuscating original data to protect personal information and user learning device and testing device using the same
US11200494B1 (en) * 2020-10-21 2021-12-14 Deeping Source Inc. Method for training and testing obfuscation network capable of obfuscating data for privacy, and training device and testing device using the same
US20220129582A1 (en) * 2020-10-22 2022-04-28 Robert Bosch Gmbh Data anonymization for data labeling and development purposes
KR102531368B1 (ko) * 2020-11-26 2023-05-12 주식회사 딥핑소스 원본 의료 이미지의 영역별로 서로 다른 컨실링 프로세스가 수행되도록 하여 원본 의료 이미지를 컨실링 처리하는 변조 네트워크를 학습하는 방법 및 테스트하는 방법, 그리고 이를 이용한 학습 장치 및 테스트 장치
US11164046B1 (en) 2020-12-07 2021-11-02 Deeping Source Inc. Method for producing labeled image from original image while preventing private information leakage of original image and server using the same
US20240088961A1 (en) 2021-01-13 2024-03-14 Lg Electronics Inc. Image display device
US11366930B1 (en) * 2021-08-23 2022-06-21 Deeping Source Inc. Method for training and testing obfuscation network capable of obfuscating data to protect personal information, and learning device and testing device using the same
US11308359B1 (en) * 2021-10-27 2022-04-19 Deeping Source Inc. Methods for training universal discriminator capable of determining degrees of de-identification for images and obfuscation network capable of obfuscating images and training devices using the same
US11669635B1 (en) * 2021-11-29 2023-06-06 Deeping Source Inc. Learning method and learning device for training obfuscation network capable of obfuscating original data for privacy and testing method and testing device using the same
US11423643B1 (en) * 2021-11-29 2022-08-23 Deeping Source Inc. Method for generating obfuscated image to be used in training learning net work and labeling device using the same
US11886955B2 (en) 2022-02-16 2024-01-30 Protopia AI, Inc. Self-supervised data obfuscation in foundation models
EP4266216A1 (en) * 2022-04-20 2023-10-25 Deeping Source Inc. Learning method and learning device for training obfuscation network capable of obfuscating original data for privacy to achieve information restriction obfuscation and testing method and testing device using the same
KR102648905B1 (ko) 2023-02-21 2024-03-18 (주)이지서티 프라이버시 보호 수준을 설정할 수 있는 데이터 변조 방법 및 장치

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170024642A1 (en) * 2015-03-13 2017-01-26 Deep Genomics Incorporated System and method for training neural networks
US20170317983A1 (en) * 2016-04-28 2017-11-02 Xerox Corporation Image document processing in a client-server system including privacy-preserving text recognition
US20180129900A1 (en) * 2016-11-04 2018-05-10 Siemens Healthcare Gmbh Anonymous and Secure Classification Using a Deep Learning Network
US20180165597A1 (en) * 2016-12-08 2018-06-14 Resurgo, Llc Machine Learning Model Evaluation in Cyber Defense
JP2018106216A (ja) * 2016-12-22 2018-07-05 日本電信電話株式会社 学習データ生成装置、開発データ生成装置、モデル学習装置、それらの方法、及びプログラム

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5671335A (en) * 1991-05-23 1997-09-23 Allen-Bradley Company, Inc. Process optimization using a neural network
JPH07105165A (ja) * 1993-09-30 1995-04-21 Nri & Ncc Co Ltd ニューラルネットワーク情報処理装置
JP3974763B2 (ja) * 2000-10-25 2007-09-12 富士通株式会社 予測分析装置及び予測分析プログラム
JP4591211B2 (ja) 2005-05-31 2010-12-01 富士ゼロックス株式会社 画像処理装置、画像処理方法、媒体、符号読取装置、及びプログラム
JP4424364B2 (ja) * 2007-03-19 2010-03-03 ソニー株式会社 画像処理装置、画像処理方法
US8577387B2 (en) 2009-03-17 2013-11-05 Qualcomm Incorporated Position location using multiple carriers
US8667301B2 (en) * 2010-04-01 2014-03-04 Apple Inc. Obfuscating transformations on data array content and addresses
US9105119B2 (en) * 2013-05-02 2015-08-11 Emotient, Inc. Anonymization of facial expressions
US9275308B2 (en) * 2013-05-31 2016-03-01 Google Inc. Object detection using deep neural networks
US10043035B2 (en) * 2013-11-01 2018-08-07 Anonos Inc. Systems and methods for enhancing data protection by anonosizing structured and unstructured data and incorporating machine learning and artificial intelligence in classical and quantum computing environments
JP6286329B2 (ja) * 2014-09-19 2018-02-28 株式会社沖データ 画像形成装置及び情報提供方法
US9454713B2 (en) 2014-12-30 2016-09-27 Ebay Inc. Similar item detection
US9773196B2 (en) * 2016-01-25 2017-09-26 Adobe Systems Incorporated Utilizing deep learning for automatic digital image segmentation and stylization
KR101784265B1 (ko) * 2016-06-09 2017-10-12 주식회사 그리즐리 빅데이터의 비식별화 처리 방법
KR101861520B1 (ko) * 2017-03-15 2018-05-28 광주과학기술원 얼굴 비식별화 방법
KR101877372B1 (ko) * 2017-05-19 2018-07-13 주식회사 하루컴퍼니 워터마크 데이터의 임베딩 및 추출 방법
US10642830B2 (en) * 2017-06-12 2020-05-05 Google Llc Context aware chat history assistance using machine-learned models
US11023593B2 (en) * 2017-09-25 2021-06-01 International Business Machines Corporation Protecting cognitive systems from model stealing attacks
US11481640B2 (en) * 2017-09-29 2022-10-25 Oracle International Corporation Directed trajectories through communication decision tree using iterative artificial intelligence
US10475169B2 (en) * 2017-11-28 2019-11-12 Adobe Inc. High dynamic range illumination estimation
US10535120B2 (en) * 2017-12-15 2020-01-14 International Business Machines Corporation Adversarial learning of privacy protection layers for image recognition services
US10748247B2 (en) * 2017-12-26 2020-08-18 Facebook, Inc. Computing high-resolution depth images using machine learning techniques
US10475538B2 (en) * 2018-01-11 2019-11-12 Siemens Healthcare Gmbh System for predicting computed tomography data from surface data
US10709394B2 (en) * 2018-01-15 2020-07-14 Siemens Healthcare Gmbh Method and system for 3D reconstruction of X-ray CT volume and segmentation mask from a few X-ray radiographs
US10535141B2 (en) * 2018-02-06 2020-01-14 Google Llc Differentiable jaccard loss approximation for training an artificial neural network

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170024642A1 (en) * 2015-03-13 2017-01-26 Deep Genomics Incorporated System and method for training neural networks
US20170317983A1 (en) * 2016-04-28 2017-11-02 Xerox Corporation Image document processing in a client-server system including privacy-preserving text recognition
US20180129900A1 (en) * 2016-11-04 2018-05-10 Siemens Healthcare Gmbh Anonymous and Secure Classification Using a Deep Learning Network
CN108021819A (zh) * 2016-11-04 2018-05-11 西门子保健有限责任公司 使用深度学习网络的匿名和安全分类
US20180165597A1 (en) * 2016-12-08 2018-06-14 Resurgo, Llc Machine Learning Model Evaluation in Cyber Defense
JP2018106216A (ja) * 2016-12-22 2018-07-05 日本電信電話株式会社 学習データ生成装置、開発データ生成装置、モデル学習装置、それらの方法、及びプログラム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
RICHARD MCPHERSON ET.AL: "Defeating Image Obfuscation with Deep Learning", pages 1 - 12 *
闫薇;: "加密数据上的机器学习分类研究", 网络空间安全, no. 3, pages 75 - 77 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112019502A (zh) * 2020-07-20 2020-12-01 北京邮电大学 一种环形守卫网络用户节点匿名保护方法及电子设备
CN112019502B (zh) * 2020-07-20 2021-06-29 北京邮电大学 一种环形守卫网络用户节点匿名保护方法及电子设备
CN116049840A (zh) * 2022-07-25 2023-05-02 荣耀终端有限公司 一种数据保护方法、装置、相关设备及系统
CN116049840B (zh) * 2022-07-25 2023-10-20 荣耀终端有限公司 一种数据保护方法、装置、相关设备及系统

Also Published As

Publication number Publication date
EP3827366A4 (en) 2022-06-08
EP3827366C0 (en) 2024-02-07
US10635788B2 (en) 2020-04-28
JP7041823B2 (ja) 2022-03-25
EP3827366A1 (en) 2021-06-02
US20200034520A1 (en) 2020-01-30
US10896246B2 (en) 2021-01-19
EP3827366B1 (en) 2024-02-07
EP3827365A4 (en) 2022-04-27
CN111373403B (zh) 2024-04-23
JP7040712B2 (ja) 2022-03-23
WO2020022619A1 (ko) 2020-01-30
JP2021523489A (ja) 2021-09-02
WO2020022703A1 (en) 2020-01-30
JP2021512442A (ja) 2021-05-13
US20200034565A1 (en) 2020-01-30
US20200201957A1 (en) 2020-06-25
WO2020022704A1 (en) 2020-01-30
EP3827365A1 (en) 2021-06-02
KR102035796B1 (ko) 2019-10-24
US10747854B2 (en) 2020-08-18

Similar Documents

Publication Publication Date Title
CN111373403B (zh) 一种用于隐藏原始数据以保护个人信息的混淆网络的学习方法和测试方法,以及其学习装置和测试装置
US10621379B1 (en) Method for training and testing adaption network corresponding to obfuscation network capable of processing data to be concealed for privacy, and training device and testing device using the same
US10621378B1 (en) Method for learning and testing user learning network to be used for recognizing obfuscated data created by concealing original data to protect personal information and learning device and testing device using the same
US11017319B1 (en) Method for training obfuscation network which conceals original data to be used for machine learning and training surrogate network which uses obfuscated data generated by obfuscation network and method for testing trained obfuscation network and learning device and testing device using the same
US11200494B1 (en) Method for training and testing obfuscation network capable of obfuscating data for privacy, and training device and testing device using the same
US11200342B1 (en) Method for training and testing obfuscation network capable of processing data to be obfuscated for privacy, and training device and testing device using the same
US11308359B1 (en) Methods for training universal discriminator capable of determining degrees of de-identification for images and obfuscation network capable of obfuscating images and training devices using the same
EP3929820A1 (en) Method for training obfuscation network which conceals original data to be used for machine learning and training surrogate network which uses obfuscated data generated by obfuscation network and learning device using the same and method for testing trained obfuscation network and testing device using the same
US11366930B1 (en) Method for training and testing obfuscation network capable of obfuscating data to protect personal information, and learning device and testing device using the same
US11244248B1 (en) Method for training and testing user learning network to be used for recognizing obfuscated data created by obfuscating original data to protect personal information and user learning device and testing device using the same
CN113408558B (zh) 用于模型验证的方法、装置、设备和介质
CN117063173A (zh) Ai模型水印系统和方法
KR20230121974A (ko) 개인 정보 보호를 위하여 원본 데이터를 변조하는 변조네트워크를 학습하는 방법 및 테스트하는 방법, 그리고, 이를 이용한 학습 장치 및 테스트 장치
Hewage et al. Optimizing the trade-off between classification accuracy and data privacy in the area of data stream mining
KR102260039B1 (ko) 개인 정보 보호를 위하여 원본 데이터를 컨실링 처리하는 변조 네트워크를 학습하는 방법 및 테스트하는 방법, 그리고, 이를 이용한 학습 장치 및 테스트 장치
KR102244190B1 (ko) 데이터를 컨실링 처리하는 방법 및 이를 이용한 데이터 변조 장치
CN117852029A (zh) 神经网络后门检测方法及装置
CN112313645A (zh) 通过合成原始数据和标记数据来生成已标记数据的数据嵌入网络的学习方法和测试方法以及用其的学习装置和测试装置
Joshi et al. MALWARE DETECTION USING MACHINE LEARNING TECHNIQUES

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant