CN112313645A - 通过合成原始数据和标记数据来生成已标记数据的数据嵌入网络的学习方法和测试方法以及用其的学习装置和测试装置 - Google Patents

通过合成原始数据和标记数据来生成已标记数据的数据嵌入网络的学习方法和测试方法以及用其的学习装置和测试装置 Download PDF

Info

Publication number
CN112313645A
CN112313645A CN201980035428.0A CN201980035428A CN112313645A CN 112313645 A CN112313645 A CN 112313645A CN 201980035428 A CN201980035428 A CN 201980035428A CN 112313645 A CN112313645 A CN 112313645A
Authority
CN
China
Prior art keywords
data
learning
labeled
network
feature information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201980035428.0A
Other languages
English (en)
Other versions
CN112313645B (zh
Inventor
金泰勋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Deep Source Co
Original Assignee
Deep Source Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Deep Source Co filed Critical Deep Source Co
Publication of CN112313645A publication Critical patent/CN112313645A/zh
Application granted granted Critical
Publication of CN112313645B publication Critical patent/CN112313645B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • G06F21/6254Protecting personal data, e.g. for financial or medical purposes by anonymising data, e.g. decorrelating personal data from the owner's identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/10Protecting distributed programs or content, e.g. vending or licensing of copyrighted material ; Digital rights management [DRM]
    • G06F21/106Enforcing content protection by specific content processing
    • G06F21/1063Personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/10Protecting distributed programs or content, e.g. vending or licensing of copyrighted material ; Digital rights management [DRM]
    • G06F21/16Program or content traceability, e.g. by watermarking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/018Audio watermarking, i.e. embedding inaudible data in the audio signal

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Hardware Design (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Multimedia (AREA)
  • Technology Law (AREA)
  • Medical Informatics (AREA)
  • Bioethics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供一种数据嵌入网络的学习方法,该方法包括:学习装置获得原始数据和标记数据并将其输入到数据嵌入网络中,以使数据嵌入网络合成原始数据和标记数据从而生成已标记学习数据;将已标记学习数据输入到学习网络中以使学习网络对已标记学习数据进行网络运算来生成第1特征信息,并将原始学习数据输入到学习网络以使学习网络对原始学习数据进行网络运算来生成第2特征信息;以及学习数据嵌入网络,以使通过参考将第1特征信息和第2特征信息作为参考的错误与将任务特定输出和与其对应的真实数据作为参考的错误中的至少一部分来生成的数据错误最小化且使已标记数据分数最大化,并学习鉴别器,以使原始数据分数最大化且使已标记数据分数最小化。

Description

通过合成原始数据和标记数据来生成已标记数据的数据嵌入 网络的学习方法和测试方法以及用其的学习装置和测试装置
技术领域
本发明涉及一种通过合成原始数据和标记数据来生成标记数据的数据嵌入网络(Data Embedding Network)的学习方法和用其的学习装置,并还涉及一种学习为通过合成原始数据和标记数据来生成标记数据的数据嵌入网络的测试方法和用其的测试装置。
背景技术
大数据(Big Data)是指包括现有企业环境或公共机构中使用的所有结构化数据以及尚未使用的所有非结构化或半结构化数据的数据,例如电子商务数据、元数据、Web日志数据、射频识别(RFID,Radio Frequency Identification)数据、传感器网络数据、社交网络数据、互联网文本和文档上的数据、互联网搜索索引数据等。从普通软件工具和计算机系统难以处理如此大量数据的意义上来说,此类数据通常被称为大数据。
大数据本身可能毫无意义,但如果对模式等进行机器学习,则对在各个领域中生成新数据或做出判断或预测会很有用。
近年来,随着对人工智能技术的关注增加,作为其基础的大数据交易或共享变得活跃起来。
然而,由于数据的特性(例如,数据量庞大且难以特定数据来源的特性),一旦传递给第三方,不仅容易复制或复印,而且即使未经许将其移交给没有权利的人,也不容易发现。为了弥补这一点,出现了某种个人识别技术,例如水印(Watermark)。
作为现有技术的一实例,可以举出韩国公开专利公报第10-2018-0058116号中公开的技术,其提供一种音频水印嵌入(Embedding)技术,包括:对第1音频信号进行MCLT变换;将水印的位串插入所述MCLT变换的第1音频信号;对所述插入位串的第1音频信号进行IMDCT变换;以及通过将所述IMDCT变换的信号与相邻帧信号叠加(Superimposing)来将水印插入第1音频信号以生成第2音频信号。
作为现有技术的另一实例,可以举出韩国公开专利公报第10-1837939号中公开的技术,其提供一种在文档嵌入水印的技术,其特征在于包括如下三个步骤:将应用预设颜色的文档分为多个区域的第1步骤;将水印选择并插入所述分为多个区域的文档,使其彼此不重叠的第2步骤;校正水印文档以使其与所述应用预设颜色的文档的颜色匹配,并根据水印的隐藏程度(Hidden Degree)校正颜色的第3步骤。
然而根据到目前为止介绍的技术,包括如上所述的现有技术,通过识别处理过程,可以很容易识别出谁的数据或从谁接收的数据,并可以防止未经授权的分发,但由于识别处理过程导致原始数据的变形或损坏,因此在机器学习、深度学习或强化学习过程中存在误识(Misrecognized)或难以使用的问题。
因此,本发明人提供一种技术,其通过合成原始数据和标记数据来生成与原始数据不同地识别的已标记数据,并使将原始数据输入到学习模型时输出的结果与将已标记数据输入到该学习模型时输出的结果彼此相同或相似。
发明内容
要解决的技术问题
本发明的目的在于解决上述现有技术的所有问题。
另外,本发明的另一目的在于可以通过对数据执行诸如数字水印处理之类的操作来容易地识别数据来源。
另外,本发明的另一目的在于使通过将机器学习运算应用于通过将标记数据插入到原始数据而获得的经识别处理的数据而生成的结果与将机器学习运算应用于原始数据而生成的结果相同或相似。
另外,本发明的另一目的在于获得原始数据与经识别处理的数据被人识别为彼此不同,但被计算机识别为彼此相同或相似的结果。
此外,本发明的另一目的在于支持数据提供者在大数据交易市场安心地交易或共享数据。
技术方案
根据本发明的一方面提供一种通过合成原始数据和标记数据(Mark Data)来生成已标记数据(Marked Data)的数据嵌入网络的学习方法(Data Embedding Network),其包括:(a)当获得原始学习数据和标记学习数据时,学习装置将所述原始学习数据和所述标记学习数据输入到所述数据嵌入网络中,使所述数据嵌入网络合成所述原始学习数据和所述标记学习数据,从而生成已标记学习数据;(b)所述学习装置(i)将所述已标记学习数据输入到具有至少一个学习参数的学习网络中,使所述学习网络(i-1)用所述学习参数将网络运算应用于所述已标记学习数据,(i-2)从而生成与所述已标记学习数据相对应的第1特征信息,(ii)并将所述原始学习数据输入到所述学习网络中,使所述学习网络(ii-1)用所述学习参数将网络运算应用于所述原始学习数据,(ii-2)从而生成与所述原始学习数据相对应的第2特征信息;以及(c)所述学习装置(c1)学习所述数据嵌入网络,(i)以使通过参考(i-1)将所述第1特征信息和所述第2特征信息作为参考而获得的至少一个第1错误与(i-2)将用所述第1特征信息生成的至少一个任务特定输出和与所述任务特定输出对应的至少一个真实数据作为参考而获得的至少一个第2错误中的至少一部分来计算出的至少一个数据错误最小化,(ii)并使与输入到鉴别器中的所述已标记学习数据相对应的至少一个已标记数据分数最大化,其中所述鉴别器鉴别所输入数据的真实性,(c2)学习所述鉴别器,以使分别与输入到所述鉴别器中的修改学习数据或修改已标记学习数据相对应的至少一个修改数据分数或至少一个修改已标记数据分数最大化并使所述已标记数据分数最小化,其中所述修改学习数据或所述修改已标记学习数据分别通过修改所述原始学习数据或所述已标记学习数据来生成。
根据本发明一实施例,所述学习网络包括分别具有至少一个第1学习参数至至少一个第n学习参数的第1学习网络至第n学习网络,其中,所述n为1或更大的整数,在所述步骤(b)中,所述学习装置(i)将所述已标记学习数据分别输入到所述第1学习网络至所述第n学习网络中,使每个所述第1学习网络至所述第n学习网络(i-1)用每个所述第1学习网络至所述第n学习网络的所述第1学习参数至所述第n学习参数将与每个学习网络相对应的网络运算应用于所述已标记学习数据,(i-2)从而输出关于所述已标记学习数据的每个第1_1特征信息至第1_n特征信息,(ii)并将所述原始学习数据输入到每个所述第1学习网络至所述第n学习网络中,使每个所述第1学习网络至所述第n学习网络(ii-1)用每个所述第1学习参数至所述第n学习参数将与每个学习网络相对应的网络运算应用于所述原始学习数据,(ii-2)从而输出关于所述原始学习数据的每个第2_1特征信息至第2_n特征信息,在所述步骤(c)中,所述学习装置(i)学习所述数据嵌入网络,以使通过参考(i-1)作为将所述第1_1特征信息和所述第2_1特征信息作为参考而获得的第1_1错误至将所述第1_n特征信息和所述第2_n特征信息作为参考而获得的第1_n错误的平均值的所述第1错误与(i-2)作为将用所述第1_1特征信息生成的至少一个第1任务特定输出和与所述第1任务特定输出对应的至少一个第1真实数据作为参考而获得的第2_1错误至将用所述第1_n特征信息生成的至少一个第n任务特定输出和与所述第n任务特定输出对应的至少一个第n真实数据作为参考而获得的第2_n错误的平均值的所述第2错误中的至少一部分来计算出的所述数据错误最小化,且使与输入到所述鉴别器的所述已标记学习数据相对应的所述已标记数据分数最大化,(ii)并且学习所述鉴别器,以使分别与输入到所述鉴别器的所述修改学习数据或所述修改已标记学习数据相对应的所述修改数据分数或所述修改已标记数据分数最大化且使所述已标记数据分数最小化。
根据本发明一实施例,所述学习网络包括分别具有至少一个第1学习参数至至少一个第n学习参数的第1学习网络至第n学习网络,其中,所述n为1或更大的整数,在所述步骤(a)中,所述学习装置将所述原始学习数据和所述标记学习数据输入到所述数据嵌入网络中,使所述数据嵌入网络合成所述原始学习数据和所述标记学习数据,从而生成第1已标记学习数据,在所述步骤(b)中,所述学习装置(i)将所述第1已标记学习数据输入到所述第1学习网络中,使所述第1学习网络(i-1)用所述第1学习网络的所述第1学习参数将网络运算应用于所述第1已标记学习数据,(i-2)从而输出关于所述第1已标记学习数据的第1_1特征信息,(ii)并将所述原始学习数据输入到所述第1学习网络中,使所述第1学习网络(ii-1)用所述第1学习参数将网络运算应用于所述原始学习数据,(ii-2)从而输出关于所述原始学习数据的第2_1特征信息,在所述步骤(c)中,所述学习装置(c1)学习所述数据嵌入网络,(i)以使通过参考(i-1)将所述第1_1特征信息和所述第2_1特征信息作为参考而获得的至少一个第1_1错误与(i-2)将用所述第1_1特征信息生成的至少一个第1任务特定输出和与所述第1任务特定输出对应的至少一个第1真实数据作为参考而获得的至少一个第2_1错误中的至少一部分来计算出的至少一个第1数据错误最小化(ii)且使与输入到所述鉴别器的所述第1已标记学习数据相对应的至少一个第1已标记数据分数最大化,从而使所述数据嵌入网络成为第1学习的数据嵌入网络,(c2)学习所述鉴别器,(i)以使分别与输入到所述鉴别器的所述修改学习数据或所述修改已标记学习数据相对应的至少一个第1修改数据分数或至少一个第1修改已标记数据分数最大化(ii)且使所述第1已标记数据分数最小化,从而使所述鉴别器成为第1学习的鉴别器,所述学习装置在将整数k从2增加到n的同时,(i)将所述原始学习数据和所述标记学习数据输入到所述第k_1学习的数据嵌入网络中,使所述第k_1学习的数据嵌入网络合成所述原始学习数据和所述标记学习数据,从而生成第k已标记学习数据,(ii)将所述第k已标记学习数据输入到第k学习网络中,使所述第k学习网络用所述第k学习网络中的至少一个第k学习参数将网络运算应用于所述第k已标记学习数据,从而输出与所述第k已标记学习数据相对应的第1_k特征信息,将所述原始学习数据输入到所述第k学习网络中,使所述第k学习网络用所述第k学习参数将网络运算应用于所述原始学习数据,从而输出与所述原始学习数据相对应的第2_k特征信息,(iii)学习第k_1学习的数据嵌入网络,以使通过参考(iii-1)将所述第1_k特征信息和所述第2_k特征信息作为参考而获得的至少一个第1_k数据错误与(iii-2)将用所述第1_k特征信息生成的至少一个第k任务特定输出和与所述第k任务特定输出对应的至少一个第k真实数据作为参考而获得的至少一个第2-k错误中的至少一部分来计算出的至少一个第k数据错误最小化,且使与输入到所述第k_1学习的鉴别器中的所述第k已标记学习数据相对应的至少一个第k已标记数据分数最大化,从而使所述第k_1学习的数据嵌入网络成为第k学习的数据嵌入网络,(iv)学习所述第k_1学习的鉴别器,以使分别与输入到所述第k_1学习的鉴别器的所述修改学习数据或所述修改已标记学习数据相对应的至少一个第k修改数据分数或至少一个第k修改已标记数据分数最大化且使所述第k已标记数据分数最小化,从而使所述k_1学习的鉴别器成为第k学习的鉴别器。
根据本发明一实施例,分别与输入到所述鉴别器的所述修改学习数据或所述修改已标记学习数据相对应的所述修改数据分数或所述修改已标记数据分数的最大值为1,作为鉴别所述修改学习数据或所述修改已标记学习数据为真的值,并与输入到所述鉴别器的所述已标记学习数据相对应的所述已标记数据分数的最小值为0,作为鉴别所述已标记学习数据为假的值。
根据本发明一实施例,在所述步骤(c)中,所述学习装置参考所述第1特征信息和所述第2特征信息之间的差来获得所述第1错误,并参考使用所述任务特定输出和所述真实数据生成的至少一个损失来获得所述第2错误。
根据本发明一实施例,所述学习装置参考所述第1特征信息和所述第2特征信息之间的范数(Norm)或余弦相似度(CosineSimilarity)来获得所述第1错误。
根据本发明一实施例,在所述步骤(c)中,所述学习装置学习所述数据嵌入网络,以进一步参考所述原始学习数据和所述已标记学习数据之间的相似度来使所述相似度最小化。
根据本发明的另一方面提供一种学习的通过合成原始数据和标记数据来生成已标记数据的数据嵌入网络的测试方法,其包括:(a)测试装置在学习装置已经执行如下处理的条件下获得要合成的原始测试数据和标记测试数据:(i)将所述原始学习数据和所述标记学习数据输入到数据嵌入网络中,使所述数据嵌入网络合成所述原始学习数据和所述标记学习数据,从而生成已标记学习数据;(ii)将所述已标记学习数据输入到具有学习参数的学习网络中,使所述学习网络用所述学习参数将网络运算应用于所述已标记学习数据,从而生成与所述已标记学习数据相对应的第1特征信息,将所述原始学习数据输入到所述学习网络中,使所述学习网络用所述学习参数将网络运算应用于所述原始学习数据,从而生成与所述原始学习数据相对应的第2特征信息;(iii)学习所述数据嵌入网络,以使通过参考(iii-1)将所述第1特征信息和所述第2特征信息作为参考而获得的至少一个第1错误与(iii-2)将使用所述第1特征信息生成的至少一个任务特定输出和与所述任务特定输出对应的至少一个真实数据(Ground Truth)作为参考而获得的至少一个第2错误中的至少一部分来计算出的至少一个数据错误最小化且使与输入到鉴别器的所述已标记学习数据相对应的至少一个已标记数据分数最大化,其中所述鉴别器鉴别所输入数据的真实性;以及(iv)学习所述鉴别器,以使分别与输入到所述鉴别器中的修改学习数据或修改已标记学习数据相对应的至少一个修改数据分数或至少一个修改已标记数据分数最大化且使所述已标记数据分数最小化,其中所述修改学习数据或所述修改已标记学习数据分别通过修改所述原始学习数据或所述已标记学习数据来生成;以及(b)所述测试装置将所述原始测试数据和所述标记测试数据输入到所述数据嵌入网络,使所述数据嵌入网络用所述数据嵌入网络的至少一个学习参数合成所述原始测试数据和所述标记测试数据,从而生成已标记测试数据。
根据本发明一实施例,在所述步骤(a)中,所述学习网络包括分别具有至少一个第1学习参数至至少一个第n学习参数的第1学习网络至第n学习网络,其中,所述n为1或更大的整数,所述学习装置已经执行如下处理:(i)将所述已标记学习数据分别输入到所述第1学习网络至所述第n学习网络中,使每个所述第1学习网络至所述第n学习网络(i-1)用每个所述第1学习网络至所述第n学习网络的至少一个所述第1学习参数至至少一个所述第n学习参数将与每个学习网络相对应的网络运算应用于所述已标记学习数据,(i-2)从而输出与所述已标记学习数据相对应的每个第1_1特征信息至第1_n特征信息;(ii)将所述原始学习数据分别输入到所述第1学习网络至所述第n学习网络中,使每个所述第1学习网络至所述第n学习网络(ii-1)用每个所述第1学习网络至所述第n学习网络的所述第1学习参数至所述第n学习参数将与每个学习网络相对应的网络运算应用于所述原始学习数据,(ii-2)从而输出与所述原始学习数据对应的每个第2_1特征信息至第2_n特征信息;(iii)学习所述数据嵌入网络,(iii-1)以使通过参考(iii-a)作为将所述第1_1特征信息和所述第2_1特征信息作为参考而获得的至少一个第1_1错误至将所述第1_n特征信息和所述第2_n特征信息作为参考而获得的至少一个第1_n错误的平均值的所述第1错误与(iii-1b)作为将用所述第1_1特征信息生成的至少一个第1任务特定输出和与所述第1任务特定输出对应的至少一个第1真实数据作为参考而获得的第2_1错误至将用所述第1_n特征信息生成的至少一个第n任务特定输出和与所述第n任务特定输出对应的至少一个第n真实数据作为参考而获得的第2_n错误的平均值的所述第2错误中的至少一部分来计算出的所述数据错误最小化,(iii-2)且使与输入到所述鉴别器的所述已标记学习数据相对应的所述已标记数据分数最大化;以及(iv)学习所述鉴别器,以使分别与输入到所述鉴别器的所述修改学习数据或所述修改已标记学习数据相对应的所述修改数据分数或所述修改已标记数据分数最大化且使所述已标记数据分数最小化。
根据本发明一实施例,在所述步骤(a)中,所述学习网络包括分别具有至少一个第1学习参数至至少一个第n学习参数的第1学习网络至第n学习网络,其中,所述n为1或更大的整数,所述学习装置已经执行如下处理的:(i)将所述原始学习数据和所述标记学习数据输入到所述数据嵌入网络中,使所述数据嵌入网络合成所述原始学习数据和所述标记学习数据,从而生成第1已标记学习数据;(ii)将所述第1已标记学习数据输入到所述第1学习网络中,使所述第1学习网络用所述第1学习网络的所述第1学习参数将网络运算应用于所述第1已标记学习数据,从而输出与所述第1已标记学习数据相对应的第1_1特征信息,并将所述原始学习数据输入到所述第1学习网络中,使所述第1学习网络用所述第1学习网络的所述第1学习参数将网络运算应用于所述原始学习数据,从而输出与所述原始学习数据相对应的第2_1特征信息;(iii)学习所述数据嵌入网络,以使通过参考(iii-1)将所述第1_1特征信息和所述第2_1特征信息作为参考而获得的所述第1_1错误与(iii-2)将用所述第1_1特征信息生成的第1任务特定输出和与所述第1任任务特定输出对应的所述第1真实数据作为参考而获得的所述第2_1错误中的至少一部分来计算出的第1数据错误最小化且使与输入到所述鉴别器的所述第1已标记学习数据相对应的所述第1已标记数据分数最大化,从而使所述数据嵌入网络成为第1学习的数据嵌入网络;(iv)学习所述鉴别器,以使分别与输入到所述鉴别器的所述修改学习数据或所述修改已标记学习数据相对应的至少一个第1修改数据分数或至少一个第1修改已标记数据分数最大化且使所述第1已标记数据分数最小化,从而使所述鉴别器成为第1学习的鉴别器;以及(v)在将整数k从2增加到n的同时,(v-1)将所述原始学习数据和所述标记学习数据输入到第k_1学习的数据嵌入网络中,使所述第k_1学习的数据嵌入网络合成所述原始学习数据和所述标记学习数据,从而生成第k已标记学习数据,(v-2)将所述第k已标记学习数据输入到第k学习网络中,使所述第k学习网络用所述第k学习网络的至少一个第k学习参数将网络运算应用于所述第k已标记学习数据,从而输出与所述第k已标记学习数据相对应的第1_k特征信息,将所述原始学习数据输入到所述第k学习网络中,使所述第k学习网络用所述第k学习参数将网络运算应用于所述原始学习数据,从而输出与所述原始学习数据相对应的第2_k特征信息,(v-3)学习第k_1学习的数据嵌入网络,以使通过参考(v-3-1)将所述第1_k特征信息和所述第2_k特征信息作为参考而获得的至少一个第1_k数据错误与(v-3-2)将用所述第1_k特征信息生成的至少一个第k任务特定输出和与所述第k任务特定输出对应的至少一个第k真实数据作为参考而获得的至少一个第2-k错误中的至少一部分来计算出的至少一个第k数据错误最小化且使与输入到所述第k_1学习的鉴别器中的所述第k已标记学习数据相对应的至少一个第k已标记数据分数最大化,从而使所述第k_1学习的数据嵌入网络成为第k学习的数据嵌入网络,(v-4)学习所述第k_1学习的鉴别器,以使分别与输入到所述第k_1学习的鉴别器的所述修改学习数据或所述修改已标记学习数据相对应的至少一个第k修改数据分数或至少一个第k修改已标记数据分数最大化且使所述第k已标记数据分数最小化,从而使所述k_1学习的鉴别器成为第k学习的鉴别器。
根据本发明一实施例,分别与输入到所述鉴别器的所述修改学习数据或所述修改已标记学习数据相对应的所述修改数据分数或所述修改已标记数据分数的最大值为1,作为鉴别所述修改学习数据或所述修改已标记学习数据为真的值,并与输入到所述鉴别器的所述已标记学习数据相对应的所述已标记数据分数的最小值为0,作为鉴别所述已标记学习数据为假的值。
根据本发明一实施例,所述学习装置参考所述第1特征信息和所述第2特征信息之间的差来获得所述第1错误,并参考使用所述任务特定输出和所述真实数据生成的至少一个损失来获得所述第2错误。
根据本发明一实施例,所述学习装置参考所述第1特征信息和所述第2特征信息之间的范数(Norm)或余弦相似度(CosineSimilarity)来获得所述第1错误。
根据本发明一实施例,所述学习装置学习所述数据嵌入网络,以进一步参考所述原始学习数据和所述已标记学习数据之间的相似度来以使所述相似度最小化。
根据本发明的另一方面提供一种学习通过合成原始数据和标记数据(Mark Data)来生成已标记数据(Marked Data)的数据嵌入网络(Data Embedding Network)的学习装置,其包括:至少一个存储指令的存储器;以及至少一个处理器,其配置为执行用于进行如下处理的指令:(I)当获得原始学习数据和标记学习数据时,将所述原始学习数据和所述标记学习数据输入到数据嵌入网络中,使所述数据嵌入网络合成所述原始学习数据和所述标记学习数据,从而生成已标记学习数据;(II)(i)将所述已标记学习数据输入到具有至少一个学习参数的学习网络中,使所述学习网络(i-1)用所述学习参数将网络运算应用于所述已标记学习数据,(i-2)从而生成与所述已标记学习数据相对应的第1特征信息(Characteristic Information),(ii)并将所述原始学习数据输入到所述学习网络中,使所述学习网络(ii-1)用所述学习参数将网络运算应用于所述原始学习数据,(ii-2)从而生成与所述原始学习数据相对应的第2特征信息;以及(III)(III-1)学习所述数据嵌入网络,(i)以使通过参考(i-1)将所述第1特征信息和所述第2特征信息作为参考而获得的至少一个第1错误与(i-2)将使用所述第1特征信息生成的至少一个任务特定输出(Task SpecificOutput)和与所述任务特定输出对应的至少一个真实数据(Ground Truth)作为参考而获得的至少一个第2错误中的至少一部分来计算出的至少一个数据错误最小化,(ii)且使与输入到鉴别器中的所述已标记学习数据相对应的至少一个已标记数据分数最大化,其中所述鉴别器(Discriminator)鉴别所输入数据的真实性,(III-2)学习所述鉴别器,以使分别与输入到所述鉴别器中的修改学习数据或修改已标记学习数据相对应的至少一个修改数据分数或至少一个修改已标记数据分数最大化且使所述已标记数据分数最小化,其中所述修改学习数据或所述修改已标记学习数据分别通过修改所述原始学习数据或所述已标记学习数据来生成。
根据本发明一实施例,所述学习网络包括分别具有至少一个第1学习参数至至少一个第n学习参数的第1学习网络至第n学习网络,其中,所述n为1或更大的整数,在所述处理(II)中,所述学习装置(i)将所述已标记学习数据分别输入到所述第1学习网络至所述第n学习网络中,使每个所述第1学习网络至所述第n学习网络(i-1)用每个所述第1学习网络至所述第n学习网络的所述第1学习参数至所述第n学习参数将与每个学习网络相对应的网络运算应用于所述已标记学习数据,(i-2)从而输出关于所述已标记学习数据的每个第1_1特征信息至第1_n特征信息,(ii)并将所述原始学习数据输入到每个所述第1学习网络至所述第n学习网络中,使每个所述第1学习网络至所述第n学习网络(ii-1)用每个所述第1学习参数至所述第n学习参数将与每个学习网络相对应的网络运算应用于所述原始学习数据,(ii-2)从而输出与所述原始学习数据对应的每个第2_1特征信息至第2_n特征信息,在所述处理(III)中,所述学习装置(i)学习所述数据嵌入网络,以使通过参考作为(i-1)将所述第1_1特征信息和所述第2_1特征信息作为参考而获得的第1_1错误至将所述第1_n特征信息和所述第2_n特征信息作为参考而获得的第1_n错误的平均值的所述第1错误与(i-2)作为将用所述第1_1特征信息生成的至少一个第1任务特定输出和与所述第1任务特定输出对应的至少一个第1真实数据作为参考而获得的第2_1错误至将用所述第1_n特征信息生成的至少一个第n任务特定输出和所述第n任务特定输出对应的至少一个第n真实数据作为参考而获得的第2_n错误的平均值的所述第2错误中的至少一部分来计算出的所述数据错误最小化,且使与输入到所述鉴别器的所述已标记学习数据相对应的所述已标记数据分数最大化,(ii)并且学习所述鉴别器,以使分别与输入到所述鉴别器的所述修改学习数据或所述修改已标记学习数据相对应的所述修改数据分数或所述修改已标记数据分数最大化且使所述已标记数据分数最小化。
根据本发明一实施例,所述学习网络包括分别具有至少一个第1学习参数至至少一个第n学习参数的第1学习网络至第n学习网络,其中,所述n为1或更大的整数,在所述处理(I)中,所述处理器将所述原始学习数据和所述标记学习数据输入到所述数据嵌入网络中,使所述数据嵌入网络合成所述原始学习数据和所述标记学习数据,从而生成第1已标记学习数据,在所述处理(II)中,所述处理器(i)将所述第1已标记学习数据输入到所述第1学习网络中,使所述第1学习网络(i-1)用所述第1学习网络的所述第1学习参数将网络运算应用于所述第1已标记学习数据,(i-2)从而输出关于所述第1已标记学习数据的第1_1特征信息,(ii)并将所述原始学习数据输入到所述第1学习网络中,使所述第1学习网络(ii-1)用所述第1学习参数将网络运算应用于所述原始学习数据,(ii-2)从而输出关于所述原始学习数据的第2_1特征信息,在所述处理(III)中,所述处理器(III-1)学习所述数据嵌入网络,(i)以使通过参考(i-1)将所述第1_1特征信息和所述第2_1特征信息作为参考而获得的至少一个第1_1错误与(i-2)将用所述第1_1特征信息生成的至少一个第1任务特定输出和与所述第1任务特定输出对应的至少一个第1真实数据作为参考而获得的至少一个第2_1错误中的至少一部分来计算出的至少一个第1数据错误最小化(ii)且使与输入到所述鉴别器的所述第1已标记学习数据相对应的至少一个第1已标记数据分数最大化,从而使所述数据嵌入网络成为第1学习的数据嵌入网络,(III-2)学习所述鉴别器,(i)以使分别与输入到所述鉴别器的所述修改学习数据或所述修改已标记学习数据相对应的至少一个第1修改数据分数或至少一个第1修改已标记数据分数最大化(ii)且使所述第1已标记数据分数最小化,从而使所述鉴别器成为第1学习的鉴别器,所述处理器在将整数k从2增加到n的同时,(i)将所述原始学习数据和所述标记学习数据输入到第k_1学习的数据嵌入网络中,使所述第k_1学习的数据嵌入网络合成所述原始学习数据和所述标记学习数据,从而生成第k已标记学习数据,(ii)将所述第k已标记学习数据输入到第k学习网络中,使所述第k学习网络用所述第k学习网络中的至少一个第k学习参数将网络运算应用于所述第k已标记学习数据,从而输出与所述第k已标记学习数据相对应的第1_k特征信息,将所述原始学习数据输入到所述第k学习网络中,使所述第k学习网络用所述第k学习参数将网络运算应用于所述原始学习数据,从而输出与所述原始学习数据相对应的第2_k特征信息,(iii)学习第k_1学习的数据嵌入网络,以使通过参考(iii-1)将所述第1_k特征信息和所述第2_k特征信息作为参考而获得的至少一个第1_k数据错误与(iii-2)将用所述第1_k特征信息生成的至少一个第k任务特定输出和与所述第k任务特定输出对应的至少一个第k真实数据作为参考而获得的至少一个第2-k错误中至少一部分来计算出的至少一个第k数据错误最小化且使与输入到所述第k_1学习的鉴别器中的所述第k已标记学习数据相对应的至少一个第k已标记数据分数最大化,从而使所述第k_1学习的数据嵌入网络成为第k学习的数据嵌入网络,(iv)学习所述第k_1学习的鉴别器,以使分别与输入到所述第k_1学习的鉴别器的所述修改学习数据或所述修改已标记学习数据相对应的至少一个第k修改数据分数或至少一个第k修改已标记数据分数最大化且使所述第k已标记数据分数最小化,从而使所述k_1学习的鉴别器成为第k学习的鉴别器。
根据本发明一实施例,分别与输入到所述鉴别器的所述修改学习数据或所述修改已标记学习数据相对应的所述修改数据分数或所述修改已标记数据分数的最大值为1,作为鉴别所述修改学习数据或所述修改已标记学习数据为真的值,并与输入到所述鉴别器的所述已标记学习数据相对应的所述已标记数据分数的最小值为0,作为于鉴别所述已标记学习数据为假的值。
根据本发明一实施例,在所述处理(III)中,所述处理器参考所述第1特征信息和所述第2特征信息之间的差来获得所述第1错误,并参考使用所述任务特定输出和所述真实数据生成的至少一个损失来获得所述第2错误。
根据本发明一实施例,所述处理器通过参考所述第1特征信息和所述第2特征信息之间的范数(Norm)或余弦相似度(CosineSimilarity)来获取所述第1错误。
根据本发明一实施例,在所述处理(III)中,所述处理器学习所述数据嵌入网络,以进一步参考所述原始学习数据和所述已标记学习数据之间的相似度来使所述相似度最小化。
根据本发明的另一方面提供一种学习的通过合成原始数据和标记数据来生成已标记数据的数据嵌入网络的测试装置,其包括:至少一个存储指令的存储器;以及至少一个处理器,其配置为执行指令以进行如下处理或支持其他装置进行如下处理:(I)在学习装置已经执行如下处理的条件下获得要合成的原始测试数据和标记测试数据:(i)当获得原始学习数据和标记学习数据时,将所述原始学习数据和所述标记学习数据输入到数据嵌入网络中,使所述数据嵌入网络合成所述原始学习数据和所述标记学习数据,从而生成已标记学习数据;(ii)将所述已标记学习数据输入到具有学习参数的学习网络中,使所述学习网络用所述学习参数将网络运算应用于所述已标记学习数据,从而生成与所述已标记学习数据相对应的第1特征信息,并将所述原始学习数据输入到所述学习网络中,使所述学习网络用所述学习参数将网络运算应用于所述原始学习数据,从而输出与所述原始学习数据相对应的第2特征信息;(iii)学习所述数据嵌入网络,以使通过参考(iii-1)将所述第1特征信息和所述第2特征信息作为参考而获得的至少一个第1错误与(iii-2)将使用所述第1特征信息生成的至少一个任务特定输出和与所述任务特定输出对应的至少一个真实数据作为参考而获得的至少一个第2错误中的至少一部分来计算出的至少一个数据错误最小化且使与输入到鉴别器的所述已标记学习数据相对应的至少一个已标记数据分数最大化,其中所述鉴别器鉴别所输入数据的真实性;以及(iv)学习所述鉴别器,以使分别与输入到所述鉴别器中的修改学习数据或修改已标记学习数据相对应的至少一个修改数据分数或至少一个修改已标记数据分数最大化且使所述已标记数据分数最小化,其中所述修改学习数据或所述修改已标记学习数据分别通过修改所述原始学习数据或所述已标记学习数据来生成;以及(II)将所述原始测试数据和所述标记测试数据输入到所述数据嵌入网络,使所述数据嵌入网络用所述数据嵌入网络的至少一个学习参数合成所述原始测试数据和所述标记测试数据,从而生成已标记测试数据。
根据本发明一实施例,在所述处理(I)中,所述学习网络包括分别具有至少一个第1学习参数至至少一个第n学习参数的第1学习网络至第n学习网络,其中,所述n为1或更大的整数,所述学习装置已经执行如下处理:(i)将所述已标记学习数据分别输入到所述第1学习网络至所述第n学习网络中,使每个所述第1学习网络至所述第n学习网络(i-1)用每个所述第1学习网络至所述第n学习网络的至少一个所述第1学习参数至至少一个所述第n学习参数将与每个学习网络相对应的网络运算应用于所述已标记学习数据,(i-2)从而输出与所述已标记学习数据相对应的每个第1_1特征信息至第1_n特征信息;(ii)将所述原始学习数据分别输入到所述第1学习网络至所述第n学习网络中,使每个所述第1学习网络至所述第n学习网络(ii-1)用每个所述第1学习网络至所述第n学习网络的所述第1学习参数至所述第n学习参数将与每个学习网络相对应的网络运算应用于所述原始学习数据,(ii-2)从而输出关于所述原始学习数据的每个第2_1特征信息至第2_n特征信息;(iii)学习所述数据嵌入网络,(iii-1)以使通过参考(iii-1a)作为将所述第1_1特征信息和所述第2_1特征信息作为参考而获得的至少一个第1_1错误至将所述第1_n特征信息和所述第2_n特征信息作为参考而获得的至少一个第1_n错误的平均值的所述第1错误与(iii-1b)作为将用所述第1_1特征信息生成的至少一个第1任务特定输出和与所述第1任务特定输出对应的至少一个第1真实数据作为参考而获得的第2_1错误至将用所述第1_n特征信息生成的至少一个第n任务特定输出和与所述第n任务特定输出对应的至少一个第n真实数据作为参考而获得的第2_n错误的平均值的所述第2错误中的至少一部分来计算出的所述数据错误最小化,(iii-2)且使与输入到所述鉴别器的所述已标记学习数据相对应的所述已标记数据分数最大化;以及(iv)学习所述鉴别器,以使分别与输入到所述鉴别器的所述修改学习数据或所述修改已标记学习数据相对应的所述修改数据分数或所述修改已标记数据分数最大化且使所述已标记数据分数最小化。
根据本发明一实施例,在所述处理(I)中,所述学习网络包括分别具有至少一个第1学习参数至至少一个第n学习参数的第1学习网络至第n学习网络,其中,所述n为1或更大的整数,所述学习装置已经执行如下处理:(i)将所述原始学习数据和所述标记学习数据输入到所述数据嵌入网络中,使所述数据嵌入网络合成所述原始学习数据和所述标记学习数据,从而生成第1已标记学习数据;(ii)将所述第1已标记学习数据输入到所述第1学习网络中,使所述第1学习网络用所述第1学习网络的所述第1学习参数将网络运算应用于所述第1已标记学习数据,从而输出与所述第1已标记学习数据相对应的第1_1特征信息,并将所述原始学习数据输入到所述第1学习网络中,使所述第1学习网络用所述第1学习网络的所述第1学习参数将网络运算应用于所述原始学习数据,从而输出与所述原始学习数据相对应的第2_1特征信息;(iii)学习所述数据嵌入网络,以使通过参考(iii-1)将所述第1_1特征信息和所述第2_1特征信息作为参考而获得的所述第1_1错误与(iii-2)将用所述第1_1特征信息生成的第1任务特定输出和与所述第1任务特定输出对应的第1真实数据作为参考而获得的所述第2_1错误中的至少一部分来计算出的第1数据错误最小化且使与输入到所述鉴别器的所述第1已标记学习数据相对应的所述第1已标记数据分数最大化,从而使所述数据嵌入网络成为第1学习的数据嵌入网络;(iv)学习所述鉴别器,以使分别与输入到所述鉴别器的所述修改学习数据或所述修改已标记学习数据相对应的至少一个第1修改数据分数或第1修改已标记数据分数最大化且使所述第1已标记数据分数最小化,从而使所述鉴别器成为第1学习的鉴别器;以及(v)在将整数k从2增加到n的同时,(v-1)将所述原始学习数据和所述标记学习数据输入到第k_1学习的数据嵌入网络中,使所述第k_1学习的数据嵌入网络合成所述原始学习数据和所述标记学习数据,从而生成第k已标记学习数据,(v-2)将所述第k已标记学习数据输入到第k学习网络中,使所述第k学习网络用所述第k学习网络中的至少一个第k学习参数将网络运算应用于所述第k已标记学习数据,从而输出与所述第k已标记学习数据相对应的第1_k特征信息,将所述原始学习数据输入到所述第k学习网络中,使所述第k学习网络用所述第k学习参数将网络运算应用于所述原始学习数据,从而输出与所述原始学习数据相对应的第2_k特征信息,(v-3)学习所述第k_1学习的数据嵌入网络,以使通过参考(v-3-1)将所述第1_k特征信息和所述第2_k特征信息作为参考而获得的至少一个第1_k数据错误与(v-3-2)将用所述第1_k特征信息生成的至少一个第k任务特定输出和与所述第k任务特定输出对应的至少一个第k真实数据作为参考而获得的至少一个第2-k错误中的至少一部分来计算出的至少一个第k数据错误最小化且使与输入到所述第k_1学习的鉴别器中的所述第k已标记学习数据相对应的至少一个第k已标记数据分数最大化,从而使所述第k_1学习的数据嵌入网络成为第k学习的数据嵌入网络,(v-4)学习所述第k_1学习的鉴别器,以使分别与输入到所述第k_1学习的鉴别器的所述修改学习数据或所述修改已标记学习数据相对应的至少一个第k修改数据分数或至少一个第k修改已标记数据分数最大化且使所述第k已标记数据分数最小化,从而使所述k_1学习的鉴别器成为第k学习的鉴别器。
根据本发明一实施例,分别与输入到所述鉴别器的所述修改学习数据或所述修改已标记学习数据相对应的所述修改数据分数或所述修改已标记数据分数的最大值为1,作为鉴别所述修改学习数据或所述修改已标记学习数据为真的值,并与输入到所述鉴别器的所述已标记学习数据相对应的所述已标记数据分数的最小值为0,作为鉴别所述已标记学习数据为假的值。
根据本发明一实施例,所述学习装置参考所述第1特征信息和所述第2特征信息之间的差来获得所述第1错误,并参考使用所述任务特定输出和所述真实数据生成的至少一个损失来获得所述第2错误。
根据本发明一实施例,所述学习装置参考所述第1特征信息和所述第2特征信息之间的范数(Norm)或余弦相似度(Cosine Similarity)来获得所述第1错误。
根据本发明一实施例,所述学习装置学习所述数据嵌入网络,以进一步参考所述原始学习数据和所述已标记学习数据之间的相似度来以使所述相似度最小化。
除此之外,本发明还提供一种计算机可读记录介质,其用于记录执行本发明的方法的计算机程序。
有益效果
本发明具有可以通过处理数据(例如,数字水印处理)来容易地识别数据来源的效果。
另外,本发明具有另一效果,即,可以获得通过将机器学习运算应用于通过将标记数据输入到原始数据而获得的经处理的数据而生成的第1结果,所述第1结果与通过将机器学习运算应用于原始数据而生成的第2结果相同或相似。
另外,本发明具有另一效果,即,原始数据与经识别处理的数据被人识别为彼此不同,但原始数据与经识别处理的数据被计算机识别为彼此相同或相似。
此外,本发明具有另一效果,即,可以支持数据提供者能够在大数据交易市场安心地交易或共享数据。
附图说明
用于描述本发明实施例的以下附图仅为本发明实施例的一部分,并且本发明所属领域的普通技术人员(以下称为“普通技术人员”)可以基于这些附图获得其他附图,而无需进行任何创造性工作。
图1示出了根据本发明一实施例的一种通过合成原始数据和标记数据来生成已标记数据的数据嵌入网络的学习装置。
图2示出了根据本发明一实施例的一种通过合成原始数据和标记数据来生成已标记数据的数据嵌入网络的学习方法。
图3示出了根据本发明一实施例的另一种通过合成原始数据和标记数据来生成已标记数据的数据嵌入网络的学习方法。
图4示出了根据本发明一实施例的一种用于测试已学习的数据嵌入网络的测试装置。
图5示出了根据本发明一实施例的一种已学习的数据嵌入网络的测试方法。
具体实施方案
下面将参考附图描述本发明的详细内容,该附图示例性地示出可以实施本发明的特定实施例。足够详细地描述这些实施例,以使本领域技术人员可以实施本发明。应当理解,本发明的各种实施例尽管不同,但不一定互斥。例如,在不脱离本发明的精神和范围的情况下,本文中描述的特定特征、结构或特性可以通过从一实施例改变为另一实施例来实现。另外,应当理解,在不脱离本发明的精神和范围的情况下,可以改变每个实施例中的各个元件的位置或布置。因此,以下详细描述不应被理解为限制性的,并且本发明的范围应被认为包括所附的权利要求以及这些权利要求所享有的等同物的所有范围。附图中的相似附图标记贯穿多个方面表示相同或相似的元件。
下面,在本发明的详细描述和权利要求中,术语“包括”及其各种表达方式并不意味着排除其他技术特征、添加、元件或步骤。部分地从说明书中或部分地从本发明的实施中,本发明的其他目的、益处和特征对于本领域技术人员而言将是显而易见的。以下实施例和附图作为示例提供,但本发明不限于此。
为了使本领域普通技术人员能够容易地实施本发明,将参考附图详细描述本发明的各种优选实施例。
图1示出了根据本发明一实施例的一种通过合成原始数据和标记数据来生成标记数据的数据嵌入网络的学习装置。
参见图1,根据本发明一实施例的学习装置(100)可以包括:存储有指令的存储器110,其中,所述指令用于学习用原始学习数据和标记学习数据生成已标记学习数据的数据嵌入网络,使学习网络通过输入已标记学习数据来计算出与用原始学习数据计算出的结果相同或相似的结果;以及处理器120,其根据存储于存储器110的指令执行学习数据嵌入网络的处理。此时,已标记数据、已标记数据学习数据、已标记测试数据等可以表示使用标记数据作为水印(Watermark)来以数字方式进行水印处理的数据。
具体而言,学习装置100通常可以使用至少一个计算装置(例如,计算机处理器、内存、存储器、输入设备、输出设备或其他现有计算装置的组件;诸如路由器或交换机等的电子通信设备;诸如网络附加存储(NAS)和存储区域网络(SAN)等的电子信息存储系统)和至少一个计算机装置(即,指示计算装置以特定方式运行的指令)的组合来实现期望的系统性能。
另外,这些装置的处理器可以包括诸如微处理单元(MPU,Micro ProcessingUnit)、中央处理单元(CPU,Central Processing Unit)、高速缓存(Cache Memory)和数据总线(Data Bus)等的硬件配置。此外,计算装置还可以包括执行特定目的的操作系统和应用程序的软件配置。
计算装置不排除包括用于实施本发明的处理器、存储器、介质或其他计算元件的任何组合的集成装置。
另一方面,当学习装置100获得原始学习数据和标记学习数据时,学习装置100的处理器120根据存储于存储器110的指令将原始学习数据和标记学习数据输入到数据嵌入网络中,使数据嵌入网络合成原始学习数据和标记学习数据,从而生成已标记学习数据。并且,学习装置100可以执行或支持其他装置执行如下处理:(i)将已标记学习数据输入到具有至少一个学习参数的学习网络中,使学习网络(i-1)用学习参数将网络运算应用于已标记学习数据,(i-2)从而生成与已标记学习数据相对应的第1特征信息(CharacteristicInformation),(ii)并将原始学习数据输入到学习网络中,使学习网络(ii-1)用学习参数将网络运算应用于原始学习数据,(ii-2)从而生成与原始学习数据相对应的第2特征信息。然后,学习装置100(I)可以学习数据嵌入网络,(i)以使通过参考(i-1)将第1特征信息和第2特征信息作为参考而获得的至少一个第1错误与(i-2)将用第1特征信息生成的至少一个任务特定输出(Task Specific Output)和与所述任务特定输出对应的至少一个真实数据(Ground Truth)作为参考而获得的至少一个第2错误中的至少一部分来计算出的至少一个数据错误最小化,(ii)且使输入到鉴别器(Discriminator)中的与已标记学习数据相对应的至少一个已标记数据分数最大化,其中所述鉴别器鉴别所输入数据的真实性,(II)可以学习鉴别器,以使分别与输入到鉴别器中的修改学习数据或修改已标记学习数据相对应的至少一个修改数据分数或至少一个修改已标记数据分数最大化且使已标记数据分数最小化。
下面将参考图2和图3描述数据嵌入网络的学习方法,所述方法通过用如上所述配置的本发明一实施例的学习装置100合成原始学习数据和标记学习数据来生成已标记学习数据。
图2示出了根据本发明一实施例的一种通过合成原始学习数据和标记学习数据来生成已标记学习数据的数据嵌入网络的学习方法。根据本发明,水印(即,标记学习数据w)仅在已标记学习数据x'内的背景中示出,但本发明的范围不限于此,水印可以在前景或已标记学习数据x'内的任何位置。
首先,当获得原始学习数据x和标记学习数据w时,学习装置100将原始学习数据x和标记学习数据w输入到数据嵌入网络G中,使数据嵌入网络G合成原始学习数据x和标记学习数据w,从而生成已标记学习数据x'(即,G(x,w))。
此时,原始学习数据x可以包括各种类型的数据,例如文本、图像、视频和声音等。
另外,标记学习数据w可以包括可以被人的视觉、听觉和触觉中的至少一种感觉识别的数字水印,例如水印和法医水印(Forensic Watermark)。另外,数字水印可以包括:鲁棒水印(Robust Watermark),其用于证明和保护原始数据的版权;易碎水印(FragileWatermark),其用于保护和证明原始数据;指纹图(Fingerprint),其包括诸如指纹之类的唯一信息;和隐写术(Steganography),其用于隐藏信息或以其他形式伪装信息,但不限于此,其可以包括可与诸如音频水印之类的原始数据结合的所有类型的水印。
此外,标记数据w可以包括有关与原始数据相关的权利持有人的信息,作为一示例,可以包括原始数据的创建者、发行者或接收者的信息、创建日期、发行日期或接收日期的信息、有关赋予原始数据的权利的信息等。
另一方面,为了防止通过从已标记学习数据x'分离出标记学习数据w来提取原始学习数据,当合成原始学习数据x和标记学习数据w时,数据嵌入网络G可以使用嵌入函数G(x,w)来添加预定的扰动(Perturbation)。
即,数据嵌入网络G可以通过参考诸如图像和声音之类的原始学习数据的类型,或诸如像素和频率之类的原始数据的特性来确定合成时待进行的扰动的类型或其扰动的程度。
例如,当原始学习数据x为图像数据时,数据嵌入网络G可以确定待进行扰动的基于像素的混合因子(Blending Factor)以及子像素级别的空间失真(Spatial Distortion)程度,并根据所确定的空间失真程度,可以扰动标记学习数据w以使其与原始学习数据x合成。
另外,数据嵌入网络G基于从原始学习数据x提取的预定密码哈希值(Cryptography Hash Value)确定要添加于标记学习数据w的随机扰动,并根据所确定的随机扰动,可以扰动标记学习数据(w)以使其与原始学习数据x合成。
另外,已标记学习数据x'可以被人识别为与原始学习数据x不同的数据,但可以被学习网络识别为与原始学习数据x相同或相似的数据。
接下来,学习装置100可以执行或支持其他装置执行如下处理:(i)将已标记学习数据x'输入到具有至少一个学习参数的学习网络F中,使学习网络F(i-1)用学习参数将网络运算应用于已标记学习数据x',(i-2)从而生成与已标记学习数据x'相对应的第1特征信息F(x');以及(ii)并将原始学习数据x输入到学习网络F中,使学习网络F(ii-1)用学习参数将网络运算应用于原始学习数据x,(ii-2)从而生成与原始学习数据x相对应的第2特征信息F(x)。
此时,学习网络F可以包括机器学习网络,但不限于此,并且可以包括通过将网络运算应用于根据学习参数输入的已标记学习数据x'来输出第1特征信息F(x')且通过将网络运算应用于原始学习数据x来输出第2特征信息F(x)的所有学习网络。另外,机器学习网络可以包括k个最近邻居(k-Nearest Neighbors)、线性回归(Linear Regression)、逻辑回归(Logistic Regression)、支持向量机(SVM,Support Vector Machine)、决策树(Decision Tree)和随机森林(Random Forest)、神经网络(Neural Network)、聚类(Clustering)、可视化(Visualization)和降维(Dimensionality Reduction)、关联规则学习(Association Rule Learning)、深度信念网络(Deep Belief Network)、强化学习(Reinforcement Learning)和深度学习算法(Deep Learning Algorithm)中的至少一种,但机器学习网络不限于此,而可以包括各种学习算法。
另外,第1特征信息F(x′)和第2特征信息F(x)可以分别为与已标记学习数据x′和原始学习数据x相对应的特征(Feature)或Logit。此外,第1特征信息F(x')和第2特征信息F(x)可以分别为与已标记学习数据x'和原始学习数据x中的预定特征相关的特征值,或者可以为包括与预定特征相关的向量(Vector)、矩阵(Matrix)和坐标(Coordinate)中的至少一个有关的值的Logit。例如,当学习数据x为面部图像数据时,上述结果可以为用于面部识别的类别、面部特征,例如笑脸表情、面部界标点(Landmark Point,例如眼睛的两个端点)的坐标。
接下来,学习装置100(I)学习数据嵌入网络,(i)以使通过参考(i-1)将第1特征信息F(x')和第2特征信息F(x)作为参考而获得的至少一个第1错误与(i-2)将用第1特征信息F(x')生成的至少一个任务特定输出(Task Specific Output)和与所述任务特定输出对应的至少一个真实数据(Ground Truth)作为参考而获得的至少一个第2错误中的至少一部分来计算出的至少一个数据错误最小化,(ii)并使输入到鉴别器D中的与已标记学习数据x'相对应的至少一个已标记数据分数最大化,其中所述鉴别器鉴别所输入数据的真实性,(II)学习鉴别器D,以使分别与输入到鉴别器中的修改学习数据或修改已标记学习数据相对应的至少一个修改数据分数或至少一个修改已标记数据分数最大化并使已标记数据分数最小化。此时,修改学习数据或修改已标记学习数据可以通过分别将通过随机干扰产生网络(未示出)生成的至少一个随机干扰添加到原始学习数据x或已标记学习数据x'来生成。作为一示例,可以指示随机干扰产生网络产生根据正态分布N(0,σ)的随机干扰,并且可以将所产生的干扰添加到原始学习数据x或已标记学习数据x'以生成修改学习数据或修改已标记学习数据。并且除了随机干扰以外,修改学习数据或修改已标记学习数据还可以通过模糊(Blur)原始学习数据x或已标记学习数据x',或改变原始学习数据x或已标记学习数据x'的分辨率来生成,但不限于此,其可以应用修改原始学习数据x或已标记学习数据x'的各种方法。
即,在学习装置100学习数据嵌入网络G时,可以被学习为通过用第1错误合成原始学习数据x和标记学习数据w来输出已标记学习数据x',使学习网络F将其识别为与原始学习数据x相同或相似,并可以被学习为使用已标记数据分数输出与原始学习数据x不同但难以与原始学习数据x区分的已标记学习数据x'。
此时,学习装置100可以使用第1特征信息F(x')和第2特征信息F(x)之间的差来获得第1错误,并可以通过使用任务特定输出和与其对应的真实数据计算出的至少一个损失来获得第2错误。
作为一示例,学习装置100可以通过参考第1特征信息F(x')和第2特征信息F(x)的范数(Norm)或余弦相似度(Cosine Similarity)来获得第1错误,但不限于此,而可以应用能够计算出第1特征信息F(x')和第2特征信息F(x)之间的差异的各种算法。
另外,任务特定输出可以为学习网络F要执行的任务的输出,并可以具有根据学习网络F所学习的任务的各种结果,例如用于类别分类的类别的概率、从用于检测位置的回归中获得的坐标结果等,并且可以将激活单元(Activation Unit)的激励函数(ActivationFunction)应用于从学习网络F输出的特征信息,从而根据要由学习网络F执行的任务来生成任务特定输出。此时,激励函数可以包括但不限于S型(Sigmoid)函数、线性(Linear)函数、Softmax函数、ReLU(Rlinear)函数、平方(Square)函数、SQRT函数、Srlinear函数、ABS函数、TANH函数、Brlinear函数等。
作为一示例,当学习网络F执行用于类别分类的任务时,学习装置100可以将从学习网络F输出的第1特征信息映射到每个类别上,从而针对每个类别生成有关已标记学习数据的概率。
此时,每个类别的概率可以表示由学习网络F输出的每个设定类别的第1特征信息F(x')为正确的概率。例如,当学习数据为面部图像数据时,可以将面部处于微笑状态的概率输出为0.75,而将面部处于不微笑状态的概率输出为0.25。此时,可以使用softmax算法将从学习网络F输出的第1特征信息F(x')映射到每个类别上,但不限于此,而各种算法可以用于将第1特征信息F(x')映射到每个类上。
另外,分别与输入到鉴别器D的修改学习数据或修改已标记学习数据相对应的修改数据分数或修改已标记数据分数的最大值为1,作为鉴别修改学习数据或修改已标记学习数据为真的值,并与输入到鉴别器D的已标记学习数据相对应的已标记数据分数的最小值为0,作为鉴别已标记学习数据x'为假的值。即,鉴别器D可以学习为将已标记学习数据x'识别为修改学习数据或修改已标记学习数据。
另外,当学习装置100学习数据嵌入网络G以使第1错误最小化且以使第2错误最大化时,学习装置100固定而不更新学习网络F的学习参数,并可以仅学习数据嵌入网络G。
另外,学习装置100可以通过进一步参考原始学习数据x和已标记学习数据x'之间的相似度来学习数据嵌入网络G以最小化相似度。即,参考原始学习数据x和已标记学习数据x'之间的差来计算出相似度,并学习数据嵌入网络G以最小化相似度,从而数据嵌入网络G可以输出与原始学习数据相差很大的已标记学习数据。
根据所述学习方法,数据嵌入网络G被学习为使参考学习网络F的输出而获得的数据错误最小化且使鉴别器D的已标记数据分数最大化或/和使原始学习数据x与已标记学习数据x'的相似性最小化,从而在用原始学习数据x和标记学习数据w生成已标记学习数据时,已标记学习数据x'与原始学习数据x有很大不同,但在学习网络F中,可以输出用已标记学习数据x'计算出的结果,以使产生与用原始学习数据x计算出的结果相同或相似的结果。即,对人或其他计算机装置而言,将标记学习数据w与已标记学习数据x'区分开来识别,但在学习网络F中,可以不受标记学习数据w的任何影响而识别原始学习数据x。
图3示意性地示出了根据本发明一实施例的另一种使用原始学习数据和标记学习数据来生成已标记学习数据的数据嵌入网络的学习方法,即,学习网络F由具有学习参数的多个学习网络F1、F2、…、Fn组成。此时,多个学习网络F1、F2、...、Fn中的每一个可以处于学习为执行彼此不同任务的状态。在下面的描述中,将省略从所述图2的描述中容易理解的部分。
首先,当获得原始学习数据x和标记学习数据w时,学习装置100将原始学习数据x和标记学习数据w输入到数据嵌入网络G中,使数据嵌入网络G合成原始学习数据x和标记学习数据w,从而生成已标记学习数据x'(即,G(x,w))。
接下来,学习装置100将已标记学习数据x'分别输入到第1学习网络F1至第n学习网络Fn中,使每个第1学习网络F1至第n学习网络Fn(i)用每个第1学习网络F1至第n学习网络Fn的第1学习参数至第n学习参数将与每个学习网络相对应的网络运算应用于已标记学习数据x',(ii)从而生成与已标记学习数据x'相对应的第1_1特征信息F1(x′)至第1_n特征信息Fn(x′)。另外,学习装置100可以将原始学习数据x分别输入到第1学习网络F1至第n学习网络Fn中,使每个第1学习网络F1至第n学习网络Fn(i)用每个第1学习网络F1至第n学习网络Fn的第1学习参数至第n学习参数将与每个学习网络相对应的网络运算应用于原始学习数据x,(ii)从而分别生成与原始学习数据x相对应的第2_1特征信息F1(x)至第2_n特征信息Fn(x)。
然后,学习装置100(i)可以学习数据嵌入网络G,以使通过参考(i-1)作为将第1_1特征信息F1(x')和第2_1特征信息F1(x)作为参考而获得的第1_1错误至将第1_n特征信息Fn(x')和第2_n特征信息Fn(x)作为参考而获得的第1_n错误的平均值的第1错误与(i-2)作为将用第1_1特征信息F1(x')生成的至少一个第1任务特定输出和与所述第1任务特定输出对应的至少一个第1真实数据作为参考而获得的第2_1错误至将用第1_n特征信息生成的至少一个第n任务特定输出和与所述第n任务特定输出对应的至少一个第n真实数据作为参考而获得的第2_n错误的平均值的第2错误中的至少一部分来计算出的数据错误最小化,(ii)且使与输入到鉴别器D的已标记学习数据x'相对应的已标记数据分数最大化,其中所述鉴别器鉴别所输入数据的真实性。并且,学习装置100可以学习鉴别器D,以使与输入到鉴别器D的修改学习数据或修改已标记学习数据相对应的修改数据分数或修改已标记数据分数最大化且使已标记数据分数最小化。
即,学习装置100获得参考第1_1特征信息F1(x')和第2_1特征信息F1(x)来计算出的第1_1错误,并获得参考第1_2特征信息F2(x')和第2_2特征信息F2(x)来计算出的第1_2错误,与此类似地,获得参考第1_n特征信息Fn(x')和第2_n特征信息Fn(x)来计算出的第1_n错误,从而获得作为所述第1_1错误至所述第1_n错误的平均值的第1错误。另外,学习装置100获得将用第1_1特征信息F1(x')生成的第1任务特定输出和与所述第1任务特定输出对应的第1真实数据作为参考而计算出的第2_1错误,获得将用第1_2特征信息F2(x')生成的至少一个第2任务特定输出和与其对应的至少一个第2真实数据作为参考而计算出的第2_2错误,与此类似地,获得将用第1_n特征信息Fn(x')生成的至少一个第n任务特定输出和与所述第n任务特定输出对应的至少一个第n真实数据作为参考而计算出的第2_n错误,从而获得所获得的第2_1错误至所获得的第2_n错误的平均值,即第2错误。此外,学习装置100(I)可以学习数据嵌入网络G,以使参考第1错误和第2错误中的至少一部分来计算出的至少一个数据错误最小化且使输入到鉴别器D中的与已标记学习数据x'相对应的至少一个已标记数据分数最大化,(II)可以学习鉴别器D,以使与输入到鉴别器中的修改学习数据或修改已标记学习数据相对应的至少一个修改数据分数或至少一个修改已标记数据分数最大化且使已标记数据分数最小化。
此时,数据错误可以为第1错误、第2错误,以及第1错误和第2错误之和中的任何一个,但本发明不限于此。
另一方面,在上文中,可以学习数据嵌入网络G,(i)以使通过参考(i-1)作为将第1_1特征信息F1(x')和第2_1特征信息F1(x)作为参考而获得的第1_1错误至将第1_n特征信息Fn(x')和第2_n特征信息Fn(x)作为参考而获得的第1_n错误的平均值的第1错误与(i-2)作为将用第1_1特征信息F1(x')生成的第1任务特定输出和与所述第1任务特定输出对应的第1真实数据作为参考而获得的第2_1错误至将用第1_n特征信息生成的第n任务特定输出和与其对应的第n真实数据作为参考而获得的第2_n错误的平均值的第2错误中的至少一部分来计算出的数据错误最小化,(ii)且使与输入到鉴别器的已标记学习数据x'相对应的已标记数据分数最大化。然而作为另一示例,可以依次学习数据嵌入网络G,以使参考第1_1错误和第2_1错误中的至少一部分而计算出的至少一个第1数据错误至参考第1_n错误和第2_n错误的至少一部分而计算出的至少一个第n数据错误最小化。
即,学习装置100将原始学习数据x和标记学习数据w输入到数据嵌入网络G,并使数据嵌入网络G合成原始学习数据x和标记学习数据w以生成第1已标记学习数据x1'。另外,学习装置100(i)将第k已标记学习数据x1'输入到第1学习网络F1中,使第1学习网络F1用第1学习网络F1的第1学习参数将网络运算应用于第1已标记学习数据x1',从而输出与第1已标记学习数据x1'相对应的第1_1特征信息F1(x1'),(ii)将原始学习数据x输入到第1学习网络F1中,使第1学习网络F1用第1学习参数将网络运算应用于原始学习数据x,从而输出与原始学习数据x相对应的第2_1特征信息F1(x)。然后,学习装置100学习数据嵌入网络G,(i)以使通过参考(i-1)将第1_1特征信息F1(x1')和第2_1特征信息F1(x)作为参考而获得的第1_1错误与(i-2)将用1_1特征信息F1(x')生成的第1任务特定输出和与所述第1任务特定输出对应的第1真实数据作为参考而获得的第2_1错误中的至少一部分来计算出的第1数据错误最小化,(ii)并使与输入到鉴别器D的第1已标记学习数据x1'相对应的第1已标记数据分数最大化,从而可以使数据嵌入网络G成为第1学习的数据嵌入网络G1。并且,学习装置100学习鉴别器D,以使与输入到鉴别器D的修改学习数据或修改已标记学习数据相对应的至少一个第1修改数据分数或至少一个第1修改已标记数据分数最大化并使第1已标记数据分数最小化,从而可以使鉴别器D成为第1学习的鉴别器D1。
另外,学习装置100在将整数k从2增加到n的同时,可以重复所述处理直到第n学习网络Fn,从而获得第n学习的数据嵌入网络Gn。
即,学习装置100将原始学习数据x和标记学习数据w输入到第k_1学习的数据嵌入网络G(k_1),并使第k_1学习的数据嵌入网络G(k_1)合成原始学习数据x和标记学习数据w以生成第k已标记学习数据xk'。另外,学习装置100(i)将第k已标记学习数据xk'输入到第k学习网络Fk中,使第k学习网络Fk用第k学习网络Fk中至少一个第k学习参数将网络运算应用于第k已标记学习数据xk',从而输出与第k已标记学习数据xk'相对应的第1_k特征信息Fk(xk'),(ii)将原始学习数据x输入到第k学习网络Fk中,使第k学习网络Fk用第k学习参数将网络运算应用于原始学习数据x,从而输出与原始学习数据x相对应的第2_k特征信息Fk(xk)。然后,学习装置100可以学习第k_1学习的数据嵌入网络G(k_1),(i)以使通过参考(i-1)将第1_k特征信息Fk(xk')和第2_k特征信息Fk(x)作为参考而获得的至少一个第1_k错误与(i-2)将用第1_k特征信息Fk(x')生成的至少一个第k任务特定输出和其对应的至少一个第k真实数据作为参考而获得的至少一个第2-k错误中的至少一部分来计算出的至少一个第k错误最小化,(ii)并使与输入到第k_1学习的鉴别器D(k_1)的至少一个第k已标记学习数据xk'相对应的至少一个第k已标记数据分数最大化,从而使第k_1学习的数据嵌入网络G(k_1)成为第k学习的数据嵌入网络Gk。并且可以学习第k_1学习的鉴别器D(k_1),以使与输入到第k_1学习的鉴别器D(k_1)的修改学习数据或修改已标记学习数据相对应的至少一个第k修改数据分数或至少一个第k修改已标记数据分数最大化并使至少一个第k已标记数据分数最小化,从而使第k_1学习的鉴别器D(k_1)成为第k学习的鉴别器Dk。
图4示出了根据本发明一实施例的一种学习为通过合成原始数据和标记数据来生成标记数据的数据嵌入网络G的测试装置。
参见图4,根据本发明一实施例的测试装置200可以包括:存储有指令的存储器210,其中,所述指令用于测试用原始数据和标记数据生成已标记数据的学习的数据嵌入网络,使学习网络用已标记数据输出与用原始数据计算出的结果相同或相似的结果;以及处理器220,其根据存储于存储器210的指令执行学习的数据嵌入网络的测试操作。
具体而言,测试装置200通常可以使用至少一个计算装置(例如,计算机处理器、内存、存储器、输入设备、输出设备或其他现有计算装置的组件;诸如路由器或交换机等的电子通信设备;诸如网络附加存储(NAS)和存储区域网络(SAN)等的电子信息存储系统)和至少一个计算机软件(即,指示计算装置以特定方式运行的指令)的组合来实现期望的系统性能。
另外,这些装置的处理器可以包括诸如微处理单元(MPU,Micro ProcessingUnit)、中央处理单元(CPU,Central Processing Unit)、高速缓存(Cache Memory)和数据总线(Data Bus)等的硬件配置。此外,计算装置还可以包括执行特定目的的操作系统和应用程序的软件配置。
然而,计算装置不排除包括用于实施本发明的处理器、存储器、介质或其他计算元件的任何组合的集成装置。
另一方面,当通过所述图2和图3中描述的方法合成数据嵌入网络时,作为一示例,在学习装置已经执行如下处理的条件下:(i)当获得原始学习数据和标记学习数据时,将原始学习数据和标记学习数据输入到数据嵌入网络中,使数据嵌入网络合成原始学习数据和标记学习数据,从而生成已标记学习数据;(ii)(ii-1)将已标记学习数据输入到具有学习参数的学习网络中,使学习网络用学习参数将网络运算应用于已标记学习数据,从而生成与已标记学习数据相对应的第1特征信息,(ii-2)将原始学习数据输入到学习网络中,使学习网络用学习参数将网络运算应用于原始学习数据,从而生成与原始学习数据相对应的第2特征信息;(iii)学习数据嵌入网络,以使通过参考(iii-1)将第1特征信息和第2特征信息作为参考而获得的第1错误与(iii-2)将用第1特征信息生成的任务特定输出和与所述任务特定输出对应的真实数据作为参考而获得的第2错误中的至少一部分来生成的数据错误最小化且使与输入到鉴别器的已标记学习数据相对应的已标记数据分数最大化,其中所述鉴别器鉴别所输入数据的真实性;以及(iv)学习鉴别器,以使与输入到鉴别器中的修改学习数据或修改已标记学习数据相对应的修改数据分数或修改已标记数据分数最大化并使已标记数据分数最小化,测试装置200获得要合成的原始测试数据和标记测试数据,并且将原始测试数据和标记测试数据输入到数据嵌入网络,使数据嵌入网络用数据嵌入网络的学习参数合成原始测试数据和标记测试数据,从而可以已标记测试数据。
图5示出了根据本发明一实施例的一种已学习的数据嵌入网络的测试方法。
参见图5,在根据图2和图3中描述的学习方法学习数据嵌入网络的状态下,当获得要合成的原始测试数据和标记测试数据时,测试装置200将原始测试数据和标记测试数据输入到数据嵌入网络,使数据嵌入网络用数据嵌入网络的学习参数合成原始测试数据和标记测试数据,从而可以生成已标记测试数据。
此时,原始测试数据和已标记测试数据可以被人或计算机装置识别为彼此不同的数据,但原始测试数据和已标记测试数据被学习网络识别为彼此相同或相似的结果。
另一方面,数据嵌入网络可以通过图2至图5的描述中的学习方法来学习。
作为一示例,学习装置可以处于如下状态:(i)当获得原始学习数据和标记学习数据时,将原始学习数据和标记学习数据输入到数据嵌入网络中,使数据嵌入网络合成原始学习数据和标记学习数据,从而生成已标记学习数据,(ii)将已标记学习数据输入到具有学习参数的学习网络中,使学习网络用学习参数将网络运算应用于已标记学习数据,从而生成与已标记学习数据相对应的第1特征信息,将原始学习数据输入到学习网络中,使学习网络用学习参数将网络运算应用于原始学习数据,从而生成与原始学习数据相对应的第2特征信息,(iii)学习数据嵌入网络,以使通过参考(iii-1)将第1特征信息和第2特征信息作为参考而获得的第1错误与(iii-2)将用第1特征信息生成的任务特定输出和与所述任务特定输出对应的真实数据作为参考而获得的第2错误中的至少一部分来计算出的数据错误最小化且使与输入到鉴别器的已标记学习数据相对应的已标记数据分数最大化,其中所述鉴别器鉴别所输入数据的真实性,(iv)学习鉴别器,以使与输入到鉴别器的修改学习数据或修改已标记学习数据相对应的修改数据分数或修改已标记数据分数最大化并使已标记数据分数最小化。
另外,在上文中,学习网络包括分别具有第1学习参数至第n学习参数的第1学习网络至第n学习网络,学习装置可以处于如下状态:(i)将已标记学习数据分别输入到第1学习网络至第n学习网络中,使每个第1学习网络至第n学习网络(i-1)用每个第1学习网络至第n学习网络的第1学习参数至第n学习参数将与每个学习网络相对应的网络运算应用于已标记学习数据,(i-2)从而输出关于已标记学习数据的每个第1_1特征信息至第1_n特征信息,(ii)将原始学习数据分别输入到第1学习网络至第n学习网络中,使每个第1学习网络至第n学习网络(ii-1)用每个第1学习网络至第n学习网络的第1学习参数至第n学习参数将网络运算应用于原始学习数据,(ii-2)从而输出与原始学习数据对应的每个第2_1特征信息至第2_n特征信息,(iii)学习数据嵌入网络,(iii-1)以使通过参考(iii-1a)作为将第1_1特征信息和第2_1特征信息作为参考而获得的第1_1错误至将第1_n特征信息和第2_n特征信息作为参考而获得的第1_n错误的平均值的第1错误与(iii-1b)作为将用第1_1特征信息生成的至少一个第1任务特定输出和与所述第1任务特定输出对应的至少一个第1真实数据作为参考而获得的第2_1错误至将用第1_n特征信息生成的至少一个第n任务特定输出和与所述第n任务特定输出对应的至少一个第n真实数据作为参考而获得的第2_n错误的平均值的第2错误中的至少一部分来计算出的数据错误最小化,(iii-2)且使与输入到鉴别器的已标记学习数据相对应的已标记数据分数最大化,(iv)学习所述鉴别器,以使分别与输入到鉴别器的修改学习数据或修改已标记学习数据相对应的修改数据分数或修改已标记数据分数最大化且使已标记数据分数最小化。
另外,在上文中,学习网络包括分别具有第1学习参数至第n学习参数的第1学习网络至第n学习网络,学习装置可以处于如下状态:(i)将原始学习数据和标记学习数据输入到数据嵌入网络中,使数据嵌入网络合成原始学习数据和标记学习数据,从而生成第1已标记学习数据,(ii)将第1已标记学习数据输入到第1学习网络中,使第1学习网络用第1学习网络的第1学习参数将网络运算应用于第1已标记学习数据,从而输出与第1已标记学习数据相对应的第1_1特征信息,并将原始学习数据输入到第1学习网络中,使第1学习网络用第1学习网络的第1学习参数将网络运算应用于原始学习数据,从而输出与原始学习数据相对应的第2_1特征信息,(iii)学习数据嵌入网络,以使通过参考(iii-1)将第1_1特征信息和第2_1特征信息作为参考而获得的第1_1错误与(iii-2)将用第1_1特征信息生成的第1任务特定输出和与所述第1任务特定输出对应的第1真实数据作为参考而获得的第2_1错误中的至少一部分来计算出的第1数据错误最小化且使与输入到鉴别器的第1已标记学习数据相对应的第1已标记数据分数最大化,从而使数据嵌入网络成为第1学习的数据嵌入网络,(iv)学习鉴别器,以使与输入到鉴别器的修改学习数据或修改已标记学习数据相对应的第1修改数据分数或第1修改已标记数据分数最大化且使第1已标记数据分数最小化,从而使鉴别器成为第1学习的鉴别器。另外,在将整数k从2增加到n的同时,学习装置可以处于如下状态:(i)将原始学习数据和标记学习数据输入到第k_1学习的数据嵌入网络中,使第k_1学习的数据嵌入网络合成原始学习数据和标记学习数据,从而生成第k已标记学习数据,(ii)将第k已标记学习数据输入到第k学习网络中,使第k学习网络用第k学习网络的至少一个第k学习参数将网络运算应用于第k已标记学习数据,从而输出与第k已标记学习数据相对应的第1_k特征信息,将原始学习数据输入到第k学习网络中,使第k学习网络用第k学习参数将网络运算应用于原始学习数据,从而输出与原始学习数据相对应的第2_k特征信息,(iii)学习第k_1学习的数据嵌入网络,以使通过参考(iii-1)将第1_k特征信息和第2_k特征信息作为参考而获得的至少一个第1_k数据错误与(iii-2)将用第1_k特征信息生成的至少一个第k任务特定输出和与所述第k任务特定输出对应的至少一个第k真实数据作为参考而获得的至少一个第2-k错误中的至少一部分来计算出的至少一个第k数据错误最小化且使与输入到第k_1学习的鉴别器中的第k已标记学习数据相对应的至少一个第k已标记数据分数最大化,从而使第k_1学习的数据嵌入网络成为第k学习的数据嵌入网络,(iv)学习第k_1学习的鉴别器,以使分别与输入到第k_1学习的鉴别器的修改学习数据或修改已标记学习数据相对应的至少一个第k修改数据分数或至少一个第k修改已标记数据分数最大化且使第k已标记数据分数最小化,从而使所述k_1学习的鉴别器成为第k学习的鉴别器。
另一方面,根据本发明一实施例,数据嵌入网络通过合成原始数据和标记数据来生成的标记数据可以提供或出售给想要购买大数据的购买者。
此时,由于根据本发明的一实施例生成的标记数据合成有标记数据,因此不仅可以使购买者难以复制或复印,而且即使未经许可将其提供给第三方,也可以容易跟踪。另外,根据本发明一实施例,已标记数据可以被人与原始数据不同地识别,但在学习网络中,其可以识别为与原始数据相同或相似。
此外,在本说明书中提到的“平均值”是指加权平均值,但不限于此。
如上所述的本发明实施例可以通过各种计算机组件执行的程序指令的形式实现并记录在计算机可读记录介质上。所述计算机可读记录介质可以单独地或组合地包括程序指令、数据文件和数据结构等。记录在所述计算机可读记录介质中的程序指令可以为针对本发明专门设计和配置的,或者对于计算机软件领域的技术人员来说是已知而可以使用的。计算机可读记录介质的示例包括诸如硬盘、软盘和磁带的磁性介质,诸如CD-ROM、DVD的光学记录介质,诸如软盘(floptical disk)的磁光介质(magneto-optical media)以及专门配置用于存储和执行程序指令的硬件装置,例如ROM、RAM、闪存等。程序指令的示例不仅包括由编译器产生的机器语言代码,而且包括可由计算机使用解释器等执行的高级语言代码。所述硬件装置可以配置为作为一个或多个软件模块操作以执行根据本发明的处理,反之亦然。
如上所述,已经通过诸如具体组件等的特定事项以及有限的实施例和附图描述了本发明,但提供所述内容仅是为了帮助更全面地理解本发明,所以本发明不限于以上实施例,并且本发明所属领域的技术人员可以根据这些描述进行各种修改和变更。
因此,本发明的精神不限于上述实施例,不仅是后述的权利要求书,而且与权利要求书等同或等同变形的所有内容均属于本发明的精神范围内。

Claims (28)

1.一种通过合成原始数据和标记数据来生成已标记数据的数据嵌入网络的学习方法,所述方法包括:
(a)当获得原始学习数据和标记学习数据时,学习装置将所述原始学习数据和所述标记学习数据输入到所述数据嵌入网络中,使所述数据嵌入网络合成所述原始学习数据和所述标记学习数据,从而生成已标记学习数据;
(b)所述学习装置(i)将所述已标记学习数据输入到具有至少一个学习参数的学习网络中,使所述学习网络(i-1)用所述学习参数将网络运算应用于所述已标记学习数据,(i-2)从而生成与所述已标记学习数据相对应的第1特征信息,(ii)并将所述原始学习数据输入到所述学习网络中,使所述学习网络(ii-1)用所述学习参数将网络运算应用于所述原始学习数据,(ii-2)从而生成与所述原始学习数据相对应的第2特征信息;以及
(c)所述学习装置(c1)学习所述数据嵌入网络,(i)以使通过参考(i-1)将所述第1特征信息和所述第2特征信息作为参考而获得的至少一个第1错误与(i-2)将使用所述第1特征信息生成的至少一个任务特定输出和与所述任务特定输出对应的至少一个真实数据作为参考而获得的至少一个第2错误中的至少一部分来计算出的至少一个数据错误最小化,(ii)并使与输入到鉴别器的所述已标记学习数据相对应的至少一个已标记数据分数最大化,其中所述鉴别器鉴别所输入数据的真实性,(c2)学习所述鉴别器,以使分别与输入到所述鉴别器的修改学习数据或修改已标记学习数据相对应的至少一个修改数据分数或至少一个修改已标记数据分数最大化并使所述已标记数据分数最小化,其中所述修改学习数据或所述修改已标记学习数据分别通过修改所述原始学习数据或所述已标记学习数据来生成。
2.根据权利要求1所述的方法,其中,
所述学习网络包括分别具有至少一个第1学习参数至至少一个第n学习参数的第1学习网络至第n学习网络,其中,所述n为1或更大的整数,
在所述步骤(b)中,
所述学习装置(i)将所述已标记学习数据分别输入到所述第1学习网络至所述第n学习网络中,使每个所述第1学习网络至所述第n学习网络(i-1)用每个所述第1学习网络至所述第n学习网络的所述第1学习参数至所述第n学习参数将与每个学习网络相对应的网络运算应用于所述已标记学习数据,(i-2)从而输出关于所述已标记学习数据的每个第1_1特征信息至第1_n特征信息,(ii)并将所述原始学习数据输入到每个所述第1学习网络至所述第n学习网络中,使每个所述第1学习网络至所述第n学习网络(ii-1)用每个所述第1学习参数至所述第n学习参数将与每个学习网络相对应的网络运算应用于所述原始学习数据,(ii-2)从而输出关于所述原始学习数据的每个第2_1特征信息至第2_n特征信息,
在所述步骤(c)中,
所述学习装置(i)学习所述数据嵌入网络,以使通过参考(i-1)作为将所述第1_1特征信息和所述第2_1特征信息作为参考而获得的第1_1错误至将所述第1_n特征信息和所述第2_n特征信息作为参考而获得的第1_n错误的平均值的所述第1错误与(i-2)作为将用所述第1_1特征信息生成的至少一个第1任务特定输出和与所述第1任务特定输出对应的至少一个第1真实数据作为参考而获得的第2_1错误至将用所述第1_n特征信息生成的至少一个第n任务特定输出和与所述第n任务特定输出对应的至少一个第n真实数据作为参考而获得的第2_n错误的平均值的所述第2错误中的至少一部分来计算出的所述数据错误最小化,且使与输入到所述鉴别器的所述已标记学习数据相对应的所述已标记数据分数最大化,(ii)并且学习所述鉴别器,以使分别与输入到所述鉴别器的所述修改学习数据或所述修改已标记学习数据相对应的所述修改数据分数或所述修改已标记数据分数最大化且使所述已标记数据分数最小化。
3.根据权利要求1所述的方法,其中,
所述学习网络包括分别具有至少一个第1学习参数至至少一个第n学习参数的第1学习网络至第n学习网络,其中,所述n为1或更大的整数,
在所述步骤(a)中,
所述学习装置将所述原始学习数据和所述标记学习数据输入到所述数据嵌入网络中,使所述数据嵌入网络合成所述原始学习数据和所述标记学习数据,从而生成第1已标记学习数据,
在所述步骤(b)中,
所述学习装置(i)将所述第1已标记学习数据输入到所述第1学习网络中,使所述第1学习网络(i-1)用所述第1学习网络的所述第1学习参数将网络运算应用于所述第1已标记学习数据,(i-2)从而输出关于所述第1已标记学习数据的第1_1特征信息,(ii)并将所述原始学习数据输入到所述第1学习网络中,使所述第1学习网络(ii-1)用所述第1学习参数将网络运算应用于所述原始学习数据,(ii-2)从而输出关于所述原始学习数据的第2_1特征信息,
在所述步骤(c)中,
所述学习装置(c1)学习所述数据嵌入网络,(i)以使通过参考(i-1)将所述第1_1特征信息和所述第2_1特征信息作为参考而获得的至少一个第1_1错误与(i-2)将用所述第1_1特征信息生成的至少一个第1任务特定输出和与所述第1任务特定输出对应的至少一个第1真实数据作为参考而获得的至少一个第2_1错误中的至少一部分来计算出的至少一个第1数据错误最小化(ii)且使与输入到所述鉴别器的所述第1已标记学习数据相对应的至少一个第1已标记数据分数最大化,从而使所述数据嵌入网络成为第1学习的数据嵌入网络,(c2)学习所述鉴别器,(i)以使分别与输入到所述鉴别器的所述修改学习数据或所述修改已标记学习数据相对应的至少一个第1修改数据分数或至少一个第1修改已标记数据分数最大化(ii)且使所述第1已标记数据分数最小化,从而使所述鉴别器成为第1学习的鉴别器,
所述学习装置在将整数k从2增加到n的同时,(i)将所述原始学习数据和所述标记学习数据输入到第k_1学习的数据嵌入网络中,使所述第k_1学习的数据嵌入网络合成所述原始学习数据和所述标记学习数据,从而生成第k已标记学习数据,(ii)将所述第k已标记学习数据输入到第k学习网络中,使所述第k学习网络用所述第k学习网络的至少一个第k学习参数将网络运算应用于所述第k已标记学习数据,从而输出与所述第k已标记学习数据相对应的第1_k特征信息,将所述原始学习数据输入到所述第k学习网络中,使所述第k学习网络用所述第k学习参数将网络运算应用于所述原始学习数据,从而输出与所述原始学习数据相对应的第2_k特征信息,(iii)学习第k_1学习的数据嵌入网络,以使通过参考(iii-1)将所述第1_k特征信息和所述第2_k特征信息作为参考而获得的至少一个第1_k数据错误与(iii-2)将用所述第1_k特征信息生成的至少一个第k任务特定输出和与所述第k任务特定输出对应的至少一个第k真实数据作为参考而获得的至少一个第2-k错误中的至少一部分来计算出的至少一个第k数据错误最小化,且使与输入到所述第k_1学习的鉴别器中的所述第k已标记学习数据相对应的至少一个第k已标记数据分数最大化,从而使所述第k_1学习的数据嵌入网络成为第k学习的数据嵌入网络,(iv)学习所述第k_1学习的鉴别器,以使分别与输入到所述第k_1学习的鉴别器的所述修改学习数据或所述修改已标记学习数据相对应的至少一个第k修改数据分数或至少一个第k修改已标记数据分数最大化且使所述第k已标记数据分数最小化,从而使所述k_1学习的鉴别器成为第k学习的鉴别器。
4.根据权利要求1所述的方法,其中,
分别与输入到所述鉴别器的所述修改学习数据或所述修改已标记学习数据相对应的所述修改数据分数或所述修改已标记数据分数的最大值为1,作为鉴别所述修改学习数据或所述修改已标记学习数据为真的值,并与输入到所述鉴别器的所述已标记学习数据相对应的所述已标记数据分数的最小值为0,作为鉴别所述已标记学习数据为假的值。
5.根据权利要求1所述的方法,其中,
在所述步骤(c)中,
所述学习装置参考所述第1特征信息和所述第2特征信息之间的差来获得所述第1错误,并参考使用所述任务特定输出和所述真实数据生成的至少一个损失来获得所述第2错误。
6.根据权利要求5所述的方法,其中,
所述学习装置参考所述第1特征信息和所述第2特征信息之间的范数或余弦相似度来获得所述第1错误。
7.根据权利要求1所述的方法,其中,
在所述步骤(c)中,
所述学习装置通过进一步参考所述原始学习数据和所述已标记学习数据之间的相似度来学习所述数据嵌入网络,以使所述相似度最小化。
8.一种学习的通过合成原始数据和标记数据来生成已标记数据的数据嵌入网络的测试方法,所述方法包括:
(a)测试装置在学习装置已经执行如下处理的条件下获得要合成的原始测试数据和标记测试数据:学习装置(i)在获得原始学习数据和标记学习数据时,将所述原始学习数据和所述标记学习数据输入到数据嵌入网络中,使所述数据嵌入网络合成所述原始学习数据和所述标记学习数据,从而生成已标记学习数据;(ii)将所述已标记学习数据输入到具有学习参数的学习网络中,使所述学习网络用所述学习参数将网络运算应用于所述已标记学习数据,从而生成与所述已标记学习数据相对应的第1特征信息,将所述原始学习数据输入到所述学习网络中,使所述学习网络用所述学习参数将网络运算应用于所述原始学习数据,从而输出与所述原始学习数据相对应的第2特征信息;(iii)学习所述数据嵌入网络,以使通过参考(iii-1)将所述第1特征信息和所述第2特征信息作为参考而获得的至少一个第1错误与(iii-2)将用所述第1特征信息生成的至少一个任务特定输出和与所述任务特定输出对应的至少一个真实数据作为参考而获得的至少一个第2错误中的至少一部分来计算出的至少一个数据错误最小化,且使与输入到鉴别器的所述已标记学习数据相对应的至少一个已标记数据分数最大化,其中所述鉴别器鉴别所输入数据的真实性;以及(iv)学习所述鉴别器,以使分别与输入到所述鉴别器中的修改学习数据或修改已标记学习数据相对应的至少一个修改数据分数或至少一个修改已标记数据分数最大化且使所述已标记数据分数最小化,其中所述修改学习数据或所述修改已标记学习数据分别通过修改所述原始学习数据或所述已标记学习数据来生成;以及
(b)所述测试装置将所述原始测试数据和所述标记测试数据输入到所述数据嵌入网络,使所述数据嵌入网络用所述数据嵌入网络的至少一个学习参数合成所述原始测试数据和所述标记测试数据,从而生成已标记测试数据。
9.根据权利要求8所述的方法,其中,
在所述步骤(a)中,
所述学习网络包括分别具有至少一个第1学习参数至至少一个第n学习参数的第1学习网络至第n学习网络,其中,所述n为1或更大的整数,
所述学习装置已经执行如下处理:(i)将所述已标记学习数据分别输入到所述第1学习网络至所述第n学习网络中,使每个所述第1学习网络至所述第n学习网络(i-1)用每个所述第1学习网络至所述第n学习网络的至少一个所述第1学习参数至至少一个所述第n学习参数将与每个学习网络相对应的网络运算应用于所述已标记学习数据,(i-2)从而输出与所述已标记学习数据相对应的每个第1_1特征信息至第1_n特征信息;(ii)将所述原始学习数据分别输入到所述第1学习网络至所述第n学习网络中,使每个所述第1学习网络至所述第n学习网络(ii-1)用每个所述第1学习网络至所述第n学习网络的所述第1学习参数至所述第n学习参数将与每个学习网络相对应的网络运算应用于所述原始学习数据,(ii-2)从而输出与所述原始学习数据对应的每个第2_1特征信息至第2_n特征信息;(iii)学习所述数据嵌入网络,(iii-1)以使通过参考(iii-1a)作为将所述第1_1特征信息和所述第2_1特征信息作为参考而获得的至少一个第1_1错误至将所述第1_n特征信息和所述第2_n特征信息作为参考而获得的至少一个第1_n错误的平均值的所述第1错误与(iii-1b)作为将用所述第1_1特征信息生成的至少一个第1任务特定输出和与所述第1任务特定输出对应的至少一个第1真实数据作为参考而获得的第2_1错误至将用所述第1_n特征信息生成的至少一个第n任务特定输出和与所述第n任务特定输出对应的至少一个第n真实数据作为参考而获得的第2_n错误的平均值的所述第2错误中的至少一部分来计算出的所述数据错误最小化,(iii-2)且使与输入到所述鉴别器的所述已标记学习数据相对应的所述已标记数据分数最大化;以及(iv)学习所述鉴别器,以使分别与输入到所述鉴别器的所述修改学习数据或所述修改已标记学习数据相对应的所述修改数据分数或所述修改已标记数据分数最大化且使所述已标记数据分数最小化。
10.根据权利要求8所述的方法,其中,
在所述步骤(a)中,
所述学习网络包括分别具有至少一个第1学习参数至至少一个第n学习参数的第1学习网络至第n学习网络,其中,所述n为1或更大的整数,
所述学习装置已经执行如下处理:(i)将所述原始学习数据和所述标记学习数据输入到所述数据嵌入网络中,使所述数据嵌入网络合成所述原始学习数据和所述标记学习数据,从而生成第1已标记学习数据;(ii)将所述第1已标记学习数据输入到所述第1学习网络中,使所述第1学习网络用所述第1学习网络的所述第1学习参数将网络运算应用于所述第1已标记学习数据,从而输出关于所述第1已标记学习数据的第1_1特征信息,并将所述原始学习数据输入到所述第1学习网络中,使所述第1学习网络用所述第1学习网络的所述第1学习参数将网络运算应用于所述原始学习数据,从而输出与所述原始学习数据相对应的第2_1特征信息;(iii)学习所述数据嵌入网络,以使通过参考(iii-1)将所述第1_1特征信息和所述第2_1特征信息作为参考而获得的所述第1_1错误与(iii-2)将用所述第1_1特征信息生成的第1任务特定输出和与所述第1任务特定输出对应的第1真实数据作为参考而获得的所述第2_1错误中的至少一部分来计算出的第1数据错误最小化且使与输入到所述鉴别器的所述第1已标记学习数据相对应的所述第1已标记数据分数最大化,从而使所述数据嵌入网络成为第1学习的数据嵌入网络;(iv)学习所述鉴别器,以使分别与输入到所述鉴别器的所述修改学习数据或所述修改已标记学习数据相对应的至少一个第1修改数据分数或至少一个第1修改已标记数据分数最大化且使所述第1已标记数据分数最小化,从而使所述鉴别器成为第1学习的鉴别器;以及(v)在将整数k从2增加到n的同时,(v-1)将所述原始学习数据和所述标记学习数据输入到第k_1学习的数据嵌入网络中,使所述第k_1学习的数据嵌入网络合成所述原始学习数据和所述标记学习数据,从而生成第k已标记学习数据,(v-2)将所述第k已标记学习数据输入到第k学习网络中,使所述第k学习网络用所述第k学习网络的至少一个第k学习参数将网络运算应用于所述第k已标记学习数据,从而输出与所述第k已标记学习数据相对应的第1_k特征信息,将所述原始学习数据输入到所述第k学习网络中,使所述第k学习网络用所述第k学习参数将网络运算应用于所述原始学习数据,从而输出与所述原始学习数据相对应的第2_k特征信息,(v-3)学习第k_1学习的数据嵌入网络,以使通过参考(v-3-1)将所述第1_k特征信息和所述第2_k特征信息作为参考而获得的至少一个第1_k数据错误与(v-3-2)将用所述第1_k特征信息生成的至少一个第k任务特定输出和与所述第k任务特定输出对应的至少一个第k真实数据作为参考而获得的至少一个第2-k错误中的至少一部分来计算出的至少一个第k数据错误最小化且使与输入到所述第k_1学习的鉴别器中的所述第k已标记学习数据相对应的至少一个第k已标记数据分数最大化,从而使所述第k_1学习的数据嵌入网络成为第k学习的数据嵌入网络,(v-4)学习所述第k_1学习的鉴别器,以使分别与输入到所述第k_1学习的鉴别器的所述修改学习数据或所述修改已标记学习数据相对应的至少一个第k修改数据分数或至少一个第k修改已标记数据分数最大化且使所述第k已标记数据分数最小化,从而使所述k_1学习的鉴别器成为第k学习的鉴别器。
11.根据权利要求8所述的方法,其中,
分别与输入到所述鉴别器的所述修改学习数据或所述修改已标记学习数据相对应的所述修改数据分数或所述修改已标记数据分数的最大值为1,作为鉴别所述修改学习数据或所述修改已标记学习数据为真的值,并与输入到所述鉴别器的所述已标记学习数据相对应的所述已标记数据分数的最小值为0,作为鉴别所述已标记学习数据为假的值。
12.根据权利要求8所述的方法,其中,
所述学习装置参考所述第1特征信息和所述第2特征信息之间的差来获得所述第1错误,并参考使用所述任务特定输出和所述真实数据生成的至少一个损失来获得所述第2错误。
13.根据权利要求12所述的方法,其中,
所述学习装置参考所述第1特征信息和所述第2特征信息之间的范数或余弦相似度来获得所述第1错误。
14.根据权利要求8所述的方法,其中,
所述学习装置通过进一步参考所述原始学习数据和所述已标记学习数据之间的相似度来学习所述数据嵌入网络,以使所述相似度最小化。
15.一种学习通过合成原始数据和标记数据来生成已标记数据的数据嵌入网络的学习装置,其包括:
至少一个存储指令的存储器;以及
至少一个处理器,其配置为执行用于进行如下处理的指令:(I)当获得原始学习数据和标记学习数据时,将所述原始学习数据和所述标记学习数据输入到数据嵌入网络中,使所述数据嵌入网络合成所述原始学习数据和所述标记学习数据,从而生成已标记学习数据;(II)(i)将所述已标记学习数据输入到具有至少一个学习参数的学习网络中,使所述学习网络(i-1)用所述学习参数将网络运算应用于所述已标记学习数据,(i-2)从而生成与所述已标记学习数据相对应的第1特征信息,(ii)并将所述原始学习数据输入到所述学习网络中,使所述学习网络(ii-1)用所述学习参数将网络运算应用于所述原始学习数据,(ii-2)从而生成与所述原始学习数据相对应的第2特征信息;以及(III)(III-1)学习所述数据嵌入网络,(i)以使通过参考(i-1)将所述第1特征信息和所述第2特征信息作为参考而获得的至少一个第1错误与(i-2)将用所述第1特征信息生成的至少一个任务特定输出和与所述任务特定输出对应的至少一个真实数据作为参考而获得的至少一个第2错误中的至少一部分来计算出的至少一个数据错误最小化,(ii)且使与输入到鉴别器中的所述已标记学习数据相对应的至少一个已标记数据分数最大化,其中所述鉴别器鉴别所输入数据的真实性,(III-2)学习所述鉴别器,以使分别与输入到所述鉴别器中的修改学习数据或修改已标记学习数据相对应的至少一个修改数据分数或至少一个修改已标记数据分数最大化且使所述已标记数据分数最小化,其中所述修改学习数据或所述修改已标记学习数据分别通过修改所述原始学习数据或所述已标记学习数据来生成。
16.根据权利要求15所述的学习装置,其中,
所述学习网络包括分别具有至少一个第1学习参数至至少一个第n学习参数的第1学习网络至第n学习网络,其中,所述n为1或更大的整数,
在所述处理(II)中,
所述处理器(i)将所述已标记学习数据分别输入到所述第1学习网络至所述第n学习网络中,使每个所述第1学习网络至所述第n学习网络(i-1)用每个所述第1学习网络至所述第n学习网络的所述第1学习参数至所述第n学习参数将与每个学习网络相对应的网络运算应用于所述已标记学习数据,(i-2)从而输出关于所述已标记学习数据的每个第1_1特征信息至第1_n特征信息,(ii)并将所述原始学习数据输入到每个所述第1学习网络至所述第n学习网络中,使每个所述第1学习网络至所述第n学习网络(ii-1)用每个所述第1学习参数至所述第n学习参数将与每个学习网络相对应的网络运算应用于所述原始学习数据,(ii-2)从而输出关于所述原始学习数据的每个第2_1特征信息至第2_n特征信息,
在所述处理(III)中,
所述处理器(i)学习所述数据嵌入网络,以使通过参考(i-1)作为将所述第1_1特征信息和所述第2_1特征信息作为参考而获得的第1_1错误至将所述第1_n特征信息和所述第2_n特征信息作为参考而获得的第1_n错误的平均值的所述第1错误与(i-2)作为将用所述第1_1特征信息生成的至少一个第1任务特定输出和与所述第1任务特定输出对应的至少一个第1真实数据作为参考而获得的第2_1错误至将用所述第1_n特征信息生成的至少一个第n任务特定输出和与所述第n任务特定输出对应的至少一个第n真实数据作为参考而获得的第2_n错误的平均值的所述第2错误中的至少一部分来计算出的所述数据错误最小化,且使与输入到所述鉴别器的所述已标记学习数据相对应的所述已标记数据分数最大化,(ii)并且学习所述鉴别器,以使分别与输入到所述鉴别器的所述修改学习数据或所述修改已标记学习数据相对应的所述修改数据分数或所述修改已标记数据分数最大化且使所述已标记数据分数最小化。
17.根据权利要求15所述的学习装置,其中,
所述学习网络包括分别具有至少一个第1学习参数至至少一个第n学习参数的第1学习网络至第n学习网络,其中,所述n为1或更大的整数,
在所述处理(I)中,
所述处理器将所述原始学习数据和所述标记学习数据输入到所述数据嵌入网络中,使所述数据嵌入网络合成所述原始学习数据和所述标记学习数据,从而生成第1已标记学习数据,
在所述处理(II)中,
所述处理器(i)将所述第1已标记学习数据输入到所述第1学习网络中,使所述第1学习网络(i-1)用所述第1学习网络的所述第1学习参数将网络运算应用于所述第1已标记学习数据,(i-2)从而输出关于所述第1已标记学习数据的第1_1特征信息,(ii)并将所述原始学习数据输入到所述第1学习网络中,使所述第1学习网络(ii-1)用所述第1学习参数将网络运算应用于所述原始学习数据,(ii-2)从而输出关于所述原始学习数据的第2_1特征信息,
在所述处理(III)中,
所述处理器(III-1)学习所述数据嵌入网络,(i)以使通过参考(i-1)将所述第1_1特征信息和所述第2_1特征信息作为参考而获得的至少一个第1_1错误与(i-2)将用所述第1_1特征信息生成的至少一个第1任务特定输出和与所述第1任务特定输出对应的至少一个第1真实数据作为参考而获得的至少一个第2_1错误中的至少一部分来计算出的至少一个第1数据错误最小化(ii)且使与输入到所述鉴别器的所述第1已标记学习数据相对应的至少一个第1已标记数据分数最大化,从而使所述数据嵌入网络成为第1学习的数据嵌入网络,(III-2)学习所述鉴别器,(i)以使分别与输入到所述鉴别器的所述修改学习数据或所述修改已标记学习数据相对应的至少一个第1修改数据分数或至少一个第1修改已标记数据分数最大化(ii)且使所述第1已标记数据分数最小化,从而使所述鉴别器成为第1学习的鉴别器,
所述处理器在将整数k从2增加到n的同时,(i)将所述原始学习数据和所述标记学习数据输入到第k_1学习的数据嵌入网络中,使所述第k_1学习的数据嵌入网络合成所述原始学习数据和所述标记学习数据,从而生成第k已标记学习数据,(ii)将所述第k已标记学习数据输入到第k学习网络中,使所述第k学习网络用所述第k学习网络中的至少一个第k学习参数将网络运算应用于所述第k已标记学习数据,从而输出与所述第k已标记学习数据相对应的第1_k特征信息,将所述原始学习数据输入到所述第k学习网络中,使所述第k学习网络用所述第k学习参数将网络运算应用于所述原始学习数据,从而输出与所述原始学习数据相对应的第2_k特征信息,(iii)学习第k_1学习的数据嵌入网络,以使通过参考(iii-1)将所述第1_k特征信息和所述第2_k特征信息作为参考而获得的至少一个第1_k数据错误与(iii-2)将用所述第1_k特征信息生成的至少一个第k任务特定输出和与所述第k任务特定输出对应的至少一个第k真实数据作为参考而获得的至少一个第2-k错误中的至少一部分来计算出的至少一个第k数据错误最小化且使与输入到所述第k_1学习的鉴别器中的所述第k已标记学习数据相对应的至少一个第k已标记数据分数最大化,从而使所述第k_1学习的数据嵌入网络成为第k学习的数据嵌入网络,(iv)学习所述第k_1学习的鉴别器,以使分别与输入到所述第k_1学习的鉴别器的所述修改学习数据或所述修改已标记学习数据相对应的至少一个第k修改数据分数或至少一个第k修改已标记数据分数最大化且使所述第k已标记数据分数最小化,从而使所述k_1学习的鉴别器成为第k学习的鉴别器。
18.根据权利要求15所述的学习装置,其中,
分别与输入到所述鉴别器的所述修改学习数据或所述修改已标记学习数据相对应的所述修改数据分数或所述修改已标记数据分数的最大值为1,作为鉴别所述修改学习数据或所述修改已标记学习数据为真的值,并与输入到所述鉴别器的所述已标记学习数据相对应的所述已标记数据分数的最小值为0,作为鉴别所述已标记学习数据为假的值。
19.根据权利要求15所述的学习装置,其中,
在所述处理(III)中,
所述处理器参考所述第1特征信息和所述第2特征信息之间的差来获得所述第1错误,并参考使用所述任务特定输出和所述真实数据生成的至少一个损失来获得所述第2错误。
20.根据权利要求19所述的学习装置,其中,
所述处理器通过参考所述第1特征信息和所述第2特征信息之间的范数或余弦相似度来获得所述第1错误。
21.根据权利要求15所述的学习装置,其中,
在所述处理(III)中,
所述处理器通过进一步参考所述原始学习数据和所述已标记学习数据之间的相似度来学习所述数据嵌入网络,以使所述相似度最小化。
22.一种学习的通过合成原始数据和标记数据来生成已标记数据的数据嵌入网络的测试装置,其包括:
至少一个存储指令的存储器;以及
至少一个处理器,其配置为执行指令以进行如下处理或支持其他装置进行如下处理:(I)在学习装置已经执行如下处理的条件下获得要合成的原始测试数据和标记测试数据:(i)当获得原始学习数据和标记学习数据时,将所述原始学习数据和所述标记学习数据输入到数据嵌入网络中,使所述数据嵌入网络合成所述原始学习数据和所述标记学习数据,从而生成已标记学习数据;(ii)将所述已标记学习数据输入到具有学习参数的学习网络中,使所述学习网络用所述学习参数将网络运算应用于所述已标记学习数据,从而生成与所述已标记学习数据相对应的第1特征信息,并将所述原始学习数据输入到所述学习网络中,使所述学习网络用所述学习参数将网络运算应用于所述原始学习数据,从而输出与所述原始学习数据相对应的第2特征信息;(iii)学习所述数据嵌入网络,以使通过参考(iii-1)将所述第1特征信息和所述第2特征信息作为参考而获得的至少一个第1错误与(iii-2)将用所述第1特征信息生成的至少一个任务特定输出和与所述任务特定输出对应的至少一个真实数据作为参考而获得的至少一个第2错误中的至少一部分来计算出的至少一个数据错误最小化且使与输入到鉴别器的所述已标记学习数据相对应的至少一个已标记数据分数最大化,其中所述鉴别器鉴别所输入数据的真实性;以及(iv)学习所述鉴别器,以使分别与输入到所述鉴别器中的修改学习数据或修改已标记学习数据相对应的至少一个修改数据分数或至少一个修改已标记数据分数最大化且使所述已标记数据分数最小化,其中所述修改学习数据或所述修改已标记学习数据分别通过修改所述原始学习数据或所述已标记学习数据来生成;以及(II)将所述原始测试数据和所述标记测试数据输入到所述数据嵌入网络,使所述数据嵌入网络用所述数据嵌入网络的至少一个学习参数合成所述原始测试数据和所述标记测试数据,从而生成已标记测试数据。
23.根据权利要求22所述的测试装置,其中,
在所述处理(I)中,
所述学习网络包括分别具有至少一个第1学习参数至至少一个第n学习参数的第1学习网络至第n学习网络,其中,所述n为1或更大的整数,
所述学习装置已经执行如下处理:(i)将所述已标记学习数据分别输入到所述第1学习网络至所述第n学习网络中,使每个所述第1学习网络至所述第n学习网络(i-1)用每个所述第1学习网络至所述第n学习网络的至少一个所述第1学习参数至至少一个所述第n学习参数将与每个学习网络相对应的网络运算应用于所述已标记学习数据,(i-2)从而输出与所述已标记学习数据相对应的每个第1_1特征信息至第1_n特征信息;(ii)将所述原始学习数据分别输入到所述第1学习网络至所述第n学习网络中,使每个所述第1学习网络至所述第n学习网络(ii-1)用每个所述第1学习网络至所述第n学习网络的所述第1学习参数至所述第n学习参数将与每个学习网络相对应的网络运算应用于所述原始学习数据,(ii-2)从而输出与所述原始学习数据对应的每个第2_1特征信息至第2_n特征信息;(iii)学习所述数据嵌入网络,(iii-1)以使通过参考(iii-1a)作为将所述第1_1特征信息和所述第2_1特征信息作为参考而获得的至少一个第1_1错误至将所述第1_n特征信息和所述第2_n特征信息作为参考而获得的至少一个第1_n错误的平均值的所述第1错误与(iii-1b)作为将用所述第1_1特征信息生成的至少一个第1任务特定输出和与所述第1任务特定输出对应的至少一个第1真实数据作为参考而获得的第2_1错误至将用所述第1_n特征信息生成的至少一个第n任务特定输出和与所述第n任务特定输出对应的至少一个第n真实数据作为参考而获得的第2_n错误的平均值的所述第2错误中的至少一部分来计算出的所述数据错误最小化,(iii-2)且使与输入到所述鉴别器的所述已标记学习数据相对应的所述已标记数据分数最大化;以及(iv)学习所述鉴别器,以使分别与输入到所述鉴别器的所述修改学习数据或所述修改已标记学习数据相对应的所述修改数据分数或所述修改已标记数据分数最大化且使所述已标记数据分数最小化。
24.根据权利要求22所述的测试装置,其中,
在所述处理(I)中,
所述学习网络包括分别具有至少一个第1学习参数至至少一个第n学习参数的第1学习网络至第n学习网络,其中,所述n为1或更大的整数,
所述学习装置已经执行如下处理:(i)将所述原始学习数据和所述标记学习数据输入到所述数据嵌入网络中,使所述数据嵌入网络合成所述原始学习数据和所述标记学习数据,从而生成第1已标记学习数据;(ii)将所述第1已标记学习数据输入到所述第1学习网络中,使所述第1学习网络用所述第1学习网络的所述第1学习参数将网络运算应用于所述第1已标记学习数据,从而输出与所述第1已标记学习数据相对应的第1_1特征信息,并将所述原始学习数据输入到所述第1学习网络中,使所述第1学习网络用所述第1学习网络的所述第1学习参数将网络运算应用于所述原始学习数据,从而输出与所述原始学习数据相对应的第2_1特征信息;(iii)学习所述数据嵌入网络,以使通过参考(iii-1)将所述第1_1特征信息和所述第2_1特征信息作为参考而获得的所述第1_1错误与(iii-2)将用所述第1_1特征信息生成的第1任务特定输出和与所述第1任务特定输出对应的第1真实数据作为参考而获得的所述第2_1错误中的至少一部分来计算出的第1数据错误最小化且使与输入到所述鉴别器的所述第1已标记学习数据相对应的所述第1已标记数据分数最大化,从而使所述数据嵌入网络成为第1学习的数据嵌入网络;(iv)学习所述鉴别器,以使分别与输入到所述鉴别器的所述修改学习数据或所述修改已标记学习数据相对应的至少一个第1修改数据分数或至少一个第1修改已标记数据分数最大化且使所述第1已标记数据分数最小化,从而使所述鉴别器成为第1学习的鉴别器;以及(v)在将整数k从2增加到n的同时,(v-1)将所述原始学习数据和所述标记学习数据输入到第k_1学习的数据嵌入网络中,使所述第k_1学习的数据嵌入网络合成所述原始学习数据和所述标记学习数据,从而生成第k已标记学习数据,(v-2)将所述第k已标记学习数据输入到第k学习网络中,使所述第k学习网络用所述第k学习网络的至少一个第k学习参数将网络运算应用于所述第k已标记学习数据,从而输出与所述第k已标记学习数据相对应的第1_k特征信息,将所述原始学习数据输入到所述第k学习网络中,使所述第k学习网络用所述第k学习参数将网络运算应用于所述原始学习数据,从而输出与所述原始学习数据相对应的第2_k特征信息,(v-3)学习所述第k_1学习的数据嵌入网络,以使通过参考(v-3-1)将所述第1_k特征信息和所述第2_k特征信息作为参考而获得的至少一个第1_k数据错误与(v-3-2)将用所述第1_k特征信息生成的至少一个第k任务特定输出和与所述第k任务特定输出对应的至少一个第k真实数据作为参考而获得的至少一个第2-k错误中的至少一部分来计算出的至少一个第k数据错误最小化且使与输入到所述第k_1学习的鉴别器中的所述第k已标记学习数据相对应的至少一个第k已标记数据分数最大化,从而使所述第k_1学习的数据嵌入网络成为第k学习的数据嵌入网络,(v-4)学习所述第k_1学习的鉴别器,以使分别与输入到所述第k_1学习的鉴别器的所述修改学习数据或所述修改已标记学习数据相对应的至少一个第k修改数据分数或至少一个第k修改已标记数据分数最大化且使所述第k已标记数据分数最小化,从而使所述k_1学习的鉴别器成为第k学习的鉴别器。
25.根据权利要求22所述的测试装置,其中,
分别与输入到所述鉴别器的所述修改学习数据或所述修改已标记学习数据相对应的所述修改数据分数或所述修改已标记数据分数的最大值为1,作为鉴别所述修改学习数据或所述修改已标记学习数据为真的值,并与输入到所述鉴别器的所述已标记学习数据相对应的所述已标记数据分数的最小值为0,作为鉴别所述已标记学习数据为假的值。
26.根据权利要求22所述的测试装置,其中,
所述学习装置参考所述第1特征信息和所述第2特征信息之间的差来获得所述第1错误,并参考使用所述任务特定输出和所述真实数据生成的至少一个损失来获得所述第2错误。
27.根据权利要求26所述的测试装置,其中,
所述学习装置参考所述第1特征信息和所述第2特征信息之间的范数或余弦相似度来获得所述第1错误。
28.根据权利要求22所述的测试装置,其中,
所述学习装置通过进一步参考所述原始学习数据和所述已标记学习数据之间的相似度来学习所述数据嵌入网络,以使所述相似度最小化。
CN201980035428.0A 2018-08-10 2019-07-19 数据嵌入网络的学习方法和装置及其测试方法和装置 Active CN112313645B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR1020180093747A KR102107021B1 (ko) 2018-08-10 2018-08-10 데이터를 식별 처리하는 방법, 시스템 및 비일시성의 컴퓨터 판독 가능 기록 매체
KR10-2018-0093747 2018-08-10
PCT/KR2019/008944 WO2020032420A1 (en) 2018-08-10 2019-07-19 Method for training and testing data embedding network to generate marked data by integrating original data with mark data, and training device and testing device using the same

Publications (2)

Publication Number Publication Date
CN112313645A true CN112313645A (zh) 2021-02-02
CN112313645B CN112313645B (zh) 2024-06-07

Family

ID=69406172

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980035428.0A Active CN112313645B (zh) 2018-08-10 2019-07-19 数据嵌入网络的学习方法和装置及其测试方法和装置

Country Status (6)

Country Link
US (1) US10789551B2 (zh)
EP (1) EP3834107A4 (zh)
JP (1) JP7140317B2 (zh)
KR (1) KR102107021B1 (zh)
CN (1) CN112313645B (zh)
WO (2) WO2020032348A1 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210216874A1 (en) * 2020-01-10 2021-07-15 Facebook Technologies, Llc Radioactive data generation
US11017320B1 (en) * 2020-06-24 2021-05-25 Deeping Source Inc. Method for training obfuscation network which conceals original data to be used for machine learning and training surrogate network which uses obfuscated data generated by obfuscation network and learning device using the same and method for testing trained obfuscation network and testing device using the same
US11366930B1 (en) * 2021-08-23 2022-06-21 Deeping Source Inc. Method for training and testing obfuscation network capable of obfuscating data to protect personal information, and learning device and testing device using the same
US11308359B1 (en) * 2021-10-27 2022-04-19 Deeping Source Inc. Methods for training universal discriminator capable of determining degrees of de-identification for images and obfuscation network capable of obfuscating images and training devices using the same
US11886955B2 (en) 2022-02-16 2024-01-30 Protopia AI, Inc. Self-supervised data obfuscation in foundation models

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6123258A (en) * 1997-06-12 2000-09-26 Fuji Xerox Co., Ltd. Information embedding and resolving method and apparatus
US20020099730A1 (en) * 2000-05-12 2002-07-25 Applied Psychology Research Limited Automatic text classification system
US20030070075A1 (en) * 2001-10-04 2003-04-10 Frederic Deguillaume Secure hybrid robust watermarking resistant against tampering and copy-attack
US20030095683A1 (en) * 2001-08-28 2003-05-22 Kayvan Najarian Automated digital watermarking methods using neural networks
US20060269098A1 (en) * 2005-05-31 2006-11-30 Fuji Xerox Co., Ltd. Image processing apparatus, image processing method, medium, code reading apparatus, and program
CN1933391A (zh) * 2005-09-16 2007-03-21 北京书生国际信息技术有限公司 一种隐形编码嵌入和检测的方法
CN101661610A (zh) * 2009-09-17 2010-03-03 上海交通大学 具有主被动鉴别功能的数字图像防伪检测系统
US20110046761A1 (en) * 2009-08-19 2011-02-24 Paul Frederick Titchener Recorded Media Enhancement Method
US20170139905A1 (en) * 2015-11-17 2017-05-18 Samsung Electronics Co., Ltd. Apparatus and method for generating translation model, apparatus and method for automatic translation
KR20170092631A (ko) * 2014-12-30 2017-08-11 이베이 인크. 유사 물품 검출
US20180018590A1 (en) * 2016-07-18 2018-01-18 NantOmics, Inc. Distributed Machine Learning Systems, Apparatus, and Methods
US20180144465A1 (en) * 2016-11-23 2018-05-24 General Electric Company Deep learning medical systems and methods for medical procedures
US20180144214A1 (en) * 2016-11-23 2018-05-24 General Electric Company Deep learning medical systems and methods for image reconstruction and quality evaluation
WO2018093926A1 (en) * 2016-11-15 2018-05-24 Google Llc Semi-supervised training of neural networks
WO2018131405A1 (ja) * 2017-01-12 2018-07-19 Kddi株式会社 情報処理装置、方法及びコンピュータ可読記憶媒体

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100950965B1 (ko) * 2008-04-16 2010-04-02 동국대학교 산학협력단 배경 영상의 자동 교체 시스템 및 그 방법
KR20140147461A (ko) * 2013-06-20 2014-12-30 삼성전자주식회사 고유의 컨텐츠를 삽입하는 전자 장치 및 방법
WO2015017796A2 (en) * 2013-08-02 2015-02-05 Digimarc Corporation Learning systems and methods
KR101871065B1 (ko) * 2016-01-27 2018-07-19 한국과학기술원 분할 기법을 이용한 3차원 메쉬 모델 워터마킹 방법 및 장치
KR101837939B1 (ko) 2016-10-18 2018-03-13 주식회사 한글과컴퓨터 문서에 워터마크를 삽입하는 방법 및 그 장치와 워터마크가 삽입된 문서
KR20180058116A (ko) 2016-11-23 2018-05-31 부산대학교 산학협력단 가정용 에너지 관리 시스템에서의 수용가의 가전기기 자동 설정 방법
JP6567488B2 (ja) 2016-12-22 2019-08-28 日本電信電話株式会社 学習データ生成装置、開発データ生成装置、モデル学習装置、それらの方法、及びプログラム
KR101861520B1 (ko) 2017-03-15 2018-05-28 광주과학기술원 얼굴 비식별화 방법
KR20180130925A (ko) * 2017-05-30 2018-12-10 국방과학연구소 머신 러닝을 위한 학습 이미지를 자동 생성하는 인공 지능 장치 및 그의 제어 방법
US20190286938A1 (en) * 2018-03-13 2019-09-19 Recogni Inc. Real-to-synthetic image domain transfer

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6123258A (en) * 1997-06-12 2000-09-26 Fuji Xerox Co., Ltd. Information embedding and resolving method and apparatus
US20020099730A1 (en) * 2000-05-12 2002-07-25 Applied Psychology Research Limited Automatic text classification system
US20030095683A1 (en) * 2001-08-28 2003-05-22 Kayvan Najarian Automated digital watermarking methods using neural networks
US20030070075A1 (en) * 2001-10-04 2003-04-10 Frederic Deguillaume Secure hybrid robust watermarking resistant against tampering and copy-attack
US20060269098A1 (en) * 2005-05-31 2006-11-30 Fuji Xerox Co., Ltd. Image processing apparatus, image processing method, medium, code reading apparatus, and program
CN1933391A (zh) * 2005-09-16 2007-03-21 北京书生国际信息技术有限公司 一种隐形编码嵌入和检测的方法
US20110046761A1 (en) * 2009-08-19 2011-02-24 Paul Frederick Titchener Recorded Media Enhancement Method
CN101661610A (zh) * 2009-09-17 2010-03-03 上海交通大学 具有主被动鉴别功能的数字图像防伪检测系统
KR20170092631A (ko) * 2014-12-30 2017-08-11 이베이 인크. 유사 물품 검출
US20170139905A1 (en) * 2015-11-17 2017-05-18 Samsung Electronics Co., Ltd. Apparatus and method for generating translation model, apparatus and method for automatic translation
US20180018590A1 (en) * 2016-07-18 2018-01-18 NantOmics, Inc. Distributed Machine Learning Systems, Apparatus, and Methods
WO2018093926A1 (en) * 2016-11-15 2018-05-24 Google Llc Semi-supervised training of neural networks
US20180144465A1 (en) * 2016-11-23 2018-05-24 General Electric Company Deep learning medical systems and methods for medical procedures
US20180144214A1 (en) * 2016-11-23 2018-05-24 General Electric Company Deep learning medical systems and methods for image reconstruction and quality evaluation
WO2018131405A1 (ja) * 2017-01-12 2018-07-19 Kddi株式会社 情報処理装置、方法及びコンピュータ可読記憶媒体

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
JONGHWA YIM等: "Style-Guided Inference of Transformer for High-resolution Image Synthesis", 《2023 IEEE/CVF WINTER CONFERENCE ON APPLICATIONS OF COMPUTER VISION (WACV)》, pages 1745 - 1755 *
海盗ORA: "从重采样到数据合成:如何处理机器学习中的不平衡分类问题?", Retrieved from the Internet <URL:https://www.cnblogs.com/huangjing/p/6789731.html> *
顾弘: "基于半监督聚类分析及广义距离函数学习的图像识别技术研究", 《中国博士学位论文全文数据库》, pages 138 - 58 *

Also Published As

Publication number Publication date
JP2021521566A (ja) 2021-08-26
JP7140317B2 (ja) 2022-09-21
WO2020032420A1 (en) 2020-02-13
US10789551B2 (en) 2020-09-29
KR20200018031A (ko) 2020-02-19
KR102107021B1 (ko) 2020-05-07
CN112313645B (zh) 2024-06-07
WO2020032348A1 (ko) 2020-02-13
US20200050962A1 (en) 2020-02-13
EP3834107A4 (en) 2022-05-04
EP3834107A1 (en) 2021-06-16

Similar Documents

Publication Publication Date Title
JP7040712B2 (ja) 個人情報保護のために原本データをコンシーリング処理する変調ネットワークを学習する方法及びテストする方法、そして、これを利用した学習装置及びテスト装置
Uchida et al. Embedding watermarks into deep neural networks
US11163860B2 (en) Protecting deep learning models using watermarking
CN112313645B (zh) 数据嵌入网络的学习方法和装置及其测试方法和装置
Shi et al. SSGAN: Secure steganography based on generative adversarial networks
KR102183335B1 (ko) 프라이버시를 위하여 데이터를 컨실링 처리할 수 있는 변조 네트워크에 대응되는 적응 네트워크를 학습하는 방법 및 테스트하는 방법, 그리고 이를 이용한 학습 장치 및 테스트 장치
KR102184787B1 (ko) 개인 정보를 보호하기 위하여 원본 데이터를 컨실링 처리하여 생성된 변조 데이터를 인식하기 위해 사용되는 사용자 러닝 네트워크를 학습하는 방법 및 테스트하는 방법, 그리고 이를 이용한 학습 장치 및 테스트 장치
KR102412832B1 (ko) 개인 정보 보호를 위하여 원본 데이터를 변조하는 변조 네트워크를 학습하는 방법 및 테스팅하는 방법, 그리고, 이를 이용한 학습 장치 및 테스팅 장치
Deeba et al. Digital watermarking using deep neural network
Bhagtani et al. An overview of recent work in media forensics: Methods and threats
Singh et al. Steganalysis of digital images using deep fractal network
Wang et al. Protecting the intellectual property of speaker recognition model by black-box watermarking in the frequency domain
Vybornova Method for copyright protection of deep neural networks using digital watermarking
Xu et al. A deep learning framework supporting model ownership protection and traitor tracing
Jia et al. Subnetwork-lossless robust watermarking for hostile theft attacks in deep transfer learning models
Luo et al. Improving security for image steganography using content-adaptive adversarial perturbations
Alharbi et al. Inpainting forgery detection using hybrid generative/discriminative approach based on bounded generalized Gaussian mixture model
Sharma et al. Towards secured image steganography based on content-adaptive adversarial perturbation
KR102247769B1 (ko) 원본 데이터와 마크 데이터를 합성하여 마킹된 데이터를 생성하는 데이터 임베딩 네트워크를 학습하는 방법 및 테스트하는 방법, 그리고 이를 이용한 학습 장치 및 테스트 장치
Jabbar et al. Digital watermarking by utilizing the properties of self-organization map based on least significant bit and most significant bit
Akram et al. Enhanced Steganalysis for Color Images Using Curvelet Features and Support VectorMachine.
Wu Robust and lossless fingerprinting of deep neural networks via pooled membership inference
Peng et al. Enhancing the anti-steganalysis ability of steganography via adversarial examples
Chen et al. When deep learning meets watermarking: A survey of application, attacks and defenses
Pandey et al. Detecting low-resolution deepfakes: an exploration of machine learning techniques

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant