CN110537184A - 利用生成式对抗网络的半监督回归 - Google Patents

利用生成式对抗网络的半监督回归 Download PDF

Info

Publication number
CN110537184A
CN110537184A CN201780089195.3A CN201780089195A CN110537184A CN 110537184 A CN110537184 A CN 110537184A CN 201780089195 A CN201780089195 A CN 201780089195A CN 110537184 A CN110537184 A CN 110537184A
Authority
CN
China
Prior art keywords
sample
network
nervus opticus
training
label
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201780089195.3A
Other languages
English (en)
Inventor
迈赫迪·雷扎霍利扎德
Md·阿克马尔·海达
吴大磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of CN110537184A publication Critical patent/CN110537184A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/088Non-supervised learning, e.g. competitive learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Analysis (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种利用生成式对抗网络(generative adversarial network,简称GAN)执行半监督回归的方法和系统,所述生成式对抗网络包括:生成器,包含第一神经网络;判别器,包含第二神经网络。所述方法和系统包括:所述第一神经网络输出从随机噪声向量获取生成的样本;向所述第二神经网络输入所述生成的样本、多个标记的训练样本和多个未标记的训练样本;所述第二神经网络输出用于多个所述生成的样本和未标记的样本中的每一个的预测连续标记。

Description

利用生成式对抗网络的半监督回归
相关申请案交叉申请
本申请要求于2017年5月19日递交的发明名称为“利用生成式对抗网络的半监督回归”的第62/508,819号美国临时专利申请的权益和在先申请优先权,以及要求于2017年10月20日递交的发明名称为“利用生成式对抗网络的半监督回归”的第15/789,518号美国专利申请的权益和在先申请优先权,该在先申请的内容以引入的方式并入本文。。
技术领域
本发明涉及生成式对抗网络,特别地,涉及生成式对抗网络中的半监督回归学习。
背景技术
深度学习已经在诸如自然语言处理(natural language processing,简称NLP)、自主驾驶、博弈和无监督学习之类的各种领域中取得了巨大成功。已开发出生成式对抗网络(generative adversarial network,简称GAN)来生成合成的实像。GAN对应于二元极大极小博弈,其中同时训练两个模型:生成模型G,用于捕获数据分布;判别模型D,用于计算样本来自训练数据而不是生成器的概率。
当训练样本不足时,GAN方案可能是有用的。
尽管GAN最近取得了进展,但仍存在关于评估、训练和标记生成的样本的关键问题。
发明内容
本发明的示例性方面提供了一种用于利用生成式对抗网络执行半监督回归的方法和系统。在一些示例中,应用基于GAN的方案,可以生成真实的高质量样本,还可以预测用于训练数据集中的生成的样本和未标记的样本的连续标记。
在示例性实施例中,公开了一种GAN,用于基于训练数据集来预测连续标记,所述训练数据集仅具有有限数目的标记的样本。还可以预测用于未标记的训练样本和生成的样本的标记。所述GAN可以应用于例如自主驾驶应用,例如确定转向角。
根据第一方面,提供了一种用于训练生成式对抗网络(generative adversarialnetwork,简称GAN)的方法,所述生成式对抗网络包括:生成器,包含第一神经网络;判别器,包含第二神经网络。所述方法包括:所述第一神经网络输出从随机噪声向量获取生成的样本;向所述第二神经网络输入所述生成的样本、多个标记的训练样本和多个未标记的训练样本;所述第二神经网络输出用于多个所述生成的样本和未标记的样本中的每一个的预测连续标记。
在一些示例性实施例中,所述第二神经网络输出每个连续标记为归一化值。在一些示例中,所述方法包括:所述第二神经网络输出所输入样本是实际样本的概率。
在一些示例性实施例中,所述方法包括:确定生成的样本是实际样本并且基于为生成的样本预测的所述连续标记的概率。在一些示例中,确定所述概率通过核函数执行,基于连续标记的所述归一化值是否在预先确定的范围内。
在一些示例中,所述标记的训练样本包括运动车辆的一系列前置摄像头图像样本,每一个所述标记的训练样本都标记有转向角。
在一些示例中,在所述神经网络的参数收敛之前,所述方法包括:重复以下操作:所述第一神经网络输出生成的样本;向所述第二网络输入所述生成的样本、标记的训练样本和未标记的训练样本;所述第二神经网络输出预测的连续标记。在每次重复期间,计算所述第二神经网络和所述第一神经网络各自的损失函数;基于所述计算的损失函数,调整所述第二神经网络和所述第一神经网络的权重参数。
在一些示例中,所述第一神经网络的所述损失函数包括特征匹配损失函数,所述特征匹配损失函数基于所述第二神经网络的中间层分别对所述训练样本和生成的样本的输出之间的差值。此外,在一些配置中,所述第二神经网络的所述损失函数是监督部分和无监督部分的组合。在一些示例中,所述监督部分基于向所述第二神经网络提供的所述标记的样本的实际标记与预测连续标记之间的差值。
根据第二方面,提供了一种用于训练生成式对抗网络(generative adversarialnetwork,简称GAN)的系统,所述生成式对抗网络包括:生成器,包含第一神经网络;判别器,包含第二神经网络。所述系统包括处理设备和存储器,所述存储器耦合至所述处理设备。所述存储器存储计算机可执行指令,所述计算机可执行指令在由所述处理设备执行时使所述系统执行以下操作:定义所述第一神经网络和所述第二神经网络;所述第一神经网络输出从随机噪声向量获取生成的样本;向所述第二神经网络输入所述生成的样本、多个标记的训练样本和多个未标记的训练样本;所述第二神经网络输出用于多个所述生成的样本和未标记的样本中的每一个的预测连续标记。
在所述系统的一些示例中,所述第二神经网络输出每个连续标记为归一化值。在一些示例中,所述系统从所述第二神经网络输出所输入样本是实际样本的概率。在一些示例中,所述系统用于确定生成的样本是基于预测的所述连续标记来生成的实际样本的概率。在一些示例中,所述系统用于定义核函数,所述核函数基于连续标记的所述归一化值是否在预先确定的范围内确定所述概率。
根据另一方面,提供了一种计算机程序产品,包括存储计算机可执行指令的计算机可读介质,所述计算机可执行指令用于使处理系统执行以下方法:定义一种生成式对抗网络(generative adversarial network,简称GAN),包括:生成器,包含第一神经网络;判别器,包含第二神经网络;从所述第一神经网络输出从随机噪声向量获取生成的样本;向所述第二神经网络输入所述生成的样本、多个标记的训练样本和多个未标记的训练样本;从所述第二神经网络输出用于多个所述生成的样本和未标记的样本中的每一个的预测连续标记。
附图说明
现在将通过示例参考示出本发明的示例性实施例的附图,其中:
图1是第一示例性实施例提供的一种生成式对抗网络(generative adversarialnetwork,简称GAN)的框图;
图2是第二示例性实施例提供的一种GAN的框图;
图3是一示例性实施例提供的图1或图2的所述GAN的生成器的框图;
图4是一示例性实施例提供的图1的所述GAN的判别器的框图;
图5是一示例性实施例提供的图2的所述GAN的判别器的框图;
图6是示例性实施例提供的示出一种由图1或图2的所述GAN执行的方法的流程图;
图7示出了一示例性实施例提供的一种GAN实现的半监督回归系统的示例;
图8示出了一示例性实施例提供的一种由图7的所述半监督回归系统实现的方法;
图9是示例性实施例提供的一种可用于实现GAN和半监督回归系统的处理系统的框图。
在不同的附图中可以使用类似的参考标号来表示类似的组件。
具体实施方式
生成式对抗网络(generative adversarial network,简称GAN)包括两个单独的深度网络:生成器网络和判别器网络。所述生成器网络(在本领域通常称为生成器)由第一神经网络实现,所述判别器网络(在本领域通常称为判别器)由第二神经网络实现。训练所述生成器,以获得具有分布Pz(z)的随机变量z并将所述随机变量z映射到训练数据集的数据分布Pdata(x)内的输出值。所述判别器为所述生成器提供训练信号。所述生成器的输出分布Pmodel(x)应在训练期间收敛到所述数据分布Pdata(x)。另一方面,所述判别器预期通过分别给出1或0的所述输出来从生成的样本中辨别实际样本(在本文中也称为真实样本)。在所述GAN训练过程中,所述生成器和判别器分别用于生成样本和通过以对抗方式提高彼此性能来对所述样本进行分类。在此方面,如“I.J.Goodfellow、J.P.-Abadie、M.Mirza、B.Xu、D.W.-Farley、S.Ozair、A.Courville和Y.Bengio在2014年神经信息处理系统进展大会(NIPS)https://arxiv.org/pdf/1406.2661.pdf第2672至2680页(2014年)发表的“生成式对抗网络””中所述。可以在训练所述生成器和判别器时使用以下对抗损失函数:
等式1:
GAN实现了二元极大极小博弈,目标在于导出纳什均衡点。找到该博弈的方案并非易事,已在该领域进行大量研究,从而产生各种类型的GAN设计。这些GAN设计中的大多数旨在提高训练稳定性和生成的合成样本的质量,这些GAN设计中的许多设计依赖于启发式方法来找到稳定的架构,从而解决不稳定的训练问题。GAN可用于生成附加实际合成样本,以在实际训练样本不足时用作未来训练样本。然而,现有GAN系统缺乏有效预测所述生成的合成样本的标记的能力。
预测样本标记时,半监督学习技术利用标记的和未标记的数据样本。半监督学习技术,提高监督任务的性能,例如通过基于附加未标记的样本的学习进行分类,需要较少数目的标记的样本进行训练。这使得半监督学习技术适于在所述训练集中限制标记的样本的数目并且获得标记的样本昂贵或困难的应用,例如自主驾驶。在这个背景下,诸如GAN的生成模型可用于生成可以半监督方式添加到训练数据集中的实际样本。例如,在“D.P.Kingma、S.Mohamed、D.J.Rezende和M.Welling在神经信息处理系统进展大会第3581至3589页(2014年)发表的“利用深度生成模型的半监督学习”中,提出了利用深度生成模型的半监督学习方法,举例说明了深度生成模型和近似贝叶斯推理的使用。已经提出了利用GAN的其它半监督技术,包括例如改进的GAN、分类GAN,SGAN和三元GAN。然而,先前的GAN实现的半监督技术通常都侧重于使用离散数目的标记的分类。
分类技术从设置数目(K)的标记(例如,在大写英文字母的示例中,K=26)中选择用于输入样本的标记。另一方面,回归方法为每个样本分配实数(例如,浮点数据类型)作为标记。对回归采用半监督分类技术的代价是将数据集的连续标记转换为离散数目的类。将连续标记(在回归问题中)转换为离散数目的类(以产生分类问题)将量化误差引入到所述训练中。此外,与回归技术相比,对回归问题采用分类技术通常要求所述网络具有更多输出,从而产生更多网络参数。因此,针对回归问题使用半监督分类技术是复杂且低效的。
因此,需要一种能够利用GAN进行半监督回归的方案。在此方面,下面描述示例性实施例,其中GAN生成合成样本作为实际、高质量样本(例如,与实际训练样本不可区分的生成的样本),预测对应于所述样本的连续标记。在示例性实施例中,在半监督学习的背景下解决回归。与仅存在有限数目的类的分类任务相反,回归任务被定义为预测给定数据集的多个样本中的每一个的连续标记。连续标记表示连续值或实数(例如,浮点数)。
示例性实施例提供了一种GAN方案,用于生成样本并使用仅具有有限数目的标记的样本的训练数据集来预测生成的样本的连续标记。这使得所述训练数据集和生成的样本能够用于训练将在所述回归任务中使用的更强大的深度网络。
图1示出了一示例性实施例提供的一种用于实现半监督回归的GAN 100。GAN 100包括生成器102,用于生成实际生成的样本xgen的集合Xgen,类似于或接近于实际标记的训练样本xlab和实际未标记的训练样本xunl的训练数据集{Xlab,Xunl}的内容。GAN 100还包括判别器104,包括深度卷积神经网络(convolutional neural network,简称CNN),用于验证所述生成的样本xgen和预测这些样本的连续标记所述判别器104通过输出所述输入样本x是实际样本(即所述输入样本x是标记的训练样本xlab或未标记的训练样本xunl)还是虚假样本(即所述输入样本x是生成的样本)xgen的预测概率D(x)来验证样本x。
在图1中:
Z:随机噪声向量
Xgen:生成的样本
Xlab:标记的训练样本
Xunl:未标记的训练样本
预测的连续标记
D(x):输入样本x是实际样本或虚假样本的预测概率,其中x∈{xgen,xlab,xunl.}
在示例性实施例中,通过使用“T.Salimans、I.Goodfellow、W.Zaremba、V.Cheung、A.Redford和X.Chen在2016年计算研究知识库ABS期刊/1606.03498发表的“用于训练GAN的改进技术”https://arxiv.org/pdf/1606.03498.pdf”中引入的特征匹配损失技术来训练生成器102。所述特征匹配损失Lossfeature_matching是所述真实(实际)样本{xlab,xunl}的所述判别器104的中间层的输出与生成的样本xgen之间的绝对差值的平均值。
训练所述生成器102时,使用所述特征匹配损失Lossfeature_matching。因此,所述生成器102的损失函数可以表示为:
LossG=Lossfeature_matching
在图1的示例中,判别器104配置有两个输出:一个输出负责预测连续标记另一个确定所述生成的样本xgen是实际样本或虚假样本的概率D(x)。如果真实连续标记映射(或归一化)到【0,1】的范围,可以使用判别器104的网络的最后一层中的S形非线性。通过使用常用的无监督GAN损失函数和监督回归损失的组合来训练所述判别器104:
LossD=Lunsupervised+Lsupervised (等式3)
其中:
z表示从均匀或正态分布提取的噪声;
x和G(z)分别描述所述实际样本(xunl、xlab)和生成的样本(xgen);y指标记的训练样本(xlab)的标记的所述真实(实际)值;
表示样本的预测的连续标记;
仅针对标记的训练样本xlab(已知所述标记的所述真实(实际)值)计算Lsupervised
pdata(x)是所述训练样本(标记的和未标记的)的所述分布。
“X.Mao、Q.Li、H.Xie、R.Y.K.Lau、Z.Wang和S.P.Smolley在arXiv预印本网站ArXiv:1611.04076,2016发表的“最小二乘生成式对抗网络”(2017年),https://arxiv.org/abs/1611.04076”包含在上述等式的所述无监督部分。此外,在标记的训练样本xlab的情况下,向所述判别器损失函数LossD添加所述监督回归误差(即所述标记的训练样本的所述预测的和真实连续标记之间的差值),所述判别器损失函数LossD有助于训练所述GAN以生成所述未标记的训练样本xunl或生成的样本xgen的连续标记。
图2示出了另一示例性实施例提供的一种GAN 200,还用于实现半监督回归。除在附图和以下描述中显而易见的差异之外,GAN 200与GAN 100类似。GAN 200包括与上述生成器102相同的生成器102。然而,GAN 200的所述判别器204与GAN 100的所述判别器104的不同之处在于:包括所述判别器CNN 206输出之后的核函数208。代替在判别器104中具有来自所述CNN 206的两个输出,在判别器204中仅由所述CNN 206预测一个回归输出,即所述预测的连续标记所述预测的标签用作核函数208的输入,所述核函数208基于所述样本的所述预测的连续标记为每个样本分配概率索引值D(x)。在一些示例中,所述核函数208可以在所述判别器CNN 206的层中实现。
因此,判别器204使用所述CNN 206的所述回归输出的单独核函数208来决定样本的所述预测的连续标记是否真实,而不是直接区分所述CNN 206处的真实样本和生成的样本。所述核函数208负责基于假设真实标记可以映射/归一化到【0,1】的范围,为每个输入连续标记分配概率索引值。如果所述预测的连续标记在真实标记的归一化范围内(即在0和1之间),所述分配的概率索引值D(x)为1,否则将根据所述连续标记的所述预测值与真实标记的目标范围之间的距离来分配数值小于1的索引,如以下等式所表示:
在图2中:
Z:随机噪声向量
Xgen:生成的样本
Xlab:标记的训练样本
Xunl:未标记的训练样本
输入样本的预测标记
概率索引值,表示所述输入样本基于所述预测标记的实际程度
判别器204的所述判别器损失函数LossD与判别器104相同。
在示例性实施例中,使用Python库“Theano”在Python中实现训练算法以高效地执行多维阵列计算,使用深度学习库“lasagna”在Theano中训练和构建神经网络。训练算法的示例性实施例可以概括如下:
输入:所述生成器102的早上(z)。所述判别器104或204的标记的和未标记的训练样本(xlab、xunl)。
输出:生成器102创建看不见的真实样本(xgen)。
判别器104或204提供:(i)判别所述真实(xlab、xunl)样本和所述虚假样本(xeen)的概率D(x);(ii)预测的连续标记
方法:
1、加载数据;
2、定义生成器和判别器的网络。所述网络是lasagne中神经网络层的堆叠;
3、通过使用判别器的所述输出来定义成本函数(例如,损失函数)。通过使用所述生成器与所述判别器的中间层的差异来描述特征匹配损失;
4、定义初始化的Theano函数,用于训练所述判别器和所述生成器网络;
5、定义用于计算测试误差和生成样本以及用于所述生成的样本的所述预测标记的三个其它Theano函数;
6、模型训练:
对于每个时期:
I、如果时期==0:
运行用于初始化所述生成器和所述判别器的所述参数的初始化Theano函数。
II、对于每批训练集:
可替代地运行判别器和生成器函数。
这些函数通过最大限度地减小所述网络的所述损失函数来更新所述判别器和所述生成器网络参数。
III、对于每批测试集:
使用Theano函数计算测试误差。
IV、报告结果
在示例性实施例中,上述GAN架构可以应用于上述论文“T.Salimans、I.Goodfellow、W.Zaremba、V.Cheung、A.Redford和X.Chen在2016年计算研究知识库ABS期刊/1606.03498发表的“用于训练GAN的改进技术”,https://arxiv.org/pdf/1606.03498.pdf”中描述的改进的GAN之上。
在示例性实施例中,所述生成器102包含具有批量归一化的4层深度CNN,其表示在图3中示出。在示例性实施例中,所述判别器104或204包含具有权重归一化和丢失的9层深度CNN。图4中示出了判别器104的示例,图5中示出了判别器204的示例。图3至图5中示出的示例性生成器和判别器架构是非限制性示例。在其它实施例中,可以使用具有与图3至图5中示出的不同层数和不同层配置的生成器和判别器。
在至少一些应用中,GAN 100和200可用于在生成式对抗网络中实现半监督回归学习。作为连续标记,回归方案GAN 100、200在至少一些应用中通过避免在将半监督分类技术应用于回归问题时不可避免的离散化误差,在解决回归问题方面的执行性能优于使用半监督GAN进行分类。此外,如上所述的GAN 100、200可以需要较少的参数和训练时间,还可以提供分类和回归半监督学习。所述判别器104、204可以高效地处理所述回归任务,同时处理标记和判别样本。
在示例性实施例中,上述改进的GAN技术提供了基于生成模型的半监督学习技术来解决回归问题。在GAN 100、200中,所述判别器网络104、204用于:接收输入样本(例如,生成的样本xgen、标记的训练样本xlab或未标记的训练样本xunl);预测所述输入样本的连续标记并生成概率索引D(x),指示所述输入样本是虚假样本(例如,生成的样本)还是实际样本(例如,标记的训练样本xlab或未标记的训练样本xunl)。GAN 100、200针对用于预测输入样本的连续标记的回归问题的半监督学习。连续标记的一个示例是转向角,在此方面,可以应用GAN 100、200,例如用于预测自主驾驶的转向角。在GAN 100中,所述判别器104CNN具有两个输出:(i)一个用于回归(预测的连续标记);(ii)一个用于判别(概率D(x),判别所述真实样本(xlab、xunl)和所述虚假样本(xgen))。在GAN 200中,所述判别器204CNN 206具有单个输出,用于回归(预测的连续标记),应用于核函数208,所述核函数208输出判别指数D(x),指示所述预测的连续标记的实际程度。所述核函数208基于以下假设来操作,即真实数据集样本(例如,训练数据集样本)的所述连续标记可以在【0,1】之间进行归一化。如果所述预测的连续标记在【0,1】的范围内,确定它们为真实标记并为其分配判别索引D(x)=1。如果所述预测的连续标记在所述范围之外,根据所述预测的连续标记在所述范围之外的程度,所述判别索引值以指数方式变为零。
如图6所示,一示例性实施例提供了一种利用生成式对抗网络执行半监督回归的方法,包括:从生成器网络输出从随机噪声向量导出的生成的样本(方框302);向判别器网络输入所述生成的样本、多个标记的训练样本和多个未标记的训练样本(方框304);针对至少所述生成的样本,从所述判别器网络输出生成的样本的预测的连续标记和所述样本是实际样本或虚假样本的预测概率(方框306)。
上述方法可用于生成实际标记的样本,然后所述实际标记的样本可用作人工智能(artificial intelligence,简称AI)系统中的机器学习任务的训练样本。应当理解的是,训练数据对于机器学习任务而言至关重要。对于监督学习算法,训练数据需要适当的标记以便进行质量训练。用于监督学习的标记的训练样本不足导致学习不良。然而,收集足够的训练样本并标记它们耗时、困难和昂贵。用于训练样本的数据收集成本随应用的变化而变化,尤其具有高训练样本成本的一个应用是训练自主驾驶(autonomous driving,简称AD)系统。
在此方面,上文结合图1至图6描述的方法和系统的示例性实施例现将在系统背景下进行描述,所述系统用于为AD系统创建具有成本效益的标记的训练样本。在示例性实施例中,应用于数据样本的标记是连续标记,这意味着它表示连续变量(与表示离散变量的离散分类标记相比)。
近年来,自主驾驶(autonomous driving,简称AD)已受到研究人员和业界的关注。为了使驾驶任务自主化并代替人类驾驶员,所述AD系统应能够识别其周边环境并相应地采取动作。机器学习可以促进所述AD系统的这项任务。机器学习用于AD系统中的不同目的,例如模拟驾驶员行为、车辆检测、车道检测和端到端学习。M.Bojarski、D.Del Testa、230D.Dworakowski、B.Firner、B.Flepp、P.Goyal、L.D.Jackel、M.Monfort、U.Muller和J.Zhang等人于2016年4月在arXiv:1604.07316v1[cs.CV]07316,25发表的“用于无人驾驶汽车吊端到端学习”(“Boiarski”)中描述了端到端学习的示例。
在Bojarski中,以监督方式训练卷积神经网络(convolutional neural network,简称CNN),以将单个前置摄像头的原始像素直接映射到转向命令。所述CNN能够从前置摄像头图像和非常稀疏的训练信号(人为控制的转向角)的组合中学习意义非凡的道路特征,而不需要将所述前置摄像头图像分解为所述道路、车道线检测、语义抽象、路径规划或控制。
在Bojarski的所述示例中,所述AD系统的训练数据来自人为控制的转向信号,所述人为控制的转向信号与来自安装在运动车辆上的摄像头的图像数据相结合。物理收集训练数据既昂贵又低效。训练AD系统需要大量训练样本,以确保所述系统能够学习所有可能的场景,例如不同的驾驶状态、道路状况和天气状况。所述AD系统未能获知特定情况可能导致安全问题。
因此,在示例性实施例中,上述基于GAN的半监督回归系统和方法用于生成标记的样本xout的强集Xout,所述标记的样本xout随后可以用于训练AD系统,包括在端到端训练的背景下。特别地,每个所述输出样本xout包括实际模拟前置摄像机图像的图像和以转向角形式的图像的连续标记。基于对GAN 100或200的输入和初始训练数据集Xdata来生成所述输出样本xout,所述输入包括噪声信号z,所述初始训练数据集Xdata包括标记的训练样本xlab和未标记的训练样本xunl。在此方面,图7示出了一种GAN实现的半监督回归系统400的示例,用于根据输入噪声z和初始训练数据集Xdata使用GAN 100或200生成标记的训练样本xout
在系统400中,所述初始训练数据集Xdata包括L个标记的样本xlab和M个未标记的样本xunl,其中M>L。在一些示例性实施例中,未标记的样本的所述数目M比标记的样本的所述数目至少大10倍。每个标记的样本xlab表示由运动车辆上的前置摄像头捕获的图像以及表示转向角的相关联的标记。在一个示例中,所述图像样本采用JPG文件的形式,所述相关联的标记表示为JPG文件名和转向角的文本级联。每个未标记的样本xunl表示由运动车辆上的前置摄像头捕获的图像。在一些示例性实施例中,所述初始训练数据集Xdata的所述标记的样本xlab已使用运动车辆收集,同时记录所述图像和转向角。
图8示出了示例性实施例提供的一种在系统400上实现的半监督回归方法500。在示例性实施例中,使用所述Python编程语言和所述Python库Theano和Lasagne在处理系统600(下述)上实现图8中示出的方法500。Adam优化算法用于迭代地更新所述判别器和生成器网络。在可替代实施例中,可以使用其它编程语言、库和优化算法。
所述方法500开始于初始化阶段501,所述初始化阶段501包括定义和初始化用于实现所述判别器104或204以及所述生成器102的所述CNN的步骤(方框502)。尽管许多不同的神经网络架构是可能的,但在示例性实施例中,上文结合图3和图4或图5描述的架构分别被定义用于生成器102和判别器104、204。
如方框504所示,所述判别器104、204和生成器102的所述损失函数LossD和LossG被定义为所述初始化阶段501的一部分。在示例性实施例中,所述生成器102的所述损失函数LossG被定义为所述特征匹配损失Lossfeature_matching
LossG=Lossfeature_matching
在示例性实施例中,所述判别器104、204的所述损失函数LossD如上所述进行定义,即组合所述无监督GAN损失函数和监督回归损耗,如以下等式所表示:
LossD=Lunsupervised+Lsupervised (等式3)
Lunsupervised=Ex~pdata(x)[(D(x)-1)2]+Ez~pz(z)[D(G(z))2] (等式5)
可以在不同的实施例中定义和应用上述损失函数的变化。
如方框504进一步所示,利用判别器参数始集ω0初始化所述判别器D(x)104、204,利用生成器参数始集θ0初始化所述生成器G(z)102。如方框506所示,然后设置所述Adam优化器参数。在非限制性示例中,将学习速率α设置为0.0005,将衰变速率β设置为0.5,将批次大小设置100。然而,在其它示例性实施例中,可以使用Adam优化器参数的许多其它不同组合。
所述初始化阶段501之后是迭代训练阶段508,重复所述迭代训练阶段508,直至所述网络参数收敛。在示例性实施例中,对一组数据样本批次执行所述训练阶段508,其中每个数据样本批次包括多个数据样本。在示出的实施例中,每个训练阶段508处理的批次的数目等于“m”。如方框510至518所表示,对于m个批次(其中1≤i≤m)上的每个时期,针对每批数据样本重复以下动作。首先,如方框510所示,由生成器网络G(z)102生成数据样本z,从训练数据集Xdata获得实际图像和标记数据样本x、y,所述训练数据集Xdata是标记的样本xlab(包括图像样本和相关联的真实标记y)和未标记的样本xunl的源。如方框512所示,基于所述当前批次样本计算所述判别器D损失函数LossD;如方框514所示,向Adam优化器提供所述获得的LossD,以获得更新的判别器参数ω。然后,如方框516所示,基于所述当前批次样本计算所述生成器G(x)损失函数LossG;如方框518所示,向Adam优化器提供所述获得的LossG,以获得更新的生成的参数θ。在当前时期内,针对全部所述m个批次重复方框510至518中所示的动作,其中以交替方式重复计算和更新所述判别器和生成器网络损失函数和参数。
如方框522所示,在已处理全部所述m个批次之后,确定测试数据集的所述验证误差是否仍在减小。如本领域已知的,所述测试数据集是预先确定的数据集,用于确定所述判别器训练何时达到所述验证误差达到其最小值的水平。验证误差不断减小表明,所述生成器权重参数θ尚未收敛。如果所述验证误差继续减小,所述训练阶段508进入另一迭代,在m个批次上在另一时期内重复上文结合方框510至518描述的动作。在一些示例中,所述相同的训练数据集样本Xunl和Xlab可以在所述训练阶段的后续重复期间结合新产生的生成的样本xgen进行重用。
在一些示例性实施例中,当测试数据集的所述验证误差不再减小时,系统400的所述GAN 100、200被视为经过训练。如方框526所示,所述系统400然后进行训练并准备好输出实际标记的数据样本xout,其中每一个包括数据样本(例如,前置摄像头图像)和连续标记,所述连续标记是0和1之间的连续数(例如,与前置摄像头图像相关联的转向角)。特别地,一旦所述GAN 100、200经过训练,所述生成器G102用于生成实际生成的样本xgen,所述判别器D104、204用于向此类样本以及未标记xunl的样本应用准确预测的连续标记在生成的样本输入的情况下,所述输出样本Xout将包括所述生成的样本xgen及其相关联的预测的连续标记在未标记的训练样本输入的情况下,所述输出样本Xout将包括先前未标记的样本xunl及其新相关联的预测的连续标记
因此,一旦经过训练,所述GAN 100、200就可以用于基于噪声输入z来生成实际标记的数据xout,还用于标记先前未标记的实际数据样本。在示例性应用中,每个输出标记的数据样本xout包括前置摄像头图像和转向角标记,然后可以用于AD系统的端到端学习。在一些示例中,从系统400输出所述标记的数据Xout时,出于训练目的,可以直接事实将其提供给AD系统;在一些示例中,可以将其存储起来以供未来使用,例如存储在数据库中。
在从GAN 100、200输出所述预测的标记是0和1之间的归一化值的一些示例中,可以应用转换函数来将所述归一化值映射到实际转向角。在一些示例中,所述转向角标记可以分解为6个或更多小数位。
在一些示例性实施例中,一旦所述系统400经过训练,它也可以用于对未标记的数据样本xunl应用标记,从而将先前未标记的实际图像转换为标记的数据样本xlab。在一些示例中,一旦所述系统400经过训练,所述判别器104、204可以纳入AD系统中,用于从运动车辆上的前置摄像头接收实时图像,主动为所述运动车辆提供转向角控制。
下表中表示了一种类似于方法500中示出的初始化阶段501和训练阶段508的伪代码算法:
表1利用GAN的半监督回归。默认值:α=0.0005,β=0.5
上述GAN架构无关紧要,仅用作一个示例。将可能对所述CNN的所述层(例如,权重、激活函数和归一化方法)进行任何修改,从而生成不同的神经网络。
图9是示例性简化处理系统600的框图,可用于实现本文中所公开的实施例,提供更高级别的实现示例。图6和图8的方法可以使用所述示例性处理系统600或所述处理系统600的变体实现。例如,所述处理系统600可以是服务器或桌面终端,或任何合适的处理系统。适用于实现本发明中所描述的实施例的其它处理系统可以使用,可以包括不同于下文论述的组件的组件。尽管图9示出了每个组件的单个实例,但是在所述处理系统600中,每个组件可能有多个实例。
所述处理系统600可以包括一个或多个处理设备602,例如处理器、图形处理单元、微处理器、专用集成电路(application-specific integrated circuit,简称ASIC)、现场可编程门阵列(field-programmable gate array,简称FPGA)、专用逻辑电路或其组合。所述处理系统600还可包括一个或多个输入/输出(input/output,简称I/O)接口604,可以启用与一个或多个合适的输入设备614和/或输出设备616进行连接。所述处理系统600可以包括一个或多个网络接口606,用于与网络(例如,内联网、因特网、P2P网络、WAN和/或LAN)或其它节点进行有线或无线通信。所述网络接口606可以包括用于网络内和/或网络间通信的有线链路(例如,以太网线)和/或无线链路(例如,一根或多根天线)。
所述处理系统600还可以包括一个或多个存储单元608,可以包括大容量存储单元,例如固态磁盘、硬盘驱动器、磁盘驱动器和/或光盘驱动器。所述处理系统600可以包括一个或多个存储器610,可以包括易失性或非易失性存储器(例如,闪存、随机存取存储器(random access memory,简称RAM)和/或只读存储器(read-only memory,简称ROM))。所述非瞬时性存储器610可以存储用于由所述处理设备602执行的指令,诸如执行本发明中所描述的示例,例如执行编码或解码。所述存储器610可以包括其它软件指令,例如用于实现操作系统和其它应用/功能的软件指令。在一些示例中,一个或多个数据集和/或模块可以由外部存储器(例如,与所述处理系统600进行有线或无线通信的外部驱动器)提供,或可以由瞬时性或非瞬时性计算机可读介质提供。非瞬时性计算机可读介质的示例包括RAM、ROM、可擦除可编程ROM(erasable programmable ROM,简称EPROM)、电可擦除可编程ROM(electrically erasable programmable ROM,简称EEPROM)、闪存、CD-ROM或其它便携式存储器。
可能存在总线612,提供所述处理系统600的组件之间的通信,所述组件包括所述处理设备602、I/O接口604、网络接口606、存储单元608和/或存储器610。所述总线612可以是任何合适的总线架构,例如,包括内存总线、外设总线或视频总线。
在图9中,所述输入设备614(例如,键盘、鼠标、麦克风、触摸屏和/或小键盘)和输出设备616(例如,显示器、扬声器和/或打印机)显示为所述处理系统600的外部设备。在其它示例中,可以包括所述输入设备614和/或所述输出设备616中的一个或多个作为所述处理系统600的组件。在其它事例中,可能没有任何输入设备614和输出设备616,在此类情况下可能不需要所述I/O接口604。
所述存储器610可以包括半监督回归模式618的指令,所述指令被执行时使得所述处理系统600执行诸如图6或图8中方法之类的方法。所述存储器610还可以将训练数据集Xdata和生成的数据样本xout存储在数据库628中。
尽管本发明可以描述具有按某种顺序排列的步骤的方法和过程,但是可以适当省略或改变所述方法和过程的一个或多个步骤。一个或多个步骤可以按不同于本发明中所描述顺序的顺序执行。
尽管本发明在方法方面可以至少部分地进行了描述,但本领域的一般技术人员将理解,本发明也针对用于执行所述方法的至少一些方面和特征的各种组件,无论是通过硬件组件、软件还是其任意组合。因此,本发明的技术方案可以软件产品形式体现。合适的软件产品可以存储在预录存储设备或其它类似的非易失性或非瞬时性计算机可读介质中,例如包括DVD、CD-ROM、USB闪存盘、可移动硬盘或其它存储介质。所述软件产品包括在其上可有形地存储的指令,所述使得处理设备(例如,个人计算机、服务器或网络设备)能够执行本文中所公开方法的示例。
在不脱离权利要求书的主题的情况下,本发明可以以其它特定形式来体现。所描述的示例性实施例在各方面都仅仅是示意性的,而不是限制性的。来自一个或多个上述实施例的选定特征可以进行结合以创建未明确描述的可替代实施例,适合此类组合的特征在本发明范围内得到理解。
本文中还公开了在所公开范围内的所有值和子范围。此外,尽管本文中所公开和示出的系统、设备和过程可以包括特定数量的元件/组件,但是系统、设备和组件可以进行修改以包括更多或更少的此类元件/组件。例如,尽管所公开的任何元件/组件可以引用为单数,但本文中所公开的实施例可以进行修改以包括多个此类元件/组件。本文中描述的主题意在涵盖和包含技术上的所有适当更改。
可以对所描述的实施例进行某些改编和修改。因此,上述讨论的实施例被视为是示意性的,而不是限制性的。

Claims (21)

1.一种用于训练生成式对抗网络(generative adversarial network,简称GAN)的方法,其特征在于,所述生成式对抗网络包括:生成器,包含第一神经网络;判别器,包含第二神经网络;所述方法包括:
所述第一神经网络输出从随机噪声向量获取生成的样本;
向所述第二神经网络输入所述生成的样本、多个标记的训练样本和多个未标记的训练样本;
所述第二神经网络输出用于多个所述生成的样本和未标记的样本中的每一个的预测连续标记。
2.根据权利要求1所述的方法,其特征在于,所述第二神经网络输出每个连续标记为归一化值。
3.根据权利要求2所述的方法,其特征在于,包括:所述第二神经网络输出所输入样本是实际样本的概率。
4.根据权利要求2所述的方法,其特征在于,包括:确定生成的样本是实际样本并且基于为生成的样本预测的所述连续标记的概率。
5.根据权利要求4所述的方法,其特征在于,确定所述概率通过核函数执行,基于连续标记的所述归一化值是否在预先确定的范围内。
6.根据权利要求1至5中任一项所述的方法,其特征在于,所述标记的训练样本包括运动车辆的一系列前置摄像头图像样本,每一个所述标记的训练样本都标记有转向角。
7.根据权利要求1至6中任一项所述的方法,其特征在于,在所述神经网络的参数收敛之前,包括:
重复以下操作:所述第一神经网络输出生成的样本;向所述第二网络输入所述生成的样本、标记的训练样本和未标记的训练样本;所述第二神经网络输出预测的连续标记;
在每次重复期间,计算所述第二神经网络和所述第一神经网络各自的损失函数;基于所述计算的损失函数,调整所述第二神经网络和所述第一神经网络的权重参数。
8.根据权利要求7所述的方法,其特征在于,所述第一神经网络的损失函数包括特征匹配损失函数,所述特征匹配损失函数基于所述第二神经网络的中间层分别对所述训练样本和生成的样本的输出之间的差值。
9.根据权利要求7所述的方法,其特征在于,所述第二神经网络的损失函数是监督部分和无监督部分的组合。
10.根据权利要求9所述的方法,其特征在于,所述监督部分基于向所述第二神经网络提供的所述标记的样本的实际标记与预测连续标记之间的差值。
11.一种用于训练生成式对抗网络(generative adversarial network,简称GAN)的系统,其特征在于,所述生成式对抗网络包括:生成器,包含第一神经网络;判别器,包含第二神经网络,所述系统包括:
处理设备;
存储器,耦合至所述处理设备,所述存储器存储计算机可执行指令,所述计算机可执行指令在由所述处理设备执行时使所述系统执行以下操作:
定义所述第一神经网络和所述第二神经网络;
所述第一神经网络输出从随机噪声向量获取生成的样本;
向所述第二神经网络输入所述生成的样本、多个标记的训练样本和多个未标记的训练样本;
所述第二神经网络输出用于多个所述生成的样本和未标记的样本中的每一个的预测连续标记。
12.根据权利要求11所述的系统,其特征在于,所述第二神经网络输出每个连续标记为归一化值。
13.根据权利要求12所述的系统,其特征在于,所述指令在由所述处理设备执行时使所述系统从所述第二神经网络输出所输入样本是实际样本的概率。
14.根据权利要求12所述的系统,其特征在于,所述指令在由所述处理设备执行时使所述系统确定生成的样本是基于预测的所述连续标记来生成的实际样本的概率。
15.根据权利要求14所述的系统,其特征在于,所述指令在由所述处理设备执行时使所述系统定义核函数,所述核函数基于所述连续标记的所述归一化值是否在预先确定的范围内确定所述概率。
16.根据权利要求11至15中任一项所述的系统,其特征在于,所述标记的训练样本包括运动车辆的一系列前置摄像头图像样本,每一个所述标记的训练样本都标记有转向角。
17.根据权利要求11至15中任一项所述的系统,其特征在于,所述指令在由所述处理设备执行时使所述系统在所述神经网络的参数收敛之前:
重复以下操作:所述第一神经网络输出生成的样本;向所述第二网络输入所述生成的样本、标记的训练样本和未标记的训练样本;所述第二神经网络输出预测的连续标记;
在每次重复期间,计算所述第二神经网络和所述第一神经网络各自的损失函数;基于所述计算的损失函数,调整所述第二神经网络和所述第一神经网络的权重参数。
18.根据权利要求17所述的系统,其特征在于,所述第一神经网络的损失函数包括特征匹配损失函数,所述特征匹配损失函数基于所述第二神经网络的中间层分别对所述训练样本和生成的样本的输出之间的差值。
19.根据权利要求17所述的系统,其特征在于,所述第二神经网络的所述损失函数是监督部分和无监督部分的组合。
20.根据权利要求19所述的系统,其特征在于,所述监督部分基于向所述第二神经网络提供的所述标记的样本的实际标记与预测连续标记之间的差值。
21.一种计算机程序产品,其特征在于,包括存储计算机可执行指令的计算机可读介质,所述计算机可执行指令用于使处理系统执行根据权利要求1至10中任一项所述的方法。
CN201780089195.3A 2017-05-19 2017-10-28 利用生成式对抗网络的半监督回归 Pending CN110537184A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201762508819P 2017-05-19 2017-05-19
US62/508,819 2017-05-19
US15/789,518 US11003995B2 (en) 2017-05-19 2017-10-20 Semi-supervised regression with generative adversarial networks
US15/789,518 2017-10-20
PCT/CN2017/108192 WO2018209894A1 (en) 2017-05-19 2017-10-28 Semi-supervised regression with generative adversarial networks

Publications (1)

Publication Number Publication Date
CN110537184A true CN110537184A (zh) 2019-12-03

Family

ID=64271811

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780089195.3A Pending CN110537184A (zh) 2017-05-19 2017-10-28 利用生成式对抗网络的半监督回归

Country Status (4)

Country Link
US (1) US11003995B2 (zh)
EP (1) EP3602392A4 (zh)
CN (1) CN110537184A (zh)
WO (1) WO2018209894A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111539525A (zh) * 2020-04-15 2020-08-14 北京圣涛平试验工程技术研究院有限责任公司 无人机战队对抗中个体失效率与战队胜率的关系确定方法
CN112786003A (zh) * 2020-12-29 2021-05-11 平安科技(深圳)有限公司 语音合成模型训练方法、装置、终端设备及存储介质
CN112784883A (zh) * 2021-01-07 2021-05-11 厦门大学 一种基于样本选择扩充的冷水珊瑚分布预测方法及系统
CN113270090A (zh) * 2021-05-19 2021-08-17 平安科技(深圳)有限公司 基于asr模型与tts模型的组合模型训练方法及设备

Families Citing this family (78)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019001418A1 (zh) * 2017-06-26 2019-01-03 上海寒武纪信息科技有限公司 数据共享系统及其数据共享方法
US11062179B2 (en) * 2017-11-02 2021-07-13 Royal Bank Of Canada Method and device for generative adversarial network training
CN108021931A (zh) * 2017-11-20 2018-05-11 阿里巴巴集团控股有限公司 一种数据样本标签处理方法及装置
US10937540B2 (en) 2017-12-21 2021-03-02 International Business Machines Coporation Medical image classification based on a generative adversarial network trained discriminator
US10592779B2 (en) 2017-12-21 2020-03-17 International Business Machines Corporation Generative adversarial network medical image generation for training of a classifier
US10540578B2 (en) * 2017-12-21 2020-01-21 International Business Machines Corporation Adapting a generative adversarial network to new data sources for image classification
WO2019241155A1 (en) * 2018-06-11 2019-12-19 Arterys Inc. Simulating abnormalities in medical images with generative adversarial networks
US10768629B2 (en) 2018-07-24 2020-09-08 Pony Ai Inc. Generative adversarial network enriched driving simulation
CN109190504B (zh) * 2018-08-10 2020-12-22 百度在线网络技术(北京)有限公司 汽车图像数据的处理方法、装置及可读存储介质
US10430708B1 (en) * 2018-08-17 2019-10-01 Aivitae LLC System and method for noise-based training of a prediction model
US10785646B2 (en) * 2018-08-24 2020-09-22 International Business Machines Corporation Use of generative adversarial networks (GANs) for robust transmitter authentication
US10467503B1 (en) * 2018-09-05 2019-11-05 StradVision, Inc. Method and device for generating image data set to be used for learning CNN capable of detecting obstruction in autonomous driving circumstance
US11087170B2 (en) * 2018-12-03 2021-08-10 Advanced Micro Devices, Inc. Deliberate conditional poison training for generative models
CN109584339A (zh) * 2018-12-04 2019-04-05 中国民航大学 一种基于生成式对抗网络的安检违禁品x光图像生成方法
WO2020115539A1 (en) * 2018-12-07 2020-06-11 Telefonaktiebolaget Lm Ericsson (Publ) System, method and network node for generating at least one classification based on machine learning techniques
CN109801228A (zh) * 2018-12-18 2019-05-24 合肥阿巴赛信息科技有限公司 一种基于深度学习的珠宝图片美化算法
CN111340831A (zh) * 2018-12-18 2020-06-26 北京京东尚科信息技术有限公司 点云边缘检测方法和装置
CN109635774B (zh) * 2018-12-21 2022-09-13 中山大学 一种基于生成对抗网络的人脸合成方法
KR20210099564A (ko) * 2018-12-31 2021-08-12 인텔 코포레이션 인공 지능을 이용한 보안 시스템
US11196769B2 (en) 2019-01-02 2021-12-07 International Business Machines Corporation Efficient bootstrapping of transmitter authentication and use thereof
US10373026B1 (en) * 2019-01-28 2019-08-06 StradVision, Inc. Learning method and learning device for generation of virtual feature maps whose characteristics are same as or similar to those of real feature maps by using GAN capable of being applied to domain adaptation to be used in virtual driving environments
CN109741328B (zh) * 2019-02-02 2023-04-14 东北大学 一种基于生成式对抗网络的汽车表观质量检测方法
US20200257985A1 (en) * 2019-02-08 2020-08-13 DeepSig Inc. Adversarially generated communications
US20200273062A1 (en) * 2019-02-26 2020-08-27 Soundhound, Inc. Artificial Intelligence Generation of Advertisements
CN109993359B (zh) * 2019-03-26 2022-11-18 华南理工大学 一种基于先进机器学习的态势预测方法
US10832450B2 (en) * 2019-03-27 2020-11-10 GM Global Technology Operations LLC Semantic preserved style transfer
CN110097185B (zh) * 2019-03-29 2021-03-23 北京大学 一种基于生成对抗网络的优化模型方法及应用
CN110084281B (zh) * 2019-03-31 2023-09-12 华为技术有限公司 图像生成方法、神经网络的压缩方法及相关装置、设备
CN110009044B (zh) * 2019-04-09 2021-09-03 北京七鑫易维信息技术有限公司 一种模型训练方法及装置、图像处理方法及装置
US11823348B2 (en) * 2019-05-17 2023-11-21 Barco N.V. Method and system for training generative adversarial networks with heterogeneous data
CN110320162B (zh) * 2019-05-20 2021-04-23 广东省智能制造研究所 一种基于生成对抗网络的半监督高光谱数据定量分析方法
CN110310343B (zh) * 2019-05-28 2023-10-03 西安万像电子科技有限公司 图像处理方法及装置
CN110377282B (zh) * 2019-06-26 2021-08-17 扬州大学 基于生成对抗和卷积神经网络的UI生成Web代码的方法
CN112348161A (zh) * 2019-08-09 2021-02-09 北京地平线机器人技术研发有限公司 神经网络的训练方法、神经网络的训练装置和电子设备
CN111626317B (zh) * 2019-08-14 2022-01-07 广东省科学院智能制造研究所 基于双流条件对抗生成网络的半监督高光谱数据分析方法
US20210056432A1 (en) * 2019-08-21 2021-02-25 Dspace Digital Signal Processing And Control Engineering Gmbh Method for training an artificial neural generator network, method for training an artificial neural discriminator network, and test unit
CN110602078B (zh) * 2019-09-04 2022-12-20 南京邮电大学 一种基于生成对抗网络的应用加密流量生成方法及系统
CN110647927A (zh) * 2019-09-18 2020-01-03 长沙理工大学 一种基于acgan图像半监督分类算法
DE102019214200A1 (de) * 2019-09-18 2021-03-18 Robert Bosch Gmbh Übersetzung von Trainingsdaten zwischen Beobachtungsmodalitäten
CN110617966A (zh) * 2019-09-23 2019-12-27 江南大学 一种基于半监督生成对抗网络的轴承故障诊断方法
CN110717579B (zh) * 2019-11-13 2023-05-19 上海海事大学 一种齿轮箱数据模型训练及使用方法
CN111046183A (zh) * 2019-12-11 2020-04-21 金蝶软件(中国)有限公司 用于文本分类的神经网络模型的构建方法和装置
EP3840292A1 (en) * 2019-12-19 2021-06-23 Zhilabs S.L. Continuous determination of quality of experience in encrypted video traffic using semi-supervised learning with generative adversarial networks
CN111080528B (zh) * 2019-12-20 2023-11-07 北京金山云网络技术有限公司 图像超分辨率和模型训练方法、装置、电子设备及介质
CN111160555B (zh) * 2019-12-26 2023-12-01 北京迈格威科技有限公司 基于神经网络的处理方法、装置及电子设备
CN111275089B (zh) * 2020-01-16 2024-03-05 北京小米松果电子有限公司 一种分类模型训练方法及装置、存储介质
CN113222105A (zh) * 2020-02-05 2021-08-06 百度(美国)有限责任公司 元协作训练范式
KR102366302B1 (ko) * 2020-02-05 2022-02-22 주식회사 스파이더코어 준 지도 학습을 위한 오토인코더 기반 그래프 설계
CN111382785B (zh) * 2020-03-04 2023-09-01 武汉精立电子技术有限公司 一种gan网络模型及实现样本自动清洗、辅助标记的方法
US11087215B1 (en) * 2020-07-25 2021-08-10 Sas Institute Inc. Machine learning classification system
CN111291833A (zh) * 2020-03-20 2020-06-16 京东方科技集团股份有限公司 应用于监督学习系统训练的数据增强方法和数据增强装置
CN113537223A (zh) * 2020-04-20 2021-10-22 北京沃东天骏信息技术有限公司 训练样本生成、模型训练和图像处理方法及装置
CN111612703A (zh) * 2020-04-22 2020-09-01 杭州电子科技大学 一种基于生成对抗网络的图像盲去模糊方法
CN111767800B (zh) * 2020-06-02 2023-09-05 华南师范大学 遥感影像场景分类得分融合方法、系统、设备及存储介质
CN111709577B (zh) * 2020-06-17 2023-08-15 上海海事大学 基于长程相关性gan-lstm的rul预测方法
CN111930728B (zh) * 2020-06-30 2023-11-24 广州洪森科技有限公司 一种设备的特征参数和故障率的预测方法及系统
CN111768836B (zh) * 2020-07-06 2023-11-24 天津大学 基于广义生成对抗网络的帕金森状态下dbs闭环学习方法
CN111797935B (zh) * 2020-07-13 2023-10-31 扬州大学 基于群体智能的半监督深度网络图片分类方法
US20220084204A1 (en) * 2020-09-11 2022-03-17 Nvidia Corporation Labeling images using a neural network
CN112199637B (zh) * 2020-09-21 2024-04-12 浙江大学 基于回归注意力生成对抗网络数据增强的回归建模方法
TWI800767B (zh) * 2020-11-16 2023-05-01 財團法人工業技術研究院 具有生成對抗網路架構之異常偵測裝置和異常偵測方法
CN112418395B (zh) * 2020-11-17 2022-08-26 吉林大学 一种基于生成对抗网络的气体传感器阵列漂移补偿方法
CN112257855B (zh) * 2020-11-26 2022-08-16 Oppo(重庆)智能科技有限公司 一种神经网络的训练方法及装置、电子设备及存储介质
US11875270B2 (en) * 2020-12-08 2024-01-16 International Business Machines Corporation Adversarial semi-supervised one-shot learning
CN112632728B (zh) * 2020-12-30 2022-10-25 西安交通大学 基于深度学习的透平机械叶型设计及性能预测方法
US11810225B2 (en) * 2021-03-30 2023-11-07 Zoox, Inc. Top-down scene generation
US11858514B2 (en) 2021-03-30 2024-01-02 Zoox, Inc. Top-down scene discrimination
CN113240655B (zh) * 2021-05-21 2023-04-07 深圳大学 一种自动检测眼底图像类型的方法、存储介质及装置
CN113537031B (zh) * 2021-07-12 2023-04-07 电子科技大学 基于多鉴别器条件生成对抗网络的雷达图像目标识别方法
US11900534B2 (en) * 2021-07-30 2024-02-13 The Boeing Company Systems and methods for synthetic image generation
US11651554B2 (en) * 2021-07-30 2023-05-16 The Boeing Company Systems and methods for synthetic image generation
CN113592000A (zh) * 2021-08-03 2021-11-02 成都理工大学 基于卷积对抗神经网络的裂缝识别技术
CN114282684A (zh) * 2021-12-24 2022-04-05 支付宝(杭州)信息技术有限公司 训练用户相关的分类模型、进行用户分类的方法及装置
CN114330924B (zh) * 2022-01-10 2023-04-18 中国矿业大学 基于生成式对抗网络的复杂产品变更强度预测方法
CN114584230B (zh) * 2022-03-07 2023-06-20 东南大学 一种基于对抗网络与长短期记忆网络的预测信道建模方法
CN115272777B (zh) * 2022-09-26 2022-12-23 山东大学 面向输电场景的半监督图像解析方法
CN115565611B (zh) * 2022-09-28 2024-01-23 广州译码基因科技有限公司 一种生物学回归预测方法、装置、设备及存储介质
CN115357941B (zh) * 2022-10-20 2023-01-13 北京宽客进化科技有限公司 一种基于生成式人工智能的去隐私方法和系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105975978A (zh) * 2016-04-22 2016-09-28 南京师范大学 一种结合标记相关性的半监督多标记特征选择及分类方法
CN106096557A (zh) * 2016-06-15 2016-11-09 浙江大学 一种基于模糊训练样本的半监督学习人脸表情识别方法
CN106209457A (zh) * 2016-07-14 2016-12-07 北京工业大学 应对智能家居环境中旁路攻击的隐私保护方法及系统

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7941382B2 (en) 2007-10-12 2011-05-10 Microsoft Corporation Method of classifying and active learning that ranks entries based on multiple scores, presents entries to human analysts, and detects and/or prevents malicious behavior
US8781782B2 (en) 2010-09-30 2014-07-15 Siemens Aktiengesellschaft System and method for conditional multi-output regression for machine condition monitoring
US8738549B2 (en) 2010-12-21 2014-05-27 International Business Machines Corporation Predictive modeling
CN104484682A (zh) 2014-12-31 2015-04-01 中国科学院遥感与数字地球研究所 一种基于主动深度学习的遥感图像分类方法
CN106296692A (zh) 2016-08-11 2017-01-04 深圳市未来媒体技术研究院 基于对抗网络的图像显著性检测方法
US10504004B2 (en) * 2016-09-16 2019-12-10 General Dynamics Mission Systems, Inc. Systems and methods for deep model translation generation

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105975978A (zh) * 2016-04-22 2016-09-28 南京师范大学 一种结合标记相关性的半监督多标记特征选择及分类方法
CN106096557A (zh) * 2016-06-15 2016-11-09 浙江大学 一种基于模糊训练样本的半监督学习人脸表情识别方法
CN106209457A (zh) * 2016-07-14 2016-12-07 北京工业大学 应对智能家居环境中旁路攻击的隐私保护方法及系统

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
ARCHITH J. BENCY ET AL.: "Beyond Spatial Auto-Regressive Models: Predicting Housing Prices with Satellite Imagery", 《ARXIV》 *
NASIM SOULY ET AL.: "Semi and Weakly Supervised Semantic Segmentation Using Generative Adversarial Network", 《ARXIV》 *
TIM SALIMANS ET AL.: "Improved Techniques for Training GANs", 《ARXIV》 *
徐一峰: "生成对抗网络理论模型和应用综述", 《金华职业技术学院学报》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111539525A (zh) * 2020-04-15 2020-08-14 北京圣涛平试验工程技术研究院有限责任公司 无人机战队对抗中个体失效率与战队胜率的关系确定方法
CN111539525B (zh) * 2020-04-15 2023-10-03 北京圣涛平试验工程技术研究院有限责任公司 无人机战队对抗中个体失效率与战队胜率的关系确定方法
CN112786003A (zh) * 2020-12-29 2021-05-11 平安科技(深圳)有限公司 语音合成模型训练方法、装置、终端设备及存储介质
CN112784883A (zh) * 2021-01-07 2021-05-11 厦门大学 一种基于样本选择扩充的冷水珊瑚分布预测方法及系统
CN113270090A (zh) * 2021-05-19 2021-08-17 平安科技(深圳)有限公司 基于asr模型与tts模型的组合模型训练方法及设备

Also Published As

Publication number Publication date
US20180336471A1 (en) 2018-11-22
WO2018209894A1 (en) 2018-11-22
US11003995B2 (en) 2021-05-11
EP3602392A4 (en) 2020-04-22
EP3602392A1 (en) 2020-02-05

Similar Documents

Publication Publication Date Title
CN110537184A (zh) 利用生成式对抗网络的半监督回归
US10846567B2 (en) Scene understanding using a neurosynaptic system
KR102483639B1 (ko) 뉴럴 네트워크 구조 확장 방법, 디멘션 리덕션 방법, 및 그 방법을 이용한 장치
KR20230018496A (ko) 뉴럴 네트워크를 위한 트레이닝 방법, 뉴럴 네트워크를 이용한 인식 방법 및 그 장치들
US20190005380A1 (en) Classifying features using a neurosynaptic system
CN116635866A (zh) 用于挖掘少数类数据样本以训练神经网络的方法和系统
CN107273782A (zh) 使用递归神经网络的在线动作检测
CN114283888A (zh) 基于分层自注意力机制的差异表达基因预测系统
Hu et al. A dynamic rectified linear activation units
CN114127747A (zh) 用于分布外检测的似然比
Montesinos‐López et al. Deep‐learning power and perspectives for genomic selection
Kim et al. Building deep random ferns without backpropagation
Yu et al. Ensemble based on GA wrapper feature selection
CN113316790A (zh) 经由sliced-wasserstein距离进行无监督域适应的系统和方法
Abdullah et al. Evolving spiking neural networks methods for classification problem: a case study in flood events risk assessment
CN110199300A (zh) 用于自动编码器的模糊输入
Nayak et al. Optimizing a higher order neural network through teaching learning based optimization algorithm
Abaimov et al. Understanding machine learning
Sahoo et al. Character recognition using firefly based back propagation neural network
Abdechiri et al. Efficacy of utilizing a hybrid algorithmic method in enhancing the functionality of multi-instance multi-label radial basis function neural networks
US20210374612A1 (en) Interpretable imitation learning via prototypical option discovery
CN110298449B (zh) 计算机进行通用学习的方法、装置和计算机可读存储介质
Płaczek Neighborhood selection and rules identification for cellular automata: a rough sets approach
Igiri et al. A comparative analysis of K-NN and ANN techniques in machine learning
Deng et al. CodeeGAN: Code generation via adversarial training

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination