CN109871898A - 一种利用生成对抗网络生成堆积物训练样本的方法 - Google Patents

一种利用生成对抗网络生成堆积物训练样本的方法 Download PDF

Info

Publication number
CN109871898A
CN109871898A CN201910149658.1A CN201910149658A CN109871898A CN 109871898 A CN109871898 A CN 109871898A CN 201910149658 A CN201910149658 A CN 201910149658A CN 109871898 A CN109871898 A CN 109871898A
Authority
CN
China
Prior art keywords
sample
generated
random
point
deposit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910149658.1A
Other languages
English (en)
Other versions
CN109871898B (zh
Inventor
周敏
朱志超
王勇
杨健
曾元
图尔荪艾力
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing China Aviation Technology Development Co Ltd
Original Assignee
Nanjing China Aviation Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing China Aviation Technology Development Co Ltd filed Critical Nanjing China Aviation Technology Development Co Ltd
Priority to CN201910149658.1A priority Critical patent/CN109871898B/zh
Publication of CN109871898A publication Critical patent/CN109871898A/zh
Application granted granted Critical
Publication of CN109871898B publication Critical patent/CN109871898B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本发明公开了一种利用生成对抗网络生成堆积物训练样本的方法,包括以下步骤:创造堆积物和点的一一对应训练集;利用判别器和生成器训练GAN模型;随机生成器生成平面的点的随机分布集合;利用生成的随机的点生成更多的样本;利用生成的样本对GAN模型进行优化。本发明方法可以得到更加鲁棒的模型,利用该模型可以增加稀有样本的数量以及质量,减少了数据采集的成本,也进一步使交通路政的检测模型更加准确鲁棒,更好地服务于交通路政的检测。

Description

一种利用生成对抗网络生成堆积物训练样本的方法
技术领域
本发明属于根据现有的路政执法与养护的训练样本(比如白色垃圾、堆积物)随机生成更多的训练数据的计算机图像处理技术领域,具体涉及一种利用生成对抗网络生成堆积物训练样本的方法。
背景技术
首个神经网络模型在1960年前后就被提出,期间经过众多学者的不断努力,神经网络也不断被优化,但由于缺乏大量的数据以及计算机的计算能力限制,神经网络算法一直没有发挥出其应有的潜力。直至2006年深度学习及其理论的提出,结合互联网的海量数据以及高效的计算能力,深度学习获得了极大的重视与发展。
在目前深度学习的研究和应用快速发展的热潮下,生成对抗网络(GenerativeAdversarial Nets,GAN)的提出更是满足了许多领域的研究和应用需求,为深度学习注入了新的发展活力。现在,GAN已经成为深度学习领域的一个重点研究方向,以至于著名学者Yann LeCun将其称为“过去十年里机器学习领域中最让人兴奋的想法”。目前,GAN在图像和视觉领域研究和应用最为广泛,已经可以精准的生成手写体数字、人脸等目标对象,还可以构建各种逼真的生活场景,从低分辨率的图像生成高分辨率的图像,把分割的图像复原,给黑白图像上色,以目标轮廓为基础恢复为原物体图像等。除此之外,GAN已经开始逐渐向语音和语言处理、电脑病毒监测、棋类比赛程序等研究中扩展。
生成对抗网络对于生成式模型的发展具有重大的意义,作为一种生成方法,它能够有效地解决建立自然性解释数据的生成难题,特别是生成高维的数据,GAN所使用的神经网络结构对于生成的数据维度没有限制,这极大的丰富了生成样本的多样性。生成对抗网络所采用的神经网络结构能够整合各类损失函数,丰富了算法设计的自由度。GAN创新性的采用两个神经网络的对抗的方式作为训练准则,并允许使用反向传播机制来进行更新优化,训练过程中没有复杂的变分下界也不需要使用马尔科夫链方法以及做各种近似推理,有效地提高了生成结构的训练效率,降低了训练难度。GAN可以直接进行新样本的采样和推断,不需要繁琐的采样序列,提高了新样本的生成效率。对抗的训练方法摒弃了对真实数据的依赖,扩展了生成过程的自由度,增加了样本的多样性。
在实践中,GAN生成的样本易于人类理解,例如,生成清晰的图像。GAN除了提供了新的生成方式以外,还对于半监督学习的研究和发展有重要影响。在GAN的训练过程是不需要制定数据标签的,虽然其的目的不是使用半监督学习,但是GAN的训练过程可以实施半监督学习中无标签数据对模型进行训练。具体来说就是先利用无标签数据训练GAN,再把少量有标签的数据传入已训练的GAN,利用GAN对数据的理解进一步训练判别器,这样可以很好的实现传统分类与回归任务。但是GAN的生成方式同样存在着一些问题,GAN采用对抗学习准则,目前还没有理论指导对抗的双方确实能够平衡发展,也很难通过损失值确定训练情况。GAN的训练过程需要确实保证对抗的双方生成器和判别器能够平衡与同步,否则无法保证训练结果可靠有用。实际的训练过程中,两个对抗网络的平衡同步很难把控,使得了训练过程变得很不稳定。对于GAN,从发展应用角度来说,如何根据随机的输入生成丰富的、容易被人类大脑理解的数据,是近期的应用发展方向;从与机器学习的其他算法交叉训练的角度来说,把GAN与特征学习、模仿学习和强化学习等技术更好的融合,促进这些技术方法发展,研发出新的人工智能应用是新的有意义的发展方向;从人工智能未来发展的角度来说,如何利用GAN推动人工智能的发展,提高理解现实世界的能力、激发人工智能的创造力是非常值得业界思考的方向。
作为一个有着无限生成能力的结构方法,GAN的最直接的应用就是生成与训练数据一致的数据样本,比如生成图像和视频等。再者就是利用GAN进行模拟人工系统的生成和计算实验的分析,对平行控制中的人工系统和实际系统平行执行的过程通过建模的方式进行分析和评估,最后以平行方式来执行对复杂系统的控制的实现。这在一方面可以进行人工系统的预测学习和实际系统的反馈学习,在另一方面也可以进行控制单元的模拟学习和强化学习。其次,GAN还能够用于解决标注数据不足的训练学习问题,常见的就是无监督学习。再者,GAN也可以在自然语言处理领域大显身手,比如生成对话,有文本生成图像等。这种生成无限样本的能力,在图像和视觉计算、语音和语言处理、互联与大型系统信息安全等领域都具有重大的研究应用价值,这也是目前发展GAN对研究人工智能的主要意义。
由于航拍堆积物的识别存在样本难以收集,而堆积物的种类多种多样,千变万化,很难收集足够的样本去训练鲁棒性强的模型,为此我们提出一种利用生成对抗网络生成堆积物训练样本的方法。
发明内容
本发明的目的在于提供一种利用生成对抗网络生成堆积物训练样本的方法,以解决背景技术中提出的由于航拍堆积物的识别存在样本难以收集,而堆积物的种类多种多样,千变万化,很难收集足够的样本去训练鲁棒性强的模型的问题。
为实现上述技术目的,本发明采取的技术方案为:
一种利用生成对抗网络生成堆积物训练样本的方法,包括以下步骤:
S1:创造堆积物和点的一一对应训练集;
S2:利用判别器和生成器训练GAN模型;
S3:随机生成器生成平面的点的随机分布集合;
S4:利用生成的随机的点生成更多的样本;
S5:利用生成的样本对GAN模型进行优化。
为优化上述技术方案,采取的具体措施还包括:
上述的步骤S1具体包括:
手动标注不同的堆积物的样本,形成堆积物和样本一一对应的数据对;
在同一个几何平面上标注随机点,进行随机的分布,生产更多不同纹理的只是堆积物形成标注和样本一一对应的数据对。
步骤S2中,生成器为U-Net网络,判别器为全连接网络,判别器的输入为语义标签图和对应图像的通道连接,使得判别器不再简单地判断图片本身的真与假,而是进一步判断两个图片的对应关系,从而使得生成器生成的图片同时具备真实性和相关性。
步骤S3中,首先生成多个矩形范围,在矩形的范围内沿X轴和Y轴方向生成随机的点,形成多个的在平面上面随机分布的点,多个随机生成的点组成的集合形成生成样本对应的标注域。
步骤S4具体为:将生成器生成的样本以及随机生成的点的集合,放到一起生成对应的纹理详细的样本。
本发明具有以下有益效果:
本发明方法可以得到更加鲁棒的模型,利用该模型可以增加稀有样本的数量以及质量,减少了数据采集的成本,也进一步使交通路政的检测模型更加准确鲁棒,更好地服务于交通路政的检测。
附图说明
图1为本发明的训练数据对示意图;
图2为本发明的生成对抗网络模型示意图;
图3为本发明的训练原理示意图。
具体实施方式
以下结合附图对本发明的实施例作进一步详细描述。
本发明的一种利用生成对抗网络生成堆积物训练样本的方法,包括以下步骤:
S1:创造堆积物和点的一一对应训练集,在生成标注的时候,针对不同的堆积物的样本进行手动标注,形成堆积物和样本一一对应的数据对;
在同一个几何平面上标注随机点,进行随机的分布,生产更多不同纹理的只是堆积物形成标注和样本一一对应的数据对,具体的对应关系如图1所示。
S2:利用判别器和生成器训练GAN的模型,GAN的模型结构如图2所示,将数据对一一校准,采用U-Net作为生成器,U-Net为利用卷积和去卷积组成U形的网络;使用全连接网络为判别器,判别器的输入是语义标签图和对应图像的通道连接。
将一个数据对中的两张图一起作为判别器的输入,实际上就是把两个图片叠在一起,channel为6作为输入,这样的结构使得判别器不再是简单地判断图片本身的真与假,而是进一步判断两个图片的对应关系,从而使得生成器生成的图片同时具备真实性和相关性;
对抗生成网络由判别器和生成器两部分组成,生成网络是一个去卷积的U-Net。在训练的时候,由两个loss组成了一个合成的loss,训练过程当中,判别器对生成的图形进行判别,然后通过从后到前的梯度的传导去改良,去优化判别器和生成器两个结构,从而使生成器生成更逼真的图像;
LcGAN(G,D)=Ex,y[log D(x,y)]+Ex,z[log(1-D(x,G(x,z)))]
LGAN(G,D)=Ey[log D(y)]+Ex,z[log(1-D(x,z))]
G表示生成模型,D表示判别模型,L是loss函数,其中G最小化这个目标函数,最大化D的目标函数。
由于U-Net在训练过程中收敛比较困难,在U-Net网络中增加了捷径链接去连接网络的不同层,在卷积层和去卷积层的部分,选择网络结构中对称的层,在这些层之间加上捷径,从而加速收敛。
每一个标注对应的点就对应着堆积物所带的比较详细的纹理,所以每一个点它在不同的位置,它就会去对应不同的纹理,在训练过程当中,这些点和其不同的位置,就会去对应堆积物纹理复杂的Latent Space当中的部分,latent space是无法直接观测的样本数据具有的隐含结构,训练的过程就是将这些数据对关系一一校准,具体的训练原理如图3所示;
Ll1(G)=Ex,y,z[||y-G(x,z)||1]
G*=argminGmaxDLcGAN(G,D)+θLl1(G)
G表示生成模型,D表示判别模型,L是loss函数,G*=argminGmaxDLcGAN(G,D)+θLl1(G)为L1距离,其中G*为目标函数,在最大化判别模型的识别率的同时,最小化生成模型被判别模型识别为生成的数据的概率,在收敛的时候达到均衡。
S3:随机生成器生成平面的点的随机分布集合,由于堆积物会集中在一些区域,所以首先生成多个矩形范围。在矩形的范围内在X轴和Y轴方向开始生成随机的点,形成多个的在平面上面随机分布的点,多个随机生成的点组成的集合形成生成样本对应的标注域。
S4:利用生成的随机的点生成更多的样本,通过不断训练,GAN模型的生成器和判别器不断优化,通过生成器可以得到更加真实的样本,判别器的判别能力也更加强大。将生成器生成的样本以及随机生成的点的集合,放到一起生成对应的纹理详细的样本。
S5:利用生成的样本对模型进行优化,从而得到更加鲁棒的模型,利用该模型可以增加稀有样本的数量以及质量,减少了数据采集的成本,也进一步使交通路政的检测模型更加准确鲁棒,更好地服务于交通路政的检测。
以上仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,应视为本发明的保护范围。

Claims (5)

1.一种利用生成对抗网络生成堆积物训练样本的方法,其特征在于:包括以下步骤:
S1:创造堆积物和点的一一对应训练集;
S2:利用判别器和生成器训练GAN模型;
S3:随机生成器生成平面的点的随机分布集合;
S4:利用生成的随机的点生成更多的样本;
S5:利用生成的样本对GAN模型进行优化。
2.根据权利要求1所述的一种利用生成对抗网络生成堆积物训练样本的方法,其特征在于:步骤S1具体包括:
手动标注不同的堆积物的样本,形成堆积物和样本一一对应的数据对;
在同一个几何平面上标注随机点,进行随机的分布,生产更多不同纹理的只是堆积物形成标注和样本一一对应的数据对。
3.根据权利要求1所述的一种利用生成对抗网络生成堆积物训练样本的方法,其特征在于:步骤S2所述生成器为U-Net网络,所述判别器为全连接网络,所述判别器的输入为语义标签图和对应图像的通道连接,使得判别器不再简单地判断图片本身的真与假,而是进一步判断两个图片的对应关系,从而使得生成器生成的图片同时具备真实性和相关性。
4.根据权利要求1所述的一种利用生成对抗网络生成堆积物训练样本的方法,其特征在于:步骤S3中,首先生成多个矩形范围,在矩形的范围内沿X轴和Y轴方向生成随机的点,形成多个的在平面上面随机分布的点,多个随机生成的点组成的集合形成生成样本对应的标注域。
5.根据权利要求1所述的一种利用生成对抗网络生成堆积物训练样本的方法,其特征在于:步骤S4具体为:将生成器生成的样本以及随机生成的点的集合,放到一起生成对应的纹理详细的样本。
CN201910149658.1A 2019-02-27 2019-02-27 一种利用生成对抗网络生成堆积物训练样本的方法 Active CN109871898B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910149658.1A CN109871898B (zh) 2019-02-27 2019-02-27 一种利用生成对抗网络生成堆积物训练样本的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910149658.1A CN109871898B (zh) 2019-02-27 2019-02-27 一种利用生成对抗网络生成堆积物训练样本的方法

Publications (2)

Publication Number Publication Date
CN109871898A true CN109871898A (zh) 2019-06-11
CN109871898B CN109871898B (zh) 2020-04-07

Family

ID=66919468

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910149658.1A Active CN109871898B (zh) 2019-02-27 2019-02-27 一种利用生成对抗网络生成堆积物训练样本的方法

Country Status (1)

Country Link
CN (1) CN109871898B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110659023A (zh) * 2019-09-11 2020-01-07 腾讯科技(深圳)有限公司 一种程序化内容生成的方法以及相关装置
CN111046673A (zh) * 2019-12-17 2020-04-21 湖南大学 一种用于防御文本恶意样本的对抗生成网络及其训练方法
CN111523429A (zh) * 2020-04-16 2020-08-11 中冶赛迪重庆信息技术有限公司 基于深度学习的堆钢识别方法
CN112101125A (zh) * 2020-08-21 2020-12-18 浙江百世技术有限公司 一种快递货物堆积程度的检测方法及装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101509604A (zh) * 2009-03-20 2009-08-19 武汉大学 一种金属管内堆积物的检测和评定方法及装置
CN107423701A (zh) * 2017-07-17 2017-12-01 北京智慧眼科技股份有限公司 基于生成式对抗网络的人脸非监督特征学习方法及装置
CN107944358A (zh) * 2017-11-14 2018-04-20 华南理工大学 一种基于深度卷积对抗网络模型的人脸生成方法
CN108564126A (zh) * 2018-04-19 2018-09-21 郑州大学 一种融合语义控制的特定场景生成方法
CN108665058A (zh) * 2018-04-11 2018-10-16 徐州工程学院 一种基于分段损失的生成对抗网络方法
WO2018200072A1 (en) * 2017-04-25 2018-11-01 Nec Laboratories America, Inc. Cyclic generative adversarial network for unsupervised cross-domain image generation
CN109190684A (zh) * 2018-08-15 2019-01-11 西安电子科技大学 基于素描及结构生成对抗网络的sar图像样本生成方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101509604A (zh) * 2009-03-20 2009-08-19 武汉大学 一种金属管内堆积物的检测和评定方法及装置
WO2018200072A1 (en) * 2017-04-25 2018-11-01 Nec Laboratories America, Inc. Cyclic generative adversarial network for unsupervised cross-domain image generation
CN107423701A (zh) * 2017-07-17 2017-12-01 北京智慧眼科技股份有限公司 基于生成式对抗网络的人脸非监督特征学习方法及装置
CN107944358A (zh) * 2017-11-14 2018-04-20 华南理工大学 一种基于深度卷积对抗网络模型的人脸生成方法
CN108665058A (zh) * 2018-04-11 2018-10-16 徐州工程学院 一种基于分段损失的生成对抗网络方法
CN108564126A (zh) * 2018-04-19 2018-09-21 郑州大学 一种融合语义控制的特定场景生成方法
CN109190684A (zh) * 2018-08-15 2019-01-11 西安电子科技大学 基于素描及结构生成对抗网络的sar图像样本生成方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
YUUSUKE KATAOKA ET AL.: "Image Generation Using Generative Adversarial Networks and Ateention Mechanism", 《2016 IEEE/ACIS 15TH INTERNATIONAL CONFERENCE ON COMPUTER AND INFORMATION SCIENCE》 *
余思泉 等: "基于对抗生成网络的纹理合成方法", 《红外与激光工程》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110659023A (zh) * 2019-09-11 2020-01-07 腾讯科技(深圳)有限公司 一种程序化内容生成的方法以及相关装置
CN111046673A (zh) * 2019-12-17 2020-04-21 湖南大学 一种用于防御文本恶意样本的对抗生成网络及其训练方法
CN111046673B (zh) * 2019-12-17 2021-09-03 湖南大学 一种用于防御文本恶意样本的对抗生成网络的训练方法
CN111523429A (zh) * 2020-04-16 2020-08-11 中冶赛迪重庆信息技术有限公司 基于深度学习的堆钢识别方法
CN112101125A (zh) * 2020-08-21 2020-12-18 浙江百世技术有限公司 一种快递货物堆积程度的检测方法及装置
CN112101125B (zh) * 2020-08-21 2024-05-03 浙江百世技术有限公司 一种快递货物堆积程度的检测方法及装置

Also Published As

Publication number Publication date
CN109871898B (zh) 2020-04-07

Similar Documents

Publication Publication Date Title
CN109871898A (zh) 一种利用生成对抗网络生成堆积物训练样本的方法
Tao et al. An object detection system based on YOLO in traffic scene
Qiao et al. Mirrorgan: Learning text-to-image generation by redescription
Wang et al. Weakly supervised adversarial domain adaptation for semantic segmentation in urban scenes
Chen et al. Motion guided spatial attention for video captioning
CN107330444A (zh) 一种基于生成对抗网络的图像自动文本标注方法
CN107506722A (zh) 一种基于深度稀疏卷积神经网络人脸情感识别方法
Chen et al. Multimodal encoder-decoder attention networks for visual question answering
CN112541501B (zh) 一种基于视觉语言建模网络的场景文字识别方法
Lerner et al. Fitting behaviors to pedestrian simulations
CN110097094A (zh) 一种面向人物交互的多重语义融合少样本分类方法
Shen et al. Machine learning assisted urban filling
CN108765383A (zh) 基于深度迁移学习的视频描述方法
Qian et al. Spot evasion attacks: Adversarial examples for license plate recognition systems with convolutional neural networks
Gomez-Perez et al. ISAAQ--Mastering Textbook Questions with Pre-trained Transformers and Bottom-Up and Top-Down Attention
CN109670559A (zh) 手写汉字的识别方法、装置、设备和存储介质
Wang et al. Detection and tracking based tubelet generation for video object detection
Chen et al. SSR-HEF: Crowd counting with multiscale semantic refining and hard example focusing
Chen et al. Headnet: pedestrian head detection utilizing body in context
CN109948589A (zh) 基于量子深度信念网络的人脸表情识别方法
Wang et al. Multi-branch spatial-temporal network for action recognition
CN109002808A (zh) 一种人体行为识别方法及系统
CN111767949A (zh) 一种基于特征和样本对抗共生的多任务学习方法及其系统
Jiang et al. IRNet: an improved retinanet model for face detection
Han et al. Video action recognition based on deeper convolution networks with pair-wise frame motion concatenation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant