CN108009568A - 一种基于wgan模型的行人检测方法 - Google Patents
一种基于wgan模型的行人检测方法 Download PDFInfo
- Publication number
- CN108009568A CN108009568A CN201711124627.8A CN201711124627A CN108009568A CN 108009568 A CN108009568 A CN 108009568A CN 201711124627 A CN201711124627 A CN 201711124627A CN 108009568 A CN108009568 A CN 108009568A
- Authority
- CN
- China
- Prior art keywords
- mrow
- pedestrian
- arbiter
- pedestrian detection
- maker
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
- G06F18/2148—Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/20—Movements or behaviour, e.g. gesture recognition
Abstract
本发明公开了一种基于WGAN模型的行人检测方法,属于深度学习神经网络领域,包括以下步骤:S1、构造原始生成对抗网络模型;S2、构造沃瑟斯坦距离,作为对抗网络模型的评判指标;S3、初始化随机噪声,输入生成器中;S4、准备好行人图像数据集,输入判别器中训练;S5、将行人检测操作得到的损失函数输入生成器进行后续训练。本方法构建的基于WGAN模型的行人检测方法,引入沃瑟斯坦距离,能够评价整个网络的训练质量,同时通过将行人图像数据集输入判别器中,不断训练判别器的能力,从而能够在复杂的道路图像中准确地判别行人的准确位置。
Description
技术领域
本发明涉及深度学习神经网络技术领域,具体涉及一种基于WGAN模型的行人检测方法。
背景技术
生成式对抗网络(Generative Adversarial Network,简称GAN)是由Goodfellow在2014年提出的深度学习框架,它基于“博奕论”的思想,构造生成器(generator)和判别器(discriminator)两种模型,前者通过输入(0,1)的均匀噪声或高斯随机噪声生成图像,后者对输入的图像进行判别,确定是来自数据集的图像还是由生成器产生的图像。
在传统的对抗网络模型中,对于生成器生成图像质量并没有统一的评判标准,且对于数据集没有统一的要求。针对现有技术中存在的上述问题,目的亟待提出一种利用沃瑟斯坦距离作为生成对抗网络的评判指标,从而使整个模型的训练能够往正确的方向进行。同时,准备好行人数据集,连同生成器生成图像,输入至判别器中进行训练。通过观察沃瑟斯坦距离,评价判别器的能力。
发明内容
本发明的目的是为了解决现有技术中的上述缺陷,提供一种基于WGAN模型的行人检测方法。
本发明的目的可以通过采取如下技术方案达到:
一种基于WGAN模型的行人检测方法,所述的行人检测方法包括下列步骤:
S1、构造原始生成对抗网络模型,通过生成器生成图像输入至判别器进行网络训练;
S2、构造沃瑟斯坦距离,作为对抗网络模型的评判指标;
S3、初始化随机噪声,输入生成器中;
S4、准备好行人图像数据集,输入判别器中训练;
S5、将行人检测操作得到的损失函数输入生成器进行后续训练。
进一步地,所述的步骤S4具体过程如下:
S41、准备好行人数据集;
S42、将生成器生成图像与行人数据集输入判别器中进行训练。
进一步地,所述的步骤S5具体过程如下:
S51、观察沃瑟斯坦距离,评价判别器当前辨别行人的能力;
S52、将行人检测操作得到的损失函数输入生成器进行后续训练。
进一步地,所述的损失函数的表达式为:
其中,D(x)表示判别器对图像的判别,pr表示数据集图像的分布,pg表示生成图像的分布,λ为超参数,为梯度,E为取均值的操作符号。
本发明相对于现有技术具有如下的优点及效果:
针对性:本发明根据行人检测的操作过程,通过准备行人图像的数据集,使得判别器的能力有了针对性。在网络不断训练的过程中,能够不断加强判别器对行人的检测能力。同时,能够通过沃瑟斯坦距离来评价整个网络的训练质量,使模型的训练有了方向。
附图说明
图1是本发明中公开的基于WGAN模型的行人检测方法的训练流程图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例
本实施例公开了一种基于WGAN模型的行人检测方法,具体包括下列步骤:
步骤S1、构造原始生成对抗网络模型,通过生成器生成图像输入至判别器进行网络训练.
步骤S2、构造沃瑟斯坦距离,作为对抗网络模型的评判指标;
不同的卷积核,体现在矩阵数值的不同、行列数的不同。
构造多个卷积核,在处理图像的过程中,不同的卷积核意味着能够在网络训练的过程中学习到生成图像的不同特征。
在本发明所涉及到的网络模型中,利用沃瑟斯坦距离作为生成对抗网络的评判指标,从而使整个模型的训练能够往正确的方向进行。
在传统的对抗网络模型中,对于生成器生成图像质量并没有统一的评判标准,且对于数据集没有统一的要求。而在本发明中,利用沃瑟斯坦距离作为生成对抗网络的评判指标,从而使整个模型的训练能够往正确的方向进行。同时,准备好行人数据集,连同生成器生成图像,输入至判别器中进行训练。通过观察沃瑟斯坦距离,评价判别器的能力。
在实际应用中,应该根据数据集图像特征的复杂程度,设置卷积核的个数。
步骤S3、初始化随机噪声,输入生成器中。
步骤S4、准备好行人图像数据集,输入判别器中训练。
具体过程如下:
S41、准备好行人图像数据集;
S42、将生成器生成图像与行人数据集输入判别器中进行训练。
步骤S5、将行人检测操作得到的损失函数输入生成器进行后续训练。具体过程如下:
S51、观察沃瑟斯坦距离,评价判别器当前辨别行人的能力;
S52、将行人检测操作得到的损失函数输入生成器进行后续训练。
损失函数的作用是衡量判别器对生成图像判断的能力。损失函数的值越小,说明在当前迭代中,判别器能够有较好的性能辨别生成器的生成图像;反之则说明判别器的性能较差。
损失函数的表达式为:
其中,D(x)表示判别器对图像的判别,pr表示数据集图像的分布,pg表示生成图像的分布,λ为超参数,为梯度,E为取均值的操作符号。
综上所述,本实施例公开了一种基于WGAN模型的行人检测方法,在传统的对抗网络模型中,对于生成器生成图像质量并没有统一的评判标准,且对于数据集没有统一的要求。而在本发明中,利用沃瑟斯坦距离作为生成对抗网络的评判指标,从而使整个模型的训练能够往正确的方向进行。同时,准备好行人数据集,连同生成器生成图像,输入至判别器中进行训练。通过观察沃瑟斯坦距离,评价判别器的能力。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
Claims (4)
1.一种基于WGAN模型的行人检测方法,其特征在于,所述的行人检测方法包括下列步骤:
S1、构造原始生成对抗网络模型,通过生成器生成图像输入至判别器进行网络训练;
S2、构造沃瑟斯坦距离,作为对抗网络模型的评判指标;
S3、初始化随机噪声,输入生成器中;
S4、准备好行人图像数据集,输入判别器中训练;
S5、将行人检测操作得到的损失函数输入生成器进行后续训练。
2.根据权利要求1所述的一种基于WGAN模型的行人检测方法,其特征在于,所述的步骤S4具体过程如下:
S41、准备好行人数据集;
S42、将生成器生成图像与行人数据集输入判别器中进行训练。
3.根据权利要求1所述的一种基于WGAN模型的行人检测方法,其特征在于,所述的步骤S5具体过程如下:
S51、观察沃瑟斯坦距离,评价判别器当前辨别行人的能力;
S52、将行人检测操作得到的损失函数输入生成器进行后续训练。
4.根据权利要求3所述的一种基于WGAN模型的行人检测方法,其特征在于,所述的损失函数的表达式为:
<mrow>
<mi>L</mi>
<mrow>
<mo>(</mo>
<mi>D</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mo>-</mo>
<msub>
<mi>E</mi>
<mrow>
<mi>x</mi>
<mo>~</mo>
<mi>p</mi>
<mi>r</mi>
</mrow>
</msub>
<mo>&lsqb;</mo>
<mi>D</mi>
<mrow>
<mo>(</mo>
<mi>x</mi>
<mo>)</mo>
</mrow>
<mo>&rsqb;</mo>
<mo>+</mo>
<msub>
<mi>E</mi>
<mrow>
<mi>x</mi>
<mo>~</mo>
<mi>p</mi>
<mi>g</mi>
</mrow>
</msub>
<mo>&lsqb;</mo>
<mi>D</mi>
<mrow>
<mo>(</mo>
<mi>x</mi>
<mo>)</mo>
</mrow>
<mo>&rsqb;</mo>
<mo>+</mo>
<msub>
<mi>&lambda;E</mi>
<mrow>
<mi>x</mi>
<mo>~</mo>
<mi>X</mi>
</mrow>
</msub>
<msub>
<mo>&dtri;</mo>
<mi>x</mi>
</msub>
</mrow>
其中,D(x)表示判别器对图像的判别,pr表示数据集图像的分布,pg表示生成图像的分布,λ为超参数,为梯度,E为取均值的操作符号。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711124627.8A CN108009568A (zh) | 2017-11-14 | 2017-11-14 | 一种基于wgan模型的行人检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711124627.8A CN108009568A (zh) | 2017-11-14 | 2017-11-14 | 一种基于wgan模型的行人检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108009568A true CN108009568A (zh) | 2018-05-08 |
Family
ID=62052533
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711124627.8A Pending CN108009568A (zh) | 2017-11-14 | 2017-11-14 | 一种基于wgan模型的行人检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108009568A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110070124A (zh) * | 2019-04-15 | 2019-07-30 | 广州小鹏汽车科技有限公司 | 一种基于生成式对抗网络的图像扩增方法及系统 |
CN110110670A (zh) * | 2019-05-09 | 2019-08-09 | 杭州电子科技大学 | 基于Wasserstein度量的行人跟踪中的数据关联方法 |
CN111192221A (zh) * | 2020-01-07 | 2020-05-22 | 中南大学 | 基于深度卷积生成对抗网络的铝电解火眼图像修补方法 |
CN112785071A (zh) * | 2021-01-29 | 2021-05-11 | 华南理工大学 | 一种企业用车客流模拟与预测系统 |
CN113554645A (zh) * | 2021-09-17 | 2021-10-26 | 常州微亿智造科技有限公司 | 基于wgan的工业异常检测方法和装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107085716A (zh) * | 2017-05-24 | 2017-08-22 | 复旦大学 | 基于多任务生成对抗网络的跨视角步态识别方法 |
CN107133601A (zh) * | 2017-05-13 | 2017-09-05 | 五邑大学 | 一种基于生成式对抗网络图像超分辨率技术的行人再识别方法 |
CN107154023A (zh) * | 2017-05-17 | 2017-09-12 | 电子科技大学 | 基于生成对抗网络和亚像素卷积的人脸超分辨率重建方法 |
CN107273936A (zh) * | 2017-07-07 | 2017-10-20 | 广东工业大学 | 一种gan图像处理方法及系统 |
CN107330364A (zh) * | 2017-05-27 | 2017-11-07 | 上海交通大学 | 一种基于cGAN网络的人群计数方法及系统 |
-
2017
- 2017-11-14 CN CN201711124627.8A patent/CN108009568A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107133601A (zh) * | 2017-05-13 | 2017-09-05 | 五邑大学 | 一种基于生成式对抗网络图像超分辨率技术的行人再识别方法 |
CN107154023A (zh) * | 2017-05-17 | 2017-09-12 | 电子科技大学 | 基于生成对抗网络和亚像素卷积的人脸超分辨率重建方法 |
CN107085716A (zh) * | 2017-05-24 | 2017-08-22 | 复旦大学 | 基于多任务生成对抗网络的跨视角步态识别方法 |
CN107330364A (zh) * | 2017-05-27 | 2017-11-07 | 上海交通大学 | 一种基于cGAN网络的人群计数方法及系统 |
CN107273936A (zh) * | 2017-07-07 | 2017-10-20 | 广东工业大学 | 一种gan图像处理方法及系统 |
Non-Patent Citations (1)
Title |
---|
ISHAAN GULRAJANI ET AL: "Improved Training of Wasserstein GANs", 《MARCHINE LEARNING》 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110070124A (zh) * | 2019-04-15 | 2019-07-30 | 广州小鹏汽车科技有限公司 | 一种基于生成式对抗网络的图像扩增方法及系统 |
CN110110670A (zh) * | 2019-05-09 | 2019-08-09 | 杭州电子科技大学 | 基于Wasserstein度量的行人跟踪中的数据关联方法 |
CN111192221A (zh) * | 2020-01-07 | 2020-05-22 | 中南大学 | 基于深度卷积生成对抗网络的铝电解火眼图像修补方法 |
CN111192221B (zh) * | 2020-01-07 | 2024-04-16 | 中南大学 | 基于深度卷积生成对抗网络的铝电解火眼图像修补方法 |
CN112785071A (zh) * | 2021-01-29 | 2021-05-11 | 华南理工大学 | 一种企业用车客流模拟与预测系统 |
CN112785071B (zh) * | 2021-01-29 | 2023-02-28 | 华南理工大学 | 一种企业用车客流模拟与预测系统 |
CN113554645A (zh) * | 2021-09-17 | 2021-10-26 | 常州微亿智造科技有限公司 | 基于wgan的工业异常检测方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108009568A (zh) | 一种基于wgan模型的行人检测方法 | |
CN107886162A (zh) | 一种基于wgan模型的可变形卷积核方法 | |
CN107590518A (zh) | 一种多特征学习的对抗网络训练方法 | |
CN107862377A (zh) | 一种基于文本‑图像生成对抗网络模型的分组卷积方法 | |
CN107886169A (zh) | 一种基于文本‑图像生成对抗网络模型的多尺度卷积核方法 | |
CN107016406A (zh) | 基于生成式对抗网络的病虫害图像生成方法 | |
CN108229526A (zh) | 网络训练、图像处理方法、装置、存储介质和电子设备 | |
CN106845421A (zh) | 基于多区域特征与度量学习的人脸特征识别方法及系统 | |
CN108229277A (zh) | 手势识别、控制及神经网络训练方法、装置及电子设备 | |
CN107563155A (zh) | 一种基于生成对抗网络的安全隐写方法和装置 | |
CN107609597A (zh) | 一种电梯轿厢人数检测系统及其检测方法 | |
CN108830145A (zh) | 一种基于深度神经网络的人数统计方法及存储介质 | |
CN109002790A (zh) | 一种人脸识别的方法、装置、设备和存储介质 | |
CN107943750A (zh) | 一种基于wgan模型的分解卷积方法 | |
CN108021979A (zh) | 一种基于原始生成对抗网络模型的特征重标定卷积方法 | |
CN107194418A (zh) | 一种基于对抗特征学习的水稻蚜虫检测方法 | |
CN109559362B (zh) | 一种图像主体脸部替换方法及装置 | |
CN107563509A (zh) | 一种基于特征返回的条件dcgan模型的动态调整算法 | |
JP7372017B2 (ja) | 鋼材成分学習装置、鋼材成分推定装置、鋼種判定装置、鋼材成分学習方法、鋼材成分推定方法、鋼種判定方法、及びプログラム | |
CN109410190B (zh) | 基于高分辨率遥感卫星影像的杆塔倒断检测模型训练方法 | |
CN107992944A (zh) | 一种基于原始生成对抗网络模型的多尺度卷积方法 | |
CN110580470A (zh) | 基于人脸识别的监测方法、装置、存储介质及计算机设备 | |
WO2020063835A1 (zh) | 模型生成 | |
CN110135461A (zh) | 基于分层注意感知深度度量学习的情感图像检索的方法 | |
CN109800785A (zh) | 一种基于自表达相关的数据分类方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180508 |