CN110472696A - 一种基于dcgan生成太赫兹人体图像的方法 - Google Patents

一种基于dcgan生成太赫兹人体图像的方法 Download PDF

Info

Publication number
CN110472696A
CN110472696A CN201910779693.1A CN201910779693A CN110472696A CN 110472696 A CN110472696 A CN 110472696A CN 201910779693 A CN201910779693 A CN 201910779693A CN 110472696 A CN110472696 A CN 110472696A
Authority
CN
China
Prior art keywords
network
terahertz
human body
image
loss
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910779693.1A
Other languages
English (en)
Inventor
王葛
朱艳
沈韬
刘英莉
朱荣盛
赵志鹏
王晓琳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kunming University of Science and Technology
Original Assignee
Kunming University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kunming University of Science and Technology filed Critical Kunming University of Science and Technology
Priority to CN201910779693.1A priority Critical patent/CN110472696A/zh
Publication of CN110472696A publication Critical patent/CN110472696A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/103Static body considered as a whole, e.g. static pedestrian or occupant recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种基于DCGAN生成太赫兹人体图像的方法,本发明采用了多张人体太赫兹安检图片作为训练集并利用深度卷积生成对抗网络生成人体太赫兹安检图像。基于GAN的核心博弈的思想,将GAN分为生成网络G和鉴别网络D,生成网络的作用是生成假的太赫兹安检图像使鉴别网络无法鉴别真假,鉴别网络的目的是努力分辨出真实的太赫兹安检图像和生成的太赫兹安检图像。最终直到鉴别网络分辨不出生成网络生成的以假乱真的图像为止就可以得到我们需要的太赫兹安检图像。本发明针对现目前太赫兹人体安检图像数据稀少,且通过太赫兹成像系统生成太赫兹人体安检图像数据存在成本昂贵的问题,提出了一种基于DCGAN生成太赫兹人体图像的方法,很好的解决了现目前太赫兹安检图像数据稀少,而导致的用深度神经网络进行模型训练时效果不理想的问题,且DCGAN生成的太赫兹人体图像数据更具多样性可使得训练出来的模型拥有更广泛的适用性和稳定性,同时降低了太赫兹安检图像研究的所需成本。

Description

一种基于DCGAN生成太赫兹人体图像的方法
技术领域
本发明涉及一种基于DCGAN生成太赫兹人体图像的方法,属于深度学习技术领域。
背景技术
随着科技的不断发展,安防检测设备被广泛的运用到了我们的日常生活中,为我们的公共社会环境提供了可靠的保障。传统的安全检查方法包括主要是基于x射线扫描仪[1]或金属探测器等,但x射线扫描仪这种检测方法产生的辐射对人体伤害特别大,因此并未得到广泛的运用。而金属探测器又只能局限于探测出金属类危险物品,无法对液体等危险物品进行检测。
近年来,太赫兹(THz)成像系统已被广泛地用于取代传统的x射线扫描仪。THz波是一种电磁波,频率范围为0.1~10thz,相应的波长在30μm~3mm之间的电磁波。它处于电磁波谱中的毫米波段与远红外波段之间的位置,低频区与毫米波重叠,高频区与红外波重叠,是一种处于电子学与光子学交叉区域的技术。由于太赫兹波段处在电磁波谱中一个非常特殊的位置,使得太赫兹波具有许多独特的特性,例如光子的低能性、脉宽频谱性、能对非极性材料有极强的穿透特性、以及很好的相干性、瞬态性等优点。通过太赫兹成像系统得到的得到的图像能够呈现出可疑物体的大致位置,再将太赫兹安检图像送入深度神经网路中进行训练能够对产生的太赫兹图像进行识别分类。
然后产生太赫兹图像的太赫兹成像系统价格比较昂贵,又加上深度学习需要大量的图像进行训练才能具备很好的效果。因此,通过生成对抗网络生成太赫兹安检图像就弥补了现目前太赫兹人体图像数据量少的问题。
发明内容
本发明提供了一种基于DCGAN生成太赫兹人体图像的方法,以用于解决人体太赫兹安检图像数据集少的问题,制作成本高的问题。
本发明的技术方案是:一种基于DCGAN生成太赫兹人体图像的方法,所述方法的具体步骤如下:
Step1、准备太赫兹安检图像数据集作为原始数据集;
Step2、选用DCGAN-tensorflow对太赫兹安检图像进行训练,定义并初始化相关参数;
Step3、建立训练模型,采用交叉熵计算损失,真样本输入的损失(d_loss_real)、假样本输入的损失(d_loss_fake)、目标损失(g_loss)。
Step4、将图像输入鉴别网络和生成网络中进行训练,通过Adam优化器最小化d_loss和g_loss。首先输入噪声z和batch_images,通过优化d_optim更新D网络。然后输入噪声z,优化g_optim来更新G网络。
Step5、对于鉴别网络,它的输入是一张图像,输出是这张图像为真实图像的概率。在DCGAN中,判别器D的结构是一个卷积神经网络,输入的图像经过若干层卷积后得到一个卷积特征,将得到的特征送入Logistic函数,最后得到输出的概率值;
Step6、对于生成网络,生成器G接收一个100-d随机噪声z,经过Project andreshape(全连接层),转化为一个4*4*1024的feature map,然后经过多个反卷积层,生成大小为64*64*3的太赫兹安检图像;
Step7、保存判别网络的识别率接近0.5左右时,生成网络图生成的太赫兹安检图像为可用图像。
进一步地,所述生成网络和所述鉴别网络独立训练。
进一步地,所述生成网络激活函数最后一层使用tanh函数,其他层都使用ReLU函数。
进一步地,所述生成网络不采用任何池化层,在判别器D中,用带有步长的卷积来代替池化层。
进一步地,所述生成网络和所述鉴别网络均使用Batch Normalization帮助模型收敛。
本发明的有益效果是:本发明采用了多张人体太赫兹安检图片作为训练集并利用深度卷积生成对抗网络生成人体太赫兹安检图像。本发明与现有技术相比,主要解决了人体太赫兹图像数据量少等现象,降低了产生大量人体太赫兹图像所需的成本。
附图说明
图1为本发明流程示意框图。
图2为本发明采用的DCGAN深度网络总体架构图;
图3为DCGAN深度网络模型生成器网络模型、判别器网络模型架构图;
图4为源太赫兹人体成像数据。
图5为DCGAN深度网络模型生成的太赫兹人体成像数据。
具体实施方式
实施例1:如附图所示,一种基于DCGAN生成太赫兹人体图像的方法,所述方法的具体步骤如下:
Step1、获取人体太赫兹安检图片数据集,太赫兹安检图像数据集图片的大小为380*200,输入的图片类型,默认为*.jpg;
Step2、选用DCGAN-tensorflow网络对太赫兹安检图像进行训练,定义并初始化相关参数,其中迭代次数设置为30,Adam的学习率,默认为0.0002,批图像的个数batch_size,默认为64,颜色通道c_dim,太赫兹安检图像为彩色图像设为3;
Step3、建立训练模型,采用交叉熵计算损失,计算公式如下:
ce=(1-a)ln(y)+aln(1-y)
真样本输入的损失(d_loss_real),要让D_logits接近于1,也就是D识别出真样本为真的,假样本输入的损失(d_loss_fake)要让D_logits_接近于0,D识别出假样本为假,g_loss:要让D识别假样本为真样本,G的目标是降低这个损失,目标损失(d_loss=d_loss_real+d_loss_fake)要最小化这个损失。
Step4、将图像输入鉴别网络和生成网络中进行训练,并将所有训练样本图像利用tanh激活函数归一化到[-1,1]之间,计算公式如下:
通过Adam优化器最小化d_loss和g_loss。首先输入噪声z和batch_images,通过优化d_optim更新D网络。然后输入噪声z,优化g_optim来更新G网络,在训练的过程中,两个网络互相对抗,最终形成了一个动态的平衡,上述过程用公式可以被描述为:
在最理想的情况下,G可以生成与真实图片极其相似的图片G(z),而D很难判断这张生成的图片是否为真,对图片的真假进行随机猜测,即D(G(z))=0.5
Step5、对于鉴别网络,除了最后一层,所有层都使用relu作为激活函数,并且最后一层使用tanh作为激活函数,它的输入是一张图像,输出是这张图像为真实图像的概率。在DCGAN中,判别器D的结构是一个卷积神经网络,输入的图像经过若干层卷积后得到一个卷积特征,将得到的特征送入Logistic函数,最后得到输出的概率值;
Step6、对于生成网络在每一层操作之后,数据输出经过一个relu函数,然后使用batch_norm进行归一化处理,最后一层使用sigmoid函数作为激活函数,并且不使用batch_norm进行归一化操作,生成器G接收一个100-d随机噪声z,经过Project and reshape(全连接层),转化为一个4*4*1024的feature map,然后经过多个反卷积层,生成大小为64*64*3的太赫兹安检图像;
Step7、保存判别网络的识别率接近0.5左右时,生成网络图生成的太赫兹安检图像为可用图像。
上面结合附图对本发明的具体实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出各种变化。

Claims (5)

1.一种基于DCGAN生成太赫兹人体图像的方法,其特征在于:所述方法的具体步骤如下:
Step1、准备太赫兹安检图像数据集作为原始数据集;
Step2、选用DCGAN-tensorflow对太赫兹安检图像进行训练,定义并初始化相关参数;
Step3、建立训练模型,采用交叉熵计算损失,真样本输入的损失(d_loss_real)、假样本输入的损失(d_loss_fake)、目标损失(g_loss)。
Step4、将图像输入鉴别网络和生成网络中进行训练,通过Adam优化器最小化d_loss和g_loss。首先输入噪声z和batch_images,通过优化d_optim更新D网络。然后输入噪声z,优化g_optim来更新G网络。
Step5、对于鉴别网络,它的输入是一张图像,输出是这张图像为真实图像的概率。在DCGAN中,判别器D的结构是一个卷积神经网络,输入的图像经过若干层卷积后得到一个卷积特征,将得到的特征送入Logistic函数,最后得到输出的概率值;
Step6、对于生成网络,生成器G接收一个100-d随机噪声z,经过Project and reshape(全连接层),转化为一个4*4*1024的feature map,然后经过多个反卷积层,生成大小为64*64*3的太赫兹安检图像;
Step7、保存判别网络的识别率接近0.5左右时,生成网络图生成的太赫兹安检图像为可用图像。
2.根据权利要求1所述的一种基于DCGAN生成太赫兹人体图像的方法,其特征在于:所述生成网络和所述鉴别网络需独立训练。
3.根据权利要求1所述的一种基于DCGAN生成太赫兹人体图像的方法,其特征在于:所述生成网络激活函数最后一层使用tanh函数,其他层都使用ReLU函数。
4.根据权利要求2所述的生成网络方法,其特征在于:所述生成网络不采用任何池化层,在判别器D中,用带有步长的卷积来代替池化层。
5.根据权利要求2所述的生成网络和鉴别网络,其特征在于:所述生成网络和所述鉴别网络均使用Batch Normalization帮助模型收敛。
CN201910779693.1A 2019-08-22 2019-08-22 一种基于dcgan生成太赫兹人体图像的方法 Pending CN110472696A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910779693.1A CN110472696A (zh) 2019-08-22 2019-08-22 一种基于dcgan生成太赫兹人体图像的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910779693.1A CN110472696A (zh) 2019-08-22 2019-08-22 一种基于dcgan生成太赫兹人体图像的方法

Publications (1)

Publication Number Publication Date
CN110472696A true CN110472696A (zh) 2019-11-19

Family

ID=68513425

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910779693.1A Pending CN110472696A (zh) 2019-08-22 2019-08-22 一种基于dcgan生成太赫兹人体图像的方法

Country Status (1)

Country Link
CN (1) CN110472696A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111402196A (zh) * 2020-02-10 2020-07-10 浙江工业大学 一种基于对抗生成网络的轴承滚子图像生成方法
CN111784573A (zh) * 2020-05-21 2020-10-16 昆明理工大学 一种基于迁移学习的被动太赫兹图像超分辨率重构方法
CN111931761A (zh) * 2020-08-10 2020-11-13 广东工业大学 一种基于胶囊网络和太赫兹光谱图像的物质识别方法
CN117079142A (zh) * 2023-10-13 2023-11-17 昆明理工大学 无人机自动巡检的反注意生成对抗道路中心线提取方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111402196A (zh) * 2020-02-10 2020-07-10 浙江工业大学 一种基于对抗生成网络的轴承滚子图像生成方法
CN111784573A (zh) * 2020-05-21 2020-10-16 昆明理工大学 一种基于迁移学习的被动太赫兹图像超分辨率重构方法
CN111931761A (zh) * 2020-08-10 2020-11-13 广东工业大学 一种基于胶囊网络和太赫兹光谱图像的物质识别方法
CN111931761B (zh) * 2020-08-10 2023-07-28 广东工业大学 一种基于胶囊网络和太赫兹光谱图像的物质识别方法
CN117079142A (zh) * 2023-10-13 2023-11-17 昆明理工大学 无人机自动巡检的反注意生成对抗道路中心线提取方法
CN117079142B (zh) * 2023-10-13 2024-01-26 昆明理工大学 无人机自动巡检的反注意生成对抗道路中心线提取方法

Similar Documents

Publication Publication Date Title
CN110472696A (zh) 一种基于dcgan生成太赫兹人体图像的方法
US11030731B2 (en) Systems and methods for fusing infrared image and visible light image
CN109543640B (zh) 一种基于图像转换的活体检测方法
CN107563355B (zh) 基于生成对抗网络的高光谱异常检测方法
Frizzi et al. Convolutional neural network for video fire and smoke detection
CN106169081B (zh) 一种基于不同照度的图像分类及处理方法
Shanmugavadivu et al. Particle swarm optimized multi-objective histogram equalization for image enhancement
CN103871029B (zh) 一种图像增强及分割方法
CN108268859A (zh) 一种基于深度学习的人脸表情识别方法
CN114841907B (zh) 面向红外与可见光图像的多尺度生成对抗融合网络的方法
CN109887047B (zh) 一种基于生成式对抗网络的信号-图像翻译方法
CN108364277A (zh) 一种双波段图像融合的红外小目标检测方法
CN104484650B (zh) 素描人脸识别的方法和装置
CN113066077B (zh) 火焰检测方法及装置
CN115965809A (zh) 结合难分样本生成与学习的sar图像目标开集识别方法
Satrasupalli et al. End to end system for hazy image classification and reconstruction based on mean channel prior using deep learning network
Zhu et al. A novel simple visual tracking algorithm based on hashing and deep learning
Wei et al. Towards robust person re-identification by adversarial training with dynamic attack strategy
CN110136081A (zh) 一种基于高斯核偏态校正弥撒滤波器的图像增强方法
CN114120079B (zh) 一种基于sar目标识别网络的对抗样本快速生成方法
TWI460667B (zh) 模糊指紋影像重建方法
Tsai et al. Decision tree-based contrast enhancement for various color images
CN107341501A (zh) 一种基于pcnn和分级聚焦技术的图像融合方法及装置
CN107273807A (zh) 一种遥感影像分类方法
Shakri et al. Entropy virus microscopy images recognition via neural network classifiers

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20191119

WD01 Invention patent application deemed withdrawn after publication