CN108805188B - 一种基于特征重标定生成对抗网络的图像分类方法 - Google Patents

一种基于特征重标定生成对抗网络的图像分类方法 Download PDF

Info

Publication number
CN108805188B
CN108805188B CN201810534540.6A CN201810534540A CN108805188B CN 108805188 B CN108805188 B CN 108805188B CN 201810534540 A CN201810534540 A CN 201810534540A CN 108805188 B CN108805188 B CN 108805188B
Authority
CN
China
Prior art keywords
network
discriminator
sample
samples
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810534540.6A
Other languages
English (en)
Other versions
CN108805188A (zh
Inventor
姜代红
黄轲
刘其开
戴磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Yunyi Electric Co Ltd
Original Assignee
Xuzhou University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xuzhou University of Technology filed Critical Xuzhou University of Technology
Priority to CN201810534540.6A priority Critical patent/CN108805188B/zh
Publication of CN108805188A publication Critical patent/CN108805188A/zh
Application granted granted Critical
Publication of CN108805188B publication Critical patent/CN108805188B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Abstract

一种基于特征重标定生成对抗网络的图像分类方法,适用于机器学习领域。将待分类的图像数据输入对抗网络模型进行网络训练;卷积网络构成的生成器和鉴别器;初始化随机噪声,将随机噪声输入生成器中;在生成器中利用卷积网络对随机噪声进行多层反卷积运算最终得到生成样本;将生成样本和和真实样本输入鉴别器;在鉴别器中利用卷积网络对输入样本进行卷积与池化操作从而得到特征图,在卷积网络中间层引入压缩激活SENet模块对特征图进行校准,得到校准后的特征图,使用全局平均池化,最终输出图像数据分类。在鉴别器的中间层引入SENet模块,自动学习每一个特征通道的重要程度,提取任务相关有用的特征抑制任务无关的特征,从而提高半监督学习表现。

Description

一种基于特征重标定生成对抗网络的图像分类方法
技术领域
本发明涉及一种图像分类方法,尤其适用于一种基于特征重标定生成对抗网络的图像分类方法。
背景技术
在一个特定网络训练过程中,随着迭代次数的增多,网络模型在训练集往往拟合地很好,训练误差较小,但测试集的拟合程度不佳,导致测试误差较大。目前的研究表明,多个神经网络模型的集成通常比单个神经网络在验证阶段的性能要好。本质上可以理解为不同的模型对同一个任务所提取的特征往往是有差异的,这种差异正好弥补了模型之间泛化能力不足的问题,从而在最终的任务表现上比单个模型要好得多。
判别模型的集成融合往往是结合了在不同随机初始化方法训练出的模型,从而提高网络的泛化能力。Srivastav等提出的dropout策略来训练单个神经网络,按一定的概率来对某一层节点的输出连接参数进行随机采样,将这个子网络作为当前更新的目标网络,可以有效增加模型的泛化能力。Wa等提出的dropconnect策略是指随机更新某一层节点的输入连接参数,来提高模型的泛化能力。Huang等提出随机深度(stochastic depth) 训练策略以及Sing等提出将dropout和随机深度进行集成的方法,解决了特征层或所有层中节点的共适应问题。若不同随机状态的网络当作一个子网络,则对整个网络而言,上述的训练策略可以当作是所有子网络的集成。
最早在生成对抗网络用到集成思想的是wang等在2016年提出的级联生成对抗网络 (Cascade of GANs),当第一个GAN的表现因训练不再提升时,则将它的输出经过逻辑门结构来选择满足条件的部分训练样本,然后将选择的训练样本送入到第二个GAN 中训练直到满足最终的约束条件位置为止,这种结构能有效地解决GAN难以捕获整个训练样本的分布问题即生成样本的多样性不足。
卷积神经网络在很多领域上都取得了巨大的突破。而卷积核作为卷积神经网络的核心,通常被看作是在局部感受野上,将空间信息和特征维度上的信息进行聚合的信息聚合体。卷积神经网络由一系列卷积层、非线性层和下采样层构成,这样它们能够从全局感受野上去捕获图像的特征来进行图像的描述。
最近很多工作是从空间维度层面来提升网络的性能,如Szegedy最早提出的Inception框架结构,将1*1,3*3,5*5的卷积和3*3的池化组合在一起嵌入了多尺度信息,聚合多种不同感受野上的特征来获得性能增益。Jaderberg等将Attention机制引入到空间维度上,允许在网络中对数据进行空间操作,使神经网络能够主动地在空间上进行特征映射。Bell等提出了Inside-Outside网络,是一种利用感兴趣区域内外的信息的对象检测器,利用空间递归神经网络集成学习兴趣区域之外的上下文信息,在内部使用 skip-pooling来提取多个级别和抽象级别的信息。
除了在空间维度上来提升网络的性能之外,在特征通道方面也能够提升网络的性能,Hu等提出了压缩激活模块。该模块共分为压缩(Squeeze)和激活(Excitation)两个操作,可以显式地构建特征通道之间的相互依赖关系,提取出有用的特征,抑制那些任务无关的特征。
发明内容
发明目的:根据上述技术的不足之处,提供一种结构简单,使网络结构对经过随机处理的同一输入样本对应得到的输出尽可能相同,可以学习到任务相关的特征,增加网络的泛化能力的基于特征重标定生成对抗网络的图像分类方法。
为实现上述技术目的,本发明的基于特征重标定生成对抗网络的图像分类方法,其步骤为:
1.一种基于特征重标定生成对抗网络的图像分类方法,其特征在于步骤为:
S1构造生成对抗网络模型,将待分类的图像数据输入对抗网络模型进行网络训练;
S2构造卷积网络构成的生成器和鉴别器;
S3初始化随机噪声,将随机噪声输入生成器中;
S4在生成器中利用卷积网络对随机噪声进行多层反卷积运算最终得到生成样本;
S5将生成样本和和真实样本输入鉴别器;
S6在鉴别器中利用卷积网络对输入样本进行卷积与池化操作从而得到特征图,在卷积网络中间层引入压缩激活SENet模块对特征图进行校准,得到校准后的特征图,引入NIN网络使用全局平均池化,最终输出图像数据分类。
详细步骤为:
a.设X={x1,x2,…xm}表示m个真实样本的集合,
将待分类的维度为100的随机噪声z输入生成器,
z∈R100,将随机噪声z映射到维度为1024×16的高维空间,重新调整映射的高维空间的通道数为1024,大小为4×4的特征图;
b.重复上述反卷积运算步骤,每一次反卷积运算都将上一次反卷积运算得到的特征图大小变为原来的两倍,直到得到的生成样本与输入图像尺寸相同后停止卷积运算;
c.将生成样本和真实样本输入鉴别器,通过鉴别器进行生成对抗网络的半监督学习,其中真实样本包括无标签样本和有限的带标签样本,带标签样本仅参与鉴别器的监督交叉熵损失,无标签样本和生成样本参与无监督对抗损失和无监督均方差损失;
首先对生成样本和真实样本进过若干个的卷积与池化操作之后,得到一系列特征图集合U,其中U∈RC×H×W,随后利用压缩激活SENet模块对特征图U进行校准,得到校准后的特征图U′,其中U′∈RC×H×W;式中,C表示通道数,H代表宽,W代表高;
d.引入NIN网络增加网络的非线性拟合能力,进行一个1×1的卷积;
e.使用全局平均池化层处理NIN网络卷积后的结果,分别输出交叉熵损失、均方差损失和对抗损失,加权求和后获得总损失,与此同时获得测试输入图像的标签以及精率,最终对图像进行分类。
设X={x1,x2,…xm}表示m个真实样本的集合,
Figure RE-GDA0001702607410000031
为维度为100的随机噪声向量,
Figure RE-GDA0001702607410000032
为生成样本,则鉴别器的输出代表其输入样本属于真实样本的概率为
Figure RE-GDA0001702607410000033
则常规对抗网络总的目标函数表示为:
Figure RE-GDA0001702607410000034
式中:E(*)表示的是期望,G表示生成器,D表示鉴别器,y表示样本的标签,
通过鉴别器进行生成对抗网络的半监督学习,需要考虑到输入样本属于真实样本的概率,还要考虑带标签的输入样本对标签类别的概率值;
设给定标签类别共有K类,样本x经过特征提取得到一个K维的特征向量 logits={l1,l2,…lK},则该样本对第j类的概率表示为:
Figure RE-GDA0001702607410000035
在监督学习中,目标函数就是最小化样本标签与模型预测的概率值的交叉熵,为了获得交叉网络的监督交叉熵损失,将输入到鉴别器的生成样本所属的类别定义为第K+1类,则来自生成样本的概率表示为pmodel(y=K+1|x),即对应于1-D(x),假设鉴别的训练样本一半来自真实样本,另一半来自生成样本,则半监督生成对抗网络鉴别器D的损失函数可表示为:
Figure RE-GDA0001702607410000046
带标签的训练贡献于监督交叉熵损失:
Figure RE-GDA0001702607410000047
无标签训练样本贡献于无监督对抗损失:令D(x)=1-pmodel(y=K+1|x),则
Figure RE-GDA0001702607410000048
其中,
Figure RE-GDA0001702607410000041
式中:exp表示的是指数函数,Z(*)表示鉴别器输出特征向量的每一维度的指数加权和;
生成对抗网络针对半监督分类任务,为鉴别器引入模型在不同状态下的无监督特征均方差损失,对真实样本两个分支的同一输入而得到的不同输出进行惩罚,该正则项能够学习任务相关的特征,提高半监督分类的精度;假设
Figure RE-GDA0001702607410000042
表示第二分支无标签的训练样本,
Figure RE-GDA0001702607410000043
表示鉴别器同一训练阶段下的不同状态,通过随机预处理函数 f(*)得到输入对应的输出可表示为:
Figure RE-GDA0001702607410000044
同理第一分支下的输入对应的输出为:
z(i)=Dθ(f(x(i)))
则无监督特征均方差正则项如下:
Figure RE-GDA0001702607410000045
其中,w(t)表示的是在训练过程中正则项对鉴别器贡献是动态的,训练初期,由于网络参数较差,该正则项的贡献为0,随着训练的进行,贡献程度逐步上升,最后获得一个趋于稳定值。
假设SENet模块不是每一张特征图对提升分类任务的作用都相同,因此需要学习输入的每一张特征图对分类任务的权重;
给定一个输入X,
Figure RE-GDA0001702607410000051
式中,C’代表是转换之后的特征图的通道数,H’代表特征图的宽,W’代表特征图的高,通过卷积映射变换Ftr(*,θ),得到C个特征图的集合U, U=[u1,u2,…,uC],其中
Figure RE-GDA0001702607410000052
下面通过压缩操作、激活映射操作和重标定操作来重标定经过映射得到的特征U:
(1)压缩Fsq(*)操作:为了探索特征通道相互之间的依赖性,首先考虑学习特征图中每一个通道的信息,由于卷积运算是在一个局部感受野进行操作,因此卷积变换之后得到的节点都无法获取该局部感受野以外的信息;
压缩操作将全局空间信息压缩到一个通道描述符中,通过全局平均池化来生成描述特征通道信息的统计量T,统计量的第c个元素计算方式如下:
Figure RE-GDA0001702607410000053
其中,
Figure RE-GDA0001702607410000054
代表着整个图像的信息;
(2)激活Fex(*)操作:激活操作类似于循环神经网络中门的机制,由两个全连接层组成,将特征维度降低到输入的1/16,然后经过激活函数ReLu激活后,通过全连接层升到原来的维度,最后通过激励函数Sigmoid的门获得0~1之间归一化的权重,表达式如下:
s=Fex(t,W)=σ(g(t,W))=σ(W2δ(W1t))
式中,δ为ReLu激活函数,σ为Sigmoid函数,
Figure RE-GDA0001702607410000055
参数W用来显式地建模特征通道间的相关性;
(3)重标定Fscale(*)操作:将激活操作得到的权重当作是特征选择之后的特征通道的重要性指标,然后与之前的通道逐个加权相乘,完成在通道维度上的对原始特征的重标定,对第c个特征通道的加权公式如下:
Figure RE-GDA0001702607410000056
其中,
Figure RE-GDA0001702607410000057
S=[s1,s2,…,sc]。
有益效果:
本发明基于传统鉴别器的损失策略和结构难以提取到抽象以及任务相关的鲁棒性特征,鉴别器引入了无监督正则项,使网络结构对经过随机处理的同一输入样本对应得到的输出尽可能相同,可以学习到任务相关的特征,使分类任务性能有所提升,即增加网络的泛化能力;与此同时,传统的鉴别器的结构是卷积加池化模块组成的,在鉴别器的中间层引入SENet模块,自动学习每一个特征通道的重要程度,提取任务相关有用的特征抑制任务无关的特征,从而提高半监督学习表现,有效提高图像的分类性能。
附图说明:
图1为本发明的步骤流程图;
图2是本发明的SENet模块结构图。
具体实施方式:
下面结合附图对本发明的具体实施例做进一步说明:
如图1所示,本发明的基于特征重标定生成对抗网络的图像分类方法,其步骤为:
S1构造生成对抗网络模型,将待分类的图像数据输入对抗网络模型进行网络训练;
S2构造卷积网络构成的生成器和鉴别器;
S3初始化随机噪声,将随机噪声输入生成器中;
S4在生成器中利用卷积网络对随机噪声进行多层反卷积运算最终得到生成样本;
S5将生成样本和和真实样本输入鉴别器;
S6在鉴别器中利用卷积网络对输入样本进行卷积与池化操作从而得到特征图,在卷积网络中间层引入压缩激活SENet模块对特征图进行校准,得到校准后的特征图,引入NIN网络使用全局平均池化,最终输出图像数据分类。
详细步骤为:
a.设X={x1,x2,…xm}表示m个真实样本的集合,
将待分类的维度为100的随机噪声z输入生成器,
z∈R100,将随机噪声z映射到维度为1024×16的高维空间,重新调整映射的高维空间的通道数为1024,大小为4×4的特征图;
b.重复上述反卷积运算步骤,每一次反卷积运算都将上一次反卷积运算得到的特征图大小变为原来的两倍,直到得到的生成样本与输入图像尺寸相同后停止卷积运算;
c.将生成样本和真实样本输入鉴别器,通过鉴别器进行生成对抗网络的半监督学习,其中真实样本包括无标签样本和有限的带标签样本,带标签样本仅参与鉴别器的监督交叉熵损失,无标签样本和生成样本参与无监督对抗损失和无监督均方差损失;
首先对生成样本和真实样本进过若干个的卷积与池化操作之后,得到一系列特征图集合U,其中U∈RC×H×W,随后利用压缩激活SENet模块对特征图U进行校准,得到校准后的特征图U′,其中U′∈RC×H×W;式中,C表示通道数,H代表宽,W代表高;
d.引入NIN网络增加网络的非线性拟合能力,进行一个1×1的卷积;
e.使用全局平均池化层处理NIN网络卷积后的结果,分别输出交叉熵损失、均方差损失和对抗损失,加权求和后获得总损失,用于参数更新,与此同时通过测试分支输出对测试样本的标签,从而计算精度,获得测试输入图像的标签以及精率,最终对图像进行分类。
设X={x1,x2,…xm}表示m个真实样本的集合,
Figure RE-GDA0001702607410000071
为维度为100的随机噪声向量,
Figure RE-GDA0001702607410000072
为生成样本,则鉴别器的输出代表其输入样本属于真实样本的概率为
Figure RE-GDA0001702607410000073
则常规对抗网络总的目标函数表示为:
Figure RE-GDA0001702607410000074
式中:E(*)表示的是期望,G表示生成器,D表示鉴别器,y表示样本的标签,
通过鉴别器进行生成对抗网络的半监督学习,需要考虑到输入样本属于真实样本的概率,还要考虑带标签的输入样本对标签类别的概率值;
设给定标签类别共有K类,样本x经过特征提取得到一个K维的特征向量 logits={l1,l2,…lK},则该样本对第j类的概率表示为:
Figure RE-GDA0001702607410000075
在监督学习中,目标函数就是最小化样本标签与模型预测的概率值的交叉熵,为了获得交叉网络的监督交叉熵损失,将输入到鉴别器的生成样本所属的类别定义为第K+1类,则来自生成样本的概率表示为pmodel(y=K+1|x),即对应于1-D(x),假设鉴别的训练样本一半来自真实样本,另一半来自生成样本,则半监督生成对抗网络鉴别器D的损失函数可表示为:
Figure RE-GDA0001702607410000086
带标签的训练贡献于监督交叉熵损失:
Figure RE-GDA0001702607410000087
无标签训练样本贡献于无监督对抗损失:令D(x)=1-pmodel(y=K+1|x),则
Figure RE-GDA0001702607410000088
其中,
Figure RE-GDA0001702607410000081
式中:exp表示的是指数函数,Z(*)表示鉴别器输出特征向量的每一维度的指数加权和;
生成对抗网络针对半监督分类任务,为鉴别器引入模型在不同状态下的无监督特征均方差损失,对真实样本两个分支的同一输入而得到的不同输出进行惩罚,该正则项能够学习任务相关的特征,提高半监督分类的精度;假设
Figure RE-GDA0001702607410000082
表示第二分支无标签的训练样本,
Figure RE-GDA0001702607410000083
表示鉴别器同一训练阶段下的不同状态,通过随机预处理函数 f(*)得到输入对应的输出可表示为:
Figure RE-GDA0001702607410000084
同理第一分支下的输入对应的输出为:
z(i)=Dθ(f(x(i)))
则无监督特征均方差正则项如下:
Figure RE-GDA0001702607410000085
其中,w(t)表示的是在训练过程中正则项对鉴别器贡献是动态的,训练初期,由于网络参数较差,该正则项的贡献为0,随着训练的进行,贡献程度逐步上升,最后获得一个趋于稳定值。
如图2所示,设SENet模块不是每一张特征图对提升分类任务的作用都相同,因此需要学习输入的每一张特征图对分类任务的权重;
给定一个输入X,
Figure RE-GDA0001702607410000091
式中,C’代表是转换之后的特征图的通道数,H’代表特征图的宽,W’代表特征图的高,通过卷积映射变换Ftr(*,θ),得到C个特征图的集合U, U=[u1,u2,…,uC],其中
Figure RE-GDA0001702607410000092
下面通过压缩操作、激活映射操作和重标定操作来重标定经过映射得到的特征U:
(1)压缩Fsq(*)操作:为了探索特征通道相互之间的依赖性,首先考虑学习特征图中每一个通道的信息,由于卷积运算是在一个局部感受野进行操作,因此卷积变换之后得到的节点都无法获取该局部感受野以外的信息;
压缩操作将全局空间信息压缩到一个通道描述符中,通过全局平均池化来生成描述特征通道信息的统计量T,统计量的第c个元素计算方式如下:
Figure RE-GDA0001702607410000093
其中,
Figure RE-GDA0001702607410000094
代表着整个图像的信息;
(2)激活Fex(*)操作:激活操作类似于循环神经网络中门的机制,由两个全连接层组成,将特征维度降低到输入的1/16,然后经过激活函数ReLu激活后,通过全连接层升到原来的维度,最后通过激励函数Sigmoid的门获得0~1之间归一化的权重,表达式如下:
s=Fex(t,W)=σ(g(t,W))=σ(W2δ(W1t))
式中,δ为ReLu激活函数,σ为Sigmoid函数,
Figure RE-GDA0001702607410000095
参数W用来显式地建模特征通道间的相关性;
(3)重标定Fscale(*)操作:将激活操作得到的权重当作是特征选择之后的特征通道的重要性指标,然后与之前的通道逐个加权相乘,完成在通道维度上的对原始特征的重标定,对第c个特征通道的加权公式如下:
Figure RE-GDA0001702607410000096
其中,
Figure RE-GDA0001702607410000097
S=[s1,s2,…,sc]。

Claims (3)

1.一种基于特征重标定生成对抗网络的图像分类方法,其特征在于步骤为:
S1构造生成对抗网络模型,将待分类的图像数据输入对抗网络模型进行网络训练;
S2构造卷积网络构成的生成器和鉴别器;
S3初始化随机噪声,将随机噪声输入生成器中;
S4在生成器中利用卷积网络对随机噪声进行多层反卷积运算最终得到生成样本;
S5将生成样本和和真实样本输入鉴别器;
S6在鉴别器中利用卷积网络对输入样本进行卷积与池化操作从而得到特征图,在卷积网络中间层引入压缩激活SENet模块对特征图进行校准,得到校准后的特征图,引入NIN网络使用全局平均池化,最终输出图像数据分类;
详细步骤为:
a.设X={x1,x2,…xm}表示m个真实样本的集合,
将待分类的维度为100的随机噪声z输入生成器,
z∈R100,将随机噪声z映射到维度为1024×16的高维空间,重新调整映射的高维空间的通道数为1024,大小为4×4的特征图;
b.重复上述反卷积运算步骤,每一次反卷积运算都将上一次反卷积运算得到的特征图大小变为原来的两倍,直到得到的生成样本与输入图像尺寸相同后停止卷积运算;
c.将生成样本和真实样本输入鉴别器,通过鉴别器进行生成对抗网络的半监督学习,其中真实样本包括无标签样本和有限的带标签样本,带标签样本仅参与鉴别器的监督交叉熵损失,无标签样本和生成样本参与无监督对抗损失和无监督均方差损失;
首先对生成样本和真实样本进过若干个的卷积与池化操作之后,得到一系列特征图集合U,其中U∈RC×H×W,随后利用压缩激活SENet模块对特征图U进行校准,得到校准后的特征图U′,其中U′∈RC×H×W;式中,C表示通道数,H代表宽,W代表高;
d.引入NIN网络增加网络的非线性拟合能力,进行一个1×1的卷积;
e.使用全局平均池化层处理NIN网络卷积后的结果,分别输出交叉熵损失、均方差损失和对抗损失,加权求和后获得总损失,与此同时获得测试输入图像的标签以及精率,最终对图像进行分类。
2.根据权利要求1所述的基于特征重标定生成对抗网络的图像分类方法,其特征在于:设X={x1,x2,…xm}表示m个真实样本的集合,
Figure FDA0002570413980000021
为维度为100的随机噪声向量,
Figure FDA0002570413980000022
为生成样本,则鉴别器的输出代表其输入样本属于真实样本的概率为
Figure FDA0002570413980000023
则常规对抗网络总的目标函数表示为:
Figure FDA0002570413980000024
式中:E(*)表示的是期望,G表示生成器,D表示鉴别器,y表示样本的标签,
通过鉴别器进行生成对抗网络的半监督学习,需要考虑到输入样本属于真实样本的概率,还要考虑带标签的输入样本对标签类别的概率值;
设给定标签类别共有K类,样本x经过特征提取得到一个K维的特征向量logits={l1,l2,…lK},则该样本对第j类的概率表示为:
Figure FDA0002570413980000025
在监督学习中,目标函数就是最小化样本标签与模型预测的概率值的交叉熵,为了获得交叉网络的监督交叉熵损失,将输入到鉴别器的生成样本所属的类别定义为第K+1类,则来自生成样本的概率表示为pmodel(y=K+1|x),即对应于1-D(x),假设鉴别的训练样本一半来自真实样本,另一半来自生成样本,则半监督生成对抗网络鉴别器D的损失函数可表示为:
Figure FDA0002570413980000026
带标签的训练贡献于监督交叉熵损失:
Figure FDA0002570413980000027
无标签训练样本贡献于无监督对抗损失:令D(x)=1-pmodel(y=K+1|x),则
Figure FDA0002570413980000028
其中,
Figure FDA0002570413980000029
式中:exp表示的是指数函数,Z(*)表示鉴别器输出特征向量的每一维度的指数加权和;
生成对抗网络针对半监督分类任务,为鉴别器引入模型在不同状态下的无监督特征均方差损失,对真实样本两个分支的同一输入而得到的不同输出进行惩罚;假设
Figure FDA0002570413980000031
表示第二分支无标签的训练样本,
Figure FDA0002570413980000032
表示鉴别器同一训练阶段下的不同状态,通过随机预处理函数f(*)得到输入对应的输出可表示为:
Figure FDA0002570413980000033
同理第一分支下的输入对应的输出为:
z(i)=Dθ(f(x(i)))
则无监督特征均方差正则项如下:
Figure FDA0002570413980000034
其中,w(t)表示的是在训练过程中正则项对鉴别器贡献是动态的,训练初期,由于网络参数较差,该正则项的贡献为0,随着训练的进行,贡献程度逐步上升,最后获得一个趋于稳定值。
3.根据权利要求1所述的基于特征重标定生成对抗网络的图像分类方法,其特征在于:
假设SENet模块不是每一张特征图对提升分类任务的作用都相同,因此需要学习输入的每一张特征图对分类任务的权重;
给定一个输入X,
Figure FDA0002570413980000035
式中,C’代表是转换之后的特征图的通道数,H’代表特征图的宽,W’代表特征图的高,通过卷积映射变换Ftr(*,θ),得到C个特征图的集合U,U=[u1,u2,…,uC],其中
Figure FDA0002570413980000036
下面通过压缩操作、激活映射操作和重标定操作来重标定经过映射得到的特征U:
(1)压缩Fsq(*)操作:为了探索特征通道相互之间的依赖性,首先考虑学习特征图中每一个通道的信息,由于卷积运算是在一个局部感受野进行操作,因此卷积变换之后得到的节点都无法获取该局部感受野以外的信息;
压缩操作将全局空间信息压缩到一个通道描述符中,通过全局平均池化来生成描述特征通道信息的统计量T,统计量的第c个元素计算方式如下:
Figure FDA0002570413980000037
其中,
Figure FDA0002570413980000041
代表着整个图像的信息;
(2)激活Fex(*)操作:激活操作类似于循环神经网络中门的机制,由两个全连接层组成,将特征维度降低到输入的1/16,然后经过激活函数ReLu激活后,通过全连接层升到原来的维度,最后通过激励函数Sigmoid的门获得0~1之间归一化的权重,表达式如下:
s=Fex(t,W)=σ(g(t,W))=σ(W2δ(W1t))
式中,δ为ReLu激活函数,σ为Sigmoid函数,
Figure FDA0002570413980000042
参数W用来显式地建模特征通道间的相关性;
(3)重标定Fscale(*)操作:将激活操作得到的权重当作是特征选择之后的特征通道的重要性指标,然后与之前的通道逐个加权相乘,完成在通道维度上的对原始特征的重标定,对第c个特征通道的加权公式如下:
Figure FDA0002570413980000043
其中,
Figure FDA0002570413980000044
S=[s1,s2,…,sc]。
CN201810534540.6A 2018-05-29 2018-05-29 一种基于特征重标定生成对抗网络的图像分类方法 Active CN108805188B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810534540.6A CN108805188B (zh) 2018-05-29 2018-05-29 一种基于特征重标定生成对抗网络的图像分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810534540.6A CN108805188B (zh) 2018-05-29 2018-05-29 一种基于特征重标定生成对抗网络的图像分类方法

Publications (2)

Publication Number Publication Date
CN108805188A CN108805188A (zh) 2018-11-13
CN108805188B true CN108805188B (zh) 2020-08-21

Family

ID=64089211

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810534540.6A Active CN108805188B (zh) 2018-05-29 2018-05-29 一种基于特征重标定生成对抗网络的图像分类方法

Country Status (1)

Country Link
CN (1) CN108805188B (zh)

Families Citing this family (56)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109870138A (zh) * 2018-11-07 2019-06-11 五邑大学 一种基于深度学习的天线下倾角测量方法
CN109785399B (zh) * 2018-11-19 2021-01-19 北京航空航天大学 合成病变图像的生成方法、装置、设备及可读存储介质
CN109620244B (zh) * 2018-12-07 2021-07-30 吉林大学 基于条件生成对抗网络和svm的婴儿异常行为检测方法
CN109671063B (zh) * 2018-12-11 2020-08-18 西安交通大学 一种基于深度网络特征间重要性的图像质量评估方法
CN109685077A (zh) * 2018-12-13 2019-04-26 深圳先进技术研究院 一种乳腺肿块图像识别方法及装置
CN109635748B (zh) * 2018-12-14 2021-09-03 中国公路工程咨询集团有限公司 高分辨率影像中道路特征的提取方法
CN109740677A (zh) * 2019-01-07 2019-05-10 湖北工业大学 一种基于主成分分析改进生成对抗网络的半监督分类方法
CN109657156B (zh) * 2019-01-22 2021-06-01 杭州师范大学 一种基于循环生成对抗网络的个性化推荐方法
US10373027B1 (en) * 2019-01-30 2019-08-06 StradVision, Inc. Method for acquiring sample images for inspecting label among auto-labeled images to be used for learning of neural network and sample image acquiring device using the same
CN109741328B (zh) * 2019-02-02 2023-04-14 东北大学 一种基于生成式对抗网络的汽车表观质量检测方法
US10997475B2 (en) * 2019-02-14 2021-05-04 Siemens Healthcare Gmbh COPD classification with machine-trained abnormality detection
CN109948660A (zh) * 2019-02-26 2019-06-28 长沙理工大学 一种改进辅助分类器gan的图像分类方法
CN110033033B (zh) * 2019-04-01 2023-04-18 南京谱数光电科技有限公司 一种基于CGANs的生成器模型训练方法
CN110021052B (zh) * 2019-04-11 2023-05-30 北京百度网讯科技有限公司 用于生成眼底图像生成模型的方法和装置
CN110060247B (zh) * 2019-04-18 2022-11-25 深圳市深视创新科技有限公司 应对样本标注错误的鲁棒深度神经网络学习方法
CN110163106A (zh) * 2019-04-19 2019-08-23 中国科学院计算技术研究所 一体式纹身检测与识别方法和系统
CN110097103A (zh) * 2019-04-22 2019-08-06 西安电子科技大学 基于生成对抗网络的半监督图像分类方法
CN113344784B (zh) * 2019-04-30 2023-09-22 达音网络科技(上海)有限公司 通过潜在空间正则化对监督式生成对抗网络进行优化
CN110110780B (zh) * 2019-04-30 2023-04-07 南开大学 一种基于对抗神经网络和海量噪声数据的图片分类方法
CN110097130B (zh) * 2019-05-07 2022-12-13 深圳市腾讯计算机系统有限公司 分类任务模型的训练方法、装置、设备及存储介质
CN110134395A (zh) * 2019-05-17 2019-08-16 广东工业大学 一种图标的生成方法、生成系统及相关装置
CN110188866B (zh) * 2019-05-28 2021-06-25 北京工业大学 一种基于注意力机制的特征提取方法
CN110263865B (zh) * 2019-06-24 2021-11-02 北方民族大学 一种半监督多模态多类别的图像翻译方法
CN110427990B (zh) * 2019-07-22 2021-08-24 浙江理工大学 一种基于卷积神经网络的艺术图像分类方法
CN110689056A (zh) * 2019-09-10 2020-01-14 Oppo广东移动通信有限公司 一种分类方法及装置、设备和存储介质
CN110796177B (zh) * 2019-10-10 2021-05-21 温州大学 一种有效减少图像分类任务中神经网络过拟合的方法
CN110853663B (zh) * 2019-10-12 2023-04-28 平安科技(深圳)有限公司 基于人工智能的语音增强方法、服务器及存储介质
CN110752028A (zh) * 2019-10-21 2020-02-04 腾讯科技(深圳)有限公司 一种图像处理方法、装置、设备以及存储介质
CN111046900B (zh) * 2019-10-25 2022-10-18 重庆邮电大学 基于局部流形正则化的半监督生成对抗网络图像分类方法
CN111079893B (zh) * 2019-11-05 2023-05-09 深圳大学 用于干涉条纹图滤波的生成器网络的获取方法和装置
CN110717579B (zh) * 2019-11-13 2023-05-19 上海海事大学 一种齿轮箱数据模型训练及使用方法
CN110930471A (zh) * 2019-11-20 2020-03-27 大连交通大学 一种基于人机交互式对抗网络的图像生成方法
WO2021109878A1 (en) * 2019-12-06 2021-06-10 Guangdong Oppo Mobile Telecommunications Corp., Ltd. Method and system for semi-supervised content localization
CN111209972A (zh) * 2020-01-09 2020-05-29 中国科学院计算技术研究所 基于混合连通性深度卷积神经网络的图像分类方法及系统
CN111325661B (zh) * 2020-02-21 2024-04-09 京工慧创(福州)科技有限公司 一种名为msgan的图像的季节风格转换模型及方法
CN111340785B (zh) * 2020-02-27 2023-04-07 广州大学 模型训练方法、产品表面缺陷检测方法和存储介质
CN111353433A (zh) * 2020-02-28 2020-06-30 江南大学 一种基于对抗尺度一致性追求特征自学习的人群计数方法
CN111428758A (zh) * 2020-03-06 2020-07-17 重庆邮电大学 一种改进的基于无监督表征学习的遥感图像场景分类方法
CN111543983B (zh) * 2020-04-02 2023-04-18 天津大学 一种基于神经网络的脑电信号通道选择方法
CN111563577B (zh) * 2020-04-21 2022-03-11 西北工业大学 基于Unet的跳跃层分频和多尺度鉴别的本征图像分解方法
CN111783520A (zh) * 2020-05-18 2020-10-16 北京理工大学 基于双流网络的腹腔镜手术阶段自动识别方法及装置
CN112101404B (zh) * 2020-07-24 2024-02-09 西安电子科技大学 基于生成对抗网络的图像分类方法、系统及电子设备
CN112102306B (zh) * 2020-09-25 2022-10-25 西安交通大学 一种基于双重gan的边缘修复特征融合的缺陷检测方法
CN112259068B (zh) * 2020-10-21 2023-04-11 上海协格空调工程有限公司 一种主动降噪空调系统及其降噪控制方法
CN112232293B (zh) * 2020-11-09 2022-08-26 腾讯科技(深圳)有限公司 图像处理模型训练、图像处理方法及相关设备
WO2022141258A1 (zh) * 2020-12-30 2022-07-07 深圳市优必选科技股份有限公司 一种图像分类方法、计算机设备和存储介质
CN112966740B (zh) * 2021-03-05 2024-03-29 西安邮电大学 基于核心样本自适应扩充的小样本高光谱图像分类方法
CN112884062B (zh) * 2021-03-11 2024-02-13 四川省博瑞恩科技有限公司 一种基于cnn分类模型和生成对抗网络的运动想象分类方法及系统
CN113094972B (zh) * 2021-03-15 2022-08-02 西南大学 基于生成对抗网络和环境要素数据的基岩深度预测方法及系统
CN113221758B (zh) * 2021-05-16 2023-07-14 西北工业大学 一种基于gru-nin模型的水声目标识别方法
CN113537031B (zh) * 2021-07-12 2023-04-07 电子科技大学 基于多鉴别器条件生成对抗网络的雷达图像目标识别方法
CN114036357A (zh) * 2021-10-13 2022-02-11 中国科学院信息工程研究所 一种基于类敏感特征提取的不均衡网络流量分类方法和系统
CN114553611A (zh) * 2022-04-25 2022-05-27 中用科技有限公司 一种物联网设备与物联网终端的绑定方法
CN116736340A (zh) * 2023-04-11 2023-09-12 中山大学·深圳 一种欺骗信号检测方法、装置、计算机设备及存储介质
CN117076871B (zh) * 2023-10-16 2023-12-29 南京邮电大学 一种基于不平衡半监督对抗训练框架的电池故障分类方法
CN117351294B (zh) * 2023-12-06 2024-02-20 武汉大学 一种基于双功能鉴别器的图像检测方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106683048A (zh) * 2016-11-30 2017-05-17 浙江宇视科技有限公司 一种图像超分辨率方法及设备
CN107527318A (zh) * 2017-07-17 2017-12-29 复旦大学 一种基于生成对抗式网络模型的发型更换方法
CN107563428A (zh) * 2017-08-25 2018-01-09 西安电子科技大学 基于生成对抗网络的极化sar图像分类方法
CN107909621A (zh) * 2017-11-16 2018-04-13 深圳市唯特视科技有限公司 一种基于双生成对抗网络的医学图像合成方法
CN107944370A (zh) * 2017-11-17 2018-04-20 西安电子科技大学 基于dccgan模型的极化sar图像分类方法
CN107968962A (zh) * 2017-12-12 2018-04-27 华中科技大学 一种基于深度学习的两帧不相邻图像的视频生成方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106845471A (zh) * 2017-02-20 2017-06-13 深圳市唯特视科技有限公司 一种基于生成对抗网络的视觉显著性预测方法
CN107451619A (zh) * 2017-08-11 2017-12-08 深圳市唯特视科技有限公司 一种基于感知生成对抗网络的小目标检测方法
CN108062753B (zh) * 2017-12-29 2020-04-17 重庆理工大学 基于深度对抗学习的无监督域自适应脑肿瘤语义分割方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106683048A (zh) * 2016-11-30 2017-05-17 浙江宇视科技有限公司 一种图像超分辨率方法及设备
CN107527318A (zh) * 2017-07-17 2017-12-29 复旦大学 一种基于生成对抗式网络模型的发型更换方法
CN107563428A (zh) * 2017-08-25 2018-01-09 西安电子科技大学 基于生成对抗网络的极化sar图像分类方法
CN107909621A (zh) * 2017-11-16 2018-04-13 深圳市唯特视科技有限公司 一种基于双生成对抗网络的医学图像合成方法
CN107944370A (zh) * 2017-11-17 2018-04-20 西安电子科技大学 基于dccgan模型的极化sar图像分类方法
CN107944370B (zh) * 2017-11-17 2019-07-02 西安电子科技大学 基于dccgan模型的极化sar图像分类方法
CN107968962A (zh) * 2017-12-12 2018-04-27 华中科技大学 一种基于深度学习的两帧不相邻图像的视频生成方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Improved Techniques for Training GANs;Tim Salimans等;《arXiv:1606.03498v1 [cs.LG]》;20160610;第1-10页 *
Squeeze-and-Excitation Networks;Jie Hu等;《arXiv:1709.01507v2 [cs.CV]》;20180405;第1-11页 *
TEMPORAL ENSEMBLING FOR SEMI-SUPERVISED LEARNING;Samuli Laine等;《arXiv:1610.02242v3 [cs.NE]》;20170315;第1-13页 *
基于稀疏深层网络的SAR图像分类方法;龙贺兆;《中国优秀硕士学位论文全文数据库•信息科技辑》;20170315;第I136-2186 *

Also Published As

Publication number Publication date
CN108805188A (zh) 2018-11-13

Similar Documents

Publication Publication Date Title
CN108805188B (zh) 一种基于特征重标定生成对抗网络的图像分类方法
Zou et al. Deep learning based feature selection for remote sensing scene classification
CN109948029B (zh) 基于神经网络自适应的深度哈希图像搜索方法
Audebert et al. Generative adversarial networks for realistic synthesis of hyperspectral samples
CN111860982A (zh) 一种基于vmd-fcm-gru的风电场短期风电功率预测方法
CN112347970B (zh) 一种基于图卷积神经网络的遥感影像地物识别方法
CN109389171B (zh) 基于多粒度卷积降噪自动编码器技术的医疗图像分类方法
CN112560966B (zh) 基于散射图卷积网络的极化sar图像分类方法、介质及设备
CN111723874A (zh) 一种基于宽度和深度神经网络的声场景分类方法
CN113705641A (zh) 基于富上下文网络的高光谱图像分类方法
CN111695611B (zh) 一种蜂群优化核极限学习和稀疏表示机械故障识别方法
CN116844041A (zh) 一种基于双向卷积时间自注意力机制的耕地提取方法
Jin et al. Deep learning for seasonal precipitation prediction over China
CN111144500A (zh) 基于解析高斯机制的差分隐私深度学习分类方法
CN111783688B (zh) 一种基于卷积神经网络的遥感图像场景分类方法
CN113033878B (zh) 基于多拓扑分级协同粒子群lstm的滑坡位移预测方法
Chen et al. Short-term Wind Speed Forecasting Based on Singular Spectrum Analysis, Fuzzy C-Means Clustering, and Improved POABP
Surakhi et al. On the ensemble of recurrent neural network for air pollution forecasting: Issues and challenges
CN111738086A (zh) 用于点云分割的构图方法、系统及点云分割系统、装置
CN114265954B (zh) 基于位置与结构信息的图表示学习方法
CN112818982B (zh) 基于深度特征自相关性激活的农业害虫图像检测方法
CN114997378A (zh) 归纳式图神经网络剪枝方法、系统、设备及存储介质
CN111783879B (zh) 基于正交注意力机制的层次化压缩图匹配方法及系统
CN115131646A (zh) 基于离散系数的深度网络模型压缩方法
Zhou et al. A hybrid learning model based on auto-encoders

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20220829

Address after: 221100 No.26 Huangshan Road, Tongshan Economic Development Zone, Xuzhou City, Jiangsu Province

Patentee after: JIANGSU YUNYI ELECTRIC Co.,Ltd.

Address before: 221018 Xuzhou Institute of technology, No.2 Lishui Road, Yunlong District, Xuzhou City, Jiangsu Province

Patentee before: XUZHOU University OF TECHNOLOGY