CN110647927A

CN110647927A - 一种基于acgan图像半监督分类算法

Info

Publication number: CN110647927A
Application number: CN201910883908.4A
Authority: CN
Inventors: 肖红光; 赵准登
Original assignee: Changsha University of Science and Technology
Current assignee: Changsha University of Science and Technology
Priority date: 2019-09-18
Filing date: 2019-09-18
Publication date: 2020-01-03

Abstract

本发明基于ACGAN图像半监督分类算法解决在半监督学习中标签过少导致分类过拟合的问题，通过ACGAN网络中的生成器生成假数据及其对应的标签，并把假数据放入分类器中进行分类，增加带有标签的数据量，从而提高分类模型的泛化能力。

Description

一种基于ACGAN图像半监督分类算法

技术领域

本发明涉及图像识别领域，具体一种基于ACGAN图像半监督分类算法。

背景技术

在实际应用中,为分类模型提供大量的人工标签越来越困难,因此,近几年基于半监督的图像分类问题获得了越来越多的关注。大量实验表明,在生成对抗网络的训练过程中,引入少量的标签数据能获得更好的分类效果。目前最常用的半监督生成对抗网络是Improved GAN，其解决一个K+1类的分类问题，其中前K类表示真实数据的具体类别，第K+1类表示生成数据即假数据的类别。然而这个网络模型并不能对生成数据有一个具体的分类，仅仅只是把生成数据去判别真伪，对于标签稀少的数据集采用半监督学习进行分类精度提高不太明显。

发明内容

针对半监督分类标签不足造成分类结果过拟合，本发明的目的在于针对ACGAN网络结构提供了一种基于ACGAN图像半监督分类算法，通过ACGAN中的分类器生成带有标签的假数据提供给分类器进行分类，增加带标签样本的数量来提高分类精度，对于无标签数据采用香农熵以衡量分类器对于无标签数据分类的不确定度，以此来提高分类器的自信度。

为实现上述目的，本发明采用以下技术方案：

1采用minibatch方式训练，先从标准正态分布中采样m个随机分布z，和m个带标签样本中的标签c，通过矩阵融和把z和y融和成一个矩阵当成生成器G的输入，通过步长卷积生成与原图像具有相同维度的假数据X_g～P_g(X,Y)。

2判别器D1接收带标签数据X_l，不带标签数据X_u和生成数据X_g通过卷积网络生成对应的数据特征。

3判别器D2接收D1输出的图像特征，通过MLP网络输出一个数值来判别这个数据特征的真伪，判别器D1/D2与生成器G构成极大极小化博弈，其期望如公式(1)，利用梯度下降法来更新D1，D2和G中的参数

其中D(X)＝D₂(D₁(X))，κ＝(m+n)。

4分类器C接收D1输出的图像特征，通过MLP网络输出一个k维列向量，其损失函数l_C分为两部分，对于有标签数据和生成数据来说使用交叉熵来表示损失函数l_sup，如公式(3)所示；对于无标签数据使用香农熵来表示损失函数l_u，如公式(4)所示；通过对损失函数采用梯度下降法来更新D1和C中的参数；

l_C＝l_u+l_sup (2)

其中

5重复步骤1—4，通过生成器和判别器博弈，直至网络达到纳什均衡。

附图说明

图1是本发明一种实施方式的方法网络结构图；

图2是本发明在MNIST数据集下的每个部分具体实施方法。

具体实施方式

下面通过附图及具体实施方式对本发明进行详细的说明。显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。在下文对本发明的细节描述中，详尽描述了一些特定的细节部分。对本领域技术人员来说没有这些细节部分的描述也可以完全理解本发明。为了避免混淆本发明的实质，公知的方法、过程、流程、元件和电路并没有详细叙述。

一种基于ACGAN半监督图像分类算法，其网络结构如图1所示，包括步骤：

步骤一：采用minibatch方式训练，先从标准正态分布中采样m个随机分布z，和m个带标签样本中的标签c，通过矩阵融和把z和y融和成一个矩阵当成生成器G的输入，通过步长卷积生成与原图像具有相同维度的假数据X_g～P_g(X,Y)。

步骤二：判别器D1通过接收带标签数据，不带标签数据和生成数据生成对应的数据特征：

2.1采样m个有标签数据X_l～P_l(X,Y)输入到判别器D1，通过卷积神经网络生成一个一维向量D₁(X_l)作为有标签数据的特征；

2.2把m个假数据X_g～P_g(X,Y)输入到判别器D1，通过卷积神经网络生成一个一维向量D₁(X_g)作为假数据的特征；

2.3采样n个无标签数据X_u～P_u(X)输入到判别器D1，通过卷积神经网络生成一个一维向量D₁(X_u)作为无标签数据的特征。

步骤三：判别器D2接收D1输出的图像特征，通过MLP网络层输出一个数值来判别这个数据特征的真伪。判别器D1/D2与生成器G构成极大极小化博弈，其期望如公式(1)，利用梯度下降法来更新D1，D2和G中的参数：

其中D(X)＝D₂(D₁(X))，κ＝(m+n)。

由于无标签数据远小于有标签数据，为了使得上式达到纳什均衡，在无标签数据对应的期望前面乘上系数κ解决数据不平衡问题，证明如下：

当G中参数固定时，上式对D求导可得：

令导数等于0，由于P_l和P_u独立同分布，则最优判别器D(X)为：

所以当生成数据分布和真实数据分布一致时(即P_l＝P_g)，判别器D(x)＝0.5，则表明判别器和生成器达到纳什均衡。

3.1把m个假数据特征D₁(X_g)输入至判别器D2，判别器的目的则希望给假数据低分，即通过梯度下降法更新D1/D2的参数最小化式(1)中的第三项，而生成器则希望假数据能在判别器中得到高分，即通过梯度下降法更新G中的参数最大化式(1)中的第三项，所以这就构成极大极小值博弈；

3.2把m个有标签数据特征D₁(X_l)输入至判别器D2，判别器的目的则希望给真实数据高分，即通过梯度下降法更新D1/D2的参数最大化式(1)中的第一项；

3.3把n个无标签数据特征D₁(X_u)输入至判别器D2，判别器的目的则希望给真实数据高分，即通过梯度下降法更新D1/D2的参数最大化式(1)中的第二项。

步骤四：分类器C接收D1输出的图像特征，通过MLP网络输出一个k维列向量，其损失函数l_C分为两部分，对于有标签数据和生成数据来说使用交叉熵来表示损失函数l_sup，如公式(3)所示，对于无标签数据使用香农熵来表示损失函数l_u，如公式(4)所示，通过对损失函数采用梯度下降法来更新D1和C中的参数。

l_C＝l_u+l_sup (2)

其中

步骤五：重复步骤1-4，通过生成器和判别器博弈，直至网络达到纳什均衡。

网络训练完成后，分类任务只需提取判别器D1和分类器C两个部分，通过从判别器D1输入图片生成对应的图片特征向量，再通过分类器C生成其类别，从而达到半监督分类的目的。其中图2是该网络在MNIST数据集上每个部分的具体实施方法。

Claims

1.一种基于ACGAN图像半监督分类算法，其特征在于，包括步骤

1)采用minibatch方式训练，先从标准正态分布中采样m个随机分布z，和m个带标签样本中的标签c，通过矩阵融和把z和y融和成一个矩阵当成生成器G的输入，通过步长卷积生成与原图像具有相同维度的假数据X_g～P_g(X,Y)；

2)判别器D1接收带标签数据X_l，不带标签数据X_u和生成数据X_g通过卷积网络生成对应的数据特征；

3)判别器D2接收D1输出的图像特征，通过MLP网络输出一个数值来判别这个数据特征的真伪。判别器D1/D2与生成器G构成极大极小化博弈，其期望如公式(1)，利用梯度下降法来更新D1，D2和G中的参数；

其中D(X)＝D₂(D₁(X))，κ＝(m+n)

4)分类器C接收D1输出的图像特征，通过MLP网络输出一个k维列向量，其损失函数l_C分为两部分如公式(2)所示，对于有标签数据和生成数据来说使用交叉熵来表示损失函数l_sup，如公式(3)所示；对于无标签数据使用香农熵来表示损失函数l_u，如公式(4)所示；通过对损失函数采用梯度下降法来更新D1和C中的参数；

l_C＝l_u+l_sup (2)

其中

5)重复步骤1—4)，通过生成器和判别器博弈，直至网络达到纳什均衡。

2.根据权利要求1所述的一种基于ACGAN的图像半监督分类算法，其特征在于，在原有的ACGAN网络中的判别器输入加上了无标签数据。

3.根据权利要求1所述的一种基于ACGAN的图像半监督分类算法，其特征在于，把通过生成器生成的带有标签的数据视为真实数据输入到分类器中，并采用交叉熵表示损失函数。

4.根据权利要求1所述的一种基于ACGAN的图像半监督分类算法，其特征在于，通过在生成数据得分期望前乘上系数κ。

5.根据权利要求1所述的一种基于ACGAN的图像半监督分类算法，其特征在于，通过分类器对无标签数据特征采用香浓熵表示损失函数。