CN108875818B

CN108875818B - 基于变分自编码机与对抗网络结合的零样本图像分类方法

Info

Publication number: CN108875818B
Application number: CN201810574638.4A
Authority: CN
Inventors: 侯兴松; 高蕊
Original assignee: Xian Jiaotong University
Current assignee: Xian Jiaotong University
Priority date: 2018-06-06
Filing date: 2018-06-06
Publication date: 2020-08-18
Anticipated expiration: 2038-06-06
Also published as: CN108875818A

Abstract

本发明公开了一种基于变分自编码机与对抗网络结合的零样本图像分类方法，在训练模型时输入已知类别样本，由训练集样本类别映射作为条件引导，通过重建损失，生成损失，判别损失，散度损失，分类损失五种损失函数对网络进行反向传播优化参数，由未知类别的类别映射引导生成对应的未知类别的伪样本，然后用伪样本训练分类器在未知类别样本上测试。通过类别映射引导生成质量高的利于图像分类的样本，弥补了零样本情景中缺失未知类别训练样本的问题，将零样本学习转化成了传统机器学习中的监督学习，提高传统零样本学习的分类正确率，并在广义零样本学习中分类正确率也有明显的提高，为零样本学习提供了一种高效生成样本从而提高分类正确率的思路。

Description

基于变分自编码机与对抗网络结合的零样本图像分类方法

技术领域

本发明属于零样本图像分类技术领域，具体涉及一种基于变分自编码机与对抗网络结合的零样本图像分类方法。

背景技术

随着信息技术的飞速发展，模式识别是信息科学和人工智能的重要组成部分，主要应用于图像处理，语音识别，数据挖掘等学科。研究模式识别的主要目的是对样本进行分类，目前效果好的方法是监督学习，即通过大量已标注的数据进行模型的训练，然后在测试集上测试。但现实中很难获得大量标注的图片，并且有时获得的标注图片不是所需要分类的类别图片。所以零样本学习的研究具有重要的意义。零样本学习通过建立已有标注图片的类别和无法获得训练样本的类别之间的联系，从而在已知类别的图片上训练模型然后在未知类别的图片上进行分类，从而达到零样本图像分类的目的。

零样本学习的问题描述如下:

令S＝{(x,y,c(y))|x∈X_s,y∈Y_s,c(y)∈A_s}，S为已知类别的数据集，

为已知类别训练样本的特征，d为特征维度，N_s为已知类别的训练样本数。Y_s＝{y₁,...,y_K}为已知类别，设已知类别的数目有K个，

为已知类别对应的类别映射，d_a为属性个数。属性是建立已知类别和未知类别的高层语义关系的桥梁。除此之外，还已知U＝{(u,c(u))|u∈Y_u,c(u)∈A_u}，U为未知类别的数据集，Y_u＝{y₁,...,y_L}为未知类别，设未知类别的数目为L个，已知类别和未知类别是互斥的，即

为未知类别的类别映射，未知类别的数据集在训练时只已知类别和对应的类别映射，其样本X_u是未知的。给定S和U，传统零样本学习的任务为学习一个分类器f_ZSL:X→Y_u，广义零样本学习的任务为学习一个分类器f_GZSL:X→Y_s∪Y_u。

建立类别与类别间的关系需要语义信息做为载体，语义空间比样本空间抽象度高，比类别空间抽象度低的空间，语义信息作为中间层的映射，建立起了样本空间和类别空间的联系。常见的类别映射有两种，一种是属性信息，一种是类别词向量。属性可以对样本进行描述，它可以为一些些简单事物的性质：颜色特性，形状特性等；也可以是由简单的性质组成的更为复杂的描述：有皮毛的、会游泳的等。属性通常为人工标注，设计仔细，直接与视觉特征相对应，但缺点是标注成本高，属性与属性之间有关联，在进行分类识别时不一定具有很高的区分性。文本学习通常通过自然语言处理技术从无标注的语料库中直接提取类别的文本上下文描述，该技术能将文本表示为特征向量，常见的模型包有Word2Vec。使用词向量表示类别名称，词向量之间的相似度就能够较好地代表类别名称语义上的相似度。优点是可以直接从语料库中获取，适合大规模的数据，但缺点是与视觉特征不直接相关，干扰因素多。

零样本学习的方法可以大致分为三类，第一类为特征空间到语义空间的映射，把语义信息当作标签进行监督学习，在测试时先对未知样本进行属性预测，然后再通过类别与语义信息之间的关系进行类别判断，例如DAP方法(C.Lampert,H.Nickisch,andS.Harmeling,“Attribute-based classification for zero-shot visual objectcategorization,”in TPAMI,2013.1,2,4,5,6,7,8,9,10,11,12)学习了样本空间到语义空间和语义空间到类别空间的分类器，根据贝叶斯定理计算每个样本属于每个类别的概率从而进行分类。这类方法将分类任务转化成了类别映射预测和图像分类两个步骤，中间会增大误差，并且存在hubness问题。第二类方法为语义空间到特征空间的映射，由于特征空间中数据相对分散，将语义信息投影到特征空间中区分度会提高，例如UVDS方法(Y.Long,L.Liu,L.Shao,F.Shen,G.Ding,and J.Han.From zero-shot learning to conventionalsupervised classification:Unseen visual data synthesis.In CVPR,2017)将语义信息映射到特征空间，通过特征间的正交性约束增大分类判别性，然后用生成的伪样本进行分类器的训练。第三类方法将语义信息和样本投影到一个公共的空间，从而减小两个空间的结构差异，例如TMV-HLP方法(Y.Fu,T.M.Hospedales,T.Xiang,and S.Gong,“Transductive multiview zero-shot learning,”TPAMI,2015.2,3)将特征和语义信息投影到一个公共的空间，通过学习投影矩阵最大化属性和特征的内积，即最大化二者的相关性。

以上的三类方法通过挖掘样本与语义信息的关系来达到分类的任务，由于样本的缺失和映射关系学习的误差，使得大部分方法具有很大的样本偏向性，尤其是在广义零样本学习中，大部分未知样本会被误分为已知类别，从而导致方法的泛化能力低。随着生成模型，例如生成对抗网络和变分自编码机被提出，给零样本学习提供了一种新的思路，即生成未知类别的伪样本，将零样本学习转化成机器学习中的监督学习。这里不同于直接的语义信息到样本的映射，这里的语义信息作为生成模型的引导信息，以巧妙设计的目标函数约束模型，生成所需要的样本。如何利用生成模型和类别的语义信息，引导网络生成有利于最终分类任务的样本是非常关键的问题。

发明内容

本发明所要解决的技术问题在于针对上述现有技术中的不足，提供一种基于变分自编码机与对抗网络结合的零样本图像分类方法，能够弥补零样本学习中训练样本缺失的问题，利用生成的伪样本将零样本学习转化成了传统机器学习中的监督学习，从而提高了传统零样本学习的分类正确率，并且在广义零样本学习中的分类正确率也有明显的提高。

本发明采用以下技术方案：

基于变分自编码机与对抗网络结合的零样本图像分类方法，由训练集中的样本的属性标签作为条件引导，在训练模型时将已知类别的样本和样本对应的属性标签作为模型的输入，通过重建损失，生成损失，判别损失，散度损失和分类损失对网络进行反向传播优化参数，模型训练完成后，输入采样的随机高斯噪声和未知类别的属性，生成对应的未知类别的伪样本，然后用伪样本训练分类器在未知类别样本上测试，实现零样本图像分类。

具体的，包括以下步骤：

S1、用残差网络提取已知类别样本的特征X_s，维度d＝2048，制作样本相应的属性标签

和类别标签

类别标签的第K+1列代表其他类，这里设为0；

S2、定义分类器网络Classifier，设置为一层全连接隐含层，神经元个数为n_hidden_C，输出为K+1维向量，利用已知类别样本X_s对分类器网络Classifier进行预训练，对分类网络参数进行初始化从而加速之后网络训练收敛的速度，优化网络参数的损失函数如下：

L_classifier＝-log(P(Y_seen|X_s))；

S3、定义条件变分自编码机CVAE的编码器网络Encoder为两层全连接隐含层，神经元个数为n_hidden_E，Encoder的输入为

即X_s和A_seen进行向量拼接后输入；Encoder的输出为(2*d_z)维的向量，前d_z维设为X_s的均值μ(X_S)，后d_z维设为X_s的方差∑(X_S)，均值和方差包含了X_s的结构信息；

S4、从随机高斯噪声中采样得到d_z维的高斯噪声z～N(0,1)，通过加均值乘方差得到z_f＝μ(X_s)+z*∑(X_s)，同时从随机高斯噪声中采样得到d_z维的高斯噪声z_p～N(0,1)；

S5、定义散度损失L_KL；

S6、定义一个多层感知机网络作为条件变分自编码机的解码器，网络设置为一层全连接隐含层，神经元个数为n_hidden_G；

S7、选择交叉熵损失定义条件变分自编码机CVAE中的重建损失L_construction；

S8、定义生成对抗网络中的判别器网络Discriminator，设置为一层全连接隐含层，神经元个数为n_hidden_D，将已知类别样本X_s，z_f输入解码器的输出X_f和z_p输入解码器的输出X_p作为判别器网络的输入；

S9、定义判别损失函数L_{discriminator}；

S10、将X_s，X_f和X_p作为分类器网络的输入，定义分类损失函数L_classifier；

S11、定义生成损失函数，通过判别器的判定为真样本，通过分类器分类完成属于其引导属性对应的类别；

S12、整体训练网络，定义模型中每个模块的优化函数，训练模型时每个模块分别用各自对应的损失函数进行反向传播优化参数；

S13、测试时，输入为未知类别对应的属性A_unseen和随机采样的高斯噪声z_t～N(0,1)，将二者拼接

作为解码器的输入，输出为生成的未知类别的伪样本X_u'。

进一步的，步骤S5中，散度损失L_KL如下：

L_KL＝KL(q_E(z|x,a)||P_z)

其中，q_E(z|x,a)为z_f，P_z～N(0,1)，KL为两个分布的KL散度计算。

进一步的，步骤S6中，多层感知机网络分别作为条件变分自编码机CVAE中的解码器Decoder和生成对抗网络中的生成器Generator；多层感知机网络的一组输出为

另一组输出为

两组输入得到两个输出X_f＝D(z_f,A_seen)和X_p＝G(z_p,A_seen)，D代表Decoder，G代表Generator。

进一步的，步骤S9中，判别损失函数L_{discriminator}如下：

L_{discriminator}＝-(log(Dis(X_s))+log(1-Dis(X_f))+log(1-Dis(X_p)))

其中，Dis(X_s)，Dis(X_f)，Dis(X_p)分别为X_s，X_f和X_p经过判别器后的输出。

进一步的，步骤S10中，分类损失函数L_classifier如下：

L_classifier＝-log(P(Y_seen|X_s))-log(P(Y_f|X_f))-log(P(Y_p|X_p))

其中，

Y_f和Y_p均为前K列为0，第K+1列为1的矩阵，X_s为已知类别样本，X_f＝D(z_f,A_seen)为z_f输入解码器的输出，X_p＝G(z_p,A_seen)为z_p输入解码器的输出，P为概率计算。

进一步的，步骤S11中，生成损失函数L_generator如下：

L_generator＝-log(Dis(X_f))-log(Dis(X_p)))-log(P(Y_seen|X_f))-log(P(Y_seen|X_p))

其中，Dis(X_f)，Dis(X_p)分别为X_f和X_p经过判别器后的输出，Y_seen为已知类别样本的类别标签，P为概率计算。

进一步的，步骤S12中，每个模块的优化函数如下：

其中，▽为梯度，λ为正则化平衡参数，Encoder为编码器，L_KL为散度损失，L_{reconstruction}为重建损失，Decoder/Generator为解码器/生成器，L_generator为生成损失函数，Discriminator为判别器，L_{discriminator}为判别损失函数，Classifier为分类器网络，L_classifier为分类损失函数。

进一步的，针对广义零样本学习，则在步骤S2～S12中将已知类别的训练样本分成两部分，一部分X_train进行S2～S12中模型的训练，另一部分X_{test_seen}进行测试，广义零样本学习中利用未知类别的伪样本X_u'和已知类别的样本X_train一起训练一个softmax分类器，训练好后用X_{test_seen}和未知类别的真实样本X_u进行测试，计算分类正确率。

进一步的，步骤S13完成后，针对传统的零样本学习，利用未知类别的伪样本X_u'训练一个softmax分类器，将零样本学习转化成传统机器学习中的监督学习，训练好之后用真实的未知类别样本测试X_u，计算分类正确率。

与现有技术相比，本发明至少具有以下有益效果：

本发明基于变分自编码机与对抗网络结合的零样本图像分类方法，由训练集中的样本的属性标签作为条件引导，在训练模型时将已知类别的样本和样本对应的属性标签作为模型的输入，通过重建损失，生成损失，判别损失，散度损失和分类损失对网络进行反向传播优化参数，模型训练完成后，输入采样的随机高斯噪声和未知类别的属性，生成对应的未知类别的伪样本，然后用伪样本训练分类器在未知类别样本上测试，实现零样本图像分类，弥补了零样本情景中缺失未知类别训练样本的问题，利用生成的伪样本将零样本学习转化成了传统机器学习中的监督学习，从而提高了传统零样本学习的分类正确率，并且在广义零样本学习中的分类正确率也有明显的提高。

进一步的，将变分自编码机与生成对抗网络两个生成模型相结合，弥补了单独使用变分自编码机生成的样本模糊判别性差，单独使用生成对抗网络样本模式单一不易控制的缺陷，并且加入了分类器模块，从而引导生成分类效果更好的样本。

进一步的，采用属性空间到特征空间的映射，相比较特征空间到属性空间映射的零样本学习方法，第一，避免了先进行属性预测在进行图像分类的分步过程，生成的特征直接进行分类，减少了分步带来的误差；第二，特征空间到属性空间映射的方法在进行属性预测后是通过最近邻的方式进行分类，最近邻方法会带来hubness问题，使得数据在属性空间存在维数灾难和类别不平衡问题，从而导致分类结果不理想，采用特征空间作为映射空间，能够缓解hubness问题，从而提高分类的正确率。

进一步的，由于零样本学习在训练过程中未知类别的样本缺失，只能通过建立已知类别的样本与类别属性之间的联系进行建模，在广义零样本学习的任务中，由于分类的目标类别包括已知类别和未知类别，所以会导致分类结果会明显偏向于已知类别，从而导致未知类别样本的分类正确率远远低于已知类别样本的分类正确率，通过属性引导生成未知类别的伪样本，弥补了未知类别样本缺失的问题，并且在分类模块的约束下生成的样本适应于分类任务，从而提高了未知类别样本的分类正确率，使已知类别和未知类别的分类正确率差异减小，增大了模型的泛化能力。

下面通过附图和实施例，对本发明的技术方案做进一步的详细描述。

附图说明

图1为本方法的总流程图；

图2为使用本方法产生的伪样本和未知类别真实样本的样本分布情况示意图，其中，(a)为未知类别真实样本的分布，(b)为生成的未知类别伪样本的分布。

具体实施方式

本发明提供了一种基于变分自编码机与对抗网络结合的零样本图像分类方法，由训练集中的样本类别映射(本方法中的类别映射指的是每个类别的属性标签)作为条件引导。在训练模型时将已知类别的样本和样本对应的属性标签作为模型的输入，通过重建损失，生成损失，判别损失，散度损失，分类损失五种损失函数对网络进行反向传播优化参数。模型训练完成后，输入采样的随机高斯噪声和未知类别的属性，生成对应的未知类别的伪样本，然后用伪样本训练分类器在未知类别样本上测试。

请参阅图1，本发明一种基于变分自编码机与对抗网络结合的零样本图像分类方法，包括以下步骤：

和类别标签

类别标签的第K+1列代表其他类，这里设为0；

S2、定义分类器网络Classifier，设置为一层全连接隐含层，神经元个数为n_hidden_C，输出为K+1维向量，利用已知类别样本X_s对分类器网络进行预训练，对分类网络参数进行初始化从而加速之后网络训练收敛的速度，优化网络参数的损失函数为L_classifier＝-log(P(Y_seen|X_s))，softmax为交叉熵函数；

S3、定义条件变分自编码机CVAE的编码器网络Encoder，神经元个数为n_hidden_E，Encoder的输入为

由于Encoder的输入是特征，所以网络为多层感知机，设置为两层全连接隐含层。

S5、定义散度损失如下：

L_KL＝KL(q_E(z|x,a)||P_z)

其中，q_E(z|x,a)为z_f，P_z～N(0,1)，KL为两个分布的KL散度计算；

S6、定义一个多层感知机网络，网络设置为一层全连接隐含层，神经元个数为n_hidden_G；

由于模型中将条件变分自编码机CVAE和生成对抗网络进行结合，网络有两个作用：一个是作为条件变分自编码机CVAE中的解码器Decoder，另一个是作为生成对抗网络中的生成器Generator；网络有两组输入：一组为

一组为

两组输入得到两个输出X_f＝D(z_f,A_seen)和X_p＝G(z_p,A_seen)，这里为了显示条件变分自编码机CVAE和生成对抗网络网络的区别，将一个网络用两个字母表示，D代表Decoder，G代表Generator。

S7、选择交叉熵损失定义CVAE中的重建损失L_construction；

重建损失有两种选择，可以用均方误差损失，也可以用交叉熵损失，本方法选择交叉熵损失；

S8、定义生成对抗网络中的判别器网络Discriminator，设置为一层全连接隐含层，神经元个数为n_hidden_D，将X_s，X_f和X_p作为判别器网络的输入，X_s为已知类别样本，X_f＝D(z_f,A_seen)为z_f输入解码器的输出，X_p＝G(z_p,A_seen)为z_p输入解码器的输出；

S9、定义判别损失函数，判别损失函数的含义为希望判别器判定为真实样本，判别和为合成的假样本；

判别损失函数如下：

L_{discriminator}＝-(log(Dis(X_s))+log(1-Dis(X_f))+log(1-Dis(X_p)))

S10、将X_s，X_f和X_p作为分类器网络的输入，定义分类损失函数，分类损失函数的含义为希望将进行相应类别的正确分类，将和分为“其它”类，他们不属于K类中的任何一类；

定义分类损失函数如下：

L_classifier＝-log(P(Y_seen|X_s))-log(P(Y_f|X_f))-log(P(Y_p|X_p))

其中，

Y_f和Y_p分别为X_f和X_p的类别标签，二者相同，是前K列为0，第(K+1)列为1的矩阵，P为概率计算。

S11、生成损失函数的含义为希望生成的样本质量很好，然后通过判别器的判定为真样本，通过分类器分类成属于与其引导属性对应的类别；

定义生成损失函数如下：

L_generator＝-log(Dis(X_f))-log(Dis(X_p)))-log(P(Y_seen|X_f))-log(P(Y_seen|X_p))；

其中，Y_seen为已知类别样本的类别标签，P为概率计算。

每个模块的优化函数如下：

作为解码器(生成器)的输入，输出为生成的未知类别的伪样本X_u'；

S14、针对传统的零样本学习，利用未知类别的伪样本X_u'训练一个softmax分类器，将零样本学习转化成传统机器学习中的监督学习，训练好之后用真实的未知类别样本测试X_u，计算分类正确率；

S15、针对广义零样本学习，则在步骤S2～S12中将已知类别的训练样本分成两部分，一部分X_train进行S2～S12中模型的训练，另一部分X_{test_seen}进行测试。广义零样本学习中利用未知类别的伪样本X_u'和已知类别的样本X_train一起训练一个softmax分类器，训练好后用X_{test_seen}和未知类别的真实样本X_u进行测试，计算分类正确率。

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。通常在此处附图中的描述和所示的本发明实施例的组件可以通过各种不同的配置来布置和设计。因此，以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围，而是仅仅表示本发明的选定实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

A、实验条件

1.实验数据库

在AWA1,AWA2,CUB三个数据集上进行测试。AWA1和AWA2为同源数据集，数据集中有50类样本，每个类别标注了85中属性。零样本学习中将50类的样本划分成训练类40类(有需要再细分成训练类23类和验证类17类)和测试类10类，训练类加验证类即为已知类别，测试类为未知类别，二者互斥。CUB数据集中有200类样本，每个类别标注了312中属性，是一个细粒度数据集。零样本学习中将200类的样本划分成训练类150类(有需要再细分成训练类100类和验证类50类)和测试类50类。详细介绍见如下表1。

表1数据集的详细介绍

2.实验要求

实验分为两个部分：传统零样本学习和广义零样本学习。

(a)传统零样本学习：训练时已知的有已知类别的样本，已知类别对应的类别标签和属性标签，未知类别对应的类别标签和属性标签。训练时已知类别的所有样本都参与训练，测试时利用未知类别标签引导生成未知类别的伪样本，用伪样本进行分类器的训练，然后在真实的未知类别样本上进行测试，分类类别的个数为未知类别的个数。

(b)广义零样本学习：训练时已知的有已知类别的样本，已知类别对应的类别标签和属性标签，未知类别对应的类别标签和属性标签。训练时将已知类别的样本分成训练样本和测试样本，测试时利用未知类别标签引导生成未知类别的伪样本，用伪样本和已知类别的训练样本一起进行分类器的训练，然后在真实的未知类别样本和已知类别的测试样本上进行测试，分类类别的个数为数据集所有类别的个数。

3.实验参数设置

AWA1和AWA2是同源数据集，所以参数设置一样，如下表2所示：

d<sub>z</sub>	n_hidden_G	n_hidden_D	n_hidden_E	n_hidden_C	λ
						256	1000	1000	1000	1024	0.01

CUB实验参数设置如下表3所示：

d<sub>z</sub>	n_hidden_G	n_hidden_D	n_hidden_E	n_hidden_C	λ
						512	1000	1000	1000	1024	0.01

B、实验结果评价标准

1.传统零样本学习：

评价标准为平均类别分类正确率。不采用整体分类正确率的原因是由于每个类别的样本数目具有不均衡性，样本数多的类别所占的权重大于样本数少的类别。为了关注到每个类别的分类正确率，这里采用平均类别分类正确率:

其中，||Y||为分类类别数，c为其中的类别c，||y_c||为类别c中分类正确的类别数，

为类别_c中的样本总数。

2.广义零样本学习：

广义零样本学习中分类的类别不仅有未知类别，也有已知类别，这里用调和平均数H来衡量分类效果。不用平均类别分类正确率是因为已知类别的样本分类正确率会明显比未知类别的高，H值能够反应已知类别和未知类别分类正确率的平衡程度，H值越高，方法的防化能力越强。H值的计算公式如下：

其中，

为已知类别的平均类别分类正确率，

为未知类别的平均类别分类正确率。

C、对比试验方案

将本发明的CVAE-GAN-CLS算法与现有的DAP算法、IAP算法、CONSE算法、CMT算法、SSE算法、LATEM算法、DEVISE算法、SAE算法进行比较。

表4传统零样本图像分类性能比较

表5广义零样本图像分类性能比较：

tr为已知类别的平均类别分类正确率，ts为未知类别的平均类别分类正确率。

表4和表5的结果表明本方法的效果超过其它比较的方法。在传统零样本学习中本方法相比较于其他方法的分类正确率最高，说明本方法产生的样本质量很高，每个类别的分类正确率不仅高而且均衡，所以最终的平均类别分类正确率高。在广义零样本学习中，相比较的大部分方法都表现出tr远远高出ts的现象，从而导致H值偏低。这是因为相比较的方法泛化能力不够，所以分类结果对已知样本类别有明显的偏向性。本方法能够产生未知类别的有利于分类目标的伪样本，在一定程度上缓解了分类偏向性，从而使tr和ts能够平衡，从而提升了H值。两个表格的数据从客观角度证明了本方法的有效性。

请参阅图2，本方法产生的未知类别的伪样本分布中，类间距离大，类内距离小，非常有利与最终的分类任务。这是因为本方法生成样本时不仅有类别属性引导，还有分类模块做约束，使得变分自编码机和生成对抗网络生成的样本不会杂乱无章，而是有利于最终的分类任务。图2从主观角度证明了本方法的有效性。

以上内容仅为说明本发明的技术思想，不能以此限定本发明的保护范围，凡是按照本发明提出的技术思想，在技术方案基础上所做的任何改动，均落入本发明权利要求书的保护范围之内。

Claims

1.基于变分自编码机与对抗网络结合的零样本图像分类方法，其特征在于，由训练集中的样本的属性标签作为条件引导，在训练模型时将已知类别的样本和样本对应的属性标签作为模型的输入，通过重建损失，生成损失，判别损失，散度损失和分类损失对网络进行反向传播优化参数，模型训练完成后，输入采样的随机高斯噪声和未知类别的属性，生成对应的未知类别的伪样本，然后用伪样本训练分类器在未知类别样本上测试，实现零样本图像分类，包括以下步骤：

和类别标签

类别标签的第K+1列代表其他类，这里设为0；

L_classifier＝-log(P(Y_seen|X_s))；

S5、定义散度损失L_KL；

S7、选择交叉熵损失定义条件变分自编码机CVAE中的重建损失L_{reconstruction}；

S9、定义判别损失函数L_{discriminator}；

作为解码器的输入，输出为生成的未知类别的伪样本X_u'。

2.根据权利要求1所述的基于变分自编码机与对抗网络结合的零样本图像分类方法，其特征在于，步骤S5中，散度损失L_KL如下：

L_KL＝KL(q_E(z|x,a)||P_z)

3.根据权利要求1所述的基于变分自编码机与对抗网络结合的零样本图像分类方法，其特征在于，步骤S6中，多层感知机网络分别作为条件变分自编码机CVAE中的解码器Decoder和生成对抗网络中的生成器Generator；多层感知机网络的一组输出为

另一组输出为

4.根据权利要求1所述的基于变分自编码机与对抗网络结合的零样本图像分类方法，其特征在于，步骤S9中，判别损失函数L_{discriminator}如下：

L_{discriminator}＝-(log(Dis(X_s))+log(1-Dis(X_f))+log(1-Dis(X_p)))

5.根据权利要求1所述的基于变分自编码机与对抗网络结合的零样本图像分类方法，其特征在于，步骤S10中，分类损失函数L_classifier如下：

L_classifier＝-log(P(Y_seen|X_s))-log(P(Y_f|X_f))-log(P(Y_p|X_p))

其中，

6.根据权利要求1所述的基于变分自编码机与对抗网络结合的零样本图像分类方法，其特征在于，步骤S11中，生成损失函数L_generator如下：

7.根据权利要求1所述的基于变分自编码机与对抗网络结合的零样本图像分类方法，其特征在于，步骤S12中，每个模块的优化函数如下：

其中，

为梯度，λ为正则化平衡参数，Encoder为编码器，L_KL为散度损失，L_{reconstruction}为重建损失，Decoder/Generator为解码器/生成器，L_generator为生成损失函数，Discriminator为判别器，L_{discriminator}为判别损失函数，Classifier为分类器网络，L_classifier为分类损失函数。

8.根据权利要求1所述的基于变分自编码机与对抗网络结合的零样本图像分类方法，其特征在于，针对广义零样本学习，则在步骤S2～S12中将已知类别的训练样本分成两部分，一部分X_train进行S2～S12中模型的训练，另一部分X_{test_seen}进行测试，广义零样本学习中利用未知类别的伪样本X_u'和已知类别的样本X_train一起训练一个softmax分类器，训练好后用X_{test_seen}和未知类别的真实样本X_u进行测试，计算分类正确率。

9.根据权利要求1所述的基于变分自编码机与对抗网络结合的零样本图像分类方法，其特征在于，步骤S13完成后，针对传统的零样本学习，利用未知类别的伪样本X_u'训练一个softmax分类器，将零样本学习转化成传统机器学习中的监督学习，训练好之后用真实的未知类别样本测试X_u，计算分类正确率。