CN110580501B - 一种基于变分自编码对抗网络的零样本图像分类方法 - Google Patents

一种基于变分自编码对抗网络的零样本图像分类方法 Download PDF

Info

Publication number
CN110580501B
CN110580501B CN201910770543.4A CN201910770543A CN110580501B CN 110580501 B CN110580501 B CN 110580501B CN 201910770543 A CN201910770543 A CN 201910770543A CN 110580501 B CN110580501 B CN 110580501B
Authority
CN
China
Prior art keywords
visual
features
semantic
encoder
pseudo
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910770543.4A
Other languages
English (en)
Other versions
CN110580501A (zh
Inventor
冀中
崔碧莹
庞彦伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin University
Original Assignee
Tianjin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin University filed Critical Tianjin University
Priority to CN201910770543.4A priority Critical patent/CN110580501B/zh
Publication of CN110580501A publication Critical patent/CN110580501A/zh
Application granted granted Critical
Publication of CN110580501B publication Critical patent/CN110580501B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Analysis (AREA)

Abstract

一种基于变分自编码对抗网络的零样本图像分类方法,是通过构造视觉模态和语义模态两个变分自编码器并以视觉特征和语义特征分别对应作为两个变分自编码器的输入,生成伪视觉特征和语义特征,最后将真实的和生成的视觉特征和语义特征输入判别器,通过度量学习的方法完成对抗过程;然后开始训练softmax分类器,将未见类图像的视觉特征输入视觉模态的变分自编码器中,利用生成的伪视觉特征和对应的标签训练分类器;在测试的时候,将未见类样本的真实视觉特征输入分类器进行分类,实现零样本图像分类任务。本发明可以实现在更加真实的场景中的分类任务,有利于推动零样本学习应用于生产生活实际,加速深度学习算法向实用发展。

Description

一种基于变分自编码对抗网络的零样本图像分类方法
技术领域
本发明涉及一种图像分类方法。特别是涉及一种基于变分自编码对抗网络的零样本图像分类方法。
背景技术
一直以来,机器学习受到了自然语言处理、计算机视觉、语音识别等领域的广泛关注。近年来,在计算机视觉领域中,图像分类任务的性能不断提升,应用场景不断延伸,对分类技术的要求也越来越严格。随着深度卷积神经网络的发展,机器学习到达了一个新的发展高度,监督学习是机器学习的重要方法,在解决图像的分类问题中,通过大量人工标注好的图像,监督学习的性能得到不断提升,在现实生活中也实现了很好的应用价值。然而,对于图像分类任务,实际上为每个类别收集足够的有标签样本并不容易,自然界物种的数量分布呈现长尾效应,大部分样本充足的图像所属类别只占全部种类的一小部分,这就为监督学习带来了巨大挑战。因此,为解决样本标签缺失的问题,零样本学习被提出。
零样本学习可以用于解决对无标签图像的分类问题,也就是说,测试图像的类别不参与训练,与训练图像所属的类别不相交。近年来,随着研究人员的增多,零样本图像分类的性能取得了一些进展,主要工作方向可大致分为两个方向。一个是通过改进视觉特征和语义特征之间相互映射的方法来提升零样本图像分类的准确率,另一个是基于生成的方法,通过用训练数据学习到的生成模型来生成测试类别的伪视觉特征,利用生成的伪视觉特征与测试样本的真实视觉特征间的相似度关系,确定测试样本所属类别。
零样本学习通过引入可见类别与未见类别共享的类别语义信息以达到知识迁移的作用,完成对测试样本类别的预测。假设在训练阶段给出了可见类别的数据{xi,si,yi}n,其中n为可见类别样本总数,
Figure BDA0002173413780000011
是可见类别第i个样本对应的视觉特征;
Figure BDA0002173413780000012
是可见类别第i个样本对应的类别语义信息;
Figure BDA0002173413780000013
是可见类别第i个样本对应的类别标签;p、q分别是视觉和语义空间的维度。在测试阶段,根据未见类别的语义特征和类别标签{st,yt},对其视觉特征xt进行分类,其中
Figure BDA0002173413780000014
并且有
Figure BDA0002173413780000015
零样本的任务就是利用可见类别的数据训练模型,进而利用训练好的模型预测未见类别的标签yt
现存的基于生成数据的方法主要包括以下步骤:
1)利用训练样本,通过线性模型或者深度模型实现由语义空间S到视觉空间X的映射:
Figure BDA0002173413780000016
2)利用训练样本学习到的映射关系f将测试样本的语义特征映射到视觉空间,得到测试样本各个类别对应的预测视觉特征。
3)利用预测得到的视觉特征与测试样本的真实视觉特征间的相似度关系,确定测试样本所属类别。通常确定类别使用的判别标准为最近邻方法。
然而基于生成类的方法存在着以下问题:
利用线性模型实现由语义空间到视觉空间的映射时,线性模型因过于简单而不能完成对语义视觉间的完整表征。引入生成对抗网络之后,利用生成器G和判别器D间的对抗学习,训练一个可以拟合真实视觉特征的生成器G。然而,针对生成特征和真实特征的差异计算损失函数来优化性能的方法容易引发模式崩溃的问题,训练也很不稳定。现有的基于生成模型的方法考虑从语义特征到视觉特征的单项对齐,因此无法很好地实现视觉-语义的交互。还有一种基于生成的方法引入了变分自编码器(VAE),以语义信息为条件输入VAE生成伪视觉特征。但VAE由于变分下界的引入使生成的视觉特征容易失真。
发明内容
本发明所要解决的技术问题是,提供一种能够提高零样本图像分类准确率的基于变分自编码对抗网络的零样本图像分类方法。
本发明所采用的技术方案是:一种基于变分自编码对抗网络的零样本图像分类方法,是通过构造视觉模态和语义模态两个变分自编码器并以视觉特征和语义特征分别对应作为两个变分自编码器的输入,生成伪视觉特征和语义特征,最后将真实的和生成的视觉特征和语义特征输入判别器,通过度量学习的方法完成对抗过程;然后开始训练softmax分类器,将未见类图像的视觉特征输入视觉模态的变分自编码器中,利用生成的伪视觉特征和对应的标签训练分类器;在测试的时候,将未见类样本的真实视觉特征输入分类器进行分类,实现零样本图像分类任务。
首先将图像数据集分为训练集和测试集,并设定x为训练样本的视觉特征,s为训练样本的类别语义特征,xt为测试样本的视觉特征,st为测试样本的类别语义特征,然后进行如下步骤:
1)分别初始化视觉模态变分自编码器中的编码器E1和解码器D1、语义模态变分自编码器中的编码器E2和解码器D2以及判别器D的参数w1、v1、w2、v2和r;
2)将训练样本的视觉特征x和类别语义特征s随机选取设定批量的数据,分别作为编码器E1和编码器E2的输入;
3)根据如下生成伪视觉特征公式和生成伪类别语义特征公式,得到生成的伪视觉特征
Figure BDA0002173413780000021
和伪类别语义特征
Figure BDA0002173413780000022
Figure BDA0002173413780000023
Figure BDA0002173413780000024
其中,编码器E1和编码器E2的输出为潜在变量,分别用表示,z1、z2的概率分布如下表示:
p(z1|x)=Ν(μ11)   (3)
q(z2|s)=Ν(μ22)   (4)
其中,p(z1|x)和q(z2|s)分别表示潜在变量z1和z2的分布,μ1、Σ1分别表示潜在变量z1的均值和方差,μ2、Σ2分别表示潜在变量z2的均值和方差,Ν表示正态分布;
4)将训练样本的视觉特征x和类别语义特征s、生成的伪视觉特征
Figure BDA0002173413780000031
和训练样本的类别语义特征s、训练样本的视觉特征x和生成的伪类别语义特征
Figure BDA0002173413780000032
以及训练样本的视觉特征x和训练样本类别之外的其他类别语义特征s-,这四对特征对随机选取设定批量的数据,作为判别器D的输入利用度量学习的方法对输入的数据对的真假进行判断,这其中,只有(x,s)为真,
Figure BDA0002173413780000033
和(x,s-)均为假,输出一个兼容性得分来表示输入的视觉和语义特征是否匹配;
5)使用判别器D的对抗损失函数公式训练判别器D,保留使判别器D性能最好的参数r,所述的对抗损失函数公式如下:
Figure BDA0002173413780000034
其中,LD为判别器D的对抗损失函数,
Figure BDA0002173413780000035
为在训练样本的视觉特征x和类别语义特征s的联合分布上计算期望,
Figure BDA0002173413780000036
为在生成的伪视觉特征
Figure BDA0002173413780000037
和类别语义特征s的联合分布上计算期望,
Figure BDA0002173413780000038
为在训练样本的视觉特征x生成的伪视觉特征
Figure BDA0002173413780000039
的联合分布上计算期望,
Figure BDA00021734137800000310
为在训练样本的视觉特征x和训练样本类别之外的其他类别语义特征s-的联合分布上计算期望;
6)根据对齐约束函数公式,训练编码器E1和编码器E2,保留使编码器E1和编码器E2性能最好的参数w1、w2,所述对齐约束函数公式如下:
Figure BDA00021734137800000311
其中L为对齐约束函数,
Figure BDA00021734137800000312
为2范数表示;
7)使用步骤6)得到的参数w1、w2,根据生成伪视觉特征公式和生成伪类别语义特征公式,生成伪视觉特征
Figure BDA00021734137800000313
和伪类别语义特征
Figure BDA00021734137800000314
8)根据如下重构损失函数公式、视觉模态变分自编码器损失函数公式和语义模态变分自编码器损失函数公式,分别计算特征重构损失、视觉模态变分自编码器损失和语义模态变分自编码器损失,并更新编码器E1、编码器E2、解码器D1和解码器D2的参数w1、w2、v1和v2
Figure BDA00021734137800000315
Figure BDA00021734137800000316
Figure BDA00021734137800000317
其中,Lrec表示重构损失函数,LVAE-1表示视觉模态变分自编码器损失函数,LVAE-2表示语义模态变分自编码器损失函数,
Figure BDA00021734137800000318
表示分别在潜在变量z1和z2的分布上计算期望,p(x|z1)和p(s|z2)分别表示通过潜在变量z1和z2生成视觉特征和语义特征的分布,q(z1|x)和q(z2|s)潜在变量z1和z2的条件分布,p(z1)和p(z2)表示潜在变量z1和z2的先验分布,这里我们设定为正态分布,log为取对数运算,DKL为KL散度计算;
9)重复步骤2)~步骤8),达到设定的迭代次数,得到最终的编码器E1、解码器D1、编码器E2、解码器D2以及判别器D的参数w1、v1、w2、v2和r;
10)将测试样本的视觉特征xt和类别语义特征st分别输入到训练好的编码器E1和解码器D1中,得到未见类别的伪视觉特征
Figure BDA0002173413780000041
利用伪视觉特征
Figure BDA0002173413780000042
和对应的标签训练softmax分类器;
11)将测试样本的视觉特征xt输入到训练好的softmax分类器中,得到预测的类别标签,即分类结果。
本发明的一种基于变分自编码对抗网络的零样本图像分类方法,利用双变分自编码器潜在特征对齐的方法模拟视觉特征的生成过程,并利用度量学习的方法训练判别器,在二者的对抗中更直观高效地提升零样本学习的性能。其优势主要体现在:
本发明将双变分自编码器和判别器组合在一起用于零样本分类任务中,通过将视觉特征和语义特征同时输入网络,构建了一个具有两个变分自编码器和一个四输入判别器的网络结构,不仅完成了视觉特征的生成过程,而且保证了不同模态间的对齐关系,设计了适合于图像数据特征的零样本分类技术。由此,本发明能够合成更趋近于真实分布的视觉特征和语义特征。考虑到度量学习的直观性,判别器将生成的视觉特征和类别语义特征的真实性在对抗中更好地展示,可以完成视觉特征与类别语义特征的关联,使语义特征更好地监督合成更真实的视觉特征,提高了模型的泛化能力,减轻了零样本图像分类技术普遍存在的领域漂移问题,从而可以实现在更加真实的场景中的分类任务,有利于推动零样本学习应用于生产生活实际,加速深度学习算法向实用发展。
附图说明
图1是本发明中视觉模态和语义模态两个变分自编码器的结构示意图;
图2是本发明中判别器的结构示意图。
具体实施方式
下面结合实施例和附图对本发明的一种基于变分自编码对抗网络的零样本图像分类方法做出详细说明。
本发明的一种基于变分自编码对抗网络的零样本图像分类方法,假设在使用语义特征生成视觉特征的同时,考虑语义特征与视觉特征之间的双向对齐。在分别对视觉和语义模态使用两个VAE的基础上,引入一个判别器,以此达到在视觉语义特征双向对齐的同时使VAE生成伪视觉特征更接近真实特征。
本发明的一种基于变分自编码对抗网络的零样本图像分类方法,是通过构造视觉模态和语义模态两个变分自编码器(VAE)并以视觉特征和语义特征分别对应作为两个变分自编码器的输入,生成伪视觉特征和语义特征,最后将真实的和生成的视觉特征和语义特征输入判别器,通过度量学习的方法完成对抗过程;然后开始训练softmax分类器,将未见类图像的视觉特征输入视觉模态的变分自编码器中,利用生成的伪视觉特征和对应的标签训练分类器;在测试的时候,将未见类样本的真实视觉特征输入分类器进行分类,实现零样本图像分类任务。
本发明所述的一种基于变分自编码对抗网络的零样本图像分类方法,首先将图像数据集分为训练集和测试集,并设定x为训练样本的视觉特征,s为训练样本的类别语义特征,xt为测试样本的视觉特征,st为测试样本的类别语义特征。如图1、图2所示,进行如下步骤:
1)分别初始化视觉模态变分自编码器中的编码器E1和解码器D1、语义模态变分自编码器中的编码器E2和解码器D2以及判别器D的参数w1、v1、w2、v2和r;
2)将训练样本的视觉特征x和类别语义特征s随机选取设定批量的数据,分别作为编码器E1和编码器E2的输入;
3)根据如下生成伪视觉特征公式和生成伪类别语义特征公式,得到生成的伪视觉特征
Figure BDA0002173413780000051
和伪类别语义特征
Figure BDA0002173413780000052
Figure BDA0002173413780000053
Figure BDA0002173413780000054
其中,编码器E1和编码器E2的输出为潜在变量,分别用表示,z1、z2的概率分布如下表示:
p(z1|x)=Ν(μ11)   (3)
q(z2|s)=Ν(μ22)   (4)
其中,p(z1|x)和q(z2|s)分别表示潜在变量z1和z2的分布,μ1、Σ1分别表示潜在变量z1的均值和方差,μ2、Σ2分别表示潜在变量z2的均值和方差,Ν表示正态分布。特别地,在视觉模态中,将编码器E1输出的z1与相应的类别语义信息s级联,在语义信息的监督下生成更逼真的视觉特征。
4)将训练样本的视觉特征x和类别语义特征s、生成的伪视觉特征
Figure BDA0002173413780000055
和训练样本的类别语义特征s、训练样本的视觉特征x和生成的伪类别语义特征
Figure BDA0002173413780000056
以及训练样本的视觉特征x和训练样本类别之外的其他类别语义特征s-,这四对特征对随机选取设定批量的数据,作为判别器D的输入;
5)使用判别器D的对抗损失函数公式训练判别器D,保留使判别器D性能最好的参数r,所述的对抗损失函数公式如下:
Figure BDA0002173413780000057
其中,LD为判别器D的对抗损失函数,
Figure BDA0002173413780000058
为在训练样本的视觉特征x和类别语义特征s的联合分布上计算期望,
Figure BDA0002173413780000059
为在生成的伪视觉特征
Figure BDA00021734137800000510
和类别语义特征s的联合分布上计算期望,
Figure BDA00021734137800000511
为在训练样本的视觉特征x生成的伪视觉特征
Figure BDA00021734137800000512
的联合分布上计算期望,
Figure BDA00021734137800000513
为在训练样本的视觉特征x和训练样本类别之外的其他类别语义特征s-的联合分布上计算期望。
6)根据对齐约束公式,训练编码器E1和编码器E2,保留使编码器E1和编码器E2性能最好的参数w1、w2,所述对齐约束公式如下:
Figure BDA00021734137800000514
其中L为对齐约束,
Figure BDA00021734137800000515
为2范数表示。
7)使用步骤6)得到的参数w1、w2,根据生成伪视觉特征公式和生成伪类别语义特征公式,生成伪视觉特征
Figure BDA0002173413780000061
和伪类别语义特征
Figure BDA0002173413780000062
8)对于视觉和语义两个模态,希望生成的伪视觉特征和伪类别语义特征能接近真实的视觉和类别语义特征,设计重构损失函数。根据如下重构损失函数公式、视觉模态变分自编码器损失函数公式和语义模态变分自编码器损失函数公式,分别计算特征重构损失、视觉模态变分自编码器损失和语义模态变分自编码器损失,并更新编码器E1、编码器E2、解码器D1和解码器D2的参数w1、w2、v1和v2
Figure BDA0002173413780000063
Figure BDA0002173413780000064
Figure BDA0002173413780000065
其中,Lrec表示重构损失函数,LVAE-1表示视觉模态变分自编码器损失函数,LVAE-2表示语义模态变分自编码器损失函数,
Figure BDA0002173413780000066
表示分别在潜在变量z1和z2的分布上计算期望,p(x|z1)和p(s|z2)分别表示通过潜在变量z1和z2生成视觉特征和语义特征的分布,q(z1|x)和q(z2|s)潜在变量z1和z2的条件分布,p(z1)和p(z2)表示潜在变量z1和z2的先验分布,这里我们设定为正态分布,log为取对数运算,DKL为KL散度计算;
9)重复步骤2)~步骤8),达到设定的迭代次数,得到最终的编码器E1、解码器D1、编码器E2、解码器D2以及判别器D的参数w1、v1、w2、v2和r;
10)对于零样本图像分类任务,本方案利用在可见类别上训练好的变分自编码对抗网络,选择性能最好的编码器E1和解码器D1的参数w1和v1,然后将测试样本的视觉特征xt和类别语义特征st分别输入到训练好的编码器E1和解码器D1中,得到未见类别的伪视觉特征
Figure BDA0002173413780000067
利用伪视觉特征
Figure BDA0002173413780000068
和对应的标签训练softmax分类器;
11)将测试样本的视觉特征xt输入到训练好的softmax分类器中,得到预测的类别标签,即分类结果。

Claims (1)

1.一种基于变分自编码对抗网络的零样本图像分类方法,其特征在于,是通过构造视觉模态和语义模态两个变分自编码器并以视觉特征和语义特征分别对应作为两个变分自编码器的输入,生成伪视觉特征和语义特征,最后将真实的和生成的视觉特征和语义特征输入判别器,通过度量学习的方法完成对抗过程;然后开始训练softmax分类器,将未见类图像的视觉特征输入视觉模态的变分自编码器中,利用生成的伪视觉特征和对应的标签训练分类器;在测试的时候,将未见类样本的真实视觉特征输入分类器进行分类,实现零样本图像分类任务;
首先将图像数据集分为训练集和测试集,并设定x为训练样本的视觉特征,s为训练样本的类别语义特征,xt为测试样本的视觉特征,st为测试样本的类别语义特征,然后进行如下步骤:
1)分别初始化视觉模态变分自编码器中的编码器E1和解码器D1、语义模态变分自编码器中的编码器E2和解码器D2以及判别器D的参数w1、v1、w2、v2和r;
2)将训练样本的视觉特征x和类别语义特征s随机选取设定批量的数据,分别作为编码器E1和编码器E2的输入;
3)根据如下生成伪视觉特征公式和生成伪类别语义特征公式,得到生成的伪视觉特征和伪类别语义特征
其中,编码器E1和编码器E2的输出为潜在变量,分别用z1、z2表示,概率分布如下表示:
p(z1|x)=Ν(μ11)        (3)
q(z2|s)=Ν(μ22)        (4)
其中,p(z1|x)和q(z2|s)分别表示潜在变量z1和z2的分布,μ1、Σ1分别表示潜在变量z1的均值和方差,μ2、Σ2分别表示潜在变量z2的均值和方差,Ν表示正态分布;
4)将训练样本的视觉特征x和类别语义特征s、生成的伪视觉特征和训练样本的类别语义特征s、训练样本的视觉特征x和生成的伪类别语义特征以及训练样本的视觉特征x和训练样本类别之外的其他类别语义特征s-,这四对特征对随机选取设定批量的数据,作为判别器D的输入利用度量学习的方法对输入的数据对的真假进行判断,这其中,只有(x,s)为真,和(x,s-)均为假,输出一个兼容性得分来表示输入的视觉和语义特征是否匹配;
5)使用判别器D的对抗损失函数公式训练判别器D,保留使判别器D性能最好的参数r,所述的对抗损失函数公式如下:
其中,LD为判别器D的对抗损失函数,为在训练样本的视觉特征x和类别语义特征s的联合分布上计算期望,为在生成的伪视觉特征和类别语义特征s的联合分布上计算期望,为在训练样本的视觉特征x和生成的伪类别语义特征的联合分布上计算期望,为在训练样本的视觉特征x和训练样本类别之外的其他类别语义特征s-的联合分布上计算期望;
6)根据对齐约束函数公式,训练编码器E1和编码器E2,保留使编码器E1和编码器E2性能最好的参数w1、w2,所述对齐约束函数公式如下:
其中L为对齐约束函数,为2范数表示;
7)使用步骤6)得到的参数w1、w2,根据生成伪视觉特征公式和生成伪类别语义特征公式,生成伪视觉特征和伪类别语义特征
8)根据如下重构损失函数公式、视觉模态变分自编码器损失函数公式和语义模态变分自编码器损失函数公式,分别计算特征重构损失、视觉模态变分自编码器损失和语义模态变分自编码器损失,并更新编码器E1、编码器E2、解码器D1和解码器D2的参数w1、w2、v1和v2
其中,Lrec表示重构损失函数,LVAE-1表示视觉模态变分自编码器损失函数,LVAE-2表示语义模态变分自编码器损失函数,表示分别在潜在变量z1和z2的分布上计算期望,p(x|z1)和p(s|z2)分别表示通过潜在变量z1和z2生成视觉特征和语义特征的分布,q(z1|x)和q(z2|s)潜在变量z1和z2的条件分布,p(z1)和p(z2)表示潜在变量z1和z2的先验分布,这里我们设定为正态分布,log为取对数运算,DKL为KL散度计算;
9)重复步骤2)~步骤8),达到设定的迭代次数,得到最终的编码器E1、解码器D1、编码器E2、解码器D2以及判别器D的参数w1、v1、w2、v2和r;
10)将测试样本的视觉特征xt和类别语义特征st分别输入到训练好的编码器E1和解码器D1中,得到未见类别的伪视觉特征利用伪视觉特征和对应的标签训练softmax分类器;
11)将测试样本的视觉特征xt输入到训练好的softmax分类器中,得到预测的类别标签,即分类结果。
CN201910770543.4A 2019-08-20 2019-08-20 一种基于变分自编码对抗网络的零样本图像分类方法 Active CN110580501B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910770543.4A CN110580501B (zh) 2019-08-20 2019-08-20 一种基于变分自编码对抗网络的零样本图像分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910770543.4A CN110580501B (zh) 2019-08-20 2019-08-20 一种基于变分自编码对抗网络的零样本图像分类方法

Publications (2)

Publication Number Publication Date
CN110580501A CN110580501A (zh) 2019-12-17
CN110580501B true CN110580501B (zh) 2023-04-25

Family

ID=68811300

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910770543.4A Active CN110580501B (zh) 2019-08-20 2019-08-20 一种基于变分自编码对抗网络的零样本图像分类方法

Country Status (1)

Country Link
CN (1) CN110580501B (zh)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111291803B (zh) * 2020-01-21 2022-07-29 中国科学技术大学 一种图像分级粒度迁移方法、系统、设备和介质
US11748629B2 (en) * 2020-01-21 2023-09-05 Moxa Inc. Device and method of handling anomaly detection
CN111310852B (zh) * 2020-03-08 2022-08-12 桂林电子科技大学 一种图像分类方法及系统
CN111966883B (zh) * 2020-08-13 2024-02-23 成都考拉悠然科技有限公司 结合自动编码器和生成对抗网络的零样本跨模态检索方法
CN112035670B (zh) * 2020-09-09 2021-05-14 中国科学技术大学 基于图像情感倾向的多模态谣言检测方法
CN112163603A (zh) * 2020-09-15 2021-01-01 郑州金惠计算机系统工程有限公司 零样本图像识别方法、装置、电子设备及存储介质
CN112232378A (zh) * 2020-09-23 2021-01-15 中国人民解放军战略支援部队信息工程大学 面向fMRI视觉分类的零次学习方法
CN112132230B (zh) * 2020-10-09 2024-02-20 腾讯科技(深圳)有限公司 图像分类方法及装置
CN112364893B (zh) * 2020-10-23 2022-07-05 天津大学 一种基于数据增强的半监督零样本图像分类方法
CN112364894B (zh) * 2020-10-23 2022-07-08 天津大学 一种基于元学习的对抗网络的零样本图像分类方法
CN113191381B (zh) * 2020-12-04 2022-10-11 云南大学 一种基于交叉知识的图像零次分类模型及其分类方法
CN112487193B (zh) * 2020-12-18 2022-11-22 贵州大学 一种基于自编码器的零样本图片分类方法
CN112580722A (zh) * 2020-12-20 2021-03-30 大连理工大学人工智能大连研究院 一种基于条件对抗自动编码机的广义零样本图像识别方法
CN112633386A (zh) * 2020-12-26 2021-04-09 北京工业大学 基于sacvaegan的高光谱图像分类方法
CN113111917B (zh) * 2021-03-16 2022-07-01 重庆邮电大学 一种基于双重自编码器的零样本图像分类方法及装置
CN112734764A (zh) * 2021-03-31 2021-04-30 电子科技大学 一种基于对抗网络的无监督医学图像分割方法
CN113139591B (zh) * 2021-04-14 2023-02-24 广州大学 一种基于增强多模态对齐的广义零样本图像分类方法
CN113177587B (zh) * 2021-04-27 2023-04-07 西安电子科技大学 基于主动学习和变分自编码器的广义零样本目标分类方法
CN113505701A (zh) * 2021-07-12 2021-10-15 辽宁工程技术大学 一种结合知识图谱的变分自编码器零样本图像识别方法
CN113673631B (zh) * 2021-10-22 2022-03-29 广东众聚人工智能科技有限公司 异常图像检测方法及装置
CN114120041B (zh) * 2021-11-29 2024-05-17 暨南大学 一种基于双对抗变分自编码器的小样本分类方法
CN114036947B (zh) * 2021-12-09 2023-11-14 广东工业大学 一种半监督学习的小样本文本分类方法和系统

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107679556A (zh) * 2017-09-18 2018-02-09 天津大学 基于变分自动编码器的零样本图像分类方法
CN108875818A (zh) * 2018-06-06 2018-11-23 西安交通大学 基于变分自编码机与对抗网络结合的零样本图像分类方法
CN109492662A (zh) * 2018-09-27 2019-03-19 天津大学 一种基于对抗自编码器模型的零样本分类方法
WO2019055114A1 (en) * 2017-09-12 2019-03-21 Hrl Laboratories, Llc VIEW-FREE VIEW-SENSITIVE SYSTEM FOR ATTRIBUTES THROUGH SHARED REPRESENTATIONS
CN109558890A (zh) * 2018-09-30 2019-04-02 天津大学 基于自适应权重哈希循环对抗网络的零样本图像分类方法
CN109598279A (zh) * 2018-09-27 2019-04-09 天津大学 基于自编码对抗生成网络的零样本学习方法
CN109643384A (zh) * 2016-08-16 2019-04-16 诺基亚技术有限公司 用于零样本学习的方法和装置
CN109993197A (zh) * 2018-12-07 2019-07-09 天津大学 一种基于深度端对端示例差异化的零样本多标签分类方法
CN110097095A (zh) * 2019-04-15 2019-08-06 天津大学 一种基于多视图生成对抗网络的零样本分类方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109643384A (zh) * 2016-08-16 2019-04-16 诺基亚技术有限公司 用于零样本学习的方法和装置
WO2019055114A1 (en) * 2017-09-12 2019-03-21 Hrl Laboratories, Llc VIEW-FREE VIEW-SENSITIVE SYSTEM FOR ATTRIBUTES THROUGH SHARED REPRESENTATIONS
CN107679556A (zh) * 2017-09-18 2018-02-09 天津大学 基于变分自动编码器的零样本图像分类方法
CN108875818A (zh) * 2018-06-06 2018-11-23 西安交通大学 基于变分自编码机与对抗网络结合的零样本图像分类方法
CN109492662A (zh) * 2018-09-27 2019-03-19 天津大学 一种基于对抗自编码器模型的零样本分类方法
CN109598279A (zh) * 2018-09-27 2019-04-09 天津大学 基于自编码对抗生成网络的零样本学习方法
CN109558890A (zh) * 2018-09-30 2019-04-02 天津大学 基于自适应权重哈希循环对抗网络的零样本图像分类方法
CN109993197A (zh) * 2018-12-07 2019-07-09 天津大学 一种基于深度端对端示例差异化的零样本多标签分类方法
CN110097095A (zh) * 2019-04-15 2019-08-06 天津大学 一种基于多视图生成对抗网络的零样本分类方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
Edgar Schönfeld等.Generalized Zero- and Few-Shot Learning via Aligned Variational Autoencoders.《 2019 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR)》.2019, *
Generative Dual Adversarial Network for Generalized Zero-Shot Learning;He Huang等;《 2019 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR)》;20190620;第1-10页 *
SR-GAN: Semantic Rectifying Generative Adversarial Network for Zero-shot Learning;Zihan Ye等;《2019 IEEE International Conference on Multimedia and Expo (ICME)》;20190805;全文 *
Zero-Shot Visual Recognition Using Semantics-Preserving Adversarial Embedding Networks;Long Chen等;《2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition》;20181231;全文 *
一种基于直推判别字典学习的零样本分类方法;冀中等;《软件学报》;20171208;全文 *

Also Published As

Publication number Publication date
CN110580501A (zh) 2019-12-17

Similar Documents

Publication Publication Date Title
CN110580501B (zh) 一种基于变分自编码对抗网络的零样本图像分类方法
CN112364894B (zh) 一种基于元学习的对抗网络的零样本图像分类方法
CN109086658B (zh) 一种基于生成对抗网络的传感器数据生成方法与系统
CN111581405B (zh) 基于对偶学习生成对抗网络的跨模态泛化零样本检索方法
Hohman et al. Visual analytics in deep learning: An interrogative survey for the next frontiers
CN109492662B (zh) 一种基于对抗自编码器模型的零样本图像分类方法
Li et al. Deep supervision with intermediate concepts
CN105975573B (zh) 一种基于knn的文本分类方法
CN110880019B (zh) 通过无监督域适应训练目标域分类模型的方法
CN110097095B (zh) 一种基于多视图生成对抗网络的零样本分类方法
CN111859978A (zh) 一种基于深度学习的情感文本生成方法
CN109783666A (zh) 一种基于迭代精细化的图像场景图谱生成方法
CN104915673A (zh) 一种基于视觉词袋模型的目标分类方法和系统
Akhtar et al. Attack to fool and explain deep networks
Fang et al. Improving the quality of crowdsourced image labeling via label similarity
CN111444802B (zh) 一种人脸识别方法、装置及智能终端
CN110956277A (zh) 一种交互式的迭代建模系统及方法
CN116975776A (zh) 一种基于张量和互信息的多模态数据融合方法和设备
CN106021402A (zh) 用于跨模态检索的多模态多类Boosting框架构建方法及装置
CN114168795B (zh) 建筑三维模型映射及存储方法、装置、电子设备及介质
Kalash et al. Relative saliency and ranking: Models, metrics, data and benchmarks
CN111144462A (zh) 一种雷达信号的未知个体识别方法及装置
CN116704208B (zh) 基于特征关系的局部可解释方法
CN113222002A (zh) 一种基于生成式鉴别性对比优化的零样本分类方法
CN116432125B (zh) 基于哈希算法的代码分类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant