CN106778804B - 基于类别属性迁移学习的零样本图像分类方法 - Google Patents
基于类别属性迁移学习的零样本图像分类方法 Download PDFInfo
- Publication number
- CN106778804B CN106778804B CN201611033208.9A CN201611033208A CN106778804B CN 106778804 B CN106778804 B CN 106778804B CN 201611033208 A CN201611033208 A CN 201611033208A CN 106778804 B CN106778804 B CN 106778804B
- Authority
- CN
- China
- Prior art keywords
- attribute
- class
- sample
- test sample
- classes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及图像处理、图像分类技术,为提出具有高效、高准确率的图像分类技术方案。本发明:基于类别属性迁移学习的零样本图像分类方法,在间接属性预测IAP基础上,通过构建基于属性的多类别分类器模型,来判断测试样本是否具有一属性,而且能够学习到测试样本的这一属性由哪些类别迁移而来,从而学习得到更加细粒度的属性,再进行转移学习,实现零样本图像分类;其中,IAP训练阶段就是一个多类别分类器,测试阶段,通过测试样本属于各个标注类别的概率,得到测试样本的预测语义特征,最后通过预测语义特征判别测试样本属于哪个未见过的类别。本发明主要应用于图像处理。
Description
技术领域
本发明涉及图像处理、图像分类技术,具体讲,涉及基于类别属性迁移学习的零样本图像分类方法。
背景技术
对于传统图像分类系统,要想准确识别出某类图像,必须给出相应带标签的训练样本。但是,一方面,世界上的事物种类非常多,标注样本需要花费大量的人力和时间;另一方面,对于某一类事物,又可以进一步细分为许多子类,如狗又可以细分为藏獒、哈巴狗、哈士奇等,而且有些类别的标注样本很难获得。近年来,为了解决样本缺失的问题,零样本学习引起了研究者们的广泛关注。零样本图像分类的目标是构建能够识别出训练数据中没有出现过的类别的图像的分类器。与传统的图像分类方法相比,零样本图像分类在不给出所有类别的训练样本的情况下,它也能够识别出未知类别的图像。所以,零样本图像分类是解决类别标签缺失问题的一种有效方法。
为了实现零样本分类的目标,需要解决两个关键问题:(1)如何构建类别描述特征;(2)如何将视觉特征和类别描述特征联系起来。为了实现对没有训练数据的未知类别的图像的识别,需要构建类别描述特征将已知类别和未知类别联系起来。
针对关键问题一,早期工作中,通常利用类别的属性特征张成的空间作为连接底层视觉特征和高层类别标签的语义空间。属性特征是人为定义的类别之间共享的特性,如“颜色”,“纹理”,“形状”等能够描述类别语义的共同特性。根据属性特征的表征形式,属性特征可以分为二进制属性、连续属性和相对属性三种。尽管属性特征在很多视觉领域取得了成功,但是属性特征仍然存在三方面的缺陷,一是标注属性仍然需要大量的时间,二是可扩展性差,如用于描述动物类别的数据集的属性特征很难扩展到鸟类数据集;三是属性特征的标注不是从视觉样本中获得的,因此与视觉样本还存在着一定的语义差异。
近年来,随着自然语言处理技术的发展,利用文本描述特征代替属性特征的研究得到广泛关注。利用自然语言处理技术,类别的文本描述特征可以从语料库中提取。这样每一个类别就可以用文本描述空间中的一个向量进行表征。常用于获取文本描述的方法有word2vec、GloVE,word2vec是Mikolov等人提出的,它可以将语料库中的单词表示成一个向量,并且向量之间的相似度可以较好的模拟单词语义上的相似度。与属性特征相比,文本描述特征是以无监督学习的方式从语料库中提取的语义描述信息,因此具有更好的扩展性。
针对关键问题二,在给定的类别语义空间中,标注类别和未标注类别都可以利用语义空间中的向量表征。这样类别之间的语义相关性可以利用各类别在语义空间中所对应的向量之间的相似度度量。然而样本的视觉特征和类别的语义特征位于不同的空间中,因此样本和类别向量之间的相似度无法直接衡量。因此解决这个问题的关键转换为多模态学习的问题,即通过学习一种映射关系将样本的视觉特征嵌入到类别语义空间中,这样样本的视觉特征和类别的语义特征之间的相似度就可以利用嵌入向量和类别描述向量之间的距离求出。当前学习不同模态之间映射关系的方法有:Lazaridou等人分别用线性回归、典型相关分析、奇异值分解和神经网络四种方法作为映射函数,发现这些方法中神经网络的效果最好。这说明和结构简单的线性映射相比,非线性映射可以表现更为丰富的映射关系。Huang等人提出的非监督学习模型,利用维基百科语料库,通过预测每个词在上下文中出现的概率,为类别名称提取50维的文本特征。然后构造了一个两层的神经网络,将视觉空间与语义空间相联系,通过均方误差最小化构建目标函数。与上述方式不同,Norouzi等人首先用训练图像训练深度神经网络,然后直接将未见过的类别的测试图像输入神经网络,得到测试图像属于各个已见过的类别的概率。再将这些概率与相应的已见过的类别的语义特征取内积,得到测试图像的预测语义特征,最后寻找与预测语义特征最接近的未见过类别的语义特征,从而确定测试图像的类别。这种方法虽然简单,却充分利用了深度神经网络,因而也能够得到良好的效果。
另外,零样本学习是将语义信息从视觉特征空间转移到类别空间中的模型,因此属于转移学习的一种特殊情况。Lampert提出了一种间接属性预测(Indirect AttributePrediction,IAP)的方法,通过挖掘标注类别和未标注类别之间的语义关系将测试样本的视觉信息转移到对应的类别空间中,具体为:属性特征通过连接标注类别和未见过的类别转移信息,IAP训练阶段就是一个多类别分类器,测试阶段,通过测试样本属于各个标注类别的概率,得到测试样本的预测语义特征,最后通过预测语义特征判别测试样本属于哪个未见过的类别。除了利用二进制表现形式的属性特征,Parikh等人提出了利用相对属性的概念,他们在两个已知数据集(人脸和自然场景数据集)的部分属性上构建了相对属性,再通过相对属性进行转移学习,以实现零样本图像分类。由于相对属性所含语义信息更加丰富,相比于利用二进制表现形式的属性特征的方法,他们的方法取得了更好的效果。另外,Ziad通过挖掘标注类别之间的语义嵌入结构,学习某一属性的类内变化信息,并提出一种分层结构模型将不同层次的属性从训练数据转移到测试样本中。以鸟的喙为例:蜂鸟(hummingbird)和信天翁(albatross)都具有属性喙(Beak),但是这两种类别的鸟喙的形状差别明显,蜂鸟的喙是长扁形的,而信天翁的喙是宽弯形的,这说明同一属性的类内变化明显。
发明内容
为克服现有技术的不足,本发明旨在提出具有高效、高准确率的图像分类技术方案。本发明:基于类别属性迁移学习的零样本图像分类方法,在间接属性预测IAP基础上,通过构建基于属性的多类别分类器模型,来判断测试样本是否具有一属性,而且能够学习到测试样本的这一属性由哪些类别迁移而来,从而学习得到更加细粒度的属性,再进行转移学习,实现零样本图像分类;其中,IAP训练阶段就是一个多类别分类器,测试阶段,通过测试样本属于各个标注类别的概率,得到测试样本的预测语义特征,最后通过预测语义特征判别测试样本属于哪个未见过的类别。
一个实例中的具体步骤如下:
1.前期数据准备
动物属性AwA(animals with attributes)数据集共有85个属性,分别基于每个属性构造多类别分类器模型,这里需要进行样本标注,在MATLAB环境下,AwA数据集已知类别的属性特征由一个85*40维的semant变量表示,其中对于属性ai,i=1,2,...,85,如果已知类别yj具有此属性,j=1,2,...,40,则semant(i,j)=1,否则semant(i,j)=0;其它的,基于某一具体属性描述,所设计的多类别分类器模型不仅能判断测试样本是否具有这一属性,而且能够学习到测试样本的这一属性由哪些类别迁移而来:基于不同属性分别进行样本标注,最后,得到一个重新被标注的85*40维的semant变量;
2.求解模型参数
在Softmax回归(Softmax Regression)中,对于给定的测试输入x,用假设函数针对每一个类别j估算出概率值p(w=j|x),其中w为被重新标注的类别,也就是说,估计x的每一种分类结果出现的概率;因此,假设函数将要输出一个向量元素的和为1的k维的向量来表示这k个估计的概率值,具体地说,假设函数hθ(x)形式如下:
其中θ1,θ2,...,θk是模型的参数,AwA数据集共有85个属性,这就需要分别构建基于85个属性的Softmax分类器模型,利用被重新标注的样本数据训练模型,得到85个Softmax模型的最优参数;
3.计算语义值
当输入一个测试样本x时,每个Softmax分类器都会得到测试样本基于某一属性被预测为已知类别的概率分布p(wj|x),这里需要进行转移学习,利用得到的属性特征semant(i,j)=1的已知类别的概率分布预测测试样本是否具有属性ai,即:
通过以上方式,计算出测试样本的预测语义值;
4.识别未知类别
通过上述计算方式,我们将得到所有测试样本的预测语义值pred_attr,给出未知类别的属性特征attr_uni,通过求内积的方式比较二者相似度大小,即:
pred=pred_attr*attr_uni
最后,预测测试样本属于与其相似度最大的未知类别,从而实现识别未知类别的目标。
本发明的特点及有益效果是:
本发明主要是针对现有的基于属性转移学习的零样本图像分类方法主要是利用全局属性并没有考虑到类别内部属性变化明显这一问题,设计一种面向零样本图像分类领域的类别属性迁移学习方法,充分地利用原数据集中已有的丰富信息。其优势主要体现在:
(1)新颖性:针对零样本图像分类问题中属性内部变化明显这一问题,提出一种新的类别间属性迁移学习的方法,通过构建基于属性的多类别分类器模型,学习更加细粒度的属性,再进行转移学习,实现零样本图像分类。
(2)有效性:通过实验证明了与标准的间接属性预测方法相比较,本发明设计的基于类别属性迁移学习方法在零样本图像分类的实验中的性能优于前者,能够有效地利用原数据集中已有的丰富信息,从而提高分类准确率。
(3)实用性:简单可行,可以用在零样本图像分类的相关领域。
附图说明:
图1是本发明的基于类别属性迁移学习的零样本图像分类方法的流程图;
图2是本发明的基于类别属性迁移学习的零样本图像分类方法的示意图。
具体实施方式
本发明涉及一种面向零样本图像分类领域的类别属性迁移学习技术,针对零样本图像分类中类别内部属性变化明显的问题,它对传统的间接属性预测方法进行了改进,达到了有效挖掘视觉样本深层语义信息、更好预测视觉样本的属性特征目的。
本发明的目的在于提供一种基于类别属性迁移学习的零样本图像分类方法。目前零样本学习中一个常用的思想是通过属性特征连接标注类别和未见过的类别进行信息的转移,从而得到测试样本的预测语义特征。如何进行信息的转移是其中的关键技术。针对这一关键技术,本发明提出一种有效地将视觉特征转移到类别属性特征的学习框架,并利用学习到的属性特征对测试样本的类别进行预测。同时提出一种从视觉样本中挖掘深层语义信息的方法,用于建立类别与类别之间的语义关系。
对于传统图像分类系统,要想准确识别出某类图像,必须给出相应带标签的训练样本。但是,一方面,世界上的事物种类非常多,标注样本需要花费大量的人力和时间;另一方面,对于某一类事物,又可以进一步细分为许多子类,如狗又可以细分为藏獒、哈巴狗、哈士奇等,而且有些类别的标注样本很难获得。近年来,为了解决样本缺失的问题,零样本学习引起了研究者们的广泛关注。零样本图像分类的目标是构建能够识别出训练数据中没有出现过的类别的图像的分类器。与传统的图像分类方法相比,零样本图像分类在不给出所有类别的训练样本的情况下,它也能够识别出未知类别的图像。所以,零样本图像分类是解决类别标签缺失问题的一种有效方法。
为了实现零样本分类的目标,需要解决两个关键问题:(1)如何构建类别描述特征;(2)如何将视觉特征和类别描述特征联系起来。为了实现对没有训练数据的未知类别的图像的识别,需要构建类别描述特征将已知类别和未知类别联系起来。
针对关键问题一,早期工作中,通常利用类别的属性特征张成的空间作为连接底层视觉特征和高层类别标签的语义空间。属性特征是人为定义的类别之间共享的特性,如“颜色”,“纹理”,“形状”等能够描述类别语义的共同特性。根据属性特征的表征形式,属性特征可以分为二进制属性、连续属性和相对属性三种。尽管属性特征在很多视觉领域取得了成功,但是属性特征仍然存在三方面的缺陷,一是标注属性仍然需要大量的时间,二是可扩展性差,如用于描述动物类别的数据集的属性特征很难扩展到鸟类数据集;三是属性特征的标注不是从视觉样本中获得的,因此与视觉样本还存在着一定的语义差异。
近年来,随着自然语言处理技术的发展,利用文本描述特征代替属性特征的研究得到广泛关注。利用自然语言处理技术,类别的文本描述特征可以从语料库中提取。这样每一个类别就可以用文本描述空间中的一个向量进行表征。常用于获取文本描述的方法有word2vec、GloVE,word2vec是Mikolov等人提出的,它可以将语料库中的单词表示成一个向量,并且向量之间的相似度可以较好的模拟单词语义上的相似度。与属性特征相比,文本描述特征是以无监督学习的方式从语料库中提取的语义描述信息,因此具有更好的扩展性。
针对关键问题二,在给定的类别语义空间中,标注类别和未标注类别都可以利用语义空间中的向量表征。这样类别之间的语义相关性可以利用各类别在语义空间中所对应的向量之间的相似度度量。然而样本的视觉特征和类别的语义特征位于不同的空间中,因此样本和类别向量之间的相似度无法直接衡量。因此解决这个问题的关键转换为多模态学习的问题,即通过学习一种映射关系将样本的视觉特征嵌入到类别语义空间中,这样样本的视觉特征和类别的语义特征之间的相似度就可以利用嵌入向量和类别描述向量之间的距离求出。当前学习不同模态之间映射关系的方法有:Lazaridou等人分别用线性回归、典型相关分析、奇异值分解和神经网络四种方法作为映射函数,发现这些方法中神经网络的效果最好。这说明和结构简单的线性映射相比,非线性映射可以表现更为丰富的映射关系。Huang等人提出的非监督学习模型,利用维基百科语料库,通过预测每个词在上下文中出现的概率,为类别名称提取50维的文本特征。然后构造了一个两层的神经网络,将视觉空间与语义空间相联系,通过均方误差最小化构建目标函数。与上述方式不同,Norouzi等人首先用训练图像训练深度神经网络,然后直接将未见过的类别的测试图像输入神经网络,得到测试图像属于各个已见过的类别的概率。再将这些概率与相应的已见过的类别的语义特征取内积,得到测试图像的预测语义特征,最后寻找与预测语义特征最接近的未见过类别的语义特征,从而确定测试图像的类别。这种方法虽然简单,却充分利用了深度神经网络,因而也能够得到良好的效果。
另外,零样本学习是将语义信息从视觉特征空间转移到类别空间中的模型,因此属于转移学习的一种特殊情况。Lampert提出了一种间接属性预测(Indirect AttributePrediction,IAP)的方法,通过挖掘标注类别和未标注类别之间的语义关系将测试样本的视觉信息转移到对应的类别空间中,具体为:属性特征通过连接标注类别和未见过的类别转移信息,IAP训练阶段就是一个多类别分类器,测试阶段,通过测试样本属于各个标注类别的概率,得到测试样本的预测语义特征,最后通过预测语义特征判别测试样本属于哪个未见过的类别。除了利用二进制表现形式的属性特征,Parikh等人提出了利用相对属性的概念,他们在两个已知数据集(人脸和自然场景数据集)的部分属性上构建了相对属性,再通过相对属性进行转移学习,以实现零样本图像分类。由于相对属性所含语义信息更加丰富,相比于利用二进制表现形式的属性特征的方法,他们的方法取得了更好的效果。另外,Ziad通过挖掘标注类别之间的语义嵌入结构,学习某一属性的类内变化信息,并提出一种分层结构模型将不同层次的属性从训练数据转移到测试样本中。以鸟的喙为例:蜂鸟(hummingbird)和信天翁(albatross)都具有属性喙(Beak),但是这两种类别的鸟喙的形状差别明显,蜂鸟的喙是长扁形的,而信天翁的喙是宽弯形的,这说明同一属性的类内变化明显。
本发明所提供的方法主要是在传统的间接属性预测(IAP)方法的基础上,为了解决类别内部属性变化明显的问题,通过构建基于属性的多类别分类器模型,它不仅能判断测试样本是否具有这一属性,而且能够学习到测试样本的这一属性由哪些类别迁移而来。从而学习得到更加细粒度的属性,再进行转移学习,实现零样本图像分类。
IAP训练阶段就是一个多类别分类器,测试阶段,通过测试样本属于各个标注类别的概率,得到测试样本的预测语义特征,最后通过预测语义特征判别测试样本属于哪个未见过的类别。本发明的方法是通过构建基于属性的多类别分类器模型。
下面以AwA数据集为例,基本步骤如下:
1.前期数据准备
AwA数据集共有85个属性,那就分别基于每个属性构造多类别分类器模型,这里需要进行样本标注。在MATLAB环境下,AwA数据集已知类别的属性特征由一个85*40维的semant变量表示,其中对于属性ai(i=1,2,...,85),如果已知类别yj(j=1,2,...,40)具有此属性,则semant(i,j)=1,否则semant(i,j)=0;但是,比如对于尾巴这一属性,已知类别中狗和鲸鱼都是有尾巴的,但是两种动物类别尾巴的形状差别很大,当输入一个类别为狼的测试样本,由于已知类别狗和测试样本狼视觉空间描述相近,所以,狼的尾巴属性由狗的尾巴属性迁移得到。基于某一具体属性描述,所设计的多类别分类器模型不仅能判断测试样本是否具有这一属性,而且能够学习到测试样本的这一属性由哪些类别迁移而来。首先,基于不同属性分别进行样本标注,对于属性ai(i=1,2,...,85),将具有属性ai的已知类别依次标注为一类,再将所有不具有属性ai的已知类别统一标注为另一类,最后,得到一个重新被标注的85*40维的semant变量。
2.求解模型参数
由于我们解决的是多分类问题,选择使用Softmax分类器,在Softmax回归中,对于给定的测试输入x,我们想用假设函数针对每一个类别j估算出概率值p(w=j|x),其中y为被重新标注的类别。也就是说,我们想估计x的每一种分类结果出现的概率。因此,我们的假设函数将要输出一个k维的向量(向量元素的和为1)来表示这k个估计的概率值。具体地说,我们的假设函数hθ(x)形式如下:
其中θ1,θ2,...,θk是模型的参数。AwA数据集共有85个属性,这就需要分别构建基于85个属性的Softmax分类器模型,利用被重新标注的样本数据训练模型,得到85个Softmax模型的最优参数。
3.计算语义值
当输入一个测试样本x时,每个Softmax分类器都会得到测试样本基于某一属性被预测为已知类别的概率分布p(wj|x),这里需要进行转移学习,利用得到的属性特征semant(i,j)=1的已知类别的概率分布预测测试样本是否具有属性ai,即:
通过以上方式,可以有效地计算出测试样本的预测语义值。
5.识别未知类别
通过上述计算方式,我们将得到所有测试样本的预测语义值pred_attr,给出未知类别的属性特征attr_uni,我们可以通过求内积的方式比较二者相似度大小,即:
pred=pred_attr*attr_uni
最后,预测测试样本属于与其相似度最大的未知类别。从而实现识别未知类别的目标。
下面结合附图和具体实施方式进一步详细说明本发明。
图1描述了所提出的基于类别属性迁移学习的零样本图像分类方法的流程图,与间接属性预测方法一样,它也通过属性特征实现类别间的转移学习,属性特征连接标注类别和未标注类别(未知类别),但是,本方法在训练阶段需要训练85个多类别分类器,如图2所示,分别构建基于85个属性的Softmax分类器模型,利用被重新标注的样本数据训练模型,测试时,对标注类别的预测通过转移学习计算出测试样本的预测语义值,从而实现对未知类别的识别。
以AwA数据集为例,其中已知类别Y={y1,y2,...,y40},未知类别Z={z1,z2,...,z10},属性空间A={a1,a2,...,a85},已知类别的属性特征由一个85*40维的semant变量表示,样本标注时,对于属性ai,计算得到所有满足semant(i,j)=1条件的已知类别yj个数ni,顺序标注已知类别yj对应的semant(i,j)为1,2,...,ni,再将所有满足semant(i,j)=0条件的已知类别yj对应的semant(i,j)统一标注为ni+1,最后,得到一个重新被标注的85*40维的semant变量。
如图2所示,构建完基于85个属性的Softmax分类器模型,利用被重新标注的样本数据训练模型,得到最优的模型参数。
测试时,当输入一个未知类别的样本,每个Softmax分类器都会得到测试样本基于对应属性被预测为已知类别的概率值,如图2所示,利用得到的概率值转移学习预测测试样本是否具有这一属性,通过下述公式:
通过以上方式,可以有效地计算出测试样本的预测语义值。
通过上述计算方式,我们将得到所有测试样本的预测语义值pred_attr,给出未知类别的属性特征attr_uni,我们可以通过求内积的方式比较二者相似度大小,即:
pred=pred_attr*attr_uni
最后,预测测试样本属于与其相似度最大的未知类别。从而实现识别未知类别的目标。
Claims (1)
1.一种基于类别属性迁移学习的零样本图像分类方法,其特征是,在间接属性预测IAP基础上,通过构建基于属性的多类别分类器模型,来判断测试样本是否具有一属性,而且能够学习到测试样本的这一属性由哪些类别迁移而来,从而学习得到更加细粒度的属性,再进行转移学习,实现零样本图像分类;其中,IAP训练阶段就是一个多类别分类器,测试阶段,通过测试样本属于各个标注类别的概率,得到测试样本的预测语义特征,最后通过预测语义特征判别测试样本属于哪个未见过的类别;具体步骤如下:
1)前期数据准备
动物属性AwA数据集共有85个属性,分别基于每个属性构造多类别分类器模型,这里需要进行样本标注,在MATLAB环境下,AwA数据集已知类别的属性特征由一个85*40维的semant变量表示,其中对于属性ai,i=1,2,...,85,如果已知类别yj具有此属性,j=1,2,...,40,则semant(i,j)=1,否则semant(i,j)=0;其它的,基于某一具体属性描述,所设计的多类别分类器模型不仅能判断测试样本是否具有这一属性,而且能够学习到测试样本的这一属性由哪些类别迁移而来:基于不同属性分别进行样本标注,最后,得到一个重新被标注的85*40维的semant变量;
2)求解模型参数
在Softmax回归中,对于给定的测试输入x,用假设函数针对每一个类别j估算出概率值p(w=j|x),其中w为被重新标注的类别,也就是说,估计x的每一种分类结果出现的概率;因此,假设函数将要输出一个向量元素的和为1的k维的向量来表示这k个估计的概率值,具体地说,假设函数hθ(x)形式如下:
其中θ1,θ2,...,θk是模型的参数,AwA数据集共有85个属性,这就需要分别构建基于85个属性的Softmax分类器模型,利用被重新标注的样本数据训练模型,得到85个Softmax模型的最优参数;
3)计算语义值
当输入一个测试样本x时,每个Softmax分类器都会得到测试样本基于某一属性被预测为已知类别的概率分布p(yj|x),这里需要进行转移学习,利用得到的属性特征semant(i,j)=1的已知类别的概率分布预测测试样本是否具有属性ai,即:
通过以上方式,计算出测试样本的预测语义值;
4)识别未知类别
通过上述计算方式,我们将得到所有测试样本的预测语义值pred_attr,给出未知类别的属性特征attr_uni,通过求内积的方式比较二者相似度大小,即:
pred=pred_attr*attr_uni
最后,预测测试样本属于与其相似度最大的未知类别,从而实现识别未知类别的目标。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611033208.9A CN106778804B (zh) | 2016-11-18 | 2016-11-18 | 基于类别属性迁移学习的零样本图像分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611033208.9A CN106778804B (zh) | 2016-11-18 | 2016-11-18 | 基于类别属性迁移学习的零样本图像分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106778804A CN106778804A (zh) | 2017-05-31 |
CN106778804B true CN106778804B (zh) | 2020-10-20 |
Family
ID=58971882
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611033208.9A Active CN106778804B (zh) | 2016-11-18 | 2016-11-18 | 基于类别属性迁移学习的零样本图像分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106778804B (zh) |
Families Citing this family (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107516109B (zh) * | 2017-08-21 | 2021-01-19 | 天津大学 | 一种基于非线性语义嵌入的零样本分类方法 |
CN107766890B (zh) * | 2017-10-31 | 2021-09-14 | 天津大学 | 一种细粒度识别中判别性图块学习的改进方法 |
CN108399421B (zh) * | 2018-01-31 | 2022-04-01 | 南京邮电大学 | 一种基于词嵌入的深度零样本分类方法 |
CN108376267B (zh) * | 2018-03-26 | 2021-07-13 | 天津大学 | 一种基于类别转移的零样本分类方法 |
CN108846413B (zh) * | 2018-05-21 | 2021-07-23 | 复旦大学 | 一种基于全局语义一致网络的零样本学习方法 |
CN109492662B (zh) * | 2018-09-27 | 2021-09-14 | 天津大学 | 一种基于对抗自编码器模型的零样本图像分类方法 |
CN109685078B (zh) * | 2018-12-17 | 2022-04-05 | 浙江大学 | 基于自动标注的红外图像识别方法 |
CN109657723A (zh) * | 2018-12-20 | 2019-04-19 | 四川新网银行股份有限公司 | 一种增强高维类别特征表达能力的方法 |
CN109886289A (zh) * | 2019-01-08 | 2019-06-14 | 深圳禾思众成科技有限公司 | 一种深度学习方法、设备及计算机可读存储介质 |
CN111435453B (zh) * | 2019-01-14 | 2022-07-22 | 中国科学技术大学 | 细粒度图像零样本识别方法 |
CN109816048B (zh) * | 2019-02-15 | 2021-02-05 | 聚时科技(上海)有限公司 | 一种基于属性迁移的图像合成方法 |
CN109934302B (zh) * | 2019-03-23 | 2021-12-07 | 大国创新智能科技(东莞)有限公司 | 新类别识别方法和基于模糊理论和深度学习的机器人系统 |
CN110427814A (zh) * | 2019-06-24 | 2019-11-08 | 深圳云天励飞技术有限公司 | 一种骑行者重识别方法、装置及设备 |
CN110689087B (zh) * | 2019-10-10 | 2023-04-18 | 西南石油大学 | 一种基于概率似然的图像样本生成方法 |
CN110909760B (zh) * | 2019-10-12 | 2021-03-16 | 中国人民解放军国防科技大学 | 一种基于卷积神经网络的图像开放集识别方法 |
CN110704662A (zh) * | 2019-10-17 | 2020-01-17 | 广东工业大学 | 一种图像分类方法及系统 |
CN112926609B (zh) * | 2019-12-05 | 2023-01-24 | 上海高德威智能交通系统有限公司 | 图像处理方法及装置 |
CN111291803B (zh) * | 2020-01-21 | 2022-07-29 | 中国科学技术大学 | 一种图像分级粒度迁移方法、系统、设备和介质 |
CN111461025B (zh) * | 2020-04-02 | 2022-07-05 | 同济大学 | 一种自主进化的零样本学习的信号识别方法 |
CN112257765B (zh) * | 2020-10-16 | 2022-09-23 | 济南大学 | 基于未知类相似类别集的零样本图像分类方法及系统 |
CN112364895B (zh) * | 2020-10-23 | 2023-04-07 | 天津大学 | 一种基于属性继承的图卷积网络零样本学习方法 |
CN113139664B (zh) * | 2021-04-30 | 2023-10-10 | 中国科学院计算技术研究所 | 一种跨模态的迁移学习方法 |
CN113255701B (zh) * | 2021-06-24 | 2021-10-22 | 军事科学院系统工程研究院网络信息研究所 | 一种基于绝对-相对学习架构的小样本学习方法和系统 |
CN113627470B (zh) * | 2021-07-01 | 2023-09-05 | 汕头大学 | 一种基于零次学习的光纤预警系统未知事件分类方法 |
CN113688879B (zh) * | 2021-07-30 | 2024-05-24 | 南京理工大学 | 一种基于置信度分布外检测的广义零样本学习分类方法 |
CN114937179B (zh) * | 2022-07-27 | 2022-12-13 | 深圳市海清数字技术有限公司 | 垃圾图像分类方法、装置、电子设备及存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105701514A (zh) * | 2016-01-15 | 2016-06-22 | 天津大学 | 一种用于零样本分类的多模态典型相关分析的方法 |
CN105718940A (zh) * | 2016-01-15 | 2016-06-29 | 天津大学 | 基于多组间因子分析的零样本图像分类方法 |
-
2016
- 2016-11-18 CN CN201611033208.9A patent/CN106778804B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105701514A (zh) * | 2016-01-15 | 2016-06-22 | 天津大学 | 一种用于零样本分类的多模态典型相关分析的方法 |
CN105718940A (zh) * | 2016-01-15 | 2016-06-29 | 天津大学 | 基于多组间因子分析的零样本图像分类方法 |
Non-Patent Citations (1)
Title |
---|
Learning To Detect Unseen Object Classes by Between-Class Attribute Transfer;Christoph H. Lampert等;《2009 IEEE Conference on Computer Vision and Pattern Recognition》;20090818;第951-958页 * |
Also Published As
Publication number | Publication date |
---|---|
CN106778804A (zh) | 2017-05-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106778804B (zh) | 基于类别属性迁移学习的零样本图像分类方法 | |
CN108376267B (zh) | 一种基于类别转移的零样本分类方法 | |
CN107133569B (zh) | 基于泛化多标记学习的监控视频多粒度标注方法 | |
CN109002834B (zh) | 基于多模态表征的细粒度图像分类方法 | |
CN111444342B (zh) | 一种基于多重弱监督集成的短文本分类方法 | |
Selvaraju et al. | Choose your neuron: Incorporating domain knowledge through neuron-importance | |
CN109993197A (zh) | 一种基于深度端对端示例差异化的零样本多标签分类方法 | |
CN110826639B (zh) | 一种利用全量数据训练零样本图像分类方法 | |
CN110633708A (zh) | 一种基于全局模型和局部优化的深度网络显著性检测方法 | |
CN111125406A (zh) | 一种基于自适应聚类学习的视觉关系检测方法 | |
CN115410026A (zh) | 基于标签传播对比半监督学习的图像分类方法与系统 | |
CN105718940A (zh) | 基于多组间因子分析的零样本图像分类方法 | |
Feng et al. | Transductive multi-instance multi-label learning algorithm with application to automatic image annotation | |
CN111461323B (zh) | 一种图像识别方法及装置 | |
CN110705384B (zh) | 一种基于跨域迁移增强表示的车辆再识别方法 | |
Zhu et al. | Age estimation algorithm of facial images based on multi-label sorting | |
Lonij et al. | Open-world visual recognition using knowledge graphs | |
Thompson et al. | finFindR: Computer-assisted recognition and identification of bottlenose dolphin photos in r | |
Yazici et al. | Color naming for multi-color fashion items | |
CN116910571A (zh) | 一种基于原型对比学习的开集域适应方法及系统 | |
CN112307914B (zh) | 一种基于文本信息指导的开放域图像内容识别方法 | |
CN114510610A (zh) | 面向多模态知识图谱构建的识别视觉概念的方法 | |
CN114842301A (zh) | 一种图像注释模型的半监督训练方法 | |
CN113223018A (zh) | 细粒度图像分析处理方法 | |
CN114299342B (zh) | 一种基于深度学习的多标记图片分类中未知标记分类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |