CN108376267B - 一种基于类别转移的零样本分类方法 - Google Patents
一种基于类别转移的零样本分类方法 Download PDFInfo
- Publication number
- CN108376267B CN108376267B CN201810252217.XA CN201810252217A CN108376267B CN 108376267 B CN108376267 B CN 108376267B CN 201810252217 A CN201810252217 A CN 201810252217A CN 108376267 B CN108376267 B CN 108376267B
- Authority
- CN
- China
- Prior art keywords
- matrix
- semantic
- category
- features
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
一种基于类别转移的零样本分类方法:获取C个类别的训练样本的视觉特征,训练样本的类别语义特征以及真实标签矩阵;采用余弦相似度或高斯相似度通过类别语义特征计算语义相似度矩阵;计算类别语义相似度矩阵的对角矩阵;调用MATLAB工具箱中的Sylvester方程求解算法得到映射矩阵;向目标函数输入训练样本的视觉特征,对应的类别语义特征以及真实标签矩阵,不断调整模型正则化参数的值,求得目标函数的最小值,模型训练完成;在测试阶段,输入测试样本的视觉特征及对应语义特征,计算分类得分,得分最高的类别即为测试样本的预测类别。本发明可充分挖掘不同类别间的语义关系,实现已知与未知类别分类器间的知识迁移,可以方便地应用于图像分类。
Description
技术领域
本发明涉及一种零样本分类方法。特别是涉及一种实现从已知类别到未知类别的知识迁移的基于类别转移的零样本分类方法。
背景技术
图像分类技术在快速准确地获取图像信息中发挥着重要作用。传统的图像分类,需要在训练阶段为所有类别提供带标签的训练样本,一方面,伴随着信息多媒体技术的发展,图像数量和种类大大增加,人工标注工作量极大,且效率低,专业性要求高;另一方面,对于一些稀有类别,训练样本往往难以获得。因此,为所有目标类别提供人工标注的训练样本并不现实,如何解决没有训练样本的目标类别分类问题,即零样本(Zero-ShotLearning,ZSL)分类问题,愈发引起关注。
人类具有即使没有见过某类视觉样本,也能够借助辅助信息推断出新类别的能力。例如,一个人只见过马而没有见过斑马,当他得到描述信息,即斑马与马外表相似,只是身上有黑白相间的条纹,那么此人就极有可能正确识别出斑马这一新类别。零样本学习正是受人类这一能力启发,致力于解决当带标签的训练数据不足以涵盖所有目标类别,仅给出对于未知类别的一些描述时,如何进行分类的问题。人类之所以具有这种能力,是因为人脑能够将已知类别和未知类别通过物体的语义信息建立联系。类似地,在零样本学习过程中,通过训练将带有标签的训练数据的视觉信息与相应已知类别的语义信息建立映射关系;然后,通过这种映射关系,将没有标签的测试数据的视觉信息与相应未知类别的语义信息相联系;最后,根据与语义信息最接近的类别为测试数据进行分类,并赋予标签。
传统的零样本分类大多是采用基于映射的方法,通过训练合适的兼容模型,使样本的视觉特征嵌入到语义特征空间,或将两种模态的特征嵌入到公共隐空间。近年来又有学者提出从语义空间到视觉空间的反向映射方法。
发明内容
本发明所要解决的技术问题是,提供一种可利用训练阶段学习到的已知类别分类器对未知类别样本进行合理的标签预测的基于类别转移的零样本分类方法。
本发明所采用的技术方案是:一种基于类别转移的零样本分类方法,包括如下步骤:
1)获取C个类别的训练样本的视觉特征X,训练样本的类别语义特征A以及真实标签矩阵Y;
2)采用余弦相似度或高斯相似度通过类别语义特征A计算语义相似度矩阵S;计算类别语义相似度矩阵S的对角矩阵D:其中Dii是对角矩阵D的每个对角元素Sij是S 的每个元素;最后计算出拉普拉斯矩阵L=D-S;
3)调用MATLAB工具箱中的Sylvester方程求解算法求出下式的解,得到映射矩阵V;
XXTV+V(λAL+β)(AAT)-1=XYA-1
式中,λ和β是模型正则化参数;
4)向如下目标函数输入训练样本的视觉特征X,对应的类别语义特征A以及真实标签矩阵Y,不断调整模型正则化参数λ和β的值,求得如下的目标函数的最小值,
式中,ai和aj分别代表第i个类别的语义特征和第j个类别的语义特征;
保留此时模型正则化参数λ和β的值及矩阵V,模型训练完成;
5)在测试阶段,输入测试样本的视觉特征xui及对应语义特征aui,根据下式计算分类得分,得分最高的类别即为测试样本的预测类别,
步骤1)所述的训练样本、对应的类别语义特征A以及真实标签矩阵Y和步骤5)所述的测试样本均是从AWA数据集或CUB数据集中获得。
步骤1)所述的视觉特征X是通过卷积神经网络提取。
步骤4)中所述目标函数获得是:在分类任务中,若需要为C个已知类别学习分类器,要优化的模型如下:
其中,W为要学习的分类器,L代表某种形式的目标函数,Ω为正则项约束,
考虑到语义信息的辅助作用,将分类器W分解为W=VA,此时模型变为:
通过对分类器W进行分解得到矩阵V∈Rp×q,便直接将样本的视觉特征和语义特征联系起来,其中:
从而利用矩阵V实现从已知类别到未知类别的知识迁移。
本发明的一种基于类别转移的零样本分类方法,在传统基于映射的零样本学习模型基础上,将所学分类器分解为语义空间A与隐空间V相乘,并将流形思想应用到零样本分类任务,可充分挖掘不同类别间的语义关系,实现已知与未知类别分类器间的知识迁移;本发明最终可归为Sylvester方程求解问题,结构简单易于实现,可以方便地应用于图像分类,目标识别与检测等计算机视觉任务中。同时语义特征可以方便的扩展为属性特征,Word2Vec等多种不同形式,且隐空间映射矩阵V可以尝试用非线性方法来代替。
附图说明
图1是本发明一种基于类别转移的零样本分类方法的流程图示意图。
其中,X是训练样本的视觉特征;A训练样本的类别语义特征;V是映射矩阵;W=VA为训练样本的分类器;Xu是测试样本的视觉特征;Au是测试样本的类别语义特征;Wu=VAu为测试样本的分类器。
具体实施方式
下面结合实施例和附图对本发明的一种基于类别转移的零样本分类方法做出详细说明。
本发明的一种基于类别转移的零样本分类方法是从分类器学习的角度出发,利用样本语义关系实现不同类别分类器之间的知识迁移,从而可利用训练阶段学习到的已知类别分类器对未知类别样本进行合理的标签预测。
本发明适用于解决跨模态的零样本学习问题。本发明以视觉特征和语义特征代表来自两个不同模态的特征,用X=[x1,...,xi,...,xN]∈Rp×N表示训练阶段来自C个已知类别的N个样本的视觉特征空间,其中p代表视觉特征的维度;用A=[a1,...,ai,...,aC]∈Rq×C代表与C个已知类别相对应的类别语义空间(属性空间或文本描述空间等),其中q代表语义特征的维度,例如ai代表第i个类别的语义矢量。此外,定义Y∈{0,1}N×C表示所有训练样本对应的真实标签集合。用表示来自U个未知类别的M个样本视觉特征集合,为U个未知类别样本对应的语义特征集合。在零样本分类任务中,C和U是互不相交的,零样本分类的目标即为对未知类别样本进行分类。
在传统的分类任务中,若需要为C个已知类别学习一个分类器,要优化的模型如下:
其中,W为训练阶段要学习的分类器,L代表某种形式的目标函数,Ω为正则项约束。通过选取不同的目标函数和正则项,将会得到不同的优化策略。
在零样本分类任务中,考虑到语义信息的辅助作用,本发明将分类器W分解为W=VA,此时模型变为:
通过对分类器W进行分解得到矩阵V∈Rp×q,便可直接将样本的视觉特征和语义特征联系起来,这样就可利用矩阵V实现从已知类别到未知类别的知识迁移。
为进一步增强模型的迁移能力,本发明利用类别的语义相似度对分类器施加基于流形的语义正则项约束:
其中Sij代表第i个已知类别和第j个已知类别的语义相似度。本发明提出的语义正则项约束基于以下假设:如果两个类别在语义上很接近,那么每个语义特征a经过V映射到特征空间 Va后,也应该比较接近,即利用语义信息辅助训练得到的这两个类别的分类器应该比较相似。比如在零样本学习常用数据集AWA中,hamster(仓鼠)和mouse(老鼠)这两个类别在语义上十分接近,它们的属性向量将会有较高相似度,那么经过训练后得到的分类器也应该比较接近,从而尽可能保证样本不会被错分到相关性较小的类别中去。
上述模型(2)的第二项正则项约束为:
其中||||F代表矩阵的弗罗贝尼乌斯范数。该项约束保证V空间欧式距离尽可能小。
本发明选取欧氏距离惩罚项作为本模型的损失函数,因此模型最终可表示为:
其中,λ和β为模型正则化参数。
接下来对模型求解过程进行简要分析,对模型(5)进行线性代数变换,并记
L(V)=tr(XTVA-Y)(XTVA-Y)T+λtr(ATVTLVA)+βtr(VVT) (6)
对参数V求导,得
XXTVAAT+V(λAL+β)=XYAT (8)
右乘(AAT)-1,得
XXTV+V(λAL+β)(AAT)-1=XYAT(AAT)-1 (9)
XXTV+V(λAL+β)(AAT)-1=XYA-1 (10)
最终方程(10)可通过求解Sylvester方程获得V的闭式解,实际操作中调用MATLAB工具箱即可求解。
在测试阶段,只需根据公式(11),输入测试样本的视觉特征及对应的语义特征,即可通过训练所得矩阵V学习到测试样本对应的分类器,为测试样本进行标签预测。
如图1所示,本发明的一种基于类别转移的零样本分类方法,具体包括如下步骤:
1)获取C个类别的训练样本的视觉特征X,训练样本的类别语义特征A以及真实标签矩阵Y;所述的训练样本、对应的类别语义特征A以及真实标签矩阵Y和步骤5)所述的测试样本均是从AWA(Animals with Attributes)数据集或CUB(Caltech-UCSDbirds-200-2011)数据集中获得。所述的视觉特征X是通过卷积神经网络提取。
2)采用余弦相似度或高斯相似度通过类别语义特征A计算类别语义相似度矩阵S;计算类别语义相似度矩阵S的对角矩阵D:其中Dii是对角矩阵D的每个对角元素Sij是S的每个元素;最后计算出拉普拉斯矩阵L=D-S;
3)调用MATLAB工具箱中的Sylvester方程求解算法求出下式的解,得到映射矩阵V;
XXTV+V(λAL+β)(AAT)-1=XYA-1
式中,λ和β是模型正则化参数;
4)向如下目标函数输入训练样本的视觉特征X,对应的类别语义特征A以及真实标签矩阵Y,不断调整模型正则化参数λ和β的值,求得如下的目标函数的最小值,
式中,ai和aj分别代表第i个类别的语义特征和第j个类别的语义特征;
保留此时模型正则化参数λ和β的值及矩阵V,模型训练完成;
所述目标函数获得是:在分类任务中,若需要为C个已知类别学习分类器,要优化的模型如下:
其中,W为要学习的分类器,L代表某种形式的目标函数,Ω为正则项约束,
考虑到语义信息的辅助作用,将分类器W分解为W=VA,此时模型变为:
从而利用矩阵V实现从已知类别到未知类别的知识迁移。
5)在测试阶段,输入测试样本的视觉特征xui及对应语义特征aui,根据下式计算分类得分,得分最高的类别即为测试样本的预测类别,
Claims (4)
1.一种基于类别转移的零样本分类方法,其特征在于,包括如下步骤:
1)获取C个类别的训练样本的视觉特征X,训练样本的类别语义特征A以及真实标签矩阵Y;
2)采用余弦相似度或高斯相似度通过类别语义特征A计算类别语义相似度矩阵S;计算类别语义相似度矩阵S的对角矩阵D:其中Dii是对角矩阵D的每个对角元素;Sij是S的每个元素;最后计算出拉普拉斯矩阵L=D-S;
3)调用MATLAB工具箱中的Sylvester方程求解算法求出下式的解,得到映射矩阵V;
XXTV+V(λAL+β)(AAT)-1=XYA-1
式中,λ和β是模型正则化参数;L是拉普拉斯矩阵;
4)向如下目标函数输入训练样本的视觉特征X,对应的类别语义特征A以及真实标签矩阵Y,不断调整模型正则化参数λ和β的值,求得如下的目标函数的最小值,
式中,ai和aj分别代表第i个类别的语义特征和第j个类别的语义特征;
保留此时模型正则化参数λ和β的值及矩阵V,模型训练完成;
5)在测试阶段,输入测试样本的视觉特征xui及对应语义特征aui,根据下式计算分类得分,得分最高的类别即为测试样本的预测类别,
2.根据权利要求1所述的一种基于类别转移的零样本分类方法,其特征在于,步骤1)所述的训练样本、对应的类别语义特征A以及真实标签矩阵Y和步骤5)所述的测试样本均是从AWA数据集或CUB数据集中获得。
3.根据权利要求1所述的一种基于类别转移的零样本分类方法,其特征在于,步骤1)所述的视觉特征X是通过卷积神经网络提取。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810252217.XA CN108376267B (zh) | 2018-03-26 | 2018-03-26 | 一种基于类别转移的零样本分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810252217.XA CN108376267B (zh) | 2018-03-26 | 2018-03-26 | 一种基于类别转移的零样本分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108376267A CN108376267A (zh) | 2018-08-07 |
CN108376267B true CN108376267B (zh) | 2021-07-13 |
Family
ID=63019198
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810252217.XA Active CN108376267B (zh) | 2018-03-26 | 2018-03-26 | 一种基于类别转移的零样本分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108376267B (zh) |
Families Citing this family (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109598279B (zh) * | 2018-09-27 | 2023-04-25 | 天津大学 | 基于自编码对抗生成网络的零样本学习方法 |
CN111079468B (zh) * | 2018-10-18 | 2024-05-07 | 珠海格力电器股份有限公司 | 机器人识别物体的方法及装置 |
CN109993197B (zh) * | 2018-12-07 | 2023-04-28 | 天津大学 | 一种基于深度端对端示例差异化的零样本多标签分类方法 |
CN109446332B (zh) * | 2018-12-25 | 2023-08-25 | 银江技术股份有限公司 | 一种基于特征迁移和自适应学习的人民调解案例分类系统及方法 |
CN111435453B (zh) * | 2019-01-14 | 2022-07-22 | 中国科学技术大学 | 细粒度图像零样本识别方法 |
CN110135459B (zh) * | 2019-04-15 | 2023-04-07 | 天津大学 | 一种基于双三元组深度度量学习网络的零样本分类方法 |
CN110472652B (zh) * | 2019-06-30 | 2023-06-09 | 天津大学 | 基于语义引导的少量样本分类方法 |
CN112418257B (zh) * | 2019-08-22 | 2023-04-18 | 四川大学 | 一种有效的基于潜在视觉属性挖掘的零样本学习方法 |
CN110717512B (zh) * | 2019-09-05 | 2023-04-07 | 华南理工大学 | 一种基于结构保持零样本学习的鸟类濒危物种识别方法 |
CN110717513B (zh) * | 2019-09-05 | 2023-04-07 | 华南理工大学 | 一种基于多分类器的零样本深海生物图片分类方法 |
CN112686277A (zh) * | 2019-10-18 | 2021-04-20 | 北京大学 | 模型训练的方法和装置 |
CN113128530B (zh) * | 2019-12-30 | 2023-11-03 | 上海高德威智能交通系统有限公司 | 一种数据分类方法及装置 |
CN111291193B (zh) * | 2020-01-18 | 2020-09-29 | 杭州电子科技大学 | 一种知识图谱在零次学习上的运用方法 |
CN111582069B (zh) * | 2020-04-22 | 2021-05-28 | 北京航空航天大学 | 一种空基监视平台的轨道障碍物零样本分类方法及装置 |
CN112163603A (zh) * | 2020-09-15 | 2021-01-01 | 郑州金惠计算机系统工程有限公司 | 零样本图像识别方法、装置、电子设备及存储介质 |
CN112257765B (zh) * | 2020-10-16 | 2022-09-23 | 济南大学 | 基于未知类相似类别集的零样本图像分类方法及系统 |
CN112149692B (zh) * | 2020-10-16 | 2024-03-05 | 腾讯科技(深圳)有限公司 | 基于人工智能的视觉关系识别方法、装置及电子设备 |
CN112364893B (zh) * | 2020-10-23 | 2022-07-05 | 天津大学 | 一种基于数据增强的半监督零样本图像分类方法 |
CN112528690B (zh) * | 2020-11-19 | 2022-06-07 | 西安交通大学 | 非接触式物品材质和形状识别方法、存储介质及计算设备 |
CN112580714B (zh) * | 2020-12-15 | 2023-05-30 | 电子科技大学中山学院 | 一种以错因强化方式动态优化损失函数的物品识别方法 |
CN113723106B (zh) * | 2021-07-29 | 2024-03-12 | 北京工业大学 | 基于标签扩展的零样本文本分类方法 |
CN115131613B (zh) * | 2022-07-01 | 2024-04-02 | 中国科学技术大学 | 一种基于多向知识迁移的小样本图像分类方法 |
CN115424096B (zh) * | 2022-11-08 | 2023-01-31 | 南京信息工程大学 | 一种多视角零样本图像识别方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105512679A (zh) * | 2015-12-02 | 2016-04-20 | 天津大学 | 一种基于极限学习机的零样本分类方法 |
CN105701514A (zh) * | 2016-01-15 | 2016-06-22 | 天津大学 | 一种用于零样本分类的多模态典型相关分析的方法 |
CN105740888A (zh) * | 2016-01-26 | 2016-07-06 | 天津大学 | 一种用于零样本学习的联合嵌入模型 |
CN106778804A (zh) * | 2016-11-18 | 2017-05-31 | 天津大学 | 基于类别属性迁移学习的零样本图像分类方法 |
CN107563444A (zh) * | 2017-09-05 | 2018-01-09 | 浙江大学 | 一种零样本图像分类方法及系统 |
-
2018
- 2018-03-26 CN CN201810252217.XA patent/CN108376267B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105512679A (zh) * | 2015-12-02 | 2016-04-20 | 天津大学 | 一种基于极限学习机的零样本分类方法 |
CN105701514A (zh) * | 2016-01-15 | 2016-06-22 | 天津大学 | 一种用于零样本分类的多模态典型相关分析的方法 |
CN105740888A (zh) * | 2016-01-26 | 2016-07-06 | 天津大学 | 一种用于零样本学习的联合嵌入模型 |
CN106778804A (zh) * | 2016-11-18 | 2017-05-31 | 天津大学 | 基于类别属性迁移学习的零样本图像分类方法 |
CN107563444A (zh) * | 2017-09-05 | 2018-01-09 | 浙江大学 | 一种零样本图像分类方法及系统 |
Non-Patent Citations (1)
Title |
---|
"Latent Embeddings for Zero-shot Classification";Yongqin Xian 等;《2016 IEEE Conference on Computer Vision and Pattern Recognition》;20161231;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN108376267A (zh) | 2018-08-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108376267B (zh) | 一种基于类别转移的零样本分类方法 | |
CN107832663B (zh) | 一种基于量子理论的多模态情感分析方法 | |
Gebru et al. | Fine-grained recognition in the wild: A multi-task domain adaptation approach | |
CN109993197B (zh) | 一种基于深度端对端示例差异化的零样本多标签分类方法 | |
CN109558942B (zh) | 一种基于浅度学习的神经网络迁移方法 | |
EP3029606A2 (en) | Method and apparatus for image classification with joint feature adaptation and classifier learning | |
CN109492750B (zh) | 基于卷积神经网络和因素空间的零样本图像分类方法 | |
Sun et al. | Global-local label correlation for partial multi-label learning | |
CN110647907B (zh) | 利用多层分类和字典学习的多标签图像分类算法 | |
CN110555060A (zh) | 基于成对样本匹配的迁移学习方法 | |
CN110795585A (zh) | 基于生成对抗网络的零样本图像分类模型及其方法 | |
CN105005794A (zh) | 融合多粒度上下文信息的图像像素语义标注方法 | |
CN110705490B (zh) | 视觉情感识别方法 | |
CN103942214B (zh) | 基于多模态矩阵填充的自然图像分类方法及装置 | |
CN111126464A (zh) | 一种基于无监督域对抗领域适应的图像分类方法 | |
Xia et al. | A regularized optimization framework for tag completion and image retrieval | |
CN111931562A (zh) | 一种基于软标签回归的无监督特征选择方法和系统 | |
Cao et al. | Deep multi-view learning to rank | |
Cheng et al. | Training mixture of weighted SVM for object detection using EM algorithm | |
CN112183464A (zh) | 基于深度神经网络和图卷积网络的视频行人识别方法 | |
CN110442736B (zh) | 一种基于二次判别分析的语义增强子空间跨媒体检索方法 | |
He et al. | Global and local fusion ensemble network for facial expression recognition | |
Lonij et al. | Open-world visual recognition using knowledge graphs | |
Wang et al. | Crop pest detection by three-scale convolutional neural network with attention | |
CN117173702A (zh) | 基于深度特征图融合的多视图多标记学习方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |