CN109492750B - 基于卷积神经网络和因素空间的零样本图像分类方法 - Google Patents
基于卷积神经网络和因素空间的零样本图像分类方法 Download PDFInfo
- Publication number
- CN109492750B CN109492750B CN201811280725.5A CN201811280725A CN109492750B CN 109492750 B CN109492750 B CN 109492750B CN 201811280725 A CN201811280725 A CN 201811280725A CN 109492750 B CN109492750 B CN 109492750B
- Authority
- CN
- China
- Prior art keywords
- neural network
- zero
- classification
- layer
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明提出一种基于卷积神经网络和因素空间的零样本图像分类方法及系统,构建一个统一的零样本分类神经网络,首先利用一个经典卷积神经网络提取数据集中的图像特征,作为神经网络的输入;使用因素压减技术降低已知因素的维度,并将已知因素和潜在因素嵌入到网络中,作为中间层共同决定最终的分类结果;该网络实现了从图像输入到最终的类别输出。训练零样本分类网络,迭代确定网络模型参数。利用零样本分类神经网络对图像进行识别,完成零样本图像的分类。本发明用一个卷积神经网络模型统一处理了视觉空间、因素空间和类别空间之间的关系,解决了特定的线性或非线性函数表达泛化能力不强的问题,把作为辅助知识的因素嵌入到网络中,易于理解、训练和使用。
Description
技术领域
本发明涉及一种基于卷积神经网络和因素空间的零样本图像分类方法及系统,属于图像识别技术领域。
背景技术
在大规模可用数据集的支撑下,计算机视觉中的物体识别算法近几年来取得了突破性的进展。但是人工收集和标注数据是一项十分耗时耗力的工作,特别是对于一些罕见物体的图像或者相似物体的分类中,需要专家来区分不同的类别。在没有训练数据的情况下,一般的方法很难进行正确识别,这时的视觉识别问题通常叫做零样本分类或者零样本学习。
零样本分类问题中,训练集中都是有类别标签标注的图像数据(又叫可见类),测试集中有部分数据并未出现在训练集中(又叫不可见类),但是却同样要进行这些不可见类物体的识别。例如,模型在“马”、“牛”等类别上训练过,因此模型能够识别“马”、“牛”的图片,当模型遇到“象”这个新类别时,零样本分类也要能够识别。在没有任何图像训练样本的情况下,零样本分类通常借助辅助知识空间来关联图像视觉空间和类别空间,这些辅助知识可以是词向量、文本描述、语义向量等。辅助知识空间作为一个视觉空间和类别空间的中间层、公共空间,分别与视觉空间和类别空间构成一个不同的映射,从而实现知识的共享和迁移。比如,通过语义向量标识的辅助知识实现类别描述,可以将可见类与不可见类联系起来,语义向量作为图像与类别标签之间的中间层。
在利用辅助知识获取合适的类别描述后,现有的零样本分类研究主要集中在:建立合适的模型,用来表达辅助知识空间与图像视觉空间、辅助知识空间与类别空间的关系。现有技术通常通过假定特定的线性或非线性函数来表达这些模型,这种特定线性或非线性函数的表达能力有限,泛化能力较弱,对于不同的零样本分类问题需要研究人员去尝试使用不同的线性或非线性函数。
发明内容
本发明的目的在于:克服现有技术的不足,提出一种基于卷积神经网络和因素空间的零样本图像分类方法及系统,建立了一个统一的卷积神经网络实现从图像输入到最终的类别输出,作为辅助知识的已知因素被嵌入在网络中间层、作为辅助分类器使用,而且还同时考虑了潜在因素。此时模型全部由神经网络来表达和训练,泛化能力很强。
为实现上述目的,本发明采用的具体方案为:
一种基于卷积神经网络和因素空间的零样本图像分类方法,步骤如下:
(1)构建零样本分类神经网络;
(2)对所述零样本分类神经网络进行训练,确定网络模型参数;
(3)通过所述零样本分类神经网络对零样本图像进行识别,完成零样本图像的分类。
所述零样本是指在神经网络训练中,部分待识别的图像没有样本。
所述步骤(1)构建零样本分类神经网络,具体为:
(1.1)将m类训练集trainX的图像输入经典卷积网络的特征提取层,对图像进行特征提取;
图像集包括训练集trainX和测试集testX,图像集包含m+n类,均有对应的类别标签,其中训练集trainX包含m类,测试集testX包含m+n类,其中,n类为在训练集中没有出现图像样本的类别;
(1.2)将提取出的特征θ(x)乘以权重矩阵W(11)和W(12)作为Net1层的输入,经过激活函数之后得到Net1层的输出;Net1层是因素分类层,其输出分为已知因素和潜在因素;
其中,已知因素是指s维的语义向量特征,对于图像集中的m+n类,其s维的语义向量特征均已知;
潜在因素是指在训练过程中,除已知因素以外、对分类结果有影响的其他因素;
(1.3)将Net1层的输出乘以权重矩阵W(21)和W(22)作为Net2层的输入,经过激活函数之后得到Net2层的输出;
(1.4)将Net2层的输出乘以权重矩阵W(3)作为Net3层的输入,经过softmax函数得到Net3层的输出,即分类结果,从而完成构建零样本分类神经网络。
对m类训练集trainX的图像进行预处理,将图像样本裁剪成统一大小。
辅助分类器的损失函数Ja为已知因素的分类误差
其中,其中φi(k)是第i个样本的第k个已知因素,εi(k)是第i个样本训练时Net1层的第k个输出,γ≥0为加权系数。
零样本分类神经网络的总损失函数J为辅助分类器的损失函数和对应Net3层的损失函数之和:J=Ja+Jc。
所述步骤(2)对零样本分类神经网络进行训练,确定网络模型参数,具体为:
(2.1)根据对应Net3层的损失函数对权重矩阵W(21)、W(22)和W(3)进行更新;
(2.2)根据总损失函数对权重矩阵W(11)和W(12)进行更新;
(2.3)根据n类样本对应的s维已知因素和类别标签,此时将v维潜在因素设置为零,对权重矩阵W(21)、W(22)和W(3)进行再次更新;
(2.4)步骤(2.1)~(2.3)迭代进行,直至权重矩阵收敛。
一种基于所述零样本图像分类方法实现的基于卷积神经网络和因素空间的零样本图像分类系统,包括:
网络构建模块:用于构建零样本分类神经网络;
训练模块:用于对所述零样本分类神经网络进行训练,确定网络模型参数;
图像识别模块:用于通过所述零样本分类神经网络对零样本图像进行识别,完成零样本图像的分类。
本发明与现有技术相比带来的有益效果为:
(1)本发明将视觉空间、因素空间以及类别空间融入到一个统一的神经网络中,现有技术中常常用一个特定的线性函数或非线性函数表述不同空间之间的关系,本发明构建的神经网络表达能力、泛化能力更强;
(2)本发明同时考虑了已知因素与潜在因素,通过在网络中为其分别分配权重形成了两条通道,并最终作用于分类结果;
(3)本发明基于因素空间理论,在辅助分类器的设计中引入因素压减技术,去除掉冗余的因素,降低了网络的复杂度与计算量;
(4)本发明用已知m类图像样本集训练以后,再利用未知图像样本n类对应的s维已知因素,进行Net2层与Net3层网络参数的调整,使得网络能够通过因素空间来关联视觉空间和类别空间。
附图说明
图1为本发明的零样本图像分类方法及系统流程图;
图2为本发明的零样本分类神经网络总体结构图;
图3为本发明的零样本分类神经网络因素分类模块的参数设置图。
具体实施方式
下面结合具体实例和附图对本发明的一种基于网络架构设计的零样本图像分类方法做出详细说明。
如图1所示,本发明提出了一种基于卷积神经网络和因素空间的零样本图像分类方法,步骤如下:
(1)构建零样本分类神经网络;
具体为:
(1.1)对m类训练集trainX的图像进行预处理,将图像样本裁剪成统一大小。如图2所示,将m类训练集trainX的图像输入经典卷积网络,在特征提取层实现图像的特征提取;
图像集包括训练集trainX和测试集testX,图像集包含m+n类,均有对应的类别标签,其中训练集trainX包含m类,测试集testX包含m+n类,其中,n类为在训练集中没有出现过的图像类别个数;
经典卷积网络特征提取层可以是AlexNet、VGG-Net或者GoogleNet的特征提取层。经典卷积神经网络能够对图像进行较为准确的识别,丢掉最后一层全连接层(分类层),所得到的节点向量可以被看成是对特征向量更加精简且有效的表达。
(1.2)如图2和图3所示,将提取出的特征θ(x)乘以权重矩阵W(11)和W(12),作为Net1层的输入,经过激活函数进行非线性变换,得到Net1层的输出;Net1层是因素分类层,其输出分为已知因素和潜在因素;
其中,已知因素是指s维的语义向量特征,对于图像集中的m+n类,其s维的语义向量特征均已知;
潜在因素是指在训练过程中,除已知因素以外、对分类结果有影响的其他因素;
作为认知描述的元词,因素是分析事物的要素,是我们展开深入分析的根。因素构成了事物的本体,是事物描述和思维过程的最深层次的东西。一个简单的因素把事物抽象到一个单一的维度,并为其命名,划分出一串属性并命其串名,属性是因素的取值,比如,“颜色”可以视为一个因素,“颜色”对应的一串属性可以是“红,绿,蓝”等。因素空间就是由一个物体集合和描述这个物体集合的因素集合构成的映射空间。因素的合成技术可以把视角的维度加多,考虑了不同的因素,从而将划分进行叠加,能够使综合程度加大。而因素的压减技术可以对因素空间进行降维,去掉冗余的因素,降低网络的复杂度。网络中的s维已知因素就是从给出的因素特征中通过因素压减得到的,本发明是通过聚类算法实现因素压减,通过词义的相似度实现聚类,使得同一个簇中的因素相似度较大,不同簇间的因素相似度较小;
如图3所示,Net1层分为上、下两部分,上部分从θ(x)中提取s维已知因素,这s维已知因素作为辅助分类器使用;下部分从θ(x)中提取v维潜在因素,作为分类时对已知因素的补充;上半部分的输入为下半部分的输入为所以Net1层的输入为Net1层的激活函数为f1,则Net1层的输出为O(1)=f1(I(1))。
(1.3)将Net1层的上、下部分的输出分别乘以权重矩阵W(21)和W(22),作为Net2层的输入,经过激活函数作用之后得到Net2层的输出;
(1.4)将Net2层的输出乘以权重矩阵W(3),作为Net3层的输入,经过softmax函数得到Net3层的输出,即分类结果,从而完成构建零样本分类神经网络;
(2)如图2所示,对所述零样本分类神经网络进行训练,根据梯度下降法迭代更新,从而确定网络模型的参数;
具体为:
(2.1)根据对应Net3层的损失函数Jc对权重矩阵W(21)、W(22)和W(3)进行更新;
(2.2)根据总损失函数J对权重矩阵W(11)和W(12)进行更新;
(2.3)根据n类样本对应的s维已知因素和类别标签,此时将v维潜在因素设置为零,对权重矩阵W(21)、W(22)和W(3)进行再次更新;
本发明使用的辅助分类器的损失函数Ja为已知因素的分类误差:
其中,φi(k)是第i个样本的第k个已知因素,εi(k)是第i个样本训练时Net1层的第k个输出,γ≥0为加权系数;
对应Net3层的损失函数为交叉熵Jc:
零样本分类神经网络的总损失函数J为辅助分类器的损失函数Ja和对应Net3层的损失函数Jc之和,即
(2.4)步骤(2.1)~(2.3)迭代进行,直至权重矩阵收敛。
(3)通过所述零样本分类神经网络对零样本图像进行识别,完成零样本图像的分类。所述零样本是指在神经网络训练过程中,部分待识别的图像目标没有样本。
基于上述图像分类方法,本发明还提出一种基于卷积神经网络和因素空间的零样本图像分类系统,包括:
网络构建模块:用于构建零样本分类神经网络;
训练模块:用于对所述零样本分类神经网络进行训练,确定网络模型参数;
图像识别模块:用于通过所述零样本分类神经网络对零样本图像进行识别,完成零样本图像的分类。
本发明将视觉空间、因素空间以及类别空间融入到一个统一的神经网络中,现有技术中常常用一个特定的线性函数或非线性函数表述不同空间之间的关系,本发明构建的神经网络表达能力、泛化能力更强;同时考虑了已知因素与潜在因素,通过在网络中为其分别分配权重形成了两条通道,并最终作用于分类结果;本发明基于因素空间理论,在辅助分类器的设计中引入因素压减技术,去除掉冗余的因素,降低了网络的复杂度与计算量。
Claims (9)
1.一种基于卷积神经网络和因素空间的零样本图像分类方法,其特征在于步骤如下:
(1)构建零样本分类神经网络;具体为:
(1.1)将m类训练集trainX的图像输入经典卷积网络的特征提取层,对图像进行特征提取;
图像集包括训练集trainX和测试集testX,图像集包含m+n类,均有对应的类别标签,其中训练集trainX包含m类,测试集testX包含m+n类,其中,n类为在训练集中没有出现图像样本的类别;
(1.2)将提取出的特征θ(x)乘以权重矩阵W(11)和W(12)作为Net1层的输入,经过激活函数之后得到Net1层的输出;Net1层是因素分类层,其输出分为已知因素和潜在因素;
其中,已知因素是指s维的语义向量特征,对于图像集中的m+n类,其s维的语义向量特征均已知;
潜在因素是指在训练过程中,除已知因素以外、对分类结果有影响的其他因素;
(1.3)将Net1层的输出乘以权重矩阵W(21)和W(22)作为Net2层的输入,经过激活函数之后得到Net2层的输出;
(1.4)将Net2层的输出乘以权重矩阵W(3)作为Net3层的输入,经过softmax函数得到Net3层的输出,即分类结果,从而完成构建零样本分类神经网络;
(2)对所述零样本分类神经网络进行训练,确定网络模型参数;
(3)通过所述零样本分类神经网络对零样本图像进行识别,完成零样本图像的分类。
2.根据权利要求1所述的一种基于卷积神经网络和因素空间的零样本图像分类方法,其特征在于:所述零样本是指在神经网络训练中,部分待识别的图像没有样本。
3.根据权利要求1所述的一种基于卷积神经网络和因素空间的零样本图像分类方法,其特征在于:对m类训练集trainX的图像进行预处理,将图像样本裁剪成统一大小。
7.根据权利要求6所述的一种基于卷积神经网络和因素空间的零样本图像分类方法,其特征在于:零样本分类神经网络的总损失函数J为辅助分类器的损失函数和对应Net3层的损失函数之和:J=Ja+Jc。
8.根据权利要求7所述的一种基于卷积神经网络和因素空间的零样本图像分类方法,其特征在于:所述步骤(2)对零样本分类神经网络进行训练,确定网络模型参数,具体为:
(2.1)根据对应Net3层的损失函数对权重矩阵W(21)、W(22)和W(3)进行更新;
(2.2)根据总损失函数对权重矩阵W(11)和W(12)进行更新;
(2.3)根据n类样本对应的s维已知因素和类别标签,此时将v维潜在因素设置为零,对权重矩阵W(21)、W(22)和W(3)进行再次更新;
(2.4)步骤(2.1)~(2.3)迭代进行,直至权重矩阵收敛。
9.一种基于如权利要求1~8中任一项所述零样本图像分类方法实现的基于卷积神经网络和因素空间的零样本图像分类系统,其特征在于包括:
网络构建模块:用于构建零样本分类神经网络;
训练模块:用于对所述零样本分类神经网络进行训练,确定网络模型参数;
图像识别模块:用于通过所述零样本分类神经网络对零样本图像进行识别,完成零样本图像的分类。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811280725.5A CN109492750B (zh) | 2018-10-30 | 2018-10-30 | 基于卷积神经网络和因素空间的零样本图像分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811280725.5A CN109492750B (zh) | 2018-10-30 | 2018-10-30 | 基于卷积神经网络和因素空间的零样本图像分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109492750A CN109492750A (zh) | 2019-03-19 |
CN109492750B true CN109492750B (zh) | 2020-11-20 |
Family
ID=65693336
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811280725.5A Active CN109492750B (zh) | 2018-10-30 | 2018-10-30 | 基于卷积神经网络和因素空间的零样本图像分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109492750B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110443277A (zh) * | 2019-06-30 | 2019-11-12 | 天津大学 | 基于注意力模型的少量样本分类方法 |
CN110659665B (zh) * | 2019-08-02 | 2023-09-29 | 深圳力维智联技术有限公司 | 一种异维特征的模型构建方法及图像识别方法、装置 |
CN110598790A (zh) * | 2019-09-12 | 2019-12-20 | 北京达佳互联信息技术有限公司 | 一种图像的识别方法、装置、电子设备及存储介质 |
CN110807472B (zh) * | 2019-10-12 | 2022-08-12 | 北京达佳互联信息技术有限公司 | 图像识别方法、装置、电子设备及存储介质 |
CN111461162B (zh) * | 2020-01-03 | 2023-04-07 | 华中科技大学 | 一种零样本目标检测模型及其建立方法 |
CN111507396B (zh) * | 2020-04-15 | 2023-08-08 | 广州大学 | 缓解神经网络对未知类样本产生错误分类的方法及装置 |
CN111738303B (zh) * | 2020-05-28 | 2023-05-23 | 华南理工大学 | 一种基于层次学习的长尾分布图像识别方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107292349A (zh) * | 2017-07-24 | 2017-10-24 | 中国科学院自动化研究所 | 基于百科知识语义增强的零样本分类方法、装置 |
CN107563444A (zh) * | 2017-09-05 | 2018-01-09 | 浙江大学 | 一种零样本图像分类方法及系统 |
CN108399421A (zh) * | 2018-01-31 | 2018-08-14 | 南京邮电大学 | 一种基于词嵌入的深度零样本分类方法 |
-
2018
- 2018-10-30 CN CN201811280725.5A patent/CN109492750B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107292349A (zh) * | 2017-07-24 | 2017-10-24 | 中国科学院自动化研究所 | 基于百科知识语义增强的零样本分类方法、装置 |
CN107563444A (zh) * | 2017-09-05 | 2018-01-09 | 浙江大学 | 一种零样本图像分类方法及系统 |
CN108399421A (zh) * | 2018-01-31 | 2018-08-14 | 南京邮电大学 | 一种基于词嵌入的深度零样本分类方法 |
Non-Patent Citations (2)
Title |
---|
Zero-Shot Learning of SAR Target Feature Space With Deep Generative Neural Networks;Qian Song et al;《IEEE GEOSCIENCE AND REMOTE SENSING LETTERS》;20171231;第14卷(第12期);第2245-2249页 * |
基于深度学习及知识挖掘的零样本图像分类;陈晨;《中国优秀硕士学位论文全文数据库信息科技辑》;20170215(第2期);第I138-400页 * |
Also Published As
Publication number | Publication date |
---|---|
CN109492750A (zh) | 2019-03-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109492750B (zh) | 基于卷积神经网络和因素空间的零样本图像分类方法 | |
CN108376267B (zh) | 一种基于类别转移的零样本分类方法 | |
CN110532900B (zh) | 基于U-Net和LS-CNN的人脸表情识别方法 | |
CN109492099B (zh) | 一种基于领域对抗自适应的跨领域文本情感分类方法 | |
CN106919951B (zh) | 一种基于点击与视觉融合的弱监督双线性深度学习方法 | |
CN106469560B (zh) | 一种基于无监督域适应的语音情感识别方法 | |
CN110046671A (zh) | 一种基于胶囊网络的文本分类方法 | |
CN110197205A (zh) | 一种多特征来源残差网络的图像识别方法 | |
CN110619059B (zh) | 一种基于迁移学习的建筑物标定方法 | |
CN113076994B (zh) | 一种开集域自适应图像分类方法及系统 | |
CN109740679B (zh) | 一种基于卷积神经网络和朴素贝叶斯的目标识别方法 | |
CN111401426B (zh) | 基于伪标签学习的小样本高光谱图像分类方法 | |
CN111832573B (zh) | 一种基于类激活映射和视觉显著性的图像情感分类方法 | |
CN106709528A (zh) | 基于多目标函数深度学习的车辆重识别方法及装置 | |
WO2022062419A1 (zh) | 基于非督导金字塔相似性学习的目标重识别方法及系统 | |
CN108764280B (zh) | 一种基于症状向量的医学数据处理方法和系统 | |
CN110110724A (zh) | 基于指数型挤压函数驱动胶囊神经网络的文本验证码识别方法 | |
Li et al. | Dating ancient paintings of Mogao Grottoes using deeply learnt visual codes | |
CN111126361A (zh) | 基于半监督学习和特征约束的sar目标鉴别方法 | |
CN110837865A (zh) | 一种基于表示学习和迁移学习的领域适配方法 | |
CN111079847A (zh) | 一种基于深度学习的遥感影像自动标注方法 | |
CN114841151B (zh) | 基于分解-重组策略的医学文本实体关系联合抽取方法 | |
CN109472733A (zh) | 基于卷积神经网络的图像隐写分析方法 | |
CN107766895B (zh) | 一种诱导式非负投影半监督数据分类方法及系统 | |
CN110705384B (zh) | 一种基于跨域迁移增强表示的车辆再识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |