CN114898136B - 一种基于特征自适应的小样本图像分类方法 - Google Patents
一种基于特征自适应的小样本图像分类方法 Download PDFInfo
- Publication number
- CN114898136B CN114898136B CN202210246145.4A CN202210246145A CN114898136B CN 114898136 B CN114898136 B CN 114898136B CN 202210246145 A CN202210246145 A CN 202210246145A CN 114898136 B CN114898136 B CN 114898136B
- Authority
- CN
- China
- Prior art keywords
- query
- sample
- support set
- feature
- support
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 32
- 238000012360 testing method Methods 0.000 claims description 21
- 238000012549 training Methods 0.000 claims description 20
- 238000010606 normalization Methods 0.000 claims description 8
- 238000005070 sampling Methods 0.000 claims description 7
- 230000004913 activation Effects 0.000 claims description 6
- 238000013527 convolutional neural network Methods 0.000 claims description 6
- 238000011176 pooling Methods 0.000 claims description 6
- 230000003044 adaptive effect Effects 0.000 claims description 5
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 claims description 3
- 238000012935 Averaging Methods 0.000 claims description 2
- 230000000873 masking effect Effects 0.000 claims description 2
- 230000001131 transforming effect Effects 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 2
- 230000000007 visual effect Effects 0.000 abstract description 2
- 230000006870 function Effects 0.000 description 4
- 238000003062 neural network model Methods 0.000 description 4
- 230000006978 adaptation Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/761—Proximity, similarity or dissimilarity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/7715—Feature extraction, e.g. by transforming the feature space, e.g. multi-dimensional scaling [MDS]; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Multimedia (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及一种基于特征自适应的小样本图像分类方法。本发明充分利用了支持集类间的信息,学习基于特定任务的模型,通过自适应方法,分两个模块对特征表示的鉴别性信息进行增强,从而提高在目标任务上的性能。首先在特定任务中利用类间注意力方法学习到了类间的潜在联系,并用这种视觉信息更新原来的特征。更新后的特征不仅包含了实例中的鉴别性信息,还针对这一特定任务作出整体的关联。然后将支持集投影至高维空间得到掩码,从而在空间中得到任务相关的特征维度,去除了冗余信息对分类的影响。本发明方法克服现有技术专注于提取鉴别性特征,缺失针对特定任务和支持集类间联系,特征空间信息冗余的问题,使分类效果更加优秀。
Description
技术领域
本发明属于计算机视觉领域,具体涉及一种基于特征自适应的小样本图像分类方法。
背景技术
小样本图像分类是指给定很少的标记样本(支持集),这些样本的类别在训练时从未出现,将未标记的样本(查询集)通过少量的标记样本分类为新的类别。传统图像分类方法已经通过深度学习模型取得了先进成果,但很大程度上依赖于大量的训练数据。而在现实应用场景中,很多特殊类别只能采集到极少量样本或标记数据,而对无标签数据进行标注将会消耗大量资源。因此,小样本图像分类方法在学术界和工业界均有着重要的研究价值。在人类的快速学习能力的启发下,研究人员希望神经网络模型在学习了一定类别的大量数据后,对于新的类别,只需要少量的样本就能快速学习。这就是小样本图像分类要解决的问题。
近年来,随着深度学习的迅速发展,小样本图像分类领域涌现出大量的基于空间度量的分类方法,这类方法通常是在大量已有的图像类别上训练神经网络模型,选取支持和查询样本并将其嵌入到一个共享的特征空间后,比较特征的相似性。一个经典的空间度量方法是原型网络,原型网络通过平均支持集得到每个类别的原型,优化查询样本到同一类别原型的距离来训练模型。训练好模型后,对测试数据到支持集各个类别原型的距离做softmax,来判断测试数据的类别标签。
虽然这类方法能够学习到丰富的特征,但这些特征都是依据支持集的每个类别独立地提取,所构成的特征空间可能包含了对于任务分类无用的特征维度,这样提取到的特征充斥大量的冗余信息,这些信息无益于分类,而且还会掩盖关键的鉴别性信息。
发明内容
本发明的目的是为了解决上述背景技术中存在的不足,即对于不同的小样本图像分类任务采用了公有的特征提取器,特征空间无法考虑到不同小样本图像分类任务的鉴别性信息。本发明提出了一种基于特征自适应的小样本图像分类方法。考虑了小样本图像分类任务内部类间的相似度信息,加入了特征自适应操作,并通过将支持集嵌入高维空间得到鉴别性信息掩码,从而在空间中得到任务相关的特征维度进行分类。本发明方法克服了现有技术存在的特征空间特征信息冗余的问题。
为了实现上述目的,本发明所采用的技术方案为:
基于特征自适应的小样本图像分类方法,该方法分为如下步骤:
步骤一,划分数据集,将数据集划分为训练集Dtrain,测试集Dtest,训练集与测试集包含不同种类的图像;
步骤二,构建小样本分类任务,从训练集Dtrain中取样支持集Dsupport和查询集Dquery构成任务,并将所述小样本分类任务中包含的图像经过特征提取器提取支持集和查询集的初步特征;
步骤三,将提取到的支持集特征送入Transformer结构的自适应模块;
步骤四,将实现自适应后的支持集特征送入投影模块,将每类支持集特征按通道方向级联,然后将其嵌入至新的特征空间,在通道方向上使用softmax得到支持集各类别的掩码;
步骤五,通过Reshaper模块将最初经过特征提取器得到的支持集和查询集的特征嵌入至和掩码共享的特征空间,并将通过每类支持集得到的各类掩码分别应用至支持集特征和查询集特征;
步骤六,计算应用掩码后的查询集和各类支持集的相似度分数,应用softmax进行分类,计算交叉熵损失,反向传播更新网络参数;
步骤七,重复进行步骤二至六,训练整体的网络模型,得到训练后网络模型,使用训练后的网络模型对测试集Dtest样本进行分类。
进一步的,步骤二的具体实现方式如下;
构建小样本分类任务,任务包含支持集和查询集,给定一个查询样本,其目标是将其分类为支持集中的一个类别,首先从训练集Dtrain中取样若干个N个类别的样本,然后从每个类别中随机选K个样本,构建支持集 指支持集样本,/>指样本对应标签;类别中剩余的样本构建查询集/> 指支持集样本,/>指样本对应标签,nq为查询集样本数量;
将支持集和查询集的图像样本x送入特征提取器fθ(·),得到支持集和查询集的初步特征表示:
φx=fθ(x)
特征提取器fθ(·)由四个卷积神经网络块构成,每一个卷积神经网络块包括:64个3×3维卷积核,批归一化层,ReLU激活函数,2×2最大池化层;
进一步的,步骤三的具体实现方式如下;
将支持集样本的特征表示送入Transformer结构的自适应模块,为得到Transformer结构中的query,key,value集合,分别采用三组线性层对支持集样本的特征进行投影,线性层的维度是d×d′,d对应样本的特征表示的维度,对支持集内的每个样本特征分别进行变换,每个样本特征都得到query,key,value向量,支持集的样本得到的query,key,value可以分别构成集合Q,K,V,公式如下:
其中是支持集样本经过特征提取器得到的特征表示集合,/>表示/>中的元素个数,φx指经过特征提取器得到的支持集样本的初步特征表示;
单个query与其他样本得到的key点乘计算相似度,再经过softmax得到注意力向量αq,:,向量αq,:的第k个元素αqk揭示了样本q和样本k之间的相似性,V:,k对应value中的第k列,将计算出的注意力值作为权重同value中的对应列作列对应加权求和得到新的query值经过线性层/>改变特征至原来的通道数,和原特征φx相加,τ表示经过dropout和LN转换,得到更新后的特征χx,公式如下:
进一步的,步骤四的具体实现方式如下;
将实现自适应后的支持集特征送入投影模块,实现自适应后的支持集特征图大小为(NK,m1,d1,d1),N是类别数,K是每个类别的样本数,m1是通道数,d1是特征的长和宽,将每类支持集特征按通道方向级联,得到张量大小为(N,Km1,d1,d1),然后通过投影模块将其嵌入至新的特征空间,得到张量大小为(N,m2,d2,d2),在通道方向上使用softmax得到不同类别的掩码一共有对应类别数N个掩码p,掩码可以掩盖不相关的特征,并通过支持集的特征来选择对当前的小样本任务最具鉴别性的特征。
进一步的,步骤五的具体实现方式如下;
为使掩码p影响支持集和查询集的特征,通过Reshaper模块匹配网络中掩码和样本特征之间的形状,将最初经过特征提取器得到的支持集和查询集的特征通过Reshaper模块嵌入至掩码共享的特征空间,并将各类掩码p分别按元素乘法应用至支持集特征和查询集特征,支持集应用掩码后,还应平均得到该类的原型;
其中φx指经过特征提取器得到的支持集样本的初步特征表示;是支持集样本经过特征提取器得到的特征表示集合,/>是支持集第i类的集合,pi是第i类的掩码,⊙表示样本方向广播掩码,/>是支持集应用掩码后平均得到的原型;
其中Q是查询集样本经过特征提取器得到的特征表示集合,pi是第i类掩码,⊙表示样本方向广播掩码,Qi表示应用了第i类掩码的查询集特征集合,表示第j个应用了第i类掩码的查询特征。
进一步的,Reshaper模块和投影模块都由三个卷积神经网络块构成,每一个卷积神经网络块包括:3×3卷积核的卷积层,批归一化层,ReLU激活函数,2×2最大池化层;
进一步的,步骤六的具体实现方式如下;
通过掩码得到的支持集和查询集特征,计算二者间的欧式距离来度量相似度,得到距离后通过softmax将查询样本分类至支持集的类别,以查询集第z个样本为例,其分类至第k类的概率为:
其中,表示了查询集应用了第k个掩码的第z个样本,和支持集应用了第k个掩码的第k类原型之间的欧式距离;
计算损失用到的交叉熵损失,公式如下:
其中,为Qz的真实标签,nq为查询集样本数量;
得到损失后,反向传播更新网络参数。
与现有技术相比,本发明具有如下有益效果:
本发明方法基于PyTorch深度学习框架,充分利用了支持集类间的信息,学习基于特定任务的模型,通过自适应方法分两个模块对特征表示的鉴别性信息进行增强,从而提高在目标任务上的性能。首先在特定任务中利用类间注意力方法学习到了类间的潜在联系,并用这种视觉信息更新了原来的特征,更新后的特征不仅包含了实例中的鉴别性信息,还对这一特定任务有了整体的关联,然后投影支持集得到掩码,去除了冗余信息对分类的影响。本发明方法克服了现有技术专注于提取鉴别性特征,缺失针对特定任务和支持集类间联系的问题,使分类效果更加优秀。
附图说明
图1为本发明的流程示意图。
图2为本发明中所述方法在训练阶段的网络结构图,其中以单张查询样本为例。
具体实施方式
下面结合附图和实施例对本发明做进一步的说明。
实施例1
本实施例提供的基于特征自适应的小样本图像分类方法,具体步骤如下:
步骤一,划分数据集,将数据集划分为训练集Dtrain,测试集Dtest,训练集与测试集应包含不同种类的图像,每类样本图像数目一般不少于600个;
步骤二,构建小样本分类任务,从训练集Dtrain中取样支持集Dsupport和查询集Dquery构成任务,并将所述小样本分类任务中包含的图像经过特征提取器提取支持集和查询集的初步特征;
进一步的,步骤二的具体实现方式如下;
构建小样本分类任务,任务包含支持集和查询集。给定一个查询样本,其目标是将其分类为支持集中的一个类别。首先从训练集Dtrain中取样若干个N个类别的样本,然后从每个类别中随机选K个样本,构建支持集 指支持集样本,/>指样本对应标签;类别中剩余的样本构建查询集/> 指支持集样本,/>指样本对应标签,nq为查询集样本数量;
将支持集和查询集的图像样本x送入特征提取器fθ(·),得到支持集和查询集的初步特征表示:
φx=fθ(x)
特征提取器fθ(·)由四个卷积神经网络块构成,每一个卷积神经网络块包括:64个3×3维卷积核,批归一化层,ReLU激活函数,2×2最大池化层;
步骤三,将提取到的支持集特征送入Transformer结构的自适应模块。其中,自注意力机制促进了实例嵌入适应,并且考虑了任务内支持集类间的信息;
进一步的,步骤三的具体实现方式如下;
将支持集样本的特征表示送入Transformer结构的自适应模块。为得到Transformer结构中的query,key,value集合,分别采用三组线性层对支持集样本的特征进行投影,线性层的维度是d×d′,d对应样本的初步特征表示的维度。对支持集内的每个样本特征分别进行变换,每个样本特征都得到query,key,value向量,支持集的样本得到的query,key,value可以分别构成集合Q,K,V,公式如下:
其中是支持集样本经过特征提取器得到的特征表示集合,/>表示/>中的元素个数,φx指经过特征提取器f()得到的支持集样本的初步特征表示。
单个query与其他样本得到的key点乘计算相似度,再经过softmax得到注意力向量αq,:,向量αq,:的第k个元素αqk揭示了样本q和样本k之间的相似性,V:,k对应value中的第k列,将计算出的注意力值作为权重同value中的对应列作加权求和得到新的query值经过线性层/>改变特征至原来的通道数,和原特征φx相加,τ表示经过dropout和LN转换(layer normalization,通道方向做归一化),得到更新后的特征ψx,公式如下:
步骤四,将实现自适应后的支持集特征送入投影模块。将每类支持集特征按通道方向级联,然后将其嵌入至新的特征空间,在通道方向上使用softmax得到支持集各类别的掩码,掩码可以掩盖不相关的特征,并通过支持集的特征来选择对当前的小样本任务最具鉴别性的特征。
进一步的,步骤四的具体实现方式如下;
将实现自适应后的支持集特征送入投影模块。实现自适应后的支持集特征图大小为(NK,m1,d1,d1),N是类别数,K是每个类别的样本数,m1是通道数,d1是特征的长和宽。将每类支持集特征按通道方向级联,得到张量大小为(N,Km1,d1,d1),然后通过投影模块将其嵌入至新的特征空间,得到张量大小为(N,m2,d2,d2),在通道方向上使用softmax得到不同类别的掩码一共有对应类别数N个掩码p,掩码可以掩盖不相关的特征,并通过支持集的特征来选择对当前的小样本任务最具鉴别性的特征。
步骤五,通过Reshaper模块将最初经过特征提取器得到的支持集和查询集的特征嵌入至和掩码共享的特征空间,并将通过每类支持集得到的各类掩码分别应用至支持集特征和查询集特征。
进一步的,步骤五的具体实现方式如下;
为使掩码p影响支持集和查询集的特征,需要通过Reshaper模块匹配网络中掩码和样本特征之间的形状。将最初经过特征提取器得到的支持集和查询集的特征通过Reshaper模块嵌入至掩码共享的特征空间,并将各类掩码p分别按元素乘法应用至支持集特征和查询集特征,支持集应用掩码后,还应平均得到该类的原型。
其中是支持集样本经过特征提取器得到的特征表示集合,/>是支持集第i类的集合,pi是该类的掩码,⊙表示样本方向广播掩码,/>是支持集应用掩码后平均得到的原型。
其中Q是查询集样本经过特征提取器得到的特征表示集合,pi是第i类掩码,⊙表示样本方向广播掩码,Qi表示应用了第i类掩码的查询集特征集合,表示第j个应用了第i类掩码的查询特征。
进一步的,Reshaper模块和投影模块都由三个卷积神经网络块构成,每一个卷积神经网络块包括:3×3卷积核的卷积层,批归一化层,ReLU激活函数,2×2最大池化层;
步骤六,计算应用掩码后的查询集和各类支持集的相似度分数,应用softmax进行分类,计算交叉熵损失,反向传播更新网络参数;
进一步的,步骤六的具体实现方式如下;
通过掩码得到的支持集和查询集特征,计算二者间的欧式距离来度量相似度,得到距离后通过softmax将查询样本分类至支持集的类别,以查询集第z个样本为例,其分类至第k类的概率为:
其中,表示了查询集应用了第k个掩码的第z个样本,和支持集应用了第k个掩码的第k类原型之间的欧式距离。
计算损失用到的交叉熵损失,公式如下:
其中,为Qz的真实标签,nq为查询集样本数量。
得到损失后,反向传播更新网络参数。
步骤七,重复进行步骤二至六,训练神经网络模型,得到训练后网络模型,使用训练后模型对测试集Dtest样本进行分类。
进一步的,步骤七的具体实现方式如下;
重复进行步骤二至六,迭代训练深度神经网络模型,得到训练后的网络模型,使用训练后模型对测试集Dtest样本进行分类。
从测试集Dtest中取样小样本分类任务,与步骤二中从训练集中采样采取相同的方式,测试分类性能。
应当理解的是,上述针对实施例的描述较为详细,并不能因此而认为是对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,本发明可以有各种更改和变化。在不脱离本发明权利要求所保护的范围。所作的任何修改、等同替换、改进等,均落入本发明的保护范围之内,本发明的请求保护范围应以所附权利要求为准。
Claims (5)
1.一种基于特征自适应的小样本图像分类方法,其特征在于,包括如下步骤:
步骤一,划分数据集,将数据集划分为训练集Dtrain,测试集Dtest,训练集与测试集包含不同种类的图像;
步骤二,构建小样本分类任务,从训练集Dtrain中取样支持集Dsupport和查询集Dquery构成任务,并将所述小样本分类任务中包含的图像经过特征提取器提取支持集和查询集的初步特征;
步骤三,将提取到的支持集特征送入Transformer结构的自适应模块;
步骤三的具体实现方式如下;
将支持集样本的特征表示送入Transformer结构的自适应模块,为得到Transformer结构中的query,key,value集合,分别采用三组线性层对支持集样本的特征进行投影,线性层的维度是d×d′,d对应样本的特征表示的维度,对支持集内的每个样本特征分别进行变换,每个样本特征都得到query,key,value向量,支持集的样本得到的query,key,value可以分别构成集合Q,K,V,公式如下:
其中是支持集样本经过特征提取器得到的特征表示集合,/>表示/>中的元素个数,φx指经过特征提取器得到的支持集样本的初步特征表示;
单个query与其他样本得到的key点乘计算相似度,再经过softmax得到注意力向量αq,:,向量αq,:的第k个元素αqk揭示了样本q和样本k之间的相似性,V:,k对应value中的第k列,将计算出的注意力值作为权重同value中的对应列作列对应加权求和得到新的query值经过线性层/>改变特征至原来的通道数,和原特征φx相加,τ表示经过dropout和LN转换,得到更新后的特征ψx,公式如下:
步骤四,将实现自适应后的支持集特征送入投影模块,将每类支持集特征按通道方向级联,然后将级联后得到张量嵌入至新的特征空间,在通道方向上使用softmax得到支持集各类别的掩码;
步骤五,通过Reshaper模块将最初经过特征提取器得到的支持集和查询集的特征嵌入至和掩码共享的特征空间,并将通过每类支持集得到的各类掩码分别应用至支持集特征和查询集特征;
步骤五的具体实现方式如下;
为使掩码p影响支持集和查询集的特征,通过Reshaper模块匹配网络中掩码和样本特征之间的形状,将最初经过特征提取器得到的支持集和查询集的特征通过Reshaper模块嵌入至掩码共享的特征空间,并将各类掩码p分别按元素乘法应用至支持集特征和查询集特征,支持集应用掩码后,还应平均得到该类的原型;
其中φx指经过特征提取器得到的支持集样本的初步特征表示;是支持集样本经过特征提取器得到的特征表示集合,/>是支持集第i类的集合,pi是第i类的掩码,⊙表示样本方向广播掩码,/>是支持集应用掩码后平均得到的原型;
其中Q是查询集样本经过特征提取器得到的特征表示集合,pi是第i类掩码,⊙表示样本方向广播掩码,Qi表示应用了第i类掩码的查询集特征集合,表示第j个应用了第i类掩码的查询特征;
步骤六,计算应用掩码后的查询集和各类支持集的相似度分数,应用softmax进行分类,计算交叉熵损失,反向传播更新网络参数;
步骤七,重复进行步骤二至六,训练整体的网络模型,得到训练后网络模型,使用训练后的网络模型对测试集Dtest样本进行分类。
2.如权利要求1所述的一种基于特征自适应的小样本图像分类方法,其特征在于:步骤二的具体实现方式如下;
构建小样本分类任务,任务包含支持集和查询集,给定一个查询样本,其目标是将其分类为支持集中的一个类别,首先从训练集Dtrain中取样若干个N个类别的样本,然后从每个类别中随机选K个样本,构建支持集 指支持集样本,/>指支持集样本对应标签;类别中剩余的样本构建查询集/> 指查询集样本,/>指查询集样本对应标签,nq为查询集样本数量;
将支持集和查询集的图像样本x送入特征提取器fθ(·),得到支持集和查询集的初步特征表示:
φx=fθ(x)
特征提取器fθ(·)由四个卷积神经网络块构成,每一个卷积神经网络块包括:64个3×3维卷积核,批归一化层,ReLU激活函数,2×2最大池化层。
3.如权利要求1所述的一种基于特征自适应的小样本图像分类方法,其特征在于:步骤四的具体实现方式如下;
将实现自适应后的支持集特征送入投影模块,实现自适应后的支持集特征图大小为(NK,m1,d1,d1),N是类别数,K是每个类别的样本数,m1是通道数,d1是特征的长和宽,将每类支持集特征按通道方向级联,得到张量大小为(N,Km1,d1,d1),然后通过投影模块将其嵌入至新的特征空间,得到张量大小为(N,m2,d2,d2),在通道方向上使用softmax得到不同类别的掩码一共有对应类别数N个掩码p,掩码可以掩盖不相关的特征,并通过支持集的特征来选择对当前的小样本任务最具鉴别性的特征。
4.如权利要求1所述的一种基于特征自适应的小样本图像分类方法,其特征在于:Reshaper模块和投影模块都由三个卷积神经网络块构成,每一个卷积神经网络块包括:3×3卷积核的卷积层,批归一化层,ReLU激活函数,2×2最大池化层。
5.如权利要求1所述的一种基于特征自适应的小样本图像分类方法,其特征在于:步骤六的具体实现方式如下;
通过掩码得到的支持集和查询集特征,计算二者间的欧式距离来度量相似度,得到距离后通过softmax将查询样本分类至支持集的类别,以查询集第z个样本为例,其分类至第k类的概率为:
其中,表示了查询集应用了第k个掩码的第z个样本,和支持集应用了第k个掩码的第k类原型之间的欧式距离;
计算损失用到的交叉熵损失,公式如下:
其中,为Qz的真实标签,nq为查询集样本数量;
得到损失后,反向传播更新网络参数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210246145.4A CN114898136B (zh) | 2022-03-14 | 2022-03-14 | 一种基于特征自适应的小样本图像分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210246145.4A CN114898136B (zh) | 2022-03-14 | 2022-03-14 | 一种基于特征自适应的小样本图像分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114898136A CN114898136A (zh) | 2022-08-12 |
CN114898136B true CN114898136B (zh) | 2024-04-19 |
Family
ID=82714517
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210246145.4A Active CN114898136B (zh) | 2022-03-14 | 2022-03-14 | 一种基于特征自适应的小样本图像分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114898136B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115953665B (zh) * | 2023-03-09 | 2023-06-02 | 武汉人工智能研究院 | 一种目标检测方法、装置、设备及存储介质 |
CN117671673B (zh) * | 2023-11-21 | 2024-05-28 | 江南大学 | 一种基于自适应张量子空间的小样本宫颈细胞分类方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110490227A (zh) * | 2019-07-09 | 2019-11-22 | 武汉理工大学 | 一种基于特征转换的少样本图像分类方法 |
CN113378938A (zh) * | 2021-06-11 | 2021-09-10 | 西安电子科技大学 | 一种基于边Transformer图神经网络的小样本图像分类方法及系统 |
CN113569486A (zh) * | 2021-07-30 | 2021-10-29 | 安徽容知日新科技股份有限公司 | 一种工业设备的故障检测方法、计算设备及可读存储介质 |
CN114092769A (zh) * | 2022-01-20 | 2022-02-25 | 国网江西省电力有限公司电力科学研究院 | 基于联邦学习的变电站多场景巡检分析方法 |
CN114092742A (zh) * | 2021-11-19 | 2022-02-25 | 西安交通大学 | 一种基于多角度的小样本图像分类装置和方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200143209A1 (en) * | 2018-11-07 | 2020-05-07 | Element Ai Inc. | Task dependent adaptive metric for classifying pieces of data |
-
2022
- 2022-03-14 CN CN202210246145.4A patent/CN114898136B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110490227A (zh) * | 2019-07-09 | 2019-11-22 | 武汉理工大学 | 一种基于特征转换的少样本图像分类方法 |
CN113378938A (zh) * | 2021-06-11 | 2021-09-10 | 西安电子科技大学 | 一种基于边Transformer图神经网络的小样本图像分类方法及系统 |
CN113569486A (zh) * | 2021-07-30 | 2021-10-29 | 安徽容知日新科技股份有限公司 | 一种工业设备的故障检测方法、计算设备及可读存储介质 |
CN114092742A (zh) * | 2021-11-19 | 2022-02-25 | 西安交通大学 | 一种基于多角度的小样本图像分类装置和方法 |
CN114092769A (zh) * | 2022-01-20 | 2022-02-25 | 国网江西省电力有限公司电力科学研究院 | 基于联邦学习的变电站多场景巡检分析方法 |
Non-Patent Citations (1)
Title |
---|
Double Graph Regularized Double Dictionary Learning for Image Classification;Yi Rong et al.;《 IEEE Transactions on Image Processing》;20200620;第29卷;第7707-7721页 * |
Also Published As
Publication number | Publication date |
---|---|
CN114898136A (zh) | 2022-08-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105184303B (zh) | 一种基于多模态深度学习的图像标注方法 | |
CN114898136B (zh) | 一种基于特征自适应的小样本图像分类方法 | |
CN114241282A (zh) | 一种基于知识蒸馏的边缘设备场景识别方法及装置 | |
CN110321967B (zh) | 基于卷积神经网络的图像分类改进方法 | |
CN105808752B (zh) | 一种基于cca和2pknn的自动图像标注方法 | |
CN111612051B (zh) | 一种基于图卷积神经网络的弱监督目标检测方法 | |
CN110942091B (zh) | 寻找可靠的异常数据中心的半监督少样本图像分类方法 | |
CN108875076B (zh) | 一种基于Attention机制和卷积神经网络的快速商标图像检索方法 | |
CN108647595B (zh) | 基于多属性深度特征的车辆重识别方法 | |
CN103942749B (zh) | 一种基于修正聚类假设和半监督极速学习机的高光谱地物分类方法 | |
CN104966105A (zh) | 一种鲁棒机器错误检索方法与系统 | |
CN102999615A (zh) | 基于径向基函数神经网络的多样化图像标注和检索方法 | |
CN112766378A (zh) | 一种专注细粒度识别的跨域小样本图像分类模型方法 | |
CN113434688A (zh) | 用于舆情分类模型训练的数据处理方法和装置 | |
CN112232395A (zh) | 一种基于联合训练生成对抗网络的半监督图像分类方法 | |
CN113344069B (zh) | 一种基于多维关系对齐的无监督视觉表征学习的图像分类方法 | |
Wang et al. | R2-trans: Fine-grained visual categorization with redundancy reduction | |
CN114329031A (zh) | 一种基于图神经网络和深度哈希的细粒度鸟类图像检索方法 | |
CN110175631A (zh) | 一种基于共同学习子空间结构和聚类指示矩阵的多视图聚类方法 | |
CN115827871A (zh) | 互联网企业分类的方法、装置和系统 | |
CN114818945A (zh) | 融入类别自适应度量学习的小样本图像分类方法及装置 | |
CN114359568A (zh) | 一种基于多粒度特征的多标签场景图生成方法 | |
CN113010697A (zh) | 用于无监督跨模态检索的充分场景表达生成方法 | |
El Fouki et al. | Towards an improved classification model based on deep Learning and nearest rules strategy | |
CN115063692B (zh) | 一种基于主动学习的遥感图像场景分类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |