CN117058452A - 一种基于特征分布拟合和深度学习的小样本图像分类方法 - Google Patents
一种基于特征分布拟合和深度学习的小样本图像分类方法 Download PDFInfo
- Publication number
- CN117058452A CN117058452A CN202311021750.2A CN202311021750A CN117058452A CN 117058452 A CN117058452 A CN 117058452A CN 202311021750 A CN202311021750 A CN 202311021750A CN 117058452 A CN117058452 A CN 117058452A
- Authority
- CN
- China
- Prior art keywords
- feature
- small sample
- image classification
- training
- class
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 93
- 238000009826 distribution Methods 0.000 title claims abstract description 56
- 238000013135 deep learning Methods 0.000 title claims abstract description 19
- 238000012549 training Methods 0.000 claims abstract description 49
- 230000008569 process Effects 0.000 claims abstract description 8
- 239000013598 vector Substances 0.000 claims description 41
- 238000012360 testing method Methods 0.000 claims description 19
- 238000012795 verification Methods 0.000 claims description 15
- 230000006870 function Effects 0.000 claims description 14
- 230000009466 transformation Effects 0.000 claims description 12
- 239000011159 matrix material Substances 0.000 claims description 10
- 238000005457 optimization Methods 0.000 claims description 10
- 238000005070 sampling Methods 0.000 claims description 10
- 238000010606 normalization Methods 0.000 claims description 7
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 claims description 4
- 238000007781 pre-processing Methods 0.000 claims description 4
- 101100481876 Danio rerio pbk gene Proteins 0.000 claims description 3
- 101100481878 Mus musculus Pbk gene Proteins 0.000 claims description 3
- 230000004913 activation Effects 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 3
- 238000013508 migration Methods 0.000 claims description 3
- 230000005012 migration Effects 0.000 claims description 3
- 238000011176 pooling Methods 0.000 claims description 3
- 238000004260 weight control Methods 0.000 claims description 3
- 230000007246 mechanism Effects 0.000 abstract description 2
- 238000002474 experimental method Methods 0.000 description 8
- 238000005259 measurement Methods 0.000 description 7
- 230000000052 comparative effect Effects 0.000 description 5
- 238000010801 machine learning Methods 0.000 description 4
- 238000013461 design Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000013526 transfer learning Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 101100455978 Arabidopsis thaliana MAM1 gene Proteins 0.000 description 1
- 238000012935 Averaging Methods 0.000 description 1
- 241000270322 Lepidosauria Species 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000000691 measurement method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011056 performance test Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/761—Proximity, similarity or dissimilarity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Image Analysis (AREA)
Abstract
本发明提供了一种基于特征分布拟合和深度学习的小样本图像分类方法,该方法综合方向驱动策略和相似性权重策略,提出一种全新的基于特征分布拟合机制的小样本图像分类网络。其中,方向驱动策略可以在更多方向(维度)上描述和获取更完整的特征分布的信息;相似性权重策略可以估计不同的类别在特征分布拟合过程中产生的不同程度的影响,并为其分配相应的权重。该方法可以近似估计出小样本类的真实特征分布,并以此生成无数量限制的训练样本,以避免模型过拟合。
Description
技术领域
本发明属于计算机视觉技术领域,具体涉及一种基于特征分布拟合和深度学习的小样本图像分类方法。
背景技术
一般图像分类是指将一张图片分配到不同的预定义类别中的过程。通常情况下,这是通过使用机器学习算法和深度神经网络来实现的。而小样本图像分类则是指在训练数据非常少的情况下(通常少于几百个图像),将一张图片分配到不同的预定义类别中的过程。在这种情况下,传统的深度学习算法和神经网络往往无法有效地进行训练和分类。小样本图像分类的目的是解决在少量数据上进行图像分类时的问题。在现实生活中,获取大量标注的图像数据往往是非常困难的,因此小样本图像分类可以更好地利用现有的图像数据并提高分类的准确性。小样本图像分类通常涉及到使用一些特殊的技术和算法,例如迁移学习、元学习、生成对抗网络等,以帮助算法更好地理解和分类图像数据。其应用包括医学影像诊断、工业生产中的缺陷检测、机器人视觉等领域。
传统的小样本图像分类方法主要包括以下几种:基于人工设计特征的分类方法,主要是通过手动设计特征提取器,例如SIFT、HOG、LBP等来提取图像特征,然后使用传统的机器学习算法,例如SVM、KNN、决策树等进行分类;基于字典学习的分类方法,通过对训练样本进行聚类,并将每个聚类中心作为字典的基础来构建分类器,在测试时,将测试样本表示为基础的线性组合,并使用分类器进行分类;基于核方法的分类方法,主要是通过核函数将低维特征映射到高维空间,然后使用传统的机器学习算法,例如SVM、KNN等进行分类;基于相似度度量的分类方法:主要是计算训练样本和测试样本之间的相似度,然后根据相似度对测试样本进行分类,常见的相似度度量方法包括欧式距离、余弦相似度、马氏距离等。这些方法都是传统的小样本图像分类方法,主要依赖于手动设计特征和传统的机器学习算法。虽然这些方法在一些场景下表现良好,但是面对复杂的图像数据和更少规模的样本数据时,效果可能不尽如人意。随着深度学习技术的发展,基于深度学习的小样本图像分类方法已成为当前的热点之一。
目前基于深度学习的少样本图像分类方法主要有以下几种:元学习(Meta-Learning)方法,元学习可以使得模型能够在少量的样本上快速学习到新的任务。这种方法通过学习到从少量的训练样本中抽象出来的共性特征,从而快速适应新的任务,常见的元学习方法包括MAML、Reptile、ProtoNets等;基于生成对抗网络(GAN)的方法,GAN可以生成与训练数据类似的合成数据,因此可以用于增强训练数据,从而提高模型的泛化能力。GAN还可以生成样本的嵌入表示,用于分类任务。常见的基于GAN的小样本分类方法包括GAN-based Few-Shot Learning(GFSL)、Conditional GAN-based Few-Shot Learning(CGFSL)等;基于度量学习的方法则是学习如何比较,通过比较每个训练任务中的查询集图像和支持集图像之间的关系,实现任务之间可迁移特征的学习。常见的基于度量学习的方法包括Matching Network、Relation Network等。这些方法都是基于深度学习的小样本图像分类方法,它们在处理少量数据和复杂数据方面有很好的表现,是当前研究的热点。虽然现有的小样本图像分类方法已经取得了一定的成果,但仍然大多聚焦于训练过程优化、判别性表征学习和样本生成网络,忽略了数据本身的属性,如数据在特征空间中的真实分布。此外,现有关注并估计小样本类别真实特征分布的方法在描述分布和获取分布信息方面还不够完全,这导致对小样本类别真实特征分布的估计不够准确。所以,设计一种准确估计的小样本类别真实特征分布的小样本图像分类网络十分有必要。
发明内容
本发明的目的在于克服现有技术的不足,提供一种基于特征分布拟合和深度学习的小样本图像分类方法,具体来说,该方法综合方向驱动策略和相似性权重策略,提出一种全新的基于特征分布拟合机制的小样本图像分类网络。其中,方向驱动策略可以在更多方向(维度)上描述和获取更完整的特征分布的信息;相似性权重策略可以估计不同的类别在特征分布拟合过程中产生的不同程度的影响,并为其分配相应的权重。该方法可以近似估计出小样本类的真实特征分布,并以此生成无数量限制的训练样本,以避免模型过拟合。
为实现上述目的,本发明提供如下技术方案:一种基于特征分布拟合和深度学习的小样本图像分类方法,包括以下步骤:
步骤一、将公开小样本图像分类数据集进行划分,分为训练集、测试集以及验证集,对训练集的图像及对应的标签数据进行预处理,获得同一尺寸图像;
步骤二、构建特征提取器模型,包括多个具有跳跃连接的宽残差块,多个卷积层、批量归一化层、激活函数层、Dropout层、平均池化层以及全连接层;
步骤三、基于步骤二构建的网络模型设计损失函数,其中包括交叉熵损失与自监督的旋转损失;
步骤四、将所述步骤一获得的训练集图像,以一定批次数量输入特征提取器模型,并以所述步骤三的损失函数对特征提取器进行预训练;
步骤五、将所述步骤一中的训练集和验证集图像输入所述步骤四中训练好的特征提取器进行特征提取,并得到训练集样本的特征向量与验证集样本的特征向量;
步骤六、在验证集中进行类别和样本特征的随机采样,构建大量不同的小样本任务;
步骤七、将所述步骤五中提取的训练集各类别特征向量进行统计信息的计算,包括各类分布的均值向量和协方差矩阵;
步骤八、将所述步骤五中构建小样本任务中的验证集样本的特征向量进行幂阶段变换;
步骤九、使用步骤七计算的各类分布的均值向量和步骤八变换后小样本任务中的支持集特征向量构建特征描述矩阵;
步骤十、选出与小样本类中的目标样本高度匹配的相似类;
步骤十一、衡量不同相似类在分布拟合过程的不同贡献,并为其分配不同的权重;
步骤十二、根据步骤七中的统计信息、步骤十中选出的相似类以及步骤十一中不同相似类的不同权重,将相似类的统计信息迁移到支持集中的特征向量所属的小样本类中;
步骤十三、根据步骤十二中迁移后的小样本类特征分布,采样无数量限制的对应类别的特征向量;
步骤十四、构建特定于任务的全连接层分类器,并将新生成的特征与支持集原始特征都将进行L2归一化,输入分类器中进行最小化监督损失的优化训练;
步骤十五、提取所述步骤一中的测试集图像特征,并进行类别和样本特征的随机采样,构建大量不同的小样本任务;
步骤十六、使用测试集小样本任务中的样本对所述步骤十四的分类器进行分类性能测试,并最后得到所有小样本任务的平均分类准确率。
进一步的,所述步骤六中,从数据集中采样N个类别,每个类别抽取K个带标签的训练样本作为支持集再从每类剩下的图像中抽取q个用于测试的无标签样本作为查询集/>其中,Xi是第i个样本。
进一步的,所述步骤七中,各类分布的均值向量和协方差矩阵计算如下:
其中,ni是第i个训练集类别中的样本数量,Xj是第i个训练集类别中的第j个图像,Fθ(·)为特征提取器。
进一步的,所述步骤八中,幂阶段变换方式如下:
其中,xi表示的是支持集和查询集中的第i个特征向量,β是调整分布偏斜程度的超参数,经过该幂阶变换后,支持集和查询集被更新为和
进一步的,所述步骤九中,第j个基类的均值μj的特征描述矩阵和支持集中的特征向量/>的特征描述矩阵/>表达如下:
进一步的,所述步骤十中,选取方式如下:
其中,Topk(·)是选择顶部元素的操作符,是匹配程度的集合,并且/>是包含与支持集/>中的特征向量/>相比k个最近类的类别标签的集合。
进一步的,所述步骤十一中,权重因子的表达如下:
其中,γ为权重控制因子,是一个用于控制权重因子大小的超参数。
与现有技术相比,本发明的有益效果是:
本发明可以根据小样本类的有偏特征分布并迁移其他类分布的统计信息,从而更准确地拟合出其相对应类别的真实分布,而后可以从拟合出的特征分布中生成更多的新类样本。具体而言,为了更好地描述其他方向上的特征分布信息,提出了一种方向驱动策略。在分布拟合过程中,提出了相似性权重策略来衡量不同相似类的影响并为其分配相应的权重。该方法使有偏的特征分布近似拟合相应的真实分布,提高了模型在小样本图像分类任务上的性能。最后相关实验结果表明,该方法能显著提高小样本图像分类任务的分类准确率,在公开三个数据集上均达到了先进的分类准确率。该方法在小样本图像分类与一般图像分类间建立起了桥梁,将小样本分类问题转化为一般的分类问题,有效地提高了模型在小样本图像分类任务上的分类性能和泛化能力。
附图说明
图1为方向驱动策略与相似性加权策略示意图;
图2为本发明的整体框架图;
图3为N-way-K-shot示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步的详细说明。此处所描述的具体实施例仅用于解释本发明技术方案,并不限于本发明。
一种基于特征分布拟合和深度学习的小样本图像分类方法,从准确估计小样本类的真实分布的角度出发,通过方向驱动策略与相似性加权策略(如图1所示),描述、获取和迁移相似类的统计信息来估计仅含若干样本的小样本类的真实分布,从而将采样生成的新特征加入模型训练,提高模型在新任务上的分类性能和泛化能力。具体如图2所示,包含以下步骤,并按以下步骤依次执行:
步骤一、将公开小样本图像分类数据集miniImageNet划分训练集、测试集以及验证集,对训练集的图像及对应的标签数据进行预处理,获得同一尺寸图像。其中,数据预处理的方式包括图像随机尺寸裁剪、图像抖动、随机水平翻转、归一化以及张量化。
步骤二、使用WideResNet-28-10模型构建特征提取器Fθ(·),包括多个具有跳跃连接的宽残差块Wide Residual Block,多个卷积层、批量归一化层、激活函数层、Dropout层、平均池化层以及全连接层;
步骤三、基于步骤二构建的网络模型设计损失函数,包括旋转损失Lrotation与交叉熵损失Lclassification,表达如下:
其中,CR为图像旋转角度的类别;为训练集,Xr为训练集样本,r为旋转角度的标签,y为类别标签以及/>为旋转类别分类器。
步骤四、将所述步骤一获得的训练集图像,以一定批次数量输入特征提取器模型,并以所述步骤三的损失函数对特征提取器进行预训练,训练Epoch数为400;
步骤五、将所述步骤一中的训练集和验证集图像输入所述步骤四中训练好的特征提取器进行特征提取,并得到训练集样本的特征向量与验证集样本的特征向量;
步骤六、在验证集中进行类别和样本特征的随机采样,构建大量不同的小样本任务,又称为N-way-K-shot的方式,如图3所示。具体而言,从数据集中采样N个类别,每个类别抽取K个带标签的训练样本作为支持集(Support set)再从每类剩下的图像中抽取q个用于测试的无标签样本作为查询集(Query set)/>其中,Xi是N-way-K-shot中的第i个样本;
步骤七、将所述步骤五中提取的训练集各类别特征向量进行统计信息的计算,训练集中各类别特征分布的均值向量和协方差矩阵计算如下;
其中,ni是第i个训练集类别中的样本数量,Xj是第i个训练集类别中的第j个图像,Fθ(·)为特征提取器;
步骤八、将所述步骤五中构建小样本任务中的验证集样本的特征向量进行幂阶段变换,其变换方式如下:
其中,xi表示的是支持集和查询集中的第i个特征向量,β是调整分布偏斜程度的超参数,经过该幂阶变换后,支持集和查询集被更新为和
步骤九、使用步骤七计算的各类分布的均值向量和步骤八变换后小样本任务中的支持集特征向量构建特征描述矩阵,第j个基类的均值μj的特征描述矩阵和支持集中的特征向量/>的特征描述矩阵/>表达如下:
步骤十、选出与小样本类中的目标样本高度匹配的相似类,选取方式如下:
其中,Topk(·)是选择顶部元素的操作符,是匹配程度的集合,并且/>是包含与支持集/>中的特征向量/>相比k个最近类的类别标签的集合;
步骤十一、衡量不同相似类的在分布拟合过程的不同贡献,并为其分配不同的权重,权重因子的表达如下:
其中,γ为权重控制因子,是一个用于控制权重因子大小的超参数;
步骤十二、根据步骤七中的统计信息、步骤十中选出的相似类以及步骤十一中不同相似类的不同权重,将相似类的统计信息迁移到支持集中的特征向量所属的小样本类中,其表达方式如下:
步骤十三、根据步骤十二中迁移后的小样本类特征分布,采样无数量限制的对应类别的特征向量,其表达如下:
其中,和/>分别拟合出的特征分布的均值向量和协方差矩阵,并且该集合/>的大小是N-way-K-shot任务中K的值,新生成的特征向量的数量被设置为超参数M;
步骤十四、构建特定于任务的全连接层分类器,并将新生成的特征与支持集原始特征都将进行L2归一化,输入分类器中进行最小化监督损失的优化训练,其表达方式如下:
其中,是支持集/>的标签集合,LCE是交叉熵损失函数,分类器模型f的参数为θ*;
步骤十五、提取所述步骤一中的测试集图像特征,并进行类别和样本特征的随机采样,构建大量不同的测试任务;
步骤十六、使用测试集小样本任务中的样本对所述步骤十四的分类器进行分类性能测试,并最后得到所有小样本任务的平均分类准确率(Accuracy)。
以下是本发明与现有技术的对比实验。
表1列出了本发明与现有技术在miniImageNet数据集上的对比实验结果。在10000个任务以及5-way-1-shot和5way-5-shot的设置下,本发明的分类平均准确率分别达到了68.58%和84.65%。与现有技术相比,本发明取得了最好的实验结果。
5-way-1-shot设置下,与基于优化的方法中准确率最高的Meta TransferLearning相比,本发明的分类准确率提高了4.28%;相比于基于度量的方法中准确率最高的Sum-min,本发明的分类准确率提高了0.26%,需要注意的是以下Sum-min报告的实验结果是在600个任务上的实验结果,与本发明中的10000个任务有很大差距;与基于微调的方法中准确率最高的S2M2R相比,本发明的分类准确率提高了3.65%;与基于生成的方法中准确率最好的DC相比,本发明的分类准确率提高了0.46%。
5-way-5-shot设置下,与基于优化的方法中准确率最高的Meta TransferLearning相比,本发明的分类准确率提高了3.75%;相比于基于度量的方法中准确率最高的Sum-min,本发明的分类准确率提高了1.94%;与基于微调的方法中准确率最好的S2M2R相比,本发明的分类准确率提高了1.47%;与基于生成的方法中准确率最好的DC相比,本发明的分类准确率提高了1.57%。
表1
表2列出了本发明与现有技术在CUB数据集上的对比实验结果。在10000个任务以及5-way-1-shot和5way-5-shot的设置下,本发明的分类平均准确率分别达到了80.40%和90.75%。与现有技术相比,本发明同样取得了最好的结果。
5-way-1-shot设置下,与基于优化的方法中准确率最高的Meta-SGD相比,本发明的分类准确率提高了27.06%;相比于基于度量的方法中准确率最高的Sum-min,本发明的分类准确率提高了0.8%;与基于微调的方法中准确率最好的Negative-Cosine相比,本发明的分类准确率提高了7.74%;与基于生成的方法中准确率最好的DC相比,本发明的分类准确率提高了2.11%。
5-way-5-shot设置下,与基于优化的方法中准确率最高的Meta-SGD相比,本发明的分类准确率提高了23.16%;相比于基于度量的方法中准确率最高的Sum-min,本发明的分类准确率提高了0.27%;与基于微调的方法中准确率最好的Negative-Cosine相比,本发明的分类准确率提高了1.35%;与基于生成的方法中准确率最好的DC相比,本发明的分类准确率提高了1.83%。
表2
表3列出了本发明与现有技术在CIFAR-FS数据集上的对比实验结果。在10000个任务以及5-way-1-shot和5way-5-shot的设置下,本发明的分类平均准确率分别达到了75.26%和86.90%。与现有技术相比,本发明同样取得了最好的结果。
5-way-1-shot设置下,与基于优化的方法中准确率最高的MetaOptNet相比,本发明的分类准确率提高了2.46%;相比于基于度量的方法中准确率最高的RENet,本发明的分类准确率提高了0.75%,需要注意的是以下RENet报告结果是在2000个任务上的实验结果,与本发明实验中的10000个任务同样有明显差距;与基于微调的方法中准确率最好的RFS-simple相比,本发明的分类准确率提高了3.76%。
5-way-5-shot设置下,与基于优化的方法中准确率最高的MetaOptNet相比,本发明的分类准确率提高了1.9%;相比于基于度量的方法中准确率最高的RENet,本发明的分类准确率提高了0.3%;与基于微调的方法中准确率最好的RFS-simple相比,本发明的分类准确率提高了0.9%。以上所有现有技术的比较实验及实验结果都验证了本发明的先进性。
表3
以上所述仅表达了本发明的优选实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形、改进及替代,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
Claims (7)
1.一种基于特征分布拟合和深度学习的小样本图像分类方法,其特征在于:包括以下步骤:
步骤一、将公开小样本图像分类数据集进行划分,分为训练集、测试集以及验证集,对训练集的图像及对应的标签数据进行预处理,获得同一尺寸图像;
步骤二、构建特征提取器模型,包括多个具有跳跃连接的宽残差块,多个卷积层、批量归一化层、激活函数层、Dropout层、平均池化层以及全连接层;
步骤三、基于步骤二构建的网络模型设计损失函数,其中包括交叉熵损失与自监督的旋转损失;
步骤四、将所述步骤一获得的训练集图像,以一定批次数量输入特征提取器模型,并以所述步骤三的损失函数对特征提取器进行预训练;
步骤五、将所述步骤一中的训练集和验证集图像输入所述步骤四中训练好的特征提取器进行特征提取,并得到训练集样本的特征向量与验证集样本的特征向量;
步骤六、在验证集中进行类别和样本特征的随机采样,构建大量不同的小样本任务;
步骤七、将所述步骤五中提取的训练集各类别特征向量进行统计信息的计算,包括各类分布的均值向量和协方差矩阵;
步骤八、将所述步骤五中构建小样本任务中的验证集样本的特征向量进行幂阶段变换;
步骤九、使用步骤七计算的各类分布的均值向量和步骤八变换后小样本任务中的支持集特征向量构建特征描述矩阵;
步骤十、选出与小样本类中的目标样本高度匹配的相似类;
步骤十一、衡量不同相似类在分布拟合过程的不同贡献,并为其分配不同的权重;
步骤十二、根据步骤七中的统计信息、步骤十中选出的相似类以及步骤十一中不同相似类的不同权重,将相似类的统计信息迁移到支持集中的特征向量所属的小样本类中;
步骤十三、根据步骤十二中迁移后的小样本类特征分布,采样无数量限制的对应类别的特征向量;
步骤十四、构建特定于任务的全连接层分类器,并将新生成的特征与支持集原始特征都将进行L2归一化,输入分类器中进行最小化监督损失的优化训练;
步骤十五、提取所述步骤一中的测试集图像特征,并进行类别和样本特征的随机采样,构建大量不同的小样本任务;
步骤十六、使用测试集小样本任务中的样本对所述步骤十四的分类器进行分类性能测试,并最后得到所有小样本任务的平均分类准确率。
2.根据权利要求1所述的一种基于特征分布拟合和深度学习的小样本图像分类方法,其特征在于:所述步骤六中,从数据集中采样N个类别,每个类别抽取K个带标签的训练样本作为支持集再从每类剩下的图像中抽取q个用于测试的无标签样本作为查询集/>其中,Xi是第i个样本。
3.根据权利要求2所述的一种基于特征分布拟合和深度学习的小样本图像分类方法,其特征在于:所述步骤七中,各类分布的均值向量和协方差矩阵计算如下:
其中,ni是第i个训练集类别中的样本数量,Xj是第i个训练集类别中的第j个图像,Fθ(·)为特征提取器。
4.根据权利要求3所述的一种基于特征分布拟合和深度学习的小样本图像分类方法,其特征在于:所述步骤八中,幂阶段变换方式如下:
其中,xi表示的是支持集和查询集中的第i个特征向量,β是调整分布偏斜程度的超参数,经过该幂阶变换后,支持集和查询集被更新为和/>
5.根据权利要求4所述的一种基于特征分布拟合和深度学习的小样本图像分类方法,其特征在于:所述步骤九中,第j个基类的均值μj的特征描述矩阵和支持集中的特征向量/>的特征描述矩阵/>表达如下:
6.根据权利要求5所述的一种基于特征分布拟合和深度学习的小样本图像分类方法,其特征在于:所述步骤十中,选取方式如下:
其中,Topk(·)是选择顶部元素的操作符,是匹配程度的集合,并且/>是包含与支持集/>中的特征向量/>相比k个最近类的类别标签的集合。
7.根据权利要求6所述的一种基于特征分布拟合和深度学习的小样本图像分类方法,其特征在于:所述步骤十一中,权重因子的表达如下:
其中,γ为权重控制因子,是一个用于控制权重因子大小的超参数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311021750.2A CN117058452A (zh) | 2023-08-15 | 2023-08-15 | 一种基于特征分布拟合和深度学习的小样本图像分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311021750.2A CN117058452A (zh) | 2023-08-15 | 2023-08-15 | 一种基于特征分布拟合和深度学习的小样本图像分类方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117058452A true CN117058452A (zh) | 2023-11-14 |
Family
ID=88665728
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311021750.2A Pending CN117058452A (zh) | 2023-08-15 | 2023-08-15 | 一种基于特征分布拟合和深度学习的小样本图像分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117058452A (zh) |
-
2023
- 2023-08-15 CN CN202311021750.2A patent/CN117058452A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103150580B (zh) | 一种高光谱图像半监督分类方法及装置 | |
CN110717554B (zh) | 图像识别方法、电子设备及存储介质 | |
CN105740912B (zh) | 基于核范数正则化的低秩图像特征提取的识别方法及系统 | |
CN108446741B (zh) | 机器学习超参数重要性评估方法、系统及存储介质 | |
CN108776812A (zh) | 基于非负矩阵分解和多样-一致性的多视图聚类方法 | |
CN1306650A (zh) | 表示多维空间中的接近性数据的系统、方法和计算机程序产品 | |
CN111882554B (zh) | 一种基于SK-YOLOv3的电力线故障智能检测方法 | |
CN112633382A (zh) | 一种基于互近邻的少样本图像分类方法及系统 | |
CN111027636B (zh) | 基于多标签学习的无监督特征选择方法及系统 | |
CN111931562A (zh) | 一种基于软标签回归的无监督特征选择方法和系统 | |
CN108921872B (zh) | 一种适用于长程跟踪的鲁棒性视觉目标跟踪方法 | |
CN110020674B (zh) | 一种提升局部类别区分度的跨领域自适应图像分类方法 | |
CN110399814B (zh) | 一种基于局部线性表示领域适应度量的人脸识别方法 | |
CN117078956A (zh) | 一种基于点云多尺度并行特征提取和注意力机制的点云分类分割网络 | |
CN117671704B (zh) | 一种手写体数字识别方法、装置及计算机存储介质 | |
Lin et al. | LLC encoded BoW features and softmax regression for microscopic image classification | |
Zhang et al. | Semantic hierarchy preserving deep hashing for large-scale image retrieval | |
CN112001345B (zh) | 基于特征变换度量网络的少样本人体行为识别方法及系统 | |
CN113592030A (zh) | 基于复值奇异谱分析的图像检索方法和系统 | |
CN117409260A (zh) | 一种基于深度子空间嵌入的小样本图像分类方法及装置 | |
CN117392450A (zh) | 一种基于进化多尺度特征学习的钢铁材料质量解析方法 | |
Liu et al. | Fuzzy c-mean algorithm based on Mahalanobis distances and better initial values | |
CN107729945A (zh) | 基于类间稀疏表示的鉴别回归、分类方法及系统 | |
CN116665039A (zh) | 基于两阶段因果干预的小样本目标识别方法 | |
CN117058452A (zh) | 一种基于特征分布拟合和深度学习的小样本图像分类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |