CN114926702A - 一种基于深度注意力度量的小样本图像分类方法 - Google Patents
一种基于深度注意力度量的小样本图像分类方法 Download PDFInfo
- Publication number
- CN114926702A CN114926702A CN202210400572.3A CN202210400572A CN114926702A CN 114926702 A CN114926702 A CN 114926702A CN 202210400572 A CN202210400572 A CN 202210400572A CN 114926702 A CN114926702 A CN 114926702A
- Authority
- CN
- China
- Prior art keywords
- sample
- class
- depth
- representing
- attention
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000005259 measurement Methods 0.000 title claims abstract description 24
- 238000000034 method Methods 0.000 title claims abstract description 16
- 238000009826 distribution Methods 0.000 claims abstract description 29
- 238000005070 sampling Methods 0.000 claims abstract description 9
- 238000012549 training Methods 0.000 claims abstract description 9
- 239000010410 layer Substances 0.000 claims description 37
- 230000006870 function Effects 0.000 claims description 9
- 238000010606 normalization Methods 0.000 claims description 5
- 230000004913 activation Effects 0.000 claims description 4
- 238000011176 pooling Methods 0.000 claims description 4
- 238000012360 testing method Methods 0.000 claims description 4
- 238000011478 gradient descent method Methods 0.000 claims description 3
- 230000008447 perception Effects 0.000 claims description 3
- 239000002356 single layer Substances 0.000 claims description 3
- 238000003860 storage Methods 0.000 claims description 3
- 239000013598 vector Substances 0.000 claims description 3
- 230000000694 effects Effects 0.000 abstract description 3
- 230000001143 conditioned effect Effects 0.000 abstract description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000011056 performance test Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000012271 agricultural production Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000010972 statistical evaluation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Multimedia (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于深度注意力度量的小样本图像分类方法,首先,根据小样本任务中的少量标注样本构建跨类样本对;然后,使用变分自编码器建立以跨类样本对为条件的多模态权重分布;接着,根据多模态权重分布采样生成深度度量网络;最后,使用生成的深度度量网络进行小样本图像分类。本发明方法根据任务描述信息生任务自适应的深度度量,解决了非参数化距离度量导致判别能力不足以及参数化的线性分类器容易过拟合的问题。采用端到端的元学习方式,避免了训练任务特定的分类器带来的时间开销,在小样本图像分类中取得了较好的分类效果。
Description
技术领域
本发明属于模式识别技术领域,具体涉及一种小样本图像分类方法。
背景技术
目前图像处理已经被广泛应用于工业制造、农业生产及军事遥感等众多领域。图像分类是其中的一项重要应用。在实际的应用中,往往面临着样本难获取以及难标注等问题,在训练时仅有少量的标记数据,呈现出典型的小样本特性。与传统机器学习的范式有所不同,小样本图像分类打破了独立同分布的假设,旨在能够在一个或者几个标注样本的条件下,将训练数据学习到的模型有效泛化到测试数据中。由于训练数据与测试数据的类别不同,而且分布差异较大,导致小样本图像分类性能不佳。元学习以良好的知识迁移及快速泛化能力成为解决小样本图像分类问题的有效途径。文献“Snell J,Swersky K,ZemelR.Prototypical networks for few shot learning[C]//Advances in NeuralInformation Processing Systems.2017:4077-4087.”,在元学习得到的嵌入空间中采用非参数化的距离度量进行分类;文献“Finn C,Abbeel P,Levine S.Modelagnosticmetalearning for fast adaptation of deep networks[C]//Proceedings of the 34thInternational Conference on Machine Learning Volume 70.JMLR.org,2017:1126-1135.”,在元学习得到的特征基础上训练任务特定的线性分类器进行分类。然而,采用非参数化的距离度量判别能力有限,而参数化的线性分类器容易陷入过拟合。这些问题限制了小样本图像分类的性能。
发明内容
为了克服现有技术的不足,本发明提供了一种基于深度注意力度量的小样本图像分类方法,首先,根据小样本任务中的少量标注样本构建跨类样本对;然后,使用变分自编码器建立以跨类样本对为条件的多模态权重分布;接着,根据多模态权重分布采样生成深度度量网络;最后,使用生成的深度度量网络进行小样本图像分类。本发明方法根据任务描述信息生任务自适应的深度度量,解决了非参数化距离度量导致判别能力不足以及参数化的线性分类器容易过拟合的问题。采用端到端的元学习方式,避免了训练任务特定的分类器带来的时间开销,在小样本图像分类中取得了较好的分类效果。
本发明解决其技术问题所采用的技术方案包括如下步骤:
步骤1:对于标准的N-wayK-shot小样本图像分类任务包含一个支持样本集和一个查询样本集其中,支持样本集包含N个类别,每个类别有K个标记样本,用于提供监督信息;查询样本集由来自支持样本集中相同的N个类别的未标记样本组成,用于进行性能测试;
其中,表示由ResNet-12构成的基本嵌入模块得到的第n类的第k个支持样本的深度特征,表示由基本嵌入模块得到的第d类的第l个支持样本的深度特征,表示样本的标注信息,表示第n个类别的第j个跨类样本对,Concat(·)表示沿着通道维度进行拼接,j=1,...,K2(N-1);
所述差异性编码器由三个串行的分别包括512、256及64个滤波器堆叠的3×3卷积块构成,每个卷积块均使用BN进行归一化、ReLU进行非线性激活及2×2池化核进行最大值池化;
步骤4:根据多模态权重分布,使用权重生成器生成深度度量网络的参数;
步骤4-2:用多个层级感知权重生成器分别为深度度量网络中的每一层生成权重参数;
所述3个感知权重生成器均依次由三个单层全连接网络连接构成,并分别使用LeakRelu进行激活;
步骤5:根据生成的深度度量网络进行小样本图像分类;
根据目标函数使用随机梯度下降法通过迭代多个小样本任务进行训练。
本发明的有益效果如下:
本发明方法根据任务描述信息生任务自适应的深度度量,解决了非参数化距离度量导致判别能力不足以及参数化的线性分类器容易过拟合的问题。采用端到端的元学习方式,避免了训练任务特定的分类器带来的时间开销。本发明方法在小样本图像分类中取得了较好的分类效果。
具体实施方式
下面结合实施例对本发明进一步说明。
一种基基于深度注意力度量的小样本图像分类方法,包括如下步骤:
步骤1:对于标准的N-wayK-shot小样本图像分类任务包含一个支持样本集和一个查询样本集其中,支持样本集包含N个类别,每个类别有K个标记样本,用于提供监督信息;查询样本集由来自支持样本集中相同的N个类别的未标记样本组成,用于进行性能测试;
步骤2:由于支持样本的数量有限(例如,N×K),获得的潜在高斯分布是不准确的,尤其是当权重分布较为复杂时。此外,单独考虑每个样本会导致难以挖掘有助于生成深度度量的类间判别信息。为此,根据任务的支持样本集 构建跨类样本对:
其中,表示由ResNet-12构成的基本嵌入模块得到的第n类的第k个支持样本的深度特征,表示由基本嵌入模块得到的第d类的第l个支持样本的深度特征,表示样本的标注信息,表示第n个类别的第j个跨类样本对,Concat(·)表示沿着通道维度进行拼接,j=1,...,K2(N-1);
所述差异性编码器由三个分别包括512、256及64个滤波器堆叠的3×3卷积块构成,并分别使用BN进行归一化、ReLU进行非线性激活及2×2池化核进行最大值池化;
步骤4:根据多模态权重分布,使用权重生成器生成深度度量网络的参数;
步骤4-2:用多个层级感知权重生成器分别为深度度量网络中的每一层生成权重参数;
所述3个感知权重生成器均依次由三个单层全连接网络连接构成,并分别使用LeakRelu进行激活;
步骤5:根据生成的深度度量网络进行小样本图像分类;
根据目标函数使用随机梯度下降法通过迭代多个小样本任务进行训练。
在测试阶段,针对每个采样的小样本任务,首先将所有样本输入到基本嵌入模块中提取深度特征,然后将支持样本集输入到元学习器中生成深度度量网络的参数,最后使用深度度量网络计算查询样本集与每个类别的原型之间的相似度得分,并将相似度得分最高的类别作为该查询样本的预测标签。
在小样本图像分类任务中,本发明方法获得较好的分类表现。以miniImageNet数据集为例,在5-way 1-shot和5-way 5-shot任务中,本发明方法的准确率分别能够达到60.39%和73.84%。相比于非参数化距离度量的基准分别提高了4.1%和4.3%。
Claims (1)
1.一种基基于深度注意力度量的小样本图像分类方法,其特征在于,包括如下步骤:
步骤1:对于标准的N-wayK-shot小样本图像分类任务包含一个支持样本集和一个查询样本集其中,支持样本集包含N个类别,每个类别有K个标记样本,用于提供监督信息;查询样本集由来自支持样本集中相同的N个类别的未标记样本组成,用于进行性能测试;
其中,表示由ResNet-12构成的基本嵌入模块得到的第n类的第k个支持样本的深度特征,表示由基本嵌入模块得到的第d类的第l个支持样本的深度特征,表示样本的标注信息,表示第n个类别的第j个跨类样本对,Concat(·)表示沿着通道维度进行拼接,j=1,...,K2(N-1);
所述差异性编码器由三个串行的分别包括512、256及64个滤波器堆叠的3×3卷积块构成,每个卷积块均使用BN进行归一化、ReLU进行非线性激活及2×2池化核进行最大值池化;
步骤4:根据多模态权重分布,使用权重生成器生成深度度量网络的参数;
步骤4-2:用多个层级感知权重生成器分别为深度度量网络中的每一层生成权重参数;
所述3个感知权重生成器均依次由三个单层全连接网络连接构成,并分别使用LeakRelu进行激活;
步骤5:根据生成的深度度量网络进行小样本图像分类;
根据目标函数使用随机梯度下降法通过迭代多个小样本任务进行训练。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210400572.3A CN114926702B (zh) | 2022-04-16 | 2022-04-16 | 一种基于深度注意力度量的小样本图像分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210400572.3A CN114926702B (zh) | 2022-04-16 | 2022-04-16 | 一种基于深度注意力度量的小样本图像分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114926702A true CN114926702A (zh) | 2022-08-19 |
CN114926702B CN114926702B (zh) | 2024-03-19 |
Family
ID=82807152
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210400572.3A Active CN114926702B (zh) | 2022-04-16 | 2022-04-16 | 一种基于深度注意力度量的小样本图像分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114926702B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115131580A (zh) * | 2022-08-31 | 2022-09-30 | 中国科学院空天信息创新研究院 | 基于注意力机制的空间目标小样本识别方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110020682A (zh) * | 2019-03-29 | 2019-07-16 | 北京工商大学 | 一种基于小样本学习的注意力机制关系对比网络模型方法 |
WO2021022752A1 (zh) * | 2019-08-07 | 2021-02-11 | 深圳先进技术研究院 | 一种多模态三维医学影像融合方法、系统及电子设备 |
CN112784921A (zh) * | 2021-02-02 | 2021-05-11 | 西北工业大学 | 任务注意力引导的小样本图像互补学习分类算法 |
-
2022
- 2022-04-16 CN CN202210400572.3A patent/CN114926702B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110020682A (zh) * | 2019-03-29 | 2019-07-16 | 北京工商大学 | 一种基于小样本学习的注意力机制关系对比网络模型方法 |
WO2021022752A1 (zh) * | 2019-08-07 | 2021-02-11 | 深圳先进技术研究院 | 一种多模态三维医学影像融合方法、系统及电子设备 |
CN112784921A (zh) * | 2021-02-02 | 2021-05-11 | 西北工业大学 | 任务注意力引导的小样本图像互补学习分类算法 |
Non-Patent Citations (1)
Title |
---|
陈晨;王亚立;乔宇;: "任务相关的图像小样本深度学习分类方法研究", 集成技术, no. 03, 30 June 2020 (2020-06-30), pages 15 - 25 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115131580A (zh) * | 2022-08-31 | 2022-09-30 | 中国科学院空天信息创新研究院 | 基于注意力机制的空间目标小样本识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN114926702B (zh) | 2024-03-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112926641B (zh) | 基于多模态数据的三阶段特征融合旋转机械故障诊断方法 | |
US7362892B2 (en) | Self-optimizing classifier | |
CN113191215A (zh) | 融合注意力机制与孪生网络结构的滚动轴承故障诊断方法 | |
CN114970605A (zh) | 一种多模态特征融合神经网络的制冷设备故障诊断方法 | |
CN113486578A (zh) | 一种工业过程中设备剩余寿命的预测方法 | |
CN108446334B (zh) | 一种无监督对抗训练的基于内容的图像检索方法 | |
CN111353373A (zh) | 一种相关对齐域适应故障诊断方法 | |
CN112949740B (zh) | 一种基于多级度量的小样本图像分类方法 | |
CN116186594B (zh) | 基于决策网络结合大数据实现环境变化趋势智能检测方法 | |
CN113887342A (zh) | 基于多源信号和深度学习的设备故障诊断方法 | |
CN112529638B (zh) | 基于用户分类和深度学习的服务需求动态预测方法及系统 | |
CN115859077A (zh) | 一种变工况下多特征融合的电机小样本故障诊断方法 | |
CN116805051A (zh) | 基于注意力机制的双卷积动态域适应设备故障诊断方法 | |
CN114239384A (zh) | 一种基于非线性度量原型网络的滚动轴承故障诊断方法 | |
CN114492634B (zh) | 一种细粒度装备图片分类识别方法及系统 | |
Zhang | Application of artificial intelligence recognition technology in digital image processing | |
CN115879018A (zh) | 基于K-means算法和BP神经网络的机舱设备状态感知与故障诊断方法 | |
CN114926702A (zh) | 一种基于深度注意力度量的小样本图像分类方法 | |
CN113935413A (zh) | 一种基于卷积神经网的配网录波文件波形识别方法 | |
CN118037423A (zh) | 农业贷款后农户还款意愿评价方法及系统 | |
CN116958701A (zh) | 一种基于改进vgg16与图像增强的网络异常流量检测方法 | |
CN108898157B (zh) | 基于卷积神经网络的数值型数据的雷达图表示的分类方法 | |
CN113590867B (zh) | 基于分层度量学习的跨模态信息检索方法 | |
CN114818945A (zh) | 融入类别自适应度量学习的小样本图像分类方法及装置 | |
CN116012903A (zh) | 一种人脸表情自动标注的方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |