CN114863174A - 一种基于多尺度注意力特征融合的小样本分类算法 - Google Patents
一种基于多尺度注意力特征融合的小样本分类算法 Download PDFInfo
- Publication number
- CN114863174A CN114863174A CN202210497821.5A CN202210497821A CN114863174A CN 114863174 A CN114863174 A CN 114863174A CN 202210497821 A CN202210497821 A CN 202210497821A CN 114863174 A CN114863174 A CN 114863174A
- Authority
- CN
- China
- Prior art keywords
- convolution
- module
- feature
- attention
- scale
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Image Analysis (AREA)
Abstract
本发明提出了一种基于多尺度注意力特征融合的小样本分类算法,提取样本间的判别特征,学习样本间的多尺度原型进行分类。在多尺度特征嵌入模块中引入自适应分组卷积和通道混洗模块,将高阶强语义特征和低阶丰富的视觉特征结合起来。并结合特征融合注意力机制,从通道维度和空间维度提取注意力特征图,并将这两组特征图进行特征融合。此外,开发了一种基于MMD的加权原型网络,采用度量学习,并利用MMD对不同样本特征生成的原型进行加权。总的来说,改进算法引入了不同样本之间的原型进行多尺度度量学习,能够加强同类样本组之间的相关性,削弱异类样本组之间的相关性,有助于小样本学习的分类性能。
Description
技术领域
本发明涉及深度学习中的目标检测分类领域,是基于多尺度注意力特征融合的方法实现小样本分类。
背景技术
深度神经网络的最新进展推动了大数据集计算机视觉的革命性进展。其中具有里程碑意义的事件之一是ResNet在ILSVRC-2015数据集上达到了96.43%的top-5图像分类精度,比相关报道的人类分类精度高5.1%。然而,如果没有高质量的标注样本进行训练,深度神经网络就不能很好地工作。为了弥补这一缺陷,小样本学习方法训练一个模型,可以快速适应新的类别,通常情况下只需要只给几个样本,甚至每个类只给一个样本。
小样本学习是受人类智慧的启发,即人们有从经验中快速学习的能力。沿着这个方向,许多研究致力于减少神经网络对大量标注样本的依赖。早期关于小概率学习的研究包括贝叶斯学习、记忆增强神经网络和迁移学习。最近关于小样本学习的研究集中在元学习和度量学习两种方法上,它们显著提高了小样本的学习性能。在这些方法中,原型网络(PN)是遵循度量学习理论的最简单、最有效的方法。特别是,PN从少数样本中学习了由所有类的原型表示组成的度量空间。在测试阶段,计算每个原型样本到类的所有原型的距离。直观地说,原型网络在学习的度量空间中执行最近邻分类。由于其简单、有效的特点,PN在自然语言处理、领域自适应、半监督学习等领域得到了广泛的应用。
因此本章研究基于多尺度注意力特征融合机制的小样本分类算法,在基于原型网络的小样本图像分类算法的基础上进行改进,现有小样本学习算法以及原型网络存在的问题主要有以下几个方面:
1、一般来说,基于度量的学习主要分为两个部分:特征提取和样本间关系的度量。而目前基于度量的理论更倾向于对样本之间的距离建模,忽略了特征提取的重要性。
2、只利用了图像的单尺度特征(顶层特征),而忽略了对小样本识别同样重要的底层特征。大量研究已经证明仅仅使用顶层特征会丢失目标部分特征信息,从而降低识别的准确性。在小样本数据集上这样的信息丢失会对识别结果产生更严重的影响,因此需要同时获取顶层和底层的特征信息,避免目标信息的丢失。
3、没有对具有辨识度特征加以利用。且缺乏对任意两个位置之间远距离空间依赖关系和任意两个通道之间的通道依赖关系的提取。
4、原始的原型网络对于类原型的估算采用的是对该类所有样本嵌入向量求和平均的方法,没有根据样本质量分配其在原型中所占权重,这种方法在面对样本偏差时缺乏鲁棒性,往往一个偏差的样本就能导致生成原型产生较大误差。
发明内容
为了克服上述现有技术的不足,本发明的主要贡献如下:提出了一种新的小样本学习方法——多尺度注意力特征融合的图像分类算法,提取样本间的判别特征,学习样本间的多尺度原型进行分类。在多尺度特征嵌入模块中引入自适应分组卷积和通道混洗模块,将高阶强语义特征和低阶丰富的视觉特征结合起来。并结合特征融合注意力机制,从通道维度和空间维度提取注意力特征图,并将这两组特征图进行特征融合。此外,开发了一种基于MMD的加权原型网络,采用度量学习,并利用MMD对不同样本特征生成的原型进行加权。总的来说,改进算法引入了不同样本之间的原型进行多尺度度量学习,能够加强同类样本组之间的相关性,削弱异类样本组之间的相关性,有助于小样本学习的分类性能。
本发明所采用的技术方案是:
步骤1:本发明通过多个尺度不同的卷积核,采集不同的特征信息,同时采用自适应分组卷积与通道混洗降低网络复杂程度和计算量,设计了一个多尺度特征提取模块,通过训练一个适应不同尺度的分组卷积网络,生成一组多尺度特征信息图,将该组特征融合后作为特征提取网络最终输出的特征图。
步骤2:对于步骤1中的多尺度特征提取模块,本发明采用自适应分组卷积的方式提取输入特征图的空间信息。自适应分组卷积可以根据卷积核的大小决定分组的个数,降低了计算量的同时优化了卷积的表达能力,从而获得更丰富的输入向量的位置信息,并在多个尺度上并行处理。
步骤3:该步骤引入Inception网络和金字塔网络结构中的多尺度卷积核,用来生成具有不同空间分辨率和深度的特征信息。然而随着卷积核大小的增加,参数量会快速增加。为了在不增加计算量的情况下处理不同核尺度下的输入特征,本发明设计了一个在不增加参数数量的情况下选择分组数量的方法。
步骤4:该步骤是该专利的核心内容,在步骤1的特征提取模块基础上,设计了基于深度可分卷积的空间注意力模块DSSAM和通道注意力DSCAM模块,该模型自适应地融合了局部特征和全局相关性,提高了网络表达能力,减少了模型参数,轻量级DSSAM和轻量级DSCAM通过3×3depthwise卷积、1×1pointwise卷积、reshaping、transpose和softmax函数等一系列操作生成空间和通道的注意力权重矩阵。然后,将输入特征与空间或通道注意矩阵相乘,得到所有空间信息和通道信息的融合特征。最后,对两个融合特征进行逐元素相加处理,利用1×1卷积进行信息融合,得到具有全局上下文信息的特征信息。
步骤5:该步骤是步骤4中的空间注意力模块DSSAM模块,将输入特征图A∈RC×H×W,送入卷积核大小为3x3的depthwise卷积,得到维度为C×H×W的特征图,但是这些特征图之间缺乏通道间信息交互。故在这之后,采用1x1的pointwise卷积得到通道信息交互后的特征图A′∈RC×H×W。接着将特征图A′送入3x3的depthwise卷积和1x1的pointwise卷积得到特征图X,Y,Z。然后的特征图X∈RC×H×W转换为X∈RC×N(其中N=H×W),转换目的是为了方便后续矩阵乘以及矩阵转置等操作。
步骤6:该步骤是步骤4中的通道注意力DSCAM模块,首先,将输入特征图送入卷积核大小为3x3的depthwise卷积,后续送入1x1的pointwise卷积得到通道信息交互后的特征图。与空间注意力模块不同,这里不需要在此使用深度可分离卷积得到三个特征图,直接将得到的特征图A′∈RC×H×W转换为A′∈RC×N(其中N=H×W),然后和转置后的特征图进行矩阵乘法。
步骤7:该步骤是基于MMD的加权原型网络模块,MMD算法通过计算基于样本分布(包括和不包括样本)的平均嵌入之间的最大平均差异得到样本权重,将错误或偏差较大样本所占权重降低,将符合要求或者偏差较小的样本权重增加,很好的避免了因某些样本偏差较大对分类结果造成的影响。
与现有技术相比,本发明的有益效果是:
(1)自适应分组卷积降低了计算量的同时优化了卷积的表达能力,从而获得更丰富的输入向量的位置信息,并在多个尺度上并行处理。
(2)基于深度可分离卷积的注意力模块模型自适应地融合了局部特征和全局相关性,提高了网络表达能力,减少了模型参数。
(3)基于MMD的加权原型网络模块将错误或偏差较大样本所占权重降低,将符合要求或者偏差较小的样本权重增加,很好的避免了因某些样本偏差较大对分类结果造成的影响。
附图说明
图1为:本发明基于多尺度注意力特征融合的小样本图像分类网络架构图。
图2为:多尺度特征提取模块。
图3为:基于深度可分离卷积的注意力模块。
Claims (4)
1.一种基于多尺度注意力特征融合的小样本分类算法,其特征在于,包括以下步骤:
步骤1:设计多尺度特征提取模块,采用自适应分组卷积的方式提取输入特征图的多尺度空间信息;
步骤2:在步骤1的特征提取模块基础上,设计了基于深度可分卷积的空间注意力模块DSSAM和通道注意力DSCAM模块,通过3×3depthwise卷积、1×1pointwise卷积、reshaping、transpose和softmax函数等一系列操作生成空间和通道的注意力权重矩阵;
步骤2.1:该步骤是步骤2中的空间注意力模块DSSAM模块,将输入特征图A∈RC×H×W,送入卷积核大小为3x3的depthwise卷积,得到维度为C×H×W的特征图,采用1x1的pointwise卷积得到通道信息交互后的特征图A′∈RC×H×W。接着将特征图A′送入3x3的depthwise卷积和1x1的pointwise卷积得到特征图X,Y,Z。然后的特征图X∈RC×H×W转换为X∈RC×N(其中N=H×W);
步骤2.2:该步骤是步骤2中的通道注意力DSCAM模块,首先,将输入特征图送入卷积核大小为3x3的depthwise卷积,后续送入1x1的pointwise卷积得到通道信息交互后的特征图A′∈RC×H×W,并将该特征图转换为A′∈RC×N(其中N=H×W),然后和转置后的特征图A′进行矩阵乘法;
步骤3:该步骤是基于MMD的加权原型网络模块,MMD算法通过计算基于样本分布(包括和不包括样本)的平均嵌入之间的最大平均差异得到样本权重,很好的避免了因某些样本偏差较大对分类结果造成的影响。
3.如权利要求1所述方法,其特征在于,本发明设计的基于深度可分卷积的空间注意力模块DSSAM和通道注意力DSCAM模块,该模型自适应地融合了局部特征和全局相关性。
4.如权利要求1所述方法,其特征在于,步骤2.1中的空间注意力模块DSSAM模块最终输出的特征图是在原始特征的基础上加权融合了所有空间位置特征。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210497821.5A CN114863174A (zh) | 2022-05-09 | 2022-05-09 | 一种基于多尺度注意力特征融合的小样本分类算法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210497821.5A CN114863174A (zh) | 2022-05-09 | 2022-05-09 | 一种基于多尺度注意力特征融合的小样本分类算法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114863174A true CN114863174A (zh) | 2022-08-05 |
Family
ID=82637184
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210497821.5A Pending CN114863174A (zh) | 2022-05-09 | 2022-05-09 | 一种基于多尺度注意力特征融合的小样本分类算法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114863174A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116486183A (zh) * | 2023-06-21 | 2023-07-25 | 耕宇牧星(北京)空间科技有限公司 | 基于多种注意力权重融合特征的sar图像建筑区分类方法 |
-
2022
- 2022-05-09 CN CN202210497821.5A patent/CN114863174A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116486183A (zh) * | 2023-06-21 | 2023-07-25 | 耕宇牧星(北京)空间科技有限公司 | 基于多种注意力权重融合特征的sar图像建筑区分类方法 |
CN116486183B (zh) * | 2023-06-21 | 2023-09-26 | 耕宇牧星(北京)空间科技有限公司 | 基于多种注意力权重融合特征的sar图像建筑区分类方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108830296B (zh) | 一种改进的基于深度学习的高分遥感影像分类方法 | |
CN111985369B (zh) | 基于跨模态注意力卷积神经网络的课程领域多模态文档分类方法 | |
CN109685819B (zh) | 一种基于特征增强的三维医学图像分割方法 | |
CN111695467B (zh) | 基于超像素样本扩充的空谱全卷积高光谱图像分类方法 | |
CN112308158A (zh) | 一种基于部分特征对齐的多源领域自适应模型及方法 | |
He et al. | A dual global–local attention network for hyperspectral band selection | |
CN110490236B (zh) | 基于神经网络的自动图像标注方法、系统、装置和介质 | |
CN106503652A (zh) | 基于低秩自适应稀疏重建的异常事件检测方法 | |
CN113688894B (zh) | 一种融合多粒度特征的细粒度图像分类方法 | |
CN113837191B (zh) | 基于双向无监督域适应融合的跨星遥感图像语义分割方法 | |
CN111898703A (zh) | 多标签视频分类方法、模型训练方法、装置及介质 | |
CN113011243A (zh) | 基于胶囊网络的面部表情分析方法 | |
CN114004333A (zh) | 一种基于多假类生成对抗网络的过采样方法 | |
CN111160130A (zh) | 一种多平台虚拟身份账号的多维碰撞识别方法 | |
CN112884150A (zh) | 一种预训练模型知识蒸馏的安全性增强方法 | |
CN115457332A (zh) | 基于图卷积神经网络和类激活映射的图像多标签分类方法 | |
CN114722892A (zh) | 基于机器学习的持续学习方法及装置 | |
CN114863174A (zh) | 一种基于多尺度注意力特征融合的小样本分类算法 | |
CN112528077B (zh) | 基于视频嵌入的视频人脸检索方法及系统 | |
CN110704665A (zh) | 一种基于视觉注意力机制的图像特征表达方法及系统 | |
Qiao et al. | LiteSCANet: An efficient lightweight network based on spectral and channel-wise attention for hyperspectral image classification | |
Ghizlane et al. | Spam image detection based on convolutional block attention module | |
Lihong et al. | Face recognition method based on adaptively weighted block-two dimensional principal component analysis | |
CN112818982B (zh) | 基于深度特征自相关性激活的农业害虫图像检测方法 | |
CN115080699A (zh) | 基于模态特异自适应缩放与注意力网络的跨模态检索方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |