CN115035408A - 基于迁移学习和注意力机制的无人机影像树种分类方法 - Google Patents

基于迁移学习和注意力机制的无人机影像树种分类方法 Download PDF

Info

Publication number
CN115035408A
CN115035408A CN202210674466.4A CN202210674466A CN115035408A CN 115035408 A CN115035408 A CN 115035408A CN 202210674466 A CN202210674466 A CN 202210674466A CN 115035408 A CN115035408 A CN 115035408A
Authority
CN
China
Prior art keywords
aerial vehicle
unmanned aerial
model
image
sample data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210674466.4A
Other languages
English (en)
Inventor
王妮
孟祥端
谌家辉
蒲涛
张亚丽
刘玉婵
王玉亮
赵明伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chuzhou University
Original Assignee
Chuzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chuzhou University filed Critical Chuzhou University
Priority to CN202210674466.4A priority Critical patent/CN115035408A/zh
Publication of CN115035408A publication Critical patent/CN115035408A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • G06V20/17Terrestrial scenes taken from planes or by drones
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/762Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • G06V20/188Vegetation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Remote Sensing (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供了基于迁移学习和注意力机制的无人机影像树种分类方法,包括:基于超像素分割算法对无人机高分遥感影像进行聚类分割,构建样本数据集;构建ResNeXt50模型,在所述ResNeXt50模型中引入空间注意力模块和通道注意力模块,构建CBAM‑ResNeXt50模型;基于所述CBAM‑ResNeXt50模型对所述样本数据集进行分类与验证,构建树种分类模型,通过所述树种分类模型获取无人机高分影像树种分类结果。本发明相较于现有无人机高分影像树种分类方法,使用更少的参数量,消耗的人力,物力及时间相对更少,并能够获得更准确的树种分类结果。

Description

基于迁移学习和注意力机制的无人机影像树种分类方法
技术领域
本发明属于树种分类领域,尤其涉及基于迁移学习和注意力机制的无人机影像树种分类方法。
背景技术
早期树种分类主要采用人工实地调查,不仅时间长,成本高,而且效率低下,同时由于我国的遥感技术起步晚,早期的森林树种分类方面的研究发展比较缓慢。无人机高分影像因其具有获取方便、空间分辨率高拥有更多的特征信息等特点,现已逐步成为遥感精细识别中应用较多的一种数据源。目前的研究从各个方面对树种分类进行研究,主要的方法有最大似然法,支持向量机,随机森林法,以及迁移学习等。众多分类方法的选择是关键步骤,部分学者将其应用到森林资源分类研究当中,但是对于无人机高分影像拥有过多的无用信息,相对于最大似然法,支持向量机,随机森林方法而言,深度学习能够有效的提取特征信息,但是对于无人机高分影像而言,分类效果欠佳。
随着深度学习图像分类技术的快速发展,深度学习中的许多分类模型如ResNet,DenseNet、Inception_v3、AlexNet被广泛应用于树种分类,并获得了较好的分类效果。
但本申请发明人在实现本申请实施例中发明技术方案的过程中,发现上述技术至少存在如下技术问题:
1.传统树种分类方法不能充分利用无人机高分影像树种影像的高质量纹理特征、空间特征导致树种分类精度低;
2.无人机高分树种影像具有种间间距小、种内差距小等现象引起树种分类精度低的问题;
3.无人机高分影像树种分类数据集制作繁琐。
发明内容
为解决上述技术问题,本发明提出了基于迁移学习和注意力机制的无人机影像树种分类方法,构建ResNeXt提取器,在特征提取器中引入CBAM注意力机制模块,引入注意力机制后使得特征提取的能力更强,特征能更好的表达图像信息,能够有效的提升树种分类的精度。
为实现上述目的,本发明提供了基于迁移学习和注意力机制的无人机影像树种分类方法,包括:
基于超像素分割算法对无人机高分遥感影像进行聚类分割,构建样本数据集;
构建CBAM-ResNeXt50模型,所述CBAM-ResNeXt50模型包括:ResNeXt50模型、空间注意力模块和通道注意力模块;
基于所述CBAM-ResNeXt50模型对所述样本数据集进行分类与验证,构建树种分类模型,通过所述树种分类模型获取无人机高分影像树种分类结果。
可选地,构建所述样本数据集包括:
通过所述超像素分割算法对所述无人机高分遥感影像进行聚类分割,获取所述无人机高分遥感影像的分类预测结果;
对所述无人机高分遥感影像进行考察获取实际分类结果;
通过所述实际分类结果对所述分类预测结果进行验证,构建所述样本数据集。
可选地,获取所述无人机高分遥感影像的分类预测结果包括:
通过所述超像素分割算法对所述无人机高分遥感影像中的像素点进行聚类;
通过shp文件对聚类后的所述无人机高分遥感影像进行裁剪,获得所述分类预测结果。
可选地,通过所述超像素分割算法对所述无人机高分遥感影像中的像素点进行聚类包括:
在所述无人机高分遥感影像中生成K个种子点;
将所述种子点周围距离最近的若干像素点,与所述种子点归为一类,直到无人机高分遥感影像中的全部像素点归类完毕,获得K个超像素;
计算所述K个超像素里所有像素点的平均向量值,获得K个聚类中心;
基于所述K个聚类中心对周围像素点进行归类,重新获得K个超像素,更新聚类中心,再次迭代,反复直到收敛,获得聚类后的所述无人机高分遥感影像。
可选地,构建所述样本数据集还包括:
对验证后的所述样本数据集进行数据增强处理;
将数据增强处理后的所述样本数据集划分为训练集和验证集。
可选地,所述数据增强处理包括图像旋转处理和图像镜像处理。
可选地,基于所述CBAM-ResNeXt50模型对所述样本数据集进行分类包括:
将所述样本数据集中的样本数据输入所述ResNeXt50模型,获取所述样本数据的特征图;
所述特征图进入所述通道注意力模块进行全局平均池化,获取高层次特征,将所述高层次特征进行通道数压缩,将压缩后的所述高层次特征进行Sigmoid激活,获得通道注意力特征图;
将所述通道注意力特征图输入所述空间注意力模块,进行最大池化和平均池化处理,获得拼接特征图,将所述拼接特征图进行卷积处理,将卷积后的所述拼接特征图进行Sigmoid激活,获得空间注意力特征图;
将所述通道注意力特征图与所述空间注意力特征图进行相乘,获得最优特征图,基于所述CBAM-ResNeXt50模型中的全连接层,对所述最优特征图进行分类,完成所述样本数据集中样本数据的分类。
可选地,所述通道注意力模块包括通道注意力机制公式;
所述通道注意力机制公式为:
Mc(F)=σ(MLP(AvgPool(F))+MLP(MaxPool(F)))
其中,σ为Sigmoid激活函数,MLP为多层感知器,AvgPool(F)为平均池化,MaxPool(F)为最大池化。
可选地,所述空间注意力模块包括空间注意力机制公式;
所述空间注意力机制公式为:
Ms(F)=σ(f7×7([AvgPool(F));MaxPool(F)]))
其中,σ为Sigmoid激活函数,f7×7表示卷积核为7×7的卷积运算。
可选地,构建所述树种分类模型还包括:
基于迁移学习方法对所述CBAM-ResNeXt50模型进行训练,基于交叉熵损失函数衡量所述CBAM-ResNeXt50模型的泛化能力,基于Adam优化,反向传播更新所述CBAM-ResNeXt50模型。
与现有技术相比,本发明具有如下优点和技术效果:
本发明采用的是基于超像素分割算法对遥感影像聚类分割,利用分割文件对影像进行裁剪,得到的每个区域中的大部分像素都是属于一个类别的,选取合适的图像作为训练集,大大减少了数据集制作的成本和效率;通过构建ResNeXt模型,在ResNeXt模型中引入CBAM注意力机制模块,引入注意力机制后使得特征提取的能力更强,特征能更好的表达图像信息,能够有效的提升树种分类的精度,并且使用更少的参数量,消耗的人力,物力及时间相对更少,
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本发明实施例的基于迁移学习和注意力机制的无人机影像树种分类方法流程示意图;
图2为本发明实施例的ResNet50和ResNeXt50差异示意图;
图3为本发明实施例的CBAM注意力机制模块示意图;
图4为本发明实施例的CBAM通道注意力机制模块示意图;
图5为本发明实施例的CBAM空间注意力机制模块示意图;
图6为本发明实施例的不同分类模型混淆矩阵对示意图;
图7为本发明实施例的树种预测分布示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
实施例
如图1,本实施例提供了基于迁移学习和注意力机制的无人机影像树种分类方法,包括:
基于超像素分割算法对无人机高分遥感影像进行聚类分割,构建样本数据集;
在ResNeXt50中,引入空间注意力模块和通道注意力模块,构建CBAM-ResNeXt50模型;
基于CBAM-ResNeXt50模型对样本数据集进行分类与验证,构建树种分类模型,通过树种分类模型获取无人机高分影像树种分类结果。
进一步地,构建样本数据集包括:
通过超像素分割算法对无人机高分遥感影像进行聚类分割,获取无人机高分遥感影像的分类预测结果;
对无人机高分遥感影像进行考察获取实际分类结果;
通过实际分类结果对分类预测结果进行验证,构建样本数据集。
进一步地,获取无人机高分遥感影像的分类预测结果包括:
通过超像素分割算法对无人机高分遥感影像中的像素点进行聚类;
通过shp文件对聚类后的无人机高分遥感影像进行裁剪,获得分类预测结果。
进一步地,通过超像素分割算法对无人机高分遥感影像中的像素点进行聚类包括:
在无人机高分遥感影像中生成K个种子点;
将种子点周围距离最近的若干像素点,与种子点归为一类,直到无人机高分遥感影像中的全部像素点归类完毕,获得K个超像素;
计算K个超像素里所有像素点的平均向量值,获得K个聚类中心;
基于K个聚类中心对周围像素点进行归类,重新获得K个超像素,更新聚类中心,再次迭代,反复直到收敛,获得聚类后的无人机高分遥感影像。
进一步地,构建样本数据集还包括:
对验证后的样本数据集进行数据增强处理;
将数据增强处理后的样本数据集划分为训练集和验证集。
进一步地,数据增强处理包括图像旋转处理和图像镜像处理。
进一步地,基于CBAM-ResNeXt50模型对样本数据集进行分类包括:
将样本数据集中的样本数据输入ResNeXt50模型,获取样本数据的特征图;
特征图进入通道注意力模块进行全局平均池化,获取高层次特征,将高层次特征进行通道数压缩,将压缩后的高层次特征进行Sigmoid激活,获得通道注意力特征图;
将通道注意力特征图输入空间注意力模块,进行最大池化和平均池化处理,获得拼接特征图,将拼接特征图进行卷积处理,将卷积后的拼接特征图进行Sigmoid激活,获得空间注意力特征图;
将通道注意力特征图与空间注意力特征图进行相乘,获得最优特征图,基于CBAM-ResNeXt50模型中的全连接层,对最优特征图进行分类,完成样本数据集中样本数据的分类。
本实施例提出基于迁移学习和注意力机制的无人机影像树种分类方法,通过对基础模型进行训练得到预训练模型,在对目标数据集进行训练时,在特征提取器中加入注意力机制模型CBAM,如图3所示,引入注意力机制后使得特征提取的能力更强,特征能更好的表达图像信息,更够有效的提升树种分类的精度,最后输入到分类器进行分类。
本实施例利用图像聚类分割算法分割整个遥感影像,采用的是基于超像素(SLIC)分割算法对遥感影像聚类分割,利用分割文件对影像进行裁剪,得到的每个区域中的大部分像素都是属于一个类别的,选取合适的图像作为训练集,大大减少了数据集制作的成本和效率。
本实施例是在ImageNet集上预训练好的ResNeXt50。其中,如图2所示,图2中为ResNet50(左)和构建的ResNeXt50(右)的差异;在网络后引入CBAM注意力机制,CBAM是一种结合了空间和通道的注意力模块,增强图像特征图中的重要特征,抑制非必要特征,实现特征优化的操作,在图像分类等实际应用当中可以取得更好的效果。ResNet50和构建的ResNeXt50的网络结构差异如下表1所示:
表1
Figure BDA0003695856220000091
在本实施例中,利用图像聚类分割算法之制作数据集并制图的方式具体为:
利用超像素分割的外包矩形对影像进行裁剪,得到的每个区域中的大部分像素都是属于一个类别的。使用超像素分割算法的原因在于超像素分割能够同时考虑像素的空间和光谱属性,生成的超像素如同细胞一般紧凑整齐,邻域特征比较容易表达,相比于其他超像素分割算法,SLIC在运行速度,生成的超像素的紧凑度,轮廓保持方面都比较理想。其具体的流程是算法首先生成K个种子点,然后在每个种子点的周围空间里搜索距离该种子点最近的若干像素,将他们归为与该种子点一类,直到所有像素点都归类完毕。然后计算这K个超像素里所有像素点的平均向量值,重新得到K个聚类中心,然后再以这K个中心去搜索其周围与其最为相似的若干像素,所有像素都归类完后重新得到K个超像素,更新聚类中心,再次迭代,如此反复直到收敛。有关制图主要是利用超像素(SLIC)结果得到shp文件,使用shp文件中能确定每个结果唯一的属性进行裁剪,使用本发明进行预测,得到预测结果,进行拼接制图。
在本实施例中,构建CBAM-ResNeXt50模型的具体过程为:
首先进行卷积核为7,步距为2的卷积操作,之后进行卷积为3,步距为2的最大最大池化操作,其次ResNeXt50经过4个Block,每个Boock中分别有3,4,6,3个Bottleneck,与普通残差神经网络ResNet相比,ResNeXt在其基础上增加了基数(cardinality)的概念,即增加ResNet网络的宽度,将残差模块并联为一个整体,即ResNeXt网络的残差部分由分组卷积构成,同时使每一个分支的结构相同,这样可以保证在更少的网络层数下获得更高的准确率。ResNeXt网络的残差部分,输入特征基于一个卷积核大小为1×1的卷积操作,被分割成32个低维嵌入,之后对32个低维嵌入进行变换,然后将32个低维嵌入聚合。在此的外侧有一个通道可以直接从输入连接输出,将残差部分经过卷积操作得到的输出与直接输入相加,两者相加之后经过ReLu激活函数得到整个块的输出。在网络最后引入CBAM注意力机制,其中特征图首先通过通道注意机制模块对输入特征图进行处理,到加权结果之后,会再经过一个空间注意力模块,最终进行加权得到结果。通道注意力机制模块如图4所示,在通道注意力模块当中分别进行全局平均池化,使全局最大池化提取更为丰富的高层次特征,接着分别通过多层感知器(Multilayer Perceptron,MLP),将通道数压缩为C/r,再扩张回C,其中C为通道数,r为衰减比率,然后将MLP输出的特征经过Sigmoid激活操作,得到最终的通道注意力模块输出,将该输出对应元素相乘。空间注意力机制模块如图5所示,首先将通道注意力机制模块输出的特征图作为本模块的输入特征图,再做一个基于通道的最大池化和平均池化,将得到的两个不同得特征拼接在一起,然后基于一个卷积操作,降维为一个通道,再经过sigmoid生成空间注意力特征。最后将该特征与空间注意力机制模块的输入特征相乘得到最优特征。最后接入6个节点的全连接层对树种数据集进行分类。本实施例的深度学习平台采用Pytorch框架,模型训练中使用交叉熵损失函数来衡量模型泛化能力好坏,使用Adam优化,反向传播更新模型。权重随机梯度下降的学习率使用固定大小值,初始学习率大小设置为0.001。同时使用迁移学习的方法训练模型,加快模型的收敛。
通道注意力模块包括通道注意力机制公式;空间注意力模块包括空间注意力机制公式;
公式(1)为通道注意力机制计算公式,公式(2)为空间注意力机制计算公式。
Mc(F)=σ(MLP(AvgPool(F))+MLP(MaxPool(F))) (1)
其中,σ为Sigmoid激活函数,MLP为多层感知器,AvgPool(F)为平均池化,MaxPool(F)为最大池化。
Ms(F)=σ(f7×7([AvgPool(F));MaxPool(F)])) (2)
其中,σ为Sigmoid激活函数,f7×7表示卷积核为7×7的卷积运算。
更进一步地,在本实施例中,还构建其他深度学习模型与本方法进行对比,如:AlexNet,Inception_v3,ResNeXt50,本方法提出的无人机高分影像树种分类方法在验证集上训练到收敛时的OA、Kappa系数均为最高,其中OA、Kappa分别达到了0.996、0.956。不同模型在验证集上的混淆矩阵如图6所示,不同模型在验证集上的总分类精度(OA),Kappa系数系数如表2所示,制图结果如图7所示。
表2
Figure BDA0003695856220000121
以上,仅为本申请较佳的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应该以权利要求的保护范围为准。

Claims (10)

1.基于迁移学习和注意力机制的无人机影像树种分类方法,其特征在于,包括:
基于超像素分割算法对无人机高分遥感影像进行聚类分割,构建样本数据集;
构建CBAM-ResNeXt50模型,所述CBAM-ResNeXt50模型包括:ResNeXt50模型、空间注意力模块和通道注意力模块;
基于所述CBAM-ResNeXt50模型对所述样本数据集进行分类与验证,构建树种分类模型,通过所述树种分类模型获取无人机高分影像树种分类结果。
2.根据权利要求1所述的基于迁移学习和注意力机制的无人机影像树种分类方法,其特征在于,构建所述样本数据集包括:
通过所述超像素分割算法对所述无人机高分遥感影像进行聚类分割,获取所述无人机高分遥感影像的分类预测结果;
对所述无人机高分遥感影像进行考察获取实际分类结果;
通过所述实际分类结果对所述分类预测结果进行验证,构建所述样本数据集。
3.根据权利要求2所述的基于迁移学习和注意力机制的无人机影像树种分类方法,其特征在于,获取所述无人机高分遥感影像的分类预测结果包括:
通过所述超像素分割算法对所述无人机高分遥感影像中的像素点进行聚类;
通过shp文件对聚类后的所述无人机高分遥感影像进行裁剪,获得所述分类预测结果。
4.根据权利要求3所述的基于迁移学习和注意力机制的无人机影像树种分类方法,其特征在于,通过所述超像素分割算法对所述无人机高分遥感影像中的像素点进行聚类包括:
在所述无人机高分遥感影像中生成K个种子点;
将所述种子点周围距离最近的若干像素点,与所述种子点归为一类,直到无人机高分遥感影像中的全部像素点归类完毕,获得K个超像素;
计算所述K个超像素里所有像素点的平均向量值,获得K个聚类中心;
基于所述K个聚类中心对周围像素点进行归类,重新获得K个超像素,更新聚类中心,再次迭代,反复直到收敛,获得聚类后的所述无人机高分遥感影像。
5.根据权利要求2所述的基于迁移学习和注意力机制的无人机影像树种分类方法,其特征在于,构建所述样本数据集还包括:
对验证后的所述样本数据集进行数据增强处理;
将数据增强处理后的所述样本数据集划分为训练集和验证集。
6.根据权利要求5所述的基于迁移学习和注意力机制的无人机影像树种分类方法,其特征在于,所述数据增强处理包括图像旋转处理和图像镜像处理。
7.根据权利要求1所述的基于迁移学习和注意力机制的无人机影像树种分类方法,其特征在于,基于所述CBAM-ResNeXt50模型对所述样本数据集进行分类包括:
将所述样本数据集中的样本数据输入所述ResNeXt50模型,获取所述样本数据的特征图;
所述特征图进入所述通道注意力模块进行全局平均池化,获取高层次特征,将所述高层次特征进行通道数压缩,将压缩后的所述高层次特征进行Sigmoid激活,获得通道注意力特征图;
将所述通道注意力特征图输入所述空间注意力模块,进行最大池化和平均池化处理,获得拼接特征图,将所述拼接特征图进行卷积处理,将卷积后的所述拼接特征图进行Sigmoid激活,获得空间注意力特征图;
将所述通道注意力特征图与所述空间注意力特征图进行相乘,获得最优特征图,基于所述CBAM-ResNeXt50模型中的全连接层,对所述最优特征图进行分类,完成所述样本数据集中样本数据的分类。
8.根据权利要求7所述的基于迁移学习和注意力机制的无人机影像树种分类方法,其特征在于,所述通道注意力模块包括通道注意力机制公式;
所述通道注意力机制公式为:
Mc(F)=σ(MLP(AvgPool(F))+MLP(MaxPool(F)))
其中,σ为Sigmoid激活函数,MLP为多层感知器,AvgPool(F)为平均池化,MaxPool(F)为最大池化。
9.根据权利要求7所述的基于迁移学习和注意力机制的无人机影像树种分类方法,其特征在于,所述空间注意力模块包括空间注意力机制公式;
所述空间注意力机制公式为:
Ms(F)=σ(f7×7([AvgPool(F));MaxPool(F)]))
其中,σ为Sigmoid激活函数,f7×7表示卷积核为7×7的卷积运算。
10.根据权利要求1所述的基于迁移学习和注意力机制的无人机影像树种分类方法,其特征在于,构建所述树种分类模型还包括:
基于迁移学习方法对所述CBAM-ResNeXt50模型进行训练,基于交叉熵损失函数衡量所述CBAM-ResNeXt50模型的泛化能力,基于Adam优化,反向传播更新所述CBAM-ResNeXt50模型。
CN202210674466.4A 2022-06-15 2022-06-15 基于迁移学习和注意力机制的无人机影像树种分类方法 Pending CN115035408A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210674466.4A CN115035408A (zh) 2022-06-15 2022-06-15 基于迁移学习和注意力机制的无人机影像树种分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210674466.4A CN115035408A (zh) 2022-06-15 2022-06-15 基于迁移学习和注意力机制的无人机影像树种分类方法

Publications (1)

Publication Number Publication Date
CN115035408A true CN115035408A (zh) 2022-09-09

Family

ID=83124885

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210674466.4A Pending CN115035408A (zh) 2022-06-15 2022-06-15 基于迁移学习和注意力机制的无人机影像树种分类方法

Country Status (1)

Country Link
CN (1) CN115035408A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024055952A1 (zh) * 2022-09-16 2024-03-21 华为技术有限公司 一种数据处理方法及其装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024055952A1 (zh) * 2022-09-16 2024-03-21 华为技术有限公司 一种数据处理方法及其装置

Similar Documents

Publication Publication Date Title
CN114120019B (zh) 一种轻量化的目标检测方法
CN108985317B (zh) 一种基于可分离卷积和注意力机制的图像分类方法
CN111882040B (zh) 基于通道数量搜索的卷积神经网络压缩方法
CN113780211A (zh) 一种基于改进型Yolov4-tiny的轻量级飞机检测方法
CN111079795A (zh) 基于cnn的分片多尺度特征融合的图像分类方法
CN106295613A (zh) 一种无人机目标定位方法及系统
CN112489164B (zh) 基于改进深度可分离卷积神经网络的图像着色方法
CN108446616B (zh) 基于全卷积神经网络集成学习的道路提取方法
CN114913379B (zh) 基于多任务动态对比学习的遥感图像小样本场景分类方法
CN113034506B (zh) 遥感图像语义分割方法、装置、计算机设备和存储介质
CN110599502B (zh) 一种基于深度学习的皮肤病变分割方法
CN115249332A (zh) 基于空谱双分支卷积网络的高光谱图像分类方法及设备
CN112818777B (zh) 一种基于密集连接与特征增强的遥感图像目标检测方法
CN115311502A (zh) 基于多尺度双流架构的遥感图像小样本场景分类方法
CN110930378A (zh) 基于低数据需求的肺气肿影像处理方法及系统
CN114373104A (zh) 一种基于动态聚合的三维点云语义分割方法及系统
CN112215199A (zh) 基于多感受野与密集特征聚合网络的sar图像舰船检测方法
CN115937693A (zh) 一种基于遥感图像的道路识别方法及系统
CN114998373A (zh) 基于多尺度损失函数的改进型U-Net云图分割方法
CN115035408A (zh) 基于迁移学习和注意力机制的无人机影像树种分类方法
CN112967296B (zh) 一种点云动态区域图卷积方法、分类方法及分割方法
CN118096922A (zh) 一种基于风格迁移和遥感影像生成地图的方法
CN114299305A (zh) 聚合密集和注意力多尺度特征的显著性目标检测算法
CN116977747B (zh) 基于多路多尺度特征孪生网络的小样本高光谱分类方法
CN115937565A (zh) 基于自适应l-bfgs算法的高光谱图像分类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination