CN114049519A - 一种光学遥感图像场景分类方法 - Google Patents
一种光学遥感图像场景分类方法 Download PDFInfo
- Publication number
- CN114049519A CN114049519A CN202111363053.6A CN202111363053A CN114049519A CN 114049519 A CN114049519 A CN 114049519A CN 202111363053 A CN202111363053 A CN 202111363053A CN 114049519 A CN114049519 A CN 114049519A
- Authority
- CN
- China
- Prior art keywords
- remote sensing
- spatial pyramid
- pyramid pooling
- triple
- optical remote
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 25
- 230000003287 optical effect Effects 0.000 title claims abstract description 18
- 238000011176 pooling Methods 0.000 claims abstract description 33
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 17
- 230000007246 mechanism Effects 0.000 claims abstract description 16
- 238000012549 training Methods 0.000 claims abstract description 13
- 230000009466 transformation Effects 0.000 claims abstract description 4
- 230000008569 process Effects 0.000 claims description 4
- 230000004931 aggregating effect Effects 0.000 claims description 2
- 238000012545 processing Methods 0.000 claims description 2
- 230000006870 function Effects 0.000 description 4
- 239000013598 vector Substances 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种光学遥感图像场景分类方法,包括:在卷积神经网络的每个模块后插入三重注意力模块,得到稠密卷积神经网络,并去掉稠密卷积神经网络的最后一个全连接层得到特征提取器;构建空间金字塔池化层,将特征提取器的输出作为空间金字塔池化层的输入,得到输出特征;将输出特征经过线性变换输入到Softmax分类器得到分类特征,得到基于三重注意力机制和空间金字塔池化的深度网络;将训练样本输入基于三重注意力机制和空间金字塔池化的深度网络,得到能够识别训练样本类别的分类器;将待分类遥感图像输入分类器得到分类结果。提高了光学遥感图像场景分类的准确率。
Description
技术领域
本发明属于图像分类方法技术领域,涉及一种光学遥感图像场景分类方法。
背景技术
随着卫星与无人机等遥感观测技术的飞速发展,高分辨率遥感图像的数据不断增多,相较于自然场景图像,高分辨遥感图像成像范围更广、尺度变化大和语义内容更复杂。现有的图像分类方法对于遥感图像的分类准确率较低。
发明内容
本发明的目的是提供一种光学遥感图像场景分类方法,解决了现有技术中存在的遥感图像的分类准确率较低的问题。
本发明所采用的技术方案是,一种光学遥感图像场景分类方法,包括以下步骤:
步骤1、将分类后原始遥感图像作为训练样本;
步骤2、构建三重注意力模块;
步骤3、在卷积神经网络的每个模块后插入三重注意力模块,得到稠密卷积神经网络,并去掉稠密卷积神经网络的最后一个全连接层得到特征提取器;
步骤4、构建空间金字塔池化层,将特征提取器的输出作为空间金字塔池化层的输入,得到输出特征;
步骤5、将输出特征经过线性变换输入到Softmax分类器得到分类特征,得到基于三重注意力机制和空间金字塔池化的深度网络;
步骤6、将训练样本输入基于三重注意力机制和空间金字塔池化的深度网络,并通过反向传播算法不断优化带权重的交叉熵损失函数,调整基于三重注意力机制和空间金字塔池化的深度网络的参数,得到能够识别训练样本类别的分类器;
步骤7、将待分类遥感图像输入分类器得到分类结果。
本发明的特点还在于:
步骤2的构建三重注意力模块的方法为:将注意力机制的输入分为三个分支,分别计算通道维度和空间维度的注意权重,对三个分支的注意权重进行聚合,得到三重注意力模块;
计算通道维度和空间维度时采用旋转操作来建立通道维度和任意一个空间维度之间的连接。
步骤4的具体过程为:特征提取器的输出在空间金字塔池化层的处理过程为:先用三个不同刻度对特征提取器的输出进行划分,对每一刻度所划分的特征图区域进行最大池化操作,将三个刻度池化后的结果进行拼接得到输出特征。
步骤6中带权重的交叉熵损失函数如下:
上式中,w(i)表示样本第i类的损失权重,p(xi)表示样本xi的真实类别,q(xi)表示样本xi的预测类别,n为样本总数,ci表示第i类的样本数目。
本发明的有益效果是:本发明的一种光学遥感图像场景分类方法,在传统卷积神经网络中插入基于三重注意力机制的注意力模块,并使用空间金字塔池化层,对数据的潜在结构特征进行更加有效的学习,从而丰富了传统卷积神经网络所提取的特征;通过三重注意力模块和空间金字塔结构实现对重点区域和显著特征的关注,对背景区域和非显著特征进行忽略,提高模型对特征的表示能力,从而提高了光学遥感图像场景分类的准确率。
附图说明
图1是本发明一种光学遥感图像场景分类方法的流程图;
图2是本发明一种光学遥感图像场景分类方法的训练样本。
具体实施方式
下面结合附图和具体实施方式对本发明进行详细说明。
一种光学遥感图像场景分类方法,如图1所示,包括以下步骤:
步骤1、将已标注好的遥感图像分类得到30类样本,如图2所示,作为训练样本;
步骤2、构建三重注意力模块;
具体的,将注意力机制的输入分为三个分支,分别计算通道维度和空间维度(包括长和宽)的注意权重,其中在计算通道维度和空间维度时采用旋转操作来建立通道维度和任意一个空间维度之间的连接,通过取平均的方法对三个分支的注意权重进行聚合,得到三重注意力模块;
步骤3、以传统卷积神经网络作为主干网络,在卷积神经网络的每个模块后插入三重注意力模块,得到稠密卷积神经网络,并去掉稠密卷积神经网络的最后一个全连接层得到特征提取器;训练时,将每个训练样本输入该特征提取器;
步骤4、构建空间金字塔池化层,将特征提取器的输出输入空间金字塔池化层,得到输出特征;
具体的,构建空间金字塔池化层,将特征提取器的输出输入空间金字塔池化层,在空间金字塔池化层中,先用三个不同刻度(16,4,1)分别对空间金字塔池化层的输入进行划分,对每一刻度所划分的特征图区域进行最大池化操作,将三个刻度池化后的结果进行拼接得到输出特征(21维向量);
步骤5、将输出特征经过线性变换输入到Softmax分类器得到分类特征(30维向量),得到基于三重注意力机制和空间金字塔池化的深度网络;
步骤6、将30类样本输入基于三重注意力机制和空间金字塔池化的深度网络,并通过反向传播算法不断优化带权重的交叉熵损失函数,调整基于三重注意力机制和空间金字塔池化的深度网络的参数,得到能够识别训练样本类别的分类器;带权重的交叉熵损失函数如下:
上式中,w(i)表示样本第i类的损失权重,p(xi)表示样本xi的真实类别,q(xi)表示样本xi的预测类别,n为样本总数,ci表示第i类的样本数目。
步骤7、将待分类遥感图像输入分类器得到分类结果。
通过以上方式,本发明的一种光学遥感图像场景分类方法,在传统卷积神经网络中插入基于三重注意力机制的注意力模块,并使用空间金字塔池化层,对数据的潜在结构特征进行更加有效的学习,从而丰富了传统卷积神经网络所提取的特征,提高了结果正确率。
Claims (5)
1.一种光学遥感图像场景分类方法,其特征在于,包括以下步骤:
步骤1、将分类后原始遥感图像作为训练样本;
步骤2、构建三重注意力模块;
步骤3、在卷积神经网络的每个模块后插入三重注意力模块,得到稠密卷积神经网络,并去掉所述稠密卷积神经网络的最后一个全连接层得到特征提取器;
步骤4、构建空间金字塔池化层,将所述特征提取器的输出作为空间金字塔池化层的输入,得到输出特征;
步骤5、将所述输出特征经过线性变换输入到Softmax分类器得到分类特征,得到基于三重注意力机制和空间金字塔池化的深度网络;
步骤6、将训练样本输入所述基于三重注意力机制和空间金字塔池化的深度网络,并通过反向传播算法不断优化带权重的交叉熵损失函数,调整所述基于三重注意力机制和空间金字塔池化的深度网络的参数,得到能够识别所述训练样本类别的分类器;
步骤7、将待分类遥感图像输入所述分类器得到分类结果。
2.根据权利要求1所述的一种光学遥感图像场景分类方法,其特征在于,步骤2所述的构建三重注意力模块的方法为:将注意力机制的输入分为三个分支,分别计算通道维度和空间维度的注意权重,对三个所述分支的注意权重进行聚合,得到三重注意力模块。
3.根据权利要求2所述的一种光学遥感图像场景分类方法,其特征在于,计算通道维度和空间维度时采用旋转操作来建立通道维度和任意一个空间维度之间的连接。
4.根据权利要求1所述的一种光学遥感图像场景分类方法,其特征在于,步骤4的具体过程为:所述特征提取器的输出在空间金字塔池化层的处理过程为:先用三个不同刻度对特征提取器的输出进行划分,对每一刻度所划分的特征图区域进行最大池化操作,将三个刻度池化后的结果进行拼接得到输出特征。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111363053.6A CN114049519A (zh) | 2021-11-17 | 2021-11-17 | 一种光学遥感图像场景分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111363053.6A CN114049519A (zh) | 2021-11-17 | 2021-11-17 | 一种光学遥感图像场景分类方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114049519A true CN114049519A (zh) | 2022-02-15 |
Family
ID=80209782
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111363053.6A Pending CN114049519A (zh) | 2021-11-17 | 2021-11-17 | 一种光学遥感图像场景分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114049519A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114764788A (zh) * | 2022-03-29 | 2022-07-19 | 首都医科大学附属北京天坛医院 | 一种颅内动脉狭窄检测方法及系统 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018142272A (ja) * | 2017-02-28 | 2018-09-13 | 株式会社エヌ・ティ・ティ・データ | コンテンツ評価予測システム及びコンテンツ評価予測方法 |
CN110334765A (zh) * | 2019-07-05 | 2019-10-15 | 西安电子科技大学 | 基于注意力机制多尺度深度学习的遥感影像分类方法 |
CN110503635A (zh) * | 2019-07-30 | 2019-11-26 | 浙江工业大学 | 一种基于异构数据融合网络的手骨x光片骨龄评估方法 |
CN111144448A (zh) * | 2019-12-09 | 2020-05-12 | 江南大学 | 基于多尺度注意力卷积编码网络的视频弹幕情感分析方法 |
CN111667884A (zh) * | 2020-06-12 | 2020-09-15 | 天津大学 | 基于注意力机制使用蛋白质一级序列预测蛋白质相互作用的卷积神经网络模型 |
US20200366690A1 (en) * | 2019-05-16 | 2020-11-19 | Nec Laboratories America, Inc. | Adaptive neural networks for node classification in dynamic networks |
WO2020244261A1 (zh) * | 2019-06-05 | 2020-12-10 | 中国科学院长春光学精密机械与物理研究所 | 高分辨率遥感图像的场景识别系统及模型生成方法 |
CN112651973A (zh) * | 2020-12-14 | 2021-04-13 | 南京理工大学 | 基于特征金字塔注意力和混合注意力级联的语义分割方法 |
CN112836646A (zh) * | 2021-02-05 | 2021-05-25 | 华南理工大学 | 一种基于通道注意力机制的视频行人重识别方法及应用 |
US20210312628A1 (en) * | 2020-04-07 | 2021-10-07 | Naver Corporation | A method for training a convolutional neural network for image recognition using image-conditioned masked language modeling |
CN113610118A (zh) * | 2021-07-19 | 2021-11-05 | 中南大学 | 一种基于多任务课程式学习的眼底图像分类方法、装置、设备及介质 |
CN113657124A (zh) * | 2021-07-14 | 2021-11-16 | 内蒙古工业大学 | 基于循环共同注意力Transformer的多模态蒙汉翻译方法 |
-
2021
- 2021-11-17 CN CN202111363053.6A patent/CN114049519A/zh active Pending
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018142272A (ja) * | 2017-02-28 | 2018-09-13 | 株式会社エヌ・ティ・ティ・データ | コンテンツ評価予測システム及びコンテンツ評価予測方法 |
US20200366690A1 (en) * | 2019-05-16 | 2020-11-19 | Nec Laboratories America, Inc. | Adaptive neural networks for node classification in dynamic networks |
WO2020244261A1 (zh) * | 2019-06-05 | 2020-12-10 | 中国科学院长春光学精密机械与物理研究所 | 高分辨率遥感图像的场景识别系统及模型生成方法 |
CN110334765A (zh) * | 2019-07-05 | 2019-10-15 | 西安电子科技大学 | 基于注意力机制多尺度深度学习的遥感影像分类方法 |
CN110503635A (zh) * | 2019-07-30 | 2019-11-26 | 浙江工业大学 | 一种基于异构数据融合网络的手骨x光片骨龄评估方法 |
CN111144448A (zh) * | 2019-12-09 | 2020-05-12 | 江南大学 | 基于多尺度注意力卷积编码网络的视频弹幕情感分析方法 |
US20210312628A1 (en) * | 2020-04-07 | 2021-10-07 | Naver Corporation | A method for training a convolutional neural network for image recognition using image-conditioned masked language modeling |
CN111667884A (zh) * | 2020-06-12 | 2020-09-15 | 天津大学 | 基于注意力机制使用蛋白质一级序列预测蛋白质相互作用的卷积神经网络模型 |
CN112651973A (zh) * | 2020-12-14 | 2021-04-13 | 南京理工大学 | 基于特征金字塔注意力和混合注意力级联的语义分割方法 |
CN112836646A (zh) * | 2021-02-05 | 2021-05-25 | 华南理工大学 | 一种基于通道注意力机制的视频行人重识别方法及应用 |
CN113657124A (zh) * | 2021-07-14 | 2021-11-16 | 内蒙古工业大学 | 基于循环共同注意力Transformer的多模态蒙汉翻译方法 |
CN113610118A (zh) * | 2021-07-19 | 2021-11-05 | 中南大学 | 一种基于多任务课程式学习的眼底图像分类方法、装置、设备及介质 |
Non-Patent Citations (5)
Title |
---|
GAO, Y: "Remote sensing scene classification based on high-order graph convolutional network", 《EUROPEAN JOURNAL OF REMOTE SENSING》, 15 January 2021 (2021-01-15) * |
NA ZHANG: "Global Attention Pyramid Network for Semantic Segmentation", 《2019 CHINESE CONTROL CONFERENCE (CCC)》, 17 October 2019 (2019-10-17) * |
王嘉楠;高越;史骏;刘子琦: "基于视觉转换器和图卷积网络的光学遥感场景分类", 《光子学报》, 13 August 2021 (2021-08-13) * |
王鑫;李可;宁晨;黄凤辰;: "基于深度卷积神经网络和多核学习的遥感图像分类方法", 电子与信息学报, no. 05, 29 January 2019 (2019-01-29) * |
胡亚兰: "基于改进 YOLOv4 的垃圾识别研究", 《电子技术与软件工程》, 1 November 2021 (2021-11-01), pages 1 - 3 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114764788A (zh) * | 2022-03-29 | 2022-07-19 | 首都医科大学附属北京天坛医院 | 一种颅内动脉狭窄检测方法及系统 |
CN114764788B (zh) * | 2022-03-29 | 2022-12-16 | 首都医科大学附属北京天坛医院 | 一种颅内动脉狭窄检测方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109949317B (zh) | 基于逐步对抗学习的半监督图像实例分割方法 | |
CN110287849B (zh) | 一种适用于树莓派的轻量化深度网络图像目标检测方法 | |
CN110929602A (zh) | 一种基于卷积神经网络的地基云图云状识别方法 | |
CN113239954B (zh) | 基于注意力机制的图像语义分割特征融合方法 | |
CN113888550B (zh) | 一种结合超分辨率和注意力机制的遥感图像道路分割方法 | |
CN112233129B (zh) | 基于深度学习的并行多尺度注意力机制语义分割方法及装置 | |
CN112287941B (zh) | 一种基于自动字符区域感知的车牌识别方法 | |
CN110399820B (zh) | 一种公路路边景物视觉识别分析方法 | |
CN114092832A (zh) | 一种基于并联混合卷积网络的高分辨率遥感影像分类方法 | |
CN114360030A (zh) | 一种基于卷积神经网络的人脸识别方法 | |
CN114998757A (zh) | 用于无人机航摄图像分析的目标检测方法 | |
CN111414954A (zh) | 一种岩石图像检索方法及其系统 | |
CN112712127A (zh) | 一种结合图卷积神经网络的图像情感极性分类方法 | |
CN114419468A (zh) | 一种结合注意力机制和空间特征融合算法的水田分割方法 | |
CN115131747A (zh) | 基于知识蒸馏的输电通道工程车辆目标检测方法及系统 | |
CN111008979A (zh) | 一种鲁棒的夜晚图像语义分割方法 | |
CN113989556A (zh) | 一种小样本医学影像分类方法和系统 | |
CN114330516A (zh) | 基于多图引导神经网络模型的小样本徽景图像分类 | |
CN110807369B (zh) | 基于深度学习和注意力机制的短视频内容智能分类方法 | |
CN114049519A (zh) | 一种光学遥感图像场景分类方法 | |
CN114972753A (zh) | 基于上下文信息聚合和辅助学习的轻量级语义分割方法及系统 | |
CN109034192B (zh) | 一种基于深度学习的轨道-车体振动状态预测方法 | |
CN112668662B (zh) | 基于改进YOLOv3网络的野外山林环境目标检测方法 | |
CN112818777B (zh) | 一种基于密集连接与特征增强的遥感图像目标检测方法 | |
CN112164065B (zh) | 一种基于轻量化卷积神经网络的实时图像语义分割方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |