CN114049519A - 一种光学遥感图像场景分类方法 - Google Patents

一种光学遥感图像场景分类方法 Download PDF

Info

Publication number
CN114049519A
CN114049519A CN202111363053.6A CN202111363053A CN114049519A CN 114049519 A CN114049519 A CN 114049519A CN 202111363053 A CN202111363053 A CN 202111363053A CN 114049519 A CN114049519 A CN 114049519A
Authority
CN
China
Prior art keywords
remote sensing
spatial pyramid
pyramid pooling
triple
optical remote
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111363053.6A
Other languages
English (en)
Inventor
高越
王嘉楠
李俊
虞结诚
吴波
姚娜娜
吴佳君
李雪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangxi Aerospace Pohu Cloud Technology Co ltd
Original Assignee
Jiangxi Aerospace Pohu Cloud Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangxi Aerospace Pohu Cloud Technology Co ltd filed Critical Jiangxi Aerospace Pohu Cloud Technology Co ltd
Priority to CN202111363053.6A priority Critical patent/CN114049519A/zh
Publication of CN114049519A publication Critical patent/CN114049519A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种光学遥感图像场景分类方法,包括:在卷积神经网络的每个模块后插入三重注意力模块,得到稠密卷积神经网络,并去掉稠密卷积神经网络的最后一个全连接层得到特征提取器;构建空间金字塔池化层,将特征提取器的输出作为空间金字塔池化层的输入,得到输出特征;将输出特征经过线性变换输入到Softmax分类器得到分类特征,得到基于三重注意力机制和空间金字塔池化的深度网络;将训练样本输入基于三重注意力机制和空间金字塔池化的深度网络,得到能够识别训练样本类别的分类器;将待分类遥感图像输入分类器得到分类结果。提高了光学遥感图像场景分类的准确率。

Description

一种光学遥感图像场景分类方法
技术领域
本发明属于图像分类方法技术领域,涉及一种光学遥感图像场景分类方法。
背景技术
随着卫星与无人机等遥感观测技术的飞速发展,高分辨率遥感图像的数据不断增多,相较于自然场景图像,高分辨遥感图像成像范围更广、尺度变化大和语义内容更复杂。现有的图像分类方法对于遥感图像的分类准确率较低。
发明内容
本发明的目的是提供一种光学遥感图像场景分类方法,解决了现有技术中存在的遥感图像的分类准确率较低的问题。
本发明所采用的技术方案是,一种光学遥感图像场景分类方法,包括以下步骤:
步骤1、将分类后原始遥感图像作为训练样本;
步骤2、构建三重注意力模块;
步骤3、在卷积神经网络的每个模块后插入三重注意力模块,得到稠密卷积神经网络,并去掉稠密卷积神经网络的最后一个全连接层得到特征提取器;
步骤4、构建空间金字塔池化层,将特征提取器的输出作为空间金字塔池化层的输入,得到输出特征;
步骤5、将输出特征经过线性变换输入到Softmax分类器得到分类特征,得到基于三重注意力机制和空间金字塔池化的深度网络;
步骤6、将训练样本输入基于三重注意力机制和空间金字塔池化的深度网络,并通过反向传播算法不断优化带权重的交叉熵损失函数,调整基于三重注意力机制和空间金字塔池化的深度网络的参数,得到能够识别训练样本类别的分类器;
步骤7、将待分类遥感图像输入分类器得到分类结果。
本发明的特点还在于:
步骤2的构建三重注意力模块的方法为:将注意力机制的输入分为三个分支,分别计算通道维度和空间维度的注意权重,对三个分支的注意权重进行聚合,得到三重注意力模块;
计算通道维度和空间维度时采用旋转操作来建立通道维度和任意一个空间维度之间的连接。
步骤4的具体过程为:特征提取器的输出在空间金字塔池化层的处理过程为:先用三个不同刻度对特征提取器的输出进行划分,对每一刻度所划分的特征图区域进行最大池化操作,将三个刻度池化后的结果进行拼接得到输出特征。
步骤6中带权重的交叉熵损失函数如下:
Figure BDA0003359582200000021
Figure BDA0003359582200000022
上式中,w(i)表示样本第i类的损失权重,p(xi)表示样本xi的真实类别,q(xi)表示样本xi的预测类别,n为样本总数,ci表示第i类的样本数目。
本发明的有益效果是:本发明的一种光学遥感图像场景分类方法,在传统卷积神经网络中插入基于三重注意力机制的注意力模块,并使用空间金字塔池化层,对数据的潜在结构特征进行更加有效的学习,从而丰富了传统卷积神经网络所提取的特征;通过三重注意力模块和空间金字塔结构实现对重点区域和显著特征的关注,对背景区域和非显著特征进行忽略,提高模型对特征的表示能力,从而提高了光学遥感图像场景分类的准确率。
附图说明
图1是本发明一种光学遥感图像场景分类方法的流程图;
图2是本发明一种光学遥感图像场景分类方法的训练样本。
具体实施方式
下面结合附图和具体实施方式对本发明进行详细说明。
一种光学遥感图像场景分类方法,如图1所示,包括以下步骤:
步骤1、将已标注好的遥感图像分类得到30类样本,如图2所示,作为训练样本;
步骤2、构建三重注意力模块;
具体的,将注意力机制的输入分为三个分支,分别计算通道维度和空间维度(包括长和宽)的注意权重,其中在计算通道维度和空间维度时采用旋转操作来建立通道维度和任意一个空间维度之间的连接,通过取平均的方法对三个分支的注意权重进行聚合,得到三重注意力模块;
步骤3、以传统卷积神经网络作为主干网络,在卷积神经网络的每个模块后插入三重注意力模块,得到稠密卷积神经网络,并去掉稠密卷积神经网络的最后一个全连接层得到特征提取器;训练时,将每个训练样本输入该特征提取器;
步骤4、构建空间金字塔池化层,将特征提取器的输出输入空间金字塔池化层,得到输出特征;
具体的,构建空间金字塔池化层,将特征提取器的输出输入空间金字塔池化层,在空间金字塔池化层中,先用三个不同刻度(16,4,1)分别对空间金字塔池化层的输入进行划分,对每一刻度所划分的特征图区域进行最大池化操作,将三个刻度池化后的结果进行拼接得到输出特征(21维向量);
步骤5、将输出特征经过线性变换输入到Softmax分类器得到分类特征(30维向量),得到基于三重注意力机制和空间金字塔池化的深度网络;
步骤6、将30类样本输入基于三重注意力机制和空间金字塔池化的深度网络,并通过反向传播算法不断优化带权重的交叉熵损失函数,调整基于三重注意力机制和空间金字塔池化的深度网络的参数,得到能够识别训练样本类别的分类器;带权重的交叉熵损失函数如下:
Figure BDA0003359582200000041
Figure BDA0003359582200000042
上式中,w(i)表示样本第i类的损失权重,p(xi)表示样本xi的真实类别,q(xi)表示样本xi的预测类别,n为样本总数,ci表示第i类的样本数目。
步骤7、将待分类遥感图像输入分类器得到分类结果。
通过以上方式,本发明的一种光学遥感图像场景分类方法,在传统卷积神经网络中插入基于三重注意力机制的注意力模块,并使用空间金字塔池化层,对数据的潜在结构特征进行更加有效的学习,从而丰富了传统卷积神经网络所提取的特征,提高了结果正确率。

Claims (5)

1.一种光学遥感图像场景分类方法,其特征在于,包括以下步骤:
步骤1、将分类后原始遥感图像作为训练样本;
步骤2、构建三重注意力模块;
步骤3、在卷积神经网络的每个模块后插入三重注意力模块,得到稠密卷积神经网络,并去掉所述稠密卷积神经网络的最后一个全连接层得到特征提取器;
步骤4、构建空间金字塔池化层,将所述特征提取器的输出作为空间金字塔池化层的输入,得到输出特征;
步骤5、将所述输出特征经过线性变换输入到Softmax分类器得到分类特征,得到基于三重注意力机制和空间金字塔池化的深度网络;
步骤6、将训练样本输入所述基于三重注意力机制和空间金字塔池化的深度网络,并通过反向传播算法不断优化带权重的交叉熵损失函数,调整所述基于三重注意力机制和空间金字塔池化的深度网络的参数,得到能够识别所述训练样本类别的分类器;
步骤7、将待分类遥感图像输入所述分类器得到分类结果。
2.根据权利要求1所述的一种光学遥感图像场景分类方法,其特征在于,步骤2所述的构建三重注意力模块的方法为:将注意力机制的输入分为三个分支,分别计算通道维度和空间维度的注意权重,对三个所述分支的注意权重进行聚合,得到三重注意力模块。
3.根据权利要求2所述的一种光学遥感图像场景分类方法,其特征在于,计算通道维度和空间维度时采用旋转操作来建立通道维度和任意一个空间维度之间的连接。
4.根据权利要求1所述的一种光学遥感图像场景分类方法,其特征在于,步骤4的具体过程为:所述特征提取器的输出在空间金字塔池化层的处理过程为:先用三个不同刻度对特征提取器的输出进行划分,对每一刻度所划分的特征图区域进行最大池化操作,将三个刻度池化后的结果进行拼接得到输出特征。
5.根据权利要求1所述的一种光学遥感图像场景分类方法,其特征在于,步骤6中带权重的交叉熵损失函数如下:
Figure FDA0003359582190000021
Figure FDA0003359582190000022
上式中,w(i)表示样本第i类的损失权重,p(xi)表示样本xi的真实类别,q(xi)表示样本xi的预测类别,n为样本总数,ci表示第i类的样本数目。
CN202111363053.6A 2021-11-17 2021-11-17 一种光学遥感图像场景分类方法 Pending CN114049519A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111363053.6A CN114049519A (zh) 2021-11-17 2021-11-17 一种光学遥感图像场景分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111363053.6A CN114049519A (zh) 2021-11-17 2021-11-17 一种光学遥感图像场景分类方法

Publications (1)

Publication Number Publication Date
CN114049519A true CN114049519A (zh) 2022-02-15

Family

ID=80209782

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111363053.6A Pending CN114049519A (zh) 2021-11-17 2021-11-17 一种光学遥感图像场景分类方法

Country Status (1)

Country Link
CN (1) CN114049519A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114764788A (zh) * 2022-03-29 2022-07-19 首都医科大学附属北京天坛医院 一种颅内动脉狭窄检测方法及系统

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018142272A (ja) * 2017-02-28 2018-09-13 株式会社エヌ・ティ・ティ・データ コンテンツ評価予測システム及びコンテンツ評価予測方法
CN110334765A (zh) * 2019-07-05 2019-10-15 西安电子科技大学 基于注意力机制多尺度深度学习的遥感影像分类方法
CN110503635A (zh) * 2019-07-30 2019-11-26 浙江工业大学 一种基于异构数据融合网络的手骨x光片骨龄评估方法
CN111144448A (zh) * 2019-12-09 2020-05-12 江南大学 基于多尺度注意力卷积编码网络的视频弹幕情感分析方法
CN111667884A (zh) * 2020-06-12 2020-09-15 天津大学 基于注意力机制使用蛋白质一级序列预测蛋白质相互作用的卷积神经网络模型
US20200366690A1 (en) * 2019-05-16 2020-11-19 Nec Laboratories America, Inc. Adaptive neural networks for node classification in dynamic networks
WO2020244261A1 (zh) * 2019-06-05 2020-12-10 中国科学院长春光学精密机械与物理研究所 高分辨率遥感图像的场景识别系统及模型生成方法
CN112651973A (zh) * 2020-12-14 2021-04-13 南京理工大学 基于特征金字塔注意力和混合注意力级联的语义分割方法
CN112836646A (zh) * 2021-02-05 2021-05-25 华南理工大学 一种基于通道注意力机制的视频行人重识别方法及应用
US20210312628A1 (en) * 2020-04-07 2021-10-07 Naver Corporation A method for training a convolutional neural network for image recognition using image-conditioned masked language modeling
CN113610118A (zh) * 2021-07-19 2021-11-05 中南大学 一种基于多任务课程式学习的眼底图像分类方法、装置、设备及介质
CN113657124A (zh) * 2021-07-14 2021-11-16 内蒙古工业大学 基于循环共同注意力Transformer的多模态蒙汉翻译方法

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018142272A (ja) * 2017-02-28 2018-09-13 株式会社エヌ・ティ・ティ・データ コンテンツ評価予測システム及びコンテンツ評価予測方法
US20200366690A1 (en) * 2019-05-16 2020-11-19 Nec Laboratories America, Inc. Adaptive neural networks for node classification in dynamic networks
WO2020244261A1 (zh) * 2019-06-05 2020-12-10 中国科学院长春光学精密机械与物理研究所 高分辨率遥感图像的场景识别系统及模型生成方法
CN110334765A (zh) * 2019-07-05 2019-10-15 西安电子科技大学 基于注意力机制多尺度深度学习的遥感影像分类方法
CN110503635A (zh) * 2019-07-30 2019-11-26 浙江工业大学 一种基于异构数据融合网络的手骨x光片骨龄评估方法
CN111144448A (zh) * 2019-12-09 2020-05-12 江南大学 基于多尺度注意力卷积编码网络的视频弹幕情感分析方法
US20210312628A1 (en) * 2020-04-07 2021-10-07 Naver Corporation A method for training a convolutional neural network for image recognition using image-conditioned masked language modeling
CN111667884A (zh) * 2020-06-12 2020-09-15 天津大学 基于注意力机制使用蛋白质一级序列预测蛋白质相互作用的卷积神经网络模型
CN112651973A (zh) * 2020-12-14 2021-04-13 南京理工大学 基于特征金字塔注意力和混合注意力级联的语义分割方法
CN112836646A (zh) * 2021-02-05 2021-05-25 华南理工大学 一种基于通道注意力机制的视频行人重识别方法及应用
CN113657124A (zh) * 2021-07-14 2021-11-16 内蒙古工业大学 基于循环共同注意力Transformer的多模态蒙汉翻译方法
CN113610118A (zh) * 2021-07-19 2021-11-05 中南大学 一种基于多任务课程式学习的眼底图像分类方法、装置、设备及介质

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
GAO, Y: "Remote sensing scene classification based on high-order graph convolutional network", 《EUROPEAN JOURNAL OF REMOTE SENSING》, 15 January 2021 (2021-01-15) *
NA ZHANG: "Global Attention Pyramid Network for Semantic Segmentation", 《2019 CHINESE CONTROL CONFERENCE (CCC)》, 17 October 2019 (2019-10-17) *
王嘉楠;高越;史骏;刘子琦: "基于视觉转换器和图卷积网络的光学遥感场景分类", 《光子学报》, 13 August 2021 (2021-08-13) *
王鑫;李可;宁晨;黄凤辰;: "基于深度卷积神经网络和多核学习的遥感图像分类方法", 电子与信息学报, no. 05, 29 January 2019 (2019-01-29) *
胡亚兰: "基于改进 YOLOv4 的垃圾识别研究", 《电子技术与软件工程》, 1 November 2021 (2021-11-01), pages 1 - 3 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114764788A (zh) * 2022-03-29 2022-07-19 首都医科大学附属北京天坛医院 一种颅内动脉狭窄检测方法及系统
CN114764788B (zh) * 2022-03-29 2022-12-16 首都医科大学附属北京天坛医院 一种颅内动脉狭窄检测方法及系统

Similar Documents

Publication Publication Date Title
CN109949317B (zh) 基于逐步对抗学习的半监督图像实例分割方法
CN110287849B (zh) 一种适用于树莓派的轻量化深度网络图像目标检测方法
CN110929602A (zh) 一种基于卷积神经网络的地基云图云状识别方法
CN113239954B (zh) 基于注意力机制的图像语义分割特征融合方法
CN113888550B (zh) 一种结合超分辨率和注意力机制的遥感图像道路分割方法
CN112233129B (zh) 基于深度学习的并行多尺度注意力机制语义分割方法及装置
CN112287941B (zh) 一种基于自动字符区域感知的车牌识别方法
CN110399820B (zh) 一种公路路边景物视觉识别分析方法
CN114092832A (zh) 一种基于并联混合卷积网络的高分辨率遥感影像分类方法
CN114360030A (zh) 一种基于卷积神经网络的人脸识别方法
CN114998757A (zh) 用于无人机航摄图像分析的目标检测方法
CN111414954A (zh) 一种岩石图像检索方法及其系统
CN112712127A (zh) 一种结合图卷积神经网络的图像情感极性分类方法
CN114419468A (zh) 一种结合注意力机制和空间特征融合算法的水田分割方法
CN115131747A (zh) 基于知识蒸馏的输电通道工程车辆目标检测方法及系统
CN111008979A (zh) 一种鲁棒的夜晚图像语义分割方法
CN113989556A (zh) 一种小样本医学影像分类方法和系统
CN114330516A (zh) 基于多图引导神经网络模型的小样本徽景图像分类
CN110807369B (zh) 基于深度学习和注意力机制的短视频内容智能分类方法
CN114049519A (zh) 一种光学遥感图像场景分类方法
CN114972753A (zh) 基于上下文信息聚合和辅助学习的轻量级语义分割方法及系统
CN109034192B (zh) 一种基于深度学习的轨道-车体振动状态预测方法
CN112668662B (zh) 基于改进YOLOv3网络的野外山林环境目标检测方法
CN112818777B (zh) 一种基于密集连接与特征增强的遥感图像目标检测方法
CN112164065B (zh) 一种基于轻量化卷积神经网络的实时图像语义分割方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination