CN117292276B - 基于编解码注意力交互的云检测方法、系统、介质及设备 - Google Patents

基于编解码注意力交互的云检测方法、系统、介质及设备 Download PDF

Info

Publication number
CN117292276B
CN117292276B CN202311579269.5A CN202311579269A CN117292276B CN 117292276 B CN117292276 B CN 117292276B CN 202311579269 A CN202311579269 A CN 202311579269A CN 117292276 B CN117292276 B CN 117292276B
Authority
CN
China
Prior art keywords
module
interaction
cloud
attention
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311579269.5A
Other languages
English (en)
Other versions
CN117292276A (zh
Inventor
李俊
胡成杰
盛庆红
王博
凌霄
徐嘉蔚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Aeronautics and Astronautics
Original Assignee
Nanjing University of Aeronautics and Astronautics
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Aeronautics and Astronautics filed Critical Nanjing University of Aeronautics and Astronautics
Priority to CN202311579269.5A priority Critical patent/CN117292276B/zh
Publication of CN117292276A publication Critical patent/CN117292276A/zh
Application granted granted Critical
Publication of CN117292276B publication Critical patent/CN117292276B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • G06V20/13Satellite images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/7715Feature extraction, e.g. by transforming the feature space, e.g. multi-dimensional scaling [MDS]; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/80Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
    • G06V10/806Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Remote Sensing (AREA)
  • Astronomy & Astrophysics (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于编解码注意力交互的云检测方法、系统、介质及设备,基于卷积神经网络与注意力机制建立云检测网络,该云检测融合了编码器注意力模块以及编解码器注意力交互模块,获取遥感影像后处理为测试集和训练集对云检测网络进行训练,得到优化云检测网络,将遥感影像输入优化云检测网络后输出优化云检测图。相较于现有技术,本发明一种检测速度快、检测精度高的基于编解码注意力交互的云检测方法、系统、介质及设备具有检测速度快、检测精度高的特点。

Description

基于编解码注意力交互的云检测方法、系统、介质及设备
技术领域
本发明涉及图像处理技术领域,具体涉及一种基于编解码注意力交互的云检测方法、系统、介质及设备。
背景技术
遥感图像通常指代由遥感卫星获得并记录各种地物电磁波大小的胶片或照片,相比于普通图像,其具有较好的空间分辨率,包含的细节信息更多,因此遥感图像被广泛应用于多个领域。随着越来越多的遥感卫星发射升空,遥感卫星获取的海量数据为植被健康监测、灾害监测和土地覆盖分类提供了丰富的信息。然而,由云遮挡造成的遥感传输图像的不准确性问题尤为突出。根据国际卫星云气候计划ISCCP (International Satellite CloudC1 imatology Project) 提供的全球云量数据显示,全球有超过60%以上的区域常常被云覆盖。可见,云一直是影响遥感影像质量的重要因素,因此云检测是遥感影像应用之前必不可少的一步。
传统上,云检测的研究方法主要是多波段阈值和纹理分析方法。多波段阈值法通常是利用云在不同波段与地物表现出来的差异性,进行云与地物的区分,例如通过近红外通道利用云的高反射和低温性进行云与地物的区分。而纹理分析通常是将云图像转换至不同的颜色空间进行纹理特征的提取,进而实现有效的云与地物分离。这些传统方法通常会花费大量时间去调参以及选取阈值,检测速度慢。同时在特定区域,如薄云区或云的边界区域,由于与地物有较大相似度,同样多波段阈值法与纹理分析法很难做出有效的云与地物分离。
近年来,深度卷积神经网络在计算机视觉领域取得了巨大的成功,通过强大的特征表达能力,成为图像处理多领域的主要研究方法。相较于传统云检测方法,现有的卷积神经网络云检测算法性能虽大幅提升,然而基于深度学习的方法所使用的卷积网络只能感知图像的局部特征。在一些关键区域,如薄云、云边界区域,仍然表现出较差的检测性能。这些区域由于特征不太明显集中或云与某些高亮地物相似度太高,导致算法难以有效的进行云与地物分离,容易产生错分现象,检测精度不高。
发明内容
发明目的:本发明目的是提供一种检测速度快、检测精度高的基于编解码注意力交互的云检测方法、系统、介质及设备。
技术方案:本发明所述的一种基于编解码注意力交互的云检测方法,包括以下步骤:
1)获取遥感影像,并从该遥感影像上标记出对应的云掩膜;
2)基于卷积神经网络和注意力机制建立云检测网络,所述云检测网络包括输入模块、编解码交互模块以及输出模块;
所述输入模块用于接收遥感影像并输出初始输入图像;
所述编解码交互模块连续设有多个交互层,每个交互层均包括交互层编码器注意力模块、编解码器注意力交互模块、上采样模块、卷积单元;
在每个交互层中:所述卷积单元提取输入图像的特征,并输出特征;所述交互层编码器注意力模块接收所述特征并输出交互层编码特征;所述上采样模块接收所述交互层编码特征,扩充通道后输出上采样特征;所述编解码器注意力交互模块接收所述上采样特征,并输出解码特征;
当该交互层为第一层交互层时,卷积单元提取初始输入图像的特征;
当该交互层为第N层交互层时,卷积单元提取上一层交互层的交互层编码特征作为输入图像的特征;且该第N层交互层的解码特征输入上一层交互层的上采样模块;N为大于1的正整数;
所述输出模块用于接收第一层交互层输出的解码特征并输出云概率图;
3)将所述遥感影像输入云检测网络,输出云概率图;
4)基于交叉熵损失建立监督损失模块,并将所述云掩膜和所述云概率图输入该监督损失模块,计算监督损失;
5)对所述遥感影像预处理,得到训练集和测试集;
基于反向传播法采用训练集和测试集重复步骤3)至4),迭代更新云检测网络,得到优化云检测网络;
6)获取待检测有云遥感影像并输入优化云检测网络,输出云检测图。
进一步的,步骤2)中,所述第一层交互层与所述输入模块、输出模块连接;所述输入模块包括初始编码器注意力模块,该初始编码器注意力模块输出的初始编码特征作为第一交互层的卷积单元初始输入图像;第一层交互层的解码特征与输入模块的初始编码特征输入输出模块。
进一步的,所述注意力机制包括全链接层操作、特征投影操作、投影特征标准化操作、注意力交互操作、特征拼接操作;
其中,所述全链接层操作用于将输入的特征分解为查询特征、键特征、值特征;
所述特征投影操作用于将所述查询特征、键特征、值特征分别投影为查询投影特征、键投影特征、值投影特征;
所述投影特征标准化操作包括方向标准化操作以及长度标准化操作,所述方向标准化操作用于将所述查询投影特征和所述键投影特征按通道维度转化为单位方向向量,得到方向查询投影特征和方向键投影特征;所述长度标准化操作用于将所述键投影特征基于通道维度求向量的模,得到长度键投影特征;
所述注意力交互操作用于将所述方向查询投影特征和方向键投影特征做矩阵乘法,得到相似性值后与长度键投影特征相乘,特征归一化后得到包含相似性和重要性的注意力图,之后将注意力图与值投影特征做矩阵乘法得到全局注意力图;利用深度可分离卷积提取所述输入的特征的局部注意力得到局部注意力图,将全局注意力图、局部注意力图与所述输入的特征相加,得到融合注意力图;所述融合注意力图包括编码特征和解码特征。
进一步的,所述长度标准化操作通过SoftMax函数将所述键投影特征在空间维度归一化,得到向量长度的相对大小。
进一步的,所述交互层编码器注意力模块及初始编码器注意力模块均通过对输入的特征依次进行全链接层操作、特征投影操作、投影特征标准化操作、注意力交互操作的步骤输出交互层编码特征或初始编码特征;
编解码器注意力交互模块通过对输入的特征依次进行特征拼接操作、特征投影操作、投影特征标准化操作、注意力交互操作的步骤输出解码特征;
所述特征拼接操作为:分别对输入的所述相邻上一层交互层的交互层编码特征和上采样特征进行全链接层操作,保留上采样特征的查询特征,并在键特征、值特征上进行特征拼接。
进一步的,步骤4)中所述监督损失通过下式计算:
L=
式中,L表示监督损失;yi表示第i个云掩膜记录的真值;pi表示第i个网络预测的云概率值;N表示像素总数。
进一步的,步骤5)中,所述训练集包括成对的训练云掩膜和训练影像;所述测试集包括成对的测试云掩膜和测试影像;所述预处理包括:将遥感影像划分为训练影像和测试影像,在训练影像上标记云掩膜形成训练云掩膜,在测试影像上标记云掩膜形成测试云掩膜,并按对组成集合。
本发明所述的基于编解码注意力交互的云检测系统,包括以下模块:
影像获取模块:用以获取遥感影像,并从该遥感影像上标记出对应的云掩膜;
云检测网络建立模块:用以基于卷积神经网络和注意力机制建立云检测网络,所述云检测网络包括输入模块、编解码交互模块以及输出模块;
所述输入模块用于接收遥感影像并输出初始输入图像;
所述编解码交互模块连续设有多个交互层,每个交互层均包括交互层编码器注意力模块、编解码器注意力交互模块、上采样模块、卷积单元;
在每个交互层中:所述卷积单元提取输入图像的特征,并输出特征;所述交互层编码器注意力模块接收所述特征并输出交互层编码特征;所述上采样模块接收所述交互层编码特征,扩充通道后输出上采样特征;所述编解码器注意力交互模块接收所述上采样特征,并输出解码特征;
当该交互层为第一层交互层时,卷积单元提取初始输入图像的特征;
当该交互层为第N层交互层时,卷积单元提取上一层交互层的交互层编码特征作为输入图像的特征;且该第N层交互层的解码特征输入上一层交互层的上采样模块;N为大于1的正整数;
所述输出模块用于接收第一层交互层输出的解码特征并输出云概率图;
结果输出模块:用以将所述遥感影像输入云检测网络,输出云概率图;
损失计算模块:用以基于交叉熵损失建立监督损失模块,并将所述云掩膜和所述云概率图输入该监督损失模块,计算监督损失;
模型优化模块:用以对所述遥感影像预处理,得到训练集和测试集;基于反向传播法采用训练集和测试集重复步骤3)至4),迭代更新云检测网络,得到优化云检测网络;
优化结果输出模块:用以获取待检测有云遥感影像并输入优化云检测网络,输出云检测图。
本发明所述的计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现所述方法的步骤。
本发明所述的计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述的方法的步骤。
有益效果:本发明具有如下显著效果:1、本发明检测精度高;通过在编码阶段融合输入的全局和局部特征,在解码阶段通过与编码器交互,融合编解码各阶段的全局和局部特征,并对云检测网络进行监督学习,实现更加准确的云检测。2、本发明检测速度快;基于注意力机制以及卷积神经网络建立云检测网络,通过计算机深度学习实现,不需要花费大量时间去调参以及选取阈值,检测速度快。
附图说明
图1为本发明中云检测网络结构图;
图2为本发明中编码器注意力模块结构示意图;
图3为本发明中编解码器注意力交互模块的结构示意图。
具体实施方式
下面结合附图和具体实施方式,进一步阐明本发明。
请参阅图1所示,本发明公开了一种基于编解码注意力交互的云检测方法,所述方法包括以下步骤:
1)获取遥感影像,并从该遥感影像上标记出对应的云掩膜。
2)基于卷积神经网络和注意力机制建立云检测网络,所述云检测网络包括输入模块、编解码交互模块以及输出模块。
所述输入模块用于接收遥感影像并输出初始输入图像。
所述编解码交互模块连续设有多个交互层,每个交互层均包括交互层编码器注意力模块、编解码器注意力交互模块、上采样模块、卷积单元。
在每个交互层中:所述卷积单元提取输入图像的特征,并输出特征;所述交互层编码器注意力模块接收所述特征并输出交互层编码特征;所述上采样模块接收所述交互层编码特征,扩充通道后输出上采样特征;所述编解码器注意力交互模块接收所述上采样特征,并输出解码特征。
当该交互层为第一层交互层时,卷积单元提取初始输入图像的特征。
当该交互层为第N层交互层时,卷积单元提取上一层交互层的交互层编码特征作为输入图像的特征;且该第N层交互层的解码特征输入上一层交互层的上采样模块;N为大于1的正整数。
所述输出模块用于接收第一层交互层输出的解码特征并输出云概率图。
所述第一层交互层与所述输入模块、输出模块连接;所述输入模块包括初始编码器注意力模块,该初始编码器注意力模块输出的初始编码特征作为第一交互层的卷积单元初始输入图像;第一层交互层的解码特征与输入模块的初始编码特征输入输出模块。
3)将所述遥感影像输入云检测网络,输出云概率图。
4)基于交叉熵损失建立监督损失模块,并将所述云掩膜和所述云概率图输入该监督损失模块,计算监督损失。监督损失通过下式计算:
L=
式中,L表示监督损失;yi表示第i个云掩膜记录的真值;pi表示第i个网络预测的云概率值;N表示像素总数。
5)对所述遥感影像预处理,得到训练集和测试集。所述训练集包括成对的训练云掩膜和训练影像;所述测试集包括成对的测试云掩膜和测试影像;所述预处理包括:将遥感影像划分为训练影像和测试影像,在训练影像上标记云掩膜形成训练云掩膜,在测试影像上标记云掩膜形成测试云掩膜,并按对组成集合。
基于反向传播法采用训练集和测试集重复步骤3)至4),迭代更新云检测网络,得到优化云检测网络。
6)获取待检测有云遥感影像并输入优化云检测网络,输出云检测图。
其中,请参阅图2至3所示,所述注意力机制包括全链接层操作、特征投影操作、投影特征标准化操作、注意力交互操作、特征拼接操作。具体介绍如下:
所述全链接层操作用于将输入的特征分解为查询特征、键特征、值特征。
所述特征投影操作用于将所述查询特征、键特征、值特征分别投影为查询投影特征、键投影特征、值投影特征。
所述投影特征标准化操作包括方向标准化操作以及长度标准化操作,所述方向标准化操作用于将所述查询投影特征和所述键投影特征按通道维度转化为单位方向向量,得到方向查询投影特征和方向键投影特征,用来描述特征的方向性。所述长度标准化操作用于将所述键投影特征基于通道维度求向量的模,得到长度键投影特征。
所述注意力交互操作用于将所述方向查询投影特征和方向键投影特征做矩阵乘法,得到相似性值后与长度键投影特征相乘,特征归一化后得到包含相似性和重要性的注意力图,之后将注意力图与值投影特征做矩阵乘法得到全局注意力图;利用深度可分离卷积提取所述输入的特征的局部注意力得到局部注意力图,将全局注意力图、局部注意力图与所述输入的特征相加,得到融合注意力图;所述融合注意力图包括编码特征和解码特征。
请参阅图2所示,所述交互层编码器注意力模块及初始编码器注意力模块均通过对输入的特征依次进行全链接层操作、特征投影操作、投影特征标准化操作、注意力交互操作的步骤输出交互层编码特征或初始编码特征。所述交互层编码器注意力模块及初始编码器注意力模块均利用全局自注意力机制综合全局特征,使得每个像素点都包含所有像素点的信息,同时融合局部特征,使编码器注意力模块自动学习最优参数。
请参阅图3所示,所述编解码器注意力交互模块通过对输入的特征依次进行特征拼接操作、特征投影操作、投影特征标准化操作、注意力交互操作的步骤输出解码特征。所述特征拼接操作为:分别对输入的所述相邻上一层交互层的交互层编码特征和上采样特征进行全链接层操作,保留上采样特征的查询特征,并在键特征、值特征上进行特征拼接。编解码器注意力交互模块利用交互层编码特征来获取全局注意力,有助于经过多层编解码后的解码器理解浅层特征,可使解码器部分能够根据目标自动学习最优参数。
本实施例中,所述长度标准化操作通过SoftMax函数将所述键投影特征在空间维度归一化,得到向量长度的相对大小。所述特征拼接操作在行上进行拼接。n=3。
步骤2)中,上采样模块包括一个深度可分离卷积层操作、一个全链接层操作和一个像素重组操作,先将前一模块输出的特征(下一个交互层的解码特征和/或此交互层的编码特征)利用深度可分离卷积投影到指定通道数n,再进行全链接层操作,输出得到r2n个通道的特征,再将该特征通过像素重新组合,得到长和宽扩到r倍,通道数变为n的上采样特征。
步骤5)中,对遥感影像的预处理包括:影像划分、建立训练集、建立测试集。影像划分为:将遥感影像划分为训练集和测试集。建立训练集为:通过人工目视解译标记训练影像的云掩膜形成训练云掩膜,分割训练影像和训练云掩膜得到多个训练影像块和多个训练云掩膜块;将多个训练集影像块放入训练数据文件夹,对应的多个训练云掩膜块放入训练标签文件夹,得到训练集。建立测试集为:通过人工目视解译标记测试影像的云掩膜形成测试云掩膜;将测试影像放入测试数据文件夹,对应的测试云掩膜放入测试标签文件夹,得到测试集。
本实施例中,获取全球分布的50景Landsat 8遥感影像,合成RGB波段数据。首先,将其中40景划为训练影像,10景划为测试影像。其次,通过人工目视解译对所有训练影像和测试影像标记云掩膜,得到训练云掩膜和测试云掩膜。
将测试影像块放入测试文件夹,对应的测试云掩膜块放到测试标签文件夹,得到测试集。通过python脚本,训练影像和训练云掩膜按512x512的窗口、步长384x384成对裁剪,训练影像块放入训练文件夹,对应的训练云掩膜块放到训练标签文件夹,得到共计31242组训练切片数据,即训练集。
在计算机内训练云检测网络,计算机的配置为:AMDRyzen9 3950X 16核处理器,Nvidia GeForceRTX3080图形处理器,主频 3.49GHz,内存64GB,操作系统为windows10。基于编解码注意力交互的遥感影像云检测网络的实现基于Pytorch2.0.1深度学习框架工具包。
训练过程中,云检测网络的所有卷积核的初始化采用均值为0、方差为0.01的高斯分布,偏置的初始化采用固定值 0.0,采用 Adam 优化算法,批次大小为2,初始学习率设为0.0002,前10000次迭代保持不变,10000次后每迭代100次减小为0.98,实际训练时每迭代10轮,进行一次模型精度验证,迭代50轮后云检测网络模型基本收敛,得到优化云检测网络。
其中,重复进行步骤4),对云概率图和人工标记的云掩膜求交叉熵损失。使用交叉熵作为损失函数,将云概率图和云掩膜代入损失函数。多次训练,在编码阶段完成下采样过程,通过设置卷积步长来降低图像分辨率,在解码阶段完成上采样过程,上采样过程采用卷积提升图像分辨率。对遥感影像生成的云概率图进行监督,提升所述基于编解码注意力交互的遥感影像云检测方法在不同分辨率上的云检测能力。通过反向传播算法,优化网络参数,直至得到优化云检测网络。
本发明云检测网络的整体结构基于U-Net结构,利用输入图像的全局特征和局部特征检测遥感图像中的云,建立有效的云检测网络,云检测精度高。同时,本发明所采用的云检测方法可推广到其他同类型遥感影像的云检测任务。根据任务情况判断云检测网络是否需要进行重新训练。若需要则建立有云遥感影像和云掩膜对的训练集,对云检测网络重新进行训练,即可得到适用于执行该任务的云检测网络。
本发明还公开了一种基于编解码注意力交互的云检测系统,包括以下模块:
影像获取模块:用以获取遥感影像,并从该遥感影像上标记出对应的云掩膜;
云检测网络建立模块:用以基于卷积神经网络和注意力机制建立云检测网络,所述云检测网络包括输入模块、编解码交互模块以及输出模块;
所述输入模块用于接收遥感影像并输出初始输入图像;
所述编解码交互模块连续设有多个交互层,每个交互层均包括交互层编码器注意力模块、编解码器注意力交互模块、上采样模块、卷积单元;
在每个交互层中:所述卷积单元提取输入图像的特征,并输出特征;所述交互层编码器注意力模块接收所述特征并输出交互层编码特征;所述上采样模块接收所述交互层编码特征,扩充通道后输出上采样特征;所述编解码器注意力交互模块接收所述上采样特征,并输出解码特征;
当该交互层为第一层交互层时,卷积单元提取初始输入图像的特征;
当该交互层为第N层交互层时,卷积单元提取上一层交互层的交互层编码特征作为输入图像的特征;且该第N层交互层的解码特征输入上一层交互层的上采样模块;N为大于1的正整数;
所述输出模块用于接收第一层交互层输出的解码特征并输出云概率图;
结果输出模块:用以将所述遥感影像输入云检测网络,输出云概率图;
损失计算模块:用以基于交叉熵损失建立监督损失模块,并将所述云掩膜和所述云概率图输入该监督损失模块,计算监督损失;
模型优化模块:用以对所述遥感影像预处理,得到训练集和测试集;基于反向传播法采用训练集和测试集重复步骤3)至4),迭代更新云检测网络,得到优化云检测网络;
优化结果输出模块:用以获取待检测有云遥感影像并输入优化云检测网络,输出云检测图。
本发明还公开了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现所述方法的步骤。
本发明还公开了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述的方法的步骤。
综上,本发明一种基于编解码注意力交互的云检测方法、系统、介质及设备具有检测速度快、检测精度高的特点。

Claims (10)

1.一种基于编解码注意力交互的云检测方法,其特征在于,所述方法包括以下步骤:
1)获取遥感影像,并从该遥感影像上标记出对应的云掩膜;
2)基于卷积神经网络和注意力机制建立云检测网络,所述云检测网络包括输入模块、编解码交互模块以及输出模块;
所述输入模块用于接收遥感影像并输出初始输入图像;
所述编解码交互模块连续设有多个交互层,每个交互层均包括交互层编码器注意力模块、编解码器注意力交互模块、上采样模块、卷积单元;
在每个交互层中:所述卷积单元提取输入图像的特征,并输出特征;所述交互层编码器注意力模块接收所述特征并输出交互层编码特征;所述上采样模块接收所述交互层编码特征,扩充通道后输出上采样特征;所述编解码器注意力交互模块接收所述上采样特征,并输出解码特征;
当该交互层为第一层交互层时,卷积单元提取初始输入图像的特征;
当该交互层为第N层交互层时,卷积单元提取上一层交互层的交互层编码特征作为输入图像的特征;且该第N层交互层的解码特征输入上一层交互层的上采样模块;N为大于1的正整数;
所述输出模块用于接收第一层交互层输出的解码特征并输出云概率图;
3)将所述遥感影像输入云检测网络,输出云概率图;
4)基于交叉熵损失建立监督损失模块,并将所述云掩膜和所述云概率图输入该监督损失模块,计算监督损失;
5)对所述遥感影像预处理,得到训练集和测试集;
基于反向传播法采用训练集和测试集重复步骤3)至4),迭代更新云检测网络,得到优化云检测网络;
6)获取待检测有云遥感影像并输入优化云检测网络,输出云检测图。
2.根据权利要求1所述的基于编解码注意力交互的云检测方法,其特征在于,步骤2)中,所述第一层交互层与所述输入模块、输出模块连接;所述输入模块包括初始编码器注意力模块,该初始编码器注意力模块输出的初始编码特征作为第一交互层的卷积单元初始输入图像;第一层交互层的解码特征与输入模块的初始编码特征输入输出模块。
3.根据权利要求1所述的基于编解码注意力交互的云检测方法,其特征在于,所述注意力机制包括全链接层操作、特征投影操作、投影特征标准化操作、注意力交互操作、特征拼接操作;
其中,所述全链接层操作用于将输入的特征分解为查询特征、键特征、值特征;
所述特征投影操作用于将所述查询特征、键特征、值特征分别投影为查询投影特征、键投影特征、值投影特征;
所述投影特征标准化操作包括方向标准化操作以及长度标准化操作,所述方向标准化操作用于将所述查询投影特征和所述键投影特征按通道维度转化为单位方向向量,得到方向查询投影特征和方向键投影特征;所述长度标准化操作用于将所述键投影特征基于通道维度求向量的模,得到长度键投影特征;
所述注意力交互操作用于将所述方向查询投影特征和方向键投影特征做矩阵乘法,得到相似性值后与长度键投影特征相乘,特征归一化后得到包含相似性和重要性的注意力图,之后将注意力图与值投影特征做矩阵乘法得到全局注意力图;利用深度可分离卷积提取所述输入的特征的局部注意力得到局部注意力图,将全局注意力图、局部注意力图与所述输入的特征相加,得到融合注意力图;所述融合注意力图包括编码特征和解码特征。
4.根据权利要求3所述的基于编解码注意力交互的云检测方法,其特征在于,所述长度标准化操作通过SoftMax函数将所述键投影特征在空间维度归一化,得到向量长度的相对大小。
5.根据权利要求3所述的基于编解码注意力交互的云检测方法,其特征在于,所述交互层编码器注意力模块及初始编码器注意力模块均通过对输入的特征依次进行全链接层操作、特征投影操作、投影特征标准化操作、注意力交互操作的步骤输出交互层编码特征或初始编码特征;
编解码器注意力交互模块通过对输入的特征依次进行特征拼接操作、特征投影操作、投影特征标准化操作、注意力交互操作的步骤输出解码特征;
所述特征拼接操作为:分别对输入的相邻上一层交互层的交互层编码特征和上采样特征进行全链接层操作,保留上采样特征的查询特征,并在键特征、值特征上进行特征拼接。
6.根据权利要求1所述的基于编解码注意力交互的云检测方法,其特征在于,步骤4)中所述监督损失通过下式计算:
L=
式中,L表示监督损失;yi表示第i个云掩膜记录的真值;pi表示第i个网络预测的云概率值;N表示像素总数。
7.根据权利要求1所述的基于编解码注意力交互的云检测方法,其特征在于,步骤5)中,所述训练集包括成对的训练云掩膜和训练影像;所述测试集包括成对的测试云掩膜和测试影像;所述预处理包括:将遥感影像划分为训练影像和测试影像,在训练影像上标记云掩膜形成训练云掩膜,在测试影像上标记云掩膜形成测试云掩膜,并按对组成集合。
8.一种基于编解码注意力交互的云检测系统,其特征在于,所述系统包括以下模块:
影像获取模块:用以获取遥感影像,并从该遥感影像上标记出对应的云掩膜;
云检测网络建立模块:用以基于卷积神经网络和注意力机制建立云检测网络,所述云检测网络包括输入模块、编解码交互模块以及输出模块;
所述输入模块用于接收遥感影像并输出初始输入图像;
所述编解码交互模块连续设有多个交互层,每个交互层均包括交互层编码器注意力模块、编解码器注意力交互模块、上采样模块、卷积单元;
在每个交互层中:所述卷积单元提取输入图像的特征,并输出特征;所述交互层编码器注意力模块接收所述特征并输出交互层编码特征;所述上采样模块接收所述交互层编码特征,扩充通道后输出上采样特征;所述编解码器注意力交互模块接收所述上采样特征,并输出解码特征;
当该交互层为第一层交互层时,卷积单元提取初始输入图像的特征;
当该交互层为第N层交互层时,卷积单元提取上一层交互层的交互层编码特征作为输入图像的特征;且该第N层交互层的解码特征输入上一层交互层的上采样模块;N为大于1的正整数;
所述输出模块用于接收第一层交互层输出的解码特征并输出云概率图;
结果输出模块:用以将所述遥感影像输入云检测网络,输出云概率图;
损失计算模块:用以基于交叉熵损失建立监督损失模块,并将所述云掩膜和所述云概率图输入该监督损失模块,计算监督损失;
模型优化模块:用以对所述遥感影像预处理,得到训练集和测试集;基于反向传播法采用训练集和测试集重复结果输出模块与损失计算模块的操作,迭代更新云检测网络,得到优化云检测网络;
优化结果输出模块:用以获取待检测有云遥感影像并输入优化云检测网络,输出云检测图。
9.一种计算机设备,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现所述权利要求1至权利要求7其中任一方法所述的步骤。
10.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述权利要求1至7其中任一所述的方法的步骤。
CN202311579269.5A 2023-11-24 2023-11-24 基于编解码注意力交互的云检测方法、系统、介质及设备 Active CN117292276B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311579269.5A CN117292276B (zh) 2023-11-24 2023-11-24 基于编解码注意力交互的云检测方法、系统、介质及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311579269.5A CN117292276B (zh) 2023-11-24 2023-11-24 基于编解码注意力交互的云检测方法、系统、介质及设备

Publications (2)

Publication Number Publication Date
CN117292276A CN117292276A (zh) 2023-12-26
CN117292276B true CN117292276B (zh) 2024-01-30

Family

ID=89252051

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311579269.5A Active CN117292276B (zh) 2023-11-24 2023-11-24 基于编解码注意力交互的云检测方法、系统、介质及设备

Country Status (1)

Country Link
CN (1) CN117292276B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111738124A (zh) * 2020-06-15 2020-10-02 西安电子科技大学 基于Gabor变换和注意力的遥感图像云检测方法
CN114220001A (zh) * 2021-11-25 2022-03-22 南京信息工程大学 基于双注意力神经网络的遥感影像云与云阴影检测方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA3125794A1 (en) * 2019-02-06 2020-08-13 Farmers Edge Inc. Shadow and cloud masking for agriculture applications using convolutional neural networks

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111738124A (zh) * 2020-06-15 2020-10-02 西安电子科技大学 基于Gabor变换和注意力的遥感图像云检测方法
CN114220001A (zh) * 2021-11-25 2022-03-22 南京信息工程大学 基于双注意力神经网络的遥感影像云与云阴影检测方法

Also Published As

Publication number Publication date
CN117292276A (zh) 2023-12-26

Similar Documents

Publication Publication Date Title
CN111986099B (zh) 基于融合残差修正的卷积神经网络的耕地监测方法及系统
CN108428220B (zh) 静止轨道卫星序列遥感影像海岛礁区域自动几何校正方法
CN110674688A (zh) 用于视频监控场景的人脸识别模型获取方法、系统和介质
CN110765912B (zh) 一种基于统计约束和Mask R-CNN的SAR图片船舶目标检测方法
CN111640116B (zh) 基于深层卷积残差网络的航拍图建筑物分割方法及装置
CN113888547A (zh) 基于gan网络的无监督域自适应遥感道路语义分割方法
CN114022408A (zh) 基于多尺度卷积神经网络的遥感图像云检测方法
CN114676773A (zh) 基于sar数据的北极海冰分类方法
CN113239736A (zh) 一种基于多源遥感数据的土地覆盖分类标注图获取方法、存储介质及系统
CN113408398A (zh) 基于通道注意力及概率上采样的遥感图像云检测方法
CN113516084B (zh) 高分辨率遥感影像半监督分类方法、装置、设备及介质
Long et al. Dual self-attention Swin transformer for hyperspectral image super-resolution
CN113657225B (zh) 一种目标检测方法
CN115984714B (zh) 一种基于双分支网络模型的云检测方法
Shit et al. An encoder‐decoder based CNN architecture using end to end dehaze and detection network for proper image visualization and detection
US20230408682A1 (en) Method and system for lulc guided sar visualization
CN116665053B (zh) 顾及阴影信息的高分辨遥感影像建筑物识别方法及系统
CN115861823B (zh) 一种基于自监督深度学习的遥感变化检测方法和装置
CN117292276B (zh) 基于编解码注意力交互的云检测方法、系统、介质及设备
CN117058367A (zh) 高分辨率遥感影像建筑物语义分割方法及装置
Raj et al. A novel Ship detection method from SAR image with reduced false alarm
Li et al. Super resolution for single satellite image using a generative adversarial network
CN117036982B (zh) 海上养殖区的光学卫星图像处理方法和装置、设备和介质
CN115909045B (zh) 一种基于对比学习的two-stage滑坡图谱特征智能识别方法
CN114758387B (zh) 基于单帧rgb图像的轻量级人脸反欺诈方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant