CN117292276B

CN117292276B - 基于编解码注意力交互的云检测方法、系统、介质及设备

Info

Publication number: CN117292276B
Application number: CN202311579269.5A
Authority: CN
Inventors: 李俊; 胡成杰; 盛庆红; 王博; 凌霄; 徐嘉蔚
Original assignee: Nanjing University of Aeronautics and Astronautics
Current assignee: Nanjing University of Aeronautics and Astronautics
Priority date: 2023-11-24
Filing date: 2023-11-24
Publication date: 2024-01-30
Anticipated expiration: 2043-11-24
Also published as: CN117292276A

Abstract

本发明公开了一种基于编解码注意力交互的云检测方法、系统、介质及设备，基于卷积神经网络与注意力机制建立云检测网络，该云检测融合了编码器注意力模块以及编解码器注意力交互模块，获取遥感影像后处理为测试集和训练集对云检测网络进行训练，得到优化云检测网络，将遥感影像输入优化云检测网络后输出优化云检测图。相较于现有技术，本发明一种检测速度快、检测精度高的基于编解码注意力交互的云检测方法、系统、介质及设备具有检测速度快、检测精度高的特点。

Description

基于编解码注意力交互的云检测方法、系统、介质及设备

技术领域

本发明涉及图像处理技术领域，具体涉及一种基于编解码注意力交互的云检测方法、系统、介质及设备。

背景技术

遥感图像通常指代由遥感卫星获得并记录各种地物电磁波大小的胶片或照片，相比于普通图像，其具有较好的空间分辨率，包含的细节信息更多，因此遥感图像被广泛应用于多个领域。随着越来越多的遥感卫星发射升空，遥感卫星获取的海量数据为植被健康监测、灾害监测和土地覆盖分类提供了丰富的信息。然而，由云遮挡造成的遥感传输图像的不准确性问题尤为突出。根据国际卫星云气候计划ISCCP (International Satellite CloudC1 imatology Project) 提供的全球云量数据显示，全球有超过60%以上的区域常常被云覆盖。可见，云一直是影响遥感影像质量的重要因素，因此云检测是遥感影像应用之前必不可少的一步。

传统上，云检测的研究方法主要是多波段阈值和纹理分析方法。多波段阈值法通常是利用云在不同波段与地物表现出来的差异性，进行云与地物的区分，例如通过近红外通道利用云的高反射和低温性进行云与地物的区分。而纹理分析通常是将云图像转换至不同的颜色空间进行纹理特征的提取，进而实现有效的云与地物分离。这些传统方法通常会花费大量时间去调参以及选取阈值，检测速度慢。同时在特定区域，如薄云区或云的边界区域，由于与地物有较大相似度，同样多波段阈值法与纹理分析法很难做出有效的云与地物分离。

近年来，深度卷积神经网络在计算机视觉领域取得了巨大的成功，通过强大的特征表达能力，成为图像处理多领域的主要研究方法。相较于传统云检测方法，现有的卷积神经网络云检测算法性能虽大幅提升，然而基于深度学习的方法所使用的卷积网络只能感知图像的局部特征。在一些关键区域，如薄云、云边界区域，仍然表现出较差的检测性能。这些区域由于特征不太明显集中或云与某些高亮地物相似度太高，导致算法难以有效的进行云与地物分离，容易产生错分现象，检测精度不高。

发明内容

发明目的：本发明目的是提供一种检测速度快、检测精度高的基于编解码注意力交互的云检测方法、系统、介质及设备。

技术方案：本发明所述的一种基于编解码注意力交互的云检测方法，包括以下步骤：

1）获取遥感影像，并从该遥感影像上标记出对应的云掩膜；

2）基于卷积神经网络和注意力机制建立云检测网络，所述云检测网络包括输入模块、编解码交互模块以及输出模块；

所述输入模块用于接收遥感影像并输出初始输入图像；

所述编解码交互模块连续设有多个交互层，每个交互层均包括交互层编码器注意力模块、编解码器注意力交互模块、上采样模块、卷积单元；

在每个交互层中：所述卷积单元提取输入图像的特征，并输出特征；所述交互层编码器注意力模块接收所述特征并输出交互层编码特征；所述上采样模块接收所述交互层编码特征，扩充通道后输出上采样特征；所述编解码器注意力交互模块接收所述上采样特征，并输出解码特征；

当该交互层为第一层交互层时，卷积单元提取初始输入图像的特征；

当该交互层为第N层交互层时，卷积单元提取上一层交互层的交互层编码特征作为输入图像的特征；且该第N层交互层的解码特征输入上一层交互层的上采样模块；N为大于1的正整数；

所述输出模块用于接收第一层交互层输出的解码特征并输出云概率图；

3）将所述遥感影像输入云检测网络，输出云概率图；

4）基于交叉熵损失建立监督损失模块，并将所述云掩膜和所述云概率图输入该监督损失模块，计算监督损失；

5）对所述遥感影像预处理，得到训练集和测试集；

基于反向传播法采用训练集和测试集重复步骤3）至4），迭代更新云检测网络，得到优化云检测网络；

6）获取待检测有云遥感影像并输入优化云检测网络，输出云检测图。

进一步的，步骤2）中，所述第一层交互层与所述输入模块、输出模块连接；所述输入模块包括初始编码器注意力模块，该初始编码器注意力模块输出的初始编码特征作为第一交互层的卷积单元初始输入图像；第一层交互层的解码特征与输入模块的初始编码特征输入输出模块。

进一步的，所述注意力机制包括全链接层操作、特征投影操作、投影特征标准化操作、注意力交互操作、特征拼接操作；

其中，所述全链接层操作用于将输入的特征分解为查询特征、键特征、值特征；

所述特征投影操作用于将所述查询特征、键特征、值特征分别投影为查询投影特征、键投影特征、值投影特征；

所述投影特征标准化操作包括方向标准化操作以及长度标准化操作，所述方向标准化操作用于将所述查询投影特征和所述键投影特征按通道维度转化为单位方向向量，得到方向查询投影特征和方向键投影特征；所述长度标准化操作用于将所述键投影特征基于通道维度求向量的模，得到长度键投影特征；

所述注意力交互操作用于将所述方向查询投影特征和方向键投影特征做矩阵乘法，得到相似性值后与长度键投影特征相乘，特征归一化后得到包含相似性和重要性的注意力图，之后将注意力图与值投影特征做矩阵乘法得到全局注意力图；利用深度可分离卷积提取所述输入的特征的局部注意力得到局部注意力图，将全局注意力图、局部注意力图与所述输入的特征相加，得到融合注意力图；所述融合注意力图包括编码特征和解码特征。

进一步的，所述长度标准化操作通过SoftMax函数将所述键投影特征在空间维度归一化，得到向量长度的相对大小。

进一步的，所述交互层编码器注意力模块及初始编码器注意力模块均通过对输入的特征依次进行全链接层操作、特征投影操作、投影特征标准化操作、注意力交互操作的步骤输出交互层编码特征或初始编码特征；

编解码器注意力交互模块通过对输入的特征依次进行特征拼接操作、特征投影操作、投影特征标准化操作、注意力交互操作的步骤输出解码特征；

所述特征拼接操作为：分别对输入的所述相邻上一层交互层的交互层编码特征和上采样特征进行全链接层操作，保留上采样特征的查询特征，并在键特征、值特征上进行特征拼接。

进一步的，步骤4）中所述监督损失通过下式计算：

L=；

式中，L表示监督损失；y_i表示第i个云掩膜记录的真值；p_i表示第i个网络预测的云概率值；N表示像素总数。

进一步的，步骤5）中，所述训练集包括成对的训练云掩膜和训练影像；所述测试集包括成对的测试云掩膜和测试影像；所述预处理包括：将遥感影像划分为训练影像和测试影像，在训练影像上标记云掩膜形成训练云掩膜，在测试影像上标记云掩膜形成测试云掩膜，并按对组成集合。

本发明所述的基于编解码注意力交互的云检测系统，包括以下模块：

影像获取模块：用以获取遥感影像，并从该遥感影像上标记出对应的云掩膜；

云检测网络建立模块：用以基于卷积神经网络和注意力机制建立云检测网络，所述云检测网络包括输入模块、编解码交互模块以及输出模块；

所述输入模块用于接收遥感影像并输出初始输入图像；

结果输出模块：用以将所述遥感影像输入云检测网络，输出云概率图；

损失计算模块：用以基于交叉熵损失建立监督损失模块，并将所述云掩膜和所述云概率图输入该监督损失模块，计算监督损失；

模型优化模块：用以对所述遥感影像预处理，得到训练集和测试集；基于反向传播法采用训练集和测试集重复步骤3）至4），迭代更新云检测网络，得到优化云检测网络；

优化结果输出模块：用以获取待检测有云遥感影像并输入优化云检测网络，输出云检测图。

本发明所述的计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现所述方法的步骤。

本发明所述的计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现所述的方法的步骤。

有益效果：本发明具有如下显著效果：1、本发明检测精度高；通过在编码阶段融合输入的全局和局部特征，在解码阶段通过与编码器交互，融合编解码各阶段的全局和局部特征，并对云检测网络进行监督学习，实现更加准确的云检测。2、本发明检测速度快；基于注意力机制以及卷积神经网络建立云检测网络，通过计算机深度学习实现，不需要花费大量时间去调参以及选取阈值，检测速度快。

附图说明

图1为本发明中云检测网络结构图；

图2为本发明中编码器注意力模块结构示意图；

图3为本发明中编解码器注意力交互模块的结构示意图。

具体实施方式

下面结合附图和具体实施方式，进一步阐明本发明。

请参阅图1所示，本发明公开了一种基于编解码注意力交互的云检测方法，所述方法包括以下步骤：

1）获取遥感影像，并从该遥感影像上标记出对应的云掩膜。

2）基于卷积神经网络和注意力机制建立云检测网络，所述云检测网络包括输入模块、编解码交互模块以及输出模块。

所述输入模块用于接收遥感影像并输出初始输入图像。

所述编解码交互模块连续设有多个交互层，每个交互层均包括交互层编码器注意力模块、编解码器注意力交互模块、上采样模块、卷积单元。

在每个交互层中：所述卷积单元提取输入图像的特征，并输出特征；所述交互层编码器注意力模块接收所述特征并输出交互层编码特征；所述上采样模块接收所述交互层编码特征，扩充通道后输出上采样特征；所述编解码器注意力交互模块接收所述上采样特征，并输出解码特征。

当该交互层为第一层交互层时，卷积单元提取初始输入图像的特征。

当该交互层为第N层交互层时，卷积单元提取上一层交互层的交互层编码特征作为输入图像的特征；且该第N层交互层的解码特征输入上一层交互层的上采样模块；N为大于1的正整数。

所述输出模块用于接收第一层交互层输出的解码特征并输出云概率图。

所述第一层交互层与所述输入模块、输出模块连接；所述输入模块包括初始编码器注意力模块，该初始编码器注意力模块输出的初始编码特征作为第一交互层的卷积单元初始输入图像；第一层交互层的解码特征与输入模块的初始编码特征输入输出模块。

3）将所述遥感影像输入云检测网络，输出云概率图。

4）基于交叉熵损失建立监督损失模块，并将所述云掩膜和所述云概率图输入该监督损失模块，计算监督损失。监督损失通过下式计算：

L=；

5）对所述遥感影像预处理，得到训练集和测试集。所述训练集包括成对的训练云掩膜和训练影像；所述测试集包括成对的测试云掩膜和测试影像；所述预处理包括：将遥感影像划分为训练影像和测试影像，在训练影像上标记云掩膜形成训练云掩膜，在测试影像上标记云掩膜形成测试云掩膜，并按对组成集合。

基于反向传播法采用训练集和测试集重复步骤3）至4），迭代更新云检测网络，得到优化云检测网络。

其中，请参阅图2至3所示，所述注意力机制包括全链接层操作、特征投影操作、投影特征标准化操作、注意力交互操作、特征拼接操作。具体介绍如下：

所述全链接层操作用于将输入的特征分解为查询特征、键特征、值特征。

所述特征投影操作用于将所述查询特征、键特征、值特征分别投影为查询投影特征、键投影特征、值投影特征。

所述投影特征标准化操作包括方向标准化操作以及长度标准化操作，所述方向标准化操作用于将所述查询投影特征和所述键投影特征按通道维度转化为单位方向向量，得到方向查询投影特征和方向键投影特征，用来描述特征的方向性。所述长度标准化操作用于将所述键投影特征基于通道维度求向量的模，得到长度键投影特征。

请参阅图2所示，所述交互层编码器注意力模块及初始编码器注意力模块均通过对输入的特征依次进行全链接层操作、特征投影操作、投影特征标准化操作、注意力交互操作的步骤输出交互层编码特征或初始编码特征。所述交互层编码器注意力模块及初始编码器注意力模块均利用全局自注意力机制综合全局特征，使得每个像素点都包含所有像素点的信息，同时融合局部特征，使编码器注意力模块自动学习最优参数。

请参阅图3所示，所述编解码器注意力交互模块通过对输入的特征依次进行特征拼接操作、特征投影操作、投影特征标准化操作、注意力交互操作的步骤输出解码特征。所述特征拼接操作为：分别对输入的所述相邻上一层交互层的交互层编码特征和上采样特征进行全链接层操作，保留上采样特征的查询特征，并在键特征、值特征上进行特征拼接。编解码器注意力交互模块利用交互层编码特征来获取全局注意力，有助于经过多层编解码后的解码器理解浅层特征，可使解码器部分能够根据目标自动学习最优参数。

本实施例中，所述长度标准化操作通过SoftMax函数将所述键投影特征在空间维度归一化，得到向量长度的相对大小。所述特征拼接操作在行上进行拼接。n=3。

步骤2）中，上采样模块包括一个深度可分离卷积层操作、一个全链接层操作和一个像素重组操作，先将前一模块输出的特征（下一个交互层的解码特征和/或此交互层的编码特征）利用深度可分离卷积投影到指定通道数n，再进行全链接层操作，输出得到r²n个通道的特征，再将该特征通过像素重新组合，得到长和宽扩到r倍，通道数变为n的上采样特征。

步骤5）中，对遥感影像的预处理包括：影像划分、建立训练集、建立测试集。影像划分为：将遥感影像划分为训练集和测试集。建立训练集为：通过人工目视解译标记训练影像的云掩膜形成训练云掩膜，分割训练影像和训练云掩膜得到多个训练影像块和多个训练云掩膜块；将多个训练集影像块放入训练数据文件夹，对应的多个训练云掩膜块放入训练标签文件夹，得到训练集。建立测试集为：通过人工目视解译标记测试影像的云掩膜形成测试云掩膜；将测试影像放入测试数据文件夹，对应的测试云掩膜放入测试标签文件夹，得到测试集。

本实施例中，获取全球分布的50景Landsat 8遥感影像，合成RGB波段数据。首先，将其中40景划为训练影像，10景划为测试影像。其次，通过人工目视解译对所有训练影像和测试影像标记云掩膜，得到训练云掩膜和测试云掩膜。

将测试影像块放入测试文件夹，对应的测试云掩膜块放到测试标签文件夹，得到测试集。通过python脚本，训练影像和训练云掩膜按512x512的窗口、步长384x384成对裁剪，训练影像块放入训练文件夹，对应的训练云掩膜块放到训练标签文件夹，得到共计31242组训练切片数据，即训练集。

在计算机内训练云检测网络，计算机的配置为：AMDRyzen9 3950X 16核处理器，Nvidia GeForceRTX3080图形处理器，主频 3.49GHz，内存64GB，操作系统为windows10。基于编解码注意力交互的遥感影像云检测网络的实现基于Pytorch2.0.1深度学习框架工具包。

训练过程中，云检测网络的所有卷积核的初始化采用均值为0、方差为0.01的高斯分布，偏置的初始化采用固定值 0.0，采用 Adam 优化算法，批次大小为2，初始学习率设为0.0002，前10000次迭代保持不变，10000次后每迭代100次减小为0.98，实际训练时每迭代10轮，进行一次模型精度验证，迭代50轮后云检测网络模型基本收敛，得到优化云检测网络。

其中，重复进行步骤4），对云概率图和人工标记的云掩膜求交叉熵损失。使用交叉熵作为损失函数，将云概率图和云掩膜代入损失函数。多次训练，在编码阶段完成下采样过程，通过设置卷积步长来降低图像分辨率，在解码阶段完成上采样过程，上采样过程采用卷积提升图像分辨率。对遥感影像生成的云概率图进行监督，提升所述基于编解码注意力交互的遥感影像云检测方法在不同分辨率上的云检测能力。通过反向传播算法，优化网络参数，直至得到优化云检测网络。

本发明云检测网络的整体结构基于U-Net结构，利用输入图像的全局特征和局部特征检测遥感图像中的云，建立有效的云检测网络，云检测精度高。同时，本发明所采用的云检测方法可推广到其他同类型遥感影像的云检测任务。根据任务情况判断云检测网络是否需要进行重新训练。若需要则建立有云遥感影像和云掩膜对的训练集，对云检测网络重新进行训练，即可得到适用于执行该任务的云检测网络。

本发明还公开了一种基于编解码注意力交互的云检测系统，包括以下模块：

所述输入模块用于接收遥感影像并输出初始输入图像；

本发明还公开了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现所述方法的步骤。

本发明还公开了一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现所述的方法的步骤。

综上，本发明一种基于编解码注意力交互的云检测方法、系统、介质及设备具有检测速度快、检测精度高的特点。

Claims

1.一种基于编解码注意力交互的云检测方法，其特征在于，所述方法包括以下步骤：

1）获取遥感影像，并从该遥感影像上标记出对应的云掩膜；

所述输入模块用于接收遥感影像并输出初始输入图像；

3）将所述遥感影像输入云检测网络，输出云概率图；

5）对所述遥感影像预处理，得到训练集和测试集；

2.根据权利要求1所述的基于编解码注意力交互的云检测方法，其特征在于，步骤2）中，所述第一层交互层与所述输入模块、输出模块连接；所述输入模块包括初始编码器注意力模块，该初始编码器注意力模块输出的初始编码特征作为第一交互层的卷积单元初始输入图像；第一层交互层的解码特征与输入模块的初始编码特征输入输出模块。

3.根据权利要求1所述的基于编解码注意力交互的云检测方法，其特征在于，所述注意力机制包括全链接层操作、特征投影操作、投影特征标准化操作、注意力交互操作、特征拼接操作；

4.根据权利要求3所述的基于编解码注意力交互的云检测方法，其特征在于，所述长度标准化操作通过SoftMax函数将所述键投影特征在空间维度归一化，得到向量长度的相对大小。

5.根据权利要求3所述的基于编解码注意力交互的云检测方法，其特征在于，所述交互层编码器注意力模块及初始编码器注意力模块均通过对输入的特征依次进行全链接层操作、特征投影操作、投影特征标准化操作、注意力交互操作的步骤输出交互层编码特征或初始编码特征；

所述特征拼接操作为：分别对输入的相邻上一层交互层的交互层编码特征和上采样特征进行全链接层操作，保留上采样特征的查询特征，并在键特征、值特征上进行特征拼接。

6.根据权利要求1所述的基于编解码注意力交互的云检测方法，其特征在于，步骤4）中所述监督损失通过下式计算：

L=；

7.根据权利要求1所述的基于编解码注意力交互的云检测方法，其特征在于，步骤5）中，所述训练集包括成对的训练云掩膜和训练影像；所述测试集包括成对的测试云掩膜和测试影像；所述预处理包括：将遥感影像划分为训练影像和测试影像，在训练影像上标记云掩膜形成训练云掩膜，在测试影像上标记云掩膜形成测试云掩膜，并按对组成集合。

8.一种基于编解码注意力交互的云检测系统，其特征在于，所述系统包括以下模块：

所述输入模块用于接收遥感影像并输出初始输入图像；

模型优化模块：用以对所述遥感影像预处理，得到训练集和测试集；基于反向传播法采用训练集和测试集重复结果输出模块与损失计算模块的操作，迭代更新云检测网络，得到优化云检测网络；

9.一种计算机设备，其特征在于，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现所述权利要求1至权利要求7其中任一方法所述的步骤。

10.一种计算机可读存储介质，其特征在于，其上存储有计算机程序，所述计算机程序被处理器执行时实现所述权利要求1至7其中任一所述的方法的步骤。