CN116091764A

CN116091764A - 一种基于融合变换网络的云图像分割方法

Info

Publication number: CN116091764A
Application number: CN202211698791.0A
Authority: CN
Inventors: 刘爽; 张家峰; 张重
Original assignee: Tianjin Normal University
Current assignee: Tianjin Normal University
Priority date: 2022-12-28
Filing date: 2022-12-28
Publication date: 2023-05-09

Abstract

本发明实施例公开了一种基于融合变换网络的云图像分割方法，该方法包括：构建特征提取模块，得到训练云图像的多尺度局部特征；构建变换网络模块，得到训练云图像的多尺度长距离依赖关系序列；构建特征融合模块，得到训练云图像的跨尺度序列；构建分割掩码生成模块，训练云图像的分割掩码；构建损失计算模块，利用损失值对云图像分割模型进行优化，得到最优云图像分割模型；利用最优云图像分割模型，得到云图像的分割结果。本发明融合卷积神经网络和变换网络，从云图像中同时学习多尺度的局部信息和长距离依赖关系，进一步提高了云图像的分割的正确率。

Description

一种基于融合变换网络的云图像分割方法

技术领域

本发明属于计算机视觉、模式识别、人工智能领域，具体涉及一种基于融合变换网络的云图像分割方法。

背景技术

云图像分割技术可以实现对云量的估计，广泛用于环境检测，天气预报等领域，因此受到了学术界和工业界的广泛关注。它主要研究将云从图像中分割出的方法。然而由于云的边缘模糊、形状各异，云图像分割技术面临着巨大的挑战。

近年来，随着云图像采集设备的发展，人们提出了很多云图像分割算法。Long等人提出了一种基于颜色阈值的云图像分割方法，将云图像的红蓝通道的比值作为云图像分割的固定阈值。此后，Heinle等人用云图像红蓝通道的差值取代比值作为云图像分割的固定阈值。Li等人提出了一种固定阈值和自适应阈值的混合方法，用于单峰和双峰云图像分割。Liu等人首先生成高置信度的标签作为硬约束种子，然后利用图割方法对云图像进行分割。

由于卷积神经网络具有强大的表征能力，因此被用于云图像分割领域，该类方法通常具有编码器-解码器结构。例如，Dev等人提出了CloudSegNet，它采用卷积、最大池化层和上采样作为编码-解码器架构的轻型版本，用于白天和夜间的云图像分割。Xie等人提出了SegCloud，通过在上采样操作中引入池化指数，有效地恢复了池化对云图像分割的损失。Shi等人提出EFCN，通过应用跳跃连接和直方图均衡化提高分割性能。Zhang等人将多尺度策略和注意力机制融合到编码器-解码器结构中，从而学习判别特征，以提高分割性能。Zhou等人提出TL-DeepLabV3+用于云图像分割任务，该方法通过使用迁移学习来克服训练云图像样本数量少的缺点。

由于卷积滤波器固有的局部属性，该方法很难对长距离的依赖关系进行建模。在自然语言处理领域中变换网络对长距离依赖关系具有较强的建模能力。因此研究人员将变换网络应用到计算机视觉领域。视觉变换网络(Vision Transformer)证明了变换网络在图像分类中可以超越基于卷积神经网络的方法。Zheng等人将语义分割任务变换为一个序列到序列的预测任务，并证明了变换网络在分割任务中的可行性。Petit等人将变换网络插入到U-Net中以获得长距离的依赖性。

以上这些基于变换网络的方法都是利用单一尺度的特征建模长距离依赖关系，忽略了多尺度信息，从而导致产生的分割结果不准确。

发明内容

本发明的目的是要解决对云图像的长距离建模不充分对云图像分割结果影响较大的技术问题，为此，本发明提供了一种基于融合变换网络的云图像分割方法。

为了实现所述目的，本发明提供了一种基于融合变换网络的云图像分割方法，所述方法包括以下步骤：

步骤S1，利用预训练深度学习模型构建特征提取模块，将训练云图像输入所述特征提取模块，得到所述训练云图像的多尺度局部特征fⁱ；

步骤S2，构建变换网络模块，将所述训练云图像的多尺度局部特征fⁱ输入至所述变换网络模块，利用所述变换网络模块学习不同尺度的长距离依赖关系，得到所述训练云图像的多尺度长距离依赖关系序列

步骤S3，构建特征融合模块，利用所述特征融合模块对于所述训练云图像的多尺度长距离依赖关系序列

进行交互并融合，得到所述训练云图像的跨尺度序列C_i；

步骤S4，将所述跨尺度序列C_i输入所述特征融合模块，得到最终的跨尺度特征C，构建分割掩码生成模块，利用所述分割掩码生成模块得到所述训练云图像的分割掩码；

步骤S5，将所述特征提取模块、变换网络模块、特征融合模块和损失计算模块组成云图像分割模型，构建损失计算模块，将所述训练云图像的分割掩码和所述训练云图像的标签输入到所述损失计算模块中，利用得到的损失值对于所述云图像分割模型进行优化，得到最优云图像分割模型；

步骤S6，在测试阶段，利用所述最优云图像分割模型计算得到输入云图像的最终分割掩码，计算得到所述训练云图像的分割掩码与所述输入云图像的最终分割掩码之间的相似度，结合所述训练云图像的标签得到所述输入云图像的分割结果。

可选地，所述步骤S1包括以下步骤：

步骤S11，确定预训练深度学习模型，并对其进行参数初始化，去掉所述预训练深度学习模型中最后的全局池化层和全连接层，得到所述特征提取模块；

步骤S12，对训练集中的训练云图像进行预处理；

步骤S13，将预处理后得到的训练云图像输入所述特征提取模块中，得到所述训练云图像的多尺度局部特征fⁱ。

可选地，所述步骤S2包括以下步骤：

步骤S21，将所述训练云图像的多尺度局部特征fⁱ转化为多尺度序列Eⁱ；

步骤S22，基于层标准化模块、多头自注意力模块、残差结构和多层感知机模块，构建变换网络层；

步骤S23，利用N层变换网络层构建得到所述变换网络模块；

步骤S24，将所述多尺度序列Eⁱ输入至所述变换网络模块，利用所述变换网络模块对所述多尺度序列Eⁱ构建不同尺度的长距离依赖关系，得到所述训练云图像的多尺度长距离依赖关系序列

可选地，所述多尺度长距离依赖关系序列

表示为：

其中，

表示第i个尺度的序列Eⁱ在第n层变换网络层的输出，L表示序列的个数，D表示每个序列的维度，LN表示层标准化模块，MLP表示多层感知机模块，MSA表示多头自注意力模块，

表示第n-1层变换网络层中第i个尺度输出的序列。

可选地，所述步骤S3包括以下步骤：

步骤S31，基于层标准化模块、多头互注意力模块、残差结构和多层感知机模块，构建所述特征融合模块；

步骤S32，利用所述特征融合模块对于所述训练云图像的多尺度长距离依赖关系序列

进行交互并融合，得到所述训练云图像的跨尺度序列Ci。

可选地，所述训练云图像的第i个跨尺度序列C_i表示为：

C_i＝Cat(Hi^,Hⁱ⁺¹),(i＝1,2)

其中，C_i∈R^2L×D表示第i个跨尺度序列，Cat为串联操作，MCA表示多头互注意力模块，

表示第i个尺度长距离依赖关系序列，

表示第i+1个尺度长距离依赖关系序列。

可选地，所述步骤S4包括以下步骤：

步骤S41，将跨尺度序列C₁和C₂输入所述特征融合模块，得到最终的跨尺度特征C；

步骤S42，利用重塑、卷积和上采样模块构建得到分割掩码生成模块；

步骤S43，将最终的跨尺度特征C输入至所述分割掩码生成模块中，利用所述分割掩码生成模块将所述最终的跨尺度特征C转化为所述训练云图像的分割掩码。

可选地，所述步骤S5包括以下步骤：

步骤S51，将所述特征提取模块、变换网络模块、特征融合模块和损失计算模块组成云图像分割模型；

步骤S52，构建损失计算模块，将所述训练云图像的分割掩码和所述训练云图像的标签输入到所述损失计算模块中，利用所述损失计算模块计算所述训练云图像的分割掩码的损失值；

步骤S53，利用所述损失值对所述云图像分割模型进行优化，得到最优云图像分割模型。

可选地，所述损失函数Loss表示为：

其中，T表示所述训练云图像中像素的总数量，u_i为所述训练云图像的第i个像素的真实标签，当所述训练云图像的第i个像素的类别为云时，u_i＝1，否则u_i＝0，p_i表示所述训练云图像的分割掩码中第i个像素的类别，当所述训练云图像的分割掩码中第i个像素的类别为云时，p_i＝1，否则p_i＝0。

本发明的有益效果为：本发明通过卷积神经网络学习了云图像的多尺度局部特征，再利用变换网络对多尺度局部特征建模长距离依赖关系，从而实现同时学习多尺度局部信息和长距离依赖关系，改善了特征的表示能力，提高云图像分割的准确率。

需要说明的是，本发明得到了国家自然科学基金项目No.62171321，天津市自然科学基金重点项目No.20JCZDJC00180的资助。

附图说明

图1是根据本发明一实施例的一种基于融合变换网络的云图像分割方法的流程图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明了，下面结合具体实施方式并参照附图，对本发明进一步详细说明。应该理解，这些描述只是示例性的，而并非要限制本发明的范围。此外，在以下说明中，省略了对公知结构和技术的描述，以避免不必要地混淆本发明的概念。

图1是根据本发明一实施例的一种基于融合变换网络的云图像分割方法的流程图，下面以图1为例来说明本发明的一些具体实现流程，如图1所示，所述基于融合变换网络的云图像分割方法包括以下步骤：

步骤S1，利用预训练深度学习模型构建特征提取模块，将训练云图像输入所述特征提取模块，得到所述训练云图像的多尺度局部特征fi；

进一步地，所述步骤S1包括以下步骤：

在本发明一实施例中，所采用的预训练深度学习模型可以为ResNet-50(BiT)，选择该模型中最后一个全局池化层之前的模型成分，即去掉所述预训练深度学习模型中最后的全局池化层和全连接层，剩余的模型部分组成特征提取模块。其中，所述特征提取模块由3个模块组成，分别命名为Stage1，Stage2和Stage3，特征提取模块分别在Stage1，Stage2和Stage3可以产生不同尺度的特征。

步骤S12，对训练集中的训练云图像进行预处理；

在本发明一实施例中，对所述训练云图像进行的预处理包括：将训练云图像随机水平翻转，概率可以设置为0.5，并把所述训练云图像所有的像素按比例缩小至预设范围内，比如0到1之间，然后将所述训练云图像中的每个像素值减去所述训练云图像的像素平均值，再除以所述训练云图像的像素方差。

在本发明一实施例中，所述多尺度局部特征

即

和

分别来自所述特征提取模块中Stage1，Stage2和Stage3的输出。其中，H是所述训练云图像的高，W是所述训练云图像的宽，256·2^i-1为训练云图像第i个尺度的特征中通道的数量。

在本发明一实施例中，H＝512，W＝512。

进一步地，所述步骤S2包括以下步骤：

步骤S21，将所述训练云图像的多尺度局部特征fi转化为多尺度序列Eⁱ；

在本发明一实施例中，可首先将训练云图像的多尺度局部特征fi使用大小为

的方格均匀划分为L个特征块，其中，每个特征块的大小为

之后将每个特征块展开为一维向量，最后利用线性层将一维向量的维度转换为D，所述训练云图像的多尺度局部特征fi经过上述步骤可转化为L个多尺度序列Eⁱ∈R^L×D，其中，P为一正整数，用于控制划分方格的大小。

在本发明一实施例中，D＝768。

在本发明一实施例中，P＝8，L＝4096，所述训练云图像的多尺度序列Eⁱ∈R^4096×768，即E¹,E²,E³∈R^4096×768。

其中，所述层标准化模块、多头自注意力模块、残差结构和多层感知机模块为本领域常用的计算模块，本公开对其不做过多介绍。

在该步骤中，首先利用层标准化模块进行数据分布标准化以加速模型收敛，再利用多头自注意力模块学习全局的依赖关系，最后利用多层感知机模块来减少参数的数量，此外，还使用残差结构来缓解梯度消失或爆炸问题。

步骤S23，利用N层变换网络层构建得到所述变换网络模块；

在本发明一实施例中，N＝2。

其中，所述N层变换网络层串联得到所述变换网络模块，比如当N＝2时，第一层变换网络层的输出连接第二层变换网络层的输入，以得到所述变换网络模块。

在本发明一实施例中，所述多尺度长距离依赖关系序列

可表示为：

其中，

表示第n-1层变换网络层中第i个尺度输出的序列，当n＝1时，

在本发明一实施例中，所述多头自注意力模块由多个单独的自注意力模块组成，所述第i个尺度的序列Eⁱ在第n层变换网络层中多头自注意力模块的输出可表示为：

其中，

表示第n层变换网络层的输入在经历第一次层标准化模块后的输出，M为独立的自注意力模块的个数，

为所述第i个尺度的序列Eⁱ在第n层变换网络层中第m个独立自注意力模块的输出，

为单独的线性层中的训练参数，d表示每个独立自注意力模块输出的维度。

在本发明一实施例中，M＝12，d＝768。

在本发明一实施例中，所述第i个尺度的序列Eⁱ在第n层变换网络层中第m个独立自注意力模块的输出可表示为：

其中，

softmax为激活函数，

分别为三个单独的线性层中的训练参数。

进行交互并融合，得到所述训练云图像的跨尺度序列C_i；

进一步地，所述步骤S3包括以下步骤：

在该步骤中，首先利用层标准化模块进行数据分布标准化以加速模型收敛，再利用多头互注意力模块学习全局的依赖关系，最后利用多层感知机模块来减少参数的数量，此外，还使用残差结构来缓解梯度消失或爆炸问题。

进行交互并融合，得到所述训练云图像的跨尺度序列C_i。

在本发明一实施例中，所述训练云图像的第i个跨尺度序列C_i可表示为：

C_i＝Cat(Hⁱ,Hⁱ⁺¹),(i＝1,2)

表示第i个尺度长距离依赖关系序列，

表示第i+1个尺度长距离依赖关系序列。

在本发明一实施例中，所述多头互注意力模块由多个单独的互注意力模块组成，所述第i个尺度长距离依赖关系序列

和第i+1个尺度长距离依赖关系序列

在多头互注意力模块的输出可表示为：

其中，

M为独立的互注意力模块的个数，

为所述第i个尺度长距离依赖关系序列

和第i+1个尺度长距离依赖关系序列

在第m个独立互注意力模块的输出，

为单独的线性层中的训练参数。

在本发明一实施例中，M＝12。

在本发明一实施例中，所述第i个尺度长距离依赖关系序列

和第i+1个尺度长距离依赖关系序列

在第m个独立互注意力模块的输出可表示为：

其中，

softmax为激活函数，

分别为三个单独的线性层中的训练参数。

进一步地，当i＝1、2时，所述步骤S4包括以下步骤：

在本发明一实施例中，C∈R^4L×D。

其中，在构建所述分割掩码生成模块时，可将所述重塑、卷积和上采样模块顺次连接。

进一步地，所述步骤S5包括以下步骤：

在本发明一实施例中，在TLCD数据库中进行训练时，构建的损失计算模块的损失函数Loss可表示为：

在本发明一实施例中，T＝262144。

该步骤中，可借助随机梯度下降法进行迭代计算以对所述云图像分割模型进行优化。

其中，所述训练云图像的标签是已知的真实分割结果。

其中，所述训练云图像的分割掩码是云图像分割模型预测的分割结果。

以网上公开的云图像分割大型数据库作为测试对象，比如在TLCD数据库上测试时，本发明云图像分割正确分割率达到78.67％(F-score)，83.12％(Recall)，77.60％(Precision)，91.38％(Accuracy)和71.63％(IoU)。本发明通过卷积神经网络学习了云图像的多尺度局部特征，再利用变换网络对多尺度局部特征建模长距离依赖关系，从而实现同时学习多尺度局部信息和长距离依赖关系，很大程度地提高了云图像分割的正确率，由此可见本发明方法的有效性。

应当理解的是，本发明的上述具体实施方式仅仅用于示例性说明或解释本发明的原理，而不构成对本发明的限制。因此，在不偏离本发明的精神和范围的情况下所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。此外，本发明所附权利要求旨在涵盖落入所附权利要求范围和边界、或者这种范围和边界的等同形式内的全部变化和修改例。