CN116206214A

CN116206214A - 一种基于轻量化卷积神经网络和双注意力的自动识别滑坡方法、系统、设备及介质

Info

Publication number: CN116206214A
Application number: CN202310218039.XA
Authority: CN
Inventors: 李卫斌; 孔玉辉; 安炳贞; 王蓉芳; 刘若辰; 尚保卫
Original assignee: Xidian University
Current assignee: Xidian University
Priority date: 2023-03-08
Filing date: 2023-03-08
Publication date: 2023-06-02

Abstract

一种基于轻量化卷积神经网络和双注意力的自动识别滑坡方法、系统、设备及介质，方法包括：对遥感影像进行预处理，获取滑坡遥感影像数据集；搭建Ournetworkframework网络模型；对Ournetwork framework网络模型进行迭代训练，最终保存训练效果最好轮次的权重；对训练好的网络模型进行预测，评价网络的好坏；使用深度学习框架随机生成一个张量，将其送入Ournetworkframework网络模型中，计算FLOPs、参数量、以及模型推理时间；其系统、设备及介质，用于实现种基于轻量化卷积神经网络和双注意力的自动识别滑坡方法；本发明的网络模型是将卷积神经网络的优势和自注意力机制的优势结合起来，创建出轻量化网络模型，在降低模型复杂度的同时，滑坡识别的准确率也以提升。

Description

一种基于轻量化卷积神经网络和双注意力的自动识别滑坡方法、系统、设备及介质

技术领域

本发明涉及自动识别滑坡技术领域，具体涉及一种基于轻量化卷积神经网络和双注意力的自动识别滑坡方法、系统、设备及介质。

背景技术

我国是地质灾害易发国家，其中滑坡是最为常见的地质灾害之一，滑坡灾害对当地人民的生命财产、重要基础设施等构成严重威胁，因此，对滑坡进行识别具有重要意义，目前在滑坡上比较成熟的技术是InSAR技术进行滑坡的早期识别，但由于其传感器成本高、多幅影像不易获取、观测周期长、技术要求高等原因，限制了其在滑坡识别领域的大规模应用。

目前应用在滑坡检测上的图像分类方法大多是基于目前比较成熟的常用网络的改进，比如DawenYu等人提出基于注意力机制的方法对卫星遥感影像进行滑坡检测(Ji S,Yu D,Shen C,et al.Landslidedetection from an open satellite imagery anddigital elevation modeldataset using attention boosted convolutional neuralnetworks[J].Landslides,2020,17(6):1337-1352)，在VGG-Net、ResNet等这些图像分类网络上添加提出的SCAM注意力机制方法提高网络性能；Sameen等人提出使用ResNet进行滑坡检测(Sameen M I,Pradhan B.Landslidedetection using residual networks and thefusion of spectral andtopographic information[J].IEEEAccess,2019,PP(99):114363-114373)，其将光谱与地形信息进行融合，通过增加特征的方法提高检测结果；但以上都是基于网络深度和复杂度都比较高的模型进行改进，以此来提升网络对滑坡识别的性能。

目前，自动识别滑坡方法还存在着以下几点：

1、通过人工目视解译进行滑坡早期识别：该方法需要依据遥感影像色彩、纹理等几何特征，与专家知识、非遥感数据相结合，识别准确度较高，但存在对专家知识依赖性强、人工成本高、效率低等问题。

2、利用InSAR技术进行滑坡的早期识别：由于其传感器成本高、多幅影像不易获取、观测周期长、技术要求高等原因，限制了其在滑坡监测领域的大规模应用。

3、利用深度学习对滑坡进行识别的技术：目前主流技术都还是在网络深度和复杂度都比较高的模型上进行改进，以此来提高对滑坡的识别效果，虽然网络模型性能是提高了，但是这些网络往往计算量巨大，依赖这些基础网络的检测算法很难达到实时运行的要求。

2021年4月发表的EfficientNetV2(TanM,Le Q.Efficientnetv2:Smallermodelsand fastertraining[C]//International conference onmachine learning.PMLR,2021:10096-10106)，是一个轻量化的网络模型，该文提出了改进的渐进学习方法，该方法会根据训练图像的尺寸动态调节正则方法；除此之外，验证了在浅层网络使用深度可分离卷积速度会很慢，因此提出了一个新的网络模块Fused-MBConv应用于浅层网络，以此来提升网络的训练速度，并提升网络的准确率。但因其网络架构是通过神经结构搜索得到的网络架构，并不完全适用于滑坡识别。

发明内容

为了克服上述现有技术的不足，本发明的目的在于提供一种基于轻量化卷积神经网络和双注意力的自动识别滑坡方法、系统、设备及介质，利用Fused-MBConv模块、MBConv模块设计出网络模型的主体框架，以此作为轻量化卷积神经网络的主体部分，在网络模型的主体框架中使用PDC模块来增加网络模型空间感知的全局性，在PDC模块中主要使用了双注意力机制模块，从空间维度和通道维度分别进行自注意力机制，实现全局建模，本发明的Our network framework网络模型是将卷积神经网络的优势和自注意力机制的优势结合起来，创建出一个轻量化的网络模型。

为了实现上述目的，本发明采取的技术方案是：

一种基于轻量化卷积神经网络和双注意力的自动识别滑坡方法，包括以下步骤：

步骤1：对遥感影像进行预处理，获取滑坡遥感影像数据集；

步骤2：搭建Ournetwork framework网络模型；

步骤3：对Ournetwork framework网络模型进行迭代训练，最终保存训练效果最好轮次的权重；

步骤4：对步骤3训练好的网络模型进行预测，分别使用准确率Accuracy、平衡F分数F1、召回率Recall、精确率Precision作为评判网络性能的评价指标，评价网络的好坏；

步骤5：使用深度学习框架随机生成一个张量，将其送入到步骤2得到的Ournetwork framework网络模型中，计算FLOPs、参数量、以及模型推理时间，所述FLOPs代表用来衡量模型的复杂度。

所述步骤1的具体方法为:

步骤1.1：获取滑坡遥感影像数据集的正样本：将遥感影像按照滑坡规模进行裁剪，并向外扩充像素点作为背景，获得正样本；

步骤1.2：获取滑坡遥感影像数据集的负样本：将遥感影像以128或256或512尺寸的大小进行裁剪，删除所有包含正样本的数据，并挑选特殊场景作为负样本；

步骤1.3：将步骤1.1获取的正样本与步骤1.2获取的负样本按一定比例划分为训练集和测试集；

步骤1.4：将步骤1.3中得到的训练集按一定比例分别划分为新的训练集和验证集；

步骤1.5：对步骤1.4得到的新的训练集进行数据增强；

步骤1.6：将步骤1.3的测试集、步骤1.4中的验证集以及步骤1.5数据增强后的训练集的数据均调整为统一大小224*224或者300*300。

所述步骤2的具体方法为:

步骤2.1：利用深度学习框架分别构建Fused-MBConv模块、MBConv模块以及PDC模块；

步骤2.2：对步骤2.1构建的Fused-MBConv模块、MBConv模块以及PDC模块进行融合。

所述步骤2.1的具体方法为：所述Fused-MBConv模块包括一个3*3升维卷积以及一个1*1降维卷积，将Fused-MBConv模块的特征输入与特征输出进行跳跃连接；MBConv模块包括一个1*1升维卷积、一个3*3深度可分离卷积、一个SE注意力机制以及一个1*1降维卷积，将MBConv模块的特征输入与特征输出进行跳跃连接；PDC模块由1*1卷积、PatchEmded模块、双注意力机制、特征转换操作以及1*1卷积组成，并将输入特征图与最终输出特征图进行shortcut链接，使用PatchEmbed模块调整特征图通道的大小，并将特征图展平为适合DualAttention Block的特征向量；

所述步骤2.2的具体方法为：首先构建一个1*1的标准卷积层，将其输出特征图送入步长为1的Fused-MBConv模块中，该次使用不进行升维，Fused-MBConv模块循环两次，将其输出特征送入步长为2的Fused-MBConv模块中，进行是输入特征通道数4倍的升维，循环4次，将其输出特征送入步长为2的Fused-MBConv模块，进行是输入特征通道数4倍的升维，将其输出特征送入步长为2的MBConv模块，进行是输入特征通道数4倍的升维，循环2次，将其输出特征送入步长为1的PDC模块，循环2次，将其输出特征送入步长为2的MBConv模块，进行是输入特征通道数4倍的升维，循环3次，将其输出特征送入步长为1的PDC模块，循环3次，最终送入一个1*1卷积中，进行池化操作以及进行全连接操作，得到一个二分类的结果，完成网络模型构建。

所述步骤3的具体方法为：将步骤1.6中得到的训练集送入到步骤2搭建的Ournetwork framework网络模型中，对Our networkframework网络模型进行迭代训练，设置包括迭代轮次、批量大小以及学习率参数，进行网络训练并记录训练时间，接着将步骤1.6的验证集送入步骤2所搭建的Our network framework网络模型中，验证模型效果，最后保存训练效果最好轮次的权重。

所述步骤4的具体方法为：将步骤1.6的测试集送入步骤3训练好的网络模型中进行预测，评价网络的好坏，分别使用准确率Accuracy、平衡F分数F1、召回率Recall、精确率Precision作为评判网络性能的评价指标，准确率Accuracy为分类正确的样本占样本总数的比例；召回率Recall代表实际的正样本中预测为正样本的概率；精确率Precision代表所有预测为正样本中实际为正样本的概率；Precision和Recall是一对矛盾的度量，Precision高时，Recall偏低；而Recall高时，Precision偏低；在需要兼顾Precision和Recall时，使用平衡F分数F1作为Precision和Recall的加权调和平均，以下为各个评价指标的计算公式：

其中TP表示正样本预测正确的个数，FP负样本预测错误的个数，TN负样本预测正确的个数，FN正样本预测错误的个数；

其中，P指Precision，R指Recall，F₁指平衡F分数；

步骤5中所述张量的维度尺寸大小为步骤1中统一调整数据集尺寸大小之后影像的维度和大小。

所述步骤1.2中特殊场景包括：道路、耕地、湖泊、植被、云层遮挡、工厂、山脊、积雪覆盖的场景；所述步骤1.3中的训练集以及测试集按照6：4或8：2的比例划分；所述步骤1.4中所述的新的训练集以及验证集的比例范围为：7：3—9：1；所述步骤1.5中的数据增强包括：随机裁剪、随机旋转、叠加噪声。

本发明还提供了一种基于轻量化卷积神经网络和双注意力的自动识别滑坡系统，包括：

移动翻转瓶颈卷积模块：该模块由1*1升维卷积、3*3深度可分离卷积、SE注意力机制以及1*1降维卷积组成，将MBConv模块的特征输入与特征输出进行跳跃连接，在该模块中使用倒残差结构，同时使用深度可分离卷积减少卷积计算所需要的参数个数，以达到网络模型轻量化的目的；

融合移动翻转瓶颈卷积模块：该模块由3*3升维卷积和1*1降维卷积组成，并将Fused-MBConv模块的特征输入与特征输出进行跳跃连接，在浅层网络中应用，用于提高网络的训练速度；

双注意力机制模块：该模块由空间维度的窗口多头自注意力机制和通道组的自注意力机制组成，从正交的角度处理问题，分别从空间维度和通道维度进行自注意力机制，用于提高自动识别滑坡网络模型的精度；

空间窗口多头自注意力机制模块：双注意力机制模块中空间维度部分，利用空间维度信息完善局部特征；

通道组自注意力机制模块：双注意力机制模块中通道维度部分，利用通道维度信息捕捉全局的联系和特征；

PDC模块：该模块由1*1卷积、PatchEmded模块、双注意力机制、特征转换操作以及1*1卷积组成，并将输入特征图与最终输出特征图进行跳跃链接，对输入特征图进行调整，以适应双注意力机制模块的输入，并对双注意力机制模块的输出特征进行调整，以适应卷积神经网络层的输入。

本发明还提供了一种基于轻量化卷积神经网络和双注意力的自动识别滑坡设备，包括：

存储器：用于存储计算机程序；

处理器，用于执行所述计算机程序时实现所述的一种基于轻量化卷积神经网络和双注意力的自动识别滑坡方法。

本发明还提供了一种计算机可读存储介质，包括：

所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时能够实现一种基于轻量化卷积神经网络和双注意力的自动识别滑坡方法。

相较于现有技术，本发明的有益效果为：

1、现有的使用深度学习进行滑坡识别的技术，更多的是依赖比较经典的网络比较深复杂度比较高的模型，以此来提高对滑坡识别的准确率，而本发明中构建的Our networkframework网络模型，该网络模型由Fused-MBConv模块、MBConv模块和PDC模块组成，利用Fused-MBConv模块、MBConv模块设计出更加适用于滑坡识别的轻量化卷积神经网络，同时结合PDC模块中的双注意力机制以增加网络模型空间感知的全局性，以此来提高滑坡识别网络模型的性能；本发明使用轻量化模型对滑坡进行识别，并同时引入双注意力机制来提高滑坡识别的准确率，因此，在降低模型复杂度的同时，整体滑坡识别的准确率还得以提升。与EfficientNetV2相比，本发明在滑坡自动识别上的F1、准确率、精确率、召回率上均有所提升，同时模型复杂度、参数量、推理时间、训练时间均有所降低。本发明在EfficientNetV2的基础上，提升了网络的训练速度和提升了网络的准确率，使其更加适用于滑坡识别任务中。

2、目前在滑坡上比较成熟的技术是InSAR技术进行滑坡的早期识别，但由于其传感器成本高、多幅影像不易获取、观测周期长、技术要求高等原因，限制了其在滑坡识别领域的大规模应用；而本发明提出的自动识别滑坡的技术相比较InSAR技术来说，图像更容易获取、不需要高成本的传感器要求等，因此，可以先使用本发明进行滑坡识别的一个初筛选，提高滑坡识别的效率。

3、相比较人工目视解译的方法，本发明无需强烈依赖专家知识，因为主要是使用计算机技术，人工成本低，效率也比人工目视解译高。

4、相比较InSAR技术，本发明中光学遥感影像成本低，数据更易获取。

附图说明

图1为本发明的网络架构图。

图2为图1PDC模块中DualAttention Block模块的架构图。

具体实施方式

下面以一种基于轻量化卷积神经网络和双注意力的自动识别滑坡方法作为实施例，并结合附图对本发明的技术方案作进一步详细地解释和说明。

步骤1：对宁夏高分二号卫星遥感影像进行预处理，获取宁夏滑坡遥感影像数据集；本发明主要针对滑坡遥感数据集和滑坡隐患点(即尚未发生滑坡，但有发生滑坡的趋势)数据集。

步骤1.1：获取宁夏滑坡遥感影像数据集的正样本：将宁夏高分二号卫星遥感影像按照滑坡规模进行裁剪，并向外扩充20个像素点作为背景，获得正样本；

步骤1.2：获取宁夏滑坡遥感影像数据集的负样本：将宁夏高分二号卫星遥感影像以512*512的大小进行裁剪，删除所有包含正样本的数据，并挑选如道路、耕地、湖泊、植被、云层遮挡、工厂、山脊、积雪覆盖等容易被误认为正样本的特殊场景作为负样本；

步骤1.3：将步骤1.1获取的正样本与步骤1.2获取的负样本按6：4的比例划分为训练集和测试集；

步骤1.4：将步骤1.3中得到的训练集按8：2的比例划分为新的训练集和验证集；

步骤1.5：对步骤1.4得到的新的训练集进行随机裁剪、随机旋转、叠加噪声等简单的数据增强；

步骤1.6：将步骤1.3的测试集、步骤1.4中的验证集以及步骤1.5数据增强后的训练集的数据均调整为统一大小300*300。

步骤2：搭建Ournetwork framework网络模型。

如图1所示，步骤2.1：利用pytorch深度学习框架分别构建Fused-MBConv模块、MBConv模块以及PDC模块；

如图2所示，具体地，所述Fused-MBConv模块包括一个3*3升维卷积以及一个1*1降维卷积，将Fused-MBConv模块的特征输入与特征输出进行跳跃连接(ShortcutConnection)；MBConv模块包括一个1*1升维卷积、一个3*3深度可分离卷积、一个SE(Squeeze-and-Excitation)注意力机制以及一个1*1降维卷积，将MBConv模块的特征输入与特征输出进行跳跃连接；PDC模块由1*1卷积、PatchEmded模块、双注意力机制、特征转换操作以及1*1卷积组成，并将输入特征图与最终输出特征图进行shortcut链接，使用PatchEmbed模块调整特征图通道的大小，并将特征图展平为适合DualAttention Block的特征向量；

步骤2.2：对步骤2.1构建的Fused-MBConv模块、MBConv模块以及PDC模块进行融合；

具体地，首先构建一个1*1的标准卷积层，将其输出特征图送入步长为1的Fused-MBConv模块(该次使用不进行升维)中，Fused-MBConv模块循环两次，将其输出特征送入步长为2的Fused-MBConv模块(进行是输入特征通道数4倍的升维)中，循环4次，将其输出特征送入步长为2的Fused-MBConv模块(进行是输入特征通道数4倍的升维)，将其输出特征送入步长为2的MBConv模块(进行是输入特征通道数4倍的升维)，循环2次，将其输出特征送入步长为1的PDC模块，循环2次，将其输出特征送入步长为2的MBConv模块(进行是输入特征通道数4倍的升维)，循环3次，将其输出特征送入步长为1的PDC模块，循环3次，最终送入一个1*1卷积中，进行池化操作以及进行全连接操作，得到一个二分类的结果，完成网络模型构建。

具体地，将步骤1.6中得到的训练集送入到步骤2搭建的Ournetwork framework网络模型中，对Our network framework网络模型进行迭代训练，将实验的迭代轮次(epoch)设置为60，批量大小(batchsize)设置为8，采用指数衰减的学习率来训练网络，初始学习率设定为0.01，根据以上参数进行网络训练并记录训练时间(Train-time)，接着将步骤1.6的验证集送入步骤2所搭建的Ournetwork framework网络模型中，验证模型效果，最后保存训练效果最好轮次的权重。

具体地，将步骤1.6的测试集送入步骤3训练好的网络模型中进行预测，评价网络的好坏，分别使用准确率(Accuracy)、平衡F分数F1、召回率(Recall)、精确率(Precision)作为评判网络性能的评价指标，准确率Accuracy为分类正确的样本占样本总数的比例；召回率Recall代表实际的正样本中预测为正样本的概率；精确率Precision代表所有预测为正样本中实际为正样本的概率；Precision和Recall是一对矛盾的度量，Precision高时，Recall偏低；而Recall高时，Precision偏低；在需要兼顾Precision和Recall时，使用平衡F分数F1指数作为Precision和Recall的加权调和平均，以下为各个评价指标的计算公式：

其中，P指Precision，R指Recall，F₁指平衡F分数。

步骤5：使用深度学习框架随机生成一个(3,300,300)的张量，将其送入到步骤2得到的Our network framework网络模型中，计算FLOPs(用来衡量模型的复杂度)、参数量Params、以及模型推理时间Infer-time。

如图1所示，基于轻量化卷积神经网络和双注意力机制的滑坡识别的网络模型整体框架，Ournetwork framework模型整体由MBConv模块、Fused-MBConv模块以及PDC模块组成，首先使用Fused-MBConv模块和MBConv模块构建网络模型的主体框架，以此作为轻量化网络的主体部分，之后在每个MBConv模块后连接PDC模块，以提高网络的性能。

在本发明中主要使用MBConv模块进行轻量化，以降低网络模型的参数量、计算量，MBConv模块由一个1*1的升维卷积、一个3*3的深度可分离卷积、一个SE注意力机制以及一个1*1的降维卷积组成，并将MBConv模块的输入特征图与输出特征图进行跳跃连接。

由于MBConv模块在浅层使用，会导致训练速度变慢，因此在浅层网络中使用Fused-MBConv模块，以加快训练速度。该模块由一个3*3的升维卷积和1*1降维卷积组成，并将Fused-MBConv模块的输入特征图与输出特征图进行跳跃连接。

虽然卷积神经网络与Transformer相比，其需要训练的参数较少，但是其在空间感知上具有局部性，而全局空间感知对图像分类、语义分割等计算机视觉任务来说是至关重要的。Transformer虽然可以获得全局特征，但是在参数量上是重量级的。因此，如何将卷积神经网络与Transformer进行结合，构造出一个准确度高、轻量化的网络模型是具有研究意义的。为此，本发明设计了结合卷积神经网络与Transformer的轻量化网络模型Ournetwork framework，通过在轻量化卷积神经网络中加入PDC模块，提高滑坡识别的准确度。

PDC模块主要由一个用于调整特征图通道数的1*1卷积；一个PatchEmbed，将特征图转化为自注意力机制输入所需要的特征向量，即进行展平操作；双注意力机制模块，先使用空间维度的窗口多头自注意力机制，之后紧跟着使用通道组自注意力机制以感知全局信息；然后按照输入PatchEmbed之前特征图的尺寸，将特征向量转化为特征图；一个调整输出特征图通道数的1*1卷积组成；最后将输入PDC模块的特征图与PDC模块最后一个1*1卷积的输出特征图进行跳跃连接作为PDC模块的输出特征图。

以上即为对本发明轻量化网络模型各个模块的介绍。在Ournetwork framework网络模型中，网络结构如下：使用一个步长为2的3*3卷积进行下采样；循环使用Fused-MBConv模块，进行如下循环使用：步长为1的Fused-MBConv模块循环2次，步长为2、扩展因子为4的Fused-MBConv模块循环4次，步长为2、扩展因子为4的Fused-MBConv模块循环1次；使用步长为2、扩展因子为4的MBConv模块循环2次；步长为1的PDC模块循环2次；步长为2的MBConv模块、扩展因子为4的MBConv模块循环3次；步长为1的PDC模块循环3次；使用一个1*1的卷积、池化操作以及进行全连接操作。

本发明中构建的Our network framework网络模型，该网络模型由Fused-MBConv模块、MBConv模块和PDC模块组成，利用Fused-MBConv模块、MBConv模块设计出更加适用于滑坡识别的轻量化卷积神经网络，同时结合PDC模块中的双注意力机制以增加网络模型空间感知的全局性，以此来提高滑坡识别网络模型的性能。

具体来说，首先利用Fused-MBConv模块、MBConv模块设计出网络模型的主体框架，以此作为轻量化卷积神经网络的主体部分，使其在保证准确度的同时，降低网络的复杂度、运行时间以及参数量等。由于使用卷积神经网络作为网络模型框架的主干，其在空间感知上具有局部性，而通过的自注意力机制可以有效获得全局感知。因此，在本发明网络模型的主体框架中使用PDC模块来增加网络模型空间感知的全局性。在PDC模块中主要使用了双注意力机制模块，从空间维度和通道维度分别进行自注意力机制，实现全局建模，Ournetworkframework将卷积神经网络的优势和自注意力机制的优势结合起来，创建出一个轻量化的网络模型。

移动翻转瓶颈卷积(Mobile invertedbottleneck convolution，MBConv)模块(见附图1)：该模块由1*1升维卷积、3*3深度可分离卷积、SE注意力机制以及1*1降维卷积组成，将MBConv模块的特征输入与特征输出进行跳跃连接，由于高维信息通过ReLU激活函数后丢失的信息更少，因此在该模块中使用倒残差结构，同时使用深度可分离卷积减少卷积计算所需要的参数个数。

融合移动翻转瓶颈卷积(Fused-MBConv)模块(见附图1)：该模块由3*3升维卷积和1*1降维卷积组成，并将Fused-MBConv模块的特征输入与特征输出进行跳跃连接，在浅层网络中应用，可以用于提高网络的训练速度，而且参数量和FLOPs的开销很小。

双注意力机制(Dual Attention)模块(见附图2)：该模块由空间维度的窗口多头自注意力机制和通道组的自注意力机制组成，从正交的角度处理问题，分别从空间维度和通道维度进行自注意力机制，通过此方法来提高自动识别滑坡网络模型的精度。

空间窗口多头自注意力机制(Spatial Window MultiheadSelf-attention)模块(见附图2)：双注意力机制模块中空间维度部分，利用空间维度信息完善局部特征。

通道组自注意力机制(Channel Group Self-attention)模块(见附图2)：双注意力机制模块中通道维度部分，利用通道维度信息捕捉全局的联系和特征。

PDC模块(见附图1)：该模块由1*1卷积、PatchEmded模块、双注意力机制、特征转换操作以及1*1卷积组成，并将输入特征图与最终输出特征图进行跳跃链接，对特征图进行调整，以适应双注意力机制模块的输入，并对双注意力机制模块的输出特征进行调整，以适应卷积神经网络层的输入。

实施例

使用两个轻量化网络模型MobileNetV3、ShuffleNetV2，近年来比较主流的EfficientNetV2网络模型以及近年来经典的卷积神经网络模型ResNet101和DenseNet169，两个近两年流行的transformer模型Vision transformer、Swin transformer，作为本发明的对比试验，使用步骤1.6的训练集和测试集作为训练、预测对比实验的数据集，将网络模型修改为对比实验的网络模型重复上述步骤3、4、5、6，得到对比实验的模型训练结果，对模型的优劣进行评价。

最终实验性能评估结果如表1所示，并在Accuracy、F1、Recall和Precision上对结果最好的评估值进行加粗标记。最终轻量化评估结果如表2所示。从表1可以看出本发明提出的Our networkframework在Accuracy、F1和Precision评估指标上均比其他实验结果好。

从表2可以看出，本发明所提出的Our network framework网络模型与轻量化网络模型相比，虽然在参数量、计算复杂度、推理时间和训练时间上略微偏高，但是评价网络性能的多项评价指标均优于MobileNetV3和ShuffleNetV2，尤其是在F1上，比MobileNetV3高6.98％，比ShuffleNetV2高5.53％。而且与其他经典卷积神经网络模型以及Transformer模型相比，Params、FLOPs、推理时间和运行时间上均低很多，并且在Accuracy、F1以及Precision评估指标上结果更好。其结果证明了本发明所提出Our network framework网络模型在滑坡识别上的有效性。

表1MobileNetV3、ShuffleNetV2、ResNet101、DenseNet169、Vision transformer、Swin transformer、EfficientNetV2以及Our networkframework在宁夏滑坡数据集上的评估指标

表2MobileNetV3、ShuffleNetV2、ResNet101、DenseNet169、Vision transformer、Swin transformer、EfficientNetV2以及Our networkframework网络模型的参数量FLOPs以及在毕节市滑坡数据集上的推理时间和运行时间

本发明中，如实验结果(表2)表明，该方法在性能、模型复杂度、模型参数数量和运行时间等方面均优于其他方法，本发明方法与轻量化的MobileNetV3和ShuffleNetV2相比，虽然在推理时间、参数量以及模型复杂度上偏高，但是性能更加优越，并且与其他经典网络和近几年新提出的Transformer相比，性能更好，推理时间、参数量以及模型复杂度更低，该方法不仅在已发生滑坡的数据集上有效，而且在滑坡隐患点数据集上仍然有效。

与现有的EfficientNetV2网络模型相比，本发明在滑坡自动识别上的F1、准确率、精确率、召回率上均有所提升，同时模型复杂度、参数量、推理时间、训练时间均有所降低，如表1、2所示，本发明在EfficientNetV2的基础上，提升了网络的训练速度和提升了网络的准确率。

存储器：用于存储计算机程序；

本发明还提供了一种计算机可读存储介质，包括：

Claims

1.一种基于轻量化卷积神经网络和双注意力的自动识别滑坡方法，其特征在于：包括以下步骤：

步骤1：对遥感影像进行预处理，获取滑坡遥感影像数据集；

步骤2：搭建Ournetworkframework网络模型；

步骤3：对Ournetworkframework网络模型进行迭代训练，最终保存训练效果最好轮次的权重；

步骤5：使用深度学习框架随机生成一个张量，将其送入到步骤2得到的Ournetworkframework网络模型中，计算FLOPs、参数量、以及模型推理时间，所述FLOPs代表用来衡量模型的复杂度。

2.根据权利要求1所述的一种基于轻量化卷积神经网络和双注意力的自动识别滑坡方法，其特征在于：所述步骤1的具体方法为：

步骤1.5：对步骤1.4得到的新的训练集进行数据增强；

3.根据权利要求1所述的一种基于轻量化卷积神经网络和双注意力的自动识别滑坡方法，其特征在于：所述步骤2的具体方法为：

4.根据权利要求3所述的一种基于轻量化卷积神经网络和双注意力的自动识别滑坡方法，其特征在于：所述步骤2.1的具体方法为：所述Fused-MBConv模块包括一个3*3升维卷积以及一个1*1降维卷积，将Fused-MBConv模块的特征输入与特征输出进行跳跃连接；MBConv模块包括一个1*1升维卷积、一个3*3深度可分离卷积、一个SE注意力机制以及一个1*1降维卷积，将MBConv模块的特征输入与特征输出进行跳跃连接；PDC模块由1*1卷积、PatchEmded模块、双注意力机制、特征转换操作以及1*1卷积组成，并将输入特征图与最终输出特征图进行shortcut链接，使用PatchEmbed模块调整特征图通道的大小，并将特征图展平为适合DualAttentionBlock的特征向量；

5.根据权利要求1所述的一种基于轻量化卷积神经网络和双注意力的自动识别滑坡方法，其特征在于：所述步骤3的具体方法为：将步骤1.6中得到的训练集送入到步骤2搭建的Ournetwork framework网络模型中，对Ournetworkframework网络模型进行迭代训练，设置包括迭代轮次、批量大小以及学习率参数，进行网络训练并记录训练时间，接着将步骤1.6的验证集送入步骤2所搭建的Our networkframework网络模型中，验证模型效果，最后保存训练效果最好轮次的权重。

6.根据权利要求1所述的一种基于轻量化卷积神经网络和双注意力的自动识别滑坡方法，其特征在于：所述步骤4的具体方法为：将步骤1.6的测试集送入步骤3训练好的网络模型中进行预测，评价网络的好坏，分别使用准确率Accuracy、平衡F分数F1、召回率Recall、精确率Precision作为评判网络性能的评价指标，准确率Accuracy为分类正确的样本占样本总数的比例；召回率Recall代表实际的正样本中预测为正样本的概率；精确率Precision代表所有预测为正样本中实际为正样本的概率；Precision和Recall是一对矛盾的度量，Precision高时，Recall偏低；而Recall高时，Precision偏低；在需要兼顾Precision和Recall时，使用平衡F分数F1作为Precision和Recall的加权调和平均，以下为各个评价指标的计算公式：

其中，P指Precision，R指Recall，F₁指平衡F分数；

7.根据权利要求2所述的一种基于轻量化卷积神经网络和双注意力的自动识别滑坡方法，其特征在于：所述步骤1.2中特殊场景包括：道路、耕地、湖泊、植被、云层遮挡、工厂、山脊、积雪覆盖的场景；所述步骤1.3中的训练集以及测试集按照6：4或8：2的比例划分；所述步骤1.4中所述的新的训练集以及验证集的比例范围为：7：3—9：1；所述步骤1.5中的数据增强包括：随机裁剪、随机旋转、叠加噪声。

8.一种基于轻量化卷积神经网络和双注意力的自动识别滑坡系统，其特征在于：包括：

9.一种基于轻量化卷积神经网络和双注意力的自动识别滑坡设备，其特征在于，包括：

存储器：用于存储计算机程序；

10.一种计算机可读存储介质，其特征在于，包括：