CN113887499B

CN113887499B - 一种沙丘图像识别模型及其创建方法和沙丘图像识别方法

Info

Publication number: CN113887499B
Application number: CN202111228791.XA
Authority: CN
Inventors: 唐颖复; 王忠静; 张腾
Original assignee: Tsinghua University
Current assignee: Tsinghua University
Priority date: 2021-10-21
Filing date: 2021-10-21
Publication date: 2022-11-18
Anticipated expiration: 2041-10-21
Also published as: CN113887499A

Abstract

本申请实施例公开了一种沙丘图像识别模型及其创建方法和沙丘图像识别方法，该创建方法包括：获取包含遥感图像的原图和掩膜mark图像的数据集作为训练数据；构建卷积神经网络模型；该模型中设置有注意门机制；通过训练数据对卷积神经网络模型进行训练；训练过程中通过注意门机制计算解码层的局部特征与编码层的全局信息的相关性，并根据相关性高低对相应区域的局部特征进行加强或减弱；采用测试数据对训练好的卷积神经网络模型进行测试，将测试通过的卷积神经网络模型作为沙丘图像识别模型。该实施例方案为在不受光照、天气、沙丘位置及类型、图像配准误差等因素干扰下，自动、快速、准确地重复检测不同沙丘图像中的目标对象提供了技术基础。

Description

一种沙丘图像识别模型及其创建方法和沙丘图像识别方法

技术领域

本申请实施例涉及计算机视觉识别技术，尤指一种沙丘图像识别模型及其创建方法和沙丘图像识别方法。

背景技术

沙丘是风沙共同作用的产物，是沙漠的主要地貌类型。沙丘的形成和移动是一种主要的沙漠化运动形式，会破坏道路、草场、农田，识别沙丘是研究沙丘形成过程和监控沙丘移动的前提。地面监测和利用遥感影像检测是沙丘研究中的常用方法。由于野外监测环境恶劣，地面监测耗时长、范围小，近十年的沙丘研究中，大都使用遥感影像数据测量识别。利用遥感影像检测的沙丘研究方法可分为两类，一类是基于对象的方法，另一类是基于像素的方法。

在基于对象的方法中，单个沙丘被视为对象，沙丘的轮廓线和峰顶线通常被视为对象的特征。目前没有自动识别沙丘或识别沙丘的技术方法，一般需要在ArcView GIS等软件中依靠目视识别沙丘对象的位置点和轮廓线、峰顶线等特征，人工识别沙丘对象。由于大多数面向对象的方法需要目视识别和人工空间分析，对专业知识水平要求较高。另外，相关研究曾针对基于对象的这类方法的客观性和效率提出过质疑。

基于像素的方法一般获取多时相的遥感图像作为研究对象，采取图像配准、辐射定标和直方图均衡化等步骤，利用软件计算图像块之间的互相关指数，采集沙丘像元位移和亚像元位移，测量沙丘动态。这类方法需要较少的人工干预，具有一定的客观性。但计算多时相的遥感图像的互相关指数时，要求研究对象的太阳光照条件无差异且配准位置严格匹配。另外，为了达到较好的沙丘识别效果，要求研究对象是高分辨率遥感图像，成本高昂。

发明内容

本申请实施例提供了一种沙丘图像识别模型及其创建方法和沙丘图像识别方法，能够为在不受光照、天气、沙丘位置及类型、图像配准误差等因素干扰的情况下，自动、快速、准确地重复检测不同沙丘图像中的目标对象提供了技术基础。

本申请实施例提供了一种沙丘图像识别模型的创建方法，所述方法可以包括：

获取包含遥感图像的原图和掩膜mark图像的数据集，作为训练数据；

构建卷积神经网络模型；所述卷积神经网络模型中设置有注意门机制；

通过所述训练数据对所述卷积神经网络模型进行训练；其中，在训练过程中通过所述注意门机制计算所述卷积神经网络模型的解码层的局部特征与所述卷积神经网络模型的编码层的全局信息的相关性，并根据所述相关性的高低对相应区域的局部特征进行加强或减弱；

采用预设的测试数据对训练好的所述卷积神经网络模型进行测试，将测试通过的卷积神经网络模型作为沙丘图像识别模型。

在本申请的示例性实施例中，所述卷积神经网络模型可以包括：依序级联的多个编码层、依序级联的多个解码层以及识别层；

在编码层与解码层之间设置有注意门模块；所述注意门模块可以设置为实现所述注意门机制；所述注意门模块可以包括：卷积层、批标准化Batch normalization层、线性整流激活ReLU层和Sigmoid层；

所述注意门机制包括：将包含所述全局信息的编码层输出信号和包含所述局部特征的解码层输出信号逐元素相加，相加后的信号依次经过所述卷积层、所述批标准化Batchnormalization层、所述ReLU层和所述Sigmoid层，获取所述相关性，将包含所述相关性的信号再与所述编码层输出信号逐元素相乘，实现对所述局部特征的加强或减弱，并得到注意门输出信号；

其中，根据最后一级解码层的解码层输出信号获得的注意门输出信号输入所述识别层。

在本申请的示例性实施例中，所述注意门机制满足预设的计算式；所述计算式可以包括：

其中，G表示注意门输出信号，g表示编码层输出信号，x表示解码层输出信号；w_k(·)表示卷积核大小为k的卷积，k为正整数；

ψ_R(·)为

是ReLU线性整流激活函数；

ψ_S(·)为

是Sigmoid激活函数；

表示逐元素相乘。

在本申请的示例性实施例中，所述编码层可以包括：依序级联第一编码层、第二编码层和第三编码层；所述解码层可以包括：依序级联第一解码层、第二解码层和第三解码层；所述注意门模块可以包括：第一注意门模块、第二注意门模块和第三注意门模块；

其中，在所述第一编码层和所述第三解码层之间设置有所述第三注意门模块；

在所述第二编码层和所述第二解码层之间设置有所述第二注意门模块；

在所述第三编码层和所述第一解码层之间设置有所述第一注意门模块。

在本申请的示例性实施例中，每个所述编码层可以包括：多个第一卷积模块和最大池化模块；

每个所述解码层可以包括：多个反卷积模块和上采样模块；

所述识别层包括：多个第一卷积模块和至少一个第二卷积模块；

其中，每个第一卷积模块包含：卷积层、批标准化Batch normalization层和ReLU层；

所述第二卷积模块可以包含：卷积层和Sigmoid激活层；

每个所述反卷积模块可以包含：卷积层、批标准化Batch normalization层和线性整流激活ReLU层。

在本申请的示例性实施例中，所述第一编码层输出的第一特征图像的特征通道数为第一数值，每一个编码层的输出经过所述最大池化模块的下采样后，所述第一特征图像的长和宽均减小一半，特征通道数增加一倍；

输入到所述第一解码层的第二特征图像的特征通道数为第二数值，每一个解码层的输出经过所述上采样模块后，所述第二特征图像的长和宽均增加一倍，特征通道数则减少一半；

所述沙丘图像识别模型的最终输出的沙丘识别结果图像与所述沙丘图像识别模型的输入图像的尺寸一致。

在本申请的示例性实施例中，所述获取包含遥感图像原图和标记图的数据集，作为训练数据，可以包括：

获取沙丘的陆地卫星Landsat遥感RGB全色图像，对该Landsat遥感RGB全色图像进行切割，形成具有预设像素的多个子图像；

从所述多个子图像中获取保留有沙丘的子图像，在所述保留有沙丘的子图像中标注沙丘区域mask，获取所述mask图像；

将所述多个子图像和所述mask图像构成数据集，作为所述训练数据。

在本申请的示例性实施例中，所述通过所述训练数据对所述卷积神经网络模型进行训练，可以包括：循环执行以下操作，直至预测结果与实际数据之间的差距满足预设要求：

81、将所述训练数据输入所述卷积神经网络模型，并获得预测结果；

82、采用二元交叉熵损失函数BCELoss计算所述预测结果与输入的训练数据的实际数据之间的差距；检测所述差距是否满足预设要求，当所述差距满足所述预设要求时，退出训练流程，当所述差距不满足所述预设要求时，进入步骤83；

83、采用Adam优化器，根据所述卷积神经网络模型反向传播的信息更新所述卷积神经网络模型的参数，并返回步骤81。

本申请实施例还提供了一种沙丘图像识别模型，可以依据上述的沙丘图像识别模型构建方法获得；包括：依序级联的多个编码层、依序级联的多个解码层以及识别层；

在编码层与解码层之间设置有注意门模块；所述注意门模块设置为实现所述注意门机制；所述注意门模块包括：卷积层、批标准化Batch normalization层、线性整流激活ReLU层和Sigmoid层；

本申请实施例还提供了一种沙丘图像识别方法，所述方法可以包括：

获取所述的沙丘图像识别模型；

将待识别图像输入所述沙丘图像识别模型，并将所述沙丘图像识别模型的输出结果作为识别结果。

与相关技术相比，本申请实施例可以包括：获取包含遥感图像的原图和掩膜mark图像的数据集，作为训练数据；构建卷积神经网络模型；所述卷积神经网络模型中设置有注意门机制；通过所述训练数据对所述卷积神经网络模型进行训练；其中，在训练过程中通过所述注意门机制计算所述卷积神经网络模型的解码层的局部特征与所述卷积神经网络模型的编码层的全局信息的相关性，并根据所述相关性的高低对相应区域的局部特征进行加强或减弱；采用预设的测试数据对训练好的所述卷积神经网络模型进行测试，将测试通过的卷积神经网络模型作为沙丘图像识别模型。通过该实施例方案，为在不受光照、天气、沙丘位置及类型、图像配准误差等因素干扰的情况下，自动、快速、准确地重复检测不同沙丘图像中的目标对象提供了技术基础。

本申请的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本申请而了解。本申请的其他优点可通过在说明书以及附图中所描述的方案来实现和获得。

附图说明

附图用来提供对本申请技术方案的理解，并且构成说明书的一部分，与本申请的实施例一起用于解释本申请的技术方案，并不构成对本申请技术方案的限制。

图1为本申请实施例的沙丘图像识别模型的创建方法流程图；

图2为本申请实施例的卷积神经网络模型以及沙丘图像识别模型示意图；

图3为本申请实施例的注意门模块示意图；

图4为本申请实施例的沙丘图像识别方法流程图。

具体实施方式

本申请描述了多个实施例，但是该描述是示例性的，而不是限制性的，并且对于本领域的普通技术人员来说显而易见的是，在本申请所描述的实施例包含的范围内可以有更多的实施例和实现方案。尽管在附图中示出了许多可能的特征组合，并在具体实施方式中进行了讨论，但是所公开的特征的许多其它组合方式也是可能的。除非特意加以限制的情况以外，任何实施例的任何特征或元件可以与任何其它实施例中的任何其他特征或元件结合使用，或可以替代任何其它实施例中的任何其他特征或元件。

本申请包括并设想了与本领域普通技术人员已知的特征和元件的组合。本申请已经公开的实施例、特征和元件也可以与任何常规特征或元件组合，以形成由权利要求限定的独特的发明方案。任何实施例的任何特征或元件也可以与来自其它发明方案的特征或元件组合，以形成另一个由权利要求限定的独特的发明方案。因此，应当理解，在本申请中示出和/或讨论的任何特征可以单独地或以任何适当的组合来实现。因此，除了根据所附权利要求及其等同替换所做的限制以外，实施例不受其它限制。此外，可以在所附权利要求的保护范围内进行各种修改和改变。

此外，在描述具有代表性的实施例时，说明书可能已经将方法和/或过程呈现为特定的步骤序列。然而，在该方法或过程不依赖于本文所述步骤的特定顺序的程度上，该方法或过程不应限于所述的特定顺序的步骤。如本领域普通技术人员将理解的，其它的步骤顺序也是可能的。因此，说明书中阐述的步骤的特定顺序不应被解释为对权利要求的限制。此外，针对该方法和/或过程的权利要求不应限于按照所写顺序执行它们的步骤，本领域技术人员可以容易地理解，这些顺序可以变化，并且仍然保持在本申请实施例的精神和范围内。

本申请实施例提供了一种沙丘图像识别模型的创建方法，如图1所示，所述方法可以包括步骤S101-S104：

S101、获取包含遥感图像的原图和掩膜mark图像的数据集，作为训练数据；

S102、构建卷积神经网络模型；所述卷积神经网络模型中设置有注意门机制；

S103、通过所述训练数据对所述卷积神经网络模型进行训练；其中，在训练过程中通过所述注意门机制计算所述卷积神经网络模型的解码层的局部特征与所述卷积神经网络模型的编码层的全局信息的相关性，并根据所述相关性的高低对相应区域的局部特征进行加强或减弱；

S104、采用预设的测试数据对训练好的所述卷积神经网络模型进行测试，将测试通过的卷积神经网络模型作为沙丘图像识别模型。

在本申请的示例性实施例中，由于目前还没有一种沙丘图像识别方法，既可以自动重复检测不同沙丘图像中的目标对象，同时不受光照、天气、沙丘位置和类型、图像配准误差等因素干扰。因此，本申请实施例提出了一种基于沙丘图像识别模型的沙丘识别方法，实现了自动、快速、准确地检测不同位置、时间和类型沙丘。

在本申请的示例性实施例中，首先需要创建所述的沙丘图像识别模型(可以称为SandUnet网络模型)，对于模型的创建，通常需要获取训练数据和测试数据、搭建学习模型、采用训练数据对学习模型进行训练以及对学习模型进行测试等步骤，下面对本申请实施例的沙丘图像识别模型的创建方法进行详细介绍。

在本申请的示例性实施例中，可以获取一个沙漠(例如，沙漠1)的Landsat遥感RGB全色图像，对该图像切割，获取一组具有预设像素(例如，可以为256x256像素)的子图像，并获取这些子图像中具有沙丘的子图像。

在本申请的示例性实施例中，对于具有沙丘的子图像，可以通过人工标注的方式标注出具有沙丘的子图像中沙丘区域掩膜mask，获取所述mask图像。

在本申请的示例性实施例中，可以将分割获取的该组具有预设像素的子图像和标注后获取的所述mask图像(即原子图像与mask图像)共同组成一个数据集，作为所述的训练数据。

在本申请的示例性实施例中，对于所述的测试数据，可以获取关于沙丘的不同的遥感图像，例如，可以获取另一个时间、另一个沙漠(例如，沙漠2)的遥感RGB全色图像，切割该图像为256x256像素的一组子图像，作为测试数据。

在本申请的示例性实施例中，注意门机制通过同时连接编码层与解码层的特征图，通过相加、卷积层、ReLU层和Sigmoi层的操作计算解码层的局部特征与编码层的全局信息的相关性，并且对于相关性高的区域，对该区域的局部特征得以加强；对于相关性低的区域，对该区域的局部特征得以减弱。

在本申请的示例性实施例中，通过注意门模块的设置，加深了卷积神经网络模型的网络深度，而且不会增加网络复杂度，并提高了识别精度高。

在本申请的示例性实施例中，下面对构建的卷积神经网络模型的结构做详细介绍。

在本申请的示例性实施例中，如图2所示，卷积神经网络模型可以由3层编码层(含卷积层和最大池化层)和3层解码层(含反卷积层和上采样层)组成，所有卷积层卷积核大小可以为3，卷积神经网络模型的第一个最大池化层和最后一个上采样层的步长可以为4，其余池化层和上采样层步长可以为2。

在本申请的示例性实施例中，沙丘图像输入到编码层中，通过卷积层和池化层对沙丘对象特征进行多层特征编码，最后一个编码层的输出信号作为第一个解码层的输入信号，解码层对输入信号特征进行解码，最终输出沙丘识别结果图像。

每个所述解码层可以包括：多个反卷积模块和上采样模块；

所述第二卷积模块可以包含：卷积层和Sigmoid激活层；

在本申请的示例性实施例中，如图2所示，3个编码层(e₁，e₂，e₃)依序级联，每一编码层包括两个卷积模块和一个最大池化Maxpooling模块，3个编码层(e₁，e₂，e₃)对应的最大池化模块分别为(m₁，m₂，m₃)。每个卷积模块包含一个卷积核为3x3的卷积层，一个批标准化(Batch normalization)层和一个线性整流激活(ReLU)层。第一编码层的最大池化模块m₁的池化核尺寸可以为4x4，第二编码层的最大池化模块m₂和第三编码层的最大池化模块m₃的池化核尺寸可以为2x2。每一编码层中的最大池化模块的输出信号作为下一编码层的卷积模块输入信号。第三个编码层e₃的最大池化模块输出信号m作为所连接的第一个解码层d₁的输入。

在本申请的示例性实施例中，如图2所示，3个解码层(d₁，d₂，d₃)依序级联，每个解码层包括两个反卷积模块和一个上采样(upsampling)模块，3个解码层(d₁，d₂，d₃)对应的上采样模块分别为(u₁，u₂，u₃)。其中，每个反卷积模块包含一个卷积核为3x3的卷积层，一个批标准化(Batch normalization)层和一个线性整流激活(ReLU)层。上采样模块中，u₁和u₂的池化核尺寸可以为2x2，u₃的池化核尺寸可以为4x4。最后一个解码层d₃层输出至最后的识别层(或称为分割层)。

在本申请的示例性实施例中，如图2所示，该识别层包含三个卷积模块(c₁，c₂，c₃)。其中，两个卷积模块c₁和c₂包含一个卷积核为3x3的卷积层，一个批标准化(Batchnormalization)层和一个线性整流激活(ReLU)层；最后一个卷积模块c₃包含一个卷积核为1x1的卷积层和一个Sigmoid激活层。识别层的输出为最终的沙丘图像识别结果。

在本申请的示例性实施例中，如图2所示，在3个编码层与3个解码层之间增加了注意门模块。

在本申请的示例性实施例中，所述编码层可以包括：依序级联第一编码层e₁、第二编码层e₂和第三编码层e₃；所述解码层可以包括：依序级联第一解码层d₁、第二解码层d₂和第三解码层d₃；所述注意门模块可以包括：第一注意门模块a₁、第二注意门模块a₂和第三注意门模块a₃；

其中，在所述第一编码层e₁和所述第三解码层d₃之间设置有所述第三注意门模块a₃；

在所述第二编码层e₂和所述第二解码层d₂之间设置有所述第二注意门模块a₂；

在所述第三编码层e₃和所述第一解码层d₁之间设置有所述第一注意门模块a₁。

在本申请的示例性实施例中，即编码层e₁输出信号g₁和解码层d₃输出信号x₁作为注意门模块a₁的输入，编码层e₂输出信号g₂和解码层d₂输出信号x作为注意门模块a₂的输入，编码层e₃输出信号g₃和解码层d₁输出信号x₁作为注意门模块a₃的输入。

在本申请的示例性实施例中，所述第一编码层e₁输出的第一特征图像的特征通道数为第一数值(例如为64)，每一个编码层的输出经过所述最大池化模块的下采样后，所述第一特征图像的长和宽均减小一半，特征通道数增加一倍；

输入到所述第一解码层的第二特征图像的特征通道数为第二数值(例如为512)，每一个解码层的输出经过所述上采样模块后，所述第二特征图像的长和宽均增加一倍，特征通道数则减少一半；

在本申请的示例性实施例中，注意门模块的内部结构可以如图3所示，注意门模块可以包含3个卷积层(卷积核尺寸可以优选为3x3)、批标准化(Batch normalization)层、ReLU层和Sigmoid层。

在本申请的示例性实施例中，将编码层输出信号和解码层输出信号作为所述注意门模块的输入信号；注意门模块的两个输入先进行逐元素相加，再经过卷积层的线性变换后，通过批标准化(Batch normalization)层的归一化处理。其中，前两个卷积层和批标准化(Batch normalization)层的输出信号会通过ReLU层进行非线性激活输出特征映射，第三个卷积层和批标准化(Batch normalization)层的输出信号会通过Sigmoid层进行非线性激活输出特征映射。最后输出信号再与编码层输入信号进行逐元素相乘，产生注意门模块的最终输出。

在本申请的示例性实施例中，人类进行读图任务时会忽略低可能、低价值的信息，注意门模块模仿人类注意力特点，通过Sigmoid层会给特征图像的每个部分分配0或1的重要性分数，编码层信号与该系列重要性分数逐元素相乘后，注意门模块不会输出该编码层的每个特征，而是确定出解码层的局部特征与编码层的全局信息的相关性，并使得相关性高的区域的局部特征得以加强；相关性低的区域的局部特征得以减弱，从而间接实现了分配更多的权重给编码层的有用特征(例如，沙丘特征)。因此，注意门模块将有效地抑制图像中背景不相干特征的响应，降低背景噪声对识别沙丘的影响，提高卷积神经网络模型的沙丘图像识别性能。

在本申请的示例性实施例中，如图3所示，本申请实施例在前三个编码层与解码层之间增加注意门机制。具体地，本申请实施例可以在第一编码层e和第三解码层d₃之间、第二编码层e₂和第二解码层d₂之间、第三编码层e₃和第一解码层d₁输出信号x₂之间设置注意门模块。具体地，第一编码层e₁和第三解码层d₃的输入图像的特征通道数可以为256，第二编码层e₂和第二解码层d₂的输入图像的特征通道数可以为128，第三编码层e₃和第一解码层d₁的输入图像的特征通道数可以为64。

ψ_R(·)为

是ReLU线性整流激活函数；

ψ_S(·)为

是Sigmoid激活函数；

表示逐元素相乘。

在本申请的示例性实施例中，例如，k可以为3，则w_k(·)为w₃(·)。

在本申请的示例性实施例中，注意门模块是将对应的编码层输出信号与解码层输出信号作为输入，则输出信号可通过上述的计算式表示。

在本申请的示例性实施例中，在确定了训练数据和卷积神经网络模型的基础上，可以采用训练数据对该卷积神经网络模型进行训练，以获得沙丘图像识别模型。

在本申请的示例性实施例中，所述通过所述训练数据对所述卷积神经网络模型进行训练，可以包括：循环执行以下操作A-C，直至预测结果与实际数据之间的差距满足预设要求：

A、将所述训练数据输入所述卷积神经网络模型，并获得预测结果；

B、采用二元交叉熵损失函数BCELoss计算所述预测结果与输入的训练数据的实际数据之间的差距；检测所述差距是否满足预设要求，当所述差距满足所述预设要求时，退出训练流程，当所述差距不满足所述预设要求时，进入步骤C；

C、采用Adam优化器，根据所述卷积神经网络模型反向传播的信息更新所述卷积神经网络模型的参数，并返回步骤A。

在本申请的示例性实施例中，可以选择二元交叉熵损失函数BCELoss，衡量预测结果与实际数据的差距程度，BCELoss函数通过以下计算式表达：

其中，L表示损失值；N表示总样本数；y_i表示第i(i为正整数)个样本的所属类别；p_i表示第i个样本的预测值，一般来说，p_i是一个概率值。

在本申请的示例性实施例中，选择Adam优化器，根据卷积神经网络模型反向传播的信息来更新卷积神经网络模型的参数，以降低损失函数BCELoss的计算值L。

在本申请的示例性实施例中，训练数据再次输入到参数更新后得到的卷积神经网络模型，训练多个(根据具体需求确定详细数值，例如30个)回合后可以得到一组卷积神经网络模型参数，从而可以选择其中的最佳参数作为该卷积神经网络模型参数，该最佳参数即使得所述差距满足预设要求的参数。

在本申请的示例性实施例中，在对卷积神经网络模型训练完毕后，可以采用前述的测试数据对该卷积神经网络模型进行测试，当测试通过时，可以将该训练好的卷积神经网络模型作为沙丘图像识别模型。当测试未通过时，可以再次调节卷积神经网络模型的结构和/或参数，直至达到预期要求。

在本申请的示例性实施例中，综上内容可知，本申请实施例的沙丘图像识别模型的创建方法首先通过沙漠的遥感图像获取训练数据；构建一个卷积神经网络模型，该卷积神经网络模型先对输入图片进行卷积和池化(max-pooling)3次，再做反卷积和上采样(up-sampling)3次，并将特征提取过程的特征图与上采样过程的特征图通过本申请实施例提出的注意门机制进行融合；对卷积神经网络模型进行训练；训练完毕以后，获取另一个时刻、另一个沙漠的遥感图像作为测试数据；对卷积神经网络模型进行测试；使用卷积神经网络模型对测试数据进行目标分割，将沙丘对象分割出来，实现沙丘图像识别。

在本申请的示例性实施例中，前述的模型创建方法实施例中的任意实施例均适用于该沙丘图像识别模型实施例中，在此不再一一赘述。

本申请实施例还提供了一种沙丘图像识别方法，如图4所示，所述方法可以包括步骤S201-S202：

S201、获取所述的沙丘图像识别模型；

S202、将待识别图像输入所述沙丘图像识别模型，并将所述沙丘图像识别模型的输出结果作为识别结果。

在本申请的示例性实施例中，前述的模型创建方法实施例中的任意实施例均适用于该沙丘图像识别方法实施例中，在此不再一一赘述。

在本申请的示例性实施例中，本申请实施例方案至少具有以下优势：

1、本申请实施例的注意门模块可以根据颜色和纹理等特征有效区分沙丘对象与沙地背景，自动学习各卷积层和反卷积层的权值来表征沙丘图像的各层特征，并忽略那些无法帮助分割沙丘的特征。

2、本申请实施例可在遥感卫星图像中分割沙丘对象，可用于监测沙丘变化与移动，为沙漠治理提供有效的参考依据。

3、本申请实施例的沙丘图像识别模型可检测不同位置、时间和类型的沙丘，利用沙丘图像识别模型可以学习到沙丘对象的多层特征值，利用沙丘图像识别模型中注意门模块抑制忽略不相关特征，提高了模型学习效率。

4、根据沙丘图像颜色差异小、纹理相近的特点，沙丘图像识别模型确定了第一层编码层的池化层和最后一层解码层的上采样层的步长为4，减少了网络复杂度，节省了训练时间。

5、本申请实施例提出的通过图像分割识别沙丘的方法，解决了之前沙丘研究方法无法自动识别的问题，同时也解决了检测效果受不同光照、天气、沙丘类型、沙丘地点等影响的问题。

本领域普通技术人员可以理解，上文中所公开方法中的全部或某些步骤、系统、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中，在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分；例如，一个物理组件可以具有多个功能，或者一个功能或步骤可以由若干物理组件合作执行。某些组件或所有组件可以被实施为由处理器，如数字信号处理器或微处理器执行的软件，或者被实施为硬件，或者被实施为集成电路，如专用集成电路。这样的软件可以分布在计算机可读介质上，计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的，术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外，本领域普通技术人员公知的是，通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据，并且可包括任何信息递送介质。

Claims

1.一种沙丘图像识别模型的创建方法，其特征在于，所述方法包括：

构建卷积神经网络模型；所述卷积神经网络模型中设置有注意门机制；通过所述训练数据对所述卷积神经网络模型进行训练；其中，在训练过程中通过所述注意门机制计算所述卷积神经网络模型的解码层的局部特征与所述卷积神经网络模型的编码层的全局信息的相关性，对于相关性高的区域，对该区域的局部特征加强；对于相关性低的区域，对该区域的局部特征减弱；

采用预设的测试数据对训练好的所述卷积神经网络模型进行测试，所述卷积神经网络模型用于对测试数据进行目标分割，区分沙丘对象与沙地背景，将沙丘对象分割出来；将测试通过的卷积神经网络模型作为沙丘图像识别模型；

其中，所述卷积神经网络模型包括：依序级联的多个编码层、依序级联的多个解码层以及识别层；

在编码层与解码层之间设置有注意门模块；所述注意门模块设置为实现所述注意门机制；所述注意门模块包括：3个卷积层、批标准化Batch normalization层、线性整流激活ReLU层和Sigmoid层；

其中，根据最后一级解码层的解码层输出信号获得的注意门输出信号输入所述识别层；

其中，所述注意门机制满足预设的计算式；所述计算式包括：

ψ_R(·)为

是ReLU线性整流激活函数；

ψ_S(·)为

是Sigmoid激活函数；

表示逐元素相乘；

其中，所述编码层包括依序级联第一编码层、第二编码层和第三编码层；所述解码层包括依序级联第一解码层、第二解码层和第三解码层；所述注意门模块包括第一注意门模块、第二注意门模块和第三注意门模块；

在所述第三编码层和所述第一解码层之间设置有所述第一注意门模块；

其中，每个所述编码层包括：多个第一卷积模块和最大池化模块；

每个所述解码层包括：多个反卷积模块和上采样模块；

所述第二卷积模块包含：卷积层和Sigmoid激活层；

每个所述反卷积模块包含：卷积层、批标准化Batch normalization层和线性整流激活ReLU层；

其中，所述第一编码层输出的第一特征图像的特征通道数为第一数值，每一个编码层的输出经过所述最大池化模块的下采样后，所述第一特征图像的长和宽均减小一半，特征通道数增加一倍；

所述沙丘图像识别模型的最终输出的沙丘识别结果图像与所述沙丘图像识别模型的输入图像的尺寸一致；

其中，所述获取包含遥感图像原图和标记图的数据集，作为训练数据，包括：

将所述多个子图像和所述mask图像构成数据集，作为所述训练数据；

其中，所述通过所述训练数据对所述卷积神经网络模型进行训练，包括：循环执行以下操作，直至预测结果与实际数据之间的差距满足预设要求：

11、将所述训练数据输入所述卷积神经网络模型，并获得预测结果；

12、采用二元交叉熵损失函数BCELoss计算所述预测结果与输入的训练数据的实际数据之间的差距；检测所述差距是否满足预设要求，当所述差距满足所述预设要求时，退出训练流程，当所述差距不满足所述预设要求时，进入步骤13；

13、采用Adam优化器，根据所述卷积神经网络模型反向传播的信息更新所述卷积神经网络模型的参数，并返回步骤11。

2.一种沙丘图像识别方法，其特征在于，所述方法包括：

获取按照权利要求1所述的沙丘图像识别模型的创建方法所创建的沙丘图像识别模型；