CN110852225B

CN110852225B - 基于深度卷积神经网络的遥感影像红树林提取方法及系统

Info

Publication number: CN110852225B
Application number: CN201911058700.5A
Authority: CN
Inventors: 郭明强; 黄颖; 余仲阳; 李春风; 谢忠; 关庆锋; 吴亮; 王均浩; 曹威
Original assignee: China University of Geosciences
Current assignee: Hubei Dixin Technology Group Co ltd
Priority date: 2019-10-31
Filing date: 2019-10-31
Publication date: 2022-05-06
Anticipated expiration: 2039-10-31
Also published as: CN110852225A

Abstract

本发明公开了一种基于深度卷积神经网络的遥感影像红树林提取方法及系统，本发明首先对高分辨率的遥感影像进行预处理，包括遥感影像的大气校正与研究区域裁剪，对处理后的各波段进行波段运算以提取先验特征信息；应用多源数据融合实现多波段和特征信息的融合，构建数据集；训练并验证由卷积神经网络搭建的语义分类模型ME‑net；调用ME‑net模型实现红树林的自动分类，输出一个png格式的掩模文件，即为分类和提取的结果；通过长距离条件随机场对分类结果进行细调。本发明中的分类模型在应用中可通过扩展数据集使得分类精度达到92.3％，完全可以代替人工目视解译，为高精度影像地图的更新和滨海地区生态系统的保护提供辅助技术支持。

Description

基于深度卷积神经网络的遥感影像红树林提取方法及系统

技术领域

本发明涉及地理信息科学领域，更具体地说，涉及一种基于深度卷积神经网络的遥感影像红树林提取方法及系统。

背景技术

在高精度影像地图的更新及生态环境的检测与保护中，遥感影像的分类与解译工作扮演者十分重要的角色，但由于遥感解译在实践过程中的复杂性，使得解译过程中会耗费大量的人力和物力；与此同时，遥感影像的地物分类的方法虽多，但分类结果却良莠不齐。其中，以滨海地区红树林的提取为例，可以发现存在诸多难点，其中红树林与影像中的植被，森林，湿地森林特征有很大的区别和联系；同时，红树林由于与一些其树种，如柳树等在遥感影像中存在十分类似的颜色、纹理和分布规律(靠近水域)等特征；此外，红树林又可分为人工种植和自然形成两种情况，人工种植的红树林会在开始阶段呈现一定的规律性，之后在一定时间演变后，又会形成另一种近似自然分布形态特征。传统的机器学习方法如随机森林，虽广泛应用于遥感影像分类中，但操作却较为复杂，精度也不够高；遥感影像的主成分分析等图像处理方法却需要大量人工去分析，所以急需一种精确度高、操作简单且低成本的方式实现红树林的自动分类和提取。

发明内容

本发明要解决的技术问题在于，针对现有技术中高分辨率遥感影像中红树林解译费时费力且精度低的技术缺陷，提供基于深度卷积神经网络的遥感影像红树林自动提取方法。

本发明解决其技术问题，所采用的技术原理是：本发明公开了一种基于深度卷积神经网络的遥感影像红树林提取方法及系统，模型被称为ME-net，通过训练、测试并调用ME-net模型实现遥感影像中地物类型的自动识别。本发明首先对高分辨率的遥感影像进行预处理，包括遥感影像的大气校正与研究区域裁剪；其次对处理后的各波段进行波段运算以提取先验特征信息；然后应用多源数据融合实现多波段和特征信息的融合，构建数据集；再然后训练并验证由卷积神经网络搭建的分类模型ME-net；再调用ME-net模型实现红树林的自动分类，输出一个png格式的掩模文件，即为分类和提取的结果；最后通过长距离条件随机场对分类结果进行细调。本发明中只需对多波段遥感影像进行基本的图像处理和特征信息波段融合，再调用红树林分类模型即可提取研究区域中的红树林地物，模型在应用中可通过扩展数据集使得分类精度达到92.3％，完全可以代替人工目视解译，为高精度影像地图的更新和滨海地区生态系统的保护提供辅助技术支持。

附图说明

下面将结合附图及实施例对本发明作进一步说明，附图中：

图1是基于深度卷积神经网络的遥感影像红树林提取方法一实施例的流程图。

具体实施方式

为了对本发明的技术特征、目的和效果有更加清楚的理解，现对照附图详细说明本发明的具体实施方式。

参考图1，图1是基于深度卷积神经网络的遥感影像红树林提取方法一实施例的流程图。本实施例的基于深度卷积神经网络的遥感影像红树林提取方法包含如下步骤：

S1、下载欧洲航天局的哨兵-2数据(S2A MSIL1C)，打开CMD控制台，通过Sen2cor中的命令L2A_Process进行大气校正，通过SNAP软件对校正后的数据进行重采样(raster->geometric operations->resampling)，得到遥感影像各波段数据。

S2、通过遥感影像处理软件ENVI 5.3绘制研究区域以裁剪出海南岛的海滨地区(其中包含大量红树林覆盖的区域)，并通过波段运算计算出水域指数MNDWI＝(Green-SWIR-1)/(Green+SWIR-1)、归一化植被覆盖指数NDVI＝(NIR-Red)/(NIR+Red)、森林指数FDI＝NIR-(Red+Green)、湿地森林指数WFI＝(NIR-Red)/SWIR-2)和红树林指数MDI2＝(NIR-SWIR-2)/SWIR-2)这5个指数信息，并与Red、Green、Blue分别表示可见光波段的红、绿、蓝三个波段，NIR表示近红外波段，SWIR-1和SWIR-2分别表示两个波长不同的短波红外波段，一起一共9个波段数据，然后将9个波段数据划分为三组，输出3个tiff文件。

S3、通过ArcGIS软件新建个人地理数据库->新建要素数据集->新建面矢量文件，加载所述3个tiff文件，并根据遥感解译的方法，例如包括目视解译和建立野外标志，矢量化出真实的红树林覆盖区域，并保存于面矢量文件mangrove.shp中，将包含真实的红树林覆盖区域的mangrove.shp文件通过ArcToolBox中的工具To Raster转成栅格文件，最终输出为png格式的灰度图mangrove.png，将灰度图mangrove.png二值化，使得红树林覆盖区域的像素值为1，非红树林覆盖区域为0，二值化后的mangrove.png文件即为制作好的遥感影像红树林覆盖区域的标签文件。

S4、调用python内opencv-python库函数中的imread函数读取所述3个tiff文件和所述标签文件，通过裁剪、旋转、镜像变化和高斯加噪等数据增强方法生成15万张图片，所有图片文件尺寸大小为512*512；每张图片对应一个标签文件和与标签文件对应的经过数据增强方法所形成的3个tiff文件，各标签文件与tiff文件的尺寸相同，标签文件(512*512*1，最后一个数字为通道数，其他地方的类似表达也与此相同)为二值灰度图，通道数为1，tiff文件(512*512*3)为三通道彩色影像，通道数为3；对tiff文件的像素值进行归一化处理(每个像素点值减数据集的均值之差除以标准差)，然后将归一化处理后所述多张图片进行划分，得到训练集、验证集和测试集。

S5、调用深度学习框架TensorFlow和Keras中的卷积层、池化层、损失函数与激活函数，从而搭建遥感影像语义的分类模型ME-net，其中分类模型ME-net在进行训练时每个样本有四个输入，分别为一个标签文件(即二值化后的mangrove.png文件，大小为512*512*1)和对应的3个tiff文件(512*512*3)；分类模型ME-net通过如下编码步骤、解码步骤和数据融合步骤实现：

编码步骤：对每个样本中的3个tiff文件做5次下采样，下采样采用所述池化层进行最大池化，分别输出5种不同尺寸的特征图，5种尺寸分别为原尺寸的1倍、1/2倍、1/4倍、1/8倍以及1/16倍，即512*512、256*256、128*128、64*64、32*32，对应的通道数依次为原尺寸的1倍、2倍、4倍、8倍以及16倍；然后采用所述卷积层提取空间上下文语义信息和通道注意力关联信息，提高抽取图像分类信息的能力和模型的泛化能力；在每次对特征图做池化之前，先通过三个卷积层提取特征图的语义信息，即得学习到红树林抽象的分类信息。分类信息作用就是提取图像特征，用于指导低层特征图的地物的位置确定；之所以抽象，是因为对特征图进行可视化后，人不能非常直观的看出其中的特征信息，但这些信息却又可以被计算机用于分类。编码层提取的特征信息，即语义信息，就是分类信息；编码层的五次下采样得到512*512，256*256....32*32，是不断得到语义信息的过程，解码层五次上采样32*32，64*64.....512*512是还原编码层到原始图像尺寸的过程，刚好尺寸相同的特征图一一对应按通道想加，因此编码层的语义信息指导了位置确定。

解码步骤：对每个样本中3个tiff文件做5次上采样，上采样采用所述池化层进行最大池化，分别输出5种不同尺寸的特征图，即512*512、256*256、128*128、64*64、32*32，5种尺寸分别为原尺寸的1倍、1/2倍、1/4倍、1/8倍以及1/16倍，对应的通道数依次为原尺寸的1倍、2倍、4倍、8倍以及16倍，将解码步骤得到的5种不同尺寸的特征图与编码步骤具有相同尺寸的特征图进行通道相加(通道相加的原理例如512*512*1+512*512*3＝512*512*4)，根据相加后的结果通过3*3滤波器整合特征图的空间信息，消除上采样带来的混叠效应，并聚合通道信息，以减少计算量，提高模型的运行效率，从而得到特征图位置信息；然后整合所述语义信息和所述特征图位置信息(整合的含义：比如1024*1024*9的特征图通过一个3*3*9的卷积核变成了一个1024*1024*1的特征图，发现原来的通道为9，现在为1，我们称之为整合)，还原出图像掩模，图像掩模的大小与所述样本中的大小一致，通道数为1，即每个样本对应一个图像掩模512*512*1；其中图像掩模的灰度值若为1则代表归为红树林一类，若为0则为非红树林一类。

数据融合步骤：对解码步骤中得到的5种不同尺寸的特征图进行上采样，得到与样本的尺寸一样的特征图512*512，且本次上采样不改变通道数；给512*512、128*128、32*32最小的图像掩模(即分类结果)分别添加二值交叉熵损失函数，Dice系数差异损失函数和F1损失函数，将三个损失函数进行相加后得到总的损失函数；将数据融合步骤中进行上采样得到的5个特征图进行通道相加，利用3*3滤波器对本步骤中通道相加的结果进行特征图的空间信息和通道信息的整合，输出的特征图的通道数即为图像掩模的通道数，这里通道数为1，代表红树林的二值分类图，0代表非红树林，激活函数为sigmoid，通过精度评价指标IOU衡量图像掩模与标签文件之间的差异。

S6、根据两块NVIDIA GTX 1080Ti显卡的计算性能和模型参数量，将训练中的参数batch_size设为16，学习率learning设为0.001，调用train函数利用所述训练集对分类模型ME-net进行120轮的迭代训练，并利用验证集对每一轮训练后的模型进行120轮的迭代验证，在训练集和验证集关于分类模型ME-net的精度评价指标IOU均稳定之后，保存训练完成的分类模型ME-net，最后调用test函数在测试集检测训练完成的分类模型ME-net，模型的评价指标为IOU。以训练轮数为横轴，以IOU值为纵轴对训练过程进行可视化，经过几十轮的训练之后，IOU先上升然后无线逼近某个IOU值，最后在该值附近保持小范围的波动，而接下来的几十轮训练中，IOU值不随轮数的增加而增大或减小，则视为模型已经收敛，保存模型参数，停止训练，防止过拟合。在本实施例中即红树林自动分类模型ME-net的精度评价指标IOU在训练集到0.9387，验证集达到0.9372，并不再下降之后，保存模型，最后调用test函数在测试集检测精度IOU达到0.9214，然后继续步骤S7，若训练集和验证集的IOU不稳定，则回到步骤S4重新进行数据增强获取与之前不同的图片，并修改批量和学习率参数。

S7、在遥感影像的红树林分类结果输出之后，再通过条件随机场模型CRF对训练完成的分类模型ME-net进一步做后处理：利用条件随机场中的二元势函数对任意两个像素点间的颜色和位置进行约束，使得相近颜色和相邻位置的像素点更容易拥有相同的分类，同时考虑相邻像素点之间的平滑度，对边缘进行平滑，从而对语义分割结果进行细调，使得评价指标精度IOU更佳，从而得到最终的红树林分类模型。

S8、在得到最终的红树林分类模型后，通过flask框架将最终的红树林分类模型发布为HttpRest服务，客户端通过bas64编码工具base64.b64encode()将遥感影像转成的base64格式字符<img src＝“data:image/png；base64,*”/>，并发布post请求，服务响应post请求，并通过request.get_data()获取数据，再由base64.b64decode()解码出遥感影像，调用最终的红树林分类模型和后处理算法CRF，实现自动分类，再将分类结果映射在原始tiff数据中，最后将分类结果和映射结果分别通过base64编码返回。

根据本发明的另一方面，本发明为解决其技术问题，本发明还提供了一种基于深度卷积神经网络的遥感影像红树林提取系统，包含如下模块：

数据预处理模块，用于下载欧洲航天局的哨兵-2数据，通过Sen2cor中命令进行大气校正，通过SNAP软件对校正后的数据进行重采样，得到遥感影像各波段数据；

信息提取模块，用于通过遥感影像处理软件ENVI 5.3绘制研究区域以裁剪出海南岛的海滨地区，并通过波段运算计算出水域指数、归一化植被覆盖指数、森林指数、湿地森林指数和红树林指数5个指数信息，并与红绿蓝三个可见光波段以及一个短波红外波段一起一共9个波段数据，然后将9个波段数据划分为三组，以输出3个tiff文件；

标签文件制作模块，用于通过ArcGIS软件新建面矢量文件，加载所述3个tiff文件，并根据遥感解译的方法矢量化出真实的红树林覆盖区域，最终输出为png格式的灰度图mangrove.png，将灰度图mangrove.png二值化，二值化后的mangrove.png文件即为制作好的遥感影像红树林覆盖区域的标签文件；

数据集形成模块，用于基于所述3个tiff文件和所述标签文件，通过调用python内opencv-python库函数根据数据增强方法生成多张图片；每张图片对应一个标签文件和与标签文件对应的经过数据增强方法所形成的3个tiff文件，各标签文件与tiff文件的尺寸相同，标签文件为二值灰度图，通道数为1，tiff文件为三通道彩色影像，通道数为3；对tiff文件的像素值进行归一化处理，然后将归一化处理后所述多张图片进行划分，得到训练集、验证集和测试集；

分类模型建立模块，用于调用深度学习框架TensorFlow和Keras中的卷积层、池化层、损失函数与激活函数，从而搭建遥感影像语义的分类模型ME-net，其中分类模型ME-net在进行训练时每个样本有四个输入，分别为一个标签文件和对应的3个tiff文件；分类模型ME-net通过如下编码单元、解码单元和数据融合单元实现：

编码单元：对每个样本中的3个tiff文件做5次下采样，下采样采用所述池化层进行最大池化，分别输出5种不同尺寸的特征图，5种尺寸分别为原尺寸的1倍、1/2倍、1/4倍、1/8倍以及1/16倍，对应的通道数依次为原尺寸的1倍、2倍、4倍、8倍以及16倍；在每次对特征图做池化之前，先通过三个卷积层提取特征图的语义信息，即学习到红树林抽象的分类信息；

解码单元：对每个样本中3个tiff文件做5次上采样，上采样采用所述池化层进行最大池化，分别输出5种不同尺寸的特征图，5种尺寸分别为原尺寸的1倍、1/2倍、1/4倍、1/8倍以及1/16倍，对应的通道数依次为原尺寸的1倍、2倍、4倍、8倍以及16倍，将解码单元得到的5种不同尺寸的特征图与编码单元具有相同尺寸的特征图按通道相加，根据相加后的结果通过滤波器整合特征图的空间信息，从而得到特征图位置信息；然后整合所述语义信息和所述特征图位置信息，还原出图像掩模，图像掩模的大小与所述样本中的大小一致，通道数为1，即每个样本对应一个图像掩模；其中图像掩模的灰度值若为1则代表归为红树林一类，若为0则为非红树林一类；

数据融合单元：对解码单元中得到的5种不同尺寸的特征图进行上采样，得到与样本的尺寸一样的特征图，且本次上采样不改变通道数；给尺寸最大、中间、最小的图像掩模分别添加一个不同的所述损失函数，再将三个损失函数进行相加后得到总的损失函数；将数据融合步骤中进行上采样得到的5个特征图进行通道相加，利用滤波器对本步骤中通道相加的结果进行特征图的空间信息和通道信息的整合，输出特征图的通道数即图像掩模的通道数，这里通道数为1，代表红树林的二值分类图，激活函数为sigmoid，通过精度评价指标IOU衡量图像掩模与标签文件之间的差异；

模型训练模块，用于设置训练批量和学习率参数，调用train函数利用所述训练集对分类模型ME-net进行迭代训练，并在分类模型ME-net的精度评价指标IOU稳定之后，保存训练完成的分类模型ME-net，最后调用test函数在测试集检测训练完成的分类模型ME-net，模型的评价指标为IOU；以训练轮数为横轴，以IOU值为纵轴对训练过程进行可视化，经过几十轮的训练之后，IOU先上升然后无线逼近某个IOU值，最后在该值附近保持小范围的波动，而接下来的几十轮训练中，IOU值不随轮数的增加而增大或减小，则视为模型已经收敛，保存模型参数，停止训练，防止过拟合，然后继续步骤S7，若训练集和验证集的IOU不稳定，则回到步骤S4重新进行数据增强获取与之前不同的图片，并修改批量和学习率参数；

模型细调模块，用于在分类结果输出之后，再通过条件随机场模型CRF对训练完成的分类模型ME-net进一步做后处理：利用条件随机场中的二元势函数对任意两个像素点间的颜色和位置进行约束，使得相近颜色和相邻位置的像素点更容易拥有相同的分类，同时考虑相邻像素点之间的平滑度，对边缘进行平滑，从而对语义分割结果进行细调，使得评价指标精度IOU更佳，从而得到最终的红树林分类模型；

模型应用模块，用于在得到最终的红树林分类模型后，通过flask框架将最终的红树林分类模型发布为HttpRest服务，客户端通过bas64编码工具base64.b64encode()将遥感影像转成的base64格式字符<img src＝“data:image/png；base64,*”/>，并发布post请求，服务响应post请求，并通过request.get_data()获取数据，再由base64.b64decode()解码出遥感影像，调用最终的红树林分类模型和后处理算法CRF，实现自动分类，再将分类结果映射在原始tiff数据中，最后将分类结果和映射结果分别通过base64编码返回。

作为本发明的优选实施方式，数据集形成模块中，每张图片所包含的标签文件和tiff文件的尺寸大小为512*512。分类模型建立模块中的解码步骤和融合步骤中的滤波器均为3*3的滤波器。分类模型建立模块的融合步骤中融合步骤分别添加一个不同的所述损失函数是指给尺寸为512*512、128*128、32*32直接上采样到512*512的图像掩模文件分别添加二值交叉熵损失函数、Dice系数差异损失函数和F1损失函数。

上面结合附图对本发明的实施例进行了描述，但是本发明并不局限于上述的具体实施方式，上述的具体实施方式仅仅是示意性的，而不是限制性的，本领域的普通技术人员在本发明的启示下，在不脱离本发明宗旨和权利要求所保护的范围情况下，还可做出很多形式，这些均属于本发明的保护之内。

Claims

1.一种基于深度卷积神经网络的遥感影像红树林提取方法，其特征在于，包含如下步骤：

S1、下载欧洲航天局的哨兵-2数据，通过Sen2cor中命令进行大气校正，通过SNAP软件对校正后的数据进行重采样，得到遥感影像各波段数据；

S2、通过遥感影像处理软件ENVI 5.3绘制研究区域以裁剪出海南岛的海滨地区，并通过波段运算计算出水域指数、归一化植被覆盖指数、森林指数、湿地森林指数和红树林指数5个指数信息，并与红绿蓝三个可见光波段以及一个短波红外波段一起一共9个波段数据，然后将9个波段数据划分为三组，以输出3个tiff文件；

S3、通过ArcGIS软件新建面矢量文件，加载所述3个tiff文件，并根据遥感解译的方法矢量化出真实的红树林覆盖区域，最终输出为png格式的灰度图mangrove.png，将灰度图mangrove.png二值化，二值化后的mangrove.png文件即为制作好的遥感影像红树林覆盖区域的标签文件；

S4、基于所述3个tiff文件和所述标签文件，通过调用python内opencv-python库函数根据数据增强方法生成多张图片；每张图片对应一个标签文件和与标签文件对应的经过数据增强方法所形成的3个tiff文件，各标签文件与tiff文件的尺寸相同，标签文件为二值灰度图，通道数为1，tiff文件为三通道彩色影像，通道数为3；对tiff文件的像素值进行归一化处理，然后将归一化处理后所述多张图片进行划分，得到训练集、验证集和测试集；

S5、调用深度学习框架TensorFlow和Keras中的卷积层、池化层、损失函数与激活函数，从而搭建遥感影像语义的分类模型ME-net，其中分类模型ME-net在进行训练时每个样本有四个输入，分别为一个标签文件和对应的3个tiff文件；分类模型ME-net通过如下编码步骤、解码步骤和数据融合步骤实现：

编码步骤：对每个样本中的3个tiff文件做5次下采样，下采样采用所述池化层进行最大池化，分别输出5种不同尺寸的特征图，5种尺寸分别为原尺寸的1倍、1/2倍、1/4倍、1/8倍以及1/16倍，对应的通道数依次为原尺寸的1倍、2倍、4倍、8倍以及16倍；在每次对特征图做池化之前，先通过三个卷积层提取特征图的语义信息，即得到红树林抽象的分类信息；

解码步骤：对每个样本中3个tiff文件做5次上采样，上采样采用所述池化层进行最大池化，分别输出5种不同尺寸的特征图，5种尺寸分别为原尺寸的1倍、1/2倍、1/4倍、1/8倍以及1/16倍，对应的通道数依次为原尺寸的1倍、2倍、4倍、8倍以及16倍，将解码步骤得到的5种不同尺寸的特征图与编码步骤具有相同尺寸的特征图按通道相加，根据相加后的结果通过滤波器整合特征图的空间信息，从而得到特征图位置信息；然后整合所述语义信息和所述特征图位置信息，还原出图像掩模，图像掩模的大小与所述样本中的大小一致，通道数为1，即每个样本对应一个图像掩模；其中图像掩模的灰度值若为1则代表归为红树林一类，若为0则为非红树林一类；

数据融合步骤：对解码步骤中得到的5种不同尺寸的特征图进行上采样，得到与样本的尺寸一样的特征图，且本次上采样不改变通道数；给尺寸最大、中间、最小的图像掩模分别添加一个不同的所述损失函数，再将三个损失函数进行相加后得到总的损失函数；将数据融合步骤中进行上采样得到的5个特征图按通道相加，利用滤波器对本步骤中通道相加的结果进行特征图的空间信息和通道信息的整合，输出特征图的通道数即图像掩模的通道数，这里通道数为1，代表红树林的二值分类图，激活函数为sigmoid，通过精度评价指标IOU衡量图像掩模与标签文件之间的差异；

S6、设置训练批量和学习率参数，调用train函数利用所述训练集对分类模型ME-net进行迭代训练，并利用验证集对每一轮训练后的模型进行验证，在训练集和验证集关于分类模型ME-net的精度评价指标IOU均稳定之后，保存训练完成的分类模型ME-net，最后调用test函数在测试集检测训练完成的分类模型ME-net，模型的评价指标为IOU；以训练轮数为横轴，以IOU值为纵轴对训练过程进行可视化，经过几十轮的训练之后，IOU先上升然后无线逼近某个IOU值，最后在该值附近保持小范围的波动，而接下来的几十轮训练中，IOU值不随轮数的增加而增大或减小，则视为模型已经收敛，保存模型参数，停止训练，防止过拟合，然后继续步骤S7，若训练集和验证集的IOU不稳定，则回到步骤S4重新进行数据增强获取与之前不同的图片，并修改批量和学习率参数；

S7、在测试集的红树林分类结果输出之后，再通过条件随机场模型CRF对训练完成的分类模型ME-net进一步做后处理：利用条件随机场中的二元势函数对任意两个像素点间的颜色和位置进行约束，使得相近颜色和相邻位置的像素点更容易拥有相同的分类，同时考虑相邻像素点之间的平滑度，对边缘进行平滑，从而对语义分割结果进行细调，使得评价指标精度IOU更佳，从而得到最终的红树林分类模型。

2.根据权利要求1所述的基于深度卷积神经网络的遥感影像红树林提取方法，其特征在于，还包含如下步骤：

3.根据权利要求1所述的基于深度卷积神经网络的遥感影像红树林提取方法，其特征在于，步骤S4中，每张图片所包含的标签文件和tiff文件的尺寸大小为512*512。

4.根据权利要求1所述的基于深度卷积神经网络的遥感影像红树林提取方法，其特征在于，步骤S5中的解码步骤和融合步骤中的滤波器均为3*3的滤波器。

5.根据权利要求3所述的基于深度卷积神经网络的遥感影像红树林提取方法，其特征在于，步骤S5的融合步骤中融合步骤分别添加一个不同的所述损失函数是指给尺寸为512*512、128*128、32*32直接上采样到512*512的图像掩模文件分别添加二值交叉熵损失函数、Dice系数差异损失函数和F1损失函数。

6.一种基于深度卷积神经网络的遥感影像红树林提取系统，其特征在于，包含如下模块：

数据集形成模块，用于基于所述3个tiff文件和所述标签文件，通过调用python内opencv-python库函数根据数据增强方法生成多张图片；每张图片具有一个标签文件和与标签文件对应的经过数据增强方法所形成的3个tiff文件，各标签文件与tiff文件的尺寸相同，标签文件为二值灰度图，通道数为1，tiff文件为三通道彩色影像，通道数为3；对tiff文件的像素值进行归一化处理，然后将归一化处理后所述多张图片进行划分，得到训练集、验证集和测试集；

数据融合单元：对解码单元中得到的5种不同尺寸的特征图进行上采样，得到与样本的尺寸一样的特征图，且本次上采样不改变通道数；给尺寸最大、中间、最小的图像掩模分别添加一个不同的所述损失函数，再将三个损失函数进行相加后得到总的损失函数；将数据融合步骤中进行上采样得到的5个特征图进行通道相加，利用滤波器对本步骤中通道相加的结果进行特征图的空间信息和通道信息的整合，输出的特征图的通道数即图像掩模的通道，这里通道数为1，代表红树林的二值分类图激活函数为sigmoid，通过精度评价指标IOU衡量图像掩模与标签文件之间的差异；

模型训练模块，用于设置训练批量和学习率参数，调用train函数利用所述训练集对分类模型ME-net进行迭代训练，并利用验证集对每一轮训练后的模型进行验证，在训练集和验证集关于分类模型ME-net的精度评价指标IOU均稳定之后，保存训练完成的分类模型ME-net，最后调用test函数在测试集检测训练完成的分类模型ME-net，模型的评价指标为IOU；以训练轮数为横轴，以IOU值为纵轴对训练过程进行可视化，经过几十轮的训练之后，IOU先上升然后无线逼近某个IOU值，最后在该值附近保持小范围的波动，而接下来的几十轮训练中，IOU值不随轮数的增加而增大或减小，则视为模型已经收敛，保存模型参数，停止训练，防止过拟合，然后继续步骤S7，若训练集和验证集的IOU不稳定，则回到步骤S4重新进行数据增强获取与之前不同的图片，并修改批量和学习率参数；

模型细调模块，用于在测试集的红树林分类结果输出之后，再通过条件随机场模型CRF对训练完成的分类模型ME-net进一步做后处理：利用条件随机场中的二元势函数对任意两个像素点间的颜色和位置进行约束，使得相近颜色和相邻位置的像素点更容易拥有相同的分类，同时考虑相邻像素点之间的平滑度，对边缘进行平滑，从而对语义分割结果进行细调，使得评价指标IOU更佳，从而得到最终的红树林分类模型。

7.根据权利要求6所述的基于深度卷积神经网络的遥感影像红树林提取系统，其特征在于，还包含如下模块：

8.根据权利要求6所述的基于深度卷积神经网络的遥感影像红树林提取系统，其特征在于，数据集形成模块中，每张图片所包含的标签文件和tiff文件的尺寸大小为512*512。

9.根据权利要求6所述的基于深度卷积神经网络的遥感影像红树林提取系统，其特征在于，分类模型建立模块中的解码步骤和融合步骤中的滤波器均为3*3的滤波器。

10.根据权利要求8所述的基于深度卷积神经网络的遥感影像红树林提取系统，其特征在于，分类模型建立模块的融合步骤中融合步骤分别添加一个不同的所述损失函数是指给尺寸为512*512、128*128、32*32直接上采样到512X 512的图像掩模文件分别添加二值交叉熵损失函数、Dice系数差异损失函数和F1损失函数。