CN114863274A - 基于深度学习的地表绿网苫盖提取方法 - Google Patents
基于深度学习的地表绿网苫盖提取方法 Download PDFInfo
- Publication number
- CN114863274A CN114863274A CN202210446913.0A CN202210446913A CN114863274A CN 114863274 A CN114863274 A CN 114863274A CN 202210446913 A CN202210446913 A CN 202210446913A CN 114863274 A CN114863274 A CN 114863274A
- Authority
- CN
- China
- Prior art keywords
- model
- image
- data
- green net
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于深度学习的地表绿网苫盖提取方法,包括以下步骤:步骤S1、获取数据;步骤S2、数据预处理;步骤S3、样本数据集制作;步骤S4、基于深度神经网络进行模型构建;步骤S5、深度神经网络模型训练;步骤S6、深度神经网络模型测试;步骤S7、端到端提取模型整合完善。本发明主要利用深度神经网络构建模型从高分辨率遥感影像中提取绿网苫盖图斑,来获取绿网苫盖在城市中的分布和数量,提高绿网苫盖提取的精度,提升城市管理的自动化、智能化水平,可为城市规划、生态环境建设和城市精细管理提供支持,对城市扩张模式的研究与城市建设管理提供辅助。
Description
技术领域
本发明涉及一种地表绿网苫盖提取方法,尤其涉及一种基于深度学习的地表绿网苫盖提取方法。
背景技术
城市发展带动了整个社会经济发展,城市建设成为现代化建设的重要引擎,也带来了大量的施工建设工地。然而施工建设过程会对周边环境造成污染,所以在实际建设过程中,相关管理部门和施工企业需要采取有效的应对措施最大程度的减少施工现场各类污染,保护建设区域的周边环境。施工过程中使用绿网覆盖裸露的土地,可以有效的治理扬尘,这是治理扬尘的有效措施,因此绿网苫盖作为建筑工地抑尘的主要措施而被广泛使用。快速获取地表绿网苫盖的空间分布与数量信息,对防尘抑尘、生态环境保护措施的制定具有重要的指导意义。
目前对于绿网苫盖的提取研究较少,尚未有系统性的方法技术提出,现主要依靠施工建设台账数据进行估算统计。现有的方法主要存在两个弊端:(1)缺乏精确性,从现有数据仅能得到施工建设的位置,无法得到具体的绿网苫盖分布和数量;(2)缺乏直观性,无法从图像的角度直观展示绿网苫盖的覆盖状况。而地理信息科学(GIS)技术的研究对象之一是地表要素的空间信息与属性信息,而绿网苫盖也是一种地表覆盖要素,因此可借助于GIS的方法进行绿网苫盖提取。而GIS方法的实现需要两方面的支撑,一是数据支撑,二是方法支撑。
在数据来源方面,遥感影像可为地表要素覆盖的提取提供可靠的数据来源。遥感作为一种重要的对地观测技术,通过人造卫星或者无人机向地面发送和接收电磁波信号的方式完成对地面物体的监测与分析。遥感影像具有全天候、覆盖广、更新快的优势,而且遥感影像具有地物种类多样化、地物特征复杂度高、地物信息丰富等特点,为地物要素提取提供了重要的信息来源。近年来我国测绘遥感卫星取得长足进步,快捷高效的获取海量高分辨率遥感数据已成为现实。
在技术方法方面,可对高分辨率遥感影像进行解译,提取目标地物要素。而地物要素的提取问题,本质上属于语义分割问题。图像语义分割是根据图像本身的纹理,颜色以及场景等信息,来得出图像中每个像素所属的类别信息。在语义分割任务中,需要准确的把图像中的每一个像素分类到一个特定的类别,图像语义分割可以提供物体在图像中的类别信息,位置信息,姿态信息,以及环境信息等。遥感影像的语义分割方法可分为五类,分别是基于像素点的分割方法、基于边缘的分割方法、基于区域的分割方法、基于数学模型的分割方法、基于机器学习的分割方法。
近年来机器学习领域取得重大发展的是深度学习。深度学习方法是具有多个级别的表示学习方法,由多个简单但非线性的模块构成,每个模块将该层的特征信息转换为更高层次的抽象表示,这样经过足够多的转换,就可以学习到非常复杂的信息。近年来,深度卷积神经网络已经应用到许多像素级分类的图像语义分割任务中,并涌现出了一系列优秀的网络,其中具有里程碑意义的工作是全卷积神经网络(FCN),它向人们展示了如何使用深度卷积神经网络对任意大小的输入图像进行端到端的逐像素语义分割。目前,基于FCN架构已演变出多种语义分割网络,如AlexNet、VGGNet、GoogleNet、U-Net等。深度学习的出现使得语义分割任务能够高效精准完成。
综上可知,从数据和方法层面都可以支撑本发明中利用深度学习网络提取绿网苫盖的实现。
发明内容
为了解决上述技术所存在的不足之处,本发明提供了一种基于深度学习的地表绿网苫盖提取方法,利用深度神经网络构建模型,从高分辨率遥感影像中提取绿网苫盖,既能够直观的反映绿网苫盖在城市中的分布,又能够提高绿网苫盖提取的精度。
为了解决以上技术问题,本发明采用的技术方案是:基于深度学习的地表绿网苫盖提取方法,包括以下步骤:
步骤S1、获取数据;
步骤S2、数据预处理;
步骤S3、样本数据集制作;
步骤S4、基于深度神经网络进行模型构建;
步骤S5、深度神经网络模型训练;
步骤S6、深度神经网络模型测试;
步骤S7、端到端提取模型整合完善。
优选的,步骤S1的过程为:确定要提取的地理区域范围,获取对应区域的某一年或者近几年的高分辨率遥感影像;如果提取的区域需要多幅影像覆盖,则应选择时间接近的影像,并且影像应少云或者无云。
优选的,步骤S2中,将收集的遥感影像数据进行预处理,使用ENVI软件对影像进行校正、镶嵌,必要时对镶嵌影像进行匀色,减少影像色差对提取结果的影响。
优选的,步骤S3中,利用经过预处理的数据构建样本数据集,准备好训练数据集、验证数据集和测试数据集,以供之后的模型训练和测试,具体包括以下步骤:
S31、将预处理后的遥感影像导入ArcGIS软件中;
S32、创建训练集区域的掩模AOImask;
S33、利用AOImask裁剪得到训练图像数据;
S34、在原始遥感影像上选定验证集区域,使用S32、S33中的方法和工具剪裁得到验证图像数据BOIimage.tif;
S35、在原始遥感影像上选定测试集区域,使用S32、S33中的方法和工具剪裁得到测试图像数据COIimage.tif;
S36、标注训练集区域的绿网苫盖要素;
S37、将矢量标签AOIshp转换为栅格标签AOIlabel;
S38、使用S36、S37中的方法和工具分别对验证集区域和测试集区域进行绿网苫盖的标注,得到栅格标签文件BOIlabel和COIlabel;
S39、对训练集影像文件AOIimage和标签文件AOIlabel进行裁剪;
S310、对裁剪后的训练样本进行“正样本”筛选;
S311、对筛选后的训练样本进行数据增强;
S312、使用S39中的方法对验证集影像文件BOIimage和标签文件BOIlabel进行裁剪,并整理放入相应的文件夹,得到验证集数据;
S313、使用S39中的方法对测试集影像文件COIimage和标签文件COIlabel进行裁剪,并整理放入相应的文件夹,得到测试集数据。
优选的,步骤S4中,以UNet 3+网络为基础构建深度学习网络模型,用于提取绿网苫盖,具体包括以下步骤:
S41、搭建TensorFlow深度学习环境;
S42、搭建模型核心架构:模型核心架构采用UNet 3+网络,该网络包括一侧的收缩路径,用于特征提取的编码器结构,另一侧的扩张路径,用于恢复图像尺寸实现像素级预测的解码器结构;
S43、在TensorFlow中构建模型功能模块,其包括数据读取模块,编码器解码器模块,精度评价模块;
其中,数据读取模块接收的是裁剪过后的影像和标签数据并对影像图片进行归一化处理;
编码器解码器模块即S42中的UNet 3+网络,该网络有5个输出值,将经过4次上采样的输出值作为模型的最终输出,而侧边输出值用于深度监督;
精度评价模块将模型提取的绿网苫盖图斑与标签中的绿网苫盖真值进行对比,计算精确度、召回率、总体精度、Kappa系数四个指标进行精度评价。
优选的,步骤S42中,模型的损失函数L采用focal loss和IoU loss的混合损失函数,如下所示:
L=Lfl+Liou
其中,Lfl表示focal loss,Liou表示IoU loss;
Focal loss的计算公式如下所示:
Lfl=-αt(1-pt)γlog(pt)
设y为地面真值,取值为0或1,p为模型预测的概率,p∈[0,1],那么αt与pt按下式计算:
Focal loss公式中α,γ为可调超参数,可设置初始值为α=0.25,γ=2,之后可根据模型训练效果进行调整;
IoU loss的计算公式如下:
其中,pi为第i个像素点的模型预测值,yi为第i个像素点的真值,N为总像素数。
优选的,步骤S43中,四个精度指标的计算方法如下:
设TP表示类别为正类的像元点预测为正类的像元点的个数,即实际为绿网苫盖像元且提取结果也为绿网苫盖的像元数;
TN表示类别为负类的像元点预测为负类的像元点的个数,即实际为非绿网苫盖像元且提取结果也为非绿网苫盖的像元数;
FP表示类别为负类的像元点预测为正类像元点的个数,即实际为非绿网苫盖像元而提取结果为绿网苫盖的像元数;
FN为类别为正类的像元点预测为负类的像元点的个数,即实际为绿网苫盖像元而提取结果为非绿网苫盖的像元数;
精确度也叫查准率,是针对预测结果而言的,表示的是预测为正的样本中有多少是真正的正样本,按如下公式计算:
召回率也叫查全率,是针对原来的样本而言的,表示的是样本中的正例有多少被预测正确了,按如下公式计算:
总精度是所有的分类正确的样本数占总样本数的比例,按如下公式计算:
Kappa系数是一个一致性检验的指标,检验模型预测结果和真实情况是否一致,其取值范围是[-1,1],实际应用中,一般是[0,1],这个系数的值越高,则代表模型实现的分类准确度越高,kappa系数的计算公式如下:
公式中N代表总样本个数。
优选的,步骤S5中,对步骤S4的构建模型进行训练,使模型学习提取特征,具体步骤如下:
S51、获取训练数据的图像和标签路径,获取验证数据的图像和标签路径,将相应路径填入模型的数据读取模块;
S52、设定超参数的初始值;
S53、模型读取训练数据,使用梯度下降方法更新模型参数进行模型训练,并在训练过程中对验证集数据测试模型的提取效果,达到指定epoch时结束训练,记录下训练集和验证集上的loss曲线,并计算相应的评价指标;
S54、对模型超参数进行优化,首先根据上一步训练的loss曲线和精度指标确定超参数的候选值,采用网格搜索法逐一测试不同超参数候选值对模型效果的影响,选取使模型提取效果达到最优的超参数,以达到模型优化的目的;
S55、将训练好的模型保存到指定路径。
优选的,步骤S6中,利用测试集数据进行模型测试,具体步骤如下:
S61、读取步骤S313中处理好的测试集数据,输入步骤S55中训练好的模型,进行模型预测;
S62、查看模型在测试集上运行的精度指标是否落在与验证集上的精度指标相近的区间;
S63、将测试集数据多次输入模型运行,记录每次模型提取的精度指标,以测试模型的稳定性。
优选的,步骤S7中,将经过测试的模型进行整合完善,具体过程如下:
S71、整合模型功能模块,按流程确定以下功能模块,包括数据读取模块、影像裁剪模块、归一化处理模块、网络预测模块、影像拼接模块、结果可视化模块;
S72、整合完善数据读取模块,使用GDAL读取TIFF格式的遥感影像,记录下影像行列数、栅格数据值、波段数、仿射矩阵、投影信息;
S73、完善影像裁剪模块,采用网格移动方法裁剪输入的大尺寸图像,可设置裁剪尺寸和重叠率参数;
S74、完善归一化处理模块,对裁剪后的图像进行归一化处理;
S75、整合网络预测模块,将步骤S74处理后的图像输入经过步骤S5、S6训练和测试后的网络模型中,得出预测提取图像;
S76、完善影像拼接模块,将上一步模型预测出的小尺寸图像进行拼接,还原为与原始图像尺寸相对应的提取结果;
S77、完善结果可视化模块,使用Matplotlib库将上一步得到的结果绘制出来,显示结果是一幅二值图像,白色为提取出的绿网苫盖要素,黑色为背景。
本发明提供了一种从高分辨率遥感影像中提取地表绿网苫盖要素的方法,弥补了此处技术方法的空缺,可以提高绿网苫盖提取的精度,直观反映绿网苫盖在城市中的分布。本方法具有可推广性,按照本方法各地可建立本地的样本数据集进行网络训练,构建适合本地区域的模型进行绿网苫盖的提取,可实现城市绿网苫盖的自动化提取,极大减轻人工负担,可为当地生态环境建设、规划建设和精细管理提供数据和技术支持,为城市规划、管理和决策提供参考。
附图说明
图1为本发明的整体流程框架图。
图2为本发明UNet 3+网络结构示意图。
具体实施方式
下面结合附图和具体实施方式对本发明作进一步详细的说明。
如图1所示的基于深度学习的地表绿网苫盖提取方法,主要利用深度神经网络构建模型从高分辨率遥感影像中提取绿网苫盖图斑,来获取绿网苫盖在城市中的分布和数量,提高绿网苫盖提取的精度,提升城市管理的自动化、智能化水平,可为城市规划、生态环境建设和城市精细管理提供支持,对城市扩张模式的研究与城市建设管理提供辅助,具体包括以下步骤:
步骤S1、获取数据:确定要提取的地理区域范围,获取对应区域的某一年或者近几年的高分辨率遥感影像,例如北京地区的可采用北京二号卫星的0.8米分辨率的遥感影像。如果提取的区域需要多幅影像覆盖,则应选择时间接近的影像,并且影像应少云或者无云。此外可根据实际需要搜集相关辅助数据,如行政边界矢量数据、外业实地调绘数据等。
步骤S2、数据预处理:将收集的遥感影像数据进行预处理,使用ENVI(TheEnvironment for Visualizing Images是一个完整的遥感图像处理平台)软件对影像进行校正、镶嵌,必要时对镶嵌影像进行匀色,减少影像色差对提取结果的影响。
步骤S3、样本数据集制作:利用经过预处理的数据构建样本数据集,准备好训练数据集、验证数据集和测试数据集,以供之后的模型训练和测试,具体包括以下步骤:
S31、将预处理后的遥感影像导入ArcGIS(ArcGIS产品线为用户提供一个可伸缩的,全面的GIS平台)软件中;
S32、创建训练集区域的掩模AOImask。选取训练集区域,创建一个训练集区域的掩模AOImask.shp,这个矢量用于裁剪训练集区域。元素类型为面要素,空间参考要和遥感影像保持一致;
S33、利用AOImask裁剪得到训练图像数据。利用ArcGIS工具箱里的【SpatialAnalyst Tools】->【Extraction】->【Extract by mask】工具裁剪原遥感影像得到训练图像数据AOIimage.tif;
S34、在原始遥感影像上选定验证集区域,使用S32、S33中的方法和工具剪裁得到验证图像数据BOIimage.tif;
S35、在原始遥感影像上选定测试集区域,使用S32、S33中的方法和工具剪裁得到测试图像数据COIimage.tif;
S36、标注训练集区域的绿网苫盖要素。首先在ArcCatalog(地理数据的资源管理器)中创建训练集区域的矢量标签文件AOIshp.shp,元素类型为面要素,添加一个名为Id的属性字段,字段类型为短整型,空间参考要和遥感影像保持一致,然后编辑该文件,用polygon(绘制多边形函数)逐个标注勾画需要提取的绿网苫盖地物,并将属性赋值为1,保存编辑结果;
S37、将矢量标签AOIshp转换为栅格标签AOIlabel。利用ArcGIS工具箱里的【Conversion Tools】->【To Raster】->【Feature to Raster】工具将得到的矢量标签AOIshp.shp转成栅格标签AOIlabel.tif。字段Field选择Id,输出像元大小选择AOIimage.tif,另外需要在环境设置里的处理范围设置为与AOIimage.tif一致。该栅格标签中目标地物(绿网苫盖)的值为1,其他部分(视为背景)的值为0;
S38、使用S36、S37中的方法和工具分别对验证集区域和测试集区域进行绿网苫盖的标注,得到栅格标签文件BOIlabel和COIlabel;
S39、对训练集影像文件AOIimage和标签文件AOIlabel进行裁剪。分别使用滑动窗口方法进行裁剪,两者采用相同的裁剪参数,保持相同的滑动窗口大小和窗口重叠度,得到一系列尺寸相同的小栅格图片,分别放入影像和标签两个文件夹。裁剪后的影像文件和对应的标签文件采用相同的命名,并分别放入相应的文件夹,作为初步的训练样本;
S310、对裁剪后的训练样本进行“正样本”筛选,所谓正样本指的是包含目标地物的图片,不含目标地物的图片称为负样本。具体方法是将训练集标签文件夹中值不全为0的标签图片(正样本)挑选出来,同时根据文件名把相对应的影像图片挑选出来,得到筛选后的训练样本;
S311、对筛选后的训练样本进行数据增强。数据增强方式包括平移、旋转、裁剪、翻转、缩放等,对影像图片和标签图片采用同样的数据增强操作,产生的新影像图片和相应的标签图片采用相同的名字命名并分别放入相应的文件夹,得到数据增强后的训练样本;
S312、使用S39中的方法对验证集影像文件BOIimage和标签文件BOIlabel进行裁剪,并整理放入相应的文件夹,得到验证集数据;
S313、使用S39中的方法对测试集影像文件COIimage和标签文件COIlabel进行裁剪,并整理放入相应的文件夹,得到测试集数据。
最终的训练集、验证集、测试集数据组织形式如下所示:
——训练集
——影像
——标签
——验证集
——影像
——标签
——测试集
——影像
——标签
步骤S4、基于深度神经网络进行模型构建:以UNet 3+网络为基础构建深度学习网络模型,用于提取绿网苫盖,具体包括以下步骤:
S41、搭建TensorFlow深度学习环境。
TensorFlow是一个端到端的开源机器学习平台,TensorFlow的安装分为CPU(中央处理器)版本和GPU(图形处理器)版本,CPU版本适用性较广,但是运算速度较慢,GPU版本运行速度更快,但是要求机器的显卡必须是NVIDIA的显卡,因为只有NVIDIA显卡才能开启CUDA(Compute Unified Device Architecture,是显卡厂商NVIDIA推出的运算平台)加速。TensorFlow-GPU深度学习环境的搭建需要以下几步:
①根据TensorFlow官网的相容性列表(https://tensorflow.google.cn/install/source_windows?hl=en#gpu)确定相对应的TensorFlow、Python(计算机编程语言)、CUDA、cuDNN(深度神经网络库(cuDNN)是GPU加速的用于深度神经网络的原语库)相容版本,如表1所示;
表1 TensorFlow版本兼容表
②安装Anaconda(开源的Python发行版本);
③从NVIDIA官网(https://developer.nvidia.com/cuda-downloads)下载CUDA并安装;
④从官网下载cuDNN,cuDNN下载完成之后是一个压缩文件,需解压缩然后将解压后的文件复制到CUDA安装路径下的cuDNN文件夹,完成cuDNN的安装;
⑤安装选定版本的TensorFlow-GPU。
S42、搭建模型核心架构。
模型核心架构采用UNet 3+网络,如图2所示。该网络左侧是收缩路径(编码器结构),用于特征提取,右侧是扩张路径(解码器结构),用于恢复图像尺寸实现像素级预测。在收缩路径中,网络重复使用3×3卷积和最大池化运算来进行下采样。在扩展路径中,采用全尺度跳跃链接进行上采样,UNet 3+中的每一个解码器层都融合了来自编码器中的大尺寸、同尺寸的特征图以及来自解码器的小尺寸的特征图,这些特征图捕获了全尺度下的细粒度语义和粗粒度语义。UNet 3+还采用了全尺度深度监督,对每个解码器阶段的侧边输出利用地面真实值进行监督。
模型的损失函数L采用focal loss和IoU loss的混合损失函数,如下所示:
L=Lfl+Liou
其中,Lfl表示focal loss,Liou表示IoU loss;
Focal loss的计算公式如下所示:
Lfl=-αt(1-pt)γlog(pt)
设y为地面真值,取值为0或1,p为模型预测的概率,p∈[0,1],那么αt与pt按下式计算:
Focal loss公式中α,γ为可调超参数,可设置初始值为α=0.25,γ=2,之后可根据模型训练效果进行调整;
IoU loss的计算公式如下:
其中,pi为第i个像素点的模型预测值,yi为第i个像素点的真值,N为总像素数。
S43、在TensorFlow中构建模型功能模块,其包括数据读取模块,编码器解码器模块,精度评价模块。
数据读取模块接收的是裁剪过后的影像和标签数据并对影像图片进行归一化处理;
编码器解码器模块即S42中的UNet 3+网络,该网络有5个输出值,将经过4次上采样的输出值作为模型的最终输出,而侧边输出值用于深度监督;
精度评价模块将模型提取的绿网苫盖图斑与标签中的绿网苫盖真值进行对比,计算精确度、召回率、总体精度、Kappa系数四个指标进行精度评价。
下面对这四个精度指标的计算方法进行说明。
设TP(True Positive)表示类别为正类的像元点预测为正类的像元点的个数,即实际为绿网苫盖像元且提取结果也为绿网苫盖的像元数;
TN(True Negative)表示类别为负类的像元点预测为负类的像元点的个数,即实际为非绿网苫盖像元且提取结果也为非绿网苫盖的像元数;
FP(False Positive)表示类别为负类的像元点预测为正类像元点的个数,即实际为非绿网苫盖像元而提取结果为绿网苫盖的像元数;
FN(False Negative)为类别为正类的像元点预测为负类的像元点的个数,即实际为绿网苫盖像元而提取结果为非绿网苫盖的像元数,如下表所示。
类别 | 提取为绿网苫盖 | 提取为非绿网苫盖 |
实际为绿网苫盖 | TP | FN |
实际非绿网苫盖 | FP | TN |
精确度(Precision)也叫查准率,是针对预测结果而言的,表示的是预测为正的样本中有多少是真正的正样本,按如下公式计算:
召回率(Recall)也叫查全率,是针对原来的样本而言的,表示的是样本中的正例有多少被预测正确了,按如下公式计算:
总精度(Overall Accuracy)是所有的分类正确的样本数(正类预测为正类、反类预测为反类)占总样本数的比例,按如下公式计算:
Kappa系数一个一致性检验的指标,检验模型预测结果和真实情况是否一致。这个系数的取值范围是[-1,1],实际应用中,一般是[0,1],这个系数的值越高,则代表模型实现的分类准确度越高。kappa系数的计算公式如下:
公式中N代表总样本个数。
步骤S5、深度神经网络模型训练:对构建模型进行训练,使模型学习提取特征,具体的方法如下:
S51、获取训练数据的图像和标签路径,获取验证数据的图像和标签路径,将相应路径填入模型的数据读取模块;
S52、设定超参数的初始值,例如batch size设为2,epoch设置为100,初始学习率learning rate设为e-4;(batch size为每批数据量的大小;一个epoch表示:所有的数据送入网络中,完成了一次前向计算+反向传播的过程)。
S53、模型读取训练数据,使用梯度下降方法更新模型参数进行模型训练,并在训练过程中对验证集数据测试模型的提取效果,达到指定epoch时结束训练,记录下训练集和验证集上的loss曲线,并计算相应的精确度、召回率等评价指标;
S54、对模型超参数进行优化,首先根据上一步训练的loss曲线和精度指标确定batch size,epoch、调整参数初始化方法(如Xavier初始化和He初始化)、梯度下降方法(如Adam、RMSprop等)等超参数的候选值,采用网格搜索法逐一测试不同超参数候选值对模型效果的影响,选取使模型提取效果达到最优的超参数,以达到模型优化的目的;
S55、将训练好的模型保存到指定路径。
步骤S6、深度神经网络模型测试:利用测试集数据进行模型测试,具体步骤如下:
S61、读取步骤S313中处理好的测试集数据,输入步骤S55中训练好的模型,进行模型预测;
S62、查看模型在测试集上运行的精度指标是否落在与验证集上的精度指标相近的区间;
S63、将测试集数据多次输入模型运行,记录每次模型提取的精度指标,以测试模型的稳定性。
步骤S7、端到端提取模型整合完善。
将经过测试的模型进行整合完善。上述步骤中模型的输入是裁剪过后的小尺寸图像和标签,输出的也是与输入图像相对应的绿网苫盖提取结果,该提取结果以小尺寸的栅格图片形式呈现,呈现方式较为细碎不利于提取内容的直观展现,如果得到相对完整的大尺寸提取结果,需要对模型进行整合完善,以达到端对端的效果,即输入大尺寸的遥感影像,经过模型得到的是相对应的大尺寸的绿网苫盖提取图像,具体步骤如下:
S71、整合模型功能模块,按流程确定以下功能模块,包括数据读取模块、影像裁剪模块、归一化处理模块、网络预测模块、影像拼接模块、结果可视化模块。
S72、整合完善数据读取模块,使用GDAL(开源栅格空间数据转换库)读取TIFF(TagImage File Format,标签图像文件格式)格式的遥感影像,记录下影像行列数、栅格数据值、波段数、仿射矩阵、投影等信息;
S73、完善影像裁剪模块,采用网格移动方法裁剪输入的大尺寸图像,可设置裁剪尺寸和重叠率参数;
S74、完善归一化处理模块,对裁剪后的图像进行归一化处理;
S75、整合网络预测模块,将S74处理后的图像输入经过步骤S5、S6训练和测试后的网络模型中,得出预测提取图像;
S76、完善影像拼接模块,将上一步模型预测出的小尺寸图像进行拼接,还原为与原始图像尺寸相对应的提取结果;
S77、完善结果可视化模块,使用Matplotlib库(Matplotlib是一个Python的2D绘图库)将上一步得到的结果绘制出来,显示结果是一幅二值图像,白色为提取出的绿网苫盖要素,黑色为背景。
利用本发明方法对地表绿网苫盖进行动态监测与管理,可为城市规划、生态环境建设和城市精细管理提供数据和技术支持,对城市扩张模式的研究与城市建设管理具有重要意义。
上述实施方式并非是对本发明的限制,本发明也并不仅限于上述举例,本技术领域的技术人员在本发明的技术方案范围内所做出的变化、改型、添加或替换,也均属于本发明的保护范围。
Claims (10)
1.基于深度学习的地表绿网苫盖提取方法,其特征在于:提取方法包括以下步骤:
步骤S1、获取数据;
步骤S2、数据预处理;
步骤S3、样本数据集制作;
步骤S4、基于深度神经网络进行模型构建;
步骤S5、深度神经网络模型训练;
步骤S6、深度神经网络模型测试;
步骤S7、端到端提取模型整合完善。
2.根据权利要求1所述的基于深度学习的地表绿网苫盖提取方法,其特征在于:所述步骤S1的过程为:确定要提取的地理区域范围,获取对应区域的某一年或者近几年的高分辨率遥感影像;如果提取的区域需要多幅影像覆盖,则应选择时间接近的影像,并且影像应少云或者无云。
3.根据权利要求1所述的基于深度学习的地表绿网苫盖提取方法,其特征在于:所述步骤S2中,将收集的遥感影像数据进行预处理,使用ENVI软件对影像进行校正、镶嵌,必要时对镶嵌影像进行匀色,减少影像色差对提取结果的影响。
4.根据权利要求1所述的基于深度学习的地表绿网苫盖提取方法,其特征在于:所述步骤S3中,利用经过预处理的数据构建样本数据集,准备好训练数据集、验证数据集和测试数据集,以供之后的模型训练和测试,具体包括以下步骤:
S31、将预处理后的遥感影像导入ArcGIS软件中;
S32、创建训练集区域的掩模AOImask;
S33、利用AOImask裁剪得到训练图像数据;
S34、在原始遥感影像上选定验证集区域,使用S32、S33中的方法和工具剪裁得到验证图像数据BOIimage.tif;
S35、在原始遥感影像上选定测试集区域,使用S32、S33中的方法和工具剪裁得到测试图像数据COIimage.tif;
S36、标注训练集区域的绿网苫盖要素;
S37、将矢量标签AOIshp转换为栅格标签AOIlabel;
S38、使用S36、S37中的方法和工具分别对验证集区域和测试集区域进行绿网苫盖的标注,得到栅格标签文件BOIlabel和COIlabel;
S39、对训练集影像文件AOIimage和标签文件AOIlabel进行裁剪;
S310、对裁剪后的训练样本进行“正样本”筛选;
S311、对筛选后的训练样本进行数据增强;
S312、使用S39中的方法对验证集影像文件BOIimage和标签文件BOIlabel进行裁剪,并整理放入相应的文件夹,得到验证集数据;
S313、使用S39中的方法对测试集影像文件COIimage和标签文件COIlabel进行裁剪,并整理放入相应的文件夹,得到测试集数据。
5.根据权利要求1所述的基于深度学习的地表绿网苫盖提取方法,其特征在于:所述步骤S4中,以UNet 3+网络为基础构建深度学习网络模型,用于提取绿网苫盖,具体包括以下步骤:
S41、搭建TensorFlow深度学习环境;
S42、搭建模型核心架构:模型核心架构采用UNet 3+网络,该网络包括一侧的收缩路径,用于特征提取的编码器结构,另一侧的扩张路径,用于恢复图像尺寸实现像素级预测的解码器结构;
S43、在TensorFlow中构建模型功能模块,其包括数据读取模块,编码器解码器模块,精度评价模块;
其中,数据读取模块接收的是裁剪过后的影像和标签数据并对影像图片进行归一化处理;
编码器解码器模块即S42中的UNet 3+网络,该网络有5个输出值,将经过4次上采样的输出值作为模型的最终输出,而侧边输出值用于深度监督;
精度评价模块将模型提取的绿网苫盖图斑与标签中的绿网苫盖真值进行对比,计算精确度、召回率、总体精度、Kappa系数四个指标进行精度评价。
6.根据权利要求5所述的基于深度学习的地表绿网苫盖提取方法,其特征在于:所述步骤S42中,模型的损失函数L采用focal loss和IoU loss的混合损失函数,如下所示:
L=Lfl+Liou
其中,Lfl表示focal loss,Liou表示IoU loss;
Focal loss的计算公式如下所示:
Lfl=-αt(1-pt)γlog(pt)
设y为地面真值,取值为0或1,p为模型预测的概率,p∈[0,1],那么αt与pt按下式计算:
Focal loss公式中α,γ为可调超参数,可设置初始值为α=0.25,γ=2,之后可根据模型训练效果进行调整;
IoU loss的计算公式如下:
其中,pi为第i个像素点的模型预测值,yi为第i个像素点的真值,N为总像素数。
7.根据权利要求5所述的基于深度学习的地表绿网苫盖提取方法,其特征在于:所述步骤S43中,四个精度指标的计算方法如下:
设TP表示类别为正类的像元点预测为正类的像元点的个数,即实际为绿网苫盖像元且提取结果也为绿网苫盖的像元数;
TN表示类别为负类的像元点预测为负类的像元点的个数,即实际为非绿网苫盖像元且提取结果也为非绿网苫盖的像元数;
FP表示类别为负类的像元点预测为正类像元点的个数,即实际为非绿网苫盖像元而提取结果为绿网苫盖的像元数;
FN为类别为正类的像元点预测为负类的像元点的个数,即实际为绿网苫盖像元而提取结果为非绿网苫盖的像元数;
精确度也叫查准率,是针对预测结果而言的,表示的是预测为正的样本中有多少是真正的正样本,按如下公式计算:
召回率也叫查全率,是针对原来的样本而言的,表示的是样本中的正例有多少被预测正确了,按如下公式计算:
总精度是所有的分类正确的样本数占总样本数的比例,按如下公式计算:
Kappa系数是一个一致性检验的指标,检验模型预测结果和真实情况是否一致,其取值范围是[-1,1],实际应用中,一般是[0,1],这个系数的值越高,则代表模型实现的分类准确度越高,kappa系数的计算公式如下:
公式中N代表总样本个数。
8.根据权利要求1所述的基于深度学习的地表绿网苫盖提取方法,其特征在于:所述步骤S5中,对步骤S4的构建模型进行训练,使模型学习提取特征,具体步骤如下:
S51、获取训练数据的图像和标签路径,获取验证数据的图像和标签路径,将相应路径填入模型的数据读取模块;
S52、设定超参数的初始值;
S53、模型读取训练数据,使用梯度下降方法更新模型参数进行模型训练,并在训练过程中对验证集数据测试模型的提取效果,达到指定epoch时结束训练,记录下训练集和验证集上的loss曲线,并计算相应的评价指标;
S54、对模型超参数进行优化,首先根据上一步训练的loss曲线和精度指标确定超参数的候选值,采用网格搜索法逐一测试不同超参数候选值对模型效果的影响,选取使模型提取效果达到最优的超参数,以达到模型优化的目的;
S55、将训练好的模型保存到指定路径。
9.根据权利要求1所述的基于深度学习的地表绿网苫盖提取方法,其特征在于:所述步骤S6中,利用测试集数据进行模型测试,具体步骤如下:
S61、读取步骤S313中处理好的测试集数据,输入步骤S55中训练好的模型,进行模型预测;
S62、查看模型在测试集上运行的精度指标是否落在与验证集上的精度指标相近的区间;
S63、将测试集数据多次输入模型运行,记录每次模型提取的精度指标,以测试模型的稳定性。
10.根据权利要求1所述的基于深度学习的地表绿网苫盖提取方法,其特征在于:所述步骤S7中,将经过测试的模型进行整合完善,具体过程如下:
S71、整合模型功能模块,按流程确定以下功能模块,包括数据读取模块、影像裁剪模块、归一化处理模块、网络预测模块、影像拼接模块、结果可视化模块;
S72、整合完善数据读取模块,使用GDAL读取TIFF格式的遥感影像,记录下影像行列数、栅格数据值、波段数、仿射矩阵、投影信息;
S73、完善影像裁剪模块,采用网格移动方法裁剪输入的大尺寸图像,可设置裁剪尺寸和重叠率参数;
S74、完善归一化处理模块,对裁剪后的图像进行归一化处理;
S75、整合网络预测模块,将步骤S74处理后的图像输入经过步骤S5、S6训练和测试后的网络模型中,得出预测提取图像;
S76、完善影像拼接模块,将上一步模型预测出的小尺寸图像进行拼接,还原为与原始图像尺寸相对应的提取结果;
S77、完善结果可视化模块,使用Matplotlib库将上一步得到的结果绘制出来,显示结果是一幅二值图像,白色为提取出的绿网苫盖要素,黑色为背景。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210446913.0A CN114863274A (zh) | 2022-04-26 | 2022-04-26 | 基于深度学习的地表绿网苫盖提取方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210446913.0A CN114863274A (zh) | 2022-04-26 | 2022-04-26 | 基于深度学习的地表绿网苫盖提取方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114863274A true CN114863274A (zh) | 2022-08-05 |
Family
ID=82632798
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210446913.0A Pending CN114863274A (zh) | 2022-04-26 | 2022-04-26 | 基于深度学习的地表绿网苫盖提取方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114863274A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115601542A (zh) * | 2022-10-08 | 2023-01-13 | 湖北工业大学(Cn) | 基于全尺度密集连接的图像语义分割方法、系统及设备 |
-
2022
- 2022-04-26 CN CN202210446913.0A patent/CN114863274A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115601542A (zh) * | 2022-10-08 | 2023-01-13 | 湖北工业大学(Cn) | 基于全尺度密集连接的图像语义分割方法、系统及设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111986099B (zh) | 基于融合残差修正的卷积神经网络的耕地监测方法及系统 | |
CN110263717B (zh) | 一种融入街景影像的土地利用类别确定方法 | |
CN110598784B (zh) | 基于机器学习的建筑垃圾分类方法及装置 | |
CN111626947A (zh) | 基于生成对抗网络的地图矢量化样本增强方法及系统 | |
CN111914767B (zh) | 一种基于多源遥感数据的散乱污企业检测方法及系统 | |
CN112967255A (zh) | 一种基于深度学习的盾构管片缺陷类型识别及定位系统及其方法 | |
CN114241326B (zh) | 一种渐进式遥感影像地物要素智能生产方法及系统 | |
CN111626358B (zh) | 一种基于bim图片识别的隧道围岩分级方法 | |
CN113033516A (zh) | 对象识别统计方法及装置、电子设备、存储介质 | |
CN116343103B (zh) | 一种基于三维gis场景与视频融合的自然资源监管方法 | |
CN109978904A (zh) | 基于图像技术的挺水植物生长信息提取方法 | |
CN114863274A (zh) | 基于深度学习的地表绿网苫盖提取方法 | |
CN109657728B (zh) | 样例生产方法及模型训练方法 | |
CN114842356B (zh) | 一种高分辨率地表类型样本自动生成方法、系统及设备 | |
CN116229001A (zh) | 一种基于空间熵的城市三维数字地图生成方法及系统 | |
CN115713603A (zh) | 基于建筑空间图谱的多类型街区建筑群形态智能生成方法 | |
CN113610294A (zh) | 一种中小城市色彩规划方法、存储介质和装置 | |
CN114140703A (zh) | 一种森林松材线虫病害智能识别方法及系统 | |
CN112580504A (zh) | 基于高分辨率卫星遥感影像的树种分类计数方法及装置 | |
CN112101429A (zh) | 一种基于Mask R-CNN的地图地理环境自动识别方法 | |
CN117523417B (zh) | 应用于自然资源统一确权登记的方法及电子设备 | |
US11823364B1 (en) | Machine learning for artificial parcel data generation | |
CN112802049B (zh) | 一种家庭物品检测数据集构建方法及系统 | |
Vasilyeva et al. | Image Recognition for Large Soil Maps Archive Overview: Metadata Extraction and Georeferencing Tool Development | |
Yang et al. | An automated image analysis approach for classification and mapping of woody vegetation from digital aerial photograph |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |