发明内容
本发明所要解决的问题是:提出一种基于云计算平台森林扰动监测方法,能够有效解决在森林扰动监测中大量数据处理的复杂工作问题,解决森林扰动相关指数对大尺度、长时间序列的迅速应对变化问题。
本发明提出的技术方案如下:
一种基于云计算平台的森林扰动长时间序列监测方法,包括以下步骤:
步骤1:获取landsat遥感影像原始数据集,进行辐射定标、大气校正、去云预处理;然后进行监督分类,同时进行NDVI、NDWI滤波;
步骤2:获取landsat5、landsat7、landsat8经过大气校正的TOA反射率产品所需年份的长时间序列数据集;
步骤3:将步骤2形成的TOA产品数据集进行区域筛选、去云,云检测使用Fmask算法检测方法,挑选云量为20%以下的影像,并将其云进行掩膜;
步骤4:计算归一化水体指数(NDWI)、归一化植被指数(NDVI)、进行水体、植被的提取;
步骤5:将步骤4中的获取的结果提取森林样本,作为步骤3中获取的结果的掩膜数据,经过掩膜后的TOA数据将其进行缨帽变换;缨帽变换后分别计算三个变量亮度、绿度、湿度的平均值、标准差;
步骤6:对TOA产品数据集进行扰动值计算处理;
步骤7:选择长时间跨度的影像列表;
步骤8:计算扰动像元值及恢复像元值;
扰动平均值DIm=(DIμ1+DIμ2+...+DIμn)/n,其中DIμ1为第一年的森林扰动指数平均值,依次类推DIμn为第n年的森林扰动指数平均值;
扰动像元,如果DIn、DIn+1、DIn+2均大于阈值θ,则DIn为第n年扰动值,此时DIn对应的该像元为扰动像元。
恢复像元,如果DIn、DIn+1、DIn+2中DIn为扰动像元值,DIn+1、DIn+2均小于阈值θ,此时DIn对应的该像元为恢复像元;亮度值B越大,绿度值
G、湿度值W越小,DI值越大,扰动值越大,扰动程度越高;
步骤9:调整阈值θ;
步骤10:计算森林扰动面积、恢复面积、扰动比例、恢复比例:
扰动面积=扰动像元的总和
恢复面积=恢复像元的总和
扰动比例=扰动面积/总面积
恢复比例=恢复面积/总面积。
优选地,步骤1中所述监督分类的选取方式以landsat影像结合google earth地图进行选取样本,主要选择的样本是建筑、水体、耕地、森林。
优选地,步骤6中对TOA数据集进行扰动值计算处理按照以下公式进行计算:
森林扰动指数DI=Bt-(Gt+Wt)
标准化后的亮度Bt=(B-Bμ)/Bσ
标准化后的绿度Gt=(G-Gμ)/Gσ
标准化后的湿度Wt=(W-Wμ)/Wσ
森林扰动指数平均值DIμ=Bμ-(Gμ+Wμ)。
优选地,在步骤10之后,还包括步骤11:提取每年的扰动像元数量并按照其分辨率计算其面积,绘制成列表,并导出平台。
优选地,在步骤11之后,还包括步骤12:将长时间序列结果集导出,在arcgis中打开,并根据需要绘制成专题图。
本发明的基于云计算平台的森林扰动长时间序列监测方法与现有技术相比的优点在于:1)提高遥感数据处理效率;2)提高森林扰动像元的监测精度;3)增加时间研究尺度;4)解决对不同区域的监测应对变化难度。
具体实施方式
本发明的基于云计算平台森林扰动长时间序列监测方法的森林扰动监测算法的原理为:基于森林扰动DI算法的基础上并加以改进,DI指数在根据对影像波段的进行缨帽变化后,提取其主要的分量进行数学运算,以获取主要的森林扰动信息,其DI算法的主要原理如下:
森林扰动指数DI=Bt-(Gt+Wt)
标准化后的亮度Bt=(B-Bμ)/Bσ
标准化后的绿度Gt=(G-Gμ)/Gσ
标准化后的湿度Wt=(W-Wμ)/Wσ
森林扰动指数平均值DIμ=Bμ-(Gμ+Wμ)
B、G、W是影像缨帽变化后的对应第一分量即亮度、第二分量即绿度、第三分量即湿度;Bμ、Gμ、Wμ是缨帽变化后的对应亮度、绿度、湿度的平均值;Bσ、Gσ、Wσ是缨帽变换后的对应亮度、绿度、湿度的标准差;将以上按公式进行运算得到标准化后的亮度Bt、绿度Gt、湿度Wt;之后通过数学运算得到DI值。利用google earth engine(GEE)云计算平台,将缨帽变换、均值运算、方差运算、标准化运算、DI算法等实现JavaScript语言编写。将JavaScript语言编写的算法转换为GEE中的平台专用使用语言。
参见图1,示出本发明的流程示意图,总体上主要利用云计算数据库中的原始数据集以及TOA反射率数据;首先将landsat5、7、8原始影像数据去云、辐射定标、大气校正等预处理;然后进行监督分类,同时进行NDVI、NDWI滤波,目的是更好的过滤出森林样本,以便在后续计算中使用。再直接使用TOA反射率数据、通过相关函数进行所需影像的筛选,同时也进行去云处理。再次将第一步中的结果数据与TOA反射率数据进行合成,提取原始影像数据预处理结果中的分类森林样本作为第二次TOA反射率数据的掩膜数据。多次扰动信息提取以确定合适阈值并进行扰动信息提取。后处理工作主要包括结果统计、结果分析、装饰制图等。
根据本发明的基于云计算平台的森林扰动长时间序列监测方法的实施例,包括以下步骤:
步骤1:获取landsat遥感影像原始数据集,进行辐射定标、大气校正、去云等预处理;然后进行监督分类,同时进行NDVI、NDWI滤波;所述监督分类的选取方式以landsat影像结合google earth地图进行选取样本。这里主要选择的样本是建筑、水体、耕地、森林。
步骤2:获取landsat5、landsat7、landsat8经过大气校正的TOA反射率产品所需年份的长时间序列数据集。本发明使用的是landsat5、landsat7、langsat8的数据,获取1988-2017年的30年的影像并形成TOA数据集。
步骤3:将步骤2形成的TOA产品数据集进行区域筛选、去云,云检测使用zhe zhu等人2011年(Zhu Z,Woodcock C E.Object-based cloud and cloud shadow detection inLandsat imagery[J].Remote Sensing of Environment,2012,118(6):83-94.)的Fmask算法检测方法,挑选云量为20%以下的影像,并将其云进行掩膜。
图2为Fmask函数去云流程示意图。第一步识别潜在云层、潜在阴影层、潜在雪层,并把潜在云层分割为潜在阴影层以及云。第二步计算云基线高度同时迭代、并判断是否达到预测值,如果否则未匹配到云阴影;如果是则判断是否匹配相似性增加,依次如图进行判断。第三步如果同时满足相似性未增加、匹配相似性不大于最大匹配相似性的98%,同时匹配性高于0.3则判断为最后的掩膜。此已集成为一个函数,包括所有步骤,不再需要一步一步进行判断。
在步骤3中还包括提取潜在云层。
第一步:计算(归一化积雪指数)NDSI、(归一化植被指数)NDVI、(亮温)BT(band 6)
NDSI=(Band2-Band5)/(Band2+Band5)、
NDVI=(Band4-Band3)/(Band4+Band3)
其中:Band2为TM、ETM卫星波段2即绿波段,Band5为TM、ETM卫星波段5即中红外波段,Band4为TM、ETM卫星波段4即近红外波段,Band3为TM、ETM卫星波段3即红波段。
第二步:计算水体温度、净像元温度、亮度属性、水体云属性、陆地云属性。
第三步:提取潜在云层,同时满足
NDSI>0.15、BT<3.8、Band4>0.11、Band 2>0.1。
基于云和云阴影匹配,具体可见文献(Zhu Z,Woodcock C E.Object-based cloudand cloud shadow detection in Landsat imagery[J].Remote Sensing ofEnvironment,2012,118(6):83-94.)
步骤4:计算归一化水体指数(NDWI)、归一化植被指数(NDVI)、进行水体、植被的提取。
NDWI=(Band4-Band2)/(Band4+Band2)
NDVI=(Band4-Band3)/(Band4+Band3)
步骤5:将步骤4中的获取的结果提取森林样本,作为步骤3中获取的结果的掩膜数据,目的是只提取森林样本;经过掩膜后的TOA数据将其进行缨帽变换,由于缨帽变换矩阵对结果会产生很大影响,此处对于landsat5、landsat7、landsat8分别使用的缨帽变换矩阵如下(只提取变换后的前三个变量,分别为亮度、绿度、湿度):
landsat5:
[0.2909,0.2493,0.4806,0.5568,0.4438,0.1706],
[-0.2728,-0.2174,-0.5508,0.7221,0.0733,-0.1648],
[0.1446,0.1761,0.3322,0.3396,-0.6210,-0.4186],
landsat7、landsat8:
[0.3561,0.3972,0.3904,0.6966,0.2286,0.1596],
[-0.3344,-0.3544,-0.4556,0.6966,-0.0242,-0.2630],
[0.2626,0.2141,0.0926,0.0656,-0.7629,-0.5388]
缨帽变换后分别计算三个变量的平均值、标准差。
步骤6:对TOA数据集进行扰动值DI计算处理,按照以下公式进行计算:
森林扰动指数DI=Bt-(Gt+Wt)
标准化后的亮度Bt=(B-Bμ)/Bσ
标准化后的绿度Gt=(G-Gμ)/Gσ
标准化后的湿度Wt=(W-Wμ)/Wσ
森林扰动指数平均值DIμ=Bμ-(Gμ+Wμ)
步骤7:根据人工选择研究区的每年度中的时间范围内的效果最好的影像,可人工在美国地质勘探局(USGS)官网进行选择,也可以通过编写的小程序进行选择,并记录每年的选择的影像文件名,例:LT05_120039_19960902代表landsat5TM影像,条带号为120039,影像拍摄时间为1996.09.02,后面以此命名。以此方式,分别选择30年时间跨度的影像列表。
步骤8:计算扰动像元值及恢复像元值。
扰动平均值DIm=(DIμ1+DIμ2+...+DIμn)/n,其中DIμ1为第一年的森林扰动指数平均值,依次类推DIμn为第n年的森林扰动指数平均值。
扰动像元,如果DIn、DIn+1、DIn+2均大于阈值θ,则DIn为第n年扰动值,此时DIn对应的该像元为扰动像元。
恢复像元,如果DIn、DIn+1、DIn+2中DIn为扰动像元值,DIn+1、DIn+2均小于阈值θ,此时DI n对应的该像元为恢复像元。亮度值B越大,绿度值G、湿度值W越小,DI值越大,扰动值越大,扰动程度越高。
步骤9:调整阈值θ,原始阈值根据多篇参考文献(郁达威,沈润平,杨辰,刘荣高.武宁县森林扰动及驱动因子分析[J].生态与农村环境学报,2013,29(05):581-586.;HEALEYSP.Comparison of Tasseled Cap-Based Landsat Data Structures for Use inForest Disturbance Detection[J].Remote Sensing of Environment,2005,97(3):301-310.)进行选取,阈值θ的调整首先参考DIm平均值的大小,一般往大于DIm的方向选择。本发明中通过计算DIm值,且人工选取多个较好的持久森林样本参考其DI值,综合考虑后,本发明初次θ阈值选取为4.0,以步长为0.5,分别多次进行实验,比较其检测变化的范围大小程度以及监测效果,经过多次试验后确定阈值的取值。此处的阈值θ改变是最关键之处,也是本发明应用到其他试验区最便利之处,只需认真精确调整阈值的取值即可获得较好的效果。后面将展示不同阈值的选择对应不同的结果。
步骤10:计算森林扰动面积、恢复面积、扰动比例、恢复比例。
扰动面积=扰动像元的总和
恢复面积=恢复像元的总和
扰动比例=扰动面积/总面积
恢复比例=恢复面积/总面积
步骤11:提取每年的扰动像元数量并按照其分辨率计算其面积,绘制成列表,并导出平台。
步骤12:将30年的时间序列结果集导出,并在arcgis中打开,并根据需要绘制成专题图。
图3是采用本发明的方法对黄山森林扰动监测示意图。此图为本发明对黄山森林扰动变化监测成果示意图,由于图例较多,此处只展示1988、1998、2008、2017四幅图例,其中成果图中包括持续森林、水体、扰动面积、恢复面积、道路等多要素叠加。
图4为采用本发明的方法对黄山时序扰动信息提取示意图。此图为黄山自然遗产地1988-2017年30年的森林扰动面积以及恢复面积的趋势图,竖轴为面积单位为平方米,横轴为对应的年份,红色线表示的未扰动面积统计趋势,蓝色线为恢复面积统计趋势。
图5为扰动点的时间序列扰动值,此图为某一像元30年DI值的变化,从早期较高到越来越低的走势;此点也为实地验证过程中的点位,坐标为E 118°07'22.38″N 30°3'45.25"。
精度评价:
采用辅助数据,2017年哨兵数据,landsat原始数据,高分影像google earth数据进行目视解译。采用目视解译的方法,根据随机分层抽样原理,由于google高分影像限制,选取2008年-2017年10年的每年的扰动点,每层随机抽样30个样本;未扰动森林、非森林每层随机抽取样本100个,共500个像元点。根据精度评价混淆矩阵,计算制图精度,用户精度,总体精度,误检率,漏检率,kappa系数加以评价。总体精度为80.66%,Kappa系数为0.77(参见表1)。同时根据实地验证,挑选四种样本类型,分别为持续森林、早期扰动已恢复、多次扰动已恢复、近期扰动未恢复。实地验证其考察点的样本现状,以辅助验证提取精度。
表1精度混淆矩阵及评价表
以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。