CN114814167B - 融合多源环境变量与光谱信息的土壤重金属含量反演方法 - Google Patents

融合多源环境变量与光谱信息的土壤重金属含量反演方法 Download PDF

Info

Publication number
CN114814167B
CN114814167B CN202210365885.XA CN202210365885A CN114814167B CN 114814167 B CN114814167 B CN 114814167B CN 202210365885 A CN202210365885 A CN 202210365885A CN 114814167 B CN114814167 B CN 114814167B
Authority
CN
China
Prior art keywords
data
heavy metal
soil
spectral
inversion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210365885.XA
Other languages
English (en)
Other versions
CN114814167A (zh
Inventor
方华军
耿静
裴杰
李国旭
许选虹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Keji'an Ecological Environment Research Institute
Sun Yat Sen University
Original Assignee
China Keji'an Ecological Environment Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Keji'an Ecological Environment Research Institute filed Critical China Keji'an Ecological Environment Research Institute
Priority to CN202210365885.XA priority Critical patent/CN114814167B/zh
Publication of CN114814167A publication Critical patent/CN114814167A/zh
Application granted granted Critical
Publication of CN114814167B publication Critical patent/CN114814167B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/24Earth materials
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N27/00Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
    • G01N27/62Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating the ionisation of gases, e.g. aerosols; by investigating electric discharges, e.g. emission of cathode
    • G01N27/626Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating the ionisation of gases, e.g. aerosols; by investigating electric discharges, e.g. emission of cathode using heat to ionise a gas
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/24Earth materials
    • G01N33/245Earth materials for agricultural purposes

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Analytical Chemistry (AREA)
  • Pathology (AREA)
  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Environmental & Geological Engineering (AREA)
  • Remote Sensing (AREA)
  • Food Science & Technology (AREA)
  • General Life Sciences & Earth Sciences (AREA)
  • Geology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Electrochemistry (AREA)
  • Image Processing (AREA)
  • Geophysics And Detection Of Objects (AREA)

Abstract

本发明公开了融合多源环境变量与光谱信息的土壤重金属含量反演方法,方法包括:首先获取土壤样本数据、混合光谱数据和环境变量数据;然后根据所述土壤样本数据、混合光谱数据和环境变量数据,构建重金属反演模型;最后根据所述重金属反演模型对目标区域进行土壤重金属含量反演,确定所述目标区域的重金属分布图。本发明提高了预测精度且普适性强,可广泛应用于环境监测技术领域。

Description

融合多源环境变量与光谱信息的土壤重金属含量反演方法
技术领域
本发明涉及环境监测技术领域,尤其是融合多源环境变量与光谱信息的土壤重金属含量反演方法。
背景技术
随着农用化学物质使用量不断增加,土壤重金属污染问题逐步凸显。
目前针对大范围土壤重金属含量估算的研究,大多单一使用光谱信息,即将与土壤重金属含量相关的特征波段及其组合指数与实测重金属含量进行统计建模,限制了模型的预测精度和普适性。
少量的知识应用会针对土壤重金属污染机理,引入环境因子辅助反演模型的建立。这种方式相比传统建模方法能够对光谱信息进行补充,一定程度上提高了模型精度。然而,这些研究尚未对辅助环境因子数据进行深入分析,引入了较多的不相关环境因子,造成了数据冗余,导致模型精度仍受到限制。
发明内容
有鉴于此,本发明实施例提供一种预测精度高且普适性强的,融合多源环境变量与光谱信息的土壤重金属含量反演方法。
本发明的一方面提供了一种融合多源环境变量与光谱信息的土壤重金属含量反演方法,包括:
获取土壤样本数据、混合光谱数据和环境变量数据;
根据所述土壤样本数据、混合光谱数据和环境变量数据,构建重金属反演模型;
根据所述重金属反演模型对目标区域进行土壤重金属含量反演,确定所述目标区域的重金属分布图。
可选地,所述获取土壤样本数据,包括:
采用五点采样法采集样本农田的表层土壤样本,并利用GPS记录所述样本农田的中心点的经纬度坐标;其中,所述表层土壤样本均匀分布于所述样本农田;
将采集到的表层土壤样本置于干燥通风处进行自然风干,并对表层土壤样本进行杂质剔除,然后将表层土壤样本进行研磨,并利用100目筛对研磨后的样本进行过筛;
采用HF-HNO3-HClO4对样本进行消煮,然后利用等离子体质谱仪测定重金属镉含量;利用碳氮元素分析仪测定土壤有机碳含量;用pH计测定土壤酸碱度。
可选地,所述获取混合光谱数据,包括:
利用调查区域数字高程模型以及地面控制点经纬度坐标对遥感影像进行正射校正,获取原始光谱数据;
对原始光谱数据进行辐射定标以及大气校正,将光谱数据单位转换至地表反射率;
提取采样点对应位置遥感影像像元的原始光谱数据,利用利用一阶微分、倒数对数的光谱变换方法对原始光谱数据进行光谱变换,分别得到一阶微分变换结果和倒数对数变换结果;
分别计算一阶微分变换结果、倒数对数变换结果、原始光谱数据各个波段与重金属浓度之间的相关系数;
对比同一波段不同处理方式下光谱数据与重金属浓度之间相关性的大小,选用每一波段中相关系数最大的光谱数据组成混合光谱数据。
可选地,所述获取环境变量数据,包括:
根据调查区域的数字高程模型,通过ArcGIS软件生成表征调查区域地形的栅格数据,通过SAGA GIS软件生成地形湿度指数数据;其中,所述栅格数据包括坡度、坡向、平面曲率、剖面曲率;
若调查区域的路网和水系的矢量数据的质量不满足预设要求,则对所述矢量数据进行勾画修正,然后根据调查区域的范围生成栅格数据,并利用ArcGIS软件计算栅格数据中每个像元离最近的河流或者道路的距离,并将该距离的值赋值给对应的像元,生成用来表征交通、水流影响程度的栅格数据;
利用监督分类方法对遥感影像进行分类,将遥感影像分为不同地物类型,其中,地物类型包括但不限于农田、人造地表、水体及森林;提取调查区域人造地表,生成表征人类活动的栅格数据;
若调查区域周边存在重金属污染源,则根据调查区域的范围生成栅格数据,并基于污染源位置,将栅格数据中每个像元离污染源的距离赋值给该像元,生成表征离污染源距离的栅格数据。
可选地,所述方法还包括从所述环境变量数据中确定重要环境变量的过程,具体包括:
将所述环境变量数据作为因子,将土壤重金属浓度作为变量,通过地理探测器模型中的分异及因子探测器进行重要性分析,获取每个环境变量对于重金属浓度分布的影响力,并依据影响程度从高到低进行排序,得到第一序列;
将所述环境变量数据作为因子,将土壤重金属浓度作为变量,通过随机森林重要性分析的方法进行重要性分析,获取每个环境变量对于重金属浓度分布的影响力,并依据影响程度从高到低进行排序,得到第二序列;
从所述第一序列和所述第二序列中选取目标个数的环境变量作为重要环境变量。
可选地,所述根据所述土壤样本数据、混合光谱数据和环境变量数据,构建重金属反演模型,包括:
根据采样点的经纬度坐标,提取采样点对应位置的影响因子数据,构建数据集;
基于十折交叉验证方法,将所述数据集随机分为10等份,选用其中9份样本作为训练集,利用偏最小二乘法、Bp神经网络、支持向量机、随机森林四种建模方法,以混合光谱数据及重要影响因子数据为自变量,以土壤重金属浓度数据为因变量训练模型;
选用另外1份样本为验证集,对四种模型进行精度评价,计算模型的决定系数、平均绝对误差、均方根误差;
重复对模型进行训练,获取满足训练条件的模型构建得到重金属反演模型。
可选地,所述根据所述重金属反演模型对目标区域进行土壤重金属含量反演,确定所述目标区域的重金属分布图,包括:
根据混合光谱筛选结果,生成目标区域范围内混合光谱栅格数据;
根据目标区域范围生成栅格数据,以混合光谱栅格数据以及栅格形式的重要影响因子为自变量,选用所述重金属反演模型反演栅格中所有像元的重金属浓度,得到所述目标区域的重金属浓度空间分布图;
提取所述目标区域的农田区域,根据所述农田区域对所述重金属浓度空间分布图进行裁剪,得到所述目标区域的重金属分布图。
本发明实施例的另一方面还提供了一种电子设备,包括处理器以及存储器;
所述存储器用于存储程序;
所述处理器执行所述程序实现如前面所述的方法。
本发明实施例的另一方面还提供了一种计算机可读存储介质,所述存储介质存储有程序,所述程序被处理器执行实现如前面所述的方法。
本发明实施例的另一方面还提供了一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如前面所述的方法。
本发明的实施例首先获取土壤样本数据、混合光谱数据和环境变量数据;然后根据所述土壤样本数据、混合光谱数据和环境变量数据,构建重金属反演模型;最后根据所述重金属反演模型对目标区域进行土壤重金属含量反演,确定所述目标区域的重金属分布图。本发明提高了预测精度且普适性强。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的整体步骤流程图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
针对现有技术存在的问题,本发明的一方面提供了一种融合多源环境变量与光谱信息的土壤重金属含量反演方法,包括:
获取土壤样本数据、混合光谱数据和环境变量数据;
根据所述土壤样本数据、混合光谱数据和环境变量数据,构建重金属反演模型;
根据所述重金属反演模型对目标区域进行土壤重金属含量反演,确定所述目标区域的重金属分布图。
可选地,所述获取土壤样本数据,包括:
采用五点采样法采集样本农田的表层土壤样本,并利用GPS记录所述样本农田的中心点的经纬度坐标;其中,所述表层土壤样本均匀分布于所述样本农田;
将采集到的表层土壤样本置于干燥通风处进行自然风干,并对表层土壤样本进行杂质剔除,然后将表层土壤样本进行研磨,并利用100目筛对研磨后的样本进行过筛;
采用HF-HNO3-HClO4对样本进行消煮,然后利用等离子体质谱仪测定重金属镉含量;利用碳氮元素分析仪测定土壤有机碳含量;用pH计测定土壤酸碱度。
可选地,所述获取混合光谱数据,包括:
利用调查区域数字高程模型以及地面控制点经纬度坐标对遥感影像进行正射校正,获取原始光谱数据;
对原始光谱数据进行辐射定标以及大气校正,将光谱数据单位转换至地表反射率;
提取采样点对应位置遥感影像像元的原始光谱数据,利用利用一阶微分、倒数对数的光谱变换方法对原始光谱数据进行光谱变换,分别得到一阶微分变换结果和倒数对数变换结果;
分别计算一阶微分变换结果、倒数对数变换结果、原始光谱数据各个波段与重金属浓度之间的相关系数;
对比同一波段不同处理方式下光谱数据与重金属浓度之间相关性的大小,选用每一波段中相关系数最大的光谱数据组成混合光谱数据。
可选地,所述获取环境变量数据,包括:
根据调查区域的数字高程模型,通过ArcGIS软件生成表征调查区域地形的栅格数据,通过SAGA GIS软件生成地形湿度指数数据;其中,所述栅格数据包括坡度、坡向、平面曲率、剖面曲率;
若调查区域的路网和水系的矢量数据的质量不满足预设要求,则对所述矢量数据进行勾画修正,然后根据调查区域的范围生成栅格数据,并利用ArcGIS软件计算栅格数据中每个像元离最近的河流或者道路的距离,并将该距离的值赋值给对应的像元,生成用来表征交通、水流影响程度的栅格数据;
利用监督分类方法对遥感影像进行分类,将遥感影像分为不同地物类型,其中,地物类型包括但不限于农田、人造地表、水体及森林;提取调查区域人造地表,生成表征人类活动的栅格数据;
若调查区域周边存在重金属污染源,则根据调查区域的范围生成栅格数据,并基于污染源位置,将栅格数据中每个像元离污染源的距离赋值给该像元,生成表征离污染源距离的栅格数据。
可选地,所述方法还包括从所述环境变量数据中确定重要环境变量的过程,具体包括:
将所述环境变量数据作为因子,将土壤重金属浓度作为变量,通过地理探测器模型中的分异及因子探测器进行重要性分析,获取每个环境变量对于重金属浓度分布的影响力,并依据影响程度从高到低进行排序,得到第一序列;
将所述环境变量数据作为因子,将土壤重金属浓度作为变量,通过随机森林重要性分析的方法进行重要性分析,获取每个环境变量对于重金属浓度分布的影响力,并依据影响程度从高到低进行排序,得到第二序列;
从所述第一序列和所述第二序列中选取目标个数的环境变量作为重要环境变量。
可选地,所述根据所述土壤样本数据、混合光谱数据和环境变量数据,构建重金属反演模型,包括:
根据采样点的经纬度坐标,提取采样点对应位置的影响因子数据,构建数据集;
基于十折交叉验证方法,将所述数据集随机分为10等份,选用其中9份样本作为训练集,利用偏最小二乘法、Bp神经网络、支持向量机、随机森林四种建模方法,以混合光谱数据及重要影响因子数据为自变量,以土壤重金属浓度数据为因变量训练模型;
选用另外1份样本为验证集,对四种模型进行精度评价,计算模型的决定系数、平均绝对误差、均方根误差;
重复对模型进行训练,获取满足训练条件的模型构建得到重金属反演模型。
可选地,所述根据所述重金属反演模型对目标区域进行土壤重金属含量反演,确定所述目标区域的重金属分布图,包括:
根据混合光谱筛选结果,生成目标区域范围内混合光谱栅格数据;
根据目标区域范围生成栅格数据,以混合光谱栅格数据以及栅格形式的重要影响因子为自变量,选用所述重金属反演模型反演栅格中所有像元的重金属浓度,得到所述目标区域的重金属浓度空间分布图;
提取所述目标区域的农田区域,根据所述农田区域对所述重金属浓度空间分布图进行裁剪,得到所述目标区域的重金属分布图。
本发明实施例的另一方面还提供了一种电子设备,包括处理器以及存储器;
所述存储器用于存储程序;
所述处理器执行所述程序实现如前面所述的方法。
本发明实施例的另一方面还提供了一种计算机可读存储介质,所述存储介质存储有程序,所述程序被处理器执行实现如前面所述的方法。
本发明实施例的另一方面还提供了一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如前面所述的方法。
下面结合说明书附图,对本发明的具体实现过程进行详细描述:
如图1所示,本发明包括以下步骤:步骤一:农田采样点土壤样本数据获取。步骤二:混合光谱数据获取。步骤三:影响土壤镉浓度空间分布的环境变量数据生产。步骤四:重要环境变量确定。步骤五:最优重金属反演模型的建立。步骤六:区域尺度农田土壤重金属含量反演。
下面具体描述各个步骤的实现过程:
步骤一:农田采样点土壤样本数据获取。具体细化步骤如下Step1-3:
Step1:样本采集:采用五点采样法采集农田0-20cm表层土壤,并利用GPS记录中心点的经纬度坐标。采样点应均匀分布于调查区域。
Step2:样本预处理:将样本置于干燥通风处使其自然风干,并在室内将样本内的稻茬、杂草等杂质剔除。之后将样本进行研磨,过100目筛。
Step3:样本成分检测:采用HF-HNO3-HClO4消煮,并利用电感耦合等离子体质谱仪(ICP-MS,Thermo Fisher,USA)进行测定重金属镉(Cd)含量;利用碳氮元素分析仪测定土壤有机碳含量;利用pH计测定土壤酸碱度,土水比为1:2.5。
步骤二:混合光谱数据获取。具体细化步骤如下,包括Step1-5:
Step1:光谱预处理:对原始光谱数据进行辐射定标以及大气校正,将光谱数据单位转换至地表反射率。利用调查区域DEM以及地面控制点经纬度坐标对遥感影像进行正射校正,提高遥感影像几何精度。其中地面控制点坐标需要在土壤采集时利用GPS实地记录。
Step2:光谱数据提取:根据步骤一Step1所采集的采样点经纬度坐标,提取采样点对应位置遥感影像像元的原始光谱数据。
Step3:光谱变换:利用利用一阶微分、倒数对数的光谱变换方法对原始光谱数据进行光谱变换,分别得到一阶微分和倒数对数的变换结果。其中一阶微分的变换公式为
Figure BDA0003587006890000071
倒数对数的变换公式为
Figure BDA0003587006890000072
式中Dj、Lj代表光谱变换结果。Bj代表第j个波段的原始光谱反射率,Dj表示第j个波段一阶微分后的光谱数据,gj为波段之间窗口宽度。Lj表示第j个波段倒数对数变换后的光谱数据。
Step4:相关性分析:分别计算一阶微分变换结果、倒数对数变换结果、原始光谱数据各个波段与重金属浓度之间的相关系数。相关系数的计算公式为
Figure BDA0003587006890000073
Rj是其中一种变换方式中第j个波段与重金属浓度之间的相关系数。
Figure BDA0003587006890000074
代表一种变换方式中第j个波段第i个样本的数值,
Figure BDA0003587006890000075
代表一种变换方式中第j个波段所有样本的平均值。Ci代表第i个样本的重金属浓度,
Figure BDA0003587006890000076
代表所有样本重金属浓度的平均值。
Step5:对比同一波段不同处理方式(原始光谱、一阶微分、倒数对数)的光谱数据与重金属浓度之间相关性的大小,选用每一波段相关系数最大的光谱数据组成混合光谱数据。
步骤三:影响土壤镉浓度空间分布的环境变量数据生产。具体细化步骤如下步骤Step1-5:
Step1:根据调查区域的数字高程模型,基于ArcGIS软件生产表征调查区域地形的栅格数据,包括坡度、坡向、平面曲率、剖面曲率,采用SAGA GIS软件生产地形湿度指数数据。
Step2:若调查区域OpenStreetMap(OSM)路网和水系的矢量数据质量不满足要求,需要在其基础上进行人工勾画。在此基础上,根据调查区域范围生成栅格数据,并利用ArcGIS软件计算栅格中每个像元离最近的河流或者道路的距离,并将该值赋值给该像元,生成用来表征交通、水流影响程度的栅格数据。
Step3:利用监督分类方法对遥感影像进行分类,根据调查区域具体情况将遥感影像分为农田、人造地表、水体、森林等地物类型,并提取调查区域人造地表。根据调查区域范围生成栅格数据,利用数字图像处理技术,计算栅格中每个像元周边1公里范围内的人造地表面积,并将此面积赋值给该像元,生成表征人类活动的栅格数据。周围人造地表面积的详细计算过程为:
1)、将遥感影像的分类结果二值化,人造地表区域赋值为1,非人造地表区域赋值为0;
2)、利用MATLAB读入二值化结果,生成数值为0或1的矩阵,并读入二值化结果的地理信息。
3)、根据二值化结果像元大小,设置对应于真实地表1公里的窗口。若每个像元的大小为10m*10m,则窗口大小设置为101*101。
4)、以此窗口遍历二值化矩阵中的所有元素。以二值化矩阵中的元素为窗口中心,统计被窗口覆盖的数值为1的元素个数。以此来计算此元素周边人造地表面积。若数值为1的元素个数为100,则周边人造地表面积为10000m2
5)、生成与二值化结果同样大小的空矩阵,储存相同位置的周边人造地表面积。
6)、根据二值化结果的地理信息,利用MATLAB将储存周围人造地表面积的矩阵转换为带有地理信息的栅格数据。
Step4:若调查区域周边存在矿业开采、污水排放、废气排放等可能的重金属污染源,需要根据调查区域范围生成栅格数据,基于污染源位置,将栅格中每个像元离污染源的距离赋值给该像元,生成表征离污染源距离的栅格数据。
Step5:根据步骤一所述的采样点土壤酸碱度、有机碳含量、重金属浓度,利用克里金插值法,获取调查区域范围内的土壤酸碱度、土壤有机碳含量以及土壤重金属浓度的栅格数据。
步骤四:重要环境变量确定。具体细化步骤如下Step1-3:
Step1:利用地理探测器(geographical detectors model,GDM)模型中的分异及因子探测器,以步骤三所获取的环境变量(DEM、坡度、坡向、平面曲率、剖面曲率、地形湿度指数、离道路距离、离河流距离、周围人造地表面积、离污染源距离、土壤有机碳、土壤酸碱度)作为因子X,以土壤重金属浓度为变量Y进行重要性分析,获取每个环境变量对于重金属浓度分布的影响力,并依据影响程度从高到低进行排序。
分异及因子探测可用于探测某因子X多大程度上解释了属性Y的空间分异,用q值度量。
Figure BDA0003587006890000081
Figure BDA0003587006890000091
SST=Nσ2
式中:h为因子X的分层,即分类或分区(可采用自然断点法对因子X进行分层)。Nh和N分别为层h和全区变量Y的像元数;σh和σ为别为层h和全区变量Y值的方差。SSW和SST分别为层内方差之和和全区总方差。q值越大表示自变量X对属性Y的解释力越强,反之则越弱。极端情况下,q值为1表明因子X完全控制了Y的空间分布,q值为0则表明因子X与Y没有任何关系。
Step2:根据步骤一Step1所采集的采样点经纬度坐标,提取采样点对应位置的环境变量数据。利用随机森林(random forest,RF)重要性分析功能以环境变量为自变量X,重金属浓度为因变量Y,计算所有环境变量对于重金属浓度分布的重要性,并依据重要性从高到低进行排序。随机森林模型拟合时会通过自助抽样形成大约2/3的样本数据,剩余样本数据称为袋外样本数据(OOB),用于评估模型整体误差以及变量的重要性。在进行重要性评价时,首先利用自助抽样的样本数据建立回归树模型,计算OOB的预测误差,然后随机置换自变量X的观测值,再次建立回归树模型,计算OOB'(随机置换变量观测后袋外数据)的预测误差,将2次袋外数据预测误差的差值进行标准化处理后,将所有回归树结果取均值即为变量的重要性。若2次袋外数据预测误差的差值较大,则说明随机置换自变量X的观测值后,随机森林的预测精度受到了较大程度的影响,此自变量X对于因变量Y的预测至关重要。本项目通过随机森林重要性排序验证地理探测器因子分析的结果,以不同的方法确定重要的驱动因子,分析驱动因子与重金属浓度之间的相关性。
Step3:为降低使用单一方法而产生的不确定性,综合选取Step1、Step2排序结果前五项的并集作为重要环境变量参与后续模型建立。
步骤五:最优重金属反演模型的建立。具体细化步骤如下:
Step1:根据步骤一的Step1所采集的采样点经纬度坐标,提取采样点对应位置的影响因子数据。
Step2:将数据集随机分为10等份,选用其中9份样本作为训练集,利用偏最小二乘法、Bp神经网络、支持向量机、随机森林四种建模方法,以混合光谱数据及重要影响因子数据为自变量,以土壤重金属浓度数据为因变量训练模型。
Step3:选用另外1份样本为验证集,对四种模型进行精度评价,计算模型的决定系数、平均绝对误差、均方根误差。
Step4:重复Step1、Step2步骤10次,保证每份样本均作为验证集参与过模型精度评价,记录每次模型评价结果。
Step5:对10次模型评价计算得到的决定系数、平均绝对误差、均方根误差取平均值,以此作为四种模型的最终精度。对比分析四种模型的精度,选择精度最高的模型参与大面积重金属浓度反演。
步骤六:区域尺度农田土壤重金属含量反演。具体细化步骤如下:
Step1:根据混合光谱筛选结果,生产研究区范围内混合光谱栅格数据。
Step2:根据研究区范围生成栅格数据,以混合光谱栅格数据以及栅格形式的重要影响因子为自变量,选用最优模型反演栅格中所有像元的重金属浓度,得到调查区域重金属浓度空间分布图。
Step3:利用步骤三Step 3中的监督分类结果,提取其中的农田区域。用农田区域对Step2获取的重金属分布图进行裁剪,得到调查区域的农田重金属分布图。
可以理解的是,本发明通过融合光谱信息以及环境因子进行建模,进而基于最优模型大面积预测农田土壤重金属浓度。
综上所述,本发明提供了一种融合光谱信息与环境变量的土壤重金属含量反演方法。该技术具备以下特点:
1、本发明利用高空间分辨率WorldView-3多光谱数据对土壤重金属浓度进行反演建模。WorldView-3多光谱数据空间分辨率较高,具有16个波段,涵盖可见光、近红外和短波红外谱段,为土壤重金属含量反演提供了较多的光谱信息。
2、本发明通过对光谱数据进行光谱变换,并利用相关性分析对光谱数据进行筛选,有效地提高了光谱数据质量。
3、本发明引入多源环境变量数据,并对其深入分析,选择对土壤重金属分布具有重要驱动作用的环境因子数据辅助反演模型的建立,进一步提高了模型反演精度。
相较于现有技术,本发明对光谱数据进行光谱变换,并通过相关性分析筛选出混合光谱,提高了光谱数据质量。本发明结合自然因子(地形、离河流距离、土壤酸碱度、土壤有机碳),人为因子(周边人造地面积、离道路距离),对光谱信息进行补充,提高了反演建模精度。本发明以周边人造地表面积来反映人类活动对此地区土壤性质的影响程度。本发明综合利用地理探测器、随机森林对环境因子重要性进行分析,选择重要影响因子参与建模。本发明的精度高体现在通过筛选混合光谱数据,结合环境影响因子共同参与建模,极大地提高了土壤重金属含量的反演精度。
在一些可选择的实施例中,在方框图中提到的功能/操作可以不按照操作示图提到的顺序发生。例如,取决于所涉及的功能/操作,连续示出的两个方框实际上可以被大体上同时地执行或所述方框有时能以相反顺序被执行。此外,在本发明的流程图中所呈现和描述的实施例以示例的方式被提供,目的在于提供对技术更全面的理解。所公开的方法不限于本文所呈现的操作和逻辑流程。可选择的实施例是可预期的,其中各种操作的顺序被改变以及其中被描述为较大操作的一部分的子操作被独立地执行。
此外,虽然在功能性模块的背景下描述了本发明,但应当理解的是,除非另有相反说明,所述的功能和/或特征中的一个或多个可以被集成在单个物理装置和/或软件模块中,或者一个或多个功能和/或特征可以在单独的物理装置或软件模块中被实现。还可以理解的是,有关每个模块的实际实现的详细讨论对于理解本发明是不必要的。更确切地说,考虑到在本文中公开的装置中各种功能模块的属性、功能和内部关系的情况下,在工程师的常规技术内将会了解该模块的实际实现。因此,本领域技术人员运用普通技术就能够在无需过度试验的情况下实现在权利要求书中所阐明的本发明。还可以理解的是,所公开的特定概念仅仅是说明性的,并不意在限制本发明的范围,本发明的范围由所附权利要求书及其等同方案的全部范围来决定。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。
计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。
以上是对本发明的较佳实施进行了具体说明,但本发明并不限于所述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。

Claims (8)

1.融合多源环境变量与光谱信息的土壤重金属含量反演方法,其特征在于,包括:
获取土壤样本数据、混合光谱数据和环境变量数据;
根据所述土壤样本数据、混合光谱数据和环境变量数据,构建重金属反演模型;
根据所述重金属反演模型对目标区域进行土壤重金属含量反演,确定所述目标区域的重金属分布图;
所述方法还包括从所述环境变量数据中确定重要环境变量的过程,具体包括:
将所述环境变量数据作为因子,将土壤重金属浓度作为变量,通过地理探测器模型中的分异及因子探测器进行重要性分析,获取每个环境变量对于重金属浓度分布的影响力,并依据影响程度从高到低进行排序,得到第一序列;
将所述环境变量数据作为因子,将土壤重金属浓度作为变量,通过随机森林重要性分析的方法进行重要性分析,获取每个环境变量对于重金属浓度分布的影响力,并依据影响程度从高到低进行排序,得到第二序列;
从所述第一序列和所述第二序列中选取目标个数的环境变量作为重要环境变量。
2.根据权利要求1所述的融合多源环境变量与光谱信息的土壤重金属含量反演方法,其特征在于,所述获取土壤样本数据,包括:
采用五点采样法采集样本农田的表层土壤样本,并利用GPS记录所述样本农田的中心点的经纬度坐标;其中,所述表层土壤样本均匀分布于所述样本农田;
将采集到的表层土壤样本置于干燥通风处进行自然风干,并对表层土壤样本进行杂质剔除,然后将表层土壤样本进行研磨,并利用100目筛对研磨后的样本进行过筛;
采用HF-HNO3-HClO4对样本进行消煮,然后利用等离子体质谱仪测定重金属镉含量;利用碳氮元素分析仪测定土壤有机碳含量;用pH计测定土壤酸碱度。
3.根据权利要求1所述的融合多源环境变量与光谱信息的土壤重金属含量反演方法,其特征在于,所述获取混合光谱数据,包括:
利用调查区域数字高程模型以及地面控制点经纬度坐标对遥感影像进行正射校正,获取原始光谱数据;
对原始光谱数据进行辐射定标以及大气校正,将光谱数据单位转换至地表反射率;
提取采样点对应位置遥感影像像元的原始光谱数据,利用一阶微分、倒数对数的光谱变换方法对原始光谱数据进行光谱变换,分别得到一阶微分变换结果和倒数对数变换结果;
分别计算一阶微分变换结果、倒数对数变换结果、原始光谱数据各个波段与重金属浓度之间的相关系数;
对比同一波段不同处理方式下光谱数据与重金属浓度之间相关性的大小,选用每一波段中相关系数最大的光谱数据组成混合光谱数据。
4.根据权利要求1所述的融合多源环境变量与光谱信息的土壤重金属含量反演方法,其特征在于,所述获取环境变量数据,包括:
根据调查区域的数字高程模型,通过ArcGIS软件生成表征调查区域地形的栅格数据,通过SAGA GIS软件生成地形湿度指数数据;其中,所述栅格数据包括坡度、坡向、平面曲率、剖面曲率;
若调查区域的路网和水系的矢量数据的质量不满足预设要求,则对所述矢量数据进行勾画修正,然后根据调查区域的范围生成栅格数据,并利用ArcGIS软件计算栅格数据中每个像元离最近的河流或者道路的距离,并将该距离的值赋值给对应的像元,生成用来表征交通、水流影响程度的栅格数据;
利用监督分类方法对遥感影像进行分类,将遥感影像分为不同地物类型,其中,地物类型包括农田、人造地表、水体及森林;提取调查区域人造地表,生成表征人类活动的栅格数据;
若调查区域周边存在重金属污染源,则根据调查区域的范围生成栅格数据,并基于污染源位置,将栅格数据中每个像元离污染源的距离赋值给该像元,生成表征离污染源距离的栅格数据。
5.根据权利要求1所述的融合多源环境变量与光谱信息的土壤重金属含量反演方法,其特征在于,所述根据所述土壤样本数据、混合光谱数据和环境变量数据,构建重金属反演模型,包括:
根据采样点的经纬度坐标,提取采样点对应位置的影响因子数据,构建数据集;
基于十折交叉验证方法,将所述数据集随机分为10等份,选用其中9份样本作为训练集,利用偏最小二乘法、Bp神经网络、支持向量机、随机森林四种建模方法,以混合光谱数据及重要影响因子数据为自变量,以土壤重金属浓度数据为因变量训练模型;
选用另外1份样本为验证集,对四种模型进行精度评价,计算模型的决定系数、平均绝对误差、均方根误差;
重复对模型进行训练,获取满足训练条件的模型构建得到重金属反演模型。
6.根据权利要求1所述的融合多源环境变量与光谱信息的土壤重金属含量反演方法,其特征在于,所述根据所述重金属反演模型对目标区域进行土壤重金属含量反演,确定所述目标区域的重金属分布图,包括:
根据混合光谱筛选结果,生成目标区域范围内混合光谱栅格数据;
根据目标区域范围生成栅格数据,以混合光谱栅格数据以及栅格形式的重要影响因子为自变量,选用所述重金属反演模型反演栅格中所有像元的重金属浓度,得到所述目标区域的重金属浓度空间分布图;
提取所述目标区域的农田区域,根据所述农田区域对所述重金属浓度空间分布图进行裁剪,得到所述目标区域的重金属分布图。
7.一种电子设备,其特征在于,包括处理器以及存储器;
所述存储器用于存储程序;
所述处理器执行所述程序实现如权利要求1至6中任一项所述的方法。
8.一种计算机可读存储介质,其特征在于,所述存储介质存储有程序,所述程序被处理器执行实现如权利要求1至6中任一项所述的方法。
CN202210365885.XA 2022-04-08 2022-04-08 融合多源环境变量与光谱信息的土壤重金属含量反演方法 Active CN114814167B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210365885.XA CN114814167B (zh) 2022-04-08 2022-04-08 融合多源环境变量与光谱信息的土壤重金属含量反演方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210365885.XA CN114814167B (zh) 2022-04-08 2022-04-08 融合多源环境变量与光谱信息的土壤重金属含量反演方法

Publications (2)

Publication Number Publication Date
CN114814167A CN114814167A (zh) 2022-07-29
CN114814167B true CN114814167B (zh) 2023-02-03

Family

ID=82534807

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210365885.XA Active CN114814167B (zh) 2022-04-08 2022-04-08 融合多源环境变量与光谱信息的土壤重金属含量反演方法

Country Status (1)

Country Link
CN (1) CN114814167B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115879061B (zh) * 2023-02-22 2023-07-25 武汉正元环境科技股份有限公司 一种重金属检测方法与装置
CN117269078B (zh) * 2023-11-21 2024-03-22 核工业北京地质研究院 土壤阳离子交换量的确定方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103529189B (zh) * 2013-06-28 2016-01-06 四川农业大学 一种基于定性和定量辅助变量的土壤有机质空间分布预测方法
CN103499529B (zh) * 2013-10-09 2016-03-16 北京大学 一种土壤与植被混合光谱测量方法及模拟系统
US20170286574A1 (en) * 2016-03-31 2017-10-05 United States Of America As Represented By The Secretary Of The Army Predictive soil analysis
CN107144535A (zh) * 2017-05-19 2017-09-08 南京信息工程大学 一种基于高光谱技术的碱化土壤空间酸碱度监测方法
CN107478580B (zh) * 2017-07-31 2020-08-25 中国科学院遥感与数字地球研究所 基于高光谱遥感的土壤重金属含量估算方法及装置
US20210172800A1 (en) * 2019-12-10 2021-06-10 Perkinelmer Health Sciences Canada, Inc. Systems and Methods for Analyzing Unknown Sample Compositions Using a Prediction Model Based On Optical Emission Spectra
CN114021900A (zh) * 2021-10-14 2022-02-08 清华大学 反演土壤重金属污染风险等级的方法
CN114018833B (zh) * 2021-11-07 2023-12-19 福建师范大学 基于高光谱遥感技术估算土壤重金属含量的方法

Also Published As

Publication number Publication date
CN114814167A (zh) 2022-07-29

Similar Documents

Publication Publication Date Title
Vaudour et al. Sentinel-2 image capacities to predict common topsoil properties of temperate and Mediterranean agroecosystems
Ali et al. Comparing methods for mapping canopy chlorophyll content in a mixed mountain forest using Sentinel-2 data
CN114814167B (zh) 融合多源环境变量与光谱信息的土壤重金属含量反演方法
Malenovský et al. Retrieval of spruce leaf chlorophyll content from airborne image data using continuum removal and radiative transfer
Halme et al. Utility of hyperspectral compared to multispectral remote sensing data in estimating forest biomass and structure variables in Finnish boreal forest
CN110174359B (zh) 一种基于高斯过程回归的航空高光谱影像土壤重金属浓度评估方法
Heenkenda et al. Quantifying mangrove chlorophyll from high spatial resolution imagery
CN114018833B (zh) 基于高光谱遥感技术估算土壤重金属含量的方法
CN110687053B (zh) 一种基于高光谱影像的区域有机质含量估算方法和装置
CN112395808A (zh) 一种结合随机森林和协同克里金的生物量遥感制图方法
Shukla et al. An Overview of Hyperspectral Remote Sensing and its applications in various Disciplines
Giannico et al. Contributions of landscape heterogeneity within the footprint of eddy-covariance towers to flux measurements
CN115561181B (zh) 一种基于无人机多光谱数据的水质反演方法
Lavanya et al. Terrain mapping of LandSat8 images using MNF and classifying soil properties using ensemble modelling
CN114460013B (zh) 滨海湿地植被地上生物量gan模型自学习遥感反演方法
CN113466143B (zh) 土壤养分反演方法、装置、设备及介质
CN113436153A (zh) 一种基于高光谱成像和支持向量机技术的原状土壤剖面碳组分预测方法
CN114819737B (zh) 公路路域植被的碳储量估算方法、系统及存储介质
Pawłuszek et al. Landslides identification using airborne laser scanning data derived topographic terrain attributes and support vector machine classification
CN115235997A (zh) 一种基于卫星高光谱影像的土壤质地反演方法
CN115128013A (zh) 一种基于分区算法的土壤有机质含量空间预测评估方法
Chusnah et al. Estimating chlorophyll-a concentrations in tropical reservoirs from band-ratio machine learning models
Biney et al. Examining the influence of bare soil UAV imagery combined with auxiliary datasets to estimate and map soil organic carbon distribution in an erosion-prone agricultural field
Khudhur et al. Comparison of the accuracies of different spectral indices for mapping the vegetation covers in Al-Hawija district, Iraq
WO2023229705A1 (en) System and method for automatically estimating gas emission parameters

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CB03 Change of inventor or designer information

Inventor after: Geng Jing

Inventor after: Fang Huajun

Inventor after: Pei Jie

Inventor after: Li Guoxu

Inventor after: Xu Xuanhong

Inventor before: Fang Huajun

Inventor before: Geng Jing

Inventor before: Pei Jie

Inventor before: Li Guoxu

Inventor before: Xu Xuanhong

CB03 Change of inventor or designer information
TR01 Transfer of patent right

Effective date of registration: 20231010

Address after: 510275 No. 135 West Xingang Road, Guangdong, Guangzhou

Patentee after: SUN YAT-SEN University

Patentee after: China keji'an Ecological Environment Research Institute

Address before: 343016 No. 61, Xingqiao street, Jizhou District, Ji'an City, Jiangxi Province

Patentee before: China keji'an Ecological Environment Research Institute

TR01 Transfer of patent right