CN106996969A - 一种土壤重金属空间分布预测方法及系统 - Google Patents

一种土壤重金属空间分布预测方法及系统 Download PDF

Info

Publication number
CN106996969A
CN106996969A CN201710124266.0A CN201710124266A CN106996969A CN 106996969 A CN106996969 A CN 106996969A CN 201710124266 A CN201710124266 A CN 201710124266A CN 106996969 A CN106996969 A CN 106996969A
Authority
CN
China
Prior art keywords
soil
gbrt
heavy metal
models
supplemental characteristic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710124266.0A
Other languages
English (en)
Inventor
罗娜
韩平
王纪华
王卉
贾文珅
王世芳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIJING AGRICULTURAL QUALITY STANDARDS AND TESTING TECHNOLOGY RESEARCH CENTER
Original Assignee
BEIJING AGRICULTURAL QUALITY STANDARDS AND TESTING TECHNOLOGY RESEARCH CENTER
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING AGRICULTURAL QUALITY STANDARDS AND TESTING TECHNOLOGY RESEARCH CENTER filed Critical BEIJING AGRICULTURAL QUALITY STANDARDS AND TESTING TECHNOLOGY RESEARCH CENTER
Priority to CN201710124266.0A priority Critical patent/CN106996969A/zh
Publication of CN106996969A publication Critical patent/CN106996969A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/24Earth materials
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Abstract

本发明实施例提供了一种土壤重金属空间分布预测方法及系统,涉及环境监测技术领域。所述方法包括:测量采样点处土样的土壤重金属含量数值;构建训练数据集;将所述辅助特征和所述土壤重金属含量作为变量构建GBRT模型,并用所述训练数据集训练所述GBRT模型得到训练好的GBRT模型;构建待测数据集;将所述待测数据集输入所述训练好的GBRT模型,输出所述待测点对应的土壤重金属含量数值。由于GBRT算法迭代集成若干弱回归器的特性、以及对辅助特征的合理应用使得本方法具有很好地泛化能力,有利于推广应用。

Description

一种土壤重金属空间分布预测方法及系统
技术领域
本发明实施例涉及环境监测技术领域,更具体地,涉及一种土壤重金属空间分布预测方法及系统。
背景技术
土壤是人类赖以生存的自然资源之一,随着农业集约化生产的发展以及城市化进程的加快,土壤环境污染问题日益突出。重金属通过污水灌溉、大气沉降等途径进入土壤。土壤重金属具有不易降解和迁移的性质,不仅通过食物链进入人体,危害人类健康,过量的土壤重金属还会进一步污染地下水环境、海洋甚至整个生态系统。因而如何更精确地掌握土壤的重金属空间分布对于土壤重金属污染防治与风险评估具有重要意义。
由于人力、财力成本的限制,土壤重金属含量监测网点的数量始终有限。但是,基于已布设的有限的监测网点,可获得一定数量的空间样本,这些样本反映了土壤重金属空间分布的部分特征,根据这些已知样本,采用适当的空间算法,可以预测未知地理空间土壤重金属的分布特征。也即只依靠采集有限的离散样本来预测土壤重金属在某一区域内的空间分布,并可通过地理信息系统(Geographic Information System,GIS)技术绘制出土壤重金属空间分布图。传统的预测方法采用的算法一般包括:地统计插值法、神经网络以及支持向量机等。
但是,地统计插值以空间自相关性为基础,由于该方法对辅助数据的利用不足,且与数据关联性较大,导致同一插值方法在不同区域的插值效果差别较大,不利于推广应用;神经网络、支持向量机在空间插值中的应用经常存在过拟合问题,导致泛化能力受限。
发明内容
本发明实施例提供了一种克服上述问题或者至少部分地解决上述问题的土壤重金属空间分布预测方法及系统。
一方面本发明实施例提供了一种土壤重金属空间分布预测方法,所述方法包括:
测量采样点处土样的土壤重金属含量数值;
获取所述采样点的辅助特征数据,构建训练数据集,所述训练数据集包括:所述采样点对应的所述土壤重金属含量数值以及所述采样点的辅助特征数据;
将所述辅助特征和所述土壤重金属含量作为变量构建GBRT模型,并用所述训练数据集训练所述GBRT模型得到训练好的GBRT模型;
获取待测点的辅助特征数据,构建待测数据集,所述待测数据集包括所述待测点的所述辅助特征数据;
将所述待测数据集输入所述训练好的GBRT模型,输出所述待测点对应的土壤重金属含量数值。
其中,在所述测量采样点处土样的土壤重金属含量数值之前还包括:
利用ArcGIS软件在待测区域内选取所述采样点,并获取所述采样点处土样。
其中,所述辅助特征包括经度、纬度、高程、土壤类型、与公路的距离、与铁路的距离、与矿区的距离以及土壤侵蚀程度中的一个或多个。
其中,所述辅助特征数据利用ArcGIS软件获取。
其中,所述用所述训练数据集训练所述GBRT模型得到训练好的GBRT模型具体为:
用所述训练数据集通过交叉验证法对所述GBRT模型进行训练得到所述训练好的GBRT模型。
其中,在所述将所述待测数据集输入所述训练好的GBRT模型,输出所述待测点对应的土壤重金属含量数值之后还包括:
利用ArcGIS软件将所述待测点对应的土壤重金属含量数值绘制成土壤重金属空间分布图。
另一方面本发明实施例提供了一种土壤重金属空间分布预测系统,所述系统包括:
测量模块,用于测量采样点处土样的土壤重金属含量数值;
第一获取模块,用于获取所述采样点的辅助特征数据,构建训练数据集,所述训练数据集包括:所述采样点对应的所述土壤重金属含量数值以及所述采样点的辅助特征数据;
训练模块,用于将所述辅助特征和所述土壤重金属含量作为变量构建GBRT模型,并用所述训练数据集训练所述GBRT模型得到训练好的GBRT模型;
第二获取模块,用于获取待测点的辅助特征数据,构建待测数据集,所述待测数据集包括所述待测点的所述辅助特征数据;
预测模块,用于将所述待测数据集输入所述训练好的GBRT模型,输出所述待测点对应的土壤重金属含量数值。
其中,所述系统还包括采样模块,用于利用ArcGIS软件在待测区域内选取所述采样点,并获取所述采样点处土样。
其中,所述训练模块具体用于用所述训练数据集通过交叉验证法对所述GBRT模型进行训练得到所述训练好的GBRT模型。
其中,所述系统还包括绘图模块,用于利用ArcGIS软件将所述待测点对应的土壤重金属含量数值绘制成土壤重金属空间分布图。
本发明实施例提供的一种土壤重金属空间分布预测方法及系统,通过将辅助特征和土壤重金属含量作为变量构建GBRT模型,通过训练数据集训练GBRT模型,再将训练好的GBRT模型应用于待测数据集,实现了对土壤重金属含量数值的预测,由于GBRT算法迭代集成若干弱回归器的特性、以及对辅助特征的合理应用使得本方法具有很好地泛化能力,有利于推广应用。
附图说明
图1为本发明实施例提供的一种土壤重金属空间分布预测方法流程图;
图2为本发明实施例提供的一种土壤重金属空间分布预测系统的结构框图;
图3为本发明实施例提供的另一种土壤重金属空间分布预测系统的结构框图;
图4为本发明实施例提供的又一种土壤重金属空间分布预测系统的结构框图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例提供的一种土壤重金属空间分布预测方法流程图,如图1所示,所述方法包括:
S11,测量采样点处土样的土壤重金属含量数值。
其中,所述采样点为离散分布于待测区域内的一定数量的监测网点,由于人力和财力的限制,采样点的数量有限,通过对采样点处土样的测量,可以获得对应于各采样点的土壤重金属含量数值。所述重金属可以是铜、镉、铅和铬等中的一种。
具体地,对采样点处土样的土壤重金属含量的测量可以采用原子荧光光谱法、原子吸收光谱法、电感耦合等离子体发射光谱法、激光诱导击穿光谱法以及X射线荧光光谱法等方法。
S12,获取所述采样点的辅助特征数据,构建训练数据集,所述训练数据集包括:所述采样点对应的所述土壤重金属含量数值以及所述采样点的辅助特征数据。
其中,所述辅助特征是指采样点或待测点所具有的可能会影响到所述采样点或待测点所在处土壤重金属含量的特征,且这些特征可以通过辅助手段获得。
具体地,根据理论分析和实践经验选取采样点的辅助特征的种类,并通过辅助手段分别获得采样点的各辅助特征数据,在步骤S11中已经测得所述采样点对应的土壤重金属含量数值,那么,各个采样点对应的所述辅助特征数据和所述土壤重金属含量数值就组合形成所述训练数据集,也就是在所述训练数据集中,所述辅助特征数据和所述土壤重金属含量数值都是已知的。
S13,将所述辅助特征和所述土壤重金属含量作为变量构建GBRT模型,并用所述训练数据集训练所述GBRT模型得到训练好的GBRT模型。
其中,GBRT(Gradient Boosting Regression Tree)又叫MART(MultipleAdditive Regression Tree),是一种迭代的决策树算法,GBRT算法由多个弱回归器组成,所有回归器的结论累加起来得出最终结果,因此GBRT算法具有较强的泛化能力(generalization)。
具体地,利用python将所述辅助特征和所述土壤重金属含量作为变量来构建GBRT模型,又因为训练数据集中所述辅助特征数据和所述土壤重金属含量数值都是已知,所以用训练数据集来对GBRT模型进行训练得到所述训练好的GBRT模型。
S14,获取待测点的辅助特征数据,构建待测数据集,所述待测数据集包括所述待测点的所述辅助特征数据。
具体地,根据步骤S12中选定的辅助特征种类,分别获取待测点的各辅助特征数据,将获取的各个待测点对应的所述辅助特征数据作为所述待测数据集。
S15,将所述待测数据集输入所述训练好的GBRT模型,输出所述待测点对应的土壤重金属含量数值。
具体地,将步骤S14中所述待测数据集中的待测点对应的辅助特征数据输入所述训练好的GBRT模型,则GBRT模型输出待测点对应的土壤重金属含量数值。
同时,得到所述土壤重金属含量数值后还可以定量评估辅助特征重要性,有利于揭示辅助特征与土壤重金属含量之间的相关性关系。
本发明实施例提供的一种土壤重金属空间分布预测方法,通过将辅助特征和土壤重金属含量作为变量构建GBRT模型,通过训练数据集训练GBRT模型,再将训练好的GBRT模型应用于待测数据集,实现了对土壤重金属含量数值的预测,由于GBRT算法迭代集成若干弱回归器的特性、以及对辅助特征的合理应用使得本方法具有很好地泛化能力,有利于推广应用。
在上述实施例中,在步骤S11之前还包括:利用ArcGIS软件在待测区域内选取所述采样点,并获取所述采样点处土样。
其中,所述ArcGIS软件是Esri公司提供的一种地理信息系统(GeographicInformation System,GIS)软件。在ArcGIS软件地图上选取采样点时,可以随机选取也可以按照特定规则选取。例如,在农田土壤重金属空间分布预测中,按照《农田土壤环境质量监测技术规范》的规定确定监测单元,采样点的布设以能代表监测区土壤质量为原则,采用均匀网格法确定采样点位置,可以在ArcGIS软件上以300的间隔布点,然后从中选取一定数量的点作为采样点。
具体地,在ArcGIS软件上确定采样点后,进行土壤样品采集时,可以GPS准确地确定采样点的空间位置,以采样点为圆心,在一定半径的范围内采集多个表层土样并进行混合。例如,在半径为5m的范围内采集多个土样并进行混合,取样深度为10cm。
本发明实施例通过ArcGIS软件选取采样点,可以使训练数据集中的辅助特征数据更准确。
在上述实施例中,所述辅助特征包括经度、纬度、高程、土壤类型、与公路的距离、与铁路的距离、与矿区的距离以及土壤侵蚀程度中的一个或多个。且所述辅助特征数据利用ArcGIS软件获取。
具体地,在步骤S12中获取所述采样点的辅助特征数据时,所述辅助特征中经度、纬度和高程数据,可以通过ArcGIS软件对数字高程图进行处理得到。所述土壤类型,可以通过ArcGIS软件对土壤类型栅格图层进行处理得到。所述与公路的距离,可通过ArcGIS软件对shp格式的区域公路分布图进行处理并计算欧氏距离得到,选取垂直距离为与公路的距离。所述与铁路的距离,可通过ArcGIS软件对shp格式的区域铁路分布图进行处理并计算欧氏距离得到,选取垂直距离为所述与铁路的距离。所述与矿区的距离,可由shp格式的区域矿山分布图进行处理并计算欧氏距离得到。所述土壤侵蚀程度,可通过ArcGIS软件对shp格式的区域土壤侵蚀强度图转化而来,其中区域土壤侵蚀等级共分为6级:无侵蚀、轻度侵蚀、中度侵蚀、强度侵蚀、极强侵蚀和剧烈侵蚀。
在步骤S14中获取待测点的辅助特征数据时,将在步骤12中获取辅助特征数据时利用的各数字图层缩放到同一分辨率后叠加,并导出为数据表格,每一行代表待测数据集中一个元素,该行的每一列代表该元素的一个辅助特征数值。
本发明实施例通过ArcGIS软件获取辅助数据,可以使训练数据集以及待测数据集更加精确,从而使得预测的土壤重金属含量数值更加准确。
在上述实施例中,所述用所述训练数据集训练所述GBRT模型得到训练好的GBRT模型具体为:
用所述训练数据集通过交叉验证法对所述GBRT模型进行训练得到所述训练好的GBRT模型。
其中,所述交叉验证法(Cross Validation)有时亦称循环估计,是一种统计学上将数据集切割成较小子集的方法。基本思想是将原始数据集(dataset)进行分组,一部分作为训练子集(train set),另一部分作为验证子集(validation set or test set),首先用训练子集对模型进行训练,再利用验证子集来测试训练得到的模型,以此来评价模型性能指标。交叉验证法一般包括:k折交叉验证法(K-fold Cross Validation)和留一交叉验证法(Leave-One-Out Cross Validation)。优选地,本发明实施例采用k折交叉验证法对所述GBRT模型进行训练得到所述训练好的GBRT模型。
进一步地,k折交叉验证法具体包括以下步骤:
首先,选取一个模型参数得到对应的GBRT模型,再将所述训练数据集分成k个互斥的子集,其中k为自然数,每次选取其中一个子集作为验证子集,余下的k-1个子集作为训练子集,则可以得到k个验证子集和k个对应的训练子集;
分别用各个训练子集对GBRT模型进行训练,得到k个训练后的GBRT模型;
用与训练子集对应的验证子集对对应的训练后的GBRT模型进行测试,即将验证子集中的辅助特征数据输入训练后的GBRT模型,假设验证子集中包含x个采样点,则输出x个对应的土壤重金属含量数值,并将这些输出的土壤重金属含量数值与验证子集中对应的已知的土壤重金属含量数值比较,求取一个均方根误差;
分别用与各个训练子集对应的k个验证子集对对应的训练后的GBRT模型进行测试,则得到k个均方根误差值,对这k个均方根误差值取平均数得到平均误差值,则这个平均误差值可评价这个模型参数对应的GBRT模型的性能。
具体地,采用交叉验证法对所述GBRT模型进行训练得到所述训练好的GBRT模型包括以下步骤:
首先,根据理论分析和实践经验选取GBRT模型的模型参数A1;
然后,利用训练数据集对模型参数为A1的GBRT模型采用交叉验证法进行训练得出对应的平均误差σ1;
再按一定步长选取模型参数的其他取值A2、A3…An,其中n值可根据需求选取,同理,利用训练数据集对模型参数为A2、A3…An的GBRT模型分别采用交叉验证法进行训练得出对应的平均误差σ2、σ3…σn;
比较σ1、σ2、σ3…σn的大小,选择平均误差最小的模型参数对应的GBRT模型作为预设GBRT模型;
再用整个训练数据集对预设GBRT模型进行训练,训练得到的GBRT模型即为训练好的GBRT模型。
本发明实施例提供的又一种土壤重金属空间分布预测方法,通过采用交叉验证法对所述GBRT模型进行训练得到所述训练好的GBRT模型,保证了训练好的GBRT模型的准确性,从而保证了对待测点对应的重金属含量数值预测的准确性。
在上述实施例中,所述方法还包括:
利用ArcGIS软件将所述待测点对应的土壤重金属含量数值绘制成土壤重金属空间分布图。
本发明实施例提供的又一种土壤重金属空间分布预测方法,通过将土壤重金属含量数值绘制成土壤重金属空间分布图,使待测区域重金属空间分布情况显示更为直观,便于观察和分析。
图2为本发明实施例提供的一种土壤重金属空间分布预测系统的结构框图,如图2所示,所述系统包括:测量模块21、第一获取模块22、训练模块23、第二获取模块24以及预测模块25,其中:
测量模块21用于测量采样点处土样的土壤重金属含量数值;第一获取模块22用于获取所述采样点的辅助特征数据,构建训练数据集,所述训练数据集包括:所述采样点对应的所述土壤重金属含量数值以及所述采样点的辅助特征数据;训练模块23用于将所述辅助特征和所述土壤重金属含量作为变量构建GBRT模型,并用所述训练数据集训练所述GBRT模型得到训练好的GBRT模型;第二获取模块24用于获取待测点的辅助特征数据,构建待测数据集,所述待测数据集包括所述待测点的所述辅助特征数据;预测模块25用于将所述待测数据集输入所述训练好的GBRT模型,输出所述待测点对应的土壤重金属含量数值。
具体地,测量模块21对采样点处土样的土壤重金属含量的测量,可以采用原子荧光光谱法、原子吸收光谱法、电感耦合等离子体发射光谱法、激光诱导击穿光谱法以及X射线荧光光谱法等方法。
第一获取模块22通过辅助手段分别获得采样点的各辅助特征数据,测量模块21已经测得所述采样点对应的土壤重金属含量数值,那么,各个采样点对应的所述辅助特征数据和所述土壤重金属含量就组合形成所述训练数据集,也就是在所述训练数据集中,所述辅助特征数据和所述土壤重金属含量数值都是已知的。
训练模块23用于利用python将所述辅助特征和所述土壤重金属含量作为变量来构建GBRT模型,又因为训练数据集中述辅助特征数据和所述土壤重金属含量数值都是已知,所以用训练数据集来对GBRT模型进行训练得到所述训练好的GBRT模型。
第二获取模块24用于根据第一获取模块22选定的辅助特征种类,分别获取待测点的各辅助特征数据,将获取的各个待测点对应的所述辅助特征数据作为所述待测数据集。
预测模块25用于将第二获取模块24获取的所述待测数据集中的待测点对应的辅助特征数据输入所述训练好的GBRT模型,并输出待测点对应的土壤重金属含量数值。
本发明实施例提供的一种土壤重金属空间分布预测系统,通过训练模块构建GBRT模型,并用训练数据集训练GBRT模型,预测模块再将训练好的GBRT模型应用于待测数据集,实现了对土壤重金属含量数值的预测,由于GBRT算法迭代集成若干弱回归器的特性、以及对辅助特征的合理应用使得本系统具有很好地泛化能力,有利于推广应用。
图3为本发明实施例提供的另一种土壤重金属空间分布预测系统的结构框图,如图3所示,所述系统包括:采样模块31、测量模块32、第一获取模块33、训练模块34、第二获取模块35以及预测模块36,其中:
测量模块32、第一获取模块33、训练模块34、第二获取模块35以及预测模块36在本实施例中所起作用与在图2对应实施例中所起作用相同,在此不再赘述。
采样模块31用于利用ArcGIS软件在待测区域内选取所述采样点,并获取所述采样点处土样。
具体地,采样模块31用于在ArcGIS软件上确定采样点后,进行土壤样品采集时,可以GPS准确地确定采样点的空间位置,以采样点为圆心,在一定半径的范围内采集多个表层土样并进行混合。
本发明实施例采集模块通过ArcGIS软件选取采样点,可以使训练数据集中的辅助特征数据更准确。
在上述实施例中,训练模块具体用于用所述训练数据集通过交叉验证法对所述GBRT模型进行训练得到所述训练好的GBRT模型。
具体地,采用交叉验证法对所述GBRT模型进行训练得到所述训练好的GBRT模型包括以下步骤:
首先,根据理论分析和实践经验选取GBRT模型的模型参数A1;
然后,利用训练数据集对模型参数为A1的GBRT模型采用交叉验证法进行训练得出对应的平均误差σ1;
再按一定步长选取模型参数的其他取值A2、A3…An,其中n值可根据需求选取,同理,利用训练数据集对模型参数为A2、A3…An的GBRT模型分别采用交叉验证法进行训练得出对应的平均误差σ2、σ3…σn;
比较σ1、σ2、σ3…σn的大小,选择平均误差最小的模型参数对应的GBRT模型作为预设GBRT模型;
再用整个训练数据集对预设GBRT模型进行训练,训练得到的GBRT模型即为训练好的GBRT模型。
本发明实施例提供的又一种土壤重金属空间分布预测系统,训练模块采用交叉验证法对所述GBRT模型进行训练得到所述训练好的GBRT模型,保证了训练好的GBRT模型的准确性,从而保证了对待测点对应的重金属含量数值预测的准确性。
图4为本发明实施例提供的又一种土壤重金属空间分布预测系统的结构框图,如图4所示,所述系统包括采样模块41、测量模块42、第一获取模块43、训练模块44、第二获取模块45、预测模块46以及绘图模块47,其中:
采样模块41、测量模块42、第一获取模块43、训练模块44、第二获取模块45以及预测模块46在本实施例中所起作用与在图3对应实施例中所起作用相同,在此不再赘述。
绘图模块47用于利用ArcGIS软件将所述待测点对应的土壤重金属含量数值绘制成土壤重金属空间分布图。
本发明实施例提供的又一种土壤重金属空间分布预测系统,通过绘图模块将土壤重金属含量数值绘制成土壤重金属空间分布图,使待测区域重金属空间分布情况显示更为直观,便于观察和分析。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种土壤重金属空间分布预测方法,其特征在于,所述方法包括:
测量采样点处土样的土壤重金属含量数值;
获取所述采样点的辅助特征数据,构建训练数据集,所述训练数据集包括:所述采样点对应的所述土壤重金属含量数值以及所述采样点的辅助特征数据;
将所述辅助特征和所述土壤重金属含量作为变量构建GBRT模型,并用所述训练数据集训练所述GBRT模型得到训练好的GBRT模型;
获取待测点的辅助特征数据,构建待测数据集,所述待测数据集包括所述待测点的所述辅助特征数据;
将所述待测数据集输入所述训练好的GBRT模型,输出所述待测点对应的土壤重金属含量数值。
2.根据权利要求1所述方法,其特征在于,在所述测量采样点处土样的土壤重金属含量数值之前还包括:
利用ArcGIS软件在待测区域内选取所述采样点,并获取所述采样点处土样。
3.根据权利要求1所述方法,其特征在于,所述辅助特征包括经度、纬度、高程、土壤类型、与公路的距离、与铁路的距离、与矿区的距离以及土壤侵蚀程度中的一个或多个。
4.根据权利要求3所述方法,其特征在于,所述辅助特征数据利用ArcGIS软件获取。
5.根据权利要求1所述方法,其特征在于,所述用所述训练数据集训练所述GBRT模型得到训练好的GBRT模型具体为:
用所述训练数据集通过交叉验证法对所述GBRT模型进行训练得到所述训练好的GBRT模型。
6.根据权利要求1所述方法,其特征在于,在所述将所述待测数据集输入所述训练好的GBRT模型,输出所述待测点对应的土壤重金属含量数值之后还包括:
利用ArcGIS软件将所述待测点对应的土壤重金属含量数值绘制成土壤重金属空间分布图。
7.一种土壤重金属空间分布预测系统,其特征在于,所述系统包括:
测量模块,用于测量采样点处土样的土壤重金属含量数值;
第一获取模块,用于获取所述采样点的辅助特征数据,构建训练数据集,所述训练数据集包括:所述采样点对应的所述土壤重金属含量数值以及所述采样点的辅助特征数据;
训练模块,用于将所述辅助特征和所述土壤重金属含量作为变量构建GBRT模型,并用所述训练数据集训练所述GBRT模型得到训练好的GBRT模型;
第二获取模块,用于获取待测点的辅助特征数据,构建待测数据集,所述待测数据集包括所述待测点的所述辅助特征数据;
预测模块,用于将所述待测数据集输入所述训练好的GBRT模型,输出所述待测点对应的土壤重金属含量数值。
8.根据权利要求7所述的系统,其特征在于,所述系统还包括采样模块,用于利用ArcGIS软件在待测区域内选取所述采样点,并获取所述采样点处土样。
9.根据权利要求7所述的系统,其特征在于,所述训练模块具体用于用所述训练数据集通过交叉验证法对所述GBRT模型进行训练得到所述训练好的GBRT模型。
10.根据权利要求7所述的系统,其特征在于,所述系统还包括绘图模块,用于利用ArcGIS软件将所述待测点对应的土壤重金属含量数值绘制成土壤重金属空间分布图。
CN201710124266.0A 2017-03-03 2017-03-03 一种土壤重金属空间分布预测方法及系统 Pending CN106996969A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710124266.0A CN106996969A (zh) 2017-03-03 2017-03-03 一种土壤重金属空间分布预测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710124266.0A CN106996969A (zh) 2017-03-03 2017-03-03 一种土壤重金属空间分布预测方法及系统

Publications (1)

Publication Number Publication Date
CN106996969A true CN106996969A (zh) 2017-08-01

Family

ID=59431774

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710124266.0A Pending CN106996969A (zh) 2017-03-03 2017-03-03 一种土壤重金属空间分布预测方法及系统

Country Status (1)

Country Link
CN (1) CN106996969A (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108647826A (zh) * 2018-05-11 2018-10-12 广东省生态环境技术研究所 一种土壤重金属环境风险预测模型的构建方法和装置
CN109060858A (zh) * 2018-09-17 2018-12-21 中国科学院地理科学与资源研究所 一种土壤重金属浓度空间分布预测准确性的定量评价方法
CN109596378A (zh) * 2018-12-10 2019-04-09 四川农业大学 一种用于川西平原农业生态系统大气沉降监测点布置方法
CN109828532A (zh) * 2019-01-29 2019-05-31 贵州大学 一种基于ga-gbrt的表面粗糙度预测方法及工艺参数优化方法
CN110346309A (zh) * 2019-06-09 2019-10-18 重庆工商大学融智学院 一种土壤重金属污染区域的预测预警方法
CN111239368A (zh) * 2020-02-10 2020-06-05 浙江大学 硒镉伴生作物重金属安全诊断系统及方法
CN111581250A (zh) * 2020-04-21 2020-08-25 中国科学院地理科学与资源研究所 矿区周边土壤重金属随自然因素的变化定量研究方法
CN112926256A (zh) * 2021-01-28 2021-06-08 武汉轻工大学 基于深度强化学习的土壤重金属含量预测方法及系统
CN113685188A (zh) * 2021-08-16 2021-11-23 中铁十八局集团有限公司 一种基于岩渣物理特征的tbm掘进优化方法
CN114154627A (zh) * 2022-02-10 2022-03-08 山东省地质矿产勘查开发局第七地质大队(山东省第七地质矿产勘查院) 一种基于gis与双层神经网络的土壤剖面测量方法及设备
CN114548747A (zh) * 2022-02-19 2022-05-27 中国农业科学院农业信息研究所 一种土壤重金属的空间插值方法、装置、电子设备及介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101718775A (zh) * 2009-11-12 2010-06-02 上海交通大学 围垦地土壤中重金属含量的空间变异分布图生成方法
US20120005204A1 (en) * 2010-07-01 2012-01-05 Yahoo! Inc. System for determining and optimizing for relevance in match-making systems
CN102636632A (zh) * 2012-04-25 2012-08-15 上海交通大学 围垦地土壤重金属污染综合评价图生成方法
CN103577605A (zh) * 2013-11-20 2014-02-12 贵州电网公司电力调度控制中心 基于数据融合和数据挖掘的数据仓库及其应用方法
CN105528652A (zh) * 2015-12-03 2016-04-27 北京金山安全软件有限公司 一种预测模型的建立方法及终端

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101718775A (zh) * 2009-11-12 2010-06-02 上海交通大学 围垦地土壤中重金属含量的空间变异分布图生成方法
US20120005204A1 (en) * 2010-07-01 2012-01-05 Yahoo! Inc. System for determining and optimizing for relevance in match-making systems
CN102636632A (zh) * 2012-04-25 2012-08-15 上海交通大学 围垦地土壤重金属污染综合评价图生成方法
CN103577605A (zh) * 2013-11-20 2014-02-12 贵州电网公司电力调度控制中心 基于数据融合和数据挖掘的数据仓库及其应用方法
CN105528652A (zh) * 2015-12-03 2016-04-27 北京金山安全软件有限公司 一种预测模型的建立方法及终端

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
宋志廷: "基于地质统计及随机模拟技术的天津武清区土壤重金属源解析", 《环境科学》 *
朱玉全: "《数据挖掘技术》", 30 November 2006 *
李晓婷: "太原市城区周边土壤污染特征分析及等级评价", 《中国优秀硕士学位论文数据库 工程科技1辑》 *
范拴喜: "《土壤重金属污染与控制》", 30 November 2011 *
赖日文: "《3S技术实践教程》", 30 September 2014 *

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108647826B (zh) * 2018-05-11 2021-03-30 广东省科学院生态环境与土壤研究所 一种土壤重金属环境风险预测模型的构建方法和装置
CN108647826A (zh) * 2018-05-11 2018-10-12 广东省生态环境技术研究所 一种土壤重金属环境风险预测模型的构建方法和装置
CN109060858A (zh) * 2018-09-17 2018-12-21 中国科学院地理科学与资源研究所 一种土壤重金属浓度空间分布预测准确性的定量评价方法
CN109596378A (zh) * 2018-12-10 2019-04-09 四川农业大学 一种用于川西平原农业生态系统大气沉降监测点布置方法
CN109828532A (zh) * 2019-01-29 2019-05-31 贵州大学 一种基于ga-gbrt的表面粗糙度预测方法及工艺参数优化方法
CN110346309A (zh) * 2019-06-09 2019-10-18 重庆工商大学融智学院 一种土壤重金属污染区域的预测预警方法
CN111239368A (zh) * 2020-02-10 2020-06-05 浙江大学 硒镉伴生作物重金属安全诊断系统及方法
CN111581250A (zh) * 2020-04-21 2020-08-25 中国科学院地理科学与资源研究所 矿区周边土壤重金属随自然因素的变化定量研究方法
CN112926256A (zh) * 2021-01-28 2021-06-08 武汉轻工大学 基于深度强化学习的土壤重金属含量预测方法及系统
CN112926256B (zh) * 2021-01-28 2022-06-14 武汉轻工大学 基于深度强化学习的土壤重金属含量预测方法及系统
CN113685188A (zh) * 2021-08-16 2021-11-23 中铁十八局集团有限公司 一种基于岩渣物理特征的tbm掘进优化方法
CN114154627A (zh) * 2022-02-10 2022-03-08 山东省地质矿产勘查开发局第七地质大队(山东省第七地质矿产勘查院) 一种基于gis与双层神经网络的土壤剖面测量方法及设备
CN114154627B (zh) * 2022-02-10 2022-05-20 山东省地质矿产勘查开发局第七地质大队(山东省第七地质矿产勘查院) 一种基于gis与双层神经网络的土壤剖面测量方法及设备
CN114548747A (zh) * 2022-02-19 2022-05-27 中国农业科学院农业信息研究所 一种土壤重金属的空间插值方法、装置、电子设备及介质

Similar Documents

Publication Publication Date Title
CN106996969A (zh) 一种土壤重金属空间分布预测方法及系统
Dick et al. Modelling landscape controls on dissolved organic carbon sources and fluxes to streams
Grayson et al. Advances in the use of observed spatial patterns of catchment hydrological response
Matzeu et al. Methodological approach to assessment of groundwater contamination risk in an agricultural area
CN105388525B (zh) 储层预测方法及装置
Goodrich et al. Catchment hydrology
CN106568923A (zh) 一种土壤重金属含量影响因子评价方法
Mansour et al. Estimation of spatially distributed groundwater potential recharge for the United Kingdom
Aquilanti et al. DNA and fluorescein tracer tests to study the recharge, groundwater flowpath and hydraulic contact of aquifers in the Umbria-Marche limestone ridge (central Apennines, Italy)
Kidd et al. Digital mapping of a soil drainage index for irrigated enterprise suitability in Tasmania, Australia
Hubbard et al. Estimation of soil classes and their relationship to grapevine vigor in a Bordeaux vineyard: advancing the practical joint use of electromagnetic induction (EMI) and NDVI datasets for precision viticulture
Sahana et al. Assessing the degree of soil salinity in the Indian Sundarban Biosphere Reserve using measured soil electrical conductivity and remote sensing data–derived salinity indices
CN112233734B (zh) 基于机器学习的水质数据推演获取方法及系统
Möller et al. Effective map scales for soil transport processes and related process domains—Statistical and spatial characterization of their scale-specific inaccuracies
CN110889196B (zh) 基于水质模型的水环境承载力评估方法、装置及存储介质
Hellebrand et al. A process proof test for model concepts: modelling the meso-scale
Zhang et al. Soil total and organic carbon mapping and uncertainty analysis using machine learning techniques
Buchanan et al. Salinity risk assessment using fuzzy multiple criteria evaluation
Wang et al. Research on habitat quality assessment and decision-making based on Semi-supervised Ensemble Learning method—Daxia River Basin, China
Fu et al. GIS and ANN-based spatial prediction of DOC in river networks: a case study in Dongjiang, Southern China
Dashtpagerdi et al. Application of cross-validation technique for zoning of groundwater levels in Shahrekord plain.
Barone et al. Comparison of different methods to assess the distribution of alien plants along the road network and use of Google Street View panoramas interpretation in Sicily (Italy) as a case study
Aghajari et al. Relationship between groundwater quality and distance to fault using adaptive neuro fuzzy inference system (ANFIS) and geostatistical methods (case study: North of Fars Province)
CN109165795A (zh) 一种基于群智能算法的集合径流预测系统与方法
Halabisky et al. The Wetland Intrinsic Potential tool: Mapping wetland intrinsic potential through machine learning of multi-scale remote sensing proxies of wetland indicators

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170801