CN114511239A - 土壤重金属污染风险区划分方法、装置、电子设备及介质 - Google Patents
土壤重金属污染风险区划分方法、装置、电子设备及介质 Download PDFInfo
- Publication number
- CN114511239A CN114511239A CN202210152175.9A CN202210152175A CN114511239A CN 114511239 A CN114511239 A CN 114511239A CN 202210152175 A CN202210152175 A CN 202210152175A CN 114511239 A CN114511239 A CN 114511239A
- Authority
- CN
- China
- Prior art keywords
- heavy metal
- metal pollution
- soil heavy
- risk
- soil
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000002689 soil Substances 0.000 title claims abstract description 211
- 229910001385 heavy metal Inorganic materials 0.000 title claims abstract description 204
- 238000000034 method Methods 0.000 title claims abstract description 52
- 238000005070 sampling Methods 0.000 claims abstract description 100
- 238000007637 random forest analysis Methods 0.000 claims abstract description 47
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 45
- 238000012216 screening Methods 0.000 claims abstract description 8
- 238000005457 optimization Methods 0.000 claims description 22
- 238000012549 training Methods 0.000 claims description 21
- 238000002790 cross-validation Methods 0.000 claims description 12
- 238000011156 evaluation Methods 0.000 claims description 10
- 241000282414 Homo sapiens Species 0.000 claims description 8
- 238000013507 mapping Methods 0.000 claims description 7
- 238000012360 testing method Methods 0.000 claims description 7
- 238000013316 zoning Methods 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 5
- 238000000605 extraction Methods 0.000 claims description 4
- 238000003066 decision tree Methods 0.000 claims description 3
- 238000009499 grossing Methods 0.000 claims description 3
- 230000008569 process Effects 0.000 claims description 3
- 238000001514 detection method Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 230000002159 abnormal effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000003912 environmental pollution Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000012067 mathematical method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012502 risk assessment Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000012732 spatial analysis Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/067—Enterprise or organisation modelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Theoretical Computer Science (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- General Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- Game Theory and Decision Science (AREA)
- Educational Administration (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Health & Medical Sciences (AREA)
- Water Supply & Treatment (AREA)
- Public Health (AREA)
- Primary Health Care (AREA)
- General Health & Medical Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种土壤重金属污染风险区划分方法、装置、电子设备及介质,上述方法包括:用土壤重金属污染风险区划分采样点数据集构建基于随机森林算法的土壤重金属污染风险等级预测模型,根据重要因素间的相关性和因素重要性筛选最优因素,生成最优输入变量集,其与优化预测模型生成最优参数组一起输入预测模型,生成优化的预测模型,利用优化的预测模型计算待划分风险区域的规则间隔点集的风险等级,最后优化处理由风险等级数据生成待划分区域的土壤重金属污染多级风险区。应用本发明实施例中的方法、装置、电子设备及介质有效提高了风险区划边界的精准度,解决地统计空间插值方法对采样点代表性和数量的依赖性强问题。
Description
技术领域
本发明属于环境污染评价技术领域,具体涉及一种区域土壤重金属污染风险区划分方法、装置、电子设备及介质。
背景技术
土壤是地球生态系统的重要组成部分、人类赖以生存的自然资源,在人类的生产生活中占据着至关重要的位置。土壤重金属污染关系国家粮食安全和人民身体健康,污染风险区的准确划分是开展土壤重金属污染风险评估、风险管控及修复治理的重要基础性工作。
土壤重金属的空间分布受自然和人为多种因素综合影响,是具有高度异质性的复合体。目前,土壤重金属污染风险区划分普遍采用地统计空间插值方法,旨在利用有限的采样点数据的空间相关性,对非采样点处的土壤重金属含量进行无偏最优估计,这不仅要求采样数据真实且具有代表性,采样点的数量更是至关重要。理论上,提高采样密度可获得高精度空间数据信息,然而对于土壤重金属检测,检测精度和准确性较高的实验室检测法具有检测周期长、工作繁琐的问题,因此,采样密度越高,所需的人力、物力、财力和时间越多,土壤重金属污染风险区划分的成本越高。
发明内容
本发明所要解决的技术问题在于针对上述现有技术的不足,提供了一种区域土壤重金属污染风险区划分方法、装置、电子设备及介质。该划分方法能够提高土壤重金属采样检测数据的利用效率,实现土壤重金属污染风险区划边界准确度的有效提高、而且还无需提高采样密度,减少人力、财力、物力和时间的耗费,
为解决上述技术问题,本发明采用的技术方案是:一种区域土壤重金属污染风险区划分方法,包括:
根据待划分风险区域内各采样点的土壤重金属含量计算各采样点的土壤重金属污染风险等级;
获取所述待划分风险区域的重要因素的空间连续分布数据,所述重要因素影响土壤重金属时空分布,再从所述空间连续分布数据中提取所述各采样点的重要影响因素值;
将所述各采样点的坐标位置与各采样点的土壤重金属污染风险等级和重要影响因素值的一一映射,整合映射后的各采样点数据生成土壤重金属污染风险区划分采样点数据集;
将所述土壤重金属污染风险区划分采样点数据集划分为训练集和测试集,构建基于随机森林算法的土壤重金属污染风险等级预测模型;
计算所述影响土壤重金属时空分布的重要因素间的相关性,结合所述相关性和所述基于随机森林算法的土壤重金属污染风险等级预测模型产生的因素重要性,筛选最优因素,生成最优输入变量集;
优化所述基于随机森林算法的土壤重金属污染风险等级预测模型的重要参数生成最优参数组,将所述最优参数组和所述最优输入变量集输入基于随机森林算法的土壤重金属污染风险等级预测模型,生成优化的土壤重金属污染风险等级预测模型;
提取代表所述待划分风险区域的规则间隔点集,利用所述优化的土壤重金属污染风险等级预测模型计算所述规则间隔点集的风险等级,优化处理由所述规则间隔点集的风险等级数据生成所述待划分区域的土壤重金属污染多级风险区。
进一步地,计算所述待划分风险区域各采样点的土壤重金属污染风险等级,包括:按照土壤重金属污染风险评价方法,根据所述各采样点的土壤重金属含量计算其土壤重金属污染风险值;根据所述土壤重金属污染风险评价方法的风险等级阈值评估所述各采样点的风险等级。
进一步地,所述影响土壤重金属时空分布的重要因素包括自然因素和人为因素,自然因素至少包括海拔、坡度、坡向和土壤类型,人为因素至少包括土地利用类型、与居住区、道路和河流的距离。
进一步地,获取所述待划分风险区域的重要因素的空间连续分布数据的方法,包括:
基于DEM数据提取待划分风险区域的海拔、坡度和坡向数据;
栅格化待划分风险区域的土壤类型和土地利用类型数据;
基于待划分风险区域的土地利用类型数据计算所述各采样点与居住区、道路和河流的距离的数据。
进一步地,提取所述各采样点的重要影响因素值,包括:将所述各采样点叠加到影响土壤重金属时空分布的重要因素的空间连续分布数据,按照所述各采样点的坐标位置提取所述各采样点的土壤重金属时空分布的重要影响因素值。
进一步地,优化所述基于随机森林算法的土壤重金属污染风险等级预测模型的重要参数生成最优参数组,包括:
按照设定的参数空间建立参数字典,对所述参数字典的重要参数采用循环嵌套、逐一遍历的优化模式,在未优化参数中选择一个作为待优化参数,固定已优化参数值,设定其他未优化参数值;
其中,待优化参数的遍历循环优化过程具体包括:利用参数随机搜索交叉验证的方式训练所述基于随机森林算法的土壤重金属污染风险等级预测模型,以生成的最优参数组为标准更新参数范围,形成优化参数字典;再按照所述优化参数字典,利用参数网格搜索交叉验证的方式训练所述基于随机森林算法的土壤重金属污染风险等级预测模型,生成所述模型的最优参数组;
其中,所述重要参数至少包括:决策树个数、最大特征数和最大深度。
进一步地,提取代表所述待划分风险区域的规则间隔点集,包括:按照设定距离创建覆盖所述待划分风险区域的规则网格;提取网格中心点生成代表所述待划分风险区域的规则间隔点集;计算所述规则间隔点集的坐标位置,提取所述规则间隔点集的土壤重金属时空分布的重要影响因素值。
进一步地,优化处理所述规则间隔点集的风险等级数据生成所述待划分区域的土壤重金属污染多级风险区,包括:空间连接所述规则间隔点集的风险等级至所述规则格网;按照所述规则格网各格网单元的风险等级融合相邻格网单元,按照设定规则消除细小格网单元,生成多级风险区划多边形;按照设定容差平滑所述多级风险区划多边形边界。
根据本发明的另一个方面,提供一种区域土壤重金属污染风险区划分装置,包括:计算模块,用于根据待划分风险区域内各采样点的土壤重金属含量计算各采样点的土壤重金属污染风险等级;提取模块,用于获取所述待划分风险区域的重要因素的空间连续分布数据,所述重要因素影响土壤重金属时空分布,再从所述空间连续分布数据中提取所述各采样点的重要影响因素值;第一生成模块,用于将所述各采样点的坐标位置与各采样点的土壤重金属污染风险等级和重要影响因素值的一一映射,整合映射后的各采样点数据生成土壤重金属污染风险区划分采样点数据集;训练模块,用于将所述土壤重金属污染风险区划分采样点数据集划分为训练集和测试集,构建基于随机森林算法的土壤重金属污染风险等级预测模型;第一优化模块,用于计算所述影响土壤重金属时空分布的重要因素间的相关性,结合所述相关性和所述基于随机森林算法的土壤重金属污染风险等级预测模型产生的因素重要性,筛选最优因素,生成最优输入变量集;第二优化模块,用于优化所述基于随机森林算法的土壤重金属污染风险等级预测模型的重要参数生成最优参数组,将所述最优参数组和所述最优输入变量集输入基于随机森林算法的土壤重金属污染风险等级预测模型,生成优化的土壤重金属污染风险等级预测模型;第二生成模块,用于提取代表所述待划分风险区域的规则间隔点集,利用所述优化的土壤重金属污染风险等级预测模型计算所述规则间隔点集的风险等级,优化处理由所述规则间隔点集的风险等级数据生成所述待划分区域的土壤重金属污染多级风险区。
进一步地,所述优化模块还包括:第一优化单元,用于利用参数随机搜索交叉验证的方式训练所述基于随机森林算法的土壤重金属污染风险等级预测模型,以生成的最优参数组为标准更新参数范围,形成优化参数字典;第二优化单元,用于按照所述优化参数字典,利用参数网格搜索交叉验证的方式训练所述基于随机森林算法的土壤重金属污染风险等级预测模型,生成所述模型的最优参数组。
根据本发明的另一个方面,提供一种电子设备,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行所述的区域土壤重金属污染风险区划分方法。
根据本发明的另一个方面,提供一种计算机可读存储介质,其存储有计算机指令,所述计算机指令被操作以执行所述的区域土壤重金属污染风险区划分方法。
本发明与现有技术相比具有以下优点:
1、本发明充分利用易获取的影响土壤重金属时空分布的重要因素,能够有效提高土壤重金属污染风险区划分的准确度,解决现有方法中地统计空间插值方法对采样点代表性和数量的依赖性强问题。优化后的土壤重金属污染风险等级预测模型的建立,提高了对真实存在的土壤重金属含量极值等异常值和噪声值的容忍度,更适用于受人为因素影响较大、空间变异性强、异常值真实存在、且通常呈非正态分布的土壤重金属污染风险区的划分,通过预测结果的优化处理,进一步实现了土壤重金属污染风险区划边界精准度的有效提高。
下面通过附图和实施例对本发明的技术方案作进一步的详细说明。
附图说明
图1是本申请实施例的一种区域土壤重金属污染风险区划分方法流程示意图;
图2是图1中计算待划分风险区域各采样点的土壤重金属污染风险等级的方法流程示意图;
图3是图1中优化基于随机森林算法的土壤重金属污染风险等级预测模型的重要参数生成最优参数组的方法流程示意图;
图4是根据本申请实施例的一种区域土壤重金属污染风险区划分装置结构示意图。
具体实施方式
如图1所示,本申请实施例的一种区域土壤重金属污染风险区划分方法该方法包括如下步骤:
步骤S1,根据待划分风险区域内各采样点的土壤重金属含量计算各采样点的土壤重金属污染风险等级。
步骤S2,获取所述待划分风险区域的重要因素的空间连续分布数据,所述重要因素影响土壤重金属时空分布,再从所述空间连续分布数据中提取所述各采样点的重要影响因素值。
步骤S3,将所述各采样点的坐标位置与各采样点的土壤重金属污染风险等级和重要影响因素值的一一映射,整合映射后的各采样点数据生成土壤重金属污染风险区划分采样点数据集。
步骤S4,将所述土壤重金属污染风险区划分采样点数据集划分为训练集和测试集,构建基于随机森林算法的土壤重金属污染风险等级预测模型。
步骤S5,计算所述影响土壤重金属时空分布的重要因素间的相关性,结合所述相关性和所述基于随机森林算法的土壤重金属污染风险等级预测模型产生的因素重要性,筛选最优因素,生成最优输入变量集。
步骤S6,优化所述基于随机森林算法的土壤重金属污染风险等级预测模型的重要参数生成最优参数组,将所述最优参数组和所述最优输入变量集输入基于随机森林算法的土壤重金属污染风险等级预测模型,生成优化的土壤重金属污染风险等级预测模型。
步骤S7,提取代表所述待划分风险区域的规则间隔点集,利用所述优化的土壤重金属污染风险等级预测模型计算所述规则间隔点集的风险等级,优化处理由所述规则间隔点集的风险等级数据生成所述待划分区域的土壤重金属污染多级风险区。
通过步骤S1至步骤S7,计算待划分风险区域各采样点的土壤重金属污染风险等级,获取各采样点的影响土壤重金属时空分布的重要因素值,筛选最优因素,生成最优输入变量集,并且优化所述基于随机森林算法的土壤重金属污染风险等级预测模型的重要参数生成最优参数组,在利用最优输入变量集和最优参数组输入基于随机森林的土壤重金属污染风险等级预测模型,生成优化的土壤重金属污染风险等级预测模型,提取代表待划分风险区域的规则间隔点集并计算各点处的土壤重金属污染风险等级,优化处理计算结果生成区域土壤重金属污染多级风险区。
通过上述方法,达到了区域土壤重金属污染风险区精确划分的目的,充分利用易获取的影响土壤重金属时空分布的重要因素,实现了提高区域土壤重金属污染风险区划分精度的技术效果,进而解决了由于采样点代表性差、数量少导致的预测精度低的技术问题。
图2是图1中步骤S1中计算待划分风险区域各采样点的土壤重金属污染风险等级的方法流程示意图,如图2所示,本实施例提供的待划分风险区域各采样点的土壤重金属污染风险等级的计算,可以包括:
步骤S11,按照土壤重金属污染风险评价方法,根据所述各采样点的土壤重金属含量计算其土壤重金属污染风险值;
步骤S12,根据所述土壤重金属污染风险评价方法的风险等级阈值评估所述各采样点的风险等级。
具体地,这里的土壤重金属污染风险评价方法包括背景值法、单因子污染指数法、内梅罗综合指数法、地累积指数法、潜在生态危害指数法、污染负荷指数法、模糊数学法、回归过量分析法等。首先,按照土壤重金属污染风险评价方法,根据各采样点的土壤重金属含量计算其土壤重金属污染风险值。然后,根据土壤重金属污染风险评价方法的风险等级阈值评估各采样点的风险等级。
作为一种可选的实施方式,步骤S2中获取所述待划分风险区域的重要因素的空间连续分布数据的方法,可以包括:
步骤S21,基于DEM数据提取待划分风险区域的海拔、坡度和坡向数据。
步骤S22,栅格化待划分风险区域的土壤类型和土地利用类型数据。
步骤S23,基于待划分风险区域的土地利用类型数据计算所述各采样点与居住区、道路和河流的距离。
具体地,这里的影响土壤重金属时空分布的重要因素包括自然因素和人为因素,自然因素至少包括海拔、坡度、坡向和土壤类型,人为因素至少包括土地利用类型、与居住区、道路和河流的距离。步骤S21,通过地理空间数据云平台下载待划分区域的DEM(数字高程)数据,应用ArcGIS 空间分析模块提取坡度和坡向数据。步骤S23中各采样点与居住区、道路和河流的距离,是基于采样点位置和待划分风险区域的土地利用矢量数据,应用ArcGIS邻域分析模块的近邻分析算法计算得到。
作为一种可选的实施方式,步骤S2中提取所述各采样点的重要影响因素值中,可以包括:将所述各采样点叠加到影响土壤重金属时空分布的重要因素的空间连续分布数据,按照所述各采样点的坐标位置提取所述各采样点的土壤重金属时空分布的重要影响因素值。
具体地,首先,叠加各采样点及影响土壤重金属时空分布的重要因素的空间连续分布数据,应用ArcGIS空间分析模块的提取值到点工具,分别提取各采样点坐标位置处土壤重金属时空分布的重要影响因素的值。然后,根据各采样点坐标位置创建多列组合唯一索引,根据唯一索引建立各采样点坐标与各采样点土壤重金属含量和影响因素值的一一映射,整合映射后的各采样点数据生成土壤重金属污染风险区划分采样点数据集。
图3是图1中优化土壤重金属污染风险等级预测模型的重要参数的方法流程示意图,如图3所示,本实施例提供的优化所述基于随机森林算法的土壤重金属污染风险等级预测模型的重要参数生成最优参数组,包括:
按照设定的参数空间建立参数字典,对所述参数字典的重要参数采用循环嵌套、逐一遍历的优化模式,在未优化参数中选择一个作为待优化参数,固定已优化参数值,设定其他未优化参数值;
其中,待优化参数的遍历循环优化过程具体包括:
S61,利用参数随机搜索交叉验证的方式训练所述基于随机森林算法的土壤重金属污染风险等级预测模型,以生成的最优参数组为标准更新参数范围,形成优化参数字典;
S62,按照所述优化参数字典,利用参数网格搜索交叉验证的方式训练所述基于随机森林算法的土壤重金属污染风险等级预测模型,生成所述模型的最优参数组;
具体地,所述重要参数至少包括:决策树个数、最大特征数和最大深度。首先,将土壤重金属污染风险区划分采样点数据集划分为训练集和测试集,构建基于随机森林的土壤重金属污染风险等级预测模型。然后,计算土壤重金属时空分布的重要影响因素间的相关性,结合因素间的相关性和由所述基于随机森林算法的土壤重金属污染风险等级预测模型产生的因素重要性,筛选最优因素,生成最优输入变量集。这里因素间的相关性度量指标包括但不限于Person相关系数、Spearman相关系数等。在步骤 S6优化所述基于随机森林算法的土壤重金属污染风险等级预测模型的重要参数生成最优参数组,将生成的最优参数组和最优输入变量集输入S4 中的基于随机森林算法的土壤重金属污染风险等级预测模型,生成优化的土壤重金属污染风险等级预测模型。这里参数字典的内容包括各参数的名称、数据类型和参数取值范围等参数描述信息。
作为一种可选的实施方式,步骤S7提取代表所述待划分风险区域的规则间隔点集,可以包括:
S711,按照设定距离创建覆盖所述待划分风险区域的规则网格。
S712,提取S711中所述规则网格中心点生成代表所述待划分风险区域的规则间隔点集。
S713,计算S712中所述规则间隔点集的坐标位置,提取所述规则间隔点集的土壤重金属时空分布的重要影响因素值。
具体地,在步骤S711至步骤S713中,首先,按照设定距离创建覆盖待划分风险区域的规则网格,这里设定距离可以是全域等距离、也可以是不等距离。然后,应用ArcGIS几何计算功能提取规则网格的各网格中心点,生成代表待划分风险区域的规则间隔点集,计算规则间隔点集中各点的坐标位置,应用步骤S2的方式提取规则间隔点集中各点的土壤重金属时空分布的重要影响因素值。
作为一种可选的实施方式,步骤S6优化处理所述规则间隔点集的风险等级数据生成所述待划分区域的土壤重金属污染多级风险区,可以包括:
步骤S621,空间连接S612中所述规则间隔点集的风险等级至S611 中所述规则网格。
步骤S622,按照所述规则网格中各格网单元的风险等级融合相邻格网单元,按照设定规则消除细小格网单元,生成多级风险区划多边形。
步骤S623,按照设定容差平滑所述多级风险区划多边形边界。
具体地,在步骤S621至步骤S623中,首先,利用空间连接将规则间隔点集的风险等级连接至与其一一对应的规则格网的各格网单元,应用 ArcGIS数据管理工具的消除模块融合风险等级相同的相邻格网单元。然后,按照设定规则消除细小格网单元,生成多级风险区划多边形,这里的设定规则包括面积小于设定值和/或边长小于特定值。最后,按照设定容差平滑所述多级风险区划多边形边界,这里的容差可以是距离或像素。
图4是本实施例提供的一种区域土壤重金属污染风险区划分装置结构示意图,如图4所示,本实施例提供的区域土壤重金属污染风险区划分装置包括:
计算模块41,用于计算待划分风险区域各采样点的土壤重金属污染风险等级;
提取模块42,用于获取所述待划分风险区域的影响土壤重金属时空分布的重要因素的空间连续分布数据,提取所述各采样点的重要影响因素值;
第一生成模块43,用于根据所述各采样点坐标位置创建多列组合唯一索引,建立所述各采样点与土壤重金属含量及其影响因素值的一一映射,汇集映射后的各采样点数据生成土壤重金属污染风险区划分采样点数据集;
训练模块44,用于将所述土壤重金属污染风险区划分采样点数据集划分为训练集和测试集,构建基于随机森林的土壤重金属污染风险等级预测模型;
第一优化模块45,用于计算所述影响土壤重金属时空分布的重要因素间的相关性,结合所述相关性和所述基于随机森林算法的土壤重金属污染风险等级预测模型产生的因素重要性,筛选最优因素,生成最优输入变量集;
第二优化模块46,用于优化所述基于随机森林算法的土壤重金属污染风险等级预测模型的重要参数生成最优参数组,将所述最优参数组和所述最优输入变量集输入基于随机森林算法的土壤重金属污染风险等级预测模型,生成优化的土壤重金属污染风险等级预测模型;
第二生成模块47,用于提取代表所述待划分风险区域的规则间隔点集,利用所述优化的土壤重金属污染风险等级预测模型计算所述规则间隔点集的风险等级,优化处理所述规则间隔点集的风险等级数据生成所述待划分区域的土壤重金属污染多级风险区。
可选的,所述第二优化模块还包括:第一优化单元461,用于利用参数随机搜索交叉验证的方式训练所述基于随机森林算法的土壤重金属污染风险等级预测模型,以生成的最优参数组为标准更新参数范围,形成优化参数字典;第二优化单元462,用于按照所述优化参数字典,利用参数网格搜索交叉验证的方式训练所述基于随机森林算法的土壤重金属污染风险等级预测模型,生成所述模型的最优参数组。
具体地,本实施例中各模块的作用及相应的操作流程和方法与上述方法类实施例是一一对应的,在此不再赘述。
本实施例还提供一种电子设备,所述电子设备包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行所述的区域土壤重金属污染风险区划分方法。
本实施例还提供一种计算机可读存储介质,其存储有计算机指令,所述计算机指令被操作以执行所述的区域土壤重金属污染风险区划分方法。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。
Claims (12)
1.一种区域土壤重金属污染风险区划分方法,其特征在于,该方法包括:
根据待划分风险区域内各采样点的土壤重金属含量计算各采样点的土壤重金属污染风险等级;
获取所述待划分风险区域的重要因素的空间连续分布数据,所述重要因素影响土壤重金属时空分布,再从所述空间连续分布数据中提取所述各采样点的重要影响因素值;
将所述各采样点的坐标位置与各采样点的土壤重金属污染风险等级和重要影响因素值的一一映射,整合映射后的各采样点数据生成土壤重金属污染风险区划分采样点数据集;
将所述土壤重金属污染风险区划分采样点数据集划分为训练集和测试集,构建基于随机森林算法的土壤重金属污染风险等级预测模型;
计算所述影响土壤重金属时空分布的重要因素间的相关性,结合所述相关性和所述基于随机森林算法的土壤重金属污染风险等级预测模型产生的因素重要性,筛选最优因素,生成最优输入变量集;
优化所述基于随机森林算法的土壤重金属污染风险等级预测模型的重要参数生成最优参数组,将所述最优参数组和所述最优输入变量集输入基于随机森林算法的土壤重金属污染风险等级预测模型,生成优化的土壤重金属污染风险等级预测模型;
提取代表所述待划分风险区域的规则间隔点集,利用所述优化的土壤重金属污染风险等级预测模型计算所述规则间隔点集的风险等级,优化处理由所述规则间隔点集的风险等级数据生成所述待划分区域的土壤重金属污染多级风险区。
2.根据权利要求1所述的一种区域土壤重金属污染风险区划分方法,其特征在于,根据待划分风险区域内各采样点的土壤重金属含量计算各采样点的土壤重金属污染风险等级,包括:
按照土壤重金属污染风险评价方法,根据所述各采样点的土壤重金属含量计算其土壤重金属污染风险值;
根据所述土壤重金属污染风险评价方法的风险等级阈值评估所述各采样点的风险等级。
3.根据权利要求1所述一种区域土壤重金属污染风险区划分方法,其特征在于,所述影响土壤重金属时空分布的重要因素包括自然因素和人为因素,自然因素至少包括海拔、坡度、坡向和土壤类型,人为因素至少包括土地利用类型、与居住区、道路和河流的距离。
4.根据权利要求3所述的一种区域土壤重金属污染风险区划分方法,其特征在于,获取所述待划分风险区域的重要因素的空间连续分布数据的方法,包括:
基于DEM数据提取待划分风险区域的海拔、坡度和坡向数据;
栅格化待划分风险区域的土壤类型和土地利用类型数据;
基于待划分风险区域的土地利用类型数据计算所述各采样点与居住区、道路和河流的距离的数据。
5.根据权利要求1所述的一种区域土壤重金属污染风险区划分方法,其特征在于,提取所述各采样点的重要影响因素值,包括:
将所述各采样点叠加到影响土壤重金属时空分布的重要因素的空间连续分布数据,按照所述各采样点的坐标位置提取所述各采样点的土壤重金属时空分布的重要影响因素值。
6.根据权利要求1所述的一种区域土壤重金属污染风险区划分方法,其特征在于,优化所述基于随机森林算法的土壤重金属污染风险等级预测模型的重要参数生成最优参数组,包括:
按照设定的参数空间建立参数字典,对所述参数字典的重要参数采用循环嵌套、逐一遍历的优化模式,在未优化参数中选择一个作为待优化参数,固定已优化参数值,设定其他未优化参数值;
其中,待优化参数的遍历循环优化过程具体包括:利用参数随机搜索交叉验证的方式训练所述基于随机森林算法的土壤重金属污染风险等级预测模型,以生成的最优参数组为标准更新参数范围,形成优化参数字典;再按照所述优化参数字典,利用参数网格搜索交叉验证的方式训练所述基于随机森林算法的土壤重金属污染风险等级预测模型,生成所述模型的最优参数组;
其中,所述重要参数至少包括:决策树个数、最大特征数和最大深度。
7.根据权利要求1所述的一种区域土壤重金属污染风险区划分方法,其特征在于,提取代表所述待划分风险区域的规则间隔点集,包括:
按照设定距离创建覆盖所述待划分风险区域的规则网格;
提取网格中心点生成代表所述待划分风险区域的规则间隔点集;
计算所述规则间隔点集的坐标位置,提取所述规则间隔点集的土壤重金属时空分布的重要影响因素值。
8.根据权利要求1所述的一种区域土壤重金属污染风险区划分方法,其特征在于,优化处理所述规则间隔点集的风险等级数据生成所述待划分区域的土壤重金属污染多级风险区,包括:
空间连接所述规则间隔点集的风险等级至所述规则格网;
按照所述规则格网各格网单元的风险等级融合相邻格网单元,按照设定规则消除细小格网单元,生成多级风险区划多边形;
按照设定容差平滑所述多级风险区划多边形边界。
9.一种区域土壤重金属污染风险区划分装置,其特征在于,包括:
计算模块,用于根据待划分风险区域内各采样点的土壤重金属含量计算各采样点的土壤重金属污染风险等级;
提取模块,用于获取所述待划分风险区域的重要因素的空间连续分布数据,所述重要因素影响土壤重金属时空分布,再从所述空间连续分布数据中提取所述各采样点的重要影响因素值;
第一生成模块,用于将所述各采样点的坐标位置与各采样点的土壤重金属污染风险等级和重要影响因素值的一一映射,整合映射后的各采样点数据生成土壤重金属污染风险区划分采样点数据集;
训练模块,用于将所述土壤重金属污染风险区划分采样点数据集划分为训练集和测试集,构建基于随机森林算法的土壤重金属污染风险等级预测模型;
第一优化模块,用于计算所述影响土壤重金属时空分布的重要因素间的相关性,结合所述相关性和所述基于随机森林算法的土壤重金属污染风险等级预测模型产生的因素重要性,筛选最优因素,生成最优输入变量集;
第二优化模块,用于优化所述基于随机森林算法的土壤重金属污染风险等级预测模型的重要参数生成最优参数组,将所述最优参数组和所述最优输入变量集输入基于随机森林算法的土壤重金属污染风险等级预测模型,生成优化的土壤重金属污染风险等级预测模型;
第二生成模块,用于提取代表所述待划分风险区域的规则间隔点集,利用所述优化的土壤重金属污染风险等级预测模型计算所述规则间隔点集的风险等级,优化处理由所述规则间隔点集的风险等级数据生成所述待划分区域的土壤重金属污染多级风险区。
10.根据权利要求9所述的装置,其特征在于,所述优化模块还包括:
第一优化单元,用于利用参数随机搜索交叉验证的方式训练所述基于随机森林算法的土壤重金属污染风险等级预测模型,以生成的最优参数组为标准更新参数范围,形成优化参数字典;
第二优化单元,用于按照所述优化参数字典,利用参数网格搜索交叉验证的方式训练所述基于随机森林算法的土壤重金属污染风险等级预测模型,生成所述模型的最优参数组。
11.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1-8中任一项所述的区域土壤重金属污染风险区划分方法。
12.一种计算机可读存储介质,其存储有计算机指令,所述计算机指令被操作以执行权利要求1-8任一项所述的区域土壤重金属污染风险区划分方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210152175.9A CN114511239B (zh) | 2022-02-18 | 2022-02-18 | 土壤重金属污染风险区划分方法、装置、电子设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210152175.9A CN114511239B (zh) | 2022-02-18 | 2022-02-18 | 土壤重金属污染风险区划分方法、装置、电子设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114511239A true CN114511239A (zh) | 2022-05-17 |
CN114511239B CN114511239B (zh) | 2023-04-18 |
Family
ID=81552315
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210152175.9A Active CN114511239B (zh) | 2022-02-18 | 2022-02-18 | 土壤重金属污染风险区划分方法、装置、电子设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114511239B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116227692A (zh) * | 2023-02-06 | 2023-06-06 | 中国科学院生态环境研究中心 | 一种农作物重金属富集风险量化方法、系统及可存储介质 |
CN118469314A (zh) * | 2024-07-15 | 2024-08-09 | 湖南省生态地质调查监测所 | 一种土壤重金属生态风险评估方法及系统 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005013786A (ja) * | 2003-06-23 | 2005-01-20 | Gifu Prefecture | 土壌からの重金属流出量の推定方法及び推定プログラム |
CN102636632A (zh) * | 2012-04-25 | 2012-08-15 | 上海交通大学 | 围垦地土壤重金属污染综合评价图生成方法 |
CN106568923A (zh) * | 2016-11-10 | 2017-04-19 | 北京农业质量标准与检测技术研究中心 | 一种土壤重金属含量影响因子评价方法 |
CN109342697A (zh) * | 2018-12-07 | 2019-02-15 | 福建农林大学 | 基于随机森林—普通克里格法的土壤有机碳含量预测方法 |
CN109492830A (zh) * | 2018-12-17 | 2019-03-19 | 杭州电子科技大学 | 一种基于时空深度学习的移动污染源排放浓度预测方法 |
CN110095587A (zh) * | 2019-05-27 | 2019-08-06 | 生态环境部南京环境科学研究所 | 一种基于高光谱影像的区域生态风险评价方法 |
CN112633733A (zh) * | 2020-12-30 | 2021-04-09 | 武汉轻工大学 | 基于可信度的随机森林土壤重金属风险评价方法及系统 |
-
2022
- 2022-02-18 CN CN202210152175.9A patent/CN114511239B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005013786A (ja) * | 2003-06-23 | 2005-01-20 | Gifu Prefecture | 土壌からの重金属流出量の推定方法及び推定プログラム |
CN102636632A (zh) * | 2012-04-25 | 2012-08-15 | 上海交通大学 | 围垦地土壤重金属污染综合评价图生成方法 |
CN106568923A (zh) * | 2016-11-10 | 2017-04-19 | 北京农业质量标准与检测技术研究中心 | 一种土壤重金属含量影响因子评价方法 |
CN109342697A (zh) * | 2018-12-07 | 2019-02-15 | 福建农林大学 | 基于随机森林—普通克里格法的土壤有机碳含量预测方法 |
CN109492830A (zh) * | 2018-12-17 | 2019-03-19 | 杭州电子科技大学 | 一种基于时空深度学习的移动污染源排放浓度预测方法 |
CN110095587A (zh) * | 2019-05-27 | 2019-08-06 | 生态环境部南京环境科学研究所 | 一种基于高光谱影像的区域生态风险评价方法 |
CN112633733A (zh) * | 2020-12-30 | 2021-04-09 | 武汉轻工大学 | 基于可信度的随机森林土壤重金属风险评价方法及系统 |
Non-Patent Citations (3)
Title |
---|
史广;刘庚;赵龙;苏迎庆;毕如田;: "基于多源环境数据和随机森林模型的农田土壤砷空间分布模拟" * |
彭丽梅;赵理;周悟;胡月明;: "基于层次分析法的耕地土壤重金属污染风险区域划分" * |
曹姗姗;陆安祥;王纪华;: "农田土壤重金属生态风险区划分" * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116227692A (zh) * | 2023-02-06 | 2023-06-06 | 中国科学院生态环境研究中心 | 一种农作物重金属富集风险量化方法、系统及可存储介质 |
CN116227692B (zh) * | 2023-02-06 | 2023-09-26 | 中国科学院生态环境研究中心 | 一种农作物重金属富集风险量化方法、系统及可存储介质 |
CN118469314A (zh) * | 2024-07-15 | 2024-08-09 | 湖南省生态地质调查监测所 | 一种土壤重金属生态风险评估方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN114511239B (zh) | 2023-04-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110263111B (zh) | 基于先验知识的土地利用/覆被信息时空监测方法 | |
Mazzoleni et al. | Can assimilation of crowdsourced data in hydrological modelling improve flood prediction? | |
Sakieh et al. | Simulating urban expansion and scenario prediction using a cellular automata urban growth model, SLEUTH, through a case study of Karaj City, Iran | |
Malczewski | Local weighted linear combination | |
CN114511239B (zh) | 土壤重金属污染风险区划分方法、装置、电子设备及介质 | |
Dietzel et al. | Spatial differences in multi‐resolution urban automata modeling | |
Panagos et al. | Estimating the soil organic carbon content for European NUTS2 regions based on LUCAS data collection | |
CN109146204A (zh) | 一种多层次综合评估的风电场升压站自动选址方法 | |
CN103345566B (zh) | 基于地质内涵的化探异常识别与评价方法 | |
CN114443982A (zh) | 一种大区域土壤重金属检测与时空分布特征分析方法及系统 | |
CN106651036A (zh) | 空气质量预报系统 | |
CN113902580B (zh) | 一种基于随机森林模型的历史耕地分布重建方法 | |
Ahmed | Modelling spatio-temporal urban land cover growth dynamics using remote sensing and GIS techniques: A case study of Khulna City | |
CN104050323A (zh) | 一种高海拔山区模糊多准则风电场选址方法 | |
Stryhal et al. | Classifications of winter atmospheric circulation patterns: validation of CMIP5 GCMs over Europe and the North Atlantic | |
CN104732279A (zh) | 基于地理信息系统的改进元胞自动机交通流模拟分析方法 | |
Schleier et al. | Robust landslide susceptibility analysis by combination of frequency ratio, heuristic GIS-methods and ground truth evaluation for a mountainous study area with poor data availability in the Three Gorges Reservoir area, PR China | |
CN112131731A (zh) | 一种基于空间特征向量滤波的城市生长元胞模拟方法 | |
CN114398951A (zh) | 一种基于随机森林和众源地理信息的土地利用变化驱动因子挖掘方法 | |
CN110019167B (zh) | 一种中长期新能源资源资料库构建方法及系统 | |
Fenech et al. | Selecting a global climate model for understanding future projections of climate change | |
CN113240219A (zh) | 一种土地利用模拟及预测方法 | |
Jayasinghe et al. | Comparative Evaluation of Open Source Urban Simulation Models Applied to Colombo City and Environs in Sri Lanka. | |
Erlacher et al. | A GPU-based parallelization approach to conduct spatially-explicit uncertainty and sensitivity analysis in the application domain of landscape assessment | |
CN115906669A (zh) | 一种顾及负样本选取策略的密集残差网络滑坡易发性评价方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |