CN107909192A - 土壤重金属含量的估测方法及装置 - Google Patents

土壤重金属含量的估测方法及装置 Download PDF

Info

Publication number
CN107909192A
CN107909192A CN201711057459.5A CN201711057459A CN107909192A CN 107909192 A CN107909192 A CN 107909192A CN 201711057459 A CN201711057459 A CN 201711057459A CN 107909192 A CN107909192 A CN 107909192A
Authority
CN
China
Prior art keywords
soil
heavy metal
estimated value
metal content
measured
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201711057459.5A
Other languages
English (en)
Other versions
CN107909192B (zh
Inventor
陆安祥
曹姗姗
王纪华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Academy of Agriculture and Forestry Sciences
Original Assignee
BEIJING AGRICULTURAL QUALITY STANDARDS AND TESTING TECHNOLOGY RESEARCH CENTER
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING AGRICULTURAL QUALITY STANDARDS AND TESTING TECHNOLOGY RESEARCH CENTER filed Critical BEIJING AGRICULTURAL QUALITY STANDARDS AND TESTING TECHNOLOGY RESEARCH CENTER
Priority to CN201711057459.5A priority Critical patent/CN107909192B/zh
Publication of CN107909192A publication Critical patent/CN107909192A/zh
Application granted granted Critical
Publication of CN107909192B publication Critical patent/CN107909192B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • Theoretical Computer Science (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Educational Administration (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Geophysics And Detection Of Objects (AREA)
  • Investigation Of Foundation Soil And Reinforcement Of Foundation Soil By Compacting Or Drainage (AREA)

Abstract

本发明提供了一种土壤重金属含量的估测方法及装置,所述估测方法通过引入土壤重金属含量的影响因子值,并且不对各影响因子之间的相关性做具体限定,利用待测位置上的残差值对通过训练好的随机森林模型得到的估测值进行优化,最后得到待测位置处的土壤重金属含量的目标估测值。本发明提供的土壤重金属含量的估测方法,无需考虑土壤重金属含量的分布、异常值,以及引入的影响因子间的多重相关性,能够避免随机森林模型过拟合现象,有效提高了土壤重金属含量的估测精度。为农产品产地安全等级边界确认、土壤污染风险评价和土壤修复等工作奠定基础,具有重要的理论、实际意义和推广应用价值。

Description

土壤重金属含量的估测方法及装置
技术领域
本发明涉及环境污染评价领域,更具体地,涉及土壤重金属含量的估测方法及装置。
背景技术
我国农产品产地的重金属污染问题日益凸显,土壤重金属富集严重威胁了生态系统和人类的安全。利用高精度插值方法计算土壤重金属含量是全面准确了解土壤重金属空间分布、保障农产品产地质量安全的重要基础性工作之一。
土壤重金属含量的空间插值研究主要是通过采样数据的统计分析和建模实现,目前常用的分析和建模方法分为非地统计分析方法和地统计分析方法两大类。非地统计分析方法没有考虑到土壤重金属元素之间的空间相关性,往往不能有效解释土壤的空间变异性(土壤的空间变异性是指土壤属性在空间分布的非均一性,即为土壤属性的空间变异性)。地统计分析方法是指在结构分析的基础上采用各种克里格插值方法估计并解决实际问题,克里格插值方法可包括:普通克里格法、泛克里格法、协同克里格法、对数正态克里格法、指示克里格法和折取克里格法等等;其中,普通克里格法还包括:对点估计的点克里格法和对块估计的块克里格法。
现已证明克里格插值方法是分析土壤重金属含量特征及其变异规律最为有效的方法之一。然而,由于克里格插值方法要求采样数据为二阶平稳,且对采样数据进行平滑处理后会使某些变化剧烈区域的重要信息丢失,不利于准确确定土壤重金属的含量。因此,引入相关地表环境因子作为辅助因子的协同克里格法和回归克里格法在土壤重金属含量的估测研究中被广泛采用,其估测精度相比于仅基于样点数据进行空间内插的方法有明显的提高。然而,协同克里格法要求辅助因子之间具有高度相关性且辅助因子需要更大的采样密度,这种条件十分苛刻,当不满足此条件时便无法准确确定土壤重金属的含量。
发明内容
为克服上述问题或者至少部分地解决上述问题,本发明提供了土壤重金属含量的估测方法及装置。
一方面,本发明提供了一种土壤重金属含量的估测方法,包括:
S1,获取目标区域内待测位置处土壤重金属含量的影响因子值;
S2,基于训练后的随机森林模型,根据所述影响因子值计算所述待测位置处土壤重金属含量的估测值,并获取所述待测位置处对应的估测值的残差值;
S3,根据所述待测位置处对应的估测值和残差值,确定所述待测位置处土壤重金属含量的目标估测值。
优选地,S1前还包括:
S11,确定所述待测位置处土壤重金属含量的辅助因子;
S12,判断所述辅助因子与土壤重金属含量的相关性,将与土壤重金属含量存在相关性的辅助因子作为所述土壤重金属含量的影响因子。
优选地,S2中训练后的随机森林模型具体通过如下方法得到:
S211,获取所述目标区域内多个第一预设位置处土壤重金属含量的检测值和影响因子值;
S212,基于随机森林模型,建立自变量和因变量之间的关系,所述自变量为每一第一预设位置处对应的影响因子值,所述因变量为每一第一预设位置处对应的检测值;
S213,对所述自变量和所述因变量之间的关系进行拟合,得到训练后的随机森林模型。
优选地,S2中获取所述待测位置处对应的估测值的残差值,具体包括:
S221,获取所述目标区域内多个第二预设位置处土壤重金属含量的检测值和影响因子值;
S222,对于所述多个第二预设位置中的任一第二预设位置,基于训练好的随机森林模型,根据所述任一第二预设位置处对应的影响因子值,计算所述任一第二预设位置处土壤重金属含量的估测值;
S223,将所述任一第二预设位置处对应的检测值和估测值相减,得到所述任一第二预设位置处对应的估测值的残差值;
S224,对所述多个第二预设位置处对应的估测值的残差值进行空间插值计算,得到所述目标区域内任一位置处对应的估测值的残差值;
S225,根据所述目标区域内任一位置处对应的估测值的残差值,确定所述待测位置处对应的估测值的残差值。
优选地,S224前还包括:
对所述多个第二预设位置处对应的残差值进行正态分布检验;
若判断获知所述多个第二预设位置处对应的估测值的残差值为非正态分布,利用对数变换、Box-Cox变换或Johnson变换对所述多个第二预设位置处对应的估测值的残差值进行正态变换。
优选地,S224具体包括:
利用克里格法对满足正态分布的所述多个第二预设位置处对应的估测值的残差值进行空间插值计算,并将进行空间插值计算得到的结果进行正态变换的逆变换,得到所述目标区域内任一位置处对应的估测值的残差值。
优选地,S224具体包括:
若进行正态变换后的所述多个第二预设位置处对应的估测值的残差值仍为非正态分布,利用反距离权重法对多个第二预设位置处对应的估测值的残差值进行空间插值计算,并将进行空间插值计算得到的结果进行正态变换的逆变换,得到所述目标区域内每一位置处对应的估测值的残差值。
优选地,所述获取所述目标区域内多个第一预设位置处土壤重金属含量的估测值,具体包括:
对于任一第一预设位置,以所述任一第一预设位置为预设正方形的中心,分别获取所述预设正方形的四个顶点位置的待测土样;
将四份待测土样进行混合,检测混合后的待测土样中的土壤重金属含量,作为所述任一预设位置处土壤重金属含量的检测值。
优选地,S3具体包括:
利用如下公式确定所述待测位置处土壤重金属含量的目标估测值:
zj=mj+e'j
其中,zj为所述目标区域内待测位置j处土壤重金属含量的目标估测值,mj为待测位置j处对应的估测值,e'j为待测位置j处对应的估测值的残差值。
另一方面,本发明提供了一种土壤重金属含量的估测装置,包括:影响因子值获取模块、残差值获取模块和目标估测值确定模块。其中,
所述影响因子值获取模块用于获取目标区域内待测位置处土壤重金属含量的影响因子值;
所述残差值获取模块用于基于训练后的随机森林模型,根据所述影响因子值计算所述待测位置处土壤重金属含量的估测值,并获取所述待测位置处对应的估测值的残差值;
所述目标估测值确定模块用于根据所述待测位置处对应的估测值和残差值,确定所述待测位置处土壤重金属含量的目标估测值。
本发明提供的土壤重金属含量的估测方法及装置,通过引入土壤重金属含量的影响因子,并且不对各影响因子之间的相关性做具体限定,利用待测位置上的残差值对通过训练好的随机森林模型得到的估测值进行优化,最后得到待测位置处土壤重金属含量的目标估测值,完成估测。本发明提供的土壤重金属含量的估测方法,无需考虑土壤重金属含量的分布、异常值,以及引入的影响因子间的多重相关性,能够避免随机森林模型过拟合现象,有效提高了土壤重金属含量的估测精度。为农产品产地安全等级边界确认、土壤污染风险评价和土壤修复等工作奠定基础,具有重要的理论、实际意义和推广应用价值。
附图说明
图1为本发明一实施例提供的一种土壤重金属含量的估测方法流程示意图;
图2为图1中获取待测位置处土壤重金属含量的影响因子的方法流程示意图;
图3为图1中获取训练好的随机森林模型的方法流程示意图;
图4为图1中获取所述待测位置处的残差值的方法流程示意图;
图5为本发明另一实施例提供的一种土壤重金属含量的估测装置结构示意图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
如图1所示,本发明一实施例提供了一种土壤重金属含量的估测方法,包括:
S1,获取目标区域内待测位置处土壤重金属含量的影响因子值;
S2,基于训练后的随机森林模型,根据所述影响因子值计算所述待测位置处土壤重金属含量的估测值,并获取所述待测位置处对应的估测值的残差值;
S3,根据所述待测位置处对应的估测值和残差值,确定所述待测位置处土壤重金属含量的目标估测值。
具体地,为了更方便快速的得到待测位置处土壤重金属含量,通常选取一个研究区域,即目标区域。本发明提供的土壤重金属含量的估测方法,对目标区域内任一待测位置处土壤重金属含量均可以进行估测,这种方法可以不用对待测位置处土壤重金属含量进行实地估测,而是考虑到土壤重金属含量的影响因子,估测出土壤重金属含量。这里的土壤重金属含量的影响因子是指与土壤重金属含量存在相关性的因素,如:地形因子和土壤类型等。其中,地形因子可包括:高程、坡度、坡向、地表曲率、地表剖面曲率、地表平面曲率、坡长坡度因子、水流动力指数及地形湿度指数等。土壤类型可分为砂质土、黏质土和壤土这三大类型,还可根据土壤的不同性质分为不同的其他类型。
如图2所示,土壤重金属含量的影响因子是通过获取到的土壤重金属含量的辅助因子得到的,具体为:S11,获取所述待测位置处影响所述土壤重金属含量的辅助因子;
S12,判断所述辅助因子与土壤重金属含量的相关性,将与土壤重金属含量存在相关性的辅助因子作为所述土壤重金属含量的影响因子。
具体地,这里的辅助因子可包括所有可能与土壤重金属含量存在相关性的因素,例如,辅助因子可分为定量因子和定性因子两类,定量因子可包含待测位置的地理坐标、与居住区的距离以及地形因子等。定性因子可包括土壤类型和土地利用类型等,这些辅助因子都是很容易就可以得到的。其中,地理坐标通常指待测位置所在的经度和纬度;地形因子可包括高程、坡度、坡向、地表曲率、地表剖面曲率、地表平面曲率、坡度坡长因子、水流动力指数及地形湿度指数等。需要注意的是,土壤重金属含量的影响因子是通过判断辅助因子与土壤重金属含量之间是否存在相关性得到的,即土壤重金属含量的影响因子可以是辅助因子中的一部分,也可以是辅助因子中的全部因素,与具体的目标区域有关。
其中,待测位置的地理坐标可通过GPS定位获取;待测位置处的地形因子可利用ArcGIS中的空间分析和栅格计算功能获取;待测位置处的土壤类型和土地利用类型可通过扫描目标区域的土壤类型图和土地利用图,利用ArcGIS进行数字化处理得到;待测位置与居住区的距离可通过经纬度和居住区矢量数据,通过ArcGIS的空间分析功能获取。这里,ArcGIS是一款地理信息系统(Geographic Information System,GIS)软件,具有地图制作、空间数据管理、空间分析和空间信息整合等能力。
由于辅助因子中包括了定量因素和定性因素,在S12中判断辅助因子与土壤重金属含量的相关性时,需要利用不同的分析方法。对于可以用具体数值表示的定量因子可以用方差分析方法进行判断,对于不能用具体数值表示的定性因子则可以用相关分析方法进行判断。最后,将与土壤重金属含量存在相关性的所述辅助因子作为所述土壤重金属含量的影响因子。
S1中,得到的待测位置处土壤重金属含量的影响因子值,对于可以用具体数值表示的定量因子,则直接是待测位置处对应的影响因子值;对于不能用具体数值表示的定性因子,则可以用预先设定的标记对不能用具体数值表示的影响因子进行标记,例如对每种土壤类型分别用顺序的自然数进行标记。
S2中,训练后的随机森林模型表示的是目标区域内任一位置处土壤重金属含量的估测值与该位置处的影响因子之间的对应关系,即将待测位置处的影响因子作为输入值输入至训练后的随机森林模型中,可得到待测位置处土壤重金属含量的估测值。
由于在随机森林模型中引入了影响因子,则可能会使得到的训练好的随机森林模型不能很好的估测土壤重金属含量,会使得到的某一位置处对应的估测值与该位置处实际的土壤重金属含量偏差较大,此时,需要获取待测位置处对应的估测值的残差值,这个残差值为通过所述训练好的随机森林模型得到的所述待测位置处对应的估测值的误差值。
根据所述待测位置处对应的估测值和所述待测位置处对应的估测值的残差值,即可得到所述待测位置处土壤重金属含量的目标估测值,具体得到待测位置处土壤重金属含量的目标估测值的方法可以利用ArcGIS的栅格计算功能实现,通过如下公式计算土壤重金属含量的目标估测值。也可直接通过如下公式计算土壤重金属含量的目标估测值。
zj=mj+e'j
其中,zj为所述目标区域内待测位置j处土壤重金属含量的目标估测值,mj为待测位置j处土壤重金属含量的估测值,e'j为待测位置j处对应的估测值的残差值。需要注意的是,这里的残差值e'j可为正值也可为负值。
本实施例中,通过引入土壤重金属含量的影响因子值,并且不对各影响因子之间的相关性做具体限定,利用待测位置处对应的估测值的残差值对通过训练后的随机森林模型得到的估测值进行优化,最后得到待测位置处土壤重金属含量的目标估测值,完成估测。本发明提供的土壤重金属含量的估测方法,无需考虑土壤重金属含量的分布、异常值,以及引入的影响因子间的多重相关性,能够避免随机森林模型过拟合现象,有效提高了土壤重金属含量的估测精度。为农产品产地安全等级边界确认、土壤污染风险评价和土壤修复等工作奠定基础,具有重要的理论、实际意义和推广应用价值。
如图3所示,在上述实施例的基础上,S2中训练后的随机森林模型具体通过如下方法得到:
S211,获取所述目标区域内多个第一预设位置处土壤重金属含量的检测值和影响因子值;
S212,基于随机森林模型,建立自变量和因变量之间的关系,所述自变量为每一第一预设位置处对应的影响因子值,所述因变量为每一第一预设位置处对应的检测值;
S213,对所述自变量和所述因变量之间的关系进行拟合,得到训练后的随机森林模型。
具体地,首先在目标区域内选取多个第一预设位置,这里的多个指的是至少一个,第一预设位置的个数通常与目标区域的大小有关,目标区域越大,则选取的第一预设位置越多,目标区域越小,则选取的第一预设位置越少。但同时需要考虑的是,由选取多个第一预设位置的目的是为了对随机森林模型进行训练,多个第一预设位置处的数据实际上组成了训练样本集。训练样本集中的数据越多,则训练好的随机森林模型的准确性越高。
利用获取到的多个第一预设位置处土壤重金属含量检测值和所述多个第一预设位置处土壤重金属含量的影响因子值对随机森林模型进行训练,训练的过程也就是建立自变量和因变量之间的关系的过程。这里所说的自变量为多个第一预设位置处土壤重金属含量的影响因子值,所说的因变量为多个第一预设位置处土壤重金属含量的检测值。
由于每一对自变量和因变量之间并不一定具有规律的关系,所以需要对自变量和因变量之间的关系进行拟合,使每一对自变量和因变量都可以通过规律的关系来表示,此时即得到了训练好的随机森林模型。
需要注意的是,在选取多个第一预设位置时,多个第一预设位置应该是均匀布设目标区域内。需要综合考虑目标区域内多个第一预设位置的地形因素、与居住区的距离、土壤类型和土地利用类型等信息,在兼顾代表性与均匀性原则的基础上采用格网布点法均匀布设多个第一预设位置。
在上述实施例的基础上,所述获取所述目标区域内多个第一预设位置处土壤重金属含量的检测值,具体包括:
对于任一第一预设位置,以所述任一第一预设位置为预设正方形的中心,分别获取所述预设正方形的四个顶点位置的待测土样;
将四份待测土样进行混合,检测混合后的待测土样中的土壤重金属含量,作为所述任一预设位置处土壤重金属含量的检测值。
具体地,例如,应用GPS精确定位每一个第一预设位置,以每一个第一预设位置为采样点,设有N个第一预设位置,则可以得到N个采样点。本发明中采用多点混合的方式采集任一采样点i处的土壤重金属含量的检测值。对于任一采样点i,以采样点i为中心的预设正方形,设预设正方形的边长为5m,分别获取预设正方形的4个顶点处的待测土样,待测土样选取距地表0~20cm的表层土,具体可分别获取1kg的待测土样。将获取到的4个顶点处的待测土样进行充分混合,利用四分法取样,取1kg的待测土样作为采样点i的待测土样。其中,四分法取样又称圆锥四分法,是指将充分混合后的待测土样堆成均匀的圆锥形,并压成圆台,最后用手或十字形架将充分混合后的待测土样分成四等份,本实施例中随机在四等份中选取一份进行检测土壤重金属含量,得到土壤重金属含量检测值,具体的检测方法则可按照国家标准方法进行检测,本发明对检测土壤重金属含量的检测方法在此不作具体限定。
本实施例为土壤采样布点方案的科学设计提供指导。
如图4所示,在上述实施例的基础上,S2中获取所述待测位置处对应的估测值的残差值,具体包括:
S221,获取所述目标区域内多个第二预设位置处土壤重金属含量的检测值和影响因子值;
S222,对于所述多个第二预设位置中的任一第二预设位置,基于训练好的随机森林模型,根据所述任一第二预设位置处对应的影响因子值,计算所述任一第二预设位置处土壤重金属含量的估测值;
S223,将所述任一第二预设位置处对应的检测值和估测值相减,得到所述任一第二预设位置处对应的估测值的残差值;
S224,对所述多个第二预设位置处对应的估测值的残差值进行空间插值计算,得到所述目标区域内任一位置处对应的估测值的残差值;
S225,根据所述目标区域内任一位置处对应的估测值的残差值,确定所述待测位置处对应的估测值的残差值。
具体地,由于待测位置处对应的估测值的残差值是指通过训练好的随机森林模型得到的待测位置处的估测值的误差值。对于目标区域的任一位置来说,计算得到任一位置处对应的估测值的残差值是不可能的,所以此时获取到的所述待测位置处对应的估测值的残差值实际上是经过估测得到的残差值。估测的方法是通过对多个第二预设位置处的残差值进行空间插值计算,得到连续的残差值,即目标区域内每一位置处对应的估测值的残差值都可以得到。
这里需要说明的是,多个第二预设位置和上述实施例中的多个第一预设位置可以完全相同,也可以完全不同,第一预设位置的个数与第二预设位置的个数可相同也可不相同,二者是相互独立的。同样需要注意的是,在选取多个第二预设位置时,多个第二预设位置应该是均匀布设目标区域内。需要综合考虑目标区域内多个第二预设位置的地形因素、与居住区的距离、土壤类型和土地利用类型等信息,在兼顾代表性与均匀性原则的基础上采用格网布点法均匀布设多个第二预设位置。作为优选方式,可将上述实施例中的多个第一预设位置作为本实施例中的多个第二预设位置。可以减少整个估测方法的取样量,充分利用采样信息,在不增加采样和监测成本的前提下,为目标区域内土壤重金属含量的高精度估测提供参考。
在上述实施例的基础上,S224前还包括:
对所述多个第二预设位置处的残差值进行正态分布检验;
若判断获知所述多个第二预设位置处对应的估测值的残差值为非正态分布,利用对数变换、Box-Cox变换或Johnson变换对所述多个第二预设位置处对应的估测值的残差值进行正态变换。
具体地,由S223得到的多个第二预设位置处的残差值并不一定是正态分布,而对于多个第二预设位置处的残差值是否为正态分布,有不同的处理方式。所以要先对多个第二预设位置处的残差值进行正态分布检验。若判断获知多个第二预设位置处的残差值为正态分布,则可直接利用克里格法对多个第二预设位置处的残差值进行空间插值计算。若判断获知多个第二预设位置处的残差值为非正态分布,则不能直接利用克里格法进行空间插值计算,需要将非正态分布的多个第二预设位置处的残差值进行正态变换,使处于非正态分布的多个第二预设位置处的残差值为正态分布,则此时即可直接利用克里格法进行空间插值计算。进行正态变换的方法可以有对数变换、Box-Cox变换或Johnson变换等。
由于残差值进行正态变换后不再是残差值,所以需要对进行空间插值计算得到的结果进行正态变换的逆变换,即可得到目标区域内任一位置处对应的估测值的残差值。
在对所述多个第二预设位置处的残差值进行正态分布检验前还包括对多个残差值的分布特征进行探索,分析各残差值的空间自相关性和各向异性。
在利用克里格法进行空间插值计算时,基于球状模型、指数模型或高斯模型等主要变异函数理论模型,拟合变异函数模型,并进行块金值、基台值和变程等参数优化设置,得到连续的残差值。
在上述实施例的基础上,S224具体包括:
若进行正态变换后的所述多个第二预设位置处对应的估测值的残差值仍为非正态分布,利用反距离权重法对多个第二预设位置处对应的估测值的残差值进行空间插值计算,并将进行空间插值计算得到的结果进行正态变换的逆变换,得到所述目标区域内每一位置处对应的估测值的残差值。
如图5所示,本发明的另一实施例提供了一种土壤重金属含量的估测装置,包括:影响因子值获取模块51、残差值获取模块52和目标估测值确定模块53;其中,
所述影响因子值获取模块51用于获取目标区域内待测位置处土壤重金属含量的影响因子值;
所述残差值获取模块52用于基于训练后的随机森林模型,根据所述影响因子值计算所述待测位置处土壤重金属含量的估测值,并获取所述待测位置处对应的估测值的残差值;
所述目标估测值确定模块53用于根据所述待测位置处对应的估测值和残差值,确定所述待测位置处土壤重金属含量的目标估测值。
具体地,本实施例中各模块的作用及相应的操作流程和方法与上述方法类实施例是一一对应的,在此不再赘述。
本实施例中,通过影响因子值获取模块引入土壤重金属含量的影响因子值,并且不对各影响因子之间的相关性做具体限定,残差值获取模块利用待测位置上的残差值对通过训练好的随机森林模型得到的估测值进行优化,最后由估测值确定模块得到待测位置处的土壤重金属含量的目标估测值,完成估测。本发明提供的土壤重金属含量的估测装置,无需考虑土壤重金属含量的分布、异常值,以及引入的影响因子间的多重相关性,能够避免随机森林模型过拟合现象,有效提高了土壤重金属含量的估测精度。为农产品产地安全等级边界确认、土壤污染风险评价和土壤修复等工作奠定基础,具有重要的理论、实际意义和推广应用价值。
最后,本发明的方法仅为较佳的实施方案,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种土壤重金属含量的估测方法,其特征在于,包括:
S1,获取目标区域内待测位置处土壤重金属含量的影响因子值;
S2,基于训练后的随机森林模型,根据所述影响因子值计算所述待测位置处土壤重金属含量的估测值,并获取所述待测位置处对应的估测值的残差值;
S3,根据所述待测位置处对应的估测值和残差值,确定所述待测位置处土壤重金属含量的目标估测值。
2.根据权利要求1所述的估测方法,其特征在于,S1前还包括:
S11,确定所述待测位置处土壤重金属含量的辅助因子;
S12,判断所述辅助因子与土壤重金属含量的相关性,将与土壤重金属含量存在相关性的辅助因子作为所述土壤重金属含量的影响因子。
3.根据权利要求1所述的估测方法,其特征在于,S2中训练后的随机森林模型具体通过如下方法得到:
S211,获取所述目标区域内多个第一预设位置处土壤重金属含量的检测值和影响因子值;
S212,基于随机森林模型,建立自变量和因变量之间的关系,所述自变量为每一第一预设位置处对应的影响因子值,所述因变量为每一第一预设位置处对应的检测值;
S213,对所述自变量和所述因变量之间的关系进行拟合,得到训练后的随机森林模型。
4.根据权利要求3所述的估测方法,其特征在于,S2中获取所述待测位置处对应的估测值的残差值,具体包括:
S221,获取所述目标区域内多个第二预设位置处土壤重金属含量的检测值和影响因子值;
S222,对于所述多个第二预设位置中的任一第二预设位置,基于训练好的随机森林模型,根据所述任一第二预设位置处对应的影响因子值,计算所述任一第二预设位置处土壤重金属含量的估测值;
S223,将所述任一第二预设位置处对应的检测值和估测值相减,得到所述任一第二预设位置处对应的估测值的残差值;
S224,对所述多个第二预设位置处对应的估测值的残差值进行空间插值计算,得到所述目标区域内任一位置处对应的估测值的残差值;
S225,根据所述目标区域内任一位置处对应的估测值的残差值,确定所述待测位置处对应的估测值的残差值。
5.根据权利要求4所述的估测方法,其特征在于,S224前还包括:
对所述多个第二预设位置处对应的残差值进行正态分布检验;
若判断获知所述多个第二预设位置处对应的估测值的残差值为非正态分布,利用对数变换、Box-Cox变换或Johnson变换对所述多个第二预设位置处对应的估测值的残差值进行正态变换。
6.根据权利要求5所述的估测方法,其特征在于,S224具体包括:
利用克里格法对满足正态分布的所述多个第二预设位置处对应的估测值的残差值进行空间插值计算,并将进行空间插值计算得到的结果进行正态变换的逆变换,得到所述目标区域内任一位置处对应的估测值的残差值。
7.根据权利要求5所述的估测方法,其特征在于,S224具体包括:
若进行正态变换后的所述多个第二预设位置处对应的估测值的残差值仍为非正态分布,利用反距离权重法对多个第二预设位置处对应的估测值的残差值进行空间插值计算,并将进行空间插值计算得到的结果进行正态变换的逆变换,得到所述目标区域内每一位置处对应的估测值的残差值。
8.根据权利要求3-7中任一项所述的估测方法,其特征在于,所述获取所述目标区域内多个第一预设位置处土壤重金属含量的检测值,具体包括:
对于任一第一预设位置,以所述任一第一预设位置为预设正方形的中心,分别获取所述预设正方形的四个顶点位置的待测土样;
将四份待测土样进行混合,检测混合后的待测土样中的土壤重金属含量,作为所述任一预设位置处土壤重金属含量的检测值。
9.根据权利要求1所述的估测方法,其特征在于,S3具体包括:
利用如下公式确定所述待测位置处土壤重金属含量的目标估测值:
zj=mj+e′j
其中,zj为所述目标区域内待测位置j处土壤重金属含量的目标估测值,mj为待测位置j处对应的估测值,e′j为待测位置j处对应的估测值的残差值。
10.一种土壤重金属含量的估测装置,其特征在于,包括:影响因子值获取模块、残差值获取模块和目标估测值确定模块;其中,
所述影响因子值获取模块用于获取目标区域内待测位置处土壤重金属含量的影响因子值;
所述残差值获取模块用于基于训练后的随机森林模型,根据所述影响因子值计算所述待测位置处土壤重金属含量的估测值,并获取所述待测位置处对应的估测值的残差值;
所述目标估测值确定模块用于根据所述待测位置处对应的估测值和残差值,确定所述待测位置处土壤重金属含量的目标估测值。
CN201711057459.5A 2017-11-01 2017-11-01 土壤重金属含量的估测方法及装置 Active CN107909192B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711057459.5A CN107909192B (zh) 2017-11-01 2017-11-01 土壤重金属含量的估测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711057459.5A CN107909192B (zh) 2017-11-01 2017-11-01 土壤重金属含量的估测方法及装置

Publications (2)

Publication Number Publication Date
CN107909192A true CN107909192A (zh) 2018-04-13
CN107909192B CN107909192B (zh) 2021-03-19

Family

ID=61842495

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711057459.5A Active CN107909192B (zh) 2017-11-01 2017-11-01 土壤重金属含量的估测方法及装置

Country Status (1)

Country Link
CN (1) CN107909192B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108647826A (zh) * 2018-05-11 2018-10-12 广东省生态环境技术研究所 一种土壤重金属环境风险预测模型的构建方法和装置
CN109085282A (zh) * 2018-06-22 2018-12-25 东南大学 一种基于小波变换和随机森林模型的色谱重叠峰解析方法
CN109242203A (zh) * 2018-09-30 2019-01-18 中冶华天南京工程技术有限公司 一种河流水质预测及水质影响因素评估方法
CN111505241A (zh) * 2020-04-26 2020-08-07 深圳市宇驰检测技术股份有限公司 企业周边土壤污染等级评定方法、装置、设备及介质
CN114019139A (zh) * 2021-10-26 2022-02-08 复旦大学 一种农用地土壤重金属异常数据的探测方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101718775A (zh) * 2009-11-12 2010-06-02 上海交通大学 围垦地土壤中重金属含量的空间变异分布图生成方法
CN106706691A (zh) * 2017-01-06 2017-05-24 中冶华天工程技术有限公司 便携式x射线荧光光谱法重金属检测种类判断方法
CN106779061A (zh) * 2016-11-11 2017-05-31 四川农业大学 一种地形平缓区土壤重金属镉空间分布预测方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101718775A (zh) * 2009-11-12 2010-06-02 上海交通大学 围垦地土壤中重金属含量的空间变异分布图生成方法
CN106779061A (zh) * 2016-11-11 2017-05-31 四川农业大学 一种地形平缓区土壤重金属镉空间分布预测方法
CN106706691A (zh) * 2017-01-06 2017-05-24 中冶华天工程技术有限公司 便携式x射线荧光光谱法重金属检测种类判断方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
谢双扬: "九龙坡区土壤重金属空间分布特征及其影响因素研究", 《中国优秀硕士学位论文全文数据库 农业科技辑》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108647826A (zh) * 2018-05-11 2018-10-12 广东省生态环境技术研究所 一种土壤重金属环境风险预测模型的构建方法和装置
CN108647826B (zh) * 2018-05-11 2021-03-30 广东省科学院生态环境与土壤研究所 一种土壤重金属环境风险预测模型的构建方法和装置
CN109085282A (zh) * 2018-06-22 2018-12-25 东南大学 一种基于小波变换和随机森林模型的色谱重叠峰解析方法
CN109242203A (zh) * 2018-09-30 2019-01-18 中冶华天南京工程技术有限公司 一种河流水质预测及水质影响因素评估方法
CN111505241A (zh) * 2020-04-26 2020-08-07 深圳市宇驰检测技术股份有限公司 企业周边土壤污染等级评定方法、装置、设备及介质
CN114019139A (zh) * 2021-10-26 2022-02-08 复旦大学 一种农用地土壤重金属异常数据的探测方法
CN114019139B (zh) * 2021-10-26 2024-03-26 复旦大学 一种农用地土壤重金属异常数据的探测方法

Also Published As

Publication number Publication date
CN107909192B (zh) 2021-03-19

Similar Documents

Publication Publication Date Title
CN107909192A (zh) 土壤重金属含量的估测方法及装置
Odeh et al. Elucidation of soil-landform interrelationships by canonical ordination analysis
Ariza-Villaverde et al. Multifractal analysis applied to the study of the accuracy of DEM-based stream derivation
Pakoksung et al. Digital elevation models on accuracy validation and bias correction in vertical
Scudiero et al. Simplifying field-scale assessment of spatiotemporal changes of soil salinity
CN104019813A (zh) 目标即时定位和构建地图的方法与系统
ZA200403210B (en) Soil and topography surveying.
Kumar Estimating spatial distribution of soil organic carbon for the Midwestern United States using historical database
CN104778369A (zh) 一种基于地面沉降监测的决策与预警方法及其系统
Cândido et al. High-resolution monitoring of diffuse (sheet or interrill) erosion using structure-from-motion
CN106996969A (zh) 一种土壤重金属空间分布预测方法及系统
CN105046046B (zh) 一种集合卡尔曼滤波局地化方法
CN108427741A (zh) 一种基于大量高精度控制点的dem相对误差评价方法
CN104062644A (zh) 一种从激光雷达高斯回波数据中提取树高的方法
CN106772639A (zh) 地下铁质管线埋深磁偶极子构造法优化反演
Liu et al. Investigating DEM error patterns by directional variograms and Fourier analysis
Wing et al. Vertical measurement accuracy and reliability of mapping-grade GPS receivers
Verbovšek et al. Morphometric properties of dolines in Matarsko podolje, SW Slovenia
Xia et al. Detecting changes of soil environmental parameters by statistics and GIS: A case from the lower Changjiang plain, China
Pardo-Pascual et al. New methods and tools to analyze beach-dune system evolution using a Real-Time Kinematic Global Positioning System and Geographic Information Systems
CN101266153B (zh) 测绘工程类陀螺全站仪精度评定方法
Devlin HydrogeoEstimatorXL: an Excel-based tool for estimating hydraulic gradient magnitude and direction
CN106358209A (zh) 基于德洛内四面体的无线传感器网络表面覆盖方法
AU2021102432A4 (en) Estimation method and apparatus for heavy metal content of soil
Fazilova et al. Deformation analysis based on GNSS measurements in Tashkent region

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20220812

Address after: 100097 No. 9 middle garden, Shuguang garden, Beijing, Haidian District

Patentee after: BEIJING ACADEMY OF AGRICULTURE AND FORESTRY SCIENCES

Address before: 1005, experimental building, Beijing Academy of agriculture and Forestry Sciences, 9 Shuguang Huayuan Middle Road, Haidian District, Beijing 100097

Patentee before: BEIJING RESEARCH CENTER FOR AGRICULTURAL STANDARDS AND TESTING