CN108549620B - 一种土壤重金属生物有效性的估计方法、系统和装置 - Google Patents

一种土壤重金属生物有效性的估计方法、系统和装置 Download PDF

Info

Publication number
CN108549620B
CN108549620B CN201810186313.9A CN201810186313A CN108549620B CN 108549620 B CN108549620 B CN 108549620B CN 201810186313 A CN201810186313 A CN 201810186313A CN 108549620 B CN108549620 B CN 108549620B
Authority
CN
China
Prior art keywords
soil
heavy metal
geochemical
random forest
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810186313.9A
Other languages
English (en)
Other versions
CN108549620A (zh
Inventor
王�琦
李芳柏
刘建锋
于焕云
孙蔚旻
郝冬梅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Eco Environmental and Soil Sciences of Guangdong Academy of Sciens
Original Assignee
Institute of Eco Environmental and Soil Sciences of Guangdong Academy of Sciens
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Eco Environmental and Soil Sciences of Guangdong Academy of Sciens filed Critical Institute of Eco Environmental and Soil Sciences of Guangdong Academy of Sciens
Priority to CN201810186313.9A priority Critical patent/CN108549620B/zh
Publication of CN108549620A publication Critical patent/CN108549620A/zh
Application granted granted Critical
Publication of CN108549620B publication Critical patent/CN108549620B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/24Earth materials
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/15Correlation function computation including computation of convolution operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Business, Economics & Management (AREA)
  • Operations Research (AREA)
  • Health & Medical Sciences (AREA)
  • Algebra (AREA)
  • Strategic Management (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Chemical & Material Sciences (AREA)
  • General Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Geology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Remote Sensing (AREA)
  • Development Economics (AREA)
  • Environmental & Geological Engineering (AREA)
  • Game Theory and Decision Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Entrepreneurship & Innovation (AREA)

Abstract

本发明公开了一种土壤重金属生物有效性的估计方法、系统和装置,方法包括:采集研究区域内的土壤重金属生物有效性的地球化学因子数据和植物的重金属含量数据;根据所述地球化学因子数据和植物的重金属含量数据,以富集系数作为因变量,以地球化学因子作为自变量,建立随机森林回归模型;其中,富集系数是指植物中重金属含量与土壤中重金属含量的比值;根据随机森林回归模型计算地球化学因子对重金属生物有效性的贡献率。本发明采用随机森林回归模型的方法能够在较为准确地处理非线性关系的高维数据,因此,本发明能够较为准确地获得土壤重金属生物有效性和地球化学因子之间的非线性关系数据。本发明可以广泛应用于环境建模技术领域。

Description

一种土壤重金属生物有效性的估计方法、系统和装置
技术领域
本发明涉及环境建模技术领域,尤其是一种土壤重金属生物有效性的估计方法、系统和装置。
背景技术
重金属可以通过食物链人体而给人类健康带来潜在危害。而土壤中有效态的重金属元素易于转化和迁移,最容易被植物吸收利用而进入食物链,从而危害人畜和生态系统。重金属对生物的实际危害最终由重金属的生物有效性来体现。因此,了解重金属的生物有效性对全面评价重金属的危害具有重要意义。重金属对植物的毒害程度取决于其从土壤向蔬菜迁移的能力,迁移能力越强,重金属富集程度越高,对植物的危害程度也就越大。重金属在土壤-植物系统中的迁移富集是一个极为复杂的过程,与土壤地球化学属性密切相关,土壤的理化性质如pH值、土壤质地以及土壤中的营养元素、矿物质含量等都会影响重金属生物有效性,因此,估计土壤重金属生物有效性的关键地球化学因子十分必要。
目前,估计土壤重金属生物有效性的关键地球化学因子的研究方法主要有控制实验法、数学模型法和机理模型法等。其中,控制实验法和机理模型法主要用于盆栽实验和小区田间试验,通过人为控制土壤地球化学因子的施用量,观察土壤重金属生物有效性与土壤地球化学因子的关系,因控制试验条件和试验持续时间的局限无法在大尺度区域开展,不适合应用在大尺度区域的环境建模中。
数学模型法则是基于大尺度观测数据,利用数学建模的方法估计土壤重金属生物有效性的关键因子,广泛应用于大尺度区域分析。土壤重金属生物有效性与地球化学因子关联的研究通常采用相关系数分析、回归分析、主成分分析以及其他多元统计方法。通过相关系数分析研究了农作物各组织器官与土壤重金属全量以及化学形态含量的相关性。然而这些分析方法仅局限于线性相关的分析。随着人工智能的迅速发展,机器学习技术成为了当前数学建模领域的热点,机器学习模型被广泛的应用于土壤重金属生物有效性的关键因子的估计。机器学习模型有很多类别,我们可以按照算法分类,比如说基于树的算法,基于神经网络的算法和基于组合模型的算法等等。通过构造概率密度函数的算法将模型划分为最大期望算法模型,贝叶斯网和马尔可夫随机场模型等;通过构造决策树的算法将模型划分为随机森林模型、多元自适应回归样条和Chi-squared Automatic InteractionDetection模型等;通过构造组合模型的算法可划分模型为Bootstrapped Aggregation模型、梯度推进机模型和随机森林模型等。普通最小二乘回归、逐步回归和逻辑斯蒂回归等传统的机器学习模型局限在于无法分析土壤重金属生物有效性的关键因子间的非线性相关而导致判断失误。
综上所述,目前还没有一种技术能够高效精准地处理非线性关系数据的技术手段。
发明内容
为解决上述技术问题,本发明的目的在于:提供一种能够高效精准地处理非线性关系的土壤重金属生物有效性的估计方法。
本发明所采取的第一种技术方案是:
一种土壤重金属生物有效性的估计方法,包括以下步骤:
采集研究区域内的土壤重金属生物有效性的地球化学因子数据和植物的重金属含量数据;
根据所述地球化学因子数据和植物的重金属含量数据,以富集系数作为因变量,以地球化学因子作为自变量,建立随机森林回归模型;其中,富集系数是指植物中重金属含量与土壤中重金属含量的比值;
根据随机森林回归模型计算地球化学因子对重金属生物有效性的贡献率。
进一步,所述地球化学因子数据包括土壤性质数据和土壤重金属形态数据,所述土壤性质数据包括土壤的pH值、土壤的有机质含量、土壤的阳离子交换量、土壤的质地、土壤内的营养元素和矿物质中的至少一种,所述土壤重金属形态数据包括土壤重金属的络草酸/草酸铵提取态、DCB提取态、氯化钙提取态、乙酸/乙酸钠提取态、DTPA螯合态和碳酸钠提取态中的至少一种。
进一步,所述根据所述地球化学因子数据和植物的重金属含量数据,以富集系数作为因变量,以地球化学因子作为自变量,建立随机森林回归模型,这一步骤具体包括:
确定随机森林回归模型中每棵决策树随机取样的预测变量的数量和决策树的数量;
以富集系数作为因变量,以地球化学因子作为自变量,在所述地球化学因子数据和植物的重金属含量数据中采用随机自举抽样的方法来选择观测值构建决策树。
进一步,还包括以下步骤:
采用十折交叉检验法估算随机森林回归模型的精度。
进一步,还包括以下步骤:
采用拟合度来验证随机森林回归模型的精度。
进一步,所述根据随机森林回归模型计算地球化学因子对重金属生物有效性的贡献率,这一步骤具体为:
根据随机森林回归模型的预测函数计算地球化学因子对重金属生物有效性的贡献率,其中所述预测函数的表达式为:
Figure BDA0001590369270000031
其中,B表示随机森林回归模型中决策树的数量,Tb()表示第b个决策树,表示预测函数,x为自变量。
本发明所采取的第二种技术方案是:
一种土壤重金属生物有效性的估计系统,包括:
采集模块,用于采集研究区域内的土壤重金属生物有效性的地球化学因子数据和植物的重金属含量数据;
建模模块,用于根据所述地球化学因子数据和植物的重金属含量数据,以富集系数作为因变量,以地球化学因子作为自变量,建立随机森林回归模型;其中,富集系数是指植物中重金属含量与土壤中重金属含量的比值;
计算模块,用于根据随机森林回归模型计算地球化学因子对重金属生物有效性的贡献率。
本发明所采取的第三种技术方案是:
一种土壤重金属生物有效性的估算装置,包括:
存储器,用于存储程序;
处理器,用于加载所述程序以执行土壤重金属生物有效性的估算方法。
本发明的有益效果是:通过采集研究区域内的土壤重金属生物有效性的地球化学因子数据和植物的重金属含量数据,并建立随机森林回归模型来获得土壤重金属生物有效性和地球化学因子之间的非线性关系,而采用随机森林回归模型的方法能够在较为准确地处理非线性关系的高维数据,因而本发明能够较为准确地获得土壤重金属生物有效性和地球化学因子之间的非线性关系数据。
附图说明
图1为本发明一种土壤重金属生物有效性的估计方法流程图;
图2为本发明一种具体实施例的土壤重金属生物有效性的估算方法流程图;
图3为珠江三角洲地球化学因子对菜心铊元素富集系数的贡献率;
图4为珠江三角洲地球化学因子对生菜铊元素富集系数的贡献率。
具体实施方式
参照图1,一种土壤重金属生物有效性的估计方法,包括以下步骤:
采集研究区域内的土壤重金属生物有效性的地球化学因子数据和植物的重金属含量数据;
根据所述地球化学因子数据和植物的重金属含量数据,以富集系数作为因变量,以地球化学因子作为自变量,建立随机森林回归模型;其中,富集系数是指植物中重金属含量与土壤中重金属含量的比值;
根据随机森林回归模型计算地球化学因子对重金属生物有效性的贡献率。
进一步作为优选的实施方式,所述地球化学因子数据包括土壤性质数据和土壤重金属形态数据,所述土壤性质数据包括土壤的pH值、土壤的有机质含量、土壤的阳离子交换量、土壤的质地、土壤内的营养元素和矿物质中的至少一种,所述土壤重金属形态数据包括土壤重金属的络草酸/草酸铵提取态、DCB提取态、氯化钙提取态、乙酸/乙酸钠提取态、DTPA螯合态和碳酸钠提取态中的至少一种。
进一步作为优选的实施方式,所述根据所述地球化学因子数据和植物的重金属含量数据,以富集系数作为因变量,以地球化学因子作为自变量,建立随机森林回归模型,这一步骤具体包括:
确定随机森林回归模型中每棵决策树随机取样的预测变量的数量和决策树的数量;
以富集系数作为因变量,以地球化学因子作为自变量,在所述地球化学因子数据和植物的重金属含量数据中采用随机自举抽样的方法来选择观测值构建决策树。
进一步作为优选的实施方式,还包括以下步骤:
采用十折交叉检验法估算随机森林回归模型的精度。
进一步作为优选的实施方式,还包括以下步骤:
采用拟合度来验证随机森林回归模型的精度。
进一步作为优选的实施方式,所述根据随机森林回归模型计算地球化学因子对重金属生物有效性的贡献率,这一步骤具体为:
根据随机森林回归模型的预测函数计算地球化学因子对重金属生物有效性的贡献率,其中所述预测函数的表达式为:
Figure BDA0001590369270000041
其中,B表示随机森林回归模型中决策树的数量,Tb()表示第b个决策树,表示预测函数,x为自变量。
与图1中方法对应的一种土壤重金属生物有效性的估计系统,包括:
采集模块,用于采集研究区域内的土壤重金属生物有效性的地球化学因子数据和植物的重金属含量数据;
建模模块,用于根据所述地球化学因子数据和植物的重金属含量数据,以富集系数作为因变量,以地球化学因子作为自变量,建立随机森林回归模型;其中,富集系数是指植物中重金属含量与土壤中重金属含量的比值;
计算模块,用于根据随机森林回归模型计算地球化学因子对重金属生物有效性的贡献率。
与图1中方法对应的一种土壤重金属生物有效性的估算装置,包括:
存储器,用于存储程序;
处理器,用于加载所述程序以执行土壤重金属生物有效性的估算方法。
下面结合说明书附图和具体的实施例对本发明进行进一步的说明。
为了解决现有技术存在处理非线性关系数据时存在不准确的问题,本实施例提出了一种土壤重金属生物有效性的估计方法,参照图2,该方法包括以下步骤:
S100、采集研究区域内的土壤重金属生物有效性的地球化学因子数据和植物的重金属含量数据。
首先确定研究的区域,而在研究区域内影响重金属生物有效性的地球化学因子主要可以分为两类,即土壤性质数据(也叫做土壤内因)和土壤重金属形态数据,所述土壤性质数据包括土壤的pH值、土壤的有机质含量、土壤的阳离子交换量、土壤的质地(土壤砂粒、粉粘和粘粒)、土壤内的营养元素(全氮、全磷、全钾、速效氮、速效磷和速效钾)和矿物质(硅、铁和铝)中的至少一种,所述土壤重金属形态数据包括土壤重金属的络草酸/草酸铵提取态(Oxalate态)、DCB提取态(DCB态)、氯化钙提取态(CaCl2态)、乙酸/乙酸钠提取态(NaOAc态)、DTPA螯合态和碳酸钠提取态中的至少一种。
S200、根据所述地球化学因子数据和植物的重金属含量数据,以富集系数作为因变量,以地球化学因子作为自变量,建立随机森林回归模型;其中,富集系数是指植物中重金属含量与土壤中重金属含量的比值。富集系数是用来定量描述一种特定金属从土壤到植物的富集的相对差异的因子,同时可以认为是一种包含土壤和植物属性的函数,是作物中重金属含量与土壤中重金属含量的比值,富集系数越大,表明作物对土壤中重金属元素的迁移富集能力就越强,是定量研究土壤重金属迁移累积能力和土壤重金属生物有效性的重要参数。富集系数不仅可以表明对植物中重金属含量受土壤重金属含量直接影响程度,还可以说明植物对重金属吸收的累积特性,其表达式如下:
Figure BDA0001590369270000061
Cplant代表植物可食部分中重金属的含量,Csoil代表植物生长的土壤中重金属的总量。我们用富集系数表示土壤重金属生物有效性。
其中,步骤S200包括步骤S201~步骤S202。
S201、确定随机森林回归模型中每棵决策树随机取样的预测变量的数量和决策树的数量。该步骤的主要作用是确定随机森林回归模型的主要参数,包括:(i)在每棵决策树划分节点,随机取样的预测变量的数量:参数mtry。对于回归模型,默认值为预测变量总数的均方根误差。(ii)决策树(回归树)的数量:参数ntree。为了优化最终模型构建的决策树的数量,最初决策树组合使用初始值1000棵树。ntree设置为1000;(iii)模型类型,回归:参数类型选择回归进行回归预测。
S202、以富集系数作为因变量,以地球化学因子作为自变量,在所述地球化学因子数据和植物的重金属含量数据中随机地采用自举抽样的方法重新选择观测值构建决策树。这样,随机森林随机地生成几百棵至几千棵决策树。
S300、根据随机森林回归模型的预测函数计算地球化学因子对重金属生物有效性的贡献率,其中所述预测函数的表达式为:
Figure BDA0001590369270000062
其中,B表示随机森林回归模型中决策树的数量,Tb()表示第b个决策树,表示预测函数,x为自变量。
随机森林回归模型的建立过程可以采用R语言软件实现。
S401、采用十折交叉检验法估算随机森林回归模型的精度。
S402、采用拟合度来验证随机森林回归模型的精度。随机森林回归模型可以采用Pesudo R平方度量。Pesudo R平方的值介于0-1之间,Pesudo R平方的值越接近1,说明随机森林模型的拟合程度越好;反之,Pesudo R平方的值越小,说明随机森林模型的拟合程度越差。
本实施例以珠江三角洲为研究区域,植物选择二类蔬菜分别为菜心和生菜,重金属选择铊元素(Tl)。
首先,样本采样:以珠江三角洲地球化学因子为自变量,蔬菜铊元素富集系数为因变量进行分析,样本量一共201个,201个样本点包括蔬菜铊元素富集系数和对应的地球化学因子。菜心和生菜各201个样本点。38个地球化学因子分别为MgO、CaO、Al2O3、Na2O、K2O、FeAm(无定型铁),Clay(粘粒)、Silt(胶粒)、FeDCB(DCB提取的铁)、Fe2O3(三氧化二铁)、Sand(沙砾)、CEC(阳离子交换量)、Tl2(CaCl2提取的铊元素)、Hydro N(水解氮)、FeNaOAc(NaOAc提取的Fe),WI-5(风化因子(K2O+Na2O+CaO+MgO)/Al2O3)、Tl1(DTPA提取的铊元素)、WI-1(风化因子SiO2/Al2O3)、Total K(土壤中总的钾元素含量),TOC(土壤有机碳)、CIW(风化因子[Al2O3/(Al2O3+CaO+Na2O)]×100)、WI-2(风化因子Al2O3/Fe2O3)、WI-3(风化因子(Al2O3+Fe2O3)/SiO2)、WI-4(风化因子(K2O+Na2O)/Al2O3)、CIA(风化因子[Al2O3/(Al2O3+CaO+Na2O+K2O)]×100)、Tl3(草酸铵提取的铊元素)、PAv(可利用的磷元素)、FeCo(焦磷酸钠提取铁)、SOM(土壤有机质)、FeDTPA(DTPA提取的铁元素)、Total P(土壤中总的磷元素含量)、pHH2O(水作为提取剂测定的pH),pHKCl(KCl作为提取剂测定的pH)。
接着,回归预测:生菜(菜心)铊元素的富集系数作为随机森林模型的因变量,地球化学因子为自变量。训练单棵回归树,设置树的数目为500,组合500棵训练的单个回归树,通过专家投票方式决策,测试数据进行测试,用最终组合得到的随机森林模型进行回归预测。计算得到地球化学因子对蔬菜富集系数的重要性以及地球化学因子与蔬菜富集系数的交互作用。
最后,借助R语言编辑的程序完成随机森林回归模型的建立,然后采用该随机森林回归模型对采集的数据进行预测。分析结果如图3和图4所示。
图3表明在珠江三角洲的地球化学因子中,对菜心铊元素富集系数的重要性最大的是K2O,总K、SiO2和TOC,贡献率达到52%。Fe2O3、PAv、FeDCB、pHH2O、Silt、WI-2、Clay、FeAm和FeDTPA的重要性为0,可忽略不计。K2O,总K、SiO2和TOC是菜心铊元素生物有效性的关键地球化学因子。
图4表明珠江三角洲地球化学因子中,对生菜铊元素富集系数的重要性最大的是Rapid K、K2O和总K,贡献率达到21%。Fe2O3、CEC、FeDCB、pHKCl、WI-2、Tl3、Tl2和FeNaOAc的重要性几乎为0,可忽略不计。Rapid K(易于被植物吸收利用的钾)、K2O和总K是生菜铊元素生物有效性的关键地球化学因子。
采用拟合度来检验模型表明珠三角地球化学因子和蔬菜铊元素富集系数的关系随机森林回归模型的拟合精度均较高,Pseudo R平方分别为0.76和0.79。
对于本实施例中的步骤编号,其仅为了便于阐述说明而设置,对步骤之间的顺序不做任何限定,实施例中的各步骤的执行顺序均可根据本领域技术人员的理解来进行适应性调整。
以上是对本发明的较佳实施进行了具体说明,但本发明并不限于所述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。

Claims (8)

1.一种土壤重金属生物有效性的估计方法,其特征在于:包括以下步骤:
采集研究区域内的土壤重金属生物有效性的地球化学因子数据和植物的重金属含量数据;
根据所述地球化学因子数据和植物的重金属含量数据,以富集系数作为因变量,以地球化学因子作为自变量,建立随机森林回归模型;其中,富集系数是指植物中重金属含量与土壤中重金属含量的比值,其表达式如下:
Figure FDA0003216316030000011
其中,Cplant代表植物可食部分中重金属的含量,Csoil代表植物生长的土壤中重金属的总量;
根据随机森林回归模型计算地球化学因子对重金属生物有效性的贡献率。
2.根据权利要求1所述的一种土壤重金属生物有效性的估计方法,其特征在于:所述地球化学因子数据包括土壤性质数据和土壤重金属形态数据,所述土壤性质数据包括土壤的pH值、土壤的有机质含量、土壤的阳离子交换量、土壤的质地、土壤内的营养元素和矿物质中的至少一种,所述土壤重金属形态数据包括土壤重金属的络草酸/草酸铵提取态、DCB提取态、氯化钙提取态、乙酸/乙酸钠提取态、DTPA螯合态和碳酸钠提取态中的至少一种。
3.根据权利要求1所述的一种土壤重金属生物有效性的估计方法,其特征在于:所述根据所述地球化学因子数据和植物的重金属含量数据,以富集系数作为因变量,以地球化学因子作为自变量,建立随机森林回归模型,这一步骤具体包括:
确定随机森林回归模型中每棵决策树随机取样的预测变量的数量和决策树的数量;
以富集系数作为因变量,以地球化学因子作为自变量,在所述地球化学因子数据和植物的重金属含量数据中采用随机自举抽样的方法来选择观测值构建决策树。
4.根据权利要求1所述的一种土壤重金属生物有效性的估计方法,其特征在于:还包括以下步骤:
采用十折交叉检验法估算随机森林回归模型的精度。
5.根据权利要求1所述的一种土壤重金属生物有效性的估计方法,其特征在于:还包括以下步骤:
采用拟合度来验证随机森林回归模型的精度。
6.根据权利要求1所述的一种土壤重金属生物有效性的估计方法,其特征在于:所述根据随机森林回归模型计算地球化学因子对重金属生物有效性的贡献率,这一步骤具体为:
根据随机森林回归模型的预测函数计算地球化学因子对重金属生物有效性的贡献率,其中所述预测函数的表达式为:
Figure FDA0003216316030000021
其中,B表示随机森林回归模型中决策树的数量,Tb()表示第b个决策树,
Figure FDA0003216316030000022
表示预测函数,x为自变量。
7.一种土壤重金属生物有效性的估计系统,其特征在于:包括:
采集模块,用于采集研究区域内的土壤重金属生物有效性的地球化学因子数据和植物的重金属含量数据;
建模模块,用于根据所述地球化学因子数据和植物的重金属含量数据,以富集系数作为因变量,以地球化学因子作为自变量,建立随机森林回归模型;其中,富集系数是指植物中重金属含量与土壤中重金属含量的比值,其表达式如下:
Figure FDA0003216316030000023
其中,Cplant代表植物可食部分中重金属的含量,Csoil代表植物生长的土壤中重金属的总量;
计算模块,用于根据随机森林回归模型计算地球化学因子对重金属生物有效性的贡献率。
8.一种土壤重金属生物有效性的估计装置,其特征在于:包括:
存储器,用于存储程序;
处理器,用于加载所述程序以执行如权利要求1所述的土壤重金属生物有效性的估算方法。
CN201810186313.9A 2018-03-07 2018-03-07 一种土壤重金属生物有效性的估计方法、系统和装置 Active CN108549620B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810186313.9A CN108549620B (zh) 2018-03-07 2018-03-07 一种土壤重金属生物有效性的估计方法、系统和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810186313.9A CN108549620B (zh) 2018-03-07 2018-03-07 一种土壤重金属生物有效性的估计方法、系统和装置

Publications (2)

Publication Number Publication Date
CN108549620A CN108549620A (zh) 2018-09-18
CN108549620B true CN108549620B (zh) 2021-10-15

Family

ID=63516420

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810186313.9A Active CN108549620B (zh) 2018-03-07 2018-03-07 一种土壤重金属生物有效性的估计方法、系统和装置

Country Status (1)

Country Link
CN (1) CN108549620B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109900682B (zh) * 2019-03-22 2022-01-25 临沂大学 一种基于富集因子值计算的表层土壤重金属污染来源定量识别方法
CN110083985B (zh) * 2019-05-21 2023-03-31 南京大学 一种土壤镉镍复合的小麦富集量的预测方法
CN114167031B (zh) * 2021-11-22 2022-08-05 中国环境科学研究院 一种土壤重金属生物可利用性含量预测的方法
CN115775042B (zh) * 2022-11-11 2023-05-05 中国科学院生态环境研究中心 基于贝叶斯理论的农作物重金属富集风险预测方法及系统
CN116227692B (zh) * 2023-02-06 2023-09-26 中国科学院生态环境研究中心 一种农作物重金属富集风险量化方法、系统及可存储介质
CN116384624B (zh) * 2023-03-13 2023-09-05 中国科学院生态环境研究中心 用于深翻耕措施的区域土壤最优翻耕深度确定方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102305792A (zh) * 2011-07-22 2012-01-04 浙江农林大学 基于非线性偏最小二乘优化模型的森林碳汇遥感估算方法
CN106568923A (zh) * 2016-11-10 2017-04-19 北京农业质量标准与检测技术研究中心 一种土壤重金属含量影响因子评价方法
CN107358121A (zh) * 2017-07-12 2017-11-17 张�诚 一种脱敏数据集的数据融合方法及装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004021252A1 (en) * 2002-08-27 2004-03-11 Freescale Semiconductor, Inc. Fast simulation of circuitry having soi transistors
US20040111314A1 (en) * 2002-10-16 2004-06-10 Ford Motor Company Satisfaction prediction model for consumers

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102305792A (zh) * 2011-07-22 2012-01-04 浙江农林大学 基于非线性偏最小二乘优化模型的森林碳汇遥感估算方法
CN106568923A (zh) * 2016-11-10 2017-04-19 北京农业质量标准与检测技术研究中心 一种土壤重金属含量影响因子评价方法
CN107358121A (zh) * 2017-07-12 2017-11-17 张�诚 一种脱敏数据集的数据融合方法及装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
"The influence of heavy metals on soil biological and chemical properties";Friedlová M.;《Soil and Water Research》;20101107(第11期);第187-194页 *
"九龙坡区土壤重金属空间分布特征及其影响因素研究";谢双扬;《中国优秀硕士学位论文全文数据库 农业科技辑》;20170215;第D043-237页 *
"农田土壤重金属污染评价研究进展";王玉军 等;《农业环境科学学报》;20171220;第36卷(第12期);第2365-2378页 *

Also Published As

Publication number Publication date
CN108549620A (zh) 2018-09-18

Similar Documents

Publication Publication Date Title
CN108549620B (zh) 一种土壤重金属生物有效性的估计方法、系统和装置
Shatar et al. Boundary-line analysis of field-scale yield response to soil properties
Chen et al. Online forecasting chlorophyll a concentrations by an auto-regressive integrated moving average model: Feasibilities and potentials
Jemison Jr et al. Evaluation of LEACHM: II. Simulation of nitrate leaching from nitrogen‐fertilized and manured corn
Benes et al. Multiscale computational models can guide experimentation and targeted measurements for crop improvement
Hollaway et al. The challenges of modelling phosphorus in a headwater catchment: Applying a ‘limits of acceptability’uncertainty framework to a water quality model
CN113267607B (zh) 一种场地有机污染物迁移过程的特征参数识别系统
Song et al. The application of Artificial Neural Network (ANN) model to the simulation of denitrification rates in mesocosm-scale wetlands
CN117322214B (zh) 一种基于神经网络的农作物肥料精准施用方法与系统
Albani et al. Source characterization of airborne pollutant emissions by hybrid metaheuristic/gradient-based optimization techniques
Grant et al. Phosphorus uptake by root systems: mathematical modelling in ecosys
CN115618720A (zh) 一种基于海拔高度的土壤盐渍化预测方法及系统
Wallor et al. Soil state variables in space and time: first steps towards linking proximal soil sensing and process modelling
Liang et al. A multivariate empirical orthogonal function method to construct nitrate maps in the Southern Ocean
M Aziz Determine the pH. of Soil by Using Neural Network Based on Soil's Colour
Brouder et al. The potassium cycle and its relationship to recommendation development
Jude C et al. Identification of soil management factors from spatially variable soil properties of coastal plain sands in Southeastern Nigeria
Akritas et al. 7 Statistical analysis of censored environmental data
Leimer et al. Biodiversity effects on nitrate concentrations in soil solution: a Bayesian model
Xu et al. Linking structural equation modeling with Bayesian network and its application to coastal phytoplankton dynamics in the Bohai Bay
Dhillon et al. Spatial variability of soil test values in a Typic Ustochrept
Kuderer How bioturbators perturb the paleo record: From Eulerian to Lagrangian and back.
Mattila et al. Do carbon farming practices build bioavailable nitrogen pools?
Orouskhani et al. Impact of sensor placement in soil water estimation
Vélez Modelling nitrogen leaching in agriculture–Exploring interdependencies between cover crops, soil structure and organic matter turnover

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: Tianhe District Tianyuan road Guangzhou City, Guangdong province 510650 No. 808

Applicant after: Institute of ecological environment and soil, Guangdong Academy of Sciences

Address before: Guangzhou City, Guangdong province 510650 Tianyuan Road No. 808

Applicant before: GUANGDONG INSTITUTE OF ECO-ENVIRONMENT AND SOIL SCIENCES

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant
CB03 Change of inventor or designer information

Inventor after: Wang Qi

Inventor after: Li Fangbai

Inventor after: Liu Jianfeng

Inventor after: Yu Huanyun

Inventor after: Sun Weimin

Inventor after: Hao Dongmei

Inventor after: Ma Yibing

Inventor before: Wang Qi

Inventor before: Li Fangbai

Inventor before: Liu Jianfeng

Inventor before: Yu Huanyun

Inventor before: Sun Weimin

Inventor before: Hao Dongmei

CB03 Change of inventor or designer information