CN114660105A - 土壤重金属Cd含量反演方法、系统、介质、计算机设备 - Google Patents

土壤重金属Cd含量反演方法、系统、介质、计算机设备 Download PDF

Info

Publication number
CN114660105A
CN114660105A CN202210355384.3A CN202210355384A CN114660105A CN 114660105 A CN114660105 A CN 114660105A CN 202210355384 A CN202210355384 A CN 202210355384A CN 114660105 A CN114660105 A CN 114660105A
Authority
CN
China
Prior art keywords
soil
content
heavy metal
model
spectrum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210355384.3A
Other languages
English (en)
Inventor
刘严松
赖思翰
李成林
王地
何星慧
邓辉
刘雅兰
朱飞霖
沈娇
王显菊
刘琦
邵青青
吴静
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Geological Survey Center Of China Geological Survey (southwest Geological Science And Technology Innovation Center)
Sichuan Sanhe Space Technology Co ltd
Chengdu Univeristy of Technology
Original Assignee
Chengdu Geological Survey Center Of China Geological Survey (southwest Geological Science And Technology Innovation Center)
Sichuan Sanhe Space Technology Co ltd
Chengdu Univeristy of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Geological Survey Center Of China Geological Survey (southwest Geological Science And Technology Innovation Center), Sichuan Sanhe Space Technology Co ltd, Chengdu Univeristy of Technology filed Critical Chengdu Geological Survey Center Of China Geological Survey (southwest Geological Science And Technology Innovation Center)
Priority to CN202210355384.3A priority Critical patent/CN114660105A/zh
Publication of CN114660105A publication Critical patent/CN114660105A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N23/00Investigating or analysing materials by the use of wave or particle radiation, e.g. X-rays or neutrons, not covered by groups G01N3/00 – G01N17/00, G01N21/00 or G01N22/00
    • G01N23/22Investigating or analysing materials by the use of wave or particle radiation, e.g. X-rays or neutrons, not covered by groups G01N3/00 – G01N17/00, G01N21/00 or G01N22/00 by measuring secondary emission from the material
    • G01N23/223Investigating or analysing materials by the use of wave or particle radiation, e.g. X-rays or neutrons, not covered by groups G01N3/00 – G01N17/00, G01N21/00 or G01N22/00 by measuring secondary emission from the material by irradiating the sample with X-rays or gamma-rays and by measuring X-ray fluorescence
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biochemistry (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Artificial Intelligence (AREA)
  • Pathology (AREA)
  • Immunology (AREA)
  • General Health & Medical Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • Mathematical Physics (AREA)
  • Analysing Materials By The Use Of Radiation (AREA)
  • Computing Systems (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Data Mining & Analysis (AREA)

Abstract

本发明属于土壤重金属污染检测技术领域,公开了一种土壤重金属Cd含量的反演方法、系统、介质、计算机设备,所述土壤重金属Cd含量的反演方法包括:采集土壤样品,使用X射线荧光分析仪测、ASD FieldSpec 3光谱仪及配套的试验设备和软件系统分别获得土壤中重金属Cd的实际含量值与元素光谱信息;对原始光谱进行降维处理和特征光谱筛选,利用元素的特征波谱进行随机森林、人工神经网络、支持向量机模型学习和含量反演。所述土壤重金属Cd含量反演系统包括:土壤光谱信息模块;重金属含量预测模块;模型预测评价模块。本发明反演精度高,操作简便,为土壤重金属Cd元素的快速无损检测及区域性评价提供了新的技术手段。

Description

土壤重金属Cd含量反演方法、系统、介质、计算机设备
技术领域
本发明属于土壤重金属污染检测技术领域,尤其涉及一种土壤重金属Cd含量反演方法、系统、介质、计算机设备。
背景技术
目前,土壤是人类赖以生存和发展的重要资源,随着工业生产的快速发展,矿区开发增加,废料中的有毒、有害物质渗入土壤,污染日益严重,其中重金属污染问题最为突出。土壤重金属污染具有隐蔽性、滞后性和难降解性,破坏生态环境有机平衡,并且通过食物链富集,严重威胁着人类的健康。
如何快速、准确、无损地获取土壤重金属污染信息是进行土壤污染防治、风险评价与预测的工作前提,是目前土壤重金属研究中的难点和热点。
现有土壤重金属含量的分析主要采用化学分析,具有周期长、成本高、化学污染等缺点。相较于传统化学测定方法,高光谱探测技术不存在化学污染的问题,并可快速、高效地进行不同空间和时间尺度的地物信息获取,在多层次-多时相的土壤污染信息获取方面具有特殊优势。
在土壤重金属Cd含量信息提取方面,目前国内外学者利用高光谱技术开展了不同程度的土壤重金属Cd含量反演理论研究与实践,在土壤重金属Cd的光谱特征方面取得了一定的进展。但是,在光谱数据采集、光谱数据处理、反演模型与反演方法方面仍存在有待探索和改进之处,光谱采集过程中容易出现样品混染、人为误差、数据波动、质量不稳定等问题,从而直接影响了反演精度和定量化分析。
因此,本发明针对土壤重金属含量反演中存在的问题,研制了专用土壤光谱测试样品杯和活动式高光谱探头支架,建立了基于高光谱的重金属Cd元素含量反演模型和反演方法体系,使得光谱采集更加规范和高效,采集的光谱数据更加稳定,提高了反演预测精度,为土壤重金属污染信息快速、无损提取提供了支持。
发明内容
针对现有技术存在的问题,本发明提供了一种土壤重金属Cd含量反演方法、系统、介质、计算机设备。
本发明是这样实现的,一种土壤重金属Cd含量反演方法,所述土壤重金属Cd含量反演方法,包括:
步骤一,采集土壤样品,制备正、副样品各一份;
步骤二,使用X射线荧光分析仪测定样品重金属Cd元素的实际含量,利用ASDFieldSpec 3光谱仪及配套的软件获取Cd元素的光谱信息;
步骤三,对原始波谱数据进行降维处理,筛选特征波段,利用随机森林、人工神经网络、支持向量机模型进行Cd元素的含量反演,建立基于高光谱特征波段的Cd元素含量反演方法体系;
进一步,所述步骤二中,X射线荧光分析仪为OLYMUPS DELTA手持式X射线荧光分析仪;高光谱数据采集使用的是ASD FieldSpec 3光谱仪及配套的软件。
为保证多次重复采样的高效和稳定性,利用本次研制的样品杯将样品分装5份放于测试台,将光谱仪探头固定在活动式支架上,旋转伸缩探头,以相同的45°入射角进行样品光谱采集。
使用ASD FieldSpec 3光谱仪及配套软件获取土壤光谱信息,具体过程为:
对土壤样品进行相关前期处理后,在黑暗情况下利用本次研制的专用样品杯进行光谱采集,以避免外界光线因素的干扰;
利用经过白板校正的ASD FieldSpec 3光谱仪进行反射光谱测量;为了保证数据的代表性,每个样本采集5次光谱数据,并对光谱进行均值处理,去除异常值,以此结果作为样品的实际反射光谱;
所述ASD FieldSpec 3光谱仪波长范围为350-2500nm,其中在350-1000nm波段的采样间隔为1.4nm、光谱分辨为3nm,1000-2500nm波段的采样点间隔为2nm、光谱分辨率为10nm。
为保证多次重复采样的高效和稳定性,利用本次研制的样品杯将样品分装5份放于测试台,将光谱仪探头固定在活动式支架上,旋转伸缩探头,以相同的45°入射角进行样品光谱采集。
进一步,所述步骤三中,对原始光谱进行变换处理包括:一阶微分(FD)、二阶微分(SD)、光谱倒数的对数(AT)、光谱倒数的对数一阶微分(ATFD)、光谱倒数的对数二阶微分(ATSD)。
进一步,所述步骤二中,对原始光谱进行变换处理具体过程为:对原始光谱进行降维处理的具体过程为:利用ViewSpecPro软件中的Process功能对土壤原始光谱曲线进行数据统计及变换,选取一阶微分(FD)、二阶微分(SD)、光谱倒数的对数(AT)、光谱倒数的对数一阶微分(ATFD)、光谱倒数的对数二阶微分(ATSD)这5种方法对所测定的光谱数据进行变换处理。
进一步,所述步骤三中,筛选特征波段具体过程为:
所测土壤光谱曲线波长范围为350-2500nm,利用SPSS 26.0软件进行特征波段的选择,筛选出对建模贡献大的波段作为建立反演模型最佳变量。
进一步,所述步骤三中,随机森林模型(RF)为结合多棵决策树的一种集成学习方法,有效应用在回归分析中;人工神经网络(ANN)为一种由许多节点构成的运算模型,有多种连接方式,具有适应性信息处理能力;支持向量机模型(SVM)根据有限样本信息,以减少训练数据复杂度,得到模型的最优的支持向量的数目,用于土壤环境评价中的非线性分类情况。
进一步,所述步骤三中,重金属含量预测具体过程为:
实验模型的建立过程在IBM SPSS Modeler Subscription软件中实现,先将实测含量与筛选出的特征波段数据读入SPSS Modeler中,在类型(type)处选择含量作为目标;
在软件工作区构建并操纵数据流(data streams):经过过滤器模块(filter),选择不同类型的预测方法,完成模型的构建,运行该数据流(data stream),进行土壤重金属Cd含量的预测,最后对预测含量结果进行分析。
进一步,所述步骤三中,评价模型预测精度和效果,具体过程为:
采用决定系数R2和均方根误差RMSE来评价模型的预测精度和效果,公式为:
Figure BDA0003585918560000041
Figure BDA0003585918560000042
其中yi为样品重金属Cd实测含量值,
Figure BDA0003585918560000043
为实测平均值,
Figure BDA0003585918560000044
为预测含量值,R2指示模型的稳定性;若R2>0.8,说明模型预测效果良好,R2越大且接近1,表示模型的拟合程度高、效果佳;若0.7<R2<0.8,说明模型预测效果一般;若R2<0.7,说明该模型预测效果差;RMSE指示模型预测的精度,RMSE越小,则说明预测值与实测值的误差越小,代表所建立的反演模型精度越高,反之则反演精度低。
本发明的另一目的在于提供一种高光谱数据采集、处理和存储的计算机设备,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行所述土壤重金属Cd含量反演方法的步骤。
本发明的另一目的在于提供一种上述的土壤重金属Cd含量的反演方法使用的样品杯,所述样品杯包括压环、内压片、外压片、套管、检测薄膜、外延边、底座、环形承台、扣盖;将检测套管套于检测薄膜之外,检测薄膜的上开口端使用压环固定于压环内压边和套管内壁之间,检测薄膜封口端和套管插入底座小口端至环形承台,检测薄膜封闭端外延边夹设于套管和底座小口端之间,扣盖盖于压环上。
本发明的另一目的在于提供种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行所述土壤重金属Cd含量反演方法的步骤。
本发明的另一目的在于提供一种实施所述土壤重金属Cd含量反演方法的土壤重金属Cd含量反演系统,所述土壤重金属Cd含量反演系统包括:
土壤光谱信息模块,用于采集、处理和存储土壤样品的光谱信息;
重金属含量预测模块,用于对原始光谱进行降维变换处理,筛选特征波段,采用随机森林、人工神经网络、支持向量机模型进行重金属含量预测;
模型预测评价模块,用于根据决定系数和均方根误差评价模型预测精度和效果。
结合上述的所有技术方案,本发明所具备的优点及积极效果为:制作并应用了专用的土壤光谱采集样品杯和活动式高光谱探头支架,便于在黑暗的试验环境下进行土壤样品的高光谱数据采集,提高了光谱采集的操作性,降低了光谱采集过程的人为误差,提高了光谱数据采集的精度。同时,建立了基于高光谱的土壤重金属Cd元素含量的反演方法和反演模型,有利于进行快速、无损进行土壤重金属Cd含量的检测,建立了土壤重金属的特征光谱数据库及配套的处理、存储系统,提高了传统土壤重金属Cd元素检测的效率和信息化程度,为治理土壤重金属污染问题提供了一种高效、快速、无损、无污染和信息化程度较高的Cd元素含量检测技术手段。
反演及评价结果表明:利用高光谱进行土壤重金属Cd元素含量的反演中以SD变换方法的降维效果最佳,预测效果最好的是SD-ANN模型,其R2=0.884,RMSE=2.679。
附图说明
图1是本发明实施例提供的土壤重金属Cd含量反演方法流程图;
图2是本发明实施例提供的土壤Cd元素高光谱实测现场照片;
图3是本发明实施例提供的样品杯结构图;
图4是本发明实施例提供的实验室实测土壤Cd元素原始光谱曲线图;
图5是本发明实施例提供的SD降维变换特征光谱曲线图;
图6是本发明实施例提供的ANN模型反演精度预测图;
图6中,图a、SD-ANN模型反演预测精度图;图b、SD-SVM模型反演预测精度图;图c、SD-RF模型反演预测精度图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
针对现有技术存在的问题,本发明提供了一种土壤重金属Cd含量反演方法、系统、介质、计算机设备,下面结合附图对本发明作详细的描述。
本发明提供的土壤重金属Cd含量反演方法业内的普通技术人员还可以采用其他的步骤实施,图1的本发明提供的土壤重金属Cd含量反演方法仅仅是一个具体实施例而已。
如图1所示,本发明实施例提供的土壤重金属Cd含量反演方法,包括:
S101:采集土壤样品,制备正、副样品各一份;
S102:使用X射线荧光分析仪测定样品重金属Cd元素的实际含量,利用ASDFieldSpec 3光谱仪及配套的软件获取Cd元素的光谱信息;
S103:对原始波谱数据进行降维处理,筛选特征波段,利用随机森林、人工神经网络、支持向量机模型进行Cd元素的含量反演,建立基于高光谱特征波段的Cd元素含量反演方法体系。
本发明实施例提供的S102中,X射线荧光分析仪为OLYMUPS DELTA手持式X射线荧光分析仪。
本发明实施例提供的S102中,土壤重金属Cd的高光谱数据仪器为ASD FieldSpec3光谱仪。
本发明实施例提供的S102中,土壤重金属元素Cd的高光谱数据采集使用了本次制作的专用样品杯和活动式光谱仪探头支架。具体操作过程为:
在黑暗情况下进行光谱采集,以避免外界光线因素的干扰;
对土壤样品进行相关前期处理后放置于光谱仪专用样品杯,将经过白板校正的ASD FieldSpec 3光谱仪探头固定在活动式探头支架上,对每个样本进行5次光谱数据采集,利用配套软件对光谱进行均值处理,去除异常值,以此结果作为样品的实际反射光谱。
所述ASD FieldSpec 3光谱仪波长范围为350-2500nm,其中在350-1000nm波段的采样间隔为1.4nm、光谱分辨为3nm,1000-2500nm波段的采样点间隔为2nm、光谱分辨率为10nm。
本发明实施例提供的S103中,对原始光谱进行降维处理包括:一阶微分(FD)、二阶微分(SD)、光谱倒数的对数(AT)、光谱倒数的对数一阶微分(ATFD)、光谱倒数的对数二阶微分(ATSD)。
本发明实施例提供的S103中,对原始光谱进行降维处理具体过程为:
利用ViewSpecPro软件中的Process功能对土壤原始光谱曲线进行数据统计及变换,选取一阶微分(FD)、二阶微分(SD)、光谱倒数的对数(AT)、光谱倒数的对数一阶微分(ATFD)、光谱倒数的对数二阶微分(ATSD)这5种方法对所测定的光谱数据进行降维处理。
本发明实施例提供的S103中,筛选特征波段具体过程为:
利用SPSS 26.0软件进行特征波段的选择,筛选出对建模贡献大的波段作为建立反演模型最佳变量。
本发明实施例提供的S103中,土壤重金属含量反演采用随机森林(RF)、人工神经网络(ANN)、支持向量机(SVM)这三种模型;随机森林模型(RF)是结合多棵决策树的一种集成学习方法,有效应用在回归分析中;人工神经网络(ANN)是一种由许多节点构成的运算模型,有多种连接方式,具有适应性信息处理能力;支持向量机模型(SVM)根据有限样本信息,以减少训练数据复杂度,得到模型的最优的支持向量的数目,用于土壤环境评价中的非线性分类情况。
本发明实施例提供的S103中,重金属含量预测具体过程为:
实验模型的建立过程在IBM SPSS Modeler Subscription中实现,先将实测含量与筛选出的特征波段数据读入SPSS Modeler中,在类型(type)处选择含量作为目标;
在软件工作区构建并操纵数据流(data streams):经过过滤器模块(filter),然后选择不同类型的预测方法,完成模型的构建,运行该数据流(data stream),进行土壤重金属Cd含量的预测,最后对预测结果进行分析。
本发明实施例提供的S103中,评价模型预测精度和效果,具体过程为:
采用决定系数R2和均方根误差RMSE来评价模型的预测精度和效果,公式为:
Figure BDA0003585918560000081
Figure BDA0003585918560000082
其中yi为样品重金属Cd实测含量值,
Figure BDA0003585918560000083
为实测平均值,
Figure BDA0003585918560000084
为预测含量值,R2指示模型的稳定性;若R2>0.8,说明模型预测效果良好,R2越大且接近1,表示模型的拟合程度高、效果佳;若0.7<R2<0.8,说明模型预测效果一般;若R2<0.7,说明该模型预测效果差;RMSE指示模型预测的精度,RMSE越小,则说明预测值与实测值的误差越小,代表所建立的反演模型精度越高,反之则反演精度低。
如图3所示,本发明提供的样品杯包括:压环1、内压片2、外压片3、套管4、检测薄膜5、外延边6、底座7、环形承台8、扣盖9,将检测套管4套于检测薄膜5之外,检测薄膜5的上开口端使用压环1固定于压环内压边和套管内壁之间,检测薄膜封口端和套管插入底座小口端至环形承台8,检测薄膜封闭端外延边6夹设于套管和底座小口端之间,扣盖9盖于压环1上。
利用该样品杯,避免了套管内壁的污染和样品交叉混染,提高了样品测试效率和精度。
下面结合具体实施例对本发明的技术方案作详细的描述。
1数据采集与处理
本发明采样依据土壤采样规范要求,确保样品能够如实反映研究区土壤表层的客观基本情况。样品采集于西藏某铅锌银矿集区,共选择样品32件,在实验室对样品进行烘干、脱水、研磨等处理,筛选粒径大小为60目的作为实验对象,并缩分成2份。
土壤样品中Cd元素的测量采用OLYMUPS DELTA手持式X射线荧光分析仪进行重金属元素含量测定,剔除异常值后进行统计。为避免外界光线因素的干扰,在黑暗情况下利用制作的专用光谱仪样品杯进行盛装待测样品,并进行光谱采集工作。本次用经过白板校正的ASD FieldSpec 3光谱仪进行反射光谱测量,该光谱仪波长范围为350-2500nm,其中在350-1000nm波段的采样间隔为1.4nm、光谱分辨为3nm,1000-2500nm波段的采样点间隔为2nm、光谱分辨率为10nm。为消除随机噪声的干扰,将光谱仪探测固定在支架上,每个样本的光谱数据采集5次,对光谱进行均值处理,去除异常值,以此结果作为样品的实际反射光谱。
2土壤光谱曲线降维处理
重金属反演建模的主要部分是对土壤光谱数据进行处理。在使用光谱仪进行土壤光谱采集过程中,由于土壤特性(含有机质、水分等)、仪器自身以及外界因素的影响,会产生一系列噪声与冗余信息,使后期数据处理过程出现问题,导致线性回归模型精度低,反演结果与真实值偏差愈大。此外,土壤中重金属的光谱响应信号微弱,很难直接通过原始光谱数据获取有用波段。因此需要通过相应的光谱处理技术来消除光谱测定时产生无关信息和噪声的影响。
为更好掌握土壤光谱曲线的变化规律,突出其吸收特征,利用ViewSpecPro软件中的Process功能对土壤原始光谱曲线进行数据统计及变换,选取一阶微分(FD)、二阶微分(SD)、光谱倒数的对数(AT)、光谱倒数的对数一阶微分(ATFD)、光谱倒数的对数二阶微分(ATSD)5种方法对所测定的光谱数据进行降维变换处理。
3特征波段选择
本发明实验所测土壤光谱曲线波长范围为350-2500nm,由于土壤重金属反演建模涉及的波段范围覆盖为可见光-热红外,波段数据冗余,因此,结合皮尔森相关性系数r,利用SPSS 26.0软件进行特征波段的选择,筛选出对建模贡献大的波段作为建立反演模型的最佳变量。
4建立反演模型
本发明土壤重金属含量反演采用随机森林(RF)、人工神经网络(ANN)、支持向量机模型(SVM)这三种模型。随机森林模型(RF)是结合多棵决策树的一种集成学习方法,可有效应用在回归分析中,人工神经网络(ANN)是一种由许多节点构成的运算模型,可以有多种连接方式,具有适应性信息处理能力,支持向量机模型(SVM)可根据有限样本信息,减少训练数据复杂度,得到模型的最优的支持向量的数目,可用于土壤环境评价中的非线性分类情况,预测情况较为理想。
本发明实验模型的建立过程在IBM SPSS Modeler Subscription中实现,先将实测含量与筛选出的特征波段数据读入SPSS Modeler中,在类型(type)处选择含量作为目标,经过过滤器模块(filter),然后选择不同类型的预测方法,完成模型的构建,运行数据流(data stream),进行土壤重金属Cd含量的预测,最后对预测结果进行分析。
5模型精度检验
为验证实验建模精度与模型预测精度,本发明采用决定系数(R2)和均方根误差(RMSE)来评价模型的预测精度和效果,公式为:
Figure BDA0003585918560000101
Figure BDA0003585918560000111
其中yi为样品重金属Cd实测含量值,
Figure BDA0003585918560000112
为实测平均值,
Figure BDA0003585918560000113
为预测含量值,R2指示模型的稳定性,若R2>0.8,说明模型预测效果良好,R2越大且接近1,表示模型的拟合程度高、效果佳,若0.7<R2<0.8,说明模型预测效果一般,若R2<0.7,说明该模型预测效果差;RMSE指示模型预测的精度,RMSE越小,则说明预测值与实测值的误差越小,代表所建立的反演模型精度越高,反之则反演精度低。
6结果分析与讨论
6.1重金属Cd元素特征波段筛选
对土壤原始光谱曲线进行FD、SD、AT、ATFD、ATSD降维变换后(表2),其中SD变换处理效果最好,筛选出在0.01级别相关性显著的特征波段10个,其次为ATSD变换处理,筛选出在0.01级别相关性显著的特征波段6个,ATFD变换处理筛选出的特征波段仅两个,AT处理及原始光谱R相关性最差,未筛选出特征波段。
表1不同光谱变换方式初选特征波段及相关性系数
Figure BDA0003585918560000114
其中,**在0.01级别(双尾),相关性显著;*在0.05级别(双尾),相关性显著。
6.2不同模型预测效果及精度评价
本发明实验采用随机森林模型(RF)、人工神经网络(ANN)、支持向量机模型(SVM)三种方法对土壤重金属含量进行预测。
以室内土壤样品实测Cd含量作为方程因变量,将SD最佳变换处理方式提取的特征波段参数作为方程自变量,进行重金属Cd含量反演预测。
反演结果表明,经过SD变换后,预测效果最好的模型是SD-ANN,其R2达到0.884,模型稳定性好,RMSE=2.679,其次是SD-SVM,R2=0.830>0.8,RMSE=1.382,预测效果较好,SD-RF模型预测效果最差,R2<0.6。
应当注意,本发明的实施方式可以通过硬件、软件或者软件和硬件的结合来实现。硬件部分可以利用专用逻辑来实现;软件部分可以存储在存储器中,由适当的指令执行系统,例如微处理器或者专用设计硬件来执行。本领域的普通技术人员可以理解上述的设备和方法可以使用计算机可执行指令和/或包含在处理器控制代码中来实现,例如在诸如磁盘、CD或DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本发明的设备及其模块可以由诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现,也可以用由各种类型的处理器执行的软件实现,也可以由上述硬件电路和软件的结合例如固件来实现。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,都应涵盖在本发明的保护范围之内。

Claims (10)

1.一种土壤重金属Cd含量的反演方法,其特征在于,所述土壤重金属Cd含量的反演方法,包括:
步骤一,采集土壤样品,制备正、副样品各一份;
步骤二,使用X射线荧光分析仪测定样品重金属Cd元素的实际含量,利用ASDFieldSpec 3光谱仪及配套的软件获取Cd元素的光谱信息;
步骤三,对原始波谱数据进行降维处理,筛选特征波段,利用随机森林、人工神经网络、支持向量机模型进行Cd元素的含量反演,建立基于高光谱特征波段的Cd元素含量反演方法体系。
2.如权利要求1所述的土壤重金属Cd含量反演方法,其特征在于,所述步骤二中,X射线荧光分析仪为OLYMUPS DELTA手持式X射线荧光分析仪;高光谱数据采集使用的是ASDFieldSpec 3光谱仪及配套的软件;
使用ASD FieldSpec 3光谱仪及配套软件获取土壤光谱信息,具体过程为:
对土壤样品进行相关前期处理后,在黑暗情况下利用专用样品杯进行光谱采集,以避免外界光线因素的干扰;
利用经过白板校正的ASD FieldSpec 3光谱仪进行反射光谱测量;为了保证数据的代表性,每个样本采集5次光谱数据,并对光谱进行均值处理,去除异常值,以此结果作为样品的实际反射光谱;
所述ASD FieldSpec 3光谱仪波长范围为350-2500nm,其中在350-1000nm波段的采样间隔为1.4nm、光谱分辨为3nm,1000-2500nm波段的采样点间隔为2nm、光谱分辨率为10nm。
3.如权利要求1所述的土壤重金属Cd含量的反演方法,其特征在于,所述步骤三中,对原始光谱进行降维处理的具体过程为:利用ViewSpecPro软件中的Process功能对土壤原始光谱曲线进行数据统计及变换,选取一阶微分(FD)、二阶微分(SD)、光谱倒数的对数(AT)、光谱倒数的对数一阶微分(ATFD)、光谱倒数的对数二阶微分(ATSD)这5种方法对所测定的光谱数据进行变换处理。
4.如权利要求1所述的土壤重金属Cd含量的反演方法,其特征在于,所述步骤三中,筛选特征波段具体过程为:所测土壤光谱曲线波长范围为350-2500nm,利用SPSS 26.0软件进行特征波段的选择,筛选出对建模贡献大的波段作为建立反演模型最佳变量。
5.如权利要求1所述的土壤重金属Cd含量的反演方法,其特征在于,所述步骤三中,随机森林模型(RF)为结合多棵决策树的一种集成学习方法,有效应用在回归分析中;人工神经网络(ANN)为一种由许多节点构成的运算模型,有多种连接方式,具有适应性信息处理能力;支持向量机模型(SVM)根据有限样本信息,以减少训练数据复杂度,得到模型的最优的支持向量的数目,用于土壤环境评价中的非线性分类情况。
6.如权利要求1所述的土壤重金属Cd含量反演方法,其特征在于,所述步骤二中,重金属含量预测具体过程为:实验模型的建立过程在IBM SPSS Modeler Subscription中实现,先将X射线荧光分析仪实测含量与筛选出的特征波段数据读入SPSS Modeler中,在类型type处选择含量作为目标;
在软件工作区构建并操纵数据流data streams:经过过滤器模块filter,然后选择不同类型的预测方法,完成模型的构建,运行该数据流data stream,进行土壤重金属Cd含量的反演,最后对预测结果进行分析。
7.如权利要求1所述的土壤重金属Cd含量的反演方法,其特征在于,所述步骤三中,评价模型预测精度和效果,具体过程为:采用决定系数R2和均方根误差RMSE来评价模型的预测精度和效果,公式为:
Figure FDA0003585918550000021
Figure FDA0003585918550000022
其中yi为样品重金属Cd实测含量值,
Figure FDA0003585918550000023
为实测平均值,
Figure FDA0003585918550000024
为预测含量值,R2指示模型的稳定性;若R2>0.8,说明模型预测效果良好,R2越大且接近1,表示模型的拟合程度高、效果佳;若0.7<R2<0.8,说明模型预测效果一般;若R2<0.7,说明该模型预测效果差;RMSE指示模型预测的精度,RMSE越小,则说明预测值与实测值的误差越小,代表所建立的反演模型精度越高,反之则反演精度低。
8.一种如权利要求1-7任一项所述的土壤重金属Cd含量的反演方法使用的样品杯,其特征在于,所述样品杯包括压环、内压片、外压片、套管、检测薄膜、外延边、底座、环形承台、扣盖;将检测套管套于检测薄膜之外,检测薄膜的上开口端使用压环固定于压环内压边和套管内壁之间,检测薄膜封口端和套管插入底座小口端至环形承台,检测薄膜封闭端外延边夹设于套管和底座小口端之间,扣盖盖于压环上。
9.一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行权利要求1~7任意一项所述土壤重金属Cd含量反演方法的步骤。
10.一种实施权利要求1~7任意一项所述土壤重金属Cd含量反演方法的土壤重金属Cd含量反演系统,其特征在于,所述土壤重金属Cd含量反演系统包括:
土壤光谱信息模块,用于采集、处理和存储土壤样品的光谱信息;
重金属含量预测模块,用于对原始光谱进行降维变换处理,筛选特征波段,采用随机森林、人工神经网络、支持向量机模型进行重金属含量预测;
模型预测评价模块,用于根据决定系数和均方根误差评价模型预测精度和效果。
CN202210355384.3A 2022-04-08 2022-04-08 土壤重金属Cd含量反演方法、系统、介质、计算机设备 Pending CN114660105A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210355384.3A CN114660105A (zh) 2022-04-08 2022-04-08 土壤重金属Cd含量反演方法、系统、介质、计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210355384.3A CN114660105A (zh) 2022-04-08 2022-04-08 土壤重金属Cd含量反演方法、系统、介质、计算机设备

Publications (1)

Publication Number Publication Date
CN114660105A true CN114660105A (zh) 2022-06-24

Family

ID=82035462

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210355384.3A Pending CN114660105A (zh) 2022-04-08 2022-04-08 土壤重金属Cd含量反演方法、系统、介质、计算机设备

Country Status (1)

Country Link
CN (1) CN114660105A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114813709A (zh) * 2022-06-28 2022-07-29 华谱智能科技(天津)有限公司 土壤成分检测方法、设备及系统
CN116297304A (zh) * 2023-03-10 2023-06-23 广东建研环境监测股份有限公司 基于化工环境的土壤重金属检测方法及装置
CN117309780A (zh) * 2023-11-27 2023-12-29 核工业北京地质研究院 土壤锗元素含量的确定方法
NL2033033B1 (en) * 2022-09-15 2024-03-22 Univ Tarim Computer-based method for detection of available nutrient content in jujube orchard soil

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006317153A (ja) * 2005-05-10 2006-11-24 Rigaku Industrial Co 蛍光x線分析用試料保持具ならびにそれを用いる蛍光x線分析方法および装置
CN105115906A (zh) * 2015-08-13 2015-12-02 成都理工大学 基于图像自身特征的绢云母化蚀变信息提取方法
CN111220554A (zh) * 2019-12-31 2020-06-02 安徽珍昊环保科技有限公司 一种土壤重金属环境风险预测模型的构建方法和装置
CN114018833A (zh) * 2021-11-07 2022-02-08 福建师范大学 基于高光谱遥感技术估算土壤重金属含量的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006317153A (ja) * 2005-05-10 2006-11-24 Rigaku Industrial Co 蛍光x線分析用試料保持具ならびにそれを用いる蛍光x線分析方法および装置
CN105115906A (zh) * 2015-08-13 2015-12-02 成都理工大学 基于图像自身特征的绢云母化蚀变信息提取方法
CN111220554A (zh) * 2019-12-31 2020-06-02 安徽珍昊环保科技有限公司 一种土壤重金属环境风险预测模型的构建方法和装置
CN114018833A (zh) * 2021-11-07 2022-02-08 福建师范大学 基于高光谱遥感技术估算土壤重金属含量的方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
LI WANG 等: "Exploring the potential of multispectral satellite images for estimating the contents of cadmium and lead in cropland", pages 130 - 160 *
曹发生 等: "基于可见光/近红外反射光谱的沉积型稀土矿La元素含量无损检测", pages 292 - 300 *
李花粉 等: "《地球信息科学与技术专业实验教程》", 中国农业大学出版社, pages: 359 - 89 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114813709A (zh) * 2022-06-28 2022-07-29 华谱智能科技(天津)有限公司 土壤成分检测方法、设备及系统
NL2033033B1 (en) * 2022-09-15 2024-03-22 Univ Tarim Computer-based method for detection of available nutrient content in jujube orchard soil
CN116297304A (zh) * 2023-03-10 2023-06-23 广东建研环境监测股份有限公司 基于化工环境的土壤重金属检测方法及装置
CN116297304B (zh) * 2023-03-10 2024-01-26 广东建研环境监测股份有限公司 基于化工环境的土壤重金属检测方法及装置
CN117309780A (zh) * 2023-11-27 2023-12-29 核工业北京地质研究院 土壤锗元素含量的确定方法
CN117309780B (zh) * 2023-11-27 2024-02-06 核工业北京地质研究院 土壤锗元素含量的确定方法

Similar Documents

Publication Publication Date Title
CN114660105A (zh) 土壤重金属Cd含量反演方法、系统、介质、计算机设备
CN108362662B (zh) 近红外光谱相似度计算方法、装置和物质定性分析系统
US7248370B2 (en) Method to reduce background noise in a spectrum
CN105486655A (zh) 基于红外光谱智能鉴定模型的土壤有机质快速检测方法
CN109669023A (zh) 一种基于多传感器融合的土壤属性预测方法
CN111488926A (zh) 一种基于优化模型的土壤有机质测定方法
CN106770058A (zh) 基于红外光谱的土壤硝态氮的快速专用装置及其使用方法
Fan et al. Direct calibration transfer to principal components via canonical correlation analysis
Gholizadeh et al. Models for estimating the physical properties of paddy soil using visible and near infrared reflectance spectroscopy
WO2020248961A1 (zh) 一种无参考值的光谱波数选择方法
CN111965167A (zh) 预测固体废弃物元素组成及热值的方法及装置
CN111693487A (zh) 基于遗传算法和极限学习机的水果糖度检测方法及系统
CN102042967B (zh) 一种基于近红外光谱技术的葡萄糖水溶液快速识别方法
Qiao et al. Near-infrared spectroscopy technology for soil nutrients detection based on LS-SVM
Ortiz-Herrero et al. Multivariate (O) PLS regression methods in forensic dating
CN113655027A (zh) 一种近红外快速检测植物中单宁含量的方法
NL2034211B1 (en) Method and system for quantitatively identifying multi-pollution sources of mixed water body
CN102262055B (zh) 一种测定聚丙烯酰胺类物质中丙烯酰胺单体残留量的方法
Nkansah et al. Determination of concentration of ACQ wood preservative components by UV-Visible spectroscopy coupled with multivariate data analysis
CN110887798A (zh) 基于极端随机树的非线性全光谱水体浊度定量分析方法
CN113295674B (zh) 一种基于s变换的激光诱导击穿光谱特征非线性处理方法
CN114002203A (zh) 一种基于拉曼光谱分析木质成分含量的方法及装置
CN109145887B (zh) 一种基于光谱潜变量混淆判别的阈值分析方法
CN106970042A (zh) 一种卡拉胶杂质、水分含量检测方法
Canonaco et al. SoFi, an Igor based interface for the efficient use of the generalized multilinear engine (ME-2) for source apportionment: application to aerosol mass spectrometer data.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination