CN117219182A - 基于原位光谱和机器学习模型的有机碳组分快速预测方法 - Google Patents
基于原位光谱和机器学习模型的有机碳组分快速预测方法 Download PDFInfo
- Publication number
- CN117219182A CN117219182A CN202310722504.3A CN202310722504A CN117219182A CN 117219182 A CN117219182 A CN 117219182A CN 202310722504 A CN202310722504 A CN 202310722504A CN 117219182 A CN117219182 A CN 117219182A
- Authority
- CN
- China
- Prior art keywords
- organic carbon
- soil
- data
- model
- machine learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 title claims abstract description 113
- 229910052799 carbon Inorganic materials 0.000 title claims abstract description 113
- 238000001228 spectrum Methods 0.000 title claims abstract description 55
- 238000000034 method Methods 0.000 title claims abstract description 38
- 238000010801 machine learning Methods 0.000 title claims abstract description 20
- 238000011065 in-situ storage Methods 0.000 title claims abstract description 19
- 239000002689 soil Substances 0.000 claims abstract description 105
- 238000012549 training Methods 0.000 claims abstract description 22
- 238000012795 verification Methods 0.000 claims abstract description 13
- 238000005070 sampling Methods 0.000 claims abstract description 6
- 229910052500 inorganic mineral Inorganic materials 0.000 claims description 24
- 239000011707 mineral Substances 0.000 claims description 24
- 238000005259 measurement Methods 0.000 claims description 14
- 230000003595 spectral effect Effects 0.000 claims description 9
- 238000002310 reflectometry Methods 0.000 claims description 8
- 238000009499 grossing Methods 0.000 claims description 7
- VEXZGXHMUGYJMC-UHFFFAOYSA-N Hydrochloric acid Chemical compound Cl VEXZGXHMUGYJMC-UHFFFAOYSA-N 0.000 claims description 6
- 239000000203 mixture Substances 0.000 claims description 6
- 239000002245 particle Substances 0.000 claims description 5
- 238000007873 sieving Methods 0.000 claims description 5
- ZCDOYSPFYFSLEW-UHFFFAOYSA-N chromate(2-) Chemical compound [O-][Cr]([O-])(=O)=O ZCDOYSPFYFSLEW-UHFFFAOYSA-N 0.000 claims description 4
- 238000007781 pre-processing Methods 0.000 claims description 4
- 238000007704 wet chemistry method Methods 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000001035 drying Methods 0.000 claims description 3
- 238000011084 recovery Methods 0.000 claims description 3
- GCLGEJMYGQKIIW-UHFFFAOYSA-H sodium hexametaphosphate Chemical compound [Na]OP1(=O)OP(=O)(O[Na])OP(=O)(O[Na])OP(=O)(O[Na])OP(=O)(O[Na])OP(=O)(O[Na])O1 GCLGEJMYGQKIIW-UHFFFAOYSA-H 0.000 claims description 3
- 235000019982 sodium hexametaphosphate Nutrition 0.000 claims description 3
- 239000001577 tetrasodium phosphonato phosphate Substances 0.000 claims description 3
- 238000009966 trimming Methods 0.000 claims description 3
- 238000010200 validation analysis Methods 0.000 claims description 2
- 238000004611 spectroscopical analysis Methods 0.000 claims 7
- 230000008859 change Effects 0.000 abstract description 4
- 238000012544 monitoring process Methods 0.000 abstract description 2
- 239000000523 sample Substances 0.000 description 28
- 239000010410 layer Substances 0.000 description 9
- 238000003066 decision tree Methods 0.000 description 5
- 238000011160 research Methods 0.000 description 5
- 238000012271 agricultural production Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 235000021049 nutrient content Nutrition 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 238000011282 treatment Methods 0.000 description 2
- 239000002253 acid Substances 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004177 carbon cycle Methods 0.000 description 1
- 238000009614 chemical analysis method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000005431 greenhouse gas Substances 0.000 description 1
- 238000000227 grinding Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000002329 infrared spectrum Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 239000003041 laboratory chemical Substances 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000002344 surface layer Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 235000013311 vegetables Nutrition 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Landscapes
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本发明公开了一种基于原位光谱和机器学习模型的有机碳组分快速预测方法,涉及土壤碳组分含量预测领域。方法包括:采集土壤剖面不同深度土层的土壤样品,获取土壤光谱数据;测定土壤样本的POC和MAOC数据;将POC和MAOC数据与经预处理后的土壤光谱数据一一对应,按照采样深度进行分类,按比例随机抽取样本,将其分为模型训练集和独立验证集;利用训练集数据,分别训练预测POC和MAOC数据的Cubist模型,直至得到预测精度达标的模型;利用Cubist模型结合土壤光谱数据,预测待测样本的POC和MAOC数据。本发明能够快速准确地预测土壤剖面有机碳组分的含量,为监测气候变化和土地利用变化背景下土壤碳及其组分变化提供了新手段。
Description
技术领域
本发明涉及土壤碳组分含量预测领域,尤其是涉及一种基于原位光谱和机器学习模型的有机碳组分快速预测方法。
背景技术
土壤有机碳是全球碳循环的关键组成部分,是反应土壤质量和健康的重要指标之一。颗粒态有机碳(POC)和矿物结合态有机碳(MAOC)是土壤有机碳的重要组成部分。POC主要由未分解或部分分解植物碎片组成,一般养分含量较低,通常粒径大于53μm;MAOC主要由微生物和植物起源的小分子量物质组成,相对养分含量较高,其粒径通常小于53μm。通过测量土壤剖面不同深度的POC和MAOC含量,可以更准确地了解土壤有机碳的来源、转化和分配,从而指导农业生产和土地管理,并为全球碳循环和气候变化的研究提供重要数据支撑。
采用传统理化实验方法可以精确地测量土壤中的POC和MAOC含量,但在处理大量土壤样本时有成本高、耗时、耗力的缺点。相比于理化实验,土壤光谱易于采集、成本低、速度快。有研究表明:350~2500nm波段的土壤光谱可以很好的预测土壤有机碳组分含量。
目前的研究主要集中于土壤表层(如0~20cm土层),利用光谱数据预测更深层土壤有机碳组分的能力需要继续探索。随着土壤深度的增加,土壤的物理、化学和生物学特性都会发生相应的变化,POC、MAOC含量也会随之发生改变,需要全面了解土壤剖面不同深度土壤的状况。同时,现如今光谱数据的主要预测对象是土壤有机碳含量,对此有强大的理论支撑以及精度保证。然而,有机碳不是一个单一的化合物,而是由多种化合物组成的复杂混合物。因此,研究有机碳组分比研究总有机碳含量更为重要,可以更好地了解土壤中有机碳的来源、性质和功能。利用光谱技术对土壤有机碳组分进行大面积快速预测,可以提高土壤有机碳组分研究的效率和精度。通过快速获取土壤有机碳组分数据,可以更好地了解土壤有机质对农业生产和生态系统的影响,从而为了解土壤质量、环境状况以及研究土壤碳循环和温室气体排放等,提供便捷的数据获取途径。
Cubist模型通过构建一系列决策树来建立预测模型。它的特点是有较高的鲁棒性和较高的精度。由于光谱数据通常存在很多的噪声干扰,具有一定的模糊性和不确定性,而此模型可以有效的处理这些问题;并且光谱数据通常具有较高的维度和复杂性,传统的回归方法难以很好地处理,Cubist通过构建一系列决策树来建立预测模型,从而能够更好地捕捉数据中的特征和关系,提高光谱预测有机碳的精度。
发明内容
本发明的目的在于克服现有技术中的缺陷,并提供一种基于原位光谱和机器学习模型的有机碳组分快速预测方法。
本发明所采用的具体技术方案如下:
本发明提供了一种基于原位光谱和机器学习模型的有机碳组分快速预测方法,具体如下:
S1:采集土壤剖面不同深度土层的土壤样品,利用ASD FieldSpec4可见—近红外光谱仪获取土壤光谱数据;
S2:测定所述土壤样本的颗粒态有机碳和矿物结合态有机碳含量;
S3:将所述土壤光谱数据进行平滑去噪预处理;
S4:将所述颗粒态有机碳和矿物结合态有机碳含量数据与步骤S3中经预处理后的所述土壤光谱数据一一对应,按照采样深度进行分类,按比例随机抽取样本,将其分为模型训练集和独立验证集;
S5:利用所述训练集样本,分别训练预测颗粒态有机碳和矿物结合态有机碳含量的Cubist模型,并且用独立验证集进行验证,直至得到预测精度达标的模型;
S6:利用步骤S5中训练好的Cubist模型,结合获取的待测样本的土壤光谱数据,预测待测样本的颗粒态有机碳和矿物结合态有机碳含量。
作为优选,所述步骤S1中,ASD FieldSpec4可见—近红外光谱仪的光谱范围为350~2500nm,分辨率为1nm,在测量时尽量减少杂散光造成的测量误差,并且每次测量前,使用反射率为99%的白板作为白色参考。
作为优选,所述步骤S2具体如下:
将土壤样本干燥后过2mm筛,之后利用5mol/L浓盐酸去除土壤样本中的无机碳,接着利用六偏磷酸钠对土壤样本分组并且过53μm筛;留在筛网上面的为颗粒态有机碳,透过筛网的为矿物结合态有机碳;随后利用中铬酸盐湿化学法,分别测量样本中的有机碳含量、颗粒态有机碳含量和矿物结合态有机碳含量。
作为优选,所述步骤S2中测得的数据,需满足碳回收率在85%以上,否则重新测量。
作为优选,所述步骤S3中,预处理操作具体如下:
首先对原始土壤光谱数据进行修剪,以去除高信噪比的波长范围,保留的光谱数据波长范围为500~2450nm波段;随后对修剪后的光谱数据,通过Savitzky–Golay方法进行窗口平滑去噪,每个窗口的具体计算公式如下:
其中,是经过平滑后得到的波段对应的反射率(或吸收率);k是半窗口长度(即整个窗口长度的一半);h是相对于窗口中心波段的偏移量,当h为负整数时,表示数据点在窗口波段中心点的左侧;当h为正整数时,表示数据点在窗口波动中心点的右侧;c是预先计算的该窗口内反射率(或吸收率)权重系数,其取决于选择的多项式阶数和次数。
进一步的,对平滑去噪后的光谱按照5nm为间隔单位进行重采样。
作为优选,所述步骤S4中,根据不同的土层深度,随机抽取75%进入训练集,余下25%进入独立验证集。
作为优选,所述步骤S5中,Cubist模型的数学形式如下:
y=a0+a1*x1+a2*x2+…+ai*xi
其中,y是模型的预测输出,x1…xi是输入特征,a0…ai是模型的系数。
作为优选,所述步骤S5的预测精度判断中,以验证集数据为输入,分别预测颗粒态有机碳和矿物结合态有机碳,将所得预测值与步骤S2所得观测值进行对比,评价Cubist模型对颗粒态有机碳和矿物结合态有机碳的预测精度。
进一步的,所述预测精度采用方根误差RMSE表征,其中RMSE越低,说明模型预测精度越好,其具体公式如下:
其中,n是样本个数;yi是目标变量观测值;是模型预测值。
本发明相对于现有技术而言,具有以下有益效果:
根据土壤光谱预测有机碳的优点,本发明能够快速准确地预测土壤剖面有机碳组分含量。相比传统的实验室化学分析方法,该方法大大降低了试验所需的时间和金钱成本。通过遥感光谱技术,只需在相对较短的时间内获取大范围的数据,而不需要采集和处理大量的土壤样品,从而提高了测量效率,节约了测量成本。
此外,该方法操作方便,无需复杂的实验室设备,技术门槛较低。只需通过光谱仪或遥感传感器获取土壤的光谱数据,然后利用相应的数据处理和分析算法,即可推断土壤剖面中有机碳组分的含量。这使得该方法适用于大规模的土壤有机碳监测和调查研究。
附图说明
图1颗粒态有机碳(a)和矿物结合态有机碳(b)预测精度散点图。
具体实施方式
下面结合附图和具体实施方式对本发明做进一步阐述和说明。本发明中各个实施方式的技术特征在没有相互冲突的前提下,均可进行相应组合。
本发明提供了一种基于原位光谱和机器学习模型的有机碳组分快速预测方法,该方法具体如下:
S1:采集土壤剖面不同深度土层的土壤样品,利用ASD FieldSpec4可见—近红外光谱仪获取土壤光谱数据。
在实际应用时,可以在野外直接利用ASD FieldSpec4可见—近红外光谱仪获取土壤光谱数据。ASD FieldSpec4可见—近红外光谱仪的光谱范围优选为350~2500nm,分辨率为1nm,在测量时尽量减少杂散光造成的测量误差,并且每次测量前,使用反射率为99%的白板作为白色参考。
S2:测定所述土壤样本的颗粒态有机碳和矿物结合态有机碳数据。
在实际应用时,需要将采集的土壤样本带回实验室,进行土样干燥、研磨和过筛,并测定土壤有机碳组分(POC、MAOC)数据。具体的,步骤如下:
将土壤样本干燥后过2mm筛,之后利用5mol/L浓盐酸去除土壤样本中的无机碳,以便后续测量样本中的有机碳含量(SOC)。接着利用六偏磷酸钠对土壤样本分组(即分组成POC和MAOC)并且过53μm筛;留在筛网上面的为颗粒态有机碳(POC),透过筛网的为矿物结合态有机碳(MAOC);随后利用中铬酸盐湿化学法,分别测量样本中的有机碳含量、颗粒态有机碳含量和矿物结合态有机碳含量。
在该步骤中测得的数据,需满足碳回收率在85%以上,即POC与MAOC含量之和占总SOC含量的85%及以上,表明该样本得到的碳组分含量数据可用,否则利用新样品重新测量。
S3:将步骤S1得到的土壤光谱数据进行预处理,去除光谱中干扰波段,并将剩余波段进行平滑去噪等处理。
在实际应用时,该步骤具体如下:
首先对原始土壤光谱数据进行修剪,以去除高信噪比的波长范围,保留的光谱数据波长范围为500~2450nm波段;随后对修剪后的光谱数据,通过Savitzky–Golay方法进行窗口平滑去噪,每个窗口的具体计算公式如下:
其中,是经过平滑后得到的波段对应的反射率(或吸收率);k是半窗口长度(即整个窗口长度的一半);h是相对于窗口中心波段的偏移量,当h为负整数时,表示数据点在窗口波段中心点的左侧;当h为正整数时,表示数据点在窗口波段中心点的右侧;c是预先计算的该窗口内反射率(或吸收率)权重系数,其取决于选择的多项式阶数和次数。
此外,还需要对平滑去噪后的光谱按照5nm为间隔单位进行重采样。
S4:将步骤S2中的颗粒态有机碳和矿物结合态有机碳数据与步骤S3中经预处理后的土壤光谱数据一一对应,按照采样深度进行分类,按比例随机抽取样本,将其分为模型训练集和独立验证集。
在实际应用时,可以每层随机抽取75%进入训练集,余下25%进入独立验证集。
S5:利用所述训练集数据,分别训练预测颗粒态有机碳和矿物结合态有机碳数据的Cubist模型,直至得到预测精度达标的模型。
本发明所选用的机器学习模型为Cubist模型,Cubist模型是一种基于决策树的机器学习算法,用于解决回归和分类问题。Cubist模型通过构建一系列决策树来建立预测模型,每个决策树都是基于对数据集的划分而构建的。与传统决策树不同的是,Cubist模型使用了一种称为“模糊逻辑”的技术来处理数据中的不确定性和模糊性,从而提高了模型的准确性和鲁棒性。模型一般形式如下:
y=a0+a1*x1+a2*x2+…+ai*xi
其中,y是模型的预测输出,x1…xi是输入特征,a0…ai是模型的系数。本步骤的预测精度判断中,以验证集数据为输入,分别预测颗粒态有机碳和矿物结合态有机碳,将所得预测值与步骤S2所得观测值进行对比,评价Cubist模型对颗粒态有机碳和矿物结合态有机碳的预测精度。
在实际应用时,预测精度采用方根误差RMSE表征,其中RMSE越低,说明模型预测精度越好,其具体公式如下:
其中,n是样本个数;yi是目标变量观测值;是模型预测值。
S6:利用步骤S5中训练好的Cubist模型,结合获取的待测样本的土壤光谱数据,预测待测样本的颗粒态有机碳和矿物结合态有机碳数据。
下面将通过实施例对本发明的方法和效果进行具体说明。
实施例
本实施例中,选取中国土壤剖面的原位可见近红外光谱进行建模,最终得到土壤有机碳组分快速预测模型。
本实施例的基于原位光谱和机器学习模型的有机碳组分快速预测方法,包括以下步骤:
步骤(1):采集0~200cm的土壤样本,采样间隔为0~10cm、10~20cm、20~30cm、30~50cm、50~100cm、100~150cm、150~200cm共七层。
步骤(2):将取得的土壤在野外直接利用ASD FieldSpec4可见—近红外光谱仪和高强度接触式探头(High Intensity Contact Probe,Analytical Spectral DevicesInc.,Boulder,Colorado)测量每个土壤剖面各层样本的光谱数据,ASD FieldSpec4可见—近红外光谱仪的光谱范围为350~2500nm,分辨率为1nm,在每次测量前,还使用反射率为99%的光谱仪作为白色参考。每层测3次,光谱仪每次测得10组光谱数据,将每次测得的光谱计算算术平均。
步骤(3):对采集的土壤样本进行土样干燥、研磨和过筛,在实验室使用酸洗法将土壤中的无机碳去除,再通过中铬酸盐湿化学法测量样品中的有机碳组分含量,从而为土壤有机碳组分(POC、MAOC)预测提供数据支持。
步骤(4):对步骤(2)得到的土壤光谱数据进行预处理,去除光谱中干扰波段,并将剩余波段进行平滑去噪等处理;
步骤(5):将步骤(3)得到的POC和MAOC数据与步骤(4)得到的平滑去噪的土壤光谱数据一一对应,按照采样深度进行分类,按比例随机抽取样本,将其分为模型训练集和独立验证集;
步骤(6):利用训练集对Cubist模型训练,模型根据训练集中的MAOC和土壤剖面光谱数据之间的相关性。
步骤(7):利用经过训练得到的Cubist模型,输入验证集数据得到模型预测的结果,利用其与土壤样本测量值进行对比,评价Cubist模型的预测精度;精度达标后可以用训练后的Cubist模型进行土壤碳组分预测。模型一般形式如下:
y=a0+a1*x1+a2*x2+…+ai*xi
其中,y是模型的预测输出,x1…xi是输入特征,a0…ai是模型的系数。
本实施例通过R2和RMSE来评价独立验证集的预测精度评价,结果如图1所示,从图中可以看出,独立验证集POC的RMSE为1.77,MAOC的RMSE为1.47,具有较好的预测精度。图1即为独立验证集POC和MAOC预测精度散点图。
也就是说,该模型测精度满足要求,可用于土壤有机碳组分含量预测。预测时,也采用与步骤(2)、(4)、(5)相同的方法,采集每个土壤剖面各个土层深度的样本的初始光谱,然后进行相同的预处理后输入Cubist模型,得到其预测土壤有机碳组分含量。
以上所述的实施例只是本发明的一种较佳的方案,然其并非用以限制本发明。有关技术领域的普通技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型。因此凡采取等同替换或等效变换的方式所获得的技术方案,均落在本发明的保护范围内。
Claims (10)
1.一种基于原位光谱和机器学习模型的有机碳组分快速预测方法,其特征在于,具体如下:
S1:采集土壤剖面不同深度土层的土壤样品,利用ASD FieldSpec4可见—近红外光谱仪获取土壤光谱数据;
S2:测定所述土壤样本的颗粒态有机碳和矿物结合态有机碳含量;
S3:将所述土壤光谱数据进行平滑去噪预处理;
S4:将所述颗粒态有机碳和矿物结合态有机碳含量数据与步骤S3中经预处理后的所述土壤光谱数据一一对应,按照采样深度进行分类,按比例随机抽取样本,将其分为模型训练集和独立验证集;
S5:利用所述训练集样本,分别训练预测颗粒态有机碳和矿物结合态有机碳含量的Cubist模型,并且用所述独立验证集进行验证,直至得到预测精度达标的模型;
S6:利用步骤S5中训练好的Cubist模型,结合获取的待测样本的土壤光谱数据,预测待测样本的颗粒态有机碳和矿物结合态有机碳含量。
2.根据权利要求1所述的基于原位光谱和机器学习模型的有机碳组分快速预测方法,其特征在于,所述步骤S1中,ASD FieldSpec4可见—近红外光谱仪的光谱范围为350~2500nm,分辨率为1nm,在测量时尽量减少杂散光造成的测量误差,并且每次测量前,使用反射率为99%的白板作为白色参考。
3.根据权利要求1所述的基于原位光谱和机器学习模型的有机碳组分快速预测方法,其特征在于,所述步骤S2具体如下:
将土壤样本干燥后过2mm筛,之后利用5mol/L浓盐酸去除土壤样本中的无机碳,接着利用六偏磷酸钠对土壤样本分组并且过53μm筛;留在筛网上面的为颗粒态有机碳,透过筛网的为矿物结合态有机碳;随后利用中铬酸盐湿化学法,分别测量样本中的有机碳含量、颗粒态有机碳含量和矿物结合态有机碳含量。
4.根据权利要求1所述的基于原位光谱和机器学习模型的有机碳组分快速预测方法,其特征在于,所述步骤S2中测得的数据,需满足碳回收率在85%以上,否则重新测量。
5.根据权利要求1所述的基于原位光谱和机器学习模型的有机碳组分快速预测方法,其特征在于,所述步骤S3中,预处理操作具体如下:
首先对原始土壤光谱数据进行修剪,以去除高信噪比的波长范围,保留的光谱数据波长范围为500~2450nm波段;随后对修剪后的光谱数据,通过Savitzky-Golay方法进行窗口平滑去噪,每个窗口的具体计算公式如下:
其中,xj*是经过平滑后得到的波段对应的反射率(或吸收率);k是半窗口长度;h是相对于窗口中心波段的偏移量;当h为负整数时,表示数据点在窗口波段中心点的左侧;当h为正整数时,表示数据点在窗口波动中心点的右侧;c是预先计算的该窗口内反射率或吸收率权重系数,其取决于选择的多项式阶数和次数。
6.根据权利要求5所述的基于原位光谱和机器学习模型的有机碳组分快速预测方法,其特征在于,对平滑去噪后的光谱按照5nm为间隔单位进行重采样。
7.根据权利要求1所述的基于原位光谱和机器学习模型的有机碳组分快速预测方法,其特征在于,所述步骤S4中,根据不同深度的土层,每层随机抽取75%进入训练集,余下25%进入独立验证集。
8.根据权利要求1所述的基于原位光谱和机器学习模型的有机碳组分快速预测方法,其特征在于,所述步骤S5中,Cubist模型的数学形式如下:
y=a0+a1*x1+a2*x2+…+ai*xi
其中,y是模型的预测输出,x1…xi是输入特征,a0…ai是模型的系数。
9.根据权利要求1所述的基于原位光谱和机器学习模型的有机碳组分快速预测方法,其特征在于,所述步骤S5的预测精度判断中,以验证集数据为输入,分别预测颗粒态有机碳和矿物结合态有机碳,将所得预测值与步骤S2所得观测值进行对比,评价Cubist模型对颗粒态有机碳和矿物结合态有机碳的预测精度。
10.根据权利要求9所述的基于原位光谱和机器学习模型的有机碳组分快速预测方法,其特征在于,所述预测精度采用方根误差RMSE表征,其中RMSE越低,说明模型预测精度越好,其具体公式如下:
其中,n是样本个数;yi是目标变量观测值;是模型预测值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310722504.3A CN117219182A (zh) | 2023-06-19 | 2023-06-19 | 基于原位光谱和机器学习模型的有机碳组分快速预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310722504.3A CN117219182A (zh) | 2023-06-19 | 2023-06-19 | 基于原位光谱和机器学习模型的有机碳组分快速预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117219182A true CN117219182A (zh) | 2023-12-12 |
Family
ID=89049876
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310722504.3A Pending CN117219182A (zh) | 2023-06-19 | 2023-06-19 | 基于原位光谱和机器学习模型的有机碳组分快速预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117219182A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110531054A (zh) * | 2019-09-29 | 2019-12-03 | 河南省农业科学院农业经济与信息研究所 | 基于Bootstrap抽样的土壤有机碳预测不确定性估测方法 |
CN113436153A (zh) * | 2021-06-11 | 2021-09-24 | 中国科学院南京土壤研究所 | 一种基于高光谱成像和支持向量机技术的原状土壤剖面碳组分预测方法 |
CN113469586A (zh) * | 2021-09-02 | 2021-10-01 | 中国农业大学 | 土地系统状态的评估方法、装置以及存储介质 |
CN114486786A (zh) * | 2022-03-03 | 2022-05-13 | 上海园林绿化建设有限公司 | 土壤有机质测定方法及测定系统 |
CN114740180A (zh) * | 2022-04-07 | 2022-07-12 | 中山大学 | 基于多源遥感数据的土壤有机碳估算方法及装置 |
CN115758270A (zh) * | 2022-11-24 | 2023-03-07 | 浙江大学杭州国际科创中心 | 基于随机森林与环境变量的土壤矿物结合态有机碳预测方法及装置 |
-
2023
- 2023-06-19 CN CN202310722504.3A patent/CN117219182A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110531054A (zh) * | 2019-09-29 | 2019-12-03 | 河南省农业科学院农业经济与信息研究所 | 基于Bootstrap抽样的土壤有机碳预测不确定性估测方法 |
CN113436153A (zh) * | 2021-06-11 | 2021-09-24 | 中国科学院南京土壤研究所 | 一种基于高光谱成像和支持向量机技术的原状土壤剖面碳组分预测方法 |
CN113469586A (zh) * | 2021-09-02 | 2021-10-01 | 中国农业大学 | 土地系统状态的评估方法、装置以及存储介质 |
CN114486786A (zh) * | 2022-03-03 | 2022-05-13 | 上海园林绿化建设有限公司 | 土壤有机质测定方法及测定系统 |
CN114740180A (zh) * | 2022-04-07 | 2022-07-12 | 中山大学 | 基于多源遥感数据的土壤有机碳估算方法及装置 |
CN115758270A (zh) * | 2022-11-24 | 2023-03-07 | 浙江大学杭州国际科创中心 | 基于随机森林与环境变量的土壤矿物结合态有机碳预测方法及装置 |
Non-Patent Citations (2)
Title |
---|
史杨;王儒敬;汪玉冰;: "基于卷积神经网络和近红外光谱的土壤有机碳预测模型", 计算机应用与软件, no. 10, 12 October 2018 (2018-10-12) * |
周银等: "星地多源数据的区域土壤有机质数字制图", 《遥感学报》, 23 May 2015 (2015-05-23), pages 999 - 1001 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Hong et al. | Rapid identification of soil organic matter level via visible and near-infrared spectroscopy: Effects of two-dimensional correlation coefficient and extreme learning machine | |
Hong et al. | Estimating lead and zinc concentrations in peri-urban agricultural soils through reflectance spectroscopy: Effects of fractional-order derivative and random forest | |
Jin et al. | Comparison of different satellite bands and vegetation indices for estimation of soil organic matter based on simulated spectral configuration | |
Bao et al. | Vis-SWIR spectral prediction model for soil organic matter with different grouping strategies | |
Shi et al. | Development of a national VNIR soil-spectral library for soil classification and prediction of organic matter concentrations | |
Guerrero et al. | Current sensor technologies for in situ and on-line measurement of soil nitrogen for variable rate fertilization: A review | |
CN107478580B (zh) | 基于高光谱遥感的土壤重金属含量估算方法及装置 | |
Srivastava et al. | Visible-near infrared reflectance spectroscopy for rapid characterization of salt-affected soil in the Indo-Gangetic Plains of Haryana, India | |
CN111488926B (zh) | 一种基于优化模型的土壤有机质测定方法 | |
dos Santos et al. | Predicting carbon and nitrogen by visible near-infrared (Vis-NIR) and mid-infrared (MIR) spectroscopy in soils of Northeast Brazil | |
Song et al. | Chlorophyll content estimation based on cascade spectral optimizations of interval and wavelength characteristics | |
CN110687053B (zh) | 一种基于高光谱影像的区域有机质含量估算方法和装置 | |
CN103712923A (zh) | 土壤野外原位测量光谱中去除水分影响因素的方法 | |
CN112669915B (zh) | 一种基于神经网络与近红外光谱的梨无损检测方法 | |
Carmon et al. | An advanced analytical approach for spectral-based modelling of soil properties | |
CN110991064A (zh) | 土壤重金属含量反演模型生成方法、系统、存储介质及反演方法 | |
CN102937575B (zh) | 一种基于二次光谱重组的西瓜糖度快速建模方法 | |
CN104596943A (zh) | 一种矿区复垦场地有毒有害元素室内光谱分层测量方法 | |
CN113436153A (zh) | 一种基于高光谱成像和支持向量机技术的原状土壤剖面碳组分预测方法 | |
CN108827909B (zh) | 基于可见近红外光谱与多目标融合的土壤快速分类方法 | |
Chen et al. | Hyperspectral detection of sugar content for sugar-sweetened apples based on sample grouping and SPA feature selecting methods | |
Zhao et al. | Spectral features of Fe and organic carbon in estimating low and moderate concentration of heavy metals in mangrove sediments across different regions and habitat types | |
Liu et al. | Diagnosis of citrus greening using raman spectroscopy-based pattern recognition | |
Wang et al. | Predicting organic matter content, total nitrogen and ph value of lime concretion black soil based on visible and near infrared spectroscopy | |
CN117491293A (zh) | 一种基于高光谱的高陡岸坡碳酸盐岩体溶蚀快速评估方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |