CN113063754A - 一种基于加权环境变量聚类的叶片磷含量检测方法 - Google Patents
一种基于加权环境变量聚类的叶片磷含量检测方法 Download PDFInfo
- Publication number
- CN113063754A CN113063754A CN202110431501.5A CN202110431501A CN113063754A CN 113063754 A CN113063754 A CN 113063754A CN 202110431501 A CN202110431501 A CN 202110431501A CN 113063754 A CN113063754 A CN 113063754A
- Authority
- CN
- China
- Prior art keywords
- phosphorus content
- leaves
- variables
- leaf
- environment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 title claims abstract description 87
- 229910052698 phosphorus Inorganic materials 0.000 title claims abstract description 87
- 239000011574 phosphorus Substances 0.000 title claims abstract description 87
- 238000001514 detection method Methods 0.000 title abstract description 7
- 238000001228 spectrum Methods 0.000 claims abstract description 47
- 230000007613 environmental effect Effects 0.000 claims abstract description 44
- 238000000034 method Methods 0.000 claims abstract description 38
- 238000012795 verification Methods 0.000 claims abstract description 12
- 238000012549 training Methods 0.000 claims abstract description 9
- 238000012216 screening Methods 0.000 claims abstract description 8
- 238000005259 measurement Methods 0.000 claims description 13
- 230000003595 spectral effect Effects 0.000 claims description 13
- 102000008482 12E7 Antigen Human genes 0.000 claims description 8
- 108010020567 12E7 Antigen Proteins 0.000 claims description 8
- 238000004422 calculation algorithm Methods 0.000 claims description 8
- 239000011159 matrix material Substances 0.000 claims description 6
- 239000002689 soil Substances 0.000 claims description 6
- 238000003064 k means clustering Methods 0.000 claims description 5
- 238000004611 spectroscopical analysis Methods 0.000 claims description 5
- 238000012360 testing method Methods 0.000 claims description 5
- 101000893549 Homo sapiens Growth/differentiation factor 15 Proteins 0.000 claims description 4
- 101000692878 Homo sapiens Regulator of MON1-CCZ1 complex Proteins 0.000 claims description 4
- 102100026436 Regulator of MON1-CCZ1 complex Human genes 0.000 claims description 4
- 206010039509 Scab Diseases 0.000 claims description 3
- WYWFMUBFNXLFJK-UHFFFAOYSA-N [Mo].[Sb] Chemical compound [Mo].[Sb] WYWFMUBFNXLFJK-UHFFFAOYSA-N 0.000 claims description 3
- 238000000985 reflectance spectrum Methods 0.000 claims description 3
- 210000003462 vein Anatomy 0.000 claims description 3
- 230000008901 benefit Effects 0.000 abstract description 4
- 238000011161 development Methods 0.000 abstract description 4
- 230000002708 enhancing effect Effects 0.000 abstract description 2
- 239000000523 sample Substances 0.000 description 35
- 244000043261 Hevea brasiliensis Species 0.000 description 34
- 230000006870 function Effects 0.000 description 10
- 238000007637 random forest analysis Methods 0.000 description 8
- 230000006872 improvement Effects 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 4
- 238000002310 reflectometry Methods 0.000 description 4
- 241000196324 Embryophyta Species 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 238000003066 decision tree Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 229920003052 natural elastomer Polymers 0.000 description 3
- 229920001194 natural rubber Polymers 0.000 description 3
- 239000004033 plastic Substances 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 102000004190 Enzymes Human genes 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000001816 cooling Methods 0.000 description 2
- 230000009849 deactivation Effects 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000001035 drying Methods 0.000 description 2
- 238000000227 grinding Methods 0.000 description 2
- 239000004570 mortar (masonry) Substances 0.000 description 2
- 238000006116 polymerization reaction Methods 0.000 description 2
- 239000000843 powder Substances 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000007873 sieving Methods 0.000 description 2
- 229920002472 Starch Polymers 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000032683 aging Effects 0.000 description 1
- 229910001570 bauxite Inorganic materials 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 235000014121 butter Nutrition 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004737 colorimetric analysis Methods 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 229920001971 elastomer Polymers 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000006260 foam Substances 0.000 description 1
- 239000010438 granite Substances 0.000 description 1
- 229910052736 halogen Inorganic materials 0.000 description 1
- 150000002367 halogens Chemical class 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000035764 nutrition Effects 0.000 description 1
- 235000016709 nutrition Nutrition 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000010238 partial least squares regression Methods 0.000 description 1
- 239000002686 phosphate fertilizer Substances 0.000 description 1
- 230000029553 photosynthesis Effects 0.000 description 1
- 238000010672 photosynthesis Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000035755 proliferation Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000011435 rock Substances 0.000 description 1
- 239000004576 sand Substances 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 235000000346 sugar Nutrition 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/359—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using near infrared light
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/3563—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light for analysing solids; Preparation of samples therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本发明公开了一种基于加权环境变量聚类的叶片磷含量检测方法,属于叶片磷含量检测相关技术领域,包括以下步骤:划分混合样组、光谱测定、叶片磷含量测定、光谱与叶片磷含量匹配、划分叶片样品的训练集和验证集、筛选影响叶片磷含量环境变量、确定最优聚类数、构建基于加权环境变量聚类的高光谱局部估测模型、预估叶片磷含量。在对叶片样品进行聚类时考虑了不同环境变量对叶片磷含量影响的差异,更符合树木在生态环境中的实际生长发育情况,因而能更准确地划分叶片样品的类别,进而挖掘出环境因子真实影响条件下叶片磷含量与光谱之间的关系,达到增强模型预测能力、提高模型预测精度的目的。
Description
技术领域
本发明涉及叶片磷含量检测相关技术领域,更具体的说是涉及一种基于加权环境变量聚类的叶片磷含量检测方法。
背景技术
磷在植物体内是细胞原生质的组分,对细胞的生长和增殖起重要作用;磷还参与植物生命过程的光合作用,糖和淀粉的利用和能量的传递过程。在橡胶树中,磷参与合成天然橡胶,与天然橡胶产量密切相关。橡胶树叶片磷含量可以指示橡胶树磷营养状况,掌握准确的橡胶树叶片磷含量是指导橡胶树合理施用磷肥保持天然橡胶稳产、高产的前提。高光谱技术具有准确、快速获取橡胶树叶片磷含量的潜力,但目前在区域尺度上构建的橡胶树叶片磷含量估测模型预测能力还有限,主要原因在于叶片磷含量及其光谱在区域尺度上具有较强的异质性。因此研发一种基于加权环境变量聚类的叶片磷含量检测方法是本领域技术人员亟需解决的问题。
发明内容
有鉴于此,本发明提供了一种基于加权环境变量聚类的叶片磷含量检测方法。
为了实现上述目的,本发明提供如下技术方案:
一种叶片磷含量检测方法,包括以下步骤:
划分混合样组:按照成土母质以及样地面积将采集的叶片划分成不同的混合样组;
光谱测定:按混合样组对叶片进行光谱测定,得到原始光谱;对原始光谱去噪,得到最终光谱;
叶片磷含量测定:将混合样组中的叶片放入烘箱中杀青30min,降温至70℃,恒温烘干至恒量,研钵磨成粉末过筛;经浓H2SO4和30%H2O2的消煮,用钼锑抗比色法测定;
光谱与叶片磷含量匹配:将最终光谱与对应的叶片磷含量值进行匹配;
划分叶片样品的训练集和验证集:利用K-S算法将采集的样本按照比例划分为训练集和验证集;
筛选影响叶片磷含量环境变量:计算叶片磷含量与环境变量之间的最大信息系数MIC1;进行显著性检验,保留与叶片磷含量关系达到显著性水平的环境变量;计算环境变量之间的最大信息系数MIC2;依据最大信息系数MIC2的大小,剔除存在共线性的环境变量;
确定最优聚类数:依据随机森林算法计算环境变量在预测目标变量时的重要性评估值,依据重要性评估值计算出任一环境变量对叶片磷含量影响的权重;依据确定的权重对相应的环境变量进行加权,利用加权环境变量获得最优聚类数;
构建基于加权环境变量聚类的高光谱局部估测模型:利用偏最小二乘回归算法构建不同样品类别的叶片磷含量高光谱局部估测模型,估算叶片磷含量。
作为一种改进,在划分混合样组中,采集不同成土母质上各个位置的特定时间内的不同植株的相同数量且没有病斑的叶片。
其优点在于,通过采集不同成土母质,不同时期的叶片,以扩大叶片磷含量变化范围,为模型的建立提供更加全面的数据,增加模型的准确性。
作为一种改进,在光谱测定前利用叶片夹底部的白板对反射率光谱进行校正。
其优点在于,对反射率光谱进行校正使测得的光谱更加准确。
作为一种改进,在光谱测定时,以叶片中部主脉左右两侧区域为测定部位,每个部位测定n次光谱,每个叶片测定2n次光谱,将混合样组的测得的光谱进行平均取值,得到每个混合样组样品的光谱反射率。
作为一种改进,光谱测定后利用butter函数和filtfilt函数进行去噪。
作为一种改进,筛选影响叶片磷含量环境变量步骤中剔除存在共线性的环境变量的具体步骤为:
筛选影响叶片磷含量环境变量步骤中剔除存在共线性的环境变量的具体步骤为:
S51、分别计算各个环境变量与叶片磷含量之间的最大信息系数值MIC1;
S52、进行显著性检验,将与叶片磷含量关系达到显著性水平的环境变量放入第一环境变量集;
S53、选择与叶片磷含量相关性最高的环境变量EV1,并将环境变量EV1保存至第二环境变量集;
S54、分别计算其他各个环境变量与环境变量EV1之间的最大信息系数值MIC2,筛选与环境变量EV1之间的最大信息系数值MIC2小于0.64的其他环境变量,并保存至第三环境变量集中;
S55、重复步骤S53、S54,直至第三环境变量集为空。
作为一种改进,在确定最优聚类数步骤中是以加权后的环境变量为输入变量结合K均值聚类法对叶片样本进行聚类,采用“手肘法”确定最优聚类数。
其优点在于,通过“手肘法”得到最优的聚类数,使构建的模型的准确率更高。
作为一种改进,基于加权环境变量聚类的高光谱局部估测模型的预测精度通过测定值标准偏差与均方根误差RMSE的比值RPD、决定系数R2、均方根误差RMSE、相对均方根误差rRMSE衡量,通过测定值标准偏差与均方根误差RMSE的比值RPD划分精确度等级。
经由上述的技术方案可知,与现有技术相比,本发明公开一种基于加权环境变量聚类的高光谱局部估测模型的叶片磷含量检测方法,在对叶片样品进行聚类时考虑了不同环境变量对叶片磷含量影响的差异,更符合树木在生态环境中的实际生长发育情况,能更准确地划分叶片样品的类别,通过对环境因子真实影响条件下叶片磷含量与光谱进行匹配,增强模型预测能力、提高模型预测精度,通过“手肘法”将叶片样品类别进行划分,获得最优的聚类数;实现对叶片磷含量快速、精确、无损的检测。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1附图为本发明的整体流程示意图;
图2附图为本发明的剔除存在共线性的环境变量的流程示意图;
图3a附图为全局模型的预测结果示意图;图3b附图为基于多种环境变量聚类的高光谱局部估测模型预测结果示意图;图3c附图为本发明预测模型的预测结果示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例公开了一种基于加权环境变量聚类的高光谱局部估测模型构建方法,本实施方式是对橡胶叶片磷含量的检测方法,如图1所示,包括以下步骤:
(1)叶片样品采集:在海南岛北部主要植胶区(土壤类型为湿润铁铝土,发生于花岗岩、玄武岩、变质岩和砂页岩四种成土母质)的8个样地采集叶片样品,分别在4-6月(抽叶期)、7-9月(叶片稳定期)和10-12月(叶片老化期)进行以扩大叶片磷含量变化范围。叶片样品采集时,依据样地的大小将每块样地分别划分为14~20个区块,每个区块内随机选取5株橡胶树采集叶片,每株橡胶树采集2片没有病斑的叶片,因此,每个区块共采集10片叶子,将这10片叶子作为一个混合样组放入一个单独的塑料袋,塑料袋外面记录样品编号、区块地理坐标、种植年限等信息。然后,再把装有混合样组的塑料袋放入装有冰块的泡沫箱中,本实施例从8个样地3次共采集427个叶片混合样组。
(2)叶片光谱测定和光谱预处理:每次样品采集完毕后就迅速送回室内进行光谱测定。为避免其他光源的影响,光谱测定在暗室内进行,应用的光谱仪为ASD公司的FieldSpec 3可见-近红外光谱仪,波谱范围为350~2500nm。在350~1000nm范围内,采样间隔和光谱分辨率分别为1.4和3nm;而在1000~2500nm范围内,采样间隔和光谱分辨率分别为2和10nm。叶片样品光谱采集时需要先将植被探头通过光纤连接到主机上,植被探头有一内置卤素灯(3.825V,4.05W),为光谱测定提供光源。每次测量叶片光谱之前,需要利用叶片夹底部的白板对反射率光谱进行校正,然后将叶片放入叶片夹中进行光谱测定。叶片中部主脉左右两侧区域为测定部位,每个部位测定3次光谱,每个叶片测定6次光谱,一个混合样组就采集60次光谱,将这60次光谱进行平均得到混合样组中样品的光谱反射率。
叶片光谱测定完毕后,需要对光谱反射率进行去噪处理。本实施例中利用Matlab2016a软件中的butter函数和filtfilt函数进行,这两个函数的计算公式如下:
[b,a]=butter(N,Wn,'low') (1);
spectrumF=filtfilt(b,a,spectrum) (2);
式中,N为滤波器的阶数;Wn为滤波器的截止频率;low代表低通滤波器;b和a是butter函数返回的滤波系数;spectrum和spectrumF分别代表原始光谱和去噪后的光谱;构造一个二阶滤波器,即N取值2,而Wn的取值(0<Wn<1);通过试错法确定最优值为0.3。
(3)叶片磷含量测定:当叶片光谱测定完成后,将橡胶树叶片样品放入105℃烘箱中杀青30min,然后降温至70℃恒温烘干至恒量,再用研钵磨成粉末过1mm筛,之后经浓H2SO4和30%的H2O2消煮,用钼锑抗比色法测定。
(4)叶片样品训练集和验证集的划分:利用K-S算法将全部427个样品按照2:1的比例划分为训练集(N=286)和验证集(N=141)。其中,训练集用于构建橡胶树叶片磷含量高光谱局部估测模型,验证集用于检验模型的预测性能。
(5)影响橡胶树叶片磷含量环境变量的确定:气候、成土母质和地形等环境因素都会影响橡胶树叶片磷含量。因此,从成土母质、19个生物气候变量以及6个地形变量中筛选影响橡胶树叶片磷含量的主要环境因子。具体步骤为:
先计算叶片磷含量与上述环境变量以及环境变量与环境变量之间的最大信息系数(Maximal Information Coefficient,MIC)(衡量变量之间关系强弱的指标,0<MIC<1,越接近于1表明变量之间的相关性越强),并保留与叶片磷含量关系达到显著性水平(p<0.05)的环境变量。然后,再剔除存在共线性的环境变量(聚类过程中存在共线性的环境变量会在距离计算时占据很高的权重,从而对聚类结果造成负面影响),剩余的变量即为参与后续分析的环境变量。
在另一实施例中:先计算橡胶树叶片磷含量的最大信息系数(MaximalInformation Coefficient,MIC)(衡量变量之间关系强弱的指标,0<MIC<1,越接近于1表明变量之间的相关性越强),并保留与叶片磷含量关系达到显著性水平(p<0.05)的环境变量;其次,计算环境变量以及环境变量之间的最大信息系数。最后,剔除存在共线性的环境变量(聚类过程中存在共线性的环境变量会在距离计算时占据很高的权重,从而对聚类结果造成负面影响),剩余的变量即为参与后续分析的环境变量。
剔除存在共线性的环境变量的具体步骤如图2所示,先保留与橡胶树叶片磷含量关系最紧密的环境变量(EV1),然后检查EV1与其他环境变量之间的MIC值,若有环境变量与EV1之间的MIC值大于等于0.64,即两者之间的相关系数(Correlation Coefficient,r)大于等于0.8,就可认为这些环境变量与EV1之间存在共线性,需要被剔除。与EV1之间的MIC值低于0.64的环境变量就被保存。接下来,在这些被保存下来的环境变量中寻找与橡胶树叶片磷含量关系最紧密的环境变量EV1之外关系最紧密的环境变量(EV2),然后查看EV2与其他保留下来环境变量之间的MIC值,若是有环境变量与EV2之间的MIC值大于等于0.64,那么就认为这些环境变量与EV2之间存在共线性,需要被剔除。以此类推,直至所有环境变量筛选完毕。最终保留下来的环境变量将参与后续的聚类分析。
(6)环境变量对橡胶树叶片磷含量影响权重的确定:随机森林(randomForest,RF)算法不但可以拟合目标变量(橡胶树叶片磷含量)与辅助变量(环境变量)之间的关系,还可提供辅助变量在预测目标变量时的重要性评估值(IncMSE),这一值越大,说明该辅助变量越重要。IncMSE的计算公式为:
式中,n为随机森林中生成的决策树的个数;ei是第i棵决策树的袋外误差(Out-of-bag error);ei'代表对某一辅助变量加入噪音后重新计算的第i棵决策树的袋外误差。
依据lncMSE可计算出每一个环境变量对橡胶树叶片磷含量影响的权重(Wi),Wi的计算公式为:
式中,Wi为第i个环境变量对橡胶树叶片磷含量影响的权重;lncMSEi代表第i个环境变量在随机森林模型中的重要性评估值;n是环境变量的个数。
橡胶树叶片磷含量和环境变量之间的RF模型在R软件中应用randomForest包的randomForest函数进行拟合,环境变量的重要性通过importance函数提取。
(7)基于加权环境变量的橡胶树叶片样本类别的划分:先利用确定的权重Wi对相应的环境变量进行加权,然后以加权后的环境变量为输入变量结合K均值聚类法对橡胶树叶片样本进行聚类。K均值聚类算法可以按照给定的K值进行聚类,但不能给出最优的聚类数。本发明采用“手肘法”确定最优的聚类数。“手肘法”的基本思想为随着聚类数K的增大,样本划分更加精细,每个类别的聚合程度会逐渐提高,而所有类别内每个样本与各自质心距离(误差)的平方和(Sum ofSquare Error,SSE)自然逐渐变小。当K小于真实聚类数时,K的增大会显著增加每个类别的聚合度,因此SSE的下降会很剧烈。而当K达到真实聚类数时,再增加K所得到的聚合度回报会迅速变小,对应的SSE下降也变得缓和。因此,SSE和K之间的关系图呈手肘状,而这个肘部对应的K值就是样本的真实聚类数。SSE的计算公式为:
式中,K是聚类数;Sj代表第j个类别;Cj为Sj的质心;X是属于类别Sj的样本。K均值聚类算法在数据分析软件Matlab2016a中通过kmeans函数实现。
(8)橡胶树叶片磷含量高光谱局部估测模型的构建与精度验证:利用偏最小二乘回归(Partial Least Squares Regression,PLSR)构建不同样品类别的橡胶树叶片磷含量高光谱局部估测模型。为了验证构建的基于加权环境变量聚类的叶片磷含量高光谱局部估测模型的预测精度,需要先将独立的验证样本归类到相应的样品类别中,再利用对应类别的局部估测模型对这些样品进行预测,并将预测值与实测值进行比较。而为了将验证样本分配到相应的类别中,需要建立验证样本的判别模型。结合训练集的聚类结果,应用数据分析软件Matlab 2016a中的classify函数建立起验证集样本的判别模型。模型的预测精度通过决定系数(Coefficient ofDetermination,R2)、均方根误差(Root Mean SquaredError,RMSE)、相对均方根误差(relative Root Mean Square Error,rRMSE)和测定值标准偏差与RMSE的比值(Ratio of Prediction Deviation,RPD)来衡量。其中,R2越接近1、RMSE和rRMSE越接近0,模型的预测精度越高;而RPD<1.4、1.4<RPD<2.0和RPD>2.0分别代表模型预测精度分为不可接受、可接受和优秀的级别。
(9)比较:对常用的全局模型、基于多种环境变量聚类的高光谱局部估测模型以及本发明中的基于加权环境变量聚类的局部估测模型的预测模型进行对比,如图3a所示的常用的全局模型的预测结果为(R2=0.588,RMSE=0.037,rRMSE=14.073,RPD=1.543),如图3b所示的基于多种环境变量聚类的高光谱局部估测模型的预测结果为(R2=0.659,RMSE=0.035,rRMSE=13.132,RPD=1.654),如图3c所示的基于加权环境变量聚类的局部估测模型的预测结果为(R2=0.744,RMSE=0.030,rRMSE=11.152,RPD=1.947),由此可以看出本发明提出的基于加权环境变量聚类的局部估测模型与基于多种环境变量聚类的高光谱局部估测模型之间的区别在于对橡胶树叶片样品进行聚类时考虑了不同环境变量对橡胶树叶片磷含量影响的差异。这一做法更符合橡胶树在生态环境中的实际生长发育情况,因而能更准确地划分橡胶树叶片样品的类别,进而挖掘出环境因子真实影响条件下橡胶树叶片磷含量与光谱之间的关系,最终达到了增强模型预测能力、提高模型预测精度的目的。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (8)
1.一种叶片磷含量检测方法,其特征在于,包括以下步骤:
划分混合样组:按照成土母质以及样地面积将采集的叶片划分成不同的混合样组;
光谱测定:按混合样组对叶片进行光谱测定,得到原始光谱;对原始光谱去噪,得到最终光谱;
叶片磷含量测定:利用钼锑抗比色法测定叶片磷含量;
光谱与叶片磷含量匹配:将最终光谱与对应的叶片磷含量值进行匹配;
划分叶片样品的训练集和验证集:将采集的样本按照比例划分为训练集和验证集;
筛选影响叶片磷含量环境变量:计算叶片磷含量与环境变量之间的最大信息系数MIC1;进行显著性检验,保留与叶片磷含量关系达到显著性水平的环境变量;计算环境变量之间的最大信息系数MIC2;依据环境变量之间的最大信息系数MIC2的大小,剔除存在共线性的环境变量;
确定最优聚类数:计算出任一环境变量对叶片磷含量影响的权重;依据权重对相应的环境变量进行加权;获取最优聚类数;
构建基于加权环境变量聚类的高光谱局部估测模型:利用偏最小二乘回归算法构建不同样品类别的叶片磷含量高光谱局部估测模型,估算叶片磷含量。
2.根据权利要求1所述的一种叶片磷含量检测方法,其特征在于,在划分混合样组中,采集不同成土母质上各个位置的特定时间内的不同植株的相同数量且没有病斑的叶片。
3.根据权利要求1所述的一种叶片磷含量检测方法,其特征在于,在光谱测定前利用叶片夹底部的白板对反射率光谱进行校正。
4.根据权利要求1-3任意一项所述的一种叶片磷含量检测方法,其特征在于,在光谱测定时,以叶片中部主脉左右两侧区域为测定部位,每个部位测定n次光谱,每个叶片测定2n次光谱,将混合样组的测得的光谱进行平均取值,得到混合样组样品的光谱反射率。
5.根据权利要求4所述的一种叶片磷含量检测方法,其特征在于,光谱测定后利用butter函数和filtfilt函数进行去噪。
6.根据权利要求4所述的一种叶片磷含量检测方法,其特征在于,筛选影响叶片磷含量环境变量步骤中剔除存在共线性的环境变量的具体步骤为:
S51、分别计算各个环境变量与叶片磷含量之间的最大信息系数值MIC1;
S52、进行显著性检验,将与叶片磷含量关系达到显著性水平的环境变量放入第一环境变量集;
S53、选择与叶片磷含量相关性最高的环境变量EV1,并将环境变量EV1保存至第二环境变量集;
S54、分别计算其他各个环境变量与环境变量EV1之间的最大信息系数值MIC2,筛选与环境变量EV1之间的最大信息系数值MIC2小于0.64的其他环境变量,并保存至第三环境变量集中;
S55、重复步骤S53、S54,直至第三环境变量集为空。
7.根据权利要求1-3或5-6任意一项所述的一种叶片磷含量检测方法,其特征在于,确定最优聚类数步骤中是以加权后的环境变量为输入变量结合K均值聚类法对叶片样本进行聚类,采用“手肘法”确定最优聚类数。
8.根据权利要求7所述的一种叶片磷含量检测方法,其特征在于,基于加权环境变量聚类的高光谱局部估测模型的预测精度通过测定值标准偏差与均方根误差RMSE的比值RPD、决定系数R2、均方根误差RMSE、相对均方根误差rRMSE衡量,通过测定值标准偏差与均方根误差RMSE的比值RPD划分精确度等级。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110431501.5A CN113063754B (zh) | 2021-04-21 | 2021-04-21 | 一种基于加权环境变量聚类的叶片磷含量检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110431501.5A CN113063754B (zh) | 2021-04-21 | 2021-04-21 | 一种基于加权环境变量聚类的叶片磷含量检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113063754A true CN113063754A (zh) | 2021-07-02 |
CN113063754B CN113063754B (zh) | 2022-09-13 |
Family
ID=76567311
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110431501.5A Expired - Fee Related CN113063754B (zh) | 2021-04-21 | 2021-04-21 | 一种基于加权环境变量聚类的叶片磷含量检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113063754B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114707321A (zh) * | 2022-03-30 | 2022-07-05 | 四川启睿克科技有限公司 | 一种基于多传感器光谱数据的加权预测方法 |
CN116432068A (zh) * | 2023-04-12 | 2023-07-14 | 中国测试技术研究院 | 一种滚筒式杀青烘干机的物料含水率预测方法及系统 |
CN114707321B (zh) * | 2022-03-30 | 2024-10-25 | 四川启睿克科技有限公司 | 一种基于多传感器光谱数据的加权预测方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2821241A1 (en) * | 2010-12-13 | 2012-06-21 | Exxonmobil Research And Engineering Company | Phosphorus recovery from hydrothermal treatment of biomass |
CN102930270A (zh) * | 2012-09-19 | 2013-02-13 | 东莞中山大学研究院 | 基于肤色检测与背景消除的手部识别方法及系统 |
CA2858166A1 (en) * | 2011-12-05 | 2013-06-13 | Commonwealth Scientific And Industrial Research Organisation | Method and system for characterising plant phenotype |
CN106092911A (zh) * | 2016-05-23 | 2016-11-09 | 塔里木大学 | 一种枣树冠层磷含量的检测方法 |
CN109738367A (zh) * | 2018-12-29 | 2019-05-10 | 首都师范大学 | 通过无人机上高光谱传感器反演河口湿地水环境要素方法 |
CN110455722A (zh) * | 2019-08-20 | 2019-11-15 | 中国热带农业科学院橡胶研究所 | 橡胶树叶片磷含量高光谱反演方法和系统 |
-
2021
- 2021-04-21 CN CN202110431501.5A patent/CN113063754B/zh not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2821241A1 (en) * | 2010-12-13 | 2012-06-21 | Exxonmobil Research And Engineering Company | Phosphorus recovery from hydrothermal treatment of biomass |
CA2858166A1 (en) * | 2011-12-05 | 2013-06-13 | Commonwealth Scientific And Industrial Research Organisation | Method and system for characterising plant phenotype |
CN102930270A (zh) * | 2012-09-19 | 2013-02-13 | 东莞中山大学研究院 | 基于肤色检测与背景消除的手部识别方法及系统 |
CN106092911A (zh) * | 2016-05-23 | 2016-11-09 | 塔里木大学 | 一种枣树冠层磷含量的检测方法 |
CN109738367A (zh) * | 2018-12-29 | 2019-05-10 | 首都师范大学 | 通过无人机上高光谱传感器反演河口湿地水环境要素方法 |
CN110455722A (zh) * | 2019-08-20 | 2019-11-15 | 中国热带农业科学院橡胶研究所 | 橡胶树叶片磷含量高光谱反演方法和系统 |
Non-Patent Citations (3)
Title |
---|
GUO PENGTAO等: "A local model based on environmental variables clustering for estimating foliar phosphorus or rubber trees with vis-NIR spectrroscopic data", 《HELIYON》 * |
郭澎涛等: "基于主成分分析和随机森林的橡胶小苗叶片磷含量高光谱预测", 《热带农业科学》 * |
郭澎涛等: "基于环境与光谱相似性的橡胶树叶片磷含量局部估测模型", 《农业工程学报》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114707321A (zh) * | 2022-03-30 | 2022-07-05 | 四川启睿克科技有限公司 | 一种基于多传感器光谱数据的加权预测方法 |
CN114707321B (zh) * | 2022-03-30 | 2024-10-25 | 四川启睿克科技有限公司 | 一种基于多传感器光谱数据的加权预测方法 |
CN116432068A (zh) * | 2023-04-12 | 2023-07-14 | 中国测试技术研究院 | 一种滚筒式杀青烘干机的物料含水率预测方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN113063754B (zh) | 2022-09-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105630743B (zh) | 一种光谱波数的选择方法 | |
WO2019233189A1 (zh) | 一种传感网络异常数据检测方法 | |
CN103048273B (zh) | 基于模糊聚类的水果近红外光谱分类方法 | |
CN109470648B (zh) | 一种单籽粒作物不完善粒快速无损判定方法 | |
CN108680515B (zh) | 一种单粒水稻直链淀粉定量分析模型构建及其检测方法 | |
CN102305772A (zh) | 基于遗传核偏最小二乘法的近红外光谱特征波长筛选方法 | |
CN110569605B (zh) | 一种基于nsga2-elm的粳稻叶片氮素含量反演模型方法 | |
CN111044516B (zh) | 一种水稻叶绿素含量遥感估测方法 | |
CN108830249B (zh) | 一种基于asd高光谱数据的冬小麦白粉病遥感监测方法 | |
CN101881726A (zh) | 植物幼苗综合性状活体无损检测方法 | |
CN111855591A (zh) | 水稻地上部碳氮比遥感反演模型和方法 | |
CN101713731A (zh) | 一种药物制剂包衣质量的鉴别方法 | |
CN109870421A (zh) | 一种基于可见光/近红外光谱分析的递增式木材树种分类识别方法 | |
CN101738373A (zh) | 一种鉴别作物种子品种的方法 | |
CN103344602A (zh) | 一种基于近红外光谱的水稻种质真伪无损检测方法 | |
CN113063754B (zh) | 一种基于加权环境变量聚类的叶片磷含量检测方法 | |
CN111855593A (zh) | 水稻叶片淀粉含量遥感反演模型和方法 | |
CN105608296B (zh) | 一种基于荔枝冠层光谱的叶片钾浓度反演方法 | |
CN112270131A (zh) | 基于ard回归算法的水稻叶面积指数遥感反演模型和方法 | |
CN104990891B (zh) | 一种种子近红外光谱和光谱图像定性分析模型建立方法 | |
CN114486786A (zh) | 土壤有机质测定方法及测定系统 | |
Wu et al. | Variety identification of Chinese cabbage seeds using visible and near-infrared spectroscopy | |
CN103913425A (zh) | 基于光谱指数和气候因子耦合的冬小麦籽粒蛋白质含量预测方法及其预测模型的构建方法 | |
CN117723505A (zh) | 基于近红外光谱的水稻种粒秕谷含量等级快速检测方法 | |
CN113159220A (zh) | 基于随机森林的混凝土侵彻深度经验算法评价方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20220913 |
|
CF01 | Termination of patent right due to non-payment of annual fee |