CN113177188B - 一种基于光谱新特征的反演叶片叶绿素含量的方法 - Google Patents

一种基于光谱新特征的反演叶片叶绿素含量的方法 Download PDF

Info

Publication number
CN113177188B
CN113177188B CN202110415971.2A CN202110415971A CN113177188B CN 113177188 B CN113177188 B CN 113177188B CN 202110415971 A CN202110415971 A CN 202110415971A CN 113177188 B CN113177188 B CN 113177188B
Authority
CN
China
Prior art keywords
data
lasso
spectrum
model
new
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110415971.2A
Other languages
English (en)
Other versions
CN113177188A (zh
Inventor
高懋芳
王天丽
张蕙杰
曹春玲
李顺国
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Agricultural Resources and Regional Planning of CAAS
Agricultural Information Institute of CAAS
Grain Research Institute of Hebei Academy of Agriculture and Forestry Sciences
Original Assignee
Institute of Agricultural Resources and Regional Planning of CAAS
Agricultural Information Institute of CAAS
Grain Research Institute of Hebei Academy of Agriculture and Forestry Sciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Agricultural Resources and Regional Planning of CAAS, Agricultural Information Institute of CAAS, Grain Research Institute of Hebei Academy of Agriculture and Forestry Sciences filed Critical Institute of Agricultural Resources and Regional Planning of CAAS
Priority to CN202110415971.2A priority Critical patent/CN113177188B/zh
Publication of CN113177188A publication Critical patent/CN113177188A/zh
Application granted granted Critical
Publication of CN113177188B publication Critical patent/CN113177188B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands

Abstract

本发明公开了一种基于光谱新特征的反演叶片叶绿素含量的方法,将光谱新特征(△h)的训练数据集作为反演叶片叶绿素含量的自变量,基于步骤3获得的参数,利用套索算法对该部分数据进行降维处理;利用得到的降维数据作为最终回归模型的自变量进行多元非线性回归,建立带有套索算法约束的多元非线性回归模型,即LASSO‑MNR反演模型,利用LASSO‑MNR反演模型反演叶片叶绿素含量。本发明建立了基于套索算法的多元非线性回归模型(LASSO‑MNR),该模型原理简单,操作方便,有效降低了光谱数据的冗余度,提高了反演精度,具有较大的灵活性和实用性同时具有较强的普适性。

Description

一种基于光谱新特征的反演叶片叶绿素含量的方法
技术领域
本发明属于农作物叶片微量元素含量反演技术领域,特别是涉及一种基于套索算法与多元非线性回归算法组合反演叶片叶绿素含量的方法。
背景技术
冬小麦等作物的长势可以通过其生理特征来表现,而其生理特征又决定了它对光吸收,透射和反射的变化。因此可以利用光谱反射率数据的差异来监测冬小麦等作物的叶绿素含量。高光谱遥感可以快速准确地反映出冬小麦等作物的生理生化参数,因此基于高光谱的光谱差异分析在植被遥感研究领域中有更广泛的应用前景。高光谱数据具有丰富的信息,但是某些相邻的波段间具有一定的相关性,这会导致光谱数据冗余度增加,造成反演结果失真,准确性降低。因此对于高光谱数据,如何将它降维而又最大限度保留有效光谱信息,成为了使用高光谱数据进行冬小麦等作物叶绿素含量反演的关键。
目前,叶片叶绿素含量反演的方法主要有三大类,基于植被指数方法、基于特征参数方法和基于机器学习的回归方法。其中,单一的植被指数舍弃了大量数据,没有很好地表征整个高光谱信息,从而可能会影响反演精度;利用红边指数及红边面积等特征参数反演叶绿素含量目前也被广泛使用,但是在模型的通用性上还存在一定的不足;近年来也有相关的学者使用神经网络等方法进行作物叶绿素含量监测,然而这些方法大多存在普遍适用性及可解释性不强等影响。目前对于高光谱数据的相关研究中使用套索算法降维后再使用多元非线性回归拟合反演叶片叶绿素含量的研究较少。
发明内容
为了解决上述技术问题中的不足之处,本发明提供了一种基于光谱新特征的反演叶片叶绿素含量的方法,LASSO-MNR模型可以在一定程度上降低光谱数据冗余度与噪声带来的消极影响,避免数据的多重共线性干扰,提高叶绿素含量反演的精度。
为了解决上述问题,本发明采用的技术方案是:
一种基于光谱新特征的反演叶片叶绿素含量的方法,包括以下步骤:
步骤1:求出光谱反射率与其光谱反射率平均值的差(△h)作为光谱新特征;再对该差求得绝对值,得到的数据集最终用于降维与反演;
步骤2:将光谱新特征(△h)数据集分为训练集与验证集,两个数据集之间的均值、标准差差异较小,具有很好的相似性;
步骤3:采用十折交叉验证方法对套索算法中的参数进行最优选择,确定效果达到最优的降维模型;
步骤4:将光谱新特征(△h)的训练数据集作为反演叶片叶绿素含量的自变量,基于步骤3获得的参数,利用套索算法对该部分数据进行降维处理;
步骤5:利用得到的降维数据作为最终回归模型的自变量进行多元非线性回归,建立带有套索算法约束的多元非线性回归模型,即LASSO-MNR反演模型,利用LASSO-MNR反演模型反演叶片叶绿素含量。
所述的方法,所述步骤4中,套索算法如下:
Figure BDA0003025886440000021
其中,
Figure BDA0003025886440000022
多元线性模型表示为y=Xβ+ε,β为回归系数,ε为误差;λ为非负数,用来平衡模型的方差与偏差,λ的选定依据广义交叉验证最小化的方式来确定。
所述的方法,所述步骤5中,利用上述LASSO算法对新特征(△h)数据求得的降维数据作为最终回归模型的自变量进行多元非线性回归,建立带有套索算法约束的多元非线性回归模型,得到LASSO-MNR反演模型;多元非线性回归的公式如下:
Figure BDA0003025886440000023
其中,YChlorophyll是叶绿素含量,x1,x2,…,xn是降维后的光谱新特征(△h)
数据,a1,a2,…,an,b1,b2,…,bn,c是反演系数。
所述的方法,所述步骤3中,MSE取最小值15.71时,λ取最优值2.3×10-3时,LASSO算法的效果最优。
所述的方法,所述步骤4中,基于套索算法将光谱新特征(△h)数据降维至59。
所述的方法,所述步骤5中,利用所述59个光谱新特征(△h)数据作为最终多元非线性回归模型的自变量进行回归拟合,最终建立带有套索算法约束的多元非线性回归模型,得到LASSO-MNR反演模型。
所述的方法,还包括步骤6,利用R2、RMSE作为评价指标得到模型反演精度,验证所述LASSO-MNR模型的反演能力;R2越高,RMSE越小,说明模型实测值和预测值之间的偏差越小,模型的拟合效果越好。
所述的方法,还包括步骤7,将所述模型的反演精度与其他反演模型相比较,验证所述LASSO-MNR模型的效果更好。
本发明发展了一种以作物光谱反射率与其光谱反射率平均值的差(△h)作为光谱新特征的基于套索算法与多元非线性回归组合反演叶片叶绿素含量的方法;该光谱新特征具有以下优势:
1、该光谱新特征可以快速判断光谱反射率数据是否存在异常及其异常程度;
2、新特征数据的变化幅度可以明显表现出原光谱数据的变化,而且变化的差异更明显;
3、增加光谱曲线拐点,可以使数据在降维的过程中尽可能多的保留光谱的全部有效信息;
4、提出新的光谱曲线变换形式,降低实际测量光谱时外在噪音对光谱反射率的负面影响。
附图说明
图1为350-1330nm部分光谱反射率曲线新特征的描述(a图)与结果(b图);
图2为1481-1790nm部分光谱反射率曲线新特征的描述(a图)与结果(b图);
图3为1961-2300nm部分光谱反射率曲线新特征的描述(a图)与结果(b图);
图4为本方法提取结果精度(R2,RMSE);
图5为本方法提取结果精度与其他方法结果精度对比;
具体实施方式
参考图1-5,本发明的一种基于光谱新特征的反演叶片叶绿素含量的方法(以冬小麦为例),包括以下步骤:
步骤1:利用ViewSpecPro软件对测量的冬小麦叶片ASD光谱数据进行预处理,删除实测光谱中受水汽吸收带影响的光谱数据,对剩余三部分冬小麦光谱求出的新特征数据,即光谱反射率与该部分光谱数据的平均值的差(△h),再对差求得绝对值,得到的数据集就是最终用于降维与反演的数据。350-1330nm的结果如图1所示,1481-1790nm的结果如图2所示,1961-2300nm的结果如图3所示。该新特征数据可以充分体现光谱数据的变化,而且可以观察到光谱反射率值与均值的差异大小。
步骤2:将光谱新特征(△h)数据集分为训练集与验证集,两个数据集之间的均值、标准差差异较小,具有很好的相似性,说明数据集样本划分合理。
步骤3:将求出的光谱新特征(△h)数据集作为LASSO-MNR模型反演冬小麦叶片叶绿素含量的自变量,共1630个自变量,再利用LASSO算法对光谱新特征(△h)训练数据集进行降维处理,减小光谱数据的冗余度及噪声的消极影响,避免光谱数据的多重共线性的影响;套索算法的具体公式如下:
Figure BDA0003025886440000041
其中,
Figure BDA0003025886440000042
多元线性模型表示为y=Xβ+ε,β为回归系数,ε为误差;λ为非负数,用来平衡模型的方差与偏差,λ的选定依据广义交叉验证最小化的方式来确定。采用10折交叉验证对套索算法精度的误差进行估计,当LASSO模型的MSE取最小值15.71时,λ可以取到最优值2.3×10-3,此时,LASSO模型的方差与偏差达到平衡,LASSO模型降维效果最好。
步骤4:将光谱新特征(△h)的训练数据集作为反演叶片叶绿素含量的自变量,基于上述参数利用套索算法对该部分数据进行降维处理,用来减小光谱数据的冗余度,避免数据存在多重共线性。结果如步骤3所述,当MSE最小时可以取到最优的λ,根据此时的λ值可以确定基于套索算法将光谱新特征(△h)数据集降维至59,而且所选变量基本上都分布在光谱曲线的各个拐角处,因此本次光谱新特征(△h)数据降维可以完整保留光谱信息,提高后续的叶绿素含量的反演精度。
步骤5:对LASSO降维算法选取的59个光谱新特征(△h)的数据作为MNR的自变量进行回归拟合,建立带有套索算法约束的多元非线性回归模型,即LASSO-MNR模型,利用LASSO-MNR模型得到冬小麦叶片叶绿素含量的反演结果。
步骤6:利用R2、RMSE作为评价指标得到模型反演精度,验证所述LASSO-MNR模型的反演能力。R2越高,RMSE越小,说明模型实测值和预测值之间的偏差越小,模型拟合效果越好,反演结果如图4所示。带有光谱新特征(△h)的LASSO-MNR模型的R2=0.98,RMSE=1.7,说明该模型几乎可以完全反演出冬小麦叶片叶绿素含量,且误差相对较小。
步骤7:将LASSO-MNR模型的反演精度与其他反演模型相比较,验证所述LASSO-MNR模型的精度更好,结果如图5所示。相较于其他模型(如BP神经网络回归,随机森林回归,多元线性回归),带有光谱新特征(△h)的LASSO-MNR模型的反演精度最高,达到了0.98,均方误差最小,仅为1.7。由此可知,带有光谱新特征(△h)的LASSO-MNR模型在反演冬小麦叶片叶绿素含量中可以达到很好的效果。
应当理解的是,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,而所有这些改进和变换都应属于本发明所附权利要求的保护范围。

Claims (1)

1.一种基于光谱新特征的反演冬小麦叶片叶绿素含量的方法,其特征在于,包括以下步骤:
步骤1:利用ViewSpecPro软件对测量的冬小麦叶片ASD光谱数据进行预处理,删除实测光谱中受水汽吸收带影响的光谱数据,对剩余三部分冬小麦光谱求出新特征数据,即光谱反射率与该部分光谱数据的平均值的差△h,再对差求得绝对值,得到的数据集就是最终用于降维与反演的数据;所述三部分冬小麦光谱包括:350-1330nm、1481-1790nm、1961-2300nm;对这三部分光谱曲线分别求平均值,用该部分的原始光谱数据减去相对应的均值,得到新特征△h,对△h取绝对值;
步骤2:将光谱新特征△h数据集分为训练集与验证集,两个数据集之间的均值、标准差差异较小,具有很好的相似性,说明数据集样本划分合理;
步骤3:将求出的光谱新特征△h数据集作为LASSO-MNR模型反演冬小麦叶片叶绿素含量的自变量,共1630个自变量,再利用LASSO算法对光谱新特征△h训练数据集进行降维处理,减小光谱数据的冗余度及噪声的消极影响,避免光谱数据的多重共线性的影响;套索算法的具体公式如下:
Figure FDA0003289498300000011
其中,
Figure FDA0003289498300000012
多元线性模型表示为y=xβ+ε,β为回归系数,ε为误差;λ为非负数,用来平衡模型的方差与偏差,λ的选定依据广义交叉验证最小化的方式来确定;采用10折交叉验证对套索算法精度的误差进行估计,当LASSO模型的MSE取最小值15.71时,λ可以取到最优值2.3×10-3,此时,LASSO模型的方差与偏差达到平衡,LASSO模型降维效果最好;
步骤4:将光谱新特征△h的训练数据集作为反演叶片叶绿素含量的自变量,基于上述参数利用套索算法对该部分数据进行降维处理,用来减小光谱数据的冗余度,避免数据存在多重共线性;当MSE最小时可以取到最优的λ,根据此时的λ值确定基于套索算法将光谱新特征△h数据集降维至59,而且所选变量都分布在光谱曲线的各个拐角处,本次光谱新特征△h数据降维完整保留光谱信息,能够提高后续的叶绿素含量的反演精度;
步骤5:对LASSO降维算法选取的59个光谱新特征△h的数据作为MNR的自变量进行回归拟合,建立带有套索算法约束的多元非线性回归模型,即LASSO-MNR模型,利用LASSO-MNR模型得到冬小麦叶片叶绿素含量的反演结果。
CN202110415971.2A 2021-04-19 2021-04-19 一种基于光谱新特征的反演叶片叶绿素含量的方法 Active CN113177188B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110415971.2A CN113177188B (zh) 2021-04-19 2021-04-19 一种基于光谱新特征的反演叶片叶绿素含量的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110415971.2A CN113177188B (zh) 2021-04-19 2021-04-19 一种基于光谱新特征的反演叶片叶绿素含量的方法

Publications (2)

Publication Number Publication Date
CN113177188A CN113177188A (zh) 2021-07-27
CN113177188B true CN113177188B (zh) 2021-12-07

Family

ID=76923699

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110415971.2A Active CN113177188B (zh) 2021-04-19 2021-04-19 一种基于光谱新特征的反演叶片叶绿素含量的方法

Country Status (1)

Country Link
CN (1) CN113177188B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117451639A (zh) * 2023-12-21 2024-01-26 内蒙古工业大学 一种基于遥感数据的水体叶绿素浓度反演方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110222475A (zh) * 2019-07-03 2019-09-10 中国水利水电科学研究院 一种基于无人机多光谱遥感反演冬小麦植株含水率的方法
CN111814707A (zh) * 2020-07-14 2020-10-23 中国科学院空天信息创新研究院 一种作物叶面积指数反演方法及装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105548113B (zh) * 2015-12-31 2019-04-16 浙江大学 一种基于叶绿素荧光和多光谱图像的植物生理监测方法
CN105976310B (zh) * 2016-05-04 2018-01-12 山东大学 一种基于分块的vca端元提取方法
CN110455722A (zh) * 2019-08-20 2019-11-15 中国热带农业科学院橡胶研究所 橡胶树叶片磷含量高光谱反演方法和系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110222475A (zh) * 2019-07-03 2019-09-10 中国水利水电科学研究院 一种基于无人机多光谱遥感反演冬小麦植株含水率的方法
CN111814707A (zh) * 2020-07-14 2020-10-23 中国科学院空天信息创新研究院 一种作物叶面积指数反演方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Subspace Matching Pursuit for Sparse Unmixing of Hyperspectral Data;Zhenwei Shi等;《 IEEE Transactions on Geoscience and Remote Sensing》;20130731;全文 *

Also Published As

Publication number Publication date
CN113177188A (zh) 2021-07-27

Similar Documents

Publication Publication Date Title
CN111414891B (zh) 基于激光雷达与光学遥感的输电线路通道树高反演方法
CN109508693B (zh) 基于成像高光谱植被指数和生育期长度信息的无人机遥感水稻估产方法
Bin et al. A modified random forest approach to improve multi-class classification performance of tobacco leaf grades coupled with NIR spectroscopy
CN117349683B (zh) 基于光谱数据的汽车配件涂装色差异常检测系统
CN111855608B (zh) 基于融合特征波长选择算法的苹果酸度近红外无损检测方法
CN113076692B (zh) 一种反演叶片氮素含量的方法
CN113177188B (zh) 一种基于光谱新特征的反演叶片叶绿素含量的方法
CN104990895B (zh) 一种基于局部区域的近红外光谱信号标准正态校正方法
US20230243744A1 (en) Method and system for automatically detecting and reconstructing spectrum peaks in near infrared spectrum analysis of tea
CN112881327A (zh) 一种基于新型植被指数的烟叶spad值估测方法
CN112129709A (zh) 一种苹果树冠层尺度氮含量诊断方法
CN113065230B (zh) 基于优化光谱指数建立水稻叶片spad的高光谱反演模型
CN112945881B (zh) 一种基于高光谱特征参数的马铃薯叶片含水量监测方法
CN107290299B (zh) 一种实时无损检测桃的糖度和酸度的方法
CN116501925B (zh) 多源遥感数据下叶面积指数预测方法、系统、设备及介质
CN116994126A (zh) 基于冠层反射率光谱的作物叶面积指数获取方法及装置
CN115824996A (zh) 基于近红外光谱的烟叶常规化学成分通用模型建模方法
CN112229816B (zh) 基于opls-spa-mix-pls的木材弹性模量预测方法
CN113505461A (zh) 利用修正三维光谱指数的土壤有机质估测的方法及系统
CN113311449A (zh) 一种高光谱激光雷达植被叶片入射角效应校正的方法
CN114199793B (zh) 一种基于高光谱的苹果叶片含氮量检测方法
CN117852949A (zh) 一种烟叶烘烤自动评价考核方法
CN116994675B (zh) 基于近红外数据的锦灯笼宿萼表皮检测方法
CN115855836A (zh) 一种基于高光谱成像的茶鲜叶萎凋与发酵程度判断方法及系统
CN111507223B (zh) 植物物种beta多样性的估算方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant