CN112525831A - 基于CatBoost回归算法的水稻地上部蛋白氮积累量遥感反演模型和方法 - Google Patents

基于CatBoost回归算法的水稻地上部蛋白氮积累量遥感反演模型和方法 Download PDF

Info

Publication number
CN112525831A
CN112525831A CN202011318134.XA CN202011318134A CN112525831A CN 112525831 A CN112525831 A CN 112525831A CN 202011318134 A CN202011318134 A CN 202011318134A CN 112525831 A CN112525831 A CN 112525831A
Authority
CN
China
Prior art keywords
rice
overground part
protein nitrogen
catboost
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011318134.XA
Other languages
English (en)
Inventor
姜晓剑
邵文琦
钟平
朱元励
汪伟
吴莹莹
李卓
陈青春
任海芳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huaiyin Normal University
Original Assignee
Huaiyin Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huaiyin Normal University filed Critical Huaiyin Normal University
Priority to CN202011318134.XA priority Critical patent/CN112525831A/zh
Publication of CN112525831A publication Critical patent/CN112525831A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N2021/1793Remote sensing
    • G01N2021/1797Remote sensing in landscape, e.g. crops

Landscapes

  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)

Abstract

本发明提供一种基于CatBoost回归算法的水稻地上部蛋白氮积累量遥感反演模型,为Python语言的CatBoost回归模型,并进一步提供了该CatBoost回归模型的模型参数。还提供了基于CatBoost回归算法的水稻地上部蛋白氮积累量遥感反演方法。本发明的基于CatBoost回归算法的水稻地上部蛋白氮积累量遥感反演模型能够快速、准确的获取水稻地上部蛋白氮积累量信息,克服水稻组分复杂带来的光谱叠加效应造成的水稻地上部蛋白氮积累量特征波段难以确定的困难,大大提高水稻地上部蛋白氮积累量反演模型精度,设计巧妙,计算简便,易于实现,成本低,适于去大规模推广应用。

Description

基于CatBoost回归算法的水稻地上部蛋白氮积累量遥感反演 模型和方法
技术领域
本发明涉及农业遥感技术领域,特别涉及水稻地上部蛋白氮积累量测量技术领域,具体是指一种基于CatBoost回归算法的水稻地上部蛋白氮积累量遥感反演模型和方法。
背景技术
水稻地上部蛋白氮积累量是指水稻地上部中蛋白态氮元素的总累积量,是反应水稻氮素营养状况、水稻长势以及水稻对氮肥吸收利用效率的重要指标,反映了水稻生理、长势以及肥水状况(杨杰.基于叶片高光谱指数的水稻氮素及色素含量监测研究[D].南京农业大学,2009)。
监测水稻地上部蛋白氮积累量,不仅可以保证水稻生产的产量和品质,同时能够动态管理水稻的氮肥施用,减少水稻生产中氮肥的使用量,缓解大量氮肥施用带来的环境问题,从而产生显著的经济和社会效益(陈青春,田永超,姚霞,等.基于冠层反射光谱的水稻追氮调控效应研究[J].中国农业科学,2010,43(20):4149-4157)。传统的水稻地上部蛋白氮积累量的监测主要采用破坏性采样的方法,需要在室内进行,测定过程费时费力,且时效性差,无法及时的获取水稻地上部蛋白氮积累量,不利于推广应用。
在水稻的生理生化过程中,水稻植株体内某些特定物质和细胞结构的变化,导致了水稻反射光谱的改变。因此,可以用光谱的变化来获取水稻地上部蛋白氮积累量等水稻生长信息(周冬琴.基于冠层反射光谱的水稻氮素营养与籽粒品质监测[D].南京农业大学,2007)。目前,使用高光谱来监测水稻的生长状态已经在作物生长监测中得到了应用。随着光谱技术的发展和普及,高光谱数据可以快捷迅速的获取水稻地上部蛋白氮积累量信息已经成为越来越多水稻生产从业者和研究人员的共识。最常用的方式是使用便携式全波段光谱仪获取水稻生长信息,选择能够反映地上部蛋白氮积累量的特征波段构建反演线性或广义线性模型。在构建水稻地上部蛋白氮积累量反演模型的过程中,全波段光谱仪所测定的光谱范围涵盖了350nm~2500nm,但是由于水稻组分复杂,组分光谱特征波段部分重叠,水稻地上部蛋白氮积累量特征光谱的确定困难,构建的模型大多是仅考虑蛋白氮积累量与光谱特征波段之间的线性效应或者广义线性效应,同时高光谱数据的快速处理成为基于高光谱数据估测水稻地上部蛋白氮积累量的亟待解决的技术问题。
因此,希望提供一种水稻地上部蛋白氮积累量遥感反演模型,其能够快速、准确的获取水稻地上部蛋白氮积累量信息,克服水稻组分复杂带来的光谱叠加效应造成的水稻地上部蛋白氮积累量特征波段难以确定的困难,大大提高水稻地上部蛋白氮积累量反演模型精度。
发明内容
为了克服上述现有技术中的缺点,本发明的一个目的在于提供一种基于CatBoost回归算法的水稻地上部蛋白氮积累量遥感反演模型,其能够快速、准确的获取水稻地上部蛋白氮积累量信息,克服水稻组分复杂带来的光谱叠加效应造成的水稻地上部蛋白氮积累量特征波段难以确定的困难,大大提高水稻地上部蛋白氮积累量反演模型精度,适于大规模推广应用。
本发明的另一目的在于提供一种基于CatBoost回归算法的水稻地上部蛋白氮积累量遥感反演模型,其设计巧妙,计算简便,易于实现,成本低,适于大规模推广应用。
本发明的另一目的在于提供一种基于CatBoost回归算法的水稻地上部蛋白氮积累量遥感反演方法,其能够快速、准确的获取水稻地上部蛋白氮积累量信息,克服水稻组分复杂带来的光谱叠加效应造成的水稻地上部蛋白氮积累量特征波段难以确定的困难,大大提高水稻地上部蛋白氮积累量反演精度,适于大规模推广应用。
本发明的另一目的在于提供一种基于CatBoost回归算法的水稻地上部蛋白氮积累量遥感反演方法,其设计巧妙,操作简单方便,成本低,适于大规模推广应用。
为达到以上目的,在本发明的第一方面,提供一种基于CatBoost回归算法的水稻地上部蛋白氮积累量遥感反演模型,其特点是,所述的基于CatBoost回归算法的水稻地上部蛋白氮积累量遥感反演模型为Python语言的CatBoost回归模型,所述CatBoost回归模型的模型参数为:'depth':6,'iterations':684,'learning_rate':0.37691211684,'l2_leaf_reg':46,'border_count':29。
较佳地,所述CatBoost回归模型采用水稻的数据集训练而成,所述数据集包括所述水稻的m个样点的冠层反射率和地上部蛋白氮积累量,m个所述样点均匀分布在水稻种植区域,所述冠层反射率为n个特征波段的冠层反射率。
更佳地,所述m为36,所述n个特征波段为2151个特征波段,所述2151个特征波段为从350nm波段至2500nm波段。
在本发明的第二方面,提供了一种基于CatBoost回归算法的水稻地上部蛋白氮积累量遥感反演方法,其特点是,包括以下步骤:
(1)测量水稻的冠层反射率;
(2)测量所述水稻的地上部蛋白氮积累量;
(3)以所述冠层反射率为输入数据,采用Python语言的CatBoost回归模型进行计算,获得反演值,根据所述反演值与所述地上部蛋白氮积累量计算决定系数R2,改变所述CatBoost回归模型的模型参数的取值,R2的变化越大,说明所述模型参数的重要性越大,将所述模型参数按照所述重要性的大小由大到小进行排列构建模型参数调优秩次矩阵;
(4)以所述冠层反射率为所述输入数据,以所述地上部蛋白氮积累量为输出结果,训练所述CatBoost回归模型,根据所述模型参数调优秩次矩阵依次对所述模型参数进行调优,获得所述模型参数的调优值;
(5)以所述冠层反射率为所述输入数据,以所述地上部蛋白氮积累量为所述输出结果,采用所述的模型参数的调优值,训练所述CatBoost回归模型,待所述CatBoost回归模型训练结束后,获得基于CatBoost回归算法的水稻地上部蛋白氮积累量遥感反演模型,使用save方法保存所述的基于CatBoost回归算法的水稻地上部蛋白氮积累量遥感反演模型,如果需要使用所述的基于CatBoost回归算法的水稻地上部蛋白氮积累量遥感反演模型,使用load方法加载所述的基于CatBoost回归算法的水稻地上部蛋白氮积累量遥感反演模型使用。
较佳地,在所述步骤(1)中,所述测量采用高光谱辐射仪进行,所述测量的时间为10:00~14:00,所述高光谱辐射仪采用视场角为25°的镜头,所述便携式野外高光谱辐射仪的传感器探头垂直指向所述水稻的冠层并距离所述冠层的顶层的垂直高度为1米,所述传感器探头的地面视场范围直径为0.44米,所述传感器探头迎向阳光,所述测量采用标准板进行校正,所述标准板是反射率为95%~99%的标准白板。
较佳地,在所述步骤(2)中,所述的测量所述水稻的地上部蛋白氮积累量的步骤具体包括:
采集所述水稻的地上部植株,杀青,烘干,至恒重后获得干植株,测定所述干植株的重量,获得地上部干物重,根据采样覆盖面积,将地上部干物重转换为单位面积地上部干物重;
将所述干植株粉碎,测定地上部蛋白氮含量,将所述单位面积地上部干物重乘以所述地上部蛋白氮含量获得所述地上部蛋白氮积累量。
更佳地,在所述步骤(2)中,所述杀青的温度为105℃,所述杀青的时间为20分钟~30分钟,所述烘干的温度为80℃~90℃,所述测定地上部蛋白氮含量采用三氯乙酸溶液沉淀法和半微量凯氏定氮法。
较佳地,在所述步骤(3)中,所述模型参数调优秩次矩阵为:
Params={'depth','iterations','learning_rate','l2_leaf_reg','border_count'}。
更佳地,在所述步骤(4)中,所述的模型参数的调优值为:
'depth':6,'iterations':684,'learning_rate':0.37691211684,'l2_leaf_reg':46,'border_count':29。
较佳地,在所述步骤(1)中,所述的测量水稻的冠层反射率的步骤具体为测量水稻种植区域的m个样点的所述冠层反射率,m个所述样点均匀分布在所述水稻种植区域,所述冠层反射率为n个特征波段的冠层反射率;在所述步骤(2)中,所述的测量所述水稻的地上部蛋白氮积累量的步骤具体为测量该m个所述样点的所述地上部蛋白氮积累量。
更佳地,在所述步骤(1)中,所述m为36,所述n个特征波段为2151个特征波段,所述2151个特征波段为从350nm波段至2500nm波段。
本发明的有益效果主要在于:
1、本发明的基于CatBoost回归算法的水稻地上部蛋白氮积累量遥感反演模型为Python语言的CatBoost回归模型,CatBoost回归模型的模型参数为:'depth':6,'iterations':684,'learning_rate':0.37691211684,'l2_leaf_reg':46,'border_count':29,对该模型进行检验,R2在0.85以上,因此,其能够快速、准确的获取水稻地上部蛋白氮积累量信息,克服水稻组分复杂带来的光谱叠加效应造成的水稻地上部蛋白氮积累量特征波段难以确定的困难,大大提高水稻地上部蛋白氮积累量反演模型精度,适于大规模推广应用。
2、本发明的基于CatBoost回归算法的水稻地上部蛋白氮积累量遥感反演模型为Python语言的CatBoost回归模型,CatBoost回归模型的模型参数为:'depth':6,'iterations':684,'learning_rate':0.37691211684,'l2_leaf_reg':46,'border_count':29,对该模型进行检验,R2在0.85以上,因此,其设计巧妙,计算简便,易于实现,成本低,适于大规模推广应用。
3、本发明的基于CatBoost回归算法的水稻地上部蛋白氮积累量遥感反演方法,包括:测量水稻的冠层反射率;测量水稻的地上部蛋白氮积累量:以冠层反射率为输入数据,采用Python语言的CatBoost回归模型进行计算,以决定系数R2构建模型参数调优秩次矩阵;以冠层反射率为输入数据,以地上部蛋白氮积累量为输出结果,训练CatBoost回归模型,根据模型参数调优秩次矩阵依次对模型参数进行调优,获得模型参数的调优值;以冠层反射率为输入数据,以地上部蛋白氮积累量为输出结果,采用模型参数的调优值,训练CatBoost回归模型,获得基于CatBoost回归算法的水稻地上部蛋白氮积累量遥感反演模型,对该模型进行检验,R2在0.85以上,因此,其能够快速、准确的获取水稻地上部蛋白氮积累量信息,克服水稻组分复杂带来的光谱叠加效应造成的水稻地上部蛋白氮积累量特征波段难以确定的困难,大大提高水稻地上部蛋白氮积累量反演精度,适于大规模推广应用。
4、本发明的基于CatBoost回归算法的水稻地上部蛋白氮积累量遥感反演方法,包括:测量水稻的冠层反射率;测量水稻的地上部蛋白氮积累量:以冠层反射率为输入数据,采用Python语言的CatBoost回归模型进行计算,以决定系数R2构建模型参数调优秩次矩阵;以冠层反射率为输入数据,以地上部蛋白氮积累量为输出结果,训练CatBoost回归模型,根据模型参数调优秩次矩阵依次对模型参数进行调优,获得模型参数的调优值;以冠层反射率为输入数据,以地上部蛋白氮积累量为输出结果,采用模型参数的调优值,训练CatBoost回归模型,获得基于CatBoost回归算法的水稻地上部蛋白氮积累量遥感反演模型,对该模型进行检验,R2在0.85以上,因此,其设计巧妙,操作简单方便,成本低,适于大规模推广应用。
本发明的这些和其它目的、特点和优势,通过下述的详细说明、附图和权利要求得以充分体现,并可通过所附权利要求中特地指出的手段、装置和它们的组合得以实现。
附图说明
图1是本发明的基于CatBoost回归算法的水稻地上部蛋白氮积累量遥感反演方法的一具体实施例的流程示意图。
图2是图1所示的具体实施例的模型构建流程示意图。
图3是图1所示的具体实施例的模型检验结果示意图,其中实测值和预测值的单位均为g/m2
具体实施方式
本发明人针对基于高光谱估测水稻地上部蛋白氮积累量的需求,克服了因水稻组分复杂而导致的水稻地上部蛋白氮积累量特征波段难以确定以及高光谱数据特征波段筛选费时费力的困难,提出了一种基于CatBoost回归算法的水稻地上部蛋白氮积累量遥感反演模型,所述的基于CatBoost回归算法的水稻地上部蛋白氮积累量遥感反演模型为Python语言的CatBoost回归模型,所述CatBoost回归模型的模型参数为:'depth':6,'iterations':684,'learning_rate':0.37691211684,'l2_leaf_reg':46,'border_count':29。
所述CatBoost回归模型可以采用任何合适的数据集训练而成,较佳地,所述CatBoost回归模型采用水稻的数据集训练而成,所述数据集包括所述水稻的m个样点的冠层反射率和地上部蛋白氮积累量,m个所述样点均匀分布在水稻种植区域,所述冠层反射率为n个特征波段的冠层反射率。所述水稻种植区域可以是多个生态点、多个品种的水稻种植区域。
所述m和所述n为正整数,可以根据需要确定,更佳地,所述m为36,所述n个特征波段为2151个特征波段,所述2151个特征波段为从350nm波段至2500nm波段。
本发明还提供了一种基于CatBoost回归算法的水稻地上部蛋白氮积累量遥感反演方法,包括以下步骤:
(1)测量水稻的冠层反射率;
(2)测量所述水稻的地上部蛋白氮积累量;
(3)以所述冠层反射率为输入数据,采用Python语言的CatBoost回归模型进行计算,获得反演值,根据所述反演值与所述地上部蛋白氮积累量计算决定系数R2,改变所述CatBoost回归模型的模型参数的取值,R2的变化越大,说明所述模型参数的重要性越大,将所述模型参数按照所述重要性的大小由大到小进行排列构建模型参数调优秩次矩阵;
(4)以所述冠层反射率为所述输入数据,以所述地上部蛋白氮积累量为输出结果,训练所述CatBoost回归模型,根据所述模型参数调优秩次矩阵依次对所述模型参数进行调优,获得所述模型参数的调优值;
(5)以所述冠层反射率为所述输入数据,以所述地上部蛋白氮积累量为所述输出结果,采用所述的模型参数的调优值,训练所述CatBoost回归模型,待所述CatBoost回归模型训练结束后,获得基于CatBoost回归算法的水稻地上部蛋白氮积累量遥感反演模型,使用save方法保存所述的基于CatBoost回归算法的水稻地上部蛋白氮积累量遥感反演模型,如果需要使用所述的基于CatBoost回归算法的水稻地上部蛋白氮积累量遥感反演模型,使用load方法加载所述的基于CatBoost回归算法的水稻地上部蛋白氮积累量遥感反演模型使用。
在所述步骤(1)中,所述测量可以采用任何合适的光谱仪和方法进行,较佳地,在所述步骤(1)中,所述测量采用高光谱辐射仪进行,所述测量的时间为10:00~14:00,所述高光谱辐射仪采用视场角为25°的镜头,所述便携式野外高光谱辐射仪的传感器探头垂直指向所述水稻的冠层并距离所述冠层的顶层的垂直高度为1米,所述传感器探头的地面视场范围直径为0.44米,所述传感器探头迎向阳光,所述测量采用标准板进行校正,所述标准板是反射率为95%~99%的标准白板。
在所述步骤(2)中,所述的测量所述水稻的地上部蛋白氮积累量的步骤可以具体包括任何合适的方法,较佳地在所述步骤(2)中,所述的测量所述水稻的地上部蛋白氮积累量的步骤具体包括:
采集所述水稻的地上部植株,杀青,烘干,至恒重后获得干植株,测定所述干植株的重量,获得地上部干物重,根据采样覆盖面积,将地上部干物重转换为单位面积地上部干物重;
将所述干植株粉碎,测定地上部蛋白氮含量,将所述单位面积地上部干物重乘以所述地上部蛋白氮含量获得所述地上部蛋白氮积累量。
在所述步骤(2)中,所述杀青和所述烘干可以采用任何合适的条件,所述测定地上部蛋白氮含量可以采用任何合适的方法,更佳地,在所述步骤(2)中,所述杀青的温度为105℃,所述杀青的时间为20分钟~30分钟,所述烘干的温度为80℃~90℃,所述测定地上部蛋白氮含量采用三氯乙酸溶液沉淀法和半微量凯氏定氮法。
在所述步骤(3)中,所述模型参数调优秩次矩阵根据决定系数R2确定,较佳地,在所述步骤(3)中,所述模型参数调优秩次矩阵为:
Params={'depth','iterations','learning_rate','l2_leaf_reg','border_count'}。
在所述步骤(4)中,所述的模型参数的调优值根据所述模型参数调优秩次矩阵依次确定,更佳地,在所述步骤(4)中,所述的模型参数的调优值为:
'depth':6,'iterations':684,'learning_rate':0.37691211684,'l2_leaf_reg':46,'border_count':29。
为了使得所述的基于CatBoost回归算法的水稻地上部蛋白氮积累量遥感反演模型的精度更高,可以选取水稻种植区域的多个样点,测定多个样点的多个特征波段的冠层反射率以及多个样点的地上部蛋白氮积累量,较佳地,在所述步骤(1)中,所述的测量水稻的冠层反射率的步骤具体为测量水稻种植区域的m个样点的所述冠层反射率,m个所述样点均匀分布在所述水稻种植区域,所述冠层反射率为n个特征波段的冠层反射率;在所述步骤(2)中,所述的测量所述水稻的地上部蛋白氮积累量的步骤具体为测量该m个所述样点的所述地上部蛋白氮积累量。
在所述步骤(1)中,所述m和所述n为正整数,可以根据需要确定,更佳地,在所述步骤(1)中,所述m为36,所述n个特征波段为2151个特征波段,所述2151个特征波段为从350nm波段至2500nm波段。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。
实施例
本实施例的基于CatBoost回归算法的水稻地上部蛋白氮积累量遥感反演方法基于实测高光谱数据,采用了水稻种植区域(江苏省淮安市农业科学研究院淮安地区稻麦种植基地,水稻品种为淮稻5号,采样时期为水稻拔节期)采集的水稻冠层反射率光谱数据以及水稻地上部蛋白氮积累量数据,共48个采样点,这些采样点均匀分布并完全覆盖水稻种植区域整个区域。48个采样点数据采用随机的方法分为两部分,其中36个采样点的数据用于模型构建,12个采样点数据用于模型检验。基于CatBoost回归算法的水稻地上部蛋白氮积累量遥感反演方法的流程如图1所示,包括如下步骤:
1.光谱测定。
水稻冠层光谱测定使用美国ASD生产的FieldSpec Pro便携式野外高光谱辐射仪,选择在天气晴朗、无风或者风速很小时进行,时间范围10:00~14:00,采样测试人员身着深色服饰,减少对光谱仪的影响或者干扰。采样时,选用视场角为25°的镜头,传感器探头垂直指向测量目标---冠层,距离冠层顶层垂直高度约1米,地面视场范围直径为0.44米,迎向阳光,取测量10次的反射光谱平均值,作为该采样点的光谱数据。测量过程中,对每个采样点的测量前后进行标准白板校正。如果测试过程中,环境光场分布发生变化,亦进行标准白板校正,本例使用的标准白板的反射率为99%。测定的光谱数据使用FieldSpec Pro便携式野外高光谱辐射仪随机软件RS3或者ViewSpec Pro软件检查,剔除异常光谱文件,对光谱数据进行插值计算,得到范围为350nm~2500nm,分辨率为1nm的光谱数据,计算光谱平行采样光谱的平均值,最后导出光谱数据并保存为ASCII文件。
2.水稻地上部蛋白氮积累量测定
收集均匀分布于每个采样点的光谱测量视场的水稻地上部植株,数量为6株,用吸水纸包好,带回实验室,先于105℃下杀青20分钟,然后在85℃下烘干,至恒重后获得干植株,测定干植株的重量,所得数据即为水稻地上部干物重,根据采样覆盖面积,将水稻地上部干物重转换为单位面积地上部干物重(LD),单位为g/m2
将干植株粉碎,使用三氯乙酸溶液将蛋白质沉淀,采用凯氏定氮法测定沉淀中的氮含量,即为地上部蛋白氮含量(PNC),单位为(%重量)(赵世杰,史国安,董新纯.植物生理学实验导.北京:中国农业科学技术出版社,2002:89-95;李合生.植物生理生化实验原理和技术.高等教育出版社,2000:186-192)。根据下式计算地上部蛋白氮积累量(PNA):
PNA=LD×PNC。
3.模型构建
模型构建采用Python语言的CatBoost回归模型进行构建,请参见图2所示,模型构建主要包括以下步骤:
3.1数据校验
对获取的水稻冠层反射率数据进行校验,剔除异常的整条光谱曲线数据。本发明中异常光谱是指相邻光谱变化超过100%,且包含空值、负值的光谱值。
3.2数据的预处理
对校验后的水稻冠层反射率数据以及水稻地上部蛋白氮积累量数据进行预处理,包括去除包含缺失值和空值的成对水稻冠层反射率数据和水稻地上部蛋白氮积累量数据。
3.3数据集的划分
为保证模型训练和反演结果的合理评估,使用随机的方法,将整个数据集(48组)划分为两部分,75%(36组)的数据用于模型训练,25%(12组)的数据用于训练后的效果评估。
3.4训练数据集的划分
为保证模型训练的效果,使用随机的方法,在每次模型训练迭代时,将训练数据集划分为5个部分,依次对模型进行训练。
3.5模型参数调优秩次矩阵的构建
本发明中,模型训练过程模型参数的调优非常重要,为保证尽量获取最佳的模型调优,使用试错法进行模型参数调优。本发明使用决定系数R2(R2越接近于1越好)作为检验参数,构建了评估模型参数权重的参数秩次矩阵。根据训练数据集首先使用模型参数的默认值进行计算,获取反演值,根据反演值和地上部蛋白氮积累量,计算决定系数R2,然后改变模型参数的取值,R2的变化越大,说明模型参数的重要性越大,将模型参数按照重要性的大小由大到小进行排列构建模型参数调优秩次矩阵,用于后续计算。
根据训练数据集中冠层反射率数据和对应的地上部蛋白氮积累量数据,计算得到的模型参数调优秩次矩阵为:
Params={'depth','iterations','learning_rate','l2_leaf_reg','border_count'}。
3.6模型构建
依据获取的模型参数调优秩次矩阵,将建模使用的数据,包括实测的冠层反射率数据和对应的实测的地上部蛋白氮积累量数据,以实测的冠层反射率数据为输入数据,实测的地上部蛋白氮积累量数据为输出结果,训练CatBoost回归模型,根据模型参数调优秩次矩阵依次对模型参数进行调优,获得该模型完整参数及取值,如下:
'depth':6,'iterations':684,'learning_rate':0.37691211684,'l2_leaf_reg':46,'border_count':29。
待模型训练结束后,使用save方法保存模型,如需使用,运行load方法加载使用。
3.7模型检验
使用构建模型之外的12个采样点高光谱数据输入模型,使用调优后的模型参数进行计算,得到预测值,分析预测值与实测值(地上部蛋白氮积累量)的关系,结果如图3所示,模型的R2为0.9020。而使用默认参数的模型R2为0.4758。
本案例训练数据和检验数据的随机划分以及模型的构建、训练和检验使用了美国MathWorks公司开发的Matlab软件(version:R2020a 9.8.0.1380330)以及Python(version:3.7.0),通过Matlab软件调用Python的CatBoost回归模型。
因此,本发明提出了一种新的、基于实测高光谱遥感数据的基于CatBoost回归算法的水稻地上部蛋白氮积累量遥感反演模型,基于实测水稻冠层反射率数据和实地采集的水稻地上部蛋白氮积累量数据,可快速、准确的获取水稻地上部蛋白氮积累量信息,克服水稻组分复杂带来的光谱叠加效应造成的水稻地上部蛋白氮积累量特征波段难以确定的困难,并通过构建模型参数调优秩次矩阵,使用试错法对模型参数调优,有效降低了线性模型过拟合的现象,大大提高了水稻地上部蛋白氮积累量反演的精度,适用于不同生态区、不同品种以及主要生育期的水稻地上部蛋白氮积累量的定量反演,从而获得水稻氮素营养、生理状态以及水肥供给的状态,提高了水稻栽培种植过程中的生长信息获取效率,并为水稻生产中水分肥料运筹提供了基础科学数据。
与现有技术相比,本发明具有以下优点:
(1)本发明使用的CatBoost回归模型适用于基于高光谱的水稻地上部蛋白氮积累量的反演,在综合考虑高光谱350~2500nm波段范围信息的基础上,考虑了水稻体内各种物质组成和细胞结构的光学特性,特别是复杂的组分对水稻地上部蛋白氮积累量特征波段的影响和叠加效应,充分利用遥感数据所包含的水稻地上部蛋白氮积累量信息,进行水稻地上部蛋白氮积累量的反演;
(2)使用了CatBoost回归机器学习算法,构建350~2500nm反射率与水稻地上部蛋白氮积累量对数值的模型,可以充分使用中央处理器和图形处理器的算力,有效缩短模型训练时间,并通过特征组合、无偏估算梯度步长等方法,可有效减少使用线性回归等模型出现的过拟合现象,大大增强了模型的鲁棒性和适用性,提高基于高光谱信息的水稻地上部蛋白氮积累量反演的速度和效率;
(3)本发明充分考虑了模型训练和模型检验的独立性,使用随机分割的方法划分训练数据集和检验数据集,训练数据集只用于模型训练,检验数据集仅用于模型检验,以保证模型效果检验的合理性。
(4)由于模型的参数调优对于模型的计算精度非常重要,因此本发明中构建了模型参数秩次矩阵,以决定系数R2为评价参数,使用试错法进行模型参数调优,在保证参数调优效果的基础上,大大提高了模型训练和参数调优的速度。
(5)本发明提出的水稻地上部蛋白氮积累量反演方法计算简便,适用于不同生态区、不同品种以及不同生育期的水稻地上部蛋白氮积累量的遥感定量反演,可准确的反演水稻地上部蛋白氮积累量,快速的获取水稻氮素营养、生理状况和长势等信息,同时为水稻种植栽培的水分肥料运筹管理提供科学数据。
综上,本发明的基于CatBoost回归算法的水稻地上部蛋白氮积累量遥感反演模型能够快速、准确的获取水稻地上部蛋白氮积累量信息,克服水稻组分复杂带来的光谱叠加效应造成的水稻地上部蛋白氮积累量特征波段难以确定的困难,提高水稻地上部蛋白氮积累量反演模型精度,设计巧妙,计算简便,易于实现,成本低,适于大规模推广应用。
由此可见,本发明的目的已经完整并有效的予以实现。本发明的功能及结构原理已在实施例中予以展示和说明,在不背离所述原理下,实施方式可作任意修改。所以,本发明包括了基于权利要求精神及权利要求范围的所有变形实施方式。

Claims (11)

1.一种基于CatBoost回归算法的水稻地上部蛋白氮积累量遥感反演模型,其特征在于,所述的基于CatBoost回归算法的水稻地上部蛋白氮积累量遥感反演模型为Python语言的CatBoost回归模型,所述CatBoost回归模型的模型参数为:'depth':6,'iterations':684,'learning_rate':0.37691211684,'l2_leaf_reg':46,'border_count':29。
2.如权利要求1所述的基于CatBoost回归算法的水稻地上部蛋白氮积累量遥感反演模型,其特征在于,所述CatBoost回归模型采用水稻的数据集训练而成,所述数据集包括所述水稻的m个样点的冠层反射率和地上部蛋白氮积累量,m个所述样点均匀分布在水稻种植区域,所述冠层反射率为n个特征波段的冠层反射率。
3.如权利要求2所述的基于CatBoost回归算法的水稻地上部蛋白氮积累量遥感反演模型,其特征在于,所述m为36,所述n个特征波段为2151个特征波段,所述2151个特征波段为从350nm波段至2500nm波段。
4.一种基于CatBoost回归算法的水稻地上部蛋白氮积累量遥感反演方法,其特征在于,包括以下步骤:
(1)测量水稻的冠层反射率;
(2)测量所述水稻的地上部蛋白氮积累量;
(3)以所述冠层反射率为输入数据,采用Python语言的CatBoost回归模型进行计算,获得反演值,根据所述反演值与所述地上部蛋白氮积累量计算决定系数R2,改变所述CatBoost回归模型的模型参数的取值,R2的变化越大,说明所述模型参数的重要性越大,将所述模型参数按照所述重要性的大小由大到小进行排列构建模型参数调优秩次矩阵;
(4)以所述冠层反射率为所述输入数据,以所述地上部蛋白氮积累量为输出结果,训练所述CatBoost回归模型,根据所述模型参数调优秩次矩阵依次对所述模型参数进行调优,获得所述模型参数的调优值;
(5)以所述冠层反射率为所述输入数据,以所述地上部蛋白氮积累量为所述输出结果,采用所述的模型参数的调优值,训练所述CatBoost回归模型,待所述CatBoost回归模型训练结束后,获得基于CatBoost回归算法的水稻地上部蛋白氮积累量遥感反演模型,使用save方法保存所述的基于CatBoost回归算法的水稻地上部蛋白氮积累量遥感反演模型,如果需要使用所述的基于CatBoost回归算法的水稻地上部蛋白氮积累量遥感反演模型,使用load方法加载所述的基于CatBoost回归算法的水稻地上部蛋白氮积累量遥感反演模型使用。
5.如权利要求4所述的基于CatBoost回归算法的水稻地上部蛋白氮积累量遥感反演方法,其特征在于,在所述步骤(1)中,所述测量采用高光谱辐射仪进行,所述测量的时间为10:00~14:00,所述高光谱辐射仪采用视场角为25°的镜头,所述便携式野外高光谱辐射仪的传感器探头垂直指向所述水稻的冠层并距离所述冠层的顶层的垂直高度为1米,所述传感器探头的地面视场范围直径为0.44米,所述传感器探头迎向阳光,所述测量采用标准板进行校正,所述标准板是反射率为95%~99%的标准白板。
6.如权利要求4所述的基于CatBoost回归算法的水稻地上部蛋白氮积累量遥感反演方法,其特征在于,在所述步骤(2)中,所述的测量所述水稻的地上部蛋白氮积累量的步骤具体包括:
采集所述水稻的地上部植株,杀青,烘干,至恒重后获得干植株,测定所述干植株的重量,获得地上部干物重,根据采样覆盖面积,将地上部干物重转换为单位面积地上部干物重;
将所述干植株粉碎,测定地上部蛋白氮含量,将所述单位面积地上部干物重乘以所述地上部蛋白氮含量获得所述地上部蛋白氮积累量。
7.如权利要求6所述的基于CatBoost回归算法的水稻地上部蛋白氮积累量遥感反演方法,其特征在于,在所述步骤(2)中,所述杀青的温度为105℃,所述杀青的时间为20分钟~30分钟,所述烘干的温度为80℃~90℃,所述测定地上部蛋白氮含量采用三氯乙酸溶液沉淀法和半微量凯氏定氮法。
8.如权利要求4所述的基于CatBoost回归算法的水稻地上部蛋白氮积累量遥感反演方法,其特征在于,在所述步骤(3)中,所述模型参数调优秩次矩阵为:
Params={'depth','iterations','learning_rate','l2_leaf_reg','border_count'}。
9.如权利要求8所述的基于CatBoost回归算法的水稻地上部蛋白氮积累量遥感反演方法,其特征在于,在所述步骤(4)中,所述的模型参数的调优值为:
'depth':6,'iterations':684,'learning_rate':0.37691211684,'l2_leaf_reg':46,'border_count':29。
10.如权利要求4所述的基于CatBoost回归算法的水稻地上部蛋白氮积累量遥感反演方法,其特征在于,在所述步骤(1)中,所述的测量水稻的冠层反射率的步骤具体为测量水稻种植区域的m个样点的所述冠层反射率,m个所述样点均匀分布在所述水稻种植区域,所述冠层反射率为n个特征波段的冠层反射率;在所述步骤(2)中,所述的测量所述水稻的地上部蛋白氮积累量的步骤具体为测量该m个所述样点的所述地上部蛋白氮积累量。
11.如权利要求10所述的基于CatBoost回归算法的水稻地上部蛋白氮积累量遥感反演方法,其特征在于,在所述步骤(1)中,所述m为36,所述n个特征波段为2151个特征波段,所述2151个特征波段为从350nm波段至2500nm波段。
CN202011318134.XA 2020-11-23 2020-11-23 基于CatBoost回归算法的水稻地上部蛋白氮积累量遥感反演模型和方法 Pending CN112525831A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011318134.XA CN112525831A (zh) 2020-11-23 2020-11-23 基于CatBoost回归算法的水稻地上部蛋白氮积累量遥感反演模型和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011318134.XA CN112525831A (zh) 2020-11-23 2020-11-23 基于CatBoost回归算法的水稻地上部蛋白氮积累量遥感反演模型和方法

Publications (1)

Publication Number Publication Date
CN112525831A true CN112525831A (zh) 2021-03-19

Family

ID=74992500

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011318134.XA Pending CN112525831A (zh) 2020-11-23 2020-11-23 基于CatBoost回归算法的水稻地上部蛋白氮积累量遥感反演模型和方法

Country Status (1)

Country Link
CN (1) CN112525831A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114993268A (zh) * 2022-04-13 2022-09-02 南京信息工程大学 结合CatBoost的水深反演方法、装置及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111829965A (zh) * 2020-08-04 2020-10-27 淮阴师范学院 水稻地上部淀粉积累量遥感反演模型和方法
CN111855590A (zh) * 2020-08-04 2020-10-30 淮阴师范学院 水稻叶片淀粉积累量遥感反演模型和方法
CN111855589A (zh) * 2020-08-04 2020-10-30 淮阴师范学院 水稻叶片氮积累量遥感反演模型和方法
CN111855591A (zh) * 2020-08-04 2020-10-30 淮阴师范学院 水稻地上部碳氮比遥感反演模型和方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111829965A (zh) * 2020-08-04 2020-10-27 淮阴师范学院 水稻地上部淀粉积累量遥感反演模型和方法
CN111855590A (zh) * 2020-08-04 2020-10-30 淮阴师范学院 水稻叶片淀粉积累量遥感反演模型和方法
CN111855589A (zh) * 2020-08-04 2020-10-30 淮阴师范学院 水稻叶片氮积累量遥感反演模型和方法
CN111855591A (zh) * 2020-08-04 2020-10-30 淮阴师范学院 水稻地上部碳氮比遥感反演模型和方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114993268A (zh) * 2022-04-13 2022-09-02 南京信息工程大学 结合CatBoost的水深反演方法、装置及存储介质

Similar Documents

Publication Publication Date Title
CN111855589A (zh) 水稻叶片氮积累量遥感反演模型和方法
CN111855591A (zh) 水稻地上部碳氮比遥感反演模型和方法
CN111855590A (zh) 水稻叶片淀粉积累量遥感反演模型和方法
CN109187441B (zh) 基于冠层光谱信息的夏玉米含氮量监测模型的构建方法
CN107505271B (zh) 基于氮素组分辐射传输模型的植株氮素估算方法和系统
CN111829965A (zh) 水稻地上部淀粉积累量遥感反演模型和方法
CN113268923B (zh) 一种基于模拟多光谱的夏玉米产量估算方法
CN107796764B (zh) 一种基于三波段植被指数的小麦叶面积指数估算模型的构建方法
CN110567892B (zh) 一种基于临界氮浓度的夏玉米氮素高光谱预测方法
CN111855593A (zh) 水稻叶片淀粉含量遥感反演模型和方法
CN111044516B (zh) 一种水稻叶绿素含量遥感估测方法
CN111855592A (zh) 水稻单位面积内地上部干物重遥感反演模型和方法
CN105445229A (zh) 基于氮平衡光谱法的小麦春季氮肥施用方法及其追氮量模型的构建方法
CN112362812A (zh) 基于Lars算法的水稻叶片叶绿素类胡萝卜素含量比值遥感反演模型和方法
CN112270131A (zh) 基于ard回归算法的水稻叶面积指数遥感反演模型和方法
Xie et al. Hyperspectral characteristics and growth monitoring of rice (Oryza sativa) under asymmetric warming
CN104778349B (zh) 一种用于水稻表土氮肥施用等级评定方法
CN112816618A (zh) 一种氮高效小麦品种的筛选方法
CN105608296B (zh) 一种基于荔枝冠层光谱的叶片钾浓度反演方法
CN113049499A (zh) 水体总氮浓度间接遥感反演方法、存储介质和终端设备
CN112632847A (zh) 基于XGBoost回归算法的水稻叶片淀粉含量遥感反演模型和方法
CN112525831A (zh) 基于CatBoost回归算法的水稻地上部蛋白氮积累量遥感反演模型和方法
CN112630167A (zh) 基于支持向量机回归算法的水稻叶片碳氮比遥感反演模型和方法
CN112270130A (zh) 基于LightGBM回归算法的水稻叶片可溶性糖积累量遥感反演模型和方法
CN112362809A (zh) 基于被动攻击回归算法的水稻地上部氮含量遥感反演模型和方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210319