CN116485757A - 一种冬小麦全氮含量预测方法 - Google Patents

一种冬小麦全氮含量预测方法 Download PDF

Info

Publication number
CN116485757A
CN116485757A CN202310454134.XA CN202310454134A CN116485757A CN 116485757 A CN116485757 A CN 116485757A CN 202310454134 A CN202310454134 A CN 202310454134A CN 116485757 A CN116485757 A CN 116485757A
Authority
CN
China
Prior art keywords
prediction
tnc
model
machine learning
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310454134.XA
Other languages
English (en)
Inventor
陈震
邱志鹏
黄修桥
李金山
段福义
程千
冯亚阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Huayuan Water Saving Co ltd
Farmland Irrigation Research Institute of CAAS
Original Assignee
Jiangsu Huayuan Water Saving Co ltd
Farmland Irrigation Research Institute of CAAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Huayuan Water Saving Co ltd, Farmland Irrigation Research Institute of CAAS filed Critical Jiangsu Huayuan Water Saving Co ltd
Priority to CN202310454134.XA priority Critical patent/CN116485757A/zh
Publication of CN116485757A publication Critical patent/CN116485757A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/02Agriculture; Fishing; Forestry; Mining
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/40Analysis of texture
    • G06T7/41Analysis of texture based on statistical description of texture
    • G06T7/45Analysis of texture based on statistical description of texture using co-occurrence matrix computation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10032Satellite or aerial image; Remote sensing
    • G06T2207/10036Multispectral image; Hyperspectral image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30181Earth observation
    • G06T2207/30188Vegetation; Agriculture

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Business, Economics & Management (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Quality & Reliability (AREA)
  • Radiology & Medical Imaging (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Agronomy & Crop Science (AREA)
  • Animal Husbandry (AREA)
  • Marine Sciences & Fisheries (AREA)
  • Mining & Mineral Resources (AREA)
  • Evolutionary Computation (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种冬小麦全氮含量预测方法,基于无人机遥感技术获取RGB和多光谱的光谱特征和纹理特征进行数据融合作为模型输入特征构建基于堆叠方法的集成预测模型进行预测。RGB和多光谱的光谱特征和纹理特征数据融合作为模型输入特征的方式,能够产生更高的预测精度;基于堆叠方法的Stacking集成学习模型可以整合多个基础学习模型的优点,弥补单一模型的局限性和不足,在回归预测中产生的结果具有更好的鲁棒性和泛化能力,结果表明,基于多源光谱特征和纹理特征融合以及集成学习方法能提高冬小麦TNC的预测精度,可成功估算抽穗期不同氮肥处理下冬小麦的TNC,可为评价不同氮肥处理下冬小麦的TNC提供数据支持。

Description

一种冬小麦全氮含量预测方法
技术领域
本发明涉及一种灌溉决策系统,具体是一种冬小麦全氮含量预测方法,属于农林灌溉技术领域。
背景技术
冬小麦在全世界范围内都广泛种植,是中国的重要粮食作物之一,与国家的粮食安全紧密相关。氮素是作物生长发育最需要的营养物质之一,对作物的生长活动以及产量和品质都发挥着至关重要的作用。植株的全氮含量是表征作物氮素状况的主要指标,因此,监测作物的全氮含量可以有效获取作物的营养状况,有利于制定合理的田间管理措施。传统的氮含量测定方法需要破坏性取样,过程繁琐、时间久、消耗大量的人力物力,虽然近年来出现了叶绿素仪等方法可以无损估测植株的氮含量,但是这些仪器测得的植株氮含量无法全面反映出作物植株的总体状况。
随着无人机遥感技术的发展,在农业领域利用无人机搭载传感器以高通量和非破坏性的方式对土壤和作物TNC监测开展了大量研究。例如:Lopez-Calderon证明了基于无人机多光谱影像数据估测forage maize全氮含量的有效性,Liu证明了基于无人机RGB影像反演冬小麦叶氮含量的有效性。常用的RGB传感器包含3个波段的信息,分辨率高;多光谱传感器包含5个波段的信息,相比RGB传感器具有更多的敏感波段信息。这两种传感器体型小,成本低,数据处理简单、便于拆卸安装携带,在农业领域受到广泛应用。据研究显示,红色、近红、热红外等波段在利用无人机遥感技术监测作物时表现良好。由于可能会受到土壤信息和冠层生物量大的影响,造成获取的光谱信息和植被指数在作物监测中表现不佳,因此要选用敏感性不同的光谱特征组合来获取高精度的预测数据。此外这些研究大多采用单一传感器证明了无人机遥感技术可以运用在预测氮含量方面,基于无人机遥感技术多源传感器数据融合来预测作物总氮含量的研究还相对较少。
纹理信息用于识别图像中物体或者区域的重要特征,是遥感影像的补充,普遍用于图像分类中。不同的氮处理条件会影响作物的生长,会造成植株高度差异、结构差异以及叶片的大小和颜色差异等,最终导致光谱影像中的纹理特征发生变化。目前,纹理特征在植被识别分类、氮素反演、病情检测等方面均有应用。然而上述研究大多只采用RGB纹理特征做分析,通过RGB和多光谱的纹理特征来做氮含量全面评估的研究还较少。
近年来,从数据中自动寻找规律并利用规律对未知数据进行预测的机器学习方法被广泛应用在数据密集型领域。机器学习算法可以用来解决农业中的多元非线性问题并取得了满意的结果。例如:Li证明了基于随机森林算法的水稻冠层氮素含量高光谱反演模型可解释、所需样本少、不会过拟合、精度高(验证区检验精度R2=0.73)且具有普适性。Berger结合机器学习回归来估测作物氮含量,证明了高斯过程回归模型可以提供准确的地上氮模拟。Zhang将岭回归分析方法引入作物氮素营养监测光谱探测方法的研究领域,证明了岭回归在该领域的适用性。Mahajan通过机器学习建模来估测芒果叶片营养状况,证明了ENR在估测营养状况方面的可行性。这些研究充分证明了RFR、GPR、RR和ENR在农业监测领域具有不错的精度。
与单一机器学习模型相比,集成学习模型具有更好的精度。集成学习模型作为机器学习模型中的一种,是通过组合多个弱学习模型获得一个更全面的模型,在样本大小不同的数据集中都有良好的性能。Stacking回归就属于集成学习模型,它通过组合多个基础学习器并把它们特征较好的部分给抓取出来进而提高模型的精确度。基础学习器选择的多样性和充分性保证了学习器之间的信息互相补充的能力,是保证模型获得正确结果的关键。Stacking回归方法在农业领域广泛应用,例如估测马铃薯叶绿素含量、估测柑橘叶片氮含量、估测苜蓿产量等方面都获得了高于单一机器学习模型的精度。目前,还没有使用多源光谱特征和纹理特征堆叠集成学习方法预测冬小麦氮含量的研究。
发明内容
针对上述问题,本发明提供一种冬小麦全氮含量预测方法,基于多源光谱特征和纹理特征融合以及集成学习方法,能够实现预测冬小麦抽穗期在不同氮肥处理下冬小麦全氮含量的前提下实现较高的预测精度,可以为评价不同氮肥处理下冬小麦全氮含量提供数据支持。
为实现上述目的,本冬小麦全氮含量预测方法具体包括以下步骤:
Step1光谱数据的获取:通过搭载多光谱传感器和RGB传感器的无人机获取正射影像数据;
Step2无人机图像预处理:
Step2-1将抽穗期获取到的同时期的无人机多光谱影像和RGB影像使用特征点匹配算法对齐图像;
Step2-2根据无人机影像和位置数据生成飞行区域的稀疏点云;基于稀疏点云建立空间网格,并且加入GCP的空间坐标信息;生成具有精确位置的稀疏点云,飞行区域的表面几何结构和空间纹理信息生成;最终生成飞行区域的高清数字正射影像和数字表面模型,并将处理后的图像导出为TIFF图像;
Step2-3将高清数字正射影像按照小区划分,划分为带有ID的多个区域,分别识别获取对应ID区域的光谱信息;
Step2-4进行纹理特征的提取,按照ID提取出的所有特征像素值的均值被用作相应的特征;
Step3植被指数计算:根据光谱影像的波段信息采用灰度共生矩阵分别提取多光谱影像和RGB影像的光谱信息和纹理信息,计算对TNC敏感的植被指数;
Step4构建基于堆叠方法的集成预测模型并预测:
Step4-1将RGB影像的光谱特征和纹理特征以及多光谱影像的光谱特征和纹理特征作为输入特征分别进行训练、并构建多个基础机器学习TNC预测模型,采用五折交叉验证方法将所有的数据集随机均匀划分为5份,并且对于不同输入特征均采用相同的划分方法,将其中的每1份做验证集、其余4份做训练集,训练5次后得到的所有数据均作为训练样本和验证样本,分别产生对应五个训练集的5组验证数据,将这5组验证数据纵向叠起来得到了测试集预测矩阵、用作次级机器学习模型的测试集,将验证集预测的结果做均值,得到各基础机器学习TNC预测模型的预测精度;
Step4-2采用Stacking集成学习模型作为次级机器学习模型来集成各个基础机器学习TNC预测模型的预测能力,同时采用五折交叉验证的方法训练Stacking集成学习模型;
Step4-3基于测试集预测矩阵产生的5组验证结果,取均值得到最终的预测精度。
进一步的,Step4-1中,多个基础机器学习TNC预测模型至少包括RFR学习模型。
进一步的,Step4-1中,多个基础机器学习TNC预测模型是GPR学习模型、RFR学习模型、RR学习模型和ENR学习模型四个基础机器学习TNC预测模型。
进一步的,Step4-1中,多个基础机器学习TNC预测模型使用不同的参数或不同的数据子集进行训练。
进一步的,Step3中,纹理信息包括平均值、方差、同质性、对比度、不相似性、熵、第二力矩和相关性。
进一步的,Step3中,针对多光谱影像,通过多光谱影像的光谱反射率计算对TNC敏感的植被指数;针对RGB影像,对RGB影像三个通道的平均DN值进行归一化处理,将红、绿、蓝三个通道定义为R、G、B,归一化数码影像三个通道DN值后得到了r、g、b三个变量,并根据三个变量计算对TNC敏感的植被指数。
与现有技术相比,本冬小麦全氮含量预测方法基于无人机遥感技术获取RGB和多光谱的光谱特征和纹理特征进行数据融合作为模型输入特征构建基于堆叠方法的集成预测模型进行预测;RGB和多光谱的光谱特征和纹理特征数据融合作为模型输入特征的方式,不同传感器获取的数据都以独特和互补的方式对TNC的预测做出贡献,因此能够产生更高的预测精度;基于堆叠方法的Stacking集成学习模型预测结果的均值作为机器学习模型的精度,这不仅解决了小样本量的问题,还提高了模型的泛化能力,同时可极大降低回归结果的偏差、提高训练精度,另外,Stacking集成学习模型可以整合多个基础学习模型的优点,弥补单一模型的局限性和不足,在回归预测中产生的结果具有更好的鲁棒性和泛化能力,集成学习模型结合不同的基础模型预测结果,可以减少单个模型过拟合的风险,避免受到维度灾难的影响,可提高集成模型的整体泛化能力;结果表明,基于多源光谱特征和纹理特征融合以及集成学习方法能提高冬小麦TNC的预测精度,可成功估算抽穗期不同氮肥处理下冬小麦的TNC,可为评价不同氮肥处理下冬小麦的TNC提供数据支持。
附图说明
图1是试验区冬小麦生长季节的日平均温度、降雨量和辐射度示图;
图2是Stacking集成学习模型示图;
图3是基于无人机RGB和多光谱的光谱特征和纹理特征构建的个体机器学习模型和集成学习模型的预测精度的统计分布示图;
图4是单一机器学习模型在Stacking集合学习模型中的贡献度示图;
图5是最佳TNC预测模型的实测值与预测值示图;
图6是试验区预测TNC分布示图。
具体实施方式
下面以河南省新乡市中国农业科学院七里营综合试验基地(113°45′38″N,35°8′10″E)作为试验研究区域为例,结合附图对本发明做进一步说明。
一、试验区和试验设计
该试验基地属于温带大陆性季风气候,冬小麦生长季节的日平均温度、降雨量和辐射度如图1所示,五月的温度和辐射强度最高,三月的降雨量最大;温度在一月份达到最低,辐射度在11月达到最低,随着冬小麦的生长,温度和辐射度都在不断增加;降雨量主要集中在11月和3月,12月、4月和5月次之。
试验区域由180个小区组成,如下表所示,在全生育期设置了N1(300kg·hm-2)、N2(180kg·hm-2)、N3(60kg·hm-2)3个处理,于拔节期和抽穗期2个生育期施肥,每个小区的总施肥量按比例划分3份,拔节期施肥量为2份,抽穗期施肥量为1份。每个氮肥处理由60个小区组成,长3m,宽1.5m,行距20cm,面积为4.5m2。本试验选用了30个小麦品种,每个处理中两个重复以确保试验的客观性。生产领域中,农药、化肥和灌溉量根据当地管理实践标准进行。植株全氮含量(TNC)的实测数据来自于小麦的抽穗期(2021年4月23日),在每个小区长势均匀的地方分别取6株具有代表性的小麦作为该小区的小麦样本,用剪刀作处理只留下地上部分,共得到180个小麦样本。将小麦样本在80℃条件下烘干称重,然后将样本植株磨碎过筛,最后使用浓硫酸加双氧水消煮、并用凯氏定氮分析仪获取小麦样本的总氮含量。
二、光谱数据的获取
试验采用一架M210(深圳大疆科技有限公司,中国深圳)无人机搭载一台Red-EdgeMX多光谱传感器和一架精灵四Pro(深圳大疆科技有限公司,中国深圳)无人机搭载RGB传感器来获取无人机多传感器的影像数据。
大疆M210是四轴无人器,最大起飞重量为6.14kg,平均续航时间约为30min,最大水平飞行速度为18m/s,搭载在该无人机上的Red-Edge MX传感器共有红色、绿色、蓝色、近红外和红色边缘五个通道,它们的中心波长为668nm、560nm、475nm、840nm和717nm,波段的带宽分别为10nm、20nm、20nm、40nm和10nm,每个通道具有相同的分辨率、均为1280×960,视野为47.2°。它还配备有一个校准板,需要在飞行任务执行前后对传感器进行校准,方便后期图像处理时将多光谱传感器的DN值(遥感影像像元亮度值)转化为反射率。大疆精灵4Pro是四旋翼无人机,最大起飞重量为1.38kg,最大水平飞行速度为20m/s,最大上升速度为6m/s,飞行续航时间大约为30min,搭载在该飞机上的是RGB传感器,分辨率为3000×4000,镜头视场角为94°。这两架无人机的飞行任务均是在2021年4月23日的11:00-14:00之间进行的,这段时间内天气晴朗无云,能够尽可能避免阴影的干扰,执行飞行任务的飞行高度均为30m,航向重叠率为85%,旁向重叠率为80%。每个传感器都采用了具有毫米级精度的GNSS(全球导航卫星系统),准确的记录了所设置的地面控制点(GCP)的位置,便于后期的地理校正,并且传感器采用的拍照模式为垂直地面等时间间隔拍照。
三、无人机图像预处理
将抽穗期获取到的同时期的无人机多光谱影像和RGB影像分别导入到Pix4DMapper Pro软件(Pix4D SA,Switzerland)中,使用特征点匹配算法对齐图像。首先根据无人机影像和位置数据生成飞行区域的稀疏点云;基于稀疏点云建立空间网格,并且加入GCP的空间坐标信息;生成具有精确位置的稀疏点云,飞行区域的表面几何结构和空间纹理信息生成;最终生成飞行区域的高清数字正射影像(DOM)和数字表面模型(DSM),并将处理后的图像导出为TIFF图像。采用ArcMap 10.5软件(美国股份有限公司环境系统研究所)分别将多光谱和RGB的高清数字正射影像按照小区划分,创建shapefile文件,划分为180个带有ID的区域,分别识别获取对应ID区域的光谱信息。为了最大程度的减小边缘效应的影像,创建的shapefile文件省略图片边缘区域,剪裁得到试验所需要的图像,然后将该图像导入到ENVI 5.3软件(Exelis Visual Information Solutions,Inc.,Boulder,USA)中进行纹理特征的提取。按照ID提取出的所有特征像素值的均值被用作相应的特征。
四、植被指数的计算
根据光谱影像的波段信息,本试验选择了广泛使用的灰度共生矩阵(GLCM)分别提取多光谱影像和RGB影像的纹理信息来预测TNC。采用ENVI 5.3软件来提取两种影像的纹理信息,包括平均值(ME)、方差(VA)、同质性(HO)、对比度(CO)、不相似性(DI)、熵(EN)、第二力矩(SE)和相关性(COR)。通过多光谱影像的光谱反射率计算了21个对TNC敏感的植被指数;又对数码影像三个通道的平均DN值进行归一化处理,将红、绿、蓝三个通道定义为R、G、B,归一化数码影像三个通道DN值后得到了r、g、b三个变量,并且根据三个数码影像变量又计算了6个对TNC敏感的植被指数。所有特征的信息如以下两个表所示。
上表中:/-经验的可见光植被指数,ME-平均值,HO-同质性,DI-不相似性,EN-熵,SE-第二力矩,VA-方差,CO-对比度,COR-相关性。
上表中:MS-多光谱,ME-平均值,HO-同质性,DI-不相似性,EN-熵,SE-第二力矩,VA-方差,CO-对比度,COR-相关性。
五、模型框架
为了提高预测性能,本试验基于多源传感器设计一种基于堆叠方法的集成模型的TNC预测精度,包含以下两个步骤:(1)基于多源传感器数据分别进行训练,构建四种基础机器学习TNC预测模型;(2)通过RR学习器对多个预测结果进行堆叠。这四种基础机器学习TNC预测模型分别为:高斯过程回归(GPR);随机森林回归(RFR);岭回归(RR);弹性网络回归(ENR)。四种基础机器学习TNC预测模型使用不同的参数或不同的数据子集进行训练。这四种机器学习模型具有不同的原理,在许多研究中已经对其适用性得到了评估,可以用于TNC的预测,并且通过多个机器学习模型进行结果预测能够补充更多有用信息,对构建集成机器学习模型非常重要。下面对四种基础机器学习TNC预测模型进行简要描述:GPR是一种通过样本学习估计回归模型参数的监督学习过程,理论上是紧致空间内任意连续函数的通用近似,它的任何随机变量的线性组合都符合正态分布,回归过程提供了一种可能的非参数建模方法可用于解决各种工程问题;RFR是一种包含多个决策树的机器学习模型,能够根据决策规则对因变量和自变量之间的关系进行建模,可以处理大量输入变量,在决定类别时评估变量的重要性,产生更高的准确性,平衡错误并快速挖掘数据;RR是一种专门用于协方差数据分析的有偏估计回归方法,以损失部分信息、降低精度为代价获得更符合实际的结果,拟合结果较好;ENR是岭回归和Lasso回归的组合,是一种不断迭代的方法,保持了Ridge的正则性质,可以永远的产生有效解并且不会产生交叉路径。
Stacking回归模型是集成学习模型中的一种,它能够通过集成方法学习到数据的不同特征,得到更好的预测结果。Stacking集成学习模型的构建如图2所示。本试验采用五折交叉验证方法(Cross-Validation)将所有的数据集随机均匀划分为5份,划分了80次,并且对于不同输入特征均采用相同的划分方法,将其中的每1份做验证集,其余4份做训练集,训练5次,得到的所有数据均作为训练样本和验证样本。基于初始数据集构建基础机器学习TNC预测模型预测后,分别产生对应五个训练集的5组验证数据,将这5组验证数据纵向叠起来得到了测试集预测矩阵,进一步用作次级机器学习模型的测试集,将验证集预测的结果做均值,得到各基础机器学习TNC预测模型的预测精度。采用了Stacking集成学习模型作为次级机器学习模型来集成各个基础机器学习TNC预测模型的预测能力,同时采用五折交叉验证的方法训练Stacking集成学习模型。基于测试集预测矩阵产生了5组验证结果,取均值得到最终的预测精度。按照五折交叉验证的方法多次划分数据集,更有利于诠释不同模型的预测精度,提高预测的可靠度。
六、模型精度评估参数
本试验共计对初始数据集划分为训练集和验证集80次,每次均采用五折交叉验证的方式训练模型,80次划分后得到了400次测试结果,这些测试结果的均值被用作模型精度评估参数,包括决定系数(R2)、均方根误差(RMSE)、性能与偏差的比值(RPD)和性能与四分位距的比值(RPIQ)。预测模型的R2、RPD和RPIQ越大,RMSE越小,表明模型的预测能力越好。以上四个模型精度评估参数的公式如下:
式中:yi是测量值,是预测值,/>是测量值的均值,N是样本量,SD是预测集的测量值的标准差,Q3是第三四分位数的下限,Q1是第一四分位数的上限。
本试验在R语言中使用importance函数计算每个基础学习模型在集成模型中的重要性,每个基础学习模型的重要性会被分配一个百分比,表示该基础学习模型对集成学习模型的解释能力的贡献程度。重要性百分比越高,该基础学习模型的贡献越大。
七、结果分析
试验中全部试验小区和三个氮处理下小区的全氮含量如下表所示。本试验中所有试验小区抽样样本得全氮含量平均值为20.07g·mg-1。三个氮处理的全氮含量均值不同,N1处理的样本全氮含量大于N2和N3处理,为23.66g·mg-1,N3处理的全氮含量最低,为15.28g·mg-1。所有小区以及各氮处理下小区的数据范围、标准差(SD)、分位数统计以及变异系数(CV),表明各氮处理之间的全氮含量差异显著而且数据分离性很好。
八、TNC预测精度分析
本试验基于冬小麦抽穗期的RGB和多光谱影像,分别采用四种基础机器学习方法和一种集合机器学习方法对TNC进行预测,400次预测结果的均值如下表所示,400次预测结果如图3所示。
以RGB的光谱指数作为输入特征时,基础机器学习TNC预测模型中GPR的表现最佳(R2=0.493,RMSE=4.273mg·g-1,RPD=1.386,RPIQ=2.083);以多光谱的光谱特征作为输入变量时,基础学习器中GPR表现最佳(R2=0.541,RMSE=4.013mg·g-1,RPD=1.468,RPIQ=2.194)。为了探索纹理信息的加入是否会提升模型的预测精度,本试验分别在加入RGB影像的纹理信息和多光谱影像纹理信息。由表可以看出,RGB光谱特征和纹理特征的组合作为输入特征使四种基础机器学习TNC预测模型精度均得到了提升,其中提升最大的是RFR模型,R2从0.382提升到了0.531,同时多光谱光谱特征和纹理特征的组合作为输入特征也使四种基础机器学习TNC预测模型精度均得到了提升,其中RFR表现最佳,R2从0.465提升到了0.65。本试验又分别基于RGB影像和多光谱影像的光谱和纹理特征中的三个特征作为输入特征可以看出,基于多光谱影像的光谱特征和纹理特征以及RGB影像的纹理特征作为输入特征时,四种基础机器学习TNC预测模型均表现最佳,其中RFR和ENR模型的R2最大,均达到了0.675,RFR模型的RMSE最小,为3.404mg·g-1,因此RFR模型的表现最佳。本试验又基于RGB和多光谱的光谱特征和纹理特征作为输入变量,表中结果显示这四种基础机器学习TNC预测模型的精度均为最高,并且Stacking集成学习模型是最佳TNC预测模型,该模型的R2、RMSE、RPD和RPIQ分别为0.7、3.352mg·g-1、1.822和2.724。本试验又基于不同输入特征构建的基础机器学习TNC预测模型的预测结果,分别采用Stacking(RR)方法构建次级机器学习模型。由图3所示,相同输入特征构建的次级机器学习模型与各基础机器学习TNC预测模型精度对比发现,次级机器学习模型精度均高于四种基础机器学习TNC预测模型。由上表所示,通过对比各次级机器学习模型发现,基于RGB和多光谱的光谱特征和纹理特征构建的次级机器学习模型精度最高(R2=0.726,RMSE=3.203mg·g-1,RPD=1.867,RPIQ=2.827),是最佳TNC预测模型。
图4所示为基于七种输入特征构建的次级机器学习Stacking集成学习模型时对应的四种基础机器学习TNC预测模型结果重要性程度分布,可以看出RFR模型的结果在这7个次级机器学习模型中均占据了最大权重,表明了构建次级机器学习模型时,具有高精度的基础机器学习TNC预测模型的重要性更高,同时还表明了基础机器学习TNC预测模型与集合机器学习模型的性能密切相关。
图5所示为基于七种输入特征分别构建的最佳TNC预测模型的实测值与预测值,基于RGB光谱特征作为输入特征时,R2为0.511,加入RGB纹理特征后的TNC预测模型的R2提升到了0.562;基于多光谱的光谱特征作为输入特征时的R2为0.551,加入多光谱纹理特征后,R2提升到了0.672;将RGB和多光谱的光谱特征和纹理特征中的三者相结合作为模型输入特征,发现基于多光谱光谱特征和纹理特征以及RGB纹理特征构建的TNC预测模型的R2值最大,达到了0.71,基于RGB光谱特征和纹理特征以及多光谱的光谱特征构建的TNC预测模型的R2最小,为0.597;基于RGB和多光谱的光谱特征和纹理特征构建的TNC预测模型R2最大。并且基于三种特征组合构建的TNC产量预测模型的R2均高于特征组合中单一特征或者两个特征组合构建的TNC产量预测模型的R2
本试验通过基于多种特征构建的TNC预测模型精度对比分析发现基于RGB和多光谱的光谱特征和纹理特征构建的次级机器学习模型(RR)的TNC预测精度最佳,因此用于生成预测TNC分布图如图6所示,不同氮处理之间的TNC的t检验分析结果如下表所示,P-value均小于0.001,表明三个氮处理之间的TNC差异显著,顺序为N1>N2>N3。通过预测产量的分布来看,N1处理的TNC在15-31mg·g-1之间,根据实测TNC结果来看,N1处理的TNC最高,在15-32mg·g-1之间,然后是N2和N3处理,这与次级机器学习模型(RR)的预测的TNC分布一致,证明了该模型可用于冬小麦TNC的估测。
本冬小麦全氮含量预测方法基于无人机遥感技术获取RGB和多光谱的光谱特征和纹理特征进行数据融合作为模型输入特征构建基于堆叠方法的集成预测模型进行预测,结果表明,基于多源光谱特征和纹理特征融合以及集成学习方法能提高冬小麦TNC的预测精度,可成功估算抽穗期不同氮肥处理下冬小麦的TNC,可为评价不同氮肥处理下冬小麦的TNC提供数据支持。

Claims (6)

1.一种冬小麦全氮含量预测方法,具体包括以下步骤:
Step1光谱数据的获取:通过搭载多光谱传感器和RGB传感器的无人机获取正射影像数据;
Step2无人机图像预处理:
Step2-1将抽穗期获取到的同时期的无人机多光谱影像和RGB影像使用特征点匹配算法对齐图像;
Step2-2根据无人机影像和位置数据生成飞行区域的稀疏点云;基于稀疏点云建立空间网格,并且加入GCP的空间坐标信息;生成具有精确位置的稀疏点云,飞行区域的表面几何结构和空间纹理信息生成;最终生成飞行区域的高清数字正射影像和数字表面模型,并将处理后的图像导出为TIFF图像;
Step2-3将高清数字正射影像按照小区划分,划分为带有ID的多个区域,分别识别获取对应ID区域的光谱信息;
Step2-4进行纹理特征的提取,按照ID提取出的所有特征像素值的均值被用作相应的特征;
Step3植被指数计算:根据光谱影像的波段信息采用灰度共生矩阵分别提取多光谱影像和RGB影像的光谱信息和纹理信息,计算对TNC敏感的植被指数;
Step4构建基于堆叠方法的集成预测模型并预测:
Step4-1将RGB影像的光谱特征和纹理特征以及多光谱影像的光谱特征和纹理特征作为输入特征分别进行训练、并构建多个基础机器学习TNC预测模型,采用五折交叉验证方法将所有的数据集随机均匀划分为5份,并且对于不同输入特征均采用相同的划分方法,将其中的每1份做验证集、其余4份做训练集,训练5次后得到的所有数据均作为训练样本和验证样本,分别产生对应五个训练集的5组验证数据,将这5组验证数据纵向叠起来得到了测试集预测矩阵、用作次级机器学习模型的测试集,将验证集预测的结果做均值,得到各基础机器学习TNC预测模型的预测精度;
Step4-2采用Stacking集成学习模型作为次级机器学习模型来集成各个基础机器学习TNC预测模型的预测能力,同时采用五折交叉验证的方法训练Stacking集成学习模型;
Step4-3基于测试集预测矩阵产生的5组验证结果,取均值得到最终的预测精度。
2.根据权利要求1所述的冬小麦全氮含量预测方法,其特征在于,Step4-1中,多个基础机器学习TNC预测模型至少包括RFR学习模型。
3.根据权利要求2所述的冬小麦全氮含量预测方法,其特征在于,Step4-1中,多个基础机器学习TNC预测模型是GPR学习模型、RFR学习模型、RR学习模型和ENR学习模型四个基础机器学习TNC预测模型。
4.根据权利要求1或2或3所述的冬小麦全氮含量预测方法,其特征在于,Step4-1中,多个基础机器学习TNC预测模型使用不同的参数或不同的数据子集进行训练。
5.根据权利要求1或2或3所述的冬小麦全氮含量预测方法,其特征在于,Step3中,纹理信息包括平均值、方差、同质性、对比度、不相似性、熵、第二力矩和相关性。
6.根据权利要求1或2或3所述的冬小麦全氮含量预测方法,其特征在于,Step3中,针对多光谱影像,通过多光谱影像的光谱反射率计算对TNC敏感的植被指数;针对RGB影像,对RGB影像三个通道的平均DN值进行归一化处理,将红、绿、蓝三个通道定义为R、G、B,归一化数码影像三个通道DN值后得到了r、g、b三个变量,并根据三个变量计算对TNC敏感的植被指数。
CN202310454134.XA 2023-04-25 2023-04-25 一种冬小麦全氮含量预测方法 Pending CN116485757A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310454134.XA CN116485757A (zh) 2023-04-25 2023-04-25 一种冬小麦全氮含量预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310454134.XA CN116485757A (zh) 2023-04-25 2023-04-25 一种冬小麦全氮含量预测方法

Publications (1)

Publication Number Publication Date
CN116485757A true CN116485757A (zh) 2023-07-25

Family

ID=87211481

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310454134.XA Pending CN116485757A (zh) 2023-04-25 2023-04-25 一种冬小麦全氮含量预测方法

Country Status (1)

Country Link
CN (1) CN116485757A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116973365A (zh) * 2023-08-21 2023-10-31 中国农业科学院油料作物研究所 一种甘蓝型油菜苗期生物量、氮含量的预测方法及系统
CN117760984A (zh) * 2023-12-25 2024-03-26 安徽科技学院 一种冬小麦spad时空变化监测方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116973365A (zh) * 2023-08-21 2023-10-31 中国农业科学院油料作物研究所 一种甘蓝型油菜苗期生物量、氮含量的预测方法及系统
CN117760984A (zh) * 2023-12-25 2024-03-26 安徽科技学院 一种冬小麦spad时空变化监测方法

Similar Documents

Publication Publication Date Title
Zheng et al. Improved estimation of rice aboveground biomass combining textural and spectral analysis of UAV imagery
Qi et al. Monitoring of peanut leaves chlorophyll content based on drone-based multispectral image feature extraction
CN113268923B (zh) 一种基于模拟多光谱的夏玉米产量估算方法
Duan et al. Remote estimation of grain yield based on UAV data in different rice cultivars under contrasting climatic zone
CN110376167A (zh) 基于无人机高光谱的水稻叶片氮含量监测方法
CN116485757A (zh) 一种冬小麦全氮含量预测方法
Zhang et al. Estimating wheat yield by integrating the WheatGrow and PROSAIL models
CN103699803A (zh) 一种基于多光谱遥感信息的区域作物养分管理方法
Fan et al. Estimation of the nitrogen content of potato plants based on morphological parameters and visible light vegetation indices
CN115759524B (zh) 一种基于遥感影像植被指数的土壤生产力等级识别方法
Liu et al. Winter wheat yield estimation based on assimilated Sentinel-2 images with the CERES-Wheat model
Sun et al. Non-destructive monitoring of maize LAI by fusing UAV spectral and textural features
Zhang et al. Evaluating maize evapotranspiration using high-resolution UAV-based imagery and FAO-56 dual crop coefficient approach
Simic Milas et al. Monitoring Landsat vegetation indices for different crop treatments and soil chemistry
Zhang et al. Inversion models of aboveground grassland biomass in Xinjiang based on multisource data
Zou et al. Combining spectral and texture feature of UAV image with plant height to improve LAI estimation of winter wheat at jointing stage
Liu et al. Evaluating how lodging affects maize yield estimation based on UAV observations
Cheng et al. Spectral purification improves monitoring accuracy of the comprehensive growth evaluation index for film-mulched winter wheat
CN114219872A (zh) 一种生态地质图编制方法
Zhu et al. UAV flight height impacts on wheat biomass estimation via machine and deep learning
Tang et al. Estimating wheat grain yield by assimilating phenology and LAI with the WheatGrow model based on theoretical uncertainty of remotely sensed observation
Xu et al. [Retracted] Digital Technology Empowers Grain Supply Chain Optimization Simulation
CN116124774A (zh) 一种基于无人机光谱多源数据预测冠层氮含量方法
CN115496999A (zh) 田间立地秸秆产量估计方法及装置
Sun et al. Potential of multi-seasonal vegetation indices to predict rice yield from UAV multispectral observations

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination