CN112528789A - 一种用于发病初中期分析的小麦条锈病遥感监测方法 - Google Patents

一种用于发病初中期分析的小麦条锈病遥感监测方法 Download PDF

Info

Publication number
CN112528789A
CN112528789A CN202011388651.4A CN202011388651A CN112528789A CN 112528789 A CN112528789 A CN 112528789A CN 202011388651 A CN202011388651 A CN 202011388651A CN 112528789 A CN112528789 A CN 112528789A
Authority
CN
China
Prior art keywords
stripe rust
wheat
rust
vegetation index
wheat stripe
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011388651.4A
Other languages
English (en)
Inventor
黄林生
刘勇
黄文江
吴康
赵晋陵
翁士状
张东彦
曾玮
洪琪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui University
Original Assignee
Anhui University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui University filed Critical Anhui University
Priority to CN202011388651.4A priority Critical patent/CN112528789A/zh
Publication of CN112528789A publication Critical patent/CN112528789A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • G06V20/188Vegetation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)

Abstract

本发明涉及一种用于发病初中期分析的小麦条锈病遥感监测方法,与现有技术相比解决了尚无针对小麦条锈病进行初中期监测的缺陷。本发明包括以下步骤:小麦条锈病遥感数据的获取与预处理;建模特征的选择;XGBoost监测模型的构建与训练;待分析小麦条锈病遥感图像的获取;小麦条锈病初中期监测结果的获得。本发明采用相关性分析和随机森林算法对植被指数特征进行特征筛选,利用XGBoost监测模型实时监测小麦条锈病的发生情况,为小麦条锈病的及时防治提供有效的信息。

Description

一种用于发病初中期分析的小麦条锈病遥感监测方法
技术领域
本发明涉及遥感图像分析技术领域,具体来说是一种用于发病初中期分析的小麦条锈病遥感监测方法。
背景技术
小麦条锈病主要发生在叶片上,叶片植物细胞在受到病害侵染后,细胞内部的水分含量、色素等都会逐渐发生改变,叶片上逐渐出现越来越多的锈色粉状物,这些现象会引起植被光谱反射率发生变化,然而在病害后期病菌具备有性繁殖能力,并且可以随着气流进行传播导致条锈病的大面积发生,因此对小麦条锈病进行初中期监测是十分必要的。
目前对于小麦条锈病的机理研究大多集中在病害的整个发病时期或者发生中后期,这并不利于小麦条锈病的及时防控,通过冠层高光谱数据构建小麦生长初中期条锈病菌的遥感监测模型可以及时地获取病害的发生信息,便于提前做好预防小麦条锈病大面积发生的准备,减少相应的经济损失。
现有技术中,师越等通过分析小麦冠层高光谱数据,提取14个植被指数特征,实现了冬小麦条锈、蚜虫和白粉病三种病虫害的检测与分类,但是所选研究的对象包含整个发病时期。黄文江等发现在冠层和田间尺度上利用光化学反射指数(PhotochemicalReflectance Index,PRI)可以有效地检测冬小麦条锈病的发生情况。Devada等人发现,没有光谱指数可以在叶片尺度上完全区分小麦条锈病、叶锈病和茎锈病,但花青素反射指数(Anthocyanin Reflectance Index,ARI)可以区分条锈病和健康小麦。郑琼等分析不同时期小麦条锈病冠层光谱数据发现PRI和ARI能很好地完成对条锈病的监测分类,然而ARI只是对于中后期的条锈病害具有较高的监测能力。也就是说,通过植被高光谱数据得到的植被指数特征可以在一定程度上实现对小麦条锈病严重度的监测,但缺乏针对于病害初中期的监测方法。
那么如何设计出一种针对于小麦条锈病初中期的遥感监测方法已经成为急需解决的技术问题。
发明内容
本发明的目的是为了解决现有技术中尚无针对小麦条锈病进行初中期监测的缺陷,提供一种用于发病初中期分析的小麦条锈病遥感监测方法来解决上述问题。
为了实现上述目的,本发明的技术方案如下:
一种用于发病初中期分析的小麦条锈病遥感监测方法,包括以下步骤:
小麦条锈病遥感数据的获取与预处理:获取小麦条锈病遥感数据并提取出冠层高光谱数据,并对冠层高光谱数据进行预处理;
建模特征的选择:从预处理后的小麦冠层反射率光谱曲线中提取出植被指数特征,利用相关性分析方法和随机森林特征选择方法进行筛选;
XGBoost监测模型的构建与训练:构建XGBoost监测模型并对其进行训练;
待分析小麦条锈病遥感图像的获取:获取待分析小麦条锈病遥感图像,并对其进行冠层高光谱数据的采集和预处理,按建模特征的选择步骤所筛选出的特征进行植被指数特征的提取;
小麦条锈病初中期监测结果的获得:将待分析小麦条锈病遥感图像的植被指数特征输入训练后的XGBoost监测模型,得到小麦条锈病初中期监测结果。
所述小麦条锈病遥感数据的获取与预处理包括以下步骤:
获取利用遥感设备中ASDFieldSpec地物光谱仪所采集的冠层高光谱数据,采集到小麦条锈病的光谱反射率,其中,光谱分辨率在350nm-1000nm范围内为3nm、在1000nm-2500nm范围内为10nm;
计算小麦冠层反射率光谱曲线,其计算公式如下:
Figure BDA0002811591850000021
式中,Rtarget为样本小麦冠层光谱反射率,DNtarget为样本小麦冠层光谱DN灰度值,DNreference为参考板的反射灰度值,Rreference为参考板的反射率值;
采用5步滑动平均法对小麦冠层反射率光谱曲线进行信号滤波处理。
所述建模特征的选择包括以下步骤:
从预处理后的小麦冠层反射率光谱曲线中提取敏感波段所组成的植被指数,作为初选建模特征;
利用相关性分析方法对初选建模特征进行筛选,形成预选建模特征;
利用随机森林特征选择方法对预选建模特征进行筛选,形成模型特征集。
所述XGBoost监测模型的构建与训练包括以下步骤:
设样本集中有n个小麦条锈病样本,m个最终筛选得到的植被指数特征,XGBoost监测模型中包含k个条锈病样本的基础树模型,最终的预测值则是k个树模型的结果进行求和,即为下式所示:
D={(xi,yi)}(D|=xi∈Rm,yi∈R) (1)
Figure BDA0002811591850000031
其中,xi表示第i个样本对应输入的植被指数特征,yi代表第i个条锈病样本所对应的病害分类标签,Rm表示由m个最终筛选得到的植被指数特征构建的线性空间,R即为实数域,
Figure BDA0002811591850000032
表示模型中第i个条锈病样本最终预测的病害分类结果,fk(xi)表示第k个树模型中所有样本xi得到的预测结果,fk∈F表示fk属于由第k个树模型得到的预测值构成的数域,式中F={f(x)=wq(x)}(q:Rm→T,w∈RT)是CART中的空间,q代表将条锈病样本映射到对应叶节点的每个树模型的结构,T代表对应条锈病害树模型的叶节点个数,RT表示由叶子节点构成的线性空间,f(x)即为对应条锈病害树模型的结构q和叶节点权重w;
通过引入正则化项使包含植被指数特征的条锈病害模型的目标函数最小化,其表达式如下:
Figure BDA0002811591850000041
Figure BDA0002811591850000042
式中
Figure BDA0002811591850000043
即为损失函数,用于判定
Figure BDA0002811591850000044
和yi之间的误差,
Figure BDA0002811591850000045
即为引入到条锈病害模型的正则化项,fk表示第k个条锈病害树模型,γ和λ表示系数,用于条锈病害模型的调参优化;
令经过t次迭代训练后的树模型为ft,则有:
Figure BDA0002811591850000046
将等式(5)进行泰勒二阶展开得到下式:
Figure BDA0002811591850000047
式中
Figure BDA0002811591850000048
Figure BDA0002811591850000049
是损失函数的泰勒二阶展开量,则正则化项
Figure BDA00028115918500000410
移除第t次迭代中的泰勒二次展开常数,并假设已知条锈病害树模型结构为q,则每个样本xi可以通过该结构找到对应的树模型叶子节点j,从而定义Ij={i|q(xi)=j|}在该结构q中,对应叶子节点j所有小麦条锈病样本的集合;
对等式(5)进行转换如下:
Figure BDA00028115918500000411
对于叶子节点j对应的权重值
Figure BDA00028115918500000412
计算出目标函数的最优值
Figure BDA0002811591850000051
采用贪婪算法将实际运用中的树模型结构划分为IL和IR,I=IL∪IR,则得到:
Figure BDA0002811591850000052
所述利用相关性分析方法对初选建模特征进行筛选包括以下步骤:
将相关系数作为植被指数特征与条锈病情指数之间相关性的密切程度的表达方式;
建立植被指数特征与条锈病情指数之间相关系数计算表达式,对所得相关系数结果进行误差分析;
对植被指数特征与条锈病情指数之间的是否存在相关关系,采用建立相关性分析表格、绘制相关图以及计算相关系数等方式来判断两者之间的相关变化方向、形态及密切程度;
其中相关系数是反映植被指数特征与条锈病情指数之间密切程度的统计指标。其计算公式如下式所示:
Figure BDA0002811591850000053
式中r即为所选择的植被指数特征与条锈病情指数之间的相关系数,x和y分别表示样本植被指数特征和条锈病病情指数,
Figure BDA0002811591850000054
Figure BDA0002811591850000055
表示对应样本植被指数特征和条锈病病情指数的平均值,n表示小麦条锈病样本的数量,Sxy表示小麦条锈病样本的协方差,Sx表示小麦条锈病样本x的标准差,Sy表示小麦条锈病样本y的标准差;
相关系数r的取值范围为-1≤r≤1,r>0表示为正相关,r<0表示为负相关,判定研究变量之间的相关程度则是通过|r|来体现,|r|越大则变量之间的密切程度越高。对所选择的植被指数特征与条锈病病情指数进行相关性分析得到其相关系数,以相关系数绝对值0.6为阈值对初选的植被指数特征进行筛选,得到相关性分析的筛选结果。
所述利用随机森林特征选择方法对预选建模特征进行筛选包括以下步骤:
根据随机森林中决策树的数量将经过相关性分析筛选过后的小麦条锈病样本的袋外数据划分为n组用来计算随机森林所有决策树的误差值,结果分别记做:errOOB1,errOOB2,…,errOOBn;
将n组袋外数据中的第i个植被指数特征进行随机排序,保证其他植被指数特征不变,重新计算样本袋外数据误差值,结果分别记做:erri1,erri2,…,errin;
根据上述得到的误差结果计算特征重要性如以下公式所示:
Figure BDA0002811591850000061
为了确保特征选取的准确性,采用10折交叉验证的方法对相关性分析过后得到的植被指数特征进行迭代计算,在经过迭代后取各植被指数特征的特征重要性得分平均值完成特征重要性排序工作,以重要性得分为0.09为阈值选择则出冗余信息含量最少、分类准确率最高的植被指数特征集作为最终的特征筛选结果。
有益效果
本发明的一种于发病初中期分析的小麦条锈病遥感监测方法,与现有技术相比采用相关性分析(CA)和随机森林算法(RF)对植被指数特征进行特征筛选,利用XGBoost监测模型实时监测小麦条锈病的发生情况,为小麦条锈病的及时防治提供有效的信息。
附图说明
图1为本发明的方法顺序图;
图2为本发明实施例中小麦冠层光谱平均反射率曲线图;
图3为本发明实施例中小麦样本的冠层光谱反射率与条锈病病情指数进行相关性分析对比图;
图4为本发明实施例中进行随机森林(RF)特征重要性排序后结果对比图。
具体实施方式
为使对本发明的结构特征及所达成的功效有更进一步的了解与认识,用以较佳的实施例及附图配合详细的说明,说明如下:
如图1所示,本发明所述的一种用于发病初中期分析的小麦条锈病遥感监测方法,包括以下步骤:
第一步,小麦条锈病遥感数据的获取与预处理:获取小麦条锈病遥感数据并提取出冠层高光谱数据,并对冠层高光谱数据进行预处理。其具体步骤如下:
(1)获取利用遥感设备中ASDFieldSpec地物光谱仪所采集的冠层高光谱数据,采集到小麦条锈病的光谱反射率,其中,光谱分辨率在350nm~1000nm范围内为3nm,在1000nm~2500nm范围内为10nm;
(2)计算小麦冠层反射率光谱曲线,其计算公式如下:
Figure BDA0002811591850000071
式中,Rtarget为样本小麦冠层光谱反射率,DNtarget为样本小麦冠层光谱DN灰度值,DNreference为参考板的反射灰度值,Rreference为参考板的反射率值;
(3)采用5步滑动平均法对小麦冠层反射率光谱曲线进行信号滤波处理。滑动平均法则是通过调整新旧数据得出移动平均值,尽可能地去除偶然因素影响,找出冠层光谱曲线的变化趋势,最终达到消除信号噪声的目的。
在实际应用中,鉴于小麦在受到条锈病侵染的过程中,叶片的叶绿素含量降低,水分减少,在不同波段上出现差异性的光谱信息,可以选择波段为350nm~1100nm的冠层光谱进行小麦条锈病害初中期的监测研究。
第二步,建模特征的选择:从预处理后的小麦冠层反射率光谱曲线中提取出植被指数特征,利用相关性分析方法和随机森林特征选择方法进行筛选。
在现有的研究中,除了光谱反射率可以反映作物遭受到病害胁迫,经常被用来识别植物病害的植被指数同样可以反映小麦受条锈病菌的侵染程度。植被指数是利用植被光谱特性对可见光和近红外波段进行不同形式的构建,以此作为遥感监测的基本理论依据,从大量的研究中发现基于高光谱数据变换得到的植被指数在作物病虫害的研究上能很好地监测病虫害的发生情况。
在实际应用中,可以根据小麦条锈病光谱响应的特性,以及以往各类研究中不同植被指数选在条锈病害监测方面的应用,选取多个由可见光和近红外波段进行重组、合并得到的植被指数作为小麦条锈病初中期监测模型的候选特征。
由于候选特征是从小麦条锈病冠层光谱曲线中提取敏感波段组合形成的植被指数,特征之间存在较高的信息冗余,本发明选择相关性分析结合随机森林算法(CA-RF)对候选特征进行特征变量筛选得到最终的模型输入变量。CA-RF特征筛选算法首先采用CA对植被指数特征与条锈病病情指数进行分析得到与病害发生相关性较大的特征合集,用于筛除无关因素的干扰,之后,利用RF算法能够实现特征重要性排序的特性对CA筛选够后的植被指数特征进行二次筛选,得到每个特征的重要性得分,选择最能反应小麦早中期条锈病为害情况的特征选择结果。其具体步骤如下:
(1)从预处理后的小麦冠层反射率光谱曲线中提取敏感波段所组成的植被指数,作为初选建模特征。
(2)利用相关性分析方法对初选建模特征进行筛选,形成预选建模特征,其具体步骤如下:
A1)将相关系数作为植被指数特征与条锈病情指数之间相关性的密切程度的表达方式;
A2)建立植被指数特征与条锈病情指数之间相关系数计算表达式,对所得相关系数结果进行误差分析;
对植被指数特征与条锈病情指数之间的是否存在相关关系,采用建立相关性分析表格、绘制相关图以及计算相关系数等方式来判断两者之间的相关变化方向、形态及密切程度;
其中相关系数是反映植被指数特征与条锈病情指数之间密切程度的统计指标。其计算公式如下式所示:
Figure BDA0002811591850000091
式中r即为所选择的植被指数特征与条锈病情指数之间的相关系数,x和y分别表示样本植被指数特征和条锈病病情指数,
Figure BDA0002811591850000092
Figure BDA0002811591850000093
表示对应样本植被指数特征和条锈病病情指数的平均值,n表示小麦条锈病样本的数量,Sxy表示小麦条锈病样本的协方差,Sx表示小麦条锈病样本x的标准差,Sy表示小麦条锈病样本y的标准差;
相关系数r的取值范围为-1≤r≤1,r>0表示为正相关,r<0表示为负相关,判定研究变量之间的相关程度则是通过|r|来体现,|r|越大则变量之间的密切程度越高。对所选择的植被指数特征与条锈病病情指数进行相关性分析得到其相关系数,以相关系数绝对值0.6为阈值对初选的植被指数特征进行筛选,得到相关性分析的筛选结果。
(3)利用随机森林特征选择方法对预选建模特征进行筛选,形成模型特征集。其具体步骤如下:
B1)根据随机森林中决策树的数量将经过相关性分析筛选过后的小麦条锈病样本的袋外数据划分为n组用来计算随机森林所有决策树的误差值,结果分别记做:errOOB1,errOOB2,…,errOOBn;
B2)将n组袋外数据中的第i个植被指数特征进行随机排序,保证其他植被指数特征不变,重新计算样本袋外数据误差值,结果分别记做:erri1,erri2,…,errin;
B3)根据上述得到的误差结果计算特征重要性如以下公式所示:
Figure BDA0002811591850000101
为了确保特征选取的准确性,采用10折交叉验证的方法对相关性分析过后得到的植被指数特征进行迭代计算,在经过迭代后取各植被指数特征的特征重要性得分平均值完成特征重要性排序工作,以重要性得分为0.09为阈值选择则出冗余信息含量最少、分类准确率最高的植被指数特征集作为最终的特征筛选结果。
第三步,XGBoost监测模型的构建与训练:构建XGBoost监测模型并对其进行训练。
XGBoost算法是一种基于回归树提升的可扩展机器学习系统。由于XGBoost算法在系统中所具备的创新使其在任何情况下都具备可伸缩性,主要创新包括:设计了一种用于处理稀疏数据的新颖树学习算法;提出了理论上合理的加权分位数草图过程,以进行有效的提案计算;最重要的是创建一种有效的感知块结构,可以用于核外计算。XGBoost算法是结合多个弱分类器形成的强分类器,采用泰勒二阶展开来优化目标函数,并且为了防止模型过拟合,引入正则化项来控制模型。相比于其它算法,XGBoost算法在分类上具有高效率和高准确率等优势。由于XGBoost是基于分类回归树(Classification and RegressionTrees,CART)形成的一个树集成模型,假设给定的样本集中有个n样本,m个特征,算法包含k个树,最终的预测值则是k个树的结果进行求和。其具体步骤如下:
(1)设样本集中有n个小麦条锈病样本,m个最终筛选得到的植被指数特征,XGBoost监测模型中包含k个条锈病样本的基础树模型,最终的预测值则是k个树模型的结果进行求和,即为下式所示:
D={(xi,yi)}(D|=xi∈Rm,yi∈R) (1)
Figure BDA0002811591850000102
其中,xi表示第i个样本对应输入的植被指数特征,yi代表第i个条锈病样本所对应的病害分类标签,Rm表示由m个最终筛选得到的植被指数特征构建的线性空间,R即为实数域,
Figure BDA0002811591850000111
表示模型中第i个条锈病样本最终预测的病害分类结果,fk(xi)表示第k个树模型中所有样本xi得到的预测结果,fk∈F表示fk属于由第k个树模型得到的预测值构成的数域,式中F={f(x)=wq(x)}(q:Rm→T,w∈RT)是CART中的空间,q代表将条锈病样本映射到对应叶节点的每个树模型的结构,T代表对应条锈病害树模型的叶节点个数,RT表示由叶子节点构成的线性空间,f(x)即为对应条锈病害树模型的结构q和叶节点权重w;
(2)通过引入正则化项使包含植被指数特征的条锈病害模型的目标函数最小化,其表达式如下:
Figure BDA0002811591850000112
Figure BDA0002811591850000113
式中
Figure BDA0002811591850000114
即为损失函数,用于判定
Figure BDA0002811591850000115
和yi之间的误差,
Figure BDA0002811591850000116
即为引入到条锈病害模型的正则化项,fk表示第k个条锈病害树模型,γ和λ表示系数,用于条锈病害模型的调参优化;
令经过t次迭代训练后的树模型为ft,则有:
Figure BDA0002811591850000117
将等式(5)进行泰勒二阶展开得到下式:
Figure BDA0002811591850000118
式中
Figure BDA0002811591850000119
Figure BDA00028115918500001110
是损失函数的泰勒二阶展开量,则正则化项
Figure BDA00028115918500001111
(3)移除第t次迭代中的泰勒二次展开常数,并假设已知条锈病害树模型结构为q,则每个样本xi可以通过该结构找到对应的树模型叶子节点j,从而定义Ij={i|q(xi)=j|}在该结构q中,对应叶子节点j所有小麦条锈病样本的集合;
对等式(5)进行转换如下:
Figure BDA0002811591850000121
对于叶子节点j对应的权重值
Figure BDA0002811591850000122
计算出目标函数的最优值
Figure BDA0002811591850000123
(4)采用贪婪算法将实际运用中的树模型结构划分为IL和IR,I=IL∪IR,则可以得到:
Figure BDA0002811591850000124
第四步,待分析小麦条锈病遥感图像的获取:获取待分析小麦条锈病遥感图像,并对其进行冠层高光谱数据的采集和预处理,按建模特征的选择步骤(第二步)所筛选出的特征进行植被指数特征的提取。
第五步,小麦条锈病初中期监测结果的获得:将待分析小麦条锈病遥感图像的植被指数特征输入训练后的XGBoost监测模型,得到小麦条锈病初中期监测结果。
在此,以河北省中国农业科学院廊坊中试实验基地(39°30.48′N~116°36.14′E)为例,该地区是我国典型的北方农作物种植区,土质优良,具备极为符合小麦生长的自然条件,主要研究在冠层尺度上随小麦生育期推移受条锈病侵染的光谱曲线和病情指数变化。在研究区域中采用人工接种的方式来实现小麦条锈病感染,选择的小麦实验品种为“铭贤169”,属于条锈病易感小麦品种,共分为A、B、C、D等4组,每组的面积为220m2,为方便取样将每组按照A1-A8、B1-B8、C1-C8、D1-D8划分为8个样方。其中A、D组小麦样本作为健康组,B、C组作为染病组。实验从2020年5月4日到5月25日,共进行5次包括小麦拔节期、抽穗期、开花期、灌浆期、乳熟期5个生育期的测试实验,为了实现小麦条锈病初中期监测,只选择小麦拔节期、抽穗期和开花期3个生育期的小麦冠层光谱反射率的测量结果。为了尽可能还原自然条件下小麦条锈病初中期的数据采集情况,3个生育期都从健康样方中随机挑选12个健康样本,从染病样方中随机挑选不同染病程度的16个样本,一共84组样本。
将小麦三个生育期的条锈病样本根据病情严重度划分为健康、轻发和重发三种状态,其小麦冠层光谱平均反射率曲线如图2所示。分析图2可以看出三种状态下小麦冠层光谱曲线变化趋势均趋于一致,在可见光区域出现高吸收,在近红外波段区域的光谱反射率高,而在绿波段区域小麦冠层光谱曲线区别于其它的可见光区域,反射率明显偏高。伴随着小麦受到条锈病侵染的程度不断加深,绿波段区域500nm~570nm和近红外波段区域700nm~1100nm的光谱反射率降低,而在波段区域600nm~700nm的光谱反射率升高,其中可见波长区域400nm~700nm内可以反映叶片色素含量的变化,而近红外区域700nm~1000nm内能够表示细胞结构状态的改变。
同时对小麦样本的冠层光谱反射率与条锈病病情指数进行相关性分析,其结果如图3所示。分析图3可以看出在波段区间350nm~570nm和705nm~1100nm内的光谱反射率与条锈病病情指数的之间表现为负相关,而在波段区间575nm~703nm内表现为正相关,并且在近红外区域相关系数很高。综合图2和图3进行分析,随着小麦病情严重度的加深,小麦叶肉组织中色素含量开始变化,冠层及生理结构受到破坏从而导致部分可见光和近红外区域的光谱反射率发生变化,500nm~570nm、600nm~700nm和750nm~1100nm均是小麦条锈病的光谱敏感区间,可以在很大程度上反映出小麦条锈病的病情发生程度,以此为依据选择相应的植被指数来监测小麦条锈病的发生。从冯等人的研究中发现红边区域700~750nm的光谱波段被认为是表示植被营养状况、水分含量和叶面积的参数,并且波段750nm位于红边区域对条锈病发生表现为敏感。这个结果与Bravo等人波段区间大约750±10nm和861±10nm进行的研究结论保持一致。
为了获取冗余信息含量更小的特征变量,对筛选过后的10个植被指数特征进行随机森林(RF)特征重要性排序,其特征重要性排序结果如图4所示。从图4中可以看出特征的重要性得分,从中选择重要性大于0.09的植被指数特征作为最终的输入变量,分别是PhRI、PRI、PSRI、SIPI和ARI。从病理的角度来说,小麦受到条锈病菌侵染后,叶片变黄,细胞结构、内部色素、水分含量发生变化,SIPI、PRI和PSRI正是随着绿色植被色素含量和光合速率等改变而变化;ARI、PhRI所对应的是由光谱波段531nm、550nm和700nm运算得出,这三个波段正处于条锈病敏感波段范围,对小麦条锈病的发生相比于其它植被指数表现更为敏感。郑等人发现PRI和ARI在针对中后期条锈病的监测拥有独特的优势,这个研究结果与黄和Devada等分别针对PRI和ARI对条锈病的研究中保持一致的观点。
本发明通过相关性分析(CA)、相关性分析结合随机森林(CA-RF)两种特征选择方法从多个植被指数中筛选出最适用于监测小麦初中期条锈病的特征集合,结合常用于条锈病遥感监测的算法构建了8个监测模型,分别是CA+RF模型、CA+SVM模型、CA+BP神经网络模型、CA+XGBoost模型、CA-RF+RF模型、CA-RF+SVM模型、CA-RF+BP神经网络模型、CA-RF+XGBoost模型。通过以上8个模型对小麦条锈病病情严重度进行对比评估得到最优监测模型。
各模型监测结果如表1所示,表中列举出CA和CA-RF两种特征选择方法结合四种小麦条锈病常用监测模型的错分误差、总体监测精度以及Kappa系数。
表1不同监测模型的分析与验证结果对比表
Figure BDA0002811591850000141
Figure BDA0002811591850000151
分析表1从中可以发现,在RF、SVM、BPNN和XGBoost四种算法模型中,由CA-RF特征选择算法获取的特征集合结合RF、BPNN、SVM和XGBoost构建的模型监测精度比单一的CA筛选的特征集合所建立的模型监测精度分别提高了3.8%、11.6%、7.7%和11.6%。从错分误差的角度,CA-RF+XGBoost模型针对健康和轻发样本产生的分类误差率明显低于其它7个模型,CA-RF+XGBoost模型的监测精度和Kappa系数达到88.5%和0.797,对比CA-RF特征选择算法与RF、SVM、BPNN和XGBoost构建的模型发现,CA-RF+XGBoost模型监测精度分别比CA-RF+RF、CA-RF+SVM和CA-RF+BPNN三个模型高出3.9%、19.3%和15.4%,Kappa系数分别高出0.056、0.307和0.271。以上分析可以得出CA-RF特征选择算法可以更加有效地得到小麦病害发生的特征变量,基于利用CA-RF筛选的特征构建的模型相比基于利用单一的CA筛选的特征所建模型的监测精度更高、误差更小。与其它模型对比分析发现,CA-RF+XGBoost模型可以在冠层尺度上对小麦初中期的病害发生进行有效地预防和监测。
本发明基于冠层高光谱数据建立的CA-RF+XGBoost模型较好的实现了小麦条锈病初中期的监测,对小麦条锈病的及时防控具有重大意义。在实验验证中,根据小麦条锈病初中期的冠层光谱曲线敏感波段获取与病害相关的植被指数作为候选特征,通过相关性分析结合随机森林特征选择算法(CA-RF)筛选出PhRI、PRI、PSRI、SIPI和ARI共5个特征变量作为最终模型的输入变量,结合XGBoost算法建立小麦条锈病初中期的监测模型,该模型对小麦条锈病初中期的监测精度和Kappa系数分别达到88.5%和0.797。此外,由CA-RF特征选择算法筛选出的植被指数特征与条锈病害的发生所带来的植被变化具有极大的关联,同时也符合现有研究的实验结果。虽然模型对小麦条锈病初中期的监测具有较高的精确度,但还是需要针对不同环境、不同品种的小麦进行验证,扩大模型的适用性。小麦条锈病初中期的监测识别能够为地方农业提供及时的数据以避免小麦因条锈病导致的巨大损失,并在之后的研究中,将该模型应用于区域尺度的高光谱遥感影像,实现区域尺度的小麦条锈病初中期的监测。
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是本发明的原理,在不脱离本发明精神和范围的前提下本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明的范围内。本发明要求的保护范围由所附的权利要求书及其等同物界定。

Claims (6)

1.一种用于发病初中期分析的小麦条锈病遥感监测方法,其特征在于,包括以下步骤:
11)小麦条锈病遥感数据的获取与预处理:获取小麦条锈病遥感数据并提取出冠层高光谱数据,并对冠层高光谱数据进行预处理;
12)建模特征的选择:从预处理后的小麦冠层反射率光谱曲线中提取出植被指数特征,利用相关性分析方法和随机森林特征选择方法进行筛选;
13)XGBoost监测模型的构建与训练:构建XGBoost监测模型并对其进行训练;
14)待分析小麦条锈病遥感图像的获取:获取待分析小麦条锈病遥感图像,并对其进行冠层高光谱数据的采集和预处理,按建模特征的选择步骤所筛选出的特征进行植被指数特征的提取;
15)小麦条锈病初中期监测结果的获得:将待分析小麦条锈病遥感图像的植被指数特征输入训练后的XGBoost监测模型,得到小麦条锈病初中期监测结果。
2.根据权利要求1所述的一种用于发病初中期分析的小麦条锈病遥感监测方法,其特征在于,所述小麦条锈病遥感数据的获取与预处理包括以下步骤:
21)获取利用遥感设备中ASDFieldSpec地物光谱仪所采集的冠层高光谱数据,采集到小麦条锈病的光谱反射率,其中,光谱分辨率在350nm-1000nm范围内为3nm、在1000nm-2500nm范围内为10nm;
22)计算小麦冠层反射率光谱曲线,其计算公式如下:
Figure FDA0002811591840000011
式中,Rtarget为样本小麦冠层光谱反射率,DNtarget为样本小麦冠层光谱DN灰度值,DNreference为参考板的反射灰度值,Rreference为参考板的反射率值;
23)采用5步滑动平均法对小麦冠层反射率光谱曲线进行信号滤波处理。
3.根据权利要求1所述的一种用于发病初中期分析的小麦条锈病遥感监测方法,其特征在于,所述建模特征的选择包括以下步骤:
31)从预处理后的小麦冠层反射率光谱曲线中提取敏感波段所组成的植被指数,作为初选建模特征;
32)利用相关性分析方法对初选建模特征进行筛选,形成预选建模特征;
33)利用随机森林特征选择方法对预选建模特征进行筛选,形成模型特征集。
4.根据权利要求1所述的一种用于发病初中期分析的小麦条锈病遥感监测方法,其特征在于,所述XGBoost监测模型的构建与训练包括以下步骤:
41)设样本集中有n个小麦条锈病样本,m个最终筛选得到的植被指数特征,XGBoost监测模型中包含k个条锈病样本的基础树模型,最终的预测值则是k个树模型的结果进行求和,即为下式所示:
D={(xi,yi)}(|D|=xi∈Rm,yi∈R) (1)
Figure FDA0002811591840000021
其中,xi表示第i个样本对应输入的植被指数特征,yi代表第i个条锈病样本所对应的病害分类标签,Rm表示由m个最终筛选得到的植被指数特征构建的线性空间,R即为实数域,
Figure FDA0002811591840000022
表示模型中第i个条锈病样本最终预测的病害分类结果,fk(xi)表示第k个树模型中所有样本xi得到的预测结果,fk∈F表示fk属于由第k个树模型得到的预测值构成的数域,式中F={f(x)=wq(x)}(q:Rm→T,w∈RT)是CART中的空间,q代表将条锈病样本映射到对应叶节点的每个树模型的结构,T代表对应条锈病害树模型的叶节点个数,RT表示由叶子节点构成的线性空间,f(x)即为对应条锈病害树模型的结构q和叶节点权重w;
42)通过引入正则化项使包含植被指数特征的条锈病害模型的目标函数最小化,其表达式如下:
Figure FDA0002811591840000031
Figure FDA0002811591840000032
式中
Figure FDA0002811591840000033
即为损失函数,用于判定
Figure FDA0002811591840000034
和yi之间的误差,
Figure FDA0002811591840000035
即为引入到条锈病害模型的正则化项,fk表示第k个条锈病害树模型,γ和λ表示系数,用于条锈病害模型的调参优化;
令经过t次迭代训练后的树模型为ft,则有:
Figure FDA0002811591840000036
将等式(5)进行泰勒二阶展开得到下式:
Figure FDA0002811591840000037
式中
Figure FDA0002811591840000038
Figure FDA0002811591840000039
是损失函数的泰勒二阶展开量,则正则化项
Figure FDA00028115918400000310
43)移除第t次迭代中的泰勒二次展开常数,并假设已知条锈病害树模型结构为q,则每个样本xi可以通过该结构找到对应的树模型叶子节点j,从而定义Ij={i|q(xi)=j|}在该结构q中,对应叶子节点j所有小麦条锈病样本的集合;
对等式(5)进行转换如下:
Figure FDA00028115918400000311
对于叶子节点j对应的权重值
Figure FDA00028115918400000312
计算出目标函数的最优值
Figure FDA0002811591840000041
44)采用贪婪算法将实际运用中的树模型结构划分为IL和IR,I=IL∪IR,则得到:
Figure FDA0002811591840000042
5.根据权利要求3所述的一种用于发病初中期分析的小麦条锈病遥感监测方法,其特征在于,所述利用相关性分析方法对初选建模特征进行筛选包括以下步骤:
51)将相关系数作为植被指数特征与条锈病情指数之间相关性的密切程度的表达方式;
52)建立植被指数特征与条锈病情指数之间相关系数计算表达式,对所得相关系数结果进行误差分析;
对植被指数特征与条锈病情指数之间的是否存在相关关系,采用建立相关性分析表格、绘制相关图以及计算相关系数等方式来判断两者之间的相关变化方向、形态及密切程度;
其中相关系数是反映植被指数特征与条锈病情指数之间密切程度的统计指标。其计算公式如下式所示:
Figure FDA0002811591840000043
式中r即为所选择的植被指数特征与条锈病情指数之间的相关系数,x和y分别表示样本植被指数特征和条锈病病情指数,
Figure FDA0002811591840000044
Figure FDA0002811591840000045
表示对应样本植被指数特征和条锈病病情指数的平均值,n表示小麦条锈病样本的数量,Sxy表示小麦条锈病样本的协方差,Sx表示小麦条锈病样本x的标准差,Sy表示小麦条锈病样本y的标准差;
相关系数r的取值范围为-1≤r≤1,r>0表示为正相关,r<0表示为负相关,判定研究变量之间的相关程度则是通过|r|来体现,|r|越大则变量之间的密切程度越高。对所选择的植被指数特征与条锈病病情指数进行相关性分析得到其相关系数,以相关系数绝对值0.6为阈值对初选的植被指数特征进行筛选,得到相关性分析的筛选结果。
6.根据权利要求3所述的一种用于发病初中期分析的小麦条锈病遥感监测方法,其特征在于,所述利用随机森林特征选择方法对预选建模特征进行筛选包括以下步骤:
61)根据随机森林中决策树的数量将经过相关性分析筛选过后的小麦条锈病样本的袋外数据划分为n组用来计算随机森林所有决策树的误差值,结果分别记做:errOOB1,errOOB2,…,errOOBn;
62)将n组袋外数据中的第i个植被指数特征进行随机排序,保证其他植被指数特征不变,重新计算样本袋外数据误差值,结果分别记做:erri1,erri2,…,errin;
63)根据上述得到的误差结果计算特征重要性如以下公式所示:
Figure FDA0002811591840000051
为了确保特征选取的准确性,采用10折交叉验证的方法对相关性分析过后得到的植被指数特征进行迭代计算,在经过迭代后取各植被指数特征的特征重要性得分平均值完成特征重要性排序工作,以重要性得分为0.09为阈值选择则出冗余信息含量最少、分类准确率最高的植被指数特征集作为最终的特征筛选结果。
CN202011388651.4A 2020-12-02 2020-12-02 一种用于发病初中期分析的小麦条锈病遥感监测方法 Pending CN112528789A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011388651.4A CN112528789A (zh) 2020-12-02 2020-12-02 一种用于发病初中期分析的小麦条锈病遥感监测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011388651.4A CN112528789A (zh) 2020-12-02 2020-12-02 一种用于发病初中期分析的小麦条锈病遥感监测方法

Publications (1)

Publication Number Publication Date
CN112528789A true CN112528789A (zh) 2021-03-19

Family

ID=74996126

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011388651.4A Pending CN112528789A (zh) 2020-12-02 2020-12-02 一种用于发病初中期分析的小麦条锈病遥感监测方法

Country Status (1)

Country Link
CN (1) CN112528789A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113514402A (zh) * 2021-04-12 2021-10-19 新疆农业大学 一种冬小麦叶绿素含量的预测系统及方法
CN113538559A (zh) * 2021-07-02 2021-10-22 宁波大学 一种基于高光谱遥感影像的近海养殖筏提取指数的提取方法
CN113607656A (zh) * 2021-08-03 2021-11-05 安徽省农业科学院土壤肥料研究所 一种基于高光谱成像的叶片叶绿素含量监测方法与系统
CN115115955A (zh) * 2022-07-08 2022-09-27 宁波大学 基于无人机高光谱遥感的松材线虫病树监测方法与装置
CN118554647A (zh) * 2024-07-30 2024-08-27 中石化胜利油建工程有限公司 一种增程式电能储放撬装电站实时监测系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106777845A (zh) * 2017-03-22 2017-05-31 南京农业大学 基于子窗口重排法提取敏感参数构建小麦叶片白粉病早期监测模型的方法
CN108229403A (zh) * 2018-01-08 2018-06-29 中国科学院遥感与数字地球研究所 一种用于估算植被叶面积指数的混合模型构建方法
CN110008905A (zh) * 2019-04-09 2019-07-12 安徽大学 基于遥感影像红边波段的区域尺度小麦条锈病监测方法
CN110132860A (zh) * 2019-05-29 2019-08-16 安徽大学 一种基于麦穗尺度分析的冬小麦赤霉病高光谱遥感监测方法
CN110553999A (zh) * 2019-07-04 2019-12-10 浙江大学山东工业技术研究院 基于高光谱和叶绿素荧光成像融合的柑橘黄龙病检测方法
CN111199185A (zh) * 2019-11-26 2020-05-26 广州地理研究所 基于XGBoost学习算法的地表温度降尺度方法、系统及设备
CN111665225A (zh) * 2020-01-03 2020-09-15 南京农业大学 一种基于叶绿素荧光成像技术判别黄瓜不同病害胁迫的方法及装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106777845A (zh) * 2017-03-22 2017-05-31 南京农业大学 基于子窗口重排法提取敏感参数构建小麦叶片白粉病早期监测模型的方法
CN108229403A (zh) * 2018-01-08 2018-06-29 中国科学院遥感与数字地球研究所 一种用于估算植被叶面积指数的混合模型构建方法
CN110008905A (zh) * 2019-04-09 2019-07-12 安徽大学 基于遥感影像红边波段的区域尺度小麦条锈病监测方法
CN110132860A (zh) * 2019-05-29 2019-08-16 安徽大学 一种基于麦穗尺度分析的冬小麦赤霉病高光谱遥感监测方法
CN110553999A (zh) * 2019-07-04 2019-12-10 浙江大学山东工业技术研究院 基于高光谱和叶绿素荧光成像融合的柑橘黄龙病检测方法
CN111199185A (zh) * 2019-11-26 2020-05-26 广州地理研究所 基于XGBoost学习算法的地表温度降尺度方法、系统及设备
CN111665225A (zh) * 2020-01-03 2020-09-15 南京农业大学 一种基于叶绿素荧光成像技术判别黄瓜不同病害胁迫的方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
樊东东: "基于代价敏感学习的冬小麦病虫害与倒伏遥感检测方法研究", 《中国优秀硕士学位论文全文数据库 农业科技辑》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113514402A (zh) * 2021-04-12 2021-10-19 新疆农业大学 一种冬小麦叶绿素含量的预测系统及方法
CN113538559A (zh) * 2021-07-02 2021-10-22 宁波大学 一种基于高光谱遥感影像的近海养殖筏提取指数的提取方法
CN113607656A (zh) * 2021-08-03 2021-11-05 安徽省农业科学院土壤肥料研究所 一种基于高光谱成像的叶片叶绿素含量监测方法与系统
CN115115955A (zh) * 2022-07-08 2022-09-27 宁波大学 基于无人机高光谱遥感的松材线虫病树监测方法与装置
CN118554647A (zh) * 2024-07-30 2024-08-27 中石化胜利油建工程有限公司 一种增程式电能储放撬装电站实时监测系统
CN118554647B (zh) * 2024-07-30 2024-10-29 中石化胜利油建工程有限公司 一种增程式电能储放撬装电站实时监测系统

Similar Documents

Publication Publication Date Title
CN112528789A (zh) 一种用于发病初中期分析的小麦条锈病遥感监测方法
Yang et al. Diagnosis of plant cold damage based on hyperspectral imaging and convolutional neural network
CN110287944B (zh) 基于深度学习的多光谱遥感影像的农作物虫害监测方法
Karadağ et al. Detection of pepper fusarium disease using machine learning algorithms based on spectral reflectance
CN110008905B (zh) 基于遥感影像红边波段的区域尺度小麦条锈病监测方法
Pydipati et al. Statistical and neural network classifiers for citrus disease detection using machine vision
CN112557393B (zh) 基于高光谱影像融合图谱特征的小麦叶层氮含量估测方法
Bendel et al. Evaluating the suitability of hyper-and multispectral imaging to detect foliar symptoms of the grapevine trunk disease Esca in vineyards
CN111161362B (zh) 一种茶树生长状态光谱影像鉴别方法
CN111738138B (zh) 一种耦合气象特征区域尺度的小麦条绣病严重度遥感监测方法
CN108830249B (zh) 一种基于asd高光谱数据的冬小麦白粉病遥感监测方法
Zhang et al. A cloud computing-based approach using the visible near-infrared spectrum to classify greenhouse tomato plants under water stress
Prasher et al. Analysis of DenseNet201 with SGD optimizer for diagnosis of multiple rice leaf diseases
Kumar et al. Apple Sweetness Measurement and Fruit Disease Prediction Using Image Processing Techniques Based on Human‐Computer Interaction for Industry 4.0
CN114694023A (zh) 一种光谱指数数据重构的棉花蚜害严重度分级方法
Nuanmeesri et al. Multi-layer perceptron neural network model development for chili pepper disease diagnosis using filter and wrapper feature selection methods
Yang et al. A quality detection method of corn based on spectral technology and deep learning model
CN112528726B (zh) 一种基于光谱成像和深度学习的棉蚜虫害监测方法及系统
CN116151454A (zh) 一种多光谱无人机预测矮林芳樟精油产量的方法及系统
CN116843960A (zh) 一种基于Sentinel-2时间序列和ReliefF的面向对象果园分类方法
CN115830444A (zh) 基于高光谱数据波段选择的水稻黑穗病提取方法及系统
CN113176214A (zh) 一种非成像光谱应用连续小波分析的麦穗赤霉病监测方法
CN115690582A (zh) 一种基于高光谱数据的冬小麦识别方法
CN114821300A (zh) 基于无人机多光谱遥感的小麦赤霉病预防植保作业时间判定方法
CN112364773A (zh) 基于l1正则约束深度多示例学习的高光谱目标检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210319