CN108982377A - 玉米生育期光谱图像与叶绿素含量相关性及时期划分方法 - Google Patents

玉米生育期光谱图像与叶绿素含量相关性及时期划分方法 Download PDF

Info

Publication number
CN108982377A
CN108982377A CN201810846451.5A CN201810846451A CN108982377A CN 108982377 A CN108982377 A CN 108982377A CN 201810846451 A CN201810846451 A CN 201810846451A CN 108982377 A CN108982377 A CN 108982377A
Authority
CN
China
Prior art keywords
model
chlorophyll content
multispectral
stage
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810846451.5A
Other languages
English (en)
Inventor
张志斌
徐明星
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inner Mongolia University
Original Assignee
Inner Mongolia University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inner Mongolia University filed Critical Inner Mongolia University
Priority to CN201810846451.5A priority Critical patent/CN108982377A/zh
Publication of CN108982377A publication Critical patent/CN108982377A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands

Landscapes

  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)

Abstract

本发明属于植物研究技术领域,公开了一种玉米生育期光谱图像与叶绿素含量相关性及时期划分方法,基于因子分析、类分析,对多光谱图像进行波段融合,提取多光谱灰度的特征;建立在玉米的整个生育期内多光谱图像灰度和叶绿素的拟合模型;使用机器学习分类模型,LinearSVC、KNeighbors、SVC和Ensemble,建立多光谱图像和玉米生育时期中,拔节期、小喇叭口期、大喇叭口期、抽雄期、开花期、抽丝期、子粒形成期、乳熟期、蜡熟期的分类模型.本发明在样本数量有限的情况下,对多光谱进行波段融合,也能够进一步提高分类器的精度。

Description

玉米生育期光谱图像与叶绿素含量相关性及时期划分方法
技术领域
本发明属于植物研究技术领域,尤其涉及一种玉米生育期光谱图像与叶绿素含量相关性及时期划 分方法。
背景技术
目前,业内常用的现有技术是这样的:
大多为采用如小波变换等方法对多光谱图像进行融合,以提取目标更多细节信息,没有对多光谱 图像进行融合,以实现对作物生长期内叶绿素含量的预测及相关性分析。
“精准农业”是当今农业最富有吸引力的前沿课题,通过引入现代技术和科学管理方式,获取农作 物生长过程中的参数信息,辅助管理人员做出科学决策,以提高农作物的产量。多光谱技术和新的叶 绿素含量测量方法的出现,在一定程度上完善了精确及无损快速采集农作物生长参数的手段。
叶绿素含量是衡量农作物生长状况的重要指标,通过在玉米生育期内,使用多光谱技术和 SPAD一502叶绿素含量测定仪,分别采集玉米叶片的多光谱图像灰度和叶绿素含量,建立两者的拟合 方程,这样通过多光谱图像灰度就可以大规模快速检测玉米的生长状况。在不同的生育阶段,给玉 米施肥的方法也不尽相同,通过多光谱图像灰度建立玉米生育时期的分类模型,可以给合理施肥提 供科学指导,提高玉米的产量。在对多光谱的波段进行融合,提取光谱特征时,将波段由原来的8 维空间映射到4维空间中,提取其光谱特征,提高拟合模型的判定系数(R-squared)、平均相对误差 率和分类模型的精度。
玉米的安全生产对我国粮食安全和作为“精准农业”的试点推广具有重要意义。虽然多光谱测 量技术在多种信息的检测和获取方面迅速发展。但总体来说,在农作物的生产种植方面,多光谱技术 的运用还不是特别广泛。经济欠发达地区对其使用更加滞后,还有很大的发展空间。
利用多光谱技术可以准确的监测和获取玉米的生长信息,并将玉米的生长信息和采集的多光谱 特征参数进行相关性研究,建立两者之间的模型,对于提取玉米的生长参数具有重要作用。对此已有 相关人员对棉花、苹果叶片的叶绿素含量和高光谱参数进行了研究,模型具有较高的反演效果。传统 测量植物叶绿素的方法,主要是使用物理化学方法,进行破坏性实验,才能获得叶绿素含量值。不仅 费时费力,而且存在明显的滞后性。在一定程度上限制了对玉米关键生育时间的监测与管理,阻碍了 “精准农业”的发展。自从有了叶绿素含量测量仪,不仅可以进行非破坏性测量,而且操作简单、实 时获取含量值,使用叶绿素测定仪和传统的物理化学方法测量得到的叶绿素含量成正相关的函数关 系。当叶绿素含量值和多光谱灰度值建立相关性模型后,可以进一步通过多光谱的灰度值来反演叶绿 素含量,监测玉米的生长状况,对于大范围的监测有极大的帮助,很大程度上提高了工作效率,为实 现玉米生育数据的大数据化奠定坚实的基础。同时,只要依据多光谱相机拍摄的多光谱图像,就可以 实时估计图像对应的叶绿素含量,为精准、优化的玉米栽培提供了科学指导。
多光谱图像融合技术主要应用于地质、农业、军事等领域,可以提高空间分辨率,减少模糊性, 提高分类精度,达到提高图像质量的目的。本发明对采集的多光谱图像灰度值,进行波段灰度特征融 合,以提高拟合模型的R-square和平均相对误差率,以及在使用多光谱图像灰度,对玉米生育时期 进行分类时,提高分类模型的精度。
施肥是提高玉米产量的关键,不合理的施肥反而会造成肥料利用率低,玉米产量下降的结果。另 一方面,随着城镇化的不断推进,劳动力形成了大规模的转移,年轻的壮年劳动力步入城市,导致劳 动力的大量缺失,所以需要迫切简化施肥流程,提高施肥的精度,实现大规模批量种植。在玉米不同 的生育时期,施肥的种类和比例不尽相同,同时还和当地的土壤状况密切相关。所以划分玉米的生育 时期对于合理施肥有重要帮助,对提高玉米产量起到极大的积极作用。
综上所述,现有技术存在的问题是:
(1)现有技术中,对于划分玉米的生育时期合理施肥没有提供合理依据;不能结合拟合叶绿素 含量的判定系数和泛化能力,提高玉米产量;
(2)现有技术中,没有基于因子分析、类分析,对多光谱图像进行波段融合,提取多光谱灰度 的特征,不能提高拟合模型的R-square、平均相对误差和灰度图像分类的精度,没有建立多光谱图像 和玉米生育时期中,拔节期、小喇叭口期、大喇叭口期、抽雄期、开花期、抽丝期、子粒形成期、乳熟期、 蜡熟期共9个时期的分类模型。不能为提高玉米产量提供依据。
解决上述技术问题的难度和意义:
通过多光谱波段融合技术,采用非接触监测作物生长期内叶绿素含量变化,以提供作物生长状态分 析方法,对进一步进行作物生长的营养含量(氮、磷、钾)信息化获取提供可借鉴的方法,同时,亦对作 物生长的施肥、灌溉或种植等自动信息化管理提供决策依据。上述技术的难度在于玉米作物各生长时期图 像灰度的聚类、因子分析进行波段融合,以及波段和与对应叶绿素含量的相关模型构建。
发明内容
针对现有技术存在的问题,本发明提供了一种玉米生育期光谱图像与叶绿素含量相关性及时期划分方 法。
本发明提出一种非接触式的作物生长状态实时检测叶绿素含量方式,有助于对作物生长状态进行实时 微观监控和管理,进一步提供了作物产量增加或果实品质改善的灌溉、施肥或种植等决策依据。
本发明是这样实现的,一种玉米生育期光谱图像与叶绿素含量相关性及时期划分方法,所述玉米生育 期光谱图像与叶绿素含量相关性及时期划分方法包括:
基于因子分析、类分析,对多光谱图像进行波段融合,提取多光谱灰度的特征;
建立在玉米的整个生育期内多光谱图像灰度和叶绿素的拟合模型;使用机器学习分类模型, LinearSVC、KNeighbors、SVC和Ensemble,建立多光谱图像和玉米生育时期中,拔节期、小喇叭口期、 大喇叭口期、抽雄期、开花期、抽丝期、子粒形成期、乳熟期、蜡熟期的分类模型。
进一步,所述玉米生育期光谱图像与叶绿素含量相关性及时期划分方法包括:
(1)基于特征提取,对多光谱波段进行波段融合,使用因子分析和聚类分析两种方法对多光谱波段 进行融合;
(2)建立拟合模型,采用逐步回归、影响分析的方法,对多光谱波段进行特征选择和剔除异常叶绿 素含量样本,比较显著的波段命名为叶绿素回归敏感波段和叶绿素含量建立回归模型;同时,在使用波段 融合方法对多光谱图像灰度特征提取后得到的因子得分,建立拟合方程;
(3)玉米生育时期的分类,采用因子分析的方法将分布比较近似的波段融合起来,扩大数据之间的 差异性。
进一步,所述玉米生育期光谱图像与叶绿素含量相关性及时期划分方法中,需由多光谱照相机拍摄得 到的玉米叶片灰度值图像;
建立叶绿素含量和多光谱灰度值的拟合模型,从每周采集的数据中选择一至两个质量较高的叶绿素含 量和多光谱灰度值;采用叶绿素测定仪测量植物叶绿素含量。
进一步,在波段融合阶段,通过使用因子分析和聚类分析方法对多光谱图像灰度进行特征提取;将原 来的8维多光谱波段映射到近红外、红、绿、蓝4维空间中,分析多光谱灰度值和近红外、红、绿、蓝光 有较高的关联性;
建立多光谱灰度值和叶绿素含量的线性和非线性模型,分析多光谱灰度和叶绿素含量的拟合模型时, 采用逐步回归的方法,提取和叶绿素含量具有较高关联性的多光谱波段,分别为475nm、575nm和675nm 3个波段,拟合模型的判定系数为0.93;在非线性回归中,基于所述3个显著性高的波段进行二次非线性 回归,得到675nm、575nm的平方,以及475nm和575nm乘积,3个具有高显著性的特征,拟合模型的 判定系数为0.88,两者的残差均分布在区间[-2,2]内,且线性模型残差点的分布聚集在零的附近。
进一步,叶绿素含量与多光谱灰度值因子得分的线性回归方程为
y叶绿素含量=47-0.88*
Factor1-2.38*Factor2-3.94*
Factor3-2.41*Factor4
本发明的另一目的在于提供一种实现所述玉米生育期光谱图像与叶绿素含量相关性及时期划分方法 的计算机程序。
本发明的另一目的在于提供一种实现所述玉米生育期光谱图像与叶绿素含量相关性及时期划分方法 的信息数据处理终端。
本发明的另一目的在于提供一种计算机可读存储介质,包括指令,当其在计算机上运行时,使得计算 机执行所述的玉米生育期光谱图像与叶绿素含量相关性及时期划分方法。
本发明的另一目的在于提供一种实现所述玉米生育期光谱图像与叶绿素含量相关性及时期划分方法 的玉米生育期光谱图像与叶绿素含量相关性及时期划分设备。
综上所述,本发明的优点及积极效果为:
本发明在建立光谱灰度和叶绿素含量拟合方程时,采用逐步回归、影响分析提高模型的判定系数, 残差分析检验模型的适用性,然后通过比较线性和非线性拟合方程,线性模型更合适,R-squared为 0.93,平均相对误差率为9%。在建立玉米生育期分类模型时,采用LinearSVC、KNeighbors、SVC和 Ensemble共4个模型,使用原始多光谱图像灰度训练分类器并将混淆矩阵及其变换后得到的矩阵灰度 可视化,提高分类器的精度,Ensemble模型中Bagging分类器的精度取得最高得分0.979。在使用因 子分析和聚类分析两种方法,对多光谱波段进行融合时,得到的融合结果一致,将相邻的2个波段映 射到1维空间中。同时在因子分析阶段,使用因子得分与叶绿素含量建立的拟合模型进一步提升了拟 合叶绿素含量的判定系数和泛化能力,R-squared为0.94,平均相对误差率为8%;使用因子得分建立分类模型时,Bagging分类器的精度提升到了0.978。
本发明在波段融合阶段,通过使用因子分析和聚类分析方法对多光谱图像灰度进行特征提取。 将原来的8维多光谱波段映射到近红外、红、绿、蓝4维空间中,说明多光谱灰度值和近红外、红、 绿、蓝光有较高的关联性。
在建立了多光谱灰度值和叶绿素含量的线性和非线性模型,在分析多光谱灰度和叶绿素含量的 拟合模型时,采用逐步回归的方法,提取和叶绿素含量具有较高关联性的多光谱波段,分别为475nm、 575nm和675nm这3个波段,拟合模型的判定系数为0.93,平均误差率为9%;在非线性回归中,基 于以上3个显著性较高的波段进行二次非线性回归,得到675nm、575nm的平方,以及475nm和575 nm乘积这3个具有较高显著性的特征,拟合模型的判定系数为0.88,平均相对误差率为9%。两者 的残差均分布在区间[-2,2]内,且线性模型较非线性模型残差点的分布更聚集在零的附近。因此,线 性回归模型更适合用来建立多光谱灰度和叶绿素含量的模型关系。随之使用波段融合方法对将原始多 光谱图像灰度转换为特征空间中的因子得分,使用因子得分与叶绿素含量建立线性拟合模型,模型的 拟合效果得到提高。
在对玉米的生育时期进行分类建模的时候,使用机器学习方法,按照模型复杂度由简单到复杂 的流程,使用原始多光谱灰度建立分类器并根据混淆矩阵可视化灰度图提升分类器的精度,和使用因 子分析降低维度的方法建立分类器,Ensemble模型中Bagging分类器的精度取得较好得分,分别为 0.979和0.978,说明在样本数量有限的情况下,对多光谱进行波段融合,也能够进一步提高分类器的 精度。
本发明进一步进行作物生长的营养含量(氮、磷、钾)信息化获取提供可借鉴的方法,同时,亦 对作物生长的施肥、灌溉或种植等自动信息化管理提供决策依据。
附图说明
图1是本发明实施例提供的玉米生育期光谱图像与叶绿素含量相关性及时期划分方法流程图。
图2是本发明实施例提供的标准化残差图。
图3是本发明实施例提供的二次非线性模型的标准化残差图.
图4是本发明实施例提供的多光谱灰度值柱状图。
图5是本发明实施例提供的分类建模流程图。
图6是本发明实施例提供的LinearSVC分类器训练时分类正确(左)和分类错误(右)情况图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详 细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明此前,已经建立苗期、穗期、花粒期的光谱与叶绿素含量间关系模型,利用光谱与叶绿素含 量关系模型对叶绿素含量进行预测,相关系数分别0.8224、0.7868、0.8092。基于支持向量机对玉米 苗期、穗期、花粒期这3个生育时期进行分类,预测精确度高于0.8。
本发明在其基础之上,新增加基于因子分析、类分析,对多光谱图像进行波段融合,提取多光谱 灰度的特征,为提高拟合模型的R-square、平均相对误差和灰度图像分类的精度提供数据支持;以及 建立了在玉米的整个生育期内多光谱图像灰度和叶绿素的拟合模型;以及使用机器学习分类模型, LinearSVC、KNeighbors、SVC和Ensemble,建立多光谱图像和玉米生育时期中,拔节期、小喇叭口 期、大喇叭口期、抽雄期、开花期、抽丝期、子粒形成期、乳熟期、蜡熟期共9个时期的分类模型。
一,下面结合具体分析对本发明作进一步描述。
本发明以多光谱图像提取的灰度值与叶绿素含量建立拟合模型,以及依据添加了玉米生育时期 标签的多光谱灰度值,建立分类模型,实现对玉米的生育时期进行分类的目标。同时分析导致多光谱 灰度值以及叶绿素含量这两类数据出现异常值的原因及其解决方法,提高拟合模型的精度,以及在分 类阶段面临的分类效果不理想问题的解决办法。
如图1所示,本发明实施例提供玉米生育期光谱图像与叶绿素含量相关性及时期划分方法,包括:
基于因子分析、类分析,对多光谱图像进行波段融合,提取多光谱灰度的特征;
建立在玉米的整个生育期内多光谱图像灰度和叶绿素的拟合模型;使用机器学习分类模型, LinearSVC、KNeighbors、SVC和Ensemble,建立多光谱图像和玉米生育时期中,拔节期、小喇叭口期、 大喇叭口期、抽雄期、开花期、抽丝期、子粒形成期、乳熟期、蜡熟期的分类模型。
具体包括:
(1)基于特征提取,对多光谱波段进行波段融合,使用因子分析和聚类分析两种方法对多光谱波段 进行融合,可有效合并相似波段并解释新特征的光学物理意义,对于提高拟合模型及分类模型的效果也起 到重要作用。
(2)建立拟合模型。多光谱的降维处理是提高其和叶绿素含量拟合精度的必须环节,考虑降低维度 势必会降低多光谱图像有效信息的利用情况。本发明采用了逐步回归、影响分析的方法,对多光谱波段进 行特征选择和剔除异常叶绿素含量样本,比较显著的波段命名为“叶绿素回归敏感波段”和叶绿素含量建 立回归模型,提高拟合模型的拟合效果;同时,在使用波段融合方法对多光谱图像灰度特征提取后得到的 因子得分,建立拟合方程,进一步提高拟合效果。
(3)玉米生育时期的分类。在采集数据时,就已经将玉米对应的生育时期进行了标记,属于机器学 习里的有监督学习。当观察多光谱的数据结构时,发现各波段的灰度值在不同的生育时期,有逐渐变小的 趋势,在最后一个时期出现了回升。所以多光谱灰度值,具有一定的可分性。同时,在同一小生育时期, 有部分波段灰度值的分布比较近似,为采用波段融合提供了良好的数据分布。为此,采用因子分析的方法 将分布比较近似的波段融合起来,扩大数据之间的差异性,近一步提高模型的分类性能。
本发明使用的是因子分析和聚类分析、基于统计学的多元回归、逐步回归、影响分析、残差分析、以 及机器学习领域的LinearSVC、SVC、KNeighbors和EnsembleClassifier分类模型。
二,下面结合具体实施例对本发明作进一步描述
1、数据采集方案设
本实验采集了两种数据,由多光谱照相机拍摄得到的玉米叶片灰度值图像。每组图像由波段分别为 425纳米、475纳米、550纳米、575纳米、615纳米、675纳米、775纳米以及850纳米的8幅图像组成。 这些灰度值图像,大致分布于全光谱图的蓝绿红和近红外区间;以及使用叶绿素测定仪,采集得到的玉米 叶片叶绿素含量。
数据采集的时间从2017年6月1日至2017年8月31日,每两天采集一次。每次于傍晚时分或午间, 在位于内蒙古大学校园内的玉米种植园,采用多光谱相机镜头与叶片成45度角的握持方式,拍摄玉米叶 片图像。叶绿素含量使用叶绿素测定仪沿着玉米叶片生长的方向,由靠近玉米秆的一端向叶尖,隔5厘米 左右,选取一个取样点采集。随着玉米植株的长大,每片叶子采集的数据点不断增多,最后趋于稳定,达 到9个左右。
对于每片玉米叶片的叶绿素含量,采用选取中位数的方法,从一片叶子测量的所有叶绿素含量中,取 其中位数作为一整片叶子的叶绿素含量。对于多光谱灰度值,在每次新建一次取样时,提取软件自动将这 次采样点的灰度值取平均值记录下来。采样点按照玉米叶片的生长方向排列。
在建立叶绿素含量和多光谱灰度值的拟合模型时,从每周采集的数据中选择一至两个质量较高的叶绿 素含量和多光谱灰度值。训练集的数量为19个,测试集的数据量为13个,在建立玉米生育时期的分类模 型中,数据总数为228,随机选择182个为训练集,占数据总量的80%,剩余的46个为测试集。
1.1多光谱相机
多光谱照相机在普通航空照相机的基础上发展而来。在可见光的基础上,向红外光和紫外光两个方向 扩展,通过让多个镜头在拍照时旋转只让特定波长的光透过,从而获得特定波长下的图像。但是必须保证 多个镜头拍摄同一物体时,相机的拍摄视角保持不变。因为使用多光谱灰度值提取软件在提取灰度值时, 只能在统一的取样点提取灰度值,如果相机抖动那么得到的一组图像的坐标就不统一,从而就必然发生提 取的样本值存在异常情况。
本发明采用的多光谱照相机为海洋薄膜公司(OTF)生产的SpectroCam。带有8个可以转动的镜头, 光谱范围从425nm到850nm。拍摄时,通过连接相机和笔记本的网线传送控制指令和将拍摄的图像保存在 笔记本的指定文件夹中。同时可以实时查看拍摄的8幅图像,如果显示的图像出现光线的过曝或者亮度过 低的情况,可以重新拍摄一组新的图像。
1.2叶绿素测定仪
SPAD-502叶绿素测定仪是在全球范围内广泛使用的通过叶绿素活体测定方法测量植物叶绿素的 设备,体积小巧,携带方便。操作时,单人即可完成测量任务。通过测量叶片在两种波长范围内的透 光系数来确定叶片当前叶绿素的相对值。在测定叶绿素时,取下测量头上的防护罩,将叶子放置在测 量头下方拇指按压上部翘起部分。当仪器进行测量时发出滴滴声表示测量完毕,在液晶显示屏上显示 叶绿素含量。同时避免光线直射,造成对实际数据的偏差。
1.3数据预处理常用的方法
保证数据质量是进行数据分析的第一步,高质量的数据是得到高质量模型的前提。数据预处理 的任务是改进数据质量,从而提高数据分析结果的精度和解释性。同时通过对数据格式和结构的调整, 使数据更符合挖掘的需要。数据预处理分为数据清理、数据集成、数据变换、数据规约几个方面。
1.3.1数据清理
数据清理是数据预处理的重要组成部分,用来删除原始数据集中的无关数据、重复数据,平滑 噪声数据,处理缺失值、异常值等。
缺失值,通常在记录或录入数据的过程中,因为相关人员的疏忽,在后期使用数据的过程中,数据分 析人员才发现的一些样本的某些属性值,缺失的情况。处理方法,可分为3种:删除记录、数据插补和不 处理。
异常值,在数据处理需要视情况决定是否需要剔除,因为有些异常值可能蕴含着有用的信息。 例如在信用卡诈骗的数据挖掘中,关注的重点就是这些异常值,它们能揭示诈骗者的特征。
表1数据清理常用方法
Table 1Common methods of data cleaning
1.3.2数据集成
数据集成是将多文件或多数据库运行环境中的异构数据进行合并处理。主要进行数据的选择、 数据的冲突以及数据的不一致。
在多光谱灰度值与叶绿素含量进行回归建模时,两种数据是采用不同的工具采集的,所以存储 的方式也就不一样。提取灰度值需要将图像批量重命名再导入到配套软件中,提取出的是电子数据, 叶绿素含量每次测量时记录在纸质记事本中,需要重新录入到电子表格中,转为电子数据。最后才能 将两种电子数据集成在一个表格中,进行数据清理,供建模使用。
1.3.3特征提取
特征提取是自动构建新的特征,将原始特征转换为一组具有明显物理意义或者统计意义的特征。 通过合并相关属性来创建新属性,降低维度,从而提高数据挖掘的效率、降低计算的时间成本。从而 寻找出最小的属性子集并确保新数据子集的概率分布尽可能接近原来数据集的分布。
表2特征提取的常用方法
Table 2Common Methods of property Specification
1.4数据拟合
数据拟合是一种基于历史信息推断出连续型对象数据未来变化趋势的数值分析方法。在我们的日常生 活中,现在已经在天气预报、电力系统用电量预测等领域发挥着重要作用。智能手机上现在都自带着天气 预报类的应用程序,无论是7天内还是15天内的天气情况都可以查看,无论是对最简单的出门是否需要 携带雨伞还是制定黄金周的外出旅行都起到一个指导作用。电厂每时每刻都在不停的生产电力,动态的调 整发电量能够有效的节约能源,缓解全球变暖。
1.4.1预测模型及实验工具介绍
统计回归方法与机器学习方法相比,建模原理简单。其中以线性回归方法为代表的统计回归方法因其 建模过程简单直观,并且具有较强的解释性,因此在实际问题中有着极为广泛的应用。统计假设理论基于 一定的理论假设,依据理论假设设定变量间的一组规律性的函数表示,即建立预测模型,通过传入自变量 输出因变量的值。回归模型根据输入自变量的个数和自变量的次方可分为,一元线性回归、多元线性回归、 非线性回归。
对于线性回归模型的介绍如下:
给定由d个属性描述的样本X=(x1;x2;x3;…;xd),其中xi是X在第i个属性上的取值,多元线 性模型试图学得一个通过属性的线性组合进行预测的函数。
基本形式为:
f(x)=ω1x12x23x3+…+ωdxd+b(2-1)
向量表达式为:
f(x)=ωTx+b (2-2)
其中,ω=(ω1;ω2;ω3;…;ωd)。
当ω和d确定后,模型就可以确定了,所以,多元线性回归,形式简单、易于建模。此外,由于ω直 观表达了各属性在预测中的重要性,因此线性模型具有很好的可解释性。例如,f叶绿素含量(x)=0.1*x425 +0.3*x475+0.4*x575+0.2*x775,则意味着只考虑多光谱图像中的4个波段,就可以拟合叶绿素 的含量。其中,575波段最重要,其次是475波段,接着是775波段,最后是425波段。因为ω575> ω475>ω775>ω425,故可以依据函数表达式,一目了然地看出各属性的重要程度。
非线性模型和线性模型非常相似,输入的自变量不仅仅是输入变量的原始形式,还包括各个变量的次 方和变量之间交互后产生的变量。比如,输入的变量是a和b,那么对于3次非线性回归模型,由原始输 入变量产生的所有变量为a、b、ab、a2、a3、b2、b3、ab,ba2和ab2
多元非线性回归方程的表达式:
y=β01z12z2+…+βnzn+ε(2-3)
其中zi是xi、xi k、xi*xj
目前在统计学领域,比较流行的工具是R语言。它是免费开源、专门为统计学和数据分析开发的语言, 很多科研工作者在这个平台已经贡献了很多工具包,安装即可免费使用。同时R语言简单易学,在各种平 台兼容性好。目前使用的最优搭配应该是使用开源组织提供的R软件内核再加上第三方公司(Rstudio) 提供的UI界面,这个组合比使用原安装包的操作环境要方便很多,能够极大地提高操作的舒适感以及提 高开发效率。
1.4.2预测模型的评价指标
不管是在建立一个模型的过程中还是在建立模型后,及时对模型进行评价是一项必要的操作。在检验 时包括:
●模型的拟合优度。
●模型的平均相对误差率。
模型的拟合优度,通过检验回归模型的系数是否全部为零来确定。如果系数全部为零,那么模型就不 可用,否则模型就可以使用。拟合优度通过计算模型的判定系数定量判定:
其中,SSR为回归平方和,SST称为总的平方和, 表示将第i个自变量输入模型后,预测得到的因变量的值,是所有因变量的平均值,yi代表第i 个因变量。
模型的平均相对误差率,计算公式为:
其中,yi是测试数据,f是建立的回归模型,f(xi)是模型预测的数值,m是样本的数目。得到 的数值越小,代表模型越好。
1.5数据分类
分类任务就是确定对象属于哪个预先定义的类别的过程。对数据分类,目前已经有了广泛应用, 比如依据电子邮件的标题和内容检查垃圾邮件,依据核磁共振扫描的结果区分肿瘤是良性还是恶性, 依据西瓜的条纹等信息挑选出一个好瓜。
分类任务输入的数据是记录集合,记录的属性可以是离散型数据也可以是连续型数据,但是记录 的类别标签必须是离散型数据。其实可以将分类模型看作一种特殊的回归模型,回归模型的输出结果 是连续型数值,分类模型的输出结果是离散型数值。本次实验都是有监督分类方法,也就是说是训练 数据集是带有类别标签的。对不带类别标签的数据集进行分类是无监督学习。
1.5.1分类模型介绍
在本次实验中使用了基于支持向量机(SVM)的LinearSVC、SVC、最近邻分类以及集成学习分类 方法。每个分类器都有fit和predict方法,fit方法将训练数据及其类别标签传入建立模型,predict 方法在已经建好的模型里,传入测试数据输出预测的类别。比如将导入的模型命名为clf,那么使用 方法为:
clf.fit(train_x,train_y)
clf.predict(test_x)。
线性支持向量分类LinearSVC(Linear Support Vector Classification)是使用liblinear实现的算法,相 比于SVC在选择惩罚参数和损失函数时有更大的自由,对数据量较大的模型有更好的表现。在处理多 分类问题时默认使用一对多的策略对数据进行分类。参数如下表所示:
表3LinearSVC的主要输入参数
Table 3Main parameters of LinearSVC
在jupyter Notebook中通过从sklearn模块中导入svm.Linear()就可以使用该方法。表3中的 主要参数在语句clf=svm.LinearSVC()中设置,就使用默认的参数值。
支持向量分类(SVC)是基于libsvm实现的分类器。它的时间复杂度是样本数量的平方,当数 据量超过1万时,花费的时间就会特别长,也就不再推荐使用该方法。SVC使用不同的核函数,建立 不同的模型。它的主要参数如下:
表4SVC的主要参数
Table 4Main parameters of SVC
在sklearn模块中导入svm.SVC就可以使用SVC方法了,传入的参数decision_function_shape使用 了一对一(ovo)方法,一共需要生成
m*(m-1)/2 (2-6)
个分类器,其中m是训练数据集的样本数,再通过投票的方式决定输入数据的类别。SVM训练模型的核心 就是选择一个较好的核函数,主要有线性(Linear)、多项式(poly)、径向基(rbf)、sigmod核函数,默 认选择径向基内核。这些函数中应用最广的是rbf核,无论是小样本还是大样本,高维还是低维等情况, rbf核函数均适用,它相比其他的函数有以下优点:
1)rbf核函数可以将一个样本映射到一个更高维的空间,而且线性核函数是rbf的一个特例,也就 是说如果考虑使用rbf,那么就没有必要考虑线性核函数了。
2)与多项式核函数相比,rbf需要确定的参数要少,核函数参数的多少直接影响函数的复杂程度。另 外,当多项式的阶数比较高时,核矩阵的元素值将趋于无穷大或无穷小,而rbf会减少数值的计算难度。
K近邻分类(KNeighbors Classifier)是通过计算与输入数据距离最近的k个训练样本集的类标号, 通过投票的方式决定其输出类标号:
集成学习方法(Ensemble Classifers)通过训练多个弱分类器并将其组合起来,得到一个性能稳定的 分类器。训练弱分类器的方法有独立训练和序列化训练两种。独立训练就是从所有的训练样本中抽取部分 样本用来训练一个分类器,序列化训练就是在已经训练好的弱分类器基础之上再训练新的弱分类器。
独立训练弱分类器以Bagging为代表,它默认弱分类器以决策树为基础。主要的参数如下:
表5Bagging分类器的主要参数
Table 5Main parameters of Bagging
其中max_samples表示每次训练弱学习器时,训练数据集中随机参与训练的数据的比例,max_features 表示每次训练弱学习器时,训练数据集的属性中随机参与训练的属性的比例。
以AdaBoostClassifier为代表的序列化训练弱分类,默认也是以决策树为弱分类器的基础,它的主要 参数如下:
表6AdaBoostClassifier的主要参数
Table 6Main parameters of AdaBoostClassifier
1.5.2实验工具
随着机器学习热潮的推动,无论是从数据分析、数据挖掘这些较为基础的领域,还是以人工智能为代 表的较为高端的领域,都涌现出了一些免费的开发工具以及社区工程师实现的开源算法。在本次试验中, 使用了主流的开发语言Python、易用的开发环境Jupyter Notebook以及开源的框架Scikit Learn。
Python语言是一种面向对象的解释型语言,在1989年由荷兰人发明,距今已有近30年的历史, 由于Python语言的简洁、易读以及可扩展等特性,在国外用Python做科学计算的研究机构日益增多。 同时众多开源的数据计算软件包都提供了Python的调用接口,底层仍用c语言编写,在提高操作简 洁性的同时,仍保持较高的执行效率,更促进了这门语言在开源社区的传播。
Jupyter Notebook是一个Web应用程序,支持运行40多种编程语言,Python和R都在它的支 持范围内,只要安装相应的内核就能使用。它有一种基于JSON的文档格式.ipynb,可以方便的分享 代码、输出结果以及图像等内容。目前在各种python研讨会上,一种流行的演示方式就是使用Jupyter Notebook,然后再将.ipynb文件发布到网上供所有人查阅。如没有安装的话,在命令行中输入pip install jupyter就可以自动安装。然后输入Juoyter notebook就会在默认的浏览器中弹出
在界面上显示有Python 3图标,表示编程使用的语言时Python最新的语法格式;Code表示, 目前处在编写代码的模式,还有一种格式是Markdown,可以实现对文字的编辑,以及插入图像。
Scikit learn是基于python的机器学习框架,有丰富的接口,可以实现分类、回归、聚类、数 据降维、模型选择和数据预处理这些功能。在使用时只需导入相应的模块即可。同时官方提供了许多 例子以及说明文档给开发人员使用。在安装scikit learn之前需要提前安装numpy、Python、scipy, 然后在命令行中pip install-U_scikit-learn就可以安装了。
在对模型训练时,使用sklearn的train_test_split方法:
将输入的多光谱灰度值随机打乱,80%数据用来训练模型,剩余的20%数据用来验证模型,即 评价模型的泛化能力。
引入交叉验证可以提高对模型的充分度和稳定性,交叉验证就是将训练集随机拆分为指定的份 数k,用参数cv设置。在sklearn中,有cross_val_score函数,模型的评价指标scoring选择精度 (precison_micro),具体方法如下:
对于泛化能力skleam也有相应的函数:
对训练模型通过精度(precision)进行评价。
对交叉验证训练时的混淆矩阵可视化,方法如下:
对于分类器,评价指标主要有精度(precision)、召回率(recall)和F得分(F-score)。通 过混淆矩阵可以便于理解以上概念。
●真正(True Positive,TP):被分类器预测为正的正样本
●假正(False Positive,FP):被分类器预测为正的负样本
●假负(False Negative,FN):被分类器预测为负的正样本
●真负(True Negative,TN):被分类器预测为负的负样本
精度、召回率、f得分的计算公式如下:
精确度(Precision):
P=TP/(TP+FP)(2-7)
召回率(Recall):
R=TP/(TP+FN)(2-8)
F得分(F-score):
F=2*P*R/(P+R)(2-9)
如果分类模型是多分类,即类别数大于等于3。主要有两种计算方法,当参数avg设置为macro时, 将多分类模型拆分为多个二分类模型,每个类别的精度和召回率计算公式如下,再取每个类别评价指标的 平均值。如果参数avg设置为weighted的话,计算加权均值。每个类别样本在总样本中的比重为每个类 别的权值。
每个类别的精度为计算对角线中数字除以其所在那一列数据的和,召回率为对角线中的数字除以其所 在那一行数字的和。
如果参数avg设置为micro,精度和召回率的计算公式为:
精度为混淆矩阵对角线上所有数字的和除以混淆矩阵左上角所有数字的和,召回率为混淆矩阵对角线 上所有数字的和除以混淆矩阵右下角所有数字的和。在第五章对玉米生育时期建立分类模型时,对欠拟合 的类别通过增加样本容量的方式,提高模型的分类效果。为了避免样本容量的增加对计算评价指标得分的 影响,故在验证分类器分类效果时将参数设置为“micro”。
四,下面结合多光谱波段融合对本发明作进一步描述。
1、多光谱波段融合是特征提方法在光谱处理方面的重要运用,在对玉米叶片的多光谱图像灰度进行 特征提取时,可有效合并相似波段并解释新特征的光学物理意义,对于提高拟合模型及分类模型的效果也 起到重要作用。
1.1基于因子分析的波段融合.
1.1.1因子得分及其光学解释
当得到因子载荷后,就可以计算每个样本的得分情况,即计算
X=μ+AF+∈ (3-1)
中的F。μ是多光谱波段灰度的数学期望,A是因子荷载矩阵,∈是残差。如果能将上述表达式变形为F=βX 的形式,求出β,那么就可以顺利的求出因子得分F。
因为荷载矩阵
i=1,2……,p,j=1,2,……,m
其中p是输入变量的维度,m是样本的数目。
A=RβT(3-3)
依据上式可得到
β=ATR-1(3-4)
因此,因子得分F可以估计为
F=ATR-1X(3-5)
在本实验中荷载矩阵A如表7所示
表7多光谱灰度值的荷载矩阵
取每个公共因子Factor下两个最大的荷载系数对应的多光谱波段作为因子所代表的多光谱波 段。对于Factor4,其对应的多光谱波段为X3、X4;对于Factor3,其对应的多光谱波段为X5、X6; 对于Factor2,其对应的多光谱波段为X7、X8;对于Factor1,其对应的波段为X1、X2。
依据波长与颜色分布的关系,大致可以将4个因子解释为:
表8公共因子的光学解释
依据因子分析对多光谱波段融合的结果来看,研究的多光谱波段分布于近红外、红、绿、蓝这四 种颜色。如果将融合的波段与叶绿素含量建立的拟合表达式的评价指标没有较大改变的话,那么得到 的模型将优于此前的线性拟合模型。因子分析将原始多光谱波段所处的8维空间映射到了4维空间, 在信息的利用率上较高,建立的线性模型更能全面的反映灰度值和叶绿素含量两者的相关性。同时在 采集多光谱灰度值时难免会有异常值的掺杂,相比于只使用3个波段的线性拟合模型来说,模型的稳 健性更高,拟合的精度更好。
1.1.2基于聚类分析的波段融合
聚类分析根据数据的分布结构,将其划分成有意义的簇。然而在很多情况下,聚类分析只是解 决其他问题的起点。无论是旨在理解还是运用,聚类分析都在许多领域扮演着重要角色。这些领域包 括:心理学和其他社会学科、生物学、统计学、模式识别、信息检索、机器学习和数据挖掘。
对于旨在理解的聚类。在对世界的分析和描述中,能够帮助人类快速识别信息。
对于旨在实用的聚类,聚类分析是研究发现最具有代表性的簇原型的技术。聚类分析提供由个别 数据对象到数据对象所指派的簇的抽象。此外,一些聚类技术使用簇原型(即代表簇中其他对象的数 据对象)来刻画簇特征。这些簇原型可以用作大量数据分析和数据处理技术的基础。主要应用在数据 的汇总、压缩和有效发现最近邻。
聚类分析方法的共同点是:
●事先不知道类别的个数与结构;
●分类的依据是对象之间的相似性和相异性,对象之间的距离是相似和相异的度量指标。
依据分类对象的不同,分为Q型聚类分析和R型聚类分析。Q型聚类分析是指对样本进行聚类, R型聚类分析是指对输入变量进行聚类分析。这里,使用的是R型聚类分析,即对输入的8个多光谱 波段进行聚类。
1.2.1距离和相似系数
设xik是第i个变量的第k个属性,变量i和j之间的距离设为dij那么,距离满足以下四个条 件:
1.dij≥0
2.dij=0,当且仅当第i个变量和第j个变量,各属性值都相同;
3.dij=dji
4.dij≤dik+dkj
基于定量变量,常用的距离方法有如下2种:
1.绝对值距离
2.欧几里得距离
当对变量进行分类时,即对属性进行分类,采用相似系数来度量变量之间的相似程度,也就是前面所 说的距离。
设cij是变量i和变量j的相似系数,对此有如下要求:
1、cij=±1,Xi=aXj(a≠0)
2、|cij|≤1
3、cij=cji
cij越接近于1,表示两个变量关系越密切,越接近于0,表示关系越疏远。变量之间经常借助相似系 数定义距离:
1.2.2聚类结果
将采集到的玉米叶子的8个波段的多光谱灰度值作为输入变量,各波段之间的距离使用公式3-9,将 聚类的个数设为4,与因子分析使用的类别数目相同。
横轴上为多光谱图像灰度的波段,纵轴为多光谱波段间,由计算公式计算得到的距离。输入的多光谱 数据有2个子簇,分别包含6个波段和2个波段,其中每个子簇又各自包含2个子簇。这能够有效的解释 采集的多光谱波段数据的内部结构,相临近的波段相比于不临近的波段,具有更相似的光学属性,同时结 合光谱和色彩的关系,使得采集的多光谱数据有更好解释性。簇的分布大致分布于,蓝、绿、红和近红外。
本发明采用了因子分析和聚类分析两种方法,对玉米叶片的多光谱波段进行融合。两种方法融合的结 果一致,将原始的8个波段映射到了近红外、红、绿、蓝4维空间中。尤其是因子分析方法,不仅能够将 多光谱图像的相似波段进行融合,而且能够计算出原始多光谱图像灰度在特征空间中的数据,即因子得分。 为接下来的数据拟合和数据分类工作,提供高质量的数据。
五,下面结合多光谱图像灰度与叶绿素含量的拟合对本发明作进一步描述。
使用R语言这个工具来建立叶绿素含量与多光谱灰度值的最优回归函数。最优回归方程有许多不同 的准则,在不同的准则下,最优回归方程也可能不同。在发明中,最优指的是从可供选择的所有变量中, 选择对因变量叶绿素含量有显著影响的自变量多光谱波段,残差满足正态分布,以及参与拟合的多光谱波 段中不存在对模型有显著影响的样本。
1、基于多元线性回归的拟合:
1.1.1所有波段参与线性回归建模
波段数目只有8个,相对于几十个、上百个属性来说,已经比较少。同时,在建立函数的过程中,并 不能事先知道,哪些波段的权重比较高,哪些波段的权重比较低,所以不能鲁莽地决定,选择带入哪些波 段以及舍弃哪些波段,否则,如果忽略了对叶绿素含量有显著影响的玉米多光谱图像的灰度,那么拟合模 型与实际情况就会出现较大的偏离。
从采集的叶绿素含量和多光谱灰度值中,选取19个样本,叶绿素含量为响应变量,多光谱灰度值为 自变量。虽然建立的模型R-squared比较大,已经接近于1,表示模型对于所有参与到建模的数据的拟合 效果比较好,但是,没有一个多光谱的波段的灰度值是显著的,也就是说,达不到前面所规定的建立“最 优”拟合方程的要求。
1.1.2基于逐步回归和影响分析提升线性模型的拟合效果
逐步回归是统计建模时常用的一种选取显著性较高自变量的方法,使用最小信息准则(AIC)作 为评价指标,每次剔除使得AIC减少最多的变量。R语言提供了较为方便的“逐步回归”计算函数step, 它是以AIC信息统计量为准则,通过选择最小的AIC信息统计量,来达到删除或增加变量的目的。依 次剔除了属性x1、x7、x3,因为它们的AIC信息统计量,在每次逐步回归的过程中,都是最小的, 所以剔除了。当逐步回归方法,终止后,再次通过summary函数,查看各变量的显著性水平,发现变 量x2、x4、x6的显著性水平有很大提高,但变量x8的显著性水平仍不理想。
在R软件中,还有dropl方法能够用来进行逐步回归。如果删除变量x8,AIC的值会从31.47 增加到31.722,是留存的4个变量中增加最少的。另外,残差平方和也是逐步回归的重要指标之一, 从直观来看,拟合越好的方程,残差的平方和应越小。去掉变量x8,残差的平方和上升7.39,也是 最少的。因此,从这两项指标来看,应该再去掉变量x8。
使用显著性水平较高的多光谱灰度值与叶绿素含量建立回归方程。可以看出,选择变量x2、x4、x6,它们 的显著性水平都比较高,并且R-squared的值也比较大。所以,可以认为在选取多光谱波段建立了“最优” 回归方程。回归方程为
f(x)叶绿素含量=52.3+0.16*x2-0.07*x4-0.09*x6。(4-1)
通过逐步回归的方法,以AIC准则为指标,依次对方程中AIC较小的变量进行删减,在一定程度上对 自变量进行了选取,但是仍没有完全达到最优的要求。按照最优方程的要求,还需要进行影响分析。
所谓影响分析就是探查对估计有异常大影响的数据。在回归分析中的一个重要假设是,使用的 模型对所有数据是适当的。在实际应用中,有一个或多个样本其观测值似乎与模型不相符,但模型拟 合于大多数数据,是一个很常见的情况。如果一个样本点不遵从某个模型,但其余数据遵从这个模型, 则称该样本点为强影响点,也称为异常值点。影响分析的一个重要功能就是区分这样的样本数据。 接下来分别计算拟合模型的DFFITS统计量、Cook距离和COVRATION统计量,对可能是强影响点的样本给 予标记。
当剔除异常样本后,可以发现模型的指标相对于以前得到了提升,也就是说优化了模型。当然, 不是所有的带有“*”标记的都是异常样本,比如,将第13号和16号样本,都剔除掉,建立模型, x2的参数显著性水平,相对于本章开始的多元线性模型,反而变弱了。所以,对于不同的模型,异常样本 的剔除,需要结合实际的情况而定。
最终得到的多光谱灰度值与叶绿素含量的线性回归表达式为:
y叶绿素含量=51.56+0.18*x2-0.08*x4-0.09*x6(4-2)
1.1.3基于回归诊断检验线性模型
给出了使用逐步回归选择对叶绿素含量影响最显著的多光谱图像灰度进入回归方程的方法,和影响分析剔 除异常值的方法来提高模型的拟合效果,但没有对回归模型的残差分布是否满足正态分布,模型的拟合优 度作进一步的研究。下面,依次就回归分析中提出的问题,对上一节的多元线性回归拟合模型进行分析。
误差项检验通过对残差进行分析实现,在使用最小二乘原理求回归模型时,对残差实际上是做 了属于正态分布的假设。接下来对线性拟合模型的残差做正态检验。
p值为0.11大于0.05,所以线性拟合模型的残差服从正态分布。
残差图是进行模型拟合的诊断工具,用来检验模型的拟合情况。以残差y.rst为纵坐标,以拟 合值y.fit为横坐标的散点图称为残差图,如图2。
如果残差服从正态分布的假设成立时,标准化残差应近似服从于标准正态分布。依据正态分布的性质,若 随机变量X~N(u,ó^2),则有
P{u-2ó<X<u+2ó}=0.954(4-3)
对于标准化残差,应该有95%的样本点落在区间[-2,2]中,从标准化残差图可以看出,图中的散 点基本落在了区间中,所以线性模型是较为合适的。
将13条测试数据代入线性拟合表达式中,得到叶绿素含量的预测值,使用均分误差根公式得到多元线性 回归模型的指标得分为9%。
1.2基于多元非线性回归的拟合
标准化残差图2中,有部分非异常值样本的残差值接近于-2,说明多元线性回归对于部分样本 的拟合仍然不是特别准确,所以能否有更好的方法来提高模型的拟合度。在多元线性回归中,增加了变量 的多次方项以及变量之间的交互项,相当于是对原来的多元线性回归增加了新的特征。所以可以将多元非 线性回归理解为增加非一次项的多元线性回归。
下面对筛选出的显著性较高的3个多光谱波段进行多元非线性回归。首先计算出每个波段的二次方项 以及它们之间的交互作用项。将第2个波段的平方项记为x22,同理x44,x66为第4个和第6个波段的平方 项,它们的交互项为x24,x26,x46。yls为叶绿素含量。得到的回归方程。
从显著性角度来看,叶绿素回归敏感波段与以其为基础添加的新的特征和叶绿素含量建立的2次非线性回 归模型,各输入变量的显著性都特别低。所以,需要利用上一章使用的逐步回归方法,剔除掉到对线性回 归作用较低的输入变量。
1.2.1基于逐步回归提升非线性模型的拟合效果
实验结果来看,有部分自变量的显著性很低。所以需要继续剔除显著性较低的自变量。
从运算结果来看,如果删除变量x66、x26、x46,AIC的值增加的最少,残差的平方和上升也最少。
当剔除以上的输入参数后,剩余的参数显著性水平得到明显提升。
得到的非线性回归方程为:
y叶绿素含量=53.52-0.107*x6-0.0004*x42+0.0008*x2*x4(4-4)
1.2.2基于回归诊断检验非线性模型,
二次非线性模型的标准化残差图,如图3。
此时的残差值,相对于线性回归可以说,在标准化区间[-2,2]内的分布较线性回归模型更松散。
将13条测试数据代入表达式4-4,得到叶绿素含量的预测值,使用平均相对误差率公式得到非线性多元线 性回归模型的指标得分为9%。
1.3波段融合对拟合模型效果的提升
在建立新的回归模型之前,需要将原始的多光谱灰度值映射到公共因子所在的四维空间,因子得分就 是其转换后的数值。
在得到因子得分后,将其作为自变量,叶绿素含量作为因变量,建立两者的线性拟合模型。
得到的叶绿素含量与多光谱灰度值因子得分的线性回归方程为
y叶绿素含量=47-0.88*
Factor1-2.38*Factor2-3.94*
Factor3-2.41*Factor4
(5-6)
由F=ATR-1X,可以将数据由公共因子对应的四维空间映射回原始的八维空间,即将使用因子得分 建立的拟合方程转变为由原始8个多光谱波段表示的表达式。
表8原始多光谱灰度八维空间对应的变换系数 T
将13条测试数据代入因子分析与叶绿素含量的拟合表达式,得到叶绿素含量的预测值,使用平均相对误 差率公式得到非线性多元线性回归模型的指标得分为8%。
因子分析通过转换公式将原始的输入变量转变为公共因子,在使得模型有更好的解释性的同时,也提 高了模型对原始信息的使用率,将全部8个多光谱波段的灰度值都加以使用,相对于只使用3个多光谱波 段,能够提高模型的稳健型。当拍摄玉米的多光谱图像时,环境对于采集效果的影响,实际上比较大。例 如,在不同的时间段拍摄,阳光的强度是不一样的,在中午的时候拍摄图像的多光谱灰度值比于傍晚时拍 摄图像的灰度值要高。同时,在拍照时,由于拍摄人员站立的位置不同,也会造成拍摄图像受到的光照强 度不一致,从而影响采集到的灰度值。当引入了因子分析方法融合波段以后,能够有效地弱化环境的影响。
依据实验结果的R-squared和平均相对误差率可以看出,由因子得分与叶绿素含量建立的拟合 方程相比于前面的线性回归与非线性回归均好。
在本发明中,采用了线性和非线性两种模型分别建立玉米叶片的多光谱图像灰度和叶绿素含量 的拟合表达式,从R-squared、残差分析和平均相对误差率3个方面来看,线性拟合模型前两项指标 均优于非线性拟合模型,平均相对误差率两者相等。所以线性回归模型更适合用来建模,同时也就不 需要建立更高次数的非线性拟合模型了。同时,在使用波段融合方法对多光谱图像灰度特征提取后得 到的因子得分,建立线性拟合方程,较使用原始多光谱图像灰度,拟合效果更好。
从多光谱波段的聚类结果可以看出,聚类分析的结果与因子分析的结果一致。通过两种不同的计 算方法,依据多光谱数据内部不同的特性,从不同的角度,得到一致的波段融合结果,印证因子分析 方法得到的结果具有一定的合理性同时更加证实了叶绿素含量与光照中的近红外、红、绿、蓝光有很 强的相关性。
六,下面结合玉米生育时期的分类对本发明作进一步描述。
依据玉米在生长过程中,因为其自身量变和质变的结果以及环境的影响,它的外部形态和内部 生理特性均发生了阶段性的变化,这些阶段性变化,称为生育时期。主要表现在叶龄指数的增大、雄 穗、雌穗的出现以及子粒的性状。叶龄指数是指已生长出叶片数占主茎总叶数的百分数,即当时已生 长出叶数/主茎总叶片数×100。依据玉米品种的不同,晚熟的茎总叶数一般为20至21片,中熟玉米 为17至18片。在采集数据时,依据以上不同生育时期的特点以及参照玉米不同生育时期的图像,记 录下拍摄玉米叶子时其所属的时期,为后期的分类工作提供精确的数据支持。
对于玉米生长时期的分类,本研究组的赵晨,已经完成了基于玉米叶片灰度值的3个时期的分 类工作,所以能否将生长时期再细化,划分为9个时期,是本部分的研究内容。
在分类实验中,9个生育时期按照玉米生长的时间顺序分别为:拔节期、小喇叭口期、大喇叭口 期、抽雄期、开花期、抽丝期、子粒形成期、乳熟期、蜡熟期。每个时期的采集的样本数大致相等, 为25个。
1.1玉米叶片多光谱灰度值的结构
通过head、info、describe和柱状图四种方法查看多光谱灰度值的数据结构,观察数据是否成 功导入到程序中,数据是否存在缺失值、数据的统计信息以及分布情况。
在Jupyter中使用pandas模块导入数据后,使用其head方法,默认显示数据的前5行,每一条 记录有9列数据,前8列存放不同光谱下的灰度值,最后一列存放玉米的生育周期,生育时期的类别 标签为区间[0,8]内的正整数。
使用info()方法可以快速的查看数据,尤其是样本数据数量,每个属性的数据类型以及是否存 在缺失值。
导入的数据不存在缺失值的情况,故不需要采用填补缺失值的方法来补充数据。如果存在缺失 值的话,一般使用该属性的中位数填补,在describe方法 中,有一项输出值就是中位数。
使用describe()方法,可以查看数值数据的平均值、标准差、最小值、最大值和四分位数。
可以看出输入的数据集共有228条记录,随着波段的增大,灰度值的各项统计值大体都呈增大的 趋势。即随着波段的增大,灰度值的分布区间呈增大的趋势,区间的高度也在增大。具体每个波段灰 度值的分布情况可以通过直方图较为直观的显示出来。如图4多光谱灰度值柱状图。
从图4看出,前6个波段的灰度主要分布在灰度值较小的区间,最后2个波段灰度值的分布较 为均匀。也就是说前6个波段的灰度值较后2个波段灰度值的分布有较高的偏向性,同时灰度值也较 小。
玉米叶片的多光谱灰度值为划分各个生育时期提供了数据支持,较好的分布情况能够降低分类 工作的难度,使用一些常用的分类方法就可以得到比较好的分类结果;反之,如果灰度值的分布情况 不理想,也就是说数据质量较差,那么就需要特征工程的介入,构造出新的具有代表性的特征,以扩 大样本数据之间的差异性、提高数据的区分度,或者寻找新的分类模型。
从不同生育时期与各波段灰度值部分数据的分布情况图中,可看出,沿着横轴方向观测,为不同 生育时期玉米同一波段灰度值的分布情况。从中可以发现在不同的生育时期,各波段的灰度值都呈现 出起伏变化的状态;同时大多数波段的灰度值,随着生育时期的增大,都呈现出了减小趋势,但在最 后一个时期都出现了回升,所以原始的样本数据具有一定的可区分度。
沿着纵轴,可以观察在相同生育时期,各多光谱波段灰度值的分布情况,在同一个生育时期内 部,有部分波段的灰度值分布曲线比较接近。如果将其合并,构建一个新的属性特征的话,可以进一 步扩大样本数据之间的区分度,提高分类的效果。
1.2基于机器学习的分类建模
1.2.1分类建模流程,如图5,
在分类时输入的数据样本总量为228,通过sklearn的train_test_split方法随机将80%的数据用来 训练模型,其余的20%数据用来评价模型。在训练模型时通过9次交叉验证充分训练模型,列出每次评价 指标精度、召回率和f得分,并给出训练时模型分类正确与错误情况的可视化灰度图,为提高模型的分类 效果提供指导意见。查看分析哪些类别的样本容易被错误分类,进而增加该类别样本的数据量,提高模型 对其学习的程度。
对于分类模型,如果在交叉验证训练阶段评价指标得分的平均值就低于0.85,可以认为对分类模型 欠拟合,没有达到实验要求,那么就不再对其通过增加样本容量的方法优化分类效果。
1.2.2分类模型选择
选取分类模型的算法,依据奥卡姆剃须刀原理,能够很好解释已知数据并且十分简单的模型才是最好 的模型,也就是处理问题时应该选择的模型。所以进行分类的模型选择流程比较合理,模型的复杂度逐渐 递增,尤其是最后的集成算法(EnsembleClassifiers)。
Linear SVC是一种使用线性核函数实现支持向量分类(Support VectorClassification)的方法, 所以该方法默认有且只有线性核函数,在执行的时候无需另行指定核函数。对于多分类情况,SVC使用一 种叫做一对一(one-against-one)的策略来进行多分类。每两个类之间都会生成一个分类器用来区分这 两个类别,故一共需要生成的分类器数量是
s=nclass*(nclass-1)/2。(5-1)
nclass是类别的总数,s是分类器的总数。
同时,还有一种叫做一对多(one-vs-the-res)的策略,只要需要nclass个分类器。当问题是二分 类时,需要1个分类器。所以,在类别数很多的情况下分类器的总数比前一种策略要少很多。KNeighbors 分类器假设给定的训练数据集,其中每个样本的类别已经标记,即是一种有监督学习方法。分类时,对于 新的实例,依据最接近它的k个训练实例的类别,通过少数服从多数的原则,决定新实例的类别。实际上 分类的模型就是由训练实例对特征空间的划分。
集成学习分为Bagging、Boosting。在进行有监督学习时,有时只能得到多个弱学习器,它们只在某 些方面有较好的表现。但是有监督学习的目标是建立一个稳定并且在各个方面表现都比极好的分类器,所 以可以通过将多个弱学习器组合起来得到一个性能更全面的分类器,即使某个弱分类器在做分类工作时得 到了错误的结果,其他的弱分类器也可以纠正错误,这就是集成学习的思想。
1.3基于机器学习的分类实验
在分类时输入的多光谱灰度的样本量为228,通过sklearn的train_test_split方法随机将80%的数 据用来训练模型,其余的20%数据用来评价模型。当验证模型参数设置为micro时,精度和召回率相等, 进而f得分也和两者相等,所以评价指标只列出精度。
在训练分类器时通过9次交叉验证充分训练分类器,列出每次的精度,如果训练时达到接受阈值0.85, 则计算验证时分类器的精度,以及依据混淆矩阵可视化灰度图增加相应类别样本的数量25个,25个样本 为从多光谱图像中再次提取的数据,再次进行9次交叉验证训练分类器,并再次计算验证分类器时的精度。 比较分类器的两次验证精度。
在通过特征提取方法,提升分类器分类效果时,使用因子分析将多光谱灰度从原来的8维空间映射为 4维空间中的因子得分。随机选取因子得分的80%作为训练及,剩余的20%作为测试集,训练分类器。同时 将其与使用原始多光谱灰度建立的分类器模型对比验证精度。
1.3.1基于混淆矩阵可视化提升模型分类效果
使用sklearn的confusion_matrix(train_y,train_y_pred)方法可以得到模型的混淆矩阵,其中 train_y和train_y_pred分别是训练集中玉米多光谱灰度值的类别标签和对应机器学习模型输出的类别标 签。在混淆矩阵的基础之上,正确分类的可视化图直接通过将数值所在位置转变成对应的灰度小方块,数 值越大,小方块的颜色越趋向于白色,正确率也就越高;小方块的颜色,越趋向于黑色,表示被分类的正 确率越低。以上信息在一定程度上显示了欠拟合的分类类别,对增加训练样本容量起到辅助作用;错 误分类的可视化图中,每个小方块的颜色代表每个数字与所在行所有数字和的比值,对角线的数值再 被设为零,从纵向看,出现较多白色小方块的列,表示样本被错误分类为此类别的概率较高;从横向 看,有较多白色小方块的行,表示此类别的样本容易被错误分类。
1.3.1.1Linear SVC模型实验,C分类器交叉验证训练时的混淆矩阵:
混淆矩阵的对角线上的数字表示训练LinearSVC模型时分类正确的样本,其他分布于每行的数字 表示分类错误的样本。混淆矩阵的列表示真实的分类,行表示预测的分类。
图6LinearSVC分类器训练时分类正确(左)和分类错误(右)情况图。
图6的左图是将图6混淆矩阵的数字转化为灰度图,数字越大在图中对应的区域就趋向于白色, 越小就趋向与黑色。由此可以看出在训练模型时,类别0和类别6分类效果最好,其次是类别2、5、 7、4、8,类别1和3分类效果最差,对应方块的颜色趋向于黑色,以上信息在一定程度上显示了欠拟 合的分类类别,对增加训练样本容量起到辅助作用。右图显示的是分类器的错分率,从纵向看,样本 被错分为类别6和7的可能性最高;从横向看,类别1、3、4、8的样本容易被错误分类。所以为了 提高模型的评价指标得分,一种方法是增加样本1、3、4、8的数量,提高对这4个类别的学习程度。
表9LinearSVC分类器交叉验证训练时的精度
表9中提升前的精度显示,在训练过程中精度的最大值为0.682,远低于接受的最小阈值0.85, 所以评价指标的平均得分小于0.85,即LinearSVC模型未达到训练要求。因为模型默认是线性核函 数,没有核函数kernel这个参数,也就无法调优,所以通过调优的方式提升分类效果不可行。提升 后的精度显示,当增加相应类别样本的数量,LinearSVC在交叉训练阶段的精度没有得到提升,反而 出现了降低。对于接下来的实验,如果在交叉验证训练阶段评价指标的得分低于0.85,就不再采用 混淆矩阵可视化的方式提升模型的分类效果。
一般情况下,当建模效果不好时,模型的泛化能力也不会很好,接下来查看LinearSVC模型的 泛化能力。模型的泛化能力显然是达不到要求,远远低于0.85。在接下来的实验中,如果模型在训 练阶段的精度就低于0.85的话,就不再验证其精度。
1.3.1.2 KNeighbors Classifier模型实验
表10KNeighbors分类器交叉验证训练时的精度
以上是将参数n_neighbors设置为5时,得到最好的评价得分,精度均小于0.85,未能达到要求。
1.3.1.3核函数为rbf的SVC的分类器;
核函数为rbf的SVC分类器训练时分类正确(左)和分类类错误(右)情况图中显示,相对来说对于 类别3、4、7、8的正确分类有待提高。右图显示,错误分类的样本容易划分到类别2和5,属于类别7的 样本容易错误分类。在进一步提高模型性能的时候,可以增加属于类别7的样本,提高对类别7的学习程 度。
表11核函数为rbf的SVC分类器交叉验证训练时精度
在交叉验证训练模型的时候,相对于原来的模型,模型的性能得到了略微提升,指标总得分上升了 0.142。对比验证时模型的指标得分,模型的泛化能力相比于之前也得到了一定程度的提升,得分提高了 0.044。说明建议具有一定的可行性。
1.3.1.4、核函数为linear的SVC分类器,
核函数为linear的SVC分类器训练时类别正确(左)和类别错误(右)情况图显示,每个类别在训 练的时候,正确分类的效果较为理想,在除对角线外的区域方块的颜色基本都为全黑,所以分类时每个类 别基本分类正确。从右图纵向看错误分类的样本容易被分类为第7类,从横向看易于被错误分类的样本是 第6类,即第6类样本正确分类的正确率略低。为了进一步提高模型的分类性能,可以增加第6类样本的 数量,增加对其学习程度。
表12核函数为linear的SVC分类器交叉验证的精度
依据分类错误分类可视化图提供的建议,增加属于类别6的样本后,再次交叉验证训练模型的评价指 标得分相对于前者分布更加紧密,极差小了0.029。验证指标的得分比前者增加了0.048。说明建议对于 改进模型起到了预期的作用。
1.3.1.5、核函数为poly的SVC分类器:
核函数为poly的SVC分类器训练时类别正确(左)和类别错误(右)情况图的左图显示,对于类别1和5的分类效果最好,类别8的分类效果略差,其余类别的分类效果介于之间。右图显示,当数据 错误分类时容易被误分类为类别4和7,类别6容易被错误分类,为了提高模型的性能,可以增加类 别6的数据。
表13核函数为poly的SVC分类器交叉验证训练时的精度
在依据类别错误分类可视化图提供的建议,增加属于类别6的样本后,再次交叉验证训练模型 的评价指标得分相对于前者分布更加紧密,极差小了0.133。验证指标的得分比前者增加了0.005。 说明建议对于改进模型起到了预期的作用。
1.3.1.6、Bagging分类器:
Bagging分类器训练时类别正确(左)和类别错误(右)情况图显示,每个类别分类正确的效果 都比较理想,第5类数据分类效果最好,第8类数据分类效果相对来说略差。从右图可见,当数据被 错误分类时,最容易被错分为第5类,容易被错分的数据为第8类数据,所以为了提高模型的分类性 能,可以增加第8类样本的数据量,提高对其学习的程度。
表14Bagging分类器交叉验证训练时的精度
按照建议增加类别8的样本,重新进行交叉验证训练模型,得到模型训练的指标。
1.3.1.7、AdaBoost分类器:
表15AdaBoost分类器交叉验证训练时的精度
在训练模型时评价得分远远低于接受阈值0.85,所以此分类器不可用。
1.3.1.8、实验结果汇总:
表16分类器的精度汇总
表17分类器效果提升后的精度对比
1.3.2波段融合对分类器精度的提升
在上面的分类实验中LinearSVC、KNeighbors分类器模型在验证时,精度远远低于通常模型接受的阈 值0.85,说明这两个模型在对玉米生育时期的数据进行分类时,性能特别弱。依据因子分析在融合多光谱 波段后的公共因子的得分与叶绿素含量建立多元线性回归方程,对回归模型的平均相对误差率有一定提升 的效果,所以对原始采集的228个多光谱灰度值也进行因子分析,希望采用此特征提取方法对提高模型的 评价指标有一定帮助。同时,从原始多光谱灰度值在不同生育时期的数据分布情况来看,有部分波段的分 布情况较为接近,说明其数据内部结构具有一定的相似性,在融合时具有一定的可行性。这里使用了因子 分析的方法将原来的8维空间映射为4维空间。
在对上述分类性能不好的分类器再次实验后,KNeighbors分类器的性能得到了较大程度的提升,但 是仍低于0.85。既然特征提取对改善模型的分类效果有作用,不妨对SVC的3个模型、集成学习的2个模 型都再次进行实验,结果显示Bagging分类器的性能得到了提升。实验结果如表18所示:
表18波段融合对分类精度的提升
本发明使用有监督机器学习方法,分别采用LinearSVC、KNeighbors、SVC和Ensemble共4个模型, 分别使用原始多光谱灰度建立分类器并根据混淆矩阵可视化灰度图提升分类器的精度,和使用波段融合提 取特征的方法建立分类器,Ensemble模型中Bagging分类器的精度取得较好得分,分别为0.979和0.978。 说明在样本数量有限的情况下,对多光谱进行波段融合,也能够进一步提高分类器的精度。
下面结合效果对本发明作进一步描述。
本发明在波段融合阶段,通过使用因子分析和聚类分析方法对多光谱图像灰度进行特征提取。将原来 的8维多光谱波段映射到近红外、红、绿、蓝4维空间中,说明多光谱灰度值和近红外、红、绿、蓝光有 较高的关联性。
在建立了多光谱灰度值和叶绿素含量的线性和非线性模型,在分析多光谱灰度和叶绿素含量的 拟合模型时,采用逐步回归的方法,提取和叶绿素含量具有较高关联性的多光谱波段,分别为475nm、 575nm和675nm这3个波段,拟合模型的判定系数为0.93,平均误差率为9%;在非线性回归中,基 于以上3个显著性较高的波段进行二次非线性回归,得到675nm、575nm的平方,以及475nm和575 nm乘积这3个具有较高显著性的特征,拟合模型的判定系数为0.88,平均相对误差率为9%。两者 的残差均分布在区间[-2,2]内,且线性模型较非线性模型残差点的分布更聚集在零的附近。因此,线 性回归模型更适合用来建立多光谱灰度和叶绿素含量的模型关系。随之使用波段融合方法对将原始多 光谱图像灰度转换为特征空间中的因子得分,使用因子得分与叶绿素含量建立线性拟合模型,模型的 拟合效果得到提高。
在对玉米的生育时期进行分类建模的时候,使用机器学习方法,按照模型复杂度由简单到复杂 的流程,使用原始多光谱灰度建立分类器并根据混淆矩阵可视化灰度图提升分类器的精度,和使用因 子分析降低维度的方法建立分类器,Ensemble模型中Bagging分类器的精度取得较好得分,分别为 0.979和0.978,说明在样本数量有限的情况下,对多光谱进行波段融合,也能够进一步提高分类器的 精度。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用全部 或部分地以计算机程序产品的形式实现,所述计算机程序产品包括一个或多个计算机指令。在计算机 上加载或执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述 计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存 储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例 如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、 数字用户线(DSL)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据 中心进行传输)。所述计算机可读取存储介质可以是计算机能够存取的任何可用介质或者是包含一个 或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软 盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所 作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种玉米生育期光谱图像与叶绿素含量相关性及时期划分方法,其特征在于,所述玉米生育期光谱图像与叶绿素含量相关性及时期划分方法包括:
基于因子分析、类分析,对多光谱图像进行波段融合,提取多光谱灰度的特征;
建立在玉米的整个生育期内多光谱图像灰度和叶绿素的拟合模型;使用机器学习分类模型,LinearSVC、KNeighbors、SVC和Ensemble,建立多光谱图像和玉米生育时期中拔节期、小喇叭口期、大喇叭口期、抽雄期、开花期、抽丝期、子粒形成期、乳熟期、蜡熟期的分类模型。
2.如权利要求1所述的玉米生育期光谱图像与叶绿素含量相关性及时期划分方法,其特征在于,所述玉米生育期光谱图像与叶绿素含量相关性及时期划分方法包括:
(1)基于特征提取,对多光谱波段进行波段融合,使用因子分析和聚类分析两种方法对多光谱波段进行融合;
(2)建立拟合模型,采用逐步回归、影响分析的方法,对多光谱波段进行特征选择和剔除异常叶绿素含量样本,比较显著的波段命名为叶绿素回归敏感波段和叶绿素含量建立回归模型;同时,在使用波段融合方法对多光谱图像灰度特征提取后得到的因子得分,建立拟合方程;
(3)玉米生育时期的分类,采用因子分析的方法将分布比较近似的波段融合起来,扩大数据之间的差异性。
3.如权利要求2所述的玉米生育期光谱图像与叶绿素含量相关性及时期划分方法,其特征在于,所述玉米生育期光谱图像与叶绿素含量相关性及时期划分方法中,由多光谱照相机拍摄得到的玉米叶片灰度值图像;
建立叶绿素含量和多光谱灰度值的拟合模型,从每周采集的数据中选择一至两个叶绿素含量和多光谱灰度值;采用叶绿素测定仪测量植物叶绿素含量。
4.如权利要求2所述的玉米生育期光谱图像与叶绿素含量相关性及时期划分方法,其特征在于,
在波段融合阶段,通过使用因子分析和聚类分析方法对多光谱图像灰度进行特征提取;将原来的8维多光谱波段映射到近红外、红、绿、蓝4维空间中,分析多光谱灰度值和近红外、红、绿、蓝光的关联性;
建立多光谱灰度值和叶绿素含量的线性和非线性模型;分析多光谱灰度和叶绿素含量的拟合模型时,采用逐步回归的方法,提取和叶绿素含量具有关联性的多光谱波段。
5.如权利要求4所述的玉米生育期光谱图像与叶绿素含量相关性及时期划分方法,其特征在于,叶绿素含量与多光谱灰度值因子得分的线性回归方程为
y叶绿素含量=47-0.88*
Factor1-2.38*Factor2-3.94*
Factor3-2.41*Factor4。
6.一种实现权利要求1~5任意一项所述玉米生育期光谱图像与叶绿素含量相关性及时期划分方法的计算机程序。
7.一种实现权利要求1~5任意一项所述玉米生育期光谱图像与叶绿素含量相关性及时期划分方法的信息数据处理终端。
8.一种计算机可读存储介质,包括指令,当其在计算机上运行时,使得计算机执行如权利要求1-5任意一项所述的玉米生育期光谱图像与叶绿素含量相关性及时期划分方法。
9.一种实现权利要求1所述玉米生育期光谱图像与叶绿素含量相关性及时期划分方法的玉米生育期光谱图像与叶绿素含量相关性及时期划分设备。
CN201810846451.5A 2018-07-27 2018-07-27 玉米生育期光谱图像与叶绿素含量相关性及时期划分方法 Pending CN108982377A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810846451.5A CN108982377A (zh) 2018-07-27 2018-07-27 玉米生育期光谱图像与叶绿素含量相关性及时期划分方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810846451.5A CN108982377A (zh) 2018-07-27 2018-07-27 玉米生育期光谱图像与叶绿素含量相关性及时期划分方法

Publications (1)

Publication Number Publication Date
CN108982377A true CN108982377A (zh) 2018-12-11

Family

ID=64551967

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810846451.5A Pending CN108982377A (zh) 2018-07-27 2018-07-27 玉米生育期光谱图像与叶绿素含量相关性及时期划分方法

Country Status (1)

Country Link
CN (1) CN108982377A (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110147525A (zh) * 2019-05-21 2019-08-20 内蒙古蒙树生态环境有限公司 苗木生长状态预测方法、装置、设备和存储介质
CN110428106A (zh) * 2019-08-05 2019-11-08 山东农业大学 一种基于机器学习的农作物需水量预测方法
CN110647725A (zh) * 2019-09-20 2020-01-03 武汉轻工大学 基于多元逐步回归的工程测试缺失数据修复方法及系统
CN111066535A (zh) * 2019-12-30 2020-04-28 中国科学院西安光学精密机械研究所 一种使用ai光谱的种植温室及种植方法
CN111077107A (zh) * 2020-01-08 2020-04-28 山东金璋隆祥智能科技有限责任公司 一种甜菊糖提取液中糖甙含量的在线检测方法
CN111084030A (zh) * 2019-12-30 2020-05-01 中国科学院西安光学精密机械研究所 模拟火星微重力的集装箱ai光谱种植系统及其控制方法
CN112834541A (zh) * 2020-01-03 2021-05-25 上海纽迈电子科技有限公司 一种钠含量及钠分布的测试方法
CN112834442A (zh) * 2021-01-04 2021-05-25 四川大学 基于多光谱数据的大区域尺度作物生长实时监测方法
US20210183045A1 (en) * 2018-08-30 2021-06-17 Ntt Data Ccs Corporation Server of crop growth stage determination system, growth stage determination method, and storage medium storing program
WO2021207977A1 (zh) * 2020-04-15 2021-10-21 深圳市大疆创新科技有限公司 可移动平台的作业方法、可移动平台以及电子设备
CN113607734A (zh) * 2021-08-11 2021-11-05 南京林业大学 无损式估测植物叶绿素含量及分布的可视化方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108195784A (zh) * 2018-02-01 2018-06-22 兰州城市学院 一种番茄叶绿素含量多光谱估测方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108195784A (zh) * 2018-02-01 2018-06-22 兰州城市学院 一种番茄叶绿素含量多光谱估测方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
姜伟杰 等: "基于多光谱成像的番茄叶片叶绿素含量预测建模方法研究", 《光谱学与光谱分析》 *
张俊华 等: "不同施肥条件下夏玉米光谱特征与叶绿素含量和LAI的相关性", 《西北植物学报》 *
张浩 等: "基于多光谱图像的水稻叶片叶绿素和籽粒氮素含量检测研究", 《中国水稻科学》 *
赵晨: "基于SVM和回归分析的玉米叶片叶绿素含量及表型参数研究", 《中国优秀硕士学位论文全文数据库 农业科技辑》 *

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210183045A1 (en) * 2018-08-30 2021-06-17 Ntt Data Ccs Corporation Server of crop growth stage determination system, growth stage determination method, and storage medium storing program
US11935282B2 (en) * 2018-08-30 2024-03-19 Ntt Data Ccs Corporation Server of crop growth stage determination system, growth stage determination method, and storage medium storing program
CN110147525A (zh) * 2019-05-21 2019-08-20 内蒙古蒙树生态环境有限公司 苗木生长状态预测方法、装置、设备和存储介质
CN110147525B (zh) * 2019-05-21 2023-02-14 内蒙古蒙树生态环境有限公司 苗木生长状态预测方法、装置、设备和存储介质
CN110428106A (zh) * 2019-08-05 2019-11-08 山东农业大学 一种基于机器学习的农作物需水量预测方法
CN110647725A (zh) * 2019-09-20 2020-01-03 武汉轻工大学 基于多元逐步回归的工程测试缺失数据修复方法及系统
CN111066535A (zh) * 2019-12-30 2020-04-28 中国科学院西安光学精密机械研究所 一种使用ai光谱的种植温室及种植方法
CN111084030A (zh) * 2019-12-30 2020-05-01 中国科学院西安光学精密机械研究所 模拟火星微重力的集装箱ai光谱种植系统及其控制方法
CN112834541A (zh) * 2020-01-03 2021-05-25 上海纽迈电子科技有限公司 一种钠含量及钠分布的测试方法
CN112834541B (zh) * 2020-01-03 2022-07-29 上海纽迈电子科技有限公司 一种钠含量及钠分布的测试方法
CN111077107A (zh) * 2020-01-08 2020-04-28 山东金璋隆祥智能科技有限责任公司 一种甜菊糖提取液中糖甙含量的在线检测方法
WO2021207977A1 (zh) * 2020-04-15 2021-10-21 深圳市大疆创新科技有限公司 可移动平台的作业方法、可移动平台以及电子设备
CN112834442A (zh) * 2021-01-04 2021-05-25 四川大学 基于多光谱数据的大区域尺度作物生长实时监测方法
CN113607734A (zh) * 2021-08-11 2021-11-05 南京林业大学 无损式估测植物叶绿素含量及分布的可视化方法

Similar Documents

Publication Publication Date Title
CN108982377A (zh) 玉米生育期光谱图像与叶绿素含量相关性及时期划分方法
Kong et al. Multi-stream hybrid architecture based on cross-level fusion strategy for fine-grained crop species recognition in precision agriculture
Koklu et al. Multiclass classification of dry beans using computer vision and machine learning techniques
Man et al. Improvement of land-cover classification over frequently cloud-covered areas using Landsat 8 time-series composites and an ensemble of supervised classifiers
Dihkan et al. Remote sensing of tea plantations using an SVM classifier and pattern-based accuracy assessment technique
Kavzoglu An investigation of the design and use of feed forward artificial neural networks in the classification of remotely sensed images
Abdalla et al. Nutrient status diagnosis of infield oilseed rape via deep learning-enabled dynamic model
CN106537422A (zh) 用于捕获信息内的关系的系统和方法
Zeng et al. Identification of maize leaf diseases by using the SKPSNet-50 convolutional neural network model
Hao et al. MFC-CNN: An automatic grading scheme for light stress levels of lettuce (Lactuca sativa L.) leaves
CN111339978A (zh) 利用卷积神经网络模型识别交通指数时间序列模式的方法
Rahmati et al. Early identification of crop types using Sentinel-2 satellite images and an incremental multi-feature ensemble method (Case study: Shahriar, Iran)
Tanwar et al. Deep learning-based hybrid model for severity prediction of leaf smut rice infection
Vaidhehi et al. RETRACTED ARTICLE: An unique model for weed and paddy detection using regional convolutional neural networks
Javidan et al. Tomato leaf diseases classification using image processing and weighted ensemble learning
Zhang et al. Appearance quality classification method of Huangguan pear under complex background based on instance segmentation and semantic segmentation
Singh et al. Apple Disease Classification Built on Deep Learning
Bilal et al. Increasing Crop Quality and Yield with a Machine Learning-Based Crop Monitoring System.
Dai et al. A novel two-stage method of plant seedlings classification based on deep learning
Mridha et al. Artificial Intelligence (AI) for Agricultural Sector
Jiang et al. Crop and weed classification based on AutoML
Yasam et al. Machine Learning based Robust Model for Seed Germination Detection and Classification
Wang et al. RETRACTED: Theoretical research on rice and wheat lodging detection based on artificial intelligence technology and a template matching algorithm
Ren et al. A new spectral index for the quantitative identification of yellow rust using fungal spore information
WAFULA A DEEP LEARNING MODEL FOR MAIZE LEAF DISEASE IDENTIFICATION: A CASE OF TRANS-NZOIA COUNTY

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20181211