CN112903602A - 基于机器学习和高光谱成像的多种类柑橘病叶识别方法及系统 - Google Patents

基于机器学习和高光谱成像的多种类柑橘病叶识别方法及系统 Download PDF

Info

Publication number
CN112903602A
CN112903602A CN202110087395.3A CN202110087395A CN112903602A CN 112903602 A CN112903602 A CN 112903602A CN 202110087395 A CN202110087395 A CN 202110087395A CN 112903602 A CN112903602 A CN 112903602A
Authority
CN
China
Prior art keywords
citrus
leaves
experimental sample
diseased
experimental
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110087395.3A
Other languages
English (en)
Inventor
吴叶兰
陈怡宇
管慧宁
刘杰
廉小亲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Technology and Business University
Original Assignee
Beijing Technology and Business University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Technology and Business University filed Critical Beijing Technology and Business University
Priority to CN202110087395.3A priority Critical patent/CN112903602A/zh
Publication of CN112903602A publication Critical patent/CN112903602A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes
    • G06F18/24137Distances to cluster centroïds
    • G06F18/2414Smoothing the distance, e.g. radial basis function networks [RBFN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Multimedia (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Radiology & Medical Imaging (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)

Abstract

本发明技术方案公开一种基于机器学习和高光谱成像的多种类柑橘病叶识别方法及系统,获取五类柑橘病叶的高光谱信息,包括正常叶片、溃疡病叶片、除草剂危害叶片、红蜘蛛危害叶片和煤烟病叶片;将光谱信息作为实验样本,对实验样本进行预处理和特征波长提取,采用支持向量机和随机森林算法设计病叶识别模型,实现柑橘病叶分类识别。本发明的优点是结合高光谱成像和机器学习技术对多种类柑橘病叶进行分类识别,得到五类柑橘病叶最佳分类模型,为柑橘生长状况监测及病虫害识别提供一种有效的无损检测方法。

Description

基于机器学习和高光谱成像的多种类柑橘病叶识别方法及 系统
技术领域
本发明属于高光谱成像技术领域,具体涉及一种基于机器学习和高光谱成像的多种类柑橘病叶识别方法及系统。
背景技术
柑橘产业是我国农村经济的支柱产业之一,在生长过程中容易受到病菌侵染和害虫侵蚀,从而使其新陈代谢受到影响,内部结构会发生改变,如叶片细胞的活性、含水量、叶绿素含量等生理特性发生变化,外部呈现反常的病害症状,如腐烂、斑点、霉斑、虫蛀等,这些病变将造成柑橘品质降低。如柑橘溃疡病病原属于细菌,感染后轻则果皮呈现疤痕、果熟后不耐贮藏易腐烂,重则导致落果;除草剂轻则导致柑橘叶片生长缓慢,重则导致枯萎死亡;柑橘红蜘蛛吸食叶片、果实汁液,引起落叶、落果;煤烟病由多种真菌引起,发病初期,表面出现暗褐色点状小霉斑,后继续扩大成绒毛状黑色或灰黑色霉层。病虫害的发生会影响柑橘的产量及质量,严重会造成经济损失。因此,研究一种精准的柑橘病虫害检测方法在实际生产过程中有重要意义。
传统的柑橘病虫害检测方法主要有人工检测方法,根据种植户或专业人员的经验知识来判断患病与否,主观性强;病理分析法,对柑橘的生物化学性质分析检测,周期长,成本高。高光谱成像技术利用成像光谱仪以数十至数百个连续细分的波段对目标区域同时成像,将图像与光谱结合,同时获取空间及光谱信息,得到以像素为单位的高光谱图像。利用高光谱数据图谱合一且波段覆盖范围广的特性,能够大大地提高其对目标的分辨识别能力。目前还没有将机器学习和高光谱成像技术结合对多种柑橘病虫害进行检测的研究。
发明内容
本发明提供一种基于机器学习和高光谱成像的多种类柑橘病叶识别方法及系统,采用高光谱成像技术,结合光谱预处理方法,提取特征波长,采用支持向量机和随机森林两类机器学习模型,实现多种类柑橘病叶的分类识别。
为实现上述目的,本发明技术方案提供了一种基于机器学习和高光谱成像的多种类柑橘病叶识别方法,包括:
一种基于机器学习和高光谱成像的多种类柑橘病叶识别方法,所述方法包括:
获取柑橘病叶的高光谱图像,其中所述柑橘叶片包括正常叶片、溃疡病叶片、除草剂危害叶片、红蜘蛛危害叶片和煤烟病叶片;
将所述高光谱图像的像素亮度值转换为反射率值;
提取所述转换后的高光谱图像对应的光谱信息并作为实验样本;
对所述实验样本进行预处理;
提取所述预处理后的实验样本的特征波长;利用所述预处理后的实验样本或所述特征波长构建训练样本集,根据所述训练样本集构建多种类柑橘病叶识别模型;
采用构建完成的识别模型进行多种类柑橘病叶识别。
在一实施例中,“提取所述转换后的高光谱图像对应的光谱信息并作为实验样本”,包括:
获取所述转换后的高光谱图像的有效光谱范围;
识别所述转换后的高光谱图像中的发病区;
根据所述发病区获取固定大小的感兴趣区域;
以所述感兴趣区域内每个像素的反射率值作为所述实验样本。
在一实施例中,“对所述实验样本进行预处理”,包括:
按下式所示的方法对所述实验样本进行一阶求导:
Figure RE-GDA0002980629350000021
其中,λi为实验样本的第i个波长,r(λi)是λi对应的反射率,Δλ为实验样本的相邻两波段间波长间隔。
在一实施例中,“对所述实验样本进行预处理”,包括:
按下式所示的方法对所述实验样本进行多元散射矫正:
Figure RE-GDA0002980629350000022
Figure RE-GDA0002980629350000031
Figure RE-GDA0002980629350000032
其中,
Figure RE-GDA0002980629350000033
为所有实验样本的反射率平均值,Datai为第i个实验样本的反射率,n为实验样本总个数,Dataij为第i个实验样本在第j个波长的反射率, ki为第i个实验样本的基线偏移量,bi为第i个实验样本的平移量,
Figure RE-GDA0002980629350000034
为校正后实验样本的光谱信息。
在一实施例中,“对所述实验样本进行预处理”,包括:
按下式所示的方法对所述实验样本进行标准正态变换:
Figure RE-GDA0002980629350000035
其中,
Figure RE-GDA0002980629350000036
为标准正态变换后第k个实验样本的反射率,xk为第k个实验样本变换前的反射率,SDev(X)为所有实验样本的标准差,Mean(X)为所有实验样本的均值。
在一实施例中,“提取所述预处理后的实验样本的特征波长”,包括:
计算所述预处理后的实验样本对应的光谱数据Xm×n的协方差矩阵Cn×n;其中,m表示实验样本总数,n表示实验样本的光谱波段;
计算Cn×n的特征值和特征向量;按降序选取k个特征向量,并作为列向量组成特征向量矩阵Un×k
按下式所示方法将实验样本投影到特征向量Un×k
Ym×k=Xm×nUn×k
其中,Ym×k为投影后实验样本的数据;
基于所述Ym×k获取对应的主成分荷载并获取主成分荷载图;
以所述主成分载荷图中荷载曲线的波峰和波谷的波长作为所述特征波长。
在一实施例中,“提取所述预处理后的实验样本的特征波长”的步骤包括:
步骤S1:利用所述实验样本的总数M和波段数K组成光谱矩阵XM×K
步骤S2:从所述XM×K中选取任意一列向量xj为初始迭代向量,并记为xk(0);其中(n=1,k(0)=j);
步骤S3:将剩余列向量组成集合S为:
S={j,1≤j≤K,j∈{k(0),…,k(n-1)}}
步骤S4:按下式所示方法获取xj对集合S中每一列向量的投影向量Pxj
Figure RE-GDA0002980629350000041
其中,T表示转置运算;
按下式所示方法记录最大投影的序号:
k(n)=arg(max||Pxj||,j∈S)
按下式所示方法将最大投影作为下次的投影向量:
xj=Pxj,j∈S
步骤S5:令n=n+1,如果n<N(N<M-1),则返回步骤S3进行循环计算,循环计算结束得到N×K对波长组合,对每对xk(0)和N组合建立定量模型,预测均方根误差最小时所对应的x* k(0)和N*即为最优波长组合,以所述最优波长组合为所述特征波长。
在一实施例中,所述病叶识别模型为支持向量机模型,所述支持向量机模型的核函数为RBF核函数;“利用所述预处理后的实验样本或所述特征波长构建训练样本集,并利用所述训练样本集构建病叶识别模型”,包括:
利用所述预处理后的实验样本的全波段光谱构建训练样本集;
将所述该训练样本集输入所述支持向量机模型;
采用网格搜寻法和交叉验证法获取所述支持向量机模型的惩罚系数和所述RBF核函数的gamma最优值;或者,
利用所述特征波长构建训练样本集;
将所述该训练样本集输入所述支持向量机模型;
采用网格搜寻法和交叉验证法获取所述支持向量机模型的惩罚系数和所述RBF核函数的gamma最优值。
在一实施例中,所述病叶识别模型为随机森林模型。
在一实施例中,在“对所述实验样本进行预处理”之前,所述方法还包括:采用随机法并按预设比例将所述实验样本分为训练样本和测试样本,并基于所述训练样本进行所述预处理;以及“利用构建完成的病叶识别模型进行病叶识别”,包括:将所述测试样本输入所述构建完成的病叶识别模型,获取所述构建完成的病叶识别模型的病叶识别率、总分类精度和Kappa系数。
一种基于机器学习和高光谱成像的多种类柑橘病叶识别系统,所述系统包括:光学暗箱、高光谱成像仪、光源、载物台以及处理装置,所述高光谱成像仪、光源以及载物台置于所述光学暗箱内,所述光源用于提供照明,所述高光谱成像仪用于采集置于所述载物台上的柑橘叶片的高光谱图像并传输给所述处理装置。
所述处理装置包括处理器、存储设备;处理器,适于执行各条程序;存储设备,适于存储多条程序;所述程序适于由处理器加载并执行如上述的基于机器学习和高光谱成像的多种类柑橘病叶识别方法。
本发明的优点在于:
本发明提供的基于机器学习和高光谱成像的多种类柑橘病叶识别方法及系统,考虑病害引起柑橘叶片内部结构改变,利用高光谱成像技术获得柑橘叶片在的光谱信息,并作为光谱样本进行预处理和特征波长提取,结合支持向量机和随机森林两种机器学习算法进行分类识别。相比于人工判断和病理分析,本发明提出的方法及系统能够更准确、快速地识别病叶,为多种类柑橘病虫害的无损准确识别提供便利。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明的一种基于机器学习和高光谱成像的多种类柑橘病叶识别系统的主要结构示意图。
图2是本发明的一种基于机器学习和高光谱成像的多种类柑橘病叶识别方法的主要步骤示意图。
图3是本发明技术方案所涉及的算法整体架构图。
图4是本发明实施例中五类柑橘叶片平均光谱曲线示意图。
图5是本发明实施例中原始光谱样本主要成分荷载图。
具体实施方式
病虫害的发生会影响柑橘的产量及质量,严重会造成经济损失。本发明的主要目的在于提供一种基于机器学习和高光谱成像的柑橘病虫害叶片(正常、溃疡病、除草剂、红蜘蛛和煤烟病)的分类识别方法及系统。考虑病害引起叶片内部结构改变,仅依靠外部特征无法准确,本发明通过高光谱成像技术获取叶片在81个波段下的光谱信息,进行预处理和特征提取后结合支持向量机和随机森林两种传统机器学习算法完成病叶的分类识别,识别结果较为准确。下面结合附图对本发明提供的基于机器学习和高光谱成像的多种类柑橘病叶识别方法及系统进行详细描述。
参阅附图1,图1示例性给出了基于机器学习和高光谱成像的多种类柑橘病叶识别系统的主要结构。如图1所示,本发明提供的基于机器学习和高光谱成像的多种类柑橘病叶识别系统包括光学暗箱50、高光谱成像仪51、光源52、载物台53、电源54以及处理装置55。其中,电源54为系统提供电力。高光谱成像仪51采用SOC710VP,光谱范围为350~1050nm,光谱分辨率为1.3nm,光谱波段数为128,镜头类型为C-Mount,焦距可调。光源52用于提供照明,其选用4个12V的卤素灯,亮度可调、角度可调。高光谱成像仪51、光源52 以及载物台53置于一个黑色的光学暗箱50内,光学暗箱50中的载物台可自由升降,载物台53上有漫反射涂层,光学暗箱50用来避免境光对图片采集造成的干扰。高光谱成像仪51用于采集置于载物台53上的柑橘叶片的高光谱图像并传输给处理装置55。该处理装置55包括处理器、存储设备;处理器,适于执行各条程序;存储设备,适于存储多条程序;该程序适于由处理器加载并执行如下述的基于机器学习和高光谱成像的多种类柑橘病叶识别方法。
参阅附图2和图3,图2和图3示例性示出了基于机器学习和高光谱成像的多种类柑橘病叶识别方法的主要步骤和算法总体架构。基于机器学习和高光谱成像的多种类柑橘病叶识别方法可以包括步骤S1至步骤S8。
步骤S1:获取柑橘病叶的高光谱图像。其中,柑橘叶片包括正常叶片、溃疡病叶片、除草剂危害叶片、红蜘蛛危害叶片和煤烟病叶片。
具体地,基于机器学习和高光谱成像的多种类柑橘病叶识别系统扫描获取柑橘叶片的高光谱图像,其中柑橘叶片包括正常叶片、溃疡病叶片、除草剂危害叶片、红蜘蛛危害叶片和煤烟病叶片五种叶片。更为具体地,可以在果园内采摘的柑橘正常叶片46片、溃疡病叶片46片、除草剂危害叶片80片、红蜘蛛危害叶片51片、煤烟病叶片98片,将采摘到的叶片擦拭干净,每六个一组放置在载物台上,转动高光谱成像仪的光圈和设置曝光时间,以获得最清晰的高光谱图像,最终设置光圈刻度为2.8,曝光时间为150ms,此时镜头与载物台距离为57.6cm,扫描速度30行/秒,32秒/cube。
步骤S2:将高光谱图像的像素亮度值转换为反射率值。
具体地,可以按公式(1)所示的方法将高光谱图像的像素亮度值转换为反射率值。
Figure RE-GDA0002980629350000071
其中,R为转换后的高光谱图像的反射率值,D为高光谱图像的像元亮度值(digital number,DN),Db为灰板的像元亮度值,Rb为灰板的标准反射率。
步骤S3:提取转换后高光谱图像对应的光谱信息并作为实验样本。
具体地,获取转换后的高光谱图像的有效光谱范围;识别转换后的高光谱图像中的发病区;根据发病区获取固定大小的感兴趣区域;上述感兴趣区域内每个像素的反射率值作为实验样本。更为具体地,利用ENVI软件打开采集的高光谱图像,去除400nm和1000nm附近受噪声影响较大的波段,选择 478~900nm间81个波段作为有效光谱范围,在每个叶片一个或多个发病区提取5×5的感兴趣区域(Region of Interest,ROI),将ROI内每个像素的反射率值作为光谱信息,则一个ROI得到的光谱信息为25×81个波段的光谱信息。
请参阅附图4,为正常叶片、溃疡病叶片、除草剂危害叶片、红蜘蛛危害叶片和煤烟病叶片五种叶片平均光谱曲线图。由平均光谱图可知在478-500nm 的蓝光波段内光谱反射率低,形成一个波谷;在550nm左右由于叶绿素反射作用光谱曲线呈现一个反射率峰;在红光波段内的680nm附近由于叶绿素强吸收作用光谱曲线有一个波谷,700-900nm为高反射率区域。全波段光谱范围内正常叶片、除草剂危害叶片、红蜘蛛危害叶片和煤烟病叶片光谱曲线相似度高,仅反射率值存在差别。值得注意的是,依据这些光谱曲线无法进行准确类别区分识别,还需后续建模处理。
步骤S4:采用随机法并按预设比例将实验样本分为训练样本和测试样本。
具体地,本实施例共获取实验样本有13250个,按训练样本集与测试样本集为3:1的比例,划分训练样本9938个和测试样本3312个。
步骤S5:对实验样本进行预处理。
具体地,本发明是对训练样本进行预处理。通过预处理可以去除光谱信息存在的噪声和谱线漂移等干扰,预处理方法可以包括一阶求导(first derivative, 1stDer)、多元散射校正(multiplicative scatter correction,MSC)和标准正态变换(standardnormalized variate,SNV)。下面对三种预处理方法进行介绍。
本实施例中,可以按公式(2)所示的方法对所述实验样本进行一阶求导:
Figure RE-GDA0002980629350000081
其中,λi为所述实验样本的第i个波长,r(λi)是λi对应的反射率,Δλ为实验样本相邻两波段间波长间隔。
也可以按公式(3)-(5)所示的方法对实验样本进行多元散射矫正:
Figure RE-GDA0002980629350000082
Figure RE-GDA0002980629350000083
Figure RE-GDA0002980629350000084
其中,
Figure RE-GDA0002980629350000085
为所有实验样本的反射率平均值样本平均值,Datai为第i个实验样本的反射率,n为实验样本总个数,Dataij为第i个实验样本在第j个波长的反射率,ki为第i个实验样本的基线偏移量,bi为第i个实验样本的平移量,
Figure RE-GDA0002980629350000086
为校正后实验样本的光谱信息。
也可以按公式(6)所示的方法对所述实验样本进行标准正态变换:
Figure RE-GDA0002980629350000091
其中,
Figure RE-GDA0002980629350000092
为标准正态变换后第k个实验样本的反射率,xk为第k个实验样本变换前的反射率,SDev(X)为所有实验样本的标准差,Mean(X)为所有实验样本的均值。
采用1stDer、MSC和SNV三种预处理方法对光谱信息进行预处理,光谱一阶求导能在谱图上显示出微小的变化,使光谱图的分辨率得到很大的提高。 MSC可有效消除光谱的基线漂移现象,增强光谱与数据之间的相关性。SNV 通过定心和缩放每个单独的光谱来减小颗粒大小不均匀和粒子表面非特异性散射的影响。
步骤S6:提取预处理后的实验样本的特征波长。
本实施例中,可以对预处理后的实验样本进行主成分分析(principal componentanalysis,PCA),获取实验样本对应的特征波长。
具体地,计算预处理后的实验样本对应的光谱数据Xm×n的协方差矩阵Cn×n;其中,m表示实验样本总数,n表示实验样本的光谱波段;计算Cn×n的特征值和特征向量;按降序选取k个特征向量,并作为列向量组成特征向量矩阵Un×k;按公式(7)所示方法将实验样本投影到特征向量Un×k
Ym×k=Xm×nUn×k (7)
其中,Ym×k为投影后实验样本的数据。
基于Ym×k获取对应的主成分荷载并获取主成分荷载图。
以主成分载荷图中主成分曲线的波峰和波谷的波长作为特征波长。
通过对预处理后实验样本的光谱波段进行线性组合得到新的主成分;以主成分中波峰和波谷的波长作为特征波长。更为具体地,采用PCA对不同预处理方法下实验样本进行特征波长提取,对原始光谱波段经过线性组合得到新的主成分,去除波段间的冗余信息,k个主成分均由原始光谱波段经过线性组合得到,其相关系数即为载荷。根据主成分的载荷(loadings)绝对值大小来确定特征波长,主成分曲线的波峰和波谷位置处载荷绝对值大,对应的波长即为特征波长。载荷是主成分与原始波长变量的相关系数,用于反映主成分和各波长变量间的密切程度。请参阅附图5,为未经预处理和经预处理的实验样本(光谱样本)前4个主成分载荷图,其中,PC-1、PC-2、PC-3和PC-4对应的曲线分别代表第一、二、三和四主成分的载荷曲线。每条曲线的波峰和波谷所对应波长为特征波长,表1所示为不同预处理方法下得到的特征波长。
表1不同预处理方法下特征波长
Figure RE-GDA0002980629350000101
由表1可以看出,原始光谱样本得到7个特征波长,分别是525.48,678.45, 710.1,720.65,725.93,757.58,762.85nm。运用相同的方法,1stDer预处理光谱样本得到7个特征波长,分别是520.2,689,704.83,715.38,731.2,741.75, 757.58nm;MSC预处理光谱样本和SNV预处理光谱样本得到7个一致的特征波长,分别是551.85,678.45,704.83,710.1,725.93,731.2,757.58nm。
本实施例中,还可以利用连续投影算法(SPA)获取预处理后的实验样本特征波长,其具体包括步骤S101至步骤S105。
具体地,步骤S101:利用实验样本的总数M和波段数K组成光谱矩阵XM×K
步骤S102:从XM×K中选取任意一列向量xj为初始迭代向量,并记为xk(0);其中(n=1,k(0)=j);
步骤S103:将剩余列向量组成集合S如表达式(8)所示:
S={j,1≤j≤K,j∈{k(0),…,k(n-1)}} (8)
步骤S104:按公式(9)所示方法获取xj对集合S中每一列向量的投影向量Pxj
Figure RE-GDA0002980629350000102
其中,T表示转置运算;
按公式(10)所示方法记录最大投影的序号:
k(n)=arg(max||Pxj||,j∈S) (10)
按公式(11)所示方法将最大投影作为下次的投影向量:
xj=Pxj,j∈S (11)
步骤S105:令n=n+1,如果n<N(N<M-1),则返回步骤S3进行循环计算,循环计算结束得到N×K对波长组合,对每对xk(0)和N组合建立定量模型,预测均方根误差最小时所对应的x* k(0)和N*即为最优波长组合,以该最优波长组合为特征波长。
表2所示为SPA在不同预处理方法下得到的特征波长。
表2不同预处理方法下的特征波长
Figure RE-GDA0002980629350000111
步骤S7:利用预处理后的实验样本或特征波长构建训练样本集,并利用训练样本集构建病叶识别模型。
具体地,可以利用支持向量机和随机森林两种方法分别建立全波段光谱 (full-band spectral,FS)和特征波长数据下的模型。
例如,病叶识别模型为支持向量机模型,支持向量机模型的核函数为RBF 核函数。利用预处理后的实验样本的全波段光谱构建训练样本集;将该训练样本集输入支持向量机模型;采用网格搜寻法和交叉验证法获取支持向量机模型的惩罚系数和RBF核函数的gamma最优值。或者,基于特征波长构建训练样本集;将该训练样本集输入支持向量机模型;采用网格搜寻法和交叉验证法获取支持向量机模型的惩罚系数和RBF核函数的gamma最优值。
更为具体地,支持向量机(support vector machines,SVM)算法在线性不可分情况下,将低维空间问题映射到高维空间,引入核函数代替预测样本和支持向量内积,避免高维复杂运算。常用的线性核函数是RBF核的一个特例,多项式核函数参数多会影响模型复杂程度,Sigmoid核函数在某些参数上近似 RBF核的功能,本发明选择RBF核函数,运用网格搜索法和交叉验证法确定不同预处理后数据在SVM模型的最优参数C和gamma,如表3所示。
表3最优参数表
Figure RE-GDA0002980629350000121
病叶识别模型还可以为随机森林模型。随机森林算法(random forest,RF) 基本思路为使用Bootstrap法从原始训练集中采样生成k个训练子集,构建k 棵决策树,形成森林,通过每棵决策树的预测投票决定最终结果,本发明运用试凑法确定随机森林棵树为500。“随机”指两方面:一是随机抽样训练子集;二是决策树构建时随机地从总的特征中选取远小于总特征个数的特征子集。随机性的引入使得每两棵树之间的差异度增加,从而使得模型的泛化能力提高。
步骤S8:利用构建完成的病叶识别模型进行病叶识别。
将测试样本输入构建完成的病叶识别模型,获取构建完成的病叶识别模型的病叶识别率、总分类精度和Kappa系数。如表4所示为不同预处理方法下全波段数据的识别结果,由表4可知对于柑橘正常叶片、溃疡病叶片和红蜘蛛危害叶片,模型识别率分别可达98%、97%和96%。除草剂叶片识别率在原始数据和经1stDer预处理数据的SVM模型下可达90%。在进行RF建模后识别率均较低,最高为原始数据下84.91%。对煤烟病叶片,均在经1st Der预处理数据的模型下有最高识别结果,1stDer-FS-SVM模型识别率为94.09%,1stDer-FS-RF模型识别率为93.29%,但与正常、溃疡病和红蜘蛛危害叶片相比,识别率不够稳定。
表4全波段数据建模结果
Figure RE-GDA0002980629350000122
Figure RE-GDA0002980629350000131
如表5为PCA特征波长数据测试样本的识别结果,分析可知,对柑橘正常叶片、溃疡病叶片和红蜘蛛危害叶片,模型识别率分别可达97%、96%和93%。除草剂叶片在经1stDer预处理数据的模型下有最高识别结果,1stDer-PCA-SVM 和1stDer-PCA-RF模型识别率分别为79.28%、80.05%,识别效果不佳,与除草剂叶片样本大量重叠于煤烟病叶片样本现象吻合。与除草剂叶片相同,煤烟病叶片也在经1stDer预处理数据的模型下有最高识别结果,1stDer-PCA-SVM模型识别率为87.27%,1stDer-PCA-RF模型识别率为91.58%。综合五类叶片,除草剂叶片识别结果最差,煤烟病叶片次之,其他三种叶片识别率均较稳定维持在93%之上。
表5 PCA特征波长数据建模结果
Figure RE-GDA0002980629350000132
如表6为SPA特征波长数据测试样本的识别结果,分析可知,五类叶片在原始数据的模型下有最好识别结果,除草剂危害叶片在原始数据模型下识别率相较1stDer-SPA-SVM增高了63%,相较1stDer-SPA-RF增高了40%;溃疡病叶片和煤烟病叶片在原始数据模型下识别率相较1st Der处理后模型增高在10%以内。经1stDer预处理后,柑橘正常叶片、除草剂危害叶片和红蜘蛛危害叶片在两种模型下均有最低的识别率,其余预处理方法下,正常叶片和红蜘蛛危害叶片识别率均在90%以上。综合五类叶片,除草剂叶片识别结果最差,煤烟病叶片次之,其他三种叶片识别率在除1st Der预处理模型外均较稳定维持在90%之上。
表6 SPA数据建模结果
Figure RE-GDA0002980629350000141
如表7所示,建模结果表明1stDer-FS-SVM模型总分类精度为95.98%, Kappa系数为0.9482,FS数据原始状态下RF模型总分类精度为93.84%,Kappa 系数为0.9205;1stDer-PCA-SVM模型总分类精度为90.82%,Kappa系数为 0.8816;1st Der-PCA-RF模型的总分类精度为91.79%,Kappa系数为0.894;SPA 波长原始状态下SVM和RF模型的总分类精度分别为94.5%、93.6%,Kappa 系数为0.9291、0.9174。对连续投影算法选择的特征波长数据建模,SVM和 RF模型下识别率均达到71%,主成分分析选择的特征波长数据建模识别率均达到84%,全波段下模型识别率在88%以上,FS数据建模效果优于PCA特征波长,PCA数据建模效果优于SPA特征波长。实验结果表明,本发明提出的高光谱成像技术结合机器学习方法进行柑橘叶片分类是可行且有效的,能够实现柑橘病虫害的无损准确识别。
表7 FS、PCA和SPA波长数据不同预处理方法下建模结果
Figure RE-GDA0002980629350000142
Figure RE-GDA0002980629350000151
本发明提供的基于机器学习和高光谱成像的柑橘病叶识别方法及系统,通过获取柑橘叶片的高光谱图像,在478-900nm范围内提取ROI得到光谱数据。采用1st Der、MSC和SNV三种方法对原始光谱数据进行预处理消除噪声、谱线漂移等现象,对不同预处理方法后数据进行PCA提取特征波长,结合支持向量机和随机森林两种传统机器学习算法进行分类识别,得到1st Der-FS-SVM 模型OA达95.98%,1st Der-PCA-SVM模型OA达90.82%,原始SPA波长在 SVM模型下OA达94.5%;原始全波段在RF模型下OA达93.84%,1st Der- PCA-RF模型OA达91.79%,原始SPA波长在RF模型下OA达93.6%,上述模型的Kappa系数均在0.8-1区间,一致性良好。这说明本发明的高光谱成像技术结合机器学习方法进行柑橘正常、溃疡病、除草剂危害、红蜘蛛危害和煤烟病叶片分类是可行且有效的,能够快速地实现柑橘病虫害的无损准确识别。
以上所述是本发明的较佳实施例及其所运用的技术原理,对于本领域的技术人员来说,在不背离本发明的精神和范围的情况下,任何基于本发明技术方案基础上的等效变换、简单替换等显而易见的改变,均属于本发明保护范围之内。

Claims (10)

1.一种基于机器学习和高光谱成像的多种类柑橘病叶识别方法,其特征在于,所述方法包括:
获取柑橘病叶的高光谱图像,其中所述柑橘叶片包括正常叶片、溃疡病叶片、除草剂危害叶片、红蜘蛛危害叶片和煤烟病叶片;
将所述高光谱图像的像素亮度值转换为反射率值;
提取所述转换后的高光谱图像对应的光谱信息并作为实验样本;
对所述实验样本进行预处理;
提取所述预处理后的实验样本的特征波长;
利用所述预处理后的实验样本或所述特征波长构建训练样本集,并利用所述训练样本集构建病叶识别模型;
利用构建完成的病叶识别模型进行病叶识别。
2.如权利要求1所述的基于机器学习和高光谱成像的多种类柑橘病叶识别方法,其特征在于,“提取所述转换后的高光谱图像对应的光谱信息并作为实验样本”,包括:
获取所述转换后的高光谱图像的有效光谱范围;
识别所述转换后的高光谱图像中的发病区;
根据所述发病区获取固定大小的感兴趣区域;
以所述感兴趣区域内每个像素的反射率值作为所述实验样本。
3.如权利要求2所述的基于机器学习和高光谱成像的多种类柑橘病叶识别方法,其特征在于,“对所述实验样本进行预处理”,包括:
按下式所示的方法对所述实验样本进行一阶求导:
Figure FDA0002911222940000011
其中,λi为实验样本的第i个波长,r(λi)是λi对应的反射率,Δλ为实验样本的相邻两波段间波长间隔。
4.如权利要求2所述的基于机器学习和高光谱成像的多种类柑橘病叶识别方法,其特征在于,“对所述实验样本进行预处理”,包括:
按下式所示的方法对所述实验样本进行多元散射矫正:
Figure FDA0002911222940000021
Figure FDA0002911222940000022
Figure FDA0002911222940000023
其中,
Figure FDA0002911222940000024
为所有实验样本的反射率平均值,Datai为第i个实验样本的反射率,n为实验样本总个数,Dataij为第i个实验样本在第j个波长的反射率,ki为第i个实验样本的基线偏移量,bi为第i个实验样本的平移量,
Figure FDA0002911222940000025
为校正后实验样本的光谱信息。
5.如权利要求2所述的基于机器学习和高光谱成像的多种类柑橘病叶识别方法,其特征在于,“对所述实验样本进行预处理”,包括:
按下式所示的方法对所述实验样本进行标准正态变换:
Figure FDA0002911222940000026
其中,
Figure FDA0002911222940000027
为标准正态变换后第k个实验样本的反射率,xk为第k个实验样本变换前的反射率,SDev(X)为所有实验样本的标准差,Mean(X)为所有实验样本的均值。
6.如权利要求3或4或5所述的基于机器学习和高光谱成像的多种类柑橘病叶识别方法,其特征在于,“提取所述预处理后的实验样本的特征波长”,包括:
计算所述预处理后的实验样本对应的光谱数据Xm×n的协方差矩阵Cn×n;其中,m表示实验样本总数,n表示实验样本的光谱波段;
计算Cn×n的特征值和特征向量;按降序选取k个特征向量,并作为列向量组成特征向量矩阵Un×k
按下式所示方法将实验样本投影到特征向量Un×k
Ym×k=Xm×nUn×k
其中,Ym×k为投影后实验样本的数据;
基于所述Ym×k获取对应的主成分荷载并获取主成分荷载图;
以所述主成分荷载图中荷载曲线的波峰和波谷的波长作为所述特征波长。
7.如权利要求3或4或5所述的基于机器学习和高光谱成像的多种类柑橘病叶识别方法,其特征在于,“提取所述预处理后的实验样本的特征波长”的步骤包括:
步骤S1:利用所述实验样本的总数M和波段数K组成光谱矩阵XM×K
步骤S2:从所述XM×K中选取任意一列向量xj为初始迭代向量,并记为xk(0);其中(n=1,k(0)=j);
步骤S3:将剩余列向量组成集合S为:
S={j,1≤j≤K,j∈{k(0),…,k(n-1)}}
步骤S4:按下式所示方法获取xj对集合S中每一列向量的投影向量Pxj
Figure FDA0002911222940000031
其中,T表示转置运算;
按下式所示方法记录最大投影的序号:
k(n)=arg(max||Pxj||,j∈S)
按下式所示方法将最大投影作为下次的投影向量:
xj=Pxj,j∈S
步骤S5:令n=n+1,如果n<N(N<M-1),则返回步骤S3进行循环计算,循环计算结束得到N×K对波长组合,对每对xk(0)和N组合建立定量模型,预测均方根误差最小时所对应的x* k(0)和N*即为最优波长组合,以所述最优波长组合为所述特征波长。
8.如权利要求1所述的基于机器学习和高光谱成像的多种类柑橘病叶识别方法,其特征在于,所述病叶识别模型为支持向量机,所述支持向量机模型的核函数为RBF核函数;“利用所述预处理后的实验样本或所述特征波长构建训练样本集,并利用所述训练样本集构建病叶识别模型”,包括:
利用所述预处理后的实验样本全波段光谱构建训练样本集;
将所述该训练样本集输入所述支持向量机模型;
采用网格搜寻法和交叉验证法获取所述支持向量机模型的惩罚系数和所述RBF核函数的gamma最优值;或者,
利用所述特征波长构建训练样本集;
将所述该训练样本集输入所述支持向量机模型;
采用网格搜寻法和交叉验证法获取所述支持向量机模型的惩罚系数和所述RBF核函数的gamma最优值。
9.如权利要求6所述的基于机器学习和高光谱成像的多种类柑橘病叶识别方法,其特征在于,所述病叶识别模型为随机森林模型;和/或,
在“对所述实验样本进行预处理”的步骤之前,所述方法还包括:采用随机法并按预设比例将所述实验样本分为训练样本和测试样本,并基于所述训练样本进行所述预处理;以及
“利用构建完成的病叶识别模型进行病叶识别”的步骤包括:
将所述测试样本输入所述构建完成的病叶识别模型,获取所述构建完成的病叶识别模型的病叶识别率、总分类精度和Kappa系数。
10.一种基于机器学习和高光谱成像的多种类柑橘病叶识别系统,其特征在于,所述系统包括:光学暗箱、高光谱成像仪、光源、载物台以及处理装置,所述高光谱成像仪、光源以及载物台置于所述光学暗箱内,所述光源用于提供照明,所述高光谱成像仪用于采集置于所述载物台上的柑橘叶片的高光谱图像并传输给所述处理装置;
所述处理装置包括处理器、存储设备;处理器,适于执行各条程序;存储设备,适于存储多条程序;所述程序适于由处理器加载并执行如权利要求1-9任一项所述的基于机器学习和高光谱成像的多种类柑橘病叶识别方法。
CN202110087395.3A 2021-01-22 2021-01-22 基于机器学习和高光谱成像的多种类柑橘病叶识别方法及系统 Pending CN112903602A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110087395.3A CN112903602A (zh) 2021-01-22 2021-01-22 基于机器学习和高光谱成像的多种类柑橘病叶识别方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110087395.3A CN112903602A (zh) 2021-01-22 2021-01-22 基于机器学习和高光谱成像的多种类柑橘病叶识别方法及系统

Publications (1)

Publication Number Publication Date
CN112903602A true CN112903602A (zh) 2021-06-04

Family

ID=76116905

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110087395.3A Pending CN112903602A (zh) 2021-01-22 2021-01-22 基于机器学习和高光谱成像的多种类柑橘病叶识别方法及系统

Country Status (1)

Country Link
CN (1) CN112903602A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113533236A (zh) * 2021-09-13 2021-10-22 广东省农业科学院农业质量标准与监测技术研究所 水果光谱的特征提取方法、模型训练方法、检测方法
CN114120038A (zh) * 2021-11-26 2022-03-01 中国科学院长春光学精密机械与物理研究所 基于高光谱成像技术及模型训练的甲状旁腺识别方法
CN114519820A (zh) * 2022-02-11 2022-05-20 常州刘国钧高等职业技术学校 一种基于机器视觉的柑橘筛选自动修正控制方法及系统
CN114689526A (zh) * 2022-05-31 2022-07-01 北京市农林科学院智能装备技术研究中心 一种香蕉枯萎病无损检测方法、装置及检测设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106845051A (zh) * 2015-12-04 2017-06-13 北京光巨力信息技术有限公司 一种基于组合优化的近红外无创血糖检测波长变量筛选方法
CN110363125A (zh) * 2019-07-04 2019-10-22 浙江大学山东工业技术研究院 采用模型传递识别不同品种柑橘黄龙病的方法
CN110763698A (zh) * 2019-10-12 2020-02-07 仲恺农业工程学院 一种基于特征波长的高光谱柑橘叶片病害识别方法
CN110929944A (zh) * 2019-11-28 2020-03-27 安徽大学 基于高光谱图像与光谱特征相融合技术的小麦赤霉病病情严重度预测方法
CN111398238A (zh) * 2020-05-13 2020-07-10 安徽理工大学 一种食用油掺杂蓖麻油的激光诱导荧光光谱识别方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106845051A (zh) * 2015-12-04 2017-06-13 北京光巨力信息技术有限公司 一种基于组合优化的近红外无创血糖检测波长变量筛选方法
CN110363125A (zh) * 2019-07-04 2019-10-22 浙江大学山东工业技术研究院 采用模型传递识别不同品种柑橘黄龙病的方法
CN110763698A (zh) * 2019-10-12 2020-02-07 仲恺农业工程学院 一种基于特征波长的高光谱柑橘叶片病害识别方法
CN110929944A (zh) * 2019-11-28 2020-03-27 安徽大学 基于高光谱图像与光谱特征相融合技术的小麦赤霉病病情严重度预测方法
CN111398238A (zh) * 2020-05-13 2020-07-10 安徽理工大学 一种食用油掺杂蓖麻油的激光诱导荧光光谱识别方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
尚廷义等著: "《基于光谱技术的寒地水稻稻瘟病害分析及机理研究》", 30 June 2016 *
王建涛等: "基于卷积神经网络的柑橘病叶高光谱分类", 《信息技术与信息化》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113533236A (zh) * 2021-09-13 2021-10-22 广东省农业科学院农业质量标准与监测技术研究所 水果光谱的特征提取方法、模型训练方法、检测方法
US11682203B2 (en) 2021-09-13 2023-06-20 Institute of Facility Agriculture, Guangdong Academy of Agricultural Science Feature extraction method, model training method, detection method of fruit spectrum
CN114120038A (zh) * 2021-11-26 2022-03-01 中国科学院长春光学精密机械与物理研究所 基于高光谱成像技术及模型训练的甲状旁腺识别方法
CN114519820A (zh) * 2022-02-11 2022-05-20 常州刘国钧高等职业技术学校 一种基于机器视觉的柑橘筛选自动修正控制方法及系统
CN114519820B (zh) * 2022-02-11 2023-05-16 常州刘国钧高等职业技术学校 一种基于机器视觉的柑橘筛选自动修正控制方法及系统
CN114689526A (zh) * 2022-05-31 2022-07-01 北京市农林科学院智能装备技术研究中心 一种香蕉枯萎病无损检测方法、装置及检测设备

Similar Documents

Publication Publication Date Title
Moghadam et al. Plant disease detection using hyperspectral imaging
Gao et al. Real-time hyperspectral imaging for the in-field estimation of strawberry ripeness with deep learning
CN112903602A (zh) 基于机器学习和高光谱成像的多种类柑橘病叶识别方法及系统
Zhou et al. Non-destructive discrimination of the variety of sweet maize seeds based on hyperspectral image coupled with wavelength selection algorithm
US11682203B2 (en) Feature extraction method, model training method, detection method of fruit spectrum
Tian et al. A multi-region combined model for non-destructive prediction of soluble solids content in apple, based on brightness grade segmentation of hyperspectral imaging
Li et al. Development of algorithms for detecting citrus canker based on hyperspectral reflectance imaging
CN112287886B (zh) 基于高光谱图像融合图谱特征的小麦植株氮含量估测方法
Zhou et al. Identification of the variety of maize seeds based on hyperspectral images coupled with convolutional neural networks and subregional voting
Gill et al. A review of automatic fruit classification using soft computing techniques
Pang et al. Detection of early bruises on apples using hyperspectral imaging combining with YOLOv3 deep learning algorithm
Barbedo A review on the combination of deep learning techniques with proximal hyperspectral images in agriculture
Gomes et al. Determination of sugar content in whole Port Wine grape berries combining hyperspectral imaging with neural networks methodologies
CN114965346A (zh) 基于深度学习和高光谱成像技术的猕猴桃品质检测方法
Xie et al. Detection of citrus black spot symptoms using spectral reflectance
Huang et al. Predicting soluble solids content in “Fuji” apples of different ripening stages based on multiple information fusion
Calixto et al. Development of a computer vision approach as a useful tool to assist producers in harvesting yellow melon in northeastern Brazil
CN117541835A (zh) 基于高光谱成像及深度学习的柑橘叶片水分胁迫检测方法及系统
Ding et al. Feature extraction of hyperspectral images for detecting immature green citrus fruit
Zhang et al. Hyperspectral imaging combined with convolutional neural network for outdoor detection of potato diseases
De Silva et al. Plant disease detection using deep learning on natural environment images
CN115049902B (zh) 柑橘叶片含水量可视化预测方法、系统、设备及存储介质
Dhiman et al. Citrus Fruit Disease Detection Techniques: A Survey and Comparative Analysis of Relevant Approaches
CN116297236A (zh) 一种基于高光谱的单粒玉米种子活力鉴别方法及装置
Liu et al. A comprehensive review on acquisition of phenotypic information of Prunoideae fruits: Image technology

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210604