CN108764275A - 叶片病害的识别方法和系统 - Google Patents

叶片病害的识别方法和系统 Download PDF

Info

Publication number
CN108764275A
CN108764275A CN201810317284.5A CN201810317284A CN108764275A CN 108764275 A CN108764275 A CN 108764275A CN 201810317284 A CN201810317284 A CN 201810317284A CN 108764275 A CN108764275 A CN 108764275A
Authority
CN
China
Prior art keywords
word
blade
disease
color
dis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810317284.5A
Other languages
English (en)
Other versions
CN108764275B (zh
Inventor
冯全
杨森
王书志
杨梅
李妙棋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Gansu Agricultural University
Original Assignee
Gansu Agricultural University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Gansu Agricultural University filed Critical Gansu Agricultural University
Priority to CN201810317284.5A priority Critical patent/CN108764275B/zh
Publication of CN108764275A publication Critical patent/CN108764275A/zh
Application granted granted Critical
Publication of CN108764275B publication Critical patent/CN108764275B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/02Agriculture; Fishing; Forestry; Mining
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Evolutionary Biology (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Business, Economics & Management (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Marine Sciences & Fisheries (AREA)
  • Mining & Mineral Resources (AREA)
  • Probability & Statistics with Applications (AREA)
  • Health & Medical Sciences (AREA)
  • Animal Husbandry (AREA)
  • General Health & Medical Sciences (AREA)
  • Agronomy & Crop Science (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供一种叶片病害的识别方法和系统,包括:对待识别的叶片进行斑块检测,获得待识别叶片上的各斑块区域,对任意一个斑块区域,将相同位置的表观特征单词和颜色特征单词组成词对;将各词对一一转换为复合特征字典中对应的复合特征单词,根据各复合特征单词出现在待识别的叶片上的次数,构建该待识别的叶片的复合特征直方图;将复合特征直方图作为预先获得的病害分类器的输入,根据所述病害分类器的输出结果对叶片的病害进行识别。本发明不需要在图像中预先分割叶片或病斑区域,而是利用统计一幅图像的复合特征词汇表中单词来识别病害的类型,具有识别率高、识别速度快等特点。

Description

叶片病害的识别方法和系统
技术领域
本发明涉及图像处理技术领域,更具体地,涉及叶片病害的识别方法和系统。
背景技术
传统的农作物病害识别都是通过有经验的专家进行诊断,该识别方法效率低、工作强度大,且不能实时地对病害做出科学、准确的诊断。随着图像处理技术和机器视觉技术广泛的应用于农业领域中,自动进行病害的识别已成为智能农业发展的趋势。
目前,关于农作物病害的图像识别方法大多通过人工采集病害叶片并在特定的光照和简单背景下进行拍摄,然后采用分割算法对叶片目标进行分割,随后需要进一步在已分割的叶片上进行病斑区域的分割,最后在病害区域上提取特征进行诊断。该类病害识别方法识别的准确率相对较高,但由于人工控制环境取像,无法实现真正的自然条件下自动病害分析。此外也有一些研究实现了自然条件下进行病害的识别,但仍需要预先在复杂背景中分割叶片区域和病害部位,该方法对叶片分割算法要求较高,且分割需要花费大量的时间,无法满足病害的实时诊断。
在病害识别中,特征提取也是需要研究的关键技术,很多经典的病害识别方法中主要依据颜色、纹理和形状等参数或各个参数的组合进行病害的识别,但由于自然条件下叶片病斑多样复杂、且特征易受光照的影响,尤其颜色特征很不鲁棒,使得采用这类方法的识别效果不佳。
发明内容
本发明提供一种克服上述问题或者至少部分地解决上述问题的叶片病害的识别方法和系统。
根据本发明的一个方面,提供一种叶片病害的识别方法,包括:
对待识别的叶片进行斑块检测,获得待识别叶片上的各斑块区域,所述斑块区域为含有斑块的区域;
对任意一个斑块区域,提取该斑块区域中各位置的SIFT特征向量以及颜色特征向量;
将SIFT特征向量转换为表观特征字典中对应的表观特征单词,将颜色特征向量转换为颜色特征字典中对应的颜色特征单词,将相同位置的表观特征单词和颜色特征单词组成词对;
将各词对一一转换为复合特征字典中对应的复合特征单词,根据各复合特征单词出现在待识别的叶片上的次数,构建该待识别的叶片的复合特征直方图;
将所述复合特征直方图作为预先获得的病害分类器的输入,根据所述病害分类器的输出结果对叶片的病害进行识别。
优选地,所述表观特征字典和颜色特征字典的构建方法包括:
获取图像训练集中所有病斑区域的SIFT特征向量和颜色特征向量,采用K-均值聚类算法,计算NS个SIFT聚类中心向量ST={sti|1≤i≤NS}和NC个颜色特征聚类中心向量COL={colj|1≤j≤NC};
记第i个SIFT聚类中心向量sti的序号wsi为表观特征单词,将sti与对应的wsi组成表观特征字典WS={(wsi,sti)|1≤i≤NS},记第j个颜色特征聚类中心向量colj的序号wcj为颜色特征单词,将colj与wcj组成颜色特征字典WC={(wcj,colj)|1≤j≤NC};
相应地,将SIFT特征向量转换为表观特征字典中对应的表观特征单词,将颜色特征向量转换为颜色特征字典中对应的颜色特征单词的步骤,具体包括:
对每个SIFT特征向量,计算该SIFT特征向量至每个SIFT聚类中心向量的欧氏距离,将欧式距离最近的SIFT聚类中心向量的序号作为该SIFT系统向量对应的表观特征单词;
对每个颜色特征向量,计算该颜色特征向量至每个颜色特征聚类中心向量的欧氏距离,将欧氏距离最近的颜色聚类中心向量的序号作为该颜色特征向量对应的颜色特征单词。
优选地,所述复合特征字典的构建方法包括:
根据图像训练集中每个叶片样本的病害以及表观特征单词表,计算表观词汇-类条件概率p(WS|DIS),所述表观特征单词表中记录对应的叶片样本中所有斑块区域的颜色特征单词,所述表观词汇-类条件概率p(WS|DIS)为已知病害DIS的情况下,出现表观特征单词WS的概率;
根据图像训练集中每个叶片样本的病害以及颜色特征单词表,计算颜色词汇-类条件概率p(WC|DIS),所述颜色特征单词表中记录对应的叶片样本中所有斑块区域的颜色特征单词,所述颜色词汇-类条件概率p(WC|DIS)为已知病害DIS的情况下,出现颜色特征单词WC的概率;
根据以下公式获得表观和颜色词汇联合-类修正条件概率:
p(WS,WC|DIS)=k1(p(WS|DIS)ap(WC|DIS)1-a)b
其中k1是保持p(WS,WC|DIS)积分为1的系数,a和b是调节p(WS,WC|DIS)形状的参数;
所述表观和颜色词汇联合-类修正条件概率为已知病害的情况下,同时出现某对表观特征单词和颜色特征单词的概率;
根据以下公式获得病害类-表观和颜色条件概率p(DIS|WS,WC):
其中,p(DIS)、p(WS)和p(WC)分别是由训练集统计出的病害的分布概率、表观词汇分布概率和颜色词汇分布概率;
根据p(DIS|WS,WC)、p(WS)和p(WC)构造具有NO个单词的复合特征字典WO。
优选地,所述根据p(DIS|WS,WC)、p(WS)和p(WC)构造具有NO个单词的复合特征字典WO的步骤,具体包括:
a、创建Ndis个空集合,按下述公式把每个单词对(wsi,wcj)分配给第l个集合,其中wsi∈WS,wcj∈WC:
b、把每个集合随机拆分成NO/Ndis个集合,共生成NO个集合SOh其中,h=1,2,…,NO
c、对任意一个集合SOh,计算该集合出现在训练集中概率p(SOh)以及已知该集合的情况下出现某病害的概率p(DIS|SOh),
其中, p(wsi)表示第i个表观特征单词出现在训练集中的概率,p(wcj)表示第j个颜色特征单词出现在训练集中的概率,p(DIS|wsi,wcj)表示在已知wsi和wcj的情况下,出现病害DIS的概率;
d、对每个单词对(wsi,wcj),按照下述方法计算其新归属集合的序号:
其中,KL为Kullback-Leibler散度,1≤h≤NO
e、将每个单词对(wsi,wcj)放入h*(wsi,wcj)指向的集合SOh
f、计算下述目标函数C:
g、重复步骤c至f,直到目标函数C收敛;
h、将集合SOh的序号h作为单词,与集合SOh一并组成复合特征字典WO={(woh,SOh)|1≤h≤NO}。
优选地,所述将各词对一一转换为复合特征字典中对应的复合特征单词的步骤,具体包括:
对任意一个词对,当所述复合特征字典中存在包含该词对的集合时,将该集合对应的单词作为对应的复合特征单词。
优选地,所述根据各复合特征单词出现在待识别的叶片上的次数,构建该待识别的叶片的复合特征直方图的步骤,具体包括:
统计各复合特征单词在所述待识别叶片上出现的次数nh
计算所述图像中复合特征直方图,其中直方图的第h(1≤h≤NO)个位置的数值fh按下式计算:
优选地,所述病害分类器的构建方法包括:
以训练集中每个叶片的复合特征直方图作为该叶片的特征向量,以该特征向量和该叶片对应的病害标识作为一个训练样本,采用支持向量机分类器对训练集中所有样本进行训练,训练结束后得到所述病害图像分类器。
优选地,所述对待识别的叶片进行斑块检测的步骤,具体包括:
计算叶片图像的梯度幅值,通过计算每个像素点一定范围内的最小梯度幅值确定滑动方向,把滑动到同一最小梯度值的像素有效地分到一个区域,对叶片图像做逐行扫描,将叶片图像分割成多个小区域;
基于高斯滤波器和Canny算子对分割为多个小区域的叶片图像进行边缘检测,利用全局阈值法对边缘图像进行二值化处理,获得二值化图像;
采用5*5的正方形结构元素対二值图像进行开运算,以去除与斑块区域相连的噪点,再采用5*5的正方形结构元素对二值图像进行闭运算,以平滑图像的边界,并对斑块的内部区域进行了填充;
对填充后的二值图像进行连通域分析,当连接体的面积大于预设阈值,则确定该区域为斑块区域,并用预设形状的框对斑块区域进行标记。
优选地,所述提取该斑块区域中各位置的SIFT特征向量以及颜色特征向量的步骤,具体包括:
将该斑块区域划分为若干个网格,将划分网格后的斑块区域的RGB彩色图像分别转换为灰度图像和CIE La*b*图像;
在所述灰度图像上的每个格点上计算SIFT特征向量,在CIE La*b*图像上的每个格点上计算该点的a*和b*值,构造该格点的颜色特征向量。
根据本发明的另一个方面,还提供一种叶片病害的识别系统,包括:
斑块检测模块,用于对待识别的叶片进行斑块检测,获得待识别叶片上的各斑块区域,所述斑块区域为含有斑块的区域;
向量提取模块,用于对任意一个斑块区域,提取该斑块区域的SIFT特征向量以及颜色特征向量;
词对获取模块,用于将SIFT特征向量转换为表观特征字典中对应的表观特征单词,将颜色特征向量转换为颜色特征字典中对应的颜色特征单词,将相同位置的表观特征单词和颜色特征单词组成词对;
直方图获取模块,用于将各词对一一转换为复合特征字典中对应的复合特征单词,根据各复合特征单词出现在待识别的叶片上的次数,构建该待识别的叶片的复合特征直方图;
分类模块,将所述复合特征直方图作为预先获得的病害分类器的输入,根据所述病害分类器的输出结果对叶片的病害进行识别。
本发明提出的叶片病害的识别方法和系统,在自然条件下拍摄农作物的叶片图像,检测出叶片图像的斑块区域,在斑块区域中构造出由表观特征单和颜色特征词单词构成的一对词组,并将词组与复合字典中的单词相匹配,并根据匹配的单词的出现概率构成单词-频率直方图。本发明实施例不需要在图像中预先分割叶片或病斑区域,而是利用统计一幅图像的复合特征词汇表中单词来识别病害的类型,具有识别率高、识别速度快等特点。
附图说明
图1为根据本发明实施例的叶片病害的识别方法的流程示意图;
图2为根据本发明实施例的单词-频率直方图的示意图;
图3为根据本发明实施例的叶片病害的识别系统的功能框图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
为了克服现有技术的上述缺陷,本发明实施例提供一种叶片病害的识别方法,参见图1,包括:
101、对待识别的叶片进行斑块检测,获得待识别叶片上的各斑块区域,斑块区域为含有斑块的区域。
需要说明的是,斑块检测是本发明实施的先决条件,在现有图像识别时,都是直接在图像上提取SIFT或其它特征,这是因为普通图像中待识别的对象都比较大,如识别相片中的人。但在叶片病害图像中,很多病斑都很小,若直接提取整个叶片的SIFT特征时,可能叶片自身或其它较大对象的SIFT特征出现的次数远远多于病斑本身的特征出现的次数,也就是较大对象的特征压制了病斑的特征,使得直接在图像级别提取SIFT特征无法用于病害识别。需要说明的,斑块检测(blob detection)技术是一种比较成熟而简单的、检测与周围大区域形态不同的小区域的方法(如叶片病斑与叶子正常部分有明显不同)。斑块检测比斑块分割简单的多,它只检测出大概区域,而不像斑块分割,需要给斑块区的每一个像素点都有准确地分配标记。斑块检测的输出结果只是一个方框或圆,大概标出斑块位置,不给每个像素做标记。并且斑块区域中的斑块既可能是病斑,也可能是普通的斑块。
102、对任意一个斑块区域,提取该斑块区域中各位置的SIFT特征向量以及颜色特征向量。
SIFT(中文名称:尺度不变特征转换,英文全称:Scale-invariant featuretransform),SIFT特征向量用于图像处理领域的一种描述子。这种描述具有尺度不变性,可在图像中检测出关键点,是一种局部特征描述子,在本发明实施例中,颜色特征向量是指斑块由RGB信号转换至CIE LAB空间后的特征向量,由于Lab色彩空间最大,它包含了RGB和CMYK色彩空间,所以当色彩数据从这样一个大的色彩空间转换到比它小得多的CMYK色彩空间时,不会因为数据量不够而引起色彩的偏差,造成色彩损失。
103、将SIFT特征向量转换为表观特征字典中对应的表观特征单词,将颜色特征向量转换为颜色特征字典中对应的颜色特征单词,将相同位置的表观特征单词和颜色特征单词组成词对。
需要说明的是,表观特征字典中记录了SIFT特征向量与表观特征单词的对应关系,通过将SIFT特征向量转换为更为简单的表观特征单词,可以减少运算的压力,在本发明实施例中表观特征单词可以是数字,也可以是字母、字符等等。同理,颜色特征字典中记录了颜色特征向量与颜色特征单词的对应关系。
104、将各词对一一转换为复合特征字典中对应的复合特征单词,根据各复合特征单词出现在待识别的叶片上的次数,构建该待识别的叶片的复合特征直方图。
需要说明的是,每个词对代表了一个SIFT特征向量和一个表观特征向量的组合,在本发明实施例中,每个词对对应着一个集合,该集合中存放了若干个词对,这些词对具有类似的性质——即均与某种病害存在较大的关联,本发明实施例的复合特征字典中的单词是通过训练集得到的,训练集中的叶片均事先识别出了存在的病害,并将训练集中获得的斑块的词组和病害建立了概率关系,例如,当植物出现病害A时,叶片的外观将出现特有的外观变化,这时采集的斑块的SIFT特征和颜色特征,将两个特征构成词组1,然后获取当出现词组1时,训练集中出现病害A时的概率,这样就建立了词组与病害A的概率关系。复合特征单词与表观特征单词、颜色特征单词一样,也具有形式简单的特定,例如可以是数字、字符、字母等等。
105、将复合特征直方图作为预先获得的病害分类器的输入,根据病害分类器的输出结果对叶片的病害进行识别。需要说明的是,病害分类器是通过复合特征直方图与病害作为训练样本训练而成的,因此,当获得待识别叶片的复合特征直方图后,将该复合特征直方图输入至分类器后就可以获得病害的类型。
在上述实施例的基础上,表观特征字典和颜色特征字典的构建方法包括:
获取图像训练集中所有病斑区域的SIFT特征向量和颜色特征向量,采用K-均值聚类算法,计算NS个SIFT聚类中心向量ST={sti|1≤i≤NS}和NC个颜色特征聚类中心向量COL={colj|1≤j≤NC}。
需要说明的是,一方面,SIFT特征向量和颜色特征向量的个数众多,另一方面,部分SIFT特征向量(颜色特征向量)存在着相似度高的情况,因此本发明实施例获取训练集中各斑块的SIFT特征向量和颜色特征向量,然后进行聚类算法,获得由SIFT聚类中心向量(即表观特征单词)构成的表观特征词汇表以及由颜色聚类中心向量(颜色特征单词)构成的颜色特征词汇表。将获取的待识别叶片中的斑块的各SIFT特征向量和颜色特征向量进行聚类,转换成表观特征单词和颜色特征单词(通过上述聚类算法,将欧式距离最短的聚类中心向量作为转化后的表现特征单词或颜色特征单词)可以减少计算的复杂性。
记第i个SIFT聚类中心向量sti的序号wsi为表观特征单词,将sti与对应的wsi组成表观特征字典WS={(wsi,sti)|1≤i≤NS},记第j个颜色特征聚类中心向量colj的序号wcj为颜色特征单词,将colj与wcj组成颜色特征字典WC={(wcj,colj)|1≤j≤NC}。
相应地,将SIFT特征向量转换为表观特征字典中对应的表观特征单词,将颜色特征向量转换为颜色特征字典中对应的颜色特征单词的步骤,具体包括:
对每个SIFT特征向量,计算该SIFT特征向量至每个SIFT聚类中心向量的欧氏距离,将欧式距离最近的SIFT聚类中心向量的序号作为该SIFT系统向量对应的表观特征单词;
对每个颜色特征向量,计算该颜色特征向量至每个颜色特征聚类中心向量的欧氏距离,将欧氏距离最近的颜色聚类中心向量的序号作为该颜色特征向量对应的颜色特征单词。
在上述实施例的基础上,复合特征字典的构建方法包括:
根据图像训练集中每个叶片样本的病害以及表观特征单词表,计算表观词汇-类条件概率p(WS|DIS),表观特征单词表中记录对应的叶片样本中所有斑块区域的颜色特征单词,表观词汇-类条件概率p(WS|DIS)为已知病害DIS的情况下,出现表观特征单词WS的概率;
根据图像训练集中每个叶片样本的病害以及颜色特征单词表,计算颜色词汇-类条件概率p(WC|DIS),颜色特征单词表中记录对应的叶片样本中所有斑块区域的颜色特征单词,颜色词汇-类条件概率p(WC|DIS)为已知病害DIS的情况下,出现颜色特征单词WC的概率;
根据以下公式获得表观和颜色词汇联合-类修正条件概率:
p(WS,WC|DIS)=k1(p(WS|DIS)ap(WC|DIS)1-a)b
其中k1是保持p(WS,WC|DIS)积分为1的系数,a和b是调节p(WS,WC|DIS)形状的参数;
表观和颜色词汇联合-类修正条件概率为已知病害的情况下,同时出现某对表观特征单词和颜色特征单词的概率;
根据以下公式获得病害类-表观和颜色条件概率p(DIS|WS,WC):
其中,p(DIS)、p(WS)和p(WC)分别是由训练集统计出的病害的分布概率、表观词汇分布概率和颜色词汇分布概率;
根据p(DIS|WS,WC)、p(WS)和p(WC)构造具有NO个单词的复合特征字典WO。
在上述实施例的基础上,根据p(DIS|WS,WC)、p(WS)和p(WC)构造具有NO个单词的复合特征字典WO的步骤,具体包括:
a、创建Ndis个空集合,按下述公式把每个单词对(wsi,wcj)分配给第l个集合,其中wsi∈WS,wcj∈WC:
b、把每个集合随机拆分成NO/Ndis个集合,共生成NO个集合SOh其中,h=1,2,…,NO
c、对任意一个集合SOh,计算该集合出现在训练集中概率p(SOh)以及已知该集合的情况下出现某病害的概率p(DIS|SOh),
其中, p(wsi)表示第i个表观特征单词出现在训练集中的概率,p(wcj)表示第j个颜色特征单词出现在训练集中的概率,p(DIS|wsi,wcj)表示在已知wsi和wcj的情况下,出现病害DIS的概率;对于表观特征单词wsi出现在训练集中的概率来说,由于预先已获得了训练集中的所有斑块的特征单词,将表观特征词汇wsi出现的总次数除以所有表观特征单词出现的总次数,即获得表观特征单词wsi出现在训练集中的概率。同理可得颜色特征单词wcj出现的概率,在此不再赘述。
d、对每个单词对(wsi,wcj),按照下述方法计算其新归属集合的序号:
其中,KL为Kullback-Leibler散度,1≤h≤NO
KL散度(Kullback-Leibler divergence),又称相对熵(relative entropy),是描述两个概率分布P和Q差异的一种方法。散度越小,则说明两个分布越接近。在本发明实施例中,词对出现在某病害的概率与单词出现在某病害的概率越接近,则将该词对放置在该单词(对应的集合)中。
e、将每个单词对(wsi,wcj)放入h*(wsi,wcj)指向的集合SOh
f、计算下述目标函数C:
g、重复步骤c至f,直到目标函数C收敛;
h、将集合SOh的序号h作为单词,与集合SOh一并组成复合特征字典WO={(woh,SOh)|1≤h≤NO}。
在上述各实施例的基础上,将各词对一一转换为复合特征字典中对应的复合特征单词的步骤,具体包括:
对任意一个词对,当复合特征字典中存在包含该词对的集合时,将该集合对应的单词作为对应的复合特征单词。
在上述各实施例的基础上,根据各复合特征单词出现在待识别的叶片上的次数,构建该待识别的叶片的复合特征直方图的步骤,具体包括:
统计各复合特征单词在待识别叶片上出现的次数nh
计算图像中复合特征直方图,其中直方图的第h(1≤h≤NO)个位置的数值fh按下式计算:
图2示出了本发明实施例的单词-频率直方图的示意图,如图所示,本发明实施例共有500个作用的复合特征单词(图中称作特征单词),直方图的纵坐标用于表示复合特征单词的频率。
在上述各实施例的基础上,病害分类器的构建方法包括:
以训练集中每个叶片的复合特征直方图作为该叶片的特征向量,以该特征向量和该叶片对应的病害标识作为一个训练样本,采用支持向量机分类器对训练集中所有样本进行训练,训练结束后得到病害图像分类器。需要说明的是,本发明实施例的分类器为常规的分类器,例如支持向量机分类器。
在上述各实施例的基础上,对待识别的叶片进行斑块检测的步骤,具体包括:
计算叶片图像的梯度幅值,通过计算每个像素点一定范围内的最小梯度幅值确定滑动方向,把滑动到同一最小梯度值的像素有效地分到一个区域,对叶片图像做逐行扫描,将叶片图像分割成多个小区域;
基于高斯滤波器和Canny算子对分割为多个小区域的叶片图像进行边缘检测,利用全局阈值法对边缘图像进行二值化处理,获得二值化图像;
采用5*5的正方形结构元素対二值图像进行开运算,以去除与斑块区域相连的噪点,再采用5*5的正方形结构元素对二值图像进行闭运算,以平滑图像的边界,并对斑块的内部区域进行了填充;
对填充后的二值图像进行连通域分析,当连接体的面积大于预设阈值,则确定该区域为斑块区域,并用预设形状的框对斑块区域进行标记。
在上述各实施例的基础上,提取该斑块区域的SIFT特征向量以及颜色特征向量的步骤,具体包括:
将该斑块区域划分为若干个网格,将划分网格后的斑块区域的RGB彩色图像分别转换为灰度图像和CIE La*b*图像;
在灰度图像上的每个格点上计算SIFT特征向量,在CIE La*b*图像上的每个格点上计算该点的a*和b*值,构造该格点的颜色特征向量。
本发明还提供一种叶片病害的识别系统,参见图3,包括:
斑块检测模块301,用于对待识别的叶片进行斑块检测,获得待识别叶片上的各斑块区域,斑块区域为含有斑块的区域;
向量提取模块302,用于对任意一个斑块区域,提取该斑块区域中各位置的SIFT特征向量以及颜色特征向量;
词对获取模块303,用于将SIFT特征向量转换为表观特征字典中对应的表观特征单词,将颜色特征向量转换为颜色特征字典中对应的颜色特征单词,将相同位置的表观特征单词和颜色特征单词组成词对;
直方图获取模块304,用于将各词对一一转换为复合特征字典中对应的复合特征单词,根据各复合特征单词出现在待识别的叶片上的次数,构建该待识别的叶片的复合特征直方图;
分类模块305,将复合特征直方图作为预先获得的病害分类器的输入,根据病害分类器的输出结果对叶片的病害进行识别。
以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种叶片病害的识别方法,其特征在于,包括:
对待识别的叶片进行斑块检测,获得待识别叶片上的各斑块区域,所述斑块区域为含有斑块的区域;
对任意一个斑块区域,提取该斑块区域中各位置的SIFT特征向量以及颜色特征向量;
将SIFT特征向量转换为表观特征字典中对应的表观特征单词,将颜色特征向量转换为颜色特征字典中对应的颜色特征单词,将相同位置的表观特征单词和颜色特征单词组成词对;
将各词对一一转换为复合特征字典中对应的复合特征单词,根据各复合特征单词出现在待识别的叶片上的次数,构建该待识别的叶片的复合特征直方图;
将所述复合特征直方图作为预先获得的病害分类器的输入,根据所述病害分类器的输出结果对叶片的病害进行识别。
2.如权利要求1所述的识别方法,其特征在于,所述表观特征字典和颜色特征字典的构建方法包括:
获取图像训练集中所有病斑区域的SIFT特征向量和颜色特征向量,采用K-均值聚类算法,计算NS个SIFT聚类中心向量ST={sti|1≤i≤NS}和NC个颜色特征聚类中心向量COL={colj|1≤j≤NC};
记第i个SIFT聚类中心向量sti的序号wsi为表观特征单词,将sti与对应的wsi组成表观特征字典WS={(wsi,sti)|1≤i≤NS},记第j个颜色特征聚类中心向量colj的序号wcj为颜色特征单词,将colj与wcj组成颜色特征字典WC={(wcj,colj)|1≤j≤NC};
相应地,将SIFT特征向量转换为表观特征字典中对应的表观特征单词,将颜色特征向量转换为颜色特征字典中对应的颜色特征单词的步骤,具体包括:
对每个SIFT特征向量,计算该SIFT特征向量至每个SIFT聚类中心向量的欧氏距离,将欧式距离最近的SIFT聚类中心向量的序号作为该SIFT系统向量对应的表观特征单词;
对每个颜色特征向量,计算该颜色特征向量至每个颜色特征聚类中心向量的欧氏距离,将欧氏距离最近的颜色聚类中心向量的序号作为该颜色特征向量对应的颜色特征单词。
3.如权利要求2所述的识别方法,其特征在于,所述复合特征字典的构建方法包括:
根据图像训练集中每个叶片样本的病害以及表观特征单词表,计算表观词汇-类条件概率p(WS|DIS),所述表观特征单词表中记录对应的叶片样本中所有斑块区域的颜色特征单词,所述表观词汇-类条件概率p(WS|DIS)为已知病害DIS的情况下,出现表观特征单词WS的概率;
根据图像训练集中每个叶片样本的病害以及颜色特征单词表,计算颜色词汇-类条件概率p(WC|DIS),所述颜色特征单词表中记录对应的叶片样本中所有斑块区域的颜色特征单词,所述颜色词汇-类条件概率p(WC|DIS)为已知病害DIS的情况下,出现颜色特征单词WC的概率;
根据以下公式获得表观和颜色词汇联合-类修正条件概率:
p(WS,WC|DIS)=k1(p(WS|DIS)a p(WC|DIS)1-a)b
其中k1是保持p(WS,WC|DIS)积分为1的系数,a和b是调节p(WS,WC|DIS)形状的参数;
所述表观和颜色词汇联合-类修正条件概率为已知病害的情况下,同时出现某对表观特征单词和颜色特征单词的概率;
根据以下公式获得病害类-表观和颜色条件概率p(DIS|WS,WC):
其中,p(DIS)、p(WS)和p(WC)分别是由训练集统计出的病害的分布概率、表观词汇分布概率和颜色词汇分布概率;
根据p(DIS|WS,WC)、p(WS)和p(WC)构造具有NO个单词的复合特征字典WO。
4.如权利要求3所述的识别方法,其特征在于,所述根据p(DIS|WS,WC)、p(WS)和p(WC)构造具有NO个单词的复合特征字典WO的步骤,具体包括:
a、创建Ndis个空集合,按下述公式把每个单词对(wsi,wcj)分配给第l个集合,其中wsi∈WS,wcj∈WC:
b、把每个集合随机拆分成NO/Ndis个集合,共生成NO个集合SOh其中,h=1,2,…,NO
c、对任意一个集合SOh,计算该集合出现在训练集中概率p(SOh)以及已知该集合的情况下出现某病害的概率p(DIS|SOh),
其中, p(wsi)表示第i个表观特征单词出现在训练集中的概率,p(wcj)表示第j个颜色特征单词出现在训练集中的概率,p(DIS|wsi,wcj)表示在已知wsi和wci的情况下,出现病害DIS的概率;
d、对每个单词对(wsi,wcj),按照下述方法计算其新归属集合的序号:
其中,KL为Kullback-Leibler散度,1≤h≤NO
e、将每个单词对(wsi,wcj)放入h*(wsi,wcj)指向的集合SOh
f、计算下述目标函数C:
g、重复步骤c至f,直到目标函数C收敛;
h、将集合SOh的序号h作为单词,与集合SOh一并组成复合特征字典WO={(woh,SOh)|1≤h≤NO}。
5.如权利要求4所述的识别方法,其特征在于,所述将各词对一一转换为复合特征字典中对应的复合特征单词的步骤,具体包括:
对任意一个词对,当所述复合特征字典中存在包含该词对的集合时,将该集合对应的单词作为对应的复合特征单词。
6.如权利要求3-5任意一项所述的识别方法,其特征在于,所述根据各复合特征单词出现在待识别的叶片上的次数,构建该待识别的叶片的复合特征直方图的步骤,具体包括:
统计各复合特征单词在所述待识别叶片上出现的次数nh
计算所述图像中复合特征直方图,其中直方图的第h(1≤h≤NO)个位置的数值fh按下式计算:
7.如权利要求1所述的识别方法,其特征在于,所述病害分类器的构建方法包括:
以训练集中每个叶片的复合特征直方图作为该叶片的特征向量,以该特征向量和该叶片对应的病害标识作为一个训练样本,采用支持向量机分类器对训练集中所有样本进行训练,训练结束后得到所述病害图像分类器。
8.如权利要求1所述的识别方法,其特征在于,所述对待识别的叶片进行斑块检测的步骤,具体包括:
计算叶片图像的梯度幅值,通过计算每个像素点一定范围内的最小梯度幅值确定滑动方向,把滑动到同一最小梯度值的像素有效地分到一个区域,对叶片图像做逐行扫描,将叶片图像分割成多个小区域;
基于高斯滤波器和Canny算子对分割为多个小区域的叶片图像进行边缘检测,利用全局阈值法对边缘图像进行二值化处理,获得二值化图像;
采用5*5的正方形结构元素対二值图像进行开运算,以去除与斑块区域相连的噪点,再采用5*5的正方形结构元素对二值图像进行闭运算,以平滑图像的边界,并对斑块的内部区域进行了填充;
对填充后的二值图像进行连通域分析,当连接体的面积大于预设阈值,则确定该区域为斑块区域,并用预设形状的框对斑块区域进行标记。
9.如权利要求1所述的识别方法,其特征在于,所述提取该斑块区域中各位置的SIFT特征向量以及颜色特征向量的步骤,具体包括:
将该斑块区域划分为若干个网格,将划分网格后的斑块区域的RGB彩色图像分别转换为灰度图像和CIE La*b*图像;
在所述灰度图像上的每个格点上计算SIFT特征向量,在CIE La*b*图像上的每个格点上计算该点的a*和b*值,构造该格点的颜色特征向量。
10.一种叶片病害的识别系统,其特征在于,包括:
斑块检测模块,用于对待识别的叶片进行斑块检测,获得待识别叶片上的各斑块区域,所述斑块区域为含有斑块的区域;
向量提取模块,用于对任意一个斑块区域,提取该斑块区域的SIFT特征向量以及颜色特征向量;
词对获取模块,用于将SIFT特征向量转换为表观特征字典中对应的表观特征单词,将颜色特征向量转换为颜色特征字典中对应的颜色特征单词,将相同位置的表观特征单词和颜色特征单词组成词对;
直方图获取模块,用于将各词对一一转换为复合特征字典中对应的复合特征单词,根据各复合特征单词出现在待识别的叶片上的次数,构建该待识别的叶片的复合特征直方图;
分类模块,将所述复合特征直方图作为预先获得的病害分类器的输入,根据所述病害分类器的输出结果对叶片的病害进行识别。
CN201810317284.5A 2018-04-10 2018-04-10 叶片病害的识别方法和系统 Active CN108764275B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810317284.5A CN108764275B (zh) 2018-04-10 2018-04-10 叶片病害的识别方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810317284.5A CN108764275B (zh) 2018-04-10 2018-04-10 叶片病害的识别方法和系统

Publications (2)

Publication Number Publication Date
CN108764275A true CN108764275A (zh) 2018-11-06
CN108764275B CN108764275B (zh) 2020-08-04

Family

ID=63981674

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810317284.5A Active CN108764275B (zh) 2018-04-10 2018-04-10 叶片病害的识别方法和系统

Country Status (1)

Country Link
CN (1) CN108764275B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111340779A (zh) * 2020-02-25 2020-06-26 中国科学院地理科学与资源研究所 一种类圆形植被斑块综合检测方法
CN115861308A (zh) * 2023-02-22 2023-03-28 山东省林草种质资源中心(山东省药乡林场) 一种元宝枫病害检测方法

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102509110A (zh) * 2011-10-24 2012-06-20 中国科学院自动化研究所 基于成对约束的在线词典再加权对图像进行分类的方法
WO2013142939A1 (en) * 2012-03-30 2013-10-03 Fundação Antônio Prudente Methods for predicting and classifying event outcomes
JP2014003909A (ja) * 2012-06-21 2014-01-16 National Agriculture & Food Research Organization 病害抵抗性品種系統の識別方法
CN103995860A (zh) * 2014-05-16 2014-08-20 中国科学院重庆绿色智能技术研究院 一种基于颜色特征提取的图像检索系统及其方法
CN104616019A (zh) * 2015-03-04 2015-05-13 国网山东省电力公司泰安供电公司 电力设备标牌图像的识别方法
CN105046681A (zh) * 2015-05-14 2015-11-11 江南大学 一种基于SoC的图像显著性区域检测方法
CN105303195A (zh) * 2015-10-20 2016-02-03 河北工业大学 一种词袋图像分类方法
CN105760871A (zh) * 2014-12-14 2016-07-13 仲恺农业工程学院 一种植物叶斑类病害抗性鉴定新方法
CN105760880A (zh) * 2016-01-29 2016-07-13 内蒙古工业大学 基于支持向量机的向日葵叶部病害判断方法
CN106529586A (zh) * 2016-10-25 2017-03-22 天津大学 基于补充文本特征的图像分类方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102509110A (zh) * 2011-10-24 2012-06-20 中国科学院自动化研究所 基于成对约束的在线词典再加权对图像进行分类的方法
WO2013142939A1 (en) * 2012-03-30 2013-10-03 Fundação Antônio Prudente Methods for predicting and classifying event outcomes
JP2014003909A (ja) * 2012-06-21 2014-01-16 National Agriculture & Food Research Organization 病害抵抗性品種系統の識別方法
CN103995860A (zh) * 2014-05-16 2014-08-20 中国科学院重庆绿色智能技术研究院 一种基于颜色特征提取的图像检索系统及其方法
CN105760871A (zh) * 2014-12-14 2016-07-13 仲恺农业工程学院 一种植物叶斑类病害抗性鉴定新方法
CN104616019A (zh) * 2015-03-04 2015-05-13 国网山东省电力公司泰安供电公司 电力设备标牌图像的识别方法
CN105046681A (zh) * 2015-05-14 2015-11-11 江南大学 一种基于SoC的图像显著性区域检测方法
CN105303195A (zh) * 2015-10-20 2016-02-03 河北工业大学 一种词袋图像分类方法
CN105760880A (zh) * 2016-01-29 2016-07-13 内蒙古工业大学 基于支持向量机的向日葵叶部病害判断方法
CN106529586A (zh) * 2016-10-25 2017-03-22 天津大学 基于补充文本特征的图像分类方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
刘媛等: ""葡萄病害的计算机识别方法"", 《中国农机化学报》 *
刘阗宇等: ""基于卷积神经网络的葡萄叶片病害检测方法"", 《东北农业大学学报》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111340779A (zh) * 2020-02-25 2020-06-26 中国科学院地理科学与资源研究所 一种类圆形植被斑块综合检测方法
CN111340779B (zh) * 2020-02-25 2020-12-22 中国科学院地理科学与资源研究所 一种类圆形植被斑块综合检测方法
CN115861308A (zh) * 2023-02-22 2023-03-28 山东省林草种质资源中心(山东省药乡林场) 一种元宝枫病害检测方法

Also Published As

Publication number Publication date
CN108764275B (zh) 2020-08-04

Similar Documents

Publication Publication Date Title
Tan et al. Recognising blueberry fruit of different maturity using histogram oriented gradients and colour features in outdoor scenes
US8340420B2 (en) Method for recognizing objects in images
US8655070B1 (en) Tree detection form aerial imagery
CN107610114B (zh) 基于支持向量机的光学卫星遥感影像云雪雾检测方法
CN109636784B (zh) 基于最大邻域和超像素分割的图像显著性目标检测方法
Siraj et al. Digital image classification for malaysian blooming flower
Alkoffash et al. A survey of digital image processing techniques in character recognition
CN112464942B (zh) 基于计算机视觉的重叠烟叶智能化分级方法
Yu et al. Automatic interesting object extraction from images using complementary saliency maps
Arora et al. A Plant Identification System using Shape and Morphological Features on Segmented Leaflets: Team IITK, CLEF 2012.
Alharbi et al. Automatic counting of wheat spikes from wheat growth images
Netto et al. Segmentation of RGB images using different vegetation indices and thresholding methods
Larese et al. Finding local leaf vein patterns for legume characterization and classification
US9715729B2 (en) Method and apparatus for processing block to be processed of urine sediment image
CN112257702A (zh) 一种基于增量学习的农作物病害识别方法
Rezaei et al. Gland segmentation in histopathology images using deep networks and handcrafted features
CN110866547B (zh) 基于多特征和随机森林的中药饮片自动分类系统及方法
Pan et al. Improving scene text detection by scale-adaptive segmentation and weighted CRF verification
CN108764275A (zh) 叶片病害的识别方法和系统
Septiarini et al. Image processing techniques for tomato segmentation applying k-means clustering and edge detection approach
Ahmad et al. Feature extraction of plant leaf using deep learning
Setiawan et al. Maize leaf disease image classification using bag of features
Chuang et al. Aggregated segmentation of fish from conveyor belt videos
CN103366183B (zh) 一种局灶性病灶的非参数自动检测方法
Kabir et al. Discriminant feature extraction using disease segmentation for automatic leaf disease diagnosis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant