CN111861103B - 一种基于多特征与多分类器的鲜茶叶分类方法 - Google Patents
一种基于多特征与多分类器的鲜茶叶分类方法 Download PDFInfo
- Publication number
- CN111861103B CN111861103B CN202010505288.3A CN202010505288A CN111861103B CN 111861103 B CN111861103 B CN 111861103B CN 202010505288 A CN202010505288 A CN 202010505288A CN 111861103 B CN111861103 B CN 111861103B
- Authority
- CN
- China
- Prior art keywords
- tea
- image
- classification
- distance matrix
- special
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 42
- 241001122767 Theaceae Species 0.000 title claims abstract 62
- 239000011159 matrix material Substances 0.000 claims abstract description 78
- 238000001514 detection method Methods 0.000 claims abstract description 17
- 238000004364 calculation method Methods 0.000 claims abstract description 14
- 238000012549 training Methods 0.000 claims abstract description 13
- 230000006870 function Effects 0.000 claims description 29
- 238000013145 classification model Methods 0.000 claims description 26
- 238000005259 measurement Methods 0.000 claims description 9
- 238000007781 pre-processing Methods 0.000 claims description 9
- 238000000605 extraction Methods 0.000 claims description 8
- 230000004927 fusion Effects 0.000 claims description 8
- 238000004422 calculation algorithm Methods 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 5
- 230000008859 change Effects 0.000 claims description 4
- 230000005484 gravity Effects 0.000 claims description 4
- 238000012937 correction Methods 0.000 claims description 3
- 238000001914 filtration Methods 0.000 claims description 3
- 238000005286 illumination Methods 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 3
- 230000009466 transformation Effects 0.000 claims description 3
- 238000012795 verification Methods 0.000 claims description 3
- 238000005457 optimization Methods 0.000 claims description 2
- 230000009286 beneficial effect Effects 0.000 abstract description 3
- 235000013311 vegetables Nutrition 0.000 abstract 1
- 244000269722 Thea sinensis Species 0.000 description 144
- 235000013616 tea Nutrition 0.000 description 143
- 238000010586 diagram Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 239000012535 impurity Substances 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 241000196324 Embryophyta Species 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000012706 support-vector machine Methods 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000002790 cross-validation Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000000877 morphologic effect Effects 0.000 description 2
- 244000241257 Cucumis melo Species 0.000 description 1
- 235000015510 Cucumis melo subsp melo Nutrition 0.000 description 1
- FJJCIZWZNKZHII-UHFFFAOYSA-N [4,6-bis(cyanoamino)-1,3,5-triazin-2-yl]cyanamide Chemical compound N#CNC1=NC(NC#N)=NC(NC#N)=N1 FJJCIZWZNKZHII-UHFFFAOYSA-N 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 235000009569 green tea Nutrition 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06395—Quality analysis or management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Biology (AREA)
- Entrepreneurship & Innovation (AREA)
- Strategic Management (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Economics (AREA)
- Multimedia (AREA)
- Game Theory and Decision Science (AREA)
- Probability & Statistics with Applications (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Image Analysis (AREA)
Abstract
本发明提供一种基于多特征与多分类器的鲜茶叶分类方法,包括以下:对茶叶图像训练样本提取几何特征和纹理特征,并输入SVM训练,得到训练好的SVM模型;利用训练好的SVM模型预测待预测茶叶图像,得到基于SVM分类器的茶叶各类型分类概率;对茶叶图像训练样本进行角点检测和距离矩阵相似度计算,并依据角点检测结果和距离矩阵相似度,得到基于特殊角度数量及距离矩阵的茶叶各类型分类概率;将基于SVM分类器的茶叶各类型分类概率和基于特殊角度数量及距离矩阵的茶叶各类型分类概率采用基于KNN结果融合,得到最终茶叶各类型分类概率;最终菜叶各类型分类概率中,最大概率值对应的类别标签即为最终分类结果;本发明提供的有益效果是:提高了茶叶分类的准确率。
Description
技术领域
本发明涉及图像分类领域,尤其涉及一种基于多特征与多分类器的鲜茶叶分类方法。
背景技术
近年来,随着采茶人工成本不断增加以及采茶工人力紧缺,为了降低生产成本,提高生产效率,越来越多的茶场开始采用机械采茶。但是机采茶中参杂叶梗等杂物,同时无法按照生产加工需求采集特定等级的鲜叶,各个等级鲜叶(如单芽、一芽一叶、一芽二叶、一芽三叶)混合在一起,大大降低了茶叶的质量,导致只能作为低价茶生产销售,这成为了制约机械采茶发展与推广的主要原因。
目前存在一些基于物理方式的茶叶分级方法,如振动筛选式茶叶分级机,在将茶叶从输送端向输出端振动前进的过程中使不同等级茶叶在重力作用下通过分选装置不同孔径落在下方的接料器上实现鲜叶分级,准确率在70%左右;茶叶风选机通过吹风将不同轻重的鲜叶区分开来,较轻的芽叶抛落距离较远,较重的芽叶抛落距离较近,准确率在70%左右。可见通过物理方式对鲜叶进行分级准确率低、误差大。另外基于光电传感器的茶叶色选机可在茶叶加工后有效分离杂质、叶梗等物质,准确在90%以上,但只能剔除杂质,依然无法进行有效分级。
随着计算机技术的高速发展,基于计算机视觉的图像分类技术应用于各个领域。目前,国内外有一些利用计算机视觉对于植物叶片进行分类的研究取得了较好的效果。例如董红霞等结合形状与纹理特征利用BP前馈神经网络对6种叶片300个样本叶片进行分类,准确率达98.4%;郑一力[8]等针对植物叶片数据库属于小样本数据库的特点,提出了一种基于迁移学习的卷积神经网络植物叶片图像识别方法,利用预训练AlexNet、InceptionV3模型对ICL数据库的识别率达95.31%和95.40%;Turkoglu等为了增加同一物种叶片间的相似率,将叶片分割成两部分和四部分后提取纹理特征、颜色特征、灰度共生矩阵以及傅里叶描述子,再结合极限学习机进行叶片识别,在Flavia叶片数据集准确率达99.10%。
而利用计算机视觉技术对茶叶进行分类的研究与应用较少,主要分为两个方面的研究:一是对加工后的茶叶分离杂质以及分级,例如高达睿等基于颜色和形状特征利用BP神经网络对三种不同等级的六安瓜片进行分类,准确率达90%以上;吴正敏等基于形态特征采用随机森林法判定特征权重并结合支持向量机进行分类,准确率为93.8%;宋彦等提出了一种基于形状特征直方图结合支持向量机的茶叶等级识别方法,准确率为95.71%。二是对采摘的鲜叶进行分类,如常春等选择茶叶图像的6个几何特征和2个纹理特征做为茶叶的分类特征,利用BP神经网络构建分类模型,准确率达90%以上,但其未对一芽二叶与一芽三叶进行区分;高震宇等设计了一套鲜茶叶智能分选系统,搭建了7层结构的卷积神经网络识别模型,其对单芽、一芽一叶、一芽二叶、一芽三叶的分类准确率为92.25%;吴正敏等利用凸包面积、凸包周长、长轴长度、短轴长度等形态特征结合BP神经网络对绿茶进行分类,准确率在90%以上,也未对一芽二叶与一芽三叶进行区分。
发明内容
有鉴于此,本方法在提取鲜茶叶几何特征与纹理特征并结合支持向量机进行鲜茶叶分类的基础上,提出了一种基于茶叶特殊角点及其距离矩阵的分类方法,并通过结果融合得出分类结果,为鲜茶叶分类研究提供了新的方法。
本发明提供了一种基于多特征与多分类器的鲜茶叶分类方法,包括以下:
S101:获取茶叶图像,作为训练数据集;
S102:对茶叶图像进行预处理,得到预处理后的茶叶图像;
S103:对预处理后的茶叶图像进行几何特征提取,得到预处理后的茶叶图像的5个相对几何特征和7个Hu不变矩相对几何特征;
对预处理后的茶叶图像进行轮廓提取,得到茶叶轮廓,并根据茶叶轮廓进行多边形拟合,得到拟合的多边形;
S104:对茶叶图像的灰度图进行纹理特征提取,得到茶叶图像的1个纹理特征;
对拟合的多边形进行角点检测,根据角点检测得到的特殊角点数量,并结合茶叶样本数据统计,得到茶叶类别及茶叶类别对应的分类概率;
S105:利用12个相对几何特征和1个纹理特征训练SVM分类器,得到基于SVM的鲜茶叶分类模型;
对所述特殊角点进行距离矩阵度量,得到特殊角点序列的距离矩阵特征库;
对待预测茶叶图像进行角点检测,并根据待预测样本的特殊角点进行距离矩阵度量,得到待预测样本的距离矩阵;
根据待预测茶叶图像的距离矩阵与所述特殊角点序列的距离矩阵特征库,计算距离矩阵相似度;
S106:利用所述基于SVM的鲜茶叶分类模型对待预测茶叶图像进行分类预测,得到基于相对几何特征、纹理特征以及SVM的茶叶各类别分类概率;
根据待预测茶叶图像的特殊角点数量和距离矩阵相似度对待预测茶叶图像进行分类预测,得到基于特殊角点以及距离矩阵相似度的茶叶各类别分类概率;
S107:将基于相对几何特征、纹理特征以及SVM的茶叶各类别分类概率和基于特殊角点以及距离矩阵的茶叶各类别分类概率进行基于KNN的结果融合,得到待预测茶叶图像最终分类结果。
进一步地,步骤S102中,对茶叶图像进行预处理,得到预处理后的茶叶图像,具体为:将茶叶图像进行灰度变换,得到灰度图像;对灰度图像进行高斯滤波,得到滤波去噪后的图像;采用大津算法对滤波去噪后的图像进行处理,得到预处理后的茶叶图像,即二值化图像。
进一步地,步骤S103中,5个相对几何特征包括矩形度、圆形度、球形度、偏心率和周长凹凸比,计算公式分别式(1)、(2)、(3)、(4)和(5)所示:
式(1)中,A为叶片面积,AMER为最小外接矩形面积;式(2)中C为叶片面积,P为叶片周长;式(3)中,RMIC为叶片最大内切圆半径,RMCC为叶片最小外接圆半径;式(4)中,D为叶片长轴,B为叶片短轴;式(5)中,P为叶片周长,PCH为叶片凸包周长。
进一步地,步骤S103中,所述7个Hu不变矩相对几何特征,具体由二阶归一化中心矩和三阶归一化中心矩构造得到,分别为H1-H7,计算公式如式(6)、(7)、(8)、(9)、(10)、(11)和(12)所示:
H1=η20+η02 (6)
H2=(η20-3η02)2+4η11 2 (7)
H3=(η30-3η12)2+(3η21-η03)2 (8)
H4=(η30+η12)2+(η21+η03)2 (9)
式(6)、(7)、(8)、(9)、(10)、(11)和(12)中,为归一化的中心矩,其中p,q为阶数,p,q=0,1,2,3且p+q取值为2或者3;/>其中/>和/>为图像的重心,/>N和M为图像的高度和宽度,f(x,y)为预处理后的茶叶图像再经离散化后的茶叶数字图像函数;/>为离散化后的茶叶数字图像的p+q阶几何矩。
进一步地,步骤S104中,对茶叶图像的灰度图进行纹理特征提取,具体过程为:
S201:采用Gamma校正法对茶叶图像的灰度图进行颜色空间归一化,降低图像局部阴影和光照变化造成的影响,得到校正后的茶叶图像;
S202:将校正后的茶叶图像分为若干个块,每个块由若干个细胞组成;每个细胞大小为n×n个像素;每个块为m×m个细胞;
S203:计算每个细胞内各像素点的梯度,并统计每个细胞各像素点梯度方向直方图,得到每个细胞的描述子;
S204:将每个细胞的描述子串联,得到每个块的HOG描述子,同时对每个块内的梯度强度进行归一化;
S205:将校正后茶叶图像的所有快的HOG描述子串联,得到校正后茶叶图像的HOG特征,即茶叶图像的1个纹理特征。
进一步地,步骤S105中,利用12个相对几何特征和1个纹理特征训练SVM分类器,得到基于SVM的鲜茶叶分类模型,具体为:采用不同的惩罚系数、不同的核函数及核函数对应的参数,通过基于网格搜索和交叉验证的方式,进行参数寻优,确定SVM鲜茶叶分类模型的最佳惩罚系数和核函数;所述不同的核函数包括:线性核函数、多项式核函数和径向基核函数;所述核函数对应的参数包括核参数gamma和最高次幂数degree。
进一步地,步骤S103中,对预处理后的茶叶图像进行轮廓提取,得到茶叶轮廓,并根据茶叶轮廓进行多边形拟合,得到拟合的多边形,具体为:所述轮廓提取,采用OPENCV的FindContours方法;所述多边形拟合,采用OPENCV的Douglas-Peucker算法。
进一步地,步骤S104中,对拟合的多边形进行角点检测,根据角点检测得到的特殊角点数量,所述特殊角点的判别方法具体为:拟合的多边形中,满足如式(13)条件的多边形的角P所对应的角点即为特殊角点:
∠P<=E (0°<=E<=180°) (13)
式(13)中,∠P为角P的角度,E为预先设置的角度阈值。
步骤S105中,对所述特殊角点进行距离矩阵度量,并进行距离矩阵相似度计算,具体为:距离矩阵如式(14)所示:
式(14)中,di,j表示特殊角点序列中第i个点与第j个点间的欧式距离,dmax表示矩阵中所有di,j的最大值;
所述距离矩阵相似度如式(15)所示:
式(15)中,S表示距离矩阵相似度,DA表示待预测茶叶图像的距离矩阵,Dn表示特殊角点序列的距离矩阵特征库中对应的距离矩阵,为已知值。
本发明提供的技术方案带来的有益效果是:提高了茶叶分类的准确率。
附图说明
图1是本发明一种基于多特征与多分类器的鲜茶叶分类方法的流程图;
图2是本发明图像预处理效果示意图;
图3是本发明实施例中基于SVM分类器的线性核函数下惩罚系数C与分类准确率;
图4是本发明基于SVM分类器的不同类型核函数最高分类准确率折线图;
图5是本发明中茶叶多边形拟合过程示意图;
图6是本发明实施例中角度A的取值与特殊角点总数N的关系图;
图7是本发明基于特殊角点及距离矩阵相似度的鲜茶叶分类流程图;
图8是本发明基于KNN融合中距离计算公式与K的选取关系示意图;
图9是本发明数据集中鲜茶叶类别示意图;
图10是本发明实施例中基于SVM的分类模型的分类结果混淆矩阵示意图;
图11是本发明实施例中SVM+基于特殊角点及其距离矩阵分类模型的分类结果混淆矩阵示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地描述。
请参考图1,本发明的实施例提供了一种基于多特征与多分类器的鲜茶叶分类方法,包括以下:
S101:获取茶叶图像,作为训练数据集;所述训练数据集包括多类茶叶图像,每一类茶叶图像包括多个茶叶图像;
S102:对茶叶图像进行预处理,得到预处理后的茶叶图像;
S103:对预处理后的茶叶图像进行几何特征提取,得到预处理后的茶叶图像的5个相对几何特征和7个Hu不变矩相对几何特征;
对预处理后的茶叶图像进行轮廓提取,得到茶叶轮廓,并根据茶叶轮廓进行多边形拟合,得到拟合的多边形;
S104:对茶叶图像的灰度图进行纹理特征提取,得到茶叶图像的1个纹理特征;
对拟合的多边形进行角点检测,根据角点检测得到的特殊角点数量,并结合茶叶样本数据统计,得到茶叶类别及茶叶类别对应的分类概率;
S105:利用12个相对几何特征和1个纹理特征训练SVM分类器,得到基于SVM的鲜茶叶分类模型;
对所述特殊角点进行距离矩阵度量,得到特殊角点序列的距离矩阵特征库;
对待预测茶叶图像进行角点检测,并根据待预测样本的特殊角点进行距离矩阵度量,得到待预测样本的距离矩阵;
根据待预测茶叶图像的距离矩阵与所述特殊角点序列的距离矩阵特征库,计算距离矩阵相似度;
S106:利用所述基于SVM的鲜茶叶分类模型对待预测茶叶图像进行分类预测,得到基于相对几何特征、纹理特征以及SVM的茶叶各类别分类概率;
根据待预测茶叶图像的特殊角点数量和距离矩阵相似度对待预测茶叶图像进行分类预测,得到基于特殊角点以及距离矩阵相似度的茶叶各类别分类概率;
S107:将基于相对几何特征、纹理特征以及SVM的茶叶各类别分类概率和基于特殊角点以及距离矩阵的茶叶各类别分类概率进行基于KNN的结果融合,得到待预测茶叶图像最终分类结果。
请参考图2,图2是本方法的图像预处理效果图;
步骤S102中,对茶叶图像进行预处理,得到预处理后的茶叶图像,具体为:将茶叶图像进行灰度变换,得到灰度图像;对灰度图像进行高斯滤波,得到滤波去噪后的图像;采用大津算法对滤波去噪后的图像进行处理,得到预处理后的茶叶图像,即二值化图像。
步骤S103中,对预处理后的茶叶图像进行几何特征提取,得到预处理后的茶叶图像的5个相对几何特征和7个Hu不变矩相对几何特征。
其中,基于图像预处理得到的二值化图像,提取矩形度、圆形度、球形度、偏心率与周长凹凸比5个相对几何特征,计算公式如表1所示。
表1相对几何特征计算公式
基于图像预处理得到的二值化图像,提取7个Hu不变矩相对几何特征,
具体由二阶归一化中心矩和三阶归一化中心矩构造得到,分别为H1-H7,计算公式如式(6)、(7)、(8)、(9)、(10)、(11)和(12)所示:
H1=η20+η02 (6)
H2=(η20-3η02)2+4η11 2 (7)
H3=(η30-3η12)2+(3η21-η03)2 (8)
H4=(η30+η12)2+(η21+η03)2 (9)
式(6)、(7)、(8)、(9)、(10)、(11)和(12)中,为归一化的中心矩,其中p,q为阶数,p,q=0,1,2,3且p+q取值为2或者3;/>其中/>和/>为图像的重心,/>N和M为图像的高度和宽度,f(x,y)为预处理后的茶叶图像再经离散化后的茶叶数字图像函数;/>为离散化后的茶叶数字图像的p+q阶几何矩。
步骤S104中对茶叶图像的灰度图进行纹理特征提取,得到茶叶图像的1个纹理特征,具体为:
基于图像预处理得到的灰度图像利用方向梯度直方图。首先采用Gamma校正法对输入图像进行颜色空间的归一化,可调节图像的对比度,降低图像局部的阴影和光照变化所造成的影响,同时可以抑制噪音的干扰;将图像划分为若干个块(block),每个块由若干个细胞(cell)组成,本方法设置细胞大小为8×8像素,每个块大小为4×4个细胞;然后计算细胞中各像素点的梯度的或边缘的方向直方图,统计每个细胞的梯度方向直方图得到每个细胞的描述子,然后将细胞的特征向量串联得到块的HOG特征,同时对块内的梯度强度进行归一化;最后将图像内的所有块的HOG特征描述串联起来得到该图像的HOG特征,即为供图像分类使用的茶叶纹理特征。
步骤S106中,基于12个相对几何特征和1个纹理特征,利用所述基于SVM的鲜茶叶分类模型对茶叶图像进行分类预测,得到基于相对几何特征、纹理特征以及SVM的茶叶各类别分类概率。
本实施例中,对惩罚系数C、不同核函数(线性核函数、多项式核函数、径向基核函数)及核函数对应的参数(核参数gamma、最高次幂次数degree)通过基于网格搜索和交叉验证的方式进行参数寻优,对于鲜茶叶分类确定最佳组合为:核函数kernel=线性核函数,惩罚系数C=0.25,线性核函数下惩罚系数C与分类准确率的关系如图3所示,各核函数最高分类准确率如图4所示。图4中,当kernel=多项式核函数时,C=0.8,gamma=1.67,degree=5;当kernel=线性核函数时,C=0.25;当kernel=径向基核函数时,C=3,gamma=0.25;
请参考图5,图5是本发明实施例中,茶叶多边形拟合过程示意图;以一芽二叶样本为例,基于图像预处理阶段得到的二值化图像,利用OPENCV的FindContours方法进行轮廓提取,然后利用Douglas-Peucker算法对茶叶轮廓进行多边形拟合,设置逼近精度为轮廓周长乘0.02,并对得到的拟合多边形进行颜色填充。
对于得到的拟合多边形,检测其特殊角点个数,此处对特殊角点的定义为:拟合多边形中任意一个满足下述条件的角P所对应的角点
∠P≤A(0°≤A≤180°)
其中∠P为角P的角度。
首先设置A=90°,对1755张分为四类(单芽、一芽一叶、一芽二叶、一芽三叶)的鲜茶叶样本进行特殊角点检测与数量统计,发现各样本检测到的特殊角点数量分布在1~8之间,大部分分布在2~5之间。其中,450个单芽样本中检测到2个特殊角点的有424(记为N1)个,432个一芽一叶样本中检测到3个特殊角点的有355(记为N2)个,441个一芽二叶样本中检测到4个特殊角点的有291(记为N3)个,432个一芽三叶样本中检测到5个特殊角点的有222(记为N4)个,N1、N2、N3、N4的总数为1292(记为N)个,这与对样本拟合多边形的直接观察结果相符。当A改变时,总数N会随之变化。当A的取值使得N最大时,A即为特殊角点条件的最佳取值。通过对A各个取值的实验,当A=100°时N值最大,即特殊角点为拟合多边形中≤100°的角所应的点。角度A的取值与总数N的关系如图6所示。
当特殊角点满足∠P≤100°时对样本进行特殊角点检测与统计,各特殊角点数量(1~8)与茶叶类别(单芽、一芽一叶、一芽二叶、一芽三叶)的对应值组成一个8×4的矩阵,对矩阵每一行进行归一化处理,即可得到各特殊角点数量对应的各个分类概率。以数据集中1755个样本为例,结果如表1所示。
表1各特殊角点数量对应的各个分类概率
通过对表1数据的分析,对于特殊角点数量在3~5之间的样本,虽然大部分检测到3个特殊角点的样本是一芽一叶,但仍有部分样本是其他类别。同样,检测到4个特殊角点的样本中除了一芽二叶还存在其他类别,检测到5个特殊角点的样本中除了一芽三叶也存在其他类别。为了降低对分类准确率的影响,使用特殊角点序列的距离矩阵的相似度进行再次比较。
步骤S105中,对所述特殊角点进行距离矩阵度量,并进行距离矩阵相似度计算,具体为:距离矩阵如式(14)所示:
式(14)中,di,j表示特殊角点序列中第i个点与第j个点间的欧式距离,dmax表示矩阵中所有di,j的最大值;
所述距离矩阵相似度如式(15)所示:
式(15)中,S表示距离矩阵相似度,DA表示待预测茶叶图像的距离矩阵,Dn表示特殊角点序列的距离矩阵特征库中对应的距离矩阵,为已知值。
请参考图7,图7是本发明基于特殊角点及距离矩阵相似度的鲜茶叶分类流程图;对于待预测茶叶图像,首先检测其特殊角点数量(记为count),若
1)1≤count<2或6≤count≤8,则将表1中特殊角点个数为count的行的四个值作为四个类别的分类概率;
2)2≤count≤5,则计算待预测茶叶图像特殊角点序列的距离矩阵,并与特殊角点序列的距离矩阵特征库中对应的矩阵计算相似度,即count=2时,与D0计算相似度,count=3时,与D1计算相似度,count=4时,与D2计算相似度,count=5时,与D3计算相似度。当相似度S大于一定阈值t时,将表1中特殊角点个数为count的行的四个值作为四个类别的分类概率,否则,四个类别的分类概率都记为0。其中阈值t基于网格搜索与交叉验证方法得出,相似度阈值如表2所示。
表2距离矩阵相似度阈值
注:t0为与D0计算相似度的阈值,t1为与D1计算相似度的阈值,t2为与D2计算相似度的阈值,t3为与D3计算相似度的阈值。
count=0或count>8,四个类别的分类概率都记为0。
基于几何特征和纹理特征以及SVM分类器的各类别分类概率与基于特殊角点及其距离矩阵的各类别分类概率结果进行结果融合,通过融合后的各分类概率得出最终分类结果。
KNN是数据挖掘分类技术中的常用方法,他的思想是样本在特征空间中的k个最邻近的样本中的大多数属于某一个类别,则该样本也划分为这个类别。影响KNN分类效果的有两个重要因素:一是距离计算公式的选取,二是参数K的选取。本发明分别对欧式距离与曼哈顿距离以及不同的K值进行实验,得出使用曼哈顿距离计算公式并且设置k=30时效果最好,结果如图8所示。
为了更好地对本发明所提方法进行验证,本发明实验采用自建数据集,共采集龙井茶鲜叶图片1973张,分为四类如图9所示,其中单芽502张、一芽一叶488张、一芽二叶494张、一芽三叶489张。
为验证基于多特征与多分类器的鲜茶叶分类模型的有效性,分别对SVM鲜茶叶分类模型、基于特殊角点及其距离矩阵的鲜茶叶分类模型以及基于KNN结果融合的鲜茶叶分类模型进行分类实验。使用Python及sklearn库实现分类模型,同时利用十折交叉验证法,将数据集中1950个样本分为10份,轮流将其中9份作为训练集,1份作为测试集,进行实验,实验结果如表3所示。其中SVM分类模型和SVM+基于特殊角点及其距离矩阵分类模型的分类结果混淆矩阵如图10、11所示。
表3不同分类模型的分类准确率
从表3数据可知,本研究提出的基于多特征与多分类器的鲜茶叶分类模型比单独使用SVM模型进行分类准确率高,提升3.16%。另外,准确率有明显提高,现有方法主利用茶叶绝对几何特征进行分类,虽然对三分类(单芽、一芽一叶、一芽多叶)分类效果较好,但是对于本方法所述四分类结果较差,不易区分一芽二叶与一芽三叶。从图10和图11的混淆矩阵可知,基于多特征与多分类器的鲜茶叶分类模型对各个类别的分类准确率均有提高,其中对于一芽一叶与一芽二叶分类准确率提高较为明显。
本发明实施的有益效果是:提高了茶叶分类的准确率。
在不冲突的情况下,本文中上述实施例及实施例中的特征可以相互结合。以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (6)
1.一种基于多特征与多分类器的鲜茶叶分类方法,其特征在于:具体包括:
S101:获取茶叶图像,作为训练数据集;
S102:对茶叶图像进行预处理,得到预处理后的茶叶图像;
S103:对预处理后的茶叶图像进行几何特征提取,得到预处理后的茶叶图像的5个相对几何特征和7个Hu不变矩相对几何特征;
对预处理后的茶叶图像进行轮廓提取,得到茶叶轮廓,并根据茶叶轮廓进行多边形拟合,得到拟合的多边形;
S104:对茶叶图像的灰度图进行纹理特征提取,得到茶叶图像的1个纹理特征;
对拟合的多边形进行角点检测,根据角点检测得到的特殊角点数量,并结合茶叶样本数据统计,得到茶叶类别及茶叶类别对应的分类概率;
S105:利用12个相对几何特征和1个纹理特征训练SVM分类器,得到基于SVM的鲜茶叶分类模型;
对所述特殊角点进行距离矩阵度量,得到特殊角点序列的距离矩阵特征库;
对待预测茶叶图像进行角点检测,并根据待预测样本的特殊角点进行距离矩阵度量,得到待预测样本的距离矩阵;
根据待预测茶叶图像的距离矩阵与所述特殊角点序列的距离矩阵特征库,计算距离矩阵相似度;
S106:利用所述基于SVM的鲜茶叶分类模型对待预测茶叶图像进行分类预测,得到基于相对几何特征、纹理特征以及SVM的茶叶各类别分类概率;
根据待预测茶叶图像的特殊角点数量和距离矩阵相似度对待预测茶叶图像进行分类预测,得到基于特殊角点以及距离矩阵相似度的茶叶各类别分类概率;
S107:将基于相对几何特征、纹理特征以及SVM的茶叶各类别分类概率和基于特殊角点以及距离矩阵的茶叶各类别分类概率进行基于KNN的结果融合,得到待预测茶叶图像最终分类结果;
步骤S104中,对茶叶图像的灰度图进行纹理特征提取,具体过程为:
S201:采用Gamma校正法对茶叶图像的灰度图进行颜色空间归一化,降低图像局部阴影和光照变化造成的影响,得到校正后的茶叶图像;
S202:将校正后的茶叶图像分为若干个块,每个块由若干个细胞组成;每个细胞大小为n×n个像素;每个块为m×m个细胞;
S203:计算每个细胞内各像素点的梯度,并统计每个细胞各像素点梯度方向直方图,得到每个细胞的描述子;
S204:将每个细胞的描述子串联,得到每个块的HOG描述子,同时对每个块内的梯度强度进行归一化;
S205:将校正后茶叶图像的所有快的HOG描述子串联,得到校正后茶叶图像的HOG特征,即茶叶图像的1个纹理特征;
步骤S105中,利用12个相对几何特征和1个纹理特征训练SVM分类器,得到基于SVM的鲜茶叶分类模型,具体为:采用不同的惩罚系数、不同的核函数及核函数对应的参数,通过基于网格搜索和交叉验证的方式,进行参数寻优,确定SVM鲜茶叶分类模型的最佳惩罚系数和核函数;所述不同的核函数包括:线性核函数、多项式核函数和径向基核函数;所述核函数对应的参数包括核参数gamma和最高次幂数degree;
步骤S105中,对所述特殊角点进行距离矩阵度量,并进行距离矩阵相似度计算,具体为:距离矩阵如式(14)所示:
式(14)中,di,j表示特殊角点序列中第i个点与第j个点间的欧式距离,dmax表示矩阵中所有di,j的最大值;
所述距离矩阵相似度如式(15)所示:
式(15)中,S表示距离矩阵相似度,DA表示待预测茶叶图像的距离矩阵,Dn表示特殊角点序列的距离矩阵特征库中对应的距离矩阵。
2.如权利要求1所述的一种基于多特征与多分类器的鲜茶叶分类方法,其特征在于:步骤S102中,对茶叶图像进行预处理,得到预处理后的茶叶图像,具体为:将茶叶图像进行灰度变换,得到灰度图像;对灰度图像进行高斯滤波,得到滤波去噪后的图像;采用大津算法对滤波去噪后的图像进行处理,得到预处理后的茶叶图像,即二值化图像。
3.如权利要求1所述的一种基于多特征与多分类器的鲜茶叶分类方法,其特征在于:步骤S103中,5个相对几何特征包括矩形度、圆形度、球形度、偏心率和周长凹凸比,计算公式分别式(1)、(2)、(3)、(4)和(5)所示:
式(1)中,A为叶片面积,AMER为最小外接矩形面积;式(2)中C为叶片面积,P为叶片周长;式(3)中,RMIC为叶片最大内切圆半径,RMCC为叶片最小外接圆半径;式(4)中,D为叶片长轴,B为叶片短轴;式(5)中,P为叶片周长,PCH为叶片凸包周长。
4.如权利要求1所述的一种基于多特征与多分类器的鲜茶叶分类方法,其特征在于:步骤S103中,所述7个Hu不变矩相对几何特征,具体由二阶归一化中心矩和三阶归一化中心矩构造得到,分别为H1-H7,计算公式如式(6)、(7)、(8)、(9)、(10)、(11)和(12)所示:
H1=η20+η02 (6)
H2=(η20-3η02)2+4η11 2 (7)
H3=(η30-3η12)2+(3η21-η03)2 (8)
H4=(η30+η12)2+(η21+η03)2 (9)
式(6)、(7)、(8)、(9)、(10)、(11)和(12)中,为归一化的中心矩,其中p,q为阶数,p,q=0,1,2,3且p+q取值为2或者3;/>其中/>和/>为图像的重心,/>N和M为图像的高度和宽度,f(x,y)为预处理后的茶叶图像再经离散化后的茶叶数字图像函数;/>为离散化后的茶叶数字图像的p+q阶几何矩。
5.如权利要求1所述的一种基于多特征与多分类器的鲜茶叶分类方法,其特征在于:步骤S103中,对预处理后的茶叶图像进行轮廓提取,得到茶叶轮廓,并根据茶叶轮廓进行多边形拟合,得到拟合的多边形,具体为:所述轮廓提取,采用OPENCV的FindContours方法;所述多边形拟合,采用Douglas-Peucker算法。
6.如权利要求1所述的一种基于多特征与多分类器的鲜茶叶分类方法,其特征在于:步骤S104中,对拟合的多边形进行角点检测,根据角点检测得到的特殊角点数量,所述特殊角点的判别方法具体为:拟合的多边形中,满足如式(13)条件的多边形的角P所对应的角点即为特殊角点:
∠P<=E (0°<=E<=180°) (13)
式(13)中,∠P为角P的角度,E为预先设置的角度阈值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010505288.3A CN111861103B (zh) | 2020-06-05 | 2020-06-05 | 一种基于多特征与多分类器的鲜茶叶分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010505288.3A CN111861103B (zh) | 2020-06-05 | 2020-06-05 | 一种基于多特征与多分类器的鲜茶叶分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111861103A CN111861103A (zh) | 2020-10-30 |
CN111861103B true CN111861103B (zh) | 2024-01-12 |
Family
ID=72984994
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010505288.3A Active CN111861103B (zh) | 2020-06-05 | 2020-06-05 | 一种基于多特征与多分类器的鲜茶叶分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111861103B (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112883835B (zh) * | 2021-01-29 | 2022-11-25 | 中南民族大学 | 基于计算机视觉的茶叶品质等级确定方法、装置及设备 |
CN113177103B (zh) * | 2021-04-13 | 2021-12-10 | 广东省农业科学院茶叶研究所 | 基于审评评语的茶叶感官品质的比较方法及系统 |
CN113477555A (zh) * | 2021-07-22 | 2021-10-08 | 西华大学 | 基于图像处理的鲜茶分选机 |
CN113838123B (zh) * | 2021-08-16 | 2024-03-19 | 湖南磐钴传动科技有限公司 | 基于图像处理的烟丝形貌特征的测量方法 |
CN114022714B (zh) * | 2021-11-11 | 2024-04-16 | 哈尔滨工程大学 | 一种基于Harris的数据增强图像分类方法及系统 |
CN115049853A (zh) * | 2022-04-14 | 2022-09-13 | 鼎云(上海)科技有限公司 | 烟叶卷曲不变特性特征提取方法及存储介质 |
CN115439524A (zh) * | 2022-09-07 | 2022-12-06 | 北京爱科农科技有限公司 | 叶片的参数计算方法、介质及计算机设备 |
CN116935235B (zh) * | 2023-09-19 | 2024-04-05 | 深圳市索威尔科技开发有限公司 | 基于采茶无人机的新鲜茶叶识别方法及相关装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107644235A (zh) * | 2017-10-24 | 2018-01-30 | 广西师范大学 | 基于半监督学习的图像自动标注方法 |
CN108154195A (zh) * | 2018-01-19 | 2018-06-12 | 镇江思泊丽农业有限公司 | 茶叶识别方法及使用该方法的茶叶分拣装置 |
CN108664927A (zh) * | 2018-05-10 | 2018-10-16 | 林丽惠 | 基于全自动支持向量机的武夷岩茶叶片图像分类方法 |
CN109308697A (zh) * | 2018-09-18 | 2019-02-05 | 安徽工业大学 | 一种基于机器学习算法的树叶病害识别方法 |
-
2020
- 2020-06-05 CN CN202010505288.3A patent/CN111861103B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107644235A (zh) * | 2017-10-24 | 2018-01-30 | 广西师范大学 | 基于半监督学习的图像自动标注方法 |
CN108154195A (zh) * | 2018-01-19 | 2018-06-12 | 镇江思泊丽农业有限公司 | 茶叶识别方法及使用该方法的茶叶分拣装置 |
CN108664927A (zh) * | 2018-05-10 | 2018-10-16 | 林丽惠 | 基于全自动支持向量机的武夷岩茶叶片图像分类方法 |
CN109308697A (zh) * | 2018-09-18 | 2019-02-05 | 安徽工业大学 | 一种基于机器学习算法的树叶病害识别方法 |
Non-Patent Citations (2)
Title |
---|
基于SVM-KNN茶叶图像纹理分类;燕娅;周晓锋;汤哲;张立;陈华荣;周建勇;;中国茶叶加工(第06期);全文 * |
基于多特征融合的植物叶片识别研究;高良;闫民;赵方;;浙江农业学报(第04期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN111861103A (zh) | 2020-10-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111861103B (zh) | 一种基于多特征与多分类器的鲜茶叶分类方法 | |
Arboleda et al. | Classification of coffee bean species using image processing, artificial neural network and K nearest neighbors | |
CN112418117B (zh) | 一种基于无人机图像的小目标检测方法 | |
CN104091321B (zh) | 适用于地面激光雷达点云分类的多层次点集特征的提取方法 | |
CN105469096B (zh) | 一种基于哈希二值编码的特征袋图像检索方法 | |
Wahab et al. | Detecting diseases in chilli plants using K-means segmented support vector machine | |
CN102842032B (zh) | 基于多模式组合策略的移动互联网色情图像识别方法 | |
CN108197538A (zh) | 一种基于局部特征和深度学习的卡口车辆检索系统及方法 | |
CN102324032B (zh) | 一种基于极坐标系下灰度共生矩阵的纹理特征提取方法 | |
Hong et al. | Comparative study on vision based rice seed varieties identification | |
CN109410238B (zh) | 一种基于PointNet++网络的枸杞识别计数方法 | |
CN110992341A (zh) | 一种基于分割的机载LiDAR点云建筑物提取方法 | |
CN109784392A (zh) | 一种基于综合置信的高光谱图像半监督分类方法 | |
Kaur | Plant leaf disease detection using ensemble classification and feature extraction | |
CN106845528A (zh) | 一种基于K‑means与深度学习的图像分类算法 | |
CN111598163B (zh) | 基于Stacking集成学习方式雷达HRRP目标识别方法 | |
CN109886277B (zh) | 一种基于轮廓分析的茶鲜叶识别方法 | |
CN109002851A (zh) | 一种基于图像多特征融合的水果分类方法及应用 | |
CN108230307B (zh) | 一种基于轮廓质心距离与神经网络的玉米破碎粒检测方法 | |
CN112633082B (zh) | 一种多特征融合杂草检测方法 | |
CN104899595A (zh) | 基于sift特征图像的蚕蛹雌雄分拣和计数装置 | |
CN110929787B (zh) | 一种基于图像的苹果客观定级系统 | |
Feng et al. | Ms-aln: Multiscale attention learning network for pest recognition | |
CN111046838A (zh) | 一种湿地遥感信息的识别方法及装置 | |
CN112014804B (zh) | 一种基于球覆盖的仿生模式识别算法的雷达信号分选方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |