发明内容
针对上述的研究武夷岩茶鲜茶叶叶片图像识别方面存在的问题,本发明提出了基于全自动支持向量机的武夷岩茶叶片图像分类方法,采用武夷岩茶鲜茶叶叶片图像的狭长度、圆形度、矩形度以及矩向量作为武夷岩茶鲜茶叶叶片图像的形状特征;采用灰度共生矩阵法表示武夷岩茶鲜茶叶叶片图像的纹理特征,获得了较好的图像分类效果。
为了实现上述目的,本发明采用以下技术方案:
基于全自动支持向量机的武夷岩茶叶片图像分类方法,包括以下步骤:
步骤1:对武夷岩茶鲜茶叶叶片图像进行预处理:去除拍摄过程中由光照和阴影导致的噪声和边缘模糊问题;将所述图像转换为灰度图,以提取武夷岩茶鲜茶叶叶片图像的纹理特征;将灰度图经过阈值分割、形态学处理得到二值图像,以提取武夷岩茶鲜茶叶叶片图像的形状特征;
步骤2:提取武夷岩茶鲜茶叶叶片图像的形状特征和纹理特征,采用武夷岩茶鲜茶叶叶片图像的狭长度、圆形度、矩形度以及矩向量作为武夷岩茶鲜茶叶叶片图像的形状特征,采用灰度共生矩阵法表示武夷岩茶鲜茶叶叶片图像的纹理特征;
步骤3:利用提取的武夷岩茶鲜茶叶叶片图像的形状特征和纹理特征,对全自动支持向量机分类器进行设计,包括:
步骤3.1:采用改进的RBF核函数参数自动选择方法选择最优的RBF核函数参数σ,用于对武夷岩茶鲜茶叶叶片图像进行分类识别;
步骤3.2:基于最优的RBF核函数参数σ,设计支持向量机的最佳惩罚参数C:首先在粗网格下,初步估计最佳惩罚参数的范围;然后利用细网格,找出在交叉验证法下,各网格值的建议次数;最后将所述建议次数当作各网格值的加权权重进行加权,从而得到最佳的惩罚参数C;
步骤4:通过全自动支持向量机分类器对武夷岩茶鲜茶叶叶片图像进行分类。
进一步地,所述改进的RBF核函数参数自动选择方法为:
假设训练数据集合为其中j为第i类的第j个样本,i=1,2,…L,L为类别数;定义类内距离w(σ)如式(17)所示,定义类间距离b(σ)如式(18)所示,定义类距离JRBF(σ)如式(19)所示:
JRBF(σ)=1-w(σ)+b(σ) (19)
其中,x,x′∈Rd;σ∈R-{0},为RBF核函数参数;R为实数集;Rd为d维实数向量空间。
进一步地,在所述阈值分割之前,还包括:
计算每一幅武夷岩茶鲜茶叶叶片图像的灰度门限。
进一步地,所述矩向量采用Hu不变矩。
进一步地,所述步骤3.2包括:
步骤3.2.1:给定粗网格的范围:
C=2t,t∈{tmin,tmin+1,tmin+2,...,tmax} (21)
步骤3.2.2:将训练数据集的每个类别分成K等分,再利用交叉验证法初步估计最佳惩罚参数的取值范围,即估计C的最小值Cmin及最大值Cmax;
步骤3.2.3:将C的取值范围切成较细的S个网格:
步骤3.2.4:利用交叉验证法,找出细网格中各细网格值的建议次数Pr,r=1,2,...,S,利用所述建议次数针对细网格值进行加权,自动找出最佳的惩罚参数C:
与现有技术相比,本发明具有的有益效果:
本发明将武夷岩茶鲜茶叶叶片图像进行预处理,舍弃提取鲜茶叶叶片的颜色特征,将采集到的彩色茶叶叶片图像转换为灰度图,用以提取纹理特征,消除了同一品种武夷岩茶鲜茶叶叶片在不同的成长时期的不同颜色对分类结果的影响。
本发明采用武夷岩茶鲜茶叶叶片图像的狭长度、圆形度、矩形度以及矩向量作为武夷岩茶鲜茶叶叶片图像的形状特征,由于狭长度、圆形度、矩形度以及矩向量都具有平移、旋转和尺度伸缩等不变性,故以狭长度、圆形度、矩形度以及矩向量作为武夷岩茶鲜茶叶叶片图像的形状特征,且采用灰度共生矩阵法表示武夷岩茶鲜茶叶叶片图像的纹理特征,并采用改进的RBF核函数参数自动选择方法选择最优的RBF核函数参数σ,基于最优的RBF核函数参数σ,设计支持向量机的最佳惩罚参数C,从而使本发明具有较高的识别精度和图像分类效果。
实施例二:
如图2所示,本发明实施例的另一种基于全自动支持向量机的武夷岩茶叶片图像分类方法,包括以下步骤:
步骤S21:对武夷岩茶鲜茶叶叶片图像进行预处理:
为提高鲜茶叶叶片的识别率,首先对武夷岩茶鲜茶叶叶片图像进行预处理,去除拍摄过程中由光照和阴影等导致的噪声和边缘模糊问题。由于同一品种武夷岩茶鲜茶叶叶片在不同的成长时期会有不同的颜色,舍弃提取鲜茶叶叶片的颜色特征,将采集到的彩色茶叶叶片图像转换为灰度图,用以提取纹理特征。然后将灰度图经过阈值分割、形态学处理等步骤得到二值图像,用以提取形状特征。
阈值分割的目的是为了把茶叶叶片与其背景分开并形成二值图像。茶叶叶片图像进行分割前首先要计算每一幅叶片图像的灰度门限,具体步骤见参考文献(RIDLER T W,CALVARD S.Picture Thresholding Using an Iterative Selection Method[J].IEEETransactions on Systems,Man and Cybernetics,1978,8(8):630-632.)的迭代阈值选择法。考虑到有些茶叶叶片可能遭受过虫子的侵蚀,从而在分割后的茶叶叶片图像内部存在小的孔洞,本发明使用形态学处理方法的闭运算消除茶叶叶片图像内部的小孔洞,得到最终的二值图像。
步骤S22:提取武夷岩茶鲜茶叶叶片图像的形状特征和纹理特征:
基于快速和有效识别茶叶叶片的目的,针对武夷岩茶叶片图像的特点,分析并提取武夷岩茶鲜茶叶叶片图像在形状和纹理上的视觉特征,即武夷岩茶鲜茶叶叶片图像的形状特征和纹理特征。
步骤S221:对武夷岩茶鲜茶叶叶片图像的形状特征进行表示:
武夷岩茶鲜茶叶叶片图像的形状特征对判断武夷岩茶所属茶树品种具有重要意义。本发明采用武夷岩鲜茶叶叶片图像的狭长度、圆形度、矩形度以及矩向量作为武夷岩鲜茶叶叶片图像的形状特征,这些特征都具有平移、旋转和尺度伸缩等不变性,对武夷岩茶鲜茶叶叶片图像的识别具有重要意义。下面分别给出上述特征的定义。
狭长度f1:狭长度为茶叶叶片的最小外接矩形的长和宽之比值。利用狭长度可以将细长的茶叶叶片与圆形或方形的茶叶叶片区分开来。定义如(1)所示:
其中,l1和l2分别代表茶叶叶片的最小外接矩形的长和宽。
圆形度f2:圆形度反映了茶叶叶片形状与圆形的接近程度。取值范围为0到1,其值越大,代表茶叶叶片形状与圆形越接近。定义如(2)所示:
其中,A代表茶叶叶片图像的面积,B代表茶叶叶片图像的周长。
矩形度f3:矩形度反映了茶叶叶片形状与其外接矩形的接近程度。其值越接近1,代表茶叶叶片形状越接近矩形。定义如(3)所示:
其中,A为茶叶叶片图像的面积,Z为茶叶叶片图像的最小外接矩形的面积。
Hu不变矩(Hu Invariant Moments)f4-f10:本发明进一步采用描述区域形状的矩向量用以更加细致地表示茶叶叶片的形状。假设茶叶叶片图像f(x,y),p+q阶中心距和归一化的p+q阶中心距分别定义如下:
Hu不变矩构造了7个不变矩(h1-h7)作为形状特征。定义如(6)-(12)所示(RIDLER TW,CALVARD S.Picture Thresholding Using an Iterative Selection Method[J].IEEETransactions on Systems,Man and Cybernetics,1978,8(8):630-632.):
f4=h1=η20+η02 (6)
f5=h2=(η20+η02)2+4η11 2 (7)
f6=h3=(η30-3η12)2+(3η21-η03)2 (8)
f7=h4=(η30+η12)2+(η21+η03)2 (9)
步骤S222:对武夷岩茶鲜茶叶叶片图像的纹理特征进行表示:
武夷岩茶鲜茶叶叶片的纹理特征对判断武夷岩茶所属茶树品种也具有重要意义。本发明采用灰度共生矩阵法表示茶叶叶片图像的纹理特征。计算灰度茶叶叶片图像基于4个生成方向、且距离d为1的灰度共生矩阵的能量、对比度、相关性和同质性的平均值;所述4个生成方向为与水平方向夹角分别为0°、45°、90°、135°。所述距离d表示两个像素点之间的距离;所述距离d为1即两个像素点的距离d为1,即表示两个相邻的像素点。下面分别给出能量、对比度、相关性和同质性的定义。
取图像(N×N)中任意一点(x,y)及偏离它的另一点(x+a,y+b),设点(x,y)及点(x+a,y+b)的点对的灰度值为(m,n),即点(x,y)的灰度值为m,点(x+a,y+b)的灰度值为n。令点(x,y)在整个画面上移动,则会得到各种(m,n)值,设灰度值的级数为k,则(m,n)的组合共有k2种。对于整个画面,统计出每一种(m,n)值出现的次数,然后排列成一个方阵,再用(m,n)出现的总次数将它们归一化为出现的概率P(m,n),这样的方阵称为灰度共生矩阵。
能量f11:能量反应的是茶叶叶片图像纹理均匀分布程度与粗细程度。其值较大,则表示叶片图像灰度分布较集中,纹理比较粗糙;其值较小,则表示茶叶叶片图像灰度分布较均匀,纹理比较细致。定义如(13)所示:
对比度f12:对比度描述茶叶叶片图像的清晰程度。其值较大,代表茶叶叶片图像较清晰,纹理沟纹较深;其值较小,代表茶叶叶片图像较模糊,纹理沟纹较浅。定义如(14)所示:
相关性f13:相关性描述茶叶叶片图像灰度值在水平和垂直方向的相似程度。其值较大,代表茶叶叶片图像灰度共生矩阵元素值在水平或垂直方向上均匀相等;其值较小,代表茶叶叶片图像灰度共生矩阵元素值在水平或垂直方向上差别较大。定义如(15)所示:
μm和μn分别为Pm和Pn的均值,σm和σn分别为Pm和Pn的标准差,Pm和Pn分别为m出现的概率和n出现的概率。
同质性f14:同质性反映茶叶叶片图像局部纹理的变化程度,返回灰度共生矩阵的元素分布到对角线的紧密程度。其值越大,局部纹理变化越少。定义如(16)所示:
步骤S23:利用提取的武夷岩茶鲜茶叶叶片图像的形状特征和纹理特征,对全自动支持向量机分类器进行设计,包括:
步骤S231:采用改进的RBF核函数参数自动选择方法选择最优的RBF核函数参数σ,用于对武夷岩茶鲜茶叶叶片图像进行分类识别;
20世纪90年代根据Vapnik提出的统计学习理论发展而来的支持向量机(SupportVector Machine,SVM),其基于结构风险最小化原则,具有出色的学习性能,泛化能力强,在模式识别领域具有广泛的应用。
RBF核函数参数自动选择方法,在使用支持向量机分类器对所提取的特征进行分类识别过程中,使用不同的核函数,不同的SVM最优分类面将会被产生,从而产生不同的SVM算法。目前常用的核函数有线性核函数(Linear kernel)、多层感知机核函数(MultilayerPerceptron kernel)和径向基核函数(Radial Basis Function kernel)。其中径向基核函数(RBF核函数)具有一些突出的优点,例如参数少、性能良好、适应性广泛等。这些突出优点使得RBF核函数常常成为SVM首选的核函数。同时需要注意的是,核函数参数的选择对SVM分类结果的好坏也起着至关重要的作用。
本发明从支持向量机的核参数的意义出发,使用一种改进的RBF核函数参数自动选择方法,选择最优的RBF核函数参数σ,用于对武夷岩茶鲜茶叶叶片图像的分类识别。改进的RBF核函数参数自动选择方法已经被应用到SVM(LI C H,HO H H,LIU Y L,et al.AnAutomatic Method for Selecting the Parameter of the Normalized KernelFunction to Support Vector Machines[J].Journal of Information Science andEngineering,2012,28(1):1-15.)和GDA(LI C H,KUO B C,LIN L H,et al.Apply anautomatic parameter selection method to generalized discriminant analysiswith RBF kernel for hyperspectral image classification.[C]//Proceedings ofthe 2013International Conference on Machine Learning and Cybernetics.TianjinChina,2013,7:253-258.),并且已经证明,改进的RBF核函数参数自动选择方法能在几秒之内找到最优的RBF核函数参数σ并且提高分类性能。
改进的RBF核函数参数自动选择方法描述如下:
假设训练数据集合为其中j为第i类的第j个样本,i=1,2,…L,L为类别数。不同的RBF核函数参数决定了不同的类内和类间距离。定义类内距离w(σ)如(17)所示,定义类间距离b(σ)如(18)所示,定义类距离JRBF(σ)如(19)所示:
JRBF(σ)=1-w(σ)+b(σ) (19)
其中,x,x′∈Rd,σ∈R-{0}为RBF核函数,R为实数集,Rd为d维实数向量空间。这样,能使JRBF(σ)的值达到最小值(接近0)的σ值就是最优的RBF核函数参数σ。最优的RBF核函数参数σ能使类内距离w(σ)的值接近1,同时使类间距离b(σ)的值接近0。反映在特征空间,就是同类的样本投影到球面的距离足够小,不同类的样本投影到球面的距离足够大。
步骤S232:基于最优的RBF核函数参数σ,设计支持向量机的最佳惩罚参数C,对分类识别精度进行调整:
虽然RBF核函数参数自动选择方法可以在几秒内即决定最佳的RBF核函数参数,然而,对于武夷岩鲜茶叶叶片图像的分类问题,在RBF核函数参数σ下,SVM搭配不同的惩罚参数C,会影响分类的结果。以图3为例,其横轴代表惩罚参数C的值,其中:
C=2t,t∈{-10,-9,-8,...,50} (20)
纵轴代表在不同惩罚参数C下,武夷岩茶叶片分类的正确率。由图3不难发现,对于武夷岩茶叶片的分类问题,过小的惩罚参数,其分类正确率虽然有超过78%,但若增加惩罚参数的值,其分类正确率会慢慢增加,大约在t=20(C=220)左右正确率达到最高,然后开始下降。因此在使用SVM时,除了RBF核函数参数需要自动选择外,惩罚参数也应该有一个准确且有效率的选择方式。
本发明导入多重网格概念,首先在粗网格下,初步估计最佳的惩罚参数的取值范围。然后再利用细网格,找出在交叉验证法下,各网格值的建议次数。最后再将此建议次数当作各网格值的加权权重进行加权,即可得到最佳的惩罚参数C。其详细步骤如下:
步骤S2321:给定粗网格的范围,使用
C=2t,t∈{tmin,tmin+1,tmin+2,...,tmax} (21)
t为最佳的惩罚参数C的取值范围选定参数,用于决定最佳的惩罚参数C的可能取值范围;
步骤S2322:将训练数据集的每个类别分成K等分,再利用交叉验证法(K-foldCross validation)初步估计最佳惩罚参数的取值范围,也就是说C∈[Cmin,Cmax]。此步骤将可以保证,在此范围内的惩罚参数,会具有不错的分类正确率。
步骤S2323:将此范围切成较细的S个网格(包含Cmin与Cmax),也就是说将从下面细网格中找出最佳的惩罚参数:
步骤S2324:利用交叉验证法,找出细网格中,各细网格值被推荐的次数Pr,r=1,2,...,S。最后,再利用此推荐次数针对细网格值进行加权,自动找出最佳的惩罚参数C。因此,
利用交叉验证准确率来自动决定最佳惩罚参数C。最佳的惩罚参数C是以分类结果的准确率为依据的。对应分类结果准确率最高的惩罚参数C即为最佳惩罚参数。
步骤S24:通过全自动支持向量机分类器对武夷岩茶鲜茶叶叶片图像进行分类。
本发明通过实地采集武夷岩茶中最具典型代表性的肉桂、水仙2个品种共计3590张鲜茶叶叶片图像作为待分类输入图像(其中肉桂鲜茶叶叶片图像1748张,水仙鲜茶叶叶片图像1842张),并通过一系列实验分析本发明方法的有效性。
为比较本发明设计的全自动支持向量机和SVM其它核函数算法对武夷岩茶鲜茶叶叶片图像的分类识别效果,本发明使用50%的叶片图像作为训练样本,50%的叶片图像作为测试样本,对提取的14种基于形状和纹理的叶片图像特征(f1,f2,…f14),分别使用全自动支持向量机和SVM其它核函数算法进行分类识别,比较各种SVM算法的识别精度,识别精度取10次实验的平均值。
表1列出了SVM线性核函数(Linear)、SVM多层感知机核函数(MLP)、SVM径向基核函数(RBF参数未优化)和使用了本发明设计的全自动支持向量机分类器的算法识别率。实验结果表明,使用RBF核函数比使用线性核函数(Linear)和SVM多层感知机核函数(MLP)获得了更高的识别率,而且本发明设计的全自动支持向量机分类器比RBF参数未优化时获得了更高的识别率,识别率达90.06%。
由于本发明对武夷岩茶中最具典型代表性的肉桂、水仙鲜茶叶叶片图像进行识别是一个二分类问题,为了进一步对各种SVM算法进行评价,本发明使用ROC曲线对各种SVM算法的分类性能进行评估,如图4所示。本发明将肉桂鲜茶叶叶片图像视为正类(positive),水仙鲜茶叶叶片图像视为负类(negative)。如果将肉桂鲜茶叶叶片图像识别为肉桂,则为真正类(TP);如果将水仙鲜茶叶叶片图像识别为肉桂,则为假正类(FP);如果将水仙鲜茶叶叶片图像识别为水仙,则为真负类(TN);如果将肉桂鲜茶叶叶片图像识别为水仙,则为假负类(FN)。我们将分类器所识别出的正类图像占所有正类图像的比例称为真正类率(truepositive rate,TPR),将分类器错认为正类的负类图像占所有负类图像的比例称为负正类率(false positive rate,FPR)。其中TPR=TP/(TP+FN),FPR=FP/(FP+TN)。ROC曲线横轴表示负正类率(FPR),纵轴表示真正类率(TPR)。所以,一个好的分类模型的ROC曲线应该尽可能靠近图形的左上角。使用全自动支持向量机和其它3种SVM算法对应的ROC曲线图如图4所示。由图4可知,本发明设计的全自动支持向量机分类器的ROC曲线最靠近图形的左上角,故分类效果最好。
表1使用全自动支持向量机和其它3种SVM算法获得的识别率
本发明提取了武夷岩茶中最具典型代表性的肉桂、水仙鲜茶叶叶片图像基于形状和纹理的14种图像特征,为了分析各种特征对鲜茶叶叶片分类识别率的贡献程度,获取对武夷岩茶鲜茶叶叶片图像进行分类识别的关键特征,本发明做了如下实验。将本发明提取的14种特征分为3组,第1组特征为形状特征(f1,f2,f3),这部分包括狭长度、圆形度和矩形度,能在一定程度上描述茶叶叶片的形状特性,但是这种表示较粗略一点。第2组特征为形状特征(f4,f5,…f10),这部分采用7个Hu不变矩向量来进一步描述区域形状,能更加具体地描述茶叶叶片的形状特性。第3组特征为纹理特征(f11,f12,f13,f14),这部分包括能量、对比度、相关性和同质性,能精确地反映纹理的粗糙程度和重复方向,定量、准确反映图像的纹理特征。本发明分别使用这3组特征以及3组特征的各种组合,应用全自动支持向量机分类器,实现对武夷岩茶鲜茶叶叶片图像的分类识别,比较各种不同类型特征对鲜茶叶叶片分类识别率的贡献程度。
表2列出了各种不同类型特征组合对鲜茶叶叶片图像所获得的识别率。识别率均取10次实验的平均值,每次实验均使用50%的叶片图像作为训练样本,50%的叶片图像作为测试样本。从表2的结果可以看出,本发明提取的3组特征,均能有效识别鲜茶叶叶片图像,其中第3组纹理特征获得更高的识别率,效果明显好于前面2组形状特征。第2组形状特征获得的识别率又好于第1组形状特征。形状特征和纹理特征的组合,比单独使用形状特征或者单独使用纹理特征,都具有更好的识别效果。但是实验结果表明,使用第1组特征和第2组特征的组合①+②获得的识别率比单独使用第2组特征获得的识别率更低。使用3组特征的组合①+②+③获得的识别率(90.06%)比使用第2组特征和第3组特征的组合②+③获得的识别率(91.00%)低。这说明并不是特征提取越多,识别率一定就能提高。有一部分特征的加入,反而使得整体识别率下降,例如本发明的第1组特征。由此得出以下结论:武夷岩茶鲜茶叶叶片分类识别过程中的关键特征为第2组特征和第3组特征的组合,即7个Hu不变矩向量和灰度共生矩阵4个方向(与水平方向夹角分别为0°、45°、90°、135°)的能量、对比度、相关性和同质性的平均值。使用本发明获取的关键特征能提高武夷岩茶鲜茶叶叶片的识别率,识别率达91.00%。使用7种不同类型特征组合对应的ROC曲线图如图5所示。由图5可知,本发明设计的14种图像特征(f1,f2,…f14)中②+③即形状特征(f4,f5,…f10)+纹理特征(f11,f12,f13,f14)对应的ROC曲线最靠近图形的左上角,即形状特征(f4,f5,…f10)+纹理特征(f11,f12,f13,f14)为对武夷岩茶鲜茶叶叶片图像进行分类识别的关键特征。
表2使用7种不同类型特征组合获得的识别率
以上所示仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。