CN105654107B

CN105654107B - 一种基于svm的有形成分分类方法

Info

Publication number: CN105654107B
Application number: CN201510603254.7A
Authority: CN
Inventors: 任迪; 唐松
Original assignee: Deary Medical Technology Co Ltd
Current assignee: Deary Medical Technology Co Ltd
Priority date: 2015-09-21
Filing date: 2015-09-21
Publication date: 2020-01-17
Anticipated expiration: 2035-09-21
Also published as: CN105654107A

Abstract

本发明公开了一种基于SVM的有形成分分类方法。所述方法包括：SVM训练阶段：A、获取包含有若干种有形成分的样本图片作为训练样本；B、将所述样本图片分割为若干有形成分图像；C、提取所述有形成分图像的图像特征并依据所述图像特征，将所述有形成分图像进行分类，构建具有若干个级联有形成分图片库；D、构建若干个级联SVM分类器并使用相应的有形成分图片库进行训练，以及有形成分识别分类阶段：E、提取待识别分类的有形成分图像的图像特征；F、依据所述图像特征，将有形成分图像分派至相应的SVM分类器中进行识别分类。采用了多个级联的SVM分类器对有形成分图形进行多层次的分类，从而有效的提高了SVM分类器对于有形成分的分类准确性。

Description

一种基于SVM的有形成分分类方法

技术领域

本发明涉及图像识别技术领域，尤其涉及一种基于SVM的有形成分分类方法。

背景技术

图像识别技术是近几年来比较热门的一种技术。不管是车牌识别还是人脸识别或者指纹识别或者细胞识别，其识别的对象比较单一，而且大多数情况下是基于神经网络来实现识别分类的。神经网络是模拟人的神经，是对人脑认识行为的一个简化描述，没有完备的理论体系，容易陷入局部极小值。

SVM亦即支持向量机，其在小样本训练集上能够得到比其它算法好很多的结果，是目前最常用、效果最好的分类器之一。其具有完备的理论体系，是基于结构风险最小化理论，其解是全局最优解。但现有的SVM识别分类算法在对于显微系统获得的图像中有形成分的分类识别的应用上还不完备，其分类的准确性也有提高的空间。

因此，现有技术还有待发展。

发明内容

鉴于上述现有技术的不足之处，本发明的目的在于提供一种基于SVM的有形成分分类方法，旨在解决现有SVM识别分类算法在有形成分的分类识别的应用上不完备，准确率有限的问题。

为了达到上述目的，本发明采取了以下技术方案：

一种基于SVM的有形成分分类方法，其中，所述方法包括：SVM训练阶段：A、获取包含有若干种有形成分的样本图片作为训练样本；B、将所述样本图片分割为若干有形成分图像；C、提取所述有形成分图像的图像特征并依据所述图像特征，将所述有形成分图像进行分类，构建具有若干个级联有形成分图片库；D、构建若干个级联SVM分类器并使用相应的有形成分图片库进行训练；以及有形成分识别分类阶段：E、提取待识别分类的有形成分图像的图像特征；F、依据所述图像特征，将有形成分图像分派至相应的SVM分类器中进行识别分类。

所述的有形成分分类方法，其中，所述步骤B具体包括：

对所述样本图片进行高斯滤波；

使用Sobel算子对高斯滤波后图像进行边缘检测，获得样本图片的梯度图像；

对所述梯度图像进行二值化，形成二值化图像；

使用区域生长法对所述二值化图像进行图像分割，获得若干有形成分图像。

所述的有形成分分类方法，其中，所述若干种有形成分包括上皮细胞、线索细胞、滴虫、白细胞、红细胞、霉菌、杆菌、精子、脂肪滴以及人造物。

所述的有形成分分类方法，其中，所述步骤C具体包括：

依据预设的尺寸阈值，将尺寸大于所述尺寸阈值的有形成分图像放入大颗粒训练库中，将尺寸小于所述尺寸阈值的有形成分图像放入小颗粒训练库中；

通过人工筛选，将大微粒训练库分为五类，作为大微粒SVM第一层训练库；其中第一类包含鳞状上皮细胞、线索细胞；第二类包含底层上皮、滴虫；第三类包含霉菌、白细胞团；第四类包含杆菌、精子；第五类包含人造物；

将大微粒SVM第一层训练库输入的第一类再人工筛选为三类作为大微粒SVM第二层第一类训练库输入，其中第一类包含鳞状上皮细胞；第二类包含线索细胞；第三类为人造物；

将大微粒SVM第一层训练输入的第二类再人工筛选为三类作为大微粒SVM第二层第二类训练库输入，其中第一类包含底层上皮；第二类包含滴虫；第三类为人造物；

将大微粒SVM第一层训练输入的第三类再人工筛选为三类作为大微粒SVM第二层第三类训练库输入，其中第一类包含霉菌；第二类包含白细胞团；第三类为人造物；

将大微粒SVM第一层训练输入的第四类再人工筛选为三类作为大微粒SVM第二层第四类训练库输入，其中第一类包含杆菌；第二类包含精子；第三类为人造物；

通过人工筛选，将小微粒训练库分为四类，作为小微粒SVM第一层训练库输入，其中，第一类包含圆形的白细胞、红细胞、滴虫、霉菌、脂肪滴；第二类包含线形的杆菌、精子；第三类包含非圆形和线形的小微粒有形成分；第四类包含人造物；

将小微粒SVM第一层训练输入的第一类再人工筛选为六类作为小微粒SVM第二层第一类训练库输入，其中第一类包含白细胞；第二类包含红细胞；第三类滴虫；第四类包含霉菌；第五类包含脂肪滴；第六类包含人造物；

将小微粒SVM第一层训练输入的第二类再人工筛选为三类作为小微粒SVM第二层第二类训练库输入，其中第一类包含杆菌；第二类包含精子；第三类包含人造物；

将小微粒SVM第一层训练输入的第三类再人工筛选为六类作为小微粒SVM第二层第三类训练库输入，其中第一类包含白细胞；第二类包含红细胞；第三类滴虫；第四类包含霉菌；第五类包含杆菌；第六类包含人造物。

所述的有形成分分类方法，其中，所述级联SVM分类器具体包括与所述大微粒SVM第一层训练库相对应的大颗粒第一层SVM分类器、与所述小微粒SVM第一层训练库相对应的小颗粒第一层SVM分类器、与所述大微粒SVM第二层第一至四类训练库相对应的大颗粒第二层第一至四类SVM分类器以及与所述小微粒SVM第二层第一至四类训练库相对应的小颗粒第二层第一至四类SVM分类器。

所述的有形成分分类方法，其中，所述步骤F具体包括：计算有形成分图像的图像特征并进行归一化；将归一化后的特征向量映射变换为高维空间的特征向量；依据有形成分图像的尺寸，分派至相对应的大颗粒或者小颗粒第一层次SVM分类器中；通过所述大颗粒或者小颗粒第一层次SVM分类器进行类别判定；依据类别判定结果，分派至对应类别的第二层次SVM分类器中进行识别；输出有形成分图像的分类识别结果

所述的有形成分分类方法，其中，所述步骤D具体包括：选择预定的训练特征；计算每类有形成分的训练特征，并确定每一训练特征的最大值和最小值；将所述训练特征归一化至【-1，1】的范围内；将归一化后的训练特征映射变换为高维空间中的特征向量；构造所述SVM分类器的目标函数；进行训练从而获得最优的SVM分类器。

所述的有形成分分类方法，其中，所述“将归一化后的训练特征映射变换为高维空间中的特征向量”的步骤具体为：，将归一化后的训练特征向量经如下公式映射变换为高维空间中的特征向量；

其中，

为归一化后的训练特征向量，

为特征内积，X＝(x₁，x₂，x₃，...，x_n)为高维空间中的特征向量。

所述的有形成分分类方法，其中，所述“构造所述SVM分类器的目标函数”的步骤具体为：

在所述高维空间中确定一个使得两类目标的几何间隔达到最大的最优超平面；

所述几何间隔最大时的约束条件为：

y_i[(W^TX)+b]-1+ξ_i≥0

其中，y_i表示分类标签，W^T为系数矩阵，X为特征向量，b为截矩矩阵，ξ_i表示允许错分样本存在的非负松弛变量；

所述目标函数具体为：

其中，C＞0为自定义惩罚因子。

所述的有形成分分类方法，其中，所述大颗粒SVM及小颗粒SVM第一层训练库的训练特征包括：面积、形状系数、面积周长比、长宽比、轮廓角点数、轮廓角点分布、灰度均值、灰度方差、轮廓半径标准差、轮廓半径最小值、轮廓半径最大值、能量、中心圆内平均FFT、中心圆外平均FFT；

所述大颗粒SVM及小颗粒SVM第二层训练库的训练特征包括：面积、形状系数、面积周长比、长宽比、轮廓角点数、轮廓角点分布、灰度均值、灰度方差、轮廓半径标准差、轮廓半径最小值、轮廓半径最大值、能量、二阶矩、相关性、对比度、逆差矩、和方差、小梯度优势、大梯度优势、能量、灰度熵、梯度熵、惯性。

有益效果：本发明提供的一种基于SVM的有形成分分类方法，提供了一个基于SVM识别分类算法进行显微系统获取图像的有形成分识别分类的完整技术方案，能够良好的应用于有形成分的识别分类中。

采用SVM分类器的方式，与神经网络分类器相比，需要的训练样本数目大大减少，并且能够得到全局最优解，不会陷入局部极小值中。另外，还采用了多个级联的SVM分类器对有形成分图形进行多层次的分类，从而有效的提高了SVM分类器对于有形成分的分类准确性。

附图说明

图1为本发明具体实施例的基于SVM的有形成分分类方法的方法流程图。

图2为本发明具体实施例的基于SVM的有形成分分类方法的样本图像处理过程的方法流程图。

图3为本发明具体实施例的基于SVM的有形成分分类方法的区域生长法的方法流程图。

图4为本发明具体实施例的样本图片的分割结果示意图。

图5为本发明具体实施例的红细胞图像处理过程的示意图。

图6为本发明具体实施例的基于SVM的有形成分分类方法的SVM分类器的训练过程的方法流程图。

图7为本发明具体实施例的基于SVM的有形成分分类方法的有形成分图像识别分类的方法流程图。

图8为本发明具体实施例的有形成分分类方式示意图。

具体实施方式

本发明提供一种基于SVM的有形成分分类方法。为使本发明的目的、技术方案及效果更加清楚、明确，以下参照附图并举实施例对本发明进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。

如图1所示，为本发明具体实施例的基于SVM的有形成分分类方法。所述方法具体可以分为SVM训练阶段以及有形成分识别分类两个阶段。

其中，所述SVM训练阶段包括：

S1、获取包含有若干种有形成分的样本图片作为训练样本。所述样本图片具体是指包含有多种细胞或者其他有形成分的医学显微图像，例如各类分泌物的显微图像等等。

具体的，所述若干种有形成分可以包括上皮细胞、线索细胞、滴虫、白细胞、红细胞、霉菌、杆菌、精子、脂肪滴以及人造物等等一些出现在分泌物的显微图像中的有形成分。

S2、将所述样本图片分割为若干有形成分图像。

具体的，如图2所示，所述步骤S2可以包括：

S21、灰度化图像。

S22、对灰度化后的样本图片进行高斯滤波。以分泌物样本图片f为例，使用

正态分布(高斯函数)计算滤波模板，并使用该模板与原图像做卷积运算，得到滤波后图像

S23、使用Sobel算子对高斯滤波后图像g进行边缘检测，获得样本图片的梯度图像其中，所述Sobel算子模板具体可以为：

或者

S24、对所述梯度图像T进行二值化，形成二值图像B。所述二值化具体可以通过如下步骤实现：

首先，计算梯度分布直方图pHist[256]

for i＝0；i＜nHeight*nWidth；i++

pHist[T[i]]++

其中，nHeight为梯度图像高，nWidth为梯度图像宽，T[i]为梯度图像各个点处像素值。

然后，计算梯度直方图pHist最大峰值处所对应的灰阶值nPixValue

nMax＝0

for i＝0；i＜256；i++

if(pHist[i]＞nMax)nMax＝pHist[i]；nPixValue＝i

通过如下算式计算二值化阈值

nThreshold＝nPixValue*α

其中，α∈(0，1)；

若梯度图像某点处像素值大于上述阈值，则将其上、下、左、右四点处像素值置为1，否则为0。具体计算算式如下：

其中，B(i，j)为二值图像。

利用区域生长法对所述二值化图像进行图像分割，获得若干有形成分图像。所述区域生长方法是根据同一物体区域内象素的相似性质来聚集象素点的方法。从初始区域(如小邻域或甚至于每个象素)开始，将相邻的具有同样性质的象素或其它区域归并到目前的区域中从而逐步增长区域，直至没有可以归并的点或其它小区域为止。在没有先验知识的情况下，可以使用区域生长法来确定在有形成分在样本中的具体区域。如图5所示，为红细胞的图像处理过程的示意图，包括原始图像、梯度图像、二值化图以及边界图。

具体的，所述区域生长法的实现方法如下：

S25、对二值化图像采用八邻域区域生长法，依据左下、下、右下、右、右上、上、左上、左八个方向去找连通点进行连通区域寻找(亦即连通搜寻)，空洞填充、去除面积过大或者过小的区域并确定有形成分区域(亦即有形成分矩形位置的区域)。八邻域如下表格所示：

7	6	5
			8	P	4
1	2	3

其中，P为二值图像某个位置处像素，1为其左方角点，2为其下方点，3为其右下方点，4为其右方点，5为其右上方点，6为其上方点，7为其左上方点，8为其左方点。

如图3所示，具体实现步骤为：创建一幅和二值图像一样尺寸的图片，像素数据全部初始化为0，从起始前景点(值为1)扫描图像，将该点压栈(B1)，并将该点对应的副本图片上像素值置为1。

遍历上述压栈点周围八邻域点(左下、下、右下、右、右上、上、左上、左)像素(B2)，如果值为1，将上述点出栈，并将邻域点压栈，同时将该邻域点对应副本图片上像素值置为255(B3)。重复该步操作直至栈为空(B4)。

S26、依据生成的有形成分的矩形区域，分割为相应的有形成分图像。

S27、在完成上述步骤后，还可以继续判断获得的图像结果是否需要继续进行分割，若是，则重复执行步骤。如图4所示，为本发明具体实施例的样本图片的分割结果。

S3、提取所述有形成分图像的图像特征并依据所述图像特征，将所述有形成分图像进行分类，构建具有若干个级联有形成分图片库。

在本发明的具体实施例中，所述分类的标准具体可以采用如下标准：

首先，依据预设的尺寸阈值，将尺寸大于所述尺寸阈值的有形成分图像放入大颗粒训练库中，将尺寸小于所述尺寸阈值的有形成分图像放入小颗粒训练库中。

然后，在分别对大颗粒和小颗粒训练库中的内容进行进一步的细分。具体为：

对于大颗粒训练库，通过人工筛选，将大微粒训练库分为五类，作为大微粒SVM第一层训练库；其中第一类包含鳞状上皮细胞、线索细胞；第二类包含底层上皮、滴虫；第三类包含霉菌、白细胞团；第四类包含杆菌、精子；第五类包含人造物。

将大微粒SVM第一层训练库输入的第一类再人工筛选为三类作为大微粒SVM第二层第一类训练库输入，其中第一类包含鳞状上皮细胞；第二类包含线索细胞；第三类为人造物。

将大微粒SVM第一层训练输入的第二类再人工筛选为三类作为大微粒SVM第二层第二类训练库输入，其中第一类包含底层上皮；第二类包含滴虫；第三类为人造物。

将大微粒SVM第一层训练输入的第三类再人工筛选为三类作为大微粒SVM第二层第三类训练库输入，其中第一类包含霉菌；第二类包含白细胞团；第三类为人造物。

将大微粒SVM第一层训练输入的第四类再人工筛选为三类作为大微粒SVM第二层第四类训练库输入，其中第一类包含杆菌；第二类包含精子；第三类为人造物。

另外，对于小颗粒训练库，通过人工筛选，将小微粒训练库分为四类，作为小微粒SVM第一层训练库输入，其中，第一类包含圆形的白细胞、红细胞、滴虫、霉菌、脂肪滴；第二类包含线形的杆菌、精子；第三类包含非圆形和线形的小微粒有形成分；第四类包含人造物。

将小微粒SVM第一层训练输入的第一类再人工筛选为六类作为小微粒SVM第二层第一类训练库输入，其中第一类包含白细胞；第二类包含红细胞；第三类滴虫；第四类包含霉菌；第五类包含脂肪滴；第六类包含人造物。

将小微粒SVM第一层训练输入的第二类再人工筛选为三类作为小微粒SVM第二层第二类训练库输入，其中第一类包含杆菌；第二类包含精子；第三类包含人造物。

通过上述分类方法，可以形成如图8所示的多个级联的有形成分图片库(集合)用于SVM分类器的训练。

S4、构建若干个级联SVM分类器并使用相应的有形成分图片库进行训练。

与上述具体实施例中的级联的有形成分图片库相对应地，所述级联SVM分类器具体可以包括与所述大微粒SVM第一层训练库相对应的大颗粒第一层SVM分类器、与所述小微粒SVM第一层训练库相对应的小颗粒第一层SVM分类器、与所述大微粒SVM第二层第一至四类训练库相对应的大颗粒第二层第一至四类SVM分类器以及与所述小微粒SVM第二层第一至四类训练库相对应的小颗粒第二层第一至四类SVM分类器。

在本发明的一具体实施例中，如图6所示，所述训练过程具体为：

S41、选择合适的训练特征。

将有形成分大小微粒以有形成分尺寸nSize界定，如果nSize＞150

则判断该有形成分为大微粒，反之为小微粒；

nSize＝Max(nWidth，nHeight)

其中，nHeight为有形成分高，nWidth为有形成分宽。

对于大颗粒SVM及小颗粒SVM第一层训练库，其训练特征包括：面积、形状系数、面积周长比、长宽比、轮廓角点数、轮廓角点分布、灰度均值、灰度方差、轮廓半径标准差、轮廓半径最小值、轮廓半径最大值、能量、中心圆内平均FFT、中心圆外平均FFT；

而对于所述大颗粒SVM及小颗粒SVM第二层训练库，其训练特征则包括：面积、形状系数、面积周长比、长宽比、轮廓角点数、轮廓角点分布、灰度均值、灰度方差、轮廓半径标准差、轮廓半径最小值、轮廓半径最大值、能量、二阶矩、相关性、对比度、逆差矩、和方差、小梯度优势、大梯度优势、能量、灰度熵、梯度熵、惯性。

S42、计算每类有形成分的所有特征，确定出每类有形成分中每一列特征的最大值fMax和最小值fMin，将所有特征归一化到【-1，1】范围内，归一化公式为：

其中，fValue为要归一化的值，fScale为归一化后的特征。

记归一化后的特征向量为特征内积为

经

映射变换为高维空间里面的特征，记为X＝(x₁，x₂，x₃，...，x_n)。

S43、构造SVM分类器的目标函数。SVM多分类，本质上也是二分类，如果有K类，则需要

类之间进行两两比较。为了将两类目标分离出来，在高维空间中，我们需要找到一个最优超平面，使得这两类目标的几何间隔达到最大。几何间隔最大时的约束条件为：

y_i[(W^TX)+b]-1+ξ_i≥0

其中，y_i表示分类标签，W^T为系数矩阵，X为特征向量，b为截矩矩阵，ξ_i表示允许错分样本存在的非负松弛变量。寻优目标函数为：

其中，C＞0为自定义惩罚因子。自定义惩罚因子的值越大，对错分样本的约束程度就越大。

S44、训练获得最优的SVM模型。对SVM训练的过程亦即是不断的寻优求解过程。为求所述目标函数的最小泛函值，构造Lagrange函数：

其中，α_i为各样本对应的Lagrange系数。

在约束条件：

Σy_iα_i＝0

0≤α_i≤C

下计算

最大值时的解α_i以及支持向量X_i。

上述函数存在唯一解，假设

为最优解，则最优超平面的系数矩阵为：

系数矩阵计算完成后，计算截矩矩阵：

其中，X^*(+1)、X^*(-1)表示两类中任意一个支持向量。

通过上述的步骤，可以得到训练后的多个级联SVM分类器用于后续的有形成分图像的识别分类。

如图1所示，所述有形成分识别分类阶段则包括：

A1、提取待识别分类的有形成分图像的图像特征。对于有形成分图像的各种图像特征的计算方法具体如下所述：

面积：有形成分二值图像中微粒区域像素点数，记为S。

周长：有形成分二值图像中包围微粒区域的边界像素点数，记为l。

形状系数：θ＝l²/S。

面积周长比：f＝S/l。

长宽比：有形成分区域最小外接矩形长边与短边的比值，记有形成分区域最小外接矩形长边为m，短边为n，则长宽比e＝m/n

角点：利用水平差分算子S_x、竖直差分S_y算子对有形成分灰度图像g进行滤波得到T_x和T_y：

计算

中四个元素的值，然后再对四个元素进行高斯平滑滤波，对每一个元素图片m_i进行高斯滤波，使用

正态分布(高斯函数)计算滤波模板，并使用该模板与原图像做卷积运算，得到滤波后图像接着计算角点响应量

如果该点的局部极大值存在，并且该点的角点响应量大于设定阈值nLimit，

则该点为角点。

灰度均值：微粒连通区域所有像素的灰度值的平均值。记微粒连通区域的点集合为{p₁，p₂，p₃，...，p_n}，灰度值为{x₁，x₂，x₃，...，x_n}，则灰度均

值为

nAvg＝(Σx_i)/n。

灰度方差：连通区域所有像素的灰度值的方差。记连通区域的点集合为{p₁，p₂，p₃，...，p_n}，灰度值为{x₁，x₂，x₃，...，x_n}，则灰度方差为

nVari＝(∑(x_i-nAvg)²)/n。

轮廓半径信息：记轮廓点集合为{b₁，b₂，b₃，...，b_n}，质心为(x₀，y₀)，则轮廓半径集合为{d₁，d₂，d₃，...，d_n}，其中

轮廓半径均值为：

μ_i＝(∑d_i)/n；

轮廓半径标准差为：

轮廓半径最大值为：

d_max＝max{d₁,d₂,d₃,...,d_n}；

轮廓半径最小值为：

d_min＝min{d₁，d₂，d₃，...，d_n}。

频域FFT计算：将图像应用快速傅里叶变换(FFT)转换到频域,幅度的平方称为能量谱。由于幅度决定了一幅图像中含有的各种频率分量的多少,故可以用能量谱来表征频域特征。频域计算需要用到傅立叶变换，其公式为：设f(x，y)为图像(x，y)处像素值，其傅里叶变换用F(u，v)表示，则有：

其中，M、N分别为图像的宽和高。

对于图像进行傅立叶变换，运算量很大，一般都通过快速傅里叶变换来减少计算量。具体算法如下：

图像数据复数化处理，存入缓存。

纵向一维快速傅里叶变换，具体包含两步：数据序列逆序；对逆序后数据进行蝶形计算。

横向一维快速傅里叶变换。

计算频谱图，并输出。

FFT变换后，可以计算图像中心为圆心的某个圆内部的能量谱为：

圆外部的能量谱为：

二阶矩：二阶矩是图像灰度分布均匀性的度量。当灰度共生矩阵中的元素分布较集中于主对角线时，说明从局部区域观察图像的灰度分布是均匀的。从图像整体观察发现，纹理较粗，此时二阶矩值则较大，反过来则二阶矩值较小。二阶矩也是灰度共生矩阵像素值平方的和，所以它也称为能量。粗纹理二阶矩值较大，可以理解为粗纹理含有较多的能量。细纹理较小，也即它含有较小的能量，计算如下：

f₁＝ΣΣp_δ ²(i，j)

相关性：相关能够被用来衡量灰度共生矩阵的元素在行的方向或列的方向的相似程度，计算如下：

其中，

μ₁＝∑i∑ijp_δ(i，j)

μ₂＝∑j∑ijp_δ(i，j)

σ₁ ²＝Σ(i-μ₁)²Σp_δ(i，j)

σ₂ ²＝Σ(j-μ₂)²Σp_δ(i，j)

熵：熵值是图像具有的信息量的度量，纹理信息是图像信息的一种。若图像没有任何纹理，则灰度共生矩阵几乎为零阵，熵值接近为0。如果图像充满着细纹理，该图像的熵值最大。若图像中分布着较少的纹理，的数值差别较大，则该图像的熵值就较小，计算如下：

f₃＝-ΣiΣp_δ(i，j)logp_δ(i，j)

对比度：图像的对比度可以理解为图像的清晰度，即纹理的清晰程度。在图像中，纹理的沟纹越深，则其对比度越小，图像的视觉效果就会越清晰，计算如下：

f₄＝Σ(ΣΣ|i-j|²p_δ(i，j))

逆差矩：

和方差：

灰度-梯度共生矩阵特征：灰度－梯度共生矩阵法是灰度级直方图和边缘直方图的结合，它考虑的是像素级灰度和边缘梯度大小的联合统计分布。灰度直方图是一幅图像灰度在图像中分布的最基本统计信息，而图像的梯度捡出了图像中的灰度跳变部分。将图像的梯度信息加进灰度共生矩阵，则使得共生矩阵更能包含图像的纹理基元及其排列的信息。灰度－梯度共生矩阵常用的特征参数有：

1)小梯度优势：

2)大梯度优势：

3)能量：

4)灰度熵：

T₄＝-ΣΣH(i，j)logΣH_j(i，j)

5)梯度熵：

T₅＝-∑∑H(i,j)log∑H_i(i,j)

6)惯性：

T₅＝∑∑(i-j)²H(i，j)

A2、依据所述图像特征，将有形成分图像分派至相应的SVM分类器中进行识别分类。

具体的，如图7所示，所述步骤A2具体包括：

A21、计算有形成分图像的图像特征并进行归一化。

A22、将归一化后的特征向量映射变换为高维空间的特征向量。

A23、依据有形成分图像的尺寸，确定其属于大颗粒还是小颗粒部分，然后将其分派至相对应的大颗粒或者小颗粒第一层次SVM分类器中。

例如，设其被派至分支S_i里面，记分支S_i的SVM第一层分类判别函数为：

其中，α₁ ^*为第一层系数矩阵，b₁ ^*为第一层截矩矩阵，

为第一层支持向量集里面的某一个向量，

为该向量的分类标签。

A24、通过所述大颗粒或者小颗粒第一层次SVM分类器进行类别判定；依据类别判定结果，分派至对应类别的第二层次SVM分类器中进行识别。例如，假设经过第一层分类判别后，其进入的类别为C_i，记C_i的SVM第二层分类判别函数为：

其中，α₂ ^*为第二层系数矩阵，b₂ ^*为第二层截矩矩阵，

为第二层支持向量集里面的某一个向量，

为该向量的分类标签。

A25、输出最终的有形成分图像的分类识别结果。

可以理解的是，对本领域普通技术人员来说，可以根据本发明的技术方案及本发明构思加以等同替换或改变，而所有这些改变或替换都应属于本发明所附的权利要求的保护范围。

Claims

1.一种基于SVM的有形成分分类方法，其特征在于，所述方法包括：

SVM训练阶段：

A、获取包含有若干种有形成分的样本图片作为训练样本；

B、将所述样本图片分割为若干有形成分图像；

C、提取所述有形成分图像的图像特征并依据所述图像特征，将所述有形成分图像进行分类，构建具有若干个级联有形成分图片库；

D、构建若干个级联SVM分类器并使用相应的有形成分图片库进行训练；

有形成分识别分类阶段：

E、提取待识别分类的有形成分图像的图像特征；

F、依据所述图像特征，将有形成分图像分派至相应的SVM分类器中进行识别分类；

所述若干种有形成分包括上皮细胞、线索细胞、滴虫、白细胞、红细胞、霉菌、杆菌、精子、脂肪滴以及人造物；

所述步骤B具体包括：

对所述样本图片进行高斯滤波；

对所述梯度图像进行二值化，形成二值化图像；

使用区域生长法对所述二值化图像进行图像分割，获得若干有形成分图像；

所述步骤C具体包括：

将小微粒SVM第一层训练输入的第三类再人工筛选为六类作为小微粒SVM第二层第三类训练库输入，其中第一类包含白细胞；第二类包含红细胞；第三类滴虫；第四类包含霉菌；第五类包含杆菌；第六类包含人造物；

所述步骤D具体包括：

选择预定的训练特征；

计算每类有形成分的训练特征，并确定每一训练特征的最大值和最小值；

将所述训练特征归一化至【－1，1】的范围内；

将归一化后的训练特征映射变换为高维空间中的特征向量；

构造所述SVM分类器的目标函数；

进行训练从而获得最优的SVM分类器；

所述步骤F具体包括：

计算有形成分图像的图像特征并进行归一化；

将归一化后的特征向量映射变换为高维空间的特征向量；

依据有形成分图像的尺寸，分派至相对应的大颗粒或者小颗粒第一层次SVM分类器中；

通过所述大颗粒或者小颗粒第一层次SVM分类器进行类别判定；

依据类别判定结果，分派至对应类别的第二层次SVM分类器中进行识别；

输出有形成分图像的分类识别结果；

所述级联SVM分类器具体包括与所述大微粒SVM第一层训练库相对应的大颗粒第一层SVM分类器、与所述小微粒SVM第一层训练库相对应的小颗粒第一层SVM分类器、与所述大微粒SVM第二层第一至四类训练库相对应的大颗粒第二层第一至四类SVM分类器以及与所述小微粒SVM第二层第一至四类训练库相对应的小颗粒第二层第一至四类SVM分类器；

所述预设的尺寸阈值为150，如果有形成分尺寸nSize>150，则判断有形成分为大微粒，反之为小微粒；

nSize＝Max(nWidth,nHeight)

其中，nHeight为有形成分高，nWidth为有形成分宽。

2.根据权利要求1所述的有形成分分类方法，其特征在于，所述“将归一化后的训练特征映射变换为高维空间中的特征向量”的步骤具体为：将归一化后的训练特征向量经如下公式映射变换为高维空间中的特征向量；

其中，

为归一化后的训练特征向量，为特征内积，X＝(x₁,x₂,x₃,...,x_n)为高维空间中的特征向量，m为归一化后的训练特征的数量。

3.根据权利要求1所述的有形成分分类方法，其特征在于，所述“构造所述SVM分类器的目标函数”的步骤具体为：

所述几何间隔最大时的约束条件为：

y_i[(W^TX)+b]-1+ξ_i≥0

所述目标函数具体为：

其中，C>0为自定义惩罚因子。

4.根据权利要求1所述的有形成分分类方法，其特征在于，所述大颗粒SVM及小颗粒SVM第一层训练库的训练特征包括：面积、形状系数、面积周长比、长宽比、轮廓角点数、轮廓角点分布、灰度均值、灰度方差、轮廓半径标准差、轮廓半径最小值、轮廓半径最大值、能量、中心圆内平均FFT、中心圆外平均FFT；