CN105654107B - 一种基于svm的有形成分分类方法 - Google Patents
一种基于svm的有形成分分类方法 Download PDFInfo
- Publication number
- CN105654107B CN105654107B CN201510603254.7A CN201510603254A CN105654107B CN 105654107 B CN105654107 B CN 105654107B CN 201510603254 A CN201510603254 A CN 201510603254A CN 105654107 B CN105654107 B CN 105654107B
- Authority
- CN
- China
- Prior art keywords
- svm
- training
- class
- particle
- layer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 58
- 238000012549 training Methods 0.000 claims abstract description 132
- 239000002245 particle Substances 0.000 claims description 112
- 238000012706 support-vector machine Methods 0.000 claims description 107
- 239000013598 vector Substances 0.000 claims description 30
- 238000012216 screening Methods 0.000 claims description 27
- 239000011159 matrix material Substances 0.000 claims description 23
- 241000224526 Trichomonas Species 0.000 claims description 18
- 210000000265 leukocyte Anatomy 0.000 claims description 18
- 210000003743 erythrocyte Anatomy 0.000 claims description 14
- 238000001914 filtration Methods 0.000 claims description 11
- 210000004027 cell Anatomy 0.000 claims description 10
- 239000008187 granular material Substances 0.000 claims description 10
- 238000013507 mapping Methods 0.000 claims description 8
- 210000000981 epithelium Anatomy 0.000 claims description 6
- 210000004085 squamous epithelial cell Anatomy 0.000 claims description 6
- 230000001131 transforming effect Effects 0.000 claims description 5
- 238000003708 edge detection Methods 0.000 claims description 3
- 210000002919 epithelial cell Anatomy 0.000 claims description 3
- 238000003709 image segmentation Methods 0.000 claims description 3
- 239000008188 pellet Substances 0.000 claims description 3
- 239000004615 ingredient Substances 0.000 claims description 2
- 238000010606 normalization Methods 0.000 claims description 2
- 244000052616 bacterial pathogen Species 0.000 claims 6
- 241000304886 Bacilli Species 0.000 description 11
- 238000004364 calculation method Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000007635 classification algorithm Methods 0.000 description 3
- 230000028327 secretion Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 241000193830 Bacillus <bacterium> Species 0.000 description 1
- 239000012237 artificial material Substances 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 230000005859 cell recognition Effects 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/002—Biomolecular computers, i.e. using biomolecules, proteins, cells
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biophysics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Organic Chemistry (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于SVM的有形成分分类方法。所述方法包括:SVM训练阶段:A、获取包含有若干种有形成分的样本图片作为训练样本;B、将所述样本图片分割为若干有形成分图像;C、提取所述有形成分图像的图像特征并依据所述图像特征,将所述有形成分图像进行分类,构建具有若干个级联有形成分图片库;D、构建若干个级联SVM分类器并使用相应的有形成分图片库进行训练,以及有形成分识别分类阶段:E、提取待识别分类的有形成分图像的图像特征;F、依据所述图像特征,将有形成分图像分派至相应的SVM分类器中进行识别分类。采用了多个级联的SVM分类器对有形成分图形进行多层次的分类,从而有效的提高了SVM分类器对于有形成分的分类准确性。
Description
技术领域
本发明涉及图像识别技术领域,尤其涉及一种基于SVM的有形成分分类方法。
背景技术
图像识别技术是近几年来比较热门的一种技术。不管是车牌识别还是人脸识别或者指纹识别或者细胞识别,其识别的对象比较单一,而且大多数情况下是基于神经网络来实现识别分类的。神经网络是模拟人的神经,是对人脑认识行为的一个简化描述,没有完备的理论体系,容易陷入局部极小值。
SVM亦即支持向量机,其在小样本训练集上能够得到比其它算法好很多的结果,是目前最常用、效果最好的分类器之一。其具有完备的理论体系,是基于结构风险最小化理论,其解是全局最优解。但现有的SVM识别分类算法在对于显微系统获得的图像中有形成分的分类识别的应用上还不完备,其分类的准确性也有提高的空间。
因此,现有技术还有待发展。
发明内容
鉴于上述现有技术的不足之处,本发明的目的在于提供一种基于SVM的有形成分分类方法,旨在解决现有SVM识别分类算法在有形成分的分类识别的应用上不完备,准确率有限的问题。
为了达到上述目的,本发明采取了以下技术方案:
一种基于SVM的有形成分分类方法,其中,所述方法包括:SVM训练阶段:A、获取包含有若干种有形成分的样本图片作为训练样本;B、将所述样本图片分割为若干有形成分图像;C、提取所述有形成分图像的图像特征并依据所述图像特征,将所述有形成分图像进行分类,构建具有若干个级联有形成分图片库;D、构建若干个级联SVM分类器并使用相应的有形成分图片库进行训练;以及有形成分识别分类阶段:E、提取待识别分类的有形成分图像的图像特征;F、依据所述图像特征,将有形成分图像分派至相应的SVM分类器中进行识别分类。
所述的有形成分分类方法,其中,所述步骤B具体包括:
对所述样本图片进行高斯滤波;
使用Sobel算子对高斯滤波后图像进行边缘检测,获得样本图片的梯度图像;
对所述梯度图像进行二值化,形成二值化图像;
使用区域生长法对所述二值化图像进行图像分割,获得若干有形成分图像。
所述的有形成分分类方法,其中,所述若干种有形成分包括上皮细胞、线索细胞、滴虫、白细胞、红细胞、霉菌、杆菌、精子、脂肪滴以及人造物。
所述的有形成分分类方法,其中,所述步骤C具体包括:
依据预设的尺寸阈值,将尺寸大于所述尺寸阈值的有形成分图像放入大颗粒训练库中,将尺寸小于所述尺寸阈值的有形成分图像放入小颗粒训练库中;
通过人工筛选,将大微粒训练库分为五类,作为大微粒SVM第一层训练库;其中第一类包含鳞状上皮细胞、线索细胞;第二类包含底层上皮、滴虫;第三类包含霉菌、白细胞团;第四类包含杆菌、精子;第五类包含人造物;
将大微粒SVM第一层训练库输入的第一类再人工筛选为三类作为大微粒SVM第二层第一类训练库输入,其中第一类包含鳞状上皮细胞;第二类包含线索细胞;第三类为人造物;
将大微粒SVM第一层训练输入的第二类再人工筛选为三类作为大微粒SVM第二层第二类训练库输入,其中第一类包含底层上皮;第二类包含滴虫;第三类为人造物;
将大微粒SVM第一层训练输入的第三类再人工筛选为三类作为大微粒SVM第二层第三类训练库输入,其中第一类包含霉菌;第二类包含白细胞团;第三类为人造物;
将大微粒SVM第一层训练输入的第四类再人工筛选为三类作为大微粒SVM第二层第四类训练库输入,其中第一类包含杆菌;第二类包含精子;第三类为人造物;
通过人工筛选,将小微粒训练库分为四类,作为小微粒SVM第一层训练库输入,其中,第一类包含圆形的白细胞、红细胞、滴虫、霉菌、脂肪滴;第二类包含线形的杆菌、精子;第三类包含非圆形和线形的小微粒有形成分;第四类包含人造物;
将小微粒SVM第一层训练输入的第一类再人工筛选为六类作为小微粒SVM第二层第一类训练库输入,其中第一类包含白细胞;第二类包含红细胞;第三类滴虫;第四类包含霉菌;第五类包含脂肪滴;第六类包含人造物;
将小微粒SVM第一层训练输入的第二类再人工筛选为三类作为小微粒SVM第二层第二类训练库输入,其中第一类包含杆菌;第二类包含精子;第三类包含人造物;
将小微粒SVM第一层训练输入的第三类再人工筛选为六类作为小微粒SVM第二层第三类训练库输入,其中第一类包含白细胞;第二类包含红细胞;第三类滴虫;第四类包含霉菌;第五类包含杆菌;第六类包含人造物。
所述的有形成分分类方法,其中,所述级联SVM分类器具体包括与所述大微粒SVM第一层训练库相对应的大颗粒第一层SVM分类器、与所述小微粒SVM第一层训练库相对应的小颗粒第一层SVM分类器、与所述大微粒SVM第二层第一至四类训练库相对应的大颗粒第二层第一至四类SVM分类器以及与所述小微粒SVM第二层第一至四类训练库相对应的小颗粒第二层第一至四类SVM分类器。
所述的有形成分分类方法,其中,所述步骤F具体包括:计算有形成分图像的图像特征并进行归一化;将归一化后的特征向量映射变换为高维空间的特征向量;依据有形成分图像的尺寸,分派至相对应的大颗粒或者小颗粒第一层次SVM分类器中;通过所述大颗粒或者小颗粒第一层次SVM分类器进行类别判定;依据类别判定结果,分派至对应类别的第二层次SVM分类器中进行识别;输出有形成分图像的分类识别结果
所述的有形成分分类方法,其中,所述步骤D具体包括:选择预定的训练特征;计算每类有形成分的训练特征,并确定每一训练特征的最大值和最小值;将所述训练特征归一化至【-1,1】的范围内;将归一化后的训练特征映射变换为高维空间中的特征向量;构造所述SVM分类器的目标函数;进行训练从而获得最优的SVM分类器。
所述的有形成分分类方法,其中,所述“将归一化后的训练特征映射变换为高维空间中的特征向量”的步骤具体为:,将归一化后的训练特征向量经如下公式映射变换为高维空间中的特征向量;
所述的有形成分分类方法,其中,所述“构造所述SVM分类器的目标函数”的步骤具体为:
在所述高维空间中确定一个使得两类目标的几何间隔达到最大的最优超平面;
所述几何间隔最大时的约束条件为:
yi[(WTX)+b]-1+ξi≥0
其中,yi表示分类标签,WT为系数矩阵,X为特征向量,b为截矩矩阵,ξi表示允许错分样本存在的非负松弛变量;
所述目标函数具体为:
其中,C>0为自定义惩罚因子。
所述的有形成分分类方法,其中,所述大颗粒SVM及小颗粒SVM第一层训练库的训练特征包括:面积、形状系数、面积周长比、长宽比、轮廓角点数、轮廓角点分布、灰度均值、灰度方差、轮廓半径标准差、轮廓半径最小值、轮廓半径最大值、能量、中心圆内平均FFT、中心圆外平均FFT;
所述大颗粒SVM及小颗粒SVM第二层训练库的训练特征包括:面积、形状系数、面积周长比、长宽比、轮廓角点数、轮廓角点分布、灰度均值、灰度方差、轮廓半径标准差、轮廓半径最小值、轮廓半径最大值、能量、二阶矩、相关性、对比度、逆差矩、和方差、小梯度优势、大梯度优势、能量、灰度熵、梯度熵、惯性。
有益效果:本发明提供的一种基于SVM的有形成分分类方法,提供了一个基于SVM识别分类算法进行显微系统获取图像的有形成分识别分类的完整技术方案,能够良好的应用于有形成分的识别分类中。
采用SVM分类器的方式,与神经网络分类器相比,需要的训练样本数目大大减少,并且能够得到全局最优解,不会陷入局部极小值中。另外,还采用了多个级联的SVM分类器对有形成分图形进行多层次的分类,从而有效的提高了SVM分类器对于有形成分的分类准确性。
附图说明
图1为本发明具体实施例的基于SVM的有形成分分类方法的方法流程图。
图2为本发明具体实施例的基于SVM的有形成分分类方法的样本图像处理过程的方法流程图。
图3为本发明具体实施例的基于SVM的有形成分分类方法的区域生长法的方法流程图。
图4为本发明具体实施例的样本图片的分割结果示意图。
图5为本发明具体实施例的红细胞图像处理过程的示意图。
图6为本发明具体实施例的基于SVM的有形成分分类方法的SVM分类器的训练过程的方法流程图。
图7为本发明具体实施例的基于SVM的有形成分分类方法的有形成分图像识别分类的方法流程图。
图8为本发明具体实施例的有形成分分类方式示意图。
具体实施方式
本发明提供一种基于SVM的有形成分分类方法。为使本发明的目的、技术方案及效果更加清楚、明确,以下参照附图并举实施例对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
如图1所示,为本发明具体实施例的基于SVM的有形成分分类方法。所述方法具体可以分为SVM训练阶段以及有形成分识别分类两个阶段。
其中,所述SVM训练阶段包括:
S1、获取包含有若干种有形成分的样本图片作为训练样本。所述样本图片具体是指包含有多种细胞或者其他有形成分的医学显微图像,例如各类分泌物的显微图像等等。
具体的,所述若干种有形成分可以包括上皮细胞、线索细胞、滴虫、白细胞、红细胞、霉菌、杆菌、精子、脂肪滴以及人造物等等一些出现在分泌物的显微图像中的有形成分。
S2、将所述样本图片分割为若干有形成分图像。
具体的,如图2所示,所述步骤S2可以包括:
S21、灰度化图像。
S22、对灰度化后的样本图片进行高斯滤波。以分泌物样本图片f为例,使用
S23、使用Sobel算子对高斯滤波后图像g进行边缘检测,获得样本图片的梯度图像其中,所述Sobel算子模板具体可以为:
或者
S24、对所述梯度图像T进行二值化,形成二值图像B。所述二值化具体可以通过如下步骤实现:
首先,计算梯度分布直方图pHist[256]
for i=0;i<nHeight*nWidth;i++
pHist[T[i]]++
其中,nHeight为梯度图像高,nWidth为梯度图像宽,T[i]为梯度图像各个点处像素值。
然后,计算梯度直方图pHist最大峰值处所对应的灰阶值nPixValue
nMax=0
for i=0;i<256;i++
if(pHist[i]>nMax)nMax=pHist[i];nPixValue=i
通过如下算式计算二值化阈值
nThreshold=nPixValue*α
其中,α∈(0,1);
若梯度图像某点处像素值大于上述阈值,则将其上、下、左、右四点处像素值置为1,否则为0。具体计算算式如下:
其中,B(i,j)为二值图像。
利用区域生长法对所述二值化图像进行图像分割,获得若干有形成分图像。所述区域生长方法是根据同一物体区域内象素的相似性质来聚集象素点的方法。从初始区域(如小邻域或甚至于每个象素)开始,将相邻的具有同样性质的象素或其它区域归并到目前的区域中从而逐步增长区域,直至没有可以归并的点或其它小区域为止。在没有先验知识的情况下,可以使用区域生长法来确定在有形成分在样本中的具体区域。如图5所示,为红细胞的图像处理过程的示意图,包括原始图像、梯度图像、二值化图以及边界图。
具体的,所述区域生长法的实现方法如下:
S25、对二值化图像采用八邻域区域生长法,依据左下、下、右下、右、右上、上、左上、左八个方向去找连通点进行连通区域寻找(亦即连通搜寻),空洞填充、去除面积过大或者过小的区域并确定有形成分区域(亦即有形成分矩形位置的区域)。八邻域如下表格所示:
7 | 6 | 5 |
8 | P | 4 |
1 | 2 | 3 |
其中,P为二值图像某个位置处像素,1为其左方角点,2为其下方点,3为其右下方点,4为其右方点,5为其右上方点,6为其上方点,7为其左上方点,8为其左方点。
如图3所示,具体实现步骤为:创建一幅和二值图像一样尺寸的图片,像素数据全部初始化为0,从起始前景点(值为1)扫描图像,将该点压栈(B1),并将该点对应的副本图片上像素值置为1。
遍历上述压栈点周围八邻域点(左下、下、右下、右、右上、上、左上、左)像素(B2),如果值为1,将上述点出栈,并将邻域点压栈,同时将该邻域点对应副本图片上像素值置为255(B3)。重复该步操作直至栈为空(B4)。
S26、依据生成的有形成分的矩形区域,分割为相应的有形成分图像。
S27、在完成上述步骤后,还可以继续判断获得的图像结果是否需要继续进行分割,若是,则重复执行步骤。如图4所示,为本发明具体实施例的样本图片的分割结果。
S3、提取所述有形成分图像的图像特征并依据所述图像特征,将所述有形成分图像进行分类,构建具有若干个级联有形成分图片库。
在本发明的具体实施例中,所述分类的标准具体可以采用如下标准:
首先,依据预设的尺寸阈值,将尺寸大于所述尺寸阈值的有形成分图像放入大颗粒训练库中,将尺寸小于所述尺寸阈值的有形成分图像放入小颗粒训练库中。
然后,在分别对大颗粒和小颗粒训练库中的内容进行进一步的细分。具体为:
对于大颗粒训练库,通过人工筛选,将大微粒训练库分为五类,作为大微粒SVM第一层训练库;其中第一类包含鳞状上皮细胞、线索细胞;第二类包含底层上皮、滴虫;第三类包含霉菌、白细胞团;第四类包含杆菌、精子;第五类包含人造物。
将大微粒SVM第一层训练库输入的第一类再人工筛选为三类作为大微粒SVM第二层第一类训练库输入,其中第一类包含鳞状上皮细胞;第二类包含线索细胞;第三类为人造物。
将大微粒SVM第一层训练输入的第二类再人工筛选为三类作为大微粒SVM第二层第二类训练库输入,其中第一类包含底层上皮;第二类包含滴虫;第三类为人造物。
将大微粒SVM第一层训练输入的第三类再人工筛选为三类作为大微粒SVM第二层第三类训练库输入,其中第一类包含霉菌;第二类包含白细胞团;第三类为人造物。
将大微粒SVM第一层训练输入的第四类再人工筛选为三类作为大微粒SVM第二层第四类训练库输入,其中第一类包含杆菌;第二类包含精子;第三类为人造物。
另外,对于小颗粒训练库,通过人工筛选,将小微粒训练库分为四类,作为小微粒SVM第一层训练库输入,其中,第一类包含圆形的白细胞、红细胞、滴虫、霉菌、脂肪滴;第二类包含线形的杆菌、精子;第三类包含非圆形和线形的小微粒有形成分;第四类包含人造物。
将小微粒SVM第一层训练输入的第一类再人工筛选为六类作为小微粒SVM第二层第一类训练库输入,其中第一类包含白细胞;第二类包含红细胞;第三类滴虫;第四类包含霉菌;第五类包含脂肪滴;第六类包含人造物。
将小微粒SVM第一层训练输入的第二类再人工筛选为三类作为小微粒SVM第二层第二类训练库输入,其中第一类包含杆菌;第二类包含精子;第三类包含人造物。
将小微粒SVM第一层训练输入的第三类再人工筛选为六类作为小微粒SVM第二层第三类训练库输入,其中第一类包含白细胞;第二类包含红细胞;第三类滴虫;第四类包含霉菌;第五类包含杆菌;第六类包含人造物。
通过上述分类方法,可以形成如图8所示的多个级联的有形成分图片库(集合)用于SVM分类器的训练。
S4、构建若干个级联SVM分类器并使用相应的有形成分图片库进行训练。
与上述具体实施例中的级联的有形成分图片库相对应地,所述级联SVM分类器具体可以包括与所述大微粒SVM第一层训练库相对应的大颗粒第一层SVM分类器、与所述小微粒SVM第一层训练库相对应的小颗粒第一层SVM分类器、与所述大微粒SVM第二层第一至四类训练库相对应的大颗粒第二层第一至四类SVM分类器以及与所述小微粒SVM第二层第一至四类训练库相对应的小颗粒第二层第一至四类SVM分类器。
在本发明的一具体实施例中,如图6所示,所述训练过程具体为:
S41、选择合适的训练特征。
将有形成分大小微粒以有形成分尺寸nSize界定,如果nSize>150
则判断该有形成分为大微粒,反之为小微粒;
nSize=Max(nWidth,nHeight)
其中,nHeight为有形成分高,nWidth为有形成分宽。
对于大颗粒SVM及小颗粒SVM第一层训练库,其训练特征包括:面积、形状系数、面积周长比、长宽比、轮廓角点数、轮廓角点分布、灰度均值、灰度方差、轮廓半径标准差、轮廓半径最小值、轮廓半径最大值、能量、中心圆内平均FFT、中心圆外平均FFT;
而对于所述大颗粒SVM及小颗粒SVM第二层训练库,其训练特征则包括:面积、形状系数、面积周长比、长宽比、轮廓角点数、轮廓角点分布、灰度均值、灰度方差、轮廓半径标准差、轮廓半径最小值、轮廓半径最大值、能量、二阶矩、相关性、对比度、逆差矩、和方差、小梯度优势、大梯度优势、能量、灰度熵、梯度熵、惯性。
S42、计算每类有形成分的所有特征,确定出每类有形成分中每一列特征的最大值fMax和最小值fMin,将所有特征归一化到【-1,1】范围内,归一化公式为:
其中,fValue为要归一化的值,fScale为归一化后的特征。
映射变换为高维空间里面的特征,记为X=(x1,x2,x3,...,xn)。
S43、构造SVM分类器的目标函数。SVM多分类,本质上也是二分类,如果有K类,则需要类之间进行两两比较。为了将两类目标分离出来,在高维空间中,我们需要找到一个最优超平面,使得这两类目标的几何间隔达到最大。几何间隔最大时的约束条件为:
yi[(WTX)+b]-1+ξi≥0
其中,yi表示分类标签,WT为系数矩阵,X为特征向量,b为截矩矩阵,ξi表示允许错分样本存在的非负松弛变量。寻优目标函数为:
其中,C>0为自定义惩罚因子。自定义惩罚因子的值越大,对错分样本的约束程度就越大。
S44、训练获得最优的SVM模型。对SVM训练的过程亦即是不断的寻优求解过程。为求所述目标函数的最小泛函值,构造Lagrange函数:
其中,αi为各样本对应的Lagrange系数。
在约束条件:
Σyiαi=0
0≤αi≤C
下计算
最大值时的解αi以及支持向量Xi。
系数矩阵计算完成后,计算截矩矩阵:
其中,X*(+1)、X*(-1)表示两类中任意一个支持向量。
通过上述的步骤,可以得到训练后的多个级联SVM分类器用于后续的有形成分图像的识别分类。
如图1所示,所述有形成分识别分类阶段则包括:
A1、提取待识别分类的有形成分图像的图像特征。对于有形成分图像的各种图像特征的计算方法具体如下所述:
面积:有形成分二值图像中微粒区域像素点数,记为S。
周长:有形成分二值图像中包围微粒区域的边界像素点数,记为l。
形状系数:θ=l2/S。
面积周长比:f=S/l。
长宽比:有形成分区域最小外接矩形长边与短边的比值,记有形成分区域最小外接矩形长边为m,短边为n,则长宽比e=m/n
角点:利用水平差分算子Sx、竖直差分Sy算子对有形成分灰度图像g进行滤波得到Tx和Ty:
计算
中四个元素的值,然后再对四个元素进行高斯平滑滤波,对每一个元素图片mi进行高斯滤波,使用
正态分布(高斯函数)计算滤波模板,并使用该模板与原图像做卷积运算,得到滤波后图像接着计算角点响应量
如果该点的局部极大值存在,并且该点的角点响应量大于设定阈值nLimit,
则该点为角点。
灰度均值:微粒连通区域所有像素的灰度值的平均值。记微粒连通区域的点集合为{p1,p2,p3,...,pn},灰度值为{x1,x2,x3,...,xn},则灰度均
值为
nAvg=(Σxi)/n。
灰度方差:连通区域所有像素的灰度值的方差。记连通区域的点集合为{p1,p2,p3,...,pn},灰度值为{x1,x2,x3,...,xn},则灰度方差为
nVari=(∑(xi-nAvg)2)/n。
轮廓半径信息:记轮廓点集合为{b1,b2,b3,...,bn},质心为(x0,y0),则轮廓半径集合为{d1,d2,d3,...,dn},其中
轮廓半径均值为:
μi=(∑di)/n;
轮廓半径标准差为:
轮廓半径最大值为:
dmax=max{d1,d2,d3,...,dn};
轮廓半径最小值为:
dmin=min{d1,d2,d3,...,dn}。
频域FFT计算:将图像应用快速傅里叶变换(FFT)转换到频域,幅度的平方称为能量谱。由于幅度决定了一幅图像中含有的各种频率分量的多少,故可以用能量谱来表征频域特征。频域计算需要用到傅立叶变换,其公式为:设f(x,y)为图像(x,y)处像素值,其傅里叶变换用F(u,v)表示,则有:
其中,M、N分别为图像的宽和高。
对于图像进行傅立叶变换,运算量很大,一般都通过快速傅里叶变换来减少计算量。具体算法如下:
图像数据复数化处理,存入缓存。
纵向一维快速傅里叶变换,具体包含两步:数据序列逆序;对逆序后数据进行蝶形计算。
横向一维快速傅里叶变换。
计算频谱图,并输出。
FFT变换后,可以计算图像中心为圆心的某个圆内部的能量谱为:
圆外部的能量谱为:
二阶矩:二阶矩是图像灰度分布均匀性的度量。当灰度共生矩阵中的元素分布较集中于主对角线时,说明从局部区域观察图像的灰度分布是均匀的。从图像整体观察发现,纹理较粗,此时二阶矩值则较大,反过来则二阶矩值较小。二阶矩也是灰度共生矩阵像素值平方的和,所以它也称为能量。粗纹理二阶矩值较大,可以理解为粗纹理含有较多的能量。细纹理较小,也即它含有较小的能量,计算如下:
f1=ΣΣpδ 2(i,j)
相关性:相关能够被用来衡量灰度共生矩阵的元素在行的方向或列的方向的相似程度,计算如下:
其中,
μ1=∑i∑ijpδ(i,j)
μ2=∑j∑ijpδ(i,j)
σ1 2=Σ(i-μ1)2Σpδ(i,j)
σ2 2=Σ(j-μ2)2Σpδ(i,j)
熵:熵值是图像具有的信息量的度量,纹理信息是图像信息的一种。若图像没有任何纹理,则灰度共生矩阵几乎为零阵,熵值接近为0。如果图像充满着细纹理,该图像的熵值最大。若图像中分布着较少的纹理,的数值差别较大,则该图像的熵值就较小,计算如下:
f3=-ΣiΣpδ(i,j)logpδ(i,j)
对比度:图像的对比度可以理解为图像的清晰度,即纹理的清晰程度。在图像中,纹理的沟纹越深,则其对比度越小,图像的视觉效果就会越清晰,计算如下:
f4=Σ(ΣΣ|i-j|2pδ(i,j))
逆差矩:
和方差:
灰度-梯度共生矩阵特征:灰度-梯度共生矩阵法是灰度级直方图和边缘直方图的结合,它考虑的是像素级灰度和边缘梯度大小的联合统计分布。灰度直方图是一幅图像灰度在图像中分布的最基本统计信息,而图像的梯度捡出了图像中的灰度跳变部分。将图像的梯度信息加进灰度共生矩阵,则使得共生矩阵更能包含图像的纹理基元及其排列的信息。灰度-梯度共生矩阵常用的特征参数有:
1)小梯度优势:
2)大梯度优势:
3)能量:
4)灰度熵:
T4=-ΣΣH(i,j)logΣHj(i,j)
5)梯度熵:
T5=-∑∑H(i,j)log∑Hi(i,j)
6)惯性:
T5=∑∑(i-j)2H(i,j)
A2、依据所述图像特征,将有形成分图像分派至相应的SVM分类器中进行识别分类。
具体的,如图7所示,所述步骤A2具体包括:
A21、计算有形成分图像的图像特征并进行归一化。
A22、将归一化后的特征向量映射变换为高维空间的特征向量。
A23、依据有形成分图像的尺寸,确定其属于大颗粒还是小颗粒部分,然后将其分派至相对应的大颗粒或者小颗粒第一层次SVM分类器中。
例如,设其被派至分支Si里面,记分支Si的SVM第一层分类判别函数为:
A24、通过所述大颗粒或者小颗粒第一层次SVM分类器进行类别判定;依据类别判定结果,分派至对应类别的第二层次SVM分类器中进行识别。例如,假设经过第一层分类判别后,其进入的类别为Ci,记Ci的SVM第二层分类判别函数为:
A25、输出最终的有形成分图像的分类识别结果。
可以理解的是,对本领域普通技术人员来说,可以根据本发明的技术方案及本发明构思加以等同替换或改变,而所有这些改变或替换都应属于本发明所附的权利要求的保护范围。
Claims (4)
1.一种基于SVM的有形成分分类方法,其特征在于,所述方法包括:
SVM训练阶段:
A、获取包含有若干种有形成分的样本图片作为训练样本;
B、将所述样本图片分割为若干有形成分图像;
C、提取所述有形成分图像的图像特征并依据所述图像特征,将所述有形成分图像进行分类,构建具有若干个级联有形成分图片库;
D、构建若干个级联SVM分类器并使用相应的有形成分图片库进行训练;
有形成分识别分类阶段:
E、提取待识别分类的有形成分图像的图像特征;
F、依据所述图像特征,将有形成分图像分派至相应的SVM分类器中进行识别分类;
所述若干种有形成分包括上皮细胞、线索细胞、滴虫、白细胞、红细胞、霉菌、杆菌、精子、脂肪滴以及人造物;
所述步骤B具体包括:
对所述样本图片进行高斯滤波;
使用Sobel算子对高斯滤波后图像进行边缘检测,获得样本图片的梯度图像;
对所述梯度图像进行二值化,形成二值化图像;
使用区域生长法对所述二值化图像进行图像分割,获得若干有形成分图像;
所述步骤C具体包括:
依据预设的尺寸阈值,将尺寸大于所述尺寸阈值的有形成分图像放入大颗粒训练库中,将尺寸小于所述尺寸阈值的有形成分图像放入小颗粒训练库中;
通过人工筛选,将大微粒训练库分为五类,作为大微粒SVM第一层训练库;其中第一类包含鳞状上皮细胞、线索细胞;第二类包含底层上皮、滴虫;第三类包含霉菌、白细胞团;第四类包含杆菌、精子;第五类包含人造物;
将大微粒SVM第一层训练库输入的第一类再人工筛选为三类作为大微粒SVM第二层第一类训练库输入,其中第一类包含鳞状上皮细胞;第二类包含线索细胞;第三类为人造物;
将大微粒SVM第一层训练输入的第二类再人工筛选为三类作为大微粒SVM第二层第二类训练库输入,其中第一类包含底层上皮;第二类包含滴虫;第三类为人造物;
将大微粒SVM第一层训练输入的第三类再人工筛选为三类作为大微粒SVM第二层第三类训练库输入,其中第一类包含霉菌;第二类包含白细胞团;第三类为人造物;
将大微粒SVM第一层训练输入的第四类再人工筛选为三类作为大微粒SVM第二层第四类训练库输入,其中第一类包含杆菌;第二类包含精子;第三类为人造物;
通过人工筛选,将小微粒训练库分为四类,作为小微粒SVM第一层训练库输入,其中,第一类包含圆形的白细胞、红细胞、滴虫、霉菌、脂肪滴;第二类包含线形的杆菌、精子;第三类包含非圆形和线形的小微粒有形成分;第四类包含人造物;
将小微粒SVM第一层训练输入的第一类再人工筛选为六类作为小微粒SVM第二层第一类训练库输入,其中第一类包含白细胞;第二类包含红细胞;第三类滴虫;第四类包含霉菌;第五类包含脂肪滴;第六类包含人造物;
将小微粒SVM第一层训练输入的第二类再人工筛选为三类作为小微粒SVM第二层第二类训练库输入,其中第一类包含杆菌;第二类包含精子;第三类包含人造物;
将小微粒SVM第一层训练输入的第三类再人工筛选为六类作为小微粒SVM第二层第三类训练库输入,其中第一类包含白细胞;第二类包含红细胞;第三类滴虫;第四类包含霉菌;第五类包含杆菌;第六类包含人造物;
所述步骤D具体包括:
选择预定的训练特征;
计算每类有形成分的训练特征,并确定每一训练特征的最大值和最小值;
将所述训练特征归一化至【-1,1】的范围内;
将归一化后的训练特征映射变换为高维空间中的特征向量;
构造所述SVM分类器的目标函数;
进行训练从而获得最优的SVM分类器;
所述步骤F具体包括:
计算有形成分图像的图像特征并进行归一化;
将归一化后的特征向量映射变换为高维空间的特征向量;
依据有形成分图像的尺寸,分派至相对应的大颗粒或者小颗粒第一层次SVM分类器中;
通过所述大颗粒或者小颗粒第一层次SVM分类器进行类别判定;
依据类别判定结果,分派至对应类别的第二层次SVM分类器中进行识别;
输出有形成分图像的分类识别结果;
所述级联SVM分类器具体包括与所述大微粒SVM第一层训练库相对应的大颗粒第一层SVM分类器、与所述小微粒SVM第一层训练库相对应的小颗粒第一层SVM分类器、与所述大微粒SVM第二层第一至四类训练库相对应的大颗粒第二层第一至四类SVM分类器以及与所述小微粒SVM第二层第一至四类训练库相对应的小颗粒第二层第一至四类SVM分类器;
所述预设的尺寸阈值为150,如果有形成分尺寸nSize>150,则判断有形成分为大微粒,反之为小微粒;
nSize=Max(nWidth,nHeight)
其中,nHeight为有形成分高,nWidth为有形成分宽。
4.根据权利要求1所述的有形成分分类方法,其特征在于,所述大颗粒SVM及小颗粒SVM第一层训练库的训练特征包括:面积、形状系数、面积周长比、长宽比、轮廓角点数、轮廓角点分布、灰度均值、灰度方差、轮廓半径标准差、轮廓半径最小值、轮廓半径最大值、能量、中心圆内平均FFT、中心圆外平均FFT;
所述大颗粒SVM及小颗粒SVM第二层训练库的训练特征包括:面积、形状系数、面积周长比、长宽比、轮廓角点数、轮廓角点分布、灰度均值、灰度方差、轮廓半径标准差、轮廓半径最小值、轮廓半径最大值、能量、二阶矩、相关性、对比度、逆差矩、和方差、小梯度优势、大梯度优势、能量、灰度熵、梯度熵、惯性。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510603254.7A CN105654107B (zh) | 2015-09-21 | 2015-09-21 | 一种基于svm的有形成分分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510603254.7A CN105654107B (zh) | 2015-09-21 | 2015-09-21 | 一种基于svm的有形成分分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105654107A CN105654107A (zh) | 2016-06-08 |
CN105654107B true CN105654107B (zh) | 2020-01-17 |
Family
ID=56482051
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510603254.7A Active CN105654107B (zh) | 2015-09-21 | 2015-09-21 | 一种基于svm的有形成分分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105654107B (zh) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106529600B (zh) * | 2016-11-16 | 2019-06-04 | 桂林理工大学 | 一种基于svm的高分辨率光学影像建筑物角点识别方法 |
CN106778603A (zh) * | 2016-12-13 | 2017-05-31 | 中国科学院信息工程研究所 | 一种基于梯度式级联svm分类器的行人识别方法 |
CN106682633B (zh) * | 2016-12-30 | 2019-08-20 | 四川沃文特生物技术有限公司 | 基于机器视觉的粪便镜检图像有形成分的分类识别方法 |
CN107609585A (zh) * | 2017-09-08 | 2018-01-19 | 湖南友哲科技有限公司 | 一种基于卷积神经网络的体液细胞显微图像识别方法 |
CN108304859B (zh) * | 2017-12-29 | 2021-03-30 | 达闼科技(北京)有限公司 | 图像识别方法及云端系统 |
CN108564114B (zh) * | 2018-03-28 | 2022-05-27 | 电子科技大学 | 一种基于机器学习的人体粪便白细胞自动识别方法 |
US11055447B2 (en) * | 2018-05-28 | 2021-07-06 | Tata Consultancy Services Limited | Methods and systems for adaptive parameter sampling |
CN109344852A (zh) * | 2018-08-01 | 2019-02-15 | 迈克医疗电子有限公司 | 图像识别方法和装置、分析仪器和存储介质 |
CN109859199B (zh) * | 2019-02-14 | 2020-10-16 | 浙江科技学院 | 一种sd-oct图像的淡水无核珍珠质量检测的方法 |
CN110059656B (zh) * | 2019-04-25 | 2021-05-11 | 山东师范大学 | 基于卷积对抗生成神经网络的白细胞分类方法及系统 |
CN110415246B (zh) * | 2019-08-06 | 2023-05-16 | 东北大学 | 一种腹部脂肪成分的分析方法 |
CN110633676B (zh) * | 2019-09-18 | 2023-04-18 | 东北大学 | 一种自动识别脑脊液细胞图像信息方法 |
CN111062296B (zh) * | 2019-12-11 | 2023-07-18 | 武汉兰丁智能医学股份有限公司 | 一种基于计算机的白细胞自动识别分类方法 |
CN112301094A (zh) * | 2020-07-22 | 2021-02-02 | 迪瑞医疗科技股份有限公司 | 一种阴道分泌物干化学有形成分分析复合质控物及其制备方法 |
CN112102341B (zh) * | 2020-08-29 | 2024-09-06 | 深圳市瑞沃德生命科技股份有限公司 | 一种细胞图像分割方法及其装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101900737A (zh) * | 2010-06-10 | 2010-12-01 | 上海理工大学 | 基于支持向量机的尿沉渣有形成分自动识别系统 |
CN102323281A (zh) * | 2011-08-22 | 2012-01-18 | 长沙高新技术产业开发区爱威科技实业有限公司 | 液体性质检测方法和系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2570970A1 (en) * | 2011-09-16 | 2013-03-20 | Technische Universität Berlin | Method and system for the automatic analysis of an image of a biological sample |
-
2015
- 2015-09-21 CN CN201510603254.7A patent/CN105654107B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101900737A (zh) * | 2010-06-10 | 2010-12-01 | 上海理工大学 | 基于支持向量机的尿沉渣有形成分自动识别系统 |
CN102323281A (zh) * | 2011-08-22 | 2012-01-18 | 长沙高新技术产业开发区爱威科技实业有限公司 | 液体性质检测方法和系统 |
Non-Patent Citations (2)
Title |
---|
一种基于线性SVM的级联分类器的构造方法;安平 等;《计算机工程与应用》;20081231;第39-40页 * |
基于SVM算法的尿沉渣细胞分类识别系统的研究;涂林林;《中国优秀硕士学位论文全文数据库 信息科技辑》;20150415;第23-37页 * |
Also Published As
Publication number | Publication date |
---|---|
CN105654107A (zh) | 2016-06-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105654107B (zh) | 一种基于svm的有形成分分类方法 | |
CN109800824B (zh) | 一种基于计算机视觉与机器学习的管道缺陷识别方法 | |
Shirazi et al. | Efficient leukocyte segmentation and recognition in peripheral blood image | |
Salem | Segmentation of white blood cells from microscopic images using K-means clustering | |
CN109636824A (zh) | 一种基于图像识别技术的多目标计数方法 | |
Isa | Automated edge detection technique for Pap smear images using moving K-means clustering and modified seed based region growing algorithm | |
Bagasjvara et al. | Automated detection and classification techniques of Acute leukemia using image processing: A review | |
CN106127735B (zh) | 一种设施蔬菜边缘清晰类叶面病斑分割方法及装置 | |
del Pozo-Banos et al. | Features extraction techniques for pollen grain classification | |
Hamednejad et al. | Retinal optic disk segmentation and analysis in fundus images using DBSCAN clustering algorithm | |
Putzu et al. | Investigation of different classification models to determine the presence of leukemia in peripheral blood image | |
Kim et al. | Automatic cell classification in human’s peripheral blood images based on morphological image processing | |
WO2016192213A1 (zh) | 一种图像特征提取方法和装置、存储介质 | |
Dissanayake et al. | Plant leaf identification based on machine learning algorithms | |
Ampilova et al. | On application of entropy characteristics to texture analysis | |
El-Tarhouni et al. | Feature fusion using the local binary pattern histogram fourier and the pyramid histogram of feature fusion using the local binary pattern oriented gradient in iris recognition | |
Cicconet et al. | Wavelet-based Circular Hough Transform and Its Application in Embryo Development Analysis. | |
Ambriz-Colin et al. | Detection of biological cells in phase-contrast microscopy images | |
Frejlichowski | Identification of erythrocyte types in greyscale MGG images for computer-assisted diagnosis | |
Rathore et al. | A novel approach for ensemble clustering of colon biopsy images | |
CN110599462A (zh) | 一种基于不平衡Fisher判别分析的尿沉渣检测方法 | |
Nasr-Isfahani et al. | A new approach for touching cells segmentation | |
Gim et al. | A novel framework for white blood cell segmentation based on stepwise rules and morphological features | |
Rai et al. | Appearance based gender classification with PCA and (2D) 2 PC A on approximation face image | |
Jiuxian et al. | Face detection based on self-skin segmentation and wavelet support vector machine |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: 130103 No. 3333 livable Road, hi tech Development Zone, Jilin, Changchun Applicant after: Medical Polytron Technologies Inc Address before: 130103 No. 3333 livable Road, hi tech Development Zone, Jilin, Changchun Applicant before: Changchun Dirui Medical Technology Co., Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |