CN105654107B - 一种基于svm的有形成分分类方法 - Google Patents

一种基于svm的有形成分分类方法 Download PDF

Info

Publication number
CN105654107B
CN105654107B CN201510603254.7A CN201510603254A CN105654107B CN 105654107 B CN105654107 B CN 105654107B CN 201510603254 A CN201510603254 A CN 201510603254A CN 105654107 B CN105654107 B CN 105654107B
Authority
CN
China
Prior art keywords
svm
training
class
particle
layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510603254.7A
Other languages
English (en)
Other versions
CN105654107A (zh
Inventor
任迪
唐松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Deary Medical Technology Co Ltd
Original Assignee
Deary Medical Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Deary Medical Technology Co Ltd filed Critical Deary Medical Technology Co Ltd
Priority to CN201510603254.7A priority Critical patent/CN105654107B/zh
Publication of CN105654107A publication Critical patent/CN105654107A/zh
Application granted granted Critical
Publication of CN105654107B publication Critical patent/CN105654107B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/002Biomolecular computers, i.e. using biomolecules, proteins, cells

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Organic Chemistry (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于SVM的有形成分分类方法。所述方法包括:SVM训练阶段:A、获取包含有若干种有形成分的样本图片作为训练样本;B、将所述样本图片分割为若干有形成分图像;C、提取所述有形成分图像的图像特征并依据所述图像特征,将所述有形成分图像进行分类,构建具有若干个级联有形成分图片库;D、构建若干个级联SVM分类器并使用相应的有形成分图片库进行训练,以及有形成分识别分类阶段:E、提取待识别分类的有形成分图像的图像特征;F、依据所述图像特征,将有形成分图像分派至相应的SVM分类器中进行识别分类。采用了多个级联的SVM分类器对有形成分图形进行多层次的分类,从而有效的提高了SVM分类器对于有形成分的分类准确性。

Description

一种基于SVM的有形成分分类方法
技术领域
本发明涉及图像识别技术领域,尤其涉及一种基于SVM的有形成分分类方法。
背景技术
图像识别技术是近几年来比较热门的一种技术。不管是车牌识别还是人脸识别或者指纹识别或者细胞识别,其识别的对象比较单一,而且大多数情况下是基于神经网络来实现识别分类的。神经网络是模拟人的神经,是对人脑认识行为的一个简化描述,没有完备的理论体系,容易陷入局部极小值。
SVM亦即支持向量机,其在小样本训练集上能够得到比其它算法好很多的结果,是目前最常用、效果最好的分类器之一。其具有完备的理论体系,是基于结构风险最小化理论,其解是全局最优解。但现有的SVM识别分类算法在对于显微系统获得的图像中有形成分的分类识别的应用上还不完备,其分类的准确性也有提高的空间。
因此,现有技术还有待发展。
发明内容
鉴于上述现有技术的不足之处,本发明的目的在于提供一种基于SVM的有形成分分类方法,旨在解决现有SVM识别分类算法在有形成分的分类识别的应用上不完备,准确率有限的问题。
为了达到上述目的,本发明采取了以下技术方案:
一种基于SVM的有形成分分类方法,其中,所述方法包括:SVM训练阶段:A、获取包含有若干种有形成分的样本图片作为训练样本;B、将所述样本图片分割为若干有形成分图像;C、提取所述有形成分图像的图像特征并依据所述图像特征,将所述有形成分图像进行分类,构建具有若干个级联有形成分图片库;D、构建若干个级联SVM分类器并使用相应的有形成分图片库进行训练;以及有形成分识别分类阶段:E、提取待识别分类的有形成分图像的图像特征;F、依据所述图像特征,将有形成分图像分派至相应的SVM分类器中进行识别分类。
所述的有形成分分类方法,其中,所述步骤B具体包括:
对所述样本图片进行高斯滤波;
使用Sobel算子对高斯滤波后图像进行边缘检测,获得样本图片的梯度图像;
对所述梯度图像进行二值化,形成二值化图像;
使用区域生长法对所述二值化图像进行图像分割,获得若干有形成分图像。
所述的有形成分分类方法,其中,所述若干种有形成分包括上皮细胞、线索细胞、滴虫、白细胞、红细胞、霉菌、杆菌、精子、脂肪滴以及人造物。
所述的有形成分分类方法,其中,所述步骤C具体包括:
依据预设的尺寸阈值,将尺寸大于所述尺寸阈值的有形成分图像放入大颗粒训练库中,将尺寸小于所述尺寸阈值的有形成分图像放入小颗粒训练库中;
通过人工筛选,将大微粒训练库分为五类,作为大微粒SVM第一层训练库;其中第一类包含鳞状上皮细胞、线索细胞;第二类包含底层上皮、滴虫;第三类包含霉菌、白细胞团;第四类包含杆菌、精子;第五类包含人造物;
将大微粒SVM第一层训练库输入的第一类再人工筛选为三类作为大微粒SVM第二层第一类训练库输入,其中第一类包含鳞状上皮细胞;第二类包含线索细胞;第三类为人造物;
将大微粒SVM第一层训练输入的第二类再人工筛选为三类作为大微粒SVM第二层第二类训练库输入,其中第一类包含底层上皮;第二类包含滴虫;第三类为人造物;
将大微粒SVM第一层训练输入的第三类再人工筛选为三类作为大微粒SVM第二层第三类训练库输入,其中第一类包含霉菌;第二类包含白细胞团;第三类为人造物;
将大微粒SVM第一层训练输入的第四类再人工筛选为三类作为大微粒SVM第二层第四类训练库输入,其中第一类包含杆菌;第二类包含精子;第三类为人造物;
通过人工筛选,将小微粒训练库分为四类,作为小微粒SVM第一层训练库输入,其中,第一类包含圆形的白细胞、红细胞、滴虫、霉菌、脂肪滴;第二类包含线形的杆菌、精子;第三类包含非圆形和线形的小微粒有形成分;第四类包含人造物;
将小微粒SVM第一层训练输入的第一类再人工筛选为六类作为小微粒SVM第二层第一类训练库输入,其中第一类包含白细胞;第二类包含红细胞;第三类滴虫;第四类包含霉菌;第五类包含脂肪滴;第六类包含人造物;
将小微粒SVM第一层训练输入的第二类再人工筛选为三类作为小微粒SVM第二层第二类训练库输入,其中第一类包含杆菌;第二类包含精子;第三类包含人造物;
将小微粒SVM第一层训练输入的第三类再人工筛选为六类作为小微粒SVM第二层第三类训练库输入,其中第一类包含白细胞;第二类包含红细胞;第三类滴虫;第四类包含霉菌;第五类包含杆菌;第六类包含人造物。
所述的有形成分分类方法,其中,所述级联SVM分类器具体包括与所述大微粒SVM第一层训练库相对应的大颗粒第一层SVM分类器、与所述小微粒SVM第一层训练库相对应的小颗粒第一层SVM分类器、与所述大微粒SVM第二层第一至四类训练库相对应的大颗粒第二层第一至四类SVM分类器以及与所述小微粒SVM第二层第一至四类训练库相对应的小颗粒第二层第一至四类SVM分类器。
所述的有形成分分类方法,其中,所述步骤F具体包括:计算有形成分图像的图像特征并进行归一化;将归一化后的特征向量映射变换为高维空间的特征向量;依据有形成分图像的尺寸,分派至相对应的大颗粒或者小颗粒第一层次SVM分类器中;通过所述大颗粒或者小颗粒第一层次SVM分类器进行类别判定;依据类别判定结果,分派至对应类别的第二层次SVM分类器中进行识别;输出有形成分图像的分类识别结果
所述的有形成分分类方法,其中,所述步骤D具体包括:选择预定的训练特征;计算每类有形成分的训练特征,并确定每一训练特征的最大值和最小值;将所述训练特征归一化至【-1,1】的范围内;将归一化后的训练特征映射变换为高维空间中的特征向量;构造所述SVM分类器的目标函数;进行训练从而获得最优的SVM分类器。
所述的有形成分分类方法,其中,所述“将归一化后的训练特征映射变换为高维空间中的特征向量”的步骤具体为:,将归一化后的训练特征向量经如下公式映射变换为高维空间中的特征向量;
Figure GDA0000966759030000051
其中,
Figure GDA0000966759030000052
为归一化后的训练特征向量,
Figure GDA0000966759030000053
为特征内积,X=(x1,x2,x3,...,xn)为高维空间中的特征向量。
所述的有形成分分类方法,其中,所述“构造所述SVM分类器的目标函数”的步骤具体为:
在所述高维空间中确定一个使得两类目标的几何间隔达到最大的最优超平面;
所述几何间隔最大时的约束条件为:
yi[(WTX)+b]-1+ξi≥0
其中,yi表示分类标签,WT为系数矩阵,X为特征向量,b为截矩矩阵,ξi表示允许错分样本存在的非负松弛变量;
所述目标函数具体为:
Figure GDA0000966759030000061
其中,C>0为自定义惩罚因子。
所述的有形成分分类方法,其中,所述大颗粒SVM及小颗粒SVM第一层训练库的训练特征包括:面积、形状系数、面积周长比、长宽比、轮廓角点数、轮廓角点分布、灰度均值、灰度方差、轮廓半径标准差、轮廓半径最小值、轮廓半径最大值、能量、中心圆内平均FFT、中心圆外平均FFT;
所述大颗粒SVM及小颗粒SVM第二层训练库的训练特征包括:面积、形状系数、面积周长比、长宽比、轮廓角点数、轮廓角点分布、灰度均值、灰度方差、轮廓半径标准差、轮廓半径最小值、轮廓半径最大值、能量、二阶矩、相关性、对比度、逆差矩、和方差、小梯度优势、大梯度优势、能量、灰度熵、梯度熵、惯性。
有益效果:本发明提供的一种基于SVM的有形成分分类方法,提供了一个基于SVM识别分类算法进行显微系统获取图像的有形成分识别分类的完整技术方案,能够良好的应用于有形成分的识别分类中。
采用SVM分类器的方式,与神经网络分类器相比,需要的训练样本数目大大减少,并且能够得到全局最优解,不会陷入局部极小值中。另外,还采用了多个级联的SVM分类器对有形成分图形进行多层次的分类,从而有效的提高了SVM分类器对于有形成分的分类准确性。
附图说明
图1为本发明具体实施例的基于SVM的有形成分分类方法的方法流程图。
图2为本发明具体实施例的基于SVM的有形成分分类方法的样本图像处理过程的方法流程图。
图3为本发明具体实施例的基于SVM的有形成分分类方法的区域生长法的方法流程图。
图4为本发明具体实施例的样本图片的分割结果示意图。
图5为本发明具体实施例的红细胞图像处理过程的示意图。
图6为本发明具体实施例的基于SVM的有形成分分类方法的SVM分类器的训练过程的方法流程图。
图7为本发明具体实施例的基于SVM的有形成分分类方法的有形成分图像识别分类的方法流程图。
图8为本发明具体实施例的有形成分分类方式示意图。
具体实施方式
本发明提供一种基于SVM的有形成分分类方法。为使本发明的目的、技术方案及效果更加清楚、明确,以下参照附图并举实施例对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
如图1所示,为本发明具体实施例的基于SVM的有形成分分类方法。所述方法具体可以分为SVM训练阶段以及有形成分识别分类两个阶段。
其中,所述SVM训练阶段包括:
S1、获取包含有若干种有形成分的样本图片作为训练样本。所述样本图片具体是指包含有多种细胞或者其他有形成分的医学显微图像,例如各类分泌物的显微图像等等。
具体的,所述若干种有形成分可以包括上皮细胞、线索细胞、滴虫、白细胞、红细胞、霉菌、杆菌、精子、脂肪滴以及人造物等等一些出现在分泌物的显微图像中的有形成分。
S2、将所述样本图片分割为若干有形成分图像。
具体的,如图2所示,所述步骤S2可以包括:
S21、灰度化图像。
S22、对灰度化后的样本图片进行高斯滤波。以分泌物样本图片f为例,使用
Figure GDA0000966759030000081
正态分布(高斯函数)计算滤波模板,并使用该模板与原图像做卷积运算,得到滤波后图像
Figure GDA0000966759030000083
S23、使用Sobel算子对高斯滤波后图像g进行边缘检测,获得样本图片的梯度图像其中,所述Sobel算子模板具体可以为:
Figure GDA0000966759030000082
或者
Figure GDA0000966759030000092
S24、对所述梯度图像T进行二值化,形成二值图像B。所述二值化具体可以通过如下步骤实现:
首先,计算梯度分布直方图pHist[256]
for i=0;i<nHeight*nWidth;i++
pHist[T[i]]++
其中,nHeight为梯度图像高,nWidth为梯度图像宽,T[i]为梯度图像各个点处像素值。
然后,计算梯度直方图pHist最大峰值处所对应的灰阶值nPixValue
nMax=0
for i=0;i<256;i++
if(pHist[i]>nMax)nMax=pHist[i];nPixValue=i
通过如下算式计算二值化阈值
nThreshold=nPixValue*α
其中,α∈(0,1);
若梯度图像某点处像素值大于上述阈值,则将其上、下、左、右四点处像素值置为1,否则为0。具体计算算式如下:
Figure GDA0000966759030000091
Figure GDA0000966759030000101
Figure GDA0000966759030000103
Figure GDA0000966759030000104
其中,B(i,j)为二值图像。
利用区域生长法对所述二值化图像进行图像分割,获得若干有形成分图像。所述区域生长方法是根据同一物体区域内象素的相似性质来聚集象素点的方法。从初始区域(如小邻域或甚至于每个象素)开始,将相邻的具有同样性质的象素或其它区域归并到目前的区域中从而逐步增长区域,直至没有可以归并的点或其它小区域为止。在没有先验知识的情况下,可以使用区域生长法来确定在有形成分在样本中的具体区域。如图5所示,为红细胞的图像处理过程的示意图,包括原始图像、梯度图像、二值化图以及边界图。
具体的,所述区域生长法的实现方法如下:
S25、对二值化图像采用八邻域区域生长法,依据左下、下、右下、右、右上、上、左上、左八个方向去找连通点进行连通区域寻找(亦即连通搜寻),空洞填充、去除面积过大或者过小的区域并确定有形成分区域(亦即有形成分矩形位置的区域)。八邻域如下表格所示:
7 6 5
8 P 4
1 2 3
其中,P为二值图像某个位置处像素,1为其左方角点,2为其下方点,3为其右下方点,4为其右方点,5为其右上方点,6为其上方点,7为其左上方点,8为其左方点。
如图3所示,具体实现步骤为:创建一幅和二值图像一样尺寸的图片,像素数据全部初始化为0,从起始前景点(值为1)扫描图像,将该点压栈(B1),并将该点对应的副本图片上像素值置为1。
遍历上述压栈点周围八邻域点(左下、下、右下、右、右上、上、左上、左)像素(B2),如果值为1,将上述点出栈,并将邻域点压栈,同时将该邻域点对应副本图片上像素值置为255(B3)。重复该步操作直至栈为空(B4)。
S26、依据生成的有形成分的矩形区域,分割为相应的有形成分图像。
S27、在完成上述步骤后,还可以继续判断获得的图像结果是否需要继续进行分割,若是,则重复执行步骤。如图4所示,为本发明具体实施例的样本图片的分割结果。
S3、提取所述有形成分图像的图像特征并依据所述图像特征,将所述有形成分图像进行分类,构建具有若干个级联有形成分图片库。
在本发明的具体实施例中,所述分类的标准具体可以采用如下标准:
首先,依据预设的尺寸阈值,将尺寸大于所述尺寸阈值的有形成分图像放入大颗粒训练库中,将尺寸小于所述尺寸阈值的有形成分图像放入小颗粒训练库中。
然后,在分别对大颗粒和小颗粒训练库中的内容进行进一步的细分。具体为:
对于大颗粒训练库,通过人工筛选,将大微粒训练库分为五类,作为大微粒SVM第一层训练库;其中第一类包含鳞状上皮细胞、线索细胞;第二类包含底层上皮、滴虫;第三类包含霉菌、白细胞团;第四类包含杆菌、精子;第五类包含人造物。
将大微粒SVM第一层训练库输入的第一类再人工筛选为三类作为大微粒SVM第二层第一类训练库输入,其中第一类包含鳞状上皮细胞;第二类包含线索细胞;第三类为人造物。
将大微粒SVM第一层训练输入的第二类再人工筛选为三类作为大微粒SVM第二层第二类训练库输入,其中第一类包含底层上皮;第二类包含滴虫;第三类为人造物。
将大微粒SVM第一层训练输入的第三类再人工筛选为三类作为大微粒SVM第二层第三类训练库输入,其中第一类包含霉菌;第二类包含白细胞团;第三类为人造物。
将大微粒SVM第一层训练输入的第四类再人工筛选为三类作为大微粒SVM第二层第四类训练库输入,其中第一类包含杆菌;第二类包含精子;第三类为人造物。
另外,对于小颗粒训练库,通过人工筛选,将小微粒训练库分为四类,作为小微粒SVM第一层训练库输入,其中,第一类包含圆形的白细胞、红细胞、滴虫、霉菌、脂肪滴;第二类包含线形的杆菌、精子;第三类包含非圆形和线形的小微粒有形成分;第四类包含人造物。
将小微粒SVM第一层训练输入的第一类再人工筛选为六类作为小微粒SVM第二层第一类训练库输入,其中第一类包含白细胞;第二类包含红细胞;第三类滴虫;第四类包含霉菌;第五类包含脂肪滴;第六类包含人造物。
将小微粒SVM第一层训练输入的第二类再人工筛选为三类作为小微粒SVM第二层第二类训练库输入,其中第一类包含杆菌;第二类包含精子;第三类包含人造物。
将小微粒SVM第一层训练输入的第三类再人工筛选为六类作为小微粒SVM第二层第三类训练库输入,其中第一类包含白细胞;第二类包含红细胞;第三类滴虫;第四类包含霉菌;第五类包含杆菌;第六类包含人造物。
通过上述分类方法,可以形成如图8所示的多个级联的有形成分图片库(集合)用于SVM分类器的训练。
S4、构建若干个级联SVM分类器并使用相应的有形成分图片库进行训练。
与上述具体实施例中的级联的有形成分图片库相对应地,所述级联SVM分类器具体可以包括与所述大微粒SVM第一层训练库相对应的大颗粒第一层SVM分类器、与所述小微粒SVM第一层训练库相对应的小颗粒第一层SVM分类器、与所述大微粒SVM第二层第一至四类训练库相对应的大颗粒第二层第一至四类SVM分类器以及与所述小微粒SVM第二层第一至四类训练库相对应的小颗粒第二层第一至四类SVM分类器。
在本发明的一具体实施例中,如图6所示,所述训练过程具体为:
S41、选择合适的训练特征。
将有形成分大小微粒以有形成分尺寸nSize界定,如果nSize>150
则判断该有形成分为大微粒,反之为小微粒;
nSize=Max(nWidth,nHeight)
其中,nHeight为有形成分高,nWidth为有形成分宽。
对于大颗粒SVM及小颗粒SVM第一层训练库,其训练特征包括:面积、形状系数、面积周长比、长宽比、轮廓角点数、轮廓角点分布、灰度均值、灰度方差、轮廓半径标准差、轮廓半径最小值、轮廓半径最大值、能量、中心圆内平均FFT、中心圆外平均FFT;
而对于所述大颗粒SVM及小颗粒SVM第二层训练库,其训练特征则包括:面积、形状系数、面积周长比、长宽比、轮廓角点数、轮廓角点分布、灰度均值、灰度方差、轮廓半径标准差、轮廓半径最小值、轮廓半径最大值、能量、二阶矩、相关性、对比度、逆差矩、和方差、小梯度优势、大梯度优势、能量、灰度熵、梯度熵、惯性。
S42、计算每类有形成分的所有特征,确定出每类有形成分中每一列特征的最大值fMax和最小值fMin,将所有特征归一化到【-1,1】范围内,归一化公式为:
Figure GDA0000966759030000151
其中,fValue为要归一化的值,fScale为归一化后的特征。
记归一化后的特征向量为特征内积为
Figure GDA0000966759030000153
Figure GDA0000966759030000154
映射变换为高维空间里面的特征,记为X=(x1,x2,x3,...,xn)。
S43、构造SVM分类器的目标函数。SVM多分类,本质上也是二分类,如果有K类,则需要
Figure GDA0000966759030000155
类之间进行两两比较。为了将两类目标分离出来,在高维空间中,我们需要找到一个最优超平面,使得这两类目标的几何间隔达到最大。几何间隔最大时的约束条件为:
yi[(WTX)+b]-1+ξi≥0
其中,yi表示分类标签,WT为系数矩阵,X为特征向量,b为截矩矩阵,ξi表示允许错分样本存在的非负松弛变量。寻优目标函数为:
Figure GDA0000966759030000161
其中,C>0为自定义惩罚因子。自定义惩罚因子的值越大,对错分样本的约束程度就越大。
S44、训练获得最优的SVM模型。对SVM训练的过程亦即是不断的寻优求解过程。为求所述目标函数的最小泛函值,构造Lagrange函数:
Figure GDA0000966759030000162
其中,αi为各样本对应的Lagrange系数。
在约束条件:
Σyiαi=0
0≤αi≤C
下计算
Figure GDA0000966759030000163
最大值时的解αi以及支持向量Xi
上述函数存在唯一解,假设
Figure GDA0000966759030000166
为最优解,则最优超平面的系数矩阵为:
Figure GDA0000966759030000164
系数矩阵计算完成后,计算截矩矩阵:
Figure GDA0000966759030000165
其中,X*(+1)、X*(-1)表示两类中任意一个支持向量。
通过上述的步骤,可以得到训练后的多个级联SVM分类器用于后续的有形成分图像的识别分类。
如图1所示,所述有形成分识别分类阶段则包括:
A1、提取待识别分类的有形成分图像的图像特征。对于有形成分图像的各种图像特征的计算方法具体如下所述:
面积:有形成分二值图像中微粒区域像素点数,记为S。
周长:有形成分二值图像中包围微粒区域的边界像素点数,记为l。
形状系数:θ=l2/S。
面积周长比:f=S/l。
长宽比:有形成分区域最小外接矩形长边与短边的比值,记有形成分区域最小外接矩形长边为m,短边为n,则长宽比e=m/n
角点:利用水平差分算子Sx、竖直差分Sy算子对有形成分灰度图像g进行滤波得到Tx和Ty
Figure GDA0000966759030000171
Figure GDA0000966759030000172
计算
Figure GDA0000966759030000181
中四个元素的值,然后再对四个元素进行高斯平滑滤波,对每一个元素图片mi进行高斯滤波,使用
Figure GDA0000966759030000182
正态分布(高斯函数)计算滤波模板,并使用该模板与原图像做卷积运算,得到滤波后图像接着计算角点响应量
Figure GDA0000966759030000183
如果该点的局部极大值存在,并且该点的角点响应量大于设定阈值nLimit,
则该点为角点。
灰度均值:微粒连通区域所有像素的灰度值的平均值。记微粒连通区域的点集合为{p1,p2,p3,...,pn},灰度值为{x1,x2,x3,...,xn},则灰度均
值为
nAvg=(Σxi)/n。
灰度方差:连通区域所有像素的灰度值的方差。记连通区域的点集合为{p1,p2,p3,...,pn},灰度值为{x1,x2,x3,...,xn},则灰度方差为
nVari=(∑(xi-nAvg)2)/n。
轮廓半径信息:记轮廓点集合为{b1,b2,b3,...,bn},质心为(x0,y0),则轮廓半径集合为{d1,d2,d3,...,dn},其中
轮廓半径均值为:
μi=(∑di)/n;
轮廓半径标准差为:
Figure GDA0000966759030000201
轮廓半径最大值为:
dmax=max{d1,d2,d3,...,dn};
轮廓半径最小值为:
dmin=min{d1,d2,d3,...,dn}。
频域FFT计算:将图像应用快速傅里叶变换(FFT)转换到频域,幅度的平方称为能量谱。由于幅度决定了一幅图像中含有的各种频率分量的多少,故可以用能量谱来表征频域特征。频域计算需要用到傅立叶变换,其公式为:设f(x,y)为图像(x,y)处像素值,其傅里叶变换用F(u,v)表示,则有:
Figure GDA0000966759030000202
其中,M、N分别为图像的宽和高。
对于图像进行傅立叶变换,运算量很大,一般都通过快速傅里叶变换来减少计算量。具体算法如下:
图像数据复数化处理,存入缓存。
纵向一维快速傅里叶变换,具体包含两步:数据序列逆序;对逆序后数据进行蝶形计算。
横向一维快速傅里叶变换。
计算频谱图,并输出。
FFT变换后,可以计算图像中心为圆心的某个圆内部的能量谱为:
Figure GDA0000966759030000211
圆外部的能量谱为:
Figure GDA0000966759030000212
二阶矩:二阶矩是图像灰度分布均匀性的度量。当灰度共生矩阵中的元素分布较集中于主对角线时,说明从局部区域观察图像的灰度分布是均匀的。从图像整体观察发现,纹理较粗,此时二阶矩值则较大,反过来则二阶矩值较小。二阶矩也是灰度共生矩阵像素值平方的和,所以它也称为能量。粗纹理二阶矩值较大,可以理解为粗纹理含有较多的能量。细纹理较小,也即它含有较小的能量,计算如下:
f1=ΣΣpδ 2(i,j)
相关性:相关能够被用来衡量灰度共生矩阵的元素在行的方向或列的方向的相似程度,计算如下:
其中,
μ1=∑i∑ijpδ(i,j)
μ2=∑j∑ijpδ(i,j)
σ1 2=Σ(i-μ1)2Σpδ(i,j)
σ2 2=Σ(j-μ2)2Σpδ(i,j)
熵:熵值是图像具有的信息量的度量,纹理信息是图像信息的一种。若图像没有任何纹理,则灰度共生矩阵几乎为零阵,熵值接近为0。如果图像充满着细纹理,该图像的熵值最大。若图像中分布着较少的纹理,的数值差别较大,则该图像的熵值就较小,计算如下:
f3=-ΣiΣpδ(i,j)logpδ(i,j)
对比度:图像的对比度可以理解为图像的清晰度,即纹理的清晰程度。在图像中,纹理的沟纹越深,则其对比度越小,图像的视觉效果就会越清晰,计算如下:
f4=Σ(ΣΣ|i-j|2pδ(i,j))
逆差矩:
Figure GDA0000966759030000231
和方差:
Figure GDA0000966759030000232
Figure GDA0000966759030000233
灰度-梯度共生矩阵特征:灰度-梯度共生矩阵法是灰度级直方图和边缘直方图的结合,它考虑的是像素级灰度和边缘梯度大小的联合统计分布。灰度直方图是一幅图像灰度在图像中分布的最基本统计信息,而图像的梯度捡出了图像中的灰度跳变部分。将图像的梯度信息加进灰度共生矩阵,则使得共生矩阵更能包含图像的纹理基元及其排列的信息。灰度-梯度共生矩阵常用的特征参数有:
1)小梯度优势:
Figure GDA0000966759030000241
2)大梯度优势:
3)能量:
Figure GDA0000966759030000243
4)灰度熵:
T4=-ΣΣH(i,j)logΣHj(i,j)
5)梯度熵:
T5=-∑∑H(i,j)log∑Hi(i,j)
6)惯性:
T5=∑∑(i-j)2H(i,j)
A2、依据所述图像特征,将有形成分图像分派至相应的SVM分类器中进行识别分类。
具体的,如图7所示,所述步骤A2具体包括:
A21、计算有形成分图像的图像特征并进行归一化。
A22、将归一化后的特征向量映射变换为高维空间的特征向量。
A23、依据有形成分图像的尺寸,确定其属于大颗粒还是小颗粒部分,然后将其分派至相对应的大颗粒或者小颗粒第一层次SVM分类器中。
例如,设其被派至分支Si里面,记分支Si的SVM第一层分类判别函数为:
Figure GDA0000966759030000251
其中,α1 *为第一层系数矩阵,b1 *为第一层截矩矩阵,
Figure GDA0000966759030000252
为第一层支持向量集里面的某一个向量,
Figure GDA0000966759030000253
为该向量的分类标签。
A24、通过所述大颗粒或者小颗粒第一层次SVM分类器进行类别判定;依据类别判定结果,分派至对应类别的第二层次SVM分类器中进行识别。例如,假设经过第一层分类判别后,其进入的类别为Ci,记Ci的SVM第二层分类判别函数为:
Figure GDA0000966759030000254
其中,α2 *为第二层系数矩阵,b2 *为第二层截矩矩阵,
Figure GDA0000966759030000255
为第二层支持向量集里面的某一个向量,
Figure GDA0000966759030000256
为该向量的分类标签。
A25、输出最终的有形成分图像的分类识别结果。
可以理解的是,对本领域普通技术人员来说,可以根据本发明的技术方案及本发明构思加以等同替换或改变,而所有这些改变或替换都应属于本发明所附的权利要求的保护范围。

Claims (4)

1.一种基于SVM的有形成分分类方法,其特征在于,所述方法包括:
SVM训练阶段:
A、获取包含有若干种有形成分的样本图片作为训练样本;
B、将所述样本图片分割为若干有形成分图像;
C、提取所述有形成分图像的图像特征并依据所述图像特征,将所述有形成分图像进行分类,构建具有若干个级联有形成分图片库;
D、构建若干个级联SVM分类器并使用相应的有形成分图片库进行训练;
有形成分识别分类阶段:
E、提取待识别分类的有形成分图像的图像特征;
F、依据所述图像特征,将有形成分图像分派至相应的SVM分类器中进行识别分类;
所述若干种有形成分包括上皮细胞、线索细胞、滴虫、白细胞、红细胞、霉菌、杆菌、精子、脂肪滴以及人造物;
所述步骤B具体包括:
对所述样本图片进行高斯滤波;
使用Sobel算子对高斯滤波后图像进行边缘检测,获得样本图片的梯度图像;
对所述梯度图像进行二值化,形成二值化图像;
使用区域生长法对所述二值化图像进行图像分割,获得若干有形成分图像;
所述步骤C具体包括:
依据预设的尺寸阈值,将尺寸大于所述尺寸阈值的有形成分图像放入大颗粒训练库中,将尺寸小于所述尺寸阈值的有形成分图像放入小颗粒训练库中;
通过人工筛选,将大微粒训练库分为五类,作为大微粒SVM第一层训练库;其中第一类包含鳞状上皮细胞、线索细胞;第二类包含底层上皮、滴虫;第三类包含霉菌、白细胞团;第四类包含杆菌、精子;第五类包含人造物;
将大微粒SVM第一层训练库输入的第一类再人工筛选为三类作为大微粒SVM第二层第一类训练库输入,其中第一类包含鳞状上皮细胞;第二类包含线索细胞;第三类为人造物;
将大微粒SVM第一层训练输入的第二类再人工筛选为三类作为大微粒SVM第二层第二类训练库输入,其中第一类包含底层上皮;第二类包含滴虫;第三类为人造物;
将大微粒SVM第一层训练输入的第三类再人工筛选为三类作为大微粒SVM第二层第三类训练库输入,其中第一类包含霉菌;第二类包含白细胞团;第三类为人造物;
将大微粒SVM第一层训练输入的第四类再人工筛选为三类作为大微粒SVM第二层第四类训练库输入,其中第一类包含杆菌;第二类包含精子;第三类为人造物;
通过人工筛选,将小微粒训练库分为四类,作为小微粒SVM第一层训练库输入,其中,第一类包含圆形的白细胞、红细胞、滴虫、霉菌、脂肪滴;第二类包含线形的杆菌、精子;第三类包含非圆形和线形的小微粒有形成分;第四类包含人造物;
将小微粒SVM第一层训练输入的第一类再人工筛选为六类作为小微粒SVM第二层第一类训练库输入,其中第一类包含白细胞;第二类包含红细胞;第三类滴虫;第四类包含霉菌;第五类包含脂肪滴;第六类包含人造物;
将小微粒SVM第一层训练输入的第二类再人工筛选为三类作为小微粒SVM第二层第二类训练库输入,其中第一类包含杆菌;第二类包含精子;第三类包含人造物;
将小微粒SVM第一层训练输入的第三类再人工筛选为六类作为小微粒SVM第二层第三类训练库输入,其中第一类包含白细胞;第二类包含红细胞;第三类滴虫;第四类包含霉菌;第五类包含杆菌;第六类包含人造物;
所述步骤D具体包括:
选择预定的训练特征;
计算每类有形成分的训练特征,并确定每一训练特征的最大值和最小值;
将所述训练特征归一化至【-1,1】的范围内;
将归一化后的训练特征映射变换为高维空间中的特征向量;
构造所述SVM分类器的目标函数;
进行训练从而获得最优的SVM分类器;
所述步骤F具体包括:
计算有形成分图像的图像特征并进行归一化;
将归一化后的特征向量映射变换为高维空间的特征向量;
依据有形成分图像的尺寸,分派至相对应的大颗粒或者小颗粒第一层次SVM分类器中;
通过所述大颗粒或者小颗粒第一层次SVM分类器进行类别判定;
依据类别判定结果,分派至对应类别的第二层次SVM分类器中进行识别;
输出有形成分图像的分类识别结果;
所述级联SVM分类器具体包括与所述大微粒SVM第一层训练库相对应的大颗粒第一层SVM分类器、与所述小微粒SVM第一层训练库相对应的小颗粒第一层SVM分类器、与所述大微粒SVM第二层第一至四类训练库相对应的大颗粒第二层第一至四类SVM分类器以及与所述小微粒SVM第二层第一至四类训练库相对应的小颗粒第二层第一至四类SVM分类器;
所述预设的尺寸阈值为150,如果有形成分尺寸nSize>150,则判断有形成分为大微粒,反之为小微粒;
nSize=Max(nWidth,nHeight)
其中,nHeight为有形成分高,nWidth为有形成分宽。
2.根据权利要求1所述的有形成分分类方法,其特征在于,所述“将归一化后的训练特征映射变换为高维空间中的特征向量”的步骤具体为:将归一化后的训练特征向量经如下公式映射变换为高维空间中的特征向量;
Figure FDA0002248072420000041
其中,
Figure FDA0002248072420000042
为归一化后的训练特征向量,为特征内积,X=(x1,x2,x3,...,xn)为高维空间中的特征向量,m为归一化后的训练特征的数量。
3.根据权利要求1所述的有形成分分类方法,其特征在于,所述“构造所述SVM分类器的目标函数”的步骤具体为:
在所述高维空间中确定一个使得两类目标的几何间隔达到最大的最优超平面;
所述几何间隔最大时的约束条件为:
yi[(WTX)+b]-1+ξi≥0
其中,yi表示分类标签,WT为系数矩阵,X为特征向量,b为截矩矩阵,ξi表示允许错分样本存在的非负松弛变量;
所述目标函数具体为:
Figure FDA0002248072420000044
其中,C>0为自定义惩罚因子。
4.根据权利要求1所述的有形成分分类方法,其特征在于,所述大颗粒SVM及小颗粒SVM第一层训练库的训练特征包括:面积、形状系数、面积周长比、长宽比、轮廓角点数、轮廓角点分布、灰度均值、灰度方差、轮廓半径标准差、轮廓半径最小值、轮廓半径最大值、能量、中心圆内平均FFT、中心圆外平均FFT;
所述大颗粒SVM及小颗粒SVM第二层训练库的训练特征包括:面积、形状系数、面积周长比、长宽比、轮廓角点数、轮廓角点分布、灰度均值、灰度方差、轮廓半径标准差、轮廓半径最小值、轮廓半径最大值、能量、二阶矩、相关性、对比度、逆差矩、和方差、小梯度优势、大梯度优势、能量、灰度熵、梯度熵、惯性。
CN201510603254.7A 2015-09-21 2015-09-21 一种基于svm的有形成分分类方法 Active CN105654107B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510603254.7A CN105654107B (zh) 2015-09-21 2015-09-21 一种基于svm的有形成分分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510603254.7A CN105654107B (zh) 2015-09-21 2015-09-21 一种基于svm的有形成分分类方法

Publications (2)

Publication Number Publication Date
CN105654107A CN105654107A (zh) 2016-06-08
CN105654107B true CN105654107B (zh) 2020-01-17

Family

ID=56482051

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510603254.7A Active CN105654107B (zh) 2015-09-21 2015-09-21 一种基于svm的有形成分分类方法

Country Status (1)

Country Link
CN (1) CN105654107B (zh)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106529600B (zh) * 2016-11-16 2019-06-04 桂林理工大学 一种基于svm的高分辨率光学影像建筑物角点识别方法
CN106778603A (zh) * 2016-12-13 2017-05-31 中国科学院信息工程研究所 一种基于梯度式级联svm分类器的行人识别方法
CN106682633B (zh) * 2016-12-30 2019-08-20 四川沃文特生物技术有限公司 基于机器视觉的粪便镜检图像有形成分的分类识别方法
CN107609585A (zh) * 2017-09-08 2018-01-19 湖南友哲科技有限公司 一种基于卷积神经网络的体液细胞显微图像识别方法
CN108304859B (zh) * 2017-12-29 2021-03-30 达闼科技(北京)有限公司 图像识别方法及云端系统
CN108564114B (zh) * 2018-03-28 2022-05-27 电子科技大学 一种基于机器学习的人体粪便白细胞自动识别方法
US11055447B2 (en) * 2018-05-28 2021-07-06 Tata Consultancy Services Limited Methods and systems for adaptive parameter sampling
CN109344852A (zh) * 2018-08-01 2019-02-15 迈克医疗电子有限公司 图像识别方法和装置、分析仪器和存储介质
CN109859199B (zh) * 2019-02-14 2020-10-16 浙江科技学院 一种sd-oct图像的淡水无核珍珠质量检测的方法
CN110059656B (zh) * 2019-04-25 2021-05-11 山东师范大学 基于卷积对抗生成神经网络的白细胞分类方法及系统
CN110415246B (zh) * 2019-08-06 2023-05-16 东北大学 一种腹部脂肪成分的分析方法
CN110633676B (zh) * 2019-09-18 2023-04-18 东北大学 一种自动识别脑脊液细胞图像信息方法
CN111062296B (zh) * 2019-12-11 2023-07-18 武汉兰丁智能医学股份有限公司 一种基于计算机的白细胞自动识别分类方法
CN112301094A (zh) * 2020-07-22 2021-02-02 迪瑞医疗科技股份有限公司 一种阴道分泌物干化学有形成分分析复合质控物及其制备方法
CN112102341B (zh) * 2020-08-29 2024-09-06 深圳市瑞沃德生命科技股份有限公司 一种细胞图像分割方法及其装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101900737A (zh) * 2010-06-10 2010-12-01 上海理工大学 基于支持向量机的尿沉渣有形成分自动识别系统
CN102323281A (zh) * 2011-08-22 2012-01-18 长沙高新技术产业开发区爱威科技实业有限公司 液体性质检测方法和系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2570970A1 (en) * 2011-09-16 2013-03-20 Technische Universität Berlin Method and system for the automatic analysis of an image of a biological sample

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101900737A (zh) * 2010-06-10 2010-12-01 上海理工大学 基于支持向量机的尿沉渣有形成分自动识别系统
CN102323281A (zh) * 2011-08-22 2012-01-18 长沙高新技术产业开发区爱威科技实业有限公司 液体性质检测方法和系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
一种基于线性SVM的级联分类器的构造方法;安平 等;《计算机工程与应用》;20081231;第39-40页 *
基于SVM算法的尿沉渣细胞分类识别系统的研究;涂林林;《中国优秀硕士学位论文全文数据库 信息科技辑》;20150415;第23-37页 *

Also Published As

Publication number Publication date
CN105654107A (zh) 2016-06-08

Similar Documents

Publication Publication Date Title
CN105654107B (zh) 一种基于svm的有形成分分类方法
CN109800824B (zh) 一种基于计算机视觉与机器学习的管道缺陷识别方法
Shirazi et al. Efficient leukocyte segmentation and recognition in peripheral blood image
Salem Segmentation of white blood cells from microscopic images using K-means clustering
CN109636824A (zh) 一种基于图像识别技术的多目标计数方法
Isa Automated edge detection technique for Pap smear images using moving K-means clustering and modified seed based region growing algorithm
Bagasjvara et al. Automated detection and classification techniques of Acute leukemia using image processing: A review
CN106127735B (zh) 一种设施蔬菜边缘清晰类叶面病斑分割方法及装置
del Pozo-Banos et al. Features extraction techniques for pollen grain classification
Hamednejad et al. Retinal optic disk segmentation and analysis in fundus images using DBSCAN clustering algorithm
Putzu et al. Investigation of different classification models to determine the presence of leukemia in peripheral blood image
Kim et al. Automatic cell classification in human’s peripheral blood images based on morphological image processing
WO2016192213A1 (zh) 一种图像特征提取方法和装置、存储介质
Dissanayake et al. Plant leaf identification based on machine learning algorithms
Ampilova et al. On application of entropy characteristics to texture analysis
El-Tarhouni et al. Feature fusion using the local binary pattern histogram fourier and the pyramid histogram of feature fusion using the local binary pattern oriented gradient in iris recognition
Cicconet et al. Wavelet-based Circular Hough Transform and Its Application in Embryo Development Analysis.
Ambriz-Colin et al. Detection of biological cells in phase-contrast microscopy images
Frejlichowski Identification of erythrocyte types in greyscale MGG images for computer-assisted diagnosis
Rathore et al. A novel approach for ensemble clustering of colon biopsy images
CN110599462A (zh) 一种基于不平衡Fisher判别分析的尿沉渣检测方法
Nasr-Isfahani et al. A new approach for touching cells segmentation
Gim et al. A novel framework for white blood cell segmentation based on stepwise rules and morphological features
Rai et al. Appearance based gender classification with PCA and (2D) 2 PC A on approximation face image
Jiuxian et al. Face detection based on self-skin segmentation and wavelet support vector machine

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 130103 No. 3333 livable Road, hi tech Development Zone, Jilin, Changchun

Applicant after: Medical Polytron Technologies Inc

Address before: 130103 No. 3333 livable Road, hi tech Development Zone, Jilin, Changchun

Applicant before: Changchun Dirui Medical Technology Co., Ltd.

GR01 Patent grant
GR01 Patent grant