CN105404887B - 一种基于随机森林的白细胞五分类方法 - Google Patents

一种基于随机森林的白细胞五分类方法 Download PDF

Info

Publication number
CN105404887B
CN105404887B CN201510398384.1A CN201510398384A CN105404887B CN 105404887 B CN105404887 B CN 105404887B CN 201510398384 A CN201510398384 A CN 201510398384A CN 105404887 B CN105404887 B CN 105404887B
Authority
CN
China
Prior art keywords
leucocyte
feature
random forest
shape
nuclear
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510398384.1A
Other languages
English (en)
Other versions
CN105404887A (zh
Inventor
曹飞龙
怀听听
赵建伟
周正华
冯爱明
楚建军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Jiliang University
Original Assignee
China Jiliang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Jiliang University filed Critical China Jiliang University
Priority to CN201510398384.1A priority Critical patent/CN105404887B/zh
Publication of CN105404887A publication Critical patent/CN105404887A/zh
Application granted granted Critical
Publication of CN105404887B publication Critical patent/CN105404887B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]
    • G06V10/464Salient features, e.g. scale invariant feature transforms [SIFT] using a plurality of salient features, e.g. bag-of-words [BoW] representations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/03Recognition of patterns in medical or anatomical images

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明公开了一种基于随机森林的白细胞五分类方法,提取能够有效的区分不同细胞类型的特征,采用SVM分类器进行降维处理,得到LBP特征在每一类白细胞上的分数;利用k‑means聚类算法对细胞核形状特征进行聚类,得到每一类细胞核的中心形状,之后计算形状特征与中心形状的距离,并把它作为衡量细胞核形状相似度的一个度量,距离越小表示两个细胞核形状越相似,利用随机森林分类器对白细胞进行分类。本发明的有益效果是误差小,效率高。

Description

一种基于随机森林的白细胞五分类方法
技术领域
本发明属于医学图像处理技术领域,涉及一种基于随机森林的白细胞五分类方法。
背景技术
人体血液白细胞的自动识别是近些年来医学图像处理与应用领域研究中最热门课题之一,也是一项复杂而意义重大的研究工作。白细胞的计数和分类是医学血液常规检查的最主要项目之一,临床上血液常规检查主要包括各类白细胞的计数以及形态特征分析,这些数据是医护人员诊断血液系统疾病的重要依据,有助于帮助医生做出正确诊断、制定治疗方案和观察疗效。五类白细胞在人体外周血液中通常呈现不同的形态和大小,而且每一类所占的数量比例也有很大差异。传统手工操作的血液常规检查通常由专家通过显微镜用肉眼检验,费时费力,工作量十分繁重,且识别误差受专家的经验、疲劳程度等主观因素影响较大。因此,研究外周血液中五类白细胞自动识别的问题对于医学临床分析具有重大意义。目前,许多学者在白细胞自动识别方面做了大量的研究,提出了许多实用的血液白细胞分类识别方法,主要包括:一种白细胞分类溶血剂及其试剂盒、一种基于支持向量机的白细胞自动识别方法、一种白细胞分类方法及装置。其特点如下:
(1)专利《一种白细胞分类溶血剂及其试剂盒》(专利号201310241478.9)利用分类溶血剂中包含的非离子表面活性剂快速溶解红细胞和血小板,并进行白细胞总数和血红蛋白和嗜碱性粒细胞的分析计数;然后再加入一种抑制剂,抑制分类试剂对于白细胞的持续损伤,保持白细胞的各个亚群的形态,进行白细胞四分群的分析计数,分别是淋巴细胞、单核细胞、中性粒细胞和嗜酸性粒细胞,同时也对嗜碱性粒细胞进行分类,最终实现白细胞的五分类计数。
缺点:本发明只适用于南京普朗医用设备有限公司生产的XFA9500全自动五分类血液细胞分析仪,是它的配套试剂。
(2)专利《一种基于相关向量机的白细胞自动识别方法》(专利201310656438.0)利用支持向量机进行白细胞自动识别的主要思想是,利用血液显微图像特征的色调信息,通过基于相关向量机的灰度图像分割方法完成色调图像的粗分割;借助模糊细胞神经网络FCNN检出所有白细胞;使用聚类分析法确定阈值,结合阈值分割和二值形态学方法对包含单个白细胞的局部图像分别进行细分割;在前一步得到的局部图像的基础上,提取最具有代表性的白细胞特征,包括形态、彩色和纹理等三类共47个特征;利用支持向量机完成对白细胞的识别与分类。
缺点:这类方法在进行白细胞分割时只考虑到了图像的灰度信息,分割错误可能导致对后续的特征提取以及分类产生误差;在对白细胞分类识别时,需要提取的特征也很多。
(3)专利《一种白细胞分类方法及装置》(专利号201410041995.6)利用BP神经网络对血液白细胞分类识别的方法,首先需要对染色后的白细胞血样样本进行图像采集,得到白细胞血液样本图像;然后将白细胞血液样本图像的各类细胞分割出来,分别提取各类细胞的细胞形态学特征参数;接下来将分割后的各类细胞进行二次分割,分别得到细胞核图像、细胞质及颗粒图像,并提取细胞的颜色和颗粒特征等信息。最后把归一化的特征送入神经网络分类器,以此来实现对五类白细胞的识别。
缺点:该方法需要对白细胞进行二次分割,提取大量的特征参数,而且BP神经网络训练速度较慢,容易陷入过拟合状态。
发明内容
本发明的目的在于提供一种基于随机森林的白细胞五分类方法,解决了现有方法的误差大,效率低的问题。
本发明所采用的技术方案是
1)提取细胞核形状特征:提取能够有效的区分不同细胞类型的特征,包括圆形度、核质比、形状和RGB颜色通道的旋转不变共生LBP局部二值模式特征;
2)针对旋转不变共生LBP局部二值模式特征维数太高的特点,采用了χ2距离作为核函数的SVM分类器进行降维处理,得到LBP特征在每一类白细胞上的分数;
3)利用k-means聚类算法对细胞核形状特征进行聚类,得到每一类细胞核的中心形状,之后计算形状特征与中心形状的距离,并把它作为衡量细胞核形状相似度的一个度量,距离越小表示两个细胞核形状越相似;
4)利用随机森林分类器对白细胞进行分类:
对白细胞特征进行组合并作归一化,并把这些特征数据作为随机森林分类器的输入,设置随机森林分类器的参数对五类白细胞进行分类。
本发明的有益效果是误差小,效率高。
附图说明
图1为本发明的整体框图。
具体实施方式
下面结合具体实施方式对本发明进行详细说明。
由于血液白细胞细胞类型和数量的差异性以及细胞形态特征的复杂性,包括细胞种类繁多、细胞核形状多样、颗粒特征分布不均匀、以及细胞质颜色信息差异等问题,我们把白细胞的分类识别工作分为两步:提取能有效描述不同白细胞类型的特征并进行后续处理,利用随机森林算法实现对白细胞的精准分类。
步骤一:在分割后的白细胞图像中提取特征:
1、根据医学上对不同类型的白细胞描述,提取能够有效的区分不同细胞类型的特征,包括圆形度、核质比、形状和RGB颜色通道的PRICoLBP特征(旋转不变共生LBP(局部二值模式)特征)。
2、针对旋转不变共生LBP维数太高的特点,我们采用核函数(核函数方法是通过一个特征映射可以将输入空间(往往是低维的)中的线性不可分数据映射成高维特征空间中(再生核Hilbert空间)中的线性可分数据,)为χ2距离,(卡方距离是利用列联表分析的方法得到一个卡方统计量来衡量两个体之间的差异性的度量)的SVM(支持向量机是建立在统计学习理论基础之上的新一代机器学习算法,它的优势主要体现在通过引入核函数,巧妙地解决了在高维空间中的内积运算,从而很好地解决了非线性分类问题)作为分类器对单一的共生旋转LBP特征进行分类,得到共生旋转LBP特征在每一类白细胞的贡献率,即分数。利用LBP特征在每一类白细胞上的分数替代原来的纹理特征既起到了对共生旋转LBP进行降维的目的,同时又保证了它在每一类白细胞上的有效识别度。
3、利用k-means聚类算法对提取的细胞核形状特征进行中心聚类。(细胞核的形状是指白细胞的细胞核的边界所围成的封闭的曲线)由于细胞类型的不同,五类白细胞的细胞核通常呈现形态不一的形状,特别地对于单核和多核细胞,细胞核形状差异更为明显,而且处于不同生长时期的细胞核形状也有差异。为了有效描述不同类型白细胞的形状信息,本发明利用积分不变量来提取细胞核的形状特征,并且由它提取的细胞核形状对于图像旋转和尺寸变换具有不变性。在提取的每一类细胞核形状中利用k-means聚类算法找出四个中心,即每类细胞核的代表性形状;计算所有提取的细胞核形状与对应形状中心的距离,并把它作为所有细胞核形状特征与每一类形状中心的匹配用于描述细胞核的形状,得到中心距匹配结果。
步骤二:利用随机森林分类器对白细胞进行分类:
1、将中心距细胞核形状中心距匹配结果、圆形度、核质比、LBP特征在每一类白细胞上的分数进行特征组合归一化,作为随机森林分类器的输入。
2、调节随机森林分类器的参数对五类白细胞进行分类。(本发明中设置随机森林的规模大小为100,每个分裂节点随机选择的分裂属性维数大小是原始特征总维数的算术平方根取整得到的数目。试验总共重复进行100次,一次分类实验在每一类白细胞特征样本中随机选取50%的样本用于分类器的训练,剩余的白细胞特征用于分类测试。发明中总的实验结果是取自于100次分类实验的平均结果。)
随机森林是由若干个相互独立的决策树构成的一个多分类器。每棵决策树相当于一个独立的分类器{h(x,θk,M)|k=1,2,L,N},其中,{θk,M|k=1,2,L,N}是训练决策树的样本集合,N是样本个数,x为测试样本的特征向量。单棵决策树的训练过程如下:在大小为N的原始样本中按照有放回的bagging采样规则进行N次随机采样得到{θk,M},把它作为决策树根节点的训练样本。决策树在当前节点的M维特征属性中随机选择其中的m(m<<M)维,并逐个计算它们的基尼不纯度指数,利用基尼不纯度最小准则选出不纯度指数最小的特征,把它作为该节点的分裂属性,由分裂函数把当前树在此节点分为左右两支子树,以此循环直到不能再分裂或到达叶子节点为止。
随机森林分类包含了训练和测试两部分,由于决策树的训练是两个随机选择的过程,所以决策树的深度可以达到最大,在训练过程中不会出现过拟合的问题。随机森林对一个新的测试样本x分类,每棵决策树会给出一个类别判断,最后随机森林综合所有决策树的投票,按照最大投票法则得出分类结果,即把每棵决策树给出的分类看作是“选票”,随机森林分类要选出得票数最多的那一类作为测试样本的分类结果。
本发明涉及一种基于随机森林的白细胞五分类方法,实现了对人体血液中白细胞的精确分类。首先,根据医学上对五种白细胞的特征描述,在分割的细胞图像中提取了圆形度、核质比、形状和多颜色共生旋转LBP等特征。然后利用SVM分类器和k-means聚类算法对提取的白细胞特征进行维数约减和形状中心聚类。最后利用随机森林分类方法对归一化的特征进行分类,从而产生最终的白细胞识别结果。
众所周知,血液中各类白细胞的计数是医学血常规检查的主要项目之一。临床上医护人员常以血常规中各类白细胞的个数和形态特征作为系统疾病诊断的重要依据。根据细胞的不同形态和大小,白细胞可以分为嗜碱性粒细胞、嗜酸性粒细胞、淋巴细胞、单核细胞和中性粒细胞五大类。每一类白细胞都各自具有自身独特的特征,对于每一类白细胞如何提取其最具代表性的特征,对于区分不同细胞类型是十分关键的。
本发明在常用的核质比和圆形度等特征的基础上,将提取细胞核和细胞质中的某些重要信息作为特征,特别是细胞质中的纹理和颜色特征(如颗粒、颜色以及核质比等)以及细胞核的形状信息,加大白细胞的类别区分度;针对纹理特征和形状信息的数据特点,在保证不减少特征描述能力的情况下,分别采用支持向量机和聚类算法对它们进行一系列处理,减少特征数据的维数;然后利用运行速度快、识别精度高的随机森林分类器对所提取的特征进行分类,实验在800张的白细胞数据库上取得了较为满意的识别精度。下表1是本发明的白细胞五分类实验结果。
表1白细胞五分类实验结果(%)
以上所述仅是对本发明的较佳实施方式而已,并非对本发明作任何形式上的限制,凡是依据本发明的技术实质对以上实施方式所做的任何简单修改,等同变化与修饰,均属于本发明技术方案的范围内。

Claims (1)

1.一种基于随机森林的白细胞五分类方法,其特征在于按照以下步骤:
1)提取细胞特征:提取能够有效的区分不同细胞类型的特征,包括细胞核的圆形度、细胞的核质比、细胞核的形状和细胞质的RGB颜色通道的旋转不变共生LBP局部二值模式特征;
2)针对旋转不变共生LBP局部二值模式特征维数太高的特点,采用了以χ2距离作为核函数的SVM分类器进行降维处理,得到LBP特征在每一类白细胞上的分数;
3)利用k-means聚类算法对细胞核形状特征进行聚类,得到每一类细胞核的中心形状,之后计算形状特征与中心形状的距离,并把它作为衡量细胞核形状相似度的一个度量,距离越小表示两个细胞核形状越相似;
4)利用随机森林分类器对白细胞进行分类:
对白细胞特征进行组合并作归一化,并把这些特征数据作为随机森林分类器的输入,设置随机森林分类器的参数对五类白细胞进行分类。
CN201510398384.1A 2015-07-05 2015-07-05 一种基于随机森林的白细胞五分类方法 Active CN105404887B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510398384.1A CN105404887B (zh) 2015-07-05 2015-07-05 一种基于随机森林的白细胞五分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510398384.1A CN105404887B (zh) 2015-07-05 2015-07-05 一种基于随机森林的白细胞五分类方法

Publications (2)

Publication Number Publication Date
CN105404887A CN105404887A (zh) 2016-03-16
CN105404887B true CN105404887B (zh) 2019-04-09

Family

ID=55470363

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510398384.1A Active CN105404887B (zh) 2015-07-05 2015-07-05 一种基于随机森林的白细胞五分类方法

Country Status (1)

Country Link
CN (1) CN105404887B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108288265A (zh) * 2018-01-09 2018-07-17 东北大学 一种面向hcc病理图像细胞核的分割与分类方法
CN108416808B (zh) * 2018-02-24 2022-03-08 斑马网络技术有限公司 车辆重定位的方法及装置
CN108520498B (zh) * 2018-03-19 2020-11-03 大连理工大学 一种晶体结晶过程监测中的高效晶体阴影噪声去除方法
CN108564114B (zh) * 2018-03-28 2022-05-27 电子科技大学 一种基于机器学习的人体粪便白细胞自动识别方法
CN108876752A (zh) * 2018-07-06 2018-11-23 武汉兰丁医学高科技有限公司 血液细胞的图像识别计数方法
CN109034257A (zh) * 2018-08-02 2018-12-18 河北工程大学 一种细胞图像记录系统及分类方法
CN109492682A (zh) * 2018-10-30 2019-03-19 桂林电子科技大学 一种多分枝随机森林数据分类方法
CN110059656B (zh) * 2019-04-25 2021-05-11 山东师范大学 基于卷积对抗生成神经网络的白细胞分类方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102331393A (zh) * 2011-07-08 2012-01-25 无锡荣兴科技有限公司 一种对人体血液中细胞进行自动分类计算的方法
CN103353938A (zh) * 2013-06-14 2013-10-16 山东大学 一种基于层次级特征的细胞膜分割方法
CN103703371A (zh) * 2011-04-29 2014-04-02 癌症预防和治疗有限公司 使用分类系统及其试剂盒识别和诊断肺部疾病的方法
CN103745210A (zh) * 2014-01-28 2014-04-23 爱威科技股份有限公司 一种白细胞分类方法及装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8422754B2 (en) * 2011-02-15 2013-04-16 Siemens Aktiengesellschaft Medical imaging system
WO2013166373A1 (en) * 2012-05-03 2013-11-07 Zhong Wu Gene expression signature for il-6/stat3 signaling pathway and use thereof

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103703371A (zh) * 2011-04-29 2014-04-02 癌症预防和治疗有限公司 使用分类系统及其试剂盒识别和诊断肺部疾病的方法
CN102331393A (zh) * 2011-07-08 2012-01-25 无锡荣兴科技有限公司 一种对人体血液中细胞进行自动分类计算的方法
CN103353938A (zh) * 2013-06-14 2013-10-16 山东大学 一种基于层次级特征的细胞膜分割方法
CN103745210A (zh) * 2014-01-28 2014-04-23 爱威科技股份有限公司 一种白细胞分类方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Cell image classification based on ensemble features and random forest;KO B C etal.;《Electronics Letters》;20111231;第47卷(第11期);第638-639页
基于多空间混合属性融合的白细胞图像识别方法研究;郝连旺;《中国博士学位论文全文数据库 医药卫生科技辑》;20150115;第70-99页

Also Published As

Publication number Publication date
CN105404887A (zh) 2016-03-16

Similar Documents

Publication Publication Date Title
CN105404887B (zh) 一种基于随机森林的白细胞五分类方法
US11900598B2 (en) System and method of classification of biological particles
Sari et al. Unsupervised feature extraction via deep learning for histopathological classification of colon tissue images
Saraswat et al. Automated microscopic image analysis for leukocytes identification: A survey
Liu et al. Bone marrow cells detection: a technique for the microscopic image analysis
WO2013037119A1 (zh) 红细胞形态学分析装置及其方法
Mohapatra et al. Unsupervised blood microscopic image segmentation and leukemia detection using color based clustering
Delgado-Font et al. Diagnosis support of sickle cell anemia by classifying red blood cell shape in peripheral blood images
Pandit et al. Survey on automatic rbc detection and counting
Agrawal et al. HEp-2 cell image classification: A comparative analysis
Elsalamony Detection of anaemia disease in human red blood cells using cell signature, neural networks and SVM
Mohapatra et al. Unsupervised leukocyte image segmentation using rough fuzzy clustering
Muhamad et al. A comparative evaluation of deep learning methods in automated classification of white blood cell images
Navya et al. Classification of blood cells into white blood cells and red blood cells from blood smear images using machine learning techniques
Kareem An evaluation algorithms for classifying leukocytes images
Zheng et al. White blood cell segmentation based on visual attention mechanism and model fitting
Ruberto et al. A leucocytes count system from blood smear images.
Arunachalam Applications of Machine learning and Image processing techniques in the detection of leukemia
CN113255718B (zh) 一种基于深度学习级联网络方法的宫颈细胞辅助诊断方法
Mohapatra et al. Fast leukocyte image segmentation using shadowed sets
Darane et al. Recognizing Presence of Hematological Disease using Deep Learning
Arya Automated detection of acute leukemia using K-means clustering algorithm
Supriyanti et al. Unsupervised Method for Calculating Diameter and Number of Leukocyte Cells
Das et al. Survey on detection of Leukemia and its subtypes using Machine Learning techniques
Prabu et al. PSO for acute lymphoblastic leukemia classification in blood microscopic images

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
CB02 Change of applicant information

Address after: Hangzhou City, Zhejiang province 310018 Xiasha Higher Education Park source Street No. 258 China Jiliang University

Applicant after: CHINA JILIANG UNIVERSITY

Address before: Hangzhou City, Zhejiang province 310018 Xiasha Higher Education Park source Street No. 258 China Jiliang University

Applicant before: China Jiliang University

COR Change of bibliographic data
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant