CN105203446B - 基于概率分布细胞分类统计方法 - Google Patents

基于概率分布细胞分类统计方法 Download PDF

Info

Publication number
CN105203446B
CN105203446B CN201510583327.0A CN201510583327A CN105203446B CN 105203446 B CN105203446 B CN 105203446B CN 201510583327 A CN201510583327 A CN 201510583327A CN 105203446 B CN105203446 B CN 105203446B
Authority
CN
China
Prior art keywords
subgroup
scatter plot
cell
likelihood function
log likelihood
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510583327.0A
Other languages
English (en)
Other versions
CN105203446A (zh
Inventor
张炎
秦军芳
谭玉华
王涛
梁铁柱
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Exxon Guangzhou Bio Tech Ltd
Original Assignee
Exxon Guangzhou Bio Tech Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Exxon Guangzhou Bio Tech Ltd filed Critical Exxon Guangzhou Bio Tech Ltd
Priority to CN201510583327.0A priority Critical patent/CN105203446B/zh
Publication of CN105203446A publication Critical patent/CN105203446A/zh
Application granted granted Critical
Publication of CN105203446B publication Critical patent/CN105203446B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明涉及人体血细胞检测不同类型细胞分类识别技术。包括以下步骤:A.对原始散点图进行初始划分,确认亚群种类;B.分别计算各个亚群的高斯分布特征参数,并计算最大对数似然函数值;C.进入迭代计算,根据上次迭代输出的高斯分布函数,计算各细胞处于各个亚群的概率分布;D.根据各细胞概率分布重新计算各个亚群的高斯分布特征参数,并计算最大对数似然函数值;E.判定最大对数似然函数值是否收敛,若不收敛,则重复步骤C和D继续迭代计算,若收敛,则终止迭代,输出各亚群高斯分布特征参数和各细胞亚群类型。本发明对散点图初始分界线划分的准确性要求较低,降低了算法的复杂度,自适应能力强,提高了粒子分类的准确性和稳定性。

Description

基于概率分布细胞分类统计方法
技术领域
本发明涉及人体血细胞检测不同类型细胞分类识别技术,特别是一种基于概率分布细胞分类统计方法。
背景技术
随着医学临床要求的不断提高,对于人体血细胞的识别和划分要求更为细致和准确。目前五分类血液分析仪得到了各级医疗单位的青睐,五分类血液细胞分析仪是根据细胞的内外部结构特征将白细胞划分成五个亚群,其具体包括淋巴细胞(Lym)、单核细胞(Mon)、中性粒细胞(Neu)、嗜酸粒细胞(Eos)、嗜碱粒细胞(Baso)。现阶段大部分仪器厂商采用层流技术结合光学检测的方式,高端五分类机型利用荧光和散射光组合成超过三维信号将白细胞进行五分群,中低端五分类机型利用散射光形成二维及三维散射信号,将白细胞分为四个亚群,另外一类亚群(Baso)则是通过传统的阻抗法进行计数统计。相对早期的散点图分类方法大多采用的是固定区域法,例如专利US4727020、US4599307中提到的利用设置区域界限的方式将样本空间划分为不同种类,落在同一区域的样本认为是同一类细胞。但由于区域界限为固定的,不能随实际样本分布情况变化,就会导致准确性不过高,适用性不够普遍。专利US5627040引入了重心引力因子可以自动调整区域边界,但各个区域的方位、大小和形状依然是固定的,虽然解决了固定区域法的部分弊端,但适用性仍不够普遍。专利CN101226190采用了K-Means聚类算法,先指定几个亚群的质心,计算每个样本点到各个质心的有效距离,选择距离最近的就将该样本点归于该亚群;重新计算各个亚群的质心,再迭代重复计算上几步,直到各个亚群的质心位置不在变化。其中有效距离可以选择欧式距离、绝对距离、Minkowski距离、Chebyshev距离、方差加权距离和马氏距离中任意一种。该种方法只需要对初始聚类质心点选择合适,就能准确的对各个亚群准确分类。但该方法比较适合“球类”聚类分布的样本,对“非球类”聚类分布的样本分类结果有比较大的偏差。专利CN103776751通过需找闭合等高线来确定各个亚群的分界线,能够处理不规则的边界,能够提高分类的精度,但对与边界有重叠的亚群就容易被识别为同一亚群,从而产生误判。
发明内容
本发明的目的是提供一种能够细致和准确地对多维细胞散点图不同亚群的区分和统计的分类统计方法。
本发明的目的是通过如下途径实现的:
基于概率分布细胞分类统计方法,其特征是包括以下步骤:
A.对原始散点图进行初始划分,确认亚群种类;
B.分别计算各个亚群的高斯分布特征参数,并计算最大对数似然函数值;
C.进入迭代计算,根据上次迭代输出的高斯分布函数,计算各细胞处于各个亚群的概率分布;
D.根据各细胞概率分布重新计算各个亚群的高斯分布特征参数,并计算最大对数似然函数值;
E.判定最大对数似然函数值是否收敛,若不收敛,则重复步骤C和D继续迭代计算,若收敛,则终止迭代,输出各亚群高斯分布特征参数和各细胞亚群类型。
所述对原始散点图进行初始划分是对原始散点图进行去噪处理,根据直方图趋势寻找血影分界线,去除血影,对原始散点图进行初始分类,确认亚群种类。
所述计算各个亚群的高斯分布特征参数是:
K为白细胞亚群的数量,πk为每个亚群的权重,N(x|μk,∑k)为每个亚群的高斯概率密度分布函数,μk均值,∑k为方差;
对数似然函数采用分步迭代的方法来进行参数估计,第k个亚群产生的概率为:
对应的特征参数分别为: 其中
重复迭代前面两步,直到对数似然函数收敛。
本发明的积极效果:本发明基于概率分布细胞分类统计方法对散点图初始分界线划分的准确性要求较低,降低了算法的复杂度,自适应能力强,提高了粒子分类的准确性和稳定性,能够细致和准确地实现对多维细胞散点图不同亚群的区分和统计。
附图说明
图1为本发明细胞分类算法流程图
图2为本发明二维原始散点图
图3为本发明散点图血影分界线图
图4为本发明散点图各亚群初始分界线图
图5为本发明散点图各亚群分布范围图
图6为本发明散点图分类结果图
图7为本发明细胞分类检测装置示意图
具体实施方式
下面结合说明书附图对本发明作详细说明:
本发明基于概率分布细胞分类统计方法涉及到的细胞分类检测装置分为3个部分组成:前光整形组件、样本整流组件和散射光收集组件,如图7所示,前光整形组件主要功能是对照射光束进行整形处理,让照射光斑匹配到试剂处理后白细胞大小;样本整流组件主要功能是保证试剂处理过的白细胞一字排列依次通过照射光斑,产生散射光信号;散射光收集组件主要功能是将划分的各个区域(至少两个区域)的散射光信号转化为电脉冲信号,并识别对应的峰值点形成样本集合。对于上述分类检测装置得到的白细胞样本集合,根据中心极限定理,可以近似的认为白细胞各亚群(淋巴、单核、中性粒、嗜酸粒)都服从均值为μk,方差为∑k的高斯正态分布。如图1所示,为细胞分类算法流程图。以二维散射信号样本集合为例,均值μ为K维二列的数组,协方差矩阵∑为2×2的方阵,对细胞散点图分类统计算法具体步骤为:
1)将识别的散射脉冲信号峰值数据变换到二维空间中,形成白细胞原始散点图,如图2所示,为低角散射信号(FLS)和中低角散射信号(FMS)形成的二维原始散点图。
2)对原始散点图进行去噪处理,利用邻域内非零点数和粒子总数来进行判定,不符合条件将该点去掉;对去噪过后的散点图分别在低角(FLS)和中低角(FMS)方向投影生成直方图,根据直方图趋势寻找血影分界线,去除血影。如图3所示,对散点图在FLS方向生成投影直方图,寻找到截止点,寻找到特定的两个极大值点,再在这两个极大值之间寻找到极小值点作为血影的FLS分界线;对散点图在FMS方向生成投影直方图,按照类似的方式,寻找血影的FLS分界线,根据折线将下方判定为血影粒子,将它们从散点图中剔除。
3)根据去除血影的散点图分别在低角(FLS)和中低角(FMS)方向投影直方图,寻找各个极值点,判定各亚群的分界线,确定该散点图亚群的种类K。如图4所示,该散点图初始分界线将细胞分为4个亚群,依次为淋巴区域、单核区域、中性粒区域和嗜酸区域。
4)根据初始分界线,对细胞散点图进行初始分类,计算各个亚群粒子的权重πk,均值μk,和协方差矩阵∑k,对各个亚群的初始高斯分布进行确定。再根据最大对数似然函数计算出该散点图的最大对数似然函数值Ln。
5)开始进入迭代计算,根据上次迭代所得到的各亚群的高斯分布函数重新计算各个粒子点出现在各个亚群的概率γ(i,k)。
6)再次根据各个粒子的概率分布γ(i,k),计算各个亚群高斯分布特征参数权重πk,均值μk,和协方差矩阵∑k
7)计算出该散点图的最大对数似然函数值Ln。
8)比较本次迭代的最大对数似然函数值和上次迭代的最大对数似然函数值,如果不收敛,则重复第5—7步,直到收敛,终止迭代。如图5所示,为迭代终止后,各亚群的高斯分布范围。
9)根据迭代输出的K个亚群高斯分布函数,分别计算每个粒子点相对于每种亚群的高斯概率密度值(PDF),寻找出最大的PDF,其对应亚群标记为该粒子的类别。如图6所示,为细胞散点图分类结果。
对于原始算点图血影分界线和初始分界线的划分并不局限于实例中所给出的方式,可以根据实际的试剂系统产生的散点图形态进行改变。对于三维信息的散点图,可以投影成多个二维散点图进行分开计算,也可以直接进行分类计算,那么高斯分布特征参数均值μ为K维3列的数组,协方差矩阵∑为3×3的矩阵。
本发明细胞分类算法,对于一个有N个数据点并且K个亚群的样本集合,各个亚群分别服从高斯正态分布,那么该样本集合可认为是高斯混合模型(GMM,Gaussian MixtureModel),引入概率密度函数的概念,此GMM的概率密度函数为:
其中,K为白细胞亚群的数量;
πk为每个亚群被选中的概率,即每个亚群的权重;
N(x|μk,∑k)为每个亚群的高斯概率密度分布函数,μk均值,∑k为方差。
只需要根据数据推导出概率分布就可以了,即需要确定特征参数πk,μk,∑k,该过程被称为“参数估计”。为了便于计算,我们引入“对数似然函数”(Log-likelihoodFunctoin),让找到的参数使该函数能够取得最大值,参数估计的过程就算完成
通常求最大值参数的做法是对函数求导等于零,然后解方程,但由于“对数似然函数”的特殊形式,采用分步迭代的方法来进行参数估计。
1)估计数据由每个亚群产生的概率。对于任意一个数据点xi,它由第k个亚群产生的概率为:
式中的πk,μk,∑k是上一次迭代计算的值或者为初始值。
2)估计每个亚群的参数。根据上一步得到的每个数据点由各个亚群产生的概率γ(i,k),根据高斯分布函数特性,对应的特征参数分别为:
其中
3)重复迭代前面两步,直到对数似然函数收敛。

Claims (3)

1.一种基于概率分布细胞分类统计方法,所述方法包括以下步骤:
A.对原始散点图进行初始划分,确认亚群种类;
B.分别计算各个亚群的高斯分布特征参数,并计算最大对数似然函数值;
C.进入迭代计算,根据上次高斯分布特征函数,计算各细胞处于各个亚群的概率分布;
D.根据各细胞概率分布重新计算各个亚群的高斯分布特征参数,并计算最大对数似然函数值;
E.判定最大对数似然函数值是否收敛,若不收敛,则重复步骤C和D继续迭代计算,若收敛,则终止迭代,输出各亚群高斯分布特征参数和各细胞亚群类型;
对细胞散点图分类统计算法具体步骤为:
1)将识别的散射脉冲信号峰值数据变换到二维空间中,形成白细胞原始散点图,为低角散射信号和中低角散射信号形成的二维原始散点图;
2)对原始散点图进行去噪处理,利用邻域内非零点数和粒子总数来进行判定,不符合条件的点去掉;对去噪过后的散点图分别在低角散射信号和中低角散射信号方向投影生成直方图,根据直方图趋势寻找血影分界线,去除血影;
3)对散点图在血影的低角散射信号方向生成投影直方图,寻找到截止点,寻找到特定的两个极大值点,再在这两个极大值之间寻找到极小值点作为血影的低角散射信号分界线;对散点图在中低角散射信号方向生成投影直方图,按照类似的方式,寻找血影的低角散射信号分界线,根据折线将下方判定为血影粒子,将血影粒子从散点图中剔除;
4)根据去除血影的散点图分别在低角散射信号和中低角散射信号方向投影直方图,寻找各个极值点,判定各亚群的分界线,确定该散点图亚群的种类K;
5)根据初始分界线,对细胞散点图进行初始分类,计算各个亚群粒子的权重πk,均值μk,和协方差矩阵Σk,对各个亚群的初始高斯分布进行确定;再根据最大对数似然函数计算出该散点图的最大对数似然函数值Ln;
6)开始进入迭代计算,根据上次迭代所得到的各亚群的高斯分布函数重新计算各个粒子点出现在各个亚群的概率γ(i,k);
7)再次根据各个粒子的概率分布γ(i,k),计算各个亚群高斯分布特征参数权重πk,均值μk,和协方差矩阵Σk;
8)计算出该散点图的最大对数似然函数值Ln;
9)比较本次迭代的最大对数似然函数值和上次迭代的最大对数似然函数值,如果不收敛,则重复第5—7步,直到收敛,终止迭代;
10)根据迭代输出的K个亚群高斯分布函数,分别计算每个粒子点相对于每种亚群的高斯概率密度值,寻找出最大的高斯概率密度值,其对应亚群标记为该粒子的类别。
2.根据权利要求1所述基于概率分布细胞分类统计方法,其特征在于:所述对原始散点图进行初始划分是对原始散点图进行去噪处理,根据直方图趋势寻找血影分界线,去除血影,对原始散点图进行初始分类,确认亚群种类。
3.根据权利要求1所述基于概率分布细胞分类统计方法,其特征在于:所述计算各个亚群的高斯分布特征参数是:
K为白细胞亚群的数量,πk为每个亚群的权重,N(x|μk,∑k)为每个亚群的高斯概率密度分布函数,μk均值,∑k为方差;
对数似然函数采用分步迭代的方法来进行参数估计,第k个亚群产生的概率为:对应的特征参数分别为: 其中重复迭代前面两步,直到对数似然函数收敛。
CN201510583327.0A 2015-09-14 2015-09-14 基于概率分布细胞分类统计方法 Active CN105203446B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510583327.0A CN105203446B (zh) 2015-09-14 2015-09-14 基于概率分布细胞分类统计方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510583327.0A CN105203446B (zh) 2015-09-14 2015-09-14 基于概率分布细胞分类统计方法

Publications (2)

Publication Number Publication Date
CN105203446A CN105203446A (zh) 2015-12-30
CN105203446B true CN105203446B (zh) 2019-09-13

Family

ID=54951242

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510583327.0A Active CN105203446B (zh) 2015-09-14 2015-09-14 基于概率分布细胞分类统计方法

Country Status (1)

Country Link
CN (1) CN105203446B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111274949B (zh) * 2020-01-19 2023-05-30 重庆医科大学附属第一医院 一种基于结构分析的血液病白细胞散点图相似度分析方法
CN113139405B (zh) * 2020-01-19 2024-03-05 桂林优利特医疗电子有限公司 一种基于多峰拟合解析的细胞分类结果校正方法
CN113052086B (zh) * 2021-03-29 2024-02-27 深圳市科曼医疗设备有限公司 一种白细胞分类方法、装置、计算机设备和存储介质
CN113188981B (zh) * 2021-04-30 2022-09-09 天津深析智能科技发展有限公司 一种多因子细胞因子自动分析方法
CN114324124A (zh) * 2021-12-21 2022-04-12 桂林优利特医疗电子有限公司 一种基于概率密度估计的散点样本数据扩充方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101672759A (zh) * 2008-09-12 2010-03-17 深圳迈瑞生物医疗电子股份有限公司 一种粒子分类统计方法及装置
CN102279146A (zh) * 2011-03-11 2011-12-14 桂林优利特医疗电子有限公司 基于激光鞘流技术的血液细胞五分类方法
CN103364324A (zh) * 2012-03-27 2013-10-23 嘉善加斯戴克医疗器械有限公司 一种用于血液细胞分析仪的自适应分类计算方法
CN103776751A (zh) * 2012-10-23 2014-05-07 深圳市蓝韵实业有限公司 用于粒子检测仪中散点图的粒子分类方法
CN104359821A (zh) * 2014-11-04 2015-02-18 深圳市帝迈生物技术有限公司 一种散点图的粒子分类统计方法和系统及血液细胞分析仪

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112485167A (zh) * 2013-05-31 2021-03-12 深圳迈瑞生物医疗电子股份有限公司 粒子分析仪的光学系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101672759A (zh) * 2008-09-12 2010-03-17 深圳迈瑞生物医疗电子股份有限公司 一种粒子分类统计方法及装置
CN102279146A (zh) * 2011-03-11 2011-12-14 桂林优利特医疗电子有限公司 基于激光鞘流技术的血液细胞五分类方法
CN103364324A (zh) * 2012-03-27 2013-10-23 嘉善加斯戴克医疗器械有限公司 一种用于血液细胞分析仪的自适应分类计算方法
CN103776751A (zh) * 2012-10-23 2014-05-07 深圳市蓝韵实业有限公司 用于粒子检测仪中散点图的粒子分类方法
CN104359821A (zh) * 2014-11-04 2015-02-18 深圳市帝迈生物技术有限公司 一种散点图的粒子分类统计方法和系统及血液细胞分析仪

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
EM及高斯混合模型;orisun;《http://www.cnblogs.com/zhangchaoyang/articles/2624882.html》;20120806;参见第1-5页 *
混合高斯模型和EM算法;JerryLead;《http://www.cnblogs.com/jerrylead/archive/2011/04/06/2006924.html》;20110406;参见第1-3页 *
白细胞分类计数方法学比较;李筱梅等;《检验医学》;20041231;第19卷(第2期);第100,103页 *
血液细胞自动分析仪参数评述;胡荣玲;《河北医学》;20001031;第6卷(第10期);第956-957页 *
解读白细胞体积分布图及白细胞分类的临床意义;吴灿;《实用医技杂志》;20060531;第13卷(第10期);第1677-1678页 *

Also Published As

Publication number Publication date
CN105203446A (zh) 2015-12-30

Similar Documents

Publication Publication Date Title
CN105203446B (zh) 基于概率分布细胞分类统计方法
CN109952614B (zh) 生物粒子的分类系统和方法
Imran Razzak et al. Microscopic blood smear segmentation and classification using deep contour aware CNN and extreme machine learning
US20080172185A1 (en) Automatic classifying method, device and system for flow cytometry
CN107389536B (zh) 基于密度-距离中心算法的流式细胞粒子分类计数方法
CN110348384B (zh) 一种基于特征融合的小目标车辆属性识别方法
CN104040561B (zh) 通过质谱术和分数规整识别微生物的方法
JPH06501106A (ja) N次元データストリームを適応的に自動クラスタリングする重力アトラクターエンジン
CN106548205A (zh) 一种流式细胞数据快速自动分群及圈门方法
CN111062425B (zh) 基于c-k-smote算法的不平衡数据集处理方法
CN101672759B (zh) 一种粒子分类统计方法及装置
CN103942415B (zh) 一种流式细胞仪数据自动分析方法
Mohapatra et al. Unsupervised blood microscopic image segmentation and leukemia detection using color based clustering
CN106548203A (zh) 一种多参数流式细胞数据快速自动分群和设门方法
CN105740914A (zh) 一种基于近邻多分类器集成的车牌识别方法及系统
CN105940301A (zh) 一种流式细胞分析仪及其多维数据分类方法、装置
CN103364324A (zh) 一种用于血液细胞分析仪的自适应分类计算方法
CN102331393A (zh) 一种对人体血液中细胞进行自动分类计算的方法
CN109541639A (zh) 一种基于粒子聚类的反演边界层高度方法
Rahman et al. Automatic identification of abnormal blood smear images using color and morphology variation of RBCS and central pallor
Nilsson et al. Model-based segmentation of leukocytes clusters
Rohaziat et al. White blood cells type detection using YOLOv5
CN110119751A (zh) 激光雷达点云目标分割方法、目标匹配方法、装置及车辆
CN101762448B (zh) 一种粒子分类方法及粒子检测装置
CN112789503A (zh) 分析有核红细胞的方法、血液细胞分析仪和存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant