一种粒子分类统计方法及装置
【技术领域】
本发明涉及一种粒子检测仪,尤其涉及粒子检测仪的一种粒子分类统计方法及装置,用于对各种粒子进行分类统计。
【背景技术】
粒子检测仪用于对各种粒子进行分类统计,例如血液细胞分析仪,其主要功能就是提供人体中各类细胞的数目,其中对各类白细胞的计数是基本的功能。使经过试剂处理后的、被液体包被的白细胞逐个通过检测区域(流动室),将激光照射到单个的细胞上,通过收集不同角度的折射或散射光线(通常为前向散射光FSC、侧向散射光SSC),再通过光电转换和AD转换,得到对应细胞的一组二维数据,将此二维数据映射到坐标系中,可以得到该细胞在二维坐标系中的位置,将样本中的所有白细胞都映射到坐标上可以得到二维的白细胞分布图(简称散点图)。在散点图中,同一类的白细胞聚集在一起,不同类的白细胞互相分离,(见图1)。在散点图上划分多个区域,把落在同一区域的白细胞归为同一类,并统计落在这些类别内的粒子数目和百分比,用以分析被测样本的成份组成。
传统的粒子分类统计方法主要有以下几种:
一、固定边界分类法。例如US.Pat.No.4987086公开了一种在散点图上用固定边界进行分类的方法,在由前向散射光和侧向散射光形成的散点图上,通过“设门”的方式从全血细胞中区分粒细胞、单核细胞和淋巴细胞的方法,所谓“设门”就是在散点图上划分出边界,落在某边界内部的细胞被认为是同一类细胞(见图2)。采用“设门”的固定边界分类的缺点是不能针对不同的样本进行边界调整,只能体现大部分正常样本特征,当某些样本的细胞信号特征显著不同于固定边界所表达的特征时就会出现较大误差。
二、US.Pat.No.5627040公开了一种重心引力因子(gravitationalattractor)方法。该方法用尺寸、形状和方向固定而位置不固定的边界在散点图上进行分类,用一种优化算法根据每个类的重心引力因子将这个类的边界确定下来(见图3)。“重心引力因子”的方法虽然可以自动调整边界的位置,但是尺寸、形状和方位还是固定的。利用这些固定边界对细胞进行分类时无法解决样本的个体差异问题,也就是说这些固定边界只是针对大多数样本的共性而言,而人体的血液样本会存在一些个体差异,比如某些人的单核细胞、淋巴细胞在经过试剂作用后会比通常人的要大,这个时候还用通用的固定边界分类的话就会出现误差。
三、US.Pat.No.6944338公开了一种自动分类方法。用修改后的Koonstand Fukunaga算法寻找二维数据的分界线(二维数据的波谷),用这些分界线将落在同一界线包围中的粒子归为一类,以此将粒子分成诸多类别(见图4)。该方法也存在一定的局限性:(1)若散点图上的数据点不连续,非常离散,很多单个点,按照此算法会对这些点周围寻找边界并最终将它们归为单独的一类,但实际上这些点并不是单独的一类而是某个大类的细胞分散的比较开而已;(2)即使用采样格(bins)将数据平滑化也很难解决上述问题,并且平滑的越厉害(bins取的点越多),计算出来的波谷与原始数据上的波谷的偏差就越大;(3)算法对二维散点图上的每个数据点都进行一次运算,但是散点图上有效的点并不多,有很多区域并没有数据。二维的散点图实际上是一个稀疏矩阵(见图5),如果对每个点都进行查找会导致算法效率下降。
【发明内容】
本发明的主要目的就是解决现有技术中的问题,提供一种粒子分类统计方法及装置,自动调整分类边界的尺寸、形状、方向和位置,提高对异常样本的适应能力和准确性。
为实现上述目的,本发明提供一种粒子分类统计方法,适用于粒子检测仪对粒子进行分类统计,所述方法包括以下步骤:
A1、收集每个粒子在检测仪中产生的至少两种特征;
B1、选择其中的两种特征将其表征为二维向量,并映射到二维散点图上;
C1、在所述散点图上划分出需要分类统计的各种类粒子的分布区域;
D1、计算各个区域内粒子的分布函数;
E1、根据各个区域内的粒子分布函数对所有区域的粒子进行分类统计。
本发明提供一种粒子分类统计装置,用于粒子检测仪对粒子进行分类统计,其特征在于所述装置包括:
信息采集单元,用于收集每个粒子在检测仪中产生的至少两种特征;
映射单元,用于选择其中的两种特征将其表征为二维向量,并映射到二维散点图上;
分布区域划分单元,用于在所述散点图上初步划分出需要统计的每个种类粒子的分布区域;
分布函数计算单元,用于计算各个区域内粒子的分布函数;
粒子统计单元,用于根据各个区域内的粒子分布函数对各种类粒子进行统计。
其中,所述的粒子的分布函数为正态分布函数,所述每个区域中粒子的正态分布函数的计算公式为:
其中,x表示散点图中X轴方向坐标,y表示散点图中Y轴方向坐标,Si为对第i类粒子总数的估计值,Ci为第i个区域内粒子坐标的协方差矩阵,|Ci|为矩阵Ci的行列式,Ci -1为矩阵Ci的逆矩阵,xi为第i个区域内粒子在X轴方向坐标的均值,yi为第i个区域内粒子在Y轴方向坐标的均值,它们的计算公式为:
其中
A
i为区域
内的粒子总数,K
i为常量,M
i为第i个区域中点的个数,x
ij为第i个区域内的第j个点在X轴方向的坐标,y
ij为第i个区域内第j个点在Y轴方向的坐标,n
ij为点(x
ij,y
ij)处的粒子个数。
对于散点图中的点Pij(xij,yij),在散点图中该点的粒子数为nij,计算各分布函数在Pij(xij,yij)处的函数值为:F1(xij,yij),F2(xij,yij),…,FN(xij,yij),则
第一类粒子的百分比为:
第二类粒子的百分比为:
以此类推,
第N类粒子的百分比为:
本发明的有益效果是:本发明能自动调整分类边界的尺寸、形状、方向和位置,具有很强的准确性和稳定性,提高了散点图分类方法对异常样本的适应能力,提高了粒子检测仪的性能。
【附图说明】
图1是样本形成的散点图;
图2是用“设门”方法进行分类的示意图;
图3是用“重心引力因子”方法进行分类的示意图;
图4是寻找二维数据波谷进行分类的示意图;
图5是散点图用矩阵表示的示意图;
图6是本发明一种实施例的方框原理图;
图7是本发明一种实施例的流程图;
图8是散点图中数据点的坐标示意图;
图9是设置的无效数据区域示意图;
图10是图1去除无效数据后的散点图;
图11是在图10划分固定区域示意图;
图12是图10的投影直方图示意图1;
图13是图10的投影直方图示意图2;
图14是图10的投影直方图示意图3;
图15是图10用投影直方图划分区域示意图;
图16是获得的四类白细胞的分布函数;
图17是对图10进行分类的结果示意图。
【具体实施方式】
本申请的特征及优点将通过实施例结合附图进行详细说明。
请参考图6,粒子检测仪用于对粒子进行分类统计,粒子分类统计装置包括:用于收集每个粒子在检测仪中产生的至少两种特征的信息采集单元,用于选择其中的两种特征将其表征为二维向量并映射到二维散点图上的映射单元,用于在所述散点图上初步划分出需要统计的每个种类粒子的分布区域的分布区域划分单元,用于计算各个区域内粒子分布函数的分布函数计算单元,用于根据各个区域内的粒子分布函数对各类粒子进行统计的粒子统计单元。
下面以血液细胞分析仪为例对本发明的粒子分类统计方法进行说明。在对各类白细胞分析中,人们通常会对血液细胞中的淋巴细胞(Lym)、单核细胞(Mono)、中性粒细胞(Neut)和嗜酸性粒细胞(Eos)比较感兴趣,需要对这几种细胞进行分类并统计,例如计算这几种细胞的数目和百分比。在测量系统准确的情况下,同一类粒子的各种特征是相近的,这是粒子分析仪区分不同粒子群体的依据所在,并且同一类粒子的特征应服从或近似于某种特定分布,例如正态分布。本发明应用统计学相关知识对散点图进行分类,根据各类白细胞在散点图中的分布所表现的统计特性,计算相关统计量,得到各类白细胞的分布函数,进而实现对散点图的分类、计数。
在本实施例中,对细胞进行分类统计的方法如图7所示,包括以下步骤:
1.在细胞分析仪中,通过用光(例如激光)照射血液样本中的白细胞,收集每个白细胞至少两个方向的光信号,选择其中两个方向的光信号(例如前向散射光FSC、侧向散射光SSC)供后续使用,将两个方向的光信号通过光电转换和AD转换,得到对应细胞的一组二维数据,将此二维数据映射到二维坐标系(例如X-Y直角坐标系)中,得到白细胞分布散点图,散点图中的数据点Pi可以用向量(xi,yi,ni)表示(见图8),其中xi为点Pi在X轴方向的坐标,yi为点Pi在Y轴方向坐标,ni为点Pi处的白细胞个数。
2.对所述散点图进行初步划分,获取感兴趣白细胞分布区域。在散点图中,并不是每个数据点都是白细胞,有些数据点是由血液样本中的红细胞碎片或噪声产生的,这些数据是无效数据,因此要把它们删除。由于这些无效数据点的信号特征比较明显,一般可以通过硬件或软件“设门限”的方式将它们去除。所谓“设门限”就是设定一个区域E(见图9),数据落在这个区域之外就保留,落在这个区域之内就剔除(见图10)。由于各类白细胞在散点图中的分布区域具有相对稳定的位置,散点图中感兴趣白细胞分布的区域可以采用划分固定区域的方法获得淋巴细胞(Lym)分布区域RLym、单核细胞(Mono)分布区域RMono、中性粒细胞(Neut)分布区域RNeut、嗜酸性粒细胞(Eos)分布区域REos(见图11),根据显示屏上显示的散点图,划线将各区域区分开来,其中
RLym={(x11,y11,n11),(x12,y12,n12),...},
RMono={(x21,y21,n21),(x22,y22,n22),...},
RNeut={(x31,y31,n31),(x32,y32,n32),...},
REos={(x41,y41,n41),(x42,y42,n42),...}。
该步骤中获取感兴趣白细胞分布区域也可以通过投影直方图寻找波谷的方法确定各类白细胞的分布区域,具体过程为:
a)把散点图中每一列的数据点累加得到一维直方图(图12),在直方图的某固定区域内寻找波谷,并以波谷为分界线把散点图分为左右两部分;
b)分别把步骤a)中散点图的左、右两部分的每一行累加得到一维直方图,在直方图的某固定区域内寻找波谷,并以波谷为分界线把散点图分为上下两部分(图13,图14),从而把散点图划分为RLym、RMono、RNeut、REos四个区域,如图15所示。
3.在步骤2中对散点图进行初步划分后,计算各区域内白细胞的分布函数:假设在步骤2中获取的RLym有M1个数据点,RMono有M2个数据点,RNeut有M3个数据点,REos有M4个数据点。对每个区域分别进行以下计算(i=1,2,3,4):
中心(均值)(xi,yi):
协方差矩阵Ci:
其中σix 2表示数据点包含的细胞在x轴方向的方差,σiy 2表示y轴方向的方差,σixy表示协方差,且Ci为正定矩阵。
概率密度函数fi(x,y):
该类白细胞的分布函数:
其中S
i为该类白细胞的总细胞数的估计值,
A
i表示区域
内的细胞数总和,A
i是原先预选区域内的一部份粒子数,被认为是最可信的粒子分布区域内的粒子个数。K
i为常量,
表示的是一个椭圆区域,K
i表示椭圆长、短轴信息。
表示
区域内的概率密度之和,即
区域内包含该类细胞的百分比。当取定P
i,可以计算出K
i值,从而获得椭圆区域。其中P
i为0到1之间的值。P
i也就是用来确定可信分布区域的一个量,可人为设定。
4.根据在各区域获得的四个分布函数(见图16)对散点图进行分类、计数。假设散点图中四个区域的分布函数为F1(x,y),F2(x,y),F3(x,y),F4(x,y),则散点图中每一点Pi(xi,yi)在每个分布函数中的函数值为F1(xi,yi),F2(xi,yi),F3(xi,yi),F4(xi,yi),在点Pi(xi,yi)处的细胞数为ni。对于散点图中的每个点,(xi,yi)点对每个分布函数都有一个理论分布值Fj(xi,yi),j=1,2,3,4.散点图中在点(xi,yi)处的粒子个数是ni,按照理论分布值把ni分配给每一类,则
RLym细胞总和为:
RMono细胞总和为:
RNeut细胞总和为:
REos细胞总和为:
从而实现对散点图上粒子的分类、计数,如图17所示,各类粒子边界的尺寸、形状、方向和位置不是确定的,而是随着该类粒子的分布的实际情况而变的,因此本发明可适应各种个体差异,自动调整分类边界的尺寸、形状、方向和位置,具有很强的准确性和稳定性。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。