【发明内容】
本发明的主要目的就是解决现有技术中的问题,提供一种粒子分类统计方法及装置,自动调整分类边界的尺寸、形状、方向和位置,提高对异常样本的适应能力和准确性。
为实现上述目的,本发明提供一种粒子分类统计方法,适用于粒子检测仪对粒子进行分类统计,所述方法包括以下步骤:
A1、收集每个粒子在检测仪中产生的至少两种特征;
B1、选择其中的两种特征将其表征为二维向量,并映射到二维散点图上;
C1、在所述散点图上划分出需要分类统计的各种类粒子的分布区域;
D1、计算各个区域内粒子的分布函数;
E1、根据各个区域内的粒子分布函数对所有区域的粒子进行分类统计。
本发明提供一种粒子分类统计装置,用于粒子检测仪对粒子进行分类统计,其特征在于所述装置包括:
信息采集单元,用于收集每个粒子在检测仪中产生的至少两种特征;
映射单元,用于选择其中的两种特征将其表征为二维向量,并映射到二维散点图上;
分布区域划分单元,用于在所述散点图上初步划分出需要统计的每个种类粒子的分布区域;
分布函数计算单元,用于计算各个区域内粒子的分布函数;
粒子统计单元,用于根据各个区域内的粒子分布函数对各种类粒子进行统计。
其中,所述的粒子的分布函数为正态分布函数,所述每个区域中粒子的正态分布函数的计算公式为:
其中,x表示散点图中X轴方向坐标,y表示散点图中Y轴方向坐标,Si为对第i类粒子总数的估计值,Ci为第i个区域内粒子坐标的协方差矩阵,|Ci|为矩阵Ci的行列式,Ci -1为矩阵Ci的逆矩阵,xi为第i个区域内粒子在X轴方向坐标的均值,yi为第i个区域内粒子在Y轴方向坐标的均值,它们的计算公式为:
其中
Ai为区域 内的粒子总数,Ki为常量,Mi为第i个区域中点的个数,xij为第i个区域内的第j个点在X轴方向的坐标,yij为第i个区域内第j个点在Y轴方向的坐标,nij为点(xij,yij)处的粒子个数。
对于散点图中的点Pij(xij,yij),在散点图中该点的粒子数为nij,计算各分布函数在Pij(xij,yij)处的函数值为:F1(xij,yij),F2(xij,yij),…,FN(xij,yij),则
第一类粒子的百分比为:
第二类粒子的百分比为:
以此类推,
第N类粒子的百分比为:
本发明的有益效果是:本发明能自动调整分类边界的尺寸、形状、方向和位置,具有很强的准确性和稳定性,提高了散点图分类方法对异常样本的适应能力,提高了粒子检测仪的性能。
【具体实施方式】
本申请的特征及优点将通过实施例结合附图进行详细说明。
请参考图6,粒子检测仪用于对粒子进行分类统计,粒子分类统计装置包括:用于收集每个粒子在检测仪中产生的至少两种特征的信息采集单元,用于选择其中的两种特征将其表征为二维向量并映射到二维散点图上的映射单元,用于在所述散点图上初步划分出需要统计的每个种类粒子的分布区域的分布区域划分单元,用于计算各个区域内粒子分布函数的分布函数计算单元,用于根据各个区域内的粒子分布函数对各类粒子进行统计的粒子统计单元。
下面以血液细胞分析仪为例对本发明的粒子分类统计方法进行说明。在对各类白细胞分析中,人们通常会对血液细胞中的淋巴细胞(Lym)、单核细胞(Mono)、中性粒细胞(Neut)和嗜酸性粒细胞(Eos)比较感兴趣,需要对这几种细胞进行分类并统计,例如计算这几种细胞的数目和百分比。在测量系统准确的情况下,同一类粒子的各种特征是相近的,这是粒子分析仪区分不同粒子群体的依据所在,并且同一类粒子的特征应服从或近似于某种特定分布,例如正态分布。本发明应用统计学相关知识对散点图进行分类,根据各类白细胞在散点图中的分布所表现的统计特性,计算相关统计量,得到各类白细胞的分布函数,进而实现对散点图的分类、计数。
在本实施例中,对细胞进行分类统计的方法如图7所示,包括以下步骤:
1.在细胞分析仪中,通过用光(例如激光)照射血液样本中的白细胞,收集每个白细胞至少两个方向的光信号,选择其中两个方向的光信号(例如前向散射光FSC、侧向散射光SSC)供后续使用,将两个方向的光信号通过光电转换和AD转换,得到对应细胞的一组二维数据,将此二维数据映射到二维坐标系(例如X-Y直角坐标系)中,得到白细胞分布散点图,散点图中的数据点Pi可以用向量(xi,yi,ni)表示(见图8),其中xi为点Pi在X轴方向的坐标,yi为点Pi在Y轴方向坐标,ni为点Pi处的白细胞个数。
2.对所述散点图进行初步划分,获取感兴趣白细胞分布区域。在散点图中,并不是每个数据点都是白细胞,有些数据点是由血液样本中的红细胞碎片或噪声产生的,这些数据是无效数据,因此要把它们删除。由于这些无效数据点的信号特征比较明显,一般可以通过硬件或软件“设门限”的方式将它们去除。所谓“设门限”就是设定一个区域E(见图9),数据落在这个区域之外就保留,落在这个区域之内就剔除(见图10)。由于各类白细胞在散点图中的分布区域具有相对稳定的位置,散点图中感兴趣白细胞分布的区域可以采用划分固定区域的方法获得淋巴细胞(Lym)分布区域RLym、单核细胞(Mono)分布区域RMono、中性粒细胞(Neut)分布区域RNeut、嗜酸性粒细胞(Eos)分布区域REos(见图11),根据显示屏上显示的散点图,划线将各区域区分开来,其中
RLym={(x11,y11,n11),(x12,y12,n12),...},
RMono={(x21,y21,n21),(x22,y22,n22),...},
RNeut={(x31,y31,n31),(x32,y32,n32),...},
REos={(x41,y41,n41),(x42,y42,n42),...}。
该步骤中获取感兴趣白细胞分布区域也可以通过投影直方图寻找波谷的方法确定各类白细胞的分布区域,具体过程为:
a)把散点图中每一列的数据点累加得到一维直方图(图12),在直方图的某固定区域内寻找波谷,并以波谷为分界线把散点图分为左右两部分;
b)分别把步骤a)中散点图的左、右两部分的每一行累加得到一维直方图,在直方图的某固定区域内寻找波谷,并以波谷为分界线把散点图分为上下两部分(图13,图14),从而把散点图划分为RLym、RMono、RNeut、REos四个区域,如图15所示。
3.在步骤2中对散点图进行初步划分后,计算各区域内白细胞的分布函数:假设在步骤2中获取的RLym有M1个数据点,RMono有M2个数据点,RNeut有M3个数据点,REos有M4个数据点。对每个区域分别进行以下计算(i=1,2,3,4):
中心(均值)(xi,yi):
协方差矩阵Ci:
其中
表示数据点包含的细胞在x轴方向的方差,
表示y轴方向的方差,σ
ixy表示协方差,且C
i为正定矩阵。
概率密度函数fi(x,y):
该类白细胞的分布函数:
其中Si为该类白细胞的总细胞数的估计值, Ai表示区域 内的细胞数总和,Ai是原先预选区域内的一部份粒子数,被认为是最可信的粒子分布区域内的粒子个数。Ki为常量,
表示的是一个椭圆区域,Ki表示椭圆长、短轴信息。 表示 区域内的概率密度之和,即 区域内包含该类细胞的百分比。当取定Pi,可以计算出Ki值,从而获得椭圆区域。其中Pi为0到1之间的值。Pi也就是用来确定可信分布区域的一个量,可人为设定。
4.根据在各区域获得的四个分布函数(见图16)对散点图进行分类、计数。假设散点图中四个区域的分布函数为F1(x,y),F2(x,y),F3(x,y),F4(x,y),则散点图中每一点Pi(xi,yi)在每个分布函数中的函数值为F1(xi,yi),F2(xi,yi),F3(xi,yi),F4(xi,yi),在点Pi(xi,yi)处的细胞数为ni。对于散点图中的每个点,(xi,yi)点对每个分布函数都有一个理论分布值Fj(xi,yi),j=1,2,3,4.散点图中在点(xi,yi)处的粒子个数是ni,按照理论分布值把ni分配给每一类,则
RLym细胞总和为:
RMono细胞总和为:
RNeut细胞总和为:
REos细胞总和为:
从而实现对散点图上粒子的分类、计数,如图17所示,各类粒子边界的尺寸、形状、方向和位置不是确定的,而是随着该类粒子的分布的实际情况而变的,因此本发明可适应各种个体差异,自动调整分类边界的尺寸、形状、方向和位置,具有很强的准确性和稳定性。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。