CN101226190B - 流式细胞术的自动分类方法和装置 - Google Patents

流式细胞术的自动分类方法和装置 Download PDF

Info

Publication number
CN101226190B
CN101226190B CN200710072878.6A CN200710072878A CN101226190B CN 101226190 B CN101226190 B CN 101226190B CN 200710072878 A CN200710072878 A CN 200710072878A CN 101226190 B CN101226190 B CN 101226190B
Authority
CN
China
Prior art keywords
particle
distance
cell
classification
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN200710072878.6A
Other languages
English (en)
Other versions
CN101226190A (zh
Inventor
易晗平
楚建军
顾问
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Mindray Bio Medical Electronics Co Ltd
Shenzhen Mindray Scientific Co Ltd
Original Assignee
Shenzhen Mindray Bio Medical Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Mindray Bio Medical Electronics Co Ltd filed Critical Shenzhen Mindray Bio Medical Electronics Co Ltd
Priority to CN200710072878.6A priority Critical patent/CN101226190B/zh
Priority to US11/966,703 priority patent/US20080172185A1/en
Publication of CN101226190A publication Critical patent/CN101226190A/zh
Application granted granted Critical
Publication of CN101226190B publication Critical patent/CN101226190B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/5005Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells

Abstract

本发明公开了一种流式细胞术的自动分类方法及装置,包括以下步骤:A1、根据收集地每个细胞或粒子逐个通过光照区域时产生的至少两路光信号,将每个细胞或粒子表征为一个与其各路光信号强度有关的、至少二维的向量;B1、计算所有有效细胞或粒子两两之间的距离,且距离越近,两个细胞或粒子之间的相似程度越高;C1、将相似程度高的细胞或粒子聚集成同一个类;D1、重复步骤C1,至少将所有有效细胞或粒子聚集成样本根据测量原理所应有的类别数L。本发明能够将粒子准确、高效地自动分类。

Description

流式细胞术的自动分类方法和装置
【技术领域】
本发明涉及粒子的分类统计方法和装置,尤其适用于流式细胞术的自动分类统计方法和装置。
【背景技术】
流式细胞仪以及基于流式细胞术的血液分析仪、尿液分析仪以及粒子分析仪等都是通过收集和分析粒子的二维或多维数据的方法来识别液体中的不同粒子以将它们分成不同的类别。如图1所示,在流式细胞仪中,细胞或粒子102的悬液在鞘液的包裹之下逐个通过一个光照区域,在光照区域中粒子102受到激光101的照射而产生不同的光信号,如前向散射信号FSC 104、侧向散射信号SSC 106以及多路的荧光信号FL等,例如图中107是绿色萤光FL1,108是黄色荧光FL2,109是红色荧光FL3,聚光透镜103将这些光信号汇聚,光电二极管105收集前向散射光104,通过戴铜滤波片111、113、114和光电倍增管110、112、115分别收集绿色萤光107、黄色荧光108和红色荧光109。分析系统将检测器(通常是PMT或者PD)收集来的这些信号生成二维或者三维的散点图,在散点图上划分多个区域,细胞或者粒子的多参数信号落在同一个区域的那些粒子被归为同一类,并统计落在这些类别内的粒子数目和百分比,用以分析被测样本的统计特性,见图2。传统的方法是在散点图上用固定边界进行分类,但是固定边界只能体现大部分正常样本特征,其缺点是不能针对不同的样本进行边界调整,那么当某些样本的粒子信号特征显著不同于固定边界所表达的特征时就会出现较大误差。例如US.Pat.No.4987086揭露了一种在前向散射光vs.侧向散射光所形成的散点图上通过“设门”的方式从全血细胞中区分粒细胞、单核细胞和淋巴细胞的方法,所谓“设门”其实就是在散点图上划分出边界,落在某边界内部的细胞被认为是同一类细胞。US.Pat.No.4727020、4704891、4599307、4987086和6014904都揭露了一些用设门的方式识别和分类计数血液样本中的细胞的方法。
用事先划分好的边界可以在散点图上生成不同的区域代表着不同的粒子类别,然而这些离散的区域可能会有些重叠,那些落在重叠区域的粒子可能就会被错误的识别分类。U.S.Pat.No.5627040用一种“重心引力因子(gravitational attractor)”的方法解决了此问题。这种方法用尺寸、形状和方位固定而位置不固定的边界在散点图上进行分类,用一种优化算法根据每个类的引力因子将这个类的边界位置确定下来。
但“重心引力因子(gravitational attractor)”的方法虽然边界的位置可以自动调整但是尺寸、形状和方位还是固定的。利用这些固定边界对粒子进行分类尤其是对人的血液细胞进行分类的时候,无法解决样本的个体差异问题,也就是说这些固定边界只是针对大多数样本的共性而言的,而人的血液样本会存在一些个体的差异,比如某些人的单核细胞、淋巴细胞在经过试剂处理之后会比通常人的要大,这个时候如果还用通用的固定边界来分类的话就会出现误差。
当出现个体差异的时候可以通过在散点图上手动重新划边界的方法来解决,这是一般的流式细胞仪的作法,但这会造成效率下降,对于高度自动化仪器来说并不适合。US.Pat.No.6944338揭露了一种自动分类的方法,用修改后的Koonst and Fukunaga算法寻找二维数据的分界线(二维数据的波谷),用这些分界线将落在同一个界限包围中的粒子归为一类,以此将粒子分成诸多个类别。但是这种方法使用中也存在一定的局限性:(1)散点图上的数据点不连续,非常离散,很多单个点或一小簇点的周围没有数据,如图3中的区域a,按照此算法会对这些点的周围寻找边界并最终将它们归为单独的一类,但实际上这些点并不是单独一类而是某个大类的粒子只不过分散较开而已;(2)即使用bins(即采样格)将数据平滑化也很难解决上述问题,并且平滑的越厉害(bins取的点越多),计算出来的波谷换算到原始数据上出现的偏差越大;(3)此算法对二维散点图上的每个点都进行一次运算,但是事实上散点图上真正有效的点并不多,有很多区域并没有数据,如图3中的区域A,二维的散点图实际上是一个稀疏矩阵,如果对每个点都进行查找会导致算法效率的下降。
【发明内容】
本发明的主要目的就是为解决以上将粒子分类时容易出现偏差和效率低的技术问题,提供一种流式细胞术的自动分类方法和装置,将粒子准确、高效地自动分类。
为实现上述目的,本发明提供一种流式细胞术的自动分类方法,包括以下步骤:
A1、根据收集的每个细胞或粒子逐个通过光照区域时产生的至少两路光信号,将每个细胞或粒子表征为一个与其各路光信号强度有关的、至少二维的向量;
B1、计算所有有效细胞或粒子两两之间的距离,且距离越近,两个细胞或粒子之间的相似程度越高;
C1、将相似程度高的细胞或粒子聚集成同一个类;
D1、重复步骤C1,至少将所有有效细胞或粒子聚集成样本根据测量原理所应有的类别数L。
本发明的进一步改进是:在步骤A1之后、步骤B1之前还包括以下步骤:设定阈值,将不符合阈值条件的细胞或粒子的数据删除。
本发明的更进一步改进是:所述步骤D1中,最后将所有有效细胞或粒子聚集成一个类别。
本发明的更进一步改进是:在所述步骤D1之后还包括以下步骤:
E1、进行聚类效果评价,确定样本真正应有的类别数。
所述步骤E1包括以下步骤:
E11、计算从1到L+r的各整数的聚类效果参数,其中L为样本根据测量原理所应有的类别数,且L为大于或等于1的整数,r为根据经验所得的大于0的整数;
E12、查找出其聚类效果参数为最大的整数q;
E13、将步骤E12中查找出的整数q和类别数L进行比较,如果q>L,则取该样本的分类数为q;如果L-o<q≤L,则取该样本的分类数为L;如果q≤L-o,则不进行分别,并结束运算。
为实现上述目的,本发明还提供一种流式细胞术的自动分类装置,包括:用于根据收集每个细胞或粒子逐个通过光照区域时产生的至少两路光信号将每个细胞或粒子表征为一个与其各路光信号强度有关的、至少二维的向量的事件生成单元;用于根据事件生成单元生成的向量计算所有有效细胞或粒子两两之间的距离的计算单元,且距离越近,两个细胞或粒子之间的相似程度越高;用于将相似程度高的细胞或粒子聚集成同一个类的聚类单元,所述聚类单元能够多次聚类,至少将所有有效细胞或粒子聚集成样本根据测量原理所应有的类别数L。
本发明的进一步改进是:还包括用于设定阈值,将不符合阈值条件的数据删除的设门单元。
本发明的更进一步改进是:所述聚类单元用于最后将所有有效细胞或粒子聚集成一个类别。
本发明的更进一步改进是:还包括用于进行聚类效果评价以确定样本真正应有的类别数的类别评价单元。
所述类别评价单元包括:用于计算从1到L+r的各整数的聚类效果参数的第二计算模块,其中L为样本根据测量原理所应有的类别数,且L为大于或等于1的整数,r为根据经验所得的大于0的整数;用于查找出其聚类效果参数为最大的整数q的第二查找模块;用于将第二查找模块查找出的整数q和类别数L进行比较的比较模块,所述比较模块用于在q>L时,取该样本的分类数为q,在L-o<q≤L时,取该样本的分类数为L,在q≤L-o,不进行分别,并结束运算。
为实现上述目的,本发明还提供一种流式细胞术的自动分类统计系统,包括:样本发生装置,所述样本发生装置进一步包括相互连接的气液传输控制模块和流动室,所述气液传输控制模块用于使含有被测细胞或粒子的样本液被鞘液包裹着通过流动室;光照射装置,用于产生光束以照射通过流动室的鞘流;检测器,用于收集细胞或粒子逐个通过光照区域时产生的至少两路光信号;分类统计处理器,用于根据检测器收集的光信号,将每个细胞或粒子表征为一个与其各路光信号强度有关的、至少二维的向量,计算所有有效细胞或粒子两两之间的距离的计算单元,且距离越近,两个细胞或粒子之间的相似程度越高,将相似程度高的细胞或粒子聚集成同一个类,经多次聚类后,至少将所有有效细胞或粒子聚集成样本根据测量原理所应有的类别数L。
本发明的进一步改进是:所述分类统计处理器还用于在计算细胞或粒子两两之间的距离之前设定阈值,将不符合阈值条件的数据删除。
本发明的更进一步改进是:所述分类统计处理器用于最后将所有有效细胞或粒子聚集成一个类别。
本发明的更进一步改进是:所述分类统计处理器还用于计算从1到L+r的各整数的聚类效果参数,查找出其聚类效果参数为最大的整数q,将查找出的整数q和类别数L进行比较,在q>L时,取该样本的分类数为q,在L-o<q≤L时,取该样本的分类数为L,在q≤L-o,不进行分别,并结束运算,其中L为样本根据测量原理所应有的类别数,且L为大于或等于1的整数,r为根据经验所得的大于0的整数。
本发明的有益效果是:1)本发明通过对流过的所有粒子的二维或多维数据的集合进行分析处理,将某粒子归到某个类中。这种方法是基于数据分析而不是在图形上(一维直方图或二维散点图)寻找边界,因此可以适用于更多维的数据。由于是对每个被测样本都进行数据分析和分类计数,相当于这种自动聚类的方法所产生的分类边界是根据样本的不同而变化的,所以能够克服在散点图上用固定边界分类所带来的缺陷,即不能针对被测样本的特异性进行边界调整的缺陷。同时本发明的分类方法只对粒子的数据进行计算,对于没有粒子的地方不计算,所以也克服了Koonst andFukunaga算法在对不连续的数据进行波谷查找时的缺陷,使分类效率更高。2)本发明在分类计算前先设门删除不合格的数据,进一步减少了计算量,提高了分类效率。3)本发明在分类后还对分类效果进行分类效果评价,提高分类结果的可信性,从而提高粒子分类统计的准确性。
本发明的特征及优点将通过实施例结合附图进行详细说明。
【附图说明】
图1是流式细胞术的信号通道示意图;
图2是传统的在二维散点图上进行分类的示意图;
图3是已有技术缺陷的示意图;
图4是本发明一种实施例的系统结构图;
图5是本发明一种实施例的流程图;
图6-a、6-b、6-c是设门的示意图;
图7是图5中聚类的一种实施例的流程图;
图8是图4中分类统计处理器的一种实施例的组成结构图;
图9、10是分别利用本发明对两个不同的样本分类的结果;
图11、12是分别利用同一个固定边界进行分类的结果。
【具体实施方式】
本发明适用于流式细胞仪以及基于流式细胞术的血液分析仪、尿液分析仪以及其他粒子分析仪中,通过对流过的所有粒子的二维或多维数据的集合进行分析处理,将某粒子归到某个类中,最终粒子被归为样本所应有的类别。
流式细胞术分类统计系统一般如图4所示,包括:样本发生装置2、光照射装置1、检测器3和分类统计处理器4。所述样本发生装置2进一步包括相互连接的气液传输控制模块22和流动室21,所述气液传输控制模块22用于使含有被测细胞或粒子的样本液被鞘液包裹着通过流动室21,流动室,为一个光透明器件,内有一个方形导孔,被测的细胞或粒子在鞘液的包裹下逐个通过这个导孔,接受光束的照射;光照射装置1用于产生光束以照射通过流动室的鞘流,光照射装置1通常包括一个或几个波长不同的激光光源11和用于将散射光整理成所需要光束的光束整形模块12,光通过光束整形模块12后在流动室21的导孔处形成一个光斑,被测细胞或粒子的样本液被鞘液包裹着通过光斑时产生各种光信号,通常光信号至少有两路,如前向散射信号FSC、侧向散射信号SSC以及多路荧光信号FL,如图1所示;检测器3用于收集细胞或粒子逐个通过光照区域时产生的至少两路光信号,检测器3通常是PMT(光电倍增管)或PD(光电二极管);分类统计处理器4用于根据检测器3收集的光信号,将每个细胞或粒子表征为一个与其各路光信号强度有关的、至少二维的向量,计算所有有效细胞或粒子两两之间的距离的计算单元,且距离越近,两个细胞或粒子之间的相似程度越高,将相似程度高的细胞或粒子聚集成同一个类,经多次聚类后,至少将所有有效细胞或粒子聚集成样本根据测量原理所应有的类别数L。分类统计处理器4的一种实施例是包括信号提取模块41和分析模块42,信号提取模块41用于提取检测器3收集到的各路光信号,分析模块42用于根据各个细胞或粒子的光信号对细胞或离子进行分类,并对每类中的细胞或粒子进行统计。
在流式细胞术中,每个粒子通过光感应区时都会得到二维或多维信号,用于表征这个粒子的特性,把某个粒子通过光感应区得到信号这个过程叫做一个事件。如果仪器系统具有p维信号通道,则当第i个粒子通过光照区时触发事件ei,得到一个p维向量ei=(xi1,xi2,xi3,…,xip),其中xik表示第k个信号强度,这些信号一般是前向散射光FSC、侧向散射光SSC或者多路的荧光FL1,FL2,…。当一次测量过程共通过了n个粒子时,就触发了n次事件,得到数据I,
I n × p = x 11 x 12 · · · x 1 p x 21 x 22 · · · x 2 p · · · · · · · · · · · · x n 1 x n 2 · · · x np
本发明就是对I进行分析处理,将一次测量过程的全部事件分成所需要的类别。
分析模块42对细胞或粒子进行分类的一种实施例包括以下步骤:
第一步:去除干扰数据,减少运算量。
每个测量过程所触发的n个事件中,有些事件并不是想要考察的粒子所触发的,这些无效事件的数量很大甚至比有效事件还要多,增加了运算量的开销,因此要将这些事件的数据从原始数据S中除去,得到一个具有m个有效事件的数据Im×p。这些无效事件一般来自于粒子和试剂反应后的碎片以及噪声等,其信号特征比较明显,一般可以通过硬件或者软件“设门”的方式将它们除去。所谓“设门”就是设定一个阈值,在这个阈值之内的数据全都保留,而超过整个阈值之外的数据全部剔除,反之亦可,即超过阈值的全部保留而低于阈值的全部剔除,对于二维数据来说可以理解为设定一个区域,数据落在这个区域之内的保留,落在这个区域之外的剔除,反之亦可。图6-a、图6-b和图6-c中给出了一个在二维数据上将有效数据除去的实例,图6-b中的区域E可以理解为一个“门”,当数据落在这个“门”内时就删除,不让它参与聚类运算,这样可以减少运算量,提高运算效率。图6-a中无效事件出现的区域一般为图6-b中的区域E,当一个事件k被触发之后首先对这个事件的数据进行判断,如果(xk1,xk2)∈E则认为此事件为无效事件,将第k个数据剔除,最终得到了一个容量相对较少的有效数据Im×p(图6-c)。
第二步:对有效数据进行聚类分析
i)计算各事件之间的距离,用这个距离来衡量事件之间的相似程度,且距离越近,两个细胞或粒子之间的相似程度越高。
设d(ei,ej)是事件ei和ej之间的距离,一般要求它满足下列条件:
a)d(ei,ej)≥0,当且仅当ei=ej时,d(ei,ej)=0;
b)d(ei,ej)=d(ej,ei);
c)d(ei,ej)≤d(ei,ek)+d(ek,ej)
通常的流式细胞术有效事件总数大概在几千到1万之间,我们把具有相同特征数据的事件作为一个事件,即:当两个事件ei(xi1,xi2…,xip),ej(xj1,xj2,…,xjp)当ei=ej时只让它们的其中之一参与聚类运算,而计数的时候给它记成两次,这样则数据量会更少,进一步提高运算效率。
计算距离的方法有多种,本领域技术人员可以根据分类效果来选择采用已有技术中的欧氏距离、绝对距离、Minkowski距离、Chebyshev距离、方差加权距离以及马氏距离等中的一种来计算距离,下面说明用欧氏距离来表示相似度,ei、ej的欧氏距离为:
d ( e i , e j ) = [ Σ k = 1 p ( x ik - x jk ) 2 ] 1 / 2
将各事件之间的距离都计算出来,形成一个距离集合,例如一个距离矩阵:Dm×m
D ( 0 ) = 0 d 12 · · · d 1 m d 21 0 · · · d 2 m · · · · · · · · · d m 1 d m 2 · · · 0
ii)将相似程度高的细胞或粒子聚集成同一个类,多次聚类后,至少将所有有效细胞或粒子聚集成样本根据测量原理所应有的类别数L。并且在合并的过程中记录该次合并的编号及两个类合并时的水平。
一般来说用流式细胞术进行样本测量时,事先都会知道样本在这样的测量原理下会有多少类粒子出现,例如血液细胞分析仪在进行白细胞分类计数的时候会出现4~5类白细胞的子类,如果知道了样本应具有的类数g,那么可以在上述方法中得到的谱系图中只分到g类为止。
分析模块42对细胞或粒子进行分类的另一种实施例如图5所示,包括以下步骤:
在步骤S2,收集所有细胞或粒子的各路光信号,将每个细胞或粒子都表征为一个与其各路光信号强度有关的、至少二维的向量,将细胞或粒子在相应的二维或多维散点图上定位,然后执行步骤S4;
在步骤S4,设门去除干扰数据,减少运算量,该步骤与上一实施例中的消除干扰数据相同,然后执行步骤S6;
在步骤S6,计算细胞或粒子两两之间的距离,如果两个细胞或粒子的距离为零,则只允许一个细胞或粒子参与聚类,但在计数时记录为两个细胞或粒子。将距离同上一实施例一样组成距离矩阵,然后执行步骤S8;
在步骤S8,将相似程度高的细胞或粒子聚集成同一个类,聚类方法可以是谱系聚类法,也可以是已有技术中的快速聚类法或者其他聚类方法如模糊聚类或神经网络聚类等。下面说明用谱系聚类法进行聚类,其一种实施例的流程如图7所示,包括以下步骤:
在步骤S802,在计算出的所有距离的距离集合中查找出距离最小的两个细胞或粒子。选择D(0)中非对角线上的最小元素,设这个最小元素为duv,然后执行步骤S804;
在步骤S804,将该两个细胞或粒子合并成一个维数相同的新的类,即将eu和ev合并成一个新的类Gr={eu,ev},然后执行步骤S806;
在步骤S806,在距离集合中将与该两个细胞或粒子相关的距离删除,即在D(0)中消去eu和ev所在的行和列,然后执行步骤S808;
在步骤S808,计算新类Gr与其他类、细胞或粒子两两之间的距离,并将其加入到距离集合中,得到一个新的距离矩阵D(1)
从D(1)出发重复上述步骤得到D(2)……,直到m个事件聚为1个大类为止。
其中,步骤S806和S808的顺序可以调换。
在合并的过程中记下合并事件的编号及两个类合并时的水平(即距离)并绘制聚类谱系图。
在步骤S8之后执行步骤S10,根据样本的特征进行分类,在聚类谱系图上取不同的谱系水平即可将整个数据分成不同数量的类,根据样本的特征,可知其在某测量原理下会有多少类粒子出现,通过选择谱系水平,即可得到相应的类别。
然而由于样本个体的差异,有些样本的某个子类的特征一致性较差,也就是说这类粒子比较分散,或者某子类与另外一个子类的差异不明显(距离较近),如果仍然强制分成g个类的话就会出现误差,导致分类结果的可信度下降,因此要在步骤10之后对聚类的效果进行评价,执行步骤S12;
在步骤S12,对分类效果进行评价,包括以下步骤:
1、计算从1到L+r的各整数的聚类效果参数,其中L为样本根据测量原理所应有的类别数,且L为大于或等于1的整数,r为根据经验所得的大于0的整数。
设某谱系水平上(距离)共有r个类,类Gk中的类内离差平方和为:
S k = Σ i ∈ G k ( x i - x ‾ k ) T ( x i - x ‾ k )
其中xi为事件ei的特征数据向量(xi1,xi2,…xip)T,T表示矩阵的转置,xk是类Gk的重心,即类Gk中所有参与运算的事件的重心,重心的坐标是事件的各个纬度的平均值,Sk越小说明Gk中各个事件越相似。
定义 P g = Σ k = 1 G S k , 所有事件的总离差平方和为:
T = Σ i = 1 m ( x i - x ‾ ) T ( x i - x ‾ )
其中,那么用伪F统计量PSF来评价将所有数据分成g个类的效果:
PSF = ( T - P g ) / ( g - 1 ) P g / ( m - g )
其中,m是距离矩阵中参与运算的事件的总数目,PSF越大表示这些事件可以显著地分成g个类。
假设通常情况下的样本在某测量原理下应具有L个类,计算分类数从1到L+r(r>0)的PSF,r通常取3~5。
2、查找出其聚类效果参数为最大的整数,若PSF的最大值出现在分成q个类时,认为从聚类分析的角度将事件分成q个类最合适。
3、如上所述,q往往并不等于L,因此在步骤S12后执行步骤S14,采取如下策略判断分类是否合理:将步骤2中查找出的整数q和类别数L进行比较,如果分类合理,则执行步骤S16,如果分类不合理,则执行步骤S18。在步骤S16,分类合理时有两种情况:
i)当q>L时,取分类数为q,并报警:出现新类(往往是异常细胞群),转入到异常样本处理程序,异常样本处理程序是例如将其中的L类进行统计计算百分比,对于新类并不参与百分比的计算、新类要用一个固定便捷来计算等处理;
ii)当(L-o)<q≤L时,取分类数为L,正常运算并输出分类结果,o的取值决于对大量样本研究的经验值,该样本中只有q个类,其它类的数据为零。
在步骤S18,当q≤(L-o)时,说明此次的样本异常,不能区分出类别,则不运算,报警,转入到异常样本处理程序。这种情况对于血液细胞来说可能说明仪器出现故障,或者白血病或试剂对血液不起作用了。
评价分类效果的统计量除了可以如上述所述采用伪F统计量外,本领域技术人员也可以采用已有技术中的R2统计量、半偏相关统计量或者伪t2统计量等。
为实现上述方法,流式细胞术的分类装置(即图4中的分析模块)的结构示意图如图8所示,包括事件生成单元、计算单元和聚类单元。事件生成单元用于根据收集每个细胞或粒子逐个通过光照区域时产生的至少两路光信号将每个细胞或粒子表征为一个与其各路光信号强度有关的、至少二维的向量;计算单元用于根据事件生成单元生成的向量计算所有有效细胞或粒子两两之间的距离,且距离越近,两个细胞或粒子之间的相似程度越高;聚类单元用于将相似程度高的细胞或粒子聚集成同一个类的,所述聚类单元能够多次聚类,至少将所有有效细胞或粒子聚集成样本根据测量原理所应有的类别数L,在另一种实施例中,聚类单元将所有有效细胞或粒子聚集成一个类。
为减少参与运算的数据,提高分类的效率,分类装置还包括用于设定阈值、将不符合阈值条件的数据删除的设门单元。
其中所述聚类单元包括:用于在计算出的所有距离的距离集合中查找出距离最小的两个细胞或粒子的第一查找模块;用于将该两个细胞或粒子合并成一个维数相同的新的类的合并模块;用于在距离集合中将与该两个细胞或粒子相关的距离删除的删除模块;用于计算新类与其他类、细胞或粒子两两之间的距离,并将其加入到距离集合中的第一计算模块。
分类装置还进一步包括用于进行聚类效果评价以确定样本真正应有的类别数的类别评价单元。
所述类别评价单元包括:用于计算从1到L+r的各整数的聚类效果参数的第二计算模块,其中L为样本根据测量原理所应有的类别数,且L为大于或等于1的整数,r为根据经验所得的大于0的整数;用于查找出其聚类效果参数为最大的整数q的第二查找模块;用于将第二查找模块查找出的整数q和类别数L进行比较的比较模块,所述比较模块用于在q>L时,取该样本的分类数为q,在L-o<q≤L时,取该样本的分类数为L,在q≤L-o,不进行分别,并结束运算。
所述第二计算模块计算的聚类效果参数为伪F统计量,所述第二计算模块包括:用于根据公式 S k = Σ i ∈ G k ( x i - x ‾ k ) T ( x i - x ‾ k ) 计算每个类的类内离差平方和的第三计算模块,其中,Sk为类Gk的类内离差平方和,xi为类Gk内第i个细胞或粒子的特征数据向量(xi1,xi2,…xip)T,xk是类Gk的重心;用于计算将样本分成g个类时的各类的类内离差平方和之和Pg的第四计算模块;用于根据公式 PSF = ( T - P g ) / ( g - 1 ) P g / ( m - g ) 计算将样本分成g个类时的伪F统计量PSF的第五计算模块。
以下是一个用于血液细胞分析仪的实现例:
在基于流式细胞术的血液细胞分析仪中用FSC和SSC将全血中的白细胞分成四个子类,分别为淋巴细胞(Lymph)、单核细胞(Mono)、中性粒细胞(Neut)和嗜碱性粒细胞(Baso)以及嗜酸性粒细胞(Eos),图9、图10是利用本发明的分类方法将对两个不同的样本A和B分类之后的结果,其对不同的样本数据生成不同的边界BorderlinelA、BorderlinelB进行分类。现有技术中一般都是在二维信号形成的散点图上用固定边界将它们区分出来,但是固定边界不能体现出样本的个体差异,图11和图12为分别为用同一个固定边界Fixed Borderlinel进行分类的结果,从中可以看到样本B的Neut细胞的一部分被固定边界划给了Mono细胞,造成结果出现偏差。而本发明所提供的分类方法能够根据样本的不同而自动调节分类边界,使分类结果更为合理。
综上所述,本发明的优点之一是对每次样本测量都进行聚类运算,是一种对任何样本都进行自动分类的方法,也就是说分类情况根据样本的不同而不同,具有针对样本的自适应性;而传统方法都是固定边界强制分类,当样本不满足固定边界的共性之后就会出现很大偏差。
美国专利5627040中虽然每一类粒子的边界位置是不固定的,但是分类边界的形状、大小和方位都是固定的,同样解决不了上述问题。
美国专利6944338虽然也提出了自动分类的算法,但是此算法是基于一个二维方阵的,有很多无效的数据点参加了运算。另外,当有效数据的过于离散之后,其运算效果将会大幅度下降,因为每个离散于大集团之外的点或者小集团都会被认为是一个单独的类,而事实却非如此。
本发明的优点之二是此算法是基于数据的,而不是图形或者图像,因此可以对多维数据进行分类,而美国专利6944338所揭露的技术只针对二维数据,目前常用的在散点图上划分边界的方法也只能在最多三维数据上进行。

Claims (19)

1.一种流式细胞术的自动分类方法,其特征在于包括以下步骤:
A1、根据收集的每个细胞或粒子逐个通过光照区域时产生的至少两路光信号,将每个细胞或粒子表征为一个与其各路光信号强度有关的、至少二维的向量;
B1、设定阈值,将不符合阈值条件的细胞或粒子的数据删除,得到有效数据,计算所有有效细胞或粒子两两之间的距离,且距离越近,两个细胞或粒子之间的相似程度越高;
C1、对距离集合中的有效数据进行聚类分析,将相似程度高的细胞或粒子聚集成同一个类;
D1、重复步骤C1多次聚类后,至少将所有有效细胞或粒子根据样本的测量原理所应有的类别数L进行分类。
2.如权利要求1所述的流式细胞术的自动分类方法,其特征在于:所述步骤B1中用选自于欧式距离、绝对距离、Minkowski距离、Chebyshev距离、方差加权距离和马氏距离中的一种方法来计算细胞或粒子两两之间的距离。
3.如权利要求2所述的流式细胞术的自动分类方法,其特征在于:所述步骤C1中的聚类分析采用谱系聚类法,所述谱系聚类法包括以下步骤:
C11、在计算出的所有距离的距离集合中查找出距离最小的两个细胞或粒子;
C12、将该两个细胞或粒子合并成一个维数相同的新的类;
C13、在距离集合中将与该两个细胞或粒子相关的距离删除;
C14、计算步骤C12中合并成的新类与其他类、细胞或粒子两两之间的距离,并将其加入到距离集合中。
4.如权利要求3所述的流式细胞术的自动分类方法,其特征在于:在所述步骤C11中,当距离为0时,则只允许一个细胞或粒子参与聚类,并在计数时记录为两个细胞或粒子。
5.如权利要求3所述的流式细胞术的自动分类方法,其特征在于:在所述步骤C12中,在合并的过程中记录该次合并的编号及两个类合并时的水平。
6.如权利要求1至5中任一项所述的流式细胞术的自动分类方法,其特征在于:所述步骤D1中,重复步骤C1,最后将所有有效细胞或粒子聚集成一个类别。
7.如权利要求6所述的流式细胞术的自动分类方法,其特征在于:在所述步骤D1之后还包括以下步骤:
E1、进行聚类效果评价,确定样本真正应有的类别数。
8.如权利要求7所述的流式细胞术的自动分类方法,其特征在于:所述步骤E1包括以下步骤:
E11、计算从1到L+r的各整数的聚类效果参数,其中L为样本根据测量原理所应有的类别数,且L为大于或等于1的整数,r为根据经验所得的大于0的整数;
E12、查找出其聚类效果参数为最大的整数q;
E13、将步骤E12中查找出的整数q和类别数L进行比较,如果q>L,则取该样本的分类数为q;如果L-o<q≤L,则取该样本的分类数为L;如果q≤L-o,则不进行分类,并结束运算,其中o的取值取决于对大量样本研究的经验值。
9.如权利要求8所述的流式细胞术的自动分类方法,其特征在于:所述步骤E11之中所述的聚类效果参数为伪F统计量,所述伪F统计量的计算包括以下步骤:
E111、根据公式
Figure FDA00002852722600021
计算每个类的类内离差平方和,其中,Sk为类Gk的类内离差平方和,xi为类Gk内第i个细胞或粒子的特征数据向量(xi1,xi2,...xip)T
Figure FDA00002852722600022
是类Gk的重心;
E112、计算将样本分成g个类时的各类的类内离差平方和之和Pg;
E113、计算将样本分成g个类时的伪F统计量PSF,
Figure FDA00002852722600023
其中,T为所有事件的总离差平方和,m是距离矩阵中参与运算的事件的总数目。
10.一种流式细胞术的自动分类装置,其特征在于包括:
用于根据收集每个细胞或粒子逐个通过光照区域时产生的至少两路光信号将每个细胞或粒子表征为一个与其各路光信号强度有关的、至少二维的向量的事件生成单元;
用于设定阈值,将不符合阈值条件的数据删除以得到有效数据的设门单元;
用于根据事件生成单元生成的向量计算所有有效细胞或粒子两两之间的距离的计算单元,且距离越近,两个细胞或粒子之间的相似程度越高;
用于对距离集合中的有效数据进行聚类分析,将相似程度高的细胞或粒子聚集成同一个类的聚类单元,所述聚类单元能够多次聚类,至少将所有有效细胞或粒子根据样本的测量原理所应有的类别数L进行分类。
11.如权利要求10所述的流式细胞术的自动分类装置,其特征在于:所述计算单元用选自于欧式距离、绝对距离、Minkowski距离、Chebyshev距离、方差加权距离和马氏距离中的一种方法来计算细胞或粒子两两之间的距离。
12.如权利要求11所述的流式细胞术的自动分类装置,其特征在于:所述聚类单元包括:
用于在计算出的所有距离的距离集合中查找出距离最小的两个细胞或粒子的第一查找模块;
用于将该两个细胞或粒子合并成一个维数相同的新的类的合并模块;
用于在距离集合中将与该两个细胞或粒子相关的距离删除的删除模块;
用于计算新类与其他类、细胞或粒子两两之间的距离,并将其加入到距离集合中的第一计算模块。
13.如权利要求10至12中任一项所述的流式细胞术的自动分类装置,其特征在于:所述聚类单元用于最后将所有有效细胞或粒子聚集成一个类别。
14.如权利要求13所述的流式细胞术的自动分类装置,其特征在于:还包括用于进行聚类效果评价以确定样本真正应有的类别数的类别评价单元。
15..如权利要求14所述的流式细胞术的自动分类装置,其特征在于:所述类别评价单元包括:
用于计算从1到L+r的各整数的聚类效果参数的第二计算模块,其中L为样本根据测量原理所应有的类别数,且L为大于或等于1的整数,r为根据经验所得的大于0的整数;
用于查找出其聚类效果参数为最大的整数q的第二查找模块;
用于将第二查找模块查找出的整数q和类别数L进行比较的比较模块,所述比较模块用于在q>L时,取该样本的分类数为q,在L-o<q≤L时,取该样本的分类数为L,在q≤L-o,不进行分类,并结束运算,其中o的取值取决于对大量样本研究的经验值。
16.如权利要求15所述的流式细胞术的自动分类装置,其特征在于:所述第二计算模块计算的聚类效果参数为伪F统计量,所述第二计算模块包括:
用于根据公式
Figure FDA00002852722600041
计算每个类的类内离差平方和的第三计算模块,其中,Sk为类Gk的类内离差平方和,xi为类Gk内第i个细胞或粒子的特征数据向量(xi1,xi2,...xip)T
Figure FDA00002852722600042
是类Gk的重心;
用于计算将样本分成g个类时的各类的类内离差平方和之和Pg的第四计算模块;
用于根据公式
Figure FDA00002852722600043
计算将样本分成g个类时的伪F统计量PSF的第五计算模块,其中,T为所有事件的总离差平方和,m是距离矩阵中参与运算的事件的总数目。
17.一种流式细胞术的自动分类统计系统,其特征在于包括:
样本发生装置,所述样本发生装置进一步包括相互连接的气液传输控制模块和流动室,所述气液传输控制模块用于使含有被测细胞或粒子的样本液被鞘液包裹着通过流动室;
光照射装置,用于产生光束以照射通过流动室的鞘流;
检测器,用于收集细胞或粒子逐个通过光照区域时产生的至少两路光信号;
分类统计处理器,用于根据检测器收集的光信号,将每个细胞或粒子表征为一个与其各路光信号强度有关的、至少二维的向量,设定阈值,将不符合阈值条件的数据删除,得到有效数据,计算所有有效细胞或粒子两两之间的距离,且距离越近,两个细胞或粒子之间的相似程度越高,对距离集合中的有效数据进行聚类分析,将相似程度高的细胞或粒子聚集成同一个类,经多次聚类后,至少将所有有效细胞或粒子根据样本的测量原理所应有的类别数L进行分类。
18.如权利要求17所述的流式细胞术的自动分类统计系统,其特征在于:所述分类统计处理器用于最后将所有有效细胞或粒子聚集成一个类别。
19.如权利要求18所述的流式细胞术的自动分类统计系统,其特征在于:所述分类统计处理器还用于计算从1到L+r的各整数的聚类效果参数,查找出其聚类效果参数为最大的整数q,将查找出的整数q和类别数L进行比较,在q>L时,取该样本的分类数为q,在L-o<q≤L时,取该样本的分类数为L,在q≤L-o,不进行分类,并结束运算,其中L为样本根据测量原理所应有的类别数,且L为大于或等于1的整数,r为根据经验所得的大于0的整数,o的取值取决于对大量样本研究的经验值。
CN200710072878.6A 2007-01-17 2007-01-17 流式细胞术的自动分类方法和装置 Active CN101226190B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN200710072878.6A CN101226190B (zh) 2007-01-17 2007-01-17 流式细胞术的自动分类方法和装置
US11/966,703 US20080172185A1 (en) 2007-01-17 2007-12-28 Automatic classifying method, device and system for flow cytometry

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200710072878.6A CN101226190B (zh) 2007-01-17 2007-01-17 流式细胞术的自动分类方法和装置

Publications (2)

Publication Number Publication Date
CN101226190A CN101226190A (zh) 2008-07-23
CN101226190B true CN101226190B (zh) 2013-07-03

Family

ID=39618408

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200710072878.6A Active CN101226190B (zh) 2007-01-17 2007-01-17 流式细胞术的自动分类方法和装置

Country Status (2)

Country Link
US (1) US20080172185A1 (zh)
CN (1) CN101226190B (zh)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8243272B2 (en) * 2005-09-19 2012-08-14 Jmar Llc Systems and methods for detecting normal levels of bacteria in water using a multiple angle light scattering (MALS) instrument
CN101493400B (zh) * 2008-01-25 2012-06-27 深圳迈瑞生物医疗电子股份有限公司 一种基于形状特征的自动分类校正的方法
FR2935802B1 (fr) * 2008-09-05 2012-12-28 Horiba Abx Sas Procede et dispositif de classification, de visualisation et d'exploration de donnees biologiques
CN101672759B (zh) * 2008-09-12 2013-01-23 深圳迈瑞生物医疗电子股份有限公司 一种粒子分类统计方法及装置
SE535070C2 (sv) * 2010-09-10 2012-04-03 Choros Cognition Ab Förfarande för att automatiskt klassificera en två-eller högredimensionell bild
CN102331393A (zh) * 2011-07-08 2012-01-25 无锡荣兴科技有限公司 一种对人体血液中细胞进行自动分类计算的方法
CN102507417B (zh) * 2011-11-29 2014-04-09 长春迪瑞医疗科技股份有限公司 一种粒子自动分类方法
CN103776751B (zh) * 2012-10-23 2016-06-01 深圳市蓝韵实业有限公司 用于粒子检测仪中散点图的粒子分类方法
WO2015157970A1 (zh) * 2014-04-17 2015-10-22 深圳迈瑞生物医疗电子股份有限公司 一种流式细胞分析仪及其多维数据分类方法、装置
CN104200114B (zh) * 2014-09-10 2017-08-04 中国人民解放军军事医学科学院卫生装备研究所 流式细胞仪数据快速分析方法
CN104361360A (zh) * 2014-12-03 2015-02-18 中国人民解放军军事医学科学院卫生装备研究所 一种流式数据细胞亚群快速自动识别方法
CN106548204A (zh) * 2016-11-01 2017-03-29 北京信息科技大学 流式细胞仪数据快速自动分群方法
CN107478622B (zh) * 2017-06-29 2020-06-02 深圳市液芯科技有限公司 一种荧光编码微球的解码方法和系统
CN108169105B (zh) * 2017-11-07 2020-12-18 山东卓越生物技术股份有限公司 应用于血细胞分析仪的白细胞分类处理方法
FR3078777B1 (fr) * 2018-03-07 2020-11-13 Alain Rousseau Procede d’analyse d’un echantillon biologique contenant des cellules biologiques, et appareil d’analyse pour la mise en œuvre du procede d’analyse
CN112154317A (zh) 2018-04-26 2020-12-29 贝克顿·迪金森公司 颗粒分析仪的表征和分选
CN112771510A (zh) * 2018-11-16 2021-05-07 索尼公司 信息处理设备、信息处理方法和程序
CN111079824A (zh) * 2019-12-13 2020-04-28 杭州电子科技大学 一种通过比较向量距离对癫痫进行分类的方法
CN114720681A (zh) * 2022-05-11 2022-07-08 深圳市帝迈生物技术有限公司 一种样本分析仪及其多联检滤波的方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4599307A (en) * 1983-07-18 1986-07-08 Becton, Dickinson And Company Method for elimination of selected cell populations in analytic cytology
US4704891A (en) * 1986-08-29 1987-11-10 Becton, Dickinson And Company Method and materials for calibrating flow cytometers and other analysis instruments
CN1163402A (zh) * 1996-04-03 1997-10-29 东亚医用电子株式会社 粒子分析装置
CN1438479A (zh) * 2002-12-31 2003-08-27 上海中科大光镊科技有限公司 一种用激光分选提取液相细胞内物质的技术
CN1653331A (zh) * 2002-05-15 2005-08-10 阿默森生物科学英国有限公司 测定细胞形态学参数变化的方法

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4727020A (en) * 1985-02-25 1988-02-23 Becton, Dickinson And Company Method for analysis of subpopulations of blood cells
US4765737A (en) * 1987-03-30 1988-08-23 Cornell Research Foundation Cell size measurements using light in flow cytometry and cell sorting
US4987086A (en) * 1987-11-30 1991-01-22 Becton, Dickinson And Company Method for analysis of subpopulations of cells
US5008202A (en) * 1988-11-29 1991-04-16 Sequoia Turner Corporation Blood diluent for red blood cell analysis
US5150313A (en) * 1990-04-12 1992-09-22 Regents Of The University Of California Parallel pulse processing and data acquisition for high speed, low error flow cytometry
US5227304A (en) * 1991-01-16 1993-07-13 Sequoia Turner Corporation Method for counting whole blood diluent and detergent reagent system
WO1993005478A1 (en) * 1991-08-28 1993-03-18 Becton, Dickinson & Company Gravitational attractor engine for adaptively autoclustering n-dimensional data streams
US6014904A (en) * 1996-05-09 2000-01-18 Becton, Dickinson And Company Method for classifying multi-parameter data
US5935857A (en) * 1997-08-01 1999-08-10 Coulter International Corp. Blood diluent
EP2565826B1 (en) * 2000-05-11 2019-11-06 Becton Dickinson and Company System for indentifying clusters in scatter plots using smoothed polygons with optimal boundaries
US6944607B1 (en) * 2000-10-04 2005-09-13 Hewlett-Packard Development Compnay, L.P. Aggregated clustering method and system
US7218764B2 (en) * 2000-12-04 2007-05-15 Cytokinetics, Inc. Ploidy classification method
US7345758B2 (en) * 2001-05-17 2008-03-18 Cytopeia Apparatus for analyzing and sorting biological particles
CA2587338C (en) * 2004-11-10 2016-02-09 Attagene, Inc. Populations of reporter sequences and methods of their use
US7113266B1 (en) * 2005-03-30 2006-09-26 Beckman Coulter, Inc. Flow cytometer for differentiating small particles in suspension

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4599307A (en) * 1983-07-18 1986-07-08 Becton, Dickinson And Company Method for elimination of selected cell populations in analytic cytology
US4704891A (en) * 1986-08-29 1987-11-10 Becton, Dickinson And Company Method and materials for calibrating flow cytometers and other analysis instruments
CN1163402A (zh) * 1996-04-03 1997-10-29 东亚医用电子株式会社 粒子分析装置
CN1653331A (zh) * 2002-05-15 2005-08-10 阿默森生物科学英国有限公司 测定细胞形态学参数变化的方法
CN1438479A (zh) * 2002-12-31 2003-08-27 上海中科大光镊科技有限公司 一种用激光分选提取液相细胞内物质的技术

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
施家琦等.双参数人类染色体流式分析及分选.《激光生物学报》.1998,第7卷(第02期), *

Also Published As

Publication number Publication date
CN101226190A (zh) 2008-07-23
US20080172185A1 (en) 2008-07-17

Similar Documents

Publication Publication Date Title
CN101226190B (zh) 流式细胞术的自动分类方法和装置
CN102507417B (zh) 一种粒子自动分类方法
US8682810B2 (en) Method and system for analysis of flow cytometry data using support vector machines
US6014904A (en) Method for classifying multi-parameter data
US10801944B2 (en) High accuracy 5-part differential with digital holographic microscopy and untouched leukocytes from peripheral blood
US20160169786A1 (en) Automated flow cytometry analysis method and system
US20180003634A1 (en) Nucleated red blood cell warning method and device, and flow cytometer using the same
US4596464A (en) Screening method for red cell abnormality
CN106662572A (zh) 细胞分析仪、粒子分类方法及装置
CN105940301B (zh) 一种流式细胞分析仪及其多维数据分类方法、装置
CN101672759B (zh) 一种粒子分类统计方法及装置
CN107389536B (zh) 基于密度-距离中心算法的流式细胞粒子分类计数方法
CN102305758B (zh) 一种粒子快速自动分类方法及其实现装置
CN102331393A (zh) 一种对人体血液中细胞进行自动分类计算的方法
CN104359821A (zh) 一种散点图的粒子分类统计方法和系统及血液细胞分析仪
CN103364324A (zh) 一种用于血液细胞分析仪的自适应分类计算方法
CN112330095A (zh) 一种基于决策树算法的质量管理方法
CN111274949B (zh) 一种基于结构分析的血液病白细胞散点图相似度分析方法
CN112432948A (zh) 一种外周血细胞形态学自动检测方法
US9347933B2 (en) System and method to improve yield of sorted particles
CN109146232A (zh) 主成分与变异系数的股市投资者情绪代理指标选择方法
CN101762448A (zh) 一种粒子分类方法及粒子检测装置
CN114912493B (zh) 基于机器学习的流式免疫细胞智能分析系统
JPS60107565A (ja) 赤血球異常のスクリ−ニング方法
CN115407076A (zh) 一种基于细胞散点图的异常检测方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20180626

Address after: 518057 the 1-4 floor of MINDRAY building, science and technology south twelve Road, Nanshan District high tech Industrial Park, Shenzhen, Guangdong.

Co-patentee after: Shenzhen MINDRAY Technology Co., Ltd.

Patentee after: Shenzhen Mairui Biotherapeutic Electronic Co., Ltd.

Address before: 518057 MINDRAY science and technology south twelve road MINDRAY high tech Industrial Park, Shenzhen, Guangdong

Patentee before: Shenzhen Mairui Biotherapeutic Electronic Co., Ltd.

TR01 Transfer of patent right