CN112507991A - 流式细胞仪数据的设门方法、系统、存储介质及电子设备 - Google Patents
流式细胞仪数据的设门方法、系统、存储介质及电子设备 Download PDFInfo
- Publication number
- CN112507991A CN112507991A CN202110153854.3A CN202110153854A CN112507991A CN 112507991 A CN112507991 A CN 112507991A CN 202110153854 A CN202110153854 A CN 202110153854A CN 112507991 A CN112507991 A CN 112507991A
- Authority
- CN
- China
- Prior art keywords
- data
- gating
- flow cytometer
- cluster
- curve
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 105
- 238000003860 storage Methods 0.000 title claims abstract description 22
- 238000009826 distribution Methods 0.000 claims abstract description 31
- 238000013507 mapping Methods 0.000 claims abstract description 13
- 238000006243 chemical reaction Methods 0.000 claims abstract description 5
- 238000012545 processing Methods 0.000 claims description 22
- 239000012535 impurity Substances 0.000 claims description 14
- 230000006835 compression Effects 0.000 claims description 11
- 238000007906 compression Methods 0.000 claims description 11
- 239000006185 dispersion Substances 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 6
- 238000012163 sequencing technique Methods 0.000 claims description 3
- 238000000638 solvent extraction Methods 0.000 claims description 3
- 230000008569 process Effects 0.000 description 19
- 238000004364 calculation method Methods 0.000 description 13
- 210000004027 cell Anatomy 0.000 description 13
- 238000004458 analytical method Methods 0.000 description 6
- 210000000265 leukocyte Anatomy 0.000 description 6
- 238000010606 normalization Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000008030 elimination Effects 0.000 description 4
- 238000003379 elimination reaction Methods 0.000 description 4
- 238000000684 flow cytometry Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000002776 aggregation Effects 0.000 description 3
- 238000004220 aggregation Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 238000012937 correction Methods 0.000 description 3
- 230000007547 defect Effects 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 230000007717 exclusion Effects 0.000 description 2
- 210000003714 granulocyte Anatomy 0.000 description 2
- 210000004698 lymphocyte Anatomy 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 210000001616 monocyte Anatomy 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- LFULEKSKNZEWOE-UHFFFAOYSA-N propanil Chemical compound CCC(=O)NC1=CC=C(Cl)C(Cl)=C1 LFULEKSKNZEWOE-UHFFFAOYSA-N 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000003321 amplification Effects 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000007797 corrosion Effects 0.000 description 1
- 238000005260 corrosion Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000010339 dilation Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000005429 filling process Methods 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 229940050561 matrix product Drugs 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 210000005259 peripheral blood Anatomy 0.000 description 1
- 239000011886 peripheral blood Substances 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/69—Microscopic objects, e.g. biological cells or cellular parts
- G06V20/698—Matching; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
- G06F18/24137—Distances to cluster centroïds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/69—Microscopic objects, e.g. biological cells or cellular parts
- G06V20/695—Preprocessing, e.g. image segmentation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种流式细胞仪数据的设门方法、系统、存储介质及电子设备,方法包括:将原始数据标准化换算,并基于换算后的数据生成关于数据点分布的二值图像,计算确定聚类中心的数目和位置,获取聚类中心对应的轮廓边界并将该轮廓边界映射至原始数据中,生成初始设门曲线;通过数据点的局部密度和距离获取聚类簇的凸包轮廓来修正初始设门曲线边缘形成最终设门曲线。该设门方法根据原始数据生成二值图像,利用二值图像快速获取聚类中心的数目和位置并生成初始设门曲线。本申请实施例提供一种流式细胞仪数据的设门方法、系统、存储介质及电子设备,该设门方法具有设门精度高、运算时间短的特点。
Description
技术领域
本发明涉及流式数据分析技术领域,主要涉及流式细胞仪数据的设门方法、系统、存储介质及电子设备。
背景技术
流式细胞术是一种能够精确快速地对细胞的理化和生物特性进行多参数定量分析以及对特定细胞群分选的技术,可对每个样本检测数百万个细胞,并快速量化每个细胞的高达50项参数。
流式细胞术的突出优势在于对样本的高通量检测能力,然而,数据分析阶段的复杂性是该项技术的瓶颈,由此导致流式细胞术的巨大潜力尚未得到充分释放。
流式细胞仪数据的设门分析是样本类群识别的过程,通过仪器生成的一系列二维散点图,在图上生成感兴趣区域以找到属于同类的细胞群,并在不同的双变量图上检查该子集,最终报告某种定性或定量测量。
当前流式细胞仪数据的设门主要通过手工操作来完成,但该方法不易扩展,且依赖于研究者的先验知识,从而引入了对预期结果的主观偏见,具有天然的局限性。
常见的流式细胞仪数据自动设门方法包括有监督和无监督两大类。
有监督方法是基于大数据的。如flowDensity、Opencyto,有监督方法本质上是数据驱动技术,强依赖于大数据的标记。
无监督方法是基于聚类的。确定聚类的策略取决于具体的算法实现,现有技术中基于K均值聚类设门,虽然计算速度有优势,但设门精度相对偏低,且在处理离群数据时易出现过拟合现象,存在精度不足的缺点。现有技术中还基于谱聚类设门,该方法设门精度上有所提高,但受限于矩阵乘积方式进行结果估计的数学机理,运算时间偏长,尤其处理大量数据时,劣势明显,存在计算速度慢的缺点。
总的来说,现有基于聚类的无监督设门方法中,普遍存在设门精度不足或运算速度慢的缺点。
因此,现有技术还有待于改进和发展。
发明内容
鉴于上述现有技术的不足,本申请实施例的目的在于提供一种流式细胞仪数据的设门方法、系统、存储介质及电子设备,以实现高效、高精度的对流式细胞仪数据进行设门。
第一方面,本申请实施例提供一种流式细胞仪数据的设门方法,用于生成流式细胞仪数据的设门曲线,包括以下步骤:
S1、将原始数据标准化换算,并基于换算后的数据生成关于数据点分布的二值图像;
S2、在二值图像上,计算确定聚类中心的数目和位置;
S3、基于二值图像,获取聚类中心对应的轮廓边界并将该轮廓边界向外偏置,将偏置后的轮廓边界映射至原始数据中,生成初始设门曲线;
S4、以原始数据计算各数据点的局部密度以及数据点之间的距离,并根据局部密度和距离数值将所有数据点分配至以聚类中心为基准的对应聚类簇内;
S5、根据聚类簇内数据点的分配情况,生成分别归属于各聚类簇且彼此无交集的凸包轮廓;
S6、以凸包轮廓为边界,调整各聚类簇的初始设门曲线的边界,将调整后的初始设门曲线输出为最终设门曲线。
所述的流式细胞仪数据的设门方法,其中,步骤S1包括以下子步骤:
S11、将原始数据通过离差标准化的方式映射至预设范围内形成标准化散点数据;
S12、根据标准化散点数据三维坐标压缩生成平面的灰度图像;
S13、将所述灰度图像转化成以数据点作为前景的二值图像;
S14、去除二值图像中小面积的前景以消除连接区域的稀疏像素;
S15、以二值膨胀操作外扩前景区域边界;
S16、在二值图像的前景目标内做孔洞填充处理。
所述的流式细胞仪数据的设门方法,其中,步骤S2包括以下子步骤:
S21、根据二值图像的中心坐标和面积大小排除杂质区域,确定聚类中心的数目;
S22、将前景目标二值图像转化为标记图像,逐个获取前景目标区域的中心坐标,标记确定聚类中心的位置。
所述的流式细胞仪数据的设门方法,其中,步骤S3包括以下子步骤:
S31、基于步骤S2从二值图像中获取的聚类中心位置,计算获取对应聚类中心所在区域的轮廓边界;
S32、将该轮廓边界向外偏置10%-30%;
S33、将偏置后的轮廓边界映射至原始数据中,形成初始设门曲线。
所述的流式细胞仪数据的设门方法,其中,步骤S4包括以下子步骤:
S41、计算原始数据中的所有数据点的局部密度,将数据点按照局部密度由大到小进行排序编号;
S42、计算每个数据点与所有在前编号的数据点之间的距离,记录该数据点与之距离最小的在前编号数据点的编号及距离;
S43、以聚类中心的数量和位置为基准进行聚类簇标记分区,聚类中心对应为该聚类簇的标记中心;
S44、按照编号顺序将所有数据点进行聚类簇归属分配,其依据为每个数据点归属于与之距离最小的数据点的同一聚类簇。
所述的流式细胞仪数据的设门方法,其中,步骤S5包括以下子步骤:
S51、基于每个聚类簇内数据点的分配情况,分别计算并生成完全包围各个聚类簇内所有数据点的最小凸多边形;
S52、判断所有最小凸多边形两两之间是否存在交集,若有则执行步骤S53,若无则执行步骤S54;
S53、以交集部分的交点连接直线分割交集归属构成新的最小凸多边形,然后执行步骤S54;
S54、将各个聚类簇的最小多边形作为凸包轮廓输出至原始数据中。
所述的流式细胞仪数据的设门方法,其中,步骤S6包括以下子步骤:
S61、判断各聚类簇的原始设门曲线是否超出与之对应的凸包轮廓,若是则执行步骤S62,若否则执行步骤S63;
S62、取原始设门曲线与对应凸包轮廓之间的交集替换为新的原始设门曲线;
S63、将原始设门曲线输出为最终设门曲线。
所述的流式细胞仪数据的设门方法,其中,步骤S4中,数据点之间的距离为笛卡尔欧氏距离,数据点的局部密度以按照高斯核的方式进行计算。
第二方面,本申请实施例提供一种流式细胞仪数据的设门系统,所述系统包括至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述的流式细胞仪数据的设门方法。
第三方面,本申请实施例提供一种非易失性计算机可读存储介质,所述非易失性计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令被一个或多个处理器执行时,可使得所述一个或多个处理器执行上述的流式细胞仪数据的设门方法。
第四方面,本申请实施例提供一种电子设备,所述电子设备包括存储在非易失性计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被处理器执行时,使所述处理器执行上述的流式细胞仪数据的设门方法。
由上可知,本申请实施例提供一种流式细胞仪数据的设门方法、系统、存储介质及电子设备,设门方法与传统的基于聚类的无监督设门方法相比,具有设门精度高、运算时间短的特点,相比于现有的有监督设门方法,可精确、快速地完成数据点的归属分类,无需采用依赖大数据进行分析。
本申请的其他特征和优点将在随后的说明书阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请实施例了解。
附图说明
图1为本发明提供的流式细胞仪数据的设门方法的流程图。
图2为本发明提供的流式细胞仪数据的设门系统的结构示意图。
图3为实施例1设门方法中的流式细胞数据的散点分布示意图。
图4为实施例1设门方法中的二值图像处理过程示意图。
图5为实施例1设门方法中的初始设门曲线示意图。
图6为实施例1设门方法中通过凸包轮廓修正初始设门曲线的示意图。
图7为实施例1中最终设门曲线的结果示意图。
图8为专家采用FlowJo软件手动设门的结果示意图。
具体实施方式
下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
第一方面,本申请实施例提供一种流式细胞仪数据的设门方法,用于生成流式细胞仪数据的设门曲线,包括以下步骤:
S1、将原始数据标准化换算,并基于换算后的数据生成关于数据点分布的二值图像,其中,二值图像为仅包括前景色和背景色的图像,前景色为对应换算后的数据点的分布位置;
S2、在二值图像上,利用仅有前景色和背景色的二值图像,可快速获知数据点的聚集分布、位置,在此基础上可计算确定聚类中心的数目和位置;其中,聚类中心的数目对应为二值图像中大面积的前景色聚集区域数量,即对应数据点的连接聚集区域,并将该聚集区域的中心标记为聚类中心的位置;
S3、基于二值图像,获取聚类中心对应的轮廓边界,即对步骤S2中获得的聚类中心所在的大面积前景色聚集区域进行描边作为该聚类中心的轮廓边界,然后将该轮廓边界向外偏置,即将该轮廓边界以聚类中心为基准进行等比例放大,将偏置后的轮廓边界映射至原始数据中,生成初始设门曲线;
S4、以原始数据计算各数据点的局部密度以及数据点之间的距离,并根据局部密度和距离数值将所有数据点分配至以聚类中心为基准的对应聚类簇内,即按照数据点的分布密度情况区分其自身对应聚类簇的归属;
S5、根据聚类簇内数据点的分配情况,生成分别归属于各聚类簇且彼此无交集的凸包轮廓,从而大致确定每个原始数据中聚类簇包含散点数据的占有区域、边界;
S6、以凸包轮廓为边界,调整各聚类簇的初始设门曲线的边界,避免该聚类簇的初始设门曲线伸出于自身所在的凸包轮廓而占据其他聚类簇所在的凸包轮廓,将调整后的初始设门曲线输出为最终设门曲线。
本申请实施例的流式细胞仪数据的设门方法,根据原始数据生成二值图像,根据二值颜色可快速计算对应数据点占有的区域面积,利用大面积前景色区域,可快速确定数据点集中分布的聚类中心,从而获取聚类中心的数目和位置;然后根据二值图像的大面积前景色生成并放大初始设门曲线。
该初始设门曲线可初步反映细胞样本类群的分布情况,但由于实际采样过程中,样本类群外侧细胞呈散点分布,样本类群可能存在相互交叉部分,若直接采用初始设门曲线设门可能存在较大误差,因此引入步骤S4-S6,利用聚类簇的凸包轮廓模拟样本类群的交界边缘,以修正初始设门曲线边缘形成最终设门曲线,利用最终设门曲线可更精确地有效地反映样本类群的分布情况。
本申请实施例的流式细胞仪数据的设门方法,与传统的基于聚类的无监督设门方法相比,利用二值图像法快速确定了聚类中心的位置和数量,具有设门精度高、运算时间短的特点,相比于现有的有监督设门方法,利用局部密度和距离算法,可精确、快速地完成数据点的归属分类,无需采用依赖大数据进行分析,可实现快速、自动化、精确地对流式细胞仪的原始数据进行设门。
在某些优选的实施方式中,步骤S1包括以下子步骤:
S11、将原始数据通过离差标准化的方式映射至预设范围内形成标准化散点数据;
S12、根据标准化散点数据三维坐标压缩生成平面的灰度图像;
S13、将灰度图像转化成以数据点作为前景的二值图像;
S14、去除二值图像中小面积的前景以消除连接区域的稀疏像素;
S15、以二值膨胀操作外扩前景区域边界;
S16、在二值图像的前景目标内做孔洞填充处理。
该二值图像的生成过程中,通过将原始数据进行离差标准化换算,有利于生成灰度图像,利用灰度图像进行去色处理可直接获得对应的二值图像,在二值图像中进行图像的稀疏像素消除、边界扩充、孔洞填充的处理,可清楚地反映出散点数据的分布情况;另外,利用二值图像进行图像处理,可有效降低图像处理的配置需求,并提高图像处理效率。
在某些优选的实施方式中,步骤S11中,将流式细胞仪的原始数据通以下差标准化处理公式进行离差标准化处理,
其中,x i 可以为第i个数据点的前向通道(FSC)、侧向通道(SSC)或荧光通道(FL)数据;x min 和x max 分别为所有数据点相应通道的最小值和最大值;floor为小数向下取整函数;n为压缩比例。
通过该公式换算后的数据点,为横坐标压缩取整在[1,n]范围内的散点数据,如n取值为128,则为横坐标压缩取整在[1,128]范围内的散点数据;在此基础上,将所有原始数据中的数据点进行离差标准化处理,从而便于后续生成图像以利于观测数据点的密集程度分布。
同理,将原始数据中数据点y i 进行离差标准化处理,使数据点成为竖坐标、纵坐标压缩取整在[1,128]范围内的散点数据,从而对原始数据的三维坐标均进行离差标准化处理,映射成三维坐标均位于位于[1,128]范围内的散点数据。
处理完成后的数据点为三维坐标(x i ,y i ,z i ),其中z i 代表该位置点上散点的个数。
值得一提的是,可根据原始数据的数据量调整差标准化处理公式中的n值来调整后续图像分析中图像的压缩比例,以调整图像处理的精度和速度。
在某些优选的实施方式中,步骤S12中,对标准化处理后的散点数据三维坐标(x i , y i ,z i )中的z i 给定阈值z thresh ,根据下列灰度取值公式筛选散点数据,即图像的灰度级取值满足如下式所示条件;
其中,设置阈值z thresh 用于屏蔽底层数据,初步地排除有聚集效应的噪音数据。
利用灰度取值公式筛选散点数据后,根据余下的散点数据的(x i ,y i )生成分辨率为n×n的灰度图像,如分辨率为128×128;灰度图像中的灰度级表征重复散点的个数,即根据z i 大小可计算出对应像素位置的灰度级,即灰度级代表该处原始细胞数据在该同一竖向轴上的数据点个数。
在某些优选的实施方式中,步骤S13中,将灰度图像的灰度区域转换成区分于背景色的单一颜色的前景色,从而形成二值图像;该二值图像可清楚反映散点分布情况。
在某些优选的实施方式中,步骤S14中,通过图像处理去除小面积前景以消除连接区域的稀疏像素,即对前景色的像素点判定该像素点所在位置是否属于小面积前景,若是则消除该像素点;其中小面积前景判定设置有对应的判定阈值,如设置判定阈值为4,消除小面积对应的matlab指令是bwareaopen(BW,4),默认8连通,即形状是方形3×3,则判定该像素点以其为中心的3×3方形范围内是否存在其他像素点,若不存在,则判定为小面积前景而消除该像素点,若存在,则保留该像素点。
在某些优选的实施方式中,判定阈值的范围可为矩形、圆形、正多边形等。
在某些优选的实施方式中,步骤S14去除小面积前景色后,余下的散点数据属于大面积前景目标,接着执行步骤S15,对余下的散点数据所在的像素点进行二值膨胀操处理,即将像素点,将像素点向外扩张,形成像素块,像素块连接后形成前景目标区域边界,构成数个大区域面积的前景目标区域,利于后续聚类的确认。
在某些优选的实施方式中,步骤S15中,二值膨胀操作时,像素点扩张的卷积核可设置为盘形,尺寸小于步骤S14中的小面积前景判定阈值,如小面积判定阈值为4时,卷积核尺寸可设置为3;将像素点扩张形成大片的前景目标区域,利于后续聚类边界的确认。
具体地,可利用Matlab中函数strel在操作结构元素以用于膨胀腐蚀及开闭运算等操作的结构元素对象,具体为利用SE=strel(shape,parameters),创建由指定形状shape对应的结构元素,从而完成像素点的结构元素扩张。
在某些优选的实施方式中,卷积核尺寸范围可为矩形、圆形、正多边形等。
在某些优选的实施方式中,步骤S16中,像素点扩张形成大片的前景区域后,内部可能存在背景色孔洞,因而需进行孔洞填充处理,孔洞填充的matlab指令是BW2=imfill(BW1,'holes'),填充输入二值图像中的孔。
值得一提的是,孔洞是一组背景像素,从图像边缘填充背景无法达到的区域,与形状大小无关。
在某些优选的实施方式中,步骤S16完成后还可执行步骤S17:进一步消除小面积前景。
具体地,步骤S17中,基于膨胀后像素块的原像素点位置,判定该像素点位置在消除阈值范围内的像素块个数是否少于10个,若是则消除该原像素点膨胀后的像素块,若否则保留该像素块;该消除阈值为判定阈值的两倍大小,如判定阈值为4时,消除阈值为8。
通过步骤S1处理后获得的二值图像,具有鲜明的由散点组成的前景目标区域,该前景目标区域的个数代表了散点分布聚集的群落数量,但是其中常伴随有杂质构成的前景区域,即非目标细胞数据构成的群落,因此需要筛选并排除杂质区域。
在某些优选的实施方式中,步骤S2包括以下子步骤:
S21、根据二值图像的中心坐标和面积大小排除杂质区域,确定聚类中心的数目;
S22、将前景目标二值图像转化为标记图像,逐个获取前景目标区域的中心坐标,标记确定聚类中心的位置。
在某些优选的实施方式中,根据步骤S1处理后的二值图像具有多个大面积前景区域,由于实验环境下杂质数量较少,其组成的区域普遍小于目标聚类,因此,在步骤S21中,可以根据大面积的前景的面积判定出杂质区域并去除,如在前述128×128分辨率的二值图像中,杂质散点区域的排除条件设置为:图像中的二维笛卡尔中心坐标均小于10且像素面积小于150;满足该条件的前景区域将被认定为杂质散点聚集区域而被消除。
排除杂质区域后,余下的大面积前景均属于目标对象前景,即为具有对应细胞聚集的聚类簇,从而可确定聚类中心的数目。
在某些优选的实施方式中,步骤S3包括以下子步骤:
S31、基于步骤S2从二值图像中获取的聚类中心位置,计算获取对应聚类中心所在区域的轮廓边界;
S32、将该轮廓边界向外偏置10%-30%;
S33、将偏置后的轮廓边界映射至原始数据中,形成初始设门曲线。
在某些优选的实施方式中,在步骤S31中,步骤S2处理后的二值图像具有多个代表不同聚类簇的大面积目标前景,通过描边或边界判定的方式获取对应聚类簇的前景边界,即获取对应聚类中心所在区域的轮廓边界。
在某些优选的实施方式中,由于前述对二值图像处理过程中利用了小面积散点消除以生成像素块组成的大面积前景目标,步骤S31中生成的轮廓边界需利用步骤S32的处理方式进行边界偏置以囊括被部分消除的小面积像素,确保该边界能包括更多目标散点,即有利于后续设门精度。
在某些优选的实施方式中,在步骤S32中轮廓边界向外偏置处理为以聚类中心为中心而将边界等比例放大10%-30%。
在某些优选的实施方式中,在步骤S33中,将所述偏置后的轮廓边界映射回原始数据中,由于生产灰度图像过程中,对原始数据进行了离差标准化压缩,因此,轮廓边界映射过程中需进行对应标准化的反比例的缩放,以匹配原始数据的大小;将按反比例映射至原始数据中的轮廓边界认定为初始设门曲线,该初始设门曲线可初步划分聚类簇的占有区域。
由于细胞散点的分布为向外辐射的,因此不同聚类簇中的散点存在交叉部分,而初始设门曲线是基于全部散点分布情况的二值处理而生成的,不同聚类簇散点的交叉部分会影响初始设门曲线的区域划分,因此需对该设门曲线进行边缘修正,而二值图像中为原始数据压缩后的标准化数值,基于标准化数值进行修正的话会造成较大误差,因此将轮廓边界返回原始数据中构成初始设门曲线,再通过原始细胞数据的数据点进行初始设门曲线边缘修正,以提高设门精度。
在某些优选的实施方式中,步骤S4-S6,主要通过增加各聚类簇边界的生成过程,用于确保上述获得的初始设门曲线尽可能逼近聚类簇边界以提升设门精度,同时也不发生相互交叉。
在某些优选的实施方式中,步骤S4中,数据点之间的距离为笛卡尔欧氏距离,数据点的局部密度以按照高斯核的方式进行计算。
在某些优选的实施方式中,步骤S4包括以下子步骤:
S41、计算原始数据中的所有数据点的局部密度,将数据点按照局部密度由大到小进行排序编号;
S42、计算每个数据点与所有在前编号的数据点之间的距离,记录该数据点与之距离最小的在前编号数据点的编号及距离;
S43、以聚类中心的数量和位置为基准进行聚类簇标记分区,聚类中心对应为该聚类簇的标记中心;
S44、按照编号顺序将所有数据点进行聚类簇归属分配,其依据为每个数据点归属于与之距离最小的数据点的同一聚类簇。
在某些优选的实施方式中,步骤S41中,将原始数据中的所有数据点的数据记为数据集S={X i }Ni=1,I S ={1,2,…,N}为相应的下标集合,由此,通过相关数据表示符号的含义,利于数据集中分析处理;
接着,定义d ij =dist(X i ,X j )为数据点X i 和X j 之间的笛卡尔欧氏距离。对于数据集S中的任一数据点,可将其分布属性特点通过定义局部密度和距离来刻画,其中,定义局部密度标记为ρ i ,距离标记为δ i ,步骤S41中需对每个数据点进行局部密度计算,该局部密度ρ i 的计算按照高斯核的方式计算,其计算公式如下:
其中,d c >0为截断距离,根据计算获得的共M个距离d ij ,升序排列为d 1≤d 2≤···≤d M,取d c =d f(M×t),0<t<1,f(Mt)表示对M×t四舍五入取整;由此,可通过高斯核方式计算数据点i处由M个距离d ij 累积计算获得的局部密度ρ i 。
计算获得所有数据点的局部密度ρ i 后,将数据点按照局部密度由大到小进行排序编号,即定义基于ρ i 由大到小降序排列的集合,该定义过程为:设{q i }Ni=1表示{ρ i }Ni=1降序排列的小标,即利用q i 对降序排列的数据点进行编号,使得ρ q1 ≥ρ q2 ≥···≥ρ qN ,从而完成数据点基于局部密度的降序排列,有利于后续距离的进行有序计算。
在某些优选的实施方式中,步骤S41利用q i 对数据点进行编号后,可应用在步骤S42中进行距离计算,由于q i 为局部密度降序排列的小标;因此,计算数据点与所有在前编号的数据点之间的距离,可理解为计算局部密度大于待测数据点的所有目标数据点与该待测数据点之间的距离;记录该数据点与之距离最小的在前编号数据点的编号及距离,可理解为取所有局部密度大于该待测数据点的目标数据点与该待测数据点之间的距离中最小距离的目标数据点,记录具有最小距离的目标数据点的编号和距离值。
在某些优选的实施方式中,步骤S42中的距离计算公式为:
该公式中,若i=1,则代表为待测数据点具有最大的局部密度,此时计算结果为具有最大局部密度的数据点与所有数据点之间的距离中的最大距离。
在某些优选的实施方式中,步骤S43中对聚类簇进行标记分区的过程为:记{m j }NCj=1为各个聚类中心对应数据点的编号,X mj 为第j个聚类簇的中心,其中NC为聚类中心的数量,该聚类中心的数量由步骤S2的二值图像处理过程中计算获取;通过{m j }NCj=1即可对聚类中心进行编号分区,利于后续数据点的归属分类。
在某些优选的实施方式中,步骤S43,还需定义初始化数据点归类属性标记{c i }NCi=1,即按照定义需求重新定义聚类中心m j 的标记,标记过程通过以下归属标记公式进行定义:
经过初始化定义后聚类中心和与之对应的聚类簇具有相同的标记k,以此为基准,可将数据点进行逐级分配。
在某些优选的实施方式中,步骤S44中,基于逐层扩充的原理逐步扩大标记中心,进行归属分配时,记{n i }Ni=1表示所有数据点中局部密度比待测数据点大的目标数据点中与待测数据点距离最近的目标数据点的编号,其中,分配过程中用到以下分配公式:
该分配公式中,引入前述标记q i ,即该运算过程为依据局部密度从大到小的顺序引入数据点进行运算,其中arg函数用于获取函数的自变量,将每个数据点代入公式中,即通过代入待测数据点X i 计算获取对应目标数据点X j 的编号j,将i的编号n i 归于n j 中,即可将数据点逐步分类至不同的聚类簇中,而对应聚类簇中含有聚类中心标记k的数据点,全部数据点分配完成后,将具有相同标记n的聚类簇内数据标记为对应聚类中心标记k,完成所有数据点在相应聚类簇的归属分配。
该数据点的分配过程包含所有散点数据,即包含了初始设门曲线内外的所有数据点,对每个聚类簇含有的数据点生成轮廓边界可反映该聚类簇的辐射范围,可用于修正初始设门曲线。
由于通过二值图像确立的聚类中心不一定是该聚类簇中确切聚类中心数据点,即该聚类中心并非具有该聚类簇中最大的局部密度,因此采用先扩充后标记的方式进行归属分类;在某些优选的实施方式中,执行步骤S42后,可根据初始设门曲线界定的范围,通过局部密度比较,确立该初始设门曲线对应聚类簇内具有最大局部密度的数据点,将该数据点定义为确切聚类中心,再执行步骤S43、S44,其中步骤S44则是以具有最大局部密度的聚类中心为基准开始逐步扩充聚类簇,即扩充过程即可完成数据点的归属标记。
在某些优选的实施方式中,步骤S5包括以下子步骤:
S51、基于每个聚类簇内数据点的分配情况,分别计算并生成完全包围各个聚类簇内所有数据点的最小凸多边形,该最小凸多边形可反映对应聚类簇的覆盖情况;
S52、判断所有最小凸多边形两两之间是否存在交集,若有则执行步骤S53,若无则执行步骤S54;
S53、以交集部分的交点连接直线分割交集归属构成新的最小凸多边形,然后执行步骤S54;
S54、将各个聚类簇的最小多边形作为凸包轮廓输出至原始数据中。
在某些优选的实施方式中,由于聚类簇的数据点的划分是依据局部密度和散点距离划分,步骤S51中形成的多个最小凸多边形可能存在重叠情况,即两个聚类簇边界产生交集,该重叠位置难以判断数据点的归属,因此需利用步骤S53对该多边形的范围边界进行修正。
在某些优选的实施方式中,步骤S53中,两个最小多边形每处重叠部分均会产生两个交点,以该两个交点连接直线即去除彼此在对方内的重叠部分,即可将两个边界区分成无交集状态。
步骤S5中生成的凸包轮廓基于聚类簇中散点数据进行生成的,因而可有效地反映出聚类簇的分布情况,即该凸包轮廓反映了聚类簇交接边界特性,利用凸包轮廓修正由二值图像中基于数据点膨胀生成的初始设门曲线,即可生成具有聚类簇交接边界特性的设门曲线,该设门曲线作为最终设门曲线具有划分精度高的特点。
在某些优选的实施方式中,步骤S6包括以下子步骤:
S61、判断各聚类簇的原始设门曲线是否超出与之对应的凸包轮廓,若是则执行步骤S62,若否则执行步骤S63;
S62、取原始设门曲线与对应凸包轮廓之间的交集替换为新的原始设门曲线;
S63、将原始设门曲线输出为最终设门曲线。
在某些优选的实施方式中,步骤S62取交集过程为:截取并舍弃原始设门曲线伸出于凸包轮廓的部分。
第二方面,本申请实施例还提供一种流式细胞仪数据的设门系统,如图2所示,系统10包括:
一个或多个处理器110以及存储器120,图2中以一个处理器110为例进行介绍,处理器110和存储器120可以通过总线或者其他方式连接,图2中以通过总线连接为例。
处理器110用于完成系统10的各种控制逻辑,其可以为通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、单片机、ARM(AcornRISCMachine)或其它可编程逻辑器件、分立门或晶体管逻辑、分立的硬件组件或者这些部件的任何组合。还有,处理器110还可以是任何传统处理器、微处理器或状态机。处理器110也可以被实现为计算设备的组合,例如,DSP和微处理器的组合、多个微处理器、一个或多个微处理器结合DSP核、或任何其它这种配置。
存储器120作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块,如本申请实施例中的用于流式细胞仪数据的设门方法对应的程序指令。处理器110通过运行存储在存储器120中的非易失性软件程序、指令以及单元,从而执行系统10的各种功能应用以及数据处理,即实现上述方法实施例中的流式细胞仪数据的设门方法。
存储器120可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据系统10使用所创建的数据等。此外,存储器120可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,存储器120可选包括相对于处理器110远程设置的存储器,这些远程存储器可以通过网络连接至系统10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
一个或者多个单元存储在存储器120中,当被一个或者多个处理器110执行时,执行上述任意方法实施例中的用于流式细胞仪数据的设方法,例如,执行以上描述的图1中的方法步骤S1至步骤S6。
第三方面,本申请实施例还提供一种非易失性计算机可读存储介质,计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令被一个或多个处理器执行,例如,执行以上描述的图1中的流式细胞仪数据的设门方法步骤S1至步骤S6。
作为示例,非易失性存储介质能够包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦ROM(EEPROM)或闪速存储器。易失性存储器能够包括作为外部高速缓存存储器的随机存取存储器(RAM)。通过说明丽非限制,RAM可以以诸如同步RAM(SRAM)、动态RAM、(DRAM)、同步DRAM(SDRAM)、双数据速率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、SynchlinkDRAM(SLDRAM)以及直接Rambus(兰巴斯)RAM(DRRAM)之类的许多形式得到。本文中所描述的操作环境的所公开的存储器组件或存储器旨在包括这些和/或任何其他适合类型的存储器中的一个或多个。
第四方面,本申请实施例还提供一种电子设备,电子设备包括存储在非易失性计算机可读存储介质上的计算机程序,计算机程序包括程序指令,当程序指令被处理器执行时,使所述处理器执行上述方法实施例的用于流式细胞仪数据的设门方法。例如,执行以上描述的图1中的方法步骤S1至步骤S6。
综上所述,本申请实施例一种流式细胞仪数据的设门方法、系统、存储介质及电子设备,方法包括:将原始数据标准化换算,并基于换算后的数据生成关于数据点分布的二值图像;在二值图像上,计算确定聚类中心的数目和位置;基于二值图像,获取聚类中心对应的轮廓边界并将该轮廓边界向外偏置,将偏置后的轮廓边界映射至原始数据中,生成初始设门曲线;以原始数据计算各数据点的局部密度以及数据点之间的距离,并根据局部密度和距离数值将所有数据点分配至以聚类中心为基准的对应聚类簇内;根据聚类簇内数据点的分配情况,生成分别归属于各聚类簇且彼此无交集的凸包轮廓;以凸包轮廓为边界,调整各聚类簇的初始设门曲线的边界,将调整后的初始设门曲线输出为最终设门曲线。该设门方法根据原始数据生成二值图像,利用二值图像快速获取聚类中心的数目和位置并生成初始设门曲线;通过数据点的局部密度和距离获取聚类簇的凸包轮廓来修正初始设门曲线边缘形成最终设门曲线。该方法与传统的基于聚类的无监督设门方法相比,具有设门精度高、运算时间短的特点,相比于现有的有监督设门方法,可精确、快速地完成数据点的归属分类,无需采用依赖大数据进行分析,可实现快速、自动化、精确地对流式细胞仪的原始数据进行设门。
以下通过具体实施例对本发明做进一步说明。
实施例1:
本实施例以人体外周血样本数据进行设门分析,通过流式细胞仪获取原始数据,数据中包含了10,000个白细胞,三个种类分别为淋巴、单核以及粒细胞,又称白细胞的三分类,通常是白细胞亚群分析顺序设门过程中的第一个环节。
在本实施例中,主要计算配置为:Intel(R)Core(TM)i7CPU@2.80GHz,16G内存,并以MatlabR2016a编程实现。
将原始数据进行离差标准化处理,并生成如图3所示像素为128×128的灰度图像,即压缩比例n为128。
将该灰度图像进行二值化处理形成如图4所述中a处的二值图像。
将二值图像依次执行小面积前景的去除、像素点的二值膨胀外扩、孔洞填充处理,获得如图4所示中d处的二值图像;其中,小面积前景去除处理时,判定阈值设定为4,像素点的二值膨胀外扩的卷积核尺寸设置为盘形,阈值为3。
然后根据中心坐标和面积大小排除杂质区域,在白细胞三分类样例中,二值图像中排除标准设置为:图像中的二维笛卡尔中心坐标均小于10且像素面积小于150,即可去除左下角杂质散点构成的杂质区域,获得如图4所示中e处的二值图像,接着通过面积计算获得各目标前景区域中的聚类中心所在像素点,确定聚类中心的数目和位置。
接着基于二值图像中获取的聚类中心位置,计算获取对应聚类中心所在前景区域的轮廓边界,然后以该聚类中心为中心,对应向外偏置扩张所在前景区域的轮廓边界,向外偏置值为20%,从而或得如图4所示中f处二值图像中的轮廓边界。
其后,将轮廓边界按照反压缩比例映射回原始数据中,由于原始数据的数据点不便于展示,后续处理图像以灰度图像模拟设门过程和结果,即图5-7中利用灰度图像模拟原始数据图像进行过程和结果展示。
如图5所示为将轮廓边界返回至原始数据中形成初始设门曲线;计算所有数据点的局部密度和数据点之间的距离,并以此为依据,将数据点划分至对应的聚类簇中,然后生成如图6所示互不交叉的凸包轮廓,然后以该凸包轮廓修正初始设门曲线;
最后,如图7所示,自动设门流程结束,输出修正后的初始设门曲线为最终设门曲线。
图8所示为专家采用FlowJo软件,对白细胞三分类的手动设门结果,从图中可看出,淋巴细胞占比8.40%,单核细胞占比4.41%,粒细胞占比71.90%。其中左下角小块聚类簇认定为杂质,排除在外。
通过设门结果给出的细胞占比符合性和设门区域交并比进行对比,可用于评价本实施例中设门方法的有效性。
因而,将本实施例中设门数据与上述手动设门数据对比,获得下表:
由上述表格可知,以专家人工手动设门方法为基准,本实施例设门方法所确立的聚类中心数量一致,给出的三类白细胞占比均在99%可信区间内,平均设门区域交并比达80%,由此可说明本实施例设门方法的有效性。
由上述表格可知,本实施例中的设门方法获得结果接近,设门结果具有代表性。
此外,本发明设门方法的运行时间约为30秒,远低于现有设门方法所需用时。
通过以上的实施例的描述,本领域的技术人员可以清楚地了解到各实施例可借助软件加通用硬件平台的方式来实现,当然也可以通过硬件实现。基于这样的理解,上述技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存在于计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机电子设备(可以是个人计算机,服务器,或者网络电子设备等)执行各个实施例或者实施例的某些部分的方法。
除了其他之外,诸如"能够'、"能"、"可能"或"可以"之类的条件语言除非另外具体地陈述或者在如所使用的上下文内以其他方式理解,否则一般地旨在传达特定实施方式能包括(然而其他实施方式不包括)特定特征、元件和/或操作。
已经在本文中在本说明书和附图中描述的内容包括能够提供流式细胞仪数据的设门方法、系统、存储介质及电子设备的示例。当然,不能够出于描述本公开的各种特征的目的来描述元件和/或方法的每个可以想象的组合,但是可以认识到,所公开的特征的许多另外的组合和置换是可能的。因此,显而易见的是,在不脱离本公开的范围或精神的情况下能够对本公开做出各种修改。此外,或在替代方案中,本公开的其他实施例从对本说明书和附图的考虑以及如本文中所呈现的本公开的实践中可能是显而易见的。意图是,本说明书和附图中所提出的示例在所有方面被认为是说明性的而非限制性的。尽管在本文中采用了特定术语,但是它们在通用和描述性意义上被使用并且不用于限制的目的。
Claims (11)
1.一种流式细胞仪数据的设门方法,用于生成流式细胞仪数据的设门曲线,其特征在于,包括以下步骤:
S1、将原始数据标准化换算,并基于换算后的数据生成关于数据点分布的二值图像;
S2、在二值图像上,计算确定聚类中心的数目和位置;
S3、基于二值图像,获取聚类中心对应的轮廓边界并将该轮廓边界向外偏置,将偏置后的轮廓边界映射至原始数据中,生成初始设门曲线;
S4、以原始数据计算各数据点的局部密度以及数据点之间的距离,并根据局部密度和距离数值将所有数据点分配至以聚类中心为基准的对应聚类簇内;
S5、根据聚类簇内数据点的分配情况,生成分别归属于各聚类簇且彼此无交集的凸包轮廓;
S6、以凸包轮廓为边界,调整各聚类簇的初始设门曲线的边界,将调整后的初始设门曲线输出为最终设门曲线。
2.根据权利要求1所述的流式细胞仪数据的设门方法,其特征在于,步骤S1包括以下子步骤:
S11、将原始数据通过离差标准化的方式映射至预设范围内形成标准化散点数据;
S12、根据标准化散点数据三维坐标压缩生成平面的灰度图像;
S13、将所述灰度图像转化成以数据点作为前景的二值图像;
S14、去除二值图像中小面积的前景以消除连接区域的稀疏像素;
S15、以二值膨胀操作外扩前景区域边界;
S16、在二值图像的前景目标内做孔洞填充处理。
3.根据权利要求1所述的流式细胞仪数据的设门方法,其特征在于,步骤S2包括以下子步骤:
S21、根据二值图像的中心坐标和面积大小排除杂质区域,确定聚类中心的数目;
S22、将前景目标二值图像转化为标记图像,逐个获取前景目标区域的中心坐标,标记确定聚类中心的位置。
4.根据权利要求1所述的流式细胞仪数据的设门方法,其特征在于,步骤S3包括以下子步骤:
S31、基于步骤S2从二值图像中获取的聚类中心位置,计算获取对应聚类中心所在区域的轮廓边界;
S32、将该轮廓边界向外偏置10%-30%;
S33、将偏置后的轮廓边界映射至原始数据中,形成初始设门曲线。
5.根据权利要求1所述的流式细胞仪数据的设门方法,其特征在于,步骤S4包括以下子步骤:
S41、计算原始数据中的所有数据点的局部密度,将数据点按照局部密度由大到小进行排序编号;
S42、计算每个数据点与所有在前编号的数据点之间的距离,记录该数据点与之距离最小的在前编号数据点的编号及距离;
S43、以聚类中心的数量和位置为基准进行聚类簇标记分区,聚类中心对应为该聚类簇的标记中心;
S44、按照编号顺序将所有数据点进行聚类簇归属分配,其依据为每个数据点归属于与之距离最小的数据点的同一聚类簇。
6.根据权利要求1所述的流式细胞仪数据的设门方法,其特征在于,步骤S5包括以下子步骤:
S51、基于每个聚类簇内数据点的分配情况,分别计算并生成完全包围各个聚类簇内所有数据点的最小凸多边形;
S52、判断所有最小凸多边形两两之间是否存在交集,若有则执行步骤S53,若无则执行步骤S54;
S53、以交集部分的交点连接直线分割交集归属构成新的最小凸多边形,然后执行步骤S54;
S54、将各个聚类簇的最小多边形作为凸包轮廓输出至原始数据中。
7.根据权利要求1所述的流式细胞仪数据的设门方法,其特征在于,步骤S6包括以下子步骤:
S61、判断各聚类簇的原始设门曲线是否超出与之对应的凸包轮廓,若是则执行步骤S62,若否则执行步骤S63;
S62、取原始设门曲线与对应凸包轮廓之间的交集替换为新的原始设门曲线;
S63、将原始设门曲线输出为最终设门曲线。
8.根据权利要求1所述的流式细胞仪数据的设门方法,其特征在于,步骤S4中,数据点之间的距离为笛卡尔欧氏距离,数据点的局部密度以按照高斯核的方式进行计算。
9.一种流式细胞仪数据的设门系统,其特征在于,所述系统包括至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-8任一项所述的流式细胞仪数据的设门方法。
10.一种非易失性计算机可读存储介质,其特征在于,所述非易失性计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令被一个或多个处理器执行时,可使得所述一个或多个处理器执行权利要求1-8任一项所述的流式细胞仪数据的设门方法。
11.一种电子设备,其特征在于,所述电子设备包括存储在非易失性计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被处理器执行时,使所述处理器执行权利要求1-8任一项所述的流式细胞仪数据的设门方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110153854.3A CN112507991B (zh) | 2021-02-04 | 2021-02-04 | 流式细胞仪数据的设门方法、系统、存储介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110153854.3A CN112507991B (zh) | 2021-02-04 | 2021-02-04 | 流式细胞仪数据的设门方法、系统、存储介质及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112507991A true CN112507991A (zh) | 2021-03-16 |
CN112507991B CN112507991B (zh) | 2021-06-04 |
Family
ID=74952573
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110153854.3A Active CN112507991B (zh) | 2021-02-04 | 2021-02-04 | 流式细胞仪数据的设门方法、系统、存储介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112507991B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023149192A1 (ja) * | 2022-02-02 | 2023-08-10 | パナソニックIpマネジメント株式会社 | 処理システム、検査システム、処理方法、及びプログラム |
CN116933107A (zh) * | 2023-07-24 | 2023-10-24 | 水木蓝鲸(南宁)半导体科技有限公司 | 数据分布边界确定方法、装置、计算机设备和存储介质 |
CN117214068A (zh) * | 2023-11-08 | 2023-12-12 | 季华实验室 | 一种运动微粒成像探测系统 |
CN118197609A (zh) * | 2024-05-17 | 2024-06-14 | 大连百首企家科技有限公司 | 一种基于人脸表情分析的麻醉镇痛效果评估方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102663390A (zh) * | 2012-04-28 | 2012-09-12 | 长春迪瑞医疗科技股份有限公司 | 一种流式细胞显微图像二值化方法 |
US20120245889A1 (en) * | 2011-03-21 | 2012-09-27 | Becton, Dickinson And Company | Neighborhood Thresholding in Mixed Model Density Gating |
CN106548203A (zh) * | 2016-10-21 | 2017-03-29 | 北京信息科技大学 | 一种多参数流式细胞数据快速自动分群和设门方法 |
CN107389536A (zh) * | 2017-07-31 | 2017-11-24 | 上海纳衍生物科技有限公司 | 基于密度‑距离中心算法的流式细胞粒子分类计数方法 |
CN110132823A (zh) * | 2019-05-15 | 2019-08-16 | 林伟阳 | 一种基于模板匹配与查找轮廓的细胞计数方法 |
CN110136118A (zh) * | 2019-05-15 | 2019-08-16 | 林伟阳 | 一种基于轮廓提取的细胞计数方法 |
CN110942467A (zh) * | 2019-10-08 | 2020-03-31 | 杭州电子科技大学 | 基于pso-fcm的改进分水岭图像分割方法 |
-
2021
- 2021-02-04 CN CN202110153854.3A patent/CN112507991B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120245889A1 (en) * | 2011-03-21 | 2012-09-27 | Becton, Dickinson And Company | Neighborhood Thresholding in Mixed Model Density Gating |
CN102663390A (zh) * | 2012-04-28 | 2012-09-12 | 长春迪瑞医疗科技股份有限公司 | 一种流式细胞显微图像二值化方法 |
CN106548203A (zh) * | 2016-10-21 | 2017-03-29 | 北京信息科技大学 | 一种多参数流式细胞数据快速自动分群和设门方法 |
CN107389536A (zh) * | 2017-07-31 | 2017-11-24 | 上海纳衍生物科技有限公司 | 基于密度‑距离中心算法的流式细胞粒子分类计数方法 |
CN110132823A (zh) * | 2019-05-15 | 2019-08-16 | 林伟阳 | 一种基于模板匹配与查找轮廓的细胞计数方法 |
CN110136118A (zh) * | 2019-05-15 | 2019-08-16 | 林伟阳 | 一种基于轮廓提取的细胞计数方法 |
CN110942467A (zh) * | 2019-10-08 | 2020-03-31 | 杭州电子科技大学 | 基于pso-fcm的改进分水岭图像分割方法 |
Non-Patent Citations (1)
Title |
---|
裴智果: "用于流式细胞仪的数据采集系统设计与实现", 《电子测量技术》 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023149192A1 (ja) * | 2022-02-02 | 2023-08-10 | パナソニックIpマネジメント株式会社 | 処理システム、検査システム、処理方法、及びプログラム |
CN116933107A (zh) * | 2023-07-24 | 2023-10-24 | 水木蓝鲸(南宁)半导体科技有限公司 | 数据分布边界确定方法、装置、计算机设备和存储介质 |
CN116933107B (zh) * | 2023-07-24 | 2024-05-10 | 水木蓝鲸(南宁)半导体科技有限公司 | 数据分布边界确定方法、装置、计算机设备和存储介质 |
CN117214068A (zh) * | 2023-11-08 | 2023-12-12 | 季华实验室 | 一种运动微粒成像探测系统 |
CN117214068B (zh) * | 2023-11-08 | 2024-01-26 | 季华实验室 | 一种运动微粒成像探测系统 |
CN118197609A (zh) * | 2024-05-17 | 2024-06-14 | 大连百首企家科技有限公司 | 一种基于人脸表情分析的麻醉镇痛效果评估方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112507991B (zh) | 2021-06-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112507991B (zh) | 流式细胞仪数据的设门方法、系统、存储介质及电子设备 | |
US10445557B2 (en) | Learning pixel visual context from object characteristics to generate rich semantic images | |
Saeedi et al. | Automatic identification of human blastocyst components via texture | |
CN106803247B (zh) | 一种基于多级筛选卷积神经网络的微血管瘤图像识别方法 | |
US11748981B2 (en) | Deep learning method for predicting patient response to a therapy | |
CN112365497A (zh) | 基于TridentNet和Cascade-RCNN结构的高速目标检测方法和系统 | |
EP3816935A1 (en) | Display control device, display control method, and display control program | |
CN115345894B (zh) | 一种焊缝射线检测图像分割方法 | |
Gan et al. | Automated leather defect inspection using statistical approach on image intensity | |
CN105354405A (zh) | 基于机器学习的免疫组化图像自动化判读系统 | |
CN111414930B (zh) | 深度学习模型训练方法及装置、电子设备及存储介质 | |
US20150242676A1 (en) | Method for the Supervised Classification of Cells Included in Microscopy Images | |
CN112085695A (zh) | 一种图像处理方法、装置及存储介质 | |
CN112488983A (zh) | 缺陷识别网络的获得方法、缺陷识别方法和等级确定方法 | |
US20230419492A1 (en) | Method and apparatus for providing information associated with immune phenotypes for pathology slide image | |
CN117036305B (zh) | 一种用于咽喉检查的图像处理方法、系统及存储介质 | |
US20160283821A1 (en) | Image processing method and system for extracting distorted circular image elements | |
CN114358279A (zh) | 图像识别网络模型剪枝方法、装置、设备及存储介质 | |
CN115375674B (zh) | 胃白光瘤变图像识别方法、装置及存储介质 | |
US11448634B2 (en) | Analysis apparatus, stratum age estimation apparatus, analysis method, stratum age estimation method, and program | |
CN110705509A (zh) | 人脸方向识别方法、装置、计算机设备和存储介质 | |
Jensch et al. | A comparative evaluation of three skin color detection approaches | |
CN112184708B (zh) | 精子存活率检测方法及装置 | |
CN116681898B (zh) | 一种图像识别及定位方法 | |
CN111862003B (zh) | 医疗影像目标信息获取方法、装置、设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |