CN104361360A - 一种流式数据细胞亚群快速自动识别方法 - Google Patents

一种流式数据细胞亚群快速自动识别方法 Download PDF

Info

Publication number
CN104361360A
CN104361360A CN201410728956.3A CN201410728956A CN104361360A CN 104361360 A CN104361360 A CN 104361360A CN 201410728956 A CN201410728956 A CN 201410728956A CN 104361360 A CN104361360 A CN 104361360A
Authority
CN
China
Prior art keywords
data
matrix
location point
cell subsets
analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410728956.3A
Other languages
English (en)
Inventor
王先文
陈锋
程智
杜耀华
李辰宇
暴洪涛
吴太虎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Medical Equipment Chinese Academy of Military Medical Sciences
Original Assignee
Institute of Medical Equipment Chinese Academy of Military Medical Sciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Medical Equipment Chinese Academy of Military Medical Sciences filed Critical Institute of Medical Equipment Chinese Academy of Military Medical Sciences
Priority to CN201410728956.3A priority Critical patent/CN104361360A/zh
Publication of CN104361360A publication Critical patent/CN104361360A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23211Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with adaptive number of clusters
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/03Recognition of patterns in medical or anatomical images

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明公开了一种流式细胞仪数据(简称流式数据)细胞亚群快速自动识别方法。本发明方法通过映射流式数据到矩阵并对矩阵的位置点进行分类实现细胞亚群自动识别,其具体过程为:首先根据流式数据二维分析方式,将数据投影到一个128*128的矩阵中,获得数据的初始化矩阵;然后采用循环求最大值的方法对矩阵的位置点进行分类,最后将位置点分类结果映射回原始数据得到最终细胞亚群分类结果。本发明能够对流式数据中的细胞亚群快速识别,提高数据分析效率,避免人为主观因素对分析结果产生的影响。该发明方法识别流式数据细胞亚群的结果准确,分析时间短,分析效率高,可应用到目前流式数据自动分析中。

Description

一种流式数据细胞亚群快速自动识别方法
技术领域
本发明涉及流式数据自动分析技术,尤其是涉及流式数据中细胞亚群的快速识别方法。
技术背景
流式细胞术是一种能够精确、快速地对生物细胞的理化特性和生物学特性进行多参数定量分析及对特定细胞群分选的技术。其原理是采用微米级激光光束对经过流体动力学聚焦的细胞进行逐个激发,完整收集并记录每个细胞诱导得到的多角度散射光与多波长标记荧光信号,并通过对细胞群多光学通道数据的聚类分析实现样本的高精度定量检测。通常,单个细胞诱导得到的散射光和荧光信号以单个事件的形式被记录,所有事件汇集成被测细胞群的完整流式数据。当前流式数据分析的主要方法是将每个事件投影至二维域中,以人工设门的方式进行分析。人工设门的主要过程是对流式数据中的细胞亚群进行类群划分,即将属于同类的细胞亚群通过设定区域(门)的方式归为一类。
常见的流式细胞仪数据类群自动识别方法,比如基于混合模型的方法,虽然计算准确度比较高,但分析的时间通常较长,分析效率低。目前比较先进的基于偏斜t混合模型的分析方法能够比较准确地识别数据中的细胞亚群,但是当分析的数据量达到万级时,其计算时间通常超过了人工分析数据时间。另一种数据聚类方法是谱聚类方法,由于该方法是基于矩阵乘积的方式进行结果估计,因此在样本量较大时,其计算时间非常长。针对该问题,目前提出的一种修正谱聚类方法,该方法一定程度上解决了样本量大造成的计算时间长的问题,但由于对数据进行了预先处理,数据中包含的一部分生物信息可能在处理过程中丢失。另外,当分析的数据中事件数达到万级时,该方法的计算时间也远远超过人工分析数据时间。
发明内容
本发明的目的是通过计算机软件准确对流式数据细胞亚群进行快速自动分析,得到数据中包含的样本信息,包括样本中的亚群数目和各细胞亚群总数。
本发明流式数据细胞亚群快速自动识别方法,具体步骤如下:
(1)将数据压缩到一个128*128的矩阵中,获得压缩后数据分布状态矩阵Mat和数据压缩前后对应关系列表L;
(2)采用循环求最大值方法对128*128矩阵Mat位置点进行分群;
(3)将矩阵位置点的分群结果按照压缩前后对应关系列表,映射回原始数据,得到原始数据的分类结果,实现对原始数据细胞亚群的自动识别。
在获得标准的128*128矩阵后,为实现对矩阵的位置点进行分群,本发明提出了循环寻找最大值方法。其具体实施过程为:
(1)求矩阵中的最大值所对应的位置点,并记录该位置为P[x,y];
(2)如果(1)中得到的位置点为第一次循环得到的点,则申请该数据样本的第一个亚群S1,并将该位置点归类到S1亚群,否则,进行过程(3)。
(3)将(1)中得到的位置点P[x,y]与之前已记录的所有位置点进行比较。如果P[x,y]离之前所有的位置点都较远,则新申请一个亚群Si(已存在亚群S1,S2,…Si-1)并将P[x,y]归类到亚群Si,否则将P[x,y]归类到已申请的所有亚群中距离最近的亚群。
(4)令P[x,y]对应的值为0,回到过程(1),直到矩阵中的所有位置对应的值为0,即Mat=0。
通过以上步骤,可以得到标准矩阵位置点的分群结果S(包含群S1,S2,…),为获得原始数据的亚群分布情况,本发明提出了在压缩数据时记录每一个原始数据对应压缩数据的关系列表L,并在得到矩阵位置点的分群结果S后,按照此对应关系L返回原始数据,从而得到原始数据的亚群分类结果。
本发明方法能够快速地对流式数据亚群进行自动识别,得到数据中样本的相关信息。本方法中对数据中样本类群信息的分析结果准确度较高,分析时间远远低于人工分析方法及其他分析方法。由于本发明方法涉及到数据的自动聚类,能够广泛地应用到模式识别、图像处理等领域。
本发明提出了一种快速自动识别流式数据亚群方法,该方法能够快速得到数据中样本的分类信息。该分析方法分析流式数据的结果精确度高,时间较短。
附图说明
图1a和1b是待分析的流式细胞仪数据;
图1b是采用人工分析方法分类的结果;
图2是采用本发明方法压缩数据后的分群结果;
图3是本发明方法将压缩数据映射回原始数据的结果;
图4是采用预抽样谱聚类方法对数据分析的结果;
图5是采用偏斜t混合模型分析的结果;
图6是本发明方法的流程图。
具体实施方式
如图1a是实验数据在SSC和CD45维度的投影。人工分析该数据是通过画门的方法划分散点图中的细胞亚群。如图1b是专家采用FloMax软件划分的细胞亚群结果,由结果来看,样本中包含了四个细胞亚群,R1-R4区域分别代表了淋巴细胞亚群、单核细胞亚群、粒细胞亚群和死细胞。
如图2是采用本发明方法将数据压缩至128*128矩阵并采用循环最大值方法对矩阵位置点进行分群后的结果。其具体实施过程为:
(1)找出矩阵Mat的最大值所对应的位置Pm[xm,ym],并申请类群S1,且Pm∈S1,并令Pm=0;
(2)再次寻找Mat最大值的位置Pi[xi,yi],并计算Pi与已分群的所有点之间的距离,如果其中任意一点Pn与Pi的距离小于阈值(默认为8,实际中可根据流式数据的特点进行微调),则将Pi归类到点Pn所属的类群,并令Pi=0,然后再次寻找Mat最大值,直到Mat=0。如果Pi与已分群的所有点距离都大于阈值,则新申请一个类群Sr,并令Pi∈Sr且Pi=0,然后再次寻找Mat最大值,直到Mat=0.
图3是将图2中分群后的结果根据压缩映射列表L(列表L部分内容见表3,其中,类群表示每一个事件分类后所属类群),将结果映射回原始数据的分类结果。
由结果可知,本发明方法分析的结果与专家分析结果一致。
另外,图4和图5分别是采用预抽样谱聚类方法和偏斜t混合模型分析该数据的结果。
表一为以上三种方法的分类误判率结果比较。表二为以上三种方法的分析时间比较,其中人工分析该数据的时间约为21s,由结果可知,本发明设计的方法不仅误判率最低,最接近专家分析的结果,而且分析时间远远低于人工分析方法和其他分析方法。
本发明方法在一台配置3.2GHz CPU和2G内存的PC上,采用C++语言编程实现。程序的流程框图见图6。
表一不同方法的误判率比较
表二不同方法的分析时间比较
表三原始数据与压缩数据对应关系列表

Claims (2)

1.一种流式数据细胞亚群快速自动识别方法,其特征在于,按照下述步骤进行:
(1)将数据压缩到一个128*128的矩阵中,获得压缩后数据分布状态矩阵和数据压缩前后对应关系列表;
(2)采用循环求最大值方法对128*128矩阵位置点进行分类;
(3)将矩阵位置点的分类结果按照压缩前后对应关系列表,映射回原始数据,得到原始数据的分类结果,实现对原始数据细胞亚群的自动识别。
2.如权利要求1所述的流式数据细胞亚群快速自动识别方法,其特征在于,步骤(2)采用的循环最大值方法对矩阵的位置点进行分类过程为:
(a)求矩阵中的最大值所对应的位置点,并记录该位置;
(b)如果(a)中得到的位置点为第一次循环得到的点,则将该位置点定为第一个细胞亚群的位置点,否则,进行过程(c);
(c)将(a)中得到的位置点与之前已记录的所有位置点进行比较;如果(a)中得到的位置点离之前所有的位置点都较远,则令(a)中得到的位置点为新的一个细胞亚群所在位置点,否则将(a)得到的位置点归类到前面记录的位置点中距离最小的亚群中;
(d)令(a)中记录的位置点对应的值为0,回到过程(a),直到矩阵中的所有位置对应的值为0。
CN201410728956.3A 2014-12-03 2014-12-03 一种流式数据细胞亚群快速自动识别方法 Pending CN104361360A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410728956.3A CN104361360A (zh) 2014-12-03 2014-12-03 一种流式数据细胞亚群快速自动识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410728956.3A CN104361360A (zh) 2014-12-03 2014-12-03 一种流式数据细胞亚群快速自动识别方法

Publications (1)

Publication Number Publication Date
CN104361360A true CN104361360A (zh) 2015-02-18

Family

ID=52528618

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410728956.3A Pending CN104361360A (zh) 2014-12-03 2014-12-03 一种流式数据细胞亚群快速自动识别方法

Country Status (1)

Country Link
CN (1) CN104361360A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104751188A (zh) * 2015-04-15 2015-07-01 爱威科技股份有限公司 一种图片处理方法及系统
CN106548205A (zh) * 2016-10-21 2017-03-29 北京信息科技大学 一种流式细胞数据快速自动分群及圈门方法
CN112131937A (zh) * 2020-08-14 2020-12-25 中翰盛泰生物技术股份有限公司 一种荧光微球的自动分群方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101226190A (zh) * 2007-01-17 2008-07-23 深圳迈瑞生物医疗电子股份有限公司 流式细胞术的自动分类方法和装置
US20090204557A1 (en) * 2008-02-08 2009-08-13 Health Discovery Corporation Method and System for Analysis of Flow Cytometry Data Using Support Vector Machines
CN101923648A (zh) * 2009-06-15 2010-12-22 深圳迈瑞生物医疗电子股份有限公司 支持向量机的聚类方法与装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101226190A (zh) * 2007-01-17 2008-07-23 深圳迈瑞生物医疗电子股份有限公司 流式细胞术的自动分类方法和装置
US20090204557A1 (en) * 2008-02-08 2009-08-13 Health Discovery Corporation Method and System for Analysis of Flow Cytometry Data Using Support Vector Machines
CN101923648A (zh) * 2009-06-15 2010-12-22 深圳迈瑞生物医疗电子股份有限公司 支持向量机的聚类方法与装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ALEX RODRIGUEZ, ALESSANDRO LAIO: ""Clustering byfast search and find of density peak"", 《SCIENCE》 *
QIAN Y, WEI C, EUN-HYUNG LEE F: ""Elucidation of seventeen human peripheral blood B cell subsets and quantification of the tetanus response using a density-based method for the automated identification of cell populations in multidimensional flow cytometry data"", 《CYTOMETRY B CLIN CYTOM》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104751188A (zh) * 2015-04-15 2015-07-01 爱威科技股份有限公司 一种图片处理方法及系统
CN106548205A (zh) * 2016-10-21 2017-03-29 北京信息科技大学 一种流式细胞数据快速自动分群及圈门方法
CN112131937A (zh) * 2020-08-14 2020-12-25 中翰盛泰生物技术股份有限公司 一种荧光微球的自动分群方法

Similar Documents

Publication Publication Date Title
KR102469620B1 (ko) 생물학적 입자의 분류 시스템 및 방법
US11748885B2 (en) Methods and systems for analyzing time ordered image data
JP6222584B2 (ja) 細胞ベースの組織解析
CN110520876B (zh) 学习结果输出装置及学习结果输出程序
US11644407B2 (en) Adaptive sorting for particle analyzers
US10753848B2 (en) Efficient contours and gating
JP4521490B2 (ja) 類似パターン検索装置、類似パターン検索方法、類似パターン検索プログラム、および分画分離装置
CN105940301B (zh) 一种流式细胞分析仪及其多维数据分类方法、装置
JP2016507759A5 (zh)
AU2019293020B2 (en) Display control device, display control method, and display control program
CN104200114A (zh) 流式细胞仪数据快速分析方法
TW202223750A (zh) 用於在光譜量化期間避免誤報識別的設備和方法以及相關的非暫時性電腦可讀取媒體
CN104361360A (zh) 一种流式数据细胞亚群快速自动识别方法
JP2015103144A (ja) 画像処理装置及びプログラム
GB2428471A (en) Flow cytometry
US20230196720A1 (en) Computer-implemented method, computer program product and system for data analysis
US8688760B2 (en) Determining population boundaries using radial density histograms
Chang et al. Multiplexed immunohistochemistry image analysis using sparse coding
CN115797926A (zh) 质谱成像图的空间区域分型方法、装置及电子设备
CN113380318B (zh) 人工智能辅助流式细胞术40cd免疫表型检测方法及系统
CN114858958A (zh) 质谱数据在质量评估中的分析方法、装置和存储介质
Schüffler et al. Computational TMA analysis and cell nucleus classification of renal cell carcinoma
CN103776751B (zh) 用于粒子检测仪中散点图的粒子分类方法
Cruz et al. Pantry Monitoring at Various Light Conditions Using Object Detection Algorithm
CN112557285B (zh) 一种流式细胞检测数据自动设门方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20150218

WD01 Invention patent application deemed withdrawn after publication