CN111257558A - 基于机器学习的慢性淋巴细胞白血病肿瘤细胞识别方法 - Google Patents

基于机器学习的慢性淋巴细胞白血病肿瘤细胞识别方法 Download PDF

Info

Publication number
CN111257558A
CN111257558A CN202010057646.9A CN202010057646A CN111257558A CN 111257558 A CN111257558 A CN 111257558A CN 202010057646 A CN202010057646 A CN 202010057646A CN 111257558 A CN111257558 A CN 111257558A
Authority
CN
China
Prior art keywords
lymphocytic leukemia
chronic lymphocytic
cells
fluorescence intensity
neural network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010057646.9A
Other languages
English (en)
Other versions
CN111257558B (zh
Inventor
吴雨洁
朱毅
刘露
陈梓灵
王琰
陈肖
赵四书
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Huayue Precision Diagnostic Technology Co ltd
Original Assignee
Jiangsu Province Hospital First Affiliated Hospital With Nanjing Medical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Province Hospital First Affiliated Hospital With Nanjing Medical University filed Critical Jiangsu Province Hospital First Affiliated Hospital With Nanjing Medical University
Priority to CN202010057646.9A priority Critical patent/CN111257558B/zh
Publication of CN111257558A publication Critical patent/CN111257558A/zh
Application granted granted Critical
Publication of CN111257558B publication Critical patent/CN111257558B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/569Immunoassay; Biospecific binding assay; Materials therefor for microorganisms, e.g. protozoa, bacteria, viruses
    • G01N33/56966Animal cells
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • Theoretical Computer Science (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Immunology (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Urology & Nephrology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Cell Biology (AREA)
  • Chemical & Material Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Hematology (AREA)
  • Artificial Intelligence (AREA)
  • Biotechnology (AREA)
  • Virology (AREA)
  • Microbiology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Zoology (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Pathology (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明公开了一种基于机器学习的慢性淋巴细胞白血病肿瘤细胞识别方法,包括如下步骤:(1)检测与慢性淋巴细胞白血病有关的抗原,计算抗原的荧光强度的置信区间界;(2)构建神经网络模型,其中模型输入为置信区间界,模型输出为是否属于慢性淋巴细胞白血病的期望输出;(3)利用采集到的慢性淋巴细胞白血病患者和非慢性淋巴细胞白血病患者的细胞荧光强度数据,对神经网络模型进行训练;(4)对于需要诊断的新患者,采集他的细胞荧光强度数据,利用神经网络模型给出参考识别结果。本发明借助于机器学习和大量历史数据,能够辅助临床医师准确识别是否属于慢性淋巴细胞白血病肿瘤细胞,从而提高临床诊断的效率和质量。

Description

基于机器学习的慢性淋巴细胞白血病肿瘤细胞识别方法
技术领域
本发明涉及一种肿瘤细胞辅助识别方法,尤其涉及一种基于机器学习的慢性淋巴细胞白血病肿瘤细胞识别方法,属于医学检验技术领域。
背景技术
慢性淋巴细胞白血病(chronic lymphocytic leukemia,简称为CLL)是发生在中老年人群的一种造血系统恶性肿瘤,其最主要的特征是在外周血或骨髓中可以检测到具有特定免疫表型特征的恶性成熟B淋巴细胞。在医学临床上,可以利用流式细胞术检测CD19+肿瘤细胞上的多个抗原,通过人为分析这些抗原的表达特征并进行判断是否是CLL肿瘤细胞。
典型的CLL肿瘤细胞免疫表型是:CD19+、CD5+、CD23+、CD200+、CD43+、CD10-、FMC7-;表面免疫球蛋白轻链(kappa/lambda)、CD20及CD79b弱表达(dim)。利用流式细胞术确认B细胞的克隆性,即B细胞表面限制性表达κ或λ轻链(κ∶λ>3∶1或<0.3∶1)或>25%的B细胞sIg不表达。
由于CLL属于慢性淋巴细胞增殖性疾病,该类疾病除了CLL,还包括套细胞淋巴瘤、毛细胞白血病、边缘区淋巴瘤、滤泡细胞淋巴瘤,幼稚细胞淋巴瘤和淋巴浆细胞淋巴瘤/巨球蛋白血症等,这类疾病的肿瘤细胞免疫表型存在很多相交表达特征导致识别异常困难,而且CLL本身也有部分表现出非典型的免疫表型特征。因此,要确定该类细胞是否是CLL肿瘤细胞,即使是一个经多年训练的专业医师也存在10%以上的识别错误或者识别不确定性。
在公布号为WO2017/073737的PCT申请中,东京大学提出了一种流式细胞仪,基于来自观测对象的光、电磁波等的信号进行分析而不进行图像化,通过机器学习优化光源系统或者检测系统之外,还利用机器学习对观测对象的分析、判别方法进行优化,从而能够快速且高精度地分析以及判别观测对象。通过将单细胞流式细胞术的各要点委托给机器学习,能够智能地测量,智能地分析、判别细胞信息的大数据。实现不受人类智慧偏见束缚的细胞分类法、不拍摄细胞“图像”的高速的细胞空间信息拍摄、分析法、根据对象自动优化的光拍摄法。
另外,在公布号为WO2017/195772的PCT申请中,日本住友电气公司提出了一种肿瘤细胞检测方法,其具有以下分析步骤:基于通过对肿瘤细胞和血液中的其它细胞进行测定而得到的多个分光光谱,计算出用于通过统计方法、机器学习或模式识别来判定是否为肿瘤细胞的边界条件,并基于通过对所述细胞进行测定而得到的分光光谱和所述边界条件来判定所述细胞是否为肿瘤细胞。
发明内容
本发明所要解决的技术问题在于提供一种基于机器学习的慢性淋巴细胞白血病肿瘤细胞识别方法。
为实现上述目的,本发明采用下述的技术方案:
一种基于机器学习的慢性淋巴细胞白血病肿瘤细胞识别方法,包括如下步骤:
(1)检测与慢性淋巴细胞白血病有关的抗原,计算所述抗原的荧光强度的置信区间界;
(2)构建神经网络模型,其中模型输入为所述置信区间界,模型输出为是否属于慢性淋巴细胞白血病的期望输出;
(3)利用采集到的慢性淋巴细胞白血病患者和非慢性淋巴细胞白血病患者的细胞荧光强度数据,对所述神经网络模型进行训练;
(4)对于需要诊断的新患者,采集他的细胞荧光强度数据,利用所述神经网络模型给出参考识别结果。
其中较优地,所述步骤(1)中,将目的细胞进行免疫荧光染色,将染色后的细胞利用流式细胞仪进行检测,流式细胞仪性能参数设置,其中以淋巴细胞中的CD45阳性CD19阴性淋巴细胞为阴性对照,获取目的细胞待测抗原的阳性表达水平。
其中较优地,所述目的细胞样本为已确诊的慢性淋巴细胞白血病或其他类型小B细胞淋巴瘤患者样本,样本采集后计数细胞并调整细胞浓度为0.5~1*109细胞/1ml。
其中较优地,所述待测抗原是CD5,CD10,CD19,CD20,CD22,CD23,CD79B,CD81,CD103,CD200,FMC7,KAPPA和LAMBDA。
其中较优地,所述荧光强度的数据分布为对数正态分布。
其中较优地,所述步骤(1)中,采用公式(1)和(2)计算荧光强度的置信区间界:
1σ下界:
Figure BDA0002373355990000031
1σ上界:μ×σ#(2)
其中,
Figure BDA0002373355990000032
Figure BDA0002373355990000033
m,v分别为对数正态分布的均值与方差。
其中较优地,所述步骤(1)中,通过CD45/SSC双参数设门限取淋巴细胞后,采用CD19/CD45设门限取CD19+细胞分析不同抗原表达;通过内参细胞验证各种抗体的组合,并确定阴性淋巴细胞的位置。
其中较优地,通过如下步骤验证各种抗体的组合,并确定阴性淋巴细胞的位置:
采用CD19-淋巴细胞,为T和NK细胞作为内参阴性对照,确定CD10,CD19,FMC7,CD79b,CD20,CD23,CD22这7个通道的阴性表达位置;采用CD19-CD5-淋巴细胞为NK细胞的内参阴性对照,验证ECD通道的阴性表达位置。
其中较优地,所述步骤(2)中,所述神经网络模型为三层,其中各个荧光强度数据首先在第一隐层中进行计算,然后输入第二隐层中进行进一步计算,最后经过Sigmoid激活函数计算后,输出参考识别结果。
其中较优地,所述步骤(3)中,所述训练的步骤如下:
(31)借助流式细胞仪,采集足够数量的两类患者的细胞荧光强度数据;
(32)利用细胞荧光强度数据的均值与方差计算置信区间界;
(33)将所述置信区间界作为模型输入,将病例是否属于慢性淋巴细胞白血病作为期望输出,训练所述神经网络模型。
其中较优地,所述步骤(4)包括如下子步骤:
(41)采集新患者的细胞荧光强度数据;
(42)计算各种荧光强度的均值与方差,计算置信区间界;
(43)将每种荧光强度的置信区间界输入训练好的神经网络模型中,得到参考识别结果。
与现有技术相比较,本发明利用流式细胞仪采集到的两类患者(慢性淋巴细胞白血病患者和非慢性淋巴细胞白血病患者)的荧光强度数据,训练得到神经网络模型。在神经网络模型训练完成之后,每当有需要诊断的患者,可以相应地采集其细胞的荧光强度数据,然后利用该神经网络模型即可给出参考识别结果,用于辅助临床医师进行判断。本发明采用神经网络模型实现,尽可能地避免引入过多的先验知识,并减少对特征工程的依赖。实验结果表明,本发明实现的分类精度可以达到95%以上,显著优于现有技术。
附图说明
图1为B细胞慢性淋巴增殖性疾病的免疫表型和细胞/分子/遗传学鉴别诊断流程图;其中,英文缩写含义如下:CLL:慢性淋巴细胞白血病,MCL:套细胞淋巴瘤,FL:滤泡淋巴瘤,HCL:毛细胞白血病,HCL-V:毛细胞白血病-变异型,WM:华氏巨球蛋白血症,MZL:边缘区淋巴瘤;
图2为平均荧光强度(MFI)的分级示意图;
图3为一例CLL流式细胞术所获得的荧光强度表达示意图;
图4为某病例的部分细胞荧光强度分布直方图;
图5为本发明所采用的神经网络模型的架构示意图。
具体实施方式
下面结合附图和具体实施例对本发明的技术内容做进一步的详细说明。
本发明提供了一种借助机器学习来辅助医师识别慢性淋巴细胞白血病(简称为CLL)的方法,主要包括检测与CLL有关的抗原、构建神经网络模型、对该神经网络模型进行训练、利用神经网络模型辅助识别四个步骤。下面分别进行具体的阐述:
典型的CLL肿瘤细胞识别流程如图1所示,主要检测的抗原是CD5,CD10,CD19,CD20,CD22,CD23,CD79B,CD81,CD103,CD200,FMC7,KAPPA和LAMBDA,共13个。根据它们的免疫表型,即阴性/弱/中度/强表达,可以帮助确定患者是否属于慢性淋巴细胞白血病,而免疫表型主要根据荧光强度判断,例如荧光强度大多分布在[10-1,100),则认为是阴性,因此荧光强度的分布区间对判断是否属于慢性淋巴细胞白血病十分关键。
在本发明的一个实施例中,将不同类型的成熟小B细胞淋巴瘤细胞(即目的细胞)进行免疫荧光染色,然后将染色后的细胞上流式细胞仪进行检测分析、进行数据计算和分析,其中在设定流式细胞仪的性能参数时,设定淋巴细胞中的T/NK淋巴细胞(CD45阳性CD19阴性淋巴细胞)为阴性对照,获取目的细胞待测抗原的阳性表达水平,即平均荧光强度(MFI)。
下面通过实施例详细说明如何检测CLL或其他类型小B细胞淋巴瘤的各种抗原的阳性表达水平。
1.样本制备:取已明确诊断的初诊CLL或其他类型淋巴瘤患者外周血或者骨髓样本2ml,计数细胞,调整细胞浓度为0.5~1*109细胞/1ml。
上述目的细胞可以根据实际情况中样本的不同而选择不同的现有技术进行制备,样本可以是骨髓、外周血或淋巴结等。在本发明的实施例中,检测成熟小B细胞淋巴瘤包括典型或非典型的CLL、套细胞淋巴瘤(MCL)、滤泡细胞淋巴瘤(FL)、幼淋巴细胞白血病(B-PLL)、毛细胞白血病(HCL)、变异型毛细胞白血病(HCL-v),边缘区淋巴瘤(MZL),不能分离B细胞淋巴瘤(BLPD-U)在内的多种临床鉴别存在难度的成熟小B细胞淋巴瘤。
2.细胞的免疫荧光染色和数据采集。
2.1每管加全血或骨髓100μl,共三管,分别加入对应的抗体各20μl后,旋涡混匀,室温避光反应30分钟。
第一管:加入FMC7-FITC/CD10-PE/CD5ECD/CD79b-PC5.5/CD20-PC7/CD23-APC/CD19-APCA750/CD22-PB/CD45KO;
选择目的:在十色流式细胞仪上,抗体组合采用最为合理且能最大程度地获取B淋巴瘤细胞的两两相关数据,逐步排除其他类型淋巴瘤。
首先通过CD45/SSC双参数设门限取淋巴细胞后,进一步采用CD19/CD45设门限取CD19+细胞分析不同抗原表达;通过内参细胞进一步验证九种抗体的组合,并确定阴性淋巴细胞均位于第一个log级位置(0~log100)。
采用CD19-非B细胞作为内部阴性对照,因为T和NK细胞不表达CD10,CD19,FMC7,CD79b,CD20,CD23,CD22;CD19-CD5-淋巴细胞为NK细胞,作为ECD通道的内部阴性对照,这是因为NK细胞不表达这两个标记。
明确了阴性淋巴细胞位置后,该管组合可以进一步分析CD19+肿瘤细胞的CD5表达确定是否是CD5+小B细胞淋巴瘤(包括CLL和MCL,基本排除FL、MZL、HCL、HCL-V、LPL/WM、PLL);进一步分析CD19+肿瘤细胞CD20、CD22、CD79b的表达水平(CLL为弱表达,肿瘤细胞位于100~101),以及是否表达FMC7,CD23可以排除MCL(MCL为FMC7+CD23-;CLL为FMC7-CD23+),随后通过CD19+肿瘤细胞是否表达CD10排除是滤泡细胞淋巴瘤(FL为CD10+,位置超过100,CLL位于0~100)。
第二管:加入kappa-FITC/lambda-PE/CD38-ECD/CD25-PC5.5/CD11C-PC7/CD103-APC/CD19-APCA750/IgM-PB/CD45-KO;
选择目的:采用CD45/SSC双参数设门限取淋巴细胞后,进一步采用CD19/SSC设门限取CD19+细胞分析不同抗原表达。
由于第二管和第一管选择参数一致,所以使用的仪器电压和补偿参数可以直接运用于第二管。
Kappa/lambda为单克隆性表达,即只表达其中一个抗原或者都不表达(正常或者反应性B细胞增多者表达为双克隆,即kappa和lambda均有表达);CD103、CD11C和CD25阴性,即可排除HCL/HCL-V(这两种淋巴瘤为阳性表达,位置均超过100);CD38阴性基本排除淋巴浆细胞淋巴瘤/巨球蛋白血症(这两种淋巴瘤为阳性表达,位置均超过100),如果阳性表达也是CLL的预后不良指标。
第三管:加入CD81-FITC/CD19PerCP/CD200-APC/CD45-KO
选择目的:进一步确认为CLL细胞,并排除MCL。
采用CD45/SSC双参数设门限取淋巴细胞后,进一步采用CD19/SSC设门限取CD19+细胞分析CD81和CD200表达;典型CLL为CD200强表达,CD81不表达(即CD81位于0~100,CD200位于102~103),而最容易混淆的MCL为CD200阴性,CD81阳性(即CD200位于0~100,CD81位于100~103)。
2.2加入溶血剂2ml,避光10分钟,离心去上清。
2.3PBS洗2次,1000转/每分,离心去上清。
2.4加入500uLPBS,上流式细胞仪收获细胞。
2.5采样后CD45/SSC设门限取淋巴细胞,进而CD19/SSC设门限取CD19+细胞。
2.6采样后,分析CD19+CD45+肿瘤细胞中各个抗原的表达,保存平均荧光强度(MFI)等相关统计学数据。
3.判断标准:平均荧光强度在流式细胞仪分为4个log级,如图2所示。其中,0~100为阴性;100~101为弱阳性;101~102为中等阳性;103~104为强阳性。
阴性对照:通过内参细胞进一步验证不同抗体组合,并确定阴性淋巴细胞是否位于第一个log级位置(0~100)。
在处理第一管时,每一个通道均采用内参细胞确定和验证阴性抗原表达位于第一个log级位置(0~100)。具体步骤如下:采用CD19-淋巴细胞,为T和NK细胞作为内参阴性对照,因为T和NK细胞不表达CD10,CD19,FMC7,CD79b,CD20,CD23,CD22,可确定这7个通道的阴性表达位置;采用CD19-CD5-淋巴细胞为NK细胞的内参阴性对照,验证ECD通道的阴性表达位置是否位于0~100
图3显示了一例CLL流式细胞术所获得的荧光强度表达示意。其中,CD19+CD45+/SSC低的为成熟B淋巴细胞,表达特点如下:
表达:CD19,CD5,CD23;
弱表达:CD20,CD22,CD79b;
强表达:CD200;
不表达:FMC7,CD103,CD10,CD81,kappa,lambda
图4显示了某个病例的部分荧光强度的分布直方图。发明人经过研究后发现:实际采集的细胞的荧光强度数据分布可以认为符合对数正态分布。在上述认识的基础上,本发明的实施例中采用公式(1)和(2)计算荧光强度的置信区间界。经过实验证实,取1σ区间最准确。
1σ下界:
Figure BDA0002373355990000071
1σ上界:μ×σ#(2)
其中,
Figure BDA0002373355990000081
Figure BDA0002373355990000082
m,v分别为对数正态分布的均值与方差。
在完成上述数据处理步骤之后,开始构建辅助医师识别慢性淋巴细胞白血病的神经网络模型。在本发明的实施例中,采用图5所示的三层神经网络作为参考识别结果的模型,其中的模型输入为图1中所示的各个抗原的荧光强度的置信区间界,各个荧光强度数据首先在第一隐层中进行计算,然后输入第二隐层中进行进一步计算,最后经过Sigmoid激活函数计算后,输出参考识别结果。在每个隐层中,包括多个作为隐层神经元的ReLU(Rectified Linear Unit)函数。
在本发明的一个实施例中,假设该神经网络模型的输入为
Figure BDA0002373355990000083
则相应的计算公式如下:
Figure BDA0002373355990000084
Z2=f(W2Z1+b2)
Z1=f(W1x+b1)
最终得到一个表示概率的实数值作为参考识别结果
Figure BDA0002373355990000085
在上述公式中,
Figure BDA0002373355990000086
为模型参数。相应的计算公式分别如下:
f(x)=max(0,x)
Figure BDA0002373355990000087
其中,函数f(·)为激活函数(即隐层神经元),在本发明实施例中为ReLU(Rectified Linear Unit)函数,σ(·)为Sigmoid激活函数。在实际构建时,输入维度n可以为26,第一隐层的隐层神经元个数o1可以取5,第二隐层的隐层神经元个数o2可以取10。需要说明的是,o1,o2甚至隐层数可根据经验或交叉验证结果灵活调节。
在利用该神经网络模型辅助识别之前,必须先进行模型训练。对于神经网络模型,一般采用基于随机梯度下降的算法训练,这些训练方法在常见的深度学习库(例如Tensorflow,Pytorch等)中几乎都有提供,仅需要提供输入及期望输出。在本发明的一个实施例中,优选采用Adam算法。它不过多地依赖人为设定的超参数,如学习率等。
在本发明中,模型训练过程即为确定上述公式中的这些模型参数的过程,具体的训练步骤如下:
(1)借助流式细胞仪,采集足够数量的两类患者的细胞荧光强度数据。对每名患者主要检测CD5,CD10,CD19,CD20,CD22,CD23,CD79B,CD81,CD103,CD200,FMC7,KAPPA和LAMBDA等抗原,因为这些抗原是判断该病例是否属于慢性淋巴细胞白血病的关键因素。
(2)如前文所述,细胞的荧光强度数据都近似认为符合对数正态分布,因此利用荧光强度数据的均值与方差可以计算置信区间界,即大致的分布范围。本发明实施例中的置信区间界均取1σ下界到1σ上界,计算公式分别由公式(1)和(2)给出。
(3)将步骤(2)中,各荧光强度的置信区间界作为模型输入。将该病例是否属于慢性淋巴细胞白血病作为期望输出,即可训练神经网络模型。
在本发明的一个实施例中,根据长期的临床积累,目前共有370个慢性淋巴细胞白血病病例数据以及380个非慢性淋巴细胞白血病病例数据,因此共有750个病例。针对这些病例,分别采集相关的荧光强度数据及其统计指标,包括均值、方差等。利用公式(1)和(2),对750个病例,计算每种荧光强度的置信区间界。利用步骤(2)得到的置信区间界(输入)以及是否属于慢性淋巴细胞白血病(期望输出)训练神经网络模型。一旦模型训练完成,即可用于辅助识别。
接下来,介绍利用训练好的神经网络模型辅助识别慢性淋巴细胞白血病肿瘤细胞的具体步骤:
(1)采集新患者的细胞荧光强度数据,采集的方法与训练步骤(1)中的相同。
(2)计算各种荧光强度的均值与方差,根据公式(1)和(2)计算其置信区间界。
(3)将每种荧光强度的置信区间上下界输入到训练好的神经网络模型中,即可得到一个参考识别结果。
在本发明的一个实施例中,对于新的病例,需要采集细胞荧光强度数据,然后计算荧光强度的均值、方差。假设某病例的各种荧光强度均值与方差如表1所示:
表1某病例的各种荧光强度均值与方差
Figure BDA0002373355990000101
则可计算其在对数正态分布下的置信区间界,如表2所示:
表2某病例的荧光强度的置信区间界
Figure BDA0002373355990000102
将上述置信区间表中的上下界,组合为26维输入向量,把该向量输入到训练好的神经网络模型中,可以得到一个实数输出p∈[0,1]。若p<0.5,表示该病例不属于慢性淋巴细胞白血病肿瘤细胞,否则属于。这个输出可以作为医师诊断的参考识别结果。
与现有技术相比较,本发明利用流式细胞仪采集到的两类患者(慢性淋巴细胞白血病患者和非慢性淋巴细胞白血病患者)的细胞荧光强度数据,训练得到神经网络模型。在模型训练完成之后,每当有需要诊断的患者,可以相应地采集其细胞的荧光强度数据,然后利用该神经网络模型即可给出参考识别结果。实验结果表明,本发明借助于机器学习和大量历史数据,实现的分类精度可以达到95%以上,能够辅助临床医师准确识别是否属于慢性淋巴细胞白血病肿瘤细胞,从而节省了人力物力,并且可以提高临床诊断的效率和质量。
上面对本发明所提供的基于机器学习的慢性淋巴细胞白血病肿瘤细胞识别方法进行了详细的说明。对本领域的一般技术人员而言,在不背离本发明实质内容的前提下对它所做的任何显而易见的改动,都将构成对本发明专利权的侵犯,将承担相应的法律责任。

Claims (10)

1.一种基于机器学习的慢性淋巴细胞白血病肿瘤细胞识别方法,其特征在于包括如下步骤:
(1)检测与慢性淋巴细胞白血病有关的抗原,计算所述抗原的荧光强度的置信区间界;
(2)构建神经网络模型,其中模型输入为所述置信区间界,模型输出为是否属于慢性淋巴细胞白血病的期望输出;
(3)利用采集到的慢性淋巴细胞白血病患者和非慢性淋巴细胞白血病患者的细胞荧光强度数据,对所述神经网络模型进行训练;
(4)对于需要诊断的新患者,采集他的细胞荧光强度数据,利用所述神经网络模型给出参考识别结果。
2.如权利要求1所述的慢性淋巴细胞白血病肿瘤细胞识别方法,其特征在于:
所述步骤(1)中,将目的细胞进行免疫荧光染色,将染色后的细胞利用流式细胞仪进行检测,流式细胞仪性能参数设置,其中以淋巴细胞中的CD45阳性CD19阴性淋巴细胞为阴性对照,获取目的细胞待测抗原的阳性表达水平。
3.如权利要求2所述的慢性淋巴细胞白血病肿瘤细胞识别方法,其特征在于:
所述目的细胞样本为已确诊的慢性淋巴细胞白血病或其他类型小B细胞淋巴瘤患者样本,样本采集后计数细胞并调整细胞浓度为0.5~1*109细胞/1ml。
4.如权利要求3所述的慢性淋巴细胞白血病肿瘤细胞识别方法,其特征在于:
所述待测抗原是CD5,CD10,CD19,CD20,CD22,CD23,CD79B,CD81,CD103,CD200,FMC7,KAPPA和LAMBDA。
5.如权利要求4所述的慢性淋巴细胞白血病肿瘤细胞识别方法,其特征在于:
所述荧光强度的数据分布为对数正态分布。
6.如权利要求5所述的慢性淋巴细胞白血病肿瘤细胞识别方法,其特征在于:
所述步骤(1)中,采用公式(1)和(2)计算荧光强度的置信区间界:
1σ下界:
Figure FDA0002373355980000021
1σ上界:μ×σ#(2)
其中,
Figure FDA0002373355980000022
Figure FDA0002373355980000023
m,v分别为对数正态分布的均值与方差。
7.如权利要求1所述的慢性淋巴细胞白血病肿瘤细胞识别方法,其特征在于:
所述步骤(1)中,通过CD45/SSC双参数设门限取淋巴细胞后,采用CD19/CD45设门限取CD19+细胞分析不同抗原表达;通过内参细胞验证各种抗体的组合,并确定阴性淋巴细胞的位置。
8.如权利要求7所述的慢性淋巴细胞白血病肿瘤细胞识别方法,其特征在于通过如下步骤验证各种抗体的组合,并确定阴性淋巴细胞的位置:
采用CD19-淋巴细胞,为T和NK细胞作为内参阴性对照,确定CD10,CD19,FMC7,CD79b,CD20,CD23,CD22这7个通道的阴性表达位置;采用CD19-CD5-淋巴细胞为NK细胞的内参阴性对照,验证ECD通道的阴性表达位置。
9.如权利要求1所述的慢性淋巴细胞白血病肿瘤细胞识别方法,其特征在于:
所述步骤(3)中,所述训练的步骤如下:
(31)借助流式细胞仪,采集足够数量的两类患者的细胞荧光强度数据;
(32)利用细胞荧光强度数据的均值与方差计算置信区间界;
(33)将所述置信区间界作为模型输入,将病例是否属于慢性淋巴细胞白血病作为期望输出,训练所述神经网络模型。
10.如权利要求1所述的慢性淋巴细胞白血病肿瘤细胞识别方法,其特征在于所述步骤(4)包括如下子步骤:
(41)采集新患者的细胞荧光强度数据;
(42)计算各种荧光强度的均值与方差,计算置信区间界;
(43)将每种荧光强度的置信区间界输入训练好的神经网络模型中,得到参考识别结果。
CN202010057646.9A 2020-01-19 2020-01-19 基于机器学习的慢性淋巴细胞白血病肿瘤细胞识别方法 Active CN111257558B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010057646.9A CN111257558B (zh) 2020-01-19 2020-01-19 基于机器学习的慢性淋巴细胞白血病肿瘤细胞识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010057646.9A CN111257558B (zh) 2020-01-19 2020-01-19 基于机器学习的慢性淋巴细胞白血病肿瘤细胞识别方法

Publications (2)

Publication Number Publication Date
CN111257558A true CN111257558A (zh) 2020-06-09
CN111257558B CN111257558B (zh) 2021-08-24

Family

ID=70947113

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010057646.9A Active CN111257558B (zh) 2020-01-19 2020-01-19 基于机器学习的慢性淋巴细胞白血病肿瘤细胞识别方法

Country Status (1)

Country Link
CN (1) CN111257558B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113205872A (zh) * 2021-04-29 2021-08-03 安徽医科大学第一附属医院 一种血液病智能诊疗辅助系统
CN114018789A (zh) * 2021-10-08 2022-02-08 武汉大学 基于成像流式细胞检测和机器学习的急性白血病分型方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101678101A (zh) * 2006-12-26 2010-03-24 分子免疫中心 可用于诊断和治疗b细胞慢性淋巴细胞白血病的能够在肿瘤细胞中诱导凋亡的药物组合物
CN102901693A (zh) * 2011-07-25 2013-01-30 索尼公司 信息处理装置和方法、程序和校正荧光光谱的强度的方法
CN106471373A (zh) * 2014-06-27 2017-03-01 约瑟卡雷拉斯白血球过多症研究所 用于治疗、诊断和预后血液系统恶性肿瘤的方法
CN106596489A (zh) * 2016-12-19 2017-04-26 中国科学院苏州生物医学工程技术研究所 用于荧光液滴检测中荧光强度数据的处理方法
WO2017073737A1 (ja) * 2015-10-28 2017-05-04 国立大学法人東京大学 分析装置
JP2017203637A (ja) * 2016-05-09 2017-11-16 住友電気工業株式会社 腫瘍細胞検出方法及び腫瘍細胞検出装置
CN109036571A (zh) * 2014-12-08 2018-12-18 20/20基因系统股份有限公司 用于预测患有癌症的可能性或风险的方法和机器学习系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101678101A (zh) * 2006-12-26 2010-03-24 分子免疫中心 可用于诊断和治疗b细胞慢性淋巴细胞白血病的能够在肿瘤细胞中诱导凋亡的药物组合物
CN102901693A (zh) * 2011-07-25 2013-01-30 索尼公司 信息处理装置和方法、程序和校正荧光光谱的强度的方法
CN106471373A (zh) * 2014-06-27 2017-03-01 约瑟卡雷拉斯白血球过多症研究所 用于治疗、诊断和预后血液系统恶性肿瘤的方法
CN109036571A (zh) * 2014-12-08 2018-12-18 20/20基因系统股份有限公司 用于预测患有癌症的可能性或风险的方法和机器学习系统
WO2017073737A1 (ja) * 2015-10-28 2017-05-04 国立大学法人東京大学 分析装置
JP2017203637A (ja) * 2016-05-09 2017-11-16 住友電気工業株式会社 腫瘍細胞検出方法及び腫瘍細胞検出装置
CN106596489A (zh) * 2016-12-19 2017-04-26 中国科学院苏州生物医学工程技术研究所 用于荧光液滴检测中荧光强度数据的处理方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
LEI FAN ET AL: "Expression patterns of CD200 and CD148 in leukemic B-cell chronic lymphoproliferative disorders and their potential value in differential diagnosis", 《INFORMA HEALTHCARE》 *
YU-JIE WU ET AL: "Using the geometric mean fluorescence intensity index method to measure ZAP-70 expression in patients with chronic lymphocytic leukemia", 《ONCOTARGETS AND THERAPY》 *
赵四书等: "CD11c 在慢性淋巴细胞白血病诊断中的意义", 《中国生物工程杂志》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113205872A (zh) * 2021-04-29 2021-08-03 安徽医科大学第一附属医院 一种血液病智能诊疗辅助系统
CN114018789A (zh) * 2021-10-08 2022-02-08 武汉大学 基于成像流式细胞检测和机器学习的急性白血病分型方法

Also Published As

Publication number Publication date
CN111257558B (zh) 2021-08-24

Similar Documents

Publication Publication Date Title
US20180106787A1 (en) System, method, and article for detecting abnormal cells using multi-dimensional analysis
US8682810B2 (en) Method and system for analysis of flow cytometry data using support vector machines
US20240044904A1 (en) System, method, and article for detecting abnormal cells using multi-dimensional analysis
US8391575B2 (en) Automatic image analysis and quantification for fluorescence in situ hybridization
US20160169786A1 (en) Automated flow cytometry analysis method and system
de Tute Flow cytometry and its use in the diagnosis and management of mature lymphoid malignancies
CN111257558B (zh) 基于机器学习的慢性淋巴细胞白血病肿瘤细胞识别方法
US20140235487A1 (en) Oral cancer risk scoring
CN110168561A (zh) 用于确定一个或多个组织样本中的细胞组成信息的装置
Falay et al. Which markers should the used for diagnostic chronic lymphocytic leukemia immunophenotyping scoring system by flow cytometry
CN112912923A (zh) 基于距离的组织状态确定
Camburn et al. Myeloblasts in normal bone marrows expressing leukaemia-associated immunophenotypes
CN113539473A (zh) 一种仅使用血常规检验数据诊断布氏杆菌病的方法及系统
Valet et al. Automated classification of patients with chronic lymphocytic leukemia and immunocytoma from flow cytometric three‐color immunophenotypes
CN112424582A (zh) 血液样本检测的方法、血液样本检测仪和存储介质
Nakayama et al. An approach for diagnosing plasma cell myeloma by three-color flow cytometry based on kappa/lambda ratios of CD38-gated CD138+ cells
Santamaria-Pang et al. Robust single cell quantification of immune cell subtypes in histological samples
US20190369099A1 (en) Systems and Methods of Oral Cancer Assessment Using Cellular Phenotype Data
JP4768706B2 (ja) 流体血球計算測定を使用する最小疾患レベルを監視するのに使用される腫瘍性細胞中の異常表現型の多次元検出方法
CN114219752B (zh) 一种针对血清蛋白电泳的异常区域检测方法
RU2803281C1 (ru) Способ диагностики онкологического заболевания крови
CN114317711A (zh) 非酒精性脂肪肝的预测方法及装置
Lo et al. A multiparameter assay for HER2 protein detection on circulating tumor cells in non-small cell lung cancer
CN111351942A (zh) 肺癌肿瘤标志物筛选系统及肺癌风险分析系统
Zyeva et al. IMMUNOLOGICAL DIAGNOSIS OF MYELODYSPLASTIC SYNDROME BY FLOW CYTOMETRY. SCREENING

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20230103

Address after: 221000 2F, Building A4, Huaihai Biomedical Industrial Park, No. 10, Zhujiang East Road, Xuzhou Hi tech Industrial Development Zone, Jiangsu Province

Patentee after: Jiangsu Huayue Precision Diagnostic Technology Co.,Ltd.

Address before: 210029 No. 300, Guangzhou Road, Nanjing, Jiangsu

Patentee before: JIANGSU PROVINCE HOSPITAL (THE FIRST HOSPITAL WITH NANJING MEDICAL

TR01 Transfer of patent right