CN111257558B - 基于机器学习的慢性淋巴细胞白血病肿瘤细胞识别方法 - Google Patents
基于机器学习的慢性淋巴细胞白血病肿瘤细胞识别方法 Download PDFInfo
- Publication number
- CN111257558B CN111257558B CN202010057646.9A CN202010057646A CN111257558B CN 111257558 B CN111257558 B CN 111257558B CN 202010057646 A CN202010057646 A CN 202010057646A CN 111257558 B CN111257558 B CN 111257558B
- Authority
- CN
- China
- Prior art keywords
- lymphocytic leukemia
- chronic lymphocytic
- cells
- fluorescence intensity
- neural network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 208000010839 B-cell chronic lymphocytic leukemia Diseases 0.000 title claims abstract description 71
- 208000031422 Lymphocytic Chronic B-Cell Leukemia Diseases 0.000 title claims abstract description 70
- 208000032852 chronic lymphocytic leukemia Diseases 0.000 title claims abstract description 70
- 210000004881 tumor cell Anatomy 0.000 title claims abstract description 36
- 238000010801 machine learning Methods 0.000 title claims abstract description 15
- 238000000034 method Methods 0.000 title abstract description 24
- 210000004027 cell Anatomy 0.000 claims abstract description 66
- 238000003062 neural network model Methods 0.000 claims abstract description 33
- 239000000427 antigen Substances 0.000 claims abstract description 25
- 102000036639 antigens Human genes 0.000 claims abstract description 25
- 108091007433 antigens Proteins 0.000 claims abstract description 25
- 238000012549 training Methods 0.000 claims abstract description 20
- 102100024222 B-lymphocyte antigen CD19 Human genes 0.000 claims description 31
- 101000980825 Homo sapiens B-lymphocyte antigen CD19 Proteins 0.000 claims description 31
- 210000004698 lymphocyte Anatomy 0.000 claims description 24
- 102100022005 B-lymphocyte antigen CD20 Human genes 0.000 claims description 21
- 101000897405 Homo sapiens B-lymphocyte antigen CD20 Proteins 0.000 claims description 21
- 101000738771 Homo sapiens Receptor-type tyrosine-protein phosphatase C Proteins 0.000 claims description 15
- 102100037422 Receptor-type tyrosine-protein phosphatase C Human genes 0.000 claims description 15
- 239000013642 negative control Substances 0.000 claims description 12
- 102000003729 Neprilysin Human genes 0.000 claims description 11
- 108090000028 Neprilysin Proteins 0.000 claims description 11
- 101000878605 Homo sapiens Low affinity immunoglobulin epsilon Fc receptor Proteins 0.000 claims description 10
- 102100038007 Low affinity immunoglobulin epsilon Fc receptor Human genes 0.000 claims description 10
- 210000000822 natural killer cell Anatomy 0.000 claims description 10
- 102100027221 CD81 antigen Human genes 0.000 claims description 9
- 101000914479 Homo sapiens CD81 antigen Proteins 0.000 claims description 9
- 101001098352 Homo sapiens OX-2 membrane glycoprotein Proteins 0.000 claims description 9
- 102100037589 OX-2 membrane glycoprotein Human genes 0.000 claims description 9
- 208000003950 B-cell lymphoma Diseases 0.000 claims description 8
- 102100038080 B-cell receptor CD22 Human genes 0.000 claims description 8
- 101000884305 Homo sapiens B-cell receptor CD22 Proteins 0.000 claims description 8
- 101000934341 Homo sapiens T-cell surface glycoprotein CD5 Proteins 0.000 claims description 8
- 102100025244 T-cell surface glycoprotein CD5 Human genes 0.000 claims description 8
- 238000001514 detection method Methods 0.000 claims description 8
- 101001046687 Homo sapiens Integrin alpha-E Proteins 0.000 claims description 6
- 102100022341 Integrin alpha-E Human genes 0.000 claims description 6
- 102100027203 B-cell antigen receptor complex-associated protein beta chain Human genes 0.000 claims description 5
- 101000914491 Homo sapiens B-cell antigen receptor complex-associated protein beta chain Proteins 0.000 claims description 5
- 210000001744 T-lymphocyte Anatomy 0.000 claims description 5
- 239000000523 sample Substances 0.000 claims description 5
- 238000003125 immunofluorescent labeling Methods 0.000 claims description 4
- -1 CD79b Proteins 0.000 claims description 3
- 239000013610 patient sample Substances 0.000 claims description 2
- 230000005859 cell recognition Effects 0.000 claims 3
- 238000003745 diagnosis Methods 0.000 abstract description 6
- 238000003759 clinical diagnosis Methods 0.000 abstract description 2
- 208000025205 Mantle-Cell Lymphoma Diseases 0.000 description 10
- 206010025323 Lymphomas Diseases 0.000 description 8
- 201000009277 hairy cell leukemia Diseases 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 6
- 210000003719 b-lymphocyte Anatomy 0.000 description 6
- 238000000684 flow cytometry Methods 0.000 description 6
- 201000007924 marginal zone B-cell lymphoma Diseases 0.000 description 6
- 208000021937 marginal zone lymphoma Diseases 0.000 description 6
- 208000010956 Hairy cell leukemia variant Diseases 0.000 description 5
- 201000000439 HCL-V Diseases 0.000 description 4
- 230000004913 activation Effects 0.000 description 4
- 210000001185 bone marrow Anatomy 0.000 description 4
- 210000002569 neuron Anatomy 0.000 description 4
- 208000033559 Waldenström macroglobulinemia Diseases 0.000 description 3
- 201000010099 disease Diseases 0.000 description 3
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 3
- 201000000564 macroglobulinemia Diseases 0.000 description 3
- 210000005259 peripheral blood Anatomy 0.000 description 3
- 239000011886 peripheral blood Substances 0.000 description 3
- 208000033766 Prolymphocytic Leukemia Diseases 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 230000001684 chronic effect Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000003325 follicular Effects 0.000 description 2
- 201000003444 follicular lymphoma Diseases 0.000 description 2
- 201000007919 lymphoplasmacytic lymphoma Diseases 0.000 description 2
- 210000003519 mature b lymphocyte Anatomy 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 239000006228 supernatant Substances 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 108010012919 B-Cell Antigen Receptors Proteins 0.000 description 1
- 102000019260 B-Cell Antigen Receptors Human genes 0.000 description 1
- 208000032568 B-cell prolymphocytic leukaemia Diseases 0.000 description 1
- 208000002250 Hematologic Neoplasms Diseases 0.000 description 1
- 101100341519 Homo sapiens ITGAX gene Proteins 0.000 description 1
- 101001057504 Homo sapiens Interferon-stimulated gene 20 kDa protein Proteins 0.000 description 1
- 101001055144 Homo sapiens Interleukin-2 receptor subunit alpha Proteins 0.000 description 1
- 101000608935 Homo sapiens Leukosialin Proteins 0.000 description 1
- 102100022297 Integrin alpha-X Human genes 0.000 description 1
- 102100027268 Interferon-stimulated gene 20 kDa protein Human genes 0.000 description 1
- 102100039564 Leukosialin Human genes 0.000 description 1
- 208000030289 Lymphoproliferative disease Diseases 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000003748 differential diagnosis Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- 230000009033 hematopoietic malignancy Effects 0.000 description 1
- 239000003219 hemolytic agent Substances 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 210000001165 lymph node Anatomy 0.000 description 1
- 230000003211 malignant effect Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000002558 medical inspection Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000010837 poor prognosis Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000002062 proliferating effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/53—Immunoassay; Biospecific binding assay; Materials therefor
- G01N33/569—Immunoassay; Biospecific binding assay; Materials therefor for microorganisms, e.g. protozoa, bacteria, viruses
- G01N33/56966—Animal cells
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Biomedical Technology (AREA)
- Theoretical Computer Science (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Immunology (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Urology & Nephrology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Cell Biology (AREA)
- Chemical & Material Sciences (AREA)
- Evolutionary Computation (AREA)
- Hematology (AREA)
- Artificial Intelligence (AREA)
- Biotechnology (AREA)
- Virology (AREA)
- Microbiology (AREA)
- Tropical Medicine & Parasitology (AREA)
- Zoology (AREA)
- Food Science & Technology (AREA)
- Medicinal Chemistry (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- Pathology (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本发明公开了一种基于机器学习的慢性淋巴细胞白血病肿瘤细胞识别方法,包括如下步骤:(1)检测与慢性淋巴细胞白血病有关的抗原,计算抗原的荧光强度的置信区间界;(2)构建神经网络模型,其中模型输入为置信区间界,模型输出为是否属于慢性淋巴细胞白血病的期望输出;(3)利用采集到的慢性淋巴细胞白血病患者和非慢性淋巴细胞白血病患者的细胞荧光强度数据,对神经网络模型进行训练;(4)对于需要诊断的新患者,采集他的细胞荧光强度数据,利用神经网络模型给出参考识别结果。本发明借助于机器学习和大量历史数据,能够辅助临床医师准确识别是否属于慢性淋巴细胞白血病肿瘤细胞,从而提高临床诊断的效率和质量。
Description
技术领域
本发明涉及一种肿瘤细胞辅助识别方法,尤其涉及一种基于机器学习的慢性淋巴细胞白血病肿瘤细胞识别方法,属于医学检验技术领域。
背景技术
慢性淋巴细胞白血病(chronic lymphocytic leukemia,简称为CLL)是发生在中老年人群的一种造血系统恶性肿瘤,其最主要的特征是在外周血或骨髓中可以检测到具有特定免疫表型特征的恶性成熟B淋巴细胞。在医学临床上,可以利用流式细胞术检测CD19+肿瘤细胞上的多个抗原,通过人为分析这些抗原的表达特征并进行判断是否是CLL肿瘤细胞。
典型的CLL肿瘤细胞免疫表型是:CD19+、CD5+、CD23+、CD200+、CD43+、CD10-、FMC7-;表面免疫球蛋白轻链(kappa/lambda)、CD20及CD79b弱表达(dim)。利用流式细胞术确认B细胞的克隆性,即B细胞表面限制性表达κ或λ轻链(κ∶λ>3∶1或<0.3∶1)或>25%的B细胞sIg不表达。
由于CLL属于慢性淋巴细胞增殖性疾病,该类疾病除了CLL,还包括套细胞淋巴瘤、毛细胞白血病、边缘区淋巴瘤、滤泡细胞淋巴瘤,幼稚细胞淋巴瘤和淋巴浆细胞淋巴瘤/巨球蛋白血症等,这类疾病的肿瘤细胞免疫表型存在很多相交表达特征导致识别异常困难,而且CLL本身也有部分表现出非典型的免疫表型特征。因此,要确定该类细胞是否是CLL肿瘤细胞,即使是一个经多年训练的专业医师也存在10%以上的识别错误或者识别不确定性。
在公布号为WO2017/073737的PCT申请中,东京大学提出了一种流式细胞仪,基于来自观测对象的光、电磁波等的信号进行分析而不进行图像化,通过机器学习优化光源系统或者检测系统之外,还利用机器学习对观测对象的分析、判别方法进行优化,从而能够快速且高精度地分析以及判别观测对象。通过将单细胞流式细胞术的各要点委托给机器学习,能够智能地测量,智能地分析、判别细胞信息的大数据。实现不受人类智慧偏见束缚的细胞分类法、不拍摄细胞“图像”的高速的细胞空间信息拍摄、分析法、根据对象自动优化的光拍摄法。
另外,在公布号为WO2017/195772的PCT申请中,日本住友电气公司提出了一种肿瘤细胞检测方法,其具有以下分析步骤:基于通过对肿瘤细胞和血液中的其它细胞进行测定而得到的多个分光光谱,计算出用于通过统计方法、机器学习或模式识别来判定是否为肿瘤细胞的边界条件,并基于通过对所述细胞进行测定而得到的分光光谱和所述边界条件来判定所述细胞是否为肿瘤细胞。
发明内容
本发明所要解决的技术问题在于提供一种基于机器学习的慢性淋巴细胞白血病肿瘤细胞识别方法。
为实现上述目的,本发明采用下述的技术方案:
一种基于机器学习的慢性淋巴细胞白血病肿瘤细胞识别方法,包括如下步骤:
(1)检测与慢性淋巴细胞白血病有关的抗原,计算所述抗原的荧光强度的置信区间界;
(2)构建神经网络模型,其中模型输入为所述置信区间界,模型输出为是否属于慢性淋巴细胞白血病的期望输出;
(3)利用采集到的慢性淋巴细胞白血病患者和非慢性淋巴细胞白血病患者的细胞荧光强度数据,对所述神经网络模型进行训练;
(4)对于需要诊断的新患者,采集他的细胞荧光强度数据,利用所述神经网络模型给出参考识别结果。
其中较优地,所述步骤(1)中,将目的细胞进行免疫荧光染色,将染色后的细胞利用流式细胞仪进行检测,流式细胞仪性能参数设置,其中以淋巴细胞中的CD45阳性CD19阴性淋巴细胞为阴性对照,获取目的细胞待测抗原的阳性表达水平。
其中较优地,所述目的细胞样本为已确诊的慢性淋巴细胞白血病或其他类型小B细胞淋巴瘤患者样本,样本采集后计数细胞并调整细胞浓度为0.5~1*109细胞/1ml。
其中较优地,所述待测抗原是CD5,CD10,CD19,CD20,CD22,CD23,CD79B,CD81,CD103,CD200,FMC7,KAPPA和LAMBDA。
其中较优地,所述荧光强度的数据分布为对数正态分布。
其中较优地,所述步骤(1)中,采用公式(1)和(2)计算荧光强度的置信区间界:
1σ上界:μ×σ#(2)
其中,
m,v分别为对数正态分布的均值与方差。
其中较优地,所述步骤(1)中,通过CD45/SSC双参数设门限取淋巴细胞后,采用CD19/CD45设门限取CD19+细胞分析不同抗原表达;通过内参细胞验证各种抗体的组合,并确定阴性淋巴细胞的位置。
其中较优地,通过如下步骤验证各种抗体的组合,并确定阴性淋巴细胞的位置:
采用CD19-淋巴细胞,为T和NK细胞作为内参阴性对照,确定CD10,CD19,FMC7,CD79b,CD20,CD23,CD22这7个通道的阴性表达位置;采用CD19-CD5-淋巴细胞为NK细胞的内参阴性对照,验证ECD通道的阴性表达位置。
其中较优地,所述步骤(2)中,所述神经网络模型为三层,其中各个荧光强度数据首先在第一隐层中进行计算,然后输入第二隐层中进行进一步计算,最后经过Sigmoid激活函数计算后,输出参考识别结果。
其中较优地,所述步骤(3)中,所述训练的步骤如下:
(31)借助流式细胞仪,采集足够数量的两类患者的细胞荧光强度数据;
(32)利用细胞荧光强度数据的均值与方差计算置信区间界;
(33)将所述置信区间界作为模型输入,将病例是否属于慢性淋巴细胞白血病作为期望输出,训练所述神经网络模型。
其中较优地,所述步骤(4)包括如下子步骤:
(41)采集新患者的细胞荧光强度数据;
(42)计算各种荧光强度的均值与方差,计算置信区间界;
(43)将每种荧光强度的置信区间界输入训练好的神经网络模型中,得到参考识别结果。
与现有技术相比较,本发明利用流式细胞仪采集到的两类患者(慢性淋巴细胞白血病患者和非慢性淋巴细胞白血病患者)的荧光强度数据,训练得到神经网络模型。在神经网络模型训练完成之后,每当有需要诊断的患者,可以相应地采集其细胞的荧光强度数据,然后利用该神经网络模型即可给出参考识别结果,用于辅助临床医师进行判断。本发明采用神经网络模型实现,尽可能地避免引入过多的先验知识,并减少对特征工程的依赖。实验结果表明,本发明实现的分类精度可以达到95%以上,显著优于现有技术。
附图说明
图1为B细胞慢性淋巴增殖性疾病的免疫表型和细胞/分子/遗传学鉴别诊断流程图;其中,英文缩写含义如下:CLL:慢性淋巴细胞白血病,MCL:套细胞淋巴瘤,FL:滤泡淋巴瘤,HCL:毛细胞白血病,HCL-V:毛细胞白血病-变异型,WM:华氏巨球蛋白血症,MZL:边缘区淋巴瘤;
图2为平均荧光强度(MFI)的分级示意图;
图3为一例CLL流式细胞术所获得的荧光强度表达示意图;
图4为某病例的部分细胞荧光强度分布直方图;
图5为本发明所采用的神经网络模型的架构示意图。
具体实施方式
下面结合附图和具体实施例对本发明的技术内容做进一步的详细说明。
本发明提供了一种借助机器学习来辅助医师识别慢性淋巴细胞白血病(简称为CLL)的方法,主要包括检测与CLL有关的抗原、构建神经网络模型、对该神经网络模型进行训练、利用神经网络模型辅助识别四个步骤。下面分别进行具体的阐述:
典型的CLL肿瘤细胞识别流程如图1所示,主要检测的抗原是CD5,CD10,CD19,CD20,CD22,CD23,CD79B,CD81,CD103,CD200,FMC7,KAPPA和LAMBDA,共13个。根据它们的免疫表型,即阴性/弱/中度/强表达,可以帮助确定患者是否属于慢性淋巴细胞白血病,而免疫表型主要根据荧光强度判断,例如荧光强度大多分布在[10-1,100),则认为是阴性,因此荧光强度的分布区间对判断是否属于慢性淋巴细胞白血病十分关键。
在本发明的一个实施例中,将不同类型的成熟小B细胞淋巴瘤细胞(即目的细胞)进行免疫荧光染色,然后将染色后的细胞上流式细胞仪进行检测分析、进行数据计算和分析,其中在设定流式细胞仪的性能参数时,设定淋巴细胞中的T/NK淋巴细胞(CD45阳性CD19阴性淋巴细胞)为阴性对照,获取目的细胞待测抗原的阳性表达水平,即平均荧光强度(MFI)。
下面通过实施例详细说明如何检测CLL或其他类型小B细胞淋巴瘤的各种抗原的阳性表达水平。
1.样本制备:取已明确诊断的初诊CLL或其他类型淋巴瘤患者外周血或者骨髓样本2ml,计数细胞,调整细胞浓度为0.5~1*109细胞/1ml。
上述目的细胞可以根据实际情况中样本的不同而选择不同的现有技术进行制备,样本可以是骨髓、外周血或淋巴结等。在本发明的实施例中,检测成熟小B细胞淋巴瘤包括典型或非典型的CLL、套细胞淋巴瘤(MCL)、滤泡细胞淋巴瘤(FL)、幼淋巴细胞白血病(B-PLL)、毛细胞白血病(HCL)、变异型毛细胞白血病(HCL-v),边缘区淋巴瘤(MZL),不能分离B细胞淋巴瘤(BLPD-U)在内的多种临床鉴别存在难度的成熟小B细胞淋巴瘤。
2.细胞的免疫荧光染色和数据采集。
2.1每管加全血或骨髓100μl,共三管,分别加入对应的抗体各20μl后,旋涡混匀,室温避光反应30分钟。
第一管:加入FMC7-FITC/CD10-PE/CD5ECD/CD79b-PC5.5/CD20-PC7/CD23-APC/CD19-APCA750/CD22-PB/CD45KO;
选择目的:在十色流式细胞仪上,抗体组合采用最为合理且能最大程度地获取B淋巴瘤细胞的两两相关数据,逐步排除其他类型淋巴瘤。
首先通过CD45/SSC双参数设门限取淋巴细胞后,进一步采用CD19/CD45设门限取CD19+细胞分析不同抗原表达;通过内参细胞进一步验证九种抗体的组合,并确定阴性淋巴细胞均位于第一个log级位置(0~log100)。
采用CD19-非B细胞作为内部阴性对照,因为T和NK细胞不表达CD10,CD19,FMC7,CD79b,CD20,CD23,CD22;CD19-CD5-淋巴细胞为NK细胞,作为ECD通道的内部阴性对照,这是因为NK细胞不表达这两个标记。
明确了阴性淋巴细胞位置后,该管组合可以进一步分析CD19+肿瘤细胞的CD5表达确定是否是CD5+小B细胞淋巴瘤(包括CLL和MCL,基本排除FL、MZL、HCL、HCL-V、LPL/WM、PLL);进一步分析CD19+肿瘤细胞CD20、CD22、CD79b的表达水平(CLL为弱表达,肿瘤细胞位于100~101),以及是否表达FMC7,CD23可以排除MCL(MCL为FMC7+CD23-;CLL为FMC7-CD23+),随后通过CD19+肿瘤细胞是否表达CD10排除是滤泡细胞淋巴瘤(FL为CD10+,位置超过100,CLL位于0~100)。
第二管:加入kappa-FITC/lambda-PE/CD38-ECD/CD25-PC5.5/CD11C-PC7/CD103-APC/CD19-APCA750/IgM-PB/CD45-KO;
选择目的:采用CD45/SSC双参数设门限取淋巴细胞后,进一步采用CD19/SSC设门限取CD19+细胞分析不同抗原表达。
由于第二管和第一管选择参数一致,所以使用的仪器电压和补偿参数可以直接运用于第二管。
Kappa/lambda为单克隆性表达,即只表达其中一个抗原或者都不表达(正常或者反应性B细胞增多者表达为双克隆,即kappa和lambda均有表达);CD103、CD11C和CD25阴性,即可排除HCL/HCL-V(这两种淋巴瘤为阳性表达,位置均超过100);CD38阴性基本排除淋巴浆细胞淋巴瘤/巨球蛋白血症(这两种淋巴瘤为阳性表达,位置均超过100),如果阳性表达也是CLL的预后不良指标。
第三管:加入CD81-FITC/CD19PerCP/CD200-APC/CD45-KO
选择目的:进一步确认为CLL细胞,并排除MCL。
采用CD45/SSC双参数设门限取淋巴细胞后,进一步采用CD19/SSC设门限取CD19+细胞分析CD81和CD200表达;典型CLL为CD200强表达,CD81不表达(即CD81位于0~100,CD200位于102~103),而最容易混淆的MCL为CD200阴性,CD81阳性(即CD200位于0~100,CD81位于100~103)。
2.2加入溶血剂2ml,避光10分钟,离心去上清。
2.3PBS洗2次,1000转/每分,离心去上清。
2.4加入500uLPBS,上流式细胞仪收获细胞。
2.5采样后CD45/SSC设门限取淋巴细胞,进而CD19/SSC设门限取CD19+细胞。
2.6采样后,分析CD19+CD45+肿瘤细胞中各个抗原的表达,保存平均荧光强度(MFI)等相关统计学数据。
3.判断标准:平均荧光强度在流式细胞仪分为4个log级,如图2所示。其中,0~100为阴性;100~101为弱阳性;101~102为中等阳性;103~104为强阳性。
阴性对照:通过内参细胞进一步验证不同抗体组合,并确定阴性淋巴细胞是否位于第一个log级位置(0~100)。
在处理第一管时,每一个通道均采用内参细胞确定和验证阴性抗原表达位于第一个log级位置(0~100)。具体步骤如下:采用CD19-淋巴细胞,为T和NK细胞作为内参阴性对照,因为T和NK细胞不表达CD10,CD19,FMC7,CD79b,CD20,CD23,CD22,可确定这7个通道的阴性表达位置;采用CD19-CD5-淋巴细胞为NK细胞的内参阴性对照,验证ECD通道的阴性表达位置是否位于0~100。
图3显示了一例CLL流式细胞术所获得的荧光强度表达示意。其中,CD19+CD45+/SSC低的为成熟B淋巴细胞,表达特点如下:
表达:CD19,CD5,CD23;
弱表达:CD20,CD22,CD79b;
强表达:CD200;
不表达:FMC7,CD103,CD10,CD81,kappa,lambda
图4显示了某个病例的部分荧光强度的分布直方图。发明人经过研究后发现:实际采集的细胞的荧光强度数据分布可以认为符合对数正态分布。在上述认识的基础上,本发明的实施例中采用公式(1)和(2)计算荧光强度的置信区间界。经过实验证实,取1σ区间最准确。
1σ上界:μ×σ#(2)
其中,
m,v分别为对数正态分布的均值与方差。
在完成上述数据处理步骤之后,开始构建辅助医师识别慢性淋巴细胞白血病的神经网络模型。在本发明的实施例中,采用图5所示的三层神经网络作为参考识别结果的模型,其中的模型输入为图1中所示的各个抗原的荧光强度的置信区间界,各个荧光强度数据首先在第一隐层中进行计算,然后输入第二隐层中进行进一步计算,最后经过Sigmoid激活函数计算后,输出参考识别结果。在每个隐层中,包括多个作为隐层神经元的ReLU(Rectified Linear Unit)函数。
Z2=f(W2Z1+b2)
Z1=f(W1x+b1)
f(x)=max(0,x)
其中,函数f(·)为激活函数(即隐层神经元),在本发明实施例中为ReLU(Rectified Linear Unit)函数,σ(·)为Sigmoid激活函数。在实际构建时,输入维度n可以为26,第一隐层的隐层神经元个数o1可以取5,第二隐层的隐层神经元个数o2可以取10。需要说明的是,o1,o2甚至隐层数可根据经验或交叉验证结果灵活调节。
在利用该神经网络模型辅助识别之前,必须先进行模型训练。对于神经网络模型,一般采用基于随机梯度下降的算法训练,这些训练方法在常见的深度学习库(例如Tensorflow,Pytorch等)中几乎都有提供,仅需要提供输入及期望输出。在本发明的一个实施例中,优选采用Adam算法。它不过多地依赖人为设定的超参数,如学习率等。
在本发明中,模型训练过程即为确定上述公式中的这些模型参数的过程,具体的训练步骤如下:
(1)借助流式细胞仪,采集足够数量的两类患者的细胞荧光强度数据。对每名患者主要检测CD5,CD10,CD19,CD20,CD22,CD23,CD79B,CD81,CD103,CD200,FMC7,KAPPA和LAMBDA等抗原,因为这些抗原是判断该病例是否属于慢性淋巴细胞白血病的关键因素。
(2)如前文所述,细胞的荧光强度数据都近似认为符合对数正态分布,因此利用荧光强度数据的均值与方差可以计算置信区间界,即大致的分布范围。本发明实施例中的置信区间界均取1σ下界到1σ上界,计算公式分别由公式(1)和(2)给出。
(3)将步骤(2)中,各荧光强度的置信区间界作为模型输入。将该病例是否属于慢性淋巴细胞白血病作为期望输出,即可训练神经网络模型。
在本发明的一个实施例中,根据长期的临床积累,目前共有370个慢性淋巴细胞白血病病例数据以及380个非慢性淋巴细胞白血病病例数据,因此共有750个病例。针对这些病例,分别采集相关的荧光强度数据及其统计指标,包括均值、方差等。利用公式(1)和(2),对750个病例,计算每种荧光强度的置信区间界。利用步骤(2)得到的置信区间界(输入)以及是否属于慢性淋巴细胞白血病(期望输出)训练神经网络模型。一旦模型训练完成,即可用于辅助识别。
接下来,介绍利用训练好的神经网络模型辅助识别慢性淋巴细胞白血病肿瘤细胞的具体步骤:
(1)采集新患者的细胞荧光强度数据,采集的方法与训练步骤(1)中的相同。
(2)计算各种荧光强度的均值与方差,根据公式(1)和(2)计算其置信区间界。
(3)将每种荧光强度的置信区间上下界输入到训练好的神经网络模型中,即可得到一个参考识别结果。
在本发明的一个实施例中,对于新的病例,需要采集细胞荧光强度数据,然后计算荧光强度的均值、方差。假设某病例的各种荧光强度均值与方差如表1所示:
表1某病例的各种荧光强度均值与方差
则可计算其在对数正态分布下的置信区间界,如表2所示:
表2某病例的荧光强度的置信区间界
将上述置信区间表中的上下界,组合为26维输入向量,把该向量输入到训练好的神经网络模型中,可以得到一个实数输出p∈[0,1]。若p<0.5,表示该病例不属于慢性淋巴细胞白血病肿瘤细胞,否则属于。这个输出可以作为医师诊断的参考识别结果。
与现有技术相比较,本发明利用流式细胞仪采集到的两类患者(慢性淋巴细胞白血病患者和非慢性淋巴细胞白血病患者)的细胞荧光强度数据,训练得到神经网络模型。在模型训练完成之后,每当有需要诊断的患者,可以相应地采集其细胞的荧光强度数据,然后利用该神经网络模型即可给出参考识别结果。实验结果表明,本发明借助于机器学习和大量历史数据,实现的分类精度可以达到95%以上,能够辅助临床医师准确识别是否属于慢性淋巴细胞白血病肿瘤细胞,从而节省了人力物力,并且可以提高临床诊断的效率和质量。
上面对本发明所提供的基于机器学习的慢性淋巴细胞白血病肿瘤细胞识别方法进行了详细的说明。对本领域的一般技术人员而言,在不背离本发明实质内容的前提下对它所做的任何显而易见的改动,都将构成对本发明专利权的侵犯,将承担相应的法律责任。
Claims (8)
2.如权利要求1所述的慢性淋巴细胞白血病肿瘤细胞识别装置,其特征在于:
所述检测模块中,将目的细胞进行免疫荧光染色,将染色后的细胞利用流式细胞仪进行检测,流式细胞仪性能参数设置,其中以淋巴细胞中的CD45阳性CD19阴性淋巴细胞为阴性对照,获取目的细胞待测抗原的阳性表达水平。
3.如权利要求2所述的慢性淋巴细胞白血病肿瘤细胞识别装置,其特征在于:
所述目的细胞样本为已确诊的慢性淋巴细胞白血病或其他类型小B细胞淋巴瘤患者样本,样本采集后计数细胞并调整细胞浓度为0.5~1*109细胞/1ml。
4.如权利要求3所述的慢性淋巴细胞白血病肿瘤细胞识别装置,其特征在于:
所述待测抗原是CD5,CD10,CD19,CD20,CD22,CD23,CD79B,CD81,CD103,CD200,FMC7,KAPPA和LAMBDA。
5.如权利要求1所述的慢性淋巴细胞白血病肿瘤细胞识别装置,其特征在于:
所述检测模块中,通过CD45/SSC双参数设门限取淋巴细胞后,采用CD19/CD45设门限取CD19+细胞分析不同抗原表达;通过内参细胞验证各种抗体的组合,并确定阴性淋巴细胞的位置。
6.如权利要求5所述的慢性淋巴细胞白血病肿瘤细胞识别装置,其特征在于通过如下步骤验证各种抗体的组合,并确定阴性淋巴细胞的位置:
采用CD19-淋巴细胞,为T和NK细胞作为内参阴性对照,确定CD10,CD19,FMC7,CD79b,CD20,CD23,CD22这7个通道的阴性表达位置;采用CD19-CD5-淋巴细胞为NK细胞的内参阴性对照,验证ECD通道的阴性表达位置。
7.如权利要求1所述的慢性淋巴细胞白血病肿瘤细胞识别装置,其特征在于所述训练模块中,采用如下训练步骤:
(31)借助流式细胞仪,采集足够数量的两类患者的细胞荧光强度数据;
(32)利用细胞荧光强度数据的均值与方差计算置信区间界;
(33)将所述置信区间界作为模型输入,将病例是否属于慢性淋巴细胞白血病作为期望输出,训练所述神经网络模型。
8.如权利要求1所述的慢性淋巴细胞白血病肿瘤细胞识别装置,其特征在于所述识别模块中,采用如下识别步骤:
(41)采集新患者的细胞荧光强度数据;
(42)计算各种荧光强度的均值与方差,计算置信区间界;
(43)将每种荧光强度的置信区间界输入训练好的神经网络模型中,得到参考识别结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010057646.9A CN111257558B (zh) | 2020-01-19 | 2020-01-19 | 基于机器学习的慢性淋巴细胞白血病肿瘤细胞识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010057646.9A CN111257558B (zh) | 2020-01-19 | 2020-01-19 | 基于机器学习的慢性淋巴细胞白血病肿瘤细胞识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111257558A CN111257558A (zh) | 2020-06-09 |
CN111257558B true CN111257558B (zh) | 2021-08-24 |
Family
ID=70947113
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010057646.9A Active CN111257558B (zh) | 2020-01-19 | 2020-01-19 | 基于机器学习的慢性淋巴细胞白血病肿瘤细胞识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111257558B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113205872A (zh) * | 2021-04-29 | 2021-08-03 | 安徽医科大学第一附属医院 | 一种血液病智能诊疗辅助系统 |
CN114018789A (zh) * | 2021-10-08 | 2022-02-08 | 武汉大学 | 基于成像流式细胞检测和机器学习的急性白血病分型方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101678101A (zh) * | 2006-12-26 | 2010-03-24 | 分子免疫中心 | 可用于诊断和治疗b细胞慢性淋巴细胞白血病的能够在肿瘤细胞中诱导凋亡的药物组合物 |
CN102901693A (zh) * | 2011-07-25 | 2013-01-30 | 索尼公司 | 信息处理装置和方法、程序和校正荧光光谱的强度的方法 |
CN106471373A (zh) * | 2014-06-27 | 2017-03-01 | 约瑟卡雷拉斯白血球过多症研究所 | 用于治疗、诊断和预后血液系统恶性肿瘤的方法 |
CN106596489A (zh) * | 2016-12-19 | 2017-04-26 | 中国科学院苏州生物医学工程技术研究所 | 用于荧光液滴检测中荧光强度数据的处理方法 |
WO2017073737A1 (ja) * | 2015-10-28 | 2017-05-04 | 国立大学法人東京大学 | 分析装置 |
JP2017203637A (ja) * | 2016-05-09 | 2017-11-16 | 住友電気工業株式会社 | 腫瘍細胞検出方法及び腫瘍細胞検出装置 |
CN109036571A (zh) * | 2014-12-08 | 2018-12-18 | 20/20基因系统股份有限公司 | 用于预测患有癌症的可能性或风险的方法和机器学习系统 |
-
2020
- 2020-01-19 CN CN202010057646.9A patent/CN111257558B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101678101A (zh) * | 2006-12-26 | 2010-03-24 | 分子免疫中心 | 可用于诊断和治疗b细胞慢性淋巴细胞白血病的能够在肿瘤细胞中诱导凋亡的药物组合物 |
CN102901693A (zh) * | 2011-07-25 | 2013-01-30 | 索尼公司 | 信息处理装置和方法、程序和校正荧光光谱的强度的方法 |
CN106471373A (zh) * | 2014-06-27 | 2017-03-01 | 约瑟卡雷拉斯白血球过多症研究所 | 用于治疗、诊断和预后血液系统恶性肿瘤的方法 |
CN109036571A (zh) * | 2014-12-08 | 2018-12-18 | 20/20基因系统股份有限公司 | 用于预测患有癌症的可能性或风险的方法和机器学习系统 |
WO2017073737A1 (ja) * | 2015-10-28 | 2017-05-04 | 国立大学法人東京大学 | 分析装置 |
JP2017203637A (ja) * | 2016-05-09 | 2017-11-16 | 住友電気工業株式会社 | 腫瘍細胞検出方法及び腫瘍細胞検出装置 |
CN106596489A (zh) * | 2016-12-19 | 2017-04-26 | 中国科学院苏州生物医学工程技术研究所 | 用于荧光液滴检测中荧光强度数据的处理方法 |
Non-Patent Citations (3)
Title |
---|
CD11c 在慢性淋巴细胞白血病诊断中的意义;赵四书等;《中国生物工程杂志》;20190903;第39卷(第9期);全文 * |
Expression patterns of CD200 and CD148 in leukemic B-cell chronic lymphoproliferative disorders and their potential value in differential diagnosis;Lei Fan et al;《informa healthcare》;20151231;全文 * |
Using the geometric mean fluorescence intensity index method to measure ZAP-70 expression in patients with chronic lymphocytic leukemia;Yu-Jie Wu et al;《OncoTargets and Therapy》;20161231;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN111257558A (zh) | 2020-06-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US12046331B2 (en) | System, method, and article for detecting abnormal cells using multi-dimensional analysis | |
US8682810B2 (en) | Method and system for analysis of flow cytometry data using support vector machines | |
US20240044904A1 (en) | System, method, and article for detecting abnormal cells using multi-dimensional analysis | |
de Tute | Flow cytometry and its use in the diagnosis and management of mature lymphoid malignancies | |
JP2018505392A (ja) | 自動化されたフローサイトメトリ分析方法及びシステム | |
CN111257558B (zh) | 基于机器学习的慢性淋巴细胞白血病肿瘤细胞识别方法 | |
US20140235487A1 (en) | Oral cancer risk scoring | |
CN110168561A (zh) | 用于确定一个或多个组织样本中的细胞组成信息的装置 | |
CN112912923A (zh) | 基于距离的组织状态确定 | |
Falay et al. | Which markers should the used for diagnostic chronic lymphocytic leukemia immunophenotyping scoring system by flow cytometry | |
CN113539473A (zh) | 一种仅使用血常规检验数据诊断布氏杆菌病的方法及系统 | |
CN112424582A (zh) | 血液样本检测的方法、血液样本检测仪和存储介质 | |
Valet et al. | Automated classification of patients with chronic lymphocytic leukemia and immunocytoma from flow cytometric three‐color immunophenotypes | |
Dunn et al. | Cancer diagnostic tests: Principles and criteria for development and evaluation | |
Santamaria-Pang et al. | Robust single cell quantification of immune cell subtypes in histological samples | |
US20190369099A1 (en) | Systems and Methods of Oral Cancer Assessment Using Cellular Phenotype Data | |
JP4768706B2 (ja) | 流体血球計算測定を使用する最小疾患レベルを監視するのに使用される腫瘍性細胞中の異常表現型の多次元検出方法 | |
CN114219752B (zh) | 一种针对血清蛋白电泳的异常区域检测方法 | |
RU2803281C1 (ru) | Способ диагностики онкологического заболевания крови | |
CN114317711A (zh) | 非酒精性脂肪肝的预测方法及装置 | |
CN111351942A (zh) | 肺癌肿瘤标志物筛选系统及肺癌风险分析系统 | |
CN118173158A (zh) | 一种小细胞肺癌免疫治疗效果的预测模型 | |
CN118505594A (zh) | 一种结直肠癌的外周血循环肿瘤细胞上皮联合间质标志物双重形态分型模型及其应用 | |
CN112945892A (zh) | 基于红外光谱融合和学习向量化神经网络的肿瘤诊断方法 | |
Zyeva et al. | IMMUNOLOGICAL DIAGNOSIS OF MYELODYSPLASTIC SYNDROME BY FLOW CYTOMETRY. SCREENING |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20230103 Address after: 221000 2F, Building A4, Huaihai Biomedical Industrial Park, No. 10, Zhujiang East Road, Xuzhou Hi tech Industrial Development Zone, Jiangsu Province Patentee after: Jiangsu Huayue Precision Diagnostic Technology Co.,Ltd. Address before: 210029 No. 300, Guangzhou Road, Nanjing, Jiangsu Patentee before: JIANGSU PROVINCE HOSPITAL(The First Affiliated Hospital of Nanjing Medical University) |