CN112313497A - 使用微流式细胞术诊断疾病的方法 - Google Patents

使用微流式细胞术诊断疾病的方法 Download PDF

Info

Publication number
CN112313497A
CN112313497A CN201980040523.XA CN201980040523A CN112313497A CN 112313497 A CN112313497 A CN 112313497A CN 201980040523 A CN201980040523 A CN 201980040523A CN 112313497 A CN112313497 A CN 112313497A
Authority
CN
China
Prior art keywords
sample
biomarker
particles
particle
disease
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980040523.XA
Other languages
English (en)
Inventor
约翰·里维斯
罗伯特·帕帕罗斯基
戴斯蒙特·品克
卡塔琳娜·瓦兹奎兹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanodico Co
Original Assignee
Nanodico Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanodico Co filed Critical Nanodico Co
Publication of CN112313497A publication Critical patent/CN112313497A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N15/00Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
    • G01N15/10Investigating individual particles
    • G01N15/14Optical investigation techniques, e.g. flow cytometry
    • G01N15/1429Signal processing
    • G01N15/1431Signal processing the electronics being integrated with the analyser, e.g. hand-held devices for on-site investigation
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N15/00Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
    • G01N15/10Investigating individual particles
    • G01N15/14Optical investigation techniques, e.g. flow cytometry
    • G01N15/1429Signal processing
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N15/00Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
    • G01N15/10Investigating individual particles
    • G01N15/14Optical investigation techniques, e.g. flow cytometry
    • G01N15/1456Optical investigation techniques, e.g. flow cytometry without spatial resolution of the texture or inner structure of the particle, e.g. processing of pulse signals
    • G01N15/1459Optical investigation techniques, e.g. flow cytometry without spatial resolution of the texture or inner structure of the particle, e.g. processing of pulse signals the analysis being performed on a sample stream
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/64Fluorescence; Phosphorescence
    • G01N21/6428Measuring fluorescence of fluorescent products of reactions or of fluorochrome labelled reactive substances, e.g. measuring quenching effects, using measuring "optrodes"
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • G01N33/57434Specifically defined cancers of prostate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N15/00Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
    • G01N2015/0038Investigating nanoparticles
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N15/00Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
    • G01N15/10Investigating individual particles
    • G01N2015/1006Investigating individual particles for cytology
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N15/00Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
    • G01N15/10Investigating individual particles
    • G01N15/14Optical investigation techniques, e.g. flow cytometry
    • G01N2015/1402Data analysis by thresholding or gating operations performed on the acquired signals or stored data
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N15/00Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
    • G01N15/10Investigating individual particles
    • G01N15/14Optical investigation techniques, e.g. flow cytometry
    • G01N2015/1488Methods for deciding
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/64Fluorescence; Phosphorescence
    • G01N21/6428Measuring fluorescence of fluorescent products of reactions or of fluorochrome labelled reactive substances, e.g. measuring quenching effects, using measuring "optrodes"
    • G01N2021/6439Measuring fluorescence of fluorescent products of reactions or of fluorochrome labelled reactive substances, e.g. measuring quenching effects, using measuring "optrodes" with indicators, stains, dyes, tags, labels, marks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/12Computing arrangements based on biological models using genetic models
    • G06N3/126Evolutionary algorithms, e.g. genetic algorithms or genetic programming
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Immunology (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Pathology (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Dispersion Chemistry (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Signal Processing (AREA)
  • Cell Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Oncology (AREA)
  • Hospice & Palliative Care (AREA)
  • Food Science & Technology (AREA)
  • Optics & Photonics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Microelectronics & Electronic Packaging (AREA)
  • Computational Linguistics (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明公开了一种诊断患者的疾病(例如临床上显著的前列腺癌)的方法。还公开了一种用于识别疾病特征的方法。所述方法涉及使用微流(μFCM)细胞术来识别粒子表型,然后使用机器学习来确定患者是否有所关注的疾病或粒子疾病的粒子表型。本文所公开的μFCM分析工作流程有助于识别μFCM数据中的可能被传统的门控分析所忽略的临床上最有用的信息。

Description

使用微流式细胞术诊断疾病的方法
技术领域
本发明总体涉及诊断方法和在该诊断方法中测试的生物标志物。更具体地说,本发明涉及一种胞外囊泡在临床上显著的前列腺癌诊断中的应用以及一种用于预测前列腺癌的生物标志物。
背景技术
胞外囊泡(EV)在免疫学、神经病学、心脏病学和肿瘤学等领域中具有很大的诊断和预测潜力。胞外囊泡包括外来体(30-100纳米)、微泡(50-2000纳米)、凋亡小体(500-4000纳米)和非常大的癌小体(1000-10000纳米)。健康和患病的细胞不断释放胞外囊泡,这些胞外囊泡含有许多来自其本源细胞的mRNA、miRNA和蛋白质标志物。在几乎所有生物流体(包括血液、尿液、精液和脑脊液)中都发现了胞外囊泡,这使得胞外囊泡成为微创诊断分析的很有希望的靶标。
存在多种胞外囊泡表征方法(Szatenek R等人,Int J MolSci 18(6),2017)。电子显微镜分析提供最高分辨率的胞外囊泡图像,但缺乏高通量数据采集能力,不能轻松地同时测量许多标志物,并且,由于原始数据是图像,因此可能需要耗时且复杂的数据分析(Harris JR,ArchBiochemBiophys 581:3-18,2015)。纳米粒子跟踪分析和可调电阻脉冲传感允许快速计数和确定粒子大小,但对于表胞外囊泡标志物不理想(GardinerC等人,JExtracell Vesicles 2,2013;Vogel等人,Anal Chem 83(9):3499-35-6,2011)。微流式细胞术(μFCM)又称为纳米级或高灵敏度流式细胞术,它允许对粒子的光学特性进行高通量表征,从而在数分钟内量化数百万胞外囊泡的粒子大小、浓度和标志物丰度(上文的Szatenek文献)。这些可取的特点使μFCM非常适合基于胞外囊泡的高灵敏度临床试验。
μFCM产生大量数据,这使得分析变得复杂。典型的10微升血浆样品稀释100倍后可在一分钟的分析时间内产生超过5000000个事件,每个事件具有十多个光学特性。换句话说,一微升血浆可有超过109个事件。其它类型的液体活检样品可具有类似的浓度。与纳米粒子(NTA)或电镜分析相比,通过μFCM进行的胞外囊泡分析可检查至少500-50000倍以上的样品事件,从而实现整个样品的更具代表性的分析。传统的基于细胞的流式细胞术分析通常涉及生成二元散点图并在4个象限内量化用户定义的感兴趣区域(ROI)内的事件浓度,因为许多细胞具有相似的大小,并被表征为标志物阳性或阴性。这种方法对于μFCM来说过于简单,因为胞外囊泡的大小和标记物的丰度不等,这就需要开发能够快速处理非常大的复杂数据集的μFCM分析工具。
在产生基于胞外囊泡的诊断/预后分析时,不仅必须表征生物样品中的胞外囊泡,还必须分析其预测临床上显著的状况的能力,这能改善患者的福祉和/或医疗保健经济学。
发明内容
根据本发明的一个方面,本发明提供了一种诊断患者的疾病的方法。所述方法包括以下步骤:将液体活检样品(例如来自患者的血浆、血清、尿液或其它体液样品)与结合所关注的疾病的生物标志物的一种或多种探针一起孵育;对样品进行微流式细胞术分析;获得一种或多种生物标志物的信号强度,并且可选地获得与样品相关的一种或多种光学特性;处理信号强度,并且,若获得了一种或多种光学特性,则使用定制算法处理这些光学特性,以计算样品中的不同粒子表型的浓度。将这些粒子表型的浓度用作机器学习算法的特征(即,输入),以确定患者患有临床上显著的前列腺癌的概率。
根据本发明的另一个方面,本发明提供了一种识别疾病的疾病特征的方法。所述方法包括以下步骤:将来自健康对象的样品和来自患有已知疾病的对象的样品与一种或多种生物标志物探针一起孵育;对样品进行微流式细胞术分析;获得一种或多种生物标志物的信号强度,并且可选地获得与每个样品相关的一种或多种光学特性;对来自一种或多种生物标志物的信号强度进行对数变换,并且,若存在一种或多种光学特性,则对这些光学特性进行对数变换,以产生变换信号强度;对感兴趣区域(ROI)中的具有相似变换信号强度的粒子进行分箱;确定每个感兴趣区域的粒子浓度;在来自健康对象的样品与来自患有已知疾病的对象的样品之间对每个感兴趣区域中的粒子浓度数据进行比较;从标志物的每个组合确定每个感兴趣区域的受试者工作特征(ROC)曲线值下的区域(AUC);并且选择提供最高AUC值的生物标志物的组合以获得疾病的疾病特征。
根据本发明的另一个方面,本发明提供了一种诊断患者体内的临床上显著的前列腺癌的方法。所述方法包括以下步骤:将来自患者的样品与结合临床上显著的前列腺癌的一种或多种生物标志物的一种或多种探针一起孵育;对样品进行微流式细胞术分析;获得一种或多种生物标志物的信号强度,并且可选地获得与样品相关的一种或多种光学特性;使用确定不同粒子表型的浓度的定制算法处理信号强度,并且,若获得了一种或多种光学特性,则处理这些光学特性;使用粒子表型的浓度作为机器学习算法的特征(即,输入),以确定患者患有临床上显著的前列腺癌的概率;并且使用特定概率阈值来诊断患有该疾病的患者。
在一个实施例中,所述处理包括:对信号强度进行对数变换,以产生变换信号强度;并且,对于每种光学特性,将具有相似变换信号强度的粒子分箱到感兴趣区域(ROI)中,其中每个感兴趣区域被视为一个不同的粒子表型。在其它实施例中,所述对数变换和分箱步骤同时发生或者独立地发生。
在另一个实施例中,对粒子进行分箱包括对每种光学特性使用设定数量的箱进行分箱。
在另一个实施例中,所述方法包括多个感兴趣区域。
在另一个实施例中,粒子是基于其对于与生物标志物结合的探针的阳性状态以及其光散射强度分箱的。为了确定粒子对于生物标志物是否是阳性的,对特定患者的特定生物标志物的信号直方图应用核密度估计(KDE)函数。从生物标志物阴性粒子群的KDE图上的最高区域识别荧光值F1。接下来,为许多不同的较高信号强度计算KDE曲线的斜率。从位于阴性粒子群右侧的一半处的斜率最负的位置确定第二荧光值F2。分隔生物标志物阳性和阴性粒子的荧光强度值(Fs)等于F1+(2*(F2-F1))+F3,其中F3是增加的一个很小的任意荧光强度值,以帮助确保生物标志物阴性粒子不被分类为生物标志物阳性粒子。荧光强度高于或低于Fs的粒子对于生物标志物分别为阳性或阴性。这种动态信号阈值化方法不易受随时间推移的信号偏移和不同患者的影响。一旦每个患者的所有粒子被分类为对于每个生物标志物是阳性/阴性的,就将用于估计粒子大小的对数变换光散射信号分箱到任意数量的组中。例如,在信号强度范围为0到1并且存在10个箱时,0与0.1之间的信号在组1中,而0.9至1的信号在组10中。最后,根据生物标志物状态(阴性/阳性)以及光散射箱的所有可能组合来产生粒子表型。例如,生物标志物A+和光散射箱1/10的粒子不同于生物标志物A-和光散射箱1/10的粒子。确定所有粒子表型的浓度,并用作机器学习算法的输入特征。
在又一个实施例中,所述机器学习算法是个体/袋装/增强决策树算法、线性/二次/三次/高斯支持向量机算法、逻辑回归、线性/二次/子空间判别分析或k近邻算法。在一个实施例中,所述机器学习算法是增强的集成决策树算法,例如XGBoost算法。
在一个实施例中,极端梯度增强决策树算法包括至少100个模型的集合,其中每个模型的概率被平均,以产生临床上显著的前列腺癌的单个概率值。
在另一个实施例中,预测分数包括护理分数的标准。
在另一个实施例中,所述一种或多种生物标志物选自表1或表2。
在又一个实施例中,所述样品是血清样品。
附图说明
参考以下说明和附图能更好地理解这些及其它实施例和特征,在附图中:
图1示出了本发明的一个实施例的方法的概图;
图2示出了使用μFCM数据预测/关联临床特征。A)使用LALS-PSMA、LALS-ghrelin和PSMA-ghrelin数据集预测各种临床特征的受试者工作特征曲线值下的面积图(ROC AUC)。对每个图中的最大的10%AUC进行平均和比较;B)使用LALS-PSMA数据集预测1+、2+、3+、4+和5级前列腺癌的ROC AUC图;C)使用LALS-ghrelin数据集预测糖尿病的ROC AUC图;以及D)使用LALS-PSMA数据集的前列腺特异性抗原PSA(右)、肿瘤分期(中)和体重(右)的相关系数图;
图3示出了在血浆样品粒子上染色的PSMA/ghrelin探针的变化性使得传统的手动门控分析变得复杂。A)、B)和C)针对非临床上显著和临床上显著的前列腺癌患者的是大角度光散射(LALS)和PSMA(a)、LALS和ghrelin(b)以及PSMA和ghrelin(c)的代表性散点图和ROC AUC图;D)通过手动门控对患者血浆中的PSMA/ghrelin探针阳性粒子进行定量分析;E)使用手工感兴趣区域数据预测临床上显著的前列腺癌(3+级)的ROC曲线;
图4示出了μFCM数据的viSNE分析。A)使用viSNE分析来自临床上显著和非临床上显著的前列腺癌患者的等量粒子(30000个);B)使用快速搜索/密度峰值算法对粒子进行聚类;C)临床上显著的前列腺癌粒子的viSNE聚类纯度。一些聚类示出了源自临床上显著的前列腺癌患者的粒子的富集(箭头);
图5示出了使用PSMA-ghrelin数据集优化μFCM数据的机器学习以预测临床上显著的前列腺癌;A)、B)、C)最优机器学习算法(a)、每个光学参数的箱数(b)和一个集合中的XGBoost模型数(C);D)网格搜索、XGBoost参数、特征选择和集成对模型性能的影响;E)用于预测临床上显著的前列腺癌的手动门控、CITRUS和定制分箱-XGBoost算法的ROC曲线。标绘的值表示至少重复10次5重交叉验证的±SEM值;
图6示出了临床与μFCM数据结合以预测临床上显著的前列腺癌。A)使用基于μFCM的XGBoost预测和SOC临床特征(包括前列腺特异性抗原、年龄、种族、直肠指检、既往阴性活检和前列腺癌家族史)从逻辑回归模型预测临床上显著的前列腺癌的瀑布图;B)采用或不采用μFCM数据的SOC的逻辑回归模型的受试者工作特征曲线;C)患有或没有前列腺肥大(>40cc)且诊断为癌症和直肠指检异常的患者的比例;D)、E)患有和没有前列腺肥大的男性的前列腺特异性抗原(d)和前列腺特异性抗原密度(e)。绘制的值为平均±SEM值;F)使用μFCM+SOC逻辑回归模型预测患有前列腺肥大的男性的临床上显著的前列腺癌;以及G)关于患有前列腺肥大的男性是否应接受使用μFCM+SOC模型进行的活检的建议;和
图7示出了LALS-PSMA-ghrelin数据集的viSNE图的聚类算法的对比。A)、B)、C)聚类算法包括K均值(a)、期望最大化高斯混合模型(b)和快速搜索/密度峰值(c);
图8是经过PSMA-ghrelin数据集变换后的XGBoost模型性能的图形表示;
图9示出了从使用PSMA-ghrelin数据集来预测临床上显著的前列腺癌的XGBoost模型获得的可变增益图(a)、以及AUC(色标)与可变增益(灰度)图的叠加(b);
图10示出了使用微流式细胞术和超声波对单个癌细胞进行高灵敏度检测的方法和结果;
图11的方法和结果示出了基于移位的微流式细胞术数据进行临床预测的增强精度;
图12示出了Jagged 1的生物标志物结果;
图13示出了2型钙粘蛋白11OB-cadherin的生物标志物结果;
图14示出了聚唾液酸的生物标志物结果;
图15示出了MERTK的生物标志物结果;和
图16示出了前列腺素(Prostein)的生物标志物结果。
具体实施方式
本文中说明了用于诊断疾病(包括临床上显著的前列腺癌)的生物标志物的示例性实施例;诊断疾病(包括临床上显著的前列腺癌)的方法;以及开发疾病预测模型和使用该模型进行诊断测试的方法。应理解,本文中所述的实施例和示例仅是出于为本领域技术人员提供示例性说明的目的,并不意味着以任何方式进行限制。在本公开中对实施例或示例的所有引用应视为对示例性和非限制性实施例或示例性和非限制性示例的引用。
除非另行限定,否则在本文中所用的所有技术和科学术语具有本发明所属领域的普通技术人员所通常理解的含义。还必须注意,除非在上下文中另有明示,否则在说明书和所附权利要求中所使用的单数形式“一”、“一个”和“所述”包括复数指代物。例如,对“抗原”或“抗体”的指代意在包括多个抗原分子或抗体。
本发明提供了一种诊断患者的疾病(例如临床上显著的前列腺癌)的方法。就本论述而言,“临床上显著的前列腺癌”指格里森3组以上的前列腺癌。所述方法包括以下步骤:将来自患者的样品与结合所关注的疾病的一种或多种生物标志物的一种或多种探针和/或抗体一起孵育;对样品进行微流式细胞术分析;获得一种或多种生物标志物的信号强度,并且可选地获得与样品相关的一种或多种光学特性;处理信号强度,并且,若获得了一种或多种光学特性,则使用定制算法处理这些光学特性,以确定患者样品中的不同粒子表型的浓度;并且使用来自患者样品的粒子表型的浓度数据作为机器学习的输入,根据机器学习算法的输出来诊断患有疾病的患者。在一个实施例中,所述疾病可以是癌症,尤其是临床上显著的前列腺癌,并且所述生物标志物与癌症生物标志物相关,尤其是临床上显著的前列腺癌生物标志物。
还提供了一种识别疾病特征的方法。所述方法包括以下步骤:将来自健康对象的样品和来自患有已知疾病的对象的样品与结合该疾病的一种或多种生物标志物的一种或多种探针一起孵育;对样品进行微流式细胞术分析;获得一种或多种生物标志物的信号强度,并且可选地获得与每个样品相关的一种或多种光学特性;对来自一种或多种生物标志物的信号强度进行对数变换,并且,若存在一种或多种光学特性,则对这些光学特性进行对数变换,以产生变换信号强度;对感兴趣区域(ROI)中的具有相似变换信号强度的粒子进行分箱;确定每个感兴趣区域中的粒子浓度(通过将每个感兴趣区域中的总粒子计数除以在数据采集期间分析的样品量来计算),在来自健康对象的样品和来自患有已知疾病的对象的样品之间比较每个感兴趣区域中的粒子浓度数据;从标志物的每个组合确定每个感兴趣区域的曲线(AUC)值下的受试者工作特征(ROC)区域;并且选择提供最高AUC值的生物标志物的组合以获得疾病的疾病特征。
可用于本发明的样品包括但不限于生物样品,例如血液(或其成分)、精液、牛奶等。在本发明中,不需要像其它方法中所要求的那样分离和提纯胞外囊泡。相反,可按照标准临床诊断程序从血液中分离血清或血浆,并在本文所述的方法中使用,而无需进一步提纯和处理。
将样品和与所关注的疾病或正在诊断的疾病的生物标志物相关的探针一起孵育,或特定类型的小粒子(例如在此情况下为胞外囊泡)一起孵育。探针可包括但不限于针对特定抗原的完整抗体或抗体成分(例如F(ab)、F(ab’)2或F(ab’)片段、微体等)、或针对特定靶标的肽。探针还可包括允许识别样品中的特定成分的各种染料。例如,与对膜结合小粒子染色的亲脂性染料一起孵育有助于样品中的蛋白质聚集体与脂质结合粒子的分离。典型情况下,探针具有直接结合的辅助成分,例如荧光结合物,这种结合物有助于检测探针结合靶标。
为了检测PSMA阳性胞外囊泡,可将样品与已与诸如DyLight 405等染料直接结合的PSMA特异性单克隆抗体J591(可通过BZL Biologics,LLC获得)一起孵育。或者,非结合探针(例如PSMA特异性单克隆抗体J591)在与样品一体孵育后可进一步与辅助试剂一起孵育,以识别在试验中使用的第一探针。例如,和与Qdot565结合的驴抗小鼠IgG抗体一起孵育,这能实现在μFCM试验中进行检测。典型情况下,生物标志物探针对只在或主要在受所关注的疾病影响的细胞或组织中表达的生物分子具有特异性。但是,生物标志物可以对于特定细胞类型是特异性的。此外,可使用不只一种生物标志物来识别所关注的疾病和/或细胞类型的不只一种特征。
样品与生物标志物探针的孵育可按单个样品+单种探针的形式进行,也可按单个样品+多种探针的形式进行。孵育的形式可提供不同的答案,因为每种生物标志物探针可提供关于样品中的胞外囊泡群的不同信息。例如,探针可指示脂质结合与非脂质结合事件、或者上皮与非上皮粒子来源。在其它情况下,探针可指示疾病的存在、疾病的存在和攻击性。一次孵育中的多种探针可能具有相似的粒子来源、疾病存在和疾病攻击性的指示。因此,探针的组合可能对疾病表型的检测具有重要意义。
粒子大小和计数可通过光散射来估计。光散射特性与上述荧光强度的结合可提供每个粒子的独特表型。这些粒子表型可单独使用,也可与多种生物标志物结合使用,可提供所关注的疾病的独特疾病特征。
然后,使用商售机器对样品进行μFCM分析,例如但不限于Apogee A50微流式细胞仪或CytoFLEX或DxFlex流式细胞仪。从μFCM分析获得的原始数据可使用以MATLAB、R或Python编写的算法提取,并且按以各个粒子为行并以光散射和荧光强度为列的形式组织。可在单独一列中表示每个粒子的记录时间。
可通过优化实验来确定每种粒子表型的光散射/荧光强度的最小和最大截止值,该优化实验包括为一系列不同的光散射/荧光强度使用一系列不同的截止值,并从先前获得的患者数据识别在曲线下提供最高受试者工作特征数值的截止值。
可使用对具有相似光散射和标志物强度的粒子分组的定制处理脚本来确定每种粒子表型中的粒子数量。根据粒子表型计数、样品运行时间长度、μFCM的样品流速和样品稀释系数来计算粒子表型的浓度。如果患者具有不只一个μFCM数据文件(即,多个副本),那么可跨所有重复的μFCM数据文件对粒子表型的浓度进行平均。
还可使用动态荧光阈值算法通过识别每个患者的每个粒子的生物标志物阳性状态来计算样品中的粒子表型的浓度。为了确定每个患者样品的粒子对于生物标志物是否为阳性的,可对来自单个患者样品的单个探针信号的直方图应用密度估计(KDE)函数。荧光值F1被识别为柱状图的X轴(荧光强度)上的与生物标志物阴性粒子群的KDE图的Y轴(粒子密度)上的最高区域相交的区域,该最高区域是KDE图左侧附近的最大峰值。接下来,从F1为许多不同的较高信号强度计算KDE曲线的斜率。从位于阴性粒子群右侧的一半处的斜率最负的位置确定第二荧光值F2。分隔生物标志物阳性和阴性粒子的荧光强度值(Fs)等于F1+(2*(F2-F1))+F3,其中F3是增加的一个很小的任意荧光强度值,以帮助确保生物标志物阴性粒子不被分类为生物标志物阳性粒子。荧光强度高于或低于Fs的粒子对于生物标志物分别为阳性或阴性。一旦每个患者的所有粒子被分类为对于每个生物标志物是阳性/阴性的,用于估计粒子大小的对数变换光散射信号就被分箱到任意数量的组中。最后,根据生物标志物状态(阴性/阳性)以及光散射箱的所有可能组合来产生粒子表型。
从上面收集的数据构建用于机器学习的数据集。可使用所有患者的粒子表型的浓度产生一个表格。在一次迭代中,行可代表患者,而列代表粒子表型的浓度。但是,对于本领域技术人员来说显而易见的是,这些数据可按相反的方式或一些其它表格的形式来表示。
根据数据集的产生方式,可向表中添加临床相关数据,作为附加的列或行。这些数据可用作机器学习的附加特征(例如前列腺特异性抗原及μFCM数据是否能更好地预测谁患有临床上显著的前列腺癌?),或者可用作机器学习算法需要预测的标签(例如识别哪些患者患有临床上显著的前列腺癌)。
一旦产生数据集,就可产生能够从具有或不具有临床数据的μFCM预测临床状态的优化的机器学习模型。用于机器学习的软件可包括但不限于R、MATLAB、KNIME和python。机器学习模型可包括单决策树、支持向量机、k近邻、线性回归、逻辑回归、判别分析、随机森林、神经网络和XGBoost。可进一步优化为预测临床状况提供最高ROC AUC的算法。使用5重交叉验证对所有的机器学习算法进行分析,该5重交叉验证涉及将数据分为5个独立的组。可使用5个组中的4个来产生模型,并且可相对于留出组确定模型精度。将各组打乱,并重复这个过程4次以上,从而在留出组中使用每个患者一次。这能确保模型精度是基于未用于产生模型的数据确定的。
机器学习算法优化包括使用递归特征消除法来识别在模型产生之前应该保留/消除哪些μFCM/临床特征。该算法使用所有数据从模型中识别最重要的特征(例如使用R中的xgb.importance函数确定XGBoost特征重要性)。产生多个数据集,包括前10、20、30、40、50、60、70、80、90或100%最重要的特征,并且使用5重交叉验证提供最高ROC AUC的数据集包含将为最终机器学习模型保留的特征。在此步骤中也可使用其它特征选择算法,包括遗传算法和模拟退火。
在特征选择之后,可通过网格搜索来优化机器学习算法的可调参数。这涉及为每个可调算法参数提供多个值(例如XGBoost参数,例如“nrounds”:100、200和300以及“max_depth”:3、4和5),并测试可能的参数值的每个组合。将使用5重交叉验证提供最高ROC AUC的参数值集用于最终的机器学习模型。
最终的机器学习模型的优化包括通过对所有模型的预测进行平均来将许多(通常≥100个)模型集成在一起。所有模型会使用上述的优化的特征和参数,但是每个模型会使用稍有不同的患者群组(例如随机选择的80%患者)来产生模型。这使得每个模型都是唯一的,并且所有模型预测结果的平均值会提供比使用具有完整数据集的单一模型更准确且更稳定的临床状态预测结果。将最终的优化集成模型保存在计算机上以备将来使用。
最终的机器学习模型可用于预测新患者的临床状态。包括有或没有临床数据的粒子表型的浓度的新患者数据可用作最终机器学习模型的输入,以预测患者具有特定临床状况的概率。
使用上述方法,对先前诊断为患有临床上显著的前列腺癌的患者进行了研究,以确定通常与该疾病最相关的粒子表型/生物标志物。表1示出了这些粒子表型/生物标志物,图12、13、14、15和16提供了附加的概念验证。
表1:与临床上显著的前列腺癌相关的生物标志物
Figure BDA0002839628810000101
Figure BDA0002839628810000111
实施例
由于不同胞外囊泡的大小不同,因此目标是将μFCM数据划分到许多不同的感兴趣区域(ROI)中(其中每个感兴趣区域代表不同胞外囊泡的浓度),并对感兴趣区域数据使用机器学习来预测临床状况(图1)。在产生这样的模型之前,首先确定μFCM数据能够最佳地预测哪些临床状况是很重要的。使用自动分析脚本来产生μFCM数据的AUC图,以预测与PSMA和ghrelin探针相关的10种不同临床状况。
在对LALS-PSMA、LALS-ghrelin和PSMA-ghrelin的AUC图中的最高10%AUC进行平均时,预测5和4+级前列腺癌提供最高的平均AUC(图2a)。有趣的是,所有三个双变量AUC图都提供高于0.7的用于预测高等级前列腺癌的前10%AUC,而LALS-PSMA具有高于0.8的用于预测5级前列腺癌的AUC。在比较不同的前列腺癌等级组时,LALS-PSMA AUC图表现出了有趣的模式变化(图2b)。在使用LALS估计粒子大小时,1+级的预测显示出了较小的PSMA阳性粒子,其AUC高于0.5,这意味着1+级前列腺癌的患者的这些感兴趣区域中的粒子浓度总体较高,而较大的PSMA阳性粒子大多显示出AUC低于0.5,这意味着1+级前列腺癌的患者的这些感兴趣区域中的粒子浓度总体较低。较高等级组的AUC图表明这种表型的进行性逆转,对于较大的PSMA阳性粒子,5级前列腺癌具有AUC>0.8,对于许多较小的PSMA阳性粒子,AUC大约为0.3。这种表型逆转在3+级的AUC图中变得非常明显。以前的临床试验表明,接受根治性前列腺切除术的3级前列腺癌患者的10年无复发进展低于0.5,这显著低于2级前列腺癌患者的>0.75值(28)。这表明,由于原发性肿瘤的手术切除不能治愈前列腺癌患者,因此大多数患有3级前列腺癌的男性在诊断时具有转移性疾病。在不受理论限制的前提下,较高等级前列腺癌患者体内的较大量的较大PSMA阳性粒子可能部分地是由转移性细胞循环造成的,因为来自局部肿瘤细胞的较大胞外囊泡(>300纳米)会难以渗入到血管中。
由于ghrelin在能量和葡萄糖代谢中的作用(ChurmR等人,Obes Rev18(2):140-148,2017),产生了AUC图以预测糖尿病。一系列不同大小的ghrelin阳性粒子表现出AUC接近0.7,这表明糖尿病男性的胞外囊泡的ghrelin受体水平升高(图2c)。
使用LALS-PSMA数据产生了前列腺特异性抗原、肿瘤分期和体重的相关图(图2d)。对于PSMA呈微阳性的较大粒子表现出与前列腺特异性抗原最正相关,而对于PSMA呈强阳性的大粒子与肿瘤分期最相关。这种相关性并不令人惊讶,因为1)前列腺PSMA表达已被证明与诊断时的前列腺特异性抗原相关(Kasperzyk JL等人,Cancer Epidemiol BiomarkersPrev 22(12):2354-63,2013),并且2)较高等级的肿瘤更有可能扩散,这能解释较高等级的AUC图与肿瘤分期相关图之间的相似性。
考虑到AUC/相关图的结果,使用FCM数据预测临床上显著的前列腺癌,这些前列腺癌被定义为3+级,因为这些患者表现出比2级和更低级前列腺癌的患者明显更差的结果。
通过手动门控对μFCM数据进行分析,以提供常规分析的基准。在特定粒子群周围产生手动门不是一项简单的任务,因为不同的粒子群存在于不同的患者散点图上,在粒子群位置方面有一些轻微的偏移(图3a、b、c)。为简单起见,产生了对所有标志物阳性粒子进行分组的门。与非临床上显著的前列腺癌相比,只有ghrelin阳性粒子的浓度在临床上显著的前列腺癌中明显高2.1倍(p<0.05,图3d)。用于预测临床上显著的前列腺癌的PSMA、ghrelin和PSMA/ghrelin阳性粒子浓度的AUC均低于0.6(图3e)。这些低AUC可用AUC图来解释,该图显示了包含AUC高于和低于0.5的粒子的门(图3a、b、c)。
临床上显著和非临床上显著的粒子的viSNE图共同反映出比常规散点图更多的可见的粒子群(图4a)。使用K-均值、期望最大化高斯混合模型和快速搜索/密度峰值算法对粒子进行聚类,最后一种算法是唯一能够维持具有不规则形状的大聚类的算法(图4b和图8)。两个聚类的临床上显著的前列腺癌聚类的纯度大于0.8,这表明这些粒子群在临床上显著的前列腺癌患者中处于较高水平(图4c)。虽然这些结果似乎有望在临床上得到利用,但viSNE的不可再现性要求同时分析所有数据。由于viSNE最多只能处理100000个事件,因此需要从分析中移除215名患者队列中的99.99%以上的粒子。
为了对从μFCM数据预测临床上显著的前列腺癌进行优化,将来自感兴趣区域的粒子浓度用作24种不同的机器学习算法的训练数据。对于LALS-PSMA、LALS-ghrelin和PSMA-ghrelin数据集,XGBoost提供了0.61、0.62和0.66的最高AUC(图5a)。所有随后的分析都使用PSMA-ghrelin数据集和XGBoost。
正如基于决策树的模型所预期的那样,FCM数据的单调变换并未提高XGBoost模型的性能(图9)。XGBoost可变增益图示出了对XGBoost模型精度最重要的感兴趣区域,表明许多不同的粒子群对XGBoost模型很重要(图10a)。具有较高可变增益的感兴趣区域大多与AUC图上显著高于和低于0.5的区域重叠,这表明在临床上显著的前列腺癌患者中具有较高和较低浓度的粒子群对模型很重要(图10b)。
将分箱策略改变为高于或低于32会导致AUC降低,这表明这种分辨率水平是预测临床上显著的前列腺癌的优选分辨率。产生越来越大的XGBoost模型集合能提高模型性能(图5c)。与单一的XGBoost模型相比,100个模型的集合使AUC提高了5%,模型变化性降低了95%。可产生更大的XGBoost集合以获得更高的模型性能,虽然如此小的精度优势也会有更高的处理/内存要求。网格搜索XGBoost参数和递归特征消除分别使XGBoost AUC提高了3%和5%(图5d)。将网格搜索、特征选择和集成相结合使XGBoost AUC显著提高了12%(p<0.05),这表明模型优化技术之间有附加的相互作用。PSMA-ghrelin数据集的Citrus和手动门控分析提供了明显较低的AUC,分别为0.52和0.59,相比之下,我们的优化的XGBoost模型为0.75(p<0.05)。当前的优化XGBoost模型也优于,作为临床上显著和非临床上显著的前列腺癌患者之间唯一显著不同的临床特征的前列腺特异性抗原(p=0.0015,表1)。
为了比较当前优化模型与用于预测临床上显著的前列腺癌的SOC,在采用或不采用我们的基于μFCM的XGBoost模型预测的条件下使用SOC产生了逻辑回归模型。在使用0.07332的截止概率时,来自SOC和μFCM模型的患者预测的瀑布图提供了89%的灵敏性和49%的特异性(图6a和表1)。向μFCM预测增加SOC可将AUC略微提高到0.76,这明显大于单独使用SOC时获得的0.68AUC值(p<0.05),证明了基于μFCM的XGBoost模型的临床价值(图6b)。
表2:前列腺癌等级组的患者特征
Figure BDA0002839628810000141
Figure BDA0002839628810000151
DRE,直肠指检;SOC,护理标准;CI,95%置信区间;ROC AUC,曲线下的受试者工作特征面积;PPV,阳性预测值;NPV,阴性预测值;
通过对215名患者的队列的进一步分析,观察到前列腺肥大(>40cc)的男性患前列腺癌的可能性明显较低,这意味着与前列腺大小正常的男性相比,前列腺肥大的男性接受不必要活检的比例更高。根据目前的临床实践,男性主要因前列腺特异性抗原水平高和/或直肠指检异常而接受前列腺活检。前列腺正常和肥大的男性中直肠指检异常的患者的比例相似(图6c),而前列腺肥大的男性中前列腺特异性抗原水平显著较高(p<0.05,图6d),这表明前列腺特异性抗原升高是导致不必要活检数量增加的原因。使用前列腺特异性抗原密度(前列腺特异性抗原数除以前列腺体积)对前列腺特异性抗原水平归一化可能不理想,因为前列腺肥大的男性的前列腺特异性抗原密度明显较低(图6e)。对于前列腺肥大的男性,临床上显著的前列腺癌的SOC+μFCM概率分值在非临床上显著和临床上显著的前列腺癌患者之间存在显著差异(p<0.0005,图6f),使用之前在表2中定义的概率截止阈值,100%和49%的临床上显著和非临床上显著的前列腺癌患者会分别被建议进行活检,这消除了大约一半的不必要活检,同时仍保持100%的检测临床上显著的前列腺癌的灵敏度(图6g)。
A.患者特征和样品采集
活检前血浆样品是从艾伯塔省前列腺癌研究计划(APCaRI)生物仓库获取的。纳入标准是以下的无前列腺癌诊断史的成年男性:(1)因前列腺问题被转诊到艾伯塔省的泌尿科诊所,并被安排进行前列腺活检;和(2)接受经尿道前列腺手术以诊断或治疗前列腺异常。所有患者都提供了书面知情同意书,该研究得到了前列腺癌中心(加拿大艾伯塔省卡尔加里)和北艾伯塔省泌尿学中心(加拿大艾伯塔省埃德蒙顿)的科学伦理委员会的批准。患者是在2014年6月至2015年9月期间登记的。按每名患者平均12个核心进行了经直肠超声引导的前列腺活检,并根据每个医院的标准操作程序进行评估。测试结果未提供给临床场点用于患者护理。获取患者样品并对其进行测试的实验室人员对患者特征不知情。根据机构标准的操作程序采集血液并进行处理以采集血浆,从手臂采集到-80℃冷冻器的时间为2小时以下。尤其是,血液样品是在临床级真空采血管中收集的。为了进行血浆制备,样品经过了两步离心过程。首先采用标准的1300xg离心10分钟,使血浆与其它血液成分分离,然后第二次采用1300xg离心10分钟以沉淀血小板。首先让在血清管中收集的血液凝结15-30分钟,然后进行单次1300xg×10分钟的离心步骤。
B.μFCM分析
将冷冻的血浆样品解冻,以16000xg离心30分钟以除去较大碎片和血小板颗粒,并与400微克/毫升的J591抗体和辅助的与Qdot565结合的驴抗小鼠IgG抗体的1/50最终稀释液一起孵育。样品还与含有Ghrelin的前18个氨基酸的0.025mM Ghrelin Cy5探针一起孵育。探针孵育30分钟后,将样品在双重过滤(0.22微米)的磷酸盐缓冲盐水中稀释100倍,并用Apogee A50微流式细胞仪以3.01微升/分钟的流速进行分析。样品运行时间最长为2分钟,或者直到记录了5000000个事件,以先到者为准。每个患者的血浆按一式三份运行。使用255.0.0.80版Histogram软件(Apogee Flow Systems)对μFCM数据进行常规手动门控分析。
C.处理μFCM数据
使用定制的MATLAB(R2017a版)脚本分析患者的μFCM fcs文件。除另有说明外,在每个fcs文件中,所有通道的信号强度都经过对数变换,并按每种光学特性使用32个箱对具有相似光学特性的粒子进行分箱。产生了三个不同的双变量粒子浓度直方图:1)大角度光散射(LALS)和PSMA染色强度、2)LALS和ghrelin探针染色强度、以及3)PSMA和ghrelin探针染色强度。每个双变量直方图包含1024个感兴趣区域(32x32个箱)。按每名患者三次重复的方式对每个感兴趣区域中的粒子浓度进行平均。
D.用μFCM数据预测和关联临床特征
使用μFCM数据预测二值临床特征(例如患者有或没有糖尿病、直肠指检正常或异常),并使用定制的MATLAB脚本分别与顺序或间隔的临床特征(例如肿瘤分期或前列腺特异性抗原)相关联。为了最大限度地减少自动分析所需的代码,产生了一个Excel说明文件,该说明文件描述如何为每种临床特征分析FCM数据。在该说明文件中,每种临床特征都是一个单独的列,每行都包含特定的信息或说明。具体信息包括临床特征在数据库中的位置、每种临床特征的数据类型(二值或顺序/间隔)、以及代表该临床特征的缺失数据的值。该说明主要涉及如何进行临床特征变换(包括对特征进行二值化时的阈值)、从格里森分数导出前列腺癌等级组、以及根据出生日期确定年龄。将缺少临床特征数据的患者从该临床特征的分析中移除。
一旦从数据库中获取到所有患者的临床特征数据并进行变换,就使用每个感兴趣区域的μFCM粒子浓度数据预测临床特征或与临床特征相关联。对于二值临床特征,为每个感兴趣区域确定受试者工作特征(ROC)曲线下的面积值,并为包括LALS-PSMA、LALS-ghrelin和PSMA-ghrelin在内的每个双变量数据集生成AUC图。对于顺序/间隔临床特征,为每个感兴趣区域确定皮尔逊相关系数,并为每个双变量数据集生成相关图。对每个AUC图中的最高的10%AUC值进行平均,并将这些值与临床特征进行比较。
E.μFCM数据的viSNE分析
使用运行在MATLAB(25)上的Cyt 2.0版软件产生了viSNE图。将每名患者的三份fcs文件连接成一个fcs文件。产生了两个新的fcs文件:一个使用来自2级以下的前列腺癌(非临床上显著的前列腺癌)患者的事件,另一个使用来自3级以上的前列腺癌(临床上显著的前列腺癌)患者的事件。这两个fcs文件总共有大约100000个事件,组中的每个患者的事件数量相等。使用Cyt软件对这两个fcs文件中的30000个事件进行随机二次采样和合并,以产生60000个事件,采用LALS、PSMA和ghrelin通道通过bh-SNE变换使用viSNE对这些事件进行可视化,并使用k均值和期望最大化高斯混合模型算法进行聚类。从Cyt导出viSNE结果,并使用Matlab的DensityClust函数采用快速搜索/密度峰值算法进行聚类(Rodriguez A和Laio A,Science 344(6191):1492-6,2014)。使用pdist2函数确定事件对的欧几里得距离。为了使用paraSet函数设定增量和ρ参数,将百分比相邻变量设置为2%,并使用高斯核。使用1.5到5之间的差值以及200到1900之间的ρ值选择聚类中心。对于所有的聚类算法,在60000个事件上产生了248个聚类。将临床上显著的前列腺癌的聚类纯度定义为临床上显著的前列腺癌事件数除以每个聚类内的事件总数。仅分析了具有至少60个粒子(占总粒子的0.1%)的聚类。
F.为预测临床上显著的前列腺癌优化机器学习模型
使用MATLAB的分类学习应用程序测试23种不同的机器学习算法,以使用粒子浓度μFCM数据预测临床上显著的前列腺癌。这些算法包括个体/袋装/增强决策树算法、线性/二次/三次/高斯支持向量机算法、逻辑回归、线性/二次/子空间判别分析和k近邻算法。还使用R中的‘xgboost’软件包(3.3.3版)测试了XGBoost。所有机器学习算法都使用默认设置和5重交叉验证,重复至少10次,在重复之间进行患者随机化。
然后,通过以下方式对具有最高AUC的机器学习算法进行优化:1)在处理μFCM数据时比较2、4、8、16、32、64和128个箱;2)使用相同的机器学习算法产生3、6、12、25、50和100个模型的集合,但是随机选择不同的患者子集作为训练数据并对模型预测结果进行平均;3)采用R‘caret’软件包使用递归特征消除法来选择μFCM感兴趣区域的最佳子集;并且4)采用下列网格搜索算法参数(XGBoost:nrounds=50、100、150、200、250、300、400;max_depth=3、4、5、6;eta=0.01、0.1;gamma=0;colsample_bytree=1;min_child_weight=1;subsample=1)。综合使用提供最高AUC的分箱/集成/特征/参数产生用于预测临床上显著的前列腺癌的最终模型。将该模型与使用Histogram软件的手动门控分析和使用R的默认设置的Citrus进行了比较。Citrus通过使用分层聚类和套索正则化逻辑回归以及最近缩小质心方法从流式细胞术数据预测临床状况(Bruggner RV等人,Proc Natl Acad Sci USA 111(26):E2770-7,2014)。
为了将护理标准(SOC)临床特征(包括前列腺特异性抗原、年龄、直肠指检、前列腺癌家族史、既往阴性活检和种族(黑人=1,其它种族=0))与最终的μFCM模型概率预测相结合,使用所有这些特征产生了逻辑回归模型。将此模型与未使用μFCM数据的类似逻辑回归模型进行了比较。
G.统计分析
除另有说明外,带误差条的条形图/点图代表平均值的平均±标准误差。在比较两组时,对间隔数据使用非配对的双尾t检验,对列联表使用费希尔精确检验。使用图基的多重比较检验通过单向ANOVA分析比较3个或更多组。使用R中的‘pROC’软件包通过德隆法比较ROC曲线。在可能的情况下,使用大约90%的灵敏度确定ROC截止值,使用6.01版GraphPadPrism软件判定获得的特异性和阳性/阴性预测值。
利用微流式细胞术通过分析超声处理样品的胞外囊泡开发循环肿瘤细胞检测检验
如图10所示,为了进行检验优化,对培养基中的100000个HeLa-GFP细胞进行孵育,并使其暴露于不同量的微泡和超声波。在超声处理之前和之后对培养基进行荧光胞外囊泡分析。为了测试检验灵敏度,将表达棕榈酰化GFP的0、1、5、10、100和1000个PC3前列腺癌细胞与1000000个HT1080细胞(背景)混合,并用微泡进行超声处理。在超声之前/之后通过微流式细胞仪分析培养基。
该检验具有比常规流式细胞术更高的理论信噪比的单癌细胞检测结果。≥15Mpa的超声波压力产生最大胞外囊泡,超声介导的胞外囊泡释放随着超声周期和微泡浓度线性地增加。
开发对光散射信号和荧光信号进行标准化的算法
如图11所示,记录了不同电压(300–400伏,+10伏增量)下来自校准珠的光散射信号。产生了光散射直方图,并将其直线地平移,以与在350伏下运行的珠子相匹配。将每个珠子的直方图峰值平移,以与在350伏下运行的珠子的相同峰值相匹配(非直线平移)。
使用前列腺特异性膜抗原对281名患者的血浆样品进行染色。使用固定的16×16分箱(LALS与PSMA)或使用利用动态荧光阈值识别对于PSMA呈阳性或阴性的粒子的算法处理数据,并根据PSMA阳性程度进一步分组。产生了XGBoost模型,以预测患有侵袭性前列腺癌(格里森4+3以上)的患者。用修正的荧光(x 0.125–256)对相同的数据应用模型,并计算AUC。
非线性光散射校准算法有助于校正样品中的光散射变化性。用动态荧光阈值处理数据有助于确保偏移数据的模型可靠性。随着时间的推移,这些标准化算法在许多诊所应用时将改善临床检验预测。

Claims (22)

1.一种诊断患者的疾病的方法,包括以下步骤:
将来自所述患者的样品与结合所关注的疾病的生物标志物的一种或多种探针一起孵育;
对所述样品进行微流式细胞术分析;
获得所述一种或多种生物标志物的信号强度,并且可选地获得与所述样品相关的一种或多种光学特性;
处理所述信号强度,并且若获得了所述一种或多种光学特性则处理所述一种或多种光学特性,以计算所述样品中的不同粒子表型的浓度;和
使用这些粒子表型的浓度作为机器学习算法的输入,以确定患者患有临床上显著的前列腺癌的概率。
2.一种识别疾病的疾病特征的方法,包括以下步骤:
将来自健康对象的样品和来自患有已知疾病的对象的样品与结合所关注的疾病的生物标志物的一种或多种探针一起孵育;
对样品进行微流式细胞术分析;
获得一种或多种生物标志物的信号强度,并且可选地获得与每个样品相关的一种或多种光学特性;
对来自所述一种或多种生物标志物的所述信号强度进行对数变换,并且若存在所述一种或多种光学特性则对所述一种或多种光学特性进行对数变换,以产生变换信号强度;
使用每个生物标志物信号的许多不同阈值对感兴趣区域(ROI)中的具有相似变换信号强度的粒子进行分箱;
在所述来自健康对象的样品与所述来自患有已知疾病的对象的样品之间对每个感兴趣区域中的粒子浓度数据进行比较;
从标志物的每个组合确定每个感兴趣区域的受试者工作特征(ROC)曲线值下的区域(AUC);和
选择提供最高AUC值的生物标志物的组合以获得疾病的疾病特征。
3.一种诊断患者体内的临床上显著的前列腺癌的方法,包括以下步骤:
将来自患者的样品与结合临床上显著的前列腺癌的生物标志物的一种或多种探针一起孵育;
对所述样品进行微流式细胞术分析;
获得一种或多种生物标志物的信号强度,并且可选地获得与所述样品相关的一种或多种光学特性;
处理信号强度,并且若获得了所述一种或多种光学特性则处理所述一种或多种光学特性,以计算所述样品中的不同粒子表型的浓度;和
使用这些粒子表型的浓度作为机器学习算法的特征(即,输入),以确定患者患有临床上显著的前列腺癌的概率。
4.如权利要求1或3所述的方法,其中所述处理包括:
对所述信号强度进行对数变换,以产生变换信号强度;和
对于每种光学特性,将具有相似变换信号强度的粒子分箱到感兴趣区域(ROI)中,其中每个感兴趣区域被视为一个不同的粒子表型。
5.如权利要求4所述的方法,其中所述对数变换和分箱步骤是同时发生的。
6.如权利要求4所述的方法,其中所述对数变换和分箱步骤是独立地发生的。
7.如权利要求4-6中任一项所述的方法,其中对粒子进行分箱包括对每种光学特性使用设定数量的箱进行分箱。
8.如权利要求2或4-6中任一项所述的方法,包括多个感兴趣区域。
9.如权利要求1或3所述的方法,其中粒子表型的确定是使用动态荧光阈值算法进行的,该算法通过以下步骤识别每个患者的每个粒子的生物标志物阳性状态:
对于每种生物标志物,对所有粒子的粒子信号数据使用核密度估计(KDE)函数进行拟合;
识别与生物标志物阴性粒子群的KDE图上的Y轴(粒子密度)上的最高区域相交的荧光值F1;
计算来自F1的许多不同的较高荧光信号强度的KDE曲线的斜率,以识别位于斜率最负处的第二荧光值F2;
计算分隔生物标志物阳性和阴性粒子的荧光强度值(Fs),该值等于F1+(2*(F2-F1))+F3,其中F3是增加的一个很小的任意荧光强度值,用于确保生物标志物阴性粒子不被分类为生物标志物阳性粒子;
根据粒子是具有高于Fs(生物标志物阳性)还是低于Fs(生物标志物阴性)的生物标志物信号确定所有粒子的生物标志物阳性状态;
根据粒子的光散射强度将粒子分箱到不同的估计尺寸组中;和
通过生物标志物阳性和光散射组的所有可能的组合来确定粒子表型。
10.如权利要求1-9中任一项所述的方法,其中所述机器学习算法是个体/袋装/增强决策树算法、线性/二次/三次/高斯支持向量机算法、逻辑回归、线性/二次/子空间判别分析或k近邻算法。
11.如权利要求10所述的方法,其中所述机器学习算法是增强决策树算法。
12.如权利要求11所述的方法,其中所述增强决策树算法是XGBoost算法。
13.如权利要求12所述的方法,其中所述极端梯度增强决策树算法包括具有平均化的输出概率的至少100个模型的集合。
14.如权利要求3所述的方法,其中所述预测分数包括护理分数的标准。
15.如权利要求3所述的方法,其中所述一种或多种生物标志物选自表1。
16.如权利要求1或2所述的方法,其中所述一种或多种生物标志物选自表2。
17.如权利要求1-16中任一项所述的方法,其中所述样品是血清样品。
18.如权利要求1-16中任一项所述的方法,其中所述样品是血浆样品。
19.如权利要求1-16中任一项所述的方法,其中所述样品是尿液样品。
20.如权利要求1-16中任一项所述的方法,其中所述样品是精液样品。
21.如权利要求1或3所述的方法,其中能够使用传统的流式细胞术来代替微流式细胞术。
22.如权利要求1或3所述的方法,其中使用与如前列腺特异性生物标志物之类的组织特异性生物标志物和/或如ghrelin之类的癌症特异性生物标志物和/或如聚唾液酸之类的结果特异性生物标志物结合的探针混合物。
CN201980040523.XA 2018-04-27 2019-04-26 使用微流式细胞术诊断疾病的方法 Pending CN112313497A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CA3,003,032 2018-04-27
CA3003032A CA3003032A1 (en) 2018-04-27 2018-04-27 Methods of diagnosing disease using microflow cytometry
PCT/CA2019/050541 WO2019204940A1 (en) 2018-04-27 2019-04-26 Methods of diagnosing disease using microflow cytometry

Publications (1)

Publication Number Publication Date
CN112313497A true CN112313497A (zh) 2021-02-02

Family

ID=68293427

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980040523.XA Pending CN112313497A (zh) 2018-04-27 2019-04-26 使用微流式细胞术诊断疾病的方法

Country Status (9)

Country Link
US (1) US20210048383A1 (zh)
EP (1) EP3785014A4 (zh)
JP (1) JP7451424B2 (zh)
CN (1) CN112313497A (zh)
AU (1) AU2019259581A1 (zh)
BR (1) BR112020021779B1 (zh)
CA (2) CA3003032A1 (zh)
CL (1) CL2020002768A1 (zh)
WO (1) WO2019204940A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113218848A (zh) * 2021-04-30 2021-08-06 天津深析智能科技发展有限公司 一种判断非特异细胞群的方法
CN113380318A (zh) * 2021-06-07 2021-09-10 天津金域医学检验实验室有限公司 人工智能辅助流式细胞术40cd免疫表型检测方法及系统
CN114018789A (zh) * 2021-10-08 2022-02-08 武汉大学 基于成像流式细胞检测和机器学习的急性白血病分型方法
CN115294191A (zh) * 2022-10-08 2022-11-04 武汉楚精灵医疗科技有限公司 基于电子内镜的标志物尺寸测量方法、装置、设备及介质

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7428505B2 (ja) * 2019-11-19 2024-02-06 富士レビオ株式会社 コンピュータプログラム、学習モデル生成方法及び情報処理装置

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6025128A (en) * 1994-09-29 2000-02-15 The University Of Tulsa Prediction of prostate cancer progression by analysis of selected predictive parameters
US6140065A (en) * 1997-09-05 2000-10-31 Dianon Systems, Inc. Methods for diagnosing benign prostatic diseases and prostatic adenocarcinoma using an algorithm
US20040265874A1 (en) * 2000-10-17 2004-12-30 Bio-Rad Laboratories, Inc. Pattern recognition method for diagnosis of systemic autoimmune diseases
CN101479599A (zh) * 2006-05-01 2009-07-08 曾罗维斯塔诊断学有限责任公司 使用生物标记鉴别疾病状态的方法和设备
JP2010256132A (ja) * 2009-04-23 2010-11-11 Okayama Univ 糖尿病性腎症の進行度の検出方法及び糖尿病性腎症の進行度の診断キット並びに糖尿病性腎症の進行度の指標となる物質及びその選別方法
CN103502473A (zh) * 2011-03-01 2014-01-08 耶鲁大学 胃肠胰神经内分泌肿瘤(gep-nen)的预测
US20150247149A1 (en) * 2012-08-13 2015-09-03 The Regents Of The University Of California Detecting and Treating Liver Damage
US20160169786A1 (en) * 2014-12-10 2016-06-16 Neogenomics Laboratories, Inc. Automated flow cytometry analysis method and system
CN105764490A (zh) * 2013-09-24 2016-07-13 加利福尼亚大学董事会 用于生物测定和诊断的胶囊封装的传感器和感测系统及其制造和使用方法
CN105934240A (zh) * 2014-01-21 2016-09-07 安杰瑞姆生物科学公司 杂交体、包含该杂交体的组合物、它们的制备方法及用途
US20180067134A1 (en) * 2016-09-08 2018-03-08 UNIVERSITé LAVAL Erythrocyte-derived extracellular vesicles as a biomarker for clinically assessing parkinson's disease
CN107850600A (zh) * 2015-07-22 2018-03-27 美侬米克国际有限公司 用于前列腺疾病的生物标记物组合

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1285365A4 (en) * 2000-03-28 2004-01-21 Dana Farber Cancer Inst Inc MOLECULAR DATABASE FOR ANTIBODY CHARACTERIZATION
WO2004099432A2 (en) * 2003-05-02 2004-11-18 The Johns Hopkins University Identification of biomarkers for detecting pancreatic cancer
US20060195266A1 (en) * 2005-02-25 2006-08-31 Yeatman Timothy J Methods for predicting cancer outcome and gene signatures for use therein
US20070009970A1 (en) * 2005-07-08 2007-01-11 Predicant Biosciences, Inc. Biological patterns for diagnosis and treatment of cancer
US20080133141A1 (en) * 2005-12-22 2008-06-05 Frost Stephen J Weighted Scoring Methods and Use Thereof in Screening
EP2089712A4 (en) * 2006-11-22 2010-09-22 Life Technologies Corp BIOMARKERS OF AUTOIMMUNE DISEASES
US20130095575A1 (en) * 2011-10-03 2013-04-18 The Board Of Trustees Of The Leland Stanford Junior University Methods for Fractionation, Analysis and Collection of Microvesicles From Patient Samples
SG10201912312YA (en) * 2012-01-31 2020-02-27 Genomic Health Inc Gene expression profile algorithm and test for determining prognosis of prostate cancer
WO2013155633A1 (en) * 2012-04-19 2013-10-24 Leong Hon Sing Method for detecting or monitoring prostate cancer
US9040504B2 (en) * 2013-01-10 2015-05-26 VenatoRx Pharmaceuticals, Inc. Beta-lactamase inhibitors
WO2017053592A1 (en) * 2015-09-23 2017-03-30 The Regents Of The University Of California Deep learning in label-free cell classification and machine vision extraction of particles
US10731166B2 (en) * 2016-03-18 2020-08-04 Caris Science, Inc. Oligonucleotide probes and uses thereof
EP3443125B1 (en) * 2016-04-15 2023-09-06 Octave Bioscience, Inc. Methods for assessment of multiple sclerosis activity
WO2018075825A1 (en) * 2016-10-19 2018-04-26 Northwestern University Extracellular vesicle-based diagnostics and engineered exosomes for targeted therapeutics against cancer
US9934364B1 (en) * 2017-02-28 2018-04-03 Anixa Diagnostics Corporation Methods for using artificial neural network analysis on flow cytometry data for cancer diagnosis

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6025128A (en) * 1994-09-29 2000-02-15 The University Of Tulsa Prediction of prostate cancer progression by analysis of selected predictive parameters
US6140065A (en) * 1997-09-05 2000-10-31 Dianon Systems, Inc. Methods for diagnosing benign prostatic diseases and prostatic adenocarcinoma using an algorithm
US20040265874A1 (en) * 2000-10-17 2004-12-30 Bio-Rad Laboratories, Inc. Pattern recognition method for diagnosis of systemic autoimmune diseases
CN101479599A (zh) * 2006-05-01 2009-07-08 曾罗维斯塔诊断学有限责任公司 使用生物标记鉴别疾病状态的方法和设备
BRPI0711148A2 (pt) * 2006-05-01 2011-08-23 Provista Diagnostics Llc métodos e aparelho para identificar status de doença utilizando biomarcadores
JP2010256132A (ja) * 2009-04-23 2010-11-11 Okayama Univ 糖尿病性腎症の進行度の検出方法及び糖尿病性腎症の進行度の診断キット並びに糖尿病性腎症の進行度の指標となる物質及びその選別方法
CN103502473A (zh) * 2011-03-01 2014-01-08 耶鲁大学 胃肠胰神经内分泌肿瘤(gep-nen)的预测
US20150247149A1 (en) * 2012-08-13 2015-09-03 The Regents Of The University Of California Detecting and Treating Liver Damage
CN105764490A (zh) * 2013-09-24 2016-07-13 加利福尼亚大学董事会 用于生物测定和诊断的胶囊封装的传感器和感测系统及其制造和使用方法
CN105934240A (zh) * 2014-01-21 2016-09-07 安杰瑞姆生物科学公司 杂交体、包含该杂交体的组合物、它们的制备方法及用途
US20160169786A1 (en) * 2014-12-10 2016-06-16 Neogenomics Laboratories, Inc. Automated flow cytometry analysis method and system
CN107850600A (zh) * 2015-07-22 2018-03-27 美侬米克国际有限公司 用于前列腺疾病的生物标记物组合
US20180067134A1 (en) * 2016-09-08 2018-03-08 UNIVERSITé LAVAL Erythrocyte-derived extracellular vesicles as a biomarker for clinically assessing parkinson's disease

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
COLLEEN N. BIGGS等: "Prostate extracellular vesicles in patient plasma as a liquid biopsy platform for prostate cancer using nanoscale flow cytometry", 《ONCOTARGET》, vol. 7, no. 8, 22 January 2016 (2016-01-22), pages 8839 - 8849, XP055437319, DOI: 10.18632/oncotarget.6983 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113218848A (zh) * 2021-04-30 2021-08-06 天津深析智能科技发展有限公司 一种判断非特异细胞群的方法
CN113218848B (zh) * 2021-04-30 2022-08-12 天津深析智能科技发展有限公司 一种判断非特异细胞群的方法
CN113380318A (zh) * 2021-06-07 2021-09-10 天津金域医学检验实验室有限公司 人工智能辅助流式细胞术40cd免疫表型检测方法及系统
CN114018789A (zh) * 2021-10-08 2022-02-08 武汉大学 基于成像流式细胞检测和机器学习的急性白血病分型方法
CN115294191A (zh) * 2022-10-08 2022-11-04 武汉楚精灵医疗科技有限公司 基于电子内镜的标志物尺寸测量方法、装置、设备及介质

Also Published As

Publication number Publication date
EP3785014A1 (en) 2021-03-03
WO2019204940A1 (en) 2019-10-31
EP3785014A4 (en) 2022-01-26
US20210048383A1 (en) 2021-02-18
BR112020021779A2 (pt) 2021-02-23
BR112020021779B1 (pt) 2023-03-07
CL2020002768A1 (es) 2021-05-28
JP2021522503A (ja) 2021-08-30
CA3050256C (en) 2023-09-05
JP7451424B2 (ja) 2024-03-18
AU2019259581A1 (en) 2020-11-26
CA3050256A1 (en) 2019-10-27
CA3003032A1 (en) 2019-10-27

Similar Documents

Publication Publication Date Title
CN112313497A (zh) 使用微流式细胞术诊断疾病的方法
US11967410B2 (en) Biodosimetry panels and methods
CA2516795C (en) Circulating tumor cells (ctc&#39;s): early assessment of time to progression,_survival and response to therapy in metastatic cancer patients
EP1861509B1 (en) A method for predicting progression free and overall survival at each follow-up time point during therapy of metastatic breast cancer patients using circulating tumor cells
CN115060882A (zh) 用非稀有细胞检测稀有细胞的方法
CN103314298B (zh) 用于检测膀胱癌和/或膀胱的炎性疾病的新型标志物
US20090061456A1 (en) Method for predicting progression free and overall survival at each follow-up time point during therapy of metastatic breast cancer patients using circulating tumor cells
JP6485759B2 (ja) 末梢循環腫瘍細胞単位の悪性度の検出方法及びそのキット
EP3090264B1 (en) Circulating tumor cell diagnostics for lung cancer
JP2019502384A (ja) 疾患の不均一性を特徴づけるための転移性疾患における、循環腫瘍細胞(ctc)の単一細胞ゲノムプロファイリング
US20170059581A1 (en) Methods for diagnosis and prognosis of inflammatory bowel disease using cytokine profiles
JP2022512890A (ja) 試料の品質評価方法
WO2020081582A1 (en) Methods of diagnosing cancer using multiple artificial neural networks to analyze flow cytometry data
CN112748191A (zh) 诊断急性疾病的小分子代谢物生物标志物及其筛选方法和应用
CN108474798A (zh) 表征细胞特异性微囊泡的方法
CN108646034B (zh) 细胞群中的稀有细胞判读方法
CN110139656A (zh) 作为膀胱癌的生物标志物的角蛋白17
WO2024183369A1 (zh) Cited4和/或metrn在椎间盘退变程度的鉴别诊断中的应用
CN108603233A (zh) 转移性疾病中循环肿瘤细胞(ctc)的单细胞基因组图谱分析以表征疾病异质性
WO2019232361A1 (en) Personalized treatment of pancreatic cancer
US20180195105A1 (en) Examination system, examination device, and examination method
JP2012022002A (ja) 循環腫瘍細胞を用いる転移性乳癌患者の療法中の各追跡期間ポイントでの無増悪および全生存を予測する方法
WO2023246808A1 (zh) 利用癌症中剪接异常的短外显子辅助癌症诊断和预后
WO2016075232A1 (en) Gene signature associated with tolerance to renal allograft
CN117887856A (zh) 一种结直肠癌的诊断生物标志物及检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination