CN115023609A - 早期非小细胞肺癌的诊断方法 - Google Patents

早期非小细胞肺癌的诊断方法 Download PDF

Info

Publication number
CN115023609A
CN115023609A CN202080086593.1A CN202080086593A CN115023609A CN 115023609 A CN115023609 A CN 115023609A CN 202080086593 A CN202080086593 A CN 202080086593A CN 115023609 A CN115023609 A CN 115023609A
Authority
CN
China
Prior art keywords
metabolite
phase
subject
equation
lung cancer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080086593.1A
Other languages
English (en)
Inventor
纳斯德·艾哈迈德·M·卜克思
大卫·维沙特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Biomark Cancer Systems Inc
Original Assignee
Biomark Cancer Systems Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Biomark Cancer Systems Inc filed Critical Biomark Cancer Systems Inc
Publication of CN115023609A publication Critical patent/CN115023609A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • G01N33/57423Specifically defined cancers of lung
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/88Integrated analysis systems specially adapted therefor, not covered by a single one of the groups G01N30/04 - G01N30/86
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57484Immunoassay; Biospecific binding assay; Materials therefor for cancer involving compounds serving as markers for tumor, cancer, neoplasia, e.g. cellular determinants, receptors, heat shock/stress proteins, A-protein, oligosaccharides, metabolites
    • G01N33/57488Immunoassay; Biospecific binding assay; Materials therefor for cancer involving compounds serving as markers for tumor, cancer, neoplasia, e.g. cellular determinants, receptors, heat shock/stress proteins, A-protein, oligosaccharides, metabolites involving compounds identifable in body fluids
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/92Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving lipids, e.g. cholesterol, lipoproteins, or their receptors
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/62Detectors specially adapted therefor
    • G01N30/72Mass spectrometers

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Immunology (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Molecular Biology (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • Biomedical Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Cell Biology (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Oncology (AREA)
  • Hospice & Palliative Care (AREA)
  • Biophysics (AREA)
  • Endocrinology (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本公开涉及一种诊断癌症的方法,具体而言,涉及一种通过测量血清和血浆中的代谢物生物标志物来诊断早期非小细胞肺癌的方法。在一些方面,该方法包括确定来自包括β‑羟基丁酸、LysoPC 20:3、PC ae C40:6、柠檬酸、肉碱和延胡索酸的组的代谢物浓度。在一些方面,所述方法包括确定来自包含β‑羟基丁酸、LysoPC 20:3、亚精胺和延胡索酸的组的代谢物的浓度。

Description

早期非小细胞肺癌的诊断方法
相关申请
本申请要求美国专利申请号62/916,486,其内容通过引用并入本文。
技术领域
本公开涉及一种诊断癌症的方法,尤其涉及一种通过测量血清和血浆中的代谢物生物标志物来诊断早期非小细胞肺癌的方法。
技术背景
肺癌是全世界与癌症相关的死亡的主要原因。用于肺癌早期检测的敏感、准确策略对于改善肺癌生存统计数据至关重要。不幸的是,目前检测或筛查肺癌的方法并不理想。尽管低剂量计算机断层扫描(LDCT)已被证明可以降低肺癌死亡率,但广泛的临床实施受到各种技术和社会经济挑战的阻碍。因此,开发一种用于早期肺癌检测的低成本、微创检测方法将显著改善目前的状况。
2016年12月29日公开的国际专利申请公开号WO2016/205960公开了一种用于检测肺癌的血清试验的生物标志物组,其检测生物标志物,该生物标志物选自缬氨酸、精氨酸、鸟氨酸、甲硫氨酸、亚精胺、精胺、二乙酰精胺、00:2、PC aa C32:2、PC ae C36:0和PC aeC44:5;和lysoPC a 08:2,或者其组合的生物标志物组。
本公开的内容
本公开的方面涉及一种方法,该方法包括测定来自受试者的生物样品中一组代谢物的每种代谢物的浓度,其中该组代谢物包括:β-羟基丁酸、LysoPC 20:3、PC ae C40:6、柠檬酸、肉碱和延胡索酸;β-羟基丁酸、LysoPC 20:3、PC ae C40:6和延胡索酸;或β-羟基丁酸、PC ae C40:6、柠檬酸和肉碱。在各种实施例中,所公开的方法是诊断非小细胞肺癌的方法,并且在具体实施例中,是诊断I期或II期非小细胞肺癌的方法。
本公开的方面涉及一种方法,该方法包括测定来自受试者的生物样品中一组代谢物的每种代谢物的浓度,其中,该组代谢物包括β-羟基丁酸、LysoPC 20:3、延胡索酸和精胺。在各种实施例中,所公开的方法是诊断非小细胞肺癌的方法,并且在特定实施例中,是诊断I期非小细胞肺癌的方法。
本公开的方面涉及一旦根据如本文所述的方法诊断为非小细胞肺癌患者的治疗。
附图的简要说明
图1a是二维偏最小二乘判别分析(PLS-DA)图,其显示健康对照(左侧阴影区域所示)与I期NSCLC患者(右侧阴影区域所示)采集的血浆代谢物数据之间的比较;
图1b是变量投影重要性分析(VIP)图,其显示了健康对照与I期NSCLC患者的最有区别的代谢物。方框表示对照与病例中代谢物浓度是增加(圈出)还是减少(未圈出);
图2a是二维偏最小二乘判别分析(PLS-DA)图,其显示了健康对照(左侧阴影区域所示)与所有阶段NSCLC患者(右侧阴影区域所示)采集的血浆代谢物数据之间的比较。健康对照与所有阶段NSCLC的PLS-DA结果;
图2b是变量投影重要性分析(VIP)图,其显示健康对照与所有阶段NSCLC患者的最有区别的代谢物。方框表示对照与病例中代谢物浓度是增加(圈出)还是减少(未圈出);
图3a是由用于诊断I期NSCLC患者的仅代谢物逻辑回归模型生成的受试者工作特征(ROC)曲线。ROC曲线及其在发现集上的95%CI用曲线显示。从验证集获得的ROC曲线显示为类似阶梯函数的线;
图3b是由用于诊断I期NSCLC患者的代谢物+吸烟史逻辑回归模型生成的受试者工作特征(ROC)曲线。ROC曲线及其在发现集上的95%CI用曲线显示。从验证集获得的ROC曲线显示为类似阶梯函数的线;
图4a是由具有不同数量的代谢物特征的用于I期NSCLC患者的随机森林探索模型生成的受试者工作特征(ROC)曲线。每个模型中代谢物特征的数量表示为Var。在左下角的框中;
图4b是变量投影重要性分析(VIP)图,其显示了健康对照与I期NSCLC患者最常选择的代谢物(特征数=5)。方框表示对照与病例中代谢物浓度是增加(圈出)还是减少(未圈出);
图5a是二维偏最小二乘判别分析(PLS-DA)图,其显示了健康对照(左侧阴影区域所示)与II期NSCLC患者(右侧阴影区域所示)采集的血浆代谢物数据之间的比较;
图5b是变量投影重要性分析(VIP)图,其显示了健康对照与II期NSCLC患者最有区别的代谢物。方框表示对照与病例中代谢物浓度是增加(圈出)还是减少(未圈出);
图6a是II期INSCLC患者的随机森林探索模型生成的受试者工作特征(ROC)曲线;
图6b是变量投影重要性分析(VIP)图,其显示了II期INSCLC患者最常选择的代谢物(特征数=5)。方框表示对照与病例中代谢物浓度是增加(圈出)还是减少(未圈出);
图7a是由用于诊断II期NSCLC患者的仅代谢物逻辑回归模型生成的受试者操作特征(ROC)曲线。每个模型中代谢物特征的数量表示为Var。在左下角的框中。ROC曲线及其在发现集上的95%CI用曲线显示。从验证集获得的ROC曲线显示为类似阶梯函数的线;
图7b是由用于诊断II期NSCLC患者的代谢物+吸烟史逻辑回归模型生成的受试者工作特征(ROC)曲线。ROC曲线及其在发现集上的95%CI用曲线显示。从验证集获得的ROC曲线显示为类似阶梯函数的线;
图8a是二维主成分分析(PCA)得分图,其显示了健康对照(显示在底部的阴影区域)与所有阶段的NSCLC患者(显示在顶部的阴影区域)采集的血浆代谢物数据之间的比较;
图8b是偏最小二乘判别分析(PLS-DA)图,其显示了健康对照(左侧阴影区域所示)与所有阶段NSCLC患者(右侧阴影区域所示)采集的血浆代谢物数据之间的比较;
图8c是变量投影重要性分析(VIP)图,其显示了健康对照与所有阶段NSCLC患者采集的血浆代谢物数据之间的比较。最具鉴别力的代谢物以系数得分的降序显示。方框表示对照与病例中代谢物浓度是增加(圈出)还是减少(未圈出);
图9a是由用于诊断早期(I+II期)NSCLC患者的仅代谢物逻辑回归模型生成的受试者工作特征(ROC)曲线。ROC曲线及其在发现集上的95%CI用曲线显示。从验证集获得的ROC曲线显示为类似阶梯函数的线;
图9b是由用于诊断早期(I+II期)NSCLC患者的代谢物+吸烟史逻辑回归模型生成的受试者工作特征(ROC)曲线。ROC曲线及其在发现集上的95%CI用曲线显示。从验证集获得的ROC曲线显示为类似于阶梯函数的线。
图10是偏最小二乘判别(PLS-DA)分析图,其显示了与健康对照相比,来自I期肺癌患者的血清样品的定量MS代谢物分析的二维得分图;
图11是变量投影重要性分析(VIP)分析图,以重要性降序排列区分血清代谢物。该图来自PLS-DA,并按照对I期癌症分类的重要性顺序对代谢物进行排序。高于85的系数的变量重要性图(VIP)得分(x轴)表明代谢物非常显著。右图显示了特定代谢物在肺癌中相对于健康对照是增加还是减少。所以LysoPC-20:3在肺癌中增加,而精胺在肺癌中死亡;
图12是来自I期肺癌患者血清中肺癌代谢物的受试者工作特征(ROC)分析,包括来自图11所示血清样品的VIP分析的四种最重要的代谢物;以及
图13是模型中所包括的具有吸烟状态的I期肺癌患者的肺癌代谢物(图11中显示的血清样品中VIP分析的四种最重要的代谢物)的受试者工作特征(ROC)分析。ROC分析的置换检验(重复1000次)表明该结果具有显著性,p值<0.001。
定义
如本文所用,“吸烟者”包括疾病控制和预防中心(“CDC”)的国家卫生统计中心(“NCHS”)的“烟草词汇表”中定义的“当前吸烟者”和“曾经吸烟者”。
如本文所用的“非吸烟者”则不是如上定义的“吸烟者”的受试者,包括“从不吸烟者”。如本文所用,“吸烟量”是通过将吸烟时间(以天为单位)乘以每日吸烟量(支/天)计算的值。
详细说明
公开了一组用于检测早期非小细胞肺癌(NSCLC)的高性能(AUC>0.9)血浆代谢物生物标志物。血浆样本来自156名活检确诊的NSCLC患者以及来自60名健康对照的年龄和性别匹配的血浆样本。临床数据和吸烟史也可用于所有样本。对所有216个血浆样品进行了完全定量的靶向质谱(MS)分析(直接进样/LC和串联MS)。随机选择三分之二的样本用于发现,三分之一用于验证。代谢物浓度数据、临床数据和吸烟史用于确定最佳生物标志物组和最佳回归模型,以使用发现组识别NSCLC的不同阶段。在验证模型上使用和评估相同的生物标志物和回归模型。
在这些血浆样品中平均有103种代谢物被量化。单变量和多变量统计分析确定了β-羟基丁酸、LysoPC 20:3、PC ae C40:6、柠檬酸和延胡索酸在健康对照和I/II期NSCLC之间存在显著差异。使用这些代谢物和其他易于测量的临床数据开发并验证了具有曲线下面积(AUC)>0.9的稳健预测模型,用于检测不同阶段的NSCLC。
存档的血浆样品从IUCPQ(魁北克大学心脏病学和肺病学研究所)组织库获得,该组织库是加拿大魁北克省的魁北克-桑特研究基金的呼吸健康网络组织库的所在地。将200-400μL血浆的冷冻(-80℃)等分试样组装并运送到加拿大阿尔伯塔大学的代谢组学创新中心(TMIC)进行定量代谢组学分析。血浆样本采集自156名经活检证实和活检分级为NSCLC的患者和60名年龄和性别特征相当的健康对照。健康对照组包括吸烟者和非吸烟者。癌症样本具有关于癌症分期、肺癌组织学、年龄、体重、身高、体重指数、吸烟状况(从不/以前/现在)、吸烟史(支/天和以年为单位的吸烟时间)、性别、生存史、医疗状况史、癌症个人史、肺部疾病状态、治疗、肿瘤大小(以毫米为单位)、肿瘤分级、阳性结节的细节,以及每个癌症患者的经胸穿刺活检、经支气管活检、支气管内活检收集的数据活检、支气管肺泡灌洗、支气管刷洗、支气管抽吸、支气管内超声、经食道超声心动图、骨显像、腹部超声、腹部CT扫描、胸部CT扫描、脑CT扫描、胸部X射线、纵隔镜检查、胸部MRI、脑MRI和PET扫描的详细数据。健康对照具有关于年龄、体重、身高、体重指数、吸烟状况(从不/以前/现在)、吸烟史(支/天和以年为单位的吸烟时间)和医疗状况史的数据。具有任何肝脏或肾脏疾病病史的患者(和对照组),以及之前接受过任何抗肿瘤药物治疗的患者都被排除在该队列之外。
OptimaTM LC/MS级甲酸和HPLC级水购自Fisher Scientific(Ottawa,ON,CA)。68种纯参考标准化合物购自Sigma-Aldrich(Oakville,ON,CA)。OptimaTM LC/MS级乙酸铵、异硫氰酸苯酯(PITC)、3-硝基苯肼(3-NPH)、1-乙基-3-(3-二甲氨基丙基)碳二亚胺(EDC)和丁基羟基甲苯(BHT)、HPLC级吡啶、HPLC级甲醇、HPLC级乙醇和HPLC级乙腈(ACN)也购自Sigma-Aldrich(Oakville,ON,CA)。44种2H、13C和15N标记化合物,用作氨基酸、生物胺、肉碱及其衍生物、磷脂酰胆碱及其衍生物的内部定量标准,购自剑桥同位素实验室公司(CambridgeIsotope Laboratories,Inc.)(Tewksbur,MA,美国)。3-(3-羟基苯基)-3-羟基丙酸(HPHPA)和13C标记的HPHPA是内部合成的,如Khaniani等人在“一种简单方便的未标记和13C标记3-(3-羟基苯基)-3-羟基丙酸的合成及其在人体尿液样品中的定量分析”,代谢物,2018,8(4):80(Khaniani et al.,“A Simple and Convenient Synthesis of Unlabeled and13C-Labeled 3-(3-Hydroxyphenyl)-3-Hydroxypropionic Acid and ItsQuantification in Human Urine Samples”,Metabolites,2018,8(4):80.),中所描述的那样。所有其他标准品,包括乳酸、β-羟基丁酸、α-酮戊二酸、柠檬酸、丁酸、异丁酸、丙酸、对羟基马尿酸、琥珀酸、延胡索酸、丙酮酸、马尿酸、甲基丙二酸、高香草酸、吲哚-3-乙酸、尿酸及其同位素标记的标准品均购自Sigma-Aldrich(加利福尼亚州奥克维尔)。Multiscreen“solvinert”滤板(疏水,PTFE,0.45pm,透明,非无菌)和
Figure BDA0003693064290000061
96 DeepWellTM Sigma-Aldrich(Oakville,ON,CA)。
所有固体化学品在CPA225D半微量电子天平(Sartorius,USA)上小心称重,精度为0.0001g。通过将精确称重的固体溶解在水中来制备每种化合物的储备溶液。通过用水混合和稀释相应的储备溶液获得校准曲线标准。对于氨基酸、生物胺、碳水化合物、肉碱及其衍生物、磷脂酰胆碱及其衍生物,同位素标记化合物的储备溶液也以相同方式制备。还通过将所有制备的同位素标记储备溶液混合在一起制成在水中的工作内标(ISTD)溶液混合物。对于有机酸,通过将准确称重的固体溶解在75%甲醇水溶液中制备同位素标记化合物的储备溶液。通过混合和稀释所有同位素标记的储备溶液,制备在75%甲醇水溶液中的工作内标(ISTD)溶液混合物。将所有标准溶液等分并储存在-80℃直至进一步使用。
一种靶向的、基于MS的定量代谢组学方法用于使用直接注射(DI)质谱(MS)和反相高效液相色谱(HPLC)串联质谱(MS/多发性硬化症)。这种96孔板半自动测定与ABI 4000Q-Trap(Applied Biosystems/MDS Sciex)质谱仪相结合,可用于靶向鉴定和定量多达138种不同的内源性代谢物,包括氨基酸、有机酸、生物胺、酰基肉碱、甘油磷脂、鞘脂和糖。该方法结合了138种分析物的衍生化和提取,以及使用多反应监测(MRM)对的选择性质谱检测。同位素标记的内标和其他内标集成到放置在96孔板内的特殊滤芯中,用于精确的代谢物定量。该测定使用上部96深孔板,下方使用密封胶带附有96孔滤板。上板的前14个孔用于质量控制和校准。第一个孔用作双空白,三个孔包含空白样品,七个孔包含参考化合物标准,三个孔包含质量控制样品。
简而言之,将血浆样品在冰上(在黑暗中)解冻并涡旋并在18,000ref(相对离心力或者×g)下离心。将10μL的每个样品加载到上96孔套件板上的滤芯中心,并在氮气流中干燥。随后,将PITC添加到每个(板的)孔中用于胺衍生化。温育后,使用蒸发器干燥滤芯。然后通过添加含有5mM乙酸铵的300μL甲醇来提取代谢物。通过双板系统的离心(50ref 5分钟)获得提取物。这允许上部96孔板的内容物流入下部96深孔板。为了分析生物胺和氨基酸,提取物随后用水稀释。为了分析糖、肉碱和脂质,提取物用甲醇稀释。在配备有
Figure BDA0003693064290000071
4000串联质谱仪(加利福尼亚佛斯特市的应用生物系统/MDS分析技术公司(Applied Biosystems/MDS Analytical Technologies,Foster City,CA))的HPLC(美国圣克拉拉的安捷伦科技公司,安捷伦1100HPLC(Agilent 1100 HPLC,Agilent Technologies,Santa Clara,US))上进行稀释提取物的质谱分析。
对于有机酸的分析,将50μL血浆样品与ISTD混合溶液和冰冷的甲醇充分混合,然后在20℃的冰箱中放置过夜以沉淀蛋白质。从冰箱中取出样品后,将所有试管以18,000rpm的转速离心20分钟(以旋转蛋白质沉淀物)。然后将上清液转移到96孔板系统的每个孔中,然后分别加入25μL以下三种试剂:3-NPH(250mM甲醇溶液)、EDC(150mM甲醇溶液)和吡啶2小时衍生反应。衍生化反应完成后,加入水和BHT溶液(2mg/mL的甲醇溶液)以稀释和稳定最终溶液。将10μL注入配备有
Figure BDA0003693064290000081
4000质谱仪的HPLC进行LC-MS/MS分析。
遵循推荐的用于标准定量代谢组学分析的统计程序。特别是,缺失值超过50%(在所有组中)的代谢物被从进一步分析中删除。对于缺失值比例低于50%的代谢物,其数值通过使用该代谢物最小浓度值的一半来进行估算。中值归一化、对数变换和自动缩放(以均值为中心并除以每个变量的标准差)用于数据缩放和归一化。通过Shapiro-Wilk检验检查特征正态性,p值阈值设置为0.05。连续数据和分类数据的单变量分析分别通过学生t检验和Fisher精确检验进行。使用MetaboAnalyst进行主成分分析(PCA)和偏最小二乘判别分析(PLS-DA)。进行了1000倍置换测试,以尽量减少观察到的PLS-DA分离是偶然的可能性。
使用Lasso特征选择算法的逻辑回归来开发使用代谢物和临床变量的NSCLC分期的预测模型。对于这些回归研究,随机选择三分之二的样本(40个对照,40-94个癌症样本,取决于分期)作为发现集。对所有发现/训练集模型进行了10倍交叉验证。一旦确定了每个癌症阶段预测因子的最佳回归模型,剩下的三分之一的样本(20个对照和20-62个癌症样本,用作保留集)用于验证每个相应的回归模型。使用MetaboAnalyst计算所有发现和验证集以及所有模型的受试者工作特征曲线下面积(AUC)、敏感性/特异性和95%置信区间。
通过我们的定量LC-MS方法测试了总共138种不同的代谢物。由于它们的丰度低,35种代谢物因缺失值比例高(>50%)而被删除。这些缺失值中的大多数是由于血浆中的代谢物浓度低于检测限(LOD)。每组中的样品数总结在下表1中。
表1.样本分组汇总
Figure BDA0003693064290000091
癌症患者和健康对照之间关于年龄、性别、身高、体重和吸烟史(是=以前+现在,否=从不)的比较使用标准学生t检验或Fisher精确检验进行,以确认他们的人口统计可比性。唯一显著不同的变量是吸烟史(p值=2.673×10-13)。基于多个临床变量,包括年龄、性别、身高、体重和吸烟史(是=以前+现在,否=从不)对肺癌发病率的影响通过逻辑回归进一步评估。结果总结在下表2中。正如预期的那样,只有吸烟史被确定为与肺癌发病率显著相关的临床变量(p值=1.13×10-13)。尽管吸烟史与肺癌之间的相关性已被大量研究并被广泛接受,但该模型表明,将吸烟史(包括吸烟持续时间和吸烟量)整合到任何诊断模型中以识别早期肺癌将是一个很好的策略。
表2.基于逻辑回归的相关性研究:NSCLC与临床变异
估算值 标准误差 z值 p值
(截距) 5.9317 5.6113 1.0571 0.2905
年龄 0.0170 0.0232 0.7306 0.4650
性别 -0.2930 0.5870 -0.4991 0.6177
身高 -4.6740 3.3846 -1.3810 0.1673
体重 -0.0014 0.0138 -0.1041 0.9171
吸烟(YIN) 2.8079 0.4136 6.7883 1.13*10<sup>-11</sup>
通过对代谢组学数据集应用简单的学生t检验,揭示了健康对照和肺癌患者(所有阶段)的代谢特征之间的巨大差异。下面的表3列出了通过t检验鉴定的具有显著FDR调整p值(q<0.05)的36种代谢物。在该研究中,磷脂酰胆碱如PC ae C40:6、PC aa C38:0和PC aaC40:2是NSCLC患者血浆中下调最多的代谢物,而溶血磷脂酰胆碱(LysoPCs)如LysoPC 20:3和LysoPC 20:4在癌症患者中显著上调。其他显著改变的代谢物包括β-羟基丁酸(在NSCLC中增加)、蛋氨酸亚矾(减少)、色氨酸(减少)、肉碱(C0和C2,均增加)和TCA循环的成员,如柠檬酸盐(减少)和延胡索酸(增加)。
表3.单因素统计分析中正常病例与非小细胞肺癌患者有显著差异的代谢物。
Figure BDA0003693064290000101
还进行了多变量分析以进一步揭示健康对照和NSCLC患者在所有阶段之间的代谢物差异。使用PLS-DA,发现NSCLC患者和健康对照之间有明显的分离(图1a)。置换检验表明,观察到的分离并非偶然(P<0.001)。发现LysoPC 20:3、肉碱、β-羟基丁酸和PC ae C40:6具有推动分离的最高的总体系数得分(图1b)。
能够有效诊断处于疾病早期阶段的肺癌患者的生物标志物显然比用于疾病晚期阶段的生物标志物更有价值。因此,进行了一系列统计分析以确定能够区分I期NSCLC患者与健康对照的血浆代谢物。如图1a所示,PLS-DA分析显示I期NSCLC组和健康对照之间明显可检测的分离。置换检验表明,观察到的病例和对照之间的分离不是偶然的(p值<0.001)。图lb显示了来自PLS-DA的总体系数得分的结果。基于该分析,LysoPC 20:3、PC ae C40:6、PC aa C38:0、肉碱和延胡索酸似乎是区分I期NSCLC患者与健康对照的最重要的血浆代谢物。
使用MetaboAnalyst进行逻辑回归以及基于随机森林的探索性ROC分析,以鉴定最佳代谢物组合以区分I期NSCLC与健康对照。在该分析中,使用基于平衡子采样的蒙特卡罗交叉验证(MCCV)来生成接收器操作特性(ROC)曲线。使用来自40名健康对照和47名I期NSCLC患者的血浆样本的发现队列,具有不同数量代谢物特征的不同ROC模型的AUC范围为0.824至0.922(图3a)。图3b显示了最常选择的代谢物,其中LysoPC 20:3、PC ae C40:6、PCaa C38:0、LysoPC 20:4、延胡索酸、肉碱和β-羟基丁酸被确定为排在首位的代谢物。然后建立逻辑回归模型来预测I期NSCLC(P)的概率,公式如下:log(P/(l-P))=0.258-1.341×PCae C40:6+1.747×LysoPC 20:3+0.913×β-羟基丁酸+0.939×延胡索酸,其中,方程中每种命名的代谢物的浓度以μM为单位。具有95%置信区间(CI)的ROC曲线如图3a所示。ROC曲线的AUC和10倍交叉验证AUC分别为0.931(95%CI,0.924~0.955)和0.923(95%CI,0.866~0.980)。在验证集(由20名健康对照和23名I期癌症患者组成)上进一步检查了仅代谢物模型的性能,并获得了略低的AUC(0.890)。从验证集获得的ROC曲线也显示在图3a中。该模型的其他细节列于下表4中。
表4.基于逻辑回归的I期NSCLC检测最佳模型:仅代谢物。
Figure BDA0003693064290000111
Figure BDA0003693064290000121
当增加了患者的吸烟史时,该发现队列的逻辑模型被修改为logit(P)=
log(P/(l-P))=0.311+0.641×吸烟量-1.372×PC ae C40:6+1.623×LysoPC20:3+0.882×β-羟基丁酸+0.65×延胡索酸,其中,P是I期NSCLC的概率。如前所述,方程中每种命名的代谢物的浓度以μM为单位。在这里和下面的所有其他模型中,吸烟量是通过将吸烟时间(以天为单位)乘以每日吸烟量(支/天)来计算的。对应模型的ROC曲线如图3b所示。代谢物+吸烟模型的AUC为0.942(95%CI,0.926~0.957),经过10倍交叉验证后为0.922(95%CI,0.864~0.979)。这类似于仅代谢物模型。当在验证集上测试相同的代谢物+吸烟史模型时,验证队列的AUC与仅代谢物模型基本相同(0.920,图3b)。有趣的是,当考虑吸烟史时,模型的敏感性略有增加(下表5)。
表5.基于逻辑回归的I期NSCLC检测的最佳模型:代谢物加上吸烟史。
Figure BDA0003693064290000122
对处于II期的肺癌患者进行了一系列类似的分析。相应的PLS-DA图和VIP图如图5a和5b所示。置换检验表明,观察到的病例与正常组的分离不是偶然的(p值<0.001)。与I期NSCLC患者相比,延胡索酸不再被确定为PLS-DA VIP图中最重要的特征之一,而β-羟基丁酸被确定为系数得分最高的代谢物之一。
使用由40名健康对照和40名II期NSCLC患者组成的血浆样品的发现队列,具有不同数量的代谢物特征的不同仅代谢物回归模型的AUC范围为0.894至0.946(图5a)。图5b显示了最常选择的代谢物。LysoPC 20:3、色氨酸、β-羟基丁酸、PC ae C40:6、谷氨酸和肉碱被确定为最具分化性的代谢物。
然后建立逻辑回归模型以预测具有以下方程的II期NSCLC(P)的概率:logit(P)=log(P/(1-P))=0.346+2.565×β-羟基丁酸-2.219×柠檬酸+2.904×肉碱-1.599×PC aeC40:6,其中,方程中每种命名的代谢物的浓度以μM为单位。具有95%CI的ROC曲线如图7a所示。ROC曲线的AUC和10倍交叉验证AUC分别为0.980(95%CI,0.973~0.987)和0.952(95%CI,0.909~0.995)。在保留验证集(由20名健康对照和20名II期癌症患者组成)上进一步检查仅代谢物模型的性能,并获得略低的AUC(0.922)。从验证集获得的ROC曲线也如图7a所示。该模型的其他细节列于下表6中。
表6.基于逻辑回归的II期NSCLC检测最佳模型:仅代谢物。
Figure BDA0003693064290000131
当增加了患者的吸烟史时,该发现队列的逻辑模型被修改为logit(P)=
log(P/(l-P))=0.098+1.489×吸烟量+2.911×β-羟基丁酸-1.627×柠檬酸+2.605×肉碱-0.702×PC ae C40:6,其中P是II期非小细胞肺癌的概率,方程中每种命名的代谢物的浓度以μM为单位。对应模型的ROC曲线如图7b所示。代谢物+吸烟模型的ROC曲线的AUC为0.985(95%CI,0.979~0.991),10倍交叉验证后为0.948(95%CI,0.900~0.996)。当在验证集上测试相同的代谢物+吸烟史模型时,验证集的AUC也接近训练集(0.940,图7b)。与I期NSCLC的模型类似,当考虑吸烟史时,模型的敏感性和验证集的总体模型性能得到改善(下表7)。
表7.基于逻辑回归的II期NSCLC检测最佳模型:代谢物加吸烟史。
Figure BDA0003693064290000141
应用上述相同方法以获得用于一起诊断I+II期NSCLC患者(定义为早期NSCLC)的预测模型。使用来自40名健康对照和87名早期NSCLC患者的血浆样本的发现队列,建立逻辑回归模型以预测患有早期NSCLC(P)的概率,公式如下:logit(P)=log(P/(l-P))=2.346-1.528×PC ae C40:6+1.429×β-羟基丁酸-2.481×柠檬酸+1.03×LysoPC 20:3+1.773×延胡索酸,其中,方程中每种命名的代谢物的浓度为以μM为单位。图9a显示了具有95%CI的ROC曲线。ROC曲线的AUC和10倍交叉验证AUC分别为0.974(95%CI,0.965~0.982)和0.959(95%CI,0.923~0.995)。在验证集(由20名健康对照和43名早期患者组成)上进一步检查了仅代谢物模型的性能,并获得了略低的AUC(0.898)。从验证集获得的ROC曲线和模型的其他细节分别如图9a和表8(下)所示。
表8.基于逻辑回归的I+II期NSCLC检测的最佳模型:仅代谢物。
Figure BDA0003693064290000142
Figure BDA0003693064290000151
当增加了患者的吸烟史时,该发现队列的逻辑模型被修改为logit(P)=
log(P/(l-P))=2.427+1.425×吸烟量-1.414×PC ae C40:6+1.414×β-羟基丁酸-2.193×柠檬酸+1.738×LysoPC 20:3+1.44×延胡索酸,其中,P是II期非小细胞肺癌的概率,方程中每种命名的代谢物的浓度以μM为单位。对应模型的ROC曲线如图5b所示。代谢物+吸烟模型的ROC曲线的AUC为0.982(95%CI,0.975~0.990),10倍交叉验证后为0.948(95%CI,0.930~1.000)。当在验证集上测试相同的代谢物+吸烟史模型时,验证集的AUC相当接近训练集(0.933,图5b)。同样,当将吸烟史增加到模型中时,模型的敏感性/特异性和模型性能都得到了改善(下表9)。
表9.基于逻辑回归的I+II期NSCLC检测的最佳模型:代谢物加上吸烟史。
Figure BDA0003693064290000152
Figure BDA0003693064290000161
与早期NSCLC阶段相比,晚期NSCLC患者血浆的代谢物分析与健康对照更加不同。PCA和PLS-DA都响应出清晰的分离(图S4a和图S4b)。PLS-DA分析的VIP数据显示,酮体失调似乎是IIIB+IV期NSCLC患者最典型的特征之一(图S4c)。尸胺(赖氨酸脱羧的产物)水平升高也被确定为区分IIIB+IV期NSCLC的最重要特征之一。相比之下,作为I/II期NSCLC特征的LysoPC20:3上调在IIEIV期NSCLC中并未作为重要特征突出。由于晚期肺癌标志物的鉴定不是这项工作的主要重点(并且由于样本量相对较小),因此没有开发预测IIIB/IV期NSCLC的逻辑回归模型。
本研究的目的是发现和验证用于早期检测非小细胞肺癌(NSCLC)的血浆代谢物(和临床)生物标志物的组合。特别是,通过基于MS的定量代谢组学技术研究了NSCLC患者(处于不同阶段)与健康(年龄和性别匹配)对照的血浆代谢物变化。使用单独的发现队列(具有10倍交叉验证)和验证队列来防止过度训练和结果中的任何意外偏差。开发并独立验证了三种不同的仅代谢物模型和三种不同的代谢物+吸烟状态模型,以检测I期、II期和Eli期NSCLC。这些模型中的大多数实现了AUC>0.9。
开发基于血液的代谢组学测试的一个关键优势在于,它可以很容易地转化为低成本、高通量的分析,可以在几乎所有配备有标准三重四极质谱仪的临床实验室中运行。对此处确定的代谢物具有特异性的改良测定法可以使用低至10μL的血浆以每个样品4-5分钟的速度运行。这些有希望的结果表明,可以开发一种微创、高性能、高通量、低成本的肺癌筛查试验,用于选择患者进行进一步的随访和使用LDCT或其他肺部成像方式进行确认。
因此,本领域技术人员理解,本公开涉及一种方法,在特定实施例能够,涉及一种检测非小细胞肺癌(例如,I期或II期非小细胞肺癌)的方法。该方法包括测定来自受试者的生物样品中一组代谢物的每种代谢物的浓度,其中,该组代谢物包括:β-羟基丁酸、LysoPC20:3、PC ae C40:6、柠檬酸、肉碱、和延胡索酸;β-羟基丁酸、LysoPC 20:3、PC ae C40:6和延胡索酸;或β-羟基丁酸、PC ae C40:6、柠檬酸和肉碱。
在各种实施例中,代谢物组包含β-羟基丁酸、LysoPC 20:3、PC ae C40:6和延胡索酸。在各种实施例中,代谢物组基本上由β-羟基丁酸、LysoPC 20:3、PC ae C40:6和延胡索酸组成。在这样的实施例中,该方法包括根据公式1确定生物样品的概率评分:
logit(P)=log(P/(l-P))=0.258-1.341×PC ae C40:6+1.747×LysoPC 20:3+0.913×β-羟基丁酸+0.939×延胡索酸
(公式1)
方程中每个代谢物的数值是在中值标准化、对数变换和自动缩放后的代谢物的浓度,以μM为单位。达到或超过I期阈值的概率评分表明受试者患有I期非小细胞肺癌。
在其他实施例中,受试者是吸烟者。在这样的实施例中,该方法包括根据公式2确定生物样品的概率评分:
logit(P)=log(P/(l-P))=0.311+0.641×吸烟量-1.372×PC ae C40:6+1.623×LysoPC 20:3+0.882×P-羟基丁酸+0.65×延胡索酸
(公式2)。
方程中每个代谢物的数值是在中值标准化、对数变换和自动缩放后的代谢物的浓度,以μM为单位。达到或超过I期吸烟者阈值的概率评分表明受试者患有I期非小细胞肺癌。
在各种实施例中,代谢物组包括:β-羟基丁酸;PC ae C40:6;柠檬酸;和肉碱。在一些实施例中,代谢物组基本上由β-羟基丁酸、PC ae C40:6、柠檬酸和肉碱组成。在这样的实施例中,特别是在受试者是非吸烟者的情况下,该方法包括根据公式3确定生物样品的I期概率评分:
logit(P)=log(P/(l-P))=0.346+2.565×β-羟基丁酸-2.219×柠檬酸+2.904×肉碱-1.599×PC ae C40:6;
(公式3)。
方程中每个代谢物的数值是在中值标准化、对数变换和自动缩放后的代谢物的浓度,以μM为单位。达到或超过II期阈值的概率评分表明受试者患有II期非小细胞肺癌。
在其他实施例中,受试者是吸烟者。在这样的实施例中,该方法包括根据公式4确定生物样品的I期概率评分:
logit(P)=log(P/(l-P))=0.098+1.489×吸烟量+2.911×β-羟基丁酸-1.627×柠檬酸+2.605×肉碱-0.702×PC ae C40:6
(公式4)。
方程中每个代谢物的数值是在中值标准化、对数变换和自动缩放后的代谢物的浓度,以μM为单位。达到或超过II期吸烟者阈值的概率评分表明受试者患有II期非小细胞肺癌。
logit(P)=log(P/(l-P))=2.346-1.528×PC ae C40:6+1.429×β-羟基丁酸-2.481×柠檬酸+1.03×LysoPC 20:3+1.773×延胡索酸;
在其他实施例中,代谢物组包括:β-羟基丁酸;LysoPC 20:3;PC ae C40:6;柠檬酸;和延胡索酸。在各种实施例中,代谢物组基本上由β-羟基丁酸、LysoPC20:3、PC ae C40:6、柠檬酸和延胡索酸组成。在这样的实施例中,特别是在受试者是非吸烟者的情况下,该方法包括根据公式5确定生物样品的概率评分:
logit(P)=log(P/(l-P))=2.346-1.528×PC ae C40:6+1.429×β-羟基丁酸-2.481×柠檬酸+1.03×LysoPC 20:3+1.773×延胡索酸;
方程中每个代谢物的数值是在中值标准化、对数变换和自动缩放后的代谢物的浓度,以μM为单位。达到或超过I/II期概率阈值的概率评分表明受试者患有I期或II期非小细胞肺癌。
在受试者是吸烟者的其他实施例中,该方法包括根据公式6确定生物样品的概率评分:
logit(P)=log(P/(l-P))=2.427+1.425×吸烟量-1.414×PC ae C40:6+1.414×β-羟基丁酸-2.193×柠檬酸+1.738×LysoPC 20:3+1.44×延胡索酸
(公式6)。
方程中每个代谢物的数值是在中值标准化、对数变换和自动缩放后的代谢物的浓度,以μM为单位。达到或超过I/II期概率阈值的概率评分表明受试者患有I期或II期非小细胞肺癌。
在各种实施例中,代谢物组基本上由β-羟基丁酸、LysoPC20:3、PCaeC40:6、柠檬酸、肉碱和延胡索酸组成。技术人员理解,在涉及所有六种这些代谢物的此类实施例中,可以根据每个公式,可能同时分析受试者患I期和II期非小细胞肺癌的可能性。在这样的实施例中,特别是在受试者是非吸烟者的情况下,该方法包括根据公式1确定生物样品的I期概率评分。满足或超过公式1的I期阈值的I期概率评分表明,该受试者患有I期非小细胞肺癌。
同时,该方法还可以包括根据公式3确定生物样本的II期概率评分。达到或超过公式3的II期阈值的II期概率评分表明受试者具有II期非小细胞肺癌。
然而同时,该方法还可以包括根据公式5确定生物样品的I/II期概率评分。满足或超过I/II期阈值的I/II期概率评分表示受试者患有I期或II期非小细胞肺癌。
在受试者是吸烟者的实施例中,该方法可以包括根据公式2确定生物样品的I期概率评分。达到或超过I期阈值的I期概率评分表明受试者具有I期非小细胞肺癌。
同时,该方法还可以包括根据公式4确定生物样本的II期概率评分。达到或超过公式4的II期阈值的II期概率评分表明受试者患有II期非小细胞肺癌。
仍然同时,该方法还可以包括根据公式6确定生物样品的I/II期概率评分。满足或超过公式6的I/II期阈值的I/II期概率评分标明受试者患有I期或II期非小细胞肺癌。
当然,本领域技术人员理解,当确定所有6种代谢物的浓度时,根据公式1、3和5(或如果受试者是吸烟者,则为2、4和6)的分析可以是以任何顺序进行。或者,可以只进行1或3次分析。
使用LYSO-PC 20:3(溶血磷脂)、β-羟基丁酸、延胡索酸和精胺的癌症检测
本公开还涉及用于早期肺癌诊断的一组四种血清代谢物生物标志物,其对于I期肺癌表现出0.94的AUROC(受试者工作特征曲线下面积),具有84%的特异性和90的敏感性%。结合易于测量的临床数据,即既往吸烟史和吸烟量,I期肺癌的AUROC略微增加至0.95,敏感性和特异性分别为91%和92%。无论分期如何,这可能是所有肺癌检测中报告的最高AUROC之一。四种血清标志物是LYSO-PC20:3(一种溶血磷脂)、β-羟基丁酸、延胡索酸和精胺。
通过液相色谱-质谱法(LC-MS)对肺癌患者(n=156)和健康对照(n=60)进行了216份血清样品的代谢组学分析。肺癌患者组包括70名I期肺癌患者、60名II期癌症患者和26名III/IV期癌症患者。所有肺癌患者均被确定为非小细胞肺癌(NSCLC),这是最常见的肺癌形式。
靶向LC-MS研究使用TMIC-PrimeTM检测试剂进行,该测定法是由加拿大艾伯塔省埃德蒙顿T6G2R3,艾伯塔大学生物科学系,BSBZ-824的代谢组学创新中心(TMIC)开发并广泛验证的靶向定量代谢组学测定试剂盒。TMIC-PrimeTM检测试剂测量143种不同的内源性代谢物,包括氨基酸、酰基肉碱、有机酸、生物胺、尿毒症毒素、甘油磷脂、鞘脂和糖。TMIC-PrimeTM检测试剂结合了直接注射质谱和反相LC-MS/MS定制检测试剂,该检测试剂针对配备Agilent 1100系列HPLC的Applied Biosystems/MDS Sciex质谱仪提供的ABI 4000Q-Trap进行了优化系统。该方法结合了分析物的衍生和提取,以及使用多反应监测(MRM)对的选择性MS检测。同位素标记的内标用于代谢物定量。
定制检测试剂包含96深孔板,其带有附有密封胶带的滤板,以及用于制备板化验的所有试剂和溶剂。每个板的前14个孔用于质量控制(QC)和仪器校准,由一个空白、三个“零”样品、七个校准标准和三个质量控制样品组成。对于除有机酸测量之外的所有代谢物测量,血清样品在冰上解冻,然后涡旋并以13,000×g离心。将10μL的每种血清样品加载到上96孔板上的过滤器中心,并在氮气流中干燥。随后,加入异硫氰酸苯酯以衍生所有含氨基的基团。温育后,使用蒸发器再次干燥过滤点。然后通过添加300μL提取溶剂(MeOH和FhO)来提取代谢物。提取物通过离心进入下部96深孔板,然后用MS运行溶剂稀释步骤获得。对于有机酸分析,将150μL冰冷的甲醇和10μL同位素标记的内标混合物添加到50μL血清中进行过夜蛋白质沉淀。然后将所得样品以13000×g离心20分钟。随后将50μL上清液加载到96深孔板的孔中心,然后加入3-硝基苯肼(NPH)以衍生羧酸盐基团。孵育2小时后,在LC-MS注射前加入BHT稳定剂和水。
在LC-MS方法中,在216个血清样品的每一血清样品中定量测量了总共138种代谢物。由于20%的MS信号低于MS检测限,统计预处理去除了35种代谢物。为了识别潜在的诊断代谢物并生成肺癌检测模型,如之前在Wishart,D.S.(2010)Computational approachesto metabolomics(代谢组学的计算方法).Methods Mol Biol.593:283-313中所述,执行了一系列统计和计算程序。通过对我们的代谢组学数据集应用简单的学生t检验,揭示了健康对照和肺癌患者(所有阶段)的代谢特征之间的显著差异。进行了多变量统计和逻辑回归分析,以发现准确诊断早期NSCLC所需的最小代谢物组。偏最小二乘判别分析(PLS-DA)使用MetaboAnalyst进行,如Xia,J.,et al.,(2015)MetaboAnalyst 3.0-makingmetabolomicsmore meaningful.Nucleic Acids Res.43(W1):W251-W257中所公开的那样。这导致了NSCLC患者和健康对照之间的良好分离。生成的模型根据其AUROC值(从高到低)进行排名。使用该协议,我们能够识别出能够区分早期肺癌(即I期肺癌患者)与AUROC值高于0.90的健康对照的代谢物生物标志物。应用10倍交叉验证来验证模型。在构建模型的训练和验证步骤中,从具有95%置信区间的ROC曲线计算敏感性和特异性。
图10显示了PLS-DA分析,该分析导致患有I期肺癌的肺癌患者(显示在右侧的阴影区域中)与健康对照(显示在左侧的阴影区域中)之间的可检测分离。图11显示了VIP图。置换检验显示,观察到的病例与正常组的分离极不可能是偶然的(P<0.001)。用于诊断I期肺癌的模型由四种血清代谢物组成,如图12中的ROC曲线所示。该模型基于LYSO-PC 20:3、β-羟基丁酸、延胡索酸和精胺的水平,以及由I期NSCLC的概率表示,其中(P)为log(P/(1-P)=0.504+2.192*LYSO-PC20:3+1.252*β-羟基丁酸+1.23*延胡索酸-1 798*精胺。训练集和10倍交叉验证集的AUROC值分别为0.95(95%CI,0.94~0.96)和0.94(95%CI,0.90~0.98),验证的敏感性和特异性分别为0.84和0.90。这些指标表明该模型是1期NSCLC的高度显著预测因子。该I期模型的详细信息列于表10。对诊断II期肺癌进行了类似的分析,并产生了一组与诊断I期肺癌类似的代谢物和AUROC值。
表10.用于诊断I期肺癌的逻辑回归模型的详细信息。
Figure BDA0003693064290000221
为了提高诊断模型的性能,通过逻辑回归来评估包括年龄、性别、身高、体重和吸烟史在内的多个临床变量对肺癌发病率的影响。在这些临床参数中,只有吸烟史被确定为与肺癌发病率显著相关(p-值=1.13*10-11)。肺癌发病率和吸烟史之间的进一步逻辑回归模型证实了前吸烟者与肺癌发病率之间的显著正相关(p值=4.16*10-10),优势率为9.82。我们的结果还表明,目前吸烟者的肺癌发病率显著升高(p-值=7.082*10-11)。尽管吸烟史与肺癌之间的相关性已被大量研究并被广泛接受,但我们的分析表明,吸烟史(包括吸烟持续时间和吸烟量)应包含在任何肺癌诊断模型中,因为它可以提高整体诊断性能。包括吸烟史的模型的ROC曲线如图13所示。用四种代谢物加上吸烟的时期和数量建立的逻辑模型表示为log(P/(1-P)=0.739+0.68*延胡索酸-1.861*精胺+5.248*吸烟时间-4.19*支/天+1.139*β-羟基丁酸+1.776*LYSO-PC 20:3,其中,P是1期NSCLC的概率。从训练集得到的AUROC为0.96(95%CI,0.95~0.97),且从10倍交叉验证得到的AUROC为0.95(95%CI,0.903~0.985)。验证集的敏感性和特异性分别为91%和92%。关于逻辑回归模型的额完整细节可以在表11中找到。我们已经确定用于诊断I期肺癌的四种代谢物生物标志物存在于血清中,可以进行快速简单的血液检测。我们早期肺癌检测的另一个优势在于事实上,它是一个多组分测试。使用多组分生物标志物组的优势在于可以调整ROC曲线的形状以优化敏感性/特异性,从而以增加假阳性为代价大大减少假阴性的数量(这是筛选测试的首选)。ROC曲线形状调整无法使用单个生物标志物组进行。
表11.用于诊断I期肺癌的逻辑回归模型(包括吸烟史)的详细信息。
Figure BDA0003693064290000231
基于上述知识,技术人员将理解本公开的方面涉及一种方法,该方法在各个方面可以是诊断非小细胞肺癌的方法。该方法包括测定来自受试者的生物样品中一组代谢物的每种代谢物的浓度,其中该组代谢物包括β-羟基丁酸、LysoPC20:3、延胡索酸和精胺。在各种实施例中,代谢物组由β-羟基丁酸、LysoPC 20:3、延胡索酸和精胺组成。
该方法还可以包括根据公式7确定生物样品的概率评分:
logit(P)=log(P/(l-P))=0.504+2.192×LysoPC 20:3+2.252×β-羟基丁酸+1.23×延胡索酸-1.798×精胺
(公式7)
方程中每个代谢物的数值是在中值标准化、对数变换和自动缩放后的代谢物的浓度,以μM为单位。达到或超过I期阈值的概率评分表明受试者患有I期非小细胞肺癌。这样的实施例对于非吸烟者特别具有预测性。
在其他实施例中,受试者可以是吸烟者。在这样的实施例中,该方法进一步包括根据公式8确定生物样品的概率评分:
0.739+0.68×延胡索酸-1.861×精胺+5.248×吸烟时间-4.19×支/天+1.139×β-羟基丁酸+1.776×LYSO-PC 20:3;
(公式8)
方程中每个代谢物的数值是在中值标准化、对数变换和自动缩放后的代谢物的浓度,以μM为单位。
满足或超过I期阈值的概率评分表明受试者患有I期非小细胞肺癌。
非小细胞肺癌的治疗
本领域技术人员理解,一旦根据本文公开的方法将受试者诊断为患有I期或II期非小细胞肺癌,则可以根据本领域已知的治疗方法对受试者进行治疗。
治疗受试者的肺癌可以包括向受试者施用治疗剂。治疗剂可包括已知或发现可用于治疗非小细胞肺癌的各种药剂,包括但不限于:顺铂;卡铂;紫杉醇;白蛋白结合紫杉醇;多西他赛;吉西他滨;长春瑞滨;依托泊苷;培美曲塞;贝伐单抗;雷莫芦单抗;厄洛替尼;阿法替尼;吉非替尼;奥希替尼;达克替尼;耐妥尤单抗;克唑替尼;色瑞替尼;劳拉替尼;恩曲替尼;达拉非尼;曲美替尼;塞尔帕替尼;普拉塞替尼;卡马替尼;拉罗替尼;恩曲替尼;纳武单抗;派姆单抗;阿特珠单抗;杜瓦鲁单抗;易普利姆玛;或其组合。
因此,本领域技术人员理解本公开的方面涉及根据本文所述的方法使用治疗剂来治疗被诊断患有非小细胞肺癌的受试者。治疗剂可包括已知可用于治疗非小细胞肺癌的任何药剂,包括但不限于:顺铂;卡铂;紫杉醇;白蛋白结合紫杉醇;多西他赛;吉西他滨;长春瑞滨;依托泊苷;培美曲塞;贝伐单抗;雷莫芦单抗;厄洛替尼;阿法替尼;吉非替尼;奥希替尼;达克替尼;耐妥尤单抗;克唑替尼;色瑞替尼;劳拉替尼;恩曲替尼;达拉非尼;曲美替尼;塞尔帕替尼;普拉塞替尼;卡马替尼;拉罗替尼;恩曲替尼;纳武单抗;派姆单抗;阿特珠单抗;杜瓦鲁单抗;易普利姆玛;或其组合。
本领域技术人员将理解,以上提供的许多细节仅作为示例,并不旨在限制本发明的范围,本发明的范围将参照所附权利要求来确定。

Claims (58)

1.一种方法,该方法包括测定来自受试者的生物样品中一组代谢物的每种代谢物的浓度,其中,该组代谢物包括:β-羟基丁酸、LysoPC 20:3、PC ae C40:6、柠檬酸、肉碱和延胡索酸;β-羟基丁酸、LysoPC 20:3、PC ae C40:6和延胡索酸;或者β-羟基丁酸、PC ae C40:6、柠檬酸和肉碱。
2.如权利要求1所述的方法,其中,该组代谢物包括:β-羟基丁酸、LysoPC 20:3、PC aeC40:6和延胡索酸。
3.如权利要求1或3所述的方法,其中,该组代谢物基本上由β-羟基丁酸、LysoPC 20:3、PC ae C40:6和延胡索酸组成。
4.如权利要求2或3所述的方法,进一步包括根据公式1确定所述生物样品的概率评分:
logit(P)=log(P/(l-P))=0.258-1.341×PC ae C40:6+1.747×LysoPC 20:3+0.913×β-羟基丁酸+0.939×延胡索酸;
其中,方程中每个代谢物的数值是中值归一化、对数变换和自动缩放后的代谢物的浓度,单位为μM。
5.如权利要求5所述的方法,其中,满足或超过I期阈值的概率评分表明所述受试者患有I期非小细胞肺癌。
6.如权利要求2至5中任一项所述的方法,其中,所述受试者是非吸烟者。
7.如权利要求2或3所述的方法,其中,所述受试者是吸烟者。
8.如权利要求7所述的方法,进一步包括根据公式2确定所述生物样品的概率评分:
logit(P)=log(P/(l-P))=0.311+0.641×吸烟量-1.372×PC ae C40:6+1.623×LysoPC 20:3+0.882×β-羟基丁酸+0.65×延胡索酸;
其中,方程中每个代谢物的数值是中值归一化、对数变换和自动缩放后的代谢物的浓度,单位为μM。
9.如权利要求8所述的方法,其中,满足或超过I期吸烟者阈值的概率评分表明所述受试者患有I期非小细胞肺癌。
10.如权利要求1所述的方法,其中,该组代谢物包括:β-羟基丁酸;PC ae C40:6;柠檬酸;和肉碱。
11.如权利要求10所述的方法,其中,该组代谢物基本上由β-羟基丁酸、PC ae C40:6、柠檬酸和肉碱组成。
12.如权利要求10或11所述的方法,进一步包括根据公式3确定所述生物样品的I期概率得分:
logit(P)=log(P/(l-P))=0.346+2.565×β-羟基丁酸-2.219×柠檬酸+2.904×肉碱-1.599×PC ae C40:6;
其中,方程中每个代谢物的数值是中值归一化、对数变换和自动缩放后的代谢物的浓度,单位为μM。
13.如权利要求12所述的方法,其中,满足或超过II期阈值的概率评分表明所述受试者患有II期非小细胞肺癌。
14.如权利要求10至13中任一项所述的方法,其中,所述受试者是非吸烟者。
15.如权利要求10或11所述的方法,其中,所述受试者是吸烟者。
16.如权利要求15所述的方法,进一步包括根据公式4确定所述生物样品的I期概率评分:
logit(P)=log(P/(l-P))=0.098+1.489×吸烟量+2.911×β-羟基丁酸-1.627×柠檬酸+2.605×肉碱-0.702×PC ae C40:6;
其中,方程中每个代谢物的数值是中值归一化、对数变换和自动缩放后的代谢物的浓度,单位为μM。
17.如权利要求16所述的方法,其中,达到或超过II期吸烟者阈值的概率评分表明所述受试者患有II期非小细胞肺癌。
18.如权利要求1或2所述的方法,其中,该组代谢物包括:β-羟基丁酸;LysoPC 20:3;PCae C40:6;柠檬酸;和延胡索酸。
19.如权利要求18所述的方法,其中,该组代谢物基本上由β-羟基丁酸、LysoPC 20:3、PC ae C40:6、柠檬酸和延胡索酸组成。
20.如权利要求18或19所述的方法,进一步包括根据公式5确定所述生物样品的概率评分:
logit(P)=log(P/(l-P))=2.346-1.528×PC ae C40:6+1.429×β-羟基丁酸-2.481×柠檬酸+1.03×LysoPC 20:3+1.773×延胡索酸;
其中,方程中每个代谢物的数值是中值归一化、对数变换和自动缩放后的代谢物的浓度,单位为μM。
21.如权利要求20所述的方法,其中,满足或超过I/II期概率阈值的概率评分表明所述受试者患有I期或II期非小细胞肺癌。
22.如权利要求18至21中任一项所述的方法,其中,所述受试者是非吸烟者。
23.如权利要求18或19所述的方法,其中,所述受试者是吸烟者。
24.如权利要求23所述的方法,进一步包括根据公式6确定所述生物样品的概率评分:
logit(P)=log(P/(l-P))=2.427+1.425×吸烟量-1.414×PC ae C40:6+1.414×β-羟基丁酸-2.193×柠檬酸+1.738×LysoPC 20:3+1.44×延胡索酸;
其中,方程中每个代谢物的数值是中值归一化、对数变换和自动缩放后的代谢物的浓度,单位为μM。
25.如权利要求24所述的方法,其中,满足或超过I/II期概率阈值的概率评分表明所述受试者患有I期或II期非小细胞肺癌。
26.如权利要求1所述的方法,其中,该组代谢物基本上由β-羟基丁酸、LysoPC 20:3、PCae C40:6、柠檬酸、肉碱和延胡索酸组成。
27.如权利要求1或26所述的方法,进一步包括根据公式1确定所述生物样品的I期概率得分:
logit(P)=log(P/(l-P))=0.258-1.341×PC ae C40:6+1.747×LysoPC 20:3+0.913×β-羟基丁酸+0.939×延胡索酸;
其中,方程中每个代谢物的数值是中值归一化、对数变换和自动缩放后的代谢物的浓度,单位为μM。
28.如权利要求27所述的方法,其中,达到或超过I期阈值的I期概率评分表明所述受试者患有I期非小细胞肺癌。
29.如权利要求1和26至28中任一项所述的方法,进一步包括根据公式3确定所述生物样品的II期概率得分:
logit(P)=log(P/(l-P))=0.346+2.565×β-羟基丁酸-2.219×柠檬酸+2.904×肉碱-1.599×PC ae C40:6;
其中,方程中每个代谢物的数值是中值归一化、对数变换和自动缩放后的代谢物的浓度,单位为μM。
30.如权利要求29所述的方法,其中,达到或超过II期阈值的II期概率评分表明所述受试者患有II期非小细胞肺癌。
31.如权利要求1和26至30中任一项所述的方法,进一步包括根据公式5确定所述生物样品的I/II期概率评分:
logit(P)=log(P/(l-P))=2.346-1.528×PC ae C40:6+1.429×β-羟基丁酸-2.481×柠檬酸+1.03×LysoPC 20:3+1.773×延胡索酸;
其中,方程中每个代谢物的数值是中值归一化、对数变换和自动缩放后的代谢物的浓度,单位为μM。
32.如权利要求31所述的方法,其中,达到或超过I/II期阈值的I/II期概率评分表明所述受试者患有I期或II期非小细胞肺癌。
33.如权利要求26至32中任一项所述的方法,其中,所述受试者是非吸烟者。
34.如权利要求26所述的方法,其中,所述受试者是吸烟者。
35.如权利要求34所述的方法,进一步包括根据公式2确定所述生物样品的I期概率评分:
logit(P)=log(P/(l-P))=0.311+0.641×吸烟量-1.372×PC ae C40:6+1.623×LysoPC 20:3+0.882×β-羟基丁酸+0.65×延胡索酸;
其中,方程中每个代谢物的数值是中值归一化、对数变换和自动缩放后的代谢物的浓度,单位为μM。
36.如权利要求35所述的方法,其中,达到或超过I期阈值的I期概率评分表明所述受试者患有I期非小细胞肺癌。
37.如权利要求34、35或36所述的方法,进一步包括根据公式4确定所述生物样品的II期概率得分:
logit(P)=log(P/(l-P))=0.098+1.489×吸烟量+2.911×β-羟基丁酸-1.627×柠檬酸+2.605×肉碱-0.702×PC ae C40:6;
其中,方程中每个代谢物的数值是中值归一化、对数变换和自动缩放后的代谢物的浓度,单位为μM。
38.如权利要求37所述的方法,其中,达到或超过II期阈值的II期概率评分表明所述受试者患有II期非小细胞肺癌。
39.如权利要求34至38中任一项所述的方法,进一步包括根据公式6确定所述生物样品的I/II期概率评分:
logit(P)=log(P/(l-P))=2.427+1.425×吸烟量-1.414×PC ae C40:6+1.414×β-羟基丁酸-2.193×柠檬酸+1.738×LysoPC 20:3+1.44×延胡索酸;
其中,方程中每个代谢物的数值是中值归一化、对数变换和自动缩放后的代谢物的浓度,单位为μM。
40.如权利要求39所述的方法,其中,达到或超过I/II期阈值的I/II期概率评分表明所述受试者患有I期或II期非小细胞肺癌。
41.如权利要求1至40中任一项所述的方法,其中,所述方法是诊断非小细胞肺癌的方法。
42.如权利要求42的方法,其中,所述非小细胞肺癌是I期或II期非小细胞肺癌。
43.一种方法,该方法包括测定来自受试者的生物样品的一组代谢物中的每种代谢物的浓度,其中,该组代谢物包括β-羟基丁酸、LysoPC 20:3、延胡索酸和精胺。
44.如权利要求43所述的方法,其中,该组代谢物由β-羟基丁酸、LysoPC 20:3、延胡索酸和精胺组成。
45.如权利要求43或44所述的方法,进一步包括根据公式7确定所述生物样品的概率评分:
logit(P)=log(P/(l-P))=0.504+2.192×LysoPC 20:3+2.252×β-羟基丁酸+1.23×延胡索酸-1.798×精胺;
其中,方程中每个代谢物的数值是中值归一化、对数变换和自动缩放后的代谢物的浓度,单位为μM。
46.如权利要求45所述的方法,其中,满足或超过I期阈值的概率评分表明所述受试者患有I期非小细胞肺癌。
47.如权利要求43至46中任一项所述的方法,其中,所述受试者是非吸烟者。
48.如权利要求43或44所述的方法,其中,所述受试者是吸烟者。
49.如权利要求48所述的方法,进一步包括根据公式8确定所述生物样品的概率评分:
0.739+0.68×延胡索酸-1.861×精胺+5.248×吸烟时间-4.19×支/天+1.139×β-羟基丁酸+1.776×LYSO-PC 20:3;
其中,方程中每个代谢物的数值是中值归一化、对数变换和自动缩放后的代谢物的浓度,单位为μM。
50.如权利要求49所述的方法,其中,满足或超过I期阈值的概率评分表明所述受试者患有I期非小细胞肺癌。
51.如权利要求5、9、13、17、21、25、28、30、32、36、38、40、42、46和50中任一项所述的方法,进一步包括治疗所述受试者的肺癌。
52.如权利要求51的方法,其中,治疗所述受试者的肺癌包括向所述受试者施用治疗剂。
53.如权利要求52所述的方法,其中,所述治疗剂包括:顺铂;卡铂;紫杉醇;白蛋白结合紫杉醇;多西他赛;吉西他滨;长春瑞滨;依托泊苷;培美曲塞;贝伐单抗;雷莫芦单抗;厄洛替尼;阿法替尼;吉非替尼;奥希替尼;达克替尼;耐妥尤单抗;克唑替尼;色瑞替尼;劳拉替尼;恩曲替尼;达拉非尼;曲美替尼;塞尔帕替尼;普拉塞替尼;卡马替尼;拉罗替尼;恩曲替尼;纳武单抗;派姆单抗;阿特珠单抗;杜瓦鲁单抗;易普利姆玛;或其组合。
54.治疗剂根据权利要求5、9、13、17、21、25、28、30、32、36、38、40、42、46和50中任一项所定义的方法在治疗被诊断患有非小细胞肺癌的受试者中的用途,其中,所述治疗剂是顺铂;卡铂;紫杉醇;白蛋白结合紫杉醇;多西他赛;吉西他滨;长春瑞滨;依托泊苷;培美曲塞;贝伐单抗;雷莫芦单抗;厄洛替尼;阿法替尼;吉非替尼;奥希替尼;达克替尼;耐妥尤单抗;克唑替尼;色瑞替尼;劳拉替尼;恩曲替尼;达拉非尼;曲美替尼;塞尔帕替尼;普拉塞替尼;卡马替尼;拉罗替尼;恩曲替尼;纳武单抗;派姆单抗;阿特珠单抗;杜瓦鲁单抗;易普利姆玛;或其组合。
55.一种用于根据权利要求5、9、13、17、21、25、28、30、32、36、38、40、42、46和50中任一项所定义的方法治疗被诊断患有非小细胞肺癌的受试者的治疗剂,其中,所述治疗剂是顺铂;卡铂;紫杉醇;白蛋白结合紫杉醇;多西他赛;吉西他滨;长春瑞滨;依托泊苷;培美曲塞;贝伐单抗;雷莫芦单抗;厄洛替尼;阿法替尼;吉非替尼;奥希替尼;达克替尼;耐妥尤单抗;克唑替尼;色瑞替尼;劳拉替尼;恩曲替尼;达拉非尼;曲美替尼;塞尔帕替尼;普拉塞替尼;卡马替尼;拉罗替尼;恩曲替尼;纳武单抗;派姆单抗;阿特珠单抗;杜瓦鲁单抗;易普利姆玛;或其组合。
56.如权利要求1至53中任一项所述的方法,其中,所述样品是血浆。
57.如权利要求1至53中任一项所述的方法,其中,所述样品是血清。
58.如权利要求1至53中任一项所述的方法,其中,所述样品是血液或血液产品。
CN202080086593.1A 2019-10-17 2020-10-17 早期非小细胞肺癌的诊断方法 Pending CN115023609A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962916486P 2019-10-17 2019-10-17
US62/916,486 2019-10-17
PCT/CA2020/051398 WO2021072554A1 (en) 2019-10-17 2020-10-17 Method of diagnosing early-stage non-small cell lung cancer

Publications (1)

Publication Number Publication Date
CN115023609A true CN115023609A (zh) 2022-09-06

Family

ID=75537304

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080086593.1A Pending CN115023609A (zh) 2019-10-17 2020-10-17 早期非小细胞肺癌的诊断方法

Country Status (5)

Country Link
US (1) US20240142455A1 (zh)
EP (1) EP4045905A4 (zh)
CN (1) CN115023609A (zh)
CA (1) CA3154765A1 (zh)
WO (1) WO2021072554A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115372628B (zh) * 2022-08-19 2023-04-11 中国医学科学院北京协和医院 与转甲状腺素蛋白淀粉样变性相关的代谢标志物及其应用

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2516866T3 (es) * 2009-06-04 2014-10-31 Metanomics Health Gmbh Medios y métodos para el diagnóstico de carcinomas de próstata
WO2016112174A2 (en) * 2015-01-08 2016-07-14 The Trustees Of The University Of Pennsylvania Biomarkers of Sleep Deprivation and Cognitive Impairment

Also Published As

Publication number Publication date
US20240142455A1 (en) 2024-05-02
EP4045905A4 (en) 2023-10-11
WO2021072554A1 (en) 2021-04-22
EP4045905A1 (en) 2022-08-24
CA3154765A1 (en) 2021-04-22

Similar Documents

Publication Publication Date Title
EP2279417B1 (en) Metabolic biomarkers for ovarian cancer and methods of use thereof
US8409794B2 (en) Biomarkers useful for diagnosing prostate cancer, and methods thereof
Wang et al. NMR-based metabolomic techniques identify potential urinary biomarkers for early colorectal cancer detection
Hsu et al. Integrated analyses utilizing metabolomics and transcriptomics reveal perturbation of the polyamine pathway in oral cavity squamous cell carcinoma
US20160341729A1 (en) Biomarkers for detecting and monitoring colon cancer
EP3775906B1 (en) Metabolite-based breast cancer detection and diagnosis
WO2011157655A1 (en) Use of bile acids for prediction of an onset of sepsis
US9739780B2 (en) Metabolite biomarkers for the detection of liver cancer
US20170003291A1 (en) Methods for detecting, diagnosing and treating endometrial cancer
US20240084394A1 (en) Urinary metabolomic biomarkers for detecting colorectal cancer and polyps
WO2017028308A1 (en) Biomarkers for coronary heart disease
Liang et al. Serum metabolomics uncovering specific metabolite signatures of intra-and extrahepatic cholangiocarcinoma
CA3029063C (en) Method of detecting lung cancer
Jain et al. Hemoglobin normalization outperforms other methods for standardizing dried blood spot metabolomics: A comparative study
CN115023609A (zh) 早期非小细胞肺癌的诊断方法
US20140162903A1 (en) Metabolite Biomarkers For Forecasting The Outcome of Preoperative Chemotherapy For Breast Cancer Treatment
Zhang et al. Altered phosphatidylcholines expression in sputum for diagnosis of non-small cell lung cancer
WO2020150609A1 (en) Urine metabolomics based method of detecting renal allograft injury
CN109946467B (zh) 一种用于胸椎黄韧带骨化诊断的生物标记物
KR20220162918A (ko) 아실카르니틴 대사체를 포함하는 구강암 진단용 바이오마커 조성물
WO2021016711A1 (en) Method of discriminating lung cancer patients
CN116519952B (zh) 颈动脉体瘤术前筛查及诊断的标志物及其应用
CA3065979C (en) Urinary metabolomic biomarkers for detecting colorectal cancer and polyps
US20230251261A1 (en) Method of detecting lung cancer
US11881311B1 (en) Survival prediction using metabolomic profiles

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination