CN113711044B - 一种用于检测结直肠癌或腺瘤的生物标志物及其方法 - Google Patents
一种用于检测结直肠癌或腺瘤的生物标志物及其方法 Download PDFInfo
- Publication number
- CN113711044B CN113711044B CN202080030060.1A CN202080030060A CN113711044B CN 113711044 B CN113711044 B CN 113711044B CN 202080030060 A CN202080030060 A CN 202080030060A CN 113711044 B CN113711044 B CN 113711044B
- Authority
- CN
- China
- Prior art keywords
- metabolites
- metabolite
- sample
- quantified
- crc
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/53—Immunoassay; Biospecific binding assay; Materials therefor
- G01N33/574—Immunoassay; Biospecific binding assay; Materials therefor for cancer
- G01N33/57407—Specifically defined cancers
- G01N33/57419—Specifically defined cancers of colon
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/68—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
- G01N33/6803—General methods of protein analysis not limited to specific proteins or families of proteins
- G01N33/6842—Proteomic analysis of subsets of protein mixtures with reduced complexity, e.g. membrane proteins, phosphoproteins, organelle proteins
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/68—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
- G01N33/6803—General methods of protein analysis not limited to specific proteins or families of proteins
- G01N33/6848—Methods of protein analysis involving mass spectrometry
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/92—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving lipids, e.g. cholesterol, lipoproteins, or their receptors
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/40—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for data related to laboratory analysis, e.g. patient specimen analysis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H20/00—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
- G16H20/10—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H20/00—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
- G16H20/40—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to mechanical, radiation or invasive therapies, e.g. surgery, laser therapy, dialysis or acupuncture
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2560/00—Chemical aspects of mass spectrometric analysis of biological material
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2800/00—Detection or diagnosis of diseases
- G01N2800/56—Staging of a disease; Further complications associated with the disease
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Urology & Nephrology (AREA)
- Immunology (AREA)
- Physics & Mathematics (AREA)
- Biomedical Technology (AREA)
- Hematology (AREA)
- Public Health (AREA)
- Medical Informatics (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medicinal Chemistry (AREA)
- Analytical Chemistry (AREA)
- General Physics & Mathematics (AREA)
- Pathology (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Cell Biology (AREA)
- Biophysics (AREA)
- Food Science & Technology (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Surgery (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Hospice & Palliative Care (AREA)
- Endocrinology (AREA)
- Oncology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
Abstract
本公开提供了一组可用于诊断结直肠癌或结直肠腺瘤的诊断生物标志物,还提供了使用诊断生物标志物组检测结直肠癌或结直肠腺瘤的方法。例如,本公开提供的方法是一种可以利用血清样本检测结直肠癌的非侵入性方法。此外,检测结直肠癌的方法可以检测不同阶段(例如癌前、早期、中期、晚期)的结直肠癌。
Description
相关申请的交叉引用
本申请要求于2019年12月28日提交的编号为62/954,483的美国临时专利申请的优先权,其全部内容通过引用并入本文。
技术领域
本申请主要涉及结直肠异常的检测,尤其涉及用于检测结直肠癌或腺瘤的生物标志物及其方法。
背景技术
结直肠癌(CRC)通常是指从结肠或直肠(大肠的部分)发展而来的癌症。CRC已成为全球日益严峻的临床挑战,而早期诊断被认为是提高CRC患者生存率的有效方法。腺瘤通常是指上皮组织的良性肿瘤。结肠腺瘤,也称为“结直肠腺瘤(CRA)”或“腺瘤性息肉”,往往会发展成恶性并导致CRC。因此,CRA或CRC的诊断对于评估患者的结直肠健康非常重要。
目前临床上用于诊断CRC和/或CRA的方法包括非侵入性方法和侵入性方法。非侵入性方法包括粪便潜血试验(FOBT)、使用诸如癌胚抗原(CEA)的肿瘤生物标志物等。侵入性方法包括使用结肠镜来确定是否有可见肿瘤病变或腺瘤性息肉、活组织检查等。虽然侵入性方法仍然是CRC/CRA诊断的金标准,但它们通常会给患者带来不适、疼痛甚至组织损伤。因此,有时首选非侵入性方法。然而,许多传统的非侵入性方法的准确性较低。因此,需要找到可以为检测CRC或CRA的非侵入性检测手段带来更高准确度的新的生物标志物。
发明内容
根据本申请的一个方面,提供了一组可用于诊断结直肠癌(CRC)或腺瘤的生物标志物。在一些实施例中,诊断生物标志物组可包括表A中列出的一种或以上代谢物。
表A
质量(+/-) | 化合物 | delta值(ppm) |
329.233(-) | C18H34O5 | 1 |
329.233(-) | 9,12,18-三羟基十八碳-10-烯酸(12Z) | 1 |
420.807(+) | C42H80NO8P | 19 |
637.157(-) | C32H31O14 | 0 |
398.18(-) | C15H27NO4 | 1 |
353.212(-) | C23H29O3 | 0 |
368.169(-) | C19H23N5O3 | 10 |
355.228(-) | C46H64O6 | 0 |
在一些实施例中,多种代谢物还可以包括表B中的代谢物。在一些实施例中,量化检测了表A中所有八种代谢物的丰度和表B中至少一种代谢物的丰度。
表B
在一些实施例中,待检代谢物可以进一步包括表C中的代谢物。在一些实施例中,可以量化表A中所有八种代谢物的丰度和表C中所有代谢物的丰度。
表C
根据本申请的另一方面,提供了一种检测受试者的CRC/CRA的方法。在一些实施例中,该方法可以包括步骤a):量化来自受试者的样本中一组多种代谢物的一种或以上组分的丰度。多种代谢物可以包括在如本申请中上述的表A、表B和/或表C中列出的代谢物。在一些实施例中,所述方法还可以包括通过处理步骤a)中量化的每种代谢物的丰度来确定样本分数。在一些实施例中,所述方法还可以包括步骤c):通过将样本分数与界限值进行比较来检测受试者的CRC/CRA。
在一些实施例中,可以通过逻辑回归方法建立预测模型。
在一些实施例中,预测模型可以基于检测来自具有已知的正常、患有CRC或CRA状态的样本的代谢物丰度测量,通过逻辑回归方法建立。
在一些实施例中,步骤(c)还可以包括:当样本分数等于或大于界限值,则受试者可检测到CRC/CRA。
在一些实施例中,对于接受者工作特征(ROC)曲线,所述方法的曲线下面积(AUC)大于0.80,并且检测样本中CRC/CRA的敏感度和特异度等于或大于75%。
在一些实施例中,对于ROC曲线,该方法可以具有大于0.85的AUC,并且检测样本中CRC/CRA的敏感度和特异度均等于或大于80%。
根据本申请的另一方面,提供了一种检测受试者的CRC/CRA的方法。在一些实施例中,该方法可以包括步骤a):量化来自受试者的样本中一组多种代谢物中的一种或以上组分的丰度。多种代谢物可包括在如本申请中上述的表A、表B和/或表C中列出的代谢物。在一些实施例中,所述方法还可以包括通过处理步骤a)中量化的每种代谢物的丰度来确定样本分数。在一些实施例中,所述方法还可包括步骤c):通过将样本分数与界限值进行比较来检测受试者的CRC/CRA患者。
根据本申请的另一方面,提供了一种检测受试者的CRA的方法。所述方法可以包括步骤a):量化来自受试者的样本中一组多种代谢物的至少五种组分的丰度。该方法还可以包括步骤b):通过处理步骤a)中量化的每种代谢物的丰度来确定样本分数。所述方法还可以进一步包括步骤c):通过将预测值与界限值进行比较来检测受试者的CRA。在一些实施例中,多种代谢物可包括在如本申请中上述的表A、表B和/或表C中列出的代谢物。
根据本申请又一方面,提供了一种检测受试者的I/II期CRC的方法。所述方法可以包括(a)用质谱法量化来自受试者的样本中一组多种代谢物中的一种或以上组分的丰度,其中多种代谢物包括表A的代谢物;(b)通过处理步骤(a)中量化的每种代谢物的浓度来确定样本分数;(c)通过将预测值与界限值进行比较来检测受试者的I/II期CRC。在一些实施例中,多种代谢物可包括在如本申请中上述的表A、表B和/或表C中列出的代谢物。
根据本申请的又一方面,提供了一种检测受试者的III/IV期CRC的方法。所述方法可以包括(a)用质谱法量化来自受试者的样本中一组多种代谢物的一种或以上组分的丰度,其中多种代谢物包括表A的代谢物;(b)通过处理步骤(a)中量化的每种代谢物的浓度来确定样本分数;(c)通过将预测值与界限值进行比较来检测受试者的III/IV期CRC。在一些实施例中,多种代谢物可包括在如本申请中上述的表A、表B和/或表C中列出的代谢物。
根据本申请的另一方面,提供了一种治疗受试者的CRC/CRA的方法。所述方法可以包括根据本申请中上述的方法检测CRC/CRA,并对受试者进行CRC/CRA治疗。
在一些实施例中,所述方法可以进一步包括用结肠镜检查验证CRC/CRA。
在一些实施例中,治疗还可包括结肠切除术或造口术。
在一些实施例中,治疗还可包括化学疗法、放射疗法、靶向药物疗法或免疫疗法。
在一些实施例中,治疗可以包括姑息治疗。
根据本申请的另一方面,提供了一种识别肠道微生物组相关(GMA)代谢物作为CRC/CRA预测组的生物标志物的方法。在一些实施例中,所述方法可以包括通过对来自CRC/CRA患者和未患有CRC/CRA的人的对照组的样本进行非靶向质谱分析来获得源数据。所述方法可以进一步包括识别在CRC/CRA患者中显著改变的第一组代谢物。通过选择与肠道微生物组显著相关的代谢物,可以从第一组中识别出第二组代谢物。该方法还可包括使用选择模型从第二组代谢物中选择用于预测组的GMA代谢物。
在一些实施例中,所述方法还可以包括用宏基因组测序验证第二组代谢物。
在一些实施例中,选择模型可以利用最小绝对收缩和选择算子(LASSO)算法。
附加特征将部分地在随后的描述中阐述,并且部分地在审阅以下内容和附图后对本领域技术人员来说将变得显而易见,或者可以通过示例的生产或操作而获知附加特征。本公开的特征可以通过以下讨论的详细示例中阐述的方法、工具和组合的各个方面的实践或使用来实现和获得。
附图说明
本申请将以示例性实施例的方式进一步说明,这些示例性实施例将通过附图进行详细描述。这些实施例并非限制性的,其中:
图1A是根据本申请的一些实施例所示的实验设计和分析程序的概览的示意图;
图1B是根据本申请的一些实施例所示的在负离子模式和正离子模式下非靶向LC-MS特征的R2值的分布图的分析图;
图1C是根据本申请的一些实施例所示的在负离子模式中代谢物特征的均方根误差(RMSE)值的分布的分析图;
图1D是根据本申请的一些实施例所示的在正离子模式中代谢物特征的均方根误差(RMSE)值分布的分析图;
图1E是根据本申请的一些实施例所示的所有合并CRC样本中非靶向LC-MS特征的方差系数(CV%)的分布图的分析图;
图1F是根据本申请的一些实施例所示的所有样本的代谢物的主成分分析(PCA)图;
图1G是根据本申请的一些实施例所示的的正常组、腺瘤组和结直肠癌组中显著变化代谢物的计数的比较图;
图1H是根据本申请的一些实施例所示的PCA图,说明基于在腺瘤和结直肠中显示显著变化的代谢物,来区分来自正常受试者(N,蓝色)、腺瘤受试者(A,红色)和结直肠癌受试者(C,绿色)的样本的血清代谢组学状态;
图2A是根据本申请一些实施例所示的匹配组中的粪便宏基因组和血清代谢组的整合分析程序的分析图;
图2B是根据本申请一些实施例所示的在物种水平的每个个体中的15个OUT的条形图;
图2C是根据本申请一些实施例所示的匹配组群的正常和结直肠异常患者中几种CRC相关肠道微生物组种类的相对丰度的分析图;
图2D是根据本申请一些实施例所示的结直肠异常受试者的肠道微生物组和血清代谢物之间的相关关系图;
图2E是根据本申请的一些实施例所示的CRC相关肠道微生物与其相关血清代谢物之间的协变的桑基图;
图3A是根据本申请一些实施例所示的预测模型根据验证集利用表A中列出的8种代谢物的丰度的ROC曲线;
图3B是根据本申请一些实施例所示的基于靶向代谢组的8种代谢物的ROC曲线的分析图;
图3C是根据本申请一些实施例所示的使用非靶向代谢组分析的正常人和结直肠不健康患者的PCA图;
图3D是根据本申请一些实施例所示的使用靶向代谢组分析的正常和结直肠不健康患者的PCA图;
图3E是根据本申请的一些实施例所示的CRC肠道微生物组相关血清代谢物(GMSM)列表的ROC曲线的分析图,用于基于匹配组中的非靶向代谢组学分析来区分正常组和结直肠异常组;
图3F是根据本申请一些实施例所示的CICAM和SD的正常和结直肠不健康患者使用代谢组分析的PCA图;
图4A是根据本申请的一些实施例所示的表示GMSM组在建模组中的鉴别效率的ROC曲线的分析图;
图4B是根据本申请的一些实施例所示的建模组中正常和结直肠异常受试者的CRC和腺瘤生物标志物特征评分的分析图;
图4C根据本申请的一些实施例示出了表示预测模型在0.541的界限分数下对验证组中的判别效率的ROC曲线;
图4D是根据本申请的一些实施例所示的表示CRC GMSM组在验证组中对于腺瘤患者和正常受试者的区分效率;
图5A是根据本申请的一些实施例所示的表示CEA和CRC预测模型的区分效率的ROC曲线;
图5B是根据本申请的一些实施例所示的用于区分正常人和结直肠异常患者的预测模型和CEA效率的图形比较的散点图;
图6A-图6D是根据本申请的一些实施例所示的CRC GMSM模型在验证组中的鉴别效率的ROC曲线。
具体实施方式
为了更清楚地说明本申请实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单的介绍。显而易见地,下面描述中的附图仅仅是本申请的一些示例或实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图将本申请应用于其它类似情景。除非从语言环境中显而易见或另做说明,图中相同标号代表相同结构或操作。
如本申请和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法也可能包含其它的步骤或元素。
申请中使用了流程图用来说明根据本申请的实施例的系统所执行的操作。应当理解的是,前面或后面操作不一定按照顺序来精确地执行。相反,可以按照倒序或同时处理各个步骤。同时,也可以将其他操作添加到这些过程中,或从这些过程移除某一步或数步操作。
本申请提供了一组可用于诊断结直肠癌或结直肠腺瘤的诊断生物标志物。还提供了使用诊断生物标志物组检测结直肠癌或结直肠腺瘤的方法。例如,本申请提供的方法是利用体液或其他样本(例如血清样本、粪便样本)来检测结直肠癌的非侵入性方法。此外,检测结直肠癌的方法可以检测不同阶段(例如癌前、早期、中期、晚期)的结直肠癌。对受试者检测早期或癌前阶段结直肠癌有效地提高了CRC患者的存活率。相较于传统的结直肠癌检测方法(例如使用CEA生物标志物的方法),本申请提供的结直肠癌检测方法更加准确,能够有效区分CRC/CRA患者与健康人。
如本申请和权利要求书中所示,本申请中的术语“受试者”是指任何人类或非人类动物。例如非人类动物可以包括哺乳动物(例如黑猩猩和其他猿类和猴子物种)、农场动物(例如牛、绵羊、猪、山羊和马)、家养哺乳动物(例如狗和猫)、实验室动物(例如小鼠、大鼠和豚鼠)等。在一些实施方案中,受试者可以包括人。
根据本申请的一个方面,提供了一组可用于诊断结直肠癌(CRC)或腺瘤的诊断生物标志物。在一些实施方案中,腺瘤包括结直肠腺瘤(CRA),其也被称为腺瘤性息肉。本申请中的术语“CRC/CRA”是指CRC或CRA,与正常情况不同。
在一些实施例中,所述组诊断生物标志物可以包括一种或以上与CRC/CRA相关的代谢物。一种或以上代谢物可以由肠道细菌产生或影响,并且可以传送到受试者身体的不同部分以执行各种功能,例如调节功能。如本申请所述,短语“受肠道细菌影响”是指在肠道细菌的作用下代谢物的丰度可能发生改变(例如,增加或减少)。
在一些实施方案中,从正常受试者获得的样本中代谢物的丰度可以不同于从患有CRC/CRA的受试者获得的样本中代谢物的丰度。如本申请所述,术语“丰度”是指特定样本中物质的数量或含量。样本可以是固体样本、流体样本、气体样本等,或其任何组合。固体样本可以包括例如粪便、耳垢等。流体样本可以包括受试者的体液,例如血液、血清、唾液、尿液、汗液等,或其任何组合。气体样本可以包括肠胃气体、呼出气体等。示例地,一种或以上代谢物可以存在于血清中并且可以被称为“血清代谢物”。在一些实施例中,为了测量代谢物的丰度,可以测量流体样本(例如,血清)、固体样本或气体样本(例如,排气)中代谢物的浓度或含量。在一些实施例中,代谢物的丰度可以是标准化值或相对于对照的相对值。在这种情况下,代谢物的丰度也称为“相对丰度”。例如,代谢物的丰度可以反映基于代谢物的测量值和样本中所有代谢物的组合测量值的z分数。在一些实施例中,测量值可以通过质谱法、色谱法(例如,HPLC)和任何其他技术获得。在一些实施例中,对照可以是人工添加到受试者体内的一组化学品的精确浓度或量,例如添加对照。或者,对照可以是从未患有CRC/CRA并且被认为是身体健康的一组受试者中获得的样本的相同代谢物的浓度或量。
表1显示了可用于诊断CRC/CRA的一组示例性代谢物。作为生物标志物的每种代谢物都显示出与CRC/CRA存在强烈而可靠的相关性。在一些实施例中,本申请提供的诊断生物标志物组可以包括表1的一种或以上代谢物。在一些实施例中,诊断生物标志物组可以包括表1中的至少一种代谢物。在一些实施例中,诊断生物标志物组可包括表1的至少两种代谢物。在一些实施例中,诊断生物标志物组可包括表1代谢物中的至少三种。在一些实施例中,诊断生物标志物组可包括至少表1的代谢物中的四种。在一些实施例中,诊断生物标志物组可包括表1中的代谢物中的至少五种。在一些实施例中,诊断生物标志物组可包括表1中的代谢物中的至少六种。在一些实施例中,诊断生物标志物组可以包括表1的至少七种代谢物。在一些实施例中,诊断生物标志物组可以包括表1中的所有代谢物。
表1
在一些实施例中,表1中所示的代谢物可用于检测受试者的CRC/CRA,并可进一步用于促进CRC/CRA的治疗。例如,质谱法(或其他技术)可用于量化样本中一组多种代谢物中一种或以上代谢物的丰度。可以对已量化的每种代谢物的丰度进行处理并用于检测CRC/CRA和/或促进受试者的CRC/CRA的治疗。在一些实施例中,表1中的任何一种代谢物都可以被量化并用于这些目的。在一些实施例中,表1中的任何两种、三种或四种代谢物可以被量化并用于这些目的。在一些实施例中,表1中的任何五种、六种或七种代谢物可被量化并用于这些目的。在一些实施例中,表1中的所有八种代谢物都可以被量化并用于这些目的。
在一些实施例中,表1中的代谢物可以通过质谱法进行量化和识别。表1中所示的代谢物可对应于一种或以上异构体形式。表2显示了与表1中所示代谢物对应的一些示例性化合物,在注释和推断之后。一种或以上这些化合物或生物标志物的丰度可以通过例如质谱法或任何其他技术进行量化,并用于检测受试者的CRC/CRA,和/或促进受试者的CRC/CRA的治疗。在一些实施例中,表1或表2中的每个代谢物可以与肠道微生物组相关。
表2
在一些实施例中,可被量化并用于检测CRC/CRA和/或促进CRC/CRA治疗的一组诊断生物标志物(代谢物)可包括9,12,13-三羟基十八碳-10-烯酸。在一些实施例中,可被量化并用于这些目的且可被量化和用于这些目的的诊断生物标志物组可包括9,12,18-三羟基十八碳-10-烯酸。在一些实施例中,可被量化并用于这些目的的一组诊断生物标志物可包括兵豆苷。在一些实施例中,可量化并用于这些目的的诊断生物标志物组可包括[(6-{[5,7-二羟基-2-(4-氧代环己烷-2,5-二烯-1-亚基)-二氢苯并吡喃-3-基]氧基]-3,4,5-三羟基-2-基)甲基][1-羟基-3-(4-羟基苯基)丙-2-烯-1-亚基]过氧化物。在一些实施例中,可被量化并用于这些目的的一组诊断生物标志物可包括2-辛烯酰肉碱。在一些实施例中,可被量化并用于这些目的的一组诊断生物标志物可包括(E)-2-(4,8-二甲基-3,7-二壬烯-1-基)-5-羟基-2,7-二甲基-二氢苯并吡喃-8-甲醛。在一些实施例中,可被量化并用于这些目的的诊断生物标志物组可包括氮、氧邻二-(三甲基硅基)苯丙氨酸。在一些实施例中,可被量化并用于这些目的的一组诊断生物标志物可包括18-(3-乙基环丙烷-1-烯-1-基)-14-羟基十八碳-4,7,10,12,16-五烯酸。
在一些实施例中,可被量化并用于检测CRC/CRA和/或促进CRC/CRA治疗的一组诊断生物标志物可包括表2的一种或以上代谢物。在一些实施例中,该组可被量化并用于这些目的的诊断生物标志物可包括表2的至少一种代谢物。在一些实施例中,可被量化并用于这些目的的诊断生物标志物组可包括表2的至少两种代谢物。在一些实施例中,可量化并用于这些目的的诊断生物标志物组可包括表2的至少三种代谢物。在一些实施例中,可量化并用于这些目的的诊断生物标志物组可以包括表2的至少四种代谢物。在一些实施例中,可以量化并用于这些目的的诊断生物标志物组可以包括至少五种表2的代谢物。在一些实施例中,可以量化并用于这些目的的诊断生物标志物组可以包括表2的至少六种代谢物。在一些实施例中,诊断生物标志物组可以是被量化和用于这些目的的生物标志物可以包括表2的至少七种代谢物。在一些实施例中,可以被量化和用于这些目的的诊断生物标志物组可以包括表2的所有代谢物。
在一些实施例中,可被量化并用于这些目的的诊断生物标志物组可包括表2中列出的至少两种代谢物。在一些实施例中,所述至少两种代谢物可包括9,12,13-三羟基十八碳-10-烯酸和2-辛烯酰肉碱。在一些实施例中,至少两种代谢物可包括9,12,13-三羟基十八碳-10-烯酸和(E)-2-(4,8-二甲基-3,7-二壬烯-1-基)-5-羟基-2,7-二甲基-二氢苯并吡喃-8-甲醛。在一些实施例中,至少两种代谢物可包括兵豆苷和2-辛烯酰肉碱。在一些实施例中,至少两种代谢物可包括兵豆苷和氮、氧邻二-(三甲基硅基)苯丙氨酸。在一些实施例中,至少两种代谢物可包括[(6-{[5,7-二羟基-2-(4-氧代环己烷-2,5-二烯-1-亚基)-二氢苯并吡喃-3-基]氧基]-3,4,5-三羟基-2-基)甲基][1-羟基-3-(4-羟基苯基)丙-2-烯-1-亚基]过氧化物和2-辛烯酰肉碱。在一些实施例中,至少两种代谢物可包括2-辛烯酰肉碱和氮、氧邻二-(三甲基硅基)苯丙氨酸。在一些实施例中,至少两种代谢物可包括2-辛烯酰肉碱和18-(3-乙基环丙烷-1-烯-1-基)-14-羟基十八碳-4,7,10,12,16-五烯酸。在一些实施例中,至少两种代谢物可包括(E)-2-(4,8-二甲基-3,7-二壬烯-1-基)-5-羟基-2,7-二甲基-二氢苯并吡喃-8-甲醛和氮、氧邻二-(三甲基硅基)苯丙氨酸。
在一些实施例中,可被量化并用于这些目的的诊断生物标志物组可包括表3中列出的至少三种代谢物。在一些实施例中,可被量化并用于这些目的的诊断生物标志物组可包括9,12,13-三羟基十八碳-10-烯酸、9,12,18-三羟基十八碳-10-烯酸和氮、氧邻二-(三甲基硅基)苯丙氨酸。在一些实施例中,可被量化并用于这些目的的一组诊断生物标志物可包括9,12,13-三羟基十八碳-10-烯酸、兵豆苷和2-辛烯酰肉碱。在一些实施例中,可量化并用于这些目的的一组诊断生物标志物可包括9,12,13-三羟基十八碳-10-烯酸、[(6-{[5,7-二羟基-2-(4-氧代环己烷-2,5-二烯-1-亚基)-二氢苯并吡喃-3-基]氧基]-3,4,5-三羟基-2-基)甲基][1-羟基-3-(4-羟基苯基)丙-2-烯-1-亚基]过氧化物和2-辛烯酰肉碱。在一些实施例中,可量化并用于这些目的的诊断生物标志物组可包括9,12,13-三羟基十八碳-10-烯酸、(E)-2-(4,8-二甲基-3,7-二壬烯-1-基)-5-羟基-2,7-二甲基-二氢苯并吡喃-8-甲醛和氮、氧邻二-(三甲基硅基)苯丙氨酸。在一些实施例中,可量化并用于这些目的的诊断生物标志物组可包括9,12,13-三羟基十八碳-10-烯酸、(E)-2-(4,8-二甲基-3,7-二壬烯-1-基)-5-羟基-2,7-二甲基-二氢苯并吡喃-8-甲醛和氮、氧邻二-(三甲基硅基)苯丙氨酸。在一些实施例中,可被量化并用于这些目的的一组诊断生物标志物可包括9,12,18-三羟基十八碳-10-烯酸、兵豆苷和2-辛烯酰肉碱。在一些实施例中,可量化并用于这些目的的一组诊断生物标志物可包括9,12,18-三羟基十八碳-10-烯酸、兵豆苷和(E)-2-(4,8-二甲基-3,7-二壬烯-1-基)-5-羟基-2,7-二甲基-二氢苯并吡喃-8-甲醛。在一些实施例中,可量化并用于这些目的的诊断生物标志物组可包括9,12,18-三羟基十八碳-10-烯酸、[(6-{[5,7-二羟基-2-(4-氧代环己烷-2,5-二烯-1-亚基)-二氢苯并吡喃-3-基]氧基]-3,4,5-三羟基-2-基)甲基][1-羟基-3-(4-羟基苯基)丙-2-烯-1-亚基]过氧化物和2-辛烯酰肉碱。在一些实施例中,可量化并用于这些目的的诊断生物标志物组可包括9,12,18-三羟基十八碳-10-烯酸、[(6-{[5,7-二羟基-2-(4-氧代环己烷-2,5-二烯-1-亚基)-二氢苯并吡喃-3-基]氧基]-3,4,5-三羟基-2-基)甲基][1-羟基-3-(4-羟基苯基)丙-2-烯-1-亚基]过氧化物和(E)-2-(4,8-二甲基-3,7-二壬烯-1-基)-5-羟基-2,7-二甲基-二氢苯并吡喃-8-甲醛。在一些实施例中,可被量化并用于这些目的的一组诊断生物标志物可包括9,12,18-三羟基十八碳-10-烯酸、2-辛烯酰肉碱和(E)-2-(4,8-二甲基-3,7-二壬烯-1-基)-5-羟基-2,7-二甲基-二氢苯并吡喃-8-甲醛。在一些实施例中,可被量化并用于这些目的的一组诊断生物标志物可包括9,12,18-三羟基十八碳-10-烯酸、2-辛烯酰肉碱和18-(3-乙基环丙烷-1-烯-1-基)-14-羟基十八碳-4,7,10,12,16-五烯酸。在一些实施例中,可量化并用于这些目的的诊断生物标志物组可包括9,12,18-三羟基十八碳-10-烯酸、(E)-2-(4,8-二甲基-3,7-二壬烯-1-基)-5-羟基-2,7-二甲基-二氢苯并吡喃-8-甲醛和氮、氧邻二-(三甲基硅基)苯丙氨酸。在一些实施例中,可被量化并用于这些目的的一组诊断生物标志物可包括9,12,18-三羟基十八碳-10-烯酸、氮、氧邻二-(三甲基硅基)苯丙氨酸和18-(3-乙基环丙烷-1-烯-1-基)-14-羟基十八碳-4,7,10,12,16-五烯酸。在一些实施例中,可量化并用于这些目的的诊断生物标志物组可包括兵豆苷、[(6-{[5,7-二羟基-2-(4-氧代环己烷-2,5-二烯-1-亚基)-二氢苯并吡喃-3-基]氧基]-3,4,5-三羟基-2-基)甲基][1-羟基-3-(4-羟基苯基)丙-2-烯-1-亚基]过氧化物和2-辛烯酰肉碱。在一些实施例中,可量化并用于这些目的的诊断生物标志物组可包括兵豆苷、[(6-{[5,7-二羟基-2-(4-氧代环己烷-2,5-二烯-1-亚基)-二氢苯并吡喃-3-基]氧基]-3,4,5-三羟基-2-基)甲基][1-羟基-3-(4-羟基苯基)丙-2-烯-1-亚基]过氧化物和18-(3-乙基环丙烷-1-烯-1-基)-14-羟基十八碳-4,7,10,12,16-五烯酸。在一些实施例中,可被量化并用于这些目的的诊断生物标志物组可包括兵豆苷、2-辛烯酰肉碱和氮、氧邻二-(三甲基硅基)苯丙氨酸。在一些实施例中,可被量化并用于这些目的的一组诊断生物标志物可包括兵豆苷、2-辛烯酰肉碱和18-(3-乙基环丙烷-1-烯-1-基)-14-羟基十八碳-4,7,10,12,16-五烯酸。在一些实施例中,可量化并用于这些目的的诊断生物标志物组可包括[(6-{[5,7-二羟基-2-(4-氧代环己烷-2,5-二烯-1-亚基)-二氢苯并吡喃-3-基]氧基]-3,4,5-三羟基-2-基)甲基][1-羟基-3-(4-羟基苯基)丙-2-烯-1-亚基]过氧化物、2-辛烯酰肉碱和(E)-2-(4,8-二甲基-3,7-二壬烯-1-基)-5-羟基-2,7-二甲基-二氢苯并吡喃-8-甲醛。
在一些实施例中,可被量化并用于这些目的的一组诊断生物标志物可包括[(6-{[5,7-二羟基-2-(4-氧代环己烷-2,5-二烯-1-亚基)-二氢苯并吡喃-3-基]氧基]-3,4,5-三羟基-2-基)甲基][1-羟基-3-(4-羟基苯基)丙-2-烯-1-亚基]过氧化物、2-辛烯酰肉碱和氮、氧邻二-(三甲基硅基)苯丙氨酸。
在一些实施例中,可被量化并用于这些目的的一组诊断生物标志物可包括[(6-{[5,7-二羟基-2-(4-氧代环己烷-2,5-二烯-1-亚基)-二氢苯并吡喃-3-基]氧基]-3,4,5-三羟基-2-基)甲基][1-羟基-3-(4-羟基苯基)丙-2-烯-1-亚基]过氧化物、2-辛烯酰肉碱和18-(3-乙基环丙烷-1-烯-1-基)-14-羟基十八碳-4,7,10,12,16-五烯酸。在一些实施例中,可量化并用于这些目的的诊断生物标志物组可包括[(6-{[5,7-二羟基-2-(4-氧代环己烷-2,5-二烯-1-亚基)-二氢苯并吡喃-3-基]氧基]-3,4,5-三羟基-2-基)甲基][1-羟基-3-(4-羟基苯基)丙-2-烯-1-亚基]过氧化物、E)-2-(4,8-二甲基-3,7-二壬烯-1-基)-5-羟基-2,7-二甲基-二氢苯并吡喃-8-甲醛和氮、氧邻二-(三甲基硅基)苯丙氨酸。在一些实施例中,可量化并用于这些目的的诊断生物标志物组可包括[(6-{[5,7-二羟基-2-(4-氧代环己烷-2,5-二烯-1-亚基)-二氢苯并吡喃-3-基]氧基]-3,4,5-三羟基-2-基)甲基][1-羟基-3-(4-羟基苯基)丙-2-烯-1-亚基]过氧化物、2-辛烯酰肉碱和18-(3-乙基环丙烷-1-烯-1-基)-14-羟基十八碳-4,7,10,12,16-五烯酸。
在一些实施例中,可被量化并用于这些目的的一组诊断生物标志物可包括2-辛烯酰肉碱、(E)-2-(4,8-二甲基-3,7-二壬烯-1-基)-5-羟基-2,7-二甲基-二氢苯并吡喃-8-甲醛和18-(3-乙基环丙烷-1-烯-1-基)-14-羟基十八碳-4,7,10,12,16-五烯酸。在一些实施例中,可被量化并用于这些目的的一组诊断生物标志物可包括2-辛烯酰肉碱、氮、氧邻二-(三甲基硅基)苯丙氨酸和18-(3-乙基环丙烷-1-烯-1-基)-14-羟基十八碳-4,7,10,12,16-五烯酸。
表1提供了一组可用于检测CRC/CRA和/或促进CRC/CRA治疗的代谢物(生物标志物)组。然而,在一些实施例中,本申请提供的诊断生物标志物组可包括表1中未列出的一种或以上其他代谢物。例如,本申请提供的诊断生物标志物组可包括表3中的至少一种代谢物。表3中的每种代谢物都可能与肠道微生物组有关。表3中的每种代谢物都被发现与CRC/CRA的存在密切相关。在一些实施例中,可以独立于表1或表2中列出的代谢物,使用表3中的一种或以上代谢物来检测和/或促进受试者的CRC/CRA的治疗。在一些实施例中,除了表1或表2中列出的代谢物之外,可以使用表3中的一种或以上代谢物来检测和/或促进受试者的CRC/CRA的治疗。在一些实施例中,表3中的一种或以上代谢物的丰度可被量化,例如,用质谱法,并可以对该丰度进行处理以检测CRC/CRA和/或促进CRC/CRA的治疗。在一些实施例中,表3中的一种或以上代谢物的丰度可以被量化,例如,用质谱法,与表1或表2的一种或以上代谢物的量化丰度分组,并且被处理用于检测CRC/CRA和/或促进CRC/CRA的治疗。在一些实施例中,仅对表3中代谢物的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21或22种代谢物进行了量化。在一些实施例中,可以量化表3中代谢物的所有23种代谢物的丰度。如上所述,表3中代谢物的量化丰度可以独立于表1或表2中代谢物的量化丰度使用,也可以与表1或表2中代谢物的量化丰度组合在一起。
在一些实施例中,表1或表2的所有八种代谢物以及表3的仅一种代谢物可以被量化、分组在一起、处理并用于检测CRC/CRA和/或促进CRC的治疗/CRA的目的。在一些实施例中,表1或表2的所有八种代谢物,以及仅2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、表3的18、19、20、21或22种代谢物被量化、组合在一起、处理并用于检测受试者的CRC/CRA和/或促进CRC/CRA的治疗。在一些实施例中,表1或表2的所有八种代谢物以及表3的所有23种代谢物可以被量化、分组在一起、处理并用于检测CRC/CRA和/或促进CRC/CRA的治疗目的。
在一些实施例中,可以仅对表1或表2的1、2、3、4、5、6或7种代谢物以及表3的仅一种代谢物进行量化、分组、处理和使用用于检测CRC/CRA和/或促进受试者的CRC/CRA的治疗。在一些实施例中,可以对表1或表2的1、2、3、4、5、6或7种代谢物,以及对表3中仅2、3、4、5、6、7、8、9、10、11、的12、13、14、15、16、17、18、19、20、21或22种代谢物进行量化、分组、处理并用于检测受试者的CRC/CRA和/或促进CRC/CRA的治疗。在一些实施方案中,表1或表2的1、2、3、4、5、6或7种代谢物以及表3的所有23种代谢物可以被量化、分组在一起、处理并用于检测CRC/CRA和/或促进受试者的CRC/CRA的治疗。
表3
作为又一个例子,本申请提供的诊断生物标志物组可以包括表4的一种或以上代谢物。在一些实施例中,本申请提供的诊断生物标志物组可以进一步包括表4中的所有代谢物4。表4中的每种代谢物都可能与肠道微生物组有关。发现表4中的每种代谢物都与CRC/CRA的存在相关。在一些实施例中,可以独立于表1、表2或表3中列出的代谢物使用表4中的一种或以上代谢物来检测和/或促进受试者的CRC/CRA的治疗。在一些实施例中,除了表1或表2中列出的代谢物之外,可以使用表4中的一种或以上代谢物来检测和/或促进受试者的CRC/CRA的治疗。在一些实施例中,除了表1、表2和表3中列出的代谢物之外,可以使用表4中的一种或以上代谢物来检测和/或促进受试者的CRC/CRA的治疗。在一些实施例中,丰度仅为1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、6、45,对表4中代谢物的47、48、49或50种代谢物进行量化。在一些实施例中,量化表4中代谢物的所有51种代谢物的丰度。如上所述,表4代谢物的量化丰度可以独立于表1或表2和表3中代谢物的量化丰度使用,也可以与表1或表3中代谢物的量化丰度组合在一起使用。
在一些实施例中,表1或表2的所有八种代谢物以及表4的仅一种代谢物可以被量化、分组在一起、处理并用于检测CRC/CRA和/或促进受试者CRC/CRA的治疗。在一些实施例中,表1或表2的所有八种代谢物,以及仅2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41,对表4的43、44、45、46、47、48、49或50种代谢物可以进行量化、分组、处理并用于检测受试者的CRC/CRA和/或促进CRC/CRA的治疗。在一些实施例中,表1或表2的所有八种代谢物以及表4的所有51种代谢物可以被量化、分组在一起、处理并用于检测个体中的CRC/CRA和/或促进CRC/CRA的治疗。
在一些实施例中,可以仅对表1或表2的1、2、3、4、5、6或7种代谢物以及表4的仅一种代谢物进行量化、分组、处理,并用于检测CRC/CRA和/或促进受试者CRC/CRA的治疗。在一些实施例中,表1或表2的1、2、3、4、5、6或7种代谢物,以及仅2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、6、35、3对表4的37、38、39、40、41、42、43、44、45、46、47、48、49或50种代谢物进行量化、分组、处理并用于检测CRC/CRA和/或促进受试者CRC/CRA的治疗。在一些实施例中,表1或表2的1、2、3、4、5、6或7种代谢物以及表4的所有51种代谢物被量化、分组在一起、处理并用于检测CRC/CRA和/或促进受试者的CRC/CRA的治疗。
表4
利用表1、表2、表3和/或表4中列出的至少一种代谢物的丰度的预测模型的AUC、特异度和敏感度相对较高,表明利用这些代谢物的丰度可以有效地将患有CRC/CRA的受试者与正常受试者区分开来。
表5显示了表1中列出的代谢物的一些信息。表5中的代谢物的特征是指质荷比,其可以例如使用质谱法来测量。表5中的术语“倍数变化”是指描述量在原始测量和后续测量之间变化多少的参数。表5中的术语“P值”是指在关于检验统计量的未知分布的零假设下,观察到的值比实际观察到的值同样极端或更极端的概率。
表5
应当注意,表1、3或4中列出的一种或以上代谢物可以具有一种或以上异构体形式,其包括在本申请提供的诊断生物标志物组的范围内。
根据本申请的另一方面,提供了一种检测受试者的CRC/CRA的方法。在一些实施例中,所述方法可以包括步骤a):量化来自受试者的样本中一组多种代谢物中的一种或以上组分的丰度。多种代谢物可包括如本申请中上述表1、表2、表3和/或表4中列出的代谢物。在一些实施例中,所述方法还可以包括通过处理步骤a)中量化的每种代谢物的丰度来确定样本分数。在一些实施例中,所述方法还可包括步骤c):通过将样本分数与界限分数进行比较来检测受试者的CRC/CRA。
在一些实施例中,可以使用质谱法(MS;例如液相色谱-质谱法(LC-MS)、气相色谱-质谱法(GC-MS)、基质辅助激光解吸/电离飞行时间质谱(MALDI-TOF MS))、紫外光谱等方法来测量多种代谢物组的一种或以上组分的丰度。
在一些实施例中,样本分数的确定可以在计算设备上实现。计算设备可以获得用于确定样本分数的预测模型。在步骤a)中量化的每种代谢物的丰度可以输入到预测模型中。预测模型可以处理在步骤a)中量化的每种代谢物的丰度并输出样本分数。样本分数可以指示受试者患有CRC/CRA的概率。
仅作为示例,步骤a)中量化的每种代谢物的丰度可以通过测量每种代谢物的浓度来量化。在一些实施例中,测量的浓度可以被标准化。例如,测量的浓度可以除以样本中所有代谢物的总浓度。
在一些实施例中,预测模型可以是训练模型。可以使用多个训练数据集来获得和训练初步模型。多个训练数据集的每一个可以包括样本对象的样本代谢物的浓度和指示样本对象是否患有CRC/CRA或正常的标签。多个样本受试者可以包括多个未患有CRC/CRA的正常受试者、多个患有CRC的受试者和多个患有CRA的受试者。仅作为示例,标签可以是0-1之间的值。如果样本对象正常,则对应标签的值可以指定为0。如果样本对象具有CRC/CRA,则对应标签的值可以指定为1。相应地,预测模型输出的样本分数可以是0到1之间的值。样本分数越接近1,受试者患有CRC/CRA的概率越高。
在一些实施例中,可以通过逻辑回归方法、基于支持向量机(SVM)的方法、基于贝叶斯分类器的方法、基于K-最近邻(KNN)的方法、决策树方法等或其任何组合来建立预测模型。
在步骤c)中,将样本分数与预测模型相关的界限分数进行比较。如本文所用,术语“界限值”是指测量尺度上的分界点,其中测试结果被分为不同的类别。在一些实施例中,当样本分数等于或大于界限分数时,计算设备可以确定受试者具有CRC/CRA。界限值可以基于预测模型的性能来确定。在一些实施例中,界限值可以是0.35-0.65之间的值。在一些实施例中,界限值可以是0.40-0.60之间的值。在一些实施例中,界限值可以是0.45-0.55之间的值。例如,界限值可以是0.48、0.50、0.52、0.541、0.55等。
在一些实施例中,接收者操作特性(ROC)曲线可以用于评估预测模型的性能。ROC曲线可以说明预测模型的诊断能力,因为其界限值是变化的。ROC曲线通常是通过绘制敏感度对特异度的图来生成的。可以基于ROC曲线确定曲线下面积(AUC)。AUC可以指示分类器(即预测模型)将随机选择的正实例排名高于随机选择的负实例的概率。
在一些实施例中,本申请提供的预测模型的AUC可以大于0.7。在一些实施例中,本申请提供的预测模型的AUC可以大于0.75。在一些实施例中,本申请提供的预测模型的AUC可以大于0.77。在一些实施例中,本申请提供的预测模型的AUC可以大于0.8。在一些实施例中,本申请提供的预测模型的AUC可以大于0.85。在一些实施例中,本申请提供的预测模型的AUC可以大于0.9。在一些实施例中,本申请提供的预测模型的AUC可以大于0.95。
在一些实施例中,用于检测CRC/CRA的预测模型的敏感度可以等于或大于70%。在一些实施例中,预测模型检测CRC/CRA的敏感度可以等于或大于75。在一些实施例中,预测模型检测CRC/CRA的敏感度可以等于或大于80%。在一些实施例中,用于检测CRC/CRA的预测模型的敏感度可以等于或大于85%。在一些实施例中,用于检测CRC/CRA的预测模型的敏感度等可以于或大于90%。在一些实施例中,用于检测CRC/CRA的预测模型的敏感度可以等于或大于95%。
在一些实施例中,用于检测CRC/CRA的预测模型的特异度可以等于或大于70%。在一些实施例中,用于检测CRC/CRA的预测模型的特异度可以等于或大于75。在一些实施例中,用于检测CRC/CRA的预测模型的特异度可以等于或大于80%。在一些实施例中,用于检测CRC/CRA的预测模型的特异度可以等于或大于85%。在一些实施例中,用于检测CRC/CRA的预测模型的特异度可以等于或大于90%。在一些实施例中,用于检测CRC/CRA的预测模型的特异度可以等于或大于95%。
图3A是根据本申请一些实施例所示的基于非靶向代谢组学分析的验证集利用表1中列出的8种代谢物的丰度的预测模型的ROC。具体地,图1中的ROC。图3A涉及示例性预测模型,其利用表1中列出的8种代谢物的丰度来确定样本得分。需要说明的是,本申请提供的预测模型可以利用表1所列8种代谢物中至少一种的丰度。图3A仅为说明目的而提供。如图3A所示,AUC约为0.95,敏感度约为95.4%,特异度约为94%。如本文所用,术语“约”是指值可以在相对小的范围内变化(例如,±0.02%或±0.05%)。
图4C是根据本申请一些实施例所示的ROC曲线,其显示了在0.541的界限分数下验证组中预测模型的区分效率。如图4C所示,预测模型在这个验证集中达到了0.91的AUC、87.9%的敏感度和81%的特异度。
关于利用各种诊断生物标志物组的预测模型的区分效率的更多描述可以在本申请的其他地方找到,例如在实施例7和实施例8中。如这些实施例中所示,AUC、特异度和预测模型的敏感度相对较高,表明利用这些代谢物丰度的预测模型可以有效区分CRC/CRA受试者和正常受试者。
在一些实施例中,用于检测CRC/CRA的方法还可包括使用其他方法验证CRC/CRA,例如结肠镜检查、活检测试、计算机断层扫描(CT)、磁共振成像(MRI)扫描,或类似方式,或其任何组合。
根据本申请的另一方面,提供了一种检测受试者的CRA的方法。所述方法可以包括步骤a):量化来自受试者的样本中一组多种代谢物的至少五种组分的丰度。所述方法还可以包括步骤b):通过处理步骤a)中量化的每种代谢物的丰度来确定样本分数。所述方法还可以进一步包括步骤c):通过将预测值与界限值进行比较来检测受试者的CRA。在一些实施例中,多种代谢物可以包括在如本申请前面所述的表1、表2、表3和或表4中列出的代谢物。
在一些实施例中,步骤b)还可以包括将步骤(a)中量化的每种代谢物的丰度标准化,并通过用预测模型处理标准化的丰度来确定样本分数。可以使用多个训练数据集来建立预测模型。例如,多个训练数据集中的每一个可以包括样本对象的样本代谢物的浓度和指示样本对象是否具有CRC或正常的标签。多个样本受试者可以包括多个未患有CRC的正常受试者和多个具有CRC的受试者。
在一些实施例中,预测模型可用于区分不同阶段的正常人与CRC患者。在一些实施例中,多个患有CRC的样本受试者可以包括多个患有癌前阶段(0期)CRC的受试者。在一些实施例中,多个患有CRC的样本受试者可以包括多个患有早期(阶段I)CRC的受试者。在一些实施例中,多个患有CRC的样本受试者可以包括多个患有中期(阶段II)CRC的受试者。在一些实施例中,多个患有CRC的样本受试者可以包括多个患有晚期(III期和IV期)CRC的受试者。在一些实施例中,用于检测CRC的预测模型可以按照与本公开前面描述的用于检测CRC/CRA的预测模型类似的方式来建立。
在一些实施例中,用于检测CRC的预测模型的敏感度可以等于或大于65%。在一些实施例中,用于检测CRC的预测模型的敏感度可以等于或大于70%。在一些实施例中,用于检测CRC的预测模型的敏感度可以等于或大于75%。在一些实施例中,用于检测CRC的预测模型的敏感度可以等于或大于80%。在一些实施例中,用于检测CRC/CRA的预测模型的敏感度可以等于或大于85%。在一些实施例中,用于检测CRC的预测模型的敏感度可以等于或大于90%。
在一些实施例中,用于检测CRC的预测模型的特异度可以等于或大于70%。在一些实施例中,用于检测CRC的预测模型的特异度可以等于或大于75%。在一些实施例中,用于检测CRC的预测模型的特异度可以等于或大于80%。在一些实施例中,用于检测CRC的预测模型的特异度可以等于或大于85%。在一些实施例中,用于检测CRC的预测模型的特异度可以等于或大于90%。
例如,如将在实施例6中描述的,用于检测CRC的预测模型用于区分具有0/I期CRC的受试者和正常受试者,并且具有0.85的AUC、82.1%的敏感度和81%特异度(参见例如图6B)。用于检测CRC的预测模型也用于区分患有II期CRC的受试者和正常受试者,并且具有0.89的AUC、88.9%的敏感度和81%的特异度(参见例如图6C)。检测CRC的预测模型也用于区分患有III/IV期CRC的受试者与正常受试者,并且具有0.91的AUC、85%的敏感度和81%的特异度。
根据本申请的又一方面,提供了一种检测受试者的I/II期CRC的方法。所述方法可以包括(a)用质谱法量化来自受试者的样本中一组多种代谢物的一种或以上组分的丰度,其中多种代谢物包括表1的代谢物;(b)通过处理步骤(a)中量化的每种代谢物的浓度来确定样本分数;(c)通过将预测值与界限值进行比较来检测受试者的I/II期CRC。在一些实施例中,多种代谢物可包括在如本申请前面所述的表1、表2、表3和/或表4中列出的代谢物。
在一些实施例中,步骤b)还可以包括将步骤(a)中量化的每种代谢物的丰度标准化,并通过用预测模型处理标准化的丰度来确定样本分数。可以使用多个训练数据集来建立预测模型。例如,多个训练数据集中的每一个可以包括样本对象的样本代谢物的浓度和指示样本对象是否患有I/II期CRC或正常的标签。多个样本受试者可以包括多个未患有CRC的正常受试者和多个患有I/II期CRC的受试者。
根据本申请的又一方面,提供了一种检测受试者的III/IV期CRC的方法。所述方法可以包括(a)用质谱法量化来自受试者的样本中一组多种代谢物的一种或以上组分的丰度,其中多种代谢物包括表1的代谢物;(b)通过处理步骤(a)中量化的每种代谢物的浓度来确定样本分数;(c)通过将预测值与界限值进行比较来检测受试者的III/IV期CRC。在一些实施例中,多种代谢物可包括在表1、表2、表3和/或表4中列出的代谢物,如本申请前面所述。
在一些实施例中,步骤b)还可以包括将步骤(a)中量化的每种代谢物的丰度标准化,并通过用预测模型处理标准化的丰度来确定样本得分。可以使用多个训练数据集来建立预测模型。例如,多个训练数据集的每一个可以包括样本对象的样本代谢物的浓度和指示样本对象是否患有III/IV期CRC或正常的标签。多个样本受试者可以包括多个未患有CRC的正常受试者和多个患有III/IV期CRC的受试者。
根据本申请的另一方面,提供了一种治疗受试者的CRC/CRA的方法。所述方法可以包括根据本申请中较早描述的方法检测CRC/CRA,并对受试者进行CRC/CRA治疗。
在一些实施例中,治疗CRC/CRA的方法还可包括使用其他方法验证CRC/CRA,例如结肠镜检查、活检测试、计算机断层扫描(CT)扫描、磁共振成像(MRI)扫描,或类似的,或其任何组合。在一些实施例中,本申请的过程可以进一步包括用结肠镜检查、活检测试、计算机断层扫描(CT)扫描、磁共振成像(MRI)扫描等或其任何组合,来安排验证CRC/CRA。在一些实施例中,这些方法可用于区分CRC和CRA,从而可以应用适当的治疗。
在一些实施例中,治疗可包括化学疗法、放射疗法、靶向药物疗法、免疫疗法等,或其任何组合。在一些实施例中,治疗可包括姑息治疗。例如,当受试者被诊断出患有晚期CRC并且其他治疗方法被证明无效时,可以为受试者提供姑息治疗以减轻受试者的疼痛和压力。如本文所用,“治疗CRC/CRA”或“治疗CRC”是指部分或完全抑制、延迟或预防结直肠癌的包括癌症转移在内的进展,抑制、延迟或预防癌症的包括癌症转移在内的复发,或预防哺乳动物(例如人类)癌症的发生或发展(化学预防)。此外,本申请的方法可用于治疗患有癌症的人类患者。然而,这些方法也可能对治疗其他哺乳动物的癌症有效。
根据本申请的另一方面,提供了一种识别肠道微生物组相关(GMA)代谢物作为CRC/CRA预测组的生物标志物的方法。在一些实施例中,所述方法可以包括通过对来自CRC/CRA患者和未患有CRC/CRA的人的对照组的样本进行非靶向质谱分析来获得源数据。所述方法可以进一步包括识别在CRC/CRA患者中显著改变的第一组代谢物。通过选择与肠道微生物组显著相关的代谢物,可以从第一组中识别出第二组代谢物。所述方法还可包括使用选择模型从第二组代谢物中选择用于预测组的GMA代谢物。
在一些实施例中,可以使用源数据进行代谢组学概况分析以识别第一组代谢物。
在一些实施例中,第二组代谢物可通过相关分析选自第一组代谢物。例如,可以在CRC/CRA患者中进行Pearson相关系数分析,以分析相对丰度高于第一阈值的肠道微生物组物种和丰度高于第二阈值的代谢物。例如,特定肠道微生物组物种的相对丰度可以基于样本中微生物组物种的数量与所有微生物组物种的数量之比来确定。代谢物的相对丰度可以基于对应代谢物的MS/MS检测片段的总计数来确定。例如,第一阈值可以是0.01%-1%之间的值,例如0.01%、0.05%、0.1%、0.5%等。又例如,第二阈值可以是1000-20000之间的值,例如1000、3000、5000、10000、12000、15000、18000、20000等。
在一些实施例中,可以使用来自CRC/CRA患者和未患有CRC/CRA的人的对照组的粪便样本来检测肠道微生物组种类及其丰度。可以使用宏基因组测序检测肠道微生物组种类及其在粪便样本中的丰度。例如,可以从粪便样本中提取核酸用于宏基因组测序。
在一些实施例中,可以使用选择模型从第二组代谢物中选择用于预测组的GMA代谢物。例如,选择模型可以是基于回归算法的模型。回归算法可以包括但不限于最小绝对收缩和选择算子(LASSO)算法、线性回归算法、多项式回归算法、岭回归算法、ElasticNet回归算法等,或者它们的任意组合。
在一些实施例中,为了确定预测组的GMA代谢物,可以进一步评估使用选择模型选择的代谢物的诊断效率的稳定性。例如,如果代谢物在非靶向和靶向检测中表现出一致的上调或下调趋势,则认为该代谢物的诊断效率是稳定的。此外或可选地,如果代谢物可以使用不同的方法(例如,靶向LC-MS检测、非靶向代谢组)进行稳定测量,则代谢物的诊断效率被认为是稳定的。
本申请提供的方法和代谢物生物标志物根据以下实施例进一步描述,其不应被解释为限制本公开的范围。
实施例
方法
用于CRC代谢组学分析的血清组
通过在2017年至2019年之间随机选择512名年龄在45至75岁之间的受试者来建立血清组。排除接受术前放疗或化疗治疗或具有CRC既往史的受试者。血清组分为三组,即发现组、建模组和验证组。该发现组包括92名受试者,分为三组,分别命名为正常组、腺瘤组和结直肠癌组。正常组(或简称N)包括31名受试者。腺瘤组(或简称A)包括12名受试者。结直肠癌组(或简称C)包括49名受试者。建模组包括265名受试者,其中97名受试者为正常人,168名受试者为结直肠异常患者。建模组中30%的受试者被随机选入训练集,其余的被选入测试集。验证集包括189名受试者,其中69名正常受试者和120名结直肠异常患者。病理诊断和分期是根据美国癌症联合委员会和国际癌症控制联盟维护的肿瘤-淋巴结-转移(TNM)分期系统确定的。在治疗前对三组受试者的血液进行取样。
血便匹配样本组
建立了包括55名受试者的粪便-血清匹配组(或称为匹配组),其中16名受试者是正常的并且39名受试者是患有结直肠癌或腺瘤的患者。粪便和血清均来自同一受试者。粪便样本用液氮速冻并储存在-80℃直至进一步使用。
用于非靶向代谢组学的代谢物提取
对于非靶向代谢组学检测中的代谢物提取,将240mL乙腈/异丙醇(3:1,体积比)添加到60mL已解冻的血清样本中,达到300mL体积的血清溶液。为了沉淀血清蛋白,将60μL甲酸铵(0.5g/ml)与6μL内标溶液(含100μg/mL L-酪氨酸-(苯基-3,5-d2))一起加入血清溶液中,Sigma-Aldrich;10μg/mL的13C-胆酸,Cambridge Isotope Laboratories;60μg/mL的度骨化醇,MedChem Express)以获得混合血清溶液。内标溶液包括100μg/mL L-酪氨酸-(苯基-3,5-d2)(Sigma-Aldrich)、10μg/mL 13C-胆酸(Cambridge Isotope Laboratories)和60μg/mL多克骨化醇(MedChem Express)。将混合血清溶液涡旋4分钟,以13,000rpm(或17,949g)离心5分钟。然后,将含有混合血清溶液所有代谢物的200μL上清液转移到另一个管中,并通过centrivap冷阱离心干燥以获得干燥的代谢物提取物。最后,用含有0.1%甲酸(Thermo Fisher)的75μL 55%甲醇(Thermo Fisher)重构干燥的代谢物提取物以进行进一步分析。
用于靶向代谢组学的代谢物提取
对于靶向代谢组学检测中的代谢物提取,除以下修改外,使用上述类似方法。将包含5μg/mL 13C-胆酸的6μL内标溶液与240μL乙腈和异丙醇(比例为4:1,Thermo Fisher)和60μL甲酸铵(0.5g/mL)混合,得到混合溶液。将混合溶液以13,000rpm(17,949g)离心5分钟。混合溶液的上清液80μL在使用前用200μL水稀释。
质控样本的准备
来自发现组中每个正常受试者和每个CRC受试者的血清分别合并为C-pool和N-pool(每个合并样本的总体积为10mL)。通过将10%、20%、30%、40%、50%、75%和90%的C-pool与N-pool按体积混合,制备了一系列7个额外的质量控制(QC)样本。QC样本用于半量化非靶向代谢组学分析。
非靶向代谢组检测
从血清组和粪便-血清匹配组中的发现组中提取的代谢物通过与UltiMate3000UPLC(Thermo Fisher)耦合的Q Exactive或Q Exactive质谱仪进行分析。在全MS扫描模式下以70,0000的分辨率在130至1200Da的质荷比(m/z)范围内采集数据。电喷雾源条件设置如下:鞘气,40psi;毛细管温度,320℃;喷涂电压,3kV(正HESI)和3.2kV(负HESI)。使用CORTECS(Waters)C18柱(1.6μm,2.1*100mm),柱箱温度保持在35℃。流速设置为0.3mL/min,每个样本进样5μL。流动相A(例如,含有0.1%甲酸的乙腈)作为梯度应用(例如,在0.5-14分钟时从5%到45%,在32分钟时为75%,在42分钟时为80%,在50-55分钟并在接下来的5分钟内恢复到5%)。流动相B是含有0.1%甲酸的Merck Millipore水。将得到的质谱结果导出到Progenesis QI软件(Nonlinear Dynamics,Durham,NC,USA)进行进一步处理。
代谢物注释和推断
代谢物注释按照以下修改进行。简而言之,MS-DIAL 4.24用于注释。首先,在公共光谱库中对QC MS1/MS2进行光谱搜索,包括HMDB、MoNA和MassBank。然后通过脂质组学功能进一步利用lipid blast数据库进行检测。应用了默认的相似度分数截止。最后,使用参考数据库进行手动检查,以确认和区分相似的读数。对于在当前条件下无法可靠获取的MS/MS代谢物,根据HMDB和Bio-ML数据库搜索其MZ以推断其潜在身份。代谢物注释的置信水平设置为:来自当前色谱和MS条件中参考化合物的MS/MS>来自公共数据库的MS/MS>MZ匹配。
宏基因组测序和菌群识别
通过QIAamp DNA Stool Mini Kit(QIAGEN)匹配组中涉及的55名受试者的粪便样本进行DNA提取,其中44份DNA样本通过质量控制。全基因组鸟枪法宏基因组测序用于肠道微生物组的分类和功能分析。文库制备和随后的宏基因组测序在上海OE生物技术有限公司的HiSeq 4000平台(Illumina)上进行,具有150个碱基对,双端读数,针对每个样本超过10Gb的序列。
使用Trimmomatic V0.36处理原始测序数据,包括接头修整、去除低质量读数或碱基对,以及通过用Bowtie 2对人类基因组(hg19)作图来去除宿主污染。之后,得到清洁读数并用带有默认参数的MetaPhlAn2 2.2.0版对清洁参数进一步分类分析。总共分析了12445种微生物组物种,其中,只有640种在至少1个受试者中相对丰度超过0.1%的物种被考虑进行进一步的微生物组-代谢组相关分析。
靶向代谢组学检测
ExionLC AC系统连接到以独立离子模式(正离子和负离子)运行的6500QTrap质谱仪(Sciex)。反相液相色谱的流动相和色谱柱与非目标代谢物分析的相同。每个样本的进样量为10μl。每次转换的停留时间为10ms,使用中等碰撞气体,气帘为40,离子喷雾电压为5,000V和-4,500V,源温度为450℃。代谢物以0.3mL/min的流速从色谱柱上洗脱下来,最初使用12%的流动相B,然后在2.5分钟内增加到60%的流动相B。流动相B的线性60%-85%和85%-100%分别设置为6分钟和8.5分钟。靶向分析的质控样本合并如下:对照组(252个样本)、癌症组(261个样本)和对照组:癌症组(1:1)。从对照组的质量控制样本中优化去簇电位和碰撞能量。使用Sciex Analyst 1.6.3软件对代谢物峰进行积分。
CRC和邻近正常组织的气流辅助解吸电喷雾电离质谱成像(AFADESI-MSI)分析
对于质谱成像,共收集9对人类结直肠组织样本,包括晚期腺瘤或CRC以及匹配的相邻非癌组织。样本在活检后立即用液氮冷冻,转移到低温小瓶中并保存于-80℃。使用CM1860UV低温切片机(Leica)进行10μm切片。相邻切片被解冻安装在显微镜载玻片上,用于常规H-E染色和质谱成像。
ADADESI-MSI分析是使用Q-Exactive质谱仪(Thermo Scientific)在70至1,000m/z范围内以70,000质量分辨率在正离子和负离子模式下进行的。简而言之,ADAESI-MSI条件如下。在电离期间以5μL/min的流速应用乙腈和水的混合物(8:2,体积比)喷雾溶剂。喷雾器和传输管电压在正离子模式下分别设置为7,500和2,000V,在负离子模式下分别设置为-5,500和-1,500V。抽气流速为45L/min,毛细管温度为350℃。ADAESI-MSI扫描沿显微镜载玻片的较长边缘(扫描的X轴)以200μm/s的恒定速率进行设置,并且在Y轴上以200μm的垂直台阶分隔相邻线。扫描从显微镜载玻片的左上角开始,在显微镜载玻片的右下角结束。
数据分析
使用R(v3.6.1)进行数据预处理、统计分析和预测模型构建。
代谢数据处理
使用Progenesis QI软件进行峰提取和比对。为了获得更可靠的峰,保留时间保留1个小数位,m/z具有3个小数位的丰度以聚合代谢物。为了滤除背景信号,在85%以上的受试者中的丰度小于5000或丰度为零的代谢物被排除在外。为了消除批次间的差异,使用R预处理核心软件包(v1.47.1)进行稳健的多阵列平均(RMA)标准化,并计算代谢物的丰度比。
数据统计分析
使用具有Tukey诚实显著差异(HSD)测试的Anova,选择p值小于0.005的代谢物作为显著改变的代谢物。以此结果为基础,筛选出结直肠异常受试者和正常受试者倍数变化小于1.2和大于0.8的代谢物。批次间差异大于15%的代谢物被删除。
肠道微生物组-血清代谢组相关分析
对匹配组中的33名结直肠异常受试者使用肠道微生物组物种和血清代谢物之间的Pearson相关系数进行成对相关系数。计算了每个物种-代谢物对的成对相关系数和p值,并认为与p值的界限值等于或小于1E-3则为显著相关。
实施例1来自发现组的血清中的半量化非靶向代谢组学分析揭示了CRC和腺瘤患者的代谢物显著改变
血清代谢组与结直肠腺瘤或结直肠癌之间的关系是通过LCMS对发现组进行非靶向代谢组谱来确定的。图1A是根据本申请的一些实施例所示的实验设计和分析程序的概览的示意图。如图1A所示,发现组被分为正常组、腺瘤组和结直肠癌组。首先过滤掉低丰度信号(例如,所有三组中的平均丰度<5000)。为了进一步评估非靶向代谢组学数据的精度和线性,如前面所述,通过将10%、20%、30%、40%、50%和75%的C-pool与N-pool按体积混合来运行一系列QC样本。负离子模式下13666种代谢物和正离子模式下14758种代谢物的准确度,其标准化相对丰度高于背景空白界限值,是通过比较它们的混合比来估计的,这些混合比来自测量的丰度与C之间的预期混合比-pool和N-pool。图1B是在负离子模式和正离子模式下非靶向LC-MS特征的R2值的分布图的分析图。在负离子和正离子模式中检测到的每种代谢物的预期混合比和测量混合比之间的线性回归模型的R2值分别显示在图1B中。如图1B所示,在负离子和正离子模式下,超过50%的代谢物的R2值都大于0.9,这表明可以非常准确地测量大多数代谢物,并且这些代谢物的相对丰度在10%范围内时表现出稳健的线性合并的正常组和CRC癌症组之间的差异为100%。
图1C是说明负离子模式中代谢物特征的均方根误差(RMSE)值分布的分析图。图1D是说明正离子模式中代谢物特征的均方根误差(RMSE)值分布的分析图。上述代谢物分析的精度通过其线性回归模型的均方根误差(RMSE)进行评估。所有代谢物特征的RMSE值的分布显示,对于负离子和正离子模式,超过50%的代谢物的RMSE小于0.2(参见图1C-1D)。总之,代谢物分析可以以半量化的方式进行精确和重复的测量,具有显著的准确性。
图1E是所有合并CRC样本中非靶向LC-MS特征的方差系数(CV%)分布图的分析图。使用合并的CRC样本作为质量控制,确定所有代谢物特征的变异系数(CV%),表明这些特征中超过90%的CV%小于15%(图1E),表明不同检测批次之间的稳定性。
代谢物在任一对组之间显示出显著不同的丰度(p值<0.005,倍数变化>1.2或<0.8)。图1F是所有样本代谢物的主成分分析(PCA)图。如图1F所示,腺瘤组的分布与结直肠癌组的分布相似,而正常组与这两个组可以明显区分开来。图1G为正常组、腺瘤组、结直肠癌组中显著变化代谢物的计数的比较图。如图1G所示,N vs.C与N vs.A显示出最大的相似性,表明肿瘤发生已经在腺瘤阶段诱导了显著的血清代谢变化。这些在C组与N组和A组与N组中均显著改变的代谢物被称为结直肠异常相关代谢物,用于进一步分析,因为它们在肿瘤进展过程中表现出早期和持续的变化,有利于早期和一致的检测适用于腺瘤和结直肠癌患者。总共包括1426个代谢物特征。如图1H是PCA图,说明基于在腺瘤和腺瘤中均显示显著变化的代谢物,区分来自正常受试者(N,蓝色)、腺瘤受试者(A,红色)和结直肠癌受试者(C,绿色)的样本的血清代谢组学状态。结直肠癌受试者与正常受试者相比。类似地,基于这些代谢物,也可以实现正常受试者和结直肠异常受试者(C&A)之间的明确划分(参见图1H)。
实施例2结直肠异常患者显著改变的肠道微生物组相关血清代谢物的测定
图2A是匹配组中整合分析粪便宏基因组和血清代谢组的程序的分析图。总共有44名受试者(11名正常和33名结直肠异常)的数据通过了质量控制。宏基因组数据的分类分析揭示了12455个微生物组物种。图2B是在物种水平的每个个体中的15个OUT的条形图。在前15种最丰富的物种中,观察到产肠毒素脆弱类杆菌(ETBF)的升高,这被认为是CRC起始的关键病原体。如图2C是说匹配组群的正常和结直肠异常患者中几种CRC相关肠道微生物组物种的相对丰度的分析图。如图2C所示,在CRC患者中,其他几种促进CRC的物种(包括具核梭杆菌、微小单胞菌和空肠弯曲杆菌)的丰度均显著上调,而长双歧杆菌等益生菌则下调。这些结果与之前的报告非常一致,进一步支持了宏基因组测序数据的质量。
使用在至少一名受试者中相对丰度高于0.1%的微生物组种类和丰度高于5000的代谢物,对匹配组中的33名结直肠异常受试者进行Pearson相关系数分析以确定微生物组相关的血清代谢物。图2D是结直肠异常受试者肠道微生物组与血清代谢物之间的相关关系图。显著相关性的界限值设置为1E-3的p值,而图3中此时的错误发现率(FDR)为18%。在相关的物种-代谢物对中,1426种先前描述的结直肠异常相关代谢物中的322种代谢物特征表现出与肠道微生物组的显著关联。图2E是显示CRC相关肠道微生物与其相关血清代谢物之间的协变的桑基图。与先前已报道在结直肠癌中促进肿瘤的物种的关联、与抗肿瘤物种的关联以及这些代谢物与其他细菌物种的关联显示于图2E中。肠道微生物组包括一系列据报道与CRC发生和进展相关的细菌种类,例如促成CRC的具核梭杆菌、微小微单胞菌、芬氏别样杆菌和内脏臭气杆菌以及益生菌长双歧杆菌和狄氏副拟杆菌。通过评估微生物组相关代谢物在预测结直肠异常方面的潜在贡献,观察到仅使用与CRC相关微生物组物种相关的63种代谢物可以解释87%的总方差(样本外平均R2=0.87)发现组中的正常和结直肠异常代谢组,而总共1426个结直肠异常相关代谢物解释了总方差的93%(样本外平均R2=0.93)。这些观察结果强烈表明CRC相关的微生物组物种可能导致血清代谢物的改变,并且63种肠道微生物组相关的血清代谢物对发现组中的结直肠异常检测做出了重大贡献。此外,除了先前表征的CRC相关物种外,这些代谢物还与大量其他与结直肠异常相关的物种密切相关。其中一些物种在正常和结直肠异常受试者之间也显示出显著改变的丰度,例如流动拟杆菌、多雷亚菌属D27,拟杆菌属细菌KA00251。
实施例3基于肠道微生物组相关血清代谢物的列表对发现组中结直肠异常的预测
基于上述这些肠道微生物组相关的血清代谢物,执行LASSO算法以寻找结直肠异常的关键代谢物生物标志物。具有10倍交叉验证(CV)的LASSO算法用于从先前确定的血清代谢组学数据和肠道微生物组代谢组学数据中进行特征选择。322种代谢物特征在正常和CRC或腺瘤样本之间显著改变(调整p<5E-3),与肠道微生物组显著相关(p<1E-3,FDR≤18%)。使用小组投票方式,LASSO运行200次中有75%以上涉及32种代谢物特征。它们的化学结构注释,包括MS2离子对(如果可识别)是通过如前所述的MS/MS谱匹配建立的。如上所述,表1列出了32种代谢物特征中的8种代谢物特征。对发现组的同一组受试者,通过基于MRM的靶向LC-MS检测可以检测到这8种代谢物并显示出一致的差异,表明可以使用不同的方法稳定地测量这些代谢物(见表6)。8种推断代谢物的化学特征首先通过靶向LC-MS进行评估,样本组与非靶向LC-MS最初发现的相应特征相同。如上所述,表3列出了32种代谢物特征中的23种其他代谢物特征。这些代谢物也被证明与肠道微生物组有关,并证明与样本中的CRC/CRA异常显著相关。
表6非靶向和靶向代谢组学分析中的血清丰度和方差
在发现组中评估了8种代谢物的预测效率。图3A是根据验证集利用表1中列出的8种代谢物的丰度的预测模型的ROC。根据非靶向代谢组检测到的丰度,可以有效区分发现组中的正常受试者和结直肠不健康患者,AUC达到0.95(95%CI:0.85-1.00),敏感度为97.8%(95%CI:90.7%-100%)和91%(95%CI:72.8-100%)的特异度(如图3A所示)。
这8种代谢物的预测效率的稳定性通过使用相同受试者组的靶向代谢组学来确定。所有这8种代谢物在非靶向和靶向检测中均表现出一致的上调或下调趋势。图3B是基于靶向代谢组的8种代谢物的ROC的分析图。此外,如图3B所示,这些代谢物通过靶向代谢组学检测也可以达到0.95(95%CI:0.85-1.00)的AUC,敏感度和特异度分别为95.4%(95%CI:82.8-100%)和94%(95%CI:78.6-100%)。非靶向LC-MS的同一样本组的ROC的AUC为0.95,靶向LC-MS的ROC的AUC也达到了该值,表明代谢物可以稳定地区分正常受试者与CRC或腺瘤受试者具有相应rt/mz的原始特征。
图3C是使用非靶向代谢组分析的正常人和结直肠不健康患者的PCA图。如图3D说明了使用靶向代谢组分析的正常和结直肠不健康患者的PCA图。使用PCA图,可以使用非靶向和靶向代谢组分析(参见图3C、D),通过这些代谢物,清楚地区分正常和结直肠不健康患者。图3E是说明CRC GMSM组的ROC曲线的分析图,用于基于匹配群组中的非靶向代谢组学分析来区分正常和结直肠异常组。如图3F是来自CICAM和SD的正常和结直肠不健康患者使用代谢组分析的PCA图。来自两个中心CICAM和SD的结直肠异常患者在PCA图中聚集在一起,并且它们都与来自CICAM的正常受试者明显分开。此外,在独立的粪便-血清匹配组中,这些代谢物也表现出很高的诊断效率,AUC为0.93(95%CI:0.76-1.00),敏感度和特异度为91.9%(95%CI:77.7-100%)和96.3%(95%CI:60.3-100%)。因此,一个包含8个肠道微生物组相关血清代谢物的列表(如表1、表2和表6所示),也称为CRC GMSM组,可以有效地预测不健康的结直肠患者。此外,在独立的粪便-血清匹配组中,许多其他代谢物也显示出较高的诊断效率。如上所述,这些代谢物中的51种列于表4中。
实施例4基于GMSM组的预测模型显示了验证组中腺瘤和CRC患者的诊断价值
基于在发现组中发现的该代谢物组,使用建模组构建预测模型,并在独立验证组中检查其在结直肠异常中的效率。共招募了从CICAM获得的284名受试者,包括103名正常人和181名不健康患者,并使用靶向MRM方法测量8种GMSM代谢物的相对丰度。图4A是说明ROC曲线的分析图,显示建模组中GMSM组的鉴别效率。预测模型是使用逻辑回归方法生成的,并且在建模组的测试集中达到了0.94(95%CI:0.90-0.99)的AUC(见图4A)。图4B是建模组中正常和结直肠异常受试者的CRC和腺瘤生物标志物特征评分的分析图。通过绘制正常和结直肠不健康受试者的生物标志物评分,在腺瘤和CRC组中发现了显著更高的评分(参见图4B)。如图4B所示,腺瘤和CRC组的临界值为0.825,正常组的临界值为0.375。为了在建模组中获得最高准确度,生物标志物评分的临界值设置为0.541,导致敏感度为92.3%,特异度为87.4%。
接下来,在独立验证组中评估预测模型的诊断性能,该验证组包括从两个独立来源获得的10名结直肠不健康患者和63名正常受试者(参见例如表7)。图4C图示了ROC曲线,其显示了在0.541的界限分数下验证组中预测模型的区分效率。通过直接传递来自建模组的界限值,GMSM预测模型达到了0.91的AUC,在所述验证集中具有87.9%的敏感度和81%的特异度(见图4C)。图4D是显示CRC GMSM组在验证组中对于腺瘤患者和正常受试者的区分效率的ROC曲线。根据验证组结直肠不健康患者的结直肠异常从腺瘤到晚期癌症的进展情况,分别检查该模型的具体分期表现,上述患者包括腺瘤、早期/中期(I/II期)以及晚期阶段(III/IV期)CRC患者。结果表明,该模型区分正常与腺瘤患者的AUC为0.81,敏感度为80.0%。对于早期/中期(I/II期)患者,AUC为0.91,敏感度为88.2%;而对于晚期(III/IV期)CRC患者,敏感度达到85%,其AUC为0.91(参见图4和表格)。这些结果表明,从早期癌前阶段到晚期可手术切除的结直肠癌患者,预测模型在区分正常受试者与结直肠腺瘤和结直肠癌患者方面表现出良好的前景。
表7测试和验证集中生物标志物列表的性能(总数和不同阶段,转移截断值0.541)
实施例5预测模型与临床生物标志物CEA鉴别结直肠异常的比较
血清CEA已被常规用作癌症检测的临床生物标志物,最近的一份报告还表明,将CEA与一系列肿瘤相关基因突变体的无细胞DNA(cfDNA)测试相结合可应用于检测可手术切除的癌症,包括CRC。为了比较CEA和肠道微生物组相关血清代谢物的预测模型检测CRC和腺瘤患者的效率,评估了它们在CEA比较组中的表现,该组由在建模和验证集中具有血清CEA评分的所有受试者组成。图5A图示了ROC曲线,其显示出CEA和CRC预测模型的鉴别效率。单独使用CEA诊断结直肠异常AUC为0.77,敏感度为32.5%,在临床使用的5U/ml临界值下特异度为100%,同时将敏感度设定为不低于85%导致界限值为2.86U/ml,敏感度为53.6%,特异度为85.3%。这些结果表明CEA标志物显示出极低的敏感度,这与之前关于该生物标志物在CRC鉴别中的高假阴性率的报告一致。另一方面,预测模型在该CEA比较组中达到了0.94的AUC,远高于CEA,并且通过将界限值0.541直接转移到该组,敏感度为89.5%,特异度为85.3%(参见图5A)。图5B图示了用于图解比较预测模型(红色虚线)和CEA(临床截止,蓝色虚线;优化截止,绿色虚线)在区分正常(绿点)和结直肠异常患者中的效率的散点图(红点)。如图5B所示,使用预测模型可以检测到209名结直肠不健康患者中的187名,而在临床截止点单独使用CEA时,这一数字减少到仅68名,留下很大一部分CRC不健康患者未确诊。因此,预测模型在鉴别结直肠异常方面优于临床生物标志物CEA。
实施例6预测模型可以区分不同阶段的CRC和正常人
图6A-图6D是说明CRC GMSM组在验证组中的鉴别效率的ROC曲线。根据验证组结直肠不健康患者结直肠异常从早期到晚期的进展情况,分别考察该预测模型的具体分期表现。图6A显示预测模型区分了正常受试者和CRC患者,显示AUC为0.89,敏感度为89.7%。图6B显示预测模型区分早期CRC患者的正常受试者,AUC为0.85,敏感度为82.1%,特异度为81%。图6C显示预测模型以0.89的AUC、88.9%的敏感度和81%的特异度区分了患有中期CRC患者的正常受试者。图6D显示预测模型区分了晚期CRC患者的正常受试者,AUC为0.91,敏感度为85%,特异度为81%。这些结果表明,该预测模型在区分正常受试者和腺瘤患者与CRC患者,甚至在早期、中期和晚期等不同阶段区分正常受试者和CRC患者方面表现出良好的效率。
该示例表明预测模型可用于区分受试者的I/II/III/IV期CRC。
实施例7预测模型可以使用表2中列出的至少两种代谢物的丰度将患有CRC/CRA的受试者与正常受试者区分开来
在一些实施例中,可被量化并用于检测CRC/CRA和/或促进CRC/CRA治疗的一组诊断生物标志物可包括表2中列出的至少两种代谢物。仅作为示例,可量化并用于这些目的的典型诊断生物标志物组示于表8中。还评估了利用这些诊断生物标志物组的预测模型的相应性能。如表8所示,预测模型的AUC、特异度和敏感度较高,表明利用这些代谢物丰度的预测模型可以有效区分CRC/CRA受试者和正常受试者。
表8
实施例8预测模型可以使用表2中列出的至少三种代谢物的丰度将患有CRC/CRA的受试者与正常受试者区分开来
在一些实施例中,可被量化并用于检测CRC/CRA和/或促进CRC/CRA治疗的一组诊断生物标志物可包括表2中列出的至少三种代谢物。仅作为示例,可以量化并用于这些目的的典型诊断生物标志物组示于表9中。还评估了利用这些诊断生物标志物组的预测模型的相应性能。如表9所示,预测模型的AUC、特异度和敏感度较高,表明利用这些代谢物丰度的预测模型可以有效区分CRC/CRA受试者和正常受试者。
表9
]上文已对基本概念做了描述,显然,对于本领域技术人员来说,上述详细披露仅仅作为示例,而并不构成对本申请的限定。虽然此处并没有明确说明,本领域技术人员可能会对本申请进行各种修改、改进和修正。该类修改、改进和修正在本申请中被建议,所以该类修改、改进、修正仍属于本申请示范实施例的精神和范围。
同时,本申请使用了特定词语来描述本申请的实施例。如“一个实施例”、“一实施例”、和/或“一些实施例”意指与本申请至少一个实施例相关的某一特征、结构或特点。因此,应强调并注意的是,本说明书中在不同位置两次或多次提及的“一实施例”或“一个实施例”或“一个替代性实施例”并不一定是指同一实施例。此外,本申请的一个或多个实施例中的某些特征、结构或特点可以进行适当的组合。
此外,本领域技术人员将理解,本公开的方面可以在本文中以多个可授予专利的类别或上下文中的任何一个来说明和描述,包括任何新的和有用的过程、机器、制造或组合或任何新的和有用的改进。因此,本公开的各方面可以完全由硬件、完全由软件(包括固件、常驻软件、微代码等)或组合软件和硬件实现来实现,这些实现在本文中统称为“模块”,“单元”、“组件”、“设备”或“系统”。此外,本公开的方面可以采用在一个或多个计算机可读介质中体现的计算机程序产品的形式,该计算机可读介质具有体现在其上的计算机可读程序代码。
此外,除非权利要求中明确说明,本申请所述处理元素和序列的顺序、数字字母的使用、或其他名称的使用,并非用于限定本申请流程和方法的顺序。尽管上述披露中通过各种示例讨论了一些目前认为有用的发明实施例,但应当理解的是,该类细节仅起到说明的目的,附加的权利要求并不仅限于披露的实施例,相反,权利要求旨在覆盖所有符合本申请实施例实质和范围的修正和等价组合。例如,虽然以上所描述的系统组件可以通过硬件设备实现,但是也可以只通过软件的解决方案得以实现,如在现有的服务器或移动设备上安装所描述的系统。
同理,应当注意的是,为了简化本申请披露的表述,从而帮助对一个或多个发明实施例的理解,前文对本申请实施例的描述中,有时会将多种特征归并至一个实施例、附图或对其的描述中。但是,这种披露方法并不意味着本申请对象所需要的特征比权利要求中提及的特征多。实际上,实施例的特征要少于上述披露的单个实施例的全部特征。
Claims (29)
1.一种检测受试者的结直肠癌或结直肠腺瘤(CRC/CRA)的系统,所述系统包括:
LC-MS系统,被配置为量化来自所述受试者的样本中一组多种代谢物中的至少两种、至少三种、至少四种、至少五种、至少六种、至少七种、或八种代谢物的丰度,其中,所述样本为血液,所述至少两种代谢物包括说明书表8所示的代谢物组合,所述至少三种代谢物包括说明书表9所示的代谢物组合,所述至少四种代谢物包括所述至少两种代谢物的组合,所述至少五种代谢物包括所述至少两种代谢物与所述至少三种代谢物的组合,所述至少六种代谢物包括所述至少三种代谢物的组合或所述至少两种代谢物的组合,所述至少七种代谢物包括所述至少三种代谢物与所述至少四种代谢物的组合,所述八种代谢物包括表A中的代谢物:
计算机系统,所述计算机系统执行如下步骤:
将所述量化的一种或以上代谢物的丰度输入到预测模型中;
通过所述预测模型处理所述量化的每种代谢物的丰度来确定样本分数;以及
通过所述预测模型将样本分数与界限值进行比较来检测所述受试者的结直肠癌或结直肠腺瘤。
4.如权利要求1-3中任一项所述的系统,其特征在于,所述样本得分指示所述受试者患有结直肠癌或结直肠腺瘤的概率。
5.如权利要求1-3中任一项所述的系统,其特征在于,为通过所述预测模型处理所述量化的每种代谢物的丰度来确定样本分数,所述计算机系统进一步执行如下步骤:
通过使用所述预测模型处理标准化的丰度来确定所述样本分数,其中,所述标准化的丰度通过标准化步骤(a)中量化的每种代谢物的丰度得到。
6.如权利要求5所述的系统,其特征在于,所述预测模型是通过逻辑回归方法建立的。
7.如权利要求5所述的系统,其特征在于,所述预测模型是基于对来自具有已知正常、结直肠癌或结直肠腺瘤状态的样本的所述代谢物的丰度的测量,通过逻辑回归方法建立的。
8.如权利要求1-3中任一项所述的系统,其特征在于,为通过所述预测模型将样本分数与界限值进行比较来检测所述受试者的结直肠癌或结直肠腺瘤,所述计算机系统进一步执行如下步骤:如果所述样本分数等于或大于所述界限值,则所述受试者可检测到结直肠癌或结直肠腺瘤。
9.如权利要求1-3中任一项所述的系统,其特征在于,对于接受者工作特性(ROC)曲线,所述系统的检测方法的曲线下面积(AUC)大于0.80,并且检测样本中的结直肠癌或结直肠腺瘤的敏感度和特异度等于或大于75%。
10.如权利要求1-3中任一项所述的系统,其特征在于,对于接受者工作特性曲线,所述系统具有大于0.85的曲线下面积,并且检测样本中结直肠癌或结直肠腺瘤的敏感度和特异度均等于或大于80%。
11.如权利要求1-3中任一项所述的系统,其特征在于,对于接受者工作特性曲线,所述系统具有大于0.90的曲线下面积,并且检测样本中结直肠癌或结直肠腺瘤的敏感度和特异度均等于或大于80%。
12.如权利要求1-3中任一项所述的系统,其特征在于,对于接受者工作特性曲线,所述系统具有大于0.90的曲线下面积,检测样本中结直肠癌或结直肠腺瘤的敏感度等于或大于85%,以及特异度检测样本中的结直肠癌或结直肠腺瘤等于或大于80%。
13.如权利要求1-3中任一项所述的系统,其特征在于,对于接受者工作特性曲线,所述系统具有约0.91的曲线下面积,检测样本中结直肠癌或结直肠腺瘤的敏感度约为88%,检测样本中结直肠癌或结直肠腺瘤的特异度约为81%。
14.一种检测受试者结直肠腺瘤的系统,所述系统包括:
LC-MS系统,被配置为用质谱法量化来自所述受试者的样本中一组多种代谢物中的至少五种组分的丰度,其中,所述样本为血液,多种代谢物包括表A中的代谢物,所述至少五种组分包括说明书表8所示的代谢物组合与说明书表9所示的代谢物组合进行组合的代谢物;
计算机系统,所述计算机系统执行如下步骤:
将所述量化的每种代谢物的丰度输入到预测模型中;
通过所述预测模型处理所述量化的每种代谢物的丰度来确定样本分数;以及
通过所述预测模型将预测值与界限值进行比较来检测所述受试者的结直肠腺瘤。
15.如权利要求14所述的系统,其特征在于,表A中所有八种代谢物的丰度都被量化,并且为通过所述预测模型处理所述量化的每种代谢物的丰度来确定样本分数,所述计算机系统执行如下步骤:
通过使用所述预测模型处理标准化的丰度来确定所述样本分数,其中,所述标准化的丰度通过标准化步骤(a)中量化的每种代谢物的丰度得到。
16.如权利要求15所述的系统,其特征在于:
对于接受者工作特性曲线,所述系统的曲线下面积(AUC)大于0.80,检测样本中结直肠癌或结直肠腺瘤的敏感度和特异度均等于或大于75%。
17.一种检测受试者 I/II 期结直肠癌的系统,所述系统包括:
LC-MS系统,被配置为用质谱法量化来自所述受试者的样本中一组多种代谢物中的至少五种组分的丰度,其中,所述样本为血液,所述多种代谢物包括表A中的代谢物,所述至少五种组分包括说明书表8所示的代谢物组合与说明书表9所示的代谢物组合进行组合的代谢物;
计算机系统,所述计算机系统执行如下步骤:
将所述量化的每种代谢物的丰度输入到预测模型中;
通过所述预测模型处理所述量化的每种代谢物的丰度来确定样本分数;
通过所述预测模型将预测值与界限值进行比较来检测所述受试者的I/II期结直肠癌。
18.如权利要求17所述的系统,其特征在于,表A中所有八种代谢物的丰度被量化,并且为通过所述预测模型处理所述量化的每种代谢物的丰度来确定样本分数,所述计算机系统进一步执行如下步骤:
通过使用所述预测模型处理标准化的丰度来确定所述样本分数,其中,所述标准化的丰度通过标准化步骤(a)中量化的每种代谢物的丰度得到。
19.如权利要求18所述的系统,其特征在于:
对于接受者工作特性曲线,所述系统的曲线下面积(AUC)大于0.90,检测样本中结直肠癌或结直肠腺瘤的敏感度等于或大于85%,检测样本中结直肠癌或结直肠腺瘤的特异度等于或大于80%。
20.一种检测受试者的III/IV期结直肠癌的系统,所述系统包括:
LC-MS系统,被配置为用质谱法量化来自所述受试者的样本中一组多种代谢物中的至少五种组分的丰度,其中,所述样本为血液,所述多种代谢物包括表A中的代谢物,所述至少五种组分包括说明书表8所示的代谢物组合与说明书表9所示的代谢物组合进行组合的代谢物;
计算机系统,所述计算机系统执行如下步骤:
将所述量化的每种代谢物的丰度输入到预测模型中;
通过所述预测模型处理所述量化的每种代谢物的丰度来确定样本分数;以及
通过所述预测模型将预测值与界限值进行比较来检测所述受试者的III/IV期结直肠癌。
21.如权利要求20所述的系统,其特征在于,表A中所有八种代谢物的丰度被量化,并且为通过所述预测模型处理所述量化的每种代谢物的丰度来确定样本分数,所述计算机系统进一步执行如下步骤:
通过使用所述预测模型处理标准化的丰度来确定所述样本分数,其中,所述标准化的丰度通过标准化所述量化的每种代谢物的丰度得到。
22.如权利要求21所述的系统,其特征在于,其中:
对于接受者工作特性曲线,所述系统的曲线下面积(AUC)大于0.90,检测样本中结直肠癌的敏感度等于或大于85%,并且检测样本中结直肠癌的特异度等于或大于80%。
23.一种从血液中识别肠道微生物群相关(GMA)代谢物作为结直肠癌(CRC)或结直肠腺瘤(CRA)预测组的生物标志物的系统,所述系统包括:
LC-MS系统,被配置为:
通过对来自结直肠癌或结直肠腺瘤患者和未患有结直肠癌或结直肠腺瘤的对照组的样本进行非靶向质谱分析来获取源数据;以及
确定在结直肠癌或结直肠腺瘤患者中显著改变的第一组代谢物;
计算机系统,所述计算机系统执行如下步骤:
通过选择与肠道微生物群显著相关的代谢物,从所述第一组代谢物中识别出第二组代谢物;以及
使用选择模型从第二组代谢物中为预测组选择肠道微生物群相关代谢物,所述肠道微生物群相关代谢物包括说明书表8所示的代谢物组合中的至少两种、说明书表9所示的代谢物组合中的至少三种、所述至少两种代谢物组合得到的至少四种代谢物、所述至少两种代谢物与所述至少三种代谢物组合得到的至少五种代谢物、所述至少三种代谢物组合或所述至少两种代谢物组合得到的至少六种代谢物、所述至少三种代谢物与所述至少四种代谢物组合得到的至少七种代谢物或表A中的全部代谢物。
24.如权利要求23所述的系统,其特征在于,所述计算机系统进一步执行如下步骤:用宏基因组测序验证第二组代谢物。
25.如权利要求23所述的系统,其特征在于,所述选择模型利用最小绝对收缩和选择算子(LASSO)算法。
26.一组生物标志物在制备检测受试者的结直肠癌或结直肠腺瘤(CRC/CRA)的系统中的应用,所述生物标志物包括说明书表8所示的代谢物组合中的至少两种、说明书表9所示的代谢物组合中的至少三种、所述至少两种代谢物组合得到的至少四种代谢物、所述至少两种代谢物与所述至少三种代谢物组合得到的至少五种代谢物、所述至少三种代谢物组合或所述至少两种代谢物组合得到的至少六种代谢物、所述至少三种代谢物与所述至少四种代谢物组合得到的至少七种代谢物。
28.如权利要求26所述的一组生物标志物在制备检测受试者的结直肠癌或结直肠腺瘤(CRC/CRA)的系统中的应用,还包括表B中的至少一种代谢物。
29.如权利要求26所述的一组生物标志物在制备检测受试者的结直肠癌或结直肠腺瘤(CRC/CRA)的系统中的应用,还包括表C中的所有代谢物。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210564270.XA CN114839298B (zh) | 2019-12-28 | 2020-12-28 | 一种用于检测结直肠癌或腺瘤的生物标志物及其方法 |
CN202210564508.9A CN114807332B (zh) | 2019-12-28 | 2020-12-28 | 一种用于检测结直肠癌或腺瘤的生物标志物及其方法 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962954483P | 2019-12-28 | 2019-12-28 | |
US62/954,483 | 2019-12-28 | ||
PCT/CN2020/140431 WO2021129881A1 (en) | 2019-12-28 | 2020-12-28 | Biomarkers for detecting colorectal cancer or adenoma and methods thereof |
Related Child Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210564270.XA Division CN114839298B (zh) | 2019-12-28 | 2020-12-28 | 一种用于检测结直肠癌或腺瘤的生物标志物及其方法 |
CN202210564508.9A Division CN114807332B (zh) | 2019-12-28 | 2020-12-28 | 一种用于检测结直肠癌或腺瘤的生物标志物及其方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113711044A CN113711044A (zh) | 2021-11-26 |
CN113711044B true CN113711044B (zh) | 2022-04-12 |
Family
ID=76573726
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202080030060.1A Active CN113711044B (zh) | 2019-12-28 | 2020-12-28 | 一种用于检测结直肠癌或腺瘤的生物标志物及其方法 |
CN202210564508.9A Active CN114807332B (zh) | 2019-12-28 | 2020-12-28 | 一种用于检测结直肠癌或腺瘤的生物标志物及其方法 |
CN202210564270.XA Active CN114839298B (zh) | 2019-12-28 | 2020-12-28 | 一种用于检测结直肠癌或腺瘤的生物标志物及其方法 |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210564508.9A Active CN114807332B (zh) | 2019-12-28 | 2020-12-28 | 一种用于检测结直肠癌或腺瘤的生物标志物及其方法 |
CN202210564270.XA Active CN114839298B (zh) | 2019-12-28 | 2020-12-28 | 一种用于检测结直肠癌或腺瘤的生物标志物及其方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US11462305B2 (zh) |
EP (1) | EP4065981A4 (zh) |
JP (1) | JP7488903B2 (zh) |
CN (3) | CN113711044B (zh) |
WO (1) | WO2021129881A1 (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114369673B (zh) * | 2022-01-06 | 2023-07-14 | 同济大学 | 结直肠腺瘤生物标志物、试剂盒及生物标志物的筛选方法 |
CN114705861B (zh) * | 2022-05-30 | 2023-02-03 | 天津云检医学检验所有限公司 | 检测样本中9种血清代谢物的表达水平的试剂在制备用于评估结直肠癌风险的试剂盒的应用 |
CN115440375A (zh) * | 2022-06-10 | 2022-12-06 | 杭州凯莱谱精准医疗检测技术有限公司 | 一种结直肠癌预测系统及其应用 |
WO2024098209A1 (en) * | 2022-11-07 | 2024-05-16 | Precogify Pharmaceutical China Co., Ltd. | Biomarkers for detecting colorectal cancer or colorectal adenoma and methods thereof |
WO2024152380A1 (en) * | 2023-01-20 | 2024-07-25 | Precogify Pharmaceutical China Co., Ltd. | Biomarkers and related methods for detecting inflammatory bowel disease and discriminating between crohn's disease and ulcerative colitis |
Family Cites Families (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2298181C (en) | 2000-02-02 | 2006-09-19 | Dayan Burke Goodnough | Non-targeted complex sample analysis |
SG182169A1 (en) * | 2005-09-12 | 2012-07-30 | Phenomenome Discoveries Inc | Method for the diagnosis of colorectal cancer and ovarian cancer by the measurement of vitamin e-related metabolites |
US20080255764A1 (en) * | 2005-09-12 | 2008-10-16 | Phenomenome Discoveries Inc. | Methods for the Diagnosis of Colorectal Cancer and Ovarian Cancer by the Measurement of Vitamin E-Related Metabolites |
EP2249161B1 (en) * | 2009-05-05 | 2020-05-13 | InfanDx AG | Method of diagnosing asphyxia |
US20120040383A1 (en) * | 2010-08-12 | 2012-02-16 | Wei Jia | Methods and Kits Relating To Metabolite Biomarkers For Colorectal Cancer |
WO2012023254A1 (ja) * | 2010-08-19 | 2012-02-23 | 国立大学法人 東京大学 | オメガ3系脂肪酸由来の新規抗炎症性代謝物 |
US20150024969A1 (en) * | 2011-09-12 | 2015-01-22 | The Children's Mercy Hospital | Sepsis prognosis biomarkers |
EP2587264A1 (en) * | 2011-10-25 | 2013-05-01 | InfanDx AG | Method and use of metabolites for the diagnosis and differentiation of neonatal encephalopathy |
UA116535C2 (uk) * | 2012-03-30 | 2018-04-10 | Рдінновейшн Апс | Сполуки бензолполікарбонових кислот та їх застосування як лікарських засобів |
WO2013171586A2 (en) * | 2012-05-14 | 2013-11-21 | Uti Limited Partnership | Metabolite biomarkers for staging colorectal cancer |
CN103324846A (zh) * | 2013-06-13 | 2013-09-25 | 浙江加州国际纳米技术研究院绍兴分院 | 结直肠癌症治疗预后生物标记物的筛选方法 |
US10274496B2 (en) * | 2014-01-17 | 2019-04-30 | University Of Washington | Biomarkers for detecting and monitoring colon cancer |
CN103740854B (zh) * | 2014-01-29 | 2015-10-21 | 中山大学附属第三医院 | 一种肿瘤标记物及其在制备结直肠癌诊断试剂中的应用 |
SG11201608053PA (en) * | 2014-03-28 | 2016-10-28 | Applied Proteomics Inc | Protein biomarker profiles for detecting colorectal tumors |
US20150294081A1 (en) * | 2014-04-11 | 2015-10-15 | Synapdx Corporation | Methods and systems for determining autism spectrum disorder risk |
US20160209415A1 (en) * | 2015-01-20 | 2016-07-21 | Poochon Scientific LLC | Method to predict or diagnose a colorectal cancer |
KR20160146102A (ko) * | 2015-06-11 | 2016-12-21 | 한국과학기술원 | N-당쇄 질량분석을 이용한 대장암 진단방법 |
US11123311B2 (en) * | 2016-01-05 | 2021-09-21 | The Regents Of The University Of California | Methods of treating mental disorders |
EP3255426B1 (en) * | 2016-06-08 | 2022-03-16 | Vitargent (International) Biotechnology Limited | Toxicant assays for consumable products |
WO2018013811A1 (en) * | 2016-07-14 | 2018-01-18 | The Regents Of The University Of California | Diagnostic and methods of treatment for chronic fatigue syndrome and autism spectrum disorders |
ES2683866B2 (es) * | 2017-03-28 | 2019-02-08 | Univ Vigo | Método no invasivo para el diagnóstico y cribado de cáncer colorrectal y adenomas avanzados en individuos asintomáticos |
JP7018605B2 (ja) * | 2017-03-30 | 2022-02-14 | 株式会社島津製作所 | 大腸がん検査方法 |
CN107064508A (zh) * | 2017-04-21 | 2017-08-18 | 深圳大学 | 辅助结直肠癌早期诊断及预后监测的分子标志物及其应用 |
CN110376315A (zh) * | 2019-08-27 | 2019-10-25 | 中精普康(北京)医药科技有限公司 | 一种基于血清中脂溶性代谢物因子的肠道健康状态诊断模型的建立方法及其应用 |
-
2020
- 2020-12-28 CN CN202080030060.1A patent/CN113711044B/zh active Active
- 2020-12-28 CN CN202210564508.9A patent/CN114807332B/zh active Active
- 2020-12-28 JP JP2022539743A patent/JP7488903B2/ja active Active
- 2020-12-28 WO PCT/CN2020/140431 patent/WO2021129881A1/en unknown
- 2020-12-28 CN CN202210564270.XA patent/CN114839298B/zh active Active
- 2020-12-28 EP EP20904689.5A patent/EP4065981A4/en not_active Withdrawn
-
2021
- 2021-10-15 US US17/451,013 patent/US11462305B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
CN114839298B (zh) | 2024-06-07 |
CN114839298A (zh) | 2022-08-02 |
JP7488903B2 (ja) | 2024-05-22 |
EP4065981A4 (en) | 2023-05-24 |
JP2023508701A (ja) | 2023-03-03 |
CN113711044A (zh) | 2021-11-26 |
US20220108777A1 (en) | 2022-04-07 |
EP4065981A1 (en) | 2022-10-05 |
CN114807332A (zh) | 2022-07-29 |
WO2021129881A1 (en) | 2021-07-01 |
US11462305B2 (en) | 2022-10-04 |
CN114807332B (zh) | 2024-06-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113711044B (zh) | 一种用于检测结直肠癌或腺瘤的生物标志物及其方法 | |
CN110646554B (zh) | 基于代谢组学的胰腺癌诊断标志物及其筛选方法和应用 | |
CN113960235B (zh) | 生物标志物在制备肺癌检测试剂中的用途和方法 | |
Fan et al. | Use of plasma metabolomics to identify diagnostic biomarkers for early stage epithelial ovarian cancer | |
Wu et al. | Identification of potential metabolite markers for colon cancer and rectal cancer using serum metabolomics | |
US20150031065A1 (en) | Compositions, methods and kits for diagnosis of lung cancer | |
CN111863250A (zh) | 一种早期乳腺癌的联合诊断模型及系统 | |
KR20180041556A (ko) | 유방암의 조기 진단을 위한 지질 마커 | |
Hassan et al. | Metabolomics driven analysis of obesity-linked colorectal cancer patients via GC-MS and chemometrics: A pilot study | |
US20170168058A1 (en) | Compositions, methods and kits for diagnosis of lung cancer | |
CN116867911A (zh) | 用于胃癌预防和早期发现的生物标志物特征 | |
Liang et al. | Lipidomics analysis based on liquid chromatography mass spectrometry for hepatocellular carcinoma and intrahepatic cholangiocarcinoma | |
Zheng et al. | Establishment of serum protein pattern for screening colorectal cancer using SELDI-TOF-MS | |
Huang et al. | Liquid chromatography–mass spectrometry based serum peptidomic approach for renal clear cell carcinoma diagnosis | |
WO2013171586A2 (en) | Metabolite biomarkers for staging colorectal cancer | |
CN112255335B (zh) | 用于区分良性和恶性卵巢肿瘤的血浆代谢标志物及其应用 | |
EP3262416B1 (en) | Method for the diagnosis of endometrial carcinoma | |
CN113533560A (zh) | 基于代谢组学的食管癌早期筛查标志物及其试剂盒 | |
CN113777181A (zh) | 一种用于诊断早期食管癌的标志物及试剂盒 | |
CN112986588B (zh) | 脂质标志物在制备结直肠癌检测试剂盒中的用途 | |
CN112255334B (zh) | 用于区分交界性和恶性卵巢肿瘤的小分子标志物及其应用 | |
CN112255333B (zh) | 卵巢肿瘤尿液代谢标志物及其应用 | |
Zhang et al. | Metabolic phenotyping to monitor chronic enteritis canceration | |
D’Andréa et al. | Pilot Study on the Use of Untargeted Metabolomic Fingerprinting of Liquid-Cytology Fluids as a Diagnostic Tool of Malignancy for Thyroid Nodules. Metabolites 2023, 13, 782 | |
Xu et al. | Evaluating for Correlations between Specific Metabolites in Patients Receiving First-Line or Second-Line Immunotherapy for Metastatic or Recurrent NSCLC: An Exploratory Study Based on Two Cohorts |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |