CN115280149A - 用于诊断卵巢癌的生物标志物 - Google Patents

用于诊断卵巢癌的生物标志物 Download PDF

Info

Publication number
CN115280149A
CN115280149A CN202180018015.9A CN202180018015A CN115280149A CN 115280149 A CN115280149 A CN 115280149A CN 202180018015 A CN202180018015 A CN 202180018015A CN 115280149 A CN115280149 A CN 115280149A
Authority
CN
China
Prior art keywords
examples
glycopeptide
group
seq
amino acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180018015.9A
Other languages
English (en)
Inventor
G·许
L·沈
H·许
D·塞里
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wayne Biosciences
Original Assignee
Wayne Biosciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wayne Biosciences filed Critical Wayne Biosciences
Publication of CN115280149A publication Critical patent/CN115280149A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6848Methods of protein analysis involving mass spectrometry
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • G01N33/57449Specifically defined cancers of ovaries
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/10Signal processing, e.g. from mass spectrometry [MS] or from PCR
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/70Mechanisms involved in disease identification
    • G01N2800/7023(Hyper)proliferation
    • G01N2800/7028Cancer

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Immunology (AREA)
  • Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • Chemical & Material Sciences (AREA)
  • Urology & Nephrology (AREA)
  • Hematology (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Medicinal Chemistry (AREA)
  • Microbiology (AREA)
  • Food Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Cell Biology (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Biophysics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Epidemiology (AREA)
  • Bioethics (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Evolutionary Biology (AREA)
  • Theoretical Computer Science (AREA)

Abstract

本文阐述了可用于诊断疾病和疾患例如但不限于癌症(例如卵巢癌)、自身免疫疾病、纤维化和衰老疾患的糖肽生物标志物。本文还阐述了产生糖肽生物标志物的方法和使用质谱法分析糖肽的方法。本文还阐述了使用机器学习算法分析糖肽的方法。

Description

用于诊断卵巢癌的生物标志物
相关申请的交叉引用
本申请要求2020年1月31日提交的美国临时专利申请第62/968,941号的优先权和权益,所述申请的全部内容出于所有目的以引用方式整体并入本文中。
技术领域
本公开涉及包括但不限于聚糖、肽和糖肽的糖蛋白组生物标志物,以及将这些生物标志物用于质谱法和临床应用的方法。
背景技术
糖基化的变化已被描述为与例如癌症等疾病状态有关。参见例如Dube,D.H.;Bertozzi,C.R.Glycans in Cancer and Inflammation–Potential for Therapeuticsand Diagnostics.Nature Rev.Drug Disc.2005,4,477-88,其全部内容出于所有目的以引用方式整体并入本文中。然而,仍然需要基于来自患者的样品中的糖基化变化来诊断所述患者的癌症例如卵巢癌的临床相关的非侵入性分析。
用于诊断卵巢癌的常规临床分析例如包括通过酶联免疫吸附分析(ELISA)测量患者血液中蛋白质CA 125(癌抗原125)的量。然而,ELISA的灵敏度和准确度有限。ELISA例如仅测量浓度在ng/mL范围内的CA 125。此狭窄测量范围限制了此分析的相关性,因为不能测量浓度大大高于或低于此浓度范围的生物标志物。此外,
CA 125 ELISA分析在可分析的样品类型方面受到限制。由于缺乏更精确和灵敏的测试,所以另外可能被诊断出患有卵巢癌的患者未接受且因此无法接受适当的后续医疗护理。
作为替代方案,质谱法(MS)提供了对包括糖肽在内的癌症特异性生物标志物的灵敏和精确测量。参见例如Ruhaak,L.R.等人,Protein-Specific DifferentialGlycosylation of Immunoglobulins in Serum of Ovarian Cancer Patients DOI:10.1021/acs.jproteome.5b01071;J.Proteome Res.,2016,15,1002-1010(2016);以及Miyamoto,S.等人,Multiple Reaction Monitoring for the Quantitation of SerumProtein Glycosylation Profiles:Application to Ovarian Cancer,DOI:10.1021/acs.jproteome.7b00541,J.Proteome Res.2018,17,222-233(2017),其全部内容出于所有目的以引用的方式整体并入本文中。然而,迄今为止,尚未以临床相关的方式证明使用MS来一般诊断癌症,或专门诊断卵巢癌。
需要的是新的生物标志物和使用MS诊断疾病状态例如使用这些生物标志物诊断癌症的新方法。本文在以下公开内容中阐述了包括聚糖、肽和糖肽及其片段的此类生物标志物,以及使用这些生物标志物与MS来诊断卵巢癌的方法。
发明内容
在另一实施方案中,本文阐述由或基本上由氨基酸序列组成的糖肽或肽,所述氨基酸序列选自由SEQ ID NO:1-76组成的组。
在另一实施方案中,本文阐述一种用于检测一种或多种MRM转变的方法,所述方法包括:从患者获得生物样品;消化和/或片段化样品中的糖肽;以及检测选自由如本文所述的转变1-76组成的组的多反应监测(MRM)转变。
在另一实施方案中,本文阐述一种鉴别样品的分类的方法,所述方法包括:通过质谱法(MS)量化样品中的一种或多种糖肽,其中糖肽各自在每种情况下单独地包含基本上由氨基酸序列组成的糖肽,所述氨基酸序列选自由SEQ ID NO:1-76及其组合组成的组;和将所述量化输入到训练模型中以生成输出概率;确定输出概率是高于还是低于分类阈值;以及基于输出概率是高于还是低于分类阈值来鉴别样品的分类。
在另一实施方案中,本文阐述一种用于对生物样品进行分类的方法,所述方法包括:从患者获得生物样品;消化和/或片段化样品中的糖肽;检测选自由转变1-76组成的组的MRM转变;和量化糖肽;将所述量化输入到训练模型中以生成输出概率;确定输出概率是高于还是低于分类阈值;以及基于输出概率是高于还是低于分类阈值对生物样品进行分类。
在另一实施方案中,本文阐述一种用于治疗患有卵巢癌的患者的方法;所述方法包括:从患者获得生物样品;将样品中的一种或多种糖肽消化和/或片段化;以及检测和量化选自由转变1-76组成的组的一个或多个多反应监测(MRM)转变;将所述量化输入到训练模型中以生成输出概率;确定输出概率是高于还是低于分类阈值;以及基于输出概率是高于还是低于分类阈值对患者进行分类,其中所述分类选自由以下组成的组:(A)需要化学治疗剂的患者;(B)需要免疫治疗剂的患者;(C)需要激素疗法的患者;(D)需要靶向治疗剂的患者;(E)需要手术的患者;(F)需要新辅助疗法的患者;(G)手术前需要化学治疗剂、免疫治疗剂、激素疗法、靶向治疗剂、新辅助疗法或其组合的患者;(H)手术后需要化学治疗剂、免疫治疗剂、激素疗法、靶向治疗剂、新辅助疗法或其组合的患者;(I)或其组合;向患者施用治疗有效量的治疗剂:其中如果确定为分类A或I,则治疗剂选自化学疗法;其中如果确定为分类B或I,则治疗剂选自免疫疗法;其中如果确定为分类C或I,则治疗剂选自激素疗法;其中如果确定为分类D或I,则治疗剂选自靶向疗法;或其中如果确定为分类F或I,则治疗剂选自新辅助疗法;其中如果确定为分类G或I,则治疗剂选自化学治疗剂、免疫治疗剂、激素疗法、靶向治疗剂、新辅助疗法或其组合;并且其中如果确定为分类H或I,则治疗剂选自化学治疗剂、免疫治疗剂、激素疗法、靶向治疗剂、新辅助疗法或其组合。
在另一实施方案中,本文阐述一种用于训练机器学习算法的方法,所述方法包括:提供指示样品的MRM转变信号的第一数据集,所述样品包含由或基本上由氨基酸序列组成的糖肽,所述氨基酸序列选自由SEQ ID NO:1-76组成的组;提供指示对照样品的MRM转变信号的第二数据集;以及使用机器学习算法将第一数据集与第二数据集进行比较。
在另一实施方案中,本文阐述一种用于诊断患有卵巢癌的患者的方法;所述方法包括:从患者获得生物样品;使用利用QQQ和/或qTOF光谱仪的MRM-MS对生物样品进行质谱分析,以检测和量化基本上由氨基酸序列组成的一种或多种糖肽,所述氨基酸序列选自由SEQ ID NO:1-76的组成的组;或检测和量化选自转变1-76的一个或多个MRM转变;将检测到的糖肽或MRM转变的量化输入到训练模型中以生成输出概率,确定输出概率是高于还是低于分类阈值;基于输出概率是高于还是低于分类阈值来鉴别患者的诊断分类;以及基于诊断分类将患者诊断为患有卵巢癌。在一些实例中,方法包括使用利用QQQ的MRM-MS对生物样品进行质谱分析。
在另一实施方案中,本文阐述一种试剂盒,所述试剂盒包含糖肽标准品、缓冲液以及一种或多种由或基本上由氨基酸序列组成的糖肽,所述氨基酸序列选自由SEQ ID NO:1-76组成的组。
附图说明
图1至14使用聚糖符号命名法(SNFG)系统说明了聚糖的化学结构。每个聚糖结构都与一个聚糖参考代码编号相关。
图15和16显示了通过质谱法检测转变1-76的工作流程。
图17是通过生物标志物分析物的液相色谱法/质谱法(LC/MS)检测获得的强度随保留时间(RT)变化的图。上图显示了PB-Net算法的预测概率,以及积分峰的最终(RT)开始和停止预测。
图18显示了LC保留时间分析。
图19是用于测量良性和恶性卵巢癌样品中的CA 125蛋白的ELISA结果图,如实施例3中所述。
图20是良性和恶性卵巢癌样品中患癌的概率图,如实施例4中所述。
专利或申请文件含有至少一幅彩色绘图。专利局将在收到请求且支付必要费用后提供带有彩图的本专利或专利申请公开案的副本。
具体实施方式
呈现以下描述以使本领域普通技术人员能够制造和使用本发明并将其结合到特定应用的上下文中。对于本领域技术人员而言,各种修改以及不同应用中的多种用途将是显而易见的,并且本文定义的一般原理可应用于广泛的实施方案。因此,本文中的发明不意在限于所呈现的实施方案,而是要符合其与本文所公开的原理和新颖特征一致的最宽范围。
除非另有明确说明,否则本说明书中公开的所有特征(包括任何随附的权利要求书、摘要和附图)都可以被用于相同、等效或类似目的的替代特征代替。因此,除非另有明确说明,否则所公开的每个特征仅是等效或相似特征的通用系列的一个实例。
请注意,如果使用,则标签左、右、前、后、上、下、正、反、顺时针和逆时针仅用于方便目的,并且不意味着任何特定的固定方向。相反,它们用于反映对象各个部分之间的相对位置和/或方向。
I.概述
本公开提供了用于分析、检测和/或量化生物样品中的聚糖的方法和组合物。在一些实例中,描述了用于诊断和筛检患有卵巢癌的患者的聚糖和糖肽组。在一些实例中,描述了用于诊断和筛检患有癌症、自身免疫疾病或纤维化的患者的聚糖和糖肽组。
使用质谱法分析生物样品的某些技术是已知的。参见例如国际PCT专利申请公开案第WO2019079639A1号,其于2018年10月18日作为国际专利申请第PCT/US2018/56574号提交且标题为用于诊断和治疗监测的生物参数的鉴定和使用(IDENTIFICATION AND USE OFBIOLOGICAL PARAMETERS FOR DIAGNOSIS AND TREATMENT MONITORING),其全部内容出于所有目的以引用的方式整体并入本文中。另外参见美国专利申请公开案第US20190101544A1号,其于2018年8月31日作为美国专利申请第16/120,016号提交且标题为糖肽作为诊断和治疗监测的生物标志物的鉴定和使用(IDENTIFICATION AND USE OFGLYCOPEPTIDES AS BIOMARKERS FOR DIAGNOSIS AND TREATMENT MONITORING),其全部内容出于所有目的以引用的方式整体并入本文中。
II.定义
除非上下文另外明确指出,否则如本文所用,单数形式“一”和“所述”包括复数个指示物。
如本文所用,短语“生物样品”是指从生物体衍生、获得、产生、提供、获取或移除的样品;或来自生物体的体液或组织的样品。生物样品包括但不限于滑液、全血、血清、血浆、尿液、痰液、组织、唾液、泪液、脊髓液、活检获得的组织切片;置于或适应于组织培养的细胞;汗液、粘液、粪便、胃液、腹水、羊水、囊液、腹腔液、胰液、母乳、肺灌洗液、骨髓、胃酸、胆汁、精液、脓液、房水、渗出液等,包括前述的衍生物、部分和组合。在一些实例中,生物样品包括但不限于血液和/或血浆。在一些实例中,生物样品包括但不限于尿液或粪便。生物样品包括但不限于唾液。生物样品包括但不限于组织解剖和组织活检。生物样品包括但不限于前述生物样品的任何衍生物或部分。
如本文所用,术语“聚糖”是指糖结合物的碳水化合物残基,例如糖肽、糖蛋白、糖脂或蛋白聚糖的碳水化合物部分。聚糖结构由聚糖参考代码编号描述,并且还在2020年1月31日提交的国际PCT专利申请第PCT/US2020/016286号中进行了说明,所述申请出于所有目的以引用的方式整体并入本文中。例如参见2020年1月31日提交的PCT专利申请第PCT/US2020/016286号的图1至图14,所述专利申请出于所有目的以引用方式整体并入本文中。聚糖使用用于图解聚糖的聚糖符号命名法(SNFG)进行图解。此图解系统的说明可在Internet上的www.ncbi.nlm.nih.gov/glycans/snfg.html获得,其全部内容出于所有目的以引用方式整体并入本文中。聚糖图形表示的符号命名法发布于Glycobiology 25:1323-1324,2015中,其可在Internet上的doi.org/10.1093/glycob/cwv091获得。显示SNFG系统图解的附加信息是。在这个系统中,术语Hex_i:解释如下:i表示绿色圆圈(甘露糖)的数量和黄色圆圈(半乳糖)的数量。术语HexNAC_j使用j表示蓝色方形(GlcNAC's)的数量。术语Fuc_d使用d表示红色三角形(岩藻糖)的数量。术语Neu5AC_l使用l表示紫色菱形(唾液酸)的数量。本文使用的聚糖参考代码将这些i、j、d和l术语组合在一起以形成复合的4-5数字聚糖参考代码,例如5300或5320。例如,图1中的聚糖3200和3210都包括3个绿色圆圈(甘露糖)、2个蓝色方形(GlcNAC),并且没有紫色菱形(唾液酸),但不同之处在于聚糖3210还包括1个红色三角形(岩藻糖)。
如本文所用,术语“糖肽”是指具有至少一个与其结合的聚糖残基的肽。在本文所述的每个实施方案中,糖肽可包含所示SEQ ID NO指定的氨基酸序列以及一种或多种聚糖(例如本文所述的与该SEQ ID NO相关的那些)、基本上由其组成或由其组成。例如,如本文所用,根据SEQ ID NO:1的糖肽可指根据SEQ ID NO:1的氨基酸序列和聚糖5402的糖肽,其中聚糖与SEQ ID NO:1的残基1424结合。如本文所用,包含SEQ ID NO:1的糖肽可指包含SEQID NO:1的氨基酸序列和聚糖5402的糖肽,其中聚糖与残基1424结合。如本文所用,基本上由SEQ ID NO:1组成的糖肽可指基本上由SEQ ID NO:1的氨基酸序列和聚糖5402组成的糖肽,其中聚糖与残基1424结合。如本文所用,由SEQ ID NO:1组成的糖肽可指由SEQ ID NO:1的氨基酸序列和聚糖5402组成的糖肽,其中聚糖与残基1424结合。类似的用法适用于SEQID NO:2-30,其中聚糖描述于以下部分中。
如本文所用,短语“糖基化肽”是指与聚糖结合的肽。
如本文所用,短语“糖肽片段”或“糖基化肽片段”或“糖肽”是指具有与获得糖基化肽的糖基化蛋白质的氨基酸序列的一部分(但不是全部)相同的氨基酸序列的糖基化肽(或糖肽),例如在MRM-MS仪器内的离子片段化。MRM是指多反应监测。除非另有说明,否则在本说明书中,“糖肽片段”或“糖肽的片段”是指任选地在糖蛋白已被酶促消化以产生糖肽之后通过使用质谱仪直接产生的片段。
如本文所用,短语“糖蛋白”是指从中获得糖基化肽的糖基化蛋白质。
除非另有说明,否则如本文所用,短语“肽”意在包括糖肽,并且不包括从中获得糖基化肽的糖基化蛋白质。
如本文所用,短语“多反应监测质谱法(MRM-MS)”是指用于靶向量化生物样品中的聚糖和肽的高度灵敏和选择性的方法。与传统质谱法不同,MRM-MS具有高度选择性(靶向性),允许研究人员微调仪器以专门寻找某些感兴趣的肽片段。MRM允许对感兴趣的肽片段,例如潜在的生物标志物的更高灵敏度、特异性、速度和量化。MRM-MS涉及使用三重四极杆(QQQ)质谱仪和四极杆飞行时间(qTOF)质谱仪中的一者或多者。
如本文所用,短语“消化糖肽”是指使用酶来破坏特定氨基酸肽键的生物过程。例如,消化糖肽包括使糖肽与消化酶,例如胰蛋白酶接触以产生糖肽片段。在一些实例中,蛋白酶用于消化糖肽。术语“蛋白酶”是指将大肽蛋白水解或分解成较小多肽或单个氨基酸的酶。蛋白酶的实例包括但不限于以下中的一者或多者:丝氨酸蛋白酶、苏氨酸蛋白酶、半胱氨酸蛋白酶、天冬氨酸蛋白酶、谷氨酸蛋白酶、金属蛋白酶、天冬酰胺肽裂解酶和前述的任何组合。
如本文所用,短语“将糖肽片段化”是指在MRM-MS仪器中发生的离子片段化过程。片段化可以产生质量相同但电荷不同的各种片段。
如本文所用,术语“受试者”是指哺乳动物。哺乳动物的非限制性实例包括人、非人灵长类动物、小鼠、大鼠、狗、猫、马或牛等。除了人之外的哺乳动物可以有利地用作代表疾病、疾病前期或疾病前期状况的动物模型的受试者。受试者可以是男性或女性。然而,在诊断卵巢癌的情况下,除非另有明确说明,否则受试者是女性。受试者可以是先前已被鉴定为患有疾病或疾患并且任选地已经历或正在经历针对疾病或疾患的治疗干预的受试者。或者,受试者也可以是先前未被诊断为患有疾病或疾患的受试者。例如,受试者可以是表现出一种或多种疾病或疾患的风险因素的受试者,或不表现出疾病风险因素的受试者,或对疾病或疾患无症状的受试者。受试者也可以是罹患或处于患上疾病或疾患的风险下的受试者。
如本文所用,术语“患者”是指哺乳动物受试者。哺乳动物可以是人或动物,包括但不限于马、猪、犬、猫、有蹄类动物和灵长类动物。在一个实施方案中,个体是人。本文所述的方法和用途可用于医疗和兽医用途。除非另有说明,否则“患者”是人类受试者。
如本文所用,短语“多反应监测(MRM)转变”是指当通过MRM-MS检测到糖肽或其片段时观察到的质荷(m/z)峰或信号。MRM转变被检测为先驱离子和子离子的转变。
如本文所用,短语“检测多反应监测(MRM)转变”是指质谱仪使用串联质谱仪离子片段化方法分析样品并鉴定样品中离子片段的质荷比的过程。所述短语还指检测到MRM-MS转变,且接着与糖肽或其片段的计算质荷比(m/z)进行比较以鉴定糖肽的MS过程。这些鉴定的质荷比的绝对值被称为转变。在本文所述方法的上下文中,质荷比转变是指示聚糖、肽或糖肽离子片段的值。对于本文所述的一些糖肽,存在单个转变峰或信号。对于本文所述的一些其它糖肽,存在多于一个转变峰或信号。在本文的一些实例中,如果这些糖肽具有相同的MRM-MS片段化模式,则单个转变可以指示另外两种糖肽。转变峰或信号包括但不限于本文所述的与糖肽相关的那些转变,所述糖肽由或基本上由氨基酸序列组成,所述氨基酸序列选自根据表1-5,例如表1、表2、表3、表4或表5或其组合的SEQ ID NO:1-76及其组合。关于MRM质谱法的背景信息可见于Introduction to Mass Spectrometry:Instrumentation,Applications,and Strategies for Data Interpretation,第4版,J.Throck Watson,O.David Sparkman,ISBN:978-0-470-51634-8,2007年11月中,其全部内容出于所有目的以引用方式整体并入本文中。
如本文所用,术语“参考值”是指从疾病状态已知的个体群体获得的值。参考值可以在n维特征空间中并且可以由最大边距超平面定义。可以根据本领域技术人员熟知的标准方法确定任何特定个体群体、亚群体或组的参考值。
如本文所用,术语“个体群体”意指一个或多个个体。在一个实施方案中,个体群体由一个个体组成。在一个实施方案中,个体群体包括多个个体。如本文所用,术语“多个”意指至少2个(例如至少4、6、8、10、12、14、16、18、20、22、24、26、28或30个)个体。在一个实施方案中,个体群体包括至少10个个体。
如本文所用,术语“治疗(treatment)”或“治疗(treating)”意指对受试者,例如哺乳动物的疾病或疾患的任何治疗,包括:1)预防或防止疾病或疾患,即,使得临床症状不发展;2)抑制疾病或疾患,即,阻遏或遏制临床症状的发展;和/或3)缓解疾病或疾患,即,使得临床症状消退。治疗可包括向有需要的受试者施用治疗剂。
如本文所用,术语“约”表示并涵盖指示值以及高于和低于所述值的范围。在某些实施方案中,术语“约”表示指定值±10%、±5%或±1%。在某些实施方案中,术语“约”表示指定值±所述值的一个标准偏差。
III.生物标志物
本文阐述生物标志物。这些生物标志物可用于多种应用,包括但不限于诊断疾病和疾患。例如,本文所述的某些生物标志物或其组合可用于诊断卵巢癌。在一些其它实例中,本文所述的某些生物标志物或其组合可用于诊断和筛检患有癌症、自身免疫疾病或纤维化的患者。在一些实施例中,本文所述的生物标志物或其组合可用于对患者进行分类,从而使患者接受适当的医学治疗。在一些其它实例中,本文所述的生物标志物或其组合可用于通过例如鉴定用于治疗患者的治疗剂来治疗或改善患者的疾病或疾患。在一些其它实例中,本文所述的生物标志物或其组合可用于确定患者的治疗预后或治疗方案的成功可能性或可存活性。
在一些实例中,来自患者的样品通过MS进行分析,并且结果用于确定样品中由选自SEQ ID NO:1-76的氨基酸序列组成的糖肽的存在、绝对量和/或相对量。在一些实例中,来自患者的样品通过MS进行分析,并且结果用于确定样品中基本上由选自SEQ ID NO:1-76的氨基酸序列组成的糖肽的存在、绝对量和/或相对量。在一些实例中,来自患者的样品通过MS进行分析,并且结果用于确定样品中由选自SEQ ID NO:1-76的氨基酸序列组成或基本上由其组成的糖肽的存在、绝对量和/或相对量。在一些实例中,来自患者的样品通过MS进行分析,并且结果用于确定样品中由选自SEQ ID NO:1-76的氨基酸序列组成或基本上由其组成的糖肽的存在、绝对量和/或相对量。在一些实例中,如下所述,通过分析MS结果来确定糖肽的存在、绝对量和/或相对量。在一些实例中,使用机器学习分析MS结果。
本文阐述选自聚糖、肽、糖肽、其片段及其组合的生物标志物。在一些实例中,糖肽由选自SEQ ID NO:1-76的氨基酸序列组成。在一些实例中,糖肽基本上由选自SEQ ID NO:1-76的氨基酸序列组成。
在一些实例中,来自患者的样品通过MS进行分析,并且结果用于确定样品中由选自SEQ ID NO:1、6、7、8、10、15、21、22、23、42、47、48、51、56、57、58、62、74和76的氨基酸序列组成的糖肽的存在、绝对量和/或相对量。在一些实例中,来自患者的样品通过MS进行分析,并且结果用于确定样品中基本上由选自SEQ ID NO:1、6、7、8、10、15、21、22、23、42、47、48、51、56、57、58、62、74和76的氨基酸序列组成的糖肽的存在、绝对量和/或相对量。在一些实例中,来自患者的样品通过MS进行分析,并且结果用于确定样品中由选自SEQ ID NO:1、6、7、8、10、15、21、22、23、42、47、48、51、56、57、58、62、74和76的氨基酸序列组成或基本上由其组成的糖肽的存在、绝对量和/或相对量。在一些实例中,来自患者的样品通过MS进行分析,并且结果用于确定样品中由选自SEQ ID NO:1、6、7、8、10、15、21、22、23、42、47、48、51、56、57、58、62、74和76的氨基酸序列组成或基本上由其组成的糖肽的存在、绝对量和/或相对量。在一些实例中,如下所述,通过分析MS结果来确定糖肽的存在、绝对量和/或相对量。在一些实例中,使用机器学习分析MS结果。
本文阐述选自聚糖、肽、糖肽、其片段及其组合的生物标志物。在一些实例中,糖肽由选自SEQ ID NO:1、6、7、8、10、15、21、22、23、42、47、48、51、56、57、58、62、74和76的氨基酸序列组成。在一些实例中,糖肽基本上由选自SEQ ID NO:1、6、7、8、10、15、21、22、23、42、47、48、51、56、57、58、62、74和76的氨基酸序列组成。
a.O-糖基化
在一些实例中,本文所述的糖肽包括O-糖基化肽。这些肽包括糖肽,其中聚糖通过氨基酸的氧原子与肽结合。典型地,聚糖所结合的氨基酸是苏氨酸(T)或丝氨酸(S)。在一些实例中,聚糖所结合的氨基酸是苏氨酸(T)。在一些实例中,聚糖所结合的氨基酸是丝氨酸(S)。
在某些实例中,O-糖基化肽包括选自由载脂蛋白C-III(APOC3)、α-2-HS-糖蛋白(FETUA)及其组合组成的组的那些肽。在某些实例中,本文所述的O-糖基化肽是载脂蛋白C-III(APOC3)肽。在某些实例中,本文所述的O-糖基化肽是α-2-HS-糖蛋白(FETUA)。
b.N-糖基化
在一些实例中,本文所述的糖肽包括N-糖基化肽。这些肽包括糖肽,其中聚糖通过氨基酸的氮原子与肽结合。典型地,聚糖所结合的氨基酸是天冬酰胺(N)或精氨酸(R)。在一些实例中,聚糖所结合的氨基酸是天冬酰胺(N)。在一些实例中,聚糖所结合的氨基酸是精氨酸(R)。
在某些实例中,N-糖基化肽包括选自由以下组成的组的成员:α-1-抗胰蛋白酶(A1AT)、α-1B-糖蛋白(A1BG)、富含亮氨酸的α-2-糖蛋白(A2GL)、α-2-巨球蛋白(A2MG)、α-1-抗糜蛋白酶(AACT)、Afamin(AFAM)、α-1-酸性糖蛋白1&2(AGP12)、α-1-酸性糖蛋白1(AGP1)、α-1-酸性糖蛋白2(AGP2)、载脂蛋白A-I(APOA1)、载脂蛋白B-100(APOB)、载脂蛋白D(APOD)、β-2-糖蛋白-1(APOH)、载脂蛋白M(APOM)、引蛋白(Attractin)(ATRN)、钙蛋白酶-3(CAN3)、铜蓝蛋白(CERU)、补体因子H(CFAH)、补体因子I(CFAI)、聚集素(CLUS)、补体C3(CO3)、补体C4-A&B(CO4A&CO4B)、补体成分C6(CO6)、补体成分C8A链(CO8A)、凝血因子XII(FA12)、
触珠蛋白(HPT)、富含组氨酸的糖蛋白(HRG)、免疫球蛋白重恒定α1&2(IgA12)、免疫球蛋白重恒定α2(IgA2)、
免疫球蛋白重恒定γ2(IgG2)、免疫球蛋白重恒定μ(IgM)、间α-胰蛋白酶抑制剂重链H1(ITIH1)、血浆激肽释放酶(KLKB1)、激肽原-1(KNG1)、血清对氧磷酶/芳酯酶1(PON1)、硒蛋白P(SEPP1)、凝血酶原(THRB)、血清转铁蛋白(TRFE)、转甲状腺素蛋白(TTR)、蛋白unc-13HomologA(UN13A)、玻连蛋白(VTNC)、锌-α-2-糖蛋白(ZA2G)、胰岛素样生长因子-II(IGF2)、载脂蛋白C-I(APOC1)、血红素结合蛋白(HEMO)、免疫球蛋白重恒定γ1(IgG1)、免疫球蛋白J链(IgJ)及其组合。
c.肽和糖肽
在一些实例中,本文阐述由氨基酸序列组成的糖肽或肽,所述氨基酸序列选自由SEQ ID NO:1-76及其组合组成的组。
在一些实例中,本文阐述基本上由氨基酸序列组成的糖肽或肽,所述氨基酸序列选自由SEQ ID NO:1-76及其组合组成的组。
在一些实例中,本文阐述由氨基酸序列组成的糖肽或肽,所述氨基酸序列选自由SEQ ID NO:1、6、7、8、10、15、21、22、23、42、47、48、51、56、57、58、62、74和76及其组合组成的组。
在一些实例中,本文阐述基本上由氨基酸序列组成的糖肽或肽,所述氨基酸序列选自由SEQ ID NO:1、6、7、8、10、15、21、22、23、42、47、48、51、56、57、58、62、74和76及其组合组成的组。
在一些实例中,本文阐述由选自以下的氨基酸序列组成的糖肽或肽:SEQ ID NO:1、3、4、5、8、11、12、13、14、16、17、18、19、20、22、23、24、25、27、30、32、34、43、45、51、54、55、65、68、71、73、74、75及其组合。
在一些实例中,本文阐述基本上由选自以下的氨基酸序列组成的糖肽或肽:SEQID NO:1、3、4、5、8、11、12、13、14、16、17、18、19、20、22、23、24、25、27、30、32、34、43、45、51、54、55、65、68、71、73、74、75及其组合。
在一些实例中,本文阐述由选自以下的氨基酸序列组成的糖肽或肽:SEQ ID NO:2、6、7、9、10、15、21、26、28、29、31、33、35、36、37、38、39、40、41、42、44、46、47、48、49、50、52、53、56、57、58、59、60、61、62、63、64、66、67、69、70、72、76及其组合。
在一些实例中,本文阐述基本上由选自以下的氨基酸序列组成的糖肽或肽:SEQID NO:2、6、7、9、10、15、21、26、28、29、31、33、35、36、37、38、39、40、41、42、44、46、47、48、49、50、52、53、56、57、58、59、60、61、62、63、64、66、67、69、70、72、76及其组合。
在某些实例中,糖肽基本上由选自SEQ ID NO:1的氨基酸序列组成。在一些实例中,糖肽包含聚糖5402,其中聚糖与残基271结合。在一些实例中,糖肽是A1AT-GP001_271_5402。本文中,A1AT是指α-1-抗胰蛋白酶。
在某些实例中,糖肽基本上由选自SEQ ID NO:2的氨基酸序列组成。在一些实例中,糖肽包含残基271处的聚糖5412。在一些实例中,糖肽是A1AT-GP001_271_5412。
在某些实例中,糖肽基本上由选自SEQ ID NO:3的氨基酸序列组成。在一些实例中,糖肽包含残基271处的聚糖5402。在一些实例中,糖肽是A1AT-GP001_271MC_5402。本文中,“MC”是指胰蛋白酶消化的缺失裂解。缺失的裂解肽包括选自SEQ ID NO:3的氨基酸序列,但也包括未通过胰蛋白酶消化裂解的其它残基。
在某些实例中,糖肽基本上由选自SEQ ID NO:4的氨基酸序列组成。在一些实例中,糖肽包含残基179处的聚糖5421或5402,或两者。在一些实例中,糖肽是A1BG-GP002_179_5421/5402。本文中,当两个聚糖在它们之间用正斜杠(/)列举时,这意味着除非另有明确说明,否则质谱方法无法区分这两种聚糖,例如因为它们具有共同的质荷比。除非另有说明,否则5421/5402表示存在聚糖5421或5402。聚糖5421/5402的量的量化包括聚糖5421的检测量以及聚糖5402的检测量的求和。本文中,A1BG是指α-1B-糖蛋白。
在某些实例中,糖肽基本上由选自SEQ ID NO:5的氨基酸序列组成。在一些实例中,糖肽包含残基1424处的聚糖5402。在一些实例中,糖肽是A2MG-GP004_1424_5402。本文中,A2MG是指α-2-巨球蛋白。
在某些实例中,糖肽基本上由选自SEQ ID NO:6的氨基酸序列组成。在一些实例中,糖肽包含残基1424处的聚糖5411。在一些实例中,糖肽是A2MG-GP004_1424_5411。
在某些实例中,糖肽基本上由选自SEQ ID NO:7的氨基酸序列组成。在一些实例中,糖肽包含残基55处的聚糖5401。在一些实例中,糖肽是A2MG-GP004_55_5401。
在某些实例中,肽包含选自SEQ ID NO:8的氨基酸序列。在一些实例中,糖肽包含残基55处的聚糖5402。在一些实例中,糖肽是A2MG-GP004_55_5402。
在某些实例中,糖肽基本上由选自SEQ ID NO:9的氨基酸序列组成。在一些实例中,糖肽包含残基55处的聚糖5411。在一些实例中,糖肽是A2MG-GP004_55_5411。
在某些实例中,肽包含选自SEQ ID NO:10的氨基酸序列。在一些实例中,糖肽包含残基869处的聚糖5200。在一些实例中,肽是A2MG-GP004_869_5200。
在某些实例中,肽包含选自SEQ ID NO:11的氨基酸序列。在一些实例中,糖肽包含残基5401处的聚糖869。在一些实例中,糖肽是A2MG-GP004_869_5401。
在某些实例中,糖肽基本上由选自SEQ ID NO:12的氨基酸序列组成。在一些实例中,糖肽包含残基869处的聚糖6301。在一些实例中,糖肽是A2MG-GP004_869_6301。
在某些实例中,糖肽基本上由选自SEQ ID NO:13的氨基酸序列组成。在一些实例中,糖肽包含残基33处的聚糖5402。在一些实例中,糖肽是AFAM-GP006_33_5402。在此,AFAM是指Afamin。
在某些实例中,糖肽基本上由选自SEQ ID NO:14的氨基酸序列组成。在一些实例中,糖肽包含残基72处的聚糖6503。在一些实例中,糖肽是AGP12-GP007&008_72MC_6503。本文中,AGP12是指α-1-酸性糖蛋白1和2。
在某些实例中,糖肽基本上由选自SEQ ID NO:15的氨基酸序列组成。在一些实例中,糖肽包含残基72处的聚糖6513。在一些实例中,糖肽是AGP12-GP007&008_72MC_6513。
在某些实例中,糖肽基本上由选自SEQ ID NO:16的氨基酸序列组成。在一些实例中,糖肽包含残基72处的聚糖7601。在一些实例中,糖肽是AGP12-GP007&008_72MC_7601。
在某些实例中,糖肽基本上由选自SEQ ID NO:17的氨基酸序列组成。在一些实例中,糖肽包含残基72处的聚糖7602。在一些实例中,糖肽是AGP12-GP007&008_72MC_7602。
在某些实例中,糖肽基本上由选自SEQ ID NO:18的氨基酸序列组成。在一些实例中,糖肽包含残基72处的聚糖7603。在一些实例中,糖肽是AGP12-GP007&008_72MC_7603。
在某些实例中,糖肽基本上由选自SEQ ID NO:19的氨基酸序列组成。在一些实例中,糖肽包含残基72处的聚糖7613。在一些实例中,糖肽是AGP12-GP007&008_72MC_7613。
在某些实例中,糖肽基本上由选自SEQ ID NO:20的氨基酸序列组成。在一些实例中,糖肽包含残基33处的聚糖5402。在一些实例中,糖肽是AGP1-GP007_33_5402。
在某些实例中,糖肽基本上由选自SEQ ID NO:21的氨基酸序列组成。在一些实例中,糖肽包含残基93处的聚糖6503或6522,或两者。在一些实例中,糖肽是AGP1-GP007_93_6503/6522。本文中,AGP1是指α-1-酸性糖蛋白1。
在某些实例中,糖肽基本上由选自SEQ ID NO:22的氨基酸序列组成。在一些实例中,糖肽包含残基93处的聚糖6513。在一些实例中,糖肽是AGP1-GP007_93_6513。
在某些实例中,糖肽基本上由选自SEQ ID NO:23的氨基酸序列组成。在一些实例中,糖肽包含残基93处的聚糖7603或7622,或两者。在一些实例中,糖肽是AGP1-GP007_93_7603/7622。
在某些实例中,糖肽基本上由选自SEQ ID NO:24的氨基酸序列组成。在一些实例中,糖肽包含残基93处的聚糖7613。在一些实例中,糖肽是AGP1-GP007_93_7613。
在某些实例中,糖肽基本上由选自SEQ ID NO:25的氨基酸序列组成。在一些实例中,糖肽包含残基74处的聚糖1102。在一些实例中,糖肽是APOC3-GP012_74_1102。本文中,APOC3是指载脂蛋白C-III。
在某些实例中,糖肽基本上由选自SEQ ID NO:26的氨基酸序列组成。在一些实例中,糖肽包含残基74处的聚糖1102。在一些实例中,糖肽是APOC3-GP012_74MC_1102。
在某些实例中,糖肽基本上由选自SEQ ID NO:27的氨基酸序列组成。在一些实例中,糖肽包含残基253处的聚糖5401。在一些实例中,糖肽是APOH-GP015_253_5401。本文中,APOH是指β-2-糖蛋白1。
在某些实例中,糖肽基本上由选自SEQ ID NO:28的氨基酸序列组成。在一些实例中,糖肽包含残基138处的聚糖5412。在一些实例中,糖肽是CERU-GP023_138_5412。本文中,CERU是指铜蓝蛋白。
在某些实例中,糖肽基本上由选自SEQ ID NO:29的氨基酸序列组成。在一些实例中,糖肽包含残基138处的聚糖5421或5402,或两者。在一些实例中,糖肽是CERU-GP023_138_5421/5402。
在某些实例中,糖肽基本上由选自SEQ ID NO:30的氨基酸序列组成。在一些实例中,糖肽包含残基138处的聚糖6503或6522,或两者。在一些实例中,糖肽是CERU-GP023_138_6503/6522。
在某些实例中,肽包含选自SEQ ID NO:31的氨基酸序列。在一些实例中,糖肽包含残基882处的聚糖5421或5402,或两者。在一些实例中,糖肽是CFAH-GP024_882_5421/5402。本文中,CFAH是指补体因子H。
在某些实例中,糖肽基本上由选自SEQ ID NO:32的氨基酸序列组成。在一些实例中,糖肽包含残基85处的聚糖5200。在一些实例中,糖肽是CO3-GP028_85_5200。本文中,CO3是指补体C3。
在某些实例中,肽包含选自SEQ ID NO:33的氨基酸序列。在一些实例中,糖肽包含残基85处的聚糖6200。在一些实例中,糖肽是CO3-GP028_85_6200。
在某些实例中,糖肽基本上由选自SEQ ID NO:34的氨基酸序列组成。在一些实例中,糖肽包含残基1328处的聚糖5402。在一些实例中,糖肽是
CO4A&CO4B-GP029&030_1328_5402。本文中,CO4A&CO4B是指补体C4-A&B。
在某些实例中,糖肽基本上由选自SEQ ID NO:35的氨基酸序列组成。在一些实例中,糖肽包含残基156处的聚糖5421或5402,或两者。在一些实例中,糖肽是FETUA-GP036_156_5402/5421。本文中,FETUA是指α-2-HS-糖蛋白。
在某些实例中,糖肽基本上由选自SEQ ID NO:36的氨基酸序列组成。在一些实例中,糖肽包含残基176处的聚糖6513。在一些实例中,糖肽是FETUA-GP036_176_6513。
在某些实例中,糖肽基本上由选自SEQ ID NO:37的氨基酸序列组成。在一些实例中,糖肽包含残基346处的聚糖1101。在一些实例中,糖肽是FETUA-GP036_346_1101。
在某些实例中,糖肽基本上由选自SEQ ID NO:38的氨基酸序列组成。在一些实例中,糖肽包含残基187处的聚糖5412或5431,或两者。在一些实例中,糖肽是HEMO-GP042_187_5412/5431。本文中,HEMO是指血红素结合蛋白。
在某些实例中,糖肽基本上由选自SEQ ID NO:39的氨基酸序列组成。在一些实例中,糖肽包含残基453处的聚糖5420或5401,或两者。在一些实例中,糖肽是HEMO-GP042_453_5420/5401。
在某些实例中,肽包含选自SEQ ID NO:40的氨基酸序列。在一些实例中,糖肽包含残基184处的聚糖6502。在一些实例中,糖肽是HPT-GP044_184_6502。本文中,HPT是指触珠蛋白。
在某些实例中,糖肽基本上由选自SEQ ID NO:41的氨基酸序列组成。在一些实例中,糖肽包含残基207处的聚糖10803。在一些实例中,糖肽是HPT-GP044_207_10803。
在某些实例中,糖肽基本上由选自SEQ ID NO:42的氨基酸序列组成。在一些实例中,糖肽包含残基207处的聚糖10804。在一些实例中,糖肽是HPT-GP044_207_10804。
在某些实例中,糖肽基本上由选自SEQ ID NO:43的氨基酸序列组成。在一些实例中,糖肽包含残基207处的聚糖11904。在一些实例中,糖肽是HPT-GP044_207_11904。
在某些实例中,糖肽基本上由选自SEQ ID NO:44的氨基酸序列组成。在一些实例中,糖肽包含残基207处的聚糖11914。在一些实例中,糖肽是HPT-GP044_207_11914。
在某些实例中,糖肽基本上由选自SEQ ID NO:45的氨基酸序列组成。在一些实例中,糖肽包含残基207处的聚糖11915。在一些实例中,糖肽是HPT-GP044_207_11915。
在某些实例中,糖肽基本上由选自SEQ ID NO:46的氨基酸序列组成。在一些实例中,糖肽包含残基241处的聚糖5401或5420,或两者。在一些实例中,糖肽是HPT-GP044_241_5401/5420。
在某些实例中,糖肽基本上由选自SEQ ID NO:47的氨基酸序列组成。在一些实例中,糖肽包含残基241处的聚糖5412。在一些实例中,糖肽是HPT-GP044_241_5412。
在某些实例中,糖肽基本上由选自SEQ ID NO:48的氨基酸序列组成。在一些实例中,糖肽包含残基241处的聚糖6501。在一些实例中,糖肽是HPT-GP044_241_6501。
在某些实例中,糖肽基本上由选自SEQ ID NO:49的氨基酸序列组成。在一些实例中,糖肽包含残基241处的聚糖6502。在一些实例中,糖肽是HPT-GP044_241_6502。
在某些实例中,糖肽基本上由选自SEQ ID NO:50的氨基酸序列组成。在一些实例中,糖肽包含残基241处的聚糖6511。在一些实例中,糖肽是HPT-GP044_241_6511。
在某些实例中,糖肽基本上由选自SEQ ID NO:51的氨基酸序列组成。在一些实例中,糖肽包含残基241处的聚糖6513。在一些实例中,糖肽是HPT-GP044_241_6513。
在某些实例中,糖肽基本上由选自SEQ ID NO:52的氨基酸序列组成。在一些实例中,糖肽包含残基144处的聚糖5501。在一些实例中,糖肽是IgA12-GP046&047_144_5501。本文中,IgA12是指免疫球蛋白重常数α1&2。
在某些实例中,糖肽基本上由选自SEQ ID NO:53的氨基酸序列组成。在一些实例中,糖肽包含残基205处的聚糖4510。在一些实例中,糖肽是IgA2-GP047_205_4510。本文中,IgA2是指免疫球蛋白重恒定α2。
在某些实例中,糖肽基本上由选自SEQ ID NO:54的氨基酸序列组成。在一些实例中,糖肽包含残基205处的聚糖5412。在一些实例中,糖肽是IgA2-GP047_205_5412。
在某些实例中,糖肽基本上由选自SEQ ID NO:55的氨基酸序列组成。在一些实例中,糖肽包含残基205处的聚糖5501。在一些实例中,糖肽是IgA2-GP047_205_5510。
在某些实例中,糖肽基本上由选自SEQ ID NO:56的氨基酸序列组成。在一些实例中,糖肽包含残基297处的聚糖3410。在一些实例中,糖肽是IgG1-GP048_297_3410。本文中,IgG1是指免疫球蛋白重恒定γ1。
在某些实例中,糖肽基本上由选自SEQ ID NO:57的氨基酸序列组成。在一些实例中,糖肽包含残基297处的聚糖4400。在一些实例中,糖肽是IgG1-GP048_297_4400。
在某些实例中,糖肽基本上由选自SEQ ID NO:58的氨基酸序列组成。在一些实例中,糖肽包含残基297处的聚糖4510。在一些实例中,糖肽是IgG1-GP048_297_4510。
在某些实例中,糖肽基本上由选自SEQ ID NO:59的氨基酸序列组成。在一些实例中,糖肽包含残基297处的聚糖5400。在一些实例中,糖肽是IgG1-GP048_297_5400。
在某些实例中,糖肽基本上由选自SEQ ID NO:60的氨基酸序列组成。在一些实例中,糖肽包含残基297处的聚糖5410。在一些实例中,糖肽是IgG1-GP048_297_5410。
在某些实例中,糖肽基本上由选自SEQ ID NO:61的氨基酸序列组成。在一些实例中,糖肽包含残基297处的聚糖5411。在一些实例中,糖肽是IgG1-GP048_297_5411。
在某些实例中,糖肽基本上由选自SEQ ID NO:62的氨基酸序列组成。在一些实例中,糖肽包含残基297处的聚糖5510。在一些实例中,糖肽是IgG1-GP048_297_5510。
在某些实例中,糖肽基本上由选自SEQ ID NO:63的氨基酸序列组成。在一些实例中,糖肽是IgG1-GP048_297_非糖基化。
在某些实例中,糖肽基本上由选自SEQ ID NO:64的氨基酸序列组成。在一些实例中,糖肽包含残基297处的聚糖3510。在一些实例中,糖肽是IgG2-GP049_297_3510。本文中,IgG2是指免疫球蛋白重恒定γ2。
在某些实例中,糖肽基本上由选自SEQ ID NO:65的氨基酸序列组成。在一些实例中,糖肽包含残基297处的聚糖4411。在一些实例中,糖肽是IgG2-GP049_297_4411。
在某些实例中,糖肽基本上由选自SEQ ID NO:66的氨基酸序列组成。在一些实例中,糖肽包含残基297处的聚糖4510。在一些实例中,糖肽是IgG2-GP049_297_4510。
在某些实例中,糖肽基本上由选自SEQ ID NO:67的氨基酸序列组成。在一些实例中,糖肽包含残基71处的聚糖5401。在一些实例中,糖肽是IgJ-GP052_71_5401。本文中,IgJ是指免疫球蛋白J链。
在某些实例中,糖肽基本上由选自SEQ ID NO:68的氨基酸序列组成。在一些实例中,糖肽包含残基439处的聚糖6200。在一些实例中,糖肽是IgM-GP053_439_6200。本文中,IgM是指免疫球蛋白重恒定μ。
在某些实例中,糖肽基本上由选自SEQ ID NO:69的氨基酸序列组成。在一些实例中,糖肽包含残基46处的聚糖4311。在一些实例中,糖肽是IgM-GP053_46_4311。
在某些实例中,糖肽基本上由选自SEQ ID NO:70的氨基酸序列组成。在一些实例中,糖肽包含残基205处的聚糖6503。在一些实例中,糖肽是KNG1-GP057_205_6503。本文中,KNG1是指激肽原-1。
在某些实例中,糖肽基本上由选自SEQ ID NO:71的氨基酸序列组成。在一些实例中,糖肽包含残基432处的聚糖5402。在一些实例中,糖肽是TRFE-GP064_432_5402。本文中,TRFE是指血清转铁蛋白。
在某些实例中,糖肽基本上由选自SEQ ID NO:72的氨基酸序列组成。在一些实例中,糖肽包含残基630处的聚糖5401。在一些实例中,糖肽是TRFE-GP064_630_5401。
在某些实例中,糖肽基本上由选自SEQ ID NO:73的氨基酸序列组成。在一些实例中,糖肽包含残基630处的聚糖6513。在一些实例中,糖肽是TRFE-GP064_630_6513。
在某些实例中,糖肽基本上由选自SEQ ID NO:74的氨基酸序列组成。在一些实例中,糖肽包含残基169处的聚糖5401。在一些实例中,糖肽是VTNC-GP067_169_5401。本文中,VTNC是指玻连蛋白。
在某些实例中,糖肽基本上由选自SEQ ID NO:75的氨基酸序列组成。在一些实例中,糖肽包含残基242处的聚糖6503。在一些实例中,糖肽是VTNC-GP067_242_6503。
在某些实例中,糖肽基本上由选自SEQ ID NO:76的氨基酸序列组成。在一些实例中,糖肽包含残基86处的聚糖5421。在一些实例中,糖肽是VTNC-GP067_86_5421。
IV.使用生物标志物的方法
A.检测糖肽的方法
在一些实施方案中,本文阐述一种用于检测一种或多种多反应监测(MRM)转变的方法,所述方法包括:从患者获得生物样品,其中所述生物样品包含一种或多种糖肽;消化和/或片段化样品中的糖肽;以及检测选自由转变1-76组成的组的多反应监测(MRM)转变。在某些实例中,方法包括检测选自由以下组成的组的MRM转变:1、6、7、8、10、15、21、22、23、42、47、48、51、56、57、58、62、74、76及其组合。在某些实例中,方法包括检测选自由以下组成的组的MRM转变:1、3、4、5、8、11、12、13、14、16、17、18、19、20、22、23、24、25、27、30、32、34、43、45、51、54、55、65、68、71、73、74、75及其组合。在某些实例中,方法包括检测选自由以下组成的组的MRM转变:2、6、7、9、10、15、21、26、28、29、31、33、35、36、37、38、39、40、41、42、44、46、47、48、49、50、52、53、56、57、58、59、60、61、62、63、64、66、67、69、70、72、76及其组合。在各种实例中,这些转变可包括表1-5中的任何一种或多种转变。在各种实例中,这些转变可包括表1-3中的任何一种或多种转变。在各种实例中,这些转变可包括表1中的任何一种或多种转变。在各种实例中,这些转变可包括表2中的任何一种或多种转变。在各种实例中,这些转变可包括表3中的任何一种或多种转变。在各种实例中,这些转变可包括表4中的任何一种或多种转变。在各种实例中,这些转变可包括表5中的任何一种或多种转变。这些转变可能指示糖肽。
在包括任何前述实例的一些实例中,方法包括将样品中的糖肽片段化;以及检测多反应监测(MRM)转变,所述转变选自由以下组成的组:转变1、3、4、5、8、11、12、13、14、16、17、18、19、20、22、23、24、25、27、30、32、34、43、45、51、54、55、65、68、71、73、74、75及其组合。
在包括任何前述实例的一些实例中,方法包括将样品中的糖肽片段化;以及检测多反应监测(MRM)转变,所述转变选自由以下组成的组:转变2、6、7、9、10、15、21、26、28、29、31、33、35、36、37、38、39、40、41、42、44、46、47、48、49、50、52、53、56、57、58、59、60、61、62、63、64、66、67、69、70、72、76及其组合。
在包括任何前述实例的一些实例中,方法包括将样品中的糖肽片段化;以及检测多反应监测(MRM)转变,所述转变选自由以下组成的组:转变1、6、7、8、10、15、21、22、23、42、47、48、51、56、57、58、62、74和76,及其组合。
在一些实例中,本文阐述检测一种或多种糖肽的方法,其中每种糖肽在每种情况下单独地选自由氨基酸序列组成的糖肽,所述氨基酸序列选自由SEQ ID NO:1-76及其组合组成的组。
在一些实例中,本文阐述检测一种或多种糖肽的方法,其中每种糖肽在每种情况下单独地选自基本上由氨基酸序列组成的糖肽,所述氨基酸序列选自由SEQ ID NO:1-76及其组合组成的组。
在一些实例中,本文阐述检测一种或多种糖肽的方法。在一些实例中,本文阐述检测一个或多个糖肽片段的方法。在某些实例中,方法包括检测糖肽或其片段所属的糖肽组。在这些实例中的一些中,糖肽组选自α-1-抗胰蛋白酶(A1AT)、α-1B-糖蛋白(A1BG)、富含亮氨酸的α-2-糖蛋白(A2GL)、α-2-巨球蛋白(A2MG)、α-1-抗糜蛋白酶(AACT)、Afamin(AFAM)、α-1-酸性糖蛋白1&2(AGP12)、α-1-酸性糖蛋白1(AGP1)、α-1-酸性糖蛋白2(AGP2)、载脂蛋白A-I(APOA1)、载脂蛋白C-III(APOC3)、载脂蛋白B-100(APOB)、载脂蛋白D(APOD)、β-2-糖蛋白-1(APOH)、载脂蛋白M(APOM)、引蛋白(ATRN)、钙蛋白酶-3(CAN3)、铜蓝蛋白(CERU)、补体因子H(CFAH)、补体因子I(CFAI)、聚集素(CLUS)、补体C3(CO3)、补体C4-A&B(CO4A&CO4B)、补体成分C6(CO6)、补体成分C8A链(CO8A)、凝血因子XII(FA12)、α-2-HS-糖蛋白(FETUA)、触珠蛋白(HPT)、富含组氨酸的糖蛋白(HRG)、免疫球蛋白重恒定α1&2(IgA12)、免疫球蛋白重恒定α2(IgA2)、免疫球蛋白重恒定γ2(IgG2)、免疫球蛋白重恒定μ(IgM)、间α-胰蛋白酶抑制剂重链H1(ITIH1)、血浆激肽释放酶(KLKB1)、激肽原-1(KNG1)、血清对氧磷酶/芳酯酶1(PON1)、硒蛋白P(SEPP1)、凝血酶原(THRB)、血清转铁蛋白(TRFE)、转甲状腺素蛋白(TTR)、蛋白unc-13HomologA(UN13A)、玻连蛋白(VTNC)、锌-α-2-糖蛋白(ZA2G)、胰岛素样生长因子-II(IGF2)、载脂蛋白C-I(APOC1)及其组合。
在包括任何前述实例的一些实例中,方法包括检测糖肽、糖肽上的聚糖和聚糖与糖肽结合的糖基化位点残基。在某些实例中,方法包括检测聚糖残基。在一些实例中,方法包括检测糖肽上的糖基化位点。在一些实例中,此过程通过质谱法与液相色谱法串联使用来完成。
在包括任何前述实例的一些实例中,方法包括从患者获得生物样品。在一些实例中,生物样品是滑液、全血、血清、血浆、尿液、痰液、组织、唾液、泪液、脊髓液、活检获得的组织切片;置于或适应于组织培养的细胞;汗液、粘液、粪便、胃液、腹水、羊水、囊液、腹腔液、胰液、母乳、肺灌洗液、骨髓、胃酸、胆汁、精液、脓液、房水、渗出液或前述的组合。在某些实例中,生物样品选自由血液、血浆、唾液、粘液、尿液、粪便、组织、汗液、泪液、毛发或其组合组成的组。在这些实例中的一些实例中,生物样品是血液样品。在这些实例中的一些实例中,生物样品是血浆样品。在这些实例中的一些实例中,生物样品是唾液样品。在这些实例中的一些实例中,生物样品是粘液样品。在这些实例中的一些实例中,生物样品是尿液样品。在这些实例中的一些实例中,生物样品是粪便样品。在这些实例中的一些实例中,生物样品是汗液样品。在这些实例中的一些实例中,生物样品是泪液样品。在这些实例中的一些实例中,生物样品是毛发样品。
在包括任何前述实例的一些实例中,方法还包括消化和/或片段化样品中的糖肽。在某些实例中,方法包括消化样品中的糖肽。在某些实例中,方法包括片段化样品中的糖肽。在一些实例中,使用质谱法分析消化或片段化的糖肽。在一些实例中,糖肽在溶液相中使用消化酶消化或片段化。在一些实例中,糖肽在质谱仪或与质谱仪相关的仪器内以气相被消化或片段化。在一些实例中,使用机器学习算法分析质谱法结果。在一些实例中,质谱法结果是糖肽、聚糖、肽及其片段的量化。在一些实例中,此量化被用作训练模型中的输入以生成输出概率。输出概率是处于给定类别或分类,例如患有卵巢癌的分类或未患卵巢癌的分类内的概率。在一些其它实例中,输出概率是处于给定类别或分类,例如患有癌症的分类或未患癌症的分类内的概率。在一些其它实例中,输出概率是处于给定类别或分类,例如患有自身免疫疾病的分类或未患自身免疫疾病的分类内的概率。在一些其它实例中,输出概率是处于给定类别或分类,例如患有纤维化的分类或未患纤维化的分类内的概率。
在包括任何前述实例的一些实例中,方法包括将样品或其一部分引入质谱仪。
在包括任何前述实例的一些实例中,方法包括在将样品或其一部分引入质谱仪之后将样品中的糖肽片段化。
在包括任何前述实例的一些实例中,质谱法是使用多反应监测(MRM)模式进行的。在一些实例中,质谱法是在数据相关采集中使用QTOF MS进行的。在一些实例中,质谱法是使用或仅MS模式进行的。在一些实例中,免疫分析与质谱法组合使用。在一些实例中,免疫分析测量CA-125和HE4。
在包括任何前述实例的一些实例中,方法包括在将样品或其一部分引入质谱仪之前发生样品中的糖肽的消化。
在包括任何前述实例的一些实例中,方法包括将样品中的糖肽片段化以提供糖肽离子、肽离子、聚糖离子、聚糖加合离子或聚糖片段离子。
在包括任何前述实例的一些实例中,方法包括消化和/或片段化样品中的糖肽以提供由氨基酸序列组成的糖肽,所述氨基酸序列选自由SEQ ID NO:1-76及其组合组成的组。
在包括任何前述实例的一些实例中,方法包括消化和/或片段化样品中的糖肽以提供基本上由氨基酸序列组成的糖肽,所述氨基酸序列选自由SEQ ID NO:1-76及其组合组成的组。
在包括任何前述实例的一些实例中,方法包括消化样品中的糖肽以提供由氨基酸序列组成的糖肽,所述氨基酸序列选自由SEQ ID NO:1-76及其组合组成的组。
在包括任何前述实例的一些实例中,方法包括消化样品中的糖肽以提供基本上由氨基酸序列组成的糖肽,所述氨基酸序列选自由SEQ ID NO:1-76及其组合组成的组。
在包括任何前述实例的一些实例中,方法包括片段化样品中的糖肽以提供由氨基酸序列组成的糖肽,所述氨基酸序列选自由SEQ ID NO:1-76及其组合组成的组。
在包括任何前述实例的一些实例中,方法包括片段化样品中的糖肽以提供基本上由氨基酸序列组成的糖肽,所述氨基酸序列选自由SEQ ID NO:1-76及其组合组成的组。
在包括任何前述实例的一些实例中,方法包括片段化样品中的糖肽以提供由氨基酸序列组成的糖肽,所述氨基酸序列选自由SEQ ID NO:1、3、4、5、8、11、12、13、14、16、17、18、19、20、22、23、24、25、27、30、32、34、43、45、51、54、55、65、68、71、73、74、75及其组合组成的组。
在包括任何前述实例的一些实例中,方法包括片段化样品中的糖肽以提供基本上由氨基酸序列组成的糖肽,所述氨基酸序列选自由SEQ ID NO:1、3、4、5、8、11、12、13、14、16、17、18、19、20、22、23、24、25、27、30、32、34、43、45、51、54、55、65、68、71、73、74、75及其组合组成的组。
在包括任何前述实例的一些实例中,方法包括片段化样品中的糖肽以提供由氨基酸序列组成的糖肽,所述氨基酸序列选自由SEQ ID NO:2、6、7、9、10、15、21、26、28、29、31、33、35、36、37、38、39、40、41、42、44、46、47、48、49、50、52、53、56、57、58、59、60、61、62、63、64、66、67、69、70、72、76及其组合组成的组。
在包括任何前述实例的一些实例中,方法包括片段化样品中的糖肽以提供基本上由氨基酸序列组成的糖肽,所述氨基酸序列选自由SEQ ID NO:2、6、7、9、10、15、21、26、28、29、31、33、35、36、37、38、39、40、41、42、44、46、47、48、49、50、52、53、56、57、58、59、60、61、62、63、64、66、67、69、70、72、76及其组合组成的组。
在包括任何前述实例的一些实例中,方法包括片段化样品中的糖肽以提供由氨基酸序列组成的糖肽,所述氨基酸序列选自由SEQ ID NO:1、6、7、8、10、15、21、22、23、42、47、48、51、56、57、58、62、74和76及其组合组成的组。
在包括任何前述实例的一些实例中,方法包括片段化样品中的糖肽以提供基本上由氨基酸序列组成的糖肽,所述氨基酸序列选自由SEQ ID NO:1、6、7、8、10、15、21、22、23、42、47、48、51、56、57、58、62、74和76及其组合组成的组。
在包括任何前述实例的一些实例中,方法包括检测选自由转变1-76组成的组的多反应监测(MRM)转变。在一些实例中,方法包括检测指示糖肽或聚糖残基的MRM转变,其中糖肽基本上由氨基酸序列组成,所述氨基酸序列选自由SEQ ID NO:1-76及其组合组成的组。在一些实例中,方法包括检测指示糖肽的MRM转变,所述糖肽基本上由氨基酸序列组成,所述氨基酸序列选自由SEQ ID NO:1-76及其组合组成的组。在一些实例中,方法包括检测选自以下的超过一个MRM转变:来自由转变1-76组成的组的成员的组合。在一些实例中,方法包括检测超过一个MRM转变,其指示具有选自SEQ ID NO:1-76的组合的氨基酸序列的糖肽组合。
在包括任何前述实例的一些实例中,方法包括检测多反应监测(MRM)转变,所述转变选自由以下组成的组:转变1、3、4、5、8、11、12、13、14、16、17、18、19、20、22、23、24、25、27、30、32、34、43、45、51、54、55、65、68、71、73、74和75。在一些实例中,方法包括检测指示糖肽或聚糖残基的MRM转变,其中糖肽基本上由氨基酸序列组成,所述氨基酸序列选自由SEQ IDNO:1、3、4、5、8、11、12、13、14、16、17、18、19、20、22、23、24、25、27、30、32、34、43、45、51、54、55、65、68、71、73、74和75及其组合组成的组。在一些实例中,方法包括检测指示糖肽的MRM转变,所述糖肽基本上由氨基酸序列组成,所述氨基酸序列选自由SEQ ID NO:1、3、4、5、8、11、12、13、14、16、17、18、19、20、22、23、24、25、27、30、32、34、43、45、51、54、55、65、68、71、73、74和75及其组合组成的组。在一些实例中,方法包括检测选自以下的超过一个MRM转变:来自由转变1、3、4、5、8、11、12、13、14、16、17、18、19、20、22、23、24、25、27、30、32、34、43、45、51、54、55、65、68、71、73、74和75组成的组的成员的组合。在一些实例中,方法包括检测超过一个MRM转变,其指示具有选自SEQ ID NO:1、3、4、5、8、11、12、13、14、16、17、18、19、20、22、23、24、25、27、30、32、34、43、45、51、54、55、65、68、71、73、74和75的组合的氨基酸序列的糖肽组合。
在包括任何前述实例的一些实例中,方法包括检测多反应监测(MRM)转变,所述转变选自由以下组成的组:转变2、6、7、9、10、15、21、26、28、29、31、33、35、36、37、38、39、40、41、42、44、46、47、48、49、50、52、53、56、57、58、59、60、61、62、63、64、66、67、69、70、72和76。在一些实例中,方法包括检测指示糖肽或聚糖残基的MRM转变,其中糖肽基本上由氨基酸序列组成,所述氨基酸序列选自由SEQ ID NO:2、6、7、9、10、15、21、26、28、29、31、33、35、36、37、38、39、40、41、42、44、46、47、48、49、50、52、53、56、57、58、59、60、61、62、63、64、66、67、69、70、72、76及其组合组成的组。在一些实例中,方法包括检测指示糖肽的MRM转变,所述糖肽基本上由氨基酸序列组成,所述氨基酸序列选自由SEQ ID NO:2、6、7、9、10、15、21、26、28、29、31、33、35、36、37、38、39、40、41、42、44、46、47、48、49、50、52、53、56、57、58、59、60、61、62、63、64、66、67、69、70、72、76及其组合组成的组。在一些实例中,方法包括检测选自以下的超过一个MRM转变:来自由转变2、6、7、9、10、15、21、26、28、29、31、33、35、36、37、38、39、40、41、42、44、46、47、48、49、50、52、53、56、57、58、59、60、61、62、63、64、66、67、69、70、72和76组成的组的成员的组合。在一些实例中,方法包括检测超过一个MRM转变,其指示具有选自SEQ ID NO:2、6、7、9、10、15、21、26、28、29、31、33、35、36、37、38、39、40、41、42、44、46、47、48、49、50、52、53、56、57、58、59、60、61、62、63、64、66、67、69、70、72和76的组合的氨基酸序列的糖肽组合。
在包括任何前述实例的一些实例中,方法包括检测选自由转变1、6、7、8、10、15、21、22、23、42、47、48、51、56、57、58、62、74和76组成的组的多反应监测(MRM)转变。在一些实例中,方法包括检测指示糖肽或聚糖残基的MRM转变,其中糖肽基本上由氨基酸序列组成,所述氨基酸序列选自由SEQ ID NO:1、6、7、8、10、15、21、22、23、42、47、48、51、56、57、58、62、74和76及其组合组成的组。在一些实例中,方法包括检测指示糖肽的MRM转变,所述糖肽基本上由氨基酸序列组成,所述氨基酸序列选自由SEQ ID NO:1、6、7、8、10、15、21、22、23、42、47、48、51、56、57、58、62、74和76及其组合组成的组。在一些实例中,方法包括检测选自以下的超过一个MRM转变:来自由转变1、6、7、8、10、15、21、22、23、42、47、48、51、56、57、58、62、74和76组成的组的成员的组合。在一些实例中,方法包括检测超过一个MRM转变,其指示具有选自SEQ ID NO:1、6、7、8、10、15、21、22、23、42、47、48、51、56、57、58、62、74和76的组合的氨基酸序列的糖肽组合。
在包括任何前述实例的一些实例中,方法包括使用多反应监测质谱法(MRM-MS)对生物样品进行质谱分析。
在包括任何前述实例的一些实例中,方法包括消化样品中的糖肽以提供基本上由氨基酸序列组成的糖肽,所述氨基酸序列选自由SEQ ID NO:1-76及其组合组成的组。在某些实例中,生物样品与化学试剂组合。在某些实例中,生物样品与酶组合。在一些实例中,酶是脂肪酶。在一些实例中,酶是蛋白酶。在一些实例中,酶是丝氨酸蛋白酶。在这些实例中的一些中,酶选自由胰蛋白酶、糜蛋白酶、凝血酶、弹性蛋白酶和枯草杆菌蛋白酶组成的组。在这些实例中的一些实例中,酶是胰蛋白酶。在一些实例中,方法包括使至少两种蛋白酶与样品中的糖肽接触。在一些实例中,至少两种蛋白酶选自由以下组成的组:丝氨酸蛋白酶、苏氨酸蛋白酶、半胱氨酸蛋白酶、天冬氨酸蛋白酶。在一些实例中,至少两种蛋白酶选自由以下组成的组:胰蛋白酶、糜蛋白酶、内切蛋白酶、Asp-N、Arg-C、Glu-C、Lys-C、胃蛋白酶、嗜热菌蛋白酶、弹性蛋白酶、木瓜蛋白酶、蛋白酶K、枯草杆菌蛋白酶、梭菌蛋白酶和羧肽酶蛋白酶、谷氨酸蛋白酶、金属蛋白酶和天冬酰胺肽裂解酶。
在包括任何前述实例的一些实例中,方法包括检测选自由转变1-76组成的组的多反应监测(MRM)转变。在一些实例中,方法包括检测指示糖肽或聚糖残基的MRM转变,其中糖肽由氨基酸序列组成或基本上由氨基酸序列组成,所述氨基酸序列选自由SEQ ID NO:1-76及其组合组成的组。在一些实例中,方法包括检测指示糖肽或聚糖残基的MRM转变,其中糖肽基本上由氨基酸序列组成,所述氨基酸序列选自由SEQ ID NO:1-76及其组合组成的组。在一些实例中,方法包括检测指示糖肽的MRM转变,所述糖肽基本上由氨基酸序列组成,所述氨基酸序列选自由SEQ ID NO:1-76及其组合组成的组。在一些实例中,方法包括检测选自以下的超过一个MRM转变:来自由转变1-76组成的组的成员的组合。在一些实例中,方法包括检测超过一个MRM转变,其指示具有选自SEQ ID NO:1-76的组合的氨基酸序列的糖肽组合。
在包括任何前述实例的一些实例中,方法包括检测多反应监测(MRM)转变,所述转变选自由以下组成的组:转变1、3、4、5、8、11、12、13、14、16、17、18、19、20、22、23、24、25、27、30、32、34、43、45、51、54、55、65、68、71、73、74和75。在一些实例中,方法包括检测指示糖肽或聚糖残基的MRM转变,其中糖肽由氨基酸序列组成或基本上由氨基酸序列组成,所述氨基酸序列选自由SEQ ID NO:1、3、4、5、8、11、12、13、14、16、17、18、19、20、22、23、24、25、27、30、32、34、43、45、51、54、55、65、68、71、73、74和75及其组合组成的组。在一些实例中,方法包括检测指示糖肽或聚糖残基的MRM转变,其中糖肽基本上由氨基酸序列组成,所述氨基酸序列选自由SEQ ID NO:1、3、4、5、8、11、12、13、14、16、17、18、19、20、22、23、24、25、27、30、32、34、43、45、51、54、55、65、68、71、73、74和75及其组合组成的组。在一些实例中,方法包括检测指示糖肽的MRM转变,所述糖肽基本上由氨基酸序列组成,所述氨基酸序列选自由SEQ ID NO:1、3、4、5、8、11、12、13、14、16、17、18、19、20、22、23、24、25、27、30、32、34、43、45、51、54、55、65、68、71、73、74和75及其组合组成的组。在一些实例中,方法包括检测选自以下的超过一个MRM转变:来自由转变1、3、4、5、8、11、12、13、14、16、17、18、19、20、22、23、24、25、27、30、32、34、43、45、51、54、55、65、68、71、73、74和75组成的组的成员的组合。在一些实例中,方法包括检测超过一个MRM转变,其指示具有选自SEQ ID NO:1、3、4、5、8、11、12、13、14、16、17、18、19、20、22、23、24、25、27、30、32、34、43、45、51、54、55、65、68、71、73、74和75的组合的氨基酸序列的糖肽组合。
在包括任何前述实例的一些实例中,方法包括检测多反应监测(MRM)转变,所述转变选自由以下组成的组:转变2、6、7、9、10、15、21、26、28、29、31、33、35、36、37、38、39、40、41、42、44、46、47、48、49、50、52、53、56、57、58、59、60、61、62、63、64、66、67、69、70、72和76。在一些实例中,方法包括检测指示糖肽或聚糖残基的MRM转变,其中糖肽由氨基酸序列组成或基本上由氨基酸序列组成,所述氨基酸序列选自由SEQ ID NO:2、6、7、9、10、15、21、26、28、29、31、33、35、36、37、38、39、40、41、42、44、46、47、48、49、50、52、53、56、57、58、59、60、61、62、63、64、66、67、69、70、72、76及其组合组成的组。在一些实例中,方法包括检测指示糖肽或聚糖残基的MRM转变,其中糖肽基本上由氨基酸序列组成,所述氨基酸序列选自由SEQID NO:2、6、7、9、10、15、21、26、28、29、31、33、35、36、37、38、39、40、41、42、44、46、47、48、49、50、52、53、56、57、58、59、60、61、62、63、64、66、67、69、70、72、76及其组合组成的组。在一些实例中,方法包括检测指示糖肽的MRM转变,所述糖肽基本上由氨基酸序列组成,所述氨基酸序列选自由SEQ ID NO:2、6、7、9、10、15、21、26、28、29、31、33、35、36、37、38、39、40、41、42、44、46、47、48、49、50、52、53、56、57、58、59、60、61、62、63、64、66、67、69、70、72、76及其组合组成的组。在一些实例中,方法包括检测选自以下的超过一个MRM转变:来自由转变2、6、7、9、10、15、21、26、28、29、31、33、35、36、37、38、39、40、41、42、44、46、47、48、49、50、52、53、56、57、58、59、60、61、62、63、64、66、67、69、70、72和76组成的组的成员的组合。在一些实例中,方法包括检测超过一个MRM转变,其指示具有选自SEQ ID NO:2、6、7、9、10、15、21、26、28、29、31、33、35、36、37、38、39、40、41、42、44、46、47、48、49、50、52、53、56、57、58、59、60、61、62、63、64、66、67、69、70、72和76的组合的氨基酸序列的糖肽组合。
在包括任何前述实例的一些实例中,方法包括检测选自由转变1、6、7、8、10、15、21、22、23、42、47、48、51、56、57、58、62、74和76组成的组的多反应监测(MRM)转变。在一些实例中,方法包括检测指示糖肽或聚糖残基的MRM转变,其中糖肽由氨基酸序列组成或基本上由氨基酸序列组成,所述氨基酸序列选自由SEQ ID NO:1、6、7、8、10、15、21、22、23、42、47、48、51、56、57、58、62、74和76及其组合组成的组。在一些实例中,方法包括检测指示糖肽或聚糖残基的MRM转变,其中糖肽基本上由氨基酸序列组成,所述氨基酸序列选自由SEQ IDNO:1、6、7、8、10、15、21、22、23、42、47、48、51、56、57、58、62、74和76及其组合组成的组。在一些实例中,方法包括检测指示糖肽的MRM转变,所述糖肽基本上由氨基酸序列组成,所述氨基酸序列选自由SEQ ID NO:1、6、7、8、10、15、21、22、23、42、47、48、51、56、57、58、62、74和76及其组合组成的组。在一些实例中,方法包括检测选自以下的超过一个MRM转变:来自由转变1、6、7、8、10、15、21、22、23、42、47、48、51、56、57、58、62、74和76组成的组的成员的组合。在一些实例中,方法包括检测超过一个MRM转变,其指示具有选自SEQ ID NO:1、6、7、8、10、15、21、22、23、42、47、48、51、56、57、58、62、74和76的组合的氨基酸序列的糖肽组合。
在包括任何前述实例的一些实例中,方法包括使用多反应监测质谱法(MRM-MS)对生物样品进行质谱分析。
在包括任何前述实例的一些实例中,方法包括消化样品中的糖肽以提供由氨基酸序列组成的糖肽,所述氨基酸序列选自由SEQ ID NO:1-76及其组合组成的组。在某些实例中,生物样品与一种或多种化学试剂接触。在某些实例中,生物样品与一种或多种酶接触。在一些实例中,酶是脂肪酶。在一些实例中,酶是蛋白酶。在一些实例中,酶是丝氨酸蛋白酶。在这些实例中的一些中,酶选自由胰蛋白酶、糜蛋白酶、凝血酶、弹性蛋白酶和枯草杆菌蛋白酶组成的组。在这些实例中的一些实例中,酶是胰蛋白酶。在一些实例中,方法包括使至少两种蛋白酶与样品中的糖肽接触。在一些实例中,至少两种蛋白酶选自由以下组成的组:丝氨酸蛋白酶、苏氨酸蛋白酶、半胱氨酸蛋白酶、天冬氨酸蛋白酶。在一些实例中,至少两种蛋白酶选自由以下组成的组:胰蛋白酶、糜蛋白酶、内切蛋白酶、Asp-N、Arg-C、Glu-C、Lys-C、胃蛋白酶、嗜热菌蛋白酶、弹性蛋白酶、木瓜蛋白酶、蛋白酶K、枯草杆菌蛋白酶、梭菌蛋白酶和羧肽酶蛋白酶、谷氨酸蛋白酶、金属蛋白酶和天冬酰胺肽裂解酶。
在包括任何前述实例的一些实例中,MRM转变选自表1、2或3中任一个中的转变或其任何组合。
在包括任何前述实例的一些实例中,方法包括对生物样品进行串联液相色谱法-质谱法。
在包括任何前述实例的一些实例中,方法包括对生物样品的多反应监测质谱法(MRM-MS)质谱法。
在包括任何前述实例的一些实例中,方法包括使用三重四极杆(QQQ)和/或四极飞行时间(qTOF)质谱仪检测MRM转变。在某些实例中,方法包括使用QQQ质谱仪检测MRM转变。在某些其它实例中,方法包括使用qTOF质谱仪进行检测。在一些实例中,适用于本方法的仪器是Agilent 6495B三重四极杆LC/MS,所述仪器可以在www.agilent.com/en/products/mass-spectrometry/lc-ms-instruments/triple-quadrupole-lc-ms/6495b-triple-quadrupole-lc-ms找到。在某些其它实例中,方法包括使用QQQ质谱仪进行检测。在一些实例中,适用于本方法的仪器是Agilent 6545LC/Q-TOF,所述仪器可以在https://www.agilent.com/en/products/liquid-chromatography-mass-spectrometry-lc-ms/lc-ms-instruments/quadrupole-time-of-flight-lc-ms/6545-q-tof-lc-ms找到。
在包括任何前述实例的一些实例中,方法包括使用QQQ和/或qTOF质谱仪检测多于一个MRM转变。在某些实例中,方法包括使用QQQ质谱仪检测多于一个MRM转变。在某些实例中,方法包括使用qTOF质谱仪检测多于一个MRM转变。在某些实例中,方法包括使用QQQ质谱仪检测多于一个MRM转变。
在包括任何前述实例的一些实例中,本文的方法包括量化一种或多种生物样品的一个或多个糖组学参数,包括采用耦合色谱法程序。在一些实例中,这些糖组学参数包括糖肽组的鉴定、糖肽上聚糖的鉴定、糖基化位点的鉴定、糖肽包括的氨基酸序列的一部分的鉴定。在一些实例中,耦合色谱法程序包括:执行或实施液相色谱法-质谱法(LC-MS)操作。在一些实施例中,耦合色谱法程序包括:执行或实施多反应监测质谱法(MRM-MS)操作。在一些实例中,本文的方法包括耦合色谱法程序,其包括:进行或实施液相色谱法-质谱法(LC-MS)操作;以及实施多反应监测质谱法(MRM-MS)操作。在一些实例中,方法包括使用通过三重四极杆(QQQ)质谱法操作和/或四极飞行时间(qTOF)质谱法操作中的一者或多者获得的一种或多种生物样品的一个或多个糖组学参数来训练机器学习算法。在一些实例中,方法包括使用通过三重四极杆(QQQ)质谱法操作获得的一种或多种生物样品的一个或多个糖组学参数来训练机器学习算法。在一些实例中,方法包括使用通过四极飞行时间(qTOF)质谱法操作获得的一种或多种生物样品的一个或多个糖组学参数来训练机器学习算法。在一些实例中,方法包括量化一种或多种生物样品的一个或多个糖组学参数,包括采用三重四极杆(QQQ)质谱法操作和四极飞行时间(qTOF)质谱法操作中的一者或多者。在一些实例中,机器学习算法用于量化这些糖组学参数。在包括任何前述实例的一些实例中,质谱法是使用多反应监测(MRM)模式进行的。在一些实例中,质谱法是在数据相关采集中使用QTOF MS进行的。在一些实例中,质谱法是使用或仅MS模式进行的。在一些实例中,免疫分析(例如ELISA)与质谱法组合使用。在一些实例中,免疫分析测量CA-125和HE4蛋白。
在包括任何前述实例的一些实例中,糖肽或其组合由氨基酸序列组成,所述氨基酸序列选自由SEQ ID NO:1-76及其组合组成的组。
在包括任何前述实例的一些实例中,糖肽或其组合基本上由氨基酸序列组成,所述氨基酸序列选自由SEQ ID NO:1-76及其组合组成的组。
在包括任何前述实例的一些实例中,糖肽或其组合由氨基酸序列组成,所述氨基酸序列选自由SEQ ID NO:1、3、4、5、8、11、12、13、14、16、17、18、19、20、22、23、24、25、27、30、32、34、43、45、51、54、55、65、68、71、73、74和75及其组合组成的组。
在包括任何前述实例的一些实例中,糖肽或其组合基本上由氨基酸序列组成,所述氨基酸序列选自由SEQ ID NO:1、3、4、5、8、11、12、13、14、16、17、18、19、20、22、23、24、25、27、30、32、34、43、45、51、54、55、65、68、71、73、74和75及其组合组成的组。
在包括任何前述实例的一些实例中,糖肽或其组合由氨基酸序列组成,所述氨基酸序列选自由SEQ ID NO:1、6、7、8、10、15、21、22、23、42、47、48、51、56、57、58、62、74和76及其组合组成的组。
在包括任何前述实例的一些实例中,糖肽或其组合基本上由氨基酸序列组成,所述氨基酸序列选自由SEQ ID NO:1、6、7、8、10、15、21、22、23、42、47、48、51、56、57、58、62、74和76及其组合组成的组。
在包括任何前述实例的一些实例中,糖肽或其组合由氨基酸序列组成,所述氨基酸序列选自由SEQ ID NO:2、6、7、9、10、15、21、26、28、29、31、33、35、36、37、38、39、40、41、42、44、46、47、48、49、50、52、53、56、57、58、59、60、61、62、63、64、66、67、69、70、72、76及其组合组成的组。
在包括任何前述实例的一些实例中,糖肽或其组合基本上由氨基酸序列组成,所述氨基酸序列选自由SEQ ID NO:2、6、7、9、10、15、21、26、28、29、31、33、35、36、37、38、39、40、41、42、44、46、47、48、49、50、52、53、56、57、58、59、60、61、62、63、64、66、67、69、70、72、76及其组合组成的组。
在包括任何前述实例的一些实例中,糖肽或其组合由氨基酸序列组成,所述氨基酸序列选自由SEQ ID NO:1、6、7、8、10、15、21、22、23、42、47、48、51、56、57、58、62、74和76及其组合组成的组。
在包括任何前述实例的一些实例中,糖肽或其组合基本上由氨基酸序列组成,所述氨基酸序列选自由SEQ ID NO:1、6、7、8、10、15、21、22、23、42、47、48、51、56、57、58、62、74和76及其组合组成的组。
在包括任何前述实例的一些实例中,方法包括消化和/或片段化样品中的糖肽以提供由氨基酸序列组成的糖肽,所述氨基酸序列选自由SEQ ID NO:1-76及其组合组成的组。
在包括任何前述实例的一些实例中,方法包括消化和/或片段化样品中的糖肽以提供基本上由氨基酸序列组成的糖肽,所述氨基酸序列选自由SEQ ID NO:1-76及其组合组成的组。
在包括任何前述实例的一些实例中,方法包括消化和/或片段化样品中的糖肽以提供由氨基酸序列组成的糖肽,所述氨基酸序列选自由SEQ ID NO:1、6、7、8、10、15、21、22、23、42、47、48、51、56、57、58、62、74和76及其组合组成的组。
在包括任何前述实例的一些实例中,方法包括消化和/或片段化样品中的糖肽以提供基本上由氨基酸序列组成的糖肽,所述氨基酸序列选自由SEQ ID NO:1、6、7、8、10、15、21、22、23、42、47、48、51、56、57、58、62、74和76及其组合组成的组。
在包括任何前述实例的一些实例中,方法包括检测一个或多个指示聚糖的MRM转变,所述聚糖选自由以下组成的组:聚糖3200、3210、3300、3310、3320、3400、3410、3420、3500、3510、3520、3600、3610、3620、3630、3700、3710、3720、3730、3740、4200、4210、4300、4301、4310、4311、4320、4400、4401、4410、4411、4420、4421、4430、4431、4500、4501、4510、4511、4520、4521、4530、4531、4540、4541、4600、4601、4610、4611、4620、4621、4630、4631、4641、4650、4700、4701、4710、4711、4720、4730、5200、5210、5300、5301、5310、5311、5320、5400、5401、5402、5410、5411、5412、5420、5421、5430、5431、5432、5500、5501、5502、5510、5511、5512、5520、5521、5522、5530、5531、5541、5600、5601、5602、5610、5611、5612、5620、5621、5631、5650、5700、5701、5702、5710、5711、5712、5720、5721、5730、5731、6200、6210、6300、6301、6310、6311、6320、6400、6401、6402、6410、6411、6412、6420、6421、6432、6500、6501、6502、6503、6510、6511、6512、6513、6520、6521、6522、6530、6531、6532、6540、6541、6600、6601、6602、6603、6610、6611、6612、6613、6620、6621、6622、6623、6630、6631、6632、6640、6641、6642、6652、6700、6701、6711、6721、6703、6713、6710、6711、6712、6713、6720、6721、6730、6731、6740、7200、7210、7400、7401、7410、7411、7412、7420、7421、7430、7431、7432、7500、7501、7510、7511、7512、7600、7601、7602、7603、7604、7610、7611、7612、7613、7614、7620、7621、7622、7623、7632、7640、7700、7701、7702、7703、7710、7711、7712、7713、7714、7720、7721、7722、7730、7731、7732、7740、7741、7751、8200、9200、9210、10200、11200、12200及其组合。本文中,这些聚糖如图1-14中所示。
在包括任何前述实例的一些实例中,方法包括对聚糖进行量化。
在包括任何前述实例的一些实例中,方法包括量化第一聚糖和量化第二聚糖;并且还包括将第一聚糖的量化与第二聚糖的量化进行比较。
在包括任何前述实例的一些实例中,方法包括将检测到的聚糖与聚糖结合的肽残基位点缔合。
在包括任何前述实例的一些实例中,方法包括生成样品的糖基化谱。
在包括任何前述实例的一些实例中,方法包括对与样品相关的组织切片上的聚糖进行空间分析。在包括任何前述实例的一些实例中,方法包括对与样品相关的组织切片上的糖肽进行空间分析。在一些实例中,方法包括与本文方法组合的基质辅助激光解吸电离飞行时间质谱法(MALDI-TOF)质谱法。
在包括任何前述实例的一些实例中,方法包括量化聚糖和/或肽的相对丰度。
在包括任何前述实例的一些实例中,方法包括通过量化基本上由氨基酸序列组成的糖肽来标准化糖肽的量,所述氨基酸序列选自由SEQ ID NO:1-76及其组合组成的组,并比较所述量化与另一化学物质的量。在一些实例中,方法包括通过量化由氨基酸序列组成的糖肽来标准化肽的量,所述氨基酸序列选自由SEQ ID NO:1-76及其组合组成的组,并将所述量化与由氨基酸序列组成的另一糖肽的量进行比较,所述氨基酸序列选自由SEQ IDNO:1-76组成的组。在一些实例中,方法包括通过量化基本上由氨基酸序列组成的糖肽来标准化肽的量,所述氨基酸序列选自由SEQ ID NO:1-76及其组合组成的组,并将所述量化与基本上由氨基酸序列组成的另一糖肽的量进行比较,所述氨基酸序列选自由SEQ ID NO:1-76组成的组。
在包括任何前述实例的一些实例中,方法包括通过量化基本上由氨基酸序列组成的糖肽来标准化糖肽的量,所述氨基酸序列选自由SEQ ID NO:1、6、7、8、10、15、21、22、23、42、47、48、51、56、57、58、62、74和76及其组合组成的组,并比较所述量化与另一化学物质的量。在一些实例中,方法包括通过量化由氨基酸序列组成的糖肽来标准化肽的量,所述氨基酸序列选自由SEQ ID NO:1、6、7、8、10、15、21、22、23、42、47、48、51、56、57、58、62、74和76及其组合组成的组,并将所述量化与由氨基酸序列组成的另一糖肽的量进行比较,所述氨基酸序列选自由SEQ ID NO:1、6、7、8、10、15、21、22、23、42、47、48、51、56、57、58、62、74和76组成的组。在一些实例中,方法包括通过量化基本上由氨基酸序列组成的糖肽来标准化肽的量,所述氨基酸序列选自由SEQ ID NO:1、6、7、8、10、15、21、22、23、42、47、48、51、56、57、58、62、74和76及其组合组成的组,并将所述量化与基本上由氨基酸序列组成的另一糖肽的量进行比较,所述氨基酸序列选自由SEQ ID NO:1、6、7、8、10、15、21、22、23、42、47、48、51、56、57、58、62、74和76组成的组。
B.用于对包含糖肽的样品进行分类的方法
在另一实施方案中,本文阐述一种用于鉴别样品的分类的方法,所述方法包括:通过质谱法(MS)量化样品中的一种或多种糖肽,其中糖肽各自在每种情况下单独地包含基本上由氨基酸序列组成的糖肽,所述氨基酸序列选自由或基本上由SEQ ID NO:1-76及其组合组成的组;和将所述量化输入到训练模型中以生成输出概率;确定输出概率是高于还是低于分类阈值;以及基于输出概率是高于还是低于分类阈值来鉴别样品的分类。
在一些实例中,本文阐述了用于对糖肽进行分类的方法,所述方法包括:从患者获得生物样品;消化和/或片段化样品中的糖肽;检测选自由转变1-76组成的组的多反应监测(MRM)转变;以及根据检测到的MRM转变对糖肽进行分类。在一些实例中,机器学习算法用于使用分析的MRM转变作为输入来训练模型。在一些实例中,使用MRM转变作为训练数据集来训练机器学习算法。在一些实例中,本文中的方法包括基于糖肽、肽和聚糖的质谱相对丰度来鉴定糖肽、肽和聚糖。在一些实例中,一种或多种机器学习算法选择和/或鉴定质谱图中的峰。
在一些实例中,本文阐述了用于对糖肽进行分类的方法,所述方法包括:从个体获得生物样品;消化和/或片段化样品中的糖肽;检测选自由转变1-76组成的组的多反应监测(MRM)转变;以及根据检测到的MRM转变对糖肽进行分类。在一些实例中,机器学习算法用于使用分析的MRM转变作为输入来训练模型。在一些实例中,使用MRM转变作为训练数据集来训练机器学习算法。在一些实例中,本文中的方法包括基于糖肽、肽和聚糖的质谱相对丰度来鉴定糖肽、肽和聚糖。在一些实例中,一种或多种机器学习算法选择和/或鉴定质谱图中的峰。
在一些实例中,本文阐述使用MRM转变作为输入数据集来训练机器学习算法的方法。在一些实例中,本文阐述用于鉴别样品分类的方法,所述方法包括通过质谱法(MS)量化样品中的糖肽,其中糖肽由氨基酸序列或基本上由其组成,所述氨基酸序列选自由SEQ IDNO:1-76及其组合组成的组;以及基于所述量化来鉴别分类。在一些实例中,量化包括确定样品中糖肽或糖肽组合的存在或不存在。在一些实例中,量化包括确定样品中糖肽或糖肽组合的相对丰度。
在包括任何前述实例的一些实例中,样品是来自患有疾病或疾患的患者的生物样品。
在包括任何前述实例的一些实例中,患者患有卵巢癌。
在包括任何前述实例的一些实例中,患者患有癌症。
在包括任何前述实例的一些实例中,患者患有纤维化。
在包括任何前述实例的一些实例中,患者患有自身免疫疾病。
在包括任何前述实例的一些实例中,疾病或疾患是卵巢癌。
在包括任何前述实例的一些实例中,MS是利用QQQ和/或qTOF质谱仪的MRM-MS。
在包括任何前述实例的一些实例中,质谱法是使用多反应监测(MRM)模式进行的。在一些实例中,质谱法是在数据相关采集中使用QTOF MS进行的。在一些实例中,质谱法是使用或仅MS模式进行的。在一些实例中,免疫分析与质谱法组合使用。在一些实例中,免疫分析测量CA-125和HE4。
在包括任何前述实例的一些实例中,机器学习算法选自由以下组成的组:深度学习算法、神经网络算法、人工神经网络算法、监督机器学习算法、线性判别分析算法、二次判别分析算法、支持向量机算法、线性基函数核支持向量算法、径向基函数核支持向量算法、随机森林算法、遗传算法、最近邻算法、k-最近邻、朴素贝叶斯分类器算法、逻辑回归算法或其组合。在某些实例中,机器学习算法是套索回归。
在包括任何前述实例的一些实例中,方法包括将样品分类为在疾病分类或疾病严重程度分类之内或包含于其中。
在包括任何前述实例的一些实例中,以80%置信度、85%置信度、90%置信度、95%置信度、99%置信度或
99.9999%置信度来鉴别分类。
在包括任何前述实例的一些实例中,方法包括在第一时间点通过MS对样品中的糖肽进行量化;在第二时间点通过MS对样品中的糖肽进行量化;以及比较第一时间点的量化与第二时间点的量化。
在包括任何前述实例的一些实例中,方法包括在第三时间点通过MS对样品中的不同糖肽进行量化;在第四时间点通过MS对样品中的不同糖肽进行量化;以及比较第四时间点的量化与第三时间点的量化。
在包括任何前述实例的一些实例中,方法包括监测患者的健康状态。
在包括任何前述实例的一些实例中,监测患者的健康状态包括监测具有风险因素例如基因突变的患者的疾病发作和进展,以及检测癌症复发。
在包括任何前述实例的一些实例中,方法包括通过MS对由氨基酸序列组成的糖肽进行量化,所述氨基酸序列选自由SEQ ID NO:1-76组成的组。
在包括任何前述实例的一些实例中,方法包括通过MS对基本上由氨基酸序列组成的糖肽进行量化,所述氨基酸序列选自由SEQ ID NO:1-76组成的组。
在包括任何前述实例的一些实例中,方法包括通过MS对由氨基酸序列组成的糖肽进行量化,所述氨基酸序列选自由SEQ ID NO:1、6、7、8、10、15、21、22、23、42、47、48、51、56、57、58、62、74和76组成的组。
在包括任何前述实例的一些实例中,方法包括通过MS对基本上由氨基酸序列组成的糖肽进行量化,所述氨基酸序列选自由SEQ ID NO:1、6、7、8、10、15、21、22、23、42、47、48、51、56、57、58、62、74和76组成的组。
在包括任何前述实例的一些实例中,方法包括通过MS对选自由以下组成的组的一种或多种聚糖进行量化:聚糖3200、3210、3300、3310、3320、3400、3410、3420、3500、3510、3520、3600、3610、3620、3630、3700、3710、3720、3730、3740、4200、4210、4300、4301、4310、4311、4320、4400、4401、4410、4411、4420、4421、4430、4431、4500、4501、4510、4511、4520、4521、4530、4531、4540、4541、4600、4601、4610、4611、4620、4621、4630、4631、4641、4650、4700、4701、4710、4711、4720、4730、5200、5210、5300、5301、5310、5311、5320、5400、5401、5402、5410、5411、5412、5420、5421、5430、5431、5432、5500、5501、5502、5510、5511、5512、5520、5521、5522、5530、5531、5541、5600、5601、5602、5610、5611、5612、5620、5621、5631、5650、5700、5701、5702、5710、5711、5712、5720、5721、5730、5731、6200、6210、6300、6301、6310、6311、6320、6400、6401、6402、6410、6411、6412、6420、6421、6432、6500、6501、6502、6503、6510、6511、6512、6513、6520、6521、6522、6530、6531、6532、6540、6541、6600、6601、6602、6603、6610、6611、6612、6613、6620、6621、6622、6623、6630、6631、6632、6640、6641、6642、6652、6700、6701、6711、6721、6703、6713、6710、6711、6712、6713、6720、6721、6730、6731、6740、7200、7210、7400、7401、7410、7411、7412、7420、7421、7430、7431、7432、7500、7501、7510、7511、7512、7600、7601、7602、7603、7604、7610、7611、7612、7613、7614、7620、7621、7622、7623、7632、7640、7700、7701、7702、7703、7710、7711、7712、7713、7714、7720、7721、7722、7730、7731、7732、7740、7741、7751、8200、9200、9210、10200、11200、12200及其组合。本文中,这些聚糖如图1-14中所示。
在包括任何前述实例的一些实例中,方法包括基于所述量化诊断患有疾病或疾患的患者。
在包括任何前述实例的一些实例中,方法包括基于所述量化将患者诊断为患有卵巢癌。
在包括任何前述实例的一些实例中,方法包括用治疗有效量的治疗剂治疗患者,所述治疗剂选自由以下组成的组:化学治疗剂、免疫疗法、激素疗法、靶向疗法、新辅助疗法、手术及其组合。
在包括任何前述实例的一些实例中,方法包括基于所述量化诊断患有疾病或疾患的个体。
在包括任何前述实例的一些实例中,方法包括将个体诊断为患有衰老疾患。
在包括任何前述实例的一些实例中,方法包括用治疗有效量的抗衰老剂治疗个体。在一些实例中,抗衰老剂选自激素疗法。在一些实例中,抗衰老剂是睾酮或睾酮补充剂或衍生物。在一些实例中,抗衰老剂是雌激素或雌激素补充剂或衍生物。
C.治疗方法
在一些实例中,本文阐述用于治疗患有疾病或疾患的患者的方法,所述方法包括通过质谱法测量来自患者的样品中的糖肽。在一些实例中,患者是人。在某些实例中,患者是女性。在某些其它示例中,患者是患有卵巢癌的女性。在某些实例中,患者是患有1期卵巢癌的女性。在某些实例中,患者是患有2期卵巢癌的女性。在某些实例中,患者是患有3期卵巢癌的女性。在某些实例中,患者是患有4期卵巢癌的女性。在一些实例中,女性的年龄等于10-20岁或在其之间。在一些实例中,女性的年龄等于20-30岁或在其之间。在一些实例中,女性的年龄等于30-40岁或在其之间。在一些实例中,女性的年龄等于40-50岁或在其之间。在一些实例中,女性的年龄等于50-60岁或在其之间。在一些实例中,女性的年龄等于60-70岁或在其之间。在一些实例中,女性的年龄等于70-80岁或在其之间。在一些实例中,女性的年龄等于80-90岁或在其之间。在一些实例中,女性的年龄等于90-100岁或在其之间。
在另一实施方案中,本文阐述一种用于治疗患有卵巢癌的患者的方法;所述方法包括:从患者获得生物样品;将样品中的一种或多种糖肽消化和/或片段化;以及检测和量化选自由转变1-76组成的组的一个或多个多反应监测(MRM)转变;将所述量化输入到训练模型中以生成输出概率;确定输出概率是高于还是低于分类阈值;以及基于输出概率是高于还是低于分类阈值对患者进行分类,其中所述分类选自由以下组成的组:(A)需要化学治疗剂的患者;(B)需要免疫治疗剂的患者;(C)需要激素疗法的患者;(D)需要靶向治疗剂的患者;(E)需要手术的患者;(F)需要新辅助疗法的患者;(G)手术前需要化学治疗剂、免疫治疗剂、激素疗法、靶向治疗剂、新辅助疗法或其组合的患者;(H)手术后需要化学治疗剂、免疫治疗剂、激素疗法、靶向治疗剂、新辅助疗法或其组合的患者;(I)或其组合;向患者施用治疗有效量的治疗剂:其中如果确定为分类A或I,则治疗剂选自化学疗法;其中如果确定为分类B或I,则治疗剂选自免疫疗法;或其中如果确定为分类C或I,则治疗剂选自激素疗法;或其中如果确定为分类D或I,则治疗剂选自靶向疗法,其中如果确定为分类F或I,则治疗剂选自新辅助疗法;其中如果确定为分类G或I,则治疗剂选自化学治疗剂、免疫治疗剂、激素疗法、靶向治疗剂、新辅助疗法或其组合;并且其中如果确定为分类H或I,则治疗剂选自化学治疗剂、免疫治疗剂、激素疗法、靶向治疗剂、新辅助疗法或其组合。
在一些实例中,机器学习用于鉴定与MRM转变相关的MS峰。在一些实例中,使用机器学习分析MRM转变。在一些实例中,机器学习用于基于与MRM转变相关的糖肽量的量化来训练模型。在一些实例中,使用经过训练的机器学习算法来分析MRM转变。在这些实例中的一些中,使用通过分析来自已知患有卵巢癌的患者的样品观察到的MRM转变来训练经过训练的机器学习算法。
在一些实例中,用选自靶向治疗的治疗剂治疗患者。在一些实例中,如果检测到组合D,则本文的方法包括施用治疗有效量的(聚(ADP)-核糖聚合酶)(PARP)抑制剂。在一些实例中,治疗剂选自奥拉帕尼(Lynparza)、鲁卡帕尼(Rubraca)和尼拉帕尼(Zejula)。
在一些实例中,患者是患有铂敏感复发性高级上皮性卵巢癌、输卵管癌或原发性腹膜癌的成年人。
在一些实例中,治疗剂以150mg、250mg、300mg、350mg和600mg的剂量施用。在一些实例中,每天两次施用治疗剂。
化学治疗剂包括但不限于铂基药物,例如卡铂(Paraplatin)或顺铂与紫杉烷,例如紫杉醇(Taxol)或多西紫杉醇(Taxotere)。卡铂可以10mg/mL可注射浓度施用(在50、150、450和600mg的小瓶中)。对于晚期卵巢癌,可持续4周施用360mg/m2 IV的单次剂量。卡铂可组合使用=每4周300mg/m2 IV(加环磷酰胺600mg/m2 IV)。Taxol可每3周在3小时内以175mg/m2 IV施用(随后施用顺铂)。Taxol可每3周在24小时内以135mg/m2 IV施用(随后施用顺铂)。Taxol可每3周在3小时内以135-175mg/m2 IV施用。
免疫治疗剂包括但不限于Zejula(尼拉帕利(Niraparib))。尼拉帕利可以每天300mg PO施用。
激素治疗剂包括但不限于促黄体激素释放激素(LHRH)激动剂、他莫昔芬和芳香酶抑制剂。
靶向治疗剂包括但不限于PARP抑制剂。
在包括任何前述实例的一些实例中,方法包括对生物样品进行多反应监测质谱法(MRM-MS)。
在包括任何前述实例的一些实例中,质谱法是使用多反应监测(MRM)模式进行的。在一些实例中,质谱法是在数据相关采集中使用QTOF MS进行的。在一些实例中,质谱法是使用或仅MS模式进行的。在一些实例中,免疫分析(例如ELISA)与质谱法组合使用。在一些实例中,免疫分析测量CA-125和HE4。
在包括任何前述实例的一些实例中,方法包括对由氨基酸序列组成的一种或多种糖肽进行量化,所述氨基酸序列选自由SEQ ID NO:1-76及其组合组成的组。
在包括任何前述实例的一些实例中,方法包括对基本上由氨基酸序列组成的一种或多种糖肽进行量化,所述氨基酸序列选自由SEQ ID NO:1、3、4、5、8、11、12、13、14、16、17、18、19、20、22、23、24、25、27、30、32、34、43、45、51、54、55、65、68、71、73、74、75及其组合组成的组。
在包括任何前述实例的一些实例中,方法包括对由氨基酸序列组成的一种或多种糖肽进行量化,所述氨基酸序列选自由SEQ ID NO:1、3、4、5、8、11、12、13、14、16、17、18、19、20、22、23、24、25、27、30、32、34、43、45、51、54、55、65、68、71、73、74、75及其组合组成的组。
在包括任何前述实例的一些实例中,方法包括对基本上由氨基酸序列组成的一种或多种糖肽进行量化,所述氨基酸序列选自由SEQ ID NO:2、6、7、9、10、15、21、26、28、29、31、33、35、36、37、38、39、40、41、42、44、46、47、48、49、50、52、53、56、57、58、59、60、61、62、63、64、66、67、69、70、72、76及其组合组成的组。
在包括任何前述实例的一些实例中,方法包括对由氨基酸序列组成的一种或多种糖肽进行量化,所述氨基酸序列选自由SEQ ID NO:2、6、7、9、10、15、21、26、28、29、31、33、35、36、37、38、39、40、41、42、44、46、47、48、49、50、52、53、56、57、58、59、60、61、62、63、64、66、67、69、70、72、76及其组合组成的组。
在包括任何前述实例的一些实例中,方法包括对基本上由氨基酸序列组成的一种或多种糖肽进行量化,所述氨基酸序列选自由SEQ ID NO:1、6、7、8、10、15、21、22、23、42、47、48、51、56、57、58、62、74、76及其组合组成的组。
在包括任何前述实例的一些实例中,方法包括对由氨基酸序列组成的一种或多种糖肽进行量化,所述氨基酸序列选自由SEQ ID NO:1、6、7、8、10、15、21、22、23、42、47、48、51、56、57、58、62、74、76及其组合组成的组。
在包括任何前述实例的一些实例中,方法包括对基本上由氨基酸序列组成的一种或多种糖肽进行量化,所述氨基酸序列选自由SEQ ID NO:1-76及其组合组成的组。
在包括任何前述实例的一些实例中,方法包括使用QQQ和/或qTOF质谱仪检测选自由转变1-76组成的组的多反应监测(MRM)转变。
在包括任何前述实例的一些实例中,方法包括训练机器学习算法以基于量化步骤鉴别分类。
在包括任何前述实例的一些实例中,方法包括使用机器学习算法以基于量化步骤鉴别分类。
在包括任何前述实例的一些实例中,机器学习算法选自由以下组成的组:深度学习算法、神经网络算法、人工神经网络算法、监督机器学习算法、线性判别分析算法、二次判别分析算法、支持向量机算法、线性基函数核支持向量算法、径向基函数核支持向量算法、随机森林算法、遗传算法、最近邻算法、k-最近邻、朴素贝叶斯分类器算法、逻辑回归算法或其组合。
D.诊断患者的方法
在一些实例中,本文阐述用于诊断患有疾病或疾患的患者的方法,所述方法包括通过质谱法测量来自患者的样品中的糖肽。
在另一实施方案中,本文阐述一种用于诊断患有卵巢癌的患者的方法;所述方法包括:从患者获得生物样品;使用利用QQQ和/或qTOF光谱仪的MRM-MS对生物样品进行质谱分析,以检测和量化基本上由氨基酸序列组成的一种或多种糖肽,所述氨基酸序列选自由SEQ ID NO:1-76的组成的组;或检测和量化选自转变1-76的一个或多个MRM转变;将检测到的糖肽或MRM转变的量化输入到训练模型中以生成输出概率,确定输出概率是高于还是低于分类阈值;和基于输出概率是高于还是低于分类阈值来鉴别患者的诊断分类;以及基于诊断分类将患者诊断为患有卵巢癌。
在另一实施方案中,本文阐述一种用于诊断患有卵巢癌的患者的方法;所述方法包括:从患者获得生物样品;使用利用QQQ和/或qTOF光谱仪的MRM-MS对生物样品进行质谱分析,以检测和量化基本上由氨基酸序列组成的一种或多种糖肽,所述氨基酸序列选自由SEQ ID NO:1-76的组成的组;或检测和量化选自转变1、6、7、8、10、15、21、22、23、42、47、48、51、56、57、58、62、74和76的一个或多个MRM转变;将检测到的糖肽或MRM转变的量化输入到训练模型中以生成输出概率,确定输出概率是高于还是低于分类阈值;和基于输出概率是高于还是低于分类阈值来鉴别患者的诊断分类;以及基于诊断分类将患者诊断为患有卵巢癌。
在另一实施方案中,本文阐述一种用于诊断患有卵巢癌的患者的方法;所述方法包括:将检测到的糖肽或MRM转变的量化输入到训练模型中以生成输出概率,确定输出概率是高于还是低于分类阈值;和基于输出概率是高于还是低于分类阈值来鉴别患者的诊断分类;以及基于诊断分类将患者诊断为患有卵巢癌。在一些实例中,方法包括从患者获得生物样品;使用利用QQQ和/或qTOF光谱仪的MRM-MS对生物样品进行质谱分析,以检测和量化一种或多种基本上由氨基酸序列组成的糖肽,所述氨基酸序列选自由SEQ ID NO:1-76组成的组;或检测和量化选自转变1-76的一个或多个MRM转变。
在一些实例中,本文阐述一种用于诊断患有卵巢癌的患者的方法;所述方法包括:从患者获得生物样品;使用利用QQQ和/或qTOF光谱仪的MRM-MS对生物样品进行质谱分析,以检测由或基本上由氨基酸序列组成的一种或多种糖肽,所述氨基酸序列选自由SEQ IDNO:1-76的组成的组;或检测选自转变1-76的一个或多个MRM转变;分析检测到的糖肽或MRM转变以鉴别诊断分类;以及基于诊断分类将患者诊断为患有卵巢癌。
在一些实例中,本文阐述一种用于诊断患有卵巢癌的患者的方法;所述方法包括:分析检测或量化的糖肽或MRM转变以鉴别诊断分类;以及基于诊断分类将患者诊断为患有卵巢癌。在一些实例中,方法包括从患者获得生物样品;和使用利用QQQ和/或qTOF光谱仪的MRM-MS对生物样品进行质谱分析,以检测一种或多种由或基本上由氨基酸序列组成的糖肽,所述氨基酸序列选自由SEQ ID NO:1-76组成的组;或检测选自转变1-76的一个或多个MRM转变。
在一些实例中,本文阐述一种用于诊断、监测或分类个体衰老的方法;所述方法包括:从患者获得生物样品;使用利用QQQ和/或qTOF光谱仪的MRM-MS对生物样品进行质谱分析,以检测由或基本上由氨基酸序列组成的一种或多种糖肽,所述氨基酸序列选自由SEQID NO:1-76的组成的组;或检测选自转变1-76的一个或多个MRM转变;分析检测到的糖肽或MRM转变以鉴别诊断分类;以及基于诊断分类将个体诊断、监测或分类为具有衰老分类。
E.疾病和疾患
本文阐述用于诊断多种疾病和疾患的生物标志物。
在一些实例中,疾病和疾患包括癌症。在一些实例中,疾病和疾患不限于癌症。
在一些实例中,疾病和疾患包括纤维化。在一些实例中,疾病和疾患不限于纤维化。
在一些实例中,疾病和疾患包括自身免疫疾病。在一些实例中,疾病和疾患不限于自身免疫疾病。
在一些实例中,疾病和疾患包括卵巢癌。在一些实例中,疾病和疾患不限于卵巢癌。
在一些实例中,疾患是衰老。在一些实例中,本文所述的“患者”等效地描述为“个体”。例如,在本文的一些方法中,阐述了用于监测或诊断个体衰老或衰老疾患的生物标志物。在这些实例中的一些中,个体不一定是患有需要治疗的医学疾患的患者。在一些实例中,个体为男性。在一些实例中,个体为女性。在一些实例中,个体为雄性哺乳动物。在一些实例中,个体为雌性哺乳动物。在一些实例中,个体为男人。在一些实例中,个体为女人。
在一些实例中,个体为1岁。在一些实例中,个体为2岁。在一些实例中,个体为3岁。在一些实例中,个体为4岁。在一些实例中,个体为5岁。在一些实例中,个体为6岁。在一些实例中,个体为7岁。在一些实例中,个体为8岁。在一些实例中,个体为9岁。在一些实例中,个体为10岁。在一些实例中,个体为11岁。在一些实例中,个体为12岁。在一些实例中,个体为13岁。在一些实例中,个体为14岁。在一些实例中,个体为15岁。在一些实例中,个体为16岁。在一些实例中,个体为17岁。在一些实例中,个体为18岁。在一些实例中,个体为19岁。在一些实例中,个体为20岁。在一些实例中,个体为21岁。在一些实例中,个体为22岁。在一些实例中,个体为23岁。在一些实例中,个体为24岁。在一些实例中,个体为25岁。在一些实例中,个体为26岁。在一些实例中,个体为27岁。在一些实例中,个体为28岁。在一些实例中,个体为29岁。在一些实例中,个体为30岁。在一些实例中,个体为31岁。在一些实例中,个体为32岁。在一些实例中,个体为33岁。在一些实例中,个体为34岁。在一些实例中,个体为35岁。在一些实例中,个体为36岁。在一些实例中,个体为37岁。在一些实例中,个体为38岁。在一些实例中,个体为39岁。在一些实例中,个体为40岁。在一些实例中,个体为41岁。在一些实例中,个体为42岁。在一些实例中,个体为43岁。在一些实例中,个体为44岁。在一些实例中,个体为45岁。在一些实例中,个体为46岁。在一些实例中,个体为47岁。在一些实例中,个体为48岁。在一些实例中,个体为49岁。在一些实例中,个体为50岁。在一些实例中,个体为51岁。在一些实例中,个体为52岁。在一些实例中,个体为53岁。在一些实例中,个体为54岁。在一些实例中,个体为55岁。在一些实例中,个体为56岁。在一些实例中,个体为57岁。在一些实例中,个体为58岁。在一些实例中,个体为59岁。在一些实例中,个体为60岁。在一些实例中,个体为61岁。在一些实例中,个体为62岁。在一些实例中,个体为63岁。在一些实例中,个体为64岁。在一些实例中,个体为65岁。在一些实例中,个体为66岁。在一些实例中,个体为67岁。在一些实例中,个体为68岁。在一些实例中,个体为69岁。在一些实例中,个体为70岁。在一些实例中,个体为71岁。在一些实例中,个体为72岁。在一些实例中,个体为73岁。在一些实例中,个体为74岁。在一些实例中,个体为75岁。在一些实例中,个体为76岁。在一些实例中,个体为77岁。在一些实例中,个体为78岁。在一些实例中,个体为79岁。在一些实例中,个体为80岁。在一些实例中,个体为81岁。在一些实例中,个体为82岁。在一些实例中,个体为83岁。在一些实例中,个体为84岁。在一些实例中,个体为85岁。在一些实例中,个体为86岁。在一些实例中,个体为87岁。在一些实例中,个体为88岁。在一些实例中,个体为89岁。在一些实例中,个体为90岁。在一些实例中,个体为91岁。在一些实例中,个体为92岁。在一些实例中,个体为93岁。在一些实例中,个体为94岁。在一些实例中,个体为95岁。在一些实例中,个体为96岁。在一些实例中,个体为97岁。在一些实例中,个体为98岁。在一些实例中,个体为99岁。在一些实例中,个体为100岁。在一些实例中,个体为超过100岁。
V.机器学习
在包括任何前述实例的一些实例中,本文中的方法包括使用质谱法和/或液相色谱法对基本上由氨基酸序列组成的一种或多种糖肽进行量化,所述氨基酸序列选自由SEQID NO:1-76组成的组。在一些实例中,量化结果被用作训练模型中的输入。在一些实例中,量化结果基于测试样品中量化的每种聚糖或糖肽的绝对量、相对量和/或类型用诊断算法分类或归类,其中诊断算法针对从患有已知疾病或疾患的个体群体中获得的每个标记物的对应值进行训练。在一些实例中,疾病或疾患是卵巢癌。
在包括任何前述实例的一些实例中,本文阐述一种用于训练机器学习算法的方法,所述方法包括:提供指示样品的MRM转变信号的第一数据集,所述样品包含基本上由氨基酸序列组成的糖肽,所述氨基酸序列选自由SEQ ID NO:1-76组成的组;提供指示对照样品的MRM转变信号的第二数据集;以及使用机器学习算法将第一数据集与第二数据集进行比较。
在包括任何前述实例的一些实例中,本文中的方法包括使用包含由氨基酸序列组成的糖肽的样品,所述氨基酸序列选自由SEQ ID NO:1-76组成的组,所述样品是来自患有卵巢癌的患者的样品。
在包括任何前述实例的一些实例中,本文中的方法包括使用包含基本上由氨基酸序列组成的糖肽的样品,所述氨基酸序列选自由SEQ ID NO:1-76组成的组,所述样品是来自患有卵巢癌的患者的样品。
在包括任何前述实例的一些实例中,本文的方法包括使用对照样品,其中对照样品是来自未患卵巢癌的患者的样品。
在包括任何前述实例的一些实例中,本文中的方法包括使用包含基本上由氨基酸序列组成的糖肽的样品,所述氨基酸序列选自由SEQ ID NO:1-76组成的组,所述样品是来自一个或多个患有卵巢癌的患者的汇集样品。
在包括任何前述实例的一些实例中,本文中的方法包括使用对照样品,所述对照样品是来自一个或多个未患卵巢癌的患者的汇集样品。
在包括任何前述实例的一些实例中,方法包括生成使用来自患有疾病或疾患的患者和未患疾病或疾患的患者的质谱法数据(例如MRM-MS转变信号)训练的机器学习模型。在一些实例中,疾病或疾患是卵巢癌。在一些实例中,方法包括通过与已知标准或其它样品的交叉验证来优化机器学习模型。在一些实例中,方法包括使用质谱法数据对性能进行鉴定,以形成具有个别敏感性和特异性的聚糖和糖肽组。在某些示例中,方法包括确定与诊断相关的置信度百分比。在一些实例中,基本上由选自由SEQ ID NO:1-76组成的组的氨基酸序列组成的一至十种糖肽可适用于以一定的置信百分比诊断患有卵巢癌的患者。在一些实例中,基本上由选自由SEQ ID NO:1-76组成的组的氨基酸序列组成的十至五十种糖肽可适用于以更高的置信百分比诊断患有卵巢癌的患者。
在包括任何前述实例的一些实例中,方法包括对生物样品进行MRM-MS和/或LC-MS。在一些实例中,方法包括通过计算装置构建表示多个质谱的理论质谱数据,其中所述多个质谱中的每一个对应于基本上由选自由SEQ ID NO:1-76组成的组的氨基酸序列组成的一种或多种糖肽。在一些实例中,方法包括通过计算装置将质谱数据与理论质谱数据进行比较以生成指示多个质谱中的每一个与多个理论目标质谱中的每一个的相似性的比较数据,所述理论目标质谱与多种糖肽中的对应糖肽相关。
在一些实例中,机器学习算法用于由计算设备并基于MRM-MS数据确定多个特征离子在多个质谱中的分布;以及通过计算装置并基于分布确定多个特征离子中的一个或多个是否是糖肽离子。
在一些实例中,本文的方法包括训练诊断算法。在本文中,训练诊断算法可指基于一种或多种糖肽的值的诊断算法的监督学习,所述一种或多种糖肽由或基本上由选自由SEQ ID NO:1-76组成的组的氨基酸序列组成。训练诊断算法可指基于一种或多种糖肽的值在统计模型中的变量选择,所述一种或多种糖肽基本上由选自由SEQ ID NO:1-76组成的组的氨基酸序列组成。训练诊断算法可例如包括为每个类别确定特征空间中的加权向量,或确定函数或函数参数。
在包括任何前述实例的一些实例中,机器学习算法选自由以下组成的组:深度学习算法、神经网络算法、人工神经网络算法、监督机器学习算法、线性判别分析算法、二次判别分析算法、支持向量机算法、线性基函数核支持向量算法、径向基函数核支持向量算法、随机森林算法、遗传算法、最近邻算法、k-最近邻、朴素贝叶斯分类器算法、逻辑回归算法或其组合。在某些实例中,机器学习算法是套索回归。
在某些实例中,机器学习算法是LASSO、岭回归、随机森林、K近邻(KNN)、深度神经网络(DNN)和主成分分析(PCA)。在某些实例中,DNN用于将质谱数据处理成分析就绪的形式。在一些实例中,DNN用于从质谱中挑选峰。在一些实例中,PCA适用于特征检测。
在一些实例中,LASSO用于提供特征选择。
在一些实例中,机器学习算法用于量化来自每种蛋白质的代表蛋白质丰度的肽。在一些实例中,这种量化包括对未测量糖基化的蛋白质进行量化。
在一些实例中,糖肽序列通过质谱仪中的片段化和使用Byonic软件的数据库搜索来鉴定。
在一些实例中,本文的方法包括无监督学习以检测代表已知生物量的MRMS-MS数据的特征,例如蛋白质功能或聚糖基序。在某些实例中,这些特征被用作机器分类的输入。在一些实例中,使用LASSO、岭回归或随机森林性质进行分类。
在一些实例中,本文的方法包括在算法中处理一个值之前将输入数据(例如MRM转变峰)映射到所述值(例如基于0-100的标度)。例如,在鉴定MRM转变并对峰表征后,本文的方法包括评估给定患者在峰周围的m/z和保留时间窗口中的MS扫描。在一些实例中,所得色谱图由机器学习算法集成,所述算法确定峰起点和终点,并计算由这些点和强度(高度)限定的面积。所得积分值是丰度,然后将其输入机器学习和统计分析训练和数据集。
在一些实例中,一种情况下的机器学习输出在另一情况下被用作机器学习输入。例如,除了用于分类过程的PCA之外,DNN数据处理还输入PCA和其它分析。这导致了至少三个层次的算法处理。在本公开的范围内预期了其它分层结构。
在包括任何前述实例的一些实例中,方法包括将样品中量化的每种聚糖或糖肽的量与诊断算法中每种聚糖或糖肽的对应参考值进行比较。在一些实施例中,方法包括比较过程,通过所述比较过程,使用诊断算法将样品中量化的聚糖或糖肽的量与相同聚糖或糖肽的参考值进行比较。比较过程可以是诊断算法分类的一部分。比较过程可以发生在抽象层次,例如在n维特征空间或更高维空间中。
在一些实例中,本文的方法包括基于用诊断算法在样品中量化的每种聚糖或糖肽的量对患者样品进行分类。在一些实例中,方法包括使用统计或机器学习分类过程,通过所述分类过程,测试样品中量化的聚糖或糖肽的量用于使用诊断算法确定健康类别。在一些实例中,诊断算法是统计或机器学习分类算法。
在包括任何前述实例的一些实例中,诊断算法的分类可包括对属于每个可能类别的一组聚糖或糖肽值的可能性进行评分,并确定评分最高的类别。通过诊断算法进行的分类可包括通过距离函数将一组标志物值与先前的观察值进行比较。适用于分类的诊断算法的实例包括随机森林、支持向量机、逻辑回归(例如多类或多项逻辑回归和/或适于稀疏逻辑回归的算法)。如本领域技术人员已知的,可以使用适用于分类的多种其它诊断算法。
在一些实例中,本文的方法包括基于从患有疾病或疾患(例如卵巢癌)的个体群体获得的每种聚糖或糖肽的值对诊断算法的监督学习。在一些实例中,方法包括基于从患有卵巢癌的个体群体获得的每种聚糖或糖肽的值在统计模型中进行变量选择。训练诊断算法可例如包括为每个类别确定特征空间中的加权向量,或确定函数或函数参数。
在一个实施方案中,参考值是源自一个个体的一个或多个样品中聚糖或糖肽的量。或者,参考值可以通过汇集从多个个体获得的数据,并计算聚糖或糖肽的平均(例如平均值或中值)量而得出。因此,参考值可以反映多个个体中的聚糖或糖肽的平均量。所述量可以与本文所述相同的方式绝对或相对地表示。
在一些实例中,参考值可以源自与正在测试的样品相同的样品,从而允许在两者之间进行适当比较。例如,如果样品源自尿液,则参考值也源自尿液。在一些实施例中,如果样品是血液样品(例如血浆或血清样品),则参考值也将是血液样品(例如血浆样品或血清样品,视情况而定)。在样品与参考值之间进行比较时,表示量的方式在与样品与参考值之间匹配。因此,可以将绝对量与绝对量进行比较,并且可以将相对量与相对量进行比较。类似地,用诊断算法表示用于分类的量的方式与表示用于训练诊断算法的量的方式匹配。
当确定聚糖或糖肽的量时,方法可包括将每种聚糖或糖肽的量与其对应参考值进行比较。当确定一种、一些或全部聚糖或糖肽的累积量时,方法可包括将累积量与对应参考值进行比较。当聚糖或糖肽的量在公式中相互组合以形成指标值时,可以将所述指标值与以相同方式得出的对应参考指标值进行比较。
参考值可以在本文所述的方法之内(即构成一个步骤)或之外(即不构成一个步骤)获得。在一些实例中,方法包括为标志物的数量建立参考值的步骤。在其它实例中,参考值在本文所述的方法之外获得并且在本发明的比较步骤期间被访问。
在包括任何前述实例的一些实例中,诊断算法的训练可以在本文阐述的方法之内(即构成步骤)或之外(即不构成步骤)获得。在一些实例中,方法包括训练诊断算法的步骤。在一些实例中,诊断算法在本文方法之外被训练并且在本发明的分类步骤期间被访问。参考值可以通过量化从健康个体群体获得的样品中聚糖或糖肽的量来确定。诊断算法可以通过量化从健康个体群体获得的样品中聚糖或糖肽的量来训练。如本文所用,术语“健康个体”是指处于健康状态的个体或个体群体,例如未表现出任何疾病症状、未被诊断患有疾病和/或不太可能患上疾病的患者。优选地,所述健康个体没有服用影响疾病的药物并且没有被诊断出患有任何其它疾病。与测试个体相比,一个或多个健康个体可以具有相似的性别、年龄和身体质量指数(BMI)。参考值可以通过量化从罹患疾病的个体群体获得的样品中聚糖或糖肽的量来确定。诊断算法可以通过量化从罹患所述疾病的个体群体获得的样品中标记物的量来训练。更优选地,这此类个体与测试个体相比可以具有相似的性别、年龄和身体质量重指数(BMI)。参考值可以从罹患卵巢癌的个体群体中获得。诊断算法可以通过量化从罹患卵巢癌的个体群体获得的样品中聚糖或糖肽的量来训练。一旦确定了卵巢癌的特征聚糖或糖肽谱,就可以将来自从个体获得的生物样品的标志物谱与此参考谱进行比较以确定测试对象是否也患有卵巢癌。一旦诊断算法被训练以对卵巢癌进行分类,则来自从个体获得的生物样品的标志物谱可以通过诊断算法进行分类,以确定测试对象是否也处于卵巢癌的所述特定阶段。
VI.试剂盒
在包括任何前述实例的一些实例中,本文阐述一种试剂盒,其包含糖肽标准品、缓冲液和一种或多种由氨基酸序列组成的糖肽,所述氨基酸序列选自由SEQ ID NO:1-76组成的组。
在包括任何前述实例的一些实例中,本文阐述一种试剂盒,其包含糖肽标准品、缓冲液和一种或多种基本上由氨基酸序列组成的糖肽,所述氨基酸序列选自由SEQ ID NO:1-76组成的组。
在包括任何前述实例的一些实例中,本文阐述一种试剂盒,其包含糖肽标准品、缓冲液和一种或多种由氨基酸序列组成的糖肽,所述氨基酸序列选自由SEQ ID NO:1、6、7、8、10、15、21、22、23、42、47、48、51、56、57、58、62、74和76及其组合组成的组。
在包括任何前述实例的一些实例中,本文阐述一种试剂盒,其包含糖肽标准品、缓冲液和一种或多种基本上由氨基酸序列组成的糖肽,所述氨基酸序列选自由SEQ ID NO:1、6、7、8、10、15、21、22、23、42、47、48、51、56、57、58、62、74和76及其组合组成的组。
在包括任何前述实例的一些实例中,本文阐述一种试剂盒,其包含糖肽标准品、缓冲液和一种或多种由氨基酸序列组成的糖肽,所述氨基酸序列选自由SEQ ID NO:1、3、4、5、8、11、12、13、14、16、17、18、19、20、22、23、24、25、27、30、32、34、43、45、51、54、55、65、68、71、73、74、75及其组合组成的组。
在包括任何前述实例的一些实例中,本文阐述一种试剂盒,其包含糖肽标准品、缓冲液和一种或多种基本上由氨基酸序列组成的糖肽,所述氨基酸序列选自由SEQ ID NO:1、3、4、5、8、11、12、13、14、16、17、18、19、20、22、23、24、25、27、30、32、34、43、45、51、54、55、65、68、71、73、74、75及其组合组成的组。
在包括任何前述实例的一些实例中,本文阐述一种试剂盒,其包含糖肽标准品、缓冲液和一种或多种由氨基酸序列组成的糖肽,所述氨基酸序列选自由SEQ ID NO:2、6、7、9、10、15、21、26、28、29、31、33、35、36、37、38、39、40、41、42、44、46、47、48、49、50、52、53、56、57、58、59、60、61、62、63、64、66、67、69、70、72、76及其组合组成的组。
在包括任何前述实例的一些实例中,本文阐述一种试剂盒,其包含糖肽标准品、缓冲液和一种或多种基本上由氨基酸序列组成的糖肽,所述氨基酸序列选自由SEQ ID NO:2、6、7、9、10、15、21、26、28、29、31、33、35、36、37、38、39、40、41、42、44、46、47、48、49、50、52、53、56、57、58、59、60、61、62、63、64、66、67、69、70、72、76及其组合组成的组。
在包括任何前述实例的一些实例中,本文阐述一种用于诊断或监测个体中的癌症的试剂盒,其中确定来自所述个体的样品的聚糖或糖肽谱并将测量的谱与正常患者的谱或有癌症家族史的患者的谱进行比较。在一些实例中,试剂盒包含一种或多种由氨基酸序列组成的糖肽,所述氨基酸序列选自由SEQ ID NO:1-76组成的组。在一些实例中,试剂盒包含一种或多种基本上由氨基酸序列组成的糖肽,所述氨基酸序列选自由SEQ ID NO:1-76组成的组。在一些实例中,试剂盒包含一种或多种由氨基酸序列组成的糖肽,所述氨基酸序列选自由SEQ ID NO:1、6、7、8、10、15、21、22、23、42、47、48、51、56、57、58、62、74和76及其组合组成的组。在一些实例中,试剂盒包含一种或多种基本上由氨基酸序列组成的糖肽,所述氨基酸序列选自由SEQ ID NO:1、6、7、8、10、15、21、22、23、42、47、48、51、56、57、58、62、74和76及其组合组成的组。在一些实例中,试剂盒包含一种或多种由氨基酸序列组成的糖肽,所述氨基酸序列选自由SEQ ID NO:1、3、4、5、8、11、12、13、14、16、17、18、19、20、22、23、24、25、27、30、32、34、43、45、51、54、55、65、68、71、73、74、75组成的组。在一些实例中,试剂盒包含一种或多种基本上由氨基酸序列组成的糖肽,所述氨基酸序列选自由SEQ ID NO:1、3、4、5、8、11、12、13、14、16、17、18、19、20、22、23、24、25、27、30、32、34、43、45、51、54、55、65、68、71、73、74、75组成的组。在一些实例中,试剂盒包含一种或多种由氨基酸序列组成的糖肽,所述氨基酸序列选自由SEQ ID NO:2、6、7、9、10、15、21、26、28、29、31、33、35、36、37、38、39、40、41、42、44、46、47、48、49、50、52、53、56、57、58、59、60、61、62、63、64、66、67、69、70、72、76及其组合组成的组。在一些实例中,试剂盒包含一种或多种基本上由氨基酸序列组成的糖肽,所述氨基酸序列选自由SEQ ID NO:2、6、7、9、10、15、21、26、28、29、31、33、35、36、37、38、39、40、41、42、44、46、47、48、49、50、52、53、56、57、58、59、60、61、62、63、64、66、67、69、70、72、76及其组合组成的组。
在包括任何前述实例的一些实例中,本文阐述一种试剂盒,其包含用于量化衍生自糖肽的氧化、硝化和/或糖化游离加合物。
VII.临床分析
在包括任何前述实例的一些实例中,生物标志物、方法和/或试剂盒可在临床环境中用于诊断患者。在这些实例中的一些中,样品分析包括使用内标。这些标准品可包括一种或多种由氨基酸序列组成的糖肽,所述氨基酸序列选自由SEQ ID NO:1-76组成的组。这些标准品可包括一种或多种基本上由氨基酸序列组成的糖肽,所述氨基酸序列选自由SEQ IDNO:1-76组成的组。在某些实例中,这些标准品可包括一种或多种由氨基酸序列组成的糖肽,所述氨基酸序列选自由SEQ ID NO:1、6、7、8、10、15、21、22、23、42、47、48、51、56、57、58、62、74和76及其组合组成的组。在某些实例中,这些标准品可包括一种或多种基本上由氨基酸序列组成的糖肽,所述氨基酸序列选自由SEQ ID NO:1、6、7、8、10、15、21、22、23、42、47、48、51、56、57、58、62、74和76及其组合组成的组。在某些实例中,这些标准品可包括一种或多种由氨基酸序列组成的糖肽,所述氨基酸序列选自由SEQ ID NO:1、3、4、5、8、11、12、13、14、16、17、18、19、20、22、23、24、25、27、30、32、34、43、45、51、54、55、65、68、71、73、74、75及其组合组成的组。在某些实例中,这些标准品可包括一种或多种基本上由氨基酸序列组成的糖肽,所述氨基酸序列选自由SEQ ID NO:1、3、4、5、8、11、12、13、14、16、17、18、19、20、22、23、24、25、27、30、32、34、43、45、51、54、55、65、68、71、73、74、75及其组合组成的组。在某些实例中,这些标准品可包括一种或多种由氨基酸序列组成的糖肽,所述氨基酸序列选自由SEQ ID NO:2、6、7、9、10、15、21、26、28、29、31、33、35、36、37、38、39、40、41、42、44、46、47、48、49、50、52、53、56、57、58、59、60、61、62、63、64、66、67、69、70、72、76及其组合组成的组。在某些实例中,这些标准品可包括一种或多种基本上由氨基酸序列组成的糖肽,所述氨基酸序列选自由SEQ ID NO:2、6、7、9、10、15、21、26、28、29、31、33、35、36、37、38、39、40、41、42、44、46、47、48、49、50、52、53、56、57、58、59、60、61、62、63、64、66、67、69、70、72、76及其组合组成的组。
在临床环境中,样品可以被制备(例如通过消化)以包括一种或多种由氨基酸序列组成的糖肽,所述氨基酸序列选自由SEQ ID NO:1-76组成的组。在某些实例中,这些样品可包括一种或多种由氨基酸序列组成的糖肽,所述氨基酸序列选自由SEQ ID NO:1、6、7、8、10、15、21、22、23、42、47、48、51、56、57、58、62、74和76及其组合组成的组。在某些实例中,这些样品可包括一种或多种基本上由氨基酸序列组成的糖肽,所述氨基酸序列选自由SEQ IDNO:1、3、4、5、8、11、12、13、14、16、17、18、19、20、22、23、24、25、27、30、32、34、43、45、51、54、55、65、68、71、73、74、75及其组合组成的组。在某些实例中,这些样品可包括一种或多种基本上由氨基酸序列组成的糖肽,所述氨基酸序列选自由SEQ ID NO:2、6、7、9、10、15、21、26、28、29、31、33、35、36、37、38、39、40、41、42、44、46、47、48、49、50、52、53、56、57、58、59、60、61、62、63、64、66、67、69、70、72、76及其组合组成的组。
在临床环境中,样品可以被制备(例如通过消化)以包括一种或多种基本上由氨基酸序列组成的糖肽,所述氨基酸序列选自由SEQ ID NO:1-76组成的组。在某些实例中,样品可以被制备(例如通过消化)以包括一种或多种基本上由氨基酸序列组成的糖肽,所述氨基酸序列选自由SEQ ID NO:1、6、7、8、10、15、21、22、23、42、47、48、51、56、57、58、62、74和76及其组合组成的组。在某些实例中,样品可以被制备(例如通过消化)以包括一种或多种基本上由氨基酸序列组成的糖肽,所述氨基酸序列选自由SEQ ID NO:1、3、4、5、8、11、12、13、14、16、17、18、19、20、22、23、24、25、27、30、32、34、43、45、51、54、55、65、68、71、73、74、75及其组合组成的组。在某些实例中,样品可以被制备(例如通过消化)以包括一种或多种基本上由氨基酸序列组成的糖肽,所述氨基酸序列选自由SEQ ID NO:2、6、7、9、10、15、21、26、28、29、31、33、35、36、37、38、39、40、41、42、44、46、47、48、49、50、52、53、56、57、58、59、60、61、62、63、64、66、67、69、70、72、76及其组合组成的组。
在一些实例中,聚糖或糖肽的量可以通过将由氨基酸序列组成的一种或多种糖肽的量与另一种生物标志物的浓度进行比较来评估,所述氨基酸序列选自由SEQ ID NO:1-76组成的组。
在一些实例中,聚糖或糖肽的量可以通过将基本上由氨基酸序列组成的一种或多种糖肽的量与另一种生物标志物的浓度进行比较来评估,所述氨基酸序列选自由SEQ IDNO:1-76组成的组。
在一些实例中,聚糖或糖肽的量可以通过比较由选自由SEQ ID NO:1-76组成的组的氨基酸序列组成的一种或多种糖肽的量与由选自由SEQ ID NO:1-76组成的组的氨基酸序列组成的一种或多种糖肽的量来评估。
在一些实例中,聚糖或糖肽的量可以通过比较基本上由选自由SEQ ID NO:1-76组成的组的氨基酸序列组成的一种或多种糖肽的量与基本上由选自由SEQ ID NO:1-76组成的组的氨基酸序列组成的一种或多种糖肽的量来评估。
在包括任何前述实例的一些实例中,试剂盒可包括用于计算糖肽MRM转变信号的标准化的软件。
在包括任何前述实例的一些实例中,试剂盒可包括用于量化由或基本上由氨基酸序列组成的糖肽的量的软件,所述氨基酸序列选自由SEQ ID NO:1-76组成的组。
在包括任何前述实例的一些实例中,试剂盒可包括用于量化由或基本上由氨基酸序列组成的糖肽的相对量的软件,所述氨基酸序列选自由SEQ ID NO:1-76组成的组。
在包括任何前述实例的一些实例中,训练模型存储在服务器上,由执行本文所述方法的临床医生访问所述服务器。在一些实例中,临床医生将来自患者样品的MRM转变信号的量化输入到存储在服务器上的训练模型中。在一些实例中,通过互联网、无线通信或其它数字或电信方法访问服务器。
在包括任何前述实例的一些实例中,训练模型存储在服务器上,由执行本文所述方法的临床医生访问所述服务器。在一些实例中,临床医生将来自患者样品的由或基本上由氨基酸序列组成的一种或多种糖肽的量化输入到存储在服务器上的训练模型中,所述氨基酸序列选自由SEQ ID NO:1-76组成的组。在一些实例中,通过互联网、无线通信或其它数字或电信方法访问服务器。
在包括任何前述实例的一些实例中,MRM转变信号1-76存储在服务器上,由执行本文所述方法的临床医生访问所述服务器。在一些实例中,临床医生将来自患者样品的MRM转变信号与存储在服务器上的MRM转变信号1-76进行比较。在一些实例中,通过互联网、无线通信或其它数字或电信方法访问服务器。
在包括任何前述实例的一些实例中,已使用本文所述的MRM转变信号1-76训练的机器学习算法存储在服务器上,由执行本文所述的方法的临床医生访问所述服务器。在一些实例中,在服务器上远程访问的机器学习算法分析来自患者样品的MRM转变信号。在一些实例中,通过互联网、无线通信或其它数字或电信方法访问服务器。
VIII.实施例
化学品和试剂。从人血清/血浆中纯化的糖蛋白标准品购自Sigma-Aldrich(St.Louis,MO)。测序级胰蛋白酶购自Promega(Madison,WI)。二硫苏糖醇(DTT)和碘乙酰胺(IAA)购自Sigma-Aldrich(St.Louis,MO)。人血清购自Sigma-Aldrich(St.Louis,MO)。
样品制备。将血清样品和糖蛋白标准品还原、烷基化,然后在37℃的水浴中用胰蛋白酶消化18小时。
LC-MS/MS分析。对于量化分析,将胰蛋白酶消化的血清样品注入与三重四极杆(QqQ)质谱仪耦接的高效液相色谱法(HPLC)系统中。在反相柱上进行分离。二元梯度中使用的溶剂A和B由水、乙腈和甲酸的混合物构成。在使用供应商提供的标准进行源调整后,使用了典型的正离子源参数。评估了以下范围:源喷射电压3-5kV,温度250-350℃,以及氮鞘气流速20-40psi。所用仪器的扫描模式是dMRM。
对于糖蛋白组学分析,使用Q ExactiveTM Hybrid Quadrupole-OrbitrapTM质谱仪或Agilent 6495B三重四极杆LC/MS分析富集的血清糖肽。
MRM质谱法设置、样品制备和试剂阐述于Li等人,Site-Specific GlycosylationQuantification of 50 serum Glycoproteins Enhanced by PredictiveGlycopeptidomics for Improved Disease Biomarker Discovery,Anal.Chem.2019,91,5433-5445;DOI:10.1021/acs.analchem.9b00776中,其全部内容出于所有目的以引用方式整体并入本文中。
实施例1–鉴定糖肽生物标志物
此实施例参考图15和17-18。
如图15所示,在步骤1中,提供了来自患有卵巢癌的患者的样品和来自未患卵巢癌的患者的样品。在步骤2中,使用蛋白酶消化样品以形成糖肽片段。在步骤3中,将糖肽片段引入串联LC-MS/MS仪器以分析与上述样品相关的保留时间和MRM-MS转变信号。在步骤4中,鉴定了糖肽和聚糖生物标志物。机器学习算法从一系列MS光谱中选择MRM-MS转变信号,并将这些信号与某些糖肽片段的计算质量相关联。有关机器学习算法鉴定的生物标志物信号的保留时间分析,参见图17-18。
在步骤5中,使用包括套索回归在内的机器学习算法将患有卵巢癌的患者的样品中鉴定的糖肽与未患卵巢癌的患者的样品中鉴定的糖肽进行比较。此比较包括糖肽的类型、绝对量和相对量的比较。从此比较中,计算了肽的标准化和糖肽的相对丰度。有关此比较的输出结果,参见图18。
实施例2–鉴定糖肽生物标志物
此实施例参考图16。
如图16所示,在步骤1中,提供了来自患者的样品。在步骤2中,使用蛋白酶消化样品以形成糖肽片段。在步骤3中,将糖肽片段引入串联LC-MS/MS仪器以分析与样品相关的保留时间和MRM-MS转变信号。在步骤4中,使用机器学习算法鉴定糖肽,所述算法选择MRM-MS转变信号并将这些信号与某些糖肽片段的计算质量相关联。在步骤5中,数据被标准化。在步骤6中,机器学习用于分析标准化数据以鉴定指示患有卵巢癌的患者的生物标志物。
IX.表
表1.糖肽组中的糖肽的转变编号。
Figure BDA0003824381570000641
Figure BDA0003824381570000651
Figure BDA0003824381570000661
Figure BDA0003824381570000671
Figure BDA0003824381570000681
表2.先驱离子和子离子(m/z)的转变编号
Figure BDA0003824381570000682
Figure BDA0003824381570000691
Figure BDA0003824381570000701
MS1和MS2分辨率为1个单位。
表3.转变编号与保留时间、Δ保留时间、碎裂电压和碰撞能量
Figure BDA0003824381570000711
Figure BDA0003824381570000721
Figure BDA0003824381570000731
电池加速器电压为5。
表4.聚糖残基化合物编号、分子量和聚糖片段质荷(m/z)(+2)&(m/z)(+3)比率
Figure BDA0003824381570000732
Figure BDA0003824381570000741
Figure BDA0003824381570000751
Figure BDA0003824381570000761
Figure BDA0003824381570000771
Figure BDA0003824381570000781
Figure BDA0003824381570000791
表5.聚糖残基化合物编号、分子量和分类
Figure BDA0003824381570000792
Figure BDA0003824381570000801
Figure BDA0003824381570000811
Figure BDA0003824381570000821
Figure BDA0003824381570000831
Figure BDA0003824381570000841
Figure BDA0003824381570000851
实施例3–CA 125 ELISA
此实施例参考图20。
对患者样品进行了蛋白质CA 125(癌抗原125)酶联免疫吸附分析(ELISA)。患者库由前n=41名从InterVenn的前瞻性试验中招募以检测卵巢癌恶性肿瘤(VOCAL)的女性组成。有n=12名患有交界或恶性癌症的女性,以及n=29名患有良性盆腔肿块的女性,代表了临床环境中将针对的确切患者人群。模型对先前从商业生物库购买的回顾性样品进行了训练,并在不知情的情况下应用于VOCAL试验参与者。
ELISA分析的结果示于图20中。
在截止值=35时,观察到ELISA分析以如下准确度、灵敏度和特异性水平诊断恶性卵巢癌:
准确度=56%灵敏度=86%特异性=48%
在20%患病率情况下样品的阳性预测值=29%
在20%患病率情况下样品的阴性预测值=93%
美国每年约有22,000例卵巢癌新病例,所述病例源于约110,000例盆腔肿块(在20%患病率情况下)。正如观察到的那样,CA-125测试将正确鉴定18,920例恶性癌症和42,240例良性癌症。将有45,760例假阳性和3080例假阴性。
实施例4–糖蛋白组训练模型测试
此实施例参考图21。
使用SEQ ID NO:1-76训练的模型用于鉴定给定患者样品患有卵巢癌的概率。
患者库由前n=41名从InterVenn的前瞻性试验中招募以检测卵巢癌恶性肿瘤(VOCAL)的女性组成。有n=12名患有交界或恶性癌症的女性,以及n=29名患有良性盆腔肿块的女性,代表了临床环境中将针对的确切患者人群。模型对先前从商业生物库购买的回顾性样品进行了训练,并在不知情的情况下应用于VOCAL试验参与者。
结果在图21中示出。
在截止值=0.54时,观察到所述模型以如下准确性、灵敏度和特异性水平诊断恶性卵巢癌:
准确性=92%灵敏度=86%特异性=93%
在20%患病率情况下样品的阳性预测值=75.0%
在20%患病率情况下样品的阴性预测值=96%。
美国每年约有22,000例卵巢癌新病例,所述病例源于约110,000例盆腔肿块(在20%患病率情况下)。
本实施例4中阐述的糖蛋白组学测试将正确鉴定18,920例恶性癌症和81,840例良性癌症。将有6,160例假阳性和3,080例假阴性。
与CA-125相比,且仅在美国,这相当于每年减少39,600例不正确的癌症诊断。这些额外的正确诊断的患者都将被分流到他们在CA-125测试的情况下不会到达的适当手术和外科医生那里。这大大减轻了患者以及对预测的恶性肿瘤进行手术所需的妇科肿瘤科医生的压力。
上述实施实施方案和实例旨在仅是说明性的而非限制性的。本领域技术人员将会认识到或将能够确定仅使用至多常规实验,就能实现具体化合物、材料和程序的许多等效物。所有此类等效物都被认为是在范围内并且由所附权利要求书涵盖。
XI.序列表
Figure BDA0003824381570000881
Figure BDA0003824381570000891
Figure BDA0003824381570000901
Figure BDA0003824381570000911
Figure BDA0003824381570000921
Figure BDA0003824381570000931
Figure BDA0003824381570000941
Figure BDA0003824381570000951
Figure BDA0003824381570000961
Figure BDA0003824381570000971
Figure BDA0003824381570000981
Figure BDA0003824381570000991
Figure BDA0003824381570001001
Figure BDA0003824381570001011
Figure BDA0003824381570001021
Figure BDA0003824381570001031
Figure BDA0003824381570001041
Figure BDA0003824381570001051
Figure BDA0003824381570001061
Figure BDA0003824381570001071
Figure BDA0003824381570001081
Figure BDA0003824381570001091
Figure BDA0003824381570001101
Figure BDA0003824381570001111
Figure BDA0003824381570001121
Figure BDA0003824381570001131
Figure BDA0003824381570001141
Figure BDA0003824381570001151
Figure BDA0003824381570001161
Figure BDA0003824381570001171

Claims (47)

1.一种检测一个或多个多反应监测(MRM)转变的方法,所述方法包括:
从患者获得或已经获得生物样品,其中所述生物样品包含一种或多种聚糖或糖肽;
消化和/或片段化所述样品中的糖肽;以及
检测选自由转变1-76组成的组的MRM转变。
2.如权利要求1所述的方法,其中在将所述样品或其一部分引入质谱仪之后发生所述样品中的糖肽片段化。
3.如权利要求1或2中任一项所述的方法,其中片段化所述样品中的糖肽产生糖肽离子、肽离子、聚糖离子、聚糖加合离子或聚糖片段离子。
4.如权利要求1至3中任一项所述的方法,其中消化和/或片段化所述样品中的糖肽产生以下肽或糖肽:
基本上由氨基酸序列组成的肽或糖肽,所述氨基酸序列选自由SEQ ID NO:1-76及其组合组成的组;
基本上由氨基酸序列组成的肽或糖肽,所述氨基酸序列选自由SEQ ID NO:1、6、7、8、10、15、21、22、23、42、47、48、51、56、57、58、62、74和76及其组合组成的组;
基本上由氨基酸序列组成的肽或糖肽,所述氨基酸序列选自由SEQ ID NO:1、3、4、5、8、11、12、13、14、16、17、18、19、20、22、23、24、25、27、30、32、34、43、45、51、54、55、65、68、71、73、74、75及其组合组成的组;或
基本上由氨基酸序列组成的肽或糖肽,所述氨基酸序列选自由SEQ ID NO:2、6、7、9、10、15、21、26、28、29、31、33、35、36、37、38、39、40、41、42、44、46、47、48、49、50、52、53、56、57、58、59、60、61、62、63、64、66、67、69、70、72、76及其组合组成的组。
5.如权利要求1至4中任一项所述的方法,其中消化所述样品中的糖肽产生基本上由氨基酸序列组成的肽或糖肽,所述氨基酸序列选自由SEQ ID NO:1-76及其组合组成的组。
6.如权利要求1至4中任一项所述的方法,其中片段化所述样品中的糖肽产生以下肽或糖肽:
基本上由氨基酸序列组成的肽或糖肽,所述氨基酸序列选自由SEQ ID NO:1-76及其组合组成的组;
基本上由氨基酸序列组成的肽或糖肽,所述氨基酸序列选自由SEQ ID NO:1、6、7、8、10、15、21、22、23、42、47、48、51、56、57、58、62、74和76及其组合组成的组;
基本上由氨基酸序列组成的肽或糖肽,所述氨基酸序列选自由SEQ ID NO:1、3、4、5、8、11、12、13、14、16、17、18、19、20、22、23、24、25、27、30、32、34、43、45、51、54、55、65、68、71、73、74、75及其组合组成的组;或
基本上由氨基酸序列组成的肽或糖肽,所述氨基酸序列选自由SEQ ID NO:2、6、7、9、10、15、21、26、28、29、31、33、35、36、37、38、39、40、41、42、44、46、47、48、49、50、52、53、56、57、58、59、60、61、62、63、64、66、67、69、70、72、76及其组合组成的组。
7.如权利要求1至6中任一项所述的方法,其中所述MRM转变选自表1-5中任一者中的转变或其任何组合。
8.如权利要求1至7中任一项所述的方法,所述方法还包括对所述生物样品进行串联液相色谱法-质谱法。
9.如权利要求1至8中任一项所述的方法,其中检测选自由转变1-76组成的组的MRM转变包括对所述生物样品进行多反应监测质谱法(MRM-MS)质谱法。
10.如权利要求1至3和7至9中任一项所述的方法,其中所述一种或多种糖肽包括以下肽或糖肽:
基本上由氨基酸序列组成的肽或糖肽,所述氨基酸序列选自由SEQ ID NO:1-76及其组合组成的组;
基本上由氨基酸序列组成的肽或糖肽,所述氨基酸序列选自由SEQ ID NO:1、6、7、8、10、15、21、22、23、42、47、48、51、56、57、58、62、74和76及其组合组成的组;
基本上由氨基酸序列组成的肽或糖肽,所述氨基酸序列选自由SEQ ID NO:1、3、4、5、8、11、12、13、14、16、17、18、19、20、22、23、24、25、27、30、32、34、43、45、51、54、55、65、68、71、73、74、75及其组合组成的组;或
基本上由氨基酸序列组成的肽或糖肽,所述氨基酸序列选自由SEQ ID NO:2、6、7、9、10、15、21、26、28、29、31、33、35、36、37、38、39、40、41、42、44、46、47、48、49、50、52、53、56、57、58、59、60、61、62、63、64、66、67、69、70、72、76及其组合组成的组。
11.如权利要求1至10中任一项所述的方法,所述方法包括检测一个或多个指示一种或多种聚糖的MRM转变,所述一种或多种聚糖选自由以下组成的组:聚糖3200、3210、3300、3310、3320、3400、3410、3420、3500、3510、3520、3600、3610、3620、3630、3700、3710、3720、3730、3740、4200、4210、4300、4301、4310、4311、4320、4400、4401、4410、4411、4420、4421、4430、4431、4500、4501、4510、4511、4520、4521、4530、4531、4540、4541、4600、4601、4610、4611、4620、4621、4630、4631、4641、4650、4700、4701、4710、4711、4720、4730、5200、5210、5300、5301、5310、5311、5320、5400、5401、5402、5410、5411、5412、5420、5421、5430、5431、5432、5500、5501、5502、5510、5511、5512、5520、5521、5522、5530、5531、5541、5600、5601、5602、5610、5611、5612、5620、5621、5631、5650、5700、5701、5702、5710、5711、5712、5720、5721、5730、5731、6200、6210、6300、6301、6310、6311、6320、6400、6401、6402、6410、6411、6412、6420、6421、6432、6500、6501、6502、6503、6510、6511、6512、6513、6520、6521、6522、6530、6531、6532、6540、6541、6600、6601、6602、6603、6610、6611、6612、6613、6620、6621、6622、6623、6630、6631、6632、6640、6641、6642、6652、6700、6701、6711、6721、6703、6713、6710、6711、6712、6713、6720、6721、6730、6731、6740、7200、7210、7400、7401、7410、7411、7412、7420、7421、7430、7431、7432、7500、7501、7510、7511、7512、7600、7601、7602、7603、7604、7610、7611、7612、7613、7614、7620、7621、7622、7623、7632、7640、7700、7701、7702、7703、7710、7711、7712、7713、7714、7720、7721、7722、7730、7731、7732、7740、7741、7751、8200、9200、9210、10200、11200、12200及其组合。
12.如权利要求11所述的方法,所述方法还包括量化第一聚糖和量化第二聚糖;并且还包括将所述第一聚糖的所述量化与所述第二聚糖的所述量化进行比较。
13.如权利要求11或12所述的方法,所述方法还包括将检测到的聚糖与所述聚糖结合的肽残基位点缔合。
14.如权利要求13所述的方法,所述方法还包括量化聚糖和/或肽的相对丰度。
15.如权利要求1至14中任一项所述的方法,所述方法包括基于基本上由具有SEQID.No:1-76的氨基酸序列组成的肽或糖肽的量标准化糖肽的量。
16.一种鉴别样品的分类的方法,所述方法包括
通过质谱法(MS)量化样品中的一种或多种糖肽,其中所述糖肽各自在每种情况下单独地包含基本上由氨基酸序列组成的糖肽,所述氨基酸序列选自由SEQ ID NO:1-76及其组合组成的组;和
将所述量化输入到训练模型中以生成输出概率;
确定所述输出概率是高于还是低于分类阈值;以及
基于所述输出概率是高于还是低于分类阈值来鉴别所述样品的分类。
17.如权利要求16所述的方法,其中所述糖肽各自在每种情况下单独地包含以下糖肽:
基本上由氨基酸序列组成的糖肽,所述氨基酸序列选自由SEQ ID NO:1、6、7、8、10、15、21、22、23、42、47、48、51、56、57、58、62、74和76及其组合组成的组;
基本上由氨基酸序列组成的糖肽,所述氨基酸序列选自由SEQ ID NO:1、3、4、5、8、11、12、13、14、16、17、18、19、20、22、23、24、25、27、30、32、34、43、45、51、54、55、65、68、71、73、74、75及其组合组成的组;或
基本上由氨基酸序列组成的糖肽,所述氨基酸序列选自由SEQ ID NO:2、6、7、9、10、15、21、26、28、29、31、33、35、36、37、38、39、40、41、42、44、46、47、48、49、50、52、53、56、57、58、59、60、61、62、63、64、66、67、69、70、72、76及其组合组成的组。
18.如权利要求16所述的方法,其中所述样品是来自患有疾病或疾患的患者或个体的生物样品。
19.如权利要求18所述的方法,其中所述患者患有癌症、自身免疫疾病或纤维化。
20.如权利要求18所述的方法,其中所述患者患有卵巢癌。
21.如权利要求18所述的方法,其中所述个体患有衰老疾患。
22.如权利要求18所述的方法,其中所述疾病或疾患为卵巢癌。
23.如权利要求16至22中任一项所述的方法,其中所述训练模型使用选自由以下组成的组的机器学习算法训练:深度学习算法、神经网络算法、人工神经网络算法、监督机器学习算法、线性判别分析算法、二次判别分析算法、支持向量机算法、线性基函数核支持向量算法、径向基函数核支持向量算法、随机森林算法、遗传算法、最近邻算法、k-最近邻、朴素贝叶斯分类器算法、逻辑回归算法或其组合。
24.如权利要求16至23中任一项所述的方法,其中所述分类是疾病分类或疾病严重程度分类。
25.如权利要求24所述的方法,其中所述分类是以大于80%置信度、大于85%置信度、大于90%置信度、大于95%置信度、大于99%置信度或大于99.9999%置信度来鉴别。
26.如权利要求13至25中任一项所述的方法,所述方法还包括:
在第一时间点通过MS对样品中的第一糖肽进行量化;
在第二时间点通过MS对样品中的第二糖肽进行量化;以及
比较所述第一时间点的所述量化与所述第二时间点的所述量化。
27.如权利要求26所述的方法,所述方法还包括:
在第三时间点通过MS对样品中的第三糖肽进行量化;
在第四时间点通过MS对样品中的第四糖肽进行量化;以及
比较所述第四时间点的所述量化与所述第三时间点的所述量化。
28.如权利要求16至27中任一项所述的方法,所述方法还包括监测患者的健康状态。
29.如权利要求16至28中任一项所述的方法,所述方法还包括通过MS对糖肽进行量化,选自由SEQ ID NO:1-76组成的组的氨基酸序列是从所述糖肽片段化的。
30.如权利要求16至29中任一项所述的方法,所述方法还包括基于所述分类诊断患有疾病或疾患的患者。
31.如权利要求30所述的方法,所述方法还包括基于所述分类将所述患者诊断为患有卵巢癌。
32.如权利要求16至31中任一项所述的方法,所述方法还包括用治疗有效量的治疗剂治疗患者,所述治疗剂选自由化学治疗剂、免疫疗法、激素疗法、靶向疗法及其组合组成的组。
33.一种治疗患有卵巢癌的患者的方法;所述方法包括:
从所述患者获得或已经获得生物样品;
消化和/或片段化或已经消化或已经片段化所述样品中的一种或多种糖肽;和
检测和量化选自由转变1-76组成的组的一个或多个多反应监测(MRM)转变;
将所述量化输入到训练模型中以生成输出概率;
确定所述输出概率是高于还是低于分类阈值;以及
基于所述输出概率是高于还是低于分类阈值对所述患者进行分类,其中所述分类选自由以下组成的组:
(A)需要化学治疗剂的患者;
(B)需要免疫治疗剂的患者;
(C)需要激素疗法的患者;
(D)需要靶向治疗剂的患者;
(E)需要手术的患者;
(F)需要新辅助疗法的患者;
(G)手术前需要化学治疗剂、免疫治疗剂、激素疗法、靶向治疗剂、新辅助疗法或其组合的患者;
(H)手术后需要化学治疗剂、免疫治疗剂、激素疗法、靶向治疗剂、新辅助疗法或其组合的患者;
(I)或其组合;
向所述患者施用治疗有效量的治疗剂:
其中如果确定为分类A或I,则所述治疗剂选自化学疗法;
其中如果确定为分类B或I,则所述治疗剂选自免疫疗法;或
其中如果确定为分类C或I,则所述治疗剂选自激素疗法;或
其中如果确定为分类D或I,则所述治疗剂选自靶向疗法
其中如果确定为分类F或I,则所述治疗剂选自新辅助疗法;
其中如果确定为分类G或I,则所述治疗剂选自化学治疗剂、免疫治疗剂、激素疗法、靶向治疗剂、新辅助疗法或其组合;并且
其中如果确定为分类H或I,则所述治疗剂选自化学治疗剂、免疫治疗剂、激素疗法、靶向治疗剂、新辅助疗法或其组合。
34.如权利要求33所述的方法,所述方法包括对所述生物样品进行多反应监测质谱法(MRM-MS)。
35.如权利要求46或47所述的方法,所述方法包括量化一种或多种以下糖肽:
基本上由氨基酸序列组成的糖肽,所述氨基酸序列选自由SEQ ID NO:1、6、7、8、10、15、21、22、23、42、47、48、51、56、57、58、62、74和76及其组合组成的组;
基本上由氨基酸序列组成的糖肽,所述氨基酸序列选自由SEQ ID NO:1、3、4、5、8、11、12、13、14、16、17、18、19、20、22、23、24、25、27、30、32、34、43、45、51、54、55、65、68、71、73、74、75及其组合组成的组;或
基本上由氨基酸序列组成的糖肽,所述氨基酸序列选自由SEQ ID NO:2、6、7、9、10、15、21、26、28、29、31、33、35、36、37、38、39、40、41、42、44、46、47、48、49、50、52、53、56、57、58、59、60、61、62、63、64、66、67、69、70、72、76及其组合组成的组。
36.如权利要求33至35中任一项所述的方法,其中分析所述转变包括使用机器学习算法选择峰和/或量化检测到的糖肽片段。
37.一种诊断患有卵巢癌的患者的方法;所述方法包括:
从所述患者获得或已经获得生物样品;
使用利用QQQ和/或qTOF光谱仪的MRM-MS对所述生物样品进行质谱分析,以检测和量化一种或多种基本上由氨基酸序列组成的糖肽,所述氨基酸序列选自由SEQ ID NO:1-76组成的组;或检测选自转变1-76的一个或多个MRM转变;
将所述检测到的糖肽或所述MRM转变的量化输入到训练模型中以生成输出概率,
确定所述输出概率是高于还是低于分类阈值;以及
基于所述输出概率是高于还是低于分类阈值来鉴别所述患者的诊断分类;以及
基于所述诊断分类将所述患者诊断为患有卵巢癌。
38.如权利要求37所述的方法,其中分析所述检测到的糖肽包括使用机器学习算法。
39.一种糖肽,所述糖肽由氨基酸序列组成,所述氨基酸序列选自由SEQ ID NO:1-76及其组合组成的组。
40.一种糖肽,所述糖肽基本上由氨基酸序列组成,所述氨基酸序列选自基本上由SEQID NO:1-76及其组合组成的组。
41.一种糖肽,所述糖肽由氨基酸序列组成,所述氨基酸序列选自由SEQ ID NO:1、6、7、8、10、15、21、22、23、42、47、48、51、56、57、58、62、74和76及其组合组成的组。
42.一种糖肽,所述糖肽基本上由氨基酸序列组成,所述氨基酸序列选自基本上由SEQID NO:1、6、7、8、10、15、21、22、23、42、47、48、51、56、57、58、62、74和76及其组合组成的组。
43.一种糖肽,所述糖肽由氨基酸序列组成,所述氨基酸序列选自由SEQ ID NO:1、3、4、5、8、11、12、13、14、16、17、18、19、20、22、23、24、25、27、30、32、34、43、45、51、54、55、65、68、71、73、74、75及其组合组成的组。
44.一种糖肽,所述糖肽基本上由氨基酸序列组成,所述氨基酸序列选自基本上由SEQID NO:1、3、4、5、8、11、12、13、14、16、17、18、19、20、22、23、24、25、27、30、32、34、43、45、51、54、55、65、68、71、73、74、75及其组合组成的组。
45.一种糖肽,所述糖肽由氨基酸序列组成,所述氨基酸序列选自由SEQ ID NO:2、6、7、9、10、15、21、26、28、29、31、33、35、36、37、38、39、40、41、42、44、46、47、48、49、50、52、53、56、57、58、59、60、61、62、63、64、66、67、69、70、72、76及其组合组成的组。
46.一种糖肽,所述糖肽基本上由氨基酸序列组成,所述氨基酸序列选自基本上由SEQID NO:2、6、7、9、10、15、21、26、28、29、31、33、35、36、37、38、39、40、41、42、44、46、47、48、49、50、52、53、56、57、58、59、60、61、62、63、64、66、67、69、70、72、76及其组合组成的组。
47.一种试剂盒,所述试剂盒包含糖肽标准品、缓冲液以及一种或多种基本上由氨基酸序列组成的糖肽,所述氨基酸序列选自由SEQ ID NO:1-76组成的组。
CN202180018015.9A 2020-01-31 2021-01-29 用于诊断卵巢癌的生物标志物 Pending CN115280149A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202062968941P 2020-01-31 2020-01-31
US62/968,941 2020-01-31
PCT/US2021/015915 WO2021155300A2 (en) 2020-01-31 2021-01-29 Biomarkers for diagnosing ovarian cancer

Publications (1)

Publication Number Publication Date
CN115280149A true CN115280149A (zh) 2022-11-01

Family

ID=74856915

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180018015.9A Pending CN115280149A (zh) 2020-01-31 2021-01-29 用于诊断卵巢癌的生物标志物

Country Status (11)

Country Link
US (1) US20230065917A1 (zh)
EP (1) EP4097478A2 (zh)
JP (1) JP2023514809A (zh)
KR (1) KR20220134571A (zh)
CN (1) CN115280149A (zh)
AU (1) AU2021214797A1 (zh)
BR (1) BR112022014863A2 (zh)
CA (1) CA3168917A1 (zh)
CL (1) CL2022002000A1 (zh)
IL (1) IL295136A (zh)
WO (1) WO2021155300A2 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023089597A2 (en) * 2021-11-22 2023-05-25 Venn Biosciences Corporation Predicting sarcoma treatment response using targeted quantification of site-specific protein glycosylation

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MY202410A (en) 2017-09-01 2024-04-27 Venn Biosciences Corp Identification and use of glycopeptides as biomarkers for diagnosis and treatment monitoring
CN111479934A (zh) 2017-10-18 2020-07-31 韦恩生物科技股份公司 用于诊断和治疗监测的生物学指标的鉴定和用途

Also Published As

Publication number Publication date
US20230065917A1 (en) 2023-03-02
AU2021214797A1 (en) 2022-09-22
KR20220134571A (ko) 2022-10-05
EP4097478A2 (en) 2022-12-07
IL295136A (en) 2022-09-01
BR112022014863A2 (pt) 2022-10-11
CL2022002000A1 (es) 2023-03-03
WO2021155300A2 (en) 2021-08-05
JP2023514809A (ja) 2023-04-11
CA3168917A1 (en) 2021-08-05
WO2021155300A3 (en) 2021-09-10

Similar Documents

Publication Publication Date Title
JP7493815B2 (ja) 卵巣癌を診断するためのバイオマーカー
EP2398918B1 (en) Methods for diagnosis and prognosis of colorectal cancer
EP2708899A2 (en) Methods and biomarkers for diagnosing and monitoring psychotic disorders
US20170176441A1 (en) Protein biomarker profiles for detecting colorectal tumors
CN113396332A (zh) 评价妊娠进展和早产流产以进行临床干预的方法及其应用
CN115575636A (zh) 一种用于肺癌检测的生物标志物及其系统
US20230065917A1 (en) Biomarkers for diagnosing ovarian cancer
US20220310230A1 (en) Biomarkers for determining an immuno-onocology response
US20230112866A1 (en) Biomarkers for clear cell renal cell carcinoma
CN118019983A (zh) 用于诊断结直肠癌或进展期腺瘤的生物标志物
US20230055572A1 (en) Biomarkers for diagnosing ovarian cancer
CN117561449A (zh) 用于测定免疫肿瘤学反应的生物标志物
Friedrich et al. SWATH-MS analysis of the N-glyco proteome from serum of prostate cancer patients in order to reflect prostate tissue neoplastic changes
He Algorithms for characterizing peptides and glycopeptides with mass spectrometry

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40082480

Country of ref document: HK