CN106574919B - 用于预测早产的生物标志物和方法 - Google Patents

用于预测早产的生物标志物和方法 Download PDF

Info

Publication number
CN106574919B
CN106574919B CN201480028164.3A CN201480028164A CN106574919B CN 106574919 B CN106574919 B CN 106574919B CN 201480028164 A CN201480028164 A CN 201480028164A CN 106574919 B CN106574919 B CN 106574919B
Authority
CN
China
Prior art keywords
human
biomarkers
pregnant woman
probability
birth
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201480028164.3A
Other languages
English (en)
Other versions
CN106574919A (zh
Inventor
都尔林·爱德华·希科克
约翰·杰伊·博尼费斯
格雷戈里·查尔斯·克里驰菲尔德
特蕾西·克里斯蒂纳·弗莱舍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sera Prognostics Inc
Original Assignee
Sera Prognostics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=51538302&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=CN106574919(B) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Sera Prognostics Inc filed Critical Sera Prognostics Inc
Priority to CN202011081810.6A priority Critical patent/CN112213500A/zh
Publication of CN106574919A publication Critical patent/CN106574919A/zh
Application granted granted Critical
Publication of CN106574919B publication Critical patent/CN106574919B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/689Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids related to pregnancy or the gonads
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K4/00Peptides having up to 20 amino acids in an undefined or only partially defined sequence; Derivatives thereof
    • C07K4/12Peptides having up to 20 amino acids in an undefined or only partially defined sequence; Derivatives thereof from animals; from humans
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/36Gynecology or obstetrics
    • G01N2800/368Pregnancy complicated by disease or abnormalities of pregnancy, e.g. preeclampsia, preterm labour
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/52Predicting or monitoring the response to treatment, e.g. for selection of therapy based on assay results in personalised medicine; Prognosis
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/60Complex ways of combining multiple protein biomarkers for diagnosis
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Abstract

本发明公开提供了用于确定怀孕妇女中早产概率的生物标志物组、方法和试剂盒。本发明公开部分基于以下发现:相对于相匹配的对照,得自怀孕妇女的生物样品中某些蛋白质和肽在具有未来将发展或目前会经受早产的高风险的怀孕妇女中差异表达。本发明公开还部分基于以下意外发现:可以在确定怀孕妇女中早产概率的方法中相对高灵敏度和高特异性地使用混合这些蛋白和肽中的一个或多个的组。本文所公开的这些蛋白质和肽单独或以一组生物标志物用作对测试样品分类、预测早产概率、监控怀孕妇女中早产发展的生物标志物。

Description

用于预测早产的生物标志物和方法
本申请主张2013年12月20日提交的美国临时专利申请No.61/919,586和2013年3月15日提交的美国临时专利申请No.61/798,504的优先权,以上每篇专利以其全部内容作为参考并入本文。
本发明总体上涉及个性化医学领域,并且更具体地,涉及用于确定怀孕妇女中早产概率的组合物和方法。
背景技术
根据世界卫生组织,每年估计1500万婴儿早产(妊娠第37完整周之前)。根据可靠数据,在几乎所有国家,早产率日益提高。参见,World Health Organization;March ofDimes;The Partnership for Maternal,Newborn&Child Health;Save the Children,Born too soon:the global action report on preterm birth,ISBN 9789241503433(2012)。每年估计有100万婴儿死于早产并发症。就全世界而言,早产是新生儿死亡的主要原因(出生前4周的婴儿),而第二主要死亡原因是5岁以下儿童中的肺炎。多数存活者面临一生残疾,包括无学习能力以及视觉和听觉问题。
根据可靠数据,在184个国家,早产率在出生婴儿的5%至18%的范围内。Blencowe等人,“National,regional and worldwide estimates of preterm birth.”The Lancet,9;379(9832):2162-72(2012)。尽管超过60%的早产发生在非洲和南亚,但早产仍是全球性问题。早产数最高的国家包括巴西、印度、尼日利亚和美国。在早产率超过15%的11个国家中,除两个国家外,全部处于下撒哈拉非洲。在最穷的国家中,平均地,12%的婴儿出生过早,相比之下,较高收入国家为9%。在国家内,较穷困家庭具有更高的风险。可以通过可行的、成本有效的护理挽救超过3/4的早产婴儿,例如,对具有早产风险的孕妇给予出生前类固醇注射以加强婴儿的肺。
对于死亡和多种健康和发育问题,早产婴儿比足月产婴儿具有更高的风险。并发症包含急性呼吸问题、胃肠问题、免疫学问题、中枢神经系统问题、听觉问题和视觉问题,以及长期运动问题、认知问题、视觉问题、听觉问题、行为问题、社会-情绪问题、健康问题和生长问题。早产婴儿的出生还可以给家庭带来大量情绪和经济成本,并且牵涉公共部门服务,如健康保险、教育及其他社会支持系统。最大的死亡和发病风险是对于那些在最早妊娠期出生的婴儿。然而,较接近足月出生的那些婴儿代表了最多数早产婴儿,并且仍经受了比足月产婴儿更多的并发症。
为了防止小于妊娠24周且超声显示宫颈打开的妇女中的早产,可以使用被称为宫颈环扎的手术程序,其中用稳固的缝合线将宫颈缝合闭合。对于小于妊娠34周并且处于主动早产分娩的妇女,住院治疗可能是必需的并且施用药物暂时停止早产分娩和/或促进胎儿肺发育。如果确定孕妇处于早产风险,则保健提供者可以实施多种临床策略,其可以包括预防性药物治疗,例如,己酸羟孕酮(Makena)注射和/或阴道黄体酮凝胶、宫颈阴道栓剂、限制性活动和/或其他身体活动和改变提高早产风险的慢性病况(如糖尿病和高血压)治疗。
急需鉴别具有早产风险的妇女,并为其提供适当的产前护理。可以对鉴别为高风险的妇女安排更密切的产前监督和预防性干预。当前用于风险评估的策略基于产科史和病史以及临床检查,但是这些策略仅能够鉴别较低比例的处于早产分娩风险的妇女。可靠的早期早产风险鉴别法将能够安排适当的监控和临床管理以预防早产分娩。这种监控和管理可以包含:更频繁的产前护理拜访、连续的宫颈长度量测、加强有关早期早产体征和症状的教育、对可改变的风险行为的生活方式干预、宫颈阴道栓剂和黄体酮治疗。最后,早产风险的可靠产前鉴别法还对监控资源的成本-有效的分配是至关重要的。
本发明通过提供用于确定孕妇是否处于早产风险的组合物和方法解决了该需求。还提供了相关优势。
发明概述
本发明提供了用于预测怀孕妇女中早产概率的组合物和方法。
在一个方面,本发明提供了一组分离的生物标志物,其包含表1至63中所列的N种生物标志物。在一些实施方式中,N是选自由2至24组成的组中的数字。在其他实施方式中,所述生物标志物组包含选自由AFTECCVVASQLR、ELLESYIDGR和ITLPDFTGDLR组成的组中的至少2种分离的生物标志物。在其他实施方式中,所述生物标志物组包含选自由FLNWIK、FGFGGSTDSGPIR、LLELTGPK、VEHSDLSFSK、IEGNLIFDPNNYLPK、ALVLELAK、TQILEWAAER、DVLLLVHNLPQNLPGYFWYK、SEPRPGVLLR、ITQDAQLK、ALDLSLK、WWGGQPLWITATK和LSETNR组成的组中的至少2种分离的生物标志物。
在其他实施方式中,所述生物标志物组包含选自由表50中所述的生物标志物和表52中所述的生物标志物组成的组中的至少2种分离的生物标志物。
在另一个方面,本发明提供了一组分离的生物标志物,其包含表1至63中所列的N种生物标志物。在一些实施方式中,N是选自由2至24组成的组中的数字。在其他实施方式中,所述生物标志物组包含选自由表50中所述的生物标志物和表52中所述的生物标志物组成的组中的至少2种分离的生物标志物。
在一些实施方式中,本发明提供了包含至少2种分离的生物标志物的生物标志物组,所述分离的生物标志物选自脂多糖-结合蛋白(LBP)、凝血酶原(THRB)、补体组分C5(C5或CO5)、纤溶酶原(PLMN)和补体组分C8γ链(C8G或者CO8G)。
在一些实施方式中,本发明提供了包含至少2种分离的生物标志物的生物标志物组,所述分离的生物标志物选自α-1B-糖蛋白(A1BG)、含有解联蛋白和金属蛋白酶结构域的蛋白12(ADA12)、脱脂蛋白B-100(APOB)、β-2-微球蛋白(B2MG)、CCAAT/增强子-结合蛋白α/β(HP8肽)、结合皮质甾类球蛋白(CBG)、补体组分C6,内皮糖蛋白(Endoglin)(EGLN)、核苷酸内焦磷酸酶/磷酸二酯酶家族成员2(ENPP2)、凝血因子VII(FA7)、透明质酸酯-结合蛋白2(HABP2)、妊娠特异性-β-1-糖蛋白9(PSG9)、抑制素βE链(INHBE)。
在其他实施方式中,本发明提供了生物标志物组,其包含脂多糖-结合蛋白(LBP)、凝血酶原(THRB)、补体组分C5(C5或CO5)、纤溶酶原(PLMN)、补体组分C8γ链(C8G或CO8G)、补体组分1,q亚组分,B链(C1QB)、纤维蛋白原β链(FIBB或FIB)、C-反应蛋白(CRP),内源性-α-胰蛋白酶抑制剂重链H4(ITIH4)、绒毛膜生长催乳激素(CSH)和血管紧张素原(ANG或ANGT)。
在其他实施方式中,本发明提供了生物标志物组,其包含α-1B-糖蛋白(A1BG)、含有解联蛋白和金属蛋白酶结构域的蛋白12(ADA12)、脱脂蛋白B-100(APOB)、β-2-微球蛋白(B2MG)、CCAAT/增强子-结合蛋白α/β(HP8肽)、结合皮质甾类球蛋白(CBG)、补体组分C6,内皮糖蛋白(Endoglin)(EGLN)、核苷酸内焦磷酸酶/磷酸二酯酶家族成员2(ENPP2)、凝血因子VII(FA7)、透明质酸酯-结合蛋白2(HABP2)、妊娠特异性-β-1-糖蛋白9(PSG9)、抑制素βE链(INHBE)。
在其他实施方式中,本发明提供了包含至少2种分离的生物标志物的生物标志物组,所述分离的生物标志物选自表51中所述的生物标志物和表53中所述的生物标志物。
本发明还提供了确定怀孕妇女中早产概率的方法,其包括测定得自所述怀孕妇女的生物样品中选自表1至63中所列的生物标志物的N种生物标志物中的每一种的可测量特征,并分析所述可测量特征以确定所述怀孕妇女中的早产概率。在一些实施方式中,本发明提供了预测GAB的方法,所述方法包括检测得自怀孕妇女的生物样品中选自表1至63中所列的生物标志物的N种生物标志物中的每一种的可测量特征,并分析所述可测量特征以预测GAB。
在一些实施方式中,可测量特征包括选自表1至63中所列的生物标志物的N种生物标志物的每一种的片段或衍生物。在所公开的方法的一些实施方式中,检测可测量特征包括对得自怀孕妇女的生物样品中选自表1至63中所列的生物标志物的N种生物标志物的每一种、它们的组合或部分和/或衍生物的量进行定量分析。在其他实施方式中,确定怀孕妇女中早产概率的所公开的方法包括检测与早产有关的一种或多种风险指征的可测量特征。
在一些实施方式中,确定怀孕妇女中早产概率的所公开的方法和本文所公开的相关方法包括检测N种生物标志物的每一种的可测量特征,其中N选自2至24。在其他实施方式中,确定怀孕妇女中早产概率的所公开的方法和本文所公开的相关方法包括检测至少2种分离的生物标志物的每一种的可测量特征,所述分离的生物标志物选自AFTECCVVASQLR、ELLESYIDGR和ITLPDFTGDLR。在其他实施方式中,确定怀孕妇女中早产概率的所公开的方法和本文所公开的相关方法包括检测至少2种分离的生物标志物的每一种的可测量特征,所述分离的生物标志物选自FLNWIK、FGFGGSTDSGPIR、LLELTGPK、VEHSDLSFSK、IEGNLIFDPNNYLPK、ALVLELAK、TQILEWAAER、DVLLLVHNLPQNLPGYFWYK、SEPRPGVLLR、ITQDAQLK、ALDLSLK、WWGGQPLWITATK和LSETNR。在其他实施方式中,确定怀孕妇女中早产概率的所公开的方法和本文所公开的相关方法包括检测至少2种分离的生物标志物的每一种的可测量特征,所述分离的生物标志物选自表50中所述的生物标志物和表52中所述的生物标志物。
在其他实施方式中,确定怀孕妇女中早产概率的所公开的方法包括检测至少2种分离的生物标志物的每一种的可测量特征,所述分离的生物标志物选自脂多糖-结合蛋白(LBP)、凝血酶原(THRB)、补体组分C5(C5或CO5)、纤溶酶原(PLMN)和补体组分C8γ链(C8G或者CO8G)。
在其他实施方式中,确定怀孕妇女中早产概率的所公开的方法包括检测至少2种分离的生物标志物的每一种的可测量特征,所述分离的生物标志物选自α-1B-糖蛋白(A1BG)、含有解联蛋白和金属蛋白酶结构域的蛋白12(ADA12)、脱脂蛋白B-100(APOB)、β-2-微球蛋白(B2MG)、CCAAT/增强子-结合蛋白α/β(HP8肽)、结合皮质甾类球蛋白(CBG)、补体组分C6,内皮糖蛋白(Endoglin)(EGLN)、核苷酸内焦磷酸酶/磷酸二酯酶家族成员2(ENPP2)、凝血因子VII(FA7)、透明质酸酯-结合蛋白2(HABP2)、妊娠特异性-β-1-糖蛋白9(PSG9)、抑制素βE链(INHBE)。
在其他实施方式中,确定怀孕妇女中早产概率的所公开的方法包括检测至少2种分离的生物标志物的每一种的可测量特征,所述分离的生物标志物选自脂多糖-结合蛋白(LBP)、凝血酶原(THRB)、补体组分C5(C5或CO5)、纤溶酶原(PLMN)、补体组分C8γ链(C8G或CO8G)、补体组分1,q亚组分,B链(C1QB)、纤维蛋白原β链(FIBB或FIB)、C-反应蛋白(CRP)、内源性-α-胰蛋白酶抑制剂重链H4(ITIH4)、绒毛膜生长催乳激素(CSH)和血管紧张素原(ANG或ANGT)
在其他实施方式中,确定怀孕妇女中早产概率的所公开的方法包括检测至少2种分离的生物标志物的每一种的可测量特征,所述分离的生物标志物选自表51中所述的生物标志物和表53中所述的生物标志物。
在确定怀孕妇女中早产概率的方法的一些实施方式中,基于选自表1至63中所列的生物标志物的N种生物标志物的每一种的定量分析的量计算怀孕妇女中的早产概率。在一些实施方式中,用于确定早产概率的所公开的方法包括使用质谱、捕获试剂或其组合检测和/或定量分析一种或多种生物标志物。
在一些实施方式中,确定怀孕妇女中早产概率的所公开的方法包括提供包含表1至63中所列的N种生物标志物的生物标志物组的初始步骤。在其他实施方式中,确定怀孕妇女中早产概率的所公开的方法包括提供来自怀孕妇女的生物样品的初始步骤。
在一些实施方式中,确定怀孕妇女中早产概率的所公开的方法包括向保健提供者传达所述概率。在其他实施方式中,传达通知对怀孕妇女的后续治疗决策。在其他实施方式中,治疗决策选自更频繁的产前护理拜访、连续的宫颈长度量测、加强有关早期早产体征和症状的教育、对可改变的风险行为的生活方式干预和黄体酮治疗中的一种或多种。
在其他实施方式中,确定怀孕妇女中早产概率的所公开的方法包括使用预测模型分析一种或多种分离的生物标志物的可测量特征。在所公开的方法的一些实施方式中,将一种或多种分离的生物标志物的可测量特征与参考特征相比较。
在其他实施方式中,确定怀孕妇女中早产概率的所公开的方法包括使用一种或多种分析,其选自线性差别分析模型、支持向量机分类算法、回归特征消去模型、微阵列预测分析模型、逻辑回归模型、CART算法、flex tree算法、LART算法、随机森林算法、MART算法、机器学习算法、惩罚回归方法及其组合。在一个实施方式中,确定怀孕妇女中早产概率的所公开的方法包括逻辑回归。
在一些实施方式中,本发明提供了确定怀孕妇女中早产概率的方法,所述方法包括在获自怀孕妇女的生物样品中对选自表1至63中所列的生物标志物的N种生物标志物的每一种的量进行定量分析;将所述量乘以预定系数,并确定怀孕妇女中的早产概率,包括将各个产物相加以获得对应于概率的总风险得分。
在其他实施方式中,本发明提供了预测GAB的方法,所述方法包括:(a)在获自所述怀孕妇女的生物样品中对选自表1至63中所列的生物标志物的N种生物标志物的每一种的量进行定量分析;(b)将所述量乘以预定系数或通过预定系数进行阈值处理,(c)确定所述怀孕妇女中预测的GAB生产,包括将所述各个产物相加以获得对应于所述预测的GAB的总风险得分。
在其他实施方式中,本发明提供了预测怀孕妇女中生产时间的方法,所述方法包括:(a)从所述怀孕妇女获得生物样品;(b)对所述生物样品中选自表1至63中所列的生物标志物的N种生物标志物的每一种的量进行定量分析;(c)将所述量乘以预定系数或通过预定系数进行阈值处理,(d)确定所述怀孕妇女中预测的GAB,包括将所述各个产物相加以获得对应于所述预测的GAB的总风险得分;和(e)从预测的GAB中减去获得生物样品时估计的胎龄(GA)以预测所述怀孕妇女中的生产时间。
根据详细说明和权利要求,本发明的其他特征和优势将是显而易见的。
附图说明
图1.出生时的真实胎龄相对于随机森林回归模型的预测胎龄的分布图。
图2.随机森林回归模型的预测胎龄相对于出生时的真实胎龄(GAB)的分布,其中以下列分类提供真实的GAB:(i)小于37周、(ii)37至39周,和(iii)40周或以上(分别为从左到右的峰值)。
发明详述
本发明公开部分地基于以下发现:相对于对照,得自怀孕妇女的生物样品中某些蛋白质和肽在具有高早产风险的怀孕妇女中差异表达。本发明公开还部分基于以下意外发现:可以在确定怀孕妇女中早产概率的方法中高灵敏度和高特异性地使用混合这些蛋白和肽中的一个或多个的组。本文所公开的这些蛋白和肽单独或以一组生物标志物用作对测试样品分类、预测早产概率、预测足月产的概率、预测出生时的胎龄(GAB)、在怀孕妇女中预测生产时间和/或监控预防性疗法的发展的生物标志物。
本发明公开提供了用于确定怀孕妇女中早产概率的生物标志物组、方法和试剂盒。本发明公开的一个主要优势在于可以在妊娠早期评价发展早产的风险,从而可以以及时的方式起始适当的监控和临床管理以预防早产分娩。本发明对于缺少任何早产风险因素和将不会被鉴别和治疗的妇女是特别有用的。
举例来说,本发明公开包括通过获得与样品有关的数据集来产生在确定怀孕妇女中早产概率中有用的结果的方法,其中所述数据集至少包括有关已鉴别为早产指示的生物标志物和生物标志物组的定量分析数据,和将所述数据集输入至使用所述数据集产生在确定怀孕妇女中早产概率中有用的结果的分析方法。如以下进一步描述的,该定量分析数据可以包括氨基酸、肽、多肽、蛋白质、核苷酸、核酸、核苷、糖、脂肪酸、类固醇、代谢产物、碳水化合物、脂肪、激素、抗体、用作生物大分子的替代物的感兴趣区及其组合。
除了通过(例如)公众数据库中的登录号、序列或参考在本发明公开中鉴别的具体的生物标志物外,本发明还考虑了与所举例说明的序列具有至少90%或至少95%或至少97%的同一性并且是现在已知或随后将发现的并且对本发明所述的方法有用的生物标志物变体的使用。这些变体可以代表多态性、剪接变体、突变等。在这点上,本说明书在本发明的背景下公开了多种本领域已知的蛋白质并且提供了与一个或多个公共数据库有关的示例性登录号以及与这些本领域已知的蛋白质有关的发表的期刊论文的示例性参考文献。然而,本领域技术人员认识到可以容易地鉴别其他登录号和期刊论文,它们可以提供所公开的生物标志物的其他特征并且举例说明的参考文献绝不是对所公开的生物标志物的限制。如本文所述,多种技术和试剂在本发明所述的方法中是有用的。在本发明的背景中,适合的样品包括(例如)血液、血浆、血清、羊膜水、阴道分泌物、唾液和尿。在一些实施方式中,所述生物样品选自全血、血浆和血清。在具体的实施方式中,所述生物样品是血清。如本文所述,可以通过本领域中已知的多种测定和技术检测生物标志物。如本文进一步所述的,这些测定无限制地包括基于质谱(MS)的测定、基于抗体的测定以及将两种方法的方面结合的测定。
与怀孕妇女中早产概率有关的蛋白生物标志物包括(但不限于)表1至63中所列的分离的生物标志物中的一个或多个。除了具体的生物标志物外,本发明公开还包括与所举例说明的序列具有约90%、约95%或约97%的同一性的生物标志物变体。如本文所使用的,变体包括多态性、剪接变体、突变等。
其他标志物可以选自一种或多种风险指征,其包括(但不限于)母体特性、病史、过往妊娠史和婚育史。这些其他标志物可以包括(例如)先前的低出生体重或早产分娩、多次在第2个三个月中自发性流产、先前在第1个三个月中人工流产、家族和存在于两代人之间的因素、不育史、未孕、胎盘异常、宫颈和子宫异常、宫颈长度量测短、妊娠期出血、宫内生长受限、宫内己烯雌酚暴露、多次妊娠、婴儿性别(infant sex)、身材矮小、低妊娠前体重、体重指数低或高、糖尿病、高血压、泌尿生殖器感染(即尿路感染)、哮喘、焦虑症和抑郁症、哮喘、高血压、甲状腺机能减退。早产的人口统计学风险指征可以包括(例如)母体年龄、种族/种族(race/ethnicity)、单身婚姻状况、社会经济地位低、母体年龄、职业相关身体活动、职业性曝露以及环境暴露和压力。其他风险指征可以包括产前护理不足、吸烟、使用大麻及其他非法毒品、可卡因使用、饮酒、咖啡因摄入、母体体重增加、饮食摄入、妊娠晚期的性活动以及业余时间的身体活动。(Preterm Birth:Causes,Consequences,and Prevention,Institute of Medicine(US)Committee on Understanding Premature Birth andAssuring Healthy Outcomes;Behrman RE,Butler AS,editors.Washington(DC):National Academies Press(US);2007)。可以使用本领域中已知的学习算法鉴别对作为标志物有用的其他风险指征,所述学习算法如线性差别分析、支持向量机分类、回归特征消去、微阵列的预测分析、逻辑回归、CART、FlexTree、LART、随机森林、MART和/或存活分析回归,它们是本领域技术人员已知的并且在本文中进一步得到说明。
本文提供了包含N种生物标志物的分离的生物标志物组,所述生物标志物选自表1至63中所列的组。在所公开的生物标志物组中,N可以是选自2至24的数。在所公开的方法中,所检测的并且确定其水平的生物标志物的数目可以是1或大于1,如2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25或以上。在某些实施方式中,所检测的并且确定其水平的生物标志物的数目可以是1或大于1,如2、3、4、5、6、7、8、9、10或以上。本发明公开所述的方法对确定怀孕妇女中早产概率是有用的。
尽管表1至63中所列的某些生物标志物单独对于确定怀孕妇女中的早产概率是有用的,但是本文还描述了对作为3个或更多个生物标志物的组分别有用的生物标志物的多个子集进行分组的方法。在一些实施方式中,本发明提供了包含N种生物标志物的组,其中N为至少3个生物标志物。在其他实施方式中,N选择为3-23个生物标志物中的任意个数。
在其他实施方式中,N选择为2-5、2-10、2-15、2-20或2-23中的任意个数。在其他实施方式中,N选择为3-5、3-10、3-15、3-20或3-23中的任意个数。在其他实施方式中,N选择为4-5、4-10、4-15、4-20或4-23中的任意个数。.在其他实施方式中,N选择为5-10、5-15、5-20或5-23中的任意个数。在其他实施方式中,N选择为6-10、6-15、6-20或6-23中的任意个数。在其他实施方式中,N选择为7-10、7-15、7-20或7-23中的任意个数。在其他实施方式中,N选择为8-10、8-15、8-20或8-23中的任意个数。在其他实施方式中,N选择为9-10、9-15、9-20或9-23中的任意个数。在其他实施方式中,N选择为10-15、10-20或10-23中的任意个数。将理解N可以选择包含类似但更高数量级的范围。
在某些实施方式中,分离的生物标志物组包含一种或多种、两种或更多种、三种或更多种、四种或更多种或五种分离的生物标志物,所述分离的生物标志物包含选自AFTECCVVASQLR、ELLESYIDGR、ITLPDFTGDLR、TDAPDLPEENQAR和SFRPFVPR的氨基酸序列。在一些实施方式中,分离的生物标志物组包含一种或多种、两种或更多种、三种或更多种、四种或更多种或五种分离的生物标志物,所述分离的生物标志物包含选自FLNWIK、FGFGGSTDSGPIR、LLELTGPK、VEHSDLSFSK、IEGNLIFDPNNYLPK、ALVLELAK、TQILEWAAER、DVLLLVHNLPQNLPGYFWYK、SEPRPGVLLR、ITQDAQLK、ALDLSLK、WWGGQPLWITATK和LSETNR的氨基酸序列。
在一些实施方式中,分离的生物标志物组包含一种或多种、两种或更多种或三种分离的生物标志物,所述分离的生物标志物包括选自AFTECCVVASQLR、ELLESYIDGR和ITLPDFTGDLR的氨基酸序列。在一些实施方式中,分离的生物标志物组包括一种或多种、两种或更多种或三种分离的生物标志物,所述分离的生物标志物包括选自FLNWIK、FGFGGSTDSGPIR、LLELTGPK、VEHSDLSFSK、IEGNLIFDPNNYLPK、ALVLELAK、TQILEWAAER、DVLLLVHNLPQNLPGYFWYK、SEPRPGVLLR、ITQDAQLK、ALDLSLK、WWGGQPLWITATK和LSETNR的氨基酸序列。
在一些实施方式中,分离的生物标志物组包含一种或多种、两种或更多种或三种分离的生物标志物,所述分离的生物标志物包括选自表50中所述的生物标志物和表52中所述的生物标志物的氨基酸序列。
在一些实施方式中,分离的生物标志物组包括含有来自下列的片段的一个或多个肽:脂多糖-结合蛋白(LBP),Schumann等人,Science 249(4975),1429-1431(1990)(UniProtKB/Swiss-Prot:P18428.3);凝血酶原(THRB),Walz等人,Proc.Natl.Acad.Sci.U.S.A.74(5),1969-1972(1977)(NCBI Reference Sequence:NP_000497.1);补体组分C5(C5或CO5),Haviland,J.Immunol.146(1),362-368(1991)(GenBank:AAA51925.1);纤溶酶原(PLMN),Petersen等人,J.Biol.Chem.265(11),6104-6111(1990)(NCBI Reference Sequences:NP_000292.1NP_001161810.1);和补体组分C8γ链(C8G或CO8G),Haefliger等人,Mol.Immunol.28(1-2),123-131(1991)(NCBI ReferenceSequence:NP_000597.2)。
在一些实施方式中,分离的生物标志物组包括含有来自下列的片段的一个或多个肽:与补体组分1,q亚组分,B链(C1QB)具有同源性的细胞粘附分子,Reid,Biochem.J.179(2),367-371(1979)(NCBI Reference Sequence:NP_000482.3);纤维蛋白原β链(FIBB或FIB);Watt等人,Biochemistry 18(1),68-76(1979)(NCBI Reference Sequences:NP_001171670.1 and NP_005132.2);C-反应蛋白(CRP),Oliveira等人,J.Biol.Chem.254(2),489-502(1979)(NCBI Reference Sequence:NP_000558.2);内源性-α-胰蛋白酶抑制剂重链H4(ITIH4)Kim等人,Mol.Biosyst.7(5),1430-1440(2011)(NCBI Reference Sequences:NP_001159921.1 and NP_002209.2);绒毛膜生长催乳激素(CSH)Selby等人,J.Biol.Chem.259(21),13131-13138(1984)(NCBI Reference Sequence:NP_001308.1);和血管紧张素原(ANG或ANGT))Underwood等人,Metabolism 60(8):1150-7(2011)(NCBIReference Sequence:NP_000020.1)。
在其他实施方式中,本发明提供了一组分离的生物标志物,其包含表1至63中所列的N种生物标志物。在一些实施方式中,N是选自2至24的数。在其他实施方式中,所述生物标志物组包含至少2种分离的生物标志物,其选自AFTECCVVASQLR、ELLESYIDGR和ITLPDFTGDLR。在其他实施方式中,所述生物标志物组包含至少2种分离的生物标志物,其选自AFTECCVVASQLR、ELLESYIDGR、ITLPDFTGDLR、TDAPDLPEENQAR和SFRPFVPR。在其他实施方式中,所述生物标志物组包含至少2种分离的生物标志物,其选自FLNWIK、FGFGGSTDSGPIR、LLELTGPK、VEHSDLSFSK、IEGNLIFDPNNYLPK、ALVLELAK、TQILEWAAER、DVLLLVHNLPQNLPGYFWYK、SEPRPGVLLR、ITQDAQLK、ALDLSLK、WWGGQPLWITATK和LSETNR。
在其他实施方式中,所述生物标志物组包含至少2种分离的生物标志物,其选自表50中所述的生物标志物和表52中所述的生物标志物。
在其他实施方式中,所述生物标志物组包含至少2种分离的生物标志物,其选自脂多糖-结合蛋白(LBP)、凝血酶原(THRB)、补体组分C5(C5或CO5)、纤溶酶原(PLMN)和补体组分C8γ链(C8G或者CO8G)。在另一种实施方式中,本发明提供了包含至少3种分离的生物标志物的生物标志物组,所述分离的生物标志物选自脂多糖-结合蛋白(LBP)、凝血酶原(THRB)、补体组分C5(C5或CO5)、纤溶酶原(PLMN)和补体组分C8γ链(C8G或者CO8G)。
在其他实施方式中,所述生物标志物组包含至少2种分离的生物标志物,其选自α-1B-糖蛋白(A1BG)、含有解联蛋白和金属蛋白酶结构域的蛋白12(ADA12)、脱脂蛋白B-100(APOB)、β-2-微球蛋白(B2MG)、CCAAT/增强子-结合蛋白α/β(HP8肽)、结合皮质甾类球蛋白(CBG)、补体组分C6,内皮糖蛋白(Endoglin)(EGLN)、核苷酸内焦磷酸酶/磷酸二酯酶家族成员2(ENPP2)、凝血因子VII(FA7)、透明质酸酯-结合蛋白2(HABP2)、妊娠特异性-β-1-糖蛋白9(PSG9)、抑制素βE链(INHBE)。
在一些实施方式中,本发明提供生物标志物组,其包含脂多糖-结合蛋白(LBP)、凝血酶原(THRB)、补体组分C5(C5或CO5)、纤溶酶原(PLMN)、补体组分C8γ链(C8G或CO8G)、补体组分1,q亚组分,B链(C1QB)、纤维蛋白原β链(FIBB或FIB)、C-反应蛋白(CRP)、内源性-α-胰蛋白酶抑制剂重链H4(ITIH4)、绒毛膜生长催乳激素(CSH)和血管紧张素原(ANG或ANGT)。在一些实施方式中,本发明提供了生物标志物组,其包含α-1B-糖蛋白(A1BG)、含有解联蛋白和金属蛋白酶结构域的蛋白12(ADA12)、脱脂蛋白B-100(APOB)、β-2-微球蛋白(B2MG)、CCAAT/增强子-结合蛋白α/β(HP8肽)、结合皮质甾类球蛋白(CBG)、补体组分C6,内皮糖蛋白(Endoglin)(EGLN)、核苷酸内焦磷酸酶/磷酸二酯酶家族成员2(ENPP2)、凝血因子VII(FA7)、透明质酸酯-结合蛋白2(HABP2)、妊娠特异性-β-1-糖蛋白9(PSG9)、抑制素βE链(INHBE)。
在另一个方面,本发明提供了包含至少2种分离的生物标志物的生物标志物组,所述分离的生物标志物选自脂多糖-结合蛋白(LBP)、凝血酶原(THRB)、补体组分C5(C5或CO5)、纤溶酶原(PLMN)、补体组分C8γ链(C8G或CO8G)、补体组分1,q亚组分,B链(C1QB)、纤维蛋白原β链(FIBB或FIB)、C-反应蛋白(CRP)、内源性-α-胰蛋白酶抑制剂重链H4(ITIH4)、绒毛膜生长催乳激素(CSH)和血管紧张素原(ANG或ANGT)以及表51和53中所述的生物标志物。
在另一个方面,本发明提供了包含至少2种分离的生物标志物的生物标志物组,所述分离的生物标志物选自α-1B-糖蛋白(A1BG)、含有解联蛋白和金属蛋白酶结构域的蛋白12(ADA12)、脱脂蛋白B-100(APOB)、β-2-微球蛋白(B2MG)、CCAAT/增强子-结合蛋白α/β(HP8肽)、结合皮质甾类球蛋白(CBG)、补体组分C6,内皮糖蛋白(Endoglin)(EGLN)、核苷酸内焦磷酸酶/磷酸二酯酶家族成员2(ENPP2)、凝血因子VII(FA7)、透明质酸酯-结合蛋白2(HABP2)、妊娠特异性-β-1-糖蛋白9(PSG9)、抑制素βE链(INHBE)。
应注意除非内容中明确规定,否则如本说明书和所附权利要求中所使用的,单数形式的“一个”和“所述”包括复数对象。因此,例如,对“生物标志物”的提及包括两种或更多种生物标志物等的混合物。
具体地,与给定量有关的术语“约”表示包括正或负5%的偏差。
除非内容中明确规定,否则如包括所附权利要求的本发明申请中所使用的,单数形式的“一个”和“所述”包括复数参考并且与“至少一个”和“一个或多个”是可互换使用的。
如本文所使用的,术语“包含”、“包括”、“含有”及其任何变化旨在涵盖非排他的包括,如包含、包括或含有元素或元素列表的过程、方法、过程产物或物质组合物不仅包括这些成分,但是可以包括这些过程、方法、过程产物或物质组合物中未明确列出或固有的其他成分。
如本文所使用的,术语“组”是指包含一个或多个生物标志物的组合物,如阵列或集合。该术语还可以表示本文所述的一种或多种生物标志物的表达类型的谱图或指数。用于生物标志物组的生物标志物的数目基于生物标志物值的特定组合的灵敏度和特异性值。
如本文所使用的并且除非另作说明,术语“分离的”和“纯化的”通常描述已从其天然环境(例如,如果它是天然存在的,自然环境)中除去并因此通过人手从其自然状态改变的物质组合物。分离的蛋白质或核酸不同于其自然存在的方式。
术语“生物标志物”是指生物分子或生物分子片段,其变化和/或检测可以与特定身体状况或状态相关。在整个发明公开中,术语“标志物”和“生物标志物”是可互换使用的。例如,本发明的生物标志物与早产可能性提高有关。这些生物标志物包括(但不限于)生物分子,其包括核苷酸、核酸、核苷、氨基酸、糖、脂肪酸、类固醇、代谢产物、肽、多肽、蛋白质、碳水化合物、脂肪、激素、抗体、用作生物大分子的替代物的感兴趣区及其组合(例如,糖蛋白、核糖核蛋白、脂蛋白)。该术语还包括生物分子的部分或片段,例如,包含至少5个连续的氨基酸残基、至少6个连续的氨基酸残基、至少7个连续的氨基酸残基、至少8个连续的氨基酸残基、至少9个连续的氨基酸残基、至少10个连续的氨基酸残基、至少11个连续的氨基酸残基、至少12个连续的氨基酸残基、至少13个连续的氨基酸残基、至少14个连续的氨基酸残基、至少15个连续的氨基酸残基、至少5个连续的氨基酸残基、至少16个连续的氨基酸残基、至少17个连续的氨基酸残基、至少18个连续的氨基酸残基、至少19个连续的氨基酸残基、至少20个连续的氨基酸残基、至少21个连续的氨基酸残基、至少22个连续的氨基酸残基、至少23个连续的氨基酸残基、至少24个连续的氨基酸残基、至少25个连续的氨基酸残基或更多个连续的氨基酸残基的蛋白质或多肽的肽片段。
本发明还提供了确定怀孕妇女中早产概率的方法,所述方法包括测定得自所述怀孕妇女的生物样品中选自表1至63中所列的生物标志物的N种生物标志物中的每一种的可测量特征,并分析所述可测量特征以确定所述怀孕妇女中的早产概率。如本文所公开的,可测量特征包括选自表1至63中所列的生物标志物的所述N种生物标志物的每一种的片段或衍生物。在所公开的方法的一些实施方式中,检测可测量特征包括对得自所述怀孕妇女的生物样品中选自表1至63中所列的生物标志物的N种生物标志物的每一种、它们的组合或部分和/或衍生物的量进行定量分析。
本发明还提供了预测GAB的方法,所述方法包括检测得自怀孕妇女的生物样品中选自表1至63中所列的生物标志物的N种生物标志物中的每一种的可测量特征,并分析所述可测量特征以预测GAB。
本发明还提供了预测GAB的方法,所述方法包括:(a)在得自怀孕妇女的生物样品中对选自表1至63中所列的生物标志物的N种生物标志物的每一种的量进行定量;(b)将所述量乘以预定系数或通过预定系数进行阈值处理,(c)确定怀孕妇女中的预测的GAB,包括将各个产物相加以获得对应于预测的GAB的总风险得分。
本发明还提供了预测怀孕妇女中生产时间的方法,所述方法包括:(a)从所述怀孕妇女获得生物样品;(b)对所述生物样品中选自表1至63中所列的生物标志物的N种生物标志物的每一种的量进行定量;(c)将所述量乘以预定系数或通过预定系数进行阈值处理,(d)确定所述怀孕妇女中预测的GAB,包括将所述各个产物相加以获得对应于所述预测的GAB的总风险得分;和(e)从预测的GAB中减去获得生物样品时估计的胎龄(GA)以预测所述怀孕妇女中的生产时间。对于针对预测生产时间的方法,应理解“生产”是指有或没有羊膜破裂的情况下,自发分娩发作后的生产。
尽管参考确定怀孕妇女中早产概率的方法进行描述和举例说明,但是本发明公开类似地适用于预测GAB的方法、预测足月产的方法、确定怀孕妇女中足月产概率的方法和预测怀孕妇女中生产时间的方法。对于本领域技术人员显而易见的是出于对母体-胎儿健康的考虑,上述方法中的每一种具有具体和大量的应用和益处。
在一些实施方式中,确定怀孕妇女中早产概率的方法和本文所公开的相关方法包括检测N种生物标志物的每一种的可测量特征,其中N选自2至24。在其他实施方式中,确定怀孕妇女中早产概率的所公开的方法和本文所公开的相关方法包括检测至少2种分离的生物标志物的每一种的可测量特征,所述分离的生物标志物选自AFTECCVVASQLR、ELLESYIDGR和ITLPDFTGDLR。在其他实施方式中,确定怀孕妇女中早产概率的所公开的方法和本文所公开的相关方法包括检测至少2种分离的生物标志物的每一种的可测量特征,所述分离的生物标志物选自FLNWIK、FGFGGSTDSGPIR、LLELTGPK、VEHSDLSFSK、IEGNLIFDPNNYLPK、ALVLELAK、TQILEWAAER、DVLLLVHNLPQNLPGYFWYK、SEPRPGVLLR、ITQDAQLK、ALDLSLK、WWGGQPLWITATK和LSETNR。
在其他实施方式中,确定怀孕妇女中早产概率的所公开的方法和本文所公开的相关方法包括检测至少2种分离的生物标志物的每一种可测量特征,所述分离的生物标志物选自表50中所述的生物标志物和表52中所述的生物标志物。
在其他实施方式中,确定怀孕妇女中早产概率的方法和本文所公开的相关方法包括检测至少2种分离的生物标志物的每一种的可测量特征,所述分离的生物标志物选自脂多糖-结合蛋白(LBP)、凝血酶原(THRB)、补体组分C5(C5或CO5)、纤溶酶原(PLMN)和补体组分C8γ链(C8G或CO8G)。
在其他实施方式中,确定怀孕妇女中早产概率的方法和本文所公开的相关方法包括检测至少2种分离的生物标志物的每一种的可测量特征,所述分离的生物标志物选自α-1B-糖蛋白(A1BG)、含有解联蛋白和金属蛋白酶结构域的蛋白12(ADA12)、脱脂蛋白B-100(APOB)、β-2-微球蛋白(B2MG)、CCAAT/增强子-结合蛋白α/β(HP8肽)、结合皮质甾类球蛋白(CBG)、补体组分C6,内皮糖蛋白(Endoglin)(EGLN)、核苷酸内焦磷酸酶/磷酸二酯酶家族成员2(ENPP2)、凝血因子VII(FA7)、透明质酸酯-结合蛋白2(HABP2)、妊娠特异性-β-1-糖蛋白9(PSG9)、抑制素βE链(INHBE)。
在其他实施方式中,确定怀孕妇女中早产概率的所公开的方法和本文所公开的相关方法包括检测至少2种分离的生物标志物的每一种的可测量特征,所述分离的生物标志物选自脂多糖-结合蛋白(LBP)、凝血酶原(THRB)、补体组分C5(C5或CO5)、纤溶酶原(PLMN)、补体组分C8γ链(C8G或CO8G),补体组分1,q亚组分,B链(C1QB)、纤维蛋白原β链(FIBB或FIB)、C-反应蛋白(CRP)、内源性-α-胰蛋白酶抑制剂重链H4(ITIH4)、绒毛膜生长催乳激素(CSH)和血管紧张素原(ANG或ANGT)。
在其他实施方式中,确定怀孕妇女中早产概率的所公开的方法和本文所公开的相关方法包括检测至少2种分离的生物标志物的每一种的可测量特征,所述分离的生物标志物选自α-1B-糖蛋白(A1BG)、含有解联蛋白和金属蛋白酶结构域的蛋白12(ADA12)、脱脂蛋白B-100(APOB)、β-2-微球蛋白(B2MG)、CCAAT/增强子-结合蛋白α/β(HP8肽)、结合皮质甾类球蛋白(CBG)、补体组分C6,内皮糖蛋白(Endoglin)(EGLN)、核苷酸内焦磷酸酶/磷酸二酯酶家族成员2(ENPP2)、凝血因子VII(FA7)、透明质酸酯-结合蛋白2(HABP2)、妊娠特异性-β-1-糖蛋白9(PSG9)、抑制素βE链(INHBE)
在其他实施方式中,确定怀孕妇女中早产概率的所公开的方法和本文所公开的相关方法包括检测至少2种分离的生物标志物的每一种的可测量特征,所述分离的生物标志物选自α-1B-糖蛋白(A1BG)、含有解联蛋白和金属蛋白酶结构域的蛋白12(ADA12)、脱脂蛋白B-100(APOB)、β-2-微球蛋白(B2MG)、CCAAT/增强子-结合蛋白α/β(HP8肽)、结合皮质甾类球蛋白(CBG)、补体组分C6,内皮糖蛋白(Endoglin)(EGLN)、核苷酸内焦磷酸酶/磷酸二酯酶家族成员2(ENPP2)、凝血因子VII(FA7)、透明质酸酯-结合蛋白2(HABP2)、妊娠特异性-β-1-糖蛋白9(PSG9)、抑制素βE链(INHBE)。
在其他实施方式中,确定怀孕妇女中早产概率的所公开的方法和本文所公开的相关方法包括检测至少2种分离的生物标志物的每一种可测量特征,所述分离的生物标志物选自表51中所述的生物标志物和表53中所述的生物标志物。
在其他实施方式中,确定怀孕妇女中早产概率的方法还包括检测与早产有关的一种或多种风险指征的可测量特征。在其他实施方式中,所述风险征候选自先前的低出生体重或早产分娩、多次在第2个三个月中自发性流产、先前在第1个三个月中人工流产、家族和存在于两代人之间的因素、不育史、未孕、胎盘异常、宫颈和子宫异常、妊娠期出血、宫内生长受限、宫内己烯雌酚暴露、多次妊娠、婴儿性别(infant sex)、身材矮小、低妊娠前体重、体重指数低或高、糖尿病、高血压、泌尿生殖器感染。
“可测量特征”是可以确定并且与受试者中早产概率相关的任何性质、特性或方面。术语还包括可以确定并且与GAB的预测、足月产的预测或怀孕妇女中生产时间的预测有关的任何性质、特性或方面。对于生物标志物,这些可测量特征可以包括(例如)生物样品中生物标志物或其片段的存在、不存在或浓度、改变的构,如(例如)翻译后修饰的存在或量,如生物标志物氨基酸序列上一个或多个位置处的氧化,或(例如)与正常对照受试者中生物标志物的构象相比,改变的构象的存在,和/或作为不止一个生物标志物的谱的一部分的生物标志物的存在、量或改变的结构。除生物标志物之外,可测量特征还可以包括风险指征,其包括(例如)母体特性、年龄、人种、种族、病史、过往妊娠史和婚育史。对于风险指征,可测量特征可以包括(例如)先前的低出生体重或早产分娩、多次在第2个三个月中自发性流产、先前在第1个三个月中人工流产、家族和存在于两代人之间的因素、不育史、未孕、胎盘异常、宫颈和子宫异常、宫颈长度测量短、妊娠期出血、宫内生长受限、宫内己烯雌酚暴露、多次妊娠、婴儿性别(infant sex)、身材矮小、低妊娠前体重/低体重指数、糖尿病、高血压、泌尿生殖器感染、甲状腺功能减退、哮喘、低学历、吸烟、使用毒品和饮酒。
在确定怀孕妇女中早产概率的公开的方法的一些实施方式中,基于选自表1至63中所列的生物标志物的N种生物标志物的每一种的定量分析的量计算怀孕妇女中的早产概率。在一些实施方式中,用于确定早产概率的所公开的方法包括使用质谱、捕获试剂或其组合检测和/或定量分析一种或多种生物标志物。
在一些实施方式中,确定怀孕妇女中早产概率的所公开的方法包括提供包含表1至63中所列的N种生物标志物的生物标志物组的初始步骤。在其他实施方式中,确定怀孕妇女中早产概率的所公开的方法包括提供来自怀孕妇女的生物样品的初始步骤。
在一些实施方式中,确定怀孕妇女中早产概率的所公开的方法包括向保健提供者传达所述概率。所公开的预测GAB的方法、预测足月产的方法、确定怀孕妇女中足月产概率的方法和预测怀孕妇女中生产时间的方法类似地包括向保健提供者传达所述概率。如上所述,尽管参考确定怀孕妇女中早产概率进行描述和举例说明,但是在整个发明公开中描述的所有实施方式类似地适用于预测GAB的方法、预测足月产的方法、确定怀孕妇女中足月产概率的方法和预测怀孕妇女中生产时间的方法。具体地,在本发明申请中,明确参考用于早产的方法所列举的生物标志物和组还可以用于预测GAB的方法、预测足月产的方法、确定怀孕妇女中足月产概率的方法和预测怀孕妇女中生产时间的方法。对于本领域技术人员显而易见的是出于对母体-胎儿健康的考虑,上述方法中的每一种具有具体和大量的应用和益处。
在其他实施方式中,传达通知对怀孕妇女的后续治疗决策。在一些实施方式中,确定怀孕妇女中早产概率的方法包括将所述概率表示为风险得分的其他特征。
如本文所使用的,术语“风险得分”是指可以基于得自怀孕妇女的生物样品中一种或多种生物标志物的量与代表从得自怀孕妇女的随机混合的生物样品计算的一种或多种生物标志物的平均量的标准或参考得分相比较来分配得分。由于在整个妊娠期间,生物标志物的水平可能不是固定的,因此必需对应于采集样品时怀孕妇女的妊娠时间点来获得标准或参考得分。可以预先确定标准或参考得分并建立预测模型,从而比较是间接的,而不是每次对受试者确定概率时实际进行的。风险得分可以是标准(例如,数值)或者阈值(例如,图上的线)。风险得分值相关于根据得自怀孕妇女的随机混合的生物样品计算的一种或多种生物标志物的平均量上下偏差。在某些实施方式中,如果风险得分大于标准或参考风险得分,则怀孕妇女可以具有提高的早产可能。在一些实施方式中,怀孕妇女风险得分的大小或其超过参考风险得分的量可以作为怀孕妇女的风险水平的指示或与之相关。
在本发明的背景中,术语“生物样品”包括采集自怀孕妇女并且含有表1至63中所列的一种或多种生物标志物的任何样品。在本发明的背景中,适合的样品包括(例如)血液、血浆、血清、羊膜水、阴道分泌物、唾液和尿。在一些实施方式中,所述生物样品选自全血、血浆和血清。在具体的实施方式中,所述生物样品是血清。如本领域技术人员将理解的,生物样品可以包括血液的任何部分或组分,无限制地,T细胞、单核细胞、嗜中性白细胞、红细胞、血小板和微囊,如外来体和外来体样微囊。在具体的实施方式中,所述生物样品是血清。
早产是指在小于37完整周的胎龄分娩或生产。已经建立了其他常用的早产子类,并将其表示为适度早产(在妊娠的第33至36周生产)、过度早产(在<妊娠的第33周生产)和严重早产(在<妊娠的第28周生产)。对于本文所公开的方法,本领域技术人员将理解可以在实践本文所公开的方法中调整表示早产和足月产的截止时间以及表示早产子类的截止时间,例如,以使特定健康益处最大化。应进一步理解这些调整在本领域技术人员的技术组合范围内,并涵盖在本文所公开的本发明的范围内。胎龄是胎儿发育程度和胎儿生产准备程度的代表。胎龄通常定义为最后一次正常月经至生产日期之间的时间长度。然而,产科测量和超声估计也可以辅助估计胎龄。早产通常被分为两个不同的亚组。一个是自发早产,它是在早产分娩或早产过早羊膜破裂的自发发生后发生的那些,不考虑后续催产或剖腹产。第二个是人工早产(indicated preterm births),它是对于妇女的护理人员确定威胁母体和/或胎儿的健康或生命的一种或多种条件,在引产或剖腹产后发生的那些。在一些实施方式中,本文所公开的方法涉及确定自发早产的概率。在其他实施方式中,本文所公开的方法涉及预测妊娠期生产。
如本文所使用的,术语“估计的胎龄”或“估计的GA”是指基于最后一次正常月经的日期和其他产科测量、超声估计或其他临床参数(其无限制地包括前段中所述的那些)确定的GA。相反,术语“预测的生产时的胎龄”或“预测的GAB”是指基于如本文所公开的本发明所述的方法确定的GAB。如本文所使用的,“足月产”是指在等于或大于37完整周的胎龄的生产。
在一些实施方式中,在采集生物样品时,怀孕妇女在妊娠的第17至28周之间。在其他实施方式中,在采集生物样品时,怀孕妇女在妊娠的第16至29周之间,第17至28周之间,第18至27周之间,第19至26周之间,第20至25周之间,第21至24周之间或第22至23周之间。在其他实施方式中,在采集生物样品时,怀孕妇女在妊娠的第17至22周之间,第16至22周之间,第22至25周之间,第13至25周之间,第26至28周之间或第26至29周之间。因此,采集生物样品时怀孕妇女的胎龄可以为15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30周。
在所主张的方法的一些实施方式中,可测量特征包括选自表1至63中所列的生物标志物的每个N种生物标志物的每一种的片段或衍生物。在所主张的方法的其他实施方式中,检测可测量特征包括对得自所述怀孕妇女的生物样品中选自表1至63中所列的生物标志物的N种生物标志物的每一种、它们的组合或部分和/或衍生物的量进行定量分析。
如本文所使用的,术语“量”或“水平”是指在生物样品和/或对照中可检测或可测量的生物标志物的量。生物标志物的量可以是(例如)多肽的量、核酸的量或者片段或替代物的量。作为另外一种选择,术语可以包括它们的组合。术语生物标志物的“量”或“水平”是生物标志物的可测量特征。
在一些实施方式中,对怀孕妇女中早产概率的计算基于选自表1至63所列的生物标志物的N种生物标志物的每一种的定量分析的量。可以在本文中使用任何现有的,可用的或常规的分离、检测和定量分析方法来测量样品中生物标志物、肽、多肽、蛋白质和/或其片段和任选地一种或多种其他生物标志物或其片段的存在或不存在(例如,读数为存在相对于不存在;或者可检测的量相对于不可检测的量)和/或量(例如,读数是绝对或相对量,如(例如)绝对或相对浓度)。在一些实施方式中,一种或多种生物标志物的检测和/或定量分析包括使用捕获试剂的测定。在其他实施方式中,所述捕获试剂是抗体、抗体片段、核酸基蛋白结合试剂、小分子或其变体。在其他实施方式中,所述测定选自酶免疫测定(EIA)、酶联免疫吸附测定(ELISA)和放射免疫测定(RIA)。在一些实施方式中,一种或多种生物标志物的检测和/或定量分析还包括质谱分析法(MS)。在其他实施方式中,所述质谱分析法是免疫共沉淀-质谱分析法(co-IP MS),其中免疫共沉淀是适合于完整蛋白质络合物分离的技术,在它之后进行质谱分析。
如本文所使用的,术语“质谱”是指能够使分析物挥发/电离以形成气相离子并确定它们的绝对或相对分子量的装置。适合的挥发/电离方法是基质辅助激光解吸电离(MALDI)、电喷雾、激光/光、热、电、雾化/喷雾等,或它们的组合。适合的质谱形式包括(但不限于)离子阱仪器、四极仪器、静电和磁性扇形场仪器、飞行时间仪器、飞行时间串联质谱仪(TOF MS/MS)、傅里叶变换质谱仪、Orbitraps以及由这些类型的质谱分析仪的不同组合组成的混合仪器。反过来,这些仪器可以与多种其他仪器连接,所述其他仪器分离样品(例如,液相色谱或基于化学或生物性质的固相吸附技术)并且使样品电离以引入到质谱仪中,其包括基质辅助激光解吸(MALDI)、电喷雾或纳喷雾电离(ESI)或它们的组合。
通常,可以在本文所公开的方法中使用任何质谱(MS)技术,所述技术可以提供肽质量的精确信息,并且优选地还提供所选肽的片段和/或(部分)氨基酸序列的精确信息(例如,在串联质谱,MS/MS;或在源后衰变,TOF MS中)。适合的肽MS和MS/MS技术和系统本身是熟知的(参见,例如,Methods in Molecular Biology,vol.146:“Mass Spectrometry ofProteins and Peptides”,Chapman主编,Humana Press 2000;Biemann 1990.MethodsEnzymol 193:455-79;或Methods in Enzymology,vol.402:“Biological MassSpectrometry”,Burlingame主编,Academic Press 2005)并且可以在实践本文所公开的方法中使用。因此,在一些实施方式中,所公开的方法包括实施定量MS以测量一种或多种生物标志物。这些定量分析方法可以以自动(Villanueva等人,Nature Protocols(2006)1(2):880-891)或半自动形式进行。在具体的实施方式中,MS可以可操作地连接至液相色谱装置(LC-MS/MS或LC-MS)或者气相色谱装置(GC-MS或GC-MS/MS)。在上下文中有用的其他方法包含同位素亲合标签(isotope-coded affinity tag)(ICAT)、串联质谱标签(TMT)或通过细胞培养物中氨基酸的稳定同位素标记(SILAC),然后进行色谱和MS/MS。
如本文所使用的,术语“多次反应监控(MRM)”或“选择反应监控(SRM)”是指对于低丰度分析物定量分析特别有用的基于MS的定量分析方法。在SRM实验中,通过三重四极仪的两个质量过滤器选择预先确定的前体离子以及一个或多个其片段并随时间监控精确定量分析。可以通过在不同前体/碎片对之间快速转换以实施MRM实验,在相同实验内在色谱时间尺度上测量多个SRM前体和碎片离子对。一系列跃迁(前体/碎片离子对)与靶标分析物(例如,肽或小分子,如化学个体、类固醇、激素)的保留时间的组合可以构成确定的测定。可以在单次LC-MS实验期间定量分析大量分析物。与MRM或SRM有关的术语“经调度”或“动态的”是指测定的变化,其中在预期保留时间周围的时窗中仅获得特定分析物的跃迁,从而显著提高了可以在单次LC-MS实验中检测和定量分析的分析物的数目并有助于测试的选择性,这是因为保留时间是依赖于分析物物理性质的性质。还可以以不止一个跃迁来监控单个分析物。最后,在测定中可以包括对应于所关心的分析物的标准品(例如,相同的氨基酸序列),但差别在于包含了稳定同位素。可以将稳定同位素标准品(SIS)以精确水平引入所述测定并用于定量分析相应的未知分析物。通过未知分析物与其相应SIS的共洗脱以及它们的跃迁性质(例如,未知物两种跃迁水平的比值和其相应SIS的两种跃迁的比值的相似性),促进了额外的特异性水平。
适合于生物标志物肽分析的质谱测定、仪器和系统可以无限制地包括基质辅助激光解吸/电离飞行时间(MALDI-TOF)MS;MALDI-TOF源后衰变(PSD);MALDI TOF/TOF;表面增强激光解吸/电离飞行时间质谱(SELDI-TOF)MS;电喷雾电离质谱(ESI-MS);ESI-MS/MS;ESI-MS/(MS)n(n是大于零的整数);ESI 3D或线性(2D)离子阱MS;ESI三重四级MS;ESI四极正交TOF(Q-TOF);ESI傅里叶变换MS系统;硅上解吸/电离(DIOS);次级离子质谱法(SIMS);大气压化学电离质谱法(APCI-MS);APCI-MS/MS;APCI-(MS)n;离子迁移光谱(IMS);电感耦合等离子体质谱(ICP-MS)、大气压光化电离质谱仪(APPI-MS);APPI-MS/MS;和APPI-(MS)n。可以使用在本领域中建立的方式实现串联MS(MS/MS)布置中的肽离子碎片化,如(例如)碰撞诱导解离(CID)。如本文所述,通过质谱的生物标志物的检测与定量分析可以包括多次反应监控(MRM),如Kuhn等人Proteomics 4:1175-86(2004)中所述等。在LC-MS/MS分析期间,经调度的多次反应监控(经调度的MRM)模式采集提高了肽定量分析的灵敏度与准确度。Anderson and Hunter,Molecular and Cellular Proteomics5(4):573(2006)。如本文所述,基于质谱的测定可以有利地与上游肽或蛋白质分离或分馏方法组合,如(例如)与色谱和本文以下所述的其他方法组合。如本文进一步所述的,鸟枪法定量蛋白质组学可以与基于SRM/MRM的测定组合以用于早产预后生物标志物的高通量鉴别和验证。
本领域技术人员将理解一些方法可以用于确定生物标志物的量,其包括质谱法,如MS/MS、LC-MS/MS、多次反应监控(MRM)或SRM以及产物离子监控(PIM)并且还包括基于抗体的方法,如免疫测定,如免疫印迹、酶联免疫吸附测定(ELISA)、免疫沉淀、免疫组织化学、免疫荧光、放射免疫测定、斑点印迹和FACS。因此,在一些实施方式中,确定至少一种生物标志物的水平包括使用免疫测定和/或质谱法。在其他实施方式中,质谱法选自MS、MS/MS、LC-MS/MS、SRM、PIM以及本领域中已知的其他这类方法。在其他实施方式中,LC-MS/MS还包括1DLC-MS/MS、2D LC-MS/MS或3D LC-MS/MS。免疫测定技术和规程通常是本领域技术人员所知的(Price and Newman,Principles and Practice of Immunoassay,2ndEdition,Grove’sDictionaries,1997;and Gosling,Immunoassays:A Practical Approach,OxfordUniversity Press,2000)。可以使用多种免疫测定技术,包含竞争和非竞争免疫测定(Self等人,Curr.Opin.Biotechnol.,7:60-65(1996))。
在其他实施方式中,免疫测定选自免疫印迹、ELISA、免疫沉淀、免疫组织化学、免疫荧光、放射免疫测定(RIA)、斑点印迹和FACS。在某些实施方式中,所述免疫测定为ELISA。在其他实施方式中,所述ELISA是直接ELISA(酶联免疫吸附测定)、间接ELISA、夹心ELISA、竞争ELISA、多通道ELISA、ELISPOT技术及其他本领域中已知的类似技术。这些免疫测定方法的原理在本领域中是已知,例如John R.Crowther,The ELISA Guidebook,第1版,HumanaPress 2000,ISBN 0896037282。通常,使用抗体进行ELISA,但是它们可以使用与本发明的一种或多种生物标志物特异性结合的并且可以检测的任何捕获试剂进行。多通道ELISA使得能够在单个隔室(例如,微孔板的孔)内同时检测两种或更多种分析物,这通常是在多个阵列位置完成的(Nielsen and Geierstanger 2004.J Immunol Methods 290:107-20(2004)和Ling等人.2007.Expert Rev Mol Diagn 7:87-98(2007))。
在一些实施方式中,放射免疫测定(RIA)可以在本发明所述的方法中用于检测一种或多种生物标志物。RIA是本领域熟知的基于竞争的测定,并且包括将已知量的放射性标记的(例如,125I或131I标记的)靶标分析物与所述分析物的特异性抗体混合,然后加入来自样品的未标记的分析物并测量替换的标记的分析物的量(参见,例如,An Introduction to Radioimmunoassay and Related Techniques,Chard T主编,Elsevier Science 1995,ISBN 0444821198)。
在本发明所述的方法中,可以在本文所述的测定中使用可检测的标记物以用于生物标志物的直接或间接检测。可以使用多种可检测的标记物,并基于所需的灵敏度、与抗体缀合的容易性、稳定性要求和可用的仪器以及处理规定选择标记物。本领域技术人员熟悉基于本发明所述的方法中生物标志物的测定检测的适合的可检测标记物的选择。适合的可检测标记物包括(但不限于)荧光染料(例如,荧光素、异硫氰酸荧光素(FITC)、OregonGreenTM、罗丹明、得克萨斯红、四若丹明异硫氰酸酯(tetrarhodimine isothiocynate,TRITC)、Cy3、Cy5等)、荧光标志物(例如,绿色荧光蛋白(GFP)、藻红蛋白等)、酶(例如,荧光素酶、辣根过氧化物酶、碱性磷酸酶等)、纳米颗粒、生物素、洋地黄毒苷(digoxigenin)、金属等。
对于质谱基分析,使用同位素试剂的差异标记,例如,同位素编码的亲合标签(ICAT)或使用同量异序标记试剂的近期变化、iTRAQ(Applied Biosystems,Foster City,Calif.)或串联质谱标签,TMT(Thermo Scientific,Rockford,IL),然后进行多维液相色谱(LC)和串联质谱(MS/MS)分析可以在本发明方法的实践中提供其他方法。
使用化学发光抗体的化学发光测定可以用于蛋白水平的灵敏、非放射性检测。用荧色物标记的抗体也可以是适合的。荧色物的实例无限制地包括DAPI、荧光素、Hoechst33258、R-藻青蛋白、B-藻红蛋白、R-藻红蛋白、罗丹明、得克萨斯红和lissamine。间接标记物包括在本领域中熟知的多种酶,如辣根过氧化物酶(HRP)、碱性磷酸酶(AP)、β-半乳糖苷酶、尿素酶等。使用辣根过氧化物酶、碱性磷酸酶、β-半乳糖苷酶的适合底物的检测系统在本领域中是熟知的。
可以分析直接或间接标记物的信号,例如,使用分光光度计检测来自发色底物的颜色;使用辐射计数器检测辐射,如用于检测125I的γ计数器;或者使用荧光计检测在存在特定波长的光的情况下的荧光。对于酶联抗体的检测,可以根据生产商的说明书,使用分光光度计,如EMAX酶标仪(Molecular Devices;Menlo Park,Calif.)进行定量分析。如果需要,用于实践本发明的测定可以是自动的或机械性进行的,并且可以同时检测来自多个样品的信号。
在一些实施方式中,本文所述的方法包括使用质谱(MS)定量分析生物标志物。在其他实施方式中,质谱可以是液相色谱-质谱(LC-MS)、多次反应监控(MRM)或选择反应监控(SRM)。在其他实施方式中,MRM或SRM还可以包括经调度MRM或经调度SRM。
如上所述,还可以在本发明所述方法的实践中使用色谱法。色谱法包括用于分离化学物质的方法,并且通常涉及以下过程:通过移动液体或气体流(“流动相”)携带分析物的混合物并当它们流过或在固定液或固相(“固定相”)上流动时由于分析物在流动相和所述固定相之间的差异分配而分成不同组分。所述固定相通常可以是细碎的固体、过滤材料片层或位于固体表面上的液体薄膜等。本领域技术人员很好地认识到色谱法是适合于生物来源的化合物(如,例如,氨基酸、蛋白质、蛋白质或肽片段等)分离的技术。
色谱可以柱色谱(即其中固定相沉积或装填成柱),优选地,液相色谱,并且更优选地,高效液相色谱(HPLC)或超高效液相色谱(UHPLC)。色谱法的详细资料在本领域中是熟知的(Bidlingmeyer,Practical HPLC Methodology and Applications,John Wiley&SonsInc.,1993)。色谱的示例性类型无限制地包括高效液体色谱(HPLC)、UHPLC、正相HPLC(NP-HPLC)、反相HPLC(RP-HPLC)、离子交换色谱(IEC),如阳离子或阴离子交换色谱法、亲水相互作用色谱(HILIC)、疏水性相互作用色谱(HIC)、尺寸排阻层析(SEC),包括凝胶过滤色谱或凝胶渗透色谱、色谱焦聚、亲和色谱法,如免疫亲和、固定化金属亲和色谱等。可以将色谱(包括一维、二维或多维色谱)与其他肽分析方法(如,例如,如本说明书其他处描述的下游质谱分析)一起用作肽分离方法。
可以任选地与任何上述分析方法一起使用其他肽或多肽分离、鉴别或定量分析方法以用于在本发明公开中测量生物标志物。这些方法无限制地包括化学提取分配、等电点聚焦(IEF),包括毛细管等电点聚焦(CIEF)、毛细管等速电泳(CITP)、毛细管电色谱(CEC)等、一维聚丙烯酰胺凝胶电泳(PAGE)、二维聚丙烯酰胺凝胶电泳(2D-PAGE)、毛细管凝胶电泳(CGE)、毛细管区带电泳(CZE)、胶束电动色谱(MEKC),自由流动电泳(FFE)等。
在本发明的背景中,术语“捕获试剂”是指可以特异性结合至靶标,具体地生物标志物的化合物。该术语包括抗体、抗体片段、核酸基蛋白结合试剂(例如,适体、慢解离速率修饰的适体(SOMAmerTM))、蛋白捕获试剂、天然配体(即用于其受体的激素或反之)、小分子或其变体。
可以配置捕获试剂以特异性结合至靶标,具体地生物标志物。捕获试剂可以包括(但不限于)有机分子,如多肽、多核苷酸以及技术人员可鉴别的其他非聚合物分子。在本文所公开的实施方式中,捕获试剂包括可以用于检测、纯化、分离或富集靶标,具体地生物标志物的任何试剂。任何本领域已知的亲合捕获技术可以用于选择性分离和富集/浓缩作为在所公开的方法中使用的生物培养基的复杂混合物的成分的生物标志物。
可以使用本领域中已知的任何适合的方法制备特异性结合至生物标志物的抗体捕获试剂。参见,例如,Coligan,Current Protocols in Immunology(1991);Harlow&Lane,Antibodies:A Laboratory Manual(1988);Goding,Monoclonal Antibodies:Principles and Practice(第2版,1986)。抗体捕获试剂可以是任何免疫球蛋白或其衍生物,无论是天然的或者完全或部分合成生产的。维持特异结合能力的它的所有的衍生物也包含在该术语中。抗体捕获试剂具有与免疫球蛋白结合域同源或基本同源的并且可以来源于天然来源或者部分或完全合成产生的结合域。抗体捕获试剂可以是单克隆抗体或多克隆抗体。在一些实施方式中,抗体是单链抗体。本领域那些技术人员将理解抗体可以以任何多种形式提供,其包括(例如)人源化、部分人源化、嵌合、嵌合人源化等。抗体捕获试剂可以是抗体片段,其包括(但不限于)Fab、Fab'、F(ab')2、scFv、Fv、dsFv双链抗体和Fd片段。可以通过任何方式产生抗体捕获试剂。例如,抗体捕获试剂可以通过完整抗体的碎片化来酶促或化学产生和/或它可以从编码所述部分抗体序列的基因重组产生。抗体捕获试剂可以包含单链抗体片段。作为另外一种选择或另外,抗体捕获试剂可以包含(例如)通过二硫键连接在一起的多条链;和得自这些分子的任何功能性片段,其中这些片段保留了亲本抗体分子的特异性结合性质。由于它们作为完整分子的功能性组分的较小尺寸,对于在某些免疫化学技术和实验应用中的使用,抗体片段可以提供优于完整抗体的优势。
对实践本发明有用的适合的捕获试剂还包括适体。适体是可以通过唯一的立体(3-D)结构特异性地结合至它们的靶标的寡核苷酸序列。适体可以包括任何适合数目的核苷酸,并且不同的适体可以具有相同或不同数目的核苷酸。适体可以是DNA或RNA或化学修饰的核酸,并且可以是单链、双链或含有双链区的,并且可以包括更高的有序结构。适体还可以是光适体,其中在适体中包含光反应性或化学反应性官能团以使其与其相应靶标共价连接。适体捕获试剂的使用可以包括特异性结合相同生物标志物的两种或更多种适体的使用。适体可以包括标签。可以使用任何已知的方法鉴别适体,包括SELEX(指数富集配体系统进化)法。一旦鉴别,则可以根据任何已知的方法制备或合成适体,包括化学合成法和酶促合成法,并且可以在用于生物标志物检测的多种应用中使用。Liu等人,Curr Med Chem.18(27):4117-25(2011)。在本发明所述方法的实践中有用的捕获试剂还包括本领域中已知具有改善的解离速率特征的SOMAmers(慢解离速率修饰的适体)。Brody等人,J Mol Biol.422(5):595-606(2012)。可以使用任何已知的方法,包括SELEX法产生SOMAmer。
本领域技术人员应理解可以在分析前修饰生物标志物以改善它们的分辨率或确定它们的身份。例如,可以在分析前对生物标志物进行蛋白消化。可以使用任何蛋白酶。可能将生物标志物切割成不连续个数的片段的蛋白酶(如胰蛋白酶)是特别有用的。由消化产生的片段用作生物标志物的指纹,借此使得能够间接检测它们。这在生物标志物具有可能与所讨论的生物标志物混淆的类似的分子量的情况下是特别有用的。另外,蛋白水解碎片化对高分子量生物标志物是有用的,这是因为较小的生物标志物更易于通过质谱分辨。在另一个实例中,可以修饰生物标志物以改善检测分辨率。例如,神经氨糖酸苷酶可以用于从糖蛋白除去末端唾液酸残基以改善与阴离子吸附剂的结合和改善检测分辨率。在另一个实例中,可以通过连接具有特定分子量的特异性结合至分子生物标志物的标签来修饰生物标志物,从而进一步区分它们。任选地,在检测这些修饰的生物标志物后,可以通过在蛋白质数据库(例如,SwissProt)中将修饰的生物标志物的物理和化学特性进行匹配来进一步确定生物标志物的身份。
在本领域中还将认识到可以将样品中的生物标志物捕获在用于检测的基底上。常规基底包括随后用于探索蛋白质存在的抗体涂覆的96-孔板或硝化纤维素膜。作为另外一种选择,可以将连接至微球、微粒、微珠、珠或其他颗粒的蛋白结合分子用于生物标志物的捕获和检测。蛋白结合分子可以是连接到颗粒表面的抗体、肽、类肽、适体、小分子配体或其他蛋白结合捕获试剂。每个蛋白结合分子可以包括唯一的可检测标记物,编码所述标记物从而使它可以不同于连接至其他蛋白结合分子的可检测标记物,从而使得能够在多通道测定中检测生物标志物。实例包括(但不限于)具有已知荧光强度的颜色编码的微球(参见,例如,由Luminex(Austin,Tex.)通过xMAP技术生产的微球);含有量子点纳米晶体的微球,例如,其具有不同的量子点颜色的比值和组合(例如,由Life Technologies(Carlsbad,Calif.)生产的Qdot纳米晶体);玻璃涂覆的金属纳米颗粒(参见,例如,由NanoplexTechnologies,Inc.(Mountain View,Calif.)生产的SERSnanotags);条型码材料(参见,例如,亚微米尺寸的条纹金属棒,如由Nanoplex Technologies,Inc.生产的Nanobarcodes),具有彩色条码的编码微粒(参见,例如,由Vitra Bioscience,vitrabio.com生产的cellcard),具有数字全息编码图像的玻璃微粒(参见,例如,由Illumina(San Diego,Calif.)生产的CyVera微珠);化学发光染料、染料化合物的组合;和具有可检测的不同尺寸的珠。
在另一个方面,可以将生物芯片用于本发明的生物标志物的捕获和检测。在本领域中,多种蛋白质生物芯片是已知的。这些包括(例如)通过Packard BioScience Company(Meriden Conn.)、Zyomyx(Hayward,Calif.)和Phylos(Lexington,Mass.)生产的蛋白质生物芯片。一般地,蛋白质生物芯片包含具有表面的基底。将捕获试剂或吸附剂连接至基底表面。通常,所述表面包括多个可寻址地址,每个地址具有在此结合的捕获试剂。所述捕获试剂可以是生物分子,如多肽或核酸,其以特异性方式捕获其他生物标志物。作为另外一种选择,捕获试剂可以是色谱材料,如阴离子交换材料或亲水材料。蛋白质生物芯片的实例在本领域中是熟知的。
生物样品中mRNA的测量可以用作生物样品中相应蛋白质生物标志物的水平的检测的替代。因此,还可以通过检测适当的RNA来检测本文所述的任何生物标志物或生物标志物组。可以通过反转录定量聚合酶链反应(RT-PCR,然后qPCR)来测量mRNA的水平。使用RT-PCR从mRNA产生cDNA。随着DNA扩增过程的进行,可以在qPCR测定中使用cDNA以产生荧光。与标准曲线相比,qPCR可以产生绝对测量,如单位细胞的mRNA拷贝数。RNA印迹、微阵列、侵入测定(Invader assay)和与毛细管电泳结合的RT-PCR均已用于测量样品中mRNA的表达水平。参见Gene Expression Profiling:Methods and Protocols,Richard A.Shimkets,editor,Humana Press,2004。
本文所公开的一些实施方式涉及确定怀孕妇女中早产概率的诊断和预后方法。一种或多种生物标志物的表达水平的检测和/或生物标志物比值的确定可以用于确定怀孕妇女中的早产概率。可以将这些检测方法(例如)用于状况的早期诊断以确定受试者是否对早产易感,以监控早产的发展或者治疗规程的进展,以评价早产的严重性,以预测早产结局和/或恢复或足月产的前景或者以帮助确定适合的早产治疗。
可以无限制地通过如上所述的方法以及本领域中已知的任何其他方法确定生物样品中生物标志物的量。然后,将因此所获得的定量分析数据进行分析分类法。在该方法中,根据算法调控原始数据,其中已通过训练数据组对算法进行预定义,例如,如本文所提供的实例中所述的。算法可以使用本文所提供的训练数据组,或者可以使用本文所提供的指导以通过不同的数据组产生算法。
在一些实施方式中,分析可测量特征来确定怀孕妇女中早产概率包括预测模型的使用。在其他实施方式中,分析可测量特征来确定怀孕妇女中早产概率包括将所述可测量特征与参考特征相比较。如本领域技术人员可以理解的,这种比较可以是与参考特征的直接比较或者是其中已将参考特征引入预测模型的间接比较。在其他实施方式中,分析可测量特征来确定怀孕妇女中早产概率包括以下中的一种或多种:线性差别分析模型、支持向量机分类算法、回归特征消去模型、微阵列预测分析模型、逻辑回归模型、CART算法、flextree算法、LART算法、随机森林算法、MART算法、机器学习算法、惩罚回归方法及其组合。在具体的实施方式中,所述分析包括逻辑回归。
分析分类法可以使用多种统计分析方法中的任一种以调控定量分析数据并为样品分类做准备。有用的方法的实例包括线性差别分析、回归特征消去、微阵列预测分析、逻辑回归、CART算法、FlexTree算法、LART算法、随机森林算法、MART算法、机器学习算法;等。
为了产生预测GAB的随机森林,本领域技术人员可以考虑一组k位出生时胎龄(GAB)已知的和已测量生产前几周采集的血液样本中N种分析物(转变)的受试者(孕妇)。回归树起始于含有所有受试者的根节点。可以在根节点计算所有受试者的平均GAB。根节点内GAB的变化较高,这是因为存在具有不同GAB的妇女的混合。然后,将根节点划分(分配)为两个分枝,从而每个分枝含有具有类似GAB的妇女。再次计算每个分枝中受试者的平均GAB。每个分枝内的GAB变化将低于根节点中的变化,这是因为每个分枝内的妇女亚组具有比根节点中相对更类似的GAB。通过选择分析物和产生具有类似GAB的分枝的分析物的阈值来产生两个分枝。从所有分析物和阈值的组中选择分析物和阈值,通常在每个节点具有分析物的随机亚组。程序连续递归产生分枝以产生其中受试者具有极类似GAB的叶(终端节点)。每个终端节点中预测的GAB是该终端节点中受试者的平均GAB。该程序产生单一回归树。随机森林可以包括数百或数千个这样的树。
可以根据设置确定样品属于给定分类的概率的阈值的预测模型方法来进行分类。所述概率优选地为至少50%,或至少60%,或至少70%,或至少80%或更高。还可以通过确定所获得的数据集和参考数据集之间的比较是否产生统计学显著差异来进行分类。如果产生,则将获得该数据集的样品分为不属于参考数据集类。相反地,如果该比较不统计学显著地不同于参考数据集,则将获得该数据集的样品分为属于参考数据集类。
可以根据提供具体值或数值范围的质量度量,例如,AUROC(ROC曲线下面积)或准确度来评价模型的预测能力。曲线下面积量度对于比较整个数据范围内分类器的准确度是有用的。具有较大AUC的分类器将具有较大的将未知在两关心组之间正确分类的能力。在一些实施方式中,所需质量阈值是以至少约0.5、至少约0.55、至少约0.6、至少约0.7、至少约0.75、至少约0.8、至少约0.85、至少约0.9、至少约0.95或更高的准确度将样品分类的预测模型。作为替代量度,所需质量阈值可以表示至少约0.7、至少约0.75、至少约0.8、至少约0.85、至少约0.9或更高的AUC将样品分类的预测模型。
如本领域中已知的,可以调整预测模型的相对灵敏度和特异性以有利于选择性度量或灵敏度度量,其中两种度量具有反比关系。根据所进行的测试的具体要求,可以调整上述模型中的限度以提供选择的灵敏度或特异性水平。灵敏度和特异性中的一个或两个可以为至少约0.7、至少约0.75、至少约0.8、至少约0.85、至少约0.9或更高。
开始,可以通过测量每个生物标志物的值来分析原始数据,通常重复三次或多次重复三次。可以调控数据,例如,可以使用标准曲线转化原始数据,并使用三次测量的平均值来计算每位患者的平均值和标准偏差。可以在模型中使用前转化这些值,例如,log-转化,Box-Cox转化(Box and Cox,Royal Stat.Soc.,Series B,26:211-246(1964))。然后,将数据输入到预测模型中,所述模型将根据状况对样品分类。可以将所得信息传达给患者或保健提供者。
为了产生早产预测模型,在训练组中使用稳健数据集,其包括已知对照样品和对应于所关心的早产分类的样品。可以使用公认标准选择样本容量。如以上所讨论的,可以使用不同的统计方法来获得高精度预测模型。实施例2提供了这种分析的实例。
在一个实施方式中,在预测模型的推导中实施分级聚类,其中使用皮尔逊相关性作为簇度量。一种方法是将早产数据集考虑为“监督学习”问题中的“学习样本”。CART是医学应用中的标准(Singer,Recursive Partitioning in the Health Sciences,(1999))并且可以通过以下方式修改:将任何定性特征转化为定量分析特征;按通过用于霍特林T2统计量的样品再使用方法评价的所达到的显著性水平分类;和lasso方法的适合应用。的确,通过在回归质量评价中适当使用Gini分类标准,将预测问题转化为回归问题而不损失预测目标(sight of prediction)。
该方法导致产生了所谓的FlexTree(Huang,Proc.Nat.Acad.Sci.U.S.A101:10529-10534(2004))。在模拟和应用于多种数据形式时,FlexTree运行良好并且对实践所主张的方法是有用的。已开发了软件自动FlexTree。作为另外一种选择,可以使用LARTree或LART(Turnbull(2005)Classification Trees with Subset Analysis Selection by the Lasso,Stanford University)。名称反映了二元树,如CART和FlexTree中;lasso,如所提及的;和通过所谓的LARS对lasso的实施,Efron等人(2004)Annals of Statistics 32:407-451(2004)。另外,参见,Huang等人,Proc.Natl.Acad.Sci.USA.101(29):10529-34(2004)。可以使用的其他分析方法包含逻辑回归。逻辑回归的一种方法:Ruczinski,Journal of Computational and Graphical Statistics 12:475-512(2003)。逻辑回归类似于CART,其中它的分类器可以显示为二元树。不同在于每个节点具有有关特征的布尔语句,它比CART产生的简单“与”语句更常规。
另一种方法是最近缩小形心(nearest shrunken centroid)方法(Tibshirani,Proc.Natl.Acad.Sci.U.S.A 99:6567-72(2002))。该技术是k均值样的,但是具有下述优点:通过缩小簇中心,自动化选择特征(如在lasso中)以集中关注有信息的那些小数目。该方法可获得为PAM软件并被广泛使用。可以使用的两个其他算法集是随机森林(Breiman,Machine Learning 45:5-32(2001))和MART(Hastie,The Elements of Statistical Learning,Springer(2001))。在本领域中,这两种方法已知是“委员会方法”,其涉及对结局“投票”的预测器。
为了提供重要性排序,可以确定假发现率(FDR)。首先,产生一组不同性值的零分布。在一个实施方案中,排列观察到的谱的值以产生偶然获得的相关系数的分布序列,借此产生相关系数的零分布的适当的集(Tusher等人,Proc.Natl.Acad.Sci.U.S.A 98,5116-21(2001))。通过下述获得零分布集:排列所有可用谱的每个谱的值;计算所有谱的配对相关系数;计算该排列的相关系数的概率密度函数;和重复该过程N次,其中N是大数,通常约300。使用N分布,计算其值以给定显著性水平超过从实验观察到的相似性值的分布获得的值(相似性的值)的相关系数值的计数的适当量度(平均值、中值等)。
FDR是预期假显著相关数目(从大于随机数据集中该选择的皮尔逊相关性的相关性估计)与经验数据中大于该选择的皮尔逊相关性的相关数目(显著相关)的比值。该截止相关值可应用于实验谱之间的相关性。使用上述分布,选择显著性的置信水平。这用来确定超出偶然获得的结果的相关系数的最低值。使用该方法,获得正相关、负相关或两者的阈值。使用该阈值,用户可以过滤配对相关系数的观察值并去除不超过阈值的那些。另外,可以获得给定阈值的假阳性率的估计。对于单个“随机相关”分布的每一个,可以找到有多少观察值落在阈值范围之外。该程序提供计数序列。所述序列的平均值和标准偏差提供潜在假阳性的平均数目及其标准偏差。
在替代的分析方法中,截面分析中选择的变量单独用作时间事件分析(生存分析)中的预测器,其中事件是早产的发生,并且无事件受试者可认为是在分娩时检查的。考虑特定妊娠结果(早产事件或无事件),每个患者观察到的随机时长和蛋白质组学及其他特征的选择,分析存活的参数方法可能好于广泛应用的半参数Cox模型。存活的Weibull参数拟合允许风险率是单一性增加、降低或恒定的,并且还具有成比例的风险表现(与Cox模型一样)和加速失败时间表现。可用于获得回归系数及相应函数的近似最大似然评估的所有标准工具在该模型中是可用的。
此外,可以使用Cox模型,特别是因为协变量数目减少至可用lasso管理的大小将显著简化分析,从而使得有可能使用非参数或半参数法预测早产时间。这些统计学工具在本领域中是已知的并且可应用于蛋白质组学数据的所有方式。提供了可容易确定并且具有关于所述怀孕妇女中早产概率和预测的早产事件时间的丰富信息的一组生物标志物、临床和遗传数据。另外,算法提供了有关怀孕妇女中的早产概率的信息。
因此,本领域技术人员将理解可以使用定量或类别变量确定根据本发明的早产概率。例如,在本发明所述的方法的实践中,可以对N种生物标志物的每一种的可测量特征进行分类数据分析以作为二元分类结局确定早产概率。作为另外一种选择,本发明所述的方法可以通过初始计算定量变量,具体地,出生时预测的胎龄来分析N种生物标志物的每一种的可测量特征。随后,出生时预测的胎龄可以用作预测早产风险的基础。通过初始使用定量变量和随后将定量变量转化为类别变量,本发明所述的方法考虑了对可测量特征检测的测量的连续区域。例如,通过预测出生时的胎龄而不是做出早产相对于足月产的二元预报,有可能调整怀孕妇女的治疗。例如,早期预测的出生时的胎龄将导致比预测接近足月的胎龄更密切的产前干预,即监控和治疗。
在预测GAB为j天加或减k天的妇女中,可以将p(PTB)估计为PAPR临床试验(参见实施例1)中预测GAB为j天加或减k天而实际在37周胎龄之前分娩的妇女的比例。一般地,对于预测GAB为j天加或减k天的妇女,将真实出生时的胎龄将小于指定胎龄的概率p(真实GAB<指定GAB)估计为PAPR临床试验中预测GAB为j天加或减k天而实际在指定胎龄之前分娩的妇女的比例。
在预测模型的建立过程中,可以期望选择标志物的亚组,即至少3种、至少4种、至少5种、至少6种标志物,和多至完整的标志物组。通常,将选择提供用于定量样品分析需要的标志物亚组,例如,试剂的可用性、定量分析的方便性等,同时维持高精度预测模型。对用于构建分类模型的一些信息性标志物的选择需要定义性能度量和用户基于该度量定义的产生具有有用预测能力的模型的阈值。例如,所述性能度量可以是AUC、预测的灵敏度和/或特异性以及预测模型的总体准确度。
如本领域技术人员将理解的,分析分类法可以使用多种统计分析方法中的任一种以调控定量数据并为样品分类做准备。有用的方法的实例无限制地包括线性差别分析、回归特征消去、微阵列预测分析、逻辑回归、CART算法、FlexTree算法、LART算法、随机森林算法、MART算法和机器学习算法。
如实施例2所述,在训练模型中使用多种方法。标志物亚组的选择可以是标志物亚组的正向选择或反向选择。可以选择将优化模型性能而不使用所有标志物的标志物数目。定义最佳项目数的一种方法是选择产生具有所需预测能力的模型的项目数(例如,AUC>0.75,或灵敏度/特异性的等价测量),所述预测能力在于使用用于给定算法的任何组合和项目数,与对该度量获得的最大值不超过一个标准偏差。
表1.单变量Cox比例风险分析中用于预测出生时的胎龄的p值小于0.05的跃迁。
跃迁 蛋白质 p-值Cox单变量
ITLPDFTGDLR_624.34_920.4 LBP_HUMAN 0.006
ELLESYIDGR_597.8_710.3 THRB_HUMAN 0.006
TDAPDLPEENQAR_728.34_613.3 CO5_HUMAN 0.007
AFTECCVVASQLR_770.87_574.3 CO5_HUMAN 0.009
SFRPFVPR_335.86_272.2 LBP_HUMAN 0.011
ITLPDFTGDLR_624.34_288.2 LBP_HUMAN 0.012
SFRPFVPR_335.86_635.3 LBP_HUMAN 0.015
ELLESYIDGR_597.8_839.4 THRB_HUMAN 0.018
LEQGENVFLQATDK_796.4_822.4 C1QB_HUMAN 0.019
ETAASLLQAGYK_626.33_679.4 THRB_HUMAN 0.021
VTGWGNLK_437.74_617.3 THRB_HUMAN 0.021
EAQLPVIENK_570.82_699.4 PLMN_HUMAN 0.023
EAQLPVIENK_570.82_329.1 PLMN_HUMAN 0.023
FLQEQGHR_338.84_497.3 CO8G_HUMAN 0.025
IRPFFPQQ_516.79_661.4 FIBB_HUMAN 0.028
ETAASLLQAGYK_626.33_879.5 THRB_HUMAN 0.029
AFTECCVVASQLR_770.87_673.4 CO5_HUMAN 0.030
TLLPVSKPEIR_418.26_288.2 CO5_HUMAN 0.030
LSSPAVITDK_515.79_743.4 PLMN_HUMAN 0.033
YEVQGEVFTKPQLWP_910.96_392.2 CRP_HUMAN 0.036
LQGTLPVEAR_542.31_571.3 CO5_HUMAN 0.036
VRPQQLVK_484.31_609.3 ITIH4_HUMAN 0.036
IEEIAAK_387.22_531.3 CO5_HUMAN 0.041
TLLPVSKPEIR_418.26_514.3 CO5_HUMAN 0.042
VQEAHLTEDQIFYFPK_655.66_701.4 CO8G_HUMAN 0.047
ISLLLIESWLEPVR_834.49_371.2 CSH_HUMAN 0.048
ALQDQLVLVAAK_634.88_289.2 ANGT_HUMAN 0.048
跃迁 蛋白质 p-值Cox单变量
YEFLNGR_449.72_293.1 PLMN_HUMAN 0.049
表2.通过Cox逐步AIC分析选择的跃迁
Figure BDA0000847619590000321
表3.通过Cox lasso模型选择的跃迁
跃迁 coef exp(coef) se(coef) z Pr(>|z|)
Collection.Window.GA.in.Days 0.0233 1.02357 0.00928 2.51 0.012
AFTECCVVASQLR_770.87_574.3 1.07568 2.93198 0.84554 1.27 0.203
ELLESYIDGR_597.8_710.3 1.3847 3.99365 0.70784 1.96 0.05
ITLPDFTGDLR_624.34_920.4 0.814 2.25691 0.40652 2 0.045
表4.单个分析物的ROC(AUROC)曲线下面积以区分早产受试者和非早产受试者。显示了具有最大AUROC面积的77个跃迁
跃迁 AUROC
ELLESYIDGR_597.8_710.3 0.71
AFTECCVVASQLR_770.87_574.3 0.70
ITLPDFTGDLR_624.34_920.4 0.70
IRPFFPQQ_516.79_661.4 0.68
TDAPDLPEENQAR_728.34_613.3 0.67
ITLPDFTGDLR_624.34_288.2 0.67
ELLESYIDGR_597.8_839.4 0.67
SFRPFVPR_335.86_635.3 0.67
ETAASLLQAGYK_626.33_879.5 0.67
TLLPVSKPEIR_418.26_288.2 0.66
ETAASLLQAGYK_626.33_679.4 0.66
SFRPFVPR_335.86_272.2 0.66
LQGTLPVEAR_542.31_571.3 0.66
VEPLYELVTATDFAYSSTVR_754.38_712.4 0.66
DPDQTDGLGLSYLSSHIANVER_796.39_328.1 0.66
VTGWGNLK_437.74_617.3 0.65
ALQDQLVLVAAK_634.88_289.2 0.65
EAQLPVIENK_570.82_329.1 0.65
VRPQQLVK_484.31_609.3 0.65
AFTECCVVASQLR_770.87_673.4 0.65
YEFLNGR_449.72_293.1 0.65
VGEYSLYIGR_578.8_871.5 0.64
EAQLPVIENK_570.82_699.4 0.64
TLLPVSKPEIR_418.26_514.3 0.64
IEEIAAK_387.22_531.3 0.64
LEQGENVFLQATDK_796.4_822.4 0.64
LQGTLPVEAR_542.31_842.5 0.64
FLQEQGHR_338.84_497.3 0.63
ISLLLIESWLEPVR_834.49_371.2 0.63
IITGLLEFEVYLEYLQNR_738.4_530.3 0.63
LSSPAVITDK_515.79_743.4 0.63
VRPQQLVK_484.31_722.4 0.63
SLPVSDSVLSGFEQR_810.92_723.3 0.63
VQEAHLTEDQIFYFPK_655.66_701.4 0.63
NADYSYSVWK_616.78_333.2 0.63
DAQYAPGYDK_564.25_813.4 0.62
FQLPGQK_409.23_276.1 0.62
TASDFITK_441.73_781.4 0.62
YGLVTYATYPK_638.33_334.2 0.62
GSFALSFPVESDVAPIAR_931.99_363.2 0.62
跃迁 AUROC
TLLIANETLR_572.34_703.4 0.62
VILGAHQEVNLEPHVQEIEVSR_832.78_860.4 0.62
TATSEYQTFFNPR_781.37_386.2 0.62
YEVQGEVFTKPQLWP_910.96_392.2 0.62
DISEVVTPR_508.27_472.3 0.62
GSFALSFPVESDVAPIAR_931.99_456.3 0.62
YGFYTHVFR_397.2_421.3 0.62
TLEAQLTPR_514.79_685.4 0.62
YGFYTHVFR_397.2_659.4 0.62
AVGYLITGYQR_620.84_737.4 0.61
DPDQTDGLGLSYLSSHIANVER_796.39_456.2 0.61
FNAVLTNPQGDYDTSTGK_964.46_262.1 0.61
SPEQQETVLDGNLIIR_906.48_685.4 0.61
ALNHLPLEYNSALYSR_620.99_538.3 0.61
GGEIEGFR_432.71_508.3 0.61
GIVEECCFR_585.26_900.3 0.61
DAQYAPGYDK_564.25_315.1 0.61
FAFNLYR_465.75_712.4 0.61
YTTEIIK_434.25_603.4 0.61
AVLTIDEK_444.76_605.3 0.61
AITPPHPASQANIIFDITEGNLR_825.77_459.3 0.60
EPGLCTWQSLR_673.83_790.4 0.60
AVYEAVLR_460.76_587.4 0.60
ALQDQLVLVAAK_634.88_956.6 0.60
AWVAWR_394.71_531.3 0.60
TNLESILSYPK_632.84_807.5 0.60
HLSLLTTLSNR_418.91_376.2 0.60
FTFTLHLETPKPSISSSNLNPR_829.44_787.4 0.60
AVGYLITGYQR_620.84_523.3 0.60
FQLPGQK_409.23_429.2 0.60
YGLVTYATYPK_638.33_843.4 0.60
TELRPGETLNVNFLLR_624.68_662.4 0.60
LSSPAVITDK_515.79_830.5 0.60
TATSEYQTFFNPR_781.37_272.2 0.60
LPTAVVPLR_483.31_385.3 0.60
APLTKPLK_289.86_260.2 0.60
表5.如通过100轮自举再取样所估计的,对于模型中允许的具体跃迁个数,随机森林、助力、lasso和逻辑回归模型的AUROC。
跃迁数 rf 助力 逻辑 lasso
1 0.59 0.67 0.64 0.69
2 0.66 0.70 0.63 0.68
3 0.69 0.70 0.58 0.71
4 0.68 0.72 0.58 0.71
跃迁数 rf 助力 逻辑 lasso
5 0.73 0.71 0.58 0.68
6 0.72 0.72 0.56 0.68
7 0.74 0.70 0.60 0.67
8 0.73 0.72 0.62 0.67
9 0.72 0.72 0.60 0.67
10 0.74 0.71 0.62 0.66
11 0.73 0.69 0.58 0.67
12 0.73 0.69 0.59 0.66
13 0.74 0.71 0.57 0.66
14 0.73 0.70 0.57 0.65
15 0.72 0.70 0.55 0.64
表6.通过每个多变量方法选择的,通过对于该方法的重要性排名的前15个跃迁。
Figure BDA0000847619590000351
Figure BDA0000847619590000361
在另一个方面,本发明提供了确定早产概率的试剂盒,其中所述试剂盒可以用于检测表1至63中所列的N种分离的生物标志物。例如,所述试剂盒可以用于检测一种或多种、两种或更多种或三种分离的生物标志物,其选自AFTECCVVASQLR、ELLESYIDGR和ITLPDFTGDLR。例如,所述试剂盒可以用于检测一种或多种、两种或更多种或三种分离的生物标志物,其选自FLNWIK、FGFGGSTDSGPIR、LLELTGPK、VEHSDLSFSK、IEGNLIFDPNNYLPK、ALVLELAK、TQILEWAAER、DVLLLVHNLPQNLPGYFWYK、SEPRPGVLLR、ITQDAQLK、ALDLSLK、WWGGQPLWITATK和LSETNR。
在另一个方面,所述试剂盒可以用于检测一种或多种,两种或多种、三种或多种、四种或多种、五种或多种、六种或多种、七种或多种或八种分离的生物标志物,其选自脂多糖-结合蛋白(LBP)、凝血酶原(THRB)、补体组分C5(C5或CO5)、纤溶酶原(PLMN)和补体组分C8γ链(C8G或CO8G)。
在另一个方面,所述试剂盒可以用于检测一种或多种、两种或多种、三种或多种、四种或多种、五种或多种、六种或多种、七种或多种或八种分离的生物标志物,其选自α-1B-糖蛋白(A1BG)、含有解联蛋白和金属蛋白酶结构域的蛋白12(ADA12)、脱脂蛋白B-100(APOB)、β-2-微球蛋白(B2MG)、CCAAT/增强子-结合蛋白α/β(HP8肽)、结合皮质甾类球蛋白(CBG)、补体组分C6,内皮糖蛋白(Endoglin)(EGLN)、核苷酸内焦磷酸酶/磷酸二酯酶家族成员2(ENPP2)、凝血因子VII(FA7)、透明质酸酯-结合蛋白2(HABP2)、妊娠特异性-β-1-糖蛋白9(PSG9)、抑制素βE链(INHBE)。
所述试剂盒可以包括用于检测生物标志物的一种或多种试剂,用于容纳分离自怀孕妇女的生物样品的容器;和将试剂与生物样品或生物样品的一部分反应以检测生物样品中分离的生物标志物的存在或量的打印的说明书。所述试剂可以包装在单独的容器中。所述试剂盒还可以包含一个或多个对照参考样品和用于实施免疫测定的试剂。
在一个实施方式中,所述试剂盒包含用于测量表1至63中所列的至少N种分离的生物标志物的水平的试剂。所述试剂盒可以包括特异性结合至这些生物标志物的抗体,例如,所述试剂盒可以含有特异性结合至脂多糖-结合蛋白(LBP)的抗体、特异性结合至凝血酶原(THRB)的抗体、特异性结合至补体组分C5(C5或CO5)的抗体、特异性结合至纤溶酶原(PLMN)的抗体、特异性结合至补体组分C8γ链(C8G或CO8G)的抗体中的至少一种。
在一个实施方式中,所述试剂盒包含用于测量表1至63中所列的至少N种分离的生物标志物的水平的试剂。所述试剂盒可以包含特异性结合至这些生物标志物的抗体,例如,所述试剂盒可以含有特异性结合至α-1B-糖蛋白(A1BG)、含有解联蛋白和金属蛋白酶结构域的蛋白12(ADA12)、脱脂蛋白B-100(APOB)、β-2-微球蛋白(B2MG)、CCAAT/增强子-结合蛋白α/β(HP8肽)、结合皮质甾类球蛋白(CBG)、补体组分C6,内皮糖蛋白(Endoglin)(EGLN)、核苷酸内焦磷酸酶/磷酸二酯酶家族成员2(ENPP2)、凝血因子VII(FA7)、透明质酸酯-结合蛋白2(HABP2)、妊娠特异性-β-1-糖蛋白9(PSG9)、抑制素βE链(INHBE)的抗体中的至少一种。
所述试剂盒可以包含用于包含在所述试剂盒内的组合物的一个或多个容器。组合物可以处于液体形式或者可以是冷冻干燥的。适合用于所述组合物的容器包括(例如)瓶、小瓶、注射器和试管。所述容器可以由多种材料形成,包括玻璃或塑料。所述试剂盒还可以包含包装说明书,其含有确定早产概率的方法的书面说明。
根据上述说明,显而易见的是可以对本文所述的本发明做出改变和变化以使其适合于多种用途和条件。这些实施方式也在以下权利要求的范围内。
在本文中,对变量的任何定义中的元素列表的列举包括该变量作为任何单个元素或所列元素组合(或子组合)的定义。在本文中,对实施方式的列举包括作为任何单个实施方式或者与任何其他实施方式或其部分组合的实施方式。
在本说明书中提及的所有专利和专利公开以每个单独的专利和专利公开具体并且单独表明作为参考并入本文的相同程度作为参考并入本文。
通过非限制性说明提供了以下实施例。
实施例
实施例1.用于早产生物标志物的发现和验证的样品组的建立
建立控制早产风险蛋白质组学评价(PAPR)临床研究实施的标准规程。该规程还规定样品和临床信息可以用于研究一些受试者的其他妊娠并发症。在整个美国,在11个内部审查委员会(IRB)批准的地点从妇女获得样品。在提供知情同意书后,获得血清和血浆样品,以及有关患者人口统计学特征、过往病史和妊娠史、当前妊娠史和并行药物治疗的相关信息。分娩后,采集与母体和婴儿状况以及并发症有关的数据。根据规程处理血清和血浆样品,所述规程需要标准化冷冻离心,将样品等份至0.5mL 2-D条码冷冻小瓶以及随后在-80℃冷冻。
分娩后,逐个回顾早产病例以确定它们的状态是自发早产还是医学人工早产。仅自发早产病例用于该分析。对于早产生物标志物的发现,以两个胎龄组分析80个样品:a)由来自妊娠23-28周的样品组成的晚期窗口,其包括13个病例、13个在样品采集1周内匹配的足月对照和14个足月随机对照,和b)由来自妊娠17-22周的样品组成的早期窗口,其包括15个病例、15个在样品采集1周内匹配的足月对照和10个随机足月对照。
随后,使用Human 14 Multiple Affinity Removal System(MARS 14)从样品中除去了高丰度蛋白,其除去了14种丰度最大的蛋白质,这些蛋白质被视为对血清蛋白质组学中疾病相关变化的鉴别是无信息性的。出于此目的,用柱缓冲液稀释等体积的每个临床或混合人血清样品(HGS)并过滤以除去沉淀。使用MARS-14柱(4.6×100mm,产品目录#5188-6558,Agilent Technologies)除去过滤样品。在自动进样器中,将样品冷却至4℃,在室温下运行除去柱,并将收集的馏分保持在4℃直至进一步分析。收集未结合的馏分用于进一步分析。
将每个临床血清样品和每个HGS的第二等份在碳酸氢铵缓冲液中稀释并使用由10mL块状材料(50%浆液,Sigma)组成的IgY14-SuperMix(Sigma)手工装填柱除去14种高丰度和约60种其他中等丰度的蛋白质。Shi等人,Methods,56(2):246-53(2012)。在自动进样器中,将样品冷却至4℃,在室温下运行除去柱,并将收集的馏分保持在4℃直至进一步分析。收集未结合的馏分用于进一步分析。
使用三氟乙醇使去除后的血清样品变性,用二硫苏糖醇还原,使用碘乙酰胺烷基化,然后以1:10的胰蛋白酶:蛋白质比使用胰蛋白酶水解。胰蛋白酶水解后,在C18柱上对样品脱盐,并将洗脱液冷冻干燥。将脱盐样品再溶解于含有5种内标肽的复原溶液中。
使用经调度多次反应监控方法(sMRM)分析去除后的和胰蛋白酶水解的样品。使用Waters Nano Acquity UPLC,在150mm×0.32mm Bio-Basic C18柱(ThermoFisher)上以5μl/min的流速并使用乙腈梯度洗脱至具有Turbo V源的AB SCIEX QTRAP 5500(AB SCIEX,Framingham,MA)中来分离所述肽。sMRM测定测量了对应于854个肽和236个蛋白质的1708个跃迁。使用Rosetta Elucidator软件(Ceiba Solutions)对色谱峰值积分。
如果它们的强度面积计数小于10000并且如果它们在每批超过三个样品中缺失,则从分析中排除跃迁。将强度面积计数log转化,并使用回归分析使质谱运行顺序趋势(runorder trend)和缺失批次影响(depletion batch effect)最小化。
实施例2.鉴别早产生物标志物的跃迁的分析I
这些分析的目标是检验实施例1中采集的数据以鉴别预测早产的跃迁和蛋白质。所使用的具体分析为(i)Cox时间-事件分析和(ii)以早产作为二元分类因变量的模型。对于所有Cox分析,因变量是时间事件的胎龄(其中事件是早产)。出于Cox分析的目的,早产受试者在生产当天发生事件。在生产当天检查足月受试者。样本采集当天的胎龄是所有Cox分析中的协变量。
先前对运行顺序和去除分批调整测定数据,并log转化。如下调整样品采集时的胎龄值。仅使用对照(未早产受试者)对样品采集时的胎龄回归跃迁值。将回归的残差指定为修正值。在以早产作为二元分类因变量的模型中使用修正值。在Cox分析中使用未修正的值。
单变量Cox比例风险分析
实施单变量Cox比例风险分析以预测出生时的胎龄,包括作为协变量的样本采集当天的胎龄。表1显示p值小于0.05的跃迁。在p值小于0.05的那些中,5种蛋白质具有多次跃迁:脂多糖-结合蛋白(LBP)、凝血酶原(THRB)、补体组分C5(C5或CO5)、纤溶酶原(PLMN)和补体组分C8γ链(C8G或CO8G)。
多变量Cox比例风险分析:逐步AIC选择
使用用于变量选择的逐步和lasso模型,实施Cox比例风险分析以预测出生时的胎龄,包括作为协变量的样本采集当天的胎龄。这些分析包括总计n=80位受试者,PTB事件数=28。逐步变量选择分析使用Akaike信息准测(AIC)作为停止准则。表2显示了通过逐步AIC分析选择的跃迁。逐步AIC模型的决定系数(R2)为0.86(未对多重比较进行修正)。
多变量Cox比例风险分析:lasso选择
将Lasso变量选择用作多变量Cox比例风险分析的第二方法以预测出生时的胎龄,包括作为协变量的样本采集当天的胎龄。该分析对通过交叉验证估计的lasso使用λ惩罚。表3显示了结果。lasso变量选择法明显比逐步AIC更严格,并且对于最终模型仅选择了3个跃迁,其代表3种不同的蛋白。这3种蛋白在单变量分析中提供了前4个跃迁;前4个单变量中的2种来自于相同的蛋白,并因此lasso方法未都选择。Lasso倾向于选择相对较少个数的具有低互相关性的变量。lasso模型的决定系数(R2)为0.21(未对多重比较进行修正)。
作为二元分类因变量的早产单变量AUROC分析
实施单变量分析,将早产受试者与非早产受试者相区分(早产作为二元分类变量),如通过接受器工作特征下的面积所估计的。这些分析使用对样品采集时的胎龄调整的跃迁值,如上所述。表4显示了具有0.6或以上的最大AUROC面积的77个跃迁的AUROC曲线。
作为二元分类因变量的早产的多变量分析
使用随机森林模型、助力模型、lasso模型和逻辑回归模型,实施多变量分析以预测作为二元分类因变量的早产。随机森林和助力模型生出多个分类树。这些树对将每个受试者分配至可能分类之一进行投票。森林选择所有树中票数最多的分类。
对于四种方法中的每一种(随机森林、助力、lasso和逻辑回归)中的每一种,每种方法允许选择其自身最好的15个跃迁并对其排名。然后,我们构建了具有1至15个跃迁的模型。每个方法顺序将节点数从15独立地降低至1。递归选项用于在每个步骤减少节点数:为了确定要去除的节点,在每个步骤根据它们在嵌套交叉验证程序中的重要性对节点排名。淘汰最不重要的节点。lasso和逻辑回归的重要性量度为z值。对于随机森林和助力,根据袋外数据(out-of-bag data)排序计算变量重要性:对于每个树,记录数据袋外部分的分类错误率;然后,在对每个变量(即跃迁)值排序后,重新计算错误率;如果跃迁确实重要,则两错误率之间将会存在大的差异;然后,对所有树的两错误率之间的差异求平均值,并通过差异的标准偏差进行归一化。表5显示了这些模型的AUC,如通过100轮自举再取样所估计的。表6显示了通过每个多变量方法选择的,通过对于该方法的重要性排名的前15个跃迁。这些多变量分析显示组合了3个或以上跃迁的模型提供了大于0.7的AUC,如通过自举估计的。
在多元模型中,随机森林(rf)、助力和lasso模型提供了最好的AUROC曲线下面积。通过这些模型选择了以下跃迁,如在Cox单变量模型中显著的和/或具有高单变量ROC:
AFTECCVVASQLR_770.87_574.3
ELLESYIDGR_597.8_710.3
ITLPDFTGDLR_624.34_920.4
TDAPDLPEENQAR_728.34_613.3
SFRPFVPR_335.86_635.3
总之,使用跃迁进行单变量和多变量Cox分析以预测出生时的胎龄(GAB),包括作为协变量的样本采集当天的胎龄。在单变量Cox分析中,鉴别了在p值小于0.05的那些中具有多次跃迁的5种蛋白质:脂多糖-结合蛋白(LBP)、凝血酶原(THRB)、补体组分C5(C5或CO5)、纤溶酶原(PLMN)和补体组分C8γ链(C8G或CO8G)。
在多变量Cox分析中,逐步AIC变量分析选择了24个跃迁,而lasso模型选择了3个跃迁,其包括单变量分析中的3个靠前的蛋白质。实施单变量(AUROC)和多变量(随机森林、助力、lasso和逻辑回归)分析以预测作为二元分类变量的早产。单变量分析鉴别了AUROC为0.6或以上的63个分析物。多变量分析显示组合了3个或以上跃迁的模型提供了大于0.7的AUC,如通过自举估计的。
实施例3.鉴别和确认早产生物标志物的研究II
除非以下注明,否则使用以上实施例中所述的基本相同的方法进行进一步研究。在本研究中,对于28个病例和56个匹配对照中的每一个使用2个妊娠期匹配对照,全部样品均来自妊娠期早期窗口(17-22周)。
分4批处理样品,每批包括7个病例、14个匹配对照和3个HGS对照。如实施例1中所述,通过MARS14除去血清样品中14种丰度最大的血清样品。然后,用二硫苏糖醇还原去除后的血清,用碘乙酰胺烷基化,然后以1:20的胰蛋白酶:蛋白质比使用胰蛋白酶在37℃水解过夜。胰蛋白酶水解后,在Empore C18 96孔固相萃取板(3M Company)上对样品脱盐,并冷冻干燥。将脱盐样品再溶解于含有5种内标肽的复原溶液中。
使用Agilent Poroshell 120 EC-C18柱(2.1×50mm,2.7μm)并用乙腈梯度洗脱至Agilent 6490三重四极质谱仪中来进行LC-MS/MS分析。
数据分析包括条件逻辑回归的使用,其中每个匹配的一组三个(病例和2个匹配对照)为层(stratum)。表中报道的p值显示在病例和匹配对照之间是否存在显著性差异。
表7.研究II的结果
Figure BDA0000847619590000411
Figure BDA0000847619590000421
实施例4.研究III:早产生物标志物的鸟枪法鉴别
进一步的研究使用了假设独立的鸟枪法来鉴别和定量分析在我们的多通道假设依赖性MRM测定中不存在的其他生物标志物。除非以下注明,否则如以上实施例中所述处理样品。
通过二维液相色谱分馏MARS去除后的患者(早产病例和足月对照)样品的胰蛋白酶水解液并通过串联质谱分析。将相当于3-4μl血清的样品等份上样至6cm×75μm自装填强阳离子交换(Luna scx,Phenomenex)柱。用盐(15、30、50、70和100%B,其中B=250mM乙酸铵、2%乙腈、0.1%甲酸在水中的溶液)从SCX柱洗脱肽,并随后对每个盐洗脱液,将肽结合至0.5μl C18装填的stem trap(Optimize Technologies,Inc.)并在10cm×75μm反相ProteoPep II PicoFrit柱(New Objective)上进一步分馏。用含有0.1%甲酸的乙腈梯度从反相柱洗脱肽,并直接在LTQ-Orbitrap(ThermoFisher)上电离。对于每次扫描,在Orbitrap中以60K分辨率获得肽母体离子质量,并在LTQ中使前7个丰度最大的离子碎片化以获得肽序列信息。
使用Sequest(Eng等人,J.Am.Soc.Mass Spectrom 1994;5:976-989)和X!Tandem(Craig和Beavis,Bioinformatics 2004;20:1466-1467)算法,将母体和碎片离子数据用于搜索人RefSeq数据库。对于Sequest,对母体离子以20ppm容差并且对碎片离子以1AMU搜索数据。允许两个胰蛋白酶漏切,并且修饰包括固有的半胱氨酸羧基氨基甲基化和蛋氨酸氧化。搜索后,通过荷电状态相对于Xcorr得分(荷电+1>1.5Xcorr,荷电+2>2.0,荷电+3>2.5)过滤数据。对X!tandem使用类似的搜索参数,除了碎片离子的质量容差为0.8AMU并且没有Xcorr过滤。作为替代,使用PeptideProphet算法(Keller等人,Anal.Chem 2002;74:5383-5392)验证每个X!Tandem肽谱分配,并使用ProteinProphet算法验证蛋白质分配(Nesvizhskii等人,Anal.Chem 2002;74:5383-5392)。过滤数据以仅包括PeptideProphet概率为0.9或以上的肽谱匹配。在汇编肽和蛋白鉴别后,将每个肽的光谱计数数据导入至DAnTE软件(Polpitiya等人,Bioinformatics.2008;24:1556–1558)。Log转换数据是中心平均值,并且通过要求必需在至少4个病例和4个对照中鉴别肽来过滤遗漏值。为了确定分析物的显著性,对每个分析物产生了接受器工作特征(ROC)曲线,其中对于分离SPTB和足月组的不同阈值,将真阳性率(灵敏度)作为假阳性率(1-特异性)的函数作图。ROC曲线(AUC)下面积等于分类器将随机选择的阳性情况排名在随机选择的阴性情况之上的概率。分别在表8和9中列出了Sequest或Xtandem单独发现的AUC大于或等于0.6的肽,并在表10中列出了两种方法均鉴别的那些。
表8.仅对于Sequest的显著性肽(AUC>0.6)
Figure BDA0000847619590000431
Figure BDA0000847619590000441
Figure BDA0000847619590000451
Figure BDA0000847619590000461
Figure BDA0000847619590000471
Figure BDA0000847619590000481
Figure BDA0000847619590000491
Figure BDA0000847619590000501
Figure BDA0000847619590000511
Figure BDA0000847619590000521
Figure BDA0000847619590000531
Figure BDA0000847619590000541
Figure BDA0000847619590000551
Figure BDA0000847619590000561
Figure BDA0000847619590000571
Figure BDA0000847619590000581
Figure BDA0000847619590000591
表9.仅对于X!Tandem的显著性肽(AUC>0.6)
Figure BDA0000847619590000592
Figure BDA0000847619590000601
Figure BDA0000847619590000611
Figure BDA0000847619590000621
Figure BDA0000847619590000631
Figure BDA0000847619590000641
Figure BDA0000847619590000651
Figure BDA0000847619590000661
Figure BDA0000847619590000671
Figure BDA0000847619590000681
Figure BDA0000847619590000691
Figure BDA0000847619590000701
Figure BDA0000847619590000711
表10.对于X!Tandem和Sequest两者的显著性肽(AUC>0.6)
Figure BDA0000847619590000712
Figure BDA0000847619590000721
Figure BDA0000847619590000731
Figure BDA0000847619590000741
Figure BDA0000847619590000751
Figure BDA0000847619590000761
Figure BDA0000847619590000771
Figure BDA0000847619590000781
Figure BDA0000847619590000791
通过以上假设独立的策略鉴别的差异表达的蛋白质已不存在于我们的MRM-MS测定,并且用作引入MRM-MS测定的候选。还选择了具有功能性兴趣的两种其他蛋白(AFP、PGH1)以用于MRM建立。通过AUC和生物学功能对候选进行优先排序,对新的途径给予优先。将每种所关心的蛋白质的序列导入Skyline软件,其产生了胰蛋白酶水解肽列表、母体离子和碎片离子的m/z值和仪器特异的碰撞能(McLean等人Bioinformatics(2010)26(7):966-968;McLean等人.Anal.Chem(2010)82(24):10116–10124)。
通过消除含有半胱氨酸和蛋氨酸的肽并通过使用鸟枪法数据来选择已在质谱仪上观察到的每种肽的潜在碎片离子的荷电状态和亚组来精炼列表。
在对母体和碎片离子进行优先排序后,以单一预测的碰撞能输出跃迁列表。向单个MRM运行添加约100个跃迁。对于模型建立,在QTRAP 5500(AB Sciex)或6490QQQ(Agilent)上采集MRM数据。如上所述,对可商购的女性人血清(来自怀孕和非怀孕供体)进行去除并处理为胰蛋白酶水解肽,并将其用于“扫描”所关心的肽。在一些情况下,将纯化的合成肽用于进一步优化。对于模型建立,在40℃,通过15分钟乙腈梯度,以100μl/min,在2.1×50mM Poroshell 120 EC-C18柱(Agilent)上分离水解血清或纯化的合成肽。
将MS/MS数据导入回Skyline,其中将每个肽的所有色谱图叠加并用于鉴别对应于所关心的肽的一致的峰和具有最高强度和最低噪音的跃迁。表11含有用于转移至MRM测定的最密切观察的候选跃迁和肽的列表。
表11.用于转移至MRM测定的候选肽和跃迁
Figure BDA0000847619590000801
Figure BDA0000847619590000811
Figure BDA0000847619590000821
Figure BDA0000847619590000831
Figure BDA0000847619590000841
Figure BDA0000847619590000851
Figure BDA0000847619590000861
Figure BDA0000847619590000871
Figure BDA0000847619590000881
Figure BDA0000847619590000891
Figure BDA0000847619590000901
*QTRAP5500数据,所有其他峰面积来自于Agilent 6490
然后,在Agilent 6490上选择每个肽的前2-10个跃迁以及每个蛋白的多至7个肽以用于碰撞能(CE)优化。使用Skyline或MassHunter Qual软件,基于峰面积或信噪比确定每个跃迁的优化的CE值。将每个肽具有最大峰面积的两个跃迁和每个蛋白至少两个肽选择用于最终的MRM方法。当具有较大峰面积的跃迁具有高背景水平或具有高干扰可能的低m/z值时,用具有较小峰面积的跃迁取代。
最后,使用与我们所建立的sMRM测定相同的柱和梯度对所选肽的保留时间作图。随后,将新发现的分析物加入sMRM方法并在以下实施例5中所述的另一假设依赖性发现研究中使用。
上述方法对于大多数蛋白质是典型的。然而,在一些情况下,在鸟枪法中鉴别的差异表达的肽不能唯一地鉴别蛋白质,例如,在具有高序列同一性的蛋白质家族中。在这些情况下,对每个家族成员建立MRM方法。另外,应注意对于任何给定的蛋白质,除了发现显著并且在Orbitrap上观察不到碎片离子的那些之外,可以在MRM优化中包含肽,并且如果那些获得了最佳信号强度,则将其加入到最终的sMRM方法中。
实施例5.鉴别和确认早产生物标志物的研究IV
通过实施例3中使用的经调度MRM测定实施其他假设依赖性发现研究,但是其中增加了实施例4中新发现的分析物。除去不太稳健的跃迁(来自实施例1中所述的原始的1708个)以改善分析性能并为新发现的分析物腾出空间。样品包括来自3个妊娠期中每一个的约30个病例和60个匹配对照(早期,17-22周,中期,23-25周,晚期,26-28周)。通过回归,对运行顺序和批次影响修正了每个跃迁的Log转化的峰面积。通过从ROC曲线计算单变量AUC值确定每个分析物分离病例和对照的能力。对单个胎龄窗口样品组(表12、13、15)以及中期和晚期窗口的组合(表14)报告了排名的单变量AUC值(0.6或更大)。通过Lasso和随机森林方法,使用不同亚组的分析物(如下所述)构建多变量分类器。Lasso显著性跃迁对应于具有非零系数的那些,并且通过Gini重要性值确定随机森林分析物排名(如果除去变量,模型精度的平均降低)。我们报告了具有非零Lasso系数的所有分析物(表16-32)以及来自每个随机森林分析的前30个分析物(表33-49)。考虑前32或100个单变量分析物,对于前50个蛋白质或全部分析物的单一最优单变量分析物,构建了模型。最后,进行1000轮自举再取样,并且在AUC为0.85或以上的组中,对每个分析物将非零Lasso系数或随机森林Gini重要性值加和。
表12.早期窗口的单个统计
跃迁 蛋白质 AUC
ELIEELVNITQNQK_557.6_517.3 IL13_HUMAN 0.834
ITLPDFTGDLR_624.3_288.2 LBP_HUMAN 0.822
FLNWIK_410.7_560.3 HABP2_HUMAN 0.820
ITLPDFTGDLR_624.3_920.5 LBP_HUMAN 0.808
SFRPFVPR_335.9_635.3 LBP_HUMAN 0.800
LIQDAVTGLTVNGQITGDK_972.0_798.4 ITIH3_HUMAN 0.800
FSVVYAK_407.2_579.4 FETUA_HUMAN 0.796
ITGFLKPGK_320.9_429.3 LBP_HUMAN 0.796
AHYDLR_387.7_288.2 FETUA_HUMAN 0.796
FSVVYAK_407.2_381.2 FETUA_HUMAN 0.795
SFRPFVPR_335.9_272.2 LBP_HUMAN 0.795
DVLLLVHNLPQNLPGYFWYK_810.4_967.5 PSG9_HUMAN 0.794
ELIEELVNITQNQK_557.6_618.3 IL13_HUMAN 0.794
QALEEFQK_496.8_680.3 CO8B_HUMAN 0.792
DAGLSWGSAR_510.3_390.2 NEUR4_HUMAN 0.792
AHYDLR_387.7_566.3 FETUA_HUMAN 0.791
VFQFLEK_455.8_811.4 CO5_HUMAN 0.786
ITGFLKPGK_320.9_301.2 LBP_HUMAN 0.783
VFQFLEK_455.8_276.2 CO5_HUMAN 0.782
SLLQPNK_400.2_599.4 CO8A_HUMAN 0.781
VQTAHFK_277.5_431.2 CO8A_HUMAN 0.780
SDLEVAHYK_531.3_617.3 CO8B_HUMAN 0.777
SLLQPNK_400.2_358.2 CO8A_HUMAN 0.776
TLLPVSKPEIR_418.3_288.2 CO5_HUMAN 0.776
ALNHLPLEYNSALYSR_621.0_538.3 CO6_HUMAN 0.774
DISEVVTPR_508.3_787.4 CFAB_HUMAN 0.774
VSEADSSNADWVTK_754.9_533.3 CFAB_HUMAN 0.773
LSSPAVITDK_515.8_743.4 PLMN_HUMAN 0.773
VQEAHLTEDQIFYFPK_655.7_701.4 CO8G_HUMAN 0.772
DVLLLVHNLPQNLPGYFWYK_810.4_594.3 PSG9_HUMAN 0.771
ALVLELAK_428.8_672.4 INHBE_HUMAN 0.770
FLNWIK_410.7_561.3 HABP2_HUMAN 0.770
LSSPAVITDK_515.8_830.5 PLMN_HUMAN 0.769
LPNNVLQEK_527.8_844.5 AFAM_HUMAN 0.769
VSEADSSNADWVTK_754.9_347.2 CFAB_HUMAN 0.768
HTLNQIDEVK_598.8_951.5 FETUA_HUMAN 0.767
TTSDGGYSFK_531.7_860.4 INHA_HUMAN 0.761
YENYTSSFFIR_713.8_756.4 IL12B_HUMAN 0.760
HTLNQIDEVK_598.8_958.5 FETUA_HUMAN 0.760
DISEVVTPR_508.3_472.3 CFAB_HUMAN 0.760
LIQDAVTGLTVNGQITGDK_972.0_640.4 ITIH3_HUMAN 0.759
EAQLPVIENK_570.8_699.4 PLMN_HUMAN 0.759
SLPVSDSVLSGFEQR_810.9_836.4 CO8G_HUMAN 0.757
跃迁 蛋白质 AUC
AVLHIGEK_289.5_348.7 THBG_HUMAN 0.755
GLQYAAQEGLLALQSELLR_1037.1_929.5 LBP_HUMAN 0.752
FLQEQGHR_338.8_497.3 CO8G_HUMAN 0.750
LPNNVLQEK_527.8_730.4 AFAM_HUMAN 0.750
AVLHIGEK_289.5_292.2 THBG_HUMAN 0.749
QLYGDTGVLGR_589.8_501.3 CO8G_HUMAN 0.748
WWGGQPLWITATK_772.4_929.5 ENPP2_HUMAN 0.747
NADYSYSVWK_616.8_769.4 CO5_HUMAN 0.746
GLQYAAQEGLLALQSELLR_1037.1_858.5 LBP_HUMAN 0.746
SLPVSDSVLSGFEQR_810.9_723.3 CO8G_HUMAN 0.745
IEEIAAK_387.2_531.3 CO5_HUMAN 0.743
TYLHTYESEI_628.3_908.4 ENPP2_HUMAN 0.742
WWGGQPLWITATK_772.4_373.2 ENPP2_HUMAN 0.742
FQLSETNR_497.8_605.3 PSG2_HUMAN 0.741
NIQSVNVK_451.3_674.4 GROA_HUMAN 0.741
TGVAVNKPAEFTVDAK_549.6_258.1 FLNA_HUMAN 0.740
LQGTLPVEAR_542.3_571.3 CO5_HUMAN 0.740
SGFSFGFK_438.7_732.4 CO8B_HUMAN 0.740
HELTDEELQSLFTNFANVVDK_817.1_906.5 AFAM_HUMAN 0.740
VQTAHFK_277.5_502.3 CO8A_HUMAN 0.739
YENYTSSFFIR_713.8_293.1 IL12B_HUMAN 0.739
AFTECCVVASQLR_770.9_574.3 CO5_HUMAN 0.736
EAQLPVIENK_570.8_329.2 PLMN_HUMAN 0.734
QALEEFQK_496.8_551.3 CO8B_HUMAN 0.734
DAQYAPGYDK_564.3_813.4 CFAB_HUMAN 0.734
TEFLSNYLTNVDDITLVPGTLGR_846.8_600.3 ENPP2_HUMAN 0.734
IAIDLFK_410.3_635.4 HEP2_HUMAN 0.733
TASDFITK_441.7_781.4 GELS_HUMAN 0.731
YEFLNGR_449.7_606.3 PLMN_HUMAN 0.731
TVQAVLTVPK_528.3_428.3 PEDF_HUMAN 0.731
LIENGYFHPVK_439.6_627.4 F13B_HUMAN 0.730
DALSSVQESQVAQQAR_573.0_672.4 APOC3_HUMAN 0.730
TVQAVLTVPK_528.3_855.5 PEDF_HUMAN 0.730
ALQDQLVLVAAK_634.9_289.2 ANGT_HUMAN 0.727
TYLHTYESEI_628.3_515.3 ENPP2_HUMAN 0.727
SDLEVAHYK_531.3_746.4 CO8B_HUMAN 0.726
FLPCENK_454.2_550.2 IL10_HUMAN 0.725
HPWIVHWDQLPQYQLNR_744.0_1047.0 KS6A3_HUMAN 0.725
AFTECCVVASQLR_770.9_673.4 CO5_HUMAN 0.725
YGLVTYATYPK_638.3_843.4 CFAB_HUMAN 0.724
TLEAQLTPR_514.8_685.4 HEP2_HUMAN 0.724
DAQYAPGYDK_564.3_315.1 CFAB_HUMAN 0.724
QGHNSVFLIK_381.6_260.2 HEMO_HUMAN 0.722
跃迁 蛋白质 AUC
HELTDEELQSLFTNFANVVDK_817.1_854.4 AFAM_HUMAN 0.722
TLEAQLTPR_514.8_814.4 HEP2_HUMAN 0.721
IEEIAAK_387.2_660.4 CO5_HUMAN 0.721
HFQNLGK_422.2_527.2 AFAM_HUMAN 0.721
IAPQLSTEELVSLGEK_857.5_333.2 AFAM_HUMAN 0.721
DALSSVQESQVAQQAR_573.0_502.3 APOC3_HUMAN 0.720
ALNHLPLEYNSALYSR_621.0_696.4 CO6_HUMAN 0.719
IAIDLFK_410.3_706.4 HEP2_HUMAN 0.719
FLQEQGHR_338.8_369.2 CO8G_HUMAN 0.719
ALQDQLVLVAAK_634.9_956.6 ANGT_HUMAN 0.718
IEGNLIFDPNNYLPK_874.0_414.2 APOB_HUMAN 0.717
YEFLNGR_449.7_293.1 PLMN_HUMAN 0.717
TASDFITK_441.7_710.4 GELS_HUMAN 0.716
DADPDTFFAK_563.8_825.4 AFAM_HUMAN 0.716
TLLPVSKPEIR_418.3_514.3 CO5_HUMAN 0.716
NADYSYSVWK_616.8_333.2 CO5_HUMAN 0.715
YGLVTYATYPK_638.3_334.2 CFAB_HUMAN 0.715
VNHVTLSQPK_374.9_459.3 B2MG_HUMAN 0.715
HYGGLTGLNK_530.3_759.4 PGAM1_HUMAN 0.714
DFHINLFQVLPWLK_885.5_400.2 CFAB_HUMAN 0.714
NCSFSIIYPVVIK_770.4_555.4 CRHBP_HUMAN 0.714
HPWIVHWDQLPQYQLNR_744.0_918.5 KS6A3_HUMAN 0.712
AQPVQVAEGSEPDGFWEALGGK_758.0_574.3 GELS_HUMAN 0.711
ALDLSLK_380.2_185.1 ITIH3_HUMAN 0.711
ALDLSLK_380.2_575.3 ITIH3_HUMAN 0.710
LDFHFSSDR_375.2_611.3 INHBC_HUMAN 0.709
TLNAYDHR_330.5_312.2 PAR3_HUMAN 0.707
EVFSKPISWEELLQ_852.9_260.2 FA40A_HUMAN 0.706
IAPQLSTEELVSLGEK_857.5_533.3 AFAM_HUMAN 0.704
LIENGYFHPVK_439.6_343.2 F13B_HUMAN 0.703
NFPSPVDAAFR_610.8_775.4 HEMO_HUMAN 0.703
QLYGDTGVLGR_589.8_345.2 CO8G_HUMAN 0.702
LYYGDDEK_501.7_563.2 CO8A_HUMAN 0.702
FQLSETNR_497.8_476.3 PSG2_HUMAN 0.701
TGVAVNKPAEFTVDAK_549.6_977.5 FLNA_HUMAN 0.700
IPGIFELGISSQSDR_809.9_679.3 CO8B_HUMAN 0.700
TLFIFGVTK_513.3_215.1 PSG4_HUMAN 0.699
YYGYTGAFR_549.3_450.3 TRFL_HUMAN 0.699
QVFAVQR_424.2_473.3 ELNE_HUMAN 0.699
AQPVQVAEGSEPDGFWEALGGK_758.0_623.4 GELS_HUMAN 0.699
DFNQFSSGEK_386.8_189.1 FETA_HUMAN 0.699
SVSLPSLDPASAK_636.4_473.3 APOB_HUMAN 0.699
GNGLTWAEK_488.3_634.3 C163B_HUMAN 0.698
跃迁 蛋白质 AUC
LYYGDDEK_501.7_726.3 CO8A_HUMAN 0.698
NFPSPVDAAFR_610.8_959.5 HEMO_HUMAN 0.698
FAFNLYR_465.8_565.3 HEP2_HUMAN 0.697
SGFSFGFK_438.7_585.3 CO8B_HUMAN 0.696
DFHINLFQVLPWLK_885.5_543.3 CFAB_HUMAN 0.696
LQGTLPVEAR_542.3_842.5 CO5_HUMAN 0.694
GAVHVVVAETDYQSFAVLYLER_822.8_863.5 CO8G_HUMAN 0.694
TSESTGSLPSPFLR_739.9_716.4 PSMG1_HUMAN 0.694
YISPDQLADLYK_713.4_277.2 ENOA_HUMAN 0.694
ESDTSYVSLK_564.8_347.2 CRP_HUMAN 0.693
ILDDLSPR_464.8_587.3 ITIH4_HUMAN 0.693
VQEAHLTEDQIFYFPK_655.7_391.2 CO8G_HUMAN 0.692
SGVDLADSNQK_567.3_662.3 VGFR3_HUMAN 0.692
DTDTGALLFIGK_625.8_217.1 PEDF_HUMAN 0.692
HFQNLGK_422.2_285.1 AFAM_HUMAN 0.691
NNQLVAGYLQGPNVNLEEK_700.7_999.5 IL1RA_HUMAN 0.691
IPGIFELGISSQSDR_809.9_849.4 CO8B_HUMAN 0.691
ESDTSYVSLK_564.8_696.4 CRP_HUMAN 0.690
GAVHVVVAETDYQSFAVLYLER_822.8_580.3 CO8G_HUMAN 0.690
DADPDTFFAK_563.8_302.1 AFAM_HUMAN 0.690
LDFHFSSDR_375.2_464.2 INHBC_HUMAN 0.689
TLFIFGVTK_513.3_811.5 PSG4_HUMAN 0.688
DFNQFSSGEK_386.8_333.2 FETA_HUMAN 0.687
IQTHSTTYR_369.5_627.3 F13B_HUMAN 0.686
HYFIAAVER_553.3_658.4 FA8_HUMAN 0.686
VNHVTLSQPK_374.9_244.2 B2MG_HUMAN 0.686
DLHLSDVFLK_396.2_366.2 CO6_HUMAN 0.685
DPTFIPAPIQAK_433.2_556.3 ANGT_HUMAN 0.684
AGITIPR_364.2_272.2 IL17_HUMAN 0.684
IAQYYYTFK_598.8_884.4 F13B_HUMAN 0.684
SGVDLADSNQK_567.3_591.3 VGFR3_HUMAN 0.683
VEPLYELVTATDFAYSSTVR_754.4_549.3 CO8B_HUMAN 0.682
AGITIPR_364.2_486.3 IL17_HUMAN 0.682
YEVQGEVFTKPQLWP_911.0_293.1 CRP_HUMAN 0.681
APLTKPLK_289.9_357.2 CRP_HUMAN 0.681
YNSQLLSFVR_613.8_508.3 TFR1_HUMAN 0.681
ANDQYLTAAALHNLDEAVK_686.4_301.1 IL1A_HUMAN 0.681
IQTHSTTYR_369.5_540.3 F13B_HUMAN 0.681
IHPSYTNYR_575.8_598.3 PSG2_HUMAN 0.681
TEFLSNYLTNVDDITLVPGTLGR_846.8_699.4 ENPP2_HUMAN 0.681
DPTFIPAPIQAK_433.2_461.2 ANGT_HUMAN 0.679
FQSVFTVTR_542.8_623.4 C1QC_HUMAN 0.679
LQVNTPLVGASLLR_741.0_925.6 BPIA1_HUMAN 0.679
跃迁 蛋白质 AUC
DEIPHNDIALLK_459.9_510.8 HABP2_HUMAN 0.678
HATLSLSIPR_365.6_272.2 VGFR3_HUMAN 0.678
EDTPNSVWEPAK_686.8_315.2 C1S_HUMAN 0.678
TGISPLALIK_506.8_741.5 APOB_HUMAN 0.678
ILPSVPK_377.2_244.2 PGH1_HUMAN 0.676
HATLSLSIPR_365.6_472.3 VGFR3_HUMAN 0.676
QGHNSVFLIK_381.6_520.4 HEMO_HUMAN 0.676
LPATEKPVLLSK_432.6_460.3 HYOU1_HUMAN 0.675
APLTKPLK_289.9_398.8 CRP_HUMAN 0.674
GVTGYFTFNLYLK_508.3_683.9 PSG5_HUMAN 0.673
TFLTVYWTPER_706.9_401.2 ICAM1_HUMAN 0.673
GDTYPAELYITGSILR_885.0_274.1 F13B_HUMAN 0.672
EDTPNSVWEPAK_686.8_630.3 C1S_HUMAN 0.672
SLDFTELDVAAEK_719.4_316.2 ANGT_HUMAN 0.672
VELAPLPSWQPVGK_760.9_342.2 ICAM1_HUMAN 0.671
GPGEDFR_389.2_322.2 PTGDS_HUMAN 0.670
TDAPDLPEENQAR_728.3_843.4 CO5_HUMAN 0.670
GVTGYFTFNLYLK_508.3_260.2 PSG5_HUMAN 0.669
FAFNLYR_465.8_712.4 HEP2_HUMAN 0.669
ITENDIQIALDDAK_779.9_873.5 APOB_HUMAN 0.669
ILNIFGVIK_508.8_790.5 TFR1_HUMAN 0.669
ISQGEADINIAFYQR_575.6_684.4 MMP8_HUMAN 0.668
GDTYPAELYITGSILR_885.0_1332.8 F13B_HUMAN 0.668
ELLESYIDGR_597.8_710.4 THRB_HUMAN 0.668
FTITAGSK_412.7_576.3 FABPL_HUMAN 0.667
ILDGGNK_358.7_490.2 CXCL5_HUMAN 0.667
GWVTDGFSSLK_598.8_854.4 APOC3_HUMAN 0.667
FSLVSGWGQLLDR_493.3_403.2 FA7_HUMAN 0.665
IHPSYTNYR_575.8_813.4 PSG2_HUMAN 0.665
ELLESYIDGR_597.8_839.4 THRB_HUMAN 0.665
SDGAKPGPR_442.7_213.6 COLI_HUMAN 0.664
IAQYYYTFK_598.8_395.2 F13B_HUMAN 0.664
SILFLGK_389.2_201.1 THBG_HUMAN 0.664
IEVNESGTVASSSTAVIVSAR_693.0_545.3 PAI1_HUMAN 0.664
VSAPSGTGHLPGLNPL_506.3_300.7 PSG3_HUMAN 0.664
LLAPSDSPEWLSFDVTGVVR_730.1_430.3 TGFB1_HUMAN 0.664
YYGYTGAFR_549.3_771.4 TRFL_HUMAN 0.663
TDAPDLPEENQAR_728.3_613.3 CO5_HUMAN 0.663
IEVIITLK_464.8_815.5 CXL11_HUMAN 0.662
ILPSVPK_377.2_227.2 PGH1_HUMAN 0.662
FGFGGSTDSGPIR_649.3_745.4 ADA12_HUMAN 0.661
DYWSTVK_449.7_347.2 APOC3_HUMAN 0.661
IEGNLIFDPNNYLPK_874.0_845.5 APOB_HUMAN 0.661
跃迁 蛋白质 AUC
WILTAAHTLYPK_471.9_407.2 C1R_HUMAN 0.661
WNFAYWAAHQPWSR_607.3_545.3 PRG2_HUMAN 0.661
SILFLGK_389.2_577.4 THBG_HUMAN 0.661
FSLVSGWGQLLDR_493.3_516.3 FA7_HUMAN 0.661
DTDTGALLFIGK_625.8_818.5 PEDF_HUMAN 0.661
SEYGAALAWEK_612.8_845.5 CO6_HUMAN 0.660
LWAYLTIQELLAK_781.5_371.2 ITIH1_HUMAN 0.660
LLEVPEGR_456.8_356.2 C1S_HUMAN 0.659
ITENDIQIALDDAK_779.9_632.3 APOB_HUMAN 0.659
LTTVDIVTLR_565.8_716.4 IL2RB_HUMAN 0.658
IEVIITLK_464.8_587.4 CXL11_HUMAN 0.658
QLGLPGPPDVPDHAAYHPF_676.7_299.2 ITIH4_HUMAN 0.658
TLAFVR_353.7_492.3 FA7_HUMAN 0.656
NSDQEIDFK_548.3_294.2 S10A5_HUMAN 0.656
YHFEALADTGISSEFYDNANDLLSK_940.8_874.5 CO8A_HUMAN 0.656
SEPRPGVLLR_375.2_454.3 FA7_HUMAN 0.655
FLPCENK_454.2_390.2 IL10_HUMAN 0.654
NCSFSIIYPVVIK_770.4_831.5 CRHBP_HUMAN 0.654
SLDFTELDVAAEK_719.4_874.5 ANGT_HUMAN 0.654
ILLLGTAVESAWGDEQSAFR_721.7_909.4 CXA1_HUMAN 0.653
SVSLPSLDPASAK_636.4_885.5 APOB_HUMAN 0.653
TGISPLALIK_506.8_654.5 APOB_HUMAN 0.653
YNQLLR_403.7_288.2 ENOA_HUMAN 0.653
YEVQGEVFTKPQLWP_911.0_392.2 CRP_HUMAN 0.652
VPGLYYFTYHASSR_554.3_720.3 C1QB_HUMAN 0.650
SLQNASAIESILK_687.4_589.4 IL3_HUMAN 0.650
WILTAAHTLYPK_471.9_621.4 C1R_HUMAN 0.650
GWVTDGFSSLK_598.8_953.5 APOC3_HUMAN 0.650
YGIEEHGK_311.5_599.3 CXA1_HUMAN 0.649
QDLGWK_373.7_503.3 TGFB3_HUMAN 0.649
DYWSTVK_449.7_620.3 APOC3_HUMAN 0.648
ALVLELAK_428.8_331.2 INHBE_HUMAN 0.647
QLGLPGPPDVPDHAAYHPF_676.7_263.1 ITIH4_HUMAN 0.646
SEYGAALAWEK_612.8_788.4 CO6_HUMAN 0.645
TFLTVYWTPER_706.9_502.3 ICAM1_HUMAN 0.644
FQSVFTVTR_542.8_722.4 C1QC_HUMAN 0.643
DPNGLPPEAQK_583.3_669.4 RET4_HUMAN 0.642
ETLLQDFR_511.3_322.2 AMBP_HUMAN 0.642
IIEVEEEQEDPYLNDR_996.0_777.4 FBLN1_HUMAN 0.641
ELCLDPK_437.7_359.2 IL8_HUMAN 0.641
TPSAAYLWVGTGASEAEK_919.5_849.4 GELS_HUMAN 0.641
NQSPVLEPVGR_598.3_866.5 KS6A3_HUMAN 0.641
FNAVLTNPQGDYDTSTGK_964.5_333.2 C1QC_HUMAN 0.641
跃迁 蛋白质 AUC
LLEVPEGR_456.8_686.4 C1S_HUMAN 0.641
FFQYDTWK_567.8_840.4 IGF2_HUMAN 0.640
SPEAEDPLGVER_649.8_670.4 Z512B_HUMAN 0.639
SEPRPGVLLR_375.2_654.4 FA7_HUMAN 0.639
SGAQATWTELPWPHEK_613.3_793.4 HEMO_HUMAN 0.638
YSHYNER_323.5_581.3 HABP2_HUMAN 0.638
YHFEALADTGISSEFYDNANDLLSK_940.8_301.1 CO8A_HUMAN 0.637
DLHLSDVFLK_396.2_260.2 CO6_HUMAN 0.637
YSHYNER_323.5_418.2 HABP2_HUMAN 0.637
YYLQGAK_421.7_327.1 ITIH4_HUMAN 0.636
EVPLSALTNILSAQLISHWK_740.8_996.6 PAI1_HUMAN 0.636
VPGLYYFTYHASSR_554.3_420.2 C1QB_HUMAN 0.636
AALAAFNAQNNGSNFQLEEISR_789.1_746.4 FETUA_HUMAN 0.636
ETLLQDFR_511.3_565.3 AMBP_HUMAN 0.635
IVLSLDVPIGLLQILLEQAR_735.1_503.3 UCN2_HUMAN 0.635
ENPAVIDFELAPIVDLVR_670.7_811.5 CO6_HUMAN 0.635
LQLSETNR_480.8_355.2 PSG8_HUMAN 0.635
DPDQTDGLGLSYLSSHIANVER_796.4_456.2 GELS_HUMAN 0.635
NVNQSLLELHK_432.2_656.3 FRIH_HUMAN 0.634
EIGELYLPK_531.3_633.4 AACT_HUMAN 0.634
SPEQQETVLDGNLIIR_906.5_699.3 ITIH4_HUMAN 0.634
NKPGVYTDVAYYLAWIR_677.0_545.3 FA12_HUMAN 0.632
QNYHQDSEAAINR_515.9_544.3 FRIH_HUMAN 0.632
EKPAGGIPVLGSLVNTVLK_631.4_930.6 BPIB1_HUMAN 0.632
VTFEYR_407.7_614.3 CRHBP_HUMAN 0.630
DLPHITVDR_533.3_490.3 MMP7_HUMAN 0.630
VEHSDLSFSK_383.5_234.1 B2MG_HUMAN 0.630
ENPAVIDFELAPIVDLVR_670.7_601.4 CO6_HUMAN 0.630
YGFYTHVFR_397.2_659.4 THRB_HUMAN 0.629
ILDDLSPR_464.8_702.3 ITIH4_HUMAN 0.629
DPNGLPPEAQK_583.3_497.2 RET4_HUMAN 0.629
GSLVQASEANLQAAQDFVR_668.7_806.4 ITIH1_HUMAN 0.629
FLYHK_354.2_447.2 AMBP_HUMAN 0.627
FNAVLTNPQGDYDTSTGK_964.5_262.1 C1QC_HUMAN 0.627
LQDAGVYR_461.2_680.3 PD1L1_HUMAN 0.627
INPASLDK_429.2_630.4 C163A_HUMAN 0.626
LEEHYELR_363.5_580.3 PAI2_HUMAN 0.625
VEHSDLSFSK_383.5_468.2 B2MG_HUMAN 0.624
TSDQIHFFFAK_447.6_659.4 ANT3_HUMAN 0.624
ATLSAAPSNPR_542.8_570.3 CXCL2_HUMAN 0.624
YGFYTHVFR_397.2_421.3 THRB_HUMAN 0.624
EANQSTLENFLER_775.9_678.4 IL4_HUMAN 0.623
GQQPADVTGTALPR_705.9_314.2 CSF1_HUMAN 0.623
跃迁 蛋白质 AUC
VELAPLPSWQPVGK_760.9_400.3 ICAM1_HUMAN 0.622
GEVTYTTSQVSK_650.3_750.4 EGLN_HUMAN 0.622
SLQAFVAVAAR_566.8_487.3 IL23A_HUMAN 0.622
HYGGLTGLNK_530.3_301.1 PGAM1_HUMAN 0.622
GPEDQDISISFAWDK_854.4_753.4 DEF4_HUMAN 0.622
YVVISQGLDKPR_458.9_400.3 LRP1_HUMAN 0.621
LWAYLTIQELLAK_781.5_300.2 ITIH1_HUMAN 0.621
SGAQATWTELPWPHEK_613.3_510.3 HEMO_HUMAN 0.621
GTAEWLSFDVTDTVR_848.9_952.5 TGFB3_HUMAN 0.621
FFQYDTWK_567.8_712.3 IGF2_HUMAN 0.621
AHQLAIDTYQEFEETYIPK_766.0_634.4 CSH_HUMAN 0.620
LPATEKPVLLSK_432.6_347.2 HYOU1_HUMAN 0.620
NIQSVNVK_451.3_546.3 GROA_HUMAN 0.620
TAVTANLDIR_537.3_288.2 CHL1_HUMAN 0.619
WSAGLTSSQVDLYIPK_883.0_515.3 CBG_HUMAN 0.616
QINSYVK_426.2_496.3 CBG_HUMAN 0.616
GFQALGDAADIR_617.3_288.2 TIMP1_HUMAN 0.615
WNFAYWAAHQPWSR_607.3_673.3 PRG2_HUMAN 0.615
NEIWYR_440.7_357.2 FA12_HUMAN 0.615
VLEPTLK_400.3_587.3 VTDB_HUMAN 0.614
YYLQGAK_421.7_516.3 ITIH4_HUMAN 0.614
ALNSIIDVYHK_424.9_774.4 S10A8_HUMAN 0.614
ETPEGAEAKPWYEPIYLGGVFQLEK_951.1_877.5 TNFA_HUMAN 0.614
LNIGYIEDLK_589.3_837.4 PAI2_HUMAN 0.614
NVNQSLLELHK_432.2_543.3 FRIH_HUMAN 0.613
ILLLGTAVESAWGDEQSAFR_721.7_910.6 CXA1_HUMAN 0.613
AALAAFNAQNNGSNFQLEEISR_789.1_633.3 FETUA_HUMAN 0.613
VLEPTLK_400.3_458.3 VTDB_HUMAN 0.613
VGEYSLYIGR_578.8_708.4 SAMP_HUMAN 0.613
DIPHWLNPTR_416.9_373.2 PAPP1_HUMAN 0.612
NEIVFPAGILQAPFYTR_968.5_357.2 ECE1_HUMAN 0.612
AEHPTWGDEQLFQTTR_639.3_765.4 PGH1_HUMAN 0.612
VEPLYELVTATDFAYSSTVR_754.4_712.4 CO8B_HUMAN 0.611
DEIPHNDIALLK_459.9_260.2 HABP2_HUMAN 0.611
QINSYVK_426.2_610.3 CBG_HUMAN 0.610
SWNEPLYHLVTEVR_581.6_614.3 PRL_HUMAN 0.610
YGIEEHGK_311.5_341.2 CXA1_HUMAN 0.610
FGFGGSTDSGPIR_649.3_946.5 ADA12_HUMAN 0.610
ANDQYLTAAALHNLDEAVK_686.4_317.2 IL1A_HUMAN 0.610
VRPQQLVK_484.3_609.4 ITIH4_HUMAN 0.609
IPKPEASFSPR_410.2_506.3 ITIH4_HUMAN 0.609
SPEQQETVLDGNLIIR_906.5_685.4 ITIH4_HUMAN 0.609
DDLYVSDAFHK_655.3_704.3 ANT3_HUMAN 0.609
跃迁 蛋白质 AUC
ELPEHTVK_476.8_347.2 VTDB_HUMAN 0.609
FLYHK_354.2_284.2 AMBP_HUMAN 0.608
QRPPDLDTSSNAVDLLFFTDESGDSR_961.5_262.2 C1R_HUMAN 0.608
DPDQTDGLGLSYLSSHIANVER_796.4_328.1 GELS_HUMAN 0.608
NEIWYR_440.7_637.4 FA12_HUMAN 0.607
LQLSETNR_480.8_672.4 PSG8_HUMAN 0.606
GQVPENEANVVITTLK_571.3_462.3 CADH1_HUMAN 0.606
FTGSQPFGQGVEHATANK_626.0_521.2 TSP1_HUMAN 0.605
LEPLYSASGPGLRPLVIK_637.4_260.2 CAA60698 0.605
QRPPDLDTSSNAVDLLFFTDESGDSR_961.5_866.3 C1R_HUMAN 0.604
LTTVDIVTLR_565.8_815.5 IL2RB_HUMAN 0.604
TSDQIHFFFAK_447.6_512.3 ANT3_HUMAN 0.604
IQHPFTVEEFVLPK_562.0_861.5 PZP_HUMAN 0.603
NKPGVYTDVAYYLAWIR_677.0_821.5 FA12_HUMAN 0.603
TEQAAVAR_423.2_615.4 FA12_HUMAN 0.603
EIGELYLPK_531.3_819.5 AACT_HUMAN 0.602
LFYADHPFIFLVR_546.6_647.4 SERPH_HUMAN 0.602
AEHPTWGDEQLFQTTR_639.3_569.3 PGH1_HUMAN 0.601
TSYQVYSK_488.2_787.4 C163A_HUMAN 0.601
YTTEIIK_434.2_704.4 C1R_HUMAN 0.601
NVIQISNDLENLR_509.9_402.3 LEP_HUMAN 0.600
AFLEVNEEGSEAAASTAVVIAGR_764.4_685.4 ANT3_HUMAN 0.600
表13.中期窗口的单个统计
跃迁 蛋白质 AUC
SEYGAALAWEK_612.8_788.4 CO6_HUMAN 0.738
VFQFLEK_455.8_811.4 CO5_HUMAN 0.709
ALNHLPLEYNSALYSR_621.0_696.4 CO6_HUMAN 0.705
SLDFTELDVAAEK_719.4_316.2 ANGT_HUMAN 0.692
VEHSDLSFSK_383.5_234.1 B2MG_HUMAN 0.686
LLAPSDSPEWLSFDVTGVVR_730.1_430.3 TGFB1_HUMAN 0.683
ALNHLPLEYNSALYSR_621.0_538.3 CO6_HUMAN 0.683
VLEPTLK_400.3_458.3 VTDB_HUMAN 0.681
LHEAFSPVSYQHDLALLR_699.4_251.2 FA12_HUMAN 0.681
SEYGAALAWEK_612.8_845.5 CO6_HUMAN 0.679
YGIEEHGK_311.5_599.3 CXA1_HUMAN 0.677
ALQDQLVLVAAK_634.9_289.2 ANGT_HUMAN 0.675
VLEPTLK_400.3_587.3 VTDB_HUMAN 0.667
VNHVTLSQPK_374.9_244.2 B2MG_HUMAN 0.665
IEEIAAK_387.2_660.4 CO5_HUMAN 0.664
DALSSVQESQVAQQAR_573.0_502.3 APOC3_HUMAN 0.664
TLLPVSKPEIR_418.3_514.3 CO5_HUMAN 0.662
ALQDQLVLVAAK_634.9_956.6 ANGT_HUMAN 0.661
TLAFVR_353.7_492.3 FA7_HUMAN 0.661
SEPRPGVLLR_375.2_654.4 FA7_HUMAN 0.658
跃迁 蛋白质 AUC
VEHSDLSFSK_383.5_468.2 B2MG_HUMAN 0.653
DPTFIPAPIQAK_433.2_461.2 ANGT_HUMAN 0.653
QGHNSVFLIK_381.6_260.2 HEMO_HUMAN 0.650
SLDFTELDVAAEK_719.4_874.5 ANGT_HUMAN 0.650
ELPQSIVYK_538.8_417.7 FBLN3_HUMAN 0.649
TYLHTYESEI_628.3_515.3 ENPP2_HUMAN 0.647
SLQAFVAVAAR_566.8_804.5 IL23A_HUMAN 0.646
AQPVQVAEGSEPDGFWEALGGK_758.0_574.3 GELS_HUMAN 0.644
QGHNSVFLIK_381.6_520.4 HEMO_HUMAN 0.644
VNHVTLSQPK_374.9_459.3 B2MG_HUMAN 0.643
DLHLSDVFLK_396.2_260.2 CO6_HUMAN 0.643
TEQAAVAR_423.2_615.4 FA12_HUMAN 0.643
GPITSAAELNDPQSILLR_632.4_826.5 EGLN_HUMAN 0.643
HFQNLGK_422.2_527.2 AFAM_HUMAN 0.642
TEQAAVAR_423.2_487.3 FA12_HUMAN 0.642
AVDIPGLEAATPYR_736.9_399.2 TENA_HUMAN 0.642
TLFIFGVTK_513.3_811.5 PSG4_HUMAN 0.642
DLHLSDVFLK_396.2_366.2 CO6_HUMAN 0.641
AFTECCVVASQLR_770.9_574.3 CO5_HUMAN 0.640
EVFSKPISWEELLQ_852.9_376.2 FA40A_HUMAN 0.639
DPTFIPAPIQAK_433.2_556.3 ANGT_HUMAN 0.639
FSLVSGWGQLLDR_493.3_403.2 FA7_HUMAN 0.638
HYINLITR_515.3_301.1 NPY_HUMAN 0.637
HFQNLGK_422.2_285.1 AFAM_HUMAN 0.637
VPLALFALNR_557.3_620.4 PEPD_HUMAN 0.636
IHPSYTNYR_575.8_813.4 PSG2_HUMAN 0.635
IEEIAAK_387.2_531.3 CO5_HUMAN 0.635
GEVTYTTSQVSK_650.3_750.4 EGLN_HUMAN 0.634
DFNQFSSGEK_386.8_333.2 FETA_HUMAN 0.634
VVGGLVALR_442.3_784.5 FA12_HUMAN 0.634
SDGAKPGPR_442.7_459.2 COLI_HUMAN 0.634
DVLLLVHNLPQNLTGHIWYK_791.8_310.2 PSG7_HUMAN 0.634
TLLPVSKPEIR_418.3_288.2 CO5_HUMAN 0.633
NKPGVYTDVAYYLAWIR_677.0_821.5 FA12_HUMAN 0.630
QVFAVQR_424.2_473.3 ELNE_HUMAN 0.630
NHYTESISVAK_624.8_415.2 NEUR1_HUMAN 0.630
IAPQLSTEELVSLGEK_857.5_333.2 AFAM_HUMAN 0.629
IHPSYTNYR_575.8_598.3 PSG2_HUMAN 0.627
EVFSKPISWEELLQ_852.9_260.2 FA40A_HUMAN 0.627
SILFLGK_389.2_201.1 THBG_HUMAN 0.626
IEVIITLK_464.8_587.4 CXL11_HUMAN 0.625
VVGGLVALR_442.3_685.4 FA12_HUMAN 0.624
VVLSSGSGPGLDLPLVLGLPLQLK_791.5_598.4 SHBG_HUMAN 0.624
FGFGGSTDSGPIR_649.3_946.5 ADA12_HUMAN 0.623
VVLSSGSGPGLDLPLVLGLPLQLK_791.5_768.5 SHBG_HUMAN 0.622
YGIEEHGK_311.5_341.2 CXA1_HUMAN 0.621
LHEAFSPVSYQHDLALLR_699.4_380.2 FA12_HUMAN 0.621
AHYDLR_387.7_566.3 FETUA_HUMAN 0.620
跃迁 蛋白质 AUC
FSVVYAK_407.2_381.2 FETUA_HUMAN 0.618
ALALPPLGLAPLLNLWAKPQGR_770.5_256.2 SHBG_HUMAN 0.618
YENYTSSFFIR_713.8_293.1 IL12B_HUMAN 0.617
VELAPLPSWQPVGK_760.9_342.2 ICAM1_HUMAN 0.617
SILFLGK_389.2_577.4 THBG_HUMAN 0.616
ILPSVPK_377.2_227.2 PGH1_HUMAN 0.615
IPSNPSHR_303.2_496.3 FBLN3_HUMAN 0.615
HYFIAAVER_553.3_301.1 FA8_HUMAN 0.615
FSVVYAK_407.2_579.4 FETUA_HUMAN 0.613
VFQFLEK_455.8_276.2 CO5_HUMAN 0.613
IAPQLSTEELVSLGEK_857.5_533.3 AFAM_HUMAN 0.613
ILPSVPK_377.2_244.2 PGH1_HUMAN 0.613
NKPGVYTDVAYYLAWIR_677.0_545.3 FA12_HUMAN 0.613
WSAGLTSSQVDLYIPK_883.0_515.3 CBG_HUMAN 0.612
TPSAAYLWVGTGASEAEK_919.5_849.4 GELS_HUMAN 0.612
ALALPPLGLAPLLNLWAKPQGR_770.5_457.3 SHBG_HUMAN 0.612
QLGLPGPPDVPDHAAYHPF_676.7_299.2 ITIH4_HUMAN 0.612
ILDDLSPR_464.8_587.3 ITIH4_HUMAN 0.611
VELAPLPSWQPVGK_760.9_400.3 ICAM1_HUMAN 0.611
DADPDTFFAK_563.8_825.4 AFAM_HUMAN 0.611
NHYTESISVAK_624.8_252.1 NEUR1_HUMAN 0.611
SEPRPGVLLR_375.2_454.3 FA7_HUMAN 0.611
LNIGYIEDLK_589.3_950.5 PAI2_HUMAN 0.611
ANLINNIFELAGLGK_793.9_299.2 LCAP_HUMAN 0.609
LTTVDIVTLR_565.8_716.4 IL2RB_HUMAN 0.608
TQILEWAAER_608.8_761.4 EGLN_HUMAN 0.608
NEPEETPSIEK_636.8_573.3 SOX5_HUMAN 0.608
AQPVQVAEGSEPDGFWEALGGK_758.0_623.4 GELS_HUMAN 0.607
LQVNTPLVGASLLR_741.0_925.6 BPIA1_HUMAN 0.607
VPSHAVVAR_312.5_345.2 TRFL_HUMAN 0.607
SLQNASAIESILK_687.4_860.5 IL3_HUMAN 0.607
GVTGYFTFNLYLK_508.3_260.2 PSG5_HUMAN 0.605
DFNQFSSGEK_386.8_189.1 FETA_HUMAN 0.605
QLGLPGPPDVPDHAAYHPF_676.7_263.1 ITIH4_HUMAN 0.605
TLEAQLTPR_514.8_814.4 HEP2_HUMAN 0.604
AFTECCVVASQLR_770.9_673.4 CO5_HUMAN 0.604
LTTVDIVTLR_565.8_815.5 IL2RB_HUMAN 0.604
TLNAYDHR_330.5_312.2 PAR3_HUMAN 0.603
LWAYLTIQELLAK_781.5_300.2 ITIH1_HUMAN 0.603
GGLFADIASHPWQAAIFAK_667.4_375.2 TPA_HUMAN 0.603
IPSNPSHR_303.2_610.3 FBLN3_HUMAN 0.603
TDAPDLPEENQAR_728.3_843.4 CO5_HUMAN 0.603
SPQAFYR_434.7_684.4 REL3_HUMAN 0.602
SSNNPHSPIVEEFQVPYNK_729.4_261.2 C1S_HUMAN 0.601
AHYDLR_387.7_288.2 FETUA_HUMAN 0.600
DGSPDVTTADIGANTPDATK_973.5_844.4 PGRP2_HUMAN 0.600
SPQAFYR_434.7_556.3 REL3_HUMAN 0.600
表14.中晚期的单个统计
跃迁 蛋白质 AUC
ALNHLPLEYNSALYSR_621.0_696.4 CO6_HUMAN 0.656
VPLALFALNR_557.3_620.4 PEPD_HUMAN 0.655
ALNHLPLEYNSALYSR_621.0_538.3 CO6_HUMAN 0.652
AVYEAVLR_460.8_587.4 PEPD_HUMAN 0.649
SEPRPGVLLR_375.2_654.4 FA7_HUMAN 0.644
VFQFLEK_455.8_811.4 CO5_HUMAN 0.643
AQPVQVAEGSEPDGFWEALGGK_758.0_574.3 GELS_HUMAN 0.640
TLAFVR_353.7_492.3 FA7_HUMAN 0.639
TEQAAVAR_423.2_615.4 FA12_HUMAN 0.637
YGIEEHGK_311.5_599.3 CXA1_HUMAN 0.637
TEQAAVAR_423.2_487.3 FA12_HUMAN 0.633
QINSYVK_426.2_496.3 CBG_HUMAN 0.633
LIEIANHVDK_384.6_683.4 ADA12_HUMAN 0.633
SEYGAALAWEK_612.8_845.5 CO6_HUMAN 0.633
ALQDQLVLVAAK_634.9_956.6 ANGT_HUMAN 0.628
VLEPTLK_400.3_587.3 VTDB_HUMAN 0.628
DFNQFSSGEK_386.8_333.2 FETA_HUMAN 0.628
TYLHTYESEI_628.3_515.3 ENPP2_HUMAN 0.628
LIEIANHVDK_384.6_498.3 ADA12_HUMAN 0.626
QINSYVK_426.2_610.3 CBG_HUMAN 0.625
SLDFTELDVAAEK_719.4_316.2 ANGT_HUMAN 0.625
DPTFIPAPIQAK_433.2_461.2 ANGT_HUMAN 0.625
AVYEAVLR_460.8_750.4 PEPD_HUMAN 0.623
YENYTSSFFIR_713.8_756.4 IL12B_HUMAN 0.623
SEYGAALAWEK_612.8_788.4 CO6_HUMAN 0.623
WSAGLTSSQVDLYIPK_883.0_515.3 CBG_HUMAN 0.622
DALSSVQESQVAQQAR_573.0_502.3 APOC3_HUMAN 0.622
ALQDQLVLVAAK_634.9_289.2 ANGT_HUMAN 0.621
SLQAFVAVAAR_566.8_804.5 IL23A_HUMAN 0.621
DPTFIPAPIQAK_433.2_556.3 ANGT_HUMAN 0.620
FGFGGSTDSGPIR_649.3_946.5 ADA12_HUMAN 0.619
VLEPTLK_400.3_458.3 VTDB_HUMAN 0.619
SLDFTELDVAAEK_719.4_874.5 ANGT_HUMAN 0.618
EVFSKPISWEELLQ_852.9_376.2 FA40A_HUMAN 0.618
FGFGGSTDSGPIR_649.3_745.4 ADA12_HUMAN 0.618
TPSAAYLWVGTGASEAEK_919.5_849.4 GELS_HUMAN 0.615
LHEAFSPVSYQHDLALLR_699.4_251.2 FA12_HUMAN 0.615
TLEAQLTPR_514.8_685.4 HEP2_HUMAN 0.613
ELPQSIVYK_538.8_417.7 FBLN3_HUMAN 0.612
GYQELLEK_490.3_631.4 FETA_HUMAN 0.612
VPLALFALNR_557.3_917.6 PEPD_HUMAN 0.611
跃迁 蛋白质 AUC
DLHLSDVFLK_396.2_260.2 CO6_HUMAN 0.611
LTTVDIVTLR_565.8_815.5 IL2RB_HUMAN 0.608
WSAGLTSSQVDLYIPK_883.0_357.2 CBG_HUMAN 0.608
ITQDAQLK_458.8_702.4 CBG_HUMAN 0.608
NIQSVNVK_451.3_674.4 GROA_HUMAN 0.607
ALEQDLPVNIK_620.4_570.4 CNDP1_HUMAN 0.607
TLNAYDHR_330.5_312.2 PAR3_HUMAN 0.606
LWAYLTIQELLAK_781.5_300.2 ITIH1_HUMAN 0.606
VVGGLVALR_442.3_784.5 FA12_HUMAN 0.605
AQPVQVAEGSEPDGFWEALGGK_758.0_623.4 GELS_HUMAN 0.603
SVVLIPLGAVDDGEHSQNEK_703.0_798.4 CNDP1_HUMAN 0.603
SETEIHQGFQHLHQLFAK_717.4_318.1 CBG_HUMAN 0.603
LLAPSDSPEWLSFDVTGVVR_730.1_430.3 TGFB1_HUMAN 0.603
IEVIITLK_464.8_587.4 CXL11_HUMAN 0.602
ITQDAQLK_458.8_803.4 CBG_HUMAN 0.602
AEIEYLEK_497.8_552.3 LYAM1_HUMAN 0.601
AVDIPGLEAATPYR_736.9_399.2 TENA_HUMAN 0.601
LTTVDIVTLR_565.8_716.4 IL2RB_HUMAN 0.600
WWGGQPLWITATK_772.4_929.5 ENPP2_HUMAN 0.600
表15.晚期窗口的单个统计
跃迁 蛋白质 AUC
AVYEAVLR_460.8_587.4 PEPD_HUMAN 0.724
AEIEYLEK_497.8_552.3 LYAM1_HUMAN 0.703
QINSYVK_426.2_496.3 CBG_HUMAN 0.695
AVYEAVLR_460.8_750.4 PEPD_HUMAN 0.693
AALAAFNAQNNGSNFQLEEISR_789.1_746.4 FETUA_HUMAN 0.684
QINSYVK_426.2_610.3 CBG_HUMAN 0.681
VPLALFALNR_557.3_620.4 PEPD_HUMAN 0.678
VGVISFAQK_474.8_580.3 TFR2_HUMAN 0.674
TGVAVNKPAEFTVDAK_549.6_258.1 FLNA_HUMAN 0.670
LIEIANHVDK_384.6_683.4 ADA12_HUMAN 0.670
LIEIANHVDK_384.6_498.3 ADA12_HUMAN 0.660
SGVDLADSNQK_567.3_662.3 VGFR3_HUMAN 0.660
TSYQVYSK_488.2_787.4 C163A_HUMAN 0.657
ITQDAQLK_458.8_702.4 CBG_HUMAN 0.652
YYGYTGAFR_549.3_450.3 TRFL_HUMAN 0.650
ALEQDLPVNIK_620.4_798.5 CNDP1_HUMAN 0.650
VFQYIDLHQDEFVQTLK_708.4_375.2 CNDP1_HUMAN 0.650
SGVDLADSNQK_567.3_591.3 VGFR3_HUMAN 0.648
YENYTSSFFIR_713.8_756.4 IL12B_HUMAN 0.647
VLSSIEQK_452.3_691.4 1433S_HUMAN 0.647
跃迁 蛋白质 AUC
YSHYNER_323.5_418.2 HABP2_HUMAN 0.646
ILDGGNK_358.7_603.3 CXCL5_HUMAN 0.645
GTYLYNDCPGPGQDTDCR_697.0_666.3 TNR1A_HUMAN 0.645
AEIEYLEK_497.8_389.2 LYAM1_HUMAN 0.645
TLPFSR_360.7_506.3 LYAM1_HUMAN 0.645
DEIPHNDIALLK_459.9_510.8 HABP2_HUMAN 0.644
ALEQDLPVNIK_620.4_570.4 CNDP1_HUMAN 0.644
SPEAEDPLGVER_649.8_314.1 Z512B_HUMAN 0.644
FGFGGSTDSGPIR_649.3_745.4 ADA12_HUMAN 0.642
TASDFITK_441.7_781.4 GELS_HUMAN 0.641
SETEIHQGFQHLHQLFAK_717.4_447.2 CBG_HUMAN 0.640
SPQAFYR_434.7_556.3 REL3_HUMAN 0.639
TAVTANLDIR_537.3_288.2 CHL1_HUMAN 0.636
VPLALFALNR_557.3_917.6 PEPD_HUMAN 0.636
YISPDQLADLYK_713.4_277.2 ENOA_HUMAN 0.633
SETEIHQGFQHLHQLFAK_717.4_318.1 CBG_HUMAN 0.633
SEPRPGVLLR_375.2_654.4 FA7_HUMAN 0.633
GYQELLEK_490.3_631.4 FETA_HUMAN 0.633
AYSDLSR_406.2_375.2 SAMP_HUMAN 0.633
SVVLIPLGAVDDGEHSQNEK_703.0_798.4 CNDP1_HUMAN 0.632
TLEAQLTPR_514.8_685.4 HEP2_HUMAN 0.631
WSAGLTSSQVDLYIPK_883.0_515.3 CBG_HUMAN 0.631
TEQAAVAR_423.2_615.4 FA12_HUMAN 0.628
AQPVQVAEGSEPDGFWEALGGK_758.0_574.3 GELS_HUMAN 0.626
AGITIPR_364.2_486.3 IL17_HUMAN 0.626
AEVIWTSSDHQVLSGK_586.3_300.2 PD1L1_HUMAN 0.625
TEQAAVAR_423.2_487.3 FA12_HUMAN 0.625
NHYTESISVAK_624.8_415.2 NEUR1_HUMAN 0.625
WSAGLTSSQVDLYIPK_883.0_357.2 CBG_HUMAN 0.623
YSHYNER_323.5_581.3 HABP2_HUMAN 0.623
DFNQFSSGEK_386.8_333.2 FETA_HUMAN 0.621
NIQSVNVK_451.3_674.4 GROA_HUMAN 0.620
SVVLIPLGAVDDGEHSQNEK_703.0_286.2 CNDP1_HUMAN 0.620
TLAFVR_353.7_492.3 FA7_HUMAN 0.619
AVDIPGLEAATPYR_736.9_286.1 TENA_HUMAN 0.619
TEFLSNYLTNVDDITLVPGTLGR_846.8_600.3 ENPP2_HUMAN 0.618
YWGVASFLQK_599.8_849.5 RET4_HUMAN 0.618
TPSAAYLWVGTGASEAEK_919.5_428.2 GELS_HUMAN 0.618
DPNGLPPEAQK_583.3_669.4 RET4_HUMAN 0.617
TYLHTYESEI_628.3_908.4 ENPP2_HUMAN 0.616
SPQAFYR_434.7_684.4 REL3_HUMAN 0.616
TPSAAYLWVGTGASEAEK_919.5_849.4 GELS_HUMAN 0.615
跃迁 蛋白质 AUC
ALNHLPLEYNSALYSR_621.0_538.3 CO6_HUMAN 0.615
IEVNESGTVASSSTAVIVSAR_693.0_545.3 PAI1_HUMAN 0.615
LTTVDIVTLR_565.8_815.5 IL2RB_HUMAN 0.615
LWAYLTIQELLAK_781.5_371.2 ITIH1_HUMAN 0.613
SYTITGLQPGTDYK_772.4_352.2 FINC_HUMAN 0.612
GAVHVVVAETDYQSFAVLYLER_822.8_863.5 CO8G_HUMAN 0.612
FQLPGQK_409.2_276.1 PSG1_HUMAN 0.612
ILDGGNK_358.7_490.2 CXCL5_HUMAN 0.611
DYWSTVK_449.7_620.3 APOC3_HUMAN 0.611
AGLLRPDYALLGHR_518.0_595.4 PGRP2_HUMAN 0.611
ALNFGGIGVVVGHELTHAFDDQGR_837.1_360.2 ECE1_HUMAN 0.611
GYQELLEK_490.3_502.3 FETA_HUMAN 0.611
HATLSLSIPR_365.6_472.3 VGFR3_HUMAN 0.610
SVPVTKPVPVTKPITVTK_631.1_658.4 Z512B_HUMAN 0.610
FQLPGQK_409.2_429.2 PSG1_HUMAN 0.610
IYLQPGR_423.7_329.2 ITIH2_HUMAN 0.610
TLNAYDHR_330.5_312.2 PAR3_HUMAN 0.609
DPNGLPPEAQK_583.3_497.2 RET4_HUMAN 0.609
FGFGGSTDSGPIR_649.3_946.5 ADA12_HUMAN 0.609
TYLHTYESEI_628.3_515.3 ENPP2_HUMAN 0.608
GAVHVVVAETDYQSFAVLYLER_822.8_580.3 CO8G_HUMAN 0.608
VPSHAVVAR_312.5_515.3 TRFL_HUMAN 0.608
YWGVASFLQK_599.8_350.2 RET4_HUMAN 0.608
EWVAIESDSVQPVPR_856.4_468.3 CNDP1_HUMAN 0.607
LQDAGVYR_461.2_680.3 PD1L1_HUMAN 0.607
DLYHYITSYVVDGEIIIYGPAYSGR_955.5_650.3 PSG1_HUMAN 0.607
LWAYLTIQELLAK_781.5_300.2 ITIH1_HUMAN 0.606
ITENDIQIALDDAK_779.9_632.3 APOB_HUMAN 0.606
SYTITGLQPGTDYK_772.4_680.3 FINC_HUMAN 0.606
FFQYDTWK_567.8_712.3 IGF2_HUMAN 0.605
IYLQPGR_423.7_570.3 ITIH2_HUMAN 0.605
YNQLLR_403.7_529.4 ENOA_HUMAN 0.605
WWGGQPLWITATK_772.4_929.5 ENPP2_HUMAN 0.605
WWGGQPLWITATK_772.4_373.2 ENPP2_HUMAN 0.605
TASDFITK_441.7_710.4 GELS_HUMAN 0.605
EWVAIESDSVQPVPR_856.4_486.2 CNDP1_HUMAN 0.605
YEFLNGR_449.7_606.3 PLMN_HUMAN 0.604
SNPVTLNVLYGPDLPR_585.7_654.4 PSG6_HUMAN 0.604
ITQDAQLK_458.8_803.4 CBG_HUMAN 0.603
LTTVDIVTLR_565.8_716.4 IL2RB_HUMAN 0.602
FNAVLTNPQGDYDTSTGK_964.5_262.1 C1QC_HUMAN 0.602
ITGFLKPGK_320.9_301.2 LBP_HUMAN 0.601
跃迁 蛋白质 AUC
DYWSTVK_449.7_347.2 APOC3_HUMAN 0.601
DPTFIPAPIQAK_433.2_556.3 ANGT_HUMAN 0.601
GWVTDGFSSLK_598.8_953.5 APOC3_HUMAN 0.601
YYGYTGAFR_549.3_771.4 TRFL_HUMAN 0.601
ELPEHTVK_476.8_347.2 VTDB_HUMAN 0.601
FTFTLHLETPKPSISSSNLNPR_829.4_874.4 PSG1_HUMAN 0.601
DLYHYITSYVVDGEIIIYGPAYSGR_955.5_707.3 PSG1_HUMAN 0.601
SPQAFYR_434.7_684.4 REL3_HUMAN 0.616
TPSAAYLWVGTGASEAEK_919.5_849.4 GELS_HUMAN 0.615
ALNHLPLEYNSALYSR_621.0_538.3 CO6_HUMAN 0.615
IEVNESGTVASSSTAVIVSAR_693.0_545.3 PAI1_HUMAN 0.615
LTTVDIVTLR_565.8_815.5 IL2RB_HUMAN 0.615
LWAYLTIQELLAK_781.5_371.2 ITIH1_HUMAN 0.613
SYTITGLQPGTDYK_772.4_352.2 FINC_HUMAN 0.612
GAVHVVVAETDYQSFAVLYLER_822.8_863.5 CO8G_HUMAN 0.612
FQLPGQK_409.2_276.1 PSG1_HUMAN 0.612
DLYHYITSYVVDGEIIIYGPAYSGR_955.5_707.3 PSG1_HUMAN 0.601
表16.Lasso早期32
变量 蛋白质 系数
LIQDAVTGLTVNGQITGDK_972.0_798.4 ITIH3_HUMAN 9.53
VQTAHFK_277.5_431.2 CO8A_HUMAN 9.09
FLNWIK_410.7_560.3 HABP2_HUMAN 6.15
ITGFLKPGK_320.9_429.3 LBP_HUMAN 5.29
ELIEELVNITQNQK_557.6_517.3 IL13_HUMAN 3.83
ALNHLPLEYNSALYSR_621.0_538.3 CO6_HUMAN 3.41
DISEVVTPR_508.3_787.4 CFAB_HUMAN 0.44
AHYDLR_387.7_288.2 FETUA_HUMAN 0.1
表17.Lasso早期100
变量 蛋白质 系数
LIQDAVTGLTVNGQITGDK_972.0_798.4 ITIH3_HUMAN 6.56
ALNHLPLEYNSALYSR_621.0_538.3 CO6_HUMAN 6.51
VQTAHFK_277.5_431.2 CO8A_HUMAN 4.51
NIQSVNVK_451.3_674.4 GROA_HUMAN 3.12
TYLHTYESEI_628.3_908.4 ENPP2_HUMAN 2.68
LIENGYFHPVK_439.6_627.4 F13B_HUMAN 2.56
AVLHIGEK_289.5_292.2 THBG_HUMAN 2.11
FLNWIK_410.7_560.3 HABP2_HUMAN 1.85
ITGFLKPGK_320.9_429.3 LBP_HUMAN 1.36
DALSSVQESQVAQQAR_573.0_672.4 APOC3_HUMAN 1.3
DALSSVQESQVAQQAR_573.0_502.3 APOC3_HUMAN 0.83
FLPCENK_454.2_550.2 IL10_HUMAN 0.39
ELIEELVNITQNQK_557.6_517.3 IL13_HUMAN 0.3
TEFLSNYLTNVDDITLVPGTLGR_846.8_600.3 ENPP2_HUMAN 0.29
VSEADSSNADWVTK_754.9_347.2 CFAB_HUMAN 0.27
ITLPDFTGDLR_624.3_288.2 LBP_HUMAN 0.13
TGVAVNKPAEFTVDAK_549.6_258.1 FLNA_HUMAN 0.04
TASDFITK_441.7_781.4 GELS_HUMAN -5.91
LIQDAVTGLTVNGQITGDK_972.0_798.4 ITIH3_HUMAN 6.56
表18.Lasso蛋白质早期窗口
变量 蛋白质 系数
ALNHLPLEYNSALYSR_621.0_538.3 CO6_HUMAN 7.17
LIQDAVTGLTVNGQITGDK_972.0_798.4 ITIH3_HUMAN 6.06
LIENGYFHPVK_439.6_627.4 F13B_HUMAN 3.23
WWGGQPLWITATK_772.4_929.5 ENPP2_HUMAN 2.8
QALEEFQK_496.8_680.3 CO8B_HUMAN 2.73
NIQSVNVK_451.3_674.4 GROA_HUMAN 2.53
DALSSVQESQVAQQAR_573.0_672.4 APOC3_HUMAN 2.51
AVLHIGEK_289.5_348.7 THBG_HUMAN 2.33
FLNWIK_410.7_560.3 HABP2_HUMAN 1.05
FLPCENK_454.2_550.2 IL10_HUMAN 0.74
ITLPDFTGDLR_624.3_288.2 LBP_HUMAN 0.7
DISEVVTPR_508.3_787.4 CFAB_HUMAN 0.45
EVFSKPISWEELLQ_852.9_260.2 FA40A_HUMAN 0.17
YYGYTGAFR_549.3_450.3 TRFL_HUMAN 0.06
TASDFITK_441.7_781.4 GELS_HUMAN -7.65
表19.Lasso全部的早期窗口
变量 蛋白质 系数
FLNWIK_410.7_560.3 HABP2_HUMAN 3.74
AHYDLR_387.7_288.2 FETUA_HUMAN 0.07
ALNHLPLEYNSALYSR_621.0_538.3 CO6_HUMAN 6.07
LIQDAVTGLTVNGQITGDK_972.0_798.4 ITIH3_HUMAN 8.85
TYLHTYESEI_628.3_908.4 ENPP2_HUMAN 2.97
VQTAHFK_277.5_431.2 CO8A_HUMAN 3.36
ELIEELVNITQNQK_557.6_618.3 IL13_HUMAN 11.24
VSEADSSNADWVTK_754.9_347.2 CFAB_HUMAN 0.63
AVLHIGEK_289.5_292.2 THBG_HUMAN 0.51
TGVAVNKPAEFTVDAK_549.6_977.5 FLNA_HUMAN 0.17
LIENGYFHPVK_439.6_343.2 F13B_HUMAN 1.7
AQPVQVAEGSEPDGFWEALGGK_758.0_574.3 GELS_HUMAN -0.93
YYGYTGAFR_549.3_450.3 TRFL_HUMAN 1.4
TASDFITK_441.7_781.4 GELS_HUMAN -0.07
NIQSVNVK_451.3_674.4 GROA_HUMAN 2.12
DALSSVQESQVAQQAR_573.0_672.4 APOC3_HUMAN 1.15
DALSSVQESQVAQQAR_573.0_502.3 APOC3_HUMAN 0.09
FGFGGSTDSGPIR_649.3_745.4 ADA12_HUMAN 2.45
ALDLSLK_380.2_575.3 ITIH3_HUMAN 2.51
TLFIFGVTK_513.3_811.5 PSG4_HUMAN 4.12
ISQGEADINIAFYQR_575.6_684.4 MMP8_HUMAN 1.29
SGVDLADSNQK_567.3_591.3 VGFR3_HUMAN 0.55
GPGEDFR_389.2_322.2 PTGDS_HUMAN 0.07
DPNGLPPEAQK_583.3_669.4 RET4_HUMAN 1.36
WNFAYWAAHQPWSR_607.3_545.3 PRG2_HUMAN -1.27
ELCLDPK_437.7_359.2 IL8_HUMAN 0.3
FFQYDTWK_567.8_840.4 IGF2_HUMAN 1.83
IIEVEEEQEDPYLNDR_996.0_777.4 FBLN1_HUMAN 1.14
ECEELEEK_533.2_405.2 IL15_HUMAN 1.78
LEEHYELR_363.5_580.3 PAI2_HUMAN 0.15
LNIGYIEDLK_589.3_837.4 PAI2_HUMAN 0.32
TAVTANLDIR_537.3_288.2 CHL1_HUMAN -0.98
SWNEPLYHLVTEVR_581.6_716.4 PRL_HUMAN 1.88
ILNIFGVIK_508.8_790.5 TFR1_HUMAN 0.05
TPSAAYLWVGTGASEAEK_919.5_849.4 GELS_HUMAN -2.69
VGVISFAQK_474.8_693.4 TFR2_HUMAN -5.68
LNIGYIEDLK_589.3_950.5 PAI2_HUMAN -1.43
GQVPENEANVVITTLK_571.3_462.3 CADH1_HUMAN -0.55
STPSLTTK_417.7_549.3 IL6RA_HUMAN -0.59
ALLLGWVPTR_563.3_373.2 PAR4_HUMAN -0.97
表20:Lasso SummedCoef早期窗口
Figure BDA0000847619590001091
Figure BDA0000847619590001101
Figure BDA0000847619590001111
Figure BDA0000847619590001121
Figure BDA0000847619590001131
Figure BDA0000847619590001141
Figure BDA0000847619590001151
表21.lasso32中期窗口
变量 UniProt_ID 系数
SEYGAALAWEK_612.8_788.4 CO6_HUMAN 6.99
VFQFLEK_455.8_811.4 CO5_HUMAN 6.43
VLEPTLK_400.3_458.3 VTDB_HUMAN 3.99
SLDFTELDVAAEK_719.4_316.2 ANGT_HUMAN 3.33
TLAFVR_353.7_492.3 FA7_HUMAN 2.44
YGIEEHGK_311.5_599.3 CXA1_HUMAN 2.27
LHEAFSPVSYQHDLALLR_699.4_251.2 FA12_HUMAN 2.14
QGHNSVFLIK_381.6_520.4 HEMO_HUMAN 0.25
LLAPSDSPEWLSFDVTGVVR_730.1_430.3 TGFB1_HUMAN -2.81
ELPQSIVYK_538.8_417.7 FBLN3_HUMAN -3.46
VNHVTLSQPK_374.9_244.2 B2MG_HUMAN -6.61
表22.lasso100中期窗口
变量 UniProt_ID 系数
VFQFLEK_455.8_811.4 CO5_HUMAN 6.89
SEYGAALAWEK_612.8_788.4 CO6_HUMAN 4.67
GEVTYTTSQVSK_650.3_750.4 EGLN_HUMAN 3.4
QVFAVQR_424.2_473.3 ELNE_HUMAN 1.94
VELAPLPSWQPVGK_760.9_342.2 ICAM1_HUMAN 1.91
LHEAFSPVSYQHDLALLR_699.4_251.2 FA12_HUMAN 1.8
SLDFTELDVAAEK_719.4_316.2 ANGT_HUMAN 1.67
YGIEEHGK_311.5_599.3 CXA1_HUMAN 1.53
YGIEEHGK_311.5_341.2 CXA1_HUMAN 1.51
HYINLITR_515.3_301.1 NPY_HUMAN 1.47
TLAFVR_353.7_492.3 FA7_HUMAN 1.46
GVTGYFTFNLYLK_508.3_260.2 PSG5_HUMAN 1.28
FSLVSGWGQLLDR_493.3_403.2 FA7_HUMAN 0.84
DALSSVQESQVAQQAR_573.0_502.3 APOC3_HUMAN 0.41
VELAPLPSWQPVGK_760.9_400.3 ICAM1_HUMAN 0.3
AVDIPGLEAATPYR_736.9_399.2 TENA_HUMAN -0.95
ELPQSIVYK_538.8_417.7 FBLN3_HUMAN -1.54
DVLLLVHNLPQNLTGHIWYK_791.8_310.2 PSG7_HUMAN -1.54
VPLALFALNR_557.3_620.4 PEPD_HUMAN -1.91
LLAPSDSPEWLSFDVTGVVR_730.1_430.3 TGFB1_HUMAN -2.3
VNHVTLSQPK_374.9_244.2 B2MG_HUMAN -3.6
EVFSKPISWEELLQ_852.9_376.2 FA40A_HUMAN -3.96
表23.Lasso蛋白质中期窗口
变量 UniProt_ID 系数
SEYGAALAWEK_612.8_788.4 CO6_HUMAN 5.84
VFQFLEK_455.8_811.4 CO5_HUMAN 5.58
SLDFTELDVAAEK_719.4_316.2 ANGT_HUMAN 2.11
TLAFVR_353.7_492.3 FA7_HUMAN 1.83
LHEAFSPVSYQHDLALLR_699.4_251.2 FA12_HUMAN 1.62
HYINLITR_515.3_301.1 NPY_HUMAN 1.39
VLEPTLK_400.3_458.3 VTDB_HUMAN 1.37
YGIEEHGK_311.5_599.3 CXA1_HUMAN 1.17
VELAPLPSWQPVGK_760.9_342.2 ICAM1_HUMAN 1.13
QVFAVQR_424.2_473.3 ELNE_HUMAN 0.79
ANLINNIFELAGLGK_793.9_299.2 LCAP_HUMAN 0.23
DVLLLVHNLPQNLTGHIWYK_791.8_310.2 PSG7_HUMAN -0.61
VEHSDLSFSK_383.5_234.1 B2MG_HUMAN -0.69
AVDIPGLEAATPYR_736.9_399.2 TENA_HUMAN -0.85
VPLALFALNR_557.3_620.4 PEPD_HUMAN -1.45
ELPQSIVYK_538.8_417.7 FBLN3_HUMAN -1.9
LLAPSDSPEWLSFDVTGVVR_730.1_430.3 TGFB1_HUMAN -2.07
EVFSKPISWEELLQ_852.9_376.2 FA40A_HUMAN -2.32
表24.Lasso全部的中期窗口
变量 UniProt_ID 系数
SEYGAALAWEK_612.8_788.4 CO6_HUMAN 2.48
VFQFLEK_455.8_811.4 CO5_HUMAN 2.41
SLDFTELDVAAEK_719.4_316.2 ANGT_HUMAN 1.07
YGIEEHGK_311.5_599.3 CXA1_HUMAN 0.64
VLEPTLK_400.3_458.3 VTDB_HUMAN 0.58
LHEAFSPVSYQHDLALLR_699.4_251.2 FA12_HUMAN 0.21
LLAPSDSPEWLSFDVTGVVR_730.1_430.3 TGFB1_HUMAN -0.62
VNHVTLSQPK_374.9_244.2 B2MG_HUMAN -1.28
表25.Lasso32中晚期窗口
变量 UniProt_ID 系数
SEYGAALAWEK_612.8_845.5 CO6_HUMAN 4.35
TLAFVR_353.7_492.3 FA7_HUMAN 2.42
YGIEEHGK_311.5_599.3 CXA1_HUMAN 1.46
DFNQFSSGEK_386.8_333.2 FETA_HUMAN 1.37
VFQFLEK_455.8_811.4 CO5_HUMAN 0.89
LIEIANHVDK_384.6_683.4 ADA12_HUMAN 0.85
QINSYVK_426.2_496.3 CBG_HUMAN 0.56
TYLHTYESEI_628.3_515.3 ENPP2_HUMAN 0.53
SLQAFVAVAAR_566.8_804.5 IL23A_HUMAN 0.39
TEQAAVAR_423.2_615.4 FA12_HUMAN 0.26
VLEPTLK_400.3_587.3 VTDB_HUMAN 0.24
AQPVQVAEGSEPDGFWEALGGK_758.0_574.3 GELS_HUMAN -2.08
VPLALFALNR_557.3_620.4 PEPD_HUMAN -2.09
AVYEAVLR_460.8_587.4 PEPD_HUMAN -3.37
表26.Lasso100中晚期窗口
变量 UniProt_ID 系数
VFQFLEK_455.8_811.4 CO5_HUMAN 3.82
SEYGAALAWEK_612.8_845.5 CO6_HUMAN 2.94
YGIEEHGK_311.5_599.3 CXA1_HUMAN 2.39
DPTFIPAPIQAK_433.2_556.3 ANGT_HUMAN 2.05
TLAFVR_353.7_492.3 FA7_HUMAN 1.9
NQSPVLEPVGR_598.3_866.5 KS6A3_HUMAN 1.87
ALNHLPLEYNSALYSR_621.0_538.3 CO6_HUMAN 1.4
TQILEWAAER_608.8_761.4 EGLN_HUMAN 1.29
VVGGLVALR_442.3_784.5 FA12_HUMAN 1.24
QINSYVK_426.2_496.3 CBG_HUMAN 1.14
YGIEEHGK_311.5_341.2 CXA1_HUMAN 0.84
ALEQDLPVNIK_620.4_570.4 CNDP1_HUMAN 0.74
GTYLYNDCPGPGQDTDCR_697.0_666.3 TNR1A_HUMAN 0.51
SLQNASAIESILK_687.4_860.5 IL3_HUMAN 0.44
DLHLSDVFLK_396.2_260.2 CO6_HUMAN 0.38
LIEIANHVDK_384.6_683.4 ADA12_HUMAN 0.37
NIQSVNVK_451.3_674.4 GROA_HUMAN 0.3
FFQYDTWK_567.8_712.3 IGF2_HUMAN 0.19
ANLINNIFELAGLGK_793.9_299.2 LCAP_HUMAN 0.19
TYLHTYESEI_628.3_515.3 ENPP2_HUMAN 0.15
AALAAFNAQNNGSNFQLEEISR_789.1_746.4 FETUA_HUMAN -0.09
AQPVQVAEGSEPDGFWEALGGK_758.0_574.3 GELS_HUMAN -0.52
TSYQVYSK_488.2_787.4 C163A_HUMAN -0.62
AVDIPGLEAATPYR_736.9_399.2 TENA_HUMAN -1.29
TAHISGLPPSTDFIVYLSGLAPSIR_871.5_472.3 TENA_HUMAN -1.53
AEIEYLEK_497.8_552.3 LYAM1_HUMAN -1.73
LLAPSDSPEWLSFDVTGVVR_730.1_430.3 TGFB1_HUMAN -1.95
VPLALFALNR_557.3_620.4 PEPD_HUMAN -2.9
AVYEAVLR_460.8_587.4 PEPD_HUMAN -3.04
ELPQSIVYK_538.8_417.7 FBLN3_HUMAN -3.49
EVFSKPISWEELLQ_852.9_376.2 FA40A_HUMAN -3.71
表27.Lasso蛋白质中晚期窗口
变量 UniProt_ID 系数
VFQFLEK_455.8_811.4 CO5_HUMAN 4.25
ALNHLPLEYNSALYSR_621.0_696.4 CO6_HUMAN 3.06
YGIEEHGK_311.5_599.3 CXA1_HUMAN 2.36
SEPRPGVLLR_375.2_654.4 FA7_HUMAN 2.11
TQILEWAAER_608.8_761.4 EGLN_HUMAN 1.81
NQSPVLEPVGR_598.3_866.5 KS6A3_HUMAN 1.79
TEQAAVAR_423.2_615.4 FA12_HUMAN 1.72
QINSYVK_426.2_496.3 CBG_HUMAN 0.98
ALEQDLPVNIK_620.4_570.4 CNDP1_HUMAN 0.98
NCSFSIIYPVVIK_770.4_555.4 CRHBP_HUMAN 0.76
LIEIANHVDK_384.6_683.4 ADA12_HUMAN 0.63
SLQNASAIESILK_687.4_860.5 IL3_HUMAN 0.59
ANLINNIFELAGLGK_793.9_299.2 LCAP_HUMAN 0.55
GTYLYNDCPGPGQDTDCR_697.0_666.3 TNR1A_HUMAN 0.55
TYLHTYESEI_628.3_515.3 ENPP2_HUMAN 0.46
NIQSVNVK_451.3_674.4 GROA_HUMAN 0.22
LTTVDIVTLR_565.8_815.5 IL2RB_HUMAN 0.11
FFQYDTWK_567.8_712.3 IGF2_HUMAN 0.01
TSYQVYSK_488.2_787.4 C163A_HUMAN -0.76
AQPVQVAEGSEPDGFWEALGGK_758.0_574.3 GELS_HUMAN -1.31
AEIEYLEK_497.8_552.3 LYAM1_HUMAN -1.59
LLAPSDSPEWLSFDVTGVVR_730.1_430.3 TGFB1_HUMAN -1.73
AVDIPGLEAATPYR_736.9_399.2 TENA_HUMAN -2.02
EVFSKPISWEELLQ_852.9_376.2 FA40A_HUMAN -3
TGVAVNKPAEFTVDAK_549.6_258.1 FLNA_HUMAN -3.15
ELPQSIVYK_538.8_417.7 FBLN3_HUMAN -3.49
VNHVTLSQPK_374.9_244.2 B2MG_HUMAN -3.82
VPLALFALNR_557.3_620.4 PEPD_HUMAN -4.94
表28.Lasso全部的中晚期窗口
变量 UniProt_ID 系数
ALNHLPLEYNSALYSR_621.0_538.3 CO6_HUMAN 2.38
TLAFVR_353.7_492.3 FA7_HUMAN 0.96
YGIEEHGK_311.5_599.3 CXA1_HUMAN 0.34
DPTFIPAPIQAK_433.2_461.2 ANGT_HUMAN 0.33
DFNQFSSGEK_386.8_333.2 FETA_HUMAN 0.13
QINSYVK_426.2_496.3 CBG_HUMAN 0.03
TYLHTYESEI_628.3_515.3 ENPP2_HUMAN 0
AQPVQVAEGSEPDGFWEALGGK_758.0_574.3 GELS_HUMAN -0.02
AEIEYLEK_497.8_552.3 LYAM1_HUMAN -0.05
VNHVTLSQPK_374.9_244.2 B2MG_HUMAN -0.12
LLAPSDSPEWLSFDVTGVVR_730.1_430.3 TGFB1_HUMAN -0.17
EVFSKPISWEELLQ_852.9_376.2 FA40A_HUMAN -0.31
AVDIPGLEAATPYR_736.9_399.2 TENA_HUMAN -0.35
VPLALFALNR_557.3_620.4 PEPD_HUMAN -0.43
AVYEAVLR_460.8_587.4 PEPD_HUMAN -2.33
表29.Lasso 32晚期窗口
变量 UniProt_ID 系数
QINSYVK_426.2_610.3 CBG_HUMAN 3.24
ILDGGNK_358.7_603.3 CXCL5_HUMAN 2.65
VFQYIDLHQDEFVQTLK_708.4_375.2 CNDP1_HUMAN 2.55
SGVDLADSNQK_567.3_662.3 VGFR3_HUMAN 2.12
YSHYNER_323.5_418.2 HABP2_HUMAN 1.63
DEIPHNDIALLK_459.9_510.8 HABP2_HUMAN 1.22
SGVDLADSNQK_567.3_591.3 VGFR3_HUMAN 0.96
FGFGGSTDSGPIR_649.3_745.4 ADA12_HUMAN 0.86
GTYLYNDCPGPGQDTDCR_697.0_666.3 TNR1A_HUMAN 0.45
TSYQVYSK_488.2_787.4 C163A_HUMAN -1.73
TGVAVNKPAEFTVDAK_549.6_258.1 FLNA_HUMAN -2.56
SPEAEDPLGVER_649.8_314.1 Z512B_HUMAN -3.04
VPLALFALNR_557.3_620.4 PEPD_HUMAN -3.33
YYGYTGAFR_549.3_450.3 TRFL_HUMAN -4.24
AVYEAVLR_460.8_587.4 PEPD_HUMAN -5.83
AEIEYLEK_497.8_552.3 LYAM1_HUMAN -6.52
AALAAFNAQNNGSNFQLEEISR_789.1_746.4 FETUA_HUMAN -6.55
表30:Lasso 100晚期窗口
变量 UniProt_ID 系数
SGVDLADSNQK_567.3_662.3 VGFR3_HUMAN 4.13
ILDGGNK_358.7_603.3 CXCL5_HUMAN 3.57
QINSYVK_426.2_610.3 CBG_HUMAN 3.41
DEIPHNDIALLK_459.9_510.8 HABP2_HUMAN 1.64
VFQYIDLHQDEFVQTLK_708.4_375.2 CNDP1_HUMAN 1.57
FGFGGSTDSGPIR_649.3_745.4 ADA12_HUMAN 1.45
LTTVDIVTLR_565.8_815.5 IL2RB_HUMAN 0.71
YSHYNER_323.5_418.2 HABP2_HUMAN 0.68
FFQYDTWK_567.8_712.3 IGF2_HUMAN 0.42
IEVNESGTVASSSTAVIVSAR_693.0_545.3 PAI1_HUMAN 0.36
GTYLYNDCPGPGQDTDCR_697.0_666.3 TNR1A_HUMAN 0.21
LIEIANHVDK_384.6_683.4 ADA12_HUMAN 0.1
VGVISFAQK_474.8_580.3 TFR2_HUMAN 0.08
TSYQVYSK_488.2_787.4 C163A_HUMAN -0.36
ALNFGGIGVVVGHELTHAFDDQGR_837.1_360.2 ECE1_HUMAN -0.65
AYSDLSR_406.2_375.2 SAMP_HUMAN -1.23
TGVAVNKPAEFTVDAK_549.6_258.1 FLNA_HUMAN -1.63
SPEAEDPLGVER_649.8_314.1 Z512B_HUMAN -2.29
YYGYTGAFR_549.3_450.3 TRFL_HUMAN -2.58
VPLALFALNR_557.3_620.4 PEPD_HUMAN -2.73
YISPDQLADLYK_713.4_277.2 ENOA_HUMAN -2.87
AVDIPGLEAATPYR_736.9_286.1 TENA_HUMAN -3.9
AEIEYLEK_497.8_552.3 LYAM1_HUMAN -5.29
AVYEAVLR_460.8_587.4 PEPD_HUMAN -5.51
AALAAFNAQNNGSNFQLEEISR_789.1_746.4 FETUA_HUMAN -6.49
表31:Lasso蛋白质晚期窗口
变量 UniProt_ID 系数
SGVDLADSNQK_567.3_662.3 VGFR3_HUMAN 3.33
ILDGGNK_358.7_603.3 CXCL5_HUMAN 3.25
QINSYVK_426.2_496.3 CBG_HUMAN 2.41
YSHYNER_323.5_418.2 HABP2_HUMAN 1.82
ALEQDLPVNIK_620.4_798.5 CNDP1_HUMAN 1.32
LIEIANHVDK_384.6_683.4 ADA12_HUMAN 1.27
GTYLYNDCPGPGQDTDCR_697.0_666.3 TNR1A_HUMAN 0.26
IEVNESGTVASSSTAVIVSAR_693.0_545.3 PAI1_HUMAN 0.18
LTTVDIVTLR_565.8_815.5 IL2RB_HUMAN 0.18
TSYQVYSK_488.2_787.4 C163A_HUMAN -0.11
TGVAVNKPAEFTVDAK_549.6_258.1 FLNA_HUMAN -0.89
AYSDLSR_406.2_375.2 SAMP_HUMAN -1.47
SPEAEDPLGVER_649.8_314.1 Z512B_HUMAN -1.79
YYGYTGAFR_549.3_450.3 TRFL_HUMAN -2.22
YISPDQLADLYK_713.4_277.2 ENOA_HUMAN -2.41
AVDIPGLEAATPYR_736.9_286.1 TENA_HUMAN -2.94
AEIEYLEK_497.8_552.3 LYAM1_HUMAN -5.18
AALAAFNAQNNGSNFQLEEISR_789.1_746.4 FETUA_HUMAN -5.71
AVYEAVLR_460.8_587.4 PEPD_HUMAN -7.33
表32:Lasso全部的晚期窗口
变量 UniProt_ID 系数
QINSYVK_426.2_496.3 CBG_HUMAN 0.5
DEIPHNDIALLK_459.9_510.8 HABP2_HUMAN 0.15
ALEQDLPVNIK_620.4_570.4 CNDP1_HUMAN 0.11
ILDGGNK_358.7_603.3 CXCL5_HUMAN 0.08
LIEIANHVDK_384.6_683.4 ADA12_HUMAN 0.06
YYGYTGAFR_549.3_450.3 TRFL_HUMAN -0.39
AALAAFNAQNNGSNFQLEEISR_789.1_746.4 FETUA_HUMAN -1.57
AEIEYLEK_497.8_552.3 LYAM1_HUMAN -2.46
AVYEAVLR_460.8_587.4 PEPD_HUMAN -2.92
表33:随机森林32早期窗口
变量 蛋白质 平均降低Gini
ELIEELVNITQNQK_557.6_517.3 IL13_HUMAN 3.224369171
AHYDLR_387.7_288.2 FETUA_HUMAN 1.869007658
FSVVYAK_407.2_381.2 FETUA_HUMAN 1.770198171
ITLPDFTGDLR_624.3_288.2 LBP_HUMAN 1.710936472
ITGFLKPGK_320.9_301.2 LBP_HUMAN 1.623922439
ITGFLKPGK_320.9_429.3 LBP_HUMAN 1.408035272
ELIEELVNITQNQK_557.6_618.3 IL13_HUMAN 1.345412168
VFQFLEK_455.8_811.4 CO5_HUMAN 1.311332013
VQTAHFK_277.5_431.2 CO8A_HUMAN 1.308902373
FLNWIK_410.7_560.3 HABP2_HUMAN 1.308093745
DAGLSWGSAR_510.3_390.2 NEUR4_HUMAN 1.297033607
TLLPVSKPEIR_418.3_288.2 CO5_HUMAN 1.291280928
LIQDAVTGLTVNGQITGDK_972.0_798.4 ITIH3_HUMAN 1.28622301
QALEEFQK_496.8_680.3 CO8B_HUMAN 1.191731825
FSVVYAK_407.2_579.4 FETUA_HUMAN 1.078909138
ITLPDFTGDLR_624.3_920.5 LBP_HUMAN 1.072613747
AHYDLR_387.7_566.3 FETUA_HUMAN 1.029562263
ALNHLPLEYNSALYSR_621.0_538.3 CO6_HUMAN 1.00992071
DVLLLVHNLPQNLPGYFWYK_810.4_967.5 PSG9_HUMAN 1.007095529
SFRPFVPR_335.9_635.3 LBP_HUMAN 0.970312536
SDLEVAHYK_531.3_617.3 CO8B_HUMAN 0.967904893
VQEAHLTEDQIFYFPK_655.7_701.4 CO8G_HUMAN 0.960398254
VFQFLEK_455.8_276.2 CO5_HUMAN 0.931652095
SLLQPNK_400.2_599.4 CO8A_HUMAN 0.926470249
SFRPFVPR_335.9_272.2 LBP_HUMAN 0.911599611
FLNWIK_410.7_561.3 HABP2_HUMAN 0.852022868
LSSPAVITDK_515.8_743.4 PLMN_HUMAN 0.825455824
DVLLLVHNLPQNLPGYFWYK_810.4_594.3 PSG9_HUMAN 0.756797142
ALVLELAK_428.8_672.4 INHBE_HUMAN 0.748802555
DISEVVTPR_508.3_787.4 CFAB_HUMAN 0.733731518
表34.随机森林100早期窗口
变量 蛋白质 平均降低Gini
ELIEELVNITQNQK_557.6_517.3 IL13_HUMAN 1.709778508
LPNNVLQEK_527.8_844.5 AFAM_HUMAN 0.961692716
AHYDLR_387.7_288.2 FETUA_HUMAN 0.901586746
ITLPDFTGDLR_624.3_288.2 LBP_HUMAN 0.879119498
IEGNLIFDPNNYLPK_874.0_414.2 APOB_HUMAN 0.842483095
ITGFLKPGK_320.9_301.2 LBP_HUMAN 0.806905233
FSVVYAK_407.2_381.2 FETUA_HUMAN 0.790429706
ITGFLKPGK_320.9_429.3 LBP_HUMAN 0.710312386
VFQFLEK_455.8_811.4 CO5_HUMAN 0.709531553
LIQDAVTGLTVNGQITGDK_972.0_798.4 ITIH3_HUMAN 0.624325189
DADPDTFFAK_563.8_825.4 AFAM_HUMAN 0.618684313
FLNWIK_410.7_560.3 HABP2_HUMAN 0.617501242
TASDFITK_441.7_781.4 GELS_HUMAN 0.609275999
DAGLSWGSAR_510.3_390.2 NEUR4_HUMAN 0.588718595
VQTAHFK_277.5_431.2 CO8A_HUMAN 0.58669845
TLLPVSKPEIR_418.3_288.2 CO5_HUMAN 0.5670608
ELIEELVNITQNQK_557.6_618.3 IL13_HUMAN 0.555624783
TYLHTYESEI_628.3_908.4 ENPP2_HUMAN 0.537678415
HFQNLGK_422.2_527.2 AFAM_HUMAN 0.535543137
TASDFITK_441.7_710.4 GELS_HUMAN 0.532743323
ITLPDFTGDLR_624.3_920.5 LBP_HUMAN 0.51667902
QALEEFQK_496.8_680.3 CO8B_HUMAN 0.511314017
AVLHIGEK_289.5_348.7 THBG_HUMAN 0.510284122
FSVVYAK_407.2_579.4 FETUA_HUMAN 0.503907813
LPNNVLQEK_527.8_730.4 AFAM_HUMAN 0.501281631
AHYDLR_387.7_566.3 FETUA_HUMAN 0.474166711
IAPQLSTEELVSLGEK_857.5_333.2 AFAM_HUMAN 0.459595701
WWGGQPLWITATK_772.4_929.5 ENPP2_HUMAN 0.44680777
TYLHTYESEI_628.3_515.3 ENPP2_HUMAN 0.434157773
DALSSVQESQVAQQAR_573.0_502.3 APOC3_HUMAN 0.432484862
表35.随机森林蛋白质早期窗口
变量 蛋白质 平均降低Gini
ELIEELVNITQNQK_557.6_517.3 IL13_HUMAN 2.881452809
LPNNVLQEK_527.8_844.5 AFAM_HUMAN 1.833987752
ITLPDFTGDLR_624.3_288.2 LBP_HUMAN 1.608843881
IEGNLIFDPNNYLPK_874.0_414.2 APOB_HUMAN 1.594658208
VFQFLEK_455.8_811.4 CO5_HUMAN 1.290134412
LIQDAVTGLTVNGQITGDK_972.0_798.4 ITIH3_HUMAN 1.167981736
TASDFITK_441.7_781.4 GELS_HUMAN 1.152847453
DAGLSWGSAR_510.3_390.2 NEUR4_HUMAN 1.146752656
FSVVYAK_407.2_579.4 FETUA_HUMAN 1.060168583
AVLHIGEK_289.5_348.7 THBG_HUMAN 1.033625773
FLNWIK_410.7_560.3 HABP2_HUMAN 1.022356789
QALEEFQK_496.8_680.3 CO8B_HUMAN 0.990074129
DVLLLVHNLPQNLPGYFWYK_810.4_967.5 PSG9_HUMAN 0.929633865
WWGGQPLWITATK_772.4_929.5 ENPP2_HUMAN 0.905895642
VQEAHLTEDQIFYFPK_655.7_701.4 CO8G_HUMAN 0.883887371
NNQLVAGYLQGPNVNLEEK_700.7_999.5 IL1RA_HUMAN 0.806472085
SLLQPNK_400.2_599.4 CO8A_HUMAN 0.783623222
DALSSVQESQVAQQAR_573.0_672.4 APOC3_HUMAN 0.774365756
NIQSVNVK_451.3_674.4 GROA_HUMAN 0.767963386
HPWIVHWDQLPQYQLNR_744.0_1047.0 KS6A3_HUMAN 0.759960139
TTSDGGYSFK_531.7_860.4 INHA_HUMAN 0.732813448
ALNHLPLEYNSALYSR_621.0_538.3 CO6_HUMAN 0.718779092
LSSPAVITDK_515.8_743.4 PLMN_HUMAN 0.699547739
TGVAVNKPAEFTVDAK_549.6_258.1 FLNA_HUMAN 0.693159192
TLNAYDHR_330.5_312.2 PAR3_HUMAN 0.647300964
DISEVVTPR_508.3_787.4 CFAB_HUMAN 0.609165621
LIENGYFHPVK_439.6_627.4 F13B_HUMAN 0.60043345
SGVDLADSNQK_567.3_662.3 VGFR3_HUMAN 0.596079858
ALQDQLVLVAAK_634.9_289.2 ANGT_HUMAN 0.579034994
ALVLELAK_428.8_672.4 INHBE_HUMAN 0.573458483
表36.随机森林全部的早期窗口
变量 蛋白质 平均降低Gini
ELIEELVNITQNQK_557.6_517.3 IL13_HUMAN 0.730972421
ITLPDFTGDLR_624.3_288.2 LBP_HUMAN 0.409808774
AHYDLR_387.7_288.2 FETUA_HUMAN 0.409298983
FSVVYAK_407.2_381.2 FETUA_HUMAN 0.367730833
ITGFLKPGK_320.9_301.2 LBP_HUMAN 0.350485117
VFQFLEK_455.8_811.4 CO5_HUMAN 0.339289475
ELIEELVNITQNQK_557.6_618.3 IL13_HUMAN 0.334303166
LPNNVLQEK_527.8_844.5 AFAM_HUMAN 0.329800706
IEGNLIFDPNNYLPK_874.0_414.2 APOB_HUMAN 0.325596677
ITGFLKPGK_320.9_429.3 LBP_HUMAN 0.31473104
FLNWIK_410.7_560.3 HABP2_HUMAN 0.299810081
LIQDAVTGLTVNGQITGDK_972.0_798.4 ITIH3_HUMAN 0.295613448
ITLPDFTGDLR_624.3_920.5 LBP_HUMAN 0.292212699
DAGLSWGSAR_510.3_390.2 NEUR4_HUMAN 0.285812225
TLLPVSKPEIR_418.3_288.2 CO5_HUMAN 0.280857718
FSVVYAK_407.2_579.4 FETUA_HUMAN 0.278531322
DADPDTFFAK_563.8_825.4 AFAM_HUMAN 0.258938798
AHYDLR_387.7_566.3 FETUA_HUMAN 0.256160046
QALEEFQK_496.8_680.3 CO8B_HUMAN 0.245543641
HTLNQIDEVK_598.8_951.5 FETUA_HUMAN 0.239528081
TASDFITK_441.7_781.4 GELS_HUMAN 0.227485958
VFQFLEK_455.8_276.2 CO5_HUMAN 0.226172392
DVLLLVHNLPQNLPGYFWYK_810.4_967.5 PSG9_HUMAN 0.218613384
VQTAHFK_277.5_431.2 CO8A_HUMAN 0.217171548
SFRPFVPR_335.9_635.3 LBP_HUMAN 0.214798112
HFQNLGK_422.2_527.2 AFAM_HUMAN 0.211756476
SVSLPSLDPASAK_636.4_473.3 APOB_HUMAN 0.211319422
FGFGGSTDSGPIR_649.3_745.4 ADA12_HUMAN 0.206574494
HFQNLGK_422.2_285.1 AFAM_HUMAN 0.204024196
跃迁 蛋白质 加和最佳Gini
ELIEELVNITQNQK_557.6_517.3 IL13_HUMAN 242.5373659
VFQFLEK_455.8_811.4 CO5_HUMAN 115.1113943
FLNWIK_410.7_560.3 HABP2_HUMAN 107.4572447
ITLPDFTGDLR_624.3_288.2 LBP_HUMAN 104.0742727
LIQDAVTGLTVNGQITGDK_972.0_798.4 ITIH3_HUMAN 103.3238077
DAGLSWGSAR_510.3_390.2 NEUR4_HUMAN 70.4151533
AHYDLR_387.7_288.2 FETUA_HUMAN 140.2670822
FSVVYAK_407.2_381.2 FETUA_HUMAN 121.3664352
LPNNVLQEK_527.8_844.5 AFAM_HUMAN 115.5211679
ITGFLKPGK_320.9_429.3 LBP_HUMAN 114.9512704
ITGFLKPGK_320.9_301.2 LBP_HUMAN 112.916627
IEGNLIFDPNNYLPK_874.0_414.2 APOB_HUMAN 52.21169288
VQTAHFK_277.5_431.2 CO8A_HUMAN 144.5237215
TLLPVSKPEIR_418.3_288.2 CO5_HUMAN 96.16982897
QALEEFQK_496.8_680.3 CO8B_HUMAN 85.35050759
FSVVYAK_407.2_579.4 FETUA_HUMAN 73.23969945
ELIEELVNITQNQK_557.6_618.3 IL13_HUMAN 61.61450671
TASDFITK_441.7_781.4 GELS_HUMAN 61.32155633
DVLLLVHNLPQNLPGYFWYK_810.4_967.5 PSG9_HUMAN 99.68404123
AVLHIGEK_289.5_348.7 THBG_HUMAN 69.96748485
ITLPDFTGDLR_624.3_920.5 LBP_HUMAN 56.66810872
WWGGQPLWITATK_772.4_929.5 ENPP2_HUMAN 56.54173176
VQEAHLTEDQIFYFPK_655.7_701.4 CO8G_HUMAN 47.92505575
DADPDTFFAK_563.8_825.4 AFAM_HUMAN 40.34147696
DALSSVQESQVAQQAR_573.0_502.3 APOC3_HUMAN 145.0311483
FGFGGSTDSGPIR_649.3_745.4 ADA12_HUMAN 109.4072996
FLPCENK_454.2_550.2 IL10_HUMAN 105.7756691
VQTAHFK_277.5_502.3 CO8A_HUMAN 101.5877845
VFQFLEK_455.8_276.2 CO5_HUMAN 95.71159157
TYLHTYESEI_628.3_908.4 ENPP2_HUMAN 94.92157517
ALNHLPLEYNSALYSR_621.0_538.3 CO6_HUMAN 90.67568777
NKPGVYTDVAYYLAWIR_677.0_545.3 FA12_HUMAN 90.35890105
LEEHYELR_363.5_580.3 PAI2_HUMAN 88.44833508
HPWIVHWDQLPQYQLNR_744.0_1047.0 KS6A3_HUMAN 88.37680942
HTLNQIDEVK_598.8_951.5 FETUA_HUMAN 87.63064143
LPNNVLQEK_527.8_730.4 AFAM_HUMAN 86.64484642
ALDLSLK_380.2_575.3 ITIH3_HUMAN 83.51201287
YGIEEHGK_311.5_599.3 CXA1_HUMAN 82.47620831
LSSPAVITDK_515.8_830.5 PLMN_HUMAN 81.5433587
LEEHYELR_363.5_288.2 PAI2_HUMAN 79.01571985
NVIQISNDLENLR_509.9_402.3 LEP_HUMAN 78.86670236
SGFSFGFK_438.7_732.4 CO8B_HUMAN 78.71961929
SDLEVAHYK_531.3_617.3 CO8B_HUMAN 78.24005567
NADYSYSVWK_616.8_333.2 CO5_HUMAN 76.07974354
AHYDLR_387.7_566.3 FETUA_HUMAN 74.68253347
AVLHIGEK_289.5_348.7 THBG_HUMAN 0.201102917
表37.随机森林加和的Gini的早期窗口
跃迁 蛋白质 加和最佳Gini
GAVHVVVAETDYQSFAVLYLER_822.8_580.3 CO8G_HUMAN 73.75860248
LIENGYFHPVK_439.6_627.4 F13B_HUMAN 73.74965194
ALDLSLK_380.2_185.1 ITIH3_HUMAN 72.760739
WWGGQPLWITATK_772.4_373.2 ENPP2_HUMAN 72.51936706
FGFGGSTDSGPIR_649.3_946.5 ADA12_HUMAN 72.49183198
GLQYAAQEGLLALQSELLR_1037.1_929.5 LBP_HUMAN 67.17588648
HFQNLGK_422.2_527.2 AFAM_HUMAN 66.11702719
YSHYNER_323.5_581.3 HABP2_HUMAN 65.56238612
ISQGEADINIAFYQR_575.6_684.4 MMP8_HUMAN 65.50301246
TGVAVNKPAEFTVDAK_549.6_258.1 FLNA_HUMAN 64.85259525
NIQSVNVK_451.3_674.4 GROA_HUMAN 64.53010225
DALSSVQESQVAQQAR_573.0_672.4 APOC3_HUMAN 64.12149927
SLLQPNK_400.2_599.4 CO8A_HUMAN 62.68167847
SFRPFVPR_335.9_635.3 LBP_HUMAN 61.90157662
NNQLVAGYLQGPNVNLEEK_700.7_999.5 IL1RA_HUMAN 61.54435815
LYYGDDEK_501.7_563.2 CO8A_HUMAN 60.16700473
SWNEPLYHLVTEVR_581.6_716.4 PRL_HUMAN 59.78209065
SGVDLADSNQK_567.3_662.3 VGFR3_HUMAN 58.93982896
GTYLYNDCPGPGQDTDCR_697.0_335.2 TNR1A_HUMAN 58.72963941
HATLSLSIPR_365.6_472.3 VGFR3_HUMAN 57.98669834
FIVGFTR_420.2_261.2 CCL20_HUMAN 57.23165578
QNYHQDSEAAINR_515.9_544.3 FRIH_HUMAN 57.21116697
DVLLLVHNLPQNLPGYFWYK_810.4_594.3 PSG9_HUMAN 56.84150484
FLNWIK_410.7_561.3 HABP2_HUMAN 56.37258274
SLQAFVAVAAR_566.8_487.3 IL23A_HUMAN 56.09012981
HFQNLGK_422.2_285.1 AFAM_HUMAN 56.04480022
GPGEDFR_389.2_322.2 PTGDS_HUMAN 55.7583763
NKPGVYTDVAYYLAWIR_677.0_821.5 FA12_HUMAN 55.53857645
LIQDAVTGLTVNGQITGDK_972.0_640.4 ITIH3_HUMAN 55.52577583
YYGYTGAFR_549.3_450.3 TRFL_HUMAN 54.27147366
TLNAYDHR_330.5_312.2 PAR3_HUMAN 54.19190934
IQTHSTTYR_369.5_627.3 F13B_HUMAN 54.18950583
TASDFITK_441.7_710.4 GELS_HUMAN 54.1056456
ALNHLPLEYNSALYSR_621.0_696.4 CO6_HUMAN 53.8997252
DADPDTFFAK_563.8_302.1 AFAM_HUMAN 53.85914848
SVSLPSLDPASAK_636.4_473.3 APOB_HUMAN 53.41996191
TTSDGGYSFK_531.7_860.4 INHA_HUMAN 52.24655536
AFTECCVVASQLR_770.9_574.3 CO5_HUMAN 51.67853429
ELPQSIVYK_538.8_409.2 FBLN3_HUMAN 51.35853002
TYLHTYESEI_628.3_515.3 ENPP2_HUMAN 51.23842124
FQLSETNR_497.8_605.3 PSG2_HUMAN 51.01576848
GSLVQASEANLQAAQDFVR_668.7_806.4 ITIH1_HUMAN 50.81923338
FSLVSGWGQLLDR_493.3_403.2 FA7_HUMAN 50.54425114
ECEELEEK_533.2_405.2 IL15_HUMAN 50.41977421
NADYSYSVWK_616.8_769.4 CO5_HUMAN 50.36434595
SLLQPNK_400.2_358.2 CO8A_HUMAN 49.75593162
LIEIANHVDK_384.6_683.4 ADA12_HUMAN 49.43389721
DISEVVTPR_508.3_787.4 CFAB_HUMAN 49.00234897
跃迁 蛋白质 加和最佳Gini
AEVIWTSSDHQVLSGK_586.3_300.2 PD1L1_HUMAN 48.79028835
SGVDLADSNQK_567.3_591.3 VGFR3_HUMAN 48.70665587
SILFLGK_389.2_201.1 THBG_HUMAN 48.5997957
AVLHIGEK_289.5_292.2 THBG_HUMAN 48.4605866
QLYGDTGVLGR_589.8_501.3 CO8G_HUMAN 48.11414904
FSLVSGWGQLLDR_493.3_516.3 FA7_HUMAN 47.59635333
DSPVLIDFFEDTER_841.9_399.2 HRG_HUMAN 46.83840473
INPASLDK_429.2_630.4 C163A_HUMAN 46.78947931
GAVHVVVAETDYQSFAVLYLER_822.8_863.5 CO8G_HUMAN 46.66185339
FLQEQGHR_338.8_497.3 CO8G_HUMAN 46.64415952
LNIGYIEDLK_589.3_837.4 PAI2_HUMAN 46.5879123
LSSPAVITDK_515.8_743.4 PLMN_HUMAN 46.2857838
GLQYAAQEGLLALQSELLR_1037.1_858.5 LBP_HUMAN 45.7427767
SDGAKPGPR_442.7_213.6 COLI_HUMAN 45.27828366
GYQELLEK_490.3_502.3 FETA_HUMAN 43.52928868
GGEGTGYFVDFSVR_745.9_869.5 HRG_HUMAN 43.24514327
ADLFYDVEALDLESPK_913.0_447.2 HRG_HUMAN 42.56268679
ADLFYDVEALDLESPK_913.0_331.2 HRG_HUMAN 42.48967422
EAQLPVIENK_570.8_699.4 PLMN_HUMAN 42.21213429
SILFLGK_389.2_577.4 THBG_HUMAN 42.03379581
HTLNQIDEVK_598.8_958.5 FETUA_HUMAN 41.98377176
AQPVQVAEGSEPDGFWEALGGK_758.0_574.3 GELS_HUMAN 41.89547273
FLPCENK_454.2_390.2 IL10_HUMAN 41.66612478
LIEIANHVDK_384.6_498.3 ADA12_HUMAN 41.50878046
DEIPHNDIALLK_459.9_510.8 HABP2_HUMAN 41.27830935
SLQAFVAVAAR_566.8_804.5 IL23A_HUMAN 41.00430596
YISPDQLADLYK_713.4_277.2 ENOA_HUMAN 40.90053801
SLPVSDSVLSGFEQR_810.9_836.4 CO8G_HUMAN 40.62020941
DGSPDVTTADIGANTPDATK_973.5_531.3 PGRP2_HUMAN 40.33913091
NTGVISVVTTGLDR_716.4_662.4 CADH1_HUMAN 40.05291612
ALVLELAK_428.8_672.4 INHBE_HUMAN 40.01646465
YEFLNGR_449.7_293.1 PLMN_HUMAN 39.83344278
WGAAPYR_410.7_577.3 PGRP2_HUMAN 39.52766213
TFLTVYWTPER_706.9_401.2 ICAM1_HUMAN 39.13662034
SEYGAALAWEK_612.8_845.5 CO6_HUMAN 38.77511119
VGVISFAQK_474.8_693.4 TFR2_HUMAN 38.5823457
IIEVEEEQEDPYLNDR_996.0_777.4 FBLN1_HUMAN 38.30913304
TGYYFDGISR_589.8_694.4 FBLN1_HUMAN 38.30617106
LQGTLPVEAR_542.3_571.3 CO5_HUMAN 37.93064544
DSPVLIDFFEDTER_841.9_512.3 HRG_HUMAN 37.4447737
AALAAFNAQNNGSNFQLEEISR_789.1_746.4 FETUA_HUMAN 37.02483715
DGSPDVTTADIGANTPDATK_973.5_844.4 PGRP2_HUMAN 36.59864788
ILILPSVTR_506.3_785.5 PSGx_HUMAN 36.43814815
SVSLPSLDPASAK_636.4_885.5 APOB_HUMAN 36.27689491
TLAFVR_353.7_492.3 FA7_HUMAN 36.18771771
VAPGVANPGTPLA_582.3_555.3 A6NIT4_HUMAN 35.70677357
HELTDEELQSLFTNFANVVDK_817.1_906.5 AFAM_HUMAN 35.14441609
AGLLRPDYALLGHR_518.0_369.2 PGRP2_HUMAN 35.13047098
跃迁 蛋白质 加和最佳Gini
GDTYPAELYITGSILR_885.0_1332.8 F13B_HUMAN 34.97832404
LFIPQITR_494.3_727.4 PSG9_HUMAN 34.76811249
GYQELLEK_490.3_631.4 FETA_HUMAN 34.76117605
VSEADSSNADWVTK_754.9_533.3 CFAB_HUMAN 34.49787512
LNIGYIEDLK_589.3_950.5 PAI2_HUMAN 34.48448691
SFRPFVPR_335.9_272.2 LBP_HUMAN 34.27529415
ILDGGNK_358.7_490.2 CXCL5_HUMAN 34.2331388
EANQSTLENFLER_775.9_678.4 IL4_HUMAN 34.14295797
DFNQFSSGEK_386.8_189.1 FETA_HUMAN 34.05459951
IEEIAAK_387.2_660.4 CO5_HUMAN 33.93778148
TEFLSNYLTNVDDITLVPGTLGR_846.8_600.3 ENPP2_HUMAN 33.87864446
LPATEKPVLLSK_432.6_347.2 HYOU1_HUMAN 33.69005522
FLQEQGHR_338.8_369.2 CO8G_HUMAN 33.61179024
APLTKPLK_289.9_357.2 CRP_HUMAN 33.59900279
YSHYNER_323.5_418.2 HABP2_HUMAN 33.50888447
TSYQVYSK_488.2_787.4 C163A_HUMAN 33.11650018
IALGGLLFPASNLR_481.3_657.4 SHBG_HUMAN 33.02974341
TGISPLALIK_506.8_741.5 APOB_HUMAN 32.64471573
LYYGDDEK_501.7_726.3 CO8A_HUMAN 32.60782458
IVLSLDVPIGLLQILLEQAR_735.1_503.3 UCN2_HUMAN 32.37907686
EAQLPVIENK_570.8_329.2 PLMN_HUMAN 32.34049256
TGYYFDGISR_589.8_857.4 FBLN1_HUMAN 32.14526507
VGVISFAQK_474.8_580.3 TFR2_HUMAN 32.11753213
FQSVFTVTR_542.8_623.4 C1QC_HUMAN 32.11360444
TSDQIHFFFAK_447.6_659.4 ANT3_HUMAN 31.95867038
IAPQLSTEELVSLGEK_857.5_333.2 AFAM_HUMAN 31.81531364
EVFSKPISWEELLQ_852.9_260.2 FA40A_HUMAN 31.36698726
DEIPHNDIALLK_459.9_260.2 HABP2_HUMAN 31.1839869
NYFTSVAHPNLFIATK_608.3_319.2 IL1A_HUMAN 31.09867061
ITENDIQIALDDAK_779.9_632.3 APOB_HUMAN 30.77026845
DTYVSSFPR_357.8_272.2 TCEA1_HUMAN 30.67784731
TDAPDLPEENQAR_728.3_843.4 CO5_HUMAN 30.66251941
LFYADHPFIFLVR_546.6_647.4 SERPH_HUMAN 30.65831566
TEQAAVAR_423.2_487.3 FA12_HUMAN 30.44356842
AVGYLITGYQR_620.8_737.4 PZP_HUMAN 30.36425528
HSHESQDLR_370.2_288.2 HRG_HUMAN 30.34684703
IALGGLLFPASNLR_481.3_412.3 SHBG_HUMAN 30.34101643
IAQYYYTFK_598.8_884.4 F13B_HUMAN 30.23453833
SLPVSDSVLSGFEQR_810.9_723.3 CO8G_HUMAN 30.11396489
IIGGSDADIK_494.8_762.4 C1S_HUMAN 30.06572687
QTLSWTVTPK_580.8_545.3 PZP_HUMAN 30.04139865
HYFIAAVER_553.3_658.4 FA8_HUMAN 29.80239884
QVCADPSEEWVQK_788.4_374.2 CCL3_HUMAN 29.61435573
DLHLSDVFLK_396.2_366.2 CO6_HUMAN 29.60077507
NIQSVNVK_451.3_546.3 GROA_HUMAN 29.47619619
QTLSWTVTPK_580.8_818.4 PZP_HUMAN 29.40047934
HSHESQDLR_370.2_403.2 HRG_HUMAN 29.32242262
LLEVPEGR_456.8_356.2 C1S_HUMAN 29.14169137
跃迁 蛋白质 加和最佳Gini
LIENGYFHPVK_439.6_343.2 F13B_HUMAN 28.63056809
EDTPNSVWEPAK_686.8_630.3 C1S_HUMAN 28.61352686
AFTECCVVASQLR_770.9_673.4 CO5_HUMAN 28.57830281
VNHVTLSQPK_374.9_459.3 B2MG_HUMAN 28.27203693
VSFSSPLVAISGVALR_802.0_715.4 PAPP1_HUMAN 28.13008712
DPDQTDGLGLSYLSSHIANVER_796.4_456.2 GELS_HUMAN 28.06549895
VVGGLVALR_442.3_784.5 FA12_HUMAN 28.00684006
NEIVFPAGILQAPFYTR_968.5_357.2 ECE1_HUMAN 27.97758456
QVCADPSEEWVQK_788.4_275.2 CCL3_HUMAN 27.94276837
LQDAGVYR_461.2_680.3 PD1L1_HUMAN 27.88063261
IQTHSTTYR_369.5_540.3 F13B_HUMAN 27.68873826
TPSAAYLWVGTGASEAEK_919.5_849.4 GELS_HUMAN 27.66889639
ALALPPLGLAPLLNLWAKPQGR_770.5_256.2 SHBG_HUMAN 27.63105727
ALQDQLVLVAAK_634.9_289.2 ANGT_HUMAN 27.63097319
IEEIAAK_387.2_531.3 CO5_HUMAN 27.52427934
TAVTANLDIR_537.3_288.2 CHL1_HUMAN 27.44246841
VSEADSSNADWVTK_754.9_347.2 CFAB_HUMAN 27.43976782
ITENDIQIALDDAK_779.9_873.5 APOB_HUMAN 27.39263522
SSNNPHSPIVEEFQVPYNK_729.4_521.3 C1S_HUMAN 27.34493617
HPWIVHWDQLPQYQLNR_744.0_918.5 KS6A3_HUMAN 27.19681613
TPSAAYLWVGTGASEAEK_919.5_428.2 GELS_HUMAN 27.17319953
AFLEVNEEGSEAAASTAVVIAGR_764.4_614.4 ANT3_HUMAN 27.10487351
WGAAPYR_410.7_634.3 PGRP2_HUMAN 27.09930054
IEVNESGTVASSSTAVIVSAR_693.0_545.3 PAI1_HUMAN 27.02567296
AEAQAQYSAAVAK_654.3_908.5 ITIH4_HUMAN 26.98305259
VPLALFALNR_557.3_917.6 PEPD_HUMAN 26.96988826
TLEAQLTPR_514.8_685.4 HEP2_HUMAN 26.94672621
QALEEFQK_496.8_551.3 CO8B_HUMAN 26.67037155
WNFAYWAAHQPWSR_607.3_545.3 PRG2_HUMAN 26.62600679
IYLQPGR_423.7_570.3 ITIH2_HUMAN 26.58752589
FFQYDTWK_567.8_840.4 IGF2_HUMAN 26.39942037
NEIWYR_440.7_357.2 FA12_HUMAN 26.35177282
GGEGTGYFVDFSVR_745.9_722.4 HRG_HUMAN 26.31688167
VGEYSLYIGR_578.8_708.4 SAMP_HUMAN 26.17367498
TAHISGLPPSTDFIVYLSGLAPSIR_871.5_800.5 TENA_HUMAN 26.13688183
GVTGYFTFNLYLK_508.3_260.2 PSG5_HUMAN 26.06007032
DYWSTVK_449.7_620.3 APOC3_HUMAN 26.03765187
YENYTSSFFIR_713.8_756.4 IL12B_HUMAN 25.9096605
YGLVTYATYPK_638.3_334.2 CFAB_HUMAN 25.84440452
LFIPQITR_494.3_614.4 PSG9_HUMAN 25.78081129
YEFLNGR_449.7_606.3 PLMN_HUMAN 25.17159874
SEPRPGVLLR_375.2_454.3 FA7_HUMAN 25.16444381
NSDQEIDFK_548.3_294.2 S10A5_HUMAN 25.12266401
YEVQGEVFTKPQLWP_911.0_293.1 CRP_HUMAN 24.77595195
GVTGYFTFNLYLK_508.3_683.9 PSG5_HUMAN 24.75289081
ISLLLIESWLEPVR_834.5_371.2 CSH_HUMAN 24.72379326
ALLLGWVPTR_563.3_373.2 PAR4_HUMAN 24.68096599
VNHVTLSQPK_374.9_244.2 B2MG_HUMAN 24.53420489
跃迁 蛋白质 加和最佳Gini
SGAQATWTELPWPHEK_613.3_793.4 HEMO_HUMAN 24.25610995
AQPVQVAEGSEPDGFWEALGGK_758.0_623.4 GELS_HUMAN 24.18769142
DLPHITVDR_533.3_490.3 MMP7_HUMAN 24.02606052
SEYGAALAWEK_612.8_788.4 CO6_HUMAN 24.00163743
AVGYLITGYQR_620.8_523.3 PZP_HUMAN 23.93958524
GFQALGDAADIR_617.3_717.4 TIMP1_HUMAN 23.69249513
YEVQGEVFTKPQLWP_911.0_392.2 CRP_HUMAN 23.67764212
SDGAKPGPR_442.7_459.2 COLI_HUMAN 23.63551614
GFQALGDAADIR_617.3_288.2 TIMP1_HUMAN 23.55832742
IAPQLSTEELVSLGEK_857.5_533.3 AFAM_HUMAN 23.38139357
DTDTGALLFIGK_625.8_217.1 PEDF_HUMAN 23.33375418
LHEAFSPVSYQHDLALLR_699.4_380.2 FA12_HUMAN 23.27455931
IYLQPGR_423.7_329.2 ITIH2_HUMAN 23.19122626
表38.随机森林32中期窗口
变量 UniProt_ID 平均降低Gini
SEYGAALAWEK_612.8_788.4 CO6_HUMAN 2.27812193
LLAPSDSPEWLSFDVTGVVR_730.1_430.3 TGFB1_HUMAN 2.080133179
ALNHLPLEYNSALYSR_621.0_696.4 CO6_HUMAN 1.952233942
ELPQSIVYK_538.8_417.7 FBLN3_HUMAN 1.518833357
VEHSDLSFSK_383.5_234.1 B2MG_HUMAN 1.482593086
VFQFLEK_455.8_811.4 CO5_HUMAN 1.448810425
VNHVTLSQPK_374.9_244.2 B2MG_HUMAN 1.389922815
YGIEEHGK_311.5_599.3 CXA1_HUMAN 1.386794676
TLAFVR_353.7_492.3 FA7_HUMAN 1.371530925
VLEPTLK_400.3_587.3 VTDB_HUMAN 1.368583173
VLEPTLK_400.3_458.3 VTDB_HUMAN 1.336029064
DALSSVQESQVAQQAR_573.0_502.3 APOC3_HUMAN 1.307024357
AQPVQVAEGSEPDGFWEALGGK_758.0_574.3 GELS_HUMAN 1.282930911
LHEAFSPVSYQHDLALLR_699.4_251.2 FA12_HUMAN 1.25362163
SEPRPGVLLR_375.2_654.4 FA7_HUMAN 1.205539225
VEHSDLSFSK_383.5_468.2 B2MG_HUMAN 1.201047302
SLDFTELDVAAEK_719.4_316.2 ANGT_HUMAN 1.189617326
SEYGAALAWEK_612.8_845.5 CO6_HUMAN 1.120706696
TYLHTYESEI_628.3_515.3 ENPP2_HUMAN 1.107036657
VNHVTLSQPK_374.9_459.3 B2MG_HUMAN 1.083264902
IEEIAAK_387.2_660.4 CO5_HUMAN 1.043635292
ALNHLPLEYNSALYSR_621.0_538.3 CO6_HUMAN 0.962643698
TLLPVSKPEIR_418.3_514.3 CO5_HUMAN 0.933440467
TEQAAVAR_423.2_615.4 FA12_HUMAN 0.878933553
DLHLSDVFLK_396.2_260.2 CO6_HUMAN 0.816855601
ALQDQLVLVAAK_634.9_289.2 ANGT_HUMAN 0.812620232
SLQAFVAVAAR_566.8_804.5 IL23A_HUMAN 0.792274782
QGHNSVFLIK_381.6_260.2 HEMO_HUMAN 0.770830031
ALQDQLVLVAAK_634.9_956.6 ANGT_HUMAN 0.767468246
SLDFTELDVAAEK_719.4_874.5 ANGT_HUMAN 0.745827911
表39.随机森林100中期窗口
变量 UniProt_ID 平均降低Gini
SEYGAALAWEK_612.8_788.4 CO6_HUMAN 1.241568411
ALNHLPLEYNSALYSR_621.0_696.4 CO6_HUMAN 0.903126414
LLAPSDSPEWLSFDVTGVVR_730.1_430.3 TGFB1_HUMAN 0.846216563
ANLINNIFELAGLGK_793.9_299.2 LCAP_HUMAN 0.748261193
VFQFLEK_455.8_811.4 CO5_HUMAN 0.717545171
VEHSDLSFSK_383.5_234.1 B2MG_HUMAN 0.683219617
ELPQSIVYK_538.8_417.7 FBLN3_HUMAN 0.671091545
LNIGYIEDLK_589.3_950.5 PAI2_HUMAN 0.652293621
VLEPTLK_400.3_587.3 VTDB_HUMAN 0.627095631
VNHVTLSQPK_374.9_244.2 B2MG_HUMAN 0.625773888
VLEPTLK_400.3_458.3 VTDB_HUMAN 0.613655529
AQPVQVAEGSEPDGFWEALGGK_758.0_574.3 GELS_HUMAN 0.576305627
TLFIFGVTK_513.3_811.5 PSG4_HUMAN 0.574056825
YGIEEHGK_311.5_599.3 CXA1_HUMAN 0.570270447
VPLALFALNR_557.3_620.4 PEPD_HUMAN 0.556087614
EVFSKPISWEELLQ_852.9_376.2 FA40A_HUMAN 0.531461012
VEHSDLSFSK_383.5_468.2 B2MG_HUMAN 0.531214597
TLAFVR_353.7_492.3 FA7_HUMAN 0.53070743
DALSSVQESQVAQQAR_573.0_502.3 APOC3_HUMAN 0.521633041
SEYGAALAWEK_612.8_845.5 CO6_HUMAN 0.514509661
SLDFTELDVAAEK_719.4_316.2 ANGT_HUMAN 0.50489698
SEPRPGVLLR_375.2_654.4 FA7_HUMAN 0.4824926
LHEAFSPVSYQHDLALLR_699.4_251.2 FA12_HUMAN 0.48217238
TYLHTYESEI_628.3_515.3 ENPP2_HUMAN 0.472286273
AVDIPGLEAATPYR_736.9_399.2 TENA_HUMAN 0.470892051
FSLVSGWGQLLDR_493.3_403.2 FA7_HUMAN 0.465839813
GEVTYTTSQVSK_650.3_750.4 EGLN_HUMAN 0.458736205
VNHVTLSQPK_374.9_459.3 B2MG_HUMAN 0.454348892
HFQNLGK_422.2_527.2 AFAM_HUMAN 0.45127405
YGIEEHGK_311.5_341.2 CXA1_HUMAN 0.430641646
表40.随机森林蛋白质中期窗口
变量 UniProt_ID 平均降低Gini
SEYGAALAWEK_612.8_788.4 CO6_HUMAN 2.09649626
LLAPSDSPEWLSFDVTGVVR_730.1_430.3 TGFB1_HUMAN 1.27664656
VFQFLEK_455.8_811.4 CO5_HUMAN 1.243884833
ANLINNIFELAGLGK_793.9_299.2 LCAP_HUMAN 1.231814882
VEHSDLSFSK_383.5_234.1 B2MG_HUMAN 1.188808078
ELPQSIVYK_538.8_417.7 FBLN3_HUMAN 1.185075445
LNIGYIEDLK_589.3_950.5 PAI2_HUMAN 1.122351536
VLEPTLK_400.3_458.3 VTDB_HUMAN 1.062664798
VPLALFALNR_557.3_620.4 PEPD_HUMAN 1.019466776
TLAFVR_353.7_492.3 FA7_HUMAN 0.98797064
TLFIFGVTK_513.3_811.5 PSG4_HUMAN 0.980159531
AQPVQVAEGSEPDGFWEALGGK_758.0_574.3 GELS_HUMAN 0.960286027
DALSSVQESQVAQQAR_573.0_502.3 APOC3_HUMAN 0.947091926
YGIEEHGK_311.5_599.3 CXA1_HUMAN 0.946937719
EVFSKPISWEELLQ_852.9_376.2 FA40A_HUMAN 0.916262164
变量 UniProt_ID 平均降低Gini
LHEAFSPVSYQHDLALLR_699.4_251.2 FA12_HUMAN 0.891310053
SLDFTELDVAAEK_719.4_316.2 ANGT_HUMAN 0.884498494
TYLHTYESEI_628.3_515.3 ENPP2_HUMAN 0.869043942
HFQNLGK_422.2_527.2 AFAM_HUMAN 0.865435217
AVDIPGLEAATPYR_736.9_399.2 TENA_HUMAN 0.844842109
TLNAYDHR_330.5_312.2 PAR3_HUMAN 0.792615068
DVLLLVHNLPQNLTGHIWYK_791.8_310.2 PSG7_HUMAN 0.763629346
GPITSAAELNDPQSILLR_632.4_826.5 EGLN_HUMAN 0.762305265
VVLSSGSGPGLDLPLVLGLPLQLK_791.5_598.4 SHBG_HUMAN 0.706312721
SLQNASAIESILK_687.4_860.5 IL3_HUMAN 0.645503581
HYINLITR_515.3_301.1 NPY_HUMAN 0.62631682
VELAPLPSWQPVGK_760.9_342.2 ICAM1_HUMAN 0.608991877
LQVNTPLVGASLLR_741.0_925.6 BPIA1_HUMAN 0.607801279
TLEAQLTPR_514.8_814.4 HEP2_HUMAN 0.597771074
SDGAKPGPR_442.7_459.2 COLI_HUMAN 0.582773073
表41.随机森林全部的中期窗口
变量 UniProt_ID 平均降低Gini
SEYGAALAWEK_612.8_788.4 CO6_HUMAN 0.493373282
ALNHLPLEYNSALYSR_621.0_696.4 CO6_HUMAN 0.382180772
VFQFLEK_455.8_811.4 CO5_HUMAN 0.260292083
LLAPSDSPEWLSFDVTGVVR_730.1_430.3 TGFB1_HUMAN 0.243156718
NADYSYSVWK_616.8_769.4 CO5_HUMAN 0.242388196
VLEPTLK_400.3_458.3 VTDB_HUMAN 0.238171849
VEHSDLSFSK_383.5_234.1 B2MG_HUMAN 0.236873731
ELPQSIVYK_538.8_417.7 FBLN3_HUMAN 0.224727161
VLEPTLK_400.3_587.3 VTDB_HUMAN 0.222105614
TLFIFGVTK_513.3_811.5 PSG4_HUMAN 0.210807574
ANLINNIFELAGLGK_793.9_299.2 LCAP_HUMAN 0.208714978
LNIGYIEDLK_589.3_950.5 PAI2_HUMAN 0.208027555
SEYGAALAWEK_612.8_845.5 CO6_HUMAN 0.197362212
VNHVTLSQPK_374.9_244.2 B2MG_HUMAN 0.195728091
YGIEEHGK_311.5_599.3 CXA1_HUMAN 0.189969499
HFQNLGK_422.2_527.2 AFAM_HUMAN 0.189572857
AGITIPR_364.2_486.3 IL17_HUMAN 0.188351054
AQPVQVAEGSEPDGFWEALGGK_758.0_574.3 GELS_HUMAN 0.185069517
SLDFTELDVAAEK_719.4_316.2 ANGT_HUMAN 0.173688295
TLAFVR_353.7_492.3 FA7_HUMAN 0.170636045
SEPRPGVLLR_375.2_654.4 FA7_HUMAN 0.170608352
TLLIANETLR_572.3_703.4 IL5_HUMAN 0.16745571
ALNHLPLEYNSALYSR_621.0_538.3 CO6_HUMAN 0.161514946
LHEAFSPVSYQHDLALLR_699.4_251.2 FA12_HUMAN 0.15852146
DGSPDVTTADIGANTPDATK_973.5_844.4 PGRP2_HUMAN 0.154028378
VPLALFALNR_557.3_620.4 PEPD_HUMAN 0.153725879
AVDIPGLEAATPYR_736.9_399.2 TENA_HUMAN 0.150920884
YGIEEHGK_311.5_341.2 CXA1_HUMAN 0.150319671
FSLVSGWGQLLDR_493.3_403.2 FA7_HUMAN 0.144781622
IEEIAAK_387.2_660.4 CO5_HUMAN 0.141983196
表42.随机森林32中晚期窗口
变量 UniProt_ID 平均降低Gini
VPLALFALNR_557.3_620.4 PEPD_HUMAN 4.566619475
VFQFLEK_455.8_811.4 CO5_HUMAN 3.062474666
AQPVQVAEGSEPDGFWEALGGK_758.0_574.3 GELS_HUMAN 3.033740627
LIEIANHVDK_384.6_498.3 ADA12_HUMAN 2.825082394
DALSSVQESQVAQQAR_573.0_502.3 APOC3_HUMAN 2.787777983
TLAFVR_353.7_492.3 FA7_HUMAN 2.730532075
ALNHLPLEYNSALYSR_621.0_696.4 CO6_HUMAN 2.671290375
AVYEAVLR_460.8_587.4 PEPD_HUMAN 2.621357053
SEPRPGVLLR_375.2_654.4 FA7_HUMAN 2.57568964
TYLHTYESEI_628.3_515.3 ENPP2_HUMAN 2.516708906
ALNHLPLEYNSALYSR_621.0_538.3 CO6_HUMAN 2.497348374
LIEIANHVDK_384.6_683.4 ADA12_HUMAN 2.457401462
YGIEEHGK_311.5_599.3 CXA1_HUMAN 2.396824268
VLEPTLK_400.3_587.3 VTDB_HUMAN 2.388105564
SEYGAALAWEK_612.8_788.4 CO6_HUMAN 2.340473883
WSAGLTSSQVDLYIPK_883.0_515.3 CBG_HUMAN 2.332007976
FGFGGSTDSGPIR_649.3_946.5 ADA12_HUMAN 2.325669514
SEYGAALAWEK_612.8_845.5 CO6_HUMAN 2.31761671
QINSYVK_426.2_496.3 CBG_HUMAN 2.245221163
QINSYVK_426.2_610.3 CBG_HUMAN 2.212307699
TEQAAVAR_423.2_615.4 FA12_HUMAN 2.105860336
AVYEAVLR_460.8_750.4 PEPD_HUMAN 2.098321893
TEQAAVAR_423.2_487.3 FA12_HUMAN 2.062684763
DFNQFSSGEK_386.8_333.2 FETA_HUMAN 2.05160689
SLQAFVAVAAR_566.8_804.5 IL23A_HUMAN 1.989521006
SLDFTELDVAAEK_719.4_316.2 ANGT_HUMAN 1.820628782
DPTFIPAPIQAK_433.2_556.3 ANGT_HUMAN 1.763514326
DPTFIPAPIQAK_433.2_461.2 ANGT_HUMAN 1.760870392
VLEPTLK_400.3_458.3 VTDB_HUMAN 1.723389354
YENYTSSFFIR_713.8_756.4 IL12B_HUMAN 1.63355187
表43.随机森林100中晚期窗口
变量 UniProt_ID 平均降低Gini
VPLALFALNR_557.3_620.4 PEPD_HUMAN 1.995805024
VFQFLEK_455.8_811.4 CO5_HUMAN 1.235926416
DALSSVQESQVAQQAR_573.0_502.3 APOC3_HUMAN 1.187464899
EVFSKPISWEELLQ_852.9_376.2 FA40A_HUMAN 1.166642578
AQPVQVAEGSEPDGFWEALGGK_758.0_574.3 GELS_HUMAN 1.146077071
TLAFVR_353.7_492.3 FA7_HUMAN 1.143038275
ANLINNIFELAGLGK_793.9_299.2 LCAP_HUMAN 1.130656591
ALNHLPLEYNSALYSR_621.0_538.3 CO6_HUMAN 1.098305298
ELPQSIVYK_538.8_417.7 FBLN3_HUMAN 1.096715712
LLAPSDSPEWLSFDVTGVVR_730.1_430.3 TGFB1_HUMAN 1.086171713
YGIEEHGK_311.5_341.2 CXA1_HUMAN 1.071880823
ALNHLPLEYNSALYSR_621.0_696.4 CO6_HUMAN 1.062278869
TQILEWAAER_608.8_761.4 EGLN_HUMAN 1.059019017
AVYEAVLR_460.8_587.4 PEPD_HUMAN 1.057920661
变量 UniProt_ID 平均降低Gini
AEIEYLEK_497.8_552.3 LYAM1_HUMAN 1.038388955
SEPRPGVLLR_375.2_654.4 FA7_HUMAN 1.028275728
AVDIPGLEAATPYR_736.9_399.2 TENA_HUMAN 1.026032369
LIEIANHVDK_384.6_498.3 ADA12_HUMAN 1.015065282
YGIEEHGK_311.5_599.3 CXA1_HUMAN 0.98667651
VLEPTLK_400.3_587.3 VTDB_HUMAN 0.970330675
DVLLLVHNLPQNLTGHIWYK_791.8_883.0 PSG7_HUMAN 0.934747674
TAHISGLPPSTDFIVYLSGLAPSIR_871.5_472.3 TENA_HUMAN 0.889111923
TLNAYDHR_330.5_312.2 PAR3_HUMAN 0.887605636
FGFGGSTDSGPIR_649.3_946.5 ADA12_HUMAN 0.884305889
LIEIANHVDK_384.6_683.4 ADA12_HUMAN 0.880889836
SEYGAALAWEK_612.8_788.4 CO6_HUMAN 0.863585472
TYLHTYESEI_628.3_515.3 ENPP2_HUMAN 0.849232356
FGFGGSTDSGPIR_649.3_745.4 ADA12_HUMAN 0.843334824
SEYGAALAWEK_612.8_845.5 CO6_HUMAN 0.842319271
TPSAAYLWVGTGASEAEK_919.5_849.4 GELS_HUMAN 0.828959173
表44.随机森林蛋白质中晚期窗口
变量 UniProt_ID 平均降低Gini
VPLALFALNR_557.3_620.4 PEPD_HUMAN 3.202123047
ANLINNIFELAGLGK_793.9_299.2 LCAP_HUMAN 2.100447309
VFQFLEK_455.8_811.4 CO5_HUMAN 2.096157529
AQPVQVAEGSEPDGFWEALGGK_758.0_574.3 GELS_HUMAN 2.052960939
ALNHLPLEYNSALYSR_621.0_696.4 CO6_HUMAN 2.046139797
TQILEWAAER_608.8_761.4 EGLN_HUMAN 1.99287941
ELPQSIVYK_538.8_417.7 FBLN3_HUMAN 1.920894959
TGVAVNKPAEFTVDAK_549.6_258.1 FLNA_HUMAN 1.917665697
SEPRPGVLLR_375.2_654.4 FA7_HUMAN 1.883557705
DALSSVQESQVAQQAR_573.0_502.3 APOC3_HUMAN 1.870232155
EVFSKPISWEELLQ_852.9_376.2 FA40A_HUMAN 1.869000136
LIEIANHVDK_384.6_683.4 ADA12_HUMAN 1.825457092
VLEPTLK_400.3_587.3 VTDB_HUMAN 1.695327774
TEQAAVAR_423.2_615.4 FA12_HUMAN 1.685013152
LLAPSDSPEWLSFDVTGVVR_730.1_430.3 TGFB1_HUMAN 1.684068039
TLNAYDHR_330.5_312.2 PAR3_HUMAN 1.673758239
AVDIPGLEAATPYR_736.9_399.2 TENA_HUMAN 1.648896853
DVLLLVHNLPQNLTGHIWYK_791.8_883.0 PSG7_HUMAN 1.648146088
AEIEYLEK_497.8_552.3 LYAM1_HUMAN 1.645833005
TYLHTYESEI_628.3_515.3 ENPP2_HUMAN 1.639121965
AGLLRPDYALLGHR_518.0_595.4 PGRP2_HUMAN 1.610227875
YGIEEHGK_311.5_599.3 CXA1_HUMAN 1.606978339
QINSYVK_426.2_496.3 CBG_HUMAN 1.554905578
LTTVDIVTLR_565.8_815.5 IL2RB_HUMAN 1.484081016
AALAAFNAQNNGSNFQLEEISR_789.1_746.4 FETUA_HUMAN 1.43173022
AEVIWTSSDHQVLSGK_586.3_300.2 PD1L1_HUMAN 1.394857397
ALEQDLPVNIK_620.4_570.4 CNDP1_HUMAN 1.393464547
DFNQFSSGEK_386.8_333.2 FETA_HUMAN 1.374296237
TSYQVYSK_488.2_787.4 C163A_HUMAN 1.36141387
变量 UniProt_ID 平均降低Gini
TLEAQLTPR_514.8_685.4 HEP2_HUMAN 1.311118611
表45.随机森林全部的中晚期窗口
变量 UniProt_ID 平均降低Gini
VPLALFALNR_557.3_620.4 PEPD_HUMAN 0.685165163
VFQFLEK_455.8_811.4 CO5_HUMAN 0.426827804
ALNHLPLEYNSALYSR_621.0_538.3 CO6_HUMAN 0.409942379
YGIEEHGK_311.5_341.2 CXA1_HUMAN 0.406589512
ALNHLPLEYNSALYSR_621.0_696.4 CO6_HUMAN 0.402152062
AQPVQVAEGSEPDGFWEALGGK_758.0_574.3 GELS_HUMAN 0.374861014
ANLINNIFELAGLGK_793.9_299.2 LCAP_HUMAN 0.367089422
TQILEWAAER_608.8_761.4 EGLN_HUMAN 0.353757524
AVYEAVLR_460.8_587.4 PEPD_HUMAN 0.350518668
TLAFVR_353.7_492.3 FA7_HUMAN 0.344669505
SEPRPGVLLR_375.2_654.4 FA7_HUMAN 0.338752336
LIEIANHVDK_384.6_683.4 ADA12_HUMAN 0.321850027
ELPQSIVYK_538.8_417.7 FBLN3_HUMAN 0.301819017
EVFSKPISWEELLQ_852.9_376.2 FA40A_HUMAN 0.299561811
LIEIANHVDK_384.6_498.3 ADA12_HUMAN 0.298253589
VLEPTLK_400.3_587.3 VTDB_HUMAN 0.296206088
YGIEEHGK_311.5_599.3 CXA1_HUMAN 0.295621408
DVLLLVHNLPQNLTGHIWYK_791.8_883.0 PSG7_HUMAN 0.292937475
TYLHTYESEI_628.3_515.3 ENPP2_HUMAN 0.275902848
DALSSVQESQVAQQAR_573.0_502.3 APOC3_HUMAN 0.275664578
FGFGGSTDSGPIR_649.3_745.4 ADA12_HUMAN 0.27120436
AVDIPGLEAATPYR_736.9_399.2 TENA_HUMAN 0.266568271
TGVAVNKPAEFTVDAK_549.6_258.1 FLNA_HUMAN 0.262537889
TLNAYDHR_330.5_312.2 PAR3_HUMAN 0.259901193
IYLQPGR_423.7_329.2 ITIH2_HUMAN 0.259086112
AEVIWTSSDHQVLSGK_586.3_300.2 PD1L1_HUMAN 0.25722354
VPSHAVVAR_312.5_515.3 TRFL_HUMAN 0.256151812
SEYGAALAWEK_612.8_845.5 CO6_HUMAN 0.251704855
FGFGGSTDSGPIR_649.3_946.5 ADA12_HUMAN 0.249400642
SEYGAALAWEK_612.8_788.4 CO6_HUMAN 0.245930393
表46.随机森林32中晚期窗口
变量 UniProt_ID 平均降低Gini
AVYEAVLR_460.8_587.4 PEPD_HUMAN 1.889521223
AEIEYLEK_497.8_552.3 LYAM1_HUMAN 1.75233545
AALAAFNAQNNGSNFQLEEISR_789.1_746.4 FETUA_HUMAN 1.676813493
TGVAVNKPAEFTVDAK_549.6_258.1 FLNA_HUMAN 1.600684153
AVYEAVLR_460.8_750.4 PEPD_HUMAN 1.462889662
LIEIANHVDK_384.6_683.4 ADA12_HUMAN 1.364115361
VPLALFALNR_557.3_620.4 PEPD_HUMAN 1.324317148
QINSYVK_426.2_610.3 CBG_HUMAN 1.305932064
ITQDAQLK_458.8_702.4 CBG_HUMAN 1.263533228
FGFGGSTDSGPIR_649.3_745.4 ADA12_HUMAN 1.245153376
LIEIANHVDK_384.6_498.3 ADA12_HUMAN 1.236529173
QINSYVK_426.2_496.3 CBG_HUMAN 1.221866266
YSHYNER_323.5_418.2 HABP2_HUMAN 1.169575572
YYGYTGAFR_549.3_450.3 TRFL_HUMAN 1.126684146
VGVISFAQK_474.8_580.3 TFR2_HUMAN 1.075283855
VFQYIDLHQDEFVQTLK_708.4_375.2 CNDP1_HUMAN 1.07279097
SPEAEDPLGVER_649.8_314.1 Z512B_HUMAN 1.05759256
DEIPHNDIALLK_459.9_510.8 HABP2_HUMAN 1.028933332
ALEQDLPVNIK_620.4_798.5 CNDP1_HUMAN 1.014443799
ALEQDLPVNIK_620.4_570.4 CNDP1_HUMAN 1.010573267
ILDGGNK_358.7_603.3 CXCL5_HUMAN 0.992175141
TSYQVYSK_488.2_787.4 C163A_HUMAN 0.95649585
YENYTSSFFIR_713.8_756.4 IL12B_HUMAN 0.955085198
SETEIHQGFQHLHQLFAK_717.4_447.2 CBG_HUMAN 0.944726739
TLPFSR_360.7_506.3 LYAM1_HUMAN 0.944426109
VLSSIEQK_452.3_691.4 1433S_HUMAN 0.933902495
AEIEYLEK_497.8_389.2 LYAM1_HUMAN 0.891235263
GTYLYNDCPGPGQDTDCR_697.0_666.3 TNR1A_HUMAN 0.87187037
SGVDLADSNQK_567.3_662.3 VGFR3_HUMAN 0.869821307
SGVDLADSNQK_567.3_591.3 VGFR3_HUMAN 0.839946466
表47.随机森林100中晚期窗口
变量 UniProt_ID 平均降低Gini
AVYEAVLR_460.8_587.4 PEPD_HUMAN 0.971695767
AEIEYLEK_497.8_552.3 LYAM1_HUMAN 0.920098693
TGVAVNKPAEFTVDAK_549.6_258.1 FLNA_HUMAN 0.786924487
AVYEAVLR_460.8_750.4 PEPD_HUMAN 0.772867983
AALAAFNAQNNGSNFQLEEISR_789.1_746.4 FETUA_HUMAN 0.744138513
AYSDLSR_406.2_375.2 SAMP_HUMAN 0.736078079
VPLALFALNR_557.3_620.4 PEPD_HUMAN 0.681784822
QINSYVK_426.2_610.3 CBG_HUMAN 0.585819307
LIEIANHVDK_384.6_498.3 ADA12_HUMAN 0.577161158
FGFGGSTDSGPIR_649.3_745.4 ADA12_HUMAN 0.573055613
WSAGLTSSQVDLYIPK_883.0_515.3 CBG_HUMAN 0.569156128
ITQDAQLK_458.8_702.4 CBG_HUMAN 0.551017844
LIEIANHVDK_384.6_683.4 ADA12_HUMAN 0.539330047
YYGYTGAFR_549.3_450.3 TRFL_HUMAN 0.527652175
VFQYIDLHQDEFVQTLK_708.4_375.2 CNDP1_HUMAN 0.484155289
FQLPGQK_409.2_429.2 PSG1_HUMAN 0.480394031
AVDIPGLEAATPYR_736.9_286.1 TENA_HUMAN 0.475252565
QINSYVK_426.2_496.3 CBG_HUMAN 0.4728541
YISPDQLADLYK_713.4_277.2 ENOA_HUMAN 0.470079977
TLPFSR_360.7_506.3 LYAM1_HUMAN 0.46881451
SPEAEDPLGVER_649.8_314.1 Z512B_HUMAN 0.4658941
ALEQDLPVNIK_620.4_798.5 CNDP1_HUMAN 0.463604174
YSHYNER_323.5_418.2 HABP2_HUMAN 0.453076307
VGVISFAQK_474.8_580.3 TFR2_HUMAN 0.437768219
LQDAGVYR_461.2_680.3 PD1L1_HUMAN 0.428524689
AEIEYLEK_497.8_389.2 LYAM1_HUMAN 0.42041448
TSYQVYSK_488.2_787.4 C163A_HUMAN 0.419411932
变量 UniProt_ID 平均降低Gini
SVVLIPLGAVDDGEHSQNEK_703.0_798.4 CNDP1_HUMAN 0.415325735
ALEQDLPVNIK_620.4_570.4 CNDP1_HUMAN 0.407951733
ILDGGNK_358.7_603.3 CXCL5_HUMAN 0.401059572
表48.随机森林蛋白质晚期窗口
变量 UniProt_ID 平均降低Gini
AVYEAVLR_460.8_587.4 PEPD_HUMAN 1.836010146
AEIEYLEK_497.8_552.3 LYAM1_HUMAN 1.739802548
AALAAFNAQNNGSNFQLEEISR_789.1_746.4 FETUA_HUMAN 1.455337749
TGVAVNKPAEFTVDAK_549.6_258.1 FLNA_HUMAN 1.395043941
AYSDLSR_406.2_375.2 SAMP_HUMAN 1.177349958
LIEIANHVDK_384.6_683.4 ADA12_HUMAN 1.14243936
QINSYVK_426.2_496.3 CBG_HUMAN 1.05284482
ALEQDLPVNIK_620.4_798.5 CNDP1_HUMAN 0.971678206
YISPDQLADLYK_713.4_277.2 ENOA_HUMAN 0.902293734
AVDIPGLEAATPYR_736.9_286.1 TENA_HUMAN 0.893163413
SPEAEDPLGVER_649.8_314.1 Z512B_HUMAN 0.856551531
ILDGGNK_358.7_603.3 CXCL5_HUMAN 0.841485153
VGVISFAQK_474.8_580.3 TFR2_HUMAN 0.835256078
YYGYTGAFR_549.3_450.3 TRFL_HUMAN 0.831195917
YSHYNER_323.5_418.2 HABP2_HUMAN 0.814479968
FQLPGQK_409.2_276.1 PSG1_HUMAN 0.77635168
YENYTSSFFIR_713.8_756.4 IL12B_HUMAN 0.761241391
TEQAAVAR_423.2_615.4 FA12_HUMAN 0.73195592
SGVDLADSNQK_567.3_662.3 VGFR3_HUMAN 0.72504131
VLSSIEQK_452.3_691.4 1433S_HUMAN 0.713380314
GTYLYNDCPGPGQDTDCR_697.0_666.3 TNR1A_HUMAN 0.704248586
TSYQVYSK_488.2_787.4 C163A_HUMAN 0.69026345
TLEAQLTPR_514.8_685.4 HEP2_HUMAN 0.654641588
AEVIWTSSDHQVLSGK_586.3_300.2 PD1L1_HUMAN 0.634751081
TAVTANLDIR_537.3_288.2 CHL1_HUMAN 0.619871203
ITENDIQIALDDAK_779.9_632.3 APOB_HUMAN 0.606313398
TASDFITK_441.7_781.4 GELS_HUMAN 0.593535076
SPQAFYR_434.7_556.3 REL3_HUMAN 0.592004045
NHYTESISVAK_624.8_415.2 NEUR1_HUMAN 0.588383911
LTTVDIVTLR_565.8_815.5 IL2RB_HUMAN 0.587343951
表49.随机森林全部的晚期窗口
变量 UniProt_ID 平均降低Gini
AVYEAVLR_460.8_587.4 PEPD_HUMAN 0.437300283
AEIEYLEK_497.8_552.3 LYAM1_HUMAN 0.371624293
AALAAFNAQNNGSNFQLEEISR_789.1_746.4 FETUA_HUMAN 0.304039734
TGVAVNKPAEFTVDAK_549.6_258.1 FLNA_HUMAN 0.280588526
AVYEAVLR_460.8_750.4 PEPD_HUMAN 0.266788699
AYSDLSR_406.2_375.2 SAMP_HUMAN 0.247412666
VPLALFALNR_557.3_620.4 PEPD_HUMAN 0.229955358
LIEIANHVDK_384.6_683.4 ADA12_HUMAN 0.218186524
ITQDAQLK_458.8_702.4 CBG_HUMAN 0.217646659
变量 UniProt_ID 平均降低Gini
WSAGLTSSQVDLYIPK_883.0_515.3 CBG_HUMAN 0.213840705
FGFGGSTDSGPIR_649.3_745.4 ADA12_HUMAN 0.212794469
LIEIANHVDK_384.6_498.3 ADA12_HUMAN 0.208620264
QINSYVK_426.2_610.3 CBG_HUMAN 0.202054546
QINSYVK_426.2_496.3 CBG_HUMAN 0.197235139
FQLPGQK_409.2_429.2 PSG1_HUMAN 0.188311102
VFQYIDLHQDEFVQTLK_708.4_375.2 CNDP1_HUMAN 0.180534913
ALEQDLPVNIK_620.4_798.5 CNDP1_HUMAN 0.178464358
YYGYTGAFR_549.3_450.3 TRFL_HUMAN 0.176050092
ALFLDALGPPAVTR_720.9_640.4 INHA_HUMAN 0.171492975
FQLPGQK_409.2_276.1 PSG1_HUMAN 0.167576198
SETEIHQGFQHLHQLFAK_717.4_447.2 CBG_HUMAN 0.162231844
ALEQDLPVNIK_620.4_570.4 CNDP1_HUMAN 0.162165399
VPSHAVVAR_312.5_515.3 TRFL_HUMAN 0.156742065
AVDIPGLEAATPYR_736.9_286.1 TENA_HUMAN 0.153681405
FTFTLHLETPKPSISSSNLNPR_829.4_874.4 PSG1_HUMAN 0.152042057
VGVISFAQK_474.8_580.3 TFR2_HUMAN 0.149034355
TLPFSR_360.7_506.3 LYAM1_HUMAN 0.143223501
SLDFTELDVAAEK_719.4_874.5 ANGT_HUMAN 0.141216186
SPEAEDPLGVER_649.8_314.1 Z512B_HUMAN 0.139843479
YGIEEHGK_311.5_341.2 CXA1_HUMAN 0.135236953
表50.早期窗口的选择的跃迁
跃迁 母体蛋白质
LIQDAVTGLTVNGQITGDK_972.0_798.4 ITIH3_HUMAN
VQTAHFK_277.5_431.2 CO8A_HUMAN
FLNWIK_410.7_560.3 HABP2_HUMAN
ITGFLKPGK_320.9_429.3 LBP_HUMAN
ALNHLPLEYNSALYSR_621.0_538.3 CO6_HUMAN
TYLHTYESEI_628.3_908.4 ENPP2_HUMAN
LIENGYFHPVK_439.6_627.4 F13B_HUMAN
AVLHIGEK_289.5_292.2 THBG_HUMAN
QALEEFQK_496.8_680.3 CO8B_HUMAN
TEFLSNYLTNVDDITLVPGTLGR_846.8_600.3 ENPP2_HUMAN
TASDFITK_441.7_781.4 GELS_HUMAN
LPNNVLQEK_527.8_844.5 AFAM_HUMAN
AHYDLR_387.7_288.2 FETUA_HUMAN
ITLPDFTGDLR_624.3_288.2 LBP_HUMAN
IEGNLIFDPNNYLPK_874.0_414.2 APOB_HUMAN
ITGFLKPGK_320.9_301.2 LBP_HUMAN
FSVVYAK_407.2_381.2 FETUA_HUMAN
ITGFLKPGK_320.9_429.3 LBP_HUMAN
VFQFLEK_455.8_811.4 CO5_HUMAN
LIQDAVTGLTVNGQITGDK_972.0_798.4 ITIH3_HUMAN
DADPDTFFAK_563.8_825.4 AFAM_HUMAN
表51.早期窗口的选择的蛋白质
蛋白质
蛋白质
补体组分C6前体 CO6_HUMAN
内源性-α-胰蛋白酶抑制剂重链H3前原蛋白 ITIH3_HUMAN
凝血因子XIII B链 F13B_HUMAN
核苷酸内焦磷酸酶/磷酸二酯酶家族成员2 ENPP2_HUMAN
补体组分C8β链 CO8B_HUMAN
甲状腺素结合球蛋白前体 THBG_HUMAN
透明质酸酯-结合蛋白2 HABP2_HUMAN
脂多糖-结合蛋白 LBP_HUMAN
补体因子B CFAB_HUMAN
凝溶胶蛋白 GELS_HUMAN
afamin前体 AFAM_HUMAN
脱脂蛋白B-100前体 APOB_HUMAN
补体组分C5 CO5_HUMAN
Alpha-2-HS-糖蛋白 FETUA_HUMAN
补体组分C8γ链 CO8G_HUMAN
表52.中晚期窗口的选择的跃迁
跃迁 母体蛋白质
VPLALFALNR_557.3_620.4 PEPD_HUMAN
VFQFLEK_455.8_811.4 CO5_HUMAN
AQPVQVAEGSEPDGFWEALGGK_758.0_574.3 GELS_HUMAN
LIEIANHVDK_384.6_498.3 ADA12_HUMAN
TLAFVR_353.7_492.3 FA7_HUMAN
ALNHLPLEYNSALYSR_621.0_696.4 CO6_HUMAN
AVYEAVLR_460.8_587.4 PEPD_HUMAN
SEPRPGVLLR_375.2_654.4 FA7_HUMAN
TYLHTYESEI_628.3_515.3 ENPP2_HUMAN
ALNHLPLEYNSALYSR_621.0_538.3 CO6_HUMAN
表53.中晚期窗口的选择的蛋白质
蛋白质
Xaa-前二肽酶 PEPD_HUMAN
亮氨酰-半胱氨酰氨肽酶 LCAP_HUMAN
补体组分C5 CO5_HUMAN
凝溶胶蛋白 GELS_HUMAN
补体组分C6前体 CO6_HUMAN
内皮糖蛋白前体 EGLN_HUMAN
含有EGF的fibulin-样细胞外基质蛋白1 FBLN3_HUMAN
凝血因子VII同工型a FA7_HUMAN
含有解联蛋白和金属蛋白酶结构域的蛋白12 ADA12_HUMAN
维生素D结合蛋白同工型1前体 VTDB_HUMAN
蛋白质
凝血因子XII前体 FA12_HUMAN
皮质甾类结合球蛋白 CBG_HUMAN
实施例6.进一步精炼早产生物标志物的研究V
使用进一步精炼的经调度MRM测定实施另外的假设依赖性发现研究。再次除去不太稳健的跃迁以改善分析性能,并为对应于上述研究中鉴别的79个所关心的分析物的稳定同位素标记的标准品(SIS)的包含腾出空间。SIS肽与它们的内源肽对应物具有相同的氨基酸序列、色谱和MS碎片化表现,但是质量不同。因此,它们可以用于降低LC-MS的分析差异度并确认分析物身份。样品包括约60例自发PTB病例(在小于37周分娩,0天)和180例足月对照(在大于或等于37周分娩,0天)。每个病例表示为与抽血1天内“匹配”的对照,而两个“随机”对照与相同的3周抽血窗口(17-19、20-22或23-25周妊娠)匹配。出于分析的目的,将这三个抽血窗口合并。基本如上所述处理样品,除了在本研究中,胰蛋白酶水解物在含有SIS标准品的溶液中复原。对原始分析物峰面积进行Box-Cox转化,通过回归对运行顺序和批次影响进行修正,并用于单变量和多变量统计分析。单变量分析包括根据考虑病例相对于对照(定义为在>37周分娩(表54)或在>40周分娩(表55))的t检验,对所有分析物调整的峰面积确定p值。单变量分析还包括对评价每个分析物的调整的峰面积对生产时间(出生时的胎龄减去抽血时的胎龄)(表56)和出生时的胎龄(表57)的依赖性的线性模型确定p值。另外,对内源分析物和它们相应的SIS对应物计算原始峰面积比,进行Box-Cox转化,然后用于单变量和多变量统计分析。对分析物/SIS峰面积比值重复上述单变量分析,其分别总结于表58-61中。
使用分析物值和临床变量(例如,母体年龄(MAGE)、体重指数(BMI))构建多变量随机森林回归模型以预测出生时的胎龄(GAB)。相对于预测的和真实的GAB的相关性以及相对于预测的与真实的GAB的平均绝对偏差(MAD)评价随机森林的准确度。当使用预测的GAB作为定量变量来将受试者分为足月或早产时,通过确定接收工作特性曲线(AUC)下面积来进一步评价准确度。将随机森林重要性值对经验积累分布函数进行拟合,并计算概率(P)。通过在随机森林模型中的重要性排名(P>0.7),使用调整的分析物峰面积值(表62)和分析物/SIS峰面积比值,我们报告了分析物(表63)。
可以使用如下所示的预测的出生时的胎龄(GAB)估计早产概率p(PTB)。估计将基于血清PAPR临床试验中招募的妇女,其提供了用于建立PTB预测方法的受试者。
在预测GAB为j天加或减k天的妇女中,将p(PTB)估计为PAPR临床试验中预测GAB为j天加或减k天而实际在37周胎龄之前分娩的妇女的比例。
一般地,对于预测GAB为j天加或减k天的妇女,将真实出生时的胎龄将小于指定胎龄的概率p(真实GAB<指定GAB)估计为PAPR临床试验中预测GAB为j天加或减k天而实际在指定胎龄之前分娩的妇女的比例。图1显示了出生时的实际胎龄相对于随机森林回归模型的预测胎龄的分布图。图2显示了随机森林回归模型的预测胎龄相对于出生时的实际胎龄(GAB)的分布,其中以下列分类提供真实的GAB:(i)小于37周、(ii)37至39周,和(iii)40周或以上。
表54.调整的峰面积的单变量p值(<37相对于>37周)
跃迁 蛋白质 P值
SPELQAEAK_486.8_659.4 APOA2_HUMAN 0.00246566
ALALPPLGLAPLLNLWAKPQGR_770.5_457.3 SHBG_HUMAN 0.002623332
ALALPPLGLAPLLNLWAKPQGR_770.5_256.2 SHBG_HUMAN 0.002822593
SPELQAEAK_486.8_788.4 APOA2_HUMAN 0.003183869
VVLSSGSGPGLDLPLVLGLPLQLK_791.5_768.5 SHBG_HUMAN 0.004936049
VVLSSGSGPGLDLPLVLGLPLQLK_791.5_598.4 SHBG_HUMAN 0.005598977
DYWSTVK_449.7_347.2 APOC3_HUMAN 0.005680405
DYWSTVK_449.7_620.3 APOC3_HUMAN 0.006288693
WGAAPYR_410.7_634.3 PGRP2_HUMAN 0.006505238
DALSSVQESQVAQQAR_573.0_502.3 APOC3_HUMAN 0.007626246
DALSSVQESQVAQQAR_573.0_672.4 APOC3_HUMAN 0.008149335
LSIPQITTK_500.8_687.4 PSG5_HUMAN 0.009943955
GWVTDGFSSLK_598.8_854.4 APOC3_HUMAN 0.010175055
IALGGLLFPASNLR_481.3_657.4 SHBG_HUMAN 0.010784167
AKPALEDLR_506.8_813.5 APOA1_HUMAN 0.011331968
WGAAPYR_410.7_577.3 PGRP2_HUMAN 0.011761088
VPLALFALNR_557.3_620.4 PEPD_HUMAN 0.014050395
FSLVSGWGQLLDR_493.3_447.3 FA7_HUMAN 0.014271151
LSIPQITTK_500.8_800.5 PSG5_HUMAN 0.014339942
TLAFVR_353.7_274.2 FA7_HUMAN 0.014459876
DVLLLVHNLPQNLPGYFWYK_810.4_960.5 PSG9_HUMAN 0.016720007
FSVVYAK_407.2_381.2 FETUA_HUMAN 0.016792786
DVLLLVHNLPQNLPGYFWYK_810.4_215.1 PSG9_HUMAN 0.017335929
SEPRPGVLLR_375.2_654.4 FA7_HUMAN 0.018147773
ALNHLPLEYNSALYSR_621.0_538.3 CO6_HUMAN 0.019056484
WNFAYWAAHQPWSR_607.3_545.3 PRG2_HUMAN 0.019190043
ALNHLPLEYNSALYSR_621.0_696.4 CO6_HUMAN 0.020218682
AQPVQVAEGSEPDGFWEALGGK_758.0_623.4 GELS_HUMAN 0.020226218
GWVTDGFSSLK_598.8_953.5 APOC3_HUMAN 0.023192703
IALGGLLFPASNLR_481.3_412.3 SHBG_HUMAN 0.023916911
WNFAYWAAHQPWSR_607.3_673.3 PRG2_HUMAN 0.026026975
FGFGGSTDSGPIR_649.3_745.4 ADA12_HUMAN 0.027731407
跃迁 蛋白质 P值
SEYGAALAWEK_612.8_788.4 CO6_HUMAN 0.031865281
DADPDTFFAK_563.8_302.1 AFAM_HUMAN 0.0335897
LFIPQITR_494.3_614.4 PSG9_HUMAN 0.034140767
DVLLLVHNLPQNLPGYFWYK_810.4_328.2 PSG9_HUMAN 0.034653304
TLAFVR_353.7_492.3 FA7_HUMAN 0.036441189
AVLHIGEK_289.5_292.2 THBG_HUMAN 0.038539433
IHPSYTNYR_384.2_452.2 PSG2_HUMAN 0.039733019
AGLLRPDYALLGHR_518.0_369.2 PGRP2_HUMAN 0.040916226
ILILPSVTR_506.3_559.3 PSGx_HUMAN 0.042460036
YYLQGAK_421.7_516.3 ITIH4_HUMAN 0.044511962
TPSAAYLWVGTGASEAEK_919.5_849.4 GELS_HUMAN 0.046362381
AGLLRPDYALLGHR_518.0_595.4 PGRP2_HUMAN 0.046572355
TYLHTYESEI_628.3_908.4 ENPP2_HUMAN 0.04754503
FSLVSGWGQLLDR_493.3_403.2 FA7_HUMAN 0.048642964
VNFTEIQK_489.8_765.4 FETA_HUMAN 0.04871392
LFIPQITR_494.3_727.4 PSG9_HUMAN 0.049288923
DISEVVTPR_508.3_787.4 CFAB_HUMAN 0.049458374
SEPRPGVLLR_375.2_454.3 FA7_HUMAN 0.049567047
表55.调整的峰面积的单变量p值(<37相对于>40周)
跃迁 蛋白质 P值
SPELQAEAK_486.8_659.4 APOA2_HUMAN 0.001457796
DYWSTVK_449.7_347.2 APOC3_HUMAN 0.001619622
DYWSTVK_449.7_620.3 APOC3_HUMAN 0.002068704
DALSSVQESQVAQQAR_573.0_502.3 APOC3_HUMAN 0.00250563
GWVTDGFSSLK_598.8_854.4 APOC3_HUMAN 0.002543943
SPELQAEAK_486.8_788.4 APOA2_HUMAN 0.003108814
SEPRPGVLLR_375.2_654.4 FA7_HUMAN 0.004035832
DALSSVQESQVAQQAR_573.0_672.4 APOC3_HUMAN 0.00434652
SEYGAALAWEK_612.8_788.4 CO6_HUMAN 0.005306924
GWVTDGFSSLK_598.8_953.5 APOC3_HUMAN 0.005685534
ALNHLPLEYNSALYSR_621.0_696.4 CO6_HUMAN 0.005770384
TYLHTYESEI_628.3_515.3 ENPP2_HUMAN 0.005798991
ENPAVIDFELAPIVDLVR_670.7_601.4 CO6_HUMAN 0.006248095
ALNHLPLEYNSALYSR_621.0_538.3 CO6_HUMAN 0.006735817
TYLHTYESEI_628.3_908.4 ENPP2_HUMAN 0.007351774
AGLLRPDYALLGHR_518.0_369.2 PGRP2_HUMAN 0.009541521
AKPALEDLR_506.8_813.5 APOA1_HUMAN 0.009780371
SEYGAALAWEK_612.8_845.5 CO6_HUMAN 0.010085363
FSLVSGWGQLLDR_493.3_447.3 FA7_HUMAN 0.010401836
WGAAPYR_410.7_634.3 PGRP2_HUMAN 0.011233623
ENPAVIDFELAPIVDLVR_670.7_811.5 CO6_HUMAN 0.012029564
DVLLLVHNLPQNLPGYFWYK_810.4_215.1 PSG9_HUMAN 0.014808277
LFIPQITR_494.3_614.4 PSG9_HUMAN 0.015879755
WGAAPYR_410.7_577.3 PGRP2_HUMAN 0.016562435
AGLLRPDYALLGHR_518.0_595.4 PGRP2_HUMAN 0.016793521
TLAFVR_353.7_492.3 FA7_HUMAN 0.016919708
FSLVSGWGQLLDR_493.3_403.2 FA7_HUMAN 0.016937583
跃迁 蛋白质 P值
WWGGQPLWITATK_772.4_373.2 ENPP2_HUMAN 0.019050115
GYVIIKPLVWV_643.9_304.2 SAMP_HUMAN 0.019675317
DVLLLVHNLPQNLPGYFWYK_810.4_960.5 PSG9_HUMAN 0.020387647
FGFGGSTDSGPIR_649.3_745.4 ADA12_HUMAN 0.020458335
DVLLLVHNLPQNLPGYFWYK_810.4_328.2 PSG9_HUMAN 0.021488084
WWGGQPLWITATK_772.4_929.5 ENPP2_HUMAN 0.021709354
LDFHFSSDR_375.2_448.2 INHBC_HUMAN 0.022403383
LFIPQITR_494.3_727.4 PSG9_HUMAN 0.025561103
TEFLSNYLTNVDDITLVPGTLGR_846.8_600.3 ENPP2_HUMAN 0.029344366
LSIPQITTK_500.8_800.5 PSG5_HUMAN 0.031361776
ALVLELAK_428.8_672.4 INHBE_HUMAN 0.031690737
SEPRPGVLLR_375.2_454.3 FA7_HUMAN 0.033067953
LSIPQITTK_500.8_687.4 PSG5_HUMAN 0.033972449
LDFHFSSDR_375.2_611.3 INHBC_HUMAN 0.034500249
LDFHFSSDR_375.2_464.2 INHBC_HUMAN 0.035166664
GAVHVVVAETDYQSFAVLYLER_822.8_580.3 CO8G_HUMAN 0.037334975
HELTDEELQSLFTNFANVVDK_817.1_854.4 AFAM_HUMAN 0.039258528
AYSDLSR_406.2_375.2 SAMP_HUMAN 0.04036485
YYLQGAK_421.7_516.3 ITIH4_HUMAN 0.042204165
ILPSVPK_377.2_264.2 PGH1_HUMAN 0.042397885
ELLESYIDGR_597.8_710.4 THRB_HUMAN 0.043053589
ALALPPLGLAPLLNLWAKPQGR_770.5_256.2 SHBG_HUMAN 0.045692283
VGEYSLYIGR_578.8_871.5 SAMP_HUMAN 0.04765767
ANDQYLTAAALHNLDEAVK_686.4_317.2 IL1A_HUMAN 0.048928376
YYGYTGAFR_549.3_551.3 TRFL_HUMAN 0.049568351
表56.生产时间线性模型中调整的峰面积的单变量p值
蛋白质 P值
ADA12_HUMAN 0.003412707
ENPP2_HUMAN 0.003767393
ADA12_HUMAN 0.004194234
ENPP2_HUMAN 0.004298493
ADA12_HUMAN 0.004627197
ADA12_HUMAN 0.004918852
ENPP2_HUMAN 0.005792374
CO6_HUMAN 0.005858282
ENPP2_HUMAN 0.007123606
CO6_HUMAN 0.007162317
ENPP2_HUMAN 0.008228726
ENPP2_HUMAN 0.009168492
PSG9_HUMAN 0.011531192
PSG9_HUMAN 0.019389627
PSG9_HUMAN 0.023680865
INHBE_HUMAN 0.02581564
B2MG_HUMAN 0.026544689
LBP_HUMAN 0.031068274
PSG9_HUMAN 0.031091843
APOA2_HUMAN 0.033130498
蛋白质 P值
INHBC_HUMAN 0.03395215
CBG_HUMAN 0.034710348
PSGx_HUMAN 0.035719227
CBG_HUMAN 0.036331871
CSH_HUMAN 0.039896611
CSH_HUMAN 0.04244001
SAMP_HUMAN 0.047112128
LBP_HUMAN 0.048141371
LBP_HUMAN 0.048433174
CO6_HUMAN 0.04850949
PSGx_HUMAN 0.049640167
表57.出生时孕龄的线性模型中调整的峰面积的单变量p值
跃迁 蛋白质 P值
ENPAVIDFELAPIVDLVR_670.7_811.5 CO6_HUMAN 0.000117239
ENPAVIDFELAPIVDLVR_670.7_601.4 CO6_HUMAN 0.000130113
TYLHTYESEI_628.3_908.4 ENPP2_HUMAN 0.000160472
TYLHTYESEI_628.3_515.3 ENPP2_HUMAN 0.000175167
TEFLSNYLTNVDDITLVPGTLGR_846.8_600.3 ENPP2_HUMAN 0.000219886
TEFLSNYLTNVDDITLVPGTLGR_846.8_699.4 ENPP2_HUMAN 0.000328416
WWGGQPLWITATK_772.4_373.2 ENPP2_HUMAN 0.000354644
WWGGQPLWITATK_772.4_929.5 ENPP2_HUMAN 0.000390821
SEYGAALAWEK_612.8_788.4 CO6_HUMAN 0.000511882
LDFHFSSDR_375.2_448.2 INHBC_HUMAN 0.000600637
ALVLELAK_428.8_672.4 INHBE_HUMAN 0.000732445
GLQYAAQEGLLALQSELLR_1037.1_929.5 LBP_HUMAN 0.000743924
DVLLLVHNLPQNLPGYFWYK_810.4_960.5 PSG9_HUMAN 0.000759173
FGFGGSTDSGPIR_649.3_745.4 ADA12_HUMAN 0.001224347
DVLLLVHNLPQNLPGYFWYK_810.4_328.2 PSG9_HUMAN 0.001241329
GYVIIKPLVWV_643.9_304.2 SAMP_HUMAN 0.001853785
SPELQAEAK_486.8_659.4 APOA2_HUMAN 0.001856303
GLQYAAQEGLLALQSELLR_1037.1_858.5 LBP_HUMAN 0.001978165
LDFHFSSDR_375.2_611.3 INHBC_HUMAN 0.002098948
LIEIANHVDK_384.6_683.4 ADA12_HUMAN 0.002212096
SFRPFVPR_335.9_272.2 LBP_HUMAN 0.002545286
SFRPFVPR_335.9_635.3 LBP_HUMAN 0.002620268
WSAGLTSSQVDLYIPK_883.0_515.3 CBG_HUMAN 0.002787272
DLHLSDVFLK_396.2_260.2 CO6_HUMAN 0.002954612
LIEIANHVDK_384.6_498.3 ADA12_HUMAN 0.002955081
DVLLLVHNLPQNLPGYFWYK_810.4_215.1 PSG9_HUMAN 0.003541011
LFIPQITR_494.3_614.4 PSG9_HUMAN 0.003750666
FGFGGSTDSGPIR_649.3_946.5 ADA12_HUMAN 0.003773696
YYLQGAK_421.7_516.3 ITIH4_HUMAN 0.004064026
SEYGAALAWEK_612.8_845.5 CO6_HUMAN 0.004208136
AITPPHPASQANIIFDITEGNLR_825.8_459.3 FBLN1_HUMAN 0.004709104
LDFHFSSDR_375.2_464.2 INHBC_HUMAN 0.005355741
HELTDEELQSLFTNFANVVDK_817.1_854.4 AFAM_HUMAN 0.005370567
ALNHLPLEYNSALYSR_621.0_696.4 CO6_HUMAN 0.005705922
跃迁 蛋白质 P值
ITQDAQLK_458.8_702.4 CBG_HUMAN 0.006762484
ITLPDFTGDLR_624.3_920.5 LBP_HUMAN 0.006993268
SILFLGK_389.2_577.4 THBG_HUMAN 0.007134146
WSAGLTSSQVDLYIPK_883.0_357.2 CBG_HUMAN 0.007670388
GVTSVSQIFHSPDLAIR_609.7_472.3 IC1_HUMAN 0.007742729
VGEYSLYIGR_578.8_871.5 SAMP_HUMAN 0.007778691
ITLPDFTGDLR_624.3_288.2 LBP_HUMAN 0.008179918
YYLQGAK_421.7_327.1 ITIH4_HUMAN 0.008404686
ALNHLPLEYNSALYSR_621.0_538.3 CO6_HUMAN 0.008601162
DYWSTVK_449.7_620.3 APOC3_HUMAN 0.008626786
TVQAVLTVPK_528.3_855.5 PEDF_HUMAN 0.008907523
ITGFLKPGK_320.9_301.2 LBP_HUMAN 0.009155417
LFIPQITR_494.3_727.4 PSG9_HUMAN 0.009571006
SPELQAEAK_486.8_788.4 APOA2_HUMAN 0.009776508
DYWSTVK_449.7_347.2 APOC3_HUMAN 0.00998356
ITGFLKPGK_320.9_429.3 LBP_HUMAN 0.010050264
FLNWIK_410.7_560.3 HABP2_HUMAN 0.010372454
DLHLSDVFLK_396.2_366.2 CO6_HUMAN 0.010806378
GVTSVSQIFHSPDLAIR_609.7_908.5 IC1_HUMAN 0.011035991
VEHSDLSFSK_383.5_468.2 B2MG_HUMAN 0.011113172
LLDSLPSDTR_558.8_276.2 IC1_HUMAN 0.011589013
LLDSLPSDTR_558.8_890.4 IC1_HUMAN 0.011629438
QALEEFQK_496.8_551.3 CO8B_HUMAN 0.011693839
LLDSLPSDTR_558.8_575.3 IC1_HUMAN 0.012159314
IIGGSDADIK_494.8_762.4 C1S_HUMAN 0.013080243
AFIQLWAFDAVK_704.9_650.4 AMBP_HUMAN 0.013462234
GFQALGDAADIR_617.3_717.4 TIMP1_HUMAN 0.014370997
LPNNVLQEK_527.8_730.4 AFAM_HUMAN 0.014424891
DTDTGALLFIGK_625.8_217.1 PEDF_HUMAN 0.014967952
VQTAHFK_277.5_502.3 CO8A_HUMAN 0.01524844
ILILPSVTR_506.3_559.3 PSGx_HUMAN 0.015263132
SILFLGK_389.2_201.1 THBG_HUMAN 0.015265233
TVQAVLTVPK_528.3_428.3 PEDF_HUMAN 0.015344052
VEPLYELVTATDFAYSSTVR_754.4_712.4 CO8B_HUMAN 0.015451068
FSLVSGWGQLLDR_493.3_447.3 FA7_HUMAN 0.015510454
GWVTDGFSSLK_598.8_854.4 APOC3_HUMAN 0.01610797
LSETNR_360.2_519.3 PSG1_HUMAN 0.016433362
TQILEWAAER_608.8_632.3 EGLN_HUMAN 0.01644844
SETEIHQGFQHLHQLFAK_717.4_318.1 CBG_HUMAN 0.016720367
TNLESILSYPK_632.8_936.5 IC1_HUMAN 0.017314185
TNLESILSYPK_632.8_807.5 IC1_HUMAN 0.017593786
AYSDLSR_406.2_375.2 SAMP_HUMAN 0.018531348
YEVQGEVFTKPQLWP_911.0_392.2 CRP_HUMAN 0.019111323
AYSDLSR_406.2_577.3 SAMP_HUMAN 0.019271266
QALEEFQK_496.8_680.3 CO8B_HUMAN 0.019429489
APLTKPLK_289.9_398.8 CRP_HUMAN 0.020110081
FQPTLLTLPR_593.4_276.1 IC1_HUMAN 0.020114306
ITQDAQLK_458.8_803.4 CBG_HUMAN 0.020401782
跃迁 蛋白质 P值
AVLHIGEK_289.5_292.2 THBG_HUMAN 0.02056597
ANDQYLTAAALHNLDEAVK_686.4_317.2 IL1A_HUMAN 0.020770124
VGEYSLYIGR_578.8_708.4 SAMP_HUMAN 0.021126414
TLYSSSPR_455.7_533.3 IC1_HUMAN 0.021306106
VEHSDLSFSK_383.5_234.1 B2MG_HUMAN 0.021640643
HELTDEELQSLFTNFANVVDK_817.1_906.5 AFAM_HUMAN 0.021921609
TLYSSSPR_455.7_696.3 IC1_HUMAN 0.022196181
GYVIIKPLVWV_643.9_854.6 SAMP_HUMAN 0.023126336
DEIPHNDIALLK_459.9_260.2 HABP2_HUMAN 0.023232158
ILILPSVTR_506.3_785.5 PSGx_HUMAN 0.023519909
WNFAYWAAHQPWSR_607.3_545.3 PRG2_HUMAN 0.023697087
FQPTLLTLPR_593.4_712.5 IC1_HUMAN 0.023751959
AQPVQVAEGSEPDGFWEALGGK_758.0_623.4 GELS_HUMAN 0.024262721
DEIPHNDIALLK_459.9_510.8 HABP2_HUMAN 0.024414348
GDSGGAFAVQDPNDK_739.3_716.3 C1S_HUMAN 0.025075028
FLNWIK_410.7_561.3 HABP2_HUMAN 0.025649617
APLTKPLK_289.9_357.2 CRP_HUMAN 0.025961162
ALDLSLK_380.2_185.1 ITIH3_HUMAN 0.026233504
GWVTDGFSSLK_598.8_953.5 APOC3_HUMAN 0.026291884
SETEIHQGFQHLHQLFAK_717.4_447.2 CBG_HUMAN 0.026457136
GDSGGAFAVQDPNDK_739.3_473.2 C1S_HUMAN 0.02727457
YEVQGEVFTKPQLWP_911.0_293.1 CRP_HUMAN 0.028244448
HVVQLR_376.2_614.4 IL6RA_HUMAN 0.028428028
DTDTGALLFIGK_625.8_818.5 PEDF_HUMAN 0.028773557
EVPLSALTNILSAQLISHWK_740.8_996.6 PAI1_HUMAN 0.029150774
AFTECCVVASQLR_770.9_574.3 CO5_HUMAN 0.029993325
TLAFVR_353.7_492.3 FA7_HUMAN 0.030064307
LWAYLTIQELLAK_781.5_300.2 ITIH1_HUMAN 0.030368674
DEIPHNDIALLK_459.9_245.1 HABP2_HUMAN 0.031972082
AGLLRPDYALLGHR_518.0_369.2 PGRP2_HUMAN 0.032057409
AVYEAVLR_460.8_587.4 PEPD_HUMAN 0.032527521
LPNNVLQEK_527.8_844.5 AFAM_HUMAN 0.033807082
GAVHVVVAETDYQSFAVLYLER_822.8_580.3 CO8G_HUMAN 0.034370139
WNFAYWAAHQPWSR_607.3_673.3 PRG2_HUMAN 0.0349737
EAQLPVIENK_570.8_329.2 PLMN_HUMAN 0.035304322
VQEAHLTEDQIFYFPK_655.7_701.4 CO8G_HUMAN 0.035704382
AFIQLWAFDAVK_704.9_836.4 AMBP_HUMAN 0.035914532
SGFSFGFK_438.7_585.3 CO8B_HUMAN 0.037168221
SGFSFGFK_438.7_732.4 CO8B_HUMAN 0.040182596
DADPDTFFAK_563.8_302.1 AFAM_HUMAN 0.041439744
EAQLPVIENK_570.8_699.4 PLMN_HUMAN 0.041447675
IIGGSDADIK_494.8_260.2 C1S_HUMAN 0.041683256
AVLTIDEK_444.8_718.4 A1AT_HUMAN 0.043221658
SEPRPGVLLR_375.2_654.4 FA7_HUMAN 0.044079127
YHFEALADTGISSEFYDNANDLLSK_940.8_874.5 CO8A_HUMAN 0.045313634
HFQNLGK_422.2_527.2 AFAM_HUMAN 0.047118971
LEQGENVFLQATDK_796.4_822.4 C1QB_HUMAN 0.047818928
NTVISVNPSTK_580.3_732.4 VCAM1_HUMAN 0.048102262
跃迁 蛋白质 P值
YYGYTGAFR_549.3_551.3 TRFL_HUMAN 0.048331316
ISLLLIESWLEPVR_834.5_500.3 CSH_HUMAN 0.049561581
LQVLGK_329.2_416.3 A2GL_HUMAN 0.049738493
表58.峰面积比的单变量p值(<37相对于>37周)
UniProt_ID 跃迁 P值
SHBG_HUMAN IALGGLLFPASNLR_481.3_657.4 0.006134652
SHBG_HUMAN IALGGLLFPASNLR_481.3_412.3 0.019049498
APOC3_HUMAN DALSSVQESQVAQQAR_573.0_672.4 0.020688543
THBG_HUMAN AVLHIGEK_289.5_292.2 0.0291698
PSG9_HUMAN DVLLLVHNLPQNLPGYFWYK_810.4_960.5 0.033518454
APOC3_HUMAN DALSSVQESQVAQQAR_573.0_502.3 0.043103265
PSG9_HUMAN LFIPQITR_494.3_614.4 0.04655948
表59.峰面积比的单变量p值(<37相对于>40周)
UniProt_ID 跃迁 P值
APOC3_HUMAN DALSSVQESQVAQQAR_573.0_672.4 0.011174438
APOC3_HUMAN DALSSVQESQVAQQAR_573.0_502.3 0.015231617
PSG9_HUMAN LFIPQITR_494.3_614.4 0.018308413
PSG9_HUMAN LFIPQITR_494.3_727.4 0.027616871
PSG9_HUMAN DVLLLVHNLPQNLPGYFWYK_810.4_960.5 0.028117582
THBG_HUMAN AVLHIGEK_289.5_292.2 0.038899107
CO6_HUMAN ALNHLPLEYNSALYSR_621.0_696.4 0.040662269
ENPP2_HUMAN TYLHTYESEI_628.3_908.4 0.044545826
表60.生产时间线性模型中峰面积比的单变量p值
UniProt_ID 跃迁 P值
ADA12_HUMAN FGFGGSTDSGPIR_649.3_946.5 5.85E-27
ADA12_HUMAN FGFGGSTDSGPIR_649.3_745.4 2.65E-24
PSG4_HUMAN TLFIFGVTK_513.3_215.1 1.07E-20
PSG4_HUMAN TLFIFGVTK_513.3_811.5 2.32E-20
PSGx_HUMAN ILILPSVTR_506.3_785.5 8.25E-16
PSGx_HUMAN ILILPSVTR_506.3_559.3 9.72E-16
PSG1_HUMAN FQLPGQK_409.2_429.2 1.29E-12
PSG11_HUMAN LFIPQITPK_528.8_261.2 2.11E-12
PSG1_HUMAN FQLPGQK_409.2_276.1 2.33E-12
PSG11_HUMAN LFIPQITPK_528.8_683.4 3.90E-12
PSG6_HUMAN SNPVTLNVLYGPDLPR_585.7_817.4 5.71E-12
PSG6_HUMAN SNPVTLNVLYGPDLPR_585.7_654.4 1.82E-11
VGFR3_HUMAN SGVDLADSNQK_567.3_662.3 4.57E-11
INHBE_HUMAN ALVLELAK_428.8_331.2 1.04E-08
PSG2_HUMAN IHPSYTNYR_384.2_452.2 6.27E-08
PSG9_HUMAN LFIPQITR_494.3_727.4 1.50E-07
VGFR3_HUMAN SGVDLADSNQK_567.3_591.3 2.09E-07
PSG9_HUMAN LFIPQITR_494.3_614.4 2.71E-07
PSG9_HUMAN DVLLLVHNLPQNLPGYFWYK_810.4_960.5 3.10E-07
PSG2_HUMAN IHPSYTNYR_384.2_338.2 2.55E-06
ITIH3_HUMAN LIQDAVTGLTVNGQITGDK_972.0_640.4 2.76E-06
UniProt_ID 跃迁 P值
ENPP2_HUMAN TYLHTYESEI_628.3_908.4 2.82E-06
ENPP2_HUMAN WWGGQPLWITATK_772.4_373.2 3.75E-06
PSG9_HUMAN DVLLLVHNLPQNLPGYFWYK_810.4_328.2 3.94E-06
B2MG_HUMAN VEHSDLSFSK_383.5_468.2 5.42E-06
ENPP2_HUMAN WWGGQPLWITATK_772.4_929.5 7.93E-06
ANGT_HUMAN ALQDQLVLVAAK_634.9_289.2 1.04E-05
B2MG_HUMAN VNHVTLSQPK_374.9_244.2 1.46E-05
AFAM_HUMAN LPNNVLQEK_527.8_730.4 1.50E-05
AFAM_HUMAN LPNNVLQEK_527.8_844.5 1.98E-05
THBG_HUMAN AVLHIGEK_289.5_292.2 2.15E-05
ENPP2_HUMAN TYLHTYESEI_628.3_515.3 2.17E-05
IL12B_HUMAN DIIKPDPPK_511.8_342.2 3.31E-05
AFAM_HUMAN DADPDTFFAK_563.8_302.1 6.16E-05
THBG_HUMAN AVLHIGEK_289.5_348.7 8.34E-05
PSG9_HUMAN DVLLLVHNLPQNLPGYFWYK_810.4_215.1 0.000104442
B2MG_HUMAN VEHSDLSFSK_383.5_234.1 0.000140786
TRFL_HUMAN YYGYTGAFR_549.3_450.3 0.000156543
HEMO_HUMAN QGHNSVFLIK_381.6_260.2 0.000164578
A1BG_HUMAN LLELTGPK_435.8_227.2 0.000171113
CO6_HUMAN ALNHLPLEYNSALYSR_621.0_696.4 0.000242116
CO6_HUMAN ALNHLPLEYNSALYSR_621.0_538.3 0.00024681
ALS_HUMAN IRPHTFTGLSGLR_485.6_432.3 0.000314359
ITIH2_HUMAN LSNENHGIAQR_413.5_544.3 0.0004877
PEDF_HUMAN TVQAVLTVPK_528.3_855.5 0.000508174
AFAM_HUMAN HFQNLGK_422.2_527.2 0.000522139
FLNA_HUMAN TGVAVNKPAEFTVDAK_549.6_258.1 0.000594403
ANGT_HUMAN ALQDQLVLVAAK_634.9_956.6 0.000640673
AFAM_HUMAN HFQNLGK_422.2_285.1 0.000718763
HGFA_HUMAN LHKPGVYTR_357.5_692.4 0.000753293
HGFA_HUMAN LHKPGVYTR_357.5_479.3 0.000909298
HABP2_HUMAN FLNWIK_410.7_561.3 0.001282014
FETUA_HUMAN HTLNQIDEVK_598.8_951.5 0.001389792
AFAM_HUMAN DADPDTFFAK_563.8_825.4 0.001498237
B2MG_HUMAN VNHVTLSQPK_374.9_459.3 0.001559862
ALS_HUMAN IRPHTFTGLSGLR_485.6_545.3 0.001612361
A1BG_HUMAN LLELTGPK_435.8_644.4 0.002012656
F13B_HUMAN LIENGYFHPVK_439.6_343.2 0.00275216
ITIH2_HUMAN LSNENHGIAQR_413.5_519.8 0.00356561
APOC3_HUMAN DALSSVQESQVAQQAR_573.0_672.4 0.00392745
F13B_HUMAN LIENGYFHPVK_439.6_627.4 0.00434836
PEDF_HUMAN TVQAVLTVPK_528.3_428.3 0.00482765
PLMN_HUMAN YEFLNGR_449.7_293.1 0.007325436
HEMO_HUMAN QGHNSVFLIK_381.6_520.4 0.009508516
FETUA_HUMAN HTLNQIDEVK_598.8_958.5 0.010018936
CO5_HUMAN LQGTLPVEAR_542.3_842.5 0.011140661
PLMN_HUMAN YEFLNGR_449.7_606.3 0.01135322
CO5_HUMAN TLLPVSKPEIR_418.3_288.2 0.015045275
HABP2_HUMAN FLNWIK_410.7_560.3 0.01523134
UniProt_ID 跃迁 P值
APOC3_HUMAN DALSSVQESQVAQQAR_573.0_502.3 0.01584708
CO5_HUMAN LQGTLPVEAR_542.3_571.3 0.017298064
CFAB_HUMAN DISEVVTPR_508.3_472.3 0.021743221
CERU_HUMAN TTIEKPVWLGFLGPIIK_638.0_640.4 0.02376225
CO8G_HUMAN SLPVSDSVLSGFEQR_810.9_723.3 0.041150397
CO8G_HUMAN FLQEQGHR_338.8_497.3 0.042038143
CO5_HUMAN VFQFLEK_455.8_811.4 0.043651929
CO8B_HUMAN QALEEFQK_496.8_680.3 0.04761631
表61.出生时孕龄的线性模型中峰面积比的单变量p值
UniProt_ID 跃迁 P值
PSG9_HUMAN DVLLLVHNLPQNLPGYFWYK_810.4_960.5 0.000431547
B2MG_HUMAN VEHSDLSFSK_383.5_468.2 0.000561148
PSG9_HUMAN DVLLLVHNLPQNLPGYFWYK_810.4_328.2 0.000957509
ENPP2_HUMAN TYLHTYESEI_628.3_908.4 0.001058809
THBG_HUMAN AVLHIGEK_289.5_292.2 0.001180484
ENPP2_HUMAN WWGGQPLWITATK_772.4_373.2 0.001524983
PSG9_HUMAN LFIPQITR_494.3_614.4 0.001542932
ENPP2_HUMAN WWGGQPLWITATK_772.4_929.5 0.002047607
ENPP2_HUMAN TYLHTYESEI_628.3_515.3 0.003087492
PSG9_HUMAN LFIPQITR_494.3_727.4 0.00477154
PSG9_HUMAN DVLLLVHNLPQNLPGYFWYK_810.4_215.1 0.004824351
THBG_HUMAN AVLHIGEK_289.5_348.7 0.006668084
AFAM_HUMAN LPNNVLQEK_527.8_730.4 0.006877647
ADA12_HUMAN FGFGGSTDSGPIR_649.3_745.4 0.011738104
PEDF_HUMAN TVQAVLTVPK_528.3_855.5 0.013349511
A1BG_HUMAN LLELTGPK_435.8_227.2 0.015793885
ITIH3_HUMAN ALDLSLK_380.2_185.1 0.016080436
ADA12_HUMAN FGFGGSTDSGPIR_649.3_946.5 0.017037089
B2MG_HUMAN VEHSDLSFSK_383.5_234.1 0.017072093
CO6_HUMAN ALNHLPLEYNSALYSR_621.0_696.4 0.024592775
TRFL_HUMAN YYGYTGAFR_549.3_450.3 0.030890831
AFAM_HUMAN DADPDTFFAK_563.8_302.1 0.033791429
CO6_HUMAN ALNHLPLEYNSALYSR_621.0_538.3 0.034865341
AFAM_HUMAN LPNNVLQEK_527.8_844.5 0.039880594
PEDF_HUMAN TVQAVLTVPK_528.3_428.3 0.040854402
PLMN_HUMAN EAQLPVIENK_570.8_329.2 0.041023812
LBP_HUMAN ITLPDFTGDLR_624.3_920.5 0.042276813
CO8G_HUMAN VQEAHLTEDQIFYFPK_655.7_701.4 0.042353851
PLMN_HUMAN YEFLNGR_449.7_606.3 0.04416504
B2MG_HUMAN VNHVTLSQPK_374.9_459.3 0.045458409
CFAB_HUMAN DISEVVTPR_508.3_472.3 0.046493405
INHBE_HUMAN ALVLELAK_428.8_331.2 0.04789353
表62.使用调整的峰面积的随机森林重要性值
跃迁 排名 重要性
INHBE_ALVLELAK_428.8_672.4 1 2964.951571
EGLN_TQILEWAAER_608.8_761.4 2 1218.3406
跃迁 排名 重要性
FA7_SEPRPGVLLR_375.2_654.4 3 998.92897
CBG_ITQDAQLK_458.8_702.4 4 930.9931102
ITIH3_ALDLSLK_380.2_185.1 5 869.6315408
ENPP2_WWGGQPLWITATK_772.4_929.5 6 768.9182114
CBG_ITQDAQLK_458.8_803.4 7 767.8940452
PSG1_LSETNR_360.2_519.3 8 714.6160065
CAA60698_LEPLYSASGPGLRPLVIK_637.4_834.5 9 713.4086612
INHBC_LDFHFSSDR_375.2_611.3 11 681.2442909
CBG_QINSYVK_426.2_610.3 12 674.3363415
LBP_GLQYAAQEGLLALQSELLR_1037.1_858.5 13 603.197751
A1BG_LLELTGPK_435.8_644.4 14 600.9902818
CO6_DLHLSDVFLK_396.2_366.2 15 598.8214342
VCAM1_TQIDSPLSGK_523.3_816.5 16 597.4038769
LRP1_NAVVQGLEQPHGLVVHPLR_688.4_285.2 17 532.0500081
CBG_QINSYVK_426.2_496.3 18 516.5575201
CO6_ENPAVIDFELAPIVDLVR_670.7_811.5 19 501.4669261
ADA12_FGFGGSTDSGPIR_649.3_745.4 20 473.5510333
CO6_DLHLSDVFLK_396.2_260.2 21 470.5473702
ENPP2_TYLHTYESEI_628.3_908.4 22 444.7580726
A1BG_LLELTGPK_435.8_227.2 23 444.696292
FRIH_QNYHQDSEAAINR_515.9_544.3 24 439.2648872
ENPP2_TEFLSNYLTNVDDITLVPGTLGR_846.8_600.3 25 389.3769604
CBG_WSAGLTSSQVDLYIPK_883.0_515.3 26 374.0749768
C1QC_FQSVFTVTR_542.8_623.4 27 370.6957977
GELS_DPDQTDGLGLSYLSSHIANVER_796.4_456.2 28 353.1176588
A1BG_ATWSGAVLAGR_544.8_643.4 29 337.4580124
APOA1_AKPALEDLR_506.8_813.5 30 333.5742035
ENPP2_TYLHTYESEI_628.3_515.3 31 322.6339162
PEPD_AVYEAVLR_460.8_750.4 32 321.4377907
TIMP1_GFQALGDAADIR_617.3_717.4 33 310.0997949
ADA12_LIEIANHVDK_384.6_498.3 34 305.8803542
PGRP2_WGAAPYR_410.7_577.3 35 303.5539874
PSG9_LFIPQITR_494.3_614.4 36 300.7877317
HABP2_FLNWIK_410.7_560.3 37 298.3363186
CBG_WSAGLTSSQVDLYIPK_883.0_357.2 38 297.2474385
PSG2_IHPSYTNYR_384.2_452.2 39 292.6203405
PSG5_LSIPQITTK_500.8_800.5 40 290.2023364
HABP2_FLNWIK_410.7_561.3 41 289.5092933
CO6_SEYGAALAWEK_612.8_788.4 42 287.7634114
ADA12_LIEIANHVDK_384.6_683.4 43 286.5047372
EGLN_TQILEWAAER_608.8_632.3 44 284.5138846
CO6_ENPAVIDFELAPIVDLVR_670.7_601.4 45 273.5146272
FA7_FSLVSGWGQLLDR_493.3_447.3 46 271.7850098
ITIH3_ALDLSLK_380.2_575.3 47 269.9425709
ADA12_FGFGGSTDSGPIR_649.3_946.5 48 264.5698225
FETUA_AALAAFNAQNNGSNFQLEEISR_789.1_746.4 49 247.4728828
FBLN1_AITPPHPASQANIIFDITEGNLR_825.8_459.3 50 246.572102
TSP1_FVFGTTPEDILR_697.9_843.5 51 245.0459575
跃迁 排名 重要性
VCAM1_NTVISVNPSTK_580.3_732.4 52 240.576729
ENPP2_TEFLSNYLTNVDDITLVPGTLGR_846.8_699.4 53 240.1949512
FBLN3_ELPQSIVYK_538.8_409.2 55 233.6825304
ACTB_VAPEEHPVLLTEAPLNPK_652.0_892.5 56 226.9772749
TSP1_FVFGTTPEDILR_697.9_742.4 57 224.4627393
PLMN_EAQLPVIENK_570.8_699.4 58 221.4663735
C1S_IIGGSDADIK_494.8_260.2 59 218.069476
IL1A_ANDQYLTAAALHNLDEAVK_686.4_317.2 60 216.5531949
PGRP2_WGAAPYR_410.7_634.3 61 211.0918302
PSG5_LSIPQITTK_500.8_687.4 62 208.7871461
PSG6_SNPVTLNVLYGPDLPR_585.7_654.4 63 207.9294937
PRG2_WNFAYWAAHQPWSR_607.3_545.3 64 202.9494031
CXCL2_CQCLQTLQGIHLK_13p8RT_533.6_567.4 65 202.9051326
CXCL2_CQCLQTLQGIHLK_13p48RT_533.6_695.4 66 202.6561548
G6PE_LLDFEFSSGR_585.8_553.3 67 201.004611
GELS_TASDFITK_441.7_710.4 68 200.2704809
B2MG_VEHSDLSFSK_383.5_468.2 69 199.880987
CO8B_IPGIFELGISSQSDR_809.9_849.4 70 198.7563875
PSG8_LQLSETNR_480.8_606.3 71 197.6739966
LBP_GLQYAAQEGLLALQSELLR_1037.1_929.5 72 197.4094851
AFAM_LPNNVLQEK_527.8_844.5 73 196.8123228
MAGE 74 196.2410502
PSG2_IHPSYTNYR_384.2_338.2 75 196.2410458
PSG9_LFIPQITR_494.3_727.4 76 193.5329266
TFR1_YNSQLLSFVR_613.8_734.5 77 193.2711994
C1R_QRPPDLDTSSNAVDLLFFTDESGDSR_961.5_866.3 78 193.0625419
PGH1_ILPSVPK_377.2_264.2 79 190.0504508
FA7_SEPRPGVLLR_375.2_454.3 80 188.2718422
FA7_TLAFVR_353.7_274.2 81 187.6895294
PGRP2_DGSPDVTTADIGANTPDATK_973.5_844.4 82 185.6017519
C1S_IIGGSDADIK_494.8_762.4 83 184.5985543
PEPD_VPLALFALNR_557.3_620.4 84 184.3962957
C1S_EDTPNSVWEPAK_686.8_630.3 85 179.2043504
CHL1_TAVTANLDIR_537.3_802.4 86 174.9866792
CHL1_VIAVNEVGR_478.8_744.4 88 172.2053147
SDF1_ILNTPNCALQIVAR_791.9_341.2 89 171.4604557
PAI1_EVPLSALTNILSAQLISHWK_740.8_996.6 90 169.5635635
AMBP_AFIQLWAFDAVK_704.9_650.4 91 169.2124477
G6PE_LLDFEFSSGR_585.8_944.4 92 168.2398598
THBG_SILFLGK_389.2_577.4 93 166.3110206
PRDX2_GLFIIDGK_431.8_545.3 94 164.3125132
ENPP2_WWGGQPLWITATK_772.4_373.2 95 163.4011689
VGFR3_SGVDLADSNQK_567.3_662.3 96 162.8822352
C1S_EDTPNSVWEPAK_686.8_315.2 97 161.6140915
AFAM_DADPDTFFAK_563.8_302.1 98 159.5917449
CBG_SETEIHQGFQHLHQLFAK_717.4_447.2 99 156.1357404
C1S_LLEVPEGR_456.8_686.4 100 155.1763293
PTGDS_GPGEDFR_389.2_623.3 101 154.9205208
跃迁 排名 重要性
ITIH2_IYLQPGR_423.7_329.2 102 154.6552717
FA7_TLAFVR_353.7_492.3 103 152.5009422
FA7_FSLVSGWGQLLDR_493.3_403.2 104 151.9971204
SAMP_VGEYSLYIGR_578.8_871.5 105 151.4738449
APOH_EHSSLAFWK_552.8_267.1 106 151.0052645
PGRP2_AGLLRPDYALLGHR_518.0_595.4 107 150.4149907
C1QC_FNAVLTNPQGDYDTSTGK_964.5_333.2 108 149.2592827
PGRP2_AGLLRPDYALLGHR_518.0_369.2 109 147.3609354
PGRP2_TFTLLDPK_467.8_686.4 111 145.2145223
CO5_TDAPDLPEENQAR_728.3_843.4 112 144.5213118
THRB_ELLESYIDGR_597.8_839.4 113 143.924639
GELS_DPDQTDGLGLSYLSSHIANVER_796.4_328.1 114 142.8936101
TRFL_YYGYTGAFR_549.3_450.3 115 142.8651352
HEMO_QGHNSVFLIK_381.6_260.2 116 142.703845
C1S_GDSGGAFAVQDPNDK_739.3_716.3 117 142.2799122
B1A4H9_AHQLAIDTYQEFR_531.3_450.3 118 138.196407
C1S_SSNNPHSPIVEEFQVPYNK_729.4_261.2 119 136.7868935
HYOU1_LPATEKPVLLSK_432.6_347.2 120 136.1146437
FETA_GYQELLEK_490.3_502.3 121 135.2890322
LRP1_SERPPIFEIR_415.2_288.2 122 134.6569527
CO6_SEYGAALAWEK_612.8_845.5 124 132.8634704
CERU_TTIEKPVWLGFLGPIIK_638.0_844.5 125 132.1047746
IBP1_AQETSGEEISK_589.8_850.4 126 130.934446
SHBG_VVLSSGSGPGLDLPLVLGLPLQLK_791.5_768.5 127 128.2052287
CBG_SETEIHQGFQHLHQLFAK_717.4_318.1 128 127.9873837
A1AT_LSITGTYDLK_555.8_696.4 129 127.658818
PGRP2_DGSPDVTTADIGANTPDATK_973.5_531.3 130 126.5775806
C1QB_LEQGENVFLQATDK_796.4_675.4 131 126.1762726
EGLN_GPITSAAELNDPQSILLR_632.4_826.5 132 125.7658253
IL12B_YENYTSSFFIR_713.8_293.1 133 125.0476631
B2MG_VEHSDLSFSK_383.5_234.1 134 124.9154706
PGH1_AEHPTWGDEQLFQTTR_639.3_765.4 135 124.8913193
INHBE_ALVLELAK_428.8_331.2 136 124.0109276
HYOU1_LPATEKPVLLSK_432.6_460.3 137 123.1900369
CXCL2_CQCLQTLQGIHLK_13p48RT_533.6_567.4 138 122.8800873
PZP_AVGYLITGYQR_620.8_523.3 139 122.4733204
AFAM_IAPQLSTEELVSLGEK_857.5_333.2 140 122.4707849
ICAM1_VELAPLPSWQPVGK_760.9_400.3 141 121.5494206
CHL1_VIAVNEVGR_478.8_284.2 142 119.0877137
APOB_ITENDIQIALDDAK_779.9_632.3 143 118.0222045
SAMP_AYSDLSR_406.2_577.3 144 116.409429
AMBP_AFIQLWAFDAVK_704.9_836.4 145 116.1900846
EGLN_GPITSAAELNDPQSILLR_632.4_601.4 146 115.8438804
LRP1_NAVVQGLEQPHGLVVHPLR_688.4_890.6 147 114.539707
SHBG_VVLSSGSGPGLDLPLVLGLPLQLK_791.5_598.4 148 113.1931134
IBP1_AQETSGEEISK_589.8_979.5 149 112.9902709
PSG6_SNPVTLNVLYGPDLPR_585.7_817.4 150 112.7910917
APOC3_DYWSTVK_449.7_347.2 151 112.544736
跃迁 排名 重要性
C1R_WILTAAHTLYPK_471.9_621.4 152 112.2199708
ANGT_ADSQAQLLLSTVVGVFTAPGLHLK_822.5_983.6 153 111.9634671
PSG9_DVLLLVHNLPQNLPGYFWYK_810.4_328.2 154 111.5743214
A1AT_AVLTIDEK_444.8_605.3 155 111.216651
PSGx_ILILPSVTR_506.3_785.5 156 110.8482935
THRB_ELLESYIDGR_597.8_710.4 157 110.7496103
SHBG_ALALPPLGLAPLLNLWAKPQGR_770.5_256.2 158 110.5091269
PZP_QTLSWTVTPK_580.8_545.3 159 110.4675104
SHBG_ALALPPLGLAPLLNLWAKPQGR_770.5_457.3 160 110.089808
PSG4_TLFIFGVTK_513.3_811.5 161 109.9039967
PLMN_YEFLNGR_449.7_293.1 162 109.6880397
PEPD_AVYEAVLR_460.8_587.4 163 109.3697285
PLMN_LSSPAVITDK_515.8_830.5 164 108.963353
FINC_SYTITGLQPGTDYK_772.4_352.2 165 108.452612
C1R_WILTAAHTLYPK_471.9_407.2 166 107.8348417
CHL1_TAVTANLDIR_537.3_288.2 167 107.7278897
TENA_AVDIPGLEAATPYR_736.9_286.1 168 107.6166195
CRP_YEVQGEVFTKPQLWP_911.0_293.1 169 106.9739589
APOB_SVSLPSLDPASAK_636.4_885.5 170 106.5901668
PRDX2_SVDEALR_395.2_488.3 171 106.2325046
CO8A_YHFEALADTGISSEFYDNANDLLSK_940.8_301.1 172 105.8963287
C1QC_FQSVFTVTR_542.8_722.4 173 105.4338742
PSGx_ILILPSVTR_506.3_559.3 174 105.1942655
VCAM1_TQIDSPLSGK_523.3_703.4 175 105.0091767
VCAM1_NTVISVNPSTK_580.3_845.5 176 104.8754444
CSH_ISLLLIESWLEPVR_834.5_500.3 177 104.6158295
HGFA_EALVPLVADHK_397.9_439.8 178 104.3383142
CGB1_CRPINATLAVEK_457.9_660.4 179 104.3378072
APOB_IEGNLIFDPNNYLPK_874.0_414.2 180 103.9849346
C1QB_LEQGENVFLQATDK_796.4_822.4 181 103.9153207
APOH_EHSSLAFWK_552.8_838.4 182 103.9052103
CO5_LQGTLPVEAR_542.3_842.5 183 103.1061869
SHBG_IALGGLLFPASNLR_481.3_412.3 184 102.2490294
B2MG_VNHVTLSQPK_374.9_459.3 185 102.1204362
APOA2_SPELQAEAK_486.8_659.4 186 101.9166647
FLNA_TGVAVNKPAEFTVDAK_549.6_258.1 187 101.5207852
PLMN_YEFLNGR_449.7_606.3 188 101.2531011
表63.使用峰面积比的随机森林重要性值
变量 排名 重要性
HABP2_FLNWIK_410.7_561.3 1 3501.905733
ADA12_FGFGGSTDSGPIR_649.3_946.5 2 3136.589992
A1BG_LLELTGPK_435.8_227.2 3 2387.891934
B2MG_VEHSDLSFSK_383.5_234.1 4 1431.31771
ADA12_FGFGGSTDSGPIR_649.3_745.4 5 1400.917331
B2MG_VEHSDLSFSK_383.5_468.2 6 1374.453629
APOB_IEGNLIFDPNNYLPK_874.0_414.2 7 1357.812445
PSG9_DVLLLVHNLPQNLPGYFWYK_810.4_960.5 8 1291.934596
A1BG_LLELTGPK_435.8_644.4 9 1138.712941
ITIH3_ALDLSLK_380.2_185.1 10 1137.127027
ENPP2_TYLHTYESEI_628.3_908.4 11 1041.036693
IL12B_YENYTSSFFIR_713.8_293.1 12 970.1662913
ENPP2_WWGGQPLWITATK_772.4_373.2 13 953.0631062
ENPP2_TYLHTYESEI_628.3_515.3 14 927.3512901
PSG9_LFIPQITR_494.3_614.4 15 813.9965357
MAGE 16 742.2425022
ENPP2_WWGGQPLWITATK_772.4_929.5 17 731.5206413
CERU_TTIEKPVWLGFLGPIIK_638.0_640.4 18 724.7745695
ITIH3_ALDLSLK_380.2_575.3 19 710.1982467
PSG2_IHPSYTNYR_384.2_452.2 20 697.4750893
ITIH1_LWAYLTIQELLAK_781.5_371.2 21 644.7416886
INHBE_ALVLELAK_428.8_331.2 22 643.008853
HGFA_LHKPGVYTR_357.5_692.4 23 630.8698445
TRFL_YYGYTGAFR_549.3_450.3 24 609.5866675
THBG_AVLHIGEK_289.5_348.7 25 573.9320948
GELS_TASDFITK_441.7_710.4 26 564.3288862
PSG9_LFIPQITR_494.3_727.4 27 564.1749327
VGFR3_SGVDLADSNQK_567.3_662.3 28 563.8087791
INHA_TTSDGGYSFK_531.7_860.4 29 554.210214
PSG9_DVLLLVHNLPQNLPGYFWYK_810.4_328.2 30 545.1743627
HYOU1_LPATEKPVLLSK_432.6_347.2 31 541.6208032
CO8G_VQEAHLTEDQIFYFPK_655.7_701.4 32 541.3193428
BMI 33 540.5028818
HGFA_LHKPGVYTR_357.5_479.3 34 536.6051948
PSG2_IHPSYTNYR_384.2_338.2 35 536.5363489
GELS_AQPVQVAEGSEPDGFWEALGGK_758.0_623.4 36 536.524931
PSG6_SNPVTLNVLYGPDLPR_585.7_654.4 37 520.108646
HABP2_FLNWIK_410.7_560.3 38 509.0707814
PGH1_ILPSVPK_377.2_527.3 39 503.593718
HYOU1_LPATEKPVLLSK_432.6_460.3 40 484.047422
CO6_ALNHLPLEYNSALYSR_621.0_696.4 41 477.8773179
INHBE_ALVLELAK_428.8_672.4 42 459.1998276
PLMN_LSSPAVITDK_515.8_743.4 43 452.9466414
PSG9_DVLLLVHNLPQNLPGYFWYK_810.4_215.1 44 431.8528248
BGH3_LTLLAPLNSVFK_658.4_875.5 45 424.2540315
AFAM_LPNNVLQEK_527.8_730.4 46 421.4953221
ITIH2_LSNENHGIAQR_413.5_519.8 47 413.1231437
GELS_TASDFITK_441.7_781.4 48 404.2679723
FETUA_AHYDLR_387.7_566.3 49 400.4711207
CERU_TTIEKPVWLGFLGPIIK_638.0_844.5 50 396.2873451
PSGx_ILILPSVTR_506.3_785.5 51 374.5672526
APOB_SVSLPSLDPASAK_636.4_885.5 52 371.1416438
FLNA_TGVAVNKPAEFTVDAK_549.6_258.1 53 370.4175588
PLMN_YEFLNGR_449.7_606.3 54 367.2768078
PSGx_ILILPSVTR_506.3_559.3 55 365.7704321
根据上述说明,显而易见的是可以对本文所述的本发明做出改变和变化以使其适合于多种用途和条件。这些实施方式也在以下权利要求的范围内。
在本文中,对变量的任何定义中的元素列表的列举包括该变量作为任何单个元素或所列元素组合(或子组合)的定义。在本文中,对实施方式的列举包括作为任何单个实施方式或者与任何其他实施方式或其部分组合的实施方式。
在本说明书中提及的所有专利和专利公开以每个单独的专利和专利公开具体并且单独表明作为参考并入本文的相同程度作为参考并入本文。
Figure IDA0001375524460000011
Figure IDA0001375524460000021
Figure IDA0001375524460000031
Figure IDA0001375524460000041
Figure IDA0001375524460000051
Figure IDA0001375524460000061
Figure IDA0001375524460000071
Figure IDA0001375524460000081
Figure IDA0001375524460000091
Figure IDA0001375524460000101
Figure IDA0001375524460000111
Figure IDA0001375524460000121
Figure IDA0001375524460000131
Figure IDA0001375524460000141
Figure IDA0001375524460000151
Figure IDA0001375524460000161
Figure IDA0001375524460000171
Figure IDA0001375524460000181
Figure IDA0001375524460000191
Figure IDA0001375524460000201
Figure IDA0001375524460000211
Figure IDA0001375524460000221
Figure IDA0001375524460000231
Figure IDA0001375524460000241
Figure IDA0001375524460000251
Figure IDA0001375524460000261
Figure IDA0001375524460000271
Figure IDA0001375524460000281
Figure IDA0001375524460000291
Figure IDA0001375524460000301
Figure IDA0001375524460000311
Figure IDA0001375524460000321
Figure IDA0001375524460000331
Figure IDA0001375524460000341
Figure IDA0001375524460000351
Figure IDA0001375524460000361
Figure IDA0001375524460000371
Figure IDA0001375524460000381
Figure IDA0001375524460000391
Figure IDA0001375524460000401
Figure IDA0001375524460000411
Figure IDA0001375524460000421
Figure IDA0001375524460000431
Figure IDA0001375524460000441
Figure IDA0001375524460000451
Figure IDA0001375524460000461
Figure IDA0001375524460000471
Figure IDA0001375524460000481
Figure IDA0001375524460000491
Figure IDA0001375524460000501
Figure IDA0001375524460000511
Figure IDA0001375524460000521
Figure IDA0001375524460000531
Figure IDA0001375524460000541
Figure IDA0001375524460000551
Figure IDA0001375524460000561
Figure IDA0001375524460000571
Figure IDA0001375524460000581
Figure IDA0001375524460000591
Figure IDA0001375524460000601
Figure IDA0001375524460000611
Figure IDA0001375524460000621
Figure IDA0001375524460000631
Figure IDA0001375524460000641
Figure IDA0001375524460000651
Figure IDA0001375524460000661
Figure IDA0001375524460000671
Figure IDA0001375524460000681
Figure IDA0001375524460000691
Figure IDA0001375524460000701
Figure IDA0001375524460000711
Figure IDA0001375524460000721
Figure IDA0001375524460000731
Figure IDA0001375524460000741
Figure IDA0001375524460000751
Figure IDA0001375524460000761
Figure IDA0001375524460000771
Figure IDA0001375524460000781
Figure IDA0001375524460000791
Figure IDA0001375524460000801
Figure IDA0001375524460000811
Figure IDA0001375524460000821
Figure IDA0001375524460000831
Figure IDA0001375524460000841
Figure IDA0001375524460000851
Figure IDA0001375524460000861
Figure IDA0001375524460000871
Figure IDA0001375524460000881
Figure IDA0001375524460000891
Figure IDA0001375524460000901
Figure IDA0001375524460000911
Figure IDA0001375524460000921
Figure IDA0001375524460000931
Figure IDA0001375524460000941
Figure IDA0001375524460000951
Figure IDA0001375524460000961
Figure IDA0001375524460000971
Figure IDA0001375524460000981
Figure IDA0001375524460000991
Figure IDA0001375524460001001
Figure IDA0001375524460001011
Figure IDA0001375524460001021
Figure IDA0001375524460001031
Figure IDA0001375524460001041
Figure IDA0001375524460001051
Figure IDA0001375524460001061
Figure IDA0001375524460001071
Figure IDA0001375524460001081
Figure IDA0001375524460001091
Figure IDA0001375524460001101
Figure IDA0001375524460001111
Figure IDA0001375524460001121
Figure IDA0001375524460001131
Figure IDA0001375524460001141
Figure IDA0001375524460001151
Figure IDA0001375524460001161
Figure IDA0001375524460001171
Figure IDA0001375524460001181
Figure IDA0001375524460001191
Figure IDA0001375524460001201
Figure IDA0001375524460001211
Figure IDA0001375524460001221
Figure IDA0001375524460001231
Figure IDA0001375524460001241
Figure IDA0001375524460001251
Figure IDA0001375524460001261
Figure IDA0001375524460001271
Figure IDA0001375524460001281
Figure IDA0001375524460001291
Figure IDA0001375524460001301
Figure IDA0001375524460001311
Figure IDA0001375524460001321
Figure IDA0001375524460001331
Figure IDA0001375524460001341
Figure IDA0001375524460001351
Figure IDA0001375524460001361
Figure IDA0001375524460001371
Figure IDA0001375524460001381
Figure IDA0001375524460001391
Figure IDA0001375524460001401
Figure IDA0001375524460001411
Figure IDA0001375524460001421
Figure IDA0001375524460001431
Figure IDA0001375524460001441
Figure IDA0001375524460001451
Figure IDA0001375524460001461
Figure IDA0001375524460001471
Figure IDA0001375524460001481
Figure IDA0001375524460001491
Figure IDA0001375524460001501
Figure IDA0001375524460001511
Figure IDA0001375524460001521
Figure IDA0001375524460001531
Figure IDA0001375524460001541
Figure IDA0001375524460001551
Figure IDA0001375524460001561
Figure IDA0001375524460001571
Figure IDA0001375524460001581
Figure IDA0001375524460001591
Figure IDA0001375524460001601
Figure IDA0001375524460001611
Figure IDA0001375524460001621
Figure IDA0001375524460001631
Figure IDA0001375524460001641
Figure IDA0001375524460001651
Figure IDA0001375524460001661
Figure IDA0001375524460001671
Figure IDA0001375524460001681
Figure IDA0001375524460001691
Figure IDA0001375524460001701
Figure IDA0001375524460001711
Figure IDA0001375524460001721
Figure IDA0001375524460001731
Figure IDA0001375524460001741
Figure IDA0001375524460001751
Figure IDA0001375524460001761
Figure IDA0001375524460001771
Figure IDA0001375524460001781
Figure IDA0001375524460001791
Figure IDA0001375524460001801
Figure IDA0001375524460001811
Figure IDA0001375524460001821
Figure IDA0001375524460001831

Claims (36)

1.用于检测获自怀孕妇女的生物样品中的可测量特征的试剂在制备用于在所述怀孕妇女中确定早产概率的试剂盒中的用途,所述试剂盒在使用中包括:检测获自所述怀孕妇女的所述生物样品中的一种或多种生物标志物中的每一种的所述可测量特征,并分析所述可测量特征以确定所述怀孕妇女的早产或足月产的概率,其中所述一种或多种生物标志物包含由序列IALGGLLFPASNLR组成的生物标志物,其中所述可测量特征定义为生物标志物或其片段的存在、不存在或浓度;改变的结构;或与正常对照受试者中生物标志物的构象相比,改变的构象的存在或量;并且其中所述片段包含至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个或至少13个连续的氨基酸残基。
2.用于检测获自怀孕妇女的生物样品中的可测量特征的试剂在制备用于预测在所述怀孕妇女中出生时的胎龄(GAB)的试剂盒中的用途,所述试剂盒在使用中包括:检测获取自所述怀孕妇女的所述生物样品中的一种或多种生物标志物中的每一种的所述可测量特征,并分析所述可测量特征以预测GAB,其中所述一种或多种生物标志物包含由序列IALGGLLFPASNLR组成的生物标志物,其中所述可测量特征定义为生物标志物或其片段的存在、不存在或浓度;改变的结构;或与正常对照受试者中生物标志物的构象相比,改变的构象的存在或量;并且其中所述片段包含至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个或至少13个连续的氨基酸残基。
3.根据权利要求1所述的用途,其进一步包含:(a)对所述一种或多种生物标志物的量进行定量分析;(b)将所述量乘以预定系数,和(c)确定所述怀孕妇女中的早产概率,包括将所述一种或多种生物标志物相加以获得对应于所述概率的总风险得分。
4.根据权利要求2所述的用途,其进一步包含:(a)对所述一种或多种生物标志物的量进行定量分析;(b)将所述量乘以预定系数和/或用预定系数对所述量进行阈值处理,(c)确定所述怀孕妇女中预测的GAB,所述确定包括将所述一个或多个生物标志物相加以获得对应于所述预测的GAB的总风险得分。
5.根据权利要求2所述的用途,其进一步包含:(a)对所述一种或多种生物标志物的量进行定量分析;(b)将所述量乘以预定系数和/或用预定系数对所述量进行阈值处理,(c)确定所述怀孕妇女中所述预测的GAB,所述确定包括将所述所述一种或多种生物标志物相加以获得对应于所述预测的GAB的总风险得分;和(d)从预测的GAB中减去获得生物样品时估计的胎龄(GA)以预测所述怀孕妇女中的生产时间。
6.根据权利要求1所述的用途,其中所述改变的结构包括翻译后修饰的存在或量。
7.根据权利要求1所述的用途,其中,所述可测量特征包含片段IALGGLLFPASNLR。
8.根据权利要求1所述的用途,其中,所述检测可测量特征包含对获自所述怀孕妇女的生物样品中的所述生物标志物的每一种、它们的组合或部分的量进行定量分析。
9.根据权利要求8所述的用途,还包括基于所述生物标志物的每一种的所述定量分析的量来计算所述怀孕妇女中的早产概率。
10.根据权利要求1所述的用途,还包括提供来自所述怀孕妇女的生物样品的初始步骤。
11.根据权利要求1所述的用途,还包括向保健提供者传达所述概率。
12.根据权利要求11所述的用途,其中,所述传达通知对所述怀孕妇女的后续治疗决策。
13.根据权利要求1所述的用途,其中,所述分析包含使用预测模型。
14.根据权利要求13所述的用途,其中,所述分析包含将所述可测量特征与参考特征进行比较。
15.根据权利要求14所述的用途,其中,所述分析包括使用选自线性差别分析模型、支持向量机分类算法、回归特征消去模型、微阵列预测分析模型、逻辑回归模型、多重回归模型、生存模型、CART算法、flex tree算法、LART算法、随机森林算法、MART算法、机器学习算法、惩罚回归方法及其组合中的一种或多种。
16.根据权利要求15所述的用途,其中,所述分析包括逻辑回归。
17.根据权利要求1所述的用途,其中,所述概率表示为风险得分。
18.根据权利要求1所述的用途,其中,所述生物样品选自全血、血浆和血清。
19.根据权利要求18所述的用途,其中,所述生物样品是血清。
20.根据权利要求3,4或5所述的用途,其中,所述定量分析包括质谱分析法(MS)。
21.根据权利要求20所述的用途,其中,所述MS包括液相色谱-质谱分析法(LC-MS)。
22.根据权利要求20所述的用途,其中,所述MS包括多次反应监控(MRM)或选择反应监控(SRM)。
23.根据权利要求22所述的用途,其中,所述MRM(或SRM)包括经调度MRM(SRM)。
24.根据权利要求3,4或5所述的用途,其中,所述定量分析包括使用捕获试剂的测定。
25.根据权利要求24所述的用途,其中,所述捕获试剂选自由抗体、抗体片段、核酸基蛋白结合试剂、小分子或其变体组成的组。
26.根据权利要求24所述的用途,其中,所述测定选自由酶免疫测定(EIA)、酶联免疫吸附测定(ELISA)和放射免疫测定(RIA)组成的组。
27.根据权利要求26所述的用途,其中,所述定量分析还包括质谱分析法(MS)。
28.根据权利要求27所述的用途,其中,所述定量分析包括免疫共沉淀-质谱分析法(co-IP MS)。
29.根据权利要求1所述的用途,还包括检测一种或多种风险指征的可测量特征。
30.根据权利要求1或3所述的用途,其中,所述可测量特征的所述分析起初包括在所述确定早产概率之前预测出生时的胎龄(GAB)。
31.根据权利要求30所述的用途,其中,所述GAB的预测被用于确定早产概率。
32.根据权利要求29所述的用途,其中,一种或多种风险指征选自由年龄、先前妊娠、先前低出生体重或早产分娩史、多次在第2个三个月中自发性流产、先前在第1个三个月中人工流产、家族和存在于两代人之间的因素、不育史、未孕、胎盘异常、宫颈和子宫异常、妊娠期出血、宫内生长受限、宫内己烯雌酚暴露、多次妊娠、婴儿性别、身材矮小、低妊娠前体重/低体重指数、糖尿病、高血压、甲状腺机能减退、哮喘、教育水平、烟草使用和泌尿生殖器感染组成的组。
33.用于确定怀孕妇女中早产概率的试剂盒,所述试剂盒包含用于检测一种或多种生物标志物的一种或多种试剂,其中所述一种或多种生物标志物包含由序列IALGGLLFPASNLR组成的生物标志物、以及用于容纳分离自所述怀孕妇女的生物样品的容器。
34.根据权利要求33所述的试剂盒,其中,所述试剂盒还包含用于检测IALGGLLFPASNLR的水平的一种或多种试剂。
35.根据权利要求33或34所述的试剂盒,其中,所述试剂盒包含特异性结合至由序列IALGGLLFPASNLR组成的所述生物标志物的抗体。
36.根据权利要求33或34所述的试剂盒,其中,所述试剂盒还包含包装说明书,其含有确定早产概率的方法的书面说明。
CN201480028164.3A 2013-03-15 2014-03-14 用于预测早产的生物标志物和方法 Active CN106574919B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011081810.6A CN112213500A (zh) 2013-03-15 2014-03-14 用于预测早产的生物标志物和方法

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201361798504P 2013-03-15 2013-03-15
US61/798,504 2013-03-15
US201361919586P 2013-12-20 2013-12-20
US61/919,586 2013-12-20
PCT/US2014/028412 WO2014144129A2 (en) 2013-03-15 2014-03-14 Biomarkers and methods for predicting preterm birth

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202011081810.6A Division CN112213500A (zh) 2013-03-15 2014-03-14 用于预测早产的生物标志物和方法

Publications (2)

Publication Number Publication Date
CN106574919A CN106574919A (zh) 2017-04-19
CN106574919B true CN106574919B (zh) 2020-11-03

Family

ID=51538302

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201480028164.3A Active CN106574919B (zh) 2013-03-15 2014-03-14 用于预测早产的生物标志物和方法
CN202011081810.6A Pending CN112213500A (zh) 2013-03-15 2014-03-14 用于预测早产的生物标志物和方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN202011081810.6A Pending CN112213500A (zh) 2013-03-15 2014-03-14 用于预测早产的生物标志物和方法

Country Status (10)

Country Link
US (4) US20140287950A1 (zh)
EP (2) EP2972308B9 (zh)
JP (5) JP2016518589A (zh)
CN (2) CN106574919B (zh)
AU (3) AU2014227891A1 (zh)
BR (1) BR112015023706A2 (zh)
CA (2) CA2907120C (zh)
ES (1) ES2836127T3 (zh)
RU (1) RU2015144304A (zh)
WO (1) WO2014144129A2 (zh)

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10928402B2 (en) 2012-12-28 2021-02-23 Nx Prenatal Inc. Treatment of spontaneous preterm birth
CN106164676B (zh) * 2014-01-06 2019-07-05 爱科谱迅病理研究公司 针对pd-l1的srm测定
CN115015552A (zh) * 2015-06-19 2022-09-06 赛拉预测公司 用于预测早产的生物标志物对
JP2019505815A (ja) * 2015-12-04 2019-02-28 エヌエックス・プリネイタル・インコーポレイテッドNX Prenatal Inc. 自然早産リスクを層別化するための循環マイクロ粒子の使用
WO2017136799A1 (en) * 2016-02-05 2017-08-10 The Regents Of The University Of California Tools for predicting the risk of preterm birth
US11753682B2 (en) 2016-03-07 2023-09-12 Father Flanagan's Boys'Home Noninvasive molecular controls
AU2017260320B2 (en) * 2016-05-05 2021-11-11 Indiana University Research & Technology Corporation Quantitative profiling of progesterone metabolites for the prediction of spontaneous preterm delivery
US11293931B2 (en) 2016-05-05 2022-04-05 Indiana University Research And Technology Corporation Quantitative profiling of progesterone metabolites for the prediction of spontaneous preterm delivery
CA3032944A1 (en) * 2016-08-05 2018-02-08 Sera Prognostics, Inc. Biomarkers for predicting preterm birth in a pregnant female exposed to progestogens
RU2019105691A (ru) * 2016-08-05 2020-09-08 Сера Прогностикс, Инк. Биомаркеры для прогнозирования преждевременных родов из-за преждевременного разрыва плодной оболочки при недоношенной беременности и идиопатических самопроизвольных родов
JP2018140172A (ja) * 2017-02-28 2018-09-13 株式会社Nttドコモ データ収集装置及びデータ収集方法
CA3073192A1 (en) 2017-08-18 2019-02-21 Sera Prognostics, Inc Pregnancy clock proteins for predicting due date and time to birth
BR112020008605A2 (pt) * 2017-10-30 2020-10-06 Carmentix Pte. Ltd. método para previsão e tratamento para redução e determinação do risco de parto prematuro e prolongamento da gestação, detecção de ecm1, fga, efemp1, ggh, pedf, ptn ou lamc2, progesterona e kit
RU2670672C1 (ru) * 2017-11-08 2018-10-24 Федеральное государственное бюджетное образовательное учреждение высшего образования "Российский национальный исследовательский медицинский университет им. Н.И. Пирогова" Министерства здравоохранения Российской Федерации (ФГБОУ ВО РНИМУ им. Н.И. Пирогова Минздрава России) Способ прогнозирования преждевременных родов в сроке гестации 24-34 недели
JP2021512318A (ja) * 2018-01-31 2021-05-13 エヌエックス・プリネイタル・インコーポレイテッドNX Prenatal Inc. 自然早産のリスクを層別化するための循環マイクロ粒子の使用
CN108918886A (zh) * 2018-06-26 2018-11-30 连云港市妇幼保健院(连云港市第三人民医院) 一种早产诊断用生物标志物及其应用
EP3853613A4 (en) * 2018-09-21 2022-06-01 The Board of Trustees of the Leland Stanford Junior University GESTATIONAL PROGRESSION AND PREMATURE ABORTION ASSESSMENT METHODS FOR CLINICAL INTERVENTION AND RELATED APPLICATIONS
CA3124498A1 (en) * 2018-12-20 2020-06-25 Parkland Center For Clinical Innovation Lightweight clinical pregnancy preterm birth predictive system and method
KR102265430B1 (ko) * 2019-08-20 2021-06-15 주식회사 케어젠 피부 상태 개선 활성을 갖는 펩타이드 및 이의 용도
CN113533547A (zh) * 2020-04-20 2021-10-22 复旦大学 一种补体蛋白c1r表达量的测量方法
US11266376B2 (en) * 2020-06-19 2022-03-08 Ultrasound Ai Inc. Premature birth prediction
RU2743880C1 (ru) * 2020-08-06 2021-03-01 Федеральное государственное бюджетное научное учреждение "Научно-исследовательский институт акушерства, гинекологии и репродуктологии имени Д.О. Отта" Способ прогнозирования преждевременных родов при многоплодии
KR102339013B1 (ko) * 2020-11-16 2021-12-14 주식회사 옵티바이오 양수 검체 내 mmp-8 정량화가 가능한 체외 진단 키트
CN112256422B (zh) * 2020-11-17 2023-08-04 中国人民解放军战略支援部队信息工程大学 基于q学习的异构平台任务调度方法及系统
EP4259279A1 (en) 2020-12-14 2023-10-18 Regeneron Pharmaceuticals, Inc. Methods of treating metabolic disorders and cardiovascular disease with inhibin subunit beta e (inhbe) inhibitors
CN112899360A (zh) * 2021-02-02 2021-06-04 北京航空航天大学 一种检测特雷彻·柯林斯综合征发生概率的组合物的应用方法
CN113267587B (zh) * 2021-05-27 2023-11-10 杭州广科安德生物科技有限公司 测定pro-SFTPB标准物质含量的特征肽段及方法
US11664100B2 (en) * 2021-08-17 2023-05-30 Birth Model, Inc. Predicting time to vaginal delivery
CN114702548B (zh) * 2022-03-11 2023-08-04 湖南源品细胞生物科技有限公司 一种促进间充质干细胞生长的多肽组合物及其培养基和应用
KR20230145829A (ko) * 2022-04-11 2023-10-18 의료법인 성광의료재단 기계학습을 이용한 고위험 임신 질환 예측을 위한 질량 스펙트럼 분석 방법
CN115344846A (zh) * 2022-07-29 2022-11-15 贵州电网有限责任公司 一种指纹检索模型及验证方法
CN116904587B (zh) * 2023-09-13 2023-12-05 天津云检医学检验所有限公司 一种用于预测早产的生物标志物组、预测模型及试剂盒

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1561228A (zh) * 2001-07-27 2005-01-05 哈特穆特M·汉瑙斯克-阿贝尔 增强新生儿的器官成熟度并预测重症监护时间
CN101260429A (zh) * 2003-01-17 2008-09-10 香港中文大学 作为妊娠相关病症的诊断标志物的循环mRNA
WO2008113995A1 (en) * 2007-03-20 2008-09-25 Novocellus Limited Assessment method
CN101437959A (zh) * 2004-09-20 2009-05-20 普罗特奥格尼克斯公司 诊断胎儿非整倍体
CN101930007A (zh) * 2010-07-30 2010-12-29 北京热景生物技术有限公司 一种孕妇早产检测的上转发光快速定量试剂盒

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4710475A (en) * 1986-05-12 1987-12-01 Mayo Medical Resources Method for the determination of the imminence of labor
JP2008500952A (ja) * 2003-07-15 2008-01-17 ジェノバ・リミテッド 心臓血管障害で減少する分泌ポリペプチド種
US7344892B2 (en) * 2003-09-23 2008-03-18 Beth Israel Deaconess Medical Center, Inc. Screening for gestational disorders
US7700573B2 (en) * 2004-03-23 2010-04-20 Oncotherapy Science, Inc. Method for diagnosing non-small lung cancer
US7678544B2 (en) * 2004-05-19 2010-03-16 Statens Serum Institut ADAM12, a novel marker for abnormal cell function
US7790463B2 (en) * 2006-02-02 2010-09-07 Yale University Methods of determining whether a pregnant woman is at risk of developing preeclampsia
EP2097094A4 (en) * 2006-11-01 2011-01-05 George Mason Intellectual Prop BIOMARKERS FOR NEUROLOGICAL SUFFERING
WO2008146100A1 (en) * 2007-06-01 2008-12-04 INSERM (Institut National de la Santé et de la Recherche Médicale) Method for absolute quantification of polypeptides
WO2009014987A2 (en) * 2007-07-20 2009-01-29 The University Of Utah Research Foundation Identification and quantification of biomarkers for evaluating the risk of preterm birth
JP2011501133A (ja) * 2007-10-10 2011-01-06 ビージー メディシン, インコーポレイテッド 心血管または脳血管主要有害事象を検出するための方法
US20100017143A1 (en) * 2008-01-30 2010-01-21 Proteogenix, Inc. Gestational age dependent proteomic changes of human maternal serum for monitoring maternal and fetal health
KR20110005708A (ko) * 2008-04-09 2011-01-18 더 유니버시티 오브 브리티시 콜롬비아 심장 동종이식 급성 거부반응 진단방법
EP2316034A1 (en) * 2008-08-04 2011-05-04 The Board of Regents of The University of Texas System Multiplexed diagnostic test for preterm labor
WO2010133173A1 (en) * 2009-05-21 2010-11-25 Rongxiu Li Process for differential polypeptides detection and uses thereof
MX2012005015A (es) * 2009-10-30 2012-06-12 Prometheus Lab Inc Metodos para diagnosticar sindrome de intestino irritable.
US10557856B2 (en) * 2010-09-24 2020-02-11 University Of Pittsburgh-Of The Commonwealth System Of Higher Education Biomarkers of renal injury
WO2012076553A2 (en) * 2010-12-06 2012-06-14 Pronota N.V. Biomarkers and parameters for hypertensive disorders of pregnancy

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1561228A (zh) * 2001-07-27 2005-01-05 哈特穆特M·汉瑙斯克-阿贝尔 增强新生儿的器官成熟度并预测重症监护时间
CN101260429A (zh) * 2003-01-17 2008-09-10 香港中文大学 作为妊娠相关病症的诊断标志物的循环mRNA
CN101437959A (zh) * 2004-09-20 2009-05-20 普罗特奥格尼克斯公司 诊断胎儿非整倍体
WO2008113995A1 (en) * 2007-03-20 2008-09-25 Novocellus Limited Assessment method
CN101930007A (zh) * 2010-07-30 2010-12-29 北京热景生物技术有限公司 一种孕妇早产检测的上转发光快速定量试剂盒

Also Published As

Publication number Publication date
EP2972308A4 (en) 2016-10-26
RU2015144304A (ru) 2017-04-21
JP2023164722A (ja) 2023-11-10
JP2022069504A (ja) 2022-05-11
EP2972308A2 (en) 2016-01-20
ES2836127T3 (es) 2021-06-24
BR112015023706A2 (pt) 2017-07-18
JP2020193989A (ja) 2020-12-03
EP3800470A1 (en) 2021-04-07
US20140287950A1 (en) 2014-09-25
AU2014227891A1 (en) 2015-10-08
AU2020201701A1 (en) 2020-03-26
CN112213500A (zh) 2021-01-12
CA3209974A1 (en) 2014-09-18
CN106574919A (zh) 2017-04-19
EP2972308B1 (en) 2020-09-16
AU2022221445A1 (en) 2022-09-22
WO2014144129A3 (en) 2015-02-05
CA2907120A1 (en) 2014-09-18
JP2016518589A (ja) 2016-06-23
US20220178938A1 (en) 2022-06-09
JP7412790B2 (ja) 2024-01-15
RU2015144304A3 (zh) 2018-03-26
US20190376978A1 (en) 2019-12-12
US20170146548A1 (en) 2017-05-25
EP2972308B9 (en) 2021-01-20
WO2014144129A2 (en) 2014-09-18
CA2907120C (en) 2023-10-17
AU2020201701B2 (en) 2022-05-26
JP2018193402A (ja) 2018-12-06

Similar Documents

Publication Publication Date Title
JP7412790B2 (ja) 早産を予測するためのバイオマーカーおよび方法
CN108450003B (zh) 用于预测早产的生物标志物对
US20190317107A1 (en) Biomarkers and methods for predicting preterm birth
US20210156870A1 (en) Biomarkers and methods for predicting preeclampsia
US20210190792A1 (en) Biomarkers for predicting preterm birth due to preterm premature rupture of membranes (pprom) versus idiopathic spontaneous labor (ptl)
US20190369109A1 (en) Biomarkers for predicting preterm birth in a pregnant female exposed to progestogens
WO2023158504A1 (en) Biomarker panels and methods for predicting preeclampsia
CA3220282A1 (en) Biomarker pairs and triplets for predicting preterm birth

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant