具体实施方式
本发明人已经鉴定了特定生物标志物,其可以单独或组合用于对非酒精性脂肪肝病(NAFLD)的进展进行诊断、预测或监测或分阶段。这些生物标志物尤其可用于NAFLD分阶段,以评估个体患有与NAFLD相关的非酒精性脂肪肝(NAFL)、非酒精性脂肪性肝炎(NASH)、肝纤维化和/或肝硬化。可以使用鉴定的生物标志物来评估NAFLD的严重性。这些标志物也在包括NAFLD的诊断、监测或分阶段以及随后治疗个体的方法中有用,以治疗NAFLD。
本发明涉及取自个体的样品中的一个或多个生物标志物的分析。通常,样品是血液样品、血清样品或血浆样品,但它可包括细胞、细胞裂解物、尿液、羊水和其他生物液体。血液样品可以是毛细血管的、静脉或动脉血液或血浆或血清样品。样品可以是纯样品或从干血斑或其他固体培养基中提取。可以使用试管(包括真空采血管)进行样品的收集,或者可以将样品印迹到固体培养基上,例如在滤纸、纤维素膜等上的干血斑(使用毛细血管血液)。在干血斑(DBS)的情况下,这可以通过用刺血针刺破他们的手指并将一滴或多滴毛细血管血液转移到滤纸、纤维素膜或等同样品支持介质上来获取,与静脉穿刺相比,这使得样品处理和样品运输更容易,同时更受患者喜欢。毛细管血液也可以收集在专用管中,例如Microtainer、Microvette、Monovette、Minivette或Multivette。
个体通常是人类。个体可以显示NAFLD的一种或多种症状和/或可能先前已被诊断患有NAFLD,其中本方法用于对NAFLD进行监测或分阶段。可以预先使用其他参数,或者使其与本发明的方法组合使用以辅助NAFLD的评估。这些参数包括患者年龄、患者性别、患者体重、患者身高、体重指数(BMI)、快速体重减轻/体重增加的证据、饮食习惯、酒精摄入量、药物记录、患者运动/活动史、种族和疾病病史(包括2型糖尿病的糖尿病史、心血管疾病、肥胖症、胃分流术、多囊卵巢综合征、睡眠呼吸暂停、甲状腺机能减退、垂体机能减退和代谢综合征,所述代谢综合征通常包括以下三个因素:腰围增加、高甘油三酯血症、高血压、高空腹血糖和低密度脂蛋白(HDL)水平)。
根据本发明,一个或多个生物标志物被检测和定量,至少一个生物标志物通常选自载脂蛋白F、脂多糖结合蛋白、纤维胶凝蛋白-2、载脂蛋白D、激肽原-1、载脂蛋白M、血小板反应蛋白-1、IgG Fc结合蛋白、胱抑素-c、α-1-酸糖蛋白2和富含亮氨酸的α-2-糖蛋白。
下面列出了Uniprot数据库中的生物标志物及其数据库登录号。本文公开的蛋白质序列参考截至2016年7月31日的Uniprot序列。因此,下面是我们的生物标志物的列表,及其登录号(括号内)和替代名称(斜体字):
载脂蛋白-F(Q13790)Apo-F,脂质转移抑制蛋白,LTIP;
载脂蛋白-M(O95445)Apo-M,ApoM,蛋白G3a;
载脂蛋白-D(P05090)Apo-D,ApoD;
激肽原-1(P01042)α-2-硫醇蛋白酶抑制剂、菲兹杰拉尔德因子、高分子量激肽原、HMWK,威廉姆斯-菲兹杰拉尔德-Flaujeac因子
将激肽原-1裂解成以下6个链:1)激肽原-1重链,2)T-激肽;替代名称:Ile-Ser-Bradykinin,3)缓激肽;替代名称:胰激肽I,4)赖氨酰-缓激肽,替代名称:胰激肽II,5)激肽原-1轻链,6)低分子量生长促进因子;
纤维胶凝蛋白-2(Q15485)37kDa弹性蛋白结合蛋白、含胶原蛋白/纤维蛋白原结构域的蛋白2、EBP-37、纤维胶凝蛋白-B、纤维胶凝蛋白-β、Hucolin、L-纤维胶凝蛋白、血清凝集素p35;
血小板反应蛋白-1(P07996);
IgG Fc结合蛋白(Q9Y6R7)Fcγ结合蛋白抗原、FcγBP
胱抑素-c(P01034)胱抑素-3,γ-痕量,神经内分泌基本多肽,后γ-球蛋白;
脂多糖结合蛋白(P18428)LBP;
α-1-酸糖蛋白2(P19652)AGP 2,血清类黏蛋白-2,OMD 2;和
富含亮氨酸的α-2-糖蛋白(P02750)LRG。
根据本发明,发明人已经确定这些蛋白质的某些水平随着NAFLD严重性的增加而降低。特别地,载脂蛋白F、α-1-酸糖蛋白2、纤维胶凝蛋白-2和富含亮氨酸的α-2-糖蛋白均证明随着NAFLD严重性增加而蛋白质水平降低。相反,胱抑素C、脂多糖结合蛋白、IgG Fc结合蛋白和血小板反应蛋白-1显示随着NAFLD严重性增加而水平增加。
在本发明的一个优选方面,所述一个或多个标志物选自载脂蛋白F、载脂蛋白D、激肽原-1、纤维胶凝蛋白-2,载脂蛋白M和血小板反应蛋白-1。特别优选的生物标志物是载脂蛋白F。
载脂蛋白F随着NAFLD严重性的增加而显示出浓度降低。因此,监测个体该蛋白质水平的变化提供了NAFLD在各阶段的进展的指示。
载脂蛋白D在健康对照中表现出高水平,并且在NAFLD的所有阶段中始终较低。因此,该标志物可用作早期NAFLD生物标志物。与对照样品或参照样品/水平相比,载脂蛋白D水平降低表明NAFLD的严重性增加。载脂蛋白M显示出从脂肪变性(NAFL)到NASH F0的轻微降低,但在NASH F3中的表达降低。因此,载脂蛋白M可用于确定肝纤维化的进展。激肽原-1在所有NAFLD阶段均显示出持续降低。
纤维胶凝蛋白-2显示在NAFLD阶段的降低,在纤维化阶段F3中显示其最低水平。
血小板反应蛋白-1从对照水平到脂肪变性(NAFL)和NAFLD的所有阶段增加。
在本发明的一个优选方面,至少一个生物标志物包括载脂蛋白F、脂多糖结合蛋白和/或纤维胶凝蛋白-2。在本发明的另一个优选方面,至少一个生物标志物包括载脂蛋白F、脂多糖结合蛋白、纤维胶凝蛋白-2和/或载脂蛋白D。
在本发明的另一个优选方面,本发明提供了对至少两个,至少三个,至少四个或至少五个或更多个生物标志物的分析,从而对NAFLD的进展进行诊断、预测或监测或分阶段。因此,上述鉴定的生物标志物优选与一个或多个附加生物标志物组合使用。
例如,标志物的组合可用于提供对NAFLD更精确的分阶段。这种生物标志物可选自载脂蛋白F、脂多糖结合蛋白、纤维胶凝蛋白-2、载脂蛋白D、激肽原-1、载脂蛋白M、血小板反应蛋白-1、IgG Fc结合蛋白、胱抑素-c、α-1-酸糖蛋白2和富含亮氨酸的α-2-糖蛋白。根据本发明使用的标志物的组合优选包含生物标志物载脂蛋白F和一个或多个附加生物标志物,所述附加生物标志物选自脂多糖结合蛋白、纤维胶凝蛋白-2、载脂蛋白D、激肽原-1、载脂蛋白M、血小板反应蛋白-1、IgG Fc-结合蛋白、胱抑素-c、α-1-酸糖蛋白2和富含亮氨酸的α-2-糖蛋白。优选的组合包含载脂蛋白F和一个或多个,例如两个,三个或四个附加生物标志物,所述附加生物标志物选自脂多糖结合蛋白、纤维胶凝蛋白-2、载脂蛋白D、α-1-酸糖蛋白2和血小板反应蛋白-1。
可根据本发明使用的标志物的其他组合包括(i)选自载脂蛋白F、脂多糖结合蛋白和纤维胶凝蛋白-2的一个或多个生物标志物和选自载脂蛋白D、α-1-酸性糖蛋白2和血小板反应蛋白-1的一个或多个生物标志物组合;(ii)选自载脂蛋白F、脂多糖结合蛋白和纤维胶凝蛋白-2的一个或多个生物标志物和选自载脂蛋白D、α-1-酸糖蛋白2和血小板反应蛋白-1的一个或多个生物标志物组合。或者,可以将附加生物标志物与本发明的一个或多个生物标志物组合。
在本发明的一个优选方面,所述方法包括至少分析载脂蛋白F和脂多糖结合蛋白;载脂蛋白F和纤维胶凝蛋白-2;载脂蛋白F和载脂蛋白D;脂多糖结合蛋白和纤维胶凝蛋白-2;脂多糖结合蛋白和载脂蛋白D;载脂蛋白D和纤维胶凝蛋白-2;载脂蛋白F、脂多糖结合蛋白和纤维胶凝蛋白-2;或载脂蛋白F、载脂蛋白D、脂多糖结合蛋白和纤维胶凝蛋白-2。
本方法可用于NAFLD的诊断,或用于NAFLD的预测,例如,以确定疾病的严重性。在本发明的一个优选方面,所述方法可用于NAFLD的分阶段,特别是用于患有非酒精性脂肪肝(NAFL),也称为脂肪变性的个体的分阶段。用于NAFLD早期分阶段和分阶段为NAFL的优选生物标志物是载脂蛋白D。所述方法也可用于将NAFLD分阶段为非酒精性脂肪性肝炎(NASH)。用于对NAFLD严重性分阶段和分阶段为NASH的优选生物标志物是载脂蛋白M。所述方法还可用于对患有肝纤维化的个体进行分阶段,包括纤维化的严重性。
在本发明的另一方面,除了如上公开的一个或多个生物标志物的分析之外,本发明还提供了一个或多个其他生物标志物的分析。一个或多个其他生物标志物可以选自如下所述的根据本发明鉴定的其他生物标志物。
一个或多个其他生物标志物可包含角蛋白I型细胞骨架18,括号中为登录号;斜体为替代名称:(P05783)细胞增殖诱导基因46蛋白、细胞角蛋白-18、CK-18、角蛋白-18、K18和/或脂连蛋白(Q15848)30kDa脂肪细胞补体相关蛋白、脂肪细胞补体相关30kDa蛋白、ACRP30、脂肪细胞、C1q和含有胶原结构域的蛋白、脂肪最丰富的基因转录物1蛋白、apM-1、明胶结合蛋白。
脂连蛋白是特别优选的其他生物标志物。本文所述的结果显示脂连蛋白从对照到脂肪变性(NAFL)到NASH浓度降低,但在NASH的纤维化阶段是恒定的。因此,其是对于NAFL和进展到NASH的有用的早期标志物。与对照样品或参照样品/水平相比,脂连蛋白水平降低,因此表明NAFLD随着其进展至非酒精性脂肪性肝炎阶段而严重性增加。
因此,本发明的方法可以包括至少分析载脂蛋白F和脂连蛋白;脂多糖结合蛋白和脂连蛋白;纤维胶凝蛋白-2和脂连蛋白;载脂蛋白D和脂连蛋白;载脂蛋白F、载脂蛋白D和脂连蛋白;载脂蛋白F、脂多糖结合蛋白和脂连蛋白;载脂蛋白F、纤维胶凝蛋白-2和脂连蛋白;脂多糖结合蛋白、纤维胶凝蛋白-2和脂连蛋白;载脂蛋白D、脂多糖结合蛋白和脂连蛋白;载脂蛋白D、纤维胶凝蛋白-2和脂连蛋白;或载脂蛋白F、脂多糖结合蛋白、纤维胶凝蛋白-2和脂连蛋白。
本发明还提供了对一个或多个蛋白质的裂解产物的评估。用于分析裂解产物的合适蛋白质包括激肽原-1、角蛋白I型细胞骨架18和血管紧张素原。通常,这些肽的裂解产物的量随着NAFLD的严重性而增加,使得所述裂解产物水平的监测可以用作本发明方法的一部分。
本方法还可用于监测NAFLD的进展,例如,在诊断患有NAFLD的患者中。所述方法可以以适当的间隔重复,例如每月一次、每两个月一次、每三个月一次、每六个月一次、每一年一次、每两年一次或每三年一次,以监测NAFLD的进展,并且特别是监测与进展到NAFLD不同阶段相关的生物标志物的变化。这种监测也可用于评估对于这种患者的治疗效果。
可以通过任何合适的技术(包括例如免疫测定法)评估本发明的一个或多个生物标志物。在本发明特别优选的方面,所述方法使用质谱法来评估一个或多个生物标志物。
在具体的实施方案中,使用无抗体的方法定量一个或多个生物标志物,所述无抗体的方法例如但不限于,使用质谱法的平行反应监测(PRM)、选择反应监测(SRM)、多反应监测(MRM)或MRM-立方(MRM3)中的多阶段片段化。
生物样品(毛细血管的/静脉/动脉血液、血清或血浆)用蛋白酶消化,所述蛋白酶例如但不限于胰蛋白酶、胰凝乳蛋白酶、Arg-C、Asp-N、梭菌蛋白酶、弹性蛋白酶、Glu-C、Lys-C、Lys-N、胃蛋白酶、蛋白质肽链内切酶和葡萄球菌蛋白酶,但在特定实施方案中,酶是胰蛋白酶。在胰蛋白酶的情况下,这还包括用于更高产量消化的固定化胰蛋白酶,例如来自PerfinityBiosciences的闪消(Flash digest)(也称为来自Thermo Scientific的智能消化(SMART Digest))。这些酶的裂解特性是已知的(例如,胰蛋白酶在赖氨酸K或精氨酸R之后裂解),因此手动地或使用软件(例如Skyline,PinPoint等),以在硅芯片计算机(in-silico)中消化蛋白质所得肽是确定的。通常排除短于7个氨基酸的肽,因为它们不太可能是独特的。通常排除长于25个氨基酸的肽,因为作为标准的合成肽可能是昂贵的。尽管通常选择7至25个氨基酸的肽用于分析,但不应完全排除短于7个氨基酸且长于25个氨基酸的肽。当使用胰蛋白酶时,通常选择没有错过裂解的肽,但对于错过一个或多个裂解的肽,可以被任何酶考虑。通常选择未经修饰的(例如糖基化、磷酸化等)和避免甲硫氨酸M的肽,因为该氨基酸可以被氧化或不被氧化,并且这些修饰会改变肽的质量。如果已知修饰的质量(例如糖基化、磷酸化、氧化、氨甲酰甲基化等),则不应完全排除修饰的肽。
在线数据库,例如但不限于PeptideAtlas和全球蛋白质组学机器数据库(gpmdb),帮助确定感兴趣的蛋白质的通常观察的肽。MRMaid可用于帮助设计基于质谱法的靶向定量分析,这通过基于来自PRIDE数据库的实验光谱,建议监测肽和MS2离子进行。蛋白质BLAST用于检查所选肽的独特性。如果肽不是唯一的,则将选择生物标志物序列内的另一个肽。
在质谱分析之前,可以使用磷酸肽富集、糖肽富集,高pH反相分馏等对消化的肽进行分馏。肽可以通过反相液相色谱法、亲水相互作用液相色谱法(HILIC)、离子交换色谱法、等电点聚焦等分离,但在特定实施方案中,通过使用碳-18(C-18)柱的反相液相色谱法进行分离。在非常低丰度的生物标志物的情况下,可以使用基于pH的反相分馏对样品分馏,可以使用免疫沉淀法富集生物标志物或者可以耗尽高丰度的蛋白质(使用免疫沉淀法或染料亲和力法,例如活性蓝用于消耗血清和/或血浆样品中的白蛋白)。
使用三重四极杆质谱仪进行SRM/MRM。第一个四极杆过滤感兴趣的蛋白质的预选肽(MS1离子),第二个四极杆将该肽片段化,第三个四极杆过滤该肽的一个或多个片段(MS2离子)用于检测。使用混合四极杆-轨道阱质谱仪例如Thermo Q Exactive及其变体或ThermoFusion及其变体进行PRM。在PRM中,四极杆过滤感兴趣的蛋白的预选肽(MS1离子),高能量碰撞解离(HCD)细胞片段化这种肽和轨道阱由于其高分辨率能够检测该肽的所有片段(MS2离子)。使用QTRAP质谱仪进行MRM3。在MRM3中,第一个四极杆过滤感兴趣的蛋白质的预选肽(MS1离子),第二个四极杆将该肽片段化,然后碎片离子(MS2离子)在线性离子阱中分离后被捕获,然后激发以执行使用MS3离子的第二次破碎步骤,以提供更高水平的灵敏度。在具体的实施方案中,该技术包括能够使用电喷雾电离(ESI)进行样品电离的MS/MS的任何串联质谱仪,但也可以使用其他电离方法进行样品电离。
碎片离子的曲线下面积(AUC)可用于相对量化蛋白质水平。已知量的具有与预选肽相同序列的合成纯重标记肽可用于建立校准曲线以帮助确定蛋白质的绝对浓度。更详细地,可以使用SRM、MRM、MRM3、PRM等进行这些肽的检测,其中质谱仪过滤预选肽(MS1离子),使肽片段化和检测该肽片段(MS2离子)。这些MS2离子的AUC用于量化生物标志物。对于绝对定量,使用已知量的合成肽,其可以是同位素标记的。通常从肽的C末端到N末端进行合成。合成循环包括:a)将C-末端氨基酸加载到固体支持物相(聚苯乙烯树脂)中。该氨基酸在N-末端受到保护,以避免不必要的反应;b)去除该氨基酸的N-末端保护基团(PG);c)活化下一个氨基酸的C-末端(N-末端带有保护基团);d)使两种氨基酸进行偶联反应;e)在b)重新开始循环或从树脂上裂解全长肽。肽可以是粗制的或具有至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或至少98%的纯度。肽可以是合成肽、IGNIS肽、PEPotec肽、AQUA肽、SpikeTide肽、蛋白质表位标记标签(QPrEST)肽、微波辅助固相合成肽、由QconCAT基因编码的串联标记肽等。生物样品中内源肽的检测和/或富集均可使用抗肽抗体、具有抗肽抗体的稳定同位素标准捕获(SISCAPA)等来实现,其中抗肽抗体针对预先确定的肽产生。除了同位素标记肽之外,生物标志物的定量还可以通过基于无标记质谱的定量(使用Progenesis LC-MS软件,Skyline软件等)进行,或通过使用同位素标签标记生物样品中的蛋白质来实现,所述同位素标签为例如串联质谱标签(TMT)、用于相对和绝对定量的同量异位标签(iTRAQ)、同位素编码的亲和标签(ICAT)等。
绝对定量可以使用来自Life Technologies的HeavyPeptide IGNIS Prime自定义肽定量试剂盒进行,使用胰蛋白酶或固定化胰蛋白酶,例如来自Perfinity Biosciences的闪消(也称为来自Thermo Scientific的智能消化),消化IGNIS Prime肽。
使用载脂蛋白F(APO-F)作为例子描述肽选择的工作流程,并且可以对所列出的任何生物标志物进行该流程。未加工的APO-F前体具有326个氨基酸。氨基酸1-35用于信号肽,氨基酸36-164用于前肽,氨基酸用于功能性APO-F。功能性APO-F序列的硅芯片计算机消化显示在7至25个氨基酸的标准之间的4种肽:SLPTEDCENEK(m/z 661.2825,2+或m/z441.1907,3+),SGVQQLIQYYQDQK(m/z 849.4283,2+或m/z 566.6213,3+),DANISQPETTK(m/z602.2962,2+,m/z 401.8666,3+),SYDLDPGAGSLEI(m/z 668.8170,2+,m/z 446.2138,3+)。所有这些肽可以通过使用SRM、MRM、PRM、MRM3的质谱来靶向,通过靶向上述括号中所示的MS1离子进行。在DANISQPETTK的情况下,在其序列中的第二个苏氨酸T是O-糖基化的,因此通常不会被选为合适的肽。然而,如果蛋白质去糖基化的,则不应排除DANISQPETTK。
除了检测生物标志物本身之外,在一些实施方案中,本发明的方法涉及检测特定生物标志物的片段。例如,裂解一些蛋白质如角蛋白I型骨架18和激肽原-1,其中裂解水平在NAFLD中增加。因此,对于这些蛋白质,监测裂解产物提供了对于NAFLD和/或疾病的阶段的标志物。在优选的实施方案中,通过质谱法检测裂解产物。当检测裂解产物时,可以不进行初始蛋白酶消化步骤。
在角蛋白I型细胞骨架18的情况下,该蛋白质通过半胱天冬酶在完全未加工序列的氨基酸397/398之间进行裂解(即,在除去引发剂甲硫氨酸后,功能性角蛋白I型细胞骨架18的氨基酸396/397之间),并且这种裂解随着NAFLD而增加。胰蛋白酶肽LLEDGEDFNLGDALDSSNSMQTIQK覆盖该裂解区域,并且可以通过使用SRM、MRM、PRM、MRM3等的质谱法进行靶向。已知该序列中的三个丝氨酸(S)氨基酸被磷酸化并且甲硫氨酸(M)可被氧化,因此如果这四个氨基酸都经修饰和未经修饰,则应计算该肽的m/z。该肽的水平随着NAFLD严重性的增加而降低。此外,裂解的胰蛋白酶肽LLEDGEDFNLGDALD可以通过使用SRM、MRM、PRM、MRM3等的质谱法进行靶向(通过靶向m/z 818.3729,2+或m/z 545.9177,3+的肽进行)。该肽的水平随着NAFLD严重性的增加而增加。裂解的胰蛋白酶肽SSNSMQTIQK也可以通过使用SRM、MRM、PRM、MRM3等的质谱法进行靶向,并且还随着NAFLD严重性的增加而增加,尽管如前所述,如果丝氨酸(S)和甲硫氨酸(M)都经修饰和未经修饰,则应计算该肽的m/z。
发现激肽原-1是NAFLD的新型生物标志物。激肽原-1裂解成以下6个链,所有这些链可以是NAFLD的潜在生物标志物:激肽原-1重链、T-激肽、缓激肽、赖氨酰-缓激肽、激肽原-1轻链和低分子量生长促进因子。T-激肽(序列ISLMKRPPGFSPFR;m/z 816.9558,2+;m/z544.9729,3+)、缓激肽(序列RPPGFSPFR;m/z 530.7880,2+;m/z 354.1944,3+)和赖氨酰-缓激肽(序列KRPPGFSPFR;m/z 594.8355,2+;m/z 396.8927,3+)是短肽,其可以通过使用SRM、MRM、PRM、MRM3等的质谱法进行靶向。靶向这些序列而不用胰蛋白酶或其他酶预先消化样品。缓激肽通过血浆激肽释放酶从激肽原释放。上述序列中第二个脯氨酸(P)的羟基化(RPP[+16]GFSPFR;m/z 538.7854,2+;m/z 359.5236,3+)发生在缓激肽释放之前,该缓激肽另外需要考虑MS1离子选择。
以与角蛋白I型细胞骨架18和激肽原-1类似的方式,可以选择用于裂解脂肪肝和/或纤维化的其他蛋白质的肽,其覆盖裂解区域并位于裂解区域的任一侧。例如,α2巨球蛋白和裂解/完整补体C3是具有纤维化依赖性硫酯裂解区域的蛋白质。
血红蛋白A1c(HbA1c,糖化血红蛋白)是结合葡萄糖的血红蛋白的组分,并且其升高的水平表明糖尿病患者在6-8周内血糖控制不良。II型糖尿病是NAFLD的风险因素,因此除了本文公开的生物标志物之外还可以测量HbA1c水平。在HbA1c中,葡萄糖与血红蛋白β链的N末端缬氨酸(V)连接。未加工的血红蛋白β链长度为147个氨基酸,第一个氨基酸是去除的引发剂甲硫氨酸。来自2-147的剩余氨基酸构成功能性血红蛋白β链。位置2的缬氨酸(V)氨基酸是HbA1c的糖化位点。HbA1c通常通过HPLC在临床中测量,但也可以通过使用SRM、MRM、PRM、MRM3等的质谱法靶向进行分析。如果来自NAFLD或糖尿病患者的生物样品中的蛋白质被胰蛋白酶消化,则来自血红蛋白β链的N末端肽具有序列VHLTPEEK(m/z476.7585,2+;m/z 318.1748,3+),其可以通过质谱法进行靶向。在m/z 476.7585(2+)或m/z318.1748(3+)处该肽的存在将表明N末端缬氨酸(V)处未糖基化的血红蛋白β链,而该肽的缺失将表明血红蛋白β链在N末端缬氨酸(V)处的糖基化。糖基化肽将具有附加质量的葡萄糖(具有一个水分子的损失),其序列为V[+162.1]HLTPEEK(m/z 557.7850,2+;m/z 372.1924,3+)。这可用于评估患者的血糖控制,并用于监测II型糖尿病,II型糖尿病是NAFLD的主要危险因素。所述方法还可用于检查血红蛋白α和β链以及其他蛋白质中的其他糖基化位点。
血管紧张素原也是纤维化的生物标志物。以下肽激素源自血管紧张素原:血管紧张素-1(DRVYIHPFHL;m/z 648.8460,2+;m/z 432.8998,3+)、血管紧张素1-9(DRVYIHPFH;m/z592.3040,2+;m/z 395.2051,3+)、血管紧张素-2(DRVYIHPF;m/z 523.7745,2+;m/z349.5188,3+)、血管紧张素1-7(DRVYIHP;m/z 450.2403,2+;m/z 300.4960,3+)、血管紧张素1-5(DRVYI;m/z 333.1845,2+;m/z 222.4588,3+;非独特且太短)、血管紧张素1-4(DRVY;m/z 276.6425,2+;m/z 184.7641,3+;非独特且太短)、血管紧张素-3(RVYIHPF;m/z466.2611,2+;m/z 311.1765,3+)和血管紧张素-4(VYIHPF;m/z 388.2105,2+;m/z259.1428,3+)。血管紧张素-2是肝纤维化中已知的肝星状细胞激活剂。可以通过使用SRM、MRM、PRM、MRM3等的质谱法靶向这些肽。必须靶向这些序列而不用胰蛋白酶或其他酶预先消化样品。
由于来自激肽原-1和血管紧张素原的肽从对它们的处理中自然地释放,因此可以在不需要用酶(例如胰蛋白酶、胰凝乳蛋白酶等)进行裂解的情况下检测它们。通过使用色谱法、分子量截止滤光片、尺寸排阻等去除具有更高分子量的蛋白质,然后通过质谱法靶向肽,可以从生物样品中检测肽。
本发明的检测方法还可包括使用试剂,其中试剂特异性地检测感兴趣的蛋白质或肽。所述试剂可以是结合要分析的蛋白质或肽的抗体或其功能等同物(即抗肽抗体)。这些抗体可用于进行免疫测定,例如但不限于酶联免疫吸附测定(ELISA)、放射免疫测定、蛋白质点印迹、蛋白质免疫印迹、比浊法、浊度测定法等。试剂盒可以进一步包含至少一种靶,其特异性用于检测可用作预测指标的基因或基因产物。
还可以使用特异性结合感兴趣的标志物的试剂通过合适的免疫测定法检测生物标志物。此类结合试剂包括免疫球蛋白和免疫球蛋白的功能等同物,其特异性结合感兴趣的生物标志物。术语“免疫球蛋白”和“抗体”在本文中可互换使用并且在其最广泛的意义上使用。因此,它们包括完整的单克隆抗体、多克隆抗体、抗体噬菌体展示(APD)、由至少两个完整抗体形成的多特异性抗体(例如双特异性抗体)和抗体片段,只要它们表现出所需的生物活性即可。APD涉及噬菌体基因工程和多轮噬菌体繁殖和抗原引导选择。
除了使用抗体来检测生物标志物之外,还可以使用抗体来富集生物样品中的生物标志物以帮助其他检测/定量方法。这包括诸如使用用于生物素化抗体的蛋白A、蛋白G、蛋白A/G或链霉亲和素/抗生物素蛋白珠的免疫沉淀技术。使用针对靶生物标志物的免疫沉淀抗体可选地使用交联剂(例如辛二酸二琥珀酰基酯(DSS))交联到珠子上,以避免在洗脱中存在抗体。或者,质谱免疫测定(MSIA)可用于使用SRM、MRM、MRM3、PRM等的NAFLD相关的生物标志物的下游质谱分析。MSIA提示可具有蛋白A、蛋白G或蛋白A/G,用于捕获对于靶生物标志物的抗体。MSIA提示可具有链霉亲和素或抗生物素蛋白,用于捕获对于靶生物标志物的生物素化抗体。MSIA特别适用于非常低丰度的生物标志物,其通常在没有富集的情况下检测不到(例如角蛋白I型细胞骨架18)。
本发明进一步提供了使用对感兴趣的生物标志物特异的抗体检测生物样品中一个或多个感兴趣的生物标志物的存在和/或测量其水平的方法。具体地,用于检测生物样品中感兴趣的生物标志物的存在的方法可以包括使样品与单克隆抗体接触并检测抗体与样品中的生物标志物的结合的步骤。更具体地,可以使用包括但不限于放射性标记、酶、发色团和荧光团的化合物标记抗体以产生可检测的信号。
当与合适的对照比较时,检测对于感兴趣的蛋白质或其功能等同物的特异性抗体的特异性结合,表明生物标志物存在于样品中。合适的对照包括已知不含有感兴趣的蛋白质的样品和与对于编码的蛋白质不特异的抗体(例如抗独特型抗体)接触的样品。检测特异性抗体-抗原相互作用的多种方法是本领域已知的,并且可以用于所述方法,包括但不限于标准免疫组织学方法、免疫沉淀法、酶免疫测定和放射免疫测定法。通常,特异性抗体将被直接或间接地可检测地标记。直接标记包括放射性同位素;产物可检测的酶(例如荧光素酶、3-半乳糖苷酶等);荧光标记(例如,异硫氰酸荧光素、罗丹明,藻红蛋白等);荧光发射金属(例如112Eu,或其他镧系元素,其通过金属螯合基团如EDTA与抗体连接);化学发光化合物(例如鲁米诺、异鲁米诺、吖啶盐等);生物发光化合物(例如萤光素、水母素(绿色荧光蛋白)等)。抗体可以连接(偶联)到不溶性载体上,例如聚苯乙烯板或珠子。间接标记包括第二抗体,其对编码的蛋白特异的抗体(“第一特异性抗体”)特异,其中第二抗体如上所述进行标记;和特异性结合对的成员,例如生物素-亲和素等。生物样品可以与固体支持物或载体(例如滤纸、硝酸纤维素膜或纤维素膜)接触并被固定,所述固体支持物或载体能够固定细胞、细胞颗粒或可溶性蛋白质。然后可以用合适的缓冲液或溶剂(例如丙酮,其溶解纤维素膜并将蛋白质沉淀在生物样品中)洗涤支持物,然后使用酶将样品中的蛋白质消化成肽,然后通过质谱法或与可检测标记的第一特异性抗体接触来检测和定量生物标志物。检测方法是本领域已知的,并且将根据可检测标记发出的信号进行选择。通常与合适的对照和与适当的标准相比较完成检测。
本发明的检测方法还可以包括使用试剂来检测NAFLD和跨NAFLD阶段中的生物标志物的翻译后的修饰的变化。这些翻译后的修饰可包括N-糖基化、O-糖基化和磷酸化。
在另一个实施方案中,本发明提供了一种确定NAFLD/纤维化预测的方法,包括:(a)确定从患者获得的生物样品中的蛋白质水平,所述蛋白质选自载脂蛋白F、脂多糖结合蛋白、纤维胶凝蛋白-2、载脂蛋白D、激肽原-1、载脂蛋白M、血小板反应蛋白-1、IgG Fc结合蛋白、胱抑素-c、α-1-酸糖蛋白2和富含亮氨酸的α-2-糖蛋白;(b)将所述(a)的水平与所述蛋白质的对照水平进行比较,以确定所述脂肪肝或纤维化的阳性或阴性诊断。
治疗方法
在根据本发明的一些情况下,描述了治疗NAFLD的方法。所述方法包括诊断个体的NAFLD,检测和定量从个体获得的生物样品中的一个或多个生物标志物,其中所述一个或多个生物标志物选自载脂蛋白F、脂多糖结合蛋白、纤维胶凝蛋白-2、载脂蛋白D、激肽原-1、载脂蛋白M、血小板反应蛋白-1、IgG Fc结合蛋白、胱抑素-c、α-1-酸糖蛋白2和富含亮氨酸的α-2-糖蛋白,对个体施用药剂或对其进行治疗方案,并从而治疗NAFLD。
该个体通常患有NAFLD,即已被诊断为患有NAFLD,或怀疑患有NAFLD,即表现出NAFLD的症状。如本文所用,术语“治疗”包括以下任何一种:预防疾病或与疾病相关的一种或多种症状;减少或预防疾病或症状的发展或进展;以及减少或消除现有疾病或症状。NAFLD/NASH的治疗旨在减少肝脏相关和全因(特别是心血管)的发病率和死亡率。选择治疗方法需要评估肝脏疾病的严重性。可根据本发明使用的治疗策略包括(i)生活方式干预或其他体重减轻方案,目标是体重减轻>7;(ii)优化心血管危险因素的治疗,包括糖尿病患者的血糖控制,血压控制或降脂治疗。
可以用于治疗的药剂包括血管紧张素转换酶抑制剂(ACE-I)/血管紧张素受体阻滞剂(ARBs),其具有潜在的抗纤维化作用,和二甲双胍,其可降低肝癌风险。利拉鲁肽是可用于治疗的另一种药物,其似乎改善NASH超过其对体重减轻的影响(LEAN study,Armstrong etal.Lancet 2015)。也可以使用针对那些患有NASH和更晚期纤维化(F2-3)的患者的肝特异性治疗剂(例如在3期临床试验中的那些)。实例包括奥贝胆酸、合成胆汁酸衍生物(拦截药品)、Elafibranor、PPAR a/d激动剂(Genfit)。目前有许多处于不同发展阶段的候选药物可以使用。可以在被诊断患有NAFLD的个体使用的进一步治疗策略是外科手术。例如,在病态肥胖患者中进行减肥手术(袖状胃切除术或roux-en-y胃旁路术)。
本文所述治疗剂的具体给药途径、给药剂量和给药方法可由医师常规确定。这些将在下面更详细地讨论。
试剂
用于本文所述治疗方法的试剂可以配制成药物组合物。除治疗活性成分外,这些组合物还可包含药学上可接受的赋形剂、载体、稀释剂、缓冲剂、稳定剂或本领域技术人员熟知的其他材料。这些材料应无毒,不应干扰活性成分的功效。药物载体或稀释剂可以是例如等渗溶液。
试剂盒
本发明进一步提供了试剂盒,其包含用于检测和定量来自个体的生物样品中的本文所述的一个或多个生物标志物的装置(例如试剂)和根据本发明的方法使用所述试剂盒的说明书。该试剂盒还可以包括关于所述方法可以在哪些个体上施用的细节。所述试剂盒通常含有与相关生物标志物特异性结合的一个或多个试剂(例如抗体)。所述试剂盒可另外包含用于测量其他实验室或临床参数的装置。使用这些试剂盒的程序可由临床实验室、实验实验室、医疗从业者或个人执行。
所述试剂盒可另外包含能够使所述方法实施的一个或多个其他试剂或仪器。此类试剂或仪器可包括以下的一个或多个:合适的缓冲液(水溶液)、同位素标记的或未标记的肽、肽校准曲线标准物、显影剂、酶、标记物、反应表面、检测手段、对照样品、标准物、说明书、解释性信息、从样品中分离相关生物标志物的方法、从个体获得样品的装置(例如容器或包含针头的仪器)或包含孔的支持物,在其上定量反应可以完成。
根据本发明鉴定的其他生物标志物
如实施例中所述,除了上述优选的生物标志物外,其中所述生物标志物通过2D-PAGE和质谱法进行初步鉴定,然后通过在NAFLD中的表达更详细地表征(载脂蛋白F、激肽原-1、载脂蛋白D、载脂蛋白M、纤维胶凝蛋白-2、α-1-酸糖蛋白2、富含亮氨酸的α-2-糖蛋白、脂多糖结合蛋白、血小板反应蛋白-1、IgG Fc结合蛋白和胱抑素-c),本发明还提供了用于NAFLD其他生物标志物,其通过2D-PAGE和质谱法初步鉴定。这些其他生物标志物列于下面。
因此,本发明还提供了一种对个体非酒精性脂肪肝病(NAFLD)的进展进行诊断、预测或监测或分阶段的方法,其基于检测和定量从个体获得的生物样品中的一个或多个下述其他生物标志物,从而对NAFLD的进展进行诊断、预测或监测或分阶段。本发明另外提供了一种对个体非酒精性脂肪肝病(NAFLD)的进展进行诊断、预测或监测或分阶段的方法,所述方法包括检测和定量从个体获得的生物样品中的一个或多个生物标志物,其中一个或多个生物标志物选自载脂蛋白F、脂多糖结合蛋白、纤维胶凝蛋白-2、载脂蛋白D、激肽原-1、载脂蛋白M、血小板反应蛋白-1、IgG Fc结合蛋白、胱抑素-c、α-1-酸糖蛋白2和富含亮氨酸的α-2-糖蛋白,并另外地检测和定量一个或多个下述其他标志物,从而对NAFLD的进展进行诊断、预测或监测或分阶段。
使用2D-PAGE,除了优选的生物标志物载脂蛋白F、激肽原-1、载脂蛋白D和载脂蛋白M之外,还鉴定了以下用于NAFLD的其他生物标志物:鉴定为特征随NAFLD严重性增加的蛋白质包括抗凝血酶-III、α-1-抗胰蛋白酶、Igγ-1链C区、补体因子B、α-2-巨球蛋白、补体因子H、补体C1r亚组分、补体C4-A、间α-胰蛋白酶抑制剂重链H4、载脂蛋白A-IV和血清白蛋白。鉴定为特征随NAFLD严重性降低的蛋白质包括载脂蛋白C2、载脂蛋白C4、载脂蛋白M、载脂蛋白C-III、载脂蛋白A-IV、凝聚素、蛋白质APOC4-APOC2、触珠蛋白、血清白蛋白、锌-α-2-糖蛋白、凝血酶链、转甲状腺素蛋白、谷胱甘肽过氧化物酶3、α-1-抗胰蛋白酶、α-1-抗胰凝乳蛋白酶、LMW激肽原-1、补体C3、补体C4-A、C4b结合蛋白α链、补体因子I轻链、补体C1r亚组分、Igα-1链C区、Igκ链C区,Igγ-1链C区、Igγ-2链C区、间α-胰蛋白酶抑制剂重链H3、凝血酶原、推定的延伸因子1-α样3、维生素D结合蛋白、β-2-糖蛋白1和α-2-HS-糖蛋白。
发现三种蛋白质特征从NAFL到NASH F0/F1强度增加,然后在NASH F3中强度降低,并且在这些特征中鉴定的蛋白质包括补体C1s亚组分、补体C3、触珠蛋白、载脂蛋白A-IV、血清白蛋白、Igκ链C区和载脂蛋白AI。一些蛋白质在NAFLD中鉴定为特征都增加和减少可能是由于蛋白质的不同片段的翻译后修饰或差异性表达,这些蛋白质包括α-1-抗胰蛋白酶、Igγ-1链C区、补体C1r亚组分、补体C4-A、载脂蛋白A-IV和血清白蛋白。
使用质谱和TMT,除了优选的生物标志物纤维胶凝蛋白-2、α-1-酸糖蛋白2,富含亮氨酸的α-2-糖蛋白、脂多糖结合蛋白、血小板反应蛋白-1、IgG Fc结合蛋白和胱抑素-c之外,还鉴定了以下用于NAFLD的其他生物标志物:鉴定为随NAFLD严重性增加的蛋白质包括胱抑素-C(P01034)、磷脂酰肌醇-聚糖特异性磷脂酶D(P80108)、GTP酶激活Rap/Ran-GAP结构域样蛋白3(Q5VVW2)、Igκ链V-I区DEE(P01597)、纤维胶凝蛋白-3(O75636)、α-2-HS-糖蛋白(P02765)、肝细胞生长因子样蛋白(P26927)、碳酸酐酶1(P00915)、Ig重链V-II区WAH(P01824)、Igκ链V-I区Mev(P01612)、血清灭菌蛋白(P27918)、Igκ链V-III区HAH(P18135)、血红蛋白亚基β(P68871)、血管性血友病因子(P04275)、血红蛋白亚基α(P69905)、Igκ链V-I区Ni(P01613)、Igκ链V-I区EU(P01598)、Igα-1链C区(P01876)、SPARC(P09486)、纤连蛋白(P02751)、血小板碱性蛋白(P02775)和血小板因子4(P02776)。鉴定为随NAFLD严重性降低的蛋白质包括妊娠区蛋白(P20742)、载脂蛋白(a)(P08519)、凝血因子XIII A链(P00488)、半乳糖凝集素-3结合蛋白(Q08380)、脂连蛋白(Q15848)、肌动蛋白细胞质1(P60709)、载脂蛋白A-II(P02652)、α-2-抗纤溶酶(P08697)、肽酶抑制剂16(Q6UXB8)、锌-α-2-糖蛋白(P25311)、α-1-酸糖蛋白2(P19652)、凝血因子XI(P03951)、血清淀粉样蛋白P成分(P02743)、蛋白Z依赖性蛋白酶抑制剂(Q9UK55)、单核细胞分化抗原CD14(P08571)、胰岛素样生长因子结合蛋白复合酸不稳定亚基(P35858)和载脂蛋白L1(O14791)。
除了本文提供的方法中的本发明的生物标志物/生物标志物组合之外,还可以分析一个或多个以下生物标志物:白和生育酚结合蛋白、丙氨酸氨基转移酶(ALT)、α-1B-糖蛋白、α-1-微球蛋白、甲胎蛋白(AFP)、血管紧张素2,血管紧张素原、载脂蛋白A-1、载脂蛋白C1、载脂蛋白C2、载脂蛋白E、脱唾液酸糖蛋白受体1、脱唾液酸糖蛋白受体2、天冬氨酸转氨酶(AST)、β2微球蛋白、胆红素、生物素、血液胆固醇、血糖(禁食和/或餐后)、血甘油三酯、血尿素氮(BUN)、缓激肽、C反应蛋白(CRP)、羧肽酶N2、C4b结合蛋白β链、CD5抗原样蛋白(CD5L)、铜蓝蛋白、几丁质酶-3样蛋白1、胶原肽酶、补体C3(包括C3dg及其在氨基酸1010-1013之间硫酯位点的裂解物)、补体因子H相关蛋白1、结缔组织生长因子、胶原蛋白IV、胶原蛋白VI、胶原蛋白XIV、72kDa IV型胶原酶、皮质类固醇结合球蛋白、肌酐、抑制因子-1、上皮细胞粘附分子、纤维蛋白原γ链、纤维连接蛋白III型结构域蛋白5、纤维胶凝蛋白-1、全血计数、半乳糖基羟基甲基葡糖基转移酶、γ-谷氨酰转肽酶、明胶酶B、凝溶胶蛋白、磷脂酰肌醇蛋白聚糖-3,高尔基体膜蛋白1、触珠蛋白(包括pH值为5.46-5.49的β链,聚糖主要为双触角的、单的或二唾液酸化的,几乎没有任何三或四触角/唾液酸化结构,和比其他低pH的触珠蛋白亚型具有更少唾液酸和更多的单唾液酸化结构)、触珠蛋白相关蛋白、血红蛋白A1c、血红素结合蛋白、高密度脂蛋白(HDL)、透明质酸、免疫球蛋白J链、间α胰蛋白酶抑制剂(H1、H2、H5、H6)、细胞内粘附分子1、鸢尾素、层粘连蛋白亚基α/β/γ(包括层粘连蛋白P1片段),卵磷脂胆固醇酰基-转移酶、肝功能检查、低密度脂蛋白(LDL)、赖氨酰羟化酶、赖氨酸氧化酶、基质金属蛋白酶(MMP-1至MMP-28)、金属蛋白酶抑制剂(TIMP1、TIMP2、TIMP3、TIMP4)、微纤维相关蛋白4、单胺-氧化酶、N-乙酰-β-d-氨基葡萄糖苷酶、骨桥蛋白、过氧化物酶-2、磷脂酰胆碱-甾醇酰基转移酶、色素上皮衍生因子、血小板计数、血小板衍生生长因子、I型前胶原(包括N-末端前肽和C-末端前肽)、III型前胶原(包括完整原胶原、N-末端前肽、C-末端前肽、完整前肽Col 1-3)、前肽Col-1的球状结构域、脯氨酰羟化酶、14-3-3蛋白质ζ/δ、蛋白质AMBP、凝血酶原(指数/凝血酶原时间/INR比率)、抵抗素、视黄醇结合蛋白4、sal样蛋白4、血清对氧磷酶/芳酰酯酶1、性激素结合球蛋白、SNC73、人踝蛋白-1、肌腱蛋白、血小板反应蛋白-2、血小板反应蛋白-3、血小板反应蛋白-4、血小板反应蛋白-5、转铁蛋白、转化生长因子α(TGFα)、转化生长因子β-1(TGFβ-1)、原肌球蛋白(1-4)、肿瘤坏死因子(TNFα)、IV型胶原蛋白(包括NC1-片段C-末端交联结构域PIVP和7S结构域/7S胶原蛋白)、VI型胶原蛋白、粗纤维调节素、血管细胞粘附分子和/或玻连蛋白。
实施例
在比较不同阶段NAFLD患者的血浆时建立的差异性表达的蛋白质
发明人已发现各种蛋白质在NAFLD患者的人血清样品中差异性表达。比较以下组:NAFL、没有纤维化F0的NASH,具有轻度纤维化F1的NASH和具有晚期纤维化F3的NASH。这一发现是通过使用两种蛋白质组学方法(二维聚丙烯酰胺凝胶电泳(2D-PAGE)和基于TMT的质谱法)比较这些血清样品来实现的。
实施例1-二维聚丙烯酰胺凝胶电泳(2D-PAGE)
为了鉴定用于NAFLD的生物标志物,使用两种基于2D-PAGE的蛋白质组学方法分析血清样品。分析以下NAFLD阶段:NAFL、没有纤维化F0的NASH、具有轻度纤维化F1的NASH和具有晚期纤维化F3的NASH。
在第一种方法中,根据制造商协议,使用Top12丰富蛋白质消耗旋转柱(ThermoScientific,Loughborough,UK)通过免疫沉淀从所有NAFLD样品中耗尽12种高丰度血清蛋白。耗尽的12种蛋白质是α1-酸性糖蛋白、α1-抗胰蛋白酶、α2-巨球蛋白、白蛋白、载脂蛋白A-I、载脂蛋白A-II、纤维蛋白原、触珠蛋白、IgA、IgG、IgM和转铁蛋白。50微克耗尽的血清蛋白在凝胶的第一维中使用7cm pH 3-11非线性梯度通过电荷进行分离并且然后使用4-12%(w/v)SDS-PAGE梯度在第二维中通过分子量(大小)进行分离。Gangadharan等,(2007),ClinChem,53,1792,描述了执行凝胶的电泳、荧光染色和扫描。
在第二种方法中,2毫克未耗尽的血清蛋白在第一维中使用pH为3-5.6非线性梯度通过电荷进行分离,然后使用9-16%(w/v)SDS-PAGE梯度在第二维中通过分子量进行分离。Gangadharan等,(2012),PLoS ONE,7,e39603;Gangadharan等,(2011),Nature ProtocolExchange,doi:10.1038/protex.2011.261and Gangadharan等,(2011),J Proteome Res,10,2643描述了执行凝胶的电泳、荧光染色和扫描。
实施例2-特异性图像分析和蛋白质鉴定
通过计算机辅助图像分析比较不同NAFLD阶段产生的二维点阵。使用ProgenesisSameSpots软件(Nonlinear Dynamics Limited,Newcastle,UK)通过计算机辅助图像分析对所有2D-PAGE凝胶的扫描图像进行分析。图像在自动线性工作流程中处理,包括凝胶对准、斑点检测、斑点分裂和统计分析。斑点检测产生完整的数据集,因为所有凝胶含有相同数量的斑点,每个斑点与所有凝胶上的相应斑点匹配。没有遗漏值,允许应用有效的统计分析。只有差异性表达变化为1.5倍或更多不同,并且对于95%置信度具有ANOVA p值≤0.05被认为是统计学上显著的。列表中显示的所有变化都在所有凝胶中可视化和确认。使用具有耗尽血清的pH 3-11凝胶观察到总共15个差异性表达的特征。使用具有未耗尽血清的pH3-5.6凝胶观察到总共38个差异性表达的特征。总共11种蛋白质鉴定为特征随NAFLD严重性增加,并且35种蛋白质鉴定为特征随NAFLD严重性降低(即总共46种蛋白质)。差异性表达特征的实例显示在图1中。从凝胶中切除这些差异性表达的特征,用胰蛋白酶消化凝胶片中的蛋白质,并且通过质谱法分析肽以基本上鉴定生物标志物,如Gangadharan等,(2007),Clin.Chem.,53,1792和Gangadharan等,(20 12),PLoS ONE,7,e39603所述。
使用针对新型生物标志物的抗体,通过SDS-PAGE和之后的蛋白质免疫印迹(Western blotting)分离NAFLD血清样品中的蛋白质。载脂蛋白F和激肽原-1在所有NAFLD阶段均显示降低。与NAFLD的所有阶段相比,健康对照中的载脂蛋白D更高,表明它有可能成为早期NAFLD标志物并且能够区分健康对照与NAFL患者。载脂蛋白M水平在健康对照和NAFLD所有阶段(除了NASH F3)似乎是恒定的,表明它是一种晚期纤维化生物标志物。这四种NAFLD生物标志物的蛋白质免疫印迹显示在图2中,并且这四种生物标志物被认为是通过2D-PAGE初步鉴定的46种蛋白质的原始列表中的特别优选的生物标志物。
实施例3-基于TMT的质谱分析
分析来自以下五个阶段中的每一个的两个血清样品:1)健康个体,2)NAFL,3)没有纤维化F0的NASH,4)具有轻度纤维化F1的NASH和5)具有晚期纤维化F3的NASH。用胰蛋白酶消化这10个样品中的蛋白质,并根据制造商协议(Life Technologies)用等压同位素标记的串联质量标签(TMT)标记胰蛋白酶肽。将具有TMT标记的肽的所有10个样品混合并使用Dionex Ultimate 3000超高效液相色谱仪和热Q活化混合式四极轨道阱质谱仪通过LC-MS/MS进行分析。使用所述方法,观察到总共54种差异性表达的血清蛋白。基于相对定量TMT数据的差异性表达蛋白质的实例显示在图3中。
使用血清样品的胰蛋白酶消化物,通过PRM靶向所有54种差异性表达的蛋白质,尽可能使用每种蛋白质的三种肽。该验证检查有助于确定54种潜在NAFLD生物标志物中哪些最有希望。在54种蛋白质中,发现实施例2中先前未鉴定的8种蛋白质是特别有希望的生物标志物(因此总共提供12种特别有希望的生物标志物,包括实施例2中列出的4种)。从8种蛋白质的列表中,纤维胶凝蛋白-2、脂连蛋白、α-1-酸糖蛋白2和富含亮氨酸的α-2-糖蛋白在跨NAFLD阶段均显示降低,而脂多糖结合蛋白、血小板反应蛋白-1、IgG Fc结合蛋白和胱抑素-c在跨NAFLD阶段显示增加。这8种NAFLD生物标志物与载脂蛋白D的PRM数据如图4所示。
实施例4-NAFLD和/或纤维化评分量表
可以配制每种新型生物标志物的NAFLD和/或纤维化评分量表。确定这些生物标志物在NAFLD和/或肝纤维化的各个阶段的毛细血管血液、静脉血液、动脉血液、血清、血浆或其他体液中的平均浓度。在NAFLD中,Kleiner-Brunt量表0至4目前用于评估临床中的肝纤维化,其中0代表无纤维化,1-3代表纤维化的中间阶段,其严重性从轻度到中度/重度增加,4代表肝硬化(Kleiner,(2005),Hepatology,41,1313)。纤维化也可以根据从0到4(例如Metavir,Knodell)或0到6的其他类似量表进行分阶段,其中0表示无纤维化,1-5表示纤维化的中间阶段,严重性从轻度到中度/重度逐渐增加,6是肝硬化(Ishak,(1995),JHepatol,22,696)。通过确定跨这些阶段的新型生物标志物的浓度范围,可以指定与Kleiner-Brunt或类似方法的数学评分算法,以帮助提供关于分阶段和预测的信息。来自多于一种的新型生物标志物的得分的相加结果可以提供更可靠的纤维化程度指示,而不是测量单个生物标志物。评分方法可能不一定遵循现有的评分,例如Kleiner-Brunt、Ishak、Metavir、Knodell等,并且可以是新的评分量表以帮助确定NAFLD和/或纤维化阶段并确定是否需要治疗。
实施例5-通过质谱法定量
使用质谱法的无抗体方法可用于确定NAFLD和/或纤维化阶段,这通过检测和/或定量一个或多个感兴趣的生物标志物进行。生物样品(毛细血管血液、静脉血液、动脉血液、血清、血浆或其他体液)中的蛋白质通常用尿素等进行变性。可以可选的还原蛋白质(使用二硫苏糖醇,三(2-羧乙基)膦,β-巯基乙醇等)并烷基化(使用碘乙酰胺等),这些步骤通常在消化之前进行,尽管它们可以在消化后进行。用酶如胰蛋白酶、胰凝乳蛋白酶等消化蛋白质。在胰蛋白酶的情况下,这还包括用于更高产量消化的固定化胰蛋白酶,例如来自PerfinityBiosciences的闪消(也称为来自Thermo Scientific的智能消化)。蛋白质消化可以使用溶液内消化、过滤辅助样品制备(FASP)、凝胶内消化(其中样品在进行消化前进入SDS-PAGE凝胶,所述样品可选地染色并切离用于消化,或浇注在聚丙烯酰胺凝胶块中),固定化酶消化(例如来自Perfinity Biosciences的闪消或来自Thermo Fisher Scientific的智能消化)等。同位素标记的肽标准物可以在消化之前或之后掺入生物样品中,这些包括合成肽、IGNIS肽、PEPotec肽、AQUA肽、SpikeTide肽、蛋白质表位标记标签(QPrEST)肽,微波辅助固相合成肽,由QconCAT基因编码的串联标记肽等。
对于不同酶(例如胰蛋白酶)的蛋白质裂解位点是已知的,因此生物标志物可以手动地或使用软件(例如Skyline、PinPoint等)在硅芯片计算机消化,以帮助确定用于靶向定量的合适的肽。通常选择的肽长于7个氨基酸,短于25个氨基酸,未经修饰(例如糖基化、磷酸化等)并且不含甲硫氨酸,尽管不应完全排除该标准之外的肽。在线数据库,例如但不限于PeptideAtlas和全球蛋白质组学机器数据库(gpmdb),帮助确定感兴趣的蛋白质的通常观察的肽。MRMaid可用于帮助设计基于质谱法的靶向定量分析,这通过基于来自PRIDE数据库的实验光谱,建议监测肽和MS2离子进行。蛋白质BLAST用于检查所选肽的独特性。如果发现肽不是唯一的,则将选择生物标志物序列内的另一个肽。
在质谱分析之前,可以使用磷酸肽富集、糖肽富集,高pH反相分馏等对消化的肽进行分馏。肽可以通过反相液相色谱法、亲水相互作用液相色谱法(HILIC),离子交换色谱法,等电点聚焦等分离。
使用三重四极杆质谱仪进行SRM/MRM,所述三重四极杆质谱仪具有三个四极杆,其包括诸如Thermo TSQ Quantiva,Waters Xevo TQ-S,Agilent 6495,Bruker EVOQ,ABSciex3500,Shimadzu 8050等仪器。使用混合四极杆-轨道阱质谱仪例如Thermo Q Exactive及其变体或Thermo Fusion及其变体进行PRM。使用QTRAP质谱仪如ABSciex QTRAP 6500进行MRM3。碎片离子的曲线下面积(AUC)可用于相对量化目标蛋白质水平。已知量的与预选肽具有相同序列的合成纯重标记肽可用于建立校准曲线以帮助确定蛋白质的绝对浓度。或者,可以使用Life Technologies的HeavyPeptide IGNIS Prime自定义肽定量试剂盒进行绝对定量。
发明人还提出,任何裂解的或具有感兴趣区域的生物标志物可以通过质谱法进行靶向,这使用覆盖在质谱分析中使用的这些裂解区域或感兴趣区域的肽标准物进行。
实施例6-免疫测定
可以进行免疫测定以评估生物标志物的水平,例如酶联免疫吸附测定(ELISA)、放射免疫测定、蛋白质点印迹、蛋白质免疫印迹、比浊法,浊度法等。
在ELISA的情况下,可以在96孔板中进行分析。一种选择是使用非竞争性单位点结合ELISA。在该分析中,在缓冲液(例如碳酸氢盐缓冲液)中制备毛细血管血液、静脉血液、动脉血液、血清、血浆或其他体液和已知浓度的抗原,将其加入到96孔板并在4℃规定时间内(例如过夜)培养。然后用溶液,例如磷酸盐缓冲盐水(PBS)和吐温(PBS-T)等洗涤所述孔,然后用含有牛血清白蛋白等的PBS溶液封闭。在培养期(例如37℃培养1小时)后,加入针对抗原(在该实施例中,感兴趣的生物标志物)的第一抗体,将板培养一段时间(例如37℃培养1小时)然后用PBS-T等洗涤。然后加入针对第一抗体动物来源的缀合第二抗体(例如辣根过氧化物酶),并将板培养一段时间(例如37℃培养1小时),然后用PBS-T等洗涤。最后,向每个孔中加入底物(例如过氧化物酶底物如2,2'-连氮基-双(3-乙基苯并噻唑啉-6-磺酸,ABTS),并在读板器上读取吸光度(例如对于ABTS在30分钟后405nm处)。
或者,可以使用夹心ELISA。在这种类型的分析中,一种抗体与板孔的底部结合。加入抗原(在这种情况下是生物标志物蛋白),并且通过洗涤去除未结合的产物。然后加入第二种标记的抗体,其与抗原结合。通常用比色法定量结合的第二抗体的量。除了新型生物标志物外,本发明人提出任何裂解或具有感兴趣区域的生物标志物,然后可以应用抗体,所述抗体靶向在免疫测定中使用的这些裂解区域或感兴趣区域。
序列表
<110> 牛津大学创新有限公司
<120> 生物标志物
<130> N408344WO
<150> GB1614455.2
<151> 2016-08-24
<160> 44
<170> PatentIn version 3.5
<210> 1
<211> 11
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> APO-F 肽-1
<400> 1
Ser Leu Pro Thr Glu Asp Cys Glu Asn Glu Lys
1 5 10
<210> 2
<211> 14
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> APO-F 肽-2
<400> 2
Ser Gly Val Gln Gln Leu Ile Gln Tyr Tyr Gln Asp Gln Lys
1 5 10
<210> 3
<211> 11
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> APO-F 肽-4
<220>
<221> MOD_RES
<222> (10)..(10)
<223> 可以是O-糖基化苏氨酸
<400> 3
Asp Ala Asn Ile Ser Gln Pro Glu Thr Thr Lys
1 5 10
<210> 4
<211> 13
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> APO-F 肽-3
<400> 4
Ser Tyr Asp Leu Asp Pro Gly Ala Gly Ser Leu Glu Ile
1 5 10
<210> 5
<211> 25
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 胰蛋白酶的肽
<400> 5
Leu Leu Glu Asp Gly Glu Asp Phe Asn Leu Gly Asp Ala Leu Asp Ser
1 5 10 15
Ser Asn Ser Met Gln Thr Ile Gln Lys
20 25
<210> 6
<211> 15
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 裂解的胰蛋白酶的肽
<400> 6
Leu Leu Glu Asp Gly Glu Asp Phe Asn Leu Gly Asp Ala Leu Asp
1 5 10 15
<210> 7
<211> 10
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 裂解的胰蛋白酶的肽
<400> 7
Ser Ser Asn Ser Met Gln Thr Ile Gln Lys
1 5 10
<210> 8
<211> 14
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> T-激肽
<400> 8
Ile Ser Leu Met Lys Arg Pro Pro Gly Phe Ser Pro Phe Arg
1 5 10
<210> 9
<211> 9
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 缓激肽
<220>
<221> MOD_RES
<222> (3)..(3)
<223> 可以是羟化脯氨酸
<400> 9
Arg Pro Pro Gly Phe Ser Pro Phe Arg
1 5
<210> 10
<211> 10
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 赖氨酰缓激肽
<400> 10
Lys Arg Pro Pro Gly Phe Ser Pro Phe Arg
1 5 10
<210> 11
<211> 8
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 来自血红蛋白β链的糖基化N末端肽
<220>
<221> MOD_RES
<222> (1)..(1)
<223> 可以是糖基化的缬氨酸
<400> 11
Val His Leu Thr Pro Glu Glu Lys
1 5
<210> 12
<211> 10
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 血管紧张素-1
<400> 12
Asp Arg Val Tyr Ile His Pro Phe His Leu
1 5 10
<210> 13
<211> 9
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 血管紧张素 1-9
<400> 13
Asp Arg Val Tyr Ile His Pro Phe His
1 5
<210> 14
<211> 8
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 血管紧张素-2
<400> 14
Asp Arg Val Tyr Ile His Pro Phe
1 5
<210> 15
<211> 7
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 血管紧张素 1-7
<400> 15
Asp Arg Val Tyr Ile His Pro
1 5
<210> 16
<211> 5
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 血管紧张素 1-5
<400> 16
Asp Arg Val Tyr Ile
1 5
<210> 17
<211> 4
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 血管紧张素 1-4
<400> 17
Asp Arg Val Tyr
1
<210> 18
<211> 7
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 血管紧张素-3
<400> 18
Arg Val Tyr Ile His Pro Phe
1 5
<210> 19
<211> 6
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 血管紧张素-4
<400> 19
Val Tyr Ile His Pro Phe
1 5
<210> 20
<211> 9
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 图 4B 序列 1
<400> 20
Val Asp Gly Ser Val Asp Phe Tyr Arg
1 5
<210> 21
<211> 23
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 图4B 序列 2
<400> 21
Leu Gly Glu Phe Trp Leu Gly Asn Asp Asn Ile His Ala Leu Thr Ala
1 5 10 15
Gln Gly Thr Ser Glu Leu Arg
20
<210> 22
<211> 10
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 图 4B 序列 3
<400> 22
Asn Cys His Val Ser Asn Leu Asn Gly Arg
1 5 10
<210> 23
<211> 14
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 图 4C 序列 1
<400> 23
Ile Glu Asp Ala Asn Leu Ile Pro Pro Val Pro Asp Asp Lys
1 5 10
<210> 24
<211> 9
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 图 4C 序列 2
<400> 24
Gly Phe Leu Leu Leu Ala Ser Leu Arg
1 5
<210> 25
<211> 13
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 图 4C 序列 3
<400> 25
Ala Gly Thr Leu Asp Leu Ser Leu Thr Val Gln Gly Lys
1 5 10
<210> 26
<211> 15
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 图 4D 序列 1
<400> 26
Gly Asp Ile Gly Glu Thr Gly Val Pro Gly Ala Glu Gly Pro Arg
1 5 10 15
<210> 27
<211> 15
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 图 4D 序列 2
<400> 27
Ile Phe Tyr Asn Gln Gln Asn His Tyr Asp Gly Ser Thr Gly Lys
1 5 10 15
<210> 28
<211> 23
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 图 4D 序列 3
<400> 28
Asn Gly Leu Tyr Ala Asp Asn Asp Asn Asp Ser Thr Phe Thr Gly Phe
1 5 10 15
Leu Leu Tyr His Asp Thr Asn
20
<210> 29
<211> 13
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 图 4E 序列 1
<400> 29
Tyr Asp Leu Ala Phe Val Val Ala Ser Gln Ala Thr Lys
1 5 10
<210> 30
<211> 12
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 图 4E 序列 2
<400> 30
Leu Asp Ser Leu Val Ala Gln Gln Leu Gln Ser Lys
1 5 10
<210> 31
<211> 14
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 图 4E 序列 3
<400> 31
Gly Ala Thr Thr Ser Pro Gly Val Tyr Glu Leu Ser Ser Arg
1 5 10
<210> 32
<211> 11
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 图 4F 序列
<400> 32
Ala Leu Asp Phe Ala Val Gly Glu Tyr Asn Lys
1 5 10
<210> 33
<211> 8
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 图 4G 序列 1
<400> 33
Ser Phe Arg Pro Phe Val Pro Arg
1 5
<210> 34
<211> 9
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 图 4G 序列 2
<400> 34
Ile Thr Gly Phe Leu Lys Pro Gly Lys
1 5
<210> 35
<211> 12
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 图 4G 序列 3
<400> 35
Val Gln Leu Tyr Asp Leu Gly Leu Gln Ile His Lys
1 5 10
<210> 36
<211> 10
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 图 4H 序列 1
<400> 36
Glu His Val Ala His Leu Leu Phe Leu Arg
1 5 10
<210> 37
<211> 15
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 图 4H 序列 2
<400> 37
Asn Trp Gly Leu Ser Phe Tyr Ala Asp Lys Pro Glu Thr Thr Lys
1 5 10 15
<210> 38
<211> 17
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 图 4H 序列 3
<400> 38
Glu Gln Leu Gly Glu Phe Tyr Glu Ala Leu Asp Cys Leu Cys Ile Pro
1 5 10 15
Arg
<210> 39
<211> 11
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 图 4I 序列 1
<400> 39
Ala Leu Gly His Leu Asp Leu Ser Gly Asn Arg
1 5 10
<210> 40
<211> 10
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 图 4I 序列 2
<400> 40
Val Ala Ala Gly Ala Phe Gln Gly Leu Arg
1 5 10
<210> 41
<211> 9
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 图 4I 序列 3
<400> 41
Gly Gln Thr Leu Leu Ala Val Ala Lys
1 5
<210> 42
<211> 7
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 图 4J 序列 1
<400> 42
Val Leu Asn Gln Glu Leu Arg
1 5
<210> 43
<211> 13
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 图 4J 序列 2
<400> 43
Asn Pro Asn Leu Pro Pro Glu Thr Val Asp Ser Leu Lys
1 5 10
<210> 44
<211> 11
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 图 4J 序列 3
<400> 44
Asn Ile Leu Thr Ser Asn Asn Ile Asp Val Lys
1 5 10