CN113156018B - 一种肝胆疾病诊断模型的建立方法及诊断系统 - Google Patents

一种肝胆疾病诊断模型的建立方法及诊断系统 Download PDF

Info

Publication number
CN113156018B
CN113156018B CN202110458372.9A CN202110458372A CN113156018B CN 113156018 B CN113156018 B CN 113156018B CN 202110458372 A CN202110458372 A CN 202110458372A CN 113156018 B CN113156018 B CN 113156018B
Authority
CN
China
Prior art keywords
liver
metabolite
serum
combination
auc
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110458372.9A
Other languages
English (en)
Other versions
CN113156018A (zh
Inventor
宁慧
张志永
彭章晓
胡哲
陆嘉伟
胡绪俊
付艳蕾
舒烈波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Deer Biotechnology Co ltd
Original Assignee
Shanghai Deer Biotechnology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Deer Biotechnology Co ltd filed Critical Shanghai Deer Biotechnology Co ltd
Publication of CN113156018A publication Critical patent/CN113156018A/zh
Application granted granted Critical
Publication of CN113156018B publication Critical patent/CN113156018B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/26Conditioning of the fluid carrier; Flow patterns
    • G01N30/28Control of physical parameters of the fluid carrier
    • G01N30/34Control of physical parameters of the fluid carrier of fluid composition, e.g. gradient
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8675Evaluation, i.e. decoding of the signal into analytical information
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Engineering & Computer Science (AREA)
  • Library & Information Science (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明公开了一种肝胆疾病诊断模型的建立方法,包括数据预处理阶段、ROC分析阶段、两两组合建模阶段、多物质组合推导阶段、最佳模型获取阶段。本发明可以有效地诊断出肝胆疾病,降低肝癌和胆管癌漏检率,非常有利于肝癌和胆管癌的早诊早治,对于改善肝癌和胆管癌预后,降低肝癌和胆管癌的死亡率有很大帮助,具有良好的临床使用和推广价值。在实际应用中,可以按照本发明建模方法选取更多的样本和更多的代谢物组合进行建模,增加模型的准确度。

Description

一种肝胆疾病诊断模型的建立方法及诊断系统
技术领域
本发明属于医药诊断技术领域,涉及一种肝胆疾病诊断模型的建立方法及诊断系统。
背景技术
肝脏是人体最重要的代谢器官,它不仅是人体内源性代谢物(氨基酸、糖类、脂类等)最重要的代谢场所,而且还是人生命周期中所暴露的上百万种外源性毒物最主要的解毒器官。许多因素(例如:高脂、高糖、酒精、化学毒物、肝炎病毒等)会导致健康的肝脏受损,进而发展成为肝炎、肝硬化和肝癌。随着肝病的进展,肝脏会出现不同的代谢表型,根据代谢表型的不同将肝脏的健康状态划分成了四个层级,0期(Phase 0):健康肝(healthyliver);1期(Phase 1):非酒精性脂肪肝(non-alcoholic fatty liver disease,NAFLD)/非酒精性脂肪肝炎(nonalcoholic steatohepatitis,NASH)/酒精性肝病(alcoholicliver disease,ALD)/病毒性肝炎(viral hepatitis);2期(Phase 2):肝硬化(cirrhosis);3期(Phase 3):肝细胞型肝癌(hepatocellular carcinoma,HCC)/胆管细胞型肝癌(cholangiocarcinoma,CCA)。大量的研究表明,肝病进程中,肝脏的代谢会出现明显的变化,这种代谢表型变化主要包含两个方面,即:能量代谢重塑(脂肪酸的β-氧化、线粒体呼吸和胞质糖酵解)和核心代谢表型产生(血清溶血卵磷脂下降、血清和尿液胆汁酸含量上升)。
诊断标志物的筛选是一个富有挑战性的工作。代谢物(分子量小于1000的内源性小分子)作为生命活动最下游层级(基因→RNA→蛋白→代谢物),是最接近生物表型的物质,由于信号传导的“级联放大”效应,基因层面的微小变化会导致代谢物表达水平的较大波动,因此代谢物作为诊断标志物具有灵敏度高的天然优势。但是,代谢物作为诊断标志物也有自身的缺陷,那就是特异性较差,因为代谢物的组织特异性不如蛋白的组织特异性高,因此不同的疾病可能会导致相同的代谢物变化。但是,溶血卵磷脂和胆汁酸的合成基本上都在肝细胞中进行,因此,肝脏的病变会直接影响这两类代谢物的表达水平,筛选这两类代谢物中的几个物质作为肝病进程的诊断标志物应该具备很好的灵敏度和特异性。
代谢物作为诊断标志物在临床上已有一些应用,如:葡萄糖作为糖尿病的诊断标志物;苯丙酮酸作为苯丙酮尿症的诊断标志物;肌酐和尿素作为肾功能的诊断标志物;肌氨酸作为前列腺癌的诊断标志物等。但与蛋白类的诊断标志物(如肿瘤标志物:癌胚抗原(carcino-embryonic antigen,CEA)、甲胎蛋白(α-fetoprotein,AFP)、CA19-9、CA125、PSA等,肝功能标志物:ALT、AST等,肾功能标志物:尿β2-微球蛋白、尿白蛋白、尿免疫球蛋白G等)相比,总体来说要少得多,有待进一步开发。目前,用于肝病临床诊断的蛋白类标志物主要有两类:(1)肝功能标志物:ALT、AST;(2)肝癌标志物:AFP。肝功能指标(ALT、AST)反映的是肝脏作为主要代谢解毒器官的功能状态,并非反应肝脏的病变水平;而肝癌标志物AFP主要用于肝癌的诊断和疗效评价指,虽应用广泛,但仍存在许多缺陷,如:(1)对于早期肝癌诊断的灵敏度较差,许多早期肝癌患者血清AFP含量很低(<20μg/L),假阴性率约为30%;(2)特异性不够,妊娠、胚胎癌如睾丸癌、卵巢癌和极少数胃、胰、胆管、结肠直肠癌也可升,此外其它肝病如肝炎、肝硬化等也会导致AFP升高,因此;血清AFP作为肝细胞癌的诊断标志物,其准确率为60-70%。基于肝病核心代谢表型变化,筛选不同于ALT、AST、AFP等临床常用指标的新标志物作为补充是十分必要和有意义的。
现代分离检测技术的飞速发展,尤其是色谱-质谱联用技术的不断升级以及大数据算法的不断完善,为代谢物的高通量分析提供了可能。非靶向代谢组学(Untargetedmetabolomics)技术就是利用气相色谱-质谱联用技术(GC-MS)和/或液相色谱-质谱联用技术(LC-MS)对生物样本(细胞、组织、体液等)的代谢组(分子量小于1000的内源性代谢小分子)进行全覆盖分析,然后结合化学计量学的方法筛选不同样本组间的差异表达代谢物,图1所示的结果就是
Figure GDA0003877907540000021
等根据大量已经报道的肝病非靶向代谢组学研究结果总结出来的示意图。然而,想要将重要的差异代谢物开发成诊断标志物,还有许多工作要做,主要包括:(1)非靶向代谢组学检测给出的代谢物是相对定量的结果(一般以质谱峰面积表示),对于同批次检测的样本具有可比性,但对于不同批次间的样本就不具有可比性,因此要想将重要的差异代谢物开发成诊断标志物,必须利用该代谢物的标准品开发其定量检测的方法,这样可以给出代谢物在样本中的绝对浓度信息,使得不同批次的样本具有可比性;(2)需要利用临床大样本进行验证,哪些差异代谢物作为诊断指标时灵敏度和特异性高(保留),哪些差异代谢物的灵敏度和特异性低(舍弃),此外还要兼顾诊断标志物是否具有好的稳定性、可检测性等。
发明内容
本发明的目的是利用预先建立好的LC-MS/MS方法,定量检测临床大样本(血清和尿液)中目标代谢物的含量,筛选诊断标志物,并计算出诊断标志物的阈值(Cut off)值,然后利用筛选出来的诊断标志物评价肝脏的健康水平,跟踪肝病进展,结合AFP进行肝癌早期预警。
本发明提供了一种用于肝胆疾病诊断的代谢标志物,所述代谢标志物包括血清代谢标志物、尿液代谢标志物。
所述血清代谢标志物包括EPA,AA,DHA,TCDA,DCA,GCA,TCA,GCDA,GCDCA,GDCA,CDCA,LPC16-0,LPC18-0,LPC18-1,LPC20-0等中的单个或任意组合;优选地,所述血清代谢标志物为血清标志物组合(GCDA+CDCA+LPC18-0+AA)。
所述尿液代谢标志物包括LPC16-0,LPC18-0,LPC18-1,AA,GCDA,GCA,GCDCA,TCDA,TCA等中的单个或任意组合;优选地,所述尿液代谢标志物为尿液标志物组合(LPC16-0+TCDA+GCA)。
本发明还提供了一种用于肝胆疾病诊断的代谢标志物的筛选方法和诊断模型,具体包括以下步骤:
(1)数据预处理阶段:将基于LC-MS/MS技术定量检测血清和尿液中重要靶标代谢标志物的含量值和疾病分型输入到R3.6.1分析软件中进行空置填充,疾病分型与表达量匹配操作,为后续筛选流程提供标准的分析格式;
(2)ROC分析阶段:根据疾病分型对每个代谢物进行受试者工作特征曲线(ROC)分析并获取每个代谢物在不同疾病分型情况下的AUC值,为后续推导多个代谢物组合提供依据;
(3)两两组合建模阶段:提取两两代谢物的数据集,并将数据集进行logistic回归运算后分为训练集与测试集,通过训练集形成评估模型,使用评估模型对测试集进行验证,获得模型准确率;
(4)多物质组合推导阶段:根据单代谢物验证及两两组合建模阶段结果,通过推导出符合要求的代谢物组合进行代建模,减少对所有代谢物组合运算量(当代谢物数量n=15个时,代谢物组合的运算量达到327670次,且随着代谢物个数n的增加,其代谢物组合的数量会呈指数增加);所述要求为predictAUC值大于0.95;对于获得的代谢物组合和疾病分型分为训练集及测试集,通过训练集形成评估模型,使用评估模型对测试集进行验证获得模型准确率;
(5)最佳模型获取阶段:对于上述流程,不同的疾病分型将有不同的优选代谢物组合,对于所有结果进行汇总统计和韦恩图分析,通过对代谢物数量、AUC值和区分疾病分型能力选出最佳模型。
步骤(1)中,所述血清靶标代谢标志物为15个,分别为:EPA,AA,DHA,TCDA,DCA,GCA,TCA,GCDA,GCDCA,GDCA,CDCA,LPC16-0,LPC18-0,LPC18-1,LPC20-0,含量值见图3。
步骤(1)中,所述尿液靶标代谢标志物为9个,分别为:LPC16-0,LPC18-0,LPC18-1,AA,GCDA,GCA,GCDCA,TCDA,TCA,含量值见图4。
步骤(2)-(5)中优选采用R3.6.1软件和自编程算法进行基于logistic模型的受试者工作特征曲线(receiver operating characteristic curve,ROC曲线)和诊断模型准确性计算。
其中,AUC值的计算公式如下:
Figure GDA0003877907540000041
M为正类样本的数目;
N为负类样本的数目;
rank为表达值从大到小排列后的序列值;
Figure GDA0003877907540000042
为正类样本的rank加和。
其中,用于logistic回归分析的具体算法公式如下:
Figure GDA0003877907540000043
常规项:α表示自变量Xj为0时个体发病与不发病概率之比的自然对数。
回归系数:βj(j=1,2,···,m)表示自变量Xj改变一个单位时Logit(P)的改变量。
其中,受试者工作特征曲线(ROC)分析如下:
ROC曲线图是反映敏感性与特异性之间关系的曲线。横坐标X轴为1-特异性,也称为假阳性率(误报率),X轴越接近零准确率越高;纵坐标Y轴称为敏感度,也称为真阳性率(敏感度),Y轴越大代表准确率越好。根据曲线位置,把整个图划分成两部分,曲线下方部分的面积被称为AUC(Area Under Curve),用来表示预测准确性,AUC值越高,也就是曲线下方面积越大,说明预测准确率越高。曲线越接近左上角(X越小,Y越大),预测准确率越高。具体算法原理如图17所示:
其中,假阳性率(fp rate):原本是错的预测为对的比例(越小越好,0为理想状态),
Figure GDA0003877907540000051
真阳性率(tp rate):原本是对的预测为对的比例(越大越好,1为理想状态),
Figure GDA0003877907540000052
精确率(precision):预测为对的当中,原本为对的比例(越大越好,1为理想状态),
Figure GDA0003877907540000053
召回率(recall):原本为对的当中,预测为对的比例(越大越好,1为理想状态),
Figure GDA0003877907540000054
F度量(F-measure):是对准确率和召回率做一个权衡(越大越好,1为理想状态,此时precision为1,recall为1);
Figure GDA0003877907540000055
判对准确率(accuracy):预测对的(包括原本是对预测为对,原本是错的预测为错两种情形)占整个的比例(越大越好,1为理想状态),
Figure GDA0003877907540000056
TP=正类被预测成正类数;FP=负类被预测成正类数;TN=负类被预测成负类数;FN=正类被预测成负类数;N=预测成负类数;P=预测成正类数
其中,多物质组合推导代建模算法公式如下:
AUC(A+B+C+...+N)≤predictAUC(A+B+...+N)
=AUC(A+B)+AUC(B+C)-AUC(B)+...+AUC(B+N)-AUC(B)
即:预估A,B,...,N个代谢物组合的AUC,选出A,B,...,N两两组合下最大的组合,如果A+B组合最大情况下,选出与其他组合最小的AUC组合,并减去相应组合对应代谢物的AUC值。
为实现n个代谢物(n≥4)在多疾病组诊断中的最优组合筛选,本发明基于R3.6.1软件设计了自编程的算法,流程框图如图18所示。
步骤(4)中,所述血清的最佳的代谢标志物组合数量为4。
步骤(4)中,所述尿液的最佳的代谢标志物组合数量为3。
步骤(5)中,所述血清的代谢标志物组合为(GCDA+CDCA+LPC18-0+AA)。
步骤(5)中,所述尿液的代谢标志物组合为(LPC16-0+TCDA+GCA)。
步骤(5)中,所述血清的代谢物组合(GCDA+CDCA+LPC18-0+AA)用于判别分析健康组(N)-肝癌组(HC)的阈值为0.83,判别分析健康组(N)-胆管癌(CC)的阈值为0.812,判别分析肝癌组(HC)-胆管癌组的阈值为0.5,即:GCDA、CDCA、LPC18-0和AA四个代谢物血清浓度值通过logistic回归运算后得到新的综合变量值,定为a,当a≥0.83,即诊断为正常组,当0.5<a<0.812诊断为肝癌组,当0<a≤0.5时诊断为胆管癌组。
基于以上方法,本发明还提出了一种肝胆疾病诊断系统,包括血清/尿液采集模块、分析模块、输出模块;其中,分析模块分别与血清/尿液采集模块、输出模块连接;所述分析模块中设有上述方法建立的肝胆疾病诊断模型;所述血清/尿液采集模块采集到样本后输入分析模块进行分析,所述分析模块通过所述输出模块输出诊断结果。
本发明还提供了所述代谢标志物在作为肝胆疾病诊断、肝胆疾病疗效评估、肝胆疾病预后干预标志物中的应用。
本发明还提供了所述代谢标志物作为生物标志物在制备肝胆疾病诊断产品和/或肝胆疾病疗效评估产品和/或肝胆疾病预后干预产品中的应用。
本发明还提供了所述的代谢标志物和AFP作为联合标志物在作为肝胆疾病诊断、肝胆疾病疗效评估、肝胆疾病的预后干预标志物中的应用。
本发明还提供了所述的代谢标志物和AFP作为联合标志物在制备肝胆疾病诊断产品和/或肝胆疾病疗效评估产品和/或肝胆疾病预后干预产品中的应用。
本发明还提供了所述代谢标志物的特异性检测试剂在制备肝胆疾病诊断产品和/或肝胆疾病疗效评估产品和/或肝胆疾病预后干预产品中的应用。
本发明还提供了所述代谢标志物和AFP的特异性联合检测试剂在制备肝胆疾病诊断产品和/或肝胆疾病疗效评估产品和/或肝胆疾病预后干预产品中的应用。
本发明还提供了一种肝胆疾病的诊断产品,所述产品包括上述代谢标志物或其组合的特异性检测试剂;或所述产品包括所述代谢标志物和AFP的特异性联合检测试剂。
本发明还提供了一种肝胆疾病疗效评估产品,所述产品包括上述代谢标志物或其组合的特异性检测试剂;或所述产品包括所述代谢标志物和AFP的特异性联合检测试剂。
本发明还提供了一种肝胆疾病预后干预产品,所述产品包括上述代谢标志物或其组合的特异性检测试剂;或所述产品包括所述代谢标志物和AFP的特异性联合检测试剂。
本发明中,所述肝胆疾病相关产品(肝胆疾病诊断产品、肝胆疾病疗效评估产品、肝胆疾病预后干预产品)包括试剂盒、试纸、固体支持体;所述固体支持体包括阵列、微阵列或蛋白质阵列。
本发明中,所述肝胆疾病的诊断产品用于检测人体中血清代谢标志物、尿液代谢标志物的水平,用于监测肝胆疾病的进展及肝癌和胆管癌的早期诊断。
本发明中,所述肝胆疾病的诊断产品含有特异性识别所述代谢标志物(包括血清代谢标志物、尿液代谢标志物中的单个或任意组合)的试剂。
本发明中,所述肝胆疾病的诊断产品含有标准品或阳性对照。
本发明中,所述肝胆疾病包括肝炎、肝硬化、肝癌、胆管癌等。
本发明还提供了一种肝胆疾病的诊断模型在诊断肝胆疾病、疗效评估、预后干预中的应用。
本发明的有益效果在于:本发明的代谢标志物组合可以有效地诊断出肝胆疾病,降低肝癌和胆管癌漏检率,非常有利于肝癌和胆管癌的早诊早治,对于改善肝癌和胆管癌预后,降低肝癌和胆管癌的死亡率有很大帮助,具有良好的临床使用和推广价值。在实际应用中,可以按照本发明建模方法选取更多的样本和更多的代谢物组合进行建模,增加模型的准确度。
附图说明
图1为优化后的标品检测图,其中,A为负离子模式下的超高效液相色谱串联质谱检测图;B为正离子模式下的超高效液相色谱串联质谱检测图。
图2为靶标代谢物含量在血清和尿液QC的RSD均小于15%,其中,A为4个溶血卵磷脂和3个多不饱和脂肪酸在血清QC样本中的含量;B为8个胆汁酸在血清QC样本中的含量;C为3个溶血卵磷脂在尿液QC样本中的含量;D为5个胆汁酸在尿液QC样本中的含量。
图3为15个目标代谢物在不同组临床血清样本中的含量。
图4为9个目标代谢物在不同组临床尿液样本中的含量。
图5为筛选流程图。
图6为利用血清的诊断指标进行判别分析时,不同诊断组合物数量对应的ROC曲线下面积排序。
图7为血清的正常组和不同疾病组诊断组合物的韦恩图.
图8为血清的不同疾病组诊断组合物的韦恩图。
图9为血清的8个对比组诊断组合物的韦恩图。
图10为利用尿液的诊断指标进行判别分析时,不同诊断组合物数量对应的ROC曲线下面积排序。
图11为尿液的正常组和不同疾病组诊断组合物的韦恩图。
图12为尿液的不同疾病组诊断组合物的韦恩图。
图13为尿液的8个对比组诊断组合物的韦恩图。
图14为健康组和疾病组之间,血清标志物组合、AFP以及二者联合的诊断能力比较。
图15为疾病组之间,血清标志物组合、AFP以及二者联合的诊断能力比较。
图16为诊断准确性考察。
图17为ROC分析的原理图;
TP=正类被预测成正类数;FP=负类被预测成正类数;TN=负类被预测成负类数;FN=正类被预测成负类数;N=预测成负类数;P=预测成正类数。
图18为代谢标志物的筛选及诊断模型流程框图。
具体实施方式
结合以下具体实施例对本发明作进一步详细说明,实施本发明的过程、条件、试剂、实验方法等,除以下专门提及的内容之外,均为本领域的普遍知识和公知常识,本发明没有特别限制内容。
实施例1:肝胆疾病诊断标志物的筛选
1.研究对象
本研究的临床血清和尿液样本来自于3个独立医学中心,具体样本信息如表1。
表1临床血清和尿样信息
Figure GDA0003877907540000081
Figure GDA0003877907540000091
2.血清和尿液样本中目标代谢物的超高效液相色谱串联质谱分析
2.1靶标代谢物的信息
从肝病的核心代谢表型中选取了15个重要的差异代谢物作为此次筛选的靶标代谢物,详细信息见表2。
表2靶标代谢物和内标信息
Figure GDA0003877907540000092
*标记的代谢物作为内标使用
2.2仪器和试剂
超高效液相色谱仪串联三重四极杆,色谱系统的型号:ACQUITYUPLC,Waters公司;质谱系统的型号(AB5500,AB Sciex公司)。漩涡振荡器(TYXH-I,上海汗诺仪器有限公司);台式高速冷冻离心机(TGL-16MS,上海卢湘仪离心机仪器有限公司)
甲醇、水、乙腈均为质谱纯(上海安谱实验科技股份有限公司)
氯仿为分析纯(国药集团)
标准品(Sigma-Aldrich公司)
2.3样本前处理
10μL血清加入90μL纯水,加入300μL蛋白沉淀剂(甲醇:乙腈=2:1,v/v)(含1.6μg/mL LPC17-0和16ng/mL GCA-C13)。涡旋1分钟,-20℃静置20分钟,4℃离心10分钟,取150μL上清装入LC-MS进样小瓶中,-80℃放置,待测。
50μL尿液加入150μL蛋白沉淀剂(甲醇:乙腈=2:1,v/v)(含64ng/mL LPC17-0和16ng/mL GCA-C13),涡旋1分钟,-20℃静置20分钟,4℃离心10分钟,取150μL上清装入LC-MS进样小瓶中,-80℃放置,待测。
血清的质控样本(QC)由血清样本混合而成,尿样的质控样本由尿液样本混合而成。质控样本的前处理方法与对应类型的检测样本前处理方法完全相同。
2.4样本检测
将处理后的所有血清和尿样样本作为分析样本,同类型的样本同批次上机,打乱顺序后随机化排序进样,以排除进样顺序带来的组间差异。每隔50个分析样本加入一个质量控制样品。
分析检测条件如下:
色谱条件:色谱柱BEH C18色谱柱(2.1×50mm2,1.7μm,Waters公司)
流动相:A相,水(含0.1%甲酸);B相,乙腈(含0.1%甲酸)
色谱梯度:10–10%B,0–0.2分钟;10–55%B,0.2–3.5分钟;55–80%B,3.5–6分钟;80–100%B,6–6.5分钟;100–100%B,6.5–8分钟,100-10%B,8–8.3分钟;10–10%B,8.3–10分钟。
流速0.6mL/min;柱温:45℃;进样量:3μL
质谱条件:电喷雾离子源,正负离子模式切换。离子源温度:120℃;锥孔载气流速:40L/h;脱溶剂气温:400℃;载气流速:650L/h;正负离子的毛细管电压分别为:+5.5kV和-5.5kV;入口电位和碰撞电位均为10V.去簇电压和碰撞能需要针对单个标准品进行优化选择,详见表3,优化后的标品检测图见附图1,多不饱和脂肪酸和胆汁酸在负离子模式下被检测,溶血卵磷脂在正离子模式下被检测,待测物在当前的色谱质谱条件下,分离度和质谱响应都很好,可以进行后续正式样本的检测分析。
2.5目标代谢物在血清和尿液中的定量结果
根据上述的前处理方法和分析检测条件,本发明检测了所有临床样本的目标代谢物含量,并利用质控样本(QC)中目标代谢物含量的相对标准偏差(RSD)值来评价测试过程的稳定性及数据的可靠性,结果显示,靶标代谢物含量在血清和尿液QC的RSD均小于15%(见附图2),说明整个分析过程稳定可靠。将不同组样本中目标代谢物的含量以箱体图展示,见附图3和附图4。在肝病进展过程中(N→HS→CH→HC/CC),血清溶血卵磷脂和多不饱和脂肪酸的含量的趋势是相同的,均为先下降后逐渐稳定;血清胆汁酸(CDCA,GCDA,GCDCA,GDCA,TCDA)的含量在肝病进展过程中(N→HS→CH→HC/CC)呈现先上升后下降的趋势,在肝硬化组(CH)其含量达到峰值;血清胆汁酸GCA和TCA的趋势一致,在肝病进展中呈现先上升,后下降,再上升的双高峰趋势,其中CH组和CC组的含量均比其它组的含量高。血清胆汁酸DCA在HS、CH、HC三种中的含量差异不大,且略低于健康组(N),在CC组中的含量最低。在肝病进展过程中(N→HS→CH→HC/CC),尿液溶血卵磷脂和多不饱和脂肪酸AA的含量的趋势是相同的,均为逐渐上升的趋势;尿液胆汁酸基本上都呈现先上升后下降的趋势,其中肝炎组(HS)尿液胆汁酸的含量最高。
表3优化的母、子离子对和相关的质谱检测参数
Figure GDA0003877907540000121
3.诊断标志物的筛选
3.1筛选流程
筛选流程图如附图5,首先基于LC-MS/MS技术定量检测来自于2个独立医学中心的5种类型临床样本(N:健康人,HS:肝炎,CH:肝硬化,HC:肝癌,CC:胆管癌)血清和尿样中15种重要靶标代谢物的含量,采用R3.6.1软件进行基于logistic模型的受试者工作特征曲线(receiver operating characteristic curve,ROC曲线)计算,筛选最佳的代谢物组合数量。通过不同组间诊断标志物组合的韦恩图分析,筛选到血清和尿液中最佳的诊断物组合。将这个最优的诊断物组合的诊断能力与临床常用的诊断指标AFP进行比较,然后利用另一批临床样本(健康人、肝癌病人和胆管癌病人的血清)进行诊断标志物组合的诊断准确性检验。
3.2筛选结果
诊断标志物可以是单个代谢物,也可以是由多个代谢物组成的代谢物组,在此案例中,采用R3.6.1软件进行基于logistic模型的受试者工作特征曲线(receiveroperating characteristic curve,ROC曲线)计算,获得15个代谢物所有组合的ROC曲线下面积(the area under the ROC curve,AUC)。以血清的代谢物组合数为横坐标,以血清的代谢物组合数所对应的AUC值为纵坐标作图(见附图6),可以发现血清的最优的代谢物组合数量,即:增加组合中代谢物的数量时模型准确度不再上升。结果表明:4个代谢物的组合是最优的。为了筛选能区分不同临床样本分组的最优诊断组合,本发明将寻找不同分组诊断组合物的交集。正常组和不同疾病组诊断组合物的韦恩图见附图7(AUC>0.95,代谢物数目=4);不同疾病组诊断组合物的韦恩图见附图8(AUC>0.75,代谢物数目=4);8个对比组诊断组合物的韦恩图(正常组vs疾病组的AUC>0.95,疾病组vs疾病组的AUC>0.75,代谢物数目=4)见附图9。8个对比组诊断组合物的交集有2个,这2个组合在不同对比组中的AUC值见表4。诊断标志物组合1(GCDA+CDCA+LPC18-0+AA)略优于诊断标志物组合2(TCDA+CDCA+LPC18-0+AA)。
尿液的诊断标志物组筛选方法与上述血清样本的筛选方法相同,以尿液的代谢物组合数为横坐标,以尿液的代谢物组合数所对应的AUC值为纵坐标作图(见附图10),可以发现最优的尿液的代谢物组合数量为3。正常组和不同疾病组诊断组合物的韦恩图见附图11(AUC>0.9,代谢物数目=3);不同疾病组诊断组合物的韦恩图见附图12(AUC>0.7,代谢物数目=3);8个对比组诊断组合物的韦恩图(正常组vs疾病组的AUC>0.95,疾病组vs疾病组的AUC>0.75,代谢物数目=3)见附图13。尿液的8个对比组诊断组合物的交集有3个,这3个组合在不同对比组中的AUC值见表5。综合来看,尿液中最优的诊断标志物组为LPC16-0+TCDA+GCA。
表4.两个组合物在血清样本不同对比组中的AUC值
Figure GDA0003877907540000141
表5.三个组合物在尿液样本不同对比组中的AUC值
Figure GDA0003877907540000142
3.3诊断标准物组合与AFP诊断能力的比较
AFP目前是肝癌临床诊断最常用的标志物,通过ROC分析(见附图14、15)和AUC值的比较(见表6),本发明可以发现在所有的判别分析组里面,筛选出来的诊断标志物组:(GCDA+CDCA+LPC18-0+AA)的AUC值均大于AFP的AUC值,说明诊断组合物(GCDA+CDCA+LPC18-0+AA)的诊断能力优于AFP。在AFP<20μg/L的样本中,(GCDA+CDCA+LPC18-0+AA)的诊断优势更加明显。在AFP≥20μg/L的样本中,肝癌组(HC)和其它组疾病进行判别分析时,AFP的AUC值大于诊断组合物(GCDA+CDCA+LPC18-0+AA)的AUC值,而在除HC组的其它疾病组的判别分析中,诊断组合物(GCDA+CDCA+LPC18-0+AA)的AUC值大于AFP的AUC值。在所有样本中或在AFP<20μg/L的样本中,AFP联合诊断标志物组并不能显著增加诊断能力,诊断标志物组可独立用于诊断,无需与AFP联合,但在AFP≥20μg/L的样本中,AFP联合诊断标志物组能显著增加不同疾病组之间的判别分析能力。
表6.诊断标志物组与AFP的诊断能力比较
Figure GDA0003877907540000151
Figure GDA0003877907540000161
实施例2:使用4个血清代谢标志物进行肝胆癌症诊断模型的构建和诊断准确性测试
本实施例的研究对象来自于3个独立医学中心的60例肝癌和60例胆管癌血清样本以及60例体检正常的健康对照血清样本,与特征筛选样本同一来源。本发明实施例2的检测分析方法与本发明实施例1的相同。以4个血清代谢组合(GCDA+CDCA+LPC18-0+AA)为诊断特征,本发明实施例1中754例(健康340例,肝癌220例,胆管癌194例)样本作为训练集,本发明实施例2中180例样本作为测试集,考察筛选出来的血清诊断标志物组合(GCDA+CDCA+LPC18-0+AA)对肝癌和胆管癌诊断准确性,结果如附图16和表7所示,血清诊断标志物组合(GCDA+CDCA+LPC18-0+AA)对健康组和肝癌组,以及健康组和胆管癌组具有很好的判别分析能力,诊断的准确性分别达到了91.7%和86.7%,远高于AFP做为肝癌诊断标志物的准确性(60-70%)。因此,本发明的代谢标志物组合可以有效地诊断出肝胆疾病,降低肝癌和胆管癌漏检率,非常有利于肝癌和胆管癌的早诊早治,对于改善肝癌和胆管癌预后,降低肝癌和胆管癌的死亡率有很大帮助,具有良好的临床使用和推广价值。在实际应用中,可以按照本发明建模方法选取更多的样本和更多的代谢物组合进行建模,增加模型的准确度。
表7.使用血清诊断标志物组合(GCDA+CDCA+LPC18-0+AA)对肝癌和胆管癌诊断准确性考察
Figure GDA0003877907540000171
上述实施例的说明只是用于理解本发明的方法及其核心思想。应当指出,对于本领域的普通技术人员来说,在不脱离本发明原理的前提下,基于本发明思想的其他实施方式也将落入本发明权利要求的保护范围内。

Claims (6)

1.一种肝胆疾病诊断模型的建立方法,其特征在于,包括以下步骤:
步骤1,数据预处理阶段:对基于LC-MS/MS技术定量检测血清和/或尿液中靶标代谢标志物的含量值和疾病分型进行空置填充、疾病分型与表达量匹配操作,为后续筛选流程提供标准的分析格式;
步骤2,ROC分析阶段:根据疾病分型对每个代谢物进行受试者工作特征曲线分析,获取每个代谢物在不同疾病分型情况下的AUC值,为后续推导多个代谢物组合提供依据;所述AUC值的计算公式如下:
Figure FDA0004086530240000011
其中,M为正类样本的数目;N为负类样本的数目;rank为表达值从大到小排列后的序列值;
Figure FDA0004086530240000013
为正类样本的rank加和;
步骤3,组合建模阶段:提取仅血清或仅尿液中的代谢物作为数据集,并将数据集进行运算后分为训练集与测试集;通过训练集形成评估模型,使用评估模型对测试集进行验证,获得模型准确率;
所述数据集通过以下公式运算后分为训练集与测试集:
Figure FDA0004086530240000012
其中,常规项:α表示自变量Xj为0时个体发病与不发病概率之比的自然对数;回归系数:βj(j=1,2,···,m)表示自变量Xj改变一个单位时Logit(P)的改变量;
步骤4,多物质组合推导阶段:根据单个代谢物验证及组合建模阶段结果,通过推导出符合要求的代谢物组合进行代建模,减少对所有代谢物组合运算量;其中,通过R3.6.1软件进行基于logistic模型的ROC计算,基于多物质组合推导代建模算法公式,以血清/尿液代谢物组合数为横坐标,以血清/尿液代谢物组合数所对应的AUC值为纵坐标作图,得到最优的代谢物组合数量;
对于获得的代谢物组合和疾病分型分为训练集及测试集,通过训练集形成评估模型,使用评估模型对测试集进行验证获得模型准确率;所述多物质组合推导代建模算法公式如下:
AUC(A+B+C+...+N)≤predictAUC(A+B+...+N)
=AUC(A+B)+AUC(B+C)-AUC(B)+...+AUC(B+N)-AUC(B)
其中,predictAUC(A+B+...+N)为预估A,B,...,N个代谢物组合的AUC;所述要求为predictAUC值大于0.95;
步骤5,最佳模型获取阶段:对于上述步骤4,不同的疾病分型将有不同的优选代谢物组合,对优选代谢物组合集进行汇总统计和韦恩图分析,通过对代谢物数量、AUC值和区分疾病分型能力选出最佳模型;其中,通过正常组和不同疾病组诊断组合物的韦恩图,以及不同疾病组诊断组合物的韦恩图的交集筛选获得代谢物组合。
2.如权利要求1所述的模型建立方法,其特征在于,步骤1中,血清靶标代谢标志物包括:EPA,AA,DHA,TCDA,DCA,GCA,TCA,GCDA,GCDCA,GDCA,CDCA,LPC16-0,LPC18-0,LPC18-1,LPC20-0中的单个或任意组合;和/或,尿液靶标代谢标志物包括:LPC16-0,LPC18-0,LPC18-1,AA,GCDA,GCA,GCDCA,TCDA,TCA中的单个或任意组合。
3.如权利要求2所述的模型建立方法,其特征在于,步骤2中,血清的最佳代谢物组合为GCDA、CDCA、LPC18-0和AA;和/或,尿液的代谢物组合为LPC16-0、TCDA和GCA。
4.如权利要求3所述的模型建立方法,其特征在于,血清的最佳代谢物组合用于判别分析健康组-肝癌组的阈值为0.83,判别分析健康组-胆管癌的阈值为0.81 2,判别分析肝癌组-胆管癌组的阈值为0.5。
5.如权利要求1所述的模型建立方法,其特征在于,所述模型准确率计算公式如下:
Figure FDA0004086530240000021
其中,TP:训练集的诊断标志物权重阈值将测试集进行有无疾病区分,正类被预测成正类数量;TN:训练集的诊断标志物权重阈值将测试集进行有无疾病区分,负类被预测成负类数量;N:测试集总数量。
6.一种肝胆疾病诊断系统,其特征在于,包括血清/尿液采集模块、分析模块和输出模块;其中,
分析模块分别与血清/尿液采集模块、输出模块连接;所述分析模块中设有如权利要求1-5之任一项所述方法建立的肝胆疾病诊断模型;所述血清/尿液采集模块采集到样本后输入分析模块进行分析,所述分析模块通过所述输出模块输出诊断结果。
CN202110458372.9A 2020-05-19 2021-04-27 一种肝胆疾病诊断模型的建立方法及诊断系统 Active CN113156018B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2020104234899 2020-05-19
CN202010423489.9A CN111610262A (zh) 2020-05-19 2020-05-19 一种用于肝胆疾病诊断的代谢标志物

Publications (2)

Publication Number Publication Date
CN113156018A CN113156018A (zh) 2021-07-23
CN113156018B true CN113156018B (zh) 2023-04-07

Family

ID=72204840

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202010423489.9A Pending CN111610262A (zh) 2020-05-19 2020-05-19 一种用于肝胆疾病诊断的代谢标志物
CN202110458372.9A Active CN113156018B (zh) 2020-05-19 2021-04-27 一种肝胆疾病诊断模型的建立方法及诊断系统

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202010423489.9A Pending CN111610262A (zh) 2020-05-19 2020-05-19 一种用于肝胆疾病诊断的代谢标志物

Country Status (1)

Country Link
CN (2) CN111610262A (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112669958B (zh) * 2020-12-08 2022-09-09 河北医科大学第二医院 代谢物作为疾病诊断的生物标志物
CN112666287B (zh) * 2020-12-22 2022-02-15 上海鹿明生物科技有限公司 基于gcmsms高通量分析动物肠道菌群代谢物的方法及应用
CN112951332A (zh) * 2021-02-25 2021-06-11 北京博富瑞基因诊断技术有限公司 一种基于aGVHD biomarker的重度肠道aGVHD模型的方法
CN114894926A (zh) * 2022-04-27 2022-08-12 天津国科医工科技发展有限公司 基于干血纸片法的胆汁酸检测方法

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050152908A1 (en) * 2003-11-03 2005-07-14 Genenews Inc. Liver cancer biomarkers
CN101003831A (zh) * 2007-01-17 2007-07-25 王贤理 肝胆系统疾病诊断试剂盒
CN102445512A (zh) * 2010-10-09 2012-05-09 中国人民解放军第二军医大学 鉴别肝癌、肝炎或肝硬化的小分子代谢物图谱及其制作方法
CN104812914B (zh) * 2012-09-21 2020-07-24 新加坡保健集团 诊断受试者中的肝癌的方法及诊断肝癌的试剂盒
CN105738626B (zh) * 2014-12-12 2017-07-14 中国科学院大连化学物理研究所 一种新的血清代谢物的组合及其作为肝癌诊断标志物的用途
CN107037144B (zh) * 2016-11-22 2019-11-08 苏长青 一种检测体液中靶标代谢物含量的超高效液相色谱串联质谱方法
CN107945878B (zh) * 2017-11-16 2020-11-27 祁小龙 一种基于放射组学的肝静脉压力梯度计算模型的构建方法
CN109060977A (zh) * 2018-07-13 2018-12-21 深圳市绘云生物科技有限公司 用于肝纤维化和肝硬化诊断的生物标志物和试剂盒及使用方法
CN109239210B (zh) * 2018-09-10 2019-11-19 哈尔滨工业大学 一种胰腺导管腺癌标志物及其筛选方法
CN110577998A (zh) * 2019-01-31 2019-12-17 上海交通大学医学院附属仁济医院 预测肝癌术后早期复发风险分子模型的构建及其应用评估
CN109852714B (zh) * 2019-03-07 2020-06-16 南京世和基因生物技术有限公司 一种肠癌早期诊断和腺瘤诊断标志物及用途
CN109884302B (zh) * 2019-03-14 2023-02-03 北京博远精准医疗科技有限公司 基于代谢组学和人工智能技术的肺癌早期诊断标志物及其应用
CN110646554B (zh) * 2019-09-12 2022-05-13 北京博远精准医疗科技有限公司 基于代谢组学的胰腺癌诊断标志物及其筛选方法和应用
CN110656168B (zh) * 2019-09-30 2023-04-18 中南大学 一种copd早期诊断标志物及其应用

Also Published As

Publication number Publication date
CN111610262A (zh) 2020-09-01
CN113156018A (zh) 2021-07-23

Similar Documents

Publication Publication Date Title
CN113156018B (zh) 一种肝胆疾病诊断模型的建立方法及诊断系统
Zhang et al. Mass spectrometry-based metabolomics in health and medical science: A systematic review
Kenny et al. Novel biomarkers for pre-eclampsia detected using metabolomics and machine learning
Zhang et al. Exploratory urinary metabolic biomarkers and pathways using UPLC-Q-TOF-HDMS coupled with pattern recognition approach
CN108414660B (zh) 一组与肺癌早期诊断相关的血浆代谢小分子标志物的应用
WO2011157655A1 (en) Use of bile acids for prediction of an onset of sepsis
CN113960215B (zh) 用于肺腺癌诊断的标志物及其应用
CN113484511B (zh) 妊娠期糖尿病的孕早期血液脂质生物标志物的筛选及应用
CN111562338B (zh) 透明肾细胞癌代谢标志物在肾细胞癌早期筛查和诊断产品中的应用
US20140148349A1 (en) Metabolite Biomarkers for the Detection of Esophageal Cancer Using NMR
CN113406226B (zh) 一种基于非靶向代谢组学检测gist患者血浆中伊马替尼代谢物的方法
Jain et al. Hemoglobin normalization outperforms other methods for standardizing dried blood spot metabolomics: A comparative study
CN113567585A (zh) 一种基于外周血的食管鳞癌筛查标志物及试剂盒
Issaq et al. Biomarker discovery: Study design and execution
Zhang et al. Preliminary study of urine metabolism in type two diabetic patients based on GC-MS
CN114758719B (zh) 一种结直肠癌预测系统及其应用
CN115684451A (zh) 基于代谢组学的食管鳞癌淋巴结转移诊断标志物及其应用
WO2011080184A1 (en) Use of endogenous metabolites for early diagnosing sepsis
CN109187814A (zh) 一种鉴定肾移植预后生物标记物的方法及其检测试剂盒
CN115575553A (zh) 血清代谢标志物作为检测egfr突变的应用以及检测系统
CN114755422A (zh) 一种结直肠癌检测的生物标志物及其应用
CN117388495B (zh) 用于诊断肺癌分期的代谢标志物的应用及试剂盒
CN111638324B (zh) 一种冠心病诊断生物标记物组合及其应用
CN114137192B (zh) 7-甲基黄嘌呤作为检测靶点在制备2型糖尿病高危个体筛查试剂盒中的应用
CN109342594A (zh) 一种鉴定胃癌生物标记物的方法及其检测试剂盒

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant