CN117589905A - 一种可作为胃癌诊断标志物的脂质代谢物组合及其应用 - Google Patents

一种可作为胃癌诊断标志物的脂质代谢物组合及其应用 Download PDF

Info

Publication number
CN117589905A
CN117589905A CN202311642694.4A CN202311642694A CN117589905A CN 117589905 A CN117589905 A CN 117589905A CN 202311642694 A CN202311642694 A CN 202311642694A CN 117589905 A CN117589905 A CN 117589905A
Authority
CN
China
Prior art keywords
gastric cancer
lipid
phosphatidylethanolamine
lipid metabolite
diagnosis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202311642694.4A
Other languages
English (en)
Other versions
CN117589905B (zh
Inventor
徐瑞华
鞠怀强
蔡泽荣
陈浩杰
莫海瑜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sun Yat Sen University Cancer Center
Original Assignee
Sun Yat Sen University Cancer Center
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sun Yat Sen University Cancer Center filed Critical Sun Yat Sen University Cancer Center
Publication of CN117589905A publication Critical patent/CN117589905A/zh
Application granted granted Critical
Publication of CN117589905B publication Critical patent/CN117589905B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/62Detectors specially adapted therefor
    • G01N30/72Mass spectrometers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8675Evaluation, i.e. decoding of the signal into analytical information

Landscapes

  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Engineering & Computer Science (AREA)
  • Library & Information Science (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明公开了一种可作为胃癌诊断标志物的脂质代谢物组合及其应用。本发明基于从胃癌患者和健康人捐献血清中获得的脂质信息,利用偏最小二乘判别分析、相关性分析和机器学习算法对其中可能与胃癌相关的脂质特征进行选择,获得了由31个脂质组成的可作为胃癌诊断标志物的组合。通过检测31个脂质的相对含量并用线性判别分析(LDA)算法进行运算,可实现对胃癌的诊断。所述脂质组合结合LDA算法构成的诊断模型不仅能将胃癌患者与健康人区分开来,还能将早期胃癌以及传统胃肠道肿瘤相关标记物(CEA、CA199和CA724)均为阴性的胃癌患者与健康人区分开来,具有良好的灵敏度、特异度和准确率,有利于胃癌的无创筛查和诊断。

Description

一种可作为胃癌诊断标志物的脂质代谢物组合及其应用
技术领域
本发明属于生物医药技术领域。更具体地,涉及一种可作为胃癌诊断标志物的脂质代谢物组合及其应用。
背景技术
胃癌是起源于胃黏膜上皮的恶性肿瘤,其发病率和死亡率分别排在全球恶性肿瘤的第五位和第四位。早期胃癌患者的5年总生存率超过90%,而伴有局部或远处转移的晚期胃癌患者的5年总生存率降至5%~30%。因此,早筛查和早诊断对胃癌患者来说十分重要。
目前,可通过检测胃癌标记物、影像学手段或内镜结合病理检查等实现对胃癌的诊断。但现有的胃肠道肿瘤相关的标志物,如CEA、CA199和CA724等用于胃癌诊断时的灵敏度较低;影像学手段在诊断胃癌时容易漏诊;作为当前金标准的内镜结合病理检查因有创、依从性差、昂贵、取材依赖内镜科医生的经验等缺点,不适合推广作为胃癌的筛查方法。因此,当前仍需开发方便快捷的、有效的、可用于早期筛查胃癌的无创检查方法。
液体活检是一种非侵入性的癌症筛查手段,可通过检查血液等体液中的循环肿瘤细胞、循环肿瘤DNA或外泌体等来辅助诊断癌症。液体活检虽是一种革命性的新策略,但仍存在一些挑战,如循环肿瘤DNA计数低、外泌体分离流程复杂和血清抗原准确性低。代谢重编程是癌症的标志之一。脂质作为细胞膜的主要成分、能量供体和信号传导分子,在癌症的发生发展中有着重要作用。与核酸和蛋白质相比,脂质代谢物作为下游分子可以直接反映癌症的表型,并提供人体的实时反馈,有望成为新型高性能的生物标志物。脂质组学技术的发展使技术人员能够揭示肿瘤相关的脂质变化,也提示了脂质代谢在发现肿瘤生物标志物和挖掘抗肿瘤药物靶点方面的应用潜力。
基于液体活检和脂质组学的血清脂质代谢物检测可能是一种有前景的胃癌诊断方案。但目前缺乏深入阐明胃癌的血清脂质代谢模式,并探索脂质在胃癌诊断和预后评估中的潜力的研究。另外,脂质代谢物的种类繁多,利用哪些脂质代谢物能够实现对胃癌的有效诊断仍需探究。
发明内容
本发明针对上述现有技术中存在的问题,提供了一种可作为胃癌诊断标志物的脂质代谢物组合,同时还提供了基于所述脂质代谢物组合,用于胃癌筛查或诊断的试剂盒和装置。
本发明的第一个目的是提供一种可作为胃癌诊断标志物的脂质代谢物组合。
本发明的第二个目的是提供用于检测所述脂质代谢物组合含量的试剂在制备用于胃癌筛查或诊断的产品中的应用。
本发明的第三个目的是提供一种用于胃癌筛查或诊断的试剂盒。
本发明的第四个目的是提供一种用于胃癌筛查或诊断的装置。
本发明上述目的通过以下技术方案实现:
本发明运用非靶向脂质组学,利用超高效液相色谱-质谱技术,从胃癌患者和健康人捐献的血清中获得了丰富的脂质代谢物信息。在此基础上,本发明利用偏最小二乘判别分析(partial least squares-discriminant analysis,PLS-DA)、相关性分析和机器学习的线性判别分析(linear discrimination analysis,LDA)算法对其中可能与胃癌相关的脂质代谢特征进行选择,获得了由31个脂质代谢物组成的脂质代谢特征,通过检测所述31个脂质代谢物的相对含量并输入模型进行运算,即可实现对胃癌的诊断。除可区分胃癌患者和健康人外,利用所述脂质代谢物组合还可以将早期胃癌患者以及传统胃肠道肿瘤相关标记物(CEA、CA199和CA724)均为阴性的胃癌患者与健康人区分开来。因此,本发明请求保护所述脂质代谢物组合及其应用。
本发明提供了一种可作为胃癌诊断标志物的脂质代谢物组合,所述脂质代谢物组合包括溶血磷脂酰胆碱17:0、鞘磷脂30:1;2O|鞘磷脂16:1;2O/14:0、溶血磷脂酰乙醇胺O-16:1、磷脂酰乙醇胺O-44:6|磷脂酰乙醇胺O-24:2_20:4、脂肪酸44:11、溶血磷脂酰胆碱20:0、酰基肉碱14:0、磷脂酰乙醇胺O-37:7|磷脂酰乙醇胺O-15:1_22:6、神经酰胺39:1;2O|神经酰胺17:1;2O/22:0、双磷脂酰甘油8:7|双磷脂酰甘油24:0_18:2_18:2_18:3、磷脂酰胆碱O-35:4、己糖胺神经酰胺42:2;2O|己糖胺神经酰胺18:1;2O/24:1、氧化脂肪酸28:3、磷脂酰胆碱40:0、脂肪酸20:5、磷脂酰乙醇胺O-38:6|磷脂酰乙醇胺O-16:1_22:5、磷脂酰胆碱36:4|磷脂酰胆碱18:2_18:2、溶血磷脂酰胆碱17:1、己糖胺神经酰胺42:2;3O、溶血磷脂酰乙醇胺O-14:1、磷脂酰胆碱38:6|磷脂酰胆碱18:2_20:4、双磷脂酰甘油76:3|双磷脂酰甘油18:0_18:0_18:0_22:3、溶血磷脂酰胆碱18:3、磷脂酰胆碱42:6、磷脂酰乙醇胺36:4|磷脂酰乙醇胺18:2_18:2、酰基肉碱18:1、鞘磷脂38:1;2O、磷脂酰乙醇胺39:6|磷脂酰乙醇胺17:0_22:6、神经酰胺38:1;2O|神经酰胺18:1;2O/20:0、鞘磷脂35:2;2O和溶血磷脂酰乙醇胺18:0。
在本发明所述实施例中,所述脂质代谢物组合由溶血磷脂酰胆碱17:0、鞘磷脂30:1;2O|鞘磷脂16:1;2O/14:0、溶血磷脂酰乙醇胺O-16:1、磷脂酰乙醇胺O-44:6|磷脂酰乙醇胺O-24:2_20:4、脂肪酸44:11、溶血磷脂酰胆碱20:0、酰基肉碱14:0、磷脂酰乙醇胺O-37:7|磷脂酰乙醇胺O-15:1_22:6、神经酰胺39:1;2O|神经酰胺17:1;2O/22:0、双磷脂酰甘油8:7|双磷脂酰甘油24:0_18:2_18:2_18:3、磷脂酰胆碱O-35:4、己糖胺神经酰胺42:2;2O|己糖胺神经酰胺18:1;2O/24:1、氧化脂肪酸28:3、磷脂酰胆碱40:0、脂肪酸20:5、磷脂酰乙醇胺O-38:6|磷脂酰乙醇胺O-16:1_22:5、磷脂酰胆碱36:4|磷脂酰胆碱18:2_18:2、溶血磷脂酰胆碱17:1、己糖胺神经酰胺42:2;3O、溶血磷脂酰乙醇胺O-14:1、磷脂酰胆碱38:6|磷脂酰胆碱18:2_20:4、双磷脂酰甘油76:3|双磷脂酰甘油18:0_18:0_18:0_22:3、溶血磷脂酰胆碱18:3、磷脂酰胆碱42:6、磷脂酰乙醇胺36:4|磷脂酰乙醇胺18:2_18:2、酰基肉碱18:1、鞘磷脂38:1;2O、磷脂酰乙醇胺39:6|磷脂酰乙醇胺17:0_22:6、神经酰胺38:1;2O|神经酰胺18:1;2O/20:0、鞘磷脂35:2;2O和溶血磷脂酰乙醇胺18:0组成。
鉴于通过检测本发明所述脂质代谢物组合中各脂质代谢物的含量,可以实现对胃癌的诊断。因此,本发明请求保护用于检测所述脂质代谢物组合含量的试剂在制备用于胃癌筛查或诊断的产品中的应用。
本发明还提供了一种用于胃癌筛查或诊断的试剂盒,所述试剂盒中含有用于检测所述脂质代谢物组合含量的试剂。
具体地,所述检测脂质代谢物组合含量是指检测所述脂质代谢物组合中的各脂质代谢物的相对含量。
可选地,所述检测试剂为利用非靶向脂质组学,使用超高效液相色谱-质谱技术检测所述脂质代谢物组合中的各脂质代谢物的相对含量所需的试剂,如内标物质、甲醇、氯仿等。
具体地,在获得所述脂质代谢物组合中各脂质代谢物的相对含量后,用线性判别分析算法进行运算,根据运算结果进行判断,若运算结果大于0.5,判断为胃癌;若运算结果小于或等于0.5,判断为健康。
本发明还提供了一种胃癌诊断模型;所述诊断模型是以本发明所述脂质代谢物组合为诊断标志物,通过机器学习的线性判别分析(LDA)算法构建得到。
具体地,本发明基于所述脂质代谢物组合,通过检测已知性质样本(胃癌或者健康)血清中所述脂质代谢物组合中各脂质代谢物的相对含量并输入LDA算法进行运算,构建得到了所述胃癌诊断模型。
具体地,本发明使用caret R package(v 6.0-88)获取LDA算法。从链接(https://github.com/caizerong/GC-LIPID-ML)可直接获取本发明上述胃癌诊断模型(bestLDA.Rds),链接中还包括使用该诊断模型的方法(predict_LDA.R)和说明(README.md)。
具体地,所述机器学习的线性判别分析算法的公式如下:
式中,score.ida(j)表示第j个样本通过线性判别分析计算后的分数,α0是常数,αk代表代谢物k的参数,metabolitek,j代表第j个样本中代谢物k经标准化后的相对含量,代谢物k是上述所述的31种脂质的其中一种。
具体地,第j个样本中代谢物k标准化后的相对含量的单位为μg/mL;score.lda的范围为0~1。
本发明还提供了一种用于胃癌筛查或诊断的装置,包括脂质代谢物含量检测部、分析部和判断部;其中,所述脂质代谢物含量检测部用于检测所述脂质代谢物组合中的各脂质代谢物在样本中的含量;所述分析部用于在获得所述脂质代谢物组合中各脂质代谢物的含量后,用线性判别分析算法进行运算;所述判断部用于针对线性判别分析算法的运算结果进行判断;若运算结果大于0.5,判断为胃癌;若运算结果小于或等于0.5,判断为健康。
具体地,所述脂质代谢物含量检测部包括超高效液相色谱和质谱技术所需仪器,通过超高效液相色谱-质谱技术非靶向检测所述脂质代谢物组合中各脂质代谢物的含量。
具体地,所述脂质代谢物的含量为相对含量。
具体地,检测所用内标为:酰基肉碱C16:0-d3、棕榈酸-d3、神经酰胺d18:1-d7/18:0、溶血磷脂酰胆碱17:0-d5、磷脂酰胆碱17:0/22:4-d5、磷酸乙醇胺17:0/17:0、鞘磷脂d18:1/15:0-d9和甘油三酯15:0/18:1/15:0-d5。
具体地,本发明所用超高效液相色谱检测仪器为Waters超高效色谱仪。
具体地,本发明所用质谱检测仪器为tripleTOFTM5600plus质谱仪。
此外,也可使用其它色谱、质谱仪器。
具体地,超高效液相色谱检测所用色谱条件为:色谱柱为C8柱;流动相A为含有10mM乙酸铵的3:2(v/v)乙腈/水溶液;流动相B为含有10mM乙酸铵的9:1(v/v)异丙醇/乙腈溶液;流动相流速为0.3mL/min,柱温为60℃,正离子模式进样量5μL,负离子模式进样量为10μL。
质谱检测所用质谱条件为:用电喷离雾子源,用正离子和负离子模式进行扫描分析;正离子模式下离子喷雾电压为5500V,负离子模式下离子喷雾电压为4500V,正离子模式界面加热器温度为500℃,负离子模式界面加热器温度为550℃;离子源气体1、离子源气体2和气帘气在正离子模式下分别设置为50、50和35psi,在负离子模式下分别设置为55、55和35psi;正离子模式和负离子模式下MS扫描范围均为150~1250Da。
采用信息依赖分析方法获得MS/MS片段模式;碰撞能量(CE)设置为30V(正离子模式)和-30V(负离子模式),碰撞能量扩散(CES)均为10V。
具体地,所述分析部包括本发明所述胃癌诊断模型。在获得所述脂质代谢物组合中各脂质代谢物的含量后,用所述模型进行运算。
本发明具有以下有益效果:
本发明基于从胃癌患者和健康人捐献的血清中获得的脂质代谢物信息,利用偏最小二乘判别分析、相关性分析和机器学习算法对其中可能与胃癌相关的脂质代谢特征进行选择,获得了由31个脂质代谢物组成的可作为胃癌诊断标志物的脂质代谢物组合。通过检测所述31个脂质代谢物的相对含量并将其输入基于机器学习的线性判别分析算法构建得到的模型,即可实现对胃癌的诊断。利用所述脂质代谢物组合不仅能将胃癌患者与健康人区分开来,还能将早期胃癌以及传统胃肠道肿瘤相关标记物(CEA、CA199和CA724)均为阴性的胃癌患者与健康人区分开来,具有良好的灵敏度、特异度和准确率,有利于胃癌的无创筛查和诊断,对提高胃癌患者的生存率具有重要意义。
附图说明
图1为训练队列中所有样本的脂质组学检测数据的偏最小二乘判别分析(PLS-DA)结果。
图2为训练队列中所有样本的所有脂质代谢物两两之间的相关性分析结果。
图3为PLS-DA分析后基于成分1和成分2得到每个代谢物的变量重要性投影(variable importance projection,VIP)分数,VIP分数最高的50个代谢物两两之间的相关性分析结果。
图4为10种机器学习算法在训练队列中进行10折交叉验证的准确率结果。
图5为LDA算法辅助的血清脂质代谢特征(serum lipid metabolic signature,SLMS)在训练队列、测试队列、外部验证队列和预测性队列中对胃癌的诊断效能;图中的A~D依次为训练队列、测试队列、外部验证队列和预测性队列的受试者工作特征(receiveroperating characteristic,ROC)曲线和曲线下面积(area under curve,AUC)。
图6为LDA算法辅助的血清脂质代谢特征SLMS在训练队列、测试队列、外部验证队列和预测性队列中对早期胃癌的诊断效能;图中的A~D依次为训练队列、测试队列、外部验证队列和预测性队列的ROC曲线和AUC。
具体实施方式
以下结合说明书附图和具体实施例来进一步说明本发明,但实施例并不对本发明做任何形式的限定。除非特别说明,本发明采用的试剂、方法和设备为本技术领域常规试剂、方法和设备。
除非特别说明,以下实施例所用试剂和材料均为市购。
实施例1胃癌诊断标志物的筛选及胃癌诊断模型的构建
本发明收集了227例胃癌患者和227例健康人捐献的血清(样本均来自中山大学肿瘤防治中心,作为训练队列),利用超高效液相色谱-质谱技术非靶向检测了血清样品中的脂质代谢物的含量。其中,胃癌患者的纳入标准为:组织病理确诊为胃癌的患者;排除标准为:术前进行了新辅助治疗;有其他癌症史;有其他系统疾病。健康捐献者的纳入标准为:18岁以上的体检正常者;排除标准为:有胃癌或者其他系统癌症史。超高效液相色谱-质谱技术非靶向检测脂质代谢物的过程如下:
1、血清样本的预处理:
用促凝管抽取捐献者(空腹状态)血样,待血凝固后,3500rpm离心8min收集上清,将得到的血清样本分装到EP管中,每管500~1000μL,保存于-80℃冰箱内;检测时,用甲醇/氯仿/水两相提取系统提取血清中的脂质成分,配置好含有对应内标的甲醇提取剂;50μL血清中加入450μL加了内标物的甲醇提取剂(内标物质的浓度均为0.4μg/mL)、700μL氯仿和200μL超纯水;所述内标物质的名称及其CAS号如表1所示:
表1.内标物质相关信息
2、超高效液相色谱-质谱技术检测:
采用Waters超高效色谱仪进行脂质分离;色谱柱为C8柱;流动相A为含有10mM乙酸铵的3:2(v/v)乙腈/水溶液;流动相B为含有10mM乙酸铵的9:1(v/v)异丙醇/乙腈溶液;设置流动相流速为0.3mL/min,柱温为60℃,正离子模式进样量5μL,负离子模式进样量为10μL。
用适合定量分析的tripleTOFTM5600plus质谱仪(AB SCIEX)进行质谱检测,质谱条件为:用电喷离雾子源,用正离子和负离子模式进行扫描分析;正离子模式下离子喷雾电压为5500V,负离子模式下离子喷雾电压为4500V,正离子模式界面加热器温度为500℃,负离子模式界面加热器温度为550℃;离子源气体1、离子源气体2和气帘气在正离子模式下分别设置为50、50和35psi,在负离子模式下分别设置为55、55和35psi;正离子模式和负离子模式下MS扫描范围均为150~1250Da。采用信息依赖分析方法获得MS/MS片段模式;碰撞能量(CE)设置为30V(正离子模式)和-30V(负离子模式),碰撞能量扩散(CES)均为10V。
3、脂质组学数据处理
本发明利用非靶向脂质组学,使用超高效液相色谱-质谱技术检测所有被检者的血清脂质代谢物,比起靶向脂质组学获得了更加全面的脂质代谢物信息,由此构建了被检者全面的脂质代谢图谱。
首先,在此基础上,本发明对训练队列中的所有样本的脂质组学数据进行了偏最小二乘判别分析(PLS-DA),结果如图1所示。由图1可知,胃癌患者和健康捐献者的脂质代谢特征能明显地区分开,但仍存在部分重叠,这提示可以寻找一组脂质代谢特征作为胃癌患者特定的标记。其次,使用非靶向脂质组学检测样本时,每个样本能检测到超过700种的脂质代谢物信息,为避免信息冗余,本发明对743个脂质代谢物进行了两两之间的Spearman相关性分析,结果如图2所示。由图2可知,检测到的脂质代谢物两两之间的Spearman相关系数大致呈正态分布。第三,出于实际应用时代谢物检测数目不宜过度的考虑,根据PLS-DA分析得到每个代谢物基于成分1和成分2的变量投影重要性(variable importanceprojection,VIP)分数,关注VIP分数最高的50个物质。VIP分数最高的50个代谢物两两之间的相关性分析结果如图3所示,由图可知,VIP分数最高的这50个物质之间相关性较高。相关性高的物质可能代表类似的重复信息。因此,在纳入相对少的物质的同时考虑到标记的全面性,本发明从VIP分数第一的物质开始纳入,往后继续纳入与此前已纳入物质的相关系数<0.7的脂质代谢物,重新筛选出了VIP分数最高的50个脂质代谢物。
鉴于训练队列中含有胃癌患者和健康捐献者的数目多(均为227例),加上每个血清样本中均含有大量的脂质代谢物信息,所以筛选标记物时对计算力的要求高,需要使用先进的算法来进行计算。人工智能(artificial intelligence,AI)已经从“浅层”的学习架构发展到了“深层”的学习架构,而机器学习(machine learning,ML)作为人工智能的重要分支,能够自动学习捕捉复杂模式并基于数据进行智能决策,已经成为生物医学数据分析的强大工具。因此,本发明引入了机器学习算法来进行脂质代谢特征的选择。
本发明选取了10种机器学习算法进行脂质代谢特征的选择,分别为:线性判别分析(linear discrimination analysis,LDA)、二次判别分析(quadratic discriminantanalysis,QDA)、随机森林(random forest,RF)、线性支持向量机(linear support vectormachine,SVMLinear)、径向基函数支持向量机(SVM with Radial basis function,SVMRadial)、具有类别权重的线性支持向量机linear support vector machine withclass weights,SVMLinearWeights)、具有类别权重的径向基函数支持向量机(supportvector machine with Radial basis function and class weights,SVMRadialWeights)k-最近邻(k-nearest neighbor,KNN)、套索和弹性网正则化广义线性模型(lasso andelastic-net regularized generalized linear model,Glmnet)、贝叶斯广义线性模型(Bayesian generalized linear models,Bayesglm)。
其中,部分算法的运算结果受参数的影响,以SVMRadialWeights为例,运算结果受参数sigma值,c值和weight值的影响。本发明在进行运算时,每个参数会根据文献报道和以往经验设定不同的数值,如sigma值设定0.01、0.1和1;c值设定0.01、0.05、0.5、1和2;weight值设定1、2和3。最后,本发明还进行了10折交叉验证,将训练队列的数据分为10份,其中9份作为训练数据,剩下1份作为测试数据,一共运算10次,每一份数据都曾单独作为测试数据,根据运算结果得到一个平均的数值。特别地,本发明最后选择的LDA算法无内部参数的设置。
本发明在训练队列数据中进行10折交叉验证选择脂质代谢特征的同时完成了算法内部参数的优化和算法的选择,10种机器学习算法在训练数据集中进行10折交叉验证的结果如图4所示。由图4可知,当运用LDA算法和选取VIP得分最高的31个脂质代谢物用于胃癌诊断时的准确率最高,其用于胃癌诊断时的准确度、特异度和灵敏度如表2所示。本发明将VIP得分最高的31个脂质代谢物称为血清脂质代谢特征(serum lipid metabolicsignature,SLMS),由LDA算法和SLMS构成了本发明的胃癌诊断模型。
表2.LDA算法辅助的SLMS用于胃癌诊断时的准确度、特异度和灵敏度
注:因采用10折交叉验证对模型进行训练,所以LDA算法辅助的SLMS用于胃癌诊断时的准确率、特异度和灵敏度得到一个平均值和95%CI。特别地,此处区分于后文直接使用模型对训练队列的样本进行判断时的准确率、特异度和灵敏度。
所述血清脂质代谢特征中所含有的31个脂质代谢物的名称、分子式及其在本实验条件下的平均质荷比(m/z)和平均保留时间(R/min)如表3所示。
表3. 31个脂质代谢物的名称、分子式及其平均质荷比和平均保留时间
如前所述,本发明通过检测训练队列中所有样本的血清脂质代谢物的相对含量,根据PLS-DA和相关性分析筛选得到VIP得分最高的50个脂质代谢物,将它们的含量用机器学习的不同算法进行训练,得到31个脂质代谢物构成的脂质代谢特征SLMS,并由LDA算法和SLMS构成了胃癌诊断模型。
所述LDA算法使用的R包为caret R package(v 6.0-88),可通过链接(https://github.com/caizerong/GC-LIPID-ML)直接获取本发明所述胃癌诊断模型(bestLDA.Rds)。特别地,链接中还包括使用该诊断模型的方法(predict_LDA.R)和说明(README.md)。
在检测新一例样本时,向模型中输入样本中所述脂质代谢物的相对含量,就能判断这一例新的样本属于胃癌患者还是健康人。后续测试队列、外部验证队列和预测性队列的样本均是用上述方法判断。因另外三个队列的样本是已知胃癌或者健康性质的,可将判断结果跟样本的实际性质相比较,得到模型用于判断胃癌时的灵敏度、特异度和准确率。
所述基于机器学习线性判别分析算法的公式如下:
上述公式中,score.lda(j)表示第j个样本通过线性判别分析算法计算后的分数,α0是常数,αk代表代谢物k的参数,metabolitek,j代表第j个样本中代谢物k经标准化后的相对含量;代谢物k为上文所述31个脂质代谢物的其中之一;第j个样本中代谢物k标准化后的相对含量的单位为μg/mL;score.lda的范围为0~1,截断值为0.5。
若线性判别分析算法的运算结果大于0.5,判断为胃癌;若线性判别分析算法的运算结果小于或等于0.5,判断为健康。
实施例2胃癌诊断模型的验证
本发明另收集了98例胃癌患者和98例健康人捐献的血清(样本均来自中山大学附属第六医院,作为外部验证队列),以及76例胃癌患者和69例健康人捐献的血清(样本均来自中山大学附属肿瘤医院,作为预测性队列),以传统胃肠道肿瘤相关的标记物CEA、CA199和CA724为参照,验证了实施例1中LDA算法辅助的SLMS,即胃癌诊断模型在训练队列、测试队列、外部验证队列和预测性队列中对胃癌的诊断效能,结果如图5(图5中的A~D依次为训练队列、测试队列、外部验证队列和预测性队列的ROC曲线和和曲线下面积(AUC))和表4所示。
表4.LDA算法辅助的SLMS对胃癌的诊断效能
/>
/>
以训练队列的结果为例进行说明,检测训练队列样本的SLMS中31个脂质代谢物的相对含量,将其代入前述胃癌诊断模型进行运算,得到其score.lda,根据截断值0.5判断样本是胃癌患者还是健康捐献者。由图5和表4可知,基于LDA算法和SLMS的胃癌诊断模型对所述样本的诊断灵敏度为0.982,意味着本发明所述LDA算法辅助的SLMS能将98.2%的胃癌患者准确判断出来;诊断特异度为0.991,意味着所述LDA算法辅助的SLMS能将99.1%的健康捐献者准确判断出来;诊断准确率为0.987,意味着所述LDA算法辅助的SLMS能将98.7%的样本准确判断出来。以上结果表明,本发明所述31个脂质代谢物构成的SLMS结合LDA算法对胃癌具有很高的诊断效能。
实施例3胃癌诊断模型对早期胃癌的诊断效能
本发明收集了133例早期胃癌患者(pTNM分期为Ⅰ、Ⅱ期)和266例健康人捐献的血清(样本均来自中山大学肿瘤防治中心),将其中85%的样本作为训练队列,15%的样本作为测试队列,用实施例1所述方法分别检测了所有样本血清中SLMS脂质代谢物的相对含量,代入模型计算score.lda,根据score.lda对样本类型进行判断。本发明另收集了43例早期胃癌患者(pTNM分期为Ⅰ、Ⅱ期)和98例健康人捐献的血清(样本均来自中山大学附属第六医院,作为外部验证队列),以及35例早期胃癌患者pTNM分期为Ⅰ、Ⅱ期)和69例健康人捐献的血清(样本均来自中山大学附属肿瘤医院,作为预测性队列),以传统胃肠道肿瘤相关的标记物CEA、CA199和CA724为参照,验证了实施例1中所得到的基于SLMS和LDA的胃癌诊断模型在所述训练队列、测试队列、外部验证队列和预测性队列中对早期胃癌的诊断效能,结果如图6(图6中的A~D依次为训练队列、测试队列、外部验证队列和预测性队列的ROC曲线和和曲线下面积(AUC))和表5所示。特别地,病理分期采用国际抗癌联盟(UICC)第8版TNM分期系统。
表5.LDA算法辅助的SLMS对早期胃癌的诊断效能
/>
/>
以训练队列的结果为例进行说明,检测训练队列样本的SLMS中31个脂质代谢物的相对含量,将其代入胃癌诊断模型进行运算,得到score.lda,根据截断值0.5判断样本属于早期胃癌患者还是健康捐献者。由图6和表5可知,基于SLMS和LDA的胃癌诊断模型对早期胃癌样本的诊断灵敏度为0.982,表明所述LDA算法辅助的SLMS能将98.2%的早期胃癌患者准确判断出来;诊断特异度为0.991,意味着所述LDA算法辅助的SLMS能将99.1%的健康捐献者准确判断出来;诊断准确率为0.988,意味着所述LDA算法辅助的SLMS能将98.8%的样本准确判断出来。以上结果表明,本发明所述31个脂质代谢物构成的SLMS结合LDA算法在诊断早期胃癌方面具有显著优势,可将其用于早期胃癌的诊断。
实施例4胃癌诊断模型对CEA、CA199和CA724均为阴性的胃癌患者的诊断效能
本发明收集了193例传统胃肠道肿瘤相关标记物(CEA、CA199和CA724)均为阴性的胃癌患者和266例健康人捐献的血清(样本均来自中山大学肿瘤防治中心),将85%的样本作为训练队列、15%的样本作为测试队列,用实施例1所述方法分别检测了所有样本血清中SLMS脂质代谢物的相对含量,代入模型计算score.lda,根据score.lda判断样本的类型。另收集了来自中山大学附属第六医院的61例传统胃肠道肿瘤相关标记物(CEA、CA199和CA724)均为阴性的胃癌患者和98例健康人捐献的血清作为外部验证队列,以及来自中山大学肿瘤防治医院的46例传统胃肠道肿瘤相关标记物(CEA、CA199和CA724)均为阴性的胃癌患者和69例健康人捐献的血清作为预测性队列,验证了实施例1中所得到的基于SLMS和LDA的胃癌诊断模型在所述训练队列、测试队列、外部验证队列和预测性队列中分区CEA、CA199和CA724均为阴性的胃癌患者和健康人的效能,结果如表6所示。
表6.LDA算法辅助的SLMS对CEA、CA199和CA724均为阴性的胃癌患者的诊断效能
注:所述队列下括号中的数字为CEA、CA199和CA724均为阴性的胃癌患者数目vs健康捐献者数目。
以训练队列的结果为例进行说明,检测训练队列样本的SLMS中31个脂质代谢物的相对含量,将其代入胃癌诊断模型进行运算,得到score.lda,根据截断值0.5判断样本是CEA、CA199和CA724均为阴性的胃癌患者还是健康捐献者。由表6可知,基于SLMS和LDA的胃癌模型诊断对所述样本的诊断灵敏度为0.994,意味着所述LDA算法辅助的SLMS能将99.4%的CEA、CA199和CA724均为阴性的胃癌患者准确判断出来;诊断特异度为0.991,意味着所述LDA算法辅助的SLMS能将99.1%的健康捐献者准确判断出来;诊断准确率为0.982,意味着所述LDA算法辅助的SLMS能将98.2%的样本准确判断出来。以上结果表明,本发明所述31个脂质代谢物构成的SLMS结合LDA算法在诊断胃癌方面具有显著优势,其能以很高的诊断效能将传统胃肠道肿瘤相关标记物(CEA、CA199和CA724)均为阴性的这群特殊的容易漏诊的胃癌患者诊断出来。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

Claims (10)

1.一种可作为胃癌诊断标志物的脂质代谢物组合,其特征在于,所述脂质代谢物组合包括溶血磷脂酰胆碱17:0、鞘磷脂30:1;2O|鞘磷脂16:1;2O/14:0、溶血磷脂酰乙醇胺O-16:1、磷脂酰乙醇胺O-44:6|磷脂酰乙醇胺O-24:2_20:4、脂肪酸44:11、溶血磷脂酰胆碱20:0、酰基肉碱14:0、磷脂酰乙醇胺O-37:7|磷脂酰乙醇胺O-15:1_22:6、神经酰胺39:1;2O|神经酰胺17:1;2O/22:0、双磷脂酰甘油8:7|双磷脂酰甘油24:0_18:2_18:2_18:3、磷脂酰胆碱O-35:4、己糖胺神经酰胺42:2;2O|己糖胺神经酰胺18:1;2O/24:1、氧化脂肪酸28:3、磷脂酰胆碱40:0、脂肪酸20:5、磷脂酰乙醇胺O-38:6|磷脂酰乙醇胺O-16:1_22:5、磷脂酰胆碱36:4|磷脂酰胆碱18:2_18:2、溶血磷脂酰胆碱17:1、己糖胺神经酰胺42:2;3O、溶血磷脂酰乙醇胺O-14:1、磷脂酰胆碱38:6|磷脂酰胆碱18:2_20:4、双磷脂酰甘油76:3|双磷脂酰甘油18:0_18:0_18:0_22:3、溶血磷脂酰胆碱18:3、磷脂酰胆碱42:6、磷脂酰乙醇胺36:4|磷脂酰乙醇胺18:2_18:2、酰基肉碱18:1、鞘磷脂38:1;2O、磷脂酰乙醇胺39:6|磷脂酰乙醇胺17:0_22:6、神经酰胺38:1;2O|神经酰胺18:1;2O/20:0、鞘磷脂35:2;2O和溶血磷脂酰乙醇胺18:0。
2.用于检测权利要求1所述脂质代谢物组合含量的试剂在制备用于胃癌筛查或诊断的产品中的应用。
3.一种用于胃癌筛查或诊断的试剂盒,其特征在于,含有用于检测权利要求1所述脂质代谢物组合含量的试剂。
4.根据权利要求3所述试剂盒,其特征在于,在获得所述脂质代谢物组合中各脂质代谢物的含量后,用线性判别分析算法进行运算,根据运算结果进行判断,若运算结果大于0.5,判断为胃癌;若运算结果小于或等于0.5,判断为健康。
5.一种用于胃癌筛查或诊断的装置,其特征在于,包括脂质代谢物含量检测部、分析部和判断部;所述脂质代谢物含量检测部用于检测权利要求1所述脂质代谢物组合中的各脂质代谢物在样本中的含量。
6.根据权利要求5所述装置,其特征在于,所述分析部用于在获得所述脂质代谢物组合中各脂质代谢物的含量后,用线性判别分析算法进行运算。
7.根据权利要求5所述装置,其特征在于,所述判断部用于对线性判别分析算法的运算结果进行判断;若运算结果大于0.5,判断为胃癌;若运算结果小于或等于0.5,判断为健康。
8.根据权利要求5所述装置,其特征在于,所述脂质代谢物含量检测部包括超高效液相色谱和质谱检测所需仪器,通过超高效液相色谱-质谱技术非靶向检测获得所述脂质代谢物组合中各脂质代谢物的含量。
9.根据权利要求8所述装置,其特征在于,所述脂质代谢物的含量为相对含量。
10.根据权利要求9所述装置,其特征在于,检测所用内标为:酰基肉碱C16:0-d3、棕榈酸-d3、神经酰胺d18:1-d7/18:0、溶血磷脂酰胆碱17:0-d5、磷脂酰胆碱17:0/22:4-d5、磷酸乙醇胺17:0/17:0、鞘磷脂d18:1/15:0-d9和甘油三酯15:0/18:1/15:0-d5。
CN202311642694.4A 2023-11-21 2023-11-30 一种可作为胃癌诊断标志物的脂质代谢物组合及其应用 Active CN117589905B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202311563758 2023-11-21
CN2023115637581 2023-11-21

Publications (2)

Publication Number Publication Date
CN117589905A true CN117589905A (zh) 2024-02-23
CN117589905B CN117589905B (zh) 2024-04-26

Family

ID=89914981

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311642694.4A Active CN117589905B (zh) 2023-11-21 2023-11-30 一种可作为胃癌诊断标志物的脂质代谢物组合及其应用

Country Status (1)

Country Link
CN (1) CN117589905B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015036044A1 (en) * 2013-09-13 2015-03-19 Telormedix Sa Cationic lipid vehicles for delivery of tlr7 agonists for specific targeting of human cd14+ monocytes in whole blood
WO2016050208A1 (zh) * 2014-10-01 2016-04-07 厦门赛诺邦格生物科技有限公司 一种多官能化聚乙二醇衍生物修饰的生物相关物质
JP2021098668A (ja) * 2019-12-23 2021-07-01 株式会社アイ・ティー・オー 細胞送達用キャリア
CA3184955A1 (en) * 2020-07-06 2022-01-13 Dominique Bridon Brk peptides and methods of use
CN113960235A (zh) * 2020-10-10 2022-01-21 中山大学肿瘤防治中心(中山大学附属肿瘤医院、中山大学肿瘤研究所) 生物标志物在制备肺癌检测试剂中的用途和方法
CN115575553A (zh) * 2021-11-12 2023-01-06 中山大学肿瘤防治中心(中山大学附属肿瘤医院、中山大学肿瘤研究所) 血清代谢标志物作为检测egfr突变的应用以及检测系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015036044A1 (en) * 2013-09-13 2015-03-19 Telormedix Sa Cationic lipid vehicles for delivery of tlr7 agonists for specific targeting of human cd14+ monocytes in whole blood
WO2016050208A1 (zh) * 2014-10-01 2016-04-07 厦门赛诺邦格生物科技有限公司 一种多官能化聚乙二醇衍生物修饰的生物相关物质
JP2021098668A (ja) * 2019-12-23 2021-07-01 株式会社アイ・ティー・オー 細胞送達用キャリア
CA3184955A1 (en) * 2020-07-06 2022-01-13 Dominique Bridon Brk peptides and methods of use
CN113960235A (zh) * 2020-10-10 2022-01-21 中山大学肿瘤防治中心(中山大学附属肿瘤医院、中山大学肿瘤研究所) 生物标志物在制备肺癌检测试剂中的用途和方法
CN116381073A (zh) * 2020-10-10 2023-07-04 中山大学肿瘤防治中心(中山大学附属肿瘤医院、中山大学肿瘤研究所) 生物标志物在制备肺癌检测试剂中的用途和方法
CN115575553A (zh) * 2021-11-12 2023-01-06 中山大学肿瘤防治中心(中山大学附属肿瘤医院、中山大学肿瘤研究所) 血清代谢标志物作为检测egfr突变的应用以及检测系统

Also Published As

Publication number Publication date
CN117589905B (zh) 2024-04-26

Similar Documents

Publication Publication Date Title
CN110646554B (zh) 基于代谢组学的胰腺癌诊断标志物及其筛选方法和应用
Ros-Mazurczyk et al. Serum lipid profile discriminates patients with early lung cancer from healthy controls
CN108414660B (zh) 一组与肺癌早期诊断相关的血浆代谢小分子标志物的应用
CN105675735B (zh) 乳腺癌诊断标记物组合、应用及其测定方法
ES2490165T3 (es) Método que facilita el diagnóstico y tratamiento del asma y cáncer de pulmón
JP2024521145A (ja) 腺腫及び大腸癌のリスクを評価するためのバイオマーカーの組み合わせ及びその使用
CN111562338A (zh) 透明肾细胞癌代谢标志物在肾细胞癌早期筛查和诊断产品中的应用
CN111896641B (zh) 结直肠癌相关雌激素血浆代谢小分子筛选方法及其应用
CN101498700A (zh) 人血液样本中脂类分子含量测定及其结直肠癌诊断试剂盒制备与应用
CN109580948B (zh) 基于二氢胸腺嘧啶代谢物的组合在结直肠癌诊断及预后预测中的应用
Anjo et al. A translational view of cells' secretome analysis-from untargeted proteomics to potential circulating biomarkers
CN111273023B (zh) 一种肺腺癌肿瘤标记物蛋白及其应用
CN117589905B (zh) 一种可作为胃癌诊断标志物的脂质代谢物组合及其应用
CN114822854B (zh) 胃黏膜病变进展及胃癌相关尿蛋白标志物及其应用
Zhang et al. Altered phosphatidylcholines expression in sputum for diagnosis of non-small cell lung cancer
CN110286223A (zh) 代谢标志物在肾透明细胞癌中的应用
CN114813997B (zh) 胆汁酸标志物组合物及应用和血清检测试剂盒
US20050158745A1 (en) Methods and compositions for detection of nasopharyngeal carcinoma
JP2024521217A (ja) アシルカルニチン代謝体を含む口腔癌診断用のバイオマーカー組成物
JP2010266386A (ja) 患者由来の代謝物を使用したがんの検査方法
CN113466370A (zh) 一种用于食管鳞癌早期筛查的标志物及检测试剂盒
CA2525743A1 (en) Differential diagnosis of colorectal cancer and other diseases of the colon
CN103570826A (zh) 新一代宫颈癌特异预警血浆蛋白
Hammoud et al. Diagnosis of esophageal adenocarcinoma by serum proteomic pattern
JP2014020941A (ja) 大腸癌のマーカーおよびそれを用いた診断

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant