CN116165385A - 用于肝癌诊断的血清代谢标志物及其筛选方法和应用 - Google Patents

用于肝癌诊断的血清代谢标志物及其筛选方法和应用 Download PDF

Info

Publication number
CN116165385A
CN116165385A CN202310451389.0A CN202310451389A CN116165385A CN 116165385 A CN116165385 A CN 116165385A CN 202310451389 A CN202310451389 A CN 202310451389A CN 116165385 A CN116165385 A CN 116165385A
Authority
CN
China
Prior art keywords
liver cancer
cancer diagnosis
serum metabolic
serum
metabolic marker
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310451389.0A
Other languages
English (en)
Other versions
CN116165385B (zh
Inventor
侯金林
樊蓉
廖星美
赵思如
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southern Hospital Southern Medical University
Original Assignee
Southern Hospital Southern Medical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southern Hospital Southern Medical University filed Critical Southern Hospital Southern Medical University
Priority to CN202310451389.0A priority Critical patent/CN116165385B/zh
Publication of CN116165385A publication Critical patent/CN116165385A/zh
Application granted granted Critical
Publication of CN116165385B publication Critical patent/CN116165385B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • G01N33/57438Specifically defined cancers of liver, pancreas or kidney
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/62Detectors specially adapted therefor
    • G01N30/72Mass spectrometers
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • G16B50/30Data warehousing; Computing architectures
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Immunology (AREA)
  • Chemical & Material Sciences (AREA)
  • Pathology (AREA)
  • Theoretical Computer Science (AREA)
  • Biotechnology (AREA)
  • Analytical Chemistry (AREA)
  • Biomedical Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Biochemistry (AREA)
  • Public Health (AREA)
  • Urology & Nephrology (AREA)
  • Data Mining & Analysis (AREA)
  • Hematology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioethics (AREA)
  • Biophysics (AREA)
  • Epidemiology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Cell Biology (AREA)
  • Microbiology (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Medicinal Chemistry (AREA)
  • Software Systems (AREA)
  • Food Science & Technology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Oncology (AREA)
  • Hospice & Palliative Care (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Primary Health Care (AREA)

Abstract

本发明属于生物医学技术领域,具体涉及用于肝癌诊断的血清代谢标志物及其筛选方法和应用。本发明提出了用于肝癌诊断的血清代谢标志物,所述血清代谢标志物包括如下化合物的至少一种:5‑甲基硫代腺苷;α‑酮丁酸酯;1‑棕榈酰甘油;3‑甲基‑2‑氧丁酸酯;丁酰肉碱;4‑胆甾醇‑3‑酮;1‑(1‑烯基‑棕榈酰基)‑甘油磷酸乙醇胺;2‑酮辛酸盐;3‑羟基丁酸;苏氨酸盐。本发明表明特定的血清代谢物可作为新型的微创生物标志物,提高疾病诊断水平,该类生物标志物的成功开发为其他疾病生物标志物的研制提供方法和策略上的借鉴。

Description

用于肝癌诊断的血清代谢标志物及其筛选方法和应用
技术领域
本发明属于生物医学技术领域,具体涉及用于肝癌诊断的血清代谢标志物及其筛选方法和应用。
背景技术
原发性肝细胞癌(HCC)是全球最常见的原发性恶性肿瘤之一。诊断HCC时的疾病分期很大程度上决定了后续治疗的疗效。目前临床应用的传统肝癌标志物(如甲胎蛋白AFP)在诊断方面还缺乏满意的敏感性和特异性,因此,迫切需要寻找更可靠、更准确的肿瘤标志物以早期诊断肝癌,提高发现早期肝癌的机会。
代谢组学作为多组学中的一个分支,是利用高通量技术对生命系统中相对分子质量<1000×103的小分子代谢产物如氨基酸、核苷酸、糖类和脂质等进行定性和定量分析的系统研究。代谢组学通常使用基于核磁共振、液质联用和气质联用等的技术方法,不仅可识别复杂的代谢表型,还可以整合生物信息学数据和其他组学策略如基因组学、转录组学和蛋白质组学,以阐明疾病潜在的生物学机制并发现疾病风险的临床相关诊断和预后标志物。代谢组学的时间响应在所有组学中最快,且结果易于理解,容易与表型和功能结合,已广泛应用于疾病诊断、治疗监测和药效学评价领域。
近年来,代谢组学逐渐兴起,在癌症等疾病的发生机制、早期预防和诊断、药物治疗靶点等多个领域的研究都取得新进展,同时发掘出众多具有优良灵敏度和特异度的血清代谢物指标,弥补了传统血清学指标的不足,助力癌症等疾病的早筛早诊。
发明内容
本发明的目的在于提供用于肝癌诊断的血清代谢标志物及其筛选方法和应用,以寻找更可靠、更准确的肿瘤标志物以进一步提高在高危人群中发现早期肝癌的机会。为实现上述目的,本发明采取的技术方案如下:
用于肝癌诊断的血清代谢标志物,所述血清代谢标志物包括如下化合物的至少一种:
5-甲基硫代腺苷;
α-酮丁酸酯;
1-棕榈酰甘油;
3-甲基-2-氧丁酸酯;
丁酰肉碱;
4-胆甾醇-3-酮;
1-(1-烯基-棕榈酰基)-甘油磷酸乙醇胺;
2-酮辛酸盐;
3-羟基丁酸;
苏氨酸盐。
可选地,所述血清代谢标志物包括如下化合物:
5-甲基硫代腺苷;
3-羟基丁酸;
苏氨酸盐;
丁酰肉碱;
2-酮辛酸盐。
本发明还提出了一种检测所述的用于肝癌诊断的血清代谢标志物的产品在制备用于肝癌诊断的产品中的用途。
可选地,检测所述的用于肝癌诊断的血清代谢标志物的产品包括试剂、试纸、试剂盒或仪器。
可选地,肝癌诊断的产品包括试剂、试纸、试剂盒或仪器。
本发明还提出了一种用于肝癌诊断的血清代谢标志物的筛选方法,包括如下步骤:
步骤一:收集受试者的血液样品,根据受试者是否患有肝癌,将血液样品分为肝癌组和非肝癌组;
步骤二:测定各个血液样品中的代谢物含量,使用3种以上的统计方法分析测定的代谢物含量与是否患肝癌的相关度;并且设定每种统计方法的相关度阈值;
步骤三,筛选出至少达到一种统计方法的相关度阈值的代谢物。
可选地,所述统计方法包含:变量重要性投影和差异倍数;Boruta法; Lasso法;ExtraTree法;或SelectKBest法;
可选地,所述每种统计方法的相关度阈值分别为变量重要性投影>1且差异倍数>1.5;采用Boruta法进行十次随机试验,按特征选择次数排序前20;采用Lasso进行十次随机试验,按特征选择次数排序前20;采用ExtraTree进行十次随机试验,按特征选择次数排序前20;采用SelectKBest进行十次随机试验,按特征选择次数排序前20。
可选地,所述非肝癌组的受试者为肝硬化或乙型肝炎的患者。
可选地,所述步骤二中,采用液相色谱-质谱联用的方式测定各个血液样品中的代谢物含量。
本发明还提出了上述血清代谢标志物用于诊断肝癌的方法,所述的方法包括如下步骤:
步骤a:利用所述的肝癌诊断的血清代谢标志物建立肝癌诊断模型;
步骤b:测定受试者血样中的血清代谢标志物含量;
步骤c:根据测定的血清代谢标志物含量,通过所述肝癌诊断模型计算肝癌诊断结果。
可选地,用于肝癌诊断的血清代谢标志物组合为:5-甲基硫代腺苷;3-羟基丁酸;苏氨酸盐;丁酰肉碱;2-酮辛酸盐。
可选地,利用上述5种血清代谢标志物的组合建立的logistic模型为y=-0.566*5-甲基硫代腺苷丰度+0.192*3-羟基丁酸丰度-0.839*苏氨酸盐丰度+0.394*丁酰肉碱丰度+0.511*2-酮辛酸盐丰度-2.464。当y的值>-1.38时判定为受试者诊断为肝癌。
可选地,利用上述5种血清代谢标志物的组合建立的梯度提升树模型,迭代次数为75次,建立树时随机抽取的特征数量为100%,对树进行提升时使用的最小权重为1,学习率为0.01,新增一个叶子分区时所需的最小减损为0.25,子样本数据占整个观测的比例为50%,树的最大深度为2。将检测得到的各物质的丰度代入模型计算值大于0.41,则诊断患者患有肝癌。
与现有技术相比,本发明的有益效果为:
(1) 本发明提出了独立筛选并验证出10种代谢物可用于肝癌早期诊断;并确定了一组5种血清代谢物,用于早期诊断肝癌,显示出良好的灵敏度和特异度,为识别肝癌高危人群、早期诊疗提供了新的技术支撑;
(2)本发明提出了用于肝癌诊断的血清代谢标志物的筛选方法,并开展了肝癌的巢式病例对照研究,利用多种方法分析测定的代谢物含量与是否患肝癌的相关度;
(3)本发明表明特定的血清代谢物可作为一种新型的微创生物标志物,提高疾病诊断水平,该类生物标志物的成功开发为其他疾病生物标志物的研制提供方法和策略上的借鉴。
附图说明
图1为外周血的血清中10个代谢物的含量统计图;其中*、**、***表示肝癌组与非肝癌组相比具有统计学差异p<0.05,p<0.01,p<0.001。
图2为针对5个代谢物的受试者工作特征分析结果;其中A为logistic回归模型在训练集和100次重抽样(bootstrap)内部验证中的结果;B为梯度提升树模型在训练集和验证集中的结果。
具体实施方式
为更好地说明本发明的目的、技术方案和优点,下面将结合具体实施例对本发明作进一步说明。本领域技术人员应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
实施例中所用的试验方法如无特殊说明,均为常规方法;所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
实施例1
本实施例中提出了一种用于肝癌诊断的血清代谢标志物的筛选方法,包括如下步骤:
步骤一:收集受试者的血液样品,根据受试者是否患有肝癌,将血液样品分为肝癌组和非肝癌组。建立统一标准的队列标本库和数据库:以标准操作程序(SOP)采集符合标准的血液样本,系统收集完整的人口学资料和临床资料。纳入一项全国多中心CHB患者长期随访研究中由乙型肝炎或肝硬化进展为肝癌、乙型肝炎或肝硬化未进展为肝癌的病例。回溯肝癌患者确诊前2年内和非肝癌患者末次随访前2年内的血清标本(每6个月随访一次)。两组患者2年前的临床特征(年龄、性别、甲胎蛋白等常见的肝癌相关危险因素)相匹配。将肝癌患者确诊时的血清标本作为肝癌组,其余的全部时间点的全部血清标本作为非肝癌组。利用非靶代谢组学技术,筛选并验证肝癌发病相关的代谢标志物。
步骤二:测定各个血液样品中的代谢物含量,含量的测定采用超高效液相色谱-质谱仪联用的方式进行测定,本实施例中共测定血清中1033种被命名的代谢物。使用3种或3种以上的统计方法分析测定的代谢物含量与是否患肝癌的相关度;划定每种统计方法的相关度阈值;
步骤三,筛选出至少达到一种统计方法的相关度阈值的代谢物。
研究样本的选择:
收集来自前瞻性研究队列的新发肝癌患者56人,匹配肝硬化患者30人及乙型肝炎患者31人。
设置试验分组:非肝癌组:即NHCC组,包括肝硬化患者外周血、乙型肝炎患者外周血,共201例,其中包含了非肝癌患者2年内的样本,以及肝癌患者2年内未确诊癌症前的样本;肝癌组:即HCC组,肝癌患者外周血,56例,为肝癌患者确诊时的样本。
本研究共纳入257例符合标准的样本进行研究。
血清样本的提取:
每个研究对象均采用促凝采血管采集晨起空腹静脉血,采集量为5ml×2管/人。所有受试者均签订样本采集知情同意书,处理好的样本均遵循实验室生物安全操作规范,做好相应记录。
使用Hamilton公司的自动MicroLab STAR®系统制备样品。在提取过程的第一步之前添加了几个回收标准品,用于质量控制。为了去除蛋白质、解离与蛋白质结合或被沉淀的蛋白质基质捕获的小分子,并回收化学多样的代谢物,在剧烈振荡下用甲醇沉淀蛋白质2分钟(Glen Mills GenoGrinder 2000),然后离心。所得提取物分为五部分:其中两个部分用于通过两种不同的反相(RP)/UPLC-MS/MS方法进行分析,使用正离子模式电喷雾电离(ESI),一部分用于使用负离子模式ESI,一部分用于使用HILIC/UPLC-MS/MS进行分析,另一部分保留一个样品用于备用。将样品短暂放置在TurboVap®(Zymark)上以去除有机溶剂。在准备分析之前,将样品提取物在氮气下储存过夜。
代谢组学检测:
使用Waters ACQUITY 超高效液相色谱 (UPLC) 和 Thermo Scientific Q-Exactive 高分辨率/精确质谱仪。该质谱仪与加热电喷雾电离 (HESI-II) 源和以 35,000质量分辨率运行的 Orbitrap 质量分析仪连接。将样品提取物干燥,然后在与四种方法中的每一种方法相容的溶剂中进行重组。每种重组溶剂都含有一系列固定浓度的标准品,以确保注射和色谱一致性。使用酸性正离子条件分析一份等分试样,色谱优化以获得更多亲水性化合物。在该方法中,使用含有0.05%全氟辛酸(PFPA)和0.1%甲酸(FA)的水和甲醇从C18柱(Waters UPLC BEH C18-2.1x100 mm,1.7µm)梯度洗脱提取物。另一个等分试样也使用酸性正离子条件进行分析,但对其进行了色谱优化,以获得更疏水的化合物。在该方法中,使用甲醇、乙腈、水、0.05%PFPA和0.01%FA从上述相同的C18柱梯度洗脱提取物,并在总体较高的有机含量下操作。使用单独的专用C18柱,使用基本负离子优化条件分析另一等分试样。使用甲醇和水从柱中梯度洗脱碱性提取物,但使用pH为8的6.5mM碳酸氢铵。使用由水和乙腈与10mM甲酸铵(pH 10.8)组成的梯度,从HILIC柱(Waters UPLC BEH Amide 2.1x150mm,1.7µm)洗脱后,通过负电离分析第四等分试样。MS分析使用动态排除在MS和数据相关的MSn扫描之间交替进行。扫描范围在不同方法之间变化不大,但覆盖70-1000 m/z。
数据处理:
进行峰识别、峰提取、峰对齐和积分等处理,进行物质注释确定多个时间点血清中1033种被命名的代谢物;基于相对标准偏差(relative standard deviation)对异常值进行过滤;缺失数据采用最小值进行填补;利用内标(internal standard)进行归一化。
统计分析:
基于测试得到的各个代谢物的丰度,通过以下5种方法筛选差异代谢物:(1)变量重要性投影(VIP)和差异倍数(FC):采用MetaboAnalyst在线网站进行偏最小二乘判别分析和差异倍数分析,以VIP>1且FC>1.5为标准筛选区分肝癌和非肝癌的差异性代谢物;(2)Boruta:基于R中的Boruta包进行的特征选择方法,采用随机森林的办法抽取特征、打乱特征顺序计算特征重要性;(3)Lasso:基于R中的glmnet包进行的特征选择方法;(4)ExtraTree:基于python运行的极度随机树,由许多决策树构成,特点是特征随机、参数随机、模型随机、分裂随机;(5)SelectKBest:采用python运行,该方法采用一种特征选择函数,通过给特征进行打分,然后从高到低选取特征。
被选择的代谢物必须满足3种或3种以上条件或在后续建模过程中起到重要作用:(1)VIP>1且FC>1.5;(2)采用Boruta进行十次随机试验,按特征选择次数排序前20;(3)采用Lasso进行十次随机试验,按特征选择次数排序前20;(4)采用ExtraTree进行十次随机试验,按特征选择次数排序前20;(5)采用SelectKBest进行十次随机试验,按特征选择次数排序前20;基于以上条件,发现10个代谢物在肝癌和非肝癌组之间具有显著差异。
肝癌病例与非肝癌病例相比,10种显著差异的代谢物见表1以及图1。图1中利用Mann-Whitney U检验,其中*、**、***表示肝癌组与非肝癌组相比具有统计学差异p<0.05,p<0.01,p<0.001。
表1
Figure SMS_1
本发明利用前瞻性人群队列开展了巢式病例对照研究,通过非靶向代谢组学技术检测了3个时间点血清中1033种被命名的代谢物,采用5种方法进行特征选择(MetaboAnalyst、Boruta、Lasso、ExtraTree、SelectKBest),发现其中10种代谢物与肝癌的发病显著相关。具体为:
5-甲基硫代腺苷
α-酮丁酸酯
1-棕榈酰甘油
3-甲基-2-氧丁酸酯
丁酰肉碱
4-胆甾醇-3-酮
1-(1-烯基-棕榈酰基)-甘油磷酸乙醇胺
2-酮辛酸盐
3-羟基丁酸
苏氨酸盐。
实施例2
本实施例利用实施例1中的血液样品检测数据,将全部样本作为训练集,使用logistic回归建立肝癌诊断模型,并进行100次重抽样(bootstrap)内部验证,得到对肝癌风险诊断效果好的logistic回归模型。
本实施例提供了一组用于肝癌诊断的血清代谢标志物组合,包括:
5-甲基硫代腺苷;
3-羟基丁酸;
苏氨酸盐;
丁酰肉碱;和
2-酮辛酸盐。
本实施例利用上述5种血清代谢标志物的组合建立的logistic模型为y=-0.566*5-甲基硫代腺苷丰度+0.192*3-羟基丁酸丰度-0.839*苏氨酸盐丰度+0.394*丁酰肉碱丰度+0.511*2-酮辛酸盐丰度-2.464。
当y的值>-1.38时判定为受试者诊断为肝癌。
基于受试者工作特征(Receiver operating characteristic,ROC)分析上述模型的诊断效果。图2中A为基于以上5种代谢物建立的logistic回归模的结果,模型在训练集的曲线下面积(AUC)为0.767(95%CI:0.709-0.816),灵敏度及特异度分别为75.0%和70.6%,采用重抽样内部验证计算C指数为0.770,Brier分数为0.134。
上述用于肝癌诊断的血清代谢标志物诊断肝癌的方法,包括如下步骤:
1、提取血清样品;
采用实施例1中“血清样本的提取”中的方法制备受试者的血清样品。
2、血清代谢标志物检测
按照实施例1中“3、代谢组学检测”的方法对本实施例步骤2中血清样本中的5-甲基硫代腺苷;3-羟基丁酸;苏氨酸盐;丁酰肉碱;2-酮辛酸盐的含量进行检测。
3、数据计算
受试者血清5-甲基硫代腺苷为3.48,3-羟基丁酸为5.38,苏氨酸盐为0.59,丁酰肉碱为1.26,2-酮辛酸盐为1.57,代入logistic回归模型计算值为1.34,大于-1.38,诊断该患者患有肝癌。
实施例3
本实施例利用实施例1中的血液样品检测数据,按7:3将其分为训练集和验证集,使用机器学习中的梯度提升分类树建立肝癌诊断模型,得到对肝癌诊断效果好的梯度提升树模型。
本实施例提供了一组用于肝癌诊断的血清代谢标志物组合,包括:
5-甲基硫代腺苷;
3-羟基丁酸;
苏氨酸盐;
丁酰肉碱;和
2-酮辛酸盐。
本实施例利用上述5种血清代谢标志物的组合建立的梯度提升树模型,迭代次数为75次,建立树时随机抽取的特征数量为100%,对树进行提升时使用的最小权重为1,学习率为0.01,新增一个叶子分区时所需的最小减损为0.25,子样本数据占整个观测的比例为50%,树的最大深度为2。代入模型计算值大于0.41,诊断患者患有肝癌。
基于ROC分析上述模型的诊断效果。图2中B为基于以上5个代谢物建立的梯度提升树模型的结果。在训练集的AUC为0.828(95%CI:0.765-0.880),诊断概率界值为0.41,灵敏度和特异度分别为69.0%和86.9%,利用Hmisc包中somers2函数直接计算C指数为0.828,Brier分数为0.167。在验证集中AUC为0.789(95%CI:0.682-0.873),采用界值0.41,灵敏度和特异度分别为64.3%和87.5%,somers2函数计算C指数为0.789,Brier分数为0.161。
上述用于肝癌诊断的血清代谢标志物诊断肝癌的方法,包括如下步骤:
1、提取血清样品;
采用实施例1中“血清样本的提取”中的方法制备受试者的血清样品。
2、血清代谢标志物检测
按照实施例1中“3、代谢组学检测”的方法对本实施例步骤2中血清样本中的5-甲基硫代腺苷;3-羟基丁酸;苏氨酸盐;丁酰肉碱;2-酮辛酸盐的含量进行检测。
3、数据计算
受试者血清5-甲基硫代腺苷丰度为0.48,3-羟基丁酸丰度为1.46,苏氨酸盐丰度为1.29,丁酰肉碱丰度为1.05,2-酮辛酸盐丰度为2.10,代入梯度提升树模型计算值为0.34,小于0.41,诊断该患者不患有肝癌。
显然,上述实施例仅仅是为清楚地说明所作的举例,而并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或变动仍处于本发明创造的保护范围之中。

Claims (10)

1.用于肝癌诊断的血清代谢标志物,其特征在于,所述血清代谢标志物包括如下化合物的至少一种:
5-甲基硫代腺苷;
α-酮丁酸酯;
1-棕榈酰甘油;
3-甲基-2-氧丁酸酯;
丁酰肉碱;
4-胆甾醇-3-酮;
1-(1-烯基-棕榈酰基)-甘油磷酸乙醇胺;
2-酮辛酸盐;
3-羟基丁酸;
苏氨酸盐。
2.根据权利要求1所述的用于肝癌诊断的血清代谢标志物,其特征在于,所述血清代谢标志物包括如下化合物:
5-甲基硫代腺苷;
3-羟基丁酸;
苏氨酸盐;
丁酰肉碱;
2-酮辛酸盐。
3.一种检测权利要求1或2所述的用于肝癌诊断的血清代谢标志物的产品在制备用于肝癌诊断的产品中的用途。
4.根据权利要求3所述的用途,其特征在于,检测所述的用于肝癌诊断的血清代谢标志物的产品包括试剂、试纸、试剂盒或仪器。
5.根据权利要求3所述的用途,其特征在于,肝癌诊断的产品包括试剂、试纸、试剂盒或仪器。
6.一种用于肝癌诊断的血清代谢标志物的筛选方法,其特征在于,包括如下步骤:
步骤一:收集受试者的血液样品,根据受试者是否患有肝癌,将血液样品分为肝癌组和非肝癌组;
步骤二:测定各个血液样品中的代谢物含量,使用3种以上的统计方法分析测定的代谢物含量与是否患肝癌的相关度;并且设定每种统计方法的相关度阈值;
步骤三,筛选出至少达到一种统计方法的相关度阈值的代谢物。
7. 根据权利要求6所述的用于肝癌诊断的血清代谢标志物的筛选方法,其特征在于,所述统计方法包含:变量重要性投影和差异倍数;Boruta法; Lasso法; ExtraTree法;或SelectKBest法。
8.根据权利要求7所述的用于肝癌诊断的血清代谢标志物的筛选方法,其特征在于,每种统计方法的相关度阈值分别为变量重要性投影>1且差异倍数>1.5;采用Boruta法进行十次随机试验,按特征选择次数排序前20;采用Lasso进行十次随机试验,按特征选择次数排序前20;采用ExtraTree进行十次随机试验,按特征选择次数排序前20;采用SelectKBest进行十次随机试验,按特征选择次数排序前20。
9.根据权利要求6所述的用于肝癌诊断的血清代谢标志物的筛选方法,其特征在于,所述非肝癌组的受试者为肝硬化或乙型肝炎的患者。
10.根据权利要求6所述的用于肝癌诊断的血清代谢标志物的筛选方法,其特征在于,所述步骤二中,采用液相色谱-质谱联用的方式测定各个血液样品中的代谢物含量。
CN202310451389.0A 2023-04-25 2023-04-25 用于肝癌诊断的血清代谢标志物及其筛选方法和应用 Active CN116165385B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310451389.0A CN116165385B (zh) 2023-04-25 2023-04-25 用于肝癌诊断的血清代谢标志物及其筛选方法和应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310451389.0A CN116165385B (zh) 2023-04-25 2023-04-25 用于肝癌诊断的血清代谢标志物及其筛选方法和应用

Publications (2)

Publication Number Publication Date
CN116165385A true CN116165385A (zh) 2023-05-26
CN116165385B CN116165385B (zh) 2023-07-18

Family

ID=86418638

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310451389.0A Active CN116165385B (zh) 2023-04-25 2023-04-25 用于肝癌诊断的血清代谢标志物及其筛选方法和应用

Country Status (1)

Country Link
CN (1) CN116165385B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006113085A2 (en) * 2005-03-28 2006-10-26 Biocatalytics, Inc. D-amino acid dehydrogenase and method of making d-amino acids
US20100279956A1 (en) * 2007-11-02 2010-11-04 Mc Creedy Jr Bruce J Biomarkers For Fatty Liver Disease And Methods Using The Same
US20110301194A1 (en) * 2010-06-02 2011-12-08 Arqule, Inc. Method for Determining Treatment Efficacy
US20150133331A1 (en) * 2012-05-21 2015-05-14 Purdue Research Foundation Metabolite biomarkers for the detection of liver cancer
CN105092842A (zh) * 2014-05-15 2015-11-25 中国科学院大连化学物理研究所 一种用于诊断肝癌的联合型代谢标志物及其检测试剂盒
KR20160014980A (ko) * 2014-07-30 2016-02-12 고려대학교 산학협력단 비알코올성 지방간 예방 및 치료용 약학적 조성물
KR20160096931A (ko) * 2015-02-06 2016-08-17 한국과학기술원 분비 대사체 분석을 통한 간독성 약물 스크리닝 방법
CN112881547A (zh) * 2021-01-12 2021-06-01 中国科学院大学宁波华美医院 一种肝硬化及肝炎人群早期肝癌诊断标志物的筛选方法
US20210401953A1 (en) * 2018-11-13 2021-12-30 The Broad Institute, Inc. Asparaginase therapeutic methods
WO2022240891A1 (en) * 2021-05-10 2022-11-17 The Cleveland Clinic Foundation Salivary metabolites are non-invasive biomarkers of hcc

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006113085A2 (en) * 2005-03-28 2006-10-26 Biocatalytics, Inc. D-amino acid dehydrogenase and method of making d-amino acids
US20100279956A1 (en) * 2007-11-02 2010-11-04 Mc Creedy Jr Bruce J Biomarkers For Fatty Liver Disease And Methods Using The Same
US20110301194A1 (en) * 2010-06-02 2011-12-08 Arqule, Inc. Method for Determining Treatment Efficacy
US20150133331A1 (en) * 2012-05-21 2015-05-14 Purdue Research Foundation Metabolite biomarkers for the detection of liver cancer
CN105092842A (zh) * 2014-05-15 2015-11-25 中国科学院大连化学物理研究所 一种用于诊断肝癌的联合型代谢标志物及其检测试剂盒
KR20160014980A (ko) * 2014-07-30 2016-02-12 고려대학교 산학협력단 비알코올성 지방간 예방 및 치료용 약학적 조성물
KR20160096931A (ko) * 2015-02-06 2016-08-17 한국과학기술원 분비 대사체 분석을 통한 간독성 약물 스크리닝 방법
US20210401953A1 (en) * 2018-11-13 2021-12-30 The Broad Institute, Inc. Asparaginase therapeutic methods
CN112881547A (zh) * 2021-01-12 2021-06-01 中国科学院大学宁波华美医院 一种肝硬化及肝炎人群早期肝癌诊断标志物的筛选方法
WO2022240891A1 (en) * 2021-05-10 2022-11-17 The Cleveland Clinic Foundation Salivary metabolites are non-invasive biomarkers of hcc

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
RALPH E. KIRSCH等: "Stimulation of albumin synthesis by keto analogues of amino acids", 《BIOCHIMICA ET BIOPHYSICA ACTA》, pages 437 - 441 *
张青松: "甲基硫代腺苷对结肠癌HCT116 细胞凋亡的影响及其机制", 《南方医科大学学报》, vol. 28, no. 2, pages 288 - 289 *
胡智祥: "《医院临床检验技术操作规范与实(化)验室管理全书》第一卷", 银声音像出版社, pages: 110 - 113 *

Also Published As

Publication number Publication date
CN116165385B (zh) 2023-07-18

Similar Documents

Publication Publication Date Title
CN110057955B (zh) 乙型肝炎特异性血清标志物的筛选方法
KLUPCZY—SKA et al. Metabolomics in medical sciences ń trends, challenges and perspectives
Brown et al. Cancer detection and biopsy classification using concurrent histopathological and metabolomic analysis of core biopsies
US7485852B2 (en) Mass analysis method and mass analysis apparatus
US20050101023A1 (en) Methods for diagnosing urinary tract and prostatic disorders
CN111289736A (zh) 基于代谢组学的慢阻肺早期诊断标志物及其应用
JP2011521215A (ja) 前立腺癌の診断及び治療のためのバイオマーカー及び薬剤標的発見法、並びにそれを用いて決定されるバイオマーカーアッセイ
CN110057954B (zh) 血浆代谢标志物在诊断或监测hbv的应用
JP2009540319A (ja) 質量分析バイオマーカーアッセイ
CN107110867A (zh) 用于肝癌诊断的生物标记物及其用途
CN103776891A (zh) 一种检测差异表达蛋白质的方法
CN112305121A (zh) 代谢标志物在动脉粥样硬化性脑梗死中的应用
US20160293394A1 (en) MALDI-TOF MS Method And Apparatus For Assaying An Analyte In A Bodily Fluid From A Subject
Song et al. MALDI‐TOF‐MS analysis in low molecular weight serum peptidome biomarkers for NSCLC
CN116165385B (zh) 用于肝癌诊断的血清代谢标志物及其筛选方法和应用
CN116148482A (zh) 用于乳腺癌患者鉴定的设备及其制备用途
CN116183924B (zh) 用于肝癌风险预测的血清代谢标志物及其筛选方法和应用
CN114791459B (zh) 用于检测肺结核的血清代谢标志物及其试剂盒
JP2014032046A (ja) 糖尿病性腎症鑑別用マーカー及びその用途
CN115684451A (zh) 基于代谢组学的食管鳞癌淋巴结转移诊断标志物及其应用
CN114705866A (zh) 基于血液的遗忘型轻度认知损害早期诊断外周血蛋白标志物、应用及其医疗辅助诊断系统
CA2605667A1 (en) Methods for detecting alzheimer&#39;s disease
Rainer et al. Mass spectrometric profiling of low-molecular-weight proteins
CN117147737B (zh) 用于食管鳞癌诊断的血浆组合标志物及试剂盒与检测方法
CN116087482B (zh) 用于2019新型冠状病毒感染患者病程严重程度分型的生物标志物

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant