CN112881547B - 一种肝硬化及肝炎人群早期肝癌诊断标志物的筛选方法 - Google Patents
一种肝硬化及肝炎人群早期肝癌诊断标志物的筛选方法 Download PDFInfo
- Publication number
- CN112881547B CN112881547B CN202110039332.0A CN202110039332A CN112881547B CN 112881547 B CN112881547 B CN 112881547B CN 202110039332 A CN202110039332 A CN 202110039332A CN 112881547 B CN112881547 B CN 112881547B
- Authority
- CN
- China
- Prior art keywords
- liver cancer
- hepatitis
- early
- screening
- people
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/04—Preparation or injection of sample to be analysed
- G01N30/06—Preparation
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/04—Preparation or injection of sample to be analysed
- G01N30/24—Automatic injection systems
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/26—Conditioning of the fluid carrier; Flow patterns
- G01N30/28—Control of physical parameters of the fluid carrier
- G01N30/34—Control of physical parameters of the fluid carrier of fluid composition, e.g. gradient
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/62—Detectors specially adapted therefor
- G01N30/72—Mass spectrometers
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/86—Signal analysis
- G01N30/8696—Details of Software
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/88—Integrated analysis systems specially adapted therefor, not covered by a single one of the groups G01N30/04 - G01N30/86
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/88—Integrated analysis systems specially adapted therefor, not covered by a single one of the groups G01N30/04 - G01N30/86
- G01N2030/8809—Integrated analysis systems specially adapted therefor, not covered by a single one of the groups G01N30/04 - G01N30/86 analysis specially adapted for the sample
- G01N2030/8813—Integrated analysis systems specially adapted therefor, not covered by a single one of the groups G01N30/04 - G01N30/86 analysis specially adapted for the sample biological materials
- G01N2030/8822—Integrated analysis systems specially adapted therefor, not covered by a single one of the groups G01N30/04 - G01N30/86 analysis specially adapted for the sample biological materials involving blood
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/88—Integrated analysis systems specially adapted therefor, not covered by a single one of the groups G01N30/04 - G01N30/86
- G01N2030/8809—Integrated analysis systems specially adapted therefor, not covered by a single one of the groups G01N30/04 - G01N30/86 analysis specially adapted for the sample
- G01N2030/884—Integrated analysis systems specially adapted therefor, not covered by a single one of the groups G01N30/04 - G01N30/86 analysis specially adapted for the sample organic compounds
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本发明涉及临床医学诊断技术领域,尤其涉及一种肝硬化及肝炎人群早期肝癌诊断标志物的筛选方法。一种肝硬化及肝炎人群早期肝癌诊断标志物的筛选方法,包括以下步骤:S1、数据获取,收集目标血浆样本并检测血浆样本中的代谢物;S2、判别模型构建,所述判别模型包括:区分肝硬化人群与原发性肝癌患者、区分肝炎人群与原发性肝癌患者;S3、筛选标志物;S4、诊断能力验证。本发明提供了一种利用高效液相色谱‑质谱联用系统获得肝硬化、肝炎、及肝细胞肝癌患者血浆的代谢轮廓,寻找潜在肿瘤代谢标志物组,构建诊断模型,用于辅助肝癌高危人群的肿瘤早期诊断的肝硬化及肝炎人群早期肝癌诊断标志物的筛选方法。
Description
技术领域
本发明涉及临床医学诊断技术领域,尤其涉及一种肝硬化及肝炎人群早期肝癌诊断标志物的筛选方法。
背景技术
原发性肝癌是肝硬化最严重并发症之一,目前肝癌的5年生存率普遍低于20%,病死率占我国恶性肿瘤的第二位。早期肝癌无特异性临床症状,无明显阳性体征或仅有类似肝硬化体征,当出现明显临床症状和体征时肝癌已处于中晚期,极大地影响了肝癌的治愈率及预后。因此对高危人群定期监测、早期诊治可有效延长患者生存期。高危人群可视为:有肝癌家族史、高病毒载量、病程长、合并多种病毒感染或伴随有嗜酒、肥胖和糖尿病等危险因素的肝硬化的患者。
血清甲胎蛋白作为肝癌相对特异的血清诊断学指标,联合肝脏影像学检查在临床肝癌筛查中已广泛应用。但约有30%~40%的肝癌患者AFP呈阴性。同时AFP在一些肝硬化及肝炎患者中亦可升高。因此,研究新的肿瘤标记物,作为肝癌筛查及诊断的重要补充,对肝癌的早期诊断意义重大。
代谢组学(metabolomics)是20世纪90年代中期发展起来的一门新兴学科,是对一个生物系统的细胞在特定时间和条件下所有小分子代谢物质的定量或半定量分析,与基因组学和蛋白质组学相比,代谢组学与生理学的联系更加紧密并可从整体上解析生物体系的功能和状态。当疾病导致机体的生理过程发生非正常变化,并引起代谢产物含量发生相应的改变时,我们可通过对代谢产物进行分析,寻找疾病的生物标志物,并通过生物标志物构建较好的疾病诊断方法。目前采用代谢组学方法筛选肝癌早期诊断的生物标志物逐渐成为研究热点。
发明内容
本发明的目的是针对现有技术的缺陷,提供了一种利用高效液相色谱-质谱联用系统获得肝硬化、肝炎、及肝细胞肝癌患者血浆的代谢轮廓,寻找潜在肿瘤代谢标志物组,构建诊断模型,用于辅助肝癌高危人群的肿瘤早期诊断的肝硬化及肝炎人群早期肝癌诊断标志物的筛选方法。
为了实现以上目的,本发明采用以下技术方案:
一种肝硬化及肝炎人群早期肝癌诊断标志物的筛选方法,包括以下步骤:
S1、数据获取,收集目标血浆样本并检测血浆样本中的代谢物,获得代谢物定性信息和相对含量的二维矩阵;
S2、判别模型构建,基于步骤S1所得的二维矩阵构建判别模型并筛选差异代谢物,所述判别模型包括:区分肝硬化人群与原发性肝癌患者、区分肝炎人群与原发性肝癌患者;
S3、筛选标志物,将步骤S2所得的差异代谢物二维矩阵进行交叉验证,获得早期筛查诊断标志物;
S4、诊断能力验证,通过支持向量机及随机森林判别模型对步骤S3所得的诊断标志物在肝炎及肝硬化患者的肝癌早期诊断中的诊断能力进行验证。
其中,肝炎人群早期肝癌诊断标志物包括:肌酐、鞘氨醇、(1S,5R)-2-甲基-5-(1-甲基乙烯基)-2-环己烯-1-醇、D-半乳糖、D-葡萄糖、胆红素、半乳糖鞘氨醇、二十二碳六烯酸、对苯二酚;肝硬化人群早期肝癌诊断标志物包括:6-磷酸海藻糖、脱氧腺苷、γ-亚麻酸、棕榈酸、乙醇酸、二十二碳六烯酸、抗坏血酸、花生四烯酸、胆绿素、6-磷酸葡萄糖、1-磷酸葡萄糖、假尿苷、尿苷、1-甲基腺苷、17a-乙炔雌二醇。
具体地,9种肝炎人群早期肝癌诊断标志物,在原发性肝癌患者中均呈不同程度的下降趋势。
15种肝硬化人群早期肝癌诊断标志物中,乙醇酸、胆绿素、脱氧腺苷、6-磷酸海藻糖、抗坏血酸、17a-乙炔雌二醇在原发性肝癌患者中呈不同程度的上升趋势;二十二碳六烯酸、1-甲基腺苷、γ-亚麻酸、尿苷、假尿苷、花生四烯酸、棕榈酸、1-磷酸葡萄糖、6-磷酸葡萄糖在原发性肝癌患者中呈不同程度的下降趋势。
在采用上述技术方案的基础上,本发明还可采用以下进一步的技术方案:
所述步骤S1采用超高效液相色谱质谱联用技术对每个血浆样本进行非靶向代谢物的检测,具体地,下机数据经软件处理后,去除空白干扰、样本缺失超过80%的化合物,外源性药物。利用MetaboAnalyst平台以及HDMB在线数据库对剩余化合物进行匹配,筛选出属于人体代谢物的化合物并形成包含定性结果和定量结果的二维矩阵
所述步骤S1还包括以下步骤:
S11、样本采集,使用抗凝管采集目标静脉血后通过离心获取上清液作为血浆样本。具体地,分别使用抗凝管采集肝硬化、肝炎、肝癌患者静脉血1mL,轻轻颠倒摇动收集管,以混匀血液,低温低速离心8~12min(血样采集后1h之内进行),取上清液作为血浆样本。
S12、样品前处理,将步骤S11所得的样本与实验溶剂进行混合并离心,获得上清液。具体地,将60~100μL血浆与300~350μL乙腈涡旋50~60s混合,在离心力18800~19000g温度3~4℃条件下离心8~10min以沉淀蛋白质。取140~155μL上清液冷冻干燥,分别以正电喷雾电离和负电喷雾电离(ESI1和ESI2)模式进行分析。质谱分析时加入45~55μL乙腈水溶液(乙腈:水=1:4v/v)复溶,涡旋震荡,在离心力13500~14500g温度3~4℃离心12~16min,取上清液进行分析。
S13、色谱分析,采用HILIC色谱柱对步骤S12所得的上清液进行分离并分析。具体地,样品采用HILIC色谱柱进行分离;柱温22~28℃;流速0.5~0.7mL/min;进样量1.5~2μL;流动相组成A:水+22~26mM乙酸铵+22~26mM氨水,B:乙腈;梯度洗脱程序如下:0---0.5min,94~96%B;0.5---7min,B从94~96%线性变化至60~66%;7---8min,B从60~66%线性变化至38~42%;8---9min,B维持在38~42%;9---9.1min,B从38~42%线性变化至94~96%;9.1---12min,B维持在94~96%;整个分析过程中样品置于4℃自动进样器中。为避免仪器检测信号波动而造成的影响,采用随机顺序进行样本的连续分析。样本队列中插入QC样品,用于监测和评价系统的稳定性及实验数据的可靠性。
S14、质谱分析,对步骤S13所得的结果进行检测以获得属于人体代谢物的化合物。采用可加热的电喷雾离子源(HESI),离子源温度330~360℃,辅助气温度300~320℃,辅助气流速8~12μL/min,离子传输管温度320~330℃;正离子模式:鞘气流速38~42μL/min,喷雾电压3.50kv;负离子模式:鞘气流速38~40μL/min,喷雾电压2.80kV。质谱分析扫描模式:全扫描,扫描范围m/z 80.00~1200.00,正负离子模式分别检测。
所述步骤S2判别模型的构建基于正交偏最小二乘判别分析算法、且结合独立样本t检验结果以筛选差异代谢物,所述步骤S2中的肝炎人群或肝硬化人群为对照组,所述步骤S2中的原发性肝癌患者为实验组,所述筛选差异代谢物的标准为OPLS-DA模型代谢物变量投影重要性值大于1且独立样本t检验p小于0.05。
所述步骤S3的交叉验证基于LASSO回归算法,步骤S2的差异代谢物二维矩阵为该算法的输入数据集,将该输入数据集进行交叉验证后选取最优正则化参数以构造判别模型,所述步骤S3中早期筛查诊断标志物的判断标准为LASSO回归判别模型中差异代谢物的权重系数大于0的特征。
具体地,LASSO回归相比于普通最小二乘估计,可以在变量众多的时候快速有效地提取出重要变量,起到简化模型作用。本发明通过python软件中的Lasso CV函数,将筛选出的差异代谢物二维矩阵作为LASSO回归(Logistic Regression)算法的输入数据集,并进行10次交叉验证,选取最优正则化参数alpha,构造判别模型。选取判别模型中权重系数大于0的特征作为肝硬化、肝炎人群肝癌早期筛查的诊断标志物。
所述步骤S4中支持向量机和随机森林判别模型的输入数据为步骤S3所得的诊断标志物构成的二维矩阵数据,所述步骤S4还包括随机将二维矩阵数据中的3/4分割为训练集且剩余1/4分割为预测集以进行学习,并通过ROC曲线的AUC值和准确率判断诊断能力。
具体地,支持向量机(SVM)是一种经典的二分类模型,基本模型为在特征空间中的最大间隔线性分类器,即通过参数优化使组间样本的间隔最大化,并在样本空间中找到一个划分超平面。随机森林(Random Forest)采用随机方式建立含多个决策树分类器,其输出类别结果由个别树输出的类别的众数而定。本发明随机选取3/4样本作为训练集,1/4样本作为测试集,并将筛选出的诊断标志物采用支持向量机(SVM)和随机森林判别模型(RandomForest Classifier)分别建立肝硬化人群与原发性肝癌患者、肝炎人群与原发性肝癌患者的分类模型。通过准确率(预测正确样本占总样本比率)和ROC曲线(Receiver OperatingCharacteristic)的AUC面积评价诊断能力。
本发明的有益效果为:利用代谢组学平台,采用超高效液相色谱-轨道阱高分辨质谱,检测肝癌高危人群(肝炎患者、肝硬化患者)与原发性肝癌患者血浆代谢物轮廓,通过与本地数据库中代谢物的保留时间、分子质量、二级碎裂谱图、碰撞能等信息进行匹配,对样本中的代谢物进行结构鉴定。利用多种统计学方法筛选肝癌高危人群与肝癌患者血浆中的诊断标志物,应用于肝癌高危人群的早期肝癌筛查和诊断,准确性较高。
附图说明
图1是本发明提供的一种肝硬化及肝炎人群早期肝癌诊断标志物的筛选方法的肝炎人群与原发性肝癌患者OPLS-DA得分图。
图2是本发明提供的一种肝硬化及肝炎人群早期肝癌诊断标志物的筛选方法的肝炎人群与原发性肝癌患者随机森林判别模型检测集ROC曲线。
图3是本发明提供的一种肝硬化及肝炎人群早期肝癌诊断标志物的筛选方法的肝硬化人群与原发性肝癌患者OPLS-DA得分图。
图4是本发明提供的一种肝硬化及肝炎人群早期肝癌诊断标志物的筛选方法的肝硬化人群与原发性肝癌患者随机森林判别模型检测集ROC曲线。
图5是本发明提供的一种肝硬化及肝炎人群早期肝癌诊断标志物的筛选方法的流程示意图。
具体实施方式
结合附图对本发明一种肝硬化及肝炎人群早期肝癌诊断标志物的筛选方法的具体方案具体实施例作进一步的阐述。
实施例一,肝炎人群肝癌早期诊断标志物的筛选。
研究对象:本研究包括24例肝炎人群血浆样本以及26例原发性肝癌患者血浆样本,所有血浆样本离心后置于-80℃冰箱内保存。研究时取出血浆样本,经样本预处理后,采用高效液相色谱质谱联用系统进行代谢组学分析,将二级质谱图与标准数据库进行比较确定物质结构,并通过相关软件处理得到含有化合物名称和峰面积的原始数据。再通过在线代谢组学分析平台Metaboanalyst对原始数据中的化合物进行匹配,并过滤非代谢物成分,最终获得所有样本原始代谢物含量矩阵。
将原始代谢物含量矩阵导入到SIMCA-P软件进行差异代谢物的寻找:应用正交偏最小二乘判别分析来区分肝炎人群和原发性肝癌患者的代谢物轮廓差异,模型的R2X=0.235,R2Y=0.977,Q2=0.951。如图1所示,肝炎人群(组别0)与原发性肝癌患者(组别1)具有显著的组间分类趋势,再选取变量权重值(VIP)大于1的变量进行独立样本t检验,并将具有显著性差异(p<0.05)的变量作为差异代谢物。
将差异代谢物构成二维矩阵输入至python软件进行进一步筛选,筛选采用的算法模型为Lasso回归,调用Lasso CV函数,进行10次交叉验证。最终筛选出9种代谢物作为肝炎人群早期肝癌筛查的诊断标志物(包含肌酐、鞘氨醇、(1S,5R)-2-甲基-5-(1-甲基乙烯基)-2-环己烯-1-醇、D-半乳糖、D-葡萄糖、胆红素、半乳糖鞘氨醇、二十二碳六烯酸、对苯二酚)。将肝炎人群与肝癌患者血浆中相应物质的浓度进行独立样本t检验并计算差异倍数,如表1所示:
其中,logFC>0表示与肝炎人群相比该标志物在原发性肝癌患者高含量,logFC<0表示该标志物在原发性肝癌患者中低含量,发现与肝炎人群相比,以上9种代谢物在肝癌患者中显著降低。
9种血浆诊断标志物采用随机森林和支持向量机算法构建肝炎人群早期诊断模型,并利用ROC曲线的AUC值和分类结果准确度对诊断性能进行评价,结果如表2所示:
图2为上述9种血浆代谢物组合构建的随机森林判别模型ROC曲线,其检测集和训练集的AUC值为0.971和0.976,因此该9种代谢物组合具有较高的诊断准确性,可做为肝炎人群早期肝癌筛查的诊断标志物。
实施例二,肝硬化人群早期诊断标志物的筛选。
研究对象:本研究包括28例肝硬化人群血浆样本以及26例原发性肝癌患者血浆样本,所有血浆样本离心后置于-80℃冰箱内保存。研究时取出血浆样本,经样本预处理后,采用高效液相色谱质谱联用系统进行代谢组学分析,将二级质谱图与标准数据库进行比较确定物质结构,并通过相关软件处理得到含有化合物名称和峰面积的原始数据。再通过在线代谢组学分析平台Metaboanalyst对原始数据中的化合物进行匹配,并过滤非代谢物成分,最终获得所有样本原始代谢物含量矩阵。
将原始代谢物含量矩阵导入到SIMCA-P软件进行差异代谢物的寻找:应用正交偏最小二乘判别分析来区分肝硬化人群和原发性肝癌患者的代谢物轮廓差异,模型的R2X=0.346,R2Y=0.965,Q2=0.897。如图3所示,肝硬化人群(组别0)与原发性肝癌患者(组别1)具有显著的组间分类趋势,再选取变量权重值(VIP)大于1的变量进行独立样本t检验,并将具有显著性差异(p<0.05)的变量作为差异代谢物。如表3所示:
其中,logFC>0表示与肝硬化人群相比该标志物在原发性肝癌患者高含量,logFC<0表示该标志物在原发性肝癌患者中低含量。
将该代谢差异物构成二维矩阵输入至python软件进行进一步筛选,筛选方法为Lasso回归,调用Lasso CV函数,进行10次交叉验证。最终筛选出15种代谢物作为肝炎人群早期肝癌筛查的诊断标志物(包含6-磷酸海藻糖、脱氧腺苷、γ-亚麻酸、棕榈酸、乙醇酸、二十二碳六烯酸、抗坏血酸、花生四烯酸、胆绿素、6-磷酸葡萄糖、1-磷酸葡萄糖、假尿苷、尿苷、1-甲基腺苷、17a-乙炔雌二醇)。将肝硬化人群与肝癌患者血浆中相应物质的浓度进行独立样本t检验并计算差异倍数(结果见表1),其中6种代谢物(乙醇酸、胆绿素、脱氧腺苷、6-磷酸海藻糖、抗坏血酸、17a-乙炔雌二醇)与肝硬化人群相比在肝癌患者中升高,尤其是乙醇酸、胆绿素上升幅度极大;其中9种代谢物(二十二碳六烯酸、1-甲基腺苷、γ-亚麻酸、尿苷、假尿苷、花生四烯酸、棕榈酸、1-磷酸葡萄糖、6-磷酸葡萄糖)与肝硬化人群相比在肝癌患者中下降。
15种血浆诊断标志物采用随机森林和支持向量机算法构建肝硬化人群早期诊断模型,并利用ROC曲线的AUC值和分类结果准确度对诊断性能进行评价,结果如表4所示:
图4为上述15种血浆代谢物组合构建的随机森林判别模型ROC曲线,其检测集和训练集的AUC值为0.867和0.994,因此该15种代谢物组合具有较高的诊断准确性,可做为肝硬化人群早期肝癌筛查的诊断标志物。
实施例三,具体地,步骤S1还包括以下步骤:
S11、样本采集,使用抗凝管采集目标静脉血后通过离心获取上清液作为血浆样本。具体地,分别使用抗凝管采集肝硬化、肝炎、肝癌患者静脉血1mL,轻轻颠倒摇动收集管,以混匀血液,低温低速离心8min(血样采集后1h之内进行),取上清液作为血浆样本。
S12、样品前处理,将步骤S11所得的样本与实验溶剂进行混合并离心,获得上清液。具体地,将60μL血浆与300~350μL乙腈涡旋50s混合,在离心力18800g温度为3℃条件下,离心8min以沉淀蛋白质。取140μL上清液冷冻干燥,分别以正电喷雾电离和负电喷雾电离(ESI1和ESI2)模式进行分析。质谱分析时加入45μL乙腈水溶液(乙腈:水=1:4v/v)复溶,涡旋震荡,13500g,3℃离心12min,取上清液进行分析。
S13、色谱分析,采用HILIC色谱柱对步骤S12所得的上清液进行分离并分析。具体地,样品采用HILIC色谱柱进行分离;柱温22℃;流速0.5mL/min;进样量1.5μL;流动相组成A:水+22mM乙酸铵+22mM氨水,B:乙腈;梯度洗脱程序如下:0---0.5min,94%B;0.5---7min,B从94%线性变化至60%;7---8min,B从60%线性变化至38%;8---9min,B维持在38%;9---9.1min,B从38%线性变化至94%;9.1---12min,B维持在94%;整个分析过程中样品置于4℃自动进样器中。为避免仪器检测信号波动而造成的影响,采用随机顺序进行样本的连续分析。样本队列中插入QC样品,用于监测和评价系统的稳定性及实验数据的可靠性。
S14、质谱分析,对步骤S13所得的结果进行检测以获得属于人体代谢物的化合物。采用可加热的电喷雾离子源(HESI),离子源温度330℃,辅助气温度300℃,辅助气流速8μL/min,离子传输管温度320℃;正离子模式:鞘气流速38μL/min,喷雾电压3.50kv;负离子模式:鞘气流速38μL/min,喷雾电压2.80kV。质谱分析扫描模式:全扫描,扫描范围m/z 80.00~1200.00,正负离子模式分别检测。
实施例四,具体地,步骤S1还包括以下步骤:
S11、样本采集,使用抗凝管采集目标静脉血后通过离心获取上清液作为血浆样本。具体地,分别使用抗凝管采集肝硬化、肝炎、肝癌患者静脉血1mL,轻轻颠倒摇动收集管,以混匀血液,低温低速离心10min(血样采集后1h之内进行),取上清液作为血浆样本。
S12、样品前处理,将步骤S11所得的样本与实验溶剂进行混合并离心,获得上清液。具体地,将80μL血浆与320μL乙腈涡旋60s混合,18920g4℃离心10min以沉淀蛋白质。取150μL上清液冷冻干燥,分别以正电喷雾电离和负电喷雾电离(ESI1和ESI2)模式进行分析。质谱分析时加入50μL乙腈水溶液(乙腈:水=1:4v/v)复溶,涡旋震荡,14000g4℃离心15min,取上清液进行分析。
S13、色谱分析,采用HILIC色谱柱对步骤S12所得的上清液进行分离并分析。具体地,样品采用HILIC色谱柱进行分离;柱温25℃;流速0.5mL/min;进样量2μL;流动相组成A:水+25mM乙酸铵+25mM氨水,B:乙腈;梯度洗脱程序如下:0---0.5min,95%B;0.5---7min,B从95%线性变化至65%;7---8min,B从65%线性变化至40%;8---9min,B维持在40%;9---9.1min,B从40%线性变化至95%;9.1---12min,B维持在95%;整个分析过程中样品置于4℃自动进样器中。为避免仪器检测信号波动而造成的影响,采用随机顺序进行样本的连续分析。样本队列中插入QC样品,用于监测和评价系统的稳定性及实验数据的可靠性。
S14、质谱分析,对步骤S13所得的结果进行检测以获得属于人体代谢物的化合物。采用可加热的电喷雾离子源(HESI),离子源温度350℃,辅助气温度300℃,辅助气流速10μL/min,离子传输管温度320℃;正离子模式:鞘气流速40μL/min,喷雾电压3.50kv;负离子模式:鞘气流速38μL/min,喷雾电压2.80kV。质谱分析扫描模式:全扫描,扫描范围m/z 80.00~1200.00,正负离子模式分别检测。本实施例中效果优于实施例三和实施例五。
实施例五,具体地,步骤S1还包括以下步骤:
S11、样本采集,使用抗凝管采集目标静脉血后通过离心获取上清液作为血浆样本。具体地,分别使用抗凝管采集肝硬化、肝炎、肝癌患者静脉血1mL,轻轻颠倒摇动收集管,以混匀血液,低温低速离心12min(血样采集后1h之内进行),取上清液作为血浆样本。
S12、样品前处理,将步骤S11所得的样本与实验溶剂进行混合并离心,获得上清液。具体地,将100μL血浆与350μL乙腈涡旋60s混合,19000g4℃离心10min以沉淀蛋白质。取155μL上清液冷冻干燥,分别以正电喷雾电离和负电喷雾电离(ESI1和ESI2)模式进行分析。质谱分析时加入55μL乙腈水溶液(乙腈:水=1:4v/v)复溶,涡旋震荡,14500g4℃离心16min,取上清液进行分析。
S13、色谱分析,采用HILIC色谱柱对步骤S12所得的上清液进行分离并分析。具体地,样品采用HILIC色谱柱进行分离;柱温28℃;流速0.7mL/min;进样量2μL;流动相组成A:水+26mM乙酸铵+26mM氨水,B:乙腈;梯度洗脱程序如下:0---0.5min,96%B;0.5---7min,B从96%线性变化至66%;7---8min,B从66%线性变化至42%;8---9min,B维持在42%;9---9.1min,B从42%线性变化至96%;9.1---12min,B维持在96%;整个分析过程中样品置于4℃自动进样器中。为避免仪器检测信号波动而造成的影响,采用随机顺序进行样本的连续分析。样本队列中插入QC样品,用于监测和评价系统的稳定性及实验数据的可靠性。
S14、质谱分析,对步骤S13所得的结果进行检测以获得属于人体代谢物的化合物。采用可加热的电喷雾离子源(HESI),离子源温度360℃,辅助气温度320℃,辅助气流速12μL/min,离子传输管温度330℃;正离子模式:鞘气流速42μL/min,喷雾电压3.50kv;负离子模式:鞘气流速40μL/min,喷雾电压2.80kV。质谱分析扫描模式:全扫描,扫描范围m/z 80.00~1200.00,正负离子模式分别检测。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (8)
1.一种肝硬化及肝炎人群早期肝癌诊断标志物的筛选方法,其特征在于包括以下步骤:
S1、数据获取,收集目标血浆样本并检测血浆样本中的代谢物,获得代谢物定性信息和相对含量的二维矩阵;
S2、判别模型构建,基于步骤S1所得的二维矩阵构建判别模型并筛选差异代谢物,所述判别模型包括:区分肝硬化人群与原发性肝癌患者、区分肝炎人群与原发性肝癌患者;
S3、筛选标志物,将步骤S2所得的差异代谢物二维矩阵进行交叉验证,获得早期筛查诊断标志物;
所述步骤S3中的早期筛查诊断标志物包括肝炎人群早期肝癌诊断标志物和肝硬化人群早期肝癌诊断标志物,
所述肝炎人群早期肝癌诊断标志物组合包括:肌酐、鞘氨醇、(1S,5R)-2-甲基-5-(1-甲基乙烯基)-2-环己烯-1-醇、D-半乳糖、D-葡萄糖、胆红素、半乳糖鞘氨醇、二十二碳六烯酸和对苯二酚;
所述肝硬化人群早期肝癌诊断标志物组合包括:6-磷酸海藻糖、脱氧腺苷、γ-亚麻酸、棕榈酸、乙醇酸、二十二碳六烯酸、抗坏血酸、花生四烯酸、胆绿素、6-磷酸葡萄糖、1-磷酸葡萄糖、假尿苷、尿苷、1-甲基腺苷和17a-乙炔雌二醇;
S4、诊断能力验证,通过支持向量机及随机森林判别模型对步骤S3所得的诊断标志物在肝炎及肝硬化患者的肝癌早期诊断中的诊断能力进行验证。
2.根据权利要求1所述的一种肝硬化及肝炎人群早期肝癌诊断标志物的筛选方法,其特征在于步骤S1采用超高效液相色谱质谱联用技术对每个血浆样本进行非靶向代谢物的检测。
3.根据权利要求2所述的一种肝硬化及肝炎人群早期肝癌诊断标志物的筛选方法,其特征在于所述步骤S1还包括以下步骤:
S11、样本采集,使用抗凝管采集目标静脉血后通过离心获取上清液作为血浆样本;
S12、样品前处理,将步骤S11所得的样本与实验溶剂进行混合并离心,获得上清液;
S13、色谱分析,采用HILIC色谱柱对步骤S12所得的上清液进行分离并分析;
S14、质谱分析,对步骤S13所得的结果进行检测以获得属于人体代谢物的化合物。
4.根据权利要求1所述的一种肝硬化及肝炎人群早期肝癌诊断标志物的筛选方法,其特征在于步骤S2判别模型的构建基于正交偏最小二乘判别分析算法、且结合独立样本t检验结果以筛选差异代谢物,所述步骤S2中的肝炎人群或肝硬化人群为对照组,所述步骤S2中的原发性肝癌患者为实验组,所述筛选差异代谢物的标准为OPLS-DA模型代谢物变量投影重要性值大于1且独立样本t检验p小于0.05。
5.根据权利要求1所述的一种肝硬化及肝炎人群早期肝癌诊断标志物的筛选方法,其特征在于所述步骤S3的交叉验证基于LASSO回归算法,步骤S2的差异代谢物二维矩阵为该算法的输入数据集,将该输入数据集进行交叉验证后选取最优正则化参数以构造判别模型,所述步骤S3中早期筛查诊断标志物的判断标准为LASSO回归判别模型中差异代谢物的权重系数大于0的特征。
6.根据权利要求1所述的一种肝硬化及肝炎人群早期肝癌诊断标志物的筛选方法,其特征在于所述步骤S4中支持向量机和随机森林判别模型的输入数据为步骤S3所得的诊断标志物构成的二维矩阵数据,所述步骤S4还包括随机将二维矩阵数据中的3/4分割为训练集且剩余1/4分割为预测集以进行学习,并通过ROC曲线的AUC值和准确率判断诊断能力。
7.根据权利要求1所述的一种肝硬化及肝炎人群早期肝癌诊断标志物的筛选方法,其特征在于所述肝炎人群早期肝癌诊断标志物在原发性肝癌患者中均呈下降趋势。
8.根据权利要求1所述的一种肝硬化及肝炎人群早期肝癌诊断标志物的筛选方法,其特征在于所述肝硬化人群早期肝癌诊断标志物中,乙醇酸、胆绿素、脱氧腺苷、6-磷酸海藻糖、抗坏血酸、17a-乙炔雌二醇在原发性肝癌患者中呈上升趋势;二十二碳六烯酸、1-甲基腺苷、γ-亚麻酸、尿苷、假尿苷、花生四烯酸、棕榈酸、1-磷酸葡萄糖、6-磷酸葡萄糖在原发性肝癌患者中呈下降趋势。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110039332.0A CN112881547B (zh) | 2021-01-12 | 2021-01-12 | 一种肝硬化及肝炎人群早期肝癌诊断标志物的筛选方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110039332.0A CN112881547B (zh) | 2021-01-12 | 2021-01-12 | 一种肝硬化及肝炎人群早期肝癌诊断标志物的筛选方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112881547A CN112881547A (zh) | 2021-06-01 |
CN112881547B true CN112881547B (zh) | 2023-04-21 |
Family
ID=76044871
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110039332.0A Active CN112881547B (zh) | 2021-01-12 | 2021-01-12 | 一种肝硬化及肝炎人群早期肝癌诊断标志物的筛选方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112881547B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113945724B (zh) * | 2021-10-29 | 2022-07-05 | 暨南大学 | 一种阈下抑郁风险预测装置及其试剂盒和应用 |
CN114373510B (zh) * | 2021-11-09 | 2023-12-01 | 武汉迈特维尔医学科技有限公司 | 用于肺癌诊断或监测的代谢标志物及其筛选方法和应用 |
CN114813994B (zh) * | 2022-03-16 | 2024-02-09 | 郑州大学第一附属医院 | 一种用于癫痫发作控制患者无创诊断的血清代谢物标志物及其应用 |
CN115184515A (zh) * | 2022-06-29 | 2022-10-14 | 中山大学附属第一医院 | 一种用于肝癌诊断的联合型血浆代谢标记物、其筛选方法及应用 |
CN115575635A (zh) * | 2022-09-28 | 2023-01-06 | 兰州大学第一医院 | 一种胆管癌诊断标志物及其筛选方法和应用 |
CN116165385B (zh) * | 2023-04-25 | 2023-07-18 | 南方医科大学南方医院 | 用于肝癌诊断的血清代谢标志物及其筛选方法和应用 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102445512A (zh) * | 2010-10-09 | 2012-05-09 | 中国人民解放军第二军医大学 | 鉴别肝癌、肝炎或肝硬化的小分子代谢物图谱及其制作方法 |
CN108990420B (zh) * | 2016-05-29 | 2022-06-24 | 深圳市绘云生物科技有限公司 | 肝病相关生物标志物和其使用方法 |
CN109725072A (zh) * | 2017-10-27 | 2019-05-07 | 中国医学科学院药物研究所 | 一种基于lc-ms/ms技术的筛查癌症生物标志物的靶向定性定量代谢组学分析方法 |
CN109884302B (zh) * | 2019-03-14 | 2023-02-03 | 北京博远精准医疗科技有限公司 | 基于代谢组学和人工智能技术的肺癌早期诊断标志物及其应用 |
WO2020252413A1 (en) * | 2019-06-13 | 2020-12-17 | The Regents Of The University Of California | Methods and compositions for determination liver fibrosis |
CN110568174B (zh) * | 2019-07-31 | 2021-03-30 | 山西大学 | 一种早期肝癌大鼠模型的构建及评价方法 |
CN110514772A (zh) * | 2019-08-09 | 2019-11-29 | 中国医学科学院基础医学研究所 | 透明肾细胞癌代谢标志物在肾细胞癌早期筛查和诊断产品中的应用 |
CN110850073B (zh) * | 2019-11-08 | 2023-04-11 | 郑州大学第一附属医院 | 肝硬化阳离子标志物的筛选方法和应用 |
-
2021
- 2021-01-12 CN CN202110039332.0A patent/CN112881547B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN112881547A (zh) | 2021-06-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112881547B (zh) | 一种肝硬化及肝炎人群早期肝癌诊断标志物的筛选方法 | |
CN110057955B (zh) | 乙型肝炎特异性血清标志物的筛选方法 | |
EP2284540A1 (en) | Method of diagnosing organ failure | |
CN111289736A (zh) | 基于代谢组学的慢阻肺早期诊断标志物及其应用 | |
AU2007230967A1 (en) | Apolipoprotein fingerprinting technique | |
CN113960235B (zh) | 生物标志物在制备肺癌检测试剂中的用途和方法 | |
WO2011157655A1 (en) | Use of bile acids for prediction of an onset of sepsis | |
US20170023575A1 (en) | Identification of blood based metabolite biomarkers of pancreatic cancer | |
CN110057954B (zh) | 血浆代谢标志物在诊断或监测hbv的应用 | |
CN113156018B (zh) | 一种肝胆疾病诊断模型的建立方法及诊断系统 | |
CN112201356B (zh) | 口腔鳞状细胞癌诊断模型的构建方法、标志物及其应用 | |
Liang et al. | Serum metabolomics uncovering specific metabolite signatures of intra-and extrahepatic cholangiocarcinoma | |
CN111562338A (zh) | 透明肾细胞癌代谢标志物在肾细胞癌早期筛查和诊断产品中的应用 | |
CN112599239B (zh) | 代谢物标志物及其在脑梗死诊断中的应用 | |
CN112305122B (zh) | 代谢物标志物及其在疾病中的应用 | |
CN112669958B (zh) | 代谢物作为疾病诊断的生物标志物 | |
WO2006129401A1 (ja) | プロテオーム網羅的解析における特異的蛋白質のスクリーニング方法 | |
CN111721882A (zh) | 一种自组装检测术后谵妄的代谢组学标记物试剂盒以及应用 | |
Zhou et al. | Clinical lipidomics analysis reveals biomarkers of lipid peroxidation in serum from patients with rheumatoid arthritis | |
CN112630344B (zh) | 代谢标志物在脑梗死中的用途 | |
CN112630330B (zh) | 小分子物质在脑梗死诊断中的应用 | |
CN112305119B (zh) | 动脉粥样硬化性脑梗死的生物标志物及其应用 | |
CN109444277B (zh) | 代谢标志物在制备胶质瘤诊断试剂盒方面的应用 | |
CN112147344B (zh) | 动脉粥样硬化性脑梗死的代谢标志物及其在诊疗中的应用 | |
CN112834652B (zh) | 急性主动脉夹层患者特异性生物标志组合物及其用途 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |