CN104713970A - 一种血清代谢组学分析模型的构建方法 - Google Patents

一种血清代谢组学分析模型的构建方法 Download PDF

Info

Publication number
CN104713970A
CN104713970A CN201510150409.6A CN201510150409A CN104713970A CN 104713970 A CN104713970 A CN 104713970A CN 201510150409 A CN201510150409 A CN 201510150409A CN 104713970 A CN104713970 A CN 104713970A
Authority
CN
China
Prior art keywords
sample
serum
model
serum sample
cancer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510150409.6A
Other languages
English (en)
Other versions
CN104713970B (zh
Inventor
王家林
张涛
薛付忠
赵德利
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHANDONG TUMOR HOSPITAL
Original Assignee
SHANDONG TUMOR HOSPITAL
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANDONG TUMOR HOSPITAL filed Critical SHANDONG TUMOR HOSPITAL
Priority to CN201510150409.6A priority Critical patent/CN104713970B/zh
Publication of CN104713970A publication Critical patent/CN104713970A/zh
Application granted granted Critical
Publication of CN104713970B publication Critical patent/CN104713970B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Investigating Or Analysing Biological Materials (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

本发明公开了一种血清代谢组学分析模型的构建方法,构建方法包括:收集健康血清样本和患病血清样本;对样本进行LC-MS检测,得原始代谢指纹图谱;将图谱进行预处理,所得二维矩阵依次进行主成分分析和偏最小二乘判别分析,得PLS-DA模型,对得到的PLS-DA模型进行验证,无过拟合危险,则模型构建完成。本发明首次将血清代谢组学分析技术用于食管癌早期筛查中,通过构建的模型可以快速、便捷的筛选出食管癌高发人群,缩小食管癌筛查的范围,有效提高了食管癌高发区全人群筛查的效率,大大降低了筛查成本,有效避免了部分人群有创胃镜造成的痛苦,具有重要的经济和社会效益,便于推广应用。

Description

一种血清代谢组学分析模型的构建方法
技术领域
本发明涉及一种血清代谢组学分析模型的构建方法,通过本发明方法得到的模型可以方便、快捷对食管癌进行早期初步筛查,属于分析技术领域。
背景技术
食管癌(esophageal cancer)是由食管鳞状上皮或腺上皮的异常增生所形成的恶性病变,是由不典型增生到癌的逐渐演变的过程。据世界卫生组织最新数据表明:全世界每年约有40万人死于食管癌,我国是食管癌发病率和死亡率最高的国家,且90%患者的组织类型为鳞状细胞癌。山东省汶河流域为食管癌高发区,以肥城市、宁阳县和汶上县最高,发病率分别为93.95/10万、88.68/10万和62.26/10万,远高于全国一般水平(16.7/10万),尤其是肥城市,其发病率为山东省平均水平的3.7倍,占到全县肿瘤死因的50% 。食管癌的高发病率和高死亡率给我国尤其是山东省汶河流域造成了巨大的疾病负担和经济负担,已经成为严重的公共卫生问题,亟待解决。
食管癌的病因复杂,多数学者认为是基因与环境共同作用的结果,食管癌发病的地域聚集性提示其与环境因素及不良生活习惯相关,如膳食成分中维生素与微量元素缺乏、进食含亚硝胺类较多的食物、如喜欢腌制酸菜或霉变食品、长期喜进烫食、吸烟、饮酒不良嗜好等。分子学研究表明食管癌的发生是多因素、多阶段、多基因变异的积累以及各因素与环境因素相互作用的结果,涉及众多原癌基因、抑癌基因以及蛋白质的改变,以及细胞周期。从癌前病变到食管癌的发生往往会经历漫长的过程,食管癌的重要癌前病变为食管鳞状上皮轻、中、重度不典型增生,由轻度不典型增生到癌变一般需要几年甚至十几年。如果在此期间,癌前病变人群改变不良生活习惯、进行预防性服药,那么将大大降低其癌变的几率。因此,食管癌癌前病变的早期识别和干预对降低其癌变率显得尤为重要。
为筛查处于轻度、中度和重度不典型增生的癌前病变状态或早期食管癌的病例,国家自2008年起在山东省肥城市(全国食管癌早诊早治示范基地),针对示范基地内的所有40~69岁的人群,借助胃镜下碘染色指示性活检技术,开展了食管癌早诊早治项目。食管内镜碘染色检查后对可疑粘膜活检并进行组织病理学检查,是目前食管癌高发区普查、高危人群筛检和早期诊断中的金标准方法。由于其直观,图像淸晰且特异性高,目前还没有一种方法能替代其地位。虽然该方法准确度高,但仍具有一定的局限性:胃镜为有创检查,且受检者感觉痛苦,在执行过程中有不依从现象;胃镜下碘染色指示性活检技术操作复杂、成本较高,如果在高发的示范区之外推广的可行性及效率仍有待商榷;食管癌高发区的碘染色阳性率不到10%,高达90%的待筛查人群要承受有创胃镜检查的痛苦,还给国家早诊早治项目带来了不必要的经济负担。因此,急需开发一种新的更简便的方法,探寻在食管癌发生发展阶段机体内环境的变化,为食管癌的金标准筛检方法(即胃镜下碘染色指示性活检技术)提供初筛的科学依据和转化医学支持,以区分碘染色阴性和碘染色阳性人群,从而避免碘染色阴性人群承受有创胃镜的痛苦并减少早诊早治项目的财政支出。此外,在食管癌早诊早治项目早期曾试行使用哈佛癌症风险预测模型(问卷涉及的内容包括生活环境、饮食方式和习惯、心情和情绪、既往病史及恶性肿瘤家族史等五大方面)初步筛查食管癌高危个体,然后针对高危个体再施行胃镜下碘染色指示性活检技术。但在实际执行中发现其具有较高的假阴性率(即漏诊),ROC曲线下面积AUC为0.70 (95%CI, 0.66–0.74) (文献来源:Thrift AP, Kendall BJ, Pandeya N, Vaughan TL, Whiteman DC. A clinical risk prediction model for Barrett esophagus. Cancer Prev Res (Phila), 2012,5(9):1115-23.)。由于该传统初筛方法效果不理想,目前食管癌筛查范围仅作40-69岁的年龄限定。
代谢组学是对生物样品(如血清、尿液、唾液等)中所有分子量低于1000Da小分子代谢物(如脂肪酸、氨基酸、核苷及甾体等生物小分子)进行定性定量检测,从而监测机体受疾病或危险因素累积等干扰后内源性物质做出的代谢响应。体内的生物信息由基因经转录传递给蛋白质,最终体现为小分子代谢物。不同于基因组学和蛋白组学反映的生物体内在差异,代谢组学的研究领域扩展到了机体与环境之间的相互影响和作用。小分子代谢物不仅是机体生命活动、生化代谢的物质基础,还体现了某些外来因素对体内代谢环境的改变,因而某些独特代谢物的浓度在不同个体间的差异事实上反映了疾病内在的表现和外在病因。近年来研究发现,诸如代谢性疾病和恶性肿瘤(卵巢癌)等疾病发生发展过程中,机体基础生化代谢均发生了明显变化,对人类理解复杂疾病的代谢机制将发挥重要作用,同时为复杂疾病的筛检和早期诊断提供崭新的技术方法。
食管癌是一种典型的代谢性疾病,在我国90%以上患者为食管鳞状细胞癌(ESCC),其通常表现为机体整体的代谢紊乱,因此代谢组学技术和方法非常适合于食管癌的研究。目前,已经有人利用代谢组学对食管癌进行研究,例如Wu等(Wu H, Xue R, Lu C, et al. Metabolomic study for diagnostic model of oesophageal cancer using gas chromatography/mass spectrometry. J Chromatogr B Analyt Technol Biomed Life Sci, 2009,877(27):3111-7.)、Zhang等(Zhang J, Bowers J, Liu L, et al. Esophageal cancer metabolite biomarkers detected by LC-MS and NMR methods. PLoS One, 2012,7(1):e30181.)、Xu等(Xu J, Chen Y, Zhang R, et al. Global and targeted metabolomics of esophageal squamous cell carcinoma discovers  potential diagnostic and therapeutic biomarkers. Mol Cell Proteomics, 2013,12(5):1306-18.)都利用代谢组学技术对食管癌进行了研究,但总体来说这些研究大多集中于病理学和发病机制的研究,为疾病的发生机理提供了新的线索,所使用的样本也是基于医院采集的食管癌晚期患者的样本,所得的研究结果仅能发现食管癌发病晚期同健康对照相比的代谢轮廓差异,而癌症晚期的血清代谢情况与癌前病变的血清代谢差异巨大,并不能对于食管癌的早期筛检和早期诊断带来帮助。并且,目前上述研究方法在健康对照选取上容易受到选择性偏倚影响,造成评价结果的推广性较差。
发明内容
针对现有技术中食管癌早期筛查方法繁琐、费用高、对检测人群造成痛苦等不足,还没有一种简便快捷、适合大范围的缺陷,本发明提供了一种血清代谢组学分析模型的构建方法及所得模型,该分析模型构建方法简单,能够代替胃镜下碘染色指示性活检技术对人群进行食管癌早期、初步筛查,既经济实惠、方便快捷,又能避免待检测人群的痛苦,便于推广应用。
本发明针对目前采用胃镜下碘染色指示性活检技术对食管癌进行初步筛查的不足,首次提出采用血清代谢组学技术代替胃镜下碘染色指示性活检技术对食管癌进行初步筛查的思路。本发明依托“国家食管癌早诊早治示范基地(山东省肥城市)”的食管癌筛检与随访人群队列,针对项目中所有胃镜下碘染色指示性活检对象,采集初次发现的上消化道病变、食管癌癌前病变和食管癌早期患者的血清标本,并随机抽取筛检中无上消化道病变的健康对象作为对照组,使用快速分离液相色谱和质谱仪(LC/MS)的高通量检测获得相应的代谢指纹图谱,并通过对图谱的进一步分析构建得到了模型,该模型能够分析辨别血清代谢物情况,通过血清代谢物情况能够初步判断是否具有食管癌患病危险。利用本发明模型可以用于高发病区的全人群食管癌早期筛检,筛除没有患病危险的人群,然后再针对高危个体进行常规内镜检查,判断是否患有食管癌。本发明缩小了内镜检查的范围,对于食管癌筛检的实施和推广有着重要的经济和社会效益。
本发明具体技术方案如下:
一种血清代谢组学分析模型的构建方法,包括以下步骤:
(1)收集健康血清样本和患病血清样本,作为分析样本;
(2)将每个分析样本采用LC-MS血清代谢组学技术进行分析,得健康血清样本和患病血清样本的原始代谢指纹图谱;
(3)将健康血清样本和患病血清样本的原始代谢指纹图谱进行图谱预处理,得到每行为分析样本,每列为代谢物信息的二维矩阵,用于进一步的统计分析;
(4)将步骤(3)的二维矩阵依次进行主成分分析(PCA)和偏最小二乘判别分析(PLS-DA),得PLS-DA模型,对得到的PLS-DA模型进行验证,无过拟合危险,则所得PLS-DA模型即为血清代谢组学分析模型。
上述构建方法中,所述LC-MS血清代谢组学技术是采用液相色谱-质谱联用系统检测血清的代谢指纹图谱的方法,本发明的优选实施方式中,所用的液相色谱-质谱联用系统为超高效液相色谱-高分辨质谱联用系统(UPLC-QTOF/MS)。优选的,液相色谱所用色谱柱为Waters ACQUITY UPLC                                                HSS T3(1.8 μm; 100 mm (length) × 2.1 mm)色谱柱,进样量为6μL,进样温度为4℃,流速为0.5 ml/min。色谱流动相包含两种溶剂:A为0.1wt%甲酸水溶液(正离子ESI+)或0.5mmol/L氟化铵水溶液(负离子ESI-),B为0.1wt%甲酸的乙腈溶液(正离子ESI+)或纯乙腈(负离子ESI-)。色谱梯度洗脱条件为:0-1min为1%B,1-8min为1%B-100%B逐渐递增,然后10-10.1min为100%B迅速减为1%B,然后1%B持续1.9min。优选的,质谱检测使用四极杆时间飞行质谱仪Q-TOF,并采用电喷雾离子源的正离子模式(ESI+)和负离子模式(ESI-)。离子源温度设定为400℃,锥孔气流量为12L/min。同时,脱溶剂气温设定为250℃,脱溶剂气流量16L/min。在正离子和负离子模式下毛细管电压分别为+3kV和-3kV,锥孔电压均为0V。锥孔压力为20psi(正离子)和40psi(负离子)。图谱数据采集的质荷比范围为50~1200 m/z,采集的扫描频率为0.25s。
上述构建方法中,所述患病血清样本选自食管炎患者、轻度不典型增生患者、重度不典型增生患者、中度不典型增生患者、食管癌癌前病变患者、食管癌早期患者和原位癌患者的血清。所述患者血清样本可以是患有上述一种病症的患者的血清,也可以是患有上述两种或两种以上的病症的患者的血清(例如患病血清为食管炎患者血清和轻度不典型增生患者的血清,或者是重度不典型增生患者血清、中度不典型增生患者血清和食管癌早期患者血清),优选的,患病血清样本含有患有上述每种病症的患者的血清(即患病血清样本中同时含有食管炎、轻度不典型增生、重度不典型增生、中度不典型增生、食管癌癌前病变、食管癌早期和原位癌患者的血清),预测准确度更高。
上述构建方法中,所述健康血清样本为没有患病血清样本所对应疾病或者与所对应疾病类似的疾病的人群的血清,也可以说是健康血清样本为没有上消化道病变的人群的血清。
上述构建方法中,所得PLS-DA模型的R2X=0.231, R2Y=0.749, Q2cum=0.638。在此情况下模型灵敏度高,特异性好,具有很好的外推效果。
上述构建方法中,所述健康血清样本和患病血清样本均来自40-69岁人群。
上述构建方法中,所选择的血清样本数量大,所述患病血清样本453个,健康血清样本187个,预测效果更高。
上述构建方法中,为了实时监测模型构建时的质量控制情况,加入质量控制样品进行质量控制。加入方式为:每10个分析样本加入一个质量控制样品,该质量控制样品可以用于实时监测分析样本从进样前处理到分析过程中的质量控制情况。所述质量控制样品组成相同,均为同一健康血清样本和同一患病血清样本按照1:1的体积比混合得到的样品。
上述构建方法中,在取得分析样本和质量控制样品后,要对他们进行预处理,预处理后再加入液相色谱-质谱联用系统进行检测。进样前的预处理包括以下步骤:
(1)用移液器抽取50μl分析样本或质量控制样品,置于Bravo自动标本处理系统(Agilent,USA)的96孔板上;
(2)加入150μl甲醇提取,涡旋30s,并在-20℃下孵化以沉淀蛋白。
(3)然后于高速离心机中在4℃下以4000转/分离心20min;
(4)将步骤(3)的上清液倒入LC-MS进样瓶中,保存在-80℃下以备LC-MS检测。
上述Bravo自动标本处理系统,也叫Bravo自动化液体处理平台。
上述分析样本和质量控制样品预处理过程中,如果分析样本和质量控制样品取样时间较长,可以将它们放入-80℃冰箱内保存,预处理时将装有已冷冻的0.4ml分析样本或质量控制样品的0.5ml离心管置于水中,水平面以没过冰冻表面为宜,放入冰箱冷藏室中进行解冻;完全解冻后,涡旋30s。经过以上解冻处理后再用上述预处理步骤进行预处理。
上述构建方法中,对原始代谢指纹图谱进行图谱预处理是指:用Masshunter软件将获得的原始代谢指纹图谱转换为MZdata数据文件,然后将Mzdata数据文件使用XCMS软件包进行包括保留时间校正、峰识别、峰匹配和峰对齐的预处理操作,得到可用于统计分析的二维矩阵,矩阵中的每行为分析样本或质量控制样品,每列为代谢物信息。
本发明还提供了采用上述方法得到的血清代谢组学分析模型。在血清代谢组学分析模型中,健康血清样本和患病血清样本的代谢物信息分别位于模型的不同位置,且各自无重叠,可以记为健康血清样本组区域为阴性区域,患病血清样本组区域为阳性区域。
使用上述血清代谢组学分析模型,可以用于血清样本的代谢组学分析。
本发明的分析血清代谢组学的方法,包括以下步骤:将待检血清样本进行预处理,达到进样要求;将预处理的待检血清样本采用LC-MS血清代谢组学技术进行分析,得该待检血清样本的原始代谢指纹图谱;将该原始代谢指纹图谱进行图谱预处理,得到可以用于统计分析的代谢物信息;将该代谢物信息导入血清代谢组学分析模型中,用于分析待检血清样本的代谢组学情况。通过分析可以获得食管癌早期筛查风险的预测概率(大于50%即为阳性),从而通过人体代谢情况判定食管癌筛查风险。在实际应用中,如果待检血清样本的代谢物信息位于模型的患病血清样本组区域(即阳性区域,即预测概率大于50%),则表示该人具有食管癌的患病危险,需要进行进一步的内镜下指示性活检;如果待检血清样本的代谢物信息位于模型的健康血清样本组区域(即阴性区域,预测概率小于50%),则表示该人不具有食管癌的患病危险,不需要进行进一步的检查。
上述分析血清代谢组学的方法中,对待检血清样本进行预处理的步骤、将待检血清样本的原始代谢指纹图谱进行图谱预处理的步骤都和上述构建血清代谢组学分析模型时的预处理步骤、图谱预处理步骤相同。
本发明依托“国家食管癌早诊早治示范基地(肥城市)”筛检平台,采集食管炎、不典型增生(又叫非典型增生、异型增生)、癌前病变及早期食管癌阶段的血清标本,所选血清标本高达640例,范围广,数量多,真实性更加可靠。通过UPLC-QTOF/MS和统计模式识别方法获得血清代谢物分析模型,该模型可以作为食管癌高发地区人群食管癌早期筛检的模型,达到对食管癌的早期筛查的目的。
本发明血清代谢组学分析模型和分析血清代谢组学的方法是基于食管癌早期或者癌变前的血清样本得到的,相比于基于医院的食管癌中晚期患者的血清样本得到的模型,本发明血清代谢组学情况与要筛查的高危人群的血清代谢组学情况匹配度更高,更适合食管癌的早期筛查。并且通过对建模方法的优化,本发明模型灵敏度高,特异性好,能很好的分辨健康人群和高危患病人群,非常适合临床应用。
本发明首次将血清代谢组学分析技术用于食管癌早期筛查中,通过本发明可以对食管癌高发区的全人群进行初步筛查,快速、便捷的筛选出食管癌高发人群,准确度高,缩小了食管癌筛查的范围。本发明将食管癌筛查方法由传统的直接胃镜下碘染色指示性活检筛查方法变为先经本发明分析血清代谢组学的方法筛查,筛查结果为阳性的个体再行胃镜下碘染色指示性活检技术进行筛查,分析血清代谢组学时仅需采集血清,无创、花费低,有效提高了食管癌高发区全人群筛查的效率,大大降低了筛查成本,有效避免了部分人群有创胃镜造成的痛苦,具有重要的经济和社会效益,便于推广应用。此外,本发明方法的提出还有利于简便的发现食管癌疑似病患,有利于癌症的早发现、早治疗,具有很高的科研和医学价值。
附图说明
图1为血清代谢组学检测的质量控制图,横轴为保留时间,纵轴为代谢物在QC样本中的RSD%值。
图2为代谢轮廓预分析的PCA得分图,其中NEG为阴性,表示健康血清样本,POS为阳性,表示患病血清样本,QC表示质量控制样品。
图3为PLS-DA三维得分图,建模的R2X=0.231, R2Y=0.749, Q2cum=0.638,其中Screening NEG为筛查阴性,表示健康血清样本,Screening POS为筛查阳性,表示患病血清样本。
图4为基于随机置换方法的PLS-DA建模验证图。
图5为用于食管癌早期筛查的PLS-DA模型的外部验证得分图,其中Screening NEG为筛查阴性,表示健康血清样本,Screening POS为筛查阳性,表示患病血清样本,Screening NEG-test表示外部测试样本的筛查阴性,Screening POS-test表示外部测试样本的筛查阳性。
图6 为PLS-DA模型外部测试样本的ROC曲线。
具体实施方式
下面,通过以下具体实施方式对本发明进行进一步的解释,并对本发明优点进行进一步的证明。
本发明血清代谢物分析模型的构建方法以及效果验证如下:
1、研究对象
本研究依托“国家食管癌早诊早治示范基地(山东省肥城市)”的食管癌筛查与随访社区人群队列,针对山东省肥城市40-69岁胃镜下碘染色指示性活检对象(作为金标准确认),采集初次发现(未经过治疗或未服用过药物)的碘染色阳性受检者(包括食管炎、轻度不典型增生、重度不典型增生、中度不典型增生、食管癌癌前病变、食管癌早期患者、原位癌患者)的血清样本作为患病样本并随机抽取筛检中胃镜下碘染色阴性受试者即无上消化道病变的健康对象作为健康样本
本研究共检测640人,其中碘染色阳性受检者(即患病样本)共453例,碘染色阴性受检者(即健康样本)共187例;年龄、性别在两组间差异没有统计学意义,具有可比性。
2、LC-MS的血清代谢组学检测
分别采集患者样本和健康样本的血清,作为患者血清样本和健康血清样本,所有采集的血清样本离心后放于-80℃冰箱内保存,使用超高效液相色谱-质谱联用仪(UPLC-QTOF/MS 6550,Agilent)和Bravo自动标本预处理系统(Agilent, USA)进行代谢组学检测(分3个大批次检测,并做好质量控制),获得样本的包含色谱和质谱信息的原始代谢指纹图谱。具体操作如下:
2.1仪器和设备
实验设备包括:UPLC-QTOF/MS 6550系统(Agilent, USA)、Bravo系统(Agilent, USA)、高速低温离心机、振动涡旋机、氮气干燥装置、4℃冷藏冰箱(海尔)、纯水仪(西门子)。
实验耗材包括:Waters ACQUITY UPLC HSS T3(particle size, 1.8 μm; 100 mm (length)×2.1 mm)色谱柱、液氮、高纯氮;锥底进样瓶、2ml离心转子、2ml离心管(圆底)、移液器、1000μl枪头、200μl枪头、记号笔、乳胶手套、口罩。
实验试剂包括:甲醇(迪马,HPLC级纯)、乙腈(迪马,HPLC级纯)、甲酸(光复精密化学研究所,天津)、纯水(TOC<10ppb)。
2.2血清样本预处理
血清样本预处理前,制备60份质量控制样品(QC),将所有患者血清样本、健康血清样本和质量控制样品进行随机编号,以患者血清样本和健康血清样本作为分析样本,每隔10个分析样本加入一个质量控制样品。质量控制样品是将同一患者血清样本和同一健康血清样本进行混合,并均匀地分成60份。患者血清样本、健康血清样本和质量控制样品均进行预处理,预处理包括以下4个步骤:
(1)用移液器抽取50μl分析样本或质量控制样品,置于Bravo自动标本处理系统(Agilent,USA)的96孔板上;
(2)加入150μl甲醇提取,涡旋30s,并在-20℃下孵化以沉淀蛋白。
(3)然后于高速离心机中在4℃下以4000转/分离心20min;
(4)将步骤(3)的上清液倒入LC-MS进样瓶中,保存在-80℃下以备LC-MS检测;
2.3血清UPLC-QTOF/MS检测
UPLC系统(1290 series, Agilent)将6μL 等份预处理后的样品注入ACQUITY UPLC HSS T3 (particle size, 1.8 μm; 100 mm (length) × 2.1 mm) 色谱柱 (Waters, Milford, USA)。进样顺序为完全随机化进样,以排除进样顺序带来的偏倚。色谱流动相包含两种溶剂:A为0.1wt%甲酸(水稀释,正离子ESI+)或0.5mM氟化铵(水稀释,负离子ESI-),B为0.1wt%甲酸(乙腈稀释,正离子ESI+)或100%乙腈(负离子ESI-)。色谱梯度为:0-1min为1%B,1-8min为1%B-100%B逐渐递增,然后10-10.1min为100%B迅速减为1%B,然后1%B持续1.9min。流速为0.5 ml/min。整个样品检测过程维持在4℃。其中,A和B的百分含量指的是体积百分含量。
质谱检测使用Agilent 四极杆时间飞行质谱仪Q-TOF (6550,Agilent),并采用电喷雾离子源的正离子模式(ESI+)和负离子模式(ESI-)。离子源温度设定为400℃,而锥孔气流量为12L/min。同时,脱溶剂气温设定为250℃,而脱溶剂气流量16L/min。在正离子和负离子模式下毛细管电压分别为+3kV和-3kV,且锥孔电压均为0V。锥孔压力为20psi(正离子)和40psi(负离子)。图谱数据采集的质荷比范围为50~1200 m/z,采集的扫描频率为0.25s。
3、XCMS图谱预处理
UPLC-QTOF/MS血清正离子ESI+和负离子ESI-检测获得原始代谢指纹图谱数据通过Agilent公司的Masshunt软件转化为Mzdata数据文件,然后使用R语言的XCMS软件包进行XCMS图谱预处理,预处理包括保留时间校正、峰识别、峰匹配、峰对齐、滤噪、重叠峰解析、阈值选择、标准化等。XCMS预处理的相关参数为:峰半腰峰宽为10 (fwhm=10),保留时间窗设置为10(bw=10),而其他参数为默认值。XCMS图谱预处理后得到可用于统计分析的二维矩阵,其中每行为样本(观测),每列为代谢物(变量),矩阵中值为相应的代谢物浓度。并且每个代谢物峰使用保留时间(retention time,RT)和质荷比(mass-to-charge ratio,m/z)定性。然后该二维矩阵使用R软件包CAMERA进行代谢物峰标识(包括同位素峰、加合物和碎片离子)。统计分析前对样本进行标准化处理,待分析保留时间范围设定为0.5~10 min。经XCMS图谱预处理,在正离子检测模式的UPLC-QTOF/MS谱生成的数据矩阵中包含522个代谢物峰,负离子检测模式为 212个代谢物峰。
4、LC-MS实验质量控制
在血清样品进行代谢组学检测时,将制备的QC样品按每10个分析样本安排1个QC的顺序均匀地插入分析样本中,从而实时监测从样本前处理到样本检测过程中的质量控制情况。所得原始代谢指纹图谱经XCMS图谱预处理后,计算每个代谢物在QC样本中的%RSD值(变异系数),并且以%RSD值为纵轴,以保留时间为横轴画图(见图1),图中的圆点代表代谢物。可以从图中看出绝大多数代谢物的%RSD值控制在30%以下,说明样本前处理到样本品检测过程中的质量控制情况良好,所获得的代谢组学数据真实可信。
5、基于PCA的代谢轮廓预分析
将得到的二维矩阵数据随机分配成2/3作为训练样本training data(125 NEG:303 POS),另外1/3作为外部测试样本test data(62NEG:151POS)。对训练样本使用无监督分析方法即主成分分析(principal component analysis, PCA) 来观察组间初步的分类趋势和离群点,见图2。图中QC标本的重复性可表明LC-MS实验质量控制良好。从图中还可以看出,筛查阳性(即患病血清样本)和筛查阴性(即健康血清样本)间具有一定的分类趋势,但仍有部分交叉,需要采用有监督学习方法实现进一步的分类。
6、基于PLS-DA的代谢轮廓分析
为尽量消除组内差距引起的偏差,获得较为明显的分组趋势,进一步针对训练样本使用有监督分析方法即偏最小二乘判别分析(partial least squares-discriminant analysis, PLS-DA)显示碘染色阳性受检者和碘染色阴性受检者的代谢轮廓的差异和分类趋势。如图3所示,碘染色阳性组和阴性组间具有代谢模式差异和明显的组间分类趋势,其建模的R2X=0.231, R2Y=0.749, Q2cum=0.638。从图3可以看出,相较于完全健康的碘染色阴性组,无论是食管炎、不典型增生还是更为严重的原位癌和早期食管癌(碘染色阳性组)都出现了明显的代谢扰动,从而具有了明显的组间分类趋势。
7、食管癌早期筛查的PLS-DA模型外部验证
将外部测试样本二维矩阵数据(62NEG:151POS)代入上述建立的PLS-DA模型中,得到预测的因子1-3(即t[1]、t[2]、t[3]值),将外部测试样本画入PLS得分图中,见图5。并根据PLS-DA模型中显示的外部测试样本的阴性和阳性,同实际分类标签(筛查阴性和阳性)做ROC曲线分析,见图6。其中ROC曲线下面积AUC值为0.99 (95%CI: 0.978~1),灵敏度为95.4%,特异度为100%,该模型外部测试样本预测的争取率为94.8%。这表明,按照本发明方法所建立的食管癌早期筛查的PLS-DA模型预测准确性高,具有不错的外推效果。
本发明方法的食管癌早期筛查PLS-DA模型的最优预测界限值(cutoff)为0.50(见图6),在实际应用中可使用该界限值作为判定筛查结果的标准,能够达到灵敏度和特异度的优化和权衡,而其他界限值均不是最优,会损失灵敏度或特异度。
8、对比实验
在模型构建研究过程中,根据图谱预处理后的二维矩阵选择了10种差异最为显著的代谢物,并以每一种差异代谢物为判断标准,通过其含量差异来反应食管癌阳性情况。结果显示,每一种单一代谢物的预测水平均不高,与实际情况的匹配度不足89%,不具有外推效果。
9、结论
由以上验证可以看出,只有通过本发明方法构建的模型才能具有很好的预测效果。本发明所得PLS-DA模型无过拟合危险,且具有明显的组间分类趋势,通过血清代谢情况能够很好的将健康血清和疑似病变血清区分开来,灵敏度和特异度高,可以用于食管癌早期筛查。
在采用本发明模型进行食管癌早期筛查应用时,步骤如下:
(1)采集待检血清,离心后采用上述2.2中的步骤(1)-(4)对血清进行预处理,以备进样检测;
(2)将预处理后的待检血清样本按照上述2.3的步骤进行LC-MS检测,得原始代谢指纹图谱;
(3)将原始代谢指纹图谱按照上述步骤3的方法进行图谱预处理,得到该待检血清的代谢物信息;
(4)将该代谢物信息导入PLS-DA模型中,计算得到t[1]、t[2]、t[3]值,可以获得食管癌早期筛查风险的预测概率(大于50%即为阳性),从而通过人体代谢情况判定食管癌筛查风险。在实际应用中,如果待检血清样本的代谢物信息位于模型的患病血清样本组区域(即阳性区域,即预测概率大于50%),则表示该人具有食管癌的患病危险,需要进行进一步的内镜下指示性活检;如果待检血清样本的代谢物信息位于模型的健康血清样本组区域(即阴性区域,预测概率小于50%),则表示该人不具有食管癌的患病危险,不需要进行进一步的检查。
除此之外,为了加快筛查效率,可以同时采集多人的血清样本,并进行编号,将多个样本一次性进行LC-MS检测、图谱预处理和数据导入。
以上为对本发明专利的描述而非限定,基于本发明专利思想的其他实施方式,均在本发明保护范围之中。

Claims (10)

1.一种血清代谢组学分析模型的构建方法,其特征是:包括以下步骤:
(1)收集健康血清样本和患病血清样本,作为分析样本;
(2)将每个分析样本采用LC-MS血清代谢组学技术进行分析,得健康血清样本和患病血清样本的原始代谢指纹图谱;
(3)将健康血清样本和患病血清样本的原始代谢指纹图谱进行图谱预处理,得到每行为分析样本,每列为代谢物信息的二维矩阵,用于进一步的统计分析;
(4)将步骤(3)的二维矩阵依次进行主成分分析和偏最小二乘判别分析,得PLS-DA模型,对得到的PLS-DA模型进行验证,无过拟合危险,则所得PLS-DA模型即为血清代谢组学分析模型。
2.根据权利要求1所述的构建方法,其特征是:所述患病血清样本选自下列患者的血清:食管炎、轻度不典型增生、重度不典型增生、中度不典型增生、食管癌癌前病变、食管癌早期和原位癌患者的血清,优选上述各种患者的血清均有;所述健康血清样本为没有患病血清所对应疾病或者类似疾病的人群的血清。
3.根据权利要求1或2所述的构建方法,其特征是:PLS-DA模型的R2X=0.231, R2Y=0.749, Q2cum=0.638。
4.根据权利要求1、2或3所述的构建方法,其特征是:所述健康血清样本和患病血清样本均来自40-69岁人群。
5.根据权利要求1、2或3所述的构建方法,其特征是:所述患病血清样本453个,健康血清样本187个。
6.根据权利要求1、2或3所述的构建方法,其特征是:液相色谱所用色谱柱为Waters ACQUITY UPLC HSS T3色谱柱,规格为100 mm× 2.1 mm,1.8 μm;进样量为6μL,进样温度为4℃,流速为0.5 ml/min;色谱流动相包含两种溶剂A和B:正离子ESI+模式下的A为0.1wt%甲酸水溶液,负离子ESI-模型下的A为0.5mmol/L氟化铵水溶液,正离子ESI+模式下的B为0.1wt%甲酸的乙腈溶液,负离子ESI-模型下的B为纯乙腈;色谱梯度洗脱条件为:0-1min为1%B,1-8min为1%B-100%B逐渐递增,10-10.1min为100%B迅速减为1%B,然后1%B持续1.9min。
7.根据权利要求1、2或3所述的构建方法,其特征是:质谱检测使用四极杆时间飞行质谱仪Q-TOF,并采用电喷雾离子源的正离子模式ESI+和负离子模式ESI-,离子源温度为400℃,锥孔气流量为12L/min,脱溶剂气温为250℃,脱溶剂气流量为16L/min;在正离子和负离子模式下毛细管电压分别为+3kV和-3kV,锥孔电压均为0V;正离子模式下锥孔压力为20psi,负离子模式下锥孔压力为40psi;图谱数据采集的质荷比范围为50~1200 m/z,采集的扫描频率为0.25s。
8.根据权利要求1、2或3所述的构建方法,其特征是:进行LC-MS血清代谢组学技术分析时,每10个分析样本加入一个质量控制样品,用于实时监测分析样本从进样前处理到分析过程中的质量控制情况,所述质量控制样品为健康血清样本和患病血清样本按照1:1的体积比混合得到的样品。
9.根据权利要求8所述的构建方法,其特征是:所述分析样本和质量控制样品进样前进行以下预处理:
(1)用移液器抽取50μl分析样本或质量控制样品,置于Bravo自动标本处理系统的96孔板上;
(2)加入150μl甲醇提取,涡旋30s,并在-20℃下孵化以沉淀蛋白;
(3)然后于高速离心机中在4℃下以4000转/分离心20min;
(4)将步骤(3)的上清液倒入LC-MS进样瓶中,保存在-80℃下以备LC-MS检测。
10.根据权利要求1、2或3所述的构建方法,其特征是:对原始代谢指纹图谱进行图谱预处理是指:用Masshunter软件将获得的原始代谢指纹图谱转换为MZdata数据文件,然后将Mzdata数据文件使用XCMS软件包进行包括保留时间校正、峰识别、峰匹配和峰对齐的预处理操作,得到可用于统计分析的二维矩阵,矩阵中的每行为分析样本或质量控制样品,每列为代谢物信息。
CN201510150409.6A 2015-04-01 2015-04-01 一种血清代谢组学分析模型的构建方法 Active CN104713970B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510150409.6A CN104713970B (zh) 2015-04-01 2015-04-01 一种血清代谢组学分析模型的构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510150409.6A CN104713970B (zh) 2015-04-01 2015-04-01 一种血清代谢组学分析模型的构建方法

Publications (2)

Publication Number Publication Date
CN104713970A true CN104713970A (zh) 2015-06-17
CN104713970B CN104713970B (zh) 2017-03-15

Family

ID=53413481

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510150409.6A Active CN104713970B (zh) 2015-04-01 2015-04-01 一种血清代谢组学分析模型的构建方法

Country Status (1)

Country Link
CN (1) CN104713970B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105044343A (zh) * 2015-08-14 2015-11-11 山东省肿瘤防治研究院 一种食管鳞状细胞癌诊断模型的构建方法、所得诊断模型及模型的使用方法
CN105044361A (zh) * 2015-08-14 2015-11-11 山东省肿瘤防治研究院 一种适合于食管鳞状细胞癌早期诊断的诊断标记物及其筛选方法
CN109187614A (zh) * 2018-09-27 2019-01-11 厦门大学 基于核磁共振和质谱的代谢组学数据融合方法及其应用
CN110308227A (zh) * 2019-08-07 2019-10-08 新疆医科大学第二附属医院 一种基于睡眠障碍出现原发性骨质疏松症患者血浆代谢组学分析方法
CN115236242A (zh) * 2022-08-25 2022-10-25 上海和黄药业有限公司 一种安宫牛黄丸四味粉指纹图谱及其成分的检测方法
CN117133377A (zh) * 2023-10-27 2023-11-28 浙江大学 一种基于代谢组学的代谢物组合模型的数据迭代处理方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120066714A (ko) * 2010-10-27 2012-06-25 경북대학교 산학협력단 산화성 스트레스 및 저산소증의 진단을 위한 혈액 투석 환자의 혈청 내 이노신 및 하이포잔틴 검출 방법
CN103235073A (zh) * 2013-04-15 2013-08-07 湖南省食品药品检验研究院 一种基于急性过敏反应的代谢组学分析方法
CN103592389A (zh) * 2013-11-15 2014-02-19 湖州市中心医院 一种基于妊娠糖尿病人血清lc/ms代谢组学分析方法
CN103616450A (zh) * 2013-11-29 2014-03-05 湖州市中心医院 一种肺癌患者血清特异性代谢产物谱及其建立方法
WO2014125443A1 (en) * 2013-02-14 2014-08-21 Metanomics Health Gmbh Means and methods for assessing the quality of a biological sample

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120066714A (ko) * 2010-10-27 2012-06-25 경북대학교 산학협력단 산화성 스트레스 및 저산소증의 진단을 위한 혈액 투석 환자의 혈청 내 이노신 및 하이포잔틴 검출 방법
WO2014125443A1 (en) * 2013-02-14 2014-08-21 Metanomics Health Gmbh Means and methods for assessing the quality of a biological sample
CN103235073A (zh) * 2013-04-15 2013-08-07 湖南省食品药品检验研究院 一种基于急性过敏反应的代谢组学分析方法
CN103592389A (zh) * 2013-11-15 2014-02-19 湖州市中心医院 一种基于妊娠糖尿病人血清lc/ms代谢组学分析方法
CN103616450A (zh) * 2013-11-29 2014-03-05 湖州市中心医院 一种肺癌患者血清特异性代谢产物谱及其建立方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
彭媛等: "应用LC/TOF-MS分析食管鳞状细胞癌血浆小分子代谢物的实验研究", 《癌变.畸变.突变》 *
徐婧: "基于RRLC-MS/MS技术的食管癌代谢组学研究", 《中国博士学位论文全文数据库 医药卫生科技辑》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105044343A (zh) * 2015-08-14 2015-11-11 山东省肿瘤防治研究院 一种食管鳞状细胞癌诊断模型的构建方法、所得诊断模型及模型的使用方法
CN105044361A (zh) * 2015-08-14 2015-11-11 山东省肿瘤防治研究院 一种适合于食管鳞状细胞癌早期诊断的诊断标记物及其筛选方法
CN109187614A (zh) * 2018-09-27 2019-01-11 厦门大学 基于核磁共振和质谱的代谢组学数据融合方法及其应用
CN110308227A (zh) * 2019-08-07 2019-10-08 新疆医科大学第二附属医院 一种基于睡眠障碍出现原发性骨质疏松症患者血浆代谢组学分析方法
CN115236242A (zh) * 2022-08-25 2022-10-25 上海和黄药业有限公司 一种安宫牛黄丸四味粉指纹图谱及其成分的检测方法
CN117133377A (zh) * 2023-10-27 2023-11-28 浙江大学 一种基于代谢组学的代谢物组合模型的数据迭代处理方法

Also Published As

Publication number Publication date
CN104713970B (zh) 2017-03-15

Similar Documents

Publication Publication Date Title
CN104713971A (zh) 一种基于lc-ms血清代谢组学技术分析血清代谢组学的方法
CN109884302B (zh) 基于代谢组学和人工智能技术的肺癌早期诊断标志物及其应用
Keppler et al. Advances in the application of comprehensive two-dimensional gas chromatography in metabolomics
CN105044361B (zh) 一种适合于食管鳞状细胞癌早期诊断的诊断标记物及其筛选方法
CN104713970A (zh) 一种血清代谢组学分析模型的构建方法
CN110646554B (zh) 基于代谢组学的胰腺癌诊断标志物及其筛选方法和应用
CN103616450B (zh) 一种肺癌患者血清特异性代谢产物谱及其建立方法
CN108414660B (zh) 一组与肺癌早期诊断相关的血浆代谢小分子标志物的应用
CN101769910A (zh) 一种从血清代谢轮廓筛选恶性卵巢肿瘤标志物的方法
Ma et al. A pilot study of gas chromatograph/mass spectrometry-based serum metabolic profiling of colorectal cancer after operation
WO2004088309A2 (en) Methods for diagnosing urinary tract and prostatic disorders
CN103776891A (zh) 一种检测差异表达蛋白质的方法
CN112151121A (zh) 一种食管癌诊断的诊断标志物、试剂盒及筛选方法和食管癌诊断模型的构建方法
CN106716127A (zh) 用于检测卵巢癌的方法
CN112183616B (zh) 一种脑胶质瘤诊断的诊断标志物、试剂盒及筛选方法和脑胶质瘤诊断模型的构建方法
CN111999403A (zh) 一种瓦斯爆炸肺损伤诊断系统、血清标志物筛选方法、肺损伤作用机制研究方法
CN110082443A (zh) 基于代谢组学表征颗粒物暴露肺代谢异常标志物筛选的小鼠模型构建方法
CN104713969A (zh) 一种血清代谢组学分析模型
Zeng et al. Image classification combined with faster R–CNN for the peak detection of complex components and their metabolites in untargeted LC-HRMS data
Djukovic et al. Colorectal cancer detection using targeted LC-MS metabolic profiling
CN109946411B (zh) 用于胸椎黄韧带骨化诊断的生物标记物及其筛选方法
CN113567585A (zh) 一种基于外周血的食管鳞癌筛查标志物及试剂盒
CN112986441A (zh) 一种从组织代谢轮廓筛选的肿瘤标志物及其应用和辅助诊断方法
Oller-Moreno et al. GCIMS: An R package for untargeted gas chromatography–Ion mobility spectrometry data processing
CN105044240A (zh) 一种适合于食管鳞状细胞癌早期诊断的诊断标记物

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant