CN109668984A - 一种基于代谢组学的喉癌血清判别模型的构建方法 - Google Patents

一种基于代谢组学的喉癌血清判别模型的构建方法 Download PDF

Info

Publication number
CN109668984A
CN109668984A CN201910093154.2A CN201910093154A CN109668984A CN 109668984 A CN109668984 A CN 109668984A CN 201910093154 A CN201910093154 A CN 201910093154A CN 109668984 A CN109668984 A CN 109668984A
Authority
CN
China
Prior art keywords
sample
laryngocarcinoma
serum
construction method
discrimination model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910093154.2A
Other languages
English (en)
Inventor
高伟
吴勇延
崔佳佳
王斌全
温树信
张春明
刘红亮
郑希望
薛绪亭
牛敏
张宇良
胡汪来
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
First Hospital of Shanxi Medical University
Original Assignee
First Hospital of Shanxi Medical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by First Hospital of Shanxi Medical University filed Critical First Hospital of Shanxi Medical University
Priority to CN201910093154.2A priority Critical patent/CN109668984A/zh
Publication of CN109668984A publication Critical patent/CN109668984A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/04Preparation or injection of sample to be analysed
    • G01N30/06Preparation
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/62Detectors specially adapted therefor
    • G01N30/72Mass spectrometers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8624Detection of slopes or peaks; baseline correction
    • G01N30/8631Peaks
    • G01N30/8634Peak quality criteria
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8675Evaluation, i.e. decoding of the signal into analytical information
    • G01N30/8686Fingerprinting, e.g. without prior knowledge of the sample components
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8696Details of Software
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/88Integrated analysis systems specially adapted therefor, not covered by a single one of the groups G01N30/04 - G01N30/86
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57484Immunoassay; Biospecific binding assay; Materials therefor for cancer involving compounds serving as markers for tumor, cancer, neoplasia, e.g. cellular determinants, receptors, heat shock/stress proteins, A-protein, oligosaccharides, metabolites
    • G01N33/57488Immunoassay; Biospecific binding assay; Materials therefor for cancer involving compounds serving as markers for tumor, cancer, neoplasia, e.g. cellular determinants, receptors, heat shock/stress proteins, A-protein, oligosaccharides, metabolites involving compounds identifable in body fluids
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/96Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving blood or serum control standard
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/88Integrated analysis systems specially adapted therefor, not covered by a single one of the groups G01N30/04 - G01N30/86
    • G01N2030/8809Integrated analysis systems specially adapted therefor, not covered by a single one of the groups G01N30/04 - G01N30/86 analysis specially adapted for the sample
    • G01N2030/8813Integrated analysis systems specially adapted therefor, not covered by a single one of the groups G01N30/04 - G01N30/86 analysis specially adapted for the sample biological materials
    • G01N2030/8822Integrated analysis systems specially adapted therefor, not covered by a single one of the groups G01N30/04 - G01N30/86 analysis specially adapted for the sample biological materials involving blood
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2560/00Chemical aspects of mass spectrometric analysis of biological material
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2570/00Omics, e.g. proteomics, glycomics or lipidomics; Methods of analysis focusing on the entire complement of classes of biological molecules or subsets thereof, i.e. focusing on proteomes, glycomes or lipidomes

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Immunology (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Cell Biology (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Oncology (AREA)
  • Hospice & Palliative Care (AREA)
  • Quality & Reliability (AREA)
  • Library & Information Science (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

本发明公开了一种基于代谢组学的喉癌血清判别模型的构建方法,该模型的构建方法包括:收集喉癌患者以及没有患喉癌或者类似疾病人群的血清样本,进行样本的制备,对样本进行液质联用检测,得到原始代谢指纹图谱,将原始谱图转化为包括保留时间、质荷比以及响应值的三维矩阵,对三维矩阵数据进行归一化以及标准化处理后依次进行主成分分析以及正交信号下的偏最小二乘判别分析,差异代谢物的筛选与指认,去掉无关变量后再次进行判别模型的建立,通过筛选后的变量建立的模型对喉癌的判别灵敏度及特异性提高。本发明可用于喉癌潜在人群的快速批量筛查,提高喉癌发生早期筛查效率,降低患者痛苦。

Description

一种基于代谢组学的喉癌血清判别模型的构建方法
技术领域
本发明属于代谢组学分析技术领域,具体涉及一种基于代谢组学的喉癌血清判别模型的构建方法,用于对喉癌高发人群进行快速筛查。
背景技术
喉癌是喉部最常见的恶性肿瘤,发病率有逐年上升趋势,约93%-99%患者的组织类型为鳞状细胞癌。根据肿瘤发生部位可分为声门上型、声门型、跨声门型以及声门下型。喉癌症状主要为声嘶、呼吸困难、咳嗽、吞咽困难、颈部淋巴结转移等。不同原发部位症状出现顺序可能不同。引发喉癌的病因尚不明确,可能有多种因素共同导致,如吸烟、饮酒、空气污染以及病毒感染等,且喉癌发病率具有明显的性别偏向及地域性,男性发病率高于女性,北方高于南方。
喉癌病发早期症状不明显不易发觉,现有的用于确诊喉癌的技术主要依靠组织活检,样本的采集在喉镜下完成,甚至有些需要反复多次活检才能证实。由于其直观且特异性高,目前没有可替代方法。喉癌组织活检为有创检查,一方面患者体验痛苦,依从性不高;另一方面也容易促进肿瘤生长及扩散,甚至给预后带来不良影响。因此,研究其他的用于喉癌早期筛查或者辅助检查的技术手段十分必要。
代谢组学是继基因组学和蛋白质组学之后发展起来的一门学科,是系统生物学的重要组成部分。之后得到迅速发展并渗透到多项领域,比如疾病诊断、医药研制开发等领域。代谢组学是对某一生物或细胞在一特定生理时期内所有低分子量代谢产物同时进行定性和定量分析的一门新学科,它是以组群指标分析为基础,以高通量检测和数据处理为手段,以信息建模与系统整合为目标的系统生物学的一个分支。喉癌患者早期表现出的症状不明显,但是机体中代谢谱会发生变化,利用代谢组底端放大的特点找到喉癌特征代谢物进行建模分析,以此提高早期喉癌筛查效率。
目前尚没有有关喉癌判别模型构建用于其早期辅助诊断的报道,现有的关于其他疾病的代谢组学模型构建方法所用变量为高通量检测所得全部变量,虽具有全面性但是不够灵敏特异,本发明在一次建模过程中经过对模型贡献的筛选,去除掉无关变量的干扰,采用贡献较大的变量组合进行二次建模,一方面提高了模型的灵敏度以及特异性,另一方面也简化了验证集的检测方法,只需检测筛选的变量组合即可,提高了检测效率。
发明内容
为解决现有技术中喉癌检查的局限性,本发明旨在提供一种基于代谢组学的喉癌血清判别模型的构建方法,该判别模型构建方法简单,可用于喉癌潜在人群的快速批量筛查,提高喉癌发生早期筛查效率,降低患者痛苦。
为了实现上述目的,本发明采用如下技术方案:
一种基于代谢组学的喉癌血清判别模型的构建方法,包括以下步骤:
(1)样本的收集:收集喉癌患者血清样本,将收集的患者血清样本随机分为探索集和验证集两组,并收集没有患喉癌或者类似疾病人群的血清作为对照样本;所有样本各取10μL混合作为质量控制样本;
(2)样本的制备:用移液器吸取100μL待测样本,加入4倍体积的蛋白沉淀溶剂进行提取,涡旋30s以沉淀蛋白;然后于高速离心机中离心;移取上清液在离心浓缩仪中悬干;悬干的样本用100μL体积比为80%的蛋白沉淀溶剂-水溶液进行复溶,于高速离心机中离心,将上清液转移至液质联用进样瓶中进样;
(3)样本的检测:对样本进行液质联用检测,每隔几个样本插入一针质量控制样本,得到原始代谢指纹图谱;
(4)数据矩阵的建立:将原始代谢谱图进行预处理并转化为包括保留时间、质荷比m/z以及响应值在内的三维数据矩阵,并进行归一化以及标准化处理;
(5)一次建模:将步骤(4)中预处理的数据进行PCA主成分分析以及偏最小二乘判别分析,对PCA主成分分析拟合出的多个主成分,选取其中的第一主成分和第二主成分用于建模,对偏最小二乘判别分析得到的偏最小二乘模型进行七次交互循环验证;
(6)差异代谢物的筛选与鉴定:根据探索集所有变量一次建模的结果,通过多变量分类模型S-Plot与T检验进行差异代谢物变量的筛选,确定变量重要性因子VIP值以及用来判定假设检验结果的统计量P值;利用本地数据库以及公用数据库HMDB、METLIN以及Massbank进行差异代谢物的指认;
(7)二次建模:将步骤(6)中鉴定得到的差异代谢物的保留时间,质荷比m/z值以及响应值的三维矩阵数据导入多元统计分析软件SIMCA-P中进行OPLS-DA正交偏最小二乘判别分析的模型建立,找到伴随模型贡献较大的代谢物变量,并通过这些代谢物变量的联合使用建立判别模型;
(8)用验证集的样本数据对建立的判别模型进行验证。
上述构建方法中,在步骤(1)样本的收集中,所述收集患者血清样本是指收集声门上型、声门下型、声门型以及跨声门型喉癌患者血清样本。
上述构建方法中,在步骤(2)样本的制备过程中,加入的蛋白沉淀溶剂为乙腈。
上述构建方法中,在步骤(2)样本的制备过程中,样本于高速离心机中离心的具体参数为:温度为4℃,离心机转速为13000rpm,离心时间为15分钟。
上述构建方法中,在步骤(3)样本的检测中,每隔几个样本插入一针质量控制样本,具体为每隔10个样本插入一针质量控制样本。
上述构建方法中,在步骤(3)样本的检测中,液质联用检测的液相条件和质谱条件分别为:
质谱条件:采用HESI离子化方式,喷雾电压:正极为3.5KV,负极为2.5KV;毛细管温度320℃;加热器温度300℃;鞘气流速:35arb,辅助气流速:10arb;扫描模式为Full Scan/dd-MS2,采集范围:质荷比m/z为100-1500,正负离子切换采集模式;分辨率采用MS FullScan 35000FWHM,MS/MS17500FWHM,NCE为12.5eV,25eV和37.5eV;
液相条件:相色谱所用色谱柱为Waters HSS T3柱,规格为2.1×100mm,1.8μm,进样量为3μL,流动相A为0.1%的甲酸水;流动相B为0.1%的甲酸乙腈,梯度洗脱:0-2min为2%B;2-13min为2%-35%B;13-28min为35%-98%B;28min-30min为98%B;30min-30.5min为98%-2%B;30.5-33min,2%B。
上述构建方法中,在步骤(4)数据矩阵的建立中,对原始谱图进行预处理是指用Compound Discover 2.0对原始谱图进行背景扣除、基线校正,峰识别以及总峰面积归一化处理,得到包含保留时间、质荷比m/z值以及峰响应值在内的三维数据矩阵,用于后期统计分析。
上述构建方法中,在步骤(5)的一次建模中,偏最小二乘判别分析模型中,可预测值R2须大于0.5。
与现有技术中的传统喉癌筛选方法相比,本发明具有如下有益效果:
1、喉癌患者的早期症状表现不明显,常常被忽视而错过最佳治疗时机,本发明根据人体发生病变会导致机体代谢谱发生变化的原理,利用代谢组底端放大的特点找到喉癌特征代谢物进行建模分析,将血清代谢组学分析技术应用于喉癌的早期筛查。本发明可以对喉癌潜在人群进行初步筛查,仅需采集患者的血清样本就可方便快捷地完成初步筛查,具有痛苦小,患者依从性好;费用低,方法简单,便于推广应用;无创伤,防止肿瘤扩散等优点。
2、本发明在一次建模过程中将原始代谢谱图预处理后的数据进行PCA主成分分析以及偏最小二乘判别分析,对PCA主成分分析拟合出的多个主成分,选取其中的第一主成分和第二主成分用于建模,对偏最小二乘判别分析得到的偏最小二乘模型进行七次交互循环验证。去除掉无关变量的干扰,采用贡献较大的变量组合进行二次建模,一方面提高了模型的灵敏度以及特异性,另一方面也简化了验证集的检测方法,只需检测筛选的变量组合即可,提高了检测效率,以此提高早期喉癌筛查效率和准确度。
3、本发明的推广应用,可以提高对喉癌潜在人群的筛选效率,降低筛选成本,使喉癌患者早发现早治疗,为喉癌的早期判别提供有力的支持,对喉癌的研究与治疗具有积极的作用。
附图说明
图1为所有样本主成分分析结果图,纵轴t[1]为第一主成分,横轴t[2]为第二主成分,其中,质量控制样本聚集,说明方法稳定可靠;
图2为探索集主成分分析结果图,纵轴t[1]为第一主成分,横轴t[2]为第二主成分;
图3为探索集七次交互循环验证排列实验结果,R2为可解释度,Q2为可预测性;
图4为采用探索集所有变量一次建模的结果,纵轴t[1]为第一主成分,横轴t[2]为第二主成分;
图5为多变量分类模型S-Plot检验筛选差异代谢物结果,横轴P(corr)[1]为每个变量的协方差,纵轴p[1]为每个变量的相关度;
图6为采用筛选完后的变量进行OPLS-DA正交偏最小二乘判别分析及二次建模的结果,纵轴t[1]表示自动校正后的第一主成分,横轴t0[1]表示自动校正后的第二主成分;
图7为验证集主成分分析PCA的结果,纵轴t[1]为第一主成分,横轴t[2]为第二主成分;
图8为验证集采用筛选变量进行正交偏最小二乘判别分析OPLS-DA二次建模的结果,纵轴t[1]为自动校正后的第一主成分,横轴t0[1]为自动校正后的第二主成分。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行具体的描述。
本发明的一种基于代谢组学的喉癌血清判别模型的构建方法是应用液质联用技术,检测血清样本中的代谢物,找到喉癌的判别标志物。包括:收集没有患喉癌或者类似疾病人以及各类型喉癌患者血清样本,将收集的患者血清样本随机分为探索集和验证集两组,将收集没有患喉癌或者类似疾病人群的血清作为对照样本,所有样品各取10μL混合作为质量控制样本;样本经处理后通过液质联用检测分析;通过一次建模筛选出喉癌患者与没有患喉癌或者类似疾病人之间代谢谱差异;根据数据库比对进行差异物指认;然后去除无关变量的影响,放大差异变量的贡献,用差异变量进行二次建模以优化模型并提高模型的灵敏度。
实施例中,一种基于代谢组学的喉癌血清判别模型的构建方法的具体步骤如下:
一、实验材料和测试方法
(1)样本的收集与制备:
收集声门上型、声门下型、声门型以及跨声门型喉癌患者血清样本59份,将收集的患者血清样本随机分为探索集和验证集两组,并收集没有患喉癌或者类似疾病人群的血清作为对照样本30份;所有样品各取10μL混合作为质量控制样本。
用移液器吸取100μL待测样本,加入4倍体积的乙腈进行提取,涡旋30s以沉淀蛋白;然后于高速离心机中在4℃下以13000rpm离心15min;移取上清液在离心浓缩仪中悬干;悬干的样本用100μL体积比为80%的乙腈-水溶液进行复溶,于高速离心机中在4℃下以13000rpm离心15min,将上清液转移至液质联用进样瓶中,进样分析。
(2)测试条件:
液相条件:流动相A,含0.1%甲酸的水;流动相B,含0.1%甲酸的乙腈。梯度洗脱:0~2min,2%B;2~3min,2%B-35%B;3~28min,35%B-98%B;28~30min,98%B;30-30.5min,为98%B-2%B;30.5-33min为2%B。进样量:3μL;流速,0.2mL/min;柱温:35℃;HSST3色谱柱2.1mm×100mm,1.8μm。
质谱条件:采用HESI离子化方式;喷雾电压:正极为3.5kV,负极为2.5kV;毛细管温度320℃;加热器温度300℃;鞘气流速为35arb,辅助气流速为10arb;扫描模式为FullScan/dd-MS2,采集范围为质荷比m/z为100~1500,正负离子切换采集模式;分辨率采用MSFull Scan 35000FWHM,MS/MS17500FWHM,NCE为12.5eV,25eV和37.5eV。
(3)样本的检测:
将样本在上述的液相条件和质谱条件下进行液质联用检测,检测前先进5针调节质量控制样本,每10个样本插入一针质量控制样本,得到原始代谢指纹图谱。
(4)数据矩阵的建立:将原始代谢谱图进行预处理并转化为包括保留时间、质荷比以及响应值在内的三维数据矩阵,并进行归一化以及标准化处理;具体是用CompoundDiscover 2.0对原始代谢指纹谱图进行背景扣除、基线校正,峰识别以及总峰面积归一化处理,得到包含保留时间、质荷比m/z值以及峰响应值在内的三维数据矩阵,用于后期统计分析。
(5)一次建模:将步骤(4)中预处理的数据进行PCA主成分分析以及偏最小二乘判别分析,对PCA主成分分析拟合出的多个主成分,选取其中的第一主成分和第二主成分用于建模,对偏最小二乘判别分析得到的偏最小二乘模型进行七次交互循环验证。
得到所有样本主成分分析结果图,如图1所示,在图1中,质量控制样本聚成一团,说明实验说明方法稳定可靠;
得到探索集主成分分析结果图,如图2所示,通过主成分分析可以看出,相比于没有患喉癌或类似疾病的人,喉癌患者的代谢谱发生明显偏移,被第一主成分分开,可预测值R2=0.526,可解释值Q2=0.325。
得到探索集七次交互循环验证排列实验结果,如图3所示,然后采用排列实验对模型进行拟合,没有出现过拟合现象。
对探索集所有变量进行正交信号的偏最小二乘建模分析,结果如图4所示,可以看到有一个正常样本出现误判现象。
(6)差异代谢物的筛选与鉴定:根据模型的变量重要性因子VIP值以及用来判定假设检验结果的统计量P值,通过多变量分类模型S-Plot与T检验进行差异代谢物的筛选;利用本地数据库以及公用数据库HMDB、METLIN以及Massbank进行差异代谢物的指认;
根据图4中探索集所有变量一次建模的结果,通过多变量分类模型S-Plot与T检验进行差异代谢物变量筛选,确定变量重要性因子VIP值以及用来判定假设检验结果的统计量P值,图5为多变量分类模型S-Plot筛选差异代谢物结果;并比对HMDB,METLIN以及Massbank数据库进行指认,得到19个差异代谢物,具体信息如表1所示。
(7)二次建模:将步骤(6)中鉴定得到的差异代谢物的保留时间,质荷比m/z值以及响应值的三维矩阵数据导入多元统计分析软件SIMCA-P中进行OPLS-DA正交偏最小二乘判别分析的模型建立,找到伴随模型贡献较大的代谢物变量,并通过这些代谢物变量的联合使用建立判别模型;其中,找到伴随模型贡献较大的19个代谢物变量,并通过这19个贡献较大的代谢物变量的联合使用建立判别模型;
用19个贡献较大的代谢物变量进行OPLS-DA正交偏最小二乘判别分析及二次建模得到如图6所示模型,正常血清样本与喉癌血清样本被第一主成分完全分开,正确判别率可达100%。
(8)用验证集的样本数据对建立的判别模型进行验证。
最后用验证集检测19个差异变量,结果如图7所示;再用差异变量响应值数据进行多元统计分析进行验证,正常血清样本与喉癌血清样本被第一主成分完全分开,正确判别率可达100%,得到相同的结论,结果如图8所示。
二、结果
所有喉癌和健康样本通过液质联用测试,得到喉癌患者以及正常对照血清样本的代谢谱。图1中质量控制样本聚成一团,说明实验过程中仪器方法可靠稳定。如图2所示,通过主成分分析可以看出,相比于正常人,喉癌患者的代谢谱发生明显偏移,被第一主成分分开,可解释度R2=0.526,可预测性Q2=0.325。然后采用七次交互循环验证排列实验对模型进行拟合,没有出现过拟合现象,如图3所示。用所有变量进行正交信号得偏最小二乘建模分析,结果如图4所示,可以看到有一个正常样本出现误判现象。通过多变量分类模型S-Plot与T检验进行差异变量筛选并比对数据库进行指认,得到19个差异代谢物,具体信息如表1所示。用19个差异变量进行二次建模得到如图6所示模型,正常血清样品与喉癌血清样品被第一主成分完全分开,正确判别率可达100%。最后用验证集检测19个差异变量,再用差异变量响应值数据进行多元统计分析进行验证,得到相同的结论。
表1:
表1差异代谢物指认信息表

Claims (8)

1.一种基于代谢组学的喉癌血清判别模型的构建方法,其特征在于:包括以下步骤:
(1)样本的收集:收集喉癌患者血清样本,将收集的患者血清样本随机分为探索集和验证集两组,并收集没有患喉癌或者类似疾病人群的血清作为对照样本;所有样本各取10μL混合作为质量控制样本;
(2)样本的制备:用移液器吸取100μL待测样本,加入4倍体积的蛋白沉淀溶剂进行提取,涡旋30s以沉淀蛋白;然后于高速离心机中离心;移取上清液在离心浓缩仪中悬干;悬干的样本用100μL体积比为80%的蛋白沉淀溶剂-水溶液进行复溶,于高速离心机中离心,将上清液转移至液质联用进样瓶中进样;
(3)样本的检测:对样本进行液质联用检测,每隔几个样本插入一针质量控制样本,得到原始代谢指纹图谱;
(4)数据矩阵的建立:将原始代谢谱图进行预处理并转化为包括保留时间、质荷比m/z以及响应值在内的三维数据矩阵,并进行归一化以及标准化处理;
(5)一次建模:将步骤(4)中预处理的数据进行PCA主成分分析以及偏最小二乘判别分析,对PCA主成分分析拟合出的多个主成分,选取其中的第一主成分和第二主成分用于建模,对偏最小二乘判别分析得到的偏最小二乘模型进行七次交互循环验证;
(6)差异代谢物的筛选与鉴定:根据探索集所有变量一次建模的结果,通过多变量分类模型S-Plot与T检验进行差异代谢物变量的筛选,确定变量重要性因子VIP值以及用来判定假设检验结果的统计量P值;利用本地数据库以及公用数据库HMDB、METLIN以及Massbank进行差异代谢物的指认;
(7)二次建模:将步骤(6)中鉴定得到的差异代谢物的保留时间,质荷比m/z值以及响应值的三维矩阵数据导入多元统计分析软件SIMCA-P中进行OPLS-DA正交偏最小二乘判别分析的模型建立,找到伴随模型贡献较大的代谢物变量,并通过这些代谢物变量的联合使用建立判别模型;
(8)用验证集的样本数据对建立的判别模型进行验证。
2.根据权利要求1所述的一种基于代谢组学的喉癌血清判别模型的构建方法,其特征在于:在步骤(1)样本的收集中,所述收集患者血清样本是指收集声门上型、声门下型、声门型以及跨声门型喉癌患者血清样本。
3.根据权利要求1所述的一种基于代谢组学的喉癌血清判别模型的构建方法,其特征在于:在步骤(2)样本的制备过程中,加入的蛋白沉淀溶剂为乙腈。
4.根据权利要求1所述的一种基于代谢组学的喉癌血清判别模型的构建方法,其特征在于:在步骤(2)样本的制备过程中,样本于高速离心机中离心的具体参数为:温度为4℃,离心机转速为13000rpm,离心时间为15分钟。
5.根据权利要求1所述的一种基于代谢组学的喉癌血清判别模型的构建方法,其特征在于:在步骤(3)样本的检测中,每隔几个样本插入一针质量控制样本,具体为每隔10个样本插入一针质量控制样本。
6.根据权利要求1所述的一种基于代谢组学的喉癌血清判别模型的构建方法,其特征在于:在步骤(3)样本的检测中,液质联用检测的液相条件和质谱条件分别为:
质谱条件:采用HESI离子化方式,喷雾电压:正极为3.5KV,负极为2.5KV;毛细管温度320℃;加热器温度300℃;鞘气流速:35arb,辅助气流速:10arb;扫描模式为Full Scan/dd-MS2,采集范围:质荷比m/z为100-1500,正负离子切换采集模式;分辨率采用MS Full Scan35000FWHM,MS/MS17500FWHM,NCE为12.5eV,25eV和37.5eV;
液相条件:相色谱所用色谱柱为Waters HSS T3柱,规格为2.1×100mm,1.8μm,进样量为3μL,流动相A为0.1%的甲酸水;流动相B为0.1%的甲酸乙腈,梯度洗脱:0-2min为2%B;2-13min为2%-35%B;13-28min为35%-98%B;28min-30min为98%B;30min-30.5min为98%-2%B;30.5-33min,2%B。
7.根据权利要求1所述的一种基于代谢组学的喉癌血清判别模型的构建方法,其特征在于:在步骤(4)数据矩阵的建立中,对原始谱图进行预处理是指用Compound Discover2.0对原始谱图进行背景扣除、基线校正,峰识别以及总峰面积归一化处理,得到包含保留时间、质荷比m/z值以及峰响应值在内的三维数据矩阵,用于后期统计分析。
8.根据权利要求1所述的一种基于代谢组学的喉癌血清判别模型的构建方法,其特征在于:在步骤(5)的一次建模中,偏最小二乘判别分析模型中,可预测值R2须大于0.5。
CN201910093154.2A 2019-01-30 2019-01-30 一种基于代谢组学的喉癌血清判别模型的构建方法 Pending CN109668984A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910093154.2A CN109668984A (zh) 2019-01-30 2019-01-30 一种基于代谢组学的喉癌血清判别模型的构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910093154.2A CN109668984A (zh) 2019-01-30 2019-01-30 一种基于代谢组学的喉癌血清判别模型的构建方法

Publications (1)

Publication Number Publication Date
CN109668984A true CN109668984A (zh) 2019-04-23

Family

ID=66150887

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910093154.2A Pending CN109668984A (zh) 2019-01-30 2019-01-30 一种基于代谢组学的喉癌血清判别模型的构建方法

Country Status (1)

Country Link
CN (1) CN109668984A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110782942A (zh) * 2019-10-25 2020-02-11 苏州帕诺米克生物医药科技有限公司 代谢组学中的质量控制方法、装置及存储介质
CN111413431A (zh) * 2020-04-17 2020-07-14 中国药科大学 一种药源性急性肾损伤病变进程代谢标志物的筛选方法
CN111426766A (zh) * 2020-04-17 2020-07-17 中国药科大学 一种药源性急性肾损伤小鼠模型的构建及评价方法
WO2021217745A1 (zh) * 2020-04-26 2021-11-04 南京大学 一种基于污染物代谢扰动的非目标生物标志物高通量筛查方法
US11226318B2 (en) 2020-04-26 2022-01-18 Nanjing University Method for high-throughput screening of non-target biomarkers based on metabolic perturbation caused by pollutants
CN114283877A (zh) * 2021-04-29 2022-04-05 厦门市迈理奥科技有限公司 一种建立代谢物模型及其代谢组学数据库的方法
CN114295706A (zh) * 2021-09-28 2022-04-08 岛津企业管理(中国)有限公司 一种基于统计学的非靶向非小细胞肺癌的病理分型方法
CN114566292A (zh) * 2022-01-29 2022-05-31 浙江大学医学院附属第一医院 应用内源性物质预测肾移植药物剂量的模型的构建方法
CN115266985A (zh) * 2022-07-29 2022-11-01 国家烟草质量监督检验中心 一种基于uhplc-qtof-ms的喉癌患者血清脂质组学检测方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103616450A (zh) * 2013-11-29 2014-03-05 湖州市中心医院 一种肺癌患者血清特异性代谢产物谱及其建立方法
CN106324173A (zh) * 2016-08-23 2017-01-11 国家烟草质量监督检验中心 一种基于反相色谱飞行时间质谱的喉癌血清差异代谢物的测定筛选方法
CN106872370A (zh) * 2017-02-23 2017-06-20 浙江大学 一种基于高光谱的杨梅中花色苷含量测定的方法
CN107203497A (zh) * 2017-06-21 2017-09-26 佛山科学技术学院 一种基于偏最小二乘法的生物特征标记物提取方法及系统
US20180180590A1 (en) * 2016-07-13 2018-06-28 The United States Of America As Represented By The Secretary Of The Navy Volatile organic compounds as diagnostic breath markers for pulmonary oxygen toxicity
CN108680745A (zh) * 2018-01-03 2018-10-19 湖州市中心医院 血清脂质生物标志物在nsclc早期诊断中的应用方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103616450A (zh) * 2013-11-29 2014-03-05 湖州市中心医院 一种肺癌患者血清特异性代谢产物谱及其建立方法
US20180180590A1 (en) * 2016-07-13 2018-06-28 The United States Of America As Represented By The Secretary Of The Navy Volatile organic compounds as diagnostic breath markers for pulmonary oxygen toxicity
CN106324173A (zh) * 2016-08-23 2017-01-11 国家烟草质量监督检验中心 一种基于反相色谱飞行时间质谱的喉癌血清差异代谢物的测定筛选方法
CN106872370A (zh) * 2017-02-23 2017-06-20 浙江大学 一种基于高光谱的杨梅中花色苷含量测定的方法
CN107203497A (zh) * 2017-06-21 2017-09-26 佛山科学技术学院 一种基于偏最小二乘法的生物特征标记物提取方法及系统
CN108680745A (zh) * 2018-01-03 2018-10-19 湖州市中心医院 血清脂质生物标志物在nsclc早期诊断中的应用方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
CHEN, YR 等: "Metabolomic profiling of human serum in lung cancer patients using liquid chromatography/hybrid quadrupole time-of-flight mass spectrometry and gas chromatography/mass spectrometry", 《JOURNAL OF CANCER RESEARCH AND CLINICAL ONCOLOGY》 *
李莉 等: "卵巢癌患者和健康者血清样本代谢分子表达的研究", 《中国妇幼保健》 *
陈卫: "基于组学的天舒胶囊质量评价与酚麻美敏片药效成分同时测定", 《中国优秀硕士学位论文全文数据库 医药卫生科技辑》 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110782942A (zh) * 2019-10-25 2020-02-11 苏州帕诺米克生物医药科技有限公司 代谢组学中的质量控制方法、装置及存储介质
CN110782942B (zh) * 2019-10-25 2023-08-25 苏州帕诺米克生物医药科技有限公司 代谢组学中的质量控制方法、装置及存储介质
CN111413431A (zh) * 2020-04-17 2020-07-14 中国药科大学 一种药源性急性肾损伤病变进程代谢标志物的筛选方法
CN111426766A (zh) * 2020-04-17 2020-07-17 中国药科大学 一种药源性急性肾损伤小鼠模型的构建及评价方法
CN111413431B (zh) * 2020-04-17 2022-03-01 中国药科大学 一种药源性急性肾损伤病变进程代谢标志物的筛选方法
WO2021217745A1 (zh) * 2020-04-26 2021-11-04 南京大学 一种基于污染物代谢扰动的非目标生物标志物高通量筛查方法
US11226318B2 (en) 2020-04-26 2022-01-18 Nanjing University Method for high-throughput screening of non-target biomarkers based on metabolic perturbation caused by pollutants
CN114283877A (zh) * 2021-04-29 2022-04-05 厦门市迈理奥科技有限公司 一种建立代谢物模型及其代谢组学数据库的方法
CN114295706A (zh) * 2021-09-28 2022-04-08 岛津企业管理(中国)有限公司 一种基于统计学的非靶向非小细胞肺癌的病理分型方法
CN114566292A (zh) * 2022-01-29 2022-05-31 浙江大学医学院附属第一医院 应用内源性物质预测肾移植药物剂量的模型的构建方法
CN115266985A (zh) * 2022-07-29 2022-11-01 国家烟草质量监督检验中心 一种基于uhplc-qtof-ms的喉癌患者血清脂质组学检测方法
CN115266985B (zh) * 2022-07-29 2023-12-22 国家烟草质量监督检验中心 一种基于uhplc-qtof-ms的喉癌患者血清脂质组学检测方法

Similar Documents

Publication Publication Date Title
CN109668984A (zh) 一种基于代谢组学的喉癌血清判别模型的构建方法
CN108414660B (zh) 一组与肺癌早期诊断相关的血浆代谢小分子标志物的应用
CN104713971B (zh) 一种利用食管癌初步筛查用血清代谢组学分析模型分析血清代谢组学的方法
CN105574474A (zh) 一种基于质谱信息的生物特征图像识别方法
CN106018640A (zh) 一种快速筛选、鉴定肿瘤生物标记物的方法及应用
CN106525988A (zh) 一种枳实药材指纹图谱的检测方法及标准指纹图谱
CN106442764B (zh) 多囊卵巢综合征的诊断和/或分型标志物及制备试剂的用途
CN104515797A (zh) 乳腺癌早期诊断的唾液蛋白指纹图谱模型及其构建方法
CN104713970A (zh) 一种血清代谢组学分析模型的构建方法
CN112114073A (zh) 一种枳壳质量标志物及其筛选方法和其应用
Zeng et al. Image classification combined with faster R–CNN for the peak detection of complex components and their metabolites in untargeted LC-HRMS data
Gui et al. Authenticity and species identification of Fritillariae cirrhosae: a data fusion method combining electronic nose, electronic tongue, electronic eye and near infrared spectroscopy
Liu et al. Study of the suitable climate factors and geographical origins traceability of Panax notoginseng based on correlation analysis and spectral images combined with machine learning
CN107449849B (zh) 一种中药鉴别方法
CN111638294A (zh) 一种小叶金花草的鉴别方法及其应用
CN110568196A (zh) 尿液中低级别胶质瘤相关的代谢标志物及其应用
CN108548883B (zh) 用于早期发现与预警肝损伤的生物标志物、方法及应用
CN112710856B (zh) 检测血清igf1蛋白的制剂在制备结直肠癌疗效监测试剂中的应用
CN115575553A (zh) 血清代谢标志物作为检测egfr突变的应用以及检测系统
CN114354827A (zh) 代谢标志物及其在制备2型糖尿病的风险预测试剂盒中的应用和试剂盒
CN111721860B (zh) 一种基于渗透压校正的尿液代谢组学分析方法
CN1841069A (zh) 一种用于鼻咽癌检测的血清蛋白质指纹图谱方法
CN108344761A (zh) 一种电针治疗慢性萎缩性胃炎的疗效评价方法
CN111257436A (zh) 一种利用质谱技术识别道地药材特异性标志物和差异性标志物及判断道地药材的方法
CN112834652B (zh) 急性主动脉夹层患者特异性生物标志组合物及其用途

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190423

RJ01 Rejection of invention patent application after publication