CN109920473A - 一种代谢组学标志物权重分析通用方法 - Google Patents

一种代谢组学标志物权重分析通用方法 Download PDF

Info

Publication number
CN109920473A
CN109920473A CN201910262303.3A CN201910262303A CN109920473A CN 109920473 A CN109920473 A CN 109920473A CN 201910262303 A CN201910262303 A CN 201910262303A CN 109920473 A CN109920473 A CN 109920473A
Authority
CN
China
Prior art keywords
metabolic
network
analysis
metabolin
metabolism
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910262303.3A
Other languages
English (en)
Other versions
CN109920473B (zh
Inventor
吴衍
张洁
申河清
丁蕊
张西
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Chinese Academy of Sciences
Institute of Urban Environment of CAS
Original Assignee
University of Chinese Academy of Sciences
Institute of Urban Environment of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Chinese Academy of Sciences, Institute of Urban Environment of CAS filed Critical University of Chinese Academy of Sciences
Priority to CN201910262303.3A priority Critical patent/CN109920473B/zh
Publication of CN109920473A publication Critical patent/CN109920473A/zh
Application granted granted Critical
Publication of CN109920473B publication Critical patent/CN109920473B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

本发明提供了一种代谢组学标志物权重分析通用方法,其包括如下步骤:S1、代谢物相关性分析;S2、网络分析,确定关键代谢网络;S3、多元回归分析,确定代谢标记物;S4、基于网络度中心性,确定代谢标记物在所述关键代谢网络的重要性。本发明利用网络分析,通过网络度中心性量化代谢标志物在关键代谢网络的重要性,为代谢标记物生物学权重提供评估方法,提高代谢标志物鉴定准确性,且对其他代谢组学平台标志物分析具有很强适用性。

Description

一种代谢组学标志物权重分析通用方法
技术领域
本发明涉及一种代谢组学标志物权重分析通用方法,属于代谢组学检测技术领域。
背景技术
随着检测手段和数据计算能力的不断提高,基于高通量检测和大数据分析的组学技术在生物的基因、转录、蛋白以及代谢等多个层面的研究中起到越来越重要的作用。组学技术从整体水平上对大量生物信息进行测量和分析,以多维、系统的角度阐述生命体在环境或基因作用下有机体活动的变化的潜在机制。
代谢组学作为组学技术中的重要一环,主要研究1000Da以下的代谢小分子,而这些小分子能够直接、准确的反应生物体当前的生理状态,包括潜在的内因或外因引起的代谢紊乱。生物代谢物不仅能够反应生物体异常基因作用的下游输出,而且能够表现出环境对于生理活动的作用结果。目前,代谢组学已经广泛应用于包括植物育种、环境毒理、药物机制以及生物品系鉴定等多个方面。与目标分析不同,非靶向代谢组学基于高通量数据分析,如同航拍一般能够发现不同条件下整体代谢过程中的显著差异因子既代谢标志物。同时,代谢标志物与生物代谢通路数据库(KEGG)结合,能够在一定程度上解释差异因子的生物学效应及其重要性。但是生物体代谢是一个复杂的稳态网络系统,一个代谢物通常涉及多条潜在的代谢通路变化,根据代谢标志物在KEGG中已知代谢通路中的富集水平分析虽然能够解释部分解释差异因子的生物学效应,由于数据库的局限性,富集分析结果往往忽略了物种间代谢差异以及未知代谢通路等因素的影响。同时,忽略代谢物之间相关性以及单一数据库富集分析容易导致代谢标志物生物学效应评估产生偏差,进而降低代谢标志物特异性。如何有效利用高通量组学数据构建特异性代谢相关性网络,量化代谢标志物在代谢网络中重要性,是提高代谢标志物特异性和解释度的一个关键问题。
发明内容
为解决上述技术问题,本发明的目的在于提供了一种代谢组学标志物权重分析通用方法。
本发明是通过以下技术方案实现的:
本发明提供了一种代谢组学标志物权重分析通用方法,其包括如下步骤:
S1、进行代谢物相关性分析;
S2、利用相关性分析结果构建代谢网络,分析并确定关键代谢网络;
S3、确定关键代谢网络的同时,通过多元回归分析,确定代谢标记物;
S4、结合关键代谢网络与代谢标记物结果,通过网络模型中心性分析,确定代谢标记物在所述关键代谢网络的重要性。
作为优选方案,步骤S1的具体操作为:
利用高分辨质谱技术获取样品的代谢指纹图谱,通过软件提取母离子精确分子量信息及相应分子量的丰度信息,利用相关代谢数据库确定母离子中属于代谢物的分子信息和丰度;
将确定的代谢物母离子丰度信息通过归一化法计算出代谢物相对强度,利用Paretoscaling对代谢物相对强度进行数据标准化处理获得代谢物浓度值;
采用相关性模型Spearman分析代谢物浓度之间相关性,确认其相关系数β。
作为优选方案,所述步骤S1中代谢组学数据来源为植物、动物组织、血液、尿液中的任何一种,所述代谢信息通过气相色谱质谱、液相色谱质谱以及核磁共振波谱中的一种或多种平台获取。
作为优选方案,步骤S2的具体操作为:
使用Network模型,利用步骤S1中相关性数据构建整体代谢网络拓扑图;
设定相关性阈值β0,通过阈值排除代谢网络中弱相关代谢节点连线;
利用OpenOrd算法,聚类强相关性代谢节点,剔除无相关或弱相关性节点;
利用Fruchterman-Reingold算法,确定关键代谢网络拓扑结构及其关键代谢节点。
作为优选方案,步骤S3的具体操作为:
基于步骤S1代谢物强度信息,利用正交最小篇二乘法回归分析,通过研究组对照组之间差异重要性分析,确定潜在差异代谢物;
利用曼-惠特尼秩和检验对潜在差异代谢物进行均值检验;
计算潜在差异代谢物在研究组对照组之间差异倍数。
作为优选方案,步骤S4的具体操作为:
基于步骤S2与S3确定的关键代谢网络节点和代谢标志物,利用Spearman确认其之间的相关性;
通过S2相关性阈值以及OpenOrd算法,删除弱相关或非相关节点;
利用ForceAtlas算法确定代谢标志物在关键代谢网络中的拓扑结构;
根据节点连线数量与相关性权重,计算代谢标记物度中心性(度),将代谢标志物度作为其生物学重要性权重。
本发明关键点在于利用高通量组学数据构建关键代谢网络,通过评估多元回归模型鉴定标志代谢物在关键代谢网络中节点度中心性量化代谢标志物生物学重要性。与此前方法不同,本发明利用测定样本代谢信息构建核心代谢网络,通过网络分析评估代谢标志物重要性,提高了代谢标志物特异性。本发明的核心保护点在于提供了代谢标志物的生物学权重信息,在增强标记代谢物判别能力同时避免了由于非特异性数据库富集分析导致标志物重要性评估偏差。
因此,本发明具有如下有益效果:
1、本发明基于传统代谢组学方法开发,不仅可以用于利用质谱平台获取代谢数据,同时可以推广至多代谢组学分析平台。
2、本发明利用高通量组学数据网络分析,对代谢标志物重要性分析提供了简单流程化处理方法,通过量化数据增加组学分析数据的可读性,降低技术应用门槛,有利于技术推广。
3、本发明以网络度中心性分析为基础,在原有多元回归筛选基础上考量化代谢物在关键代谢网络中的重要性,建立基于样品数据代谢信息为基础的权重分析体系,避免了代谢标志物基于非特异性代谢数据库富集分析而导致结果特异性降低的问题,提高了代谢标志物的判别能力,提高其在定向育种、品系鉴定、药物作用等多领域的应用效率。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明的方法的流程图;
图2为本发明中内源代谢物浓度Spearman相关性分析结果;
图3为本发明中关键代谢网络;
图4为本发明中病例对照内源代谢物OPLS-DA分析结果;
图5为本发明中标志代谢物在实验组关键代谢网络中的作用。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进。这些都属于本发明的保护范围。
实施例1
本实施例涉及基于脐带血清代谢轮廓的妊娠期糖尿病代谢异常通路筛选,具体包括如下步骤:
一、血清样品的收集和预处理
收集65例无明显妊娠期合并症的健康孕妇以及31例仅患有妊娠期糖尿病且无其他围产期并发症孕妇的脐带血,通过液液萃取方式提取脐带血血清代谢物。全部脐带血样品均在厦门妇幼保健院收集,所有受试者均签署书面知情同意书。
二、血清代谢检测
通过必要的前处理,提取的血清代谢图谱通过赛默飞Q Exactive液相色谱质谱联用系统获得。代谢物的分离采用反向色谱柱,代谢物分子信息通过质谱系统获得,其质谱采用正负离子两种模式运行。ESI扫描模式下,扫描范围为70到1000Da。检测过程中穿插质控样品,通过质控(QC)校正模型对质谱信号强度进行校正。
三、代谢数据提取与分析
利用CompoundDiscovery进行保留时间校正,提取质谱测量文件中有效离子信息;利用Compound Discovery集成数据库分析一级、二级质谱信息,匹配质谱特征峰对应的分子式;利用Human Urine Metabolome Database(HMDB)确定匹配质谱特征峰中人体的内源代谢物。
四、代谢网络的构建和关键类别代谢网络鉴定
基于上述内源代谢物相对峰强度数据,分别通过求和归一化和Pareto scaling对代谢物强度进行数据标准化处理,并且在标准处理数据基础上,通过Spearman模型分析内源代谢物间相关系数β(图2)。
五、关键代谢网络鉴定
利用Spearman模型相关性数据,通过设定相关性阈值β0去除弱关系以及无关系节点连线;通过OpenOrd算法聚焦关键相关性代谢网络,利用网络拓扑结构删除代谢网络外独立节点;进而采用Fruchterman-Reingold算法构建关键代谢网络拓扑结构图,如图3所示。
六、代谢物标记物鉴定
将第四步标准化处理后的内源性代谢物导入SIMCA-P软件,数据根据病例/对照分组,采用监督学习多元回归模型OPLS-DA对组间的差异代谢物进行鉴定(图4)。通过OPLS-DA模型中考察所有内源性代谢物组间差异重要性参数VIP确认潜在差异代谢物。设定代谢物的重要性参数(VIP)大于1.2为潜在差异代谢物,并且从候选名单中移除jack-knifing置信区间小于0的变量。
潜在差异代谢物进一步通过曼-惠特尼秩和检验确定其组间差异显著性,并计算其组间变异系数(FC)。最后,选择均值差异显著(p<0.05)且变异系数大于1.4的潜在差异代谢物作为代谢物标志物,其中包括四氢可的松,花生四烯酸,酮基胆固醇,胆甾-4,6-二烯-3-酮,酰肉碱,如表1所示。
六、标志代谢物在关键代谢网络重要性分析
基于第五步构建的关键代谢网络和第六步差异代谢物结果,基于实验组(GDM组)数据,通过Spearman相关性分析确定关键代谢网络节点与代谢物标志物之间相关系数,通过相关系数阈值β0与OpenOrd去除非相关性连线和节点,通过ForecAtlas算法构建代谢标志物重要性分析网络拓扑图,如图5所示。
通过网络节点度中心性分析(度),代谢物四氢可的松以及花生四烯酸对网络具有较大的作用。网络分析中,四氢可的松以及花生四烯酸与网络中关键节点的白三烯A(Leukotriene A4),溶血卵磷脂类(LysoPC)代谢物有较强的联系,这也与妊娠中晚期GDM母亲脂质代谢异常的事实相符。同时,以BMI和年龄作为校正因素进行多元线性回归分析,结果也显示生物标志物花生四烯酸对于不同代谢水平具有较好的判别能力。本案例结果说明度中心性分析能够量化代谢物标志物在关键代谢调控网络中的重要性,是代谢组生物学重要性分析的一个重要参数。
表1、GDM代谢标志物
表2、GDM代谢标志物网络重要性分析
a.p值由所有标志代谢物拟合多元线性回归求得,其中BMI和年龄作为校正因素。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变形或修改,这并不影响本发明的实质内容。

Claims (6)

1.一种代谢组学标志物权重分析通用方法,其特征在于,包括如下步骤:
S1、进行代谢物相关性分析;
S2、利用相关性分析结果构建代谢网络,分析并确定关键代谢网络;
S3、确定关键代谢网络的同时,通过多元回归分析,确定代谢标记物;
S4、结合关键代谢网络与代谢标记物结果,通过网络模型中心性分析,确定代谢标记物在所述关键代谢网络的重要性。
2.如权利要求1所述的代谢组学标志物权重分析通用方法,其特征在于,步骤S1的具体操作为:
利用高分辨质谱技术获取样品的代谢指纹图谱,通过软件提取母离子精确分子量信息及相应分子量的丰度信息,利用相关代谢数据库确定母离子中属于代谢物的分子信息和丰度;
将确定的代谢物母离子丰度信息通过归一化法计算出代谢物相对强度,利用Paretoscaling对代谢物相对强度进行数据标准化处理获得代谢物浓度值;
采用相关性模型Spearman分析代谢物浓度之间相关性,确认其相关系数β。
3.如权利要求1或2所述的代谢组学标志物权重分析通用方法,其特征在于,所述步骤S1中代谢组学数据来源为植物、动物组织、血液、尿液中的任何一种,所述代谢信息通过气相色谱质谱、液相色谱质谱以及核磁共振波谱中的一种或多种平台获取。
4.如权利要求1所述的代谢组学标志物权重分析通用方法,其特征在于,步骤S2的具体操作为:
使用Network模型,利用步骤S1中相关性数据构建整体代谢网络拓扑图;
设定相关性阈值β0,通过阈值排除代谢网络中弱相关代谢节点连线;
利用OpenOrd算法,聚类强相关性代谢节点,剔除无相关或弱相关性节点;
利用Fruchterman-Reingold算法,确定关键代谢网络拓扑结构及其关键代谢节点。
5.如权利要求1所述的代谢组学标志物权重分析通用方法,其特征在于,步骤S3的具体操作为:
基于步骤S1代谢物强度信息,利用正交最小篇二乘法回归分析,通过研究组对照组之间差异重要性分析,确定潜在差异代谢物;
利用曼-惠特尼秩和检验对潜在差异代谢物进行均值检验;
计算潜在差异代谢物在研究组对照组之间差异倍数。
6.如权利要求1所述的代谢组学标志物权重分析通用方法,其特征在于,步骤S4的具体操作为:
基于步骤S2与S3确定的关键代谢网络节点和代谢标志物,利用Spearman确认其之间的相关性;
通过S2相关性阈值以及OpenOrd算法,删除弱相关或非相关节点;
利用ForceAtlas算法确定代谢标志物在关键代谢网络中的拓扑结构;
根据节点连线数量与相关性权重,计算代谢标记物度中心性(度),将代谢标志物度作为其生物学重要性权重。
CN201910262303.3A 2019-04-02 2019-04-02 一种代谢组学标志物权重分析通用方法 Expired - Fee Related CN109920473B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910262303.3A CN109920473B (zh) 2019-04-02 2019-04-02 一种代谢组学标志物权重分析通用方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910262303.3A CN109920473B (zh) 2019-04-02 2019-04-02 一种代谢组学标志物权重分析通用方法

Publications (2)

Publication Number Publication Date
CN109920473A true CN109920473A (zh) 2019-06-21
CN109920473B CN109920473B (zh) 2021-02-12

Family

ID=66968226

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910262303.3A Expired - Fee Related CN109920473B (zh) 2019-04-02 2019-04-02 一种代谢组学标志物权重分析通用方法

Country Status (1)

Country Link
CN (1) CN109920473B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112986411A (zh) * 2019-12-17 2021-06-18 中国科学院地理科学与资源研究所 一种生物代谢物筛查方法
CN113643768A (zh) * 2021-08-12 2021-11-12 上海鹿明生物科技有限公司 植物代谢物数据库的构建方法、装置、介质及终端
CN114609318A (zh) * 2020-12-03 2022-06-10 中国科学院大连化学物理研究所 一种基于分子结构关联网络的规模化代谢组定性方法
CN114923992A (zh) * 2022-03-29 2022-08-19 中国科学院上海有机化学研究所 鉴定已知和未知代谢物的分析方法、装置和设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105956413A (zh) * 2016-04-27 2016-09-21 王�忠 识别生物分子网络中关键模块或关键节点的方法
CN108095685A (zh) * 2016-11-23 2018-06-01 中国科学院昆明动物研究所 人体微生物互作网络中正负作用比值在评估人体健康和疾病诊断中的应用
CN108680745A (zh) * 2018-01-03 2018-10-19 湖州市中心医院 血清脂质生物标志物在nsclc早期诊断中的应用方法
CN109061020A (zh) * 2018-09-28 2018-12-21 深圳市绘云生物科技有限公司 一种基于气相/液相色谱质谱平台的数据分析系统
CN109192252A (zh) * 2018-08-23 2019-01-11 南开大学 共表达周期昼夜节律的转录组学在药物作用机制发现中的用途

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105956413A (zh) * 2016-04-27 2016-09-21 王�忠 识别生物分子网络中关键模块或关键节点的方法
CN108095685A (zh) * 2016-11-23 2018-06-01 中国科学院昆明动物研究所 人体微生物互作网络中正负作用比值在评估人体健康和疾病诊断中的应用
CN108680745A (zh) * 2018-01-03 2018-10-19 湖州市中心医院 血清脂质生物标志物在nsclc早期诊断中的应用方法
CN109192252A (zh) * 2018-08-23 2019-01-11 南开大学 共表达周期昼夜节律的转录组学在药物作用机制发现中的用途
CN109061020A (zh) * 2018-09-28 2018-12-21 深圳市绘云生物科技有限公司 一种基于气相/液相色谱质谱平台的数据分析系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
IDOIA IBERO-BARAIBAR,,ANA ROMO-HUALDE ET AL.: ""The urinary metabolomic profifile following the intake of meals supplemented with a cocoa extract in middle-aged obese subjects"", 《FOOD & FUNCTION》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112986411A (zh) * 2019-12-17 2021-06-18 中国科学院地理科学与资源研究所 一种生物代谢物筛查方法
CN114609318A (zh) * 2020-12-03 2022-06-10 中国科学院大连化学物理研究所 一种基于分子结构关联网络的规模化代谢组定性方法
CN114609318B (zh) * 2020-12-03 2024-03-12 中国科学院大连化学物理研究所 一种基于分子结构关联网络的规模化代谢组定性方法
CN113643768A (zh) * 2021-08-12 2021-11-12 上海鹿明生物科技有限公司 植物代谢物数据库的构建方法、装置、介质及终端
CN113643768B (zh) * 2021-08-12 2023-12-15 上海鹿明生物科技有限公司 植物代谢物数据库的构建方法、装置、介质及终端
CN114923992A (zh) * 2022-03-29 2022-08-19 中国科学院上海有机化学研究所 鉴定已知和未知代谢物的分析方法、装置和设备

Also Published As

Publication number Publication date
CN109920473B (zh) 2021-02-12

Similar Documents

Publication Publication Date Title
Feizi et al. Recent trends in application of chemometric methods for GC-MS and GCŨGC-MS-based metabolomic studies
CN109920473A (zh) 一种代谢组学标志物权重分析通用方法
Misra Data normalization strategies in metabolomics: Current challenges, approaches, and tools
Rosato et al. From correlation to causation: analysis of metabolomics data using systems biology approaches
Lamichhane et al. An overview of metabolomics data analysis: current tools and future perspectives
Blasco et al. Comparative analysis of targeted metabolomics: dominance-based rough set approach versus orthogonal partial least square-discriminant analysis
Checa et al. Lipidomic data analysis: tutorial, practical guidelines and applications
Brown et al. Automated workflows for accurate mass-based putative metabolite identification in LC/MS-derived metabolomic datasets
Du et al. Metabolomics data preprocessing using ADAP and MZmine 2
Jaffe et al. PEPPeR, a platform for experimental proteomic pattern recognition
Xia et al. Web-based inference of biological patterns, functions and pathways from metabolomic data using MetaboAnalyst
Kenar et al. Automated label-free quantification of metabolites from liquid chromatography–mass spectrometry data
Wen et al. Urinary volatile organic compound analysis for the diagnosis of cancer: A systematic literature review and quality assessment
Rinaudo et al. Biosigner: a new method for the discovery of significant molecular signatures from omics data
JP6715451B2 (ja) マススペクトル解析システム,方法およびプログラム
Pluskal et al. Metabolomics data analysis using MZmine
CN103776891A (zh) 一种检测差异表达蛋白质的方法
Bowling et al. Analyzing the metabolome
Percival et al. Univariate and multivariate statistical approaches to the analysis and interpretation of NMR-based metabolomics datasets of increasing complexity
Antoniewicz et al. Evaluation of regression models in metabolic physiology: predicting fluxes from isotopic data without knowledge of the pathway
Li et al. COLMARq: a web server for 2D NMR peak picking and quantitative comparative analysis of cohorts of metabolomics samples
CN109870533A (zh) 一种基于分子地图的生物样本快速智能识别方法
Aksenov et al. Algorithmic learning for auto-deconvolution of GC-MS data to enable molecular networking within GNPS
Kalia et al. Unsupervised dimensionality reduction for exposome research
Shi et al. Discovery of urine biomarkers for bladder cancer via global metabolomics

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20210212

CF01 Termination of patent right due to non-payment of annual fee