CN107703243A - 用于代谢组学的气相色谱‑质谱分析处理方法和系统 - Google Patents
用于代谢组学的气相色谱‑质谱分析处理方法和系统 Download PDFInfo
- Publication number
- CN107703243A CN107703243A CN201710919407.8A CN201710919407A CN107703243A CN 107703243 A CN107703243 A CN 107703243A CN 201710919407 A CN201710919407 A CN 201710919407A CN 107703243 A CN107703243 A CN 107703243A
- Authority
- CN
- China
- Prior art keywords
- peak
- summary report
- file
- metabolism group
- processing method
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/86—Signal analysis
- G01N30/8651—Recording, data aquisition, archiving and storage
Landscapes
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
Abstract
本发明公开了一种用于代谢组学的气相色谱‑质谱分析处理方法和系统,包括以下步骤:S1:定义为提取参数模板,用AMDIS以可重复的方式提取每个样品的参数,用这些参数来整合整个数据集的色谱峰,并且在此过程结束时,生成汇总报告文件;S2:进行峰值提取,根据峰高或峰面积确定代谢物的浓度,将代谢物的浓度保存到汇总报告文件中;S3:验证峰值和代谢物浓度的正确性,将重新整合的峰值保存到汇总报告文件中;S4:执行污染物标记和校正;S5:对数据进行统计分析。本发明不需要像常规方法那样对每个样品进行峰鉴定、代谢物鉴定和比对,可以最大限度地减少分析处理大数据的时间,经检验,运用终端计算机可以在一小时内处理数百个样本。
Description
技术领域
本发明属于代谢组学的数据处理领域,特别是涉及一种用于代谢组学的气相色谱-质谱分析处理方法和系统。
背景技术
GC-MS(Gas Chromatography-Mass Spectrometer)是指气相色谱-质谱联用仪,是一种测量离子荷质比的仪器。由于气相色谱的流动相为惰性气体,气-固色谱法中以表面积大且具有一定活性的吸附剂作为固定相,当多组分的混合样品进入色谱柱后,由于吸附剂对每个组分的吸附力不同,经过一定时间后,各组分在色谱柱中的运行速度也就不同,吸附力弱的组分容易被解吸下来,最先离开色谱柱进入检测器,而吸附能力强的组分最不容易被解吸下来,因此最后离开色谱柱,如此各组分得以在色谱柱中彼此分离,顺序进入检测器中被检测、记录下来。
在代谢组学中虽然气相色谱-质谱能在短时间内对几百或几千个样本进行分析,但同时也面临一些挑战,包括仪器的性能变化、质谱柱老化而引起的信号强度损失、例子源中污染物的积聚以及采样处理的差异等因素。虽然,气相色谱-质谱是应用于代谢组学研究的一种成熟的分析平台,能够分离复杂的生物化学混合物,并且能够从高复现性的电子轰击离子化质谱中快速的鉴定化合物,然而,当然气相色谱-质谱用于大样本研究时,在数月内分析成千上万个样品,将增加分析难度,很多用于气相色谱-质谱数据提取装置都是设计为了进行靶向分析,或者是少于一百个样本的分析,不能用于大数据处理。
自动化质谱图解卷积和鉴定系统(简称AMDIS)利用算法提高了气相色谱 -质谱鉴定化合物的可靠性,然而AMDIS不是为大数据而设计的,有时可能不准确地将同一色谱峰鉴定出多种物质,当化合物没有高准确度时,AMDIS也会产生缺失值,从而使多变量统计分析产生问题。
发明内容
针对现有技术的不足,本发明的目的在于提供一种可以大大提高 GC-MS数据提取效率和准确性的用于代谢组学的气相色谱-质谱分析处理方法和系统。
为了解决上述技术问题,本发明采用了如下的技术方案:
一种用于代谢组学的气相色谱-质谱分析处理方法,包括以下步骤:
S1:将参考离子的参数定义为提取参数模板,用AMDIS以可重复的方式提取每个样品的参数,用这些参数来整合整个数据集的色谱峰,并且在此过程结束时,生成汇总报告文件;
S2:访问S1创建的汇总文件报告,进行峰值提取,根据峰高或峰面积确定代谢物的浓度,将代谢物的浓度保存到汇总报告文件中;
S3:访问S2创建的汇总报告文件,验证峰值和代谢物浓度的正确性,将重新整合的峰值保存到汇总报告文件中;
S4:执行污染物标记和校正;
S5:对S5中的数据文件进行统计分析,并将最终统计结果保存在选定的工作目录下。
在步骤S1中,若在质谱库中未预先定义参考离子,则可以选择从质谱库大量离子中自动生成一个参考离子。
在进行峰值提取前,将AMDIS提取的全部样品参数生成图案文件。
所述步骤S1中的参数包括参考离子、保留时间和化合物鉴定。
在汇总报告文件中,为每个保留时间范围返回一个值。
在步骤S3中,验证峰值浓度的方式包括:
第一种方式:通过汇总报告文件中列出的警告信息判断不正确峰值浓度;
第二种方式:通过重叠色谱图来判断不正确峰值浓度。
在步骤S4中,生成的数据文件包括样本名称、样品类型和批次信息,通过样本中检测到的峰值与同一批次检测的平均值进行比较来鉴定污染物。
在步骤S5中,所述统计分析的方法包括:
第一种方法:主成分分析;
第二种方法:偏最小二乘法-判别分析;
第三种方法:方差分析或T检验。
与现有技术相比,本发明的有益效果在于:
1、本发明不需要像常规方法那样对每个样品进行峰鉴定、代谢物鉴定和比对,可以最大限度地减少分析处理大数据的时间,经检验,运用终端计算机可以在一小时内处理数百个样本。
2、本发明通过峰值提取-峰值检测-污染物标记和校正-统计分析操作大大提高了GC-MS数据提取准确性。
具体实施方式
一种用于代谢组学的气相色谱-质谱分析处理方法,包括以下步骤:
S1:将参考离子的参数定义为提取参数模板,用AMDIS以可重复的方式提取每个样品的参数,用这些参数来整合整个数据集的色谱峰,并且在此过程结束时,生成汇总报告文件;
S2:访问S1创建的汇总文件报告,进行峰值提取,根据峰高或峰面积确定代谢物的浓度,将代谢物的浓度保存到汇总报告文件中;
S3:访问S2创建的汇总报告文件,验证峰值和代谢物浓度的正确性,将重新整合的峰值保存到汇总报告文件中;
S4:执行污染物标记和校正;
S5:对S5中的数据文件进行统计分析,并将最终统计结果保存在选定的工作目录下。
采用常规方法需要对每个样品进行峰鉴定、代谢物鉴定和比对,使得整个过程产生不必要的耗时;本方法通过AMDIS按照模板参数以可重复的方式提取所有样品的参数,然后再进行分析处理,最大限度地减少了分析处理大数据的时间;经过检验,通过使用总结模板中集成参数,运用终端计算机可以在一小时内处理数百个样本,极大地满足了代谢组学对大数据处理的要求。
在步骤S1中,若在质谱库中未预先定义参考离子,则可以选择从质谱库大量离子中自动生成一个参考离子。
在进行峰值提取前,将AMDIS提取的全部样品参数生成图案文件,以便在峰值提取前进行手动校正。
所述步骤S1中的参数包括参考离子、保留时间和化合物鉴定。当然,用户还可以根据自己的喜好和需求轻松修改模板参数,例如纳入或排除特定化合物、或选择整合所有同位素离子。
在AMDIS提取样品参数时,经常会出现保留时间偏移现象,重复性差,为了解决此问题,可以根据峰的保留时间偏移和峰值宽度来调整峰值保留时间,具体公式如下:
其中,X=所有样品中被鉴定的代谢物的保留时间;peakwidth峰值宽度=色谱峰的宽度;IQR=四分位间距;Q1=第一四分位;Q2=第三四分位;
为了确定保留时间范围内的多个色谱峰,一旦保留时间大于预设阈值,可以通过下列公式自动确定可能峰值。
其中,i=initial scan time;n=end of scan time;density.yaxis= densityestimation of peak height;density.xaxis=density estimation of scan time;i=最初扫描时间;n=扫描结束时间;density.yaxis=峰高的密度估计;density.xaxis=扫描时间的密度估计。
当低丰度或共洗脱化合物未达到AMDIS中的光谱鉴定阈值时,或峰值嵌入背景噪声中,会产生大部分缺失值。因此,本方法为汇总报告文件中的每个保留时间范围返回一个值,不管是否确定了峰值,用这种方法,加上使用低基线阈值,可以将缺失值减少到所获取数据的0.02%以下。
在步骤S3中,验证峰值浓度的方式包括:
第一种方式:通过汇总报告文件中列出的警告信息判断不正确峰值浓度;
第二种方式:通过重叠色谱图来判断不正确峰值浓度。
在步骤S4中,为执行污染物标记和校正,生成的数据文件包括样本名称、样品类型和批次信息,通过样本中检测到的峰值与同一批次检测的平均值进行比较来鉴定污染物。
在步骤S5中,所述统计分析的方法包括:
第一种方法:主成分分析(PCA),主成分分析是通过微观谱图对未知成分进行分析,用于分析样品的主要成分。
第二种方法:偏最小二乘法-判别分析,是一种根据观察或测量到的若干变量值,来判断研究对象如何分类的常用统计分析方法,其原理是对不同处理样本(如观测样本、对照样本)的特性分别进行训练,产生训练集,并检验训练集的可信度。
第三种方法:方差分析或T检验,T检验是用来检查不同样本之间是否存在差异,而方差分析则是评估不同样本之间的差异是由某个因素起主要作用。
一种用于代谢组学的气相色谱-质谱的分析处理系统,包括:
AMDIS,所述AMDIS根据汇总报告文件定义的提取参数以可重复的方式提取每个样品的色谱峰;
处理单元,所述处理单元根据AMDIS提取的数据生成汇总报告文件,并对汇总报告文件中数据进行峰值提取、峰值检测、数据规范和统计分析操作;
显示屏,所述显示屏用于显示生成的图案文件和操作界面。
最后需要说明的是,以上实施例仅用以说明本发明的技术方案而非限制技术方案,尽管申请人参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,那些对本发明的技术方案进行修改或者等同替换,而不脱离本技术方案的宗旨和范围,均应涵盖在本发明的权利要求范围当中。
Claims (9)
1.一种用于代谢组学的气相色谱-质谱分析处理方法,其特征在于,包括以下步骤:
S1:将参考离子的参数定义为提取参数模板,用AMDIS以可重复的方式提取每个样品的参数,用这些参数来整合整个数据集的色谱峰,并且在此过程结束时,生成汇总报告文件;
S2:访问S1创建的汇总文件报告,进行峰值提取,根据峰高或峰面积确定代谢物的浓度,将代谢物的浓度保存到汇总报告文件中;
S3:访问S2创建的汇总报告文件,验证峰值和代谢物浓度的正确性,将重新整合的峰值保存到汇总报告文件中;
S4:执行污染物标记和校正;
S5:对S5中的数据文件进行统计分析,并将最终统计结果保存在选定的工作目录下。
2.根据权利要求1所述的一种用于代谢组学的气相色谱-质谱分析的数据处理方法,其特征在于:在步骤S1中,若在质谱库中未预先定义参考离子,则可以选择从质谱库大量离子中自动生成一个参考离子。
3.根据权利要求1所述的一种用于代谢组学的气相色谱-质谱分析的数据处理方法,其特征在于:在进行峰值提取前,将AMDIS提取的全部样品参数生成图案文件。
4.根据权利要求1所述的一种用于代谢组学的气相色谱-质谱分析的数据处理方法,其特征在于:所述步骤S1中的参数包括参考离子、保留时间和化合物鉴定。
5.根据权利要求1所述的一种用于代谢组学的气相色谱-质谱分析的数据处理方法,其特征在于:在汇总报告文件中,为每个保留时间范围返回一个值。
6.根据权利要求1所述的一种用于代谢组学的气相色谱-质谱分析的数据处理方法,其特征在于:在步骤S3中,验证峰值浓度的方式包括:
第一种方式:通过汇总报告文件中列出的警告信息判断不正确峰值浓度;
第二种方式:通过重叠色谱图来判断不正确峰值浓度。
7.根据权利要求1所述的一种用于代谢组学的气相色谱-质谱分析的数据处理方法,其特征在于:在步骤S4中,生成的数据文件包括样本名称、样品类型和批次信息,通过样本中检测到的峰值与同一批次检测的平均值进行比较来鉴定污染物。
8.根据权利要求1所述的一种用于代谢组学的气相色谱-质谱分析的数据处理方法,其特征在于:在步骤S5中,所述统计分析的方法包括:
第一种方法:主成分分析;
第二种方法:偏最小二乘法-判别分析;
第三种方法:方差分析或T检验。
9.一种用于代谢组学的气相色谱-质谱的分析处理系统,其特征在于,包括:
AMDIS,所述AMDIS根据汇总报告文件定义的提取参数以可重复的方式提取每个样品的色谱峰;
处理单元,所述处理单元根据AMDIS提取的数据生成汇总报告文件,并对汇总报告文件中数据进行峰值提取、峰值检测、数据规范和统计分析操作;
显示屏,所述显示屏用于显示生成的图案文件和操作界面。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710919407.8A CN107703243B (zh) | 2017-09-26 | 2017-09-26 | 用于代谢组学的气相色谱-质谱分析处理方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710919407.8A CN107703243B (zh) | 2017-09-26 | 2017-09-26 | 用于代谢组学的气相色谱-质谱分析处理方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107703243A true CN107703243A (zh) | 2018-02-16 |
CN107703243B CN107703243B (zh) | 2021-06-15 |
Family
ID=61183926
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710919407.8A Active CN107703243B (zh) | 2017-09-26 | 2017-09-26 | 用于代谢组学的气相色谱-质谱分析处理方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107703243B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109061020A (zh) * | 2018-09-28 | 2018-12-21 | 深圳市绘云生物科技有限公司 | 一种基于气相/液相色谱质谱平台的数据分析系统 |
US11754536B2 (en) | 2021-11-01 | 2023-09-12 | Matterworks Inc | Methods and compositions for analyte quantification |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020147550A1 (en) * | 1994-03-28 | 2002-10-10 | Hitachi, Ltd. | Method and apparatus for analyzing multi-channel chromatogram |
CN1898674A (zh) * | 2003-10-20 | 2007-01-17 | 瑟诺生物科学有限责任公司 | 用于校准质谱仪(ms)与其它仪器系统和用于处理ms与其它数据的方法 |
US20100108876A1 (en) * | 2008-10-31 | 2010-05-06 | Horn David M | Mass Spectral Analysis Of Complex Samples Containing Large Molecules |
CN103616450A (zh) * | 2013-11-29 | 2014-03-05 | 湖州市中心医院 | 一种肺癌患者血清特异性代谢产物谱及其建立方法 |
CN104458983A (zh) * | 2013-09-16 | 2015-03-25 | 中国科学院大连化学物理研究所 | 一种有效获取血清小分子代谢物信息的方法 |
CN106485082A (zh) * | 2016-10-17 | 2017-03-08 | 南京医科大学 | 一种基于精浆代谢组学的opls‑da诊断模型的建立方法及其应用 |
-
2017
- 2017-09-26 CN CN201710919407.8A patent/CN107703243B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020147550A1 (en) * | 1994-03-28 | 2002-10-10 | Hitachi, Ltd. | Method and apparatus for analyzing multi-channel chromatogram |
CN1898674A (zh) * | 2003-10-20 | 2007-01-17 | 瑟诺生物科学有限责任公司 | 用于校准质谱仪(ms)与其它仪器系统和用于处理ms与其它数据的方法 |
US20100108876A1 (en) * | 2008-10-31 | 2010-05-06 | Horn David M | Mass Spectral Analysis Of Complex Samples Containing Large Molecules |
CN104458983A (zh) * | 2013-09-16 | 2015-03-25 | 中国科学院大连化学物理研究所 | 一种有效获取血清小分子代谢物信息的方法 |
CN103616450A (zh) * | 2013-11-29 | 2014-03-05 | 湖州市中心医院 | 一种肺癌患者血清特异性代谢产物谱及其建立方法 |
CN106485082A (zh) * | 2016-10-17 | 2017-03-08 | 南京医科大学 | 一种基于精浆代谢组学的opls‑da诊断模型的建立方法及其应用 |
Non-Patent Citations (2)
Title |
---|
COREY D. BROECKLING ET AL: "MET-IDEA: Data Extraction Tool for Mass Spectrometry-Based Metabolomics", 《ANAL. CHEM.》 * |
ZHENTIAN LEI ET AL: "MET-IDEA version 2.06; improved efficiency and additional functions for mass spectrometry-based metabolomics data processing", 《METABOLOMICS》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109061020A (zh) * | 2018-09-28 | 2018-12-21 | 深圳市绘云生物科技有限公司 | 一种基于气相/液相色谱质谱平台的数据分析系统 |
US11754536B2 (en) | 2021-11-01 | 2023-09-12 | Matterworks Inc | Methods and compositions for analyte quantification |
Also Published As
Publication number | Publication date |
---|---|
CN107703243B (zh) | 2021-06-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10658165B2 (en) | Isotopic pattern recognition | |
US7488935B2 (en) | Apparatus and method for processing of mass spectrometry data | |
Kaufmann | The current role of high-resolution mass spectrometry in food analysis | |
US7538321B2 (en) | Method of identifying substances using mass spectrometry | |
JPWO2012073322A1 (ja) | 質量分析データ処理装置 | |
US10818485B2 (en) | Multidimensional mass spectrometry data processing device | |
WO2015107690A1 (ja) | タンデム質量分析データ処理装置 | |
CN108982729B (zh) | 用于提取质量迹线的系统和方法 | |
WO2020194582A1 (ja) | クロマトグラフ質量分析装置 | |
US6104027A (en) | Deconvolution of multiply charged ions | |
US7529630B2 (en) | Method of analyzing mass analysis data and apparatus for the method | |
CN107703243A (zh) | 用于代谢组学的气相色谱‑质谱分析处理方法和系统 | |
CN113748339A (zh) | 实时峰检测 | |
CN104024845B (zh) | 智能本底数据采集及减除 | |
JP4929149B2 (ja) | 質量分析スペクトル分析方法 | |
JP6222277B2 (ja) | タンデム質量分析データ処理装置 | |
JP6226823B2 (ja) | クロマトグラフ質量分析装置及びその制御方法 | |
JP3663140B2 (ja) | 質量分析方法および質量分析装置 | |
JP4921302B2 (ja) | 質量分析システム | |
JP5627338B2 (ja) | 質量分析方法 | |
JP6760400B2 (ja) | クロマトグラムデータ処理装置 | |
CN115516301A (zh) | 色谱质量分析数据处理方法、色谱质量分析装置以及色谱质量分析数据处理用程序 | |
TW201506401A (zh) | 由液相層析質譜資料中萃取離子信號之方法與系統 | |
Wang | Investigation of Deconvolution Approaches in GC-MS Metabolomics Studies | |
WO2023119072A1 (en) | Natural isotopologues based-mass spectrometer calibration |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |