CN103115991B - 一种针对混合物质质谱图的谱库筛选方法 - Google Patents

一种针对混合物质质谱图的谱库筛选方法 Download PDF

Info

Publication number
CN103115991B
CN103115991B CN201310059714.5A CN201310059714A CN103115991B CN 103115991 B CN103115991 B CN 103115991B CN 201310059714 A CN201310059714 A CN 201310059714A CN 103115991 B CN103115991 B CN 103115991B
Authority
CN
China
Prior art keywords
ion peak
screening
kurtosis
fragment ion
mass spectrogram
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310059714.5A
Other languages
English (en)
Other versions
CN103115991A (zh
Inventor
孔波
杨华武
卢红兵
邹有
钟科军
龚淑果
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Tobacco Hunan Industrial Co Ltd
Original Assignee
China Tobacco Hunan Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Tobacco Hunan Industrial Co Ltd filed Critical China Tobacco Hunan Industrial Co Ltd
Priority to CN201310059714.5A priority Critical patent/CN103115991B/zh
Publication of CN103115991A publication Critical patent/CN103115991A/zh
Application granted granted Critical
Publication of CN103115991B publication Critical patent/CN103115991B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明公开了一种针对混合物质质谱图的谱库筛选方法,针对色谱分离中经常出现共流出峰的混合物质当作待测物质,进行二维质谱图与标准质谱库的相似性筛选,利用混合物质的质谱图中碎片离子峰峰度排在前面的碎片离子峰,与谱库中每一物质的质谱图碎片离子峰进行匹配,相匹配的物质进入筛选库;接着对比谱库中的物质和混合物质的物质分子量、分子离子峰的横坐标及对应的纵坐标,不匹配的从筛选库中剔除;利用分子离子峰与其附近碎片离子峰峰度最大的碎片离子峰的峰度比值,以谱库中分子离子峰的位置为参考,从待测物质的质谱图中找出同样的比值,将后者与前者的比值从小到大排列作为筛选库中物质与待测物质的匹配表。该方法能够迅速定位几十或百余种可能组分,实现谱库检索筛选,从而大大提高了仪器分离能力不够所带来的缺陷。

Description

一种针对混合物质质谱图的谱库筛选方法
技术领域
本发明涉及一种针对混合物质质谱图的谱库筛选方法。
背景技术
在GC/MS分析中,对于复杂基质样品,一个色谱峰可能是几个组分和基质背景离子重叠的结果,因此,质谱图中的最大峰度并不是单一组分而是多个组分的离子峰。一次质谱图库检索可能给出很差的匹配结果,不能直接确认组成混合质谱图的所有单个组分。
目前的质谱仪器工作站,即计算机系统,可控制仪器的运行、采样、存储和质谱图检索。在做完质谱测定之后,工作站系统可将新得到的未知物质谱图与谱库的二十几万已知物的质谱图进行对比,找出谱库中与之最接近的若干谱图作为检索结果。当有较好的质谱测定条件(如GC-MS的分离程度好,未知物质的离子强度足够大等),同时谱库中存在有相应的化合物的质谱图时,检索得到的结果好。但是,当多种物质无法有效分离,构成混合物重叠质谱图时,不能有效快速的检索出物质组分。
发明内容
本发明提供一种针对混合物质质谱图的谱库筛选方法,其目的在于,克服上述现有技术的不足,在二十几万张质谱图库中,迅速缩小范围,筛选有效物质组分。
本发明采用如下技术方案:
一种针对混合物质质谱图的谱库筛选方法,其特征在于,包括如下步骤:
步骤1:利用质谱图中的碎片离子峰峰度,将待测物质和质谱图中物质进行匹配,得到初始筛选库;
色谱图中存在共流出峰的待测物质,从大到小提取待测物质的质谱图中碎片离子峰峰度大小排列在前50的碎片离子峰,依次与谱库中每一物质的质谱图中碎片离子峰峰度大小排列在前N的碎片离子峰进行匹配,若谱库中物质的质谱图中碎片离子峰峰度大小排列在前N的碎片离子峰峰均能在待测物质质谱图中碎片离子峰峰度大小排列在前50的碎片离子峰中找到,则将谱库中的该物质筛选出来,进入筛选库;其中,12≤N≤16,N为整数;
步骤2:剔除从步骤1得到的筛选库中物质分子量超过400的物质,得到剩余待筛选物质;
步骤3:依次查看步骤2得到的每个剩余待筛选物质的分子离子峰的所在位置在待测物质的质谱图中对应的碎片离子峰峰度大小是否为0,若为0,则将该物质从筛选库中剔除,更新筛选库;
步骤4:依据步骤3得到更新后的筛选库,依次计算筛选库中每一物质的分子离子峰峰度与该物质距离分子离子峰±1、±2位置中最大的碎片离子峰峰度的比值,即为第一比值;以每个物质的分子离子峰横坐标为参考坐标,找出参考坐标在待测物质的质谱图中对应的峰度与距离该参考坐标±1、±2位置中的最大的碎片离子峰峰度的比值,即为第二比值;用第二比值除以第一比值得到两者比值差异,将比值差异按从小到大排列成表得到谱库筛选结果;
其中,±1表示与指定分子离子峰坐标相差一个单位的前、后两个坐标,±2表示与指定分子离子峰坐标相差两个单位的前、后两个坐标。
所述步骤1中N为12。
有益效果
本发明提供了一种针对混合物质质谱图的谱库筛选方法,针对色谱分离中经常出现共流出峰的混合物质当作待测物质,进行二维质谱图与标准质谱库的相似性筛选,利用混合物质的质谱图中碎片离子峰峰度排在前面的碎片离子峰,与谱库中每一物质的质谱图碎片离子峰进行匹配,相匹配的物质进入筛选库;接着对比谱库中的物质和混合物质的物质分子量、分子离子峰的横坐标及对应的纵坐标,不匹配的从筛选库中剔除;最终利用分子离子峰与其附近碎片离子峰峰度最大的碎片离子峰的峰度比值,从待测物质的质谱图中找出质谱图中与谱库中物质的分子离子峰横坐标相同的碎片离子峰峰度及该横坐标附近最大碎片离子峰峰度的比值,将后者与前者的比值从小到大排列作为筛选库中物质与待测物质的匹配表。该方法从标准质谱库中二十余万种化合物中迅速定位几十或百余种可能组分,逐级地从质谱数据库中挑选合理的物质质谱,剔除不匹配物质信息,缩小范围,逐步定位混合质谱图真实组分,实现谱库检索筛选,从而大大提高了仪器分离能力不够所带来的缺陷,最大限度地实现共流出峰的化合物组成筛选,弥补色谱分析分离能力的不足,弥补该领域的空白。
附图说明
图1为组分1纯物质质谱图;
图2为组分2纯物质质谱图;
图3为组分3纯物质质谱图;
图4为三个物质混合质谱图;
图5为本发明的流程图;
图6为各组分筛选结果排序表。
具体实施方式
以下将结合附图和具体实施例对本发明做进一步详细说明:
该实施例来自实际样品仪器分析数据。采用气相色谱-质谱联用仪(FINNIGAN TRACEDSQ)进行样品实验。首先将三个纯物质进入质谱仪进行质谱分析,该实施例来自实际样品仪器分析数据。采用气相色谱-质谱联用仪(FINNIGAN TRACE DSQ)进行样品实验。首先将三种纯物质进入质谱仪进行质谱分析,图1、图2、图3分别为组分1、组分2及组分3纯物质的质谱图(其物质数字识别号码CAS号分别为:104-46-1、99-85-4、2216-51-5),利用质谱仪自带的分析软件,将三种纯物质与谱库中的物质进行匹配,得到匹配度分别为96%、94%、97%(从谱库中检索得到的NIST编号分别为:291536、239106、229324);然后,将三种物质等比例混合后,直接进入质谱仪进行质谱分析,得到图4,同样利用质谱仪自带的分析软件,将混合物质与谱库中的物质进行匹配度检索,其匹配度仅为33%,一般认为大于80%才有可信性,并且在检索排名列表前十位中未见任何一个真实组分化合物,说明现有的谱库检索方法无法检索。
接下来采用本发明的方法,如图5所示,选取NIST2011版质谱库作为谱库,该版本谱库的主库中包含212961种物质;
步骤1:利用质谱分析仪自带的软件,如Agilent MSD ChemStation,对混合物质进行分析,判定其色谱图中存在共流出峰,表明该物质为混合物质,将该物质作为待测物质,从大到小提取待测物质的质谱图中碎片离子峰峰度大小排列在前50的碎片离子峰,依次与谱库中每一物质的质谱图中碎片离子峰峰度大小排列在前N的碎片离子峰进行匹配,若谱库中物质的质谱图中碎片离子峰峰度大小排列在前N的碎片离子峰峰均能在待测物质质谱图中碎片离子峰峰度大小排列在前50的碎片离子峰中找到,则将谱库中的该物质筛选出来,进入筛选库;其中,12≤N≤16,N为整数;本实施例中设定N为12,得到1224种物质进入筛选库;
步骤2:剔除从步骤1得到的筛选库中物质分子量超过400的物质,得到剩余待筛选物质;经过剔除后,有347中物质被剔除,筛选库中留下877中物质;
步骤3:依次查看步骤2得到的每个剩余待筛选物质的分子离子峰的所在位置在待测物质的质谱图中对应的碎片离子峰峰度大小是否为0,若为0,则将该物质从筛选库中剔除,更新筛选库;更新后的筛选库只包含480种物质,又进一步剔除了397种物质;
步骤4:依据步骤3得到更新后的筛选库,依次计算筛选库中每一物质的分子离子峰峰度与该物质距离分子离子峰±1、±2位置中最大的碎片离子峰峰度的比值,即为第一比值;以每个物质的分子离子峰横坐标为参考坐标,找出参考坐标在待测物质的质谱图中对应的峰度与距离该参考坐标±1、±2位置中的最大的碎片离子峰峰度的比值,即为第二比值;用第二比值除以第一比值得到两者比值差异,将比值差异按从小到大排列成表得到谱库筛选结果,如图6所示。
从图6可以看出:组分1排名108,组分2排名86,组分3排名15,图6中第一列RANK为排名,第二列NIST ID为对应物质的NIST编号,第三列FORMULA为物质化学式,第四列RATIO是步骤4最终得到的比值差异。通过以上过程筛选,混合物的实际组分已经进入一百余名,大大缩小了可能范围,提高的筛选效率和准确率。

Claims (2)

1.一种针对混合物质质谱图的谱库筛选方法,其特征在于,包括如下步骤:
步骤1:利用质谱图中的碎片离子峰峰度,将待测物质和质谱图中物质进行匹配,得到初始筛选库;
色谱图中存在共流出峰的待测物质,从大到小提取待测物质的质谱图中碎片离子峰峰度大小排列在前50的碎片离子峰,依次与谱库中每一物质的质谱图中碎片离子峰峰度大小排列在前N的碎片离子峰进行匹配,若谱库中物质的质谱图中碎片离子峰峰度大小排列在前N的碎片离子峰峰均能在待测物质质谱图中碎片离子峰峰度大小排列在前50的碎片离子峰中找到,则将谱库中的该物质筛选出来,进入筛选库;其中,12≤N≤16,N为整数;
步骤2:剔除从步骤1得到的筛选库中物质分子量超过400的物质,得到剩余待筛选物质;
步骤3:依次查看步骤2得到的每个剩余待筛选物质的分子离子峰的所在位置在待测物质的质谱图中对应的碎片离子峰峰度大小是否为0,若为0,则将该物质从筛选库中剔除,更新筛选库;
步骤4:依据步骤3得到更新后的筛选库,依次计算筛选库中每一物质的分子离子峰峰度与该物质距离分子离子峰±1、±2位置中最大的碎片离子峰峰度的比值,即为第一比值;以每个物质的分子离子峰横坐标为参考坐标,找出参考坐标在待测物质的质谱图中对应的峰度与距离该参考坐标±1、±2位置中的最大的碎片离子峰峰度的比值,即为第二比值;用第二比值除以第一比值得到两者比值差异,将比值差异按从小到大排列成表得到谱库筛选结果;
其中,±1表示与指定分子离子峰坐标相差一个单位的前、后两个坐标,±2表示与指定分子离子峰坐标相差两个单位的前、后两个坐标。
2.根据权利要求1所述的针对混合物质质谱图的谱库筛选方法,其特征在于,所述步骤1中N为12。
CN201310059714.5A 2013-02-26 2013-02-26 一种针对混合物质质谱图的谱库筛选方法 Active CN103115991B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310059714.5A CN103115991B (zh) 2013-02-26 2013-02-26 一种针对混合物质质谱图的谱库筛选方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310059714.5A CN103115991B (zh) 2013-02-26 2013-02-26 一种针对混合物质质谱图的谱库筛选方法

Publications (2)

Publication Number Publication Date
CN103115991A CN103115991A (zh) 2013-05-22
CN103115991B true CN103115991B (zh) 2014-11-26

Family

ID=48414418

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310059714.5A Active CN103115991B (zh) 2013-02-26 2013-02-26 一种针对混合物质质谱图的谱库筛选方法

Country Status (1)

Country Link
CN (1) CN103115991B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104504706A (zh) * 2014-12-26 2015-04-08 天津大学 一种气相色谱质谱谱图匹配方法
CN105842330B (zh) * 2015-09-09 2018-06-05 张华俊 一种质谱检测及解析方法
CN107219321B (zh) * 2017-05-23 2018-10-19 湖南中烟工业有限责任公司 一种混合质谱筛除方法
CN109425663B (zh) * 2017-08-24 2021-06-15 湖南中烟工业有限责任公司 一种基于稀疏性假设分解与解析混合质谱的方法
CN109696506B (zh) * 2017-10-23 2021-04-06 中国石油化工股份有限公司 一种用于对样品进行分子识别的方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101371143A (zh) * 2005-12-19 2009-02-18 安纳利扎有限公司 涉及数据模式例如谱生物标志的系统和方法
CN101382525A (zh) * 2008-10-16 2009-03-11 中国药科大学 一种中药复杂体系中系列成分的快速筛选及鉴定方法
CN102809600A (zh) * 2012-07-19 2012-12-05 复旦大学 用于一级相同质量二级b,y碎片离子对定量方法的数据分析方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101371143A (zh) * 2005-12-19 2009-02-18 安纳利扎有限公司 涉及数据模式例如谱生物标志的系统和方法
CN101382525A (zh) * 2008-10-16 2009-03-11 中国药科大学 一种中药复杂体系中系列成分的快速筛选及鉴定方法
CN102809600A (zh) * 2012-07-19 2012-12-05 复旦大学 用于一级相同质量二级b,y碎片离子对定量方法的数据分析方法

Also Published As

Publication number Publication date
CN103115991A (zh) 2013-05-22

Similar Documents

Publication Publication Date Title
Knolhoff et al. Non-targeted screening approaches for contaminants and adulterants in food using liquid chromatography hyphenated to high resolution mass spectrometry
CN103115991B (zh) 一种针对混合物质质谱图的谱库筛选方法
CN110596278B (zh) 一种代谢物液相色谱-质谱联用检测方法
US10734208B2 (en) Imaging mass spectrometer
US7072773B2 (en) Method of using data binning in the analysis of chromatography/spectrometry data
CN102590407B (zh) 基于气相色谱-质谱分析的共流出峰解析及谱库检索方法
GB2404194A (en) Automated chromatography/mass spectrometry analysis
CN104024845B (zh) 智能本底数据采集及减除
CN104820011A (zh) 一种蛋白质翻译后修饰定位的方法
CN102590406A (zh) 基于气相色谱-质谱分析数据的三维信息对比分析方法
US20210333251A1 (en) Methods, mediums, and systems to compare data within and between cohorts
US10147590B2 (en) Mass spectrometry data processing apparatus and mass spectrometry data processing method
CN109507348B (zh) 聚合物型药用辅料组成成分的计算机辅助分析系统及方法
Du et al. Data reduction of isotope-resolved LC-MS spectra
CN111220750A (zh) 一种中药识别平台和利用该平台的中药识别方法
CN107703243A (zh) 用于代谢组学的气相色谱‑质谱分析处理方法和系统
JP2013145245A (ja) 質量分析データ処理方法及び装置
Nikolic et al. Mass Spectra Deconvolution of Gaseous Mixtures Containing Volatile Organic Compounds
Solovyeva et al. viqc: Visual and intuitive quality control for mass spectrometry-based proteome analysis
CN111220754A (zh) 一种人参识别平台和利用该平台的人参识别方法
WO2006125864A1 (en) Analysis techniques for liquid chromatography/mass spectrometry
EP3285190A1 (en) Systems and methods for sample comparison and classification
CN111220751A (zh) 一种三七识别平台和利用该平台的三七识别方法
CN113419010B (zh) 贝母类药材的特征图谱构建方法及其应用
US20220301839A1 (en) Method for analyzing mass spectrometry data, computer program medium, and device for analyzing mass spectrometry data

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant