CN114965662A - 一种化学物质注释方法 - Google Patents

一种化学物质注释方法 Download PDF

Info

Publication number
CN114965662A
CN114965662A CN202210873847.5A CN202210873847A CN114965662A CN 114965662 A CN114965662 A CN 114965662A CN 202210873847 A CN202210873847 A CN 202210873847A CN 114965662 A CN114965662 A CN 114965662A
Authority
CN
China
Prior art keywords
ion
chemical substance
sample
mass
fragment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210873847.5A
Other languages
English (en)
Inventor
薛靖川
诸嘉民
赵亚男
蔡宴朋
方明亮
谭倩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong University of Technology
Original Assignee
Guangdong University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong University of Technology filed Critical Guangdong University of Technology
Priority to CN202210873847.5A priority Critical patent/CN114965662A/zh
Publication of CN114965662A publication Critical patent/CN114965662A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N27/00Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
    • G01N27/62Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating the ionisation of gases, e.g. aerosols; by investigating electric discharges, e.g. emission of cathode
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01JELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
    • H01J49/00Particle spectrometers or separator tubes
    • H01J49/26Mass spectrometers or separator tubes

Landscapes

  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Electrochemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

本发明提供一种化学物质注释方法。该方法包括:采集目标化学物质碎片离子的质荷比、母离子质荷比以及对应的保留时间建立目标化学物质数据库;采用EISA技术采集样品化学物质的离子质谱图,以数据库中目标化学物质的保留时间为中心搜索所述离子质谱图,识别所述样品化学物质的质谱离子信息;基于该质谱离子信息,确定所述样品中是否存在具体目标化学物质的母离子与相关碎片离子;若存在,则计算所述具体目标化学物质的母离子丰度与其每一种碎片离子丰度的相关度,并当所述相关度均大于阈值时,将该具体目标化学物质确定为高置信水平物质。本发明提供的方案适合用于低浓度的化学物质的快速注释,并且便于以计算机程序实现。

Description

一种化学物质注释方法
技术领域
本申请提供的技术方案涉及化学物质识别/鉴定领域,具体涉及一种基于质谱离子源内高能裂解技术的化学物质注释新方法。
背景技术
暴露组学旨在研究人一生接触到的环境暴露因素总和及其引起的健康效应。质谱是暴露组学研究中对化学物质进行分析的一个重要技术手段。化学物质暴露组首要难点是如何实现对人体化学物质暴露进行快速检测分析。进行暴露组识别的人体内化学物质包括外源性环境污染物及其转化产物和由肠道菌群、炎症反应等体内生化反应过程生成的内源性活性代谢物。环境污染物等化学物质在人体中存在水平较低,常常给检测与分析带来较大挑战,亟需灵敏度较高的分析检测技术对待分析样品中存在的低浓度化学物质进行分析和鉴定。
传统化学物质注释/识别方案需要通过串联质谱仪,分别获取母离子质谱(MS)数据和碎片离子的质谱数据。母离子又称作前体离子,通常在离子源内生成。碎片离子的生成通常需要将ESI与串联质谱(ESI-MS/MS)相结合,当母离子进入碰撞室内后在能量作用下与惰性气体分子发生反应产生碎片离子。但是科学家们发现,即使在ESI(电雾喷离子源)等所谓的“软电离”技术中源内裂解(ISF)现象同样存在,由源内裂解现象产生的源内碎片离子是导致化学物质鉴定结果错误的一个主要原因。
传统的基于暴露组学的化学物质注释/识别方案中数据采集模式分为:数据依赖采集模式(DDA)和数据独立采集模式(DIA)。
数据依赖采集(DDA)模式是串联质谱中数据采集的一种主要模式。在DDA模式下,质谱仪器在执行MS全扫描时会自动对从全扫描谱图中选择的母离子列表进行MS/MS分析。DDA模式优点是选择性高,但通量较低、难以实现化学物质碎片离子的批量采集。
数据独立采集(DIA)是质谱分析中一种批量采集化学物质碎片离子的模式。在该模式中,选定m/z(质荷比)范围内的所有离子都将在串联质谱的第二阶段进行碎片化和分析。该模式下通过裂解在给定时间进入质谱仪的所有离子(称为宽谱DIA)或通过顺序分离和裂解m/z范围来获得串联质谱数据。该数据采集模式尽管可以实现化学物质碎片离子的批量采集,但选择性较低。
传统基于碰撞室的碎片离子生成方式对母离子峰高有一定要求,无法有效采集低浓度化学物质的碎片离子信息。申请人在前期建立的基于质谱离子源内高能裂解现象的化学物质高灵敏分析技术(EISA),可以有效采集低浓度化学物质的碎片离子信息,因此可以有效实现低浓度化学物质的鉴定。EISA技术通过优化离子源内裂解能量,革新了碎片离子采集方式,实现了在不影响母离子峰高的情况下生成相应碎片离子。该技术可以采集低浓度化学物质的碎片离子,实现低浓度化学物质的鉴定。在采用该技术进行化学物质分析时,一方面需要手动鉴定,过于耗时耗力;另一方面常用物质鉴定软件通常仅适用于母离子峰和碎片离子峰分开采集的情况,且主要通过峰提取实现物质特征识别,由于低浓度化学物质的质谱峰不明显或丰度峰形较差,不能被传统物质鉴定软件所识别。
发明内容
针对现有的低浓度化学物质注释方法的上述不足,本发明提供一种与EISA技术获得的谱图相匹配的化学物质注释新方法,实现化学物质自动化鉴定。
本发明提供的技术方案实现为:一种化学物质注释方法,所述方法包括以下步骤:
步骤S1,采用离子源设备及设置参数,产生离子源内高能裂解现象以采集目标化学物质的源内碎片离子质谱数据建立目标化学物质离子数据库;所述源内碎片离子质谱数据包括:目标化学物质碎片离子的质荷比,母离子质荷比以及对应的保留时间(retentiontime);
步骤S2,采用所述离子源设备、所述设置参数,产生样品化学物质的离子源内高能裂解现象以采集该样品化学物质的源内碎片离子质谱图;
步骤S3,设置以所述目标化学物数据库中每个目标化学物质保留时间RT为中心的保留时间窗口K,在所述样品化学物质的质谱图的保留时间窗口K段内进行搜索,识别出所述样品化学物质对应于该保留时间窗口K的质谱离子信息;所述质谱离子信息包括:离子的荷质比,以及各离子的丰度峰(intensity);
步骤S4,对于所述数据库中的任一具体目标化学物质,基于所述质谱离子信息确定该样品化学物质的源内裂解离子中是否存在该具体目标化学物质的母离子与相关碎片离子(即源内裂解碎片离子);若存在,则计算所述具体目标化学物质的母离子及其每一种相关碎片离子在丰度上的相关度;若不存在,则排除该具体目标化学物质;
步骤S5,判断所述相关度是否均大于阈值,若是,将该具体目标化学物质确定为该样品中存在的高置信水平物质。
进一步地,所述步骤S3中,在所述样品化学物质的质谱图的所述保留时间窗口K段内进行搜索,识别出所述样品化学物质对应于该保留时间窗口K的质谱离子信息,实现为:确定具体目标化学物质的母离子在所述质谱图中对应于所述保留时间窗口K的丰度采样序列中的样本值缺失率是否超过80%,若是,则认为样品中不存在所述具体目标化学物质;否则,识别出样品化学物质的质谱离子信息,把在该保留时间窗口K内各离子的丰度峰作为所述特征离子丰度。
优选地,所述保留时间窗口K设为:
Figure 488053DEST_PATH_IMAGE001
;所述阈值设为0.8。
优选地,所述相关度设置为皮尔逊相关系数,其计算公式为:
Figure 763177DEST_PATH_IMAGE002
其中、
Figure DEST_PATH_IMAGE003
为母离子和具体某一碎片离子的相关度,
Figure 468965DEST_PATH_IMAGE004
为母离子丰度的第i个样本,
Figure DEST_PATH_IMAGE005
为所述某一碎片离子丰度的第i个样本,
Figure 115716DEST_PATH_IMAGE006
为母离子丰度样本序列的标准差,
Figure DEST_PATH_IMAGE007
为所述具体某一碎片离子丰度样本序列的标准差,n为母离子或所述碎片离子样本序列的长度,
Figure 906954DEST_PATH_IMAGE008
为母离子丰度样本的平均值,
Figure DEST_PATH_IMAGE009
为所述某一碎片离子丰度的平均值。
本发明提供的化学物质注释方法,基于源内裂解现象实现化学物质的质谱母离子和碎片离子质谱数据的同时采集,基于源内高能裂解技术,样品化学物质在低浓度下能够获得比传统采集模式更高的母离子丰度和碎片离子丰度,再根据母离子与碎片离子丰度的相关性来识别化学物质,能够有效识别低浓度的化学物质。该方法能够非常方便地采用计算机程序来实现,尤其适用于大量化学物质的识别。
附图说明
图1为本发明提供的化学物质注释方法的流程图。
具体实施方式
为了使本发明所解决的技术问题、技术方案以及有益效果更加清楚明白,以下结合附图对本发明进行进一步详细说明。应该理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
如图1所示的一个实施例中、本发明提供的化学物质注释方法,包括以下步骤:
步骤S1,采用离子源设备及设置参数,产生离子源内高能裂解现象以采集目标化学物质的源内碎片离子质谱数据建立目标化学物质离子数据库;所述源内碎片离子质谱数据包括:目标化学物质碎片离子的质荷比,母离子质荷比以及对应的保留时间(retentiontime);
步骤S2,采用所述离子源设备、所述设置参数,产生样品化学物质的离子源内高能裂解现象以采集该样品化学物质的源内碎片离子质谱图;
步骤S3,设置以所述目标化学物数据库中每个目标化学物质保留时间RT为中心的保留时间窗口K,在所述样品化学物质的质谱图的保留时间窗口K段内进行搜索,识别出所述样品化学物质对应于该保留时间窗口K的质谱离子信息;所述质谱离子信息包括:离子的荷质比,以及各离子的丰度(intensity);
步骤S4,对于所述数据库中的任一具体目标化学物质,基于所述质谱离子信息确定该样品化学物质的源内裂解离子中是否存在该具体目标化学物质的母离子与相关碎片离子(即源内裂解碎片离子);若存在,则计算所述具体目标化学物质的母离子及其每一种相关碎片离子在丰度上的相关度;若不存在,则排除该具体目标化学物质;
步骤S5,判断所述相关度是否均大于阈值,若是,将该具体目标化学物质确定为该样品中存在的高置信水平物质。以确定为该样品化学物质的高置信水平物质的目标化学物质对其进行注释/标注。其中,所述高置信水平物质的目标化学物质按照上述相关度,从高到低进行排序。
进一步地,所述步骤S3中,在所述样品化学物质的质谱图的所述保留时间窗口K段内进行搜索,识别出所述样品化学物质的质谱离子信息,实现为:确定具体目标化学物质的母离子在所述质谱图中对应于所述保留时间窗口K的丰度采样序列中的样本值缺失率是否超过80%,若是,则认为样品中不存在所述具体目标化学物质;否则,识别出样品化学物质的质谱离子信息,把在该保留时间窗口K内各离子(包括所有母离子和碎片离子)的丰度峰作为所述特征离子丰度。
所述时间窗口K设置成以具体目标化学物质的保留时间RT为中心的一定时间范围能够避免对整个样品化学物质的质谱数据进行搜索,减少了数据搜索量进一步提供了化学物质注释的速度。其中,所述时间范围可以设置成RT±5s,RT±10s,RT±15s,RT±20s,RT±25s,RT±30s。在该实施例中,将所述时间窗口K设置成:RT-15s≤K≤RT+15s。
在上述搜索过程中,对于所述数据库中具体目标化学物质的母离子信息在样品化学物质的质谱图中样本序列中缺失样本值达到一定比例,则认为样品中不存在此化合物,以提高搜索的速度。对于没有忽略掉的具体目标化学物质,则认为样品化学物质质谱图中存在对应数据库中具体目标化学物质的母离子信息。初步筛选完成后才确定对应数据库中具体目标化学物质的所述相关碎片离子是否存在于样品化学物质的质谱图中,以此大大降低了对大量化学物质注释时的数据处理量。
在该实施例中,所述相关度设置为皮尔逊相关系数,其计算公式为:
Figure 985769DEST_PATH_IMAGE010
其中、
Figure DEST_PATH_IMAGE011
为母离子和具体某一碎片离子的相关度,
Figure 296795DEST_PATH_IMAGE012
为母离子丰度波形的第i个样本,
Figure 68442DEST_PATH_IMAGE013
为所述某一碎片离子丰度波形的第i个样本,
Figure 81398DEST_PATH_IMAGE014
为母离子丰度样本序列的标准差,
Figure 963903DEST_PATH_IMAGE015
为所述具体某一碎片离子丰度样本序列的标准差,n为母离子或所述碎片离子样本序列的长度,
Figure 316387DEST_PATH_IMAGE016
为母离子丰度样本的平均值,
Figure 573449DEST_PATH_IMAGE018
为所述某一碎片离子丰度的平均值,n其取决于保留时间窗口K的大小以及离子丰度波形采样率。显然,若母离子和某一碎片离子的相关度越高,说明相应的碎片离子来源于该母离子裂解的可能性越大,对应样品化学物质属于该具体目标化学物质的概率则越大。
与上述方法相对应,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储程序代码,计算机执行所述程序代码实现上述化学物质的注释方法。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。

Claims (5)

1.一种化学物质注释方法,其特征在于,所述方法包括:
采用离子源设备及设置参数,产生离子源内高能裂解现象以采集目标化学物质的源内碎片离子质谱数据建立目标化学物质离子数据库;所述源内碎片离子质谱数据包括:目标化学物质碎片离子的质荷比,母离子质荷比以及对应的保留时间RT;
采用所述离子源设备、所述设置参数,产生样品化学物质的离子源内高能裂解现象以采集该样品化学物质的源内碎片离子质谱图;设置以所述目标化学物数据库中每个目标化学物质保留时间RT为中心的保留时间窗口K,在所述样品化学物质的质谱图的保留时间窗口K段内进行搜索,识别出所述样品化学物质对应于该保留时间窗口K的质谱离子信息;所述质谱离子信息包括:离子的荷质比,以及各离子的丰度;
对于所述数据库中的任一具体目标化学物质,基于所述质谱离子信息确定该样品化学物质的源内裂解离子中是否存在该具体目标化学物质的母离子与相关碎片离子;若存在,则计算所述具体目标化学物质的母离子及其每一种相关碎片离子在丰度上的相关度;若不存在,则排除该具体目标化学物质;在所述相关度均大于阈值时,将该具体目标化学物质确定为该样品中存在的高置信水平物质。
2.如权利要求1所述的方法,其特征在于,在所述样品化学物质的质谱图的保留时间窗口K段内进行搜索,识别出所述样品化学物质对应于该保留时间窗口K的质谱离子信息,实现为:确定具体目标化学物质的母离子在所述质谱图中对应于所述保留时间窗口K的丰度采样序列中的样本值缺失率是否超过80%,若是,则认为样品中不存在所述具体目标化学物质;若否,识别出样品化学物质的质谱离子信息。
3.如权利要求2所述的方法,其特征在于,所述保留时间窗口K设为:
Figure 197236DEST_PATH_IMAGE001
4.如权利要求1-3中任一项所述的方法,其特征在于,所述相关度为皮尔逊相关系数,所述相关度
Figure 617853DEST_PATH_IMAGE002
的计算公式为:
Figure 903472DEST_PATH_IMAGE003
其中,
Figure 16921DEST_PATH_IMAGE004
为母离子和具体某一碎片离子的相关度,
Figure 942152DEST_PATH_IMAGE005
为母离子丰度的第i个样本,
Figure 228777DEST_PATH_IMAGE006
为所述某一碎片离子丰度的第i个样本,
Figure 290274DEST_PATH_IMAGE007
为母离子丰度样本序列的标准差,
Figure 886209DEST_PATH_IMAGE008
为所述具体某一碎片离子丰度样本序列的标准差,n为母离子或所述碎片离子样本序列的长度,
Figure 298736DEST_PATH_IMAGE009
为母离子丰度样本的平均值,
Figure 326735DEST_PATH_IMAGE010
为所述某一碎片离子丰度的平均值。
5.如权利要求4所述的方法,其特征在于,所述阈值设为0.8。
CN202210873847.5A 2022-07-25 2022-07-25 一种化学物质注释方法 Pending CN114965662A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210873847.5A CN114965662A (zh) 2022-07-25 2022-07-25 一种化学物质注释方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210873847.5A CN114965662A (zh) 2022-07-25 2022-07-25 一种化学物质注释方法

Publications (1)

Publication Number Publication Date
CN114965662A true CN114965662A (zh) 2022-08-30

Family

ID=82968823

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210873847.5A Pending CN114965662A (zh) 2022-07-25 2022-07-25 一种化学物质注释方法

Country Status (1)

Country Link
CN (1) CN114965662A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115453009A (zh) * 2022-10-14 2022-12-09 广东工业大学 一种不依赖保留时间的化学物质注释方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090215103A1 (en) * 2005-06-03 2009-08-27 Waters Investments Limited Generation and use of a catalog of polypeptide-related information for chemical analyses
CN104215716A (zh) * 2014-09-19 2014-12-17 沈阳金域医学检验所有限公司 一种检测人血清中总睾酮的方法
CN112684069A (zh) * 2020-12-23 2021-04-20 河北省地质实验测试中心 一种测定水中甲基萘化合物的方法
WO2021122834A1 (en) * 2019-12-19 2021-06-24 Basf Plant Science Company Gmbh Method of protein detection

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090215103A1 (en) * 2005-06-03 2009-08-27 Waters Investments Limited Generation and use of a catalog of polypeptide-related information for chemical analyses
CN104215716A (zh) * 2014-09-19 2014-12-17 沈阳金域医学检验所有限公司 一种检测人血清中总睾酮的方法
WO2021122834A1 (en) * 2019-12-19 2021-06-24 Basf Plant Science Company Gmbh Method of protein detection
CN112684069A (zh) * 2020-12-23 2021-04-20 河北省地质实验测试中心 一种测定水中甲基萘化合物的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JINGCHUAN XUE ET AL.: "Proteomics with Enhanced In-Source Fragmentation/Annotation:Applying XCMS-EISA Informatics and Q MRM High-Sensitivity Quantification", 《J. AM. SOC. MASS SPECTROM. 》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115453009A (zh) * 2022-10-14 2022-12-09 广东工业大学 一种不依赖保留时间的化学物质注释方法
CN115453009B (zh) * 2022-10-14 2023-08-22 广东工业大学 一种不依赖保留时间的化学物质注释方法

Similar Documents

Publication Publication Date Title
CN109828068B (zh) 质谱数据采集及分析方法
US7880135B2 (en) Mass spectrometer
Zhang et al. ProbIDtree: an automated software program capable of identifying multiple peptides from a single collision‐induced dissociation spectrum collected by a tandem mass spectrometer
CN108931570B (zh) 质谱分析数据解析装置以及质谱分析数据解析用程序
US20140138535A1 (en) Interpreting Multiplexed Tandem Mass Spectra Using Local Spectral Libraries
US20160343558A1 (en) Tandem mass spectrometry data processing system
JP5810983B2 (ja) 質量分析を用いた化合物同定方法及び化合物同定システム
JP4857000B2 (ja) 質量分析システム
CN114965662A (zh) 一种化学物质注释方法
US9947519B2 (en) Computational method and system for deducing sugar chains using tandem MSn spectrometry data
US9530633B2 (en) Method for isomer discrimination by tandem mass spectrometry
Cooper et al. An assessment of AcquireX and Compound Discoverer software 3.3 for non-targeted metabolomics
JP5636614B2 (ja) Lc−maldiで得られたデータの比較解析方法
TWI547686B (zh) 醣胜肽之胺基酸定序及醣基鑑定雙功能方法及系統
CN115453009B (zh) 一种不依赖保留时间的化学物质注释方法
US20230178348A1 (en) Chromatograph mass spectrometry data processing method, chromatograph mass spectrometer, and chromatograph mass spectrometry data processing program
CN111900073B (zh) 离子源和质谱联用控制方法
EP3002696B1 (en) Methods for generating, searching and statistically validating a peptide fragment ion library
US11527394B2 (en) Methods and apparatus for determining interference in MS scan data, filtering ions and performing mass spectrometry analysis on a sample
JP4921302B2 (ja) 質量分析システム
CN117110466A (zh) 一种高灵敏、高通量的化学物质注释方法与系统
JP5150370B2 (ja) 質量分析システムおよび質量分析方法
EP4368984A1 (en) Microorganism mass spectrometry method
JP2008170346A (ja) 質量分析システム
Ng Understanding the chemical basis for the preferential ionization of specific biomolecules in mass spectrometry analysis of microbial cells

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20220830

RJ01 Rejection of invention patent application after publication