CN117789848B - 一种应用特征碎片及特征碎片组辅助非靶向筛查的方法 - Google Patents
一种应用特征碎片及特征碎片组辅助非靶向筛查的方法 Download PDFInfo
- Publication number
- CN117789848B CN117789848B CN202410210612.7A CN202410210612A CN117789848B CN 117789848 B CN117789848 B CN 117789848B CN 202410210612 A CN202410210612 A CN 202410210612A CN 117789848 B CN117789848 B CN 117789848B
- Authority
- CN
- China
- Prior art keywords
- fragments
- characteristic
- fragment
- mass
- compound
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000012634 fragment Substances 0.000 title claims abstract description 209
- 238000000034 method Methods 0.000 title claims abstract description 42
- 238000012216 screening Methods 0.000 title claims abstract description 40
- 150000001875 compounds Chemical class 0.000 claims abstract description 93
- 239000000126 substance Substances 0.000 claims abstract description 43
- 238000001819 mass spectrum Methods 0.000 claims abstract description 35
- 238000001228 spectrum Methods 0.000 claims abstract description 20
- 238000004817 gas chromatography Methods 0.000 claims abstract description 5
- 230000003595 spectral effect Effects 0.000 claims description 31
- 238000004949 mass spectrometry Methods 0.000 claims description 9
- 238000000605 extraction Methods 0.000 claims description 6
- 239000002957 persistent organic pollutant Substances 0.000 abstract description 5
- IJGRMHOSHXDMSA-UHFFFAOYSA-N nitrogen Substances N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 7
- 229910052757 nitrogen Inorganic materials 0.000 description 7
- -1 aromatic nitrogen heterocyclic compounds Chemical class 0.000 description 5
- 238000013467 fragmentation Methods 0.000 description 5
- 238000006062 fragmentation reaction Methods 0.000 description 5
- 238000004896 high resolution mass spectrometry Methods 0.000 description 5
- 239000000203 mixture Substances 0.000 description 5
- 239000000356 contaminant Substances 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 239000013076 target substance Substances 0.000 description 4
- 239000003344 environmental pollutant Substances 0.000 description 3
- 239000010842 industrial wastewater Substances 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 231100000719 pollutant Toxicity 0.000 description 3
- SIKJAQJRHWYJAI-UHFFFAOYSA-N Indole Chemical compound C1=CC=C2NC=CC2=C1 SIKJAQJRHWYJAI-UHFFFAOYSA-N 0.000 description 2
- KYQCOXFCLRTKLS-UHFFFAOYSA-N Pyrazine Chemical compound C1=CN=CC=N1 KYQCOXFCLRTKLS-UHFFFAOYSA-N 0.000 description 2
- JUJWROOIHBZHMG-UHFFFAOYSA-N Pyridine Chemical compound C1=CC=NC=C1 JUJWROOIHBZHMG-UHFFFAOYSA-N 0.000 description 2
- KAESVJOAVNADME-UHFFFAOYSA-N Pyrrole Chemical compound C=1C=CNC=1 KAESVJOAVNADME-UHFFFAOYSA-N 0.000 description 2
- SMWDFEZZVXVKRB-UHFFFAOYSA-N Quinoline Chemical compound N1=CC=CC2=CC=CC=C21 SMWDFEZZVXVKRB-UHFFFAOYSA-N 0.000 description 2
- 230000019771 cognition Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 239000007789 gas Substances 0.000 description 2
- 150000002475 indoles Chemical class 0.000 description 2
- AWJUIBRHMBBTKR-UHFFFAOYSA-N isoquinoline Chemical compound C1=NC=CC2=CC=CC=C21 AWJUIBRHMBBTKR-UHFFFAOYSA-N 0.000 description 2
- 150000002537 isoquinolines Chemical class 0.000 description 2
- 238000000622 liquid--liquid extraction Methods 0.000 description 2
- 150000003216 pyrazines Chemical class 0.000 description 2
- 150000004892 pyridazines Chemical class 0.000 description 2
- 150000003222 pyridines Chemical class 0.000 description 2
- 150000003230 pyrimidines Chemical class 0.000 description 2
- 150000003233 pyrroles Chemical class 0.000 description 2
- 150000003248 quinolines Chemical class 0.000 description 2
- 238000000638 solvent extraction Methods 0.000 description 2
- 235000013599 spices Nutrition 0.000 description 2
- MWOOGOJBHIARFG-UHFFFAOYSA-N vanillin Chemical compound COC1=CC(C=O)=CC=C1O MWOOGOJBHIARFG-UHFFFAOYSA-N 0.000 description 2
- FGQOOHJZONJGDT-UHFFFAOYSA-N vanillin Natural products COC1=CC(O)=CC(C=O)=C1 FGQOOHJZONJGDT-UHFFFAOYSA-N 0.000 description 2
- 235000012141 vanillin Nutrition 0.000 description 2
- PCNDJXKNXGMECE-UHFFFAOYSA-N Phenazine Natural products C1=CC=CC2=NC3=CC=CC=C3N=C21 PCNDJXKNXGMECE-UHFFFAOYSA-N 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 238000000944 Soxhlet extraction Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 150000004030 azacyclic compounds Chemical class 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000013075 data extraction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000000796 flavoring agent Substances 0.000 description 1
- 235000019634 flavors Nutrition 0.000 description 1
- 239000003205 fragrance Substances 0.000 description 1
- 238000002290 gas chromatography-mass spectrometry Methods 0.000 description 1
- 238000013537 high throughput screening Methods 0.000 description 1
- PZOUSPYUWWUPPK-UHFFFAOYSA-N indole Natural products CC1=CC=CC2=C1C=CN2 PZOUSPYUWWUPPK-UHFFFAOYSA-N 0.000 description 1
- RKJUIXBNRJVNHR-UHFFFAOYSA-N indolenine Natural products C1=CC=C2CC=NC2=C1 RKJUIXBNRJVNHR-UHFFFAOYSA-N 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 238000002414 normal-phase solid-phase extraction Methods 0.000 description 1
- 239000005416 organic matter Substances 0.000 description 1
- 238000002203 pretreatment Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- PBMFSQRYOILNGV-UHFFFAOYSA-N pyridazine Chemical compound C1=CC=NN=C1 PBMFSQRYOILNGV-UHFFFAOYSA-N 0.000 description 1
- UMJSCPRVCHMLSP-UHFFFAOYSA-N pyridine Natural products COC1=CC=CN=C1 UMJSCPRVCHMLSP-UHFFFAOYSA-N 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000002137 ultrasound extraction Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Landscapes
- Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
Abstract
本发明公开一种应用特征碎片及特征碎片组辅助非靶向筛查的方法,涉及有机污染物筛查技术领域,该方法包括:获取样品包含的化合物的初步鉴定结果;初步鉴定结果是应用气相色谱高分辨质谱对样品进行扫描,将解卷积之后的峰与NIST谱库匹配以后得到的;从初步鉴定结果中选择满足预设匹配条件且含有特征碎片或特征碎片组的化合物,得到多个初始化合物;特征碎片和特征碎片组是联合使用化学信息数据库和NIST谱库从目标大类化合物提取的;从多个初始化合物中选取综合得分最高的初始化合物作为样品的筛查结果。本发明能够提高非靶向筛查结果的准确度。
Description
技术领域
本发明涉及有机污染物筛查技术领域,特别是涉及一种应用特征碎片及特征碎片组辅助非靶向筛查的方法。
背景技术
有机污染物种类复杂,传统的靶向分析,其目标物质十分有限,难以探究到在之前研究中未出现过的新污染物,易忽略复杂介质中的主要风险污染物,需要非靶向手段全面筛查。因此,基于高分辨质谱的新污染物筛查是研究的热点和前沿。其中,气相色谱-高分辨质谱广泛被用于挥发和半挥发性有机污染物的高通量筛查。但针对某一大类或具有特定结构的有机污染物,如何进行非靶向筛查仍是巨大挑战。目前气相色谱-高分辨质谱非靶筛查多采用与NIST谱库比对的方法,来鉴定所分析的非靶物质结构。然而,这种方法有一定的局限性,对某一个物质的质谱峰,NIST谱库比对通常会获得多种可能的物质,且综合得分高的物质并不一定就是正确的结果。因此,除了与NIST谱库比对外,亟需开发其他方法辅助进行非靶物质的结构鉴定,进而提高非靶筛查结果的准确度。
特征碎片是非靶向筛查过程中的常用方法,但目前公开的专利方法在特征碎片提取的过程中仍有局限性。如,已有专利(CN 116718715 A和CN 116297923 A)根据质谱碎裂规律进行特征碎片的提取,然后筛查特定类的物质。这些方法虽然对特定类物质有一定筛查效果,但该方法需要对物质碎裂规律有足够的认知,实际应用时受个人经验或知识的限制,很难推广应用。普适性的特征碎片方法仍是统计目标污染物大类谱图中出现丰度和频率都较高的碎片。所以在筛选特征碎片时,有尽可能多的谱图作为数据源是至关重要的。
目前,大部分特征碎片筛查方法,以实测谱图为基础(CN 115753953 A),而标样有限,成本高昂,获取的谱图数量有限且测样提取过程耗时耗力。已有专利(CN 113009054 B)提出对于NIST谱库的数据进行收集,提取特征碎片。相较于以实测谱图为基础,该方法一定程度上扩大了特征碎片筛选时的物质范围。但该方法确定香兰素类香精香料物质时,在GB2760-2014中允许添加的香精香料名单中,找到与香兰素结构相似的化合物27种,再通过NIST谱库和标准品检测,得到各种化合物的碎片离子和丰度。这种根据已有资料确定某类香精香料具体包含化合物的清单方法,会受到目前认知和研究的局限性,很容易造成遗漏。此外,目前利用特征碎片的筛查方法,仅用单个特征碎片进行,有可能造成筛查结果的假阳性。
发明内容
本发明的目的是提供一种应用特征碎片及特征碎片组辅助非靶向筛查的方法,能够提高非靶向筛查结果的准确度。
为实现上述目的,本发明提供了如下方案:一种应用特征碎片及特征碎片组辅助非靶向筛查的方法,所述方法包括:获取样品包含的化合物的初步鉴定结果;所述初步鉴定结果是应用气相色谱高分辨质谱对样品进行扫描,将解卷积之后的峰与NIST谱库匹配以后得到的。
从所述初步鉴定结果中选择满足预设匹配条件且含有特征碎片或特征碎片组的化合物,得到多个初始化合物;所述特征碎片和所述特征碎片组是联合使用化学信息数据库和NIST谱库从目标大类化合物提取的。
从所述多个初始化合物中选取综合得分最高的初始化合物作为所述样品的筛查结果。
可选地,所述特征碎片和所述特征碎片组的提取过程,具体包括:在化学信息数据库检索目标化合物分子的CAS号;所述目标化合物分子以目标大类有机物包含的共同结构为子结构。
根据所述CAS号在NIST质谱数据库中进行批量搜索,得到多个化合物的质谱数据。
从各化合物的所述质谱数据中提取质谱碎片,得到多个碎片;所述质谱碎片为各化合物的所述质谱数据中满足预设要求的碎片。
根据各所述质谱碎片的出现频率,从多个所述质谱碎片中选择特征碎片;其中,所述特征碎片的出现频率大于除所述特征碎片外的其他所述质谱碎片的出现频率。
根据各所述质谱碎片的出现规律,从多个所述质谱碎片中选择特征碎片组;其中,所述特征碎片组包括至少两个所述质谱碎片且所述特征碎片组中各所述质谱碎片必须同时出现在多个所述化合物中。
可选地,从多个所述质谱碎片中选择特征碎片,具体包括:从出现频率按照由大到小排列的多个所述质谱碎片中,选择第一预设数量的所述质谱碎片,得到多个特征碎片。
可选地,根据各所述质谱碎片的出现规律,从多个所述质谱碎片中选择特征碎片组,具体包括:统计同时出现在各所述化合物中的各所述质谱碎片,得到多个初始特征碎片组。
从出现频率按照由大到小排列的多个所述初始特征碎片组中,选择第二预设数量的所述初始特征碎片组,得到多个特征碎片组。
可选地,在化学信息数据库检索目标化合物分子的CAS号,具体包括:在化学信息数据库检索目标化合物分子。
根据所述目标化合物分子的化合物分子信息,提取所述目标化合物分子的CAS号。
可选地,在化学信息数据库检索目标化合物分子,具体包括:在化学信息数据库检索目标大类有机物包含的共同结构。
收集以所述共同结构为子结构的目标化合物分子。
可选地,各所述化合物的质谱数据的格式均为MSP格式。
根据本发明提供的具体实施例,本发明公开了以下技术效果:本发明通过获取样品包含的化合物的初步鉴定结果,并选择满足预设匹配条件且含有特征碎片或特征碎片组的化合物得到多个初始化合物;特征碎片和特征碎片组是联合使用化学信息数据库和NIST谱库从目标大类化合物提取的;最后从多个初始化合物中选取综合得分最高的初始化合物作为样品的筛查结果。本发明通过联合使用化学信息数据库和NIST谱库从目标大类化合物提取特征碎片,能够克服NIST谱库比对方法获得的多种可能的物质中综合得分高的物质并不一定就是正确的结果的缺陷,并且除了与NIST谱库比对外,还提出了特征碎片和特征碎片组的概念,进一步地,将化学信息数据库和NIST谱库联合使用,从目标大类化合物提取特征碎片和特征碎片组,应用特征碎片和特征碎片组辅助进行非靶物质的结构鉴定,进而提高了非靶筛查结果的准确度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例1提供的应用特征碎片及特征碎片组辅助非靶向筛查的方法流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种应用特征碎片及特征碎片组辅助非靶向筛查的方法,能够提高非靶向筛查结果的准确度。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
实施例1:本实施例中的应用特征碎片及特征碎片组辅助非靶向筛查的方法包括步骤1-步骤3。
步骤1:获取样品包含的化合物的初步鉴定结果;所述初步鉴定结果是应用气相色谱高分辨质谱对样品进行扫描,将解卷积之后的峰与NIST谱库匹配以后得到的。
步骤2:从所述初步鉴定结果中选择满足预设匹配条件且含有特征碎片或特征碎片组的化合物,得到多个初始化合物;所述特征碎片和所述特征碎片组是联合使用化学信息数据库和NIST谱库从目标大类化合物提取的。
步骤3:从所述多个初始化合物中选取综合得分最高的初始化合物作为所述样品的筛查结果。
其中,所述特征碎片和所述特征碎片组的提取过程,具体包括步骤2.1-步骤2.5。
步骤2.1:在化学信息数据库检索目标化合物分子的CAS号;所述目标化合物分子以目标大类有机物包含的共同结构为子结构。
步骤2.1具体包括步骤2.1.1-步骤2.1.2。
步骤2.1.1:在化学信息数据库检索目标化合物分子。
步骤2.1.1具体包括步骤2.1.1.1-步骤2.2.1.2。
步骤2.1.1.1:在化学信息数据库检索目标大类有机物包含的共同结构。
步骤2.1.1.2:收集以所述共同结构为子结构的目标化合物分子。
步骤2.1.2:根据所述目标化合物分子的化合物分子信息,提取所述目标化合物分子的CAS号。
步骤2.2:根据所述CAS号在NIST质谱数据库中进行批量搜索,得到多个化合物的质谱数据。
具体地,各所述化合物的质谱数据的格式均为MSP格式。
步骤2.3:从各化合物的所述质谱数据中提取质谱碎片,得到多个碎片;所述质谱碎片为各化合物的所述质谱数据中满足预设要求的碎片。
步骤2.4:根据各所述质谱碎片的出现频率,从多个所述质谱碎片中选择特征碎片;其中,所述特征碎片的出现频率大于除所述特征碎片外的其他所述质谱碎片的出现频率。
具体地,从出现频率按照由大到小排列的多个所述质谱碎片中,选择第一预设数量的所述质谱碎片,得到多个特征碎片。
在实际应用中,可以根据实际情况选择第一预设数量的具体数值。
步骤2.5:根据各所述质谱碎片的出现规律,从多个所述质谱碎片中选择特征碎片组;其中,所述特征碎片组包括至少两个所述质谱碎片且所述特征碎片组中各所述质谱碎片必须同时出现在至少一个所述化合物中。
具体地,从多个所述质谱碎片中选择特征碎片组包括:统计同时出现在各所述化合物中的各所述质谱碎片,得到多个初始特征碎片组。从出现频率按照由大到小排列的多个所述初始特征碎片组中,选择第二预设数量的所述初始特征碎片组,得到多个特征碎片组。在实际应用中,可以根据实际情况选择第二预设数量的具体数值。
在实际应用中,筛选单个碎片,相当于是按出现频率筛选。筛选特征碎片组,是考虑到两个(及以上)碎片会同时出现在一个化合物中,高于一定的频率就选为特征碎片组。
特征碎片组不是筛选完单个特征碎片再进行组合。而是重新提取,要求在单个化合物的谱图中,两个(或者两个以上)的碎片必须同时出现。例如,C5H3N和C3HN组成的特征碎片组,是在46种目标大类化合物的谱图中,都同时出现。所以特征碎片组不止包含出现频率,还包括出现规律(一些碎片总是共同出现)。提出特征碎片组的目的在于,单个特征碎片可能造成筛查的假阳性(并不是本发明研究的目标化合物,但还是含有了某一特征碎片),特征碎片组可以减少假阳性。
作为一个具体地实施方式,如图1所示,应用特征碎片及特征碎片组辅助非靶向筛查的方法的具体应用过程包括步骤S1-步骤S6。
S1:化学信息数据库检索。在公共化学信息数据库检索某大类有机物包含的共同母体结构,收集包含此子结构的分子。优选的,使用Pubchem化学信息数据库进行检索。
具体地,本实施例研究目标为芳香氮杂环类化合物。在Pubchem数据库检索芳香氮杂环结构,分别检索包括吡咯、吡啶、吡嗪、哒嗪、嘧啶、吲哚、喹啉和异喹啉作为公共结构的化学分子,收集包含各子结构的分子。
S2:分子信息获取。将在化学信息数据库收集到的化合物分子信息下载,并使用python编程提取其CAS号。
具体地,将在化学信息数据库收集到的化合物分子信息下载,并使用python进行编程提取其CAS号。处理后的数据如下:吡咯类化合物33种、吡啶类化合物576种、吡嗪类化合物16种、哒嗪类化合物17种、嘧啶类化合物175种、吲哚类化合物2283种、喹啉类化合物1285种和异喹啉类化合物1285种,总计检索到芳香氮杂环类化合物4887种。
S3:NIST质谱数据库检索。使用CAS号在NIST质谱数据库批量搜索,下载MSP格式的质谱数据中的Num Peaks一栏中包含的碎片质量及丰度信息将用于后续统计。
具体地,使用CAS号在NIST质谱数据库批量搜索,下载MSP格式的质谱数据用于后续统计碎片信息。检索到有匹配到NIST质谱数据的记录数如下:吡咯类化合物2种、吡啶类化合物46种、吡嗪类化合物2种、哒嗪类化合物2种、嘧啶类化合物23种、吲哚类化合物40种、喹啉类化合物116种和异喹啉类化合物31种,总计收集到262种芳香氮杂环类化合物的NIST质谱数据。
S4:碎片信息获取。使用python进行编程,提取MSP中每个物质包含的丰度较高的碎片质核比对于丰度的要求可以按照应用的实际情况与需求设置不同阈值。优选的,选择每个化合物质谱数据中丰度前10的碎片信息。
其中,丰度是Num Peaks这一栏中含有的信息,其格式为:质量数 丰度;质量数 丰度;质量数 丰度……
具体地,使用python进行编程,提取MSP中262种化合物对应质谱数据中,丰度前10的碎片质量信息。
S5:筛选特征碎片及特征碎片组。
统计各个碎片的出现频率,选择出现频率较高的碎片作为特征碎片,根据其质核比推测分子式。优选的,统计总出现频率前10的碎片作为特征碎片。
进一步地,根据质核比推测分子式具体包括:结合目标有机物的元素组成可以推测特征碎片的元素组成,比如实施例中,包含元素及其精确质量为C=12.0000、H=1.0078、N=14.0064,比如筛选出的出现频率最高的碎片:51=C(12)×3+N(14)×1+H(1)×1。确定了是C3NH后,精确质量就是=12.0000×3+14.0064+1.007。如果有多个元素组成,可结合研究经验、碎裂规律推断、查看标样碎片、在实际质谱图验证等等方法确定其特征碎片的分子组成。
统计出现频率较高的特定碎片组合(2个及以上)作为特征碎片组,根据特征碎片组中每个碎片质荷比,计算其精确质量。优选的,统计至少在20个化合物质谱数据中同时出现的特征碎片组合,才能作为特征碎片组。
具体地,选择总出现频率前10的碎片作为特征碎片,统计至少在20个化合物质谱数据中出现的特征碎片组。根据特征碎片的质核比推测其分子式。通过262种芳香氮杂环类化合物的NIST谱图,提取出的氮杂环类化合物的特征碎片见表1,特征碎片组见表2。
表1 芳香氮杂环类化合物的特征碎片记录表。
。
表2 芳香氮杂环类化合物的特征碎片组记录表。
。
S6:应用于非靶向筛查。
应用于非靶向筛查的步骤包括:样品前处理、气相色谱质谱数据采集与数据预处理、谱库比对、判断是否有候选化合物符合匹配条件并含有特征碎片组或特征碎片、在含有特征碎片组和特征碎片的候选化合物中选取综合得分最高的物质为最终结果。其中,在谱图处理的软件中可以直接搜索某一种或者多种特定精确质量的碎片,筛选出只含有特征碎片的物质。也可以直接检查每个物质的谱图结果。具体地,通谱图处理软件获取综合得分,比如GC Deconvolutinon、TraceFinder和Compound Discoverer。
在实际应用中,针对不同的样品性质与实验需求,选择适宜的前处理方式,包括但不限于:液液萃取、固相萃取、索氏提取和超声提取等等。本实施例样品类型为工业废水使用液液萃取方法进行样品前处理。使用气相色谱高分辨质谱对样品进行数据采集,设置仪器参数,数据采集后使用软件进行解卷积处理和候选化合物匹配。在本实施例中,使用GC-Orbitrap进行数据采集,解卷积后共得到946个峰。
与NIST谱库以及供应商提供的GC-Orbitrap自建污染物谱库匹配后,在每个峰匹配的候选列表中,保留候选芳香氮杂环化合物符合RSI>600,RHRMF>75%和ΔRI<50的匹配条件,并含有至少一个表1中特征碎片的匹配结果。共得到10个符合条件的峰。
对于筛出的目标峰与候选匹配结果,选取综合得分最高的候选目标大类化合物作为匹配结果。本实施例中某工业废水样品中含有的氮杂环物质信息及其综合得分结果见表3。
表3 某工业废水样品中氮杂环物质信息及其综合得分结果统计表。
。
与现有技术相比,本发明的有益效果如下所示:1.本发明涉及的方法适用范围广泛。应用本发明的方法时仅需要确定所研有机物类型的共同结构,不要求已知目标种类有机物的碎裂规律、包含物质清单或者检测标样。
2.本发明谱图检索全面,得到的特征碎片可信度高。对于具有某种公共母体结构的有机污染物,通过化学数据库和NIST谱库联合使用,全面检索特定种类有机污染物的结构与谱图信息,以此为基础,得到的特征碎片及特征碎片组全面、可信。
3.本发明提出了特征碎片组的概念及提取方法。即除了提取单个出现频率较高的特征碎片,也考虑提取多次在不同化合物谱图中出现的特征碎片组。应用特征碎片和特征碎片组辅助进行非靶物质的结构鉴定,能够克服单一特征碎片可能造成的筛查的假阳性,提高了筛查结果的准确性和可信性。
4.本发明涉及的特征碎片筛查过程中,数据提取部分不需要手动进行提取,均可使用代码自动化完成,应用简单,省时省力。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
Claims (4)
1.一种应用特征碎片及特征碎片组辅助非靶向筛查的方法,其特征在于,所述方法包括:
获取样品包含的化合物的初步鉴定结果;所述初步鉴定结果是应用气相色谱高分辨质谱对样品进行扫描,将解卷积之后的峰与NIST谱库匹配以后得到的;
从所述初步鉴定结果中选择满足预设匹配条件且含有特征碎片或特征碎片组的化合物,得到多个初始化合物;所述特征碎片和所述特征碎片组是联合使用化学信息数据库和NIST谱库从目标大类化合物提取的;所述特征碎片和所述特征碎片组的提取过程,具体包括:在化学信息数据库检索目标化合物分子的CAS号;所述目标化合物分子以目标大类有机物包含的共同结构为子结构;根据所述CAS号在NIST质谱数据库中进行批量搜索,得到多个化合物的质谱数据;从各化合物的所述质谱数据中提取质谱碎片,得到多个碎片;所述质谱碎片为各化合物的所述质谱数据中满足预设要求的碎片;根据各所述质谱碎片的出现频率,从多个所述质谱碎片中选择特征碎片;其中,所述特征碎片的出现频率大于除所述特征碎片外的其他所述质谱碎片的出现频率;根据各所述质谱碎片的出现规律,从多个所述质谱碎片中选择特征碎片组;其中,所述特征碎片组包括至少两个所述质谱碎片且所述特征碎片组中各所述质谱碎片必须同时出现在多个所述化合物中;
从多个所述质谱碎片中选择特征碎片,具体包括:从出现频率按照由大到小排列的多个所述质谱碎片中,选择第一预设数量的所述质谱碎片,得到多个特征碎片;
根据各所述质谱碎片的出现规律,从多个所述质谱碎片中选择特征碎片组,具体包括:统计同时出现在各所述化合物中的各所述质谱碎片,得到多个初始特征碎片组;从出现频率按照由大到小排列的多个所述初始特征碎片组中,选择第二预设数量的所述初始特征碎片组,得到多个特征碎片组;
从所述多个初始化合物中选取综合得分最高的初始化合物作为所述样品的筛查结果。
2.根据权利要求1所述的应用特征碎片及特征碎片组辅助非靶向筛查的方法,其特征在于,在化学信息数据库检索目标化合物分子的CAS号,具体包括:
在化学信息数据库检索目标化合物分子;
根据所述目标化合物分子的化合物分子信息,提取所述目标化合物分子的CAS号。
3.根据权利要求2所述的应用特征碎片及特征碎片组辅助非靶向筛查的方法,其特征在于,在化学信息数据库检索目标化合物分子,具体包括:
在化学信息数据库检索目标大类有机物包含的共同结构;
收集以所述共同结构为子结构的目标化合物分子。
4.根据权利要求1所述的应用特征碎片及特征碎片组辅助非靶向筛查的方法,其特征在于,各所述化合物的质谱数据的格式均为MSP格式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410210612.7A CN117789848B (zh) | 2024-02-27 | 2024-02-27 | 一种应用特征碎片及特征碎片组辅助非靶向筛查的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410210612.7A CN117789848B (zh) | 2024-02-27 | 2024-02-27 | 一种应用特征碎片及特征碎片组辅助非靶向筛查的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117789848A CN117789848A (zh) | 2024-03-29 |
CN117789848B true CN117789848B (zh) | 2024-05-14 |
Family
ID=90402150
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410210612.7A Active CN117789848B (zh) | 2024-02-27 | 2024-02-27 | 一种应用特征碎片及特征碎片组辅助非靶向筛查的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117789848B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113009054A (zh) * | 2021-03-31 | 2021-06-22 | 华南农业大学 | 基于气相质谱特征碎片非定向筛查食品中香精香料及其衍生物的方法 |
CN113933373A (zh) * | 2021-12-16 | 2022-01-14 | 成都健数科技有限公司 | 一种利用质谱数据确定有机物结构的方法和系统 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2463633B (en) * | 2008-05-15 | 2013-02-27 | Thermo Fisher Scient Bremen | MS/MS data processing |
US10878944B2 (en) * | 2018-03-23 | 2020-12-29 | Thermo Finnigan Llc | Methods for combining predicted and observed mass spectral fragmentation data |
-
2024
- 2024-02-27 CN CN202410210612.7A patent/CN117789848B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113009054A (zh) * | 2021-03-31 | 2021-06-22 | 华南农业大学 | 基于气相质谱特征碎片非定向筛查食品中香精香料及其衍生物的方法 |
CN113933373A (zh) * | 2021-12-16 | 2022-01-14 | 成都健数科技有限公司 | 一种利用质谱数据确定有机物结构的方法和系统 |
Non-Patent Citations (1)
Title |
---|
基于气相/液相色谱-高分辨率质谱联用技术的 非目标化合物分析方法研究进展;林必桂 等;《环境化学》;20160315;第466-473页 * |
Also Published As
Publication number | Publication date |
---|---|
CN117789848A (zh) | 2024-03-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kaufmann | Combining UHPLC and high-resolution MS: a viable approach for the analysis of complex samples? | |
Rubert et al. | Metabolic fingerprinting based on high-resolution tandem mass spectrometry: a reliable tool for wine authentication? | |
JP3805979B2 (ja) | 質量分析方法および装置 | |
Xin et al. | Rapid identification of plant materials by wooden-tip electrospray ionization mass spectrometry and a strategy to differentiate the bulbs of Fritillaria | |
WO2022262132A1 (zh) | 一种样品未知成分的液质联用非靶向分析方法 | |
Oberacher et al. | Compound identification in forensic toxicological analysis with untargeted LC–MS-based techniques | |
Wong et al. | Rapid plant volatiles screening using headspace SPME and person-portable gas chromatography–mass spectrometry | |
Silva Jr et al. | Analytical challenges in doping control: Comprehensive two-dimensional gas chromatography with time of flight mass spectrometry, a promising option | |
Sisco et al. | Development and evaluation of a synthetic opioid targeted gas chromatography mass spectrometry (GC‐MS) method | |
Liu et al. | Applicability of ultra‐high performance liquid chromatography‐quadrupole‐time of flight mass spectrometry for cocaine profiling | |
Lommen et al. | Ultra‐fast retroactive processing of liquid chromatography high‐resolution full‐scan Orbitrap mass spectrometry data in anti‐doping screening of human urine | |
CN117789848B (zh) | 一种应用特征碎片及特征碎片组辅助非靶向筛查的方法 | |
Carby‐Robinson et al. | Cocaine profiling method retrospectively developed with nontargeted discovery of markers using liquid chromatography with time‐of‐flight mass spectrometry data | |
JP2019174431A (ja) | 複数成分からなる試料についてクロマトグラフィー質量分析で得られるクロマトグラム及びマススペクトルの解析方法及び情報処理装置及びプログラム及び記録媒体 | |
Rosnack et al. | Screening solution using the software platform UNIFI: an integrated workflow by waters | |
Xing et al. | Rapid screening for bisbibenzyls in bryophyte crude extracts using liquid chromatography/tandem mass spectrometry | |
Swanson et al. | Analysis of unknown fentanyl analogs using high resolution mass spectrometry with mass defect filtering | |
CN108375639B (zh) | 一种快速建立样品中组分质谱数据库的方法 | |
Le Pogam et al. | Implementation of an MS/MS Spectral Library for Monoterpene Indole Alkaloids | |
Yu et al. | Fast determination of phenanthrene in soil by gas chromatography‐mass spectrometry using chemometric resolution and standard addition method | |
Cooper et al. | An assessment of AcquireX and Compound Discoverer software 3.3 for non-targeted metabolomics | |
Croley et al. | Combining targeted and nontargeted data analysis for liquid chromatography/high‐resolution mass spectrometric analyses | |
Segawa et al. | Differentiation of ring‐substituted regioisomers of cathinone analogs by supercritical fluid chromatography | |
US20220301839A1 (en) | Method for analyzing mass spectrometry data, computer program medium, and device for analyzing mass spectrometry data | |
CN115015437B (zh) | 一种基于衍生化的白酒中羧基化合物的高覆盖分析方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |