CN112289386A - 确定化合物分子量的方法及装置 - Google Patents
确定化合物分子量的方法及装置 Download PDFInfo
- Publication number
- CN112289386A CN112289386A CN202011146162.8A CN202011146162A CN112289386A CN 112289386 A CN112289386 A CN 112289386A CN 202011146162 A CN202011146162 A CN 202011146162A CN 112289386 A CN112289386 A CN 112289386A
- Authority
- CN
- China
- Prior art keywords
- isotope
- sample
- molecular
- molecular formula
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 150000001875 compounds Chemical class 0.000 title claims abstract description 80
- 238000000034 method Methods 0.000 title claims abstract description 55
- 230000000155 isotopic effect Effects 0.000 claims abstract description 29
- 238000012216 screening Methods 0.000 claims description 19
- 238000004364 calculation method Methods 0.000 claims description 8
- 238000001514 detection method Methods 0.000 abstract description 18
- 238000009826 distribution Methods 0.000 abstract description 14
- 239000005416 organic matter Substances 0.000 abstract description 10
- 230000035945 sensitivity Effects 0.000 abstract description 6
- 150000002500 ions Chemical class 0.000 description 22
- 238000004422 calculation algorithm Methods 0.000 description 13
- 238000003860 storage Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 9
- 238000004590 computer program Methods 0.000 description 8
- 239000000126 substance Substances 0.000 description 8
- 229910052799 carbon Inorganic materials 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 229910052757 nitrogen Inorganic materials 0.000 description 5
- 229910052760 oxygen Inorganic materials 0.000 description 5
- 229910052698 phosphorus Inorganic materials 0.000 description 5
- 229910052717 sulfur Inorganic materials 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 229910052739 hydrogen Inorganic materials 0.000 description 4
- 238000001819 mass spectrum Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 238000004949 mass spectrometry Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000011002 quantification Methods 0.000 description 3
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 2
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 2
- 150000001793 charged compounds Chemical class 0.000 description 2
- 239000003085 diluting agent Substances 0.000 description 2
- 235000013305 food Nutrition 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 239000007789 gas Substances 0.000 description 2
- 230000014759 maintenance of location Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 239000000447 pesticide residue Substances 0.000 description 2
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000002485 combustion reaction Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000001212 derivatisation Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010812 external standard method Methods 0.000 description 1
- 235000012055 fruits and vegetables Nutrition 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000010884 ion-beam technique Methods 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 150000002894 organic compounds Chemical class 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 239000011574 phosphorus Substances 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 229910052710 silicon Inorganic materials 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 239000011593 sulfur Substances 0.000 description 1
- 238000005303 weighing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/20—Identification of molecular entities, parts thereof or of chemical compositions
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N27/00—Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
- G01N27/62—Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating the ionisation of gases, e.g. aerosols; by investigating electric discharges, e.g. emission of cathode
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computing Systems (AREA)
- Theoretical Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Electrochemistry (AREA)
- Crystallography & Structural Chemistry (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
Abstract
本发明公开了一种确定化合物分子量的方法及装置,所述方法包括:获取样品的质谱图并确定同位素离子峰;基于同位素离子峰,确定样品的分子量的候选范围;根据样品的分子量的候选范围,获得样品的候选分子式;将候选分子式与预创建的同位素标准库进行比对,获得样品和同位素标准库中的标准化合物的相似性结果,同位素标准库包括基于同位素原则筛选出的分子式;基于相似性结果,确定样品的分子量。本发明将待测有机物与同位素分布进行相似性比较从而确定其分子量,提高检测的灵敏度,降低化合物定量限和检出限,提升了化合物分子量检测准确度。
Description
技术领域
本发明涉及化学数据处理技术领域,特别是涉及一种确定化合物分子量的方法及装置。
背景技术
目前,食品质量安全问题越来越受到关注,尤其是果蔬中农药残留问题已经成为关注的焦点问题。现有的,农药残留检测方法通常是基于外标法,定量限和检出限相对较高,稳定同位素技术在地质学、水文学、大气科学、食品安全和化学等领域有着广泛的应用。它是一种基于生物体内稳定同位素差异的一种溯源技术,在农产品中主要应用于产地溯源和物质掺假研究。该技术利用同位素质谱仪进行精确测量丰度值来记录同位素含量。质谱仪将待测有机物样品经过高温燃烧分解转化为气体,然后将气体在离子源中进一步离子化,最后利用电磁分析器将离子束分解为不同质荷比M/Z的组分,仪器记录每一组分离子强度,利用软件程序将该强度转化为同位素丰度值。
现有技术都是使用稳定同位素标记的有机物作为内标(即稀释剂),通过对同位素丰度的质谱测量和加入稀释剂的准确称量,求得样品中待测有机物的绝对分子量。在这个过程中同位素丰度的质谱测量受仪器的精度影响,无法精确的根据标准库中的分子量和保留时间区分待测有机物的成分。可见,现有的分析方法无法准确地检测出化合物分子量。
发明内容
针对于上述问题,本发明提供一种确定化合物分子量的方法及装置,实现了提高检测的灵敏度、降低化合物定量限和检出限,提升了化合物分子量检测准确度。
为了实现上述目的,本发明提供了如下技术方案:
一种确定化合物分子量的方法,包括:
获取样品的质谱图,并确定同位素离子峰;
基于所述同位素离子峰,确定所述样品的分子量的候选范围;
根据所述样品的分子量的候选范围,获得所述样品的候选分子式;
将所述候选分子式与预创建的同位素标准库进行比对,获得所述样品和所述同位素标准库中的标准化合物的相似性结果,所述同位素标准库包括基于同位素原则筛选出的分子式;
基于所述相似性结果,确定所述样品的分子量。
可选地,所述方法还包括:
确定化合物各元素的排列组合的第一分子式集合;
利用同位素原则,在所述第一分子式集合中筛选出所述化合物的第二分子式集合;
计算得到所述第二分子式集合中各个分子式的同位素强度;
基于同位素条件,建立同位素标准库;
基于所述同位素强度构成的化合物的分子量与所述同位素标准库进行比对,确定所述化合物分子量。
可选地,所述将所述候选分子式与预创建的同位素标准库进行比对,包括:
将所述样品的所有分子式集合与预创建的同位素标准库的同位素强度进行结构性比对,将所述样品的分子式集合中包含所述样品同位素所有强度的分子式进行筛选,得到候选分子式集合。
可选地,所述方法还包括:
将所述样品的所有分子式集合与所述候选分子式集合的差值,确定为第三分子式集合;
计算所述第三分子式集合与所述预创建的同位素标准库中分子式的相似度。
可选地,所述方法还包括:
基于相似度结果,确定第四分子式集合;
计算所述第四分子式集合与所述候选分子式集合的并集,得到第五分子式集合;
依据所述第五分子式集合,确定所述样品的分子量。
一种确定化合物分子量的装置,包括:
第一获取单元,用于获取样品的质谱图,并确定同位素离子峰;
第一确定单元,用于基于所述同位素离子峰,确定所述样品的分子量的候选范围;
第二获取单元,用于根据所述样品的分子量的候选范围,获得所述样品的候选分子式;
比对单元,用于将所述候选分子式与预创建的同位素标准库进行比对,获得所述样品和所述同位素标准库中的标准化合物的相似性结果,所述同位素标准库包括基于同位素原则筛选出的分子式;
第二确定单元,用于基于所述相似性结果,确定所述样品的分子量。
可选地,所述装置还包括:
第三确定单元,用于确定化合物各元素的排列组合的第一分子式集合;
筛选单元,用于利用同位素原则,在所述第一分子式集合中筛选出所述化合物的第二分子式集合;
第一计算单元,用于计算得到所述第二分子式集合中各个分子式的同位素强度;
建立单元,用于基于同位素条件,建立同位素标准库;
第四确定单元,用于基于所述同位素强度构成的化合物的分子量与所述同位素标准库进行比对,确定所述化合物分子量。
可选地,所述比对单元具体用于:
将所述样品的所有分子式集合与预创建的同位素标准库的同位素强度进行结构性比对,将所述样品的分子式集合中包含所述样品同位素所有强度的分子式进行筛选,得到候选分子式集合。
可选地,所述装置还包括:
第五确定单元,用于将所述样品的所有分子式集合与所述候选分子式集合的差值,确定为第三分子式集合;
第二计算单元,用于计算所述第三分子式集合与所述预创建的同位素标准库中分子式的相似度。
可选地,所述装置还包括:
第六确定单元,用于基于相似度结果,确定第四分子式集合;
第三计算单元,用于计算所述第四分子式集合与所述候选分子式集合的并集,得到第五分子式集合;
第七确定单元,用于依据所述第五分子式集合,确定所述样品的分子量。
相较于现有技术,本发明提供了一种确定化合物分子量的方法及装置,所述方法包括:获取样品的质谱图并确定同位素离子峰;基于同位素离子峰,确定样品的分子量的候选范围;根据样品的分子量的候选范围,获得样品的候选分子式;将候选分子式与预创建的同位素标准库进行比对,获得样品和同位素标准库中的标准化合物的相似性结果,同位素标准库包括基于同位素原则筛选出的分子式;基于相似性结果,确定样品的分子量。本发明将待测有机物与同位素分布进行相似性比较从而确定其分子量,提高检测的灵敏度,降低化合物定量限和检出限,提升了化合物分子量检测准确度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的一种确定化合物分子量的方法的流程示意图;
图2为本发明实施例提供的一种确定化合物分子量的装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”和“第二”等是用于区别不同的对象,而不是用于描述特定的顺序。此外术语“包括”和“具有”以及他们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有设定于已列出的步骤或单元,而是可包括没有列出的步骤或单元。
在本发明实施例中提供了一种确定化合物分子量的方法,参见图1,该方法针对现有质谱分析方法因质谱仪精度偏低,无法精确的根据标准库中的分子量和保留时间区分待测有机物的成分,本方案提供一种基于稳定同位素分布算法来确定待测化合物组分的质谱法,将待测有机物与同位素分布进行相似性比较从而确定其分子量。该方法可提高检测的灵敏度,降低化合物定量限和检出限。其包括以下步骤:
S101、获取样品的质谱图,并确定同位素离子峰。
S102、基于所述同位素离子峰,确定所述样品的分子量的候选范围。
S103、根据所述样品的分子量的候选范围,获得所述样品的候选分子式。
根据样品的分子量Mass_sa以及质谱图的分子量误差δm,可以框定样品分子量的近似范围Range_mass=[Mass_sa-δm,Mass_sa+δm],进而可以通过分子量索引得到在该范围内的所有分子式,记为集合F1。
S104、将所述候选分子式与预创建的同位素标准库进行比对,获得所述样品和所述同位素标准库中的标准化合物的相似性结果。
所述同位素标准库包括基于同位素原则筛选出的分子式。
S105、基于所述相似性结果,确定所述样品的分子量。
将样品的所有可能分子式逐一和同位素标准库进行比对,计算样品和标准化合物之间的相似性,从而确定样品的化合物组分。对应的,在本发明中可以通过分子拓扑结构相似性和同位素强度相似性两种方法计算样品和同位素标准库的相似性。
在本发明实施例中还包括生成同位素标准库的方法,具体可以包括:
确定化合物各元素的排列组合的第一分子式集合;
利用同位素原则,在所述第一分子式集合中筛选出所述化合物的第二分子式集合;
计算得到所述第二分子式集合中各个分子式的同位素强度;
基于同位素条件,建立同位素标准库;
基于所述同位素强度构成的化合物的分子量与所述同位素标准库进行比对,确定所述化合物分子量。
为了便于对本发明创建的同位素标准库进行说明,首先对同位素分布算法进行说明。
其中,同位素条件是指同位素七条规则对应的内容,即根据同位素七条规则来建立同位素标准库。
同位素分布即同位素相对丰度分布,是指自然界中某一元素的各种同位素的相对含量(以原子数百分计)。有机质谱的正常离子有两种,即分子离子和碎片离子,他们的质量数指的是组成有机离子的各元素原子量之和。同位素分为最轻同位素和重同位素,例如C,H,O,N,P,S中的最轻同位素,即12C,1H,16O,14N,31P,32S。最轻同位素的天然丰度都很高,因此同位素丰度也很强,称其为峰组中的主峰。与之相对的是重同位素,其实质上是分子离子和碎片离子的特殊形式,与主峰相比只是质量不同而无化学结构上的差异。根据数理统计原理,有机化合物分子中任何元素的丰度符合二项式(∑ai)n的展开式,其中二项式中的ai代表同一元素中不同质量同位素的天然丰度比,n代表离子中有重同位素的元素的原子数目。本方案采取麦克劳林方法对二项式展开,如C2H6O展开如下所示:
其中,公式1中的12C表示12C的丰度比值。
则根据以上同位素分布算法计算C2H6O的同位素强度过程如下:
在本发明中建立同位素标准库,其主要包括以下步骤:
定义各元素(如C,H,O,N,P,S)的最大个数,分别记Nm-C,Nm-H,Nm-O,Nm-N,Nm-P,Nm-S,计算由以上元素的排列组合分子式集合,记为集合C0;
根据同位素七条规则,筛选出选定范围的合理分子式,记为集合C1,该集合即是由同位素组成的标准化合物的所有分子集合。至此,同位素标准库建立。具体七条规则如下所示:
(1)元素个数的限制:例如在1000Da时碳=12Da,最大值为1000/12=83,查表可知H,N,S,O,P和Si元素的最大值。
(2)LEWIS和SENIOR化学规则约束:对于中性化合物,这些规则可以得到最好的测试,因此首先需要通过确定化合物的形成和校正来中和质谱中检测到的离子物质。
(3)同位素模式原则:假定高质量的数据采集,特别是足够的离子统计和用于检测M+1和M+2丰度的高信噪比,在算法中包括等比例丰度作为额外的正交约束。
(4)氢碳比原则:将Wiley光谱数据库作为开发集进行研究。所有样本中超过99.7%的H/C比值在0.2-3.1之间。因此,把这个范围称为“共同范围”。利用概率统计原理进行约束。
(5)元素比原则:氮,氧,磷和硫与碳的比,控制在一定范围内,不能使分子式倾斜。
(6)元素比概率:元素比概率原子,因此查表判断元素量的存在情况。
(7)TMS基团限制:通常需要对原始分子进行化学衍生化处理,如果离子化条件和分子结构允许观察分子离子,则必须扣除TMS基团(C3H8Si)以计算未衍生化的分子。
根据上述同位素分布算法,计算得到集合C1中的各个分子式的同位素强度。为了减少后续样品与同位素标准匹配的运行时间,因此,在本发明中把主峰所对应的分子式的索引,并将其映射到实轴上,后续根据索引采取倒排文序方法进行匹配。
在本发明实施例中所述将所述候选分子式与预创建的同位素标准库进行比对,包括:
将所述样品的所有分子式集合与预创建的同位素标准库的同位素强度进行结构性比对,将所述样品的分子式集合中包含所述样品同位素所有强度的分子式进行筛选,得到候选分子式集合。
具体的,根据样品的分子量Mass_sa以及质谱图的分子量误差δm,可以框定样品分子量的近似范围Range_mass=[Mass_sa-δm,Mass_sa+δm],进而可以通过分子量索引得到在该范围内的所有分子式,记为集合F1。将样品的所有可能分子式逐一和同位素标准库进行比对,计算样品和标准化合物之间的相似性,从而确定样品的化合物组分。本发明提出分子拓扑结构相似性和同位素强度相似性两种方法计算样品和同位素标准库的相似性:
(1)分子拓扑结构相似性。
将由分子量筛出的分子式集合F1分别与4.12节建立的同位素标准库的同位素强度进行结构性比对,把F1中包含了样品中同位素所有强度的分子式筛选出来(采用倒排文序先把包含样品中每个同位素分子的集合都罗列出来,再取这些集合的交集),记为集合F2。
(2)同位素相对强度相似性。
将由分子量筛出的分子式集合F1减去由分子拓扑结构筛选的集合F2记为集合F3,接下来根据相似度算法计算集合F3中的每个分子和4.12节建立的样品同位素强度相似性,把F3中相似度大于90%的分子式筛选出来,记为集合F4。相似度算法有很多种,如余弦相似度算法、皮尔逊相似度算法和欧几里得相似度算法等。优选地,可以采取余弦相似性算法计算集合F3中的分子式与标准库分子式相对强度之间的相似度,其计算公式如下所示:
其中,N是指样品中所包含的同位素峰的个数,每个i对应一个同位素峰,最后将集合F2和集合F4求并集,得到集合F5。即集合F5中样品的所有可能分子式可通过同位素标准库确认。最后根据贴近的标准化合物分子的线性组合可以确认样品的精确分子量。
在本发明实施例提供一种基于稳定同位素分布算法来确定待测化合物组分的质谱法,将待测有机物与同位素分布进行相似性比较从而确定其分子量。该方法可提高检测的灵敏度,降低化合物定量限和检出限。具体包括:
同位素分布即同位素相对丰度分布,是指自然界中某一元素的各种同位素的相对含量(以原子数百分计)。根据数理统计原理,有机化合物分子中任何元素的丰度符合二项式(∑ai)n的展开式。本发明实施例采取麦克劳林方法对二项式展开。
定义各元素(如C,H,O,N,P,S)的最大个数,分别记为Nm-C,Nm-H,Nm-O,Nm-N,Nm-P,Nm-S,然后根据化学性质七条规则,筛选出选定范围的合理分子式,记为集合C1,该集合即是由同位素组成的化合物的所有分子组合.。最后根据同位素分布算法,计算集合C1中的各个分子式的同位素强度。为了减少后续样品与同位素标准库匹配的运行时间,把主峰所对应的分子量视为分子式的索引,并将其映射到实轴上,后续根据索引采取倒排文序方法进行匹配。
将样品的所有可能分子式逐一和同位素标准库进行比对,计算样品和标准化合物之间的相似性,从而确定样品的化合物组分的分子量。本方案提出分子拓扑结构相似性和同位素强度相似性两种方法计算样品和同位素标准库的相似性,从而将可能的化合物缩小在更小的范围。
参见图2,其示出了本发明实施例提供的一种确定化合物分子量的装置的结构示意图,该装置包括:
第一获取单元10,用于获取样品的质谱图,并确定同位素离子峰;
第一确定单元20,用于基于所述同位素离子峰,确定所述样品的分子量的候选范围;
第二获取单元30,用于根据所述样品的分子量的候选范围,获得所述样品的候选分子式;
比对单元40,用于将所述候选分子式与预创建的同位素标准库进行比对,获得所述样品和所述同位素标准库中的标准化合物的相似性结果,所述同位素标准库包括基于同位素原则筛选出的分子式;
第二确定单元50,用于基于所述相似性结果,确定所述样品的分子量。
在上述实施例的基础上,所述装置还包括:
第三确定单元,用于确定化合物各元素的排列组合的第一分子式集合;
筛选单元,用于利用同位素原则,在所述第一分子式集合中筛选出所述化合物的第二分子式集合;
第一计算单元,用于计算得到所述第二分子式集合中各个分子式的同位素强度;
建立单元,用于基于同位素条件,建立同位素标准库;
第四确定单元,用于基于所述同位素强度构成的化合物的分子量与所述同位素标准库进行比对,确定所述化合物分子量。
在上述实施例的基础上,所述比对单元具体用于:
将所述样品的所有分子式集合与预创建的同位素标准库的同位素强度进行结构性比对,将所述样品的分子式集合中包含所述样品同位素所有强度的分子式进行筛选,得到候选分子式集合。
在上述实施例的基础上,所述装置还包括:
第五确定单元,用于将所述样品的所有分子式集合与所述候选分子式集合的差值,确定为第三分子式集合;
第二计算单元,用于计算所述第三分子式集合与所述预创建的同位素标准库中分子式的相似度。
在上述实施例的基础上,所述装置还包括:
第六确定单元,用于基于相似度结果,确定第四分子式集合;
第三计算单元,用于计算所述第四分子式集合与所述候选分子式集合的并集,得到第五分子式集合;
第七确定单元,用于依据所述第五分子式集合,确定所述样品的分子量。
在本发明实施例提供了一种确定化合物分子量的装置,第一获取单元获取样品的质谱图,并确定同位素离子峰;第一确定单元基于同位素离子峰,确定样品的分子量的候选范围;第二获取单元根据样品的分子量的候选范围,获得样品的候选分子式;比对单元将候选分子式与预创建的同位素标准库进行比对,获得样品和同位素标准库中的标准化合物的相似性结果,同位素标准库包括基于同位素原则筛选出的分子式;第二确定单元基于相似性结果,确定样品的分子量。本发明将待测有机物与同位素分布进行相似性比较从而确定其分子量,提高检测的灵敏度,降低化合物定量限和检出限,提升了化合物分子量检测准确度。
需要说明的是,本实施例中的各个模块、子模块和单元的工作过程请参照上述实施例中的相应说明,在此不再赘述。
本发明实施例提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现所述确定化合物分子量的方法。
本发明实施例提供了一种电子设备,包括:存储器和处理器;
其中,所述存储器用于存储程序;
处理器调用程序并用于:
获取样品的质谱图,并确定同位素离子峰;
基于所述同位素离子峰,确定所述样品的分子量的候选范围;
根据所述样品的分子量的候选范围,获得所述样品的候选分子式;
将所述候选分子式与预创建的同位素标准库进行比对,获得所述样品和所述同位素标准库中的标准化合物的相似性结果,所述同位素标准库包括基于同位素原则筛选出的分子式;
基于所述相似性结果,确定所述样品的分子量。
可选地,所述方法还包括:
确定化合物各元素的排列组合的第一分子式集合;
利用同位素原则,在所述第一分子式集合中筛选出所述化合物的第二分子式集合;
计算得到所述第二分子式集合中各个分子式的同位素强度;
基于同位素条件,建立同位素标准库;
基于所述同位素强度构成的化合物的分子量与所述同位素标准库进行比对,确定所述化合物分子量。
可选地,所述将所述候选分子式与预创建的同位素标准库进行比对,包括:
将所述样品的所有分子式集合与预创建的同位素标准库的同位素强度进行结构性比对,将所述样品的分子式集合中包含所述样品同位素所有强度的分子式进行筛选,得到候选分子式集合。
可选地,所述方法还包括:
将所述样品的所有分子式集合与所述候选分子式集合的差值,确定为第三分子式集合;
计算所述第三分子式集合与所述预创建的同位素标准库中分子式的相似度。
可选地,所述方法还包括:
基于相似度结果,确定第四分子式集合;
计算所述第四分子式集合与所述候选分子式集合的并集,得到第五分子式集合;
依据所述第五分子式集合,确定所述样品的分子量。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种确定化合物分子量的方法,其特征在于,包括:
获取样品的质谱图,并确定同位素离子峰;
基于所述同位素离子峰,确定所述样品的分子量的候选范围;
根据所述样品的分子量的候选范围,获得所述样品的候选分子式;
将所述候选分子式与预创建的同位素标准库进行比对,获得所述样品和所述同位素标准库中的标准化合物的相似性结果,所述同位素标准库包括基于同位素原则筛选出的分子式;
基于所述相似性结果,确定所述样品的分子量。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
确定化合物各元素的排列组合的第一分子式集合;
利用同位素原则,在所述第一分子式集合中筛选出所述化合物的第二分子式集合;
计算得到所述第二分子式集合中各个分子式的同位素强度;
基于同位素条件,建立同位素标准库;
基于所述同位素强度构成的化合物的分子量与所述同位素标准库进行比对,确定所述化合物分子量。
3.根据权利要求1所述的方法,其特征在于,所述将所述候选分子式与预创建的同位素标准库进行比对,包括:
将所述样品的所有分子式集合与预创建的同位素标准库的同位素强度进行结构性比对,将所述样品的分子式集合中包含所述样品同位素所有强度的分子式进行筛选,得到候选分子式集合。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
将所述样品的所有分子式集合与所述候选分子式集合的差值,确定为第三分子式集合;
计算所述第三分子式集合与所述预创建的同位素标准库中分子式的相似度。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
基于相似度结果,确定第四分子式集合;
计算所述第四分子式集合与所述候选分子式集合的并集,得到第五分子式集合;
依据所述第五分子式集合,确定所述样品的分子量。
6.一种确定化合物分子量的装置,其特征在于,包括:
第一获取单元,用于获取样品的质谱图,并确定同位素离子峰;
第一确定单元,用于基于所述同位素离子峰,确定所述样品的分子量的候选范围;
第二获取单元,用于根据所述样品的分子量的候选范围,获得所述样品的候选分子式;
比对单元,用于将所述候选分子式与预创建的同位素标准库进行比对,获得所述样品和所述同位素标准库中的标准化合物的相似性结果,所述同位素标准库包括基于同位素原则筛选出的分子式;
第二确定单元,用于基于所述相似性结果,确定所述样品的分子量。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:
第三确定单元,用于确定化合物各元素的排列组合的第一分子式集合;
筛选单元,用于利用同位素原则,在所述第一分子式集合中筛选出所述化合物的第二分子式集合;
第一计算单元,用于计算得到所述第二分子式集合中各个分子式的同位素强度;
建立单元,用于基于同位素条件,建立同位素标准库;
第四确定单元,用于基于所述同位素强度构成的化合物的分子量与所述同位素标准库进行比对,确定所述化合物分子量。
8.根据权利要求6所述的装置,其特征在于,所述比对单元具体用于:
将所述样品的所有分子式集合与预创建的同位素标准库的同位素强度进行结构性比对,将所述样品的分子式集合中包含所述样品同位素所有强度的分子式进行筛选,得到候选分子式集合。
9.根据权利要求8所述的装置,其特征在于,所述装置还包括:
第五确定单元,用于将所述样品的所有分子式集合与所述候选分子式集合的差值,确定为第三分子式集合;
第二计算单元,用于计算所述第三分子式集合与所述预创建的同位素标准库中分子式的相似度。
10.根据权利要求9所述的装置,其特征在于,所述装置还包括:
第六确定单元,用于基于相似度结果,确定第四分子式集合;
第三计算单元,用于计算所述第四分子式集合与所述候选分子式集合的并集,得到第五分子式集合;
第七确定单元,用于依据所述第五分子式集合,确定所述样品的分子量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011146162.8A CN112289386A (zh) | 2020-10-23 | 2020-10-23 | 确定化合物分子量的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011146162.8A CN112289386A (zh) | 2020-10-23 | 2020-10-23 | 确定化合物分子量的方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112289386A true CN112289386A (zh) | 2021-01-29 |
Family
ID=74423662
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011146162.8A Pending CN112289386A (zh) | 2020-10-23 | 2020-10-23 | 确定化合物分子量的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112289386A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114420222A (zh) * | 2022-03-29 | 2022-04-29 | 北京市疾病预防控制中心 | 一种基于分布式流式处理的碎片离子化合物结构的快速确认方法 |
CN115439752A (zh) * | 2022-09-22 | 2022-12-06 | 上海市环境科学研究院 | 大气有机物种的识别方法、计算机设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060284068A1 (en) * | 2005-05-19 | 2006-12-21 | Aviv Amirav | Mass spectrometric based method for sample identification |
CN103792275A (zh) * | 2013-09-24 | 2014-05-14 | 中国科学院成都生物研究所 | 一种高分辨质谱准确分子式预测方法 |
CN109507348A (zh) * | 2018-10-24 | 2019-03-22 | 科迈恩(北京)科技有限公司 | 聚合物型药用辅料组成成分的计算机辅助分析系统及方法 |
-
2020
- 2020-10-23 CN CN202011146162.8A patent/CN112289386A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060284068A1 (en) * | 2005-05-19 | 2006-12-21 | Aviv Amirav | Mass spectrometric based method for sample identification |
CN103792275A (zh) * | 2013-09-24 | 2014-05-14 | 中国科学院成都生物研究所 | 一种高分辨质谱准确分子式预测方法 |
CN109507348A (zh) * | 2018-10-24 | 2019-03-22 | 科迈恩(北京)科技有限公司 | 聚合物型药用辅料组成成分的计算机辅助分析系统及方法 |
Non-Patent Citations (1)
Title |
---|
杜金腾: ""质谱分析技术在化学分析中的应用研究"", 《第三届空间材料及其应用技术学术交流会论文集》, 22 September 2011 (2011-09-22), pages 5 - 6 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114420222A (zh) * | 2022-03-29 | 2022-04-29 | 北京市疾病预防控制中心 | 一种基于分布式流式处理的碎片离子化合物结构的快速确认方法 |
CN115439752A (zh) * | 2022-09-22 | 2022-12-06 | 上海市环境科学研究院 | 大气有机物种的识别方法、计算机设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Brehm et al. | Eleven-year solar cycles over the last millennium revealed by radiocarbon in tree rings | |
Blum et al. | Reporting of variations in the natural isotopic composition of mercury | |
Ireland et al. | Considerations in zircon geochronology by SIMS | |
Krauss et al. | LC–high resolution MS in environmental analysis: from target screening to the identification of unknowns | |
Azcarate et al. | Classification of monovarietal Argentinean white wines by their elemental profile | |
CN112289386A (zh) | 确定化合物分子量的方法及装置 | |
Guigue et al. | Ultrahigh-resolution FT-ICR mass spectrometry for molecular characterisation of pressurised hot water-extractable organic matter in soils | |
Zhang et al. | A novel approach for simple statistical analysis of high-resolution mass spectra | |
Gavard et al. | KairosMS: A new solution for the processing of hyphenated ultrahigh resolution mass spectrometry data | |
Lehnert et al. | SIFT-MS optimization for atmospheric trace gas measurements at varying humidity | |
EP2590206B1 (en) | Method and device for estimating the elemental composition of a molecule from an isotopic distribution | |
US8543625B2 (en) | Methods and systems for analysis of multi-sample, two-dimensional data | |
JP4953175B2 (ja) | クロマトグラフ/質量分析装置における定量精度向上方法 | |
Shulyumova et al. | Multivariate calibration in TXRF analysis of water | |
Reuschenbach et al. | Development of a scoring parameter to characterize data quality of centroids in high-resolution mass spectra | |
TWI493168B (zh) | 分析質譜的方法、電腦程式及系統 | |
Zweigle et al. | PFΔ Screen—an open-source tool for automated PFAS feature prioritization in non-target HRMS data | |
Zhu et al. | Development of an automatic linear calibration method for high-resolution single-particle mass spectrometry: improved chemical species identification for atmospheric aerosols | |
CN110793959A (zh) | 基于激光诱导击穿光谱的金属牌号鉴定方法 | |
Fetterolf et al. | Added resolution elements for greater informing power in tandem mass spectrometry | |
CN113484400B (zh) | 基于机器学习的质谱图分子式计算方法 | |
CN108303388B (zh) | 一种原位定量表征复杂有机物和金属离子络合过程的方法 | |
Doran et al. | A computer program to simplify analysis of mass scan data of organometallic compounds from high‐resolution mass spectrometers | |
EP4078600B1 (en) | Method and system for the identification of compounds in complex biological or environmental samples | |
Grebneva-Balyuk | A new method for finding the limits of quantification of elements, estimating dynamic range, and detecting matrix and interelement interferences in spectral analysis (atomic absorption spectrometry and ICP analysis methods) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |