CN113758989B - 基于碎片树的现场质谱目标物识别以及衍生物预测方法 - Google Patents
基于碎片树的现场质谱目标物识别以及衍生物预测方法 Download PDFInfo
- Publication number
- CN113758989B CN113758989B CN202110986213.6A CN202110986213A CN113758989B CN 113758989 B CN113758989 B CN 113758989B CN 202110986213 A CN202110986213 A CN 202110986213A CN 113758989 B CN113758989 B CN 113758989B
- Authority
- CN
- China
- Prior art keywords
- fragment
- peak
- mass spectrum
- mass
- tree
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000012634 fragment Substances 0.000 title claims abstract description 52
- 238000001819 mass spectrum Methods 0.000 title claims abstract description 48
- 238000000034 method Methods 0.000 title claims abstract description 25
- 230000007935 neutral effect Effects 0.000 claims abstract description 17
- 238000013467 fragmentation Methods 0.000 claims abstract description 12
- 238000006062 fragmentation reaction Methods 0.000 claims abstract description 12
- 150000002500 ions Chemical class 0.000 claims abstract description 11
- 238000001914 filtration Methods 0.000 claims abstract description 7
- 238000004422 calculation algorithm Methods 0.000 claims description 9
- 238000012216 screening Methods 0.000 claims description 7
- 238000012545 processing Methods 0.000 claims description 5
- 239000002243 precursor Substances 0.000 claims description 4
- 230000015572 biosynthetic process Effects 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000004590 computer program Methods 0.000 claims description 3
- 150000003254 radicals Chemical class 0.000 claims description 3
- 230000011218 segmentation Effects 0.000 claims description 2
- 238000003860 storage Methods 0.000 claims description 2
- 238000004949 mass spectrometry Methods 0.000 abstract description 7
- 230000007547 defect Effects 0.000 abstract description 2
- 238000013145 classification model Methods 0.000 abstract 1
- 230000006870 function Effects 0.000 description 16
- 150000001875 compounds Chemical class 0.000 description 12
- 239000000126 substance Substances 0.000 description 6
- 238000001514 detection method Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 4
- 239000000463 material Substances 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- XNCOSPRUTUOJCJ-UHFFFAOYSA-N Biguanide Chemical compound NC(N)=NC(N)=N XNCOSPRUTUOJCJ-UHFFFAOYSA-N 0.000 description 2
- 229940123208 Biguanide Drugs 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 2
- 239000010931 gold Substances 0.000 description 2
- 229910052737 gold Inorganic materials 0.000 description 2
- 230000002218 hypoglycaemic effect Effects 0.000 description 2
- 239000002207 metabolite Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- AEQDJSLRWYMAQI-KRWDZBQOSA-N tetrahydropalmatine Chemical compound C1CN2CC(C(=C(OC)C=C3)OC)=C3C[C@H]2C2=C1C=C(OC)C(OC)=C2 AEQDJSLRWYMAQI-KRWDZBQOSA-N 0.000 description 2
- 206010010774 Constipation Diseases 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000010494 dissociation reaction Methods 0.000 description 1
- 230000005593 dissociations Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000004451 qualitative analysis Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 229930189907 rotundine Natural products 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N27/00—Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
- G01N27/62—Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating the ionisation of gases, e.g. aerosols; by investigating electric discharges, e.g. emission of cathode
Landscapes
- Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Electrochemistry (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
Abstract
一种基于碎片树的现场质谱目标物识别以及衍生物预测方法,包括如下步骤:S1、对目标物的多级电压碎裂谱图进行峰形校准;S2、合并处理后的多张谱图,生成一张包含母离子和所有碎片的谱图;S3、对每个碎片峰进行候选分子式预测,通过非带电分子分子式过滤黄金规则、质谱精度排序和碎片树的形成三层筛选,得到最终的候选分子式,再根据中性丢失和峰值相似度对节点和边赋值权重,生成候选分子碎片图;S4、计算最大得分的彩色碎片树;S5、通过碎片树对齐来进行聚类。该方法能够提取衍生物的一级二级质谱特征,训练出分类模型,进而实现对衍生物的鉴定归类。该方法大大弥补了传统现场质谱技术在质谱信号预测上的不足,尤其适于小质谱平台的应用。
Description
技术领域
本发明涉及质谱仪及信号处理的领域,特别是一种基于碎片树的现场质谱目标物识别以及衍生物预测方法。
背景技术
质谱仪是将物质粒子(原子、分子)电离成离子,通过适当的电场或磁场将他们分离,并检测其强度,从而进行定性、定量分析的仪器。因其具有直接测量的本质和高分辨、高灵敏、大通量、高准确度的特性,质谱仪在生命科学、材料科学、食品安全、环境监测、医疗卫生、国家安全等领域具有不可代替的作用和举足轻重的地位。由于现阶段需求的质谱仪主要用于研究的目的,仪器功能复杂、使用和维护要求高,需要专业人员操作,所以只能在实验室里使用。食品安全检测、各种野外环境的现场检测、现场诊断、流程监控、排放物检测与控制、突发事件的处理、尤其是化学和生物武器的检测等诸多需要现场使用质谱仪的场合都对小型便携、操作简单的质谱仪提出了迫切的要求。显然,这样的发展将鼓励质谱拓宽应用领域,成为简化质谱系统,目标操作以及开发各种优化的专业形式的大容量/低利润仪器的驱动力。
目前现场质谱仪的研究尚处于对仪器各部分进行不断改进以满足社会需求的阶段,仪器的小型化通常需要产品架构简单、稳定性强,这将导致仪器的精度和分辨率都无法达到很高的标准,只能进行简单的定性分析。对于质谱信号的分析仍处于初始阶段,并没有充分挖掘并发挥质谱信号的全部价值信息。
国内外提出许多技术和方法用于鉴定小分子,但是大部分的目标识别算法都是针对高精度、高分辨率的大型质谱仪而言。现有的对现场质谱仪的目标识别主流的方法有:(1)质谱库搜索;(2)碎裂搜索法;(3)机器学习;(4)碎片树。
质谱库搜索是鉴定代谢物的一种传统方法。它是将未知化合物在给定条件下的质谱图与含有大量参考质谱图的数据库进行比较。根据数据库中的候选分子质谱图和未知化合物质谱图的相似性进行排序,并返回最佳匹配的候选分子。质谱库搜索的主要缺点是只能识别已知中的未知化合物,即如果数据库中不包含目标化合物的参考谱,则匹配结果不可靠。
碎裂搜索法是从数据库中参考化合物的化学结构生成模拟质谱,并将它们与未知化合物的质谱进行比较。该方法可以帮助鉴定质谱数据库中没有的化合物,提高质谱数据库识别未知化合物的能力。碎裂搜索法适用于识别先验知识较少的化合物,比如不清楚该化合物的碎裂规则。但是,该方法主要基于从分子中断开键生成片段。这些都是近似的估计,实际上键的解离能要复杂得多。
机器学习方法基于机器学习对代谢物进行鉴定的原理是学习和预测质谱和化合物之间的中间表示,然后使用这种表示对质谱库进行匹配或检索。机器学习方法需要大量的数据和基于专家知识进行结构注释,这是复杂的和消耗时间的。此外,它还需要大量的算力,对计算机对较高的性能要求。
碎片树由一组节点表示,每个节点对应于一个片段或前体离子,并用其分子式标注。连接节点对的边表示裂解反应,并以中性丢失的分子式进行标注。现有的碎片树方法对于质谱的质量要求较高,目前仅适于高精度、高分辨率的实验室质谱仪的应用。
目标物识别能够扩展现场质谱的应用场景,让现场质谱的定性检测更加智能,降低现有人工误判和未知新型衍生物的漏检所带来的风险。但是相比于实验室的大型质谱仪器,现场质谱谱图分辨率和质量精度较低,这对后续准确识别和聚类目标物非常不利。
需要说明的是,在上述背景技术部分公开的信息仅用于对本申请的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本发明的主要目的在于克服上述背景技术的缺陷,提供一种基于碎片树的现场质谱目标物识别以及衍生物预测方法。
为实现上述目的,本发明采用以下技术方案:
一种基于碎片树的现场质谱目标物识别以及衍生物预测方法,包括如下步骤:
S1、对目标物的多级电压碎裂谱图进行峰形校准;
S2、对步骤S1处理后的多张谱图进行合并,生成一张包含母离子和所有碎片的谱图;
S3、对每个碎片峰进行候选分子式预测,通过非带电分子分子式过滤黄金规则、质谱精度排序和碎片树的形成三层筛选,得到最终的候选分子式,再根据中性丢失和峰值相似度对节点和边赋值权重,生成候选分子碎片图;
S4、计算最大得分的彩色碎片树;
S5、通过碎片树对齐来进行聚类。
进一步地:
步骤S1包括:
S11、对质量轴进行分段,通过分段处理的方式,将每一段近似线性误差进行处理;
S12、计算标样的理论谱图;
其中,同位素的分布可通过将某一特定原子的同位素比值信息逐步加到整个分子中计算得到;可以将原子的同位素函数表示为δ函数,将其与卷积相联系,即将某一特定原子的同位素函数逐步卷积到整个分子中计算得到;
S13、通过解卷积求得校准滤波器;
S14、通过将所述校准滤波器和目标物原始信号卷积,对原始谱图的信号峰形进行校准。
步骤S13包括:
质谱仪实际测量的数据表示为理论同位素分布y0和实际峰值函数p之间的卷积操作,如式(1)所示:
实际的峰形函数p通过与滤波器函数f的卷积转换成数学上可定义的函数d,如式(2)所示:
式中,y表示实际质谱,y0表示理论质谱,p表示实际峰形,d表示理论峰形,f表示校准滤波器;
对式(1)和(2)整理得式(3)
通过RL解卷积算法求得校准滤波器f。
步骤S2包括:
S21、将不同碎裂能量的质谱峰归一化后进行排序,保留峰值强度最大的10个峰;
S22、根据质谱仪的质量精度设置阈值,并判断满足阈值条件的峰是否处于相邻碰撞能量的谱图中,在同时满足上述两个条件的情况下合并峰。
步骤S3包括:
S31、识别分子式:根据每个峰值对应的质量,在质量偏差范围内求取符合该质量的分子式;
S32、分子式筛选:通过非带电分子分子式过滤黄金规则,质谱精度排序,从元素个数或元素个数比值对候选分子式进行筛选;
S33、判断子分子:根据各个元素个数的大小判断每个峰所对应候选分子式的子分子,并用有向线段进行连接,由此,生成以各个峰的候选分子式为节点通过有向线段进行连接的碎片图;
S34、设置节点、边权重:根据各个候选分子式的理论质量和实验质谱的质量的差值大小赋予每个节点不同的权重;根据中性丢失、不可能中性丢失、自由基丢失对实际的中性丢失,对前体离子到子离子的边进行权重计算。
步骤S4包括:
在碎片图中寻找权值和最大的彩色子树,保证每个颜色只保留一个分子,即每个峰只有一个解释。
步骤S4包括:
利用改进的Prim算法,从任意一个顶点开始,将这个顶点作为最初的最小生成树的子树,通过逐步地为当前的子树添加新边来生成最终的最小生成树,添加的策略是,每次只添加从外部连接到该子树的所有边中的最短边;其中,选择权值最小、且弧头y在子图T中入度为0的有向边<x,y>,将x和y中不属于U的顶点加入到集合U中。
步骤S5包括:
通过计算两个碎片树之间的对齐距离来对碎片树之间的相似度进行衡量。
步骤S5包括:
S51、插入空节点和空路径,使其在没有标签的情况下,结构相似。
S52、然后根据碎片和中性丢失两个维度,对两棵树的相似度进行打分。
一种计算机可读存储介质,存储有计算机程序,所述计算机程序由处理器执行时,实现所述的步骤S1至S5。
本发明具有如下有益效果:
本发明提供一种基于碎片树的现场质谱目标物识别以及衍生物预测方法,实现自动化的目标物识别,该方法能够提取衍生物的一级二级质谱特征,训练出分类模型,进而实现对衍生物的鉴定归类,实现对原始信号预处理的基础上进一步实现对质谱信息的挖掘,大大地弥补了传统的现场质谱技术在质谱信号预测方面的不足。本发明尤其适于小质谱平台的应用。
附图说明
图1为本发明一种实施例的现场质谱目标物识别以及衍生物预测方法流程图
图2为本发明一种实施例的计算质谱信号同位素分布流程图。
图3为本发明一种实施例的罗通定碎片校准结果。
图4为测试双胍类口服降血糖药片三种物质的碎片树以及对齐效果示意图。
具体实施方式
以下对本发明的实施方式做详细说明。应该强调的是,下述说明仅仅是示例性的,而不是为了限制本发明的范围及其应用。
本发明中,碎片树模型利用不同碎裂电压下的二级质谱图建立化合物和所有碎片离子之间的关系。本发明实施例提供一种现场质谱目标物识别以及衍生物预测方法,图1为其流程示意图。
首先,对目标物的多级电压碎裂谱图进行峰形校准,提高其精度和分辨率。
然后,对处理后的多张谱图进行合并,生成一张包含母离子和所有碎片的谱图。
接下来,对每个碎片峰进行候选分子式预测,通过非带电分子分子式过滤黄金规则、质谱精度排序和碎片树的形成这三层筛选,得到最终的候选分子式,并根据中性丢失和峰值相似度对节点和边赋值,生成候选分子碎片图。
随后,计算最大得分的彩色碎片树。
最后,通过碎片树对齐来进行聚类。
以下通过优选实施例对上述各步骤进行具体的说明:
现场质谱谱图校准
(1)对质量轴进行分段:
由于质谱仪的峰形误差不是线性的,通过分段处理的方式,将每一段近似线性误差进行处理。
(2)计算标样的理论谱图:
同位素的分布可通过将某一特定原子的同位素比值信息逐步加到整个分子中计算得到。可以将原子的同位素函数表示为δ函数,将其与卷积相联系,即将某一特定原子的同位素函数逐步卷积到整个分子中计算得到。一个实施例的计算流程如图2所示。
(3)通过解卷积求得校准滤波器:
如式(1)质谱仪实际测量的数据可以表示为理论同位素分布y0和实际峰值函数p之间的卷积操作。
实际的峰形函数p可以通过与滤波器函数f的卷积转换成数学上可定义的函数d,如式(2)所示。
式中,实际质谱y,理论质谱y0,实际峰形p,理论峰形d,校准滤波器f。
对上述两式整理得式(3)
通过RL解卷积算法可求得校准滤波器f。
(4)通过卷积对原始谱图进行校准:
将校准滤波器和目标物原始信号卷积,可以对信号的峰形进行很好得校准。图3展示了罗通定得二级碎片实际谱图、理论谱图和校准谱图的结果,可以看出,谱图得到了很好的校准,与理论质谱非常接近。
合并峰
合并峰具体分以下两个步骤进行:
(1)将不同碎裂能量的质谱峰归一化后进行排序,保留峰值强度最大的10个峰。如此可以保留谱图95%以上的信息。
(2)根据质谱仪的质量精度设置阈值,并判断满足阈值条件的峰是否处于相邻碰撞能量的谱图中,在同时满足上述两个条件的情况下合并峰。
例如,如果满足阈值条件的峰值出现在碰撞能量为15eV和35eV的质谱中,但不在碰撞能量为25eV的质谱中,程序不会合并它们,因为它们很有可能有不同的解释,只是质量偶然相同。
生成碎片图
(1)识别分子式
根据每个峰值对应的质量,在质量偏差范围内求取符合该质量的分子式。
(2)分子式筛选
通过非带电分子分子式过滤黄金规则、质谱精度排序和碎片树的形成三个方面从元素个数、元素个数比值等方面对候选分子式进行筛选。
(3)判断子分子
根据各个元素个数的大小判断每个峰所对应候选分子式的子分子,并用有向线段进行连接。由此,生成以各个峰的候选分子式为节点通过有向线段进行连接的碎片图。
(4)设置节点、边权重
根据各个候选分子式的理论质量和实验质谱的质量的差值大小赋予每个节点不同的权重。根据常见中性丢失、不可能中性丢失和自由基丢失等对实际的中性丢失,即前体离子到子离子的边进行权重计算。
生成最大彩色碎片树
利用改进的Prim算法在图中寻找权值和最大的彩色子树,保证每个颜色只保留一个分子,即每个峰只有一个解释。
Prim算法是从任意一个顶点开始,把这个顶点作为最初的最小生成树的子树,通过逐步地为当前的子树添加新边来生成最终的最小生成树。添加的策略是,每次只添加从外部连接到该子树的所有边中的最短边。由于Prim算法是针对全连接无向图的,因此基于生成树性质:数据元素具备唯一前驱、多个后继的特点对其进行改进。改进思路为选择权值最小、且弧头y在子图T中入度为0的有向边<x,y>,把x和y中不属于U的顶点加入到集合U中。
碎片树对齐
通过计算两个碎片树之间的对齐距离来对碎片树之间的相似度进行衡量,具体计算分以下两个步骤进行:
(1)插入空节点和空路径,使其在没有标签的情况下,结构相似。
(2)然后根据碎片和中性丢失两个维度,对两棵树的相似度进行打分。
测试效果
本发明实施例测试了多组现场质谱谱图同类别衍生物的预测及聚类效果。图4展示了双胍类口服降血糖药片三种物质的碎片树以及对齐效果,从图中可以看出这三种物质的碎片树非常相似,得到了较好的对齐与聚类。
本发明的背景部分可以包含关于本发明的问题或环境的背景信息,而不一定是描述现有技术。因此,在背景技术部分中包含的内容并不是申请人对现有技术的承认。
以上内容是结合具体/优选的实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,其还可以对这些已描述的实施方式做出若干替代或变型,而这些替代或变型方式都应当视为属于本发明的保护范围。在本说明书的描述中,参考术语“一种实施例”、“一些实施例”、“优选实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。尽管已经详细描述了本发明的实施例及其优点,但应当理解,在不脱离专利申请的保护范围的情况下,可以在本文中进行各种改变、替换和变更。
Claims (5)
1.一种基于碎片树的现场质谱目标物识别以及衍生物预测方法,其特征在于,包括如下步骤:
S1、对目标物的多级电压碎裂谱图进行峰形校准;
S2、对步骤S1处理后的多张谱图进行合并,生成一张包含母离子和所有碎片的谱图;
S3、对每个碎片峰进行候选分子式预测,通过非带电分子分子式过滤黄金规则、质谱精度排序和碎片树的形成三层筛选,得到最终的候选分子式,再根据中性丢失和峰值相似度对节点和边赋值权重,生成候选分子碎片图;
S4、计算最大得分的彩色碎片树;
S5、通过碎片树对齐来进行聚类;
步骤S3包括:
S31、识别分子式:根据每个峰值对应的质量,在质量偏差范围内求取符合该质量的分子式;
S32、分子式筛选:通过非带电分子分子式过滤黄金规则、质谱精度排序和碎片树的形成,从元素个数或元素个数比值对候选分子式进行筛选;
S33、判断子分子:根据各个元素个数的大小判断每个峰所对应候选分子式的子分子,并用有向线段进行连接,由此,生成以各个峰的候选分子式为节点通过有向线段进行连接的碎片图;
S34、设置节点、边权重:根据各个候选分子式的理论质量和实验质谱的质量的差值大小赋予每个节点不同的权重;根据中性丢失、不可能中性丢失、自由基丢失对实际的中性丢失,对前体离子到子离子的边进行权重计算;
步骤S4包括:
在碎片图中寻找权值和最大的彩色子树,保证每个颜色只保留一个分子,即每个峰只有一个解释;其中,利用改进的Prim算法,从任意一个顶点开始,将这个顶点作为最初的最小生成树的子树,通过逐步地为当前的子树添加新边来生成最终的最小生成树,添加的策略是,每次只添加从外部连接到该子树的所有边中的最短边;其中,选择权值最小、且弧头y在子图T中入度为0的有向边<x,y>,将x和y中不属于U的顶点加入到集合U中;
步骤S5中,通过计算两个碎片树之间的对齐距离来对碎片树之间的相似度进行衡量;步骤S5包括:
S51、插入空节点和空路径,使其在没有标签的情况下,结构相似;
S52、然后根据碎片和中性丢失两个维度,对两棵树的相似度进行打分。
2.如权利要求1所述的方法,其特征在于,步骤S1包括:
S11、对质量轴进行分段,通过分段处理的方式,将每一段近似线性误差进行处理;
S12、计算目标物的理论谱图;
其中,同位素的分布可通过将某一特定原子的同位素比值信息逐步加到整个分子中计算得到;可以将原子的同位素函数表示为δ函数,将其与卷积相联系,即将某一特定原子的同位素函数逐步卷积到整个分子中计算得到;
S13、通过解卷积求得校准滤波器;
S14、通过将所述校准滤波器和目标物原始信号卷积,对原始谱图的信号峰形进行校准。
3.如权利要求2所述的方法,其特征在于,步骤S13包括:
质谱仪实际测量的数据可表示为理论同位素分布y0和实际峰值函数p之间的卷积操作,如式(1)所示:
实际的峰形函数p通过与滤波器函数f的卷积转换成数学上可定义的函数d,如式(2)所示:
式中,y表示实际质谱,y0表示理论质谱,p表示实际峰形,d表示理论峰形,f表示校准滤波器;
对式(1)和(2)整理得式(3)
通过RL解卷积算法求得校准滤波器f。
4.如权利要求1至2任一项所述的方法,其特征在于,步骤S2包括:
S21、将不同碎裂能量的质谱峰归一化后进行排序,保留峰值强度最大的10个峰;
S22、根据质谱仪的质量精度设置阈值,并判断满足阈值条件的峰是否处于相邻碰撞能量的谱图中,在同时满足上述两个条件的情况下合并峰。
5.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序由处理器执行时,实现如权利要求1至4任一项所述的方法的步骤S1至S5。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110986213.6A CN113758989B (zh) | 2021-08-26 | 2021-08-26 | 基于碎片树的现场质谱目标物识别以及衍生物预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110986213.6A CN113758989B (zh) | 2021-08-26 | 2021-08-26 | 基于碎片树的现场质谱目标物识别以及衍生物预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113758989A CN113758989A (zh) | 2021-12-07 |
CN113758989B true CN113758989B (zh) | 2023-11-28 |
Family
ID=78791303
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110986213.6A Active CN113758989B (zh) | 2021-08-26 | 2021-08-26 | 基于碎片树的现场质谱目标物识别以及衍生物预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113758989B (zh) |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1898674A (zh) * | 2003-10-20 | 2007-01-17 | 瑟诺生物科学有限责任公司 | 用于校准质谱仪(ms)与其它仪器系统和用于处理ms与其它数据的方法 |
WO2009154964A2 (en) * | 2008-05-30 | 2009-12-23 | Glycome Technologies Inc. | Methods for structural analysis of glycans |
WO2012126451A2 (de) * | 2011-03-18 | 2012-09-27 | Boecker Sebastian | Verfahren zur identifizierung insbesondere unbekannter substanzen durch massenspektrometrie |
CN103389335A (zh) * | 2012-05-11 | 2013-11-13 | 中国科学院大连化学物理研究所 | 一种鉴定生物大分子的分析装置和方法 |
GB201321149D0 (en) * | 2013-11-29 | 2014-01-15 | Thermo Fisher Scient Bremen | Method of mass spectral data analysis |
CN104215729A (zh) * | 2014-08-18 | 2014-12-17 | 中国科学院计算技术研究所 | 串联质谱数据母离子检测模型训练方法及母离子检测方法 |
WO2016187898A1 (zh) * | 2015-05-26 | 2016-12-01 | 哈尔滨工业大学深圳研究生院 | 代谢物ms/ms质谱计算机仿真方法 |
CN108593754A (zh) * | 2018-04-24 | 2018-09-28 | 清华大学 | 一种痕量物质串级质谱分析方法 |
CN109991357A (zh) * | 2019-05-10 | 2019-07-09 | 广州质量监督检测研究院 | 糖皮质激素及其衍生物的筛查方法及其应用 |
CN111551646A (zh) * | 2020-05-15 | 2020-08-18 | 云南中烟工业有限责任公司 | 一种基于质谱相似度的色谱峰纯度判定方法 |
CN111551626A (zh) * | 2020-05-18 | 2020-08-18 | 苏州市汉诺生物科技有限公司 | 基于分子组成和结构指纹识别的串级质谱解析方法 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2585453C (en) * | 2004-10-28 | 2020-02-18 | Cerno Bioscience Llc | Qualitative and quantitative mass spectral analysis |
US7348553B2 (en) * | 2004-10-28 | 2008-03-25 | Cerno Bioscience Llc | Aspects of mass spectral calibration |
US7451052B2 (en) * | 2005-05-29 | 2008-11-11 | Cerno Bioscience Llc | Application of comprehensive calibration to mass spectral peak analysis and molecular screening |
US8396870B2 (en) * | 2009-06-25 | 2013-03-12 | University Of Tennessee Research Foundation | Method and apparatus for predicting object properties and events using similarity-based information retrieval and modeling |
US20120108448A1 (en) * | 2010-11-03 | 2012-05-03 | Agilent Technologies, Inc. | System and method for curating mass spectral libraries |
EP3123495B1 (en) * | 2014-03-28 | 2019-11-13 | Wisconsin Alumni Research Foundation | High mass accuracy filtering for improved spectral matching of high-resolution gas chromatography-mass spectrometry data against unit-resolution reference databases |
US10796788B2 (en) * | 2017-06-19 | 2020-10-06 | Academia Sinica | Structural determination of carbohydrates using special procedure and database of mass spectra |
US10878944B2 (en) * | 2018-03-23 | 2020-12-29 | Thermo Finnigan Llc | Methods for combining predicted and observed mass spectral fragmentation data |
-
2021
- 2021-08-26 CN CN202110986213.6A patent/CN113758989B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1898674A (zh) * | 2003-10-20 | 2007-01-17 | 瑟诺生物科学有限责任公司 | 用于校准质谱仪(ms)与其它仪器系统和用于处理ms与其它数据的方法 |
WO2009154964A2 (en) * | 2008-05-30 | 2009-12-23 | Glycome Technologies Inc. | Methods for structural analysis of glycans |
WO2012126451A2 (de) * | 2011-03-18 | 2012-09-27 | Boecker Sebastian | Verfahren zur identifizierung insbesondere unbekannter substanzen durch massenspektrometrie |
CN103389335A (zh) * | 2012-05-11 | 2013-11-13 | 中国科学院大连化学物理研究所 | 一种鉴定生物大分子的分析装置和方法 |
GB201321149D0 (en) * | 2013-11-29 | 2014-01-15 | Thermo Fisher Scient Bremen | Method of mass spectral data analysis |
CN104215729A (zh) * | 2014-08-18 | 2014-12-17 | 中国科学院计算技术研究所 | 串联质谱数据母离子检测模型训练方法及母离子检测方法 |
WO2016187898A1 (zh) * | 2015-05-26 | 2016-12-01 | 哈尔滨工业大学深圳研究生院 | 代谢物ms/ms质谱计算机仿真方法 |
CN108593754A (zh) * | 2018-04-24 | 2018-09-28 | 清华大学 | 一种痕量物质串级质谱分析方法 |
CN109991357A (zh) * | 2019-05-10 | 2019-07-09 | 广州质量监督检测研究院 | 糖皮质激素及其衍生物的筛查方法及其应用 |
CN111551646A (zh) * | 2020-05-15 | 2020-08-18 | 云南中烟工业有限责任公司 | 一种基于质谱相似度的色谱峰纯度判定方法 |
CN111551626A (zh) * | 2020-05-18 | 2020-08-18 | 苏州市汉诺生物科技有限公司 | 基于分子组成和结构指纹识别的串级质谱解析方法 |
Non-Patent Citations (7)
Title |
---|
fragmentation trees reloaded;Sebastoan bocker;《Journal of Cheminformatics》;正文,附图3 * |
Identifying the Unknowns by Aligning Fragmentation Trees;Florian Rasche;《American Chemical Society》;全文 * |
Sebastoan bocker.fragmentation trees reloaded.《Journal of Cheminformatics》.2016,正文,附图3. * |
Seven Golden Rules for heuristic filtering of molecular formulas obtained by accurate mass spectrometry;Tobias Kind;《BMC Bioinformatics》;全文 * |
Towards de novo identification of metabolites by analyzing tandem mass spectra;Sebastian Böcker;《BIOINFORMATICS》;第5部分 * |
基于分子式数据库策略的FM-searcher软件 在危害物非目标筛查分子式预测中的应用;雷 珊;《质谱学报》;全文 * |
基于树结构的本体概念相似度计算方法;徐英卓;《计 算 机 系 统 应 用》;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN113758989A (zh) | 2021-12-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9312110B2 (en) | System and method for grouping precursor and fragment ions using selected ion chromatograms | |
EP2836958B1 (en) | Method for classification of a sample on the basis of spectral data and corresponding data storage medium and system | |
US8884218B2 (en) | Method and systems for mass spectrometry for identification and structural analysis of unknown substance | |
US20140297201A1 (en) | Computer-assisted structure identification | |
CN107729721B (zh) | 一种代谢物鉴定及紊乱通路分析方法 | |
US20070095757A1 (en) | Methods and systems for the annotation of biomolecule patterns in chromatography/mass-spectrometry analysis | |
US20140274751A1 (en) | Chemical identification using a chromatography retention index | |
CN108398416A (zh) | 一种基于激光拉曼光谱的混合物成分测定方法 | |
Moorthy et al. | A new library-search algorithm for mixture analysis using DART-MS | |
CN104820011B (zh) | 一种蛋白质翻译后修饰定位的方法 | |
US10041915B2 (en) | Mass spectrometry (MS) identification algorithm | |
CN113758989B (zh) | 基于碎片树的现场质谱目标物识别以及衍生物预测方法 | |
Pleil et al. | Beyond monoisotopic accurate mass spectrometry: ancillary techniques for identifying unknown features in non-targeted discovery analysis | |
EP4078600A1 (en) | Method and system for the identification of compounds in complex biological or environmental samples | |
CN117169387A (zh) | 水中污染物的非靶向分析方法 | |
CN118176540A (zh) | 用于未知化合物检测和识别的化学峰寻找器模型 | |
Kearsley et al. | Similarity Measures of Mass Spectra in Hilbert Spaces | |
EP2541585A1 (en) | Computer-assisted structure identification | |
Zhang et al. | Selection of neutral losses and characteristic ions for mass spectral classifier | |
LaMarche | Methods for comparing metaproteomic data in the absence of metagenomic information | |
Wang et al. | GPA: An algorithm for LC/MS based glycan profile annotation | |
Lebedev et al. | DETECTION OF ISOTOPIC PEAK SERIES IN LOW-RESOLUTION MASS SPECTRA USING CLUSTERING ALGORITHM AND CHI-SQUARE TEST | |
Timm et al. | Peak intensity prediction for pmf mass spectra using support vector regression | |
CN117999605A (zh) | 谱比较 | |
CN113744814A (zh) | 基于贝叶斯后验概率模型的质谱数据搜库方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |