CN113758989B - 基于碎片树的现场质谱目标物识别以及衍生物预测方法 - Google Patents

基于碎片树的现场质谱目标物识别以及衍生物预测方法 Download PDF

Info

Publication number
CN113758989B
CN113758989B CN202110986213.6A CN202110986213A CN113758989B CN 113758989 B CN113758989 B CN 113758989B CN 202110986213 A CN202110986213 A CN 202110986213A CN 113758989 B CN113758989 B CN 113758989B
Authority
CN
China
Prior art keywords
fragment
peak
mass spectrum
mass
tree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110986213.6A
Other languages
English (en)
Other versions
CN113758989A (zh
Inventor
钱翔
杨淑媛
霍新明
余泉
倪凯
王晓浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen International Graduate School of Tsinghua University
Original Assignee
Shenzhen International Graduate School of Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen International Graduate School of Tsinghua University filed Critical Shenzhen International Graduate School of Tsinghua University
Priority to CN202110986213.6A priority Critical patent/CN113758989B/zh
Publication of CN113758989A publication Critical patent/CN113758989A/zh
Application granted granted Critical
Publication of CN113758989B publication Critical patent/CN113758989B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N27/00Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
    • G01N27/62Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating the ionisation of gases, e.g. aerosols; by investigating electric discharges, e.g. emission of cathode

Landscapes

  • Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Electrochemistry (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

一种基于碎片树的现场质谱目标物识别以及衍生物预测方法,包括如下步骤:S1、对目标物的多级电压碎裂谱图进行峰形校准;S2、合并处理后的多张谱图,生成一张包含母离子和所有碎片的谱图;S3、对每个碎片峰进行候选分子式预测,通过非带电分子分子式过滤黄金规则、质谱精度排序和碎片树的形成三层筛选,得到最终的候选分子式,再根据中性丢失和峰值相似度对节点和边赋值权重,生成候选分子碎片图;S4、计算最大得分的彩色碎片树;S5、通过碎片树对齐来进行聚类。该方法能够提取衍生物的一级二级质谱特征,训练出分类模型,进而实现对衍生物的鉴定归类。该方法大大弥补了传统现场质谱技术在质谱信号预测上的不足,尤其适于小质谱平台的应用。

Description

基于碎片树的现场质谱目标物识别以及衍生物预测方法
技术领域
本发明涉及质谱仪及信号处理的领域,特别是一种基于碎片树的现场质谱目标物识别以及衍生物预测方法。
背景技术
质谱仪是将物质粒子(原子、分子)电离成离子,通过适当的电场或磁场将他们分离,并检测其强度,从而进行定性、定量分析的仪器。因其具有直接测量的本质和高分辨、高灵敏、大通量、高准确度的特性,质谱仪在生命科学、材料科学、食品安全、环境监测、医疗卫生、国家安全等领域具有不可代替的作用和举足轻重的地位。由于现阶段需求的质谱仪主要用于研究的目的,仪器功能复杂、使用和维护要求高,需要专业人员操作,所以只能在实验室里使用。食品安全检测、各种野外环境的现场检测、现场诊断、流程监控、排放物检测与控制、突发事件的处理、尤其是化学和生物武器的检测等诸多需要现场使用质谱仪的场合都对小型便携、操作简单的质谱仪提出了迫切的要求。显然,这样的发展将鼓励质谱拓宽应用领域,成为简化质谱系统,目标操作以及开发各种优化的专业形式的大容量/低利润仪器的驱动力。
目前现场质谱仪的研究尚处于对仪器各部分进行不断改进以满足社会需求的阶段,仪器的小型化通常需要产品架构简单、稳定性强,这将导致仪器的精度和分辨率都无法达到很高的标准,只能进行简单的定性分析。对于质谱信号的分析仍处于初始阶段,并没有充分挖掘并发挥质谱信号的全部价值信息。
国内外提出许多技术和方法用于鉴定小分子,但是大部分的目标识别算法都是针对高精度、高分辨率的大型质谱仪而言。现有的对现场质谱仪的目标识别主流的方法有:(1)质谱库搜索;(2)碎裂搜索法;(3)机器学习;(4)碎片树。
质谱库搜索是鉴定代谢物的一种传统方法。它是将未知化合物在给定条件下的质谱图与含有大量参考质谱图的数据库进行比较。根据数据库中的候选分子质谱图和未知化合物质谱图的相似性进行排序,并返回最佳匹配的候选分子。质谱库搜索的主要缺点是只能识别已知中的未知化合物,即如果数据库中不包含目标化合物的参考谱,则匹配结果不可靠。
碎裂搜索法是从数据库中参考化合物的化学结构生成模拟质谱,并将它们与未知化合物的质谱进行比较。该方法可以帮助鉴定质谱数据库中没有的化合物,提高质谱数据库识别未知化合物的能力。碎裂搜索法适用于识别先验知识较少的化合物,比如不清楚该化合物的碎裂规则。但是,该方法主要基于从分子中断开键生成片段。这些都是近似的估计,实际上键的解离能要复杂得多。
机器学习方法基于机器学习对代谢物进行鉴定的原理是学习和预测质谱和化合物之间的中间表示,然后使用这种表示对质谱库进行匹配或检索。机器学习方法需要大量的数据和基于专家知识进行结构注释,这是复杂的和消耗时间的。此外,它还需要大量的算力,对计算机对较高的性能要求。
碎片树由一组节点表示,每个节点对应于一个片段或前体离子,并用其分子式标注。连接节点对的边表示裂解反应,并以中性丢失的分子式进行标注。现有的碎片树方法对于质谱的质量要求较高,目前仅适于高精度、高分辨率的实验室质谱仪的应用。
目标物识别能够扩展现场质谱的应用场景,让现场质谱的定性检测更加智能,降低现有人工误判和未知新型衍生物的漏检所带来的风险。但是相比于实验室的大型质谱仪器,现场质谱谱图分辨率和质量精度较低,这对后续准确识别和聚类目标物非常不利。
需要说明的是,在上述背景技术部分公开的信息仅用于对本申请的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本发明的主要目的在于克服上述背景技术的缺陷,提供一种基于碎片树的现场质谱目标物识别以及衍生物预测方法。
为实现上述目的,本发明采用以下技术方案:
一种基于碎片树的现场质谱目标物识别以及衍生物预测方法,包括如下步骤:
S1、对目标物的多级电压碎裂谱图进行峰形校准;
S2、对步骤S1处理后的多张谱图进行合并,生成一张包含母离子和所有碎片的谱图;
S3、对每个碎片峰进行候选分子式预测,通过非带电分子分子式过滤黄金规则、质谱精度排序和碎片树的形成三层筛选,得到最终的候选分子式,再根据中性丢失和峰值相似度对节点和边赋值权重,生成候选分子碎片图;
S4、计算最大得分的彩色碎片树;
S5、通过碎片树对齐来进行聚类。
进一步地:
步骤S1包括:
S11、对质量轴进行分段,通过分段处理的方式,将每一段近似线性误差进行处理;
S12、计算标样的理论谱图;
其中,同位素的分布可通过将某一特定原子的同位素比值信息逐步加到整个分子中计算得到;可以将原子的同位素函数表示为δ函数,将其与卷积相联系,即将某一特定原子的同位素函数逐步卷积到整个分子中计算得到;
S13、通过解卷积求得校准滤波器;
S14、通过将所述校准滤波器和目标物原始信号卷积,对原始谱图的信号峰形进行校准。
步骤S13包括:
质谱仪实际测量的数据表示为理论同位素分布y0和实际峰值函数p之间的卷积操作,如式(1)所示:
实际的峰形函数p通过与滤波器函数f的卷积转换成数学上可定义的函数d,如式(2)所示:
式中,y表示实际质谱,y0表示理论质谱,p表示实际峰形,d表示理论峰形,f表示校准滤波器;
对式(1)和(2)整理得式(3)
通过RL解卷积算法求得校准滤波器f。
步骤S2包括:
S21、将不同碎裂能量的质谱峰归一化后进行排序,保留峰值强度最大的10个峰;
S22、根据质谱仪的质量精度设置阈值,并判断满足阈值条件的峰是否处于相邻碰撞能量的谱图中,在同时满足上述两个条件的情况下合并峰。
步骤S3包括:
S31、识别分子式:根据每个峰值对应的质量,在质量偏差范围内求取符合该质量的分子式;
S32、分子式筛选:通过非带电分子分子式过滤黄金规则,质谱精度排序,从元素个数或元素个数比值对候选分子式进行筛选;
S33、判断子分子:根据各个元素个数的大小判断每个峰所对应候选分子式的子分子,并用有向线段进行连接,由此,生成以各个峰的候选分子式为节点通过有向线段进行连接的碎片图;
S34、设置节点、边权重:根据各个候选分子式的理论质量和实验质谱的质量的差值大小赋予每个节点不同的权重;根据中性丢失、不可能中性丢失、自由基丢失对实际的中性丢失,对前体离子到子离子的边进行权重计算。
步骤S4包括:
在碎片图中寻找权值和最大的彩色子树,保证每个颜色只保留一个分子,即每个峰只有一个解释。
步骤S4包括:
利用改进的Prim算法,从任意一个顶点开始,将这个顶点作为最初的最小生成树的子树,通过逐步地为当前的子树添加新边来生成最终的最小生成树,添加的策略是,每次只添加从外部连接到该子树的所有边中的最短边;其中,选择权值最小、且弧头y在子图T中入度为0的有向边<x,y>,将x和y中不属于U的顶点加入到集合U中。
步骤S5包括:
通过计算两个碎片树之间的对齐距离来对碎片树之间的相似度进行衡量。
步骤S5包括:
S51、插入空节点和空路径,使其在没有标签的情况下,结构相似。
S52、然后根据碎片和中性丢失两个维度,对两棵树的相似度进行打分。
一种计算机可读存储介质,存储有计算机程序,所述计算机程序由处理器执行时,实现所述的步骤S1至S5。
本发明具有如下有益效果:
本发明提供一种基于碎片树的现场质谱目标物识别以及衍生物预测方法,实现自动化的目标物识别,该方法能够提取衍生物的一级二级质谱特征,训练出分类模型,进而实现对衍生物的鉴定归类,实现对原始信号预处理的基础上进一步实现对质谱信息的挖掘,大大地弥补了传统的现场质谱技术在质谱信号预测方面的不足。本发明尤其适于小质谱平台的应用。
附图说明
图1为本发明一种实施例的现场质谱目标物识别以及衍生物预测方法流程图
图2为本发明一种实施例的计算质谱信号同位素分布流程图。
图3为本发明一种实施例的罗通定碎片校准结果。
图4为测试双胍类口服降血糖药片三种物质的碎片树以及对齐效果示意图。
具体实施方式
以下对本发明的实施方式做详细说明。应该强调的是,下述说明仅仅是示例性的,而不是为了限制本发明的范围及其应用。
本发明中,碎片树模型利用不同碎裂电压下的二级质谱图建立化合物和所有碎片离子之间的关系。本发明实施例提供一种现场质谱目标物识别以及衍生物预测方法,图1为其流程示意图。
首先,对目标物的多级电压碎裂谱图进行峰形校准,提高其精度和分辨率。
然后,对处理后的多张谱图进行合并,生成一张包含母离子和所有碎片的谱图。
接下来,对每个碎片峰进行候选分子式预测,通过非带电分子分子式过滤黄金规则、质谱精度排序和碎片树的形成这三层筛选,得到最终的候选分子式,并根据中性丢失和峰值相似度对节点和边赋值,生成候选分子碎片图。
随后,计算最大得分的彩色碎片树。
最后,通过碎片树对齐来进行聚类。
以下通过优选实施例对上述各步骤进行具体的说明:
现场质谱谱图校准
(1)对质量轴进行分段:
由于质谱仪的峰形误差不是线性的,通过分段处理的方式,将每一段近似线性误差进行处理。
(2)计算标样的理论谱图:
同位素的分布可通过将某一特定原子的同位素比值信息逐步加到整个分子中计算得到。可以将原子的同位素函数表示为δ函数,将其与卷积相联系,即将某一特定原子的同位素函数逐步卷积到整个分子中计算得到。一个实施例的计算流程如图2所示。
(3)通过解卷积求得校准滤波器:
如式(1)质谱仪实际测量的数据可以表示为理论同位素分布y0和实际峰值函数p之间的卷积操作。
实际的峰形函数p可以通过与滤波器函数f的卷积转换成数学上可定义的函数d,如式(2)所示。
式中,实际质谱y,理论质谱y0,实际峰形p,理论峰形d,校准滤波器f。
对上述两式整理得式(3)
通过RL解卷积算法可求得校准滤波器f。
(4)通过卷积对原始谱图进行校准:
将校准滤波器和目标物原始信号卷积,可以对信号的峰形进行很好得校准。图3展示了罗通定得二级碎片实际谱图、理论谱图和校准谱图的结果,可以看出,谱图得到了很好的校准,与理论质谱非常接近。
合并峰
合并峰具体分以下两个步骤进行:
(1)将不同碎裂能量的质谱峰归一化后进行排序,保留峰值强度最大的10个峰。如此可以保留谱图95%以上的信息。
(2)根据质谱仪的质量精度设置阈值,并判断满足阈值条件的峰是否处于相邻碰撞能量的谱图中,在同时满足上述两个条件的情况下合并峰。
例如,如果满足阈值条件的峰值出现在碰撞能量为15eV和35eV的质谱中,但不在碰撞能量为25eV的质谱中,程序不会合并它们,因为它们很有可能有不同的解释,只是质量偶然相同。
生成碎片图
(1)识别分子式
根据每个峰值对应的质量,在质量偏差范围内求取符合该质量的分子式。
(2)分子式筛选
通过非带电分子分子式过滤黄金规则、质谱精度排序和碎片树的形成三个方面从元素个数、元素个数比值等方面对候选分子式进行筛选。
(3)判断子分子
根据各个元素个数的大小判断每个峰所对应候选分子式的子分子,并用有向线段进行连接。由此,生成以各个峰的候选分子式为节点通过有向线段进行连接的碎片图。
(4)设置节点、边权重
根据各个候选分子式的理论质量和实验质谱的质量的差值大小赋予每个节点不同的权重。根据常见中性丢失、不可能中性丢失和自由基丢失等对实际的中性丢失,即前体离子到子离子的边进行权重计算。
生成最大彩色碎片树
利用改进的Prim算法在图中寻找权值和最大的彩色子树,保证每个颜色只保留一个分子,即每个峰只有一个解释。
Prim算法是从任意一个顶点开始,把这个顶点作为最初的最小生成树的子树,通过逐步地为当前的子树添加新边来生成最终的最小生成树。添加的策略是,每次只添加从外部连接到该子树的所有边中的最短边。由于Prim算法是针对全连接无向图的,因此基于生成树性质:数据元素具备唯一前驱、多个后继的特点对其进行改进。改进思路为选择权值最小、且弧头y在子图T中入度为0的有向边<x,y>,把x和y中不属于U的顶点加入到集合U中。
碎片树对齐
通过计算两个碎片树之间的对齐距离来对碎片树之间的相似度进行衡量,具体计算分以下两个步骤进行:
(1)插入空节点和空路径,使其在没有标签的情况下,结构相似。
(2)然后根据碎片和中性丢失两个维度,对两棵树的相似度进行打分。
测试效果
本发明实施例测试了多组现场质谱谱图同类别衍生物的预测及聚类效果。图4展示了双胍类口服降血糖药片三种物质的碎片树以及对齐效果,从图中可以看出这三种物质的碎片树非常相似,得到了较好的对齐与聚类。
本发明的背景部分可以包含关于本发明的问题或环境的背景信息,而不一定是描述现有技术。因此,在背景技术部分中包含的内容并不是申请人对现有技术的承认。
以上内容是结合具体/优选的实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,其还可以对这些已描述的实施方式做出若干替代或变型,而这些替代或变型方式都应当视为属于本发明的保护范围。在本说明书的描述中,参考术语“一种实施例”、“一些实施例”、“优选实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。尽管已经详细描述了本发明的实施例及其优点,但应当理解,在不脱离专利申请的保护范围的情况下,可以在本文中进行各种改变、替换和变更。

Claims (5)

1.一种基于碎片树的现场质谱目标物识别以及衍生物预测方法,其特征在于,包括如下步骤:
S1、对目标物的多级电压碎裂谱图进行峰形校准;
S2、对步骤S1处理后的多张谱图进行合并,生成一张包含母离子和所有碎片的谱图;
S3、对每个碎片峰进行候选分子式预测,通过非带电分子分子式过滤黄金规则、质谱精度排序和碎片树的形成三层筛选,得到最终的候选分子式,再根据中性丢失和峰值相似度对节点和边赋值权重,生成候选分子碎片图;
S4、计算最大得分的彩色碎片树;
S5、通过碎片树对齐来进行聚类;
步骤S3包括:
S31、识别分子式:根据每个峰值对应的质量,在质量偏差范围内求取符合该质量的分子式;
S32、分子式筛选:通过非带电分子分子式过滤黄金规则、质谱精度排序和碎片树的形成,从元素个数或元素个数比值对候选分子式进行筛选;
S33、判断子分子:根据各个元素个数的大小判断每个峰所对应候选分子式的子分子,并用有向线段进行连接,由此,生成以各个峰的候选分子式为节点通过有向线段进行连接的碎片图;
S34、设置节点、边权重:根据各个候选分子式的理论质量和实验质谱的质量的差值大小赋予每个节点不同的权重;根据中性丢失、不可能中性丢失、自由基丢失对实际的中性丢失,对前体离子到子离子的边进行权重计算;
步骤S4包括:
在碎片图中寻找权值和最大的彩色子树,保证每个颜色只保留一个分子,即每个峰只有一个解释;其中,利用改进的Prim算法,从任意一个顶点开始,将这个顶点作为最初的最小生成树的子树,通过逐步地为当前的子树添加新边来生成最终的最小生成树,添加的策略是,每次只添加从外部连接到该子树的所有边中的最短边;其中,选择权值最小、且弧头y在子图T中入度为0的有向边<x,y>,将x和y中不属于U的顶点加入到集合U中;
步骤S5中,通过计算两个碎片树之间的对齐距离来对碎片树之间的相似度进行衡量;步骤S5包括:
S51、插入空节点和空路径,使其在没有标签的情况下,结构相似;
S52、然后根据碎片和中性丢失两个维度,对两棵树的相似度进行打分。
2.如权利要求1所述的方法,其特征在于,步骤S1包括:
S11、对质量轴进行分段,通过分段处理的方式,将每一段近似线性误差进行处理;
S12、计算目标物的理论谱图;
其中,同位素的分布可通过将某一特定原子的同位素比值信息逐步加到整个分子中计算得到;可以将原子的同位素函数表示为δ函数,将其与卷积相联系,即将某一特定原子的同位素函数逐步卷积到整个分子中计算得到;
S13、通过解卷积求得校准滤波器;
S14、通过将所述校准滤波器和目标物原始信号卷积,对原始谱图的信号峰形进行校准。
3.如权利要求2所述的方法,其特征在于,步骤S13包括:
质谱仪实际测量的数据可表示为理论同位素分布y0和实际峰值函数p之间的卷积操作,如式(1)所示:
实际的峰形函数p通过与滤波器函数f的卷积转换成数学上可定义的函数d,如式(2)所示:
式中,y表示实际质谱,y0表示理论质谱,p表示实际峰形,d表示理论峰形,f表示校准滤波器;
对式(1)和(2)整理得式(3)
通过RL解卷积算法求得校准滤波器f。
4.如权利要求1至2任一项所述的方法,其特征在于,步骤S2包括:
S21、将不同碎裂能量的质谱峰归一化后进行排序,保留峰值强度最大的10个峰;
S22、根据质谱仪的质量精度设置阈值,并判断满足阈值条件的峰是否处于相邻碰撞能量的谱图中,在同时满足上述两个条件的情况下合并峰。
5.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序由处理器执行时,实现如权利要求1至4任一项所述的方法的步骤S1至S5。
CN202110986213.6A 2021-08-26 2021-08-26 基于碎片树的现场质谱目标物识别以及衍生物预测方法 Active CN113758989B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110986213.6A CN113758989B (zh) 2021-08-26 2021-08-26 基于碎片树的现场质谱目标物识别以及衍生物预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110986213.6A CN113758989B (zh) 2021-08-26 2021-08-26 基于碎片树的现场质谱目标物识别以及衍生物预测方法

Publications (2)

Publication Number Publication Date
CN113758989A CN113758989A (zh) 2021-12-07
CN113758989B true CN113758989B (zh) 2023-11-28

Family

ID=78791303

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110986213.6A Active CN113758989B (zh) 2021-08-26 2021-08-26 基于碎片树的现场质谱目标物识别以及衍生物预测方法

Country Status (1)

Country Link
CN (1) CN113758989B (zh)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1898674A (zh) * 2003-10-20 2007-01-17 瑟诺生物科学有限责任公司 用于校准质谱仪(ms)与其它仪器系统和用于处理ms与其它数据的方法
WO2009154964A2 (en) * 2008-05-30 2009-12-23 Glycome Technologies Inc. Methods for structural analysis of glycans
WO2012126451A2 (de) * 2011-03-18 2012-09-27 Boecker Sebastian Verfahren zur identifizierung insbesondere unbekannter substanzen durch massenspektrometrie
CN103389335A (zh) * 2012-05-11 2013-11-13 中国科学院大连化学物理研究所 一种鉴定生物大分子的分析装置和方法
GB201321149D0 (en) * 2013-11-29 2014-01-15 Thermo Fisher Scient Bremen Method of mass spectral data analysis
CN104215729A (zh) * 2014-08-18 2014-12-17 中国科学院计算技术研究所 串联质谱数据母离子检测模型训练方法及母离子检测方法
WO2016187898A1 (zh) * 2015-05-26 2016-12-01 哈尔滨工业大学深圳研究生院 代谢物ms/ms质谱计算机仿真方法
CN108593754A (zh) * 2018-04-24 2018-09-28 清华大学 一种痕量物质串级质谱分析方法
CN109991357A (zh) * 2019-05-10 2019-07-09 广州质量监督检测研究院 糖皮质激素及其衍生物的筛查方法及其应用
CN111551646A (zh) * 2020-05-15 2020-08-18 云南中烟工业有限责任公司 一种基于质谱相似度的色谱峰纯度判定方法
CN111551626A (zh) * 2020-05-18 2020-08-18 苏州市汉诺生物科技有限公司 基于分子组成和结构指纹识别的串级质谱解析方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2585453C (en) * 2004-10-28 2020-02-18 Cerno Bioscience Llc Qualitative and quantitative mass spectral analysis
US7348553B2 (en) * 2004-10-28 2008-03-25 Cerno Bioscience Llc Aspects of mass spectral calibration
US7451052B2 (en) * 2005-05-29 2008-11-11 Cerno Bioscience Llc Application of comprehensive calibration to mass spectral peak analysis and molecular screening
US8396870B2 (en) * 2009-06-25 2013-03-12 University Of Tennessee Research Foundation Method and apparatus for predicting object properties and events using similarity-based information retrieval and modeling
US20120108448A1 (en) * 2010-11-03 2012-05-03 Agilent Technologies, Inc. System and method for curating mass spectral libraries
EP3123495B1 (en) * 2014-03-28 2019-11-13 Wisconsin Alumni Research Foundation High mass accuracy filtering for improved spectral matching of high-resolution gas chromatography-mass spectrometry data against unit-resolution reference databases
US10796788B2 (en) * 2017-06-19 2020-10-06 Academia Sinica Structural determination of carbohydrates using special procedure and database of mass spectra
US10878944B2 (en) * 2018-03-23 2020-12-29 Thermo Finnigan Llc Methods for combining predicted and observed mass spectral fragmentation data

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1898674A (zh) * 2003-10-20 2007-01-17 瑟诺生物科学有限责任公司 用于校准质谱仪(ms)与其它仪器系统和用于处理ms与其它数据的方法
WO2009154964A2 (en) * 2008-05-30 2009-12-23 Glycome Technologies Inc. Methods for structural analysis of glycans
WO2012126451A2 (de) * 2011-03-18 2012-09-27 Boecker Sebastian Verfahren zur identifizierung insbesondere unbekannter substanzen durch massenspektrometrie
CN103389335A (zh) * 2012-05-11 2013-11-13 中国科学院大连化学物理研究所 一种鉴定生物大分子的分析装置和方法
GB201321149D0 (en) * 2013-11-29 2014-01-15 Thermo Fisher Scient Bremen Method of mass spectral data analysis
CN104215729A (zh) * 2014-08-18 2014-12-17 中国科学院计算技术研究所 串联质谱数据母离子检测模型训练方法及母离子检测方法
WO2016187898A1 (zh) * 2015-05-26 2016-12-01 哈尔滨工业大学深圳研究生院 代谢物ms/ms质谱计算机仿真方法
CN108593754A (zh) * 2018-04-24 2018-09-28 清华大学 一种痕量物质串级质谱分析方法
CN109991357A (zh) * 2019-05-10 2019-07-09 广州质量监督检测研究院 糖皮质激素及其衍生物的筛查方法及其应用
CN111551646A (zh) * 2020-05-15 2020-08-18 云南中烟工业有限责任公司 一种基于质谱相似度的色谱峰纯度判定方法
CN111551626A (zh) * 2020-05-18 2020-08-18 苏州市汉诺生物科技有限公司 基于分子组成和结构指纹识别的串级质谱解析方法

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
fragmentation trees reloaded;Sebastoan bocker;《Journal of Cheminformatics》;正文,附图3 *
Identifying the Unknowns by Aligning Fragmentation Trees;Florian Rasche;《American Chemical Society》;全文 *
Sebastoan bocker.fragmentation trees reloaded.《Journal of Cheminformatics》.2016,正文,附图3. *
Seven Golden Rules for heuristic filtering of molecular formulas obtained by accurate mass spectrometry;Tobias Kind;《BMC Bioinformatics》;全文 *
Towards de novo identification of metabolites by analyzing tandem mass spectra;Sebastian Böcker;《BIOINFORMATICS》;第5部分 *
基于分子式数据库策略的FM-searcher软件 在危害物非目标筛查分子式预测中的应用;雷 珊;《质谱学报》;全文 *
基于树结构的本体概念相似度计算方法;徐英卓;《计 算 机 系 统 应 用》;全文 *

Also Published As

Publication number Publication date
CN113758989A (zh) 2021-12-07

Similar Documents

Publication Publication Date Title
US9312110B2 (en) System and method for grouping precursor and fragment ions using selected ion chromatograms
EP2836958B1 (en) Method for classification of a sample on the basis of spectral data and corresponding data storage medium and system
US8884218B2 (en) Method and systems for mass spectrometry for identification and structural analysis of unknown substance
US20140297201A1 (en) Computer-assisted structure identification
CN107729721B (zh) 一种代谢物鉴定及紊乱通路分析方法
US20070095757A1 (en) Methods and systems for the annotation of biomolecule patterns in chromatography/mass-spectrometry analysis
US20140274751A1 (en) Chemical identification using a chromatography retention index
CN108398416A (zh) 一种基于激光拉曼光谱的混合物成分测定方法
Moorthy et al. A new library-search algorithm for mixture analysis using DART-MS
CN104820011B (zh) 一种蛋白质翻译后修饰定位的方法
US10041915B2 (en) Mass spectrometry (MS) identification algorithm
CN113758989B (zh) 基于碎片树的现场质谱目标物识别以及衍生物预测方法
Pleil et al. Beyond monoisotopic accurate mass spectrometry: ancillary techniques for identifying unknown features in non-targeted discovery analysis
EP4078600A1 (en) Method and system for the identification of compounds in complex biological or environmental samples
CN117169387A (zh) 水中污染物的非靶向分析方法
CN118176540A (zh) 用于未知化合物检测和识别的化学峰寻找器模型
Kearsley et al. Similarity Measures of Mass Spectra in Hilbert Spaces
EP2541585A1 (en) Computer-assisted structure identification
Zhang et al. Selection of neutral losses and characteristic ions for mass spectral classifier
LaMarche Methods for comparing metaproteomic data in the absence of metagenomic information
Wang et al. GPA: An algorithm for LC/MS based glycan profile annotation
Lebedev et al. DETECTION OF ISOTOPIC PEAK SERIES IN LOW-RESOLUTION MASS SPECTRA USING CLUSTERING ALGORITHM AND CHI-SQUARE TEST
Timm et al. Peak intensity prediction for pmf mass spectra using support vector regression
CN117999605A (zh) 谱比较
CN113744814A (zh) 基于贝叶斯后验概率模型的质谱数据搜库方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant