CN113744814A - 基于贝叶斯后验概率模型的质谱数据搜库方法及系统 - Google Patents

基于贝叶斯后验概率模型的质谱数据搜库方法及系统 Download PDF

Info

Publication number
CN113744814A
CN113744814A CN202110831136.7A CN202110831136A CN113744814A CN 113744814 A CN113744814 A CN 113744814A CN 202110831136 A CN202110831136 A CN 202110831136A CN 113744814 A CN113744814 A CN 113744814A
Authority
CN
China
Prior art keywords
probability
database
mass
molecular formula
molecular
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110831136.7A
Other languages
English (en)
Other versions
CN113744814B (zh
Inventor
何庆瑜
潘全威
张鹏伟
洪玲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Macau
Jinan University
Original Assignee
University of Macau
Jinan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Macau, Jinan University filed Critical University of Macau
Priority to CN202110831136.7A priority Critical patent/CN113744814B/zh
Publication of CN113744814A publication Critical patent/CN113744814A/zh
Application granted granted Critical
Publication of CN113744814B publication Critical patent/CN113744814B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/90Programming languages; Computing architectures; Database systems; Data warehousing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/40Searching chemical structures or physicochemical data
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

本发明公开了基于贝叶斯后验概率模型的质谱数据库搜索方法,包括以下步骤:测量标准物质的分子质量,得到测量误差,进而计算其标准差;构建化学分子式数据库;以该数据库中各分子式的分子质量为均值,以测量误差的标准差为标准差,建立正态分布函数;在设定的数据库搜索误差范围内计算质谱测得质量数的上限和下限;设定先验概率并计算;设定该分子式在数据库中的频率为第一频率,根据先验概率和第一频率计算出第一概率;根据先验概率、第一频率和第一概率,计算所测物质的分子式是数据库中所收录某个分子式的后验概率,得到搜索结果;本发明考虑仪器性能对搜索结果的影响,同时又对搜索结果从概率角度进行可能性分析,解决现有搜索方式的缺点。

Description

基于贝叶斯后验概率模型的质谱数据搜库方法及系统
技术领域
本发明涉及质谱技术、分析化学的研究领域,特别涉及一种基于贝叶斯后验概率模型的质谱数据搜库方法及系统。
背景技术
相对分子质量及其对应的化学分子式是对物质定性的重要信息。质谱技术可通过检测物质带电后的质荷比来获得物质的相对分子质量,然后通过相对分子质量来获得物质的化学分子式。质谱技术测定物质的分子质量后,可以通过检索收录了物质的分子量及分子式的数据库来快速鉴定所测物质的分子式,也可以通过计算的方式计算出可能的分子式(CN103792275A)。传统的数据库搜索过程需要经过以下步骤:1.设定一个质量误差范围(单位:ppm或mDa),2.在此误差范围内将质谱测得的质量数与数据库中的质量数进行匹配,3.数据库返回匹配到的候选分子式及其他信息。4.对候选分子式进行筛选。在实际应用中,传统的方法有两大缺陷。一方面,对数据库返回的候选分子式进一步进行筛选具有挑战性,因为现有的数据库搜索方法不能告诉我们哪个候选分子式的可能性更高,从而无法有效从候选分子式中选择正确的分子式。另一方面,误差范围的选择很关键,对同一数据库,过大的误差范围会导致较多的候选分子式从数据库中返回,而当设定的误差范围小于仪器的测量误差时会导致没有搜索结果,造成假阴性的鉴定结果。因此,在进行数据库搜索时必须设定合理的误差范围来与数据库中的质量数进行匹配。从根本上讲,误差范围的设定需要与仪器的测量误差(仪器性能)相关。而现有的数据库搜索过程中误差范围的选择没有充分考虑到仪器性能这一因素,其设定往往依靠操作者的经验,有很大的主观性。
发明内容
本发明的主要目的在于克服现有技术的缺点与不足,提供一种基于贝叶斯后验概率模型的质谱数据搜库方法及系统,该方法考虑到了仪器性能对搜索结果的影响这一因素,同时又能对搜索结果从概率角度进行可能性的分析。因此,可以解决现有的通过数据库搜索方式鉴定物质分子式时的缺点,对提高鉴定的准确度和鉴定效率有帮助。
本发明的第一目的在于提供一种基于贝叶斯后验概率模型的质谱数据搜库方法;
本发明的第二目的在于提供一种基于贝叶斯后验概率模型的质谱数据搜库系统;
本发明的第一目的通过以下的技术方案实现:
基于贝叶斯后验概率模型的质谱数据搜库方法,包括以下步骤:
根据标准物质的信息,测量标准物质的分子质量,得到仪器的测量误差,进而计算出测量误差的标准差;
构建化学分子式数据库,同时包含各分子式的分子质量和各分子式出现的频率;
以化学分子式数据库中各分子式的分子质量为均值,以测量误差的标准差为标准差,建立正态分布函数;
质谱检测物质得到质量数,在设定的数据库搜索误差范围内计算质谱测得质量数的上限和下限;
设定的数据库搜索误差范围内某分子式是质谱所测物质的分子式的概率为先验概率并计算;
设定该分子式在数据库中的频率为第一频率,根据先验概率和第一频率,利用全概率公式计算出第一概率,所述第一概率为数据库整体中能检测到所测物质的概率;
根据先验概率、第一频率和第一概率,计算所测物质的分子式是数据库中所收录某个分子式的后验概率,得到搜索结果。
进一步地,所述测量误差的标准差通过测试获得或由仪器制造商提供。
进一步地,所述测量误差的标准差通过测量若干个标准物质或若干次测量某标准物质的分子质量,得出一系列测量误差记作μ1,μ2……μi,然后计算出仪器测量误差的标准差σ。
进一步地,所述化学分子式数据库通过公开的化学物质数据库获得,所述化学分子式数据库包括以下内容:化学分子式、单一同位素分子质量、各分子式出现的频率和分子式数总数;所述化学分子式数据库各分子式出现的频率由统计现有分子式得出或是人为设定值。
进一步地,所述正态分布函数,具体如下:
Figure BDA0003175501020000021
其中,π为常数圆周率,σ为质谱仪测量误差的标准差,mi为数据库中某分子式的单一同位素分子质量,m为分子质量变量。
进一步地,所述在设定的数据库搜索误差范围内计算质谱测得的分子质量m0的搜索上限和下限,具体为:所述质谱检测物质得到质量数m0,是质谱测得的带电分子的质量或由带电分子质量计算得出的中性分子质量;若误差单位为相对质量误差ppm,且设定a ppm的误差范围,则其上限计算方式为m1=m0+am010-6,下限计算方式为m1=m0-xm010-6;若误差单位为绝对质量mDa,且设定a mDa的误差范围,则其上限计算方式为m1=m0+a10-3,下限计算方式为m1=m0-a10-3
进一步地,所述计算先验概率,具体如下:
在设定的数据库搜索误差范围内,通过正态分布函数计算出理论上数据库中某分子式是质谱所测物质的分子式的概率,记作P(w/M),计算方式如下:
Figure BDA0003175501020000031
Figure BDA0003175501020000032
P(w/Mi)=P2-P1,(4)
其中,P1为上限概率,P2为下限概率,m1为在设定的搜索误差范围内计算出质谱测得的质量数的上限,m2为在设定的搜索误差范围内计算出质谱测得质量数的下限,mi为数据库收录某分子式的单一同位素分子质量,σ为质谱仪测量误差的标准差。
进一步地,所述根据先验概率和第一频率,利用全概率公式计算出第一概率,具体为:
数据库中某个分子式可能是所测物质的分子式的概率是先验概率P(w/Mi)与其在数据库中第一频率p(Mi)的乘积,记作P(w/Mi)*P(Mi);利用全概率公式计算出数据库整体中能搜索到所测物质的第一概率P(w):
Figure BDA0003175501020000033
进一步地,所述计算所测物质的分子式是数据库中所收录某个分子式的后验概率,具体计算如下:
Figure BDA0003175501020000034
其中,p(w)为第一概率,p(wMi)为先验概率,p(Mi)为第一频率。
本发明的第二目的通过以下技术方案实现:
基于贝叶斯后验概率模型的质谱数据搜库系统,包括:
标准物质分子质量测量模块,用于测量标准物质的分子质量,得到测量误差,进而计算出测量误差的标准差;
测量误差计算模块,用于计算出测量误差的标准差;
化学分子式数据库构建模块,用于构建化学分子式数据库;
正态分布函数建立模块,用于以化学分子式数据库中各分子式的分子质量为均值,以测量误差的标准差为标准差,建立正态分布函数;
质谱测得质量数计算模块,用于在设定的数据库搜索误差范围内计算质谱测得质量数的上限和下限;
先验概率计算模块,用于计算先验概率,所述先验概率为设定的数据库搜索误差范围内某分子式是质谱测物质的分子式的概率;
第一概率计算模块,用于根据先验概率和第一频率计算第一概率,所述第一频率为该分子式在数据库中的频率,所述第一概率为数据库整体中能检测到所测物质的概率;
后验概率计算模块,用于计算根据先验概率、第一频率、第一概率计算后验概率,所述后验概率为所测物质的分子式是数据库中所收录某个分子式概率;
搜索结果输出模块,用于输出搜索结果。
本发明与现有技术相比,具有如下优点和有益效果:
本发明通过设置基于贝叶斯后验概率模型的质谱数据搜库方法,可以计算出搜索结果中每一个候选分子式的可能性(概率),可以根据可能性的高低对候选分子式进行取舍,本方法在搜索过程中还引入了质谱仪测量误差标准差这一参数,使搜索结果更准确。
附图说明
图1是本发明所述基于贝叶斯后验概率模型的质谱数据搜库方法的流程图。
图2是本发明所述实施例1中质谱数据搜库方法流程框图;
图3是本发明所述实施例2中基于贝叶斯后验概率模型的质谱数据搜库系统结构框图。
具体实施方式
下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
实施例1:
基于贝叶斯后验概率模型的质谱数据搜库方法,如图1所示,包括以下步骤:
根据标准物质的信息,测量标准物质的分子质量,得到测量误差,进而计算出测量误差的标准差;
构建化学分子式数据库;
以化学分子式数据库中各分子式的分子质量为均值,以测量误差的标准差为标准差,建立正态分布函数;
在设定的数据库搜索误差范围内计算质谱测得质量数的上限和下限;
设定的数据库搜索误差范围内某分子式是质谱测物质的分子式的概率为先验概率并计算;
设定该分子式在数据库中的频率为第一频率,根据先验概率和第一频率,利用全概率公式计算出第一概率,所述第一概率为数据库整体中能检测到所测物质的概率;
根据先验概率、第一频率和第一概率,计算所测物质的分子式是数据库中所收录某个分子式的后验概率,得到搜索结果。
流程框图如图2所示,具体如下:
通过对多个标准物质的测量,获得了实验室某质谱仪器测量误差的分布,并计算出测量误差的标准差为σ=0.7ppm,运用该台仪器我们对实验样本1μg/L的硫酸睾酮(C19H28O5S)进行分子质量检测,三次结果的平均值为368.16859;
从网上下载2019版HMDB数据库,并对数据库中各物质的信息进行整理,统计各分子式在数据库中的出现次数fi,提取其中的化学分子式及单一同位素分子质量信息。然后,去除重复的分子式及分子质量,获得13432个不同的分子式,计算每个分子式在数据库中的频率p(w)=fi/13432。
在常用的10ppm的质量误差范围内进行数据库搜索。先计算测得的质量数368.16859在10ppm范围内的上限和下限,记作m1和m2。经计算m1=368.1649083m2=368.1722717;
以数据库中每个分子式的分子质量mi为均值,仪器测量误差的标准差0.7ppm为标准差,生成13432个正态分布函数。函数表达式如下:
Figure BDA0003175501020000051
其中,π为常数圆周率,σ为质谱仪测量误差的标准差,mi为各分子式的分子质量,m为变量;
根据以上公式计算出所测质量是数据库中各分子式的可能性,记作先验概率
Figure BDA0003175501020000061
利用全概率公式求出数据库整体能匹配到到所测物质的概率P(w)。即,本数据库中1342个先验概率与似然概率乘积的和。
Figure BDA0003175501020000062
最后由贝叶斯定理求得所测物质的分子式是数据库中所收录的某个分子式的后验概率
Figure BDA0003175501020000063
经过计算,有2个候选分子式的概率大于0,而数据库中其他分子式的概率均为0。根据可能性大小排序,本方法可以从候选分子式中正确的筛选出所测物质的分子式为C19H28O5S(75%的可能性,表1)。而利用传统的数据库搜索方法,在常用的10 ppm误差范围内,也匹配到两个分子式,但无法根据质量误差的大小无法做出正确的选择(表2)。
表1本方法可以计算出可能性最高的结果为C19H28O5S
Figure BDA0003175501020000064
表2传统方法搜索结果最佳匹配为C15H28O10
Figure BDA0003175501020000065
实施例2:
基于贝叶斯后验概率模型的质谱数据搜库系统,如图3所示,包括:
标准物质分子质量测量模块,用于测量标准物质的分子质量,得到测量误差,进而计算出测量误差的标准差;
测量误差计算模块,用于计算出测量误差的标准差;
化学分子式数据库构建模块,用于构建化学分子式数据库;
正态分布函数建立模块,用于以化学分子式数据库中各分子式的分子质量为均值,以测量误差的标准差为标准差,建立正态分布函数;
质谱测得质量数计算模块,用于在设定的数据库搜索误差范围内计算质谱测得质量数的上限和下限;
先验概率计算模块,用于计算先验概率,所述先验概率为设定的数据库搜索误差范围内某分子式是质谱测物质的分子式的概率;
第一概率计算模块,用于根据先验概率和第一频率计算第一概率,所述第一频率为该分子式在数据库中的频率,所述第一概率为数据库整体中能检测到所测物质的概率;
后验概率计算模块,用于计算根据先验概率、第一频率、第一概率计算后验概率,所述后验概率为所测物质的分子式是数据库中所收录某个分子式概率;
搜索结果输出模块,用于输出搜索结果。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

Claims (10)

1.基于贝叶斯后验概率模型的质谱数据搜库方法,其特征在于,包括以下步骤:
根据标准物质的信息,测量标准物质的分子质量,得到仪器的测量误差,进而计算出测量误差的标准差;
构建化学分子式数据库,同时包含各分子式的分子质量和各分子式出现的频率;
以化学分子式数据库中各分子式的分子质量为均值,以测量误差的标准差为标准差,建立正态分布函数;
质谱检测物质得到质量数,在设定的数据库搜索误差范围内计算质谱测得质量数的上限和下限;
设定的数据库搜索误差范围内某分子式是质谱所测物质的分子式的概率为先验概率并计算;
设定该分子式在数据库中的频率为第一频率,根据先验概率和第一频率,利用全概率公式计算出第一概率,所述第一概率为数据库整体中能检测到所测物质的概率;
根据先验概率、第一频率和第一概率,计算所测物质的分子式是数据库中所收录某个分子式的后验概率,得到搜索结果。
2.根据权利要求1所述的基于贝叶斯后验概率模型的质谱数据搜库方法,其特征在于,所述测量误差的标准差通过测试获得或由仪器制造商提供。
3.根据权利要求1所述的基于贝叶斯后验概率模型的质谱数据搜库方法,其特征在于,所述测量误差的标准差通过测量若干个标准物质或若干次测量某标准物质的分子质量,得出一系列测量误差记作μ1,μ2……μi,然后计算出仪器测量误差的标准差σ。
4.根据权利要求1所述的基于贝叶斯后验概率模型的质谱数据搜库方法,其特征在于,所述化学分子式数据库通过公开的化学物质数据库获得,所述化学分子式数据库包括以下内容:化学分子式、单一同位素分子质量、各分子式出现的频率和分子式数总数;所述化学分子式数据库各分子式出现的频率由统计现有分子式得出或是人为设定值。
5.根据权利要求1所述的基于贝叶斯后验概率模型的质谱数据搜库方法,其特征在于,所述正态分布函数,具体如下:
Figure FDA0003175501010000011
其中,π为常数圆周率,σ为质谱仪测量误差的标准差,mi为数据库中某分子式的单一同位素分子质量,m为分子质量变量。
6.根据权利要求1所述的基于贝叶斯后验概率模型的质谱数据搜库方法,其特征在于,所述在设定的数据库搜索误差范围内计算质谱测得的分子质量m0的搜索上限和下限,具体为:所述质谱检测物质得到质量数m0,是质谱测得的带电分子的质量或由带电分子质量计算得出的中性分子质量;若误差单位为相对质量误差ppm,且设定a ppm的误差范围,则其上限计算方式为m1=m0+am010-6,下限计算方式为m1=m0-xm010-6;若误差单位为绝对质量mDa,且设定a mDa的误差范围,则其上限计算方式为m1=m0+a10-3,下限计算方式为m1=m0-a10-3
7.根据权利要求1所述的基于贝叶斯后验概率模型的质谱数据搜库方法,其特征在于,所述计算先验概率,具体如下:
在设定的数据库搜索误差范围内,通过正态分布函数计算出理论上数据库中某分子式是质谱所测物质的分子式的概率,记作P(w/M),计算方式如下:
Figure FDA0003175501010000021
Figure FDA0003175501010000022
P(w/Mi)=P2-P1, (4)
其中,P1为上限概率,P2为下限概率,m1为在设定的搜索误差范围内计算出质谱测得的质量数的上限,m2为在设定的搜索误差范围内计算出质谱测得质量数的下限,mi为数据库收录某分子式的单一同位素分子质量,σ为质谱仪测量误差的标准差。
8.根据权利要求7所述的基于贝叶斯后验概率模型的质谱数据搜库方法,其特征在于,所述根据先验概率和第一频率,利用全概率公式计算出第一概率,具体为:
数据库中某个分子式可能是所测物质的分子式的概率是先验概率P(w/Mi)与其在数据库中第一频率p(Mi)的乘积,记作P(w/Mi)*P(Mi);利用全概率公式计算出数据库整体中能搜索到所测物质的第一概率P(w):
Figure FDA0003175501010000023
9.根据权利要求8所述的基于贝叶斯后验概率模型的质谱数据搜库方法,其特征在于,所述计算所测物质的分子式是数据库中所收录某个分子式的后验概率,具体计算如下:
Figure FDA0003175501010000031
其中,p(w)为第一概率,p(w|Mi)为先验概率,p(Mi)为第一频率。
10.基于贝叶斯后验概率模型的质谱数据搜库系统,其特征在于,包括:
标准物质分子质量测量模块,用于测量标准物质的分子质量,得到测量误差,进而计算出测量误差的标准差;
测量误差计算模块,用于计算出测量误差的标准差;
化学分子式数据库构建模块,用于构建化学分子式数据库;
正态分布函数建立模块,用于以化学分子式数据库中各分子式的分子质量为均值,以测量误差的标准差为标准差,建立正态分布函数;
质谱测得质量数计算模块,用于在设定的数据库搜索误差范围内计算质谱测得质量数的上限和下限;
先验概率计算模块,用于计算先验概率,所述先验概率为设定的数据库搜索误差范围内某分子式是质谱测物质的分子式的概率;
第一概率计算模块,用于根据先验概率和第一频率计算第一概率,所述第一频率为该分子式在数据库中的频率,所述第一概率为数据库整体中能检测到所测物质的概率;
后验概率计算模块,用于计算根据先验概率、第一频率、第一概率计算后验概率,所述后验概率为所测物质的分子式是数据库中所收录某个分子式概率;
搜索结果输出模块,用于输出搜索结果。
CN202110831136.7A 2021-07-22 2021-07-22 基于贝叶斯后验概率模型的质谱数据搜库方法及系统 Active CN113744814B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110831136.7A CN113744814B (zh) 2021-07-22 2021-07-22 基于贝叶斯后验概率模型的质谱数据搜库方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110831136.7A CN113744814B (zh) 2021-07-22 2021-07-22 基于贝叶斯后验概率模型的质谱数据搜库方法及系统

Publications (2)

Publication Number Publication Date
CN113744814A true CN113744814A (zh) 2021-12-03
CN113744814B CN113744814B (zh) 2023-07-07

Family

ID=78728964

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110831136.7A Active CN113744814B (zh) 2021-07-22 2021-07-22 基于贝叶斯后验概率模型的质谱数据搜库方法及系统

Country Status (1)

Country Link
CN (1) CN113744814B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102495127A (zh) * 2011-11-11 2012-06-13 暨南大学 一种基于概率统计模型的蛋白质二级质谱鉴定方法
CN103792275A (zh) * 2013-09-24 2014-05-14 中国科学院成都生物研究所 一种高分辨质谱准确分子式预测方法
CN104765984A (zh) * 2015-03-20 2015-07-08 同济大学 一种生物质谱数据库快速建立与搜索的方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102495127A (zh) * 2011-11-11 2012-06-13 暨南大学 一种基于概率统计模型的蛋白质二级质谱鉴定方法
CN103792275A (zh) * 2013-09-24 2014-05-14 中国科学院成都生物研究所 一种高分辨质谱准确分子式预测方法
CN104765984A (zh) * 2015-03-20 2015-07-08 同济大学 一种生物质谱数据库快速建立与搜索的方法

Also Published As

Publication number Publication date
CN113744814B (zh) 2023-07-07

Similar Documents

Publication Publication Date Title
US5121338A (en) Method for detecting subpopulations in spectral analysis
CA2501003C (en) Sample analysis to provide characterization data
CN107729721B (zh) 一种代谢物鉴定及紊乱通路分析方法
JP6089345B2 (ja) 時および/または空間系列ファイルの多成分回帰/多成分分析
US20140297201A1 (en) Computer-assisted structure identification
CN108398416A (zh) 一种基于激光拉曼光谱的混合物成分测定方法
US8543625B2 (en) Methods and systems for analysis of multi-sample, two-dimensional data
CN111551644A (zh) 基于离子迁移谱技术对进口香米原产地溯源的方法
GB2561879A (en) Spectroscopic analysis
JP4953175B2 (ja) クロマトグラフ/質量分析装置における定量精度向上方法
CN114283877A (zh) 一种建立代谢物模型及其代谢组学数据库的方法
CN111863135B (zh) 一种假阳性结构变异过滤方法、存储介质及计算设备
CN113484400B (zh) 基于机器学习的质谱图分子式计算方法
CN113744814B (zh) 基于贝叶斯后验概率模型的质谱数据搜库方法及系统
CN112289386A (zh) 确定化合物分子量的方法及装置
CN111858570A (zh) 一种ccs数据的标准化方法、数据库构建方法以及数据库系统
US4987548A (en) Analyzer of partial molecular structures
WO2021004355A1 (zh) 构建诱饵库、构建目标-诱饵库、代谢组fdr鉴定的方法及装置
CN114783539A (zh) 一种基于光谱聚类的中药成分分析方法及系统
JP2004219140A (ja) 質量スペクトルの解析方法およびコンピュータプログラム
CN114694771A (zh) 样品分类方法、分类器的训练方法、设备和介质
Lias Numeric databases for chemical analysis
CN117907512B (zh) 基于固相萃取流速与内标物选型关系构建的污水检测方法
US11990327B2 (en) Method, system and program for processing mass spectrometry data
US20230288384A1 (en) Method for determining small molecule components of a complex mixture, and associated apparatus and computer program product

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant