CN106662551A - 质谱分析数据处理装置 - Google Patents

质谱分析数据处理装置 Download PDF

Info

Publication number
CN106662551A
CN106662551A CN201580035341.5A CN201580035341A CN106662551A CN 106662551 A CN106662551 A CN 106662551A CN 201580035341 A CN201580035341 A CN 201580035341A CN 106662551 A CN106662551 A CN 106662551A
Authority
CN
China
Prior art keywords
compound
mass spectrum
database
candidate
quasi
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201580035341.5A
Other languages
English (en)
Other versions
CN106662551B (zh
Inventor
荫山哲也
梅村佳克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shimadzu Corp
Original Assignee
Shimadzu Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shimadzu Corp filed Critical Shimadzu Corp
Publication of CN106662551A publication Critical patent/CN106662551A/zh
Application granted granted Critical
Publication of CN106662551B publication Critical patent/CN106662551B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/20Identification of molecular entities, parts thereof or of chemical compositions
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8675Evaluation, i.e. decoding of the signal into analytical information
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N27/00Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
    • G01N27/62Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating the ionisation of gases, e.g. aerosols; by investigating electric discharges, e.g. emission of cathode
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/62Detectors specially adapted therefor
    • G01N30/72Mass spectrometers
    • G01N30/7233Mass spectrometers interfaced to liquid or supercritical fluid chromatograph
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01JELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
    • H01J49/00Particle spectrometers or separator tubes
    • H01J49/004Combinations of spectrometers, tandem spectrometers, e.g. MS/MS, MSn
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01JELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
    • H01J49/00Particle spectrometers or separator tubes
    • H01J49/26Mass spectrometers or separator tubes
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N2030/022Column chromatography characterised by the kind of separation mechanism
    • G01N2030/027Liquid chromatography

Landscapes

  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Electrochemistry (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

本发明可对化合物数据库(33)中所收录的质谱上的每一峰设定能够选择是否用于数据库检索的非使用指示信息作为属性信息。例如,对实测时混入的噪声峰或者来源于夹杂物的峰等预先设定好非使用指示信息。在化合物鉴定时,当从数据库(33)中与质谱一起读出非使用指示信息以进行数据库检索时,无用信息删除部(341)将设定有非使用指示信息的峰删除,并将所得质谱送至化合物候选抽取部(342)和评分部(343)。因此,设定有非使用指示信息的峰例如在计算化合物候选的得分时被忽略掉而计算出精度更高的得分,从而可改善鉴定精度。

Description

质谱分析数据处理装置
技术领域
本发明涉及一种对由质谱分析装置采集到的数据进行解析处理的数据处理装置,更详细而言,涉及一种用以利用收录有与大量已知化合物相对应的质谱的数据库来鉴定试样中的未知化合物或者推断其结构的数据处理装置。
背景技术
作为利用气相色谱质谱分析装置(GC-MS)或液相色谱质谱分析装置(LC-MS)来鉴定试样中的未知化合物的方法之一,使用收录有与大量已知化合物相对应的质谱(包括MSn谱,其中,n为2以上的整数)的数据库(有时也称为“质谱库”)来进行数据库检索的方法为人们所熟知。作为这种收录有质谱的数据库,例如,从美国国家标准技术研究院(NIST)归纳整理出的所谓的NIST数据库或者John Wiley&Sons出版社归纳整理出的所谓的Wiley数据库这样的网罗性地收录有普通化合物的质谱的通用性数据库到将对象缩小为农药用、药物用、代谢物用等特定领域的或者特定目的的化合物的数据库,有各种数据库(参考专利文献1等)。
这种质谱的数据库通常是根据通过使用实际设备来实际测定目标化合物的标准品而获得的数据来加以制作。通常,在数据采集时,各种因素所导致的噪声等不需要的要素会包含在质谱中。例举具体例的话,例如在LC-MS中,存在来源于LC中所使用的流动相中所混入的夹杂物的离子作为不需要的要素出现在质谱中的情况。此外,还存在来源于从色谱柱中析出的夹杂物的离子作为不需要的要素出现在质谱中的情况。如下情况在分析的可靠性上来讲是不佳:不需要的要素有可能以如此方式包含在质谱中,但还是对所获得的质谱随意地实施某些加工而收录至数据库。因此,即便是上述那样的包含不需要的要素的质谱,通常而言,这样的质谱也是直接收录至数据库。
另外,基于质谱的数据库检索有各种算法,通常,进行如下两阶段的处理的情况较为多见:从数据库中抽取谱图与针对未知化合物而获得的质谱在一定程度上类似的多种化合物作为化合物候选,其后,计算将谱图的一致性严格地加以数值化而得的得分,按照该得分从高到低的顺序对化合物候选进行排序并展示给用户。在进行这种数据处理时,若数据库中的质谱包含不需要的要素,则容易产生假阳性或假阴性,从而导致检索精确度降低。
此外,在与主要骨架相同的类似的不同化合物相对应的质谱中,会出现来源于其相同的主要骨架的相通的谱图,因此质谱本身非常类似。若数据库中收录有大量这种类似化合物,则在其中一种化合物为未知化合物时,质谱类似的大量化合物会作为化合物候选而被抽取出来。与如此抽取出来的多个化合物候选相对应的质谱的谱图因相通部分较多,因此,即便计算得分,也难以产生有意义差别,从而导致即便对得分进行比较也难以判定哪一种是正解的化合物。此外,为正解的化合物的排位较高的可能性也会降低。另外,在利用质谱的化合物鉴定中,虽然测定人员最终大多会目视确认质谱的一致性,但若是抽取出来的化合物候选的数量过多的话,则测定人员的确认作业负担极大,也容易发生漏查等作业失误。
现有技术文献
专利文献
专利文献1:日本专利特开2005-83952号公报
发明内容
发明要解决的问题
本发明是为了解决上述问题而成,其目的在于提供如下质谱分析数据处理装置:即便数据库中所收录的质谱包含噪声等不需要的要素,也能够提高通过数据库检索而进行的化合物鉴定或结构推断的精度。
此外,本发明的另一目的在于提供如下质谱分析数据处理装置:即便在数据库中收录有主要骨架相通的类似的大量化合物且其中一种化合物为目标化合物这样的情况下,也可在数据库检索中排除类似化合物的影响而以高准确度鉴定目标化合物。
解决问题的技术手段
为了解决上述问题而完成的本发明的第1方式为一种质谱分析数据处理装置,其将通过对未知化合物进行质谱分析而获得质谱与收录有已知化合物的质谱的数据库进行对照,由此推断该未知化合物的物质或者推断结构,该质谱分析数据处理装置的特征在于,包括:
a)数据库,其能够将与质谱上出现的离子峰的至少一部分相关联、并表示不在后述的数据库检索中的任一阶段使用这一内容的非使用指示信息设定为属性信息,且收录有已知化合物的质谱;以及
b)检索执行部,在使用所述数据库来实施对针对未知化合物而获得的质谱的数据库检索时,其使用将作为所述属性信息而附有所述非使用指示信息的离子峰剔除之后的质谱来进行数据库检索。
此处所说的“质谱分析”包括包含对离子的裂解操作的MS/MS分析、n为3以上的MSn分析,“质谱”包括MS/MS谱、MSn谱。
在本发明的第1方式的质谱分析数据处理装置中,数据库中所收录的质谱通常为经质心处理而得的线状谱。例如,在电子离子化法下的离子源中,在离子化时,分子离子容易发生裂解而生成各种碎片离子,因此在质谱中,除了来源于分子离子的峰以外,还会出现各种碎片离子峰。此外,由于许多元素有天然同位素,因此,分子离子峰、碎片离子峰除了伴有单一同位素质谱峰以外,还伴有1个或多个同位素峰。即,在质谱上,在多个不同质荷比m/z位置出现离子峰。在本发明的第1方式的质谱分析数据处理装置中的数据库中,例如,可针对质谱上的每一离子峰,换句话说,可针对每一质荷比而设定非使用指示信息作为属性信息。
非使用指示信息可在将该质谱收录至数据库时进行设定,或者,也可以为能够在将质谱收录至数据库之后设定非使用指示信息。此外,也可以为能够对数据库中已收录的质谱新设定非使用指示信息或者变更其设定,但为了避免错误地或恶意地故意变更非使用指示信息,较理想为实施有安全对策。
作为一例,在将通过对已知化合物进行实测而获得的质谱收录至数据库时,在存在显然不应该由该化合物生成的离子峰也就是推断为噪声的峰的情况下,对该离子峰设定好非使用指示信息即可。
在想要鉴定试样中的未知化合物的情况下,当给出通过对该未知化合物进行质谱分析而获得的质谱时,检索执行部实施针对该质谱的数据库检索。这时,针对数据库中所收录的每一质谱而确认属性信息,在某一质谱中存在附有非使用指示信息的离子峰的情况下,将剔除该离子峰之后的质谱作为针对未知化合物的质谱的对照对象。由此,如上所述,在噪声峰附有非使用指示信息的情况下,该噪声峰不会被反映至谱图的比较等,从而可避免因存在噪声峰而导致检索精度降低。
作为本发明的质谱分析数据处理装置的一优选实施方式,宜设为如下构成:
上述检索执行部包括候选抽取部和排序部,所述候选抽取部对质谱的谱图进行比较来抽取成为候选的多个化合物,所述排序部根据质谱的类似性对抽取出来的多个候选化合物进行化合物候选的排序,
上述非使用指示信息包括第1非使用指示信息和第2非使用指示信息,所述第1非使用指示信息表示在由上述候选抽取部进行的化合物的抽取以及由所述排序部进行的化合物候选的排序中均不使用,所述第2非使用指示信息表示仅在由上述排序部进行的化合物候选的排序时不使用,
上述候选抽取部使用将附有第1非使用指示信息的离子峰剔除之后的质谱来抽取多个化合物候选,上述排序部使用将附有第1非使用指示信息和第2非使用指示信息中的至少任一方的离子峰剔除之后的质谱来对化合物候选进行排序。
在该构成中,由检索执行部进行的数据库检索的处理为2个阶段,即,通过谱图的比较来抽取多个化合物候选的阶段和计算例如表示这些化合物候选各自的类似性的得分并按照该得分来进行排序的阶段,并且,以区分在这两个阶段内都不使用的离子峰和在化合物候选抽取的阶段内使用但在排序的阶段内不使用的离子峰的方式分配两种非使用指示信息。因而,在由检索执行部进行的数据库检索处理中,可将数据库中的质谱上出现的特定的离子峰全部忽略,此外,还可实现如下数据库检索:在抽取多个化合物候选的阶段考虑数据库中的质谱上出现的特定的离子峰,但在进行排序的阶段忽略相同离子峰。
例如,在数据库中存在大量主要骨架相同的类似化合物且这样的化合物之一为鉴定对象即目标化合物的情况下,宜对与主要骨架相对应的离子峰附上第2非使用指示信息。在该情况下,由于在抽取多个化合物候选的阶段会考虑与主要骨架相对应的离子峰,因此主要骨架与目标化合物相同的大量类似化合物作为化合物候选被抽取出来。另一方面,在分别计算关于如此抽取出来的化合物候选的得分时,与同一主要骨架相对应的离子峰被忽略,因此除主要骨架以外的使各化合物具有特征的的离子峰的类似性、差异性得以较大程度地反映到得分中。
结果,即便存在大量类似化合物,其中为正解的化合物获得较高得分的可能性也较高,从而能够准确地获得为正解的化合物作为鉴定结果。此外,由于在排序的阶段能够准确地精简化合物候选,因此在测定人员目视确认质谱的一致性等的时候也可减轻测定人员的负担。此外,还能够减少测定人员的确认失误等的发生。
此外,为了解决上述问题而完成的本发明的第2方式为一种质谱分析数据处理装置,其用于通过数据库检索来推断未知化合物,该数据库检索使用收录有已知化合物的质谱的数据库,该质谱分析数据处理装置的特征在于,包括:
a)数据库,其能够将与质谱上出现的离子峰的至少一部分相关联、并在数据库检索中加以优先对待的优先指示信息设定为属性信息,且收录有质谱;以及
b)检索处理部,其通过实施将未知化合物的质谱与所述数据库中的质谱进行对照的数据库检索来抽取有可能推测为目标的未知化合物的化合物候选,该检索处理部制作如下检索结果,即,将所述未知化合物的质谱中存在设定有所述优先指示信息的离子峰这一内容作为条件之一来抽取化合物候选,或者能够在通过不使用所述优先指示信息的数据库检索而抽取出来的化合物候选中,将所述未知化合物的质谱中存在设定有该优先指示信息的离子峰的化合物候选与其他化合物候选辨别开来。
在本发明的第2方式的质谱分析数据处理装置中,与上述第1方式中的非使用指示信息一样,例如可针对质谱上的每一离子峰也就是每一质荷比而设定优先指示信息作为属性信息之一。
在想要鉴定试样中的未知化合物的情况下,当给出通过对该未知化合物进行质谱分析而获得的质谱时,检索执行部例如实施针对该质谱的普通数据库检索,并抽取谱图的类似性较高的多个化合物候选。其后,确认与抽取出来的多个化合物候选相对应的质谱上是否存在设定有优先指示信息的离子峰,将设定有优先指示信息的离子峰不存在于未知化合物的质谱中的化合物候选剔除。或者,以能够在通过数据库检索抽取出来的多个化合物候选中,将设定有优先指示信息的离子峰存在于未知化合物的质谱中的化合物候选与其以外的化合物候选辨别开来的方式制作并显示检索结果,以此代替剔除操作。
因而,在存在大量主要骨架相同的类似的不同化合物的情况下,通过不对与这样的主要骨架相对应的离子峰而是对这以外的、与使各种化合物具有特征的部分结构相对应的离子峰设定好优先指示信息,能够将具有存在于未知化合物中的部分结构的、也就是为正解的可能性较高的化合物候选留作最终的化合物候选,或者以能够与其他化合物候选辨别开来的方式展示给测定人员。
在本发明的第2方式的质谱分析数据处理装置中,进而优选宜设为如下构成:
在上述数据库中,能够针对设定有上述优先指示信息的离子峰,将阈值信息与上述优先指示信息一起设定为属性信息,所述阈值信息用于判定该离子峰的信号强度相对于存在该离子峰的质谱上的特定峰的信号强度的强度比。
此处,所谓特定峰,设为质谱上的特定质荷比下的峰、或者表示最大强度而与质荷比无关的峰等即可。
并且,在该构成中,上述检索处理部宜将如下内容作为条件之一来抽取化合物候选:设定有上述优先指示信息的离子峰存在于上述未知化合物的质谱中;以及,上述离子峰的信号强度相对于该未知化合物的质谱上的上述特定峰的信号强度的强度比为阈值信息以上,所述阈值信息与上述优先指示信息一起被设定在该离子峰上。
根据该构成,即便在未知化合物的质谱中观测到设定有优先指示信息的离子峰的情况下,包含假想为其信号强度无意义的离子峰的化合物候选也会在实质上从该候选中被剔除。由此,可准确地精简化合物候选,使得测定人员易于确定正解的化合物。
发明的效果
根据本发明的第1及第2方式所涉及的质谱分析数据处理装置,一方面能够将通过实测而获得的质谱用于数据库,另一方面可提高通过使用该数据库的数据库检索而进行的化合物的鉴定或者结构解析的精度。
附图说明
图1为使用本发明所涉及的质谱分析数据处理装置的LC-MS系统的第1实施例的概略构成图。
图2为第1实施例的LC-MS系统中的化合物鉴定处理的一例的说明图。
图3为使用本发明所涉及的质谱分析数据处理装置的LC-MS系统的第2实施例的概略构成图。
图4为第2实施例的LC-MS系统中的化合物鉴定处理的一例的说明图。
具体实施方式
参照附图,对使用本发明所涉及的质谱分析数据处理装置的LC-MS系统的第1实施例进行说明。图1为本实施例的LC-MS系统的概略构成图,图2为本实施例的LC-MS系统中的化合物鉴定处理的一例的说明图。
本实施例的LC-MS系统包括液相色谱仪(LC)1、质谱分析部(MS)2以及数据处理部3。
虽未图示,但液相色谱仪1包括容纳有流动相的流动相容器、以一定流速供给流动相的泵、将规定量的液体试样注入至所供给的流动相中的注射器、对液体试样中所含的化合物进行分离的色谱柱等作为液相色谱仪的基本要素,将包含在时间上被分离后的各化合物的试样送至质谱分析部2。
虽然同样未图示,但质谱分析部2具有将试样中的化合物离子化的大气压离子源、输送所生成的离子的离子导向器、根据质荷比m/z来分离离子的四极滤质器、以及检测分离后的离子的离子检测器等,通过在四极滤质器中反复进行跨及规定质荷比范围的扫描测定,可反复采集该质荷比范围的质谱数据。
数据处理部3包括测定数据存储部31、质谱制作部32、化合物数据库33、数据库检索处理部34及属性信息设定部35作为功能块,数据库检索处理部34包括无用信息删除部341、化合物候选抽取部342、评分部343及排序部344。此外,在数据处理部3上连接有输入部4和显示部5,所述输入部4供测定人员操作以设定数据库检索时的检索条件等,所述显示部5显示检索条件、检索结果等。
再者,数据处理部3的功能的一部分或大部分能够设为通过在个人电脑上执行规定的数据处理程序来实现的构成。
在化合物数据库33中,针对大量化合物而以与化合物名、结构式、分子量等化合物信息331相关联的方式登记有质谱数据332。这与以往相同。此处,进而能够登记对应于质谱数据332的属性信息333。属性信息为如下信息。
例如,在如图2的(a)所示的以横轴为质荷比m/z、以纵轴为信号强度的质谱中,通常会出现多个峰,其中,既有来源于原本的目标化合物的峰,又包含来源于与目标化合物无关的夹杂物的峰、由夹杂物以外的各种因素所引起的噪声峰。优选质谱上不存在这种来源于夹杂物的峰、噪声峰,但通过实测而获得的质谱中出现这种不期望的峰这一情况是避免不了的。因此,在根据实测结果来制作数据库时,会登记包含这种不期望的峰的质谱。
此外,在通过实测而获得的质谱中,虽然有来源于目标化合物的峰,但也存在能够在鉴定该化合物时成为障碍的峰。例如,在主要骨架大致相同且一部分结构各不相同这样的类似化合物中的一种为目标化合物的情况下,来源于主要骨架的离子峰会以较高的信号强度出现在质谱中。然而,由于类似化合物同样会出现这样的离子峰,因此,不仅无益于目标化合物的鉴定,还会淡化来源于化合物特异性部分结构的峰的影响。
因此,在本实施例的LC-MS系统中,能够以使这种鉴定所不需要的峰或者在鉴定上反而成为障碍的峰不反映至检索结果的方式对质谱上出现的每一峰附加表示在数据库检索时不使用的也就是忽略的非使用指示信息。此处,该非使用指示信息有第1非使用指示信息和第2非使用指示信息两种。这一点将在后文叙述。
上述非使用指示信息能够由用户对已登记在化合物数据库33中的任意化合物的质谱数据332、或者对欲新登记至化合物数据库33的任意化合物的质谱数据332酌情加以设定。例如,当用户利用输入部4进行规定操作时,属性信息设定部35将由用户指定的化合物的质谱显示在显示部5的画面上。当用户通过利用输入部4的点击操作等在显示出来的质谱上指示不用于鉴定的峰时,属性信息设定部35识别所指示的峰的质荷比,并将该信息作为非使用指示信息而写入至化合物数据库33内的存储属性信息333的规定存储区域。
当然,若如此设定的非使用指示信息因操作失误或恶意而被重写时,则会降低分析的可靠性,因此,较理想为以只有具有比普通测定人员高的权限的负责人能够实施非使用指示信息的新的设定或变更的方式实施有安全对策。
接着,一边参照图2,一边对在本实施例的LC-MS系统中像上述那样在化合物数据库33中设定有非使用指示信息的状态下实施的特征性化合物鉴定处理进行说明。
测定人员通过输入部4在根据通过对目标试样的测定而采集到的数据来制作并显示在显示部5的画面上的色谱中指示推断为来源于欲鉴定的化合物的峰。于是,从测定数据存储部31中读出在所指示的峰的峰顶的时间而获得的数据,质谱制作部32根据该数据来制作质谱并送至数据库检索处理部34。数据库检索处理部34从化合物数据库33中搜索谱图与该给出的质谱(以下,称为“目标质谱”)类似的化合物,由此鉴定作为目标的未知化合物。
在数据库检索处理部34中,数据库检索是分为(I)由化合物候选抽取部342进行的具有类似谱图的化合物候选的粗略抽取、以及(II)由评分部343进行的针对各个化合物候选的表示谱图的详细类似性的得分的算出这两个阶段来进行,在候选排序部344中根据所算出的得分来进行最终的候选的精简、排序。上述第1非使用指示信息在(I)及(II)这两个阶段内被参考,上述第2非使用指示信息只在阶段(II)内被参考。
在抽取谱图与目标质谱类似的化合物时,化合物候选抽取部342依序读出化合物数据库33中所登记的与化合物相对应的质谱数据332,而这时,也会读出作为属性信息333加以存储的第1非使用指示信息。无用信息删除部341将所读出的质谱数据中设定有第1非使用指示信息的峰删除,化合物候选抽取部342判定峰删除处理后的质谱与目标质谱的谱图是否类似。
现在,针对化合物数据库33中所收录的如图2的(a)所示的质谱上的峰,设为标注有符号○的峰设定有第1非使用使用信息的标记、标注有符号△的峰设定有第2非使用使用信息的标记。在该情况下,在抽取化合物候选时,无用信息删除部341会将设定有第1非使用指示信息的峰删除,因此,为了判定谱图类似性而提供给化合物候选抽取部342的质谱变为图2的(b)所示的样子。即,在图2的(a)中设定有符号○的峰在谱图类似性的判定时被忽略。因而,只要对在用以登记至数据库的实测时意外出现的噪声峰等设定好第1非使用指示信息,即可实现与使用实质上不存在这样的噪声峰的质谱的情况相同的化合物候选抽取。
再者,虽然化合物候选抽取用的具体算法在此处不作特别限制,但为了以尽可能短的时间从登记有庞大数量的化合物的化合物数据库33中搜索化合物,也可为如下算法:只要信号强度在规定的阈值以上,则不论该信号强度的高低如何,只着眼于出现峰的质荷比的位置来判定类似性。
接着,评分部343针对抽取出来的各个化合物候选而计算得分,所述得分是将目标质谱与对应于这些化合物候选的质谱的谱图的类似程度定量化而得。在该得分计算时,将作为属性信息333而存储在化合物数据库33中的第1非使用指示信息及第2非使用指示信息都读出,无用信息删除部341将所读出的质谱数据中设定有第1非使用指示信息和第2非使用指示信息中的至少任一方的峰删除。继而,评分部343根据峰删除处理后的质谱与目标质谱的峰的位置以及信号强度的差等来算出得分。
在图2的例子中,在评分时,无用信息删除部341会将设定有第1非使用指示信息和第2非使用指示信息中的至少任一方的峰删除,因此,提供给评分部343的质谱变为图2的(c)所示的样子。即,在图2的(a)中设定有符号○的峰和设定有符号△的峰均在评分时被忽略。因而,只要对来源于对于与类似化合物的辨别无用的主要骨架的离子峰等设定好第2非使用指示信息,这样的峰的类似性便不会被反映至得分,从而使得来源于主要骨架以外的特异性部分结构的峰的类似性、差异性清楚地出现在得分中。结果,使得对应于特异性部分结构与目标化合物相同的化合物候选的得分较高。此外,只要像上述那样对噪声峰等设定好第1非使用指示信息,噪声峰便同样不会被反映至得分,因此得分的精度提高。
若以如此方式算出多个化合物候选各自的得分,则在存在得分极低的化合物候选的情况下,候选排序部344将其从列表中剔除。继而,将剩下的化合物候选按照得分从高到低的顺序进行排序,并与得分一起显示在显示部5的画面上作为鉴定结果。如此,在本实施例的LC-MS系统中,可对化合物数据库33中所登记的质谱的各峰设定非使用指示信息,通过在数据库检索时利用非使用指示信息来忽略一部分峰,可搜索可能性更高的化合物候选并以较高精度进行可能性的排序。
接着,参照附图,对使用本发明所涉及的质谱分析数据处理装置的LC-MS系统的第2实施例进行说明。图3为该第2实施例的LC-MS系统的概略构成图,图4为第2实施例的LC-MS系统中的化合物鉴定处理的一例的说明图。在图3中,对与图1所示的构成相同的构成要素标注有相同符号。
在该LC-MS系统中,与化合物数据库33中所存储的质谱数据332相对应的属性信息333包括优先指示信息和强度比阈值信息。此外,数据库检索处理部34包括优先离子确认部345及强度比运算部346。
与第1实施例中的非使用指示信息一样,优先指示信息能够由用户对已登记在化合物数据库33中的任意化合物的质谱数据332、或者对欲新登记至化合物数据库33的任意化合物的质谱数据332酌情加以设定。另一方面,强度比阈值信息是能够由用户对设定有优先指示信息的质谱上的峰酌情加以设定的数值信息。如后文所述,该强度比阈值信息表示用以判定作为目标的(也就是设定有优先指示信息的)峰相对于规定的基准强度的相对信号强度的阈值,具体而言,例如,将该质谱上的特定质荷比的峰的信号强度或者该质谱上观测到的最大强度定为上述基准强度即可。
接着,一边参照图4,一边对在本实施例的LC-MS系统中像上述那样在化合物数据库33中设定有优先指示信息及强度比阈值信息的状态下实施的特征性化合物鉴定处理进行说明。
与上述第1实施例一样,当测定人员通过输入部4在色谱上指示推断来源于欲鉴定的化合物的峰时,数据库检索处理部34从化合物数据库33中搜索谱图与目标质谱类似的化合物。在该数据库检索时,化合物候选抽取部342进行具有类似谱图的化合物候选的粗略抽取,接着,评分部343算出针对各个化合物候选的表示谱图的详细类似性的得分。此处,不同于第1实施例,由于未设定有非使用指示信息作为属性信息,因此化合物数据库33中所登记的质谱数据332上的所有峰都被用于数据库检索。
此处,为了简化说明,在评分部343中进行仅仅基于目标质谱上的峰的质荷比与化合物候选的质谱上的峰的质荷比的一致性的评分,忽略该峰的信号强度的类似性。如图4所示,在目标质谱中,在m/z=a、b、c这三个质荷比下观测到峰。评分部343在各化合物候选的质谱中确认在上述三个质荷比(实际上是将以各质荷比为中心的规定裕度估计在内的质荷比范围)下是否存在峰,在相同质荷比存在峰的情况下,得分每次加1分。现在,在A、B、C、D这四个化合物候选的质谱如图4所示的情况下,若根据峰的质荷比的一致性来求得分,则在化合物A、D中,质荷比一致的峰的个数为3,因此得分为“3”,在化合物B、C中,质荷比一致的峰的个数为2,因此得分为“2”。
优先离子确认部345以与该处理并行的方式或者在该处理之后确认在被加至得分的峰是否设定有优先指示信息。继而,若被加至得分的峰设定有优先指示信息,则对该化合物候选附加表示该情况的标记。在图4的例子中,被加至得分的峰设定有优先指示信息的是化合物A、C这两个。因此,对这两个化合物候选附加标记。在存在得分极低的化合物候选的情况下,候选排序部344将其从列表中剔除,将剩下的化合物候选按照得分从高到低的顺序进行排序,并与得分一起显示在显示部5的画面上作为鉴定结果。此时,对附有标记的化合物候选同时进行表示含有优先离子这一情况的显示。在图4的例1中,是显示“有优先离子”这一文本信息,但显示的形态并不限于此。
此外,由于还存在在得分的差较小时优先离子的有无更加重要这一情况,因此也可像图4中例2所示那样,即便得分较低,也将含有优先离子的化合物排列在排位中的上位。
如此,在数据库检索的结果中,含有设定有优先指示信息的离子的化合物可与不含设定有优先指示信息的离子的化合物辨别开来,并且,即便在某些情况下得分较低,也会被优先显示,也就是被显示在列表的上位。因此,例如在使目标化合物具有特征的离子或者对于与目标化合物以外的化合物进行区分较为有用的离子为已知的情况下,通过对该离子设定好优先指示信息,测定人员可轻易从检索结果中选择正解的化合物候选。
此外,在优先离子确认部345根据优先指示信息的设定的有无对化合物候选附加表示有优先指示信息的标记时,在与优先指示信息一起还设定有强度比阈值信息的情况下,强度比运算部346能够执行如下处理。即,强度比运算部346在该化合物候选的质谱中求出作为相对强度比的强度基准的峰的信号强度值和设定有优先指示信息的峰的信号强度值并计算强度比。继而,将该强度比与强度比阈值信息的阈值进行比较,若在该阈值以上,则判定优先指示信息有效。继而,仅对含有设定有判定为有效的优先指示信息的离子的化合物候选附加标记。由此,能够仅在不仅含有设定有优先指示信息的离子、该离子的信号强度还是可信赖的程度时,在检索结果中对化合物候选进行表示含有优先离子这一情况的显示。此外,也可不论强度比的判定结果如何均进行表示含有优先离子这一情况的显示,另外还进行表示强度比是否在强度比阈值信息的阈值以上的判定结果的显示。
根据上述说明,第1实施例的LC-MS系统中所使用的非使用指示信息和第2实施例的LC-MS系统中所使用的优先指示信息能够并用是明确的。即,将设定有非使用指示信息的离子峰剔除而执行数据库检索来抽取化合物候选,之后判定是否包含设定有优先指示信息的离子峰,并将其判定结果反映至检索结果的显示中即可。由此,可将结构与目标化合物类似的其他化合物从检索结果中剔除,并且,进而明确展示出检索结果中具有使目标化合物具有特征的部分结构的化合物候选。
再者,上述实施例是将本发明运用于LC-MS,但可以将本发明运用于LC-MS/MS、GC-MS、GC-MS/MS、进而不与LC或GC组合的单一质谱分析装置等利用化合物数据库中所登记的质谱来进行化合物鉴定的所有质谱分析装置。
此外,显然上述实施例都只是本发明的一例,因此,本发明并不限于上述变形例,在本发明的宗旨的范围适当进行变更、修正、追加也是包含在本申请的申请专利范围内。
符号说明
1 液相色谱仪
2 质谱分析部
3 数据处理部
31 测定数据存储部
32 质谱制作部
33 化合物数据库
331 化合物信息
332 质谱数据
333 属性信息
34 数据库检索处理部
341 无用信息删除部
342 化合物候选抽取部
343 评分部
344 候选排序部
345 优先离子确认部
346 强度比运算部
35 属性信息设定部。

Claims (5)

1.一种质谱分析数据处理装置,其用于通过数据库检索来推断未知化合物,该数据库检索使用收录有已知化合物的质谱的数据库,该质谱分析数据处理装置的特征在于,包括:
a)数据库,其能够将与质谱上出现的离子峰的至少一部分相关联、并表示不在数据库检索中的任一阶段内使用这一情况的非使用指示信息设定为属性信息,且收录有质谱;以及
b)检索处理部,在实施数据库检索时,其使用将所述属性信息中附有非使用指示信息的离子峰剔除之后的质谱来进行数据库检索。
2.根据权利要求1所述的质谱分析数据处理装置,其特征在于,
所述检索处理部包括:候选抽取部,其对质谱的谱图进行比较来抽取成为候选的多个化合物;以及排序部,其根据质谱的类似性对抽取出来的多个候选进行候选的排序;
所述非使用指示信息包括:第1非使用指示信息,其表示在由所述候选抽取部进行的化合物的抽取以及由所述排序部进行的化合物候选的排序中均不使用;以及第2非使用指示信息,其表示仅在由所述排序部进行的化合物候选的排序时不使用;
所述候选抽取部使用将附有第1非使用指示信息的离子峰剔除之后的质谱来抽取多个化合物候选,所述排序部使用将附有第1非使用指示信息和第2非使用指示信息中的至少任一方的离子峰剔除之后的质谱对化合物候选进行排序。
3.一种质谱分析数据处理装置,其用于通过数据库检索来推断未知化合物,该数据库检索使用收录有已知化合物的质谱的数据库,该质谱分析数据处理装置的特征在于,包括:
a)数据库,其能够将与质谱上出现的离子峰的至少一部分相关联、并在数据库检索中加以优先对待的优先指示信息设定为属性信息,且收录有质谱;以及
b)检索处理部,其通过实施将未知化合物的质谱与所述数据库中的质谱进行对照的数据库检索来抽取有可能推测为目标的未知化合物的化合物候选,该检索处理部制作如下检索结果,即,将所述未知化合物的质谱中存在设定有所述优先指示信息的离子峰这一内容作为条件之一来抽取化合物候选,或者能够在通过不使用所述优先指示信息的数据库检索而抽取出来的化合物候选中,将所述未知化合物的质谱中存在设定有该优先指示信息的离子峰的化合物候选与其他化合物候选辨别开来。
4.根据权利要求3所述的质谱分析数据处理装置,其特征在于,
在所述数据库中,能够针对设定有所述优先指示信息的离子峰,将阈值信息与所述优先指示信息一起设定为属性信息,所述阈值信息用于判定该离子峰的信号强度相对于存在该离子峰的质谱上的特定峰的信号强度的强度比。
5.根据权利要求4所述的质谱分析数据处理装置,其特征在于,
所述检索处理部将如下内容作为条件之一来抽取化合物候选:设定有所述优先指示信息的离子峰存在于所述未知化合物的质谱中;以及,所述离子峰的信号强度相对于该未知化合物的质谱上的所述特定峰的信号强度的强度比为阈值信息以上,所述阈值信息与所述优先指示信息一起被设定在该离子峰上。
CN201580035341.5A 2014-07-03 2015-01-13 质谱分析数据处理装置 Expired - Fee Related CN106662551B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
PCT/JP2014/067813 WO2016002047A1 (ja) 2014-07-03 2014-07-03 質量分析データ処理装置
JPPCT/JP2014/067813 2014-07-03
PCT/JP2015/050622 WO2016002233A1 (ja) 2014-07-03 2015-01-13 質量分析データ処理装置

Publications (2)

Publication Number Publication Date
CN106662551A true CN106662551A (zh) 2017-05-10
CN106662551B CN106662551B (zh) 2019-09-03

Family

ID=55018646

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580035341.5A Expired - Fee Related CN106662551B (zh) 2014-07-03 2015-01-13 质谱分析数据处理装置

Country Status (5)

Country Link
US (1) US10557837B2 (zh)
EP (1) EP3165912A4 (zh)
JP (1) JP6191773B2 (zh)
CN (1) CN106662551B (zh)
WO (2) WO2016002047A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113295759A (zh) * 2021-05-31 2021-08-24 西南大学 一种筛选代谢组中差异代谢物的方法

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3433874B1 (en) * 2016-03-24 2020-02-12 Shimadzu Corporation A method of processing an image charge/current signal
EP3505923A4 (en) 2016-08-26 2019-08-07 Shimadzu Corporation MASS SPECTROMETRY IMPORTER DATA PROCESSING DEVICE AND METHOD
DE112019000581T5 (de) 2018-02-26 2020-12-17 Leco Corporation Verfahren zum Einstufen von Bibliothekstreffern in der Massenspektrometrie
CN112204396A (zh) * 2018-05-02 2021-01-08 沃特世科技公司 使用标志物化合物相关的色谱特征和质谱特征共同鉴定植物性药材的方法
US11211236B2 (en) * 2019-05-30 2021-12-28 Thermo Finnigan Llc Operating a mass spectrometer utilizing a promotion list
US11879897B2 (en) 2019-05-30 2024-01-23 Thermo Finnigan Llc Operating a mass spectrometer utilizing mass spectral database search
JP7167105B2 (ja) * 2020-09-17 2022-11-08 日本電子株式会社 マススペクトル処理装置及び方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20010007349A1 (en) * 1999-12-27 2001-07-12 Hitachi, Ltd. Mass spectrometric analysis method and apparatus using the method
CN102057271A (zh) * 2008-06-04 2011-05-11 株式会社岛津制作所 质量分析数据解析方法以及质量分析数据解析装置
CN102323363A (zh) * 2011-06-13 2012-01-18 中国科学院计算机网络信息中心 化合物的色谱-质谱联用鉴定方法
CN103389345A (zh) * 2012-05-07 2013-11-13 株式会社岛津制作所 色谱质谱分析用数据处理系统
CN103718036A (zh) * 2011-03-11 2014-04-09 莱克公司 在色谱系统中处理数据的方法

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05149935A (ja) * 1991-11-28 1993-06-15 Shimadzu Corp Gc/msデータ処理装置
US5939612A (en) * 1998-04-28 1999-08-17 Hewlett-Packard Company Retention time-locked spectral database for target analyte analysis
JP3805979B2 (ja) * 1999-12-27 2006-08-09 株式会社日立製作所 質量分析方法および装置
US7473892B2 (en) * 2003-08-13 2009-01-06 Hitachi High-Technologies Corporation Mass spectrometer system
JP2005083952A (ja) 2003-09-10 2005-03-31 Shimadzu Corp 液体クロマトグラフ質量分析装置
JP4620446B2 (ja) * 2004-12-24 2011-01-26 株式会社日立ハイテクノロジーズ 質量分析方法、質量分析システム、診断システム、検査システム及び質量分析プログラム
JP2007287531A (ja) * 2006-04-18 2007-11-01 Shimadzu Corp 質量分析データ解析方法
US7555393B2 (en) * 2007-06-01 2009-06-30 Thermo Finnigan Llc Evaluating the probability that MS/MS spectral data matches candidate sequence data
JP2011237311A (ja) * 2010-05-12 2011-11-24 Shimadzu Corp クロマトグラフ質量分析用データ処理装置
CN103109345B (zh) * 2010-09-15 2016-06-22 Dh科技发展私人贸易有限公司 产物离子光谱的数据独立获取及参考光谱库匹配
WO2012104956A1 (ja) * 2011-01-31 2012-08-09 株式会社島津製作所 質量分析方法及び装置
WO2013022771A1 (en) * 2011-08-05 2013-02-14 Smiths Detection Inc. Chemical identification using a chromatography retention index
US20130131998A1 (en) * 2011-11-18 2013-05-23 David A. Wright Methods and Apparatus for Identifying Mass Spectral Isotope Patterns
CN104813324B (zh) * 2012-08-09 2017-09-05 珀金埃尔默健康科学公司 用于从质谱法输出识别聚合物物种的方法及设备
US20140142865A1 (en) * 2012-11-20 2014-05-22 David A. Wright Automatic Reconstruction of MS-2 Spectra from all Ions Fragmentation to Recognize Previously Detected Compounds

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20010007349A1 (en) * 1999-12-27 2001-07-12 Hitachi, Ltd. Mass spectrometric analysis method and apparatus using the method
CN102057271A (zh) * 2008-06-04 2011-05-11 株式会社岛津制作所 质量分析数据解析方法以及质量分析数据解析装置
CN103718036A (zh) * 2011-03-11 2014-04-09 莱克公司 在色谱系统中处理数据的方法
CN102323363A (zh) * 2011-06-13 2012-01-18 中国科学院计算机网络信息中心 化合物的色谱-质谱联用鉴定方法
CN103389345A (zh) * 2012-05-07 2013-11-13 株式会社岛津制作所 色谱质谱分析用数据处理系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113295759A (zh) * 2021-05-31 2021-08-24 西南大学 一种筛选代谢组中差异代谢物的方法

Also Published As

Publication number Publication date
JP6191773B2 (ja) 2017-09-06
WO2016002233A1 (ja) 2016-01-07
US10557837B2 (en) 2020-02-11
JPWO2016002233A1 (ja) 2017-04-27
US20170131248A1 (en) 2017-05-11
CN106662551B (zh) 2019-09-03
EP3165912A1 (en) 2017-05-10
EP3165912A4 (en) 2018-01-17
WO2016002047A1 (ja) 2016-01-07

Similar Documents

Publication Publication Date Title
CN106662551B (zh) 质谱分析数据处理装置
NL2009015C2 (en) Method for classification of a sample on the basis of spectral data, method for creating a database and method for using this database, and corresponding computer program, data storage medium and system.
CN101971019B (zh) 用于确定复杂混合物中的化学成分的组成的系统、方法和计算机可读介质
JP6088177B2 (ja) 解析装置、解析方法、プログラム
CN106935477B (zh) 串联质谱分析数据处理装置
CN105518448B (zh) 色谱质谱分析用数据处理装置
US20060125826A1 (en) Method and system for mass spectrometry and gas chromatographic data analysis
US6573492B2 (en) Mass spectrometric analysis method and apparatus using the method
JP6132073B2 (ja) 包括的2次元クロマトグラフ用データ処理装置
CN109477814A (zh) 色谱质谱分析用数据处理装置
CN110506205A (zh) 质谱分析装置和色谱质谱联用仪
WO2020194582A1 (ja) クロマトグラフ質量分析装置
CN116783480A (zh) 色谱装置
CN110234991A (zh) 谱数据处理装置
US8134121B2 (en) Chromatographic mass spectrometer
WO2020044435A1 (ja) データ解析方法、データ解析装置、及びデータ解析用の学習モデル作成方法
Smedsgaard et al. Classification of terverticillate Penicillia by electrospray mass spectrometric profiling
CN108027346A (zh) 质谱分析装置、质谱分析方法以及质谱分析用程序
JP2004053283A (ja) クロマトグラフデータ処理装置
JP6295910B2 (ja) 質量分析データ処理装置
JP2017227542A (ja) 質量分析データ処理装置、質量分析装置、質量分析データ処理方法、及び質量分析データ処理用プログラム
KR101932798B1 (ko) 내부표준물질을 이용한 성분분석장치 및 방법
JP6628181B2 (ja) 質量分析を用いた試料解析方法及び試料解析システム
El Abiead et al. Benchmarking feature quality assurance strategies for non-targeted metabolomics
CN116754702A (zh) 分析装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20190903

Termination date: 20210113