CN108982729A - 用于提取质量迹线的系统和方法 - Google Patents

用于提取质量迹线的系统和方法 Download PDF

Info

Publication number
CN108982729A
CN108982729A CN201810550353.7A CN201810550353A CN108982729A CN 108982729 A CN108982729 A CN 108982729A CN 201810550353 A CN201810550353 A CN 201810550353A CN 108982729 A CN108982729 A CN 108982729A
Authority
CN
China
Prior art keywords
mass
peak
traces
intensity
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810550353.7A
Other languages
English (en)
Other versions
CN108982729B (zh
Inventor
H·普法弗
C·亨里奇
R·马雷克
K·谭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thermo Fisher Scientific Bremen GmbH
Original Assignee
Thermo Fisher Scientific Bremen GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thermo Fisher Scientific Bremen GmbH filed Critical Thermo Fisher Scientific Bremen GmbH
Publication of CN108982729A publication Critical patent/CN108982729A/zh
Application granted granted Critical
Publication of CN108982729B publication Critical patent/CN108982729B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01JELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
    • H01J49/00Particle spectrometers or separator tubes
    • H01J49/0027Methods for using particle spectrometers
    • H01J49/0036Step by step routines describing the handling of the data generated during a measurement
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8624Detection of slopes or peaks; baseline correction
    • G01N30/8631Peaks
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/96Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation using ion-exchange
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01JELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
    • H01J49/00Particle spectrometers or separator tubes
    • H01J49/0004Imaging particle spectrometry
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8624Detection of slopes or peaks; baseline correction
    • G01N2030/8648Feature extraction not otherwise provided for
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/62Detectors specially adapted therefor
    • G01N30/72Mass spectrometers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

一种从自分离装置排出的物质流的质谱数据中提取作为分离参数函数的质量迹线的计算机实施的方法,其中所述质谱数据由在质谱仪中的分析生成,所述方法包含,接收所述质谱数据,其中所述质谱数据包含各自针对所述分离参数的相应值获得的多个质谱;从所述多个质谱中鉴别根据所述分离参数排序的三个或更多个强度峰的序列,其中所述鉴别三个或更多个强度峰的所述序列包含选择在初始质量下的初始强度峰,和对于强度峰的所述序列的每个其它强度峰,至少基于强度峰的所述序列中的相邻强度峰的质量选择所述强度峰,所述方法进一步包含从强度峰的所述鉴别的序列,提供所述物质流的给定排出化合物的质量迹线。

Description

用于提取质量迹线的系统和方法
技术领域
本发明涉及质谱仪数据的分析,特别是提取质量迹线,例如以形成提取离子色谱图。
背景技术
质谱(MS)技术的使用已经在许多其中需要详述分析各种化学和通常生物样品的领域中变得非常重要。这类质谱分析用于鉴别给定样品的化学组成。
在质谱仪中的直接分析通常涉及由化学样品生成离子。然后通过质谱仪测量这些离子的质荷比(m/z)和丰度以产生质谱。在这类质谱中的处于具体m/z值的强度中的峰(或质心)提供指示相应离子的相对丰度和质量的标记。此标记使得能够鉴别构成原始化学样品的一种或多种化合物。
对于包含大量不同化合物的样品,如生物样品,MS技术通常与分离技术组合。分离技术通常涉及例如通过借助溶剂洗涤结合到固定相的样品来分配(或分离)样品,使得样品的各种组分依据(一种或多种)给定分离参数如保留时间从样品中排出。常见分离技术包括色谱技术-如液相色谱法(LC)或气相色谱法(GC)。借助组合的色谱和质谱技术(如LC/MS),色谱技术使得不同化合物(或被分析物)在不同时间(被称为保留时间)或更通常在保留时间的时间段内从样品中洗脱。使用质谱仪分析在给定保留时间洗脱的化合物以产生针对所述保留时间的质谱。因此,典型色谱/质谱分析在给定保留时间的时间段内产生许多个别质谱。这些质谱随保留时间而变化,指示在相同时间内从样品中洗脱的化合物的差异。
依据洗脱参数进行的这些质谱分析不仅允许鉴别个别洗脱的化合物,而且允许鉴别或表征整体样品。洗脱参数在上文所讨论的实例中通常为保留时间,但是还可为离子迁移率、pH、离子大小和/或其它物理化学特性。这类物理化学特性通常与保留时间成比例。通常,通过针对所关注的m/z值生成质量迹线(如提取离子色谱图)进行此分析。所关注的m/z值自身通常基于质谱来确定。举例来说,强度降低高于某一阈值的任何强度峰(在谱图中)的m/z值可被认为是所关注的m/z值。给定质量迹线由在给定m/z值下(或周围)的质谱中的峰的强度形成。然后,这些强度绘制为洗脱参数的函数。具有最大值(和任选地满足某些其它准则如最小丰度和/或与预期信号模型的符合性)的质量迹线被认为是事件(或特征)并且这类特征可用于鉴别具体洗脱的化合物。
由这类组合的分离/质谱技术产生的个别质谱的数量通常非常大(对于典型LC/MS分析,其数量级可为数千个质谱)。这意味着继而鉴别的质量迹线的数量通常相对应地大(例如数量级为约1,000到1,000,000个质量迹线)。鉴于此,质量迹线的生成通常要求自动化。
用于生成质量迹线的现存方法使用在洗脱期间测量的预定义m/z窗口。这是一系列m/z值,通常以所关注的m/z值为中心,并且落入此m/z窗口内的质谱中的任何强度峰形成针对所述m/z值的质量迹线的一部分。窗口宽度通常由用户或软件设计员指定,并且在质量迹线生成中的任何误差的情况下必须手动来调节。自动测定参数(如色谱峰宽和其时间相关性)从美国专利第9,395,341号中已知,但是仍然不常见。
发明内容
本发明的目的在于提供用于在分离质谱分析之后生成质量迹线的改进系统。具体地说,已经观察到,如果在具有在给定m/z值下的强度峰(其可表示为质心)的第一化合物的洗脱期间,还洗脱具有在类似m/z值下的另一强度峰的第二化合物,则一个或这两个峰的所测量的m/z值可失真。具体地说,在m/z空间中存在两个峰朝向彼此偏转的倾向。
如上所概述,这类偏转可导致在由现有技术的方法生成的质量迹线中的误差。具体地说,偏转可使得将通常落在用于给定质量迹线的m/z窗口内的一些m/z强度峰现在偏转到m/z窗口之外。这导致不存在的质量迹线的点,和在一些情况下丢失或误鉴别的事件。这在下文参考图1c更详细地描述。
在本发明中,提出用于生成质量迹线的新方法和系统。本发明提供通过以下提取质量迹线的方法:鉴别第一候选质心(或强度峰)和沿后续质心使质量迹线行进,基于已经鉴别为质量迹线的一部分的相邻质心的m/z值来鉴别质量迹线的另外的质心。
在第一方面中,提供从自分离装置排出的物质流(或被分析物的离子流或其它流或流量)的质谱数据中提取作为分离参数(或分离尺度)的函数的质量迹线(如提取离子色谱图)的计算机实施的方法。应了解,分离装置可为可引起被分析物与提供到分离装置的样品分离的任何装置。举例来说,分离装置可为以下中的任一种:液相(或气相)色谱(或色谱柱);成像装置,如基质辅助激光解吸电离(MALDI)或次级离子质谱分析(SIMS)成像装置等。
在此方面中,通过在质谱仪中的分析来生成质谱数据,并且所述方法包含接收质谱数据,其中质谱数据包含各自针对分离参数的相应值获得的多个质谱。类似地,分离尺度可为使所述分离参数化的任何事项。在色谱装置中,这通常是保留时间,而在成像装置中,这可为探头束在样品的表面上的位置。
方法以通过从多个质谱中鉴别根据分离参数排序的三个或更多个强度峰的序列继续。所述鉴别三个或更多个强度峰的序列包含选择在初始质量下的初始强度峰,和对于强度峰的序列的每个其它强度峰,至少基于强度峰的序列中的相邻强度峰的质量,选择所述强度峰。
从强度峰的鉴别序列,提供物质流的给定排出化合物的质量迹线。通常,质量迹线至少由鉴别的强度峰形成。
鉴别三个或更多个强度峰的序列的步骤可替代地通过以下进行:选择在初始质量和分离参数的初始值下的初始强度峰以形成质量迹线的一部分,和至少基于在分离参数的相邻值下的一个或多个先前选择的强度峰的质量,重复地选择在分离参数的另外的值下的另外的强度峰以形成质量迹线的一部分。
此方面有利地允许质量迹线行进,并且最终从质谱数据提取质量迹线,其中在质谱数据中存在m/z偏转(如上述那些)的情况下具有更高可靠度。这是因为所述方法有效地使质量迹线沿其路径行进并且因此能够追踪在m/z方向上的平滑偏转。
通常,对于强度峰的序列的每个其它强度峰,以所述强度峰处于在围绕相应预期质量的相应范围(或差异)内的相应质量为条件选择所述强度峰,其中至少基于强度峰的序列中的相邻强度峰的质量,确定相应预期质量。
相应预期质量的所述确定可基于(或包括)序列的先前选择的强度峰的平均值。所述平均值可任选地为加权平均值和/或加窗平均值。
在一些实施例中,依据相邻强度峰的强度确定相应范围。
在方法的一个实施例中,在从多个质谱中鉴别根据分离参数排序的三个或更多个强度峰的序列的步骤中,此步骤包含选择在初始质量下的初始强度峰,和对于强度峰的序列的每个其它强度峰,基于强度峰的序列中的相邻强度峰的质量和分离参数选择所述强度峰。
具体地说,对于强度峰的序列的每个其它强度峰,基于所述强度峰的质量与相邻强度峰的质量的质量差和所述强度峰的分离参数与相邻强度峰的分离参数的差来选择所述强度峰。优选地,以以下方式选择强度峰的序列的其它强度峰,即在选择的强度峰的分离参数与相邻强度峰的分离参数的差增加的情况下,所述选择的强度峰的质量与相邻强度峰的质量的质量差必须更小。
选择的强度峰的质量与相邻强度峰的质量的所允许的质量差的最大值,所允许的质量窗口可通过所述选择的强度峰的分离参数和相邻强度峰的分离参数的差的函数来给出。此函数优选地随着所述选择的强度峰的分离参数与相邻强度峰的分离参数的差而降低,并且当圆或椭圆轴线中的一个为选择的强度峰的质量与相邻强度峰的质量的质量差并且其它轴线为所述选择的强度峰的分离参数和相邻强度峰的分离参数的差时,可表达为例如圆或椭圆的等式。
鉴别三个或更多个强度峰的序列的步骤可替代地通过以下进行:选择在初始质量和分离参数初始值下的初始强度峰以形成质量迹线的一部分,和基于在分离参数的相邻值下至少一个或多个先前选择的强度峰的质量和邻近于选择的另外的强度峰的强度峰的序列中的强度峰的分离参数,重复地选择在分离参数的另外的值下的另外的强度峰以形成质量迹线的一部分。
具体地说,至少一个或多个先前选择的强度峰的质量可限定质量窗口。然后,另外选择的强度峰的质量必须在质量窗口的范围内。限定的质量窗口随着另外选择的强度峰的分离参数与在强度峰的序列中其相邻强度峰的分离参数的差增加进一步地减小。
此方面有利地允许质量迹线行进,并且最终从质谱数据中提取质量迹线,其中,通过进一步考虑在强度峰的序列中相邻强度峰的分离参数的差,在质谱数据中存在m/z偏转(如上述那些)的情况下可靠度进一步增强。
在其中分离装置包含色谱仪的实施例中,分离参数通常包含保留时间。然而,应了解,保留时间可被用作其它物理化学特性(如以下中的任一种:离子迁移率;pH;离子大小;碰撞截面;极化率等)的代理量度标准。
另外或替代地,分离参数可包含任何一种或多种物理化学特性,如:离子迁移率;pH;离子大小;碰撞截面;极化率等。
在其中分离装置包含质谱成像装置的实施例中,分离参数通常表示提供到质谱成像装置的样品的表面位置。
在一些实施例中,所述提供步骤包含将事件检测算法应用到质量迹线,从而生成与质量迹线对应的事件,所述事件包含分离参数中心和质量中心。任选地,事件还可包含通过事件检测算法确定的以下特性或测量结果中的任一个:一个或多个峰宽;峰的不对称性的测量结果;与模型峰拟合的质量的测量结果;峰是否为多个峰的反卷积的结果的指示;其中是否应用质量校正的指示等。另外或替代地,所述提供步骤可进一步包含提供质量迹线的分离参数中心和质量中心。这类提供的分离参数中心和质量中心可为通过事件检测算法确定的那些。
在第二方面中,提供用于压缩质谱数据的计算机实施的方法。方法包含,通过重复应用上述方法中的任一个,将质谱数据分解成多个质量迹线;通过将事件检测算法应用到多个质量迹线中的每一个,鉴别在多个质量迹线中的错误质量迹线;和由质量迹线和与鉴别的错误质量迹线对应的质谱数据形成质谱数据的压缩版本。通常,错误质量迹线为这样一些,其中事件检测算法未能检测事件和/或未能以高于确定性(或拟合优度测量值)的阈值程度将预定义模型峰拟合到质量迹线。
在一些实施例中,质谱数据的压缩版本包含与鉴别的错误质量迹线对应的质谱数据,和通过应用事件检测算法代替与一个或多个事件相关的质谱数据而生成的一个或多个事件。
以此方式,应了解,质谱数据已经通过用从多个质量迹线中检测的事件替换质谱数据的部分而被有效地压缩。对于那些错误的质量迹线,保留相关质谱数据,使得在压缩期间信息缺失减到最少。
在一些实施例中,可丢弃多个质量迹线中由少于预定数量强度峰(或质心)组成的质量迹线。任选地,强度峰的预定数量可基于事件检测算法。举例来说,强度峰的预定数量可为事件检测算法拟合到预定义模型峰所需的强度峰的最小数量。
本发明还提供与以下对应且包含以下的设备:被布置成实施以上方法的元件、模块或组件,例如一个或多个各种适宜配置的计算装置,如先前描述的那些。
具体地说,本发明因此提供从自分离装置排出的物质流(或被分析物的离子流或其它流或流量)的质谱数据中提取作为分离参数(或分离尺度)的函数的质量迹线(如提取离子色谱图)的系统。系统包含被布置成接收质谱数据的接收模块,其中质谱数据包含各自针对分离参数的相应值获得的多个质谱;被布置成从多个质谱鉴别根据分离参数排序的三个或更多个强度峰的序列的鉴别模块。所述鉴别三个或更多个强度峰的序列包含选择在初始质量下的初始强度峰,和对于强度峰的序列的每个其它强度峰,至少基于强度峰的序列中的相邻强度峰的质量,选择所述强度峰;和被布置成从强度峰的鉴别的序列,提供物质流的给定排出化合物的质量迹线的输出模块。
任选地,系统还可被布置成压缩质谱数据。具体地说,系统可被布置成将质谱数据分解成多个质量迹线,并且可进一步包含被布置成通过将事件检测算法应用到多个质量迹线中的每一个,鉴别多个质量迹线中的错误质量迹线的事件检测模块;和被布置成由质量迹线和与鉴别的错误质量迹线对应的质谱数据形成质谱数据的压缩版本的压缩模块。
本发明还提供适于由一个或多个处理器执行的一个或多个计算机程序,这类(一个或多个)计算机程序被布置成实施以上概述且在本文中描述的方法。本发明还提供一个或多个计算机可读媒体和/或通过网络运送的数据信号,所述媒体和/或数据信号包含(或其上存储)这类一个或多个计算机程序。
附图说明
现将参照附图仅借助于实例描述本发明的实施例,在所述附图中:
图1a示意性地说明用于样品的经耦合分离/质谱分析的实例系统;
图1b示出质谱的实例图形表示;
图1c示出如可由图1a中的系统生成的两个实例质量迹线;
图2示意性地说明可在本发明中使用的计算机系统的实例;
图3a示意性地说明实例分析系统(如可在图1a中的系统中使用的分析系统)的逻辑布置;
图3b示意性地说明用于由质谱数据获得质量迹线的方法,所述方法可由图3a的分析系统进行(或实施);
图4为示意性地说明供图3b中所示的方法使用的质量迹线生成步骤的实例实施方案的流程图;
图5为示意性地说明在图4中阐述的质量迹线生成步骤的实例实施方案的变型的流程图;
图6a示出两个曲线图,其中数据来自LC-OrbitrapMS数据采集,质量迹线使用如根据图5的方法生成;
图6b示出两个曲线图,其中数据来自LC-OrbitrapMS数据采集,质量迹线使用根据现有技术的方法生成;
图6c示出来自图6a以及不同质量范围的质量迹线;
图7示意性地说明用于样品的经耦合分离质量/光谱分析的变型实例系统。
具体实施方式
在以下的说明中并且在附图中,描述本发明的某些实施例。然而,应了解本发明不限于描述的实施例并且一些实施例可不包括下文描述的所有特征。然而,显而易见的是可以在不脱离如所附权利要求书中阐述的本发明的更广泛精神和范围的情况下,在本文中进行各种修改和改变。
图1a示意性地说明用于样品101的经耦合分离/质谱分析的实例系统100。系统100示出为包含分离装置110、质谱仪130、质量际线分析系统150和另一个处理模块170。
分离装置110被配置成将样品101分离成多种组分(或被分析物)112。具体地说,分离装置110通常被配置成使组分(或被分析物)112依据分离参数(或尺度)从分离装置110洗脱(或排出或以其它方式散发)。(一种或多种)分离参数还可被认为是洗脱参数,尤其在分离装置包含色谱仪或色谱柱的情况下。被分析物通常作为物质流(或离子流)通过分离装置110排出,所述物质流接着可被引入(或注射)到如下文即将描述的质谱仪130中。应了解,此物质流可为各种被分析物的连续流,或此物质流可根据被分析物与样品101分离的速率而产生脉冲。
举例来说,分离装置110可为本领域中通常已知类型的液相(或气相)色谱仪。在此实例中,洗脱参数将为保留时间。换句话说,组分穿过色谱仪需要的持续时间(例如在样品被注射到装置中和组分被提供到质谱仪130之间的时间)。因为液相(和气相)色谱仪在本领域中为众所周知的,所以其在本文中将不进一步描述。
在另一个实例中,分离装置110可为在质谱成像(如基质辅助激光解吸电离(MALDI)或次级离子质谱分析(SIMS)成像)中使用的类型的成像装置。在这些实例中,样品101包含通常通过电离束(如离子束或激光)扫描的表面。通常,电离束使(一种或多种)组分112从在所述波束聚焦其上的样品101的表面上的位置散发(或排出)。随着所述波束扫描样品101,组分112依据扫描路径排出。以此方式,应了解,分离参数可为在样品101的表面上的坐标,或指示所述波束的扫描次序的参数(如在光栅扫描中的像素)。因为质谱成像在本领域中为众所周知的,所以其在本文中将不进一步描述。
除色谱和成像的许多变型以外,许多其它分离装置和方法为本领域中已知,包括离子迁移和差分离子迁移分离、电泳、通过结合到结合剂的阵列(的元件)的分离。
分离装置110耦接到质谱仪130。具体地说,分离装置110被配置成将所排出组分提供到质谱仪130。通常通过注射将这些组分112引入到质谱仪130中。质谱仪130可被布置成使注射的组分112电离(和任选地碎片化)。替代地,通过分离装置110提供的组分112可已经为电离的。举例来说,在分离装置110为离子迁移分离器或成像装置(如在MALDI装置中)的情况下,通常通过分离装置110使组分112电离。以此方式,应了解,分离装置110可为质谱仪130的离子源。
质谱仪130被布置成相对于电离片段(或组分112)的质荷比(即m/z值)生成相对丰度(或强度)的质谱132。质谱132即刻在下文进一步详细描述。众所周知,生成质谱132可涉及根据电离组分的m/z值分离或选择所述电离组分,接着测量由这些分离组的离子和/或电离片段所引起的一个或多个信号。分离或选择电离组分可发生,因为特定m/z值的离子具有这些离子在其上振荡的特定轨道。由于此振荡,可检测到离子的特征信号,所述特征信号具有频率ω并且可通过所述特征信号来分配特定m/z值。质谱仪的操作在本领域中为众所周知的,并且在本文中不进一步描述。技术人员将理解质谱仪130可为任何类型。举例来说,质谱仪可为以下中的任一种:飞行时间(TOF)质谱仪、傅里叶变换离子回旋共振质谱仪(FT-ICRMS)、OrbitrapTM质谱仪等。
通常通过质谱仪130依据分离参数来接收组分112。以此方式,应了解,质谱仪130同时(或基本上同时)接收在洗脱参数的相同值(或在相同值范围内)下排出的组分112。因此,质谱仪130被布置成依据分离参数生成质谱132。换句话说,针对洗脱参数的相应值生成每个质谱132。更具体地说,每个质谱132可被认为是(或表示)在洗脱参数的相应值下排出的组分112的质谱132。在跨越整个m/z范围的完全强度对m/z曲线的意义上,每个质谱132不必为完全质谱。举例来说,如本文中所提到的,质谱132可包含一个或多个m/z对强度数据点。质谱132可受限于所关注的具体m/z范围。在极端情况下,质谱132可仅包含在所关注的具体m/z范围内的质心。
因此,应理解,质谱132至少借助强度(或丰度)、m/z(或质量)的尺度和洗脱参数来形成数据集。因此,质谱仪130被布置成产生质谱数据(或经耦合分离/质谱数据)131。质谱数据131包含各自针对分离参数的相应值获得的多个质谱132。
实际上一些装置如四极杆质谱仪或一些飞行时间质谱仪可不提供质谱数据131作为关于分离参数的绘制质谱132的有序集。相反,质谱数据可为具有分离参数的相关联值的m/z-强度值对的流。
举例来说,四极杆质谱仪可按非顺序方式检测多个质量范围,从而引起乱序的质量与分离参数的关系。替代地,阿达马转变飞行时间仪器或类似地操作的装置可提供质量到达时间的序列,其要求用于测定分离尺度的参数的反卷积。
应理解,据称这类质谱数据仍然可包含质谱132,因为如以上阐述的,质谱132仅可被认为是具有强度(或丰度)的尺度的数据集;在分离参数的给定值(或值范围)下的m/z(或质量)。
应了解,给定组分112可在一系列分离参数P内从分离装置110排出。通常,在此范围内,组分112的丰度可上升到峰顶,并且然后下落。然而在一些情况下,如质谱成像,可存在组分的丰度的急剧不连续。这可为(例如)其中组分仅存在于如上所述的波束扫描的样品101表面的清晰地限定范围中的情况。
因此,应了解,在质谱数据131中的每个质谱132(或质谱数据集132)中,将存在多个m/z强度峰(通常表示为质心)-即在单个质谱132中相对于m/z的强度值中的局部极大值。然而,还将存在多个分离参数强度峰-即,对于具有特定m/z值的特定组分,在质谱数据131中相对于分离参数的强度中的局部极大值。
分离参数的范围(两种或更多种组分通过所述范围排出)可重叠。举例来说,在色谱仪中,给定组分可在保留时间中的时段内洗脱。在以下的说明中,为易于论述,将通常参考涉及使用色谱图的情形来给定实例。然而,应了解论述不限于这些实例并且涉及洗脱和洗脱参数的讨论同等地适用于更为通用的分离装置,其中术语排出和分离参数(或以上阐述的其它替代方案)可替代地使用。
举例来说,如图1a中所示,相对于洗脱参数,第一组分1121首先洗脱。在第一组分1121相对于洗脱参数结束洗脱之前,第二分量1122开始洗脱。因此,存在洗脱参数的范围,在所述范围内,第一组分1121和第二分量1122同时洗脱,并且因此同时注射到质谱仪130中。针对在此范围中洗脱参数的值p2生成的质谱将包括针对第一组分1121和第二组分1122的m/z强度峰。
相对来说,如图1a中所示,相对于洗脱参数,第三组分1123第三洗脱,并且在洗脱同时另外无其它组分112洗脱。因此,针对在其中第三组分1123洗脱的范围内洗脱参数的值p3生成的第二质谱将包括仅针对第三组分1123的m/z强度峰。
分析系统150被布置成接收由质谱仪130生成的质谱数据131。分析系统150可为(或包含)再一个计算机系统,如即刻参考图2更详细地描述的计算机系统200。分析系统150被布置成基于在所接收的质谱数据中的质谱132,生成一个或多个质量迹线152。
质量迹线152,如图1c中所示的实例质量迹线152A通常包含作为洗脱参数函数的一组m/z强度(或相对丰度)峰(或质心),其针对从样品101洗脱的组分112的具体离子片段。因为每个质谱132通常对应于洗脱参数的相应不同值,所以在质量迹线152中的每个质心来自相应不同质谱132。
质量迹线152的一个具体实例,在分离装置110为色谱图的情况下,为本领域中众所周知的提取离子色谱图。
另外的处理模块170被布置成接收生成的质量迹线152。然后,另外的处理模块170被布置成对质量迹线152执行另外的处理技术以便鉴别具体洗脱化合物112和/或关于样品101的结构和组成的信息。
质量迹线通常适用于如以下的过程:重新检查数据以检测先前未知的被分析物;突出显示潜在的异构体,解析疑似共洗脱物质;和提供所关注的化合物的清晰色谱图。
存在许多本领域中已知的依赖于精确质量迹线152的这类处理技术,包括来自赛默科技公司(Thermo Scientific)的化合物发现者(Compound Discoverer)和蛋白质组发现者(Proteome Discoverer)软件产品。在蛋白质组和化合物发现者产品中,质量迹线152可被用作用于确定(或鉴别)在数据中关联性事件的事件(或峰)检测算法的输入。这些事件接着可用于多种不同过程,包括:色谱比对,比较在不同色谱运行中的类似事件(例如用于确定不同样品中某些蛋白的相对量和/或存在或不存在),和用于确定在不同条件下生物体中形成的医药产品的代谢物的相对量。
应了解,改进的质量迹线152通常引起更正确地识别色谱峰。这继而可引起更正确地鉴别和定量肽。这在许多情形中是重要的,例如差异表达实验,其中可获得更好的相对蛋白量化。确定何种蛋白质在不同情况下丰度变化最终有助于鉴别蛋白质与疾病的状态或对医治的响应的相关性。因此其结果是,通过改进质量迹线的确定,可改进患者的健康状态的诊断。实际上,没有精确质量迹线确定,对于医治有价值的信号可在数据评估过程中不可挽回地早早地丢失,如Cappadona等人的“用于基于质谱的定量蛋白质组研究的软件解决方案的当前挑战(Current challenges in software solutions for mass spectrometry-based quantitative proteomics)”中,《氨基酸(Amino Acids)》,(2012)43:1087-1108中所阐述。
质量迹线152的另一用途示于Biller,J.E.和Biemann,K.(1974)“重构质谱:一直利用气相色谱-质谱仪数据的新颖方法(Reconstructed Mass Spectra,A Novel Approachfor the Utilization of Gas Chromatograph—Mass Spectrometer Data)”,《分析通讯(Analytical Letters)》,7:7,515-528中。本文中质量迹线用于使片段离子与其在GC-MS中的相应母体相关。类似方法论述于美国9,312,110中,其中母离子在单独获取的完全MS谱中并且片段离子在MS2谱中获取,其可由许多已知用于解离离子的方法生成。
在质谱成像的情况下,质量迹线152可经处理以鉴别在样品的表面上的单独区域。可对质量迹线使用来自可视成像的已知方法(如分水岭方法)以分离所述区域。另外,有可能基于外部信息(其可例如为来源于相同样品的光学或电子显微术)引导区域分离。
图1b示出质谱132的实例图形表示。
质谱132包含一个或多个m/z值(或质荷比)132-1i(其中ⅰ仅为从1到n的索引)。每个m/z值对应于相应离子物质并且等于相应离子物质的分子量除以相应离子物质的绝对元素电荷。质谱132包含一个或多个强度值132-2i,每个强度值132-2i针对相应m/z值132-1i呈现。每个强度值132-2i与对应于相应m/z值132-1i的离子物质的相对丰度相关。每个强度值132-2i可与对应于相应m/z值的离子物质的相对丰度成比例。
实验质谱如质谱132可以通过虚线指示的连续曲线和通过竖直实线指示的质心曲线的形式绘制(或表示)。通过虚线指示的峰的宽度表示质量分辨率的极限,其为区分m/z比接近的两种不同的离子物质的能力。
然而,应了解,质谱132不需要以曲线图的形式绘制(或储存)。实际上,质谱132可表示成任何合适的形式。举例来说,质谱132可表示为包含一个或多个强度值132-2i和一个或多个m/z值132-1i的列表。在一些情况下,质谱132可仅表示为质心(或局部极大值)的列表,每个质心表示为m/z值和强度值对。
因为存在许多本领域中常用的用于根据质谱数据获得这类质心的技术,所以这些将不在本文中进一步论述。然而,应了解,本文所描述的技术可以对形成质谱132的质心的列表,或对其中合适技术用于鉴别强度极大值(或质心)的原始质谱132执行。
图1c示出如可由系统100生成的两个实例质量迹线152A;152B
在图1c中,示出曲线图197,其将来自质谱132的质心(或强度峰)描绘为每个质心的m/z值与质谱132的洗脱参数的值之间的关系。所述质心形成每个质心的强度的部分,通过围绕点的圆形的直径指示,以便于视觉显示。如可见,在曲线图197中存在两个明显的中心分别居于m/z值A和B附近的质心序列。这些表示洗脱两种化合物,一种具有标记m/z值A,而另一种具有标记m/z值B。如可见,相对于洗脱参数,m/z值存在略微差异,这通常由质谱仪的固有精确度导致。这种精确度可相对于存在于质谱仪中的离子的数量而变化,而质谱仪中的离子的数量本身往往会在给定化合物的洗脱过程中上升和下降。
对于所关注的m/z值A的质量迹线152A和所关注的m/z值B的质量迹线152B,相应质量迹线152A、152B为围绕相应所关注的m/z值的质心的强度相对于那些质心的洗脱参数的值的曲线。在其中分离技术为色谱技术的情况下,洗脱参数将为保留时间,且质量迹线将为所关注的m/z值的提取离子色谱图。
为了考虑m/z值的略微差异,现有技术质量迹线提取技术通常通过包括具有在某一范围Δ(所关注的m/z值的任一侧)内的m/z值的所有质心来形成质量迹线,如图1c中所示。此范围(通常2Δ)通常被称为质量窗口(或质量窗口宽度)并且被预定义,常由用户或软件架构指定,或根据其它信息以编程方式确定。具体地说,质量窗口可基于质谱仪类型和/或分辨率设置生成。换句话说,质量窗口用于考虑以下事实:由质谱仪报告的m/z值存在有限精确度,从而导致一个质谱到下一个质谱之间报告的m/z值的差异。
然而,现在已经观察到,相同谱图中两个邻近质心的报告的m/z值可偏转。通常,质心朝向彼此偏转(或在一些情况下,质心中的一个(通常较小密集的质心)朝向另一质心偏转)。然而,因为偏转可是由于在质量分析器内离子的相互作用的一般效应,所以在一些情况下质心可远离彼此偏转。在任一情况下,这可导致一些质心偏转超出围绕所关注的m/z值的质量窗口Δ的范围,如在曲线图197中相对于所关注的m/z值B的质心可见。尽管事实是在质心在质量窗口内的情况下,那些质心仍然与相同洗脱化合物的标记m/z值B有关。
这导致生成错误质量迹线,如质量迹线152B'和152B”。本文中,由于超出质量窗口的范围的遗失质心,生成两个单独质量迹线。这两个错误质量迹线中的每一个相对于洗脱参数具有强度的相关联相应峰(或事件)。在此实例中,第一峰位于与真实质量迹线152B的峰相同的洗脱参数的值处。然而,第一峰的形状不同于真实峰的形状。此形状差异(与错误第二峰组合)可阻止鉴别产生此质量迹线的洗脱化合物。在一些情况下,由于两个错误峰的异常截短形状,它们可被分析系统简单地丢弃,从而阻止鉴别洗脱化合物。替代地,两个错误峰可导致错分类洗脱化合物,例如进一步分析可假定两个错误峰为两种单独洗脱的化合物的结果。
图2示意性地说明计算机系统200的实例。系统200包含计算机202。计算机202包含:存储媒体204、存储器206、处理器208、接口210、用户输出接口212、用户输入接口214和网络接口216,它们全部通过一个或多个通信总线218连接在一起。
存储媒体204可为非易失性数据存储装置的任何形式,如硬盘驱动器、磁盘、光学光盘、ROM等中的一种或多种。存储媒体204可存储可由处理器208执行的操作系统。为了计算机202运行,可需要由处理器208执行操作系统。存储媒体204还可存储一个或多个计算机程序(或软件或指令或代码)。
存储器206可为适于存储数据和/或计算机程序(或软件或指令或代码)的任何随机存取存储器(存储单元或易失性存储媒体)。
处理器208可为适于执行一个或多个计算机程序(如储存在存储媒体204上和/或存储器206中的那些)的任何数据处理单元,所述计算机程序中的一些可为根据本发明的实施例的计算机程序或这样的计算机程序,其当由处理器208执行时使处理器208实施根据本发明的实施例的方法并且将系统200配置成根据本发明的实施例的系统。处理器208可包含单个数据处理单元或并联、单独或与彼此合作操作的多个数据处理单元。处理器208在实施用于本发明的实施例的数据处理操作时可将数据存储到存储媒体304和/或存储器206,和/或从其中读取数据。
接口210可为用于向计算机202外部的或可从计算机202拆卸的装置222提供接口的任何单元。装置222可为数据存储装置,例如,光学光盘、磁盘、固态存储设备等中的一种或多种。装置222可具有处理能力-例如,装置可为智能卡。因此,根据装置222从处理器208接收的一个或多个命令,接口210可从装置222访问数据,或提供数据到装置222,或与装置222连接。
用户输入接口214被布置成接收来自系统200的用户或操作员的输入。用户可经由连接至用户输入接口214或与其通信的系统200的一个或多个输入装置提供此输入,如鼠标(或其它指向装置)226和/或键盘224。然而,应了解用户可经由一个或多个额外或替代的输入装置(如触摸屏幕)向计算机202提供输入。计算机202可将经由用户输入接口214从输入装置接收的输入存储在存储器206中用于处理器208随后访问和处理,或可将所述输入直接传输到处理器208,使得处理器208可相应地对用户输入作出反应。
用户输出接口212被布置成将图形/可视输出提供到系统200的用户或操作员。因此,处理器208可被布置成发指令给用户输出接口212以形成表示期望图形输出的图像/视频信号,并且将此信号提供到连接至用户输出接口212的系统200的监视器(或显示屏或显示单元)220。
最后,网络接口216提供计算机202从一个或多个数据通信网络下载数据和/或将数据上传到一个或多个数据通信网络的功能性。
应了解,图2中所说明和上述的系统200的架构仅为示例性的并且可在本发明的实施例中使用具有不同架构(例如相较于图2中所示,具有更少组件,或相较于图2中所示,具有额外和/或替代的组件)的其它计算机系统200。举例来说,计算机系统200可包含以下中的一种或多种:个人计算机;服务器计算机;膝上型计算机;移动电话;平板计算机;其它移动装置或消费型电子装置;云端计算资源;网络连接装置等。
图3a示意性地说明实例分析系统150(如可用于系统100中的)的逻辑布置。分析系统150包含接收器模块310、质量迹线生成(或提取)模块320和质量迹线处理模块330。
接收器模块310被布置成接收质谱数据131。通常,接收器模块310被布置成接收来自耦接到(或连接至)分析系统150的质谱仪的质谱数据。然而,应了解接收器模块310可被布置成接收来自任何合适来源的质谱数据131,包括数据存储装置、云端计算服务、测试数据生成程序等。如先前阐述的,质谱数据131包含由质谱仪130根据洗脱参数(如保留时间)生成的多个(或一系列)质谱132。
质量迹线生成模块320被布置成基于所接收的质谱130,提取(或获得)一个或多个质量迹线152。具体地说,质量迹线生成模块320被布置成从所接收的质谱数据131的质谱,鉴别根据洗脱参数排序的三个或更多个强度峰的序列。作为鉴别序列的一部分,质量迹线生成模块320通常被布置成选择来自质谱132的初始强度峰。初始强度峰可基于所关注的m/z值(或范围)来选择。应了解,这类所关注的m/z值(或范围)可以许多不同方式指定,如通过用户,通过质谱数据131的其它分析,基于样品101的已知特性等。如下文即刻阐述的,初始强度峰可基于质谱数据131的抽样来选择。以初始强度峰开始,质量迹线生成模块320被布置成通过根据(或追踪)质量迹线来选择序列的另外的强度峰,作为洗脱参数的函数。换句话说,质量迹线生成模块320被布置成针对强度峰的序列的每个另外的强度峰,基于序列中已经选择的相邻强度峰来选择所述另外的强度峰。
质量迹线处理模块330被布置成提供提取的一个或多个质量迹线152。通常,质量迹线处理模块330被布置成绘制质心的序列的强度作为洗脱参数的函数。应了解,这类曲线图不限于图形表示并且可包括坐标(或绘制点)的列表;表示强度峰的序列的强度的一个或多个参数化曲线(作为洗脱参数的函数)等中的任一个。
质量迹线处理模块330可被布置成确定(或计算或另外估计)所提取质量迹线152的质量中心。质量中心通常为构成质量迹线152的强度峰的各个m/z值(或质量值)的平均值。具体地说,质量中心可为通过强度进行加权的强度峰的各个m/z值(或质量值)的平均值。另外或替代地,强度峰可通过信噪比进行加权。另外或替代地,可从质量中心中省略偏转的质心以提供校正的质量中心。这类质量中心校正的实例在“用于相对蛋白质量化NeuCode标记(NeuCode labels for relative protein quantification)”,Merrill等人,《分子和细胞的蛋白质组学(Mol.Cell.Proteomics)》,13(2014),第2503-2512页中给出,其以全文引用的方式并入本文中。
因此,应了解质量迹线152的质量中心有效地为在质量迹线中检测的(或每种)组分的所测量m/z(或质量)值。
另外或替代地,质量迹线处理模块可被布置成确定所提取质量迹线152的洗脱参数中心(如保留时间中心或空间时间中心)。通常,洗脱参数中心为洗脱时间的值,在所述值下,质量迹线152的强度为最高-即(通常局部)最大值。可通过将峰检测算法应用到质量迹线以确定在强度与洗脱参数曲线图中的峰来确定这类洗脱参数中心。在实例中,洗脱参数中心可设定为均分峰面积的洗脱参数的值。在更高维度中,这可等于几何中心。应了解,这类方法可特别地适用于不符合某一预定义模型或峰形的峰。这可通常为在成像质谱中的情况。
质量中心和洗脱参数中心的组合通常对应于事件。这类事件通常为具体化合物的洗脱。举例来说,在质量迹线152为提取离子色谱图的情况下,质量中心和保留时间中心将对应于色谱事件-即具有质量中心的具体化合物的洗脱作为来自色谱的标记质量。事件可鉴别为在质量迹线的强度中的峰。替代地,可使用事件检测算法,其要求在将峰分类为事件之前,满足这类质量迹线强度峰的其它条件。举例来说,事件检测机制可要求具有以下中的任何一项或多项:最小面积、与模型峰和或预期统计变型的最小符合性和与具有相同(或基本上相同)洗脱参数值的一个或多个峰的共洗脱。通常,因此,事件检测包含如上阐述的峰检测(通常每个限定峰构成事件)。
本领域技术人员应了解,存在许多用于检测峰和/或事件的已知方法。在一个实例中,使用合适拟合算法(如最小平方拟合)将形式的高斯曲线拟合到质量迹线152。这类拟合将产生作为H的质量迹线的色谱峰的强度,作为RT的峰的洗脱参数中心以及作为W的峰宽。
峰拟合的概述在以下中给出:《科学和技术中的数据处置(Data Handling inScience and Technology)》;第8和11章;21卷,(1998);《色谱中的数据分析和信号处理(Data Analysis and Signal Processing in Chromatography)》;Attila Felinger编;其以全文引用的方式并入本文中。事件或峰的洗脱参数中心(如上述的)可确定为事件或峰检测算法的一部分。举例来说,“使用双高斯混合模型和统计模型选择的不对称LC-MS峰的量化和反卷积(Quantification and deconvolution of asymmetric LC-MS peaks usingthe bi-Gaussian mixture model and statistical model selection)”,Yu和Peng,《BMC生物资讯(BMC Bioinformatics)》,2010年11月12日,其以全文引用的方式并入本文中,建议通过将双高斯模型拟合到XIC进行峰检测和后续确定峰中心(如洗脱参数中心)。这类方法还为可用于检测可存在于相同质量迹线(或XIC)中的多个峰的方法的实例。
鉴于这类事件检测算法在本领域中为众所周知的,所以本文中将不对它们进一步详细论述。然而,应理解,质量迹线处理模块330可被布置成应用事件检测算法并且提供针对给定提取质量迹线的一个或多个检测事件。
质量迹线处理模块330还可被布置成计算提取质量迹线152的其它参数或特性。这类其它参数可包括以下中的任何一项或多项:质量迹线152的信噪比(或测量结果)、质量迹线152的强度中的背景噪声的测量结果、质量迹线的一个或多个峰宽。具体地说,应了解,质量迹线152的峰宽可为关于m/z尺度的宽度(如在质量迹线152中的质心的m/z值的差异)。另外或替代地,质量迹线的峰宽可为关于洗脱参数尺度的宽度。
图3b示意性地说明用于由质谱数据131获得质量迹线152的方法350,所述方法可由分析系统150进行(或实施)。
步骤360包含接收包含多个质谱132的质谱数据131的接收器模块320,所述多个质谱132各自针对洗脱参数的相应值获得。
步骤370包含基于所接收的质谱132提取质量迹线152的质量迹线生成模块320。步骤370包含从多个质谱132鉴别三个或更多个强度峰的序列的质量迹线生成模块320,强度峰的序列根据洗脱参数排序。具体地说,在初始m/z值下的初始强度峰选自质谱132。对于强度峰的序列的每个其它强度峰,所述强度峰基于强度峰的序列中的相邻强度峰的m/z值来选择
步骤380包含提供提取质量迹线152的质量迹线处理模块330。所述提供步骤可包含以下中的任一项或多项:显示质量迹线152;存储器质量迹线152;传输质量迹线152(如到下游系统或处理方法)等。任选地,步骤380包含计算以下中的一项或多项的质量迹线处理模块330:提取质量迹线152的相应质量中心;提取质量迹线152的分离参数中心(例如洗脱参数中心);质量迹线152的信噪比;质量迹线152的背景噪声(通常背景强度)的测量结果;质量迹线152的一个或多个峰宽;峰的不对称性的测量结果;拟合到模型峰的质量的测量结果;峰是否为多个峰的反卷积的结果的指示;其中是否应用质量校正的指示等。作为步骤380的一部分,这些任选地计算的参数或特性中的任一种或全部可提供有质量迹线152。
应了解,步骤370和380可对于相同质谱数据131重复,例如以针对不同的所关注的m/z值来提取多个质量迹线152。还应了解,步骤370可重复以便提取多个质量迹线152,并且步骤380可关于提取质量迹线152执行一次。
通常,针对在多个质谱中的第一(或相对于洗脱参数的初始)质谱132(其具有强度峰)中每个强度峰,执行步骤370。换句话说,针对这类第一质谱132中的每个强度峰,开始质量迹线152。然后,通常循序地考虑质谱,并且针对不形成现存提取质量迹线的一部分的任何另外的强度峰,开始新质量迹线-即针对在后续质谱中的不为现存质量迹线152的一部分的每个强度峰,也执行步骤370。以此方式,可保证提取尽可能多的质量迹线152,并且在质谱中的每个强度峰考虑包含在质量迹线中。
图4为示意性地说明供图3b中所示的方法使用的质量迹线生成步骤370的实例实施方案的流程图。
步骤410包含选择在质谱132的初始m/z值下的初始强度峰。通常,如上阐述,对相同质谱数据131,执行步骤370多次。具体地说,针对给定质谱132,提取质量迹线152的尝试可针对质谱132中的每个强度峰(或质心)进行。因此,可以此方式简单地选择初始强度峰。另外或替代地,一个或多个所关注的m/z值可由用户指定。可基于一个或多个所关注的m/z值,选择初始强度峰。举例来说,可选择具有与所关注的m/z值最接近的m/z值的强度峰。也是在步骤410,基于初始强度峰的m/z值,设定预期m/z值。通常,预期m/z值设定成等于初始强度峰的m/z值。
应了解,存在许多已知的出于生成质量迹线的目的来选择初始峰的方式。通常,使用预定强度阈值并且选择超过阈值的强度峰。有利地,峰挑选可使用峰的相,并且相对于波谱中的噪声背景动态地确定阈值,并且保留背景信息。这类方法阐述于美国专利7,962,301中,其以全文引用的方式并入本文中。另外或替代地,,可利用质量分析器的特性来降低假阴性率,例如如对于FT/MS器械在美国专利7,987,060中所示,所述专利以全文引用的方式并入本文中。
步骤420包含选择随后质谱132中的一个或多个强度峰,其m/z值在预期m/z值的m/z范围(或质量公差)内。通常,步骤420包含确定(或鉴别)随后质谱132中的一个或多个强度峰的m/z值是否具有在预期m/z值的预定义范围内。此m/z范围可为(或包含)如先前所描述的质量窗口。以此方式,应了解预定义范围可在步骤370的过程中恒定。替代地,预定义范围可在步骤370的过程中变化,如下文即刻阐述的。在其中在步骤420中鉴别超过一个强度峰的情况下,步骤420可包含选择所有强度峰。替代地,步骤420可包含选择强度峰中的一个以包括在强度峰的序列中。这类选择可包含选择具有与所关注的预期m/z值最接近的m/z值的强度峰。替代地,选择可基于一个或多个相邻质量迹线152的所关注的(一个或多个)预期m/z值。举例来说,相较于当前质量迹线152的预期m/z值,m/z值更接近相邻质量迹线152的预期m/z值的强度峰可被丢弃。然后,可从剩余的所鉴别强度峰,选择具有与所关注的预期m/z值最接近的m/z值的强度峰。在其中所鉴别强度峰中的所有已经被丢弃情况下,以此方式,控制流移动到“否”分支,其在下文即刻描述。
如果随后质谱132中的具有在预期m/z值的预定义范围内的m/z值的一个或多个强度峰被选择,则控制流移动到步骤430。
步骤430包含将在步骤420中选择的强度峰包括在强度峰的序列中。在通过步骤420选择超过一个强度峰的情况下,基于所选择的强度峰的平均强度峰可包括于强度峰的序列中。另外或替代地,所有选择的峰可包括于质量迹线中。
步骤440包含至少基于在步骤430中包括于强度峰的序列中的强度峰的m/z值,更新预期m/z值。在一些情况下,预期m/z值可设定成在步骤430中包括于强度峰的序列中的强度峰的m/z值。通常,基于在序列中的先前强度峰的m/z值的平均值来更新预期m/z值(或预期m/z值更新为在序列中的先前强度峰的m/z值的平均值,或与其成比例)。平均值可为加窗平均值,其中仅包括预定义数量的先前强度峰的m/z值。另外或可替代地,平均值可为加权平均值,如通过强度进行加权的平均值。
在步骤440之后,控制流然后移动回到步骤420。因此,应了解至少基于强度峰的序列中的相邻强度峰的m/z值来鉴别在步骤420中鉴别的强度峰。
如果在步骤420之后,通过步骤420未选择强度峰,则控制流移动到步骤450。
步骤450包含确定质量迹线152是否应当终止。通常,如果对于预定义数量的连续质谱,通过步骤420未选择强度峰,则质量迹线152将终止。通常,这指示与质量迹线相关联的化合物的洗脱已结束。应了解,可使用其它终止准则。终止准则可包括在分离尺度中的预定义和/或动态地确定的准则。终止准则可包括:何时总迹线(在分离尺度中)的长度超出在分离尺度中的平均预期峰宽的整倍数。在此情况下,应了解,可为有利的是,在最新强度峰被用作新迹线的初始强度峰的情况下,打开新迹线。在成像情形下,应了解可以成排进行扫描。这里,行的结束可终止迹线。终止准则可取决于已经选择为序列的一部分的许多强度峰,例如质量迹线越长,预定义数量可更大。以此方式,应了解,相比于较短质量迹线,较长质量迹线可更为耐受强度峰的空隙或遗失。
如果步骤450确定质量迹线不应终止,则控制流移动到步骤420,其针对序列中的随后质谱进行。应了解,如果只要在步骤420中未选择强度峰,终止准则就要求质量迹线终止,则步骤450可省略。在此情况下,一旦在步骤420中未选择强度峰,步骤370就将直接地终止。
图5为示意性地说明在图4中阐述的质量迹线生成步骤370的实例实施方案的变型的流程图。除以下方面外,以上图4的论述适用于图5。
步骤545包含更新m/z范围(或质量窗口)。可基于以下项中的任一个(或任何组合)来更新m/z范围(或m/z范围与其成比例或随其而变):质谱仪的分辨率;预期m/z值;序列中的先前选择的强度峰的强度;信噪比等。通常,m/z范围将不相对于预期m/z值更新到低于0.1ppm。应了解,在一些实例中,m/z范围可取决于以下(或基于以下而确定):相同质谱中的邻近(或相邻)峰(即,在m/z尺度中相邻的峰)。举例来说,如果邻近峰在m/z大小上足够接近预期m/z值以引起朝向邻近峰的“吸引”,则质量窗口可经调节以考虑所述预测的“吸引”。这类调节可包括加宽窗口和/或使窗口朝向邻近峰偏移。通过追踪在所有质量迹线中的质量差异,可基于自动地观察到的趋势调节质量窗口。举例来说,质量窗口可功能上取决于质量和/或强度。具体地说,应了解通过具有较低信噪比的质谱仪检测的较低离子将由于噪声的影响而示出较高质量变率。因此,根据信噪比,可成反比地作出m/z范围。
应了解,步骤410可包含以与上述步骤545类似的方式,基于初始强度峰的m/z值,设定m/z范围。
在图5中所示的方法的实例实施方案中,可使用以下准则和参数。
●在步骤410和440中设定的预期m/z值等于avg_mz,其为在序列中的四个先前选择的强度峰的平均m/z值。在先前已经选择少于四个序列中的强度峰的情况下,使用所有先前选择的序列中的强度峰。
●质量公差为tol_amu=MININUM(2avg_mz/res*2/3,1.5*avg_mz/1e6)。针对在0.1和100之间的值,因数1.5可通常被取代。接近0.1的值将最适于超高分辨率FTMS,而约100的值将最适于飞行时间质谱。res设定成等于m/z值与强度峰的半高宽(FWHM)值的比率-即,res=m/z/FWHM.
●用于确定是否终止质量迹线的预定义数量(或最大值间隙长度)为maxGapLen=MAXIMUM(len/3,10),其中len为当应用测试时序列中的强度峰的数量。应了解,可动态地确定最大值maxGapLen(本文中设定为10)。具体地说,可基于以下中的任一项动态地确定最大值maxGapLen:仪器类型、信噪比、观察的(或预设)色谱峰宽等。通常合理的范围为在3到10附近或在使用分离方法中的平均峰宽。
通过下文给出的伪码说明实例方法:
对于每个(质谱(洗脱参数升序))
对于每个(有效质量迹线(质量升序))
对于每个(质谱中的质心(质量升序))
如果(质量质心低于avg_mz-1/2*tol_amu)
未发现匹配:将质心添加到新质量迹线作为初始强度峰
继续(以随后质量质心继续)
否则如果(质量质心高于avg_mz+1/2*tol_amu)
未发现匹配:将质心添加到新质量迹线作为初始强度峰
中断(以随后自动迹线继续)
否则
检查此或随后质量迹线是否具有与当前质量质心更小匹配。以更小距离将质量质心分配到质量迹线
结束质心
如果(无质量质心分配到当前质量迹线)
添加间隙(零质量质心)到质量迹线
如果(达到maxGapLen点)
终止质量迹线并提供终止的质量迹线
结束质量迹线
结束质谱
图6a示出数据来自数据采集MS系统的两个曲线。曲线图610为标绘如由本发明的方法生成的两个质量迹线1521;1522的质心(或强度峰)的曲线图610。如可看出,存在两个明显分离的质量迹线1521;1522,本文中分别接近于质量值142.0765和142.0730居中,曲线图620示出两个质量迹线1521;1522的对应强度对保留时间的曲线图。
可看出,当强度增加时,相对于上部质量,下部质量显著地变动。上部质量也略微偏移,但是偏移明显小得多。
还可容易地看出,在峰中心附近存在足够数据点以确定正确未偏移的质量。在此特殊情况下,在存在相比于偏移的数据点更不变的数据点的情况下,简单中值将已经产生对于下部迹线的质量的显著地改进结果。
具有窄质量提取窗口的常规现有技术方法将不能正确地抓取下部质量迹线1521,因为围绕保留时间7,51的强度的序列将超出质量窗口的范围。这可在图6b中看出,其类似于上述图6a的图,但使用现有技术的质量迹线检测方法产生。如从图6b可看出,应用于质量迹线1521的事件检测方法将受限制而失败,因为实际色谱强度峰从质量迹线1521中丢失。
图6c示出来自图6a以及不同质量范围的质量迹线1521
线612示出质量范围的下限,如通过如上文阐述的tol_amu给出的质量范围,因为其沿分离参数(或在此情况下的保留时间)变化。类似地,线614示出质量范围的下限,如通过如上文阐述的tol_amu给出的质量范围,因为其沿保留时间变化。
如从线612;614可看出,其中本发明的方法查找在质量迹线1521中的另外的质心的范围有效地追踪质量迹线1521。以此方式,可看出方法自动地考虑质量迹线1521围绕保留时间7,51的大偏转,这类质心超出预期质量范围的范围。因此,与如上图6b中所示的现有技术的方法相比,未从质量迹线1511中错误地省略质心
为便于理解,从每次提取单个质量迹线的观点,逻辑地描述上文参考图3b、4和5描述的方法。这可通过质量迹线类型来视为质量迹线。然而,应了解本发明不限于此实施方案。替代地,上述方法可通过质心类型实施为质心。换句话说,可并行地提取质量迹线150的两个或更多个(或所有)。
在通过质心类型的这类质心的一个实例中,可按分离参数的顺序考虑质谱132。对于给定质谱132,对于有效质量迹线152(尚未终止的质量迹线152)中的每一个,可按照步骤420测试质谱132中的每个质心。如果对于给定质量迹线选择质心,则质心添加到质量迹线152(按照步骤430)和预期m/z值,并且任选地针对所述质量迹线152更新m/z范围。如果对于任何有效质量迹线152未选择质心,则可使用所述质心作为初始强度峰,开始新质量迹线152。一旦已经考虑质谱132的所有质心,则终止准则应用于其中未添加新质心的有效质量迹线152。满足终止准则的任何质量迹线不被进一步考虑并且可被提供到质量迹线处理模块330。然后对于在随后质谱(按分离参数的顺序)中的质心重复所述过程。
应了解,前面论述不限于选择在分离参数的任何具体方向(或含义)中的强度峰。尽管直接视觉化在分离参数的一个点值下的初始强度峰和在分离参数的后续值下的随后选择的强度峰,但是有可能选择在分离参数的高值下的初始强度峰和选择相对于分离参数反向的另外的峰。还应了解,可选择在任何方向上移动出分离参数值的另外的峰。举例来说,在质谱成像中,质量迹线可沿样品的表面上的对角线行进。
另外或替代地,质量迹线可相对于分离参数从给定初始强度峰正向和反向行进。
实际上,可能有利的是,一旦已经确定平均质量(或质量中心),就反向使质量迹线重新行进。这可有利地改进初始强度峰的选择并且可引起将以其它方式未考虑为质量迹线的一部分的前面的峰包括在质量迹线中。还应了解,虽然色谱峰在时间上并不趋于对称,但是当在时间上正向移动时可仍然适合于使用相同选择和终止准则。
应了解,质谱数据131,如通过先前论述的组合分离质谱技术产生的,可需要大量存储空间。举例来说,傅里叶变换类型质谱仪可以每秒5次采集的速率获取信息(或质谱),其中每次采集产生2兆字节的数据。这可引起约100Mbit/s的数据流或3.5千兆字节/小时的储存器要求。这是对于单次LC/MS实验的普通原始数据量。
另外,通常可为这样的情况:这类质谱数据131的进一步处理,如通过先前关于图1a描述的另外的处理模块170进行的,)通过远程于质谱装置130自身的服务器执行。这类远程服务器可经由网络(如互联网和/或任何其它合适的局域或广域网)连接至质谱装置130。实际上,这类质谱数据131的进一步处理可使用云端计算资源和/或其它此类软件即服务(SaaS)架构来进行。通常,质量迹线生成通过相同远程处理系统来执行,迫使整个质谱数据传输到远程系统(或云端计算系统)。因此,对于质谱数据的传输,需要大量频宽。
图7示意性地说明用于样品101的分离质谱分析的变型实例系统700。变型系统700为先前论述的实例系统100的变型。与图7的系统100有关的上述论述在以下方面除外。
分析系统150被布置成将质谱数据131分解成多个质量迹线152。应了解,这类分解通常包含如通过先前所描述的方法中的任一种,从质谱数据131中重复提取质量迹线152。通常执行这类重复提取,直至不提取出另外的质量迹线152。可使用用于终止重复提取(或分解)的其它准则,如以下中的任一项:提取预定义数量的质量迹线152;质谱数据131的质谱132的每个质心(或强度峰)已经包括于(或考虑用于)质量迹线中。
分析系统被布置成鉴别多个质量迹线152中的错误质量迹线152。错误质量迹线152可为丢失质心、产生寄生质量迹线强度峰的质量迹线152,如先前参考图1c论述的峰。另外或替代地,错误质量迹线152可为包含小于预定义最小数量的质心的质量迹线152。可基于曲线拟合准则设定质心的预定义数量。举例来说,质心的预定义数量可为将预定义曲线类型拟合到质量迹线152需要的点的最小数量。通常,具有少于三个质心的质量迹线152为错误质量迹线,因为应了解在最简单的抛物线拟合的情况下,需要至少三个数据点。另外或替代地,分析系统可被布置成将事件检测算法应用于质量迹线,以确定用于质量迹线的一个或多个事件,作为鉴别错误质量迹线152的一部分。事件检测方法的应用先前在上文论述,并且本领域中为众所周知的。通常,这类事件检测方法包含将模型峰(或一组模型峰)拟合到每个质量迹线。标准计算拟合技术,如最小平方拟合通常用于执行此。如上所阐述,其中拟合的模型峰满足一些预定义准则(如具有最大值、最小丰度和/或与模型峰于符合性)的质量迹线为所考虑事件。
如果未检测到这类事件和/或如果事件自身被认为是错误的,则质量迹线可被认为是错误的。通常,错误事件为其中模型峰与质量迹线的拟合的优度低于预定义阈值的事件。存在许多测量模型峰与数据的拟合的方式,其为本领域技术人员已知的,因此在本文中不进一步描述。
通常,基于质谱数据131的统计测量结果和/或关于质谱仪130的信息,选择拟合优度阈值。举例来说,质量迹线中每个点的预期变率可为以下的总和:离子统计差异(通常泊松统计);检测器噪声或与质谱仪自身检测器相关联的噪声(例如用于量值模式FT/MS数据的瑞利分布噪声);和由于其它来源的差异,如离子来源的稳定性或自动增益控制的缺陷。
鉴于此,离子统计差异(通常泊松统计);检测器噪声的总和乘以合理的裕量(如1到2的因数)可被用作质量迹线的强度相对于拟合的模型峰的差异的接受性准则。
分析系统被布置成由质量迹线152和与所鉴别错误质量迹线152对应的质谱数据131形成质谱数据131的压缩版本730。质谱数据131的压缩版本730包含非错误(或良好)质量迹线和与所鉴别错误质量迹线152对应的任选质谱数据131的检测事件。事件可包含以下中的任一项:质量迹线152的质量中心;质量迹线的分离参数中心、质量迹线152的信噪比(或测量结果)、质量迹线152的强度中的背景噪声的测量结果、质量迹线的一个或多个峰宽。举例来说,质量迹线152的事件可包含质量迹线的质量中心;质量迹线强度峰的分离参数中心;和质量迹线强度峰的峰宽。通常,与所鉴别错误质量迹线152对应的质谱数据131为错误质量迹线的质心。
换句话说,应了解,通过用那些质量迹线的对应事件数据替换与非错误质量迹线有关的质谱数据131和保留错误迹线的质谱数据131来压缩质谱数据131。
举例来说,在质量迹线中由在保留时间中的八个强度峰组成的色谱峰可首先需要存储24个双精度值(由每个强度峰的m/z值、保留时间和强度组成)。在上述压缩的情况下,如果质量迹线为非错误质量迹线,则3个双精度和一个单精度值(分别为质量、保留时间、强度和峰宽)可为足够的。这将减少大于6的因数。因为通常大部分质量迹线是非错误的,这提供有价值的总体压缩。实际上,甚至在其中所有质量迹线中的第三个为错误的情况下,质谱数据储存量将减少大于二的因数。
如上所述,具有少于预定义数量质心的质量迹线可被分类为错误质量迹线。然而,应了解,在一些情况下,作为先前描述的质量迹线生成和/或质量迹线提供步骤的一部分,具有少于预定义数量的质心的质量迹线可丢弃。在这些情况下,这类质量迹线将不被鉴别为错误质量迹线,因为它们已经被丢弃。
举例来说,质量迹线分析系统150可被布置成丢弃所有具有小于二个(或三个或其它预定义数量)数据点的质量迹线152。在另一实例中,质量迹线分析系统150可被布置成丢弃所有具有小于预定义数量的要素的质量迹线152(短质量迹线),除非峰组判定系统(如在国际专利公开案WO/2016/145331或美国专利7,962,301中中概述的系统,所述两个专利以全文引用的方式并入本文中)已经识别信号作为峰组的一部分。另外或替代地,如果峰高于如通过峰组判定系统确定的预定义信噪比阈值,则质量迹线分析系统150可被布置成不丢弃短质量迹线152。预定义数量可优选地在1和分离尺度在中的峰宽的一部分(通常需要至多峰宽的一半)之间。预定义S/N阈值可相对高,例如在10和100之间(10、20、50和100为普通值)。相对来说,质量迹线分析系统150可被布置成始终保留某些预定义相对或绝对质量的质量迹线(用于进一步确定它们是否为错误质量迹线),如来自量化试剂盒如NeuCodeiTRAQ或TMT的质量或用于SILAC量化的质量组。所有这些的试剂盒为本领域技术人员熟知的。
分析系统150经由网络750连接至另外的处理系统170。网络750可为适于在分析系统150和另外的处理系统170之间通信或传递数据的任何种类的数据通信网络。因此,网络170可包含以下的一种或多种:广域网、城域网、互联网、无线通信网络、有线或缆线通信网络、卫星通信网、电话网等。分析系统150和另外的处理系统170可被布置成以任何合适数据通信协议经由网络750彼此通信。举例来说,当网络750包含互联网时,数据通信协议可为TCP/IP、UDP、SCTP等。
分析系统150被布置成将质谱数据131的压缩版本730提供到另外的处理系统170。
通过在质量迹线生成阶段检测错误质量迹线,质谱数据131的压缩版本730能够保留关于错误质量迹线152的质谱数据131。这使得分析系统150能够丢弃关于其它质量迹线的质谱数据131,因为出于另外的处理技术的目的,这些质量迹线通过事件数据充分地描述。保留关于错误质量迹线152的质谱数据131,使得如果需要这些错误迹线的另外的分析作为另外的处理技术的一部分,则相关质谱数据131仍然可用。
以此方式,鉴于给定质量迹线的事件数据通常显著地小于与质量迹线152对应的原始质谱数据131,有效地压缩质谱数据131。因此,可丢弃原始质谱数据131,并且优先地使用质谱数据131的压缩版本730。实际上,应了解,分析模块150可以本地方式定位到质谱仪130,减少质谱数据131的大数据传送的需要。
还应了解,分析系统150可相对于质谱仪130的操作,实时生成质谱数据131的压缩版本730。这是因为质谱仪130的采集通常按洗脱参数的顺序,如上文阐述的质谱数据131的处理。此实时操作具有另一优点,即不必在任何一个时间存储整组质谱数据131、。可检查质量迹线152以查看在运行中它们生成和相关质谱数据131被丢弃时,质量迹线152是否为错误的。
可与现存技术一起使用上述压缩,以便减少波谱(或m/z)域中的噪声。这些技术的实例可发现于美国专利7,962,301和7,987,060中,所述两项专利以全文引用的方式并入。具体地说,可在应用上述压缩技术之前或之后使用这些方法压缩背景波谱噪声。在其中短于预定义数量的质心的质量迹线152被丢弃(而非鉴别为错误质量迹线)的上述情况中使用这类技术可提供额外压缩益处,因为与这些短(丢弃)质量迹线对应的质谱数据可被压缩,例如作为背景噪声。
应了解,可通过压缩系统执行错误质量迹线的进一步处理。举例来说,对于具有以下中的任一项的错误质量迹线:
●多个卷积色谱峰;
●由于相邻质量迹线的m/z偏转;
●具有充分界定的背景噪声的峰;
●纯背景或锁定质量;
●具有系统性质量趋势或拖尾峰的峰;
●具有低信噪比的峰
可经进一步分析以产生额外信息,从而允许与这些质量迹线有关的质谱数据在质谱数据的压缩版本中被丢弃,有利于对应事件和额外信息。举例来说,在存在多个卷积色谱峰的情况下,可计算额外质量和时间信息。
在由于相邻质量迹线而存在m/z偏转的情况下,可确定一组标签(例如检测的偏转,对干扰峰的引用;校正的质量等。)。在存在具有充分界定的背景噪声和/或纯背景或锁定质量的峰的情况下,可确定背景质量和强度和任选地另外的标签(例如锁定质量指数,对具有相同质量的相邻时间间隙的引用等。)。在存在具有低信噪比的峰的情况下,可记录信噪比。
在以上描述中,已经根据m/z比和强度论述质谱。然而,应了解,质谱可例如根据质量和相对丰度、质量和强度、m/z比和相对丰度等,以多种不同方式表示。以上论述同等地适用于本领域中已知表示质谱的任何其它方式。因此,技术人员将理解在本文中参考术语m/z的论述可同等地适用于术语质量,且反之亦然。
应了解,如上所述分离装置110可包含链接在一起的若干不同分离装置110。举例来说,然后,通过MALDI装置产生的物质流可引入到色谱以便进一步分离,其中所得物质流被提供到质谱仪130。
如上文阐述的,事件检测常利用模型峰。虽然基于分析模型如具体峰形式(例如高斯分布)在上文描述此内容,但是应了解此模型峰也可表示为一系列样品。当质量迹线不符合某一简单模型但是除按比例调整以外“自动类似”(和引起偏移)时,这可尤其方便。从质谱数据收集当模型峰信息时,这可尤其方便。平均峰形接着可与一组已知模型比较,在适当情况下从所述已知模型中选择并且参数化一个模型。当发现系统性形状不符合组中的任一个模型中时,观察到的平均峰可表示为一组样品。质量因素的拟合方法和确定(例如测量点与正确地按比例调整取样的模型峰的差异)不显著地不同。取样模型峰的线性或更高阶次插值可为所必要的,以便针对样品密度中的差异进行调节。
应了解,所描述的方法已示出为按特定次序进行的个别步骤。然而,技术人员应了解,这些步骤可以不同次序组合或进行,同时仍然获得所要结果。
应了解,可使用多种不同信息处理系统来实施本发明的实施例。具体地说,尽管图和其论述提供示例性计算系统和方法,但这些仅用于提供在论述本发明的各种方面时的有用参考。可在任何合适数据处理装置上进行本发明的实施例,如个人计算机、膝上型计算机、服务器计算机等。当然,系统和方法的描述已经出于论述的目的而简化并且它们仅为许多可用于本发明的实施例的不同类型的系统和方法之一。应了解,在逻辑块之间的边界仅为说明性的并且替代实施例可合并逻辑块或元件,或可将功能的替代分解赋于各种逻辑块或元件上。
应了解,上述功能性可作为硬件和/或软件实施为一或多个对应模块。举例来说,上述功能性可被实施为用于由系统的处理器执行的一个或多个软件组件。替代地,上述功能性可被实施为如在一个或多个现场可编程门阵列(FPGA)上的硬件,和/或一个或多个专用集成电路(ASIC)和/或一个或多个数字信号处理器(DSP)和/或其它硬件布置。在本文中所含的流程图中实施的或如上所述的方法步骤可各自通过对应的相应模块实施;在本文中所含的流程图中实施的或如上所述的多个方法步骤可通过单个模块一起实施。
应了解,只要本发明的实施例由计算机程序实施,那么携载计算机程序的存储媒体和传输媒体形成本发明的方面。所述计算机程序可具有一个或多个程序指令或程序代码,其当由计算机执行时实施本发明的实施例。如本文所使用的术语“程序”可为被设计成用于在计算机系统上执行的指令序列,并且可包括子程序、功能、程序、模块、目标方法、目标实施方案、可执行应用程序、小程序、服务器小程序、源代码、目标代码、共享库、动态链接库和/或被设计成用于在计算机系统上执行的其它指令序列。存储媒体可为磁盘(如硬盘驱动器或软盘)、光学光盘(如CD-ROM、DVD-ROM或BluRay盘)或存储器(如ROM、RAM、EEPROM、EPROM、闪速存储器或便携式/可拆卸存储器装置)等。传输媒体可为通信信号、数据广播、在两个或更多个计算机之间通信链接等。

Claims (15)

1.一种从自分离装置排出的物质流的质谱数据中提取作为分离参数的函数的质量迹线的计算机实施的方法,其中所述质谱数据由在质谱仪中的分析生成,所述方法包含:
接收所述质谱数据,其中所述质谱数据包含各自针对所述分离参数的相应值获得的多个质谱;
从所述多个质谱中鉴别根据所述分离参数排序的三个或更多个强度峰的序列,其中所述鉴别三个或更多个强度峰的所述序列包含:
选择在初始质量下的初始强度峰,和
对于强度峰的所述序列的每个其它强度峰,
至少基于强度峰的所述序列中的相邻强度峰的质量选择所述强度峰,
所述方法进一步包含从强度峰的所述鉴别的序列,提供所述物质流的给定排出化合物的质量迹线。
2.根据权利要求1所述的方法,其中对于强度峰的所述序列的每个其它强度峰,以所述强度峰处于在围绕相应预期质量的相应范围内的相应质量为条件选择所述强度峰,其中至少基于强度峰的所述序列中的相邻强度峰的所述质量确定所述相应预期质量。
3.根据权利要求2所述的方法,其中基于所述序列的先前选择的强度峰的平均值确定所述相应预期质量。
4.根据权利要求3所述的方法,其中所述序列的所述先前选择的强度峰的所述平均值为加权平均值。
5.根据权利要求3所述的方法,其中所述序列的所述先前选择的强度峰的所述平均值为加窗平均值。
6.根据权利要求2到5中任一项所述的方法,其中依据所述相邻强度峰的强度确定所述相应范围。
7.根据前述权利要求中任一项所述的方法,其中所述分离装置包含色谱仪,并且所述分离参数包含保留时间。
8.根据权利要求1到6中任一项所述的方法,其中所述分离参数包含以下中的任一种或多种:离子迁移率;pH;离子大小;碰撞截面;极化率。
9.根据权利要求1到6中任一项所述的方法,其中所述分离装置包含质谱成像装置,并且所述分离参数表示提供到所述质谱成像装置的样品的表面位置。
10.根据前述权利要求中任一项所述的方法,其中所述提供步骤进一步包含提供所述质量迹线的分离参数中心和质量中心。
11.根据权利要求10所述的方法,其中所述提供步骤包含将事件检测算法应用到所述质量迹线,从而生成与所述质量迹线对应的事件,所述事件包含所述分离参数中心和所述质量中心。
12.一种用于压缩质谱数据的计算机实施的方法,所述方法包含:
通过重复应用根据前述权利要求中任一项所述的方法,将所述质谱数据分解成多个质量迹线;
通过将事件检测算法应用到所述多个质量迹线中的每一个,鉴别所述多个质量迹线中的错误质量迹线;
由所述质量迹线和与所述鉴别的错误质量迹线对应的质谱数据形成所述质谱数据的压缩版本。
13.根据权利要求12所述的方法,其中所述质谱数据的所述压缩版本包含与所述鉴别的错误质量迹线对应的所述质谱数据和一个或多个事件,所述一个或多个事件通过应用所述事件检测算法代替与所述一个或多个事件相关的质谱数据生成。
14.一种设备,被布置成实施根据权利要求1到13中任一项所述的方法。
15.一种存储指令的计算机可读媒体,所述指令当由处理器执行时使所述处理器实施根据权利要求1到13中任一项所述的方法。
CN201810550353.7A 2017-06-02 2018-05-31 用于提取质量迹线的系统和方法 Active CN108982729B (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
EP17174385.9A EP3410109A1 (en) 2017-06-02 2017-06-02 Systems and methods for extracting mass traces
EP17174385.9 2017-06-02
EP18170779.5A EP3410110B1 (en) 2017-06-02 2018-05-04 Systems and methods for extracting mass traces
EP18170779.5 2018-05-04

Publications (2)

Publication Number Publication Date
CN108982729A true CN108982729A (zh) 2018-12-11
CN108982729B CN108982729B (zh) 2021-06-08

Family

ID=59021373

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810550353.7A Active CN108982729B (zh) 2017-06-02 2018-05-31 用于提取质量迹线的系统和方法

Country Status (3)

Country Link
US (2) US10347478B2 (zh)
EP (2) EP3410109A1 (zh)
CN (1) CN108982729B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112378986A (zh) * 2021-01-18 2021-02-19 宁波华仪宁创智能科技有限公司 质谱分析方法
CN114674909A (zh) * 2020-12-10 2022-06-28 塞莫费雪科学(不来梅)有限公司 用于处理质谱的方法和系统

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3576129B1 (en) * 2018-06-01 2023-05-03 Thermo Fisher Scientific (Bremen) GmbH Method for detecting the isotopic labelling state of unknown species of molecules
CN112534267A (zh) * 2018-08-31 2021-03-19 Dh科技发展私人贸易有限公司 复杂样本中相关化合物的识别和评分
WO2022063816A1 (en) 2020-09-23 2022-03-31 Roche Diagnostics Gmbh Computer-implemented method for detecting at least one interference and/or at least one artefact in at least one chromatogram
WO2023062783A1 (ja) * 2021-10-14 2023-04-20 株式会社島津製作所 クロマトグラフ質量分析装置、及びクロマトグラフ質量分析データ処理方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006130983A1 (en) * 2005-06-08 2006-12-14 Mds Inc. Doing Business Through Its Mds Sciex Division Dynamic background signal exclusion in chromatography/mass spectrometry data-dependent data acquisition
CN1885030A (zh) * 2005-06-24 2006-12-27 安捷伦科技有限公司 用于质谱数据处理的仪器和方法
US20080234948A1 (en) * 2005-07-08 2008-09-25 Metanomics Gmbh System and Method for Characterizing a Chemical Sample
US20160071711A1 (en) * 2013-04-22 2016-03-10 Shimadzu Corporation Imaging mass spectrometric data processing method and imaging mass spectrometer

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5300771A (en) * 1992-06-02 1994-04-05 Analytica Of Branford Method for determining the molecular weights of polyatomic molecules by mass analysis of their multiply charged ions
WO2004019035A2 (en) * 2002-08-22 2004-03-04 Applera Corporation Method for characterizing biomolecules utilizing a result driven strategy
US6983213B2 (en) * 2003-10-20 2006-01-03 Cerno Bioscience Llc Methods for operating mass spectrometry (MS) instrument systems
GB2410123B (en) 2003-09-25 2006-11-01 Thermo Finnigan Llc Method of processing and storing mass spectrometry data
US7351956B2 (en) * 2004-04-08 2008-04-01 Mdc Inc. Dynamic background signal exclusion in chromatography/mass spectrometry data-dependent data acquisition
CA2501003C (en) * 2004-04-23 2009-05-19 F. Hoffmann-La Roche Ag Sample analysis to provide characterization data
EP1766394B1 (en) 2004-05-20 2020-09-09 Waters Technologies Corporation System and method for grouping precursor and fragment ions using selected ion chromatograms
GB2472951B (en) 2004-11-29 2011-04-27 Thermo Finnigan Llc Method of processing mass spectrometry data
EP2322922B1 (en) 2009-08-26 2015-02-25 Thermo Fisher Scientific (Bremen) GmbH Method of improving the resolution of compounds eluted from a chromatography device
US20140142865A1 (en) * 2012-11-20 2014-05-22 David A. Wright Automatic Reconstruction of MS-2 Spectra from all Ions Fragmentation to Recognize Previously Detected Compounds
US20140179020A1 (en) * 2012-12-20 2014-06-26 David A. Wright Methods and Apparatus for Identifying Ion Species Formed during Gas-Phase Reactions
WO2016145331A1 (en) 2015-03-12 2016-09-15 Thermo Finnigan Llc Methods for data-dependent mass spectrometry of mixed biomolecular analytes

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006130983A1 (en) * 2005-06-08 2006-12-14 Mds Inc. Doing Business Through Its Mds Sciex Division Dynamic background signal exclusion in chromatography/mass spectrometry data-dependent data acquisition
CN1885030A (zh) * 2005-06-24 2006-12-27 安捷伦科技有限公司 用于质谱数据处理的仪器和方法
US20080234948A1 (en) * 2005-07-08 2008-09-25 Metanomics Gmbh System and Method for Characterizing a Chemical Sample
US20160071711A1 (en) * 2013-04-22 2016-03-10 Shimadzu Corporation Imaging mass spectrometric data processing method and imaging mass spectrometer

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114674909A (zh) * 2020-12-10 2022-06-28 塞莫费雪科学(不来梅)有限公司 用于处理质谱的方法和系统
CN112378986A (zh) * 2021-01-18 2021-02-19 宁波华仪宁创智能科技有限公司 质谱分析方法
CN112378986B (zh) * 2021-01-18 2021-08-03 宁波华仪宁创智能科技有限公司 质谱分析方法

Also Published As

Publication number Publication date
US20190295830A1 (en) 2019-09-26
EP3410110B1 (en) 2024-04-17
EP3410110A1 (en) 2018-12-05
EP3410109A1 (en) 2018-12-05
US10347478B2 (en) 2019-07-09
US10504707B2 (en) 2019-12-10
US20180350577A1 (en) 2018-12-06
CN108982729B (zh) 2021-06-08

Similar Documents

Publication Publication Date Title
CN108982729A (zh) 用于提取质量迹线的系统和方法
US8975577B2 (en) System and method for grouping precursor and fragment ions using selected ion chromatograms
US8447527B2 (en) Methods and apparatus for performing retention-time matching
US8105838B2 (en) Generation and use of a catalog of polypeptide-related information for chemical analyses
US8592752B2 (en) Techniques for performing retention-time matching of precursor and product ions and for constructing precursor and product ion spectra
JP4704034B2 (ja) クロマトグラフィ/分光測定データの解析でデータビンニングを用いる方法
Zhurov et al. Distinguishing analyte from noise components in mass spectra of complex samples: where to cut the noise?
US11423331B2 (en) Analytical data analysis method and analytical data analyzer
JP4857000B2 (ja) 質量分析システム
US20090210167A1 (en) Computational methods and systems for multidimensional analysis
Wille et al. Liquid chromatography high-resolution mass spectrometry in forensic toxicology: what are the specifics of method development, validation and quality assurance for comprehensive screening approaches?
CN115380212A (zh) 用于比较群组内和群组间数据的方法、介质和系统
JP2008008801A (ja) 質量分析システム
CN111257401B (zh) 用于测定离子种类的质量的系统和方法
JP2008224636A (ja) 質量分析システム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant