CN113631920B - 用于前体推理的扫描带数据和概率框架的实时编码的方法 - Google Patents

用于前体推理的扫描带数据和概率框架的实时编码的方法 Download PDF

Info

Publication number
CN113631920B
CN113631920B CN202080025386.5A CN202080025386A CN113631920B CN 113631920 B CN113631920 B CN 113631920B CN 202080025386 A CN202080025386 A CN 202080025386A CN 113631920 B CN113631920 B CN 113631920B
Authority
CN
China
Prior art keywords
overlapping
ion
mass
window
precursor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202080025386.5A
Other languages
English (en)
Other versions
CN113631920A (zh
Inventor
N·G·布洛姆菲尔德
G·伊沃什夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
DH Technologies Development Pte Ltd
Original Assignee
DH Technologies Development Pte Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by DH Technologies Development Pte Ltd filed Critical DH Technologies Development Pte Ltd
Publication of CN113631920A publication Critical patent/CN113631920A/zh
Application granted granted Critical
Publication of CN113631920B publication Critical patent/CN113631920B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01JELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
    • H01J49/00Particle spectrometers or separator tubes
    • H01J49/0027Methods for using particle spectrometers
    • H01J49/0036Step by step routines describing the handling of the data generated during a measurement
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/62Detectors specially adapted therefor
    • G01N30/72Mass spectrometers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8696Details of Software
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/17Function evaluation by approximation methods, e.g. inter- or extrapolation, smoothing, least mean square method
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01JELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
    • H01J49/00Particle spectrometers or separator tubes
    • H01J49/004Combinations of spectrometers, tandem spectrometers, e.g. MS/MS, MSn
    • H01J49/0045Combinations of spectrometers, tandem spectrometers, e.g. MS/MS, MSn characterised by the fragmentation or other specific reaction

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Mathematical Physics (AREA)
  • Computational Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Pathology (AREA)
  • Immunology (AREA)
  • Biochemistry (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Computing Systems (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
  • Electron Tubes For Measurement (AREA)

Abstract

前体离子传输窗口跨前体离子质量范围以重叠的步长移动。由质量过滤器在每个重叠步长传输的前体离子被裂解或传输。针对每个重叠窗口检测形成质谱数据的每个重叠窗口的一个或多个结果所得的产物离子或前体离子中的每一个的强度或计数。检测到的每个独特产物离子在数据获取期间被实时编码。这种编码包括检测到重叠窗口的每个独特离子的计数或强度的总和以及与每个总和相关联的窗口的位置。用于每个独特离子的编码存储在存储器设备中,而不是质谱数据。去模糊算法或数值方法被用于从编码的数据中确定每个独特离子的前体离子。

Description

用于前体推理的扫描带数据和概率框架的实时编码的方法
相关申请
本申请要求于2019年5月31日提交的美国临时专利申请序列No.62/855,242的权益,其内容通过引用整体并入本文。
技术领域
本文的教导涉及编码和存储扫描SWATH质谱数据。更具体而言,本文的教导涉及用于通过基于四极响应函数或前体离子推断概率函数应用扫描四极维度的实时编码来减小存储扫描SWATH数据所需的文件尺寸的系统和方法。
背景技术
如下所述,扫描SWATH是一种串联质谱方法,其中跨质量范围扫描前体离子质量选择窗口或前体离子传输窗口,使得连续的窗口具有大面积重叠和小面积非重叠。这种扫描使结果所得的产物离子成为被扫描的前提离子传输窗口的函数。这个附加信息在识别负责每个产物离子的一个或多个前体离子方面是有用的,这在传统SWATH中有时很难做到。
扫描SWATH的一个问题是它要求长期(例如,文件)存储比常规SWATH多得多的数据。增加的文件存储量与前体离子传输窗口重叠的量大致成比例。因此,如果n个前体离子传输窗口在扫描SWATH中重叠,那么对于被分析的相同的前体离子质量范围,在扫描SWATH实验中至少需要将比常规SWATH实验中多大致n倍的数据存储到文件中。
虽然文件存储本身不断变得越来越便宜,但就所需的处理时间和所需的处理能力而言,对此类大文件的后处理具有显著的成本。扫描存储在文件中的SWATH数据被后处理,例如,以推断被测产物离子的前体离子。大量的数值分解或概率推理方法可以用于扫描SWATH数据。
传统上,对于扫描SWATH实验,从每个重叠的前体离子传输窗口产生的用于每个产物离子的原始质量分析器检测(例如,例如,飞行时间(TOF)质量分析器计数)被存储到文件。可替代地,也可以使用中间类型的数据。例如,用于每个重叠的前体离子传输窗口的每个产物离子谱可以存储到文件。遗憾的是,在这两种方法中,如果n是重叠的前体离子传输窗口的数量,那么存储尺寸仍然至少是存储相同类型数据的常规SWATH所需的存储尺寸的大致n倍。
因此,需要附加的系统和方法来减小存储扫描SWATH数据所需的文件尺寸,而不会丢失对数据进行后处理以获得如前体离子推断之类的信息所需的任何信息。
串联质谱法和扫描SWATH
一般而言,串联质谱法或MS/MS是用于分析化合物的众所周知的技术。串联质谱法涉及从样本中电离一种或多种化合物、选择一种或多种化合物的一种或多种前体离子、将一种或多种前体离子裂解为产物离子以及对产物离子进行质量分析。
串联质谱法可以提供定性和定量信息。产物离子谱可以被用于识别感兴趣的分子。一种或多种产物离子的强度可以被用于定量样本中存在的化合物的量。
可以使用串联质谱仪执行大量不同类型的实验方法或工作流程。这些工作流程的三大类是靶向获取、信息相关的获取(IDA)或数据相关的获取(DDA)和数据独立的获取(DIA)。
在靶向获取方法中,为感兴趣的化合物预定义从前体离子到产物离子的一个或多个过渡。当样本被引入串联质谱仪时,在多个时间段或循环中的每个时间段或循环期间询问一个或多个过渡。换句话说,质谱仪选择并裂解每个过渡的前体离子,并对过渡的产物离子执行目标质量分析。因此,为每个过渡产生质谱。靶向获取方法包括但不限于多反应监视(MRM)和选择的反应监视(SRM)。
在IDA方法中,随着样本被引入串联质谱仪,用户可以指定用于执行产物离子的靶向或非靶向质量分析的准则。例如,在IDA方法中,执行前体离子或质谱法(MS)调查扫描以生成前体离子峰列表。用户可以选择准则来过滤峰列表以找到峰列表上前体离子的子集。然后对前体离子的子集的每个前体离子执行MS/MS。为每个前体离子产生产物离子谱。随着样本被引入串联质谱仪,对前体离子的子集的前体离子重复执行MS/MS。
但是,在蛋白质组学和许多其它样本类型中,化合物的复杂性和动态范围非常大。这对传统的靶向和IDA方法提出了挑战,要求非常高速的MS/MS获取来深入询问样本,以便既识别又量化范围广泛的分析物。
因此,开发了DIA方法,串联质谱法的第三大类。这些DIA方法已被用于提高从复杂样本收集数据的重现性和全面性。DIA方法也可以被称为非特定裂解方法。在传统的DIA方法中,串联质谱仪的动作在基于先前前体或产物离子扫描中获取的数据的MS/MS扫描之间没有变化。而是选择前体离子质量范围。然后前体离子传输窗口跨前体离子质量范围步进。前体离子传输窗口中的所有前体离子被裂解,并且前体离子传输窗口中的所有前体离子的所有产物离子都被质量分析。
用于扫描质量范围的前体离子传输窗口可以非常窄,使得窗口内多个前体的可能性小。这种类型的DIA方法称为例如MS/MSALL。在MS/MSALL方法中,大约1amu的前体离子传输窗口在整个质量范围内被扫描或步进。为每个1amu前体质量窗口产生产物离子谱。通过组合每个质量选择窗口的产物离子谱,产生整个前体离子质量范围的产物离子谱。分析或扫描整个质量范围一次所需的时间被称为一个扫描周期。但是,在每个周期期间跨宽的前体离子质量范围扫描窄的前体离子传输窗口对于一些仪器和实验来说是不切实际的。
因此,更大的前体离子传输窗口或具有更大宽度的选择窗口跨整个前体质量范围步进。这种类型的DIA方法被称为例如SWATH获取。在SWATH获取中,在每个周期中跨前体质量范围步进的前体离子传输窗口的宽度可以是5-25amu,或者甚至更大。与MS/MSALL方法一样,每个前级离子传输窗口中的所有前体离子都被裂解,并且每个质量选择窗口中所有前体离子的所有产物离子都进行质量分析。但是,因为使用了更宽的前体离子传输窗口,所以与MS/MSALL方法的周期时间相比,周期时间可以显著减少。或者,对于液相色谱(LC),可以增加累积时间。一般而言,对于LC,周期时间由LC峰定义。必须跨LC峰获得足够多的点(强度作为周期时间的函数)才能确定其形状。当周期时间由LC定义时,一个周期中可以执行的实验或质谱法扫描的次数定义每次实验或扫描可以累积离子观察的时间。因此,更宽的前体离子传输窗口可以增加累积时间。
美国专利No.8,809,770描述了可以如何使用SWATH获取来提供关于感兴趣的化合物的前体离子的定量和定性信息。特别地,将从裂解前体离子传输窗口中发现的产物离子与感兴趣的化合物的已知产物离子的数据库进行比较。此外,分析从裂解前体离子传输窗口中发现的产物离子的离子痕量或提取的离子色谱图(XIC),以提供定量和定性信息。
但是,例如,在使用SWATH获取分析的样本中识别感兴趣的化合物会是困难的。这会是困难的,因为或者没有随前体离子传输窗口提供的前体离子信息来帮助确定产生每个产物离子的前体离子,或者提供的前体离子信息来自具有低灵敏度的质谱法(MS)观察。此外,因为随前体离子传输窗口提供的特定前体离子信息很少或没有,所以也难以确定产物离子是否与前体离子传输窗口内的多个前体离子卷积或包括来自多个前体离子的贡献。
因此,开发了一种在SWATH获取中扫描前体离子传输窗口的方法,称为扫描SWATH。本质上,在扫描SWATH中,前体离子传输窗口跨质量范围进行扫描,因此连续的窗口具有大面积重叠和小面积非重叠。这种扫描使结果所得的产物离子成为被扫描的前体离子传输窗口的函数。进而,这种附加信息可以被用于识别负责每个产物离子的一个或多个前体离子。
扫描SWATH已在国际公开No.WO 2013/171459 A2(下文中称为“'459申请”)中进行了描述。在'459申请中,25Da的前体离子传输窗口或前体离子传输窗口随时间进行扫描,使得前体离子传输窗口的范围随时间改变。然后将检测到产物离子的定时与传输它们的前体离子的前体离子传输窗口的定时关联。
通过首先绘制检测到的每个产物离子的质荷比(m/z)作为由四极杆质量过滤器传输的前体离子m/z值的函数来完成相关性。由于前体离子传输窗口是随时间扫描的,因此由四极杆质量过滤器传输的前体离子m/z值也可以被认为是时间。检测到特定产物离子的开始和结束时间与其前体从四极杆传输的开始和结束时间关联。因此,产物离子信号的开始和结束时间被用于确定其对应前体离子的开始和结束时间。
美国专利No.10,068,753(下文中称为“'753专利”)中也描述了扫描SWATH。'753专利通过组合来自重叠的前体离子传输窗口的连续组的产物离子光谱提高产物离子与其对应前体离子的相关性的准确性。通过对产品离子谱中产物离子的强度进行连续求和,组合来自连续组的产物离子谱。这种求和产生可以具有与前体质量不一致的形状的函数。该形状将产物离子强度描述为前体质量的函数。前体离子是根据为产物离子计算的函数确定的。
优选的是具有用于扫描SWATH的矩形前体离子传输窗口。但是,扫描SWATH的另一个优点是它可以同等且高效地处理任何离子传输函数。离子传输函数甚至不必提前已知,它可以根据数据本身进行校准。换句话说,虽然矩形前体离子传输窗口是优选的,但是可以使用任何形状的前体离子传输窗口。
'459申请和'753专利提供了用于在扫描SWATH数据时识别与产物离子对应的一种或多种前体离子的方法。但是,'459申请和'753专利并未解决在不丢失数据的后处理所需的任何信息的情况下减小存储扫描SWATH数据所需的文件尺寸。
发明内容
根据各种实施例,公开了用于编码和存储从重叠的前体离子传输窗口测得的串联质谱法数据的系统、方法和计算机程序产品。该系统包括离子源设备、质量过滤器、裂解设备、质量分析器和处理器。
离子源设备将样本或样本中感兴趣的化合物变换成离子束。质量过滤器接收离子束。然后,质量过滤器通过跨前体离子质量范围R m/z以S m/z的步长尺寸在重叠步长中移动具有前体离子质荷比(m/z)宽度W的前体离子传输窗口来过滤离子。跨质量范围产生一系列重叠的传输窗口。质量过滤器在每个重叠步长处在传输窗口内传输前体离子。
裂解设备裂解或传输由质量过滤器在每个重叠步长处传输的前体离子。为该系列的每个重叠窗口产生一个或多个结果所得的产物离子。质量分析器针对该系列的每个重叠窗口检测形成该系列的每个重叠窗口的质谱数据的所述一个或多个结果所得的产物离子中的每一个的强度或计数。
处理器与离子源设备、质量过滤器、裂解设备和质量分析器通信。代替将系列的每个重叠窗口的质谱数据存储在存储器设备中的文件中,处理器执行编码和存储步骤。
处理器通过执行多个子步骤在数据获取期间实时地编码和存储由质量分析器检测到的每个独特的产物离子。首先,处理器识别具有每个独特离子的第一次出现的系列的第一次出现重叠窗口。处理器然后选择紧接在第一次出现重叠窗口之前的系列的一组G个重叠窗口,使得该组跨越至少传输窗口的宽度W。例如,根据G≥W/S计算组中重叠窗口的数量G。例如,由G个重叠窗口的组跨越的传输窗口的宽度W是前体离子不确定区间。
在各种实施例中,前体离子的似然性跨不确定性区间W可以不同。为简单起见,将其视为常数(或矩形前体离子似然性函数,其中前体离子似然性函数等于质量过滤器传输函数)。不确定性区间W上的恒定前体离子似然性导致三角形前体离子不确定性分布函数。但是,另一种可能的前体离子不确定性分布函数可以是高斯前体离子不确定性分布函数。
处理器计算从该组的G个重叠窗口的每个窗口检测到的每个独特离子的计数或强度的总和。处理器将该总和与组的重叠窗口的位置相关联。处理器将所选择的系列的G个重叠窗口的组向前移一个重叠窗口,计算从该组的G个重叠窗口的每个窗口检测到的每个独特离子的计数或强度的总和,将总和与组的重叠窗口的位置相关联,将总和和位置存储在存储器设备中,并重复这些步骤,直到组的至少一个重叠窗口不再与第一次出现重叠窗口重叠。
申请人的教导的这些和其它特征在本文中阐述。
附图说明
本领域技术人员将理解,以下描述的附图仅用于说明目的。附图无意以任何方式限制本教导的范围。
图1是图示在其上可以实现本教导的实施例的计算机系统的框图。
图2是示出根据各种实施例的用于编码和存储从重叠的前体离子传输窗口测得的串联质谱法数据的系统的示意图。
图3是示出根据各种实施例的在扫描SWATH数据获取期间如何实时地编码检测到的每个独特产物离子的图。
图4是示出根据各种实施例的在扫描SWATH数据获取期间如何实时地存储或编码每个独特离子的求和的计数或强度的集合的示例性图。
图5是示出根据各种实施例的在编码之后压缩求和的计数或强度仍保留推断前体离子所必需的信息的示例性曲线图。
图6是示出根据各种实施例的在将去模糊算法应用于数据之前求和的产物离子计数被绘制为前体离子传输窗口位置和产物离子m/z的函数的示例性热图曲线图。
图7是示出根据各种实施例的在将去模糊算法应用于图6的数据之后求和的产物离子计数被绘制为前体离子传输窗口位置和产物离子m/z的函数的示例性热图曲线图。
图8是根据各种实施例的示例性图,包括示出在将去模糊算法应用于数据之前求和的产物离子计数被绘制为色谱时间和前体离子传输窗口位置的函数的热图曲线图,以及示出从用于前体离子m/z值的热图曲线图中找到的XIC的曲线图。
图9是根据各种实施例的示例性图,包括示出在将去模糊算法应用于图8的数据之后求和的产物离子计数被绘制为色谱时间和前体离子传输窗口位置的函数的热图曲线图,以及示出从用于前体离子m/z值的热图曲线图中找到的XIC的曲线图。
图10是示出根据各种实施例的用于编码和存储从重叠的前体离子传输窗口测得的串联质谱法数据的方法的流程图。
图11是根据各种实施例的包括一个或多个不同软件模块的系统的示意图,这些软件模块执行用于编码和存储从重叠的前体离子传输窗口测得的串联质谱法数据的方法。
在详细描述本教导的一个或多个实施例之前,本领域的技术人员将认识到的是,本教导的应用不限于下面的详细描述中阐述或附图中图示的组件的构造、布置和步骤的布置的细节。而且,应该理解的是,本文使用的措词和术语是出于描述的目的,而不应当被认为是限制性的。
具体实施方式
计算机实现的系统
图1是图示在其上可以实现本教导的实施例的计算机系统100的框图。计算机系统100包括总线102或用于传送信息的其它通信机制,以及与总线102耦合以用于处理信息的处理器104。计算机系统100还包括耦合到总线102的存储器106,其可以是随机存取存储器(RAM)或其它动态存储设备,用于存储要由处理器104执行的指令。存储器106还可以被用于在执行要由处理器104执行的指令期间存储临时变量或其它中间信息。计算机系统100还包括耦合到总线102的只读存储器(ROM)108或其它静态存储设备,用于存储用于处理器104的静态信息和指令。提供诸如磁盘或光盘之类的存储设备110,并将其耦合到总线102以存储信息和指令。
计算机系统100可以经由总线102耦合到显示器112,诸如阴极射线管(CRT)或液晶显示器(LCD),以向计算机用户显示信息。包括字母数字键和其它键的输入设备114耦合到总线102,用于将信息和命令选择传送到处理器104。另一种类型的用户输入设备是光标控件116,诸如鼠标、轨迹球或光标方向键,用于将方向信息和命令选择传送到处理器104并用于控制显示器112上的光标移动。这种输入设备通常在两个轴(即,第一轴(即,x)和第二轴(即,y))上具有两个自由度,这允许设备指定平面中的位置。
计算机系统100可以执行本教导。与本教导的某些实施方式一致,响应于处理器104执行存储器106中包含的一个或多个指令的一个或多个序列,由计算机系统100提供结果。此类指令可以从诸如存储设备110之类的另一个计算机可读介质读入存储器106。存储器106中包含的指令序列的执行使处理器104执行本文所述的过程。可替代地,可以使用硬连线电路系统代替软件指令或与软件指令结合使用以实现本教导。因此,本教导的实施方式不限于硬件电路系统和软件的任何特定组合。
如本文所使用的,术语“计算机可读介质”是指参与向处理器104提供指令以供执行的任何介质。这种介质可以采取许多形式,包括但不限于非易失性介质、易失性介质和前体离子质量选择介质。非易失性介质包括例如光盘或磁盘,诸如存储设备110。易失性介质包括动态存储器,诸如存储器106。前体离子质量选择介质包括同轴电缆、铜线和光纤,包括构成总线102的电线。
计算机可读介质的常见形式包括例如软盘、柔性盘、硬盘、磁带或任何其它磁介质,CD-ROM、数字视频盘(DVD)、蓝光盘、任何其它光学介质,拇指驱动器、存储卡、RAM、PROM和EPROM、FLASH-EPROM、任何其它存储芯片或盒带,或计算机可以从中读取的任何其它有形介质。
各种形式的计算机可读介质可以涉及将一个或多个指令的一个或多个序列携带到处理器104以供执行。例如,指令最初可以被携带在远程计算机的磁盘上。远程计算机可以将指令加载到其动态存储器中并使用调制解调器通过电话线发送指令。计算机系统100本地的调制解调器可以在电话线上接收数据并使用红外发送器将数据转换成红外信号。耦合到总线102的红外检测器可以接收红外信号中携带的数据并将数据放置在总线102上。总线102将数据携带到存储器106,处理器104从存储器106检索并执行指令。由存储器106接收的指令可以可选地在处理器104执行之前或之后存储在存储设备110上。
根据各种实施例,被配置为由处理器执行以执行方法的指令存储在计算机可读介质上。计算机可读介质可以是存储数字信息的设备。例如,计算机可读介质包括如本领域中已知的用于存储软件的光盘只读存储器(CD-ROM)。计算机可读介质由适于执行被配置为执行的指令的处理器访问。
为了说明和描述的目的,已经给出了本教导的各种实施方式的以下描述。它不是详尽的并且不将本教导限制到所公开的精确形式。鉴于以上教导,修改和变化是可能的,或者可以从本教导的实践获取。此外,所描述的实施方式包括软件,但是本教导可以被实现为硬件和软件的组合或者单独地实现为硬件。本教导可以用面向对象和非面向对象的编程系统来实现。
编码和存储扫描SWATH数据
如上所述,扫描SWATH是串联质谱法方法,其中跨质量范围扫描前体离子传输窗口,使得连续窗口具有大面积重叠和小面积非重叠。扫描SWATH的一个问题是它要求长期(例如,文件)存储比常规SWATH多得多的数据。因此,需要附加的系统和方法来减小存储扫描SWATH数据所需的文件尺寸,而不会丢失对数据进行后处理以获得如前体离子推断之类的信息所需的任何信息。
'459申请和'753专利提供了用于在扫描SWATH数据中识别与产物离子对应的一种或多种前体离子的方法。但是,'459申请和'753专利没有解决在不丢失数据后处理所需的任何信息的情况下减小存储扫描SWATH数据所需的文件尺寸。
在各种实施例中,存储扫描SWATH数据所需的文件尺寸通过基于四极杆响应函数或前体离子推断概率函数的扫描四极杆维度的实时编码而减小。换句话说,代替针对每个检测到的产物离子存储从扫描SWATH的每次扫描中收集的所有原始检测数据,而是存储一系列求和的计数或强度及其位置,其描述每个检测到的产物离子在扫描四极杆维度中或随着传输窗口沿着前体离子质量范围的移动如何变化。这显著减小了存储扫描SWATH数据所需的文件尺寸,而不会丢失对数据进行后处理以获得如前体离子推断之类的信息所需的任何信息。
用于编码和存储扫描SWATH数据的系统
图2是示出根据各种实施例的用于编码和存储从重叠前体离子传输窗口测得的串联质谱法数据的系统的示意图200。图2的系统包括离子源设备210、质量过滤器220、裂解设备230、质量分析器240和处理器250。
在各种实施例中,图2的系统还可以包括样本引入设备260。例如,样本引入设备260随时间将一种或多种感兴趣的化合物从样本引入到离子源设备210。样本引入设备260可以执行包括但不限于注射、液相色谱、气相色谱、毛细管电泳或离子迁移的技术。
在图2的系统中,质量过滤器220和裂解设备230被示为四极杆的不同级,而质量分析器240被示为飞行时间(TOF)设备。本领域普通技术人员可以认识到的是,这些级中的任何一个都可以包括其它类型的质谱法设备,包括但不限于离子阱、轨道阱、离子迁移设备或傅立叶变换离子回旋共振(FT-ICR)设备。
离子源设备210将样本或感兴趣的化合物从样本变换成离子束。离子源设备210可以执行电离技术,包括但不限于基质辅助的激光解吸/电离(MALDI)或电喷雾电离(ESI)。
质量过滤器220接收离子束。质量过滤器220跨前体离子质量范围R m/z以S m/z的步长尺寸在重叠步长中移动具有前体离子质荷比(m/z)宽度W的前体离子传输窗口来过滤离子。跨质量范围产生一系列重叠的传输窗口。质量过滤器220在每个重叠步长在传输窗口内传输前体离子。
串联质谱仪201的裂解设备230裂解或传输由质量过滤器220在每个重叠步长传输的前体离子。为该系列的每个重叠窗口产生一个或多个结果所得的产物离子。当使用足够高以分裂离子的碰撞能量时,裂解设备230裂解前体离子。当使用足够低的不使离子裂解的碰撞能量时,裂解设备230传输前体离子。因此,结果产生的产物离子可以包括前体离子。
串联质谱仪201的质量分析器240针对该系列的每个重叠窗口检测形成该系列的每个重叠窗口的质谱数据的一个或多个结果所得的产物离子中的每一个的强度或计数。如果质量分析器240是如图所示的TOF设备,那么它检测计数。例如,如果质量分析器240是四极杆,那么它检测强度。
处理器250可以是但不限于计算机、微处理器、图1的计算机系统或能够从串联质谱仪发送和接收控制信号和数据并处理数据的任何设备。处理器250与离子源设备210、质量过滤器220、裂解设备230和质量分析器240通信。处理器250被示为分离的设备,但可以是串联质谱仪201或另一个设备的处理器或控制器。
代替将系列的每个重叠窗口的质谱数据存储在存储器设备(未示出)中的文件中,处理器250执行编码和存储步骤。
处理器250通过执行多个子步骤在数据获取期间实时地编码和存储由质量分析器240检测到的每个独特的产物离子。首先,处理器250识别具有每个独特离子的第一次出现的该系列的第一次出现重叠窗口。
图3是示出根据各种实施例的在扫描SWATH数据获取期间如何实时地编码检测到的每个独特产物离子的图300。曲线310示出在前体离子质量范围内的m/z 321处存在前体离子320。具有m/z宽度W的前体离子传输窗口330跨质量范围以步长尺寸S m/z步进,从而产生一系列重叠传输窗口。在图3中,例如,独特产物离子301的第一次出现发生在第一次出现重叠窗口331中。
返回到图2,处理器250然后选择紧接在第一次出现重叠窗口之前的系列的一组G个重叠窗口,使得该组跨越至少传输窗口的宽度W。例如,根据G≥W/S计算组中重叠窗口的数量G。例如,由G个重叠窗口的组跨越的传输窗口的宽度W是前体离子不确定区间。处理器250计算从组的G个重叠窗口的每个窗口检测到的每个独特离子的计数或强度的总和。处理器250将总和与组的重叠窗口的位置相关联。
例如,在图3中,选择紧接在第一次出现重叠窗口331之前的系列的G个重叠窗口的组350,使得组350跨越至少前体离子不确定区间,该区间是传输窗口330的宽度W。组350中重叠窗口的数量G是根据G≥W/S计算的并且在这个示例中是8。计算从组350的G个重叠窗口的每个窗口检测到的独特产物离子301的计数或强度的总和。为组350计算的总和351被示为绘制在曲线图360中。总和351与组350的第一重叠窗口的位置相关联并且被绘制在曲线图360中组350的第一重叠窗口的位置处。
返回到图2,处理器250将所选择的系列的G个重叠窗口的组向前移一个重叠窗口。处理器250计算从组的G个重叠窗口的每个窗口检测到的每个独特离子的计数或强度的总和。处理器250将总和与组的重叠窗口的位置相关联。处理器250将总和和位置存储在存储器设备中。处理器250重复这些步骤,直到组的至少一个重叠窗口不再与第一次出现重叠窗口重叠。
例如,在图3中,组350向前移动一个重叠窗口。计算从组350的G个重叠窗口的每个窗口检测到的独特产物离子301的计数或强度的总和。该总和与组350的第一重叠窗口的位置相关联。该总和和位置存储在存储器设备中。重复这些步骤,直到组350的至少一个重叠窗口不再与第一次出现重叠窗口331重叠。例如,总和和位置存储在存储器设备的文件中。
图4是示例图400,其示出了根据各种实施例的在扫描SWATH数据获取期间如何实时存储或编码每个独特离子的求和的计数或强度的集合。在图4中,再次示出了图3的曲线图360。曲线图360的独特产物离子的求和的计数或强度及其位置的集合410存储在存储器设备中。例如,集合410被存储为强度和位置(前体离子m/z)对的系列412。由于集合410包括17个点,因此系列412包括17个强度和位置对(I1,M1),(I2,M2),…,(I17,M17)。
图4的集合410或系列412与图3的前体离子传输窗口330的比较表明,图4的存储集合410或系列412显著降低了扫描SWATH的每个产物离子的存储要求。图3的每个传输窗口330表示先前必须存储的产物离子质谱。此外,每个传输窗口可以包括多个产物离子的强度。图4通过将产物离子强度求和并且仅存储与相同前体离子对应的强度显著降低了存储扫描SWATH的产物离子的存储要求。换句话说,通过使用将产物离子的强度与前体离子m/z关联的编码,显著降低了产物离子数据的存储要求。
在图3-4的曲线图360中,求和的计数或强度351具有三角形形状。这个三角形形状是由于图2的四极杆过滤器220传输具有均匀概率分布函数的前体离子。例如,其它质谱仪和质量过滤器会产生不同的形状。换句话说,概率分布函数的形状取决于每个特定质谱仪的不确定性区间。此外,不确定区间取决于串联质谱仪的质量过滤器的函数。
具有使用矩形前体离子传输产生矩形前体离子传输函数的质量过滤器的理想串联质谱仪进而产生三角形不确定性函数,诸如图3-4的曲线图360的函数370。函数370描述图3的独特产物离子301的求和的计数或强度如何随着组350的位置而变化。返回到图4,曲线图360的函数370可以被描述为函数420。进而,数学函数422可以被用于描述函数420。注意的是,a是数学函数422中三角形底边的长度,并且m是三角形侧边延伸的斜率或上升。甚至更简单地,函数420可以被描述为三角形422的位置及其底边的宽度a。再次,理想地,在各种实施例中,对于这种类型的质谱仪,可以最简单地将产物离子编码为三角函数的位置和宽度。
返回到图2,在存储步骤中,处理器250将每个独特离子的求和的计数或强度和位置的集合存储在存储器设备(未示出)的文件中。在各种实施例中,在存储该集合之前或之后,处理器250减少该集合的点的数量以压缩数据但仍维持该集合的相同形状。具体而言,处理器250进一步减少每个独特离子的存储的总和和位置的数量,同时仍然维持每个独特离子的原始存储的总和和位置的形状以便压缩这个数据。
图5是根据各种实施例的示例性曲线图500,其示出了在编码之后压缩求和的计数或强度仍然保留推断前体离子所需的信息。点510表示在编码的求和的计数或强度的集合被减少以压缩数据之后剩余的产物离子的求和的计数或强度。理想三角形520与点510一起绘制以示出压缩的点510如何仍然维持三角形形状。例如,三角形的顶点被用于推断产生产物离子的前体离子。
但是,遗憾的是,编码过程会产生模糊的三角函数。这导致细长的底边和倾斜的三角形形状。
因此,在各种实施例中,去模糊算法被应用于产物离子的测得的求和的计数或强度以移除前体离子不确定性编码的影响。返回到图2,处理器250通过使用去模糊算法从每个独特离子的存储的总和和位置中进一步移除失真(或不确定性加宽)效应。去模糊算法将存储的总和和位置等同于去模糊的总和和位置与概率分布函数的卷积,概率分布函数取决于质量过滤器的扫描SWATH传输函数的不确定性区间。去模糊算法求解每个独特离子的去模糊的总和和位置。
在各种实施例中,每个独特离子的去模糊的总和和位置可以被用于“锐化”编码数据。换句话说,每个独特离子的去模糊的总和和位置被写入存储器设备中的文件。与不进行去模糊的情况下写入编码数据相比,存储去模糊的数据产生更小的文件尺寸。它还保留了相同量的信息,并使得从此类文件中提取的光谱和XIC且对于连续数据分析而言更加准确并且更不模糊。具体而言,图2的处理器250进一步存储每个独特的去模糊的总和和位置来代替存储的总和和位置以减少存储器设备中所需的空间。
在各种实施例中,去模糊的求和的计数或强度还可以被编码为函数。更具体而言,在三角函数的情况下,去模糊的求和的计数或强度还可以被编码为三角形的位置和底边宽度。
去模糊算法对于图像处理领域的技术人员来说是众所周知的。通常,在成像中,模糊是由例如相机抖动造成的。从数学上讲,相机抖动可以被描述为函数。然后将测得的图像建模为去模糊的图像和相机抖动函数的卷积。去模糊算法针对去模糊的图像求解这个方程。如果图像中的模糊是由无法建模为函数的东西造成的,那么可以使用盲去卷积算法。
在扫描SWATH中,模糊或模糊概率分布函数是已知的并且可以被建模。它取决于由质量过滤器执行的前体离子传输功能。因此,可以使用去模糊算法。当然,知道模糊函数比不知道模糊函数更容易解决“模糊问题”。但是,在各种替代实施例中,也可以使用不知道模糊函数的盲去卷积或去模糊。
在图像处理中,去模糊算法通常应用于二维(图像的长度和宽度)。相反并且在各种实施例中,在扫描SWATH中,去模糊算法仅被应用一维。这是前体离子传输窗口维度。例如,去模糊算法仅应用于一维,以使问题解决方案更加稳定。任何处理都会引入误差。例如,如果时间维度中没有去卷积,那么围绕那个维度的所有不确定性都不会引入误差。换句话说,知道前体离子传输窗口维度中的模糊函数确保最小化去模糊误差。
例如,扫描SWATH可以产生四维数据。相关维度是产物离子计数或强度。三个独立的维度可以包括产物离子m/z维度、前体离子传输窗口位置维度和色谱或分离时间维度。在产物离子m/z维度的测量中一般几乎没有不确定性。
前体维度中前体离子位置的模糊、概率分布函数或不确定性不依赖于被分析的化合物。代替地,它取决于仪器或质谱仪及其使用方式。因此,可以对这个维度应用去模糊算法。
但是,色谱或分离时间维度中的模糊或不确定性确实随着被分析的化合物而变化。换句话说,色谱时间维度的模糊不仅取决于所使用的色谱柱,还取决于被分析的化合物。因此,在色谱或分离时间维度中不应用去模糊算法。
图6是根据各种实施例的示例性热图曲线图600,其示出了在将去模糊算法应用于数据之前作为前体离子传输窗口位置和产物离子m/z的函数绘制的求和的产物离子计数。插图610示出两个不同的产物离子611和612具有相似的产物离子m/z值。这也表明,这两个产物离子在前体离子传输窗口位置维度上的不确定性区间或三角概率分布函数高度重叠。
通常,特定前体离子传输窗口位置的产物离子谱是通过绘制水平线找到的,诸如通过曲线图600的线620。插图610示出线620的谱包括产物离子611和产物离子612。换句话说,由于两个产物离子的不确定性区间的大重叠,因此前体离子传输窗口位置将包括两个产物离子。因此,由于这种大的重叠或模糊,即使两个产物离子可能不是来自同一个前体离子,也会发现两个产物离子都是特定前体离子的产物离子。
在各种实施例中,去模糊算法被应用于图6的数据。特别地,在前体离子传输窗口位置维度中应用Lucy-Richardson去模糊算法。测得的求和的计数及其在前体离子传输窗口位置维度中的位置等同于去模糊的求和的计数和位置和在质量过滤器不确定性区间上的三角概率分布函数的卷积。去模糊算法针对去模糊的求和的计数和位置求解这个方程。注意的是,一些去模糊算法要求每个点处的一阶导数。
图7是根据各种实施例的示例性热图曲线图700,示出了在将去模糊算法应用于图6的数据之后作为前体离子传输窗口位置和产物离子m/z的函数绘制的求和的产物离子计数。插图710示出去模糊之后两个不同的产物离子611和612仍具有相似的产物离子m/z值。但是,这两个产物离子在前体离子传输窗口位置维度中的不确定性区间或三角概率分布函数在去模糊之后示出更少的重叠。本质上,这两个产物离子的三角概率分布函数的底边宽已显著减小。
三角概率分布函数的这种减小使得更容易区分前体离子的产物离子。插图710示出,在去模糊之后,线620的谱不再包括产物离子611和产物离子612两者。换句话说,由于两个产物离子不确定性区间重叠的减少,前体离子传输窗口位置将只包括一个产物离子。
在各种实施例中,在去模糊之后,前体离子传输窗口位置维度中的概率分布函数可以被保存为每个产物离子的编码。例如,图7中的产物离子611和产物离子612的三角形的位置和底边宽度可以保存在存储器设备中而不是测得的求和的计数。换句话说,仅存储诸如图4的函数420之类的三角函数的位置和底边宽度而不是函数420的点进一步降低了存储要求。
在各种实施例中,在去模糊之后发现的概率分布函数或测得的每个独特产物离子的求和的计数或强度的集合是从存储器设备读取的。例如,任一种类型的数据是从文件中读取的。然后将数值分解方法或概率推理方法应用于读取的数据以确定独特产物离子的前体离子。例如,对于三角函数,独特产物离子的前体离子被发现位于三角函数的顶点处。
更具体地并且返回到图2,在各种实施例中,处理器250还使用每个独特离子的去模糊的总和和位置确定每个独特离子的前体离子。例如,每个独特离子的去模糊的总和和位置具有三角形形状。处理器250还将每个独特离子的前体离子确定为与三角形形状的顶点对应的前体离子。
前体离子传输窗口位置维度中的去模糊也改进了色谱或分离时间维度中的峰发现。但是,如上所述,去模糊不应用于色谱或分离时间维度。
图8是根据各种实施例的示例图800,其包括示出在将去模糊算法应用于数据之前作为色谱时间和前体离子传输窗口位置的函数绘制的求和的产物离子计数的热图曲线图,以及示出从针对前体离子m/z值的热图中找到的XIC的曲线图。热图810示出在时间811和812处的产物离子强度区域。在应用去模糊算法之前,两个强度区域在前体离子传输窗口位置维度中都具有大的宽度。
因此,对于由线815表示的特定前体离子传输窗口位置(前体离子m/z值),可以随时间检测两个强度区域。换句话说,由于前体离子传输窗口位置维度中产物离子不确定性的宽度大,因此对于特定的前体离子传输窗口位置,可以随时间检测到两种不同的产物离子。
XIC 821在曲线图820中示出。XIC 821表示沿着热图810的线815随时间的强度。XIC 821包括两个分离的峰,其识别在去模糊之前前体离子传输窗口位置的两个不同产物离子。
图9是根据各种实施例的示例图900,其包括示出在将去模糊算法应用于图8的数据之后作为色谱时间和前体离子传输窗口位置的函数绘制的求和的产物离子计数的热图曲线图,以及示出从前体离子m/z值的热图中找到的XIC的曲线图。热图910再次示出时间811和812处的产物离子强度区域。在应用去模糊算法之后,两个强度区域在前体离子传输窗口位置维度上的宽度都比去模糊之前更窄。
现在,对于由线815表示的特定前体离子传输窗口位置(前体离子m/z值),随时间只能检测到一个强度区域。换句话说,由于前体离子传输窗口位置维度中产物离子不确定性的宽度较窄,因此对于特定前体离子传输窗口位置,随时间仅检测到一个产物离子。
XIC 921在曲线图920中示出。XIC 921表示沿着热图910的线815随时间的强度。XIC 921仅包括一个峰,该一个峰识别去模糊之后线815的前体离子传输窗口位置的仅一个产物离子。
在各种实施例中,代替使用去模糊算法,可以将数值方法应用于产物离子的测得的求和的和计数或强度以便确定产物离子的前体离子。美国专利No.10,651,019(下文中称为“'019”专利)公开了一种通过扫描SWATH数据确定产物离子的前体离子的方法,并通过引用整体并入本文。在'019专利中,所选择的产物离子的强度是从多个产物离子谱中检索到的,这些产物离子谱是从跨前体离子质量范围对前体离子传输窗口的每次扫描获得的。产生的轨迹描述所选择的产物离子的强度如何随前体离子传输窗口而变化。
创建矩阵乘法方程,该方程描述一个或多个前体离子如何与所选择的产物离子的迹线对应。矩阵乘法方程包括已知的n×m质量过滤器矩阵乘以长度为m的未知前体离子列矩阵,这等同于长度为n的所选择的离子迹线列矩阵。针对未知前体离子列矩阵使用数值方法,例如通常的非负矩阵分解(NNMF)或具体的非负最小二乘法(NNLS),来求解矩阵乘法方程。
在各种实施例中,求和的计数或强度的集合被用于长度为n的列矩阵。针对未知前体离子列矩阵使用数值方法来求解矩阵乘法方程。因此,找到产物离子的前体离子。
更具体而言并且返回到图2,处理器250还使用数值方法确定每个独特离子的前体离子。数值方法将存储的总和和位置布置为长度为n的列矩阵。数值方法将列矩阵等同于已知的n×m质量过滤器矩阵乘以长度为m的未知前体离子列矩阵。最后,数值方法求解未知前体离子列矩阵以确定前体离子。数值方法可以包括但不限于NNMF或NNLS。
用于编码和存储扫描SWATH数据的方法
图10是示出根据各种实施例的用于编码和存储从重叠前体离子传输窗口测得的串联质谱法数据的方法1000的流程图。
在方法1000的步骤1010中,使用串联质谱仪的质量过滤器以步长尺寸S m/z跨前体离子质量范围在重叠的步长中移动具有前体离子质荷比(m/z)宽度W的前体离子传输窗口。产生跨质量范围的一系列重叠的传输窗口。质量过滤器在每个重叠步长处传输传输窗口内的前体离子。
在步骤1020中,在每个重叠步长由质量过滤器传输的前体离子使用串联质谱仪的裂解设备被裂解或传输。为该系列的每个重叠窗口产生一个或多个结果所得产物离子或前体离子。
在步骤1030中,使用串联质谱仪的质量分析器检测系列的每个重叠窗口的一个或多个结果所得的产物离子或前体离子中的每一个的强度或计数,这些产物离子或前体离子形成该系列的每个重叠窗口的质谱数据。
在步骤1040中,使用处理器根据步骤1050、1060和1070在数据获取期间实时地编码由质量分析器检测到的每个独特产物离子。
在步骤1050中,识别具有每个独特离子的第一次出现的系列的第一次出现重叠窗口。
在步骤1060中,选择紧接在第一次出现重叠窗口之前的系列的一组G个重叠窗口,使得该组跨越至少传输窗口的宽度W,计算从该组的G个重叠窗口中的每个窗口检测到的每个独特离子的计数或强度的总和,并且该总和与组的重叠窗口的位置相关联。
在步骤1070中,将所选择的系列的G个重叠窗口的组向前移一个重叠窗口,计算从该组的G个重叠窗口的每个窗口检测到的独特离子的计数或强度的总和,将该总和与组的重叠窗口的位置相关联,将总和和位置存储在存储器设备中,并且重复这些步骤,直到组的至少一个重叠窗口不再与第一次出现重叠窗口重叠。
用于编码和存储扫描SWATH数据的计算机程序产品
在各种实施例中,计算机程序产品包括有形的计算机可读存储介质,其内容包括具有在处理器上执行的指令的程序,以便执行用于编码和存储从重叠前体离子传输窗口测得的串联质谱数据的方法。这个方法由包括一个或多个不同软件模块的系统执行。
图11是根据各种实施例的包括一个或多个不同软件模块的系统1100的示意图,所述软件模块执行用于编码和存储从重叠前体离子传输窗口测得的串联质谱数据的方法。系统1100包括控制模块1110以及编码和存储模块1120。
控制模块1110指示串联质谱仪的质量过滤器跨前体离子质量范围以S m/z的步长尺寸在重叠步长中移动具有前体离子质荷比(m/z)宽度W的前体离子传输窗口。产生跨质量范围的一系列重叠的传输窗口。质量过滤器在每个重叠步长在传输窗口内传输前体离子。
控制模块1110指示串联质谱仪的裂解设备裂解或传输在每个重叠步长由质量过滤器传输的前体离子。为该系列的每个重叠窗口产生一个或多个结果所得的产物离子或前体离子。
控制模块1110指示串联质谱仪的质量分析器,该质量分析器针对该系列的每个重叠窗口检测形成该序列的每个重叠窗口的质谱数据的一个或多个结果所得的产物离子或前体离子中的每一个的强度或计数。
编码和存储模块1120在数据获取期间对质量分析器实时检测到的每个独特的产物离子进行编码。识别具有每个独特离子的第一次出现的系列的第一次出现重叠窗口。选择紧接在第一次出现重叠窗口之前的系列的一组G个重叠窗口,使得该组跨越至少传输窗口的宽度W、计算从组的G个重叠窗口中的每个窗口检测到的独特离子的计数或强度的总和,并将该总和与组的重叠窗口的位置相关联。
将所选择的系列的G个重叠窗口的组向前移一个重叠窗口,计算从组的G个重叠窗口中的每个窗口检测到的独特离子的计数或强度的总和,将该总和与组的重叠窗口的位置相关联,将总和和位置存储在存储器设备中,并且重复这些步骤,直到组的至少一个重叠窗口不再与第一次出现重叠窗口重叠。
虽然结合各种实施例描述了本教导,但是并不意图将本教导限于此类实施例。相反,本领域技术人员将认识到的是,本教导涵盖各种替代方案、修改和等同形式。
另外,在描述各种实施例时,说明书可能已经给出了作为特定步骤顺序的方法和/或过程。但是,就该方法或过程不依赖于本文阐述的步骤的特定次序而言,该方法或过程不应当限于所描述的步骤的特定顺序。如本领域普通技术人员将认识到的,步骤的其它顺序可以是可能的。因此,说明书中阐述的步骤的特定次序不应当被解释为对权利要求的限制。此外,针对方法和/或过程的权利要求不应当限于以所写次序执行其步骤,并且本领域技术人员可以容易地认识到,顺序可以变化并且仍然在各种实施例的精神和范围之内。

Claims (14)

1.一种用于编码和存储从重叠前体离子传输窗口测得的串联质谱法数据的系统,包括:
串联质谱仪的质量过滤器,其跨前体离子质量范围以步长尺寸Sm/z在重叠步长中移动具有前体离子质荷比(m/z)宽度W的前体离子传输窗口,产生跨质量范围的一系列重叠传输窗口,其中质量过滤器在每个重叠步长处在传输窗口内传输前体离子;
质谱仪的裂解设备,其裂解或传输由质量过滤器在每个重叠步长处传输的前体离子,为该系列的每个重叠窗口产生一个或多个结果所得的产物离子;
质谱仪的质量分析器,其针对该系列的每个重叠窗口检测形成该系列的每个重叠窗口的质谱数据的所述一个或多个结果所得的产物离子中的每一个的强度或计数;以及
与质谱仪通信的处理器,代替将该系列的每个重叠窗口的质谱数据存储在存储器设备中,通过以下在数据获取期间实时地编码由质量分析器检测到的每个独特的产物离子:
识别具有每个独特离子的第一次出现的该系列的第一次出现重叠窗口,
选择紧接在第一次出现重叠窗口之前的该系列的一组G个重叠窗口,使得该组跨越至少传输窗口的宽度W,计算从该组的G个重叠窗口的每个窗口检测到的每个独特离子的计数或强度的总和,并将该总和与组的重叠窗口的位置相关联,
其中根据G≥W/S计算组中重叠窗口G的数量,以及
将所选择的系列的G个重叠窗口的组向前移一个重叠窗口,计算从该组的G个重叠窗口的每个窗口检测到的每个独特离子的计数或强度的总和,将总和与组的重叠窗口的位置相关联,将总和和位置存储在存储器设备中,并重复这些步骤,直到组的至少一个重叠窗口不再与第一次出现的重叠窗口重叠。
2.如权利要求1所述的系统,其中处理器还减少每个独特离子的存储的总和和位置的数量,同时仍然维持每个独特离子的原始存储的总和和位置的形状,以便压缩这个数据。
3.如权利要求1所述的系统,其中处理器还通过使用去模糊算法从每个独特离子的存储的总和和位置移除编码所造成的影响,其中所述去模糊算法将存储的总和和位置等同于去模糊的总和和位置和概率分布函数的卷积,所述概率分布函数取决于质量过滤器的不确定性区间,并求解每个独特离子的去模糊的总和和位置。
4.如权利要求3所述的系统,其中处理器还使用每个独特离子的去模糊的总和和位置确定每个独特离子的前体离子。
5.如权利要求3所述的系统,其中处理器还存储每个独特的去模糊的总和和位置来代替存储的总和和位置,以减少存储器设备中所需的空间。
6.如权利要求1所述的系统,其中每个独特离子的存储的总和和位置具有三角形形状。
7.如权利要求4所述的系统,其中处理器还将每个独特离子的前体离子确定为与三角形形状的顶点对应的前体离子。
8.如权利要求1所述的系统,其中处理器还使用数值方法确定每个独特离子的前体离子,所述数值方法将存储的总和和位置布置为长度为n的列矩阵、将该列矩阵等同于质量过滤器的已知的n×m质量过滤器矩阵乘以长度为m的未知前体离子列矩阵、并求解未知的前体离子列矩阵以确定前体离子。
9.如权利要求8所述的系统,其中数值方法包括非负矩阵分解(NNMF)。
10.如权利要求8所述的系统,其中数值方法包括非负最小二乘法(NNLS)。
11.如权利要求1所述的系统,其中处理器还通过移除多个总和和位置同时仍然维持存储的总和和位置的相同形状来压缩每个独特离子的存储的总和和位置。
12.如权利要求1所述的系统,其中由G个重叠窗口的组跨越的传输窗口的宽度W是前体离子不确定性区间。
13.一种用于编码和存储从重叠前体离子传输窗口测得的串联质谱法数据的方法,包括:
使用串联质谱仪的质量过滤器跨前体离子质量范围以步长尺寸S m/z在重叠步长中移动具有前体离子质荷比(m/z)宽度W的前体离子传输窗口,产生跨质量范围的一系列重叠传输窗口,其中质量过滤器在每个重叠步长处在传输窗口内传输前体离子;
使用质谱仪的裂解设备裂解或传输由质量过滤器在每个重叠步长处传输的前体离子,为该系列的每个重叠窗口产生一个或多个结果所得的产物离子;
使用质谱仪的质量分析器针对该系列的每个重叠窗口检测形成该系列的每个重叠窗口的质谱数据的所述一个或多个结果所得的产物离子中的每一个的强度或计数;以及
通过以下在数据获取期间使用处理器实时地编码由质量分析器检测到的每个独特产物离子:
识别具有每个独特离子的第一次出现的系列的第一次出现重叠窗口,
选择紧接在第一次出现重叠窗口之前的系列的一组G个重叠窗口,使得该组跨越至少传输窗口的宽度W,计算从该组的G个重叠窗口的每个窗口检测到的每个独特离子的计数或强度的总和,并将该总和与组的重叠窗口的位置相关联,根据G≥W/S计算组中重叠窗口G的数量,以及
将所选择的系列的G个重叠窗口的组向前移一个重叠窗口,计算从该组的G个重叠窗口的每个窗口检测到的每个独特离子的计数或强度的总和,将总和与组的重叠窗口的位置相关联,将总和和位置存储在存储器设备中,并重复这些步骤,直到组的至少一个重叠窗口不再与第一次出现重叠窗口重叠。
14.一种计算机程序产品,包括非暂态和有形计算机可读存储介质,其内容包括具有指令的程序,该指令在处理器上执行以执行用于编码和存储从重叠的前体离子传输窗口测得的串联质谱法数据的方法,该方法包括:
提供一种系统,其中该系统包括一个或多个不同的软件模块,并且其中所述不同的软件模块包括控制模块以及编码和存储模块;
使用控制模块指示串联质谱仪的质量过滤器跨前体离子质量范围以步长尺寸Sm/z在重叠步长中移动具有前体离子质荷比(m/z)宽度W的前体离子传输窗口,产生跨质量范围的一系列重叠传输窗口,其中质量过滤器在每个重叠步长处在传输窗口内传输前体离子;
使用控制模块指示质谱仪的裂解设备裂解或传输由质量过滤器在每个重叠步长处传输的前体离子,为该系列的每个重叠窗口产生一个或多个结果所得的产物离子;
使用控制模块指示质谱仪的质量分析器针对该系列的每个重叠窗口检测形成该系列的每个重叠窗口的质谱数据的所述一个或多个结果所得的产物离子中的每一个的强度或计数;以及
通过以下使用编码和存储模块在数据获取期间实时地编码由质量分析器检测到的每个独特产物离子:
识别具有每个独特离子的第一次出现的系列的第一次出现重叠窗口,
选择紧接在第一次出现重叠窗口之前的系列的一组G个重叠窗口,使得该组跨越至少传输窗口的宽度W,计算从该组的G个重叠窗口的每个窗口检测到的每个独特离子的计数或强度的总和,并将该总和与组的重叠窗口的位置相关联,根据G≥W/S计算组中重叠窗口G的数量,以及
将所选择的系列的G个重叠窗口的组向前移一个重叠窗口,计算从该组的G个重叠窗口的每个窗口检测到的每个独特离子的计数或强度的总和,将总和与组的重叠窗口的位置相关联,将总和和位置存储在存储器设备中,并重复这些步骤,直到组的至少一个重叠窗口不再与第一次出现重叠窗口重叠。
CN202080025386.5A 2019-05-31 2020-05-29 用于前体推理的扫描带数据和概率框架的实时编码的方法 Active CN113631920B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962855242P 2019-05-31 2019-05-31
US62/855,242 2019-05-31
PCT/IB2020/055138 WO2020240506A1 (en) 2019-05-31 2020-05-29 Method for real time encoding of scanning swath data and probabilistic framework for precursor inference

Publications (2)

Publication Number Publication Date
CN113631920A CN113631920A (zh) 2021-11-09
CN113631920B true CN113631920B (zh) 2024-04-26

Family

ID=73553584

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080025386.5A Active CN113631920B (zh) 2019-05-31 2020-05-29 用于前体推理的扫描带数据和概率框架的实时编码的方法

Country Status (5)

Country Link
US (1) US20220189754A1 (zh)
EP (1) EP3977628A4 (zh)
JP (1) JP2022534468A (zh)
CN (1) CN113631920B (zh)
WO (1) WO2020240506A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117581330A (zh) 2021-06-09 2024-02-20 Dh科技发展私人贸易有限公司 扫描swath中增强的q1质量分离
WO2023017448A1 (en) * 2021-08-12 2023-02-16 Dh Technologies Development Pte. Ltd. Intensity-independent precursor inference in mass spectroscopy

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012090046A1 (en) * 2010-12-29 2012-07-05 Dh Technologies Development Pte. Ltd. Method for triggering dependent spectra for data acquisition
CN105637613A (zh) * 2013-10-16 2016-06-01 Dh科技发展私人贸易有限公司 使用任意传输加窗根据产物离子识别前驱体离子的系统及方法
CN109526237A (zh) * 2016-06-15 2019-03-26 Dh科技发展私人贸易有限公司 使用swath方法扩展动态范围
CN109643635A (zh) * 2016-07-25 2019-04-16 Dh科技发展私人贸易有限公司 用于在扫描swath数据中识别前体及产物离子对的系统及方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US74528A (en) * 1868-02-18 Improved spring-mattress
US20060255258A1 (en) * 2005-04-11 2006-11-16 Yongdong Wang Chromatographic and mass spectral date analysis
JP5542433B2 (ja) * 2006-05-26 2014-07-09 ウオーターズ・テクノロジーズ・コーポレイシヨン イオン検出およびn次元データのパラメータ推定
KR102044211B1 (ko) * 2011-12-29 2019-11-13 디에이치 테크놀로지즈 디벨롭먼트 피티이. 리미티드 체류 시간 판정 또는 확인을 위한 윈도우가 있는 질량 분석 데이터의 사용
GB201208961D0 (en) 2012-05-18 2012-07-04 Micromass Ltd 2 dimensional MSMS
US10153146B2 (en) * 2014-03-28 2018-12-11 Wisconsin Alumni Research Foundation High mass accuracy filtering for improved spectral matching of high-resolution gas chromatography-mass spectrometry data against unit-resolution reference databases
EP3304382A4 (en) * 2015-05-29 2019-07-17 Waters Technologies Corporation TECHNIQUES FOR PROCESSING SPECTRAL MASS DATA
DE102020132851B3 (de) * 2020-12-09 2021-12-30 Bruker Optik Gmbh Ionenmobilitätsspektrometer und verfahren zum betrieb eines ionenmobilitätsspektrometers

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012090046A1 (en) * 2010-12-29 2012-07-05 Dh Technologies Development Pte. Ltd. Method for triggering dependent spectra for data acquisition
CN105637613A (zh) * 2013-10-16 2016-06-01 Dh科技发展私人贸易有限公司 使用任意传输加窗根据产物离子识别前驱体离子的系统及方法
CN109526237A (zh) * 2016-06-15 2019-03-26 Dh科技发展私人贸易有限公司 使用swath方法扩展动态范围
CN109643635A (zh) * 2016-07-25 2019-04-16 Dh科技发展私人贸易有限公司 用于在扫描swath数据中识别前体及产物离子对的系统及方法

Also Published As

Publication number Publication date
JP2022534468A (ja) 2022-08-01
CN113631920A (zh) 2021-11-09
WO2020240506A1 (en) 2020-12-03
EP3977628A1 (en) 2022-04-06
US20220189754A1 (en) 2022-06-16
EP3977628A4 (en) 2023-06-28

Similar Documents

Publication Publication Date Title
CN109643635B (zh) 用于在扫描swath数据中识别前体及产物离子对的系统及方法
JP2016057312A (ja) タンデム質量分析計において可変質量選択窓幅を用いるためのシステムおよび方法
CN107092769B (zh) 用于在串联质谱分析中使用交错窗宽度的系统及方法
US10504707B2 (en) Systems and methods for extracting mass traces
CN113631920B (zh) 用于前体推理的扫描带数据和概率框架的实时编码的方法
JP7325421B2 (ja) Msms信頼度を改良するためのdm-swath取り込み
JP2022179596A (ja) Idaのための前駆体イオン選択における付加物およびその他の悪化因子の物理的単離
CN109643633B (zh) 自动化质谱库保留时间校正
CN109526237B (zh) 使用swath方法扩展动态范围
JP6698668B2 (ja) 断片化エネルギーを切り替えながらの幅広い四重極rf窓の高速スキャニング
CN118043938A (zh) 用于增强dda质谱法中的信息的方法
US20230307220A1 (en) Method for Extracting cIEF-MS Profiles from m/z versus Time Arrays
CN111095477B (zh) 用同位素选择性ms/ms评估mrm峰纯度
JP6896830B2 (ja) イオン種の質量を判定するためのシステムおよび方法
CN117581330A (zh) 扫描swath中增强的q1质量分离
CN113574629A (zh) 不可知化合物洗脱测定
CN114616644A (zh) 基于阈值的ida排除列表
CN116324403A (zh) 通过质谱法进行的化合物识别
CN117795643A (zh) Tof-ms中的空间电荷减少

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant