CN110178182B - 用于对复杂样本进行质量分析的方法、装置和存储介质 - Google Patents
用于对复杂样本进行质量分析的方法、装置和存储介质 Download PDFInfo
- Publication number
- CN110178182B CN110178182B CN201780084101.3A CN201780084101A CN110178182B CN 110178182 B CN110178182 B CN 110178182B CN 201780084101 A CN201780084101 A CN 201780084101A CN 110178182 B CN110178182 B CN 110178182B
- Authority
- CN
- China
- Prior art keywords
- mass
- ion
- information
- fragments
- precursor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- H—ELECTRICITY
- H01—ELECTRIC ELEMENTS
- H01J—ELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
- H01J49/00—Particle spectrometers or separator tubes
- H01J49/004—Combinations of spectrometers, tandem spectrometers, e.g. MS/MS, MSn
- H01J49/0045—Combinations of spectrometers, tandem spectrometers, e.g. MS/MS, MSn characterised by the fragmentation or other specific reaction
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/10—Signal processing, e.g. from mass spectrometry [MS] or from PCR
-
- H—ELECTRICITY
- H01—ELECTRIC ELEMENTS
- H01J—ELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
- H01J49/00—Particle spectrometers or separator tubes
- H01J49/0027—Methods for using particle spectrometers
- H01J49/0036—Step by step routines describing the handling of the data generated during a measurement
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Medical Informatics (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Analytical Chemistry (AREA)
- Theoretical Computer Science (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Biotechnology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Epidemiology (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Public Health (AREA)
- Bioethics (AREA)
- Molecular Biology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Genetics & Genomics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Signal Processing (AREA)
- Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
Abstract
本公开描述了用于分析质谱数据的技术和装置。在一个实施方案中,例如,一种装置可以包括以下逻辑:访问经由对包括目标前体的样本进行质量分析生成的产物离子数据集;访问所述目标前体的元素的包括标称质量和质量亏损信息的前体组合物信息;基于所述前体组合物信息而确定与所述目标前体相关联的离子碎片的标称质量(NM)‑质量亏损(MD)关系信息;确定一个或多个碎片上界和一个或多个碎片下界;经由将所述一个或多个碎片上界和所述一个或多个碎片下界应用于所述NM‑MD关系信息而从所述离子碎片提取候选离子碎片;以及基于与所述候选离子碎片相关联的裂解效率信息而从多个候选离子碎片确定目标离子碎片。其他实施方案有所描述并受权利要求书保护。
Description
相关申请的交叉引用
本申请按照35 U.S.C. § 119(e)要求2016年11月21日提交的美国临时专利申请序列号62/424,699的优先权权益,该申请的全部内容以引用的方式并入本文,如同在此完整阐述一样。
技术领域
本文的实施方案整体涉及复杂样本的分析,并且更具体地,涉及通过质谱(MS)对复杂样本中的化合物的定量。
背景技术
在复杂体系(诸如蛋白质或其他复杂化合物)的分析中获取准确和精确的定性和定量质谱数据的能力取决于独立于任何周围基质来测量所有离子的物理化学属性的能力。成功的定性分析需要确保碎片和产物离子正确地比对或匹配它们衍生自的母体离子或前体离子。
MS结合色谱,诸如液相色谱(LC)方法,是用于量化样本中的化合物的常用方法。例如,MS/MS(或串联MS)涉及来自通过离解机制(诸如源内裂解、表面诱导的裂解、碰撞诱导的离解、电子捕获、电子脱离、电荷转移和光离解)生成的一个或多个前体离子的碎片离子的产物离子光谱。定量通常通过以下方式进行:首先通过LC分离化合物以生成一系列色谱图,然后通过MS/MS电离和检测分离的化合物以产生具有离子峰的多个质谱。假设峰面积与化合物浓度之间存在相关性,使用在质量窗口内与目标化合物相关联的所有峰的峰面积或总面积,可以推断关于感兴趣的化合物的定量信息。
复杂样本中的分子的结构鉴定是确定产物离子光谱中的哪些碎片离子属于哪种前体。常规的方法在量化复杂样本中的目标化合物上遇到挑战,特别是在操作员和研究员所预期的时间和资源限制下。例如,随着样本的复杂性或动态范围增加,多种化合物在相同的保留时间(RT)窗口中从LC共洗脱的机会也被放大,从而产生其中来自不同的化合物的离子占据相同的质荷比(m/z)空间并相互干扰的质谱。在另一个示例中,随着样本的复杂性增加,在样本中的高丰度化合物的数量也会成比例地增加,这可能使检测器饱和并破坏检测器响应的线性。因此,常规的MS技术通常不能提供与构成复杂样本的化合物的量充分地相关的信号分布。
发明内容
以下呈现简化的总结,以便提供对本文所述的一些新颖实施方案的基本理解。该总结不是详尽的概述,并且并不旨在标识关键/重要要素或描绘其范围。一些概念以简化形式呈现,作为稍后呈现的更详细的描述的前序。
各种实施方案整体涉及用于分析样本的MS技术。例如,一些实施方案可以包括可操作以基于受分析的分子的组分元素的质量信息等将复合产物离子光谱中的产物离子分离成其母体前体离子的技术和装置。在示例性实施方案中,产物离子可以经由标称(或整数)质量与质量亏损(或分数质量)的变化速率的比较与其母体前体比对,例如,以标称质量相对于可能母体前体的标称质量的降序。
在一个实施方案中,样本分析的方法可以包括:访问经由对包括至少一个目标前体的样本进行质量分析生成的至少一个产物离子数据集;访问至少一个目标前体的多种组分元素的前体组合物信息,该前体组合物信息包括多种组分元素的至少一部分的标称质量信息和质量亏损信息;基于前体组合物信息而确定与至少一个目标前体相关联的多个离子碎片的标称质量(NM)-质量亏损(MD)关系信息;确定多个离子碎片的至少一个离子碎片上界和至少一个离子碎片下界;经由将至少一个离子碎片上界和至少一个离子碎片下界应用于NM-MD关系信息而从多个离子碎片提取多个候选离子碎片;基于与多个候选离子碎片相关联的裂解效率信息而从多个候选离子碎片确定多个目标离子碎片;以及生成至少一个产物离子数据集的多个目标离子碎片的至少一部分的光谱数据。其他实施方案有所描述并受权利要求书保护。
为了实现前述和相关目的,本文结合以下描述和所附附图描述某些例示性方面。这些方面指示可实践本文公开的原理的各种方式,并且所有方面及其等同物旨在在要求保护的主题的范围内。当结合附图考虑时,从以下详细描述中,其他优点和新颖特征将变得显而易见。
附图说明
图1示出了第一操作环境的实施方案。
图2描绘了肽前体分子的组分元素的质量信息。
图3描绘了肽组分元素分布信息。
图4描绘了z=1的离子的标称质量相对于分数质量的图。
图5描绘了z=2的离子的标称质量相对于分数质量的图。
图6描绘了z=3的离子的标称质量相对于分数质量的图。
图7描绘了z=1-3的离子的标称质量相对于分数质量的图。
图8描绘了示出根据一些实施方案的回归线拟合的图。
图9描绘了裂解效率相对于最大和最小产物离子强度百分比的图。
图10A描绘了潜在产物离子的标称质量相对于分数质量的图。
图10B描绘了图10A的图的产物离子的质谱。
图11A描绘了目标产物离子的标称质量相对于分数质量的图。
图11B描绘了图11A的图的目标产物离子的质谱。
图12示出了第一逻辑流程的实施方案。
图13示出了第一逻辑流程的实施方案。
图14示出了存储介质的示例。
图15示出了计算架构的实施方案。
具体实施方式
各种实施方案可以整体涉及用于生成MS光谱数据并将产物离子与前体分子比对的方法和装置。现在将参考用于分析样本(例如,在使用MS过程(诸如LC/MS/MS)分析样本的系统中)的例示性实施方案描述技术和实施方案。应当理解,本文所述的技术可以结合其他系统、方法和/或实施方案使用,并且可以具有比在该详细描述中出于例示目的提供的更广泛的应用。
在本说明书中,可以阐述许多具体细节,诸如部件和系统配置,以便提供对各种实施方案的更透彻的理解。然而,本领域的技术人员应当理解,可以在没有此类具体细节的情况下实践这些实施方案。另外,没有详细地示出一些众所周知的结构和其他特征,以避免不必要地模糊本发明。
在以下描述中,对“一个实施方案”、“实施方案”、“示例性实施方案”、“各种实施方案”等的引用指示如此描述的本发明的实施方案可以包括特定特征、结构或特性,但是多于一个实施方案可以而非每个实施方案必须包括特定特征、结构或特性。此外,一些实施方案可以具有针对其他实施方案描述的特征中的一些、全部或没有这些特征。
如在本说明书和权利要求中所用,并且除非另外指明,否则使用序数形容词“第一”、“第二”、“第三”等描述要素仅指示某个要素的特定示例或所提及的相似要素的不同示例,而不旨在暗示如此描述的要素必须按照特定顺序(时间上、空间上、按排名或以任何其他方式)。
图1示出了可表示各种实施方案的操作环境100的示例。图1中描绘的操作环境100可以包括色谱设备105,包括但不限于LC设备。可以通过注射器将样本注入色谱设备105中。泵可以引导样本通过色谱设备105的柱,以根据通过柱的保留时间将样本分离成组分部分。色谱设备105的输出可以被引导到质谱仪110以进行分析。色谱设备105和质谱仪110的系统可以被配置为例如LC-MS或LC-MS/MS设备。尽管使用LC和MS/MS作为示例,但是实施方案不限于此,因为本文中考虑了能够根据一些实施方案操作的任何类型的MS系统。
LC-MS和LC-MS/MS采集技术通常涉及获取从色谱设备105洗脱的样本的一个或多个母体(前体)离子数据集(光谱)和一个或多个对应产物离子数据集(光谱)。在这些技术中,来自色谱设备105的液相色谱柱的洗脱液进入离子源,在离子源中进行电离。裂解、碰撞或反应设备(或单元)通常布置在离子源的下游,以选择性地裂解或反应母体离子以产生产物离子。在MS 110中,碰撞单元的输出被引导到质量分析仪。质量分析仪可以是任何质量分析仪,包括例如四极杆、飞行时间(TOF)、离子阱、扇形磁场质量分析仪以及它们的组合。质谱仪的检测器检测从质量分析仪发出的离子。检测器可以与质量分析仪整合。例如,在TOF质量分析仪的情况下,检测器可以是对离子强度进行计数(即对射入的离子进行计数)的微通道板检测器。例如,MS 110可以包括布置在裂解、碰撞或反应设备下游的TOF MS,该TOFMS可以用于获取母体产物和产物离子数据集。
在获取数据集之后,可以在数据集中检测产物和母体离子,并且将产物离子分配或“合并”到母体离子。例如,可以通过色谱保留时间比对来完成合并。如果产物离子的保留时间在测量误差内与一个或多个母体离子的保留时间相同,那么可以将产物离子分配(合并)到一个或多个特定母体离子。测量误差通常被认为是一个或多个母体离子的峰宽的一部分。例如,如果产物离子的保留时间在一个或多个母体离子的色谱峰宽的+/-半最大值半宽(“HWHM”)内,那么可以将产物离子分配给一个或多个特定母体离子。
另一种已知的采集技术还利用离子迁移率。在此类布置中,离子迁移率分离(“IMS”)设备布置在离子源的下游和裂解、碰撞或反应设备的上游。通过保留时间比对以及离子迁移率比对完成合并。因此,可以更容易地区分样本的不同组分,并且可以更准确地将产物离子分配给合适的母体离子。然而,仍然存在其中组分具有无法区分的保留时间和漂移时间的大量情况。
可以根据各种采集操作模式来操作MS 110。操作模式的非限制性示例可以包括数据相关采集(DDA)、数据独立采集(DIA)和/或它们的变型。在DDA中,碎片或产物离子由进行质量分辨的母体离子或前体离子形成(例如,使用四极杆质量过滤器隔离窗口)。在DIA中,碎片或产物离子由母体离子或前体离子形成,该母体离子或前体离子是时间分辨(MSE)或时间和离子迁移漂移时间分辨(HD-MSE)的。
DDA中的前体和产物离子比对可以包括使用来自隔离的(例如,第一质量过滤器前体)m/z前体离子的分配给母体前体的产物离子,其中除了m/z隔离窗口的宽度之外没有附加的过滤。假设的是,质量隔离窗口越窄,MS/MS产物离子光谱的选择性越大。此类关系可能在处理简单混合物时出现;然而,当对复杂混合物进行采样时,小的质量隔离窗口,即使小至0.4Th,也可能不包含仅一种前体分子。例如,主要由碳(C)、氮(N)、氢(H)、氧(O)、硫(S)和磷(P)构成的生物分子可以产生具有非常不同的结构而几乎相同的M/Z的化合物。此外,某些元素组合物可以产生几乎相同但具有不同的电荷状态的前体离子m/z值。尽管在本文中使用生物分子诸如蛋白质/肽作为示例,但是实施方案不限于此。实际上,本文中设想了根据一些实施方案的能够被处理和分析的任何类型或类别的化合物,诸如肽、烃等。
常规系统一般使用两种可商购获得的类型的DIA、SWATH(所有理论质谱的顺序窗口采集)和MSE中的一种。一般来讲,SWATH与DDA采集基本上类似地操作,但是m/z隔离窗宽度更大(>10 Thomson (Th))。在MSE中,所有前体离子是一直在恒定或可变m/z隔离窗口内的碎片。虽然这些类型的实验具有更高产物离子采样率,但是它们受到限制,因为每个MS/MS光谱都包含来自多于一种前体的产物离子。SWATH使用光谱库来匹配已知标识与复合产物离子光谱之间的产物离子。此外,还可以使用非常宽的前体质量公差(例如,在所有可用电荷状态下的隔离窗口的宽度)来搜索产物离子光谱。对于MSE,前体和产物离子通过中心质量保留进行对比,并且如果应用离子迁移率分离,那么使漂移时间居中。尽管DIA对复杂样本的离子补充物进行了更多采样,但是在采样的化合物的添加的互补物的宽动态范围内正确地识别和定量的能力受到复杂性限制。
MS 110可以通信地耦接到装置120,诸如计算或逻辑设备,该装置具有处理器电路125、存储器单元140和收发器170。处理电路125可以通信地耦接到存储器单元140和/或收发器170。在一些实施方案中,装置120和/或其部件可以是MS 110的部件。在各种实施方案中,装置120和/或其部件可以操作以控制MS 110和/或其某些功能。
处理电路125可以包括和/或可以访问根据一些实施方案的用于执行处理的各种逻辑。例如,处理电路125可以包括和/或可以访问MS数据分析逻辑130,例如,NM-MD逻辑132、裂解效率逻辑134和/或前体产物比对逻辑136。MS数据分析逻辑130(例如,NM-MD逻辑132、碎片效率逻辑134和/或前体-产物比对逻辑136)能够以硬件、软件或它们的组合来实现。如在本申请中所用,术语“逻辑”、“部件”、“层”、“系统”、“电路”、“解码器”、“编码器”和/或“模块”旨在是指计算机相关的实体、硬件、硬件和软件的组合、软件或执行中的软件,它们的示例由图15的示例性计算架构1500提供。例如,逻辑、电路或层可以是和/或可以包括但不限于在处理器上运行的进程、处理器、硬盘驱动器、多个存储驱动器(光学和/或磁性存储介质)、对象、可执行程序、执行线程、程序、计算机、硬件电路、集成电路、专用集成电路(ASIC)、可编程逻辑器件(PLD)、数字信号处理器(DSP)、现场可编程门阵列(FPGA)、片上系统(SoC)、存储器单元、逻辑门、寄存器、半导体器件、芯片、微芯片、芯片组、软件部件、程序、应用程序、固件、软件模块、计算机代码、前述项的任何组合等。在一些实施方案中,MS数据分析逻辑130的至少一部分(及其逻辑)可以布置在处理器电路125内。在其他实施方案中,例如,MS数据分析逻辑130可以位于加速器、处理器核、接口、单独的处理器管芯等中。
收发器170可以操作以提供用于装置120的通信过程。例如,装置120可以经由收发器170与经由网络180可访问的节点182a-n通信。存储器单元140可以包括呈一个或多个高速存储器单元的形式的各种类型的计算机可读存储介质和/或系统,诸如只读存储器(ROM)、随机存取存储器(RAM)、动态RAM (DRAM)、双数据速率DRAM (DDRAM)、同步DRAM(SDRAM)、静态RAM (SRAM)、可编程ROM (PROM)、可擦除可编程ROM (EPROM)、电可擦除可编程ROM (EEPROM)、闪存存储器、聚合物存储器(诸如铁电聚合物存储器、双向存储器、相变或铁电存储器),硅-氧化物-氮化物-氧化物-硅(SONOS)存储器、磁性或光学卡设备阵列(诸如独立磁盘冗余阵列(RAID)驱动器)、固态存储器设备(例如,USB存储器、固态驱动器(SSD)和适于存储信息的任何其他类型的存储介质。另外,存储器单元140可以包括呈一个或多个低速存储器单元的形式的各种类型的计算机可读存储介质,包括内部(或外部)硬盘驱动器(HDD)、磁性软盘驱动器(FDD)和用于从可移动光盘读取或向其写入的光盘驱动器(例如,CD-ROM或DVD)、固态驱动器(SSD)等。
在一些实施方案中,各种数据可以存储在存储器单元140中,诸如离子数据集142、质量信息144和/或标称质量(NM)-质量亏损(MD)关系信息146。在各种实施方案中,MS 110的样本分析结果可以被提供给装置120并例如被存储为离子数据集142。离子数据集142的非限制性示例可以包括m/z信息、保留时间信息、迁移率漂移信息、强度信息、光谱等。在一些实施方案中,离子数据集142、质量信息144和/或NM-MD关系信息146可以包括访问和/或存储在一个或多个远程位置处诸如在数据库、云计算环境等中的信息。
MS数据分析逻辑130可以操作以为来自MS 110的数据提供各种分析过程。例如,MS数据分析逻辑130(单独地或经由NM-MD逻辑132、裂解效率逻辑134和/或前体产物比对逻辑136中的一个或多个)可以操作以提供MS数据分析过程以分析MS数据(例如,离子数据集)、生成MS数据光谱、比对产物离子和前体等。
NM-MD逻辑132可以操作以提供与由MS 110分析的一种或多种分子相关联的质量信息相关的各种过程。在一些实施方案中,可以选择一种或多种分子或以其他方式将一种或多种分子指定为目标前体。一般来讲,目标前体是MS分析中的感兴趣的前体,诸如在复杂样本中感兴趣的特定蛋白质或肽。
NM-MD逻辑132可以访问、生成和/或提供与目标前体和/或组分元素或它们的潜在碎片相关联的质量信息144。在各种实施方案中,质量信息144可以包括但不限于组分元素(或构建块)的标称质量和质量亏损信息和/或目标前体的潜在碎片。例如,如果目标前体是肽,那么组分元素将包括氨基酸以及可包括在目标前体中的任何其他潜在元素、部分等。一般来讲,元素的标称质量包括元素的最丰富的天然存在的稳定同位素的整体质量或分子离子或分子的组分元素的整数质量的总和。质量亏损是特定核的实际质量与标称质量之间的差异。质量亏损可以表示不同元素的核稳定化所需的不同的结合能量的等同物。按照惯例,超过12C的质量被限定为零。元素的质量亏损可以是正的(例如,1H:1.00783和14N:14.00307)或负的(例如16O:15.99491,32S:31.97207和31P:30.97376)。化合物的质量亏损可以包括分数质量,即小数点右侧的质量。例如,氨基酸丙氨酸具有71.03711的标称质量和0.03711的质量亏损或分数质量。
图2描绘了表1 205,其提供了肽前体分子的组分元素的质量信息144。更具体地,图2提供了氨基酸210(其中半胱氨酸由羧基氨基甲基化修饰)的NM-MD质量信息,其包括但不限于每种氨基酸的元素组成215、在电荷状态(z=1 220、z=2 222、z=3 224和z=4 226)下的分子量(Mr),以及在每个充电状态下的质量亏损240、242、244和246。如表1 205所示,对于Mr220、222、224和226、以及质量亏损240、242、244和246,存在最小值260、最大值262、中值264、平均值266、标准偏差268和CV 270值。表1 205表示肽前体分子的组分元素的非加权值。
MS数据分析逻辑130,例如经由NM-MD逻辑132,可以相对于目标化合物的组分构建块的母体分子的完整分子质量的整数和质量亏损来使用目标化合物的组分构建块的整数和质量亏损。在一些实施方案中,如果前体离子的m/z和z是已知的,那么最高m/z产物离子的最大电荷减少(每次1个电荷)m/z值是已知的。在一些情况下,当电离时,单个洗脱组分能够以多个电荷状态存在。对于多个电荷状态的那些组分,在DDA和高清晰度质谱(HDMS或HDMSE)DIA采集中分别处理每种电荷状态。尽管洗脱组分在液相中是单一的,但是当电离时它也能够以多电荷状态存在。在DDA采集中,电荷状态由质量隔离窗口分离。在HDMSE DIA采集中,在离子路径的内部的离子迁移分离(IMS)用其碰撞横截面积(CCSA2)分离电荷状态。对于MSE和SWATH型DIA采集,两种电荷状态将同时地裂解,从而产生包含2+和1+碎片离子两者的产物离子光谱。当前前体的基于DDA和/或DIA的选择方案涉及其中按强度选择裂解质量候选物并将其包括在排除目录中以避免高度丰富的物质的不断重新裂解的过程。常规的DDA和/或DIA方法没有充分地利用基于由当前仪器递送的高准确度前体质量测量的分数质量的有价值信息。因此,根据一些实施方案的MS数据分析过程可以使用一组产物离子按电荷状态来分离产物离子以验证另一组产物离子。
当肽键离解时,生成两个碎片离子,即Y离子和B离子(Y离子的互补物)。更具体地,如果肽在肽键处裂解,那么如果电荷保留在N末端碎片上,那么该碎片离子就被称为B离子。如果电荷保留在C末端碎片上,那么该碎片离子就被称为Y离子。可能碎片及其命名的更全面的列表在以下文献中提供:Roepstorff and Fohlman, Biomedical MassSpectrometry, 1984; 11(11):601(Roepstorff和Fohlman,生物医学质谱,1984年;第11卷,第11期,第601页),以及Johnson et al,Anal. Chem. 1987, 59(21): 2621:2625(Johnson等人,分析化学,1987年,第59卷,第21期,第2621页至第2625页),这两篇文献以引用的方式并入本文。含有仅一个氨基末端氨基酸的碎片被称为b1,含有前两个氨基末端氨基酸的碎片被称为b2,依此类推。
来自电荷z的前体的在MS/MS光谱中的最高m/z产物离子被称为Y最大,其中Y最大= [Mr+ (z-1)*H]/z,其中Mr是前体的分子质量,z是前体的电荷数量,并且H是氢的质量。B离子的最大碎片离子质量是B最大= [(Mr + (z-1)*H)-H2O]/z,其中Mr是前体的分子质量,z是前体的电荷数量,H是氢的质量,并且H2O是水的分子质量。
在一些实施方案中,NM-MD逻辑132可以操作以生成、访问和/或提供NM-MD关系信息146。在各种实施方案中,NM-MD关系信息146可以包括标称m/z与同目标前体诸如产物离子碎片相关联的元素的分数m/z之间的关联。在示例性实施方案中,NM-MD关系信息146可以包括产物离子碎片的标称m/z和分数m/z的确定,诸如图4至图7中表示的。例如,图4至图7表示某些z值的产物离子碎片的标称m/z和分数m/z的密度图或图。在一些实施方案中,图4至图7中描绘的产物离子碎片可以是经由MS的凭经验的质量分析的结果。在其他实施方案中,图4至图7中描绘的产物离子碎片可以是其他计算机生成的数据的计算机摘要或图形表示的结果(例如,UniProt等)。
图4描绘了呈图405的形式的NM-MD关系信息146或表示z=1 410的离子(诸如产物离子)的标称m/z 420相对于分数m/z 425的曲线。如图4所示,曲线405可以包括产物离子的单个电荷矢量450。图5描绘了呈表示z=2 510的离子的标称m/z 520相对于分数m/z 525的图505的形式的NM-MD关系信息146。如图5所示,曲线505可以包括产物离子的多个电荷矢量550、552和554。图6描绘了呈表示z=3 610的离子的标称m/z 620相对于分数m/z 625的图605的形式的NM-MD关系信息146。如图6所示,曲线605可以包括产物离子的多个电荷矢量650、652、654和656。图7描绘了z=1-3的离子的呈组合的密度图705的形式的NM-MD关系信息146。
在各种实施方案中,NM-MD逻辑132可以操作以从与样本、目标前体或化合物的类别(例如,肽)相关联的潜在产物离子产物群中选择候选产物离子碎片。在示例性实施方案中,MS数据分析过程可以使用与前体离子的标称质量和质量亏损和该前体离子的主要产物离子的标称质量和质量亏损相关联的生成的关系(例如,[Mr + (z-1)*H]/z)来提供前体和产物离子比对。例如,当目标前体分子裂解时,每个碎片的标称质量和质量亏损两者都可以因母体的组成组分(构建块)的标称质量和质量亏损而降低。例如,根据一些实施方案的MS数据分析过程可以计算重量平均标称质量和质量亏损以及它们每个与在研究的分子的构建块组的标准偏差。
图3描绘了表2 305,表2以组分元素分布信息的形式提供质量信息144。对于肽,质量信息144可以是呈酵母、人和小鼠的蛋白质组中的氨基酸310的平均频率分布315的形式。在一些实施方案中,平均频率分布315可以用于确定含有肽的样本的重量平均中值标称值和分数质量值。
根据一些实施方案配置的MS数据分析过程可以将Y最大和B最大两者的标称和质量亏损用作最大值,并且分别将Y1和B1的重量平均标称和质量亏损用作最小值,以产生NM-MD关系信息的两个单独的线性回归线拟合(例如,参见图8)。在一些实施方案中,对于所有回归线拟合,Y1和B1值可以保持恒定。在采用IMS的采集中,产物离子可以被预过滤,例如,通过将它们的标称漂移时间与每个母体前体的漂移时间进行比较。漂移时间的消除不是绝对的,因为该方法采用隔离窗口,该隔离窗口的宽度由反映前体离子m/z和z值的自适应函数确定。因此,随着m/z和z增加,隔离窗口的宽度也会增加。在各种实施方案中,可以通过添加驻留在质量信息中的组分构建块144的标称质量和质量亏损两者的相应标准偏差的用户或算法得到的倍数来为用于产物离子提取的回归线拟合中的每个提供上界线和下界线(例如,图2,表1 205)。在示例性实施方案中,去除在上界线和下界线之外的所有或基本上所有的产物离子以在处理的下一个阶段中进行考虑。
图8描绘了根据一些实施方案的回归线拟合。如图8所示,产物离子可以绘制在标称m/z 820相对于分数m/z 825的图805上,包括B最大([(Mr + (z-1)*H)-H20]/z) 872和Y最大(Mr+ (z-1)*H]/z) 870。根据一些实施方案,提供第一回归线拟合850和第二回归线拟合860。第一回归线拟合850可以与上界852和下界854相关联,该上界852和下界854是距第一回归线拟合850的阈值距离。第二回归线拟合860可以与上界862和下界864相关联,该上界862和下界864是距第二回归线拟合860的阈值距离。回归线830的值也在图8中描绘。根据一些实施方案,MS数据分析过程可以在图805上定位Y最大和Y1,并且生成连接Y最大和Y1的线以生成一个回归线拟合860。在一些实施方案中,MS数据分析过程可以在图805上定位B最大和B1,并且生成连接B最大和B1的线以生成另一个回归线拟合850。在一些实施方案中,阈值距离可以包括用于确定上界852、860和下界854、864的标准偏差,该标准偏差可以是基于组分元素(诸如色氨酸)的整数质量和质量亏损。在一些实施方案中,阈值距离可以是基于手动或算法的值。在一些实施方案中,回归线拟合850可以表示最大回归线拟合,而回归线拟合860可表示最小回归线拟合。参考图4至图8,在其中描绘了在其中描绘的离子的回归线拟合,包括图4的回归线拟合470和472、图5的回归线拟合570和572和图6的回归线拟合670和672。
如图8所示,Y离子主要低于回归线拟合,而B离子主要(>98.2%)高于回归线拟合。因此,根据一些实施方案的MS数据分析过程可以通过允许Y离子与B伴子分离来在识别过程中提供增加的选择性。可以选择回归线拟合上界852和回归线拟合下界854和/或回归线拟合上界862和回归线拟合下界864之间的产物离子并将其指定为候选离子碎片。
可以针对感兴趣的电荷值复制选择和指定候选离子碎片的过程。例如,可以针对z>2的前体离子重复确定电荷矢量的回归线拟合(以及它们各自的上界和下界)的过程。对于某些裂解过程,诸如碰撞诱导的离解(CID),z>2的前体离子可以生成从1+到z-1的最大值的碎片离子。可以如图8所示进行碎片离子的1+互补物的提取。由于氨基酸的元素组成和肽离子在MS中以多种电荷状态存在的能力,一些较高z碎片离子将在1+处理中被捕获。对于2+产物离子,即,那些不落在1+上界线和下界线内的产物离子,它们的质量亏损将在上部电荷矢量与下部电荷矢量之间切换。图5在二维空间中示出了标称质量520相对于2+产物离子的质量亏损525,其中中心电荷矢量552在1+上界线和下界线内,其他同位素分布在上部电荷矢量550与较低电荷矢量554。参考表1 205,在其中描绘了三个电荷矢量通道之间的分数质量的切换。
在一些实施方案中,使用z>2的前体离子的[Mr + (z-1)*H]/z作为最大值和中值权重平均B1和Y1[Mr + (z-1)*H]/z作为最小值计算上部电荷矢量通道和下部电荷矢量通道的回归线拟合。可以使用前体的[Mr + (z-1)*H]/z作为最大值和中值权重平均B1和Y1[Mr +(z-1)*H]/z作为最小值来计算上部电荷矢量。可以类似地计算较低电荷矢量;但是,最大值可以设置为前体离子的[Mr + (z-1)*H]/z减去组分构建块(例如,表1 205)的质量信息的中值标称和质量亏损的1倍。在各种实施方案中,最小标称质量和质量亏损可以与上部电荷矢量相同。对于z>2的前体离子,唯一电荷矢量通道的数量与(z-1)成比例。可以类似地处理更高z前体离子。例如,图6描绘了3+前体离子电荷矢量通道。
一旦构造所有回归线拟合,根据一些实施方案的MS分析过程就可以产生条带(在2维或3维空间中),这取决于是否采用IMS,从而仅选择在它们相应回归线拟合的上界线和下界线之间捕获的候选产物离子。条带,诸如图8的条带880的候选离子,由上界线和下界线限定。这些边界线反映两个值(标称质量和质量亏损)中的每个值的理论值加/减标准偏差。标称质量和质量亏损的在2维中的这些宽度(或标准偏差的数量)在回归线拟合的上方和下方投射候选离子碎片条带。可以从进一步考虑和/或对目标前体或潜在碎片离子的分析中去除不在候选离子条带内的离子。
一旦提取在条带上的候选离子碎片,裂解效率逻辑134可以操作以执行MS数据分析过程的碎片过滤过程。在一些实施方案中,裂解过滤过程可操作以基于裂解效率进一步过滤候选离子碎片以确定目标离子碎片。在一些实施方案中,可以将裂解效率确定为1减去残余离子强度/前体离子强度比。在各种实施方案中,随定性分析而变的灵敏度直接地与裂解效率相关。例如,MS/MS光谱中的过多残余前体离子强度指示裂解不良,因此产物离子强度较低。类似地,如果前体离子群集强度足够高以生成统计学上显著的数量的产物,那么MS/MS光谱中不存在任何残余前体离子强度,就会指示裂解过度。在示例性实施方案中,跨最宽动态范围的组成组分的识别随产物离子强度而变。
根据一些实施方案的裂解过滤过程确定产物离子光谱中的残余前体离子群集并计算它们相应强度的差异以计算裂解效率。图9描绘了裂解效率920相对于最大和最小产物离子强度百分比925的图905。在一些实施方案中,可以将计算的裂解效率与例如图9进行比较,并且设定相对于前体离子的最大产物离子强度公差930和最小产物离子强度公差932。在一些实施方案中,可以通过对一组先前采集的数据集(诸如DDA数据集和/或模拟数据集)的统计分析来生成图9。可以使用DDA数据集,因为仪器使用针对每个切换的前体离子的标称质量和z的优化的碰撞能量值的查找表。碰撞能量可以从最佳设置变化以表征裂解效率。从这些数据集中,可以基于前体离子的裂解效率计算适合于上界线(最强烈的产物)和下界线(最不强烈的产物)的回归线。
图10A和图11A描绘了目标前体的感兴趣的潜在产物离子的标称质量相对于质量亏损。图10A描绘了根据一些实施方案的未被过滤的潜在产物离子;相反,它们根据常规的方法未经过滤或进行过滤。图11A描绘了位于标称质量和质量亏损的上界和下界之间并在强度上界和强度下界的强度窗口内的电荷矢量条带上的目标碎片离子(条带)。图10B和图11B描绘了基于分别标z值和碎片离子类型(Y离子或B离子)的图10A和图11A的目标碎片离子而从离子数据集生成的光谱。图10B的光谱包括比图11B的光谱明显更多的峰值。因此,使用图11B的滤波光谱,前体-产物分析和/或比对可以更有效和准确。例如,对于图10B,肽匹配或“离子得分”为69,而图11B的离子得分为109,其比图10B的常规方法的离子得分显著改进。在一些实施方案中,前体-产物比对逻辑136可以操作以将产物离子碎片与目标前体比对,例如,使用离子数据集142和/或相关联的光谱,诸如图10B和图11B中所示的光谱。
在一些实施方案中,MS数据分析过程可以基于分数质量、标称质量、z和碎片离子类型等执行从头测序过程和/或序列标签形成过程。从头测序过程可以包括确定前体离子的[Mr + (z-1)*H]/z与其近Y离子邻居(低于回归线)之间的Δ标称质量在所有组分元素的最大整数质量内,例如,如表1 205中所提供的。鉴于标称质量匹配,那么比较质量亏损的Δ以验证匹配,如果匹配在匹配公差或阈值内,那么[Mr + (z-1)*H]/z的属性用匹配的产物离子的那些替换,并且可以重复该过程。在没有初始匹配的情况下(例如,没有Y最大-1个氨基酸),该算法寻找两个氨基酸的Δ标称质量和质量亏损,以试图连接到Y最大-2个氨基酸。如果Y最大-1个氨基酸或Y最大-2个氨基酸没有连接,那么该过程取用最强的产物离子,知道其碎片离子类型(高于b或低于y),并且从前体离子的[Mr + (z-1)*H]/z标称质量中减去其标称质量并寻找其互补对的伴子(上部/下部条带)。过程重复该过程,直到查询到所有提取的产物离子的互补对。如果发现互补对,那么将来自第一遍的[Mr + (z-1)*H]/z值替换为互补对的值,并且逐个通道重复相同过程。
本文包括表示用于执行所公开的架构的新颖方面的示例性方法的一个或多个逻辑流程。虽然为了简化说明目的,本文所示的一种或多种方法被示出并描述为一系列的动作,但是本领域的技术人员将理解并了解,这些方法不受动作次序限制。因此,一些动作能够以不同的次序发生和/或与本文所示和所述的其他动作同时地发生。例如,本领域的技术人员将理解并了解,方法可以替代地表示为一系列的相关状态或事件,诸如在状态图中。此外,并非方法中所示的所有行为都可能是新颖实施方式所必需的。
逻辑流程可以用软件、固件、硬件或它们的任何组合来实现。在软件和固件实施方案中,逻辑流程可以由存储在非暂时性计算机可读介质或机器可读介质(诸如光学、磁性或半导体存储装置)上的计算机可执行指令来实现。实施方案不限于该上下文。
图12示出了逻辑流程1200的实施方案。逻辑流程1200可以表示由本文所述的一个或多个实施方案诸如装置120和/或MS 110执行的操作的一些或全部。在一些实施方案中,逻辑流程1200可以表示MS数据分析过程的操作的一些或全部。
在框1202处,逻辑流程1200可以确定目标前体。例如,MS 110的操作员可以在样本分析期间输入至少一种感兴趣的目标前体(例如,蛋白质或肽)。在框1204处,逻辑流程1200可以访问目标前体的元素的前体组合物信息。例如,对于肽目标前体,MS数据分析逻辑130可以访问质量信息144,该质量信息包括氨基酸的多个电荷值的标称质量和质量亏损,诸如表1 205中提供的。在框1206处,逻辑流程1200可以确定与目标前体相关联的离子碎片的NM-MD关系信息。例如,NM-MD 132可以针对某些电荷值确定、生成、访问和/或提供标称m/z相对于质量亏损m/z的曲线,诸如在图4至图7中所描绘的。
在框1208处,逻辑流程1200可以确定离子碎片的上界和离子碎片的下界。例如,根据一些实施方案配置的MS数据分析过程可以将Y最大和B最大两者的标称和质量亏损用作最大值,并且分别将Y1和B1的重量平均标称和质量亏损用作最小值,以产生NM-MD关系信息的两个单独的线性回归线拟合。此外,可以通过添加驻留在质量信息中的组分构建块144的标称质量和质量亏损两者的相应标准偏差的用户或算法得到的倍数来为用于产物离子提取的回归线拟合中的每个提供上界线和下界线。在框1210处,逻辑流程1200可以基于将离子碎片上界和离子碎片下界应用于NM-MD关系信息来提取候选离子碎片。例如,参考图8,可以选择回归线拟合上界852和回归线拟合下界854与回归线拟合上界862和回归线拟合下界864之间的产物离子并将其指定为候选离子碎片。
图13示出了逻辑流程1300的实施方案。逻辑流程1300可以表示由本文所述的一个或多个实施方案诸如装置120和/或MS 110执行的操作的一些或全部。在一些实施方案中,逻辑流程1300可以表示MS数据分析过程的操作的一些或全部。
在框1302处,逻辑流程1300可以确定与目标前体的离子碎片相关联的裂解效率信息。例如,裂解过滤过程可操作以基于裂解效率进一步过滤候选离子碎片以确定目标离子碎片。在一些实施方案中,可以将裂解效率确定为1减去残余离子强度/前体离子强度比。在框1304处,逻辑流程1300可以确定最小产物离子强度公差和最大产物离子强度公差。例如,可以将计算的裂解效率与例如图9进行比较,并且设定相对于前体离子的最大产物离子强度公差930和最小产物离子强度公差932。逻辑流程1300可以在框1306处通过基于最小产物离子强度和最大产物离子强度而过滤候选产物离子来确定目标产物离子。例如,图11A描绘了位于标称质量和质量亏损的上界和下界之间并在强度上界和强度下界的强度窗口内的电荷矢量条带上的目标碎片离子。在框1308处,逻辑流程1300可以生成产物离子数据集的目标离子碎片的光谱数据。例如,图11B描绘了基于标z值和碎片离子类型(Y离子或B离子)的图11A的目标碎片离子而从离子数据集生成的光谱。
图14示出了存储介质1400的示例。存储介质1400可以包括制品。在一些示例中,存储介质1400可以包括任何非暂时性计算机可读介质或机器可读介质,诸如光学、磁性或半导体存储装置。存储介质1400可以存储各种类型的计算机可执行指令,诸如用于实现逻辑流程1200和/或1300的指令。计算机可读或机器可读存储介质的示例可以包括能够存储电子数据的任何有形介质,包括易失性存储器或非易失性存储器、可移动或不可移动存储器、可擦除或不可擦除存储器、可写或可重写存储器等。计算机可执行指令的示例可以包括任何合适的类型的代码,诸如源代码、编译代码、解释代码、可执行代码、静态代码、动态代码、面向对象代码、可视代码等。示例不限于该上下文。
图15示出了适于实现如前所述的各种实施方案的示例性计算架构1500的实施方案。在各种实施方案中,计算架构1500可以包括或实现为电子设备的一部分。在一些实施方案中,计算架构1500可以表示例如装置120和/或MS 110。实施方案不限于该上下文。
如在本申请中所用,术语“系统”和“部件”和“模块”旨在是指与计算机相关的实体、硬件、硬件和软件的组合、软件或执行中的软件,它们的示例由示例性计算架构1500提供。例如,部件可以是但不限于是在处理器上运行的进程、处理器、硬盘驱动器、多个存储驱动器(光学和/或磁性存储介质)、对象、可执行文件、执行线程、程序和/或计算机。举例来说,在服务器上运行的应用程序和服务器两者都可以是部件。一个或多个部件可以驻留在进程和/或执行线程内,并且部件可以位于一台计算机上和/或分布在两台或更多台计算机之间。此外,部件可以通过各种类型的通信介质彼此通信地耦接以协调操作。协调可以涉及单向或双向信息交换。例如,部件能够以通过通信介质传达的信号的形式传达信息。该信息可以实现为分配给各种信号线的信号。在此类分配中,每条消息都是信号。然而,另外实施方案可以替代地采用数据消息。可以通过各种连接发送此类数据消息。示例性连接包括并行接口、串行接口和总线接口。
计算架构1500包括各种通用计算元件,诸如一个或多个处理器、多核处理器,协处理器、存储器单元、芯片组、控制器、外围设备、接口、振荡器、定时设备、视频卡、音频卡、多媒体输入/输出(I/O)部件、电源等。然而,实施方案不限于计算架构1500的实施方式。
如图15所示,计算架构1500包括处理单元1504、系统存储器1506和系统总线1508。处理单元1504可以是各种可商购获得的处理器中的任一种,包括但不限于:AMD®Athlon®、Duron®和Opteron®处理器;ARM®应用程序、嵌入式和安全处理器;IBM®和Motorola®DragonBall®和PowerPC®处理器;IBM和Sony®Cell处理器;Intel®Celeron®、Core(2) Duo®、Itanium®、Pentium®、Xeon®和XScale®处理器;以及类似的处理器。双微处理器、多核处理器和其他多处理器架构也可以用作处理单元1504。
系统总线1508为系统部件提供了接口,该系统部件包括但不限于系统存储器1506到处理单元1504。系统总线1508可以是若干类型的总线结构中的任一种,其可以使用各种可商购获得的总线架构中的任一种进一步互连到存储器总线(具有或不具有存储器控制器)、外围总线和本地总线。接口适配器可以经由插槽架构连接到系统总线1508。示例性插槽架构可以包括但不限于加速图形端口(AGP)、卡总线、(扩展)工业标准架构((E)ISA)、微通道架构(MCA)、NuBus、外围部件互连(扩展)(PCI(X))、PCI Express、个人计算机存储卡国际协会(PCMCIA)等。
系统存储器1506可以包括呈一个或多个高速存储器单元的形式的各种类型的计算机可读存储介质,诸如只读存储器(ROM)、随机存取存储器(RAM)、动态RAM (DRAM)、双数据速率DRAM (DDRAM)、同步DRAM (SDRAM)、静态RAM (SRAM)、可编程ROM (PROM)、可擦除可编程ROM (EPROM)、电可擦除可编程ROM (EEPROM)、闪存存储器、聚合物存储器(诸如铁电聚合物存储器、双向存储器、相变或铁电存储器),硅-氧化物-氮化物-氧化物-硅(SONOS)存储器、磁性或光学卡设备阵列(诸如独立磁盘冗余阵列(RAID)驱动器)、固态存储器设备(例如,USB存储器、固态驱动器(SSD)和适于存储信息的任何其他类型的存储介质。在图15中所示的实施方案中,系统存储器1506可以包括非易失性存储器1510和/或易失性存储器1512。基本输入/输出系统(BIOS)可以存储在非易失性存储器1510中。
计算机1502可以包括呈一个或多个低速存储器单元的形式的各种类型的计算机可读存储介质,包括内部(或外部)硬盘驱动器(HDD) 1514、用于从可移动磁盘1518读取或向其写入的磁性软盘驱动器(FDD) 1516、以及用于从可移动光盘1522读取或向其写入的光盘驱动器1520(例如,CD-ROM或DVD)。HDD 1514、FDD 1516和光盘驱动器1520可以分别通过HDD接口1524、FDD接口1526和光盘驱动器接口1528连接到系统总线1508。用于外部驱动器实施方式的HDD接口1524可以包括通用串行总线(USB)和IEEE 13154接口技术中的至少一者或两者。
驱动器和相关联的计算机可读介质提供数据、数据结构、计算机可执行指令等的易失性和/或非易失性存储。例如,多个程序模块可以存储在驱动器单元1510和存储器单元1512中,包括操作系统1530、一个或多个应用程序1532、其他程序模块1534和程序数据1536。在一个实施方案中,一个或多个应用程序1532、其他程序模块1534和程序数据1536可以包括例如装置105或MS 110的各种应用程序和/或部件。
用户可以通过一个或多个有线/无线输入设备(例如,键盘1538和定点设备诸如鼠标1540)将命令和信息输入到计算机1502中。其他输入设备可以包括麦克风、红外(IR)遥控器、射频(RF)遥控器、游戏手柄、手写笔、读卡器、加密狗、指纹读卡器、手套、图形输入板、操纵杆、键盘、视网膜读取器、触摸屏(例如,电容式、电阻式等)、轨迹球、触控板、传感器、触控笔等。这些和其他输入设备通常通过耦接到系统总线1508的输入设备接口1542连接到处理单元1504,但是可以通过其他接口连接诸如并行端口、IEEE 1394串行端口、游戏端口、USB端口、IR接口等连接。
监视器1544或其他类型的显示设备也经由接口诸如视频适配器1546连接到系统总线1508。监视器1544可以在计算机802的内部或外部。除了监视器1544之外,计算机通常包括其他外围输出设备,诸如扬声器、打印机等。
计算机1502可以经由到一个或多个远程计算机诸如远程计算机1548的有线和/或无线通信使用逻辑连接在网络环境中操作。远程计算机1548可以是工作站、服务器计算机、路由器、个人计算机、便携式计算机、基于微处理器的娱乐设备、对等设备或其他公共网络节点,并且通常包括相对于计算机1502描述的元件中的许多或所有,但是为了简洁起见,仅示出了存储器/存储设备1550。所描绘的逻辑连接包括到局域网(LAN) 1552和/或更大网络例如广域网(WAN) 1554的有线/无线连接。此类LAN和WAN网络环境在办公室和公司中是常见的,并且促成企业范围的计算机网络,诸如内联网,它们全都可以连接到全球通信网络,例如互联网。
当在LAN网络环境中使用时,计算机1502通过有线和/或无线通信网络接口或适配器1556连接到LAN 1552。适配器1556可以促成到LAN 1552的有线和/或无线通信,该LAN还可以包括设置在其上的无线接入点,以用于与适配器1556的无线功能性通信。
当在WAN联网环境中使用时,计算机1502可以包括调制解调器1558,或连接到WAN1554上的通信服务器,或具有用于通过WAN 1554诸如通过互联网建立通信的其他手段。调制解调器1558可以是内部的或外部的,并且有线和/或无线设备经由输入设备接口1542连接到系统总线1508。在联网环境中,相对于计算机1502描述的程序模块或其部分可以存储在远程存储器/存储设备1550中。应当理解,所示的网络连接是示例性的,并且可以使用在计算机之间建立通信链路的其他手段。
计算机1502可操作以使用IEEE 802系列标准与有线和无线设备或实体(诸如可操作地设置在无线通信中的无线设备(例如,IEEE 802.16空中调制技术))通信。这至少包括Wi-Fi(或无线保真)、WiMax和Bluetooth™无线技术等。因此,通信可以是与常规网络一样的预定义的结构,或仅是至少两个设备之间的自组织通信。Wi-Fi网络使用称为IEEE 802.11x(a、b、g、n等)的无线电技术来提供安全、可靠、快速的无线连接性。Wi-Fi网络可以用于将计算机彼此连接,连接到互联网,以及连接到有线网络(使用IEEE 802.3相关媒体和功能)。
至少一个实施方案的一个或多个方面可以通过存储在机器可读介质上的表示指令来实现,该表示指令表示处理器内的各种逻辑,该表示指令在由机器读取时,致使机器制造逻辑以执行本文所述的技术。被称为“IP核”的此类表示可以存储在有形机器可读介质上并提供给各种客户或制造设施,以加载到实际制造逻辑的制造机器或处理器中。一些实施方案可以例如使用机器可读介质或制品来实现,该机器可读介质或制品可以存储指令或指令集,该指令或指令集在由机器执行时,可以致使机器执行根据实施方案的方法和/或操作。此类机器可以包括例如任何合适的处理平台、计算平台、计算设备、处理设备、计算系统、处理系统、计算机、处理器等,并且可以使用硬件和/或软件的任何合适的组合来实现。机器可读介质或制品可以包括例如任何合适的类型的存储器单元、存储器设备、存储器制品、存储器介质、存储设备、存储制品、存储介质和/或存储单元,例如,存储器、可移动或不可移动介质、可擦除或不可擦除介质、可写或可重写介质、数字或模拟介质、硬盘、软盘、压缩盘只读存储器(CD-RW)、可记录压缩盘(CD-R)、可重写压缩盘(CD-RW)、光盘、磁性介质、磁光介质、可移动存储卡或磁盘、各种类型的数字通用盘(DVD)、磁带、盒式磁带等。指令可以包括使用任何合适的高级、低级、面向对象、可视、编译和/或解释编程语言实现的任何合适的类型的代码,诸如源代码、编译代码、解释代码、可执行代码、静态代码、动态代码、加密代码等。
以下包括非限制性示例性实施方案:
实施例1是计算机实现的样本分析方法,该方法包括:访问经由对包括至少一个目标前体的样本进行质量分析生成的至少一个产物离子数据集;访问至少一个目标前体的多种组分元素的前体组合物信息,该前体组合物信息包括多种组分元素的至少一部分的标称质量信息和质量亏损信息;基于前体组合物信息而确定与至少一个目标前体相关联的多个离子碎片的标称质量(NM)-质量亏损(MD)关系信息;确定多个离子碎片的至少一个离子碎片上界和至少一个离子碎片下界;经由将至少一个离子碎片上界和至少一个离子碎片下界应用于NM-MD关系信息而从多个离子碎片提取多个候选离子碎片;以及基于与多个候选离子碎片相关联的裂解效率信息而从多个候选离子碎片确定多个目标离子碎片。
实施例2是实施例1的方法,包括生成多个目标离子碎片的光谱数据。
实施例3是实施例1的方法,至少一种目标前体包括肽,并且多种组分元素包括氨基酸。
实施例4是实施例1的方法,NM-MD关系信息包括多个离子碎片的标称质量相对于质量亏损的图。
实施例5是实施例1的方法,至少一个碎片下界包括第一回归线拟合、第一上界和第一下界,第一上界和第一下界是距第一回归线拟合的阈值距离。
实施例6是实施例5的方法,第一回归线拟合包括Y最大离子与Y1离子之间的线拟合。
实施例7是实施例6的方法,至少一个碎片下界包括第二回归线拟合、第二上界和第二下界,第二上界和第二下界是距第一回归线拟合的阈值距离。
实施例8是实施例7的方法,第二回归线拟合包括B最大离子与B1离子之间的线拟合。
实施例9是可操作以执行样本分析的装置,该装置包括:处理电路;以及逻辑,该逻辑耦接到至少一个存储器,用以:访问经由对包括至少一个目标前体的样本进行质量分析生成的至少一个产物离子数据集;访问至少一个目标前体的多种组分元素的前体组合物信息,该前体组合物信息包括多种组分元素的至少一部分的标称质量信息和质量亏损信息;基于前体组合物信息而确定与至少一个目标前体相关联的多个离子碎片的标称质量(NM)-质量亏损(MD)关系信息;确定多个离子碎片的至少一个离子碎片上界和至少一个离子碎片下界;经由将至少一个离子碎片上界和至少一个离子碎片下界应用于NM-MD关系信息而从多个离子碎片提取多个候选离子碎片;以及基于与多个候选离子碎片相关联的裂解效率信息而从多个候选离子碎片确定多个目标离子碎片。
实施例10是实施例9的装置,逻辑用以生成多个目标离子碎片的光谱数据。
实施例11是实施例9的装置,至少一种目标前体包括肽,并且多种组分元素包括氨基酸。
实施例12是实施例9的装置,NM-MD关系信息包括多个离子碎片的标称质量相对于质量亏损的图。
实施例13是实施例9的装置,至少一个碎片下界包括第一回归线拟合、第一上界和第一下界,第一上界和第一下界是距第一回归线拟合的阈值距离。
实施例14是实施例13的装置,第一回归线拟合包括Y最大离子与Y1离子之间的线拟合。
实施例15是实施例14的装置,至少一个碎片下界包括第二回归线拟合、第二上界和第二下界,第二上界和第二下界是距第一回归线拟合的阈值距离。
实施例16是实施例15的装置,第二回归线拟合包括B最大离子与B1离子之间的线拟合。
实施例17是计算机可读存储介质,该计算机可读存储介质包括多个指令,多个指令在被执行时,使处理电路能够:访问经由对包括至少一个目标前体的样本进行质量分析生成的至少一个产物离子数据集;访问至少一个目标前体的多种组分元素的前体组合物信息,该前体组合物信息包括多种组分元素的至少一部分的标称质量信息和质量亏损信息;基于前体组合物信息而确定与至少一个目标前体相关联的多个离子碎片的标称质量(NM)-质量亏损(MD)关系信息;确定多个离子碎片的至少一个离子碎片上界和至少一个离子碎片下界;经由将至少一个离子碎片上界和至少一个离子碎片下界应用于NM-MD关系信息而从多个离子碎片提取多个候选离子碎片;以及基于与多个候选离子碎片相关联的裂解效率信息而从多个候选离子碎片确定多个目标离子碎片。
实施例18是实施例17的计算机可读存储介质,多个指令在被执行时使处理电路能够生成多个目标离子碎片的光谱数据。
实施例19是实施例17的计算机可读存储介质,至少一种目标前体包括肽,并且多种组分元素包括氨基酸。
实施例20是实施例17的计算机可读存储介质,NM-MD关系信息包括多个离子碎片的标称质量相对于质量亏损的图。
应当指出的是,本文所述的方法不必以所描述的次序或以任何特定的次序执行。此外,关于本文标识的方法描述的各种活动能够以串联或并行方式执行。
虽然在本文中已经示出和描述了具体的实施方案,但是应当理解,被计算来实现相同的目的的任何布置可以替代所示出的具体的实施方案。本公开旨在涵盖各种实施方案的任何和所有改编或变化。应当理解,以上描述是以例示性方式进行,而不是限制性的。在阅读以上描述后,上述实施方案的组合以及本文未具体地描述的其他实施方案对于本领域的技术人员来说将是显而易见的。因此,各种实施方案的范围包括其中使用上述组合物、结构和方法的任何其他应用。
需强调,本发明的摘要按照315 C.F.R. § 1.152(b)提供,从而要求允许读者快速地确定技术公开的性质的摘要。应当理解,所提交的摘要将不会被用于解释或限制权利要求的范围或含义。另外,在前述具体实施方式中,可以看出,可以出于简化本公开目的,各种特征在单一实施方案中被分组在一起。本公开的该方法不应被解释为反映要求保护的实施方案要求比每项权利要求中明确地表述的特征更多的特征的意图。相反,如以下权利要求所反映,本发明的主题比单个公开的实施方案的所有特征少。因此,以下权利要求在此结合到具体实施方式中,其中每项权利要求将其自身作为单独优选的实施方案。在所附权利要求中,术语“包括(including)”和“其中(in which)”分别用作相应术语“包括(comprising)”和“其中(wherein)”的通俗英文等效用语。此外,术语“第一”、“第二”和“第三”等仅用作标签,而不旨在对它们的对象强加数字要求。
虽然已经用特定于结构特征和/或方法动作的语言描述了本主题,但是应当理解,所附权利要求中限定的主题不一定限于以上描述的具体的特征或动作。相反,具体的特征和动作被公开为实施权利要求的示例形式。
Claims (12)
1.一种计算机实现的样本分析方法,所述方法包括:
访问经由对包括至少一个目标前体的样本进行质量分析生成的至少一个产物离子数据集;
访问所述至少一个目标前体的多种组分元素的前体组合物信息,所述前体组合物信息包括所述多种组分元素的至少一部分的标称质量信息和质量亏损信息;
确定与所述至少一个目标前体相关联的多个离子碎片的标称质量-质量亏损关系信息,所述标称质量-质量亏损关系信息包括标称质量相对于质量亏损信息,所述标称质量-质量亏损关系信息基于所述前体组合物信息;
确定所述多个离子碎片的所述标称质量相对于质量亏损信息的至少一个离子碎片上界和所述多个离子碎片的所述标称质量相对于质量亏损信息的至少一个离子碎片下界,
所述至少一个碎片上界包括B最大离子与B1离子之间的第一回归线拟合,
所述第一回归线拟合与第一上界和第一下界相关联,所述第一上界和所述第一下界每个是距所述第一回归线拟合的阈值距离,
所述至少一个碎片下界包括Y最大离子与Y1离子之间的第二回归线拟合,
所述第二回归线拟合与第二上界和第二下界相关联,所述第二上界和所述第二下界每个是距所述第二回归线拟合的阈值距离;
经由将所述至少一个离子碎片上界和所述至少一个离子碎片下界应用于所述标称质量相对于质量亏损信息并且选择在所述至少一个离子碎片上界和所述至少一个离子碎片下界之间捕获的候选产物离子而从所述多个离子碎片提取多个候选离子碎片;以及
基于与所述多个候选离子碎片相关联的裂解效率信息而从所述多个候选离子碎片确定多个目标离子碎片,所述多个目标离子碎片属于所述至少一个目标前体。
2.根据权利要求1所述的方法,包括生成所述多个目标离子碎片的光谱数据。
3.根据权利要求1所述的方法,所述至少一种目标前体包括肽,并且所述多种组分元素包括氨基酸。
4.根据权利要求1所述的方法,所述标称质量-质量亏损关系信息包括所述多个离子碎片的标称质量相对于质量亏损的图。
5.一种可操作以执行样本分析的装置,所述装置包括:
处理电路;和
逻辑,所述逻辑耦接到至少一个存储器,用以:
访问经由对包括至少一个目标前体的样本进行质量分析生成的至少一个产物离子数据集;
访问所述至少一个目标前体的多种组分元素的前体组合物信息,所述前体组合物信息包括所述多种组分元素的至少一部分的标称质量信息和质量亏损信息;
确定与所述至少一个目标前体相关联的多个离子碎片的标称质量-质量亏损关系信息,所述标称质量-质量亏损关系信息包括标称质量相对于质量亏损信息,所述标称质量-质量亏损关系信息基于所述前体组合物信息;
确定所述多个离子碎片的所述标称质量相对于质量亏损信息的至少一个离子碎片上界和所述多个离子碎片的所述标称质量相对于质量亏损信息的至少一个离子碎片下界,
所述至少一个碎片上界包括B最大离子与B1离子之间的第一回归线拟合,
所述第一回归线拟合与第一上界和第一下界相关联,所述第一上界和所述第一下界每个是距所述第一回归线拟合的阈值距离,
所述至少一个碎片下界包括Y最大离子与Y1离子之间的第二回归线拟合,
所述第二回归线拟合与第二上界和第二下界相关联,所述第二上界和所述第二下界每个是距所述第二回归线拟合的阈值距离;
经由将所述至少一个离子碎片上界和所述至少一个离子碎片下界应用于所述标称质量相对于质量亏损信息并且选择在所述至少一个离子碎片上界和所述至少一个离子碎片下界之间捕获的候选产物离子而从所述多个离子碎片提取多个候选离子碎片;以及
基于与所述多个候选离子碎片相关联的裂解效率信息而从所述多个候选离子碎片确定多个目标离子碎片,所述多个目标离子碎片属于所述至少一个目标前体。
6.根据权利要求5所述的装置,所述逻辑用以生成所述多个目标离子碎片的光谱数据。
7.根据权利要求5所述的装置,所述至少一种目标前体包括肽,并且所述多种组分元素包括氨基酸。
8.根据权利要求5所述的装置,所述标称质量-质量亏损关系信息包括所述多个离子碎片的标称质量相对于质量亏损的图。
9.一种计算机可读存储介质,所述计算机可读存储介质包括多个指令,所述多个指令在被执行时,使处理电路能够:
访问经由对包括至少一个目标前体的样本进行质量分析生成的至少一个产物离子数据集;
访问所述至少一个目标前体的多种组分元素的前体组合物信息,所述前体组合物信息包括所述多种组分元素的至少一部分的标称质量信息和质量亏损信息;
确定与所述至少一个目标前体相关联的多个离子碎片的标称质量-质量亏损关系信息,所述标称质量-质量亏损关系信息包括标称质量相对于质量亏损信息,所述标称质量-质量亏损关系信息基于所述前体组合物信息;
确定所述多个离子碎片的所述标称质量相对于质量亏损信息的至少一个离子碎片上界和所述多个离子碎片的所述标称质量相对于质量亏损信息的至少一个离子碎片下界,
所述至少一个碎片上界包括B最大离子与B1离子之间的第一回归线拟合,
所述第一回归线拟合与第一上界和第一下界相关联,所述第一上界和所述第一下界每个是距所述第一回归线拟合的阈值距离,
所述至少一个碎片下界包括Y最大离子与Y1离子之间的第二回归线拟合,
所述第二回归线拟合与第二上界和第二下界相关联,所述第二上界和所述第二下界每个是距所述第二回归线拟合的阈值距离;
经由将所述至少一个离子碎片上界和所述至少一个离子碎片下界应用于所述标称质量相对于质量亏损信息并且选择在所述至少一个离子碎片上界和所述至少一个离子碎片下界之间捕获的候选产物离子而从所述多个离子碎片提取多个候选离子碎片;以及基于与所述多个候选离子碎片相关联的裂解效率信息而从所述多个候选离子碎片确定多个目标离子碎片,所述多个目标离子碎片属于所述至少一个目标前体。
10.根据权利要求9所述的计算机可读存储介质,所述多个指令在被执行时使所述处理电路能够生成所述多个目标离子碎片的光谱数据。
11.根据权利要求9所述的计算机可读存储介质,所述至少一种目标前体包括肽,并且所述多种组分元素包括氨基酸。
12.根据权利要求9所述的计算机可读存储介质,所述标称质量-质量亏损关系信息包括所述多个离子碎片的标称质量相对于质量亏损的图。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201662424699P | 2016-11-21 | 2016-11-21 | |
US62/424699 | 2016-11-21 | ||
PCT/US2017/062811 WO2018094396A1 (en) | 2016-11-21 | 2017-11-21 | Techniques for mass analyzing a complex sample |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110178182A CN110178182A (zh) | 2019-08-27 |
CN110178182B true CN110178182B (zh) | 2023-08-08 |
Family
ID=60766144
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201780084101.3A Active CN110178182B (zh) | 2016-11-21 | 2017-11-21 | 用于对复杂样本进行质量分析的方法、装置和存储介质 |
Country Status (4)
Country | Link |
---|---|
US (1) | US10825672B2 (zh) |
EP (1) | EP3542292B1 (zh) |
CN (1) | CN110178182B (zh) |
WO (1) | WO2018094396A1 (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109828068B (zh) * | 2017-11-23 | 2021-12-28 | 株式会社岛津制作所 | 质谱数据采集及分析方法 |
CN116297794B (zh) * | 2023-05-11 | 2023-10-31 | 深圳大学 | 基于超高分辨质谱仪的有机物确定方法及终端设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1340160A (zh) * | 1999-01-22 | 2002-03-13 | 泰利斯技术股份公司 | 质谱法筛选催化剂 |
CN1898674A (zh) * | 2003-10-20 | 2007-01-17 | 瑟诺生物科学有限责任公司 | 用于校准质谱仪(ms)与其它仪器系统和用于处理ms与其它数据的方法 |
CN102017058A (zh) * | 2008-05-15 | 2011-04-13 | 塞莫费雪科学(不来梅)有限公司 | Ms/ms数据处理 |
CN102937622A (zh) * | 2012-11-20 | 2013-02-20 | 复旦大学 | 一种在离子阱中进行的串级质谱分析方法 |
CN104508792A (zh) * | 2012-06-18 | 2015-04-08 | 莱克公司 | 使用非均匀采样的串联式飞行时间质谱法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE112005001166B4 (de) * | 2004-05-20 | 2014-10-09 | Waters Technologies Corp. (N.D.Ges.D. Staates Delaware) | Verfahren und Vorrichtung zum Identifizieren von Proteinen in Gemischen |
US7634364B2 (en) * | 2005-06-23 | 2009-12-15 | Life Technologies Corporation | Methods and systems for mass defect filtering of mass spectrometry data |
WO2014130627A1 (en) * | 2013-02-21 | 2014-08-28 | Children's Medical Center Corporation | Glycopeptide identification |
-
2017
- 2017-11-21 WO PCT/US2017/062811 patent/WO2018094396A1/en active Application Filing
- 2017-11-21 CN CN201780084101.3A patent/CN110178182B/zh active Active
- 2017-11-21 US US15/819,793 patent/US10825672B2/en active Active
- 2017-11-21 EP EP17817959.4A patent/EP3542292B1/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1340160A (zh) * | 1999-01-22 | 2002-03-13 | 泰利斯技术股份公司 | 质谱法筛选催化剂 |
CN1898674A (zh) * | 2003-10-20 | 2007-01-17 | 瑟诺生物科学有限责任公司 | 用于校准质谱仪(ms)与其它仪器系统和用于处理ms与其它数据的方法 |
CN102017058A (zh) * | 2008-05-15 | 2011-04-13 | 塞莫费雪科学(不来梅)有限公司 | Ms/ms数据处理 |
CN104508792A (zh) * | 2012-06-18 | 2015-04-08 | 莱克公司 | 使用非均匀采样的串联式飞行时间质谱法 |
CN102937622A (zh) * | 2012-11-20 | 2013-02-20 | 复旦大学 | 一种在离子阱中进行的串级质谱分析方法 |
Non-Patent Citations (2)
Title |
---|
an MS/MS acquisition strategy for maximizing selectivity, specificity and sensitivity of DIA product ion spectra.《Proteomics》.2016,第16卷 * |
Brad J. Williams 等.Multi-Mode Acquisition (MMA) * |
Also Published As
Publication number | Publication date |
---|---|
US20180144918A1 (en) | 2018-05-24 |
EP3542292B1 (en) | 2024-09-11 |
EP3542292A1 (en) | 2019-09-25 |
CN110178182A (zh) | 2019-08-27 |
US10825672B2 (en) | 2020-11-03 |
WO2018094396A1 (en) | 2018-05-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4932833B2 (ja) | 分画を用いる化学分析の方法および装置 | |
JP4932834B2 (ja) | 保持時間整合を行うための方法および装置 | |
US7577538B2 (en) | Computational method and system for mass spectral analysis | |
Telu et al. | Analysis of human plasma metabolites across different liquid chromatography/mass spectrometry platforms: Cross‐platform transferable chemical signatures | |
EP2032238A2 (en) | Analyzing mass spectral data | |
US20090210167A1 (en) | Computational methods and systems for multidimensional analysis | |
JP2007256126A (ja) | 質量分析システム | |
CN110178182B (zh) | 用于对复杂样本进行质量分析的方法、装置和存储介质 | |
Koomen et al. | Diagnostic protein discovery using liquid chromatography/mass spectrometry for proteolytic peptide targeting | |
CN114127555B (zh) | 目标化合物分析技术 | |
Lopez-Ferrer et al. | Pushing the limits of bottom-up proteomics with state-of-the-art capillary UHPLC and orbitrap mass spectrometry for reproducible quantitation of proteomes | |
Li et al. | Informatics for Mass Spectrometry-Based Protein Characterization |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |