CN101534933B - 关于n维数据的离子检测和参数估计 - Google Patents
关于n维数据的离子检测和参数估计 Download PDFInfo
- Publication number
- CN101534933B CN101534933B CN2007800279145A CN200780027914A CN101534933B CN 101534933 B CN101534933 B CN 101534933B CN 2007800279145 A CN2007800279145 A CN 2007800279145A CN 200780027914 A CN200780027914 A CN 200780027914A CN 101534933 B CN101534933 B CN 101534933B
- Authority
- CN
- China
- Prior art keywords
- convolution
- peak
- ion
- data
- dimension
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H01—ELECTRIC ELEMENTS
- H01J—ELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
- H01J49/00—Particle spectrometers or separator tubes
- H01J49/26—Mass spectrometers or separator tubes
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/20—Identification of molecular entities, parts thereof or of chemical compositions
-
- H—ELECTRICITY
- H01—ELECTRIC ELEMENTS
- H01J—ELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
- H01J49/00—Particle spectrometers or separator tubes
- H01J49/0027—Methods for using particle spectrometers
- H01J49/0036—Step by step routines describing the handling of the data generated during a measurement
-
- H—ELECTRICITY
- H01—ELECTRIC ELEMENTS
- H01J—ELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
- H01J49/00—Particle spectrometers or separator tubes
- H01J49/02—Details
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/08—Feature extraction
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/70—Machine learning, data mining or chemometrics
Landscapes
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Crystallography & Structural Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computing Systems (AREA)
- Theoretical Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
- Image Processing (AREA)
Abstract
用于LC/IMS/MS的方法和设备涉及:从样本获得有噪声的原始数据;将数据与伪像减少滤波器进行卷积;以及在保留时间、离子迁移率和质荷比维定位卷积数据的一个或多个离子峰。
Description
本申请要求2006年5月26日提交的美国临时申请(申请号60/808901)的优先权和权益,通过引用将其完成内容完整地结合于此。
技术领域
本发明概要地涉及化合物的分析,更具体来说,涉及通过液相色谱分析、离子迁移率光谱分析和质量光谱分析所采集的离子的检测及量化。
背景技术
质量光谱仪(MS)广泛地用于识别和量化样本中的分子种类(molecular species)。在分析期间,把来自样本的分子离子化以形成被引入质量光谱仪进行分析的离子。质量光谱仪测量所引入离子的质荷比(m/z)和强度。
质量光谱仪受限于单个样本光谱中可靠检测和量化的不同离子的数量。因此,包含许多分子种类的样本可能产生对于使用常规质量光谱仪进行解释或分析过于复杂的光谱。
另外,分子种类的浓度往往在大范围改变。例如,生物样本通常在较低浓度比在较高浓度具有更大数量的分子种类。因此,离子的很大一部分以低浓度出现。低浓度往往接近常用质量光谱仪的检测极限。此外,在低浓度,离子检测遭受背景噪声和/或干扰背景分子。因此,能通过去除尽可能多的背景噪声以及减少光谱中存在的干扰种类的数量,来改进这类低丰度种类的检测。
在将样本注入质量光谱仪之前,色谱分离通常用于降低这类光谱的复杂度。例如,肽或蛋白质往往产生在共同的色谱保留时间洗脱的离子簇,并因此产生在光谱中重叠的峰。在时间上将这些簇与不同分子分离有助于简化这类簇所产生的光谱的解释。
常用色谱分离仪器包括气相色谱仪(GC)和液相色谱仪(LC)。在与质量光谱仪耦合时,所产生的系统称作GC/MS或LC/MS系统。GC/MS或LC/MS系统通常是在线系统,其中GC或LC的输出直接与MS耦合。
组合LC/MS系统为分析人员提供识别以及量化各种样本中的分子种类的强大部件。一般样本包含数个或数千个分子种类的混合物。分子往往展示大量属性和特性,并且各分子种类能产生一个以上离子。例如,肽的质量取决于其核子的同位素形式,并且电喷雾接口能将肽和蛋白质离子化成电荷态的系列。
在LC/MS系统中,在特定时间将样本注入液相色谱仪。液相色谱仪使样本随时间洗脱,产生流出液相色谱仪的洗脱液。将流出液相色谱的洗脱液连续引入质量光谱仪的离子化源。随着分离的进行,MS生成的质量光谱的组成逐渐发展,并反映洗脱液组成的变化。
基于计算机的系统通常以规则间隔的时间区间对光谱进行取样和记录。在常规系统中,在完成LC分离之后分析获取的光谱。
在获取之后,常规LC/MS系统生成一维光谱和色谱。离子的响应(或强度)是在光谱或色谱中看到的峰的高度或面积。为了分析常规LC/MS系统生成的光谱或色谱,必须定位或检测这类光谱或色谱中与离子对应的峰。分析检测到的峰以确定引起峰的离子的属性。这些属性包括保留时间、质荷比和强度。
离子的质量或质荷比(m/z)估计通过检查包含该离子的光谱来得出。离子的保留时间估计通过检查包含该离子的色谱来得出。单质量通道色谱中的峰顶点的时间位置提供离子的保留时间。单光谱扫描中的峰顶点的m/z位置能提供离子的m/z值。
使用LC/MS系统来检测离子的常规技术形成总离子色谱(TIC)。如果存在较少离子需要检测,则通常应用这种技术。通过在每个光谱扫描中合计在所有m/z值上所采集的所有响应,并且相对于扫描时间绘制该合计,来生成TIC。理想情况下,TIC中的各峰对应于单个离子。
来自多个分子的峰的共同洗脱是检测TIC中的峰的这种方法的一个可能的问题。作为共同洗脱的结果,TIC中看到的每个独立峰可能没有对应唯一离子。分隔这类共同洗脱峰的常规方法是从TIC中选择一个峰的顶点,并且采集与所选峰的顶点对应的时间的光谱。所得光谱图是一系列质量峰,每个大概对应于在共同的保留时间洗脱的单个离子。
对于复杂混合物,例如通过在有限范围的m/z通道上进行求和,共同洗脱通常还将光谱响应的求和限制到仅在所采集通道的子集上进行求和。合计色谱提供与有限m/z范围中检测的离子有关的信息。另外,能得到对于各色谱峰顶点的光谱。为了以这种方式识别所有离子,一般需要多个合计色谱。
峰检测遭遇的另一个困难是检测器噪声。减少检测器噪声影响的一种常用技术是信号平均光谱或色谱。例如,能共同相加与特定色谱峰对应的光谱以降低噪声影响。质荷比值以及峰面积和高度能通过分析平均光谱中的峰来得到。类似地,以光谱峰的顶点为中心的共同相加的色谱能减少色谱中的噪声影响,并提供保留时间以及色谱峰面积和高度的更准确估计。
除了这些问题之外,当常规峰检测例程用于检测色谱或光谱峰时,还遇到其它困难。如果手动执行,则这类常规方法是主观且冗长的。在自动执行时,由于用于识别峰的阈值的主观选择,这类方法仍然会是主观的。此外,这些常规方法易于不准确,因为它们仅使用单个提取光谱或色谱来分析数据,并且没有提供具有最高统计准确性或者最低统计差异的离子参数估计。最后,对于低浓度的离子或者对于其中共同洗脱和离子干扰易于成为常见问题的复杂色谱,常规峰检测技术不一定提供一致的、可再生的结果。
发明内容
本发明的一些实施例涉及需要三维或更多维的数据的分析仪器和方法。例如,本发明的一些优选实施例涉及包括LC、离子迁移率光谱分析(IMS)和MS的设备。本发明的一些方面源于以下认识:LC/IMS/MS和其它更高维数据生成技术获益于通过使用卷积滤波器的有效数据评估以减少噪声和/或峰干扰引起的伪像。此外,在较低或最低维(如离子迁移率维)中的暂时收缩数据加速分析,并且允许较高或最高解析度(resolution)维(如质量-光谱分析维)识别采集数据中在数据分析期间能够忽略的大部分。此外,例如离子迁移率维支持在其它维(如保留时间和/或质量维)中重叠的离子峰的区分。
例如,在一些基于LC/IMS/MS的实施例中,数据的更快更有效的表征提供离子参数,例如离子迁移率、质荷比(m/z)、保留时间和离子强度,它们通过创建离子迁移率维中收缩的数据的数据矩阵来精确且最佳地被估计,并且与快速线性二维有限脉冲响应(FIR)滤波器进行卷积以生成输出卷积矩阵。将峰检测例程应用于输出卷积矩阵,以识别与样本中的离子对应的峰。
已识别的峰可选地用于指明原始数据的哪些部分包含峰。这些所指明部分可选地与三维滤波器进行卷积,然后在所有维中定位离子峰。例如,低解析度维的评估支持其它维中重叠的离子峰的阐明。
因此,在一个说明性实施例中,本发明主要描述LC/IMS/MS分析的方法。该方法包括从样本获得有噪声的原始数据。数据包括三维数据元素的集合,它们各将离子计数强度与保留时间维、离子迁移率维和质荷比维关联,其中噪声与离子峰伪像关联。该方法还包括:在离子迁移率维中收缩数据元素集合,以获得各将组合的离子计数强度与保留时间和质荷比维关联的收缩的数据元素集合;将收缩的数据元素集合与伪像减少滤波器进行卷积,该滤波器与二维矩阵关联,由此获得具有减少的峰伪像的数据元素的卷积集合;在保留时间和质荷比维中定位数据元素的卷积收缩集合的离子峰;响应数据元素的卷积集合的离子峰的位置而选择原始数据的一个或多个部分以用于进一步分析;以及至少在离子迁移率维中定位原始数据的这些部分的每个的一个或多个峰。
在第二说明性实施例中,本发明主要描述N维分析的方法。该方法包括:从样本获得有噪数据,该数据包括各将离子计数强度与不同解析度的至少三维关联的数据元素的集合;将数据元素的集合与伪像减少滤波器卷积以产生数据元素的卷积集合;以及在数据元素的卷积集合中定位一个或多个离子峰。
在另一方面,本发明涉及化学处理设备。该设备包括配置成实现例如上述方法之一的控制单元。
附图说明
图1是根据本发明的一个实施例的示范LC/MS系统的示意图。
图2是示范色谱或光谱峰的图。
图3示出在示范LC/MS实验期间在三个时间的关于三个离子的示范光谱。
图4示出与图3的示范离子对应的色谱。
图5是根据本发明的一个实施例、用于处理数据的方法的流程图。
图6是根据本发明的一个实施例、用于处理数据的方法的图形流程图。
图7是根据本发明的一个实施例、确定用于检测离子的阈值的方法的图形流程图。
图8示出根据本发明的一个实施例的示范数据矩阵。
图9示出根据本发明的一个实施例、由图3和图4的数据所创建的示范数据矩阵的等高线图表示。
图10是根据本发明的一个实施例、在没有噪声时处理数据的简化方法的流程图。
图11示出共同洗脱离子对图9的示范数据矩阵的影响。
图12示出共同洗脱离子对图3所示示范数据的“肩部”影响。
图13示出噪声如何影响根据本发明的实施例所创建的数据矩阵中的示范数据。
图14A示出与图13所示的数据矩阵中示出的示范数据对应的三个离子的光谱。
图14B示出与图13所示的数据矩阵中示出的示范数据对应的三个离子的色谱。
图15示出根据本发明的一个实施例的示范一维切趾Savitzky-Golay二阶导数滤波器。
图16A示出根据本发明的一个实施例、光谱(m/z)方向的示范一维滤波器的截面。
图16B示出根据本发明的一个实施例、色谱(时间)方向的示范一维滤波器的截面。
图16C示出根据本发明的一个实施例、光谱(m/z)方向的示范一维平滑滤波器f1的截面。
图16D示出根据本发明的一个实施例、色谱方向的示范一维二阶导数滤波器g1的截面。
图16E示出根据本发明的一个实施例、色谱方向的示范一维平滑滤波器g2的截面。
图16F示出根据本发明的一个实施例、光谱(m/z)方向的示范一维二阶导数滤波器f2的截面。
图17A示出根据本发明的实施例、能够通过数据矩阵中存储的LC/MS数据生成的示范峰。
图17B示出根据本发明的一个实施例的示范秩2(rank-2)滤波器的点源响应(有限脉冲响应)。
图17C示出具有相等质量并且接近但不是完全相同地在时间上重合的两个LC/MS峰的仿真。
图17D示出图17C的双峰仿真的质量的峰截面。
图17E示出图17C的双峰仿真的时间的峰截面。
图17F示出将计数(散粒)噪声加入图17C的双峰仿真的影响。
图17G示出图17F的添加噪声双峰仿真的质量的峰截面。
图17H示出图17F的添加噪声双峰仿真的时间的峰截面。
图17I示出将秩2滤波器与图17F的仿真数据进行卷积的结果。
图17J示出图17I所示结果的质量的峰截面。
图17K示出图17I所示结果的时间的峰截面。
图18示出根据本发明的一个实施例、用于执行数据的实时处理的流程图。
图19是根据图18的流程图的方法、用于执行数据的实时处理的方法的图形示图。
图20是根据本发明的一个实施例、用于确定适当阈值的方法的流程图。
图21是根据本发明的一个实施例、用于确定峰纯度量度的方法的流程图。
图22A示出由两个母体分子和所得多个分子产生的示范LC/MS数据矩阵。
图22B示出与图22A中在时间t1的数据对应的示范复杂光谱。
图22C示出与图22A中在时间t2的数据对应的示范复杂光谱。
图23是示出在本发明的一个实施例所生成的未修改和已修改离子列表中能如何识别相关离子的曲线图。
图24是根据本发明的一个实施例的分析方法的流程图。
具体实施方式
定义
“色谱分析”-指的是分离化学化合物中所使用的装备和/或方法。色谱装备通常在压力和/或电和/或磁力下移动液体和/或离子。根据上下文,本文的词语“色谱”指的是通过色谱部件得出的数据或者数据表示。色谱能包括数据点的集合,数据点的每个由两个或更多值组成;这些值之一往往是色谱保留时间值,而其余值通常与强度或幅度的值关联,强度或幅度又对应于样本的成分的数量或浓度。
本发明支持色谱数据的生成和分析。本发明的一些实施例涉及包括分离样本化合物的单个模块的仪器,而其它实施例涉及多个模块。例如,本发明的原理适用于液相色谱分析设备以及适用于例如包括液相色谱分析、离子迁移率光谱分析和质量光谱分析模块的设备。在一些基于多模块的实施例中,色谱模块放置在通过适当接口与离子迁移率光谱分析模块的液体通信中;IMS模块又通过使用适当接口(如电喷雾离子化接口)与质量-光谱分析模块进行接口。一些适当接口有时产生或保持离子形式的分离材料。样本液体流通常被蒸发、离子化并且输送给质量-光谱分析模块的进样口。
因此,一些实施例产生由数据元素集合组成的多维数据,其中的每个具有与例如保留时间(从色谱分析模块得出)、离子迁移率和质荷比等的测量维关联的值。维值的唯一集合在实验上与例如在质量光谱分析模块中所测量的离子强度的值链接。
蛋白质-本文中指的是聚集为单一多肽的氨基酸的特定一级序列(primary sequence)。
肽-本文中指的是聚集为蛋白质的一级序列中包含的单一多肽的氨基酸的特定序列。
前体肽-使用蛋白质分解协议生成的胰蛋白酶肽(或者其它蛋白质分解产物)。前体可选地在色谱上分离,并传递给质量光谱仪。离子源将这些前体肽离子化,以便通常产生前体的带正电的质子化形式(protenated form)。这种带正电的质子化前体离子的质量在本文称作前体的“mwHPlus”或“MH+”。下文中,术语“前体质量”一般指离子化肽前体的质子化mwHPlus或MH+质量。
碎片-多种类型的碎片能在LC/MS分析中发生。在胰蛋白酶肽前体的情况下,碎片能包括多肽离子,它们由完整肽前体的碰撞碎裂产生,并且其一级氨基酸序列包含在起始前体肽中。Y离子和B离子是这类肽碎片的示例。胰蛋白酶肽的碎片还能包括亚胺离子、例如磷酸根离子(PO3)等官能团、从特定分子或分子类分裂的质量标签(mass tag)或者来自前体的水(H2O)或氨(NH3)分子的“中性丢失”。
Y离子和B离子-如果肽在肽键碎裂,以及如果电荷保留在N端碎片上,则那个碎片离子称作B离子。如果电荷保留在C末端碎片上,则碎片离子称作Y离子。在Roepstorff和Fohlman的Biomed Mass Spectrom 1984,11(11):601以及Johnson等人的Anal.Chem 1987,59(21):2621:2625中提供了可能的碎片及其术语的更全面的列表。
保留时间-在上下文中,通常指的是实体达到其最大强度的色谱图形中的点。
离子-例如,肽通常因组成元素的同位素的天然丰度而作为离子的总体出现在LC/MS分析中。离子具有例如保留时间和m/z值。质量光谱仪(MS)仅检测离子。LC/MS技术为每一个所检测的离子产生各种观测的测量。这包括:离子的质荷比(m/z)、质量(m)、保留时间和信号强度(例如计数的离子的数量)。
噪声-本文中用于表示产生于例如包括因计数统计引起的泊松噪声、因热效应引起的高斯、约翰逊噪声的检测器噪声的源以及易于隐藏真实离子峰或者产生假离子峰的其它噪声源的原始数据成分。
伪像-本文中表示例如产生于噪声、峰干扰和峰重叠的原始数据的假峰。
一般来说,LC/IMS/MS分析可选地提供按照其质量、电荷、保留时间、迁移率和总强度对于例如肽的经验描述。当肽从色谱柱洗脱时,它在特定保留时间周期洗脱,并在单个保留时间达到其最大信号。在离子化和(可能的)碎裂之后,肽表现为离子的相关集合。集合中的不同离子对应于共同肽的不同同位素组成和电荷。离子的相关集合中的各离子产生单个峰保留时间和峰形状。由于这些离子源自共同肽,因此,在某个测量容差中,各离子的峰保留时间和峰形状是相同的。每个肽的MS获取对于所有同位素和电荷态产生多个离子检测,在某个测量容差中全部共享相同的峰保留时间和峰形状。
在LC/MS分离中,单肽(前体或碎片)产生许多离子检测,它们表现为具有多种电荷态的离子簇。来自这种簇的这些离子检测的反卷积指明存在单个实体,其具有唯一单一同位素质量、特定保留时间、所测量的信号强度、某种电荷态。
本发明的实施例能适用于各种应用,包括能溶解于溶剂的大分子非挥发性分析物。虽然以下针对LC、LC/MS或LC/IMS/MS系统来描述本发明的实施例,但是,本发明的实施例能配置用于与其它分析技术配合工作,包括GC、GC/MS和GC/IMS/MS系统。对于上下文,首先参照图1-23来描述将1D和2D矩阵用于分析LC/MS数据的实施例。然后参照图24来描述与LC/IMS/MS和更高维技术相关的本发明的一些优选实施例。
图1是根据本发明的一个实施例的示范LC/MS系统101的示意图。通过自动或手动将样本102注入液相色谱仪104来执行LC/MS分析。泵103和注入器105所提供的色谱溶剂的高压流迫使样本102通过液相色谱仪104中的色谱柱106迁移。柱106通常包括硅珠的封装柱,其表面包括接合分子。样本、溶剂和珠中的分子种类之间的竞争性交互作用确定各分子种类的迁移速度。
分子种类通过柱106迁移,并且在特征时间从柱106出现或洗脱。这个特征时间一般称作分子的保留时间。一旦分子从柱106洗脱,它能被传送给检测器、如质量光谱仪108。
保留时间是特征时间。也就是说,实际上,在保留时间t从柱中洗脱的分子在基本上以时间t为中心的时间周期洗脱。在该时间周期的洗脱图形称作色谱峰。色谱峰的洗脱图形能通过钟形曲线来描述。峰的钟形曲线具有通常通过它的半高度或半最大值的全宽度来描述的宽度(FWHM)。分子的保留时间是峰的洗脱图形的顶点的时间。在质量光谱仪生成的光谱中出现的光谱峰具有相似形状,并且能通过相似方式来表征。图2示出具有峰顶点204的示范色谱或光谱峰202。FWHM和高度或峰202也在图2中示出。
为了后续描述,假定峰具有如图2所示的高斯分布。对于高斯分布,FWHM大约为高斯分布的标准偏差σ的2.35倍。
色谱峰宽度与峰高度无关,并且实质上是关于给定分离方法的分子的恒定特性。在理想情况下,对于给定色谱方法,所有分子种类将以相同峰宽度洗脱。但是,峰宽度通常作为保留时间的函数而改变。例如,在分离结束时洗脱的分子能显示比与分离中较早洗脱的分子关联的峰宽度要宽数倍的峰宽度。
除了其宽度之外,色谱或光谱峰具有高度或面积。一般来说,峰的高度和面积与注入液相色谱仪的种类的数量或质量成比例。术语“强度”一般指色谱或光谱峰的高度或面积。
虽然色谱分离是实质上连续的过程,但是分析洗脱液的检测器通常以规则间隔的区间对洗脱液进行取样。检测器对洗脱液进行取样的速率称作取样率或取样频率。备选地,检测器对洗脱液进行取样的区间称作取样区间或取样周期。由于取样周期必须足够长,使得系统对各峰的分布充分取样,所以最小取样周期受到色谱峰宽度限制。作为一个示例,取样周期能设置成使得在色谱峰的FWHM期间进行大约五(5)次测量。
在LC/MS系统中,将色谱洗脱液引入质量光谱仪(MS)108以供分析,如图1所示。MS 108包括去溶剂化系统110、离子发生器112、质量分析器114、检测器116和计算机118。在将样本引入MS 108时,去溶剂化系统110去除溶剂,以及离子化源112对分析物分子进行离子化。对于从LC 104发展的分子进行离子化的离子化方法包括电子碰撞(EI)、电喷雾(ES)和大气化学离子化(APCI)。注意,在APCI中,离子化和去溶剂化的顺序相反。
然后将离子化分子传送给质量分析器114。质量分析器114按其质荷比对分子进行分类或过滤。质量分析器、例如用于分析MS 108中的离子化分子的质量分析器114包括四极质量分析器(Q)、飞行时间(TOF)质量分析器以及基于傅立叶变换的质量光谱仪(FTMS)。
质量分析器能在各种配置中以级联放置,包括例如四极飞行时间(Q-TOF)质量分析器。级联配置实现已经过质量分析的分子的在线碰撞修改和分析。例如,在基于三级四极的质量分析器(例如Q1-Q2-Q3或Q1-Q2-TOF质量分析器)中,第二四极(Q2)将加速电压导入第一四极(Q1)所分离的离子。这些离子与特意引入Q2的气体进行碰撞。离子由于这些碰撞而碎裂。那些碎片由第三四极(Q3)或者由TOF进一步分析。本发明的实施例适用于从例如以上所述的质量分析的任一种模式所得到的光谱和色谱。
然后采用检测装置116来检测在关于m/z的每个值的分子。示范离子检测装置包括电流测量静电计和单离子计数多通道板(MCP)。来自MCP的信号能由鉴别器、之后由时域转换器(TDC)或者由模数(ATD)转换器进行分析。为了本描述的目的,假定基于MCP检测的系统。因此,检测器响应通过特定数量的计数来表示。这个检测器响应(即计数的数量)与在各质荷比区间所检测的离子的强度成比例。
LC/MS系统输出随时间采集的一系列光谱或扫描。质荷光谱是作为m/z的函数绘制的强度。光谱的各元素(即单个质荷比)称作通道。随时间查看单通道提供关于该对应质荷比的色谱。生成的质荷光谱或扫描能由计算机118获得和记录,并且存储在计算机118可访问的存储介质(如硬盘驱动器)中。光谱或色谱通常由计算机系统118作为值的数组来记录并存储。该数组能被显示并且经过数学分析。
组成MS系统(如MS 108)的具体功能元件能在各LC/MS系统之间改变。本发明的实施例能适合与能组成MS系统的大量组件配合使用。
在色谱分离和离子检测及记录之后,使用分离后数据分析系统(DAS)来分析数据。在本发明的一个备选实施例中,DAS实时或准实时地执行分析。DAS一般通过运行于计算机(如图1所示的计算机118)上的计算机软件来实现。能配置成运行本文所述的DAS的计算机是本领域的技术人员众所周知的。DAS配置成执行多个任务,包括提供光谱和/或色谱的可视显示以及提供用于对数据执行数学分析的工具。DAS所提供的分析包括分析将要查看并进一步分析的从单次注入所得到的结果和/或从一组注入所得到的结果。应用于样本集合的分析的示例包括对于受关注的分析物产生校准曲线以及检测未知物中存在但不在控制中的新化合物。本文描述根据本发明的实施例的DAS。
图3示出在示范LC/MS实验期间产生的三个离子(离子1、离子2和离子3)的示范光谱。与离子1、离子2和离子3关联的峰出现在保留时间和m/z的有限范围之内。对于本例,假定离子1、离子2和离子3的质荷比是不同的,并且离子的分子母体在接近相同而不是完全相同的保留时间被洗脱。因此,相应分子的洗脱图形重叠或者共同洗脱。在这些假设情况下,有某个时间全部三个分子都存在于MS的离子化源中。例如,图3示出当全部三个离子都存在于MS离子化源中时采集的示范光谱。这是显而易见的,因为各光谱展示与离子1、2和3的每个关联的峰。正如在图3所示的示范光谱中能看到,不存在光谱峰的重叠。没有重叠指明质量光谱仪已解析这些光谱峰。与离子1、2和3的每个对应的峰的顶点的位置表示其质荷比。
仅使用单光谱不可能确定光谱中的离子洗脱的准确保留时间或者甚至相对保留时间。例如,能看到,在采集光谱B的数据时,与离子1、2和3关联的全部三个分子正在从柱中洗脱。但是,仅分析光谱B不可能确定离子1、2和3的洗脱时间之间的关系。因此,光谱B可能是在对应色谱峰开始的时间采集的,此时分子开始从柱洗脱,或者从色谱峰结束时采集,此时分子接近完成洗脱,或者在开始或结束之间的某个时间采集。
与保留时间相关的更准确信息能通过检查连续光谱来获得。这个附加信息能包括洗脱分子的保留时间或者至少洗脱顺序。例如,假定连续采集图3中所示的光谱A、B和C,使得在时间tA采集光谱A;在稍后时间tB采集光谱B;以及在作为时间tB以后时间的时间tC采集光谱C。然后,能通过检查当时间从tA前进到tC时连续采集的光谱中出现的峰的相对高度,来确定相应分子的洗脱顺序。这种检查表明,当时间前进时,离子2的强度相对离子1减小,并且离子3的强度相对离子1增加。因此,离子2在离子1之前洗脱,而离子3在离子1之后洗脱。
能通过生成与光谱中发现的各峰对应的色谱,来校验这种洗脱顺序。这能通过获得与离子1、2和3对应的每个峰的顶点的m/z值来实现。给定这三个m/z值,DAS从各光谱提取对于每次扫描在那个m/z所得到的强度。然后相对于洗脱时间来绘制所提取强度。这种图表如图4所示。能看到,图4中的图表表示通过检查图3中的峰所得到的m/z值处离子1、2和3的色谱。各色谱包含单个峰。图4所示的离子1、2和3的色谱的检查确认,离子2在最早时间洗脱,而离子3在最后时间洗脱。图4所示的色谱的每个的顶点位置表示与相应离子对应的分子的洗脱时间。
记住这个介绍,本发明的实施例涉及分析例如光谱和色谱等的实验分析输出,以便最佳地检测离子并且量化与所检测离子相关的参数。此外,本发明的实施例能提供极为简化的光谱和色谱。
图5是用于处理例如光谱和色谱等的实验分析输出的流程图500。流程图500能通过多种方式(包括通过上述DAS)来实施。在图5所示的本发明的实施例中,分析按照如下方式进行:步骤502:创建具有色谱和光谱数据的二维数据矩阵。步骤504:指定要应用于数据矩阵的二维卷积滤波器。步骤506:将二维卷积滤波器应用于数据矩阵。例如,能采用二维滤波器对数据矩阵进行卷积。步骤508:检测对数据矩阵应用二维滤波器的输出的峰。每个所检测的峰被认为对应于离子。阈值能用来优化峰检测。步骤510:提取关于每个所检测的峰的离子参数。参数包括离子特征,例如保留时间、质荷比、强度、光谱方向的峰宽度和/或色谱方向的峰宽度。步骤512:将关联所提取离子的离子参数存储在列表或表中。存储能在检测到各峰时或者在已检测到多个或全部峰之后执行。步骤514:使用所提取的离子参数对数据进行后处理。例如,离子参数表能用来简化数据。这种简化例如能通过窗口化以降低光谱或色谱复杂度来实现。分子的性质能根据所简化的数据来推断。
图6和图7是描述流程图500的上述步骤的图形流程图。图6是根据本发明的一个实施例、用于处理LC/MS数据的方法的图形流程图602。更具体来说,图形流程图602的各元素示出根据本发明的一个实施例的步骤的结果。元素604是根据本发明的一个实施例所创建的示范LC/MS数据矩阵。如下所述,能通过将连续时间所采集的LC/MS光谱放入数据矩阵的连续列,来创建LC/MS数据矩阵。元素606是能按照预期滤波特性来指定的示范二维卷积滤波器。下面更详细地描述指定二维滤波器的考虑因素。元素608表示根据本发明的一个实施例、将元素606的二维滤波器应用于元素604的LC/MS数据矩阵。二维滤波器对LC/MS数据矩阵的这种示范应用是二维卷积,其中采用二维卷积滤波器对LC/MS数据矩阵进行卷积。滤波步骤的输出是输出数据矩阵,它的一个示例表示为元素610。在将滤波器应用于数据矩阵包括卷积的情况下,输出是输出卷积矩阵。
元素612示出对输出数据矩阵执行峰检测以识别或检测与离子关联的峰的示范结果。阈值能用来优化峰检测。在此处,认为检测到离子。元素614是使用所检测的离子所创建的离子性质的示范列表或表。
图7是示出根据本发明的一个实施例、示出确定检测阈值的结果及其对进一步整理离子参数表的应用的图形流程图702。元素706表示从离子参数列表(元素704)所访问的示范峰数据。元素706示出使用所访问数据来确定检测阈值的结果。将已确定阈值应用于步骤704所生成的离子参数列表,以生成编辑的离子参数列表,它的一个示例如步骤708所示。现在更详细地说明上述步骤。
步骤1:创建数据矩阵
不是将LC/MS分析看作光谱和色谱的不同系列,而是有利地将LC/MS输出配置为强度的数据矩阵。在本发明的一个实施例中,通过将与在渐增时间所采集的每个连续光谱关联的数据放入数据矩阵的连续列来构造数据矩阵,由此创建强度的二维数据矩阵。图8示出这种示范数据矩阵800,其中在时间上连续采集的五(5)个光谱存储在数据矩阵800的连续列801-805中。在以这种方式存储光谱时,数据矩阵800的行表示所存储的光谱中的对应m/z值处的色谱。这些色谱由数据矩阵800中的行811-815表示。因此,通过矩阵形式,数据矩阵的各列表示在特定时间所采集的光谱,而各行表示在固定m/z所采集的色谱。数据矩阵的各元素是对于特定m/z(在对应光谱中)在特定时间(在对应色谱中)所采集的强度值。虽然本公开假定面向列的光谱数据和面向行的色谱数据,但是在本发明的备选实施例中,定向数据矩阵使得行表示光谱,而列表示色谱。
图9是如上所述通过将光谱数据存储在数据矩阵的连续列中所生成的数据矩阵的示范图形表示(具体来说是等高线图)。在图9所示的等高线图中,离子1、2和3的每个表现为强度的岛。等高线图不仅清楚地示出三个离子的存在,而且还示出洗脱顺序为离子2、然后是离子1、之后是离子3。图9还示出三个顶点902a、902b和902c。顶点902a对应于离子1,顶点902b对应于离子2,以及顶点902c对应于离子3。顶点902a、902b和902c的位置分别对应于离子1、2和3的m/z及保留时间。等高线图的零值基底之上的顶点的高度是离子强度的量度。与单个离子关联的计数或强度包含在椭圆区域或岛中。这个区域的m/z(列)方向的FWHM是光谱(质量)峰的FWHM。这个区域的行(时间)方向的FWHM是色谱峰的FWHM。
形成岛的同心等高线的最里面标识具有最高强度的元素。这个局部最大值或最大元素具有比其最接近的相邻元素更大的强度。例如,对于二维数据等高线,局部最大值或顶点是其幅度大于它的最接近相邻元素的任何点。在本发明的一个实施例中,局部最大值或顶点必须大于八(8)个最接近的相邻元素。例如,在表1中,中心元素是局部最大值,因为8个毗连元素的每个具有小于10的值。
表1:说明最大值的示例
8.5 | 9.2 | 6.8 |
9.2 | 10.0 | 8.4 |
7.9 | 8.5 | 7.2 |
通过图9的等高线图绘制有六根线条。标记为离子1、离子2和离子3的三条水平线分别标识与离子1、2和3的色谱对应的截面,如图4所示。标记为A、B和C的三条垂直线分别标识与质量光谱3A、3B和3C对应的截面,如图3所示。
在创建数据矩阵之后,检测离子。对于每个所检测的离子,得到离子参数,例如保留时间、m/z和强度。如果数据矩阵没有噪声,以及如果离子没有相互干扰(例如通过色谱共同洗脱和光谱干扰),则各离子产生强度的唯一隔离岛,如图9的等高线图所示。
如图9所示,各岛包含单个最大元素。在没有噪声、共同洗脱或干扰的情况下,根据本发明的一个实施例的离子检测和参数量化按照图10中的流程图1000所示进行:步骤1001:形成数据矩阵步骤1002:咨询数据矩阵中的各元素。步骤1004:标识作为强度的局部最大值并且具有正值的所有元素。步骤1006:将每个这种局部最大值标记为离子。步骤1008:提取离子参数。步骤1010:将离子参数列表。步骤1012:对离子参数进行后处理以得到分子性质。
在步骤1008,通过检查最大元素得到各离子的参数。离子的保留时间是包含最大元素的扫描的时间。离子的m/z是包含最大元素的通道的m/z。离子的强度是最大元素本身的强度,或者备选地,强度能够是最大元素周围的元素的强度的总和。下面描述的内插技术能用于更好地估计这些参数。还能确定辅助可观测参数,包括例如色谱和光谱方向的峰的宽度。步骤2和3:滤波器的指定和应用
滤波器的需求
LC/MS实验中很少(如果曾经出现)没有共同洗脱、干扰或噪声。共同洗脱、干扰或噪声的存在能严重地降低准确可靠检测离子的能力。因此,流程图1000所示的简单检测和量化过程不可能在所有情况中都是适当的。
共同洗脱
图11是示出因有限峰宽度引起的干扰和共同洗脱的影响的示范等高线图。在图11所示的示例中,假定另一个离子、即离子4具有略大于离子1的m/z和保留时间值,以及具有位于离子1的顶点的光谱和色谱两个方向的FWHM之内的顶点。因此,离子4在色谱方向与离子1共同洗脱,并且在光谱方向干扰离子1。
图12示出在图11的线条A、B和C所示的时间的由于离子4的共同洗脱引起的光谱影响。在图12所示的各光谱中,离子4显示为对离子1的肩部。这从图11所示的等高线图中也是显而易见的,因为不存在与离子4关联的明确顶点。[0100]因此,LC/MS系统中的检测的一个问题在于,离子的对可在时间上共同洗脱,并且在光谱上进行干扰,使得离子的对仅产生单个而不是两个局部最大值。共同洗脱或干扰能导致在数据矩阵中具有高强度的真正离子被遗漏,即没有检测到。这种将真正峰作为离子的检测的遗漏称作假阴性。噪声[0101]LC/MS系统中遇到的噪声通常分为两类:检测噪声和化学噪声。检测器和化学噪声进行结合建立了基线噪声背景,相对它来进行离子的检测和量化。[0102]检测噪声又称作散粒或热噪声,它是所有检测过程中固有的。例如,计数检测器(如MCP)添加散粒噪声,而放大器(如静电计)添加热或约翰逊噪声。散粒噪声的统计一般通过泊松统计来描述。约翰逊噪声的统计一般通过高斯统计来描述。这种检测噪声是系统中固有的,并且无法消除。[0103]LC/MS中遇到的第二种噪声是化学噪声。化学噪声产生于几个来源。例如,在分离和离子化过程中无意捕获到的小分子能引起化学噪声。这类分子能够持续存在,每个以给定质荷比产生基本上恒定的背景强度,或者每个这种分子能被分离,由此在特征保留时间产生色谱图形。化学噪声的另一个来源存在于复杂样本,它们能包含其浓度在大动态范围改变的分子以及其影响在较低浓度更为明显的干扰元素。[0104]图13是示出噪声的影响的示范等高线图。在图13中,将数值方式生成的噪声加入离子峰等高线图以仿真化学和检测器噪声的影响。图14A示出分别与图13中的线条A、B和C对应的质量光谱(光谱A、B和C),图14B示出分别与图13中标记为离子1、离子2和离子3的线条对应的离子1、2、3的色谱。正如在图13中能看到,加性噪声的一种有害影响在于,它使顶点出现在整个图表上,包括与离子1和2关联的标称顶点位置的FWHM中。这些噪声引起的顶点可能会错误地识别为对应于离子的峰,由此导致假阳性离子检测。[0105]因此,局部最大值可以是由于噪声而不是由于离子而引起。因此,假峰、即没有与离子关联的峰可能被当作离子。此外,噪声可能对于一个离子产生一个以上的多个局部最大值。这些多个最大值能导致检测不表示真正离子的峰。因此,当实际上多个峰只是由于单个离子而引起时,来自单个离子的峰可能多次被当作独立离子。假峰作为离子的这种检测称作假阳性。[0106]除了忽略噪声影响之外,图10所述的简单离子检测算法一般在统计上不是最佳的。这是因为保留时间、m/z和强度的估计的差异通过单个最大元素的噪声性质来确定。简化算法没有利用强度岛中最大元素周围的其它元素。下面进行更详细描述,这类相邻元素能用来减小估计的差异。卷积的作用[0107]根据本发明的一个实施例,LC/MS数据矩阵是二维矩阵。这种数据矩阵能通过将它与滤波器系数的二维数组进行卷积来处理。[0108]本发明的实施例中采用的卷积运算提供比常规系统中采用的简单信号平均方案更通用且强大的峰检测方式。本发明的实施例中采用的卷积运算解决图10所示方法的限制。[0109]能选取滤波器系数以提供具有比从分析单通道或扫描所得到的更好的信噪比的离子参数的估计。[0110]能选取卷积滤波器系数以产生对于特定数据集具有最大准确性或者最小统计差异的离子参数的估计。本发明的实施例的这些有益效果对于低浓度的离子提供比常规系统更加可再生的结果。[0111]本发明的实施例的另一个优点在于,能选取滤波器系数以解析共同洗脱和干扰的离子。例如,在本发明的实施例中,能使用适当指定的滤波器系数来检测质量光谱中对其它离子显示为肩部的离子的顶点。这种检测克服了与分析复杂色谱时共同洗脱和离子干扰是常见问题的的常规技术关联的限制。[0112]本发明的实施例的另一个优点在于,能选取滤波器系数以减去基线信号,从而产生离子强度的更精确估计。[0113]本发明的实施例的另一个优点在于,能选取滤波器系数以使卷积的计算负荷为最小,从而产生峰检测和离子参数的估计的高速运算。
总的来说,许多滤波器形状能用于卷积,包括例如Savitzky-Golay(SG)平滑和微分滤波器。能选取滤波器形状以执行多个功能,包括平滑、峰标识、噪声减小和基线减小。下面描述本发明的优选实施例中使用的滤波器形状。
本发明中卷积的实现
根据本发明的实施例的卷积运算是线性非迭代的并且与数据矩阵中的数据的值不相关。在本发明的一个实施例中,通过通用编程语言使用通用计算机(如计算机118)来实现卷积运算。在本发明的一个备选实施例中,卷积运算通过称作数字信号处理器(DSP)的专用处理器来实现。基于DSP的滤波通常提供优于基于通用计算机的滤波的增强处理速度。
一般来说,卷积组合两个输入以产生一个输出。本发明的实施例采用二维卷积。二维卷积运算的一个输入是从LC/MS实验的光谱输出所创建的强度的数据矩阵。二维卷积运算的第二输入是滤波器系数的矩阵。卷积运算输出一个输出卷积矩阵。一般来说,输出卷积矩阵具有与输入LC/MS矩阵相同数量的行和列元素。
为了本描述的简洁起见,假定LC/MS数据矩阵是矩形,并且滤波器系数的矩阵的大小可比得上峰的大小。在这种情况下,滤波器系数矩阵的大小比输入数据矩阵或输出卷积矩阵的大小要小。
输出矩阵的元素按照如下方式从输入LC/MS数据矩阵获得:使滤波器矩阵以输入数据矩阵中的元素为中心,然后将输入数据矩阵元素与对应滤波器矩阵元素相乘并对乘积求和,从而产生输出卷积数据矩阵的元素。通过组合相邻元素,卷积滤波器减小离子保留时间、质荷比和强度的估计中的差异。
输出卷积矩阵的边缘值是处于离输出卷积矩阵的边缘的一半滤波器宽度之内的那些元素。一般来说,在本发明的实施例中,这些元素能设置成无效值以指明无效滤波值。一般来说,忽略这些边缘值不是本发明的实施例的重要限制,并且在后续处理中能忽略这些无效值。
一维卷积
明确地详细描述对于一维情况的卷积。这个描述之后是总结对于二维情况的卷积。首先描述一维情况是有用的,因为本发明的优选实施例中使用的二维卷积运算通过将一系列一维卷积应用于数据矩阵来实现。
在一维中,卷积运算定义如下。给定强度的一维N元素输入数组di以及卷积滤波器系数的一维M元素数组fj,卷积运算定义为: 式中,ci是输出卷积数组,以及i=1,...,N。为了方便起见,选取M为奇数。下标j在j=-h,...0,...h变化,其中h定义为h≡(M-1)/2。
因此,ci的值对应于di周围的h个元素的加权和。光谱和色谱是包含峰的一维输入数组的示例。卷积滤波器fj的宽度设置成大约为峰的宽度。因此,M大约为跨越峰宽度的数组元素的数量。峰的宽度通常远小于输入数组的长度N,使得一般来说M□N。
虽然di的下标i的范围为1至N,但是在本发明的一些实施例中,仅对于i>h或者i≤(N-h)来定义ci,以说明边缘效应。没有对求和定义靠近数组边界(即当i≤h或i>(N-h)时)的ci的值。这类边缘效应能通过将ci的值限制为i>h或i≤(N-h)来处理,其中定义求和。在这种情况下,求和仅应用于充分远离数组边缘的那些峰,使得滤波器fj能应用到峰邻域中的所有点。也就是说,在数据数组di的边缘没有执行滤波。一般来说,忽略边缘效应不是本发明的实施例的重要限制。
如果对于1<i<h或者N≥i>(N-h)需要边缘附近的滤波值,则能为这些边缘元素修改数据数组和/或滤波器系数。能通过将h个元素附加到数组的各端,并将M系数滤波器应用于包含N+2h个元素的数组,来修改数据矩阵。
备选地,能通过适当修改滤波函数的极限以说明在边缘附近存在少于M个点用于滤波,来考虑边缘效应。二维卷积
上述一维卷积运算能推广到本发明的实施例中使用的二维数据的情况。在二维情况下,卷积运算的一个输入是由两个下标(i,j)作为下标的数据矩阵di,j,其中i=1,...,M,以及j=1,...,N。输入数据矩阵的数据值能逐个实验改变。卷积的另一个输入是固定滤波器系数fp,q的集合,它也由两个下标作为下标。滤波器系数矩阵fp,q是具有P×Q个系数的矩阵。变量h和1定义为h≡(P-1)/2以及1≡(Q-1)/2。因此,p=-h,...,h,以及q=-1,...,1。
将di,j与fp,q进行卷积产生输出卷积矩阵ci,j:
一般来说,滤波器的大小远远小于数据矩阵的大小,使得P<<M且Q<<N。上式表明,通过使fp,q以di,j的第(i,j)个元素为中心,然后使用滤波器系数fp,q来得到周围强度的加权和,来计算ci,j。因此,输出矩阵ci,j的各元素对应于di,j的元素的加权和,其中各元素di,j从以第(i,j)个元素为中心的区域来获得。
虽然di,j的下标i和j的范围为i=1至N,以及j从1至M,但是在本发明的一些实施例中,仅对于i≥h或i≤(N-h)和j≥1或j≤(M-1)来定义ci,j,以便说明边缘效应。没有对求和定义数组边界附近(即当i<h或i>(N-h)和/或j≥1或j≤(M-1)时)的ci的值。这类边缘效应能通过将ci,j的值限制为定义了求和的值来处理。在这种情况下,求和仅应用于充分远离数组边缘的那些峰,使得滤波器fp,q能应用到峰邻域中的所有点。也就是说,在数据数组di,j的边缘没有执行滤波。一般来说,忽略边缘效应不是本发明的实施例的重要限制。
如果对于1≤i<h或者N≥i>(N-h)需要边缘附近的滤波值,则能为这些边缘元素修改数据矩阵和/或滤波器系数矩阵。一种方式是将h个元素附加到各行末端,以及将1个元素附加到各列末端。然后将二维卷积滤波器应用于包含(N+2h)×(M+21)个元素的数据矩阵。
备选地,能通过适当修改滤波函数的极限以说明在行边缘附近存在少于P个点用于滤波以及在列边缘附近存在少于Q个点用于滤波,来考虑边缘效应。
实现等式(2)的计算负荷能确定如下。如果fp,q包含P×Q个系数,则计算ci,j的值所需的乘法数量是P×Q。例如,在P=20和Q=20的情况下,则确定输出卷积矩阵中的各输出点ci,j需要400次乘法。这是高计算负荷,能通过二维卷积的其它方式来减轻。
采用秩1(rank-1)滤波器的二维卷积
等式(2)中所述的二维卷积滤波器应用包含P×Q个单独指定系数的滤波器矩阵。存在指定滤波器系数的其它方式。虽然所得卷积系数不是随意指定的,但是减轻了计算负荷。
指定滤波器系数的一种这样的备选方式是秩1滤波器。为了描述秩1卷积滤波器,考虑LC/MS数据矩阵的二维卷积能通过两个一维卷积的连续应用来实现。例如参见John H.Karl的“Introduction To Digital Processing”(第320页,ACADEMIC PRESS,1989年)(“KARL”),通过引用将其结合到本文中。例如,将一维滤波器gq应用于LC/MS数据矩阵的各行,从而产生中间卷积矩阵。对于这个中间卷积矩阵,将第二一维滤波器fp应用于各列。能以滤波器系数的不同集合指定每个一维滤波器。等式(3)说明如何连续应用包含秩1卷积滤波器的滤波器,其中中间矩阵包含在括号中。
实现等式(3)的计算负荷能确定如下。如果fp包含P个系数,并且gq包含Q个系数,则计算ci,j的值所需的乘法数量是P+Q。例如,在P=20和Q=20的情况下,确定输出卷积矩阵中的各输出点ci,j仅需要40次乘法。能看到,与其中确定各ci,j需要20×20=400的等式(2)中所述的二维卷积的一般情况相比,这更为计算有效。
等式(4)是等式(3)的重新排列,说明连续运算相当于数据矩阵与其元素是一维滤波器的成对乘积的单个系数矩阵的卷积。等式(4)的检查表明,在使用秩1公式时,有效的二维卷积矩阵是通过两个一维向量的外积所形成的秩1矩阵。因此,等式(4)能改写为: 二维系数矩阵Fpq出现于卷积运算。Fpq具有秩1矩阵的形式,其中秩1矩阵被定义为列向量(这里为fp)和行向量(这里为gq)的外积。例如参见Gilbert Strang的“Introduction To Applied Mathematics”(68FF,WELLESLEY-CAMBRIDGE PRESS,1986年)(“STRANG”),通过引用将其结合到本文中。
在使用秩1滤波器实现的本发明的实施例中,秩1滤波器的特征在于两个正交截面(每个滤波器一个)。关于各正交截面的滤波器由一维滤波器数组来指定。
采用秩2滤波器的二维卷积
二维卷积运算能采用秩2滤波器来执行。采用秩2滤波器的二维卷积通过计算两个秩1滤波器并对其结果求和来执行。因此,需要四个滤波器f1 p、g1 q、f2 p和g2 q来实现用于本发明的实施例中执行的二维卷积的秩2滤波器。
两个滤波器f1 p和g1 q与第一秩1滤波器关联,而两个滤波器f2 p和g2 q与第二秩1滤波器关联。这四个滤波器f1 p、f2和g1 q、g2 q按照如下方式来实现:
在光谱方向(沿列)应用滤波器f1 p和f2 p,而在色谱方向(沿行)应用滤波器g1 q和g2 q。等式(7)说明如何能连续应用各滤波器对以及如何对于来自两个秩1滤波器的结果求和,其中中间矩阵包含在括号中。等式(7)说明根据本发明的实施例实现秩2滤波器的优选方式。
等式(8)是等式(7)的重新排列,说明秩2滤波器配置中的连续运算相当于数据矩阵与其元素是两个一维滤波器对的成对乘积之和的单个系数矩阵的卷积。
为了分析秩2滤波器的计算要求,考虑如果f1 p和f2 p均包含P个系数,而g1 q和g2 q均包含Q个系数,则计算输出卷积矩阵的元素ci,j的值所需的乘法数量为2(P+Q)。因此,在P=20和Q=20的情况下,计算输出卷积矩阵的各元素只需要80次乘法,而在等式(2)所示的一般情况下,计算各ci,j需要20×20=400。
因此,本发明的一个实施例采用秩2滤波器,有效的二维卷积矩阵由两对一维向量的外积之和来形成。等式(8)能改写为
二维系数矩阵Fpq出现于卷积运算。二维系数矩阵Fpq具有秩2矩阵的形式,其中秩2矩阵被定义为两个线性独立秩1矩阵之和,如STRANG所述。在这里,f1 pg1 q和f2 pg2 q均为秩1矩阵。
滤波器指定
等式(2)、(3)和(7)都是本发明的二维卷积滤波器的实施例。等式(2)将滤波器系数指定为矩阵fp,q,等式(3)将滤波器系数指定为两个一维滤波器fp和gq的集合,以及等式(7)将滤波器指定为四个一维滤波器f1 p、g1 q和f2 p、g2 q的集合。
等式(2)、(3)和(7)没有指定这些系数的优选值。选取本发明的滤波器系数的值以解决图10的方法的限制。选取滤波器系数以实现几个目标,其中包括减小检测器和化学噪声的影响、部分解析共同洗脱和干扰峰、减去基线噪声以及实现计算效率和高速运算。
与使用等式(2)能实现的相比,匹配滤波器定理(MFT)是现有技术已知的、获得滤波器系数的规范方法。例如参见KARL的217;BRIAN D.O.ANDERSON和JOHN B.MOORE的“OptimalFiltering”(223ff,PRENTICE-HALL公司,1979年)(“ANDERSON”)的223ff,通过引用将其结合到本文中。从MFT得到的滤波器设计成检测信号的存在以及减小检测器噪声的影响。然后,这类滤波器能用于检测LC/MS数据矩阵中的离子,并且能用于确定离子的保留时间、质荷比和强度。从MFT得到的滤波器是优于图10的方法的改进。具体来说,通过组合来自与峰顶点相邻的峰内的元素的数据,这类滤波器减小差异并提高精度。但是,这类滤波器没有设计成减去基线噪声或者解析共同洗脱和干扰峰。从MFT得到的滤波器没有设计成实现高速运算。
描述了表示优于图10的方法的改进的MFT以及能从其得到的滤波器系数的集合,然后描述减去基线、减小共同洗脱和干扰的影响、同时仍然减小检测器和化学噪声的影响的改进滤波器。这类滤波器采用平滑和二阶导数滤波器的组合,并且使用等式(3)和(7)来实现。优选实施例将等式(7)与平滑和二阶导数滤波器的组合配合使用,它们共同降低噪声、解析干扰峰、减去基线以及减轻计算负荷以便允许高速运算。
一维卷积的匹配滤波器定理
首先针对一维卷积来描述MFT。然后推广到二维卷积。
选取Fj的系数以执行检测功能。例如,匹配滤波器定理(MFT)提供能用于执行检测功能的称作匹配滤波器的滤波器系数的集合。
MFT假定数据数组di能建模为信号rosi加上加性噪声ni之和: 信号的形状是固定的,并且通过系数集合si来描述。比例因子ro确定信号幅度。MFT还假定信号是有限的。也就是说,信号在某个区域之外为零(或者足够小到可以忽略)。假定信号延续M个元素。为了方便起见,M通常选取为奇数,并且信号的中心位于so。如果h被定义为h≡(M-1)/2,则对于i<-h以及对于i>h,si=0。在以上表达式中,信号的中心出现在i=io。
为了简化当前描述,假定噪声元素ni为不相关高斯偏差,具有零平均和标准偏差σo。MFT的更一般公式适应相关或有色噪声。例如参见ANDERSON的288-304。
在这些假设条件下,各元素的信噪比(SNR)为rosi/σo。通过考虑集中形式与信号重合的加权wi的M元素集合(其中h≡(M-1)/2以及i=-h,...,0,...h),能确定包含信号si的数据的加权和的SNR。假定集中加权与信号重合,则加权和S被定义为:
总体均值中的噪声项的平均值为零。因此,各数组中的信号相同、但噪声不同的数组的总体上的S的平均值为:
为了确定噪声贡献,将加权应用于仅包含噪声的区域。和的总体平均为零。与总体平均有关的加权和的标准偏差为:
最后,SNR确定为: 这个结果针对加权系数wi的一般集合。
MFT指定使SNR为最大的wi的值。如果加权因子wi被看作单位长度的M维向量w的元素,即归一化加权因子使得 则当向量w指向与向量s相同的方向时,SNR为最大。当相应元素相互成比例时,即,当wi∝si时,向量指向相同方向。因此,MFT意味着,当加权函数是信号本身的形状时,加权和具有最大信噪比。
如果选取wi使得wi=si,则对于具有单位标准偏差的噪声,SNR减小到: SNR的这个公式在滤波器系数以信号为中心时对应于加权和的信号性质,而在滤波器处于仅噪声区域时对应于噪声性质。
二维卷积的匹配滤波器定理
以上对于一维情况所述的MFT也能推广到数据的二维数组中嵌入的有限二维信号的二维情况。如前所述,假定数据建模为信号加噪声之和: 式中,信号si,j的范围受到限制,并且其中心位于(io,jo),其中具有幅度ro。各噪声元素ni,j是零平均和标准偏差σo的无关高斯偏差。
为了确定包含信号Si,j的数据的加权和的SNR,考虑加权wi,j的P×Q元素集合,其中h=(P-1)/2且1=(Q-1)/2,使得i=-h,...,h以及j=-1,...,1。集中加权与信号重合。加权和S为:
S对总体的平均值为: 噪声的标准偏差为: 以及信噪比为:
如同上述一维情况那样,当加权函数的形状与信号成比例时,即,当wi,j∝si,j时,SNR为最大。加权和的信号性质对应于滤波器系数以信号为中心的情况,而加权和的噪声性质对应于滤波器处于仅噪声区域的情况。
匹配滤波器通过最佳地组合相邻元素来实现最大信号噪声。采用匹配滤波器系数的卷积滤波器产生离子保留时间、质荷比和强度的估计的最小差异。
保证产生唯一最大值的匹配滤波器
一般来说,使用卷积的信号检测通过沿数据数组移动滤波器系数并且获得各点的加权和来进行。例如,在滤波器系数满足MFT、即wi=si(滤波器与信号匹配)的情况下,则在数据的仅噪声区域中,输出的幅度由噪声规定。当滤波器与信号重叠时,幅度增加,并且当滤波器在时间上与信号对齐时必定达到唯一最大值。
一维高斯匹配滤波器
作为一维卷积的上述技术的一个示例,考虑信号是产生于单个离子的单个峰的情况。峰(光谱的或色谱的)能建模为高斯图形,其宽度由标准偏差σp给出,其中宽度以样本元素的单位来测量。则信号为:
假定滤波器边界设置为±4σp。按照匹配滤波器定理,滤波器是信号形状本身、即以零为中心并且由±4σp限定的高斯。这种匹配滤波器的系数由下式给出: 对于i>-4σp且i<4σp
还假定系统每个标准偏差取样四个点。因此,σp=4,则i=-16,...,16,并且滤波器对于本例为33点宽。对于一维的高斯匹配滤波器(GMF),卷积输出数组的最大信号为7.09ro,并且噪声幅度为2.66σo。与使用匹配滤波器关联的SNR为2.66(ro/σo)。
高斯匹配滤波器与一维的Boxcar滤波器对比
我们将GMF与一维的简单boxcar滤波器进行对比。再次假定信号为通过上述高斯形状来建模的峰。假定boxcar的滤波器边界也设置为±4σp。boxcar滤波器的系数由下式给出: Boxcar滤波器的输出是对M个点(M=8σp+1)的输入信号的平均值。
同样还假定系统每个标准偏差取样四个点,因此boxcar滤波器为33点宽。对于单位高度的高斯峰,使用boxcar滤波器对于峰的平均信号为0.304ro,并且噪声的标准偏差为 使用boxcar滤波器的SNR为1.75(ro/σo)。
因此,高斯匹配滤波器相对boxcar的SNR为2.66/1.75=1.52,或者比boxcar滤波器所提供的SNR高50%以上。
匹配滤波器和boxcar滤波器都是线性的。这些滤波器的任一个与高斯峰形状的卷积产生具有唯一最大值的输出。因此,这些滤波器的任一个能用于本发明的实施例的卷积。但是,在高斯噪声的情况下,由于它在局部最大值处的较高SNR,匹配滤波器是优选的。
高斯噪声和泊松噪声
当噪声具有高斯统计时,高斯匹配滤波器是最佳滤波器。对于计数检测器,boxcar滤波器将是最佳的,因为它只是与峰关联的所有计数之和。为了对关联峰的所有计数求和,boxcar滤波器的宽度应当与峰的宽度相关。Boxcar滤波器的宽度通常将为峰的FWHM的2至3倍。
二维高斯匹配滤波器
作为二维卷积的匹配滤波器技术的一个示例,考虑信号是产生于单个离子的单个峰的情况。峰能建模为光谱和色谱两个方向的高斯图形。光谱宽度由标准偏差σp给出,其中以样本元素的单位来测量宽度,以及色谱宽度由标准偏差σq给出,其中以样本元素的单位来测量宽度。以数据矩阵元素io,jo为中心的信号则为:
假定滤波器边界设置为±4σp和±4σq。按照匹配滤波器定理,滤波器是信号形状本身、即以零为中心并且由±4σp±4σq限定的高斯。这种匹配滤波器的系数由下式给出: 对于p>-4σp且p<4σp,以及q>-4σq且q<4σq
还假定对于光谱和色谱两个方向,系统每个标准偏差取样四个点。因此,σp=4且σq=4,使得p=-16,...16和q=-16,...,16,并且滤波器对于本例为33×33点宽。对于二维的高斯匹配滤波器(GMF),卷积输出矩阵中的最大信号为50.3ro,并且噪声幅度为7.09σo。与使用匹配滤波器关联的SNR为7.09(ro/σo)。
二维卷积滤波器在色谱以及在质量光谱方向对LC/MS数据矩阵执行滤波运算。作为卷积运算的结果,输出卷积矩阵将包含其形状相对于输入LC/MS数据矩阵一般变宽或者以其它方式失真的峰。具体来说,匹配高斯滤波器将始终在输出卷积矩阵中产生在色谱以及光谱方向上相对于输入峰以的因子变宽的峰。
初看起来,由GMF所产生的变宽对于精确估计保留时间、质荷比或强度的关键参数似乎看上去是有害的。但是,匹配滤波器定理表明,二维卷积产生其保留时间、质荷比和强度产生于与峰关联的所有光谱和色谱元素的有效组合的顶点值,使得所得顶点关联值产生峰的保留时间、m/z和强度的统计最佳估计。
高斯匹配滤波器与二维的Boxcar滤波器对比
我们将GMF与二维的简单boxcar滤波器进行对比。再次假定信号为通过上述高斯形状来建模的峰。假定boxcar的滤波器边界也设置为±4σp。boxcar滤波器的系数由下式给出: Boxcar滤波器的输出是对M×N个点的输入信号的平均值。
同样还假定系统每个标准偏差取样四个点,因此boxcar滤波器为33×33点宽。对于单位高度的高斯峰,使用boxcar滤波器对于峰的平均信号为0.092ro,并且噪声的标准偏差为0.303σo。使用boxcar滤波器的SNR为3.04(ro/σo)。
因此,高斯匹配滤波器相对boxcar的SNR为7/3=2.3,或者比boxcar滤波器所提供的SNR高两倍以上。
匹配滤波器和boxcar滤波器都是线性的。这些滤波器的任一个与高斯峰形状的卷积产生具有唯一最大值的输出。因此,这些滤波器的任一个能用于本发明的实施例的卷积。但是,在高斯噪声的情况下,由于它在局部最大值处的较高SNR,匹配滤波器是优选的。
高斯噪声和泊松噪声
当噪声具有高斯统计时,二维的高斯匹配滤波器是最佳滤波器。对于计数检测器,boxcar滤波器将是最佳的,因为它只是与峰关联的所有计数之和。为了对关联峰的所有计数求和,boxcar滤波器的宽度应当在光谱和色谱方向与峰的宽度相关。Boxcar滤波器的宽度通常在光谱和色谱方向将是峰的相应FWHM的2至3倍之间。
用于LC/MS数据矩阵中的离子的检测的高斯匹配滤波器
对于高斯匹配滤波器,二维卷积滤波器的指定(步骤2)是如上所述的高斯滤波器系数fp,q的系数,以及滤波器的应用(步骤3)则按照使用这些滤波器系数的等式(2)。步骤2和步骤3的这个实施例则提供检测离子以及确定其保留时间、质荷比和强度的方法。来自这种方法的结果减小检测器噪声的影响,并且是对图10的方法的改进。
不是匹配滤波器的滤波器系数。
还能使用与遵循信号形状的那些系数不同的线性加权系数。虽然这类系数可能没有产生最高可能的SNR,但是它们可能具有其它弥补的优点。这些优点包括部分解析共同洗脱和干扰峰的能力、减去基线噪声以及导致高速运算的计算效率。我们分析高斯匹配滤波器的限制,并且描述解决这些限制的线性滤波器系数。
高斯匹配滤波器的问题
对于高斯峰,匹配滤波器定理(MFT)将高斯匹配滤波器(GMF)指定为其响应与任何其它卷积滤波器相比具有最高信噪比的滤波器。但是,高斯匹配滤波器(GMF)可能并不是在所有情况中都是最佳的。
GMF的一个缺点在于,它产生各离子的变宽或加宽的输出峰。为了帮助解释峰加宽,众所周知的是,如果具有正值和标准宽度σs的信号与具有正值和标准宽度σf的滤波器进行卷积,则卷积输出的标准宽度增加。信号和滤波器宽度正交组合以产生输出宽度 在其中信号和滤波器的宽度相等的GMF的情况下,输出峰比输入峰要宽大约 的因子,即40%。
峰加宽能引起小峰的顶点被大峰掩盖。例如当小峰与较大峰在时间上接近共同洗脱以及在质荷上接近重合时,这种掩盖可能发生。补偿这种共同洗脱的一种方式是减小卷积滤波器的宽度。例如,将高斯卷积滤波器的宽度减半产生仅比输入峰要宽12%的输出峰。但是,由于峰宽度不匹配,所以SNR相对使用GMF所实现的SNR被减小。减小的SNR的缺点由检测接近重合峰对的增加能力的优点来抵消。
GMF的另一个缺点在于,它仅具有正系数。因此,GMF保留各离子下的基线响应。正系数滤波器始终产生其顶点幅度是实际峰幅度加上底层基线响应之和的峰。这种背景基线强度可能是由于检测器噪声以及其它低层次峰(有时称作化学噪声)的组合引起的。
为了获得幅度的更精确测量,通常采用基线减去运算。这种运算通常需要检测峰周围的基线响应、将那些响应内插到峰中心以及从峰值减去那个响应以获得峰强度的最佳估计的单独算法。
备选地,基线减去能通过指定具有负系数以及正系数的滤波器来实现。这类滤波器有时称作反卷积滤波器,并且通过形状与提取数据的二阶导数的滤波器相似的滤波器系数来实现。这类滤波器能配置成产生每个检测离子的单个局部最大响应。这类滤波器的另一个优点在于,它们提供反卷积或者解析增强的措施。因此,这类滤波器不仅保留原始数据矩阵中出现的峰的顶点,而且它们还能产生在原始数据中仅作为肩部而不是独立顶点可见的峰的顶点。因此,反卷积滤波器能解决与共同洗脱和干扰关联的问题。
GMF的第三个缺点在于,它一般需要大量乘法来计算输出卷积矩阵中的各数据点。因此,使用GMF的卷积通常比使用其它滤波器的卷积在计算上代价更高并且更慢。如下所述,与GMF不同的滤波器指定能用于本发明的实施例。
二阶导数滤波器的优点
根据本发明的实施例,提取信号的二阶导数的滤波器在检测离子时极为有用。这是因为信号的二阶导数是信号的曲率的量度,它是峰的最突出特性。无论在一维、二维或更多维中进行考虑,峰的顶点一般都是具有曲率的最高幅度的峰的点。肩部峰也由高曲率的区域来表示。因此,由于它们对曲率的响应性,二阶导数滤波器能用于增强峰检测以及提供关于依靠较大的干扰峰的背景的肩部峰的存在的改进检测。
峰的顶点处的二阶导数具有负值,因为峰在其顶点的曲率为最大的负。本发明的一些非限制性的说明性实施例将使用反二阶导数滤波器。反二阶导数滤波器是其所有系数已与-1相乘的二阶导数滤波器。反二阶导数滤波器的输出在峰顶点为正。除非另加说明,本发明的一些示例中提到的所有二阶导数滤波器均被理解为反二阶导数滤波器。二阶导数滤波器的所有图表均为反二阶导数滤波器。
二阶导数滤波器对常数或直线(具有零曲率)的响应为零。因此,二阶导数滤波器对于峰下的基线响应具有零响应。二阶导数滤波器响应峰的顶点处的曲率而不响应底层基线。因此,二阶导数滤波器实际上执行基线减去。图15示出能应用于色谱和光谱方向的任一个或两个的示范二阶导数滤波器的截面。
一维的二阶导数滤波器
在一维情况下,二阶导数滤波器相对于平滑滤波器是有利的,因为二阶导数滤波器在顶点的幅度与基础峰的幅度成比例。此外,峰的二阶导数不响应基线。因此,实际上,二阶导数滤波器自动执行基线减去和校正的运算。
二阶导数滤波器的一个缺点在于,它们能具有相对峰顶点增加噪声的不合需要的影响。这种噪声增加影响能通过预平滑数据或者增加二阶导数滤波器的宽度来减小。例如,在本发明的一个实施例中,增加二阶导数卷积滤波器的宽度。增加二阶导数卷积滤波器的宽度改进它在卷积期间平滑输入数据矩阵中的数据的能力。用于平滑和获得二阶导数的Savitzky-Golay滤波器
对于数据的单通道(光谱或色谱),用于平滑数据(即减小噪声的影响)或者用于对数据求微分的常规方法是通过应用滤波器。在本发明的一个实施例中,通过将对应于单光谱或色谱的一维数据数组与固定值滤波器系数的集合进行卷积,对那个数据数组执行平滑或微分。
例如,能用适当系数来指定众所周知的有限脉冲响应(FIR)滤波器,以执行包括平滑和微分在内的各种运算。例如参见KARL。适当的平滑滤波器一般具有带所有正值和单个最大值的对称钟形曲线。能使用的示范平滑滤波器包括具有高斯、三角形、抛物线、梯形形状和余弦(co-sinusoidal)形状,它们的每个表征为具有单个最大值的形状。具有不对称带尾曲线(tailed curve)的平滑滤波器也能用于本发明的实施例。
能指定用于对数据的一维数组进行平滑或求微分的FIR滤波器的系列是众所周知的Savitzky-Golay滤波器。例如参见A.SAVITZKY和M.J.E.GOLAY的“Analytical Chemistry”(第36卷,第1627-1639页),通过引用将其结合到本文中。Savitzky-Golay(SG)多项式滤波器提供由加权多项式形状之和指定的平滑和微分滤波器的适当系列。滤波器的这个系列中的0阶平滑滤波器是平顶(boxcar)滤波器。滤波器的这个系列中的二阶平滑滤波器是具有单个正最大值的抛物线。滤波器的这个系列中获得二阶导数的二阶滤波器是带零平均具有单个负最大值的抛物线。对应的反二阶导数SG滤波器具有正最大值。
切趾Savitsky-Golay滤波器
SG滤波器的改进产生在本发明中良好工作的一类平滑和二阶导数滤波器。这些改进的SG滤波器称作切趾Savitsky-Golay(ASG)滤波器。术语“切趾”指的是通过将加权系数的数组应用于SG滤波器系数的最小二乘求导数所得到的滤波器系数。加权系数是切趾函数。对于本发明的实施例中使用的ASG滤波器,切趾函数在以下软件代码中是余弦窗口(由COSINEWINDOW定义)。这个切趾函数经由加权最小二乘应用于box-car滤波器以获得ASG平滑滤波器,以及应用于二阶导数SG二次多项式以获得ASG二阶导数滤波器。box car滤波器和二阶导数二次方程式本身是Savitzky-Golay多项式滤波器的示例。
每一个SG滤波器具有对应的切趾Savitzky-Golay(ASG)滤波器。ASG滤波器提供与对应SG滤波器相同的基本滤波器功能,但具有对不希望的高频噪声分量的更高衰减。切趾保留SG滤波器的平滑和微分性质,同时产生更为改进的高频截止特性。具体来说,切趾去除在滤波器边界的SG滤波器系数的突然过渡,并用平滑过渡取代它们到零。(正是余弦切趾函数迫使平滑过渡到零。)平滑尾部是有利的,因为它们降低因上述高频噪声引起的双重计数的风险。这类ASG滤波器的示例包括余弦平滑滤波器和余弦切趾二阶多项式Savitzky-Golay二阶导数滤波器。
在本发明的优选实施例中,将这些平滑和二阶导数ASG滤波器指定应用于LC/MS数据矩阵的列和行。
用于二维卷积的秩1滤波器的示例
作为用于二维卷积的秩1公式的应用的一个示例,我们能选取等式(3)中的fp和gq以具有高斯图形。所得Fpq在各行和列中具有高斯图形。Fpq的值将接近于但不等于二维GMF的fp,q。因此,这个特定秩1公式将与GMF类似地进行,但是具有计算时间的减少。例如,在P和Q等于20的上面提供的示例中,通过使用秩1滤波器计算要求的计算负荷减少400/40=10的因子。
选取fp和gq具有高斯分布以及按照等式(3)应用这些滤波器构成根据本发明的步骤2和步骤3的一个实施例。
但是对于本发明的其它实施例,我们能将单独的滤波器应用于秩1滤波器的各维。例如,在本发明的一个实施例中,fp(光谱方向应用的滤波器)是平滑滤波器,而gq(色谱方向应用的滤波器)是二阶导数滤波器。通过这类滤波器组合,能指定不同的秩1滤波器实现,它们克服了通常与滤波关联的问题。例如,能指定包括秩1滤波器的滤波器以解决与GMF关联的上述问题。
通过等式3所实现的上述秩1滤波器更为计算有效,因此比通过等式2所实现的GMF更快。此外,滤波器的指定组合提供能用于定量工作的线性基线校正响应。
此外,滤波器的组合对色谱方向的融合的峰进行锐化或者部分反卷积。
用于本发明的实施例、具有上述优点的示范秩1滤波器包括:第一滤波器fp,它是余弦ASG平滑滤波器,它的FWHM大约为对应质量峰的FWHM的70%;以及第二滤波器gq,它是ASG二阶导数滤波器,它的零交叉(zero crossing)宽度大约为对应色谱峰的FWHM的70%。在本发明的其它实施例中,其它滤波器和滤波器的组合能用作秩1滤波器。
图16A示出用于秩1滤波器以便应用于LC/MS数据矩阵的列以形成中间矩阵的示范余弦ASG平滑滤波器的光谱方向的截面。图16B示出应用于所生成的中间矩阵的行的示范ASG二阶导数滤波器的色谱方向的截面。
fp和gq的滤波器功能能够相反。也就是说,fp能够是二阶导数滤波器,而gq能够是平滑滤波器。这种秩1滤波器在光谱方向对肩部峰进行反卷积,并且在色谱方向进行平滑。
注意,fp和gq不应当都是二阶导数滤波器。在fp和gq都是二阶导数滤波器的情况中产生的秩1乘积矩阵在与离子峰进行卷积时包含不只一个、而是总共五个正的局部最大值。四个附加正顶点是从关联这些滤波器的负瓣的乘积中产生的旁瓣。因此,滤波器的这个特定组合产生不适合所提出的方法的秩1滤波器。
下面所述的秩2公式实现在光谱和色谱方向都具有平滑滤波器和二阶导数滤波器的性质的滤波器。
表2提供使用秩1卷积滤波器的用于本发明的实施例的若干滤波器组合。
表2:秩1滤波器的滤波器组合各滤波器组合是步骤2的实施例,并且作为秩1滤波器的每个使用等式(3)来应用,由此实施步骤3。在本发明的其它实施例中,其它滤波器和滤波器的组合能用作秩1滤波器。
m/z | 时间 |
平滑 | 平滑 |
平滑 | 二阶导数 |
二阶导数 | 平滑 |
作为优选实施例的用于二维卷积的秩2滤波器的示例
秩2滤波器需要为二维的每个指定两个滤波器。在本发明的一个优选实施例中,指定四个滤波器以便以计算有效的方式来解决上述与GMF关联的问题。
例如,在本发明的实施例中,第一秩1滤波器包括作为f1 p的光谱平滑滤波器以及作为g1 q的色谱二阶导数滤波器。这样一种示范平滑滤波器是余弦滤波器,它的FWHM大约为对应质量峰的FWHM的70%。这样一种示范二阶导数滤波器是ASG二阶导数滤波器,它的零交叉宽度大约为对应色谱峰的FWHM的70%。第二秩1滤波器包括作为f2 p的光谱二阶导数滤波器以及作为g2 q的色谱平滑滤波器。这样一种示范二阶导数滤波器是二阶导数ASG滤波器,它的零交叉宽度大约为对应质量峰的FWHM的70%。这样一种示范平滑滤波器是余弦滤波器,它的FWHM大约为对应色谱峰的FWHM的70%。其它滤波器和滤波器组合能用于本发明的实施例。这类滤波器的截面分别如图16C、图16D、图16E和图16F所示。
以上所述的秩2滤波器具有优于GMF的几个优点。由于它是秩2滤波器,所以比GMF更为计算有效,因此运行更快。此外,由于各截面是其系数和为零的二阶导数滤波器,因此,它提供能用于定量工作的线性基线校正响应,并且在色谱和光谱方向对融合峰进行锐化或部分反卷积。
在本发明的一个优选秩2实施例中,列滤波器的每个的滤波器宽度(按照系数的数量)设置成与光谱峰宽度成比例,而行滤波器的每个的滤波器宽度(按照系数的数量)设置成与色谱峰宽度成比例。在本发明的优选实施例中,列滤波器的宽度设置成彼此相等并且与光谱峰的FWHM成比例。例如,对于5个通道的光谱峰宽度FWHM,滤波器宽度可设置成11个点,因此平滑和二阶导数光谱滤波器的滤波器宽度均将设置成11个点的相同值。类似地,在优选实施例中,行滤波器的宽度设置成彼此相等并且与色谱峰的FWHM成比例。例如,对于5个通道的色谱峰宽度FWHM,滤波器宽度能设置成11个点,因此平滑和二阶导数光谱滤波器的滤波器宽度均将设置成11个点的相同值。以这种方式来选取滤波器宽度产生含有包括相等维数的秩2滤波器的秩1滤波器。也就是说,如果第一秩1滤波器具有维数M×N,则第二秩1滤波器的维也具有维数M×N。应当注意,秩2滤波器无需由具有相等维数的秩1滤波器来组成,并且任何适当的秩1滤波器能相加以产生秩2滤波器。
秩1滤波器被相加以构成秩2滤波器,因此在相加之前,在相对意义上必须对滤波器进行归一化。在优选实施例中,第一秩1滤波器在光谱方向是平滑滤波器而在色谱方向是二阶导数滤波器。如果这个滤波器比第二秩1滤波器更多地被加权,则组合滤波器更强调光谱方向的平滑以及色谱方向的峰的反卷积和基线减去。因此,两个秩1滤波器的相对归一化确定色谱、光谱方向的平滑和微分的相对重点。
例如,考虑两个秩1滤波器: 其中,等式(11)是第一秩1滤波器,而等式(12)是第二秩1滤波器。在本发明的一个优选实施例中,每个秩1滤波器经过归一化,使得它的系数的平方之和等于一。这种归一化为光谱和色谱方向的平滑和微分提供相等加权。也就是说,对于各具有M×N维的秩1滤波器:
通过将适当的比例因子应用于相应秩1矩阵的系数,能将该优选实施例的平滑滤波器和二阶导数滤波器进行归一化以满足这个标准。
此外,在该优选实施例中,每个秩1滤波器的行维数是相同的,并且每个秩1滤波器的列维数是相同的。因此,能按照下式将系数相加以获得秩2卷积滤波器的点源: 从等式(13)能看到,需要两个秩1滤波器的相对归一化来确定二维卷积滤波器Fp,q。
二维卷积滤波器的优选实施例的滤波器系数
针对图17A-K来描述示范秩2滤波器。这个滤波器是能用于检测离子、减去基线响应、部分解析融合峰并且以高计算效率来执行的步骤2和步骤3的一个实施例。
具体来说,这个秩2滤波器可用于检测肩部峰。根据本发明的实施例的秩2滤波器能包括色谱和光谱方向的二阶导数滤波器。由于二阶导数滤波器对曲率的响应性质,这种秩2滤波器能检测肩部峰,其中肩部峰的顶点在数据中可能不明显。假定秩2滤波器包括测量曲率的二阶导数滤波器,则在数据中不是直接看到的第二峰的顶点能作为输出卷积矩阵中的独立顶点来检测。
图17A是能在LC/MS数据中生成的仿真峰的图形表示,其中水平轴表示所示的扫描的时间和m/z通道,而垂直轴表示强度。图17B示出根据本发明的一个优选实施例、与秩2滤波器对应的卷积滤波器矩阵。
在这种仿真中,所有离子的光谱和色谱峰宽度为8个点FWHM。所有四个滤波器的滤波器系数的数量为15个点。
图17C示出具有相等质量并且接近但不是完全相同地在时间上重合的两个LC/MS峰的仿真。图17D示出峰的截面在质量上是纯峰,而图17E示出峰的截面在时间上展示肩部1704。图17F至图17H示出仿真计数(散粒噪声)对于包括图17D-17E所示的肩部峰的各取样元素的影响。图17G和图17H示出因增加的计数噪声而产生的截面。在图17G和图17H中能看到,作为计数噪声的结果而生成许多局部最大值。因此能看到,即使只有两个离子存在,计数噪声也能产生多个可能引起假阳性离子检测的伪局部最大值。
图17I-K示出将秩2滤波器与仿真数据进行卷积的结果。所得输出卷积矩阵(由图17I的等高线图表示)包括两个不同的峰1702和1706。峰1702是与两个离子中更强的离子关联的峰,而峰1706是不太强的肩部离子的峰。图17J是光谱(质荷比)方向的输出卷积矩阵的截面。图17K是色谱(时间)方向的输出卷积矩阵的截面。
通过查看图17I-K所观察到的是本发明的基于秩2滤波器的实施例减小计数噪声的影响并且对肩部峰进行反卷积以产生多个局部最大值。各局部最大值与离子关联。因此,本发明的这个实施例还减小假阳性率。离子参数m/z、保留时间和强度通过如上所述分析所检测的局部最大值来获得。
任何滤波器在产生单个局部最大值时均能被使用
以上所述的滤波器和卷积方法能用于检测LC/MS数据矩阵中的离子。能选取滤波器系数的其它集合作为步骤2的实施例。
输入信号是LC/MS数据矩阵中具有唯一最大值的峰,因此步骤2的卷积滤波器必须在经过卷积过程后如实地保持那个唯一的正最大值。卷积滤波器作为步骤2的一个实施例必须满足的一般要求如下所述:卷积滤波器必须具有在与具有唯一最大值的输入进行卷积时产生唯一最大值的输出。
对于具有钟形响应的离子,通过其截面全部是钟形、具有单个正最大值的任何卷积滤波器来满足这个条件。这类滤波器的示例包括反抛物线滤波器、三角形滤波器和余弦滤波器。具体来说,具有唯一正值顶点的性质的任何卷积滤波器使那个滤波器成为用于本发明的实施例的适当候选。滤波器系数的等高线图能用于检查局部最大值的数量和位置。通过滤波器的所有行、列和对角线截面必须具有单个正局部最大值。许多滤波器形状满足这个条件,因此能用于本发明的实施例。
能使用Boxcar,因为它产生单个局部最大值
可接受的另一个滤波器形状是具有常数值的滤波器(即boxcar滤波器)。这是因为峰与boxcar滤波器的卷积产生具有单个最大值的输出。boxcar滤波器在本发明的实施例中有利的一个众所周知的特性在于,这种形状对于给定数量的滤波器点产生最小变化。boxcar滤波器的另一个优点在于,一般来说,它们能采用比具有其它形状的滤波器、如高斯或余弦滤波器更少的乘法来实现。
boxcar的维数应当匹配光谱和色谱方向的峰的广度。如果boxcar太小,则不会对关联峰的所有计数求和。如果boxcar太大,则可能包括来自其它相邻峰的计数。
但是,boxcar滤波器对于本发明可应用的一些应用也具有明显的缺点。例如,boxcar滤波器的传递函数表明它们传递高频噪声。这种噪声能增加对低幅度信号(低SNR)的峰进行双重计数的风险,这在本发明的一些应用中可能是不希望的。因此,与boxcar形状不同的滤波器形状一般在本发明的应用中是优选的。
二阶导数滤波器能产生单个局部最大值
具有在与具有唯一最大值的输入进行卷积时产生唯一最大值的输出的另一个适当类别的卷积滤波器是具有单个正局部最大值、但具有负旁瓣的滤波器。这类滤波器的示例包括响应曲率的二阶导数滤波器。适当的二阶导数滤波器能通过从平滑滤波器减去平均值来指定。虽然这类滤波器能从boxcar、三角形和梯形形状的组合来组装,但是对数据求微分的滤波器的最常见指定是Savitzky-Golay多项式滤波器。
高斯噪声和泊松噪声
当噪声具有高斯统计时,高斯匹配滤波器是最佳滤波器。来自计数检测器的噪声具有泊松统计。在泊松噪声的情况下,boxcar滤波器可以是用于检测的最佳滤波器,因为boxcar只对关联峰的所有计数求和。但是,对于GMF所述的限制中的许多仍然适用于boxcar滤波器,即使在泊松噪声的情况下。Boxcar滤波器无法减去基线噪声,并且无法解析干扰和共同洗脱峰。另外,boxcar滤波器的传递函数可允许对峰顶点的双重计数。
优选实施例的秩2滤波器是高斯噪声和泊松噪声的两种情况的SNR的折衷。这个秩2滤波器具有基线减去和部分解析重叠峰的优点。
峰宽度在确定滤波器系数中的作用
在本发明的实施例中,选取要与输入矩阵D进行卷积的卷积滤波器F的系数以对应于与离子对应的峰的典型形状和宽度。例如,滤波器F的中心行的截面匹配色谱峰形状;滤波器F的中心列的截面匹配光谱峰形状。应当注意,虽然卷积滤波器的宽度能与峰的FWHM匹配(在时间以及在质荷上),但是不要求这种宽度匹配。
离子强度的解释和滤波器系数的缩放
在本发明中,强度测量估计是局部最大值处的滤波器输出的响应。与LC/MS数据矩阵进行卷积的滤波器系数的集合确定强度的缩放。滤波器系数的不同集合产生不同的强度缩放,因此本发明的强度的这种估计不一定准确对应于峰面积或峰高度。
但是,强度测量与峰面积或者与峰高度成比例,因为卷积运算是强度测量的线性组合。因此,局部最大值处的滤波器输出的响应与产生离子的样本中的分子的浓度成比例。局部最大值处的滤波器输出的响应则能以与离子的响应的峰的高度面积相同的方式用于样本中的分子的定量测量。
假设滤波器的一致集合用于确定标准、校准器和样本的强度,则所得强度测量产生精确的可定量的结果,而与强度缩放无关。例如,本发明的实施例所生成的强度能用于建立浓度校准曲线,它随后能用于确定分析物的浓度。
不对称峰形状
上述示例假定光谱和色谱方向的离子的峰形状为高斯,因此是对称的。一般来说,峰形状不是对称的。不对称峰形状的一个常见示例是带尾高斯、与阶跃指数(step-exponential)进行卷积的高斯的形状。这里所述的方法仍然适用于不对称的峰形状。在对称滤波器应用于不对称峰的情况下,输出卷积矩阵中的顶点的位置一般不会准确对应于不对称峰的顶点位置。但是,源自峰不对称的任何偏移(在色谱或者光谱方向)将有效地为常数偏移。这种偏移易于通过常规质量光谱校准以及通过使用内部标准的保留时间校准进行校正。
根据匹配滤波器定理,不对称峰的检测的最佳形状将是不对称峰形状本身。但是,假设对称滤波器的宽度匹配不对称峰的宽度,则对于本发明,对称滤波器与匹配的不对称滤波器之间的检测效率的差异将为最小。
改变滤波器系数以便内插和偏移数据
系数修改的另一个用途是提供内插以说明因质量光谱仪的校准引起的小变化。这种系数修改能逐个光谱发生。例如,如果质量校准的变化引起通道的0.3的分数的偏移,则能得出列滤波器(平滑以及二阶导数),它们估计在没有这种质量偏移的情况下的输出。这样,能进行实时质量校正。所得滤波器通常是略微不对称的。
动态滤波
滤波器特性、如滤波器宽度缩放能响应LC分离或MS扫描的已知变化特性而改变。例如,在TOF质量光谱仪中,峰宽度(FWHM)已知为在每次扫描的过程中从低值(例如0.010amu)改变成更宽的值(例如0.130amu)。在本发明的一个优选实施例中,平滑和微分滤波器的系数的数量设置成等于光谱峰的FWHM的大约两倍。当MS扫描例如从低到高质量进行时,该优选实施例所采用的平滑以及二阶导数列滤波器的滤波器宽度能相应地扩展,以便保留滤波器宽度与峰宽度之间的关系。类似地,如果色谱峰的宽度已知为在分离期间改变,则行滤波器的宽度能扩展或缩短,以便保留滤波器宽度与峰宽度之间的关系。
秩1和秩2滤波器的实时实施例
在常规LC/MS系统中,当分离进行时获取光谱。通常以恒定取样率(例如以每秒一次的速率)将光谱写入计算机存储器。在采集一个或多个完整光谱之后,将它们写入更永久的存储装置,如硬盘存储器。这种采集后处理也能在本发明的实施例中执行。因此,在本发明的一个实施例中,仅在获取完成之后才生成卷积矩阵。在本发明的这种实施例中,原始数据和卷积矩阵本身作为从分析所检测局部最大值得到的离子参数列表被存储。
另外,使用秩1和秩2滤波器的本发明的实施例能配置成实时运算。在本发明的实时实施例中,在获取数据的同时,获得卷积矩阵的列。因此,初始列(与光谱对应)能被获得、分析,并且在所有光谱的获取完成之前使其离子参数被写入磁盘。
本发明的这个实时实施例基本上分析计算机存储器中的数据,仅将离子参数列表写入永久硬盘驱动器。在这个上下文中,实时表示在获取数据时对计算机存储器中的光谱执行秩1和秩2滤波。因此,在分离开始时在写入磁盘的光谱中检测由LC/MS所检测的离子,并且在分离进行时还将离子参数列表中包含与这些离子关联的参数的部分写入磁盘。
通常存在与开始实时处理关联的时间延迟。包含在时间t和宽度Δt的色谱峰中洗脱的离子的光谱在被采集后马上能被处理。实时处理通常在时间t+3Δt、即在最初采集3个光谱之后开始。然后,将通过分析这个色谱峰所确定的离子参数附加于被创建并存储在永久存储装置(如计算机磁盘)中的离子参数列表。实时处理按照上述技术进行。
实时处理的优点包括:(1)快速获取离子参数列表;(2)根据离子参数列表中的信息来触发实时处理。这类实时处理包括馏分收集和停流技术,以便存储洗脱液供分析。这样一种示范停流技术在核磁共振(NMR)光谱检测器中捕捉洗脱液。
图18是示出根据本发明的一个优选实施例、用于实时处理的方法的流程图1800。该方法能通过例如基于DSP的设计等的硬件或者通过例如上述DAS等的软件来运行。本领域的技术人员清楚地知道如何根据以下描述来配置这种硬件或软件。为了便于描述,将该方法描述为好像由DAS运行软件执行。图19示出光谱缓冲器1902、色谱缓冲器1906和顶点缓冲器1910以及如何操纵它们执行执行流程图1800中所示的方法。
在步骤1802,DAS通过接收下一个光谱元素来开始该方法。在图19,这些光谱元素表示为S1、S2、S3、S4和S5,并且分别对应于在时间T1、T2、T3、T4和T5所接收的光谱元素。在步骤1804,DAS确定所接收光谱元素是否为0。如果所接收光谱元素为0,则在步骤1802,DAS通过接收下一个光谱元素继续进行该方法。如果光谱元素不为零,则其强度用来缩放光谱滤波器1904的系数。在图19所示的示例中,光谱滤波器1904是具有滤波器系数F1、F2和F3的3元素滤波器。缩放能通过将各滤波器系数与所接收光谱元素的强度相乘来实现。
在步骤1808,将经缩放的光谱滤波器系数加到光谱缓冲器。光谱缓冲器是数组。光谱缓冲器中的元素的数量等于各光谱中的元素的数量。
为了执行求和,对齐滤波器1904使得光谱缓冲器中与所接收光谱元素对应的元素与滤波器1904的中心对齐。因此,在时间T1,当接收到光谱元素S1时,滤波器1904的中心F2与光谱缓冲器元素1902a对齐;在时间T2,当接收到光谱元素S2时,滤波器1904的中心F2与光谱缓冲器元素1902b对齐,依此类推。这些步骤如图19所示,其中,对于时间T1、T2、T3、T4和T5示出滤波器系数F1、F2和F3的缩放以及加到光谱缓冲器1902,时间T1、T2、T3、T4和T5在本例中是接收足够的光谱元素以填充光谱缓冲器1902所需的时间。所得比例和也在图19的光谱缓冲器元素中示出。
在步骤1810,DAS确定光谱缓冲器是否已满,即,所接收和处理的光谱元素的数量是否与光谱滤波器中的元素的数量相同。如果不是,则在步骤1802,DAS通过等待下一个光谱元素继续进行该方法。如果光谱缓冲器已满,则在步骤1812,DAS继续进行该方法。
在步骤1812,DAS将新的光谱移动到色谱缓冲器1906。色谱缓冲器1906包含N个光谱,其中N是色谱缓冲器中的系数的数量。在本例中,N为3。色谱缓冲器1906配置为先进后出(FILO)缓冲器。因此,当添加新的光谱时,丢掉最早的光谱。在步骤1812添加新的光谱时,丢弃最早的光谱。在步骤1814,DAS将色谱滤波器1907应用于色谱缓冲器1906的各行。在应用滤波器之后,中心列1908对应于输出卷积矩阵的单列卷积光谱。在步骤1816,DAS将该卷积光谱传输到顶点缓冲器1910。
在本发明的一个实施例中,顶点缓冲器1910为三个光谱宽,即,顶点缓冲器1910包括三个列光谱。光谱列的每个优选地具有完整光谱的长度。顶点缓冲器1910是FILO缓冲器。因此,当来自色谱缓冲器1906的新列在步骤1816附加到顶点缓冲器1910时,丢弃最早的列光谱。
下面所述的峰检测算法能对顶点缓冲器1910的中心列1912来执行。中心列1912用于通过使用最靠近的相邻值提供峰和离子参数的更准确的分析。峰的分析允许DAS在步骤1820提取离子参数(例如保留时间、m/z和强度)以存储在离子参数列表中。此外,光谱峰宽度信息也能通过沿列检查与局部最大值相邻的点来获得。
顶点缓冲器1910还能扩大超过3个光谱宽度。例如,为了测量色谱峰宽度,将需要将顶点缓冲器扩大到包括至少等于色谱峰的FWHM的数量的光谱,例如色谱峰的FWHM的两倍。
在本发明的实时实施例中,无需记录原始光谱。仅记录已滤波光谱。因此,降低了本发明的实时实施例的大容量存储要求。但是,一般来说,对于本发明的实时实施例要求附加的存储存储器、如RAM。对于本发明的基于秩1滤波器的实时实施例,仅需要单个光谱缓冲器。对于本发明的基于秩2滤波器的实时实施例,需要两个光谱缓冲器,一个用于平滑,而一个用于二阶导数光谱滤波器。
步骤4:峰检测
离子的存在产生具有输出卷积矩阵中的强度的局部最大值的峰。本发明的实施例的检测过程检测这类峰。在本发明的一个实施例中,检测过程将其最大强度满足检测阈值的那些峰识别为与离子对应的峰。本文所使用的“满足检测阈值”被定义为满足超过检测阈值的任何标准。例如,标准可能满足检测阈值或者满足或超过检测阈值。另外,在本发明的一些实施例中,标准可降到低于检测阈值或者满足或降到低于检测阈值。
输出卷积矩阵中的强度的各局部最大值是与离子对应的峰的候选。如上所述,在没有检测器噪声的情况下,每一个局部最大值将被认为与离子对应。但是,在存在噪声的情况下,一些局部最大值(特别是低幅度局部最大值)只是因噪声而引起的,而没有表示与所检测离子对应的真正峰。因此,重要的是设置检测阈值,使得满足检测阈值的局部最大值是因噪声而引起的可能性非常小。
各离子产生输出卷积矩阵中的强度的唯一顶点或最大值。输出卷积矩阵中的这些唯一最大值的特性提供与样本中存在的离子的数量和性质有关的信息。这些特性包括峰的位置、宽度和其它性质。在本发明的一个实施例中,识别输出卷积矩阵中的所有局部最大值。后续处理消除确定为不与离子关联的那些局部最大值。
根据本发明的实施例,仅在局部最大值满足检测阈值时,强度的局部最大值才被认为与检测的离子对应。检测阈值本身也是强度,强度的局部最大值与其进行比较。检测阈值能通过主观或客观方式来获得。实际上,检测阈值将真实峰的分布分为两类:满足检测阈值的峰以及不满足检测阈值的真实峰。忽略不满足检测阈值的峰。因此,忽略不满足检测阈值的真实峰。这类忽略的真实峰称作假阴性。
阈值还将噪声峰的分布分为两类:满足检测阈值的峰以及不满足检测阈值的噪声峰。满足检测阈值的任何噪声峰被认为是离子。被认为是离子的噪声峰称作假阳性。
在本发明的实施例中,检测阈值通常设置成实现通常很低的期望的假阳性率。也就是说,检测阈值设置成使得噪声峰在给定实验中将满足检测阈值的概率是不太可能的。
为了获得较低的假阳性率,检测阈值设置成较高值。将检测阈值设置成较高值以降低假阳性率具有提高假阴性率、即不会检测与离子对应的低幅度真实峰的概率的不合需要的效果。因此,设置检测阈值时记住这些竞争因素。
检测阈值能主观或客观地确定。无论是主观还是客观的任何阈值方法的目标是确定用于编辑离子列表的检测阈值。其强度不满足检测阈值的所有峰均被认为是噪声。这些“噪声”峰被抛弃而不包含在进一步分析中。
用于设置检测阈值的主观方法是绘制接近所观测噪声的最大值的线条。满足检测阈值的任何局部最大值被认为是与离子对应的峰。而不满足检测阈值的任何局部最大值被认为是噪声。虽然能使用用于确定阈值的主观方法,但是客观技术是优选的。
根据本发明的实施例、用于选择检测阈值的一种客观方法使用输出卷积矩阵数据的柱状图。图20是根据本发明的一个实施例、用于客观确定检测阈值的方法的流程图。该方法又如图7中以图形方式所示。该方法按照以下步骤进行:步骤2002:以升序将输出卷积矩阵中存在的所有正局部最大值的强度分类步骤2004:将输出卷积数据矩阵中的强度数据的标准偏差确定为在列表中的35.1百分点处的强度。步骤2006:根据标准偏差的倍数来确定检测阈值。步骤2008:使用满足检测阈值的峰来生成编辑的离子列表或离子参数列表。
当局部最大值的大多数因高斯噪声而引起时,上述方法适用。例如,如果存在1000个强度,则步骤2004将确定第351个强度表示高斯标准偏差。如果最大强度的分布仅因高斯噪声过程而引起,则其值超过第351个强度的局部最大值将以高斯噪声分布所预测的频率出现。
检测阈值则是第351个强度的倍数。作为一个示例,考虑两个检测阈值。一个对应于2个标准偏差。一个对应于4个标准偏差。2偏差阈值产生极少假阴性,但产生大量假阳性。根据高斯噪声分布的性质,2标准偏差阈值表示大约5%的峰将被错误地识别为离子。4偏差阈值产生更多假阴性,但产生明显更少的假阳性。根据高斯噪声分布的性质,4标准偏差阈值表示大约0.01%的峰将被错误地识别为离子。
在记录强度的每个区间的强度的数量的情况下,不是将所有局部最大值的强度的列表进行分类,而是能使用柱状图显示。通过选择一系列均匀间隔的强度值,其中每对值定义一个区间,并且对落入每格中的最大强度的数量进行计数,来获得柱状图。柱状图是每格的强度的数量相对于定义每格的平均强度值。柱状图提供用于确定强度分布的标准偏差的图形方法。
经验方法的变种使用卷积输出噪声的标准偏差σ与输入噪声的标准偏差σ0之间的关系来设置检测阈值。根据上述滤波器分析,这种关系可表示为 假定输入噪声是不相关高斯偏差。输入噪声σ0能从输入LCL/MS数据矩阵作为背景噪声的标准偏差来测量。仅包含背景噪声的LC/MS的区域能从空白注入来获得,也就是说,LC/MS数据在没有注入样本的分离获得。
因此,输出的标准偏差能够仅使用滤波器系数Fi,j和测量背景噪声σ0的值来推断,检测阈值则能根据得出的输出噪声标准偏差σ来设置。
步骤5:峰参数提取
在识别作为与离子对应的峰的那些局部最大值之后,估计各峰的参数。在本发明的一个实施例中,被估计的参数是保留时间、质荷比和强度。也能估计例如色谱峰宽度(FWHM)和质荷峰宽度(FWHM)等的其它参数。
每个已识别离子的参数从输出卷积矩阵中的所检测的峰的局部最大值的特性来获得。在本发明的一个实施例中,这些参数确定如下:(1)离子的保留时间是包含(已滤波)最大元素的(已滤波)扫描的时间;(2)离子的m/z是包含(已滤波)最大元素的(已滤波)通道的m/z;(3)离子的强度是(已滤波)最大元素本身的强度。
能通过测量跨越峰的最接近零交叉点的位置之间的距离或者通过测量跨越峰的最接近最小值之间的距离来确定光谱或色谱方向的峰的宽度。这类峰宽度能用于确认峰从其相邻峰被解析。能通过考虑峰宽度来收集其它信息。例如,峰宽度的非预期的大值可能指明重合峰。因此,零交叉或局部最小值的位置能用作估计干扰重合的影响或者修改离子参数列表中存储的参数值的输入。
通过分析峰所确定的参数能够通过考虑相邻元素来进一步优化。由于卷积矩阵的元素表示数据的数字样本,因此,色谱(时间)维的峰的真实顶点可能没有与取样时间准确重合,并且光谱(质荷比)维的峰的真实顶点可能没有与质荷比通道准确重合。因此,时间和质荷比维的信号的实际最大值与可用取样值偏移取样周期或者质荷比通道区间的分数。能根据具有与峰对应的局部最大值的元素周围的矩阵元素的值,使用内插(如曲线拟合技术)来估计这些分数偏移。
例如,用于在二维上下文中估计相对于包含与离子对应的局部最大值的输出卷积矩阵的元素的真实顶点的分数偏移的技术是对包含局部最大值的数据矩阵的元素及其最接近相邻元素拟合二维形状。在本发明的实施例中,使用二维抛物线形状,因为它是对其顶点附近的卷积峰的形状的良好近似。例如,能对包含峰及其8个最接近相邻元素的九元素矩阵拟合抛物线形状。在本发明的范围和精神之内,其它拟合能用于这种内插。
使用抛物线拟合,计算峰顶点的内插值,从其中确定离子参数。与通过读取扫描时间和光谱通道的值所得到的相比,内插值提供保留时间、m/z和强度的更精确的估计。最大值处的抛物线的值及其与那个最大值对应的内插时间和m/z值是离子强度、保留时间和m/z的估计。
二维抛物线拟合的最大值的行方向的内插位置是保留时间的最佳估计。二维抛物线拟合的最大值的列方向的内插位置给出质荷比的最佳估计。顶点在基线上方的内插高度给出离子强度或浓度的最佳估计(由滤波器因子缩放)。
本发明的实施例还能配置成从中间卷积矩阵的结果中提取峰参数。例如,以上所述用于定位与检测的离子对应的单个峰的方法还能用于定位矩阵的各行或列中的峰。这些峰可用于存储在已知时间或质量值处的光谱或色谱。
例如,对于来自以上所述的中间卷积矩阵的各行和列能够获得从二阶导数滤波器获得的光谱或色谱。也能够对于局部最大值来检查这些中间结果。这些最大值有效地是色谱和光谱的平滑形式。局部最大值能够被提取和保存,从而给出关于在特定时间或时间范围的样本的光谱内容或者在典型质量或质量范围的色谱内容的其它细节。
测量误差
由于本发明的实施例所产生的各离子参数测量是估计,所以存在与每个这种测量关联的测量误差。能在统计上估计这些关联测量误差。
两个不同的因素构成测量误差。一个因素是系统或校准误差。例如,如果质量光谱仪m/z轴没有完全校准,则任何给定m/z值均包含偏移。系统误差通常保持恒定。例如,校准误差在整个m/z范围基本上保持恒定。这种误差与特定离子的幅度或信噪比无关。类似地,在质荷比的情况下,误差与光谱方向的峰宽度无关。
构成测量误差的第二个因素是与各测量关联的不可约的统计误差。这个误差因热或散粒噪声相关影响而产生。关于给定离子的这个误差的幅度或变化取决于离子的峰宽度和强度。统计误差测量再现性,因此与校准误差无关。关于统计误差的另一术语是精度。
与各测量关联的统计误差原则上能从进行测量的仪器的基本操作参数来估计。例如,在质量光谱仪中,这些操作参数通常包括与微通道计数板(MCP)的效率耦合的仪器的传输效率和离子化。这些操作参数共同确定与离子关联的计数。计数确定与使用质量光谱仪的任何测量关联的统计误差。例如,与上述测量关联的统计误差通常遵循泊松分布。各误差的数值能经由误差传播理论从计数统计得出。例如参见P.R.Bevington的“Data Reduction and Error Analysis forthe Physical Sicences”,第58-64页(McGraw-Hill,1969年)。
一般来说,统计误差也能直接从数据中推断。直接从数据中推断统计误差的一种方式是调查测量的再现性。例如,相同混合物的重复注入能建立关于相同分子的m/z值的统计再现性。注入之间的m/z值的差可能因统计误差而引起。
在与保留时间测量关联的误差的情况下,统计再现性更难以实现,因为从重复注入产生的系统误差倾向于掩盖统计误差。克服这个难题的一种技术是检查从共同母体分子所产生的不同m/z值的离子。源自共同分子的离子预计具有相同的固有保留时间。因此,源自共同母体的分子的保留时间的测量之间的任何差异可能因统计误差而引起,这些统计误差与关联峰的性质的测量的基本检测器噪声关联。
使用本发明的一个实施例所进行和存储的各测量能伴有其关联的统计和系统误差的估计。虽然这些误差应用于每个所检测离子的参数估计,但是它们的值能通过分析离子集合来统一推断。在适当的误差分析之后,与所检测离子的各测量关联的误差能包含在与所检测离子测量对应的表的各行中。在本发明的这种实施例中,表的各行能具有与各离子关联的十五个测量。这些测量是与行对应的所检测离子的五个测量及其关联的统计和系统误差,它们是保留时间、质荷比、强度、光谱FWHM和色谱FWHM。
如上所述,保留时间和m/z中的测量误差的统计分量(或精度)取决于相应峰宽度和强度。对于具有高SNR的峰,精度能实质上小于相应峰宽度的FWHM。例如,对于具有20毫amu的FWHM和高SNR的峰,精度能小于1毫amu。对于刚刚高于噪声可检测的峰,精度能够是20毫amu。为了便于论述统计误差,FWHM认为是卷积之前的LC/MS色谱中的峰的FWHM。
精度与峰宽度成正比而与峰幅度成反比。一般来说,精度、峰宽度和峰幅度之间的关系能表示为:
在这种关系中,σm是m/z的测量的精度(表示为标准误差),wm是峰的宽度(以FWHM的毫amu表示),hp是峰的强度(表示为滤波后信噪比),以及k是大约为一(unity)的无量纲常数。k的准确值取决于所使用的滤波方法。这个表达式表明σm小于wm。因此,本发明允许以小于原始LC/MS数据中测量的m/z峰宽度的FWHM的精度进行对检测的离子的m/z的估计。
对于保留时间的测量应用相似的考虑因素。能测量峰的保留时间的精度取决于峰宽度和信号强度的组合。如果峰的FWHM最大值为0.5分钟,则保留时间能测量到0.05分钟(3秒)的由标准误差所描述的精度。使用本发明,能够以小于原始LC/MS数据中测量的保留时间峰宽度的FWHM的精度进行对所检测离子的保留时间的估计。
步骤6:存储提取的参数
如上所述,本发明的实施例的一个输出是与所检测离子对应的参数的表或列表。这个离子参数表或列表具有与每个所检测离子对应的行,其中各行包括一个或多个离子参数以及必要时包含其关联误差参数。在本发明的一个实施例中,离子参数表中的各行具有三个这种参数:保留时间、质荷比和强度。对于列表中所表示的每个所检测离子能存储其它离子参数及关联误差。例如,通过在色谱和/或光谱方向的其FWHM或零交叉宽度所测量的所检测离子的峰宽度也能够被确定和存储。
当采用二阶导数滤波器来执行滤波时,零交叉宽度可适用。二阶导数的零值出现在峰的上坡和下坡侧的峰的拐点处。对于高斯峰图形,拐点出现在与峰顶点的+/1标准偏差距离处。因此,通过拐点所测量的宽度对应于峰的2标准偏差宽度。因此,零交叉宽度是与大约2个标准偏差对应的峰宽度的高度无关量度。在本发明的一个实施例中,表中的行数对应于所检测离子的数量。
本发明还提供数据压缩有益效果。这是因为存储离子参数表中包含的信息所需的计算机存储器明显小于存储最初生成的原始LC/MS数据所需的存储器。例如,包含3600个光谱(例如在一小时每秒采集一次的光谱)、其中各光谱中具有400000个解析元素(例如20000∶1MS解析度,从50至2000amu)的典型注入需要超过存储器的数千兆字节来存储强度的LC/MS数据矩阵。
在一个复杂示例中,使用本发明的实施例,能检测大约100000个离子。这些所检测离子通过具有100000行的表来表示,其中各行包括与所检测离子对应的离子参数。存储每个所检测离子的期望的参数所需的计算机存储量通常小于100兆字节。这个存储量代表存储最初生成数据所需的存储器的一小部分。离子参数表中存储的离子参数数据能被访问和提取以便进一步处理。用于存储数据的其它方法能用于本发明的实施例中。
如果这种分析使用离子参数列表而不是最初产生的LC/MS数据来执行,则不仅存储要求显著降低,而且后处理LC/MS数据的计算效率也明显提高。这是因为需要处理的数据点的数量的显著减小。
步骤7:简化光谱和色谱
能咨询所得离子列表或表以形成新颖和有用的光谱。例如,如上所述,根据保留时间的增强估计从表中选择离子产生极大降低复杂度的光谱。备选地,根据m/z值的增强估计从表中选择离子产生极大降低复杂度的色谱。例如,下面更详细地进行描述,保留时间窗口能用来排除与受关注种类不相关的离子。保留时间选择的光谱简化了在光谱中引入多个离子的分子种类(例如蛋白质、肽及其碎裂产物)的质量光谱的解释。类似地,能定义m/z窗口以区分具有相同或相似m/z值的离子。
使用保留窗口的概念,能获得来自LC/MS色谱的简化光谱。能选取窗口的宽度不大于色谱峰的FWHM。在一些情况下,选择更小的窗口,例如峰的FWHM的十分之一。通过选择一般与受关注峰的顶点关联的特定保留时间,然后选取与所选取的特定保留时间有关的值的范围,来定义保留时间窗口。
例如,能选择具有最高强度值的离子,并记录保留时间。在记录的保留时间周围选择保留时间窗口。然后检查离子参数表中存储的保留时间。只有具有属于保留时间窗口的保留时间的那些离子才被选择用于包含在光谱中。对于具有30秒的FWHM的峰,保留时间窗口的有用值能够大到+/-15秒或者小到+/-1.5秒。
能指定保留时间窗口以选择接近同时洗脱并且因此是用于进行相关的候选的离子。这种保留时间窗口排除不相关分子。因此,使用保留窗口从峰列表中得到的光谱仅包含与受关注种类对应的离子,由此极大地简化了所产生的光谱。这是对于常规技术所产生的通常包含与受关注种类不相关的离子的光谱的重大改进。
使用离子参数表还提供用于分析色谱峰纯度的技术。峰纯度指的是峰是因单个离子还是因共同洗脱离子的结果而引起的。例如,通过参考本发明的实施例生成的离子参数列表,分析人员能确定多少化合物或离子在受关注主要峰的时间内洗脱。参照图21来描述一种用于提供峰纯度的测量或度量的方法。
在步骤2102,选取保留时间窗口。保留时间窗口对应于与受关注离子对应的峰的升高和降落。在步骤2104,咨询离子参数表以便识别在所选取的保留时间窗口中洗脱的所有离子。在步骤2106,对所识别离子(包括受关注离子)的强度求和。在步骤2108,计算峰纯度度量。峰纯度度量能通过许多方式来定义。在本发明的一个实施例中,峰纯度度量定义为:纯度=100*(受关注峰的强度)/(保留窗口中的所有峰的强度之和)。备选地,在本发明的另一个实施例中,峰纯度定义为:纯度=100*(最强的强度)/(保留窗口中的所有峰的强度之和)。在峰纯度的两种定义中,峰纯度表示为百分比值。
本发明的光谱简化特性还能用于更轻松地研究生物样本。生物样本是通常使用LC/MS方法进行分析的混合物的一个重要类别。生物样本一般包括复杂分子。这类复杂分子的一个特性在于,单分子种类可产生若干离子。肽以不同的同位素状态自然出现。因此,在给定电荷呈现的肽将以m/z的若干个值呈现,每个值对应于那个肽的不同同位素状态。通过充分解析,肽的质量光谱展示特性离子簇。
将通常具有高质量的蛋白质离子化为不同的电荷态。虽然蛋白质中的同位素变化不可由质量光谱仪来解析,但是以不同电荷态呈现的离子一般能够被解析。这类离子产生能用于帮助识别蛋白质的特征图。则本发明的方法将允许关联来自共同蛋白质的那些离子,因为它们具有共同的保留时间。这些离子随后形成简化光谱,该简化光谱能够通过例如授予Fenn等人的美国专利No.5130538中公开的方法来分析。
质量光谱仪仅测量质荷比而不测量质量本身。但是,从分子产生的离子的图案来推断分子(如肽和蛋白质)的电荷态是可能的。使用这个推断电荷态,能估计分子的质量。例如,如果蛋白质以多个电荷态出现,则从m/z值的间隔来推断电荷、计算知道电荷的各离子的质量以及最终估计无电荷母体的质量是可能的。类似地,对于肽,在m/z电荷是关于特定质量m的同位素值中的电荷引起的情况下,从毗连离子之间的间隔来推断电荷是可能的。
存在许多使用来自离子的m/z值来推断电荷和母体质量的众所周知的技术。在美国申请No.5130538中描述了这样一种示范技术,通过引用将其完整地结合到本文中。对于这些技术的每个的要求是选择正确的离子以及使用m/z的精确值。所检测离子参数表中表示的离子提供高精度值,它们能用作对这些技术的输入以产生增强精度的结果。
另外,所引用的方法中的几种尝试通过区分可呈现在光谱中的离子来降低光谱的复杂度。一般来说,这些技术涉及选择集中于突出峰的光谱或者搜索与单个峰关联的光谱,以便得到单个提取的MS光谱。如果那个峰来自产生了多个时间重合离子的分子,则光谱将包含所有那些离子,其中包括来自不相关种类的离子。
这些不相关种类能来自在与受关注种类完全相同的保留时间洗脱的离子,或者普遍地,不相关种类来自在不同保留时间洗脱的离子。但是,如果这些不同的保留时间是在大约色谱峰宽度的FWHM的窗口之内,则来自这些峰的前部或尾部的离子可能呈现在光谱中。与不相关种类关联的峰的呈现需要后续处理以检测和去除它们。在它们重合的一些情况下,它们可以是偏置测量(biasingmeasurement)。
图22A示出由两个母体分子和所得多个离子产生的示范LC/MS数据矩阵。在这个示例中,某个种类在时间t1洗脱,从而产生4个离子,以及另一个种类在时间t2洗脱,从而在LC/MS数据矩阵中产生5个离子。即使存在两个不同的种类,但是,如果光谱将在时间t1或时间t2被提取,则结果光谱将包含九个峰,各来自九个离子之一。但是,本发明将获得关于这9个离子的每个的9个准确保留时间(以及m/z和强度)。如果光谱然后仅由具有实质上等于t1的保留时间的离子构成,则仅存在四个离子。这个简化光谱在图22B中呈现。类似地,如果光谱然后仅由具有实质上等于t2的保留时间的离子构成,则仅存在五个离子。这个简化光谱在图22C中呈现。
应用
当采用LC/MS系统采集样本时,通常在横跨色谱峰采集多个光谱,以便精确地推断保留时间。例如,在本发明的实施例中,每个FWHM采集5个光谱。
逐个光谱来改变LC/MS系统的配置是可能的。例如,所有偶数光谱能在一种模式采集,而所有奇数交织光谱能采用配置成在不同模式操作的MS来采集。示范的双模式采集操作能用于与LC/MSE交替的LC/MS,其中,在一种模式(LC/MS)中采集未碎裂离子,而在第二模式(LC/MSE)中,采集在第一模式中所采集的未碎裂离子的碎片。通过当离子穿过碰撞室时施加到离子的电压等级来区分这些模式。在第一模式中,电压低,而在第二模式中,电压升高。(Bateman等人。)
在这种系统中,在一种模式中系统所采集的碎片或离子以具有与未修改离子相同的保留时间的色谱图形呈现。这是因为未碎裂和碎裂离子共有相同分子种类,因此分子的洗脱图形依据从该分子衍生的所有未碎裂和碎裂离子打印。这些洗脱图形实质上是时间对齐的,因为与色谱峰的峰宽度或FWHM相比,在线MS中的模式之间的切换所需的额外时间很短。例如,MS中分子的渡越时间(transittime)通常大约为数毫秒或数微秒,而色谱峰的宽度通常大约为数秒或数分钟。因此,具体来说,未碎裂和碎裂离子的保留时间实质上相同。此外,相应峰的FWHM将会相同,并且相应峰的色谱图形也将会实质上相同。
在两种操作模式中采集的光谱能分为两个独立数据矩阵。以上所述的卷积、顶点检测、参数估计和阈值的操作能独立地应用于两者。虽然这种分析产生离子的两个列表,但是呈现在列表中的离子具有相互之间的关系。例如,呈现在与一种操作模式对应的离子的列表中的具有高强度的强离子可在根据另一种操作模式所采集的修改离子的列表中具有对应物。在这种情况下,离子通常将具有共同保留时间。为了将这类相关离子相互关联以便进行分析,如上所述限制保留时间的窗口能应用于两个数据矩阵中存在的离子。应用这种窗口的结果是识别两个列表中具有共同保留时间并因此可能被相关的离子。
即使这些相关离子的保留时间相同,检测器噪声的影响也会使这些离子的保留时间的测量值略有不同。这种差别是统计误差的表现,并测量离子的保留时间的测量的精度。在本发明中,离子的估计保留时间的差将小于色谱峰宽度的FWHM。例如,如果峰的FWHM为30秒,则离子之间的保留时间的变化对于低强度峰将小于15秒,而对于高强度峰将小于1.5秒。在这个示例中,用于采集相同分子的离子(以及拒绝不相关离子)的窗口宽度能大到+/-15秒或者小到+/-1.5秒。
图23是示出在本发明的一个实施例所生成的未修改和已修改离子列表中能如何识别相关离子的曲线图。数据矩阵2302示出在从未修改MS实验产生的光谱中检测的三个前体离子2304、2306和2308。数据矩阵2310示出在修改MS(例如如上所述以引起碎裂)之后从实验中产生的八个离子。数据矩阵2302中与数据矩阵2310中的离子相关的离子在由标记为t0、t1和t2的三条垂直线所示的相同保留时间呈现。例如,数据矩阵2310中的离子2308a和2308b与数据矩阵2302中的离子2308相关。数据矩阵2310中的离子2306a、2306b和2306c与数据矩阵2302中的离子2306相关。数据矩阵2310中的离子2304a、2304b和2304c与数据矩阵2302中的离子2304相关。这些关系能通过具有分别以时间t0、t1和t2为中心的适当宽度的保留时间窗口来识别。
离子参数列表能用于各种分析。这样一种分析涉及指纹识别或映射。存在整体完善表征的、具有基本上相同组成的并且其成分以相同的相对量存在的混合物的许多示例。生物示例包括新陈代谢的最终产物,例如尿、脑脊髓液和眼泪。其它示例是组织和血液中存在的细胞群体的蛋白质含量。其它示例是组织和血液中存在的细胞群体的蛋白质含量的酶解液。这些解液包含能由双模式LC/MS和LC/MSE进行分析的混合肽。工业示例包括汽油或石油的香气、香味、味道、燃料分析。环境示例包括杀虫剂、燃料和除草剂以及水和土壤的污染。
来自预计在这些液体中所观测到的异常包括在由药物或药物物质的摄取或注射而产生的新陈代谢的产物的情况下的外源物;新陈代谢液体中滥用的药物的证据;产品中的掺杂物,例如汁液、味道和香味;或者在燃料分析中。根据本发明的实施例所产生的离子参数列表能用作对本领域已知的方法的输入以用于指纹或多元分析。例如SIMCA(瑞典的Umetrics)或Pirouette(美国华盛顿Woodenville地区的Infometrix)等软件分析包能配置成通过识别样本群体之间的离子的变化,使用指纹或多元技术来检测这类异常。这些分析能确定混合物中的实体的正常分布,然后识别偏离标准的那些样本。
化合物的合成可产生预期化合物以及额外的分子实体。这些额外的分子实体表征合成路线的特征。离子参数列表有效地成为能用于表征化合物合成的合成路线的特征的指纹。
本发明可适用的另一个重要应用是生物标志发现。其浓度的变化与病情或者与药物作用唯一相关的分子的发现是检测疾病或者处理药物发现的基础。生物标志分子能出现于细胞群体或者新陈代谢产物或者例如血液和血浆等液体中。使用众所周知的方法对为控制和疾病或用药状态所产生的离子参数列表的比较能用于识别作为疾病或者药物作用的标志的分子。
N维数据和LC/IMS/MS
本发明的一些实施例涉及比从LC/MS仪器所得到的更高维的数据。这些实施例的一部分涉及LC/IMS/MS仪器。虽然以下描述主要针对LC/IMS/MS数据,但是,本领域的技术人员会理解,本文所述的原理对于提供三维和更高维数据的各种仪器具有广泛的适用性。
这些实施例的一部分包括LC模块、IMS模块和TOF-MS模块。在授予Bateman等人的美国专利公布2003/01084(2003年1月2日公布)中描述了用以适当地实现本发明的一些实施例的这种仪器的示例。
首先,对于本发明的一些方面的更广义上下文,描述不同维数的数据采集。对于例如仅LC或者仅MS仪器中存在的单通道检测器,一维数据通常在二维图中显示。随后必须定位图中的所有峰。
在LC的情况下,典型检测器实现紫外光/可见光(UV/Vis)吸收率检测。峰参数是峰从柱中洗脱时峰的保留时间和吸收率。
在例如采用基于四极或基于TOF的MS来执行的MS的情况下,电磁力用于分离不同m/z比的离子,以及检测器提供作为m/z比的函数的离子强度值。需要例程来定位强度相对m/z数据的二维图中的峰。在组合的LC/MS中,峰必须被定位,即在以三维(离子强度相对保留时间和m/z)绘制的数据中与伪像区分开。
下面进行描述,在一些LC/IMS/MS相关的实施例中,三个分离相关的维与离子-强度值关联。分离的三个维-液相色谱分析、之后是离子迁移率、之后是质量光谱分析-测量离子的三种对应性质:保留时间、离子迁移率和质荷比。MS模块以离子与其峰关联的m/z值来定位离子。峰与例如通过微通道板所测量的离子峰的离子计数的综合数量关联。
表3提供本发明的一些实施例所提供的不同维数的数据的的总结。第一列列出一些特定分析技术以及对于具有与N次分离关联的N维数据的任何技术的更一般引用。N可选地等于三或者更大。第二列列出根据本发明的一些实施例用来减少伪像并且帮助区分重叠峰的卷积滤波器的维数。在一些优选实现中,卷积滤波器的维数匹配分离的次数。
为了进行定义,如果选取将离子强度当作除了分离的维之外的数据维,则数据可选地称作具有比分离维数大一的维。
在卷积之后,在卷积数据中定位与局部最大值关联的峰。例如,将三维空间中的局部最大值适当地定义为具有比其所有相邻数据点更大的值的数据点(本文中又称作数据元素)。例如,三维分离空间中的元素具有3×3×3-1=26个相邻元素。因此,定位局部最大值一般需要将中心元素与26个相邻元素进行比较。
表3的第三列列出确立某个点是局部最大值所进行的比较的次数。其余列列出分离维。局部最大值识别峰的顶点。各顶点对应于离子。本详细描述的其余部分将集中于LC/IMS/MS以及更大的分离维。表3
图24是根据本发明的一个说明性实施例的LC/IMS/MS分析的方法2400的流程图。方法2400包括从样本获得(2410)有噪声的原始数据。数据包括三维数据元素的集合,它们各将离子计数强度与保留时间维、离子迁移率维和质荷比维关联。方法2400还包括:在离子迁移率维收缩(2420)数据元素集合以获得收缩数据元素集合,该收缩数据元素集合的每个将组合的离子计数强度与保留时间和质荷比维关联;以及将收缩数据元素集合与例如关联二维矩阵的伪像减少滤波器进行卷积(2430)。方法2400还包括:在保留时间和质荷比维定位(2440)数据元素的卷积集合的离子峰;以及响应已定位离子峰而选择(2450)有噪声的原始数据的一个或多个部分进行进一步分析。方法2400还包括:将有噪声的原始数据的所选部分与例如关联三维矩阵的伪像减少滤波器进行卷积(2460);以及在保留时间、离子迁移率和质荷比维定位(2470)卷积原始数据中的离子峰。
响应收缩数据元素的卷积集合的已定位(2440)离子峰而选择为进一步分析所选择(2450)的原始数据一个或多个部分。数据元素的卷积收缩集合的离子峰在保留时间和质荷比维的位置指示原始数据中在保留时间和质荷比维的受关注位置。
因此,选择用于进一步分析的部分适当地包括原始数据的完全离子迁移率维,但是仅包括原始数据的保留时间和质荷比维的限制区域。这些限制区域包括由数据元素的卷积收缩集合所指示的位置。原始数据的部分则被选择为例如实质上以已定位的离子峰为中心。因此,避免了不包含有意义数据或受关注数据的数据空间的部分的无效分析。此外,所选部分的大小可选地响应观测的或者预定的峰宽度来选取。优选地,在各维中,所选部分的大小比那个维中的峰宽度要大。
如上所述,卷积(2460)需要原始数据的三维卷积。对于峰信息确定,可选地通过在三个维(保留时间、离子迁移率和离子m/z)的搜索来定位(2440)局部最大值;局部最大值的位置将三个分离相关的离子性质-保留时间、迁移率和m/z-与离子的强度(对应于经由MS所检测的离子的数量)关联。如果卷积滤波器经过适当归一化,则峰顶点的值提供对于整个离子峰的综合离子强度。
随后参照表4,方法2400利用三个不同维中的原始数据的不同解析度等级(m/z中的较高解析度、离子迁移率中的较差解析度以及保留时间中的中间解析度)。表4示出解析度的这些差别。对于三个维,表4列出典型测量范围、取样周期、元素数量(即通过取样周期划分的范围)、峰的半最大值的全宽度(按照时间)、峰的半最大值全宽度(按照数据点元素)以及解析度(按照可解析峰的数量)。
表4
分离维 | 范围 | 取样周期 | 数组元素的数量 | 峰FWHM | 峰FWHM | 解析度 |
m/z | 75μsec | 0.5ns | 150000 | 4ns | 8elem. | 18000 |
保留 | 100min | 4sec | 1500 | 30sec | 7.5elem | 200 |
迁移率 | 20ms | 0.1ms | 200 | 0.7ms | 7elem | 30 |
18000的MS解析度对应于强度的150000个通道,其中峰宽度(FWHM)为8个通道。第二最高解析度是色谱维,其中具有100分钟分离和30秒的峰宽度(对应于7.5次扫描)。最低解析度由离子迁移率给出。假定7个元素的FWHM的所示示例,IMS解析度对于200通道光谱为30个峰。这个理想化示例忽略了峰宽度随质量和迁移率的典型变化。
更详细来说,方2400法可选地实现如下。来自各个扫描的原始数据组装到三维数据数组中,其中一个轴是与色谱保留时间对应的扫描集合的时间,第二轴对应于与迁移率漂移时间对应的扫描集合中的扫描数量,以及第三轴是与质荷比对应的通道数。三维卷积应用于三维数据数组。三个维中的局部最大值定位离子峰。如果卷积滤波器为以下目的经过归一化,则峰顶点的值提供第四离子性质,即对于峰整体综合强度。
三维卷积利用例如平滑或二阶导数滤波器或者这类滤波器的组合。可选地选取卷积滤波器的系数以使信噪比为最大、使统计误差性质为最小、去除基线背景、和/或减轻离子干扰的影响。为了更有效地进行计算,如方法2400的以上描述所示,三维卷积可选地应用于原始数据的子体积(sub-volume)。响应LC/MS数据而选择子体积。收缩(2420)的数据通过组合(例如相加)所有迁移率光谱来获得。可选地,死区时间(dead-time)校正和锁定质量校正结合到方法2400中,如对于各维的自动峰宽度计算那样。
方法2400可扩展到产生N维分离相关的数据的N次依次分离。这类数据可选地组装为N维超立方体,以及N维卷积应用于超立方体中的所有点。例如通过将点的强度与以N维空间中的各元素为中心的3N个相邻元素进行比较,来找出局部最大值。内插公式定位各峰的N维参数,并且N维峰顶点处的值是说明在N维分离之后与峰关联的所有计数或信号的峰的强度。
方法2400可选地应用于质心数据(centroid data)。在质心方式中,扫描集合中对于扫描所记录的唯一信息是峰信息,其中各峰通过质量和强度来描述。采用其宽度对应于质量光谱解析度的高斯峰来取代各质量-强度对,例如,从峰列表来重构各光谱的连续体表示。重构的连续体光谱组装到立方体中并且被分析。
如上所述,由于效率原因,可选地选取不将三维卷积滤波器应用于原始数据的整个体积(volume);操纵数据所需的运算数随维数的幂而增加。使用当前可用的处理设备,应用于单个基于LC/IMS/MS的系统注入中得到的所有数据的一般三维卷积将需要例如数天计算时间。方法2400可能将计算时间减少至例如不到1个小时,同时提供可与从完整三维卷积所得到的结果相比的结果。可选地,通过采用依次应用于从数据所提取的线性数组的一维滤波器来近似二维和三维卷积滤波器,来获得附加的计算效率。
下面是对基于LC/IMS/MS的系统的数据计算的示例。离子强度以三维体积来组织,其中各数据元素是作为计数(C)所测量的强度,以及各元素由对应于保留时间(T)、迁移率(D)和质荷比μ的三个变量作为下标。在数学上,这个三维数据的各元素由三个下标来标记。化学工作者一般将这种数据称作“四维”数据,因此将强度看作是数据的额外的维。在这个示例中,用于各数据元素的符号是Ci,j,k,其中C是由整数下标i,j,k所指定的数据元素处测量的计数。这些下标对应于扫描数(保留时间Ti)、扫描集合数(迁移率Dj)和通道数(质荷比μk)。因此得到
Ci,j,k=C(Ti,Dj,μk)
在这个示例中,LC/IMS/MS系统中的离子的响应近似为三维中的高斯峰,其中各离子产生横跨地分布于特性峰宽度的计数。
三个方向的每个的峰的宽度是分离的模式的性质。标准偏差峰宽度是色谱、迁移率和质量光谱方向的σT、σD、σμ。计数在数据元素上分布为
式中,CV是综合体积计数,以及i,j,k下标分别对应于色谱扫描时间、迁移率扫描时间和质荷通道。高斯峰以i0、j0和k0(其承担分数值)为中心。顶点计数速率与综合体积计数速率之间的关系为
为了检测这类数据中的离子以及测量它们的性质、即从数组Ci,j,k推断i0、j0、k0和CV,在这个示例中,使用卷积滤波器来估计这些参数。卷积数据的局部最大值定位离子并且估计其强度。
给定滤波器系数的集合Fl,m,n,三维卷积的输出是三维体积,表示为
式中,Ri,j,k作为卷积元素。
滤波器系数Fl,m,n跨越三维体积,其中各维的宽度与各维中的峰的宽度关联。F的下标是围绕0对称的,并且各维中的元素的数量是(2L+1)、(2M+1)和(2N+1)。
在这个示例中,将Fl,m,n的宽度调整为匹配对于MS和IMS维的变化峰宽度。各输出值Ri,j,k的计算需要与滤波器系数同样多的乘法。
如卷积表达式所示,通过将系数Fl,m,n以元素Ci,j,k为中心,并执行所示乘法和加法,来获得Ri,j,k的值。一般来说,存在与输入值Ci,j,k同样多的输出值Ri,j,k。
在三维应用中,如果Ri,j,k的值超过它的所有相邻元素的值,则它是局部最大值。也就是说,如果Ri,j,k是在(3×3×3=27)元素立方体的中心,则Ri,j,k的值在其离子峰强度值超过它的26个最接近相邻元素时是最大值。归一化系数通过将未归一化滤波器与模型高斯峰进行卷积来获得;模型高斯峰的峰宽度对应于物理预计峰宽度。如果卷积最大值超过适当选择的阈值,则检测到离子。阈值检测的值设置为例如100计数或更小。
给定峰检测,例如通过对最大值附近的27个元素拟合三维二次曲线,得到它在三维中的顶点的位置。最大值的内插下标值给出峰的性质,产生与离子的保留时间、迁移率和质荷比对应的分数下标。一般来说,光谱未经过校准,因此质荷未经过校准。
卷积的运算数与所得强度的数量乘以滤波器系数的数量之积成比例。运算数随数据的维度的幂而增加。对基于LC/IMS/MS的系统的卷积方式则可选地必须应付可能很大的运算数。
如上所述,减少计算的运算数量的一种方式是将三维卷积滤波器实现为一系列一维卷积滤波器。作为近似,一维滤波器的多次应用实现二维或三维滤波器矩阵,如以上参照图1-23所述。例如,21×21元素二维卷积矩阵用四个一维卷积来取代,在光谱方向两个以及在保留时间维两个。在三维卷积的情况下,21×21×21三维卷积滤波器用九个一维卷积来取代,各维中三个一维卷积。这种方式将计算时间例如在二维情况中减少6的因子以及在三维情况中减少48的因子。
如上所述,无需计算所有原始数据点的卷积元素以提供离子检测。优选地,仅计算Ri,j,k的足够的值来定位各离子的局部最大值。最大数是例如各离子的3×3×3Ri,j,k值的立方体。如果那个立方体中心的Ri,j,k的值大于周围所有26个值,则找到局部最大值。因此,原则上,在一个说明性示例中,如果存在要查找的100000个离子,则仅需要大约3000000个元素或者少于可能的卷积元素的4.5×1010总数的0.01%。这些关键卷积值的计算可选地需要几秒钟。实际上,计算比这个最小值更多的元素。因此,在一些实施例中,本发明利用以下认识:IMS模块加入LC/MS系统可选地极大增加测量数据点的数量,其中大部分不提供所需信息。
在这个示例中,通过从三维LC/IMS/MS数据构造二维LC/MS数据矩阵,在离子迁移率维中收缩原始数据。通过对于来自在相同色谱扫描时间和质量光谱通道测量的所有迁移率的强度求和,获得二维LC/MS矩阵的元素如下所示,
如上所述,优选地在迁移率维上求和,因为这个维具有最低解析度或峰容量;所得T×μ二维数组则具有比另外可能的两对维更多的解析元素。
二维卷积应用于这个收缩数组以确定卷积元素的数组,其中
本示例利用以下假设:所有离子通过这些二维离子峰(由于相似离子迁移率,它们可由多于一个离子产生)来说明。因此,二维卷积的结果指明应用三维卷积的位置,以及每个二维离子峰将对应于一个或多个三维离子。如果对于特定二维离子峰不存在离子干扰,则对应三维体积将产生单个离子检测,其位置在离子迁移率维中。
对于每个二维离子峰位置确定,计算三维卷积元素的集合。在本示例中,对于每个已定位峰,这些元素跨越以二维峰位置的保留时间和m/z为中心的三维体积,并且跨越所有200个迁移率光谱。
因此,三维数据提供离子的迁移率特性,同时保留时间、m/z和/或强度信息已经通过卷积二维数据来提供,或者优选地,也通过原始三维数据来精确地提供。因此,计算三维卷积元素的有限选择是足够的。
为了适应在卷积二维数据中定位的、可能包括其顶点分布于已定位峰的宽度的多个离子的峰,可选地采用以下方案。对于以每个二维离子检测为中心的11个保留时间元素乘以11个质荷元素乘以200个离子迁移率元素的体积来计算卷积元素。对于这个示例,假定每秒2亿次计算运算,大约38分钟处理时间为LC/IMS/MS系统中的单个样本注入中的所有离子提供保留时间、离子迁移率、质荷比和离子强度。减少对其计算三维卷积元素的体积还将计算时间减少(例如另一个20的因子)到易处理等级。
为了说明和描述,陈述了本发明的优选实施例的上述公开。所述的确切形式不是旨在对本发明的穷举或者限制。根据以上公开,本领域的技术人员清楚地知道本文所述实施例的许多变更和修改。本发明的范围仅由本文所附的权利要求及其等效物来定义。
此外,在描述本发明的代表实施例时,说明书可能将本发明的方法和/或过程陈述为步骤的特定次序。但是,在方法或过程不依赖于本文所述步骤的特定顺序的意义上,方法或过程不应当局限于所述步骤的特定次序。本领域的技术人员会理解,步骤的其它次序可以是可能的。因此,说明书中所述的步骤的特定顺序不应当被理解为对权利要求的限制。另外,针对本发明的方法和/或过程的权利要求不应当局限于其步骤按照编写顺序来执行,本领域的技术人员能够易于理解,次序可改变并仍然保持在本发明的精神和范围之内。
Claims (22)
1.一种LC/IMS/MS分析的方法,包括:
从样本获得包括三维数据元素的集合的有噪声的原始数据,所述三维数据元素各将离子计数强度与保留时间维、离子迁移率维和质荷比维关联,其中所述噪声与离子峰伪像关联;
在所述离子迁移率维中收缩所述数据元素的集合以获得收缩的数据元素的集合,所述收缩的数据元素各将组合的离子计数强度与所述保留时间维和质荷比维关联;
将所述收缩的数据元素的集合与关联二维矩阵的伪像减少滤波器进行卷积,由此获得具有减少的峰伪像的收缩的数据元素的卷积集合;
在所述保留时间维和质荷比维定位所述收缩的数据元素的卷积集合的离子峰;
响应所述收缩的数据元素的卷积集合的所定位的离子峰而选择所述有噪声的原始数据的一个或多个部分以用于进一步分析;
将所述有噪声的原始数据的所选择的一个或多个部分与关联三维矩阵的伪像减少滤波器进行卷积;以及
在所述离子迁移率维中对所述原始数据的各卷积部分定位一个或多个离子峰。
2.如权利要求1所述的方法,其中,对所述原始数据的各卷积部分定位所述一个或多个离子峰还包括在所述保留时间维和质荷比维中定位所述原始数据的所述卷积部分的所述一个或多个离子峰。
3.如权利要求2所述的方法,还包括:对于已定位的离子峰,将所述原始数据的所述卷积部分的所述保留时间维和质荷比维与所述收缩的数据元素的卷积集合的所述保留时间维和质荷比维进行比较。
4.如权利要求1所述的方法,其中,对所述原始数据的各卷积部分定位所述一个或多个离子峰包括在所述离子迁移率维中定位在所述保留时间维和质荷比维中重叠的至少两个离子峰。
5.如权利要求1所述的方法,还包括:在所述保留时间维和质荷比维中定位所述原始数据的所述卷积的一个或多个部分的重叠离子峰。
6.如权利要求1所述的方法,其中,所述一个或多个部分各由所述有噪声的原始数据的所述保留时间维和质荷比维中的限制范围以及所述离子迁移率维中的非限制范围组成。
7.如权利要求6所述的方法,其中,各部分的所述限制范围实质上以关联的已定位的离子峰为中心。
8.如权利要求1所述的方法,其中,定位离子峰包括确定所卷积的原始数据的局部离子强度最大值。
9.如权利要求1所述的方法,还包括:对所定位的一个或多个离子峰的至少一个拟合曲线以改进所述至少一个峰的至少所述质荷比维中的位置的精度。
10.如权利要求9所述的方法,其中,拟合曲线包括对关联局部最大值的三个最大离子强度值拟合曲线。
11.如权利要求10所述的方法,其中,所述曲线基于二次方程式。
12.如权利要求1所述的方法,还包括:对所定位的一个或多个离子峰的至少一个拟合曲线以改进所述至少一个峰的至少所述离子迁移率维中的位置的精度。
13.如权利要求1所述的方法,还包括:对所定位的一个或多个离子峰的至少一个拟合曲线以改进所述至少一个峰的至少所述保留时间维中的位置的精度。
14.如权利要求1所述的方法,还包括:将所述三维矩阵的元素归一化,使得所述一个或多个已定位的峰的高度与总的峰离子计数关联。
15.一种用于分析样本的方法,包括:
从所述样本获得有噪声的原始数据,所述数据包括数据元素的集合,所述数据元素各将离子计数强度与不同解析度的至少三个维关联,其中所述噪声与离子峰伪像关联;
至少在具有最低解析度的维中收缩所述数据元素的集合以获得
收缩的数据元素的集合,所述收缩的数据元素各将组合的离子计数强
度与所述至少三个维的其余维关联;
将所述收缩的数据元素的集合与伪像减少滤波器进行卷积,所述
滤波器关联具有与所述收缩的数据元素相同数量的维的矩阵,由此获
得具有减少的峰伪像的收缩的数据元素的卷积集合;
在所述至少三个维的其余维中定位所述收缩的数据元素的卷积集合的离子峰;
选择所述有噪声的原始数据的一个或多个部分以用于进一步分析,所述一个或多个部分与所述收缩的数据元素的卷积集合的离子峰的位置关联;
将所述有噪声的原始数据的所选择的一个或多个部分与伪像减
少滤波器进行卷积,所述伪像减少滤波器关联具有与所述有噪声的原
始数据相同数量的维的矩阵;以及
在所述最低解析度维中对所述有噪声的原始数据的所卷积的所选择的一个或多个部分的每个定位一个或多个离子峰。
16.如权利要求15所述的方法,其中,对所述部分的每个定位所述一个或多个离子峰还包括在所述保留时间维和质荷比维中定位所述部分的每个中的所述一个或多个离子峰。
17.一种用于化学处理的设备,包括:
色谱分析模块;
离子迁移率模块;
质量光谱分析模块;以及
控制单元,与所述模块进行通信,包括至少一个处理器以及用于存储多个指令的至少一个存储器,所述多个指令在由所述至少一个处理器运行时引起以下步骤的实现
从样本获得包括三维数据元素的集合的有噪声的原始数据,所述三维数据元素各将离子计数强度与保留时间维、离子迁移率维和质荷比维关联,其中所述噪声与离子峰伪像关联;
在所述离子迁移率维中收缩所述数据元素的集合以获得收缩的数据元素的集合,所述收缩的数据元素各将组合的离子计数强度与所述保留时间维和质荷比维关联;
将所述收缩的数据元素的集合与关联二维矩阵的伪像减少滤波器进行卷积,由此获得具有减少的峰伪像的收缩的数据元素的卷积集合;
在所述保留时间维和质荷比维中定位所述收缩的数据元素的卷积集合的离子峰;
响应所述收缩的数据元素的卷积集合的所定位的离子峰而选择所述有噪声的原始数据的一个或多个部分以用于进一步分析;
将所述有噪声的原始数据的所选择的一个或多个部分与关联三维矩阵的伪像减少滤波器进行卷积;以及
在所述离子迁移率维中对所述原始数据的每个卷积的所选择的一个或多个部分定位一个或多个离子峰。
18.一种设备,包括:
分析模块,配置成从样本获得有噪声的原始数据,所述数据包括数据元素的集合,所述数据元素各将离子计数强度与不同解析度的至少三个维关联,其中所述噪声与离子峰伪像关联;
用于至少在具有最低解析度的维中收缩所述数据元素的集合以获得收缩的数据元素的减少的集合的部件,所述收缩的数据元素各将组合的离子计数强度与所述至少三个维的其余维关联;
用于将所述收缩的数据元素的集合与伪像减少滤波器进行卷积的部件,所述滤波器关联具有与所述收缩的数据元素相同数量的维的矩阵,由此获得具有减少的峰伪像的收缩的数据元素的卷积集合;
用于在所述至少三个维的其余维中定位所述收缩的数据元素的卷积集合的离子峰的部件;
用于选择所述有噪声的原始数据的一个或多个部分以用于进一步分析的部件,所述一个或多个部分与所述收缩的数据元素的卷积集合的离子峰的位置关联;
用于将所述有噪声的原始数据的所选择的一个或多个部分与伪像减少滤波器进行卷积的部件,所述伪像减少滤波器关联具有与所述有噪声的原始数据相同数量的维的矩阵;以及
用于在最低解析度维中对所述有噪声的原始数据的所卷积的所选择的一个或多个部分的每个定位一个或多个离子峰的部件。
19.一种LC/IMS/MS分析的方法,包括:
从样本获得有噪声的原始数据,所述数据包括三维数据元素的集合,所述三维数据元素各将离子计数强度与保留时间维、离子迁移率维和质荷比维关联,其中所述噪声与离子峰伪像关联;
将所述三维数据元素与伪像减少滤波器进行卷积,所述滤波器与三维矩阵关联,由此获得具有减少的离子峰伪像的数据元素的卷积集合;以及
在所述保留时间维、离子迁移率维和质荷比维定位所卷积的三维数据元素的一个或多个离子峰。
20.如权利要求19所述的方法,其中,定位包括将离子峰与所述所卷积的三维数据元素中的离子强度的局部最大值关联。
21.如权利要求19所述的方法,其中,至少两个已定位的峰在所述保留时间维或质荷比维中重叠。
22.如权利要求19所述的方法,其中,至少两个已定位的峰具有实质上相同的离子迁移率。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US80890106P | 2006-05-26 | 2006-05-26 | |
US60/808,901 | 2006-05-26 | ||
PCT/US2007/069784 WO2007140327A2 (en) | 2006-05-26 | 2007-05-25 | Ion detection and parameter estimation for n-dimensional data |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101534933A CN101534933A (zh) | 2009-09-16 |
CN101534933B true CN101534933B (zh) | 2013-03-27 |
Family
ID=38779384
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2007800279145A Active CN101534933B (zh) | 2006-05-26 | 2007-05-25 | 关于n维数据的离子检测和参数估计 |
Country Status (6)
Country | Link |
---|---|
US (3) | US8178834B2 (zh) |
EP (1) | EP2024064B1 (zh) |
JP (1) | JP5542433B2 (zh) |
CN (1) | CN101534933B (zh) |
HK (1) | HK1135058A1 (zh) |
WO (1) | WO2007140327A2 (zh) |
Families Citing this family (68)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020115056A1 (en) * | 2000-12-26 | 2002-08-22 | Goodlett David R. | Rapid and quantitative proteome analysis and related methods |
GB0305796D0 (en) | 2002-07-24 | 2003-04-16 | Micromass Ltd | Method of mass spectrometry and a mass spectrometer |
WO2005079263A2 (en) * | 2004-02-13 | 2005-09-01 | Waters Investments Limited | Apparatus and method for identifying peaks in liquid chromatography/mass spectrometry data and for forming spectra and chromatograms |
CN101534933B (zh) * | 2006-05-26 | 2013-03-27 | 沃特世科技公司 | 关于n维数据的离子检测和参数估计 |
JP4614002B2 (ja) * | 2006-06-08 | 2011-01-19 | 株式会社島津製作所 | クロマトグラフ質量分析用データ処理装置 |
US7501621B2 (en) * | 2006-07-12 | 2009-03-10 | Leco Corporation | Data acquisition system for a spectrometer using an adaptive threshold |
US8067731B2 (en) * | 2008-03-08 | 2011-11-29 | Scott Technologies, Inc. | Chemical detection method and system |
EP2279260B1 (en) * | 2008-05-29 | 2021-07-21 | Waters Technologies Corporation | Techniques for performing retention-time matching of precursor and product ions and for constructing precursor and product ion spectra |
JP4973628B2 (ja) * | 2008-08-29 | 2012-07-11 | 株式会社島津製作所 | クロマトグラフ質量分析データ解析方法及び装置 |
DE102008046139B4 (de) * | 2008-09-05 | 2024-03-28 | Thermo Fisher Scientific (Bremen) Gmbh | Verfahren zur quantitativen Bestimmung einer Substanz durch Massenspektrometrie |
GB0909289D0 (en) * | 2009-05-29 | 2009-07-15 | Micromass Ltd | Method of processing mass spectral data |
DE102009035587B3 (de) * | 2009-07-31 | 2011-03-24 | Siemens Aktiengesellschaft | Verfahren zur Filterung eines Chromatogramms |
WO2011041656A2 (en) * | 2009-10-02 | 2011-04-07 | Metabolon Inc. | Apparatus and associated method for analyzing small molecule components in a complex mixture |
EP2494516A4 (en) * | 2009-10-29 | 2016-02-17 | Optimark L L C | DIGITAL WATERMARK MARKING |
CN102109491B (zh) * | 2009-12-24 | 2013-03-27 | 同方威视技术股份有限公司 | 离子迁移谱检测仪的基于离子图序列的物质识别方法 |
US8921773B2 (en) | 2010-01-20 | 2014-12-30 | Waters Technologies Corporation | Techniques for efficient fragmentation of peptides |
GB201002447D0 (en) * | 2010-02-12 | 2010-03-31 | Micromass Ltd | Mass spectrometer |
US8706426B2 (en) * | 2010-04-16 | 2014-04-22 | University Of Central Florida Research Foundation, Inc. | Systems and methods for identifying classes of substances |
WO2011155984A1 (en) * | 2010-06-11 | 2011-12-15 | Waters Technologies Corporation | Techniques for mass spectrometry peak list computation using parallel processing |
GB2485187A (en) * | 2010-11-04 | 2012-05-09 | Agilent Technologies Inc | Displaying chromatography data |
GB201100301D0 (en) * | 2011-01-10 | 2011-02-23 | Micromass Ltd | Method of processing multidmensional mass spectrometry data |
JP5556695B2 (ja) * | 2011-02-16 | 2014-07-23 | 株式会社島津製作所 | 質量分析データ処理方法及び該方法を用いた質量分析装置 |
WO2012125548A2 (en) * | 2011-03-11 | 2012-09-20 | Leco Corporation | Systems and methods to process data in chromatographic systems |
US9812306B2 (en) | 2011-08-17 | 2017-11-07 | Smiths Detection Inc. | Shift correction for spectral analysis |
US9810669B2 (en) | 2011-11-28 | 2017-11-07 | Waters Technologies Corporation | Techniques for quantification of samples |
CN104168812B (zh) | 2012-03-07 | 2016-08-24 | 奥林巴斯株式会社 | 光学测量装置以及光纤束的关联方法 |
WO2013134771A1 (en) * | 2012-03-09 | 2013-09-12 | Torion Technologies, Inc. | Deconvolution and identification algorithms for use on spectroscopic data |
GB201205009D0 (en) | 2012-03-22 | 2012-05-09 | Micromass Ltd | Multi-dimensional survey scans for improved data dependent acquisitions (DDA) |
US9653271B2 (en) | 2012-06-07 | 2017-05-16 | Waters Technologies Corporation | Methods and apparatus for performing mass spectrometry |
EP2741224A1 (en) * | 2012-11-20 | 2014-06-11 | Thermo Finnigan LLC | Methods for generating local mass spectral libraries for interpreting multiplexed mass spectra |
US10860526B2 (en) * | 2012-12-01 | 2020-12-08 | The Regents Of The University Of California | System and method of managing large data files |
JP5997650B2 (ja) | 2013-04-15 | 2016-09-28 | 株式会社日立ハイテクノロジーズ | 分析システム |
JP6495905B2 (ja) * | 2013-08-09 | 2019-04-03 | ディーエイチ テクノロジーズ デベロップメント プライベート リミテッド | Tofデータ取得のための強度補正 |
JP6065983B2 (ja) * | 2013-09-04 | 2017-01-25 | 株式会社島津製作所 | クロマトグラフ質量分析用データ処理装置 |
US9143162B2 (en) | 2013-11-05 | 2015-09-22 | Waters Technologies Corporation | Techniques for compressing mass spectrometry data in real-time |
US9892895B2 (en) * | 2014-05-30 | 2018-02-13 | Metabolon, Inc. | Method for analyzing small molecule components of a complex mixture in a multi-sample process, and associated apparatus and computer program product |
WO2015191390A1 (en) * | 2014-06-09 | 2015-12-17 | Water Technologies Corporation | Method to remove ion interferences |
WO2015191993A1 (en) * | 2014-06-13 | 2015-12-17 | Waters Technologies Corporation | System and method for enhancing charge-state determination in electrospray mass spectrometry |
WO2015191999A1 (en) * | 2014-06-13 | 2015-12-17 | Waters Technologies Corporation | Analysis of complex biological matrices through targeting and advanced precursor and product ion alignment |
WO2015191980A1 (en) * | 2014-06-13 | 2015-12-17 | Waters Technologies Corporation | Intelligent target-based acquisition |
US10041907B2 (en) * | 2014-09-26 | 2018-08-07 | Micromass Uk Limited | Accurate mobility chromatograms |
CN105572212B (zh) * | 2014-10-14 | 2018-12-07 | 中国科学院大连化学物理研究所 | 一种基于可视化质谱信息的生晒参和红参快速识别方法 |
CN105574474B (zh) * | 2014-10-14 | 2019-03-12 | 中国科学院大连化学物理研究所 | 一种基于质谱信息的生物特征图像识别方法 |
CN105844328B (zh) * | 2015-01-15 | 2021-03-02 | 开利公司 | 用于自动试运行人员计数系统的方法和系统 |
GB201509209D0 (en) | 2015-05-28 | 2015-07-15 | Micromass Ltd | Echo cancellation for time of flight analogue to digital converter |
GB2539871A (en) * | 2015-05-29 | 2017-01-04 | Micromass Ltd | A method of mass spectrometry |
US11321425B2 (en) * | 2016-04-27 | 2022-05-03 | Shimadzu Corporation | Method and device for processing data |
CN109073615B (zh) * | 2016-05-02 | 2021-11-23 | 株式会社岛津制作所 | 数据处理装置 |
JP6637393B2 (ja) * | 2016-07-29 | 2020-01-29 | 日本電子株式会社 | 四重極型質量分析計及び質量分析方法 |
EP3545292B1 (en) * | 2016-11-23 | 2021-09-15 | Atonarp Inc. | System and method for determining set of mass to charge ratios for set of gases |
US9779922B1 (en) * | 2017-01-17 | 2017-10-03 | Advion Inc. | Generation of discovery ion currents and mass spectrometry and uses thereof |
CN106950315B (zh) * | 2017-04-17 | 2019-03-26 | 宁夏医科大学 | 基于uplc-qtof快速表征样品中化学成分的方法 |
WO2019116288A1 (en) | 2017-12-15 | 2019-06-20 | Metabolon, Inc. | Method for analyzing small molecule components of a complex mixture, and associated apparatus and computer program product |
CA3091796A1 (en) * | 2018-02-19 | 2019-08-22 | Cerno Bioscience Llc | Reliable and automatic mass spectral analysis |
CN108614064B (zh) * | 2018-04-10 | 2019-07-16 | 华南理工大学 | 一种二维色谱峰的检测方法及其应用 |
KR102157348B1 (ko) * | 2018-12-20 | 2020-09-18 | 한국과학기술연구원 | 모발시료 처리 및 이차이온질량분석을 이용한 모발증거물 감식방법 |
JP2020139789A (ja) * | 2019-02-27 | 2020-09-03 | 株式会社島津製作所 | 微生物分析用試料の調製方法、微生物の分析方法、微生物の識別方法および微生物分析用キット |
JP2022523564A (ja) | 2019-03-04 | 2022-04-25 | アイオーカレンツ, インコーポレイテッド | 機械学習を使用するデータ圧縮および通信 |
EP3977628A4 (en) * | 2019-05-31 | 2023-06-28 | DH Technologies Development Pte. Ltd. | Method for real time encoding of scanning swath data and probabilistic framework for precursor inference |
EP4010692A1 (en) * | 2019-08-08 | 2022-06-15 | F. Hoffmann-La Roche AG | Method and device for automatic peak integration |
CN111490752B (zh) * | 2020-04-22 | 2024-02-02 | 广西科技大学 | 一种用于数字滤波器求取光谱导数的方法 |
CN115605749A (zh) * | 2020-05-25 | 2023-01-13 | 株式会社岛津制作所(Jp) | 色谱质量分析数据处理方法、色谱质量分析装置及色谱质量分析数据处理用程序 |
WO2022003890A1 (ja) * | 2020-07-02 | 2022-01-06 | 株式会社島津製作所 | イメージング質量分析装置及びイメージング質量分析データ処理方法 |
JP7249980B2 (ja) | 2020-10-26 | 2023-03-31 | 日本電子株式会社 | マススペクトル処理装置及び方法 |
CN113138248B (zh) * | 2021-04-25 | 2022-08-02 | 贵州中烟工业有限责任公司 | 特征图谱提取方法及料液配制质量稳定性的检测方法 |
CN113960152B (zh) * | 2021-10-18 | 2023-06-06 | 北方工业大学 | 一种基于离子迁移谱的痕量爆炸物识别方法及系统 |
GB2617318A (en) * | 2022-03-30 | 2023-10-11 | Thermo Fisher Scient Bremen Gmbh | Analysis of time-of-flight mass spectra |
CN116257745B (zh) * | 2023-05-10 | 2023-08-15 | 杭州致成电子科技有限公司 | 一种负荷电流极端异常数据处理方法和装置 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5440119A (en) * | 1992-06-02 | 1995-08-08 | Labowsky; Michael J. | Method for eliminating noise and artifact peaks in the deconvolution of multiply charged mass spectra |
US6960761B2 (en) * | 1997-06-02 | 2005-11-01 | Advanced Research & Technology Institute | Instrument for separating ions in time as functions of preselected ion mobility and ion mass |
DE19803309C1 (de) * | 1998-01-29 | 1999-10-07 | Bruker Daltonik Gmbh | Massenspektrometrisches Verfahren zur genauen Massenbestimmung unbekannter Ionen |
JP2004536276A (ja) | 2000-11-16 | 2004-12-02 | シファーゲン バイオシステムズ, インコーポレイテッド | 質量スペクトルを分析する方法 |
US6787761B2 (en) * | 2000-11-27 | 2004-09-07 | Surromed, Inc. | Median filter for liquid chromatography-mass spectrometry data |
US6873915B2 (en) * | 2001-08-24 | 2005-03-29 | Surromed, Inc. | Peak selection in multidimensional data |
US6835927B2 (en) * | 2001-10-15 | 2004-12-28 | Surromed, Inc. | Mass spectrometric quantification of chemical mixture components |
AU2003262188A1 (en) * | 2002-04-12 | 2003-10-27 | Northeastern University | Matched filtration with experimental noise determination for denoising, peak picking and quantitation in lc-ms |
US6983213B2 (en) * | 2003-10-20 | 2006-01-03 | Cerno Bioscience Llc | Methods for operating mass spectrometry (MS) instrument systems |
US7684934B2 (en) | 2003-06-06 | 2010-03-23 | The United States Of America As Represented By The Department Of Health And Human Services | Pattern recognition of whole cell mass spectra |
WO2005079263A2 (en) * | 2004-02-13 | 2005-09-01 | Waters Investments Limited | Apparatus and method for identifying peaks in liquid chromatography/mass spectrometry data and for forming spectra and chromatograms |
JP4246662B2 (ja) * | 2004-04-15 | 2009-04-02 | 株式会社日立ハイテクノロジーズ | 飛行時間型質量分析装置および分析方法 |
US7075064B2 (en) * | 2004-05-24 | 2006-07-11 | Brigham Young University | System and method for extracting spectra from data produced by a spectrometer |
JP4513488B2 (ja) | 2004-10-06 | 2010-07-28 | 株式会社日立製作所 | イオンモビリティー分析装置及びイオンモビリティー分析方法 |
JP2006184275A (ja) | 2004-11-30 | 2006-07-13 | Jeol Ltd | 質量分析方法および質量分析装置 |
CN101534933B (zh) * | 2006-05-26 | 2013-03-27 | 沃特世科技公司 | 关于n维数据的离子检测和参数估计 |
-
2007
- 2007-05-25 CN CN2007800279145A patent/CN101534933B/zh active Active
- 2007-05-25 EP EP07784158.3A patent/EP2024064B1/en active Active
- 2007-05-25 WO PCT/US2007/069784 patent/WO2007140327A2/en active Application Filing
- 2007-05-25 US US12/301,301 patent/US8178834B2/en active Active
- 2007-05-25 JP JP2009512324A patent/JP5542433B2/ja not_active Expired - Fee Related
-
2010
- 2010-02-09 HK HK10101458.1A patent/HK1135058A1/xx not_active IP Right Cessation
-
2012
- 2012-04-13 US US13/446,043 patent/US8480110B2/en active Active
-
2013
- 2013-02-28 US US13/780,148 patent/US8766172B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US20120259557A1 (en) | 2012-10-11 |
HK1135058A1 (en) | 2010-05-28 |
US20140025342A1 (en) | 2014-01-23 |
EP2024064A4 (en) | 2012-01-04 |
US8766172B2 (en) | 2014-07-01 |
US8178834B2 (en) | 2012-05-15 |
JP2009539067A (ja) | 2009-11-12 |
US8480110B2 (en) | 2013-07-09 |
JP5542433B2 (ja) | 2014-07-09 |
CN101534933A (zh) | 2009-09-16 |
EP2024064B1 (en) | 2014-11-19 |
US20090294645A1 (en) | 2009-12-03 |
WO2007140327A3 (en) | 2008-04-10 |
EP2024064A2 (en) | 2009-02-18 |
WO2007140327A2 (en) | 2007-12-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101534933B (zh) | 关于n维数据的离子检测和参数估计 | |
US20220406584A1 (en) | Techniques for mass spectrometry peak list computation using parallel processing | |
US7645984B2 (en) | Apparatus and method for identifying peaks in liquid chromatography/mass spectrometry data and for forming spectra and chromatograms | |
US6906320B2 (en) | Mass spectrometry data analysis techniques | |
US7279679B2 (en) | Methods and systems for peak detection and quantitation | |
US9312110B2 (en) | System and method for grouping precursor and fragment ions using selected ion chromatograms | |
EP1958006B1 (en) | Discover biological features using composite images | |
CN104170052B (zh) | 用于改进的质谱分析法定量作用的方法和装置 | |
EP3844507B1 (en) | Identification and scoring of related compounds in complex samples | |
WO2012095647A2 (en) | Method of processing multidimensional mass spectrometry data | |
Kuikka | Detection and integration of chromatographic peaks using theoretical peak fitting | |
Delabrière | New approaches for processing and annotations of high-throughput metabolomic data obtained by mass spectrometry | |
Conrad | New statistical algorithms for the analysis of mass spectrometry time-of-flight mass data with applications in clinical diagnostics |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 1135058 Country of ref document: HK |
|
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: GR Ref document number: 1135058 Country of ref document: HK |