CN103718036A - 在色谱系统中处理数据的方法 - Google Patents

在色谱系统中处理数据的方法 Download PDF

Info

Publication number
CN103718036A
CN103718036A CN201280020570.6A CN201280020570A CN103718036A CN 103718036 A CN103718036 A CN 103718036A CN 201280020570 A CN201280020570 A CN 201280020570A CN 103718036 A CN103718036 A CN 103718036A
Authority
CN
China
Prior art keywords
factor
data
peak
methods according
submanifold
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201280020570.6A
Other languages
English (en)
Other versions
CN103718036B (zh
Inventor
王纪红
P·M·威利斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Leco Corp
Original Assignee
Leco Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Leco Corp filed Critical Leco Corp
Publication of CN103718036A publication Critical patent/CN103718036A/zh
Application granted granted Critical
Publication of CN103718036B publication Critical patent/CN103718036B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8624Detection of slopes or peaks; baseline correction
    • G01N30/8644Data segmentation, e.g. time windows
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8675Evaluation, i.e. decoding of the signal into analytical information
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01JELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
    • H01J49/00Particle spectrometers or separator tubes
    • H01J49/0027Methods for using particle spectrometers
    • H01J49/0036Step by step routines describing the handling of the data generated during a measurement
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/62Detectors specially adapted therefor
    • G01N30/72Mass spectrometers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8696Details of Software
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching
    • G06F2218/14Classification; Matching by matching peak patterns

Landscapes

  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Engineering & Computer Science (AREA)
  • Library & Information Science (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

描述了一种用于处理色谱质谱分析系统中的数据的方法,所述数据表示由强度、质量值和保留时间构成的离子峰。在实施方式中,该方法包括预先处理所述数据(S200)、分析经预先处理的数据(S300)以确定用于因子分析的有效因子,检查原始数据和处理与被相信存在于数据中的任何同位素或加合物相关联的数据(S400),以及基于经处理的数据准备并提供相关结果(S500)。

Description

在色谱系统中处理数据的方法
技术领域
本发明涉及用于在色谱质谱系统中获得的数据的数据处理技术。 
背景技术
已经知道色谱质谱仪产生大量数据并且许多数据具有噪声或不需要的信息。期望能够有效并精确地从噪声区分出相关信息并且以有效并高分辨率的方式处理该信息的系统和方法。 
发明内容
描述了一种用于在色谱系统中处理数据的系统和方法。在实施例中,该系统和方法包括处理由色谱系统产生的数据以产生经处理的数据、分析经处理的数据以及基于经处理的数据准备并提供结果。 
附图说明
图1描绘了根据在本发明中描述的实施例的、关于对色谱峰识别和去卷积的因子分析技术的一般过程; 
图2是气相色谱、质谱系统的一般框图; 
图3示出了根据实施例的技术的特征; 
图4表示根据实施例的对于来自数据获取系统的数据进行预先处理的示例性方法; 
图5表示根据实施例的基线校正的示例性方法; 
图6展示了滤波处理的示例性实施方式; 
图7表示根据本公开讨论的原理的、识别经实质优化的系数的典型处理; 
图8示出了根据实施例的可以被用来使子簇的峰形状达标的典 型处理; 
图9列出了根据实施方式的其中一般无关数据可以被从子簇移除以改善数据的方法; 
图10绘出了根据这里描述的实施方式的方面的引种(seeding)方法; 
图11示出了根据所描述的实施例的因子识别的过程; 
图12描绘了在示例性系统中M相对于峰相关性阈值的比较; 
图13用图表相对于峰相关性阈值展示了在实施方式中的M;以及 
图14提供了防止因子分解的方法。 
各种附图中的类似的符号表示类似的要素。 
具体实施方式
参照图1,公开了用于因子分析技术的示例性方法,该因子分析技术从色谱、质谱系统识别色谱峰并对其去卷积。可以明白该方法可以被用在全部类型的色谱系统中,包括液相和气相色谱系统。在实施例中,如图所示,该方法包括以下步骤:(i)预处理由分析系统接收的数据(S200),(ii)分析经预处理的数据(S300),(iii)处理与被相信存在于数据中的任何同位素或加合物相关联的数据(S400),以及(V)准备并提供相关结果(S500)。 
在实施方式中,提供数据以由与质谱仪相关联的数据获取系统分析。为了本公开的目的,可以理解数据获取系统是如U.S.7,501,621、U.S.7,825,373和U.S.7,884,319中所述的系统。 
此外,在经历这种分析之前,来自数据获取系统的数据可以如美国临时专利申请No.61/445,674所述地被调整。前述的以及全部其他引用的专利以及专利申请都通过应用将其全文结合在这里。在所结合的参考文件中的术语的定义或使用与这里提供的术语不一致或者相矛盾时,应用这里提供的术语的定义,并且不应用参考文件中的术语的定义。 
总而言之,上述数据获取系统基本上将来自质谱系统的原始数据转换为被称作“棒(sticks)”的质心质谱,每一个质心质谱都表示离子峰并且包括强度、确切质量值和质量分辨率值。在棒的构造期间,来自模拟-数字转换器的原始数据已经受到104或105:1的压缩并且获取噪声和多余信息的大部分已经被移除。结果是非常稀疏的二维数据,但是因为数据获取系统的目的是将全部的离子信息转送到下一个处理阶段,所以化学背景噪声可能依然存在。之后,棒可以在相邻保留时间扫描中被漂移校正并收集到统计上类似的质量簇中。 
在实施方式中,具有类似强度轮廓的簇被认为表示来自从色谱柱洗脱的分子化合物的各种同位素、加合物和碎片离子。此外,还有来自于诸如柱流失(column bleed)、移动相污染、环境污染等的各种来源的、不具有色谱结构的背景离子的簇。簇过滤器可以被应用来移除具有不达到理想最小信号-噪声水平的簇,并且其余的簇之后被送到处理系统,来用于继续分析。 
应当理解,基于公开的内容,如图3所示,在数据处理的每个阶段,通常首选以保留一些剩余噪声的代价来保留有用的信息。一般来说,所描述的系统具有经优化的保留噪声量,以保持数据完整。 
图4示出了对于由处理系统从数据获取系统接收的数据进行预处理的示例性方法。在实施方式中,处理(S200)包括以下步骤:分离短簇与长簇并且对长簇进行基线校正(S210)、对数据滤波以平滑数据(S220)、将经过滤的簇划分为子簇(S230)以及使子簇达标(S240)。在实施例中,如下文中更具体地讨论的,使子簇达标可以包括使峰形状达标和使信号-噪声达标中的至少一者。 
已经发现长簇可以具有与整个分析的长度接近的持续时间并且大部分长簇是如果不被适当处理可能会使结果实际上偏移的背景离子。同样,长簇通常相对更强并且通常具有与其相关的更高噪声。然而,因为由于来自于洗脱化合物的共享质量的贡献,一些这种数据也可能包括期望的色谱数据,所以优选地对于长簇提供进一步分析,而非将它们全部提取出来。由于它们的经提升的强度,在实施方式中, 这种长簇可以首先经受基线校正。 
现在将会公开这种基线校正的方法。在实施方式中并且如图5所示,对于数据执行基线校正的步骤可以包括以下步骤:将数据分离为块,每个块的长度被确定为色谱数据的期望全宽半高的倍数(S111);基于在该块的下四分位中的基线强度估计在块的中央的基线强度(S212);在前述等距四分位点之间进行线性内插,以产生基线估计(S213);剪取在基线上直到基线水平的数据,并且保留在基线下的数据(S214);平滑所剪取的数据的曲线,以产生基线的改善版本(S215)以及重复步骤(S214)和(S215),直到全部或基本全部数据降落到经平滑的基线上的最小公差内。上述基线校正可以对于每个期望的经分离的块(在实施方式中,可以包括经分离的块中的全部或基本全部)进行。类似地,校正可以被应用到每个长簇(在实施方式中,可以包括长簇中的全部或基本全部)。 
在实施方式中,在步骤(S211)期间块的长度被估计为色谱数据的期望全宽半高的五(5)倍,但是基于本公开,该长度大于或小于五(5)倍都是合适的。 
如所讨论的,剪取数据(S214)包括平滑所剪取的数据的曲线。在实施方式中,实施Savitzky-Golay平滑算法以实现平滑步骤。其他平滑算法也可以被采用并且本发明不应当由此受到限制。 
继续参照图4,数据可以接下来被滤波以移除噪声(S220)。这种滤波处理的实施方式在图6中示出。在实施方式中并且如所讨论的,无限脉冲响应滤波器被用来执行该步骤,但是,基于这里的内容可以认识到其他类型的滤波器也可以代替使用,例如有限脉冲响应滤波器。继续参照图6,识别数据内的最大峰并且估计该峰的全宽半高(S221)。所估计的值接下来被与预先限定的查找表匹配,以基于它们的全宽半高识别一组前向和反向二级无线脉冲响应滤波器系数,它们都被优化以平滑色谱峰(S222)。使用在步骤(S222)中得出的所识别的、经优化的系数,数据被平滑化(S223)。之后,经平滑的数据与原始数据相比较,以识别每个簇的噪声图(S224)。在实施方式 中,每个簇的噪声图被识别为平滑数据与原始数据之间的残差的标准差。为了基于本公开而变得明显的目的,噪声图被保留,因为其将会被分配到根据(S230)从簇得出的每个子簇。该方法提供了最大似然最小二乘法估计,其有助于没有受到高强度数据过度影响的分析,并且允许低强度数据被充分地表示。 
如所讨论的,在实施例中,通过在(S222)处使用查找表来识别经优化的系数。在实施方式中,在进行任何处理之前,经优化的系数被预先计算并且保存在系统中,以用于多个期望的全宽半高值。图7示出了可以预先计算系数的一个方式。 
在(S225)处,在每个期望的全宽半高处形成多个纯高斯峰。在实施方式中,这些峰的宽度基本在目标全宽半高的约三分之一(1/3)到全宽半高的三(3)倍之间或者在这二者处,并且它们被存储为基准峰。接下来在(S226)处将噪声增加到基准峰中的全部或被选择的一个。在实施方式中,噪声可以是白噪声并且可以根据高斯分布增加到每个峰。之后,在(S227)处,以将经平滑的噪声峰与基准峰之间的残差基本最小化的方式,峰的每一个或被选择的一个被优化以调整滤波器系数。可以使用非线性Levenburg-Marquardt法来提供优化(S227)。在优化期间,系数可以被约束,以产生稳定脉冲响应。对于每个或被选择的基准全宽半高重复该处理(S228)并且经优化的系数值被存储在查找表中(S229)。在实施方式中,作为结果的示例性平滑滤波器的脉冲响应类似于sinc滤波器的脉冲响应,其中滤波器的原瓣的宽度近似为目标全宽半高的一半。使用该实施方式,峰形状和结构可以基本被保留并且所检测到的错误正峰的数目可以基本被最小化。 
返回参照图4,经滤波的簇可以被划分为子簇(S230)。在实施方式中,经滤波的簇数据被检查以识别谷(位于两个峰或顶点之间)中的最小点小于临近峰的限定强度的每个实例。作为示例,峰强度可以被选择为处于临近峰中的一者或两者的强度的二分之一(1/2)处或大约二分之一。一旦被识别出来,该谷被认为是簇切割点,由此将簇 分离为一个或多个子簇。如将会理解的,经划分的子簇的数目将会取决于给定簇的簇切割点的量。 
图8示出了可以被用来使子簇的峰形状达标的示意性处理(S240)。该处理可以帮助确保相关子簇包括色谱信息。在实践中,一些子簇可以包括不含有色谱信息的数据,下文中将其称作为离群值(outlier)。优选的是从数据中提取并免除在实践可能的情况下尽可能多的离群值,而不移除相关数据。在实施方式中,可以使用以下一个或多个技术来从离群值中分离期望的子簇:(i)选择具有比最小信号噪声比更大的信号噪声比的子簇(S242);(ii)选择具有比最小质量更高的峰形状的子簇(S244);以及(iii)选择具有最小簇长度的子簇(S246)。在实施方式中,在3-8棒之间、在4-7棒之间、在3-7之间、在4-8棒之间、在4-6棒之间、在5棒处或者在以上范围的边界处选择最小簇长度。可以使用其他的最小簇长度。在实施方式中,可以使用每个分离处理。为了便于公开,本公开将会讨论如图8所述使用全部处理的实施例。此外,无论是用哪个分离处理,本公开不应当局限于它们被处理的顺序。 
提供了用于选择具有比最小或阈值信号噪声比更大的信号噪声比的子簇的示例性处理(S241)。在实施方式中,阈值比率可以被选择为硬编码值与用户限定值之间的较小者。作为示例,阈值可以为十(10)或约为十。在其他技术之中,噪声可以被测量为四分之一(1/4)离子面积的预先限定的获取噪声或者原始簇数据与经平滑的簇数据之间的残差的标准差。然而,应当理解,如果具有阈值之下的比率的子簇是达标的峰的同位素或加合物的话,它们仍可以被用在因子分析中。 
因为具有比阈值更大的信号噪声比率的子簇仍然可能具有多余数据或噪声,所以可能期望进一步修剪该子簇。一个修剪方法包括从峰的左侧和右侧修剪这种子簇的基线。在实施方式中,子簇内的原始数据被从两端或一端向中央扫描,强度(左/右)上升到阈值以上的位置变为子簇的新的末端并且基线数据被丢弃。在实施方式中,阈值强 度是子簇噪声的标准差的四(4)倍。 
如在先讨论的,识别期望子簇并消除离群值的另一个技术是选择具有比最小或阈值质量更高的峰形状的子簇(S244)。在实施方式中,阈值质量可以基于色谱峰具有可以优选地使用双高斯曲线合理建模的一般形状的假设,但是本发明不应当被局限于此。双高斯曲线相对于诸如Pearson IV的其他峰形状更优的地方在于拟合的速度和稳定性。因此,在实施例中并如图9所示,每个子簇首先被拟合到双高斯峰(S247)。识别子簇与拟合峰之间的相关性(S248)。选择具有比阈值相关性更大或基本在阈值相关性处的相关性的峰,具有比阈值相关性更小的相关性的峰被识别为离群值(S249)。在实施方式中,阈值相关性可以是0.6,优选地为0.8。 
基于本公开,适当地是每个子簇可以被认为包括单个色谱峰,但是可以理解,由于来自两个以上的共洗脱化合物的结合的信息,每个子簇可以是共享的质量成分峰,该现象可以如下文所述地进一步的去卷积。 
返回参照图1,根据上文内容预先处理的数据现在在(S300)中经受分析。在该步骤中,公开了确定用于因子分析的有效因子的数目以及提供这些因子的初始种子估计的方法。这里讨论的因子引种(seeding)的应用产生了防止因子分析过度地集中到局部极小值的方法。因此,可以迅速地获得具有更高精确度和分辨率的结果。 
在实施例中并且如图10所示,所公开的引种方法包括在(S310)处划拨一个或多个值来处理或在其他情况下确定有效因子的数目并且控制去卷积。在实施例中,可以被使用的值其中包括色谱分辨率的程度、峰重叠或峰相关性阈值以及作为结果的因子的最小质量。这些值可以被用户选择、预先限定或在预引种处理期间基于分析结果动态产生。 
在实施例中,多程(multi-pass)处理可以有助于因子确定。现在将会讨论双程处理,但是根据本公开也可以认识到可以使用变程处理并且本发明有权具有其全部范围。此外,双程处理可以是可选的, 使得在判断出来自单程处理的结果是足够的情况下,可以使用这种单程处理。一般来说,这种处理在确定因子时有助于排除低质量峰,因为这种峰可以使得结果模糊或者在其他情况下减慢处理。然而,如之后所讨论的,所排除的一些或全部峰都可以在处理中在之后的时刻被结合,如果这种峰被确定为与同位素或加合物相关的话。 
在实施方式中,第一程被用来提供所确定的因子的第一估计(S320)。如图11所示,该程可以开始于选择因子的基础峰或者浓度轮廓(S321)。基础峰可以手动地选择或者诸如通过实施算法函数等来自动地选择。在实施例中,数据集合中最强的子簇峰被选择为基础峰,因为可以假定这个峰可能相比于相对更不强的子簇峰最佳地表示纯化合品(chemical)。在实施方式中,所选择的子簇峰被选择为因子的基础峰或浓度轮廓。 
在选择基础峰之后,全部的局部数据(例如,可能与该基础峰相交的子簇)被评价并与基础峰进行相关,以对于基础峰划拨相关性值C(S322)。可以使用已知相关方法。在实施例中,具有预定最小相关性值的局部数据被与基础峰相结合,以产生因子(S323)。之后可以对于所识别的因子规定谱的初始估计S(S324)。 
接下来,剩余数据中的最强峰被选择为下一个因子,并且再次根据上述处理结合相关的数据(S325)。该处理继续直到全部子簇已经被初始地分配到因子。 
现在可以采用第二程(S330),由此来自第一程的因子被进一步分析并且判断在第一程中识别的单个因子是否可以或者应当被进一步分离为个别因子。在该步骤期间,相关性参数和相关联的置信区间可以被用来分离可能在第一程中已经被错误地融入的数据。在实施方式中,相关性参数可以是用户识别的或预先限定的。 
图12举例说明了可以被用在第二程中的实施方式(S330)。如图所示,选择因子中的最强子簇(S331),其将会被识别为基础峰,尽管也可以使用其他项。计算基础峰与因子中的一个或全部其他子簇之间的相关性(S332)。也可以对于包括基础峰的每个子簇计算顶点 位置置信区间(S333)。示例性置信区间确定可以是: 
在以上公式中,(i)M表示sigma倍数并且与期望的标准差的数目相关联,M可以与下文讨论的峰相关性阈值相关联,(ii)峰宽度是期望得到其置信区间的子簇峰的全宽半高,(iii)S/N是子簇的信号噪声比率,其被计算为子簇的峰高与峰-峰噪声的比率,并且顶点位置是峰的顶点的时间位置。虽然公开了示例性置信区间确定,但是可以使用其他计算,并且除非特别否认,本发明应当不局限于所公开的示例。 
如果是优选的,如上文所述,在实施方式中,M可以如图13所示与峰相关性阈值函数相关联。图13基于以可变量时移的两个高斯的相关性和置信区间重叠的测量结果,用图表展示了相对于峰相关性阈值的M。可以使用所图示的关系,使得当峰相关性阈值或M中的任一者被识别时,另一个值可以基于该图示性关系自动地得出。或者,在实施方式中,可能期望提供独立的峰相关性阈值和M。 
在实施方式中,高置信性趋向于具有大的M(在2或4处、在2-4之间、在3处或约为3)和宽的置信区间。并且,对于非常强的峰(例如,趋向于具有升高的信号噪声比率的那些峰),置信区间可以趋向于狭窄,因为有足够数量的离子以使得锋位置的不确定性非常小。例如,如果3的sigma倍数被用于顶点位于时刻20处的基础峰(或子簇),该峰具有2的宽度、2560的高度和10的峰-峰噪声,那么置信区间对于基础峰的顶点位置为20±0.375。置信区间与基础峰的置信区间重叠并且与基础峰的相关性大于用户规定的峰相关性阈值的全部子簇都被一同分组到一因子中(S334)。如果期望的话,如果有任何剩余的子簇,那么剩余子簇中最强子簇被选择为用于新的因子的基础峰并且重复处理,直到不再有子簇剩余(S335)。通过该处理产生的新的因子的量与共洗脱化合物的量有关。第二程提供了其中具有基本相同的顶点位置但是具有不同的形状的两个峰被去卷积的方法。 
与前述内容同时地,或者在完成上文所述的因子识别中的一个、一些或全部时,对于每个因子计算平均浓度轮廓(S340),见图10。作为示例,多元曲线分辨(MCR)方法可以被用来确定每个因子的平均浓度轮廓。在实施方式中,对于一个或全部因子,所计算的平均浓度轮廓被用作为每个因子的所估计的峰形状。可选地,如果对于一个或全部因子需要的话,基础峰形状可以被识别为所估计的峰形状。此外,两个估计峰形状可以被使用,使得所计算的平均浓度轮廓和基础峰形状可以被用于一个或全部因子。 
通过使用平均浓度轮廓,另外的不期望的因子可以通过测量平均浓度轮廓的峰质量(PQ)的进一步计算(S350)而取出。在实施方式中,PQ可以通过确定每个浓度轮廓的拟合的残差的偏差来计算。可以采用不同的偏差法,例如,可以优选地使用双高斯系统中的标准差。在实施方式中,小于阈值峰质量(例如,0.5)的峰质量被从数据和继续的运算移除(S360)。然而应当理解,PQ阈值的选择和偏差计算及其方法可以根据期望的结果来改变,并且本发明不应当由此受到限制。 
返回参照图1,可能期望将数据增加回与同位素和加合物相关的因子中(S400)。在实施方式中,原始数据被检查,并且被认为与同位素和加合物相关的数据被选择并且之后使其对于全部或所选择的一个因子达标。如果数据表示相关性大于具有比阈值错误率更小的错误率的最小相关性,那么可以对于因子达标。在实施方式中,最小相关性是0.9,并且错误率是百分之二十。如果该数据达标的话,之后将该数据分配给该因子。 
在实施方式中,可以通过相对于原始数据检查典型的同位素m/z间隔和加合物m/z间隔并且基于检查提取出表示同位素/加合物的数据,来识别同位素/加合物。例如,包括化合物的单核碳(singly-charged carbon)具有间隔约n×1.003质量单位的同位素,其中n=1、2、3……;在含氯化合物中,同位素通常间隔1.997质量单位。对于加合物,如果使用单钠离子将分子离子化,将会相对于由单氢离子离子化的相同 分子具有21.982质量单位的质量移动。 
此外,化合物的同位素/加合物可能已经与相邻的共洗脱因子不正确地分组(例如,噪声可能已经使得同位素/加合物峰与相邻峰相对于与真实的基础峰具有更高的相关性)。当识别时,期望再分配这种同位素/加合物。确定并再分配这种不正确的分组的一个方法是将因子与其相邻的一个或多个因子相比较。在实施方式中,基于第一因子的浓度轮廓与临近因子的浓度轮廓之间的相关性来识别什么因子可以构成相邻因子。如果相关性大于最小相关性,那么该因子被识别为相邻因子并且潜在地包括来自第一因子的同位素或加合物。在实施方式中,最小相关性是0.9。之后,相邻因子被扫描并且如果同位素/加合物达到属于第一因子的标准,它们被再分配到第一因子。在实施方式中,该处理可以对于下一个临近因子重复,直到相关性小于最小相关性为止。如果数据表示相关性大于具有比阈值错误率更小的错误率的最小相关性,那么可以进行因子与同位素/加合物之间的达标确定。在实施方式中,最小相关性是0.9,并且错误率是百分之二十。如果该处理将因子的全部构成部分排空,那么该因子被排除。该处理可以对于数据的全部或所选择的部分重复。 
在处理过程期间的时间,可以注意到相关性阈值可能太高了。例如,这可能由于尝试对接近地共洗脱的化合物去卷积而发生。然而,如果同位素和加合物没有这样高度相关,那么可能由于过度高的相关性阈值而导致因子分解(即,单洗脱化合物由一个以上的因子建模)。在图14中示出了有助于防止因子被这样分解的一个方法。一因子(即,最强)内的基础同位素/加合物子簇与其他子簇之间的相关性的平均值被在该因子内计算,“局部相关性阈值”(S610)。之后,确定因子以及与该因子相邻的因子的浓度轮廓之间的相关性(S620)。如果因子之间的相关性大于局部相关性阈值,那么将这两个因子合并(S630)。该处理可以在全部因子对于每个所识别的基础同位素/加合物子簇重复。 
一旦识别出了因子并且对于因子选择了合适的估计浓度轮廓,那 么估计峰形状被与具有已知参数的所选择的曲线相比较(S370)。在实施方式中,估计浓度轮廓被归一化并且之后与一个或多个预先确定的、预先计算的曲线相比较。归一化可以由通过重新采样过程进行拉伸或收缩来提供并且之后使其居中以与预先计算的曲线的宽度和中心相匹配。 
之后计算新的数据与预先限定的曲线的集合之间的相关性(S380),并且用于最佳匹配的偏度和峰度值被选择作为优化的种子(S390)。 
在实施方式中,Pearson函数被用来选定预先计算的曲线,优选地,Pearson IV曲线。Pearson IV曲线可以被提到具有五个参数:(i)高度;(ii)中心;(iii)宽度;(iv)偏度(第三矩);和(v)峰度(第四矩)。在实施方式中,预先计算的曲线是偏度和峰度的至少一者的排列,同时其余参数被保持恒定,使得之后对于每个排列记录并保存峰形状。可以理解,其他排列可以被使用,并且权利要求不应当如此限制到这里公开的示例性实施方式。例如,其中,高度和偏度可以改变,同时保持中心、宽度和峰度为恒定的值。 
应当理解,这里描述的系统和技术的各种实施方式可以以数字电子电路、集成电路、特殊设计的ASIC(特定用途集成电路)、计算机硬件、固件、软件以及/或者它们的组合来实现。这些各种实施方式可以包括实施于可以在可编程系统上执行和/或解释的一个或多个计算机程序中,该可编程系统包括至少一个可编程处理器、至少一个输入装置和至少一个输出装置,至少一个可编程的处理器可以是特殊用途或一般用途的,并被连接以从存储系统接收数据和指令并且向存储系统发送数据和指令。 
这些计算机程序(也被公知为程序、软件、软件应用或代码)包括用于可编程处理器的机器指令,并且可以以高水平的过程和/或面向对象编程语言和/或以汇编/机器语言实施。如这里所使用的,术语“机器可读介质”、“计算机可读介质”指的是用于向可编程处理器提供机器指示和/或数据的任何计算机程序产品、设备和/或装置(例如, 磁盘、光盘、存储器、可编程逻辑器件(PLD)),包括接收机器指令作为机器可读信号的机器可读介质。术语“机器可读信号”指的是用于向可编程处理器提供机器指令和/或数据的任何信号。 
为了提供与用户的交互,这里描述的系统和技术可以被实施在具有用于将信息显示给用户的显示装置(例如,CRT(阴极射线管)或LCD(液晶显示)监视器)以及用户用其向计算机提供输入的键盘和指点装置(例如,鼠标或轨迹球)的计算机上。其他种类的装置也可以被用来提供与用户的交互,例如,提供给用户的反馈可以是任何形式的传感器反馈(例如,视觉反馈、音频反馈或触觉反馈),并且来自用户的输入可以以任何形式(包括声音、语音或触摸输入)来接收。 
这里描述的系统和技术可以实施在以下计算系统中,该计算系统包括后端组件(例如,数据服务器),或者包括中间设备组件(例如,应用服务器),或者包括前端组件(例如,具有图形用户界面或网络浏览器的客户端计算机,通过图形用户界面或网络浏览器,用户可以与这里描述的系统和技术的实施方式交互),或者包括诸如后端、中间设备或前端组件的任何组合。系统的组件可以由任何形式或介质的数字数据通信(例如,通信网络)相互连接。通信网络的示例包括局域网(“LAN”)、广域网(“WAN”)和互联网。 
计算系统可以包括客户端和服务器。客户端和服务器通常彼此原理并且通常通过通信网络相互沟通。客户端和服务器的关系借助于在各个计算机上运行并且彼此具有客户端-服务器关系的计算机程序来实现。 
说明书中描述的主题和功能操作的实施方式可以以数字电子电路来实施,或者以包括本说明书中公开的结构以及它们的结构等价物的计算机硬件、固件或软件来实施,或者以它们的一个或多个的组合来实施。说明书中描述的主题的实施方式可以被实施为一个或多个计算机程序产品,即,嵌入计算机可读介质的计算机程序指令的一个或多个模块,以由数据处理设备执行或者控制数据处理设备的操作。计算机可读介质可以是机器可读存储装置、机器可读存储衬底、记忆装 置、影响计算机可读传播信号的物质组成,或者其中一者或多者的结合。短语“数据处理设备”包括用于借助于例如可编程处理器、计算机或多处理器或计算机来处理数据的全部设备、装置和机器。除了硬件之外,设备可以包括对于所谈的计算机创造执行环境的代码,例如,构成处理器固件、协议堆栈、数据库管理系统、操作系统或它们一者或多者的组合的代码。传播信号是人工产生的信号,例如,机器产生的电、光或电磁信号,其被产生以对信息进行编码,以将其传送到合适的接收器设备。 
计算机程序(也被已知为程序、软件、软件应用、脚本或代码)可以以任何形式的编程语言的形式来书写,包括编译或解释语言,并且可以被展开为任何形式,包括独立程序或模块、组件、子程序或适合于用在计算环境中的其他单元。计算机程序不一定对应于文件系统中的文件。程序可以存储在保持其他程序或数据的文件的一部分中(例如,存储在置标语言文件中的一个或多个脚本)、存储在专用于所谈程序的单个文件中,或者存储在多个相关联的文件中(例如,存储一个或多个模块、子程序或部分代码的文件)。计算机程序可以被展开以在位于一个地点或分布到多个地点并且由通信网络相互连接的一个计算机或多个计算机上执行。 
在说明书中描述的处理和逻辑过程可以由执行一个或多个计算机程序的一个或多个可编程处理器来执行,以通过对输入数据执行运算并且产生输出的功能。处理和逻辑流程也可以由特殊用途逻辑电路(例如,FPGA(场可编程门阵列)或ASIC(特定用途集成电路))执行,或者设备也可以被实施为特殊用途逻辑电路。 
适合与执行计算机程序的处理器例如包括一般和特殊目的微处理器,以及任何类型的数字计算机的任一个或多个处理器。一般来说,处理器将会从只读存储器或随机存取存储器或这二者接收指令和数据。计算机的关键元件是用于执行指令的处理器以及用户存储指令和数据的一个或多个存储器装置。一般来说,计算机也将包括或者被可操作地连接到用于存储数据的一个或多个大容量存储装置,例如,磁 盘、磁光盘或光盘,以从其接收数据或将数据传递过去。然而,计算机不需要具有这种装置。此外,计算机可以被嵌入另一个装置,列举几个,例如移动电话、个人数字助手(PDA)、移动音频播放器、全球定位系统(GPS)接收器。适合于存储计算机程序指令和数据的计算机可读介质包括各种形式的非易失性存储器、介质和存储器装置,例如包括半导体存储器装置,例如,EPROM、EEPROM和闪存存储器装置;磁盘,例如,内置硬盘或可移除盘;磁光盘;以及CD ROM和DVD ROM盘。处理器和存储器可以例如由特殊用途逻辑电路实施或结合在其中。 
为了提供与用户的交互,说明书中描述的主题的实施方式可以被实施在计算机上,其具有用于将信息显示给用户的显示装置,例如,CRT(阴极射线管)或LCD(液晶显示)监视器,以及用户可以由其向计算机提供输入的键盘和指点装置,例如,鼠标或轨迹球。其他类型的装置可以被用来提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感器反馈,例如,(例如,视觉反馈、音频反馈或触觉反馈),并且来自用户的输入可以以任何形式(包括声音、语音或触摸输入)来接收。 
虽然本说明书包括许多细节,但是它们不应当被理解为本发明的范围或者权利要求所限定的内容的限制,相反,仅仅为对于本发明的具体实施例特殊的特征的描述。在本说明书中、在独立实施方式的语境中描述的特定特征也可以在单个实施方式中结合实施。相反地,在单个实施例的语境中描述的各个特征也可以分离地或者以任何合适的子结合实施在多个实施方式中。此外,虽然以上的描述中将特征作为以特定组合发挥作用并且甚至最初在权利要求中如此限定,但是从权利要求中限定的组合而来的一个或多个特征在一些情况下可以从组合中删去,并且权利要求中限定的组合可以设计子组合或子组合的变化。 
类似地,虽然在附图中以特定顺序图示了操作,但是这应当不被理解为要求这些操作以示出的具体顺序或次序执行,或者全部图示的 操作可以被执行,以实现期望结果。在特定环境中,多任务和并行处理可以是有益的。此外,上述实施方式中的各种系统组件的分离不应当被理解为在全部实施方式中需要这种操作,并且应当被理解为所描述的程序组件和系统可以一般被一同集成到单个软件产品中或封装到多个软件产品中。 
已经描述了大量实施方式。然而,应当理解,可以在不背离本公开的精神和范围的状态下进行各种修改。例如,上文是处的流程的各种形式可以被使用,而步骤可以被重新排序、增加或移除。同样。虽然已经描述了系统和方法的多个应用,应当认识到可以构思到各种其他应用。因此,其他实施方式也在本发明的范围中。 

Claims (64)

1.一种在用于色谱质谱系统的数据获取系统中处理与质谱相关的数据的方法,所述方法包括:
处理所述数据以产生经处理的数据;
分析所述经处理的数据以从其提取噪声,并且将所述质谱的用于一个或多个洗脱化合物的一个或多个成分分成一组,以帮助阐明这些化合物中的每一种,其中所述一个或多个成分是同位素、加合物和碎片;和
准备并提供与所述经处理的数据相关联的结果。
2.根据权利要求1所述的方法,还包括:
将可能已经作为噪声提取的与同位素和加合物中的至少一者相关联的信息重新合并。
3.根据权利要求1所述的方法,其中,所述数据包括长簇和短簇,并且所述处理步骤包括:
分离所述短簇与所述长簇;
对所述数据进行滤波,以平滑所述数据,由此产生经滤波的簇;
将所述经滤波的簇划分为子簇;以及
使所述子簇达标,以从其提取不理想的子簇。
4.根据权利要求3所述的方法,其中,所述分离步骤还包括:
将所述数据分离为块;
估计在每个块的中心处的基线的强度;
在每个块的等距四分位点之间进行线性内插,以产生基线估计;
剪取在所述基线的水平以上的数据并且保留在所述基线以下的数据;以及
平滑所剪取的数据以产生所述基线的改善版本。
5.根据权利要求4所述的方法,其中,每个块的长度是数据的期望全宽半高的倍数。
6.根据权利要求4所述的方法,其中,每个块的长度被估计为数据的期望全宽半高的五倍。
7.根据权利要求4所述的方法,其中,所述平滑步骤包括应用Savitzky-Golay平滑算法。
8.根据权利要求4所述的方法,其中,估计在块的中心处的基线的强度是基于在所述块的下四分位中基线的强度。
9.根据权利要求3所述的方法,其中,所述达标步骤包括以下至少一者:
选择具有比阈值信号噪声比更大的信号噪声比的子簇,
选择具有比阈值质量更高的峰形状的子簇,以及
选择具有最小簇长度的子簇。
10.根据权利要求9所述的方法,其中,所述阈值信号噪声比为10。
11.根据权利要求9所述的方法,其中,所述噪声是四分之一(1/4)离子面积的预先限定的获取噪声。
12.根据权利要求9所述的方法,其中,所述噪声是原始簇数据与所述经平滑的簇数据之间的残差的标准差。
13.根据权利要求9所述的方法,其中,如果具有比所述阈值信号噪声比更小的信号噪声比的子簇是同位素或加合物的话,仍然将它们用在因子分析中。
14.根据权利要求9所述的方法,还包括以下步骤:
从峰的左侧和右侧修剪子簇的基线。
15.根据权利要求14所述的方法,其中,所述修剪步骤还包括:
从末端向中央扫描所述子簇内的原始数据;
在每个末端识别强度上升到阈值以上的位置,作为新端点;
丢弃在所述新端点之外的数据。
16.根据权利要求15所述的方法,其中,所述阈值是所述子簇的标准差的四倍。
17.根据权利要求9所述的方法,其中,所述阈值质量基于所述子簇的拟合与预先限定的曲线之间的相关性。
18.根据权利要求17所述的方法,其中,所述预先限定的曲线是双高斯曲线。
19.根据权利要求17所述的方法,其中,所述阈值相关性是0.6。
20.根据权利要求18所述的方法,其中,所述阈值相关性是0.8。
21.根据权利要求3所述的方法,其中,所述滤波步骤利用无限脉冲响应滤波器。
22.根据权利要求3所述的方法,其中,所述滤波步骤包括:
识别所述数据内的最强峰;
估计所识别的峰的全宽半高;
将所估计的全宽半高对于查找表匹配,以识别一个或多个经优化的滤波系数;
基于所述经优化的滤波系数平滑所述数据;以及
识别每个簇的噪声图。
23.根据权利要求22所述的方法,其中,所述经优化的滤波系数是前向和反向二次无限脉冲响应滤波系数的集合。
24.根据权利要求23所述的方法,其中,所述噪声图是所述平滑数据和所述原始数据之间的残差的标准差。
25.根据权利要求24所述的方法,其中,所述噪声图被分配到从簇得出的每个所述子簇。
26.根据权利要求23所述的方法,其中,所述经优化的系数是按照以下步骤计算的:
在每个期望的全宽半高处形成高斯峰;
将噪声增加到所述高斯峰,由此产生噪声高斯峰;以及
优化所述高斯峰,以按照使所述噪声高斯峰与所述高斯峰之间的残差基本最小化的方式来调整所述滤波系数。
27.根据权利要求26所述的方法,其中,所述优化步骤利用了非线性Levenburg-Marquardt处理。
28.根据权利要求3所述的方法,其中,所述簇具有峰和谷并且所述划分步骤还包括:
识别经滤波的簇内的、位于两个峰之间的谷具有比这两个峰的限定强度更小的最小点的每个实例;以及
如果存在所述情况的话,基于每个所识别的实例来将所述簇分离为子簇。
29.根据权利要求20所述的方法,其中,限定强度为所述两个峰中的一个或两个的强度的一半或大约一半。
30.根据权利要求3所述的方法,其中,所述分析步骤还包括:
确定用于因子分析的有效因子;以及
提供这些因子的初始种子估计。
31.根据权利要求30所述的方法,还包括:
排除低质量峰。
32.根据权利要求3所述的方法,其中,所述分析步骤还包括:
在所述数据中选择基础峰;
评价全部局部数据并将其与所述基础峰相关;
将具有预定最小相关性值的局部数据与所述基础峰结合,以产生因子;以及
估计所述因子的谱。
33.根据权利要求32所述的方法,其中,所述基础峰是手动选择的。
34.根据权利要求32所述的方法,其中,数据集合中的最强子簇峰被选择作为基础峰。
35.根据权利要求32所述的方法,其中,所述最小相关性值是0.6。
35.根据权利要求34所述的方法,还包括:
A)一旦识别了所述基础峰,那么选择剩余数据中的下一个最强峰作为下一个因子;
B)在完成步骤(A)之后,选择剩余数据中的下一个最强峰作为下一个因子;以及
C)重复步骤(B),直到全部的子簇都被分配因子为止。
36.根据权利要求32所述的方法,还包括:
比较相关性阈值和相关联的置信区间的一者或二者,以将在所述结合步骤中已经结合的、本不应当被结合的局部数据分离到分立因子中。
37.根据权利要求36所述的方法,其中,所述比较步骤还包括:
选择所述因子中的最强子簇;
确定所述因子中的基础子簇与至少一个其他子簇之间的相关性;
确定至少一个子簇的顶点位置置信区间;
将具有以下特征的子簇分成一组:(i)与基础峰重叠,以及(ii)与所述基础峰的相关性大于限定相关性阈值,其中,每个分组是因子。
38.根据权利要求36所述的方法,还包括:
计算每个因子的平均浓度轮廓。
39.根据权利要求38所述的方法,其中,所述计算步骤利用多元曲线分辨方法来确定每个因子的平均浓度轮廓。
40.根据权利要求39所述的方法,其中,所计算的平均浓度轮廓被用作为每个因子的估计峰形状。
41.根据权利要求38所述的方法,还包括:
测量所述平均浓度轮廓的峰质量;以及
移除具有小于阈值峰质量的峰质量的数据。
42.根据权利要求41所述的方法,其中,所述测量步骤是通过确定每个浓度轮廓的拟合的残差的偏差来计算的。
43.根据权利要求42所述的方法,其中,所述偏差是双高斯系统中的标准差。
44.根据权利要求41所述的方法,其中,所述阈值峰质量是0.5。
45.根据权利要求44所述的方法,其中,输入相关性参数是手动输入的。
46.根据权利要求40所述的方法,还包括:
将估计峰形状与至少一个预先选择的曲线相比较。
47.根据权利要求46所述的方法,还包括:
在所述比较步骤之前将估计峰形状归一化,以限定经归一化的估计峰形状。
48.根据权利要求47所述的方法,其中,所述归一化步骤包括通过重新采样过程进行拉伸或收缩中至少一者并且之后使估计峰形状居中,以与所述至少一个预先选择的曲线的宽度和中心相匹配。
49.根据权利要求47所述的方法,还包括:
计算经归一化的峰形状与所述至少一个预先选择的曲线之间的相关性。
50.根据权利要求49所述的方法,其中,最佳匹配的偏度和峰度值被选择为用于优化的种子。
51.根据权利要求46所述的方法,其中,所述至少一个预先选择的曲线是由Pearson IV函数产生的。
52.根据权利要求51所述的方法,其中,所述至少一个预先选择的曲线是偏度和峰度的至少一者的排列,同时其余参数被保持恒定,使得之后对于每个排列记录并保存峰形状。
53.根据权利要求1所述的方法,还包括:
检查所述数据中与同位素和加合物中一者或两者相关联的信息;
选择相关联的数据;
使相关联的数据达标;以及
如果相关联的数据达标,那么将其分配给因子。
54.根据权利要求53所述的方法,其中,所述达标步骤包括:
计算所述数据相对于因子的相关性;以及
如果相关性大于最小相关性,将其分配给因子。
55.根据权利要求54所述的方法,其中,最小相关性是0.9。
56.根据权利要求36所述的方法,还包括:
识别与因子不正确地分组的同位素/加合物;以及
将由此识别的同位素/加合物重新分配到适当因子。
57.根据权利要求56所述的方法,其中,所述识别步骤包括:
将因子的浓度轮廓与相邻因子的浓度轮廓相比较,以识别相关性;
如果第一因子的浓度轮廓与相邻因子的浓度轮廓之间的相关性大于阈值相关性,那么检查所述相邻因子以定位来自于所述第一因子的同位素/加合物;以及
基于所述检查步骤将所述同位素/加合物重新分配到所述第一因子。
58.根据权利要求57所述的方法,其中,所述阈值相关性是0.9。
59.根据权利要求36所述的方法,其中,相关性参数是用户限定的。
60.根据权利要求36所述的方法,还包括:
防止因子分解。
61.根据权利要求60所述的方法,其中,所述防止步骤包括:
确定局部相关性阈值,该局部相关性阈值基于在一因子内的基础同位素/加合物子簇与所述因子内的其他子簇之间的平均相关性;
将所述因子与临近因子的浓度轮廓相关;以及
如果所述相关性大于局部相关性阈值,那么合并所述因子和所述临近因子。
62.根据权利要求61所述的方法,还包括:
如果因子被合并,将所述因子的浓度轮廓与下一个临近因子相关。
63.根据权利要求61所述的方法,其中,所述阈值相关性是0.9。
64.根据权利要求9所述的方法,其中,所述最小簇长度是5棒。
CN201280020570.6A 2011-03-11 2012-03-12 在色谱系统中处理数据的方法 Expired - Fee Related CN103718036B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201161451952P 2011-03-11 2011-03-11
US61/451,952 2011-03-11
PCT/US2012/028754 WO2012125548A2 (en) 2011-03-11 2012-03-12 Systems and methods to process data in chromatographic systems

Publications (2)

Publication Number Publication Date
CN103718036A true CN103718036A (zh) 2014-04-09
CN103718036B CN103718036B (zh) 2016-06-01

Family

ID=45856043

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201280020570.6A Expired - Fee Related CN103718036B (zh) 2011-03-11 2012-03-12 在色谱系统中处理数据的方法

Country Status (5)

Country Link
US (1) US10488377B2 (zh)
JP (1) JP5941073B2 (zh)
CN (1) CN103718036B (zh)
DE (1) DE112012001185B4 (zh)
WO (1) WO2012125548A2 (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104126119A (zh) * 2012-01-16 2014-10-29 莱克公司 处理色谱系统中数据的系统及方法
CN105334279A (zh) * 2014-08-14 2016-02-17 大连达硕信息技术有限公司 一种高分辨质谱数据的处理方法
CN105445389A (zh) * 2014-09-18 2016-03-30 戴安公司 校准色谱系统以及分析样品的自动化方法
CN106662551A (zh) * 2014-07-03 2017-05-10 株式会社岛津制作所 质谱分析数据处理装置
CN107209156A (zh) * 2015-02-05 2017-09-26 Dh科技发展私人贸易有限公司 经由曲线减法检测基于质谱的相似性
CN108614064A (zh) * 2018-04-10 2018-10-02 华南理工大学 一种二维色谱峰的检测方法及其应用
CN109001354A (zh) * 2018-05-30 2018-12-14 迈克医疗电子有限公司 波峰识别方法和装置、色谱分析仪及存储介质
CN109507347A (zh) * 2017-09-14 2019-03-22 湖南中烟工业有限责任公司 一种色谱峰选择方法
CN112017734A (zh) * 2019-05-31 2020-12-01 塞莫费雪科学(不来梅)有限公司 质谱数据的反卷积
CN113567603A (zh) * 2021-07-22 2021-10-29 华谱科仪(大连)科技有限公司 色谱谱图的检测分析方法及电子设备
CN116242954A (zh) * 2023-05-06 2023-06-09 精智未来(广州)智能科技有限公司 一种呼气分子分析气相色谱数据的自动化分析方法与系统

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5933032B2 (ja) * 2012-01-16 2016-06-08 レコ コーポレイションLeco Corporation クロマトグラフィーピークを処理しグループ化するシステム及び方法
US10802000B2 (en) 2013-03-15 2020-10-13 Dionex Corporation Method of calibrating a chromatography system
JP6079511B2 (ja) * 2013-09-02 2017-02-15 株式会社島津製作所 ピーク抽出方法及びプログラム
US9754774B2 (en) 2014-02-14 2017-09-05 Perkinelmer Health Sciences, Inc. Systems and methods for automated analysis of output in single particle inductively coupled plasma mass spectrometry and similar data sets
EP3937207A1 (en) * 2014-02-14 2022-01-12 PerkinElmer Health Sciences, Inc. System and method for automated analysis of output in single particle inductively coupled plasma mass spectrometry and similar data sets
US11244818B2 (en) 2018-02-19 2022-02-08 Agilent Technologies, Inc. Method for finding species peaks in mass spectrometry
CN108614284B (zh) * 2018-04-24 2022-04-05 北京邮电大学 一种定位信号处理方法、装置及设备
US10784093B1 (en) 2019-04-04 2020-09-22 Thermo Finnigan Llc Chunking algorithm for processing long scan data from a sequence of mass spectrometry ion images
DE102021103389A1 (de) 2021-02-12 2022-08-18 Dionex Softron Gmbh Verfahren und Systeme zum Bestimmen einer Charakteristik eines von einer Pumpe zugeführten Fluids
EP4080514A4 (en) * 2021-02-25 2024-06-26 Acchrom Technologies Co., Ltd. CHROMATOGRAPHIC ANALYSIS SYSTEM, METHOD FOR DETECTING AND EVALUATING A CHROMATOGRAM AND ELECTRONIC DEVICE

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020063208A1 (en) * 2000-11-27 2002-05-30 Surromed, Inc. Median filter for liquid chromatography-mass spectrometry data
WO2006125864A1 (en) * 2005-05-26 2006-11-30 Valtion Teknillinen Tutkimuskeskus Analysis techniques for liquid chromatography/mass spectrometry
US20110054804A1 (en) * 2009-08-26 2011-03-03 Pfaff Hans Method of Improving the Resolution of Compounds Eluted from a Chromatography Device

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3488518A (en) 1965-12-13 1970-01-06 Ibm Peak voltage storage and noise eliminating circuit
JP4865981B2 (ja) * 2000-09-08 2012-02-01 ウォーターズ・テクノロジーズ・コーポレーション 検出器応答プロフィールの境界を決定し、かつプロセスを制御するための方法および装置
WO2003087770A2 (en) * 2002-04-12 2003-10-23 Northeastern University Matched filtration with experimental noise determination for denoising, peak picking and quantitation in lc-ms
US6983213B2 (en) * 2003-10-20 2006-01-03 Cerno Bioscience Llc Methods for operating mass spectrometry (MS) instrument systems
GB2404194A (en) * 2003-07-21 2005-01-26 Amersham Biosciences Ab Automated chromatography/mass spectrometry analysis
CA2501003C (en) * 2004-04-23 2009-05-19 F. Hoffmann-La Roche Ag Sample analysis to provide characterization data
US7781729B2 (en) * 2006-05-26 2010-08-24 Cerno Bioscience Llc Analyzing mass spectral data
US7653496B2 (en) * 2006-02-02 2010-01-26 Agilent Technologies, Inc. Feature selection in mass spectral data
CN101534933B (zh) * 2006-05-26 2013-03-27 沃特世科技公司 关于n维数据的离子检测和参数估计
US7501621B2 (en) 2006-07-12 2009-03-10 Leco Corporation Data acquisition system for a spectrometer using an adaptive threshold
EP2145180B1 (en) * 2007-04-13 2013-12-04 Sequenom, Inc. Comparative sequence analysis processes and systems
JP2009008582A (ja) * 2007-06-29 2009-01-15 Shimadzu Corp クロマトグラムデータ処理装置
US8139833B2 (en) * 2008-04-09 2012-03-20 Boris Fain Analyzing large data sets using a computer system
US8631057B2 (en) 2009-08-25 2014-01-14 International Business Machines Corporation Alignment of multiple liquid chromatography-mass spectrometry runs

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020063208A1 (en) * 2000-11-27 2002-05-30 Surromed, Inc. Median filter for liquid chromatography-mass spectrometry data
WO2006125864A1 (en) * 2005-05-26 2006-11-30 Valtion Teknillinen Tutkimuskeskus Analysis techniques for liquid chromatography/mass spectrometry
US20110054804A1 (en) * 2009-08-26 2011-03-03 Pfaff Hans Method of Improving the Resolution of Compounds Eluted from a Chromatography Device

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
MARIUS C. CODREA等: "Tools for computational processing of LC-MS datasets: A user’s perspective", 《COMPUTER METHODS AND PROGRAMS IN BIOMEDICINE》 *

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104126119A (zh) * 2012-01-16 2014-10-29 莱克公司 处理色谱系统中数据的系统及方法
CN106662551B (zh) * 2014-07-03 2019-09-03 株式会社岛津制作所 质谱分析数据处理装置
CN106662551A (zh) * 2014-07-03 2017-05-10 株式会社岛津制作所 质谱分析数据处理装置
CN105334279A (zh) * 2014-08-14 2016-02-17 大连达硕信息技术有限公司 一种高分辨质谱数据的处理方法
CN105334279B (zh) * 2014-08-14 2017-08-04 大连达硕信息技术有限公司 一种高分辨质谱数据的处理方法
CN105445389A (zh) * 2014-09-18 2016-03-30 戴安公司 校准色谱系统以及分析样品的自动化方法
CN105445389B (zh) * 2014-09-18 2018-07-31 戴安公司 校准色谱系统以及分析样品的自动化方法
CN107209156A (zh) * 2015-02-05 2017-09-26 Dh科技发展私人贸易有限公司 经由曲线减法检测基于质谱的相似性
CN109507347A (zh) * 2017-09-14 2019-03-22 湖南中烟工业有限责任公司 一种色谱峰选择方法
CN108614064A (zh) * 2018-04-10 2018-10-02 华南理工大学 一种二维色谱峰的检测方法及其应用
CN109001354A (zh) * 2018-05-30 2018-12-14 迈克医疗电子有限公司 波峰识别方法和装置、色谱分析仪及存储介质
CN112017734A (zh) * 2019-05-31 2020-12-01 塞莫费雪科学(不来梅)有限公司 质谱数据的反卷积
CN112017734B (zh) * 2019-05-31 2023-12-12 塞莫费雪科学(不来梅)有限公司 包含重叠的同位素模式的质谱数据反卷积分析方法和计算机可读介质
CN113567603A (zh) * 2021-07-22 2021-10-29 华谱科仪(大连)科技有限公司 色谱谱图的检测分析方法及电子设备
CN113567603B (zh) * 2021-07-22 2022-09-30 华谱科仪(大连)科技有限公司 色谱谱图的检测分析方法及电子设备
CN116242954A (zh) * 2023-05-06 2023-06-09 精智未来(广州)智能科技有限公司 一种呼气分子分析气相色谱数据的自动化分析方法与系统

Also Published As

Publication number Publication date
JP5941073B2 (ja) 2016-06-29
DE112012001185B4 (de) 2014-08-28
US10488377B2 (en) 2019-11-26
WO2012125548A3 (en) 2012-12-20
WO2012125548A2 (en) 2012-09-20
JP2014507672A (ja) 2014-03-27
US20140088923A1 (en) 2014-03-27
DE112012001185T5 (de) 2014-01-02
CN103718036B (zh) 2016-06-01

Similar Documents

Publication Publication Date Title
CN103718036A (zh) 在色谱系统中处理数据的方法
CN104126119A (zh) 处理色谱系统中数据的系统及方法
Park et al. Partially collapsed Gibbs samplers: Illustrations and applications
Kaczmarska et al. Application of TauSpinner for studies on tau-lepton polarization and spin correlations in Z, W and H decays at LHC
Holmes A practical guide to the Probability Density Approximation (PDA) with improved implementation and error characterization
Monteiro et al. Fitting isochrones to open cluster photometric data-A new global optimization tool
CN109857804B (zh) 一种分布式模型参数的搜索方法、装置和电子设备
Graves Automatic step size selection in random walk Metropolis algorithms
CN111738521B (zh) 非侵入式电力负荷监测序列生成方法、系统、设备及介质
Faranda et al. Generalized extreme value distribution parameters as dynamical indicators of stability
Ma Adaptive shrinkage in Pólya tree type models
US8725469B2 (en) Optimization of data processing parameters
CN115357764A (zh) 一种异常数据检测方法及装置
Palarea-Albaladejo et al. Package ‘zCompositions’
Yılmaz et al. An economic approach to the management of high‐quality processes
Chirkin Likelihood description for comparing data with simulation of limited statistics
WO2012050581A1 (en) Dataset compression
CN107491417A (zh) 一种基于特定划分的主题模型下的文档生成方法
Domshlak et al. The SelMax planner: Online learning for speeding up optimal planning
Bock Computation of confidence levels for exclusion or discovery of a signal with the method of fractional event counting
Abasov et al. Methodology for the Application of Deep Neural Networks in Searches for New Physics at Colliders and Statistical Interpretation of Expected Results
Dayman et al. Sparse Bayesian Regression with Integrated Feature Selection for Nuclear Reactor Analysis
CN117056203B (zh) 一种基于复杂性的数值表达式型蜕变关系选择方法
Eo Bayesian inference about the types of structural breaks when there are different breaks in many parameters
Moore et al. Methods to Impute Household Income in the National Crime Victimization Survey

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160601

Termination date: 20200312

CF01 Termination of patent right due to non-payment of annual fee