CN108351331A - 色谱质谱分析数据处理方法以及处理装置 - Google Patents

色谱质谱分析数据处理方法以及处理装置 Download PDF

Info

Publication number
CN108351331A
CN108351331A CN201580084378.7A CN201580084378A CN108351331A CN 108351331 A CN108351331 A CN 108351331A CN 201580084378 A CN201580084378 A CN 201580084378A CN 108351331 A CN108351331 A CN 108351331A
Authority
CN
China
Prior art keywords
compound
norms
vector
target compound
spectrum analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201580084378.7A
Other languages
English (en)
Other versions
CN108351331B (zh
Inventor
爱须亮太
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shimadzu Corp
Original Assignee
Shimadzu Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shimadzu Corp filed Critical Shimadzu Corp
Publication of CN108351331A publication Critical patent/CN108351331A/zh
Application granted granted Critical
Publication of CN108351331B publication Critical patent/CN108351331B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8675Evaluation, i.e. decoding of the signal into analytical information
    • G01N30/8679Target compound analysis, i.e. whereby a limited number of peaks is analysed
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8624Detection of slopes or peaks; baseline correction
    • G01N30/8631Peaks
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/62Detectors specially adapted therefor
    • G01N30/72Mass spectrometers
    • G01N30/7233Mass spectrometers interfaced to liquid or supercritical fluid chromatograph
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01JELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
    • H01J49/00Particle spectrometers or separator tubes
    • H01J49/0027Methods for using particle spectrometers
    • H01J49/0036Step by step routines describing the handling of the data generated during a measurement
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01JELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
    • H01J49/00Particle spectrometers or separator tubes
    • H01J49/26Mass spectrometers or separator tubes

Landscapes

  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Engineering & Computer Science (AREA)
  • Library & Information Science (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

利用LC部(1)和MS部(2)在每个测定时间点得到的质谱数据被存储于质谱数据存储部(41)。化合物权重时间序列数据计算部(42)基于在标准质谱库(46)中保存的各种化合物的标准质谱来制作化合物谱矩阵(L),将该矩阵(L)、基于在一个测定时间点t得到的数据的实测矢量(Mt)、测定时间点t的化合物权重矢量(wt)之间的关系确定为线性回归模型,利用引入了正则化项的最小范数估计法来估计未知的化合物权重矢量(wt)。化合物权重时间序列曲线图制作部(43)基于针对所指出的时间范围内的各测定时间点得到的化合物权重矢量(wt),来按每种目标化合物制作表示权重的时间变化的化合物权重时间序列曲线图,利用在该曲线图中出现的峰来进行该化合物的定量、是否含有该化合物的判定。

Description

色谱质谱分析数据处理方法以及处理装置
技术领域
本发明涉及如下的数据处理方法以及处理装置:为了判定试样中有无目标化合物或者对目标化合物进行定量,对由将液相色谱仪(LC)或气相色谱仪(GC)与质谱分析装置组合而成的液相色谱质谱联用仪(LC-MS)或气相色谱质谱联用仪(GC-MS)等色谱质谱联用仪收集到的数据进行处理。
背景技术
在LC-MS中,在质谱分析装置中对从LC的柱发送来的洗脱液重复进行遍及规定的质荷比m/z范围的扫描测定,由此能够时刻获得表示源自洗脱液中的成分的离子的质荷比与信号强度的关系的质谱数据。能够通过从这样得到的数据提取表示特定的一个质荷比下的信号强度的数据并按时间序列顺序排列,来制作表示具有该质荷比的离子的信号强度随时间的变化的提取离子色谱图(XIC)。另外,能够通过提取表示特定的多个质荷比下的信号强度的数据,按每个测定点(保持时间)将该信号强度相加并按时间序列顺序排列,来制作混合离子色谱图(MIC)。另外,能够通过将表示在一个质谱中出现的所有质荷比下的信号强度的数据相加并按时间序列顺序排列,来制作总离子色谱图(TIC)。
例如在想要对试样中含有的目标化合物进行定量的情况下,制作源自该目标化合物的离子的质荷比下的XIC或者包含该质荷比的MIC,在该色谱图上检测与目标化合物对应的峰并计算峰的面积值。然后,参照预先求出的表示该目标化合物的浓度(含有量)与峰面积值的关系的校准曲线,并根据基于实测的色谱图的峰面积值来计算浓度值。另外,在想要调查试样中是否含有目标化合物的情况下,制作源自该目标化合物的离子的质荷比下的XIC,尝试在该XIC上检测与目标化合物对应的峰,如果检测到峰,则能够判断为存在该目标化合物,如果没有检测到峰,则能够判断为不存在该目标化合物。
在决定了作为定量对象或者检测对象的化合物的情况下,不仅源自该目标化合物的离子的质荷比已知,保持时间也已知。因此,通常在XIC或MIC中在该目标化合物的保持时间附近的规定时间范围内检测出峰,决定被检测到的峰的起始点和结束点并计算峰面积值(参照专利文献1等)。
然而,在由于各种因素导致在质谱分析装置中检测的离子的质荷比产生误差(质量偏差)的情况下,有时在原本应该观测到源自该目标化合物的峰的XIC或MIC中未出现源自目标化合物的峰,变得无法进行峰检测和峰面积值的计算。另外,在LC中多种化合物未被充分地分离而在XIC或MIC上源自其它化合物的峰与源自目标化合物的峰重叠的情况下,源自该目标化合物的峰顶的位置在外观上发生偏移,有时脱离了以保持时间为中心的时间范围而无法进行峰检测。另外,在目标化合物的含有量少的情况下,当制作源自该目标化合物的离子的质荷比下的XIC时,噪声相对地变大,有时在噪声的影响下难以检测源自目标化合物的峰或者峰面积值的误差变大。
专利文献1:日本特开2012-42322号公报(段落[0002])
专利文献2:日本特开昭63-308560号公报
非专利文献1:《LassoおよびElastic Net》,[线上],美国MathWorks公司,[2015年10月16日检索],因特网<URL:http://jp.mathworks.com/help/stats/lasso-and-elastic-net.html>
非专利文献2:C.M.Bishop,《Pattern Recognition and Machine Learning》,美国斯普林格(Springer)公司,2006年
发明内容
发明要解决的问题
本发明是为了解决上述问题而完成的,其目的在于提供如下的色谱质谱分析数据处理方法以及处理装置:能够获得与以往的XIC或MIC相比噪声少的源自目标化合物的峰,并且即使在存在噪声的叠加、质量偏差或峰顶的时间方向上的偏移等的情况下,也能够进行与基于在以往的XIC或MIC上观测到的峰的面积值的定量相比更高精度的定量。
用于解决问题的方案
为了解决上述问题而完成的第一发明是对通过色谱质谱分析来随着时间经过重复得到的质谱数据进行处理的色谱质谱分析数据处理方法,其特征在于,包括以下步骤:
a)化合物权重矢量计算步骤,将基于在任意的测定时间点t得到的质谱数据的实测矢量Mt、测定时间点t的化合物权重矢量wt以及基于目标化合物的标准质谱的化合物谱矩阵L之间的关系确定为线性回归模型,针对在规定时间范围内的每个测定时间点得到的质谱数据执行最大似然估计处理,由此分别求出每个该测定时间点的化合物权重矢量wt,其中,所述实测矢量Mt是将质荷比点数设为维数且将信号强度值设为元素的矢量,所述化合物权重矢量wt是将目标化合物的数量设为维数且将各目标化合物的权重设为元素的矢量,所述化合物谱矩阵L是将质荷比点数和目标化合物的数量分别设为行数和列数且将信号强度值设为元素的矩阵,所述规定时间范围至少包含目标化合物的保持时间,所述最大似然估计处理是利用引入了正则化项的最小范数估计法来基于已知的所述实测矢量Mt和所述化合物谱矩阵L估计化合物权重矢量wt的处理;以及
b)峰检测步骤,基于通过所述化合物权重矢量计算步骤针对规定时间范围得到的多个所述化合物权重矢量wt,来制作将目标化合物的权重按时间序列顺序排列所得到的表示该权重的时间变化的曲线图,在该曲线图中检测与目标化合物对应的峰,
其中,利用通过所述峰检测步骤检测到的峰来进行目标化合物的定性或者定量。
另外,为了解决上述问题而完成的第二发明是用于实施上述第一发明所涉及的色谱质谱分析数据处理方法的处理装置,是对通过色谱质谱分析来随着时间经过重复得到的质谱数据进行处理的色谱质谱分析数据处理装置,其特征在于,具备:
a)化合物权重矢量计算部,其将基于在任意的测定时间点t得到的质谱数据的实测矢量Mt、测定时间点t的化合物权重矢量wt以及基于目标化合物的标准质谱的化合物谱矩阵L之间的关系确定为线性回归模型,针对在规定时间范围内的每个测定时间点得到的质谱数据执行最大似然估计处理,由此分别求出每个该测定时间点的化合物权重矢量wt,其中,所述实测矢量Mt是将质荷比点数设为维数且将信号强度值设为元素的矢量,所述化合物权重矢量wt是将目标化合物的数量设为维数且将各目标化合物的权重设为元素的矢量,所述化合物谱矩阵L是将质荷比点数和目标化合物的数量分别设为行数和列数且将信号强度值设为元素的矩阵,所述规定时间范围至少包含目标化合物的保持时间,所述最大似然估计处理是利用引入了正则化项的最小范数估计法来基于已知的所述实测矢量Mt和所述化合物谱矩阵L估计化合物权重矢量wt的处理;
b)峰检测部,其基于由所述化合物权重矢量计算部针对规定时间范围得到的多个所述化合物权重矢量wt,来制作将目标化合物的权重按时间序列顺序排列所得到的表示该权重的时间变化的曲线图,在该曲线图中检测与目标化合物对应的峰;以及
c)处理部,其基于由所述峰检测部得到的峰检测结果对目标化合物进行定性,或者基于由所述峰检测部检测到的峰的面积或者高度对目标化合物进行定量。
在第一发明和第二发明中,色谱质谱分析通常是LC/MS分析或者GC/MS分析。另外,即使在不进行基于柱的成分分离而使试样随着流动相的流动导入到质谱分析装置的流动注射分析(FIA)法中,被导入到质谱分析装置的一种成分(化合物)的浓度也与LC和GC同样地山形地变化。因而,上述色谱质谱分析还包括进行基于FIA法的试样导入的质谱分析。
在第一发明所涉及的色谱质谱分析数据处理方法中,在化合物权重矢量计算步骤中,典型地确定用下面的式(1)表示的线性回归模型。此外,在此所说的化合物的权重表示试样中的各化合物的贡献程度,因此实质上反映浓度或相对的含有量。
Mt=Lwt+ε …(1)
在此,ε是表示噪声的概率矢量。Mt是通过实测得到的数据本身,L能够通过实验或者根据既有的数据库等来求出。因而,Mt和L是已知的,能够归纳为式(1)是在被提供了Mt和L的情况下求出未知的wt的最大似然估计值的线性回归分析的问题。为了解决这种问题,以往已知利用了最小二乘法的方法(参照专利文献2)。然而,在这种以往的方法中有时发生过度学习而使估计的误差反而变大。因此,在该化合物权重矢量计算步骤中,利用引入了正则化项的最小范数估计法来估计化合物权重矢量wt。
在化合物权重矢量计算步骤中,例如在由用户设定的时间范围或者以对于由用户指定的目标化合物而言已知的保持时间为中心的具有规定的时间幅度的时间范围内包含的各测定时间点,分别根据基于通过实测得到的质谱数据的实测矢量Mt和不依赖于测定时间点的通用的化合物谱矩阵L来求出化合物权重矢量wt。在峰检测步骤中,根据以这种方式得到的多种化合物权重矢量wt制作将目标化合物的权重按时间序列顺序排列所得到的权重时间序列曲线图。该权重时间序列曲线图表示该目标化合物的权重随时间的变化,因此与XIC同样地出现与目标化合物对应的峰,该峰的形状与XIC上的峰的形状相似。
因而,如果在权重时间序列曲线图上检测到源自目标化合物的(被估计为源自目标化合物的)峰,则能够判断为在所测定的试样中含有该目标化合物。另外,预先求出表示权重时间序列曲线图上的峰面积值与浓度值的关系的校准曲线,通过参照该校准曲线,能够根据权重时间序列曲线图上的峰面积值来求出浓度值。
在第一发明所涉及的色谱质谱分析数据处理方法和第二发明所涉及的色谱质谱分析数据处理装置中,在最小范数估计法中利用的正则化项能够设为L1范数和L2范数中的任一个。
一般地,L1范数的选择性高,因此在采用L1范数作为正则化项的情况下,能够针对一种目标化合物获得健全(robust)的峰。相反,在XIC上源自多种化合物的峰有所重叠的状况、即变量间的相关性高的状况下,在权重时间序列曲线图上无法获得适当的峰。另一方面,在采用L2范数作为正则化项的情况下,即使在XIC上源自多种化合物的峰有所重叠那样的状况下,也能够在这些每种化合物的权重时间序列曲线图上分别获得某种程度上足够的峰。
因此,在第一发明所涉及的色谱质谱分析数据处理方法以及第二发明所涉及的色谱质谱分析数据处理装置中,优选的是,将L1范数与L2范数切换地作为正则化项,或者同时使用L1范数和L2范数作为正则化项。
优选设为,在能够将L1范数与L2范数切换地作为正则化项的情况下,用户能够根据试样的状况(例如作为测定对象的目标化合物是多还是少、或测定对象以外的杂质是多还是少等)等来对使用L1范数和L2范数中的哪一个进行选择。另外,也可以根据基于收集到的质谱数据制作的XIC、MIC、TIC的状态来自动地判断化合物的重叠的状况,基于其结果来对使用L1范数和L2范数中的哪一个进行切换。
另外,更为优选的是,通过引入弹性网络(Elastic Net)来在L1范数与L2范数之间进行切换或者同时使用L1范数和L2范数。如非专利文献1等所记载的那样,在弹性网络中,根据参数α(0≤α≤1)的值调整L1范数和L2范数的贡献程度。因而,用户通过手动或者如上所述的自动的判定处理来决定该参数α,根据此时的化合物的重叠的状况等来获得与一种或者多种目标化合物对应的更加良好、即SN比高的峰。
发明的效果
根据本发明所涉及的色谱质谱分析数据处理方法以及处理装置,能够获得与在基于质谱数据制作的XIC或MIC上观测到的峰相比噪声更少的健全的峰。由此,能够在例如根据有无源自目标化合物的峰来判定试样中是否含有该目标化合物那样的情况下提高其判定的精度。另外,能够在基于检测到的峰的面积值对该目标化合物进行定量的情况下,提高峰面积值的精度,从而使定量精度提高。
另外,根据本发明所涉及的色谱质谱分析数据处理方法以及处理装置,在权重时间序列曲线图上不仅反映了仅特定质荷比的信号强度,还反映了仅接近特定质荷比的质荷比的信号强度。因此,即使在源自目标化合物的离子的质荷比产生偏差的情况下,也能够获得源自该目标化合物的良好的峰。另外,适当地确定制作权重时间序列曲线图的时间范围,由此即使在XIC上源自目标化合物的峰的峰顶存在时间方向上的偏移的情况下,也能够可靠地获得源自该目标化合物的峰。
附图说明
图1是具备本发明所涉及的数据处理装置的LC-MS的一个实施例的概要结构图。
图2是表示本实施例的LC-MS的化合物权重时间序列数据获取处理的过程的流程图。
图3是用于说明化合物权重时间序列数据获取处理的概念图。
图4是表示在利用弹性网络进行了正则化型最小范数估计的情况下获得的化合物权重时间序列曲线图的一例的图。
具体实施方式
以下,参照所附附图对具备本发明所涉及的色谱质谱分析数据处理装置的LC-MS的一个实施例进行说明。
图1是本实施例的LC-MS的概要结构图。
本实施例的LC-MS具备液相色谱仪(LC)部1、质谱分析(MS)部2、模拟数字转换器(ADC)3、数据处理部4、输入部5以及显示部6。虽然未图示,但LC部1包括:以固定流量输送流动相的送液泵、向所输送的流动相中注入试样的注射器以及将试样中含有的化合物在时间方向上分离的柱等。MS部2例如是具备电喷雾离子源的四极型或飞行时间型的质谱分析装置。
为了进行后述的特征性的数据处理,数据处理部4具备质谱数据存储部41、化合物权重时间序列数据计算部42、化合物权重时间序列曲线图制作部43、峰检测部44、定量运算部45、标准质谱库46以及化合物权重时间序列校准曲线存储部47来作为功能块。标准质谱库46是针对各种化合物收录了标准质谱的数据库,其是能够通过针对标准试样进行的实际的测定来获取的数据或者是能够从一般公开的化合物数据库等获取的数据。此外,该数据处理部4的功能通常能够设为通过使安装于个人计算机的专用的数据处理软件在该计算机上运行来具体实现的结构。
概要地说明本实施例的LC-MS的针对试样进行数据收集时的动作。
在LC部1中,在规定的定时从注射器向以大致固定流速被输送到柱的流动相中注入试样。随着流动相的流动,试样被导入到柱中,该试样中含有的各种化合物在通过柱的期间在时间方向上分离。因而,随着时间经过,在从LC部向MS部2导入的试样中依次含有不同的化合物。在MS部2中,在每个存在规定的时间间隔的测定时间点重复执行遍及规定质荷比范围的扫描测定。通过一次的扫描测定来获得构成一个质谱的数据,该数据从ADC 3被输入到数据处理部4并被存储到质谱数据存储部41。这样,在质谱数据存储部41中存储有在从向流动相中注入了试样的时间点起直到测定结束时间点为止的期间内的各测定时间点得到的质谱数据。
接着,说明基于如上所述那样存储于质谱数据存储部41的数据对试样中含有的目标化合物进行定量时的特征性的数据处理。
图2是表示化合物权重时间序列曲线图制作处理的过程的流程图,图3是用于说明化合物权重时间序列曲线图制作处理的概念图。
在对保持时间和定量离子的质荷比已知的目标化合物进行定量的情况下,通常制作该定量离子(或者除此以外的特征性的离子)的质荷比下的XIC,在该XIC上检测源自目标化合物的峰。与此相对地,在本实施例的LC-MS中,实施如以下那样的化合物权重时间序列曲线图制作处理,在该曲线图上检测源自目标化合物的峰。首先,对该化合物权重时间序列曲线图进行说明。
当前,将表示在某个测定时刻t通过测定得到的质谱数据的实测矢量设为Mt,将表示多种化合物的标准质谱的化合物谱矩阵设为L,将测定时刻t的化合物权重矢量设为wt。实测矢量Mt是将质谱的质荷比的点数P设为维数、将该P个质荷比值中的各质荷比值下的信号强度值设为元素的P维矢量。化合物谱矩阵L是将化合物的数量N和质谱的质荷比的点数P设为行数和列数、将各化合物的P个质荷比值中的各质荷比值下的信号强度值设为元素的矩阵。化合物权重矢量wt是将化合物的数量N设为维数、将该N种化合物各自的权重的值设为元素的N维矢量。当用线性回归模型表示这些Mt、wt、L的关系时,能够如已经说明的式(1)那样记载。再次表示该式(1)。
Mt=Lwt+ε …(1)
其中,ε是表示噪声的概率矢量。
根据质谱数据存储部41中存储的数据来求出实测矢量Mt。另一方面,能够基于标准质谱库46中预先收录的数据来制作化合物谱矩阵L。如果将ε视为高斯白噪声,则在式(1)中未知的是wt。因此,考虑在式(1)中求出化合物权重矢量wt的最大似然估计值的线性回归分析的问题(参照非专利文献2等)。作为这样的反问题的标准的解法,已知最小范数估计法,但在基于最小二乘法的最小范数估计中易于发生过度学习。因此,利用引入了正则化项的最小范数估计法。作为正则化项,已知L1范数和L2范数,但当引入更为标准的L2范数来作为正则化项时,使下面的式(2)的评价函数最小的wt为最佳解。
J(w)=(1/2)||Mt-Lwt||2+(λ/2)||wtTwt|| …(2)
为了求出使上述评价函数最小的wt的值,评价与J(w)的w有关的微分,求出其微分值为零的点即可。评价函数的微分为下面的式(3)。
dJ(w)/dw=-LT(Mt-Lwt)+λwt …(3)
在此,λ是适当地决定的正则化参数。使式(3)中的左边最小化的wt是用于最大似然估计的参数,因此当将微分置为0来整理式(3)时,成为
(LTL+λI)wt=LTMt …(4)。
因而,化合物权重矢量wt的估计值成为
wt=(LTL+λI)-1LTMt …(5)。
在式(5)中求出的是某个测定时间点t的化合物权重矢量wt。因此,按从测定开始时间点起直到测定结束时间点为止的整个测定时间范围或者规定时间范围中包含的每个测定时间点求出该化合物权重矢量wt,当将该化合物权重矢量wt按时间序列顺序排列时,获得化合物权重时间序列矩阵W。该矩阵是将化合物数和测定时间点的点数设为行数和列数的矩阵。通过从该矩阵提取特定的化合物的权重来获得化合物时间序列曲线图。该权重反映了化合物的浓度,因此化合物时间序列曲线图表示某种化合物的浓度随时间的变化。因而,该化合物时间序列曲线图中出现的峰能够与XIC或MIC上的峰同样地用于化合物的定性(有无的判定)和定量。在该方法中,化合物谱矩阵也可以是由与仅一种目标化合物有关的元素构成的矩阵,但通过根据与多种目标化合物对应的标准质谱制作化合物谱矩阵,能够一次性求出该多种目标化合物的化合物权重时间序列矩阵和化合物权重时间序列曲线图。
接着,参照图2、图3来说明具体的处理过程。
在执行处理之前,化合物权重时间序列数据计算部42设定规定的正则化参数λ(步骤S1)。一般地,本装置的制造商能够预先通过实验求出该正则化参数λ。接着,用户从输入部5指定处理对象的数据、一种或者多种目标化合物以及处理对象时间范围t1~t2(步骤S2)。化合物权重时间序列数据计算部42从标准质谱库46读出与所指定的目标化合物对应的标准质谱,并制作化合物谱矩阵L(步骤S3)。如图3所示,该化合物谱矩阵L在估计化合物权重矢量wt时是与测定时间无关地被通用的。
化合物权重时间序列数据计算部42将所指定的处理对象时间范围内的最初的测定时间点t1设置为时间变量t(步骤S4)。然后,在被指定为处理对象的数据中,从质谱数据存储部41读出测定时间点t的质谱数据,并制作实测矢量Mt(步骤S5)。基于以这种方式得到的实测矢量Mt和上述化合物谱矩阵L,通过上述方法来估计化合物权重矢量wt(步骤S6)。暂时存储所得到的化合物权重矢量wt。
接着,判定测定时间点t是否为处理对象时间范围内的最后的测定时间点t2(步骤S7),如果当前测定时间点t没有达到t2,则将对当前测定时间点t加上测定时间间隔Δt后的时间点设为新的测定时间点t(步骤S8),返回到步骤S5。因而,通过重复进行步骤S5~S8,如图3所示,在t1~t2的时间范围内的彼此隔开测定时间间隔Δt的各测定时间点分别获得化合物权重矢量wt。如果当前测定时间点t达到t2,则在步骤S7中判定为“是”,化合物权重时间序列曲线图制作部43通过将化合物权重矢量按时间序列顺序排列来制作化合物权重时间序列矩阵,再提取与所指定的目标化合物对应的权重的值并进行曲线图化,由此制作化合物权重时间序列曲线图(步骤S9)。
这样,按由用户指定的每种目标化合物求出表示权重的时间变化的化合物权重时间序列曲线图。
如上所述,与某一种化合物对应的化合物权重时间序列曲线图与XIC同样地反映了该化合物的浓度,因此该化合物权重时间序列曲线图上的源自该化合物的峰的形状与该XIC上的源自该化合物的峰的形状相似。因此,峰检测部44按每种目标化合物在化合物权重时间序列曲线图上检测峰。峰检测的方法能够利用与以往相同的算法。如果峰检测部44检测到峰,则计算该峰的面积值。定量运算部45将计算出的峰面积值与化合物权重时间序列校准曲线存储部47中存储的对应于相同目标化合物的校准曲线进行对照,来导出定量值(浓度值或含有量)。此外,在化合物权重时间序列曲线图上没有检测到有意义的峰的情况下,能够得出试样中不含有该化合物的结论。
在指定了多种目标化合物的情况下,利用与目标化合物对应的化合物权重时间序列曲线图来进行同样的处理即可。这样,如果求出定量结果,则从显示部6输出该定量结果。另外,优选将在该定量运算中利用的化合物权重时间序列曲线图也一起显示在显示部6的画面上。
此外,设为在化合物权重时间序列校准曲线存储部47中预先存储有通过实验求出的每种化合物的表示化合物权重时间序列曲线图上的峰面积值与定量值的关系的校准曲线。
在上述说明中,将L2范数用作估计化合物权重矢量wt时的正则化项,但也能够将L1范数用作正则化项。
一般地,色谱曲线图中的分离性能良好且不存在化合物的重叠、即源自目标化合物的峰是孤立峰的情况下,与将L2范数用作正则化项相比,将L1范数用作正则化项的话,噪声的去除效果更高,峰的SN比更高。另一方面,在多种化合物互相重叠的情况下,特别是在量比较多的化合物与微量的化合物互相重叠的情况下,如果利用L1范数的正则化项,则微小的峰的权重被大强度的峰吸收,微小的峰的权重收敛为零而有可能无法被检测到。与此相对地,如果利用L2范数的正则化项,则虽然各个峰的SN比没有变高,但能够将互相重叠的峰分离从而也观测到微小的峰。
因而,在能够根据试样中含有的化合物的种类等在某种程度上可靠地估计化合物的重叠状况的情况下,根据其估计结果唯一地选择L1范数或者L2范数来作为正则化项即可。但是,大多情况下或者通常难以事先可靠地估计化合物的重叠状况。因此,优选引入弹性网络(Elastic Net)来在L1范数与L2范数之间进行切换或者同时使用L1范数和L2范数。如非专利文献1等所记载的那样,在弹性网络中,与参数α(0≤α≤1)的值相应地调整L1范数和L2范数的贡献程度。具体地说,在α=0的情况下使用L2范数,在α=1的情况下使用L1范数,在0<α<1的期间,成为α越接近0则越接近L2范数的状态。因而,通过根据试样中含有的化合物的状况等提供恰当的参数α,能够获得更加健全的峰。
当然,用户也可以手动地设定该参数α,但实际上适当地确定参数α是很困难的或者是耗费工夫的。因此,优选的是,例如根据在所得到的XIC上检测到的峰自动判定化合物的重叠状况,在基于其判定结果设定恰当的参数α之后实施如上所述的处理。
图4是表示在利用弹性网络进行了正则化型最小范数估计的情况下获得的化合物权重时间序列曲线图的一例的图。图4的(a)的左边是在XIC上A、B、C三种化合物重叠的例子,但即使设为不能将在XIC上重叠的峰完全分离,检测存在峰的重叠的情况也比较容易。在该情况下,获知在大的峰的起始点与结束点之间的时间范围内存在三个以上的小的峰的可能性高,因此设定接近0的值来作为参数α。其结果,例如图4的(a)的右边所示,能够获得观测到与化合物A、B、C分别对应的峰的三个化合物权重时间序列曲线图。
图4的(b)的左边是在XIC上噪声大但不存在化合物的重叠的例子。例如能够通过平滑处理等来去除重叠于大的峰上的源自噪声的小的峰,因此在该情况下,能够判断为源自单一化合物的峰的可能性高。因此,设定接近1的值来作为参数α。其结果,例如图4的(b)右边所示,能够获得观测到被良好地去除了噪声的SN比高的峰的化合物权重时间序列曲线图。
此外,上述实施例将本发明应用于通过LC-MS得到的数据,但也能够应用于通过GC-MS得到的数据。
另外,上述实施例是本发明的一例,在本发明的宗旨的范围内适当施加变形、追加、修改也包含在本申请专利权利要求书中,这是显而易见的。
附图标记说明
1:液相色谱仪(LC)部;2:质谱分析(MS)部;3:模拟数字转换器(ADC);4:数据处理部;41:质谱数据存储部;42:时间序列数据计算部;43:时间序列曲线图制作部;44:峰检测部;45:定量运算部;46:标准质谱库;47:时间序列校准曲线存储部;5:输入部;6:显示部。

Claims (10)

1.一种色谱质谱分析数据处理方法,对通过色谱质谱分析来随着时间经过重复得到的质谱数据进行处理,所述色谱质谱分析数据处理方法的特征在于,包括以下步骤:
a)化合物权重矢量计算步骤,将基于在任意的测定时间点t得到的质谱数据的实测矢量Mt、测定时间点t的化合物权重矢量wt以及基于目标化合物的标准质谱的化合物谱矩阵L之间的关系确定为线性回归模型,针对在规定时间范围内的每个测定时间点得到的质谱数据执行最大似然估计处理,由此分别求出每个该测定时间点的化合物权重矢量wt,其中,所述实测矢量Mt是将质荷比点数设为维数且将信号强度值设为元素的矢量,所述化合物权重矢量wt是将目标化合物的数量设为维数且将各目标化合物的权重设为元素的矢量,所述化合物谱矩阵L是将质荷比点数和目标化合物的数量分别设为行数和列数且将信号强度值设为元素的矩阵,所述规定时间范围至少包含目标化合物的保持时间,所述最大似然估计处理是利用引入了正则化项的最小范数估计法来基于已知的所述实测矢量Mt和所述化合物谱矩阵L估计化合物权重矢量wt的处理;以及
b)峰检测步骤,基于通过所述化合物权重矢量计算步骤针对规定时间范围得到的多个所述化合物权重矢量wt,来制作将目标化合物的权重按时间序列顺序排列所得到的表示该权重的时间变化的曲线图,在该曲线图中检测与目标化合物对应的峰,
其中,利用通过所述峰检测步骤检测到的峰来进行目标化合物的定性或者定量。
2.根据权利要求1所述的色谱质谱分析数据处理方法,其特征在于,
所述正则化项是L1范数。
3.根据权利要求1所述的色谱质谱分析数据处理方法,其特征在于,
所述正则化项是L2范数。
4.根据权利要求1所述的色谱质谱分析数据处理方法,其特征在于,
将L1范数与L2范数切换地作为所述正则化项,或者同时使用L1范数和L2范数作为所述正则化项。
5.根据权利要求4所述的色谱质谱分析数据处理方法,其特征在于,
通过引入弹性网络,来在L1范数与L2范数之间进行切换或者同时使用L1范数和L2范数。
6.一种色谱质谱分析数据处理装置,对通过色谱质谱分析来随着时间经过重复得到的质谱数据进行处理,所述色谱质谱分析数据处理装置的特征在于,具备:
a)化合物权重矢量计算部,其将基于在任意的测定时间点t得到的质谱数据的实测矢量Mt、测定时间点t的化合物权重矢量wt以及基于目标化合物的标准质谱的化合物谱矩阵L之间的关系确定为线性回归模型,针对在规定时间范围内的每个测定时间点得到的质谱数据执行最大似然估计处理,由此分别求出每个该测定时间点的化合物权重矢量wt,其中,所述实测矢量Mt是将质荷比点数设为维数且将信号强度值设为元素的矢量,所述化合物权重矢量wt是将目标化合物的数量设为维数且将各目标化合物的权重设为元素的矢量,所述化合物谱矩阵L是将质荷比点数和目标化合物的数量分别设为行数和列数且将信号强度值设为元素的矩阵,所述规定时间范围至少包含目标化合物的保持时间,所述最大似然估计处理是利用引入了正则化项的最小范数估计法来基于已知的所述实测矢量Mt和所述化合物谱矩阵L估计化合物权重矢量wt的处理;
b)峰检测部,其基于由所述化合物权重矢量计算部针对规定时间范围得到的多个所述化合物权重矢量wt,来制作将目标化合物的权重按时间序列顺序排列所得到的表示该权重的时间变化的曲线图,在该曲线图中检测与目标化合物对应的峰;以及
c)处理部,其基于由所述峰检测部得到的峰检测结果对目标化合物进行定性,或者基于由所述峰检测部检测到的峰的面积或高度对目标化合物进行定量。
7.根据权利要求6所述的色谱质谱分析数据处理装置,其特征在于,
所述正则化项是L1范数。
8.根据权利要求6所述的色谱质谱分析数据处理装置,其特征在于,
所述正则化项是L2范数。
9.根据权利要求6所述的色谱质谱分析数据处理装置,其特征在于,
将L1范数与L2范数切换地作为所述正则化项,或者同时使用L1范数和L2范数作为所述正则化项。
10.根据权利要求9所述的色谱质谱分析数据处理装置,其特征在于,
通过引入弹性网络,来在L1范数与L2范数之间进行切换或者同时使用L1范数和L2范数。
CN201580084378.7A 2015-11-05 2015-11-05 色谱质谱分析数据处理方法以及处理装置 Expired - Fee Related CN108351331B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2015/081148 WO2017077618A1 (ja) 2015-11-05 2015-11-05 クロマトグラフ質量分析データ処理方法及び処理装置

Publications (2)

Publication Number Publication Date
CN108351331A true CN108351331A (zh) 2018-07-31
CN108351331B CN108351331B (zh) 2020-06-02

Family

ID=58661804

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580084378.7A Expired - Fee Related CN108351331B (zh) 2015-11-05 2015-11-05 色谱质谱分析数据处理方法以及处理装置

Country Status (5)

Country Link
US (1) US10866222B2 (zh)
EP (1) EP3407061A4 (zh)
JP (1) JP6409983B2 (zh)
CN (1) CN108351331B (zh)
WO (1) WO2017077618A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113196053A (zh) * 2018-12-20 2021-07-30 佳能株式会社 信息处理装置、信息处理装置的控制方法及程序
CN114778752A (zh) * 2021-01-22 2022-07-22 株式会社岛津制作所 色谱仪质量分析装置
CN116106464A (zh) * 2023-04-10 2023-05-12 西湖欧米(杭州)生物科技有限公司 质谱数据质量程度或概率的控制系统、评估系统及方法
CN117907511A (zh) * 2024-03-20 2024-04-19 浙江灵析精仪科技发展有限公司 一种多组分重叠峰的自动化解析方法、装置及电子设备

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11788995B2 (en) * 2016-08-10 2023-10-17 Mls Acq, Inc. System and method for background removal in spectrometry system
JP6969441B2 (ja) * 2018-02-26 2021-11-24 株式会社島津製作所 測定データ処理方法、測定データ処理装置、及び測定データ処理用プログラム
JP6817243B2 (ja) * 2018-02-28 2021-01-20 日本電子株式会社 スペクトル処理装置及び方法
WO2020188454A1 (en) * 2019-03-15 2020-09-24 Waters Technologies Ireland Limited Techniques for targeted compound analysis
JP6683335B1 (ja) 2019-07-10 2020-04-15 フロンティア・ラボ株式会社 含有判定支援システム及び含有判定支援方法
JP7447774B2 (ja) 2020-11-30 2024-03-12 株式会社島津製作所 ガス分析装置およびガス分析装置の状態検出方法
JP7440870B2 (ja) 2021-01-22 2024-02-29 株式会社島津製作所 2つの変数により定まるデータの解析方法
CN115545082A (zh) * 2022-10-20 2022-12-30 广东省麦思科学仪器创新研究院 质谱图生成方法、装置、系统及可读存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030040123A1 (en) * 2001-08-24 2003-02-27 Surromed, Inc. Peak selection in multidimensional data
CN102788849A (zh) * 2012-06-01 2012-11-21 中国人民解放军第二军医大学 一种色谱-质谱代谢组学数据分析的新方法
CN103197177A (zh) * 2013-03-20 2013-07-10 山东电力集团公司济宁供电公司 一种基于贝叶斯网络的变压器故障诊断分析方法
WO2015015106A1 (fr) * 2013-07-31 2015-02-05 Biomerieux Sa Procede et dispositif d'analyse d'un echantillon biologique
CN104504706A (zh) * 2014-12-26 2015-04-08 天津大学 一种气相色谱质谱谱图匹配方法
WO2015056311A1 (ja) * 2013-10-16 2015-04-23 株式会社島津製作所 クロマトグラムデータ処理装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4807148A (en) * 1987-05-29 1989-02-21 Hewlett-Packard Company Deconvolving chromatographic peaks
US20060255258A1 (en) * 2005-04-11 2006-11-16 Yongdong Wang Chromatographic and mass spectral date analysis
JP5533255B2 (ja) * 2010-05-24 2014-06-25 株式会社島津製作所 質量分析方法及び装置
JP5561016B2 (ja) 2010-08-19 2014-07-30 株式会社島津製作所 クロマトグラフ質量分析装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030040123A1 (en) * 2001-08-24 2003-02-27 Surromed, Inc. Peak selection in multidimensional data
CN102788849A (zh) * 2012-06-01 2012-11-21 中国人民解放军第二军医大学 一种色谱-质谱代谢组学数据分析的新方法
CN103197177A (zh) * 2013-03-20 2013-07-10 山东电力集团公司济宁供电公司 一种基于贝叶斯网络的变压器故障诊断分析方法
WO2015015106A1 (fr) * 2013-07-31 2015-02-05 Biomerieux Sa Procede et dispositif d'analyse d'un echantillon biologique
WO2015056311A1 (ja) * 2013-10-16 2015-04-23 株式会社島津製作所 クロマトグラムデータ処理装置
CN104504706A (zh) * 2014-12-26 2015-04-08 天津大学 一种气相色谱质谱谱图匹配方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113196053A (zh) * 2018-12-20 2021-07-30 佳能株式会社 信息处理装置、信息处理装置的控制方法及程序
CN114778752A (zh) * 2021-01-22 2022-07-22 株式会社岛津制作所 色谱仪质量分析装置
CN114778752B (zh) * 2021-01-22 2023-09-22 株式会社岛津制作所 色谱仪质量分析装置
CN116106464A (zh) * 2023-04-10 2023-05-12 西湖欧米(杭州)生物科技有限公司 质谱数据质量程度或概率的控制系统、评估系统及方法
CN116106464B (zh) * 2023-04-10 2023-07-25 西湖欧米(杭州)生物科技有限公司 质谱数据质量程度或概率的控制系统、评估系统及方法
CN117907511A (zh) * 2024-03-20 2024-04-19 浙江灵析精仪科技发展有限公司 一种多组分重叠峰的自动化解析方法、装置及电子设备

Also Published As

Publication number Publication date
WO2017077618A1 (ja) 2017-05-11
US20190041369A1 (en) 2019-02-07
EP3407061A1 (en) 2018-11-28
JPWO2017077618A1 (ja) 2018-05-17
EP3407061A4 (en) 2019-10-23
US10866222B2 (en) 2020-12-15
JP6409983B2 (ja) 2018-10-24
CN108351331B (zh) 2020-06-02

Similar Documents

Publication Publication Date Title
CN108351331A (zh) 色谱质谱分析数据处理方法以及处理装置
US10121643B2 (en) Chromatography/mass spectrometry data processing device
Stein An integrated method for spectrum extraction and compound identification from gas chromatography/mass spectrometry data
JP3805979B2 (ja) 質量分析方法および装置
CN103443899B (zh) 质量分析装置
JP6088177B2 (ja) 解析装置、解析方法、プログラム
JP2005291715A (ja) におい測定装置
CN104246488B (zh) 质量分析装置
JP2014509385A (ja) バックグラウンド減算を媒介したデータ依存式収集方法及びシステム
CN103282768B (zh) 色谱质量分析装置
JP7409462B2 (ja) クロマトグラム表示装置
CN106062548A (zh) 质谱分析方法及质谱分析装置
CN105518448A (zh) 色谱质谱分析用数据处理装置
Crowell et al. Increasing confidence of LC–MS identifications by utilizing ion mobility spectrometry
JP6508342B2 (ja) 高分子化合物の定量分析方法及び該定量分析のためのデータ処理装置
CN109643635A (zh) 用于在扫描swath数据中识别前体及产物离子对的系统及方法
JP4782579B2 (ja) タンデム型質量分析システム及び方法
CN105008908A (zh) 数据处理装置以及数据处理方法
JP2013195099A (ja) クロマトグラフ質量分析データ処理装置
US11879879B2 (en) Spectrum data processing device
US9823228B2 (en) Chromatograph mass spectrometer and control method therefor
CN108780073A (zh) 色谱仪装置
Erny et al. Algorithm for comprehensive analysis of datasets from hyphenated high resolution mass spectrometric techniques using single ion profiles and cluster analysis
US9779922B1 (en) Generation of discovery ion currents and mass spectrometry and uses thereof
CN108780066A (zh) 质谱分析装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20200602

Termination date: 20211105