WO2017077618A1 - クロマトグラフ質量分析データ処理方法及び処理装置 - Google Patents

クロマトグラフ質量分析データ処理方法及び処理装置 Download PDF

Info

Publication number
WO2017077618A1
WO2017077618A1 PCT/JP2015/081148 JP2015081148W WO2017077618A1 WO 2017077618 A1 WO2017077618 A1 WO 2017077618A1 JP 2015081148 W JP2015081148 W JP 2015081148W WO 2017077618 A1 WO2017077618 A1 WO 2017077618A1
Authority
WO
WIPO (PCT)
Prior art keywords
compound
norm
mass spectrometry
time
data processing
Prior art date
Application number
PCT/JP2015/081148
Other languages
English (en)
French (fr)
Inventor
亮太 愛須
Original Assignee
株式会社島津製作所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社島津製作所 filed Critical 株式会社島津製作所
Priority to JP2017548575A priority Critical patent/JP6409983B2/ja
Priority to CN201580084378.7A priority patent/CN108351331B/zh
Priority to US15/773,702 priority patent/US10866222B2/en
Priority to EP15907804.7A priority patent/EP3407061A4/en
Priority to PCT/JP2015/081148 priority patent/WO2017077618A1/ja
Publication of WO2017077618A1 publication Critical patent/WO2017077618A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8675Evaluation, i.e. decoding of the signal into analytical information
    • G01N30/8679Target compound analysis, i.e. whereby a limited number of peaks is analysed
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8624Detection of slopes or peaks; baseline correction
    • G01N30/8631Peaks
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/62Detectors specially adapted therefor
    • G01N30/72Mass spectrometers
    • G01N30/7233Mass spectrometers interfaced to liquid or supercritical fluid chromatograph
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01JELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
    • H01J49/00Particle spectrometers or separator tubes
    • H01J49/0027Methods for using particle spectrometers
    • H01J49/0036Step by step routines describing the handling of the data generated during a measurement
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01JELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
    • H01J49/00Particle spectrometers or separator tubes
    • H01J49/26Mass spectrometers or separator tubes

Definitions

  • the present invention relates to liquid chromatograph mass spectrometry in which a liquid chromatograph (LC) or gas chromatograph (GC) is combined with a mass spectrometer in order to determine the presence or absence of a target compound in a sample or to quantify the target compound.
  • the present invention relates to a data processing method and a processing apparatus for processing data collected by a chromatograph mass spectrometer such as an apparatus (LC-MS) or a gas chromatograph mass spectrometer (GC-MS).
  • the mass charge of ions derived from the components in the eluate is obtained by repeating the scan measurement over the specified mass-to-charge ratio m / z range in the mass spectrometer for the eluate sent from the LC column.
  • Mass spectrum data indicating the relationship between the ratio and the signal intensity can be obtained every moment.
  • Extracted ion chromatogram showing temporal changes in signal intensity of ions with this mass-to-charge ratio by extracting data showing signal intensity at one specific mass-to-charge ratio from the data thus obtained and arranging them in chronological order (XIC) can be created.
  • a mixed ion chromatogram MIC
  • a total ion chromatogram TIC
  • an XIC in the mass-to-charge ratio of ions derived from the target compound or an MIC including the mass-to-charge ratio is created, and a peak corresponding to the target compound is displayed on the chromatogram. Detect and calculate the peak area value. Then, the concentration value is calculated from the peak area value based on the actually measured chromatogram with reference to a calibration curve showing the relationship between the concentration (content) of the target compound and the peak area value, which has been obtained in advance.
  • an XIC in the mass-to-charge ratio of ions derived from the target compound is created, and a peak corresponding to the target compound is detected on the XIC. If the peak is detected, the target compound is present. If the peak is not detected, it can be determined that the target compound is not present.
  • the peak derived from the target compound should be originally observed. Peak may not appear, and peak detection and peak area value calculation may not be performed. In addition, when a plurality of compounds are not sufficiently separated by LC and a peak derived from another compound overlaps a peak derived from the target compound on XIC or MIC, the position of the peak top derived from the target compound is apparent. In some cases, the peak may not be detected due to deviation from the time range centered on the holding time.
  • the noise becomes relatively large, and it is difficult to detect the peak derived from the target compound due to the noise. Or the error of the peak area value may increase.
  • JP 2012-42322 A (paragraph [0002]) JP-A 63-308560
  • the present invention has been made to solve the above-described problems, and the object of the present invention is to obtain a peak derived from a target compound with less noise than conventional XIC and MIC, and to superimpose noise. Chromatograph that can perform quantification with higher accuracy than conventional quantification based on peak area values observed on XIC and MIC even when there is a mass deviation or peak top time deviation. An object of the present invention is to provide a mass spectrometry data processing method and processing apparatus.
  • formed in order to solve the said subject is a chromatograph mass spectrometry data processing method which processes the mass spectrum data repeatedly obtained with time progress by chromatograph mass analysis, a) Based on the mass spectrum data obtained at an arbitrary measurement time t, the number of mass-to-charge ratio points is an actual measurement vector Mt having the number of dimensions and the signal intensity value as an element, and the number of target compounds at the measurement time t is the number of dimensions. Based on the compound weight vector w t having the compound weight as an element and the standard mass spectrum of the target compound, the number of mass-to-charge ratio points and the number of the target compound are respectively the number of rows and columns, and the signal intensity value is an element.
  • the relationship between the compound spectrum matrix L is defined as a linear regression model, and the compound weight vector w t is estimated using the minimum norm estimation method that introduces a regularization term based on the known measured vector M t and the compound spectrum matrix L.
  • formed in order to solve the said subject is a processing apparatus for enforcing the chromatograph mass spectrometry data processing method which concerns on the said 1st invention, and with time progress by chromatograph mass spectrometry.
  • a chromatographic mass spectrometry data processing apparatus for processing repeatedly obtained mass spectrum data a) Based on the mass spectrum data obtained at an arbitrary measurement time t, the number of mass-to-charge ratio points is an actual measurement vector Mt having the number of dimensions and the signal intensity value as an element, and the number of target compounds at the measurement time t is the number of dimensions.
  • the number of mass-to-charge ratio points and the number of the target compound are respectively the number of rows and columns, and the signal intensity value is an element.
  • the relationship between the compound spectrum matrix L is defined as a linear regression model, and the compound weight vector w t is estimated using the minimum norm estimation method that introduces a regularization term based on the known measured vector M t and the compound spectrum matrix L. Mass spectrum obtained at each measurement time point within a predetermined time range including at least the retention time of the target compound.
  • a graph representing the time change of the weights in which the weights of the target compounds are arranged in time series is created.
  • a peak detection unit for detecting a peak corresponding to the target compound in the graph c) a processing unit that qualifies the target compound based on the peak detection result by the peak detection unit, or quantifies the target compound based on the area or height of the peak detected by the peak detection unit; It is characterized by having.
  • chromatographic mass spectrometry is usually LC / MS analysis or GC / MS analysis.
  • concentration of one component (compound) introduced into the mass spectrometer can also be obtained by the flow injection analysis (FIA) method in which the sample is introduced into the mass spectrometer without being separated by the column and placed on the mobile phase flow. Changes to a mountain shape like LC and GC.
  • the chromatographic mass spectrometry includes mass spectrometry in which a sample is introduced by the FIA method.
  • a linear regression model represented by the following equation (1) is typically determined.
  • the weight of the compound here represents the degree of contribution of each compound in the sample, and thus substantially reflects the concentration and relative content.
  • Mt Lwt + ⁇ (1)
  • is a probability vector representing noise.
  • Mt can be obtained by actual measurement, and L can be obtained experimentally or from an existing database. Therefore, Mt and L are known, and the equation (1) can be regarded as a problem of linear regression analysis for obtaining the maximum likelihood estimation value of wt that is unknown when they are given.
  • the compound weight vector calculation step for example, at each measurement time point included in the time range set by the user or the time range having a predetermined time width centered on the retention time known for the target compound specified by the user.
  • the compound weight vector w t is obtained based on the actually measured vector M t based on the mass spectrum data obtained by actual measurement and the compound spectrum matrix L that is common regardless of the measurement time point.
  • the peak detection step a weight time series graph in which the weights of the target compound are arranged in chronological order is created from the plurality of compound weight vectors w t thus obtained. Since this weight time series graph represents the time change of the weight of the target compound, a peak corresponding to the target compound appears like XIC, and the peak has a similar shape to the peak on XIC.
  • a peak derived from the target compound (presumed to be derived from the target compound) is detected on the weighted time series graph, it can be determined that the target compound is contained in the measured sample.
  • a calibration curve indicating the relationship between the peak area value and the concentration value on the weighted time series graph is obtained in advance, and the concentration value is calculated from the peak area value on the weighted time series graph by referring to this calibration curve. Can be requested.
  • the regularization term used in the minimum norm estimation method is either the L1 norm or the L2 norm. Can do.
  • the L1 norm has high selectivity
  • the L1 norm when adopted as a regularization term, a robust peak can be obtained for one target compound.
  • an appropriate peak cannot be obtained on the weighted time series graph in a situation where peaks derived from a plurality of compounds are overlapped on XIC, that is, in a situation where the correlation between variables is high.
  • the L2 norm when adopted as a regularization term, even if there is an overlap between peaks derived from a plurality of compounds on XIC, there is a certain degree on the weight time series graph for each compound. Sufficient peaks can be obtained.
  • the L1 norm and the L2 norm are switched as the regularization term, or the L1 norm It is good to use together with L2 norm.
  • the L1 norm and the L2 norm can be switched as the regularization term, depending on the state of the sample (for example, whether there are many target compounds to be measured, whether there are many impurities other than the measurement target, etc.) It is preferable that the user can select which of the L1 norm and the L2 norm to use. Also, automatically determine the compound overlap status from the XIC, MIC, and TIC states created based on the collected mass spectrum data, and use either the L1 norm or the L2 norm based on the result May be switched.
  • the L1 norm and the L2 norm are switched by introducing an elastic net, or the L1 norm and the L2 norm are used in combination.
  • the degree of contribution between the L1 norm and the L2 norm is adjusted according to the value of the parameter ⁇ (0 ⁇ ⁇ ⁇ 1). Therefore, by determining the parameter ⁇ manually by the user or by the automatic determination process as described above, it is better to correspond to one or a plurality of target compounds depending on the overlapping state of the compounds at that time. That is, a peak with a high S / N ratio can be obtained.
  • the chromatographic mass spectrometry data processing method and processing apparatus it is possible to obtain a robust peak with less noise compared to a peak observed on XIC or MIC created based on mass spectrum data. Can do.
  • the accuracy of the determination can be improved.
  • the accuracy of the peak area value can be increased to improve the quantification accuracy.
  • the chromatographic mass spectrometry data processing method and processing apparatus According to the chromatographic mass spectrometry data processing method and processing apparatus according to the present invention, not only the signal intensity of only a specific mass-to-charge ratio but also the signal intensity of only the mass-to-charge ratio adjacent thereto is reflected in the weighted time series graph. Is done. Therefore, even when the mass-to-charge ratio of ions derived from the target compound is shifted, a good peak derived from the target compound can be obtained. In addition, by appropriately determining the time range for creating the weighted time series graph, the peak derived from the target compound can be reliably obtained even when there is a time direction shift at the peak top of the peak derived from the target compound on XIC. Can do.
  • the schematic block diagram of one Example of LC-MS provided with the data processor which concerns on this invention.
  • the flowchart which shows the procedure of the compound weight time series data acquisition process in LC-MS of a present Example.
  • the figure which shows an example of the compound weight time series graph obtained when the regularization type
  • FIG. 1 is a schematic configuration diagram of the LC-MS of the present embodiment.
  • the LC-MS of this embodiment includes a liquid chromatograph (LC) unit 1, a mass spectrometry (MS) unit 2, an analog-digital converter (ADC) 3, a data processing unit 4, an input unit 5, and a display unit 6.
  • the LC unit 1 includes a liquid feed pump that feeds the mobile phase at a constant flow rate, an injector that injects a sample into the fed mobile phase, a column that separates compounds contained in the sample in the time direction, and the like.
  • the MS unit 2 is, for example, a quadrupole or time-of-flight mass spectrometer equipped with an electrospray ion source.
  • the data processing unit 4 includes, as functional blocks, a mass spectrum data storage unit 41, a compound weight time series data calculation unit 42, a compound weight time series graph creation unit 43, and a peak detection unit 44.
  • a quantitative calculation unit 45 a standard mass spectrum library 46, and a compound weight time-series calibration curve storage unit 47.
  • the standard mass spectrum library 46 is a database in which standard mass spectra are recorded for various compounds, and this is data that can be obtained by actual measurement on a standard sample or from a publicly available compound database. is there.
  • the function of the data processing unit 4 can usually be realized by operating dedicated data processing software installed in a personal computer on the computer.
  • a sample is injected from the injector at a predetermined timing during the mobile phase sent to the column at a substantially constant flow rate.
  • the sample is introduced into the column by the flow of the mobile phase, and various compounds contained in the sample are separated in the time direction while passing through the column. Therefore, the sample introduced from the LC part to the MS part 2 contains different compounds sequentially with time.
  • scan measurement over a predetermined mass-to-charge ratio range is repeatedly executed at each measurement time point that is a predetermined time interval.
  • Mass spectrum data storage unit 41 stores the mass spectrum data obtained at each measurement point in the period from the time when the sample is injected into the mobile phase to the end point of measurement.
  • FIG. 2 is a flowchart showing the procedure of the compound weight time series graph creation processing
  • FIG. 3 is a conceptual diagram for explaining the compound weight time series graph creation processing.
  • an XIC is usually created based on the mass-to-charge ratio of the quantitative ions (or other characteristic ions) and the target on the XIC A compound-derived peak is detected.
  • the following compound weight time series graph creation processing is performed, and the peak derived from the target compound is detected on the graph. First, the compound weight time series graph will be described.
  • Mt is an actual measurement vector representing mass spectrum data obtained by measurement at a certain measurement time t
  • L is a compound spectrum matrix representing a standard mass spectrum of a plurality of compounds
  • wt is a compound weight vector at the measurement time t.
  • the actual measurement vector Mt is a P-dimensional vector having the number P of the mass-to-charge ratio of the mass spectrum as the number of dimensions and the signal intensity value at each of the P mass-to-charge ratio values as elements.
  • the compound spectrum matrix L is a matrix having the number N of compounds and the mass-to-mass ratio point P of the mass spectrum as the number of rows and the number of columns, and the signal intensity value at each of the P mass-to-charge ratio values of each compound as an element. .
  • the compound weight vector w t is an N-dimensional vector having the number N of compounds as the number of dimensions and the weight value of each of the N compounds as an element.
  • Mt Lwt + ⁇ (1)
  • is a probability vector representing noise.
  • the actual measurement vector Mt is obtained from the data stored in the mass spectrum data storage unit 41.
  • the compound spectrum matrix L can be created based on data recorded in advance in the standard mass spectrum library 46. If ⁇ is regarded as Gaussian white noise, it is wt that is unknown in the equation (1). Therefore, the problem of linear regression analysis for obtaining the maximum likelihood estimated value of the compound weight vector wt in the equation (1) is considered (see Non-Patent Document 2, etc.).
  • the minimum norm estimation method is known as a standard solution to such an inverse problem, overlearning is likely to occur in the minimum norm estimation by the least square method. Therefore, the minimum norm estimation method that introduces a regularization term is used.
  • (5) is a compound weight vector w t at a certain measurement time t. Therefore, when this compound weight vector wt is obtained for each measurement time point included in the entire measurement time range or the predetermined time range from the measurement start time point to the measurement end time point and arranged in time series, the compound weight time series matrix W is obtained. can get.
  • This matrix is a matrix in which the number of compounds and the number of points at the time of measurement are the number of rows and the number of columns.
  • a compound time series graph is obtained by extracting the weight of a specific compound from this matrix. Since this weight reflects the concentration of the compound, the compound time series graph represents the temporal change in the concentration of a certain compound.
  • the peak appearing in the compound time series graph can be used for qualitative (determination of presence / absence) or quantification of the compound, like the peak on XIC or MIC.
  • the compound spectrum matrix may consist of elements for only one target compound, but by creating a compound spectrum matrix from standard mass spectra corresponding to a large number of target compounds, the compounds in the multiple target compounds A weight time series matrix and a compound weight time series graph can be obtained at a time.
  • the compound weight time-series data calculation unit 42 sets a predetermined regularization parameter ⁇ (step S1).
  • the regularization parameter ⁇ can be experimentally obtained in advance by the manufacturer of the apparatus.
  • the user designates data to be processed, one or more target compounds, and a processing target time range t1 to t2 from the input unit 5 (step S2).
  • the compound weight time series data calculation unit 42 reads out a standard mass spectrum corresponding to the designated target compound from the standard mass spectrum library 46, and creates a compound spectrum matrix L (step S3).
  • the compound spectrum matrix L is commonly used regardless of the measurement time when estimating the compound weight vector wt.
  • the compound weight time series data calculation unit 42 sets the first measurement time t1 within the designated processing target time range to the time variable t (step S4). Then, among the data designated as the processing target, the mass spectrum data at the measurement time t is read from the mass spectrum data storage unit 41, and an actual measurement vector Mt is created (step S5). Based on the actual measurement vector Mt thus obtained and the compound spectrum matrix L, the compound weight vector wt is estimated by the above-described method (step S6). The obtained compound weight vector wt is temporarily stored.
  • step S7 it is determined whether or not the measurement time t is the last measurement time t2 within the processing time range (step S7). If the current measurement time t has not reached t2, the measurement time interval ⁇ t is reached at the current measurement time t. Is added as a new measurement time t (step S8), and the process returns to step S5. Therefore, by repeating steps S5 to S8, as shown in FIG. 3, compound weight vectors w t are obtained at the respective measurement time points separated from each other by the measurement time interval ⁇ t within the time range of t 1 to t 2.
  • step S7 When the current measurement time t reaches t2, it is determined Yes in step S7, and the compound weight time series graph creation unit 43 creates a compound weight time series matrix by arranging the compound weight vectors in time series, and is further designated.
  • a compound weight time series graph is created by extracting and graphing the weight value corresponding to the target compound (step S9). Thus, for each target compound designated by the user, a compound weight time series graph representing a change in weight over time is obtained.
  • the peak detector 44 detects a peak on the compound weight time series graph for each target compound.
  • the same algorithm as the conventional one can be used for the peak detection method. If a peak is detected, the peak detector 44 calculates the area value of the peak.
  • the quantitative calculation unit 45 derives a quantitative value (concentration value or content) by comparing the calculated peak area value with a calibration curve corresponding to the same target compound stored in the compound weight time-series calibration curve storage unit 47. To do. When no significant peak is detected on the compound weight time series graph, it can be concluded that the compound is not included in the sample.
  • the same processing may be performed using a compound weight time series graph corresponding to the target compound. Then, when the quantitative result is obtained, it is output from the display unit 6.
  • the compound weight time series graph used for the quantitative calculation may be displayed on the screen of the display unit 6 together.
  • the compound weight time-series calibration curve storage unit 47 stores in advance a calibration curve for each compound that indicates the relationship between the peak area value and the quantitative value on the compound weight time-series graph obtained experimentally.
  • the L2 norm is used as the regularization term when estimating the compound weight vector wt.
  • the L1 norm can also be used as the regularization term.
  • the L1 norm regularization term is used to make a minute peak at a large intensity.
  • the peak weights are absorbed, and the weights of the minute peaks converge to zero, making it impossible to detect them.
  • the regularization term of the L2 norm is used, although the SN ratio of each peak does not increase, it is possible to separate the overlapping peaks and observe a minute peak.
  • the L1 norm or L2 norm can be alternatively selected as a regularization term depending on the estimation result. That's fine.
  • the degree of contribution between the L1 norm and the L2 norm is adjusted according to the value of the parameter ⁇ (0 ⁇ ⁇ ⁇ 1).
  • the user may set the parameter ⁇ manually, but in practice, it is difficult or troublesome to set the parameter ⁇ appropriately. Therefore, for example, the compound overlap state may be automatically determined from the peak detected on the obtained XIC, and an appropriate parameter ⁇ may be set based on the determination result, and the above processing may be performed.
  • FIG. 4 is a diagram showing an example of a compound weight time series graph obtained when regularized minimum norm estimation using an elastic net is performed.
  • the left side of FIG. 4 (a) is an example in which three compounds A, B, and C overlap on XIC. Even if it is impossible to completely separate the overlapping peaks on XIC, It is relatively easy to detect the presence of overlap. In this case, since it is understood that there is a high possibility that there are three or more small peaks in the time range between the start point and end point of the large peak, a value close to 0 is set as the parameter ⁇ . As a result, for example, as shown on the right side of FIG. 4A, three compound weight time series graphs in which peaks corresponding to the compounds A, B, and C are observed can be obtained.
  • Fig. 4 (b) left is an example where there is no overlap of compounds although noise is large on XIC. Since a small peak derived from noise that is superimposed on a large peak can be removed, for example, by a smoothing process, it can be determined that there is a high possibility of a peak derived from a single compound. Therefore, a value close to 1 is set as the parameter ⁇ . As a result, for example, as shown on the right side of FIG. 4B, a compound weight time series graph in which a peak with a high S / N ratio from which noise is well removed is observed can be obtained.
  • the present invention is applied to data obtained by LC-MS, but can also be applied to data obtained by GC-MS.
  • the said Example is an example of this invention, and even if it changes suitably, an addition, and a correction within the meaning of this invention, it is clear that it is included by the claim of this application.

Landscapes

  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Engineering & Computer Science (AREA)
  • Library & Information Science (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

LC部(1)及びMS部(2)によって測定時点毎に得られたマススペクトルデータはマススペクトルデータ記憶部(41)に格納される。化合物重み時系列データ算出部(42)は、標準マススペクトルライブラリ(46)に保存されている各種化合物の標準マススペクトルに基づいて化合物スペクトル行列Lを作成し、該行列L、一つの測定時点tにおいて得られたデータに基づく実測ベクトルMt、測定時点tにおける化合物重みベクトルwtの関係を線形回帰モデルとして定め、正則化項を導入した最小ノルム推定法を用いて未知の化合物重みベクトルwtを推定する。化合物重み時系列グラフ作成部(43)は、指摘された時間範囲内における各測定時点に対し得られた化合物重みベクトルwtに基づき、目的化合物毎に重みの時間変化を示す化合物重み時系列グラフを作成し、該グラフに現れるピークを利用して該化合物の定量や含有の有無の判定を行う。

Description

クロマトグラフ質量分析データ処理方法及び処理装置
 本発明は、試料中の目的化合物の有無を判定したり目的化合物を定量したりするために、液体クロマトグラフ(LC)やガスクロマトグラフ(GC)と質量分析装置とを組み合わせた液体クロマトグラフ質量分析装置(LC-MS)やガスクロマトグラフ質量分析装置(GC-MS)などのクロマトグラフ質量分析装置で収集されたデータを処理するデータ処理方法及び処理装置に関する。
 LC-MSでは、LCのカラムから送られて来る溶出液に対し質量分析装置において所定の質量電荷比m/z範囲に亘るスキャン測定を繰り返すことで、溶出液中の成分由来のイオンの質量電荷比と信号強度との関係を示すマススペクトルデータを時々刻々と得ることができる。こうして得られたデータから特定の一つの質量電荷比における信号強度を示すデータを抽出し時系列順に並べることで、該質量電荷比を持つイオンの信号強度の時間的な変化を示す抽出イオンクロマトグラム(XIC)を作成することができる。また、特定の複数の質量電荷比における信号強度を示すデータを抽出し、その信号強度を測定点(保持時間)毎に加算して時系列順に並べることで、混合イオンクロマトグラム(MIC)を作成することができる。さらにまた、一つのマススペクトルに現れる全ての質量電荷比における信号強度を示すデータを加算して時系列順に並べることで、トータルイオンクロマトグラム(TIC)を作成することができる。
 例えば試料に含まれる目的化合物を定量したい場合には、その目的化合物由来のイオンの質量電荷比におけるXIC又は該質量電荷比を含むMICを作成し、そのクロマトグラム上で目的化合物に対応するピークを検出しピークの面積値を計算する。そして、予め求めておいた、その目的化合物の濃度(含有量)とピーク面積値との関係を示す検量線を参照し、実測のクロマトグラムに基づくピーク面積値から濃度値を算出する。また、試料中に目的化合物が含まれているか否かを調べたい場合には、その目的化合物由来のイオンの質量電荷比におけるXICを作成し、該XIC上で目的化合物に対応するピークの検出を試み、ピークが検出されれば該目的化合物が存在し、ピークが検出されなければ該目的化合物は存在しないと判断することができる。
 定量対象又は検出対象の化合物が決まっている場合には、その目的化合物由来のイオンの質量電荷比だけでなく保持時間も既知である。そこで、通常、XICやMICにおいて該目的化合物の保持時間付近の所定時間範囲でピークを検出し、検出されたピークの開始点及び終了点を決定してピーク面積値を算出する(特許文献1等参照)。
 しかしながら、様々な要因によって質量分析装置において検出されるイオンの質量電荷比に誤差(質量ずれ)が生じた場合、本来その目的化合物由来のピークが観測される筈であるXICやMICに目的化合物由来のピークが現れず、ピーク検出やピーク面積値の算出が行えなくなることがある。また、LCで複数の化合物が十分に分離されず、XICやMIC上で別の化合物由来のピークが目的化合物由来のピークに重なってしまった場合に、その目的化合物由来のピークトップの位置が見かけ上ずれてしまい、保持時間を中心とする時間範囲から外れてピーク検出ができなくなる場合がある。さらにまた、目的化合物の含有量が少ない場合には、該目的化合物由来のイオンの質量電荷比におけるXICを作成するとノイズが相対的に大きくなり、ノイズの影響で目的化合物由来のピークの検出が困難になったり或いはピーク面積値の誤差が大きくなったりすることがある。
特開2012-42322号公報(段落[0002]) 特開昭63-308560号公報
「Lasso および Elastic Net」、[online]、米国MathWorks社、[2015年10月16日検索]、インターネット<URL: http://jp.mathworks.com/help/stats/lasso-and-elastic-net.html> ビショップ(C. M. Bishop)、「パターン・リコグニション・アンド・マシン・ラーニング(Pattern Recognition and Machine Learning)」、米国シュプリンガー(Springer)社、2006年
 本発明は上記課題を解決するために成されたものであり、その目的とするところは、従来のXICやMICに比べてノイズの少ない目的化合物由来のピークを得ることができるとともに、ノイズの重畳や質量ずれ、或いはピークトップの時間方向のずれなどがあった場合でも、従来のXICやMIC上で観測されるピークの面積値に基づく定量に比べて精度の高い定量を行うことができるクロマトグラフ質量分析データ処理方法及び処理装置を提供することにある。
 上記課題を解決するためになされた第1の発明は、クロマトグラフ質量分析により時間経過に伴って繰り返し得られたマススペクトルデータを処理するクロマトグラフ質量分析データ処理方法であって、
 a)任意の測定時点tにおいて得られたマススペクトルデータに基づく、質量電荷比点数を次元数とし信号強度値を要素とする実測ベクトルMt、測定時点tにおける目的化合物の数を次元数とし各目的化合物の重みを要素とする化合物重みベクトルwt、及び、目的化合物の標準的なマススペクトルに基づく、質量電荷比点数と目的化合物の数とをそれぞれ行と列の数とし信号強度値を要素とする化合物スペクトル行列L、の関係を線形回帰モデルとして定め、既知である前記実測ベクトルMtと前記化合物スペクトル行列Lとに基づき、正則化項を導入した最小ノルム推定法を用いて化合物重みベクトルwtを推定する、という最尤解推定処理を、少なくとも目的化合物の保持時間を含む所定の時間範囲内の測定時点毎に得られたマススペクトルデータについて実行することで、その測定時点毎の化合物重みベクトルwtをそれぞれ求める化合物重みベクトル算出ステップと、
 b)前記化合物重みベクトル算出ステップにより所定の時間範囲に対して得られた複数の前記化合物重みベクトルwtに基づいて、目的化合物の重みを時系列順に並べた該重みの時間変化を表すグラフを作成し、そのグラフにおいて目的化合物に対応するピークを検出するピーク検出ステップと、
 を有し、前記ピーク検出ステップにより検出されるピークを利用して目的化合物の定性又は定量を行うことを特徴としている。
 また上記課題を解決するためになされた第2の発明は、上記第1の発明に係るクロマトグラフ質量分析データ処理方法を実施するための処理装置であり、クロマトグラフ質量分析により時間経過に伴って繰り返し得られたマススペクトルデータを処理するクロマトグラフ質量分析データ処理装置であって、
 a)任意の測定時点tにおいて得られたマススペクトルデータに基づく、質量電荷比点数を次元数とし信号強度値を要素とする実測ベクトルMt、測定時点tにおける目的化合物の数を次元数とし各目的化合物の重みを要素とする化合物重みベクトルwt、及び、目的化合物の標準的なマススペクトルに基づく、質量電荷比点数と目的化合物の数とをそれぞれ行と列の数とし信号強度値を要素とする化合物スペクトル行列L、の関係を線形回帰モデルとして定め、既知である前記実測ベクトルMtと前記化合物スペクトル行列Lとに基づき、正則化項を導入した最小ノルム推定法を用いて化合物重みベクトルwtを推定する、という最尤解推定処理を、少なくとも目的化合物の保持時間を含む所定の時間範囲内の測定時点毎に得られたマススペクトルデータについて実行することで、その測定時点毎の化合物重みベクトルwtをそれぞれ求める化合物重みベクトル算出部と、
 b)前記化合物重みベクトル算出部によって所定の時間範囲に対して得られた複数の前記化合物重みベクトルwtに基づいて、目的化合物の重みを時系列順に並べた該重みの時間変化を表すグラフを作成し、そのグラフにおいて目的化合物に対応するピークを検出するピーク検出部と、
 c)前記ピーク検出部によるピーク検出結果に基づいて目的化合物を定性する、又は前記ピーク検出部により検出されたピークの面積又は高さに基づいて目的化合物を定量する処理部と、
 を備えることを特徴としている。
 第1及び第2の発明において、クロマトグラフ質量分析とは通常、LC/MS分析又はGC/MS分析である。また、カラムによる成分分離を行わずに、移動相の流れに乗せて試料を質量分析装置に導入するフローインジェクション分析(FIA)法でも、質量分析装置に導入される一つの成分(化合物)の濃度はLCやGCと同様に山形状に変化する。したがって、上記クロマトグラフ質量分析はFIA法による試料導入を行う質量分析も含むものとする。
 第1の発明に係るクロマトグラフ質量分析データ処理方法において化合物重みベクトル算出ステップでは、典型的には次の(1)式で表される線形回帰モデルを定める。なお、ここでいう化合物の重みとは試料中における各化合物の寄与度合いを表しているから、実質的には濃度や相対的な含有量を反映する。
   Mt=Lwt+ε   …(1)
ここでεはノイズを表す確率ベクトルである。Mtは実測により得られたデータそのもの、Lは実験的に又は既存のデータベース等から求めることが可能である。したがって、MtとLとが既知であり、(1)式は、それらが与えられたもとで未知であるwtの最尤推定値を求める線形回帰分析の問題であると捉えることができる。こうした問題を解くために、従来、最小二乗法を用いた手法が知られている(特許文献2参照)。しかしながら、こうした従来の手法では過学習が生じ推定の誤差が却って大きくなる場合がある。そこで、この化合物重みベクトル算出ステップでは、正則化項を導入した最小ノルム推定法を用いて化合物重みベクトルwtを推定する。
 化合物重みベクトル算出ステップでは、例えばユーザにより設定された時間範囲、或いは、ユーザにより指定された目的化合物について既知である保持時間を中心とする所定の時間幅を有する時間範囲に含まれる各測定時点において、それぞれ実測により得られたマススペクトルデータに基づく実測ベクトルMt、及び測定時点に依らずに共通である化合物スペクトル行列Lとに基づいて化合物重みベクトルwtを求める。ピーク検出ステップでは、そうして得られた複数の化合物重みベクトルwtから、目的化合物の重みを時系列順に並べた重み時系列グラフを作成する。この重み時系列グラフはその目的化合物の重みの時間変化を表すものであるから、XICと同様に目的化合物に対応するピークが現れ、そのピークはXIC上のピークと相似形状となる。
 したがって、重み時系列グラフ上で目的化合物由来の(目的化合物由来であると推定される)ピークが検出されれば、測定した試料中に該目的化合物が含まれると判断することができる。また、重み時系列グラフ上でのピーク面積値と濃度値との関係を示す検量線を予め求めておき、この検量線を参照することで、重み時系列グラフ上でのピーク面積値から濃度値を求めることができる。
 第1の発明に係るクロマトグラフ質量分析データ処理方法及び第2の発明に係るクロマトグラフ質量分析データ処理装置において、最小ノルム推定法に利用する正則化項はL1ノルム又はL2ノルムのいずれかとすることができる。
 一般に、L1ノルムは選択性が高いため、L1ノルムを正則化項として採用した場合には、一つの目的化合物についてロバストなピークを得ることができる。その反面、XIC上で複数の化合物由来のピークに重なりがあるような状況、つまり変数間の相関が高い状況では重み時系列グラフ上で適切なピークが得られない。一方、L2ノルムを正則化項として採用した場合には、XIC上で複数の化合物由来のピークに重なりがあるような状況であっても、それら化合物毎の重み時系列グラフ上でそれぞれ或る程度十分なピークを得ることができる。
 そこで第1の発明に係るクロマトグラフ質量分析データ処理方法及び第2の発明に係るクロマトグラフ質量分析データ処理装置において、好ましくは、正則化項としてL1ノルムとL2ノルムとを切り替える、又はL1ノルムとL2ノルムとを併用するとよい。
 正則化項としてL1ノルムとL2ノルムとが切り替え可能である場合、試料の状況(例えば測定対象である目的化合物が多いか少ないか、測定対象以外の夾雑物が多いか否かなど)などに応じてユーザがL1ノルムとL2ノルムのいずれを使用するのかを選択できるようにするとよい。また、収集されたマススペクトルデータに基づいて作成されるXIC、MIC、TICの状態から化合物の重なりの状況を自動的に判断し、その結果に基づいてL1ノルムとL2ノルムのいずれを使用するのかを切り替えるようにしてもよい。
 また、より好ましくは、エラスティックネット(Elastic Net)を導入することでL1ノルムとL2ノルムとを切り替える、又はL1ノルムとL2ノルムとを併用するとよい。非特許文献1等に記載されているように、エラスティックネットでは、パラメータα(0≦α≦1)の値に応じてL1ノルムとL2ノルムとの寄与度合いが調整される。したがって、このパラメータαをユーザが手動で又は上述したような自動的な判定処理によって決めることにより、そのときの化合物の重なりの状況等に応じて、1又は複数の目的化合物に対応するより良好な、つまりはSN比の高いピークを得ることができる。
 本発明に係るクロマトグラフ質量分析データ処理方法及び処理装置によれば、マススペクトルデータに基づいて作成されるXICやMIC上で観測されるピークに比べて、よりノイズの少ないロバストなピークを得ることができる。それによって、例えば目的化合物由来のピークの有無によって該目的化合物が試料に含まれるか否かを判定するような場合、その判定の精度を高めることができる。また、検出されたピークの面積値に基づいてその目的化合物を定量する場合に、ピーク面積値の精度が上がることで定量精度を向上させることができる。
 また、本発明に係るクロマトグラフ質量分析データ処理方法及び処理装置によれば、特定の質量電荷比のみの信号強度だけでなく、それに近接する質量電荷比のみの信号強度も重み時系列グラフに反映される。そのため、目的化合物由来のイオンの質量電荷比にずれが生じた場合でも、該目的化合物由来の良好なピークを得ることができる。また、重み時系列グラフを作成する時間範囲を適切に定めることで、XIC上では目的化合物由来のピークのピークトップに時間方向のずれがある場合でも、該目的化合物由来のピークを確実に得ることができる。
本発明に係るデータ処理装置を備えたLC-MSの一実施例の概略構成図。 本実施例のLC-MSにおける化合物重み時系列データ取得処理の手順を示すフローチャート。 化合物重み時系列データ取得処理を説明するための概念図。 エラスティックネットを用いた正則化型最小ノルム推定を行った場合に得られる化合物重み時系列グラフの一例を示す図。
 以下、本発明に係るクロマトグラフ質量分析データ処理装置を備えたLC-MSの一実施例について、添付図面を参照して説明する。
 図1は本実施例のLC-MSの概略構成図である。
 本実施例のLC-MSは、液体クロマトグラフ(LC)部1、質量分析(MS)部2、アナログデジタル変換器(ADC)3、データ処理部4、入力部5、及び表示部6を備える。図示しないものの、LC部1は、移動相を一定流量で送給する送液ポンプ、送給される移動相中に試料を注入するインジェクタ、試料に含まれる化合物を時間方向に分離するカラム、などを含む。MS部2は例えば、エレクトロスプレーイオン源を備えた四重極型又は飛行時間型の質量分析装置である。
 データ処理部4は後述する特徴的なデータ処理を行うために、機能ブロックとして、マススペクトルデータ記憶部41、化合物重み時系列データ算出部42、化合物重み時系列グラフ作成部43、ピーク検出部44、定量演算部45、標準マススペクトルライブラリ46、化合物重み時系列検量線記憶部47、を含む。標準マススペクトルライブラリ46は様々な化合物について標準的なマススペクトルが収録されたデータベースであり、これは標準試料に対する実際の測定によって又は一般に公開されている化合物データベース等から取得することが可能なデータである。なお、このデータ処理部4の機能は、通常、パーソナルコンピュータにインストールされた専用のデータ処理ソフトウエアを該コンピュータ上で動作させることで具現化する構成とすることができる。
 本実施例のLC-MSにおける試料に対するデータ収集時の動作を概略的に説明する。
 LC部1では、略一定流速でカラムへ送られる移動相中に、所定のタイミングでインジェクタから試料が注入される。移動相の流れによって試料はカラムへと導入され、該試料に含まれる各種の化合物はカラムを通過する間に時間方向に分離される。したがって、LC部からMS部2へと導入される試料中には時間経過に伴って順次異なる化合物が含まれる。MS部2では、所定の時間間隔である測定時点毎に所定の質量電荷比範囲に亘るスキャン測定が繰り返し実行される。1回のスキャン測定によって一つのマススペクトルを構成するデータが得られ、このデータはADC3からデータ処理部4に入力されてマススペクトルデータ記憶部41に格納される。こうしてマススペクトルデータ記憶部41には、試料が移動相中に注入された時点から測定終了時点までの期間中の各測定時点で得られたマススペクトルデータが格納される。
 次に、上記のようにマススペクトルデータ記憶部41に格納されているデータに基づいて試料に含まれる目的化合物の定量を行う際の、特徴的なデータ処理について説明する。
 図2は化合物重み時系列グラフ作成処理の手順を示すフローチャート、図3は化合物重み時系列グラフ作成処理を説明するための概念図である。
 保持時間や定量イオンの質量電荷比が既知である目的化合物を定量する場合、通常、該定量イオン(又はそれ以外の特徴的なイオン)の質量電荷比におけるXICを作成し、該XIC上で目的化合物由来のピークを検出する。それに対し本実施例のLC-MSでは、以下のような化合物重み時系列グラフ作成処理を実施し、そのグラフ上で目的化合物由来のピークを検出する。まず、この化合物重み時系列グラフについて説明する。
 いま、或る測定時刻tにおいて測定によって得られたマススペクトルデータを表す実測ベクトルをMt、複数の化合物の標準的なマススペクトルを表す化合物スペクトル行列をL、測定時刻tにおける化合物重みベクトルをwtとする。実測ベクトルMtは、マススペクトルの質量電荷比の点数Pを次元数とし、そのP個の質量電荷比値それぞれにおける信号強度値を要素とするP次元ベクトルである。化合物スペクトル行列Lは、化合物の数Nとマススペクトルの質量電荷比の点数Pを行数、列数とし、各化合物のP個の質量電荷比値それぞれにおける信号強度値を要素とする行列である。化合物重みベクトルwtは、化合物の数Nを次元数とし、そのN個の化合物それぞれにおける重みの値を要素とするN次元ベクトルである。これらMt、wt、Lの関係を線形回帰モデルで表すと、既に述べた(1)式のように書ける。この(1)式を再掲する。
   Mt=Lwt+ε   …(1)
ただし、εはノイズを表す確率ベクトルである。
 実測ベクトルMtはマススペクトルデータ記憶部41に格納されているデータから求まる。一方、化合物スペクトル行列Lは標準マススペクトルライブラリ46に予め収録されているデータに基づいて作成可能である。εをガウス性白色ノイズとみなせば、(1)式において未知であるのはwtである。そこで、(1)式において化合物重みベクトルwtの最尤推定値を求める線形回帰分析の問題を考える(非特許文献2など参照)。こうした逆問題の標準的な解法として最小ノルム推定法が知られているが、最小二乗法による最小ノルム推定では過学習が生じ易い。そこで、正則化項を導入した最小ノルム推定法を用いる。正則化項としてはL1ノルムとL2ノルムとが知られているが、より標準的であるL2ノルムを正則化項として導入すると、次の(2)式による評価関数を最小にするようなwtが最適解となる。
  J(w)=(1/2)||Mt-Lwt||2+(λ/2)||wtTwt||   …(2)
 上記評価関数が最小となるwtの値を求めるには、J(w)のwについての微分を評価し、その微分値がゼロとなる点を求めればよい。評価関数の微分は次の(3)式となる。
  dJ(w)/dw=-LT(Mt-Lwt)+λwt   …(3)
ここでλは適宜に定められる正則化パラメータである。(3)式における左辺を最小化するwtが最尤推定のためのパラメータであるので、微分を0とおいて(3)式を整理すると、
  (LTL+λI)wt=LTMt   …(4)
となる。したがって、化合物重みベクトルwtの推定値は、
  wt=(LTL+λI)-1TMt   …(5)
となる。
 (5)式で求まるのは、或る一つの測定時点tにおける化合物重みベクトルwtである。そこで、この化合物重みベクトルwtを測定開始時点から測定終了時点までの全測定時間範囲又は所定の時間範囲に含まれる測定時点毎に求め、それを時系列順に並べると、化合物重み時系列行列Wが得られる。この行列は、化合物数と測定時点の点数とを行数、列数とする行列である。この行列から特定の化合物の重みを抽出することで、化合物時系列グラフが得られる。この重みは化合物の濃度を反映しているから、化合物時系列グラフは或る化合物の濃度の時間的変化を表す。したがって、この化合物時系列グラフに現れるピークはXICやMIC上のピークと同様に、化合物の定性(有無の判定)や定量に利用可能である。この手法では、化合物スペクトル行列が一つの目的化合物のみについての要素からなるものでもよいが、多数の目的化合物に対応する標準マススペクトルから化合物スペクトル行列を作成することで、その多数の目的化合物における化合物重み時系列行列や化合物重み時系列グラフを一度に求めることができる。
 続いて、図2、図3を参照して具体的な処理手順を説明する。
 処理の実行に先立って、化合物重み時系列データ算出部42は所定の正則化パラメータλを設定する(ステップS1)。一般的には、この正則化パラメータλは本装置の製造メーカが予め実験的に求めておくことができる。次に、ユーザは入力部5から処理対象のデータ、1又は複数の目的化合物、及び、処理対象時間範囲t1~t2を指定する(ステップS2)。化合物重み時系列データ算出部42は指定された目的化合物に対応する標準マススペクトルを標準マススペクトルライブラリ46から読み出し、化合物スペクトル行列Lを作成する(ステップS3)。図3に示すように、この化合物スペクトル行列Lは、化合物重みベクトルwtを推定する際に、測定時間に依らずに共通に利用されるものである。
 化合物重み時系列データ算出部42は指定された処理対象時間範囲内の最初の測定時点t1を時間変数tにセットする(ステップS4)。そして、処理対象として指定されたデータの中で、測定時点tにおけるマススペクトルデータをマススペクトルデータ記憶部41から読み出し、実測ベクトルMtを作成する(ステップS5)。こうして得られた実測ベクトルMtと上記化合物スペクトル行列Lとに基づき、上述した手法によって化合物重みベクトルwtを推定する(ステップS6)。得られた化合物重みベクトルwtは一時的に記憶される。
 次に測定時点tが処理対象時間範囲内の最後の測定時点t2であるか否かが判定され(ステップS7)、現測定時点tがt2に達していなければ現測定時点tに測定時間間隔Δtを加えたものを新たな測定時点tとし(ステップS8)ステップS5へと戻る。したがって、ステップS5~S8の繰り返しによって、図3に示すように、t1~t2の時間範囲内の互いに測定時間間隔Δt隔てた各測定時点において、それぞれ化合物重みベクトルwtが得られる。現測定時点tがt2に達するとステップS7でYesと判定され、化合物重み時系列グラフ作成部43が化合物重みベクトルを時系列順に配列することで化合物重み時系列行列を作成し、さらに指定された目的化合物に対応する重みの値を抽出してグラフ化することで化合物重み時系列グラフを作成する(ステップS9)。
 こうして、ユーザにより指定された目的化合物毎に、重みの時間変化を表す化合物重み時系列グラフが求まる。
 上述したように、或る一つの化合物に対応する化合物重み時系列グラフはXICと同様に該化合物の濃度を反映しているから、その化合物重み時系列グラフ上の該化合物由来のピークの形状はそのXIC上の該化合物由来のピークの形状と相似になる。そこで、ピーク検出部44は目的化合物毎に化合物重み時系列グラフ上でピークを検出する。ピーク検出の手法は従来と同様のアルゴリズムを用いることができる。ピーク検出部44はピークが検出されたならば、該ピークの面積値を計算する。定量演算部45は計算されたピーク面積値を、化合物重み時系列検量線記憶部47に格納されている同じ目的化合物に対応する検量線に照らして、定量値(濃度値や含有量)を導出する。なお、化合物重み時系列グラフ上で有意なピークが検出されない場合には、その化合物は試料に含まれていないと結論付けることができる。
 目的化合物が複数指定されている場合には、目的化合物に対応する化合物重み時系列グラフを用いて同様の処理を行えばよい。そうして、定量結果が求まったならば、それを表示部6から出力する。また、その定量演算に用いられた化合物重み時系列グラフも併せて表示部6の画面上に表示するとよい。
 なお、化合物重み時系列検量線記憶部47には、実験的に求めた、化合物重み時系列グラフ上のピーク面積値と定量値との関係を示す化合物毎の検量線を予め記憶させておくものとする。
 上記説明では、化合物重みベクトルwtを推定する際の正則化項としてL2ノルムを用いていたが、正則化項としてL1ノルムを用いることもできる。
 一般に、クロマトグラフでの分離性能が良好であって化合物の重なりがない場合、つまり目的化合物由来のピークが孤立ピークである場合には、L2ノルムよりもL1ノルムを正則化項として用いたほうがノイズの除去効果が高くピークのSN比が高くなる。一方、複数の化合物が重なり合っているような場合、特に比較的量が多い化合物と微量である化合物とが重なり合っている場合には、L1ノルムの正則化項を用いると、大きな強度のピークに微小なピークの重みが吸収されてしまい、微小ピークの重みがゼロに収束してしまって検出できなくなるおそれがある。これに対し、L2ノルムの正則化項を用いれば、それぞれのピークのSN比は高くならないものの、重なり合ったピークを分離して微小なピークも観測することが可能となる。
 したがって、試料に含まれる化合物の種類等から化合物の重なり状況を或る程度的確に推定できる場合には、その推定結果に応じて、正則化項としてL1ノルム又はL2ノルムを択一的に選択すればよい。ただし、多くの場合又は汎用的には、化合物の重なり状況を事前に的確に推定するのは困難である。そこで、エラスティックネット(Elastic Net)を導入し、L1ノルムとL2ノルムとを切り替える、又はL1ノルムとL2ノルムとを併用するとよい。非特許文献1等に記載されているように、エラスティックネットでは、パラメータα(0≦α≦1)の値に応じてL1ノルムとL2ノルムとの寄与度合いが調整される。具体的には、α=0ではL2ノルムを、α=1ではL1ノルムを使用することになり、0<α<1の間ではαが0に近づくほどL2ノルムに近い状態となる。したがって、試料に含まれる化合物の状況等に応じて適当なパラメータαを与えることで、よりロバストなピークを取得することができる。
 もちろん、このパラメータαをユーザが手動で設定するようにしても構わないが、実際には適切にパラメータαを定めることは難しく又は手間も掛かる。そこで、例えば得られたXIC上で検出されるピークから化合物の重なり状況を自動的に判定し、その判定結果に基づいて適宜のパラメータαを設定したうえで上記のような処理を実施するとよい。
 図4は、エラスティックネットを用いた正則化型最小ノルム推定を行った場合に得られる化合物重み時系列グラフの一例を示す図である。図4(a)左はXIC上でA、B、Cなる三つの化合物が重なった例であるが、XIC上では重なったピークを完全に分離することは不可能であったとしても、ピークの重なりがあることを検出するのは比較的容易である。この場合には、大きなピークの開始点と終了点との間の時間範囲に小さなピークが三つ以上存在する可能性が高いことが分かるから、パラメータαとして0に近い値を設定する。その結果、例えば図4(a)右に示すように、化合物A、B、Cにそれぞれ対応するピークが観測される三つの化合物重み時系列グラフを得ることができる。
 図4(b)左はXIC上でノイズは大きいものの化合物の重なりがない例である。大きなピークに重畳している、ノイズ由来の小さなピークは例えばスムージング処理などによって除去することができるから、この場合、単一化合物由来のピークの可能性が高いと判断できる。そこで、パラメータαとして1に近い値を設定する。その結果、例えば図4(b)右に示すように、ノイズが良好に除去されたSN比の高いピークが観測される化合物重み時系列グラフを得ることができる。
 なお、上記実施例は本発明をLC-MSで得られたデータに適用したものであるが、GC-MSで得られたデータに適用することもできる。
 また、上記実施例は本発明の一例であり、本発明の趣旨の範囲で適宜変形、追加、修正を加えても本願特許請求の範囲に包含されることは明らかである。
1…液体クロマトグラフ(LC)部
2…質量分析(MS)部
3…アナログデジタル変換器(ADC)
4…データ処理部
41…マススペクトルデータ記憶部
42…時系列データ算出部
43…時系列グラフ作成部
44…ピーク検出部
45…定量演算部
46…標準マススペクトルライブラリ
47…時系列検量線記憶部
5…入力部
6…表示部

Claims (10)

  1.  クロマトグラフ質量分析により時間経過に伴って繰り返し得られたマススペクトルデータを処理するクロマトグラフ質量分析データ処理方法であって、
     a)任意の測定時点tにおいて得られたマススペクトルデータに基づく、質量電荷比点数を次元数とし信号強度値を要素とする実測ベクトルMt、測定時点tにおける目的化合物の数を次元数とし各目的化合物の重みを要素とする化合物重みベクトルwt、及び、目的化合物の標準的なマススペクトルに基づく、質量電荷比点数と目的化合物の数とをそれぞれ行と列の数とし信号強度値を要素とする化合物スペクトル行列L、の関係を線形回帰モデルとして定め、既知である前記実測ベクトルMtと前記化合物スペクトル行列Lとに基づき、正則化項を導入した最小ノルム推定法を用いて化合物重みベクトルwtを推定する、という最尤解推定処理を、少なくとも目的化合物の保持時間を含む所定の時間範囲内の測定時点毎に得られたマススペクトルデータについて実行することで、その測定時点毎の化合物重みベクトルwtをそれぞれ求める化合物重みベクトル算出ステップと、
     b)前記化合物重みベクトル算出ステップにより所定の時間範囲に対して得られた複数の前記化合物重みベクトルwtに基づいて、目的化合物の重みを時系列順に並べた該重みの時間変化を表すグラフを作成し、そのグラフにおいて目的化合物に対応するピークを検出するピーク検出ステップと、
     を有し、前記ピーク検出ステップにより検出されるピークを利用して目的化合物の定性又は定量を行うことを特徴とするクロマトグラフ質量分析データ処理方法。
  2.  請求項1に記載のクロマトグラフ質量分析データ処理方法であって、
     前記正則化項はL1ノルムであることを特徴とするクロマトグラフ質量分析データ処理方法。
  3.  請求項1に記載のクロマトグラフ質量分析データ処理方法であって、
     前記正則化項はL2ノルムであることを特徴とするクロマトグラフ質量分析データ処理方法。
  4.  請求項1に記載のクロマトグラフ質量分析データ処理方法であって、
     前記正則化項としてL1ノルムとL2ノルムとを切り替える、又はL1ノルムとL2ノルムとを併用することを特徴とするクロマトグラフ質量分析データ処理方法。
  5.  請求項4に記載のクロマトグラフ質量分析データ処理方法であって、
     エラスティックネット(Elastic Net)を導入することでL1ノルムとL2ノルムとを切り替える、又はL1ノルムとL2ノルムとを併用することを特徴とするクロマトグラフ質量分析データ処理方法。
  6.  クロマトグラフ質量分析により時間経過に伴って繰り返し得られたマススペクトルデータを処理するクロマトグラフ質量分析データ処理装置であって、
     a)任意の測定時点tにおいて得られたマススペクトルデータに基づく、質量電荷比点数を次元数とし信号強度値を要素とする実測ベクトルMt、測定時点tにおける目的化合物の数を次元数とし各目的化合物の重みを要素とする化合物重みベクトルwt、及び、目的化合物の標準的なマススペクトルに基づく、質量電荷比点数と目的化合物の数とをそれぞれ行と列の数とし信号強度値を要素とする化合物スペクトル行列L、の関係を線形回帰モデルとして定め、既知である前記実測ベクトルMtと前記化合物スペクトル行列Lとに基づき、正則化項を導入した最小ノルム推定法を用いて化合物重みベクトルwtを推定する、という最尤解推定処理を、少なくとも目的化合物の保持時間を含む所定の時間範囲内の測定時点毎に得られたマススペクトルデータについて実行することで、その測定時点毎の化合物重みベクトルwtをそれぞれ求める化合物重みベクトル算出部と、
     b)前記化合物重みベクトル算出部によって所定の時間範囲に対して得られた複数の前記化合物重みベクトルwtに基づいて、目的化合物の重みを時系列順に並べた該重みの時間変化を表すグラフを作成し、そのグラフにおいて目的化合物に対応するピークを検出するピーク検出部と、
     c)前記ピーク検出部によるピーク検出結果に基づいて目的化合物を定性する、又は前記ピーク検出部により検出されたピークの面積又は高さに基づいて目的化合物を定量する処理部と、
     を備えることを特徴とするクロマトグラフ質量分析データ処理装置。
  7.  請求項6に記載のクロマトグラフ質量分析データ処理装置であって、
     前記正則化項はL1ノルムであることを特徴とするクロマトグラフ質量分析データ処理装置。
  8.  請求項6に記載のクロマトグラフ質量分析データ処理装置であって、
     前記正則化項はL2ノルムであることを特徴とするクロマトグラフ質量分析データ処理装置。
  9.  請求項6に記載のクロマトグラフ質量分析データ処理装置であって、
     前記正則化項としてL1ノルムとL2ノルムとを切り替える、又はL1ノルムとL2ノルムとを併用することを特徴とするクロマトグラフ質量分析データ処理装置。
  10.  請求項9に記載のクロマトグラフ質量分析データ処理装置であって、
     エラスティックネット(Elastic Net)を導入することでL1ノルムとL2ノルムとを切り替える、又はL1ノルムとL2ノルムとを併用することを特徴とするクロマトグラフ質量分析データ処理装置。
PCT/JP2015/081148 2015-11-05 2015-11-05 クロマトグラフ質量分析データ処理方法及び処理装置 WO2017077618A1 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2017548575A JP6409983B2 (ja) 2015-11-05 2015-11-05 クロマトグラフ質量分析データ処理方法及び処理装置
CN201580084378.7A CN108351331B (zh) 2015-11-05 2015-11-05 色谱质谱分析数据处理方法以及处理装置
US15/773,702 US10866222B2 (en) 2015-11-05 2015-11-05 Chromatograph mass spectrometric data processing method and processing device
EP15907804.7A EP3407061A4 (en) 2015-11-05 2015-11-05 METHOD FOR PROCESSING CHROMATOGRAPHIC DATA-MASS SPECTROMETRY AND PROCESSING DEVICE
PCT/JP2015/081148 WO2017077618A1 (ja) 2015-11-05 2015-11-05 クロマトグラフ質量分析データ処理方法及び処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2015/081148 WO2017077618A1 (ja) 2015-11-05 2015-11-05 クロマトグラフ質量分析データ処理方法及び処理装置

Publications (1)

Publication Number Publication Date
WO2017077618A1 true WO2017077618A1 (ja) 2017-05-11

Family

ID=58661804

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2015/081148 WO2017077618A1 (ja) 2015-11-05 2015-11-05 クロマトグラフ質量分析データ処理方法及び処理装置

Country Status (5)

Country Link
US (1) US10866222B2 (ja)
EP (1) EP3407061A4 (ja)
JP (1) JP6409983B2 (ja)
CN (1) CN108351331B (ja)
WO (1) WO2017077618A1 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019148519A (ja) * 2018-02-28 2019-09-05 日本電子株式会社 スペクトル処理装置及び方法
JP2019148455A (ja) * 2018-02-26 2019-09-05 株式会社島津製作所 測定データ処理方法、測定データ処理装置、及び測定データ処理用プログラム
WO2021005821A1 (ja) * 2019-07-10 2021-01-14 フロンティア・ラボ株式会社 含有判定支援システム及び含有判定支援方法
JP2022086659A (ja) * 2020-11-30 2022-06-09 株式会社島津製作所 ガス分析装置およびガス分析装置の状態検出方法
CN115545082A (zh) * 2022-10-20 2022-12-30 广东省麦思科学仪器创新研究院 质谱图生成方法、装置、系统及可读存储介质
JP7440870B2 (ja) 2021-01-22 2024-02-29 株式会社島津製作所 2つの変数により定まるデータの解析方法
JP7460988B2 (ja) 2021-01-22 2024-04-03 株式会社島津製作所 クロマトグラフ質量分析装置

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11788995B2 (en) * 2016-08-10 2023-10-17 Mls Acq, Inc. System and method for background removal in spectrometry system
CN113196053A (zh) * 2018-12-20 2021-07-30 佳能株式会社 信息处理装置、信息处理装置的控制方法及程序
EP3924730B1 (en) * 2019-03-15 2024-05-01 Waters Technologies Ireland Limited Apparatus and method for targeted compound analysis
CN116106464B (zh) * 2023-04-10 2023-07-25 西湖欧米(杭州)生物科技有限公司 质谱数据质量程度或概率的控制系统、评估系统及方法
CN117907511B (zh) * 2024-03-20 2024-06-14 浙江灵析精仪科技发展有限公司 一种多组分重叠峰的自动化解析方法、装置及电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63308560A (ja) * 1987-05-29 1988-12-15 Yokogawa Hewlett Packard Ltd 成分スペクトルの推定方法
JP2011249032A (ja) * 2010-05-24 2011-12-08 Shimadzu Corp 質量分析方法及び装置
WO2015056311A1 (ja) * 2013-10-16 2015-04-23 株式会社島津製作所 クロマトグラムデータ処理装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6873915B2 (en) * 2001-08-24 2005-03-29 Surromed, Inc. Peak selection in multidimensional data
US20060255258A1 (en) * 2005-04-11 2006-11-16 Yongdong Wang Chromatographic and mass spectral date analysis
JP5561016B2 (ja) 2010-08-19 2014-07-30 株式会社島津製作所 クロマトグラフ質量分析装置
CN102788849B (zh) * 2012-06-01 2013-11-13 中国人民解放军第二军医大学 一种色谱-质谱代谢组学数据分析的新方法
CN103197177B (zh) * 2013-03-20 2015-09-23 山东电力集团公司济宁供电公司 一种基于贝叶斯网络的变压器故障诊断分析方法
FR3009387B1 (fr) * 2013-07-31 2016-11-18 Biomerieux Sa Procede et dispositif d'analyse d'un echantillon biologique
CN104504706A (zh) * 2014-12-26 2015-04-08 天津大学 一种气相色谱质谱谱图匹配方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63308560A (ja) * 1987-05-29 1988-12-15 Yokogawa Hewlett Packard Ltd 成分スペクトルの推定方法
JP2011249032A (ja) * 2010-05-24 2011-12-08 Shimadzu Corp 質量分析方法及び装置
WO2015056311A1 (ja) * 2013-10-16 2015-04-23 株式会社島津製作所 クロマトグラムデータ処理装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"Lasso Oyobi Elastic Net", XP009506402, Retrieved from the Internet <URL:http://jp.mathworks.com/help/stats/lasso-and-elastic-net.html> [retrieved on 20160107] *
See also references of EP3407061A4 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019148455A (ja) * 2018-02-26 2019-09-05 株式会社島津製作所 測定データ処理方法、測定データ処理装置、及び測定データ処理用プログラム
JP2019148519A (ja) * 2018-02-28 2019-09-05 日本電子株式会社 スペクトル処理装置及び方法
WO2021005821A1 (ja) * 2019-07-10 2021-01-14 フロンティア・ラボ株式会社 含有判定支援システム及び含有判定支援方法
JP2021015108A (ja) * 2019-07-10 2021-02-12 フロンティア・ラボ株式会社 含有判定支援システム及び含有判定支援方法
US11927575B2 (en) 2019-07-10 2024-03-12 Frontier Laboratories Ltd. Content determination assistance system and content determination assistance method
JP2022086659A (ja) * 2020-11-30 2022-06-09 株式会社島津製作所 ガス分析装置およびガス分析装置の状態検出方法
JP7447774B2 (ja) 2020-11-30 2024-03-12 株式会社島津製作所 ガス分析装置およびガス分析装置の状態検出方法
JP7440870B2 (ja) 2021-01-22 2024-02-29 株式会社島津製作所 2つの変数により定まるデータの解析方法
JP7460988B2 (ja) 2021-01-22 2024-04-03 株式会社島津製作所 クロマトグラフ質量分析装置
CN115545082A (zh) * 2022-10-20 2022-12-30 广东省麦思科学仪器创新研究院 质谱图生成方法、装置、系统及可读存储介质

Also Published As

Publication number Publication date
EP3407061A4 (en) 2019-10-23
CN108351331B (zh) 2020-06-02
JP6409983B2 (ja) 2018-10-24
US20190041369A1 (en) 2019-02-07
US10866222B2 (en) 2020-12-15
JPWO2017077618A1 (ja) 2018-05-17
CN108351331A (zh) 2018-07-31
EP3407061A1 (en) 2018-11-28

Similar Documents

Publication Publication Date Title
JP6409983B2 (ja) クロマトグラフ質量分析データ処理方法及び処理装置
US10121643B2 (en) Chromatography/mass spectrometry data processing device
JP4973628B2 (ja) クロマトグラフ質量分析データ解析方法及び装置
US9514922B2 (en) Mass analysis data processing apparatus
US20150066387A1 (en) Substance identification method and mass spectrometer using the same
CA2825280A1 (en) Background subtraction-mediated data-dependent acquisition
JP5505110B2 (ja) クロマトグラフ質量分析装置
US9209004B2 (en) Method and system for processing mass spectrometry data, and mass spectrometer
JP5757264B2 (ja) クロマトグラフ質量分析データ処理装置
JP2013068444A (ja) 包括的2次元クロマトグラフ質量分析用データ処理装置
JP5211753B2 (ja) クロマトグラフ用データ処理装置
JP4470505B2 (ja) クロマトグラフ質量分析用データ処理装置
JP2018504600A (ja) 干渉検出および着目ピークのデコンボルーション
WO2018138901A1 (ja) スペクトルデータ処理装置
JP2014211393A (ja) ピーク検出装置
US9520277B2 (en) Substance identification method and mass spectrometry system used for the same method
JP6226823B2 (ja) クロマトグラフ質量分析装置及びその制御方法
JP6929645B2 (ja) マルチトレース定量化
JP5747839B2 (ja) クロマトグラフ質量分析用データ処理装置
JP7414125B2 (ja) 波形情報推定方法及び装置、並びに、ピーク波形処理方法及び装置
US11735405B2 (en) Mass spectrum processing apparatus and method
JP7334788B2 (ja) 波形解析方法及び波形解析装置
WO2020075850A1 (ja) 解析方法、解析装置、解析プログラム、及び標準シェイプの生成方法
JP2023135276A (ja) 学習方法、および学習プログラム
JP2010048732A (ja) ガスクロマトグラフ装置

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 15907804

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2017548575

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: 2015907804

Country of ref document: EP