WO2021240993A1 - ピークトラッキング装置、ピークトラッキング方法およびピークトラッキングプログラム - Google Patents

ピークトラッキング装置、ピークトラッキング方法およびピークトラッキングプログラム Download PDF

Info

Publication number
WO2021240993A1
WO2021240993A1 PCT/JP2021/014052 JP2021014052W WO2021240993A1 WO 2021240993 A1 WO2021240993 A1 WO 2021240993A1 JP 2021014052 W JP2021014052 W JP 2021014052W WO 2021240993 A1 WO2021240993 A1 WO 2021240993A1
Authority
WO
WIPO (PCT)
Prior art keywords
peak
score
probability
data
chromatogram
Prior art date
Application number
PCT/JP2021/014052
Other languages
English (en)
French (fr)
Inventor
陽 野田
Original Assignee
株式会社島津製作所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社島津製作所 filed Critical 株式会社島津製作所
Priority to JP2022527541A priority Critical patent/JP7480843B2/ja
Priority to US17/927,964 priority patent/US20230204548A1/en
Priority to CN202180037872.3A priority patent/CN115698705A/zh
Publication of WO2021240993A1 publication Critical patent/WO2021240993A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8624Detection of slopes or peaks; baseline correction
    • G01N30/8631Peaks
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8624Detection of slopes or peaks; baseline correction
    • G01N30/8631Peaks
    • G01N30/8634Peak quality criteria
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8624Detection of slopes or peaks; baseline correction
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/88Integrated analysis systems specially adapted therefor, not covered by a single one of the groups G01N30/04 - G01N30/86

Definitions

  • the present invention relates to a peak tracking device, a peak tracking method, and a peak tracking program.
  • the chromatogram of the sample can be obtained from the measurement data acquired by the analyzer. Method scouting is performed to optimize the analysis condition data for the purpose of increasing the degree of peak separation or shortening the analysis time.
  • peak tracking For example, the area value of the peak, the optical spectrum of the peak, the similarity of the MS spectrum of the peak, and the like are used.
  • An object of the present invention is to provide a user with useful information for identifying a peak contained in a chromatogram.
  • the peak tracking device has a chromatogram acquisition unit that acquires a plurality of chromatograms based on a plurality of measurement data obtained by giving a plurality of analysis condition data to the analyzer, and each chromatogram.
  • a score calculation unit that calculates score data based on the affiliation probability indicating which substance contained in the sample each peak belongs to, and a score display that displays the score data calculated by the score calculation unit on the display. It has a part.
  • FIG. 1 is an overall view of an analysis system according to this embodiment.
  • FIG. 2 is a configuration diagram of a computer according to the present embodiment.
  • FIG. 3 is a functional block diagram of the computer according to the present embodiment.
  • FIG. 4 is a diagram showing chromatograms obtained from different analytical condition data.
  • FIG. 5 is a flowchart showing a peak tracking method according to the present embodiment.
  • FIG. 6 is a diagram showing the relationship between the solvent concentration and the retention time.
  • FIG. 7 is a diagram showing a predicted distribution of the retention time regression curve of substance A.
  • FIG. 8 is a diagram showing a predicted distribution of the retention time regression curve of substance B.
  • FIG. 9 is a diagram showing a predicted distribution of the retention time regression curve of the substance C.
  • FIG. 1 is an overall view of an analysis system according to this embodiment.
  • FIG. 2 is a configuration diagram of a computer according to the present embodiment.
  • FIG. 3 is a functional block diagram of the computer according to the present embodiment.
  • FIG. 10 is a diagram showing a predicted distribution of the retention time regression curve of substance D.
  • FIG. 11 is a diagram showing a predicted distribution of the retention time regression curve of the substance E.
  • FIG. 12 is a diagram showing a histogram of the categorical distribution probability at the solvent concentration “0.25”.
  • FIG. 13 is a diagram showing a histogram of the categorical distribution probability at the solvent concentration “0.5”.
  • FIG. 14 is a diagram showing a histogram of the categorical distribution probability at the solvent concentration “0.75”.
  • FIG. 15 is a diagram showing a histogram of the categorical distribution probability at a solvent concentration of “1.0”.
  • FIG. 16 is a diagram showing an analysis support screen displayed on the display.
  • FIG. 1 is an overall view of the analysis system 5 according to the present embodiment.
  • the analysis system 5 includes a computer 1 and a liquid chromatograph 3.
  • the computer 1 and the liquid chromatograph 3 are connected via the network 4.
  • the network 4 is, for example, a LAN (Local Area Network).
  • the computer 1 has a function of setting analysis conditions in the liquid chromatograph 3, a function of acquiring measurement results in the liquid chromatograph 3, and a function of analyzing the measurement results.
  • a program for controlling the liquid chromatograph 3 is installed in the computer 1.
  • the liquid chromatograph 3 includes a pump unit, an autosampler unit, a column oven unit, a detector unit, and the like.
  • the liquid chromatograph 3 also comprises a system controller.
  • the system controller controls the liquid chromatograph 3 according to the control instruction received from the computer 1 via the network 4.
  • the system controller transmits the measurement result data of the liquid chromatograph 3 to the computer 1 via the network 4.
  • FIG. 2 is a configuration diagram of computer 1.
  • the computer 1 includes a CPU (Central Processing Unit) 101, a RAM (Random Access Memory) 102, a ROM (Read Only Memory) 103, a display 104, an operation unit 105, a storage device 106, a communication interface 107, and a device interface 108. ..
  • CPU Central Processing Unit
  • RAM Random Access Memory
  • ROM Read Only Memory
  • FIG. 2 is a configuration diagram of computer 1.
  • the computer 1 includes a CPU (Central Processing Unit) 101, a RAM (Random Access Memory) 102, a ROM (Read Only Memory) 103, a display 104, an operation unit 105, a storage device 106, a communication interface 107, and a device interface 108. ..
  • CPU Central Processing Unit
  • RAM Random Access Memory
  • ROM Read Only Memory
  • the CPU 101 controls the computer 1.
  • the RAM 102 is used as a work area when the CPU 101 executes a program.
  • a control program or the like is stored in the ROM 103.
  • the display 104 is, for example, a liquid crystal display.
  • the operation unit 105 is a device that accepts user operations, and includes a keyboard, a mouse, and the like.
  • the display 104 may be composed of a touch panel display, and the display 104 may have a function as an operation unit 105.
  • the storage device 106 is a device that stores various programs and data.
  • the storage device 106 is, for example, a hard disk.
  • the communication interface 107 is an interface for communicating with other computers and devices.
  • the communication interface 107 is connected to the network 4.
  • the device interface 108 is an interface for accessing various external devices.
  • the CPU 101 can access the storage medium 109 via an external device device connected to the device interface 108.
  • the storage device 106 stores the peak tracking program P1, the analysis condition data AP, the measurement data MD, the chromatogram CG, the retention time data RTD, and the score data SD.
  • the peak tracking program P1 is a program for controlling the liquid chromatograph 3.
  • the peak tracking program P1 has a function of setting analysis conditions for the liquid chromatograph 3, a function of acquiring measurement results from the liquid chromatograph 3 and generating a chromatogram CG, and a function of analyzing the measurement results.
  • the analysis condition data AP is data describing the analysis conditions set in the liquid chromatograph 3, and includes a plurality of analysis parameters.
  • the measurement data MD is the data of the measurement result acquired from the liquid chromatograph 3.
  • Retention time data RTD is data indicating the retention time of a substance contained in chromatogram CG.
  • the sample to be analyzed contains a plurality of substances
  • the chromatogram CG contains peaks of the plurality of substances.
  • the retention time data RTD includes data indicating a plurality of retention times for each chromatogram CG.
  • the score data SD is data calculated based on the probability of belonging to which substance contained in the sample each peak contained in the chromatogram belongs to.
  • FIG. 3 is a functional block diagram of the computer 1.
  • the control unit 200 is a functional unit realized by the CPU 101 using the RAM 102 as a work area and executing the peak tracking program P1.
  • the control unit 200 includes an analysis management unit 201, a chromatogram acquisition unit 202, a score calculation unit 203, and an analysis support information display unit 204.
  • the analysis management unit 201 controls the liquid chromatograph 3.
  • the analysis management unit 201 gives an instruction to the liquid chromatograph 3 for the analysis process in response to the user's instruction to set the analysis condition data AP and start the analysis process.
  • the user sets a combination of setting values of analysis parameters such as solvent concentration, solvent mixing ratio, initial gradient value, gradient gradient, and column temperature as analysis conditions.
  • the user sets a plurality of sets of combinations of these analysis parameters. For example, a combination of analysis parameters in which the solvent concentration is changed little by little, a combination of analysis parameters in which the column temperature is changed little by little, and the like are set as analysis conditions.
  • the user creates a plurality of analysis condition data APs in this way, and performs analysis processing based on the plurality of analysis condition data APs for the same sample.
  • the analysis management unit 201 also acquires the measurement data MD from the liquid chromatograph 3. As described above, the user performs analysis processing based on a plurality of analysis condition data APs. The analysis management unit 201 acquires a plurality of measurement data MDs corresponding to the plurality of analysis condition data APs.
  • the chromatogram acquisition unit 202 acquires the chromatogram CG based on the measurement data MD.
  • the chromatogram acquisition unit 202 stores the acquired chromatogram CG in the storage device 106.
  • the analysis management unit 201 acquires a plurality of measurement data MDs corresponding to the plurality of analysis condition data APs.
  • the chromatogram acquisition unit 202 acquires a plurality of chromatogram CGs corresponding to the plurality of measurement data MDs.
  • the score calculation unit 203 calculates the score data SD based on the plurality of chromatogram CGs acquired by the chromatogram acquisition unit 202.
  • the sample analyzed in the liquid chromatograph 3 in the present embodiment contains a plurality of substances.
  • the score calculation unit 203 calculates the belonging probability indicating which substance contained in the sample each peak contained in the chromatogram CG belongs to.
  • FIG. 4 is a diagram showing two chromatograms CG1 and CG2 obtained based on two different analysis condition data APs.
  • the chromatograms CG1 and CG2 are acquired based on the measurement data MD obtained for the same sample.
  • the retention time of each peak is different due to the difference in the analysis condition data AP.
  • the peaks connected by the dotted lines in the figure are peaks derived from the same substance.
  • the score calculation unit 203 calculates the belonging probability indicating which substance contained in the sample each peak contained in the chromatograms CG1 and CG2 belongs to.
  • the score calculation unit 203 performs regression analysis using the solvent concentration which is an analysis parameter included in the analysis condition data AP and the retention time data RTD of each peak obtained from the chromatogram CG.
  • the score calculation unit 203 regresses the holding time data RTD by using Bayesian inference. Then, the score calculation unit 203 calculates the belonging probability indicating which substance contained in the sample each peak contained in the chromatogram CG belongs to, based on the regression analysis result of the retention time data RTD. Then, the score calculation unit 203 generates the score data SD based on the calculated belonging probability.
  • the analysis support information display unit 204 displays information for analysis support on the display 104.
  • the analysis support information display unit 204 includes a distribution display unit 205 and a score display unit 206.
  • the distribution display unit 205 displays the result of the regression analysis in the score calculation unit 203 on the display 104.
  • the score display unit 206 displays the score data SD calculated by the score calculation unit 203 on the display 104.
  • FIG. 5 is a flowchart showing a peak tracking method according to the present embodiment. It is known that the retention time of each substance in a chromatograph can be regressed with respect to analytical parameters such as solvent concentration, pH, and column temperature. In the peak tracking method of the present embodiment, the affiliation of each peak included in the chromatogram is determined at the same time as the regression of the retention time. When solving the belonging problem at the same time as regression, the solution is not always unique. Therefore, in the present embodiment, a possible distribution is obtained as a solution by calculating the posterior distribution by Bayesian inference.
  • the user Before starting the process shown in FIG. 5, the user operates the operation unit 105 in advance to set a plurality of analysis conditions.
  • the analysis management unit 201 stores a plurality of analysis condition data APs in the storage device 106.
  • the analysis management unit 201 sets a plurality of analysis condition data APs in the liquid chromatograph 3. Specifically, the analysis management unit 201 sets a plurality of analysis condition data APs for the system controller of the liquid chromatograph 3. Accordingly, in the liquid chromatograph 3, a plurality of analysis processes are executed for the same sample based on the set analysis condition data APs. In the liquid chromatograph 3, a plurality of measurement data MDs are acquired corresponding to a plurality of analysis condition data APs.
  • step S102 the analysis management unit 201 acquires a plurality of measurement data MDs from the liquid chromatograph 3.
  • the analysis management unit 201 stores a plurality of acquired measurement data MDs in the storage device 106.
  • step S103 the chromatogram acquisition unit 202 acquires a plurality of measurement data MDs stored in the storage device 106 in step S102, and acquires a plurality of chromatogram CGs from the acquired plurality of measurement data MDs.
  • step S104 the score calculation unit 203 acquires a plurality of chromatogram CGs acquired in step S103, and acquires the retention time data RTD of each peak included in each chromatogram CG.
  • FIG. 6 is a diagram showing the relationship between the analysis condition data AP and the retention time data RTD acquired in step S104.
  • the horizontal axis indicates the solvent concentration among the analysis parameters included in the analysis condition data AP.
  • the vertical axis indicates the holding time.
  • the retention times acquired for the five solvent concentrations are graphed corresponding to the five analytical condition data APs.
  • the five retention times are plotted for each of the five solvent concentrations. These five retention times are the retention times of the five peaks of the substances A to E contained in the sample.
  • the five retention time points are indicated by five types of symbols. Specifically, it is indicated by five types of symbols, that is, a quadrangle, a star, a triangle, a circle, and a cross, in order from the one with the shortest holding time.
  • the order of the holding times may be changed depending on the solvent concentration, so the symbols in FIG. 6 are for convenience. That is, the same symbol does not necessarily mean the retention time of peaks derived from the same substance.
  • the five retention times at the concentration "0.0" are associated with the substances A to E in order from the one with the shortest retention time.
  • the quadrangle at the concentration "0.0" is the substance A
  • the star shape is the substance B
  • the triangle is the substance C
  • the circle is the substance D
  • the cross is the substance E.
  • the main object of the present invention is that the peaks corresponding to the retention times represented by the five symbols at the concentrations "0.25", "0.5", "0.75" and "1.0" are the substances A to It is to show the belonging probability of which of D belongs.
  • step S105 the score calculation unit 203 obtains the affiliation probability (posterior distribution) indicating which substance each peak belongs to by the following mathematical formula (1).
  • c is the concentration.
  • the concentration c has five types of “0.0”, “0.25”, “0.5”, “0.75”, and “1.0”.
  • i is the peak ID.
  • c) indicates the probability that a peak will be selected by the categorical distribution.
  • c) is assumed to be constant regardless of i.
  • an appropriate value can be set as the probability that the peak is selected in the concentration c.
  • an appropriate value can be set for p (i
  • f (c) is a regression function of the retention time with respect to the concentration c.
  • N (u, ⁇ ) indicates the probability of x under the conditions of mean u and standard deviation ⁇ . That is, in the formula (1), the function N indicates the likelihood of x.
  • the score calculation unit 203 performs Bayesian estimation by giving an appropriate prior distribution to the assumed noise amount (standard deviation ⁇ ) and the regression coefficient inside the regression function f (c).
  • the amount of noise (standard deviation ⁇ ) is appropriately given as an approximate value from the accuracy of the iterative processing of the liquid chromatograph 3.
  • the regression function f (c) is the logarithm of a quadratic polynomial, it is known that the coefficient of the quadratic is very small in most substances, so that it is an empirically appropriate normal.
  • the distribution can be set. Alternatively, an appropriate value can be set using an information criterion such as WAIC based on a past case in which the peak track has already been completed.
  • the first-order coefficients As for the first-order coefficients, a general tendency is known for changes in solvent concentration. Also in the example of FIG. 6, for all the substances A to E, the retention time tends to decrease to the right with respect to the solvent concentration. Therefore, more preferably, a gentle prior distribution such as a t distribution can be given empirically. As described above, the posterior distribution in which each peak belongs to the substances A to E can be obtained from the likelihood and the prior distribution. In this embodiment, Bayesian inference by NUTS sampling is used. As a result, the likelihood of i (ID) is calculated by marginalization. Using NUTS sampling is an example, and other Bayesian methods can also be used.
  • FIG. 7 to 11 are diagrams showing the predicted distribution (distribution of belonging probability) calculated by Bayesian inference for the holding time shown in FIG.
  • FIG. 7 is a predicted distribution for substance A. That is, it is a figure which shows the predicted distribution by Bayesian inference of the substance A shown by a quadrangle at a concentration "0.0".
  • FIG. 8 is a predicted distribution for substance B. That is, it is a figure which shows the predicted distribution by Bayesian inference of the substance B shown in the star shape at the concentration "0.0”.
  • FIG. 9 is a predicted distribution for substance C. That is, it is a figure which shows the predicted distribution by Bayesian inference of the substance C shown by the triangle at the concentration "0.0".
  • FIG. 10 is a predicted distribution for substance D.
  • FIG. 11 is a predicted distribution for the substance E. That is, it is a figure which shows the predicted distribution by Bayesian inference of the substance E shown by the cross at the concentration "0.0".
  • the probability that each peak belongs to substances A to E is shown by shading.
  • the dark part indicates that the affiliation probability is high, and the lighter the color, the lower the affiliation probability.
  • the peak indicated by the cross has a high probability of being substance E at any concentration.
  • the peak shown in a star shape at a concentration of “0.25” or higher has a certain probability of being a substance C as well as a probability of being a substance B. ..
  • the peak indicated by the triangle at the concentration “0.25” or higher has a probability of being substance C as well as a probability of being substance B to some extent.
  • the score calculation unit 203 calculates the likelihood L (c) shown by the following mathematical formula (2) by using the sampling of the posterior distribution.
  • step S106 the score calculation unit 203 calculates the score data SD indicating which of the substances A to E each peak belongs to, using the following mathematical formula (3).
  • the score calculation unit 203 stores the score data SD in the storage device 106.
  • FIGS. 12 to 15 are diagrams showing a histogram of the categorical distribution probability when Bayesian inference is performed for the substance C.
  • the score calculation unit 203 calculates the likelihood L (c) shown above by using the sampling of the posterior distribution, and generates a histogram of the categorical distribution probability.
  • FIG. 12 is a diagram showing a histogram of the categorical distribution probability for the substance C at the concentration “0.25”.
  • the horizontal axis is the probability of the categorical distribution
  • the vertical axis is the histogram (cumulative value) of the categorical distribution probability. That is, it is a histogram in which the categorical distribution probabilities are calculated for a plurality of analysis condition data APs and the results are aggregated.
  • the ratio shown at the top of the graph indicates the score data SD of the probability of belonging to each peak.
  • the ratio shown at the upper part of the graph is the score data SD of the affiliation probability of each peak as in FIG. 12, and is a value indicating the occupancy rate of the frequency at which the probability becomes 0.8 or more.
  • FIG. 14 is a diagram showing a histogram of the categorical distribution probability for the substance C at the concentration “0.75”.
  • the occupancy rate of the frequency at which the probability of the categorical distribution is 0.8 or more is used as the score data SD, but this is an example.
  • the score data SD may be generated based on the probability of belonging to which substance each peak belongs to. In other words, the score data SD may be any one that correlates with the probability of belonging indicating which substance each peak belongs to.
  • step S107 the score display unit 206 displays the score data SD on the display 104.
  • step S108 the distribution display unit 205 displays the distribution (predicted distribution) of the belonging probability calculated in step S105 on the display 104.
  • FIG. 16 is a diagram showing an analysis support screen displayed on the display 104. In the example shown in FIG. 16, the score data SD of the affiliation probability of the substance C and the distribution of the affiliation probability regarding the substance C are displayed on the analysis support screen.
  • the “affiliation score of substance C” is displayed based on the score data SD.
  • the affiliation score of the substance C is the same as the score displayed at the upper part of the histogram shown in FIGS. 12 to 15. Further, the distribution of the belonging probability with respect to the substance C is the same as that shown in FIG. In FIG. 16, the case where the analysis support information regarding the substance C is displayed is illustrated, but the same applies to the substances A, B, D, and E.
  • the computer 1 of the present embodiment displays the score data SD based on the belonging probability indicating which substance contained in the sample belongs to each peak contained in each chromatogram on the display 104. This allows the user to confirm the probability of belonging to the peak. Further, the computer 1 of the present embodiment displays the distribution of the belonging probability obtained by the regression analysis on the display 104. This allows the user to visually confirm the validity of the peak affiliation.
  • the liquid chromatograph 3 is an example of the analyzer.
  • the computer 1 is an example of the peak tracking device.
  • the computer 1 displays the score data SD calculated by the score calculation unit 203 on the display 104.
  • the computer 1 may output the score data SD calculated by the score calculation unit 203 to another device, another program, a process, or the like.
  • the score data SD may be output to a device that executes processing for the purpose of AQBD (Analytical Quality by Design).
  • the control unit 200 of the computer 1 further includes an output unit in addition to the functional block shown in FIG.
  • the score data SD calculated in the present embodiment may be output to a program or device that processes these design spaces.
  • the design space and the score data SD can be associated with each other to present information.
  • the liquid chromatograph 3 has been described as an example of the analyzer of the present invention.
  • the present invention is also applicable to gas chromatographs.
  • the case where the computer 1 which is the peak tracking device of the present embodiment is connected to the liquid chromatograph 3 which is an analyzer via the network 4 has been described as an example.
  • the computer 1 may be configured to be built in the analyzer.
  • the peak tracking program P1 may be stored and provided in the storage medium 109.
  • the CPU 101 may access the storage medium 109 via the device interface 108 and store the peak tracking program P1 stored in the storage medium 109 in the storage device 106 or the ROM 103.
  • the CPU 101 may access the storage medium 109 via the device interface 108 and execute the peak tracking program P1 stored in the storage medium 109.
  • the peak tracking device is A chromatogram acquisition unit that acquires a plurality of chromatograms based on a plurality of measurement data obtained by giving a plurality of analysis condition data to the analyzer, and a chromatogram acquisition unit.
  • a score calculation unit that calculates score data based on the probability of belonging indicating which substance contained in the sample each peak contained in each chromatogram belongs to.
  • a score display unit for displaying the score data calculated by the score calculation unit on a display is provided.
  • the score calculation unit may calculate the affiliation probability by performing a regression analysis of the plurality of analysis condition data and the retention time of each substance obtained based on each analysis condition data.
  • the regressable retention time can be used to provide the user with useful information for identifying peaks contained in the chromatogram.
  • the peak tracking device further A distribution display unit for displaying the distribution of the belonging probability obtained by the regression analysis may be provided.
  • the user can confirm the validity of the peak identification by referring to the distribution of the belonging probability.
  • the peak tracking device is A chromatogram acquisition unit that acquires a plurality of chromatograms based on a plurality of measurement data obtained by giving a plurality of analysis condition data to the analyzer, and a chromatogram acquisition unit.
  • a score calculation unit that calculates score data based on the probability of belonging indicating which substance contained in the sample each peak contained in each chromatogram belongs to. It includes an output unit that outputs the score data calculated by the score calculation unit.
  • Score data can be used in other devices and programs.
  • the peak tracking method is A process of acquiring a plurality of chromatograms based on a plurality of measurement data obtained by giving a plurality of analysis condition data to an analyzer, and a process of acquiring a plurality of chromatograms.
  • the peak tracking program is Processing to acquire multiple chromatograms based on multiple measurement data obtained by giving multiple analysis condition data to the analyzer, Processing to calculate score data based on the probability of belonging, which indicates which substance contained in the sample each peak contained in each chromatogram belongs to.
  • the computer is made to execute the process of displaying the calculated score data on the display.

Landscapes

  • Analytical Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Pathology (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

ピークトラッキング装置は、複数の分析条件データを分析装置に与えることによって得られた複数の測定データに基づいて、複数のクロマトグラムを取得するクロマトグラム取得部と、各クロマトグラムに含まれる各ピークが、試料に含まれるいずれの物質に所属するかを示す所属確率に基づくスコアデータを算出するスコア算出部と、スコア算出部により算出されたスコアデータをディスプレイに表示するスコア表示部とを備える。

Description

ピークトラッキング装置、ピークトラッキング方法およびピークトラッキングプログラム
 本発明は、ピークトラッキング装置、ピークトラッキング方法およびピークトラッキングプログラムに関する。
 分析装置において取得される測定データから、試料のクロマトグラムを取得することができる。ピークの分離度を高くすることを目的として、あるいは、分析時間を短くすることを目的として、分析条件データの最適化を図るメソッドスカウティングが行われる。
 メソッドスカウティングを行うとき、異なる分析条件データに基づいて得られる異なるクロマトグラム間で同じ物質由来のピークを決定するピークトラッキングを行う必要がある。ピークトラッキングを行うためには、例えば、ピークの面積値、ピークの光学スペクトル、または、ピークのMSスペクトルの類似度などが用いられる。
 また、分析条件データと分析測定データとの間で回帰分析を行うことにより、メソッドスカウティングに有用な情報を与えることができる。下記非特許文献1においては、保持時間の回帰分析が行われている。
 核酸医薬品、ペプチド医薬品など比較的分子量の大きな薬剤の合成において、構造の似通った類縁物が副産物として生成されることが知られている。このような類縁物は光学スペクトルも似通っているため、光学スペクトル類似度を利用してもピークトラッキングが充分に行えない場合がある。また、このような類縁物はMSスペクトルも似た形状になることが多く、ピーク毎に特異なクロマトグラムを出力するm/z値を探索するために膨大な労力が必要とされる。ピーク面積値を用いる方法によっても、組み合わせを絞りきれない場合が多く、ピークトラッキングが充分に行えない場合がある。
 本発明の目的は、クロマトグラムに含まれるピークを同定するために有用な情報をユーザに提供することである。
 本発明の一局面に従うピークトラッキング装置は、複数の分析条件データを分析装置に与えることによって得られた複数の測定データに基づいて、複数のクロマトグラムを取得するクロマトグラム取得部と、各クロマトグラムに含まれる各ピークが、試料に含まれるいずれの物質に所属するかを示す所属確率に基づくスコアデータを算出するスコア算出部と、スコア算出部により算出されたスコアデータをディスプレイに表示するスコア表示部とを備える。
 本発明によれば、クロマトグラムに含まれるピークを同定するために有用な情報をユーザに提供することができる。
図1は本実施の形態に係る分析システムの全体図である。 図2は本実施の形態に係るコンピュータの構成図である。 図3は本実施の形態に係るコンピュータの機能ブロック図である。 図4は異なる分析条件データから得られたクロマトグラムを示す図である。 図5は本実施の形態に係るピークトラッキング方法を示すフローチャートである。 図6は溶媒濃度と保持時間との関係を示す図である。 図7は物質Aの保持時間回帰曲線の予測分布を示す図である。 図8は物質Bの保持時間回帰曲線の予測分布を示す図である。 図9は物質Cの保持時間回帰曲線の予測分布を示す図である。 図10は物質Dの保持時間回帰曲線の予測分布を示す図である。 図11は物質Eの保持時間回帰曲線の予測分布を示す図である。 図12は溶媒濃度“0.25”におけるカテゴリカル分布確率のヒストグラムを示す図である。 図13は溶媒濃度“0.5”におけるカテゴリカル分布確率のヒストグラムを示す図である。 図14は溶媒濃度“0.75”におけるカテゴリカル分布確率のヒストグラムを示す図である。 図15は溶媒濃度“1.0”におけるカテゴリカル分布確率のヒストグラムを示す図である。 図16はディスプレイに表示される分析支援画面を示す図である。
 次に、添付の図面を参照しながら本発明の実施の形態に係るピークトラッキング装置、方法およびプログラムの構成について説明する。
 (1)分析システムの全体構成
 図1は、本実施の形態に係る分析システム5の全体図である。分析システム5は、コンピュータ1および液体クロマトグラフ3を備える。コンピュータ1および液体クロマトグラフ3は、ネットワーク4を介して接続される。ネットワーク4は、例えばLAN(Local Area Network)である。
 コンピュータ1は、液体クロマトグラフ3に分析条件を設定する機能、液体クロマトグラフ3における測定結果を取得し、測定結果を分析する機能などを備える。コンピュータ1には、液体クロマトグラフ3を制御するためのプログラムがインストールされる。
 液体クロマトグラフ3は、ポンプユニット、オートサンプラユニット、カラムオーブンユニットおよび検出器ユニットなどを備える。液体クロマトグラフ3は、また、システムコントローラを備える。システムコントローラは、コンピュータ1からネットワーク4経由で受信した制御指示に従って、液体クロマトグラフ3を制御する。システムコントローラは、液体クロマトグラフ3の測定結果のデータを、ネットワーク4経由でコンピュータ1に送信する。
 (2)コンピュータ(ピークトラッキング装置)の構成
 図2は、コンピュータ1の構成図である。コンピュータ1は、本実施の形態においてはパーソナルコンピュータが利用される。コンピュータ1は、CPU(Central Proccessing Unit)101、RAM(Random Access Memory)102、ROM(Read Only Memory)103、ディスプレイ104、操作部105、記憶装置106、通信インタフェース107、および、デバイスインタフェース108を備える。
 CPU101は、コンピュータ1の制御を行う。RAM102は、CPU101がプログラムを実行するときにワークエリアとして使用される。ROM103には、制御プログラムなどが記憶される。ディスプレイ104は、例えば液晶ディスプレイである。操作部105は、ユーザの操作を受け付けるデバイスであり、キーボード、マウスなどを含む。ディスプレイ104がタッチパネルディスプレイで構成され、ディスプレイ104が操作部105としての機能を備えていても良い。記憶装置106は、各種プログラムおよびデータを記憶する装置である。記憶装置106は、例えばハードディスクである。通信インタフェース107は、他のコンピュータおよびデバイスと通信を行うインタフェースである。通信インタフェース107は、ネットワーク4に接続される。デバイスインタフェース108は、各種の外部デバイスにアクセスするインタフェースである。CPU101は、デバイスインタフェース108に接続された外部デバイス装置を介して記憶媒体109にアクセスすることができる。
 記憶装置106には、ピークトラッキングプログラムP1、分析条件データAP、測定データMD、クロマトグラムCG、保持時間データRTD、および、スコアデータSDが記憶される。ピークトラッキングプログラムP1は、液体クロマトグラフ3を制御するためのプログラムである。ピークトラッキングプログラムP1は、液体クロマトグラフ3に対して分析条件を設定する機能、液体クロマトグラフ3から測定結果を取得し、クロマトグラムCGを生成するなど、測定結果を分析する機能などを備える。分析条件データAPは、液体クロマトグラフ3に設定する分析条件を記述したデータであり、複数の分析パラメータを含む。測定データMDは、液体クロマトグラフ3から取得した測定結果のデータである。保持時間データRTDは、クロマトグラムCGに含まれる物質の保持時間を示すデータである。本実施の形態においては、分析される試料に複数の物質が含まれており、クロマトグラムCGには複数の物質のピークが含まれる。これにより、保持時間データRTDには各クロマトグラムCGに対して複数の保持時間を示すデータが含まれる。スコアデータSDは、クロマトグラムに含まれる各ピークが、試料に含まれるいずれの物質に所属するかを示す所属確率に基づいて算出されるデータである。
 図3は、コンピュータ1の機能ブロック図である。制御部200は、CPU101が、RAM102をワークエリアとして使用し、ピークトラッキングプログラムP1を実行することにより実現される機能部である。制御部200は、分析管理部201、クロマトグラム取得部202、スコア算出部203、および、分析支援情報表示部204を備える。
 分析管理部201は、液体クロマトグラフ3の制御を行う。分析管理部201は、ユーザによる分析条件データAPの設定および分析処理の開始指示を受けて、液体クロマトグラフ3に対する分析処理の指示を行う。ユーザは、溶媒濃度、溶媒混合比、グラジエント初期値、グラジエント勾配、カラム温度などの分析パラメータの設定値の組み合わせを、分析条件として設定する。ユーザは、これら分析パラメータの組み合わせを複数セット設定する。例えば、溶媒濃度を少しずつ変化させた分析パラメータの組み合わせや、カラム温度を少しずつ変化させた分析パラメータの組み合わせなどを分析条件として設定する。ユーザは、このように複数の分析条件データAPを作成し、同一の試料に対して複数の分析条件データAPに基づく分析処理を行う。
 分析管理部201は、また、液体クロマトグラフ3から測定データMDを取得する。上記のように、ユーザは、複数の分析条件データAPに基づく分析処理を行う。分析管理部201は、複数の分析条件データAPに対応する複数の測定データMDを取得する。
 クロマトグラム取得部202は、測定データMDに基づいてクロマトグラムCGを取得する。クロマトグラム取得部202は、取得したクロマトグラムCGを記憶装置106に保存する。上記のように、分析管理部201は、複数の分析条件データAPに対応する複数の測定データMDを取得する。クロマトグラム取得部202は、複数の測定データMDに対応する複数のクロマトグラムCGを取得する。
 スコア算出部203は、クロマトグラム取得部202が取得した複数のクロマトグラムCGに基づいて、スコアデータSDを算出する。本実施の形態において液体クロマトグラフ3において分析される試料は、複数の物質を含んでいる。スコア算出部203は、クロマトグラムCGに含まれる各ピークが、試料に含まれるいずれの物質に所属するかを示す所属確率を算出する。
 図4は、2つの異なる分析条件データAPに基づいて得られた2つのクロマトグラムCG1,CG2を示す図である。クロマトグラムCG1,CG2は、同一の試料について得られた測定データMDに基づいて取得される。図4を参照すれば分かるように、クロマトグラムCG1,CG2では、分析条件データAPの違いに起因して各ピークの保持時間が異なっている。図において点線で結ばれているピークは、同一の物質に由来するピークである。スコア算出部203は、クロマトグラムCG1,CG2に含まれる各ピークが、試料に含まれるいずれの物質に所属するかを示す所属確率を算出する。
 具体的には、スコア算出部203は、分析条件データAPに含まれる分析パラメータである溶媒濃度と、クロマトグラムCGから得られる各ピークの保持時間データRTDとを用いて回帰分析を行う。本実施の形態においては、スコア算出部203は、ベイズ推論を利用して保持時間データRTDの回帰を行う。そして、スコア算出部203は、保持時間データRTDの回帰分析結果に基づき、クロマトグラムCGに含まれる各ピークが、試料に含まれるいずれの物質に所属するかを示す所属確率を算出する。そして、スコア算出部203は、算出した所属確率に基づいてスコアデータSDを生成する。
 分析支援情報表示部204は、ディスプレイ104に分析支援のための情報表示を行う。分析支援情報表示部204は、分布表示部205およびスコア表示部206を備える。分布表示部205は、スコア算出部203における回帰分析の結果をディスプレイ104に表示する。スコア表示部206は、スコア算出部203が算出したスコアデータSDをディスプレイ104に表示する。
 (3)ピークトラッキング方法
 次に、本実施の形態に係るコンピュータ1(ピークトラッキング装置)において実行されるピークトラッキング方法について説明する。図5は、本実施の形態に係るピークトラッキング方法を示すフローチャートである。クロマトグラフにおける各物質の保持時間は、溶媒濃度、pH、カラム温度などの分析パラメータに対して回帰できることが知られている。本実施の形態のピークトラッキング方法においては、保持時間の回帰と同時に、クロマトグラムに含まれる各ピークの所属を決定する。回帰と同時に所属問題を解く場合、解が一意になるとは限らないため、本実施の形態においては、ベイズ推論による事後分布算出によって、解としてあり得る分布を取得する。
 図5に示す処理を開始する前に、予め、ユーザが操作部105を操作し、複数の分析条件の設定を行う。このようなユーザの設定操作を受けて、分析管理部201は、記憶装置106に複数の分析条件データAPを保存する。
 次に、図5に示すステップS101において、分析管理部201が、複数の分析条件データAPを液体クロマトグラフ3に設定する。具体的には、分析管理部201は、液体クロマトグラフ3のシステムコントローラに対して、複数の分析条件データAPを設定する。これに応じて、液体クロマトグラフ3において、設定された複数の分析条件データAPに基づいて、同一の試料に対して複数回の分析処理が実行される。液体クロマトグラフ3において、複数の分析条件データAPに対応して複数の測定データMDが取得される。
 次に、ステップS102において、分析管理部201は、液体クロマトグラフ3から複数の測定データMDを取得する。分析管理部201は、記憶装置106に、取得した複数の測定データMDを保存する。
 次に、ステップS103において、クロマトグラム取得部202が、ステップS102において記憶装置106に保存された複数の測定データMDを取得し、取得した複数の測定データMDから複数のクロマトグラムCGを取得する。
 次に、ステップS104において、スコア算出部203は、ステップS103において取得された複数のクロマトグラムCGを取得し、各クロマトグラムCGに含まれる各ピークの保持時間データRTDを取得する。
 図6は、分析条件データAPとステップS104において取得された保持時間データRTDとの関係を示す図である。図6において、横軸は、分析条件データAPに含まれる分析パラメータのうち、溶媒濃度を示す。図6において、縦軸は、保持時間を示す。図6においては、5つの分析条件データAPに対応して、5種類の溶媒濃度に関して取得された保持時間がグラフされている。溶媒濃度は、“0.0”、“0.25”、“0.5”、“0.75”、“1.0”の5種類であるが、ここでは特に溶媒濃度の単位は意味を持たないものとする。
 5種類の溶媒濃度に対して、それぞれ5つの保持時間がプロットされている。この5つの保持時間は、試料に含まれる物質A~Eの5つのピークの保持時間である。図6においては、5つの保持時間の点を、5種類の記号で示している。具体的には、保持時間の短い方から順に、四角形、星形、三角形、円形および十字の5種類の記号で示している。しかし、実際には、溶媒濃度によって保持時間の順序が入れ替わることもあるため、図6における記号は便宜上である。つまり、同じ記号が同じ物質由来のピークの保持時間であるとは限らない。ここで、濃度“0.0”における5つの保持時間を、保持時間の短い方から順に物質A~Eと対応付ける。つまり、濃度“0.0”における四角形が物質A、星型が物質B、三角形が物質C、円形が物質D、十字が物質Eであるとする。本発明の主目的は、濃度“0.25”、“0.5”、“0.75”、“1.0”における5つの記号で表される保持時間に対応するピークが、物質A~Dのいずれに所属するかの所属確率を示すことである。
 次に、ステップS105において、スコア算出部203は、以下の数式(1)により、各ピークがいずれの物質に所属するかを示す所属確率(事後分布)を求める。
Figure JPOXMLDOC01-appb-M000001
 数式(1)において、cは濃度である。図6に示した例では、濃度cは、“0.0”、“0.25”、“0.5”、“0.75”、“1.0”の5種類である。数式(1)において、iは、ピークのIDである。図6に示した例では、保持時間の小さい方から順にi=0~4のIDが付与される。つまり、図6において、四角形で示されるピークにi=0、星形で示されるピークにi=1、三角形で示されるピークにi=2、円形で示されるピークにi=4、十字で示されるピークにi=4のIDが付与される。
 p(i|c)は、カテゴリカル分布によってピークが選ばれる確率を示す。p(i|c)は、濃度cにおいて、i=0~4のピークが選ばれる確率である。つまり、p(i|c)は、各ピークが物質A~Eのいずれに所属するかを示す事後分布を算出するための事前分布となる。本実施の形態においては、説明を簡単にするために、p(i|c)は、iに関わらず一定であるとする。ただし、ピークのスペクトルや面積を参照することにより、濃度cにおいて、ピークが選ばれる確率として適当な値を設定することができる。例えば、物質A~Eのピークの大小関係やスペクトルの類似度などを参照することで、p(i|c)に適当な値を設定することができる。
 数式(1)において、xは、濃度c、ID=iにおける保持時間である。数式(1)において、f(c)は、濃度cに対する保持時間の回帰関数である。N(u,σ)は、平均u、標準偏差σの条件下におけるxの確率を示す。つまり、数式(1)において、関数Nは、xの尤度を示す。
 スコア算出部203は、想定されるノイズ量(標準偏差σ)や回帰関数f(c)内部の回帰係数に適当な事前分布を与えて、ベイズ推定を行う。ノイズ量(標準偏差σ)は、液体クロマトグラフ3の繰り返し処理の精度などから、おおよその値が適切に与えられる。また、回帰関数f(c)が2次多項式の対数となっている場合であれば、ほとんどの物質で2次の係数は非常に小さくなることが知られているので、経験的に適当な正規分布を設定することができる。あるいは、既にピークトラックが完了している過去の事例に基づいて、WAICなどの情報量規準を用いて、適当な値を設定することができる。1次の係数に関しては、溶媒濃度の変化に対して一般的な傾向が知られている。図6の例においても、すべての物質A~Eについて、溶媒濃度に対して保持時間が概ね右下がりの傾向を示している。従って、より好ましくは経験的にt分布などの緩やかな事前分布を与えることができる。以上のように、尤度と事前分布から、各ピークが物質A~Eに所属する事後分布を得ることができる。なお、本実施の形態においては、NUTSサンプリングによるベイズ推論を用いる。これにより、i(ID)について周辺化により尤度が算出される。NUTSサンプリングを用いることは一例であり、他のベイズ理論の手法を用いることもできる。
 図7~図11は、図6で示す保持時間について、ベイズ推論により算出された予測分布(所属確率の分布)を示す図である。図7は、物質Aに関する予測分布である。つまり、濃度“0.0”において四角形で示す物質Aのベイズ推論による予測分布を示す図である。図8は、物質Bに関する予測分布である。つまり、濃度“0.0”において星形で示す物質Bのベイズ推論による予測分布を示す図である。図9は、物質Cに関する予測分布である。つまり、濃度“0.0”において三角形で示す物質Cのベイズ推論による予測分布を示す図である。図10は、物質Dに関する予測分布である。つまり、濃度“0.0”において円形で示す物質Dのベイズ推論による予測分布を示す図である。図11は、物質Eに関する予測分布である。つまり、濃度“0.0”において十字で示す物質Eのベイズ推論による予測分布を示す図である。
 図7~図11において、各ピークが物質A~Eに所属する確率が、濃淡で示されている。色の濃い部分は、所属確率が高いことを示し、色が薄くなる程、所属確率が低くなることを示している。図11に示すように、十字で示されるピークについては、いずれの濃度においても物質Eである確率が高いことが分かる。また、図8および図9に示すように、濃度“0.25”以上において星形で示されるピークは、物質Bである確率とともに、物質Cである確率も、ある程度有していることが分かる。また、図8および図9に示すように、濃度“0.25”以上において三角形で示されるピークは、物質Cである確率とともに、物質Bである確率も、ある程度有していることが分かる。
 カテゴリカル分布はサンプリング時には周辺化されているので、実際には、別途カテゴリカル分布の算出が必要である。スコア算出部203は、事後分布のサンプリングを用いて、以下の数式(2)で示す尤度L(c)を算出する。
Figure JPOXMLDOC01-appb-M000002
 そして、スコア算出部203は、ステップS106において、以下の数式(3)を用いて、各ピークが物質A~Eのいずれに所属するかを示すスコアデータSDを計算する。スコア算出部203は、スコアデータSDを記憶装置106に保存する。
Figure JPOXMLDOC01-appb-M000003
 図12~図15は、物質Cに関して、ベイズ推論を行った場合のカテゴリカル分布確率のヒストグラムを示す図である。スコア算出部203は、事後分布のサンプリングを用いて、上記で示す尤度L(c)を計算し、カテゴリカル分布確率のヒストグラムを生成する。
 図12は、濃度“0.25”において、物質Cに関するカテゴリカル分布確率のヒストグラムを示す図である。図12において横軸はカテゴリカル分布の確率であり、縦軸は、カテゴリカル分布確率のヒストグラム(累積値)である。つまり、複数の分析条件データAPについて、カテゴリカル分布確率を算出し、その結果を集計したヒストグラムである。図に示すように、確率1.0において、i=2の累積値が最も大きくなっている。また、確率1.0において、i=3の累積値が次に多くなっている。これにより、濃度“0.25”においては、i=2のピークが物質Cに所属する確率が非常に高くなっていることが分かる。また、濃度“0.25”においては、i=3のピークが物質Cに所属する確率も、ある程度有していることが分かる。
 図12において、グラフの上部に示される割合は、各ピークの所属確率のスコアデータSDを示す。スコアデータSDは、所属確率が0.8以上となる頻度の占有率を示す値であり、右端からi=0~4の場合のスコアデータSDを示している。図の例では、i=0のピークのスコアデータSDが0、i=1のピークのスコアデータSDが0.02、i=2のピークのスコアデータSDが0.69、i=3のピークのスコアデータSDが0.3、i=4のピークのスコアデータSDが0であることを示している。
 図13は、濃度“0.5”において、物質Cに関するカテゴリカル分布確率のヒストグラムを示す図である。図に示すように、確率1.0において、i=2の累積値が最も大きくなっている。また、確率1.0において、i=3の累積値が次に多くなっている。これにより、濃度“0.5”においても、i=2のピークが物質Cに所属する確率が非常に高くなっていることが分かる。また、濃度“0.5”においても、i=3のピークが物質Cに所属する確率も、ある程度有していることが分かる。また、濃度“0.5”において、i=1のピークが物質Cに所属する確率もわずかであるが有していることが分かる。
 図13において、グラフの上部に示される割合は、図12と同様、各ピークの所属確率のスコアデータSDであり、確率が0.8以上となる頻度の占有率を示す値である。図の例では、i=0のピークのスコアデータSDが0.05、i=1のピークのスコアデータSDが0.09、i=2のピークのスコアデータSDが0.61、i=3のピークのスコアデータSDが0.24、i=4のピークのスコアデータSDが0であることを示している。
 図14は、濃度“0.75”において、物質Cに関するカテゴリカル分布確率のヒストグラムを示す図である。図15は、濃度“1.0”において、物質Cに関するカテゴリカル分布確率のヒストグラムを示す図である。濃度“0.5”、“0.75”においても、i=2のピークが物質Cに所属する確率が非常に高くなっていることが分かる。
 図14の例では、i=0のピークのスコアデータSDが0.14、i=1のピークのスコアデータSDが0.12、i=2のピークのスコアデータSDが0.59、i=3のピークのスコアデータSDが0.16、i=4のピークのスコアデータSDが0であることを示している。図15の例では、i=0のピークのスコアデータSDが0.14、i=1のピークのスコアデータSDが0.19、i=2のピークのスコアデータSDが0.51、i=3のピークのスコアデータSDが0.15、i=4のピークのスコアデータSDが0であることを示している。なお、図11~図14に示した例では、スコアデータSDとしてカテゴリカル分布の確率が0.8以上となる頻度の占有率を利用したが、これは一例である。スコアデータSDは、各ピークがいずれの物質に所属するかを示す所属確率に基づいて生成されるものであればよい。言い換えると、スコアデータSDは、各ピークがいずれの物質に所属するかを示す所属確率に相関するものであればよい。
 次に、ステップS107において、スコア表示部206が、スコアデータSDをディスプレイ104に表示する。続いて、ステップS108において、分布表示部205が、ステップS105で算出した所属確率の分布(予測分布)をディスプレイ104に表示する。図16は、ディスプレイ104に表示された分析支援画面を示す図である。図16で示す例では、分析支援画面には、物質Cの所属確率のスコアデータSD、および、物質Cに関する所属確率の分布が表示されている。
 図16において、“物質Cの所属スコア”は、スコアデータSDに基づいて表示される。物質Cの所属スコアは、図12~図15で示したヒストグラムの上部に表示されたスコアと同様である。また、物質Cに関する所属確率の分布は、図9に示したものと同様である。図16では、物質Cに関する分析支援情報を表示させる場合を例示したが、物質A、B、D、Eについても同様である。
 このように、本実施の形態のコンピュータ1は、各クロマトグラムに含まれる各ピークが、試料に含まれるいずれの物質に所属するかを示す所属確率に基づくスコアデータSDをディスプレイ104に表示する。これにより、ユーザは、ピークの所属確率を確認することが可能である。また、本実施の形態のコンピュータ1は、回帰分析により得られた所属確率の分布をディスプレイ104に表示する。これにより、ユーザは、ピークの所属の妥当性を視覚的に確認することができる。
 (4)請求項の各構成要素と実施の形態の各要素との対応
 以下、請求項の各構成要素と実施の形態の各要素との対応の例について説明するが、本発明は下記の例に限定されない。上記の実施の形態では、液体クロマトグラフ3が分析装置の例である。また、上記の実施の形態では、コンピュータ1がピークトラッキング装置の例である。
 請求項の各構成要素として、請求項に記載されている構成または機能を有する種々の要素を用いることもできる。
 (5)他の実施の形態
 上記実施の形態においては、コンピュータ1は、スコア算出部203が算出したスコアデータSDをディスプレイ104に表示させる。他の実施の形態としては、コンピュータ1が、スコア算出部203が算出したスコアデータSDを、他の装置または他のプログラム、プロセスなどに出力するようにしてもよい。例えば、AQBD(Analytical Quality by Design)を目的とした処理を実行する装置に、スコアデータSDを出力するようにしてもよい。この場合、コンピュータ1の制御部200は、図2に示した機能ブロックに加えて、更に出力部を備える。
 例えば、ピークの保持時間や分離度を回帰分析することにより、保持時間や分離度のデザインスペースを取得するプログラムまたは装置がある。これらデザインスペースを処理するプログラムまたは装置に、本実施の形態において算出したスコアデータSDを出力するようにしてもよい。例えば、スコアデータSDを入力した装置において、デザインスペースとスコアデータSDとを関連付けて情報を提示することができる。
 上記実施の形態においては、本発明の分析装置として、液体クロマトグラフ3を例に説明した。本発明は、他にも、ガスクロマトグラフにも適用可能である。また、上記の実施の形態において、本実施の形態のピークトラッキング装置であるコンピュータ1は、ネットワーク4を介して分析装置である液体クロマトグラフ3に接続される場合を例に説明した。他の実施の形態として、コンピュータ1が、分析装置に内蔵される構成であってもよい。
 上記実施の形態においては、ピークトラッキングプログラムP1は、記憶装置106に保存されている場合を例に説明した。他の実施の形態として、ピークトラッキングプログラムP1は、記憶媒体109に保存されて提供されてもよい。CPU101は、デバイスインタフェース108を介して記憶媒体109にアクセスし、記憶媒体109に保存されたピークトラッキングプログラムP1を、記憶装置106またはROM103に保存するようにしてもよい。あるいは、CPU101は、デバイスインタフェース108を介して記憶媒体109にアクセスし、記憶媒体109に保存されたピークトラッキングプログラムP1を実行するようにしてもよい。
 なお、本発明の具体的な構成は、前述の実施形態に限られるものではなく、発明の要旨を逸脱しない範囲で種々の変更および修正が可能である。
 (6)態様
 上述した複数の例示的な実施の形態は、以下の態様の具体例であることが当業者により理解される。
 (第1項)
 本発明の一態様に係るピークトラッキング装置は、
 複数の分析条件データを分析装置に与えることによって得られた複数の測定データに基づいて、複数のクロマトグラムを取得するクロマトグラム取得部と、
 各クロマトグラムに含まれる各ピークが、試料に含まれるいずれの物質に所属するかを示す所属確率に基づくスコアデータを算出するスコア算出部と、
 前記スコア算出部により算出された前記スコアデータをディスプレイに表示するスコア表示部と、を備える。
 クロマトグラムに含まれるピークを同定するために有用な情報をユーザに提供することができる。
 (第2項)
 第1項に記載のピークトラッキング装置において、
 前記スコア算出部は、前記複数の分析条件データと各分析条件データに基づいて得られた各物質の保持時間との回帰分析を行うことにより、前記所属確率を算出してもよい。
 回帰可能な保持時間を利用して、クロマトグラムに含まれるピークを同定するために有用な情報をユーザに提供することができる。
 (第3項)
 第2項に記載のピークトラッキング装置において、
 前記ピークトラッキング装置は、さらに、
 前記回帰分析により得られた前記所属確率の分布を表示する分布表示部、を備えてもよい。
 ユーザは、所属確率の分布を参照することで、ピークの同定の妥当性を確認することができる。
 (第4項)
 第2項または第3項に記載のピークトラッキング装置において、
 前記スコア算出部は、ベイズ推論を用いることにより回帰関数に誤差を与えたときの誤差分布から取得される尤度、および、各ピークが選択される確率に基づいて前記所属確率を算出してもよい。
 ベイズ推論により、ピークがいずれの物質に所属するかを示す所属確率を提示可能である。
 (第5項)
 本発明の他の態様に係るピークトラッキング装置は、
 複数の分析条件データを分析装置に与えることによって得られた複数の測定データに基づいて、複数のクロマトグラムを取得するクロマトグラム取得部と、
 各クロマトグラムに含まれる各ピークが、試料に含まれるいずれの物質に所属するかを示す所属確率に基づくスコアデータを算出するスコア算出部と、
 前記スコア算出部により算出された前記スコアデータを出力する出力部と、を備える。
 スコアデータを他の装置やプログラムにおいて利用可能である。
 (第6項)
 本発明の他の態様に係るピークトラッキング方法は、
 複数の分析条件データを分析装置に与えることによって得られた複数の測定データに基づいて、複数のクロマトグラムを取得する工程と、
 各クロマトグラムに含まれる各ピークが、試料に含まれるいずれの物質に所属するかを示す所属確率に基づくスコアデータを算出する工程と、
 算出された前記スコアデータをディスプレイに表示する工程と、を含む。
 (第7項)
 本発明の他の態様に係るピークトラッキングプログラムは、
 複数の分析条件データを分析装置に与えることによって得られた複数の測定データに基づいて、複数のクロマトグラムを取得する処理、
 各クロマトグラムに含まれる各ピークが、試料に含まれるいずれの物質に所属するかを示す所属確率に基づくスコアデータを算出する処理、
 算出された前記スコアデータをディスプレイに表示する処理、をコンピュータに実行させる。

Claims (7)

  1.  複数の分析条件データを分析装置に与えることによって得られた複数の測定データに基づいて、複数のクロマトグラムを取得するクロマトグラム取得部と、
     各クロマトグラムに含まれる各ピークが、試料に含まれるいずれの物質に所属するかを示す所属確率に基づくスコアデータを算出するスコア算出部と、
     前記スコア算出部により算出された前記スコアデータをディスプレイに表示するスコア表示部と、を備えるピークトラッキング装置。
  2.  前記スコア算出部は、前記複数の分析条件データと各分析条件データに基づいて得られた各物質の保持時間との回帰分析を行うことにより、前記所属確率を算出する、請求項1に記載のピークトラッキング装置。
  3.  前記ピークトラッキング装置は、さらに、
     前記回帰分析により得られた前記所属確率の分布を表示する分布表示部、を備える、請求項2に記載のピークトラッキング装置。
  4.  前記スコア算出部は、ベイズ推論を用いることにより回帰関数に誤差を与えたときの誤差分布から取得される尤度、および、各ピークが選択される確率に基づいて前記所属確率を算出する、請求項1に記載のピークトラッキング装置。
  5.  複数の分析条件データを分析装置に与えることによって得られた複数の測定データに基づいて、複数のクロマトグラムを取得するクロマトグラム取得部と、
     各クロマトグラムに含まれる各ピークが、試料に含まれるいずれの物質に所属するかを示す所属確率に基づくスコアデータを算出するスコア算出部と、
     前記スコア算出部により算出された前記スコアデータを出力する出力部と、を備えるピークトラッキング装置。
  6.  複数の分析条件データを分析装置に与えることによって得られた複数の測定データに基づいて、複数のクロマトグラムを取得する工程と、
     各クロマトグラムに含まれる各ピークが、試料に含まれるいずれの物質に所属するかを示す所属確率に基づくスコアデータを算出する工程と、
     算出された前記スコアデータをディスプレイに表示する工程と、を含むピークトラッキング方法。
  7.  複数の分析条件データを分析装置に与えることによって得られた複数の測定データに基づいて、複数のクロマトグラムを取得する処理、
     各クロマトグラムに含まれる各ピークが、試料に含まれるいずれの物質に所属するかを示す所属確率に基づくスコアデータを算出する処理、
     算出された前記スコアデータをディスプレイに表示する処理、をコンピュータに実行させるピークトラッキングプログラム。
PCT/JP2021/014052 2020-05-28 2021-03-31 ピークトラッキング装置、ピークトラッキング方法およびピークトラッキングプログラム WO2021240993A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2022527541A JP7480843B2 (ja) 2020-05-28 2021-03-31 ピークトラッキング装置、ピークトラッキング方法およびピークトラッキングプログラム
US17/927,964 US20230204548A1 (en) 2020-05-28 2021-03-31 Peak tracking device, peak tracking method and peak tracking program
CN202180037872.3A CN115698705A (zh) 2020-05-28 2021-03-31 峰追踪装置、峰追踪方法及峰追踪程序

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2020093335 2020-05-28
JP2020-093335 2020-05-28

Publications (1)

Publication Number Publication Date
WO2021240993A1 true WO2021240993A1 (ja) 2021-12-02

Family

ID=78723323

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2021/014052 WO2021240993A1 (ja) 2020-05-28 2021-03-31 ピークトラッキング装置、ピークトラッキング方法およびピークトラッキングプログラム

Country Status (4)

Country Link
US (1) US20230204548A1 (ja)
JP (1) JP7480843B2 (ja)
CN (1) CN115698705A (ja)
WO (1) WO2021240993A1 (ja)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04212059A (ja) * 1990-01-18 1992-08-03 Hewlett Packard Co <Hp> クロマトグラフのスペクトル・データ処理方法
JPH06324029A (ja) * 1993-03-15 1994-11-25 Hitachi Ltd クロマトグラム解析表示方法及びその装置
JP2003530572A (ja) * 2000-04-11 2003-10-14 ザ プロクター アンド ギャンブル カンパニー 高速液体クロマトグラフィー・パラメータのモデル化、予測、及び最適化のための方法
WO2018211714A1 (en) * 2017-05-15 2018-11-22 Shimadzu Corporation Mass spectrometry data acquisition method
WO2019176658A1 (ja) * 2018-03-14 2019-09-19 株式会社日立ハイテクノロジーズ クロマトグラフィー質量分析方法およびクロマトグラフ質量分析装置
WO2020225864A1 (ja) * 2019-05-08 2020-11-12 株式会社島津製作所 分析装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04212059A (ja) * 1990-01-18 1992-08-03 Hewlett Packard Co <Hp> クロマトグラフのスペクトル・データ処理方法
JPH06324029A (ja) * 1993-03-15 1994-11-25 Hitachi Ltd クロマトグラム解析表示方法及びその装置
JP2003530572A (ja) * 2000-04-11 2003-10-14 ザ プロクター アンド ギャンブル カンパニー 高速液体クロマトグラフィー・パラメータのモデル化、予測、及び最適化のための方法
WO2018211714A1 (en) * 2017-05-15 2018-11-22 Shimadzu Corporation Mass spectrometry data acquisition method
WO2019176658A1 (ja) * 2018-03-14 2019-09-19 株式会社日立ハイテクノロジーズ クロマトグラフィー質量分析方法およびクロマトグラフ質量分析装置
WO2020225864A1 (ja) * 2019-05-08 2020-11-12 株式会社島津製作所 分析装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ANONYMOUS: "多サンプルMS ⾼速定量解析ソフトウェア MS Quant Manager™ /Multi-sample MS,high-speed quantitative analysis software: MS Quant Manager/", REIFYCS INC. BROCHURE, 1 January 2014 (2014-01-01), pages 1 - 2, XP055878004, Retrieved from the Internet <URL:https://ja.reifycs.com/files/BrochureMsQuantManager.pdf> [retrieved on 20220112] *
NODA, AKIRA: "Retention Time Alignment Algorithm for Chromatogram", SHIMADZU REVIEW, vol. 69, no. 3-4, 2013, pages 265 - 269 *

Also Published As

Publication number Publication date
JP7480843B2 (ja) 2024-05-10
JPWO2021240993A1 (ja) 2021-12-02
US20230204548A1 (en) 2023-06-29
CN115698705A (zh) 2023-02-03

Similar Documents

Publication Publication Date Title
Broadhurst et al. Guidelines and considerations for the use of system suitability and quality control samples in mass spectrometry assays applied in untargeted clinical metabolomic studies
Amigo et al. ChroMATHography: solving chromatographic issues with mathematical models and intuitive graphics
Geladi Chemometrics in spectroscopy. Part 1. Classical chemometrics
Johnson et al. High-speed peak matching algorithm for retention time alignment of gas chromatographic data for chemometric analysis
US8428889B2 (en) Methods of automated spectral peak detection and quantification having learning mode
Fraga et al. Increasing the number of analyzable peaks in comprehensive two-dimensional separations through chemometrics
US7676329B2 (en) Method and system for processing multi-dimensional measurement data
US20080302957A1 (en) Identifying ions from mass spectral data
Giddings et al. A software system for data analysis in automated DNA sequencing
US20160209379A9 (en) Prediction of Fuel Properties
US9812306B2 (en) Shift correction for spectral analysis
Christmann et al. gc-ims-tools–A new Python package for chemometric analysis of GC–IMS data
US20170219542A1 (en) Peak extraction method and program
Nowik et al. Assessment of two-dimensional separative systems using the nearest neighbor distances approach. Part 2: separation quality aspects
Mani-Varnosfaderani et al. Estimating complicated baselines in analytical signals using the iterative training of Bayesian regularized artificial neural networks
Gibb et al. Mass spectrometry analysis using MALDIquant
JP7415771B2 (ja) 分析支援装置、分析支援方法および分析支援プログラム
WO2021240993A1 (ja) ピークトラッキング装置、ピークトラッキング方法およびピークトラッキングプログラム
Reis et al. Multiresponse and multiobjective latent variable optimization of modern analytical instrumentation for the quantification of chemically related families of compounds: Case study—Solid‐phase microextraction (SPME) applied to the quantification of analytes with impact on wine aroma
JP4639940B2 (ja) ゲル浸透クロマトグラフ装置用データ処理装置
Woehl et al. Method for automatic generation of Indirect Hard Models using crossvalidation (MAGIC) for the spectral analysis of mixture spectra
Babić et al. Resolution of protein hydrogen/deuterium exchange by fitting amide exchange probabilities to the peptide isotopic envelopes
US20060273010A1 (en) Systems for developing analytical device methods
CN110546496A (zh) 试样分析装置
Richards et al. A novel approach to the quantification of industrial mixtures from the Vinyl Acetate Monomer (VAM) process using Near Infrared spectroscopic data and a Quantitative Self Modeling Curve Resolution (SMCR) methodology

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 21812468

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2022527541

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 21812468

Country of ref document: EP

Kind code of ref document: A1