WO2021240939A1 - データ処理装置、データ処理方法、データ処理プログラムおよび分析装置 - Google Patents

データ処理装置、データ処理方法、データ処理プログラムおよび分析装置 Download PDF

Info

Publication number
WO2021240939A1
WO2021240939A1 PCT/JP2021/008351 JP2021008351W WO2021240939A1 WO 2021240939 A1 WO2021240939 A1 WO 2021240939A1 JP 2021008351 W JP2021008351 W JP 2021008351W WO 2021240939 A1 WO2021240939 A1 WO 2021240939A1
Authority
WO
WIPO (PCT)
Prior art keywords
peak
data processing
predicted distribution
display
unit
Prior art date
Application number
PCT/JP2021/008351
Other languages
English (en)
French (fr)
Inventor
雄介 玉井
Original Assignee
株式会社島津製作所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社島津製作所 filed Critical 株式会社島津製作所
Priority to JP2022527525A priority Critical patent/JP7332045B2/ja
Priority to CN202180037521.2A priority patent/CN115667913A/zh
Priority to US17/926,356 priority patent/US20230417714A1/en
Publication of WO2021240939A1 publication Critical patent/WO2021240939A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8624Detection of slopes or peaks; baseline correction
    • G01N30/8631Peaks
    • G01N30/8637Peak shape
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/62Detectors specially adapted therefor
    • G01N30/72Mass spectrometers

Definitions

  • the present invention relates to a data processing apparatus, a data processing method, a data processing program and an analysis apparatus.
  • a function such as a Gaussian function or a BEMG function shown in Non-Patent Document 1 is assumed for each peak shape, and a peak shape model in which a plurality of these are mixed is used.
  • a mixed Gaussian model it is assumed that the signal waveform can be expressed by the function of the following equation (1), where the number of assumed peaks (number of clusters) is K.
  • the parameters ⁇ k and ⁇ k are estimated by the maximum likelihood estimation method or the like.
  • the shape of each peak is represented by the following equation (2).
  • FIG. 1 is a diagram showing the relationship between the tailing of the main peak and the impurity peak. As shown in FIG.
  • the peak waveform in which the impurity peak is superimposed on the main peak in which tailing does not occur is substantially the same as the peak waveform of the main peak in which tailing occurs, and these cannot be distinguished. Therefore, an area error occurs when the area of the peak waveform is quantitatively analyzed. Further, when fitting the peak waveform using the peak shape model, there are uncertainties such as noise included in the measured peak waveform, so that an error occurs in the quantitative analysis of the area of the peak waveform. Under these circumstances, there has been a need of users to evaluate how much error can occur in the quantitative index obtained from the peak waveform and to secure a reasonable safety factor.
  • the present disclosure has been made to solve such a problem, and the purpose of the present disclosure is a technique capable of ensuring a reasonable safety factor in consideration of an error with respect to a quantitative index obtained from a peak waveform. Is to provide.
  • the data processing apparatus performs data processing on the measured waveform obtained by a predetermined measurement on the sample.
  • the data processing device includes an estimation unit, a calculation unit, and a display processing unit.
  • the estimation unit estimates the predicted distribution of each peak shape using a predetermined peak shape model for each of a plurality of adjacent peak waveforms included in the measurement waveform.
  • the calculation unit calculates the prediction distribution of the quantitative index for each peak waveform based on the prediction distribution of the peak shape estimated by the estimation unit.
  • the display processing unit can operate so as to display the predicted distribution of the quantitative index calculated by the calculation unit.
  • the data processing method performs data processing on the measured waveform obtained by a predetermined measurement on the sample.
  • the data processing method consists of a step of estimating the predicted distribution of each peak shape using a predetermined peak shape model for each of a plurality of adjacent peak waveforms included in the measured waveform, and a predicted distribution of the estimated peak shape. Based on the above, a step of calculating the predicted distribution of the quantitative index for each peak waveform and a step of displaying the predicted distribution of the calculated quantitative index are provided.
  • a data processing program performs data processing on a measured waveform obtained by a predetermined measurement on a sample.
  • the data processing program tells the computer a step of estimating the predicted distribution of each peak shape using a predetermined peak shape model for each of a plurality of adjacent peak waveforms included in the measured waveform, and the estimated peak shape. Based on the predicted distribution of, the step of calculating the predicted distribution of the quantitative index for each peak waveform and the step of displaying the predicted distribution of the calculated quantitative index are executed.
  • the data processing device can operate to display the predicted distribution of the quantitative index for each peak shape.
  • the user can confirm the predicted distribution of the quantitative index, it is possible to intuitively grasp the statistical data related to the quantitative index, and by confirming these, the error is taken into consideration for the quantitative index. A reasonable safety factor can be ensured.
  • FIG. 2 is a block diagram showing an example of the functional configuration of the data processing device. As shown in FIG. 2, the data processing device 100 according to the present embodiment is configured to be connectable to the sample measuring device 10.
  • the sample measuring device 10 in the present embodiment is, for example, a chromatograph analyzer (LC, GC) in which a component separating device such as a liquid chromatograph or a gas chromatograph and a detector are combined. Further, a chromatograph mass spectrometer (LC / MS, GC / MS) using a mass spectrometer (MS) as a detector may be used.
  • LC chromatograph analyzer
  • MS mass spectrometer
  • the data processing device 100 performs data processing on the measured waveform obtained by a predetermined measurement on the sample.
  • Each peak shape included in the measured waveform corresponds to each of the plurality of substances contained in the sample.
  • the measured waveform is assumed to be the waveform of the chromatogram obtained by the measurement by the liquid chromatograph analyzer (sample measuring device 10).
  • main component a substance (also referred to as “main component”) and an impurity are contained in a sample
  • main peak a peak corresponding to the main component
  • impurity peak a peak corresponding to the impurity
  • the data processing device 100 includes a hard disk, a CPU (Central Processing Unit), and a memory.
  • the CPU reads the program stored in the hard disk into the memory and executes it to realize various functions of the data processing device 100.
  • the data processing device 100 is, for example, a personal computer or a workstation.
  • the data processing device 100 is connected to peripheral devices including the keyboard 111 and the display 112.
  • the data processing device 100 may include an input device such as a display 112 and a display device such as a display 112.
  • the data processing device 100 includes an acquisition unit 101, an estimation unit 102, an input unit 103, a calculation unit 104, and a display processing unit 105. Each of these functions is realized by the CPU of the data processing device 100 executing various programs.
  • the sample measuring device 10 performs a predetermined measurement on the sample.
  • the acquisition unit 101 acquires the measurement waveform. Specifically, the acquisition unit 101 acquires a measurement waveform obtained by a predetermined measurement performed by the sample measuring device 10.
  • the estimation unit 102 estimates the predicted distribution of the peak shape using a predetermined peak shape model for the peak waveform included in the measurement waveform.
  • the predetermined peak shape model is the "K-mixed BEMG function" described later.
  • the measurement waveform is a measurement waveform acquired by the acquisition unit 101.
  • the sample measuring device 10 may not be provided with the acquisition unit 101. In this case, the estimation unit 102 directly acquires and estimates the measurement waveform obtained by the predetermined measurement performed by the sample measuring device 10.
  • the estimation unit 102 estimates the predicted distribution of each peak shape by Bayesian estimation.
  • the present invention is not limited to this, and the estimation unit 102 may perform estimation using an estimation method other than Bayesian estimation.
  • the peak waveform included in the measurement waveform includes a plurality of adjacent peak waveforms. That is, the estimation unit 102 uses a predetermined peak shape model (K-mixed BEMG function) for each of a plurality of adjacent peak waveforms included in the measurement waveform acquired by the acquisition unit 101 to obtain the peak shape of each peak shape. Estimate the predicted distribution. Details will be described later with reference to FIGS. 5 to 7.
  • K-mixed BEMG function K-mixed BEMG function
  • the calculation unit 104 calculates the prediction distribution of the quantitative index for each peak waveform based on the prediction distribution of the peak shape estimated by the estimation unit 102. Further, the calculation unit 104 calculates the quantile at the threshold value in the predicted distribution of the calculated quantitative index.
  • the quantitative index is "area of peak shape (also referred to as” peak area ”)". That is, the predicted distribution of the quantitative index in this case is the predicted distribution of the peak area. Further, the quantitative index may be a "ratio of peak areas between peak shapes (also simply referred to as” area ratio "). The predicted distribution of the quantitative index in this case is the predicted distribution of the area ratio, and indicates "the distribution of the ratio of the substances corresponding to each peak shape". Further, for example, the threshold value is "0.95" and the obtained quantile is "20.4%". Details will be described later with reference to FIGS. 8 to 10.
  • the display processing unit 105 can operate so as to display the predicted distribution of the quantitative index calculated by the calculation unit 104. Further, the display processing unit 105 can operate so as to display the quantiles calculated by the calculation unit 104. Specifically, the display processing unit 105 causes the display 112 to display at least one of the predicted distribution and the quantile of the quantitative index calculated by the calculation unit 104. As a result, the display 112 shows the predicted distribution and the quantile of the quantitative index. Details will be described later with reference to FIGS. 8 to 10.
  • the user can make various settings and switch the display by operating the keyboard 111.
  • the user can set the threshold value by operating the keyboard 111.
  • the input unit 103 receives the user's input. Specifically, the input unit 103 receives an input of a threshold value (for example, 0.95) based on a user operation.
  • the calculation unit 104 calculates a quantile based on the threshold value input by the input unit 103, and displays it on the display 112.
  • the display 112 may display the quantiles together with the threshold value, may display the predicted distribution of the area ratio together with these (see FIG. 9 described later), and may display the predicted distribution of the peak shape together with these. You may do so (see FIG. 10 below).
  • the user can switch the display of the display 112 by operating the keyboard 111.
  • the user can switch the display of the predicted distribution of the area ratio (see FIG. 9 described later) to the display of the predicted distribution of the peak area (see FIG. 8 described later) by operating the keyboard 111, or the predicted distribution of the peak shape. Can be switched to the display (see FIG. 10 described later).
  • the data processing device 100 may be configured to be connectable to a network such as a LAN (Local Area Network) via a communication interface.
  • a network such as a LAN (Local Area Network) via a communication interface.
  • the data processing device 100 may be connected to the sample measuring device 10 via a network. Further, the data processing device 100 may be connected to a plurality of sample measuring devices 10 via a network.
  • the processing performed by the acquisition unit 101, the estimation unit 102, the input unit 103, the calculation unit 104, and the display processing unit 105 may be performed by the personal computer. It may be performed by a server device connected to a personal computer via a network. In the former case, the program that performs the above processing will be installed in the personal computer, and in the latter case, it will be installed in the server device.
  • the program that performs the above processing may be downloadable from a server device via a network, or may be stored in a recording medium (for example, a CD or DVD) and distributed.
  • FIG. 3 is a flowchart showing an example of data processing.
  • the data processing apparatus 100 executes data processing.
  • the data processing is a process performed on a measurement waveform obtained by a predetermined measurement on a sample, and the acquisition unit 101, the estimation unit 102, the input unit 103, the calculation unit 104, and the display processing unit 105 of the data processing device 100 perform the data processing. It is a series of processes to be executed.
  • Data processing includes acquisition processing, estimation processing, input processing, calculation processing, and display processing.
  • the acquisition process is a process executed by the acquisition unit 101
  • the estimation process is a process executed by the estimation unit 102
  • the input process is a process executed by the input unit 103
  • the calculation process is a process executed by the calculation unit 104.
  • the display process is a process executed by the display process unit 105.
  • the step is simply referred to as S.
  • the CPU reads the program stored in the hard disk into the memory and executes it.
  • Data processing is performed by executing a data processing program.
  • the acquisition process is performed by executing the acquisition process program.
  • the estimation process is performed by executing the estimation process program.
  • the input process is performed by executing the input process program.
  • the calculation process is performed by executing the calculation process program.
  • the display process is performed by executing the display process program.
  • the acquisition unit 101 performs acquisition processing for transferring data (measurement waveform) between the sample measuring device 10 and the data processing device 100.
  • the acquisition process is performed by executing the acquisition process program.
  • the data processing device 100 executes the acquisition process in S11 and advances the process to S12.
  • the acquisition unit 101 acquires the measurement waveform obtained by the predetermined measurement performed by the sample measuring device 10.
  • the data processing device 100 executes the estimation process in S12 and advances the process to S13.
  • the estimation process the process shown in FIG. 4 is performed.
  • FIG. 4 is a flowchart showing an example of estimation processing.
  • the data processing apparatus 100 Bayesian estimates with respect to the peak waveform included in the measurement waveform in each case where the number of peaks is assumed to be 1 to N in S21.
  • the predicted distribution of the peak shape is estimated by the above method, and the process proceeds to S22.
  • the data processing device 100 executes an input process in S13 and advances the process to S14.
  • the input unit 103 receives the user's input. Specifically, the input unit 103 receives the input of the threshold value and the display item based on the operation of the user.
  • the "display item" is an item that the user intends to display on the display 112, and may be a quantitative index such as a peak area or an area ratio, or may be a quantile or the like. For example, when the quantitative index "area ratio" is input as a display item, the predicted distribution of the area ratio is displayed on the display 112. Further, for example, the threshold value is "0.95".
  • the data processing device 100 executes the calculation process in S14 and S15.
  • the calculation unit 104 calculates the prediction distribution of the quantitative index for each peak waveform based on the prediction distribution of the peak shape estimated by the estimation unit 102, and advances the processing to S15.
  • the "predicted distribution of area ratio" is calculated as the predicted distribution of the quantitative index.
  • the calculation unit 104 obtains the quantile at the threshold value in the predicted distribution of the quantitative index, and proceeds to the process in S17. For example, "20.4%" is obtained as the quantile at the threshold value (0.95) in the predicted distribution of the area ratio. If the display of the quantile is not specified in S14, it is not necessary to calculate the quantile.
  • the data processing device 100 executes the display processing in S16 and ends the data processing.
  • the display processing unit 105 causes the display 112 to display at least one of the predicted distribution and the quantile (for example, 20.4%) of the quantitative index (for example, the area ratio) calculated by the calculation unit 104.
  • the display 112 shows the predicted distribution of the quantitative index and the quantile.
  • the predicted distribution of the peak area is displayed on the display 112, or as shown in FIG. 9 described later, together with the predicted distribution of the area ratio, there is a probability of 0.95 (95%).
  • the predicted distribution of the peak shape is displayed on the display 112.
  • the user can input to change the threshold value or change the display item or the quantitative index by operating the keyboard 111.
  • the data processing device 100 executes the calculation processing of S14 to S16 and the display processing of S17 based on the changed display item.
  • the display processing unit 105 performs a process of displaying the probability of being equal to or greater than the threshold input by the input unit 103 as a quantile, or a process of displaying the probability of being equal to or less than the threshold input by the input unit 103 as a quantile.
  • the process of displaying the probability of exceeding the threshold input by the input unit 103 as a quantile, and the process of displaying the probability of becoming less than the threshold input by the input unit 103 as a quantile It may be what you do.
  • the quantile is a numerical value calculated based on the input threshold value, and is, for example, a statistic indicating some degree of danger or safety.
  • the calculation unit 104 may calculate the first and second prediction distributions based on the quantitative indexes related to each other for each peak waveform based on the prediction distribution of the peak shape estimated by the estimation unit 102. good.
  • the display processing unit 105 can operate so as to change the display mode of the first and second predicted distributions based on the selection of the user who received the input in the input unit 103.
  • the "first and second predicted distributions based on the quantitative indexes related to each other" may have the same quantitative index, or may be anything as long as they are related to each other.
  • the calculation unit 104 may calculate the predicted distribution of the peak area of the peak 1 as the first predicted distribution and the predicted distribution of the peak area of the peak 2 as the second predicted distribution.
  • the calculation unit 104 may calculate the predicted distribution of the peak shape of the peak 1 as the first predicted distribution and the predicted distribution of the peak area of the peak 1 as the second predicted distribution.
  • the calculation unit 104 may calculate the predicted distribution of the peak shape of the peak 1 as the first predicted distribution and the predicted distribution of the peak area of the peak 2 as the second predicted distribution.
  • only the first predicted distribution may be displayed, only the second predicted distribution may be displayed, or both may be displayed. Often, when displaying both, one may be displayed larger and the other may be displayed smaller.
  • a display item may be input so as to display the predicted distribution of the peak shape of the peak 1, and the predicted distribution of the peak shape of only the peak 1 may be displayed on the display 112. Further, in S13, display items are input so that the predicted distribution of the peak shape of the peak 1 is displayed large and the predicted distribution of the peak shape of the peak 2 is displayed small, and the predicted distribution of the peak shape of the peak 1 is displayed on the display 112. It may be displayed in a large size and the predicted distribution of the peak shape of the peak 2 may be displayed in a small size.
  • the acquisition unit 101 acquires a measurement waveform (also referred to as a “signal waveform”) obtained by a predetermined measurement performed by the sample measuring device 10.
  • the estimation unit 102 uses a predetermined peak shape model to predict each peak shape for each of a plurality of adjacent peak waveforms included in the measurement waveform acquired by the acquisition unit 101 by Bayesian estimation. presume.
  • the estimation and display of the predicted distribution of the peak shape will be specifically described.
  • an LC chromatogram is applied as a measurement waveform (signal waveform).
  • the BEMG function is applied as a predetermined peak shape model. That is, one peak shape can be expressed by the following equation (3).
  • the signal waveform model can be expressed by adding multiple BEMG functions.
  • the K-mixed BEMG function is represented by the following equation (4).
  • the error term ⁇ is added as in the equation (4). It is assumed that the error term ⁇ is normally distributed with a zero average, and its variance is estimated from the signal waveform as a parameter.
  • the BEMG function is applied as a model of the peak shape, but the present invention is not limited to this.
  • a Gaussian function may be applied as a model of a peak shape
  • a Cauchy function may be applied, or something that can be described by some model function may be used.
  • the error term may be the following equation (5) in which an error is added to x, or the following equation (6) in which the input x affects the error.
  • the error term is normally distributed, but it is not limited to this. For example, it may follow other probability distributions, or it may follow rules other than probability distributions.
  • Bayesian estimation for example, distribution estimation may be performed by sampling with No U-Turn Sampler (NUTS). Not limited to this, other sampling methods may be used. Further, for example, a Bayesian estimation method other than sampling such as variational Bayes may be used.
  • NUTS No U-Turn Sampler
  • peak 1 the peak of a substance
  • peak 2 the peak of impurities
  • the number of peaks may be one (only the main peak exists), or the number of peaks may be two (there are main peaks and shoulder peaks). Alternatively, the number of peaks may be 3 or more.
  • the predicted distribution of the peak shape is estimated on the assumption that the number of peaks is one, two, or more. Specifically, in the present embodiment, the predicted distribution of the peak shape is estimated for each of the cases where the number of peaks is assumed to be 1 to N, and the result can be displayed on the display 112. There is. Further, the user can determine an appropriate number of peaks from the comparison of the predicted distribution of the peak shape for each number of peaks, and the configuration is such that it can be set.
  • FIG. 5 is a diagram showing a display example of the predicted distribution of the peak shape when the number of peaks is assumed to be two.
  • FIG. 6 is a diagram showing a display example of the predicted distribution of the peak shape when the number of peaks is assumed to be one.
  • the posterior distribution of parameters can be obtained as an estimator. From this estimator, the predicted amount (predicted distribution) of each peak shape is generated. 5 and 6 show the peak shape estimated from the posterior distribution of each parameter. Here, the solid line indicates the observed waveform. The area enclosed by the dashed line shows the 95% prediction intervals on both sides of the predicted distribution of the signal waveform obtained from the estimator (posterior distribution of the parameters of the model).
  • FIG. 7 is a diagram showing a display example of the predicted distribution of each peak shape when the number of peaks is assumed to be two.
  • the solid line indicates the observed waveform (measured waveform).
  • the area surrounded by the broken line indicates the 95% prediction interval of peak 1 (main peak).
  • the region surrounded by the alternate long and short dash line indicates the 95% prediction interval of the peak 2 (shoulder peak) shape.
  • the posterior distribution of b i (if the sampling performing Bayesian estimation samples obtained from the posterior distribution) parameters A i, u i, s i , a i, the posterior distribution of b i be those obtained by substituting the model error term It shows the predicted distribution of the peak shape itself excluding.
  • peak 2 shoulder peak
  • the number of peaks 2 is the impurity peak (shoulder peak) in addition to the main peak.
  • the peaks are close to each other and tailing occurs, the tailing and the impurity peak overlap, resulting in high uncertainty.
  • uncertainties can be evaluated by predictive distribution using methods such as Bayesian inference.
  • the user visually confirms which of the 1 to N peaks is appropriate, and the user selects (sets) the optimum number of peaks. bottom.
  • the present invention is not limited to this, and the data processing apparatus 100 may select the optimum number of peaks.
  • the selection may be made automatically using a criterion such as an information criterion or a Bayes factor. For example, when the information criterion is used as a criterion and one of a plurality of models is selected, the one with the smallest evaluation value is selected as a valid model.
  • both the user and the data processing device 100 may select the number of peaks. For example, the predicted distribution of each peak shape when the number of peaks is 1 to N is displayed, and the number of peaks selected by the data processing device 100 is displayed. In this case, the user visually determines an appropriate number of peaks, and if the number of peaks is different from the number of peaks selected by the data processing apparatus 100, the configuration may be such that the number of peaks can be changed to the number of peaks determined by the user.
  • the calculation unit 104 calculates the prediction distribution of the quantitative index for each peak waveform based on the prediction distribution of the peak shape estimated by the estimation unit 102.
  • the display processing unit 105 performs a process of displaying the predicted distribution of the quantitative index calculated by the calculation unit 104 on the display 112.
  • the quantitative index includes at least the height of the peak shape (also referred to as “peak height”) and the area of the peak shape (also referred to as “peak area”). It may also include the concentration of the substance calculated from the peak height or the peak area (also referred to as “substance concentration”).
  • concentration is the concentration of the substance contained in the sample and corresponding to each peak.
  • FIG. 8 is a diagram showing a display example of the predicted distribution of the peak area.
  • the left side of FIG. 8 is the predicted distribution of the peak area of peak 1 (main peak), and the right side of FIG. 8 is the predicted distribution of the peak area of peak 2 (shoulder peak), and the results are plotted as a violin diagram. Is.
  • the vertical axis shows the peak area
  • the horizontal axis shows the probability densities of peak 1 or peak 2 symmetrically.
  • the peak area of peak 2 (shoulder peak) is 0.130 on average and 0.113 on the median, and the 95% prediction interval on both sides is [0.079, 0.278]. As shown, the distribution shape is vertically asymmetric and the upper end extends to 0.5, so it is easy to visually or intuitively understand that the value can be extremely large. Also, from the figure, it is intuitive that the area of peak 1 is about 1.0, the area of peak 2 is about 0.1, and the area of peak 2 is about 1/10 of the area of peak 1. Easy to grasp.
  • the predicted distribution of the peak height and the substance concentration is calculated based on the predicted distribution of the peak shape estimated by the estimation unit 102 described above, and these are displayed on the display 112. Is possible. These displays can be switched by user operation.
  • the probability distribution of the other is obtained by adding up the probabilities corresponding to all the values that one variable can take and marginalizing them. , Plot this.
  • the predicted distribution of the quantitative index includes the distribution of the ratio of the substance corresponding to each peak shape.
  • the quantitative index is "ratio of peak height between peak shapes (also simply referred to as” height ratio ”)
  • the predicted distribution of the quantitative index is the predicted distribution of the height ratio.
  • the quantitative index is "ratio of peak area between peak shapes (also simply referred to as” area ratio ”)
  • the predicted distribution of the quantitative index is the predicted distribution of the area ratio.
  • the quantitative index is "the ratio of the concentration between substances (also simply referred to as” concentration ratio ”)
  • the predicted distribution of the quantitative index is the predicted distribution of the concentration ratio.
  • the area ratio "peak area of peak 2 / peak area of peak 1".
  • the area ratio refers to the ratio of impurities to the substance corresponding to peak 1 when peak 2 is an impurity.
  • the area ratio may be set to "peak area of peak 2 / (peak area of peak 1 + peak area of peak 2)".
  • the area ratio may be equal to "the sum of the peak area of a certain peak / the peak area of peaks 1 to N", and the area ratio is obtained for the two peaks to be compared. You may do it.
  • a plurality of peaks may be displayed at the same time, or they may be displayed one by one.
  • a plurality of area ratios may be displayed at the same time, or they may be displayed one by one.
  • FIG. 9 is a diagram showing an example of displaying the predicted distribution of the area ratio and the quantiles.
  • FIG. 9 shows a histogram and its kernel density estimation.
  • the input unit 103 inputs the threshold value based on the user's operation.
  • the calculation unit 104 calculates the predicted distribution of the quantitative index for each peak waveform based on the predicted distribution of the peak shape estimated by the estimation unit 102, and further divides the calculated quantitative index at the threshold value in the predicted distribution. Calculate the points.
  • the display processing unit 105 can operate so as to display the probability of being equal to or less than or equal to the threshold value received by the input unit 103 as a quantile.
  • the calculation unit 104 calculates the predicted distribution of the area ratio for each peak waveform based on the predicted distribution of the peak shape estimated by the estimation unit 102, and uses the threshold value (0.95) in the calculated predicted distribution of the area ratio. Calculate the quantile of.
  • the display processing unit 105 displays the probability of becoming the threshold value (0.95) or more input by the input unit 103 as a quantile.
  • the area ratio the peak area of the peak 2 / the peak area of the peak 1 is also uniquely determined.
  • the area ratio becomes 20.4% or more with a probability of 0.05 (5%).
  • "0.05" is input as the threshold value, and the quantile obtained for it is "20.4%”.
  • the display processing unit 105 can operate so as to display the percentile points of the predicted distribution of the quantitative index corresponding to the threshold value input by the input unit 103.
  • the 95% point is 0.204.
  • 95% points are indicated by vertical broken lines as percentile points.
  • the prediction interval in Bayesian estimation allows such an intuitive interpretation.
  • the number of peaks is 2, but there may be 3 or more peaks.
  • the predicted distribution as shown in FIG. 8 exists for the number of peaks.
  • any two peaks may be selected and the predicted distribution of the area ratio as shown in FIG. 9 may be displayed.
  • the risk rate is set to 5% (threshold value is 0.95) here, this threshold value can be specified by the user as described above.
  • the risk factor is specified, it is possible to know the possible values of the area ratio of the impurity peak within the specified risk factor range.
  • the display processing unit 105 may be able to operate so as to redisplay the percentile point corresponding to the newly input threshold value.
  • the display processing unit 105 For example, in the display processing unit 105, "0.95" is input to the input unit 103 as a threshold value to display percentile points based on the threshold value "0.95", and then "0.97" is input to the input unit 103 as a threshold value. When input to, the percentile point may be displayed based on the threshold value "0.97".
  • the threshold value is changed (for example, "0.97" (risk rate 3%)).
  • the display can be updated.
  • the user verifies that the area ratio of the shoulder peak is 20.4% or more when the risk rate is 5%, but 22% or more when the risk rate is 3%. can do.
  • the percentile points are also changed and displayed. In this way, the user can set / update an arbitrary value as the threshold value, and display the result on the display 112 for evaluation / verification.
  • the percentile points and quantiles of the predicted distribution of the height ratio and the density ratio are displayed based on the threshold value. These displays can be switched by user operation.
  • FIG. 10 is a diagram showing a display example of the predicted distribution and quantile points of each peak shape.
  • the "peak shape” is input as a display item as the "quantitative index”
  • the predicted distribution of the peak shape (95% prediction interval for each peak) is displayed on the display 112.
  • the area ratio can be used as a quantitative index.
  • the concentration of each component is usually proportional to the peak height and the peak area, so that the predicted distribution of the component concentration is obtained. From this predicted distribution, it is possible to evaluate the possibility that each substance will exceed the threshold value set by laws and regulations or irreducible polynomials.
  • the number of peak functions (number of peaks) applied to the chromatogram is also used as an estimation target, it is possible to evaluate the probability of the presence or absence of impurities.
  • FIG. 11 is a block diagram showing an example of the functional configuration of the analyzer according to the modified example of the present embodiment.
  • the sample measuring device 10 makes a predetermined measurement on the sample, and the measurement waveform obtained by the predetermined measurement performed by the sample measuring device 10 is used as the data processing device 100.
  • the configuration is such that the acquisition unit 101 of the above is acquired.
  • the analyzer 1 is configured to include the data processing device 100 and the measuring unit 11.
  • the measuring unit 11 makes a predetermined measurement on the sample.
  • the acquisition unit 101 acquires a measurement waveform obtained by a predetermined measurement performed by the measurement unit 11.
  • the sample measuring device 10 different from the data processing device 100 performs a predetermined measurement on the sample, but in the modified example of the present embodiment, the measuring unit included in the analyzer 1 is provided. Allow 11 to make a predetermined measurement on the sample.
  • the analyzer 1 includes a measurement unit 11, an acquisition unit 101, an estimation unit 102, an input unit 103, a calculation unit 104, a display processing unit 105, and an operation unit. It includes 121 and a display unit 122.
  • the analyzer 1 is, for example, the above-mentioned chromatograph analyzer (LC, GC) or chromatograph mass spectrometer (LC / MS, GC / MS).
  • the measurement unit 11 is a device that performs a predetermined measurement on the sample
  • the data processing device 100 is a device that performs data processing on the obtained measurement waveform. That is, the analyzer 1 is a device including both a device for performing measurement and a device for performing data processing.
  • the data processing device 100 may be a board or a module that performs data processing.
  • the data processing device 100 includes an acquisition unit 101, an estimation unit 102, an input unit 103, a calculation unit 104, and a display processing unit 105, and the contents of the processing performed by these units are described with reference to FIGS. 1 to 10. Similar to the one described.
  • the data processing device 100 inputs an operation from the user by the operation unit 121 provided in the data processing device 100, and displays the operation on the display unit 122 provided in the data processing device 100.
  • a program for processing data on the measured waveform is installed in a personal computer connected to the LC analyzer, or the personal computer executes a program for processing data on the measured waveform.
  • the LC analyzer itself is configured to execute a program for processing data on the measured waveform.
  • the data processing apparatus performs data processing on the measured waveform obtained by a predetermined measurement on the sample.
  • the data processing device includes an estimation unit, a calculation unit, and a display processing unit.
  • the estimation unit estimates the predicted distribution of each peak shape using a predetermined peak shape model for each of a plurality of adjacent peak waveforms included in the measurement waveform.
  • the calculation unit calculates the prediction distribution of the quantitative index for each peak waveform based on the prediction distribution of the peak shape estimated by the estimation unit.
  • the display processing unit can operate so as to display the predicted distribution of the quantitative index calculated by the calculation unit.
  • the user can confirm the predicted distribution of the quantitative index, so that it is easy to intuitively grasp the statistical data related to the quantitative index, and by confirming these, an error with respect to the quantitative index can be obtained. It is possible to secure a reasonable safety factor in consideration of.
  • the calculation unit calculates the quantile at the threshold value in the predicted distribution of the calculated quantitative index.
  • the display processing unit can operate so as to display the quantiles calculated by the calculation unit.
  • the user can confirm the quantile at the threshold value in the predicted distribution of the quantitative index, so that a reasonable safety factor can be ensured in consideration of the error for the quantitative index. can.
  • the data processing device further includes an input unit for receiving user input.
  • the calculation unit calculates the first and second predicted distributions based on the quantitative indexes related to each other for each peak waveform based on the predicted distribution of the peak shape estimated by the estimation unit.
  • the display processing unit can operate so as to change the display mode of the first and second prediction distributions based on the selection of the user who has received the input in the input unit.
  • the display mode of the first and second predicted distributions can be changed based on the user's selection, for example, displaying only the first predicted distribution or displaying only the second predicted distribution. Therefore, it is easy to intuitively grasp the statistical data related to the quantitative index.
  • the data processing device further includes an input unit that receives user input.
  • the display processing unit can operate so as to display the probability of being equal to or greater than or equal to or less than the threshold value received by the input unit as a quantile.
  • the data processing device further includes an input unit that receives user input.
  • the display processing unit can operate to display the percentile points of the predicted distribution of the quantitative index corresponding to the threshold value input by the input unit.
  • the quantitative index includes at least the height of the peak shape and the area of the peak shape.
  • the predicted distribution of the quantitative index includes the distribution of the ratio of the substance corresponding to each peak shape.
  • the estimation unit estimates the predicted distribution of each peak shape by Bayesian estimation.
  • the analyzer includes the data processing device according to any one of items 1 to 9, and a measuring unit that performs a predetermined measurement on a sample.
  • sampling 11 data processing is performed on a measurement waveform obtained by a predetermined measurement on a sample.
  • the data processing method consists of a step of estimating the predicted distribution of each peak shape using a predetermined peak shape model for each of a plurality of adjacent peak waveforms included in the measured waveform, and a predicted distribution of the estimated peak shape. Based on the above, a step of calculating the predicted distribution of the quantitative index for each peak waveform and a step of displaying the predicted distribution of the calculated quantitative index are provided.
  • the user can confirm the predicted distribution of the quantitative index, so that it is easy to intuitively grasp the statistical data related to the quantitative index, and by confirming these, an error with respect to the quantitative index can be obtained. It is possible to secure a reasonable safety factor in consideration of.
  • the user can confirm the quantile at the threshold value in the predicted distribution of the quantitative index, so that a reasonable safety factor can be ensured in consideration of the error for the quantitative index. can.
  • each peak waveform is related to each other based on the step of receiving the input of the user and the predicted distribution of the estimated peak shape. It further includes a step of calculating the first and second predicted distributions based on the quantitative index, and a step of changing the display mode of the first and second predicted distributions based on the selection of the user who received the input.
  • the display mode of the first and second predicted distributions can be changed based on the user's selection, for example, displaying only the first predicted distribution or displaying only the second predicted distribution. Therefore, it is easy to intuitively grasp the statistical data related to the quantitative index.
  • the data processing program performs data processing on the measured waveform obtained by a predetermined measurement on the sample.
  • the data processing program tells the computer a step of estimating the predicted distribution of each peak shape using a predetermined peak shape model for each of a plurality of adjacent peak waveforms included in the measured waveform, and the estimated peak shape. Based on the predicted distribution of, the step of calculating the predicted distribution of the quantitative index for each peak waveform and the step of displaying the predicted distribution of the calculated quantitative index are executed.
  • the user can confirm the predicted distribution of the quantitative index, so that it is easy to intuitively grasp the statistical data related to the quantitative index, and by confirming these, an error with respect to the quantitative index can be obtained. It is possible to secure a reasonable safety factor in consideration of.
  • the present disclosure discloses the peak area (or the peak area) of each substance contained in a sample when peak separation is important due to superimposition of a plurality of peaks by including a plurality of peak waveforms in which measurement waveforms such as a chromatograph are close to each other. It is used to quantify the peak height and concentration) and to evaluate its robustness (evaluate the quantitative index).
  • Analytical device 10 Sample measuring device, 11 Measuring unit, 100 Data processing device, 101 Acquisition unit, 102 Estimating unit, 103 Input unit, 104 Calculation unit, 105 Display processing unit, 111 Keyboard, 112 Display, 121 Operation unit, 122 Display section.

Landscapes

  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Automatic Analysis And Handling Materials Therefor (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

データ処理装置(100)は、試料に対する所定の測定によって得られた測定波形に対してデータ処理を行う。データ処理装置(100)は、推定部(102)と、算出部(104)と、表示処理部(105)とを備える。推定部(102)は、測定波形に含まれる近接した複数のピーク波形の各々に対して、所定のピーク形状モデルを用いて各々のピーク形状の予測分布を推定する。算出部(104)は、推定部(102)で推定したピーク形状の予測分布に基づき、各々のピーク波形に対して定量指標の予測分布を算出する。表示処理部(105)は、算出部(104)で算出した定量指標の予測分布を表示させるように動作可能である。

Description

データ処理装置、データ処理方法、データ処理プログラムおよび分析装置
 本発明は、データ処理装置、データ処理方法、データ処理プログラムおよび分析装置に関する。
 液体クロマトグラフやガスクロマトグラフなどの成分分離装置と検出器とを組み合わせた分析装置においては、不純物や類縁物質など複数のピークが重畳することが多い。このため、定量分析に先立ってピークの分離を行う必要がある。クロマトグラフを用いた分析では、個々のピーク形状に、たとえば、ガウス関数や、非特許文献1に示されるBEMG関数といった関数を仮定し、これらを複数個混合させたピーク形状モデルを用いる。たとえば、混合ガウスモデルを用いる場合、想定するピークの本数(クラスタ数)をKとして以下の式(1)の関数で信号波形を表現できると仮定する。
Figure JPOXMLDOC01-appb-M000001
 そして、パラメータであるμ,σを最尤推定法などにより推定する。ここで、各ピークの形状は、以下の式(2)で示される。
Figure JPOXMLDOC01-appb-M000002
 しかしながら、ピーク同士が重畳している場合、各ピークの形状やピークの面積に関する推定には大きな不確実性が残る。上述の最尤推定を用いて各ピークの面積や高さ(あるいはこれらに比例する成分濃度)を予測すると、予測誤差が大きくなる恐れがある。
 上述のように、ピーク分離に際しては、ガウス関数やBEMG関数(非特許文献1)を複数個用意してピーク波形にあてはめることで、重畳したピーク群から一つ一つのピーク形状を推定する。しかしながら、各ピーク形状の推定に際し、ある物質のピーク(「主ピーク」とも称する)と不純物(あるいは類縁物質)のピークとが本質的に区別できない領域が存在する。図1は、主ピークのテーリングと不純物ピークとの関係を示す図である。図1に示すように、テーリングが発生していない主ピークに不純物ピークを重ね合わせたピーク波形は、テーリングが発生した主ピークのピーク波形とほぼ同じ波形となり、これらを区別することができない。このため、ピーク波形の面積を定量分析する場合において面積誤差が生じることになる。さらに、ピーク形状モデルを用いてピーク波形のフィッティングを行う場合、測定したピーク波形に含まれるノイズなどの不確実要素があるため、ピーク波形の面積の定量分析には誤差が生じる。このような事情から、ピーク波形から得られる定量指標にどの程度の誤差が生じ得るのかを評価し、合理的な安全率を確保したいというユーザのニーズがあった。
 本開示は、かかる問題を解決するためになされたものであり、本開示の目的は、ピーク波形から得られる定量指標に対して誤差を考慮して合理的な安全率を確保することができる技術を提供することである。
 本開示のある局面に従うデータ処理装置は、試料に対する所定の測定によって得られた測定波形に対してデータ処理を行う。データ処理装置は、推定部と、算出部と、表示処理部とを備える。推定部は、測定波形に含まれる近接した複数のピーク波形の各々に対して、所定のピーク形状モデルを用いて各々のピーク形状の予測分布を推定する。算出部は、推定部で推定したピーク形状の予測分布に基づき、各々のピーク波形に対して定量指標の予測分布を算出する。表示処理部は、算出部で算出した定量指標の予測分布を表示させるように動作可能である。
 本開示の別の局面に従うデータ処理方法は、試料に対する所定の測定によって得られた測定波形に対してデータ処理を行う。データ処理方法は、測定波形に含まれる近接した複数のピーク波形の各々に対して、所定のピーク形状モデルを用いて各々のピーク形状の予測分布を推定するステップと、推定したピーク形状の予測分布に基づき、各々のピーク波形に対して定量指標の予測分布を算出するステップと、算出した定量指標の予測分布を表示させるステップとを備える。
 本開示の別の局面に従うデータ処理プログラムは、試料に対する所定の測定によって得られた測定波形に対してデータ処理を行う。データ処理プログラムは、コンピュータに、測定波形に含まれる近接した複数のピーク波形の各々に対して、所定のピーク形状モデルを用いて各々のピーク形状の予測分布を推定するステップと、推定したピーク形状の予測分布に基づき、各々のピーク波形に対して定量指標の予測分布を算出するステップと、算出した定量指標の予測分布を表示させるステップとを実行させる。
 本開示によれば、データ処理装置は、各々のピーク形状に対する定量指標の予測分布を表示させるように動作可能である。このように、ユーザが定量指標の予測分布を確認することができるため、定量指標に関する統計データを直感的に把握しやすくできるとともに、これらを確認することで定量指標に対して誤差を考慮して合理的な安全率を確保することができる。
主ピークのテーリングと不純物ピークとの関係を示す図である。 データ処理装置の機能構成の一例を示すブロック図である。 データ処理の一例を示すフローチャートである。 推定処理の一例を示すフローチャートである。 ピーク本数を2本と仮定した場合のピーク形状の予測分布の表示例を示す図である。 ピーク本数を1本と仮定した場合のピーク形状の予測分布の表示例を示す図である。 ピーク本数を2本と仮定した場合の各ピーク形状の予測分布の表示例を示す図である。 ピーク面積の予測分布の表示例を示す図である。 面積比率の予測分布および分位点の表示例を示す図である。 各ピーク形状の予測分布および分位点の表示例を示す図である。 本実施の形態の変形例に係る分析装置の機能構成の一例を示すブロック図である。
 以下、本開示の実施の形態について、図面を参照しながら詳細に説明する。なお、図中同一又は相当部分には同一符号を付してその説明は繰り返さない。
 [データ処理装置の機能構成]
 図2は、データ処理装置の機能構成の一例を示すブロック図である。図2に示すように、本実施の形態に係るデータ処理装置100は、試料測定装置10と接続可能に構成されている。
 本実施の形態における試料測定装置10は、たとえば、液体クロマトグラフやガスクロマトグラフなどの成分分離装置と検出器とを組み合わせたクロマトグラフ分析装置(LC、GC)である。また、検出器として質量分析装置(MS)を用いたクロマトグラフ質量分析装置(LC/MS、GC/MS)などであってもよい。
 データ処理装置100は、試料に対する所定の測定によって得られた測定波形に対してデータ処理を行う。測定波形に含まれる各々のピーク形状は、試料に含まれる複数の物質の各々に対応するものである。本実施の形態においては、測定波形は、液体クロマトグラフ分析装置(試料測定装置10)による測定により得られたクロマトグラムの波形を想定している。
 たとえば、試料にある物質(「主成分」とも称する)と不純物とが含まれる場合、主成分に対応するピーク(「主ピーク」とも称する)と、不純物に対応するピーク(「不純物ピーク」とも称する)とが測定波形中に出現することになる。主ピークと不純物ピークとが近接する場合は、これらを区別することが難しくなる(図1参照)。
 ここで、データ処理装置100は、ハードディスクと、CPU(Central Processing Unit)と、メモリとを備える。CPUは、ハードディスクに保存されているプログラムをメモリに読み込んで実行し、データ処理装置100の各種機能を実現する。データ処理装置100は、たとえば、パーソナルコンピュータやワークステーションである。
 また、データ処理装置100は、キーボード111やディスプレイ112を含む周辺機器と接続されている。なお、データ処理装置100は、ディスプレイ112などの入力装置やディスプレイ112などの表示装置を含むものであってもよい。
 データ処理装置100は、取得部101と、推定部102と、入力部103と、算出部104と、表示処理部105とを備える。これらの各機能は、データ処理装置100のCPUが各種プログラムを実行することで実現される。
 試料測定装置10は、試料に対する所定の測定を行う。取得部101は、測定波形を取得する。具体的には、取得部101は、試料測定装置10が行った所定の測定によって得られた測定波形を取得する。
 推定部102は、測定波形に含まれるピーク波形に対して、所定のピーク形状モデルを用いてピーク形状の予測分布を推定する。本実施の形態においては、所定のピーク形状モデルは、後述する「K-混合BEMG関数」である。測定波形は、取得部101が取得した測定波形である。なお、試料測定装置10は、取得部101を備えないものであってもよい。この場合、推定部102は、試料測定装置10が行った所定の測定によって得られた測定波形を直接取得して、推定を行う。
 本実施の形態においては、推定部102は、ベイズ推定により各々のピーク形状の予測分布を推定する。しかし、これに限らず、ベイズ推定以外の推定手法を用いて推定部102が推定を行うものであってもよい。
 本実施の形態においては、測定波形に含まれるピーク波形は、近接した複数のピーク波形を含むものとする。つまり、推定部102は、取得部101で取得した測定波形に含まれる近接した複数のピーク波形の各々に対して、所定のピーク形状モデル(K-混合BEMG関数)を用いて各々のピーク形状の予測分布を推定する。詳しくは、図5~図7を用いて後述する。
 算出部104は、推定部102で推定したピーク形状の予測分布に基づき、各々のピーク波形に対して定量指標の予測分布を算出する。また、算出部104は、算出した定量指標の予測分布における閾値での分位点を算出する。
 たとえば、定量指標は、「ピーク形状の面積(「ピーク面積」とも称する)」である。つまり、この場合の定量指標の予測分布は、ピーク面積の予測分布である。また、定量指標は、「ピーク形状間のピーク面積の比率(単に「面積比率」とも称する)であってもよい。この場合の定量指標の予測分布は、面積比率の予測分布であって、「各々のピーク形状に対応する物質の比率の分布」を指し示すものである。また、たとえば、閾値は「0.95」であり、求められた分位点は「20.4%」である。詳しくは、図8~図10を用いて後述する。
 表示処理部105は、算出部104で算出した定量指標の予測分布を表示させるように動作可能である。また、表示処理部105は、算出部104で算出した分位点を表示するように動作可能である。具体的には、表示処理部105は、算出部104で算出した定量指標の予測分布および分位点の少なくとも一方をディスプレイ112に表示させる。その結果、ディスプレイ112には、定量指標の予測分布や分位点が表示される。詳しくは、図8~図10を用いて後述する。
 ここで、ユーザは、キーボード111の操作により各種設定を行ったり、表示の切り替えを行うことが可能である。たとえば、ユーザは、キーボード111の操作により閾値を設定することができる。
 入力部103は、ユーザの入力を受ける。具体的には、入力部103は、ユーザの操作に基づき閾値(たとえば、0.95)の入力を受ける。算出部104は、入力部103で入力を受けた閾値に基づき、分位点を算出し、それをディスプレイ112に表示する。たとえば、ディスプレイ112は、閾値とともに分位点を表示してもよいし、これらとともに面積比率の予測分布を表示してもよいし(後述の図9参照)、これらとともにピーク形状の予測分布を表示してもよい(後述の図10参照)。
 また、ユーザは、キーボード111の操作により、ディスプレイ112の表示を切り替えることができる。たとえば、ユーザは、キーボード111の操作により上記の面積比率の予測分布の表示(後述の図9参照)をピーク面積の予測分布の表示(後述の図8参照)に切り替えたり、ピーク形状の予測分布の表示(後述の図10参照)に切り替えたりすることができる。
 なお、データ処理装置100は、通信インターフェースを介してLAN(Local Area Network)等のネットワークに接続可能な構成としてもよい。この場合、データ処理装置100は、ネットワークを経由して、試料測定装置10に接続するようにしてもよい。また、データ処理装置100は、ネットワークを経由して、複数台の試料測定装置10に接続するようにしてもよい。
 このような、取得部101と、推定部102と、入力部103と、算出部104と、表示処理部105とが行う処理は、上述のように、パーソナルコンピュータが行うようにしてもよいが、ネットワーク経由でパーソナルコンピュータに接続されたサーバ装置が行うようにしてもよい。上記処理を行うプログラムは、前者の場合はパーソナルコンピュータにインストールされることになり、後者の場合はサーバ装置にインストールされることになる。上記処理を行うプログラムは、ネットワーク経由でサーバ装置よりダウンロード可能にしてもよいし、記録媒体(たとえば、CDやDVD)に記憶して配布するようにしてもよい。
 [データ処理のフローチャート]
 図3は、データ処理の一例を示すフローチャートである。図3に示すように、データ処理装置100は、データ処理を実行する。データ処理は、試料に対する所定の測定によって得られた測定波形に対して行う処理であって、データ処理装置100の取得部101、推定部102、入力部103、算出部104および表示処理部105が実行する一連の処理である。
 データ処理は、取得処理と、推定処理と、入力処理と、算出処理と、表示処理とを含む。取得処理は取得部101が実行する処理であり、推定処理は推定部102が実行する処理であり、入力処理は入力部103が実行する処理であり、算出処理は算出部104が実行する処理であり、表示処理は表示処理部105が実行する処理である。以下では、ステップを単にSと記載する。
 CPUは、ハードディスクに保存されているプログラムをメモリに読み込んで実行する。データ処理は、データ処理プログラムの実行により行われる。取得処理は、取得処理プログラムの実行により行われる。推定処理は、推定処理プログラムの実行により行われる。入力処理は、入力処理プログラムの実行により行われる。算出処理は、算出処理プログラムの実行により行われる。表示処理は、表示処理プログラムの実行により行われる。
 たとえば、取得部101は、試料測定装置10とデータ処理装置100との間で、データ(測定波形)の受け渡しをするための取得処理を行う。取得処理は、取得処理プログラムの実行により行われる。
 データ処理を開始すると、データ処理装置100は、S11において、取得処理を実行し、処理をS12に進める。取得処理において、取得部101は、試料測定装置10が行った所定の測定によって得られた測定波形を取得する。
 データ処理装置100は、S12において、推定処理を実行し、処理をS13に進める。推定処理において、図4で示す処理を行う。
 図4は、推定処理の一例を示すフローチャートである。図4に示すように、推定処理を開始すると、データ処理装置100は、S21において、ピーク本数を1~N本と仮定した場合のそれぞれについて、測定波形に含まれるピーク波形に対して、ベイズ推定によりピーク形状の予測分布を推定し、処理をS22に進める。
 データ処理装置100は、S22において、ユーザが指定したピーク本数を設定し、処理をS23に進める。たとえば、S21で算出されたピーク本数=1~N本のそれぞれのピーク形状の予測分布は、ディスプレイ112に表示させてもよい(後述の図5,図6参照)。そして、ピーク本数として1~N本のいずれが妥当であるかをユーザが指定する。この場合、たとえば、キーボード111の操作に基づきユーザが指定したピーク本数を設定する。
 データ処理装置100は、S23において、S22で設定されたピーク本数のピーク形状の予測分布を推定結果として選択し、推定処理を終了する。たとえば、ピーク本数=2本が設定された場合は、データ処理装置100は、ピーク本数=2本のピーク形状の予測分布を推定結果として選択し、S13~S16の処理において、この推定結果を用いる。
 図3に戻り、データ処理装置100は、S13において、入力処理を実行し、処理をS14に進める。入力処理において、入力部103は、ユーザの入力を受ける。具体的には、入力部103は、ユーザの操作に基づき閾値および表示項目の入力を受ける。「表示項目」は、ユーザが、ディスプレイ112に表示させようとする項目であり、ピーク面積や面積比率などの定量指標であってもよく、分位点などであってもよい。たとえば、表示項目として、定量指標「面積比率」が入力された場合は、ディスプレイ112には面積比率の予測分布が表示される。また、たとえば、閾値は「0.95」である。
 データ処理装置100は、S14,S15において、算出処理を実行する。S14において、算出部104は、推定部102で推定したピーク形状の予測分布に基づき、各々のピーク波形に対して定量指標の予測分布を算出し、処理をS15に進める。たとえば、定量指標の予測分布として「面積比率の予測分布」が算出される。
 S15において、算出部104は、定量指標の予測分布における閾値での分位点を求め、処理をS17に進める。たとえば、面積比率の予測分布における閾値(0.95)での分位点として「20.4%」が求められる。なお、S14において分位点の表示が指定されていない場合は、分位点を算出する必要はない。
 データ処理装置100は、S16において、表示処理を実行し、データ処理を終了する。表示処理において、表示処理部105は、算出部104で算出した定量指標(たとえば、面積比率など)の予測分布および分位点(たとえば、20.4%)の少なくとも一方をディスプレイ112に表示させる。
 その結果、ディスプレイ112には、定量指標の予測分布や分位点が表示される。たとえば、後述する図8に示すように、ピーク面積の予測分布がディスプレイ112に表示されたり、後述する図9に示すように、面積比率の予測分布とともに、0.95(95%)の確率で、面積比率(=ピーク2のピーク面積/ピーク1のピーク面積)が20.4%未満になることを示す「P(面積[%]<20.4)=0.95」がディスプレイ112に表示されたり、後述する図10に示すように、ピーク形状の予測分布がディスプレイ112に表示される。
 ここで、ユーザは、キーボード111の操作により閾値を変更したり、表示項目や定量指標を変更する入力を行うことができる。このような変更が行われた場合は、データ処理装置100は、再度、S13からデータ処理を実行するようにすればよい。たとえば、ユーザが閾値を「0.95」から「0.97」に変更した場合は、S13において、閾値=「0.97」が入力される。そして、データ処理装置100は、変更された閾値に基づき、S14,S15の算出処理およびS16の表示処理を実行する。
 また、ユーザが表示項目を「ピーク面積」から「ピーク高さ」に変更した場合は、S13において、表示項目=「ピーク高さ」が入力される。そして、データ処理装置100は、変更された表示項目に基づき、S14~S16の算出処理およびS17の表示処理を実行する。
 なお、表示処理部105は、入力部103で入力した閾値以上となる確率を分位点として表示させる処理を行ったり、入力部103で入力した閾値以下となる確率を分位点として表示させる処理を行うものに限らず、入力部103で入力した閾値を超える確率を分位点として表示させる処理を行うものや、入力部103で入力した閾値未満となる確率を分位点として表示させる処理を行うものであってもよい。なお、分位点は、入力した閾値に基づき算出される数値であり、たとえば、何らかの危険度や安全度を示すような統計量である。
 また、算出部104は、推定部102で推定したピーク形状の予測分布に基づき、各々のピーク波形に対して、互いに関連する定量指標に基づく第1、第2予測分布を算出するようにしてもよい。この場合、表示処理部105は、入力部103で入力を受けたユーザの選択に基づき第1、第2予測分布の表示態様を変更するように動作可能である。
 「互いに関連する定量指標に基づく第1、第2予測分布」は、定量指標が同じであってもよいし、互いに関連のあるものであればどのようなものであってもよい。たとえば、算出部104は、第1予測分布としてピーク1のピーク面積の予測分布を算出し、第2予測分布としてピーク2のピーク面積の予測分布を算出するものであってもよい。算出部104は、第1予測分布としてピーク1のピーク形状の予測分布を算出し、第2予測分布としてピーク1のピーク面積の予測分布を算出するものであってもよい。算出部104は、第1予測分布としてピーク1のピーク形状の予測分布を算出し、第2予測分布としてピーク2のピーク面積の予測分布を算出するものであってもよい。ただし、たとえば、試料測定装置10が行った所定の測定によって得られた2つの測定波形間で比較するような場合は、互いに関連するものであるとは言えない。
 また、第1、第2予測分布の表示態様として、第1予測分布のみを表示させるようにしてもよいし、第2予測分布のみを表示させるようにしてもよいし、いずれも表示してもよく、いずれも表示する場合には、一方を大きく表示し他方を小さく表示するようにしてもよい。
 具体的には、たとえば、S13において、ピーク1のピーク形状の予測分布を表示させるように表示項目を入力し、ディスプレイ112に、ピーク1のみのピーク形状の予測分布を表示させてもよい。また、S13において、ピーク1のピーク形状の予測分布を大きく表示させピーク2のピーク形状の予測分布を小さく表示させるように表示項目を入力し、ディスプレイ112に、ピーク1のピーク形状の予測分布を大きく表示させピーク2のピーク形状の予測分布を小さく表示させるようにしてもよい。
 [ピーク形状の予測分布]
 上述のように、取得部101は、試料測定装置10が行った所定の測定によって得られた測定波形(「信号波形」とも称する)を取得する。推定部102は、取得部101で取得した測定波形に含まれる近接した複数のピーク波形の各々に対して、所定のピーク形状モデルを用いて各々のピーク形状の予測分あ布を、ベイズ推定により推定する。以下、ピーク形状の予測分布の推定や表示に関し、具体的に説明する。
 本実施の形態においては、クロマトグラムにおいて複数のピークが重畳し、かつ重畳しているピーク本数が未知の場合を想定している。このような場合、一般的に、信号波形からピーク分離を行うには、個々のピークの形状に関するモデルを足し合わせることで信号波形のモデルを作り、そのモデルのパラメータを調整することで信号波形にフィッティングする。
 本実施の形態においては、測定波形(信号波形)として、LCクロマトグラムを適用する。また、所定のピーク形状モデルとして、BEMG関数を適用する。すなわち、以下の式(3)により、1つのピーク形状が表現できるものとする。
Figure JPOXMLDOC01-appb-M000003
 信号波形はこのピークが重畳したものとみなせるので、信号波形モデルはBEMG関数を複数足し合わせることで表現できる。本実施の形態では、K個のBEMG関数を足し合わせたもの(ピーク本数=K本)を「K-混合BEMG関数」と称する。K-混合BEMG関数は、以下の式(4)で示される。ただし、信号に混入するノイズを考慮し、式(4)のように、誤差項εを付加する。誤差項εはゼロ平均で正規分布しているものとし、その分散はパラメータとして信号波形から推定する。
Figure JPOXMLDOC01-appb-M000004
 なお、本実施の形態においては、ピーク形状のモデルとしてBEMG関数を適用したが、これに限らない。たとえば、ピーク形状のモデルとしてガウス関数を適用してもよいし、コーシー関数を適用するようにしてもよいし、なんらかのモデル関数で記述できるようなものであればよい。また、誤差項は、xに誤差を追加する以下の式(5)であってもよいし、入力xが誤差に影響する形式の以下の式(6)であってもよい。また、誤差項は正規分布するとしたが、これに限らない。たとえば、その他の確率分布に従うようにしてもよいし、確率分布以外の規則に従うようにしてもよい。
Figure JPOXMLDOC01-appb-M000005
Figure JPOXMLDOC01-appb-M000006
 また、ベイズ推定に際しては、たとえば、No U-Turn Sampler(NUTS)によるサンプリングにより分布推定を実行すればよい。なお、これに限らず、他のサンプリング手法を用いるようにしてもよい。また、たとえば、変分ベイズなどのサンプリング以外のベイズ推定手法を用いてもよい。
 図1を用いて説明したように、ある物質のピーク(「主ピーク」、「ピーク1」とも称する)と不純物のピーク(「ショルダーピーク」、「ピーク2」とも称する)とが近接する場合、これらのピークを区別することが難しくなる。
 図1のような場合においては、ピーク本数が1本(主ピークのみ存在)である可能性もあるし、ピーク本数が2本(主ピークおよびショルダーピークが存在)である可能性もある。あるいは、ピーク本数が3本以上である可能性もある。
 このため、本実施の形態においては、ピーク本数が1本または2本、あるいはそれ以上あることを仮定して、ピーク形状の予測分布を推定する。具体的には、本実施の形態においては、ピーク本数が1本~N本であると仮定した場合のそれぞれについて、ピーク形状の予測分布を推定し、その結果をディスプレイ112に表示可能な構成としている。さらに、各ピーク本数におけるピーク形状の予測分布の対比から、妥当なピーク本数をユーザが判定し、それを設定可能な構成としている。
 以下、図5~図7を用いて、具体例を説明する。図5は、ピーク本数を2本と仮定した場合のピーク形状の予測分布の表示例を示す図である。図6は、ピーク本数を1本と仮定した場合のピーク形状の予測分布の表示例を示す図である。
 ベイズ推定により推定量として、パラメータの事後分布が得られる。この推定量から、各ピーク形状の予測量(予測分布)を生成する。図5,図6は、各パラメータの事後分布から、推定されたピーク形状を描画したものである。ここで、実線は、観測波形を示す。破線で囲われた領域は、推定量(モデルのパラメータの事後分布)から得た信号波形の予測分布の両側95%予測区間を示している。
 図6に示すように、ピーク本数を1本と仮定した場合(1-混合BEMG関数モデルを適用)は、ピークの右側部分の予測分布が広がっており、大きな誤差が発生していることが確認できる。これに対して、図5に示すように、ピーク本数を2本と仮定した場合(2-混合BEMG関数モデルを適用)は、ピーク本数を1本と仮定した場合に比べて、ピークの右側部分の誤差が小さい。
 図示しないが、ピーク本数が3本、4本・・・N本である場合のピーク形状の予測分布も表示可能である。そして、ピーク本数=2本が妥当であるとユーザが判断した場合、キーボード111の操作により、ピーク本数=2本であることを設定する。これにより、ピーク本数=2本のピーク形状の予測分布が推定結果として選択される。また、このピーク形状の予測分布に基づき、定量指標の予測分布などが算出されることになる。
 図7は、ピーク本数を2本と仮定した場合の各ピーク形状の予測分布の表示例を示す図である。ここで、実線は、観測波形(測定波形)を示す。破線で囲われた領域は、ピーク1(主ピーク)の95%予測区間を示す。一点鎖線で囲われた領域はピーク2(ショルダーピーク)形状の95%予測区間を示す。図7は、パラメータA,u,s,a,bの事後分布(サンプリングによりベイズ推定を行う場合は事後分布から得たサンプル)をモデルに代入したものであって、誤差項を除いたピーク形状自体の予測分布を示すものである。
 図7に示すように、ピーク1(主ピーク)の右側に近接してピーク2(ショルダーピーク)が存在していることが分かる。図1の例で言えば、ピーク本数=1本となるのは、主ピークのみが存在するようなケースであり、ピーク本数=2本となるのは、主ピークに加えて不純物ピーク(ショルダーピーク)が存在するようなケースである。ピーク間が近接しておりテーリングが発生するような場合は、テーリングと不純物ピークが重畳するため、不確実性が高くなる。上記に示したように、このような不確実性は、ベイズ推定などの手法を用いた予測分布により評価を行うことができる。
 以上のように、本実施の形態においては、1~N本のピーク本数のうちいずれが妥当であるかをユーザが目視で確認し、最適なピーク本数をユーザが選択する(設定する)ようにした。しかし、これに限らず、データ処理装置100が最適なピーク本数を選択するようにしてもよい。この場合、情報量規準やベイズファクターなどの基準を用いて自動的に選択するようにしてもよい。たとえば、基準として情報量規準を用いた場合、複数のモデルのいずれかを選択させるような場合、評価値が最も小さくなるものを妥当なモデルとして選択させる。
 あるいは、ユーザおよびデータ処理装置100の双方で、ピーク本数の選択を行うようにしてもよい。たとえば、ピーク本数が1~N本である場合のそれぞれのピーク形状の予測分布を表示するとともに、データ処理装置100が選択したピーク本数を表示するようにする。この場合において、ユーザは目視で妥当なピーク本数を決め、このピーク本数がデータ処理装置100が選択したピーク本数と異なる場合は、ユーザが決めたピーク本数に変更可能な構成としてもよい。
 [定量指標の予測分布と分位点]
 上述のように、算出部104は、推定部102で推定したピーク形状の予測分布に基づき、各々のピーク波形に対して定量指標の予測分布を算出する。表示処理部105は、算出部104で算出した定量指標の予測分布をディスプレイ112に表示させる処理を行う。
 ここで、定量指標は、少なくともピーク形状の高さ(「ピーク高さ」とも称する)、ピーク形状の面積(「ピーク面積」とも称する)を含む。また、ピーク高さまたはピーク面積から算出される物質の濃度(「物質濃度」とも称する)を含んでもよい。「物質濃度」は、試料に含まれる物質であって、各々のピークに対応した物質の濃度である。
 図8は、ピーク面積の予測分布の表示例を示す図である。図8の例は、図7の例において、ピーク本数=2本である場合の各ピーク形状の予測分布に基づき、定量指標としてピーク面積の予測分布を算出部104で算出し、この予測分布をディスプレイ112に表示させたものである。
 図8の左側はピーク1(主ピーク)のピーク面積の予測分布、図8の右側は、ピーク2(ショルダーピーク)のピーク面積の予測分布をそれぞれ算出し、その結果をバイオリン図としてプロットしたものである。ここで、縦軸は、ピーク面積を示し、横軸は、ピーク1またはピーク2の確率密度が左右対称に表示されている。
 ピーク2(ショルダーピーク)のピーク面積は、平均で0.130、中央値で0.113であり、両側95%予測区間は[0.079,0.278]である。図示されるように、分布形状は上下非対称であり、上端は0.5まで伸びているため、極めて大きな値となる可能性があることが視覚的あるいは直感的に分かりやすい。また、図からは、ピーク1の面積は1.0程度、ピーク2の面積は0.1程度であり、ピーク2の面積はピーク1の面積のおよそ1/10程度であろうことが直感的につかみやすい。
 図示しないが、図8の例と同様に、上述の推定部102で推定したピーク形状の予測分布に基づき、ピーク高さや物質濃度に関しても予測分布を算出して、これらをディスプレイ112に表示させることが可能である。これらの表示は、ユーザの操作により切り替えが可能である。なお、プロットさせる際に、2変数の確率分布があるような場合には、一方の変数が取りうる全ての値に対応する確率を合算して周辺化することにより、他方の確率分布を得て、これをプロットしている。
 また、定量指標の予測分布は、各々のピーク形状に対応する物質の比率の分布を含む。たとえば、定量指標が「ピーク形状間のピーク高さの比率(単に「高さ比率」とも称する)」である場合、定量指標の予測分布は、高さ比率の予測分布である。定量指標が「ピーク形状間のピーク面積の比率(単に「面積比率」とも称する)」である場合、定量指標の予測分布は、面積比率の予測分布である。定量指標が「物質間の濃度の比率(単に「濃度比率」とも称する)」である場合、定量指標の予測分布は、濃度比率の予測分布である。
 たとえば、ピーク1およびピーク2が存在する上記例においては、面積比率=「ピーク2のピーク面積/ピーク1のピーク面積」である。面積比率は、ピーク2が不純物である場合、ピーク1に対応する物質に対する不純物の比率を指す。また、面積比率=「ピーク2のピーク面積/(ピーク1のピーク面積+ピーク2のピーク面積)」としてもよい。あるいは、N本のピークがある場合は、面積比率=「あるピークのピーク面積/ピーク1~Nのピーク面積の和」としてもよいし、比較対象とする2つのピークについて、面積比率を求めるようにしてもよい。
 また、図8のように、ピーク面積を表示する場合は、複数のピークについて同時に表示させるようにしてもよいし、1つ1つ切り替えて表示させるようにしてもよい。次に示す図9のように、面積比率を表示する場合は、複数の面積比率を同時に表示させるようにしてもよいし、1つ1つ切り替えて表示するようにしてもよい。
 図9は、面積比率の予測分布および分位点の表示例を示す図である。図9では、ヒストグラムとそのカーネル密度推定を示している。
 上述のように、入力部103は、ユーザの操作に基づき閾値を入力する。算出部104は、推定部102で推定したピーク形状の予測分布に基づき、各々のピーク波形に対して定量指標の予測分布を算出し、さらに、算出した定量指標の予測分布における閾値での分位点を算出する。表示処理部105は、入力部103で入力を受けた閾値以上または閾値以下となる確率を、分位点として表示させるように動作可能である。
 本例では、定量指標として「面積比率」、閾値として「0.95」が入力されているとする。算出部104は、推定部102で推定したピーク形状の予測分布に基づき、各々のピーク波形に対して面積比率の予測分布を算出し、算出した面積比率の予測分布における閾値(0.95)での分位点を算出する。表示処理部105は、入力部103で入力した閾値(0.95)以上となる確率を、分位点として表示させる。
 図9の例においては、分位点=「20.4%」が算出され、「P(面積[%]<20.4)=0.95」が表示されている。これにより、0.95(95%)の確率(安全率)で、面積比率(ピーク2のピーク面積/ピーク1のピーク面積)が20.4%未満になることを示している。この例においては、閾値として「0.95」が入力され、それに対して求められた分位点は「20.4%」である。なお、図8の図においては示されないが、ピーク1のピーク面積とピーク2のピーク面積とは、内部データとしては1対1の対応関係がある。このため、面積比率=ピーク2のピーク面積/ピーク1のピーク面積も一意に決定されることになる。
 あるいは、0.05(5%)の確率で、面積比率が20.4%以上になることを示してもよい。この場合、閾値として「0.05」が入力され、それに対して求められた分位点は「20.4%」になる。表示処理部105は、入力部103で入力した閾値(0.05)以下となる確率を、分位点として表示させる。たとえば、「P(面積[%]≧20.4)=0.05」を表示するようにしてもよい。
 この場合、言い換えると、ピーク1に対するピーク2(ショルダーピーク)の面積比率が20.4%以上となる確率(危険率)は5%(=1-0.95)になるとも言える。なお、面積比率を閾値として入力させ、危険率を算出させるようにしてもよい。たとえば、ユーザが閾値として「20.4%」を入力した場合に、分位点として危険率=「5%」が算出される。
 また、表示処理部105は、入力部103で入力を受けた閾値に対応する、定量指標の予測分布のパーセンタイル点を表示させるように動作可能である。本例においては、95%点は0.204である。図9に示すように、パーセンタイル点として95%点を縦破線で表示している。通常の予測区間とは異なり、ベイズ推定における予測区間ではこのような直観的な解釈が可能である。
 なお、上記例では、ピーク本数は2本であるが、3本以上のピークが存在してもよい。この場合、図8で示したような予測分布がピーク本数分存在することになる。この場合、そのうちの任意の2つのピークを選択し、図9に示したような面積比率の予測分布を表示させるようにしてもよい。
 また、ここでは危険率を5%(閾値を0.95)としているが、上述のように、この閾値はユーザが指定することができる。危険率が指定されると、不純物ピークの面積比率について、指定した危険率の範囲で取り得る値を知ることができる。
 また、表示処理部105は、入力部103で新たに閾値の入力を受けた場合、パーセンタイル点を新たに入力を受けた閾値に対応させて再表示させるように動作可能としてもよい。
 たとえば、表示処理部105は、閾値として「0.95」が入力部103に入力されて閾値「0.95」に基づきパーセンタイル点を表示させた後に、閾値として「0.97」が入力部103に入力されたときは、閾値「0.97」に基づきパーセンタイル点を表示させてもよい。
 具体的には、閾値として「0.95」(危険率5%)を設定して図9のような表示を行った後に、閾値を変更(たとえば、「0.97」(危険率3%))して、表示を更新することができる。この場合、たとえば、ユーザは、危険率が5%である場合はショルダーピークの面積比率が20.4%以上となるが、危険率が3%である場合は22%以上となるといったことを検証することができる。また、この場合、パーセンタイル点も変更して表示する。このように、ユーザは、閾値として任意の値を設定・更新することができ、その結果をディスプレイ112に表示させて評価・検証を行うことができる。
 特に、医薬品における不純物分析の場面において、上記のような評価・検証を行いたいというニーズが強い。医薬品の有効成分に残存している不要な化学物質である医薬品不純物は、所定濃度以上含まれる場合に報告義務がある。また、有効成分と不純物の間、あるいは不純物と不純物の間においてピークが近接するような場合は、上述の通り、特に誤差が発生しやすくなる。このような事情から、不純物の含有率に関し、どの程度の誤差が生じているのかといったリスクを把握したいという強いニーズがある。
 また、図示しないが、図9の例と同様に、高さ比率や濃度比率に関しても予測分布を算出して、これらをディスプレイ112に表示させることが可能である。また、この場合、閾値に基づき、高さ比率や濃度比率の予測分布のパーセンタイル点や分位点を表示させる。これらの表示は、ユーザの操作により切り替えが可能である。
 また、図9を用いて説明した分位点の表示は、面積比率の予測分布とともに表示するものに限らない。たとえば、個々のピーク形状の予測分布とともに表示するようにしてもよい。図10は、各ピーク形状の予測分布および分位点の表示例を示す図である。この場合、「定量指標」として「ピーク形状」が表示項目として入力されて、ピーク形状の予測分布(ピークごとの95%予測区間)がディスプレイ112に表示されることになる。
 図10に示すように、個々のピーク形状の予測分布とともに、「P(面積[%]<20.4)=0.95」を表示している。これにより、0.95(95%)の確率で、ピーク2のピーク面積/ピーク1のピーク面積(面積比率)が20.4%未満になることが示される。
 以上示したように、ユーザが定量指標の予測分布を確認することができるため、定量指標に関する統計データを直感的に把握しやすくできるとともに、これらを確認することで定量指標に対して誤差を考慮して合理的な安全率を確保することができる。また、ユーザが定量指標の予測分布における閾値での分位点を確認することができるため、定量指標に対して誤差を考慮して合理的な安全率を確保することができる。
 たとえば、定量指標として面積比率を用いることができる。この場合、各ピークの面積誤差を考慮することにより、各ピーク物質について合理的な安全率を確保した定量が可能となる。クロマトグラフでの成分定量においては、各成分の濃度は、通常、ピーク高さやピーク面積に比例するため、成分濃度の予測分布を得る。この予測分布から、各物質が、法令や既約などで定められた閾値を上回る可能性を評価することができる。また、クロマトグラムに適用するピーク関数の数(ピーク本数)も推定対象とした場合、不純物の有無の確率も評価することも可能になる。
 [分析装置の機能構成について]
 図11は、本実施の形態の変形例に係る分析装置の機能構成の一例を示すブロック図である。
 本実施の形態においては、図2に示したように、試料測定装置10が試料に対する所定の測定を行い、試料測定装置10が行った所定の測定によって得られた測定波形を、データ処理装置100の取得部101が取得するような構成とした。
 これに対して、本実施の形態の変形例に係る分析装置1は、データ処理装置100と、測定部11とを備えるように構成した。測定部11は、試料に対する所定の測定を行う。取得部101は、測定部11が行った所定の測定によって得られた測定波形を取得する。
 すなわち、本実施の形態においては、データ処理装置100とは異なる試料測定装置10が試料に対する所定の測定を行うようにしたが、本実施の形態の変形例においては、分析装置1が備える測定部11が試料に対する所定の測定を行うようにする。
 この場合、たとえば、図11に示すように、分析装置1は、測定部11と、取得部101と、推定部102と、入力部103と、算出部104と、表示処理部105と、操作部121と、表示部122を備える。
 分析装置1は、たとえば、上述したクロマトグラフ分析装置(LC、GC)やクロマトグラフ質量分析装置(LC/MS、GC/MS)などである。測定部11は、試料に対する所定の測定を行う装置であり、データ処理装置100は、得られた測定波形に対してデータ処理を行う装置である。つまり、分析装置1は、測定を行う装置とデータ処理を行う装置とのいずれも備える装置である。データ処理装置100は、データ処理を行う基板やモジュールであってもよい。
 データ処理装置100は、取得部101と、推定部102と、入力部103と、算出部104と、表示処理部105を備えるが、これらが行う処理の内容は、図1~図10を用いて説明したものと同様である。データ処理装置100は、データ処理装置100に備えられた操作部121によりユーザからの操作を入力し、データ処理装置100に備えられた表示部122に表示を行う。
 本実施の形態においては、たとえば、LC分析装置に接続したパーソナルコンピュータに測定波形に対するデータ処理を行うプログラムをインストールすること、あるいは、当該パーソナルコンピュータが、測定波形に対するデータ処理を行うプログラムを実行するサーバ装置と接続することを想定しているが、本実施の形態の変形例においては、LC分析装置自体が測定波形に対するデータ処理を行うプログラムを実行する構成となる。
 [態様]
 上述した実施の形態およびその変形例は、以下の態様の具体例であることが当業者により理解される。
 (第1項)一態様に係るデータ処理装置は、試料に対する所定の測定によって得られた測定波形に対してデータ処理を行う。データ処理装置は、推定部と、算出部と、表示処理部とを備える。推定部は、測定波形に含まれる近接した複数のピーク波形の各々に対して、所定のピーク形状モデルを用いて各々のピーク形状の予測分布を推定する。算出部は、推定部で推定したピーク形状の予測分布に基づき、各々のピーク波形に対して定量指標の予測分布を算出する。表示処理部は、算出部で算出した定量指標の予測分布を表示させるように動作可能である。
 このような構成によれば、ユーザが定量指標の予測分布を確認することができるため、定量指標に関する統計データを直感的に把握しやすくできるとともに、これらを確認することで定量指標に対して誤差を考慮して合理的な安全率を確保することができる。
 (第2項)第1項に記載のデータ処理装置において、算出部は、算出した定量指標の予測分布における閾値での分位点を算出する。表示処理部は、算出部で算出した分位点を表示するように動作可能である。
 このような構成によれば、ユーザが定量指標の予測分布における閾値での分位点を確認することができるため、定量指標に対して誤差を考慮して合理的な安全率を確保することができる。
 (第3項)第1項または第2項に記載のデータ処理装置において、ユーザの入力を受ける入力部をさらに備える。算出部は、推定部で推定したピーク形状の予測分布に基づき、各々のピーク波形に対して、互いに関連する定量指標に基づく第1、第2予測分布を算出する。表示処理部は、入力部で入力を受けたユーザの選択に基づき第1、第2予測分布の表示態様を変更するように動作可能である。
 このような構成によれば、たとえば、第1予測分布のみを表示させたり第2予測分布のみを表示させたりするなど、ユーザの選択に基づき第1、第2予測分布の表示態様を変更することができるため、定量指標に関する統計データを直感的に把握しやすくできる。
 (第4項)第2項に記載のデータ処理装置において、ユーザの入力を受ける入力部をさらに備える。表示処理部は、入力部で入力を受けた閾値以上または閾値以下となる確率を、分位点として表示させるように動作可能である。
 このような構成によれば、ユーザの意思により入力された閾値に基づいて算出される分位点に基づく評価を好適に行うことができる。
 (第5項)第2項に記載のデータ処理装置において、ユーザの入力を受ける入力部をさらに備える。表示処理部は、入力部で入力を受けた閾値に対応する、定量指標の予測分布のパーセンタイル点を表示させるように動作可能である。
 このような構成によれば、ユーザの意思により入力された閾値に基づいて表示されるパーセンタイル点に基づく評価を好適に行うことができる。
 (第6項)第5項に記載のデータ処理装置において、表示処理部は、入力部で新たに閾値の入力を受けた場合、パーセンタイル点を新たに入力を受けた閾値に対応させて再表示させるように動作可能である。
 このような構成によれば、ユーザの意思により変更した閾値に基づき表示されるパーセンタイル点に基づく評価を好適に行うことができる。
 (第7項)第1~第6項のいずれか1項に記載のデータ処理装置において、定量指標は、少なくともピーク形状の高さ、およびピーク形状の面積を含む。
 このような構成によれば、たとえば、主成分や不純物など特定の物質を対象とした評価を好適に行うことができる。
 (第8項)第7項に記載のデータ処理装置において、定量指標の予測分布は、各々のピーク形状に対応する物質の比率の分布を含む。
 このような構成によれば、たとえば、主成分に対して不純物が含まれる比率や不純物同士の比率に関する評価を好適に行うことができる。
 (第9項)第1~第8項のいずれか1項に記載のデータ処理装置において、推定部は、ベイズ推定により各々のピーク形状の予測分布を推定する。
 このような構成によれば、定量指標に関する評価を好適に行うことができる。
 (第10項)分析装置は、第1~第9項のいずれか1項に記載のデータ処理装置と、試料に対する所定の測定を行う測定部とを備える。
 このような構成によれば、一つの装置(分析装置)のみで、試料に対する所定の測定および定量指標に関する評価を行うことができる。
 (第11項)一態様に係るデータ処理方法は、試料に対する所定の測定によって得られた測定波形に対してデータ処理を行う。データ処理方法は、測定波形に含まれる近接した複数のピーク波形の各々に対して、所定のピーク形状モデルを用いて各々のピーク形状の予測分布を推定するステップと、推定したピーク形状の予測分布に基づき、各々のピーク波形に対して定量指標の予測分布を算出するステップと、算出した定量指標の予測分布を表示させるステップとを備える。
 このような構成によれば、ユーザが定量指標の予測分布を確認することができるため、定量指標に関する統計データを直感的に把握しやすくできるとともに、これらを確認することで定量指標に対して誤差を考慮して合理的な安全率を確保することができる。
 (第12項)第11項に記載のデータ処理方法において、算出した定量指標の予測分布における閾値での分位点を算出するステップと、算出した分位点を表示するステップとをさらに備える。
 このような構成によれば、ユーザが定量指標の予測分布における閾値での分位点を確認することができるため、定量指標に対して誤差を考慮して合理的な安全率を確保することができる。
 (第13項)第11項または第12項に記載のデータ処理方法において、ユーザの入力を受けるステップと、推定した前記ピーク形状の予測分布に基づき、各々のピーク波形に対して、互いに関連する定量指標に基づく第1、第2予測分布を算出するステップと、入力を受けたユーザの選択に基づき第1、第2予測分布の表示態様を変更するステップとをさらに備える。
 このような構成によれば、たとえば、第1予測分布のみを表示させたり第2予測分布のみを表示させたりするなど、ユーザの選択に基づき第1、第2予測分布の表示態様を変更することができるため、定量指標に関する統計データを直感的に把握しやすくできる。
 (第14項)一態様に係るデータ処理プログラムは、試料に対する所定の測定によって得られた測定波形に対してデータ処理を行う。データ処理プログラムは、コンピュータに、測定波形に含まれる近接した複数のピーク波形の各々に対して、所定のピーク形状モデルを用いて各々のピーク形状の予測分布を推定するステップと、推定したピーク形状の予測分布に基づき、各々のピーク波形に対して定量指標の予測分布を算出するステップと、算出した定量指標の予測分布を表示させるステップとを実行させる。
 このような構成によれば、ユーザが定量指標の予測分布を確認することができるため、定量指標に関する統計データを直感的に把握しやすくできるとともに、これらを確認することで定量指標に対して誤差を考慮して合理的な安全率を確保することができる。
 今回開示された実施の形態は、全ての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は、上記した実施の形態の説明ではなくて請求の範囲によって示され、請求の範囲と均等の意味および範囲内での全ての変更が含まれることが意図される。
 本開示は、たとえば、クロマトグラフなどの測定波形が近接した複数のピーク波形を含むことで、複数のピークの重畳によりピーク分離が重要となる場合において、試料に含まれる各物質のピーク面積(あるいはピーク高さや濃度)を定量するとともに、その頑健性を評価する(定量指標に関する評価をする)ために利用される。
 1 分析装置、10 試料測定装置、11 測定部、100 データ処理装置、101 取得部、102 推定部、103 入力部、104 算出部、105 表示処理部、111 キーボード、112 ディスプレイ、121 操作部、122 表示部。

Claims (14)

  1.  試料に対する所定の測定によって得られた測定波形に対してデータ処理を行うデータ処理装置であって、
     前記測定波形に含まれる近接した複数のピーク波形の各々に対して、所定のピーク形状モデルを用いて各々のピーク形状の予測分布を推定する推定部と、
     前記推定部で推定した前記ピーク形状の予測分布に基づき、各々のピーク波形に対して定量指標の予測分布を算出する算出部と、
     前記算出部で算出した前記定量指標の予測分布を表示させるように動作可能な表示処理部とを備える、データ処理装置。
  2.  前記算出部は、算出した前記定量指標の予測分布における閾値での分位点を算出し、
     前記表示処理部は、前記算出部で算出した前記分位点を表示するように動作可能である、請求項1に記載のデータ処理装置。
  3.  ユーザの入力を受ける入力部をさらに備え、
     前記算出部は、前記推定部で推定した前記ピーク形状の予測分布に基づき、各々のピーク波形に対して、互いに関連する前記定量指標に基づく第1、第2予測分布を算出し、
     前記表示処理部は、前記入力部で入力を受けたユーザの選択に基づき前記第1、第2予測分布の表示態様を変更するように動作可能である、請求項1に記載のデータ処理装置。
  4.  ユーザの入力を受ける入力部をさらに備え、
     前記表示処理部は、前記入力部で入力を受けた前記閾値以上または前記閾値以下となる確率を、前記分位点として表示させるように動作可能である、請求項2に記載のデータ処理装置。
  5.  ユーザの入力を受ける入力部をさらに備え、
     前記表示処理部は、前記入力部で入力を受けた前記閾値に対応する、前記定量指標の予測分布のパーセンタイル点を表示させるように動作可能である、請求項2に記載のデータ処理装置。
  6.  前記表示処理部は、前記入力部で新たに前記閾値の入力を受けた場合、前記パーセンタイル点を新たに入力を受けた前記閾値に対応させて再表示させるように動作可能である、請求項5に記載のデータ処理装置。
  7.  前記定量指標は、少なくともピーク形状の高さ、およびピーク形状の面積を含む、請求項1~請求項6のいずれか1項に記載のデータ処理装置。
  8.  前記定量指標の予測分布は、各々のピーク形状に対応する物質の比率の分布を含む、請求項7に記載のデータ処理装置。
  9.  前記推定部は、ベイズ推定により各々のピーク形状の予測分布を推定する、請求項1に記載のデータ処理装置。
  10.  請求項1に記載のデータ処理装置と、
     前記試料に対する前記所定の測定を行う測定部とを備える、分析装置。
  11.  試料に対する所定の測定によって得られた測定波形に対してデータ処理を行うデータ処理方法であって、
     前記測定波形に含まれる近接した複数のピーク波形の各々に対して、所定のピーク形状モデルを用いて各々のピーク形状の予測分布を推定するステップと、
     推定した前記ピーク形状の予測分布に基づき、各々のピーク波形に対して定量指標の予測分布を算出するステップと、
     算出した前記定量指標の予測分布を表示させるステップとを備える、データ処理方法。
  12.  算出した前記定量指標の予測分布における閾値での分位点を算出するステップと、
     算出した前記分位点を表示するステップとをさらに備える、請求項11に記載のデータ処理方法。
  13.  ユーザの入力を受けるステップと、
     推定した前記ピーク形状の予測分布に基づき、各々のピーク波形に対して、互いに関連する前記定量指標に基づく第1、第2予測分布を算出するステップと、
     入力を受けたユーザの選択に基づき前記第1、第2予測分布の表示態様を変更するステップとをさらに備える、請求項11に記載のデータ処理方法。
  14.  試料に対する所定の測定によって得られた測定波形に対してデータ処理を行うデータ処理プログラムであって、コンピュータに、
     前記測定波形に含まれる近接した複数のピーク波形の各々に対して、所定のピーク形状モデルを用いて各々のピーク形状の予測分布を推定するステップと、
     推定した前記ピーク形状の予測分布に基づき、各々のピーク波形に対して定量指標の予測分布を算出するステップと、
     算出した前記定量指標の予測分布を表示させるステップとを実行させる、データ処理プログラム。
PCT/JP2021/008351 2020-05-29 2021-03-04 データ処理装置、データ処理方法、データ処理プログラムおよび分析装置 WO2021240939A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2022527525A JP7332045B2 (ja) 2020-05-29 2021-03-04 データ処理装置、データ処理方法、データ処理プログラムおよび分析装置
CN202180037521.2A CN115667913A (zh) 2020-05-29 2021-03-04 数据处理装置、数据处理方法、数据处理程序及分析装置
US17/926,356 US20230417714A1 (en) 2020-05-29 2021-03-04 Data Processing Device, Data Processing Method, Data Processing Program, and Analysis Device

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2020-094492 2020-05-29
JP2020094492 2020-05-29

Publications (1)

Publication Number Publication Date
WO2021240939A1 true WO2021240939A1 (ja) 2021-12-02

Family

ID=78723318

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2021/008351 WO2021240939A1 (ja) 2020-05-29 2021-03-04 データ処理装置、データ処理方法、データ処理プログラムおよび分析装置

Country Status (4)

Country Link
US (1) US20230417714A1 (ja)
JP (1) JP7332045B2 (ja)
CN (1) CN115667913A (ja)
WO (1) WO2021240939A1 (ja)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06324029A (ja) * 1993-03-15 1994-11-25 Hitachi Ltd クロマトグラム解析表示方法及びその装置
JP2016004525A (ja) * 2014-06-19 2016-01-12 株式会社日立製作所 データ分析システム及びデータ分析方法
WO2016035167A1 (ja) * 2014-09-03 2016-03-10 株式会社島津製作所 クロマトグラムデータ処理方法及び装置
WO2019092837A1 (ja) * 2017-11-09 2019-05-16 富士通株式会社 波形解析装置
WO2019176658A1 (ja) * 2018-03-14 2019-09-19 株式会社日立ハイテクノロジーズ クロマトグラフィー質量分析方法およびクロマトグラフ質量分析装置
WO2020032803A1 (en) * 2018-08-10 2020-02-13 Yevgen Matviychuk Method and system for determining the concentration of chemical species using nmr
WO2020105566A1 (ja) * 2018-11-19 2020-05-28 キヤノン株式会社 情報処理装置、情報処理装置の制御方法、プログラム、算出装置、及び算出方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4353242A (en) * 1980-12-16 1982-10-12 University Of Utah Research Foundation Multichannel detection and resolution of chromatographic peaks
US6807490B1 (en) * 2000-02-15 2004-10-19 Mark W. Perlin Method for DNA mixture analysis
CA2501003C (en) * 2004-04-23 2009-05-19 F. Hoffmann-La Roche Ag Sample analysis to provide characterization data

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06324029A (ja) * 1993-03-15 1994-11-25 Hitachi Ltd クロマトグラム解析表示方法及びその装置
JP2016004525A (ja) * 2014-06-19 2016-01-12 株式会社日立製作所 データ分析システム及びデータ分析方法
WO2016035167A1 (ja) * 2014-09-03 2016-03-10 株式会社島津製作所 クロマトグラムデータ処理方法及び装置
WO2019092837A1 (ja) * 2017-11-09 2019-05-16 富士通株式会社 波形解析装置
WO2019176658A1 (ja) * 2018-03-14 2019-09-19 株式会社日立ハイテクノロジーズ クロマトグラフィー質量分析方法およびクロマトグラフ質量分析装置
WO2020032803A1 (en) * 2018-08-10 2020-02-13 Yevgen Matviychuk Method and system for determining the concentration of chemical species using nmr
WO2020105566A1 (ja) * 2018-11-19 2020-05-28 キヤノン株式会社 情報処理装置、情報処理装置の制御方法、プログラム、算出装置、及び算出方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
KAWASHIMA ET AL.: "Spectral decomposition based on Bayesian variable selection", INFORMATION PROCESSING SOCIETY OF JAPAN JOURNAL MATHEMATICAL MODELING AND APPLICATION, vol. 12, no. 2, July 2019 (2019-07-01), pages 34 - 43 *
MATVIYCHUK YEVGEN; VON HARBOU ERIK; HOLLAND DANIEL J.: "An experimental validation of a Bayesian model for quantification in NMR spectroscopy", JOURNAL OF MAGNETIC RESONANCE., ACADEMIC PRESS, ORLANDO, FL., US, vol. 285, 1 January 1900 (1900-01-01), US , pages 86 - 100, XP085253432, ISSN: 1090-7807, DOI: 10.1016/j.jmr.2017.10.009 *

Also Published As

Publication number Publication date
CN115667913A (zh) 2023-01-31
JPWO2021240939A1 (ja) 2021-12-02
JP7332045B2 (ja) 2023-08-23
US20230417714A1 (en) 2023-12-28

Similar Documents

Publication Publication Date Title
US8428889B2 (en) Methods of automated spectral peak detection and quantification having learning mode
Kang et al. Making the most of spatial information in health: a tutorial in Bayesian disease mapping for areal data
Jalali-Heravi et al. MCRC software: a tool for chemometric analysis of two-way chromatographic data
EP2438436B1 (en) Methods of automated spectral peak detection and quantification without user input
WO2010047916A1 (en) Methods of automated spectral peak detection and quantification without user input
Badrick et al. A primer on patient-based quality control techniques
van Rossum et al. A method for optimization and validation of moving average as continuous analytical quality control instrument demonstrated for creatinine
JP2004502934A (ja) 選択された多成分サンプルの分析方法
Chen et al. Multi-criteria design of an X control chart
GB2586710A (en) Chromatography mass spectrometry method, and chromatograph mass spectrometry device
Rupprecht et al. Automating LC–MS/MS mass chromatogram quantification: Wavelet transform based peak detection and automated estimation of peak boundaries and signal-to-noise ratio using signal processing methods.
WO2021240939A1 (ja) データ処理装置、データ処理方法、データ処理プログラムおよび分析装置
US11829357B2 (en) Analysis assistance device, analysis assistance method and non-transitory computer readable medium storing analysis assistance program
EP3250917A1 (en) Automatic quantitative regression
CN105404770B (zh) 临床诊断处理中从大失控状态恢复的系统以及方法
Xie et al. Partial least median of squares regression
CN115994093A (zh) 测试用例推荐方法和装置
US20210341441A1 (en) Analysis assistance device, analysis assistance method and non-transitory computer readable storage medium recording analysis assistance program
US20210356446A1 (en) Analysis assistance device, analysis assistance method and non-transitory computer readable medium storing analysis assistance program
EP2966583B1 (en) System and method for spot checking small out-of-control conditions in a clinical diagnostic process
JPWO2018198207A1 (ja) 試料分析装置
Kuzmič et al. Practical robust fit of enzyme inhibition data
Lim et al. Difference-and regression-based approaches for detection of bias
JP2016133486A (ja) クロマトグラフ用データ処理システムおよびクロマトグラムの検索方法
EP4293353A1 (en) Analysis assistance device, analysis assistance method and analysis assistance program

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 21814055

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2022527525

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 21814055

Country of ref document: EP

Kind code of ref document: A1