WO2021210228A1 - 波形情報推定方法及び装置、並びに、ピーク波形処理方法及び装置 - Google Patents

波形情報推定方法及び装置、並びに、ピーク波形処理方法及び装置 Download PDF

Info

Publication number
WO2021210228A1
WO2021210228A1 PCT/JP2021/000823 JP2021000823W WO2021210228A1 WO 2021210228 A1 WO2021210228 A1 WO 2021210228A1 JP 2021000823 W JP2021000823 W JP 2021000823W WO 2021210228 A1 WO2021210228 A1 WO 2021210228A1
Authority
WO
WIPO (PCT)
Prior art keywords
waveform
peak
function
model
partial
Prior art date
Application number
PCT/JP2021/000823
Other languages
English (en)
French (fr)
Inventor
陽 野田
Original Assignee
株式会社島津製作所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社島津製作所 filed Critical 株式会社島津製作所
Priority to CN202180028313.6A priority Critical patent/CN115398226B/zh
Priority to JP2022515206A priority patent/JP7414125B2/ja
Priority to US17/918,259 priority patent/US20230160862A1/en
Publication of WO2021210228A1 publication Critical patent/WO2021210228A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8624Detection of slopes or peaks; baseline correction
    • G01N30/8631Peaks
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8693Models, e.g. prediction of retention times, method development and validation
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/62Detectors specially adapted therefor
    • G01N30/72Mass spectrometers

Definitions

  • the present invention relates to a method and device for estimating information on signal waveforms obtained by various analyzers and measuring devices, and a peak waveform processing method and device using the method and device.
  • the "signal waveform” includes not only the waveform itself obtained by analysis or measurement, but also a waveform created by processing the signal obtained by analysis or measurement.
  • LC liquid chromatograph
  • GC gas chromatograph
  • the peak waveform on the chromatogram is ideally shaped according to the Gaussian distribution.
  • reading and tailing occur in the actually obtained peaks on the chromatogram due to various factors.
  • the baseline may be drifting, or due to inadequate separation, multiple peaks from different components often overlap. In such various situations, it is not easy to accurately detect the peak and accurately obtain the area value and height value of the peak, and various methods and algorithms for peak detection have been conventionally used. ..
  • Non-Patent Document 1 an appropriate baseline correction line is set for a given chromatogram, and the overlapping peaks are appropriately separated based on the baseline correction line, and each of the separated peaks is separated.
  • a waveform processing method for calculating the integrated value of the area is disclosed.
  • Patent Document 1 describes a method of fitting a model function prepared in advance to a peak waveform on a chromatogram and calculating a feature amount such as a peak area value or height value based on the result. Has been done.
  • the method of fitting such a model function is also used for various observation waveforms other than peak waveforms.
  • a calibration curve showing the relationship between the peak area value and the concentration (or content) of a substance is used, and it is possible to perform minimum square fitting using such a calibration curve as a polynomial or an exponential function. Often there is.
  • drug stability tests and pharmacokinetic tests temporal changes in the resolution of the target substance and temporal changes in metabolites are observed, and even in such cases, the observed waveforms fluctuate smoothly. Apply the model function and then perform the statistical analysis.
  • Non-Patent Document 1 the classical peak detection method as disclosed in Non-Patent Document 1 has a relatively good waveform condition such as relatively small noise and a steady signal. Is assumed. Therefore, if these conditions are not satisfied, accurate peak detection is often not possible, and in general, a method using fitting of a model function enables more accurate peak detection.
  • the EMG (Exponential Modified Gaussian) function is often used as the model function.
  • the peak waveform in the chromatogram is ideally close to the Gaussian waveform, it is often an asymmetric waveform due to tailing.
  • a model function corrected in consideration of such tailing it is difficult to perform fitting so that the shape of the hem of the peak exactly matches, and a shape error of the peak tends to occur.
  • the peak to be observed is a peak derived from a single component
  • the influence of the peak shape error due to the above-mentioned factors on the peak area value is small.
  • the shape error of the peaks may greatly affect the area value of each peak.
  • the present invention has been made to solve these problems, and its main purpose is to use parameters for model functions used for peak detection, extraction of peak feature values, etc., without spending a lot of labor and time. It is an object of the present invention to provide a waveform information estimation method and an apparatus capable of improving the accuracy while suppressing the increase in the above.
  • Another object of the present invention is to use such a waveform information estimation method and apparatus to accurately detect peaks observed in a chromatogram or spectrum, and to accurately separate and detect overlapping peaks. It is an object of the present invention to provide a peak waveform processing method and an apparatus capable of calculating an accurate feature value for a peak that has been formed.
  • One aspect of the waveform information estimation method is a method of estimating waveform information about a signal waveform, using a computer.
  • a waveform extraction step that extracts a partial waveform to be modeled from a signal waveform based on actual measurement using a predetermined analyzer, and a waveform extraction step.
  • the partial waveform obtained in the waveform extraction step as an input and performing hostile learning using two models that are hostile to each other, the generative model and the discriminative model, the model function corresponding to the partial waveform or the said A model function and a hostile learning step to acquire the distribution information of the shape in the function, Is to execute.
  • one aspect of the waveform information estimation device which is made to solve one of the above problems, is an apparatus for carrying out the waveform information estimation method according to the above aspect according to the present invention.
  • a waveform extraction unit that extracts a partial waveform to be modeled from a signal waveform based on actual measurement using a predetermined analyzer, and a waveform extraction unit.
  • the partial waveform obtained by the waveform extraction unit as an input and performing hostile learning using two models that are hostile to each other, the generative model and the discriminative model, the model function corresponding to the partial waveform or the said A model function and a hostile learning unit that acquires the distribution information of the shape in the function, Is provided.
  • one aspect of the peak waveform processing method according to the present invention is a peak waveform processing method using the waveform information estimation method of the above aspect.
  • the partial waveform is a peak waveform.
  • the model waveform generation step of generating a peak model waveform by using the model function obtained in the hostile learning step is further executed, and the peak is detected for the target signal waveform by using the peak model waveform. be.
  • the peak waveform processing method is the peak waveform processing method using the waveform information estimation method of the above aspect.
  • the partial waveform is a peak waveform.
  • a processing step of performing waveform processing for separating a plurality of overlapping peaks in a target signal waveform is further executed.
  • one aspect of the peak waveform processing device which is made to solve one of the above problems, is a peak waveform processing device using the waveform information estimation device of the above aspect.
  • the partial waveform is a peak waveform.
  • a model waveform generation unit that generates a peak model waveform using the model function obtained by the hostile learning unit is further provided, and peak detection for a target signal waveform is performed using the peak model waveform. ..
  • the peak waveform processing device uses the waveform information estimation device of the above aspect.
  • the partial waveform is a peak waveform. It further includes a waveform processing unit that performs waveform processing to separate a plurality of overlapping peaks in a target signal waveform by using a model function obtained by the hostile learning unit.
  • the method of analysis or measurement in the analyzer is not limited, but typically, components in the sample such as a chromatograph device, a mass analyzer, a nuclear magnetic resonance device, an optical analyzer, and an X-ray analyzer ( It is possible to use a device capable of acquiring a signal waveform in which a peak corresponding to (compounds, elements, etc.) is observed. Further, it does not necessarily have to be a signal waveform in which a peak is observed, as long as a characteristic waveform is observed. Further, not only the signal waveform directly obtained by the analysis or measurement in the analyzer, but also the analysis result and the calibration curve created based on the measurement result can be included in the signal waveform referred to here.
  • the Generative Adversarial Network (hereinafter referred to as “GAN””, which is a method of machine learning disclosed in Non-Patent Documents 2, 3 and the like.
  • the model function corresponding to the partial waveform extracted from the signal waveform and the distribution (probability distribution) information regarding the variation (variation) of the model function can be acquired by using (referred to as).
  • the peak waveform extracted from the chromatogram obtained by actually analyzing the sample with a chromatograph device is given as real data.
  • the shape of the signal waveform may differ significantly depending on the type of sample to be analyzed or the type (category, etc.) of the components contained in the sample. Even if a plurality of signal waveforms having significantly different shapes are subjected to learning by GAN as real data, the learning is not performed properly and it is difficult to obtain a target highly accurate generative model. Therefore, instead of a general-purpose analysis that does not limit the type of sample, the tendency of the waveform shape is close, that is, the waveform by limiting the type of sample, the type of component, the purpose of analysis, the field of application, etc. to some extent. It is advisable to perform GAN learning using partial waveforms having a certain degree of shape as real data.
  • hostile learning is not necessarily GAN using a neural network
  • WGAN Wasserstein GAN
  • WGAN-gp Wasserstein GAN
  • an algorithm that outputs a function that can approximate the distribution of the data based on the data to be trained may be used.
  • a model function for modeling a partial waveform such as a peak in a chromatogram obtained by a chromatographic apparatus with high accuracy a model function thereof.
  • Information on the distribution of the waveform shape can be obtained with high accuracy.
  • the peak waveform processing method and apparatus of one aspect according to the present invention by using the highly accurate model function and waveform distribution information obtained as described above for peak detection, a chromatogram or the like to be analyzed can be used. The peak observed in is more accurately detected. Further, according to the peak waveform processing method and apparatus of another aspect according to the present invention, even when a plurality of peaks overlap on a chromatogram or a spectrum, those peaks can be separated with high accuracy. In addition, peak feature values such as the area value and height value of the peak detected in this way or the separated peak can be obtained with high accuracy. Thereby, the quantification accuracy of the components in the sample can be improved.
  • the range of error that can be taken by the peak feature values such as the area value and height value of the peak obtained from the chromatogram to be analyzed can be rationalized. Can be calculated. Thereby, for example, it is possible to accurately evaluate whether or not the characteristic value of the peak obtained by another waveform processing method is appropriate.
  • FIG. 6 is a schematic configuration diagram of an embodiment of an LC device including a data analysis device including a waveform information estimation device according to the present invention.
  • FIG. 3 is a functional block configuration diagram of a hostile learning execution unit in the waveform information estimation device shown in FIG.
  • the figure which shows the network configuration example in the generator in FIG. The figure which shows an example of the input data (real waveform data) of GAN.
  • the signal waveform to be analyzed is a chromatogram waveform
  • the peak observed on the chromatogram is detected by data analysis, and the peak top position (holding time) and peak area value (or peak area value) of the peak are detected. Height value) shall be calculated.
  • FIG. 1 is an overall configuration diagram of an embodiment of an LC device including a data analysis device including a waveform information estimation device according to the present invention.
  • the measuring unit 10 includes a mobile phase container 11, a pump 12 that sucks the mobile phase and feeds it at a substantially constant flow rate (or flow rate), and an injector 13 that injects a sample liquid into the mobile phase. It includes a column 14 for separating the components contained in the sample solution according to the holding time, and a detector 15 for detecting the components in the eluate eluted from the column 14.
  • the detector 15 for example, an optical detector such as a photodiode array (PDA) detector, a mass spectrometer, or the like can be used.
  • PDA photodiode array
  • the data analysis unit 20 has a function of digitizing and processing the detection signal output from the detector 15, and includes functional blocks such as a data collection unit 21, a peak detection processing unit 22, and a qualitative / quantitative analysis unit 23.
  • the peak detection processing unit 22 includes functional blocks such as a prior information storage unit 221, a Bayesian estimation processing unit 222, and a peak feature value determination unit 223.
  • An input unit 24 and a display unit 25 as a user interface are connected to the data analysis unit 20.
  • the substance of the data analysis unit 20 is a general-purpose computer, and by executing the dedicated software (computer program) installed in the computer on the computer, the functions of each functional block as shown in FIG. 1 are achieved. NS. Of course, it is also possible to achieve some of the functions in such a functional block with a dedicated hardware circuit or the like.
  • the pump 12 sucks the mobile phase stored in the mobile phase container 11 and feeds it to the column 14 at a substantially constant flow rate.
  • the injector 13 injects a predetermined amount of a sample solution prepared in advance into the mobile phase at a predetermined timing according to an instruction from a control unit (not shown).
  • the injected sample solution is introduced into the column 14 along with the flow of the mobile phase, and various components contained in the sample solution are separated and eluted in the time direction while passing through the column 14.
  • the detector 15 detects a component contained in the eluate and outputs a detection signal having an intensity corresponding to the amount of the component every moment.
  • the data collection unit 21 samples the detection signal at predetermined time intervals, converts it into digital data, and stores it in the storage device.
  • This stored data is data (chromatogram data) constituting the chromatogram waveform, and the component detected by the detector 15 is observed as a peak on the chromatogram.
  • the peak detection processing unit 22 receives the chromatogram data, detects a significant peak, and obtains the position (time) of the peak top of the detected peak and the area value (or height value) of the peak.
  • the qualitative / quantitative analysis unit 23 identifies the component from the information on the position of each peak on the chromatogram, and uses the calibration curve prepared in advance to contain each component from the peak area value (or height value). Calculate the amount. That is, the qualitative / quantitative analysis unit 23 performs qualitative analysis and quantification of each component contained in the sample, and outputs the result to the display unit 25.
  • Peak detection method and peak feature value calculation method In the LC apparatus of this embodiment, peak fitting based on Bayesian estimation is used in order to detect the peak appearing in the chromatogram to be analyzed and obtain the peak area value as the feature value thereof.
  • the peak waveform corresponding to the component in the sample in the chromatogram can be represented by a function f (t, Z) that takes the shape parameter Z and the holding time t as arguments.
  • the shape parameter Z is, for example, a parameter related to or presumed to be related to the width of the peak and the spread of the hem.
  • Bayesian inference can estimate the posterior distribution from the prior distribution of the parameters of a function and the actual data. Now, if both the peak model function f (t, Z) and the probability distribution of the shape parameter Z are known, the posterior situation when a certain chromatogram waveform D is given as the observed waveform by using Bayesian estimation.
  • D) is obtained from the probability p (D
  • Z) is p (D
  • Z) N (f (t, Z), ⁇ ), assuming that the peak model function f (t, Z) is multiplied by, for example, the normal noise of the standard deviation ⁇ . ) Can be given.
  • the function N has a normal distribution.
  • the probability distribution of the shape of the peak model function f (t, Z 0 ) can be obtained from the posterior distribution. That is, with respect to the peak waveform observed on the chromatogram waveform D, a peak model function indicating a waveform shape in which fitting is appropriately obtained can be stochastically obtained. Therefore, for example, if the probability of a function showing a certain waveform shape is remarkably high, it can be determined that the waveform shape represents a peak waveform on a given chromatogram. Further, based on the function f (t, Z 0 ), a desired peak feature value such as a peak area value, a height value, or a peak position can be calculated.
  • the probability distribution of peak feature values such as the area value and height value of peaks on the chromatogram from the probability distribution of the shape of the peak model function f (t, Z 0).
  • the credible interval of the probability distribution is set to 95%, and the range of values that the peak area, height, position, etc. can take can be obtained.
  • FIG. 2 is a schematic configuration diagram of an embodiment of a waveform information estimation device for estimating a peak model function and parameter distribution information.
  • This device includes functional blocks such as an actual measurement data input unit 30, a peak waveform extraction unit 31, a hostile learning execution unit 32, and a peak model function determination unit 33.
  • the substance of this device is a computer, and each functional block shown in FIG. 2 is embodied by executing a predetermined program (software) installed in the computer.
  • FIG. 3 is a functional block configuration diagram of the GAN used by the hostile learning execution unit 32 in FIG.
  • the apparatus shown in FIGS. 2 and 3 may be included in the data analysis unit 20 of the LC apparatus shown in FIG. That is, the above function may be achieved by the data analysis computer of the LC device, but the means for achieving the above function may be separate from the data analysis unit 20.
  • the chromatogram waveform obtained by actual measurement is used as the real data at the time of hostile learning by GAN. That is, the chromatogram waveform obtained by actually measuring the sample using the measuring unit 10 of the LC device shown in FIG. 1 or an LC device equivalent thereto is used as real data.
  • the peak waveform on the chromatogram has a large difference in the shape of the peak waveform depending on the type of sample, that is, the type of component, the field and purpose of analysis, the LC separation condition, and the like. If we try to analyze multiple peak waveforms with large differences in such shapes, for example, peak waveforms that tend to have large tailing and peak waveforms that tend to have little tailing, the peak model function There arises a problem that the width of the distribution is too wide and the accuracy of the function is lowered, or the distribution of the parameters is too wide. Therefore, such problems can be avoided by narrowing down the application fields of analysis. Specifically, here, the field of analysis is limited to the analysis of metabolites derived from living organisms. That is, the sample is a biological sample, and the components in the sample are metabolites. Of course, this is just an example, and techniques such as those described herein can be applied to various samples, components, or analytical purposes.
  • the actual measurement data input unit 30 reads a large number of chromatogram data obtained by actual measurement.
  • the peak waveform extraction unit 31 removes, for example, a peak having an extremely low SN ratio or a peak with insufficient separation from each input chromatogram data, and extracts a peak having a good waveform shape. conduct. Then, the peak waveform extraction unit 31 obtains a predetermined peak shape parameter such as a tailing (or reading) degree and a peak width for the extracted peak. If the correlation between the parameters, for example, that there is a proportional relationship between the retention time and the peak width, can be predicted, the peak width is normalized by the retention time in advance so that learning described later can be easily performed. It is possible to perform normalization processing in advance to weaken the correlation between parameters such as.
  • the peak waveform extraction unit 31 acquires the peak shape parameters of a large number of single peaks.
  • the hostile learning execution unit 32 performs learning by GAN using the peak shape parameter of a single peak having a good waveform shape as real data.
  • the hostile learning execution unit 32 includes a random noise generation unit 40, a generator 41, a data selection unit 44, a discriminator 45, a determination unit 46, and an update processing unit 47.
  • the generator 41 includes a time distortion function generation unit 411, a time input unit 412, and a Gaussian function calculation unit 413.
  • a neural network as described in Non-Patent Documents 2 and 3 is used for both the time strain function generator 411 and the classifier 45 in the generator 41.
  • GAN The general idea of GAN is that the generator generates fake data that resembles real data, and the classifier alternately discriminates between the fake data and the real data. That is, the generator learns the parameters of the peak waveform itself.
  • the following improvements have been added to the algorithm in GAN used in the hostile learning execution unit 32 in the present embodiment.
  • the peak waveform on the chromatogram is ideally shaped according to the Gaussian function, but in reality, it deviates from the Gaussian waveform shape due to various factors. Therefore, this deviation is defined as a time strain function s (t, Z) representing a temporal strain, and the time strain function generator 411 in the generator 41 uses a neural network to define this time strain function s (t, Z). To generate.
  • the time input unit 412 adds the time strain function s (t, Z) to the time t, which is a parameter on the horizontal axis of the chromatogram, and delivers it to the Gaussian function calculation unit 413.
  • the Gaussian function calculation unit 413 performs a Gaussian function operation with t + s (t, Z) as an argument, and outputs a waveform according to the Gaussian function Gauss (t + s (t, Z)) including a time distortion element.
  • time distortion function s (t, Z) and the function f (t, Z) representing the original peak waveform are continuous functions with respect to time t
  • the measured data obtained by the measurement is observed for each sampling time. It is a set of discrete data. Therefore, such a function cannot be directly used for the GAN generator 41. Therefore, here, instead of the time strain function s (t, Z) which is a continuous function, a discrete time strain function s (T, Z) using a vector T indicating each sampling time of the measured data is used for time. It is output as a function generated by the distortion function generation unit 411.
  • the time distortion function generation unit 411 creates the time distortion function s (T, Z) based on the noise input from the random noise generation unit 40 by the neural network.
  • the time input unit 412 has a vector T corresponding to the time t, which is the same size as the vector size of the given real data, and a discrete time strain function s (T, Z) output from the time strain function generation unit 411. ) And are added.
  • the Gaussian function calculation unit 413 generates a waveform according to the Gaussian function Gauss (T + s (T, Z)), that is, a false peak waveform.
  • the fake waveform data output at this time has the same size as the real waveform vector to be learned.
  • the data selection unit 44 alternately switches between the fake waveform data output from the generator 41 and the real waveform data and inputs the data to the classifier 45.
  • the classifier 45 discriminates whether or not the input data is genuine, and the determination unit 46 determines whether or not the identification result is correct, that is, when the genuine data is input to the classifier 45, it is genuine. It is determined whether or not it is identified as being, and whether or not it is identified as fake when the fake data is input to the classifier 45.
  • the update processing unit 47 updates the coefficient of the neural network in the time distortion function generation unit 411 so that the false data approaches the real data based on the determination result by the determination unit 46. At the same time, the coefficient of the neural network in the classifier 45 is updated so that the discriminating performance of the classifier 45 is improved.
  • learning is executed so as to improve the performance of each of the generator 41 and the classifier 45 while competing with each other in this way.
  • the training in GAN as described above causes the generator 41 to generate a false peak waveform that is very close to the real peak waveform, and in the process of learning, the peak model function that approximates the peak waveform and its function. Information on the distribution of parameters (that is, the probability distribution of the waveform shape) can be obtained.
  • the peak model function determination unit 33 determines the peak model function representing the peak waveform shape and the distribution of its shape parameters based on the result of the hostile learning execution unit 32 performing learning in GAN as described above.
  • the function generated by the time distortion function generator 411 is limited to a minute time distortion, and Gauss (T + s (T, Z)) incorporating the function is peaked. It is used as a model function. As a result, not the entire peak waveform on the chromatogram but only the minute time distortion part when the peak waveform on the chromatogram is approximated by the Gaussian function needs to be generated by GAN learning, so that highly accurate learning can be performed. Easy to do.
  • the distribution of shape parameter Z is a probability distribution. Therefore, the distribution of the shape parameter Z can be used as it is as a prior distribution in Bayesian estimation. Therefore, it is not necessary to clearly describe the distribution of the peak model function f (t, Z), and it is assumed that there is a function f (t, Z) that simply transforms the random variable Z when performing Bayesian inference. Can make inferences.
  • FIG. 4 is a diagram showing an example of a network configuration in the time distortion function generator 411 of the generator 41 in FIG.
  • the time distortion function generation unit 411 combines the random number vector Z given by the random noise generation unit 40 and the time t which is a scalar value and receives them as one vector. Then, this vector is applied to the full connect (FC) layer and the network of activation functions.
  • the input of the first layer is added to the input of each subsequent layer, since the tailing of the peak is usually strongly directly influenced by the parameter t.
  • a free neural network configuration can be used as the time distortion function generation unit 411.
  • a general neural network may be used as the classifier 45, but here, a one-dimensional convolution layer and a linear combination layer are used so that a bell-shaped waveform such as a Gaussian function can be better captured. Use a neural network with.
  • the essential purpose of the hostile learning execution unit 32 is to learn a distribution that matches the distribution of the data point cloud, and in the above example, GAN is used as the learning method.
  • GAN is used as the learning method.
  • An appropriate algorithm can be used that can optimize the function using (gradient).
  • the KL (Kullback-Leibler) distance is used as the similarity to the distribution of the function f generated from the observed waveform D and the shape parameter Z, but in addition to the KL distance, JS (Jensen-Shannon) is used.
  • JS Jensen-Shannon
  • Various indicators can be used to evaluate the degree of agreement of the distribution, such as distance and Wasserstein distance.
  • a neural network with a non-negative output can be created by adding 1 to the ELU (Exponential Linear Units) function or using the RELU function as an activation function.
  • ELU Exposential Linear Units
  • RELU RELU function
  • s (t, Z) c * t + d + ⁇ A * sigmoid (t * a + b) is calculated to satisfy the monotonicity of the time distortion.
  • Functions can be created.
  • the time strain function is a model in which an inflection point due to the synthesis of a plurality of sigmoid functions exists on the straight line represented by ct + d.
  • FIG. 5 is a diagram showing a part of real peak waveform data used at the time of learning by GAN.
  • FIG. 6 is a diagram showing a part of false peak waveform data generated by the generator 41.
  • a plurality of waveforms are randomly overwritten.
  • the training in GAN can obtain a generative model capable of outputting false peak waveform data that is extremely close (substantially indistinguishable) to real peak waveform data.
  • the peak detection processing unit 22 By the processing as described above, it is possible to acquire a generative model that simulates the peak waveform observed on the actually measured chromatograph, that is, the peak model function and the distribution information of the shape parameters. .. By storing these data in the prior information storage unit 221 of the apparatus shown in FIG. 1 and using it as a prior distribution at the time of Bayesian estimation in the Bayesian estimation processing unit 222, the peak detection processing unit 22 accurately determines the peak. It can be detected and peak feature values such as peak quantitative values can be calculated more accurately.
  • the posterior distribution Z 0 of the shape parameter Z is obtained with respect to the target observed waveform data D 0.
  • the shape of the sample Gauss (T + f (T, Z 0 )) with a specific peak shape can be obtained, and the peak area value is based on that shape.
  • the distribution of desired peak feature values such as, etc. may be calculated. Since f (t, Z) obtained by machine learning as described above is a function that takes t as an argument, which is similar to the EMG function, the distribution of parameter Z by Bayesian estimation and the posterior prediction distribution of function f can be used. It has the advantages of the model function as it is and can be easily applied to Bayesian estimation.
  • the signal value of the mixed peak may be simply the sum of the signal values corresponding to a plurality of single peaks.
  • information on the distribution such as the position and height of the peak is also required for Bayesian estimation, but in the case of a chromatogram, these parameters are required. It is common to consider the distribution of each independently, and the distribution can be estimated separately from the shape parameters such as the peak width.
  • Bayesian estimation is performed on the premise that a plurality of peaks exist, so that the peaks are substantially separated and the peaks such as the peak area of each peak are substantially separated.
  • the feature value can be obtained.
  • the above-mentioned method according to the present invention can of course be used for calculating peak feature values such as peak presence / absence test and peak position estimation.
  • a method other than Bayesian estimation may be used. Specifically, a simpler method such as the maximum likelihood estimation method or the least squares method, which is frequently used for fitting peak waveforms, may be used. Even in that case, since the original peak model function is obtained with high accuracy, peak detection, peak separation, etc. with high accuracy are possible.
  • the method according to the present invention is applied to the analysis of peaks on the chromatogram, it can be used for the analysis of other waveforms.
  • the calibration curve used when obtaining the component concentration (content) from the peak area is also a kind of signal waveform, and the same analysis can be performed on the calibration curve.
  • the shape of the calibration curve usually does not follow the Gaussian function, but instead of using the Gaussian function, it is possible to model using the function g (t + f (t, Z), Z).
  • this method can also be applied to the analysis of waveforms indicating the passage of time in the amount of change in the amount of drug reaction.
  • FIG. 7 is a diagram showing a part of real data used when creating a generative model simulating a calibration curve by learning by GAN.
  • FIG. 8 is a diagram showing a part of false data generated by the generator.
  • a plurality of waveforms are randomly overwritten. As can be seen by comparing these, it is possible to obtain a generative model capable of outputting fake data that is extremely close to (substantially indistinguishable) to real data even when simulating a calibration curve.
  • the time strain function f related to the time t is created by the neural network to describe the conversion function, but the conversion function is described by using the function g (x, Z) related to the intensity x instead of the time. It is also possible to describe g (Gauss (T), Z). This is based on the assumption that distortion occurs according to the intensity rather than the time. For example, in an LC device using an absorptiometer as a detector, signal saturation occurs in a high concentration region and the peak top is crushed. It is suitable for writing model functions in such cases. As a matter of course, the function f and the function g can be combined and described as g (Gauss (T + f (T, Z)), Z).
  • the present invention can be applied when processing or analyzing a signal waveform obtained by various analyzers other than the LC device and the GC device. Is clear.
  • One aspect of the waveform information estimation method is a method of estimating waveform information about a signal waveform, using a computer.
  • a waveform extraction step that extracts a partial waveform to be modeled from a signal waveform based on actual measurement using a predetermined analyzer, and a waveform extraction step.
  • the partial waveform obtained in the waveform extraction step as an input and performing hostile learning using two models that are hostile to each other, the generative model and the discriminative model, the model function corresponding to the partial waveform or the said A model function and a hostile learning step to acquire the distribution information of the shape in the function, Is to execute.
  • a waveform extraction unit that extracts a partial waveform to be modeled from a signal waveform based on actual measurement using a predetermined analyzer, and a waveform extraction unit.
  • the partial waveform obtained by the waveform extraction unit as an input and performing hostile learning using two models that are hostile to each other, the generative model and the discriminative model, the model function corresponding to the partial waveform or the said A model function and a hostile learning unit that acquires the distribution information of the shape in the function, Is provided.
  • the waveform information estimation method for example, for modeling a partial waveform such as a peak in a chromatogram obtained by a chromatograph device with high accuracy. It is possible to obtain the model function and the shape parameters of the model function, for example, distribution information such as the tailing degree of the peak and the peak width with high accuracy.
  • the model function and parameter distribution information obtained in this way for peak detection for example, the peak observed in the chromatogram or the like to be analyzed can be detected more accurately.
  • the position of the peak obtained from the chromatogram to be analyzed or the range of error of the peak feature value such as the area value and the height value can be reasonably calculated. be able to. Thereby, for example, it is possible to accurately evaluate whether or not the characteristic value of the peak obtained by another waveform processing method is appropriate.
  • the hostile learning unit In the waveform information estimation device according to the item 9, the hostile learning unit generates a partial function representing a distortion element when the partial waveform is approximated by a predetermined function, and uses the partial function. By introducing it into the predetermined function and using the parameter on the horizontal axis of the signal waveform as an argument of the function, a process of outputting a fake waveform to be compared with the input partial waveform shall be performed. Can be done.
  • the generative model In a general GAN, the generative model generates a function for creating fake data that resembles the real data described above, but the waveform information estimation method according to the second item and the waveform information estimation according to the tenth item.
  • the generative model In the device, the generative model generates a partial function that represents only the distortion element when the partial waveform is approximated by a predetermined function, not the data itself that represents the partial waveform. That is, this partial function does not create the partial waveform itself, but is a function that expresses the distortion when trying to approximate the partial waveform with, for example, a Gaussian function.
  • the partial function representing the distortion element is a function whose intensity fluctuation is significantly smaller than the function representing the original partial waveform itself
  • the learning of the generative model in GAN etc. should be performed by expanding the minute intensity fluctuation. become. Therefore, it is possible to learn with higher accuracy than when learning the partial waveform itself, and it is possible to improve the calculation accuracy of the model function and the distribution of the shape parameters of the model function.
  • the partial waveform is a peak waveform
  • the distortion element is a function of distortion with respect to the parameters on the horizontal axis of the peak waveform. Can be done.
  • the partial waveform is a peak waveform
  • the distortion element is a function of distortion with respect to the parameters on the horizontal axis of the peak waveform. Can be.
  • the partial waveform is the peak waveform extracted from the chromatogram
  • the parameter on the horizontal axis is time, so that the partial function is a time distortion function. Is.
  • the parameter on the horizontal axis can be time.
  • waveform information estimation method described in the fourth item and the waveform information estimation device described in the twelfth item highly accurate waveform information such as a model function for a peak on a chromatogram and a distribution of its shape parameters can be obtained. be able to.
  • the invention according to paragraph 5 is a peak waveform processing method using the waveform information estimation method according to any one of paragraphs 1 to 4.
  • the partial waveform is a peak waveform.
  • the model waveform generation step of generating a peak model waveform by using the model function obtained in the hostile learning step is further executed, and the peak detection of the target signal waveform is performed by using the peak model waveform. can do.
  • the invention according to paragraph 13 is a peak waveform processing device using the waveform information estimation device according to any one of paragraphs 9 to 12.
  • the partial waveform is a peak waveform.
  • a model waveform generation unit that generates a peak model waveform using the model function obtained by the hostile learning unit is further provided, and peak detection for a target signal waveform is performed using the peak model waveform. be able to.
  • peak detection can be performed accurately by using a highly accurate model function. Further, since the peak feature value such as the peak height value and the area value can be obtained with high accuracy, for example, the quantification accuracy of the target component can be improved.
  • the invention according to paragraph 6 is a peak waveform processing method using the waveform information estimation method according to any one of paragraphs 1 to 4.
  • the partial waveform is a peak waveform.
  • Using the model function obtained in the hostile learning step it is possible to further execute a processing step of performing waveform processing for separating a plurality of overlapping peaks in a target signal waveform.
  • the invention according to paragraph 14 is a peak waveform processing apparatus using the waveform information estimation apparatus according to any one of paragraphs 9 to 12.
  • the partial waveform is a peak waveform. It is possible to provide a waveform processing unit that performs waveform processing for separating a plurality of overlapping peaks in a target signal waveform by using the model function obtained by the hostile learning unit.
  • a plurality of overlapping peaks are accurately separated by using a highly accurate model function, and then each of them is used.
  • Peak feature values such as peak height value and area value can be obtained with high accuracy.
  • a feature value estimation step for obtaining a predetermined feature value for each detected or separated peak may be further executed. can.
  • the peak waveform processing apparatus may further include a feature value estimation unit for obtaining a predetermined feature value for each detected or separated peak. ..
  • the peak waveform processing method according to the seventh item and the peak waveform processing apparatus according to the fifteenth item, it is possible to perform accurate quantitative analysis based on, for example, a chromatogram or a spectrum.
  • the peak waveform processing method according to item 8 and the peak waveform processing apparatus according to item 16 for example, when detecting a peak in a chromatogram or obtaining a peak feature amount such as an area value by using Bayesian estimation.
  • the distribution information of the shape of the above model function is used. Therefore, the peak can be accurately detected and separated, and the peak feature amount such as the peak area value can be obtained with high accuracy. As a result, the qualitative accuracy and the quantification accuracy can be improved.

Landscapes

  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

本発明の一態様による波形情報推定装置は、所定の分析装置を用いた実測に基く信号波形から、モデル化対象である部分波形を抽出する波形抽出部(31)と、波形抽出部により得られた部分波形を入力とし、生成モデルと識別モデルという互いに敵対する二つのモデルを用いた敵対的学習を実行することで、前記部分波形に対応するモデル関数、又は、該モデル関数及び該関数における形状の分布情報を取得する敵対的学習部(32)と、を備える。本発明によれば、精度の高いピークモデル関数とその形状パラメーターの分布情報とを取得することができる。

Description

波形情報推定方法及び装置、並びに、ピーク波形処理方法及び装置
 本発明は、各種の分析装置や計測装置で得られる信号波形に関する情報を推定する方法及び装置、並びに、該方法及び装置を用いたピーク波形処理方法及び装置に関する。なお、本明細書において「信号波形」とは、分析や計測によって得られる波形そのもののほかに、分析や計測によって得られた信号を処理することで作成された波形も含むものとする。
 液体クロマトグラフ(LC)装置やガスクロマトグラフ(GC)装置では、試料に対するクロマトグラフ分析を実施することで、該試料に含まれる成分(一般には化合物)に対応するピークが観測されるクロマトグラムを取得する。クロマトグラムにおいて観測されるピークの位置(保持時間)は試料中の成分の種類に対応しているため、そのピーク位置から成分を特定する、つまり定性することができる。また、クロマトグラムにおいて観測されるピークの面積値や高さ値はそのピークに対応する成分の含有量や濃度に対応しているため、その面積値や高さ値から当該成分を定量することができる。そのため、クロマトグラムに基く定性や定量の精度を向上させるには、クロマトグラムに現れるピークのピークトップの位置やピークの面積値又は高さ値を精度良く求めることが重要である。
 一般にクロマトグラム上のピーク波形は、理想的にはガウス分布に従った形状である。しかしながら、実際に得られるクロマトグラム上のピークには、様々な要因によりリーディングやテーリングが生じる。また、ベースラインがドリフトしている場合もあるし、分離が不十分であるために、異なる成分に由来する複数のピークが重なっている場合も多い。このような様々な状況において、ピークを的確に検出するとともにピークの面積値や高さ値を精度良く求めることは容易ではなく、従来、ピーク検出のための様々な手法やアルゴリズムが利用されている。
 例えば非特許文献1には、与えられたクロマトグラムに対し適宜のベースライン補正線を設定するとともに、該ベースライン補正線に基いて、重なっているピークを適宜に分離し、分離した各ピークの面積の積算値を計算する波形処理方法が開示されている。
 また、特許文献1には、予め用意しておいたモデル関数をクロマトグラム上のピーク波形にフィッティングし、その結果に基いてピークの面積値や高さ値などの特徴量を算出する方法が記載されている。
 こうしたモデル関数をフィッティングする手法はピーク状波形ではない様々な観測波形にも利用されている。例えばクロマトグラムに基く定量分析では、ピーク面積値と物質の濃度(又は含有量)との関係を示す検量線が使用されるが、こうした検量線を多項式や指数関数として最小二乗フィッティングを行うことがしばしばある。また、医薬品の安定性試験や薬物動態試験では、目的物質の分解能の時間的な変化や代謝物の時間的な変化を観察することが行われるが、こうした場合にも滑らかに変動する観測波形にモデル関数を当てはめて、そのうえで統計解析を実行する。
 一般に、非特許文献1に開示されているような古典的なピーク検出法は、ノイズが比較的微少であることや、信号が定常的であることなど、波形の状態が比較的良好であることを前提としている。そのため、こうした条件を満たさない場合には的確なピーク検出が行えないことも多く、一般的には、モデル関数のフィッティングを利用した方法のほうが、より正確なピーク検出が可能である。
国際公開第2016/035167号
「ピーク波形処理を確認しましょう」、[online]、株式会社島津製作所、[2019年12月2日検索]、インターネット<URL:http://www.an.shimadzu.co.jp/hplc/support/lib/lctalk/23/23lab.htm> Alec Radford、ほか2名、「Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks」、[online]、[2019年12月2日検索]、インターネット<URL : https://arxiv.org/abs/1511.06434> Ian J. Goodfellow、ほか7名、「Generative Adversarial Nets」、[online]、[2019年12月2日検索]、インターネット<URL : https://arxiv.org/pdf/1406.2661.pdf>
 上述した特許文献1に記載のような、モデル関数のフィッティングを利用したピーク検出法をクロマトグラムに適用する場合、モデル関数としてEMG(Exponential Modified Gaussian)関数がしばしば用いられる。その理由は、クロマトグラムにおけるピーク波形は理想的にはガウス波形に近いものの、実際にはテーリングのために非対称波形になることが多いためである。しかしながら、こうしたテーリングを考慮して補正されたモデル関数を用いても、ピークの裾部の形状まで厳密に一致するようなフィッティングを行うことは難しく、ピークの形状誤差が生じがちである。
 フィッティングによるピーク波形形状の一致度合いを向上させるには、モデル関数を規定するパラメーター、つまり形状パラメーターを増やすことが有効である。しかしながら、パラメーターの数が増えるほどモデル関数を表す式は劣問題に近づき、ノイズの影響を受け易くなる。これは、本来であれば、追加される形状補正のためのパラメーター群はEMG関数のテーリングパラメーターなどと密接に連携して特定の範囲(分布)に収まるべきであるものの、こうした計算には多大な労力と時間とが掛かるため、そのような精緻なモデル関数を設計することは実用的でないこと、が主たる原因である。
 観測対象であるピークが単一成分由来のピークである場合には、上述した要因によるピークの形状誤差がピーク面積値に与える影響は小さい。しかしながら、異なる成分に由来する複数のビークが重なっており、これを分離する必要がある場合には、ピークの形状誤差が各ピークの面積値に大きな影響を与えることがある。機器分析の分野では、近年、試料中の多成分を一斉に分析することが求められており、クロマトグラフ分析のみで多成分を完全に分離するのが難しいのはもちろんのこと、クロマトグラフと質量分析とを組み合わせたとしても複数の成分を完全に分離できない場合もある。そのため、モデル関数のフィッティングを利用してピーク面積値等を取得する際に、形状パラメーターを増やすことなくピークの形状誤差を抑えることは、成分の定量性能を改善するうえで重要である。
 本発明はこうした課題を解決するために成されたものであり、その主たる目的は、多大な労力や時間を掛けることなく、ピーク検出やピーク特徴値の抽出等に利用されるモデル関数について、パラメーターの増加を抑えながらその精度を向上させることができる波形情報推定方法及び装置を提供することである。
 また本発明の他の目的は、そうした波形情報推定方法及び装置を利用することで、クロマトグラムやスペクトルにおいて観測されるピークを正確に検出したり、重なっているピークを精度良く分離したり、検出したピークについての精度の良い特徴値を算出したりすることができるピーク波形処理方法及び装置を提供することである。
 上記課題の一つを解決するために成された本発明に係る波形情報推定方法の一態様は、信号波形についての波形情報を推定する方法であって、コンピューターを用い、
 所定の分析装置を用いた実測に基く信号波形から、モデル化対象である部分波形を抽出する波形抽出ステップと、
 前記波形抽出ステップにおいて得られた部分波形を入力とし、生成モデルと識別モデルという互いに敵対する二つのモデルを用いた敵対的学習を実行することで、前記部分波形に対応するモデル関数、又は、該モデル関数及び該関数における形状の分布情報を取得する敵対的学習ステップと、
 を実行するものである。
 また上記課題の一つを解決するために成された本発明に係る波形情報推定装置の一態様は、本発明に係る上記態様の波形情報推定方法を実施するための装置であり、
 所定の分析装置を用いた実測に基く信号波形から、モデル化対象である部分波形を抽出する波形抽出部と、
 前記波形抽出部により得られた部分波形を入力とし、生成モデルと識別モデルという互いに敵対する二つのモデルを用いた敵対的学習を実行することで、前記部分波形に対応するモデル関数、又は、該モデル関数及び該関数における形状の分布情報を取得する敵対的学習部と、
 を備えるものである。
 また上記課題の一つを解決するために成された本発明に係るピーク波形処理方法の一態様は、上記態様の波形情報推定方法を用いたピーク波形処理方法であって、
 前記部分波形はピーク波形であり、
 前記敵対的学習ステップにおいて得られたモデル関数を利用してピークモデル波形を生成するモデル波形生成ステップ、をさらに実行し、前記ピークモデル波形を利用して目的の信号波形に対するピーク検出を行うものである。
 また本発明に係るピーク波形処理方法の他の態様は、上記態様の波形情報推定方法を用いたピーク波形処理方法であって、
 前記部分波形はピーク波形であり、
 前記敵対的学習ステップにおいて得られたモデル関数を利用して、目的の信号波形において重なっている複数のピークを分離する波形処理を行う処理ステップ、をさらに実行するものである。
 また上記課題の一つを解決するために成された本発明に係るピーク波形処理装置の一態様は、上記態様の波形情報推定装置を用いたピーク波形処理装置であって、
 前記部分波形はピーク波形であり、
 前記敵対的学習部により得られたモデル関数を利用してピークモデル波形を生成するモデル波形生成部、をさらに備え、前記ピークモデル波形を利用して目的の信号波形に対するピーク検出を行うものである。
 また本発明に係るピーク波形処理装置の他の態様は、上記態様の波形情報推定装置を用いたピーク波形処理装置であって、
 前記部分波形はピーク波形であり、
 前記敵対的学習部により得られたモデル関数を利用して、目的の信号波形において重なっている複数のピークを分離する波形処理を行う波形処理部、をさらに備えるものである。
 本発明において、分析装置における分析や計測の手法は問わないが、典型的には、クロマトグラフ装置、質量分析装置、核磁気共鳴装置、光学分析装置、X線分析装置など、試料中の成分(化合物や元素など)に対応するピークが観測される信号波形を取得可能な装置とすることができる。また、必ずしもピークが観測される信号波形でなくても、特徴的な波形が観測されるものであればよい。また、分析装置における分析や計測により直接得られる信号波形に限らず、分析結果や計測結果に基いて作成される検量線などもここでいう信号波形に含めることができる。
 本発明に係る上記態様の波形情報推定方法及び装置では、例えば、非特許文献2、3等に開示されている、機械学習の一手法である敵対的生成ネットワーク(Generative Adversarial Network:以下「GAN」と称す)を利用して、信号波形から抽出される部分波形に対応するモデル関数と、そのモデル関数の変動(ばらつき)に関する分布(確率分布)情報を取得することができる。GANによる学習の際には、例えばクロマトグラフ装置で実際に試料を分析することで得られたクロマトグラムから抽出されたピーク波形を本物のデータとして与える。
 分析装置の種類は同じであっても、分析対象である試料の種類、或いは試料に含まれる成分の種類(カテゴリーなど)によって信号波形の形状が大きく相違する場合がある。そうした、形状が大きく異なる複数の信号波形を本物のデータとしてGANによる学習に供しても、学習が適切に行われず、目的とする精度の高い生成モデルを得ることは難しい。したがって、試料の種類等を限らない汎用的な分析ではなく、試料の種類や成分の種類、分析の目的、適用分野などを或る程度限定することで、波形形状の傾向が近い、つまりは波形形状が或る程度揃っている部分波形を本物のデータとしたGANの学習を実行するとよい。
 なお、敵対的学習は必ずしもニューラルネットワークを用いたGAN(ここでいうGANはGANの基本構造を有する広義のGANであり、WGAN(=Wasserstein GAN)、WGAN-gpなどの様々な改良版を含む)である必要はなく、ニューラルネットワークに代えて、学習対象のデータに基て該データの分布を近似できる関数を出力するアルゴリズムを用いてもよい。
 本発明に係る上記態様の波形情報推定方法及び装置によれば、例えば、クロマトグラフ装置で得られるクロマトグラムにおけるピーク等の部分波形を高い精度でモデル化するためのモデル関数や、そのモデル関数の波形形状の分布の情報を、高い精度で以て取得することができる。
 また本発明に係る一態様のピーク波形処理方法及び装置によれば、上述したように得られた精度の高いモデル関数や波形分布情報をピーク検出に利用することで、解析対象であるクロマトグラム等において観測されるピークをより的確に検出することができる。また、本発明に係る他の態様のピーク波形処理方法及び装置によれば、クロマトグラムやスペクトル上で複数のピークが重なっている場合でも、それらピークを高い確度で分離することができる。また、そうして検出したピーク、或いは分離されたピークの面積値や高さ値などのピーク特徴値を精度良く求めることができる。それによって、試料中の成分の定量精度を向上させることができる。
 また、モデル関数やその関数の波形分布情報が判明していることで、解析対象であるクロマトグラムから求まるピークの面積値や高さ値などのピーク特徴値が採り得る誤差の範囲を合理的に算出することができる。それによって、例えば、他の波形処理法によって得られたピークの特徴値が適切であるか否か等の評価を的確に行うことができる。
本発明に係る波形情報推定装置を含むデータ解析装置を備えたLC装置の一実施形態の概略構成図。 本発明に係る波形情報推定装置の一実施形態の機能ブロック構成図。 図2に示した波形情報推定装置における敵対的学習実行部の機能ブロック構成図。 図3中の生成器におけるネットワーク構成例を示す図。 GANの入力データ(本物の波形データ)の一例を示す図。 GANの出力データ(偽波形データ)の一例を示す図。 検量線を対象としたときのGANの入力データ(本物データ)の一例を示す図。 検量線を対象としたときのGANの出力データ(偽データ)の一例を示す図。
 以下、本発明の一実施形態である波形情報推定装置を利用したデータ解析装置について、添付図面を参照して説明する。
 以下の例では、解析対象の信号波形はクロマトグラム波形であり、データ解析によって、クロマトグラム上で観測されるピークを検出するとともに該ピークのピークトップの位置(保持時間)及びピーク面積値(又は高さ値)を求めるものとする。
 [一実施形態のLC装置の全体構成及び概略動作]
 図1は、本発明に係る波形情報推定装置を含むデータ解析装置を備えたLC装置の一実施形態の全体構成図である。
 図1において、測定部10は、移動相容器11と、移動相を吸引して略一定の流速(又は流量)で送給するポンプ12と、移動相中に試料液を注入するインジェクター13と、試料液に含まれる成分を保持時間に応じて分離するカラム14と、カラム14から溶出する溶出液中の成分を検出する検出器15と、を含む。検出器15としては例えば、フォトダイオードアレイ(PDA)検出器等の光学検出器や質量分析装置などを用いることができる。
 データ解析部20は、検出器15から出力される検出信号をデジタル化して処理する機能を有し、データ収集部21、ピーク検出処理部22、定性・定量解析部23などの機能ブロックを含む。ピーク検出処理部22は、事前情報記憶部221、ベイズ推定処理部222、ピーク特徴値決定部223などの機能ブロックを含む。このデータ解析部20には、ユーザーインターフェイスとしての入力部24と表示部25とが接続されている。
 データ解析部20の実体は汎用のコンピューターであり、該コンピューターにインストールされた専用のソフトウェア(コンピュータープログラム)を該コンピューターで実行することにより、図1に示したような各機能ブロックの機能が達成される。もちろん、こうした機能ブロックにおける機能の一部を専用のハードウェア回路等で達成することも可能である。
 このLC装置においてポンプ12は、移動相容器11に貯留されている移動相を吸引し、略一定流速で以てカラム14に送給する。インジェクター13は、図示しない制御部からの指示に応じた所定のタイミングで、予め用意されている試料液を所定量だけ移動相中に注入する。注入された試料液は移動相の流れに乗ってカラム14に導入され、試料液に含まれる各種の成分はカラム14を通過する間に時間方向に分離されて溶出する。検出器15は溶出液に含まれる成分を検出し、その成分の量に応じた強度の検出信号を時々刻々と出力する。
 データ解析部20においてデータ収集部21は、上記検出信号を所定時間間隔でサンプリングしてデジタルデータに変換し記憶装置に記憶する。この記憶されるデータがクロマトグラム波形を構成するデータ(クロマトグラムデータ)であり、検出器15において検出された成分はクロマトグラム上でピークとして観測される。ピーク検出処理部22はクロマトグラムデータを受けて有意なピークを検出し、検出したピークのピークトップの位置(時間)とピークの面積値(又は高さ値)を求める。定性・定量解析部23は、クロマトグラム上の各ピークの位置の情報から成分を特定するとともに、予め作成された検量線を利用して、ピーク面積値(又は高さ値)から各成分の含有量を算出する。つまり、定性・定量解析部23は試料に含まれる各成分の定性と定量とを実施し、その結果を表示部25に出力する。
 [ピーク検出方法及びピーク特徴値の算出方法]
 本実施形態のLC装置では、解析対象であるクロマトグラムに現れているピークを検出しその特徴値としてのピーク面積値を得るために、ベイズ推定に基くピークフィッティングを利用している。
 クロマトグラムにおいて試料中の成分に対応するピーク波形は、形状パラメーターZと保持時間tとを引数にとる関数f(t,Z)で表すことができる。ここで、形状パラメーターZは例えば、ピークの幅や裾部の広がり方に関連する又は関連すると推測されるパラメーターである。よく知られているように、ベイズ推定では、或る関数のパラメーターの事前分布と実際のデータとから事後分布を推定することができる。いま、ピークモデル関数f(t,Z)と該形状パラメーターZの確率分布の両方が既知であれば、ベイズ推定を用いることで、観測波形として或るクロマトグラム波形Dが与えられたときの事後確率p(Z|D)は、上記モデル関数に関連する確率p(D|Z)と形状パラメーターZの確率p(Z)とから求まる。確率p(D|Z)は、ピークモデル関数f(t,Z)に例えば標準偏差σの正規ノイズが乗ると仮定すれば、p(D|Z)=N(f(t,Z),σ)で与えることができる。但し、関数Nは正規分布である。
 このようにしてベイズ推定によってパラメーターZの確率分布である事後分布が求まれば、その事後分布から、ピークモデル関数f(t,Z0)の形状の確率分布を得ることができる。即ち、クロマトグラム波形D上で観測されるピーク波形に対して、フィッティングが適切になされる波形形状を示すピークモデル関数が確率的に求まる。したがって、例えば或る波形形状を示す関数の確率が顕著に高ければ、その波形形状が、与えられたクロマトグラム上のピーク波形を表している、と判断することができる。さらに、その関数f(t,Z0)に基いて、ピークの面積値、高さ値、或いはピーク位置などの、所望のピーク特徴値を算出することができる。
 また、ピークモデル関数f(t,Z0)の形状の確率分布から、クロマトグラム上のピークの面積値や高さ値等のピーク特徴値の確率分布を算出することもできる。それにより、例えば確率分布の信用区間を95%として、ピーク面積や高さ、或いは位置などが採り得る値の範囲などを求めることもできる。
 なお、特許文献1に示されているように、近接して存在している複数のピークの裾部が重なっている状況においても、複数のピークが存在していることを前提とした混合分布を組み込んだベイズ推定を行うことによって、各ピークを分離してそれぞれのピーク特徴値を求めることができる。
 [モデル関数及び波形分布情報の算出方法]
 上述したように、ベイズ推定によるフィッティングの手法をピーク波形に対して適用するためには、ピークモデル関数とその関数における形状パラメーターの分布(事前分布)とが必要である。一般的には、ピーク波形に対するモデル関数としてはガウス関数やEMG関数などが用いられる。それに対し、ここでは、こうした明示的なモデル関数を用いること無く、ピーク波形を表す関数自体とその関数が持ちうる形状の分布(形状パラメーターの分布)とを同時に学習する機械学習の手法を利用して、クロマトグラフ装置の種類・方式やその分析の適用分野の特性等に応じたピークモデル関数とその関数のパラメーター分布情報とを推定する。
 図2は、ピークモデル関数とパラメーター分布情報とを推定するための波形情報推定装置の一実施形態の概略構成図である。この装置は、実測データ入力部30、ピーク波形抽出部31、敵対的学習実行部32、ピークモデル関数決定部33などの機能ブロックを含む。この装置の実体はコンピューターであり、コンピューターにインストールされた所定のプログラム(ソフトウェア)を実行することで、図2に示した各機能ブロックが具現化される。
 図3は、図2中の敵対的学習実行部32で使用されるGANの機能ブロック構成図である。なお、図2及び図3に示した装置は図1に示したLC装置のデータ解析部20に含まれるようにしてもよい。つまり、LC装置のデータ解析用コンピューターで上記機能が達成されるようにしてもよいが、上記機能を達成する手段はデータ解析部20とは別体であってもよい。
 図2及び図3に示す波形情報推定装置では、GANによる敵対的学習の際の本物データとして、実測により得られたクロマトグラム波形を用いる。即ち、図1に示したLC装置の測定部10又はこれと同等のLC装置を用い、実際に試料を測定することで取得されたクロマトグラム波形を本物データとして利用する。
 但し、一般的に、クロマトグラム上のピーク波形と言っても、試料の種類つまりは成分の種類、解析の適用分野や目的、LC分離条件等によって、ピーク波形の形状に大きな差異が生じる。そうした形状に大きな差異がある複数のピーク波形、例えば、テーリングが大きい傾向にあるピーク波形とテーリングが殆ど現れない傾向にあるピーク波形とのいずれをも解析の対象としようとすると、ピークモデル関数の分布の幅が広すぎて該関数の精度が低下する、或いは、パラメーターの分布が広がりすぎる、といった問題が生じる。そこで、解析の適用分野などを絞ることによって、こうした問題を回避することができる。具体的には、ここでは、解析対象の分野を生体由来の代謝物の解析に限定する。即ち、試料は生体試料であり、試料中の成分は代謝物である。もちろん、これは一例であって、様々な試料、成分、或いは解析目的について、ここで述べるような手法を適用することができる。
 図2に示す波形情報推定装置において、実測データ入力部30は、実測により得られた多数のクロマトグラムデータを読み込む。ピーク波形抽出部31は、入力された各クロマトグラムデータに対し、例えばSN比が極端に低いピークや分離が不十分であるピークなどを除去し、波形形状が良好であるピークを抽出する処理を行う。そして、ピーク波形抽出部31は、抽出したピークについて、テーリング(又はリーディング)度合いやピーク幅といった所定のピーク形状パラメーターを求める。なお、例えば保持時間とピーク幅とに比例関係があるといったパラメーター間の相関が予測できる場合には、後述する学習が容易に行われるようにするために、予めピーク幅を保持時間で正規化するといったパラメーター間の相関を弱める正規化処理を事前に行うようにすることができる。
 上記のようにしてピーク波形抽出部31は、多数の単一ピークのピーク形状パラメーターを取得する。敵対的学習実行部32は、良好な波形形状を有する単一ピークのピーク形状パラメーターを本物データとしたGANによる学習を実施する。
 図3に示すように、敵対的学習実行部32は、ランダムノイズ発生部40、生成器41、データ選択部44、識別器45、判定部46、及び更新処理部47、を含む。生成器41は、時間歪関数生成部411と、時間入力部412と、ガウス関数演算部413と、を含む。ここでは、生成器41における時間歪関数生成部411、及び識別器45にはいずれも、非特許文献2、3に記載されているようなニューラルネットワークを用いる。
 一般的なGANの考え方では、生成器が本物データに似せた偽のデータを生成し、識別器はその偽のデータと本物データとを交互に識別する。即ち、生成器はピーク波形そのもののパラメーターを学習する。これに対し、本実施形態における敵対的学習実行部32で用いられるGANにおけるアルゴリズムには、次のような改良が加えられている。
 既に述べたように、クロマトグラム上のピーク波形は理想的にはガウス関数に従った形状であるが、実際には様々な要因によってガウス波形形状からのずれが生じる。そこで、このずれを時間的な歪みを表す時間歪関数s(t,Z)として定義し、生成器41において時間歪関数生成部411は、ニューラルネットワークによって、この時間歪関数s(t,Z)を生成する。時間入力部412は、クロマトグラムの横軸のパラメーターである時間tに時間歪関数s(t,Z)を加算してガウス関数演算部413に引き渡す。ガウス関数演算部413は、t+s(t,Z)を引数とするガウス関数の演算を行い、時間歪要素を含むガウス関数Gauss(t+s(t,Z))に従った波形を出力する。
 但し、時間歪関数s(t,Z)や元のピーク波形を表す関数f(t,Z)は時間tに関する連続関数であるのに対し、測定によって得られる実測データはサンプリング時間毎に観測された離散的なデータの集合である。そのため、そうした関数を直接的にGANの生成器41に利用することはできない。そこで、ここでは、連続関数である時間歪関数s(t,Z)の代わりに、実測データの各サンプリング時刻を示すベクトルTを用いた離散的な時間歪関数s(T,Z)を、時間歪関数生成部411により生成された関数として出力する。
 即ち、学習実行時に、時間歪関数生成部411はニューラルネットワークにより、ランダムノイズ発生部40から入力されるノイズに基いて時間歪関数s(T,Z)を作成する。時間入力部412は、与えられた本物データのベクトルサイズと同じサイズである、時刻tに対応するベクトルTと、時間歪関数生成部411から出力された離散的な時間歪関数s(T,Z)とを加算する。これを受けてガウス関数演算部413は、ガウス関数Gauss(T+s(T,Z))に従った波形、つまりは偽のピーク波形を生成する。このときに出力される偽の波形データは、学習対象である本物の波形ベクトルと同じサイズである。
 データ選択部44は、生成器41から出力される偽の波形データと上記本物の波形データとを交互に切り替えて識別器45に入力する。識別器45は、入力されたデータが本物であるか否かを識別し、判定部46はその識別結果が正しいか否か、つまり、本物データが識別器45に入力されたときにはそれが本物であると識別したか否か、一方、偽データが識別器45に入力されたときにはそれが偽物であると識別したか否か、を判定する。
 更新処理部47は判定部46による判定結果に基いて、偽データが本物データに近づくように、時間歪関数生成部411におけるニューラルネットワークの係数を更新する。また併せて、識別器45の識別性能が向上するように、該識別器45におけるニューラルネットワークの係数を更新する。周知のように、GANでは、このように生成器41と識別器45とを競わせながら、それぞれの性能が向上するように学習を実行する。
 上述したようなGANにおける学習によって、生成器41は本物のピーク波形にきわめて近い偽のピーク波形を生成するようになり、その学習の過程で、そのピーク波形を近似するピークモデル関数とその関数のパラメーターの分布(つまりは波形形状の確率分布)情報とが得られる。ピークモデル関数決定部33は、敵対的学習実行部32が上述したようなGANにおける学習を実施した結果に基いて、ピーク波形形状を表すピークモデル関数とその形状パラメーターの分布とを決定する。
 本実施形態の波形情報推定装置における生成器41では、時間歪関数生成部411で生成される関数を微小な時間歪みに限定し、該関数を組み込んだGauss(T+s(T,Z))をピークモデル関数として用いている。これによって、クロマトグラム上のピーク波形全体ではなく、クロマトグラム上のピーク波形をガウス関数で近似したときの微小な時間歪みの部分のみをGANの学習によって生成すればよいため、精度の高い学習が容易に行える。
 GANにおいて形状パラメーターZの分布は確率分布である。したがって、この形状パラメーターZの分布は、そのままベイズ推定の際の事前分布として用いることができる。そのため、ピークモデル関数f(t,Z)の分布自体は明に記述する必要はなく、ベイズ推定を行う際には、確率変数Zを単純に変換する関数f(t,Z)が存在するとして推論を行うことができる。
 図4は、図3中の生成器41の時間歪関数生成部411におけるネットワーク構成の一例を示す図である。図示するように、この例では、時間歪関数生成部411は、ランダムノイズ発生部40から与えられる乱数ベクトルZとスカラー値である時間tとを結合して一つのベクトルとして受け取る。そして、このベクトルをフルコネクト(FC)層及び活性化関数のネットワークに適用する。通常、ピークのテーリングはパラメーターtに直接的に強く影響を受けるため、この例では、最初の層の入力を以降の各層の入力に加えている。但し、この構成に限らず、自由なニューラルネットワークの構成を時間歪関数生成部411として使用できることは当然である。
 一方、識別器45としては一般的なニューラルネットワークを用いても構わないが、ここでは、ガウス関数のような釣り鐘形状の波形をよりよく捉えられるように、一次元コンボリューション層と線形結合層とを持つニューラルネットワークを用いる。
 また、より好ましくは、s(t,Z)≒tで示される分布となるように、関数s(t,Z)のネットワークにスキップドコネクション(スキップ接続)を用いるか、或いは、s(t,Z)=t+s’(t,Z)として、s’(t,Z)が0付近の値を適切な幅でとるようにネットワーク重みのパラメーターの初期値分布を調整するとよい。
 また、釣り鐘状関数の裾が重いなどの、強度に対して略一様に掛かる歪みがある場合も考えられる。その場合には、強度補正ニューラルネットワーク関数i(y)を使用し、生成器41として関数i(Gauss(s(t,Z))を用いることも有用である。この関数iのネットワーク構成も関数sと同様に、図4に示したものと同様のネットワーク構成で記述することができる。
 また上記説明において、敵対的学習実行部32の本質的な目的はデータ点群の分布に一致する分布を学習することであり、上記例ではその学習の手法としてGANを用いている。非特許文献2、3に示されているように、GANではニューラルネットワークを使用するのが一般的であるが、非特許文献3の記載からも明らかであるように、ニューラルネットワークに代えて、微分(勾配)を用いて関数を最適化できる適宜のアルゴリズムを使用することができる。また、ここでは、観測波形Dと形状パラメーターZとから生成される関数fの分布に対する類似度としてKL(Kullback-Leibler)距離を利用しているが、KL距離以外にも、JS(Jensen-Shannon)距離やWasserstein距離などの、分布の一致度合いを評価する様々な指標を用いることができる。
 また、ピーク波形のリーディング及びテーリングの形状を考えると、時間歪関数s(t,Z)には単調性を仮定するのが妥当である。そこで、単調性を組み込んだニューラルネットワークを用いてもよい。
 例えば(t,Z)を引数として、A,a,b,c,dの値を出力するニューラルネットワークを作成する。このうちA,a,cは非負である。非負の出力を持つニューラルネットワークは、ELU(Exponential Linear Units) 関数に1を加えたものやRELU関数などを活性化関数として用いることで作成可能である。このようにして得られた出力A,a,b,c,dを用い、s(t,Z)= c*t+d+ΣA*sigmoid(t*a+b)を計算することにより、単調性を満たした時間歪関数を作成することができる。上記例では、時間歪関数は、ct+dで示される直線に複数のシグモイド関数の合成による変曲点が存在しているというモデルになる。
 図5は、GANによる学習の際に使用する本物のピーク波形データの一部を示す図である。一方、図6は、生成器41により生成される偽のピーク波形データの一部を示す図である。図5及び図6はいずれも、ランダムに複数本の波形を重ね書きしたものである。これらを比較すれば分かるように、GANにおける学習によって、本物のピーク波形データにきわめて近い(実質的には区別できない)偽のピーク波形データを出力可能な生成モデルを得ることができる。
 上述したような処理によって、実測のクロマトグラフ上で観測されるピーク波形に基いて該波形を模擬的に生成する生成モデル、つまりはピークモデル関数と形状パラメーターの分布情報とを取得することができる。これらデータを図1に示した装置における事前情報記憶部221に格納しておき、ベイズ推定処理部222におけるベイズ推定の際の事前分布として用いることで、ピーク検出処理部22は、ピークを精度良く検出するとともにピーク定量値などのピーク特徴値をより正確に計算することができる。
 即ち、ベイズ推定を利用したパラメーター推論の際には、対象となる観測波形データD0に対して、形状パラメーターZの事後分布Z0が得られる。こうして得られた推論済みの事後分布Z0をサンプリングすることによって、具体的なピーク形状のサンプルGauss(T+f(T,Z0))の形状が得られるので、その形状を元にしてピーク面積値などの所望のピーク特徴値の分布を算出すればよい。上述したような機械学習によって得られるf(t,Z)はEMG関数等と同様のtを引数とする関数であるため、ベイズ推定によるパラメーターZの分布や関数fの事後予測分布が使用できるといったモデル関数の利点をそのまま有しており、ベイズ推定に容易に適用することができる。
 実用的には、隣接するピークの裾部同士が重なった混合ピーク等を扱う必要がある場合が多いが、LC装置、GC装置等の多くの分析装置では、分析における線形性が確保されているものとみなせる。そのため、解析対象がクロマトグラム波形である場合、混合ピークの信号値は複数の単一ピークに対応する信号値を単純に加算したものである、としても構わない。また、ベイズ推定のためには、ピークの幅や裾部の広がり度合いなどの情報のほかに、ピークの位置や高さ等の分布の情報も必要であるものの、クロマトグラムの場合にはそれらパラメーターの分布をそれぞれ独立に考えるのが一般的であり、ピーク幅等の形状パラメーターとは別に、その分布を推定することができる。したがって、複数のピークが重なっている混合分布においても、複数のピークが存在しているとの前提の下でベイズ推定を行うことによって、実質的にピークを分離し、それぞれのピーク面積などのピーク特徴値を求めることができる。
 また、本発明に係る上述した手法は、ピーク面積の算出以外にも、ピーク有無の検定、ピーク位置の推定等、のピーク特徴値の算出にも当然ながら利用可能である。また、ピークモデル関数を利用してピーク検出、ピーク分離、或いはピーク特徴値の算出を行うために、ベイズ推定以外の手法を利用してもよい。具体的には、ピーク波形のフィッテイングに頻用されている最尤推定法、最小二乗法などの、より簡易的な方法を利用してもよい。その場合でも、元のピークモデル関数が高い精度で得られているため、高い精度でのピーク検出、ピーク分離等が可能である。
 [ピーク波形解析以外への応用]
 また、上記説明では、本発明に係る手法をクロマトグラム上のピークの解析に適用したが、それ以外の波形の解析に利用することができる。例えば、ピーク面積から成分濃度(含有量)等を求める際に使用される検量線も一種の信号波形であり、検量線についても同様の解析が可能である。もちろん、通常、検量線の形状はガウス関数に従わないが、ガウス関数を用いる代わりに、関数g(t+f(t,Z),Z)を用いてモデル化することが可能である。また、薬剤反応量の変化量の時間経過等などを示す波形の解析にも本手法を適用することができる。
 図7は、検量線を模擬する生成モデルをGANによる学習により作成する際に使用する本物データの一部を示す図である。一方、図8は、これに対して生成器において生成される偽データの一部を示す図である。図7及び図8はいずれも、ランダムに複数本の波形を重ね書きしたものである。これらを比較すれば分かるように、検量線を模擬する際にも、本物データにきわめて近い(実質的には区別できない)偽データを出力可能な生成モデルを得ることができる。
 また、上記例では、時間tに関係する時間歪関数fのみをニューラルネットワークで作成して変換関数を記述したが、時間ではなく強度xに関係する関数g(x,Z)を用いて変換関数g(Gauss(T),Z)を記述することもできる。これは、時間ではなく強度に応じた歪みが発生することを想定したものであり、例えば、吸光光度計などを検出器としたLC装置において、高濃度領域で信号飽和が生じてピークトップが潰れるような場合のモデル関数を記述するのに適している。当然のことながら、関数fと関数gとを組み合わせ、g(Gauss(T+f(T,Z)),Z)と記述することもできる。
 また、上記実施形態は本発明をLC装置に適用した例であるが、LC装置やGC装置以外の様々な分析装置で得られる信号波形を処理又は解析する際に本発明を適用することができることは明らかである。
 [種々の態様]
 上述した例示的な実施形態は、以下の態様の具体例であることが当業者により理解される。
 (第1項)本発明に係る波形情報推定方法の一態様は、信号波形についての波形情報を推定する方法であって、コンピューターを用い、
 所定の分析装置を用いた実測に基く信号波形から、モデル化対象である部分波形を抽出する波形抽出ステップと、
 前記波形抽出ステップにおいて得られた部分波形を入力とし、生成モデルと識別モデルという互いに敵対する二つのモデルを用いた敵対的学習を実行することで、前記部分波形に対応するモデル関数、又は、該モデル関数及び該関数における形状の分布情報を取得する敵対的学習ステップと、
 を実行するものである。
 (第9項)本発明に係る波形情報推定装置の一態様は、
 所定の分析装置を用いた実測に基く信号波形から、モデル化対象である部分波形を抽出する波形抽出部と、
 前記波形抽出部により得られた部分波形を入力とし、生成モデルと識別モデルという互いに敵対する二つのモデルを用いた敵対的学習を実行することで、前記部分波形に対応するモデル関数、又は、該モデル関数及び該関数における形状の分布情報を取得する敵対的学習部と、
 を備えるものである。
 第1項に記載の波形情報推定方法又は第9項に記載の波形情報推定装置によれば、例えば、クロマトグラフ装置で得られるクロマトグラムにおけるピーク等の部分波形を高い精度でモデル化するためのモデル関数や、そのモデル関数の形状パラメーター、例えばピークのテーリング度合い、ピーク幅などの分布の情報とを、高い確度で以て取得することができる。
 こうして得られたモデル関数やパラメーター分布の情報を例えばピーク検出に利用することで、解析対象であるクロマトグラム等において観測されるピークをより的確に検出することができる。また、そうしたピークの面積値や高さ値などのピーク特徴値の算出の精度を向上させることができる。それによって、試料中の成分の定性精度及び定量精度を向上させることができる。
 また、モデル関数及びパラメーター分布情報が判明していることで、解析対象であるクロマトグラムから求まるピークの位置、或いは面積値や高さ値などのピーク特徴値の誤差の範囲を合理的に算出することができる。それによって、例えば、他の波形処理法によって得られたピークの特徴値が適切であるか否か等の評価を的確に行うことができる。
 (第2項)第1項に記載の波形情報推定方法において、前記敵対的学習ステップでは、前記部分波形を所定の関数で近似したときの歪み要素を表す部分関数を生成し、該部分関数を前記所定の関数に導入するとともに、前記信号波形の横軸のパラメーターを該関数の引数とすることで、入力された前記部分波形と比較される偽の波形を出力する処理を行うものとすることができる。
 (第10項)第9項に記載の波形情報推定装置において、前記敵対的学習部は、前記部分波形を所定の関数で近似したときの歪み要素を表す部分関数を生成し、該部分関数を前記所定の関数に導入するとともに、前記信号波形の横軸のパラメーターを該関数の引数とすることで、入力された前記部分波形と比較される偽の波形を出力する処理を行うものとすることができる。
 一般的なGANでは、生成モデルは上記本物のデータに似せた偽のデータを作成するための関数を生成するが、第2項に記載の波形情報推定方法及び第10項に記載の波形情報推定装置において、生成モデルは、部分波形を表すデータそのものではなく、部分波形を所定の関数で近似したときの歪み要素のみを表す部分関数を生成する。つまり、この部分関数は部分波形そのものを作成するものではなく、部分波形を例えばガウス関数などで近似しようとしたときの歪みを表す関数である。そして、部分波形の横軸のパラメーターを引数とし、生成された部分関数を所定の関数に導入することで、偽の波形を示すデータを求める。この偽のデータと上記本物のデータとを識別モデルを用いて識別する。
 歪み要素を表す部分関数は元の部分波形そのものを表す関数に比べて強度の変動が大幅に小さな関数となるので、GAN等における生成モデルの学習は微小な強度変動を拡大して学習を行うことになる。そのため、部分波形そのものを学習する場合に比べて精度の高い学習が可能であり、モデル関数、及び、そのモデル関数の形状パラメーターの分布の算出精度を高めることができる。
 (第3項)第2項に記載の波形情報推定方法において、前記部分波形はピーク波形であり、前記歪み要素は、該ピーク波形の横軸のパラメーターについての歪みの関数であるものとすることができる。
 (第11項)同様に、第10項に記載の波形情報推定装置において、前記部分波形はピーク波形であり、前記歪み要素は、該ピーク波形の横軸のパラメーターについての歪みの関数であるものとすることができる。
 即ち、第3項に記載の方法及び第11項に記載の装置において、部分波形がクロマトグラムから抽出されたピーク波形である場合、横軸のパラメーターは時間であるから上記部分関数は時間歪関数である。
 (第4項、第12項)第3項に記載の波形情報推定方法、及び第11項に記載の波形情報推定装置において、前記横軸のパラメーターは時間であるものとすることができる。
 第4項に記載の波形情報推定方法及び第12項に記載の波形情報推定装置によれば、例えばクロマトグラム上のピークについてのモデル関数やその形状パラメーターの分布などの精度の高い波形情報を得ることができる。
 (第5項)第5項に記載の発明は、第1項~第4項のいずれか1項に記載の波形情報推定方法を用いたピーク波形処理方法であって、
 前記部分波形はピーク波形であり、
 前記敵対的学習ステップにおいて得られたモデル関数を利用してピークモデル波形を生成するモデル波形生成ステップ、をさらに実行し、前記ピークモデル波形を利用して目的の信号波形に対するピーク検出を行うものとすることができる。
 (第13項)第13項に記載の発明は、第9項~第12項のいずれか1項に記載の波形情報推定装置を用いたピーク波形処理装置であって、
 前記部分波形はピーク波形であり、
 前記敵対的学習部により得られたモデル関数を利用してピークモデル波形を生成するモデル波形生成部、をさらに備え、前記ピークモデル波形を利用して目的の信号波形に対するピーク検出を行うものとすることができる。
 第5項に記載のピーク波形処理方法及び第13項に記載のピーク波形処理装置によれば、精度の高いモデル関数を利用してピーク検出を正確に行うことができる。また、ピークの高さ値や面積値などのピーク特徴値を精度良く求めることができるので、例えば目的成分の定量精度を向上させることができる。
 (第6項)また第6項に記載の発明は、第1項~第4項のいずれか1項に記載の波形情報推定方法を用いたピーク波形処理方法であって、
 前記部分波形はピーク波形であり、
 前記敵対的学習ステップにおいて得られたモデル関数を利用して、目的の信号波形において重なっている複数のピークを分離する波形処理を行う処理ステップ、をさらに実行するものとすることができる。
 (第14項)同様に、第14項に記載の発明は、第9項~第12項のいずれか1項に記載の波形情報推定装置を用いたピーク波形処理装置であって、
 前記部分波形はピーク波形であり、
 前記敵対的学習部により得られたモデル関数を利用して、目的の信号波形において重なっている複数のピークを分離する波形処理を行う波形処理部、を備えるものとすることができる。
 第6項に記載のピーク波形処理方法及び第14項に記載のピーク波形処理装置によれば、精度の高いモデル関数を利用して、重なっている複数のピークを精度良く分離したうえで、各ピークの高さ値や面積値などのピーク特徴値を精度良く求めることができる。それにより、例えば、従来手法ではクロマトグラム上で分離しにくい重なったピークについても、各ピークに対応する成分についての精度の良い定量分析が可能である。
 (第7項)第5項又は第6項に記載のピーク波形処理方法において、検出された又は分離された各ピークについて所定の特徴値を求める特徴値推算ステップをさらに実行するものとすることができる。
 (第15項)第13項又は第14項に記載のピーク波形処理装置において、検出された又は分離された各ピークについて所定の特徴値を求める特徴値推算部をさらに備えるものとすることができる。
 第7項に記載のピーク波形処理方法及び第15項に記載のピーク波形処理装置によれば、例えばクロマトグラムやスペクトルに基いた精度の良い定量分析を行うことができる。
 (第8項、第16項)第5項~第7項のいずれか1項に記載のピーク波形処理方法、又は、第13項~第15項のいずれか1項に記載のピーク波形処理装置において、ピーク検出、ピークの分離、及び/又は、ピークについての所定の特徴値の推算を、ベイズ推定を用いて行うものとすることができる。
 第8項に記載のピーク波形処理方法及び第16項に記載のピーク波形処理装置では、ベイズ推定を利用して例えばクロマトグラムにおけるピークを検出したり面積値等のピーク特徴量を求めたりする際の事前分布として、上記モデル関数の形状の分布情報が用いられる。したがって、ピークを的確に検出したり分離したりすることができるとともにピーク面積値等のピーク特徴量も精度良く求めることができ、その結果、定性精度や定量精度を向上させることができる。
10…測定部
 11…移動相容器
 12…ポンプ
 13…インジェクター
 14…カラム
 15…検出器
20…データ解析部
 21…データ収集部
 22…ピーク検出処理部
  221…事前情報記憶部
  222…ベイズ推定処理部
  223…ピーク特徴値決定部
 23…定性・定量解析部
24…入力部
25…表示部
30…実測データ入力部
31…ピーク波形抽出部
32…敵対的学習実行部
33…モデル関数情報決定部
40…ランダムノイズ発生部
41…生成器
 411…時間歪関数生成部
 412…時間入力部
 413…ガウス関数演算部
44…データ選択部
45…識別器
46…判定部
47…更新処理部

Claims (16)

  1.  信号波形についての波形情報を推定する方法であって、コンピューターを用い、
     所定の分析装置を用いた実測に基く信号波形から、モデル化対象である部分波形を抽出する波形抽出ステップと、
     前記波形抽出ステップにおいて得られた部分波形を入力とし、生成モデルと識別モデルという互いに敵対する二つのモデルを用いた敵対的学習を実行することで、前記部分波形に対応するモデル関数、又は、該モデル関数及び該関数における形状の分布情報を取得する敵対的学習ステップと、
     を実行する波形情報推定方法。
  2.  前記敵対的学習ステップでは、前記部分波形を所定の関数で近似したときの歪み要素を表す部分関数を生成し、該部分関数を前記所定の関数に導入するとともに、前記信号波形の横軸のパラメーターを該関数の引数とすることで、入力された前記部分波形と比較される偽の波形を出力する処理を行う、請求項1に記載の波形情報推定方法。
  3.  前記部分波形はピーク波形であり、前記歪み要素は、該ピーク波形の横軸のパラメーターについての歪みの関数である、請求項2に記載の波形情報推定方法。
  4.  前記信号波形の横軸のパラメーターは時間である、請求項3に記載の波形情報推定方法。
  5.  前記部分波形はピーク波形であり、
     前記敵対的学習ステップにおいて得られたモデル関数を利用してピークモデル波形を生成するモデル波形生成ステップ、をさらに実行し、前記ピークモデル波形を利用して目的の信号波形に対するピーク検出を行う、請求項1に記載の波形情報推定方法を用いたピーク波形処理方法。
  6.  前記部分波形はピーク波形であり、
     前記敵対的学習ステップにおいて得られたモデル関数を利用して、目的の信号波形において重なっている複数のピークを分離する波形処理を行う処理ステップ、をさらに実行する、請求項1に記載の波形情報推定方法を用いたピーク波形処理方法。
  7.  検出された又は分離された各ピークについて所定の特徴値を求める特徴値推算ステップをさらに実行する、請求項5に記載のピーク波形処理方法。
  8.  ピーク検出、ピークの分離、及び/又は、ピークについての所定の特徴値の推算を、ベイズ推定を用いて行う、請求項5に記載のピーク波形処理方法。
  9.  所定の分析装置を用いた実測に基く信号波形から、モデル化対象である部分波形を抽出する波形抽出部と、
     前記波形抽出部により得られた部分波形を入力とし、生成モデルと識別モデルという互いに敵対する二つのモデルを用いた敵対的学習を実行することで、前記部分波形に対応するモデル関数、又は、該モデル関数及び該関数における形状の分布情報を取得する敵対的学習部と、
     を備える波形情報推定装置。
  10.  前記敵対的学習部は、前記部分波形を所定の関数で近似したときの歪み要素を表す部分関数を生成し、該部分関数を前記所定の関数に導入するとともに、前記信号波形の横軸のパラメーターを該関数の引数とすることで、入力された前記部分波形と比較される偽の波形を出力する処理を行う、請求項9に記載の波形情報推定装置。
  11.  前記部分波形はピーク波形であり、前記歪み要素は、該ピーク波形の横軸のパラメーターについての歪みの関数である、請求項10に記載の波形情報推定装置。
  12.  前記信号波形の横軸のパラメーターは時間である、請求項11に記載の波形情報推定装置。
  13.  前記部分波形はピーク波形であり、
     前記敵対的学習部により得られたモデル関数を利用してピークモデル波形を生成するモデル波形生成部、をさらに備え、前記ピークモデル波形を利用して目的の信号波形に対するピーク検出を行う、請求項9に記載の波形情報推定装置を用いたピーク波形処理装置。
  14.  前記部分波形はピーク波形であり、
     前記敵対的学習部により得られたモデル関数を利用して、目的の信号波形において重なっている複数のピークを分離する波形処理を行う波形処理部、を備える、請求項9に記載の波形情報推定装置を用いたピーク波形処理装置。
  15.  検出された又は分離された各ピークについて所定の特徴値を求める特徴値推算部をさらに備える、請求項13に記載のピーク波形処理装置。
  16.  ピーク検出、ピークの分離、及び/又は、ピークについての所定の特徴値の推算を、ベイズ推定を用いて行う、請求項13に記載のピーク波形処理装置。
PCT/JP2021/000823 2020-04-17 2021-01-13 波形情報推定方法及び装置、並びに、ピーク波形処理方法及び装置 WO2021210228A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202180028313.6A CN115398226B (zh) 2020-04-17 2021-01-13 波形信息估计方法及装置以及峰波形处理方法及装置
JP2022515206A JP7414125B2 (ja) 2020-04-17 2021-01-13 波形情報推定方法及び装置、並びに、ピーク波形処理方法及び装置
US17/918,259 US20230160862A1 (en) 2020-04-17 2021-01-13 Waveform information inference method and device, and peak waveform processing method and device

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2020-073946 2020-04-17
JP2020073946 2020-04-17

Publications (1)

Publication Number Publication Date
WO2021210228A1 true WO2021210228A1 (ja) 2021-10-21

Family

ID=78083584

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2021/000823 WO2021210228A1 (ja) 2020-04-17 2021-01-13 波形情報推定方法及び装置、並びに、ピーク波形処理方法及び装置

Country Status (4)

Country Link
US (1) US20230160862A1 (ja)
JP (1) JP7414125B2 (ja)
CN (1) CN115398226B (ja)
WO (1) WO2021210228A1 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018155412A1 (ja) * 2017-02-21 2018-08-30 日本電気株式会社 分類装置と分類方法並びにプログラム
US20190379977A1 (en) * 2018-06-07 2019-12-12 Lofelt Gmbh Systems and methods for generating haptic output for enhanced user experience
JP2020042598A (ja) * 2018-09-12 2020-03-19 国立大学法人神戸大学 生体信号データからの個体特徴分離による状態予測方法および装置
WO2020070786A1 (ja) * 2018-10-02 2020-04-09 株式会社島津製作所 識別器の生成方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107076712B (zh) * 2014-09-03 2019-01-11 株式会社岛津制作所 色谱数据处理方法以及装置
CN110197224B (zh) * 2019-05-29 2021-05-14 华南理工大学 基于特征空间深度对抗学习的空中手写字符轨迹恢复方法
CN110364186B (zh) * 2019-08-08 2021-06-25 清华大学深圳研究生院 一种基于对抗学习的端到端的跨语言语音情感识别方法
CN110580682A (zh) * 2019-09-16 2019-12-17 电子科技大学 一种基于优化生成对抗网络地震数据超分辨率重建方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018155412A1 (ja) * 2017-02-21 2018-08-30 日本電気株式会社 分類装置と分類方法並びにプログラム
US20190379977A1 (en) * 2018-06-07 2019-12-12 Lofelt Gmbh Systems and methods for generating haptic output for enhanced user experience
JP2020042598A (ja) * 2018-09-12 2020-03-19 国立大学法人神戸大学 生体信号データからの個体特徴分離による状態予測方法および装置
WO2020070786A1 (ja) * 2018-10-02 2020-04-09 株式会社島津製作所 識別器の生成方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
STINIS, P. ET AL.: "Enforcing constraints for interpolation and extrapolation in Generative Adversarial Networks", JOURNAL OF COMPUTATIONAL PHYSICS, vol. 397, no. 108844, 2019, pages 1 - 33, XP085826704, ISSN: 0021-9991, DOI: 10.1016/j.jcp.2019.07.042 *
TANAKA, K. ET AL.: "SYNTHETIC-TO- NATURAL SPEECH WAVEFORM CONVERSION USING CYCLE-CONSISTENT ADVERSARIAL NETWORKS", 2018 IEEE SPOKEN LANGUAGE TECHNOLOGY WORKSHOP (SLT, 2018, Athens, Greece, pages 632 - 639, XP033517039, ISBN: 978-1-5386-4334-1, DOI: 10.1109/SLT.2018.8639636 *

Also Published As

Publication number Publication date
US20230160862A1 (en) 2023-05-25
JP7414125B2 (ja) 2024-01-16
CN115398226B (zh) 2024-02-09
JPWO2021210228A1 (ja) 2021-10-21
CN115398226A (zh) 2022-11-25

Similar Documents

Publication Publication Date Title
JP6729455B2 (ja) 分析データ解析装置及び分析データ解析方法
Smolinska et al. Interpretation and visualization of non-linear data fusion in kernel space: study on metabolomic characterization of progression of multiple sclerosis
JP6760380B2 (ja) 分析データ処理方法及び分析データ処理装置
US20140067342A1 (en) Particle tracking in biological systems
WO2008019382A2 (en) Quantum resonance interferometry for detecting signals
Rubtsov et al. Time-domain Bayesian detection and estimation of noisy damped sinusoidal signals applied to NMR spectroscopy
Vega-Márquez et al. Deep learning techniques to improve the performance of olive oil classification
Möller et al. Random forests for functional covariates
JPWO2018134952A1 (ja) 分析データ解析方法および分析データ解析装置
Lopatka et al. Probabilistic peak detection for first-order chromatographic data
Fan et al. Deep-Learning-Assisted multivariate curve resolution
Alsouki et al. Dual-sPLS: a family of Dual Sparse Partial Least Squares regressions for feature selection and prediction with tunable sparsity; evaluation on simulated and near-infrared (NIR) data
WO2021210228A1 (ja) 波形情報推定方法及び装置、並びに、ピーク波形処理方法及び装置
JP7424595B2 (ja) 識別器の生成方法及び装置
Schleif et al. Genetic algorithm for shift-uncertainty correction in 1-D NMR-based metabolite identifications and quantifications
Esquerre et al. Evaluation of ensemble Monte Carlo variable selection for identification of metabolite markers on NMR data
Zhang et al. Fusion of Quality Evaluation Metrics and Convolutional Neural Network Representations for ROI Filtering in LC–MS
Liu et al. A survey of the baseline correction algorithms for real-time spectroscopy processing
JP2019124486A (ja) スペクトル処理装置及び方法
JP6817243B2 (ja) スペクトル処理装置及び方法
Zhang et al. Application of a target-guided data processing approach in saturated peak correction of GC× GC analysis
US20230280316A1 (en) Learning data producing method, waveform analysis device, waveform analysis method, and recording medium
Burke IV A robust and automated deconvolution algorithm of peaks in spectroscopic data
US20230280318A1 (en) Learning data producing method, waveform analysis device, waveform analysis method, and recording medium
US20230243789A1 (en) Analysis device and analysis method

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 21788501

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2022515206

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 21788501

Country of ref document: EP

Kind code of ref document: A1