WO2021215179A1 - 培養状態の推定方法、情報処理装置及びプログラム - Google Patents

培養状態の推定方法、情報処理装置及びプログラム Download PDF

Info

Publication number
WO2021215179A1
WO2021215179A1 PCT/JP2021/012016 JP2021012016W WO2021215179A1 WO 2021215179 A1 WO2021215179 A1 WO 2021215179A1 JP 2021012016 W JP2021012016 W JP 2021012016W WO 2021215179 A1 WO2021215179 A1 WO 2021215179A1
Authority
WO
WIPO (PCT)
Prior art keywords
data
state
culture
soft sensor
cells
Prior art date
Application number
PCT/JP2021/012016
Other languages
English (en)
French (fr)
Inventor
直貴 中村
暢之 原口
Original Assignee
富士フイルム株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 富士フイルム株式会社 filed Critical 富士フイルム株式会社
Priority to JP2022516908A priority Critical patent/JPWO2021215179A1/ja
Priority to EP21793623.6A priority patent/EP4119674A4/en
Publication of WO2021215179A1 publication Critical patent/WO2021215179A1/ja
Priority to US18/047,384 priority patent/US20230081615A1/en

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12MAPPARATUS FOR ENZYMOLOGY OR MICROBIOLOGY; APPARATUS FOR CULTURING MICROORGANISMS FOR PRODUCING BIOMASS, FOR GROWING CELLS OR FOR OBTAINING FERMENTATION OR METABOLIC PRODUCTS, i.e. BIOREACTORS OR FERMENTERS
    • C12M41/00Means for regulation, monitoring, measurement or control, e.g. flow regulation
    • C12M41/48Automatic or computerized control
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12MAPPARATUS FOR ENZYMOLOGY OR MICROBIOLOGY; APPARATUS FOR CULTURING MICROORGANISMS FOR PRODUCING BIOMASS, FOR GROWING CELLS OR FOR OBTAINING FERMENTATION OR METABOLIC PRODUCTS, i.e. BIOREACTORS OR FERMENTERS
    • C12M41/00Means for regulation, monitoring, measurement or control, e.g. flow regulation
    • C12M41/30Means for regulation, monitoring, measurement or control, e.g. flow regulation of concentration
    • C12M41/36Means for regulation, monitoring, measurement or control, e.g. flow regulation of concentration of biomass, e.g. colony counters or by turbidity measurements
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12MAPPARATUS FOR ENZYMOLOGY OR MICROBIOLOGY; APPARATUS FOR CULTURING MICROORGANISMS FOR PRODUCING BIOMASS, FOR GROWING CELLS OR FOR OBTAINING FERMENTATION OR METABOLIC PRODUCTS, i.e. BIOREACTORS OR FERMENTERS
    • C12M41/00Means for regulation, monitoring, measurement or control, e.g. flow regulation
    • C12M41/46Means for regulation, monitoring, measurement or control, e.g. flow regulation of cellular or enzymatic activity or functionality, e.g. cell viability
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/65Raman scattering
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • G16B5/30Dynamic-time models
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/10Immunoglobulins specific features characterized by their source of isolation or production
    • C07K2317/14Specific host cells or culture conditions, e.g. components, pH or temperature
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound

Definitions

  • the disclosed technology relates to a method for estimating the culture state, an information processing device, and a program.
  • Japanese Patent Application Laid-Open No. 2019-110767 describes a culture tank that produces a target substance by encapsulating a culture solution and culturing cells, a measuring means for measuring the operating state of the culture tank, and a measurement value by the measuring means. Is connected to the individual control means that individually controls various ventilation gas supply means and the like so as to match the preset control target values, and the individual control means so as to be bidirectionally communicable.
  • a method for controlling a cell culture device equipped with a soft sensor having a numerical numerical calculation model is described. After inputting individual control values by the individual control means, the soft sensor estimates the quality properties of the target substance in the culture tank using the control values and the statistical numerical calculation model, and the estimated quality properties are estimated in advance. Correct the control target value when it falls below the set reference value.
  • Japanese Patent Application Laid-Open No. 2008-526203 describes a bioreactor equipped with a cell growth vessel and a sensor.
  • the sensor is configured to measure the condition inside the container and provide an input to a model-free adaptive controller, measuring the condition that correlates with the product quality attribute by methods such as spectrophotometry.
  • the adaptive controller is configured to include a dynamic feedback system using an artificial neural network to provide output to the actuator.
  • Monitoring of the culture state during the cell culture period is performed by actually measuring predetermined measurement items for some cells or culture medium sampled from the culture vessel.
  • offline processing requires preprocessing for the sample, and it takes a relatively long time to obtain the monitoring result. Therefore, if any abnormality occurs during the culture period, it becomes difficult to deal with it immediately.
  • spectroscopy as a method for monitoring the culture state.
  • the cell suspension containing the cells and the culture solution is irradiated with electromagnetic waves, and spectral data showing the wave number or the intensity of each wavelength of the electromagnetic waves affected by the cell suspension is obtained.
  • a multivariate analysis method such as PLS (Partial Least Squares Regression)
  • an estimated value regarding a monitoring target for example, an antibody produced from a cell
  • the culture state is estimated using a multivariate analysis method such as PLS. If you do, the estimation accuracy may be significantly reduced.
  • the disclosed technique was made in view of the above points, and the estimation result can be obtained immediately, and it can be applied even when the density of cells in the culture vessel is high and the content to be monitored is low. It is an object of the present invention to provide a method for estimating a suitable culture state, an information processing apparatus, and a program.
  • Estimation method in culture includes cells and culture medium, the concentration of cells is irradiated to the cell suspension at 35 ⁇ 10 6 cells / mL or more, acted upon by the cell suspension Spectral data indicating the intensity of electromagnetic waves for each wave number or wavelength is acquired, and spectrum data is input by machine learning using a plurality of combinations of spectrum data and state data indicating the state of cells or culture solutions as learning data. , Build a soft sensor that outputs state data, and acquire the state data output from the soft sensor by inputting the spectrum data acquired for the cell suspension containing the cells in culture into the soft sensor. include.
  • another method for estimating the culture state shows the intensity of electromagnetic waves, which are irradiated to a cell suspension containing cells and a culture solution and are affected by the cell suspension, for each wave number or wavelength.
  • Spectral data is acquired, preprocessing is performed on the spectrum data, and processing is performed by machine learning using a plurality of combinations of the processed data obtained by the pretreatment and state data indicating the state of cells or culture medium as training data.
  • the above preprocessing may include a process of selecting a spectrum intensity value for each wave number or wavelength included in the spectrum data to be used as learning data.
  • the number of wave numbers or spectral intensity values for each wavelength included in the spectral data to be used as the learning data is 5 or more and less than 1000.
  • the above selection may be performed using sparse modeling.
  • the above preprocessing includes identifying highly correlated spectral data having a relatively high correlation with state data among the spectral data as processed data.
  • the spectrum data may be data showing the spectrum of scattered light of the light irradiated to the cell suspension.
  • the state data may be data on the amount of antibody contained in the culture medium, the amount of antibody degradation products, the amount of antibody aggregates, or the amount of immature sugar chains having a structure similar to that of the antibody. Further, the state data may be data on the amount of components contained in the culture solution. Further, the state data may be data on the number of cells.
  • the information processing device is an information processing device including at least one processor, and the processor is an electromagnetic wave that is irradiated to a cell suspension containing cells and a culture solution and is acted on by the cell suspension.
  • Pretreatment was performed on the spectral data indicating the number of waves or the intensity for each wavelength, and a plurality of combinations of the processed data obtained by the pretreatment and the state data indicating the state of the cell or the culture solution were used as training data.
  • Build a soft sensor that inputs processed data by machine learning and outputs state data.
  • a cell suspension containing cells and a culture solution is irradiated, and spectral data showing the intensity of each wave number or wavelength of the electromagnetic wave affected by the cell suspension is subjected to predetermined processing.
  • the processed data is input by machine learning using a plurality of combinations of the processed data obtained by the pretreatment and the state data indicating the state of the cell or the culture solution as the learning data, and the state data is output.
  • an estimation result can be obtained immediately, and a culture state estimation method and an information processing apparatus that can be applied even when the cell density in the culture vessel is high and the content to be monitored is low. Is provided.
  • This is an example of a functional block diagram showing an example of the functional configuration of the information processing apparatus in the operation phase according to the embodiment of the disclosed technology.
  • It is a flowchart which shows an example of the flow of the estimation process which concerns on embodiment of the disclosed technique.
  • It is a figure which shows an example of the state data which can be acquired by a soft sensor.
  • It is a graph which shows the relationship between the estimated value acquired by the soft sensor which concerns on embodiment of the disclosed technique, and the measured value acquired by sampling.
  • the method for estimating the culture state is a spectrum showing the intensity of electromagnetic waves, which are irradiated to a cell suspension containing cells and a culture solution and acted by the cell suspension, for each wave number or wavelength.
  • a plurality of combinations of a step of acquiring data, a step of preprocessing the acquired spectrum data, a processed data obtained by the pretreatment, and a state data indicating the state of a cell or a culture solution are used as training data. It includes a step of constructing a soft sensor that inputs processed data and outputs state data by machine learning used.
  • Pretreatment methods include sparse modeling, PCA (principal component analysis), LSA (SVD) (latent semantic analysis (singular value decomposition)), LDA (linear discriminant analysis), ICA (independent component analysis), PLS (partial).
  • a dimentional reduction method such as (minimum square regression), which may include a process of selecting the wave number or the spectral intensity value for each wavelength included in the spectral data to be used as learning data. In this case, the spectral intensity value of the wave number or wavelength remaining after selection becomes the processed data. It is expected that the number of waves or the spectral intensity values for each wavelength constituting the spectral data will be enormous.
  • spectral data can be performed, for example, by sparse modeling. That is, in the preprocessing performed on the spectrum data, the correlation with the state data is relative to the spectrum data by excluding the data having a relatively low correlation with the state data from the spectrum data by sparse modeling. Highly correlated spectrum data may include identifying as processed data.
  • the number of data used as the training data is preferably selected from 5 or more to less than 1000 by pretreatment, more preferably 5 or more and 800 or less, and 5 or more. More preferably 500 or less, and most preferably 11 or more and 334 or less.
  • the explanatory variables are selected (that is, one of the explanatory variables) for the regression model in which the wave number or the spectral intensity value for each wavelength included in the spectral data is used as the explanatory variable and the state data is used as the objective variable. Excludes the part).
  • lasso regression can be used as a sparse modeling method. Lasso regression is a method of selecting explanatory variables so that the cost function calculated by adding a penalty term to the root mean squared error (RMSE) is minimized.
  • the explanatory variables are selected by excluding the low-correlation spectrum data having a relatively low correlation with the state data from the spectrum data.
  • the penalties may be determined by, for example, cross-validation represented by K-validation.
  • the method for estimating the culture state uses highly correlated spectrum data as processed data among the spectrum data acquired for the cell suspension containing the cells in culture. It includes a step of acquiring state data output from the soft sensor 20 by inputting to the soft sensor 20.
  • the soft sensor 20 realizes a process of outputting state data based on the input high correlation spectrum data by software.
  • the soft sensor 20 is constructed in the information processing device 10 (see FIGS. 2 and 5) described later.
  • the soft sensor 20 is an application of an analysis method by Raman spectroscopy. That is, the spectrum data of Raman scattered light is applied as the spectrum data input to the soft sensor 20.
  • Raman spectroscopy is a spectroscopy that evaluates a substance using Raman scattered light. When a substance is irradiated with light, the light interacts with the substance to generate Raman scattered light having a wavelength different from that of the incident light. Since the wavelength difference between the incident light and the Raman scattered light corresponds to the energy component of the molecular vibration of the substance, Raman scattered light having a different wavelength (wave number) can be obtained between substances having different molecular structures. In addition, various physical properties such as stress, temperature, electrical characteristics, orientation, and crystallinity can be estimated using Raman scattered light.
  • FIG. 2 is a diagram showing an example of a method for acquiring spectral data for a cell suspension 31 containing cells in culture.
  • the cells are cultured in a state of being contained in the culture vessel 30 together with the culture solution.
  • the spectrum data can be acquired by using a known probe 40 and analyzer 41 for Raman spectroscopic analysis.
  • the tip of the probe 40 is immersed in a cell suspension 31 containing cells and a culture solution contained in a culture vessel 30.
  • the cell suspension 31 is irradiated with excitation light emitted from a light emitting portion (not shown) provided at the tip of the probe 40.
  • the Raman scattered light generated by the interaction between the excitation light and the cell suspension 31 is received by a light receiving portion (not shown) provided at the tip of the probe 40.
  • the acquired Raman scattered light is decomposed by the analyzer 41 for each wave number (reciprocal of wavelength), and spectral data which is a spectral intensity value for each wave number is generated.
  • the spectral data may be a spectral intensity value for each wavelength. If scheme of the cell culture to obtain the spectral data in the case of the perfusion culture method, it is preferable that the concentration of the cells irradiated with electromagnetic waves to the cell suspension at 35 ⁇ 10 6 cells / mL or more.
  • the cell concentration is more preferably 40 ⁇ 10 6 cells / mL or more and 300 ⁇ 10 6 cells / mL or less, and further preferably 60 ⁇ 10 6 cells / mL or more and 220 ⁇ 10 6 cells / mL or less. , 80 ⁇ 10 6 cells / mL or more and 1300 ⁇ 10 6 cells / mL or less is most preferable.
  • the purpose of cell culture is to produce an antibody, the higher the concentration of the cells to be cultured, the higher the efficiency of antibody production. Therefore, by setting the concentration of the cells 35 ⁇ 10 6 cells / mL or more, it is possible to ensure a constant production efficiency.
  • the soft sensor 20 is constructed by machine learning using spectrum data containing a large amount of noise components as learning data, the accuracy of the learning model may be reduced and overlearning may occur, and it may not be possible to construct a soft sensor that can withstand actual use. be.
  • the spectrum data is supplied to the information processing apparatus 10.
  • the perfusion culture is a method in which a medium containing a product such as an antibody is continuously extracted from the culture vessel 30, while a fresh medium is continuously supplied to the culture vessel 30.
  • the state data output from the soft sensor 20 is data indicating the state of cells or culture medium, which has a correlation with the spectral data.
  • the state data may be, for example, data on the amount of antibody contained in the culture medium, the amount of antibody degradation products, the amount of antibody aggregates, or the amount of immature sugar chains whose structure is similar to that of the antibody. Antibodies are products produced by cells in culture.
  • the state data may be data on the amount of components contained in the culture solution.
  • the “data on the amount” may be the content of the component in the culture solution or the content rate (concentration).
  • the state data may be data on the number of living cells in the culture vessel 30.
  • the "data on the number of living cells” may be the total number of living cells in the culture medium or the density.
  • the soft sensor 20 is constructed by machine learning using a plurality of combinations of spectrum data and state data as learning data.
  • FIG. 3 is a diagram showing an example of learning data 50.
  • the learning data 50 is acquired, for example, in a preliminary test culture. That is, the spectrum data for learning is acquired from the cell suspension contained in the culture vessel 30 in the test culture.
  • the state data for learning can be obtained by actual measurement by a conventional sampling method with cells or culture medium cultured in the culture vessel 30 as a measurement target in test culture. For example, when acquiring the concentration of an antibody contained in a culture solution as state data for learning, a method such as HPLC (high performance liquid chromatography) can be used.
  • HPLC high performance liquid chromatography
  • the test culture is carried out over a predetermined period, and the learning data is acquired at a plurality of time points during the test culture period.
  • the spectrum data for learning and the state data for learning at each time point are associated with each other.
  • the analyzer 41 is, as the spectral data, for example, a spectral intensity values in the range of wave number 500 cm -1 to 3000 cm -1 and outputs at 1 cm -1 increments. Therefore, the number of acquired spectrum data becomes enormous, and if all the spectrum data are used as learning data, the learning load becomes excessive, and a high-performance processor is required to perform machine learning.
  • the spectral intensity value of the Raman scattered light constituting the spectral data may include a spectral intensity value of a wave number having a low correlation with the state data to be monitored. For example, it is considered that the spectral intensity value of a specific wave value of Raman scattered light has a low correlation with the concentration of the antibody. If the soft sensor 20 is constructed by machine learning using spectrum data including the spectrum intensity value of the wave number having a low correlation with the state data to be monitored as learning data, the accuracy of the output value of the soft sensor 20 may decrease. be.
  • the spectral intensity value of the wave number having a relatively high correlation with the state data to be monitored is the highly correlated spectral data. Identify as.
  • the learning phase which is the stage of constructing the soft sensor 20 by machine learning
  • the soft sensor 20 is constructed by machine learning using a plurality of combinations of highly correlated spectrum data and state data as learning data.
  • the operation phase in which the constructed soft sensor 20 is operated to acquire state data for the cells or culture solution being cultured, as shown in FIG. 4, the cell suspension containing the cells being cultured is acquired.
  • the state data output from the soft sensor 20 is acquired by inputting the highly correlated spectrum data having a relatively high correlation with the state data to be monitored into the soft sensor 20.
  • the information processing device 10 is used to construct the soft sensor 20 and acquire state data using the soft sensor 20.
  • FIG. 5 is a diagram showing an example of the hardware configuration of the information processing device 10.
  • the information processing device 10 includes a CPU (Central Processing Unit) 101, a memory 102 as a temporary storage area, and a non-volatile storage unit 103. Further, the information processing device 10 includes a display unit 104 such as a liquid crystal display, an input unit 105 such as a keyboard and a mouse, a network I / F (InterFace) 106 connected to a network, and an external I / F 107 to which an analyzer 41 is connected. including.
  • the CPU 101, the memory 102, the storage unit 103, the display unit 104, the input unit 105, the network I / F 106, and the external I / F 107 are connected to the bus 108.
  • the storage unit 103 is realized by a storage medium such as an HDD (Hard Disk Drive), an SSD (Solid State Drive), or a flash memory.
  • the learning data 50, the estimation model 60, the soft sensor construction program 70, and the estimation program 80 are stored in the storage unit 103.
  • the learning data 50 is a plurality of combinations of the spectrum data and the state data, and is acquired in the test culture.
  • FIG. 6 is a diagram showing an example of the structure of the estimation model 60.
  • the estimation model 60 is a neural network including an input layer, a plurality of intermediate layers, and an output layer. A spectral intensity value for each wave number of Raman scattered light, that is, spectral data is input to the input layer of the estimation model 60. From the output layer of the estimation model 60, state data corresponding to the spectrum data input to the input layer is output.
  • the CPU 101 reads the soft sensor construction program 70 from the storage unit 103, expands it into the memory 102, and executes it.
  • the CPU 101 reads the estimation program 80 from the storage unit 103, expands it into the memory 102, and executes it.
  • An example of the information processing device 10 is a server computer or the like.
  • the CPU 101 is an example of a processor in the disclosed technology.
  • FIG. 7 is an example of a functional block diagram showing an example of the functional configuration of the information processing device 10 in the learning phase.
  • the information processing device 10 includes a specific unit 11 and a learning unit 12. It is assumed that the learning data 50 and the estimation model 60 are stored in the storage unit 103.
  • the specific unit 11 By performing regression analysis on the training data 50 by Lasso regression, which is an example of sparse modeling, the specific unit 11 has a relative correlation with the state data among the spectral data included in the training data 50. A high frequency spectral intensity value is specified as highly correlated spectral data. Specifically, the specific unit 11 performs the following processing. The specific unit 11 performs a process of thinning out the spectral intensity values of the wave numbers randomly determined for the spectral data included in the training data 50, and a regression model (regression formula) showing the relationship between the thinned out spectral data and the corresponding state data. ) Is generated.
  • the specific part 11 derives a cost function obtained by adding a penalty term to the root mean squared error (RMSE) for the generated regression model.
  • RMSE root mean squared error
  • the specific unit 11 By repeating each of the above processes a predetermined number of times, the specific unit 11 generates a regression model for each of a plurality of spectral data having different wave numbers to be thinned out, and derives the above cost function for each regression model. ..
  • the identification unit 11 specifies the smallest number of spectral intensity values that can minimize the above cost function as high-correlation spectral data in a predetermined number of iterative calculations.
  • the learning unit 12 trains the estimation model 60 by machine learning using a combination of the highly correlated spectrum data specified by the specific unit 11 and the corresponding state data as training data among the learning data 50. As a result, the soft sensor 20 that inputs the highly correlated spectrum data and outputs the state data is constructed.
  • the learning unit 12 trains the estimation model 60 using the learning data 50 according to the error back propagation method as an example of machine learning. Specifically, the learning unit 12 extracts the highly correlated spectrum data specified by the specific unit 11 from the learning spectrum data included in the learning data 50. The learning unit 12 inputs the extracted high-correlation spectrum data into the estimation model 60, and acquires the state data output from the estimation model 60. The learning unit 12 has a score indicated by the acquired state data (for example, a score indicating the antibody concentration) and a score indicated by the learning state data corresponding to the highly correlated spectrum data included in the learning data 50. The estimation model 60 is trained so that the difference from the above is minimized.
  • the learning unit 12 performs a process of training the estimation model 60 by using a combination of all or a part of the highly correlated spectrum data included in the learning data 50 and the state data.
  • the machine learning method includes random forest, linear regression, non-linear regression (SVM: Sapport vector machine, Basian regression), logistic regression, etc., but the error backpropagation method is preferable.
  • FIG. 8 is a flowchart showing an example of the flow of the soft sensor construction process executed by the CPU 101 executing the soft sensor construction program 70 in the learning phase.
  • the soft sensor construction program 70 is executed, for example, when an execution instruction for the soft sensor construction process is input by the user via the input unit 105.
  • step S1 the specific unit 11 randomly selects a spectral intensity value of the wave number to be excluded from the spectral data included in the learning data 50 stored in the storage unit 103. That is, the specific unit 11 performs a process of thinning out the spectral intensity values for a part of the spectral intensity values acquired in increments of 1 cm-1 wave number.
  • the number of waves to be excluded may be a predetermined number or a randomly determined number.
  • the identification unit 11 relates the spectrum data (that is, the thinned spectrum data) composed of the spectral intensity values of the wave numbers other than the wave numbers to be excluded selected in step S1 to the corresponding state data.
  • the regression model may be a linear model or a non-linear model.
  • step S3 the specific unit 11 derives a cost function for the regression model generated in step S2.
  • the cost function is used as an index value indicating the accuracy of the regression model.
  • step S4 the specific unit 11 determines whether or not the number of repetitions of the processes from step S1 to step S3 has reached a predetermined number of times.
  • the specific unit 11 repeats the processes from step S1 to step S3 until the number of repetitions reaches a predetermined number of times.
  • a regression model is generated for each of the plurality of thinned out spectral data having different wave numbers to be excluded, and a cost function is derived for each of the generated regression models.
  • step S5 the identification unit 11 specifies the thinned spectrum data used when generating the regression model that minimizes the cost function as the highly correlated spectrum data.
  • the spectral data used to generate the regression model with the minimum cost function is composed of the spectral intensity values of the wavenumbers, which have a relatively high correlation with the state data.
  • the specifying unit 11 identifies the spectral data composed of the spectral intensity values of the wave numbers having a relatively high correlation with the state data as the highly correlated spectral data by the regression analysis.
  • step S6 the learning unit 12 extracts the high-correlation spectrum data specified in step S5 from the spectrum data included in the learning data 50 stored in the storage unit 103, and corresponds to the extracted high-correlation spectrum data.
  • the estimation model 60 is trained by machine learning using a plurality of combinations with state data as teacher data. Specifically, the learning unit 12 inputs the high correlation spectrum data specified in step S5 into the estimation model 60, and includes the score indicated by the state data output from the estimation model 60 and the learning data 50. The estimation model 60 is trained so that the difference from the score indicated by the training state data corresponding to the highly correlated spectrum data is minimized. As a result, the soft sensor 20 is constructed.
  • the soft sensor 20 is constructed for each type of state data to be monitored. For example, when data on the amount of antibody contained in the culture solution is output to the soft sensor 20 as state data, the spectral intensity value of the number of waves having a high correlation with the amount of antibody in the spectral data is used as highly correlated spectral data. Be identified. Then, the amount of antibody is estimated based on the highly correlated spectrum data by machine learning using a plurality of combinations of the identified high correlation spectrum data and the state data regarding the amount of antibody obtained by actual measurement as learning data. A soft sensor 20 that outputs a value is constructed.
  • the spectral intensity value of the wave number having a high correlation with the number of cells among the spectral data is specified as the highly correlated spectral data. Then, the number of cells is estimated based on the highly correlated spectrum data by machine learning using a plurality of combinations of the identified high correlation spectrum data and the state data regarding the number of cells acquired by actual measurement as learning data. A soft sensor 20 that outputs a value is constructed.
  • FIG. 9 is an example of a functional block diagram showing an example of the functional configuration of the information processing apparatus 10 in the operation phase.
  • the information processing apparatus 10 includes an acquisition unit 13, an extraction unit 14, and an estimation unit 15. It is assumed that the storage unit 103 stores a trained estimation model 60 that functions as a soft sensor 20.
  • the method for estimating the culture state according to the embodiment of the disclosed technique is applied, for example, when estimating the state of cells or culture solution in culture contained in a culture vessel.
  • spectral data is acquired by the probe 40 and the analyzer 41 for the cell suspension 31 containing the cells in culture contained in the culture vessel 30.
  • the acquisition unit 13 acquires the spectrum data output from the analyzer 41.
  • the extraction unit 14 has a high correlation spectrum data specified by the specific unit 11 among the spectral data acquired by the acquisition unit 13, that is, a spectral intensity value of a wave number having a relatively high correlation with the state data to be monitored. Is extracted.
  • the estimation unit 15 reads the trained estimation model 60 that functions as the soft sensor 20 from the storage unit 103, inputs the highly correlated spectrum data extracted by the extraction unit 14 into the estimation model 60, and outputs the high correlation spectrum data from the estimation model 60. Acquires the status data to be executed.
  • the estimation unit 15 may control the display unit 104 to display the acquired state data. Further, the estimation unit 15 may store the acquired state data in the storage unit 103.
  • FIG. 10 is a flowchart showing an example of the flow of estimation processing executed by the CPU 101 executing the estimation program 80 in the operation phase.
  • the estimation program 80 is executed, for example, when an execution instruction for estimation processing is input by the user via the input unit 105.
  • step S11 the acquisition unit 13 acquires the spectrum data output from the analyzer 41.
  • step S12 the extraction unit 14 has a wave number that has a relatively high correlation with the highly correlated spectrum data specified by the specific unit 11, that is, the state data to be monitored, among the spectral data acquired by the acquisition unit 13. Extract the spectral intensity value of.
  • step S13 the estimation unit 15 reads the learned estimation model 60 functioning as the soft sensor 20 from the storage unit 103, inputs the highly correlated spectrum data extracted in step S12 into the read estimation model 60, and estimates. Acquire the state data output from the model 60.
  • the estimation unit 15 controls the display unit 104 to display the acquired state data.
  • FIG. 11 is a diagram showing an example of state data acquired by using the soft sensor 20.
  • the soft sensor 20 it is possible to estimate, for example, the density of living cells as an item related to cells.
  • the soft sensor 20 it is possible to estimate, for example, the antibody concentration, the concentration of immature sugar chains whose structure is similar to that of the antibody, the concentration of antibody aggregates, and the concentration of antibody degradation products as items related to the product. Is.
  • the concentration of lactic acid, the concentration of glucose, the concentration of citric acid, the concentration of glutamine, the concentration of asparagine, the concentration of phenylalanine and the concentration of leucine can be selected as items related to the components contained in the culture solution. It is possible to estimate.
  • 12A to 12L are graphs showing the relationship between the estimated value of each item shown in FIG. 11, which is the state data output from the soft sensor 20, and the actually measured value acquired by sampling.
  • the estimated value obtained by the soft sensor 20 the value of the coefficient of determination R 2 indicating the degree of deviation from the measured value is not less than 0.95, a very high accuracy of the output value of the soft sensor 20 It was confirmed that.
  • FIG. 13 shows the relationship between the estimated value of the concentration of glutamine contained in the culture solution and the measured value when the estimated value was acquired by using the soft sensor 20 and when the estimated value was acquired by using the conventional multivariate analysis method by PLS. It is a graph showing. 14A and 14B show the estimated values of the concentrations of each component contained in the culture broth from the measured values when they are obtained by using the soft sensor 20 and when they are obtained by using the conventional multivariate analysis method by PLS. is a graph showing the coefficient of determination R 2 indicating the degree of divergence. For the case of using the soft sensor 20 it has acquired the coefficient of determination R 2 in each case in case of not carrying out the case and the pre-treatment was carried out preprocessing for specifying the high correlation spectral data.
  • Table 1 shows the number of wave numbers (number of explanatory variables) used in the concentration estimation in each method (soft sensor (with pretreatment), soft sensor (without pretreatment), PLS).
  • PSL when the full wavenumber band (2500) of Raman scattered light is included in the analysis target, the accuracy is significantly deteriorated. Therefore, and as C-H, we analyzed 1000 wavenumbers from 500 cm -1 to the peak due to the binding of such C-O is said to stand until 1500 cm -1 which is present in the above-mentioned components to perform density estimation .
  • the spectral data used for concentration estimation in each method is the spectral data obtained in the same culture experiment.
  • the estimated values obtained by using the soft sensor 20 for all the components contained in the culture solution are the estimates obtained by using the conventional multivariate analysis method by PLS. It was confirmed that the accuracy was higher than the value. Further, it was confirmed that when the soft sensor 20 is used, the accuracy of the estimated value is further improved by performing the preprocessing for specifying the highly correlated spectrum data.
  • the number used as learning data when constructing the soft sensor 20 is 11 or more and 334 or less. It was sorted up to.
  • the spectrum data acquired for the cell suspension containing the cells being cultured is input to the soft sensor and output from the soft sensor.
  • the culture state is estimated. Since it is relatively easy to monitor the spectrum data in-line by actual measurement, it is possible to estimate the culture state in-line. In addition, since the estimation result of the culture state can be obtained immediately, it is possible to immediately deal with any abnormality that occurs during the culture period.
  • the soft sensor is constructed by machine learning using a plurality of combinations of spectrum data and state data acquired in an actual culture environment as learning data, the density of cells in the culture vessel is high. Moreover, even in an actual culture environment where the content of the monitoring target is low, it is possible to estimate the culture state with higher accuracy than when estimating the cell state using a multivariate analysis method such as PLS. Is.
  • the highly correlated spectral data composed of the spectral intensity values of the waves having a relatively high correlation with the state data to be monitored is used as the training data, so that the analyzer 41 is used.
  • the learning load can be reduced and the accuracy of the output value of the soft sensor 20 can be improved as compared with the case where all the spectrum data output from is used as the learning data.
  • the value of the coefficient of determination R 2 indicating the degree of deviation from the measured values acquired by the estimated value and the sampling obtained by a software sensor is 0.8 or more, more preferably 0.9 or more, Most preferably 0.95 or more.
  • the amount of antibody contained in the culture solution the amount of antibody degradation products, the amount of antibody aggregates, or immaturity similar in structure to the antibody. It is possible to obtain an estimated value regarding the amount of sugar chains as state data.
  • the degradation product of the antibody is formed by the degradation of the antibody by a degrading enzyme produced during culturing.
  • Antibody aggregates are likely to form, for example, when the concentration of antibody produced by cells becomes excessively high or when stress such as heat is applied.
  • Immature sugar chains having a structure similar to that of an antibody are likely to be formed, for example, when the amount of waste products in the culture solution increases or when the oxygen concentration in the culture solution is insufficient.
  • the culture solution contains nutrients and the like necessary for culturing cells. It is preferable that the necessary nutrients are contained in the culture solution in just proportion during the culture period. Therefore, it is effective to acquire an estimated value regarding the amount of the component contained in the culture solution as state data in order to maintain a good culture state.
  • the method for estimating the culture state it is possible to obtain an estimated value regarding the number of cells cultured in the culture container 30 as state data. If the number of cells cultured in the culture vessel 30 becomes excessively large, the oxygen and nutrients supplied to the cells may be insufficient, and the survival rate of the cells may decrease. On the other hand, in cell culture for the purpose of producing an antibody, if the number of cells cultured in the culture vessel 30 becomes excessively small, the antibody production efficiency decreases. Therefore, acquiring an estimated value regarding the number of cells cultured in the culture vessel 30 as state data is effective in maintaining a good culture state.
  • a mode in which a spectrum of Raman scattered light is used as the spectrum data has been illustrated, but the present embodiment is not limited to this mode.
  • the spectrum data is preprocessed and a soft sensor is constructed by machine learning using a plurality of combinations of the processed data and the state data obtained by the preprocessing as learning data is exemplified.
  • the spectrum data that has not been preprocessed may be used as the training data.
  • the preprocessing a process for specifying highly correlated spectrum data having a relatively high correlation with the state data among the spectrum data has been exemplified, but the present invention is not limited to this.
  • a process of excluding the spectral intensity value of a predetermined wave number from the learning data may be performed as a preprocessing.
  • the spectral data acquired by the analyzer 41 is grouped so that those having similar wavenumbers belong to the same wavenumber group, and the average value, standard deviation, median value, and maximum value of the intensity of scattered light are grouped for each wavenumber group.
  • the process of calculating the minimum value and the like may be performed as a preprocessing.
  • the spectral intensity value for each wavenumber group is used as learning data.
  • the learning data composed of a plurality of combinations of the spectrum data indicating the wave number or the intensity for each wavelength and the state data may be subjected to a process of reducing the number of dimensions as a preprocessing.
  • the various processors include a CPU, which is a general-purpose processor that executes software (program) and functions as various processing units, and a processor whose circuit configuration can be changed after manufacturing an FPGA or the like.
  • a dedicated electric circuit which is a processor having a circuit configuration specially designed for executing a specific process such as a programmable logic device (PLD), an ASIC (Application Specific Integrated Circuit), and the like.
  • One processing unit may be composed of one of these various processors, or a combination of two or more processors of the same type or different types (for example, a combination of a plurality of FPGAs or a combination of a CPU and an FPGA). It may be composed of a combination). Further, a plurality of processing units may be configured by one processor.
  • one processor is configured by a combination of one or more CPUs and software, as represented by a computer such as a client and a server.
  • a processor functions as a plurality of processing units.
  • SoC System on Chip
  • the various processing units are configured by using one or more of the above-mentioned various processors as a hardware structure.
  • an electric circuit in which circuit elements such as semiconductor elements are combined can be used.
  • the mode in which the soft sensor construction program 70 and the estimation program 80 are stored (installed) in the storage unit 103 in advance has been described, but the present invention is not limited to this.
  • the soft sensor construction program 70 and the estimation program 80 were recorded on a recording medium such as a CD-ROM (Compact Disc Read Only Memory), a DVD-ROM (Digital Versatile Disc Read Only Memory), and a USB (Universal Serial Bus) memory. It may be provided in the form. Further, the soft sensor construction program 70 and the estimation program 80 may be downloaded from an external device via a network.

Abstract

細胞及び培養液を含む細胞懸濁液に照射され、細胞懸濁液による作用を受けた電磁波の、波数または波長毎の強度を示すスペクトルデータを取得する。スペクトルデータについて前処理を行う。前処理によって得られた処理済みデータと、細胞または培養液の状態を示す状態データとの複数の組み合わせを学習用データとして用いた機械学習によってソフトセンサを構築する。培養中の細胞を含む細胞懸濁液について取得されたスペクトルデータについての処理済みデータをソフトセンサに入力することによってソフトセンサから出力される状態データを取得する。

Description

培養状態の推定方法、情報処理装置及びプログラム
 開示の技術は、培養状態の推定方法、情報処理装置及びプログラムに関する。
 培養中の細胞または培養液の状態を推定する培養状態の方法に関する技術として、以下の技術が知られている。例えば、特開2019-110767号公報には、培養液を封入して細胞を培養することによって目的物質を生産する培養槽と、培養槽の運転状態を計測する計測手段と、計測手段による計測値が、予め設定された制御目標値に一致するように、各種通気ガス供給手段等を個別に制御する個別制御手段と、個別制御手段と双方向通信可能に接続されているとともに、予め構築した統計的数値演算モデルを有するソフトセンサと、を備えた細胞培養装置の制御方法が記載されている。ソフトセンサは、個別制御手段による個別の制御値が入力された後、制御値と統計的数値演算モデルとを用いて培養槽内における目的物質の品質性状を推定し、推定された品質性状が予め設定した基準値を下回る場合に制御目標値を修正する。
 また、特表2008-526203号公報には、細胞成長容器とセンサーとを備えたバイオリアクターが記載されている。センサーは、容器内部の状態を測定し、モデルフリーな適応コントローラへの入力を提供するように構成され、分光測光などの方法により生成物品質属性との相関関係を示す状態を測定する。適応コントローラは、人工ニューラルネットワークを用いた動的なフィードバックシステムを含んで構成され、アクチュエータに出力を提供するように構成されている。
 細胞の培養期間中における培養状態のモニタリングは、培養容器からサンプリングされた一部の細胞または培養液について、所定の計測項目を実測することにより行われる。しかしながら、このようなオフライン処理によれば、サンプルに対する前処理が必要となり、モニタリング結果を得るまでに比較的長い時間を要する。従って、培養期間中に何等かの異常が生じた場合に即時に対処することが困難となる。
 また、培養状態のモニタリング手法として、分光法を用いることが考えられる。分光法を用いた培養状態のモニタリングでは、細胞及び培養液を含む細胞懸濁液に電磁波を照射し、細胞懸濁液の作用を受けた電磁波の波数または波長毎の強度を示すスペクトルデータを、PLS(Partial Least Squares Regression)等の多変量解析手法を用いて解析することで、モニタリング対象(例えば、細胞から産生される抗体)に関する推定値を取得する。しかしながら、培養容器内における細胞の密度が高く(すなわち、夾雑物が多く)、且つモニタリング対象の含有量が僅かである実際の培養プロセスにおいて、PLS等の多変量解析手法を用いて培養状態の推定を行うと、推定精度が著しく低くなる場合がある。
 開示の技術は、上記の点に鑑みてなされたものであり、推定結果を即時に得ることができ、培養容器内の細胞の密度が高く、且つモニタリング対象の含有量が少ない場合にも適用可能な培養状態の推定方法、情報処理装置及びプログラムを提供することを目的とする。
 開示の技術に係る培養状態の推定方法は、細胞及び培養液を含み、細胞の濃度が35×10cells/mL以上である細胞懸濁液に照射され、細胞懸濁液による作用を受けた電磁波の、波数または波長毎の強度を示すスペクトルデータを取得し、スペクトルデータと細胞または培養液の状態を示す状態データとの複数の組み合わせを学習用データとして用いた機械学習によってスペクトルデータを入力とし、状態データを出力とするソフトセンサを構築し、培養中の細胞を含む細胞懸濁液について取得されたスペクトルデータをソフトセンサに入力することによってソフトセンサから出力される状態データを取得することを含む。
 また、開示の技術に係る他の培養状態の推定方法は、細胞及び培養液を含む細胞懸濁液に照射され、細胞懸濁液による作用を受けた電磁波の、波数または波長毎の強度を示すスペクトルデータを取得し、スペクトルデータについて前処理を行い、前処理によって得られた処理済みデータと細胞または培養液の状態を示す状態データとの複数の組み合わせを学習用データとして用いた機械学習によって処理済みデータを入力とし、状態データを出力とするソフトセンサを構築し、培養中の細胞を含む細胞懸濁液について取得されたスペクトルデータについての処理済みデータをソフトセンサに入力することによってソフトセンサから出力される前記状態データを取得することを含む。
 上記前処理は、スペクトルデータに含まれる波数または波長毎のスペクトル強度値のうち、学習用データとして用いるものの選別を行う処理を含み得る。上記選別により、スペクトルデータに含まれる波数または波長毎のスペクトル強度値のうち、前記学習用データとして用いるものの数を5以上1000未満とすることが好ましい。上記選別をスパースモデリングを用いて行ってもよい。上記の前処理は、スペクトルデータのうち、状態データとの相関性が相対的に高い高相関スペクトルデータを、処理済みデータとして特定することを含む。
 スペクトルデータは、細胞懸濁液に照射された光の散乱光のスペクトルを示すデータであってもよい。
 状態データは、培養液に含まれる抗体の量、抗体の分解物の量、抗体の凝集物の量または抗体と構造が類似した未成熟糖鎖の量に関するデータであってもよい。また、状態データは、培養液に含まれる成分の量に関するデータであってもよい。また、状態データは、細胞の数に関するデータであってもよい。
 開示の技術に係る情報処理装置は、少なくとも1つのプロセッサを含む情報処理装置であって、プロセッサは、細胞及び培養液を含む細胞懸濁液に照射され、細胞懸濁液による作用を受けた電磁波の、波数または波長毎の強度を示すスペクトルデータについて前処理を行い、前処理によって得られた処理済みデータと細胞または培養液の状態を示す状態データとの複数の組み合わせを学習用データとして用いた機械学習によって処理済みデータを入力とし、状態データを出力とするソフトセンサを構築する。
 開示の技術に係るプログラムは、細胞及び培養液を含む細胞懸濁液に照射され、細胞懸濁液による作用を受けた電磁波の、波数または波長毎の強度を示すスペクトルデータについて所定の処理を行い、前記前処理によって得られた処理済みデータと細胞または培養液の状態を示す状態データとの複数の組み合わせを学習用データとして用いた機械学習によって処理済みデータを入力とし、状態データを出力とするソフトセンサを構築する処理をコンピュータに実行させるためのプログラムである。
 開示の技術によれば、推定結果を即時に得ることができ、培養容器内の細胞の密度が高く、且つモニタリング対象の含有量が少ない場合にも適用可能な培養状態の推定方法及び情報処理装置が提供される。
開示の技術の実施形態に係る培養状態の推定方法の一例を示す図である。 スペクトルデータを取得する方法の一例を示す図である。 開示の技術の実施形態に係る学習用データの一例を示す図である。 開示の技術の実施形態に係る培養状態の推定方法の一例を示す図である。 開示の技術の実施形態に係る情報処理装置のハードウェア構成の一例を示す図である。 開示の技術の実施形態に係る推定モデルの構造の一例を示す図である。 開示の技術の実施形態に係る学習フェーズにおける情報処理装置の機能的な構成の一例を示す機能ブロック図の一例である。 開示の技術の実施形態に係るソフトセンサ構築処理の流れの一例を示すフローチャートである。 開示の技術の実施形態に係る運用フェーズにおける情報処理装置の機能的な構成の一例を示す機能ブロック図の一例である。 開示の技術の実施形態に係る推定処理の流れの一例を示すフローチャートである。 ソフトセンサによって取得可能な状態データの一例を示す図である。 開示の技術の実施形態に係るソフトセンサによって取得された推定値と、サンプリングによって取得した実測値との関係を示すグラフである。 開示の技術の実施形態に係るソフトセンサによって取得された推定値と、サンプリングによって取得した実測値との関係を示すグラフである。 開示の技術の実施形態に係るソフトセンサによって取得された推定値と、サンプリングによって取得した実測値との関係を示すグラフである。 開示の技術の実施形態に係るソフトセンサによって取得された推定値と、サンプリングによって取得した実測値との関係を示すグラフである。 開示の技術の実施形態に係るソフトセンサによって取得された推定値と、サンプリングによって取得した実測値との関係を示すグラフである。 開示の技術の実施形態に係るソフトセンサによって取得された推定値と、サンプリングによって取得した実測値との関係を示すグラフである。 開示の技術の実施形態に係るソフトセンサによって取得された推定値と、サンプリングによって取得した実測値との関係を示すグラフである。 開示の技術の実施形態に係るソフトセンサによって取得された推定値と、サンプリングによって取得した実測値との関係を示すグラフである。 開示の技術の実施形態に係るソフトセンサによって取得された推定値と、サンプリングによって取得した実測値との関係を示すグラフである。 開示の技術の実施形態に係るソフトセンサによって取得された推定値と、サンプリングによって取得した実測値との関係を示すグラフである。 開示の技術の実施形態に係るソフトセンサによって取得された推定値と、サンプリングによって取得した実測値との関係を示すグラフである。 開示の技術の実施形態に係るソフトセンサによって取得された推定値と、サンプリングによって取得した実測値との関係を示すグラフである。 培養液に含まれるグルタミンの濃度の推定値を、ソフトセンサを用いて取得した場合及び従来のPLSによる多変量解析手法を用いて取得した場合のそれぞれについて、実測値との関係を示したグラフである。 培養液に含まれる各成分の濃度の推定値を、ソフトセンサを用いて取得した場合及び従来のPLSによる多変量解析手法を用いて取得した場合のそれぞれについて、決定係数を示したグラフである。 培養液に含まれる各成分の濃度の推定値を、ソフトセンサを用いて取得した場合及び従来のPLSによる多変量解析手法を用いて取得した場合のそれぞれについて、決定係数を示したグラフである。
 以下、開示の技術の実施形態の一例を、図面を参照しつつ説明する。なお、各図面において同一または等価な構成要素及び部分には同一の参照符号を付与し、重複する説明は適宜省略する。
 開示の技術の実施形態に係る培養状態の推定方法は、細胞及び培養液を含む細胞懸濁液に照射され、細胞懸濁液による作用を受けた電磁波の、波数または波長毎の強度を示すスペクトルデータを取得するステップと、取得したスペクトルデータについて前処理を行うステップと、前処理によって得られた処理済みデータと、細胞または培養液の状態を示す状態データとの複数の組み合わせを学習用データとして用いた機械学習によって、処理済みデータを入力とし、状態データを出力とするソフトセンサを構築するステップとを含む。前処理の方法としては、 スパースモデリング、PCA(主成分分析)、LSA(SVD)(潜在意味解析 (特異値分解))、LDA (線形判別分析)、ICA(独立成分分析)、PLS(部分的最小二乗回帰)等のdimentional reduactionの手法があり、スペクトルデータに含まれる波数または波長毎のスペクトル強度値のうち、学習用データとして用いるものの選別を行う処理を含んでいてもよい。この場合、選別されて残った波数または波長のスペクトル強度値が処理済みデータとなる。スペクトルデータを構成する波数または波長毎のスペクトル強度値は、膨大な数に及ぶことが想定される。学習用データとして用いるデータの選別を行うことでモデルデータへの過学習による予測精度低下を防ぐことができる。スペクトルデータの選別は、例えば、スパースモデリングによって行うことが可能である。すなわち、スペクトルデータについて行われる前処理は、スパースモデリングによって、スペクトルデータのうち、状態データに対する相関性が相対的に低いデータを除外することにより、スペクトルデータのうち、状態データとの相関性が相対的に高い高相関スペクトルデータを、処理済みデータとして特定することを含んでいてもよい。スペクトルデータに含まれる波数または波長毎の強度データのうち、前記学習用データとして用いるものの数を、前処理によって5以上1000未満にまで選別することが好ましく、5以上800以下がより好ましく、5以上500以下がさらに好ましく、11以上334以下が最も好ましい。
 本実施形態において、スパースモデリングとは、スペクトルデータに含まる波数または波長毎のスペクトル強度値を説明変数とし、状態データを目的変数とする回帰モデルついて、説明変数を選別(すなわち、説明変数の一部を除外)すること意味する。スパースモデリングの手法としては、例えば、lasso回帰を用いることが可能である。Lasso回帰は、二乗平均平方根誤差(RMSE: root mean squared error)に罰則項(ペナルティ項)を加算することにより算出されるコスト関数が最小になるように説明変数の選択を行う手法である。本実施形態では、スペクトルデータのうち、状態データとの相関性が相対的に低い低相関スペクトルデータを除外することにより説明変数の選別を行う。罰則項は、例えばK分割交差検証に代表されるcross-validationなどで決定してもよい。以下の説明では、スペクトルデータについて行われる前処理が、高相関スペクトルデータを特定する処理である場合を例に説明する。
 開示の技術の実施形態に係る培養状態の推定方法は、図1に示すように、培養中の細胞を含む細胞懸濁液について取得されたスペクトルデータのうち、高相関スペクトルデータを処理済みデータとしてソフトセンサ20に入力することによってソフトセンサ20から出力される状態データを取得するステップを含む。ソフトセンサ20は、入力される高相関スペクトルデータに基づいて状態データを出力する処理をソフトウェアによって実現するものである。ソフトセンサ20は、後述する情報処理装置10(図2、図5参照)において構築される。
 本実施形態において、ソフトセンサ20は、ラマン分光法による解析手法を適用したものである。すなわち、ソフトセンサ20に入力されるスペクトルデータとして、ラマン散乱光のスペクトルデータが適用される。ラマン分光法は、ラマン散乱光を用いて物質の評価を行う分光法である。光を物質に照射すると、光が物質と相互作用することで入射光と異なる波長を持つラマン散乱光が発生する。入射光とラマン散乱光の波長差は、物質が持つ分子振動のエネルギー分に相当するため、分子構造の異なる物質間で、異なる波長(波数)を持ったラマン散乱光が得られる。また、ラマン散乱光を用いて、応力、温度、電気特性、配向、結晶性などの様々な物性を推定することができる。
 図2は、培養中の細胞を含む細胞懸濁液31についてスペクトルデータを取得する方法の一例を示す図である。細胞は、培養液とともに培養容器30に収容された状態で培養される。スペクトルデータは、公知のラマン分光解析用のプローブ40及びアナライザ41を用いて取得することが可能である。図2に示すように、プローブ40の先端は、培養容器30に収容された細胞及び培養液を含む細胞懸濁液31中に浸漬される。プローブ40の先端に設けられた光出射部(図示せず)から出射した励起光が細胞懸濁液31に照射される。励起光と細胞懸濁液31との相互作用によって発生したラマン散乱光は、プローブ40の先端に設けられた受光部(図示せず)によって受光される。取得されたラマン散乱光は、アナライザ41によって、波数(波長の逆数)毎に分解され、波数毎のスペクトル強度値であるスペクトルデータが生成される。なお、スペクトルデータは、波長毎のスペクトル強度値であってもよい。細胞培養の方式が灌流培養方式である場合においてスペクトルデータを取得する場合、細胞の濃度が35×10cells/mL以上である細胞懸濁液に電磁波を照射することが好ましい。細胞の濃度は、40×10cells/mL以上300×10cells/mL以下であることがより好ましく、60×10cells/mL以上220×10cells/mL以下であることが更に好ましく、80×10cells/mL以上1300×10cells/mL以下であることが最も好ましい。細胞培養が、抗体の製造を目的とする場合、培養する細胞の濃度が高い程、抗体の製造効率を高めることができる。従って、細胞の濃度を35×10cells/mL以上とすることで、一定の製造効率を確保することができる。一方、細胞の濃度が過度に高いと、スペクトルデータに混入するノイズ成分の量が多くなる。ノイズ成分を多く含むスペクトルデータを学習用データとして用いた機械学習によってソフトセンサ20を構築すると、学習モデルの精度低下及び過学習を招き、実使用に耐え得るソフトセンサを構築することができないおそれがある。細胞の濃度が300×10cells/mL以下に調整された細胞懸濁液についてスペクトルデータを取得することで、スペクトルデータに混入するノイズ成分の量を許容範囲に抑えることが可能となる。スペクトルデータは、情報処理装置10に供給される。なお、灌流培養とは、培養容器30から抗体等の産生物を含む培地を連続的に抜き出す一方、新鮮な培地を連続的に培養容器30に供給する方式である。
 ソフトセンサ20から出力される状態データは、スペクトルデータに相関性を有する、細胞または培養液の状態を示すデータである。状態データは、例えば、培養液に含まれる抗体の量、抗体の分解物の量、抗体の凝集物の量または抗体と構造が近似した未成熟糖鎖の量に関するデータであってもよい。抗体は、培養中の細胞から産生される産生物である。また、状態データは、培養液に含まれる成分の量に関するデータであってもよい。なお、「量に関するデータ」は、培養液中における、当該成分の含有量であってもよいし、含有率(濃度)であってもよい。また、状態データは、培養容器30内における生細胞の数に関するデータであってもよい。「生細胞の数に関するデータ」は、培養液中における生細胞の総数であってもよいし、密度であってもよい。これらの状態データは、実測によるインラインモニタが容易ではない。ソフトセンサ20を用いることで、実測によるインラインモニタが比較的容易なスペクトルデータに基づいて、状態データのインラインでの取得が可能となる。
 ソフトセンサ20は、スペクトルデータと状態データとの複数の組み合わせを学習用データとして用いた機械学習によって構築される。図3は、学習用データ50の一例を示す図である。学習用データ50は、例えば、予備的に実施されるテスト培養において取得される。すなわち、学習用のスペクトルデータは、テスト培養において培養容器30内に収容された細胞懸濁液から取得される。学習用の状態データは、テスト培養において培養容器30内で培養されている細胞または培養液を測定対象として、従来のサンプリング手法による実測により取得することが可能である。例えば、学習用の状態データとして培養液に含まれる抗体の濃度を取得する場合、HPLC(high performance liquid chromatography)等の手法を用いることが可能である。テスト培養は、所定期間に亘って行われ、学習用データは、テスト培養期間中における複数の時点で取得される。各時点における学習用のスペクトルデータ及び学習用の状態データは、互いに対応付けられる。
 ここで、アナライザ41は、スペクトルデータとして、例えば波数500cm-1から3000cm-1までの範囲のスペクトル強度値を1cm-1刻みで出力する。従って、取得されるスペクトルデータの数は膨大となり、全てのスペクトルデータを学習用データとして用いると、学習負荷が過大となり、機械学習を実施するために、高性能なプロセッサが必要となる。また、スペクトルデータを構成するラマン散乱光のスペクトル強度値の中には、モニタリング対象の状態データに対する相関性が低い波数のスペクトル強度値が含まれている場合がある。例えば、ラマン散乱光のある特定の波数値のスペクトル強度値は、抗体の濃度に対する相関性が低いことが考えられる。モニタリング対象の状態データとの相関性が低い波数のスペクトル強度値を含むスペクトルデータを学習用データとして用いた機械学習によってソフトセンサ20を構築すると、ソフトセンサ20の出力値の精度が低下するおそれがある。
 そこで、本実施形態においては、スペクトルデータに対する前処理として、アナライザ41から出力されるスペクトルデータのうち、モニタリング対象の状態データとの相関性が相対的に高い波数のスペクトル強度値を高相関スペクトルデータとして特定する。そして、機械学習によってソフトセンサ20を構築する段階である学習フェーズにおいては、高相関スペクトルデータと状態データとの複数の組み合わせを学習データとして用いた機械学習によってソフトセンサ20を構築する。一方、構築されたソフトセンサ20を運用して、培養中の細胞または培養液について状態データを取得する運用フェーズにおいては、図4に示すように、培養中の細胞を含む細胞懸濁液について取得されたスペクトルデータのうち、モニタリング対象の状態データとの相関性が相対的に高い高相関スペクトルデータをソフトセンサ20に入力することによってソフトセンサ20から出力される状態データを取得する。ソフトセンサ20の構築及びソフトセンサ20を用いた状態データの取得は情報処理装置10によって行われる。
 図5は、情報処理装置10のハードウェア構成の一例を示す図である。情報処理装置10は、CPU(Central Processing Unit)101、一時記憶領域としてのメモリ102、及び不揮発性の記憶部103を含む。また、情報処理装置10は、液晶ディスプレイ等の表示部104、キーボードとマウス等の入力部105、ネットワークに接続されるネットワークI/F(InterFace)106、及びアナライザ41が接続される外部I/F107を含む。CPU101、メモリ102、記憶部103、表示部104、入力部105、ネットワークI/F106、及び外部I/F107は、バス108に接続される。
 記憶部103は、HDD(Hard Disk Drive)、SSD(Solid State Drive)、またはフラッシュメモリ等の記憶媒体によって実現される。記憶部103には、学習用データ50、推定モデル60、ソフトセンサ構築プログラム70及び、推定プログラム80が記憶される。学習用データ50は、図3に示すように、スペクトルデータと状態データとの複数の組み合わせであり、テスト培養において取得されたものである。
 図6は、推定モデル60の構造の一例を示す図である。推定モデル60は、入力層、複数の中間層、及び出力層を含むニューラルネットワークとされている。推定モデル60の入力層には、ラマン散乱光の波数毎のスペクトル強度値、すなわちスペクトルデータが入力される。推定モデル60の出力層からは、入力層に入力されたスペクトルデータに対応する状態データが出力される。
 学習フェーズにおいて、CPU101は、記憶部103からソフトセンサ構築プログラム70を読み出してからメモリ102に展開し、実行する。運用フェーズにおいて、CPU101は、記憶部103から推定プログラム80を読み出してからメモリ102に展開し、実行する。なお、情報処理装置10の例としては、サーバコンピュータ等が挙げられる。CPU101は、開示の技術におけるプロセッサの一例である。
 図7は、学習フェーズにおける情報処理装置10の機能的な構成の一例を示す機能ブロック図の一例である。学習フェーズにおいて、情報処理装置10は、特定部11及び学習部12を含んで構成される。記憶部103には、学習用データ50及び推定モデル60が格納されているものとする。
 特定部11は、学習用データ50に対してスパースモデリングの一例であるLasso回帰による回帰分析を行うことにより、学習用データ50に含まれるスペクトルデータのうち、状態データとの相関性が相対的に高い波数のスペクトル強度値を高相関スペクトルデータとして特定する。具体的には、特定部11は、以下の処理を行う。特定部11は、学習用データ50含まれるスペクトルデータについて、ランダムに定めた波数のスペクトル強度値を間引く処理を行い、間引きしたスペクトルデータと対応する状態データとの関係性を示す回帰モデル(回帰式)を生成する。特定部11は生成した回帰モデルについて、二乗平均平方根誤差(RMSE: root mean squared error)に罰則項を加算したコスト関数を導出する。特定部11は、上記の各処理を所定回数繰り返し実施することにより、間引きされる波数が互いに異なる複数のスペクトルデータの各々について回帰モデルを生成するとともに、各回帰モデルについて上記のコスト関数を導出する。特定部11は、所定回数の繰り返し計算の中で、上記のコスト関数を最小とすることが可能な最少数のスペクトル強度値を高相関スペクトルデータとして特定する。例えば、グルタミンに本前処理を適用した場合、本前処理前のスペクトルデータの数:2500個、コスト関数:0.23に対し、前処理後のスペクトルデータの数:20個、コスト関数:0.015の結果を得た。
 学習部12は、学習用データ50のうち、特定部11によって特定された高相関スペクトルデータと、対応する状態データとの組み合わせを教師データとして用いた機械学習によって、推定モデル60を学習させる。これにより、高相関スペクトルデータを入力とし、状態データを出力とするソフトセンサ20が構築される。
 学習部12は、学習用データ50を用いて、機械学習の一例としての誤差逆伝播法に従って、推定モデル60を学習させる。具体的には、学習部12は、学習用データ50に含まれる、学習用のスペクトルデータから、特定部11によって特定された高相関スペクトルデータを抽出する。学習部12は抽出した高相関スペクトルデータを推定モデル60に入力し、推定モデル60から出力される状態データを取得する。学習部12は、取得した状態データによって示されるスコア(例えば、抗体の濃度を示すスコア)と、学習用データ50に含まれる、当該高相関スペクトルデータに対応する学習用の状態データによって示されるスコアとの差が最小となるように、推定モデル60を学習させる。学習部12は、推定モデル60を学習させる処理を、学習用データ50に含まれる高相関スペクトルデータと、状態データとの全部または一部の組み合わせを用いて行う。なお、機械学習の手法としては、誤差逆伝播法の他、ランダムフォレスト、線形回帰、非線形回帰(SVM:Sapport vector machine、ベイジアン回帰)、ロジスティック回帰等、挙げられるが、誤差逆伝搬法が好ましい。
 図8は、学習フェーズにおいて、CPU101が、ソフトセンサ構築プログラム70を実行することによって実施されるソフトセンサ構築処理の流れの一例を示すフローチャートである。ソフトセンサ構築プログラム70は、例えば、ユーザによって入力部105を介してソフトセンサ構築処理の実行指示が入力された場合に実行される。
 ステップS1において、特定部11は、記憶部103に格納されている学習用データ50に含まれるスペクトルデータから除外する波数のスペクトル強度値をランダムに選択する。すなわち、特定部11は、波数1cm-1刻みで取得されるスペクトル強度値のうち、一部の波数についてのスペクトル強度値を間引く処理を行う。除外する波数の数は、予め定められた数であってもよいし、ランダムに定められた数であってもよい。
 ステップS2において、特定部11は、ステップS1において選択された除外対象の波数以外の波数のスペクトル強度値によって構成されるスペクトルデータ(すなわち、間引きされたスペクトルデータ)と、対応する状態データとの関係性を示す回帰モデル(回帰式)を生成する。具体的には、間引きされたスペクトルデータを説明変数とし、対応する状態データを目的変数とする回帰モデルを統計的手法によって推計する。回帰モデルは、線形モデルであってもよいし、非線形モデルであってもよい。
 ステップS3において、特定部11は、ステップS2において生成した回帰モデルについてコスト関数を導出する。コスト関数は、回帰モデルの精度を示す指標値として用いられる。
 ステップS4において、特定部11は、ステップS1からステップS3までの処理の繰り返し回数が所定回数に達したか否かを判定する。特定部11は、繰り返し回数が所定回数に達するまで、ステップS1からステップS3までの処理を繰り返し実施する。これにより、除外対象の波数が互いに異なる複数の間引きされたスペクトルデータの各々について回帰モデルが生成され、生成された回帰モデルの各々についてコスト関数が導出される。
 ステップS5において、特定部11は、コスト関数が最小となる回帰モデルを生成する際に用いた、間引きされたスペクトルデータを高相関スペクトルデータとして特定する。コスト関数が最小となる回帰モデルを生成する際に用いたスペクトルデータは、状態データとの相関性が相対的に高い波数のスペクトル強度値によって構成される。このように特定部11は、回帰分析により、状態データとの相関性が相対的に高い波数のスペクトル強度値によって構成されるスペクトルデータを高相関スペクトルデータとして特定する。
 ステップS6において、学習部12は、記憶部103に格納された学習用データ50に含まれるスペクトルデータからステップS5において特定された高相関スペクトルデータを抽出し、抽出した高相関スペクトルデータと、対応する状態データとの複数の組み合わせを教師データとする機械学習により推定モデル60を学習させる。具体的には、学習部12は、ステップS5において特定された高相関スペクトルデータを推定モデル60に入力し、推定モデル60から出力される状態データによって示されるスコアと、学習用データ50に含まれる、当該高相関スペクトルデータに対応する学習用の状態データによって示されるスコアとの差が最小となるように、推定モデル60を学習させる。これにより、ソフトセンサ20が構築される。
 ソフトセンサ20は、モニタリングしようとする状態データの種別毎に構築される。例えば、培養液に含まれる抗体の量に関するデータを状態データとしてソフトセンサ20に出力させる場合、スペクトルデータのうち抗体の量に対して高い相関性を有する波数のスペクトル強度値が高相関スペクトルデータとして特定される。そして、特定された高相関スペクトルデータと、実測によって取得された抗体の量に関する状態データとの複数の組み合わせを学習用データとして用いた機械学習によって、高相関スペクトルデータに基づいて抗体の量に関する推定値を出力するソフトセンサ20が構築される。一方、細胞の数に関するデータを状態データとしてソフトセンサ20に出力させる場合、スペクトルデータのうち細胞の数に対して高い相関性を有する波数のスペクトル強度値が高相関スペクトルデータとして特定される。そして、特定された高相関スペクトルデータと、実測によって取得された細胞の数に関する状態データとの複数の組み合わせを学習用データとして用いた機械学習によって、高相関スペクトルデータに基づいて細胞の数に関する推定値を出力するソフトセンサ20が構築される。
 図9は、運用フェーズにおける情報処理装置10の機能的な構成の一例を示す機能ブロック図の一例である。運用フェーズにおいて、情報処理装置10は、取得部13、抽出部14及び推定部15を含んで構成される。記憶部103には、ソフトセンサ20として機能する学習済みの推定モデル60が格納されているものとする。
 開示の技術の実施形態に係る培養状態の推定方法は、例えば、培養容器に収容された培養中の細胞または培養液の状態を推定する場合に適用される。図2に示すように、培養容器30に収容された培養中の細胞を含む細胞懸濁液31についてプローブ40及びアナライザ41によってスペクトルデータが取得される。
 取得部13は、アナライザ41から出力されるスペクトルデータを取得する。抽出部14は、取得部13によって取得されたスペクトルデータのうち、特定部11によって特定された高相関スペクトルデータ、すなわち、モニタリング対象の状態データとの相関性が相対的に高い波数のスペクトル強度値を抽出する。
 推定部15は、ソフトセンサ20として機能する学習済みの推定モデル60を記憶部103から読み出して、抽出部14によって抽出された高相関スペクトルデータを、推定モデル60に入力し、推定モデル60から出力される状態データを取得する。推定部15は、取得した状態データを表示部104に表示させる制御を行ってもよい。また、推定部15は、取得した状態データを記憶部103に記憶させてもよい。
 図10は、運用フェーズにおいて、CPU101が、推定プログラム80を実行することによって実施される推定処理の流れの一例を示すフローチャートである。推定プログラム80は、例えば、ユーザによって入力部105を介して推定処理の実行指示が入力された場合に実行される。
 ステップS11において、取得部13は、アナライザ41から出力されるスペクトルデータを取得する。ステップS12において、抽出部14は、取得部13によって取得されたスペクトルデータのうち、特定部11によって特定された高相関スペクトルデータ、すなわち、モニタリング対象の状態データとの相関性が相対的に高い波数のスペクトル強度値を抽出する。ステップS13において推定部15は、ソフトセンサ20として機能する学習済みの推定モデル60を記憶部103から読み出して、ステップS12において抽出された高相関スペクトルデータを、読み出した推定モデル60に入力し、推定モデル60から出力される状態データを取得する。推定部15は、取得した状態データを表示部104に表示させる制御を行う。
 図11は、ソフトセンサ20を用いて取得された状態データの一例を示す図である。ソフトセンサ20を用いることで、細胞に関する項目として、例えば生細胞密度を推定することが可能である。また、ソフトセンサ20を用いることで、産生物に関する項目として、例えば抗体濃度、抗体と構造が近似した未成熟糖鎖の濃度、抗体凝集物の濃度及び抗体分解物の濃度を推定することが可能である。また、ソフトセンサ20を用いることで、培養液に含まれる成分に関する項目として、例えば乳酸の濃度、グルコースの濃度、クエン酸の濃度、グルタミンの濃度、アスパラギンの濃度、フェニルアラニンの濃度及びロイシンの濃度を推定することが可能である。
 図12A~図12Lは、ソフトセンサ20から出力された状態データである、図11に示した各項目の推定値と、サンプリングによって取得した実測値との関係を示すグラフである。いずれの項目においても、ソフトセンサ20によって取得した推定値の、実測値からの乖離の程度を示す決定係数Rの値が0.95以上であり、ソフトセンサ20の出力値の精度が極めて高いことが確認された。
 図13は、培養液に含まれるグルタミンの濃度の推定値を、ソフトセンサ20を用いて取得した場合及び従来のPLSによる多変量解析手法を用いて取得した場合のそれぞれについて、実測値との関係を示したグラフである。図14A及び図14Bは、培養液に含まれる各成分の濃度の推定値を、ソフトセンサ20を用いて取得した場合及び従来のPLSによる多変量解析手法を用いて取得した場合について、実測値からの乖離の程度を示す決定係数Rを示したグラフである。ソフトセンサ20を用いる場合については、高相関スペクトルデータを特定する前処理を実施した場合及び前処理を実施しない場合のそれぞれの場合について決定係数Rを取得した。各手法(ソフトセンサ(前処理あり)、ソフトセンサ(前処理なし)、PLS)における濃度推定において使用した波数の数(説明変数の数)を表1に示す。PSLの場合、ラマン散乱光の全波数帯(2500)を解析対象に含めた場合、精度が著しく悪くなる。そのため、濃度推定を行う上記各成分に存在するC-H、C-O等の結合に起因したピークが立つといわれている500cm-1から1500cm-1までの1000個の波数を解析対象とした。各手法における濃度推定に使用したスペクトルデータは、同一の培養実験にて得られたスペクトルデータである。なお、乳酸及びクエン酸の濃度については、PLSによる多変量解析手法を用いて推定値を取得することはできなかった。図13、図14A及び図14Bに示すように、培養液に含まれるいずれの成分についても、ソフトセンサ20を用いて取得した推定値は、従来のPLSによる多変量解析手法を用いて取得した推定値よりも高精度であることが確認された。また、ソフトセンサ20を用いる場合において、高相関スペクトルデータを特定する前処理を実施することによって、推定値の精度が更に高くなることが確認された。本実施形態では、前処理によって、スペクトルデータに含まれる波数または波長毎のスペクトル強度値(データ数2500)のうち、ソフトセンサ20を構築する際の学習用データとして用いるものの数を11以上334以下にまで選別した。
Figure JPOXMLDOC01-appb-T000001

 
 以上のように、開示の技術の実施形態に係る培養状態の推定方法によれば、培養中の細胞を含む細胞懸濁液について取得されたスペクトルデータをソフトセンサに入力することによってソフトセンサから出力される状態データを取得することで、培養状態の推定が行われる。スペクトルデータは、実測によるインラインモニタが比較的容易であるため、培養状態の推定をインラインで行うことが可能である。また、培養状態の推定結果を、即時に取得することができるので、培養期間中に何等かの異常が生じた場合に即時に対処することが可能となる。
 また、ソフトセンサは、実際の培養環境下において取得されたスペクトルデータと状態データとの複数の組み合わせを学習用データとして用いた機械学習によって構築されるので、培養容器内の細胞の密度が高く、且つモニタリング対象の含有量が少ない実際の培養環境下においても、PLS等の多変量解析手法を用いて細胞状態の推定を行う場合と比較して、高い精度で培養状態の推定を行うことが可能である。
 また、アナライザ41から出力されるスペクトルデータのうち、モニタリング対象の状態データとの相関性が相対的に高い波数のスペクトル強度値によって構成される高相関スペクトルデータが学習データとして用いられるので、アナライザ41から出力される全てのスペクトルデータを学習用データとして用いる場合と比較して、学習負荷を小さくすることができ、また、ソフトセンサ20の出力値の精度を向上させることが可能となる。状態データについて、ソフトセンサによって取得した推定値とサンプリングによって取得した実測値からの乖離の程度を示す決定係数Rの値は0.8以上であることが好ましく、0.9以上がより好ましく、0.95以上が最も好ましい。
 また、開示の技術の実施形態に係る培養状態の推定方法によれば、培養液に含まれる抗体の量、抗体の分解物の量、抗体の凝集物の量または抗体と構造が類似した未成熟糖鎖の量に関する推定値を、状態データとして取得することが可能である。抗体の分解物は、培養中に生成される分解酵素により抗体が分解することにより形成される。抗体の凝集物は、例えば、細胞から産生される抗体の濃度が過度に高くなる、または熱等のストレスが加わると、形成されやすい。抗体と構造が類似した未成熟糖鎖は、例えば、培養液中の老廃物の量が増加する、または培養液中の酸素濃度が不足すると形成されやすい。抗体の分解物、抗体の凝集物、及び抗体と構造が類似した未成熟糖鎖については、培養期間中における生成量を極力少なくすることが好ましい。従って、抗体の分解物の量、抗体の凝集物の量または抗体と構造が類似した未成熟糖鎖の量に関する推定値を状態データとして取得することは、良好な培養状態を維持する上で有効である。
 また、開示の技術の実施形態に係る培養状態の推定方法によれば、培養液に含まれる成分の量に関する推定値を、状態データとして取得することが可能である。培養液には、細胞の培養に必要な栄養分等が含まれる。培養期間中において、必要な栄養分が培養液に過不足なく含まれていることが好ましい。従って、培養液に含まれる成分の量に関する推定値を状態データとして取得することは、良好な培養状態を維持する上で有効である。
 また、開示の技術の実施形態に係る培養状態の推定方法によれば、培養容器30内で培養されている細胞の数に関する推定値を状態データとして取得することが可能である。培養容器30内で培養されている細胞の数が過度に多くなると、細胞に供給される酸素及び栄養分が不足し、細胞の生存率が低下するおそれがある。一方、抗体の製造を目的とする細胞培養においては、培養容器30内で培養されている細胞の数が過度に少なくなると、抗体の製造効率が低下する。従って、培養容器30内で培養されている細胞の数に関する推定値を状態データとして取得することは、良好な培養状態を維持する上で有効である。
 なお、本実施形態では、スペクトルデータとして、ラマン散乱光のスペクトルを用いる形態を例示したが、この態様に限定されない。例えば、細胞懸濁液に照射された赤外線の吸収スペクトルをスペクトルデータとして用いることも可能である。また、核磁気共鳴スペクトルをスペクトルデータとして用いることも可能である。
 また、本実施形態では、スペクトルデータについて前処理を行い、前処理によって得られた処理済みデータと状態データとの複数の組み合わせを学習用データとして用いた機械学習によってソフトセンサを構築する場合を例示したが、学習負荷及び過学習による推定モデルの精度低下が問題とならない場合には、前処理が施されていないスペクトルデータを、学習用データとして用いてもよい。
 また、本実施形態では、前処理として、スペクトルデータのうち、状態データとの相関性が相対的に高い高相関スペクトルデータを特定する処理を例示したが、これに限定されるものではない。例えば、アナライザ41によって取得されたスペクトルデータのうち、予め定められた波数のスペクトル強度値を学習用データから除外する処理を前処理として行ってもよい。また、アナライザ41によって取得されたスペクトルデータについて、波数の近いもの同士が同じ波数グループに属するようにグループ分けを行い、波数グループ毎に散乱光の強度の平均値、標準偏差、中央値、最大値、最小値等を算出する処理を前処理として行ってもよい。この場合、波数グループ毎のスペクトル強度値が学習用データとして用いられる。また、波数または波長毎の強度を示すスペクトルデータと状態データとの複数の組み合わせによって構成される学習データについて、次元数を削減する処理を前処理として行ってもよい。
 また、上記実施形態において、例えば、特定部11、学習部12、取得部13、抽出部14、推定部15といった各種の処理を実行する処理部(processing unit)のハードウェア的な構造としては、次に示す各種のプロセッサ(processor)を用いることができる。上記各種のプロセッサには、前述したように、ソフトウェア(プログラム)を実行して各種の処理部として機能する汎用的なプロセッサであるCPUに加えて、FPGA等の製造後に回路構成を変更可能なプロセッサであるプログラマブルロジックデバイス(Programmable Logic Device:PLD)、ASIC(Application Specific Integrated Circuit)等の特定の処理を実行させるために専用に設計された回路構成を有するプロセッサである専用電気回路等が含まれる。
 1つの処理部は、これらの各種のプロセッサのうちの1つで構成されてもよいし、同種または異種の2つ以上のプロセッサの組み合わせ(例えば、複数のFPGAの組み合わせや、CPUとFPGAとの組み合わせ)で構成されてもよい。また、複数の処理部を1つのプロセッサで構成してもよい。
 複数の処理部を1つのプロセッサで構成する例としては、第1に、クライアント及びサーバ等のコンピュータに代表されるように、1つ以上のCPUとソフトウェアの組み合わせで1つのプロセッサを構成し、このプロセッサが複数の処理部として機能する形態がある。第2に、システムオンチップ(System on Chip:SoC)等に代表されるように、複数の処理部を含むシステム全体の機能を1つのIC(Integrated Circuit)チップで実現するプロセッサを使用する形態がある。このように、各種の処理部は、ハードウェア的な構造として、上記各種のプロセッサの1つ以上を用いて構成される。
 更に、これらの各種のプロセッサのハードウェア的な構造としては、より具体的には、半導体素子などの回路素子を組み合わせた電気回路(circuitry)を用いることができる。
 また、上記実施形態では、ソフトセンサ構築プログラム70及び推定プログラム80が記憶部103に予め記憶(インストール)されている態様を説明したが、これに限定されない。ソフトセンサ構築プログラム70及び推定プログラム80は、CD-ROM(Compact Disc Read Only Memory)、DVD-ROM(Digital Versatile Disc Read Only Memory)、及びUSB(Universal Serial Bus)メモリ等の記録媒体に記録された形態で提供されてもよい。また、ソフトセンサ構築プログラム70及び推定プログラム80は、ネットワークを介して外部装置からダウンロードされる形態としてもよい。
 なお、2020年4月21日に出願された日本国特許出願2020-075480の開示は、その全体が参照により本明細書に取り込まれる。また、本明細書に記載された全ての文献、特許出願および技術規格は、個々の文献、特許出願、および技術規格が参照により取り込まれることが具体的かつ個々に記された場合と同程度に、本明細書中に参照により取り込まれる。

Claims (12)

  1.  細胞及び培養液を含み、前記細胞の濃度が35×10cells/mL以上である細胞懸濁液に照射され、前記細胞懸濁液による作用を受けた電磁波の、波数または波長毎の強度を示すスペクトルデータを取得し、
     前記スペクトルデータと前記細胞または前記培養液の状態を示す状態データとの複数の組み合わせを学習用データとして用いた機械学習によって前記スペクトルデータを入力とし、前記状態データを出力とするソフトセンサを構築し、
     培養中の細胞を含む細胞懸濁液について取得された前記スペクトルデータを前記ソフトセンサに入力することによって前記ソフトセンサから出力される前記状態データを取得する
     ことを含む培養状態の推定方法。
  2.  細胞及び培養液を含む細胞懸濁液に照射され、前記細胞懸濁液による作用を受けた電磁波の、波数または波長毎の強度を示すスペクトルデータを取得し、
     前記スペクトルデータについて前処理を行い、
     前記前処理によって得られた処理済みデータと前記細胞または前記培養液の状態を示す状態データとの複数の組み合わせを学習用データとして用いた機械学習によって前記処理済みデータを入力とし、前記状態データを出力とするソフトセンサを構築し、
     培養中の細胞を含む細胞懸濁液について取得された前記スペクトルデータについての前記処理済みデータを前記ソフトセンサに入力することによって前記ソフトセンサから出力される前記状態データを取得する
     ことを含む培養状態の推定方法。
  3.  前記前処理は、前記スペクトルデータに含まれる波数または波長毎のスペクトル強度値のうち、前記学習用データとして用いるものの選別を行う処理を含む
     請求項2に記載の推定方法。
  4.  前記選別により、前記スペクトルデータに含まれる波数または波長毎の強度のうち、前記学習用データとして用いるものの数を5以上1000未満とする
     請求項3に記載の推定方法。
  5.  前記選別をスパースモデリングによって行う
     請求項3または請求項4に記載の推定方法。
  6.  前記前処理は、前記スペクトルデータのうち、前記状態データとの相関性が相対的に高い高相関スペクトルデータを、前記処理済みデータとして特定することを含む
     請求項2から請求項5のいずれか1項に記載の推定方法。
  7.  前記スペクトルデータは、前記細胞懸濁液に照射された光の散乱光のスペクトルを示すデータである
     請求項1から請求項6のいずれか1項に記載の推定方法。
  8.  前記状態データは、前記培養液に含まれる抗体の量、前記抗体の分解物の量、前記抗体の凝集物の量または前記抗体と構造が類似した未成熟糖鎖の量に関するデータである
     請求項1から請求項7のいずれか1項に記載の推定方法。
  9.  前記状態データは、前記培養液に含まれる成分の量に関するデータである
     請求項1から請求項7のいずれか1項に記載の推定方法。
  10.  前記状態データは、前記細胞の数に関するデータである
     請求項1から請求項7のいずれか1項に記載の推定方法。
  11.  少なくとも1つのプロセッサを含む情報処理装置であって、
     前記プロセッサは、
     細胞及び培養液を含む細胞懸濁液に照射され、前記細胞懸濁液による作用を受けた電磁波の、波数または波長毎の強度を示すスペクトルデータについて前処理を行い、
     前記前処理によって得られた処理済みデータと前記細胞または前記培養液の状態を示す状態データとの複数の組み合わせを学習用データとして用いた機械学習によって前記処理済みデータを入力とし、前記状態データを出力とするソフトセンサを構築する
     情報処理装置。
  12.  細胞及び培養液を含む細胞懸濁液に照射され、前記細胞懸濁液による作用を受けた電磁波の、波数または波長毎の強度を示すスペクトルデータについて前処理を行い、
     前記前処理によって得られた処理済みデータと前記細胞または前記培養液の状態を示す状態データとの複数の組み合わせを学習用データとして用いた機械学習によって前記処理済みデータを入力とし、前記状態データを出力とするソフトセンサを構築する
     処理をコンピュータに実行させるためのプログラム。
PCT/JP2021/012016 2020-04-21 2021-03-23 培養状態の推定方法、情報処理装置及びプログラム WO2021215179A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2022516908A JPWO2021215179A1 (ja) 2020-04-21 2021-03-23
EP21793623.6A EP4119674A4 (en) 2020-04-21 2021-03-23 METHOD FOR ESTIMATING THE STATE OF A CROP, INFORMATION PROCESSING DEVICE AND PROGRAM
US18/047,384 US20230081615A1 (en) 2020-04-21 2022-10-18 Method for estimating culture state, information processing device, and program

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2020075480 2020-04-21
JP2020-075480 2020-04-21

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US18/047,384 Continuation US20230081615A1 (en) 2020-04-21 2022-10-18 Method for estimating culture state, information processing device, and program

Publications (1)

Publication Number Publication Date
WO2021215179A1 true WO2021215179A1 (ja) 2021-10-28

Family

ID=78270623

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2021/012016 WO2021215179A1 (ja) 2020-04-21 2021-03-23 培養状態の推定方法、情報処理装置及びプログラム

Country Status (4)

Country Link
US (1) US20230081615A1 (ja)
EP (1) EP4119674A4 (ja)
JP (1) JPWO2021215179A1 (ja)
WO (1) WO2021215179A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023090015A1 (ja) * 2021-11-22 2023-05-25 富士フイルム株式会社 情報処理装置、情報処理装置の作動方法、情報処理装置の作動プログラム、校正済み状態予測モデルの生成方法、並びに校正済み状態予測モデル
EP4339277A1 (en) * 2022-08-24 2024-03-20 Yokogawa Electric Corporation Cell culture system and cell culture method
WO2024070544A1 (ja) * 2022-09-30 2024-04-04 富士フイルム株式会社 分光分析装置のセンサ部、測定システム、および測定方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008526203A (ja) 2004-12-29 2008-07-24 バイオジェン・アイデック・エムエイ・インコーポレイテッド バイオリアクタープロセス制御システムおよび方法
JP2019110767A (ja) 2017-12-20 2019-07-11 株式会社日立製作所 細胞培養装置の制御方法及び制御システム
WO2020039683A1 (ja) * 2018-08-22 2020-02-27 富士フイルム株式会社 細胞培養支援装置の作動プログラム、細胞培養支援装置、細胞培養支援装置の作動方法
JP2020075480A (ja) 2018-11-09 2020-05-21 大日本印刷株式会社 バリアフィルム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1287114B1 (en) * 2000-06-08 2016-08-10 The Regents of The University of California Visual-servoing optical microscopy
WO2013138513A1 (en) * 2012-03-13 2013-09-19 The Regents Of The University Of California Application of light scattering patterns to determine differentiation status of stem cells and stem cell colonies
WO2016208356A1 (ja) * 2015-06-26 2016-12-29 株式会社ニコン 判定装置、判定プログラム、判定方法、細胞シート製造装置、および細胞シート製造方法
CN111344558A (zh) * 2017-10-06 2020-06-26 龙沙有限公司 使用拉曼光谱法自动控制细胞培养
WO2019175959A1 (ja) * 2018-03-13 2019-09-19 株式会社島津製作所 細胞状態判定方法及び細胞状態判定装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008526203A (ja) 2004-12-29 2008-07-24 バイオジェン・アイデック・エムエイ・インコーポレイテッド バイオリアクタープロセス制御システムおよび方法
JP2019110767A (ja) 2017-12-20 2019-07-11 株式会社日立製作所 細胞培養装置の制御方法及び制御システム
WO2020039683A1 (ja) * 2018-08-22 2020-02-27 富士フイルム株式会社 細胞培養支援装置の作動プログラム、細胞培養支援装置、細胞培養支援装置の作動方法
JP2020075480A (ja) 2018-11-09 2020-05-21 大日本印刷株式会社 バリアフィルム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023090015A1 (ja) * 2021-11-22 2023-05-25 富士フイルム株式会社 情報処理装置、情報処理装置の作動方法、情報処理装置の作動プログラム、校正済み状態予測モデルの生成方法、並びに校正済み状態予測モデル
EP4339277A1 (en) * 2022-08-24 2024-03-20 Yokogawa Electric Corporation Cell culture system and cell culture method
WO2024070544A1 (ja) * 2022-09-30 2024-04-04 富士フイルム株式会社 分光分析装置のセンサ部、測定システム、および測定方法

Also Published As

Publication number Publication date
JPWO2021215179A1 (ja) 2021-10-28
EP4119674A1 (en) 2023-01-18
EP4119674A4 (en) 2023-09-13
US20230081615A1 (en) 2023-03-16

Similar Documents

Publication Publication Date Title
WO2021215179A1 (ja) 培養状態の推定方法、情報処理装置及びプログラム
Sun et al. Recent developments of artificial intelligence in drying of fresh food: A review
Chen et al. A fuzzy optimization strategy for the implementation of RBF LSSVR model in vis–NIR analysis of pomelo maturity
Kutsanedzie et al. Advances in nondestructive methods for meat quality and safety monitoring
Le Application of deep learning and near infrared spectroscopy in cereal analysis
Jiang et al. Comparison of algorithms for wavelength variables selection from near-infrared (NIR) spectra for quantitative monitoring of yeast (Saccharomyces cerevisiae) cultivations
Yao et al. Nondestructive detection for egg freshness grade based on hyperspectral imaging technology
Basile et al. Use of artificial neural networks and NIR spectroscopy for non-destructive grape texture prediction
He et al. Discrimination of grape seeds using laser-induced breakdown spectroscopy in combination with region selection and supervised classification methods
Jiang et al. Qualitative and quantitative analysis in solid-state fermentation of protein feed by FT-NIR spectroscopy integrated with multivariate data analysis
Huang et al. Assessment of tomato maturity in different layers by spatially resolved spectroscopy
Ye et al. NIR hyperspectral imaging technology combined with multivariate methods to identify shrimp freshness
Song et al. Black heart detection in white radish by hyperspectral transmittance imaging combined with chemometric analysis and a successive projections algorithm
Jiang et al. Maturity Stage Discrimination of Camellia oleifera fruit using visible and near-infrared hyperspectral imaging
Shao et al. Near-infrared spectroscopy for classification of oranges and prediction of the sugar content
Li et al. Near-infrared spectroscopy coupled chemometric algorithms for rapid origin identification and lipid content detection of Pinus koraiensis seeds
Jiang et al. Rapid identification of fermentation stages of bioethanol solid-state fermentation (SSF) using FT-NIR spectroscopy: comparisons of linear and non-linear algorithms for multiple classification issues
US20240018185A1 (en) Method for estimating purified state
Gomes et al. Prediction of sugar content in port wine vintage grapes using machine learning and hyperspectral imaging
Escuredo et al. Rapid estimation of potato quality parameters by a portable near-infrared spectroscopy device
Jiang et al. Detecting total acid content quickly and accurately by combining hyperspectral imaging and an optimized algorithm method
Wang et al. Simultaneous prediction of peach firmness and weight using vibration spectra combined with one-dimensional convolutional neural network
Chen et al. Advanced nondestructive detection technologies in food
Feng et al. A novel genetic algorithm-based optimization framework for the improvement of near-infrared quantitative calibration models
Yu et al. Is this pear sweeter than this apple? A universal SSC model for fruits with similar physicochemical properties

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 21793623

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2022516908

Country of ref document: JP

Kind code of ref document: A

ENP Entry into the national phase

Ref document number: 2021793623

Country of ref document: EP

Effective date: 20221010

NENP Non-entry into the national phase

Ref country code: DE