JP2024073504A - 培養状態の推定方法、情報処理装置及びプログラム - Google Patents
培養状態の推定方法、情報処理装置及びプログラム Download PDFInfo
- Publication number
- JP2024073504A JP2024073504A JP2024033386A JP2024033386A JP2024073504A JP 2024073504 A JP2024073504 A JP 2024073504A JP 2024033386 A JP2024033386 A JP 2024033386A JP 2024033386 A JP2024033386 A JP 2024033386A JP 2024073504 A JP2024073504 A JP 2024073504A
- Authority
- JP
- Japan
- Prior art keywords
- data
- culture
- cells
- spectral
- state
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 97
- 230000010365 information processing Effects 0.000 title claims abstract description 23
- 230000003595 spectral effect Effects 0.000 claims abstract description 173
- 239000006285 cell suspension Substances 0.000 claims abstract description 41
- 238000007781 pre-processing Methods 0.000 claims abstract description 40
- 238000010801 machine learning Methods 0.000 claims abstract description 24
- 210000004027 cell Anatomy 0.000 claims description 78
- 230000002596 correlated effect Effects 0.000 claims description 33
- 230000008569 process Effects 0.000 claims description 27
- 238000001228 spectrum Methods 0.000 claims description 12
- 239000001963 growth medium Substances 0.000 claims description 11
- 239000007857 degradation product Substances 0.000 claims description 8
- 210000004748 cultured cell Anatomy 0.000 claims description 3
- 239000012531 culture fluid Substances 0.000 abstract description 18
- 238000005259 measurement Methods 0.000 description 23
- 238000005516 engineering process Methods 0.000 description 22
- 238000001069 Raman spectroscopy Methods 0.000 description 16
- 238000010586 diagram Methods 0.000 description 16
- 230000006870 function Effects 0.000 description 16
- 238000005070 sampling Methods 0.000 description 15
- 238000010238 partial least squares regression Methods 0.000 description 14
- 238000012544 monitoring process Methods 0.000 description 11
- 238000012545 processing Methods 0.000 description 11
- 238000003860 storage Methods 0.000 description 11
- 238000000491 multivariate analysis Methods 0.000 description 10
- 230000000875 corresponding effect Effects 0.000 description 7
- 238000004113 cell culture Methods 0.000 description 6
- KRKNYBCHXYNGOX-UHFFFAOYSA-N citric acid Chemical compound OC(=O)CC(O)(C(O)=O)CC(O)=O KRKNYBCHXYNGOX-UHFFFAOYSA-N 0.000 description 6
- 239000000523 sample Substances 0.000 description 6
- 238000012360 testing method Methods 0.000 description 6
- 238000012549 training Methods 0.000 description 6
- 238000000605 extraction Methods 0.000 description 5
- 239000000047 product Substances 0.000 description 5
- 239000000126 substance Substances 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 238000010276 construction Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 4
- JVTAAEKCZFNVCJ-UHFFFAOYSA-N lactic acid Chemical compound CC(O)C(O)=O JVTAAEKCZFNVCJ-UHFFFAOYSA-N 0.000 description 4
- 238000004611 spectroscopical analysis Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000000354 decomposition reaction Methods 0.000 description 3
- 239000002609 medium Substances 0.000 description 3
- 235000015097 nutrients Nutrition 0.000 description 3
- 230000005856 abnormality Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 2
- 238000002790 cross-validation Methods 0.000 description 2
- 230000005284 excitation Effects 0.000 description 2
- 238000004128 high performance liquid chromatography Methods 0.000 description 2
- 230000016784 immunoglobulin production Effects 0.000 description 2
- 238000012880 independent component analysis Methods 0.000 description 2
- 239000004310 lactic acid Substances 0.000 description 2
- 235000014655 lactic acid Nutrition 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 229910052760 oxygen Inorganic materials 0.000 description 2
- 239000001301 oxygen Substances 0.000 description 2
- 230000010412 perfusion Effects 0.000 description 2
- 238000000513 principal component analysis Methods 0.000 description 2
- 238000000611 regression analysis Methods 0.000 description 2
- 239000013076 target substance Substances 0.000 description 2
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 238000000862 absorption spectrum Methods 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000012136 culture method Methods 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000012737 fresh medium Substances 0.000 description 1
- 239000007789 gas Substances 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000001678 irradiating effect Effects 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 238000000655 nuclear magnetic resonance spectrum Methods 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 230000000704 physical effect Effects 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000002798 spectrophotometry method Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 238000009423 ventilation Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12M—APPARATUS FOR ENZYMOLOGY OR MICROBIOLOGY; APPARATUS FOR CULTURING MICROORGANISMS FOR PRODUCING BIOMASS, FOR GROWING CELLS OR FOR OBTAINING FERMENTATION OR METABOLIC PRODUCTS, i.e. BIOREACTORS OR FERMENTERS
- C12M41/00—Means for regulation, monitoring, measurement or control, e.g. flow regulation
- C12M41/48—Automatic or computerized control
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K16/00—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12M—APPARATUS FOR ENZYMOLOGY OR MICROBIOLOGY; APPARATUS FOR CULTURING MICROORGANISMS FOR PRODUCING BIOMASS, FOR GROWING CELLS OR FOR OBTAINING FERMENTATION OR METABOLIC PRODUCTS, i.e. BIOREACTORS OR FERMENTERS
- C12M41/00—Means for regulation, monitoring, measurement or control, e.g. flow regulation
- C12M41/30—Means for regulation, monitoring, measurement or control, e.g. flow regulation of concentration
- C12M41/36—Means for regulation, monitoring, measurement or control, e.g. flow regulation of concentration of biomass, e.g. colony counters or by turbidity measurements
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12M—APPARATUS FOR ENZYMOLOGY OR MICROBIOLOGY; APPARATUS FOR CULTURING MICROORGANISMS FOR PRODUCING BIOMASS, FOR GROWING CELLS OR FOR OBTAINING FERMENTATION OR METABOLIC PRODUCTS, i.e. BIOREACTORS OR FERMENTERS
- C12M41/00—Means for regulation, monitoring, measurement or control, e.g. flow regulation
- C12M41/46—Means for regulation, monitoring, measurement or control, e.g. flow regulation of cellular or enzymatic activity or functionality, e.g. cell viability
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/62—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
- G01N21/63—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
- G01N21/65—Raman scattering
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/20—Supervised data analysis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B5/00—ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
- G16B5/30—Dynamic-time models
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2317/00—Immunoglobulins specific features
- C07K2317/10—Immunoglobulins specific features characterized by their source of isolation or production
- C07K2317/14—Specific host cells or culture conditions, e.g. components, pH or temperature
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
Landscapes
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Organic Chemistry (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- General Health & Medical Sciences (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- Biotechnology (AREA)
- Genetics & Genomics (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Microbiology (AREA)
- Sustainable Development (AREA)
- Biophysics (AREA)
- Medical Informatics (AREA)
- Computer Hardware Design (AREA)
- Immunology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Biology (AREA)
- General Physics & Mathematics (AREA)
- Pathology (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Physiology (AREA)
- Databases & Information Systems (AREA)
- Cell Biology (AREA)
- Medicinal Chemistry (AREA)
- Artificial Intelligence (AREA)
- Bioethics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Epidemiology (AREA)
Abstract
【課題】推定結果を即時に得ることができ、培養容器内の細胞の密度が高く、且つモニタリング対象の含有量が少ない場合にも適用可能な培養状態の推定方法、情報処理装置及びプログラムを提供する。【解決手段】細胞及び培養液を含む細胞懸濁液に照射され、細胞懸濁液による作用を受けた電磁波の、波数または波長毎の強度を示すスペクトルデータを取得する。スペクトルデータについて前処理を行う。前処理によって得られた処理済みデータと、細胞または培養液の状態を示す状態データとの複数の組み合わせを学習用データとして用いた機械学習によってソフトセンサを構築する。培養中の細胞を含む細胞懸濁液について取得されたスペクトルデータについての処理済みデータをソフトセンサに入力することによってソフトセンサから出力される状態データを取得する。【選択図】図4
Description
開示の技術は、培養状態の推定方法、情報処理装置及びプログラムに関する。
培養中の細胞または培養液の状態を推定する培養状態の方法に関する技術として、以下の技術が知られている。例えば、特開2019-110767号公報には、培養液を封入して細胞を培養することによって目的物質を生産する培養槽と、培養槽の運転状態を計測する計測手段と、計測手段による計測値が、予め設定された制御目標値に一致するように、各種通気ガス供給手段等を個別に制御する個別制御手段と、個別制御手段と双方向通信可能に接続されているとともに、予め構築した統計的数値演算モデルを有するソフトセンサと、を備えた細胞培養装置の制御方法が記載されている。ソフトセンサは、個別制御手段による個別の制御値が入力された後、制御値と統計的数値演算モデルとを用いて培養槽内における目的物質の品質性状を推定し、推定された品質性状が予め設定した基準値を下回る場合に制御目標値を修正する。
また、特表2008-526203号公報には、細胞成長容器とセンサーとを備えたバイオリアクターが記載されている。センサーは、容器内部の状態を測定し、モデルフリーな適応コントローラへの入力を提供するように構成され、分光測光などの方法により生成物品質属性との相関関係を示す状態を測定する。適応コントローラは、人工ニューラルネットワークを用いた動的なフィードバックシステムを含んで構成され、アクチュエータに出力を提供するように構成されている。
細胞の培養期間中における培養状態のモニタリングは、培養容器からサンプリングされた一部の細胞または培養液について、所定の計測項目を実測することにより行われる。しかしながら、このようなオフライン処理によれば、サンプルに対する前処理が必要となり、モニタリング結果を得るまでに比較的長い時間を要する。従って、培養期間中に何等かの異常が生じた場合に即時に対処することが困難となる。
また、培養状態のモニタリング手法として、分光法を用いることが考えられる。分光法を用いた培養状態のモニタリングでは、細胞及び培養液を含む細胞懸濁液に電磁波を照射し、細胞懸濁液の作用を受けた電磁波の波数または波長毎の強度を示すスペクトルデータを、PLS(Partial Least Squares Regression)等の多変量解析手法を用いて解析することで、モニタリング対象(例えば、細胞から産生される抗体)に関する推定値を取得する。しかしながら、培養容器内における細胞の密度が高く(すなわち、夾雑物が多く)、且つモニタリング対象の含有量が僅かである実際の培養プロセスにおいて、PLS等の多変量解析手法を用いて培養状態の推定を行うと、推定精度が著しく低くなる場合がある。
開示の技術は、上記の点に鑑みてなされたものであり、推定結果を即時に得ることができ、培養容器内の細胞の密度が高く、且つモニタリング対象の含有量が少ない場合にも適用可能な培養状態の推定方法、情報処理装置及びプログラムを提供することを目的とする。
開示の技術に係る培養状態の推定方法は、細胞及び培養液を含み、細胞の濃度が35×106cells/mL以上である細胞懸濁液に照射され、細胞懸濁液による作用を受けた電磁波の、波数または波長毎の強度を示すスペクトルデータを取得し、スペクトルデータと細胞または培養液の状態を示す状態データとの複数の組み合わせを学習用データとして用いた機械学習によってスペクトルデータを入力とし、状態データを出力とするソフトセンサを構築し、培養中の細胞を含む細胞懸濁液について取得されたスペクトルデータをソフトセンサに入力することによってソフトセンサから出力される状態データを取得することを含む。
また、開示の技術に係る他の培養状態の推定方法は、細胞及び培養液を含む細胞懸濁液に照射され、細胞懸濁液による作用を受けた電磁波の、波数または波長毎の強度を示すスペクトルデータを取得し、スペクトルデータについて前処理を行い、前処理によって得られた処理済みデータと細胞または培養液の状態を示す状態データとの複数の組み合わせを学習用データとして用いた機械学習によって処理済みデータを入力とし、状態データを出力とするソフトセンサを構築し、培養中の細胞を含む細胞懸濁液について取得されたスペクトルデータについての処理済みデータをソフトセンサに入力することによってソフトセンサから出力される前記状態データを取得することを含む。
上記前処理は、スペクトルデータに含まれる波数または波長毎のスペクトル強度値のうち、学習用データとして用いるものの選別を行う処理を含み得る。上記選別により、スペクトルデータに含まれる波数または波長毎のスペクトル強度値のうち、前記学習用データとして用いるものの数を5以上1000未満とすることが好ましい。上記選別をスパースモデリングを用いて行ってもよい。上記の前処理は、スペクトルデータのうち、状態データとの相関性が相対的に高い高相関スペクトルデータを、処理済みデータとして特定することを含む。
スペクトルデータは、細胞懸濁液に照射された光の散乱光のスペクトルを示すデータであってもよい。
状態データは、培養液に含まれる抗体の量、抗体の分解物の量、抗体の凝集物の量または抗体と構造が類似した未成熟糖鎖の量に関するデータであってもよい。また、状態データは、培養液に含まれる成分の量に関するデータであってもよい。また、状態データは、細胞の数に関するデータであってもよい。
開示の技術に係る情報処理装置は、少なくとも1つのプロセッサを含む情報処理装置であって、プロセッサは、細胞及び培養液を含む細胞懸濁液に照射され、細胞懸濁液による作用を受けた電磁波の、波数または波長毎の強度を示すスペクトルデータについて前処理を行い、前処理によって得られた処理済みデータと細胞または培養液の状態を示す状態データとの複数の組み合わせを学習用データとして用いた機械学習によって処理済みデータを入力とし、状態データを出力とするソフトセンサを構築する。
開示の技術に係るプログラムは、細胞及び培養液を含む細胞懸濁液に照射され、細胞懸濁液による作用を受けた電磁波の、波数または波長毎の強度を示すスペクトルデータについて所定の処理を行い、前記前処理によって得られた処理済みデータと細胞または培養液の状態を示す状態データとの複数の組み合わせを学習用データとして用いた機械学習によって処理済みデータを入力とし、状態データを出力とするソフトセンサを構築する処理をコンピュータに実行させるためのプログラムである。
開示の技術によれば、推定結果を即時に得ることができ、培養容器内の細胞の密度が高く、且つモニタリング対象の含有量が少ない場合にも適用可能な培養状態の推定方法及び情報処理装置が提供される。
以下、開示の技術の実施形態の一例を、図面を参照しつつ説明する。なお、各図面において同一または等価な構成要素及び部分には同一の参照符号を付与し、重複する説明は適宜省略する。
開示の技術の実施形態に係る培養状態の推定方法は、細胞及び培養液を含む細胞懸濁液に照射され、細胞懸濁液による作用を受けた電磁波の、波数または波長毎の強度を示すスペクトルデータを取得するステップと、取得したスペクトルデータについて前処理を行うステップと、前処理によって得られた処理済みデータと、細胞または培養液の状態を示す状態データとの複数の組み合わせを学習用データとして用いた機械学習によって、処理済みデータを入力とし、状態データを出力とするソフトセンサを構築するステップとを含む。前処理の方法としては、 スパースモデリング、PCA(主成分分析)、LSA(SVD)(潜在意味解析 (特異値分解))、LDA (線形判別分析)、ICA(独立成分分析)、PLS(部分的最小二乗回帰)等のdimentional reduactionの手法があり、スペクトルデータに含まれる波数または波長毎のスペクトル強度値のうち、学習用データとして用いるものの選別を行う処理を含んでいてもよい。この場合、選別されて残った波数または波長のスペクトル強度値が処理済みデータとなる。スペクトルデータを構成する波数または波長毎のスペクトル強度値は、膨大な数に及ぶことが想定される。学習用データとして用いるデータの選別を行うことでモデルデータへの過学習による予測精度低下を防ぐことができる。スペクトルデータの選別は、例えば、スパースモデリングによって行うことが可能である。すなわち、スペクトルデータについて行われる前処理は、スパースモデリングによって、スペクトルデータのうち、状態データに対する相関性が相対的に低いデータを除外することにより、スペクトルデータのうち、状態データとの相関性が相対的に高い高相関スペクトルデータを、処理済みデータとして特定することを含んでいてもよい。スペクトルデータに含まれる波数または波長毎の強度データのうち、前記学習用データとして用いるものの数を、前処理によって5以上1000未満にまで選別することが好ましく、5以上800以下がより好ましく、5以上500以下がさらに好ましく、11以上334以下が最も好ましい。
本実施形態において、スパースモデリングとは、スペクトルデータに含まる波数または波長毎のスペクトル強度値を説明変数とし、状態データを目的変数とする回帰モデルついて、説明変数を選別(すなわち、説明変数の一部を除外)すること意味する。スパースモデリングの手法としては、例えば、lasso回帰を用いることが可能である。Lasso回帰は、二乗平均平方根誤差(RMSE: root mean squared error)に罰則項(ペナルティ項)を加算することにより算出されるコスト関数が最小になるように説明変数の選択を行う手法である。本実施形態では、スペクトルデータのうち、状態データとの相関性が相対的に低い低相関スペクトルデータを除外することにより説明変数の選別を行う。罰則項は、例えばK分割交差検証に代表されるcross-validationなどで決定してもよい。以下の説明では、スペクトルデータについて行われる前処理が、高相関スペクトルデータを特定する処理である場合を例に説明する。
開示の技術の実施形態に係る培養状態の推定方法は、図1に示すように、培養中の細胞を含む細胞懸濁液について取得されたスペクトルデータのうち、高相関スペクトルデータを処理済みデータとしてソフトセンサ20に入力することによってソフトセンサ20から出力される状態データを取得するステップを含む。ソフトセンサ20は、入力される高相関スペクトルデータに基づいて状態データを出力する処理をソフトウェアによって実現するものである。ソフトセンサ20は、後述する情報処理装置10(図2、図5参照)において構築される。
本実施形態において、ソフトセンサ20は、ラマン分光法による解析手法を適用したものである。すなわち、ソフトセンサ20に入力されるスペクトルデータとして、ラマン散乱光のスペクトルデータが適用される。ラマン分光法は、ラマン散乱光を用いて物質の評価を行う分光法である。光を物質に照射すると、光が物質と相互作用することで入射光と異なる波長を持つラマン散乱光が発生する。入射光とラマン散乱光の波長差は、物質が持つ分子振動のエネルギー分に相当するため、分子構造の異なる物質間で、異なる波長(波数)を持ったラマン散乱光が得られる。また、ラマン散乱光を用いて、応力、温度、電気特性、配向、結晶性などの様々な物性を推定することができる。
図2は、培養中の細胞を含む細胞懸濁液31についてスペクトルデータを取得する方法の一例を示す図である。細胞は、培養液とともに培養容器30に収容された状態で培養される。スペクトルデータは、公知のラマン分光解析用のプローブ40及びアナライザ41を用いて取得することが可能である。図2に示すように、プローブ40の先端は、培養容器30に収容された細胞及び培養液を含む細胞懸濁液31中に浸漬される。プローブ40の先端に設けられた光出射部(図示せず)から出射した励起光が細胞懸濁液31に照射される。励起光と細胞懸濁液31との相互作用によって発生したラマン散乱光は、プローブ40の先端に設けられた受光部(図示せず)によって受光される。取得されたラマン散乱光は、アナライザ41によって、波数(波長の逆数)毎に分解され、波数毎のスペクトル強度値であるスペクトルデータが生成される。なお、スペクトルデータは、波長毎のスペクトル強度値であってもよい。細胞培養の方式が灌流培養方式である場合においてスペクトルデータを取得する場合、細胞の濃度が35×106cells/mL以上である細胞懸濁液に電磁波を照射することが好ましい。細胞の濃度は、40×106cells/mL以上300×106cells/mL以下であることがより好ましく、60×106cells/mL以上220×106cells/mL以下であることが更に好ましく、80×106cells/mL以上1300×106cells/mL以下であることが最も好ましい。細胞培養が、抗体の製造を目的とする場合、培養する細胞の濃度が高い程、抗体の製造効率を高めることができる。従って、細胞の濃度を35×106cells/mL以上とすることで、一定の製造効率を確保することができる。一方、細胞の濃度が過度に高いと、スペクトルデータに混入するノイズ成分の量が多くなる。ノイズ成分を多く含むスペクトルデータを学習用データとして用いた機械学習によってソフトセンサ20を構築すると、学習モデルの精度低下及び過学習を招き、実使用に耐え得るソフトセンサを構築することができないおそれがある。細胞の濃度が300×106cells/mL以下に調整された細胞懸濁液についてスペクトルデータを取得することで、スペクトルデータに混入するノイズ成分の量を許容範囲に抑えることが可能となる。スペクトルデータは、情報処理装置10に供給される。なお、灌流培養とは、培養容器30から抗体等の産生物を含む培地を連続的に抜き出す一方、新鮮な培地を連続的に培養容器30に供給する方式である。
ソフトセンサ20から出力される状態データは、スペクトルデータに相関性を有する、細胞または培養液の状態を示すデータである。状態データは、例えば、培養液に含まれる抗体の量、抗体の分解物の量、抗体の凝集物の量または抗体と構造が近似した未成熟糖鎖の量に関するデータであってもよい。抗体は、培養中の細胞から産生される産生物である。また、状態データは、培養液に含まれる成分の量に関するデータであってもよい。なお、「量に関するデータ」は、培養液中における、当該成分の含有量であってもよいし、含有率(濃度)であってもよい。また、状態データは、培養容器30内における生細胞の数に関するデータであってもよい。「生細胞の数に関するデータ」は、培養液中における生細胞の総数であってもよいし、密度であってもよい。これらの状態データは、実測によるインラインモニタが容易ではない。ソフトセンサ20を用いることで、実測によるインラインモニタが比較的容易なスペクトルデータに基づいて、状態データのインラインでの取得が可能となる。
ソフトセンサ20は、スペクトルデータと状態データとの複数の組み合わせを学習用データとして用いた機械学習によって構築される。図3は、学習用データ50の一例を示す図である。学習用データ50は、例えば、予備的に実施されるテスト培養において取得される。すなわち、学習用のスペクトルデータは、テスト培養において培養容器30内に収容された細胞懸濁液から取得される。学習用の状態データは、テスト培養において培養容器30内で培養されている細胞または培養液を測定対象として、従来のサンプリング手法による実測により取得することが可能である。例えば、学習用の状態データとして培養液に含まれる抗体の濃度を取得する場合、HPLC(high performance liquid chromatography)等の手法を用いることが可能である。テスト培養は、所定期間に亘って行われ、学習用データは、テスト培養期間中における複数の時点で取得される。各時点における学習用のスペクトルデータ及び学習用の状態データは、互いに対応付けられる。
ここで、アナライザ41は、スペクトルデータとして、例えば波数500cm-1から3000cm-1までの範囲のスペクトル強度値を1cm-1刻みで出力する。従って、取得されるスペクトルデータの数は膨大となり、全てのスペクトルデータを学習用データとして用いると、学習負荷が過大となり、機械学習を実施するために、高性能なプロセッサが必要となる。また、スペクトルデータを構成するラマン散乱光のスペクトル強度値の中には、モニタリング対象の状態データに対する相関性が低い波数のスペクトル強度値が含まれている場合がある。例えば、ラマン散乱光のある特定の波数値のスペクトル強度値は、抗体の濃度に対する相関性が低いことが考えられる。モニタリング対象の状態データとの相関性が低い波数のスペクトル強度値を含むスペクトルデータを学習用データとして用いた機械学習によってソフトセンサ20を構築すると、ソフトセンサ20の出力値の精度が低下するおそれがある。
そこで、本実施形態においては、スペクトルデータに対する前処理として、アナライザ41から出力されるスペクトルデータのうち、モニタリング対象の状態データとの相関性が相対的に高い波数のスペクトル強度値を高相関スペクトルデータとして特定する。そして、機械学習によってソフトセンサ20を構築する段階である学習フェーズにおいては、高相関スペクトルデータと状態データとの複数の組み合わせを学習データとして用いた機械学習によってソフトセンサ20を構築する。一方、構築されたソフトセンサ20を運用して、培養中の細胞または培養液について状態データを取得する運用フェーズにおいては、図4に示すように、培養中の細胞を含む細胞懸濁液について取得されたスペクトルデータのうち、モニタリング対象の状態データとの相関性が相対的に高い高相関スペクトルデータをソフトセンサ20に入力することによってソフトセンサ20から出力される状態データを取得する。ソフトセンサ20の構築及びソフトセンサ20を用いた状態データの取得は情報処理装置10によって行われる。
図5は、情報処理装置10のハードウェア構成の一例を示す図である。情報処理装置10は、CPU(Central Processing Unit)101、一時記憶領域としてのメモリ102、及び不揮発性の記憶部103を含む。また、情報処理装置10は、液晶ディスプレイ等の表示部104、キーボードとマウス等の入力部105、ネットワークに接続されるネットワークI/F(InterFace)106、及びアナライザ41が接続される外部I/F107を含む。CPU101、メモリ102、記憶部103、表示部104、入力部105、ネットワークI/F106、及び外部I/F107は、バス108に接続される。
記憶部103は、HDD(Hard Disk Drive)、SSD(Solid State Drive)、またはフラッシュメモリ等の記憶媒体によって実現される。記憶部103には、学習用データ50、推定モデル60、ソフトセンサ構築プログラム70及び、推定プログラム80が記憶される。学習用データ50は、図3に示すように、スペクトルデータと状態データとの複数の組み合わせであり、テスト培養において取得されたものである。
図6は、推定モデル60の構造の一例を示す図である。推定モデル60は、入力層、複数の中間層、及び出力層を含むニューラルネットワークとされている。推定モデル60の入力層には、ラマン散乱光の波数毎のスペクトル強度値、すなわちスペクトルデータが入力される。推定モデル60の出力層からは、入力層に入力されたスペクトルデータに対応する状態データが出力される。
学習フェーズにおいて、CPU101は、記憶部103からソフトセンサ構築プログラム70を読み出してからメモリ102に展開し、実行する。運用フェーズにおいて、CPU101は、記憶部103から推定プログラム80を読み出してからメモリ102に展開し、実行する。なお、情報処理装置10の例としては、サーバコンピュータ等が挙げられる。CPU101は、開示の技術におけるプロセッサの一例である。
図7は、学習フェーズにおける情報処理装置10の機能的な構成の一例を示す機能ブロック図の一例である。学習フェーズにおいて、情報処理装置10は、特定部11及び学習部12を含んで構成される。記憶部103には、学習用データ50及び推定モデル60が格納されているものとする。
特定部11は、学習用データ50に対してスパースモデリングの一例であるLasso回帰による回帰分析を行うことにより、学習用データ50に含まれるスペクトルデータのうち、状態データとの相関性が相対的に高い波数のスペクトル強度値を高相関スペクトルデータとして特定する。具体的には、特定部11は、以下の処理を行う。特定部11は、学習用データ50含まれるスペクトルデータについて、ランダムに定めた波数のスペクトル強度値を間引く処理を行い、間引きしたスペクトルデータと対応する状態データとの関係性を示す回帰モデル(回帰式)を生成する。特定部11は生成した回帰モデルについて、二乗平均平方根誤差(RMSE: root mean squared error)に罰則項を加算したコスト関数を導出する。特定部11は、上記の各処理を所定回数繰り返し実施することにより、間引きされる波数が互いに異なる複数のスペクトルデータの各々について回帰モデルを生成するとともに、各回帰モデルについて上記のコスト関数を導出する。特定部11は、所定回数の繰り返し計算の中で、上記のコスト関数を最小とすることが可能な最少数のスペクトル強度値を高相関スペクトルデータとして特定する。例えば、グルタミンに本前処理を適用した場合、本前処理前のスペクトルデータの数:2500個、コスト関数:0.23に対し、前処理後のスペクトルデータの数:20個、コスト関数:0.015の結果を得た。
学習部12は、学習用データ50のうち、特定部11によって特定された高相関スペクトルデータと、対応する状態データとの組み合わせを教師データとして用いた機械学習によって、推定モデル60を学習させる。これにより、高相関スペクトルデータを入力とし、状態データを出力とするソフトセンサ20が構築される。
学習部12は、学習用データ50を用いて、機械学習の一例としての誤差逆伝播法に従って、推定モデル60を学習させる。具体的には、学習部12は、学習用データ50に含まれる、学習用のスペクトルデータから、特定部11によって特定された高相関スペクトルデータを抽出する。学習部12は抽出した高相関スペクトルデータを推定モデル60に入力し、推定モデル60から出力される状態データを取得する。学習部12は、取得した状態データによって示されるスコア(例えば、抗体の濃度を示すスコア)と、学習用データ50に含まれる、当該高相関スペクトルデータに対応する学習用の状態データによって示されるスコアとの差が最小となるように、推定モデル60を学習させる。学習部12は、推定モデル60を学習させる処理を、学習用データ50に含まれる高相関スペクトルデータと、状態データとの全部または一部の組み合わせを用いて行う。なお、機械学習の手法としては、誤差逆伝播法の他、ランダムフォレスト、線形回帰、非線形回帰(SVM:Sapport vector machine、ベイジアン回帰)、ロジスティック回帰等、挙げられるが、誤差逆伝搬法が好ましい。
図8は、学習フェーズにおいて、CPU101が、ソフトセンサ構築プログラム70を実行することによって実施されるソフトセンサ構築処理の流れの一例を示すフローチャートである。ソフトセンサ構築プログラム70は、例えば、ユーザによって入力部105を介してソフトセンサ構築処理の実行指示が入力された場合に実行される。
ステップS1において、特定部11は、記憶部103に格納されている学習用データ50に含まれるスペクトルデータから除外する波数のスペクトル強度値をランダムに選択する。すなわち、特定部11は、波数1cm-1刻みで取得されるスペクトル強度値のうち、一部の波数についてのスペクトル強度値を間引く処理を行う。除外する波数の数は、予め定められた数であってもよいし、ランダムに定められた数であってもよい。
ステップS2において、特定部11は、ステップS1において選択された除外対象の波数以外の波数のスペクトル強度値によって構成されるスペクトルデータ(すなわち、間引きされたスペクトルデータ)と、対応する状態データとの関係性を示す回帰モデル(回帰式)を生成する。具体的には、間引きされたスペクトルデータを説明変数とし、対応する状態データを目的変数とする回帰モデルを統計的手法によって推計する。回帰モデルは、線形モデルであってもよいし、非線形モデルであってもよい。
ステップS3において、特定部11は、ステップS2において生成した回帰モデルについてコスト関数を導出する。コスト関数は、回帰モデルの精度を示す指標値として用いられる。
ステップS4において、特定部11は、ステップS1からステップS3までの処理の繰り返し回数が所定回数に達したか否かを判定する。特定部11は、繰り返し回数が所定回数に達するまで、ステップS1からステップS3までの処理を繰り返し実施する。これにより、除外対象の波数が互いに異なる複数の間引きされたスペクトルデータの各々について回帰モデルが生成され、生成された回帰モデルの各々についてコスト関数が導出される。
ステップS5において、特定部11は、コスト関数が最小となる回帰モデルを生成する際に用いた、間引きされたスペクトルデータを高相関スペクトルデータとして特定する。コスト関数が最小となる回帰モデルを生成する際に用いたスペクトルデータは、状態データとの相関性が相対的に高い波数のスペクトル強度値によって構成される。このように特定部11は、回帰分析により、状態データとの相関性が相対的に高い波数のスペクトル強度値によって構成されるスペクトルデータを高相関スペクトルデータとして特定する。
ステップS6において、学習部12は、記憶部103に格納された学習用データ50に含まれるスペクトルデータからステップS5において特定された高相関スペクトルデータを抽出し、抽出した高相関スペクトルデータと、対応する状態データとの複数の組み合わせを教師データとする機械学習により推定モデル60を学習させる。具体的には、学習部12は、ステップS5において特定された高相関スペクトルデータを推定モデル60に入力し、推定モデル60から出力される状態データによって示されるスコアと、学習用データ50に含まれる、当該高相関スペクトルデータに対応する学習用の状態データによって示されるスコアとの差が最小となるように、推定モデル60を学習させる。これにより、ソフトセンサ20が構築される。
ソフトセンサ20は、モニタリングしようとする状態データの種別毎に構築される。例えば、培養液に含まれる抗体の量に関するデータを状態データとしてソフトセンサ20に出力させる場合、スペクトルデータのうち抗体の量に対して高い相関性を有する波数のスペクトル強度値が高相関スペクトルデータとして特定される。そして、特定された高相関スペクトルデータと、実測によって取得された抗体の量に関する状態データとの複数の組み合わせを学習用データとして用いた機械学習によって、高相関スペクトルデータに基づいて抗体の量に関する推定値を出力するソフトセンサ20が構築される。一方、細胞の数に関するデータを状態データとしてソフトセンサ20に出力させる場合、スペクトルデータのうち細胞の数に対して高い相関性を有する波数のスペクトル強度値が高相関スペクトルデータとして特定される。そして、特定された高相関スペクトルデータと、実測によって取得された細胞の数に関する状態データとの複数の組み合わせを学習用データとして用いた機械学習によって、高相関スペクトルデータに基づいて細胞の数に関する推定値を出力するソフトセンサ20が構築される。
図9は、運用フェーズにおける情報処理装置10の機能的な構成の一例を示す機能ブロック図の一例である。運用フェーズにおいて、情報処理装置10は、取得部13、抽出部14及び推定部15を含んで構成される。記憶部103には、ソフトセンサ20として機能する学習済みの推定モデル60が格納されているものとする。
開示の技術の実施形態に係る培養状態の推定方法は、例えば、培養容器に収容された培養中の細胞または培養液の状態を推定する場合に適用される。図2に示すように、培養容器30に収容された培養中の細胞を含む細胞懸濁液31についてプローブ40及びアナライザ41によってスペクトルデータが取得される。
取得部13は、アナライザ41から出力されるスペクトルデータを取得する。抽出部14は、取得部13によって取得されたスペクトルデータのうち、特定部11によって特定された高相関スペクトルデータ、すなわち、モニタリング対象の状態データとの相関性が相対的に高い波数のスペクトル強度値を抽出する。
推定部15は、ソフトセンサ20として機能する学習済みの推定モデル60を記憶部103から読み出して、抽出部14によって抽出された高相関スペクトルデータを、推定モデル60に入力し、推定モデル60から出力される状態データを取得する。推定部15は、取得した状態データを表示部104に表示させる制御を行ってもよい。また、推定部15は、取得した状態データを記憶部103に記憶させてもよい。
図10は、運用フェーズにおいて、CPU101が、推定プログラム80を実行することによって実施される推定処理の流れの一例を示すフローチャートである。推定プログラム80は、例えば、ユーザによって入力部105を介して推定処理の実行指示が入力された場合に実行される。
ステップS11において、取得部13は、アナライザ41から出力されるスペクトルデータを取得する。ステップS12において、抽出部14は、取得部13によって取得されたスペクトルデータのうち、特定部11によって特定された高相関スペクトルデータ、すなわち、モニタリング対象の状態データとの相関性が相対的に高い波数のスペクトル強度値を抽出する。ステップS13において推定部15は、ソフトセンサ20として機能する学習済みの推定モデル60を記憶部103から読み出して、ステップS12において抽出された高相関スペクトルデータを、読み出した推定モデル60に入力し、推定モデル60から出力される状態データを取得する。推定部15は、取得した状態データを表示部104に表示させる制御を行う。
図11は、ソフトセンサ20を用いて取得された状態データの一例を示す図である。ソフトセンサ20を用いることで、細胞に関する項目として、例えば生細胞密度を推定することが可能である。また、ソフトセンサ20を用いることで、産生物に関する項目として、例えば抗体濃度、抗体と構造が近似した未成熟糖鎖の濃度、抗体凝集物の濃度及び抗体分解物の濃度を推定することが可能である。また、ソフトセンサ20を用いることで、培養液に含まれる成分に関する項目として、例えば乳酸の濃度、グルコースの濃度、クエン酸の濃度、グルタミンの濃度、アスパラギンの濃度、フェニルアラニンの濃度及びロイシンの濃度を推定することが可能である。
図12A~図12Lは、ソフトセンサ20から出力された状態データである、図11に示した各項目の推定値と、サンプリングによって取得した実測値との関係を示すグラフである。いずれの項目においても、ソフトセンサ20によって取得した推定値の、実測値からの乖離の程度を示す決定係数R2の値が0.95以上であり、ソフトセンサ20の出力値の精度が極めて高いことが確認された。
図13は、培養液に含まれるグルタミンの濃度の推定値を、ソフトセンサ20を用いて取得した場合及び従来のPLSによる多変量解析手法を用いて取得した場合のそれぞれについて、実測値との関係を示したグラフである。図14A及び図14Bは、培養液に含まれる各成分の濃度の推定値を、ソフトセンサ20を用いて取得した場合及び従来のPLSによる多変量解析手法を用いて取得した場合について、実測値からの乖離の程度を示す決定係数R2を示したグラフである。ソフトセンサ20を用いる場合については、高相関スペクトルデータを特定する前処理を実施した場合及び前処理を実施しない場合のそれぞれの場合について決定係数R2を取得した。各手法(ソフトセンサ(前処理あり)、ソフトセンサ(前処理なし)、PLS)における濃度推定において使用した波数の数(説明変数の数)を表1に示す。PSLの場合、ラマン散乱光の全波数帯(2500)を解析対象に含めた場合、精度が著しく悪くなる。そのため、濃度推定を行う上記各成分に存在するC-H、C-O等の結合に起因したピークが立つといわれている500cm-1から1500cm-1までの1000個の波数を解析対象とした。各手法における濃度推定に使用したスペクトルデータは、同一の培養実験にて得られたスペクトルデータである。なお、乳酸及びクエン酸の濃度については、PLSによる多変量解析手法を用いて推定値を取得することはできなかった。図13、図14A及び図14Bに示すように、培養液に含まれるいずれの成分についても、ソフトセンサ20を用いて取得した推定値は、従来のPLSによる多変量解析手法を用いて取得した推定値よりも高精度であることが確認された。また、ソフトセンサ20を用いる場合において、高相関スペクトルデータを特定する前処理を実施することによって、推定値の精度が更に高くなることが確認された。本実施形態では、前処理によって、スペクトルデータに含まれる波数または波長毎のスペクトル強度値(データ数2500)のうち、ソフトセンサ20を構築する際の学習用データとして用いるものの数を11以上334以下にまで選別した。
以上のように、開示の技術の実施形態に係る培養状態の推定方法によれば、培養中の細胞を含む細胞懸濁液について取得されたスペクトルデータをソフトセンサに入力することによってソフトセンサから出力される状態データを取得することで、培養状態の推定が行われる。スペクトルデータは、実測によるインラインモニタが比較的容易であるため、培養状態の推定をインラインで行うことが可能である。また、培養状態の推定結果を、即時に取得することができるので、培養期間中に何等かの異常が生じた場合に即時に対処することが可能となる。
また、ソフトセンサは、実際の培養環境下において取得されたスペクトルデータと状態データとの複数の組み合わせを学習用データとして用いた機械学習によって構築されるので、培養容器内の細胞の密度が高く、且つモニタリング対象の含有量が少ない実際の培養環境下においても、PLS等の多変量解析手法を用いて細胞状態の推定を行う場合と比較して、高い精度で培養状態の推定を行うことが可能である。
また、アナライザ41から出力されるスペクトルデータのうち、モニタリング対象の状態データとの相関性が相対的に高い波数のスペクトル強度値によって構成される高相関スペクトルデータが学習データとして用いられるので、アナライザ41から出力される全てのスペクトルデータを学習用データとして用いる場合と比較して、学習負荷を小さくすることができ、また、ソフトセンサ20の出力値の精度を向上させることが可能となる。状態データについて、ソフトセンサによって取得した推定値とサンプリングによって取得した実測値からの乖離の程度を示す決定係数R2の値は0.8以上であることが好ましく、0.9以上がより好ましく、0.95以上が最も好ましい。
また、開示の技術の実施形態に係る培養状態の推定方法によれば、培養液に含まれる抗体の量、抗体の分解物の量、抗体の凝集物の量または抗体と構造が類似した未成熟糖鎖の量に関する推定値を、状態データとして取得することが可能である。抗体の分解物は、培養中に生成される分解酵素により抗体が分解することにより形成される。抗体の凝集物は、例えば、細胞から産生される抗体の濃度が過度に高くなる、または熱等のストレスが加わると、形成されやすい。抗体と構造が類似した未成熟糖鎖は、例えば、培養液中の老廃物の量が増加する、または培養液中の酸素濃度が不足すると形成されやすい。抗体の分解物、抗体の凝集物、及び抗体と構造が類似した未成熟糖鎖については、培養期間中における生成量を極力少なくすることが好ましい。従って、抗体の分解物の量、抗体の凝集物の量または抗体と構造が類似した未成熟糖鎖の量に関する推定値を状態データとして取得することは、良好な培養状態を維持する上で有効である。
また、開示の技術の実施形態に係る培養状態の推定方法によれば、培養液に含まれる成分の量に関する推定値を、状態データとして取得することが可能である。培養液には、細胞の培養に必要な栄養分等が含まれる。培養期間中において、必要な栄養分が培養液に過不足なく含まれていることが好ましい。従って、培養液に含まれる成分の量に関する推定値を状態データとして取得することは、良好な培養状態を維持する上で有効である。
また、開示の技術の実施形態に係る培養状態の推定方法によれば、培養容器30内で培養されている細胞の数に関する推定値を状態データとして取得することが可能である。培養容器30内で培養されている細胞の数が過度に多くなると、細胞に供給される酸素及び栄養分が不足し、細胞の生存率が低下するおそれがある。一方、抗体の製造を目的とする細胞培養においては、培養容器30内で培養されている細胞の数が過度に少なくなると、抗体の製造効率が低下する。従って、培養容器30内で培養されている細胞の数に関する推定値を状態データとして取得することは、良好な培養状態を維持する上で有効である。
なお、本実施形態では、スペクトルデータとして、ラマン散乱光のスペクトルを用いる形態を例示したが、この態様に限定されない。例えば、細胞懸濁液に照射された赤外線の吸収スペクトルをスペクトルデータとして用いることも可能である。また、核磁気共鳴スペクトルをスペクトルデータとして用いることも可能である。
また、本実施形態では、スペクトルデータについて前処理を行い、前処理によって得られた処理済みデータと状態データとの複数の組み合わせを学習用データとして用いた機械学習によってソフトセンサを構築する場合を例示したが、学習負荷及び過学習による推定モデルの精度低下が問題とならない場合には、前処理が施されていないスペクトルデータを、学習用データとして用いてもよい。
また、本実施形態では、前処理として、スペクトルデータのうち、状態データとの相関性が相対的に高い高相関スペクトルデータを特定する処理を例示したが、これに限定されるものではない。例えば、アナライザ41によって取得されたスペクトルデータのうち、予め定められた波数のスペクトル強度値を学習用データから除外する処理を前処理として行ってもよい。また、アナライザ41によって取得されたスペクトルデータについて、波数の近いもの同士が同じ波数グループに属するようにグループ分けを行い、波数グループ毎に散乱光の強度の平均値、標準偏差、中央値、最大値、最小値等を算出する処理を前処理として行ってもよい。この場合、波数グループ毎のスペクトル強度値が学習用データとして用いられる。また、波数または波長毎の強度を示すスペクトルデータと状態データとの複数の組み合わせによって構成される学習データについて、次元数を削減する処理を前処理として行ってもよい。
また、上記実施形態において、例えば、特定部11、学習部12、取得部13、抽出部14、推定部15といった各種の処理を実行する処理部(processing unit)のハードウェア的な構造としては、次に示す各種のプロセッサ(processor)を用いることができる。上記各種のプロセッサには、前述したように、ソフトウェア(プログラム)を実行して各種の処理部として機能する汎用的なプロセッサであるCPUに加えて、FPGA等の製造後に回路構成を変更可能なプロセッサであるプログラマブルロジックデバイス(Programmable Logic Device:PLD)、ASIC(Application Specific Integrated Circuit)等の特定の処理を実行させるために専用に設計された回路構成を有するプロセッサである専用電気回路等が含まれる。
1つの処理部は、これらの各種のプロセッサのうちの1つで構成されてもよいし、同種または異種の2つ以上のプロセッサの組み合わせ(例えば、複数のFPGAの組み合わせや、CPUとFPGAとの組み合わせ)で構成されてもよい。また、複数の処理部を1つのプロセッサで構成してもよい。
複数の処理部を1つのプロセッサで構成する例としては、第1に、クライアント及びサーバ等のコンピュータに代表されるように、1つ以上のCPUとソフトウェアの組み合わせで1つのプロセッサを構成し、このプロセッサが複数の処理部として機能する形態がある。第2に、システムオンチップ(System on Chip:SoC)等に代表されるように、複数の処理部を含むシステム全体の機能を1つのIC(Integrated Circuit)チップで実現するプロセッサを使用する形態がある。このように、各種の処理部は、ハードウェア的な構造として、上記各種のプロセッサの1つ以上を用いて構成される。
更に、これらの各種のプロセッサのハードウェア的な構造としては、より具体的には、半導体素子などの回路素子を組み合わせた電気回路(circuitry)を用いることができる。
また、上記実施形態では、ソフトセンサ構築プログラム70及び推定プログラム80が記憶部103に予め記憶(インストール)されている態様を説明したが、これに限定されない。ソフトセンサ構築プログラム70及び推定プログラム80は、CD-ROM(Compact Disc Read Only Memory)、DVD-ROM(Digital Versatile Disc Read Only Memory)、及びUSB(Universal Serial Bus)メモリ等の記録媒体に記録された形態で提供されてもよい。また、ソフトセンサ構築プログラム70及び推定プログラム80は、ネットワークを介して外部装置からダウンロードされる形態としてもよい。
なお、2020年4月21日に出願された日本国特許出願2020-075480の開示は、その全体が参照により本明細書に取り込まれる。また、本明細書に記載された全ての文献、特許出願および技術規格は、個々の文献、特許出願、および技術規格が参照により取り込まれることが具体的かつ個々に記された場合と同程度に、本明細書中に参照により取り込まれる。
Claims (12)
- 細胞及び培養液を含み、前記細胞の濃度が35×106cells/mL以上である細胞懸濁液に照射され、前記細胞懸濁液による作用を受けた電磁波の、波数または波長毎の強度を示すスペクトルデータを取得し、
前記スペクトルデータと前記細胞または前記培養液の状態を示す状態データとの複数の組み合わせを学習用データとして用いた機械学習によって前記スペクトルデータを入力とし、前記状態データを出力とするソフトセンサを構築し、
培養中の細胞を含む細胞懸濁液について取得された前記スペクトルデータを前記ソフトセンサに入力することによって前記ソフトセンサから出力される前記状態データを取得する
ことを含む培養状態の推定方法。 - 細胞及び培養液を含む細胞懸濁液に照射され、前記細胞懸濁液による作用を受けた電磁波の、波数または波長毎の強度を示すスペクトルデータを取得し、
前記スペクトルデータについて前処理を行い、
前記前処理によって得られた処理済みデータと前記細胞または前記培養液の状態を示す状態データとの複数の組み合わせを学習用データとして用いた機械学習によって前記処理済みデータを入力とし、前記状態データを出力とするソフトセンサを構築し、
培養中の細胞を含む細胞懸濁液について取得された前記スペクトルデータについての前記処理済みデータを前記ソフトセンサに入力することによって前記ソフトセンサから出力される前記状態データを取得する
ことを含む培養状態の推定方法。 - 前記前処理は、前記スペクトルデータに含まれる波数または波長毎のスペクトル強度値のうち、前記学習用データとして用いるものの選別を行う処理を含む
請求項2に記載の推定方法。 - 前記選別により、前記スペクトルデータに含まれる波数または波長毎の強度のうち、前記学習用データとして用いるものの数を5以上1000未満とする
請求項3に記載の推定方法。 - 前記選別をスパースモデリングによって行う
請求項3または請求項4に記載の推定方法。 - 前記前処理は、前記スペクトルデータのうち、前記状態データとの相関性が相対的に高い高相関スペクトルデータを、前記処理済みデータとして特定することを含む
請求項2から請求項5のいずれか1項に記載の推定方法。 - 前記スペクトルデータは、前記細胞懸濁液に照射された光の散乱光のスペクトルを示すデータである
請求項1から請求項6のいずれか1項に記載の推定方法。 - 前記状態データは、前記培養液に含まれる抗体の量、前記抗体の分解物の量、前記抗体の凝集物の量または前記抗体と構造が類似した未成熟糖鎖の量に関するデータである
請求項1から請求項7のいずれか1項に記載の推定方法。 - 前記状態データは、前記培養液に含まれる成分の量に関するデータである
請求項1から請求項7のいずれか1項に記載の推定方法。 - 前記状態データは、前記細胞の数に関するデータである
請求項1から請求項7のいずれか1項に記載の推定方法。 - 少なくとも1つのプロセッサを含む情報処理装置であって、
前記プロセッサは、
細胞及び培養液を含む細胞懸濁液に照射され、前記細胞懸濁液による作用を受けた電磁波の、波数または波長毎の強度を示すスペクトルデータについて前処理を行い、
前記前処理によって得られた処理済みデータと前記細胞または前記培養液の状態を示す状態データとの複数の組み合わせを学習用データとして用いた機械学習によって前記処理済みデータを入力とし、前記状態データを出力とするソフトセンサを構築する
情報処理装置。 - 細胞及び培養液を含む細胞懸濁液に照射され、前記細胞懸濁液による作用を受けた電磁波の、波数または波長毎の強度を示すスペクトルデータについて前処理を行い、
前記前処理によって得られた処理済みデータと前記細胞または前記培養液の状態を示す状態データとの複数の組み合わせを学習用データとして用いた機械学習によって前記処理済みデータを入力とし、前記状態データを出力とするソフトセンサを構築する
処理をコンピュータに実行させるためのプログラム。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020075480 | 2020-04-21 | ||
JP2020075480 | 2020-04-21 | ||
JP2022516908A JPWO2021215179A1 (ja) | 2020-04-21 | 2021-03-23 | |
PCT/JP2021/012016 WO2021215179A1 (ja) | 2020-04-21 | 2021-03-23 | 培養状態の推定方法、情報処理装置及びプログラム |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022516908A Division JPWO2021215179A1 (ja) | 2020-04-21 | 2021-03-23 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2024073504A true JP2024073504A (ja) | 2024-05-29 |
Family
ID=78270623
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022516908A Pending JPWO2021215179A1 (ja) | 2020-04-21 | 2021-03-23 | |
JP2024033386A Pending JP2024073504A (ja) | 2020-04-21 | 2024-03-05 | 培養状態の推定方法、情報処理装置及びプログラム |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022516908A Pending JPWO2021215179A1 (ja) | 2020-04-21 | 2021-03-23 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20230081615A1 (ja) |
EP (1) | EP4119674A4 (ja) |
JP (2) | JPWO2021215179A1 (ja) |
WO (1) | WO2021215179A1 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023090015A1 (ja) * | 2021-11-22 | 2023-05-25 | 富士フイルム株式会社 | 情報処理装置、情報処理装置の作動方法、情報処理装置の作動プログラム、校正済み状態予測モデルの生成方法、並びに校正済み状態予測モデル |
JP2024030410A (ja) * | 2022-08-24 | 2024-03-07 | 横河電機株式会社 | 細胞培養システム、及び細胞培養方法 |
WO2024070544A1 (ja) * | 2022-09-30 | 2024-04-04 | 富士フイルム株式会社 | 分光分析装置のセンサ部、測定システム、および測定方法 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2411465C (en) * | 2000-06-08 | 2013-08-27 | The Regents Of The University Of California | Visual-servoing optical microscopy |
JP2008526203A (ja) * | 2004-12-29 | 2008-07-24 | バイオジェン・アイデック・エムエイ・インコーポレイテッド | バイオリアクタープロセス制御システムおよび方法 |
WO2013138513A1 (en) * | 2012-03-13 | 2013-09-19 | The Regents Of The University Of California | Application of light scattering patterns to determine differentiation status of stem cells and stem cell colonies |
JPWO2016208356A1 (ja) * | 2015-06-26 | 2018-05-24 | 株式会社ニコン | 判定装置、判定プログラム、判定方法、細胞シート製造装置、および細胞シート製造方法 |
WO2019071076A1 (en) * | 2017-10-06 | 2019-04-11 | Lonza Ltd. | AUTOMATED CONTROL OF CELL CULTURE BY SPECTROSCOPY RAMAN |
JP2019110767A (ja) | 2017-12-20 | 2019-07-11 | 株式会社日立製作所 | 細胞培養装置の制御方法及び制御システム |
WO2019175959A1 (ja) * | 2018-03-13 | 2019-09-19 | 株式会社島津製作所 | 細胞状態判定方法及び細胞状態判定装置 |
WO2020039683A1 (ja) * | 2018-08-22 | 2020-02-27 | 富士フイルム株式会社 | 細胞培養支援装置の作動プログラム、細胞培養支援装置、細胞培養支援装置の作動方法 |
JP7487456B2 (ja) | 2018-11-09 | 2024-05-21 | 大日本印刷株式会社 | バリアフィルム |
-
2021
- 2021-03-23 WO PCT/JP2021/012016 patent/WO2021215179A1/ja unknown
- 2021-03-23 EP EP21793623.6A patent/EP4119674A4/en active Pending
- 2021-03-23 JP JP2022516908A patent/JPWO2021215179A1/ja active Pending
-
2022
- 2022-10-18 US US18/047,384 patent/US20230081615A1/en active Pending
-
2024
- 2024-03-05 JP JP2024033386A patent/JP2024073504A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
US20230081615A1 (en) | 2023-03-16 |
EP4119674A1 (en) | 2023-01-18 |
JPWO2021215179A1 (ja) | 2021-10-28 |
EP4119674A4 (en) | 2023-09-13 |
WO2021215179A1 (ja) | 2021-10-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2021215179A1 (ja) | 培養状態の推定方法、情報処理装置及びプログラム | |
Sun et al. | Recent developments of artificial intelligence in drying of fresh food: A review | |
Kutsanedzie et al. | Advances in nondestructive methods for meat quality and safety monitoring | |
Yao et al. | Nondestructive detection for egg freshness grade based on hyperspectral imaging technology | |
Jiang et al. | Maturity Stage Discrimination of Camellia oleifera fruit using visible and near-infrared hyperspectral imaging | |
He et al. | Discrimination of grape seeds using laser-induced breakdown spectroscopy in combination with region selection and supervised classification methods | |
WO2020105566A1 (ja) | 情報処理装置、情報処理装置の制御方法、プログラム、算出装置、及び算出方法 | |
Huang et al. | Assessment of tomato maturity in different layers by spatially resolved spectroscopy | |
Khorramifar et al. | Application of MOS gas sensors coupled with chemometrics methods to predict the amount of sugar and carbohydrates in potatoes | |
Song et al. | Black heart detection in white radish by hyperspectral transmittance imaging combined with chemometric analysis and a successive projections algorithm | |
Li et al. | Near-infrared spectroscopy coupled chemometric algorithms for rapid origin identification and lipid content detection of Pinus koraiensis seeds | |
Xiong et al. | Non-destructive detection of chicken freshness based on electronic nose technology and transfer learning | |
Escuredo et al. | Rapid estimation of potato quality parameters by a portable near-infrared spectroscopy device | |
Hasanzadeh et al. | Non-destructive detection of fruit quality parameters using hyperspectral imaging, multiple regression analysis and artificial intelligence | |
Jiang et al. | Comparison of wavelength selected methods for improving of prediction performance of PLS model to determine aflatoxin B1 (AFB1) in wheat samples during storage | |
US20240018185A1 (en) | Method for estimating purified state | |
Chen et al. | Advanced nondestructive detection technologies in food | |
Khumaidi et al. | Using fuzzy logic to increase accuracy in mango maturity index classification: Approach for developing a portable near-infrared spectroscopy device | |
Wang et al. | Simultaneous prediction of peach firmness and weight using vibration spectra combined with one-dimensional convolutional neural network | |
Feng et al. | A Novel Genetic Algorithm‐Based Optimization Framework for the Improvement of Near‐Infrared Quantitative Calibration Models | |
Muruganantham et al. | Rapid estimation of moisture content in unpeeled potato tubers using hyperspectral imaging | |
Yao et al. | Nondestructive detection of S‐ovalbumin content in eggs using portable NIR spectrometer and MPA‐CARS | |
Checa et al. | Preliminary study of the relation between the content of cadmium and the hyperspectral signature of organic cocoa beans | |
Yang et al. | Identification of Peanut Kernels Infected with Multiple Aspergillus flavus Fungi Using Line-Scan Raman Hyperspectral Imaging | |
Dib et al. | Raman Spectroscopy Application in Food Waste Analysis: A Step towards a Portable Food Quality-Warning System |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240305 |