JP2024002023A - 検量装置、検量方法および検量プログラム - Google Patents

検量装置、検量方法および検量プログラム Download PDF

Info

Publication number
JP2024002023A
JP2024002023A JP2022100959A JP2022100959A JP2024002023A JP 2024002023 A JP2024002023 A JP 2024002023A JP 2022100959 A JP2022100959 A JP 2022100959A JP 2022100959 A JP2022100959 A JP 2022100959A JP 2024002023 A JP2024002023 A JP 2024002023A
Authority
JP
Japan
Prior art keywords
calibration
reference sample
data
components
data set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2022100959A
Other languages
English (en)
Other versions
JP7168118B1 (ja
Inventor
航 小林
Ko Kobayashi
理紗 原
Risa HARA
広大 村山
Kodai Murayama
聡一郎 下田
soichiro Shimoda
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yokogawa Electric Corp
Original Assignee
Yokogawa Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yokogawa Electric Corp filed Critical Yokogawa Electric Corp
Priority to JP2022100959A priority Critical patent/JP7168118B1/ja
Priority to JP2022172704A priority patent/JP2024002873A/ja
Application granted granted Critical
Publication of JP7168118B1 publication Critical patent/JP7168118B1/ja
Priority to EP23152500.7A priority patent/EP4296348A1/en
Priority to US18/106,849 priority patent/US20230419174A1/en
Priority to CN202310146751.3A priority patent/CN117288697A/zh
Publication of JP2024002023A publication Critical patent/JP2024002023A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12MAPPARATUS FOR ENZYMOLOGY OR MICROBIOLOGY; APPARATUS FOR CULTURING MICROORGANISMS FOR PRODUCING BIOMASS, FOR GROWING CELLS OR FOR OBTAINING FERMENTATION OR METABOLIC PRODUCTS, i.e. BIOREACTORS OR FERMENTERS
    • C12M41/00Means for regulation, monitoring, measurement or control, e.g. flow regulation
    • C12M41/48Automatic or computerized control
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12MAPPARATUS FOR ENZYMOLOGY OR MICROBIOLOGY; APPARATUS FOR CULTURING MICROORGANISMS FOR PRODUCING BIOMASS, FOR GROWING CELLS OR FOR OBTAINING FERMENTATION OR METABOLIC PRODUCTS, i.e. BIOREACTORS OR FERMENTERS
    • C12M41/00Means for regulation, monitoring, measurement or control, e.g. flow regulation
    • C12M41/30Means for regulation, monitoring, measurement or control, e.g. flow regulation of concentration
    • C12M41/32Means for regulation, monitoring, measurement or control, e.g. flow regulation of concentration of substances in solution
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/01Arrangements or apparatus for facilitating the optical investigation
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/27Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands using photo-electric detection ; circuits for computing concentration
    • G01N21/274Calibration, base line adjustment, drift correction
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/01Arrangements or apparatus for facilitating the optical investigation
    • G01N2021/0106General arrangement of respective parts
    • G01N2021/0112Apparatus in one mechanical, optical or electronic block
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2201/00Features of devices classified in G01N21/00
    • G01N2201/12Circuits of general importance; Signal processing
    • G01N2201/129Using chemometrical methods

Landscapes

  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Analytical Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Zoology (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Pathology (AREA)
  • Immunology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Sustainable Development (AREA)
  • Genetics & Genomics (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Computer Hardware Design (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)
  • Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)

Abstract

【課題】効果的に高精度な検量モデルを作成すること。【解決手段】検量装置10は、複数の成分を含む基準試料のスペクトルデータと当該基準試料の複数の成分ごとの含有量によって決定される各目的変量とを含む当該基準試料のデータセットを生成し、当該基準試料のデータセットを用いた機械学習により、スペクトルデータの入力に応じて、複数の成分ごとの各目的変量のうち少なくとも1つの目的変量を出力する機械学習モデルを訓練する。【選択図】図1

Description

本発明は、検量装置、検量方法および検量プログラムに関する。
従来、細胞培養装置(バイオリアクター)を使用した、例えば動物細胞、微生物、植物細胞等を含む細胞培養において、栄養分濃度値等のプロセス値を予測する予測技術がある。例えば、上記の予測技術は、バイオリアクターからスペクトルデータを取得し、任意の適切な分析手法で、グルコース等の栄養分濃度のオフライン測定データを取得する。そして、上記の予測技術は、スペクトルデータのピークをプロセス変量のオフライン測定値に相関させ、ケモメトリックモデリングを実行することで、栄養分濃度値等のプロセス値の予測を行う。
特開2020-195370号公報 特表2020-537126号公報 特開2016-128822号公報
Thaddaeus A. Webster, Development of Generic Raman Models for a GS-KOTM CHO Platform Process, Biotechnol. Prog., 2018, Vol. 34 Hemlata Bhatia, In-line monitoring of amino acids in mammalian cell cultures using raman spectroscopy and multivariate chemometrics models, Eng. Life Sci. 2018, 18, 55-61
しかしながら、上記の予測技術では、細胞培養の条件が大きく異なるような場合には、予測値が実測値と大きく外れてしまう恐れがあるので、効果的に高精度な検量モデルを作成することが難しい。
本発明は、上記に鑑みてなされたものであって、効果的に高精度な検量モデルを作成することを目的とする。
本発明は、複数の成分を含む基準試料のスペクトルデータと前記基準試料の前記複数の成分ごとの含有量によって決定される各目的変量とを含む前記基準試料のデータセットを生成する生成部と、前記基準試料のデータセットを用いた機械学習により、前記スペクトルデータの入力に応じて、前記複数の成分ごとの前記各目的変量のうち少なくとも1つの目的変量を出力する機械学習モデルを訓練する訓練部とを備える検量装置を提供する。
また、本発明は、コンピュータが、複数の成分を含む基準試料のスペクトルデータと前記基準試料の前記複数の成分ごとの含有量によって決定される各目的変量とを含む前記基準試料のデータセットを生成し、前記基準試料のデータセットを用いた機械学習により、前記スペクトルデータの入力に応じて、前記複数の成分ごとの前記各目的変量のうち少なくとも1つの目的変量を出力する機械学習モデルを訓練する処理を実行する検量方法を提供する。
また、本発明は、コンピュータに、複数の成分を含む基準試料のスペクトルデータと前記基準試料の前記複数の成分ごとの含有量によって決定される各目的変量とを含む前記基準試料のデータセットを生成し、前記基準試料のデータセットを用いた機械学習により、前記スペクトルデータの入力に応じて、前記複数の成分ごとの前記各目的変量のうち少なくとも1つの目的変量を出力する機械学習モデルを訓練する処理を実行させる検量プログラムを提供する。
本発明によれば、効果的に高精度な検量モデルを作成することができるという効果がある。
実施形態に係る検量システムの構成例を示す図である。 実施形態に係る検量システムの各装置の構成例を示すブロック図である。 実施形態に係る推定結果の一例を示す図である。 実施形態に係る推定結果の一例を示す図である。 実施形態に係る推定結果の一例を示す図である。 実施形態に係るデータ推定処理の流れの一例を示すフローチャートである。 実施形態に係る検量モデル構築処理1の流れの一例を示すフローチャートである。 実施形態に係る検量モデル構築処理2の流れの一例を示すフローチャートである。 実施形態に係る検量モデル構築処理2の評価の一例を示す図である。 ハードウェア構成例を説明する図である。
以下に、本発明の一実施形態に係る検量装置、検量方法および検量プログラムを、図面を参照して詳細に説明する。なお、本発明は、以下に説明する実施形態により限定されるものではない。
〔実施形態〕
以下に、実施形態に係る検量システムの構成、検量装置等の構成、各処理の流れを順に説明し、最後に実施形態の効果を説明する。
〔1.検量システム100の構成〕
図1を用いて、実施形態に係る検量システム100の構成を詳細に説明する。図1は、実施形態に係る検量システム100の構成例を示す図である。以下では、検量システム100全体の構成例、検量システム100の処理、検量システム100の効果の順に説明する。
(1-1.検量システム100全体の構成例)
検量システム100は、検量装置10、細胞培養装置20、分光装置30および調節装置40を有する。図1に示した検量システム100には、複数台の検量装置10、複数台の細胞培養装置20、複数台の分光装置30または複数台の調節装置40が含まれてもよい。また、検量装置10は、細胞培養装置20、分光装置30および調節装置40のうち1つ以上と統合された構成であってもよい。以下では、検量装置10、細胞培養装置20、分光装置30、調節装置40の順に説明する。
(1-1-1.検量装置10)
検量装置10は、分光装置30と通信可能に接続され、細胞培養装置20の細胞培養液のスペクトルデータを取得する。また、検量装置10は、調節装置40と通信可能に接続され、調節装置40に対して細胞培養装置20の細胞培養液の成分濃度の推定結果を送信する。
(1-1-2.細胞培養装置20)
細胞培養装置20は、動物細胞、微生物、植物細胞等の細胞が含まれる細胞培養液を収容する細胞培養槽を有する。また、細胞培養装置20の細胞培養槽が収容する細胞培養液には、成分としてグルコース、乳酸、抗体等が含有される。また、細胞培養装置20は、分光装置30および調節装置40と制御可能に接続される。
(1-1-3.分光装置30)
分光装置30は、細胞培養装置20と制御可能に接続され、細胞培養装置20の細胞培養液のスペクトルデータを測定する。分光装置30は、ラマン分光装置、近赤外分光装置、赤外分光装置、紫外分光装置、蛍光分光装置、可視分光装置等であるが、特に限定されない。
(1-1-4.調節装置40)
調節装置40は、細胞培養装置20と制御可能に接続され、細胞培養装置20の細胞培養液の成分を調節する。
(1-2.検量システム100全体の処理)
上記の検量システム100全体の処理について説明する。なお、下記の処理は、異なる順序で実行することもできる。また、下記の処理のうち、省略される処理があってもよい。
(1-2-1.検量モデル構築処理)
検量装置10は、非培養系サンプルSを用いて検量モデル14dを構築する(図1(1)参照)。ここで、非培養系サンプルSは、細胞培養液に含まれる測定対象成分と測定対象外成分とを様々な濃度で調製した溶液である。例えば、検量装置10は、非培養系サンプル測定用装置(不図示)によって測定された非培養系サンプルSのスペクトルデータを取得し、後述する記憶部14に格納する。また、検量装置10は、非培養系サンプルSのスペクトルデータ測定の前または後にサンプリングを実施し、任意の適切な分析手法で目的変量(例:グルコース等の栄養分濃度)のオフライン測定データを取得し、記憶部14に格納する。
検量装置10は、記憶部14からキャリブレーションセットを読み込む。ここで、キャリブレーションセットは、非培養系サンプルSのスペクトルデータと目的変量のオフライン測定データとから生成した教師ありデータセットである。次に、検量装置10は、クロスバリデーションによる検量モデル14dの開発条件の探索を行う。ここで、開発条件とは、スペクトルの前処理、波数範囲、回帰モデルの回帰係数、信号処理等の解析のアルゴリズムの種類やパラメータのことをいう。そして、検量装置10は、条件探索の結果をもとに、検量モデル14dを構築する。また、検量装置10は、導出した開発条件である検量モデル情報を、記憶部14に格納する。
このとき、検量装置10は、細胞培養装置20を稼働させて新規取得したデータセットを用いて、より高精度な検量モデル14dを作成することもできる。すなわち、検量装置10は、記憶部14からキャリブレーションセットおよび新規取得したデータセットを読み込む。このとき、検量装置10は、分光装置30によって測定された細胞培養装置20の細胞培養液のスペクトルデータを取得する。また、検量装置10は、細胞培養装置20の細胞培養液から任意の適切な分析手法で測定された目的変量データを取得する。次に、検量装置10は、新規取得したデータセットをバリデーションセットに用いることによって、検量モデル14dの開発条件の探索を行う。そして、検量装置10は、条件探索の結果をもとに、検量モデル14dを構築する。
(1-2-2.スペクトルデータ取得処理)
検量装置10は、細胞培養装置20に接続された分光装置30から、細胞培養液のスペクトルデータを取得する(図1(2)参照)。例えば、検量装置10は、ラマン分光装置である分光装置30が測定した細胞培養液のスペクトルデータを取得する。
(1-2-3.目的変量推定処理)
検量装置10は、細胞培養液のスペクトルデータを検量モデル14dに入力することによって、成分濃度等の目的変量を推定する(図1(3)参照)。このとき、入力されたスペクトルデータが記憶部14から読み出した検量モデル情報に適用されることにより、ピーク強度から測定対象成分量の予測値(推定結果)が算出される。
(1-2-4.推定結果表示処理)
検量装置10は、細胞培養液に関する推定結果を表示する(図1(4)参照)。例えば、検量装置10は、細胞培養液の測定対象成分として、栄養分濃度値等のプロセス変量を表示する。
(1-2-5.推定結果送信処理)
検量装置10は、細胞培養液に関する推定結果を調節装置40に対して送信する(図1(5)参照)。例えば、検量装置10は、栄養分濃度値等のプロセス変量を調節装置40に対して送信する。このとき、調節装置40は、栄養分濃度値等の調節を行うことによって、細胞培養装置20の環境の最適化を行う。
(1-3.検量システム100の効果)
以下では、参考技術の検量処理の問題点を説明した上で、検量システム100の効果について説明する。
(1-3-1.参考技術の検量処理の問題点)
参考技術の検量処理では、細胞培養装置(バイオリアクター)にラマン分光装置を接続し、スペクトルデータを取得する。また、当該処理では、任意の適切な分析手法で、栄養分(グルコース等)濃度のオフライン測定データを取得する。次に、当該処理では、多変量ソフトウェアパッケージを使用して、スペクトルデータのピークをプロセス変量のオフライン測定値に相関させる。このとき、当該処理では、平滑化または正規化による前処理を行うこともある。続いて、当該処理では、ケモメトリックモデリングを実行して、栄養分濃度値などのプロセス値を予測する。このとき、当該処理では、ノイズ低減のためにフィルタリングを行うこともある。そして、当該処理では、予測されたプロセス値を利用して、ラマンリアルタイム分析およびフィードバック制御を行い、細胞培養物に連続的かつ低濃度の栄養分を提供する。上記の検量処理には、以下のような問題点がある。
(1-3-1-1.問題点1)
上記の検量処理では、モデル作成用データセット(キャリブレーションセット)として、細胞培養装置に分光装置を接続して取得したスペクトルデータおよびサンプリングして得られる濃度データを使用する(n=7~12)。当該処理では、高精度な検量モデルを作成するためには、実際のモデル使用時に得られるスペクトル(バリデーションセット)との同等性(類似性)が高いこと、濃度範囲がカバーされており濃度間隔が均等であること、あらゆる条件が加味されており偶発的な相互相関がないこと等を満たしたキャリブレーションセットが必要になる。そのためには、複数回、複数の条件で細胞培養を実施する必要がある。
(1-3-1-2.問題点2)
上記の検量処理では、モデル作成にかかる時間とコストが膨大となる。例えば、当該処理では、1回の細胞培養(5Lスケール)にかかるコストは10~20万円程度であり、培養は1~2週間程度実施する。
(1-3-1-3.問題点3)
上記の検量処理では、サンプリングを伴う細胞培養を実施する必要があるが、サンプリングには培養液のロス、コンタミネーションのリスクがある。
(1-3-1-4.問題点4)
上記の検量処理では、測定が実施される細胞培養条件とモデル作成時の細胞培養条件を同じにすることで精度の高い予測を可能としている。しかし、当該処理では、細胞培養の条件が大きく異なるような場合には、予測値が実測値と大きく外れてしまう恐れがある。例えば、当該処理では、細胞種、細胞密度、培地、フィード剤等が異なる、または、それらが組合せで異なるような培養では、予測値が実測値と大きく外れてしまう恐れがある。
(1-3-1-5.問題点5)
上記の検量処理では、細胞培養条件や装置の設置条件に対する定量モデルのロバスト性が劣ってしまうことがある。
(1-3-2.検量システム100の概要)
検量システム100では、検量装置10は、複数の成分を含む非培養系サンプルSのスペクトルデータと成分濃度とを含む非培養系サンプルSの教師ありデータセットを生成し、当該データセットを用いた機械学習により、スペクトルデータの入力に応じて目的とする成分濃度を出力する機械学習モデルである検量モデル14dを訓練する。このとき、検量装置10は、細胞培養液に含まれる成分を様々な濃度で調製した非培養系サンプルSを用いて教師ありデータセットを生成する。また、検量装置10は、細胞培養液に対する分光分析により測定されたスペクトルデータを取得し、当該スペクトルデータを、訓練済みである検量モデル14dに入力して得られる結果に基づき、細胞培養液に含まれる成分の濃度を推定する。
(1-3-3.検量システム100の効果)
第1に、検量システム100は、キャリブレーションセットを準備するためのサンプリングを伴う細胞培養を行う必要がないので、モデル作成にかかる時間とコストを大幅に短縮できる。第2に、検量システム100は、培養液のロスやコンタミネーションのリスクがなくなる。第3に、検量システム100は、成分間の相互相関がないサンプルを調製してキャリブレーションセットとして用いていることから検量モデル14dが過学習されないので、細胞培養条件に対する定量モデルのロバスト性が向上し、様々な培養条件に適用できるようになる。第4に、検量システム100は、キャリブレーションセットのデータ数を従来よりも少なくできるので、必要なメモリ容量や演算コストを削減できる。
さらに、検量システム100は、広範な分析に利用することができる。例えば、検量システム100は、ラマン分光分析だけでなく、近赤外分光分析、赤外分光分析、紫外分光分析、蛍光分光分析、可視分光分析等の広範な分光分析手法にも使用することができる。また、検量システム100は、必ずしも生物培養を伴う必要はなく、化学合成や攪拌による混合のプロセスであっても適用することができる。また、また、検量システム100は、非培養系サンプルSの容量等のスケールに測定対象のスケールを限定することなく、より容量の大きい測定対象にも適用することができる。
〔2.検量システム100の各装置の構成〕
図2を用いて、図1に示した検量システム100が有する各装置の機能構成について説明する。図2は、実施形態に係る検量システム100の各装置の構成例を示すブロック図である。以下では、実施形態に係る検量装置10の構成例、検量装置10の推定結果の具体例、細胞培養装置20の構成例、分光装置30の構成例、調節装置40の構成例の順に詳細に説明する。
(2-1.検量装置10の構成例)
まず、図2を用いて、検量装置10の構成例について説明する。検量装置10は、入力部11、出力部12、通信部13、記憶部14および制御部15を有する。
(2-1-1.入力部11)
入力部11は、当該検量装置10への各種情報の入力を司る。例えば、入力部11は、マウスやキーボード等で実現され、当該検量装置10への設定情報等の入力を受け付ける。
(2-1-2.出力部12)
出力部12は、当該検量装置10からの各種情報の出力を司る。例えば、出力部12は、ディスプレイ等で実現され、当該検量装置10に記憶された設定情報等を出力する。
(2-1-3.通信部13)
通信部13は、他の装置との間でのデータ通信を司る。例えば、通信部13は、ルータ等を介して、各通信装置との間でデータ通信を行う。また、通信部13は、図示しないオペレータの端末との間でデータ通信を行うことができる。
(2-1-4.記憶部14)
記憶部14は、制御部15が動作する際に参照する各種情報や、制御部15が動作した際に取得した各種情報を記憶する。例えば、記憶部14は、複数の成分を含む基準試料のスペクトルデータと、当該基準試料の複数の成分ごとの含有量によって決定される各目的変量とを記憶する。記憶部14は、スペクトルデータ記憶部14a、目的変量データ記憶部14b、検量モデル情報記憶部14cおよび検量モデル14dを有する。ここで、記憶部14は、例えば、RAM(Random Access Memory)、フラッシュメモリ等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置等で実現され得る。なお、図2の例では、記憶部14は、検量装置10の内部に設置されているが、検量装置10の外部に設置されてもよいし、複数の記憶部が設置されていてもよい。
(2-1-4-1.スペクトルデータ記憶部14a)
スペクトルデータ記憶部14aは、制御部15の取得部15aによって取得されたスペクトルデータを記憶する。例えば、スペクトルデータ記憶部14aは、図示しない非培養系サンプル測定用装置から取得された非培養系サンプルSのスペクトルデータを記憶する。また、スペクトルデータ記憶部14aは、分光装置30から取得された細胞培養装置20の細胞培養液のスペクトルデータを記憶する。また、スペクトルデータ記憶部14aは、通信部13によって受信されたスペクトルデータを記憶してもよい。
(2-1-4-2.目的変量データ記憶部14b)
目的変量データ記憶部14bは、制御部15の取得部15aによって取得された目的変量データを記憶する。例えば、目的変量データ記憶部14bは、図示しない分析装置から取得された非培養系サンプルSや細胞培養液の各成分の濃度データを記憶する。また、目的変量データ記憶部14bは、非培養系サンプルSを調製する際に付与された各成分の濃度データを記憶する。また、目的変量データ記憶部14bは、通信部13によって受信された濃度データを記憶してもよい。さらに、目的変量データ記憶部14bは、各成分の濃度データの他、細胞密度、pH(水素イオン指数)、浸透圧等の各成分の含有量によって決定される目的変量全般を記憶する。
(2-1-4-3.検量モデル情報記憶部14c)
検量モデル情報記憶部14cは、制御部15の訓練部15cによって取得された検量モデル情報を記憶する。例えば、検量モデル情報記憶部14cは、スペクトルの前処理、波数範囲、回帰モデルの回帰係数、信号処理等の情報を記憶する。また、検量モデル情報記憶部14cは、検量モデル情報として、基準試料のデータセットにクロスバリデーションを用いて得られた第1開発条件を記憶する。また、検量モデル情報記憶部14cは、検量モデル情報として、測定対象試料のデータセットをバリデーションセットに用いて得られた第2開発条件を記憶する。
(2-1-4-4.検量モデル14d)
検量モデル14dは、スペクトルデータが入力されると、各成分の濃度等の目的変量を出力する機械学習モデルである。例えば、検量モデル14dは、PLSR(Partial Least Squares Regression)、主成分回帰、ガウス過程回帰等によって実現される機械学習モデルである。
(2-1-5.制御部15)
制御部15は、当該検量装置10全体の制御を司る。制御部15は、取得部15a、生成部15b、訓練部15cおよび推定部15dを有する。ここで、制御部15は、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等の電子回路やASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現され得る。
また、制御部15は、多変量解析による回帰モデルが構築可能な計算環境を有する。例えば、制御部15は、ケモメトリック手法や多変量解析手法のパッケージと、それを使用した演算を行う環境を有する。また、制御部15は、ネットワーク接続ができてもよい。
(2-1-5-1.取得部15a)
取得部15aは、複数の成分を含む基準試料に対する分光分析により測定されたスペクトルデータを取得する。例えば、取得部15aは、図示しない非培養計サンプル測定用装置を用いて、数mL~数千mLのビーカー等の容器に収容された非培養系サンプルSに対するスペクトルデータを取得する。また、取得部15aは、測定対象となる試料に対する分光分析により測定されたスペクトルデータを取得する。例えば、取得部15aは、分光装置30を用いてラマン分光分析、近赤外分光分析、赤外分光分析、紫外分光分析、蛍光分光分析、可視分光分析等により測定されたスペクトルデータを取得する。なお、取得部15aは、取得したスペクトルデータをスペクトルデータ記憶部14aに格納する。
(2-1-5-2.生成部15b)
生成部15bは、複数の成分を含む基準試料のスペクトルデータと当該基準試料の複数の成分ごとの含有量によって決定される各目的変量とを含む当該基準試料のデータセットを生成する。例えば、生成部15bは、記憶部14から複数の成分を含む基準試料のスペクトルデータと当該基準試料の複数の成分ごとの含有量によって決定される各目的変量とを取得し、当該基準試料の教師ありデータセットを生成する。
複数の成分を含む基準試料の例について説明すると、生成部15bは、複数の成分それぞれの含有量によって決定される目的変量が異なる複数の非培養系試料に対して分光分析を実行し、分光分析により得られる基準試料のスペクトルデータと各目的変量とを含む基準試料のデータセットを生成する。例えば、生成部15bは、栄養分であるグルコース、グルタミン酸等のアミノ酸の濃度が異なる複数の非培養系サンプルSに対してラマン分光分析を実行し、非培養系サンプルSのスペクトルデータと各濃度とを含む非培養系サンプルSのデータセットを生成する。具体的な例を用いて説明すると、生成部15bは、非培養系サンプルS1{グルコース濃度1.0g/L、グルタミン酸濃度1.0g/L}、非培養系サンプルS2{グルコース濃度2.0g/L、グルタミン酸濃度2.0g/L}、非培養系サンプルS3{グルコース濃度3.0g/L、グルタミン酸濃度3.0g/L}のように濃度が異なる複数の非培養系サンプルSに対してラマン分光分析を実行し、非培養系サンプルS1~S3のスペクトルデータと、各濃度{グルコース濃度、グルタミン酸濃度}とを含む非培養系サンプルSのデータセットを生成する。
また、生成部15bは、測定対象となる複数の培養系試料それぞれに含有される成分を用いて作成された複数の非培養系試料に対して分光分析を実行し、分光分析により得られる基準試料のスペクトルデータと各目的変量とを含む基準試料のデータセットを生成する。例えば、生成部15bは、測定対象となる培養細胞や代謝物を用いて作成された複数の非培養系サンプルSに対してラマン分光分析を実行し、非培養系サンプルSのスペクトルデータと各濃度とを含む非培養系サンプルSのデータセットを生成する。具体的な例を用いて説明すると、生成部15bは、非培養系サンプルS11{細胞A濃度1.0g/L、抗体A濃度1.0g/L}、非培養系サンプルS12{細胞B濃度2.0g/L、抗体B濃度1.0g/L}、非培養系サンプルS13{細胞C濃度1.0g/L、抗体C濃度1.0g/L}のように成分や濃度が異なる複数の非培養系サンプルSに対してラマン分光分析を実行し、非培養系サンプルS11~S13のスペクトルデータと、各濃度{細胞濃度、抗体濃度}とを含む非培養系サンプルSのデータセットを生成する。
さらに、生成部15bは、測定対象である試料のスペクトルデータと測定対象である試料の複数の成分ごとの含有量によって決定される各目的変量とを含む測定対象である試料のデータセットをさらに生成する。例えば、生成部15bは、細胞培養装置20の細胞培養液に対して分光装置30がラマン分光分析によって測定されたスペクトルデータと、任意の適切な分析手法によって測定された各成分濃度とを含む細胞培養液のデータセットを生成する。具体的な例を用いて説明すると、生成部15bは、測定対象である細胞Aの細胞培養液に対してラマン分光分析によって測定されたスペクトルデータである{ラマン分光スペクトルA}と、濃度データである{細胞A濃度1.0g/L、グルコース濃度2.0g/L、乳酸濃度1.0g/L、抗体A濃度1.0g/L}とを含む細胞Aの細胞培養液のデータセットを生成する。
上記ではデータセットに含まれる目的変量の例として濃度について説明してきたが、目的変量は濃度に限定されない。例えば、生成部15bは、各成分の濃度の他、細胞密度、pH(水素イオン指数)、浸透圧等の各成分の含有量によって決定される目的変量全般を用いてデータセットを生成することができる。
(2-1-5-3.訓練部15c)
訓練部15cは、複数の成分を含む基準試料のデータセットを用いた機械学習により、スペクトルデータの入力に応じて、複数の成分ごとの各目的変量のうち少なくとも1つの目的変量を出力する機械学習モデルを訓練する。例えば、複数の成分を含む非培養系サンプルSのデータセットを用いた機械学習により、説明変数であるスペクトルデータの入力に応じて、複数の成分ごとの各目的変量のうち少なくとも1つの目的変数である目的変量を出力する検量モデル14dを訓練する。具体的な例を用いて説明すると、訓練部15cは、データセット1{スペクトルデータ:ラマン分光スペクトル1、目的変量データ:グルコース濃度1.0g/L、グルタミン酸濃度1.0g/L}、データセット2{スペクトルデータ:ラマン分光スペクトル2、目的変量データ:グルコース濃度2.0g/L、グルタミン酸濃度2.0g/L}、データセット3{スペクトルデータ:ラマン分光スペクトル3、目的変量データ:グルコース濃度3.0g/L、グルタミン酸濃度3.0g/L}を用いた機械学習により、検量モデル14dを訓練する。
また、訓練部15cは、複数の成分を含む基準試料のデータセットにクロスバリデーションを用いてアルゴリズムまたはパラメータに関する第1開発条件を検索し、当該第1開発条件に基づいて機械学習モデルを訓練するとともに、当該第1開発条件を記憶部14に格納する。例えば、訓練部15cは、複数の成分を含む非培養系サンプルSのデータセットにクロスバリデーションを用いてスペクトルの前処理、波数範囲、回帰モデルの回帰係数、信号処理等の情報を検索し、当該情報に基づいて検量モデル14dを訓練する。このとき、訓練部15cは、当該情報を用いて最適なアルゴリズムやモデルのパラメータを特定し、それらを適用した検量モデル14dを訓練する。
なお、訓練部15cは、非培養系サンプルSに基づくアルゴリズムまたはパラメータに関する検索条件(スペクトルの前処理、波数範囲、回帰モデルの回帰係数、信号処理等の情報)を検量モデル情報として検量モデル情報記憶部14cに格納する。
さらに、訓練部15cは、測定対象である試料のデータセットをバリデーションセットに用いてアルゴリズムまたはパラメータに関する第2開発条件を検索し、当該第2開発条件に基づいて機械学習モデルを訓練するとともに、当該第2開発条件を記憶部14に格納する。例えば、訓練部15cは、細胞培養装置20の細胞培養液のデータセットをバリデーションセットに用いてスペクトルの前処理、波数範囲、回帰モデルの回帰係数、信号処理等の情報を検索し、当該情報に基づいて検量モデル14dを訓練する。このとき、訓練部15cは、当該情報を用いて最適なアルゴリズムやモデルのパラメータを特定し、それらを適用した検量モデル14dを訓練する。
なお、訓練部15cは、細胞培養装置20の細胞培養液に基づくアルゴリズムまたはパラメータに関する検索条件(スペクトルの前処理、波数範囲、回帰モデルの回帰係数、信号処理等の情報)を検量モデル情報として検量モデル情報記憶部14cに格納する。
(2-1-5-4.推定部15d)
推定部15dは、取得されたスペクトルデータを、訓練済みである機械学習モデルに入力して得られる結果に基づき、測定対象である試料に含まれる成分の含有量によって決定される目的変量を推定する。例えば、推定部15dは、取得された細胞培養装置20の細胞培養液のスペクトルデータを、検量モデル14dに入力して得られる結果に基づき、当該細胞培養装置20の細胞培養液に含まれる成分の成分濃度を推定する。具体的な例を用いて説明すると、推定部15dは、測定対象である細胞Aの細胞培養液の成分濃度として、{細胞A濃度2.0g/L、グルコース濃度1.5g/L、乳酸濃度1.5g/L、抗体A濃度2.0g/L}を推定する。また、推定部15dは、測定対象である細胞Aの細胞培養液の成分濃度のプロセスデータとして、時間1、時間2、時間3、・・・のように、任意の時刻での目的変量を推定する。
また、推定部15dは、推定結果を出力部12に表示することもできる。例えば、推定部15dは、スペクトルデータが取得された時刻の細胞培養液のグルコースの濃度変化を示したグラフを出力部12に表示する。また、推定部15dは、スペクトルデータが取得された時刻の細胞培養液の細胞の密度変化を示したグラフを出力部12に表示する。
また、推定部15dは、推定結果を調節装置40に送信することもできる。例えば、推定部15dは、細胞培養液のグルコースの濃度が閾値を下回った場合には、調節装置40に対してグルコースを供給するように指示を送信する。また、推定部15dは、細胞培養液のpHが正常範囲外の数値を示した場合には、調節装置40に対してpHを調整するように指示を送信する。
さらに、推定部15dは、測定対象のスケールを限定せずに目的変量を推定することができる。例えば、推定部15dは、数mLスケールの非培養系サンプルSのデータセットによって訓練された検量モデル14dを用いて、100mLスケール、5Lスケール、50Lスケール、2000Lスケールの細胞培養液の成分濃度を推定することができる。
(2-2.検量装置10の推定結果の具体例)
図3~図5を用いて、検量装置10の推定結果の具体例について説明する。図3~図5は、実施形態に係る推定結果の一例を示す図である。以下では、推定結果の誤差を評価した具体例1、細胞培養液の条件を大きく変更した具体例2について説明する。
(2-2-1.具体例1)
図3~図4を用いて、検量装置10の推定結果の具体例1について説明する。具体例1は、訓練済みの検量モデル14dを使用して、細胞培養プロセスにおける栄養分、代謝物の濃度の予測を行ったものである。このとき、モデルの性能を把握するために、同じ条件の5Lスケールの細胞培養プロセスを3バッチ(培養液1~3)用いて実施した。
図3の例では、横軸に「時間[日]」、縦軸に「グルコース[g/L]」をとり、時間経過に対する栄養分であるグルコース濃度の変化を示している。ここで、図3中の黒点は、検量装置10の推定結果である予測値を示す。また、図3中の白色の四角は、検量装置10の推定結果の検証のために測定されたオフライン測定値を示す。
図4の例では、培養液1~3におけるグルコース、乳酸、抗体ごとの予測標準誤差(RMSEP)を示している。ここで、図4中の予測標準誤差は、オフライン測定値付近11点の予測値を平均して誤差を算出したものである。図4に示すように、培養液1の予測標準誤差が{グルコース:0.28g/L、乳酸:0.40g/L、抗体:0.11g/L}、培養液2の予測標準誤差が{グルコース:0.27g/L、乳酸:0.28g/L、抗体:0.08g/L}、培養液3の予測標準誤差が{グルコース:0.31g/L、乳酸:0.18g/L、抗体:0.10g/L}と算出される。
上記の具体例1より、細胞培養プロセス3バッチ分の結果から検量モデル14dの予測能力の精度およびその再現性が確認することができる。
(2-2-2.具体例2)
図5を用いて、検量装置10の推定結果の具体例2について説明する。具体例2は、モデル生成時の条件と大きく異なる、すなわち培地を変更した5Lスケールの細胞培養プロセスに対して検量モデル14dモデルを適用した場合の推定結果であり、具体例1と同様に、細胞培養プロセスにおける栄養分、代謝物の濃度の予測を行ったものである。
図5の例では、図3と同様に、横軸に「時間[日]」、縦軸に「グルコース[g/L]」をとり、時間経過に対する栄養分であるグルコース濃度の変化を示している。ここで、図5中の黒点は、検量装置10の推定結果である予測値を示す。また、図5中の白色の四角は、検量装置10の推定結果の検証のために測定されたオフライン測定値を示す。
上記の具体例2より、条件の異なる細胞培養においても、栄養分、代謝物の成分濃度を予測することが可能であることが確認できる。
(2-3.細胞培養装置20の構成例)
図2を用いて、図1に示した細胞培養装置20の構成例について説明する。細胞培養装置20は、図示しない細胞培養槽を有する。細胞培養槽は、細胞、グルコースやアミノ酸を含む栄養成分、細胞代謝物を含む細胞培養液を収容する。ここで、細胞培養液によって培養される培養物としては、細胞の他、微生物、酵母等を使用してもよい。
(2-4.分光装置30の構成例)
図2を用いて、図1に示した分光装置30の構成例について説明する。分光装置30は、光源30a、分析部30b、導光部30cおよび測定部30dを有する。
(2-4-1.光源30a)
光源30aは、細胞培養液に対して照射される光の光源である。光源30aは、ラマン分光分析、近赤外分光分析、赤外分光分析、紫外分光分析、蛍光分光分析、可視分光分析等に使用される光の光源である。光源30aの光の種類および波長は、測定の目的によって変更することができる。
(2-4-2.分析部30b)
分析部30bは、測定部30dから導光部30cを介して導かれた光を分析する。例えば、分析部30bは、測定の目的によって最適な分光手段を選択し、導かれた光を分析する。また、分析部30bは、分光手段を有し、光の波長ごとの強度を検出してスペクトルを算出する。
(2-4-3.導光部30c)
導光部30cは、光源30aの光を測定部30dに導く。また、導光部30cは、細胞培養液から反射された光を分析部30bに導く。例えば、導光部30cは、ミラーや光ファイバー、レンズ等によって実現される。
(2-4-4.測定部30d)
測定部30dは、測定対象である細胞培養液に対して光を照射し、その反射光または散乱光を受光する。また、測定部30dは、細胞培養に影響を与えず、十分に攪拌されて均一化された培養液が入射光に照射されるような構造を有する。例えば、集光レンズプローブ、フローセル等によって実現される。
(2-5.調節装置40の構成例)
図2を用いて、図1に示した調節装置40の構成例について説明する。調節装置40は、細胞培養槽の環境(温度、pH、溶存酸素、栄養分濃度等)を調節する。例えば、調節装置40は、栄養分を供給するポンプやヒーター等によって実現される。
〔3.検量システム100の処理の流れ〕
図6~図8を用いて、実施形態に係る検量システム100の処理の流れについて説明する。以下では、データ推定処理の流れ、検量モデル構築処理1の流れ、検量モデル構築処理2の流れの順に説明する。
(3-1.データ推定処理の流れ)
図6を用いて、実施形態に係るデータ推定処理の流れについて説明する。図6は、実施形態に係るデータ推定処理の流れの一例を示すフローチャートである。なお、下記のステップS101~S104の処理は、異なる順序で実行することもできる。また、下記のステップS101~S104の処理のうち、省略される処理があってもよい。
(3-1-1.スペクトルデータ取得処理)
第1に、検量装置10の取得部15aは、スペクトルデータを取得する(ステップS101)。例えば、取得部15aは、分光装置30を用いてラマン分光分析、近赤外分光分析、赤外分光分析、紫外分光分析、蛍光分光分析、可視分光分析等により測定された細胞培養液のスペクトルデータを取得する。このとき、取得部15aは、分光装置30の分析部30bによってデジタル情報に変換されたデータを取得し、当該データからスペクトルデータを算出する。
(3-1-2.目的変量推定処理)
第2に、検量装置10の推定部15dは、成分濃度等の目的変量を推定する(ステップS102)。例えば、推定部15dは、取得された細胞培養装置20の細胞培養液のスペクトルデータを検量モデル14dに入力して得られる結果に基づき、当該細胞培養装置20の細胞培養液に含まれるグルコース等の成分ごとの濃度を推定する。このとき、推定部15dは、取得されたスペクトルデータを記憶部14から読み出した検量モデル情報に適用することによって、ピーク強度から測定対象成分量(例:栄養分濃度値等のプロセス変量)の予測値を算出する。
(3-1-3.推定結果表示処理)
第3に、検量装置10の推定部15dは、推定結果を表示する(ステップS103)。例えば、推定部15dは、スペクトルデータが取得された時刻の細胞培養液のグルコースの濃度変化を示したグラフを出力部12に表示する。
(3-1-4.推定結果送信処理)
第4に、検量装置10の推定部15dは、推定結果を送信し(ステップS104)、処理を終了する。例えば、推定部15dは、細胞培養液のグルコースの濃度が閾値を下回った場合には、調節装置40に対してグルコースを供給するように指示を送信する。このとき、推定結果を受信した調節装置40は、細胞培養装置20の細胞培養槽の最適化を実行する。
(3-1-5.データ推定処理の効果)
上記のデータ推定処理では、細胞培養装置20に分光装置30を接続して得られるスペクトルデータを検量モデル14dで処理することによって、対象成分の濃度をリアルタイムに推定することができる。また、データ推定処理では、対象成分の濃度の推定値を用いて、培養液中の濃度の制御をリアルタイムに行うことで、最適な培養環境を維持することができる。
(3-2.検量モデル構築処理1の流れ)
図7を用いて、実施形態に係る検量モデル構築処理1の流れについて説明する。図7は、実施形態に係る検量モデル構築処理1の流れの一例を示すフローチャートである。なお、下記のステップS201~S204の処理は、異なる順序で実行することもできる。また、下記のステップS201~S204の処理のうち、省略される処理があってもよい。
(3-2-1.データセット取得処理)
第1に、検量装置10の生成部15bは、キャリブレーションセットを読み出す(ステップS201)。例えば、生成部15bは、培養プロセス予測前に非培養系サンプルSで測定されたスペクトルデータと目的変量データとを記憶部14から取得し、教師ありデータセットとして生成する。このとき、生成部15bは、教師ありデータセットとして記憶部14に記憶されるキャリブレーションセットを読み出してもよい。
(3-2-2.開発条件検索処理)
第2に、検量装置10の訓練部15cは、検量モデル14dの開発条件を検索する(ステップS202)。例えば、訓練部15cは、非培養系サンプルSのデータセットにクロスバリデーションを用いて解析のアルゴリズムの種類やパラメータに関する第1開発条件(非培養系サンプルSのデータセットから得られたスペクトルの前処理、波数範囲、回帰モデルの回帰係数、信号処理等の情報)を検索する。
(3-2-3.検量モデル訓練処理)
第3に、検量装置10の訓練部15cは、検索結果をもとに検量モデル14dを構築する(ステップS203)。例えば、訓練部15cは、非培養系サンプルSのデータセットを用いた機械学習により、説明変数であるスペクトルデータの入力に応じて、目的変数である成分濃度を出力する検量モデル14dを訓練する。
(3-2-4.検量モデル情報格納処理)
第4に、検量装置10の訓練部15cは、検量モデル情報を格納し(ステップS204)、処理を終了する。このとき、訓練部15cは、検量モデル情報記憶部14cにスペクトルの前処理、波数範囲、回帰モデルの回帰係数、信号処理等の情報を格納する。
(3-2-5.検量モデル構築処理1の効果)
上記の検量モデル構築処理1では、キャリブレーションセットを準備するためのサンプリングを伴う細胞培養を行う必要がないので、モデル作成にかかる時間とコストを大幅に短縮でき、培養液のロス、コンタミネーションのリスクがなくなる。また、検量モデル構築処理1では、細胞培養条件に対する定量モデルのロバスト性が向上し、様々な培養条件に適用できるようになる。さらに、検量モデル構築処理1では、キャリブレーションセットのデータ数を従来法よりも少なくできるため、必要なメモリ容量、演算コストを削減できる。
(3-3.検量モデル構築処理2の流れ)
図8を用いて、さらに細胞培養装置20を稼働させて新規取得したデータセットを用いる実施形態に係る検量モデル構築処理2の流れについて説明する。図8は、実施形態に係る検量モデル構築処理2の流れの一例を示すフローチャートである。なお、下記のステップS301~S304の処理は、異なる順序で実行することもできる。また、下記のステップS301~S304の処理のうち、省略される処理があってもよい。
(3-3-1.データセット取得処理)
第1に、検量装置10の生成部15bは、キャリブレーションセットおよび新規取得したデータセットを読み出す(ステップS301)。このとき、生成部15bは、新規取得したデータセットには、スペクトルデータとして、細胞培養装置20に接続して取得したデータを使用する。あるいは、生成部15bは、別の分光装置による測定データを使用してもよい。また、生成部15bは、目的変量データとして、スペクトルデータの測定前後でサンプリングを実施し、任意の適切な分析手法で取得されたデータを使用する。
例えば、生成部15bは、キャリブレーションセットとして、記憶部14に予め保存されていた非培養系サンプルSのデータセットを読み出す。また、生成部15bは、新規取得したデータセットとして、5Lスケールの細胞培養データを読み出す。このとき、生成部15bは、新規取得したデータセットに供する細胞培養データとして、非培養系サンプルSと同じ培地成分を用いてもよいし、異なる培地成分を用いてもよい。なお、上記の培地は、非培養系サンプルSの主に希釈のために使用され、メーカーの製品ごとに内容物が異なる。
(3-3-2.開発条件検索処理)
第2に、検量装置10の訓練部15cは、検量モデル14dの開発条件を検索する(ステップS302)。このとき、訓練部15cは、新規取得したデータセットをバリデーションセットとして用いて解析のアルゴリズムの種類やパラメータに関する第2開発条件(新規取得したデータセットから得られたスペクトルの前処理、波数範囲、回帰モデルの回帰係数、信号処理等の情報)を検索する。
(3-3-3.検量モデル訓練処理)
第3に、検量装置10の訓練部15cは、検索結果をもとに検量モデル14dを構築する(ステップS303)。なお、検量モデル訓練処理については、上述した検量モデル構築処理1の検量モデル訓練処理と同様の処理であるため、説明を省略する。
(3-3-4.検量モデル情報格納処理)
第4に、検量装置10の訓練部15cは、検量モデル情報を格納し(ステップS304)、処理を終了する。なお、検量モデル情報格納処理については、上述した検量モデル構築処理1の検量モデル情報格納処理と同様の処理であるため、説明を省略する。
(3-3-5.検量モデル構築処理2の評価)
図9を用いて、上記の検量モデル構築処理2の評価について説明する。図9は、実施形態に係る検量モデル構築処理2の評価の一例を示す図である。図9の例では、培養液1-1~1-3および培養液2-1~2-2におけるグルコース、乳酸、抗体ごとの予測標準誤差(RMSEP)の変化を示している。ここで、培養液1-1~1-3は、モデル作成時の条件と同じ5Lスケールの細胞培養液であり、培養液2-1~2-2は、モデル作成時の条件と大きく異なる、すなわち培地を変更した5Lスケールの細胞培養液である。
図9に示すように、培養液1-1の予測標準誤差が{グルコース:0.28g/L→0.18g/L、乳酸:0.40g/L→0.11g/L、抗体:0.11g/L→0.20g/L}、培養液1-2の予測標準誤差が{グルコース:0.27g/L→0.16g/L、乳酸:0.28g/L→0.22g/L、抗体:0.08g/L→0.12g/L}、培養液1-3の予測標準誤差が{グルコース:0.31g/L→0.18g/L、乳酸:0.18g/L→0.15g/L、抗体:0.10g/L→0.13g/L}と算出される。また、培養液2-1の予測標準誤差が{グルコース:0.39g/L→0.13g/L、乳酸:0.35g/L→0.10g/L、抗体:0.51g/L→0.14g/L}、培養液2-2の予測標準誤差が{グルコース:0.62g/L→0.16g/L、乳酸:0.50g/L→0.36g/L、抗体:0.40g/L→0.14g/L}と算出される。
上記のように、検量モデル構築処理2によって構築された検量モデル14dの検量精度の向上を確認することができる。
(3-3-6.検量モデル構築処理2の効果)
上記の検量モデル構築処理2は、非培養系のスペクトルのみからなるキャリブレーションセットに対して、1回以上の細胞培養データのデータセットをバリデーションに使用して、新規のモデルを作成することができる。すなわち、検量モデル構築処理2では、検量モデル構築処理1の効果に加えて、新規取得したデータセットをバリデーションに用いることで、実際に予測したい測定対象物に適した検量モデル14dの諸条件に合わせることができ、検量精度を向上することができる。
〔4.実施形態の効果〕
最後に、実施形態の効果について説明する。以下では、実施形態に係る処理に対応する効果1~6について説明する。
(4-1.効果1)
第1に、上述した実施形態に係る処理では、複数成分を含む基準試料のスペクトルデータと当該基準試料の複数成分ごとの含有量によって決定される各目的変量とを含む基準試料データセットを生成し、当該基準試料データセットを用いた機械学習により、スペクトルデータの入力に応じて、複数の成分ごとの各目的変量のうち少なくとも1つの目的変量を出力する検量モデル14dを訓練する。このため、実施形態に係る処理では、効果的に高精度な検量モデル14dを作成することができる。
(4-2.効果2)
第2に、上述した実施形態に係る処理では、複数成分それぞれの目的変量が異なる複数の非培養系試料に対して分光分析を実行し、当該分光分析により得られる基準試料のスペクトルデータと各目的変量とを含む基準試料のデータセットを生成する。このため、実施形態に係る処理では、異なる目的変量の基準試料を用いることによって、効果的に高精度な検量モデル14dを作成することができる。
(4-3.効果3)
第3に、上述した実施形態に係る処理では、測定対象となる複数の培養系試料それぞれに含有される成分を用いて作成された複数の非培養系試料に対して分光分析を実行し、分光分析により得られる基準試料のスペクトルデータと各目的変量とを含む基準試料データセットを生成する。このため、実施形態に係る処理では、測定対象となる培養系試料に成分が類似する基準試料を用いることによって、効果的に高精度な検量モデル14dを作成することができる。
(4-4.効果4)
第4に、上述した実施形態に係る処理では、測定対象である試料に対する分光分析により測定されたスペクトルデータを取得し、取得したスペクトルデータを訓練済みである検量モデル14dに入力して得られる結果に基づき、測定対象である試料に含まれる成分の含有量によって決定される目的変量を推定する。このため、実施形態に係る処理では、効果的に高精度な検量モデル14dを作成するとともに、推定結果を活用して測定対象の環境を最適化することができる。
(4-5.効果5)
第5に、上述した実施形態に係る処理では、基準試料のスペクトルデータと各目的変量とを保持し、保持した基準試料のスペクトルデータと各目的変量とを取得し、基準試料の教師ありデータセットを生成し、基準試料のデータセットにクロスバリデーションを用いてアルゴリズムまたはパラメータに関する開発条件を検索し、当該開発条件に基づいて機械学習モデルを訓練するとともに、当該開発条件を保持する。このため、実施形態に係る処理では、基準試料のオフラインデータを用いるとともに適切な検量モデル14dの調整を行うことによって、効果的に高精度な検量モデル14dを作成することができる。
(4-6.効果6)
第6に、上述した実施形態に係る処理では、測定対象試料のスペクトルデータと測定対象試料の複数成分ごとの含有量によって決定される各目的変量とを含む測定対象試料データセットをさらに生成し、測定対象試料データセットをバリデーションセットに用いてアルゴリズムまたはパラメータに関する開発条件をさらに検索し、当該開発条件に基づいて検量モデル14dを訓練する。このため、実施形態に係る処理では、実際に予測したい測定対象に合わせた適切な学習モデルの調整を行うことによって、効果的に高精度な検量モデルを作成することができる。
〔システム〕
上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散や統合の具体的形態は図示のものに限られない。つまり、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
さらに、各装置にて行なわれる各処理機能は、その全部または任意の一部が、CPUおよび当該CPUにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。
〔ハードウェア〕
次に、検量装置10のハードウェア構成例を説明する。図10は、ハードウェア構成例を説明する図である。図10に示すように、検量装置10は、通信装置10a、HDD(Hard Disk Drive)10b、メモリ10c、プロセッサ10dを有する。また、図10に示した各部は、バス等で相互に接続される。
通信装置10aは、ネットワークインタフェースカードなどであり、他のサーバとの通信を行う。HDD10bは、図2に示した機能を動作させるプログラムやDBを記憶する。
プロセッサ10dは、図2に示した各処理部と同様の処理を実行するプログラムをHDD10b等から読み出してメモリ10cに展開することで、図2等で説明した各機能を実行するプロセスを動作させる。例えば、このプロセスは、検量装置10が有する各処理部と同様の機能を実行する。具体的には、プロセッサ10dは、取得部15a、生成部15b、訓練部15c、推定部15d等と同様の機能を有するプログラムをHDD10b等から読み出す。そして、プロセッサ10dは、取得部15a、生成部15b、訓練部15c、推定部15d等と同様の処理を実行するプロセスを実行する。
このように、検量装置10は、プログラムを読み出して実行することで各種処理方法を実行する装置として動作する。また、検量装置10は、媒体読取装置によって記録媒体から上記プログラムを読み出し、読み出された上記プログラムを実行することで上記した実施形態と同様の機能を実現することもできる。なお、この他の実施形態でいうプログラムは、検量装置10によって実行されることに限定されるものではない。例えば、他のコンピュータまたはサーバがプログラムを実行する場合や、これらが協働してプログラムを実行するような場合にも、本発明を同様に適用することができる。
このプログラムは、インターネットなどのネットワークを介して配布することができる。また、このプログラムは、ハードディスク、フレキシブルディスク(FD)、CD-ROM、MO(Magneto-Optical disk)、DVD(Digital Versatile Disc)などのコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行することができる。
〔その他〕
開示される技術特徴の組合せのいくつかの例を以下に記載する。
(1)複数の成分を含む基準試料のスペクトルデータと前記基準試料の前記複数の成分ごとの含有量によって決定される各目的変量とを含む前記基準試料のデータセットを生成する生成部と、前記基準試料のデータセットを用いた機械学習により、前記スペクトルデータの入力に応じて、前記複数の成分ごとの前記各目的変量のうち少なくとも1つの目的変量を出力する機械学習モデルを訓練する訓練部と、を備える検量装置。
(2)前記生成部は、前記複数の成分それぞれの含有量によって決定される目的変量が異なる複数の非培養系試料に対して分光分析を実行し、前記分光分析により得られる前記基準試料のスペクトルデータと前記各目的変量とを含む前記基準試料のデータセットを生成する、(1)に記載の検量装置。
(3)前記生成部は、測定対象となる複数の培養系試料それぞれに含有される成分を用いて作成された前記複数の非培養系試料に対して分光分析を実行し、前記分光分析により得られる前記基準試料のスペクトルデータと前記各目的変量とを含む前記基準試料のデータセットを生成する、(2)に記載の検量装置。
(4)測定対象となる試料に対する分光分析により測定されたスペクトルデータを取得する取得部と、取得された前記スペクトルデータを、訓練済みである前記機械学習モデルに入力して得られる結果に基づき、前記測定対象である試料に含まれる成分の含有量によって決定される目的変量を推定する推定部と、をさらに備える(1)から(3)のいずれかに記載の検量装置。
(5)前記基準試料のスペクトルデータと前記各目的変量とを記憶する記憶部をさらに備え、前記生成部は、前記記憶部から前記基準試料のスペクトルデータと前記各目的変量とを取得し、前記基準試料の教師ありデータセットを生成し、前記訓練部は、前記基準試料のデータセットにクロスバリデーションを用いてアルゴリズムまたはパラメータに関する第1開発条件を検索し、前記第1開発条件に基づいて前記機械学習モデルを訓練するとともに、前記第1開発条件を前記記憶部に格納する、(1)から(4)に記載の検量装置。
(6)前記生成部は、前記測定対象である試料のスペクトルデータと前記測定対象である試料の前記複数の成分ごとの含有量によって決定される各目的変量とを含む前記測定対象である試料のデータセットをさらに生成し、前記訓練部は、前記測定対象である試料のデータセットをバリデーションセットとして用いてアルゴリズムまたはパラメータに関する第2開発条件をさらに検索し、前記第2開発条件に基づいて前記機械学習モデルを訓練するとともに、前記第2開発条件を前記記憶部に格納する、(5)に記載の検量装置。
(7)コンピュータが、複数の成分を含む基準試料のスペクトルデータと前記基準試料の前記複数の成分ごとの含有量によって決定される各目的変量とを含む前記基準試料のデータセットを生成し、前記基準試料のデータセットを用いた機械学習により、前記スペクトルデータの入力に応じて、前記複数の成分ごとの前記各目的変量のうち少なくとも1つの目的変量を出力する機械学習モデルを訓練する、処理を実行する検量方法。
(8)コンピュータに、複数の成分を含む基準試料のスペクトルデータと前記基準試料の前記複数の成分ごとの含有量によって決定される各目的変量とを含む前記基準試料のデータセットを生成し、前記基準試料のデータセットを用いた機械学習により、前記スペクトルデータの入力に応じて、前記複数の成分ごとの前記各目的変量のうち少なくとも1つの目的変量を出力する機械学習モデルを訓練する、処理を実行させる検量プログラム。
10 検量装置
11 入力部
12 出力部
13 通信部
14 記憶部
14a スペクトルデータ記憶部
14b 目的変量データ記憶部
14c 検量モデル情報記憶部
14d 検量モデル
15 制御部
15a 取得部
15b 生成部
15c 訓練部
15d 推定部
20 細胞培養装置
30 分光装置
30a 光源
30b 分析部
30c 導光部
30d 測定部
40 調節装置
100 検量システム

Claims (8)

  1. 複数の成分を含む基準試料のスペクトルデータと前記基準試料の前記複数の成分ごとの含有量によって決定される各目的変量とを含む前記基準試料のデータセットを生成する生成部と、
    前記基準試料のデータセットを用いた機械学習により、前記スペクトルデータの入力に応じて、前記複数の成分ごとの前記各目的変量のうち少なくとも1つの目的変量を出力する機械学習モデルを訓練する訓練部と、
    を備える検量装置。
  2. 前記生成部は、
    前記複数の成分それぞれの含有量によって決定される目的変量が異なる複数の非培養系試料に対して分光分析を実行し、
    前記分光分析により得られる前記基準試料のスペクトルデータと前記各目的変量とを含む前記基準試料のデータセットを生成する、
    請求項1に記載の検量装置。
  3. 前記生成部は、
    測定対象となる複数の培養系試料それぞれに含有される成分を用いて作成された前記複数の非培養系試料に対して分光分析を実行し、
    前記分光分析により得られる前記基準試料のスペクトルデータと前記各目的変量とを含む前記基準試料のデータセットを生成する、
    請求項2に記載の検量装置。
  4. 測定対象となる試料に対する分光分析により測定されたスペクトルデータを取得する取得部と、
    取得された前記スペクトルデータを、訓練済みである前記機械学習モデルに入力して得られる結果に基づき、前記測定対象である試料に含まれる成分の含有量によって決定される目的変量を推定する推定部と、
    をさらに備える請求項1から3のいずれか1項に記載の検量装置。
  5. 前記基準試料のスペクトルデータと前記各目的変量とを記憶する記憶部をさらに備え、
    前記生成部は、
    前記記憶部から前記基準試料のスペクトルデータと前記各目的変量とを取得し、前記基準試料の教師ありデータセットを生成し、
    前記訓練部は、
    前記基準試料のデータセットにクロスバリデーションを用いてアルゴリズムまたはパラメータに関する第1開発条件を検索し、前記第1開発条件に基づいて前記機械学習モデルを訓練するとともに、前記第1開発条件を前記記憶部に格納する、
    請求項4に記載の検量装置。
  6. 前記生成部は、
    前記測定対象である試料のスペクトルデータと前記測定対象である試料の前記複数の成分ごとの含有量によって決定される各目的変量とを含む前記測定対象である試料のデータセットをさらに生成し、
    前記訓練部は、
    前記測定対象である試料のデータセットをバリデーションセットとして用いてアルゴリズムまたはパラメータに関する第2開発条件をさらに検索し、前記第2開発条件に基づいて前記機械学習モデルを訓練するとともに、前記第2開発条件を前記記憶部に格納する、
    請求項5に記載の検量装置。
  7. コンピュータが、
    複数の成分を含む基準試料のスペクトルデータと前記基準試料の前記複数の成分ごとの含有量によって決定される各目的変量とを含む前記基準試料のデータセットを生成し、
    前記基準試料のデータセットを用いた機械学習により、前記スペクトルデータの入力に応じて、前記複数の成分ごとの前記各目的変量のうち少なくとも1つの目的変量を出力する機械学習モデルを訓練する、
    処理を実行する検量方法。
  8. コンピュータに、
    複数の成分を含む基準試料のスペクトルデータと前記基準試料の前記複数の成分ごとの含有量によって決定される各目的変量とを含む前記基準試料のデータセットを生成し、
    前記基準試料のデータセットを用いた機械学習により、前記スペクトルデータの入力に応じて、前記複数の成分ごとの前記各目的変量のうち少なくとも1つの目的変量を出力する機械学習モデルを訓練する、
    処理を実行させる検量プログラム。
JP2022100959A 2022-06-23 2022-06-23 検量装置、検量方法および検量プログラム Active JP7168118B1 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2022100959A JP7168118B1 (ja) 2022-06-23 2022-06-23 検量装置、検量方法および検量プログラム
JP2022172704A JP2024002873A (ja) 2022-06-23 2022-10-27 検量装置、検量方法および検量プログラム
EP23152500.7A EP4296348A1 (en) 2022-06-23 2023-01-19 Calibration device, calibration method, and calibration program
US18/106,849 US20230419174A1 (en) 2022-06-23 2023-02-07 Calibration device, calibration method, and computer-readable recording medium
CN202310146751.3A CN117288697A (zh) 2022-06-23 2023-02-15 检量装置、检量方法和计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022100959A JP7168118B1 (ja) 2022-06-23 2022-06-23 検量装置、検量方法および検量プログラム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2022172704A Division JP2024002873A (ja) 2022-06-23 2022-10-27 検量装置、検量方法および検量プログラム

Publications (2)

Publication Number Publication Date
JP7168118B1 JP7168118B1 (ja) 2022-11-09
JP2024002023A true JP2024002023A (ja) 2024-01-11

Family

ID=83977453

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2022100959A Active JP7168118B1 (ja) 2022-06-23 2022-06-23 検量装置、検量方法および検量プログラム
JP2022172704A Pending JP2024002873A (ja) 2022-06-23 2022-10-27 検量装置、検量方法および検量プログラム

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2022172704A Pending JP2024002873A (ja) 2022-06-23 2022-10-27 検量装置、検量方法および検量プログラム

Country Status (4)

Country Link
US (1) US20230419174A1 (ja)
EP (1) EP4296348A1 (ja)
JP (2) JP7168118B1 (ja)
CN (1) CN117288697A (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016128822A (ja) * 2010-09-17 2016-07-14 アッヴィ・インコーポレイテッド バイオプロセス操作用のラマン分光法
JP2020020785A (ja) * 2018-06-29 2020-02-06 ヴァイアヴィ・ソリューションズ・インコーポレイテッドViavi Solutions Inc. 分光モデルのクロスバリデーションベース較正
JP2020537126A (ja) * 2017-10-06 2020-12-17 ロンザ リミテッドLonza Limited ラマン分光法を使用する細胞培養の自動制御
JP2022131809A (ja) * 2021-02-26 2022-09-07 横河電機株式会社 測定方法及び測定システム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MX2020003555A (es) 2017-10-16 2020-08-03 Regeneron Pharma Sistemas de espectroscopia raman in situ y metodos para controlar variables de proceso en cultivos celulares.
CN110920255B (zh) * 2018-09-19 2021-03-12 精工爱普生株式会社 打印头控制电路、打印头以及液体喷出装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016128822A (ja) * 2010-09-17 2016-07-14 アッヴィ・インコーポレイテッド バイオプロセス操作用のラマン分光法
JP2020537126A (ja) * 2017-10-06 2020-12-17 ロンザ リミテッドLonza Limited ラマン分光法を使用する細胞培養の自動制御
JP2020020785A (ja) * 2018-06-29 2020-02-06 ヴァイアヴィ・ソリューションズ・インコーポレイテッドViavi Solutions Inc. 分光モデルのクロスバリデーションベース較正
JP2022131809A (ja) * 2021-02-26 2022-09-07 横河電機株式会社 測定方法及び測定システム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
小西 正朗: "成分分析と機械学習を用いた微生物培地解析に関する研究", 生物工学会誌, vol. 第100巻 第3号, JPN7022003242, 25 March 2022 (2022-03-25), pages 125 - 130, ISSN: 0004824594 *

Also Published As

Publication number Publication date
CN117288697A (zh) 2023-12-26
US20230419174A1 (en) 2023-12-28
EP4296348A1 (en) 2023-12-27
JP2024002873A (ja) 2024-01-11
JP7168118B1 (ja) 2022-11-09

Similar Documents

Publication Publication Date Title
Reddi et al. Mlperf inference benchmark
Pfeiffer et al. Manufacturing lead time estimation with the combination of simulation and statistical learning methods
US20220068440A1 (en) System and method for predicting quality of a chemical compound and/or of a formulation thereof as a product of a production process
JP2021522601A (ja) バッチプロセスのモデル化、監視及び制御におけるバッチデータの自動アライメントのためのコンピュータシステム及び方法
Gargalo et al. Towards the development of digital twins for the bio-manufacturing industry
JP6620100B2 (ja) 合成多成分の生物工学および化学プロセス試料を調製するための方法およびシステム
Rathore et al. Digitization in bioprocessing: The role of soft sensors in monitoring and control of downstream processing for production of biotherapeutic products
US20230272331A1 (en) Predictive Modeling and Control of Cell Culture
Huang et al. Reconstructing dynamic molecular states from single-cell time series
Henriques et al. Monitoring mammalian cell cultivations for monoclonal antibody production using near-infrared spectroscopy
Graf et al. A novel approach for non-invasive continuous in-line control of perfusion cell cultivations by Raman spectroscopy
Brunner et al. Online sensor validation in sensor networks for bioprocess monitoring using swarm intelligence
Poth et al. Extensive evaluation of machine learning models and data preprocessings for Raman modeling in bioprocessing
Min et al. Application of semi-supervised convolutional neural network regression model based on data augmentation and process spectral labeling in Raman predictive modeling of cell culture processes
Fletcher et al. Quantifying uncertainty from aerosol and atmospheric parameters and their impact on climate sensitivity
CN116052778A (zh) 实时监测生物反应器中细胞培养液组分浓度的方法
CN117217419B (zh) 工业生产全生命周期碳排放监测方法及系统
Steinwandter et al. Propagation of measurement accuracy to biomass soft-sensor estimation and control quality
CN112651173B (zh) 一种基于跨域光谱信息的农产品品质无损检测方法及可泛化系统
Reis et al. Prediction of profiles in the process industries
JP7168118B1 (ja) 検量装置、検量方法および検量プログラム
Craven et al. Process analytical technology and quality-by-design for animal cell culture
Zhao et al. Multi-mode process monitoring based on a novel weighted local standardization strategy and support vector data description
CN113702328B (zh) 一种成品油的性质分析方法、装置、设备及存储介质
Putra et al. Estimation of acetic acid concentration from biogas samples using machine learning

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220623

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20220623

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220712

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220912

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220927

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221010

R150 Certificate of patent or registration of utility model

Ref document number: 7168118

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150