CN117288697A - 检量装置、检量方法和计算机可读存储介质 - Google Patents
检量装置、检量方法和计算机可读存储介质 Download PDFInfo
- Publication number
- CN117288697A CN117288697A CN202310146751.3A CN202310146751A CN117288697A CN 117288697 A CN117288697 A CN 117288697A CN 202310146751 A CN202310146751 A CN 202310146751A CN 117288697 A CN117288697 A CN 117288697A
- Authority
- CN
- China
- Prior art keywords
- spectral data
- machine learning
- components
- sample
- reference sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 76
- 238000003860 storage Methods 0.000 title claims abstract description 55
- 230000003595 spectral effect Effects 0.000 claims abstract description 109
- 239000013074 reference sample Substances 0.000 claims abstract description 72
- 238000010801 machine learning Methods 0.000 claims abstract description 57
- 238000012549 training Methods 0.000 claims abstract description 47
- 239000000523 sample Substances 0.000 claims description 62
- 238000005259 measurement Methods 0.000 claims description 45
- 238000011161 development Methods 0.000 claims description 36
- 238000004611 spectroscopical analysis Methods 0.000 claims description 36
- 238000012795 verification Methods 0.000 claims description 11
- 238000002790 cross-validation Methods 0.000 claims description 7
- 238000004519 manufacturing process Methods 0.000 abstract description 4
- 238000004113 cell culture Methods 0.000 description 102
- 238000012545 processing Methods 0.000 description 63
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 36
- 239000008103 glucose Substances 0.000 description 36
- 238000010276 construction Methods 0.000 description 28
- JVTAAEKCZFNVCJ-UHFFFAOYSA-N lactic acid Chemical compound CC(O)C(O)=O JVTAAEKCZFNVCJ-UHFFFAOYSA-N 0.000 description 26
- 210000004027 cell Anatomy 0.000 description 22
- 238000001069 Raman spectroscopy Methods 0.000 description 20
- 239000007788 liquid Substances 0.000 description 20
- 235000015097 nutrients Nutrition 0.000 description 20
- 230000000694 effects Effects 0.000 description 19
- 238000004458 analytical method Methods 0.000 description 18
- 238000001228 spectrum Methods 0.000 description 15
- 238000004891 communication Methods 0.000 description 14
- 238000013500 data storage Methods 0.000 description 14
- 239000012930 cell culture fluid Substances 0.000 description 13
- 235000014655 lactic acid Nutrition 0.000 description 13
- 239000004310 lactic acid Substances 0.000 description 13
- FFBHFFJDDLITSX-UHFFFAOYSA-N benzyl N-[2-hydroxy-4-(3-oxomorpholin-4-yl)phenyl]carbamate Chemical compound OC1=C(NC(=O)OCC2=CC=CC=C2)C=CC(=C1)N1CCOCC1=O FFBHFFJDDLITSX-UHFFFAOYSA-N 0.000 description 12
- 238000010586 diagram Methods 0.000 description 12
- 239000002609 medium Substances 0.000 description 12
- 238000007781 pre-processing Methods 0.000 description 9
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 8
- 239000001963 growth medium Substances 0.000 description 8
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 235000013922 glutamic acid Nutrition 0.000 description 6
- 239000004220 glutamic acid Substances 0.000 description 6
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 5
- 239000002207 metabolite Substances 0.000 description 5
- 238000005070 sampling Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 4
- 238000004497 NIR spectroscopy Methods 0.000 description 3
- 235000001014 amino acid Nutrition 0.000 description 3
- 150000001413 amino acids Chemical class 0.000 description 3
- 238000011109 contamination Methods 0.000 description 3
- 238000001506 fluorescence spectroscopy Methods 0.000 description 3
- 238000007689 inspection Methods 0.000 description 3
- 239000013028 medium composition Substances 0.000 description 3
- 244000005700 microbiome Species 0.000 description 3
- 238000000870 ultraviolet spectroscopy Methods 0.000 description 3
- 210000004102 animal cell Anatomy 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 239000012531 culture fluid Substances 0.000 description 2
- 229930195712 glutamate Natural products 0.000 description 2
- GPRLSGONYQIRFK-UHFFFAOYSA-N hydron Chemical compound [H+] GPRLSGONYQIRFK-UHFFFAOYSA-N 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000000491 multivariate analysis Methods 0.000 description 2
- 230000003204 osmotic effect Effects 0.000 description 2
- 238000010238 partial least squares regression Methods 0.000 description 2
- 238000004445 quantitative analysis Methods 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- CIWBSHSKHKDKBQ-JLAZNSOCSA-N Ascorbic acid Chemical compound OC[C@H](O)[C@H]1OC(=O)C(O)=C1O CIWBSHSKHKDKBQ-JLAZNSOCSA-N 0.000 description 1
- 238000012935 Averaging Methods 0.000 description 1
- 241001436672 Bhatia Species 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 239000006143 cell culture medium Substances 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000012569 chemometric method Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000000875 corresponding effect Effects 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- 238000007865 diluting Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000001678 irradiating effect Effects 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012845 near infrared spectroscopy analysis Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 235000016709 nutrition Nutrition 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 238000012628 principal component regression Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 239000013587 production medium Substances 0.000 description 1
- 238000010223 real-time analysis Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000003756 stirring Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000005303 weighing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12M—APPARATUS FOR ENZYMOLOGY OR MICROBIOLOGY; APPARATUS FOR CULTURING MICROORGANISMS FOR PRODUCING BIOMASS, FOR GROWING CELLS OR FOR OBTAINING FERMENTATION OR METABOLIC PRODUCTS, i.e. BIOREACTORS OR FERMENTERS
- C12M41/00—Means for regulation, monitoring, measurement or control, e.g. flow regulation
- C12M41/48—Automatic or computerized control
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12M—APPARATUS FOR ENZYMOLOGY OR MICROBIOLOGY; APPARATUS FOR CULTURING MICROORGANISMS FOR PRODUCING BIOMASS, FOR GROWING CELLS OR FOR OBTAINING FERMENTATION OR METABOLIC PRODUCTS, i.e. BIOREACTORS OR FERMENTERS
- C12M41/00—Means for regulation, monitoring, measurement or control, e.g. flow regulation
- C12M41/30—Means for regulation, monitoring, measurement or control, e.g. flow regulation of concentration
- C12M41/32—Means for regulation, monitoring, measurement or control, e.g. flow regulation of concentration of substances in solution
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/01—Arrangements or apparatus for facilitating the optical investigation
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/27—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands using photo-electric detection ; circuits for computing concentration
- G01N21/274—Calibration, base line adjustment, drift correction
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/01—Arrangements or apparatus for facilitating the optical investigation
- G01N2021/0106—General arrangement of respective parts
- G01N2021/0112—Apparatus in one mechanical, optical or electronic block
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2201/00—Features of devices classified in G01N21/00
- G01N2201/12—Circuits of general importance; Signal processing
- G01N2201/129—Using chemometrical methods
Landscapes
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Analytical Chemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Organic Chemistry (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Immunology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Pathology (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- Microbiology (AREA)
- Sustainable Development (AREA)
- Genetics & Genomics (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Medical Informatics (AREA)
- Evolutionary Computation (AREA)
- Computer Hardware Design (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
- Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)
Abstract
本发明提供检量装置、检量方法和计算机可读存储介质,能够有效地制作高精度的检量模型。检量装置10生成基准样品的数据集,该基准样品的数据集包括含有多种成分的基准样品的光谱数据、以及由该基准样品的多种成分的各成分含量决定的各目的变量;通过机器学习对机器学习模型进行训练,所述机器学习使用该基准样品的数据集,所述机器学习模型根据光谱数据的输入,输出多种成分的各成分的各目的变量中的至少1个目的变量。
Description
技术领域
本发明涉及检量装置(検量装置)、检量方法(検量方法)和计算机可读存储介质。
背景技术
以往,在使用细胞培养装置(生物反应器)的例如含有动物细胞、微生物、植物细胞等的细胞培养中,有预测营养成分浓度值等进程值的预测技术。例如,上述的预测技术从生物反应器取得光谱数据,通过任意合适的分析方法,取得葡萄糖等营养成分浓度的离线测定数据。并且,上述的预测技术通过将光谱数据的峰值与进程变量的离线测定值相关联,执行化学计量学建模,来进行营养成分浓度值等进程值的预测。
现有技术文献
专利文献
专利文献1:日本特开2020-195370号公报
专利文献2:日本特表2020-537126号公报
专利文献3:日本特开2016-128822号公报
非专利文献
非专利文献1:Thaddaeus A.Webster,Development of Generic Raman Modelsfor a GS-KOTM CHO Platform Process,Biotechnol.Prog.,2018,Vol.34
非专利文献2:Hemlata Bhatia,In-line monitoring of amino acids inmammalian cell cultures using raman spectroscopy and multivariatechemometrics models,Eng.Life Sci.2018,18,55-61
发明内容
发明要解决的技术问题
然而,在上述的预测技术中,当细胞培养条件有很大差异时,预测值与实测值可能有很大偏差,因此难以有效地制作高精度的检量模型(検量モデル)。
本发明就是鉴于上述情况而完成的,其目的在于有效地制作高精度的检量模型。
解决的技术问题的技术手段
一个方式的检量装置具备:生成部,生成基准样品的数据集,所述基准样品的数据集包括含有多种成分的基准样品的光谱数据、以及由所述基准样品的所述多种成分的各成分含量决定的各目的变量;训练部,通过机器学习对机器学习模型进行训练,所述机器学习使用所述基准样品的数据集,所述机器学习模型根据所述光谱数据的输入,输出所述多种成分的各成分的所述各目的变量中的至少1个目的变量。
此外,一个方式的检量方法使计算机执行如下处理:生成基准样品的数据集,所述基准样品的数据集包括含有多种成分的基准样品的光谱数据、以及由所述基准样品的所述多种成分的各成分含量决定的各目的变量;通过机器学习对机器学习模型进行训练,所述机器学习使用所述基准样品的数据集,所述机器学习模型根据所述光谱数据的输入,输出所述多种成分的各成分的所述各目的变量中的至少1个目的变量。
此外,一个方式的计算机可读存储介质记录有检量程序,所述检量程序使计算机执行如下处理:生成基准样品的数据集,所述基准样品的数据集包括含有多种成分的基准样品的光谱数据、以及由所述基准样品的所述多种成分的各成分含量决定的各目的变量;通过机器学习对机器学习模型进行训练,所述机器学习使用所述基准样品的数据集,所述机器学习模型根据所述光谱数据的输入,输出所述多种成分的各成分的所述各目的变量中的至少1个目的变量。
有益效果
根据本发明,具有能够有效地制作高精度的检量模型的效果。
附图说明
图1是表示根据实施方式的检量系统的结构示例的图。
图2是表示根据实施方式的检量系统的各装置的结构示例的框图。
图3是表示根据实施方式的推定结果的一个示例的图。
图4是表示根据实施方式的推定结果的一个示例的图。
图5是表示根据实施方式的推定结果的一个示例的图。
图6是表示根据实施方式的数据推定处理的流程的一个示例的流程图。
图7是表示根据实施方式的检量模型构建处理1的流程的一个示例的流程图。
图8是表示根据实施方式的检量模型构建处理2的流程的一个示例的流程图。
图9是表示根据实施方式的检量模型构建处理2的评价的一个示例的图。
图10是说明硬件结构示例的图。
具体实施方式
以下,参照附图对根据本发明的一个实施方式的检量装置、检量方法和检量程序进行详细说明。另外,本发明不受以下说明的实施方式的限定。
[实施方式]
以下,依次说明根据实施方式的检量系统的结构、检量装置等的结构、各处理的流程,最后说明实施方式的效果。
[1.检量系统100的结构]
使用图1,详细说明根据实施方式的检量系统100的结构。图1是表示根据实施方式的检量系统100的结构示例的图。以下,依次说明检量系统100整体的结构示例、检量系统100的处理、检量系统100的效果。
(1-1.检量系统100整体的结构示例)
检量系统100具有检量装置10、细胞培养装置20、分光装置30和调节装置40。图1所示的检量系统100可以包括多台检量装置10、多台细胞培养装置20、多台分光装置30或多台调节装置40。此外,检量装置10可以是与细胞培养装置20、分光装置30和调节装置40中的1个以上集成的结构。以下,依次说明检量装置10、细胞培养装置20、分光装置30、调节装置40。
(1-1-1.检量装置10)
检量装置10以可通信的方式与分光装置30连接,取得细胞培养装置20的细胞培养液的光谱数据。此外,检量装置10以可通信的方式与调节装置40连接,向调节装置40发送细胞培养装置20的细胞培养液的成分浓度的推定结果。
(1-1-2.细胞培养装置20)
细胞培养装置20具有容纳细胞培养液的细胞培养槽,所述细胞培养液含有动物细胞、微生物、植物细胞等细胞。此外,细胞培养装置20的细胞培养槽所容纳的细胞培养液中含有葡萄糖、乳酸、抗体等作为成分。此外,细胞培养装置20以可控制的方式与分光装置30和调节装置40连接。
(1-1-3.分光装置30)
分光装置30以可控制的方式与细胞培养装置20连接,测定细胞培养装置20的细胞培养液的光谱数据。分光装置30为拉曼分光装置、近红外分光装置、红外分光装置、紫外分光装置、荧光分光装置、可见分光装置等,但没有特别限定。
(1-1-4.调节装置40)
调节装置40以可控制的方式与细胞培养装置20连接,调节细胞培养装置20的细胞培养液的成分。
(1-2.检量系统100整体的处理)
对上述的检量系统100整体的处理进行说明。另外,下述处理可以以不同的顺序执行。此外,下述的处理中,部分处理可以省略。
(1-2-1.检量模型构建处理)
检量装置10使用非培养类样本S构建检量模型14d(参照图1(1))。在此,非培养类样本S是将细胞培养液中含有的测定对象成分和非测定对象成分以各种浓度调制而成的溶液。例如,检量装置10取得通过非培养类样本测定用装置(未图示)测定的非培养类样本S的光谱数据,存入后述的存储部14。此外,检量装置10在非培养类样本S的光谱数据的测定前或测定后实施采样,通过任意合适的分析方法取得目的变量(例如:葡萄糖等营养成分浓度)的离线测定数据,存入存储部14。
检量装置10从存储部14读取校准集。在此,校准集为从非培养类样本S的光谱数据和目的变量的离线测定数据生成的监督式数据集。接下来,检量装置10通过交叉验证进行检量模型14d的开发条件的探索。在此,开发条件是指光谱的预处理、波数范围、回归模型的回归系数、信号处理等解析的算法的种类或参数。并且,检量装置10基于条件探索的结果构建检量模型14d。此外,检量装置10将导出的开发条件(即检量模型信息)存入存储部14。
此时,检量装置10能够使用使细胞培养装置20运作而新取得的数据集制作更高精度的检量模型14d。即,检量装置10从存储部14读取校准集和新取得的数据集。此时,检量装置10取得通过分光装置30测定的细胞培养装置20的细胞培养液的光谱数据。此外,检量装置10从细胞培养装置20的细胞培养液取得以任意合适的分析方法测定的目的变量数据。接下来,检量装置10通过将新取得的数据集用于验证集,来进行检量模型14d的开发条件的探索。并且,检量装置10基于条件探索的结果,构建检量模型14d。
(1-2-2.光谱数据取得处理)
检量装置10从与细胞培养装置20连接的分光装置30取得细胞培养液的光谱数据(参照图1(2))。例如,检量装置10取得由作为拉曼分光装置的分光装置30测定的细胞培养液的光谱数据。
(1-2-3.目的变量推定处理)
检量装置10通过将细胞培养液的光谱数据输入检量模型14d,来推定成分浓度等目的变量(参照图1(3))。此时,通过将输入的光谱数据应用于从存储部14读取的检量模型信息,根据峰值强度,计算出测定对象成分量的预测值(推定结果)。
(1-2-4.推定结果显示处理)
检量装置10显示与细胞培养液相关的推定结果(参照图1(4))。例如,检量装置10将营养成分浓度值等进程变量显示为细胞营养液的测定对象成分。
(1-2-5.推定结果发送处理)
检量装置10将与细胞培养液有关的推定结果发送至调节装置40(参照图1(5))。例如,检量装置10将营养成分浓度值等进程变量发送至调节装置40。此时,调节装置40通过进行营养成分浓度值等的调节,来进行细胞培养装置20的环境的最优化。
(1-3.检量系统100的效果)
以下,在说明参考技术的检量处理的问题点的基础上,对检量系统100的效果进行说明。
(1-3-1.参考技术的检量处理的问题点)
在参考技术的检量处理中,将拉曼分光装置连接到细胞培养装置(生物反应器),取得光谱数据。此外,在该处理中,以任意合适的分析方法取得营养成分(葡萄糖等)浓度的离线测定数据。接下来,在该处理中,使用多变量软件包将光谱数据的峰值与进程变量的离线测定值相关联。此时,在该处理中,有时也通过平滑化或正规化进行预处理。然后,在该处理中,执行化学计量学建模,预测营养成分浓度值等进程值。此时,在该处理中,有时也为了降低噪音进行滤波(フィルタリング)。并且,在该处理中,利用所预测的进程值,进行拉曼实时分析和反馈控制,为细胞培养物提供连续的且浓度低的营养成分。在上述的检量处理中,存在以下问题点。
(1-3-1-1.问题点1)
在上述的检量处理中,将在细胞培养装置上连接分光装置而取得的光谱数据和采样得到的浓度数据用作模型制作用数据集(校准集)(n=7~12)。在该处理中,为了制作高精度的检量模型,需要满足如下条件的校准集:与实际使用模型时得到的光谱(验证集)的同等性(相似性)高;覆盖浓度范围,且浓度间隔均等;所有条件都考虑在内,且不存在偶发性的互相关等。因此,需要在多个条件下多次实施细胞培养。
(1-3-1-2.问题点2)
在上述的检量处理中,制作模型所需的时间和成本是庞大的。例如,在该处理中,1次细胞培养(5L规模)所需的成本为10~20万日元左右,培养实施1~2周左右。
(1-3-1-3.问题点3)
在上述的检量处理中,需要实施伴随采样的细胞培养,但采样存在培养液损失、污染的风险。
(1-3-1-4.问题点4)
在上述的检量处理中,通过使实施测定的细胞培养条件和制作模型时的细胞培养条件相同,能够进行高精度的预测。但是,在该处理中,在细胞培养条件有很大差异的情况下,预测值可能与实测值有很大偏差。例如,在该处理中,在细胞种类、细胞密度、培养基、供料剂等不同或者它们的组合不同的培养下,预测值可能与实测值有很大偏差。
(1-3-1-5.问题点5)
在上述的检量处理中,定量模型对细胞培养条件或装置的设置条件的稳健性(ロバスト性)有时较差。
(1-3-2.检量系统100的概要)
在检量系统100中,检量装置10生成非培养类样本S的监督式数据集,所述非培养类样本S的监督式数据集包括含有多种成分的非培养类样本S的光谱数据和成分浓度,通过机器学习对作为机器学习模型的检量模型14d进行训练,所述机器学习使用该数据集,所述作为机器学习模型的检量模型14d根据光谱数据的输入,输出作为目的的成分浓度。此时,检量装置10使用非培养类样本S生成监督式数据集,所述非培养类样本S是将细胞培养液中含有的成分以各种浓度调制而成的。此外,检量装置10取得通过对细胞培养液进行分光分析而测定的光谱数据,将该光谱数据输入训练完成的检量模型14d,基于所得结果,推定细胞培养液中含有的成分的浓度。
(1-3-3.检量系统100的效果)
第1,由于检量系统100不需要为了准备校准集而进行伴随采样的细胞培养,能够大大减少制作模型所需的时间和成本。第2,检量系统100消除了培养液损失和污染的风险。第3,由于检量系统100制备成分之间没有互相关的样本并将其用作校准集,使得检量模型14d不会被过度学习,因此,提高了定量模型对细胞培养条件的稳健性,能够适用于各种培养条件。第4,由于检量系统100相比以往能够减少校准集的数据数,因此能够削减必要的存储容量和运算成本。
进一步地,检量系统100能够用于广泛的分析。例如,检量系统100不仅能够用于拉曼分光分析,还能够用于近红外分光分析、红外分光分析、紫外分光分析、荧光分光分析、可见分光分析等广泛的分光分析方法。此外,检量系统100不一定需要伴随有生物培养,也能够适用于通过化学合成或搅拌进行混合的过程。此外,检量系统100也能够适用于容量更大的测定对象,而不用将测定对象的规模限定于非培养类样本S的容量等规模。
[2.检量系统100的各装置的结构]
使用图2,对图1所示的检量系统100所具有的各装置的功能结构进行说明。图2为表示根据实施方式的检量系统100的各装置的结构示例的框图。以下,依次详细说明根据实施方式的检量装置10的结构示例、检量装置10的推定结果的具体示例、细胞培养装置20的结构示例、分光装置30的结构示例、调节装置40的结构示例。
(2-1.检量装置10的结构示例)
首先,使用图2,对检量装置10的结构示例进行说明。检量装置10具有输入部11、输出部12、通信部13、存储部14和控制部15。
(2-1-1.输入部11)
输入部11负责向该检量装置10输入各种信息。例如,输入部11通过鼠标或键盘等实现,接受对该检量装置10的设定信息等的输入。
(2-1-2.输出部12)
输出部12负责从该检量装置10输出各种信息。例如,输出部12通过显示器等实现,输出该检量装置10中存储的设定信息等。
(2-1-3.通信部13)
通信部13负责与其它装置之间的数据通信。例如,通信部13经由路由器等与各通信装置之间进行数据通信。此外,通信部13可以与未图示的操作员的终端之间进行数据通信。
(2-1-4.存储部14)
存储部14对控制部15操作时参照的各种信息、和控制部15操作后取得的各种信息进行存储。例如,存储部14对含有多种成分的基准样品的光谱数据、以及由该基准样品的多种成分的各成分含量决定的各目的变量进行存储。存储部14具有光谱数据存储部14a、目的变量数据存储部14b、检量模型信息存储部14c和检量模型14d。在此,存储部14例如通过RAM(Random Access Memory)、闪存等半导体存储器元件,或者硬盘、光盘等存储装置等实现。另外,在图2的示例中,存储部14设置在检量装置10的内部,但也可以设置在检量装置10的外部,所以可以设置多个存储部。
(2-1-4-1.光谱数据存储部14a)
光谱数据存储部14a对通过控制部15的取得部15a取得的光谱数据进行存储。例如,光谱数据存储部14a对从未图示的非培养类样本测定用装置取得的非培养类样本S的光谱数据进行存储。此外,光谱数据存储部14a对从分光装置30取得的细胞培养装置20的细胞培养液的光谱数据进行存储。此外,光谱数据存储部14a也可以存储通过通信部13接收到的光谱数据。
(2-1-4-2.目的变量数据存储部14b)
目的变量数据存储部14b对通过控制部15的取得部15a取得的目的变量数据进行存储。例如,目的变量数据存储部14b对从未图示的分析装置取得的非培养类样本S或细胞培养液的各成分的浓度数据进行存储。此外,目的变量数据存储部14b对制备非培养类样本S时所给出的各成分的浓度数据进行存储。此外,目的变量数据存储部14b也可以对通过通信部13接收到的浓度数据进行存储。进一步地,目的变量数据存储部14b除了存储各成分的浓度数据之外,还存储由细胞密度、pH(氢离子指数)、渗透压等各成分的含量决定的所有目的变量。
(2-1-4-3.检量模型信息存储部14c)
检量模型信息存储部14c对通过控制部15的训练部15c取得的检量模型信息进行存储。例如,检量模型信息存储部14c对光谱的预处理、波数范围、回归模型的回归系数、信号处理等信息进行存储。此外,检量模型信息存储部14c将对基准样品的数据集使用交叉验证而得到的第1开发条件存储为检量模型信息。此外,检量模型信息存储部14c将把测定对象样品的数据集用于验证集而得到的第2开发条件存储为检量模型信息。
(2-1-4-4.检量模型14d)
检量模型14d是一种机器学习模型,当输入光谱数据时,会输出各成分的浓度等目的变量。例如,检量模型14d是通过PLSR(Partial Least Squares Regression)、主成分回归、高斯过程回归等实现的机器学习模型。
(2-1-5.控制部15)
控制部15负责控制该检量装置10整体。控制部15具有取得部15a、生成部15b、训练部15c和推定部15d。在此,控制部15可以通过例如CPU(Central Processing Unit)和MPU(Micro Processing Unit)等电子电路、或者ASIC(Application Specific IntegratedCircuit)和FPGA(Field Programmable Gate Array)等集成电路实现。
此外,控制部15具有能够通过多变量解析构建回归模型的计算环境。例如,控制部15具有化学计量学方法或多变量解析方法的包、以及使用该包进行运算的环境。此外,控制部15也可以进行网络连接。
(2-1-5-1.取得部15a)
取得部15a取得通过对含有多种成分的基准样品进行分光分析而测定的光谱数据。例如,取得部15a使用未图示的非培养类样本测定用装置,对容纳在数mL~数千mL的烧杯等容器中的非培养类样本S取得光谱数据。此外,取得部15a取得通过对作为测定对象的样品进行分光分析而测定的光谱数据。例如,取得部15a使用分光装置30取得通过拉曼分光分析、近红外分光分析、红外分光分析、紫外分光分析、荧光分光分析、可见分光分析等测定的光谱数据。另外,取得部15a将取得的光谱数据存入光谱数据存储部14a。
(2-1-5-2.生成部15b)
生成部15b生成基准样品的数据集,该基准样品的数据集包括含有多种成分的基准样品的光谱数据、以及由该基准样品的多种成分的各成分含量决定的各目的变量。例如,生成部15b从存储部14取得含有多种成分的基准样品的光谱数据、以及由该基准样品的多种成分的各成分含量决定的各目的变量,然后生成该基准样品的监督式数据集。
对含有多种成分的基准样品的示例进行说明,生成部15b对目的变量不同的多个非培养类样品执行分光分析,生成基准样品的数据集,其中,所述目的变量由多种成分的各成分含量决定,所述基准样品的数据集包括通过分光分析得到的基准样品的光谱数据和各目的变量。例如,生成部15b对作为营养成分的葡萄糖、谷氨酸等氨基酸的浓度不同的多个非培养类样本S执行拉曼分光分析,生成非培养类样本S的数据集,所述非培养类样本S的数据集包括非培养类样本S的光谱数据和各浓度。使用具体的示例进行说明,生成部15b对非培养类样本S1{葡萄糖浓度1.0g/L、谷氨酸浓度1.0g/L}、非培养类样本S2{葡萄糖浓度2.0g/L、谷氨酸浓度2.0g/L}、非培养类样本S3{葡萄糖浓度3.0g/L、谷氨酸浓度3.0g/L}这样浓度不同的多个非培养类样本S执行拉曼分光分析,生成非培养类样本S的数据集,所述非培养类样本S的数据集包括非培养类样本S1~S3的光谱数据和各浓度{葡萄糖浓度、谷氨酸浓度}。
此外,生成部15b对多个非培养类样品执行分光分析,生成基准样品的数据集,其中,所述多个非培养类样品是使用作为测定对象的多个培养类样品的各培养类样品中含有的成分制成的,所述基准样品的数据集包括通过分光分析得到的基准样品的光谱数据和各目的变量。例如,生成部15b对多个非培养类样本S执行拉曼分光分析,生成非培养类样本S的数据集,其中,所述多个非培养类样本S是使用作为测定对象的培养细胞或代谢物制成的,所述非培养类样本S的数据集包括非培养类样本S的光谱数据和各浓度。使用具体的示例进行说明,生成部15b对非培养类样本S11{细胞A浓度1.0g/L、抗体A浓度1.0g/L}、非培养类样本S12{细胞B浓度2.0g/L、抗体B浓度1.0g/L}、非培养类样本S13{细胞C浓度1.0g/L、抗体C浓度1.0g/L}这样成分和浓度不同的多个非培养类样本S执行拉曼分光分析,生成非培养类样本S的数据集,所述非培养类样本S的数据集包括非培养类样本S11~S13的光谱数据和各浓度{细胞浓度、抗体浓度}。
进一步地,生成部15b进一步生成作为测定对象的样品的数据集,所述作为测定对象的样品的数据集包括作为测定对象的样品的光谱数据、以及由作为测定对象的样品的多种成分的各成分含量决定的各目的变量。例如,生成部15b生成细胞培养液的数据集,所述细胞培养液的数据集包括通过分光装置30对细胞培养装置20的细胞培养液进行拉曼分光分析而测定的光谱数据、以及通过任意合适的分析方法测定的各成分浓度。使用具体的示例进行说明,生成部15b生成细胞A的细胞培养液的数据集,所述细胞A的细胞培养液的数据集包括通过对作为测定对象的细胞A的细胞培养液进行拉曼分光分析而测定的光谱数据{即拉曼分光光谱A}和浓度数据{即细胞A浓度1.0g/L、葡萄糖浓度2.0g/L、乳酸浓度1.0g/L、抗体A浓度1.0g/L}。
上述中,作为数据集中含有的目的变量的示例,对浓度进行了说明,但目的变量不限定于浓度。例如,生成部15b除了各成分的浓度之外,还可以使用细胞密度、pH(氢离子指数)、渗透压等的由各成分的含量决定的所有目的变量来生成数据集。
(2-1-5-3.训练部15c)
训练部15c通过机器学习对机器学习模型进行训练,所述机器学习使用含有多种成分的基准样品的数据集,所述机器学习模型根据光谱数据的输入,输出多种成分的各成分的各目的变量中的至少1个目的变量。例如,训练部15c通过机器学习对检量模型14d进行训练,所述机器学习使用含有多种成分的非培养类样本S的数据集,所述检量模型14d根据作为说明变量的光谱数据的输入,输出多种成分的各成分的各目的变量中的至少1个目的变量。使用具体的示例进行说明,训练部15c通过机器学习对检量模型14d进行训练,所述机器学习使用数据集1{光谱数据:拉曼分光光谱1、目的变量数据:葡萄糖浓度1.0g/L、谷氨酸浓度1.0g/L}、数据集2{光谱数据:拉曼分光光谱2、目的变量数据:葡萄糖浓度2.0g/L、谷氨酸浓度2.0g/L}、数据集3{光谱数据:拉曼分光光谱3、目的变量数据:葡萄糖浓度3.0g/L、谷氨酸浓度3.0g/L}。
此外,训练部15c通过对含有多种成分的基准样品的数据集使用交叉验证,来检索与算法或参数相关的第1开发条件,基于该第1开发条件对机器学习模型进行训练,同时,将该第1开发条件存入存储部14。例如,训练部15c通过对含有多种成分的非培养类样本S的数据集使用交叉验证,来检索光谱的预处理、波数范围、回归模型的回归系数、信号处理等信息,基于该信息,对检量模型14d进行训练。此时,训练部15c使用该信息确定最佳算法或模型的参数,并对应用它们的检量模型14d进行训练。
此外,训练部15c将与基于非培养类样本S的算法或参数相关的检索条件(光谱的预处理、波数范围、回归模型的回归系数、信号处理等信息)作为检量模型信息存入检量模型信息存储部14c。
进一步地,训练部15c通过将作为测定对象的样品的数据集用于验证集,来检索与算法或参数相关的第2开发条件,基于该第2开发条件对机器学习模型进行训练,同时,将该第2开发条件存入存储部14。例如,训练部15c通过将细胞培养装置20的细胞培养液的数据集用于验证集,来检索光谱的预处理、波数范围、回归模型的回归系数、信号处理等信息,基于该信息对检量模型14d进行训练。此时,训练部15c使用该信息确定最佳算法或模型的参数,并对应用它们的检量模型14d进行训练。
另外,训练部15c将与基于细胞培养装置20的细胞培养液的算法或参数相关的检索条件(光谱的预处理、波数范围、回归模型的回归系数、信号处理等信息)作为检量模型信息存入检量模型信息存储部14c。
(2-1-5-4.推定部15d)
推定部15d基于将所取得的光谱数据输入训练完成的机器学习模型而得到的结果,来推定由作为测定对象的样品中含有的成分的含量决定的目的变量。例如,推定部15d基于将所取得的细胞培养装置20的细胞培养液的光谱数据输入检量模型14d而得到的结果,来推定该细胞培养装置20的细胞培养液中含有的成分的成分浓度。使用具体的示例进行说明,推定部15d推定{细胞A浓度2.0g/L、葡萄糖浓度1.5g/L、乳酸浓度1.5g/L、抗体A浓度2.0g/L}为作为测定对象的细胞A的细胞培养液的成分浓度。此外,推定部15d推定时间1、时间2、时间3、……这样的任意时刻时的目的变量为作为测定对象的细胞A的细胞培养液的成分浓度的进程数据。
此外,推定部15d还可以将推定结果显示在输出部12上。例如,推定部15d将表示光谱数据取得的时刻时的细胞培养液的葡萄糖的浓度变化的图表显示在输出部12上。此外,推定部15b将表示光谱数据取得的时刻时的细胞培养液的细胞密度变化的图表显示在输出部12上。
此外,推定部15d还可以将推定结果发送至调节装置40。例如,当细胞培养液的葡萄糖的浓度低于阈值时,推定部15d会对调节装置40发送供给葡萄糖的指示。此外,当细胞培养液的pH显示正常范围之外的数值时,推定部15d会对调节装置40发送调整pH的指示。
进一步地,推定部15d能够在不限定测定对象的规模的情况下推定目的变量。例如,推定部15d能够通过使用由数mL规模的非培养类样本S的数据集训练的检量模型14d,来推定100mL规模、5L规模、50L规模、2000L规模的细胞培养液的成分浓度。
(2-2.检量装置10的推定结果的具体示例)
使用图3~图5,对检量装置100的推定结果的具体示例进行说明。
图3~图5为表示根据实施方式的推定结果的一个示例的图。以下,对评价推定结果的误差的具体示例1、大大改变细胞培养液的条件的具体示例2进行说明。
(2-2-1.具体示例1)
使用图3~图4,对检量装置10的推定结果的具体示例1进行说明。具体示例1通过使用训练完成的检量模型14d,来预测细胞培养进程中的营养成分、代谢物的浓度。此时,为了把握模型的性能,使用3个批次(培养液1~培养液3)实施相同条件的5L规模的细胞培养过程。
在图3的示例中,以“时间‘天’”作为横轴,以“葡萄糖‘g/L’”作为纵轴,显示营养成分葡萄糖的浓度随时间的变化。在此,图3中的黑点表示检量装置10的推定结果,即预测值。此外,图3中的白色的四角表示为了验证检量装置10的推定结果而测定的离线测定值。
在图4的示例中,显示培养液1~培养液3中的葡萄糖、乳酸、抗体各自的预测标准误差(Root Mean Squared Error of Prediction:RMSEP)。在此,图4中的预测标准误差是通过对离线测定值附近11个点的预测值进行平均而计算出的误差。如图4所示,计算出:培养液1的预测标准误差为{葡萄糖:0.28g/L、乳酸:0.40g/L、抗体:0.11g/L}、培养液2的预测标准误差为{葡萄糖:0.27g/L、乳酸:0.28g/L、抗体:0.08g/L}、培养液3的预测标准误差为{葡萄糖:0.31g/L、乳酸:0.18g/L、抗体:0.10g/L}。
由上述的具体示例1可知,可以根据细胞培养过程的3个批次的结果,来确认检量模型14d的预测能力的精度及其再现性。
(2-2-2.具体示例2)
使用图5,对检量装置10的推定结果的具体示例2进行说明。具体示例2是将检量模型14d应用于与生成模型时的条件有很大不同、即改变了培养基的5L规模的细胞培养过程时的推定结果,与具体示例1一样,进行细胞培养过程中的营养成分、代谢物的浓度的预测。
在图5的示例中,与图3一样,以“时间‘天’”作为横轴,以“葡萄糖‘g/L’”作为纵轴,显示营养成分葡萄糖的浓度随时间的变化。在此,图5中的黑点表示检量装置10的推定结果,即预测值。此外,图5中的白色的四角表示为了验证检量装置10的推定结果而测定的离线测定值。
根据上述的具体示例2可以确认,即使在条件不同的细胞培养中,也可以预测营养成分、代谢物的成分浓度。
(2-3.细胞培养装置20的结构示例)
使用图2,对图1所示的细胞培养装置20的结构示例进行说明。细胞培养装置20具有未图示的细胞培养槽。细胞培养槽容纳细胞、含有葡萄糖或氨基酸的营养成分、含有细胞代谢物的细胞培养液。在此,除细胞之外,也可以将微生物、酵母等用作由细胞培养液培养的培养物。
(2-4.分光装置30的结构示例)
使用图2,对图1所示的分光装置30的结构示例进行说明。分光装置30具有光源30a、分析部30b、导光部30c和测定部30d。
(2-4-1.光源30a)
光源30a是对细胞培养液进行照射的光的光源。光源30a是用于拉曼分光分析、近红外分光分析、红外分光分析、紫外分光分析、荧光分光分析、可见分光分析等的光的光源。光源30a的光的种类和波长可以根据测定目的而改变。
(2-4-2.分析部30b)
分析部30b对从测定部30d经由导光部30c导出的光进行分析。例如,分析部30b根据测定目的选择最佳分光手段,分析导出的光。此外,分析部30b具有分光手段,通过检测出光波长各自的强度来计算出光谱。
(2-4-3.导光部30c)
导光部30c将光源30a的光引导至测定部30d。此外,导光部30c将从细胞培养液反射的光引导至分析部30b。例如,导光部30c通过反射镜、光纤、透镜等实现。
(2-4-4.测定部30d)
测定部30d向作为测定对象的细胞培养液照射光,并接收其反射光或散射光。此外,测定部30d具有不影响细胞培养、并且向经充分搅拌而均匀化的培养液照射入射光的结构。例如,通过聚光透镜探针、流动池等实现。
(2-5.调节装置40的结构示例)
使用图2,对图1所示的调节装置40的结构示例进行说明。调节装置40调节细胞培养槽的环境(温度、pH、溶解氧、营养成分浓度等)。例如,调节装置40通过供给营养成分的泵、加热器等实现。
[3.检量系统100的处理的流程]
使用图6~图8,对根据实施方式的检量系统100的处理的流程进行说明。以下,依次说明数据推定处理的流程、检量模型构建处理1的流程、检量模型构建处理2的流程。
(3-1.数据推定处理的流程)
使用图6,对根据实施方式的数据推定处理的流程进行说明。图6为表示根据实施方式的数据推定处理的流程的一个示例的流程图。另外,下述的步骤S101~S104的处理可以以不同的顺序执行。此外,下述的步骤S101~S104的处理中,部分处理可以省略。
(3-1-1.光谱数据取得处理)
第1,检量装置10的取得部15a取得光谱数据(步骤S101)。例如,取得部15a使用分光装置30,取得由拉曼分光分析、近红外分光分析、红外分光分析、紫外分光分析、荧光分光分析、可见分光分析等测定的细胞培养液的光谱数据。此时,取得部15a取得通过分析装置30的分析部30b转换为数字信息的数据,根据该数据计算出光谱数据。
(3-1-2.目的变量推定处理)
第2,检量装置10的推定部15d推定成分浓度等目的变量(步骤S102)。例如,推定部15d基于将所取得的细胞培养装置20的细胞培养液的光谱数据输入检量模型14d而得到的结果,推定该细胞培养装置20的细胞培养液中含有的葡萄糖等各成分的浓度。此时,推定部15d通过将所取得的光谱数据应用于从存储部14读取的检量模型信息,根据峰值强度,计算出测定对象成分量(例如:营养成分浓度值等进程变量)的预测值。
(3-1-3.推定结果显示处理)
第3,检量装置10的推定部15d显示推定结果(步骤S103)。例如,推定部15d将表示光谱数据取得的时刻时的细胞培养液的葡萄糖的浓度变化的图表显示在输出部12上。
(3-1-4.推定结果发送处理)
第4,检量装置10的推定部15d发送推定结果(步骤S104),结束处理。例如,当细胞培养液的葡萄糖的浓度低于阈值时,推定部15d会对调节装置40发送供给葡萄糖的指示。此时,接收到推定结果的调节装置40执行细胞培养装置20的细胞培养槽的最优化。
(3-1-5.数据推定处理的效果)
在上述的数据推定处理中,通过用检量模型14d对将分光装置30与细胞培养装置20连接而得到的光谱数据进行处理,可以实时推定对象成分的浓度。此外,在数据推定处理中,通过使用对象成分的浓度的推定值来实时控制培养液中的浓度,可以维持最佳培养环境。
(3-2.检量模型构建处理1的流程)
使用图7,对根据实施方式的检量模型构建处理1的流程进行说明。图7为根据实施方式的检量模型构建处理1的流程的一个示例的流程图。另外,下述的步骤S201~S204的处理可以以不同的顺序执行。此外,下述的步骤S201~S204的处理中,部分处理可以省略。
(3-2-1.数据集取得处理)
第1,检量装置10的生成部15b读取校准集(步骤S201)。例如,生成部15b从存储部14取得在培养过程预测前用非培养类样本S测定的光谱数据和目的变量,生成监督式数据集。此时,生成部15b可以读取存储部14中存储的校准集作为监督式数据集。
(3-2-2.开发条件检索处理)
第2,检量装置10的训练部15c检索检量模型14d的开发条件(步骤S202)。例如,训练部15c通过对非培养类样本S的数据集使用交叉验证来检索与解析的算法的种类或参数相关的第1开发条件(从非培养类样本S的数据集得到的光谱的预处理、波数范围、回归模型的回归系数、信号处理等信息)。
(3-2-3.检量模型训练处理)
第3,检量装置10的训练部15c基于检索结果构建检量模型14d(步骤S203)。例如,训练部15c通过机器学习对检量模型14d进行训练,所述机器学习使用非培养类样本S的数据集,所述检量模型14d根据作为说明变量的光谱数据的输入,输出作为目的变量的成分浓度。
(3-2-4.检量模型信息存入处理)
第4,检量装置10的训练部15c将检量模型信息存入(步骤S204),结束处理。此时,训练部15c将光谱的预处理、波数范围、回归模型的回归系数、信号处理等信息存入检量模型信息存储部14c。
(3-2-5.检量模型构建处理1的效果)
在上述的检量模型构建处理1中,由于不需要为了准备校准集而进行伴随采样的细胞培养,因此,能够大大减少制作模型所需的时间和成本,消除培养液的损失、污染的风险。此外,在检量模型构建处理1中,提高了定量模型对细胞培养条件的稳健性,能够适用于各种培养条件。进一步地,在检量模型构建处理1中,由于与传统方法相比能够减少校准集的数据数,因此能够削减必要的存储容量、运算成本。
(3-3.检量模型构建处理2的流程)
使用图8,对根据实施方式的检量模型构建处理2的流程进行说明,所述根据实施方式的检量模型构建处理2使用进一步使细胞培养装置20运作而新取得的数据集。图8为表示根据实施方式的检量模型构建处理2的流程的一个示例的流程图。另外,下述的步骤S301~S304的处理可以以不同的顺序执行。此外,下述的步骤S301~S304的处理中,部分处理可以省略。
(3-3-1.数据集取得处理)
第1,检量装置10的生成部15b读取校准集和新取得的数据集(步骤S301)。此时,生成部15b在新取得的数据集中,使用与细胞培养装置20连接而取得的数据作为光谱数据。或者,生成部15b也可以使用通过其它分光装置测定的数据。此外,生成部15b在光谱数据的测定前后实施采样,使用以任意合适的分析方法取得数据作为目的变量数据。
例如,生成部15b读取预先保存在存储部14中的非培养类样本S的数据集作为校准集。此外,生成部15b读取5L规模的细胞培养数据作为新取得的数据集。此时,生成部15b可以使用与非培养类样本S相同的培养基成分,也可以使用与其不同的培养基成分,来作为提供给新取得的数据集的细胞培养数据。另外,上述的培养基主要用于稀释非培养类样本S,内容物因制造商的产品而异。
(3-3-2.开发条件检索处理)
第2,检量装置10的训练部15c检索检量模型14d的开发条件(步骤S302)。此时,训练部15c通过将新取得的数据集用作验证集来检索与解析的算法的种类或参数相关的第2开发条件(从新取得的数据集得到的光谱的预处理、波数范围、回归模型的回归系数、信号处理等信息)。
(3-3-3.检量模型训练处理)
第3,检量装置10的训练部15c基于检索结果构建检量模型14d(步骤S303)。此外,由于检量模型训练处理与上述的检量模型构建处理1的检量模型训练处理的处理相同,因此省略说明。
(3-3-4.检量模型信息存入处理)
第4,检量装置10的训练部15c将检量模型信息存入(步骤S304),结束处理。另外,由于检量模型信息存入处理与上述的检量模型构建处理1的检量模型信息存入处理的处理相同,因此省略说明。
(3-3-5.检量模型构建处理2的评价)
使用图9,对上述的检量模型构建处理2的评价进行说明。图9为表示根据实施方式的检量模型构建处理2的评价的一个示例的图。在图9的示例中,显示培养液1-1~培养液1-3和培养液2-1~培养液2-2中的葡萄糖、乳酸、抗体各自的预测标准误差(RMSEP)的变化。在此,培养液1-1~培养液1-3是与制作模型时的条件相同的5L规模的细胞培养液,培养液2-1~培养液2-2是与制作模型时的条件有很大不同、即改变了培养基的5L规模的细胞培养液。
如图9所示,计算出:培养液1-1的预测标准误差为{葡萄糖:0.28g/L→0.18g/L、乳酸:0.40g/L→0.11g/L、抗体:0.11g/L→0.20g/L}、培养液1-2的预测标准误差为{葡萄糖:0.27g/L→0.16g/L、乳酸:0.28g/L→0.22g/L、抗体:0.08g/L→0.12g/L}、培养液1-3的预测标准误差为{葡萄糖:0.31g/L→0.18g/L、乳酸:0.18g/L→0.15g/L、抗体:0.10g/L→0.13g/L}。此外,计算出:培养液2-1的预测标准误差为{葡萄糖:0.39g/L→0.13g/L、乳酸:0.35g/L→0.10g/L、抗体:0.51g/L→0.14g/L}、培养液2-2的预测标准误差为{葡萄糖:0.62g/L→0.16g/L、乳酸:0.50g/L→0.36g/L、抗体:0.40g/L→0.14g/L}。
根据上述,可以确认通过检量模型构建处理2构建的检量模型14d的检量精度有所提高。
(3-3-6.检量模型构建处理2的效果)
对于仅由非培养类的光谱构成的校准集,上述的检量模型构建处理2能够将1次以上的细胞培养数据的数据集用于验证,来制作新模型。即,在检量模型构建处理2中,除了检量模型构建处理1的效果之外,通过将新取得的数据集用于验证,能够与适合于实际期望预测的测定对象的检量模型14d的各种条件相匹配,能够提高检量精度。
[4.实施方式的效果]
最后,对实施方式的效果进行说明。以下,对与根据实施方式的处理对应的效果1~效果6进行说明。
(4-1.效果1)
第1,在上述的根据实施方式的处理中,生成基准样品数据集,所述基准样品数据集包括含有多种成分的基准样品的光谱数据、以及由该基准样品的多种成分的各成分含量决定的各目的变量,通过机器学习对检量模型14d进行训练,所述机器学习使用该基准样品数据集,所述检量模型14d根据光谱数据的输入,输出多种成分的各成分的各目的变量中的至少1个目的变量。因此,在根据实施方式的处理中,能够有效地制作高精度的检量模型14d。
(4-2.效果2)
第2,在上述的根据实施方式的处理中,对多种成分的各成分的目的变量不同的多个非培养类样品执行分光分析,生成基准样品的数据集,所述基准样品的数据集包括通过该分光分析得到的基准样品的光谱数据和各目的变量。因此,在根据实施方式的处理中,通过使用不同的目的变量的基准样品,能够有效地制作高精度的检量模型14d。
(4-3.效果3)
第3,在上述的根据实施方式的处理中,对使用作为测定对象的多个培养类样品的各培养类样品中含有的成分而制成的多个非培养类样品执行分光分析,生成基准样品数据集,所述基准样品数据集包括通过分光分析得到的基准样品的光谱数据和各目的变量。因此,在根据实施方式的处理中,通过使用与作为测定对象的培养类样品的成分相似的基准样品,能够有效地制作高精度的检量模型14d。
(4-4.效果4)
第4,在上述的根据实施方式的处理中,取得通过对作为测定对象的样品进行分光分析而测定的光谱数据,将取得的光谱数据输入训练完成的检量模型14d,基于所得结果,推定由作为测定对象的样品中含有的成分的含量决定的目的变量。因此,在根据实施方式的处理中,能够有效地制作高精度的检量模型14d,同时,还能够通过利用推定结果来使测定对象的环境最优化。
(4-5.效果5)
第5,在上述的根据实施方式的处理中,保持基准样品的光谱数据和各目的变量,取得所保持的基准样品的光谱数据和各目的变量,生成基准样品的监督式数据集,通过对基准样品的数据集使用交叉验证来检索与算法或参数相关的开发条件,基于该开发条件对机器学习模型进行训练,同时,保持该开发条件。因此,在根据实施方式的处理中,通过使用基准样品的离线数据的同时对合适的检量模型14d进行调整,能够有效地制作高精度的检量模型14d。
(4-6.效果6)
第6,在上述的根据实施方式的处理中,进一步生成测定对象样品数据集,所述测定对象样品数据集包括测定对象样品的光谱数据、以及由测定对象样品的多种成分的各成分含量决定的各目的变量,通过将测定对象样品数据集用于验证集来进一步检索与算法或参数相关的开发条件,基于该开发条件对检量模型14d进行训练。因此,在根据实施方式的处理中,通过对与实际期望预测的测定对象相匹配的合适的学习模型进行调整,能够有效地制作高精度的检量模型。
[系统]
关于包括上述文件中和附图中所示的处理顺序、控制顺序、具体名称、各种数据或参数的信息,除了特别记载的情况之外,可以任意改变。
此外,附图所示的各装置的各结构要素是功能概念性的,物理上不一定按照附图所示的那样构成。即,各装置的分散或集成的具体方式不限定于附图所示的方式。也就是说,其全部或一部分可以根据各种负荷或使用状况等,以任意单位在功能上或物理上分散、集成而构成。
进一步地,关于各装置中执行的各处理功能,其全部或任意的一部分可以通过CPU和由该CPU解析执行的程序来实现,或者可以作为基于有线逻辑的硬件来实现。
[硬件]
接下来,对检量装置10的硬件结构示例进行说明。图10为对硬件结构示例进行说明的图。如图10所示,检量装置10具有通信装置10a、HDD(Hard Disk Drive)10b、存储器10c和处理器10d。此外,图10所示的各部通过总线等相互连接。
通信装置10a是网络接口卡等,进行与其它服务器的通信。HDD10b存储使图2所示的功能运作的程序或DB。
处理器10d从HDD10b等读取与图2所示的各处理部执行相同处理的程序并在存储器10c中展开,由此,使执行图2等说明的各功能的过程运作。例如,该过程执行与检量装置10所具有的各处理部相同的功能。具体而言,处理器10d从HDD10b等读取具有与取得部15a、生成部15b、训练部15c、推定部15d等相同功能的程序。并且,处理器10d执行如下程序:执行与取得部15a、生成部15b、训练部15c、推定部15d等相同的处理。
这样,检量装置10通过读取并执行程序,从而作为执行各种处理方法的装置进行运作。此外,检量装置10通过介质读取装置从存储介质读取上述程序,通过执行所读取的上述程序,能够实现与上述的实施方式相同的功能。另外,本发明其它的实施方式中提及的程序并不限定于由检量装置10执行。例如,当其它的计算机或服务器执行程序时、或者它们协作执行程序时,也同样可以适用于本发明。
所述程序可以通过因特网等网络发布。此外,所述程序可以通过硬盘、软盘(FD)、CD-ROM、MO(Magneto-Optical disk)、DVD(Digital Versatile Disc)等记录到计算机可读取存储介质中,并由计算机从存储介质读取来执行。
[其它]
以下记载所公开的技术特征的组合的几个示例。
(1)一种检量装置,其特征在于,具备:生成部,生成所述基准样品的数据集,所述基准样品的数据集包括含有多种成分的基准样品的光谱数据、以及由所述基准样品的所述多种成分的各成分含量决定的各目的变量;以及训练部,通过机器学习对机器学习模型进行训练,所述机器学习使用所述基准样品的数据集,所述机器学习模型根据所述光谱数据的输入,输出所述多种成分的各成分的所述各目的变量中的至少1个目的变量。
(2)根据(1)所述的检量装置,其特征在于,所述生成部对目的变量不同的多个非培养类样品执行分光分析,所述目的变量由所述多种成分的各成分的含量决定,所述生成部生成所述基准样品的数据集,所述基准样品的数据集包括通过所述分光分析得到的所述基准样品的光谱数据、以及所述各目的变量。
(3)根据(2)所述的检量装置,其特征在于,所述生成部对所述多个非培养类样品执行分光分析,所述多个非培养类样品是使用作为测定对象的多个培养类样品的各培养类样品中含有的成分制成的,所述生成部生成所述基准样品的数据集,所述基准样品的数据集包括通过所述分光分析得到的所述基准样品的光谱数据、以及所述各目的变量。
(4)根据(1)至(3)中任一项所述的检量装置,其特征在于,进一步具备:取得部,取得通过对作为测定对象的样品进行分光分析而测定的光谱数据;推定部,基于将所取得的所述光谱数据输入训练完成的所述机器学习模型而得到的结果,推定由所述作为测定对象的样品中含有的成分的含量决定的目的变量。
(5)根据(1)至(4)所述的检量装置,其特征在于,进一步具备存储所述基准样品的光谱数据和所述各目的变量的存储部,所述生成部从所述存储部取得所述基准样品的光谱数据和所述各目的变量,生成所述基准样品的监督式数据集,所述训练部通过对所述基准样品的数据集使用交叉验证来检索与算法或参数相关的第1开发条件,基于所述第1开发条件训练所述机器学习模型,同时,将所述第1开发条件存入所述存储部。
(6)根据(5)所述的检量装置,其特征在于,所述生成部进一步生成所述作为测定对象的样品的数据集,所述作为测定对象的样品的数据集包括所述作为测定对象的样品的光谱数据、以及由所述作为测定对象的样品的所述多种成分的各成分含量决定的各目的变量,所述训练部通过将所述作为测定对象的样品的数据集用作验证集来进一步检索与算法或参数相关的第2开发条件,基于所述第2开发条件训练所述机器学习模型,同时,将所述第2开发条件存入所述存储部。
(7)一种检量方法,其特征在于,使计算机执行如下处理:生成基准样品的数据集,所述基准样品的数据集包括含有多种成分的基准样品的光谱数据、以及由所述基准样品的所述多种成分的各成分含量决定的各目的变量;通过机器学习对机器学习模型进行训练,所述机器学习使用所述基准样品的数据集,所述机器学习模型根据所述光谱数据的输入,输出所述多种成分的各成分的所述各目的变量中的至少1个目的变量。
(8)一种计算机可读存储介质,其特征在于,所述计算机可读存储介质为记录有检量程序的计算机可读存储介质,所述检量程序使计算机执行如下处理:生成基准样品的数据集,所述基准样品的数据集包括含有多种成分的基准样品的光谱数据、以及由所述基准样品的所述多种成分的各成分含量决定的各目的变量;通过机器学习对机器学习模型进行训练,所述机器学习使用所述基准样品的数据集,所述机器学习模型根据所述光谱数据的输入,输出所述多种成分的各成分的所述各目的变量中的至少1个目的变量。
Claims (8)
1.一种检量装置,其特征在于,具备:
生成部,生成基准样品的数据集,所述基准样品的数据集包括含有多种成分的基准样品的光谱数据、以及由所述基准样品的所述多种成分的各成分含量决定的各目的变量;以及
训练部,通过机器学习对机器学习模型进行训练,所述机器学习使用所述基准样品的数据集,所述机器学习模型根据所述光谱数据的输入,输出所述多种成分的各成分的所述各目的变量中的至少1个目的变量。
2.根据权利要求1所述的检量装置,其特征在于,
所述生成部对目的变量不同的多个非培养类样品执行分光分析,所述目的变量由所述多种成分的各成分的含量决定,
所述生成部生成所述基准样品的数据集,所述基准样品的数据集包括通过所述分光分析得到的所述基准样品的光谱数据、以及所述各目的变量。
3.根据权利要求2所述的检量装置,其特征在于,
所述生成部对所述多个非培养类样品执行分光分析,所述多个非培养类样品是使用作为测定对象的多个培养类样品的各培养类样品中含有的成分制成的,
所述生成部生成所述基准样品的数据集,所述基准样品的数据集包括通过所述分光分析得到的所述基准样品的光谱数据、以及所述各目的变量。
4.根据权利要求1至3中任一项所述的检量装置,其特征在于,进一步具备:
取得部,取得通过对作为测定对象的样品进行分光分析而测定的光谱数据;以及
推定部,基于将所取得的所述光谱数据输入训练完成的所述机器学习模型而得到的结果,推定由所述作为测定对象的样品中含有的成分的含量决定的目的变量。
5.根据权利要求4所述的检量装置,其特征在于,进一步具备存储所述基准样品的光谱数据和所述各目的变量的存储部,
所述生成部从所述存储部取得所述基准样品的光谱数据和所述各目的变量,生成所述基准样品的监督式数据集,
所述训练部通过对所述基准样品的数据集使用交叉验证来检索与算法或参数相关的第1开发条件,基于所述第1开发条件训练所述机器学习模型,同时,将所述第1开发条件存入所述存储部。
6.根据权利要求5所述的检量装置,其特征在于,
所述生成部进一步生成所述作为测定对象的样品的数据集,所述作为测定对象的样品的数据集包括所述作为测定对象的样品的光谱数据、以及由所述作为测定对象的样品的所述多种成分的各成分含量决定的各目的变量,
所述训练部通过将所述作为测定对象的样品的数据集用作验证集来进一步检索与算法或参数相关的第2开发条件,基于所述第2开发条件训练所述机器学习模型,同时,将所述第2开发条件存入所述存储部。
7.一种检量方法,其特征在于,使计算机执行如下处理:
生成基准样品的数据集,所述基准样品的数据集包括含有多种成分的基准样品的光谱数据、以及由所述基准样品的所述多种成分的各成分含量决定的各目的变量;
通过机器学习对机器学习模型进行训练,所述机器学习使用所述基准样品的数据集,所述机器学习模型根据所述光谱数据的输入,输出所述多种成分的各成分的所述各目的变量中的至少1个目的变量。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质为记录有检量程序的计算机可读存储介质,所述检量程序使计算机执行如下处理:
生成基准样品的数据集,所述基准样品的数据集包括含有多种成分的基准样品的光谱数据、以及由所述基准样品的所述多种成分的各成分含量决定的各目的变量;
通过机器学习对机器学习模型进行训练,所述机器学习使用所述基准样品的数据集,所述机器学习模型根据所述光谱数据的输入,输出所述多种成分的各成分的所述各目的变量中的至少1个目的变量。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022-100959 | 2022-06-23 | ||
JP2022100959A JP7168118B1 (ja) | 2022-06-23 | 2022-06-23 | 検量装置、検量方法および検量プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117288697A true CN117288697A (zh) | 2023-12-26 |
Family
ID=83977453
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310146751.3A Pending CN117288697A (zh) | 2022-06-23 | 2023-02-15 | 检量装置、检量方法和计算机可读存储介质 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20230419174A1 (zh) |
EP (1) | EP4296348A1 (zh) |
JP (2) | JP7168118B1 (zh) |
CN (1) | CN117288697A (zh) |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120123688A1 (en) * | 2010-09-17 | 2012-05-17 | Abbott Laboratories | Raman spectroscopy for bioprocess operations |
KR20200068697A (ko) * | 2017-10-06 | 2020-06-15 | 론자 리미티드 | 라만 분광법을 사용하는 세포 배양의 자동 제어 |
BR122023022045A2 (pt) | 2017-10-16 | 2024-01-16 | Regeneron Pharmaceuticals, Inc. | Métodos e sistemas para controlar condições de meio de cultura celular e para reduzir modificações pós-translação de uma proteína secretada |
US10928309B2 (en) * | 2018-06-29 | 2021-02-23 | Viavi Solutions Inc. | Cross-validation based calibration of a spectroscopic model |
CN110920255B (zh) * | 2018-09-19 | 2021-03-12 | 精工爱普生株式会社 | 打印头控制电路、打印头以及液体喷出装置 |
JP7414029B2 (ja) * | 2021-02-26 | 2024-01-16 | 横河電機株式会社 | 測定方法及び測定システム |
-
2022
- 2022-06-23 JP JP2022100959A patent/JP7168118B1/ja active Active
- 2022-10-27 JP JP2022172704A patent/JP2024002873A/ja active Pending
-
2023
- 2023-01-19 EP EP23152500.7A patent/EP4296348A1/en active Pending
- 2023-02-07 US US18/106,849 patent/US20230419174A1/en active Pending
- 2023-02-15 CN CN202310146751.3A patent/CN117288697A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
JP7168118B1 (ja) | 2022-11-09 |
EP4296348A1 (en) | 2023-12-27 |
JP2024002023A (ja) | 2024-01-11 |
JP2024002873A (ja) | 2024-01-11 |
US20230419174A1 (en) | 2023-12-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Bhatia et al. | In‐line monitoring of amino acids in mammalian cell cultures using raman spectroscopy and multivariate chemometrics models | |
Luo et al. | Bioprocess systems analysis, modeling, estimation, and control | |
JP2021522601A (ja) | バッチプロセスのモデル化、監視及び制御におけるバッチデータの自動アライメントのためのコンピュータシステム及び方法 | |
JP6620100B2 (ja) | 合成多成分の生物工学および化学プロセス試料を調製するための方法およびシステム | |
CN111201434A (zh) | 用于控制细胞培养物中的过程变量的原位拉曼光谱系统和方法 | |
Rathore et al. | Digitization in bioprocessing: The role of soft sensors in monitoring and control of downstream processing for production of biotherapeutic products | |
US20230081615A1 (en) | Method for estimating culture state, information processing device, and program | |
JP2023544029A (ja) | 細胞培養の予測モデル化及び制御 | |
Voss et al. | Advanced monitoring and control of pharmaceutical production processes with Pichia pastoris by using Raman spectroscopy and multivariate calibration methods | |
Min et al. | Application of semi-supervised convolutional neural network regression model based on data augmentation and process spectral labeling in Raman predictive modeling of cell culture processes | |
Graf et al. | A novel approach for non-invasive continuous in-line control of perfusion cell cultivations by Raman spectroscopy | |
Brunner et al. | Online sensor validation in sensor networks for bioprocess monitoring using swarm intelligence | |
WO2023117827A1 (en) | Method of operation of a process plant, soft sensor and digital process twin system | |
Gomes et al. | Monitoring and control of bioreactor: Basic concepts and recent advances | |
CN116052778A (zh) | 实时监测生物反应器中细胞培养液组分浓度的方法 | |
CN117217419A (zh) | 工业生产全生命周期碳排放监测方法及系统 | |
CN115985404A (zh) | 监测和自动化控制生物反应器的方法和装置 | |
Solle et al. | Chemometric modelling based on 2D-fluorescence spectra without a calibration measurement | |
Craven et al. | Process analytical technology and quality-by-design for animal cell culture | |
JP7168118B1 (ja) | 検量装置、検量方法および検量プログラム | |
US20230279332A1 (en) | Hybrid Predictive Modeling for Control of Cell Culture | |
Khodabandehlou et al. | Cell culture product quality attribute prediction using convolutional neural networks and Raman spectroscopy | |
Acosta-Pavas et al. | Soft sensors based on interpretable learners for industrial-scale fed-batch fermentation: Learning from simulations | |
US20240085864A1 (en) | Just-In-Time Learning With Variational Autoencoder For Cell Culture Process Monitoring And/Or Control | |
Narayanan et al. | Consistent value creation from bioprocess data with customized algorithms: Opportunities beyond multivariate analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |