CN115410657A - 燃料乙醇发酵过程菌丝体浓度、乙醇浓度和葡萄糖浓度时间序列预测方法 - Google Patents

燃料乙醇发酵过程菌丝体浓度、乙醇浓度和葡萄糖浓度时间序列预测方法 Download PDF

Info

Publication number
CN115410657A
CN115410657A CN202210921099.3A CN202210921099A CN115410657A CN 115410657 A CN115410657 A CN 115410657A CN 202210921099 A CN202210921099 A CN 202210921099A CN 115410657 A CN115410657 A CN 115410657A
Authority
CN
China
Prior art keywords
concentration
time
mycelium
ethanol
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210921099.3A
Other languages
English (en)
Inventor
颜学峰
李欣喆
董裕峰
王冠
常璐
陈力凡
田锡炜
庄英萍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
East China University of Science and Technology
Original Assignee
East China University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by East China University of Science and Technology filed Critical East China University of Science and Technology
Priority to CN202210921099.3A priority Critical patent/CN115410657A/zh
Publication of CN115410657A publication Critical patent/CN115410657A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/30Prediction of properties of chemical compounds, compositions or mixtures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/11Complex mathematical operations for solving equations, e.g. nonlinear equations, general mathematical optimization problems
    • G06F17/13Differential equations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Chemical & Material Sciences (AREA)
  • Operations Research (AREA)
  • Algebra (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Biology (AREA)
  • Biomedical Technology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明是燃料乙醇发酵过程菌丝体浓度、乙醇浓度和葡萄糖浓度时间序列预测方法。本方法构建基于多项式回归算法的发酵结束时间预测模型,建立了发酵结束时间与初始条件之间的数学关系。通过时间尺度的缩放,变换不同批次数据的时间序列达到统一的标准结束时间。本方法建立基于XGBoost算法的菌丝体浓度预测模型。将所获得的菌丝体浓度与生长速率作为补充的机理知识添加到乙醇和葡萄糖浓度的预测模型中。本方法建立人工神经网络的动力学参数模型,其可以根据时间变量和环境变量提供动力学参数。将其融合入前面的菌丝体浓度、乙醇浓度和葡萄糖浓度预测模型中,可以实现不同初始条件下,菌丝体浓度、乙醇浓度、葡萄糖浓度的时间序列预测。

Description

燃料乙醇发酵过程菌丝体浓度、乙醇浓度和葡萄糖浓度时间 序列预测方法
技术领域
本发明属于生物发酵工程领域,涉及基于机理和数据驱动的对燃料乙醇不同发酵批次中菌丝体浓度、乙醇浓度以及葡萄糖浓度预测的动态建模方法。
背景技术
近年来关于开发无污染、成本低的新型燃料代替污染严重的传统燃料这一方向成为一项重要课题。不仅如此,由于原油、煤炭等化石燃料的世界储备日渐减少,寻找作为替代品的新型燃料已势在必行。燃料乙醇作为汽油添加剂以及新型燃料在这一领域中备受关注。燃料乙醇是指未添加变性剂、体积分数达到99.5%以上的无水乙醇,是一种清洁的高辛烷值燃料。其可再生性、增氧助燃性、原料普遍性和绿色环保等优势,紧密契合“碳中和、碳达峰”的宗旨。乙醇发酵过程的工业生产经历了长时间的历史发展,其丰富的生产经验为乙醇转型成为新型燃料的发展之路打下了深厚基础,具有未来发展成为主要燃料能源的巨大潜力。目前,燃料乙醇的主要生产途径为生物质发酵法,其过程大多具有时变性、高度复杂性以及不确定性等。因此,建立准确的模型来描述发酵过程具有重要的意义。不仅可以帮助科研人员更加准确地研究乙醇发酵过程,而且可以指导工艺、操作条件的改造与优化。
混合建模能够成功的重要原因是不同类型模型之间能够互补。在传统的工业建模方法中,所建立的机理模型通常需要先深入研究该工业过程或现象的理论知识。再尝试将这种过程或现象抽象为数学形式,并进一步在计算机中实现。当机理模型可以准确描述机理时,其准确性、稳定性和可解释性都是首屈一指的。但这种建模方式也存在一定的弊端。建立起的机理模型往往是单一的,其蕴含的数学过程或者机理是有限的。某些过程的机理也是难以描述的,例如:模型中存在变量的维度很高、动力学参数时变、变量之间存在多重共线性和复杂的非线性等情况。因此,机理模型的优点在于准确性好、可解释性好,但建模难度高、模型不具有灵活性。在机器学习的建模中,通常是使用某种固定的算法挖掘数据中的信息且不需要机理知识的支持。算法会对已有数据进行训练,根据预测结果与真实值之间的误差来调整模型中的参数。但数据驱动模型也存在一定的问题。当采集到的数据存在样本不均衡问题时,模型容易对多数样本产生过拟合现象。有的模型则面临着数据量很少的挑战,算法难以从单纯的数据中挖掘出完整的模型。数据如果存在异常点或者噪声,也可能会使得模型学习到了错误的知识,导致其预测准确率下降。工业生产对于模型稳定性和鲁棒性有着较高的要求,单纯的数据驱动模型有时候完全不能达到要求。数据驱动模型的优点在于建模简单,但对采集的数据要求高。在本发明所建立的混合模型中,数据驱动模型是将机理模型中的寻找合适机理的问题,转换为获取优质数据和寻找模型参数的问题。利用数据驱动模型提取出机理模型无法体现出的非线性复杂关系。而利用机理模型来减少数据驱动模型受到数据噪声、分布等影响程度。机理模型作为混合模型的基础,减少样本中噪声、冗余信息对数据驱动模型的影响,从而避免所建立的混合模型出现违背机理与常识的情况。
发明内容
本发明目的是提供一种基于机理和数据驱动的燃料乙醇发酵过程菌丝体浓度、乙醇浓度和葡萄糖浓度时间序列预测方法。
本发明的具体技术方案是:燃料乙醇发酵过程菌丝体浓度、乙醇浓度和葡萄糖浓度时间序列预测方法,具体步骤包括:
第一步,根据不同批次的初始条件建立基于多项式回归算法的发酵结束时间预测模型,并对发酵数据进行统一时间尺度的变换。
第二步,为了更加准确地预测出菌丝体浓度的变化趋势,建立基于XGBoost算法的菌丝体浓度预测模型,并计算出该时间段内菌丝体生长速率的预测值。
第三步,建立人工神经网络的动力学参数模型,其可以根据时间变量和环境变量提供动力学参数,将其融合入前面的菌丝体浓度、乙醇浓度和葡萄糖浓度预测模型中,可以实现不同初始条件下,菌丝体浓度、乙醇浓度、葡萄糖浓度的时间序列预测。该动态混合模型结构如图1所示。
本发明的优点:(1)采用多项式回归算法建立了发酵初始条件和发酵结束时间的数学关系,模型结构简单,可解释性强。该模型以较高精度预测出发酵结束时间,对乙醇生产具有极其重要的指导意义。(2)本发明基于初始葡萄糖浓度不同的发酵批次数据,结合机理建模与数据驱动建模的互补的特性,建立了考虑发酵时间因素影响的动态模型。该模型有助于更加真实地模拟和预测发酵过程的动态行为。
1.基于多项式回归算法的发酵结束时间预测模型
在燃料乙醇的生产中,乙醇的发酵是一个复杂的过程。在将该过程抽象为数学模型后,将构成一个复杂的多变量系统。例如:不同批次的发酵结束时间是不同的。这种时间上的不统一,给发酵过程预测模型的训练带来了一定的困难。因此,建立了基于多项式回归算法的发酵结束时间预测模型,来描述初始葡萄糖浓度、初始菌丝体浓度与发酵结束时间的数学关系。由于初始葡萄糖浓度和初始菌丝体浓度数量级差异较大,需要对二者进行标准化处理:
Figure BDA0003777661760000031
其中,
Figure BDA0003777661760000032
代表标准化后的初始葡萄糖浓度;
Figure BDA0003777661760000033
代表初始葡萄糖浓度;
Figure BDA0003777661760000034
代表初始葡萄糖浓度的均值;
Figure BDA0003777661760000035
代表初始葡萄糖浓度的标准差;
Figure BDA0003777661760000036
代表标准化后的初始菌丝体浓度;
Figure BDA0003777661760000037
代表初始菌丝体浓度;
Figure BDA0003777661760000038
代表初始菌丝体浓度的均值;
Figure BDA0003777661760000039
代表初始菌丝体浓度的标准差。
选择二次多项式回归模型,舍弃平方项,只保留交互项对特征进行升维。则发酵结束时间预测模型的特征为:标准化后的初始葡萄糖浓度
Figure BDA00037776617600000310
标准化后的初始菌丝体浓度
Figure BDA00037776617600000311
和二者之间的乘积cs 0*×cx 0*。多项式回归模型(仅存在交互项)的表达式为:
tpre=αcs 0*+βcx 0*+γcs 0*cx 0*+ε (2)
其中,tpre代表发酵结束时间的预测值;α、β、γ代表回归系数,ε代表截距,该模型的参数通过实验数据来拟合确定。
2.统一时间尺度的数据变换
不同批次的时间尺度不同,导致取样时间间隔以及发酵结束时间不同。样本数据上时间的不统一,给发酵过程中模型的建立来了一定的困难。因此,需要通过时间缩放将训练数据的时间序列转换为统一的发酵结束时间和时间间隔。这种时间上的统一有利于模型的训练。
按照式(3)将不同的发酵过程映射到同一标准化时间,即总发酵时长为34小时。根据转换后的标准时间插值训练集中菌丝体浓度、乙醇浓度和葡萄糖浓度为2小时间隔的时间序列。
Figure BDA0003777661760000041
其中,t*代表统一时间尺度后的当前真实采用时间的标准时间;t代表当前真实的采样时间点;tpre代表利用多项式回归模型所预测的发酵结束时间。
3.基于XGBoost算法的菌丝体浓度预测模型
通过纯机理建模后,发现Logistic方程既不能较好地拟合出菌丝体浓度的变化趋势,也不能体现出发酵中后期环境与酵母菌的负反馈作用。因此在混合建模过程中,将舍弃菌丝体生长的机理模型,选择单独对其建立数据驱动模型。构建基于XGBoost 算法的菌丝体浓度预测模型,其输入变量为t*时刻的菌丝体浓度cx t*、乙醇浓度cP t*、葡萄糖浓度cs t*和发酵标准时间t*,其输出为t*+1时刻的菌丝体浓度cx t*+1。选择判定系数R2作为XGBoost模型的评估指标:
Figure BDA0003777661760000042
式中,cx代表菌丝体浓度的实验值;
Figure BDA0003777661760000043
代表XGBoost模型菌丝体浓度的预测结果;
Figure BDA0003777661760000044
代表菌丝体浓度实验数据的平均值;m代表训练数据的样本量。基于实验数据,以评估指标最优为目标,对其参数进行确定。确定最佳的超参数组合后,根据差分公式计算获得该时间段内菌丝体生长速率的预测值:
Figure BDA0003777661760000045
该模型可以获得较为准确的菌丝体浓度以及生长速率的预测结果,为乙醇和葡萄糖预测模型提供补充的机理知识。
4.人工神经网络的乙醇动力学参数模型
当初始葡萄糖浓度相差较大时,纯机理建模出现失配的问题。即将训练好的机理模型运用到其他发酵批次中,效果不理想。为了解决纯机理模型所引发的失配问题,本发明建立人工神经网络的乙醇动力学参数模型。此模型的目标是寻找一组固定的权值与阈值,从而得出随着环境变量(cx t*、cP t*和cs t*)与时间变量变化的动力学参数。神经网络模型的输入变量为t*时刻的菌丝体浓度cx t*、乙醇浓度cP t*、葡萄糖浓度cs t*和发酵标准时间t*,其输出为t*+1时刻乙醇机理模型所用到的3个动力学参数k1 t*+1、k2 t*+1和k3 t*+1。神经网络模型中隐藏层的激活函数选择Sigmoid函数,输出层的激活函数选择线性传输函数Purelin。改进的乙醇生成机理模型如下:
Figure BDA0003777661760000051
将由XGBoost模型所预测出的菌丝体浓度和生长速率作为补充的机理知识添加到微分方程式(6)中,则可以计算出t*+1时刻的乙醇浓度cP t*+1。此时就将问题转换为一个优化问题,其目标函数是最小化乙醇浓度的预测值与真实值之间的均方根误差,被优化的变量是人工神经网络模型的权值与阈值。采用单纯形法优化该问题,其目标函数的表达式如下:
Figure BDA0003777661760000052
式中,cP代表乙醇浓度的实验值;
Figure BDA0003777661760000053
代表乙醇浓度的预测值。
5.人工神经网络的葡萄糖动力学参数模型
该神经网络模型的输入变量为t*时刻的菌丝体浓度cx t*、乙醇浓度cP t*、葡萄糖浓度cs t*和发酵标准时间t*,其输出为t*+1时刻葡萄糖机理模型所用到的3个动力学参数k4 t *+1、k5 t*+1和k6 t*+1。改进的葡萄糖消耗机理模型如下:
Figure BDA0003777661760000054
将利用上述模型所得到的cx
Figure BDA0003777661760000055
Figure BDA0003777661760000056
数据添加到微分方程式(8)中,则可以计算出t*+1时刻的葡萄糖浓度cs t*+1。该优化问题的目标函数的表达式如下:
Figure BDA0003777661760000057
式中,cs代表葡萄糖浓度的实验值;
Figure BDA0003777661760000058
代表葡萄糖浓度的预测值。
最终,将燃料乙醇发酵过程的动态混合模型在标准时间下预测出的菌丝体浓度、乙醇浓度和葡萄糖浓度的时间序列缩放变换回到真实的发酵时间,具体公式如下:
Figure BDA0003777661760000061
其中,t*代表统一时间尺度后的当前真实采用时间的标准时间;t代表当前真实的采样时间点;tpre代表利用多项式回归模型所预测的发酵结束时间。
附图说明
图1是基于机理和数据驱动的燃料乙醇发酵过程菌丝体浓度、乙醇浓度和葡萄糖浓度时间序列预测方法结构图。
具体实施方式
以下通过实施例对本发明作出进一步说明,但不限制本发明的范围:
1.发酵数据采集以及预处理
本发明所采用的发酵数据可以根据初始葡萄糖浓度划分为3大类:即220g/L左右、250g/L上下和285g/L以上。随机选择6批发酵数据作为训练集,2批发酵数据作为测试数据。每一批发酵数据的采样时间间隔与发酵结束时间都是不同的,包括不同取样时间下所对应的菌丝体浓度、乙醇浓度和葡萄糖浓度。通过多项式回归算法预测发酵结束时间的表达式为:
tpre=4.2424cs 0*-3.0377cx 0*+2.5902cs 0*cx 0*+32.2870 (11)
将其按照式(3)对发酵结束时间标准化,并根据转换时间插值训练集中菌丝体浓度、乙醇浓度和葡萄糖浓度为统一时间尺度的时间序列。采用MATLAB平台上的插值函数“interp1”中分段三次埃米特插值“pchip”来获得。即每一批数据是发酵时长为0~34小时、并以2小时为时间间隔的18组样本。其中训练集包含108组数据,对应6批菌丝体浓度、乙醇浓度和葡萄糖浓度的时间序列。测试集包含2批燃料乙醇发酵过程的数据。
2.基于XGBoost算法的菌丝体浓度预测模型
本发明通过5折交叉验证对XGBoost框架中的超参数进行选择。部分参数选择如下:objective=’reg:linear’、max_depth=6、eta=0.3、n_estimators=18、subsample=1、gamma=0、lambda=1、alpha=0、colsample_bytree=1、colsample_bylevel=1。训练模型后,即可得出t*+1时刻的菌丝体浓度的预测值。该时间段内生长速率的预测值由差分公式(5)计算。
3.人工神经网络的乙醇动力学参数模型
根据乙醇预测模型训练集中的效果选择神经网络的隐藏层神经元个数为4个。并选择其连接方式为全连接,则所需权值与阈值的个数总和为35个。初始化神经网络模型的权值与阈值后,就可以计算出下一时刻乙醇机理模型所用到的3个动力学参数 k1 t*+1、k2 t*+1和k3 t*+1。将由XGBoost模型所预测出的菌丝体浓度和生长速率作为补充的机理知识添加到改进的微分方程式(6)中,可以计算出t*+1时刻的乙醇浓度cP t*+1。利用单纯形法所寻得乙醇动力学参数模型的最优权值与阈值为:
Figure BDA0003777661760000071
b=[b1 b2 b3 b4]T=[0.6752 0.2489 0.3174 0.2685]T
Figure BDA0003777661760000072
b'=[b1' b2' b3']T=[0.2204 0.2504 0.5253]T
式中,V代表神经网络中输入层到隐藏层的权值矩阵;v21代表输入层第2个神经元与隐含层第1个神经元之间的权值,其余同理;b代表隐藏层神经元的阈值向量; b1代表隐藏层第一个神经元的阈值,其余同理;W代表隐藏层到输出层的权值矩阵; w21代表隐藏层第2个神经元与输出层第1个神经元之间的权值,其余同理;b'代表输出层神经元的阈值向量;b1'代表输出层第一个神经元的阈值,其余同理。
4.人工神经网络的葡萄糖动力学参数模型
根据葡萄糖预测模型训练集中的拟合效果选择神经网络的隐藏层神经元个数为3个。将利用上述模型所得到的cx
Figure BDA0003777661760000073
Figure BDA0003777661760000074
数据添加到改进的微分方程式(8)中,则可以计算出t*+1时刻的葡萄糖浓度cs t*+1。利用单纯形法所寻得葡萄糖动力学参数模型的最优权值与阈值为:
Figure BDA0003777661760000081
b=[b1 b2 b3]T=[4.8630 0.5804 2.4842]T
Figure BDA0003777661760000082
b'=[b1' b2' b3']T=[0.1367 -0.3971 0.2127]T

Claims (8)

1.燃料乙醇发酵过程菌丝体浓度、乙醇浓度和葡萄糖浓度时间序列预测方法,其特征在于,步骤包括:
第一,基于多项式回归算法的发酵结束时间预测模型,建立发酵结束时间与初始条件之间的数学关系,为后续时间尺度的统一提供发酵结束时间的预测值;通过时间尺度的缩放,变换不同批次的当前真实采样时间点达到统一的发酵结束时间;
第二,基于XGBoost算法的菌丝体浓度预测模型将所获得的菌丝体浓度和生长速率的预测值作为补充的机理知识添加到乙醇浓度和葡萄糖浓度的预测模型中;
第三,建立人工神经网络的动力学参数模型,根据时间变量和环境变量提供动力学参数;将其融合入前面的菌丝体浓度、乙醇浓度和葡萄糖浓度预测模型中,实现不同初始条件下,菌丝体浓度、乙醇浓度、葡萄糖浓度的时间序列预测;该步骤如下:
(1)寻找燃料乙醇发酵过程机理模型,作为混合模型的基础;
(2)构建发酵结束时间预测模型;
(3)进行统一时间尺度的数据变换;
(4)构建菌丝体浓度以及生长速率的预测模型,实现机理模型中Logistic方程对菌丝体浓度拟合;
(5)根据模型所提供菌丝体浓度以及生长速率的机理知识,结合动力学参数模型构建出乙醇和葡萄糖浓度的预测模型;
(6)将动态混合模型在标准时间下所预测出的菌丝体浓度、乙醇浓度和葡萄糖浓度缩放到真实的发酵时间,实现时间序列预测。
2.根据权利要求1所述的燃料乙醇发酵过程菌丝体浓度、乙醇浓度和葡萄糖浓度时间序列预测方法,其特征在于,所述发酵结束时间预测模型建立了初始葡萄糖浓度、初始菌丝体浓度与发酵结束时间的数学关系是:由于初始葡萄糖浓度和初始菌丝体浓度数量级差异较大,对二者进行标准化处理:
Figure FDA0003777661750000011
其中,
Figure FDA0003777661750000012
代表标准化后的初始葡萄糖浓度;
Figure FDA0003777661750000013
代表初始葡萄糖浓度;
Figure FDA0003777661750000014
代表初始葡萄糖浓度的均值;
Figure FDA0003777661750000021
代表初始葡萄糖浓度的标准差;
Figure FDA0003777661750000022
代表标准化后的初始菌丝体浓度;
Figure FDA0003777661750000023
代表初始菌丝体浓度;
Figure FDA0003777661750000024
代表初始菌丝体浓度的均值;
Figure FDA0003777661750000025
代表初始菌丝体浓度的标准差;选择二次多项式回归模型,舍弃平方项,只保留交互项对特征进行升维;发酵结束时间预测模型的特征为:标准化后的初始葡萄糖浓度
Figure FDA0003777661750000026
标准化后的初始菌丝体浓度
Figure FDA0003777661750000027
和二者之间的乘积
Figure FDA0003777661750000028
多项式回归模型,仅存在交互项的表达式为:
Figure FDA0003777661750000029
其中,tpre代表发酵结束时间的预测值;α、β、γ代表回归系数,ε代表截距,该模型的参数通过实验数据来拟合确定。
3.根据权利要求1所述的燃料乙醇发酵过程菌丝体浓度、乙醇浓度和葡萄糖浓度时间序列预测方法,其特征在于,所述进行统一时间尺度的数据变换,是根据各发酵过程时间长度不相同,对不同时间长度的发酵过程映射到同一标准化时间,根据转换后的时间插值训练集中菌丝体浓度、乙醇浓度和葡萄糖浓度为若干时间间隔的时间序列。标准化发酵结束时间转换公式如下:
Figure FDA00037776617500000210
其中,t*代表统一时间尺度后的当前真实采用时间的标准时间;t代表当前真实的采样时间点;tpre代表利用多项式回归模型所预测的发酵结束时间。
4.根据权利要求3所述的燃料乙醇发酵过程菌丝体浓度、乙醇浓度和葡萄糖浓度时间序列预测方法,其特征在于,总发酵时长为34小时;若干时间间隔是是2小时的时间间隔。
5.根据权利要求1所述的燃料乙醇发酵过程菌丝体浓度、乙醇浓度和葡萄糖浓度时间序列预测方法,其特征在于,构建所述基于XGBoost算法的菌丝体浓度预测模型:输入变量为t*时刻的菌丝体浓度
Figure FDA00037776617500000211
乙醇浓度
Figure FDA00037776617500000212
葡萄糖浓度
Figure FDA00037776617500000213
和发酵标准时间t*,其输出为t*+1时刻的菌丝体浓度
Figure FDA00037776617500000214
判定系数R2作为XGBoost模型的评估指标:
Figure FDA00037776617500000215
式中,cx代表菌丝体浓度的实验值;
Figure FDA00037776617500000216
代表XGBoost模型菌丝体浓度的预测结果;
Figure FDA00037776617500000217
代表菌丝体浓度实验数据的平均值;m代表训练数据的样本量。基于实验数据,以评估指标最优为目标,对其参数进行确定;确定超参数组合后,根据差分公式计算该时间段内菌丝体生长速率的预测值:
Figure FDA0003777661750000031
6.根据权利要求1所述的燃料乙醇发酵过程菌丝体浓度、乙醇浓度和葡萄糖浓度时间序列预测方法,其特征在于,所述建立人工神经网络的动力学参数模型:神经网络模型的输入变量为t*时刻的菌丝体浓度
Figure FDA0003777661750000032
乙醇浓度
Figure FDA0003777661750000033
葡萄糖浓度
Figure FDA0003777661750000034
和发酵标准时间t*,其输出为t*+1时刻乙醇机理模型所用到的3个动力学参数
Figure FDA0003777661750000035
Figure FDA0003777661750000036
神经网络模型中隐含层的激活函数选择Sigmoid函数,输出层的激活函数选择线性传输函数Purelin;此模型目标是获得一组固定的权值与阈值,得出随着环境变量
Figure FDA0003777661750000037
Figure FDA0003777661750000038
Figure FDA0003777661750000039
)与时间变量变化的动力学参数;改进的乙醇生成机理模型如下:
Figure FDA00037776617500000310
将由XGBoost模型所预测出的菌丝体浓度和生长速率作为补充的机理知识添加到改进的乙醇微分方程式中,计算出t*+1时刻的乙醇浓度
Figure FDA00037776617500000311
7.根据权利要求6所述的燃料乙醇发酵过程菌丝体浓度、乙醇浓度和葡萄糖浓度时间序列预测方法,其特征在于,人工神经网络的动力学参数模型进行优化,目标函数是最小化乙醇浓度的预测值与实验值之间的均方根误差,被优化的变量是神经网络模型的权值与阈值;采用单纯形法优化该问题,其目标函数的表达式如下:
Figure FDA00037776617500000312
式中,cP代表乙醇浓度的实验值;
Figure FDA00037776617500000313
代表乙醇浓度的预测值。
8.根据权利要求1所述的燃料乙醇发酵过程菌丝体浓度、乙醇浓度和葡萄糖浓度时间序列预测方法,其特征在于,将燃料乙醇发酵过程的动态混合模型在标准时间下预测出的菌丝体浓度、乙醇浓度和葡萄糖浓度的时间序列缩放变换回到真实的发酵时间,具体公式如下:
Figure FDA00037776617500000314
其中,t*代表统一时间尺度后的当前真实采用时间的标准时间;t代表当前真实的采样时间点;tpre代表利用多项式回归模型所预测的发酵结束时间。
CN202210921099.3A 2022-08-02 2022-08-02 燃料乙醇发酵过程菌丝体浓度、乙醇浓度和葡萄糖浓度时间序列预测方法 Pending CN115410657A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210921099.3A CN115410657A (zh) 2022-08-02 2022-08-02 燃料乙醇发酵过程菌丝体浓度、乙醇浓度和葡萄糖浓度时间序列预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210921099.3A CN115410657A (zh) 2022-08-02 2022-08-02 燃料乙醇发酵过程菌丝体浓度、乙醇浓度和葡萄糖浓度时间序列预测方法

Publications (1)

Publication Number Publication Date
CN115410657A true CN115410657A (zh) 2022-11-29

Family

ID=84158830

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210921099.3A Pending CN115410657A (zh) 2022-08-02 2022-08-02 燃料乙醇发酵过程菌丝体浓度、乙醇浓度和葡萄糖浓度时间序列预测方法

Country Status (1)

Country Link
CN (1) CN115410657A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116467835A (zh) * 2023-02-07 2023-07-21 山东申东发酵装备有限公司 一种啤酒发酵罐监控系统
CN116774575A (zh) * 2023-08-21 2023-09-19 山东六佳药用辅料股份有限公司 一种用于糊精生产过程中粘度控制方法及系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116467835A (zh) * 2023-02-07 2023-07-21 山东申东发酵装备有限公司 一种啤酒发酵罐监控系统
CN116467835B (zh) * 2023-02-07 2024-01-26 山东申东发酵装备有限公司 一种啤酒发酵罐监控系统
CN116774575A (zh) * 2023-08-21 2023-09-19 山东六佳药用辅料股份有限公司 一种用于糊精生产过程中粘度控制方法及系统
CN116774575B (zh) * 2023-08-21 2023-11-03 山东六佳药用辅料股份有限公司 一种用于糊精生产过程中粘度控制方法及系统

Similar Documents

Publication Publication Date Title
CN115410657A (zh) 燃料乙醇发酵过程菌丝体浓度、乙醇浓度和葡萄糖浓度时间序列预测方法
CN102693450B (zh) 一种基于遗传神经网络的曲轴疲劳寿命预测方法
CN108416460B (zh) 基于多因素时序—随机深度置信网络模型的蓝藻水华预测方法
del Rio-Chanona et al. Dynamic modeling and optimization of cyanobacterial C-phycocyanin production process by artificial neural network
CN111553407A (zh) 一种基于马尔科夫灰色模型的工程项目成本预测方法
CN116703644A (zh) 一种基于Attention-RNN的短期电力负荷预测方法
Li et al. Dynamic hybrid modeling of fuel ethanol fermentation process by integrating biomass concentration XGBoost model and kinetic parameter artificial neural network model into mechanism model
Roeva et al. Multiple model approach to modelling of Escherichia coli fed-batch cultivation extracellular production of bacterial phytase
Mesquita et al. Machine learning applied for metabolic flux‐based control of micro‐aerated fermentations in bioreactors
CN113095534A (zh) 一种ARIMA与改进Elman神经网络组合的风电功率预测方法
CN115496153A (zh) 多头自注意力的深度卷积嵌入聚类风光荷联合场景方法
CN114912363A (zh) 基于bp-lstm模型的解脂耶氏酵母发酵软测量方法
Zhang et al. Reliable multi-objective on-line re-optimisation control of a fed-batch fermentation process using bootstrap aggregated neural networks
Graefe et al. A new training method for hybrid models of bioprocesses
CN111667387A (zh) 一种基于元知识字典学习的认知诊断方法
CN113962431A (zh) 一种两阶段特征处理的母线负荷预测方法
CN109858127A (zh) 基于递归时序深度置信网络的蓝藻水华预测方法
CN111339646A (zh) 一种用于全自动控制的温度数据增强方法
McKay et al. Evolving a hybrid model of a fed-batch fermentation process
CN113050710B (zh) Hammerstein非线性动态系统的建模及其连续搅拌反应器浓度控制
CN110334373A (zh) 一种基于机理模型和模糊加权lssvm的发酵建模与优化方法
Eikens et al. Neural networks and first principle models for bioprocesses
Mairet et al. Parameter estimation for dynamic resource allocation in microorganisms: A bi-level optimization problem
Reyed Computational biotechnology: An approach in silico based modeling bioprocess
Mairet et al. Coupling framers to get enhanced interval observers. Application to growth rate estimation in a photobioreactor

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination