CN116484723A - 一种基于动态多层域自适应的发酵过程软测量建模方法 - Google Patents
一种基于动态多层域自适应的发酵过程软测量建模方法 Download PDFInfo
- Publication number
- CN116484723A CN116484723A CN202310338540.XA CN202310338540A CN116484723A CN 116484723 A CN116484723 A CN 116484723A CN 202310338540 A CN202310338540 A CN 202310338540A CN 116484723 A CN116484723 A CN 116484723A
- Authority
- CN
- China
- Prior art keywords
- domain
- data
- model
- distribution
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 238000000855 fermentation Methods 0.000 title claims abstract description 49
- 230000004151 fermentation Effects 0.000 title claims abstract description 49
- 238000005259 measurement Methods 0.000 title claims abstract description 44
- 238000009826 distribution Methods 0.000 claims abstract description 112
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 19
- 230000006978 adaptation Effects 0.000 claims abstract description 17
- 238000012549 training Methods 0.000 claims abstract description 16
- 238000013508 migration Methods 0.000 claims abstract description 12
- 230000005012 migration Effects 0.000 claims abstract description 12
- 239000000758 substrate Substances 0.000 claims abstract description 8
- 238000013528 artificial neural network Methods 0.000 claims abstract description 6
- 230000006870 function Effects 0.000 claims description 26
- CYDMQBQPVICBEU-UHFFFAOYSA-N chlorotetracycline Natural products C1=CC(Cl)=C2C(O)(C)C3CC4C(N(C)C)C(O)=C(C(N)=O)C(=O)C4(O)C(O)=C3C(=O)C2=C1O CYDMQBQPVICBEU-UHFFFAOYSA-N 0.000 claims description 19
- CYDMQBQPVICBEU-XRNKAMNCSA-N chlortetracycline Chemical compound C1=CC(Cl)=C2[C@](O)(C)[C@H]3C[C@H]4[C@H](N(C)C)C(O)=C(C(N)=O)C(=O)[C@@]4(O)C(O)=C3C(=O)C2=C1O CYDMQBQPVICBEU-XRNKAMNCSA-N 0.000 claims description 19
- 229960004475 chlortetracycline Drugs 0.000 claims description 19
- 235000019365 chlortetracycline Nutrition 0.000 claims description 19
- 239000011159 matrix material Substances 0.000 claims description 19
- 230000008569 process Effects 0.000 claims description 19
- 238000012360 testing method Methods 0.000 claims description 19
- 238000002472 multi-metal deposition Methods 0.000 claims description 17
- 238000010606 normalization Methods 0.000 claims description 8
- 230000003044 adaptive effect Effects 0.000 claims description 7
- 238000011156 evaluation Methods 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000001514 detection method Methods 0.000 claims description 6
- 238000013507 mapping Methods 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 4
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 3
- VHUUQVKOLVNVRT-UHFFFAOYSA-N Ammonium hydroxide Chemical compound [NH4+].[OH-] VHUUQVKOLVNVRT-UHFFFAOYSA-N 0.000 claims description 3
- 235000011114 ammonium hydroxide Nutrition 0.000 claims description 3
- 230000000694 effects Effects 0.000 claims description 2
- 238000000691 measurement method Methods 0.000 description 6
- 238000004519 manufacturing process Methods 0.000 description 5
- 238000013526 transfer learning Methods 0.000 description 3
- 238000010923 batch production Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000004566 building material Substances 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000004886 process control Methods 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2119/00—Details relating to the type or aim of the analysis or the optimisation
- G06F2119/02—Reliability analysis or reliability optimisation; Failure analysis, e.g. worst case scenario performance, failure mode and effects analysis [FMEA]
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/02—Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Mathematical Analysis (AREA)
- Data Mining & Analysis (AREA)
- Pure & Applied Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Mathematical Optimization (AREA)
- Computational Mathematics (AREA)
- Computing Systems (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Geometry (AREA)
- Algebra (AREA)
- Computer Hardware Design (AREA)
- Databases & Information Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一种基于动态多层域自适应的发酵过程软测量建模方法。本发明针对发酵过程数据普遍存在的实时数据与历史数据的分布不一致和实时数据缺乏标签的问题,将迁移学习策略引入到深度神经网络中,实现了在标记的源域数据上建立软测量模型预测目标域上的发酵过程的基质浓度。首先以受监督的方式训练源域数据上的卷积神经网络模型,并将其参数作为初始化参数提供给目标模型;然后在多层卷积神经网络中分别使用多核最大均值差异与条件嵌入算子差异适配源域和目标域的边缘分布与条件分布,并引入动态自适应因子调整分布权重,以微调目标模型。最后,利用分布适配后的历史数据建立软测量回归模型。本发明能实现发酵过程中发酵罐与发酵罐的知识迁移,有效提高软测量模型的预测精度。
Description
技术领域
本发明涉及过程控制领域的方法,尤其涉及一种基于动态多层域自适的软测量建模方法。
背景技术
流程工业是制造业的重要组成部分,包括石化、冶金、制药、建材和电力等生产行业,是我国国民经济和社会发展的重要支柱产业。间歇过程作为现代工业过程的主要方式之一,其定义是指在有限的时间里,将原料按照工艺流程加工成特定产品的过程。在间歇过程中,由于传感器技术的制约以及现场操作环境的限制,很多关键的产品质量或过程状态参数无法在线实时测量。软测量技术为此类难测参数的在线估计提供了有效途径,把容易测量的变量作为模型的输入,难以测量的变量作为模型的输出,以构建合适的数据驱动软测量模型。目前,大多数数据驱动软测量建模研究主要集中实时数据与历史数据服从独立同分布。然而,在实际生产过程中存在多种工作条件和模式,使得实时数据和历史数据之间的分布不一致,导致传统软传测量模型不具备很高的预测准确性。此外,从实际工业生产中获取传感器数据的标记数据通常困难、昂贵和耗时的。
针对上述问题,迁移学习作为最近发展起来的一种学习范式,已显示出利用不同但相关的源领域数据中的知识的潜力。域自适应方法作为迁移学习在特征匹配或特征变换学习的一个重要研究方向,其目的就是为了使得源域和目标域在特征表示层面上的差异性尽可能减小,从而源域和目标域中的数据特征能够互相匹配,最终达到源域数据能够协助目标域进行相关任务的学习。基于特征的迁移学习是域适应方法的基础,如何使得不同域之间的数据分布差异性尽可能减小并得到合适的匹配,一直被研究学者所关注和研究。近年来,随着工业中对数值预测的需求增加,越来越多的研究集中于将域自适应应用于软测量建模任务。然而,由于实际生产过程中,旧操作条件收集的历史数据与新操作条件收集的实时数据来自不同领域。因此,始终存在数据分布偏移,包括协变量偏移、条件偏移、先验概率等。如何缓解数据分布偏移仍然是迁移学习的主要障碍。
发明内容
本发明主要针对发酵过程数据普遍存在的实时数据与历史数据的分布不一致和实时数据缺乏标签的问题,提出了一种基于动态多层域自适的发酵过程软测量建模方法,以提高工业变量的检测精度。
为解决上述技术问题,本发明的技术方案如下:一种基于动态多层域自适应的发酵过程软测量建模方法,包括以下步骤:
步骤(1)发酵过程数据的获取及预处理
通过集散控制系统或离线检测的方法获取发酵过程数据,利用特征选择等方法确定和主导变量y密切相关的过程变量作为辅助变量x;利用Z-Score方法,对原始数据集进行归一化处理;确定源域数据Ds和目标域数据Dt,并分别划分成训练集Dtrn和测试集Dtest;
步骤(2)建立动态多层域自适应软测量模型
基于参数迁移和特征迁移捕获有标记源域的知识,在多层卷积神经网络中分别使用多核最大均值差异MK-MMD与条件嵌入算子差异CEOD同时测量源域和目标域的边缘分布与条件分布差异,并引入动态自适应因子μ调整分布权重,以微调目标模型;然后使用适配后的历史数据建立动态多层域自适应软测量模型预测目标域发酵过程的基质浓度;
步骤(3)模型评估
引入评价指标均方根误差RMSE和决定系数R2对模型进行评估,验证动态多层域自适应模型的预测效果。
进一步地,所述步骤(1)金霉素发酵过程数据的获取及预处理的具体过程为:
步骤(1.1)获取发酵过程数据
通过集散控制系统或离线检测的方法获取金霉素发酵过程数据,利用特征选择等方法确定以基质浓度为主导变量y,挑选与目标变量密切相关的多个过程变量作为辅助变量x,辅助变量分别为发酵时间、温度、PH(-)、DO浓度、空气流量、空气消耗量、补料速率、基质消耗量和氨水消耗量;
步骤(1.2)数据归一化处理
对数据进行Z-Score归一化处理,公式如下:
其中,x*为归一化处理后的数据,x为所采集的原始数据,为原始数据的均值,σ为原始数据的标准差;
步骤(1.3)确定源域数据和目标域数据
从归一化处理的不同发酵罐数据集中任选一个发酵罐作为源域Ds,另一发酵罐为目标域Dt,并将源域数据集和目标域数据集分别划分为训练集Dtrn和测试集Dtest;源域为完全标记数据,表示为其中/>为第i个源域样本,χS为源域样本的特征空间,/>为第i个源域样本对应的标签,YS为源域样本的标签空间,ns为源域样本数;目标域为完全未标记数据,表示为/>其中/>为第j个目标域样本,χT为目标域样本的特征空间,nt为目标域样本数。
进一步地,所述步骤(2)建立动态多层域自适应软测量模型的具体过程为:
步骤(2.1)预训练
以受监督的方式训练源域数据上的深度卷积神经网络模型,并保存该模型参数,将参数作为初始参数提供给相同结构的目标模型;均方误差损失用于训练和更新卷积神经网络模型和预测器的参数,预训练网络的回归预测损失可表示为:
其中f(·)为预测函数,ys为真实样本标签,ns为源域样本个数;
步骤(2.2)微调目标模型
在多层卷积神经网络(卷积层和全连接层)中分别使用多核最大均值差异MK-MMD与条件嵌入算子差异CEOD同时适配源域和目标域之间的边缘分布与条件分布,并引入动态自适应因子调整分布权重,以微调目标模型;然后使用适配后的历史数据建立动态多层域自适应软测量模型预测目标域发酵过程的基质浓度;
对于边缘分布,使用最大平均差异MMD将数据映射到再生核希尔伯特空间RKHS,以测量源域和目标域的分布差异,可表示为:
其中,XS为源域样本,XT为目标域样本,ns为源域样本的个数,nt为目标域样本的个数,H表示再生核希尔伯特空间,φ(·)为映射函数;
根据等式(3),使用无偏估计来估计源域和目标域之间的MMD,可表示为:
其中,k(xi,xj)为高斯核函数;
在多层卷积神经网络中使用多核最大均值差异(MK-MMD)适配边缘分布,以测量源域和目标域的分布差异;根据等式(4),边缘分布差异MDD损失函数可表示为:
其中,XL,S=∪l∈Lxl,s和XL,T=∪l∈Lxl,t分别表示源域和目标域的多层可迁移样本,l为每一个可迁移的神经网络层,L={C1,C2,C3,C4,F1,F2}为所有可迁移层的索引,为高斯核函数,通过/>选择高斯内核带宽参数σ作为所有样本对之间的中值距离,n=ns/2=nt/2为样本数,pl为权衡参数,用于平衡多层MK-MMD的大小;
对于条件分布,基于核嵌入理论,使用条件嵌入算子差CEOD来测量RKHS中的条件分布差异;条件分布的条件均值嵌入通过贝叶斯规则进行线性运算,可表示为:
其中,和φ(·)为映射函数,/>的条件期望E[·]通过平均嵌入的内积计算为/><·,·>为内积运算符,Γ表示与特征向量和标签相对应的RKHS,Cy|X为描述两个RKHS的变化规则的运算符,可通过互协方差算子CyX和自方差算子CXX计算,表示为:
其中,为张量积,Cy|X使用经验值进一步估计,可表示为:
其中,和γ=(φ(x1),φ(x2),...,φ(xn)是特征矩阵,K=γTγ是Gram矩阵,n为样本个数,ηI为正则化项,η∈(0,1]为正则化系数;
根据等式(9),条件分布差异CDD损失函数可表示为:
其中,Kxx=Kxx(i,j)=k(xi,xj)和Kyy=Kyy(i,j)=k(yi,yj)是高斯核函数,ns和nt分别为源域样本数和目标域样本数;
为了更好地调整边缘分布与条件分布的相对重要性,提出动态分布适应DDA,DDA引入动态自适应因子μ调整分布权重,可表示为:
其中,和/>分别表示边缘分布和条件分布的A-距离,LMDD和LCDD分别表示边缘分布损失和条件分布损失;动态分布适应DDA可通过等式(5)和等式(10)进一步表示为:
LDDA=μLMDD+(1-μ)LCDD μ∈[0,1] (12)
其中μ→0表示测量条件分布差异,μ→1表示测量边缘分布差异;
根据等式(2)和等式(12),动态多层自适应模型的总损失可表示为:
Ltotal=αLpre+βLDDA+λWTW (13)
其中,α,β∈(0,1]为权衡参数,λWTW为正则化项,λ∈(0,1]为正则化系数;
步骤(2.3)网络参数初始化设置
预训练源域和微调目标模型过程中,都需要设置一些超参数:学习率用于控制参数更新的步长大小;迭代次数为模型要迭代的次数,过少的迭代次数可能导致模型欠拟合,过多的迭代次数可能导致模型过拟合;α,β为平衡回归预测损失与动态域自适应的权重;λ为正则化系数,用于控制模型的复杂度,防止过拟合;η为条件嵌入算子差异计算条件分布差异中的正则化系数;μ为动态自适应因子,每次根据运行次数动态适配边缘分布与条件分布;采用反向传播算法和Adam优化器迭代更新网络权重。
进一步地,所述步骤(3)模型评估的具体过程为:
步骤(3.1)均方根误差RMSE,公式如下:
其中,Ntest表示测试样本的数量;和yi分别表示第i个测试样本的预测值和真实值,RMSE排除数据规模的影响,衡量预测值和真实值之间的偏差程度,RMSE越小,模型的预测精确度越高;
步骤(3.2)决定系数R2,公式如下:
其中,表示真实值的平均值,R2可以很好地解释回归模型的方差得分,其取值在0到1之间,越接近1,R2模型对真实值的拟合程度越高。
与现有技术相比,本发明具有以下有益效果:本发明将迁移学习策略引入到深度神经网络中,提出的基于动态多层域自适应的发酵过程软测量建模方法,实现了发酵过程中发酵罐与发酵罐之间的知识迁移,解决了发酵过程数据普遍存在的实时数据与历史数据的分布不一致和实时数据缺乏标签的问题。本发明同时考虑源域与目标域的边缘分布和条件分布不同,首先对有大量标签数据的源域进行预训练,并将参数传递给目标模型;然后,在多层卷积神经网络中分别使用多核最大均值差异与条件嵌入算子差异同时适配边缘分布与条件分布,并引入动态自适应因子调整分布权重,以微调目标模型;最后利用分配适配后的历史数据建立软测量模型,实现金霉素发酵过程的基质浓度预测,有效提高软测量模型的预测精度。
附图说明
图1为本发明基于动态多层域自适应的发酵过程软测量建模方法的流程图;
图2为发酵罐T637的T637III1309013批次的有标记样本数;
图3为任务T637-T636不同软测量方法对金霉素基质浓度预测误差曲线;
图4为任务T636-T638不同软测量方法对金霉素基质浓度预测误差曲线;
图5为任务T638-T636不同软测量方法对金霉素基质浓度预测误差曲线。
具体实施方式
以下结合附图和具体实施例对本发明的技术方案做进一步详细说明。
(1)金霉素发酵过程数据的获取及预处理
步骤(1.1)获取金霉素发酵过程数据
通过集散控制系统或离线检测的方法获取金霉素发酵过程数据,利用特征选择等方法确定以基质浓度为主导变量y,挑选与目标变量密切相关的9个过程变量作为辅助变量x,辅助变量分别为发酵时间、温度、PH(-)、DO浓度、空气流量、空气消耗量、补料速率、基质消耗量和氨水消耗量。本实例共采集金霉素发酵过程的3个发酵罐数据(T636、T637、T368),每个发酵罐用14个批次,共340个数据进行建模,发酵罐T637的T637III1309013批次的有标记样本数如图2所示;
步骤(1.2)数据归一化处理
为了保证数据之间的可比性,将不同量级的数据统一转换成同一量级,利用Z-Score方法,对原始数据集进行归一化处理;公式如下:
其中,x*为归一化处理后的数据,x为所采集的原始数据,为原始数据的均值,σ为原始数据的标准差;
步骤(1.3)确定源域数据和目标域数据
本实例从归一化处理的不同发酵罐数据集中分别选择T637,T636,T638作为源域数据集Ds,T636,T638作为目标域数据集Dt,并将源域和目标域数据集划分为训练集Dtrn(11批次,265个样本)和测试集Dtest(3批次,75个样本)。源域为完全标记数据,表示为其中/>为第i个源域样本,χS为源域样本的特征空间,/>为第i个源域样本对应的标签,YS为源域样本的标签空间,ns为源域样本数;目标域为完全未标记数据,表示为/>其中/>为第j个目标域样本,χT为目标域样本的特征空间,nt为目标域样本数。
(2)建立动态多层域自适应软测量模型
步骤(2.1)预训练
以受监督的方式训练源域数据上的深度卷积神经网络模型,并保存该模型参数,将参数作为初始参数提供给相同结构的目标模型;均方误差损失用于训练和更新卷积神经网络模型和预测器的参数,预训练网络的回归预测损失可表示为:
其中f(·)为预测函数,ys为真实样本标签,ns为源域样本个数;
步骤(2.2)微调目标模型
在多层卷积神经网络(卷积层和全连接层)中分别使用多核最大均值差异MK-MMD与条件嵌入算子差异CEOD同时适配源域和目标域之间的边缘分布与条件分布,并引入动态自适应因子调整分布权重,以微调目标模型;然后使用适配后的历史数据建立动态多层域自适应软测量模型预测目标域发酵过程的基质浓度;
对于边缘分布,使用最大平均差异MMD将数据映射到再生核希尔伯特空间RKHS,以测量源域和目标域的分布差异,可表示为:
其中,XS为源域样本,XT为目标域样本,ns为源域样本的个数,nt为目标域样本的个数,H表示再生核希尔伯特空间,φ(·)为映射函数;
根据等式(3),使用无偏估计来估计源域和目标域之间的MMD,可表示为:
其中,k(xi,xj)为高斯核函数;
在多层卷积神经网络中使用多核最大均值差异(MK-MMD)适配边缘分布,以测量源域和目标域的分布差异;根据等式(4),边缘分布差异MDD损失函数可表示为:
pl=1-DMDD 2(Xl,s,Xl,t)/DMDD 2(XL,S,XL,T) (6)
其中,XL,S=∪l∈Lxl,s和XL,T=∪l∈Lxl,t分别表示源域和目标域的多层可迁移样本,l为每一个可迁移的神经网络层,L={C1,C2,C3,C4,F1,F2}为所有可迁移层的索引,为高斯核函数,通过/>选择高斯内核带宽参数σ作为所有样本对之间的中值距离,n=ns/2=nt/2为样本数,pl为权衡参数,用于平衡多层MK-MMD的大小;
对于条件分布,基于核嵌入理论,使用条件嵌入算子差CEOD来测量RKHS中的条件分布差异;条件分布的条件均值嵌入通过贝叶斯规则进行线性运算,可表示为:
其中,和φ(·)为映射函数,/>的条件期望E[·]通过平均嵌入的内积计算为/><·,·>为内积运算符,Γ表示与特征向量和标签相对应的RKHS,Cy|X为描述两个RKHS的变化规则的运算符,可通过互协方差算子CyX和自方差算子CXX计算,表示为:
其中,为张量积,Cy|X使用经验值进一步估计,可表示为:
其中,和γ=(φ(x1),φ(x2),...,φ(xn)是特征矩阵,K=γTγ是Gram矩阵,n为样本个数,ηI为正则化项,η∈(0,1]为正则化系数;
根据等式(9),条件分布差异CDD损失函数可表示为:
其中,Kxx=Kxx(i,j)=k(xi,xj)和Kyy=Kyy(i,j)=k(yi,yj)是高斯核函数,ns和nt分别为源域样本数和目标域样本数,η∈(0,1]为正则化系数;
为了更好地调整边缘分布与条件分布的相对重要性,提出动态分布适应DDA,DDA引入动态自适应因子μ调整分布权重,可表示为:
其中,和/>分别表示边缘分布和条件分布的A-距离,LMDD和LCDD分别表示边缘分布损失和条件分布损失;动态分布适应DDA可通过等式(5)和等式(10)进一步表示为:
LDDA=μLMDD+(1-μ)LCDD μ∈[0,1] (12)
其中μ→0表示测量条件分布差异,μ→1表示测量边缘分布差异;
根据等式(2)和等式(12),动态多层自适应模型的总损失可表示为:
Ltotal=αLpre+βLDDA+λWTW (13)
其中,α,β∈(0,1]为权衡参数,λWTW为正则化项,λ∈(0,1]为正则化系数;
步骤(2.3)网络参数初始化设置
本发明边缘分布的核函数设置为exp(-||x-x′||2),条件分布的核函数设置为exp(-0.8||x-x′||2),条件嵌入算子差异计算条件分布差异中的正则化系数η设置为0.8;预训练源域和微调目标模型过程中初始学习率分别设置为0.02和0.01,迭代次数分别设置为300和100,微调目标模型阶段的最后两个完全连接层的学习率固定为0.01*初始学习率;α和β为平衡回归预测损失与动态域自适应的权重,分别设置为0.1和0.03,正则化系数λ分别为1e-4和5e-3;动态自适应因子μ每次根据运行次数动态适配边缘分布与条件分布;采用反向传播算法和Adam优化器迭代更新网络权重。
(3)模型评估
步骤(3.1)均方根误差RMSE,公式如下:
其中,Ntest表示测试样本的数量;和yi分别表示第i个测试样本的预测值和真实值,RMSE排除数据规模的影响,衡量预测值和真实值之间的偏差程度,RMSE越小,模型的预测精确度越高;
步骤(3.2)决定系数R2,公式如下:
其中,y表示真实值的平均值,R2可以很好地解释回归模型的方差得分,其取值在0到1之间,越接近1,R2模型对真实值的拟合程度越高。
(4)金霉素发酵过程数据的预测结果
本实例设置T637作为源域,T636作为目标域;T636作为源域,T638作为目标域;T638作为源域,T636作为目标域,共完成3项迁移任务,分别为T637-T636、T636-T638、T638-T636。比较了如下方法:
1)直接预测(PD)模型:预训练后的源模型用于直接预测目标任务;
2)条件分布适应(CDA)模型:微调目标模型中,仅对全连接层进行边缘分布差异测量;
3)边缘分布适应(MDA)模型:微调目标模型中,仅对全连接层进行条件分布差异测量。
不同软测量方法对金霉素基质浓度预测结果比较如表1所示。将T637和T636分别作为源域和目标域,本发明与不同软测量方法对金霉素基质浓度预测误差曲线,如图3所示。将T636和T638分别作为源域和目标域,本发明与不同软测量方法对金霉素基质浓度预测误差曲线,如图4所示。将T638和T636分别作为源域和目标域,本发明与不同软测量方法对金霉素基质浓度预测误差曲线,如图5所示。从上述实验结果可以看出,本发明方法的预测准确度相比于其它软测量模型具有明显优势,能够说明在发酵过程建模中,将不同发酵罐数据进行动态多层域自适应来提取域不变信息,能够提升软测量模型的预测准确度。
表1不同软测量方法对金霉素基质浓度预测结果比较
本发明将迁移学习策略引入到深度神经网络中,实现金霉素发酵过程中发酵罐与发酵罐之间的知识迁移,解决发酵过程数据普遍存在的实时数据与历史数据的分布不一致和实时数据缺乏标签的问题。本发明的重点在于:首先对源域进行预训练,并将参数传递到目标模型;然后在多层卷积神经网络中分别使用多核最大均值差异与条件嵌入算子差异同时测量源域和目标域的边缘分布差异与条件分布差异,并引入动态自适应因子调整分布权重,以微调目标模型。最后预测目标域中无标签数据的金霉素发酵过程的基质浓度。本发明具有一定的可行性和有效性。
需要说明的是,本发明不仅限于保护实施例与某个案例,实施例所述的内容仅仅是对发明构思的实现形式的列举,在本发明的精神和权利要求保护范围内,未对本发明做出的任何修改或改进,都将受到本发明的保护范围限制。
Claims (4)
1.一种基于动态多层域自适应的发酵过程软测量建模方法,其特征在于,包括以下步骤:
步骤(1)发酵过程数据的获取及预处理
通过集散控制系统或离线检测的方法获取发酵过程数据,利用特征选择等方法确定和主导变量y密切相关的过程变量作为辅助变量x;利用Z-Score方法,对原始数据集进行归一化处理;确定源域数据Ds和目标域数据Dt,并分别划分成训练集Dtrn和测试集Dtest;
步骤(2)建立动态多层域自适应软测量模型
基于参数迁移和特征迁移捕获有标记源域的知识,在多层卷积神经网络中分别使用多核最大均值差异MK-MMD与条件嵌入算子差异CEOD同时测量源域和目标域的边缘分布差异与条件分布差异,并引入动态自适应因子μ调整分布权重,以微调目标模型;然后使用适配后的历史数据建立动态多层域自适应软测量模型预测目标域发酵过程的基质浓度;
步骤(3)模型评估
引入评价指标均方根误差RMSE和决定系数R2对模型进行评估,验证动态多层域自适应模型的预测效果。
2.根据权利要求1所述的基于动态多层域自适应的发酵过程软测量建模方法,其特征在于,所述步骤(1)发酵过程数据的获取及预处理的具体过程为:
步骤(1.1)获取发酵过程数据
通过集散控制系统或离线检测的方法获取金霉素发酵过程数据,利用特征选择等方法确定以基质浓度为主导变量y,挑选与目标变量密切相关的多个过程变量作为辅助变量x,辅助变量分别为发酵时间、温度、PH(-)、DO浓度、空气流量、空气消耗量、补料速率、基质消耗量和氨水消耗量;
步骤(1.2)数据归一化处理
对数据进行Z-Score归一化处理,公式如下:
其中,x*为归一化处理后的数据,x为所采集的原始数据,为原始数据的均值,σ为原始数据的标准差;
步骤(1.3)确定源域数据和目标域数据
从归一化处理的不同发酵罐数据集中任选一个发酵罐作为源域Ds,另一发酵罐为目标域Dt,并将源域数据集和目标域数据集分别划分为训练集Dtrn和测试集Dtest;源域为完全标记数据,表示为其中/>为第i个源域样本,χS为源域样本的特征空间,为第i个源域样本对应的标签,YS为源域样本的标签空间,ns为源域样本数;目标域为完全未标记数据,表示为/>其中/>为第j个目标域样本,χT为目标域样本的特征空间,nt为目标域样本数。
3.根据权利要求1所述的基于动态多层域自适应的发酵过程软测量建模方法,其特征在于,所述步骤(2)建立动态多层域自适应软测量模型的具体过程为:
步骤(2.1)预训练
以受监督的方式训练源域数据上的深度卷积神经网络模型,并保存该模型参数,将参数作为初始参数提供给相同结构的目标模型;均方误差损失用于训练和更新卷积神经网络模型和预测器的参数,预训练网络的回归预测损失可表示为:
其中f(·)为预测函数,ys为真实样本标签,ns为源域样本个数;
步骤(2.2)微调目标模型
在多层卷积神经网络卷积层和全连接层中分别使用多核最大均值差异MK-MMD与条件嵌入算子差异CEOD同时测量源域和目标域之间的边缘分布差异与条件分布差异,并引入动态自适应因子调整分布权重,以微调目标模型;然后使用适配后的历史数据建立动态多层域自适应软测量模型预测目标域发酵过程的基质浓度;
对于边缘分布,使用最大平均差异MMD将数据映射到再生核希尔伯特空间RKHS,以测量源域和目标域的分布差异,可表示为:
其中,XS为源域样本,XT为目标域样本,ns为源域样本的个数,nt为目标域样本的个数,H表示再生核希尔伯特空间,φ(·)为映射函数;
根据等式(3),使用无偏估计来估计源域和目标域之间的MMD,可表示为:
其中,k(xi,xj)为高斯核函数;
在多层卷积神经网络中使用多核最大均值差异MK-MMD适配边缘分布,以测量源域和目标域的分布差异;根据等式(4),边缘分布差异MDD损失函数可表示为:
pl=1-DMDD 2(Xl,s,Xl,t)/DMDD 2(XL,S,XL,T) (6)
其中,XL,S=∪l∈Lxl,s和XL,T=∪l∈Lxl,t分别表示源域和目标域的多层可迁移样本,l为每一个可迁移的神经网络层,L={C1,C2,C3,C4,F1,F2}为所有可迁移层的索引,为高斯核函数,通过/>选择高斯内核带宽参数σ作为所有样本对之间的中值距离,n=ns/2=nt/2为样本数,pl为权衡参数,用于平衡多层MK-MMD的大小;
对于条件分布,基于核嵌入理论,使用条件嵌入算子差CEOD来测量RKHS中的条件分布差异;条件分布的条件均值嵌入通过贝叶斯规则进行线性运算,可表示为:
其中,和φ(·)为映射函数,/>的条件期望E[·]通过平均嵌入的内积计算为<·,·>为内积运算符,Γ表示与特征向量和标签相对应的RKHS,Cy|X为描述两个RKHS的变化规则的运算符,可通过互协方差算子CyX和自方差算子CXX计算,表示为:
其中,为张量积,Cy|X使用经验值进一步估计,可表示为:
其中,和γ=(φ(x1),φ(x2),...,φ(xn)是特征矩阵,K=γTγ是Gram矩阵,n为样本个数,ηI为正则化项,η∈(0,1]为正则化系数;
根据等式(9),条件分布差异CDD损失函数可表示为:
其中,Kxx=Kxx(i,j)=k(xi,xj)和Kyy=Kyy(i,j)=k(yi,yj)是高斯核函数,ns和nt分别为源域样本数和目标域样本数;
为了更好地调整边缘分布与条件分布的相对重要性,提出动态分布适应DDA,DDA引入动态自适应因子μ调整分布权重,可表示为:
其中,和/>分别表示边缘分布和条件分布的A-距离,LMDD和LCDD分别表示边缘分布损失和条件分布损失;动态分布适应DDA可通过等式(5)和等式(10)进一步表示为:
LDDA=μLMDD+(1-μ)LCDD μ∈[0,1] (12)
其中μ→0表示测量条件分布差异,μ→1表示测量边缘分布差异;
根据等式(2)和等式(12),动态多层自适应模型的总损失可表示为:
Ltotal=αLpre+βLDDA+λWTW (13)
其中,α,β∈(0,1]为权衡参数,λWTW为正则化项,λ∈(0,1]为正则化系数;
步骤(2.3)网络参数初始化设置
预训练源域和微调目标模型过程中,都需要设置一些超参数:学习率用于控制参数更新的步长大小;迭代次数为模型要迭代的次数,过少的迭代次数可能导致模型欠拟合,过多的迭代次数可能导致模型过拟合;α,β为平衡回归预测损失与动态域自适应的权重;λ为正则化系数,用于控制模型的复杂度,防止过拟合;η为条件嵌入算子差异计算条件分布差异中的正则化系数;μ为动态自适应因子,每次根据运行次数动态适配边缘分布与条件分布;采用反向传播算法和Adam优化器迭代更新网络权重。
4.根据权利要求1所述的基于动态多层域自适应的发酵过程软测量建模方法,其特征在于,所述步骤(3)模型评估的具体过程为:
步骤(3.1)均方根误差RMSE,公式如下:
其中,Ntest表示测试样本的数量;和yi分别表示第i个测试样本的预测值和真实值,RMSE排除数据规模的影响,衡量预测值和真实值之间的偏差程度,RMSE越小,模型的预测精确度越高;
步骤(3.2)决定系数R2,公式如下:
其中,表示真实值的平均值,R2可以很好地解释回归模型的方差得分,其取值在0到1之间,越接近1,R2模型对真实值的拟合程度越高。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310338540.XA CN116484723B (zh) | 2023-03-31 | 2023-03-31 | 一种基于动态多层域自适应的发酵过程软测量建模方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310338540.XA CN116484723B (zh) | 2023-03-31 | 2023-03-31 | 一种基于动态多层域自适应的发酵过程软测量建模方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116484723A true CN116484723A (zh) | 2023-07-25 |
CN116484723B CN116484723B (zh) | 2024-05-31 |
Family
ID=87211142
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310338540.XA Active CN116484723B (zh) | 2023-03-31 | 2023-03-31 | 一种基于动态多层域自适应的发酵过程软测量建模方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116484723B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118460362A (zh) * | 2024-07-09 | 2024-08-09 | 浙江每日元康生物科技有限公司 | 应用于益生菌发酵的温度控制系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109060001A (zh) * | 2018-05-29 | 2018-12-21 | 浙江工业大学 | 一种基于特征迁移学习的多工况过程软测量建模方法 |
CN111914492A (zh) * | 2020-04-28 | 2020-11-10 | 昆明理工大学 | 一种基于进化优化的半监督学习工业过程软测量建模方法 |
CN112989711A (zh) * | 2021-04-25 | 2021-06-18 | 昆明理工大学 | 一种基于半监督集成学习的工业过程软测量建模方法 |
CN114334024A (zh) * | 2021-12-28 | 2022-04-12 | 浙江工业大学 | 一种基于快速成分迁移学习的发酵过程软测量建模方法 |
CN114512191A (zh) * | 2022-01-17 | 2022-05-17 | 江南大学 | 一种基于迁移成分分析的青霉素浓度预测方法 |
CN115482877A (zh) * | 2022-05-15 | 2022-12-16 | 浙江工业大学 | 一种基于时序图网络的发酵过程软测量建模方法 |
-
2023
- 2023-03-31 CN CN202310338540.XA patent/CN116484723B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109060001A (zh) * | 2018-05-29 | 2018-12-21 | 浙江工业大学 | 一种基于特征迁移学习的多工况过程软测量建模方法 |
CN111914492A (zh) * | 2020-04-28 | 2020-11-10 | 昆明理工大学 | 一种基于进化优化的半监督学习工业过程软测量建模方法 |
CN112989711A (zh) * | 2021-04-25 | 2021-06-18 | 昆明理工大学 | 一种基于半监督集成学习的工业过程软测量建模方法 |
CN114334024A (zh) * | 2021-12-28 | 2022-04-12 | 浙江工业大学 | 一种基于快速成分迁移学习的发酵过程软测量建模方法 |
CN114512191A (zh) * | 2022-01-17 | 2022-05-17 | 江南大学 | 一种基于迁移成分分析的青霉素浓度预测方法 |
CN115482877A (zh) * | 2022-05-15 | 2022-12-16 | 浙江工业大学 | 一种基于时序图网络的发酵过程软测量建模方法 |
Non-Patent Citations (3)
Title |
---|
QIN XIONG 等: "A Soft Sensor Method based on Unsupervised Multi-layer Domain Adaptation for Batch Processes", 《2023 IEEE 12TH DATA DRIVEN CONTROL AND LEARNING SYSTEMS CONFERENCE (DDCLS)》, 7 July 2023 (2023-07-07), pages 1805 - 1811 * |
王通 等: "基于模糊评估自适应更新的油井动液面软测量建模", 《化工学报》, vol. 70, no. 12, 3 September 2019 (2019-09-03), pages 4760 - 4769 * |
黄成 等: "基于时空局部学习的集成自适应软测量方法", 《仪器仪表学报》, vol. 44, no. 1, 16 December 2022 (2022-12-16), pages 231 - 241 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118460362A (zh) * | 2024-07-09 | 2024-08-09 | 浙江每日元康生物科技有限公司 | 应用于益生菌发酵的温度控制系统 |
CN118460362B (zh) * | 2024-07-09 | 2024-09-13 | 浙江每日元康生物科技有限公司 | 应用于益生菌发酵的温度控制系统 |
Also Published As
Publication number | Publication date |
---|---|
CN116484723B (zh) | 2024-05-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109060001B (zh) | 一种基于特征迁移学习的多工况过程软测量建模方法 | |
CN110414788B (zh) | 一种基于相似日和改进lstm的电能质量预测方法 | |
Liu et al. | Intelligent prognostics of machining tools based on adaptive variational mode decomposition and deep learning method with attention mechanism | |
Dong et al. | The prediction trend of enterprise financial risk based on machine learning arima model | |
CN108875933B (zh) | 一种无监督稀疏参数学习的超限学习机分类方法及系统 | |
CN116484723B (zh) | 一种基于动态多层域自适应的发酵过程软测量建模方法 | |
CN113012766B (zh) | 一种基于在线选择性集成的自适应软测量建模方法 | |
Natarajan et al. | Online deep neural network-based feedback control of a Lutein bioprocess | |
Shioya et al. | Knowledge-based design and operation of bioprocess systems | |
CN110046377B (zh) | 一种基于异构相似度的选择性集成即时学习软测量建模方法 | |
CN110569985A (zh) | 基于在线和离线决策集成学习的在线异构迁移学习的方法 | |
CN113030197A (zh) | 一种气体传感器漂移补偿方法 | |
Acuña et al. | Static and dynamic neural network models for estimating biomass concentration during thermophilic lactic acid bacteria batch cultures | |
CN112818030B (zh) | 一种自适应的分布式流数据关联规则挖掘方法 | |
CN114334024A (zh) | 一种基于快速成分迁移学习的发酵过程软测量建模方法 | |
Liu et al. | A multi-input parallel convolutional attention network for tool wear monitoring | |
CN116484275B (zh) | 基于自适应时空图卷积神经网络的铝电解阳极效应监测方法 | |
Zhou et al. | Deep learning with PID residual elimination network for time-series prediction of water quality in aquaculture industry | |
CN114861759A (zh) | 一种线性动态系统模型的分布式训练方法 | |
CN111160464B (zh) | 基于多隐层加权动态模型的工业高阶动态过程软测量方法 | |
Zhu et al. | Model-based prediction of dissolved oxygen content in fish production | |
CN116798506B (zh) | 一种毕赤酵母发酵过程中菌体浓度的预测方法 | |
Valencia et al. | Optimization of invertase production in a fed-batch bioreactor using simulation based dynamic programming coupled with a neural classifier | |
CN109554439A (zh) | 一种基于online-rlssvm的毕赤酵母发酵过程软测量方法 | |
CN114254675A (zh) | 一种基于相似矩阵的保持目标域局部结构的风格迁移方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |