CN109060001B - 一种基于特征迁移学习的多工况过程软测量建模方法 - Google Patents
一种基于特征迁移学习的多工况过程软测量建模方法 Download PDFInfo
- Publication number
- CN109060001B CN109060001B CN201810531977.4A CN201810531977A CN109060001B CN 109060001 B CN109060001 B CN 109060001B CN 201810531977 A CN201810531977 A CN 201810531977A CN 109060001 B CN109060001 B CN 109060001B
- Authority
- CN
- China
- Prior art keywords
- data
- domain
- training
- network
- target domain
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 93
- 230000008569 process Effects 0.000 title claims abstract description 58
- 238000005259 measurement Methods 0.000 title claims abstract description 36
- 238000013526 transfer learning Methods 0.000 title claims abstract description 14
- 238000012549 training Methods 0.000 claims abstract description 71
- 238000009826 distribution Methods 0.000 claims abstract description 28
- 238000013508 migration Methods 0.000 claims abstract description 11
- 230000005012 migration Effects 0.000 claims abstract description 11
- 238000011156 evaluation Methods 0.000 claims abstract description 9
- 238000007781 pre-processing Methods 0.000 claims abstract description 5
- 230000006978 adaptation Effects 0.000 claims abstract description 4
- 230000009466 transformation Effects 0.000 claims description 31
- 239000010410 layer Substances 0.000 claims description 30
- 230000006870 function Effects 0.000 claims description 28
- 238000013528 artificial neural network Methods 0.000 claims description 18
- 210000002569 neuron Anatomy 0.000 claims description 18
- 238000012360 testing method Methods 0.000 claims description 18
- 238000006243 chemical reaction Methods 0.000 claims description 14
- 239000000110 cooling liquid Substances 0.000 claims description 10
- 239000004576 sand Substances 0.000 claims description 9
- 230000003044 adaptive effect Effects 0.000 claims description 7
- 238000005457 optimization Methods 0.000 claims description 7
- 238000012545 processing Methods 0.000 claims description 6
- 238000009795 derivation Methods 0.000 claims description 5
- 150000001875 compounds Chemical class 0.000 claims description 4
- 238000000691 measurement method Methods 0.000 claims description 4
- 230000004913 activation Effects 0.000 claims description 3
- 238000004422 calculation algorithm Methods 0.000 claims description 3
- 230000000694 effects Effects 0.000 claims description 3
- 239000002356 single layer Substances 0.000 claims description 3
- 238000000638 solvent extraction Methods 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims 1
- 238000001311 chemical methods and process Methods 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000009776 industrial production Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000003042 antagnostic effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012824 chemical production Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01D—MEASURING NOT SPECIALLY ADAPTED FOR A SPECIFIC VARIABLE; ARRANGEMENTS FOR MEASURING TWO OR MORE VARIABLES NOT COVERED IN A SINGLE OTHER SUBCLASS; TARIFF METERING APPARATUS; MEASURING OR TESTING NOT OTHERWISE PROVIDED FOR
- G01D21/00—Measuring or testing not otherwise provided for
- G01D21/02—Measuring two or more variables by means not covered by a single other subclass
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
一种基于特征迁移学习的多工况过程软测量建模方法,包括以下步骤:(1)获取连续搅拌釜式反应器的多工况过程变量数据集;(2)多工况数据的预处理以及数据集划分;(3)不同工况下的数据特征分布匹配迁移训练;(4)建立域适应极限学习机软测量模型;(5)将特征分布匹配好的新训练数据送入软测量模型训练并进行预测评估。本发明利用特征迁移方法将相关工况数据特征信息迁移到标签数据缺乏的工况中,有效提升了软测量模型对标签数据缺乏的工况的预测准确度。
Description
技术领域
本发明涉及化工过程的多工况软测量建模领域,特别涉及一种基于特征迁移学习的多工况过程软测量建模方法。
背景技术
在当代流程工业生产中,为保证生产设备的稳定运行以及产品质量满足要求,采用数据驱动的软测量建模方法对过程中的关键变量进行预测得到了更多关注。数据驱动的软测量建模方法利用生产过程中的大量历史标签数据进行训练,从而挖掘出历史数据中辅助变量与关键变量之间的数学关系。数据驱动的软测量建模方法凭借无需深入了解过程的反应机理,准确性高和实现简单等优势,在化工过程中得到了广泛应用。
近年来,化工生产过程中的多工况特性受到广泛关注。由于生产多牌号产品的需要,生产过程的操作条件要进行频繁切换,造成了所采集的过程数据也发生了显著的变化。多工况特性为传统软测量建模方法的实施增加了难度,首先,不同工况下收集的数据特点存在差异性,在特定工况下建立的模型无法适用于其他工况的关键变量的预测;其次,不同的工况在建立独立的软测量模型均需要足够的历史标签数据进行训练,才能获得准确的预测模型。在实际工业生产过程中,标签数据量是十分有限的,更多的是无标签数据。国内外研究学者通过提出半监督学习方法和主动学习方法,在使用少量的标签数据的基础上,并充分利用大量无标签数据所携带的结构信息,进一步提升模型的预测准确性。然而,半监督学习方法和主动学习方法在标签数据量上有较高的要求,标签数据量十分缺乏时,此类方法将失去作用。因此,需要一种对标签数据量依赖性更小,准确性更好的软测量方法。
迁移学习作为机器学习领域的一个新颖方向。传统机器学习以及深度学习方法在十分缺乏标签数据的领域中,并不能获得良好的预测效果,然而,迁移学习可以在标签数据量少的领域发挥作用。迁移学习通过模仿人具有的举一反三的能力,从拥有足量标签数据的领域中获取有用知识信息,来帮助缺乏标签数据量的领域进行软测量建模。迁移学习凭借其强大的学习能力已经在语音识别、图像识别领域获得不错的效果。结合化工过程数据的特点,提出一种基于特征迁移学习的多工况过程软测量建模方法,在缺少标签数据的工况中提升软测量模型的预测准确度。
发明内容
为了克服已有的多工况过程软测量方法在标签数据缺少的情况下预测精度较低的不足,本发明提出一种基于特征迁移学习的多工况过程软测量建模方法,通过迁移有用特征信息,建立不同工况下的软测量模型,以有效提升模型的预测准确度。
本发明解决其技术问题所采用的技术方案是:
一种基于特征迁移学习的多工况过程软测量建模方法,所述方法包括以下步骤:
(1)获取连续搅拌釜式反应器的多工况过程变量数据集
运行连续搅拌釜式反应器并模拟多工况过程,获取不同工况下的冷却液体积流量数据qc,反应温度T和产物浓度数据Ca,建立多工况下的过程变量数据集,其中,冷却液体积流量数据qc,反应温度T作为数据集的输入变量,产物浓度数据Ca作为待预测变量;
(2)多工况数据的预处理以及数据集划分
由于冷却液体积流量和反应温度的量纲单位不同,首先需要进行数据标准化处理,从而变成无量纲数据集;其次,将其中一个工况划分为拥有较多标签数据量的训练集和测试集,其余工况均划分为少量标签数据量的训练集和测试集;
(3)不同工况下的数据特征分布匹配迁移训练
建立特征分布变换匹配对抗网络,将不同工况的训练数据送入特征分布匹配对抗网络进行训练;
(4)建立域适应极限学习机(Domain Adaptation ELM,DAELM)、极限学习机(ELM)、支持向量回归(SVR)软测量模型并进行预测评估;
(5)将特征分布匹配好的源域标签数据集与目标域少量标签数据集组合送入三种软测量模型进行训练预测评估;采用均方根误差RMSE和最大绝对误差MAE评价指标对模型进行评估,验证特征迁移学习的预测效果。
进一步,所述步骤(2)的过程为:
步骤2.1:为消除过程变量之间因量纲带来的差异性,对数据进行min-max标准化处理,公式如下:
式中,x'为标准化处理后的数据集;x为所采集的原始数据集;xmin为原始过程变量数据的最小值;xmax为原始过程变量数据的最大值;
步骤2.2:从标准化处理后的不同工况数据集任意选取一个工况作为源域工况数据集,从剩余工况中任意选择一个作为目标域工况数据集;源域工况数据集中训练集全部为标签,源域工况数据集中训练集占总样本数的60%,测试集占总样本数的40%;其余目标域工况数据集中训练集中有标签为10%,无标签为50%,其余目标域工况数据集中训练集占总样本数60%,测试集占样本数的40%。
进一步,所述步骤(3)的过程为:
步骤3.1:建立特征分布对抗变换匹配网络
源域和目标域工况数据形式为和其中和ysi分别为源域中第i个样本的输入变量和输出变量,和yti分别为目标域中第i个样本的输入变量和输出变量,N为源域样本数,M为目标域样本数,m为样本的特征维数,建立一个单层特征变换神经网络,变换过程如下:
建立一个领域对抗判别神经网络,网络用于判别源域数据经特征变换后与目标域数据之间是否不可区分,判别过程如下:
式中,wjk,wkl,wl,bk,bl,b分别为判别网络第一个隐层,第二个隐层和输出层的权重和偏置;σ1,σ2,σ3分别对应层的激活函数relu,relu,sigmoid;z,v分别为第一个隐层的数据特征表示,第二个隐层的数据特征表示;n,K,L分别为样本特征维数,第一个隐层神经元数,第二个隐层神经元数;D(v)为最终判别网络概率输出;
上述特征变换神经网络与领域对抗判别网络,组成特征分布对抗变换匹配网络,循环训练两个网络,使得源域特征经特征变换神经网络变换后,领域对抗判别神经网络无法将其与目标域特征区分开;整个网络使用最小二乘误差作为损失函数进行训练,训练过程损失函数如下:
式中,losstransform(Dt,T,Xs)为变换网络损失函数;lossD(Dt,T,Xs,Xt)为领域对抗判别网络损失函数;T为变换网络函数;Dt为领域对抗判别网络函数;为最大期望值;Xs和Xt分别为源域数据集和目标域数据集;P(xs)为源域数据分布;P(xt)为目标域数据分布;
步骤3.2:网络参数初始设置及参数优化训练
变换网络和领域对抗判别网络初始损失值均设置为lossinit=0.001。每次迭代训练过程中,两个网络分别对源域数据和目标域数据各采样n=3次进行训练调参,所采集的数据量为总数据量的一半;使用自适应矩估计算法(Adam)分别对变换网络和领域对抗判别网络的参数进行优化。
更进一步,所述步骤(4)的过程为:
建立域适应极限学习机软测量模型,在正则化极限学习机(RELM)的基础上进行改进,将源域和目标域的训练误差(最小二乘误差)全部引入正则化极限学习机的优化目标函数中。优化目标函数如下:
式中,分别为源域隐含层的输出,源域样本预测误差以及在源域中第i个样本的输出标签;分别为目标域隐含层的输出,目标域样本的预测误差以及在目标域中第j个辅助指导样本的标签;为源域样本训练的输出权重;NS和NT分别为源域的训练样本数和目标域的训练样本数;CS和CT分别为源域标签训练样本的预测误差惩罚因子,目标域标签训练样本的预测误差惩罚因子;
利用拉格朗日数乘法求解公式如下:
通过拉格朗日乘数法进行求偏导且偏导数为零,最终βS的求解如下:
当训练样本数NS小于隐层神经元数L,即NS<L
当训练样本数NS大于隐层神经元数L,即NS>L,最终βS的求解如下:
本发明利用对抗学习方法对不同工况数据进行特征变换匹配,能够缩小不同工况之间的特征分布差异性,在源域数据特征与目标域数据特征匹配完成后,首先,假设目标域有少量标签数据时,将匹配后的源域标签数据和有限的目标域标签数据组合为新的训练集;其次,假设目标域没有任何标签数据时,将匹配后的源域标签数据作为训练集;上述两种情况分别送入不同的软测量模型进行训练并在目标域测试数据集上进行预测评估。
本发明的有益效果主要表现在:本发明利用对抗学习方法对不同工况数据的特征分布进行匹配,缩小特征分布之间的差异性,有效利用相关工况标签数据辅助对少标签数据的工况进行建模,并有效提升模型的预测准确度。
附图说明
图1是本发明的方法的流程图;
图2是本发明提出的特征匹配对抗训练结构图;
图3a、3b为工况1和工况2的预测误差分布对比图
图4a、4b为工况1和工况3的预测误差分布对比图
图5a、5b为工况3和工况2的预测误差分布对比图。
具体实施方式
下面结合附图对本发明作进一步描述。
参照图1~图5b,一种基于特征迁移学习的多工况过程软测量建模方法,所述方法包括以下步骤:
(1)获取连续搅拌釜式反应器的多工况过程变量数据集
运行连续搅拌釜式反应器并模拟多工况过程,获取不同工况下的冷却液体积流量数据qc,反应温度T和产物浓度数据Ca,建立多工况下的过程变量数据集,其中,冷却液体积流量数据qc,反应温度T作为数据集的输入变量,产物浓度数据Ca作为待预测变量;
(2)多工况数据的预处理以及数据集划分,过程如下:
步骤2.1:为消除过程变量之间因量纲带来的差异性,对数据进行min-max标准化处理,公式如下:
式中,x'为标准化处理后的数据集;x为所采集的原始数据集;xmin为原始过程变量数据的最小值;xmax为原始过程变量数据的最大值;
步骤2.2:从标准化处理后的不同工况数据集任意选取一个工况作为源域工况数据集,从剩余工况中任意选择一个作为目标域工况数据集;源域工况数据集中训练集全部为标签数据,源域工况数据集中训练集占总样本数的60%,测试集占总样本数的40%;其余目标域工况数据集中训练集中有标签数据为10%,无标签数据为50%,其余目标域工况数据集中训练集占总样本数60%,测试集占样本数的40%。
(3)不同工况下的数据特征分布匹配迁移训练,过程如下:
步骤3.1:建立特征分布对抗变换匹配网络
源域和目标域工况数据形式为和其中和ysi分别为源域中第i个样本的输入变量和输出变量,和yti分别为目标域中第i个样本的输入变量和输出变量,N为源域样本数,M为目标域样本数,m为样本的特征维数,建立一个单层特征变换神经网络,变换过程如下:
建立一个领域对抗判别神经网络,网络用于判别源域数据经特征变换后与目标域数据之间是否不可区分,判别过程如下:
式中,wjk,wkl,wl,bk,bl,b分别为判别网络第一个隐层,第二个隐层和输出层的权重和偏置;σ1,σ2,σ3分别对应层的激活函数relu,relu,sigmoid;z,v分别为第一个隐层的数据特征表示,第二个隐层的数据特征表示;n,K,L分别为样本特征维数,第一个隐层神经元数,第二个隐层神经元数;D(v)为最终判别网络概率输出;
上述特征变换神经网络与领域对抗判别网络,组成特征分布对抗变换匹配网络,循环训练两个网络,使得源域特征经特征变换神经网络变换后,领域对抗判别神经网络无法将其与目标域特征区分开;整个网络使用最小二乘误差作为损失函数进行训练,训练过程损失函数如下:
式中,losstransform(Dt,T,Xs)为变换网络损失函数;lossD(Dt,T,Xs,Xt)为领域对抗判别网络损失函数;T为变换网络函数;Dt为领域对抗判别网络函数;为最大期望值;Xs和Xt分别为源域数据集和目标域数据集;P(xs)为源域数据分布;P(xt)为目标域数据分布;
步骤3.2:网络参数初始设置及参数优化训练
变换网络和领域对抗判别网络初始损失值losstransform-init,lossD-init均设置为0.001,每次迭代训练过程中,两个网络分别对源域数据和目标域数据各采样n=3次进行训练调参,所采集的数据量为总数据量的一半;使用自适应矩估计算法(Adam)分别对变换网络和领域对抗判别网络的参数进行优化,
(4)建立域适应极限学习机软测量模型(DAELM)
建立域适应极限学习机软测量模型,在正则化极限学习机(RELM)的基础上进行改进,将源域和目标域的训练误差(最小二乘误差)全部引入正则化极限学习机的优化目标函数中,优化目标函数如下:
式中,分别为源域隐含层的输出,源域样本预测误差以及在源域中第i个样本的输出标签;分别为目标域隐含层的输出,目标域样本的预测误差以及在目标域中第j个辅助指导样本的标签;为源域样本训练的输出权重;NS和NT分别为源域的训练样本数和目标域的训练样本数;CS和CT分别为源域标签训练样本的预测误差惩罚因子,目标域标签训练样本的预测误差惩罚因子,
利用拉格朗日数乘法求解公式如下:
通过拉格朗日乘数法进行求偏导且偏导数为零,最终βS的求解如下:
当训练样本数NS小于隐层神经元数L,即NS<L
当训练样本数NS大于隐层神经元数L,即NS>L,最终βS的求解如下:
(5)将特征分布匹配好的新训练数据送入三种不同的软测量模型训练并进行预测评估;
使用训练好的软测量模型在目标域测试集上进行测试评估,评估指标为RMSE和MAE,计算公式如下:
实例:一种基于特征迁移学习的多工况过程软测量建模方法,包以下步骤:
(1)获取连续搅拌釜式反应器的多工况过程变量数据集
运行连续搅拌釜式反应器并模拟多工况过程,获取不同工况下的冷却液体积流量数据qc,反应温度T和产物浓度数据Ca,建立多工况下的过程变量数据集,其中,冷却液体积流量数据qc和反应温度T作为数据集的输入变量,产物浓度数据Ca作为待预测变量。实验收集三种工况数据集分别为工况1、工况2和工况3,每种工况数据各有60个样本。
(2)数据的预处理以及数据集划分
对数据进行min-max标准化处理,从标准化处理后的不同工况数据集任意选取一个工况作为源域工况数据集,从剩余工况中任意选择一个作为目标域工况数据集;源域工况数据集中训练集(全部为标签数据)占总样本数的60%,测试集占总样本数的40%;其余目标域工况数据集中训练集(其中有标签数据为10%,无标签数据为50%)占总样本数60%,测试集占样本数的40%。
(3)建立特征分布对抗变换匹配网络
任意选取两个工况数据分别作为源域数据和目标域数据,将两类数据送入特征分布对抗变换匹配网络训练,使得源域数据分布变换到目标域数据分布中,最终两者特征分布得到匹配。
(4)无目标域标签数据和有少量目标域标签数据实验预测结果
设置工况1作为源域,工况2作为目标域;工况1作为源域,工况3作为目标域;工况3作为源域,工况2作为目标域等三种情况进行实验。针对无目标域标签数据时,分别使用本发明方法(特征迁移)和支持向量回归(SVR)进行预测,预测误差对比结果如表1a、表2a和表3a所示;针对有少量目标域标签数据(6个标签数据)分别使用本发明方法(特征迁移)、极限学习机(ELM)和域适应极限学习机(DAELM)进行预测,预测误差对比结果如表1b、表2b和表3b。
如图3a~3b所示,工况1和工况2分别作为源域和目标域,将本发明方法与传统方法预测误差分布进行对比;如图4a~4b所示,工况1和工况3分别作为源域和目标域,将本发明方法与传统方法预测误差分布进行对比;如图5a~5b所示,工况3和工况2分别作为源域和目标域,将本发明方法与传统方法预测误差分布进行对比。从上述对比结果可以看出,本发明方法的预测准确度相比于传统软测量模具有明显优势,能够说明在多工况过程建模中,将不同工况数据特征进行匹配来提取共享特征信息,能够提升软测量模型的预测准确度。
表1a
表1b
表2a
表2b
表3a
表3b
本发明方法利用特征迁移学习方法将不同工况数据特征进行匹配,能够提升特定工况在缺少足量标签数据时所建立的软测量模型预测精度,具有普遍性和通用性。
本说明书实施例所述的内容仅仅是对发明构思的实现形式的列举,本发明的保护范围不应当被视为仅限于实施例所陈述的具体形式,本发明的保护范围也及于本领域技术人员根据本发明构思所能够想到的等同技术手段。
Claims (2)
1.一种基于特征迁移学习的多工况过程软测量方法,其特征在于,所述方法包括以下步骤:
(1)获取连续搅拌釜式反应器的多工况过程变量数据集
运行连续搅拌釜式反应器并模拟多工况过程,获取不同工况下的冷却液体积流量数据qc,反应温度T和产物浓度数据Ca,建立多工况下的过程变量数据集,其中,冷却液体积流量数据qc,反应温度T作为数据集的输入变量,产物浓度数据Ca作为待预测变量;
(2)多工况数据的预处理以及数据集划分
由于冷却液体积流量和反应温度的量纲单位不同,首先需要进行数据标准化处理,从而变成无量纲数据集;其次,将其中一个工况划分为拥有较多标签数据量的训练集和测试集,其余工况均划分为少量标签数据量的训练集和测试集;
(3)不同工况下的数据特征分布匹配迁移训练
建立特征分布变换匹配对抗网络,将不同工况的训练数据送入特征分布匹配对抗网络进行训练;
(4)建立域适应极限学习机、极限学习机、支持向量回归(SVR)软测量模型并进行预测评估;
(5)将特征分布匹配好的源域标签数据集与目标域少量标签数据集组合送入三种软测量模型进行训练预测评估;采用均方根误差RMSE和最大绝对误差MAE评价指标对模型进行评估,验证特征迁移学习的预测效果;
所述步骤(3)的过程为:
步骤3.1:建立特征分布对抗变换匹配网络
源域和目标域工况数据形式为和其中和ysi分别为源域中第i个样本的输入变量和输出变量,和yti分别为目标域中第i个样本的输入变量和输出变量,N为源域样本数,M为目标域样本数,m为样本的特征维数,建立一个单层特征变换神经网络,变换过程如下:
建立一个领域对抗判别神经网络,网络用于判别源域数据经特征变换后与目标域数据之间是否不可区分,判别过程如下:
式中,wjk,wkl,wl,bk,bl,b分别为判别网络第一个隐层,第二个隐层和输出层的权重和偏置;σ1,σ2,σ3分别对应层的激活函数relu,relu,sigmoid;z,v分别为第一个隐层的数据特征表示,第二个隐层的数据特征表示;n,K,L分别为样本特征维数,第一个隐层神经元数,第二个隐层神经元数;D(v)为最终判别网络概率输出;
上述特征变换神经网络与领域对抗判别网络,组成特征分布对抗变换匹配网络,循环训练两个网络,使得源域特征经特征变换神经网络变换后,领域对抗判别神经网络无法将其与目标域特征区分开,整个网络使用最小二乘误差作为损失函数进行训练,训练过程损失函数如下:
式中,losstransform(Dt,T,Xs)为变换网络损失函数;lossD(Dt,T,Xs,Xt)为领域对抗判别网络损失函数;T为变换网络函数;Dt为领域对抗判别网络函数;为最大期望值;Xs和Xt分别为源域数据集和目标域数据集;P(xs)为源域数据分布;P(xt)为目标域数据分布;
步骤3.2:网络参数初始设置及参数优化训练
变换网络和领域对抗判别网络初始损失值均设置为lossinit=0.001每次迭代训练过程中,两个网络分别对源域数据和目标域数据各采样n=3次进行训练调参,所采集的数据量为总数据量的一半;使用自适应矩估计算法分别对变换网络和领域对抗判别网络的参数进行优化;
所述步骤(4)的过程为:
建立域适应极限学习机软测量模型,在正则化极限学习机的基础上进行改进,将源域和目标域的训练误差全部引入正则化极限学习机的优化目标函数中,优化目标函数如下:
式中,分别为源域隐含层的输出,源域样本预测误差以及在源域中第i个样本的输出标签;分别为目标域隐含层的输出,目标域样本的预测误差以及在目标域中第j个辅助指导样本的标签;为源域样本训练的输出权重;NS和NT分别为源域的训练样本数和目标域的训练样本数;CS和CT分别为源域标签训练样本的预测误差惩罚因子,目标域标签训练样本的预测误差惩罚因子;
利用拉格朗日数乘法求解公式如下:
通过拉格朗日乘数法进行求偏导且偏导数为零,最终βS的求解如下:
当训练样本数NS小于隐层神经元数L,即NS<L
当训练样本数NS大于隐层神经元数L,即NS>L,最终βS的求解如下:
2.如权利要求1所述的基于特征迁移学习的多工况过程软测量方法,其特征在于,所述步骤(2)的过程为:
步骤2.1:对数据进行min-max标准化处理,公式如下:
式中,x'为标准化处理后的数据集;x为所采集的原始数据集;xmin为原始过程变量数据的最小值;xmax为原始过程变量数据的最大值;
步骤2.2:从标准化处理后的不同工况数据集任意选取一个工况作为源域工况数据集,从剩余工况中任意选择一个作为目标域工况数据集;源域工况数据集中训练集全部为标签,源域工况数据集中训练集占总样本数的60%,测试集占总样本数的40%;其余目标域工况数据集中训练集中有标签为10%,无标签为50%,其余目标域工况数据集中训练集占总样本数60%,测试集占样本数的40%。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810531977.4A CN109060001B (zh) | 2018-05-29 | 2018-05-29 | 一种基于特征迁移学习的多工况过程软测量建模方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810531977.4A CN109060001B (zh) | 2018-05-29 | 2018-05-29 | 一种基于特征迁移学习的多工况过程软测量建模方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109060001A CN109060001A (zh) | 2018-12-21 |
CN109060001B true CN109060001B (zh) | 2021-02-26 |
Family
ID=64819755
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810531977.4A Active CN109060001B (zh) | 2018-05-29 | 2018-05-29 | 一种基于特征迁移学习的多工况过程软测量建模方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109060001B (zh) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109669009A (zh) * | 2019-01-10 | 2019-04-23 | 重庆邮电大学 | 基于域校正的域自适应极限学习机电子鼻漂移抑制方法 |
CN109948858B (zh) * | 2019-03-25 | 2023-09-26 | 东北大学 | 基于数据驱动的工况识别方法 |
CN109905724A (zh) * | 2019-04-19 | 2019-06-18 | 广州虎牙信息科技有限公司 | 直播视频处理方法、装置、电子设备及可读存储介质 |
CN110458598A (zh) * | 2019-07-04 | 2019-11-15 | 阿里巴巴集团控股有限公司 | 场景适配方法、装置及电子设备 |
CN110322932A (zh) * | 2019-07-11 | 2019-10-11 | 重庆科技学院 | 三嗪酮生产过程反应釜温度软测量方法及系统 |
CN110362933B (zh) * | 2019-07-17 | 2022-07-01 | 哈尔滨工业大学 | 基于迁移学习的飞机辅助动力装置寿命预测方法 |
CN110705029B (zh) * | 2019-09-05 | 2021-09-07 | 西安交通大学 | 一种基于迁移学习的振荡扑翼能量采集系统流场预测方法 |
CN111027678B (zh) * | 2019-12-04 | 2023-08-04 | 湃方科技(北京)有限责任公司 | 一种数据迁移方法及装置 |
CN111060318B (zh) * | 2020-01-09 | 2021-12-28 | 山东科技大学 | 一种基于深度对抗迁移网络的轴承故障诊断方法 |
CN111415032B (zh) * | 2020-03-03 | 2022-04-29 | 东华大学 | 基于迁移学习的elm-ae的聚酯纤维原丝生产性能预测方法 |
CN112001421B (zh) * | 2020-07-27 | 2022-06-10 | 浙江大学 | 一种工业控制回路状态识别方法 |
CN112766596B (zh) * | 2021-01-29 | 2024-04-16 | 苏州思萃融合基建技术研究所有限公司 | 建筑能耗预测模型的构建方法、能耗预测方法及装置 |
CN112836432A (zh) * | 2021-02-07 | 2021-05-25 | 浙江工业大学 | 基于迁移学习的室内颗粒悬浮物浓度预测方法 |
CN113570147B (zh) * | 2021-07-30 | 2023-10-10 | 华中科技大学 | 一种薄壁件多工况加工误差快速预测方法及设备 |
CN113657486B (zh) * | 2021-08-16 | 2023-11-07 | 浙江新再灵科技股份有限公司 | 基于电梯图片数据的多标签多属性分类模型建立方法 |
CN113570161B (zh) * | 2021-08-29 | 2024-05-24 | 浙江工业大学 | 基于宽度迁移学习的搅拌釜反应物浓度预测模型构建方法 |
CN113792514B (zh) * | 2021-09-18 | 2023-11-24 | 上海交通大学 | 一种基于迁移学习的化学机械抛光芯片表面高度预测模型建模方法 |
CN114580305B (zh) * | 2022-03-28 | 2023-04-07 | 浙江工业大学 | 一种海洋浮标运动特性的域适应迁移建模与预测方法 |
CN116484723B (zh) * | 2023-03-31 | 2024-05-31 | 昆明理工大学 | 一种基于动态多层域自适应的发酵过程软测量建模方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8345962B2 (en) * | 2007-11-29 | 2013-01-01 | Nec Laboratories America, Inc. | Transfer learning methods and systems for feed-forward visual recognition systems |
CN104537415A (zh) * | 2014-12-02 | 2015-04-22 | 北京化工大学 | 一种基于压缩感知和dros-elm的非线性过程工业故障预测及识别方法 |
CN105425583A (zh) * | 2015-11-05 | 2016-03-23 | 浙江大学 | 基于协同训练lwpls的青霉素生产过程的控制方法 |
CN105913079A (zh) * | 2016-04-08 | 2016-08-31 | 重庆大学 | 基于目标域迁移极限学习的电子鼻异构数据识别方法 |
CN106803124A (zh) * | 2017-01-21 | 2017-06-06 | 中国海洋大学 | 基于流形正则和范数正则的领域迁移极限学习机方法 |
CN108051233A (zh) * | 2017-12-16 | 2018-05-18 | 太原理工大学 | 一种球磨机负荷参数软测量方法 |
-
2018
- 2018-05-29 CN CN201810531977.4A patent/CN109060001B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8345962B2 (en) * | 2007-11-29 | 2013-01-01 | Nec Laboratories America, Inc. | Transfer learning methods and systems for feed-forward visual recognition systems |
CN104537415A (zh) * | 2014-12-02 | 2015-04-22 | 北京化工大学 | 一种基于压缩感知和dros-elm的非线性过程工业故障预测及识别方法 |
CN105425583A (zh) * | 2015-11-05 | 2016-03-23 | 浙江大学 | 基于协同训练lwpls的青霉素生产过程的控制方法 |
CN105913079A (zh) * | 2016-04-08 | 2016-08-31 | 重庆大学 | 基于目标域迁移极限学习的电子鼻异构数据识别方法 |
CN106803124A (zh) * | 2017-01-21 | 2017-06-06 | 中国海洋大学 | 基于流形正则和范数正则的领域迁移极限学习机方法 |
CN108051233A (zh) * | 2017-12-16 | 2018-05-18 | 太原理工大学 | 一种球磨机负荷参数软测量方法 |
Non-Patent Citations (1)
Title |
---|
基于迁移学习的径向基函数神经网络学习;郑雪辉 等;《计算机工程与应用》;20150819;第52卷(第5期);第6-10及21页 * |
Also Published As
Publication number | Publication date |
---|---|
CN109060001A (zh) | 2018-12-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109060001B (zh) | 一种基于特征迁移学习的多工况过程软测量建模方法 | |
Qian et al. | Stock prediction based on LSTM under different stability | |
CN112001270B (zh) | 基于一维卷积神经网络的地面雷达自动目标分类识别方法 | |
CN110909926A (zh) | 基于tcn-lstm的太阳能光伏发电预测方法 | |
CN111160176B (zh) | 基于融合特征的一维卷积神经网络地面雷达目标分类方法 | |
CN111126575A (zh) | 基于机器学习的气体传感器阵列混合气体检测方法及装置 | |
Ma et al. | Degradation prognosis for proton exchange membrane fuel cell based on hybrid transfer learning and intercell differences | |
CN111368920A (zh) | 基于量子孪生神经网络的二分类方法及其人脸识别方法 | |
CN111768000A (zh) | 在线自适应微调深度学习的工业过程数据建模方法 | |
CN111079856B (zh) | 一种基于csjitl-rvm的多时段间歇过程软测量建模方法 | |
CN113780242A (zh) | 一种基于模型迁移学习的跨场景水声目标分类方法 | |
CN110245398B (zh) | 空气预热器转子热变形量的软测量深度学习方法 | |
CN110045606A (zh) | 一种用于分布式参数系统在线建模的增量时空学习方法 | |
CN111222689A (zh) | 基于多尺度时间特征的lstm负荷预测方法、介质及电子装置 | |
CN112014790A (zh) | 基于因子分析的近场源定位方法 | |
CN116975645A (zh) | 一种基于vae-mrcnn的工业过程软测量建模方法 | |
CN112001115A (zh) | 一种半监督动态软测量网络的软测量建模方法 | |
CN113780420B (zh) | 基于gru-gcn的变压器油中溶解气体浓度预测方法 | |
CN114596726B (zh) | 基于可解释时空注意力机制的停车泊位预测方法 | |
CN114239397A (zh) | 基于动态特征提取与局部加权深度学习的软测量建模方法 | |
CN114004346A (zh) | 基于门控堆叠同构自编码器的软测量建模方法及存储介质 | |
CN116484275B (zh) | 基于自适应时空图卷积神经网络的铝电解阳极效应监测方法 | |
CN106599391B (zh) | 基于三角形角度值动态加权的关联向量机软测量建模方法 | |
CN107704944A (zh) | 一种基于信息论学习的股市波动区间预测方法 | |
CN114707424B (zh) | 基于质量相关慢特征分析算法的化工过程软测量方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |