CN109902378B

CN109902378B - 基于多模型迁移和bma理论的复杂工业过程低成本建模方法

Info

Publication number: CN109902378B
Application number: CN201910138294.7A
Authority: CN
Inventors: 褚菲; 代邦武; 丁珮宽; 代伟; 杨春雨; 马小平
Original assignee: China University of Mining and Technology CUMT
Current assignee: China University of Mining and Technology CUMT
Priority date: 2019-02-25
Filing date: 2019-02-25
Publication date: 2023-05-30
Anticipated expiration: 2039-02-25
Also published as: CN109902378A

Abstract

本发明公开了一种基于多模型迁移和BMA理论的复杂工业过程低成本建模方法，属于工业生产过程构建性能预测模型技术领域。本发明利用拉丁超立方采集新工业过程建模的初始数据集；然后确定相似旧工业过程模型，利用贝叶斯模型平均理论评估旧工业过程模型对新工业过程建模的权重，得到旧工业过程的融合输出；最后通过多模型迁移策略迁移旧工业过程的有用信息并结合少量新工业过程数据完成新工业过程建模。同时设计了基于嵌套拉丁超立方设计的序贯实验采集新工业过程的最小建模数据集。本发明有效解决了复杂工业过程建模成本高、建模周期长的问题，降低了建模成本，加快了建模速度，提高了建模精度。

Description

基于多模型迁移和BMA理论的复杂工业过程低成本建模方法

技术领域

本发明提出一种基于多模型迁移和贝叶斯模型平均理论的复杂工业过程低成本建模方法，属于工业生产过程构建性能预测模型技术领域。

背景技术

随着市场竞争的日益激烈，以低成本快速准确地建立工业过程的性能预测模型已经是工业生产领域中的一种趋势。然而由于工业过程运行数据不足，传统的建模方法在有限的预算和时间难以快速准确的建立过程性能预测模型，而设计实验采集数据耗时费力，又增加过程建模成本。为了解决此问题，基于多模型方法建立新工业过程预测模型的方法应运而生。Cheng Lin等人对电动车电池建立了Thevenin模型，双极化模型，3阶RC模型评估其充电状态；Nandola等人对非线性混合模型分别建立多个线性子模型对其进行优化控制。

然而这两种方式实质上都只关注于一个过程而不是多个相似的过程，因此忽略了多个相似工业过程之间有用的信息。

发明内容

为了实现上述目的，本发明提供了一种基于多模型迁移和BMA理论的复杂工业过程低成本建模方法，此处BMA理论指贝叶斯模型平均理论(Bayesian Model Averaging)。工业生产中存在大量相似的过程并且它们之间是相互关联的，尽管它们在尺寸、结构等方面存在差异，但是它们的内在机理是相似的，它们包含的信息可以指导新工业过程的建模。本发明在对新工业过程进行建模时，充分利用相似工业过程的有用信息，减少新工业过程建模阶段中对其运行数据的依赖，有效解决了新工业过程建模成本高、建模周期长的问题，从而加快新工业过程的建模速度，同时将新工业过程建模所需要的数据量尽可能降至最低。

本发明是通过如下技术方案实现的：一种基于多模型迁移和BMA理论的复杂工业过程低成本建模方法，其具体步骤如下：

A、选取已有相似旧工业过程模型M_i(x),i＝1,…,N；

B、利用拉丁超立方采样方法，采集新工业过程建模初始数据集，同时映射新工业过程数据至旧工业过程模型的可行区间；

C、用贝叶斯模型平均理论评估旧工业过程模型对新工业过程建模的权重，获得旧工业过程模型融合输出为

D、多模型迁移策略，训练新工业过程模型。将旧工业过程模型融合输出y₁和新工业过程输入数据X作为多模型迁移策略的输入数据，利用取最小二乘支持向量机(LeastSquares Support Vector Machine，LSSVM)算法训练新工业过程模型，获得新工业过程模型输出y₂，完成新工业过程建模；

E、模型验证，若步骤D所得模型满足实验停止条件，则模型迁移训练结束，否则，利用嵌套拉丁超立方设计来采集新工业过程样本，继续训练新工业过程模型，直至满足实验停止条件；

所述步骤A包含：根据“25％规则”(G.E.Box,J.S.Hunter and W.G.Hunter,Statistics for experimenters:design,innovation,and discovery,vol.2,New York,NY,USA:Wiley,2005.)确定初始数据集大小n₀，即n₀≤0.25*T，T为实验预算；利用拉丁超立方采样方法采集n₀组新工业过程数据，并将新工业过程数据映射到旧工业过程模型所对应的区间内，公式如下：

其中x_o和x_n分别对应旧工业过程和新工业过程的输入，x_o,min和x_o,max是旧工业过程运行区间下限和上限，x_n,min和x_n,max是新工业过程运行区间的下限和上限。

所述步骤C包含：对于选定的N个相似旧工业过程模型M₁,M₂,...,M_N和训练数据集D＝{(Y₁,x₁),(Y₂,x₂),…,(Y_n,x_n)}，输出值Y的概率分布函数可以被描述为：

其中p_i(Y|M_i,D)是在给定第i个旧工业过程模型M_i和训练数据集D下Y的后验分布，p(M_i|D)是旧工业过程模型M_i的权重，即w_i＝p(M_i|D)且

从而根据贝叶斯模型平均理论得到预测输出Y的后验均值和方差是：

利用期望最大化(Expectation-Maximization，EM)算法估计w_i的值，步骤如下：

1)设置t＝0，计算初始值：

2)计算初始似然函数值：

其中gp(x)是高斯函数；

3)设置t＝t+1，计算

4)计算权值：

更新似然函数值；

5)计算δ＝l(w,σ)^t-l(w,σ)^t-1，如果δ≤δ₀就结束算法。否则，返回第3)步。

根据获得的w_i值，可得到旧工业过程模型融合输出为

/>

所述步骤E中嵌套拉丁超立方设计为：假设初始实验中通过LHD运行n₀次采集的数据序列为

通过NLHD运行n₁次获得更大数据序列B的简要步骤如下：

1)计算

其中/>

表示大于等于n₁x_1k的最小整数，k＝1,2,…,d；

2)从

绘制一个全排列/>

其中/>

表示a_k在/>

中的相对补集；

3)通过

构建矩阵C，其中i＝1,…,n₁-n₀,k＝1,…,d,u_ik是U_[0,1)下的独立同分布；

4)运行n₁次逐行相加A和C得到B；

所述步骤E中实验停止条件为：选取交叉验证误差(Mean Cross ValidationError，Mean_CVE)作为阈值来判断数据采集循环继续与否,具体过程如下：

1)通过LHD采集初始的n₀个实验数据；

2)设置t＝0；

3)使用n_t个新工业过程数据训练迁移模型；

4)计算Mean_CVE，

其中Y_i是新工业过程的真值，y_i′是由数据点(x_i,Y_i)以外的数据建立的迁移模型的预测值；

5)如果Mean_CVE小于设定值则停止迁移模型训练，否则，令t＝t+1,通过嵌套拉丁超立方方法采集(n_t+1-n_t)组新工业过程数据，扩大训练数据集

返回步骤3)，直至Mean_CVE小于设定值。

所述步骤E中模型验证为：利用均方根误差(Root Mean Square Error，RMSE)和平均相对误差(Mean Relative Error,MRE)来评估迁移模型的有效性，公式如下：

其中，N是测试数据的数量，y_i是预测模型的输出，Y_i是新工业过程的真实输出。

本发明的有益效果是：

本发明通过采用了一种多模型融合迁移策略来为新工业过程建立性能预测模型，充分利用了工业中现有的相似旧工业过程的性能预测模型，利用贝叶斯模型平均理论得到最优的旧工业过程模型融合权值，并在尽可能少的运行数据支持下，利用最小二乘支持向量机对相似旧工业过程中的公共部分进行模型迁移训练，从而加快新工业过程的建模速度，降低了建模成本，获得符合精度要求的预测模型。同时该方法比单模型迁移和纯LSSVM建模方法需要的实验数据信息更少，预测精度更高，几乎接近实际输出，为复杂工业过程建模降低了大量成本。

附图说明

下面结合附图和具体实例对本发明做进一步描述：

图1是多模型迁移策略示意图；

图2是多模型迁移方法中旧压缩机B，C和D的融合权重；

图3是多模型迁移模型，单模型迁移模型和纯LSSVM模型的压力比的预测结果；

图4是多模型迁移模型，单模型迁移模型和纯LSSVM模型的压力比的RMSE。

具体实施方式

下面结合附图及具体实施例对本发明进行详细说明。

如图1所示，一种基于多模型迁移和BMA理论的复杂工业过程低成本建模方法，在对新工业过程进行建模时，充分利用了已有相似工业过程的有用信息，同时将新工业过程建模所需要的数据量降至最低，其具体步骤如下：

A、选取已有相似旧工业过程模型M_i(x),i＝1,…,N；

B、利用拉丁超立方(Latin Hypercube Design，LHD)采样方法，采集新工业过程建模初始数据集，同时映射新工业过程数据至旧工业过程模型的可行区间；

E、模型验证，若步骤D所得模型满足实验停止条件，则模型迁移训练结束，否则，利用嵌套拉丁超立方设计(Nested Latin Hypercube Design，NLHD)来采集新工业过程样本，继续训练新工业过程模型，直至满足实验停止条件。

其中x_o和x_n分别对应旧工业过程和新工业过程的输入，x_o,min和x_o,max是旧工业过程运行区间下限和上限，x_n,min和x_n,max是新工业过程运行区间的下限和上限。具体实施例中的新旧压缩机稳定运行区间如表1所示(A是新压缩机，B、C、D是旧压缩机)，

表1.新旧压缩机稳定运行区间

1)设置t＝0，计算初始值：

2)计算初始似然函数值：

其中gp(x)是高斯函数；

3)设置t＝t+1，计算

4)计算权值：

更新似然函数值；

根据获得的w_i值，可得到旧工业过程模型融合输出为

实施例中旧压缩机融合权值结果如图1所示。/>

通过NLHD运行n₁次获得更大数据序列B的简要步骤如下：

1)计算

其中/>

表示大于等于n₁x_1k的最小整数，k＝1,2,…,d；

2)从

绘制一个全排列/>

其中/>

表示a_k在/>

中的相对补集；

3)通过

4)运行n₁次逐行相加A和C得到B；

1)通过LHD采集初始的n₀个实验数据；

2)设置t＝0；

3)使用n_t个新工业过程数据训练迁移模型；

4)计算Mean_CVE，

返回步骤3)，直至Mean_CVE小于设定值。

为了验证该方法的效果，利用所采集的实验数据样本分别建立基于多模型迁移的新压缩机性能预测模型、基于单模型迁移的新压缩机性能预测模型以及基于纯LSSVM方法的新压缩机性能预测模型，并将三个模型的预测压比与实际输出进行对比，结果如图3可见，基于多模型迁移的建模方法预测精度要比其他两种建模方法预测精度高很多，具体数值的Mean_CVE如表2可见：随着新压缩机运行数据点的增加，三种模型的Mean_CVE都在逐渐的减少，所提方法在运行次数为20时满足实验停止的条件，其Mean_CVE＝0.041<0.05，而其他两种方法的Mean_CVE都达不到实验停止要求。

表2.纯LSSVM、单目标迁移和多目标迁移模型的输出值的Mean_CVE

表3列出了多模型迁移模型，单模型迁移模型和LSSVM模型的压力比的RMSE和MRE，图4为三种模型的压力比的RMSE曲线，从图表中可以看出，多模型方法的RMSE和MRE分别为0.0274和0.16％，均小于其他两种方法。

表3.三种建模方法预测的压力比的RMSE和MRE

由上述分析可知，本发明通过采用了一种多模型融合迁移策略来为新工业过程建立性能预测模型，充分利用了工业中现有的相似旧工业过程的性能预测模型，利用贝叶斯模型平均理论得到最优的旧工业过程模型融合权值，并在尽可能少的新压缩机运行数据支持下，利用最小二乘支持向量机对相似旧工业过程中的公共部分进行模型迁移训练，从而加快新工业过程的建模速度，降低了建模成本，获得符合精度要求的预测模型。同时该方法比单模型迁移和纯LSSVM建模方法需要的实验数据信息更少，预测精度更高，几乎接近实际输出，为工业过程建模降低了大量成本。

Claims

1.一种基于多模型迁移和BMA理论的复杂工业过程低成本建模方法，其特征在于：采用多套相同的生产设备，各自的内部参数不同，进行多个相似的生产过程，其中有N个生产过程已知预测模型，认定其为旧工业过程，另有一生产过程未知预测模型，认定为新工业过程；旧工业过程运行时间长，数据多且预测模型准确，新工业过程是全新的生产过程，数据少；新工业过程输入数据为X，旧工业过程预测模型为M_i(x),i＝1,…,N；具体建模方法如下：

A、选取已有相似旧工业过程模型M_i(x),i＝1,…,N；

D、多模型迁移策略，训练新工业过程模型；将旧工业过程模型融合输出y₁和新工业过程输入数据X作为多模型迁移策略的输入数据，利用取最小二乘支持向量机(Least SquaresSupport Vector Machine，LSSVM)算法训练新工业过程模型，获得新工业过程模型输出y₂，完成新工业过程建模；

E、模型验证，若步骤D所得模型满足实验停止条件，则模型迁移训练结束，否则，利用嵌套拉丁超立方设计来采集新工业过程样本，继续训练新工业过程模型，直至满足实验停止条件。

2.根据权利要求1所述的基于多模型迁移和BMA理论的复杂工业过程低成本建模方法，其特征在于，所述步骤A包含：根据“25％规则”确定初始数据集大小n₀，即n₀≤0.25*T，T为实验预算；利用拉丁超立方采样方法采集n₀组新工业过程数据，并将新工业过程数据映射到旧工业过程模型所对应的区间内，公式如下：