CN115392102A

CN115392102A - 能耗预测模型的建立方法及装置、能耗预测方法及系统

Info

Publication number: CN115392102A
Application number: CN202110565330.5A
Authority: CN
Inventors: 李西良; 范协诚; 邓佑刚; 盛鸿飞; 张赵波; 赵铁成
Original assignee: Xinjiang Xinte Crystal Silicon High Tech Co ltd; Xinte Energy Co Ltd
Current assignee: Xinjiang Xinte Crystal Silicon High Tech Co ltd; Xinte Energy Co Ltd
Priority date: 2021-05-24
Filing date: 2021-05-24
Publication date: 2022-11-25

Abstract

本发明公开一种能耗预测模型的建立方法，包括：对多晶硅还原生产的能耗数据及能耗影响因素进行预处理，得到预处理数据；利用最小二乘支持向量机LSSVM对所述预处理数据进行建模，得到预测模型；利用麻雀搜索算法SSA对所述预测模型的参数进行优化，得到目标能耗预测模型。相应地，还提供能耗预测模型的建立装置、能耗预测方法及系统。使用本发明的能耗预测模型的建立方法得到的能耗预测模型，可提高多晶硅还原生产的能耗值的预测精度。

Description

能耗预测模型的建立方法及装置、能耗预测方法及系统

技术领域

本发明属于多晶硅技术领域，具体涉及一种能耗预测模型的建立方法及装置、能耗预测方法及系统。

背景技术

多晶硅是光伏设备的主要原材料，近年来对多晶硅的需求量增长迅速。还原炉是生产多晶硅的重要设备，其还原电能耗约占生产综合电能耗的60％，约占综合生产成本的30％。采取一定的措施来减少还原炉的能耗已经成为多晶硅生产研究的热点。

由于多晶硅还原炉沉积生产过程是一个随机、动态、复杂的过程，其能耗每时每刻都在变化，在生产过程中很难确定下一时刻的能耗情况，这种复杂的生产过程给工艺人员的可控管理带来了极大的挑战。目前，对于多晶硅生产过程中还原炉能耗的研究包括提高还原工艺水平和改进生产设备，以实现节能优化，或者采用能耗预测模型以实现能耗预测，但存在预测模型的研究相对较少、预测模型的预测精度不高等问题。

发明内容

本发明要解决的技术问题是针对现有技术存在的上述不足，提供一种能耗预测模型的建立方法及装置、能耗预测方法及系统，使用本发明的能耗预测模型，可提高多晶硅还原生产的能耗值的预测精度。

第一方面，本发明实施例提供一种能耗预测模型的建立方法，包括：对多晶硅还原生产的能耗数据及能耗影响因素进行预处理，得到预处理数据；利用最小二乘支持向量机LSSVM对所述预处理数据进行建模，得到预测模型；利用麻雀搜索算法SSA对所述预测模型的参数进行优化，得到目标能耗预测模型。

优选地，所述对多晶硅还原生产的能耗数据及能耗影响因素进行预处理，得到预处理数据，具体包括：所述预处理数据包括第一预处理数据和第二预处理数据，利用变分模态分解VMD将多晶硅还原生产的能耗数据构成的序列分解为K个具有不同的中心频率和带宽的模态分量，以构成第一预处理数据，其中，K为正整数且K大于1；根据观察中心频率确定K的取值，利用主成分分析算法PCA对多晶硅还原生产的能耗影响因素进行筛选，得到筛选后的能耗影响因素，以构成第二预处理数据。

优选地，所述利用最小二乘支持向量机LSSVM对所述预处理数据进行建模，得到预测模型，具体包括：利用最小二乘支持向量机LSSVM分别对第一预处理数据和第二预处理数据进行建模，得到K个预测子模型，K个预测子模型构成所述预测模型。

优选地，所述利用麻雀搜索算法SSA对所述预测模型的参数进行优化，得到目标能耗预测模型，具体包括：利用麻雀搜索算法SSA分别对K个预测子模型的参数寻找全局最优值，得到K个目标能耗预测子模型，以构成所述目标能耗预测模型，其中，所述参数包括惩罚系数和核函数宽度。

优选地，所述利用麻雀搜索算法SSA分别对K个预测子模型的参数寻找全局最优值，得到K个目标能耗预测子模型，具体包括：针对各个预测子模型分别设置SSA参数，所述SSA参数包括麻雀的种群大小、迭代次数阈值；初始化麻雀位置并计算麻雀个体适应度值，选择最优个体适应度值作为全局最优值；根据SSA迭代更新麻雀种群中发现者、追随者、预警者位置并判断麻雀是否进行反捕食行为；迭代更新个体最优值和全局最优值，当迭代次数等于迭代次数阈值时，输出SSA寻找的全局最优值，全局最优值包括惩罚系数和核函数宽度；将输出的全局最优值赋值给相应的预测子模型，得到与所述预测子模型相应的目标能耗预测子模型。

第二方面，本发明实施例还提供一种能耗预测方法，包括：根据第一方面所述的能耗预测模型的建立方法得到目标能耗预测模型；利用所述目标能耗预测模型得到多晶硅还原生产的能耗预测值，以对多晶硅还原生产的能耗进行预测。

优选地，根据第一方面所述的能耗预测模型的建立方法得到目标能耗预测模型，利用所述目标能耗预测模型得到多晶硅还原生产的能耗预测值，具体包括：根据目标能耗预测模型得到K个目标预测子模型；获取多晶硅还原生产的能耗数据及筛选后的能耗影响因素；利用变分模态分解将多晶硅还原生产的能耗数据构成的序列分解为K个具有不同的中心频率和带宽的模态分量；将分解得到的K个模态分量及筛选后的能耗影响因素分别输入K个目标能耗预测子模型进行预测，得到K个能耗子预测值；将K个能耗子预测值叠加，得到多晶硅还原生产的能耗预测值。

优选地，在得到多晶硅还原生产的能耗预测值之后，能耗预测方法还包括：利用RMSE和/或MAPE和/或MAE评估能耗预测值的精确度。

第三方面，本发明实施例还提供一种能耗预测模型的建立装置，包括预处理模块，建模模块和模型优化模块。预处理模块，用于对多晶硅还原生产的能耗数据及能耗影响因素进行预处理，得到预处理数据。建模模块，与预处理模块连接，用于利用最小二乘支持向量机LSSVM对所述预处理数据进行建模，得到预测模型。模型优化模块，与建模模块连接，用于利用麻雀搜索算法SSA对所述预测模型的参数进行优化，得到目标能耗预测模型。

第四方面，本发明实施例还提供一种能耗预测系统，包括第三方面所述的能耗预测模型的建立装置、和预测模块。能耗预测模型的建立装置，用于建立目标能耗预测模型。预测模块，与能耗预测模型的建立装置连接，用于利用目标能耗预测模型得到多晶硅还原生产的能耗预测值，以对多晶硅还原生产的能耗进行预测。

本发明的能耗预测模型的建立方法及装置、能耗预测方法及系统，利用最小二乘支持向量机LSSVM对多晶硅还原生产的能耗数据及能耗影响因素进行预测模型的建模，进一步利用麻雀搜索算法SSA对所建立的预测模型进行参数优化。由于LSSVM相比于支持向量机SVM具有更高的预测精度，更快的预测速度，及更少的待优化参数等优势。且SSA具有比粒子群算法PSO、引力搜索算法GSA等参数优选方法具有更优秀的精度、收敛速度、稳定性和鲁棒性等优势。因此，综合LSSVM和SSA在预测精度方面的优势所建立的预测模型，可大幅提高能耗值的预测精度。

附图说明

图1：为本发明实施例1的一种能耗预测模型的建立方法的流程图；

图2：为本发明实施例1的另一种能耗预测模型的建立方法的流程图；

图3：为本发明实施例1的多晶硅还原生产能耗数据构成的序列的示意图；

图4：为本发明实施例1的VMD多晶硅生产过程能耗分量示意图；

图5：为本发明实施例1的能耗影响因素的各主成分的贡献率柱状示意图。

具体实施方式

为使本领域技术人员更好地理解本发明的技术方案，下面结合附图和实施例对本发明作进一步详细描述。

实施例1：

如图1、图2所示，本实施例提供一种能耗预测模型的建立方法，可应用于多晶硅还原生产或其他产品工艺生产中的能耗预测模型的建立，本实施例以应用于多晶硅还原生产时进行能耗预测模型的建立进行说明。能耗预测模型的建立方法包括：

步骤101，对多晶硅还原生产的能耗数据及能耗影响因素进行预处理，得到预处理数据。

本实施例中，多晶硅还原生产的能耗数据指多晶硅还原生产过程中的电能耗数据。可通过多晶硅生产企业的GBAI-ICS系统平台收集多晶硅还原生产的预设时长内的每日能耗数据用于建立能耗预测模型。能耗影响因素指多晶硅还原生产过程中对能耗产生影响的因素，例如H₂(氢气)流量、TCS(三氯氢硅)流量、尾气温度、尾气压力、混合气温度、相电流和相电压等。可收集多晶硅还原生产的预设时长内的每日能耗数据所对应的能耗影响因素的数据用于建立能耗预测模型。

可选地，步骤101：对多晶硅还原生产的能耗数据及能耗影响因素进行预处理，得到预处理数据，具体包括：所述预处理数据包括第一预处理数据和第二预处理数据，利用变分模态分解(Variational mode decomposition，VMD)将多晶硅还原生产的能耗数据构成的序列分解为K个具有不同的中心频率和带宽的模态分量，以构成第一预处理数据，其中，K为正整数且K大于1；根据观察中心频率确定K的取值。利用主成分分析算法PCA对多晶硅还原生产的能耗影响因素进行筛选，得到筛选后的能耗影响因素，以构成第二预处理数据。

本实施例中，由于能耗数据具有随机性、动态性、复杂性，若不对能耗数据进行数据预处理分析，将影响能耗预测模型的预测精度。变分模态分解VMD是采用原始信号的非递归处理，将原始复杂信号f(t)分解为K模块功能IMF分量，目的是降低原始信号序列的非平稳性、复杂度，利用交替方向乘子法更新模块功能及其中心频率，调整相应的基频带，最大限度地减少带宽估计。变分模态分解具体构造步骤包括S11-S14：

S11，通过希尔伯特Hilbert变换计算每个模态函数u_k(t)解析信号，将中心频率ω_k的相应指数项混叠，以获得每个模态的频谱：

式中：δ(t)是狄拉克函数；*表示卷积运算；

表示中心频率复平面向量描述。

S12，通过高斯平滑原理，对u_k(t)信号带宽解调：

式中：{u_k}＝{u₁，u₂，...，u_k}为K个模态分量IMF；{ω_k}＝{ω₁，ω₂，...，ω_k}为各IMF的中心频率。

S13，引入二次惩罚系数α和拉格朗日乘数λ，将约束性变分问题转换为无约束变分问题：

S14，利用交替方向乘子法更新u_k，ω_k，λ并求取式(3)拉格朗日函数的鞍点：

式中：n表示迭代的数量，τ表示噪声容限参数，

和

分别表示

f(t)、u_t(t)和λ(t)的傅里叶变换。

本实施例中，通过某多晶硅生产企业的GBAI-ICS系统平台收集到多晶硅还原生产的900天内的每日能耗数据共计900组(样本间隔为24小时)，部分能耗数据如表1所示。及所述900组能耗数据对应的能耗影响因素的数据900组。例如，从900组的能耗数据及其对应的能耗影响因素数据中选取810组作为训练数据，90组作为测试数据。

表1

日期	耗电量/十万kWh
		2018.12.1	13.4307
2018.12.2	12.9533
		2018.12.3	12.6225
2018.12.4	12.7483
		2018.12.5	12.6548
2018.12.6	12.2176
		2018.12.7	12.7384

多晶硅还原生产的900组能耗数据构成的序列如图3所示。由图3可知能耗数据具有非线性、非平稳性和随机性的特点，若根据该能耗数据构建预测模型，将会导致预测模型的精度较低。为解决该问题，利用VMD对能耗数据分解处理，即将能耗数据构成的序列分解成K个具有不同的中心频率和带宽的子信号序列，由于分解后的子信号序列具有规律性，使得对具有规律性的数据进行建模得到的预测模型的预测精度将进一步提高。具体地，VMD需先选定模态个数K，模态分解的次数过少，信号中的一些重要信息将被排除或者丢失，影响模型的预测精度。模态分解个数过多时，相邻模态分量的中心频率彼此接近，从而导致频率混叠，也将影响模型的预测精度。因此，采用观察中心频率方法确定K的大小。多晶硅还原生产能耗数据通过S11-S14方法进行VMD分解可得K个IMF分量，其中心频率呈低频到高频分布，选取分量的中心频率取到最大值时的K值作为分解次数。对K从小到大取值，观察分解后各模态中心频率最大值，当K取值为5时，其中心频率首次达到最大值。得到的各模态分量的中心频率如表2所示，因此，810组能耗数据构成的序列分解得到的5个IMF分量构成第一预处理数据。

表2

由表2可见，各中心频率值相差较多，无相近频率；对惩罚因子α取默认值2000，τ取值0.3，以保证数据分解的保真度。本实施例选取K值为5，将图3的多晶硅还原生产能耗数据进行VMD分解的结果如图4所示。需要说明的是，本实施例中的分解结果包括训练数据和测试数据的分解结果，实际中可对训练数据和测试数据分别进行VMD分解，训练数据VMD分解后的结果作为预测模型的输入进行模型训练，测试数据VMD分解后的结果作为预测模型的输入进行模型测试。通过采用VMD分解，可进一步提高预测模型的预测精度。

进一步地，由于多晶硅还原生产的能耗影响因素较多，且各能耗影响因素机理复杂、耦合性强。若将所有的能耗影响因素都作为预测模型输入变量，会导致预测模型结构复杂化、执行时间过长，而直接去掉某个能耗影响因素可能会影响模型预测效果。因此，有必要消除多晶硅生产过程所有能耗影响因素的数据间多重共线性，提取关键的能耗影响因素，在不影响模型执行效率的情况下，提高模型的预测性能，实现对原始数据多变量影响因素进行降维处理。因此，利用主成分分析算法PCA对多晶硅还原生产的能耗影响因素进行筛选，具体包括S21-S23：

S21，构成变量采样的原始数据矩阵x_n×p：

式中：n表示为样本数；p表示为样本中指标的数量。

S22，对矩阵x_n×p标准正态分布化处理得到标准化矩阵R，且对其求解相关系数矩阵R。相关系数的计算公式如下：

式中：r_ij为x_mi与x_mj之间的相关系数，且r_ij＝r_ji。

S23，建立关系矩阵R。计算R的特征值及特征向量，基于其特征值确定主要成分的个数m。

式中：取η＝0.95；即将样本维数n降至目标维数m。

通过公式(7)-(9)，对900组能耗数据对应的能耗影响因素的数据900组求出协方差矩阵的特征根及贡献率，根据累积贡献率提取主成分，特征根及贡献率的结果如表3所示。方差贡献率相对于成分个数的柱状图如图5所示。

表3

成分名	特征值	方差贡献率/％	累计贡献率/％
				W1	6.6642	0.4165	0.4165
W2	3.7793	0.2362	0.6527
				W3	2.0910	0.1307	0.7834
W4	1.0882	0.0680	0.8514
				W5	0.9234	0.0577	0.9091
W6	0.8482	0.0530	0.9621
				W7	0.3028	0.0189	0.9811
W8	0.1834	0.0115	0.9925
				W9	0.0907	0.0057	0.9982
W10	0.0157	0.0010	0.9992
				W11	0.0069	0.0004	0.9996
W12	0.0028	0.0002	0.9998

根据表2，原有12个输入变量(即900组能耗影响因素的数据中每组数据均包括12个能耗影响因素)。通过S21-S23的主成分分析，当m＝6时，主成分累计贡献率为96.21％。由公式(10)主成分累计贡献率η≥95％，即W₁-W₆主成分分析后可得到影响能耗的数据的主要信息。由图5可知，各主成分的贡献率逐渐下降，从W₇开始贡献率非常低，对整个数据信息的影响很小，因此将原有12个能耗影响因素进行筛选，得到其中6个能耗影响因素作为预测模型的输入变量，即训练数据的810组能耗影响因素数据中，其中的每组数据包括12个能耗影响因素，在经过PCA处理得到每组数据仅包括6个能耗影响因素，该处理后的810组能耗影响因素的数据构成第二预处理数据。利用PCA进行能耗影响因素的数据预处理，在不影响模型性能的前提下可减少预测模型的输入变量的数量，从而有效提高模型执行效率。

步骤102，利用最小二乘支持向量机LSSVM对预处理数据进行建模，得到预测模型。

本实施例中，LSSVM是对SVM的改进和扩展，区别在于LSSVM将最小二乘损失函数用作损失函数，并用等式约束替换SVM不等式约束，将低维空间中的线性不可分问题转化到高维空间中去解决，避免了二次规划问题，将最优化问题的求解转化为求解线性方程，降低算法的复杂，同时提升收敛的精度。LSSVM的回归过程包括S31-S33：

S31，LSSVM的回归模型：

式中：ω为特征空间中的权系数向量；

表示把x映射到高维特征空间的非线性映射函数；b∈R表示偏差。

S32，利用结构风险最小化准则，式(11)对应的LSSVM优化问题可以转变成式(12)，为解决带约束问题，引入α_i构建Lagrange函数式(13)：

式中：e_i为误差变量；ξ为惩罚系数，α_i为Lagrange乘法算子。

S33，对公式(13)通过KKT条件求解，并最终得到回归函数为：

K(x_i，x_j)＝x_i·x_j ^T＝exp{-||x_i-x_j||²/2σ²} (15)

式中：K(x_i，x_j)为核函数，σ为核函数宽度。后续将利用麻雀算法对LSSVM模型中的ξ和σ寻优。

可选地，步骤102：利用最小二乘支持向量机LSSVM对预处理数据进行建模，得到预测模型，具体包括：利用LSSVM分别对第一预处理数据和第二预处理数据进行建模，得到K个预测子模型，K个预测子模型构成所述预测模型。

本实施例中，由于对810组的能耗数据、能耗影响因素数据进行数据预处理后，得到5个模态分量(即5个具有不同的中心频率和带宽的810组能耗数据)、包括6个能耗影响因素的810组能耗影响因素的数据(即第二预处理数据)。针对每个模态分量及第二预处理数据分别根据S31-S33构建LSSVM预测子模型，也就是说，利用LSSVM对能耗数据及能耗影响因素的训练数据进行建模处理，得到5个预测子模型，所述5个预测子模型为基于PCA+VMD+LSSVM所构建的预测模型，可用于预测多晶硅的能耗值，从而根据所预测的能耗值对多晶硅的还原工序进行能耗影响因素的调整控制，以提高多晶硅的生产效率。

步骤103，利用麻雀搜索算法(Sparrow search algorithm，SSA)对所述预测模型的参数进行优化，得到目标能耗预测模型。

本实施例中，由于SSA具有比粒子群算法PSO、引力搜索算法GSA等参数优选方法更优秀的精度、收敛速度、稳定性和鲁棒性等优势，故在模型训练过程中进一步采用SSA对预测模型的参数进行优化，以获得精确度高的目标能耗预测模型。SSA是一种新型多目标优化算法，主要模拟麻雀群的觅食和防止捕食过程。由发现者、跟随者、预警者组成麻雀群觅食模型。在觅食过程中，发现最佳食物的个体为发现者，其余为追随者，并选择了一定比例的个体进行预警。麻雀搜索算法具体的搜索过程包括S41-S43：

S41，发现者位置迭代更新数学表达式如下：

式中：t表示迭代的数量，W表示迭代次数最大阈值，

表示第t代的第i个麻雀的位置在第d维，α∈(0，1]。预警值r∈[0，1]，安全值β∈[0.5，1]，q是服从正态分布的随机数，l是元素全部为1的矩阵。当r＜β时，表明附近没有捕食者，发现者进行范围性搜索。当r≥β，表明发现捕食者并向种群发出警告，麻雀种群要立即飞往安全的地方觅食。

S42，追随者位置迭代更新数学表达式如下：

式中：

表示追随者占据食物最多位置，

表示追随者处在种群食物最少的位置。a表示每个元素是±1的矩阵，并且a⁺＝a^T(aa^T)^-1。当i＞n/2时，表明适应度值低的第i个追随者没获得食物，需要追随新的发现者获得食物。

S43，预警者意识到危险时，进行反捕食行为，其数学表达式如下：

其中：

表示当前种群最安全位置。ρ表示学习率控制参数且满足标准正态分布随机数。k∈[-1，1]表示麻雀转移方向与学习率控制参数。f_i表示个体麻雀的当前适应值，f_g表示最优适应值，f_w表示最差适应值。ε∈(0.01，0.5)，获得更强的追踪能力。当f_i＞f_g表明麻雀受到捕食者的危险系数较大。当f_i＝f_g，表明种群中预警麻雀意识到危险，需要靠近其他麻雀以最大程度地减少被捕食的风险系数。

可选地，步骤103：利用麻雀搜索算法SSA对所述预测模型的参数进行优化，得到目标预测模型，具体包括：利用麻雀搜索算法SSA分别对K个预测子模型的参数寻找全局最优值，得到K个目标能耗预测子模型，以构成目标能耗预测模型，其中，参数包括惩罚系数和核函数宽度。

本实施例中，如图2所示，利用SSA分别对K个预测子模型的参数寻找全局最优值，得到K个目标预测子模型，包括S51-S55：

S51，针对各个预测子模型分别设置SSA参数，SSA参数包括麻雀的种群大小N、迭代次数阈值W；

S52，初始化麻雀位置x并计算麻雀个体适应度值P_best，选择最优个体适应度值作为全局最优值G_best；

S53，根据SSA(式16-18)迭代更新麻雀种群中发现者、追随者、预警者位置并判断麻雀是否进行反捕食行为；

S54，迭代更新个体最优值P_best和全局最优值G_best，当迭代次数等于迭代次数阈值W时，输出SSA寻找的全局最优值，全局最优值包括惩罚系数ξ和核函数宽度σ；

S55，将输出的全局最优值赋值给相应的预测子模型，得到与预测子模型相应的目标能耗预测子模型。

本实施例中，由于采用了SSA进行参数寻优，故得到基于PCA+VMD+SSA+LSSVM所构建的目标预测模型，可用于预测多晶硅的能耗值，其相比于PCA+VMD+LSSVM或VMD+LSSVM所构建的预测模型具有更高的预测精度。

本实施例的能耗预测模型的建立方法，由于利用主成分分析PCA提取多晶硅生产过程能耗影响因素的主要成分，实现降低多晶硅生产能耗影响因素的目标维数，从而提升预测模型的执行效率。由于利用变分模态分解VMD将多晶硅生产过程的能耗数据构成的序列进行分解，获得K个具有不同的中心频率和带宽的模态分量，采用观察中心频率方法确定合适的K的取值，从而降低能耗序列的非平稳性、复杂度，避免能耗序列的非平稳性、复杂度影响所建模型的精度，故进行VMD处理能进一步提升预测模型的精度。为提高模型在短尺度时序的预测能力，对各模态分别建立LSSVM预测模型且利用麻雀搜索算法SSA对建立模型参数进行优化，可以进一步提高预测模型的精度。

实施例2：

本实施例提供一种能耗的预测方法，包括：

步骤201，根据实施例1所述的能耗预测模型的建立方法得到目标能耗预测模型。

步骤202，利用目标能耗预测模型得到多晶硅还原生产的能耗预测值，以对多晶硅还原生产的能耗进行预测。

可选地，根据实施例1所述的能耗预测模型的建立方法得到目标能耗预测模型，利用所述目标能耗预测模型得到多晶硅还原生产的能耗预测值，具体包括：

步骤2021，根据目标能耗预测模型得到K个目标预测子模型(即为基于PCA+VMD+SSA+LSSVM构建的K个目标预测子模型)。

步骤2022，获取多晶硅还原生产的能耗数据及筛选后的能耗影响因素，即获取测试数据，测试数据包括能耗数据及经过PCA处理后的能耗影响因素的相关数据。

步骤2023，利用变分模态分解将多晶硅还原生产的能耗数据构成的序列分解为K个具有不同的中心频率和带宽的模态分量，本实施例中，由于实施例1中分解为5个不同的模态分量，故测试数据中的能耗数据同样分解为5个不同的模态分量。

步骤2024，将分解得到的K个模态分量及筛选后的能耗影响因素分别输入K个目标能耗预测子模型进行预测，得到K个能耗子预测值。例如，第一个目标能耗预测子模型的输入数据包括第一个模态分量的能耗数据及筛选后的能耗影响因素，输出为第一个能耗子预测值。

步骤2025，将K个能耗子预测值叠加，得到多晶硅还原生产的能耗预测值。

可选地，在步骤202之后，能耗的预测方法还包括：利用RMSE和/或MAPE和/或MAE和/或FMA评估能耗预测值的精确度。

本实施例中，为了评价所建立的目标预测模型的可信度及精确度，对误差和精度进行量化，采用90组测试数据对目标能耗预测模型进行能耗预测后，采用式(19)-式(22)预测误差和精度评价指标进行多晶硅生产过程能耗预测结果的评估。

(1)预测误差的可靠性用平均相对误差：

(2)预测值偏离真值误差的大小用平均绝对误差：

(3)样本数据离散程度用均方根误差：

(4)预测模型精确度：

其中：x_t为真实值，

为与预测值。N为样本的测试数量，M为样本总数量。

本实施例中，为更清楚的描述本实施例的目标能耗预测模型的预测精度效果，采用试验方法比较不同的目标能耗预测模型的预测精度。采用五种目标能耗预测模型(分别为LSSVM、SSA-LSSVM、VMD-LSSVM、VMD-SSA-LSSVM、PCA-VMD-SSA-LSSVM)进行了900组样本数据的训练和测试，其中810组能耗数据及能耗影响因素数据作为训练样本，剩余的90组能耗数据及能耗影响因素数据作为测试样本。测试结果显示，采用PCA-VMD-SSA-LSSVM模型对多晶硅生产过程能耗具有较高的预测精度，预测精度最高可达98.7％。五种模型误差评价指标如表4。LSSVM预测模型的三项指标(MAPE、MAE、RMSE)均最大，分别达到了0.363193、0.289676和2.306367，说明预测效果最差；SSA-LSSVM预测模型和VMD-LSSVM预测模型的误差较LSSVM模型降低很多，预测效果提升明显。PCA-VMD-SSA-LSSVM预测模型的三项指标分别为0.010324、0.009467和0.058779，在预测精度上全面优于前面四种预测模型预测效果。

表4

预测模型	MAPE	MAE	RMSE
				LSSVM	0.363193	0.289676	2.306367
SSA-LSSVM	0.097062	0.056651	0.454031
				VMD-LSSVM	0.034258	0.027297	0.217626
VMD-SSA-LSSVM	0.014816	0.012051	0.095755
				PCA-VMD-SSA-LSSVM	0.010324	0.009467	0.058779

此外，基于PCA-VMD-SSA-LSSVM的多晶硅还原生产的目标能耗预测模型，与其他预测模型如粒子群优化BP神经网络模型、粒子群优化极限学习机ELM模型和Adaboost算法优化长短期记忆人工神经网络LSTM模型对比具有最优的预测精度，试验结果如表5所示。

表5

预测模型	平均绝对百分比误差MAPE
		PSO-BP	0.324563
PSO-ELM	0.378537
		LSTM--Adaboost	0.132458
PCA-VMD-SSA-LSSVM	0.010324

本实施例的能耗预测方法，可为探究能耗影响因素与能耗数据之间的内在联系提供参考，并且有利于进行还原生产过程的管控和降低能耗。例如，基于windowS 10操作系统与MATLAB R2018b软件搭建多晶硅还原生产的目标能耗预测模型，通过对车间多晶硅还原生产的能耗值进行预测，找到满足生产质量要求的同时生产能耗较低的生产基线。生产基线包括H₂(氢气)流量、TCS(SiHCl₃，三氯氢硅)流量、相电流、相电压、尾气温度和混合气体温度等指标要求，以此作为生产车间对多晶硅还原生产过程的管控标准。车间操作人员通过预测模型得到的能耗预测值，调整生产基线的各项指标使满足生产要求，降低能耗的同时实现对还原生产过程的管控，从而提高企业的经济效益。

实施例3：

本实施例提供一种能耗预测模型的建立装置，包括预处理模块，建模模块和模型优化模块。

预处理模块，用于对多晶硅还原生产的能耗数据及能耗影响因素进行预处理，得到预处理数据。建模模块，与预处理模块连接，用于利用最小二乘支持向量机LSSVM对所述预处理数据进行建模，得到预测模型。模型优化模块，与建模模块连接，用于利用麻雀搜索算法SSA对所述预测模型的参数进行优化，得到目标能耗预测模型。各模块的具体功能详见实施例1所述内容，此处不再赘述。

实施例4：

本实施例提供一种能耗预测系统，包括实施例3所述的能耗预测模型的建立装置和预测模块。

能耗预测模型的建立装置，用于建立目标预测模型。

预测模块，与能耗预测模型的建立装置连接，用于利用目标预测模型对目标多晶硅还原生产的能耗进行预测，得到所述目标多晶硅还原生产的能耗预测值。

可以理解的是，以上实施方式仅仅是为了说明本发明的原理而采用的示例性实施方式，然而本发明并不局限于此。对于本领域内的普通技术人员而言，在不脱离本发明的精神和实质的情况下，可以做出各种变型和改进，这些变型和改进也视为本发明的保护范围。

Claims

1.一种能耗预测模型的建立方法，其特征在于，包括：

对多晶硅还原生产的能耗数据及能耗影响因素进行预处理，得到预处理数据；

利用最小二乘支持向量机LSSVM对所述预处理数据进行建模，得到预测模型；

利用麻雀搜索算法SSA对所述预测模型的参数进行优化，得到目标能耗预测模型。

2.根据权利要求1所述的能耗预测模型的建立方法，其特征在于，所述对多晶硅还原生产的能耗数据及能耗影响因素进行预处理，得到预处理数据，具体包括：所述预处理数据包括第一预处理数据和第二预处理数据，

利用变分模态分解VMD将多晶硅还原生产的能耗数据构成的序列分解为K个具有不同的中心频率和带宽的模态分量，以构成第一预处理数据，其中，K为正整数且K大于1；

根据观察中心频率确定K的取值，

利用主成分分析算法PCA对多晶硅还原生产的能耗影响因素进行筛选，得到筛选后的能耗影响因素，以构成第二预处理数据。

3.根据权利要求2所述的能耗预测模型的建立方法，其特征在于，所述利用最小二乘支持向量机LSSVM对所述预处理数据进行建模，得到预测模型，具体包括：

利用最小二乘支持向量机LSSVM分别对第一预处理数据和第二预处理数据进行建模，得到K个预测子模型，K个预测子模型构成所述预测模型。

4.根据权利要求3所述的能耗预测模型的建立方法，其特征在于，所述利用麻雀搜索算法SSA对所述预测模型的参数进行优化，得到目标能耗预测模型，具体包括：

利用麻雀搜索算法SSA分别对K个预测子模型的参数寻找全局最优值，得到K个目标能耗预测子模型，以构成所述目标能耗预测模型，其中，所述参数包括惩罚系数和核函数宽度。

5.根据权利要求4所述的能耗预测模型的建立方法，其特征在于，所述利用麻雀搜索算法SSA分别对K个预测子模型的参数寻找全局最优值，得到K个目标能耗预测子模型，具体包括：

针对各个预测子模型分别设置SSA参数，所述SSA参数包括麻雀的种群大小、迭代次数阈值；

初始化麻雀位置并计算麻雀个体适应度值，选择最优个体适应度值作为全局最优值；

根据SSA迭代更新麻雀种群中发现者、追随者、预警者位置并判断麻雀是否进行反捕食行为；

迭代更新个体最优值和全局最优值，当迭代次数等于迭代次数阈值时，输出SSA寻找的全局最优值，全局最优值包括惩罚系数和核函数宽度；

将输出的全局最优值赋值给相应的预测子模型，得到与所述预测子模型相应的目标能耗预测子模型。

6.一种能耗预测方法，其特征在于，包括：

根据权利要求1-5任一项所述的能耗预测模型的建立方法得到目标能耗预测模型；

利用所述目标能耗预测模型得到多晶硅还原生产的能耗预测值，以对多晶硅还原生产的能耗进行预测。

7.根据权利要求6所述的能耗预测方法，其特征在于，根据权利要求5所述的能耗预测模型的建立方法得到目标能耗预测模型，

利用所述目标能耗预测模型得到多晶硅还原生产的能耗预测值，具体包括：

根据目标能耗预测模型得到K个目标预测子模型；

获取多晶硅还原生产的能耗数据及筛选后的能耗影响因素；

利用变分模态分解将多晶硅还原生产的能耗数据构成的序列分解为K个具有不同的中心频率和带宽的模态分量；

将分解得到的K个模态分量及筛选后的能耗影响因素分别输入K个目标能耗预测子模型进行预测，得到K个能耗子预测值；

将K个能耗子预测值叠加，得到多晶硅还原生产的能耗预测值。

8.根据权利要求7所述的能耗预测方法，其特征在于，在得到多晶硅还原生产的能耗预测值之后，还包括：

利用RMSE和/或MAPE和/或MAE评估能耗预测值的精确度。

9.一种能耗预测模型的建立装置，其特征在于，包括预处理模块，建模模块和模型优化模块，

预处理模块，用于对多晶硅还原生产的能耗数据及能耗影响因素进行预处理，得到预处理数据，建模模块，与预处理模块连接，用于利用最小二乘支持向量机LSSVM对所述预处理数据进行建模，得到预测模型，

模型优化模块，与建模模块连接，用于利用麻雀搜索算法SSA对所述预测模型的参数进行优化，得到目标能耗预测模型。

10.一种能耗预测系统，其特征在于，包括权利要求9所述的能耗预测模型的建立装置、和预测模块，

能耗预测模型的建立装置，用于建立目标能耗预测模型，

预测模块，与能耗预测模型的建立装置连接，用于利用目标能耗预测模型得到多晶硅还原生产的能耗预测值，以对多晶硅还原生产的能耗进行预测。