CN110533249B

CN110533249B - 一种基于集成长短期记忆网络的冶金企业能耗预测方法

Info

Publication number: CN110533249B
Application number: CN201910824388.XA
Authority: CN
Inventors: 王刚; 段双玲; 张峰; 王含茹; 马敬玲; 张亚楠
Original assignee: Hefei University of Technology
Current assignee: Hefei University of Technology
Priority date: 2019-09-02
Filing date: 2019-09-02
Publication date: 2021-09-14
Anticipated expiration: 2039-09-02
Also published as: CN110533249A

Abstract

本发明公开了一种基于集成长短期记忆网络的冶金企业能耗预测方法，其步骤包括：1收集冶金企业能耗数据并进行预处理；2使用长短期记忆网络提取冶金企业能耗数据的深度学习特征；3构建多个冶金企业能耗数据的训练集，训练多个冶金企业能耗数据的支持向量回归预测模型；4使用Jensen‑Shannon散度对K个训练好的支持向量回归预测模型进行选择，使用自适应线性归一化结合方法对所选择的支持向量回归预测模型的结果进行融合。本发明能解决单个冶金企业能耗数据的支持向量回归预测模型鲁棒性不强的问题，提冶金企业能耗数据的预测效果。

Description

一种基于集成长短期记忆网络的冶金企业能耗预测方法

技术领域

本发明涉及冶金企业能耗预测技术领域，主要涉及一种基于集成长短期记忆网络的冶金企业能耗预测方法。

背景技术

能源是国民经济发展的重要物质基础，是决定未来国家科技发展、经济发展和国防建设的重要保障。节约能源是我国经济和社会发展的一项长远战略方针，也是当前一项极为紧迫的任务。但是随着冶金工业的发展，能源的问题变得越来越严重，尤其是冶金企业在生产钢铁、铜等产品中，如果生产计划安排得不合理，或者管理的手段不够强，将会浪费大量的能源。冶金企业能耗预测精度的提高，有助于冶金企业合理安排生产计划，提高物料的利用率，减少不必要的能源消耗。

目前，冶金企业能耗预测方法一般分为三类：基于物理模型的预测方法、基于统计模型的预测方法和基于机器学习的预测方法。基于物理模型的预测方法主要依据专家知识对冶金企业能耗数据进行建模，成本较高昂且建模较困难。基于统计模型的预测方法是通过收集大量的历史冶金企业能耗统计数据，运用一定的统计模型来建立冶金企业能耗预测模型，代表方法有移动平均模型、自回归移动平均模型等。基于统计模型的预测方法虽然能较好的处理线性时间序列数据，但是不能很好地预测非线性时间序列数据。基于机器学习的预测方法凭借其较强的非线性拟合与泛化能力，广泛运用于冶金企业能耗预测，近年来受到了越来越多的关注，代表方法有随机森林、支持向量回归、神经网络等。传统的基于机器学习的预测方法通常需要进行复杂的特征工程。例如，首先，在数据集上进行探索性数据分析；然后，需要对数据进行降维处理；最后，要仔细选择数据的代表特征进行预测。目前，单个预测模型在冶金企业能耗预测领域应用较为广泛，但是单个预测模型的鲁棒性不强，无法取得较好的预测效果。虽然，集成学习方法在冶金企业能耗预测中也得到了应用，但是由于冶金企业能耗数据具有较强的随机性和波动性，基学习器在冶金企业能耗数据上的预测性能也各有差异。

发明内容

为了解决现有技术中存在的上述问题，本发明提供一种基于集成长短期记忆网络的冶金企业能耗预测方法，以期能充分考虑冶金企业能耗数据的时间特性以及单个预测模型的性能，通过采用集成方法解决单个冶金企业能耗数据的支持向量回归预测模型鲁棒性不强问题，从而提高冶金企业能耗数据的预测效果。

本发明为达到上述发明目的，采用以下技术方案：

本发明一种基于集成长短期记忆网络的冶金企业能耗预测方法的特点是按照如下步骤进行：

步骤1，收集冶金企业能耗数据并进行预处理：

步骤1.1，收集冶金企业能耗历史数据组成原始数据集合，记为P＝{p₁,p₂,...,p_m,...,p_M}，p_m为原始数据集合P中第m天的冶金企业能耗数据，1≤m≤M，M表示原始数据集合P中的总数；

步骤1.2，检查原始数据集合P是否存在缺失值，若存在缺失值，对所有缺失值用原始数据集合P中所有冶金企业能耗数据的平均值进行填充后，再对填充后的原始数据集合中所有冶金企业能耗数据进行归一化处理，得到归一化后的冶金企业能耗数据集；否则，直接对原始数据集合P中所有冶金企业能耗数据进行归一化处理，得到归一化后的冶金企业能耗数据集；

步骤1.3，使用滑动窗口对归一化后的冶金企业能耗数据集进行样本划分，得到冶金企业能耗数据的N个样本，记为样本集D＝{(x₁,y₁),(x₂,y₂),...,(x_n,y_n),...,(x_N,y_N)}，其中，(x_n,y_n)表示冶金企业能耗数据的第n个样本，x_n表示冶金企业能耗数据第n个样本的样本向量，且

表示冶金企业能耗数据第n个样本的样本向量x_n中第a-1个属性，该属性表示为冶金企业能耗数据经过归一化处理后的每天的综合能耗值；y_n表示冶金企业能耗数据第n个样本的样本向量x_n的目标输出值，且

a表示第n个样本的长度；

步骤2，使用长短期记忆网络提取冶金企业能耗数据的深度学习特征：

将冶金企业能耗数据的样本集D中的样本依次输入长短期记忆网络中，得到最后一层隐藏层的输出并作为冶金企业能耗数据的深度学习特征，从而得到冶金企业能耗数据的特征集L＝{(h₁,y₁),(h₂,y₂),...,(h_n,y_n),...,(h_N,y_N)}，其中，(h_n,y_n)表示冶金企业能耗数据的第n个特征样本，h_n表示冶金企业能耗数据第n个特征样本的深度学习特征，其形式为向量；

步骤3，构建多个冶金企业能耗数据的训练集，训练多个冶金企业能耗数据的支持向量回归预测模型；

步骤3.1，使用自助采样法对冶金企业能耗数据的特征集L进行K次采样，得到K个包含R个特征样本的训练集{DS₁,DS₂,,DS_k,…,DS_K}，其中，DS_k表示第k个包含R个特征样本的训练集，且

表示第k个训练集DS_k中第r个特征样本，

表示第k个训练集DS_k中第r个特征样本的深度学习特征，

表示第k个训练集DS_k中第r个特征样本的目标输出值，1≤r≤R，1≤k≤K；

步骤3.2，以径向基核函数作为支持向量回归预测模型的映射函数，以ε-不敏感损失函数作为支持向量回归预测模型的损失函数；

将K个冶金企业能耗数据的训练集{DS₁,DS₂,…,DS_k,…,DS_K}中的特征样本依次输入到支持向量回归预测模型进行训练，从而获得K个训练好的冶金企业能耗数据的支持向量回归预测模型；

步骤4，使用Jensen-Shannon散度对K个训练好的支持向量回归预测模型进行选择，使用自适应线性归一化结合方法对所选择的支持向量回归预测模型的结果进行融合：

步骤4.1，利用式(1)对第k个训练好的冶金企业能耗数据的支持向量回归预测模型进行Jensen-Shannon散度的计算，得到第k个训练好的冶金企业能耗数据的支持向量回归预测模型的Jensen-Shannon散度

从而得到K个Jensen-Shannon散度：

式(1)中，

表示第k个训练好的支持向量回归预测模型在第r个冶金企业能耗数据的特征样本

的预测值，β₁和β₂分别表示特征样本的目标输出值

和预测值

的权重，β₁,β₂≥0且β₁+β₂＝1；

步骤4.2，对K个冶金企业能耗数据的支持向量回归预测模型的Jensen-Shannon散度分别与阈值θ进行比较，并选择Jensen-Shannon散度小于阈值θ的所有W个训练好的支持向量回归预测模型，其中θ的取值范围为(0,1)；

步骤4.3，利用式(2)所示的自适应线性归一化方法建立W个训练好的支持向量回归预测模型在冶金企业能耗数据的特征集L上的优化模型：

式(2)中，E表示由W个元素且元素值为1组成的向量，且E＝[1,1,...,1]^T，η表示W个训练好的支持向量回归预测模型的权重向量，且η＝[η₁,η₂,...,η_w,...,η_W]^T，η_w表示第w个训练好的支持向量回归预测模型的权重，且1≤w≤W，e_n表示W个训练好的支持向量回归预测模型在冶金企业能耗数据的特征集L中第n个特征样本(h_n,y_n)上的绝对误差向量，且

表示第w个训练好的支持向量回归预测模型在第n个特征样本上的绝对误差，并有：

式(3)中，f_w(h_n)表示第w个训练好的支持向量回归预测模型在冶金企业能耗数据的特征集L中第n个特征样本(h_n,y_n)的预测结果；

步骤4.5，利用拉格朗日函数对式(2)进行优化求解，得到式(4)所示的W个训练好的支持向量回归预测模型的权重向量η：

步骤4.6，利用W个训练好的支持向量回归预测模型对给定新的特征样本h_new进行预测，得到预测结果向量f(h_new)；

利用式(5)所示的使用自适应线性归一化结合方法对W个训练好的支持向量回归预测模型的预测结果进行融合，从而得到新的特征样本h_new的最终预测结果F(h_new)：

与已有技术相比，本发明的有益效果体现在：

1、本发明将处理后的冶金企业能耗数据与集成学习方法、长短期记忆网络方法、支持向量回归方法相结合，实现了有效的冶金企业能耗预测，进而获得了较为精确的预测结果；

2、本发明考虑到冶金企业能耗预测结果具有时间分布特性，在所提集成学习方法中使用Jensen-Shannon散度来衡量各个训练好的支持向量回归预测模型的预测性能与真实冶金企业能耗数据时间分布的距离，以此标准来选择距离较小的训练好的支持向量回归预测模型来进行集成，从而减少了预测性能不佳的支持向量回归预测模型所带来的影响，获得了较为精确的预测；

3、由于冶金企业能耗数据具有较强的随机性和波动性，本发明考虑到训练好的各个支持向量回归预测模型在冶金企业能耗数据上预测性能的差异，使用自适应线性归一化结合方法对选择的各个支持向量回归预测模型进行权重的分配，从而获得了比使用一般权重分配方法更精确的预测结果；

4、本发明通过使用长短期记忆网络提取冶金企业能耗数据的深度学习特征，解决了复杂的特征工程问题，从而简化了特征提取的计算过程；

5、本发明使用自助采样法进行采样，得到多个不同的冶金企业能耗数据集，并基于不同的冶金企业能耗数据集建立不同的支持向量回归预测模型，减少了训练时间并提高了模型的学习效率。

附图说明

图1为本发明的整体流程示意图；

图2为本发明长短期记忆网络的内部结构示意图；

图3为本发明所提方法的RMSE实验结果图；

图4为本发明所提方法的MAPE实验结果图。

具体实施方式

本实施例中，一种基于集成长短期记忆网络的冶金企业能耗预测方法，整体流程示意图如图1所示，先对收集的冶金企业能耗数据进行预处理；然后使用长短期记忆网络提取冶金企业能耗数据的深度学习特征，并使用自助采样法构建多个冶金企业能耗数据的训练集，训练多个冶金企业能耗数据的支持向量回归预测模型；最后使用Jensen-Shannon散度对K个训练好的支持向量回归预测模型进行选择，使用自适应线性归一化结合方法对所选择的支持向量回归预测模型的结果进行融合，具体按照以下步骤进行：

步骤1，收集冶金企业能耗数据并进行预处理：

步骤1.1，收集冶金企业能耗历史数据组成原始数据集合，记为P＝{p₁,p₂,...,p_m,...,p_M}，p_m为原始数据集合P中第m天的冶金企业能耗数据，1≤m≤M，M表示原始数据集合P中的总数，本发明中冶金企业能耗数据是指冶金企业在冶金过程中用电量、用水量、煤炭量和焦碳量的综合能耗值，单位统一用kgce/t表示，其表示千克标准煤每吨，kgce为能源消耗量，用标准煤表示；

a表示第n个样本的长度；

将长短期记忆网络的激活函数设置为sigmoid函数，其内部结构示意图如图2所示；优化器设置为Adam；输入层时间步数设置为a-1，输入层维数设置为1；考虑到隐含层过多会增加模型的训练成本，针对冶金企业能耗预测，将隐含层的数目设置为1层，每个隐含层的维数设置为64；输出变量维数设置为1；

步骤3.1，使用自助采样法对冶金企业能耗数据的特征集L进行K次采样，得到K个包含R个特征样本的训练集{DS₁,DS₂,…,DS_k,…,DS_K}，其中，DS_k表示第k个包含R个特征样本的训练集，且

表示第k个训练集DS_k中第r个特征样本，

表示第k个训练集DS_k中第r个特征样本的深度学习特征，

从而得到K个Jensen-Shannon散度：

式(1)中，

的预测值，β₁和β₂分别表示特征样本的目标输出值

和预测值

的权重，β₁,β₂≥0且β₁+β₂＝1；

步骤4.2，对K个冶金企业能耗数据的支持向量回归预测模型的Jensen-Shannon散度分别与阈值θ进行比较，并选择Jensen-Shannon散度小于阈值θ的所有W个训练好的支持向量回归预测模型，其中，θ的取值范围为(0,1)；

步骤4.6，利用W个训练好的支持向量回归预测模型对给定新的特征样本h_new进行预测，得到预测结果向量f(h_new)，且f(h_new)＝[f(h_new)¹,f(h_new)²,...,f(h_new)^w,...,f(h_new)^W]^T，f(h_new)^w表示第w个训练好的支持向量回归预测模型对新的特征样本h_new的预测结果；

针对本发明方法进行实验论证，具体包括：

1、数据集

本发明选用某有色金属生产公司的能耗数据集来验证基于集成长短期记忆网络的冶金企业能耗预测方法的有效性。在此数据中，共1826个数据，时间跨度从2014年1月1日至2018年12月31日的某有色金属生产公司的冶金综合能耗数据。

2、评价指标

本发明使用均方根误差(Root Mean Squared Error，RMSE)和平均绝对百分误差(Mean Absolute Percentage Error，MAPE)百分数作为实验的评价指标。RMSE用来衡量误差的分散程度，RMSE的值越小，表示模型的预测效果越好。MAPE不仅考虑了预测值与真实值的误差，还考虑了误差与真实值之间的比例，MAPE的值越小，表示模型的预测效果越好。RMSE和MAPE的计算公式如式(6)和(7)所示：

式(6)和式(7)中，S表示冶金企业能耗数据测试集的样本总数，其中1≤s≤S，y_s表示冶金企业能耗数据测试集中第s个样本的真实值，F(h_s)表示冶金企业能耗数据测试集中第s个样本的预测值；

3、实验流程

为了验证本发明所提出方法的有效性，本发明选用自回归移动平均模型(Auto-Regression MovingAverage Model，ARMA)，BP神经网络(BackPropagationNeuralNetwork，BPNN)，极限学习机(Extreme Learning Machine，ELM)，长短期记忆网络(LongShort Term Memory，LSTM)，支持向量回归(SupportVectorRegression，SVR)，长短期记忆网络结合支持向量回归的预测方法(LSTM-SVR)，本发明方法进行比较。ARMA、BPNN、ELM、LSTM、SVR均忽略了使用长短期记忆网络提取冶金企业能耗数据的深度学习特征以及忽略了使用集成学习方法；LSTM-SVR使用了LSTM提取冶金企业能耗数据的深度学习特征以及使用了集成学习方法，但是没有对集成学习方法中基学习器进行选择，并使用简单平均法对各个基学习器的预测结果进行融合。实验过程中，本发明将2014年1月1日至2017年12月31日的某有色金属生产公司的冶金综合能耗数据作为训练集，2018年1月1日至2018年12月31日的作为测试集。

4、实验结果

为了验证本发明所提出方法的有效性，本发明在某有色金属生产公司的能耗数据集上进行实验，并将本发明所提方法及其对比方法的实验结果进行比较。实验结果如表1和图3，图4所示。

表1 RMSE和MAPE实验结果

由表1、图3和图4可以看出，本发明所提方法在RMSE和MAPE两个评价指标下均优于另外六种预测方法。从表1、图3和图4还可以看出，在ARMA、BPNN、ELM、LSTM、SVR与LSTM-SVR方法的比较中，LSTM-SVR方法在两个评价指标下均取得了较优的结果，在LSTM-SVR方法和本发明方法的比较中，本发明方法在两个评价指标也均取得了最优的结果。这一结果表明，对冶金企业能耗预测而言，使用LSTM提取冶金企业能耗数据的深度学习特征以及对训练好的基学习器进行合理选择和分配合适的权重有助于提高预测结果的准确性，这也进一步验证了本发明方法提出的同时考虑使用LSTM取冶金企业能耗数据的深度学习特征以及考虑到基学习器预测性能的差异对基学习器进行选择和权重分配的有效性。