一种基于园区画像的园区负荷预测方法及系统
技术领域
本发明涉及负荷预测技术领域,特别是涉及一种基于园区画像的园区负荷预测方法及系统。
背景技术
准确的园区负荷预测是电力系统安全、稳定、经济运行的重要前提。能源行业的数字化趋势也为人工智能技术的应用提供了必要条件。同时,机器学习的快速发展也为负荷预测的提供了全新的解决方案。其中,基于机器学习方法的用户画像技术在许多领域获得广泛应用,包括精准营销、精准广告平台、信息流推送、各类推荐系统等,在电力系统中通过画像技术的应用在预测问题、电力市场营销、市场交易等方面取得显著效果。另外,深度学习在多个领域有着优异实践效果,相较与传统浅层模型,深度学习模型往往能获得更好的学习效果,作为该领域内的尖端技术,获得了工业界与学术界的广泛关注,各行业科研人员并对其内涵与相关应用场景进行了深入挖掘。但是,目前深度学习与能源领域的结合仍然有限,在模型训练过程中存在陷入局部极小值的风险。
发明内容
本发明的目的是提供一种基于园区画像的园区负荷预测方法及系统,以克服模型训练过程中存在陷入局部极小值的风险的技术缺陷,提高预测精度。
为实现上述目的,本发明提供了如下方案:
一种基于园区画像的园区负荷预测方法,所述预测方法包括如下步骤:
获取园区的历史用户画像信息、历史负荷数据、历史天气数据和历史节假日数据作为输入数据,获取每组输入数据对应的检测时间的下一时刻检测的负荷数据作为输出,构建训练样本集;
构建园区负荷预测的卷积神经网络模型和长短记忆模型;
利用所述训练样本集训练所述卷积神经网络模型,获得训练后的卷积神经网络模型;
利用所述训练样本集训练所述长短记忆模型,获得训练后的长短记忆模型;
将训练后的卷积神经网络模型与训练后的长短记忆模型的输出端与Lasso回归模型的输入端连接,构建园区短期负荷预测模型;
利用所述训练样本集对所述短期负荷预测模型的Lasso回归模型进行训练,获得训练后的园区短期负荷预测模型;
获取园区当前时刻的用户画像信息、负荷数据、天气数据、节假日数据输入所述训练后的园区短期负荷预测模型,得到下一时刻的负荷预测值。
可选的,所述卷积神经网络模型包括输入层、多个隐含层和全连接层;所述隐含层包括多个卷积层和多个池化层。
可选的,所述利用所述训练样本集训练所述卷积神经网络模型的过程中利用随机梯度下降法更新所述卷积神经网络模型中的权重和偏置参数。
可选的,所述长短记忆模型包括遗忘门、输入门和输出门。
可选的,所述利用所述训练样本集训练所述长短记忆模型的过程中采用自适应时刻估计法更新长短记忆模型的权值参数和输入偏置参数。
一种基于园区画像的园区负荷预测系统,所述识别系统包括:
训练样本集构建模块,用于获取园区的历史用户画像信息、历史负荷数据、历史天气数据和历史节假日数据作为输入数据,获取每组输入数据对应的检测时间的下一时刻检测的负荷数据作为输出,,构建训练样本集;
模型构建模块,用于构建园区负荷预测的卷积神经网络模型和长短记忆模型;
卷积神经网络模型训练模块,用于利用所述训练样本集训练所述卷积神经网络模型,获得训练后的卷积神经网络模型;
长短记忆模型训练模块,用于利用所述训练样本集训练所述长短记忆模型,获得训练后的长短记忆模型;
园区短期负荷预测模型构建模块,用于将训练后的卷积神经网络模型与训练后的长短记忆模型的输出端与Lasso回归模型的输入端连接,构建园区短期负荷预测模型;
园区短期负荷预测模型训练模块,用于利用所述训练样本集对所述短期负荷预测模型的Lasso回归模型进行训练,获得训练后的园区短期负荷预测模型;
预测模块,用于获取园区当前时刻的用户画像信息、负荷数据、天气数据、节假日数据输入所述训练后的园区短期负荷预测模型,得到下一时刻的负荷预测值。
可选的,所述卷积神经网络模型包括输入层、多个隐含层和全连接层;所述隐含层包括多个卷积层和多个池化层。
可选的,所述卷积神经网络模型训练模块包括:
第一参数更新子模块,用于利用随机梯度下降法更新所述卷积神经网络模型中的权重和偏置参数。
可选的,所述长短记忆模型包括遗忘门、输入门和输出门。
可选的,所述长短记忆模型训练模块包括:
第二参数更新子模块,用于采用自适应时刻估计法更新长短记忆模型的权值参数和输入偏置参数。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明提出了一种基于园区画像的园区负荷预测方法及系统。所述预测方法,首先,获取园区的历史用户画像信息、历史负荷数据、历史天气数据和历史节假日数据作为输入数据,获取每组输入数据对应的检测时间的下一时刻检测的负荷数据作为输出,构建训练样本集;然后分别训练所述卷积神经网络模型和长短记忆模型;然后将训练后的卷积神经网络模型与训练后的长短记忆模型的输出端与Lasso回归模型的输入端连接,构建园区短期负荷预测模型;并利用训练样本集对短期负荷预测模型的Lasso回归模型进行训练,获得训练后的园区短期负荷预测模型;最后获取园区当前时刻的用户画像信息、负荷数据、天气数据、节假日数据输入所述训练后的园区短期负荷预测模型,得到下一时刻的负荷预测值。本发明采用卷积神经网络模型和长短记忆模型组合的园区短期负荷预测模型,有效避免了单一模型在训练过程中存在陷入局部极小值的风险,而且组合有的模型可充分发挥各自的优势,提高负荷预测的精度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的一种基于园区画像的园区负荷预测方法的流程图;
图2为本发明提供的一种基于园区画像的园区负荷预测方法的原理示意图;
图3为本发明提供的卷积神经网络模型的结构图;
图4为本发明提供的长短记忆模型的单元结构图;
图5为本发明提供的具体实施例的长短记忆模型的训练次数与预测结果的关系图;
图6为本发明提供的具体实施例的一组数据的BP神经网络与本发明提供的预测方法的预测结果的对比图;
图7为本发明提供的具体实施例的另一组数据的BP神经网络与本发明提供的预测方法的预测结果的对比图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种基于园区画像的园区负荷预测方法及系统,以克服模型训练过程中存在陷入局部极小值的风险的技术缺陷,提高预测精度。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
为了实现上述目的本发明提供一种基于园区画像的园区负荷预测方法,如图1和2所示,所述预测方法包括如下步骤:
步骤101,获取园区的历史用户画像信息、历史负荷数据、历史天气数据和历史节假日数据作为输入数据,获取每组输入数据对应的检测时间的下一时刻检测的负荷数据作为输出,构建训练样本集。
负荷预测的输入特征x。包含了园区用户画像信息,该信息结合用电信息采集系统、SG186营销业务系统、电能服务平台、需求响应系统4个数据平台,包含了园区中工作人员数量、经济变化状况、园区占地变化、停电记录、线损信息、储能容量信息。除此以外,输入因素也同时包含了负荷历史数据、天气数据与节假日数据。预测目标,输出数据y为下一个小时的电力负荷数据。即,具体的,两个时刻间隔为一小时。
步骤102,构建园区负荷预测的卷积神经网络模型和长短记忆模型。
卷积神经网络模拟了人类视觉系统的信息处理过程。它的基本架构可以归结为输入层、多个隐含层和输出层,其中隐含层主要由卷积层连接池化层构成,输出层为一层全连接层。卷积层通过一个或多个卷积核在前一层输出信号上做卷积,计算输入每一个小区域与卷积核模式的相似程度。每一个卷积核负责一种特征模式的识别,因此对于同一层的同一种特征模式,网络共享同一个卷积核,从而减少了网络参数。池化层通过最大池化或平均池化的方式实现降采样,以此来降低训练样本数量和提高训练速度。最后的全连接层对通过此前卷积和池化提取的特征使用前向神经网络分类得到输出。卷积神经网络架构如附图2所示。
长短期记忆模型是一种改进优化的循环神经网络模型,标准循环神经网络模型在隐含层中只包含相对简单的记忆模块,在训练模型时极易出现梯度消失的问题。为了进一步提升循环神经网络模型,长短记忆网络把隐含层设计成更复杂的结构,主要通过遗忘门、输入门、输出门来增减记忆单元的信息,如附图3所示。
步骤103,利用所述训练样本集训练所述卷积神经网络模型,获得训练后的卷积神经网络模型。
在训练过程中,对于卷积神经网络而言,{(x(1),y(1)),(x(2),y(2)),…,(x(n),y(n))}表示训练集,x表示输入信息,y表示对应标签。hw,b(x)为神经网络的输出,表示其预测得分,则其损失项可表示为:
整个训练集的损失函数可以表示为:
式中,n代表标签个数;γ为权重项缩放系数;s
l和s
l+1代表l和l+1层上的神经元节点数;n
l代表卷积网络的层数;
代表l层上第i个节点与l+1层上第j个节点之间的权重参数。式中第一部分是均方根误差,第二部分是正则项,其作用是约束权重参数以避免过度拟合。
使用随机梯度下降法来更新权重和偏置参数:
式中,α表示学习率,作用是调节梯度下降的速度。
步骤104,利用所述训练样本集训练所述长短记忆模型,获得训练后的长短记忆模型。
给定一个输入x,长短期记忆网络的输出为y,每个时刻记忆单元经过各个门接收当前输入xt、来自上一隐藏状态输出ht-1和内部单元状态ct-1,长短记忆网络的计算过程如下:
遗忘门ft决定哪些信息将从记忆单元状态Ct-1中删除,并由激活函数σ(·)来决定遗忘门的激活状态:
ft=σ(Wfxxt+Wfhht-1+WfcCt-1+bf)
式中的输出ft是对应于最后一个单元状态Ct-1的0到1之间的值。当Ct-1取0时意味着完全忘记最后的状态,取值为1表示完全保持最后的状态。
其次,长短记忆网络使用输入门it来决定将要存储到新的单元状态Ct的新信息,计算过程如下:
it=σ(Wixxt+Wihht-1+WicCt-1+bi)
Ut=g(Wcxxt+Wchht-1+bc)
式中,Ut为添加到新单元状态Ct的候选值;g(·)为激活函数。
旧记忆单元状态Ct-1更新为新状态Ct的过程如下所示:
Ct=Ct-1ft+Utit
式中Ct-1ft作用是确定有多少信息将从Ct-1中遗忘,Utit确定有多少信息添加到新单元状态Ct。
最后使用输出门ot计算输出信号ht(最后一层输出的ht即为模型整体输出)的过程如下:
ot=σ(Woxxt+Wohht-1+WocCt-1+bo)
式中激活函数σ为sigmoid函数;
和g为tanh函数;W
fx表示输入信息x
t的遗忘门权值矩阵;W
ix、W
cx表示输入信息x
t的输入门权值矩阵;W
ox表示输入信息x
t的输出门权值矩阵;W
fh表示上一隐藏状态h
t-1的遗忘门权值矩阵;W
ih、W
ch表示上一隐藏状态h
t-1的输入门权值矩阵;W
oh表示上一隐藏状态h
t-1的输出门权值矩阵;W
fc表示内部单元状态C
t-1的遗忘门权值矩阵;W
ic表示内部单元状态C
t-1的输入门权值矩阵;W
oc表示内部单元状态C
t-1的输出门权值矩阵;b
f、b
i、b
c、b
o表示各个门的输入偏置。
针对梯度下降法的缺陷,对于长短记忆网络的优化问题,本发明提出了一种自适应时刻估计方法(ADAM,Adaptivemomentestimation),ADAM能根据不同参数状态,设计定制化的自适应性学习率,从而使得ADAM算法适用于非平稳或梯度稀疏梯度的问题。采用ADAM来更新长短记忆网络的参数,以提高模型挖掘负荷曲线变化趋势的能力。
步骤105,将训练后的卷积神经网络模型与训练后的长短记忆模型的输出端与Lasso回归模型的输入端连接,构建园区短期负荷预测模型。
步骤106,利用所述训练样本集对所述短期负荷预测模型的Lasso回归模型进行训练,获得训练后的园区短期负荷预测模型。
本发明中的模型将不同类型的深度学习算法动态结合,以获得更好的预测效果,在模型的第一层中首先使用长短记忆模型与卷积神经网络模型对负荷预测相关数据分别进行训练,在第二层中使用权值分配方式,将第一层中的预测结果动态结合,使得第一层模型的计算结果能够取长补短,提高预测效果,其中,第二层模型选择的是Lasso回归方法。
Lasso回归方法是一种同时进行特征选择和正则化的线性回归分析方法,其基本思想是在回归系数绝对值之和小于一个阈值的条件下,使残差平方和最小化,将相关性较低的变量的系数压缩为0,然后删除这些特征变量,从而达到降低输入维度的目的。
对于普通线性模型,可表示为:
Y=Xβ+ε
式中,Y为最终负荷预测值,X=(X(1),X(2))分别对应第一层模型中长短记忆网络与卷积神经网络的预测值,随机误差项εi~N(0,σ2),ε=(ε1,ε2,…,εn)T,β=(β1,β2,…βd)T为回归系数,n与d为回归系数的个数。Lasso回归方法在其中增加L1惩罚项,得到Lasso估计
式中,λ为调节系数,
为最终长短记忆网络与卷积神经网络的预测值所对应的动态权重,在模型训练过程中需要求解权重,当权值计算完成即代表负荷预测模型建立完成。
步骤107,获取园区当前时刻的用户画像信息、负荷数据、天气数据、节假日数据输入所述训练后的园区短期负荷预测模型,得到下一时刻的负荷预测值。
在线预测环节,实际应用中在数据库中所采集信息(包含园区用户画像信息与负荷相关数据)输入到已经训练好的双层模型中,得到最终预测结果。精确的预测结果有利于园区能源系统安全可靠运行。
一种基于园区画像的园区负荷预测系统,所述识别系统包括:
训练样本集构建模块,用于获取园区的历史用户画像信息、历史负荷数据、历史天气数据和历史节假日数据作为输入数据,获取每组输入数据对应的检测时间的下一时刻检测的负荷数据作为输出,,构建训练样本集;
模型构建模块,用于构建园区负荷预测的卷积神经网络模型和长短记忆模型。所述卷积神经网络模型包括输入层、多个隐含层和全连接层;所述隐含层包括多个卷积层和多个池化层。所述长短记忆模型包括遗忘门、输入门和输出门。
卷积神经网络模型训练模块,用于利用所述训练样本集训练所述卷积神经网络模型,获得训练后的卷积神经网络模型;所述卷积神经网络模型训练模块包括:第一参数更新子模块,用于利用随机梯度下降法更新所述卷积神经网络模型中的权重和偏置参数。
长短记忆模型训练模块,用于利用所述训练样本集训练所述长短记忆模型,获得训练后的长短记忆模型;
园区短期负荷预测模型构建模块,用于将训练后的卷积神经网络模型与训练后的长短记忆模型的输出端与Lasso回归模型的输入端连接,构建园区短期负荷预测模型。
所述长短记忆模型训练模块包括:第二参数更新子模块,用于采用自适应时刻估计法更新长短记忆模型的权值参数和输入偏置参数。
园区短期负荷预测模型训练模块,用于利用所述训练样本集对所述短期负荷预测模型的Lasso回归模型进行训练,获得训练后的园区短期负荷预测模型;
预测模块,用于获取园区当前时刻的用户画像信息、负荷数据、天气数据、节假日数据输入所述训练后的园区短期负荷预测模型,得到下一时刻的负荷预测值。
为了验证本发明的预测方法及系统的预测效果,本发明提供一种具体的实施方式。
第一:本发明参考了深度学习算法在多个领域(图像处理、语音识别等方面)的应用,并将深度学习的尖端人工智能技术与能源领域相关问题结合,提出了一种基于人工智能与客户画像分析的短期负荷预测模型。实施案例选用北京某地区负荷实际数据进行验证,该场景下为居民负荷用电情况,预测目标为下一小时负荷。采用的误差指标包含平均相对误差MAPE、均方根误差RMSE,表示如下:
式中,n为数据集的样本数量,ai与bi分别i时刻的真实值与预测值。
第二:长短记忆网络与卷积神经网络的结构参数选择均较为困难,两者的参数选择具有极大相似性,结构参数同时包含了神经元、隐含层和训练代数。本发明以长短记忆网络在负荷预测任务中的结构参数选择为例,分析差异化参数对模型预测误差的影响。其中,变量数目和训练时长分别作为时间和空间复杂程度的计算指标。表1分析了不同隐含层在测试集上预测效果。当模型含有2层隐含层时,测试数据的RMSE为最优4.21%,这说明当前配置的长短记忆网络模型最匹配负荷数据情况。当隐含层为3或4层时,RMSE下降,模型产生了过拟合,预测精度随之降低。表2分析了神经元数量对模型建立的影响。神经元数量为32时,RMSE达到最优4.21%。神经元个数继续增加时,空间、时间复杂度增加,测试样本的RMSE迅速升高,此时模型也产生了过拟合效应。当训练次数小于120代时,测试集和训练集的RMSE明显随着迭代次数增加而较低;当训练次数为120代时,测试集达到最高精度;当训练次数大于120代时,随着训练代数增加,虽然训练集精度继续提高,但是测试集精度已经降低,此时再进行训练会使得模型过度学习,预测模型性能降低,如附图5所示。基于上述分析,本文模型参数为2层隐含层,每层32节点,迭代次数为120代。
表1长短记忆模型的隐含层层数与预测结果数据表
层数量 |
RMSE/% |
变量数目 |
训练时长/s |
1 |
4.61 |
660 |
42 |
2 |
4.21 |
1020 |
61 |
3 |
4.70 |
1420 |
97 |
4 |
5.02 |
1820 |
132 |
表2长短记忆模型的神经元数量与预测结果数据表
神经元数量 |
RMSE/% |
变量数目 |
训练时长/s |
16 |
5.23 |
412 |
17 |
32 |
4.21 |
1526 |
61 |
64 |
4.43 |
4236 |
492 |
128 |
4.99 |
9640 |
900 |
第三:本发明对两种场景下预测结果进行分析,分别选取了一周的时段进行比较,并将使用本发明设计的算法与传统BP神经网络算法(单层隐藏层)的预测结果进行对比,附图6和附图7分别选择了测试集中某周负荷预测仿真结果进行比较,可知使用深度学习组合模型的预测精度均优于传统BP神经网络模型。当负荷曲线产生较大波动时,本发明采用的深度学习组合预测模型仍然能较好的跟踪变化。BP神经网络的学习能力有限,预测效果明显弱于本发明组合模型。
相较于常规预测算法,单一深度学习算法虽然能够获得较好的预测效果,但是该类型算法的模型层数与节点数较多,模型中往往包含较多信息,模型在训练过程中有陷入局部极小值的风险。有的局部极小点所对应的模型泛化性能可能较差,而通过组合深度学习模型进行结合之后,可有效减少陷入局部极小点的风险。组合后的深度学习模型充分发挥各个算法自身优势,摒弃了各个算法中预测效果较差的环节。因此,采用组合学习方式后能够有效提高负荷预测的精度。
本说明书中等效实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,等效实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。