CN111461378A

CN111461378A - 一种电网负荷预测方法和装置

Info

Publication number: CN111461378A
Application number: CN201910048314.1A
Authority: CN
Inventors: 宋宗耘; 张健; 刘庆; 杨健; 唐易木
Original assignee: Electric Power Planning and Engineering Institute Co Ltd
Current assignee: Electric Power Planning and Engineering Institute Co Ltd
Priority date: 2019-01-18
Filing date: 2019-01-18
Publication date: 2020-07-28

Abstract

本发明实施例提供了一种电网负荷预测方法和装置，其中方法包括：获取调控参数和环境参数，所述调控参数至少包括预设产品的单位时间段内的计划产量；向贝叶斯神经网络BNN模型输入待预测样本，得出负荷预测值，其中，所述待预测样本包括所述调控参数和所述环境参数，所述BNN模型的训练过程使用的训练样本包括调控参数样本和环境参数样本，所述负荷预测值为所述单位时间段内的负荷预测值。本发明实施例可以提升所述BNN模型得出的负荷预测值的准确性。

Description

一种电网负荷预测方法和装置

技术领域

本发明涉及电力系统负荷预测技术领域，尤其涉及一种电网负荷预测方法和装置。

背景技术

电网技术中的负荷预测是制定生产计划、停电计划等的重要依据，以避免电网负荷过剩或者欠负荷而造成能源的浪费和影响电网的稳定性。

随着当前环境的日益严峻，对于钢铁、炼铁、炼钢、水泥等产品，其生产过程中消耗的电量占部分电网的负荷的比重较大。而且这些产品在生产过程中会产生大量污染排放物，需要根据空气质量参数进行相应的调控。例如：在空气质量较好的情况下，增加钢铁、炼铁、炼钢、水泥等产品的产量，同时增加了电网的耗电量；在空气质量较差的情况下，减少钢铁、炼铁、炼钢、水泥等产品的产量，同时减少了电网的耗电量。

在相关技术中，仅将类峰值负荷、日类型、气温、风速、降水等环境参数作为BP(back propagation，反向传播)神经网络预测模型的负荷预测输入指标，以预测电网的负荷预测值。

对于钢铁、炼铁、炼钢、水泥等产品的产量的变化对于电网负荷预测值的影响，并没有提出一种有效的预测方法，从而造成预测出的电网负荷预测值不准确。

由此可知，现有技术中的负荷预测方法预测出的负荷预测值存在不准确的问题。

发明内容

本发明实施例提供一种电网负荷预测方法和装置，以解决现有技术中的负荷预测方法预测出的负荷预测值存在的不准确的问题。

为解决以上技术问题，本发明采用如下技术方案：

第一方面，本发明实施例提供了一种电网负荷预测方法，所述方法包括：

获取调控参数和环境参数，所述调控参数至少包括预设产品的单位时间段内的计划产量；

向贝叶斯神经网络BNN模型输入待预测样本，得出负荷预测值，其中，所述待预测样本包括所述调控参数和所述环境参数，所述BNN模型的训练过程使用的训练样本包括调控参数样本和环境参数样本，所述负荷预测值为所述单位时间段内的负荷预测值。

可选的，所述调控参数还包括空气质量指数。

可选的，在向BNN模型输入待预测样本，得出负荷预测值之前，所述方法还包括：

根据所述调控参数和所述环境参数，确定所述待预测样本所属的样本类型；

所述向BNN模型输入待预测样本，得出负荷预测值的步骤，包括：

向所述待预测样本所属的样本类型对应的目标BNN模型输入所述待预测样本，得出所述负荷预测值，其中，所述目标BNN模型为BNN模型集中与所述待预测样本所属的样本类型对应的BNN模型，所述BNN模型集中包括与多个样本类型分别对应的多个BNN模型。

可选的，所述待预测样本所属的样本类型通过以下方式确定：

获取历史样本集，所述历史样本集包括在历史时间段内的n个训练样本，其中，所述历史样本集包括所述训练样本集，n为大于1的整数，且每一个训练样本包括所述调控参数样本、所述环境参数样本以及实测负荷值；

采用聚类挖掘算法DKM将所述n个训练样本划分为k个聚类簇，其中， k为大于1且小于或者等于n的整数，每一个聚类簇分别包括至少一个训练样本，且每一个聚类簇分别对应一个样本类型；

确定所述待预测样本所属的第一聚类簇，并确定所述待预测样本的样本类型为所述第一聚类簇对应的样本类型。

可选的，通过以下过程将所述n个训练样本划分为k个聚类簇：

确定所述n个训练样本中每一个训练样本的密度，其中，所述每一个训练样本的密度为以半径为r且以所述每一个训练样本为中心的球体所覆盖的空间坐标区域内的训练样本的数量，其中，所述r为预设常数，所述n个训练样本分别位于所述空间坐标内；

将相隔距离较远的k个训练样本分别作为所述k个聚类簇的初始中心点： Z₁,Z₂,…,Z_k，其中，所述初始中心点的密度大于平均密度，所述平均密度等于所述n个训练样本的密度的平均值；

将除了所述Z₁,Z₂,…,Z_k之外的n－k个训练样本划分为k个矩阵M₁,M₂,…,M_k，所述M₁,M₂,…,M_k分别与所述Z₁,Z₂,…,Z_k对应，其中，每一个初始中心点的密度与其对应的矩阵中的训练样本的密度之间的差值小于预设差值，且所述k个矩阵中的训练样本的密度均大于所述平均密度；

在每一个矩阵对应的初始中心点与所述每一个矩阵中的目标训练样本之间的离差平方和取最小值的情况下，将所述初始中心点修改为所述目标训练样本；

根据修改后的初始中心点，确定其对应的聚类簇中包含的训练样本。

可选的，所述目标BNN模型通过以下方式确定：

分别将所述第一聚类簇中的训练样本划分为训练集和检验集；

将所述训练集作为所述训练样本集，训练得出所述第一聚类簇对应的目标 BNN模型；

在训练得出所述第一聚类簇对应的目标BNN模型之后，所述方法还包括：

将所述检验集中的训练样本分别输入所述目标BNN模型，得出预测值序列，其中，所述预测值序列包括与所述检验集中的每一个训练样本对应的负荷预测值；

根据所述预测值序列中的每一负荷预测值与对应的实测负荷值之间的差值，确定所述目标BNN模型的误差序列。

可选的，所述将所述训练集作为所述训练样本集，训练得出所述第一聚类簇对应的目标BNN模型的步骤，包括：

确定所述目标BNN模型的目标函数为所述训练集中的训练样本的似然函数，所述目标函数包括待确定的权值参数w和超参数；

根据所述目标BNN模型的所述w的预设先验概率分布和所述训练集中的训练样本，确定所述w和所述阈值的后验概率分布，所述后验概率分布通过以下公式表示：

其中，所述超参数包括α和β，所述D表示所述训练集，所述H为所述目标BNN模型中隐含层的节点数；p(D|w,β,H)为所述D的似然函数， p(w|α,H)为所述w的所述预设先验分布，p(D|α,β,H)为所述D的全概率分布，所述α和所述β均为常数；

在所述p(w|D,α,β,H)取最大值的情况下，确定所述α和所述β的值，以及确定所述w等于所述p(w|D,α,β,H)的权向量。

可选的，在向BNN模型输入待预测样本，得出负荷预测值之后，所述方法还包括：

根据所述误差序列，确定广义回归条件异方差GARCH模型；

根据所述GARCH模型，修正所述负荷预测值的误差，得到目标负荷预测值。

可选的，所述GARCH模型通过以下方式确定：

所述GARCH模型，表示为以下公式：

y_t＝x_tγ+u_t

其中，所述y_t为t时刻的负荷预测值的误差值，所述x_t为t时刻的修正前的负荷预测值，所述γ为系数向量，所述u_t为残差，所述u_t表示为以下公式：

所述v_t为均值为0且方差随时间变化的标准正态分布，所述

为条件标准差，

表示为以下公式：

所述α₀、所述α_i以及所述β_j均为常数，所述

为t－i时刻的残差平方，所述

为t－j时刻的条件方差，所述p为移动平均项的最大滞后阶数，所述q为自回归项的最大值滞后阶数，所述i为小于或者等于所述p的正整数，所述j为小于或者等于所述q的正整数；

求解上述公式，得出所述γ和所述u_t的值，以确定所述GARCH模型。

第二方面，本发明实施例提供了一种电网负荷预测装置，包括：

获取模块，用于获取调控参数和环境参数，所述调控参数至少包括预设产品的单位时间段内的计划产量；

预测模块，用于向贝叶斯神经网络BNN模型输入待预测样本，得出负荷预测值，其中，所述待预测样本包括所述调控参数和所述环境参数，所述BNN 模型的训练过程使用的训练样本包括调控参数样本和环境参数样本，所述负荷预测值为所述单位时间段内的负荷预测值。

第三方面，本发明实施例提供了一种电子设备，包括：存储器、处理器以及存储器、处理器、显示屏及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现本发明方法实施例中提供的所述的电网负荷预测方法中的步骤。

第四方面，本发明实施例提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现本发明方法实施例中提供的所述的电网负荷预测方法中的步骤。

在本发明实施例中，获取调控参数和环境参数，所述调控参数至少包括预设产品的单位时间段内的计划产量；向贝叶斯神经网络BNN模型输入待预测样本，得出负荷预测值，其中，所述待预测样本包括所述调控参数和所述环境参数，所述BNN模型的训练过程使用的训练样本包括调控参数样本和环境参数样本，所述负荷预测值为所述单位时间段内的负荷预测值。这样，可以在预测负荷预测值的过程中将生产所述预设产品而消耗的用电量计入对所述负荷预测值的影响，从而使预测得到的所述负荷预测值的准确性更高。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的一种电网负荷预测方法的流程图；

图2是本发明实施例提供的另一种电网负荷预测方法的流程图；

图3是本发明实施例提供的一种DKM-BNN-GARCH模型的原理图；

图4是本发明实施例中的三个聚类簇中样本数据在空间坐标中的分布图；

图5是本发明实施例中BNN模型、DKM-BNN模型分别与实际日负荷值的比较图；

图6是本发明实施例中BNN模型与DKM-BNN模型的比较图；

图7是本发明实施例中的噪声检测结果示意图；

图8是本发明实施例中8月份的预测误差消减相对值的示意图；

图9是本发明实施例中多种模型得出的日峰值负荷的比较图；

图10是本发明实施例中BNN模型、DKM-BNN模型和 DKM-BNN-GARCH模型的比较图；

图11是本发明实施例提供的一种电网负荷预测装置的结构图；

图12是本发明实施例提供的另一种电网负荷预测装置的结构图；

图13是本发明实施例提供的另一种电网负荷预测装置的结构图；

图14是本发明实施例提供的一种电子设备的结构图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参阅图1，是本发明实施例提供的一种电网负荷预测方法的流程图，如图1所示，该方法包括以下步骤：

步骤101、获取调控参数和环境参数，所述调控参数至少包括预设产品的单位时间段内的计划产量。

其中，所述环境参数可以包括类峰值负荷、所述单位时间段的类型、气温、风速、降水等对负荷预测值产生影响的非调控因素，在此不做限定。

所述调控参数可以包括人为调控的参数，例如：钢铁的计划产量、计划停电等，在此不做限定。

所述预设产品可以包括钢铁、水泥等在生产过程中消耗大量电能的产品，在此不做限定。

优选的，所述单位时间段内的计划产量可以是日计划产量，相应的根据所述日计划产量得出的负荷预测值为日负荷预测值，例如：日峰值负荷预测值、日平均负荷预测值等。

当然，所述单位时间长度还可以是月、周、小时等，其他时间长度，在此不做限定。

步骤102、向贝叶斯神经网络(Bayesian neutral network，BNN)模型， BNN模型输入待预测样本，得出负荷预测值，其中，所述待预测样本包括所述调控参数和所述环境参数，所述BNN模型的训练过程使用的训练样本包括调控参数样本和环境参数样本，所述负荷预测值为所述单位时间段内的负荷预测值。

其中，所述BNN模型又可以称之为基于贝叶斯框架下的反向传播算法神经网络模型，其训练过程使用的训练样本包括调控参数样本和环境参数样本，可以使所述BNN模型与所述包括调控参数样本和环境参数样本的训练样本更加匹配，从而提升采用所述BNN模型得出的负荷预测值的准确度。

另外，所述负荷预测值为所述单位时间段内的负荷预测值，是指，所述负荷预测值可以是与所述单位时间内的计划产量、环境参数等匹配的日负荷预测值、周负荷预测值等，在此不做限定。

需要说明的是，所述待预测样本中除了所述调控参数和所述环境参数以外还可以包括其他参数，例如：根据所述待预测样本所属的类型，可以在所述 BNN模型中输入与所述类型匹配的权参数等，以增加所述BNN模型与所述待预测样本所属的类型的匹配程度，在此不作具体限定。

本步骤中，通过采用包括调控参数样本和环境参数样本的训练样本训练处所述BNN模型，从而使所述BNN模型与所述包含调控参数和所述环境参数的待预测样本更加匹配，便于根据所述调控参数和所述环境参数对所述负荷预测值的综合影响，得出准确度更高的负荷预测值，以提升所述电网负荷预测方法的准确度。

请参阅图2，是本发明实施例提供的另一种电网负荷预测方法的流程图，如图2所示，该方法包括以下步骤：

步骤201、获取调控参数和环境参数，所述调控参数至少包括预设产品的单位时间段内的计划产量。

可选的，所述调控参数还包括空气质量指数。

需要说明的是，在所述空气质量指数表示所述空气质量越差的情况下，可以适当的减少所述负荷预测值，以避免火力发电等污染排放量高的发电装置产生过多的污染物而进一步恶化环境。

当然，还可以根据所述空气质量指数确定水泥生产、化工生产等能耗量和污染排放量较高和产品的计划产量，以在空气质量好的时候，适当的提升该产品的产量，在空气质量较差的时候，适当的减少该产品的产量。以避免空气质量恶化，提升所述电网负荷预测值的环保性能。

步骤202、根据所述调控参数和所述环境参数，确定所述待预测样本所属的样本类型。

步骤203、向所述待预测样本所属的样本类型对应的目标BNN模型输入所述待预测样本，得出所述负荷预测值，其中，所述目标BNN模型为BNN 模型集中与所述待预测样本所属的样本类型对应的BNN模型，所述BNN模型集中包括与多个样本类型分别对应的多个BNN模型。

其中，所述待预测样本所述的样本类型不同，可以是指所述待预测样本中的调控参数、环境参数中的至少一个的取值不同或者差异过大。另外，所述 BNN模型集中不同的BNN模型中的参数可以不同。这样，可以通过BNN模型集中不同的BNN模型分别对相应样本类型的待预测样本进行预测，以避免所述BNN模型不适用于所述待预测样本所属的样本类型，从而使得出的负荷预测值不准确。

作为一种可选的实施方式，所述待预测样本所属的样本类型通过以下方式确定：

采用DKM将所述n个训练样本划分为k个聚类簇，其中，k为大于1且小于或者等于n的整数，每一个聚类簇分别包括至少一个训练样本，且每一个聚类簇分别对应一个样本类型；

其中，所述实测负荷值为所述训练样本实际测得的负荷值，可以用于检验所述BNN模型根据所述训练样本得出的负荷预测值的准确性，从而确定所述 BNN模型的准确性。

另外，所述聚类挖掘算法(Density K-medoids algorithm，DMK)可以根据所述n个训练样本中每个训练样本周围训练样本的密度，将所述n个训练样本划分为多个聚类簇，每一个聚类簇中包含的训练样本的密度相近。

本实施方式中，采用DMK算法将历史样本集中的训练样本划分为多个聚类簇，且每一个聚类簇分别对应一个样本类型，从而使密度相近的训练样本属于一个样本类型，相较于现有技术中，随机的选择初始中心点的方式，可以减少迭代初始中心点的次数，从而简化了划分训练样本的样本类型的过程。

作为一种可选的实施方式，通过以下过程将所述n个训练样本划分为k 个聚类簇：

将除了所述Z₁,Z₂,…,Z_k之外的n－k个训练样本划分为k个矩阵 M₁,M₂,…,M_k，所述M₁,M₂,…,M_k分别与所述Z₁,Z₂,…,Z_k对应，其中，每一个初始中心点的密度与其对应的矩阵中的训练样本的密度之间的差值小于预设差值，且所述k个矩阵中的训练样本的密度均大于所述平均密度；

其中，所述训练样本的密度可以根据以该训练样本为圆心，绘制一个半径为r的球体，该球体中包含的训练样本的数量便可以作为所述密度。

例如：可以通过以下公式计算所述n个训练样本的密度：

Density(x_i)＝{p∈C|dist(x_i,p)≤r}(i＝1,2,…,n)

其中，p∈C表示p为以x_i为圆心并以r为半径形成的球体中包含的样本集 C中的任一训练样本，dist(x_i,p)表示x_i与p之间的欧氏距离，r表示预设半径值，i取1至n中的任意整数。

这样，满足上述公式的p的数量，即为所述x_i的密度。

其中，r的大小可以根据所述训练样本集中各个训练样本之间距离的平均值确定。

例如：

其中，u表示历史样本集中所有训练样本之间的距离的均值，n表示所述历史样本集中包含的训练样本的数量，x_i表示所述历史样本集中第i个训练样本，x_j表示所述历史样本集中第j个训练样本，dist(x_i,x_j)表示求x_i与x_j之间的欧氏距离，θ为常数，i和j分别可以取1至n中的任意整数。

当然，所述r还可以是其他任意预设的半径值。

另外，每一个初始中心点的密度与其对应的矩阵中的训练样本的密度之间的差值小于预设差值，这样，可以确保同一矩阵中训练样本的密度相近，使属于同一样本类型的训练样本很大概率的包含于同一矩阵中。

所述n个训练样本的平均密度可表示为以下公式：

其中，∑Density(x_i)表示对n个训练样本的密度求和。

本实施方式中，在每一个矩阵对应的初始中心点与所述每一个矩阵中的目标训练样本之间的离差平方和取最小值的情况下，将所述初始中心点修改为所述目标训练样本，表示选择一个最优的目标训练样本替代所述初始中心点，作为修改后的初始中心点。

上述确定k个初始中心点的过程，可以是一个迭代的过程，例如：

首先，确定所述n个训练样本中，满足条件Density(x_i)＞Density_average的训练样本形成的对象集S；

选取所述S中密度最大的一个训练样本作为初始中心点Z₁，选取所述S 中距离Z₁最远的一个训练样本作为初始中心点Z₂；

从集合S中剔除Z₁和Z₂后，重新计算Density(x_i)和Density_average，并重复迭代上述两个步骤，直至找到第k个初始中心点Z_k。

这样，可以确定出密度较大且相隔距离较远的k个初始中心点。

另外，密度相近的训练样本，很可能属于同一聚类簇，可以通过以下公式确定与所述k个初始中心点分别对应的k个矩阵：

通过以下公式确定第i个举证中包含的训练样本：

M_i＝{p∈S|dist(Z_i,p)≤Density_average}

其中，p∈S表示p为集合S中的任一训练样本，dist(Z_i,p)表示初始中心点Z_i与p之间的欧氏距离。

这样，在集合S中的训练样本p满足与初始中心点之间的欧式距离，且该欧式距离小于Density_average时，便可以确定该训练样本p属于初始中心点Z_i对应的矩阵M_i中。

本实施方式中，所述在每一个矩阵对应的初始中心点与所述每一个矩阵中的目标训练样本之间的离差平方和取最小值的情况下，将所述初始中心点修改为所述目标训练样本的过程，可以是一个迭代的过程，例如：

将矩阵中任一训练样本替代所述初始中心点后，计算离差平方和，若该离差平方和小于替代前的离差平方和，则表示该替代后的训练样本比替代前的初始中心点更加适合作为该矩阵对应的聚类簇的聚类中心。

其中，离差平方和可通过以下公式计算得出：

其中，

表示第i个矩阵M_i的离差平方和，k为所述初始中心点的数量， x为所述M_i中的任一训练样本，O_i表示第i个初始中心点。

分别将矩阵M_i中的各个训练样本代入上述公式，并在得出的离差平方和小于替代前的离差平方和的情况下，确认该替代有效，即确定所述初始中心点为替代后的所述训练样本。

需要说明的是，每替代一次初始中心点需要根据替代后的初始中心点重新确定该替代后的初始中心点所对应的聚类簇中包含的训练样本的数量。

然后从重新确定的聚类簇中选择一个训练样本以替代上一次的初始中心点，并根据本次替代后的初始中心点重复上计算离差平方和，并依照上述过程进行重复迭代，直至得出的离差平方和与上一次迭代过程中的离差平方和相等的情况下，确定该次替代后的初始中心点为最终的初始中心点。

另外，上述根据修改后的初始中心点，确定其对应的聚类簇中包含的训练样本的可以是，将所述集合S中除了k个最终的初始中心点以外的训练样本，分配至距离最近的一个初始中心点对应的聚类簇中。

这样，可以确保各个聚类簇中包含的训练样本的相似度高。

作为一种可选的实施方式，所述目标BNN模型通过以下方式确定：

其中，在BNN模型中输入xi后可以得出对应的输出y。其中，xi为样本数据，y为与该样本数据对应的负荷预测值，BNN模型包括权参数w，所述权参数w又可以称之为权向量w或者权向量参数w。

通过将检验集分别输入所述目标BNN模型，并将得出的负荷预测值与对应的实测负荷值进行比较，得出所述目标BNN模型的误差序列，从而可以根据该误差序列确定该目标BNN模型的误差率，或者根据该误差序列对所述目标BNN模型进行改进，以减少所述目标BNN模型的误差。

进一步的，所述将所述训练集作为所述训练样本集，训练得出所述第一聚类簇对应的目标BNN模型的步骤，包括：

其中，求解公式：

的具体过程为：

假设w的先验分布服从最为常见的正态分布，即：

其中，m为w的维数即权重参数和阈值参数的总个数，exp(-αE_W)表示 (-αE_W)的指数函数，Z_W和Z_W(α)为公式替代符。其中，E_W替代的公式为：

Z_W(α)替代的公式为：

其中，假设训练集表示为D＝{x_i,t_i}^N，其中，N表示所述训练集D中包含的训练样本的数量，其为大于1的整数，x_i表示所述训练集D中第i个训练样本。

另外，所述训练集D中不可避免的存在噪声δ_i，x_i与t_i之间的函数关系f 可表示为t_i＝f(x_t)+δ_i。

假设噪声δ_i服从均值为0，方差为

的正态分布，则噪声δ_i的分布函数可表示为以下公式：

假设所述训练集D中的训练样本服从相互独立的同一分布，则噪声δ_i的分布函数可表示为以下公式：

将δ_i＝t_i-f(x_t)带入上述公式，得到训练集D的似然概率分布函数：

其中，Z_D(β)为公式替代符，其替代的公式为

E_D表示所述BNN模型根据训练集D得出的误差函数。

将所述

和所述

带入所述

即可得到以下后验分布的公式：

令S(w)＝αE_W+βE_D，则得出以下公式：

其中，S(w)为正则误差函数，Z_S(α,β)为归一化因子所述 Z_S(α,β)＝∫exp(-S(w))dw，其取值不依赖于权值参数w，表示对(-S(w))的指数函数求积分。

因此，在求出S(w)的最小值后，便可以确定后验分布的最大值。

假设S(w)在w^*处取得最小值，则在点w^*处对式

进行二阶泰勒展开，得出以下公式：

其中，w^*为w的假设值，由于S(w)在w^*处取得最小值，故▽S(w^*)＝0，由此可得出以下公式：

式中，▽▽S(w^*)为S(w)在w^*处的黑塞(Hessian)矩阵，且▽▽S(w^*)＝α▽▽E_W(w^*)+β▽▽E_D(w^*)。

其中，超参数α和β用于控制BNN模型的复杂度，为利用α和β训练BNN 模型，需要求出是后验概率分布最大时的α和β的参数值。

具体的，超参数α和β的后验分布如下公式所示：

其中，p(D|H)为归一化因子，其取值与α、β无关，p(α,β|H)为先验分布，在训练样本足够多的情况下的先验分布变化微小，p(D|α,β,H)为似然函数。

其中，似然函数p(D|α,β,H)为式

的归一化因子，即：

将公式

公式

和公式

带入上述公式，得出：

将上述公式的等式两变分别取对数，得出以下公式：

将上述公式的等式两边分别对α、β求偏导，其中，假设后验概率分布取最大值时，α的取值为α^*，且β的取值为β^*。则所述α^*和所述β^*分别表示为以下公式：

其中，γ为公式替代符，其替代的公式为

K为出入参数个数，λ_k为E_D的Hessian矩阵的特征值。

这样，便可以得出权值参数w的后验概率分布取最大值时的，并确定后验概率分布取最大值时权值参数w的取值。

并将上述得出的w、α和β的参数值分别代入所述BNN模型，便可以得出所述目标BNN模型。

本实施方式中，BNN模型以权值参数w的后验分布为优化目标函数，通过学习得到最佳的权值参数w，以优化神经网络模型的泛化能力，提高BNN 模型的预测性能。

当然，可以采用不同聚类簇中的训练样本分别执行上述训练过程，以得出与各个聚类簇分别对应的BNN模型，在此不再重复。

作为一种可选的实施方式，在向BNN模型输入待预测样本，得出负荷预测值之后，所述方法还包括：

根据所述误差序列，确定广义回归条件异方差GARCH模型；

其中，采用GARCH模型修正所述负荷预测值的误差，可以避免所述BNN 模型中输入的多个待预测样本与输出的多个负荷预测值之间的映射关系存在较大差异而造成预测结果存在误差的情况，从而提升所述电网负荷预测方法的准确性。

作为一种可选的实施方式，所述GARCH模型通过以下方式确定：

所述GARCH模型，表示为以下公式：

y_t＝x_tγ+u_t

所述v_t为均值为0且方差随时间变化的标准正态分布，所述

为条件标准差，

表示为以下公式：

所述α₀、所述α_i以及所述β_j均为常数，所述

为t－i时刻的残差平方，所述

为t－j时刻的条件方差，所述p为移动平均项的最大滞后阶数，所述 q为自回归项的最大值滞后阶数，所述i为小于或者等于所述p的正整数，所述j为小于或者等于所述q的正整数；

其中，

为移动平均项，等于前一期残差平方

与权重α_i的乘积的累加。

本实施方式中，相对于现有技术中的方差方程比式：

其中，增加了一个GARCH项。

对于GARCH(p,q)模型，其条件方差

表示如下：

其约束条件为表示为以下公式：

另外，在p和q等于1的情况下，所述GARCH模型，表示为以下公式：

y_t＝x_tγ+u_t

其中，

所述

为移动平均项，等于前一期残差平方

与权重α的乘积，所述

为自回归项，即GARCH项，由前一期条件方差

和对应的权重β确定。

上述公式的约束条件为：

由上述公式和约束条件便可以确定所述权重α、β、γ和所述u_t的值，从而确定所述GARCH模型。

在本发明实施例中，根据所述待预测样本所述的样本类型，将其输入与该类型匹配的BNN模型中，从而避免不同的待预测样本之间差异过大而造成的同一个BNN模型不能适用或者根据部分待预测样本得出的负荷预测值的准确率低的问题，从而使预测得到的所述负荷预测值的准确性更高。

下面以地区A在某一年中的日峰值负荷为预测和训练BNN模型的对象，进行说明与验证，如图3所示，本实施例中采用DKM-BNN-GARCH模型对地区A的日峰值负荷进行预测和训练，即，先采用DKM对训练样本进行分类 (划分为k个聚类簇，分别为：C₁，C₂，…，C_k)，每一样本类型对应一个不同的BNN模型，并将BNN模型输出的日峰值负荷初步预测值Demand_p采用GARCH模型进行误差修正得到修正后的预测值Demand_p ^*。

其中，BNN模型的输入参数包括调控参数，在此以所述调控参数包括钢铁和水泥的日计划生产量以及空气污染指数。

所述BNN模型的输入还包括

输出为

其中，

表示第i 个聚类簇中的训练样本中除了所述调控参数以外的参数，所述

表示根据所述第i个聚类簇中的训练样本得出的日峰值负荷预测结果。

本实施例中，收集A地区在6月1日至8月30日期间92天的日峰值负荷和气象数据，形成训练样本集。假设DKM算法将所述训练样本集划分为三种样本类型，选取待预测样本7日前的日峰值负荷、日均气温、日类型作为环境参数，以构成训练样本的特征向量。

其中，将日类型划分为周一至周四、周五、周六和周日四类，这样更加适用于周五作为工作日的最后一天，其日负荷不同于其他工作日的情况，和周日作为休息日的最后一天，其日负荷量也不同于周六的情况。

在此以假设样本类型A代表周一至周四，B代表周五，C代表周六，D 代表周日。日平均气温和7天前峰值负荷无需再做量化。运用DKM算法将92 个样本划分为三个簇，如图4所示，聚类簇C1、C2和C3中的训练样本分布于空间坐标轴中，其中，所述空间坐标轴包括三个互相垂直的轴，其分别表示： 7日前日峰值负荷、日均气温、日类型。

另外，如下表1所示，分别将每一个聚类簇划分为训练样本集和测试样本集，其中，以6至7月内的训练样本作为所述训练样本集，以8月内的训练样本作为所述测试样本集，则所述聚类簇C1、C2和C3中各类训练样本的分布情况如表1所示：

表1

分别在各聚类簇中选取相似日的钢铁日产量、水泥日产量、空气污染指数 (也可称之为空气质量指数)、日最高气温、日最低气温、风速、降水、日类型构成BNN模型输入的待预测样本(也可以称之为样本向量)，以6月份和7 月份样本数据作为训练集，通过训练、预测、簇汇总等过程输出8月份日最大负荷初步预测值和预测误差RE序列。

本实施例中采用相对误差(Relative Error，RE)和平均绝对百分误差(MeanAbsolute Percentage Error，MAPE)作为模型预测效果评估指标。在一般情况下，RE值和MAPE值越小，则表示BNN模型的预测精度越高。设y_A为日峰值负荷实际值，y_F为日峰值负荷预测值，N为评估样本总数，则RE和MAPE 分别表示为以下公式：

如图5和图6所示，其中，图5为DKM-BNN和未分类的BNN模型分别得出的负荷预测值的拟合曲线和分别与实际负荷值之间的相对误差的条形图；图6为将不同类型的训练样本分别输入同样的DKM-BNN模型和同样的BNN 模型后得出的负荷预测值的拟合曲线和与实际负荷值之间的相对误差的条形图。

由图5和图6可知，采用DKM-BNN模型，可以降低BNN模型得出的负荷预测值与实际负荷值之间的误差，从而提升所述负荷预测值的准确率。

本实施例中，在得出所述DKM-BNN模型的误差序列后，对所述误差序列进行白噪声检验，如图6所示，误差序列存在二阶自相关和偏相关，为非白噪声序列，由此判断所述误差序列中仍存在未被解释的信息，即所述 DKM-BNN模型存在误差。

为修正所述DKM-BNN模型存在的误差，本实施例中通过GARCH建模提取相关信息对DKM-BNN模型得出的日峰值负荷预测结果进行修正。

其中，修正后的结果即修正后的日峰值负荷预测值，如下表2所示：

表2

另外，如图7和图8所示，其中，图7为白噪声检验结果；图8为预测误差的削减幅度。

图7中检测的时间为：8月1日至8月31日，检测的样本数量为31个。

从图8和表2可以得出，除8月8日外，GARCH误差修正后的峰值负荷预测值的相对误差明显降低，平均绝对百分比误差(Mean Absolute Percentage Error，MAPE)从1.72％降低至0.74％。可见，GARCH误差修正模型(即 DKM-BNN-GARCH模型)可以有效提高DKM-BNN模型的预测精度。

下面对DKM-BNN-GARCH模型的有效性、优越性和普适性进行检验。

一、有效性检验：将本实施例中提出的DKM-BNN-GARCH模型与支持向量机(SupportVector Machine，SVM)模型、神经网络(Back Propagation， BP)模型、差分整合移动平均自回归(Autoregressive Integrated Moving Average， ARIMA)模型、灰色预测(GM(1,1))模型的预测结果进行比较。其中，各个模型的预测值与实际值的拟合曲线如图9所示；各个模型的预测误差MAPE 如下表3所示：

表3

由图9和表3可知，本实施例得出的DKM-BNN-GARCH模型的日峰值负荷预测结果与实际日峰值负荷拟合程度较好，且与BP、SVM等预测模型相比具有更好的预测精度，从而确认所述DKM-BNN-GARCH模型具有有效性。

二、优越性检验：为验证本实施例提供的DKM-BNN-GARCH模型的优越性，将DKM-BNN-GARCH模型与DKM-BNN模型、BNN-GARCH模型预测结果进行比较，采用MAPE作为预测效果评价指标。各个模型的预测值与实际值的拟合曲线如图10，同时参考表3所示各个模型的预测误差MAPE。

由图10和表3可知，本实施例提供的DKM-BNN-GARCH模型得出的日峰值负荷预测结果的相对误差，明显小于未误差修正的DKM-BNN模型和未聚类处理的BNN-GARCH模型的预测误差，从而确认DKM-BNN-GARCH模型具有优越性。

三、普适性检验：为验证DKM-BNN-GARCH模型的普适性，采用本实施例中得出的DKM-BNN-GARCH模型对其他代表性月份(2月份(冬季)、5 月份(春季)和11月份(秋季))的日峰值负荷进行预测，采用MAPE作为普适性评价指标，得出的误差结果如表3所示。

由表3可知，本实施例中的DKM-BNN-GARCH模型不仅能够精确预测8 月份的日峰值负荷，对其他代表性月份的日峰值负荷也能做出准确预测，从而确认DKM-BNN-GARCH模型具有普适性。

请参阅图11，是本发明实施例提供的一种电网负荷预测装置的结构图，如图11所示，该装置1100包括：

获取模块1101，用于获取调控参数和环境参数，所述调控参数至少包括预设产品的单位时间段内的计划产量；

预测模块1102，用于向贝叶斯神经网络BNN模型输入待预测样本，得出负荷预测值，其中，所述待预测样本包括所述调控参数和所述环境参数，所述 BNN模型的训练过程使用的训练样本包括调控参数样本和环境参数样本，所述负荷预测值为所述单位时间段内的负荷预测值。

可选的，所述调控参数还包括空气质量指数。

可选的，如图12所示，装置1100还包括：

第一确定模块1103，用于根据所述调控参数和所述环境参数，确定所述待预测样本所属的样本类型；

所述预测模块1102用于：

可选的，所述目标BNN模型通过以下方式确定：

可选的，如图13所示，所述装置1100还包括：

第二确定模块1104，用于根据所述误差序列，确定广义回归条件异方差 GARCH模型；

修正模块，用于根据所述GARCH模型，修正所述负荷预测值的误差，得到目标负荷预测值。

可选的，所述GARCH模型通过以下方式确定：

所述GARCH模型，表示为以下公式：

y_t＝x_tγ+u_t

所述v_t为均值为0且方差随时间变化的标准正态分布，所述

为条件标准差，

表示为以下公式：

所述α₀、所述α_i以及所述β_j均为常数，所述

为t－i时刻的残差平方，所述

本发明实施例提供的电网负荷预测装置能够实现本发明实施例提供的电网负荷预测方法实施例中的各个过程，且能够取得相同的有益效果，为避免重复在此不再赘述。

请参阅图14，是本发明实施例提供的一种电子设备的结构图，如图14所示，所述电子设备包括：收发机1410、存储器1420、处理器1400及存储在所述存储器1420上并可在所述处理器1400上运行的程序，其中：

所述收发机1410，用于获取调控参数和环境参数，所述调控参数至少包括预设产品的单位时间段内的计划产量；

所述处理器1400，用于向贝叶斯神经网络BNN模型输入待预测样本，得出负荷预测值，其中，所述待预测样本包括所述调控参数和所述环境参数，所述BNN模型的训练过程使用的训练样本包括调控参数样本和环境参数样本，所述负荷预测值为所述单位时间段内的负荷预测值。

其中，收发机1410，可以用于在处理器1400的控制下获取和输出数据。

在图14中，总线架构可以包括任意数量的互联的总线和桥，具体由处理器1400代表的一个或多个处理器和存储器1420代表的存储器的各种电路链接在一起。总线架构还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起，这些都是本领域所公知的，因此，本文不再对其进行进一步描述。总线接口提供接口。收发机1410可以是多个元件，即包括发送机和接收机，提供用于在传输介质上与各种其他装置通信的单元。

处理器1400负责管理总线架构和通常的处理，存储器1420可以存储处理器1400在执行操作时所使用的数据。

可选的，所述调控参数还包括空气质量指数。

可选的，所述处理器1400还用于：

所述处理器1400执行的向BNN模型输入待预测样本，得出负荷预测值的步骤，包括：

可选的，所述目标BNN模型通过以下方式确定：

所述处理器1400还用于：

可选的，所述处理器1400还用于：

根据所述误差序列，确定广义回归条件异方差GARCH模型；

可选的，所述GARCH模型通过以下方式确定：

所述GARCH模型，表示为以下公式：

y_t＝x_tγ+u_t

所述v_t为均值为0且方差随时间变化的标准正态分布，所述

为条件标准差，

表示为以下公式：

所述α₀、所述α_i以及所述β_j均为常数，所述

为t－i时刻的残差平方，所述

本发明实施例提供的电子设备能够实现本发明实施例中提供的电网负荷预测方法实施例中的各个过程，窃取的相同的有益效果，为避免重复，在此不再赘述。

本发明实施例还提供一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现本发明实施例提供的电网负荷预测方法中的步骤。

在本申请所提供的几个实施例中，应该理解到，所揭露方法和装置，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理包括，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。

上述以软件功能单元的形式实现的集成的单元，可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述电网负荷预测方法的部分步骤。而前述的存储介质包括： U盘、移动硬盘、只读存储器(Read-OnlyMemory，ROM)、随机存取存储器 (Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明所述原理的前提下，还可以作出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种电网负荷预测方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述调控参数还包括空气质量指数。

3.根据权利要求1所述的方法，其特征在于，在向BNN模型输入待预测样本，得出负荷预测值之前，所述方法还包括：

4.根据权利要求3所述的方法，其特征在于，所述待预测样本所属的样本类型通过以下方式确定：

采用聚类挖掘算法DKM将所述n个训练样本划分为k个聚类簇，其中，k为大于1且小于或者等于n的整数，每一个聚类簇分别包括至少一个训练样本，且每一个聚类簇分别对应一个样本类型；

5.根据权利要求4所述的方法，其特征在于，通过以下过程将所述n个训练样本划分为k个聚类簇：

将相隔距离较远的k个训练样本分别作为所述k个聚类簇的初始中心点：Z₁,Z₂,…,Z_k，其中，所述初始中心点的密度大于平均密度，所述平均密度等于所述n个训练样本的密度的平均值；

6.根据权利要求4所述的方法，其特征在于，所述目标BNN模型通过以下方式确定：

将所述训练集作为所述训练样本集，训练得出所述第一聚类簇对应的目标BNN模型；

7.根据权利要求6所述的方法，其特征在于，所述将所述训练集作为所述训练样本集，训练得出所述第一聚类簇对应的目标BNN模型的步骤，包括：

其中，所述超参数包括α和β，所述D表示所述训练集，所述H为所述目标BNN模型中隐含层的节点数；p(D|w,β,H)为所述D的似然函数，p(w|α,H)为所述w的所述预设先验分布，p(D|α,β,H)为所述D的全概率分布，所述α和所述β均为常数；

8.根据权利要求6所述的方法，其特征在于，在向BNN模型输入待预测样本，得出负荷预测值之后，所述方法还包括：

根据所述误差序列，确定广义回归条件异方差GARCH模型；

9.根据权利要求8所述的方法，其特征在于，所述GARCH模型通过以下方式确定：

所述GARCH模型，表示为以下公式：

y_t＝x_tγ+u_t

所述v_t为均值为0且方差随时间变化的标准正态分布，所述

为条件标准差，

表示为以下公式：

所述α₀、所述α_i以及所述β_j均为常数，所述

为t－i时刻的残差平方，所述

10.一种电网负荷预测装置，其特征在于，包括：

预测模块，用于向贝叶斯神经网络BNN模型输入待预测样本，得出负荷预测值，其中，所述待预测样本包括所述调控参数和所述环境参数，所述BNN模型的训练过程使用的训练样本包括调控参数样本和环境参数样本，所述负荷预测值为所述单位时间段内的负荷预测值。