CN116307250A

CN116307250A - 一种基于典型日特征选择的短期负荷预测方法及系统

Info

Publication number: CN116307250A
Application number: CN202310389305.5A
Authority: CN
Inventors: 刘昊; 杨明; 张俊岭; 隗寿晨; 姜学良; 何成; 牛爱梅; 褚敬; 郑旭东
Original assignee: Shandong University; Shandong Luruan Digital Technology Co Ltd
Current assignee: Shandong University; Shandong Luruan Digital Technology Co Ltd
Priority date: 2023-04-07
Filing date: 2023-04-07
Publication date: 2023-06-23

Abstract

本发明提出了一种基于典型日特征选择的短期负荷预测方法及系统，包括：获取历史负荷数据、历史气象数据及预测日气象数据；对历史负荷数据进行聚类，获得负荷特征典型日分类结果，对于聚类之后的每一类负荷，采用聚类中心作为该类负荷的典型日，用于分析每一类负荷的特征；针对每类负荷的典型日，计算各影响因子与负荷之间的最大信息系数和协同度，基于计算结果完成每类负荷的特征选择，获得每类负荷的的特征集；利用历史气象数据及每类负荷的的特征集分别训练神经网络；将预测日气象数据输入至训练后的神经网络中获得负荷预测结果。

Description

一种基于典型日特征选择的短期负荷预测方法及系统

技术领域

本发明属于短期负荷预测技术领域，尤其涉及一种基于典型日特征选择的短期负荷预测方法及系统。

背景技术

本部分的陈述仅仅是提供了与本发明相关的背景技术信息，不必然构成在先技术。

短期电力负荷预测既是发电厂制定日内实时发电规划的依据，也是电网安全经济运行的保障。随着电力市场的进一步开放，电力生产和消费更加市场化，负荷预测的实时结果数据将成为电力交易中心最倚重的数据之一，这对电力系统负荷预测的准确性提出了更高的要求。

基于传统数学统计模型的电力负荷预测具有运算量小、简单线性预测精度高的优点，但不足以处理复杂非线性负荷时间序列，难以满足现代预测需求，随着人工智能技术的发展，机器学习在电力负荷预测领域得到广泛应用，如人工神经网络、支持向量机等。然而此类方法大多为浅层模型，泛化能力差，面对少量数据的情况时表现较好，但在输入海量数据时可能会出现网络不稳定和参数不收敛等问题。

随着大量传感仪器、智能电表设备的投入，为基于深度学习的负荷预测方法提供了高纬度的海量数据。电力负荷受气象、经济、节假日等因素影响，具有复杂的非线性特征。若将所有因素都作为预测模型的输入变量，将使计算复杂度增加、导致维度灾难，还可能因变量间交叉相关等引起预测精度降低等问题。从海量数据中提取影响负荷的特征变量，选择合适的变量集能增强模型的可解释性、提高预测精度并降低时间复杂度。

在影响电力负荷的诸多外部因素中，包括季节、星期、节假日等这一类时间因素较为特殊，它们通常以离散数值表示作为输入变量，但将时间变量全部输入显然也会存在冗余问题。

现有方法有确定了影响显著的节假日，并对季节进行划分；或者在将日期划分为工作日、周末、节假日的基础上，对节假日等特殊日进行量化处理，但负荷特性与地域和年份密切相关，以固定时间段划分或数值量化都存在一定主观性。另一类常见的处理方法是将离散时间变量与气象因素等连续数值变量按照同一规则进行特征筛选，但容易存在度量指标对不同类型变量的健壮性、公平性不一致的问题。

发明内容

为克服上述现有技术的不足，本发明提供了一种基于典型日特征选择的短期负荷预测方法，相比起PCC相关系数的方法能够挖掘非线性的关联度，表示出各特征对负荷的影响，有效提高预测精度。

为实现上述目的，本发明的一个或多个实施例提供了如下技术方案：

第一方面，公开了一种基于典型日特征选择的短期负荷预测方法，包括：

获取历史负荷数据、历史气象数据及预测日气象数据；

对历史负荷数据进行聚类，获得负荷特征典型日分类结果，对于聚类之后的每一类负荷，采用聚类中心作为该类负荷的典型日，用于分析每一类负荷的特征；

针对每类负荷的典型日，计算各影响因子与负荷之间的最大信息系数和协同度，基于计算结果完成每类负荷的特征选择，获得每类负荷的的特征集；

利用历史气象数据及每类负荷的的特征集分别训练神经网络；

将预测当日的输入变量集输入至训练后的神经网络中获得负荷预测结果。

作为进一步的技术方案，对历史负荷数据使用基于相似度的K-means算法聚类分析，实现负荷特征典型日分类，对于聚类之后的每一类负荷，采用K-means聚类中心作为该类负荷的典型日，用于分析每一类负荷的特征。

作为进一步的技术方案，对历史负荷数据使用基于相似度的K-means算法聚类分析，将聚类结果按其特征分为低温、中温、高温三类负荷典型日，针对每类负荷典型日分别进行特征选择与神经网络模型训练。

作为进一步的技术方案，采用最大信息系数作为短期负荷预测变量选择的相关度标准，假设负荷值y为目标变量，x为待筛选的负荷预测模型输入变量，定义输入变量x与目标变量的相关度Rel(x)为：

Rel(x)＝MIC(x,y)。

作为进一步的技术方案，基于计算结果完成每类负荷的特征选择，具体为：

将最大信息系数与特征协同度结合，作为负荷特征选择的指标，最大信息系数与特征协同结合为作为选择变量时的评价标准，步进迭代选择变量。

作为进一步的技术方案，使用MIC算法选择变量的迭代步骤如下：

1)第1次变量选择时选择与输出变量相关度最高的变量：

2)第n次变量选择时(n＞1),对待选变量x_i,其得分记为：

Score(x_i)＝MIC(x_i∣y)+α·VI(x_i,S_n-1)

式中:S_n-1为n-1次变量选择后的已选变量集,α为权重，权重α一般在0～10之间，可通过试错法选择；

从而将当前步中得分最高的变量s_n作为新的变量加入特征变量集S_n-1，构成新的变量集S_n；

3)重复前两步直到已选变量数目n达到预设值N。

作为进一步的技术方案，在获取历史负荷数据、历史气象数据及预测日气象数据之后还包括归一化处理步骤。

第二方面，公开了一种基于典型日特征选择的短期负荷预测系统，包括：

数据获取模块，其被配置为：获取历史负荷数据、历史气象数据及预测日气象数据；

负荷特征聚类模块，其被配置为：对历史负荷数据进行聚类，获得负荷特征典型日分类结果，对于聚类之后的每一类负荷，采用聚类中心作为该类负荷的典型日，用于分析每一类负荷的特征；

特征选择模块，其被配置为：针对每类负荷的典型日，计算各影响因子与负荷之间的最大信息系数和协同度，基于计算结果完成每类负荷的特征选择，获得每类负荷的的特征集；

模型训练模块，其被配置为：利用历史气象数据及每类负荷的的特征集分别训练神经网络；

负荷预测模块，其被配置为：将预测日气象数据输入至训练后的神经网络中获得负荷预测结果。

以上一个或多个技术方案存在以下有益效果：

本发明技术方案将历史负荷数据的聚类结果按其特征分为低温、中温、高温三类负荷典型日，分别进行特征选择与模型训练，增强预测模型的针对性；MIC-VI特征选择方法，综合考虑特征相关性与特征协同度，采用公平性更好的MIC最大信息系数计算特征相关性，相比起PCC相关系数的方法能够挖掘非线性的关联度，表示出各特征对负荷的影响；最后采用时间卷积网络TCN进行训练与预测工作，有效提高预测精度。

本发明附加方面的优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

构成本发明的一部分的说明书附图用来提供对本发明的进一步理解，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。

图1是本发明实施例所述的k-means算法的步骤；

图2是本发明实施例中TCN时间卷积网络的空洞卷积模块；

图3是本发明实施例中TCN时间卷积网络的残差模块示意图；

图4是本发明实施例中基于负荷典型日特征选择的MIC-VI-TCN负荷预测方法流程图；

图5、图6、图7是本发明实施例中负荷典型日分类结果图；

图8是本发明实施例中基于负荷典型日特征选择的MIC-VI-TCN负荷预测方法与其它方法预测结果对比图。

具体实施方式

应该指出，以下详细说明都是示例性的，旨在对本发明提供进一步的说明。除非另有指明，本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是，这里所使用的术语仅是为了描述具体实施方式，而非意图限制根据本发明的示例性实施方式。

在不冲突的情况下，本发明中的实施例及实施例中的特征可以相互组合。

实施例一

本实施例公开了一种基于典型日特征选择的短期负荷预测方法，包括：

获取历史负荷数据、历史气象数据以及预测日气象数据；

基于历史负荷数据，使用基于相似度的K-means算法聚类分析，实现负荷特征典型日分类；

基于聚类之后的每一类负荷，采用K-means聚类中心作为该类负荷的典型日，分析每一类负荷的特征；

针对每类典型日进行特征筛选，计算各影响因子与负荷之间的最大信息系数和协同度，按照得分完成特征选择。

最后根据选出的特征集，使用历史负荷数据、历史气象数据对每一类典型日分别训练TCN时间卷积网络，并完成预测。

具体的，将预测当日的输入变量集输入至训练后的时间卷积网络获得预测负荷。

(1)K-means聚类方法

在负荷预测中，聚类算法通常用于对负荷的影响因素进行聚类分析。其中较为常用的是基于划分法中的k-means算法。k-means聚类算法被广泛应用在科学和工业领域，它的主要思想是先把含有n个对象的样本数据集D划分到一组聚类中,k是设定的最终聚类个数,k≤n。

k-means聚类算法的主要思想就是通过聚类把数据集中包含的所有的数据均划分到多个不同的类中，通过逐次迭代从而使得目标函数最小，使得最终生成的各个类别中的对象尽可能地相似而与其它类中的对象又尽可能地相异。迭代过程如下：第一步先从样本数据集中随机地选出k个数据作为k个类的初始质心；而后计算出数据集中剩余的数据与各类指定质心的距离，根据计算出的距离而将其分配到离指定质心最近的类中：再求新形成的类的质心。这样不断重复，直到目标函数最小为止。

k-means聚类算法通常以欧式距离作为相似性测试函数，即：

给定两组不同日期的负荷数据X＝(x₁,x₂,...,x_n)和Y＝(y₁,y₂,…,y_n)，X和Y两个向量间的欧氏距离(Euclidean Distance)表示为：

k-means算法是把数据给分成不同的簇，目标是同一个簇中的差异小，不同簇之间的差异大，用误差平方和作为目标函数:

输入样本数据集，以及期望得到的类别数k；输出能够使得平方误差准则函数最小的k个类；

1)首先随机选择数据作为初始类的质心，即初始聚类中心；

2)计算出每个对象数据与指定类的质心距离，然后将其划分到与计算出的距离最小的那一类中，即距离该对象最近的类:进而将所有数据均划分到K个类中；

3)重新计算每个新类的质心；

4)重复步骤2)、3)，直到每个类的质心均不再发生变化为止。k-means聚类算法采用迭代更新的办法，使得选取的质心逐渐接近最终的真实的聚类中心，使误差平方和准则函数越来越小，聚类的效果越来越好，它是一个求解最优的问题。虽然目标函数中存在有许多的局部极小点，但是只有一个使得误差平方和准则函数最小的全局最小点。为了找出这个全局最小点，目标函数的迭代过程总是沿着误差平方准则函数减小的方向而进行搜索。该算法对属性没有要求，也不必确定具体和相关性距离矩阵，运算速度较快；

(2)MIC-VI特征选择方法

待选变量与目标变量的相关度是衡量该变量重要性的必要标准之一。相关度常用相关系数或互信息表征，但相关系数难以挖掘变量间复杂非线性关系，而互信息则对不同类型关联关系的健壮度存在差异。

最大信息系数(maximalinformationcoefficient，MIC)是一种能对海量数据中变量间的各种依赖关系进行广泛挖掘的相关度指标。最大信息系数定义如下：假设D(X,Y)为有限二维数据集，将当前二维空间在X和Y方向分别划分为x区间和y区间，形成x×y的网格G；划分区间相同的网格有多种划分方式，设不同划分方式形成的网格的集合为Ω，则定义：

式中：a和b表示二维空间在x轴和y轴方向的区间划分数；D∣G表示数据集D在划分网格G上的分布；I(D∣G)表示D∣G的互信息；max表示取最大值。将不同划分区间下数据集D的最大规范化互信息组成特征矩阵M(D)，特征矩阵元素定义为：

式中min{··}表示2者中的较小值。则最大信息系数定义为：

式中：n为数据集样本数：B(n)为网格划分数上限值。B(n)一般取值范围为ω(1)≤B(n)≤O(n^1-s)，0＜ε＜1。网格划分数上限值B(n)的增大将使得MIC对相关度的度量更精确，但随之计算复杂度也会增加。由现有技术可知当B(n)＝n^0.6时能得到最优的效果，因此本实施例子也采用该设置方法。

从而，将特征变量c和负荷数据l联合构成二维空间D(X,Y)，就能在该场景下计算单个变量与负荷的最大信息系数。

采用最大信息系数作为短期负荷预测变量选择的相关度标准，假设负荷值l为目标变量，c为待筛选的负荷预测模型输入变量特征，包含历史负荷变量及气象变量，定义输入变量c与目标变量的相关度Rel(c)为：

Rel(c)＝MIC(c,l)

待选变量之间除了冗余还存在协同作用，即两个待选变量共同使用时对预测的贡献大于两者单独使用时对预测的贡献之和。选择变量时考虑“最大相关度”原则的同时还应综合考虑“最大协同度”。两个输入特征变量c_i与c_s关于目标变量即负荷l的协同增益定义为：

IG(c_i,c_s,l)＝I([c_i,c_s],l)-(I(c_i,l)+I(c_s,l))

式中：I([c_i,c_s],l)为第i个输入特征变量c_i与第s个输入特征变量c_s共同使用时联合变量[c_i,c_s]与负荷y的互信息，I(c_i,l)+I(c_s,l)为输入特征变量c_i与c_s单独使用时与目标变量y的互信息之和。当IG(x_i,x_s,y)≥0时，代表x_i与x_s共同使用时有正向的协同作用；当IG(c_i,c_s,l)＜0时，代表x_i与x_s存在关于目标变量的冗余，由于冗余度已通过施密特正交化考虑，可令协同度为0。假设已选变量集为S_n，待选变量c_i与已选变量集S_n关于目标变量y的协同度(variableinteraction,VI)定义为：

本实例中使用的MIC-VI特征选择方法为：

将最大信息系数与特征协同度结合，作为负荷特征选择的指标，最大信息系数与特征协同结合为作为选择变量时的评价标准，步进迭代选择变量。设待选变量集中共有M个变量，表示为S_c＝{c₁,c₂,…,c_M}，第n次变量选择后的已选变量集为S_n，目标变量为y，最终的输入特征集中需选变量数为N，使用MIC算法选择变量的迭代步骤如下：

1)第1次变量选择时选择与输出变量相关度最高的变量：

2)第n次变量选择时(n＞1),对待选变量x_i,其得分记为：

Score(c_i)＝MIC(c_i∣l)+α·VI(c_i,S_n-1)

式中：S_n-1为n-1次变量选择后的已选变量集，α为权重。权重α一般在0～10之间,可通过试错法选择，本文中选择α＝5。

从而将当前步中得分最高的变量c_n作为新的变量加入特征变量集S_n-1，构成新的变量集S_n。

3)重复前两步直到已选变量数目n达到预设值N。

从而，在针对各典型日的特征选择中，在确定待选变量集之后，能够按照本方法步骤所述计算待选变量集中各个变量与负荷之间的最大信息系数值和不同变量针对负荷的协同度，最终计算每个变量的得分。进一步根据得分能够确定所属历史负荷变量与历史气象变量、当日气象变量构成的待选变量集中对当日负荷影响最大的几个变量，从而将这些变量作为输入特征训练神经网络进行预测。

(3)典型日特征选择的MIC-VI-TCN短期负荷预测方法

本实例采用中国某地市2021年一年的负荷数据作为本模型验证的数据集，每15分钟一个采样点，每天96点的负荷数据以及温度等气象预报数据。

为了避免不同数据间量纲的差异，对原始数据进行了归一化处理:

式中：X^*为归一化值；X为原数据值；X_min为序列最小值；X_max为序列最大值。

本实例采用平均绝对误差(mean absolute error,MAE)和平均绝对百分比误差(mean absolute percentage error,MAPE)作为预测结果的评价指标。其计算公式如下：

式中：y_i和

为i时刻的实际值和预测值；N为样本总数。

本实例中日负荷特征分类与典型日选取结果：

将训练集数据以天为单位整理，使用基于欧氏距离的K-means聚类算法进行聚类分析，采用误差平方和SSE作为聚类评价指标，经测试在K＝3之后，继续增大K对减少SSE的效果减弱，综合考虑分类标签的丰富性之后，选择聚类个数为3。在K＝3时，采用K-means聚类的结果如附图5，附图6，附图7所示.

对图中所示聚类结果进一步分析，第二类结果曲线最多且负荷值较低，集中分布在2月到6月、9月到11月温度适宜的时间段；第一类和第三类负荷值较高，且第一类集中分布在7、8月高温日，第三类则集中分布在1月和12月低温日。由此可以按照温度将负荷分类为低温日、中温日和高温日，分别训练针对三种不同类别的预测模型。

根据数据集中已有的负荷、气象数据，将历史负荷、温度、湿度等特征，考虑时间延迟和趋势特征影响构建待选变量集共157维待选变量，各变量如下表所示，其中，历史负荷变量分别选用当前采样点前七天的历史负荷、历史前三个点和后三个点即前一小时和后一小时的负荷值表征趋势变化；温度、湿度气象变量选用当前采样点的值和历史七天内当前采样点的值。待选变量集中不包含日期和节假日变量，因为采用MIC-VI的特征选择方法计算其得分并不能代表日期变量与负荷的关系，在模型训练和预测时将节假日以标签形式输入。

表1待选变量集合

对于三类负荷典型日，分别选用每天8点，12点和20点三个整点时刻的采样点为代表，利用提出的MIC-VI特征选择方法进行特征筛选，同时使用特征选择的相关系数法作为模型输入的对比，皮尔逊相关系数计算公式如下：

设置最终输入特征变量为20维进行特征选择，对于相关系数法，直接选用相关系数排序前20位变量作为输入。变量选择结果如下表所示：

表2采用本实例方法与PCC法进行变量选择的结果

由变量选择结果可知，在高温日两种方法都能识别温度对负荷变化的影响，而在其它类型日，所提MIC-VI特征选择方法对于历史负荷的选择更能识别出星期数相同时(d＝7)的影响，同时对于温度变量的筛选，只选择了更靠近待预测日的一天前后一小时的温度。

本实例采用5个残差模块链接的TCN时间卷积网络，各模块卷积层滤波器数量设计为[24,16,12,8,8]，扩张系数为[1,2,4,8,16]，卷积核尺寸为2,。将提出的基于MIC的特征选择和TCN方法记为MIC-VI-TCN方法，将采用相关系数法选择特征后预测的方法记为PCC-TCN，同时选用负荷预测中常用的LSTM神经网络作为对比模型，分别记为PCC-LSTM和MIC-VI-LSTM。在预测第t个采样点的负荷时，对应的输入特征为筛选得到的输入特征集和节假日标签，分别对三种典型负荷日测试预测结果，计算各评价指标如下表所示。

表3各方法预测结果MAE

表4各方法预测结果MAPE

从预测结果评价指标来看，本实例中基于负荷典型日的MIC-VI-TCN预测模型，在针对分类后的三种典型日预测结果均表现良好，相比基础的PCC特征选择方法，MAPE平均降低了1.5％；对比常用的LSTM神经网络，在相同特征筛选模式下，所提模型也有所提升。应用改进的特征选择方法后，所提模型针对不同负荷类型日的预测需求均能适应，具有良好的泛化能力。同时在分类之后，模型针对负荷变化不大的中温日负荷预测，能够进一步提升学习效果和预测精度。

附图8展示了低温日类型中12月20日的负荷预测结果，从图中可以看出，应用新的特征选择方法后，LSTM和TCN的预测结果均有提升，同时相比LSTM方法，所提的MIC-VI-TCN方法对于负荷变化有更好的跟踪能力。

实施例二

本实施例的目的是提供一种计算机装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现上述方法的步骤。

实施例三

本实施例的目的是提供一种计算机可读存储介质。

一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时执行上述方法的步骤。

实施例四

本实施例的目的是提供了一种基于典型日特征选择的短期负荷预测系统，包括：

负荷预测模块，其被配置为：将预测当日的输入变量集输入至训练后的神经网络中获得负荷预测结果。

以上实施例二、三和四的装置中涉及的各步骤与方法实施例一相对应，具体实施方式可参见实施例一的相关说明部分。术语“计算机可读存储介质”应该理解为包括一个或多个指令集的单个介质或多个介质；还应当被理解为包括任何介质，所述任何介质能够存储、编码或承载用于由处理器执行的指令集并使处理器执行本发明中的任一方法。

本领域技术人员应该明白，上述本发明的各模块或各步骤可以用通用的计算机装置来实现，可选地，它们可以用计算装置可执行的程序代码来实现，从而，可以将它们存储在存储装置中由计算装置来执行，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。本发明不限制于任何特定的硬件和软件的结合。

上述虽然结合附图对本发明的具体实施方式进行了描述，但并非对本发明保护范围的限制，所属领域技术人员应该明白，在本发明的技术方案的基础上，本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

Claims

1.一种基于典型日特征选择的短期负荷预测方法，其特征是，包括：

获取历史负荷数据、历史气象数据及预测日气象数据；

2.如权利要求1所述的一种基于典型日特征选择的短期负荷预测方法，其特征是，对历史负荷数据使用基于相似度的K-means算法聚类分析，实现负荷特征典型日分类，对于聚类之后的每一类负荷，采用K-means聚类中心作为该类负荷的典型日，用于分析每一类负荷的特征。

3.如权利要求1所述的一种基于典型日特征选择的短期负荷预测方法，其特征是，对历史负荷数据使用基于相似度的K-means算法聚类分析，将聚类结果按其特征分为低温、中温、高温三类负荷典型日，针对每类负荷典型日分别进行特征选择与神经网络模型训练。

4.如权利要求1所述的一种基于典型日特征选择的短期负荷预测方法，其特征是，采用最大信息系数作为短期负荷预测变量选择的相关度标准，假设负荷值y为目标变量，x为待筛选的负荷预测模型输入变量，定义输入变量x与目标变量的相关度Rel(x)为：

Rel(x)＝MIC(x,y)。

5.如权利要求1所述的一种基于典型日特征选择的短期负荷预测方法，其特征是，基于计算结果完成每类负荷的特征选择，具体为：

6.如权利要求1所述的一种基于典型日特征选择的短期负荷预测方法，其特征是，使用MIC算法选择变量的迭代步骤如下：

1)第1次变量选择时选择与输出变量相关度最高的变量：

2)第n次变量选择时，n＞1,对待选变量x_i，其得分记为：

Score(x_i)＝MIC(x_i∣y)+α·VI(x_i,S_n-1)

式中:S_n-1为n-1次变量选择后的已选变量集，α为权重，权重α一般在0～10之间，可通过试错法选择；

3)重复前两步直到已选变量数目n达到预设值N。

7.如权利要求1所述的一种基于典型日特征选择的短期负荷预测方法，其特征是，在获取历史负荷数据、历史气象数据及预测日气象数据之后还包括归一化处理步骤。

8.一种基于典型日特征选择的短期负荷预测系统，其特征是，包括：

9.一种计算机装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征是，所述处理器执行所述程序时实现上述权利要求1-7任一所述的方法的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征是，该程序被处理器执行时执行上述权利要求1-7任一所述的方法的步骤。