一种基于机器学习的超短期电力负荷预测方法及装置
技术领域
本发明涉及一种基于机器学习的超短期电力负荷预测方法及装置,属于电力数据处理技术领域。
背景技术
电力负荷预测是保障电力系统安全稳定运行的技术前提之一,其中超短期负荷预测对于实时安全分析和实时经济调度具有重要的意义。当前经济迅速发展,各行业对于电力的需求越来越高,负荷类型也愈发复杂且电力负荷受温度、湿度、节假日等因素的影响,其随机性较强,因此提高负荷预测精度是当前研究的主要目标。
国内外对于负荷预测模型的研究主要分为时间序列模型,机器学习与深度学习模型。XGBoost是机器学习的一种模型,是对Boosting算法的优化,常用于数据挖掘,对于电力负荷数据的拟合有较好的效果。
变分模态分解(VMD)是一种时频分析法,可将非平稳信号分解为多个较平稳的本征模态函数(IMF)。
发明内容
针对电力负荷受复杂环境影响随机性较强,预测精度不高问题,本发明考虑天气及节假日影响构造数据特征并通过数据挖掘和机器学习算法建立模型,提出了一种基于机器学习的超短期电力负荷预测方法及装置。本发明使用变分模态分解(VMD)方法分解电力负荷数据以减少负荷数据非平稳性对预测精度带来的影响。同时,若对分解后的多个IMF依次预测,则预测时间会成倍增加,降低了预测效率,故本发明使用K均值聚类方法Kmeans对各IMF聚类,以保证预测效率。
本发明通过下述技术方案来实现。一种基于机器学习的超短期电力负荷预测方法,步骤如下:
第一步,对原始数据归一化操作;
第二步,使用变分模态分解(VMD)方法对负荷数据进行处理,将波动性较强的原始负荷数据分解为多个较平稳的本征模态函数(IMF)分量;
第三步,使用Kmeans方法对各本征模态函数(IMF)分量进行聚类,为确定聚类数,对不同聚类数进行效果测试,使用轮廓系数法和模糊划分系数评价效果,得到效果最好的聚类数后进行聚类,然后依次将同一类的负荷分量叠加,得到新负荷序列;
第四步,考虑影响因素对电力负荷的影响进行特征构造;
第五步,利用XGBoost模型对新负荷序列进行预测,之后对各预测值叠加重构得到最终预测结果。
进一步地,第四步所述影响因素包括天气、节假日、温度等因素。
进一步地,第二步中,分解过程为:首先,根据前人研究结果和实际应用经验设置惩罚参数为2000,初始中心频率为0;然后,预设分解阶数K值范围,依次进行分解实验,将中心频率最为接近的一组实验的分解阶数K值设定为最佳参数;最后,设置最佳参数对原始数据进行分解,得到n个本征模态函数(IMF)分量。
第三步中,聚类过程为:首先,需确定聚类数,预设不同聚类数如2-8类,依次进行聚类并使用轮廓系数法与模糊划分系数对聚类效果进行评分以此确定最佳聚类数;其中,轮廓系数法与模糊划分系数评分两者得分越高则表示聚类效果越好;然后,设置最佳聚类数进行聚类,将同类中负荷分量叠加,得到m组新负荷序列。
第五步的具体过程如下:首先,对XGBoost模型参数进行初始化,设置初始参数;然后,根据前人研究及实际应用经验设置调参范围;最后,使用网格搜索与交叉验证法寻找最优参数,评估指标为平均绝对百分误差MAPE,其计算公式如下:
式中,式中,
表示预测值,y
i述表示真实值,i=1,2,3...n,;使用网格搜索进行遍历寻优,计算并记录MAPE值进行对比,得到最佳参数;将最佳参数替换最大树高初始值,继续下一参数寻优,以此类推得到一组最佳参数;
在XGBoost模型设置已找寻的最佳参数,将构造特征后的各组数据按照8:2划分训练集与测试集,依次预测后叠加重构得到最后连续96个点的预测值,计算并记录MAPE、平均绝对误差MAE、均方根误差RMSE对预测模型进行评估。
本发明还提供了一种基于机器学习的超短期电力负荷预测装置,包括数据导入及归一化模块、分解模块、聚类模块、特征构造模块、预测模块和评估模块,所述分解模块接收数据导入及归一化模块处理后的数据,并进行变分模态分解处理,得到本征模态函数分量;所述聚类模块对本征模态函数分量聚类分析得到新负荷序列;所述特征构造模块根据新负荷序列历史信息、天气、节假日特征构造特征;所述预测模块对新负荷序列进行预测得到最终预测结果:所述评估模块比较预测结果与真实值之间的误差,评估超短期电力负荷预测装置的预测效果。
更具体地,数据导入及归一化模块用于对原始数据使用峰值法归一化处理并导入超短期电力负荷预测装置。
更具体地,分解模块用于变分模态分解(VMD)模型参数确定,包括惩罚参数、初始中心频率及分解阶数,之后对数据进行分解得到多个本征模态函数分量。
更具体地,聚类模块用于Kmeans参数确定,之后对分解模块得到的分量聚类并分别对同一类分量叠加,得到新负荷序列。
更具体地,预测模块用于XGBoost模型参数寻优,之后对特征构造模块得到的各序列特征预测,最后叠加重构得到预测值。
更具体地,评估模块用于计算预测值与真实值之间的误差,包括MAPE、MAE、RMSE,以此评估超短期电力负荷预测装置的预测效果。
本发明考虑天气、节假日等因素影响构造数据特征并结合VMD、Kmeans、XGBoost方法的优点,采用VMD处理负荷数据,把波动性较强的负荷序列分解为不同频率下平稳的分量进行预测,提高了超短期预测精度,同时使用Kmeans方法对分量聚类后叠加在预测,避免了负荷数据分解为多分量在预测所带来的耗时影响,在一定程度上保证了预测效率,对于实施安全分析和实时经济调度起到一些参考作用。本发明可提高超短期负荷预测精度。
附图说明
图1为本发明的方法流程图。
图2为基于机器学习的超短期电力负荷预测装置的流程图。
图中:10-数据导入及归一化模块、20-分解模块、30-聚类模块、40-特征构造模块、50-预测模块、60-评估模块。
具体实施方式
下面对本发明进一步详细阐明。
参照图1,一种基于机器学习的超短期电力负荷预测方法,步骤如下:
第一步,对原始数据归一化操作;
使用峰值法归一化对原始数据进行处理,其公式如下:
式中:X
i表示原始负荷,X
max表示X
i的最大值,
表示归一化后的数值,i代表序号。
第二步,使用变分模态分解(VMD)方法对负荷数据进行处理,将波动性较强的原始负荷数据分解为多个较平稳的本征模态函数(IMF)分量;
变分模态分解(VMD)的参数对分解效果有很大影响,故分解前先确定其重要参数。首先,根据前人研究结果和实际应用经验设置惩罚参数为2000,初始中心频率为0;然后,分解阶数K对分解的效果至关重要,先预设分解阶数K值范围,然后依次进行分解实验,将中心频率最为接近的一组实验的分解阶数K值设定为最佳参数;最后,设置最佳参数对原始数据进行分解,得到n个本征模态函数(IMF)分量。
第三步,使用Kmeans方法对各本征模态函数(IMF)分量进行聚类,为确定聚类数,对不同聚类数进行效果测试,使用轮廓系数法和模糊划分系数评价效果,得到效果最好的聚类数后进行聚类,然后依次将同一类的负荷分量叠加,得到新负荷序列;
对变分模态分解(VMD)方法分解得到的各本征模态函数(IMF)分量使用Kmeans方法进行聚类。首先,需确定聚类数,预设不同聚类数如2-8类,依次进行聚类并使用轮廓系数法与模糊划分系数对聚类效果进行评分以此确定最佳聚类数;其中,轮廓系数法与模糊划分系数评分两者得分越高则表示聚类效果越好;然后,设置最佳聚类数进行聚类,将同类中负荷分量叠加,得到m组新负荷序列。
第四步,考虑天气、节假日等因素对电力负荷的影响进行特征构造;
考虑天气、节假日等因素对电力负荷的影响,结合新负荷序列历史数据进行特征构造,详情如表1所示。
表1特征详情
第五步,利用XGBoost模型对新负荷序列进行预测,之后对各预测值叠加重构得到最终预测结果。步骤如下:
(1)模型参数的设置直接影响预测结果,故预测前需对XGBoost参数进行寻优。首先,XGBoost常用参数为最大树高、迭代次数、学习率等,对模型参数进行初始化,设置初始参数;然后,根据前人研究及实际应用经验设置调参范围。最后,使用网格搜索与交叉验证法寻找最优参数,评估指标为平均绝对百分误差MAPE,其计算公式如下:
式中,式中,
表示预测值,y
i述表示真实值,i=1,2,3...n,以最大树高调优为例进行过程说明。设置初始化参数为5;设置最大树高调参范围为3-10;使用网格搜索进行遍历寻优,计算并记录MAPE值进行对比,得到最佳参数;将最佳参数替换最大树高初始值,继续下一参数寻优,以此类推得到一组最佳参数。各参数初始化值、调参范围如表2所示。
表2 XGBoost参数初始化与调参范围表
(2)在XGBoost模型设置已找寻的最佳参数,将构造特征后的各组数据按照8:2划分训练集与测试集,依次预测后叠加重构得到最后连续96个点的预测值,计算并记录MAPE、平均绝对误差MAE、均方根误差RMSE对预测模型进行评估。
如图2所示,一种基于机器学习的超短期电力负荷预测装置,包括数据导入及归一化模块10、分解模块20、聚类模块30、特征构造模块40、预测模块50和评估模块60,所述分解模块20接收数据导入及归一化模块10处理后的数据,并进行变分模态分解处理,得到本征模态函数分量;所述聚类模块30对本征模态函数分量聚类分析得到新负荷序列;所述特征构造模块40根据新负荷序列历史信息、天气、节假日特征构造特征;所述预测模块50对新负荷序列进行预测得到最终预测结果:所述评估模块60比较预测结果与真实值之间的误差,评估超短期电力负荷预测装置的预测效果。
本发明中,数据导入及归一化模块10用于对原始数据使用峰值法归一化处理并导入超短期电力负荷预测装置。
本发明中,分解模块20一方面用于变分模态分解(VMD)模型的参数确定:根据前人研究结果和实际应用经验设置惩罚参数为2000,初始中心频率为0;预设分解阶数K值范围,然后依次进行分解实验,将中心频率最为接近的一组实验的分解阶数K值设定为最佳参数。另一方面用于设置变分模态分解(VMD)最佳参数对原始数据进行分解,得到n个本征模态函数分量。
本发明中,聚类模块30一方面用于Kmeans聚类数的确定:预设不同聚类数,如2-8类,依次按照预设聚类数进行处理,使用轮廓系数法与模糊划分系数对聚类效果进行评分。其中,轮廓系数法与模糊划分系数评分两者得分越高则表示聚类效果越好,以两种方法评价得分确定最佳聚类数。另一方面设置最佳聚类数进行聚类,将同类中负荷分量叠加,得到m组新负荷序列。
本发明中,特征构造模块40用于预测前的特征构造:根据新负荷序列历史数据、天气、节假日信息构造特征。考虑预测日期临近前一天数据、预测点临近前7个时刻点数据、日期类型、工作日、节假日、最高最低及平均温度共14维特征。
本发明中,预测模块50一方面用于XGBoost模型参数寻优:第一步,设置XGBoost的最大树高、迭代次数、学习率等常用参数初始化值,对模型参数进行初始化。第二步,设置调参范围。第三步,使用网格搜索与交叉验证法寻找最优参数,评估指标为平均绝对百分误差MAPE,其计算公式如下:
以最大树高调优为例进行过程说明。设置初始化参数为5;设置最大树高调参范围为3-10;使用网格搜索进行遍历寻优,计算并记录MAPE值进行对比,得到最佳参数;将最佳参数替换最大树高初始值,继续下一参数寻优,以此类推得到一组最佳参数。
另一方面用于使用最佳参数的XGBoost模型预测:将各分量构造的特征按照8:2划分训练集与测试集对模型进行训练,最后依次预测连续96个时刻的负荷值分量,将各分量预测结果叠加得到最终预测值。
本发明中,评估模块60用于计算预测值与真实值之间的误差,包括MAPE、MAE、RMSE,以此评估超短期电力负荷预测装置的预测效果。