CN108537683A - 一种基于相似日选取及随机森林算法的负荷预测方法 - Google Patents

一种基于相似日选取及随机森林算法的负荷预测方法 Download PDF

Info

Publication number
CN108537683A
CN108537683A CN201810331198.XA CN201810331198A CN108537683A CN 108537683 A CN108537683 A CN 108537683A CN 201810331198 A CN201810331198 A CN 201810331198A CN 108537683 A CN108537683 A CN 108537683A
Authority
CN
China
Prior art keywords
day
similarity
sample
random forest
load
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810331198.XA
Other languages
English (en)
Inventor
谈竹奎
刘斌
李正佳
赵远凉
徐睿
欧家祥
王冕
袁旭峰
徐玉韬
吕黔苏
杜雪
汪永祥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guizhou Power Grid Co Ltd
Original Assignee
Guizhou Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guizhou Power Grid Co Ltd filed Critical Guizhou Power Grid Co Ltd
Priority to CN201810331198.XA priority Critical patent/CN108537683A/zh
Publication of CN108537683A publication Critical patent/CN108537683A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/06Electricity, gas or water supply
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"

Abstract

本发明公开了一种基于相似日选取及随机森林的负荷特性指标预测方法,它包括采集预测区域内负荷变化影响因素,确定每种影响因素的相似度计算方法;根据相似度计算方法,分别计算各历史日与预测日的相似度,构建相似度矩阵;根据相似度矩阵,计算总相似度;确定总相似度的阈值,选取相似度大于阈值的样本组成相似日样本集;采用重抽样法从S个样本中抽取K个子样本集训练K棵决策树,选取r个特征因素作为当前节点的分裂特征集;进行节点的分裂;将OOB数据作为测试样本,对随机森林回归模型进行误差估计调整模型中回归树的数量K;根据输入预测日样本,取各个回归树输出的平均值作为预测结果;实现了对负荷进行精确预测。

Description

一种基于相似日选取及随机森林算法的负荷预测方法
技术领域
本发明属于负荷特性指标预测技术,特别是涉及一种基于相似日选取及随机森林的负荷特性指标预测方法。
背景技术
电力系统是一个大规模的电能生产、输送、分配、消费的网络,电能不能大量储存,具有即时性的特点。保持电能生产和消费的平衡是电力系统稳定运行的基本条件,而负荷预测是保证这种平衡的重要环节。近年来,随着电力市场的进一步开放,电力生产和消费更加市场化,负荷预测在现代电力系统调度和管理中的作用更加彰显,因此对电力系统负荷预测的准确性提出了更高的要求。我国对负荷预测的重视程度经历了一个较长的过程,为促进整个电力市场的可持续发展,负荷预测也是我国实现电力市场的必备条件,具有重要的理论意义和实用价值。为顺应时代的潮流,需要更深入的钻研负荷预测的原理和方法,改进负荷预测方法,提高负荷预测的精度。
发明内容
本发明要解决的技术问题是:提供一种基于相似日选取及随机森林的负荷特性指标预测方法,以改进负荷预测方法,提高负荷预测的精度。
本发明的技术方案是:
一种基于相似日选取及随机森林的负荷特性指标预测方法,它包括:
步骤S110,采集预测区域内负荷变化影响因素;
步骤S120,根据所采集的负荷变化影响因素,确定每种影响因素的相似度计算方法;
步骤S130,根据不同影响因素得到的相似度计算方法,分别计算各历史日与预测日的相似度,构建相似度矩阵;
步骤S140,根据相似度矩阵,将历史日各因素的相似度相乘,计算总相似度;
步骤S150,确定总相似度的阈值,选取相似度大于阈值的样本组成相似日样本集;
步骤S160,设定初始回归树的数量K,采用Bootstrap重抽样法从S个样本中抽取K个子样本集,生成K棵回归树;
步骤S170,根据重抽样获得的样本集,同时训练K棵决策树,选取r个特征因素作为当前节点的分裂特征集,r小于等于log2(H+1);
步骤S180,根据基尼不纯度最小准则进行节点的分裂;
步骤S190,将OOB数据作为测试样本,对随机森林回归模型进行误差估计,根据预测误差调整模型中回归树的数量K;
步骤S200,根据输入预测日样本到随机森林回归模型,取各个回归树输出的平均值即可得到最终的预测结果。
所述负荷变化影响因素包括温度、湿度、降水和日类型数据;温度温为每日最高温度及最低温度;日类型为工作日、假日或特殊日。
所述构建相似度矩阵为:
X=[Pid]i=1,2,3...,M;d=1,2,3...D
式中:X为相似度矩阵;M为影响因素的个数;D为历史日的个数;Pid每个历史日每个影响因素的相似度。
计算总相似度公式为:
Fd为历史日的总相似度;M为影响因素的个数。
采用Bootstrap重抽样法从S个样本中抽取K个子样本集的方法包括:采用Bootstrap重抽样法从S个样本中抽取K个子样本集,最大限度地生成K棵回归树,生成的过程不需要剪枝;为了使决策树不产生局部最优解,随机森林采用有放回的Bootstrap重抽样法,随机抽样技术来产生K个训练样本集。
本发明有益效果:
本发明利用训练样本集得到负荷预测模型,从而实现对预测日的负荷预测。首先计算历史日与预测日之间的相似度,对样本实现预处理,选取相似度较高的历史样本,从而获得相似日样本集。然后对随机森林回归模型进行训练,将预测日的特征向量输入训练好的模型中,取所有回归树输出结果的平均值作为最终的负荷预测结果,从而实现对预测日的负荷进行精确预测。
优点及效果:
(1)本发明设计的基于相似日选取及随机森林算法的负荷预测方法,从多个影响因素出发进行相似日的选取。
(2)本发明设计的基于相似日选取及随机森林算法的负荷预测方法,随机森林算法需要调节的参数较少,给定随机森林的训练集样本、特征量个数等确定后,只需要确定决策树的个数即可。
(3)本发明设计的基于相似日选取及随机森林算法的负荷预测方法,不容易出现过拟合现象而且算法的拟合精度也较高,且随机森林的数学定义和决策树的结构性质保证了算法的收敛性。
附图说明
图1为本发明方法流程图;
图2为随机森林结构图;
图3为气温对负荷的影响系数。
具体实施方式
一种基于相似日选取及随机森林算法的负荷预测方法,通过采用相似日选取算法及随机森林算法,利用训练样本集得到负荷预测模型,从而实现对预测日的负荷预测。该实施方式计算历史日与预测日之间的相似度,对收资样本实现预处理,选取相似度较高的历史样本,从而获得相似日样本集。然后对随机森林回归模型进行训练,将预测日的特征向量输入训练好的模型中,取所有回归树输出结果的平均值作为最终的负荷预测结果,从而实现对预测日的负荷预测。该基于相似日选取及随机森林算法的负荷预测方法包括以下步骤:
步骤S110,根据实地调研收资数据,从经济因素、气候因素、时间因素、地理因素等方面出发,选取温度、湿度、降水、日类型等多个影响负荷变化的重要因素。上述影响因素中,温度需要考虑每日最高温度及最低温度。日类型是指工作日或周末,是否为特殊日等等。
步骤S120,根据所选取的负荷变化影响因素,确定每种影响因素的相似度计算方法。上述影响因素可分为:(1)最高温度;(2)最低温度;(3)湿度;(4)降水量;(5)日类型;(6)日期的距离;不同影响因素的相似度计算方法,具体描述如下:
(1)最高温度
气温对负荷的影响主要体现在空调设备的使用方面,通过空调设备的调节,使得人体的舒适度达到最佳。当气温较低时,空调体现为升温负荷,气温越低,负荷越高;当气温较高时,空调体现为降温负荷,气温越高,负荷越高。因此气温对负荷的影响是呈现为非线性的,气温对负荷的影响系数如图3所示。采用类似图3的映射表,将最高气温映射为一个映射值,根据映射值计算相似度。
(2)最低温度
最低气温对负荷的影响主要在冬季,最低气温越低,空调负荷的比重上升。但冬季空调负荷明显低于夏天,且冬天采暖的方式不局限于空调,使用燃煤集中供暖更为有效,因此最低温度对负荷的影响同样可以通过类似于图1的映射表得到,但需要合理的调低最低温度对负荷的影响指数的大小。
(3)湿度
当天气处于湿冷状态时,将导致“寒冷指数”上升,人体舒适度会下降,从而导致空调负荷上升;气温居中时,湿度的影响较小,不明显。当温度处于湿热的状态时,同样人体舒适度会下降,从而导致空调负荷的明显上升。考虑以上现象,在评估湿度因素的相似度时,需要综合考虑气温的影响,确定不同湿度对负荷的影响系数,再根据影响系数计算相似度。
(4)降水量
降水量对负荷的影响主要体现在对于温度和湿度的间接影响。当降水量较大且持续时间较长时,湿度增加,温度有所降低,从而间接带动空调负荷的升高。但降水量较大时,也会使小水电出力增加,网供负荷降低。因此,首先需要确定降水对负荷影响的方向,按照降雨量大小排序,依次确定各种降雨形式对负荷影响的程度。
(5)日类型
日类型可分为工作日或周末或特殊日。一般工作日以及周末的负荷曲线的形状是有明显区别,同样对于一些特殊日,负荷曲线也会发生明显的移动。若日类型相同,获得该因素最大相似度1。对于特殊日,需要考虑以下情况:同为特殊日,且日期相同;同为特殊日,但日期不同;一个为特殊日,一个为非特殊日;均为非特殊日。
(6)日期的距离
距预测日的远近也影响相似度的大小。一般,距离预测日越近,相似度越高。其相似度计算公式如下:
其中pid为第d天日期距离因素的相似度;γ为衰减系数;a为该因素的最低相似度。
步骤S130,根据不同影响因素得到的相似度方法,分别计算各历史日与预测日的相似度,构建相似度矩阵。假设考虑M种因素,D个历史日,获得的相似度矩阵为X,具体表示方法如下:
X=[Pid]i=1,2,3...,M;d=1,2,3...D
其中X为相似度矩阵;M为影响因素的个数;D为历史日的个数。Pid每个历史日每个影响因素的相似度。
步骤S140,根据相似度矩阵,将历史日各因素的相似度相乘,计算总相似度。历史日的总相似度用Fd表示,其具体计算方法如下式:
步骤S150,确定总相似度的阈值,选取相似度大于阈值的样本组成相似日样本集。λ为总相似度的阈值,选取Fd≥λ构成相似日样本集,相似日的个数为S。
步骤S160,设定初始回归树的数量K,采用Bootstrap重抽样法从S个样本中抽取K个子样本集,最大限度地生成K棵回归树,生成的过程不需要剪枝。为了使决策树不产生局部最优解,随机森林采用有放回的Bootstrap重抽样法,随机抽样技术来产生K个训练样本集合。
步骤S170,根据重抽样获得的样本集,同时训练K棵决策树,选取r个特征因素作为当前节点的分裂特征集,r小于等于log2(H+1)。决策树在节点分裂时会在所有特征中随机选择一部分用于计算最佳分裂属性,不能将全部特征属性参与计算中。通常选取r小于等于log2(H+1)或者n=√H,其中H为样本特征向量的维数。这里选取H为6个,因此r=3。
步骤S180,根据基尼不纯度最小准则进行节点的分裂。具体描述如下:
Gini不纯度最小准则的计算如下:
P(j|t)表示节点t上类别为j的概率,当节点t的所有样本属于同一类时,基尼指数取到最小值0,此时样本类别最纯;当Gini指数取最大值1时,处在当前节点的样本类别是最不纯的。
当前节点的Gini指数为
其中z为子节点的个数,ni为子节点i处的样本量,n为上层节点处的样本个数。在训练过程中要计算每个属性的Gini指数,并选择一个具有最小Gini指标的变量对当前节点进行分裂,直至达到停止条件。
步骤S190,将OOB数据作为测试样本,对随机森林回归模型进行误差估计,根据预测误差调整模型中回归树的数量K。随机森林是使用Bootstrap方法进行训练集的生成的,在生成这些数据集时,初始的训练集中有一些样本是不能被抽取的,称之为袋外数据,即OOB数据。以每一棵决策树为单位,利用未被该森林选中的所有的训练样本点的集合,统计该树的OOB误分率,将所有树的误分率取平均得到OOB误分率,就可以得到一个OOB误差估计。
步骤S200,根据输入预测日样本,取各个回归树输出的平均值即可得到最终的预测结果。

Claims (5)

1.一种基于相似日选取及随机森林的负荷特性指标预测方法,它包括:
步骤S110,采集预测区域内负荷变化影响因素;
步骤S120,根据所采集的负荷变化影响因素,确定每种影响因素的相似度计算方法;
步骤S130,根据不同影响因素得到的相似度计算方法,分别计算各历史日与预测日的相似度,构建相似度矩阵;
步骤S140,根据相似度矩阵,将历史日各因素的相似度相乘,计算总相似度;
步骤S150,确定总相似度的阈值,选取相似度大于阈值的样本组成相似日样本集;
步骤S160,设定初始回归树的数量K,采用Bootstrap重抽样法从S个样本中抽取K个子样本集,生成K棵回归树;
步骤S170,根据重抽样获得的样本集,同时训练K棵决策树,选取r个特征因素作为当前节点的分裂特征集,r小于等于log2(H+1);
步骤S180,根据基尼不纯度最小准则进行节点的分裂;
步骤S190,将OOB数据作为测试样本,对随机森林回归模型进行误差估计,根据预测误差调整模型中回归树的数量K;
步骤S200,根据输入预测日样本到随机森林回归模型,取各个回归树输出的平均值即可得到最终的预测结果。
2.根据权利要求1所述的一种基于相似日选取及随机森林的负荷特性指标预测方法,其特征在于:所述负荷变化影响因素包括温度、湿度、降水和日类型数据;温度温为每日最高温度及最低温度;日类型为工作日、假日或特殊日。
3.根据权利要求1所述的一种基于相似日选取及随机森林的负荷特性指标预测方法,其特征在于:所述构建相似度矩阵为:X=[Pid]i=1,2,3...,M;d=1,2,3...D
式中:X为相似度矩阵;M为影响因素的个数;D为历史日的个数;Pid每个历史日每个影响因素的相似度。
4.根据权利要求1所述的一种基于相似日选取及随机森林的负荷特性指标预测方法,其特征在于:计算总相似度公式为:
Fd为历史日的总相似度;M为影响因素的个数。
5.根据权利要求1所述的一种基于相似日选取及随机森林的负荷特性指标预测方法,其特征在于:采用Bootstrap重抽样法从S个样本中抽取K个子样本集的方法包括:采用Bootstrap重抽样法从S个样本中抽取K个子样本集,最大限度地生成K棵回归树,生成的过程不需要剪枝;为了使决策树不产生局部最优解,随机森林采用有放回的Bootstrap重抽样法,随机抽样技术来产生K个训练样本集。
CN201810331198.XA 2018-04-13 2018-04-13 一种基于相似日选取及随机森林算法的负荷预测方法 Pending CN108537683A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810331198.XA CN108537683A (zh) 2018-04-13 2018-04-13 一种基于相似日选取及随机森林算法的负荷预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810331198.XA CN108537683A (zh) 2018-04-13 2018-04-13 一种基于相似日选取及随机森林算法的负荷预测方法

Publications (1)

Publication Number Publication Date
CN108537683A true CN108537683A (zh) 2018-09-14

Family

ID=63480360

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810331198.XA Pending CN108537683A (zh) 2018-04-13 2018-04-13 一种基于相似日选取及随机森林算法的负荷预测方法

Country Status (1)

Country Link
CN (1) CN108537683A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109597968A (zh) * 2018-12-29 2019-04-09 西安电子科技大学 基于smt大数据的锡膏印刷性能影响因素分析方法
CN109636010A (zh) * 2018-11-23 2019-04-16 国网湖北省电力有限公司 基于相关因素矩阵的省级电网短期负荷预测方法及系统
CN110428113A (zh) * 2019-08-09 2019-11-08 云南电网有限责任公司电力科学研究院 一种基于随机森林的变压器油中溶解气体浓度预测方法
CN110458438A (zh) * 2019-08-05 2019-11-15 北京师范大学 植被水分利用效率wue的影响因子的计算方法及装置
CN111292020A (zh) * 2020-03-13 2020-06-16 贵州电网有限责任公司 一种基于随机森林的电网实时运行风险评估方法及系统
CN111738478A (zh) * 2019-12-24 2020-10-02 上海海事大学 基于随机森林算法和Adam神经网络波浪补偿预测方法
CN112257742A (zh) * 2020-09-07 2021-01-22 中国南方电网有限责任公司超高压输电公司广州局 一种换流阀入水温度预测修正方法及运维系统
CN112529262A (zh) * 2020-11-27 2021-03-19 北京京能高安屯燃气热电有限责任公司 短期功率预测方法、装置、计算机设备和存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105303262A (zh) * 2015-11-12 2016-02-03 河海大学 一种基于核主成分分析和随机森林的短期负荷预测方法
CN106778836A (zh) * 2016-11-29 2017-05-31 天津大学 一种基于约束条件的随机森林推荐算法
CN108062720A (zh) * 2017-12-05 2018-05-22 贵州电网有限责任公司电力科学研究院 一种基于相似日选取及随机森林算法的负荷预测方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105303262A (zh) * 2015-11-12 2016-02-03 河海大学 一种基于核主成分分析和随机森林的短期负荷预测方法
CN106778836A (zh) * 2016-11-29 2017-05-31 天津大学 一种基于约束条件的随机森林推荐算法
CN108062720A (zh) * 2017-12-05 2018-05-22 贵州电网有限责任公司电力科学研究院 一种基于相似日选取及随机森林算法的负荷预测方法

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109636010A (zh) * 2018-11-23 2019-04-16 国网湖北省电力有限公司 基于相关因素矩阵的省级电网短期负荷预测方法及系统
CN109636010B (zh) * 2018-11-23 2022-12-02 国网湖北省电力有限公司 基于相关因素矩阵的省级电网短期负荷预测方法及系统
CN109597968A (zh) * 2018-12-29 2019-04-09 西安电子科技大学 基于smt大数据的锡膏印刷性能影响因素分析方法
CN109597968B (zh) * 2018-12-29 2021-06-08 西安电子科技大学 基于smt大数据的锡膏印刷性能影响因素分析方法
CN110458438A (zh) * 2019-08-05 2019-11-15 北京师范大学 植被水分利用效率wue的影响因子的计算方法及装置
CN110428113A (zh) * 2019-08-09 2019-11-08 云南电网有限责任公司电力科学研究院 一种基于随机森林的变压器油中溶解气体浓度预测方法
CN111738478A (zh) * 2019-12-24 2020-10-02 上海海事大学 基于随机森林算法和Adam神经网络波浪补偿预测方法
CN111292020A (zh) * 2020-03-13 2020-06-16 贵州电网有限责任公司 一种基于随机森林的电网实时运行风险评估方法及系统
CN111292020B (zh) * 2020-03-13 2020-12-15 贵州电网有限责任公司 一种基于随机森林的电网实时运行风险评估方法及系统
CN112257742A (zh) * 2020-09-07 2021-01-22 中国南方电网有限责任公司超高压输电公司广州局 一种换流阀入水温度预测修正方法及运维系统
CN112257742B (zh) * 2020-09-07 2021-09-14 中国南方电网有限责任公司超高压输电公司广州局 一种换流阀入水温度预测修正方法及运维系统
CN112529262A (zh) * 2020-11-27 2021-03-19 北京京能高安屯燃气热电有限责任公司 短期功率预测方法、装置、计算机设备和存储介质

Similar Documents

Publication Publication Date Title
CN108537683A (zh) 一种基于相似日选取及随机森林算法的负荷预测方法
CN108062720A (zh) 一种基于相似日选取及随机森林算法的负荷预测方法
CN108416366B (zh) 一种基于气象指数的加权ls-svm的电力系统短期负荷预测方法
Weinand et al. Developing a municipality typology for modelling decentralised energy systems
CN112288164B (zh) 一种计及空间相关性和修正数值天气预报的风功率组合预测方法
CN106251001A (zh) 一种基于改进模糊聚类算法的光伏功率预测方法
CN110135630A (zh) 基于随机森林回归和多步寻优的短期负荷需求预测方法
CN112926795B (zh) 一种基于sbo优化cnn的高层住宅建筑群热负荷预测方法及系统
CN111561734B (zh) 基于人工智能的供暖户阀调节方法、系统及设备
CN106650784A (zh) 一种基于特征聚类比较的光伏电站功率预测方法及装置
CN110111003A (zh) 一种基于改进fcm聚类算法的新能源典型场景构建方法
CN113762387B (zh) 一种基于混合模型预测的数据中心站多元负荷预测方法
CN109886567A (zh) 一种考虑体感温度和辐射强度的短期负荷预测方法
CN111898856B (zh) 基于极限学习机的物理-数据融合楼宇的分析方法
CN111461921B (zh) 一种基于机器学习的负荷建模典型用户数据库更新方法
CN112949895A (zh) 一种基于动态可扩展神经网络模型的风速预测方法
CN106786499B (zh) 基于改进afsa优化elm的短期风电功率预测方法
CN112686449A (zh) 基于人体气象舒适度指数的居民用电预测方法
CN115545333A (zh) 一种多负荷日类型配电网负荷曲线预测方法
CN115912502A (zh) 一种智能电网运营优化方法及装置
CN116191544A (zh) 一种基于改进K-means算法的分布式发电集群划分方法
CN115566689A (zh) 一种改进天鹰优化算法优化负荷峰谷时段划分以及峰谷电价方法
CN109858668A (zh) 一种雷电气候下电力负荷区域协调预测方法
CN109586309B (zh) 基于大数据自由熵理论和场景匹配的配电网无功优化方法
CN116128154A (zh) 一种农业园区综合能源系统的能源优化配置方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20180914

WD01 Invention patent application deemed withdrawn after publication