CN115271215A - 一种短期电力负荷精细修正预测方法、系统、装置、介质 - Google Patents

一种短期电力负荷精细修正预测方法、系统、装置、介质 Download PDF

Info

Publication number
CN115271215A
CN115271215A CN202210913740.9A CN202210913740A CN115271215A CN 115271215 A CN115271215 A CN 115271215A CN 202210913740 A CN202210913740 A CN 202210913740A CN 115271215 A CN115271215 A CN 115271215A
Authority
CN
China
Prior art keywords
load
prediction
data
day
time point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210913740.9A
Other languages
English (en)
Inventor
宋晓霞
郇长武
胡电中
董仁玮
李锐
梁洪明
李星震
杨欣毅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
YANTAI HAIYI SOFTWARE CO Ltd
Original Assignee
YANTAI HAIYI SOFTWARE CO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by YANTAI HAIYI SOFTWARE CO Ltd filed Critical YANTAI HAIYI SOFTWARE CO Ltd
Priority to CN202210913740.9A priority Critical patent/CN115271215A/zh
Publication of CN115271215A publication Critical patent/CN115271215A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Marketing (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Public Health (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Water Supply & Treatment (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种短期电力负荷精细修正预测方法、系统、装置、介质,方法包括:利用训练好的平均负荷集成模型,对预测日每一段的平均负荷进行预测,得到预测日每一段的平均负荷的预测结果;利用训练好的时刻点负荷集成模型,对预测日各时刻点的负荷值进行预测,得到各时刻点初期的负荷预测结果;利用预测日每一段的平均负荷的预测结果对相应的预测日的初期负荷预测结果进行修正,得到预测日各时刻点的最终预测负荷结果。与人工确定系数相比,该修正方法更具有可解释性、智能性、降低了人工干预,对预测结果的修正更加精细准确。

Description

一种短期电力负荷精细修正预测方法、系统、装置、介质
技术领域
本发明涉及负荷预测技术领域,尤其涉及一种短期电力负荷精细修正预测方法、系统、装置、介质。
背景技术
负荷预测方法的研究可以追溯到上世纪五六十年代,主要分为传统方法、智能方法以及混合技术。传统方法包括时间序列法、回归分析法、指数平滑法、灰色预测法、相似日法等方法;智能方法包括支持向量机(Support Vector Machine,简称:SVM)、模糊预测(FUZZY)、人工神经网络(Artificial Neural Network,简称:ANN)、小波分析法、随机森林(Random Forest,简称:RF)、决策树(Decision Tree)、梯度提升算法等方法。混合技术包括传统方法和智能方法的组合、不同传统方法的组合、不同智能方法的组合。
时间序列法是最常见、最经典的一种负荷预测方法,包括了自回归、滑动平均、自回归滑动平均等,计算模型简单且收敛速度快,但该方法对时间序列的平稳性要求较高,存在预测误差的缺陷,未考虑其他不确定因素变化的影响。回归分析法模型简单且对陌生场景有较好的预测,但是对历史数据要求高,使用线性方法来描述复杂问题的精度较低,对于各种影响负荷的因素无法详细描述,模型使用难度大,需要一定的经验。指数平滑法通过“近大远小”的思想分配加权的系数,能够反映出新近数据对于预测负荷的影响,方法简单,但是对于时间序列波动大的时候预测结果也不佳,难以反映其他相关因素对负荷的影响。
支持向量机使用有限的历史样本数据信息在模型中寻找最优点,泛化能力强,收敛速度快,但是需要靠人为经验确定自选参数和核函数、对于波动大的样本数据的预测效果不好。模糊预测法是建立在模糊数学理论上的一种方法,主要包括模糊聚类法、模糊相似优先比法和模糊最大贴近度法等,可以很好地处理不确定因素对负荷的影响,但是需要较多的历史数据,且单独使用时预测效果不佳。
基于神经网络的短期负荷预测方法的使用可以追溯到上世纪九十年代。人工神经网络主要包括感知机、线性神经网络、BP神经网络(Back Propagation,简称:BP)、径向基函数网络(Radial basis function network,简称:RBF network)等,其中BP神经网络应用最广泛,它是一种有监督的前向多层感知机结构,使用的是误差反向传播算法,具有非线性映射性强、网络泛化性好等优点,具有广泛的应用,但是训练速度慢,容易收敛到局部最小点。近年来,随着深度学习的快速发展,很多研究致力于使用卷积神经网络(ConvolutionalNeural Networks,简称:CNN)、循环神经网络(Recurrent Neural Network,简称:RNN)、长短期记忆网络(Long Short-Term Memory,简称:LSTM)、门控循环单元(Gate RecurrentUnit,简称:GRU)、生成对抗网络(Generative Adversarial Networks,简称:GAN)等深度神经网络来实现负荷预测,但是深度学习的训练耗时,结果不稳定,也无法满足大规模线路的实时、在线负荷预测要求。
负荷预测技术可以分为传统经典预测技术、现代智能预测技术和组合预测技术。其中时间序列法,如自回归移动平均模型(Autoregressive Integrated Moving Averagemodel,简称:ARIMA)是电力负荷预测中发展较成熟和系统性的算法,它根据负荷的历史数据,获得负荷变动的惯性特征,建立描述负荷随时间变化的时序模型,确定其基本特征和变化规律,来对未来负荷进行预测。回归分析法(如多元线性回归、岭回归)也是一种常用的、经典的传统预测技术,它需要根据历史数据和负荷大小的影响因素,来寻找自变量和因变量之间的关系和回归方程。短期负荷预测一般使用时间序列法和回归分析法这两种主流负荷预测方法的相关技术。
现有技术对负荷结果使用系数进行修正一般是通过专家经验确定,不具有自动化能力,且难以满足大数据时代背景的需求;现有技术对负荷结果的修正一般是通过寻找相似日等方法,方法较复杂,并且如果历史数据中缺乏与预测日相似性高的日期,则会严重影响修正结果;现有技术未能充分考虑和利用其他因素对于负荷值结果的影响,导致负荷预测精度降低。
发明内容
针对上述技术问题,本发明针提供了一种短期电力负荷精细修正预测方法、系统、装置、介质。
本发明解决上述技术问题的技术方案如下:
本发明提供了一种短期电力负荷精细修正预测方法,包括以下步骤:
步骤1:获取预测日的相关外部影响数据、预测日前N天的历史负荷数据及对应的相关外部影响数据,作为初始数据集;
步骤2:对所述初始数据集进行预处理,形成预处理后的数据集;
步骤3:对预处理后的数据集进行特征工程操作,形成第一训练数据集;
步骤4:针对第一训练数据集中的数据,将每天负荷数据根据峰值峰谷所在的时间区间进行分段,并将每段的多条数据合为一条,得到每段的预处理结果,以此来形成第二训练数据集;
步骤5:构建多种机器学习方法组成的集成模型;
步骤6:利用第二训练数据集对集成模型进行训练,得训练好的平均负荷集成模型;利用训练好的平均负荷集成模型,对预测日每一段的平均负荷进行预测,得到预测日每一段的平均负荷的预测结果;
步骤7:利用第一训练数据集对集成模型进行训练,得训练好的时刻点负荷的集成模型;利用训练好的时刻点负荷集成模型,对预测日各时刻点的负荷值进行预测,得到各时刻点初期的负荷预测结果;
步骤8:利用预测日每一段的平均负荷的预测结果对相应的预测日的初期负荷预测结果进行修正,得到预测日各时刻点的最终预测负荷结果。
进一步地,所述步骤1中,相关外部影响数据包括时间属性、温度属性、天气属性、节假日属性。
进一步地,所述步骤2中,对所述初始数据集进行预处理包括:采用线型插值法,对缺失的数值型数据补全;节假日数据修正;对天气、节假日信息、星期属性数据这类分类型数据进行编码。
进一步地,所述步骤3中,特征工程操作具体包括:
添加关于周几的特征列:将日期根据周几分为[1,2,3,4,5,6,7]和[1,1,1,1,1,2,2]两种类型的特征;
添加关于节前节后和月初月末的一列特征;
添加负荷值和温度值的数据差分特征:负荷的差分是前一天的负荷减去前两天的负荷;
添加温度影响特征。
进一步地,所述步骤5中,所述机器学习集成模型包括LGBM(Light GradientBoosting Machine,轻量梯度提升机)、岭回归(Ridge Regression)和CatBoost(Categorical Boosting,梯度提升决策树)。
进一步地,所述步骤5中,所述集成模型中权重比例为LGBM:岭回归:CatBoost=2:1:4。
进一步地,所述步骤8中,预测日的每组的平均负荷预测结果对预测日的初期负荷预测结果进行修正包括:
预测日各时刻点的预测负荷结果v'Pj;预测日各时刻点的初期负荷预测结果vPj
v′Pj=vPji
其中,
Figure BDA0003772459070000041
AveValueAI表示某段内各时刻点初期的负荷预测结果的平均负荷,AveValuePI表示预测日某段的平均负荷的预测结果。
本发明还提供了一种短期电力负荷精细修正预测系统,包括数据获取模块、数据预处理模块、特征工程模块、数据分段处理模块、预测模型预生成模块、平均负荷预测模块、时刻点负荷预测模块、负荷修正模块;
数据获取模块,用于获取预测日的相关外部影响数据、预测日前N天的历史负荷数据及对应的相关外部影响数据,作为初始数据集;
数据预处理模块,用于对所述初始数据集进行预处理,形成预处理后的数据集;
特征工程模块,用于对预处理后的数据集进行特征工程操作,形成第一训练数据集;
数据分段处理模块,用于针对第一训练数据集中的数据,将每天负荷数据根据峰值峰谷所在的时间区间进行分段,并将每段的多条数据合为一条,得到每段的预处理结果,以此来形成第二训练数据集;
预测模型预生成模块,用于构建多种机器学习方法组成的集成模型,其中机器学习的方法包括LGBM、岭回归、CatBoost;
平均负荷预测模块,利用第二训练数据集对集成模型进行训练,得训练好的平均负荷集成模型;利用训练好的平均负荷集成模型,对预测日每一段的平均负荷进行预测,得到预测日每一段的平均负荷的预测结果;
时刻点负荷预测模块,利用第一训练数据集对集成模型进行训练,得训练好的时刻点负荷的集成模型;利用训练好的时刻点负荷集成模型,对预测日各时刻点的负荷值进行预测,得到各时刻点初期的负荷预测结果;
负荷修正模块,用于利用预测日每一段的平均负荷的预测结果对相应的预测日的初期负荷预测结果进行修正,得到预测日各时刻点的最终预测负荷结果。
本发明还提供了一种短期电力负荷精细修正预测装置,其包括:处理器、存储器以及程序;所述程序存储在所述存储器中,所述处理器调用存储器存储的程序,以执行任意一项所述的一种短期电力负荷精细修正预测方法。
本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质被配置成存储程序,所述程序被配置成执行任意一项所述一种短期电力负荷精细修正预测方法。
与现有技术相比,本发明具有如下技术效果:
1、根据峰值峰谷所在的时间区间进行分段,预测每一段的平均负荷,用来指导修正所有时刻点的预测结果,每一段的平均负荷与该时间区间内所有点的预测值的平均负荷进行比较,从而得到每段的一个系数,将该系数用于对每个时间区间内所有时刻点的微调;与人工确定系数相比,该精细修正方法更具有可解释性、智能性、降低了人工干预,且将一天按照峰值峰谷分为几个时间区间从而可以得到几个系数,对预测结果的修正更加精细准确。
2、对于短期电力负荷预测任务,从特征工程层面进行分析和处理,充分分析和考虑了影响负荷预测结果的温度、节假日、周几等相关因素,构建多个特征将其进行表达,加强上述因素对负荷值的影响,提升负荷预测精度。
3、采用LGBM、岭回归和CatBoost三个模型的集成模型,分别应用于平均负荷和所有时刻点的负荷的预测,与单模型相比,集成模型中和了单模型的误差,有效提升了模型的泛化能力,得到更稳定、更高精度的结果。
附图说明
图1为本发明的一种短期电力负荷精细修正预测方法流程示意图;
图2为本发明的数据分段示意图;
图3为本发明的数据分段部分多条数据处理为一条示意图;
图4为本发明的根据一段数据分段结果进行预测的示意图;
图5为本发明的单模型与集成模型预测结果与真实值曲线对比示意图;
图6为本发明的滚动预测的误差累积示意图;
图7为本发明的真实值与单模型、真实值与集成模型的分段平均负荷预测结果的差值对比示意图;
图8为本发明的随机选取某天的真实值与单模型和集成模型预测结果的对比示意图;
图9为本发明的随机选取某天的真实值与单模型、集成模型和精细修正后的集成模型预测结果的对比示意图。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
本发明进行短期负荷预测的目标为预测未来一天24小时内以15分钟为采样间隔(96点)的负荷数值。基于此提出了一种短期电力负荷精细修正预测方法,包括以下步骤:
步骤1:获取预测日的相关外部影响数据、预测日前N天的历史负荷数据及对应的相关外部影响数据,作为初始数据集。其中,相关外部影响数据包括时间属性、温度属性、天气属性、节假日属性。
步骤2:对所述初始数据集进行预处理,形成预处理后的数据集。
数据预处理步骤主要包括以下几个方面:
缺失数据补全:对于缺失的数值型数据使用线性插值填充;对于分类型数据使用空值填充。
节假日数据修正:使用python包chinese_calendar获得准确的是否节假日以及哪个节假日的结果;
分类型数据编码:对天气、节假日、周几等分类型数据进行编码,将字符串转化为电脑能够识别的数值型分类特征。
步骤3:对预处理后的数据集进行特征工程操作,提取关键特征,形成第一训练数据集。
负荷大小受到时间、温度、天气、节假日属性等多种特征因素的影响,因此,对于负荷数据的处理和转换也会影响建模和预测的能力,仅使用已知的特征可能不能很好的表示业务逻辑,甚至影响模型的预测能力。本实施例从数据中提取和使用关键特征,有助于帮助算法更好地发挥最优效果。对数据进行特征工程操作,了解和分析影响负荷大小的特征因素,对其进行定义和处理,从而提升模型的预测精度。
特征工程,提取关键特征主要包括:
提取添加关于周几的特征列:将日期根据周几分为[1,2,3,4,5,6,7]和[1,1,1,1,1,2,2]两种类型的特征,以提升提现周几对于负荷值的影响,强化日期类型;
提取添加关于节前节后和月初月末的一列特征:经过分析和专家经验发现,负荷值曲线在月初月末和节假日前后的表现与其他日期有明显不同,因此将月初、月末、节前、节后和其他日期分别用不同的标签表示,另外节前节后优先级高于月初月末;
提取添加负荷值和温度值的数据差分特征:温度的差分计算是当天的温度减去前一天的温度,需要注意的是,由于预测日当天的负荷值是未知的,因此负荷的差分是前一天的负荷减去前两天的负荷;
提取添加温度影响特征:高温时由于需要加开空调,对负荷值有所影响,因此增加相关特征,具体表示为当温度大于26度时,该列特征值为(当前温度-26),温度小于26度时,该列特征值为0;
对于所有时刻点的负荷预测,添加前一周每天的平均负荷,以及一周前对应时刻的负荷,以提升预测日前一周数据对于负荷预测结果的影响。
步骤4:针对第一训练数据集中的数据,将每天负荷数据根据峰值峰谷所在的时间区间进行分段,并将每段的多条数据合为一条,得到每段的预处理结果,以此来形成第二训练数据集。
将每天的各时刻点(96点)的负荷数据根据曲线形状(峰值峰谷)、按照对应的时间区间进行分段,对于每段数据,通过求均值、求最大最小值、求众数等方法将多条数据的特征压缩处理为一条,最终得到每段的预处理结果,其步骤如图2所示,其中,n表示将每天的数据一共分成了n个时间段。
负荷数据按照时间区间分段后,将多条数据的特征处理为一条的样例如图3所示,具体来说,对于负荷值(VALUE)和温度(TEMP)这类数值型属性特征进行求均值操作;对于是否节假日(HOLIDAY)、节假日类型(HNAME)、节假日当天(HDAY)、天气(WEATHER)、风向(WIND)、风力(WINP)这类分类型属性特征进行求众数的方法;另外,对温度(TEMP)进行求最大最小值,作为两个新的特征列。
步骤5:构建多种机器学习方法组成的集成模型。机器学习的方法包括LGBM、岭回归、CatBoost。
LGBM:使用基于直方图的算法,因此具有更快的训练速度和更好的效率;具有更低的内存占用;与其他提升算法相比,具有更高的准确率,并且可以通过“max_depth”参数预防过拟合问题。缺点是直方图比较粗糙,会损失一部分精度。
岭回归:是一种改良的最小二乘估计法,相当于线性回归的基础上加入L2正则,优点是回归系数更符合实际更可靠,估计参数更稳定,在多病态数据中有优势。缺点是放弃了最小二乘法的无偏性,损失了部分信息,降低了精度。
CatBoost:是一种基于对称决策树的的参数少、准确率高的框架,具有比其他任何机器学习算法都卓越的性能;减少了调参的难度和过拟合发生的机会,具有鲁棒性;解决了梯度偏差和预测偏移的问题。缺点是运算过程比其他机器学习方法耗时,处理类别特征需要大量内存。
不同的单模型的负荷预测在同一个日期下具有不同的表现,同一天的预测结果下有的模型精度高,有的精度较低,稳定性较差,因此本实施例通过使用集成模型,即将LGBM、岭回归、CatBoost模型的预测结果进行加权组合,可以有效增强模型的泛化能力和稳定性,并且也有助于提升模型的预测精度。
步骤6:利用第二训练数据集对集成模型进行训练,得训练好的平均负荷集成模型;利用训练好的平均负荷集成模型,对预测日每一段的平均负荷进行预测,得到预测日每一段的平均负荷的预测结果。
第二训练数据集中每段的预处理结果依次输入LGBM、岭回归、CatBoost三种模型中,依照此来训练平均负荷集成模型,得训练好的平均负荷集成模型。
利用训练好的平均负荷集成模型,将预测日每段的预处理结果依次输入LGBM、岭回归、CatBoost三种平均负荷模型中,对预测日每段的平均负荷进行预测,得到预测日每段的平均负荷的预测结果,将预测结果进行加权,得到预测日每一段的平均负荷的预测结果。
这n个分段平均负荷的预测结果用于指导各时刻(96点)负荷预测结果的精确修正。使用其中一段数据分段处理结果进行集成模型预测的具体步骤如图4所示。
步骤7:利用第一训练数据集对集成模型进行训练,得训练好的时刻点负荷的集成模型;利用训练好的时刻点负荷集成模型,对预测日各时刻点的负荷值进行预测,得到各时刻点初期的负荷预测结果。
第一训练数据集中各时刻点(96点)数据依次输入LGBM、岭回归Ridge、CatBoost三种模型中,依照此来训练时刻点负荷集成模型,得训练好的时刻点负荷集成模型。
利用训练好的时刻点负荷集成模型,将预测日各时刻点(96点)数据依次输入LGBM、岭回归、CatBoost三种时刻点负荷预测的模型中,使用LGBM、岭回归、CatBoost三种时刻点负荷预测的模型来预测预测日当天各时刻点(96点)的负荷值,然后将预测结果进行加权后得到初期的负荷预测结果。
使用集成模型与各个独立模型的预测结果曲线如图5所示。从图5可以看出,由于不同算法性质不同,其预测的结果曲线也有差别。例如图中岭回归Ridge预测的结果明显偏低,而CatBoost的预测结果偏高,集成之后两者就起到互相中和的作用,所以将多个算法的结果进行加权平均可能会获得比算法单独预测更好的结果。
步骤8:利用预测日每一段的平均负荷的预测结果对相应的预测日的初期负荷预测结果进行修正,得到预测日各时刻点的最终预测负荷结果。
如图6所示,随着预测长度的增加,误差逐渐上升,本实施例提出的修正由于是单步预测,因此可以避免滚动预测产生的误差累积,所以精细修正的预测精度高,使用此结果来辅助修正各时刻点(96点)的预测结果,能够起到提升精度的作用,具体做法如下:
预测日各时刻点的预测负荷结果v'Pj;预测日各时刻点的初期负荷预测结果vPj
v′Pj=vPji
其中,
Figure BDA0003772459070000111
AveValueAI表示某段内各时刻点初期的负荷预测结果的平均负荷,AveValuePI表示预测日某段的平均负荷的预测结果。
每一段的平均负荷与该时间区间内所有时刻点的预测值的平均负荷进行比较,从而得到每段的一个系数,将该系数用于对每个时间区间内所有时刻点的微调,并且在每段之间进行平滑处理,防止各段连接处的突增突减。
负荷的预测结果在经过特征工程和集成模型之后,有的日期下的结果还是不够准确,例如:由于业务方面的原因,月初月末的日期是工厂的固定盘点,所以预测结果普遍高于真实值;经过数据分析发现,周日和周一等日期的负荷预测精度也偏低;等等。以往的一种方法是通过专家经验,将负荷预测结果乘上一个系数或者加减一个确定值来修正,然而这种方法受限于专家知识,而且需要耗费大量人力物力且无法满足大数据背景下海量数据的高性能、高效率、高价值的需求。本实施例针对该问题提出精细修正的方法,从自动化角度确定调整系数,提升模型的预测精度,减少了人工干预,更加智能,能够满足大数据时代的需求。
为了验证本方案的可行性、可用性,开展了以下对比实验:
实验一、假设预测日各时刻点或者各时间段的预测负荷结果为v'Pj,实际负荷值为vTj,各时刻点的预测精度计算公式为:
Figure BDA0003772459070000121
预测日的平均精度计算公式为:
Figure BDA0003772459070000122
其中,N表示预测日时刻的数量,可以为96个时刻点或者数据分段的数量。
按照上述试验方案对某负荷线路进行负荷预测并计算日平均精度,在分段预测平均负荷下的精度对比如表1所示。
表1某线路分段负荷预测结果对比表
Figure BDA0003772459070000123
由表1可以看出,增加了特征工程以后,对于分时间段的平均负荷的预测精度均有提升,对于三个单模型平均提升大约为0.53%,对于集成模型的提升大约为0.67%,由此可见特征工程对于提升负荷预测精度的作用,其中集成模型的权重比例为LGBM:Ridge:CatBoost=2:1:4。
特征工程在预测所有点负荷下的精度对比如表2所示:
表2某线路所有点的负荷预测结果对比表
Figure BDA0003772459070000131
从表2的精度结果可以看出,增加了特征工程后所有点的负荷预测精度具有显著提升,对单个模型的平均提升大约为1.81%,对于集成模型的提升大约为1.99%,由此体现出特征工程的重要作用,其中集成模型的权重比例为LGBM:Ridge:CatBoost=2:1:4。
实验二、集成模型对于提升负荷预测精度的影响。
实验一已经展示了单模型和集成模型对比的定量结果,因此实验二中进行定性分析。分段预测平均负荷的集成模型和单模型的预测结果对比如图7所示。
将2022年3月数据进行分段预测平均负荷,使用集成模型的权重比例为LGBM:Ridge:CatBoost=2:1:4,分别计算真实值与各单模型预测值的差值以及真实值与集成模型的预测值的差值(结果越接近0越好),结果如图7所示,可以看出,集成模型可以有效中和单个模型预测结果与真实值相比过低或者过高的情况,提升负荷预测精度。
预测所有点负荷的集成模型和单模型的预测结果对比,如图8所示。
将2022年3月数据的所有点数据进行预测,随机选取某天结果,将单模型与集成模型的负荷预测结果与真实值进行对比,结果如图8所示,可以明显看出,集成模型可以有效中和三个单模型的预测结果,使得集成模型的预测曲线更加拟合真实数据曲线,从而有效提升负荷预测精度。
实验三、精细修正对于提升负荷预测精度的影响。
随机选取2022年3月某天96点的真实值与单模型、集成模型和精细修正后的集成模型的预测结果进行对比,结果如图9所示,可以看出经过精细修正后的负荷预测曲线比没有修正的集成模型曲线要更加拟合真实负荷曲线。
表3 2022年3月周日和周一的96点的负荷精细修正预测结果对比表
Figure BDA0003772459070000141
研究发现实验数据使用的线路的数据在周日和周一的准确度普遍比其他时间低而且对周日很难通过特征工程等方法提升精度而使用精细修正后有明显提升,选取2022年3月周日和周一的精细修正结果进行定量分析,如表3所示,可以看出,使用精细修正后集成模型的预测精度有明显的提高。而且精细修正与专家经验手动设置相比,更加智能化、自动化。
上述实验结果表明,一种短期电力负荷精细修正预测方法可以有效的提升短期负荷预测的精度。
本方案提出了精细修正的方法,通过使用每天分段预测的平均负荷对每个时间段内的所有负荷进行调整,来指导修正一天中所有点的预测结果,对负荷预测曲线进行微调,提高了预测精度;考虑到节假日、周几、温度等特征对于负荷值大小的影响,进行特征工程工作,构建多种相关特征,以加强上述特征对于负荷变化的影响;使用LGBM、岭回归和CatBoost三个模型的集成模型来进行预测,有效提升了模型的稳定性、鲁棒性和准确率。
在本发明的实施例中,还提供了一种短期电力负荷精细修正预测系统,包括数据获取模块、数据预处理模块、特征工程模块、数据分段处理模块、预测模型预生成模块、平均负荷预测模块、时刻点负荷预测模块、负荷修正模块。
数据获取模块,用于获取预测日的相关外部影响数据、预测日前N天的历史负荷数据及对应的相关外部影响数据,作为初始数据集。
数据预处理模块,用于对所述初始数据集进行预处理,形成预处理后的数据集。
特征工程模块,用于对预处理后的数据集进行特征工程操作,提取关键特征,形成第一训练数据集。
数据分段处理模块,用于针对第一训练数据集中的数据,将每天负荷数据根据峰值峰谷所在的时间区间进行分段,并将每段的多条数据合为一条,以此来形成第二训练数据集。
预测模型预生成模块,用于构建多种机器学习方法组成的集成模型。其中,机器学习的方法包括LGBM、岭回归、CatBoost,集成模型的权重比例为LGBM:岭回归:CatBoost=2:1:4。
平均负荷预测模块,利用第二训练数据集对集成模型进行训练,得训练好的平均负荷集成模型;利用训练好的平均负荷集成模型,对预测日每一段的平均负荷进行预测,得到预测日每一段的平均负荷的预测结果。
时刻点负荷预测模块,利用第一训练数据集对集成模型进行训练,得训练好的时刻点负荷的集成模型;利用训练好的时刻点负荷集成模型,对预测日96点的负荷值进行预测,得到各时刻点初期的负荷预测结果;
负荷修正模块,用于利用预测日每一段的平均负荷的预测结果对相应的预测日的初期负荷预测结果进行修正,得到预测日各时刻点的最终预测负荷结果。
其中,预测日各时刻点的预测负荷结果v'Pj;预测日各时刻点的初期负荷预测结果vPj
v′Pj=vPji
其中,
Figure BDA0003772459070000161
AveValueAI表示某段内各时刻点初期的负荷预测结果的平均负荷,AveValuePI表示预测日某段的平均负荷的预测结果。
在本发明的实施例中,还提供了一种短期电力负荷精细修正预测装置,其包括:处理器、存储器以及程序;程序存储在存储器中,处理器调用存储器存储的程序,以执行上述的一种短期电力负荷精细修正预测方法。
在上述一种短期电力负荷精细修正预测装置的实现中,存储器和处理器之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可以通过一条或者多条通信总线或信号线实现电性连接,如可以通过总线连接。存储器中存储有实现数据访问控制方法的计算机执行指令,包括至少一个可以软件或固件的形式存储于存储器中的软件功能模块,处理器通过运行存储在存储器内的软件程序以及模块,从而执行各种功能应用以及数据处理。
存储器可以是,但不限于,随机存取存储器(RandomAccessMemory,简称:RAM),只读存储器(Read Only Memory,简称:ROM),可编程只读存储器(Programmable Read-OnlyMemory,简称:PROM),可擦除只读存储器(Erasable Programmable Read-OnlyMemory,简称:EPROM),电可擦除只读存储器(Electric ErasableProgrammableRead-OnlyMemory,简称:EEPROM)等。其中,存储器用于存储程序,处理器在接收到执行指令后,执行程序。
处理器可以是一种集成电路芯片,具有信号的处理能力。上述的处理器可以是通用处理器,包括中央处理器(CentralProcessingUnit,简称:CPU)、网络处理器(NetworkProcessor,简称:NP)等。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
在本发明的实施例中,还提供了一种计算机可读存储介质,计算机可读存储介质被配置成存储程序,程序被配置成执行上述的一种短期电力负荷精细修正预测方法。
本领域内的技术人员应明白,本发明实施例的实施例可提供为方法或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图中指定的功能的步骤。
以上对本发明所提供的一种短期电力负荷精细修正预测方法、一种短期电力负荷精细修正预测系统、一种短期电力负荷精细修正预测装置和一种计算机可读存储介质的应用进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种短期电力负荷精细修正预测方法,其特征在于,包括以下步骤:
步骤1:获取预测日的相关外部影响数据、预测日前N天的历史负荷数据及对应的相关外部影响数据,作为初始数据集;
步骤2:对所述初始数据集进行预处理,形成预处理后的数据集;
步骤3:对预处理后的数据集进行特征工程操作,形成第一训练数据集;
步骤4:针对第一训练数据集中的数据,将每天负荷数据根据峰值峰谷所在的时间区间进行分段,并将每段的多条数据合为一条,得到每段的预处理结果,以此来形成第二训练数据集;
步骤5:构建多种机器学习方法组成的集成模型;
步骤6:利用第二训练数据集对集成模型进行训练,得训练好的平均负荷集成模型;利用训练好的平均负荷集成模型,对预测日每一段的平均负荷进行预测,得到预测日每一段的平均负荷的预测结果;
步骤7:利用第一训练数据集对集成模型进行训练,得训练好的时刻点负荷的集成模型;利用训练好的时刻点负荷集成模型,对预测日各时刻点的负荷值进行预测,得到各时刻点初期的负荷预测结果;
步骤8:利用预测日每一段的平均负荷的预测结果对相应的预测日的初期负荷预测结果进行修正,得到预测日各时刻点的最终预测负荷结果。
2.根据权利要求1所述的一种短期电力负荷精细修正预测方法,其特征在于,所述步骤1中,相关外部影响数据包括时间属性、温度属性、天气属性、节假日属性。
3.根据权利要求2所述的一种短期电力负荷精细修正预测方法,其特征在于,所述步骤2中,对所述初始数据集进行预处理包括:采用线型插值法,对缺失的数值型数据补全;节假日数据修正;对天气、节假日信息、星期属性数据这类分类型数据进行编码。
4.根据权利要求3所述的一种短期电力负荷精细修正预测方法,其特征在于,所述步骤3中,特征工程操作具体包括:
添加关于周几的特征列:将日期根据周几分为[1,2,3,4,5,6,7]和[1,1,1,1,1,2,2]两种类型的特征;
添加关于节前节后和月初月末的一列特征;
添加负荷值和温度值的数据差分特征:负荷的差分是前一天的负荷减去前两天的负荷;
添加温度影响特征。
5.根据权利要求1所述的一种短期电力负荷精细修正预测方法,其特征在于,所述步骤5中,所述机器学习集成模型包括LGBM、岭回归和CatBoost。
6.根据权利要求5所述的一种短期电力负荷精细修正预测方法,其特征在于,所述步骤5中,所述集成模型中权重比例为LGBM:岭回归:CatBoost=2:1:4。
7.根据权利要求1所述的一种短期电力负荷精细修正预测方法,其特征在于,所述步骤8中,预测日的每组的平均负荷预测结果对预测日的初期负荷预测结果进行修正包括:
预测日各时刻点的预测负荷结果v'Pj;预测日各时刻点的初期负荷预测结果vPj
v′Pj=vPji
其中,
Figure FDA0003772459060000021
AveValueAI表示某段内各时刻点初期的负荷预测结果的平均负荷,AveValuePI表示预测日某段的平均负荷的预测结果。
8.一种短期电力负荷精细修正预测系统,其特征在于,包括数据获取模块、数据预处理模块、特征工程模块、数据分段处理模块、预测模型预生成模块、平均负荷预测模块、时刻点负荷预测模块、负荷修正模块;
数据获取模块,用于获取预测日的相关外部影响数据、预测日前N天的历史负荷数据及对应的相关外部影响数据,作为初始数据集;
数据预处理模块,用于对所述初始数据集进行预处理,形成预处理后的数据集;
特征工程模块,用于对预处理后的数据集进行特征工程操作,形成第一训练数据集;
数据分段处理模块,用于针对第一训练数据集中的数据,将每天负荷数据根据峰值峰谷所在的时间区间进行分段,并将每段的多条数据合为一条,得到每段的预处理结果,以此来形成第二训练数据集;
预测模型预生成模块,用于构建多种机器学习方法组成的集成模型,其中机器学习的方法包括LGBM、岭回归、CatBoost;
平均负荷预测模块,利用第二训练数据集对集成模型进行训练,得训练好的平均负荷集成模型;利用训练好的平均负荷集成模型,对预测日每一段的平均负荷进行预测,得到预测日每一段的平均负荷的预测结果;
时刻点负荷预测模块,利用第一训练数据集对集成模型进行训练,得训练好的时刻点负荷的集成模型;利用训练好的时刻点负荷集成模型,对预测日各时刻点的负荷值进行预测,得到各时刻点初期的负荷预测结果;
负荷修正模块,用于利用预测日每一段的平均负荷的预测结果对相应的预测日的初期负荷预测结果进行修正,得到预测日各时刻点的最终预测负荷结果。
9.一种短期电力负荷精细修正预测装置,其特征在于,其包括:处理器、存储器以及程序;所述程序存储在所述存储器中,所述处理器调用存储器存储的程序,以执行权利要求1-7任意一项所述的一种短期电力负荷精细修正预测方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质被配置成存储程序,所述程序被配置成执行权利要求1-7任意一项所述的一种短期电力负荷精细修正预测方法。
CN202210913740.9A 2022-07-29 2022-07-29 一种短期电力负荷精细修正预测方法、系统、装置、介质 Pending CN115271215A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210913740.9A CN115271215A (zh) 2022-07-29 2022-07-29 一种短期电力负荷精细修正预测方法、系统、装置、介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210913740.9A CN115271215A (zh) 2022-07-29 2022-07-29 一种短期电力负荷精细修正预测方法、系统、装置、介质

Publications (1)

Publication Number Publication Date
CN115271215A true CN115271215A (zh) 2022-11-01

Family

ID=83746353

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210913740.9A Pending CN115271215A (zh) 2022-07-29 2022-07-29 一种短期电力负荷精细修正预测方法、系统、装置、介质

Country Status (1)

Country Link
CN (1) CN115271215A (zh)

Similar Documents

Publication Publication Date Title
CN110969290B (zh) 一种基于深度学习的径流概率预测方法及系统
CN109190442B (zh) 一种基于深度级联卷积神经网络的快速人脸检测方法
WO2021238455A1 (zh) 数据处理方法、设备及计算机可读存储介质
CN109766950B (zh) 一种基于形态聚类和LightGBM的工业用户短期负荷预测方法
CN110751318B (zh) 一种基于ipso-lstm的超短期电力负荷预测方法
US11074435B2 (en) Method and apparatus for predicting face beauty grade, and storage medium
CN110444011B (zh) 交通流高峰识别方法、装置、电子设备及存储介质
CN111241755A (zh) 电力负荷预测方法
CN116307215A (zh) 一种电力系统的负荷预测方法、装置、设备及存储介质
CN112214496B (zh) 基于大数据分析的化妆品生产线安全监测方法及云服务器
CN110889558A (zh) 路况预测方法及装置
CN113361785A (zh) 配电网短期负荷预测方法、装置、终端及存储介质
CN113822419A (zh) 一种基于结构信息的自监督图表示学习运行方法
CN116205334A (zh) 电网负荷的智能预测方法及装置
CN116432697A (zh) 一种融合长短期记忆网络与注意力机制的时间序列预测方法
CN112215398A (zh) 电力用户负荷预测模型建立方法、装置、设备及存储介质
CN110110339A (zh) 一种日前水文预报误差校正方法及系统
CN110516792A (zh) 基于小波分解和浅层神经网络的非平稳时间序列预测方法
CN115271215A (zh) 一种短期电力负荷精细修正预测方法、系统、装置、介质
CN116470491A (zh) 基于copula函数的光伏功率概率预测方法及系统
CN113780644A (zh) 一种基于在线学习的光伏出力预测方法
CN112801356A (zh) 一种基于ma-lssvm的电力负荷预测方法
Liu et al. Short-term Load Forecasting Approach with SVM and Similar Days Based on United Data Mining Technology
CN117996863B (zh) 光伏电源的下垂控制方法、装置、计算机设备及介质
Dai et al. A novel hybrid time-varying graph neural network for traffic flow forecasting

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination