CN117993570A - 一种负荷预测方法、装置、设备及存储介质 - Google Patents

一种负荷预测方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN117993570A
CN117993570A CN202410242068.4A CN202410242068A CN117993570A CN 117993570 A CN117993570 A CN 117993570A CN 202410242068 A CN202410242068 A CN 202410242068A CN 117993570 A CN117993570 A CN 117993570A
Authority
CN
China
Prior art keywords
load
data
predicted
prediction
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202410242068.4A
Other languages
English (en)
Inventor
朱静
刘丹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Honghe Electronics Hangzhou Co ltd
Original Assignee
Honghe Electronics Hangzhou Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Honghe Electronics Hangzhou Co ltd filed Critical Honghe Electronics Hangzhou Co ltd
Priority to CN202410242068.4A priority Critical patent/CN117993570A/zh
Publication of CN117993570A publication Critical patent/CN117993570A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/067Enterprise or organisation modelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J3/00Circuit arrangements for ac mains or ac distribution networks
    • H02J3/003Load forecast, e.g. methods or systems for forecasting future load demand

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Software Systems (AREA)
  • Development Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Water Supply & Treatment (AREA)
  • Primary Health Care (AREA)
  • Power Engineering (AREA)
  • Public Health (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Educational Administration (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Medical Informatics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种负荷预测方法、装置、设备及存储介质。该方法包括:获取数据集,数据集包括电力系统的历史负荷数据,以及待预测时间的节假日特征、季节性因素特征和数值天气;对数据集进行预处理得到预处理数据集,并将预处理数据集划分为训练集和预测集;基于训练集训练初始预测模型,得到训练好的负荷预测模型,训练好的负荷预测模型包括轻量级梯度提升树LightGBM模型和自回归移动平均ARMA模型;基于训练好的负荷预测模型对预测集进行预测,得到待预测时间的预测负荷数据。如此可以准确、快速地预测出待预测时间的预测负荷数据,便可利用预测负荷数据对待预测时间的供电进行规划,避免电网故障,提高供电效率。

Description

一种负荷预测方法、装置、设备及存储介质
技术领域
本申请涉及计算机技术领域,尤其涉及一种负荷预测方法、装置、设备及存储介质。
背景技术
作为生产生活的重要支撑,电力系统可以向各行业、各领域提供用电服务,是现代化社会运转的基础设施之一。
然而,随着人口的增长和经济的发展,电力负荷的增加给电力系统带来了巨大的挑战,需要十分复杂的管理和运营方式才能使电力系统的供电保持可靠和稳定,否则,过度或不足的供电会导致电网时常发生故障,影响供电效率。
发明内容
本申请实施例提供了一种负荷预测方法、装置、设备及存储介质,以不需要采取复杂的管理和运营方式也能够保持电力系统的可靠性和稳定性,有助于避免电网故障,提高供电效率。
第一方面,本申请实施例提供了一种负荷预测方法,包括:
获取数据集,所述数据集包括电力系统的历史负荷数据,以及待预测时间的节假日特征、季节性因素特征和数值天气;
对所述数据集进行预处理得到预处理数据集,并将所述预处理数据集划分为训练集和预测集;
基于所述训练集训练初始预测模型,得到训练好的负荷预测模型,所述训练好的负荷预测模型包括轻量级梯度提升树LightGBM模型和自回归移动平均ARMA模型;
基于所述训练好的负荷预测模型对所述预测集进行预测,得到所述待预测时间的预测负荷数据。
可选地,所述初始预测模型包括初始LightGBM模型,所述LightGBM模型通过如下步骤训练:
以所述训练集中待预测时间的节假日特征、季节性因素特征和数值天气作为所述初始LightGBM模型的输入,并以所述待预测时间的预测负荷数据作为所述初始LightGBM模型的输出,对所述初始LightGBM模型进行训练,训练结束得到所述LightGBM模型。
可选地,所述初始预测模型包括初始ARMA模型,所述ARMA模型通过如下步骤训练:
以所述训练集中的历史负荷数据作为所述初始ARMA模型的输入,并以所述待预测时间的预测负荷数据作为所述初始ARMA模型的输出,对所述初始ARMA模型进行训练,训练结束得到所述ARMA模型。
可选地,所述基于所述训练好的负荷预测模型对所述预测集进行预测,得到所述待预测时间的预测负荷数据,包括:
分别利用所述LightGBM模型和所述ARMA模型对所述预测集进行预测,得到所述LightGBM模型对应的预测结果和所述ARMA模型对应的预测结果;
对所述LightGBM模型对应的预测结果和所述ARMA模型对应的预测结果进行加权平均,得到所述预测负荷数据。
可选地,所述方法还包括:
获取所述待预测时间的实际负荷数据;
基于所述预测负荷数据和所述实际负荷数据,确定所述负荷预测模型的误差数据;所述误差数据为所述待预测时间中的任一时刻的负荷预测偏差率、日负荷的预测偏差率均方根、日平均负荷的预测准确率和月平均日负荷的预测准确率。
可选地,通过如下公式计算所述误差数据:
Ad=(1-RMSE)×100%
其中,Ei为所述待预测时间中第i时刻的负荷预测偏差率,Li,f为所述第i时刻的预测负荷数据,Li为所述第i时刻的实际负荷数据,RMSE为所述日负荷的预测偏差率均方根,n为待预测时间中时刻的总数量,Ad为所述日平均负荷的预测准确率,Am为月平均日负荷的预测准确率,Ad,r为第r天的日平均负荷的预测准确率,k为用于评估月平均日负荷的预测准确率的总天数。
可选地,所述对所述数据集进行预处理得到预处理数据集,包括:
基于所述数据集中任一时间段所包括的多个不同时刻分别对应的数据,确定所述任一时间段的数据的缺失率;
当所述任一时间段的数据的缺失率小于缺失率阈值,对所述任一时间段的数据进行填充,得到第一数据集;
当所述任一时间段的数据的缺失率大于缺失率阈值,从所述数据集中删除所述任一时间段的数据,得到第一数据集;
对所述第一数据集进行清洗和去重得到第二数据集;
对所述第二数据集进行异常值处理,得到所述预处理数据集。
第二方面,本申请实施例提供了一种负荷预测装置,包括:
获取模块,用于获取数据集,所述数据集包括电力系统的历史负荷数据,以及待预测时间的节假日特征、季节性因素特征和数值天气;
处理模块,用于对所述数据集进行预处理得到预处理数据集,并将所述预处理数据集划分为训练集和预测集;
训练模块,用于基于所述训练集训练初始预测模型,得到训练好的负荷预测模型,所述训练好的负荷预测模型包括轻量级梯度提升树LightGBM模型和自回归移动平均ARMA模型;
预测模块,用于基于所述训练好的负荷预测模型对所述预测集进行预测,得到所述待预测时间的预测负荷数据。
第三方面,本申请实施例提供了一种电子设备,所述设备包括:处理器、存储器、系统总线;
所述处理器以及所述存储器通过所述系统总线相连;
所述存储器用于存储程序,所述程序包括指令,所述指令当被所述处理器执行时使所述处理器执行上述负荷预测方法的任一实现方式。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在电子设备上运行时,使得所述电子设备执行上述负荷预测方法的任一实现方式。
从以上技术方案可以看出,本申请实施例具有以下优点:
在本申请实施例中,获取包括电力系统的历史负荷数据,以及待预测时间的节假日特征、季节性因素特征和数值天气的数据集之后,可以对该数据集进行预处理得到预处理数据集,并将预处理数据集划分为训练集和预测集。通过对数据集进行预处理,可以提高数据质量,这样利用预处理数据集划分出的训练集进行模型训练,有助于得到精度较高的负荷预测模型,从而获取到准确的负荷预测数据。接着,即可基于训练集训练初始预测模型,得到训练好的负荷预测模型,并基于训练好的负荷预测模型对预测集进行预测,得到待预测时间的预测负荷数据。由于上述训练好的负荷预测模型包括LightGBM模型和ARMA模型,因此,通过多模型进行预测,使模型具有多样性,可以进一步提高预测的准确性。如此一来,借助训练好的负荷预测模型可以准确、快速地预测出待预测时间的预测负荷数据,工作人员便可提前利用预测负荷数据对待预测时间的供电进行规划,不需要采取复杂的管理和运营方式也能够保持电力系统的可靠性和稳定性,有助于避免电网故障,提高供电效率。
附图说明
图1为本申请实施例提供的一种负荷预测方法的流程图;
图2为本申请实施例提供的一种预测负荷数据的整体获取过程的示意图;
图3为本申请实施例提供的一种负荷预测装置的结构示意图。
具体实施方式
正如前文所述,随着人口的增长和经济的发展,电力负荷的增加给电力系统带来了巨大的挑战,需要十分复杂的管理和运营方式才能使电力系统的供电保持可靠和稳定,否则,过度或不足的供电会导致电网时常发生故障,影响供电效率。
基于此,为了解决上述问题,本申请实施例提供了一种负荷预测方法,可以包括:获取包括电力系统的历史负荷数据,以及待预测时间的节假日特征、季节性因素特征和数值天气的数据集之后,可以对该数据集进行预处理得到预处理数据集,并将预处理数据集划分为训练集和预测集。通过对数据集进行预处理,可以提高数据质量,这样利用预处理数据集划分出的训练集进行模型训练,有助于得到精度较高的负荷预测模型,从而获取到准确的负荷预测数据。接着,即可基于训练集训练初始预测模型,得到训练好的负荷预测模型,并基于训练好的负荷预测模型对预测集进行预测,得到待预测时间的预测负荷数据。由于上述训练好的负荷预测模型包括LightGBM模型和ARMA模型,因此,通过多模型进行预测,使模型具有多样性,可以进一步提高预测的准确性。如此一来,借助训练好的负荷预测模型可以准确、快速地预测出待预测时间的预测负荷数据,工作人员便可提前利用预测负荷数据对待预测时间的供电进行规划,不需要采取复杂的管理和运营方式也能够保持电力系统的可靠性和稳定性,有助于避免电网故障,提高供电效率。
需要说明的是,本申请实施例亦可不限定该负荷预测方法的执行主体,例如,本申请实施例的负荷预测方法可以应用于终端设备或服务器等负荷预测设备。其中,终端设备可以为智能手机、计算机、个人数字助理(Personal Digital Assistant,PDA)、平板电脑等电子设备。服务器可以为独立服务器、集群服务器或云服务器。
为了使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
图1为本申请实施例提供的一种负荷预测方法的流程图。结合图1所示,本申请实施例提供的负荷预测方法,可以包括:
S101:获取数据集。
其中,数据集可以包括电力系统的历史负荷数据,以及待预测时间的节假日特征、季节性因素特征和数值天气。在实际应用中,为了对电力系统每日的供电情况进行预测,待预测时间的区间可以设置为24小时,即,以过去的每一天作为一个待预测时间。进一步地,上述节假日特征可以表示出待预测时间是否为节假日,季节性因素特征可以表示出待预测时间所处的季节。另外,由于夏季和冬季常开空调会使供电上升,因此,季节性因素特征还可表示出待预测时间是否处于空调常开时段。本申请实施例中对于历史负荷数据的取值区间可不具体限定,例如是获取过去30天、60天或90天的历史负荷数据。另外,实际应用中,由于每天的天气数据和负荷数据会随着不同时刻发生变化,因此,可以先将每个时间段划分为多个时刻,例如,按小时划分时刻得到12个时刻,或者,按每15分钟划分时刻得到96个时刻。而后,再获取多个时刻分别对应的天气数据和负荷数据。也就是说,历史负荷数据可以包括过去每一天所划分出的多个时刻分别对应的负荷数据,数值天气可以包括待预测时间所划分出的多个时刻分别对应的数值天气。其中,数值天气可以包括温度、湿度和天气代码(例如,代码00表示晴天,代码01表示雨天,代码02表示雷雨天,以及代码03表示雪天等)等多种信息。
此外,在本申请实施例中,对于数值天气的获取方式可不具体限定。作为一种示例,本申请实施例的执行主体,如服务器,可以预先通过天气预报服务器获取上述数值天气并保存在本地,当需要进行负荷预测时,服务器可以通过本地读取的方式获取数值天气。作为另一种示例,服务器可以在进行负荷预测时,从天气预报服务器中爬取上述数值天气。
S102:对数据集进行预处理得到预处理数据集,并将预处理数据集划分为训练集和预测集。
在本申请实施例中,在进行模型训练之前,通过对数据集进行预处理,可以提高数据质量。如此,采用质量较高的数据作为样本来训练模型,有助于提高模型预测的准确性,从而得到准确的负荷预测数据。具体来说,对数据集进行预处理得到预处理数据集的过程,也就是步骤S102,可以包括步骤21-步骤25:
步骤21:基于数据集中任一时间段所包括的多个不同时刻分别对应的数据,确定任一时间段的数据的缺失率。
以上述实施例中将每个时间段按每15分钟划分时刻得到96个时刻为例,若数据集中某一时间段的数据无缺失,则其应包括96个时刻分别对应的数据。因此,在实际应用中,任一时间段的数据的缺失率,可以通过任一时间段实际包括的数据所对应的时刻数量与上述96个时刻计算得到。
步骤22:当任一时间段的数据的缺失率小于缺失率阈值,对任一时间段的数据进行填充,得到第一数据集。
步骤23:当任一时间段的数据的缺失率大于缺失率阈值,从数据集中删除任一时间段的数据,得到第一数据集。
在实际应用中,上述缺失率阈值可以为10%。仍以上述实施例中将每个时间段按每15分钟划分时刻得到96个时刻为例,当任一时间段的数据的缺失率小于10%时,可以说明该时间段缺失了少于10个时刻所对应的数据,因此该时间段对应的数据缺失较少,可以对该部分数据进行填充以得到完整数据。当任一时间段的数据的缺失率大于10%时,可以说明该时间段缺失了多于10个时刻所对应的数据,因此该时间段对应的数据缺失较多,可以直接不采用该时间段对应的数据。
步骤24:对第一数据集进行清洗和去重得到第二数据集。
针对数据的清洗和去重的过程,本申请实施例并不限定,可以采用现有的或者未来可能出现的任一种能够实现数据清洗和去重的方法来实施。
步骤25:对第二数据集进行异常值处理,得到预处理数据集。
在本申请实施例中,对第二数据集进行异常值处理,是指对第二数据集中的异常数据进行水平处理和垂直处理。
作为一种示例,水平处理的过程可以包括:将待处理的负荷数据前后两个时刻对应的负荷数据作为该待处理的负荷数据的变动范围。当待处理的负荷数据超出这一范围,则可以说明待处理的负荷数据为异常数据。接着,可以进一步采用上述两个时刻对应的负荷数据的平均值来修正待处理的负荷数据,得到平稳变化的数据。
作为另一种示例,考虑到不同时间段内的相同时刻的数据应具有相似性的情况,例如,日期1和日期2的同一时刻的负荷数据应保持在一定范围内。基于此,垂直处理的过程可以体现为:将不同时间段内同一时刻的负荷数据所在的范围作为待处理的负荷数据的变动范围。当待处理的负荷数据超出这一范围,则可以说明待处理的负荷数据为异常数据。接着,可以进一步采用上述不同时间段内同一时刻的负荷数据的平均值来修正待处理的负荷数据,得到平稳变化的数据。
S103:基于训练集训练初始预测模型,得到训练好的负荷预测模型。
其中,训练好的负荷预测模型包括轻量级梯度提升树(Light Gradient BoostingMachine,LightGBM)模型和自回归移动平均(Auto-Regressive Moving Average,ARMA)模型。如此,通过多模型预测的方式使模型具有多样性,从而可以提高预测的准确性。为了便于理解,下面结合一种可能的实施方式对上述两种模型的训练过程进行示例性说明。
作为一种可能的实施方式,初始预测模型包括初始LightGBM模型。针对该初始LightGBM模型,可以通过如下步骤训练:以训练集中待预测时间的节假日特征、季节性因素特征和数值天气作为初始LightGBM模型的输入,并以待预测时间的预测负荷数据作为初始LightGBM模型的输出,对初始LightGBM模型进行训练,训练结束得到LightGBM模型。
作为另一种可能的实施方式,初始预测模型包括初始ARMA模型。针对该初始ARMA模型,可以通过如下步骤训练:以训练集中的历史负荷数据作为初始ARMA模型的输入,并以待预测时间的预测负荷数据作为初始ARMA模型的输出,对初始ARMA模型进行训练,训练结束得到ARMA模型。
S104:基于训练好的负荷预测模型对预测集进行预测,得到待预测时间的预测负荷数据。
前面提到,训练好的负荷预测模型包括轻量级梯度提升树(Light GradientBoosting Machine,LightGBM)模型和自回归移动平均(Auto-Regressive MovingAverage,ARMA)模型。基于此,为了便于理解,下面结合一种可能的实施方式对预测负荷数据的获取过程进行示例性说明。
作为一种可能的实施方式,预测负荷数据的获取过程,也就是步骤S104,可以包括:分别利用LightGBM模型和ARMA模型对预测集进行预测,得到LightGBM模型对应的预测结果和ARMA模型对应的预测结果;对LightGBM模型对应的预测结果和ARMA模型对应的预测结果进行加权平均,得到预测负荷数据。在实际应用中,由于LightGBM模型和ARMA模型的预测准确性相似,因此,可直接对第一初始预测数据和第二初始预测数据计算算数平均值,得到上述预测负荷数据。
进一步地,为了提高负荷预测模型的准确性,还可以进一步计算预测负荷和实际负荷之间的误差,以便后续结合误差调整负荷预测数据,或者,使工作人员借助误差适应性地调整供电计划,从而进一步提高供电效率。基于此,在本申请实施例中,该负荷预测方法还可以包括步骤31-步骤32:
步骤31:获取待预测时间的实际负荷数据。
步骤32:基于预测负荷数据和实际负荷数据,确定负荷预测模型的误差数据。
其中,误差数据可以体现为待预测时间中的任一时刻的负荷的预测偏差率、日负荷的预测偏差率均方根、日平均负荷的预测准确率和月平均日负荷的预测准确率中的至少一个。为了便于理解,下面结合公式分别对上述的四种误差数据进行示例性说明。
结合下式(1)所示,在本申请实施例中,可以基于待预测时间段中的任一时刻的预测负荷数据和实际负荷数据之间的差值,来计算该任一时刻的负荷预测偏差率。
其中,Ei为第i时刻的负荷预测偏差率,Li,f为第i时刻的预测负荷数据源,Li为第i时刻的实际负荷数据。
结合下式(2)所示,在本申请实施例中,可以基于上述待预测时间中的任一时刻的负荷预测偏差率和待预测时间中时刻的总数量,计算日负荷的预测偏差率均方根。
其中,RMSE为日负荷的预测偏差率均方根,Ei为第i时刻的负荷预测偏差率,n为待预测时间中时刻的总数量。
结合下式(3)所示,在本申请实施例中,可以基于日负荷的预测偏差率均方根,计算日平均负荷的预测准确率。
Ad=(1-RMSE)×100% (3)
其中,Ad为日平均负荷的预测准确率,RMSE为日负荷的预测偏差率均方根。
结合下式(4)所示,在本申请实施例中,可以基于日负荷的预测偏差率均方根,以及用于评估月平均日负荷的预测准确率的总天数,计算月平均日负荷的预测准确率。
其中,Am为月平均日负荷的预测准确率,Ad,r为第r天的日平均负荷的预测准确率,k为用于评估月平均日负荷的预测准确率的总天数。
如此一来,基于以上步骤S101-步骤S102的相关内容可知,在本申请实施例中,获取包括电力系统的历史负荷数据,以及待预测时间的节假日特征、季节性因素特征和数值天气的数据集之后,可以对该数据集进行预处理得到预处理数据集,并将预处理数据集划分为训练集和预测集。通过对数据集进行预处理,可以提高数据质量,这样利用预处理数据集划分出的训练集进行模型训练,有助于得到精度较高的负荷预测模型,从而获取到准确的负荷预测数据。接着,即可基于训练集训练初始预测模型,得到训练好的负荷预测模型,并基于训练好的负荷预测模型对预测集进行预测,得到待预测时间的预测负荷数据。由于上述训练好的负荷预测模型包括LightGBM模型和ARMA模型,因此,通过多模型进行预测,使模型具有多样性,可以进一步提高预测的准确性。如此一来,借助训练好的负荷预测模型可以准确、快速地预测出待预测时间的预测负荷数据,工作人员便可提前利用预测负荷数据对待预测时间的供电进行规划,不需要采取复杂的管理和运营方式也能够保持电力系统的可靠性和稳定性,有助于避免电网故障,提高供电效率。
此外,在本申请实施例中,为了便于理解预测负荷数据的整体获取过程,下面可以结合附图进行说明。
图2为本申请实施例提供的一种预测负荷数据的整体获取过程的示意图。结合图2所示,本申请实施例提供的预测负荷数据的整体获取过程,可以包括:首先获取数据集,然后,数据集进行预处理并进行切分,得到训练集和预测集。接着,构建LightGBM模型。利用训练集中的节假日特征、季节性因素特征和数值天气训练该LightGBM模型并进行校验,校验通过得到训练好的LightGBM模型。同时,对训练集中的历史负荷数据进行平滑处理,并进一步判断处理后的数据是否平滑且非白噪声。若是,则可基于历史负荷数据进行模型定阶,得到训练好的ARMA模型。接着,分别将预测集的数据输入训练好的LightGBM模型和训练好的ARMA模型,得到训练好的LightGBM模型对应的预测结果A和训练好的ARMA模型对应的预测结果B。通过对预测结果A和预测结果B进行加权平均,即可得到最终预测结果,也就是预测复合数据。
进一步地,基于上述实施例提供的负荷预测方法,本申请实施例还可以提供一种负荷预测装置。下面分别结合实施例和附图,对该负荷预测装置进行描述。
图3为本申请实施例提供的一种负荷预测装置的结构示意图。结合图3所示,本申请实施例提供的负荷预测装置300,包括:
获取模块301,用于获取数据集,所述数据集包括电力系统的历史负荷数据,以及待预测时间的节假日特征、季节性因素特征和数值天气;
处理模块302,用于对所述数据集进行预处理得到预处理数据集,并将所述预处理数据集划分为训练集和预测集;
训练模块303,用于基于所述训练集训练初始预测模型,得到训练好的负荷预测模型,所述训练好的负荷预测模型包括轻量级梯度提升树LightGBM模型和自回归移动平均ARMA模型;
预测模块304,用于基于所述训练好的负荷预测模型对所述预测集进行预测,得到所述待预测时间的预测负荷数据。
作为一种实施方式,所述初始预测模型包括初始LightGBM模型,所述LightGBM模型通过如下模块训练:
第一训练模块,用于以所述训练集中待预测时间的节假日特征、季节性因素特征和数值天气作为所述初始LightGBM模型的输入,并以所述待预测时间的预测负荷数据作为所述初始LightGBM模型的输出,对所述初始LightGBM模型进行训练,训练结束得到所述LightGBM模型。
作为一种实施方式,所述初始预测模型包括初始ARMA模型,所述ARMA模型通过如下模块训练:
第二训练模块,用于以所述训练集中的历史负荷数据作为所述初始ARMA模型的输入,并以所述待预测时间的预测负荷数据作为所述初始ARMA模型的输出,对所述初始ARMA模型进行训练,训练结束得到所述ARMA模型。
作为一种实施方式,所述预测模块304,包括:
预测子模块,用于分别利用所述LightGBM模型和所述ARMA模型对所述预测集进行预测,得到所述LightGBM模型对应的预测结果和所述ARMA模型对应的预测结果;
加权平均模块,用于对所述LightGBM模型对应的预测结果和所述ARMA模型对应的预测结果进行加权平均,得到所述预测负荷数据。
作为一种实施方式,所述负荷预测装置300还包括:
获取子模块,用于获取所述待预测时间的实际负荷数据;
误差确定模块,用于基于所述预测负荷数据和所述实际负荷数据,确定所述负荷预测模型的误差数据;所述误差数据为所述待预测时间中的任一时刻的负荷预测偏差率、日负荷的预测偏差率均方根、日平均负荷的预测准确率和月平均日负荷的预测准确率。
作为一种实施方式,通过如下公式计算所述误差数据:
Ad=(1-RMSE)×100%
其中,Ei为所述待预测时间中第i时刻的负荷预测偏差率,Li,f为所述第i时刻的预测负荷数据,Li为所述第i时刻的实际负荷数据,RMSE为所述日负荷的预测偏差率均方根,n为待预测时间中时刻的总数量,Ad为所述日平均负荷的预测准确率,Am为月平均日负荷的预测准确率,Ad,r为第r天的日平均负荷的预测准确率,k为用于评估月平均日负荷的预测准确率的总天数。
作为一种实施方式,所述处理模块302,包括:
缺失率确定模块,用于基于所述数据集中任一时间段所包括的多个不同时刻分别对应的数据,确定所述任一时间段的数据的缺失率;
填充模块,用于当所述任一时间段的数据的缺失率小于缺失率阈值,对所述任一时间段的数据进行填充,得到第一数据集;
删除模块,用于当所述任一时间段的数据的缺失率大于缺失率阈值,从所述数据集中删除所述任一时间段的数据,得到第一数据集;
清洗去重模块,用于对所述第一数据集进行清洗和去重得到第二数据集,所述第二数据集包括第一时间段对应的数据;
异常值处理模块,用于对所述第二数据集进行异常值处理,得到所述预处理数据集。
进一步地,本申请实施例还提供了一种电子设备,包括:处理器、存储器、系统总线;
所述处理器以及所述存储器通过所述系统总线相连;
所述存储器用于存储一个或多个程序,所述一个或多个程序包括指令,所述指令当被所述处理器执行时使所述处理器执行上述负荷预测方法的任一实现方式。
进一步地,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在电子设备上运行时,使得所述终端设备执行上述负荷预测方法的任一实现方式。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到上述实施例方法中的全部或部分步骤可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者诸如媒体网关等网络通信设备,等等)执行本申请各个实施例或者实施例的某些部分所述的方法。需要说明的是,本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。
对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种负荷预测方法,其特征在于,包括:
获取数据集,所述数据集包括电力系统的历史负荷数据,以及待预测时间的节假日特征、季节性因素特征和数值天气;
对所述数据集进行预处理得到预处理数据集,并将所述预处理数据集划分为训练集和预测集;
基于所述训练集训练初始预测模型,得到训练好的负荷预测模型,所述训练好的负荷预测模型包括轻量级梯度提升树LightGBM模型和自回归移动平均ARMA模型;
基于所述训练好的负荷预测模型对所述预测集进行预测,得到所述待预测时间的预测负荷数据。
2.根据权利要求1所述的负荷预测方法,其特征在于,所述初始预测模型包括初始LightGBM模型,所述LightGBM模型通过如下步骤训练:
以所述训练集中待预测时间的节假日特征、季节性因素特征和数值天气作为所述初始LightGBM模型的输入,并以所述待预测时间的预测负荷数据作为所述初始LightGBM模型的输出,对所述初始LightGBM模型进行训练,训练结束得到所述LightGBM模型。
3.根据权利要求1所述的负荷预测方法,其特征在于,所述初始预测模型包括初始ARMA模型,所述ARMA模型通过如下步骤训练:
以所述训练集中的历史负荷数据作为所述初始ARMA模型的输入,并以所述待预测时间的预测负荷数据作为所述初始ARMA模型的输出,对所述初始ARMA模型进行训练,训练结束得到所述ARMA模型。
4.根据权利要求1所述的负荷预测方法,其特征在于,所述基于所述训练好的负荷预测模型对所述预测集进行预测,得到所述待预测时间的预测负荷数据,包括:
分别利用所述LightGBM模型和所述ARMA模型对所述预测集进行预测,得到所述LightGBM模型对应的预测结果和所述ARMA模型对应的预测结果;
对所述LightGBM模型对应的预测结果和所述ARMA模型对应的预测结果进行加权平均,得到所述预测负荷数据。
5.根据权利要求1至4任一项所述的负荷预测方法,其特征在于,所述方法还包括:
获取所述待预测时间的实际负荷数据;
基于所述预测负荷数据和所述实际负荷数据,确定所述负荷预测模型的误差数据;所述误差数据为所述待预测时间中的任一时刻的负荷预测偏差率、日负荷的预测偏差率均方根、日平均负荷的预测准确率和月平均日负荷的预测准确率。
6.根据权利要求5所述的负荷预测方法,其特征在于,通过如下公式计算所述误差数据:
Ad=(1-RMSE)×100%
其中,Ei为所述待预测时间中第i时刻的负荷预测偏差率,Li,f为所述第i时刻的预测负荷数据,Li为所述第i时刻的实际负荷数据,RMSE为所述日负荷的预测偏差率均方根,n为待预测时间中时刻的总数量,Ad为所述日平均负荷的预测准确率,Am为月平均日负荷的预测准确率,Ad,r为第r天的日平均负荷的预测准确率,k为用于评估月平均日负荷的预测准确率的总天数。
7.根据权利要求1至4任一项所述的负荷预测方法,其特征在于,所述对所述数据集进行预处理得到预处理数据集,包括:
基于所述数据集中任一时间段所包括的多个不同时刻分别对应的数据,确定所述任一时间段的数据的缺失率;
当所述任一时间段的数据的缺失率小于缺失率阈值,对所述任一时间段的数据进行填充,得到第一数据集;
当所述任一时间段的数据的缺失率大于缺失率阈值,从所述数据集中删除所述任一时间段的数据,得到第一数据集;
对所述第一数据集进行清洗和去重得到第二数据集;
对所述第二数据集进行异常值处理,得到所述预处理数据集。
8.一种负荷预测装置,其特征在于,包括:
获取模块,用于获取数据集,所述数据集包括电力系统的历史负荷数据,以及待预测时间的节假日特征、季节性因素特征和数值天气;
处理模块,用于对所述数据集进行预处理得到预处理数据集,并将所述预处理数据集划分为训练集和预测集;
训练模块,用于基于所述训练集训练初始预测模型,得到训练好的负荷预测模型,所述训练好的负荷预测模型包括轻量级梯度提升树LightGBM模型和自回归移动平均ARMA模型;
预测模块,用于基于所述训练好的负荷预测模型对所述预测集进行预测,得到所述待预测时间的预测负荷数据。
9.一种电子设备,其特征在于,所述设备包括:处理器、存储器、系统总线;
所述处理器以及所述存储器通过所述系统总线相连;
所述存储器用于存储程序,所述程序包括指令,所述指令当被所述处理器执行时使所述处理器执行权利要求1至6任一项所述的负荷预测方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有指令,当所述指令在电子设备上运行时,使得所述电子设备执行权利要求1至6任一项所述的负荷预测方法。
CN202410242068.4A 2024-03-04 2024-03-04 一种负荷预测方法、装置、设备及存储介质 Pending CN117993570A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410242068.4A CN117993570A (zh) 2024-03-04 2024-03-04 一种负荷预测方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410242068.4A CN117993570A (zh) 2024-03-04 2024-03-04 一种负荷预测方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN117993570A true CN117993570A (zh) 2024-05-07

Family

ID=90893088

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410242068.4A Pending CN117993570A (zh) 2024-03-04 2024-03-04 一种负荷预测方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN117993570A (zh)

Similar Documents

Publication Publication Date Title
CN110969285B (zh) 预测模型训练方法、预测方法、装置、设备及介质
CN111210093B (zh) 基于大数据的日用水量预测方法
CN111680841B (zh) 基于主成分分析的短期负荷预测方法、系统及终端设备
CN112215442B (zh) 电力系统短期负荷预测方法、系统、设备及介质
CN111932402A (zh) 一种基于相似日和lstm的短期电力负荷双向组合预测方法
CN108898248B (zh) 电力负荷影响因素量化分析方法、装置、设备及介质
CN110555578A (zh) 一种销量预测方法和装置
CN116663746A (zh) 一种电力负荷预测方法、装置、计算机设备及存储介质
CN114330934A (zh) 一种模型参数自适应的gru新能源短期发电功率预测方法
CN116757465A (zh) 一种基于双训练权重分配模型的线路风险评估方法及装置
CN117407681B (zh) 一种基于向量聚类的时序数据预测模型建立方法
CN114692981A (zh) 基于Seq2Seq模型的中长期径流预报方法和系统
CN117973953A (zh) 居民温控负荷的需求响应潜力预测模型的构建方法和装置
CN118132948A (zh) 一种电力电量预测方法
CN116562398B (zh) 电力负荷预测模型训练方法、预测方法、电子设备和介质
CN112598181A (zh) 负荷预测方法、装置、设备和存储介质
CN112330017A (zh) 电力负荷预测方法、装置、电子设备和存储介质
CN117374917A (zh) 一种超短期电力负荷的多元回归预测方法及装置
CN116523540A (zh) 基于自适应lgbm的超短期电价预测方法
CN117993570A (zh) 一种负荷预测方法、装置、设备及存储介质
CN113780644A (zh) 一种基于在线学习的光伏出力预测方法
CN112614006A (zh) 负荷预测方法、装置、计算机可读存储介质以及处理器
CN111899123A (zh) 电量预测方法、装置以及计算机可读存储介质
JPH11126102A (ja) ガス需要量の予測方法
CN116011698B (zh) 机组组合确定方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination