CN117236800B - 一种多场景自适应的用电负荷预测方法及系统 - Google Patents
一种多场景自适应的用电负荷预测方法及系统 Download PDFInfo
- Publication number
- CN117236800B CN117236800B CN202311508730.8A CN202311508730A CN117236800B CN 117236800 B CN117236800 B CN 117236800B CN 202311508730 A CN202311508730 A CN 202311508730A CN 117236800 B CN117236800 B CN 117236800B
- Authority
- CN
- China
- Prior art keywords
- prediction
- load
- feature
- scene
- adaptive
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005611 electricity Effects 0.000 title claims abstract description 43
- 238000000034 method Methods 0.000 title claims abstract description 43
- 238000012795 verification Methods 0.000 claims abstract description 25
- 238000012549 training Methods 0.000 claims abstract description 11
- 238000010276 construction Methods 0.000 claims abstract description 8
- 238000012545 processing Methods 0.000 claims description 17
- 230000002159 abnormal effect Effects 0.000 claims description 12
- 230000003044 adaptive effect Effects 0.000 claims description 9
- 238000007781 pre-processing Methods 0.000 claims description 8
- 238000010200 validation analysis Methods 0.000 claims description 5
- 238000012935 Averaging Methods 0.000 claims description 2
- 238000012790 confirmation Methods 0.000 claims description 2
- 239000002245 particle Substances 0.000 claims description 2
- 238000010801 machine learning Methods 0.000 description 6
- 238000009795 derivation Methods 0.000 description 5
- 230000001617 migratory effect Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 101001095088 Homo sapiens Melanoma antigen preferentially expressed in tumors Proteins 0.000 description 3
- 102100037020 Melanoma antigen preferentially expressed in tumors Human genes 0.000 description 3
- 238000012800 visualization Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000001932 seasonal effect Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000005057 refrigeration Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种多场景自适应的用电负荷预测方法及系统,该方法包括以下步骤:获取历史用电数据并确认预测场景;根据所述预测场景对所述历史用电数据进行特征构造,生成入模候选特征;将所述入模候选特征输入XGBoost模型,通过所述XGBoost模型进行自适应调参,得到预测结果;所述自适应调参包括根据所述入模候选特征生成最优特征组、确认训练样本和最优验证集并进行训练,最后通过贝叶斯调参得到最优模型参数;本发明能够根据不同的预测场景自适应调参,实现用电负荷预测,不仅学习到各种特定场景的特征,提高预测精确度,还通过自适应调参,减少人工干预,进而降低了技术门槛。
Description
技术领域
本发明涉及用电负荷预测技术领域,更具体的说是涉及一种多场景自适应的用电负荷预测方法及系统。
背景技术
负荷预测是保证电力供需平衡的基础,并为电网、电源的规划建设以及电网企业、电网使用者的经营决策提供信息和依据。居民用电负荷具有明显的年增长和季节波动特点,其季节性变化在很多情况下直接影响系统峰荷的变化。制冷和取暖设备使用量也迅速增加,使得电力负荷尤其是居民用电负荷受气象因素间的影响进一步增大。
时间序列预测是根据过去一段时间的历史数据来预测未来某段时间内的数值的变化趋势及总量,广泛应用于金融领域、生产制造、交通运输、医疗保健、电力行业等众多领域,具体的任务包括股票价格、天气预报、交通流量、销量预测、负荷预测等方面。
目前,对于时间序列预测任务,由于机器学习和深度学习方法在精准度和计算效率方面均表现突出,近年来已经成为用电负荷预测的热门方法,其中由于机器学习具备良好的可解释性,因此在电力预测方面应用广泛。
但是,由于机器学习建模过程中伴随着大量特征工程构建及人工调参等工作,并且需要熟悉业务并且具备专业能力的人员来开展,这为机器学习在负荷预测方面的应用设置了一定的技术门槛。
因此,如何提高负荷预测的准确度以及降低机器学习在负荷预测任务中的技术门槛是本领域技术人员亟需解决的问题。
发明内容
有鉴于此,本发明提供了一种多场景自适应的用电负荷预测方法及系统,能够根据不同的预测场景自适应调参,实现用电负荷预测,不仅学习到各种特定场景的特征,提高预测精确度,还通过自适应调参,减少人工干预,进而降低了技术门槛。
为了实现上述目的,本发明采用如下技术方案:
一种多场景自适应的用电负荷预测方法,包括以下步骤:
获取历史用电数据并确认预测场景;
根据所述预测场景对所述历史用电数据进行特征构造,生成入模候选特征;
将所述入模候选特征输入XGBoost模型,通过所述XGBoost模型进行自适应调参,得到预测结果;所述自适应调参包括根据所述入模候选特征生成最优特征组、确认训练样本和最优验证集并进行训练,最后通过贝叶斯调参得到最优模型参数。
进一步的,在对所述历史用电数据进行特征构造前,进行数据预处理,所述数据预处理包括:
提取基本特征,并对所述基本特征的缺失值和异常值进行处理,得到用电负荷序列相关字段。
进一步的,所述提取基本特征,包括:
提取最大负荷、最小负荷和平均负荷,得到负荷特征;
提取最高温、最低温和平均温度,得到温度特征;
提取常驻人口、迁入人口、迁出人口和净迁入人口,得到人口特征。
进一步的,对所述基本特征的缺失值和异常值进行处理,包括:
缺失值处理:分别获取缺失值位置的前后位置特征值,计算平均值进行填充;
异常值处理:根据预设值提取特定位置的特征值,并进行异常识别;针对异常值,采用平均数、中位数、模型拟合值进行修正或视为缺失值,进行填充处理。
进一步的,步骤还包括:获取预测目标和/或预测粒度,所述预测目标为最大负荷、最小负荷和平均负荷中的一种或多种;所述预测粒度为天、小时或分钟。
进一步的,对所述历史用电数据进行特征构造,步骤包括:
根据预设值在所述历史用电数据中提取预测场景下的关联数据作为初级候选特征;所述关联数据包括温度特征和人口特征;
通过时序对所述初级候选特征进行衍生,得到所述入模候选特征。
进一步的,对所述初级候选特征进行衍生,包括:
将所述温度特征和所述人口特征与日期进行关联,得到交叉特征。
进一步的,所述根据所述入模候选特征生成最优特征组,步骤包括:
使用XGBoost模型对所述入模候选特征进行特征决策;
对XGBoost模型中各个提升树下的结果进行加权求和后然后平均,得到该特征重要性得分;
根据所述重要性得分结合预设的阈值,输出满足阈值需求的最优特征组。
进一步的,所述根据所述重要性得分结合预设的阈值,输出满足阈值需求的最优特征组,具体为:
根据所述重要性得分对特征进行排序,得到高可用特征组;
通过对所述XGBoost模型进行多次调参,对应生成对应的多组所述高可用特征组;
采用预先确认的验证集对各个所述高可用特征组分别进行验证,得到所述最优特征组。
进一步的,所述最优验证集为前向n步验证、同期n步验证或根据相似温度选择的验证集。
一种多场景自适应的用电负荷预测系统,该采用了上述的用电负荷预测方法,包括:
数据处理模块,用于获取历史用电数据,并进行预处理;
场景确认模块,用于对预测场景、预测目标和预测粒度进行选择;
自适应预测模块,用于构造特征并进行自动化建模预测。
经由上述的技术方案可知,与现有技术相比,本发明公开提供了一种多场景自适应的用电负荷预测方法及系统,能够根据不同的预测场景自适应调参,实现用电负荷预测,不仅学习到各种特定场景的特征,提高预测精确度,还通过自适应调参,减少人工干预,进而降低了技术门槛。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1是根据本发明实施例提供的一种多场景自适应的用电负荷预测方法流程示意图;
图2是本发明实施例提供的一种多场景自适应的用电负荷预测系统结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
本发明实施例公开了一种多场景自适应的用电负荷方法,包括以下步骤:
S1:获取历史用电数据并确认预测场景。具体的,历史用电数据包括用电负荷数据集和相关联的其他数据集,如天气数据集和人口数据集。
此外,在一种实施里中,还需要确认预测目标和预测粒度。预测目标通常为最大负荷、最小负荷、平均负荷中的其一。预测场景包括节日场景,如春节、五一、十一,还可以为日常场景,即不包括特定节日的其他时段。预测粒度是指预测最小时间单位,一般为天、小时、分钟。
S2:对历史用电数据进行预处理。具体步骤包括:
S21:提取基本特征,并对基本特征的缺失值和异常值进行处理,得到用电负荷序列相关字段;其中,基本特征包括负荷特征、温度特征和人口特征;负荷特征包括最大负荷、最小负荷和平均负荷;温度特征包括最高温度、最低温度和平均温度;人口特征包括常驻人口、迁入人口、迁出人口和净迁人口。
S22:缺失值处理:分别检查原始负荷数据集、温度天气数据集、人口数据集关键字段是否存在缺失现象,若存在字段缺失,则使用缺失值位置上下位置值的平均值进行填充;
例如为对最大负荷字段采用上下位置均值进行空值填充:“power_df[“max_power”].fillna(power_df[“max_power”].interpolate(), inplace=True)”。
由于负荷用电数据集中不存在类别型变量,因此这里对该类变量不进行填充操作。
异常值处理:分别检查原始负荷数据集、温度天气数据集、人口数据集中是否存在异常值,检查时可以通过查看每一个变量的常见数值型统计描述,这些统计值包括:变量元素个数(count),变量的平均值(mean),变量标准差(std),变量元素最大值(max),变量元素最小值(min)及变量25%、60%、70%三个不同百分位置的数值,即统计学中的四分位数,其中50%对应的是中位数,并结合可视化工具进行异常值的判断分析;通过分析识别出异常值后,可以通过对异常值进行修正,具体的操作包括使用平均数、中位数、模型拟合或视为缺失值等,由于本发明中使用的模型为XGBoost,该模型对异常值不敏感,可以将视为缺失值的异常值单独分为一箱。
在本实施例中,对于异常值的处理操作包括:
首先使用python中的可视化包matplotlib进行可视化,观察每列数值型变量的变化趋势,通过观察的方法对异常时间点进行定位识别,再对该点位视为空值,采用如上空值填充方法进行填充,需要说明的是这种观察法比使用三西格玛方法及分为数法更为可靠合理,可以避免采用公式计算带来的填充操作的系统误差。
S23:将处理后的三类数据集进行合并,构造用电负荷时间序列数据集,得到预处理后的历史用电数据。
S3:根据预测场景对历史用电数据进行特征构造,生成入模候选特征。其中,历史用电数据为预处理后得到的数据。具体步骤包括:
S31:根据预设值在历史用电数据中衍生预测场景下的时序关联特征;通过对负荷特征、温度特征和人口特征进行两两交叉,衍生交叉特征。
具体的,以节日场景举例,假设预测场景和预测目标为春节腊月二十四至正月初七期间的日粒度最大负荷,则需要将S2中的最高温、最低温、平均温度、常驻人口、迁入人口、迁出人口、净迁入人口直接作为入模基础特征。
根据日期衍生出时序关联特征,包括:预测日距离除夕当日的天数(days)、年、月、日、季度、星期几。以及通过两两特征组合得到的交叉特征,包括:季度*最高温、季度*最低温、季度*迁入人口、季度*迁出人口等。需要指出,如果预测场景为其他节日,可以根据具体目标衍生出预测日距离该节日中某个特定日期的天数,如预测五一场景时,可以将五月一日作为特定日期,衍生距离五一当日的天数(days),其他特征保持不变。若预测场景为日常场景,则不需要引入days特征,其他特征保持不变。构造后的特征包括:“年”、“月”、“日”、“星期几”、“是否节假日”、“距离节日天数”等时间衍生特征,“最高温”、“最低温”、“平均温度”的温度相关特征,“迁入人口”、“迁出人口”、“常驻人口”等相关人口特征,以及“季度*最高温”、“季度*最低温”、“季度*迁入人口”、“季度*迁出人口”等交叉衍生特征。
其中时序特征衍生,是指将日期按照年、月、日等不同时间粒度进行的特征衍生过程。本文中首先将日期特征转化为datetime类型,并进行相应的衍生:
通过属性dt.quarter得到季度(“quarte”);通过自定义函数get_season进行衍生,可以按照春季(3、4、5月)、夏季(6,7,8月)、秋季(9,10,11)、冬季(12,1,2月)进行衍生得到季节(“season”);通过属性dt.month获得月份(“month”),如1月、2月至12月;通过属性dt.year获得年份(“year”),如2016,2017,2018等;通过dt.dayofweek获得星期(“day_of_week”),如星期一、星期二至星期日;当年第几天(“day_of_year”),如第1天、第2天至第365天,主要;通过dt.dayofyear获得当年第几周(“week_of_year”),如第1周、第2周至第52周;通过自定义函数get_days获得距离节日天数(“days”),用来计算当前日期距离节日的天数,该特征可以一定程度用来度量节日效应。
交叉特征衍生主要是通过将日期衍生特征和温度特征进行交叉得到新的特征。本文发现最高温(tmp)和季度(season)之间,最高温和月份(month)之间、最高温和星期(week)之间以及距离节日天数(days)与季度和月份之间进行相乘,可以得到包含多维因素的交叉特征,这些新的特征均对模型有一定的提升,示例:通过tmp * month 得到交叉特征”tmp_month”;通过tmp*season得到交叉特征”tmp_season”;通过tmp*week得到交叉特征”tmp_week”;通过days*month得到交叉特征”days_month”;通过days*season得到交叉特征”days_season”。
S4:确定最优特征组,将入模候选特征输入至XGBoost模型,通过XGBoost模型进行自适应调参,得到预测结果。具体步骤包括:
S41:根据所述入模候选特征生成最优特征组。
S411:采用模型的特征选择方法,得到多组高可用特征。
XGBoost模型构建后最终将一个特征在所有提升树中的结果进行加权求和后然后平均,得到该特征重要性得分。在使用XGBoost模型时,一个已训练的XGBoost模型能够自动计算特征重要性,这些重要性得分可以通过使用model.feature_importances_直接输出得到。
S412:对所有特征依次操作,并进行排序;设置一个阈值,用于筛选出满足阈值条件的特征,得到一组高可用特征,如可以设定当重要性得分大于0.15时保留对应特征,小于该值时则对特征进行剔除。
S413:在此基础上,对XGBoost模型相关参数进行修改,并执行S41和S42就可以得到多个高可用特征组。本发明中高可用特征组至少为三组。具体参数修改为:将各默认参数修改为相应的数值,具体为”learning_rate”修改为0.01或0.1,”max_depth”修改为5或7,”n_estimators”修改为500或1000,三个参数分别表示:最大深度、树的个数、学习率。
其中,特征重要性可以使用如下方法进行输出:“model = XGBClassifier();model.feature_importances_”。
可选的,本实施例中使用的算法模型XGBoost为集成模型,可以对特征重要性进行排序,以得到候选特征中高可用特征。
XGBoost是基于Boosted Trees的一种集成方法,即采用加法模型的集成树模型,树由叶子节点数和叶子节点分数表示。
XGBoost的目标函数为:
其中,i表示第i条样本数据,表示第t颗决策树,L是指损失函数,/>和/>分别为二阶泰勒展开后的一阶和二阶系数,Ω为正则化项。正则化展开后,/>为叶子节点向量,T为叶子节点数量。
XGBoost分裂方式可以表示为:
其中,表示分裂节点的选择,/>和/>分别表示节点分裂后左右结点的集合。
上式用即为XGBoost评估待分裂结点的方法,由此得到一颗XGBoost集成树。
S414:多个高可用特征组,通过验证集对多个高可用特征组选择,得到最优的特征组。具体的,在验证集使用MAPE做为评价指标,依次便利高可用特征组,选择验证集MAPE最小的特征组作为最优特征组,在该步中,验证集可默认选择为预测日前n天。
S42:确认训练样本:在得到最优特征组后选择最佳时间对应的训练样本,通过依次递归选择数据集的起始年份,通过遍历各年,在验证集选择并确定数据集的开始时间以便得到最佳的训练开始时间,即训练时间从逐年的1月1日开始。
S43:确定最优验证集:通过三种策略确定最优验证集,即:前向n步验证、同期n步验证和根据相似温度选择的验证集;其中前向n步是指验证集选择待预测日的前n天;同期n步是指对于节假日场景中,如对春节时段进行预测,选择历年农历同期时间作为验证集;根据相似温度选择验证集是指根据待预测时间段的温度,选择历史相似的温度区间的数据作为验证集。在验证集确定最优模型参数后即对目标场景的指定时间范围进行负荷预测。其中,验证集上的模型的预测性能评价,使用平均绝对百分比误差(MAPE)作为评判标准。
其中,表示预测值,/>表示对应的真实值。
S44:最后使用贝叶斯调参确定模型最优参数,并输出预测结果。
实施例2
基于同一发明构思,本发明实施例公开一种多场景自适应的用电负荷预测系统,包括:
数据处理模块,用于获取历史用电数据,并进行预处理;具体用于对负荷用电预测相关数据集中的关键字段进行相应的数据处理操作,构建用电负荷时间序列数据集。
场景选择模块,用于对预测场景、预测目标进行选择。
自适应预测模块,用于构造特征并进行自动化建模预测。该模块包括两个子模块,分别为:自动化特征工程模块、自动化建模预测模块、预测结果输出模块。
自动化特征工程模块,包括:空值处理、基础特征生成、时序特征衍生、交叉特征衍生、特征选择、特征组生成。
自动化建模预测模块,包括:自动选择训练集开始时间、自动选择验证集和自动化调参。
预测结果输出模块,结合自动化特征工程模块和自动化建模预测模块共同产生用电负荷预测的最终预测结果。
本发明实施例所提供的系统,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,系统实施例部分未提及之处,可参考前述方法实施例中相应内容,在此不再赘述。
实施例3
本发明实施例还提供一种存储介质,其上存储有计算设备可读的一个或多个程序,一个或多个程序包括指令,指令当由计算设备执行时,使得计算设备执行实施例1中的一种基于自动化特征工程的用电负荷预测多场景自适应技术。
本发明实施例中,存储介质例如可以是电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备以及上述的任意合适的组合。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例,或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
应当注意的是,词语“包含”不排除存在未列在权利要求中的部件或步骤。位于部件之前的词语“一”或“一个”不排除存在多个这样的部件。本发明可以借助于包括有若干不同部件的硬件以及借助于适当编程的计算机来实现。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
Claims (8)
1.一种多场景自适应的用电负荷预测方法,其特征在于,包括以下步骤:
获取历史用电数据并确认预测场景;
对所述历史用电数据进行数据预处理:提取基本特征,并对所述基本特征的缺失值和异常值进行处理,得到用电负荷序列相关字段,所述提取基本特征,包括:提取最大负荷、最小负荷和平均负荷,得到负荷特征;提取最高温、最低温和平均温度,得到温度特征;提取常驻人口、迁入人口、迁出人口和净迁入人口,得到人口特征;
根据所述预测场景对所述历史用电数据进行特征构造,生成入模候选特征;具体步骤包括:根据预设值在所述历史用电数据中衍生预测场景下的时序关联特征;通过对负荷特征、温度特征和人口特征进行两两交叉,衍生交叉特征;
将所述入模候选特征输入XGBoost模型,通过所述XGBoost模型进行自适应调参,得到预测结果;所述自适应调参包括根据所述入模候选特征生成最优特征组、确认训练样本和最优验证集并进行训练,最后通过贝叶斯调参得到最优模型参数。
2.根据权利要求1所述的一种多场景自适应的用电负荷预测方法,其特征在于,对所述基本特征的缺失值和异常值进行处理,包括:
缺失值处理:分别获取缺失值位置的前后位置特征值,计算平均值进行填充;
异常值处理:根据预设值提取特定位置的特征值,并进行异常识别;针对异常值,采用平均数、中位数、模型拟合值进行修正或视为缺失值,进行填充处理。
3.根据权利要求1所述的一种多场景自适应的用电负荷预测方法,其特征在于,步骤还包括:获取预测目标和/或预测粒度,所述预测目标为最大负荷、最小负荷和平均负荷中的一种或多种;所述预测粒度为天、小时或分钟。
4.根据权利要求1所述的一种多场景自适应的用电负荷预测方法,其特征在于,对所述历史用电数据进行特征构造,步骤包括:
根据预设值在所述历史用电数据中衍生预测场景下的时序关联特征;
通过对负荷特征、温度特征和人口特征进行两两交叉,衍生交叉特征。
5.根据权利要求1所述的一种多场景自适应的用电负荷预测方法,其特征在于,所述根据所述入模候选特征生成最优特征组,步骤包括:
使用XGBoost模型对所述入模候选特征进行特征决策;
对XGBoost模型中各个提升树下的结果进行加权求和后然后平均,得到所述入模候选特征的重要性得分;
根据所述重要性得分结合预设的阈值,输出满足阈值需求的最优特征组。
6.根据权利要求5所述的一种多场景自适应的用电负荷预测方法,其特征在于,所述根据所述重要性得分结合预设的阈值,输出满足阈值需求的最优特征组,具体为:
根据所述重要性得分对特征进行排序,得到高可用特征组;
通过对所述XGBoost模型进行多次调参,对应生成对应的多组所述高可用特征组;
采用预先确认的验证集对各个所述高可用特征组分别进行验证,得到所述最优特征组。
7.根据权利要求1所述的一种多场景自适应的用电负荷预测方法,其特征在于,所述最优验证集为前向n步验证、同期n步验证或根据相似温度选择的验证集。
8.一种多场景自适应的用电负荷预测系统,其特征在于,采用了权利要求1-7任一项所述的用电负荷预测方法,包括:
数据处理模块,用于获取历史用电数据,并进行预处理;
场景确认模块,用于对预测场景、预测目标和预测粒度进行选择;
自适应预测模块,用于构造特征并进行自动化建模预测。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311508730.8A CN117236800B (zh) | 2023-11-14 | 2023-11-14 | 一种多场景自适应的用电负荷预测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311508730.8A CN117236800B (zh) | 2023-11-14 | 2023-11-14 | 一种多场景自适应的用电负荷预测方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117236800A CN117236800A (zh) | 2023-12-15 |
CN117236800B true CN117236800B (zh) | 2024-02-20 |
Family
ID=89084634
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311508730.8A Active CN117236800B (zh) | 2023-11-14 | 2023-11-14 | 一种多场景自适应的用电负荷预测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117236800B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117710008B (zh) * | 2024-02-06 | 2024-04-30 | 贵州师范大学 | 一种适用于喀斯特地区生态产品销售信息管理系统 |
CN118396244B (zh) * | 2024-06-27 | 2024-09-24 | 山东聚源热力有限责任公司 | 基于数字孪生的供热负荷数据预测方法及系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111340273A (zh) * | 2020-02-17 | 2020-06-26 | 南京邮电大学 | 一种基于GEP参数优化XGBoost的电力系统短期负荷预测方法 |
WO2022077693A1 (zh) * | 2020-10-15 | 2022-04-21 | 中国科学院深圳先进技术研究院 | 负荷预测模型的训练方法及训练装置、存储介质、设备 |
CN116596112A (zh) * | 2023-04-10 | 2023-08-15 | 哈博能源科技(苏州)有限公司 | 一种通用冷热电负荷预测方法及系统 |
-
2023
- 2023-11-14 CN CN202311508730.8A patent/CN117236800B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111340273A (zh) * | 2020-02-17 | 2020-06-26 | 南京邮电大学 | 一种基于GEP参数优化XGBoost的电力系统短期负荷预测方法 |
WO2022077693A1 (zh) * | 2020-10-15 | 2022-04-21 | 中国科学院深圳先进技术研究院 | 负荷预测模型的训练方法及训练装置、存储介质、设备 |
CN116596112A (zh) * | 2023-04-10 | 2023-08-15 | 哈博能源科技(苏州)有限公司 | 一种通用冷热电负荷预测方法及系统 |
Non-Patent Citations (1)
Title |
---|
基于改进Bi-LSTM和XGBoost 的电力负荷组合预测方法;代业明 等;上海理工大学学报;第44卷(第2期);正文第138-147页 * |
Also Published As
Publication number | Publication date |
---|---|
CN117236800A (zh) | 2023-12-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN117236800B (zh) | 一种多场景自适应的用电负荷预测方法及系统 | |
Tan et al. | Ultra-short-term industrial power demand forecasting using LSTM based hybrid ensemble learning | |
Von Krannichfeldt et al. | Online ensemble learning for load forecasting | |
CN116596044B (zh) | 基于多源数据的发电负荷预测模型训练方法及装置 | |
CN106600959B (zh) | 一种交通拥堵指数的预测方法 | |
Feng et al. | Reinforcement learning based dynamic model selection for short-term load forecasting | |
CN111178639A (zh) | 一种基于多模型融合实现预测的方法及装置 | |
CN110212524A (zh) | 一种区域电力负荷预测方法 | |
CN112418545A (zh) | 一种基于负荷特征及模型融合的售电量预测方法及系统 | |
CN118195103A (zh) | 一种基于Transformer的综合负荷预测方法及系统 | |
Zhang et al. | Long-term energy and peak power demand forecasting based on sequential-XGBoost | |
CN115238854A (zh) | 一种基于tcn-lstm-am的短期负荷预测方法 | |
CN113627677A (zh) | 多区域能源需求预测方法、装置、终端设备及存储介质 | |
CN117374920A (zh) | 考虑环境因素的超短期预测方法、装置及介质 | |
CN117494906A (zh) | 一种基于多元时间序列的天然气日负荷预测方法 | |
CN117728404A (zh) | 一种中长期光伏场站发电量预测方法及系统 | |
CN107704723A (zh) | 一种基于斜率关联度的显著变量选择方法 | |
Sauhats et al. | A stochastic approach to hydroelectric power generation planning in an electricity market | |
CN116307250A (zh) | 一种基于典型日特征选择的短期负荷预测方法及系统 | |
CN110110885A (zh) | 信息预测方法、装置、计算机设备和存储介质 | |
KR101484761B1 (ko) | 위기 경보 신호를 이용하여 산업 위기를 예측하는 방법 및 그 장치 | |
KR102614595B1 (ko) | 실시간 거시지표 예측 기반 주가 예측 시스템 | |
Riddervold et al. | Rolling horizon simulator for evaluation of bidding strategies for reservoir hydro | |
Kumar et al. | Bidirectional LSTM Network-Based Short-Term Load Forecasting Method in Smart Grids | |
Prahara et al. | Improved Feature Selection Algorithm of Electricity Price Forecasting using SVM |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |