CN110570034B - 一种基于多XGBoost模型融合的母线负荷预测方法 - Google Patents
一种基于多XGBoost模型融合的母线负荷预测方法 Download PDFInfo
- Publication number
- CN110570034B CN110570034B CN201910809141.0A CN201910809141A CN110570034B CN 110570034 B CN110570034 B CN 110570034B CN 201910809141 A CN201910809141 A CN 201910809141A CN 110570034 B CN110570034 B CN 110570034B
- Authority
- CN
- China
- Prior art keywords
- data
- xgboost
- bus load
- layer
- prediction system
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 30
- 230000004927 fusion Effects 0.000 title claims abstract description 16
- 239000002245 particle Substances 0.000 claims abstract description 15
- 238000007781 pre-processing Methods 0.000 claims abstract description 10
- 230000006870 function Effects 0.000 claims description 20
- 238000010606 normalization Methods 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 5
- 101001095088 Homo sapiens Melanoma antigen preferentially expressed in tumors Proteins 0.000 claims description 3
- 102100037020 Melanoma antigen preferentially expressed in tumors Human genes 0.000 claims description 3
- 238000006243 chemical reaction Methods 0.000 claims description 2
- 238000010276 construction Methods 0.000 claims 1
- 230000000694 effects Effects 0.000 abstract description 4
- 238000005457 optimization Methods 0.000 abstract description 3
- 238000010801 machine learning Methods 0.000 description 5
- 230000009286 beneficial effect Effects 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 102100035932 Cocaine- and amphetamine-regulated transcript protein Human genes 0.000 description 1
- 101000715592 Homo sapiens Cocaine- and amphetamine-regulated transcript protein Proteins 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- General Business, Economics & Management (AREA)
- Computing Systems (AREA)
- Marketing (AREA)
- General Health & Medical Sciences (AREA)
- Tourism & Hospitality (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Game Theory and Decision Science (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Entrepreneurship & Innovation (AREA)
- Molecular Biology (AREA)
- Operations Research (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Development Economics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于多XGBoost模型融合的母线负荷预测方法,包括如下步骤:首先,对母线负荷数据及其相关数据进行预处理,并构建样本集;其次,构建分层预测系统,共2层,在第一层建立N个不同的XGBoost模型,在第二层建立1个XGBoost模型,将第一层N个XGBoost模型的输出作为其输入,即由第一层的XGBoost模型进行一次学习,再由第二层的XGBoost模型对第一层的学习结果进行二次学习;采用粒子群算法(PSO)优化分层预测系统参数;最后应用样本集进行训练与测试,输出母线负荷预测结果。本发明的方法强化了学习效果,提升了泛化能力,适合于解决随机性较强的母线负荷的预测问题。
Description
技术领域
本发明涉及母线负荷预测技术领域,具体为一种基于多XGBoost模型融合的母线负荷预测方法。
背景技术
母线负荷是指由变电站的主变压器供给某一供电区域的终端负荷的总和。由于供电区域通常较小,母线负荷量级低,一般仅为几百兆瓦。此外由于不同供电区域的用户性质存在差异,例如,某些区域居民负荷偏多,而某些区域工业负荷偏多,因此各母线的负荷成分往往不同,导致预测难度更大。
近年来,机器学习技术快速发展,被广泛应用于负荷预测领域。极限梯度提升(XGBoost)是基于梯度提升手段实现的机器学习模型,在各类机器学习预测比赛中表现优异。对于母线负荷预测,由于母线负荷的随机性较强,模型学习不充分的现象时有发生。为此,可考虑采用模型融合手段将多个模型集成,构成综合预测系统,以强化学习效果,提升预测精度。
综上,对于母线负荷预测问题,单一的机器学习模型难以有效应对,因此可考虑结合模型融合手段解决母线负荷预测问题。
发明内容
本发明所要解决的技术问题是如何提高母线负荷的预测精度。
为实现以上目的,本发明提出的技术方案为:一种基于多XGBoost模型融合的母线负荷预测方法,包括以下步骤:
步骤A:对母线负荷数据及其相关数据进行数据预处理;
步骤B:构建样本集,划分训练集与测试集;
步骤C:构建分层预测系统,共2层,第一层为N个XGBoost模型,第二层为1个XGBoost模型;N≥1;
步骤D:利用粒子群算法优化分层预测系统参数;
步骤E:应用分层预测系统进行训练与预测。
进一步,步骤A中,对母线负荷数据及其相关数据进行数据预处理,包括:
步骤A1:获取母线负荷数据及其相关数据,相关数据包括日期类型、时刻、气象条件等;
步骤A2:采用线性插值法填补母线负荷数据中的缺失值,并对填补后的母线负荷数据进行归一化处理;
步骤A3:对日期类型、时刻、风速、降雨量等数据进行独热编码,对温度、湿度等数据进行归一化处理。
进一步,步骤C中,构建分层预测系统,共2层,第一层为3个XGBoost模型,第二层为1个XGBoost模型,包括:
步骤C1:建立3个XGBoost模型,以并行方式分布,用于一次学习,3个XGBoost模型的输出为母线负荷一次预测值;
步骤C2:建立1个XGBoost模型,顺序连接在3个XGBoost模型之后,即以第一层的3个XGBoost模型的输出作为第二层的XGBoost模型的输入,整体构成分层预测系统。
进一步,步骤D中,利用粒子群算法优化分层预测系统参数,包括:
步骤D1:初始化分层预测系统中各个XGBoost模型的参数,参数集合即为粒子;
步骤D2:设定粒子群算法的适应度函数,计算公式如下:
式中,fitness表示适应度函数,MAPE表示平均绝对百分比误差;
步骤D3:计算粒子适应度,根据适应度更新粒子,若达到最大迭代次数或适应度的增量小于给定阈值,则结束迭代,输出参数优化结果,否则重复步骤D3。
本发明具有以下有益效果:
1.本发明的一种基于多XGBoost模型融合的母线负荷预测方法,将多个XGBoost模型以分层的形式进行模型融合,构成分层预测系统,强化了学习效果。相较于单个模型,分层预测系统具有更好的预测精度。
2.本发明的一种基于多XGBoost模型融合的母线负荷预测方法,构建的分层预测系统采用粒子群算法优化系统参数,有效解决了系统参数较多难以配置的问题,使得所提方法具备良好的实用价值。
附图说明
图1是本发明方法的实现流程图;
图2是本发明方法中分层预测系统的示意图;
图3是本发明方法中粒子群算法优化分层预测系统参数的实现流程图。
具体实施方式
下面结合附图对本发明所提方法进行详细阐述。
图1为本发明所提方法的实现流程图。如图1所示,包括以下步骤:
步骤A:对母线负荷数据及其相关数据进行数据预处理;
步骤B:构建样本集,划分训练集与测试集;
步骤C:构建分层预测系统,共2层,第一层为3个XGBoost模型,第二层为1个XGBoost模型;
步骤D:利用粒子群算法优化分层预测系统参数;
步骤E:应用分层预测系统进行训练与预测。
进一步,步骤A中,对母线负荷数据及其相关数据进行数据预处理,包括:
步骤A1:获取母线负荷数据及其相关数据,相关数据包括日期类型、时刻、气象条件等;
步骤A2:采用线性插值法填补母线负荷数据中的少量缺失值,并对填补后的母线负荷数据进行归一化;
步骤A3:对日期类型、时刻、风速、降雨量等数据进行独热编码,对温度、湿度等数据进行归一化处理。
特别地,步骤A2中,采用线性插值法填补母线负荷数据中的少量缺失值,线性插值法的计算公式如下:
式中,p指t时刻缺失的母线负荷数据的填补值,p0指t时刻之前t0时刻已知的母线负荷值,p1指t时刻之后t1时刻已知的母线负荷值。对于母线负荷数据中存在少量缺失值的情况,采用线性插值法可以快速、简单地解决该问题,避免数据缺失造成的不良影响。
特别地,步骤A2和步骤A3中,对母线负荷数据和温度、湿度等数据进行归一化处理,归一化方法为最大最小归一化,转换公式如下:
式中,X指待归一化的数据,xmax为待归一化的数据中的最大值,xmin为待归一化的数据中的最小值,x*为归一化后的数据。归一化有助于模型更好地利用数据。
进一步,步骤C中,构建分层预测系统,其结构示意图如图2所示,第一层为3个XGBoost模型,第二层为1个XGBoost模型,包括:
步骤C1:建立3个XGBoost模型,以并行方式分布,用于一次学习,3个XGBoost模型的输出为母线负荷一次预测值;
步骤C2:建立1个XGBoost模型,顺序连接在3个XGBoost模型之后,即以第一层的3个XGBoost模型的输出作为第二层的XGBoost模型的输入,整体构成分层预测系统。
为了验证本发明的有效性,在本实施例对比了不同数量模型融合的分层预测系统与单一XGBoost模型的预测精度,结果如下表所示,其中多XGBoost模型融合(N+1)表示第一层为N个XGBoost、第二层为1个XGBoost模型的分层预测系统,其中N=2,3,4,5。结果显示,多XGBoost模型融合的预测精度高于单一XGBoost模型的预测精度,且第一层为3个XGBoost、第二层为1个XGBoost的分层预测系统的预测精度最高,说明了本发明方法的有效性。
特别地,步骤C中,构建分层预测系统的基本模型为XGBoost模型。XGBoost是基于梯度提升技术实现的机器学习算法,其是由多个分类与回归树(CART)组合而成。对于一个具有n个样本和m个特征的给定数据集D={(xi,yi)}(|D|=n,xi∈Rm,yi∈R),其中xi为具有m维特征的样本向量,yi为与xi对应的实际值,R为实数集。采用由K棵CART集成的XGBoost模型预测输出,如式(3)所示,为实际值yi的预测值。
式中,Γ={fk(xi)=ωq(xi)}(q:Rm→T,ω∈RT)是CART的函数空间,fk(·)表示第k棵树。q表示树结构,T表示叶结点的数量,每个fk都对应一个独立的树结构q与叶权重ω。为了将开棵树有效组合构成XGBoost,要将式(4)所示的正则化目标函数L最小化。
对式(5)采用二阶泰勒展开,展开结果如式(6)所示。
定义Ij={i|q(xi)=j}为叶结点j的样本集。将正则项Ω展开,式(7)改写为式(8),
式(10)为评价树结构q的评分函数,该函数值越小,说明树的结构越好。至此,XGBoost模型建立完成。
进一步,步骤D中,粒子群算法优化分层预测系统参数,其流程图如图3所示,包括:
步骤D1:初始化分层预测系统中各个XGBoost模型的参数,参数集合即为粒子;
步骤D2:设定粒子群算法的适应度函数,计算公式如下:
式中,fitness表示适应度函数,MAPE表示平均绝对百分比误差。
步骤D3:计算粒子适应度,根据适应度更新粒子,若达到最大迭代次数或适应度的增量小于给定阈值,则结束迭代,输出参数优化结果,否则重复步骤D3。
Claims (4)
1.一种基于多XGBoost模型融合的母线负荷预测方法,其特征在于:包括以下步骤:
步骤A:对母线负荷数据及其相关数据进行数据预处理;
步骤B:构建样本集,划分训练集与测试集;
步骤C:构建分层预测系统,共2层,第一层为3个XGBoost模型,第二层为1个XGBoost模型;
步骤D:利用粒子群算法优化分层预测系统参数;
步骤E:应用分层预测系统进行训练与预测;
其中,在所述步骤C中,分层预测系统的具体构建步骤包括:
步骤C1:建立3个XGBoost模型,以并行方式分布,用于一次学习,3个XGBoost模型的输出为母线负荷一次预测值;
步骤C2:建立1个XGBoost模型,顺序连接在3个XGBoost模型之后,即以第一层的3个XGBoost模型的输出作为第二层的XGBoost模型的输入,整体构成分层预测系统;
在所述步骤D中,利用粒子群算法优化分层预测系统参数,包括以下步骤:
步骤D1:初始化分层预测系统中各个XGBoost模型的参数,参数集合即为粒子;
步骤D2:设定粒子群算法的适应度函数,计算公式如下:
式中,fitness表示适应度函数,MAPE表示平均绝对百分比误差;
步骤D3:计算粒子适应度,根据适应度更新粒子,若达到最大迭代次数或适应度的增量小于给定阈值,则结束迭代,输出参数优化结果,否则重复步骤D3。
2.根据权利要求1所述的基于多XGBoost模型融合的母线负荷预测方法,其特征在于:步骤A中,对母线负荷数据及其相关数据进行数据预处理,包括:
步骤A1:获取母线负荷数据及其相关数据,相关数据包括日期类型、时刻、气象条件;
步骤A2:采用线性插值法填补母线负荷数据中的缺失值,并对填补后的母线负荷数据进行归一化处理;
步骤A3:对日期类型、时刻、风速、降雨量数据进行独热编码,对温度、湿度数据进行归一化处理。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910809141.0A CN110570034B (zh) | 2019-08-29 | 2019-08-29 | 一种基于多XGBoost模型融合的母线负荷预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910809141.0A CN110570034B (zh) | 2019-08-29 | 2019-08-29 | 一种基于多XGBoost模型融合的母线负荷预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110570034A CN110570034A (zh) | 2019-12-13 |
CN110570034B true CN110570034B (zh) | 2022-04-22 |
Family
ID=68776756
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910809141.0A Active CN110570034B (zh) | 2019-08-29 | 2019-08-29 | 一种基于多XGBoost模型融合的母线负荷预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110570034B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113282470B (zh) * | 2021-05-12 | 2023-07-07 | 中国联合网络通信集团有限公司 | 一种性能预测方法及装置 |
CN113503750B (zh) * | 2021-06-25 | 2022-07-29 | 太原理工大学 | 一种直接空冷机组最佳背压确定方法 |
CN113962431B (zh) * | 2021-09-09 | 2024-07-16 | 哈尔滨工程大学 | 一种两阶段特征处理的母线负荷预测方法 |
CN114034375B (zh) * | 2021-10-26 | 2024-06-11 | 三峡大学 | 一种特高压输电线路噪声测量系统及方法 |
CN114819380B (zh) * | 2022-05-12 | 2024-06-28 | 福州大学 | 基于模型融合的电网母线负荷预测方法 |
CN115879570B (zh) * | 2022-10-25 | 2024-05-07 | 国网安徽省电力有限公司合肥供电公司 | 电网负荷预测模型的建立方法及计算机可读储存介质 |
CN115409292A (zh) * | 2022-10-31 | 2022-11-29 | 广东电网有限责任公司佛山供电局 | 一种电力系统短期负荷预测方法及相关装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106529719A (zh) * | 2016-11-08 | 2017-03-22 | 中国地质大学(武汉) | 基于粒子群优化算法风速融合的风电功率预测的方法 |
CN108510113A (zh) * | 2018-03-21 | 2018-09-07 | 中南大学 | 一种XGBoost在短期负荷预测中的应用 |
CN109508753A (zh) * | 2018-12-25 | 2019-03-22 | 中南大学 | 一种矿物浮选过程指标的在线预测方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104239694B (zh) * | 2014-08-28 | 2016-11-23 | 北京交通大学 | 一种城轨列车转向架的故障预测与视情维修方法 |
-
2019
- 2019-08-29 CN CN201910809141.0A patent/CN110570034B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106529719A (zh) * | 2016-11-08 | 2017-03-22 | 中国地质大学(武汉) | 基于粒子群优化算法风速融合的风电功率预测的方法 |
CN108510113A (zh) * | 2018-03-21 | 2018-09-07 | 中南大学 | 一种XGBoost在短期负荷预测中的应用 |
CN109508753A (zh) * | 2018-12-25 | 2019-03-22 | 中南大学 | 一种矿物浮选过程指标的在线预测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110570034A (zh) | 2019-12-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110570034B (zh) | 一种基于多XGBoost模型融合的母线负荷预测方法 | |
CN109948029B (zh) | 基于神经网络自适应的深度哈希图像搜索方法 | |
CN111210082B (zh) | 一种基于优化的bp神经网络算法的降水量预测方法 | |
CN107609667B (zh) | 基于Box_cox变换和UFCNN的供热负荷预测方法及系统 | |
CN111243045A (zh) | 一种基于高斯混合模型先验变分自编码器的图像生成方法 | |
CN111784043A (zh) | 一种基于模态gru学习网络的配电台区售电量精准预测方法 | |
CN112149879A (zh) | 一种计及宏观波动性分类的新能源中长期电量预测方法 | |
CN113132232B (zh) | 一种能量路由优化方法 | |
CN112330487A (zh) | 一种光伏发电短期功率预测方法 | |
CN112650933A (zh) | 一种基于高阶聚合的图卷积融合多头注意力机制的会话推荐方法 | |
CN116207739A (zh) | 配电网优化调度方法、装置、计算机设备和存储介质 | |
CN117096875B (zh) | 一种基于Spatio-Temporal Transformer模型的短期负荷预测方法及系统 | |
CN111882157A (zh) | 一种基于深度时空神经网络的需求预测方法、系统及计算机可读存储介质 | |
CN113128666A (zh) | 基于Mo-S-LSTMs模型的时间序列多步预测方法 | |
CN114971090A (zh) | 一种电供暖负荷预测方法、系统、设备和介质 | |
CN109540089B (zh) | 一种基于贝叶斯-克里金模型的桥面高程拟合方法 | |
CN118040678A (zh) | 一种短期海上风电功率组合预测方法 | |
CN111639463B (zh) | 一种基于XGBoost算法的电力系统扰动后频率特征预测方法 | |
CN117039983A (zh) | 一种结合通道注意力机制的光伏出力预测方法及终端 | |
CN112232570A (zh) | 一种正向有功总电量预测方法、装置及可读存储介质 | |
CN116451826A (zh) | 一种基于改进长短期记忆神经网络的光伏发电预测方法 | |
CN113610665B (zh) | 一种基于多延迟输出回声状态网的风力发电功率预测方法 | |
CN115526308A (zh) | 基于宽度剪枝回声状态网络的时间序列预测方法 | |
CN115377977B (zh) | 含零注入节点的主动配电网高精度状态估计系统及方法 | |
WO2024174300A1 (zh) | 一种基于图神经网络的工艺质量时间序列预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20201211 Address after: Xikang Road, Gulou District of Nanjing city of Jiangsu Province, No. 1 210098 Applicant after: HOHAI University Applicant after: STATE GRID JIANGSU ELECTRIC POWER Co.,Ltd. Address before: Xikang Road, Gulou District of Nanjing city of Jiangsu Province, No. 1 210098 Applicant before: HOHAI University |
|
TA01 | Transfer of patent application right | ||
GR01 | Patent grant | ||
GR01 | Patent grant |