CN109727066A - 一种基于XGBoost算法的大工业用电用户负荷预测方法 - Google Patents
一种基于XGBoost算法的大工业用电用户负荷预测方法 Download PDFInfo
- Publication number
- CN109727066A CN109727066A CN201811608997.3A CN201811608997A CN109727066A CN 109727066 A CN109727066 A CN 109727066A CN 201811608997 A CN201811608997 A CN 201811608997A CN 109727066 A CN109727066 A CN 109727066A
- Authority
- CN
- China
- Prior art keywords
- influence factor
- xgboost algorithm
- load
- monthly
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Supply And Distribution Of Alternating Current (AREA)
Abstract
本发明涉及电网供电配电领域,为大工业用电用户的负荷预测方法,包括:对用电用户的原始数据进行清洗和处理;从多个影响因素维度构建影响因素指标体系,在每个影响因素维度下构建多个影响因素指标;建立XGBoost算法模型,XGBoost算法模型的输入为历史影响因素指标数据,以月度最大负荷为学习目标;通过XGBoost算法进行模型训练,输出结果为各个影响因素指标的权重;通过XGBoost算法模型,对用电用户的月度最大负荷进行预测,提供月度负荷预测结果。本发明通过构建大工业用户的月度最大负荷预测模型,为其提供准确的月度负荷预测结果,以便选择合理的计费方式,降低用电成本。
Description
技术领域
本发明涉及电网供电配电领域,具体为大工业用电用户的负荷预测方法。
背景技术
用电负荷预测是通过历史用电负荷数据、经济发展水平、气象数据等影响因素来预测未来用电负荷的方法。现有的负荷预测技术按照预测的时间长短,可以分为超短期、短期、中期、长期负荷预测;按照预测对象不同,可以分为按地区、行业负荷预测。传统的负荷预测方法包括回归分析法、时间序列法、灰色模型法等。随着智能算法的兴起和普及,智能算法在国内外关于负荷预测的研究中占了很高比重,主要包括人工神经网络法、支持向量机法、小波分析法等。
主流的负荷预测技术主要用于指导电力系统的规划、运行、控制和稳定等方面,以保障电力系统安全运行,提升电网企业经济效益为主要目的,主要针对地区性、行业性且整体存在明显周期规律的宏观负荷数据。单个大工业企业的受电容量小,负荷数据由于受到企业生产变动、原材料价格波动、宏观政策等不确定因素影响,缺乏周期性规律,波动性大,预测难度高。主流的负荷预测方法在大工业企业负荷预测的应用上适用性较差。
发明内容
为解决现有技术所存在的技术问题,本发明提供基于XGBoost算法的大工业用电用户负荷预测方法,通过构建大工业用户的月度最大负荷预测模型,为其提供准确的月度负荷预测结果,以便选择合理的计费方式,降低用电成本。
本发明采用以下技术方案来实现:一种基于XGBoost算法的大工业用电用户负荷预测方法,包括以下步骤:
对用电用户的原始数据进行清洗和处理;
从多个影响因素维度构建影响因素指标体系,在每个影响因素维度下构建多个影响因素指标;
建立XGBoost算法模型,XGBoost算法模型的输入为历史影响因素指标数据,以月度最大负荷为学习目标;通过XGBoost算法进行模型训练,输出结果为各个影响因素指标的权重;
通过XGBoost算法模型,对用电用户的月度最大负荷进行预测,提供月度负荷预测结果。
优选地,XGBoost算法模型为一种提升树,以每一棵树的节点预测值与节点真实值之差作为该棵树分裂生成的残差,以上一棵树分裂生成的残差为样本,拟合下一棵回归树,通过累加所有提升树的结果作为最终结果。
优选地,,对原始数据进行清洗和处理的过程包括:首先对原始数据开展一致性检验、异常识别、缺失识别,对缺失数据和异常数据进行标识;然后对每个用电用户计算其历史同期均值,以填补缺失数据和替换异常数据;最后生成衍生指标。
本发明与现有技术相比,具有如下优点和有益效果:基于XGBoost算法,综合考虑单个企业月最大负荷变动的天气、历史期数负荷、用户基本信息、企业生产情况、节假日、行业整体生产情况等影响因素,构建大工业用户的月度最大负荷预测模型,为大工业企业提供月度负荷预测结果,帮助企业选择合理的计费方式,降低用电成本。大工业用电用户可以根据月度最大负荷预测模型的预测结果,合理选择基本电费计费方案,降低用电成本,提升市场竞争力;电网企业通过为用电客户提供精准负荷预测结果,指导用户优化用电,为用户提供增值服务,提升电网企业市场竞争力。
附图说明
图1是本发明的预测流程图;
图2是数据清洗和处理流程图;
图3是XGBoost算法模型的树结构图;
图4是通过XGboost算法建立的最大负荷预测模型的关键影响指标示意图;
图5是一个实施例中对某用户的月度负荷预测结果图。
具体实施方式
下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
实施例
本发明通过设计指标体系,采用XGBoost算法建模,并对模型进行验证,最终构建大工业企业月度负荷预测模型,为大工业企业择优选择计费方式提供参考依据。本发明的核心算法内容包括:设计了一套识别企业月度最大负荷变动的指标体系;基于XGBoost算法,建立大工业用户月度最大负荷预测模型;对月度最大负荷预测模型进行应用,为优化大工业企业计费方式提供支撑依据。
本发明采用基于XGBoost算法的月度负荷预测方法包括数据清洗、指标体系构建、模型算法构建、模型输出应用等步骤,流程如图1所示,各主要步骤具体如下:
(1)对大工业用电用户的原始数据进行清洗和处理
通过ETL抽取系统的原始数据,首先对原始数据开展一致性检验、异常识别、缺失识别,对缺失数据和异常数据进行标识;然后对每个用户计算其历史同期均值,以填补缺失数据和替换异常数据;最后生成衍生指标。数据清洗和处理过程如图2所示。
(2)构建影响因素指标体系
从历史期数负荷、天气指标、用户基本信息、企业生产情况、行业整体水平、节假日六个主要影响因素维度构建指标体系,在每个影响因素维度下构建多个影响因素指标。各影响因素维度下的部分指标如表一所示:
表一
(3)建立XGBoost算法模型
XGBoost算法模型的输入为历史影响因素指标数据,以月度最大负荷为学习目标。通过 XGBoost算法进行模型训练,输出结果为各个影响因素指标的权重。
XGBoost是提升树的一种,以每一棵树的节点预测值与节点真实值之差作为该棵树分裂生成的残差,以上一棵树分裂生成的残差为样本,拟合下一棵回归树,通过累加所有提升树的结果作为最终结果,如图3。相比于其它提升树,XGBoost算法用于回归建模有明显优势: 1)XGBoost在决策树分裂生长过程中加入了正则项,控制模型复杂度,使学习出来的模型更加简单,防止过拟合,建立的企业负荷预测模型鲁棒性更好;2)该算法工具支持在特征粒度上的并行,各个特征的增益计算可以开多线程进行,负荷预测模型应用结果输出快,符合实际应用需求;3)该算法具有高度的灵活性,允许用户自定义优化目标和评价标准,可根据实际研究样本和研究对象调整模型参数,模型应用更贴近实际使用需要。
获取某大工业企业近5年的月度最大负荷及影响因素指标数据作为样本,进行训练建模,结合应用实际,预测对象为连续变量,设置目标函数为“reg:linear”;定义树分裂最大深度 max_depth=7;收缩步长eta=0.3;线程数nthread=2;迭代计算次数nround=12时模型预测效果最佳。经验证,XGboost算法模型预测效果佳、速度快,适于进行负荷预测。
(4)模型应用
通过建立的XGBoost算法模型,对大工业企业用电用户的月度最大负荷进行预测,提供月度负荷预测结果,帮助企业选择合理的计费方式,降低用电成本。
通过XGboost算法建立的大工业用户月度最大负荷预测模型,模型关键影响指标如图4 所示。
模型结果表明,影响企业月度负荷的重要影响因素是历史期数负荷,其次是企业自身生产情况、行业水平及天气变化情况,对单个企业而言,节假日对月度最大负荷影响较小。
采用本发明基于XGBoost算法模型对某用户的月度负荷进行预测,结果如图5所示,图中示出了该企业2018年1月至7月最大负荷实际值与预测值偏差情况,相对误差最大值为 1.87%。以历史近4年的月度负荷数据及相关影响指标建模,对2018年1月至7月的月度最大负荷预测;实践证明,模型运用预测结果与实际月度负荷指标值偏差较小,模型预测准确性较高。说明本发明负荷预测方法能够在大工业企业月度负荷预测中应用。通过负荷预测结果,指导选择计费方式,降低用电成本,为客户提供增值服务。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
Claims (6)
1.一种基于XGBoost算法的大工业用电用户负荷预测方法,其特征在于,包括以下步骤:
对用电用户的原始数据进行清洗和处理;
从多个影响因素维度构建影响因素指标体系,在每个影响因素维度下构建多个影响因素指标;
建立XGBoost算法模型,XGBoost算法模型的输入为历史影响因素指标数据,以月度最大负荷为学习目标;通过XGBoost算法进行模型训练,输出结果为各个影响因素指标的权重;
通过XGBoost算法模型,对用电用户的月度最大负荷进行预测,提供月度负荷预测结果。
2.根据权利要求1所述的大工业用电用户负荷预测方法,其特征在于,XGBoost算法模型为一种提升树,以每一棵树的节点预测值与节点真实值之差作为该棵树分裂生成的残差,以上一棵树分裂生成的残差为样本,拟合下一棵回归树,通过累加所有提升树的结果作为最终结果。
3.根据权利要求2所述的大工业用电用户负荷预测方法,其特征在于,所述XGBoost算法模型在决策树分裂生长过程中加入正则项。
4.根据权利要求1所述的大工业用电用户负荷预测方法,其特征在于,通过ETL抽取系统中用电用户的原始数据。
5.根据权利要求1所述的大工业用电用户负荷预测方法,其特征在于,对原始数据进行清洗和处理的过程包括:首先对原始数据开展一致性检验、异常识别、缺失识别,对缺失数据和异常数据进行标识;然后对每个用电用户计算其历史同期均值,以填补缺失数据和替换异常数据;最后生成衍生指标。
6.根据权利要求1所述的大工业用电用户负荷预测方法,其特征在于,所述多个影响因素维度包括历史期数负荷、天气指标、用户基本信息、企业生产情况、行业整体水平及节假日。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811608997.3A CN109727066A (zh) | 2018-12-27 | 2018-12-27 | 一种基于XGBoost算法的大工业用电用户负荷预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811608997.3A CN109727066A (zh) | 2018-12-27 | 2018-12-27 | 一种基于XGBoost算法的大工业用电用户负荷预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109727066A true CN109727066A (zh) | 2019-05-07 |
Family
ID=66296506
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811608997.3A Pending CN109727066A (zh) | 2018-12-27 | 2018-12-27 | 一种基于XGBoost算法的大工业用电用户负荷预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109727066A (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110298509A (zh) * | 2019-06-28 | 2019-10-01 | 佰聆数据股份有限公司 | 一种结合短期负荷预测的大工业行业用电优化方法 |
CN110334739A (zh) * | 2019-06-05 | 2019-10-15 | 深圳供电局有限公司 | 一种两段式分量负荷预测方法及装置 |
CN110543988A (zh) * | 2019-08-28 | 2019-12-06 | 上海电力大学 | 一种基于XGBoost算法的光伏短期出力预测系统及方法 |
CN111178957A (zh) * | 2019-12-23 | 2020-05-19 | 广西电网有限责任公司 | 一种用电客户电量突增预警的方法 |
CN111178675A (zh) * | 2019-12-05 | 2020-05-19 | 佰聆数据股份有限公司 | 基于LR-Bagging算法的电费回收风险预测方法、系统、存储介质及计算机设备 |
CN111723942A (zh) * | 2020-06-29 | 2020-09-29 | 南方电网科学研究院有限责任公司 | 一种企业用电负荷预测方法、电网业务子系统及预测系统 |
CN112381313A (zh) * | 2020-11-23 | 2021-02-19 | 国网北京市电力公司 | 充电桩地址的确定方法和装置 |
CN112508251A (zh) * | 2020-11-27 | 2021-03-16 | 国网浙江省电力有限公司杭州供电公司 | 一种基于电力驾驶舱的负荷预测方法及装置 |
CN112614010A (zh) * | 2020-12-07 | 2021-04-06 | 国网北京市电力公司 | 负荷预测方法及装置、存储介质及电子装置 |
CN113962505A (zh) * | 2021-08-17 | 2022-01-21 | 北京国电通网络技术有限公司 | 基于时间轴的电网资源差异化分配方法及相关设备 |
CN114862057A (zh) * | 2022-06-13 | 2022-08-05 | 浙江电力交易中心有限公司 | 一种代理电量预测方法、装置、设备及介质 |
CN110826795B (zh) * | 2019-10-31 | 2023-06-09 | 国网辽宁省电力有限公司经济技术研究院 | 极端温度气象日母线日前负荷预测方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180060728A1 (en) * | 2016-08-31 | 2018-03-01 | Microsoft Technology Licensing, Llc | Deep Embedding Forest: Forest-based Serving with Deep Embedding Features |
-
2018
- 2018-12-27 CN CN201811608997.3A patent/CN109727066A/zh active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180060728A1 (en) * | 2016-08-31 | 2018-03-01 | Microsoft Technology Licensing, Llc | Deep Embedding Forest: Forest-based Serving with Deep Embedding Features |
Non-Patent Citations (2)
Title |
---|
许裕粟等: "Xgboost算法在区域用电预测中的应用!", 《自动化仪表》 * |
黄文达,方芃岚: "基于XGBoost算法的用电电量预测的实践应用", 《现代信息科技》 * |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110334739A (zh) * | 2019-06-05 | 2019-10-15 | 深圳供电局有限公司 | 一种两段式分量负荷预测方法及装置 |
CN110298509B (zh) * | 2019-06-28 | 2023-05-23 | 佰聆数据股份有限公司 | 一种结合短期负荷预测的大工业行业用电优化方法 |
CN110298509A (zh) * | 2019-06-28 | 2019-10-01 | 佰聆数据股份有限公司 | 一种结合短期负荷预测的大工业行业用电优化方法 |
CN110543988A (zh) * | 2019-08-28 | 2019-12-06 | 上海电力大学 | 一种基于XGBoost算法的光伏短期出力预测系统及方法 |
CN110826795B (zh) * | 2019-10-31 | 2023-06-09 | 国网辽宁省电力有限公司经济技术研究院 | 极端温度气象日母线日前负荷预测方法 |
CN111178675A (zh) * | 2019-12-05 | 2020-05-19 | 佰聆数据股份有限公司 | 基于LR-Bagging算法的电费回收风险预测方法、系统、存储介质及计算机设备 |
CN111178957B (zh) * | 2019-12-23 | 2023-04-14 | 广西电网有限责任公司 | 一种用电客户电量突增预警的方法 |
CN111178957A (zh) * | 2019-12-23 | 2020-05-19 | 广西电网有限责任公司 | 一种用电客户电量突增预警的方法 |
CN111723942A (zh) * | 2020-06-29 | 2020-09-29 | 南方电网科学研究院有限责任公司 | 一种企业用电负荷预测方法、电网业务子系统及预测系统 |
CN111723942B (zh) * | 2020-06-29 | 2024-02-02 | 南方电网科学研究院有限责任公司 | 一种企业用电负荷预测方法、电网业务子系统及预测系统 |
CN112381313A (zh) * | 2020-11-23 | 2021-02-19 | 国网北京市电力公司 | 充电桩地址的确定方法和装置 |
CN112508251A (zh) * | 2020-11-27 | 2021-03-16 | 国网浙江省电力有限公司杭州供电公司 | 一种基于电力驾驶舱的负荷预测方法及装置 |
CN112614010A (zh) * | 2020-12-07 | 2021-04-06 | 国网北京市电力公司 | 负荷预测方法及装置、存储介质及电子装置 |
CN113962505A (zh) * | 2021-08-17 | 2022-01-21 | 北京国电通网络技术有限公司 | 基于时间轴的电网资源差异化分配方法及相关设备 |
CN114862057A (zh) * | 2022-06-13 | 2022-08-05 | 浙江电力交易中心有限公司 | 一种代理电量预测方法、装置、设备及介质 |
CN114862057B (zh) * | 2022-06-13 | 2024-05-31 | 浙江电力交易中心有限公司 | 一种代理电量预测方法、装置、设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109727066A (zh) | 一种基于XGBoost算法的大工业用电用户负荷预测方法 | |
CN108491969B (zh) | 基于大数据的空间负荷预测模型构建方法 | |
CN107784397B (zh) | 一种电网物资需求预测系统及其预测方法 | |
CN108053082B (zh) | 基于温度区间分解的电网中长期负荷预测方法 | |
CN107506845A (zh) | 一种基于多模型融合的售电量预测方法及其系统 | |
Macedo et al. | Typification of load curves for DSM in Brazil for a smart grid environment | |
CN105678407A (zh) | 一种基于人工神经网络的日用电量预测方法 | |
CN103310286A (zh) | 一种具有时间序列特性的产品订单预测方法及装置 | |
Liu et al. | Edge sensing data-imaging conversion scheme of load forecasting in smart grid | |
CN110009419A (zh) | 基于经济景气法的改进时间序列售电量预测方法及系统 | |
CN104252652A (zh) | 电力系统中空间负荷预测方法 | |
CN106022530A (zh) | 一种电力需求侧柔性负荷有功功率预测方法 | |
CN103699947A (zh) | 一种基于元学习的电力系统时变非线性负荷组合预测方法 | |
CN110198042A (zh) | 一种电网储能的动态优化方法及存储介质 | |
CN111967684A (zh) | 一种基于大数据分析的计量资产主动配送方法 | |
CN106485367A (zh) | 一种基于多企业用电数据耦合的经济分析平台及预测方法 | |
CN109034241A (zh) | 基于支持向量机的负荷集群控制方法和系统 | |
CN108805313A (zh) | 面向全球供应链的需求预测方法、装置、以及系统 | |
CN114091776A (zh) | 一种基于K-means的多分支AGCNN短期电力负荷预测方法 | |
Mishra et al. | Performance evaluation of prophet and STL-ETS methods for load forecasting | |
CN109447336A (zh) | 一种上游水库与其反调节水库坝间水位优化控制方法 | |
CN108846529A (zh) | 一种发电量预测系统 | |
CN117521900A (zh) | 基于投资比率和时序算法的电网业扩物资需求预测方法 | |
JP6679980B2 (ja) | 電力需要予測装置、及び電力需要予測方法 | |
CN105117859A (zh) | 基于iowa算子的电力发展水平通用评价方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190507 |