CN111507777A - 一种基于轻量级梯度提升算法预测电价的系统模型 - Google Patents
一种基于轻量级梯度提升算法预测电价的系统模型 Download PDFInfo
- Publication number
- CN111507777A CN111507777A CN202010386436.4A CN202010386436A CN111507777A CN 111507777 A CN111507777 A CN 111507777A CN 202010386436 A CN202010386436 A CN 202010386436A CN 111507777 A CN111507777 A CN 111507777A
- Authority
- CN
- China
- Prior art keywords
- data
- algorithm
- model
- gradient
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000005611 electricity Effects 0.000 title claims abstract description 20
- 238000000034 method Methods 0.000 claims abstract description 14
- 238000004891 communication Methods 0.000 claims description 8
- 230000007717 exclusion Effects 0.000 claims description 7
- 238000005070 sampling Methods 0.000 claims description 6
- 238000004458 analytical method Methods 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 4
- 230000010354 integration Effects 0.000 claims description 3
- 230000002159 abnormal effect Effects 0.000 claims description 2
- 230000001174 ascending effect Effects 0.000 claims description 2
- 230000005540 biological transmission Effects 0.000 claims description 2
- 230000007547 defect Effects 0.000 claims 1
- 238000003066 decision tree Methods 0.000 abstract 2
- 238000010801 machine learning Methods 0.000 abstract 1
- 230000006870 function Effects 0.000 description 7
- 238000005192 partition Methods 0.000 description 2
- 238000010248 power generation Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0206—Price or cost determination based on market factors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Economics (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Development Economics (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Tourism & Hospitality (AREA)
- Primary Health Care (AREA)
- General Health & Medical Sciences (AREA)
- Water Supply & Treatment (AREA)
- Game Theory and Decision Science (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
随着新一轮电力市场改革的持续推进,电价作为反映市场运营状况的重要指标,准确预测电价能够帮助电力市场博弈方进行风险规避,达到经济收益最大化。梯度提升决策树是机器学习中一个长盛不衰的模型,其主要思想是利用弱分类器(决策树)迭代训练以得到最优模型,该模型具有训练效果好、不易过拟合等优点。该方法不仅在工业界应用广泛,支持高效率的并行训练,并且具有更快的训练速度、更低的内存消耗、更好的准确率、支持分布式可以快速处理海量数据等优点。本发明采用了一种基于轻量级梯度提升算法来预测节点电价,可以极大的提高预测准确度。
Description
技术领域
本发明涉及人工智能应用于电价预测领域,具体涉及一种基于轻量级梯度提升算法LightGBM(Light Gradient Boosting Method)预测电价的系统模型。
背景技术
随着电力市场改革正式开始. 新电改放开了电力市场的售电侧, 使我国的电力市场逐渐走向市场化. 电 能作为电力市场中的一种特殊产品, 电价是反映电力市场运营情况、评价电力市场竞争效率的重要指 标, 是电力市场各博弈方进行科学决策的基础.对电价数据进行准确预测可以帮助售电企业决定市场 的日前报价, 最大限度地规避风险、提高收益, 同时也能够为发电企业的发电扩容提供价格信号. 因此, 对波动频率较大的电价数据进行准确预测已经成为电力市场各交易方研究的核心问题。本发明提出了一种基于轻量级梯度提升算法LightGBM(Light Gradient Boosting Method)来预测电价的系统模型。
发明内容
本发明的目的是提供一种电价预测的系统模型来准确预测电价,能够帮助电力市场博弈方进行风险规避, 达到经济收益最大化。其中梯度提升决策树是机器学习中一个长盛不衰的模型,其主要思想是利用弱分类器(决策树)迭代训练以得到最优模型,该模型具有训练效果好、不易过拟合等优点。该方法不仅在工业界应用广泛,支持高效率的并行训练,并且具有更快的训练速度、更低的内存消耗、更好的准确率、支持分布式可以快速处理海量数据等优点。本发明采用了一种基于轻量级梯度提升算法LightGBM(Light GradientBoosting Method)来预测节点电价,可以极大的提高预测准确度,相关流程如图1所示。
附图说明
图1为本发明实施中电价预测系统模块流程图。
图2为本发明实施中样本电力价格曲线图。
图3为本发明实施中电价预测值与历史电价的曲线图。
具体实施方式
为使得本发明的内容、目的、特征及优点能够更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本发明一部分实施例,而非全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护说明书的范围。
本发明的技术方案具体步骤如下。
1)通过测量或取得历史数据的方式, 获得该区域的小时级历史气温, 工作日,节假日, 小时参数, 月参数, 年参数, 历史用电负荷, 包括同一时段上一周的负荷,同一时段昨天的负荷,前二十四小时的平均负荷,以及历史节点电价, 包括同一时段上一周的电价,同一时段昨天的电价,前二十四小时的平均电价,前一天的峰值电价, 上一周的峰值电价,样本电力价格曲线图如图2所示。
2)由于可能存在的人为误差, 我们对于从训练集中删除了异常数据,比如:由于极端高温或极端低温导致的峰值电价, 大面积输电堵塞导致的峰值电价等。由于该类数据的出现概率很小, 我们采用异常分析的办法, 剔除掉1%概率最小的数据。异常分析公式如下:
a.首先计算出每一组数据的多元正态分布:
3)采用轻量级梯度提升算法训练模型, 具体步骤如下:
d.为了求解该目标函数, 我们采用泰勒公式:
原问题转化成:
e.为了确保生成的树模型们不会导致过拟合, 目标函数的正则项我们定义为:
f.由于在实际的应用中, 数据量大, 特征值多。为了提高算法的效率, 减少运算时间,首先在每一个生成树模型时, 并不通过穷举法找到最优切入点,而是采用贪心算法:
i.从深度为0的树开始,对每个叶节点枚举所有的可用特征;
ii. 针对每个特征,把属于该节点的训练样本根据该特征值进行升序排列,通过线性扫描的方式来决定该特征的最佳分裂点,并记录该特征的分裂收益;
iii.选择收益最大的特征作为分裂特征,用该特征的最佳分裂点作为分裂位置,在该节点上分裂出左右两个新的叶节点,并为每个新节点关联对应的样本集
iv.回到第 1 步,递归执行到满足特定条件为止
g.在每一个树模型生成时的梯度下降时,采用单边梯度抽样算法。在树模型算法的梯度大小可以反应样本的权重,梯度越小说明模型拟合的越好,单边梯度抽样算法利用这一信息对样本进行抽样,减少了大量梯度小的样本,在接下来的计算过程中只需关注梯度高的样本,极大的减少了计算量。单边梯度抽样算法保留了梯度大的样本,并对梯度小的样本进行随机抽样,为了不改变样本的数据分布,在计算增益时为梯度小的样本引入一个常数进行平衡;
h.最后如果对于特征值,我们采用互斥特征捆绑算法。由于高维特征往往是稀疏的,而且特征间可能是相互排斥的(如两个特征不同时取非零值),如果两个特征并不完全互斥(如只有一部分情况下是不同时取非零值),可以用互斥率表示互斥程度。互斥特征捆绑算法指出如果将一些特征进行融合绑定,则可以降低特征数量;
i. 在每一个树模型的生成中,我们采用,逐叶(leaf-wise)策略: 每次分类增益最大的叶子节点,直到达停止条件。
4)在工程实现中, 传统的特征并行算法在于对数据进行垂直划分,然后使用不同机器找到不同特征的最优分裂点,基于通信整合得到最佳划分点,然后基于通信告知其他机器划分结果。 传统的特征并行方法有个很大的缺点:需要告知每台机器最终划分结果,增加了额外的复杂度(因为对数据进行垂直划分,每台机器所含数据不同,划分结果需要通过通信告知)。而本发明采用的轻量级梯度提升算法,不进行数据垂直划分,而是采用分散规约的方式将直方图整合的任务分摊到不同机器上,从而降低通信代价,并通过直方图做差进一步降低不同机器间的通信。每台机器都有训练集完整数据,在得到最佳划分方案后可在本地执行划分而减少了不必要的通信。
5)最后预测电价数据结果如图3所示。
本发明通过一种基于轻量级梯度提升算法,考虑多种数据自变量,提出一种对电力价格预测方法。为综合应用新能源发电,保障整体电网用电平稳安全,提供了一套得到有效预测数据的系统。以上是对本发明的较佳实施进行了具体说明,但本发明创造并不限于所述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做出种种的等同变形或替换,这些等同的变型或替换均包含在本申请权利要求所限定的范围内。
Claims (2)
1.本发明提出的一种基于轻量级梯度提升算法LightGBM(Light Gradient BoostingMethod)预测电价的系统模型,其特征在于,包括:
通过测量或取得历史数据的方式,获得该区域的小时级历史气温, 工作日, 节假日,小时参数, 月参数, 年参数, 历史用电负荷, 包括同一时段上一周的负荷,同一时段昨天的负荷,前二十四小时的平均负荷,以及历史节点电价, 包括同一时段上一周的电价,同一时段昨天的电价,前二十四小时的平均电价,前一天的峰值电价, 上一周的峰值电价,样本电力价格曲线图如图2所示;
2)由于可能存在的人为误差, 我们对于从训练集中删除了异常数据,比如:由于极端高温或极端低温导致的峰值电价, 大面积输电堵塞导致的峰值电价等;
由于该类数据的出现概率很小, 我们采用异常分析的办法, 剔除掉1%概率最小的数据;
异常分析公式如下:
a.首先计算出每一组数据的多元正态分布:
3)采用轻量级梯度提升算法训练模型, 具体步骤如下:
预测值由k个树模型的和组成,
所以目标函数为:
d.为了求解该目标函数, 我们采用泰勒公式:
原问题转化成:
e.为了确保生成的树模型们不会导致过拟合, 目标函数的正则项我们定义为:
也就是说, 我们希望目标函数越小, 同时叶子数越少越好;
f.由于在实际的应用中, 数据量大, 特征值多,
为了提高算法的效率, 减少运算时间,首先在每一个生成树模型时, 并不通过穷举法找到最优切入点,而是采用贪心算法:
i.从深度为0的树开始,对每个叶节点枚举所有的可用特征;
ii. 针对每个特征,把属于该节点的训练样本根据该特征值进行升序排列,通过线性扫描的方式来决定该特征的最佳分裂点,并记录该特征的分裂收益;
iii.选择收益最大的特征作为分裂特征,用该特征的最佳分裂点作为分裂位置,在该节点上分裂出左右两个新的叶节点,并为每个新节点关联对应的样本集
iv.回到第 1 步,递归执行到满足特定条件为止
g.在每一个树模型生成时的梯度下降时,采用单边梯度抽样算法;
在树模型算法的梯度大小可以反应样本的权重,梯度越小说明模型拟合的越好,单边梯度抽样算法利用这一信息对样本进行抽样,减少了大量梯度小的样本,在接下来的计算过程中只需关注梯度高的样本,极大的减少了计算量;
单边梯度抽样算法保留了梯度大的样本,并对梯度小的样本进行随机抽样,为了不改变样本的数据分布,在计算增益时为梯度小的样本引入一个常数进行平衡;
h.最后如果对于特征值,我们采用互斥特征捆绑算法,
由于高维特征往往是稀疏的,而且特征间可能是相互排斥的(如两个特征不同时取非零值),如果两个特征并不完全互斥(如只有一部分情况下是不同时取非零值),可以用互斥率表示互斥程度,
互斥特征捆绑算法指出如果将一些特征进行融合绑定,则可以降低特征数量;
i. 在每一个树模型的生成中,我们采用,逐叶(leaf-wise)策略: 每次分类增益最大的叶子节点,直到达停止条件;
4)在工程实现中, 传统的特征并行算法在于对数据进行垂直划分,然后使用不同机器找到不同特征的最优分裂点,基于通信整合得到最佳划分点,然后基于通信告知其他机器划分结果;
5)最后预测电价数据结果如图3所示。
2.本发明提出的一种基于轻量级梯度提升算法预测电价的系统模型的特征在于,传统的特征并行方法有个很大的缺点:需要告知每台机器最终划分结果,增加了额外的复杂度(因为对数据进行垂直划分,每台机器所含数据不同,划分结果需要通过通信告知),而本发明采用的轻量级梯度提升算法,不进行数据垂直划分,而是采用分散规约的方式将直方图整合的任务分摊到不同机器上,从而降低通信代价,并通过直方图做差进一步降低不同机器间的通信,每台机器都有训练集完整数据,在得到最佳划分方案后可在本地执行划分而减少了不必要的通信。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010386436.4A CN111507777A (zh) | 2020-05-09 | 2020-05-09 | 一种基于轻量级梯度提升算法预测电价的系统模型 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010386436.4A CN111507777A (zh) | 2020-05-09 | 2020-05-09 | 一种基于轻量级梯度提升算法预测电价的系统模型 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111507777A true CN111507777A (zh) | 2020-08-07 |
Family
ID=71878395
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010386436.4A Pending CN111507777A (zh) | 2020-05-09 | 2020-05-09 | 一种基于轻量级梯度提升算法预测电价的系统模型 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111507777A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111967918A (zh) * | 2020-09-01 | 2020-11-20 | 上海积成能源科技有限公司 | 一种基于支持向量回归算法的预测电价的系统模型 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109657977A (zh) * | 2018-12-19 | 2019-04-19 | 重庆誉存大数据科技有限公司 | 一种风险识别方法和系统 |
CN110472778A (zh) * | 2019-07-29 | 2019-11-19 | 上海电力大学 | 一种基于Blending集成学习的短期负荷预测方法 |
CN111008193A (zh) * | 2019-12-03 | 2020-04-14 | 国网天津市电力公司电力科学研究院 | 一种数据清洗与质量评价方法及系统 |
CN111126716A (zh) * | 2020-01-14 | 2020-05-08 | 上海积成能源科技有限公司 | 一种基于极端梯度提升算法预测电价的系统模型 |
-
2020
- 2020-05-09 CN CN202010386436.4A patent/CN111507777A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109657977A (zh) * | 2018-12-19 | 2019-04-19 | 重庆誉存大数据科技有限公司 | 一种风险识别方法和系统 |
CN110472778A (zh) * | 2019-07-29 | 2019-11-19 | 上海电力大学 | 一种基于Blending集成学习的短期负荷预测方法 |
CN111008193A (zh) * | 2019-12-03 | 2020-04-14 | 国网天津市电力公司电力科学研究院 | 一种数据清洗与质量评价方法及系统 |
CN111126716A (zh) * | 2020-01-14 | 2020-05-08 | 上海积成能源科技有限公司 | 一种基于极端梯度提升算法预测电价的系统模型 |
Non-Patent Citations (1)
Title |
---|
覃海滨: "基于数据挖掘技术的销量预测模型的增强算法及比较研究", 中国优秀硕士学位论文全文数据库, 15 March 2020 (2020-03-15), pages 138 - 564 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111967918A (zh) * | 2020-09-01 | 2020-11-20 | 上海积成能源科技有限公司 | 一种基于支持向量回归算法的预测电价的系统模型 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108171379B (zh) | 一种用电负荷预测方法 | |
CN110555989B (zh) | 一种基于Xgboost算法的交通量预测方法 | |
CN109615124B (zh) | 一种基于深度学习的scada主站负荷预测方法 | |
CN109800898A (zh) | 一种智能短期负荷预测方法及系统 | |
CN110188919A (zh) | 一种基于长短期记忆网络的负荷预测方法 | |
CN111523735A (zh) | 一种基于轻量级梯度提升算法预测短期电力负荷的系统模型 | |
CN112085256B (zh) | 考虑负荷跃变的全周期负荷预测方法 | |
CN113554466A (zh) | 一种短期用电量预测模型构建方法、预测方法和装置 | |
CN104865827B (zh) | 一种基于多工况模型的抽油机采油优化方法 | |
CN111008726B (zh) | 一种电力负荷预测中类图片转换方法 | |
CN114792156A (zh) | 基于曲线特征指标聚类的光伏输出功率预测方法和系统 | |
CN111639111A (zh) | 面向调水工程的多源监测数据深度挖掘和智能分析方法 | |
Lin et al. | Approximate mixed-integer programming solution with machine learning technique and linear programming relaxation | |
CN111915079B (zh) | 一种混合knn风电功率预测方法及系统 | |
CN116186548A (zh) | 电力负荷预测模型训练方法及电力负荷预测方法 | |
CN109214610B (zh) | 一种基于长短期记忆神经网络的饱和电力负荷预测方法 | |
CN110059938B (zh) | 一种基于关联规则驱动的配电网规划方法 | |
CN111697560A (zh) | 一种基于lstm预测电力系统负荷的方法及系统 | |
CN107590747A (zh) | 基于综合能源大数据分析的电网资产周转率计算方法 | |
CN116826745B (zh) | 一种电力系统背景下的分层分区短期负荷预测方法及系统 | |
CN111507777A (zh) | 一种基于轻量级梯度提升算法预测电价的系统模型 | |
CN112348236B (zh) | 用于智能用电监测终端的异常日负荷需求预测系统与方法 | |
CN117913808A (zh) | 一种分布式光伏发电预测方法及其装置 | |
CN117407681A (zh) | 一种基于向量聚类的时序数据预测模型建立方法 | |
CN112801415A (zh) | 基于马尔科夫链分布模型的超短期负荷预测方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |