CN115249166A - 出清电价预测方法、装置、计算机设备和存储介质 - Google Patents
出清电价预测方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN115249166A CN115249166A CN202111564491.9A CN202111564491A CN115249166A CN 115249166 A CN115249166 A CN 115249166A CN 202111564491 A CN202111564491 A CN 202111564491A CN 115249166 A CN115249166 A CN 115249166A
- Authority
- CN
- China
- Prior art keywords
- time point
- predicted
- day
- training
- electricity price
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005611 electricity Effects 0.000 title claims abstract description 186
- 238000000034 method Methods 0.000 title claims abstract description 59
- 238000012549 training Methods 0.000 claims abstract description 125
- 238000013145 classification model Methods 0.000 claims abstract description 66
- 238000012545 processing Methods 0.000 claims abstract description 28
- 238000002372 labelling Methods 0.000 claims abstract description 14
- 230000005540 biological transmission Effects 0.000 claims description 13
- 230000009466 transformation Effects 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 7
- 238000012163 sequencing technique Methods 0.000 claims description 5
- 238000012423 maintenance Methods 0.000 claims description 4
- 230000006870 function Effects 0.000 description 18
- 230000008569 process Effects 0.000 description 14
- 238000012795 verification Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 9
- 238000005457 optimization Methods 0.000 description 8
- 238000012216 screening Methods 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- 238000002790 cross-validation Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000013138 pruning Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0283—Price estimation or determination
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Finance (AREA)
- Theoretical Computer Science (AREA)
- Marketing (AREA)
- Accounting & Taxation (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Primary Health Care (AREA)
- Tourism & Hospitality (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请提出一种出清电价预测方法、装置、计算机设备和存储介质,其中,方法包括:对训练日各样本点对应的影响因素进行特征工程,得到训练日各样本点对应的输入特征;根据电价对训练日各样本点进行分类标签化处理,以确定训练日各样本点对应的分类标签;将训练日各样本点对应的输入特征输入到初始XGBOOST分类模型中进行求解训练,得到XGBOOST分类模型;将分类标签为回归标签的样本点对应的输入特征输入初始XGBOOST回归模型中进行求解训练,得到XGBOOST回归模型;利用XGBOOST分类模型和XGBOOST回归模型,对待预测日各时刻点的电价进行预测。该方法通过结合分类模型和回归模型,提高了出清电价的预测准确率。
Description
技术领域
本申请涉及电力现货交易市场领域,尤其涉及一种出清电价预测方法、装置、计算机设备和存储介质。
背景技术
现货市场主要包括日前、日内和实时市场,现货交易的实施开展,需要交易员从数月前的中长期交易开始,直至日前、实时交易,时刻保持对现货市场供需关系的高度敏感及细致分析。出清价格是现货市场供求关系的实际反映,直接影响市场主体的利润,故开展市场出清价格预测对挖掘现货市场深层规律以及市场主体进行交易决策都具有重大意义。
因此,如何提高出清电价的预测准确率是亟待解决的问题。
发明内容
本申请提出一种出清电价预测方法、装置、计算机设备和存储介质。
本申请一方面实施例提出了一种出清电价预测方法,包括:
确定训练日各样本点对应的出清电价的影响因素;
对所述影响因素进行特征工程,得到所述训练日各样本点对应的输入特征;
根据电价对所述训练日各样本点进行分类标签化处理,以确定所述训练日各样本点对应的分类标签;
将所述训练日各样本点对应的输入特征输入到初始极端梯度提升(eXtremeGradient Boosting,XGBOOST)分类模型中进行求解训练,得到XGBOOST分类模型;
将分类标签为回归标签的样本点对应的输入特征输入初始XGBOOST回归模型中进行求解训练,得到XGBOOST回归模型;
利用所述XGBOOST分类模型和所述XGBOOST回归模型,对待预测日各时刻点的电价进行预测。
本申请另一方面实施例提出了一种出清电价预测装置,包括:
第一确定模块,用于确定训练日各样本点对应的出清电价的影响因素;
特征处理模块,用于对所述影响因素进行特征工程,得到所述训练日各样本点对应的输入特征;
第二确定模块,用于根据电价对所述训练日各样本点进行分类标签化处理,以确定所述训练日各样本点对应的分类标签;
第一训练模块,用于将所述训练日各样本点对应的输入特征输入到初始极端梯度提升XGBOOST分类模型中进行求解训练,得到XGBOOST分类模型;
第二训练模块,用于将分类标签为回归标签的样本点对应的输入特征输入初始XGBOOST回归模型中进行求解训练,得到XGBOOST回归模型;
预测模块,用于利用所述XGBOOST分类模型和所述XGBOOST回归模型,对待预测日各时刻点的电价进行预测。
本申请另一方面实施例提出了一种计算机设备,包括处理器和存储器;
其中,所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于实现如上述一方面实施例所述的出清电价预测方法。
本申请另一方面实施例提出了一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述一方面实施例所述的出清电价预测。
本申请另一方面实施例提出了一种计算机程序产品,包括计算机程序,包括计算机程序,所述计算机程序在被处理器执行时实现上述一方面实施例所述方法的步骤。
本申请实施例的出清电价预测方法、装置、计算机设备和存储介质,通过对训练日各样本点进行分类标签化处理,并利用具有分类标签的各样本点训练得到XGBOOST分类模型,利用分类标签为回归标签的样本点训练得到XGBOOST回归模型,利用XGBOOST分类模型和XGBOOST回归模型对待预测日各时刻点的出清电价进行预测,提高了出清电价的预测准确率。
本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本申请实施例提供的一种出清电价预测方法的流程示意图;
图2为本申请实施例提供的另一种出清电价预测方法的流程示意图;
图3为本申请实施例提供的一种出清电价预测方法过程示意图;
图4为本申请实施例提供的一种XGBOOST分类模型的训练和预测过程示意图;
图5为本申请实施例提供的一种XGBOOST回归模型的训练和预测过程示意图;
图6为本申请实施例提供的一种电力现货市场出清电价预测方法还原预测电价过程示意图;
图7为本申请实施例提供的一种出清电价预测装置的结构示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。
下面参考附图描述本申请实施例的出清电价预测方法、装置、计算机设备和存储介质。
图1为本申请实施例提供的一种出清电价预测方法的流程示意图。
本申请实施例提出的出清电价预测方法,可以由本申请实施例提供的出清电价预测装置执行,该装置可以配置于计算机设备中,通过对训练日各样本点进行分类标签化处理,并利用具有分类标签的各样本点训练得到XGBOOST分类模型,利用分类标签为回归标签的样本点训练得到XGBOOST回归模型,利用XGBOOST分类模型和XGBOOST回归模型对待预测日各时刻点的出清电价进行预测,提高了出清电价的预测准确率。
如图1所示,该出清电价预测方法包括:
步骤101,确定训练日各样本点对应的出清电价的影响因素。
本申请中,可以基于现货交易市场披露信息,确定出训练日各样本点对应的出清电价的影响因素。其中,出清电价的影响因素可以包括但不限于:全网用电负荷、新能源负荷、省间线路负荷、输变电检修计划、历史时刻点出清电价等。另外,这里的省间线路负荷可以是指联络线或西电东送等的省间线路负荷。
需要说明的是,不同的行政区域对应的出清电价的影响因素可能不同。比如A省的出清电价的影响因素包括全网用电负荷、新能源负荷、省间线路负荷、输变电检修计划和历史时刻点出清电价,B省的出清电价的影响因素除包括全网用电负荷、新能源负荷、省间线路负荷、输变电检修计划和历史时刻点出清电价外,还包括运行机组容量、检修机组总容量等。
本申请中,训练日可以是多个,每个训练日具有多个样本点,一个时刻点对应一个样本点。比如,将训练日划分为96个时刻点,那么训练日具有96个样本点,若将训练日划分为24个时刻点,那么训练日具有24个样本点。
步骤102,对影响因素进行特征工程,得到训练日各样本点对应的输入特征。
本申请中,出清电价的影响因素包括结构化的影响因素和非结构化的影响因素,对于非结构化的影响因素可以进行编码处理,对于结构化的影响因素可以进行预处理,比如进行数据清洗等。
在编码时,可以采用one-hot编码,可以针对输变电检修计划进行离散编码。具体地,可以根据每天市场披露数据,每新增一条输变电线路,输入数据将新增一维特征,根据样本日期及时刻点进行一一对应,若在任一时刻点每新增一条输变电线路的情况下,确定任一时刻点对应的输入特征新增一维特征。可见,本申请中所用特征是一个动态变化的数据,根据样本所选日期不同,特征数量及特征都会随之改变。
比如,某训练日的某个时刻点某条输变电无检修计划,则可以编码为0,反之,可以编码为1。
本申请中,特征工程包括:可以基于负荷需求及新能源负荷的供需情况,确定每个样本点对应的第一竞价空间特征,并根据不同联络线,确定每个样本点对应的每条联络线上的第二竞价空间特征,及确定月份、日期及时刻点的类型特征,以得到每个样本点对应的输入特征。
在确定月份、日期及时刻点的类型特征时,比如,月份可以编码为1-12,分别对应每年1-12月,日期类型可以编码为0-6,分别对应周一至周日,可以根据不同省份发售电测的不同,时刻点类型可以编码为1-96或1-24。
步骤103,根据电价对训练日各样本点进行分类标签化处理,以确定训练日各样本点对应的分类标签。
本申请中,可以根据每个样本点对应的历史出清电价,是否为特殊电价分类标签化处理,以确定训练日各样本点对应的分类标签。在实现时,若某样本点的历史出清电价为特殊电价,可以确定该样本点对应的标签为非回归标签,若该样本点的历史出清电价不是特殊电价,可以确定该样本点对应的标签为回归标签。其中,特殊电价可以是0价、封顶价、最低价等。
比如,某样本点对应的历史出清电价为特殊电价,该样本点对应的标签可以为0,若样本点对应的历史出清电价不是特殊电价,该样本点对应的标签可以为1。
需要说明的是,上述回归标签用1表示,非回归标签用0表示仅是示例,具体可以根据实际需要设置,本申请对此不作限定。
步骤104,将训练日各样本点对应的输入特征输入到初始XGBOOST分类模型中进行求解训练,得到XGBOOST分类模型。
本申请中,在确定训练日各样本点对应的分类标签后,可以利用具有分类标签的各样本点对初始XGBOOST分类模型进行训练,得到最终的XGBOOST分类模型。
在实现时,可以将训练日每个样本点对应的输入特征输入到初始XGBOOST分类模型中,采用贪心算法进行求解训练及采用逐步寻优和五折交叉验证进行参数寻优,得到XGBOOST分类模型。
步骤105,将分类标签为回归标签的样本点对应的输入特征输入初始XGBOOST回归模型中进行求解训练,得到XGBOOST回归模型。
本申请中,在确定训练日各样本点对应的分类标签后,可以利用分类标签为回归标签的样本点对初始XGBOOST回归模型进行训练,得到最终的XGBOOST回归模型。
在实现时,可以将分类标签为回归标签的样本点对应的输入特征输入到初始XGBOOST回归模型中,采用贪心算法进行求解训练及采用逐步寻优和五折交叉验证进行参数寻优,得到XGBOOST回归模型。
本申请中,XGBOOST分类模型和XGBOOST回归模型的求解训练过程可以自动进行特征筛选,特征筛选的结果将影响最终训练得到的XGBOOST最优参数及模型本身树结构。XGBOOST模型求解过程中,每一步可以将选择出对目标损失下降最快的特征,从而具有自动特征筛选的功能。XGBOOST的基模型选择树模型,求解XGBOOST可分解为对若干树模型的求解,最后将所有基模型进行求和。具体地,假设树个数为k,XGBOOST模型即为:
假设通过披露数据预处理及特征工程后,有n个样本(一个样本点作为一个样本),m个特征,则:
D={(xi,yi)}(|D|=n,xi∈Rm,yi∈R)
其中,xi表示第i个样本输入特征,yi表示第i个电价类别标签或电价,分类或回归树(CART树)的空间F为:
F={f(x)=wq(x)}(q:Rm→T,w∈RT)
其中,q代表每棵树的结构,将样本映射到对应的叶节点;T是对应树的叶节点个数;f(x)对应树的结构q和叶节点权重w。所以XGBOOST的预测值是每棵树对应叶节点值的和。
目标是学习这k个树,所以最小化下面这个带正则项的目标函数(损失函数):
上式的第一项是损失误差,如均方误差(MSE)和logistic等,第二项是正则项,控制树的复杂度,以防止过拟合。上述目标函数的优化参数是模型,不能使用传统的优化方法在欧氏空间优化,但模型在训练时,是一种加法的方式,所以在第t轮,将加入模型,最小化下面的目标函数:
下面以求解第t个基模型为例,说明XGBOOST的求解过程,在第t轮,目标函数为:
接下来将目标函数进行泰勒展开,取前三项,移除高阶小无穷小项,最后目标函数转化为:
最终将关于树模型的迭代转化为关于树叶子节点的迭代,并求出最优的叶节点分数。将叶节点的最优值带入目标函数,最终目标函数的形式为:
上式可作为得分函数用来测量树结构的质量,类似于决策树的不纯度得分,只是其通过更广泛的目标函数得到。通过上式,当树结构确定时,树的结构得分只与其一阶倒数和二阶倒数有关,得分越小,说明结构越好。
通常情况下,无法枚举所有可能的树结构然后选取最优的,所以选择用一种贪婪算法来代替:从单个叶节点开始,迭代分裂来给树添加节点。节点切分后的损失函数为:
上式括号中各项分别代表左子树分数、右子树分数、不分割时的节点分数,γ代表加入新叶节点引入的复杂度代价,用来评估切分后的损失函数,目标是寻找一个特征及对应的值,使得切分后的损失下降最大。其中,γ除了控制树的复杂度,另一个作用是作为阈值,只有当分裂后的增益大于γ时,才选择分裂,起到了预剪枝的作用。
不断枚举不同树的结构,利用打分函数来寻找出一个最优结构的树,接着加入到模型中,不断重复此操作。这个寻找的过程使用的即是贪心算法。选择一个特征分裂,计算损失函数最小值,然后再选一个特征分裂,又得到一个损失最小值,枚举完后找一个效果最好的,对树进行分裂,这个过程即是求解树模型又能筛选出使得损失下降最大的特征,得到特征重要性。
步骤106,利用XGBOOST分类模型和XGBOOST回归模型,对待预测日各时刻点的电价进行预测。
本申请中,可以先利用XGBOOST分类模型,对待预测日每个时刻点的电价类别标签进行预测,以预测每个时刻点的电价类别标签是回归标签还是非回归标签,即预测电价类型是特殊电价还是非特殊电价。若预测某时刻点的标签为回归标签,说该时刻点的预测电价为非特殊电价,可以进一步通过XGBOOST回归模型进行预测。若预测某时刻点的标签为非回归标签,说明该时刻点的预测电价为特殊电价。
本申请实施例中,通过确定训练日各样本点对应的出清电价的影响因素;对影响因素进行特征工程,得到训练日各样本点对应的输入特征;根据电价对训练日各样本点进行分类标签化处理,以确定训练日各样本点对应的分类标签;将训练日各样本点对应的输入特征输入到初始极端梯度提升XGBOOST分类模型中进行求解训练,得到XGBOOST分类模型;将分类标签为回归标签的样本点对应的输入特征输入初始XGBOOST回归模型中进行求解训练,得到XGBOOST回归模型;利用XGBOOST分类模型和XGBOOST回归模型,对待预测日各时刻点的电价进行预测。由此,通过结合XGBOOST分类模型和XGBOOST回归模型预测电价,不仅提高了出清电价的预测准确率,而且适用于特殊出清市场和平稳市场环境,适用范围广。
图2为本申请实施例提供的另一种出清电价预测方法的流程示意图。
如图2所示,该出清电价预测方法,包括:
步骤201,确定训练日各样本点对应的出清电价的影响因素。
步骤202,对影响因素进行特征工程,得到训练日各样本点对应的输入特征。
步骤203,根据电价对训练日各样本点进行分类标签化处理,以确定训练日各样本点对应的分类标签。
步骤204,将训练日各样本点对应的输入特征输入到初始XGBOOST分类模型中进行求解训练,得到XGBOOST分类模型。
步骤205,将分类标签为回归标签的样本点对应的输入特征输入初始XGBOOST回归模型中进行求解训练,得到XGBOOST回归模型。
本申请中,步骤201-步骤205与上述步骤101-步骤105类似,故在此不再赘述。
步骤206,对待预测日期各时刻点的数据信息进行特征处理,以获取待预测日每个时刻点对应的输入特征。
其中,数据信息可以是指数据披露信息。本申请中,可以对待预测日每个时刻点的数据披露信息进行特征处理,以获取待预测日每个时刻点对应的输入特征。这里获取待预测日每个时刻点对应的输入特征的方法,与获取训练日每个样本点对应的输入特征的方法类似,故在此不再赘述。
步骤207,将待预测日每个时刻点对应的输入特征输入至XGBOOST分类模型中,以获取待预测日每个时刻点对应的电价类别标签。
本申请中,可以将待预测日每个时刻点对应的输入特征输入至XGBOOST分类模型中,通过XGBOOST分类模型对待预测日每个时刻点的输入特征输进行处理,以获取待预测日每个时刻点对应的电价类别标签。其中,电价类别标签包括回归标签和非回归标签,比如,回归标签为1代表非特殊电价,非回归标签为0代表特殊电价。
步骤208,在第一时刻点的电价类别标签为非回归标签的情况下,根据非回归标签,确定第一时刻点对应的预测电价。
本申请中,若第一时刻点的电价类别标签为非回归标签,说明第一时刻点的预测电价为特殊电价,那么可以根据非回归标签,确定第一时刻点对应的预测电价。
步骤209,在第二时刻点的电价类别标签为回归标签的情况下,将第二时刻点对应的输入特征输入至XGBOOST回归模型中,以获取第二时刻点对应的预测电价。
在第二时刻点的电价类别标签为回归标签的情况下,说明第二时刻点电价为非特殊电价,可以将第二时刻点对应的输入特征输入至XGBOOST回归模型中,以通过XGBOOST回归模型对第二时刻点的电价进行预测,以获取第二时刻点对应的预测电价。
比如,回归标签用1表示,非回归标签用0表示,可以将电价分类标签为1的时刻点的输入特征输入至XGBOOST回归模型中,以获取这些时刻点的预测电价。
步骤210,按照待预测日期各时刻点的早晚顺序,对第一时刻点对应的预测电价和第二时刻点对应的预测电价进行排序,得到预测日各时刻点连续预测电价。
在实际应用中,可能待预测日某些时刻点的预测电价为特殊电价,某些时刻点的预测电价为非特殊电价。为了便于查看,本申请中,可以按照待预测日各时刻点的早晚顺序,对第一时刻点对应的预测电价和第二时刻点对应的预测电价进行排序,从而可以得到预测日各时刻点连续预测电价。
比如,回归标签用1表示,非回归标签为0,对待预测日96个时刻点的电价进行预测,将分类预测结果为0的时刻点、分类预测结果为1的时刻点通过回归预测得到的预测电价,按照时刻点一一对应并排序,分别还原为标签0对应的特殊电价、连续电价,并进行排列组合,得到预测日96时刻点的连续预测电价。
进一步地,也可以将待预测日各时刻点作为横坐标,预测电价为纵坐标,根据第一时刻点对应的预测电价和第二时刻点对应的预测电价,生成待预测日对应的预测电价曲线图。
本申请实施例中,在利用XGBOOST分类模型和XGBOOST回归模型,对待预测日各时刻点的电价进行预测时,可以将待预测日每个时刻点对应的输入特征输入至XGBOOST分类模型中,以获取待预测日每个时刻点对应的电价类别标签,对于电价类别标签为回归标签的时刻点,可以进一步利用XGBOOST回归模型进行电价预测,提高了出清电价的预测准确率。
为了便于理解,下面结合图3对本申请实施例的出清电价预测方法进行说明,图3为本申请实施例提供的一种出清电价预测方法过程示意图。
如图3所示,先导入现货市场披露文件,之后对披露文件进行解析,提取对训练日每个样本点的出清电价有影响的影响因素,并利用one-hot编码等数据预处理,并进行特征工程,得到训练日每个样本点对应的输入特征。之后,根据电价对训练日各样本点进行分类标签化处理。若样本点的出清电价为特殊电价,添加标签0,若样本点的出清电价为非特殊电价,添加标签1。
在对训练日样本点进行标签化处理之后,利用训练日各样本点,即利用标签为0和标签为1的样本点,对XGBOOST分类模型进行训练,并利用标签为1的样本点对XGBOOST回归模型进行训练。在得到XGBOOST分类模型和XGBOOST预测模型后,利用XGBOOST分类模型进行预测,判断预测标签是否为0。如果待预测日某时刻点的预测标签为0,说明该时刻点的预测电价为特殊电价。如果预测标签不为0,即预测标签为1,说明该时刻点的预测电价不是非特殊电价,可以进一步利用XGBOOST回归模型进行电价回归预测,得到该时刻点的预测电价。之后,对于电价分类标签为0的样本点,可以将电价分类标签还原为特殊电价,并结合回归模型预测得到的预测电价,与预测日披露特征进行组合,并进行电价预测值输出。
为了便于理解,下面结合图4对XGBOOST分类模型的训练和预测进行说明,图4为本申请实施例提供的一种XGBOOST分类模型的训练和预测过程示意图。
如图4所示,设置XGBOOST分类寻优参数范围,利用训练集标签为0的和训练及标签为1的样本点对XGBOOST分类模型求解。其中,可以对所有训练集标签化,得到标签为0的训练集和标签为1的训练集,并将标签化的训练集分为两部分,4/5的训练集用于XGBOOST分类模型求解,将剩余1/5训练集作验证集。
在求解出XGBOOST分类模型后,分别将标签为0的验证集和标签为1的验证集输入XGBOOST分类模型进行预测,以获取验证集每个样本对应的预测结果。之后,计算每套参数情况下,5个验证集上的平均准确率,并输出验证集上平均准确率最高的参数组合,根据平均准确率最高的参数组合,得到最优XGBOOST分类模型。
在获取最优XGBOOST分类模型后,可以用于预测某天各时刻点的出清电价。在实现时,可以对预测日披露数据进行特征处理,得到预测日各时刻点对应的输入特征。之后,将各时刻点对应的输入特征分别输入最优XGBOOST分类模型,以获取预测日电价标签预测值。
为了便于理解,下面结合图5对XGBOOST回归模型的训练和预测进行说明,图5为本申请实施例提供的一种XGBOOST回归模型的训练和预测过程示意图。
如图5所示,设置XGBOOST回归寻优参数范围,利用训练集标签为0的和训练及标签为1的样本点对XGBOOST回归模型求解。其中,可以对所有训练集标签化,得到标签为0的训练集和标签为1的训练集,并将标签为1的训练集分为两部分,4/5的训练集用于XGBOOST回归模型求解,将剩余1/5训练集作验证集。
在求解出XGBOOST回归模型后,将标签为1的验证集输入XGBOOST回归模型进行预测,以获取验证集每个样本对应的预测结果。之后,计算每套参数情况下,5个验证集上的平均准确率,并输出验证集上平均准确率最高的参数组合,根据平均准确率最高的参数组合,得到最优XGBOOST回归模型。
在获取最优XGBOOST回归模型后,可以用于预测某天电价预测标签为1的时刻点的出清电价。在实现时,可以对预测日XGBOOST分类模型预测电价标签为1的时刻点的披露数据进行特征处理,得到该时刻点对应的输入特征。之后,将该时刻点对应的输入特征输入最优XGBOOST回归模型,以获取预测日时刻点标签为1的预测电价。
为了便于理解,下面结合图6对还原预测电价过程进行说明,图6为本申请实施例提供的一种电力现货市场出清电价预测方法还原预测电价过程示意图。
如图6所示,对于XGBOOST分类模型预测结果为0的时刻点,将预测结果还原为特殊电价,0价、封顶价或其他,并将还原后的电价与该时刻点的输入特征进行组合,得到包含日期、时刻点、还原电价一一对应的矩阵。
对于XGBOOST分类模型预测结果为1的时刻点,将XGBOOST回归模型预测的电价与该时刻点的输入特征进行组合,得到包含日期、时刻点、还原电价一一对应的矩阵。
之后,根据日期、时刻点组合矩阵,并按照各时刻点的早晚顺序进行排序,得到最终预测日的预测电价。
为了实现上述实施例,本申请实施例还提出一种出清电价预测装置。图7为本申请实施例提供的一种出清电价预测装置的结构示意图。
如图7所示,该出清电价预测装置700包括:
第一确定模块710,用于确定训练日各样本点对应的出清电价的影响因素;
特征处理模块720,用于对所述影响因素进行特征工程,得到所述训练日各样本点对应的输入特征;
第二确定模块730,用于根据电价对所述训练日各样本点进行分类标签化处理,以确定所述训练日各样本点对应的分类标签;
第一训练模块740,用于将所述训练日各样本点对应的输入特征输入到初始极端梯度提升XGBOOST分类模型中进行求解训练,得到XGBOOST分类模型;
第二训练模块750,用于将分类标签为回归标签的样本点对应的输入特征输入初始XGBOOST回归模型中进行求解训练,得到XGBOOST回归模型;
预测模块760,用于利用所述XGBOOST分类模型和所述XGBOOST回归模型,对待预测日各时刻点的电价进行预测。
在本申请实施例一种可能的实现方式中,所述预测模块760,用于:
对所述待预测日期各时刻点的数据信息进行特征处理,以获取所述待预测日每个时刻点对应的输入特征;
将所述待预测日每个时刻点对应的输入特征输入至所述XGBOOST分类模型中,以获取所述待预测日每个时刻点对应的电价类别标签;
在第一时刻点的电价类别标签为非回归标签的情况下,根据所述非回归标签,确定所述第一时刻点对应的预测电价;
在第二时刻点的电价类别标签为所述回归标签的情况下,将所述第二时刻点对应的输入特征输入至所述XGBOOST回归模型中,以获取所述第二时刻点对应的预测电价;
按照所述待预测日期各时刻点的早晚顺序,对所述第一时刻点对应的预测电价和所述第二时刻点对应的预测电价进行排序,得到所述预测日各时刻点连续预测电价。
在本申请实施例一种可能的实现方式中,特征处理模块720,用于:
在任一时刻点每新增一条输变电线路的情况下,确定所述任一时刻点对应的输入特征新增一维特征。
在本申请实施例一种可能的实现方式中,特征处理模块720,用于:
基于负荷需求及新能源负荷的供需情况,确定每个样本点对应的第一竞价空间特征;
根据不同联络线,确定每个样本点对应的每条联络线上的第二竞价空间特征;
确定月份、日期及时刻点的类型特征,以得到每个样本点对应的输入特征。
在本申请实施例一种可能的实现方式中,所述影响因素包括:全网用电负荷、新能源负荷、省间线路负荷、输变电检修计划、历史时刻点出清电价。
需要说明的是,上述对出清电价预测方法实施例的解释说明,也适用于该实施例的出清电价预测装置,故在此不再赘述。
本申请实施例中,通过对训练日各样本点进行分类标签化处理,并利用具有分类标签的各样本点训练得到XGBOOST分类模型,利用分类标签为回归标签的样本点训练得到XGBOOST回归模型,利用XGBOOST分类模型和XGBOOST回归模型对待预测日各时刻点的出清电价进行预测,提高了出清电价的预测准确率。
为了实现上述实施例,本申请实施例还提出一种计算机设备,包括处理器和存储器;
其中,处理器通过读取存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于实现如上述实施例所述的出清电价预测方法。
为了实现上述实施例,本申请实施例还提出一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述实施例所述的出清电价预测方法。
为了实现上述实施例,本申请实施例还提出一种计算机程序产品,包括计算机程序,包括计算机程序,所述计算机程序在被处理器执行时实现上述实施例所述的出清电价预测方法的步骤。
在本说明书的描述中,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (10)
1.一种出清电价预测方法,其特征在于,包括:
确定训练日各样本点对应的出清电价的影响因素;
对所述影响因素进行特征工程,得到所述训练日各样本点对应的输入特征;
根据电价对所述训练日各样本点进行分类标签化处理,以确定所述训练日各样本点对应的分类标签;
将所述训练日各样本点对应的输入特征输入到初始极端梯度提升XGBOOST分类模型中进行求解训练,得到XGBOOST分类模型;
将分类标签为回归标签的样本点对应的输入特征输入初始XGBOOST回归模型中进行求解训练,得到XGBOOST回归模型;
利用所述XGBOOST分类模型和所述XGBOOST回归模型,对待预测日各时刻点的电价进行预测。
2.如权利要求1所述的方法,其特征在于,所述利用所述XGBOOST分类模型和所述XGBOOST回归模型,对待预测日各时刻点的电价进行预测,包括:
对所述待预测日期各时刻点的数据信息进行特征处理,以获取所述待预测日每个时刻点对应的输入特征;
将所述待预测日每个时刻点对应的输入特征输入至所述XGBOOST分类模型中,以获取所述待预测日每个时刻点对应的电价类别标签;
在第一时刻点的电价类别标签为非回归标签的情况下,根据所述非回归标签,确定所述第一时刻点对应的预测电价;
在第二时刻点的电价类别标签为所述回归标签的情况下,将所述第二时刻点对应的输入特征输入至所述XGBOOST回归模型中,以获取所述第二时刻点对应的预测电价;
按照所述待预测日期各时刻点的早晚顺序,对所述第一时刻点对应的预测电价和所述第二时刻点对应的预测电价进行排序,得到所述预测日各时刻点连续预测电价。
3.根据权利要求1所述的方法,其特征在于,所述对所述影响因素进行特征工程,得到所述训练日各样本点对应的输入特征,包括:
在任一时刻点每新增一条输变电线路的情况下,确定所述任一时刻点对应的输入特征新增一维特征。
4.如权利要求1所述的方法,其特征在于,所述对所述影响因素进行特征工程,得到所述训练日各样本点对应的输入特征,包括:
基于负荷需求及新能源负荷的供需情况,确定每个样本点对应的第一竞价空间特征;
根据不同联络线,确定每个样本点对应的每条联络线上的第二竞价空间特征;
确定月份、日期及时刻点的类型特征,以得到每个样本点对应的输入特征。
5.根据权利要求1-4任一所述的方法,其特征在于,所述影响因素包括:全网用电负荷、新能源负荷、省间线路负荷、输变电检修计划、历史时刻点出清电价。
6.一种出清电价预测装置,其特征在于,包括:
第一确定模块,用于确定训练日各样本点对应的出清电价的影响因素;
特征处理模块,用于对所述影响因素进行特征工程,得到所述训练日各样本点对应的输入特征;
第二确定模块,用于根据电价对所述训练日各样本点进行分类标签化处理,以确定所述训练日各样本点对应的分类标签;
第一训练模块,用于将所述训练日各样本点对应的输入特征输入到初始极端梯度提升XGBOOST分类模型中进行求解训练,得到XGBOOST分类模型;
第二训练模块,用于将分类标签为回归标签的样本点对应的输入特征输入初始XGBOOST回归模型中进行求解训练,得到XGBOOST回归模型;
预测模块,用于利用所述XGBOOST分类模型和所述XGBOOST回归模型,对待预测日各时刻点的电价进行预测。
7.如权利要求6所述的装置,其特征在于,所述预测模块,用于:
对所述待预测日期各时刻点的数据信息进行特征处理,以获取所述待预测日每个时刻点对应的输入特征;
将所述待预测日每个时刻点对应的输入特征输入至所述XGBOOST分类模型中,以获取所述待预测日每个时刻点对应的电价类别标签;
在第一时刻点的电价类别标签为非回归标签的情况下,根据所述非回归标签,确定所述第一时刻点对应的预测电价;
在第二时刻点的电价类别标签为所述回归标签的情况下,将所述第二时刻点对应的输入特征输入至所述XGBOOST回归模型中,以获取所述第二时刻点对应的预测电价;
按照所述待预测日期各时刻点的早晚顺序,对所述第一时刻点对应的预测电价和所述第二时刻点对应的预测电价进行排序,得到所述预测日各时刻点连续预测电价。
8.如权利要求6所述的装置,其特征在于,所述特征处理模块,用于:
在任一时刻点每新增一条输变电线路的情况下,确定所述任一时刻点对应的输入特征新增一维特征。
9.一种计算机设备,其特征在于,包括处理器和存储器;
其中,所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于实现如权利要求1-5中任一所述的出清电价预测方法。
10.一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-5中任一所述的出清电价预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111564491.9A CN115249166B (zh) | 2021-12-20 | 2021-12-20 | 出清电价预测方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111564491.9A CN115249166B (zh) | 2021-12-20 | 2021-12-20 | 出清电价预测方法、装置、计算机设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115249166A true CN115249166A (zh) | 2022-10-28 |
CN115249166B CN115249166B (zh) | 2023-05-05 |
Family
ID=83698105
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111564491.9A Active CN115249166B (zh) | 2021-12-20 | 2021-12-20 | 出清电价预测方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115249166B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2018101531A4 (en) * | 2018-10-14 | 2018-11-15 | Chang, Zhihan Mr | Stock forecast model based on text news by random forest |
CN110322074A (zh) * | 2019-07-09 | 2019-10-11 | 北京华电天仁电力控制技术有限公司 | 一种考虑电力供求关系的短期电价预测方法和系统 |
CN111027779A (zh) * | 2019-12-19 | 2020-04-17 | 上海积成能源科技有限公司 | 一种储能项目自充自用综合电价模拟预测方法 |
CN111191814A (zh) * | 2019-11-22 | 2020-05-22 | 储长青 | 一种电价预测方法、系统和计算机可读存储介质 |
US20200202436A1 (en) * | 2019-03-05 | 2020-06-25 | Dhruv Siddharth KRISHNAN | Method and system using machine learning for prediction of stocks and/or other market instruments price volatility, movements and future pricing by applying random forest based techniques |
CN112232886A (zh) * | 2020-10-30 | 2021-01-15 | 南方电网能源发展研究院有限责任公司 | 一种电价概率预测方法、系统、计算机设备和存储介质 |
CN112308335A (zh) * | 2020-11-12 | 2021-02-02 | 南方电网能源发展研究院有限责任公司 | 一种基于xgboost算法的短期电价预测方法及装置 |
JP2021036411A (ja) * | 2019-08-22 | 2021-03-04 | Eneos株式会社 | 電力価格予測装置、電力価格予測方法、電力価格予測プログラム、及びコンピュータ読取可能な記録媒体 |
CN112766298A (zh) * | 2020-08-20 | 2021-05-07 | 同济大学 | 基于XGBoost回归的技术成果定价评估方法 |
-
2021
- 2021-12-20 CN CN202111564491.9A patent/CN115249166B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2018101531A4 (en) * | 2018-10-14 | 2018-11-15 | Chang, Zhihan Mr | Stock forecast model based on text news by random forest |
US20200202436A1 (en) * | 2019-03-05 | 2020-06-25 | Dhruv Siddharth KRISHNAN | Method and system using machine learning for prediction of stocks and/or other market instruments price volatility, movements and future pricing by applying random forest based techniques |
CN110322074A (zh) * | 2019-07-09 | 2019-10-11 | 北京华电天仁电力控制技术有限公司 | 一种考虑电力供求关系的短期电价预测方法和系统 |
JP2021036411A (ja) * | 2019-08-22 | 2021-03-04 | Eneos株式会社 | 電力価格予測装置、電力価格予測方法、電力価格予測プログラム、及びコンピュータ読取可能な記録媒体 |
CN111191814A (zh) * | 2019-11-22 | 2020-05-22 | 储长青 | 一种电价预测方法、系统和计算机可读存储介质 |
CN111027779A (zh) * | 2019-12-19 | 2020-04-17 | 上海积成能源科技有限公司 | 一种储能项目自充自用综合电价模拟预测方法 |
CN112766298A (zh) * | 2020-08-20 | 2021-05-07 | 同济大学 | 基于XGBoost回归的技术成果定价评估方法 |
CN112232886A (zh) * | 2020-10-30 | 2021-01-15 | 南方电网能源发展研究院有限责任公司 | 一种电价概率预测方法、系统、计算机设备和存储介质 |
CN112308335A (zh) * | 2020-11-12 | 2021-02-02 | 南方电网能源发展研究院有限责任公司 | 一种基于xgboost算法的短期电价预测方法及装置 |
Non-Patent Citations (2)
Title |
---|
RAHUL KUMAR AGRAWAL ET AL: ""Ensemble of relevance vector machines and boosted trees for electricity"", 《APPLIED ENERGY》 * |
王 翔: ""基于标签分布学习森林的电价概率预测"", 《计算机时代》 * |
Also Published As
Publication number | Publication date |
---|---|
CN115249166B (zh) | 2023-05-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Guo et al. | A multivariate intelligent decision-making model for retail sales forecasting | |
Chang et al. | Integrating a piecewise linear representation method and a neural network model for stock trading points prediction | |
Zhao et al. | Using a grey model optimized by differential evolution algorithm to forecast the per capita annual net income of rural households in China | |
Hsu | Using improved grey forecasting models to forecast the output of opto-electronics industry | |
Lee et al. | A multiagent approach to $ q $-learning for daily stock trading | |
Serguieva et al. | Fuzzy interval methods in investment risk appraisal | |
CN112734135B (zh) | 一种电力负荷预测方法、智能终端及计算机可读存储介质 | |
Hong et al. | Locational marginal price forecasting using deep learning network optimized by mapping-based genetic algorithm | |
CN110689190A (zh) | 一种电网负荷预测方法、装置及相关设备 | |
CN110751411A (zh) | 一种面向云制造任务的制造资源匹配方法 | |
CN117787569B (zh) | 一种智能辅助评标方法及系统 | |
CN111680452A (zh) | 基于全要素数据挖掘的电网工程精准投资决策仿真方法 | |
CN112990587A (zh) | 一种对台区用电进行精准预测的方法及系统、设备、介质 | |
CN116452121A (zh) | 一种智能企业库存管理系统及管理平台 | |
CN110796296A (zh) | 多目标投资优化模型的构建方法、装置和计算设备 | |
CN112990584A (zh) | 一种基于深度强化学习的自动生产决策系统及方法 | |
CN116628534A (zh) | 基于电力大数据的园区用能动态画像划分方法 | |
CN115249166B (zh) | 出清电价预测方法、装置、计算机设备和存储介质 | |
CN114971688A (zh) | 一种基于组合模型的供应链生产预测方法 | |
CN114372835A (zh) | 综合能源服务潜力客户识别方法、系统及计算机设备 | |
CN113743994A (zh) | 一种供应商的旺季预测方法、系统、设备及存储介质 | |
Er et al. | Visualization Analysis of Stock Data and Intelligent Time Series Stock Price Prediction Based on Extreme Gradient Boosting | |
CN118449140B (zh) | 一种风光储多目标电源选址定容预测系统及方法 | |
CN116703301B (zh) | 一种基于多个回收仓库信息二氧化锆废料管控方法 | |
Chung et al. | New Product Demand Forecasting Using Hybrid Machine Learning: A Combined Model of K-Means, Ann, and Qrnn |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |