CN112232886B - 一种电价概率预测方法、系统、计算机设备和存储介质 - Google Patents
一种电价概率预测方法、系统、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN112232886B CN112232886B CN202011200533.6A CN202011200533A CN112232886B CN 112232886 B CN112232886 B CN 112232886B CN 202011200533 A CN202011200533 A CN 202011200533A CN 112232886 B CN112232886 B CN 112232886B
- Authority
- CN
- China
- Prior art keywords
- electricity price
- prediction
- data
- prediction data
- error
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005611 electricity Effects 0.000 title claims abstract description 276
- 238000000034 method Methods 0.000 title claims abstract description 53
- 238000012549 training Methods 0.000 claims abstract description 33
- 238000009826 distribution Methods 0.000 claims abstract description 23
- 238000004458 analytical method Methods 0.000 claims abstract description 22
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 19
- 238000004590 computer program Methods 0.000 claims description 15
- 238000012937 correction Methods 0.000 claims description 4
- 238000012502 risk assessment Methods 0.000 abstract description 13
- 238000011156 evaluation Methods 0.000 abstract description 3
- 238000007621 cluster analysis Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 238000010276 construction Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 2
- 238000010187 selection method Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000008602 contraction Effects 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000010248 power generation Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0206—Price or cost determination based on market factors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- Development Economics (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Finance (AREA)
- Entrepreneurship & Innovation (AREA)
- Accounting & Taxation (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Game Theory and Decision Science (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Tourism & Hospitality (AREA)
- Health & Medical Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Educational Administration (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种电价概率预测方法、系统、计算机设备和存储介质,所述方法包括:根据训练时段电价数据,采用预测模型预测得到第一电价预测数据;根据所述第一电价预测数据,采用分布模型拟合得到第一电价预测数据的误差特征;采用聚类算法将所述第一电价预测数据的误差特征聚类分析,得到第一电价预测数据的中心特征;根据目标时段电价数据,采用预测模型预测得到第二电价预测数据;根据所述第一电价预测数据的中心特征修正所述第二电价预测数据,得到目标时段的电价概率预测数据。本发明实施例既保证电价预测的科学准确和误差概率的分析精度,又兼顾预测结果用于风险分析的可行性,对发电商的定价决策和风险评估有重大意义。
Description
技术领域
本发明涉及电网电价预测领域,特别是涉及一种基于误差聚类的电价概率预测方法、系统、计算机设备和存储介质。
背景技术
目前,国家发展改革委、国家能源局确定的第一批8个电力现货市场建设试点全部进入试运行阶段,我国电力市场建设取得又一重要突破。随着电力行业市场化竞争程度逐步加深,基于节点电价理论的电力批发市场结算将随着市场条件的不同而发生变化,电价的波动性也会日益明显,如何进行科学准确的电价预测并能给出合理有效的风险评估对于市场主体来说显得十分重要。
国内外已有的电价预测研究成果主要集中在价格确定性的预测,极少涉及到其不确定性或风险性研究,其主要原因如下:一方面,周期性社会活动难以建模,容易引入电价预测误差,且总体上考虑误差并不能体现不同时段电价误差的特性;另一方面,预测得到的电价数据会应用于风险评估等大规模的优化问题上,考虑过多的风险场景会引入大量风险分析的工作量。在实际应用上,如果提供的电价预测方法只能保证电价预测的相对准确性,且只进行较简单的误差分析,而不能兼顾误差概率的分析精度和预测结果用于风险分析的可行性,其难以直接用于发电商的定价决策和风险评估。然而,发电商参与批发市场的报价策略往往基于对未来电价的预估,并希望通过其预测误差大小的不同可能性来评估决策风险。因此,引入科学可行的误差分布电价概率预测对于发电侧主体具有重要意义。
发明内容
本发明的目的是进行电价预测时,既能保证电价预测的科学准确和误差概率的分析精度,又能兼顾预测结果用于风险分析的可行性的效果。
为了实现上述目的,有必要针对上述技术问题,提供了一种电价概率预测方法、系统、计算机设备和存储介质。
第一方面,本发明实施例提供了一种电价概率预测方法,所述方法包括以下步骤:
根据训练时段电价数据,采用预测模型预测得到第一电价预测数据;
根据所述第一电价预测数据,采用分布模型拟合得到第一电价预测数据的误差特征;
采用聚类算法将所述第一电价预测数据的误差特征聚类分析,得到第一电价预测数据的中心特征;
根据目标时段电价数据,采用预测模型预测得到第二电价预测数据;
根据所述第一电价预测数据的中心特征修正所述第二电价预测数据,得到目标时段的电价概率预测数据。
进一步地,所述根据训练时段电价数据,采用预测模型预测得到第一电价预测数据的步骤之前包括:建立预测模型;
进一步地,所述预测模型为xgboost预测模型,所述建立预测模型的步骤包括:
初始化所述xgboost预测模型的参数和样本集权重;
根据所述样本集权重,迭代计算得到误差数据;
根据所述误差数据更新所述样本集权重。
进一步地,所述训练时段电价数据和所述目标时段电价数据均至少包括预测日类型、预测日周末标识、预测日负荷高峰时刻系统供需比、预测日系统负荷统计量、预测日系统负荷值、预测日前一天的历史电价统计量和历史电价值、预测日前两天的历史电价统计量和历史电价值;
所述第一电价预测数据为所述训练时段的电价预测值;
所述第二电价预测数据均为所述目标时段的电价预测值。
进一步地,所述根据所述第一电价预测数据,采用分布模型拟合得到第一电价预测数据的误差特征的步骤包括:
根据所述第一电价预测数据和所述训练时段电价数据,计算所述第一电价预测数据的误差;
采用logistic分布模型对所述第一电价预测数据的误差进行拟合,得到所述第一电价预测数据的误差特征。
进一步地,所述采用聚类算法将所述第一电价预测数据的误差特征聚类分析,得到第一电价预测数据的中心特征的步骤包括:
根据第一电价预测数据的误差特征构建二维平面;
在所述二维平面上,随机选取特定数量中心点;
根据所述特定数量中心点,采用Kmeans聚类算法进行聚类分析,得到所述第一电价预测数据的中心特征。
进一步地,所述根据所述第一电价预测数据的中心特征修正所述第二电价预测数据,得到目标时段的电价概率预测数据的步骤包括:
将所述第二电价预测数据与所述第一电价预测数据的中心特征的均值求和,得到所述目标时段的电价概率预测数据;所述中心特征包括均值和标准差。
进一步地,所述根据所述第一电价预测数据的中心特征修正所述第二电价预测数据,得到目标时段的电价概率预测数据的步骤还包括:
将所述中心特征的均值与特定倍数所述中心特征的标准差求和或求差,得到目标时段不同置信水平的电价概率预测区间。
第二方面,本发明实施例提供了一种电价概率预测的系统,所述系统包括:
第一电价预测模块,用于根据训练时段电价数据,采用预测模型预测得到第一电价预测数据;
电价误差分析模块,根据所述第一电价预测数据,采用分布模型拟合得到第一电价预测数据的误差特征;
误差聚类分析模块,用于采用聚类算法将所述第一电价预测数据的误差特征聚类分析,得到第一电价预测数据的中心特征;
第二电价预测模块,用于根据目标时段电价数据,采用预测模型预测得到第二电价预测数据;
电价预测修正模块,用于根据所述第一电价预测数据的中心特征修正所述第二电价预测数据,得到目标时段的电价概率预测数据。
第三方面,本发明实施例还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。
上述本申请提供了一种电价概率预测方法、系统、计算机设备和存储介质,通过所述方法,实现了基于日类型、周末标识、预测日负荷高峰时刻的系统供需比、预测日系统负荷统计量、预测日各时刻点系统负荷值、预测日前一天和预测日前两天的历史电价统计量和历史电价值等训练时段电价数据进行预测,得到训练时段的电价预测值,采用分布模型拟合预测误差提取预测误差特征,再对误差特征进行聚类分析得到误差中心特征,并用其进行对目标时段电价预测数据进行修正得到对应的电价概率预测值和不同置信水平下的电价概率预测区间的效果。与现有技术相比,该方法在未来电价预测的应用上,给出预测日各时刻点电价预测值的同时,充分分析预测误差在不同时段的差异性,既能保证电价预测的科学准确和误差概率的分析精度,又能兼顾预测结果用于风险分析的可行性,对发电商的定价决策和风险评估有重大意义。
附图说明
图1是本发明实施例中电价概率预测方法的应用场景示意图;
图2是本发明实施例中电价概率预测方法的流程示意图;
图3是图2中步骤S11和步骤S14所使用的xgboost预测模型建立的流程示意图;
图4是图2中步骤S12采用logistic分布模型拟合误差特征的流程示意图;
图5是图2中步骤S13采用Kmeans聚类算法对误差特征聚类分析的流程示意图;
图6是图5中基于PJM数据测试集误差聚类效果示意图;
图7是图2中步骤S15电价预测值修正的流程示意图;
图8是图7中所述方法基于PJM日前数据测试集得到的90.51%置信水平的电价概率预测区间与实际电价曲线对比示意图;
图9是本发明实施例中电价概率预测系统的结构示意图;
图10是本发明实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案和有益效果更加清楚明白,下面结合附图及实施例,对本发明作进一步详细说明,显然,以下所描述的实施例是本发明实施例的一部分,仅用于说明本发明,但不用来限制本发明的范围。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供的电价概率预测方法,可以应用于如图1所示的终端或服务器上。其中,终端可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。服务器可生成最终的电价概率预测结果,将生成的电价概率预测结果发送至终端,终端接收到电价概率预测结果后,供终端的使用者查看分析。
在一个实施例中,如图2所示,提供了一种电价概率预测方法,包括以下步骤:
S11、根据训练时段电价数据,采用预测模型预测得到第一电价预测数据;
S12、根据所述第一电价预测数据,采用分布模型拟合得到第一电价预测数据的误差特征;
S13、采用聚类算法将所述第一电价预测数据的误差特征聚类分析,得到第一电价预测数据的中心特征;
S14、根据目标时段电价数据,采用预测模型预测得到第二电价预测数据;
S15、根据所述第一电价预测数据的中心特征修正所述第二电价预测数据,得到目标时段的电价概率预测数据。
其中,电价预测时使用的训练时段电价数据和目标时段电价数据均至少包括预测日类型、预测日周末标识、预测日负荷高峰时刻系统供需比、预测日系统负荷统计量、预测日系统负荷值、预测日前一天的历史电价统计量和历史电价值、预测日前两天的历史电价统计量和历史电价值等数据。由于前一天和前两天的电价数据与预测日的电价有着很强的相关性,基于该数据得到的预测日电价值是科学有效的。训练时段电价数据和目标时段电价数据中的预测日类型分别用1到7来标记星期一到星期日,预测日周末标识分别用0和1来标记工作日和周末,预测日系统负荷统计量包括负荷最小值、负荷均值和负荷最大值,预测日前一天和前两天的历史电价统计量包括电价最小值、电价均值和电价最大值。结合实际的电价预测场景,用户对预先收集到的相关电价数据进行清洗后,可按需将清洗后的数据以固定比例划分为训练时段电价数据、目标时间段电价数据,且具体每一天的电价都包括24小时各时刻点的电价,充分考虑同日不同时电价的差异性和异日同时电价的相关性,进而为目标时段预测日24小时电价预测结果的准确性提供很好的保证。
本申请实施例中考虑到同日不同时电价数据和预测误差的差异性,使用预测模型对训练时段内的各时刻点电价值进行预测得到对应各时刻点的电价预测值,并对各时刻的预测误差采用分布拟合得到对应各时刻点的误差特征,结合异日同时电价和预测误差的相关性,对各时刻点的误差特征聚类分析得到对应误差特征的中心特征,并依此对目标时段预测日各时刻点的电价预测值进行修正,给出可靠的电价概率预测值为发电商的定价决策提供了有力支持。将该方法应用于实际电价预测时,既保证了预测日各时刻点电价预测科学准确和误差概率的分析精度,又能有效避免因采用分时误差分析而引入过多的风险增加风险评估工作量的问题,进而做到了预测结果用于风险分析的可行性,对于发电商的定价决策和风险评估有重大意义。
在一个实施例中,如图3所示,所述预测模型为xgboost预测模型,建立预测模型的步骤包括:
S111、初始化所述xgboost预测模型的参数和样本集权重;
其中,xgboost模型的参数分为通用参数、Booster参数和学习目标参数三类,该实施例中重点关注树深、迭代次数和收缩长度的训练,其他参数均使用模型自带的默认值,并将训练集样本权重系数在初始化时置为相同,即假设有n个样本,则每个样本点的初始权重的百分值为100/n,后续根据每次得到的迭代误差分别对每个样本点的权重进行更新。
S112、根据所述样本集权重,迭代计算得到误差数据;
其中,第m次迭代误差errm的计算公式为:
wi代表第i个样本的权重,i=1,2,…,n,n表示训练样本的数目;Gm代表第m个分类器,m表示当前迭代的次数。
S113、根据所述误差数据更新所述样本集权重。
其中,每次迭代完成需要使用当前迭代误差更新训练样本的权重,以保证分类误差大的样本将会被赋一个更高的权重,同时降低分类正确的样本权重,使用更新训练样本权重wi的公式如下:
其中,am=log((1-errm)/errm)。样本权重更新完成后,检查是否满足继续迭代的模型参数条件,如是否达到最大树深,是否达到迭代次数的上限。如果当前迭代完成后仍满足继续迭代的条件,则将迭代次数加1,继续重复上一步的迭代训练;如果已不满足模型参数的要求即达到迭代终止条件,则停止迭代,确定模型的参数,建立最终xgboost预测模型。
本实施例中采用的xgboost预测模式是一种提升树模型,它将许多树模型集成在一起,形成一个很强的分类器,通过多线程实现了回归树的并行构建,在原有梯度提升树(Gradient Boosting)算法基础上加以改进,从而极大地提升了模型训练速度和预测精度,是一个准确率和运算效率都很高的预测模型,并且其分布式版本有广泛的可移植性,支持多个平台运行,可以很好的解决工业界规模预测的问题。本实施例选用xgboost模型对电价进行预测能够保证电价预测值的精准和预测过程的高效。
在一个实施例中,如图4所示,所述根据所述第一电价预测数据,采用分布模型拟合得到第一电价预测数据的误差特征的步骤S12包括:
S121、根据所述第一电价预测数据和所述训练时段电价数据,计算所述第一电价预测数据的误差;
其中,第一电价预测数据的误差用第一电价预测数据和训练时段电价数据的绝对误差来衡量,绝对误差E的计算公式如下:
E=|Pforecast-Pactual|,
Pforecast为第一电价预测数据、Pactual为训练时段电价数据。
S122、采用logistic分布模型对所述第一电价预测数据的误差进行拟合,得到所述第一电价预测数据的误差特征。
其中,第一电价预测数据的误差特征为训练时段内的各时刻点的均值和标准差。
Logistic分布模型是最重要且应用最广泛的非线性统计模型之一,其概率密度和累计密度函数分别为:
该分布模型对变量要求低,可以接受非正态分布的数据,且总体预测准确率较高,模型稳定,利于推广创新。本实施例中选用该模型对预测误差进行分布拟合可以得到准确率较高的特征参数,进而保证了误差分析的精准性。
在一个实施例中,如图5所示,所述采用聚类算法将所述第一电价预测数据的误差特征聚类分析,得到第一电价预测数据的中心特征的步骤S13包括:
S131、根据第一电价预测数据的误差特征构建二维平面;
其中,二维平面上的点由训练时段各时刻点的误差特征的均值μ和标准差σ组成,记为(μ,σ)。
S132、在所述二维平面上,随机选取特定数量中心点;
其中,随机选取特定数量中心点即先确定聚类数,再随机选取与聚类数相同的点作为中心点。Kmeans聚类算法执行时选择合适的聚类数K非常关键,现有的K值选取方法有:(1)简单设置法,即直接用样本量n除以2再开方出来的值作为K值,具体公式为(2)肘部法,当选择的K值小于真正的聚类数时,cost值就会随K值增加而大幅的减小;当选择的K值大于真正的聚类数时,cost值就不会因为K值增加而变化那么明显,正确的K值就在这个拐点处;(3)间隔统计量法,通过在样本所在的矩形区域(高维的话就是立方体区域)中按照均匀分布随机地产生和原始样本数一样多的随机样本,并对这个随机样本做K-Means聚类,从而得到一个类内样本点之间的距离Dk,并重复多次采集多个数据,再引入合适的测度作为间隔度量值Gapk,采用蒙特卡洛法求出使Gapk取得最大值所对应的K值就是最佳的聚类数;(4)轮廓系数法,通过计算样本点到同簇其他样本的平均距离和样本点到其他簇所有样本的平均距离,来衡量样本和所属簇之间的相似度即内聚性,从而选取所有样本点内聚性都高的聚类数作为最佳聚类数;(5)Canopy算法,通过事先粗聚类的方式,为k-means算法确定初始聚类数和聚类中心点。
上述5种方法都可以用于聚类数的选取,但都有其最佳适用场景,因此,在实际应用过程中使用者可以根据现有的数据规模和具体预测场景选取确定聚类数的方法。本实施例中考虑到聚类分析中数据集到各类中心点的总距离d会随着类数K的增加而下降的特性,结合实际电价预测分时误差数据的特点和误差分析的需求,在手肘法的基础上融入了拐点的特定选取方法来确定最佳聚类数,即先依据聚类数K和总距离d作出曲线图,将下一次总距离减少量小于上一次的1/6时的点置为曲线的拐点,将该拐点处对应的聚类数K确定为聚类分析的类数,该方法应用于PJM(PennsylvaniaNew JerseyMaryland)日前市场2020年1月至6月的数据测试集的误差分布聚类上得到了较好的聚类效果,具体请参见图6。
S133、根据所述特定数量中心点,采用Kmeans聚类算法进行聚类分析,得到所述第一电价预测数据的中心特征。
其中,Kmeans聚类分析中,使用的计算中心点μk的公式和各点到各中心点距离最小值r的公式分别为:
xi为样本点,rik为分类系数值,取值为1或0,i=1,2,…,n,n表示训练样本的个数,当样本点xi属于第K类时rik取1,否则取0。
本实施例中采用的Kmeans聚类算法是一种收敛速度较快的聚类分析法,由于电价预测误差数据的同日不同时的差异性和异日同时的相关性可以保证簇内的密集性和簇之间的区别性,进而能够得到很好的聚类效果,获得准确的类中心特征用于对预测值的修正,进而得到科学合理的预测值。
在一个实施例中,如图7所示,所述根据所述第一电价预测数据的中心特征修正所述第二电价预测数据,得到目标时段的电价概率预测数据的步骤S15包括:
S151、将所述第二电价预测数据与所述第一电价预测数据的中心特征的均值求和,得到所述目标时段的电价概率预测数据;所述中心特征包括均值和标准差;
其中,目标时段内各时刻点的电价概率预测数据的计算公式为:
S152、将所述中心特征的均值与特定倍数所述中心特征的标准差求和或求差,得到目标时段不同置信水平的电价概率预测区间。
其中,目标时段不同置信水平的各时刻点电价概率预测区间[δa,δb]的上下限分别如下表示:
δa=μ-n×σ,δb=μ+n×σ,
μ为各时刻点所属类的中心特征的均值,σ为各时刻点所属类的中心特征的标准差,n为与所取置信水平相对应的σ倍数。
本实施例中,基于异日同时误差的相关性,使用误差聚类分析得到的各时刻点中心特征,并使用中心特征的均值对预测值进行修正,可以有效的减少实际预测引入的误差,进而得到一个更精准的电价预测值,与此同时也给出了不同置信水平的电价概率预测区间,为发电商的报价决策和风险评估提供了有力的支撑,采用实施例所述方法基于PJM日前数据测试集得到的90.51%置信水平的电价概率预测区间与实际电价的对比如图8所示。
需要说明的是,虽然上述流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行,如果图2中步骤S14的位置是可以前移的,只要保证在步骤S11之后,步骤S15之前即可。
在一个实施例中,如图9所示,提供了一种电价概率预测系统,所述系统包括:
第一电价预测模块91,用于根据训练时段电价数据,采用预测模型预测得到第一电价预测数据;
电价误差分析模块92,用于根据所述第一电价预测数据,采用分布模型拟合得到第一电价预测数据的误差特征;
误差聚类分析模块93,用于采用聚类算法将所述第一电价预测数据的误差特征聚类分析,得到第一电价预测数据的中心特征;
第二电价预测模块94,用于根据目标时段电价数据,采用预测模型预测得到第二电价预测数据;
电价预测修正模块95,用于根据所述第一电价预测数据的中心特征修正所述第二电价预测数据,得到目标时段的电价概率预测数据。
关于电价概率预测系统的具体限定可以参见上文中对于电价概率预测方法的限定,在此不再赘述。上述电价概率预测系统中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
图10示出一个实施例中计算机设备的内部结构图,该计算机设备具体可以是终端或服务器。如图10所示,该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示器和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种电价概率预测方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域普通技术人员可以理解,图10中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算设备可以包括比途中所示更多或更少的部件,或者组合某些部件,或者具有同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述方法的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述方法的步骤。
综上,本发明实施例提供的一种电价概率预测方法、系统、计算机设备和存储介质,其误差聚类的电价概率预测方法在充分分析电价预测误差在不同时段差异性的基础上,提取出各时段误差分布的特征,再基于各时段的特征本身对其进行聚类操作,使用各类中心的特征得到准确的电价概率预测值和不同置信水平下的电价概率区间。该方法应用于实际的电价预测时,可以在不引入过多风险情形的前提下,给出精确的电价概率预测值和不同置信水平下的电价概率区间,既保证电价预测的科学准确和误差概率的分析精度,又兼顾了预测结果用于风险分析的可行性,给发电商的定价决策和风险评估提供了重要且有意义的依据。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。
本说明书中的各个实施例均采用递进的方式描述,各个实施例直接相同或相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统、计算机设备和存储介质的实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。需要说明的是,上述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种优选实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和替换,这些改进和替换也应视为本申请的保护范围。因此,本申请专利的保护范围应以所述权利要求的保护范围为准。
Claims (9)
1.一种电价概率预测方法,其特征在于,所述方法包括以下步骤:
根据训练时段电价数据,采用预测模型预测得到第一电价预测数据;
根据所述第一电价预测数据,采用分布模型拟合得到第一电价预测数据的误差特征;所述根据所述第一电价预测数据,采用分布模型拟合得到第一电价预测数据的误差特征的步骤包括:根据所述第一电价预测数据和所述训练时段电价数据,计算所述第一电价预测数据的误差;采用logistic分布模型对所述第一电价预测数据的误差进行拟合,得到所述第一电价预测数据的误差特征;所述误差特征包括均值和标准差;
采用聚类算法将所述第一电价预测数据的误差特征聚类分析,得到第一电价预测数据的中心特征;
根据目标时段电价数据,采用预测模型预测得到第二电价预测数据;
根据所述第一电价预测数据的中心特征修正所述第二电价预测数据,得到目标时段的电价概率预测数据。
2.如权利要求1所述的电价概率预测方法,其特征在于,所述根据训练时段电价数据,采用预测模型预测得到第一电价预测数据的步骤之前包括:建立预测模型;
其中,所述预测模型为xgboost预测模型,所述建立预测模型的步骤包括:
初始化所述xgboost预测模型的参数和样本集权重;
根据所述样本集权重,迭代计算得到误差数据;
根据所述误差数据更新所述样本集权重。
3.如权利要求1所述的电价概率预测方法,其特征在于,所述训练时段电价数据和所述目标时段电价数据均至少包括预测日类型、预测日周末标识、预测日负荷高峰时刻系统供需比、预测日系统负荷统计量、预测日系统负荷值、预测日前一天的历史电价统计量和历史电价值、预测日前两天的历史电价统计量和历史电价值;
所述第一电价预测数据为所述训练时段的电价预测值;
所述第二电价预测数据均为所述目标时段的电价预测值。
4.如权利要求1所述的电价概率预测方法,其特征在于,所述采用聚类算法将所述第一电价预测数据的误差特征聚类分析,得到第一电价预测数据的中心特征的步骤包括:
根据第一电价预测数据的误差特征构建二维平面;
在所述二维平面上,随机选取特定数量中心点;
根据所述特定数量中心点,采用Kmeans聚类算法进行聚类分析,得到所述第一电价预测数据的中心特征。
5.如权利要求1所述的电价概率预测方法,其特征在于,所述根据所述第一电价预测数据的中心特征修正所述第二电价预测数据,得到目标时段的电价概率预测数据的步骤包括:
将所述第二电价预测数据与所述第一电价预测数据的中心特征的均值求和,得到所述目标时段的电价概率预测数据;所述中心特征包括均值和标准差。
6.如权利要求5所述的电价概率预测方法,其特征在于,所述根据所述第一电价预测数据的中心特征修正所述第二电价预测数据,得到目标时段的电价概率预测数据的步骤还包括:
将所述中心特征的均值与特定倍数所述中心特征的标准差求和或求差,得到目标时段不同置信水平的电价概率预测区间。
7.一种电价概率预测的系统,其特征在于,所述系统包括:
第一电价预测模块,用于根据训练时段电价数据,采用预测模型预测得到第一电价预测数据;
电价误差分析模块,用于根据所述第一电价预测数据,采用分布模型拟合得到第一电价预测数据的误差特征;
误差聚类分析模块,用于采用聚类算法将所述第一电价预测数据的误差特征聚类分析,得到第一电价预测数据的中心特征;
第二电价预测模块,用于根据目标时段电价数据,采用预测模型预测得到第二电价预测数据;
电价预测修正模块,用于根据所述第一电价预测数据的中心特征修正所述第二电价预测数据,得到目标时段的电价概率预测数据。
8.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011200533.6A CN112232886B (zh) | 2020-10-30 | 2020-10-30 | 一种电价概率预测方法、系统、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011200533.6A CN112232886B (zh) | 2020-10-30 | 2020-10-30 | 一种电价概率预测方法、系统、计算机设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112232886A CN112232886A (zh) | 2021-01-15 |
CN112232886B true CN112232886B (zh) | 2021-06-04 |
Family
ID=74121780
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011200533.6A Active CN112232886B (zh) | 2020-10-30 | 2020-10-30 | 一种电价概率预测方法、系统、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112232886B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113837812B (zh) * | 2021-10-09 | 2023-01-17 | 广东电力交易中心有限责任公司 | 节点电价联合概率预测方法及装置 |
CN115249166B (zh) * | 2021-12-20 | 2023-05-05 | 国家电投集团电站运营技术(北京)有限公司 | 出清电价预测方法、装置、计算机设备和存储介质 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105956682A (zh) * | 2016-04-19 | 2016-09-21 | 上海电力学院 | 基于bp神经网络与马尔可夫链的短期电价预测方法 |
CN108510113A (zh) * | 2018-03-21 | 2018-09-07 | 中南大学 | 一种XGBoost在短期负荷预测中的应用 |
CN108764577A (zh) * | 2018-05-31 | 2018-11-06 | 山东师范大学 | 基于动态模糊认知图的在线时间序列预测方法 |
US10255641B1 (en) * | 2014-10-31 | 2019-04-09 | Intuit Inc. | Predictive model based identification of potential errors in electronic tax return |
CN109784594A (zh) * | 2017-11-10 | 2019-05-21 | 中国电力科学研究院有限公司 | 一种售电商可调负荷决策方法及系统 |
CN111160401A (zh) * | 2019-12-09 | 2020-05-15 | 国网辽宁省电力有限公司电力科学研究院 | 一种基于均值漂移和XGBoost的异常用电判别方法 |
CN111191814A (zh) * | 2019-11-22 | 2020-05-22 | 储长青 | 一种电价预测方法、系统和计算机可读存储介质 |
CN111525627A (zh) * | 2020-05-08 | 2020-08-11 | 清华大学 | 含抽蓄与新能源发电的柔性直流输电系统日前调度方法 |
CN112308335A (zh) * | 2020-11-12 | 2021-02-02 | 南方电网能源发展研究院有限责任公司 | 一种基于xgboost算法的短期电价预测方法及装置 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105590174A (zh) * | 2015-12-29 | 2016-05-18 | 南京因泰莱电器股份有限公司 | 基于k-均值聚类rbf神经网络的企业用电负荷预测方法 |
CN105956787A (zh) * | 2016-05-18 | 2016-09-21 | 国网福建省电力有限公司 | 一种电力系统电网发展阶段划分及预测方法 |
CN106485362B (zh) * | 2016-10-18 | 2019-10-18 | 江苏省电力试验研究院有限公司 | 一种基于高维风电预测误差模型及降维技术的发电调度方法 |
CN107067099B (zh) * | 2017-01-25 | 2020-06-19 | 清华大学 | 风电功率概率预测方法及装置 |
CN109146553A (zh) * | 2018-07-27 | 2019-01-04 | 东北电力大学 | 基于多密度聚类与多核svm的实时电价预测系统及其方法 |
CN111191811A (zh) * | 2018-11-14 | 2020-05-22 | 中兴通讯股份有限公司 | 集群负荷预测方法、装置及存储介质 |
CN111368168A (zh) * | 2020-03-12 | 2020-07-03 | 佛山市艾温特智能科技有限公司 | 一种基于大数据的电价获取和预测方法、系统和计算机可读存储介质 |
-
2020
- 2020-10-30 CN CN202011200533.6A patent/CN112232886B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10255641B1 (en) * | 2014-10-31 | 2019-04-09 | Intuit Inc. | Predictive model based identification of potential errors in electronic tax return |
CN105956682A (zh) * | 2016-04-19 | 2016-09-21 | 上海电力学院 | 基于bp神经网络与马尔可夫链的短期电价预测方法 |
CN109784594A (zh) * | 2017-11-10 | 2019-05-21 | 中国电力科学研究院有限公司 | 一种售电商可调负荷决策方法及系统 |
CN108510113A (zh) * | 2018-03-21 | 2018-09-07 | 中南大学 | 一种XGBoost在短期负荷预测中的应用 |
CN108764577A (zh) * | 2018-05-31 | 2018-11-06 | 山东师范大学 | 基于动态模糊认知图的在线时间序列预测方法 |
CN111191814A (zh) * | 2019-11-22 | 2020-05-22 | 储长青 | 一种电价预测方法、系统和计算机可读存储介质 |
CN111160401A (zh) * | 2019-12-09 | 2020-05-15 | 国网辽宁省电力有限公司电力科学研究院 | 一种基于均值漂移和XGBoost的异常用电判别方法 |
CN111525627A (zh) * | 2020-05-08 | 2020-08-11 | 清华大学 | 含抽蓄与新能源发电的柔性直流输电系统日前调度方法 |
CN112308335A (zh) * | 2020-11-12 | 2021-02-02 | 南方电网能源发展研究院有限责任公司 | 一种基于xgboost算法的短期电价预测方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN112232886A (zh) | 2021-01-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Vagropoulos et al. | ANN-based scenario generation methodology for stochastic variables of electric power systems | |
US20210133536A1 (en) | Load prediction method and apparatus based on neural network | |
CN112686464A (zh) | 短期风电功率预测方法及装置 | |
CN112232886B (zh) | 一种电价概率预测方法、系统、计算机设备和存储介质 | |
CN111693931A (zh) | 智能电能表误差远程计算方法、装置和计算机设备 | |
CN113255973A (zh) | 电力负荷预测方法、装置、计算机设备和存储介质 | |
Guo et al. | Deep inverse reinforcement learning for objective function identification in bidding models | |
Yao et al. | Management of cascading outage risk based on risk gradient and Markovian tree search | |
CN115660233A (zh) | 光伏功率预测方法、装置、电子设备及存储介质 | |
Dong et al. | Short-term building cooling load prediction model based on DwdAdam-ILSTM algorithm: A case study of a commercial building | |
CN111476411B (zh) | 一种光伏电站发电量计算方法及服务器 | |
CN115907307B (zh) | 面向电网实时数据交互的电力系统碳排放流在线分析方法 | |
CN112580885A (zh) | 一种配件合格率的预测方法、装置、设备及存储介质 | |
CN117114438A (zh) | 一种具备灵活性与可解释性的建筑区域能源系统冷热负荷数据驱动预测方法 | |
CN115907131B (zh) | 一种北方地区电采暖负荷预测模型搭建方法和系统 | |
Zhang et al. | RSVRs based on feature extraction: a novel method for prediction of construction projects’ costs | |
CN115616333A (zh) | 一种配电网线损预测方法及系统 | |
CN115629576A (zh) | 非侵入式柔性负荷聚合特性辨识与优化方法、装置及设备 | |
CN114418168A (zh) | 一种区域火力发电量中长期预测方法和系统 | |
CN113095963A (zh) | 房地产成本数据处理方法、装置、计算机设备和存储介质 | |
CN112949908A (zh) | 一种电价概率预测方法及装置 | |
He et al. | Singular-Value Decomposition Feature-Extraction Method for Cost-Performance Prediction | |
Indralaksono et al. | Hierarchical Clustering and Deep Learning for Short-Term Load Forecasting with Influenced Factors | |
Vijayvargia et al. | VARMA model parameterization using MLLE approach for intraday wind power forecasting application | |
Ogut et al. | PV Fleet Modeling via Smooth Periodic Gaussian Copula |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |