CN111709779A - 一种用于电力现货市场的交易品种优化系统 - Google Patents
一种用于电力现货市场的交易品种优化系统 Download PDFInfo
- Publication number
- CN111709779A CN111709779A CN202010485738.7A CN202010485738A CN111709779A CN 111709779 A CN111709779 A CN 111709779A CN 202010485738 A CN202010485738 A CN 202010485738A CN 111709779 A CN111709779 A CN 111709779A
- Authority
- CN
- China
- Prior art keywords
- data
- module
- price
- optimization system
- trading
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000005457 optimization Methods 0.000 title claims abstract description 40
- 238000004458 analytical method Methods 0.000 claims abstract description 33
- 238000004364 calculation method Methods 0.000 claims abstract description 27
- 238000000034 method Methods 0.000 claims abstract description 18
- 238000004140 cleaning Methods 0.000 claims abstract description 15
- 230000000694 effects Effects 0.000 claims abstract description 10
- 238000010219 correlation analysis Methods 0.000 claims abstract description 9
- 238000005311 autocorrelation function Methods 0.000 claims description 30
- 230000005611 electricity Effects 0.000 claims description 29
- 230000009467 reduction Effects 0.000 claims description 17
- 238000012360 testing method Methods 0.000 claims description 14
- 239000013598 vector Substances 0.000 claims description 13
- 230000002159 abnormal effect Effects 0.000 claims description 11
- 238000012545 processing Methods 0.000 claims description 11
- 238000007781 pre-processing Methods 0.000 claims description 10
- 238000000638 solvent extraction Methods 0.000 claims description 9
- 238000010586 diagram Methods 0.000 claims description 8
- YHXISWVBGDMDLQ-UHFFFAOYSA-N moclobemide Chemical compound C1=CC(Cl)=CC=C1C(=O)NCCN1CCOCC1 YHXISWVBGDMDLQ-UHFFFAOYSA-N 0.000 claims description 7
- 238000000605 extraction Methods 0.000 claims description 6
- 239000011159 matrix material Substances 0.000 claims description 6
- 238000005259 measurement Methods 0.000 claims description 6
- 241001123248 Arma Species 0.000 claims description 3
- 235000012571 Ficus glomerata Nutrition 0.000 claims description 3
- 244000153665 Ficus glomerata Species 0.000 claims description 3
- 230000001419 dependent effect Effects 0.000 claims description 3
- 238000009499 grossing Methods 0.000 claims description 3
- 238000005070 sampling Methods 0.000 claims description 3
- 230000001932 seasonal effect Effects 0.000 claims description 3
- 230000006641 stabilisation Effects 0.000 claims description 3
- 238000011105 stabilization Methods 0.000 claims description 3
- 239000013589 supplement Substances 0.000 claims description 3
- 230000003203 everyday effect Effects 0.000 claims description 2
- 230000008901 benefit Effects 0.000 abstract description 5
- 238000009826 distribution Methods 0.000 description 18
- 238000012795 verification Methods 0.000 description 11
- 238000000513 principal component analysis Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 7
- 230000001186 cumulative effect Effects 0.000 description 6
- 230000006399 behavior Effects 0.000 description 4
- 238000003064 k means clustering Methods 0.000 description 4
- 230000008439 repair process Effects 0.000 description 4
- 230000002354 daily effect Effects 0.000 description 3
- 230000007775 late Effects 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000000556 factor analysis Methods 0.000 description 2
- 238000012880 independent component analysis Methods 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013075 data extraction Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005315 distribution function Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012847 principal component analysis method Methods 0.000 description 1
- 238000013102 re-test Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000033764 rhythmic process Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012731 temporal analysis Methods 0.000 description 1
- 238000000700 time series analysis Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0283—Price estimation or determination
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Development Economics (AREA)
- General Business, Economics & Management (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Computation (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Human Resources & Organizations (AREA)
- Tourism & Hospitality (AREA)
- General Health & Medical Sciences (AREA)
- Water Supply & Treatment (AREA)
- Public Health (AREA)
- Entrepreneurship & Innovation (AREA)
- Probability & Statistics with Applications (AREA)
- Game Theory and Decision Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开的属于电力交易优化技术领域,具体为一种用于电力现货市场的交易品种优化系统,该用于电力现货市场的交易品种优化系统包括价格分析子系统、交易策略优化子系统和交易品种优化系统;所述价格分析子系统包括数据清洗模块、价格相关性分析模块、价格趋势性分析模块;所述交易策略优化子系统包括在险价值计算模块和市场报价策略分析模块;实现便捷,效果明显,算法具有策略优化子系统的优势,交易品种优化算法能够有效、快速地匹配交易者所代理的不同种类电力用户所适用的市场交易品种,为交易者估计市场收益提供依据,应用具备多种模型分析波动概率,为交易者估算成交价格风险提供依据。
Description
技术领域
本发明涉及电力交易优化技术领域,具体为一种用于电力现货市场的交易品种优化系统。
背景技术
电力交易是指针对电力商品或服务进行的买卖活动。包括电能交易、辅助服务交易、输电权交易等。
交易品种受到诸多环境影响,现有的交易产品在交易中容易出现计算不准确的情况,影响使用效果。
发明内容
本发明的目的在于提供一种用于电力现货市场的交易品种优化系统,以解决上述背景技术中提出的交易品种受到诸多环境影响,现有的交易产品在交易中容易出现计算不准确的情况,影响使用效果的问题。
为实现上述目的,本发明提供如下技术方案:一种用于电力现货市场的交易品种优化系统,该用于电力现货市场的交易品种优化系统包括价格分析子系统、交易策略优化子系统和交易品种优化系统;
所述价格分析子系统包括数据清洗模块、价格相关性分析模块、价格趋势性分析模块;
所述交易策略优化子系统包括在险价值计算模块和市场报价策略分析模块;
所述交易品种优化系统包括预处理以及正则化模块、数据降维模块和K 平均聚类模块。
优选的,所述数据清洗模块对异常点即数据的缺失、“0”值,由于记录错误导致超出合理的范围、单个值发生跳变进行标定,标定后,通过算法对其进行修补,修补方式为三种,包括:将异常点位设置为定值;对于明显具有周期性的数据,通过手动指定周期长度,平移上一周期对应点位的数据进行修补;借助临近点位插值。
优选的,所述价格相关性分析模块通过相关性系数的计算,评估因变量和自变量之间的相关性程度,常规数据多为正态分布,一般适用皮尔逊相关系数,采用斯皮尔曼相关系数作为补充,同时,针对假日、排班、机组组合、用户组合等离散类型的数据序列,可以采用肯德尔相关性系数进行分析。
优选的,所述价格趋势性分析模块采用代表性的季节性时间序列预测算法ARIMA作为价格趋势性分析的核心算法,ARIMA模型运用的流程如下:
1)根据时间序列的散点图、自相关函数和偏自相关函数图识别其平稳性;
2)对非平稳的时间序列数据进行平稳化处理,直到处理后的自相关函数和偏自相关函数的数值不显著;
3)根据所识别出来的特征建立相应的时间序列模型,平稳化处理后,若偏自相关函数是截尾的,而自相关函数是拖尾的,则建立AR模型;若偏自相关函数是拖尾的,而自相关函数是截尾的,则建立MA模型;若偏自相关函数和自相关函数均是拖尾的,则序列适合ARMA模型;
4)参数估计,检验是否具有统计意义;
5)假设检验,判断残差序列是否为白噪声序列;
6)利用已通过检验的模型进行预测。
优选的,所述在险价值计算模块通过在险价值作为衡量投资损失风险的指标
优选的,所述市场报价策略分析模块采用了动态规划DP的方法来进行时间规整的计算,使得两个序列的形态尽可能的一致,得到最大可能的相似度,市场报价策略分析模块通过相似度的阈值,将不同的报价行为曲线有效归类,从而使用户能够直观掌握市场上通行的报价策略。
优选的,所述预处理以及正则化模块选择使用前后数据为参考点,进行拉格朗日插值,以达到平滑曲线和数据补全的作用,其插值多项式为:其中(x0,y0),(x1,y1)…(xk,yk)为已知的数据点,L(x)为插值函数, lj(x)为插值基函数(拉格朗日基本多项式):
不同规模的电力用户,在计量数据上的取值范围上存在差异,为了能够在统一的框架内进行特征提取,有必要将各采样点分量进行正则化,使得向量保持在(0,1)区间,若有n个电力用户,每日采集点数量为m,原有日时序矩阵可写为:
从而得到正则化后时序矩阵F;
对于输入为不同用户的电力计量数据而言,通过预处理和正则化算法,能够将不同用电规模、电功率波动范围上下限不同的数据统一在相同的尺度下,方便后续算法步骤的处理。
优选的,所述数据降维模块多个变量进行最佳综合简化,即对高维变量空间进行降维处理,将n维特征映射到k维上,这k维是全新的正交特征也被称为主成分,是在原有n维特征的基础上重新构造出来的k维特征;
具体步骤如下:
第一个新坐标轴选择是原始数据中方差最大的方向;
第二个新坐标轴选取是与第一个坐标轴正交的平面中使得方差最大的;
第三个轴是与第1,2个轴正交的平面中方差最大的;
依次类推,可以得到n个这样的坐标轴;
保留前面k个含有绝大部分方差的坐标轴,即实现了数据特征的降维。
优选的,所述K平均聚类模块对于给定的特征样本集,按照样本之间的距离大小,将样本集划分为K个簇,让每一簇内的点尽量紧密的连在一起,而让簇间的距离尽量的大;
该算法的基本步骤为:
输入是样本集D={x1,x2,…xm},聚类的簇树k,最大迭代次数N;
输出簇划分C={C1,C2,…Cm};
从样本集D中随机选择k个样本作为初始的k个质心向量:μ1,μ2,…μm;
对于n=1,2,...,N:
如果所有的k个质心向量都没有发生变化,则转到下一步骤;
输出簇划分C={C1,C2,…Cm}。
与现有技术相比,本发明的有益效果是:
1)数据清洗模块,在限定的条件下对数据比较、判断以及替换,实现便捷,效果明显,如果有进一步的测试数据集,可以针对数据特征,设置固定的参数组合,避免用户的繁琐输入;
价格相关性分析模块的理论依据参照经典统计学体系,科学性和普适性较高,后续主要考虑部署环境、数据类型的限制,在用户使用逻辑上做出适应性的调整,同时可以对既有数据做出筛选,剔除不具有代表性的数据集,降低运维投入;
价格趋势性分析模块采用的ARIMA模型,在有效的参数调校和合理的数据集保证的基础上,能够得到较好的效果。由于模型复杂度较高,需要较强的算力。需要讨论实际的部署环境,必要时换用更为精简的模型;
2)交易策略优化子系统在交易策略优化应用中,对于测试使用的市场交易行为,算法能够有效地总结典型市场申报策略,并为使用者未来申报提供参考。但交易数据的不完整限制了对算法鲁棒性的进一步验证。此外,根据历史价格变化,应用具备多种模型分析波动概率,为交易者估算成交价格风险提供依据。
附图说明
图1为本发明系统逻辑框图;
图2为本发明清洗前数据图;
图3为本发明清洗后数据图;
图4为本发明不同月度竞价场内价格波动曲线图;
图5为本发明两个波形对齐的点图;
图6为本发明数据与业务模型图;
图7为本发明输入数据图;
图8为本发明交易品种的收益测算结果图;
图9为本发明收益的时间分布图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要理解的是,术语“上”、“下”、“前”、“后”、“左”、“右”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
实施例:
请参阅图1-9,本发明提供一种技术方案:
如图1所示,一种用于电力现货市场的交易品种优化系统,该用于电力现货市场的交易品种优化系统包括价格分析子系统、交易策略优化子系统和交易品种优化系统;
所述价格分析子系统包括数据清洗模块、价格相关性分析模块、价格趋势性分析模块;
所述交易策略优化子系统包括在险价值计算模块和市场报价策略分析模块;
所述交易品种优化系统包括预处理以及正则化模块、数据降维模块和K 平均聚类模块。
数据清洗模块
价格相关数据常见的异常主要包括,数据的缺失、“0”值,由于记录错误导致超出合理的范围(为负数)、单个值发生跳变。针对这些异常情况,需要相应的检查机制,对异常点进行标定。如下表面所示,为常见的异常和处理方式;
标记出相应的异常后,可以通过算法对其进行修补。计划使用以下三种修复方式:将异常点位设置为定值;对于明显具有周期性的数据,通过手动指定周期长度,平移上一周期对应点位的数据进行修补;借助临近点位插值。如下表所示,为修复方式。
价格相关性分析模块
可以通过相关性系数的计算,评估因变量和自变量之间的相关性程度。常规数据多为正态分布,一般适用皮尔逊相关系数(N);为了应对市场初期数据的不稳定性、以及非正态分布的数据,采用斯皮尔曼相关系数(S)作为补充;同时,针对假日、排班、机组组合、用户组合等离散类型的数据序列,可以采用肯德尔相关性系数(K)进行分析。
价格趋势性分析模块
主要希望获取其未来的趋势,电力行业数据往往具有季节性、周期性较强的特点,因此选用代表性的季节性时间序列预测算法ARIMA作为价格趋势性分析的核心算法。
ARIMA模型又称为差分自回归移动平均模型,主要由自回归、差分和移动平均构成,是时间序列分析中最常用的模型之一。运用的流程如下:
1)根据时间序列的散点图、自相关函数和偏自相关函数图识别其平稳性。
2)对非平稳的时间序列数据进行平稳化处理。直到处理后的自相关函数和偏自相关函数的数值不显著;
3)根据所识别出来的特征建立相应的时间序列模型。平稳化处理后,若偏自相关函数是截尾的,而自相关函数是拖尾的,则建立AR模型;若偏自相关函数是拖尾的,而自相关函数是截尾的,则建立MA模型;若偏自相关函数和自相关函数均是拖尾的,则序列适合ARMA模型;
4)参数估计,检验是否具有统计意义;
5)假设检验,判断残差序列是否为白噪声序列;
6)利用已通过检验的模型进行预测。
数据与业务模型
本应用业务逻辑和数据流程如下:
用户选定待分析序列,切片查看
对待分析数据进行检测和清洗
用户从平台接口选择其关注的相关数据,进行相关性分析
或:
用户针对选定的数据进行趋势性分析
本应用针对特定时间序列数据开展分析,与平台数据的交互为单一的查询和调用,平台支持层面,不涉及聚合与业务逻辑运算,但需要考虑数据权限的管理。
算法测试结果
数据清洗算法测试
通过搭建基于浏览器的测试平台,实现了数据异常检测和清洗的相关功能,效果如下截图所示。这里选用了一电力荷数据作为测试对象,针对超出阈值和缺失的数据做出了补全,证明了数据清洗功能的有效性。如图2和图3 所示分别为:清洗前数据图、清洗后数据图。
市场报价策略分析模块
时间序列中,需要比较相似性的两段时间序列的长度可能并不相等,在本应用中,由于市场实时竞价数量不同,导致市场内价格出清数据长度并不一致,使用传统的欧几里得距离无法有效地求的两个时间序列之间的距离(或者相似性)。
例如图4所示,上下线分别为不同月度竞价场内价格波动曲线。可以看到他们整体上的波形形状很相似,但时间轴上不对齐。如图5所示,DTW可以通过找到这两个波形对齐的点。
在场内的月度交易中,摘挂牌双方需要根据市场价格曲线的波动,实时调整竞价策略。在应用中,次年12个月逐月的价格曲线将基于市场参与者的报价实时波动,出现明显的季节性与周期性,对于价格曲线的拟合,成为了交易策略优化模块的重要内容。需要对市场价格曲线进行相似度分析。
Dynamic Time Warping(DTW)最初由日本学者Itakura提出,是一种衡量两个长度不同的时间序列的相似度的方法。应用也比较广,主要是在模板匹配中,比如说用在孤立词语音识别(识别两段语音是否表示同一个单词),手势识别,数据挖掘和信息检索等中。
DTW可以计算两个时间序列的相似度,尤其适用于不同长度、不同节奏的时间序列。DTW将自动warping扭曲时间序列(即在时间轴上进行局部的缩放),采用了动态规划DP(dynamic programming)的方法来进行时间规整的计算,使得两个序列的形态尽可能的一致,得到最大可能的相似度。算法可通过相似度的阈值,将不同的报价行为曲线有效归类,从而使用户能够直观掌握市场上通行的报价策略。
大部分情况下,两个序列整体上具有非常相似的形状,但是这些形状在x 轴上并不是对齐的。所以在比较他们的相似度之前,需要将其中一个(或者两个)序列在时间轴下warping扭曲,以达到更好的对齐。而DTW就是实现这种warping扭曲的一种有效方法。DTW通过把时间序列进行延伸和缩短,来计算两个时间序列性之间的相似性。
分母中的K主要是用来对不同的长度的规整路径做补偿。因为不同的路径其长短不同,较长的路径有较多的“点对”,会有较多的距离累加上去,所以总距离除以K得到单位路径的距离:累加距离cumulative distances。从 (0,0)点开始匹配这两个序列Q和C,每到一个点,之前所有的点计算的距离都会累加。到达终点(n,m)后,这个累积距离就是序列Q和C的相似度。
累积距离γ(i,j)可以按下面的方式表示,累积距离γ(i,j)为当前格点距离d(i,j),也就是点qi和cj的欧式距离(相似性)与可以到达该点的最小的邻近元素的累积距离之和:
γ(i,j)=d(qi,cj)+min{γ(i-1,j-1),γ(i-a,j),γ(i,j-1)}
最佳路径是使得沿路径的积累距离达到最小值这条路径。这条路径可以通过动态规划(dynamic programming)算法得到。
在险价值计算模块
对于电力市场交易者,则可以用于衡量因市场波动造成购电成本的增加量,并对相应的资金储备加以调整,是市场参与者防范风险的有效工具。可以通过在险价值(VaR)作为衡量投资损失风险的指标。在险价值即在给定的损失概率,以及正常的市场波动情况下,在一定的期间内损失程度的风险指标。
在险价值计算简要步骤如下:
设置置信水平α%
当选择正态分布验证时,求当前置信水平下的置信因子k,可利用标准正态累积分布函数的反函数计算
进而求得在险价值
VaR=σ·k
5)当选择历史分布验证或蒙特卡洛验证时,需构造抽样集P'‘。历史分布经验中取P'‘∈P,。蒙特卡洛分布中P={p1,p2,…pm},pi以假定的分布随机生成。之后在险价值VaR为P'‘以置信区间α%计算的百分位数。
在实际应用运用中,建议将正态分布验证、蒙特卡洛验证、历史分布验证同时作为计算在险价值时可选的验证方式。正态分布验证计算较为简易,但市场价格波动行为由于后尾效应,较正态分布往往有所偏差。历史分布验证依赖的数据量较大,适合已有较多交易数据的品种。蒙特卡洛验证计算量较大,但能够避免数据量不足的问题。
数据流程描述与算法测试
数据与业务模型(如图6所示)
算法设计
预处理以及正则化模块
电力计量数据在现场采集和传输过程中可能出现的错误,在数据进行特征提取等算法前,需对空值数据加以预处理,这里选择使用前后数据为参考点,进行拉格朗日插值,以达到平滑曲线和数据补全的作用。其插值多项式为:
其中(x0,y0),(x1,y1)…(xk,yk)为已知的数据点,L(x)为插值函数,lj(x)为插值基函数(拉格朗日基本多项式):
不同规模的电力用户,在计量数据上的取值范围上存在差异。为了能够在统一的框架内进行特征提取,有必要将各采样点分量进行正则化,使得向量保持在(0,1)区间。
若有n个电力用户,每日采集点数量为m,原有日时序矩阵可写为:
对其中的每一列可以应用以下正则化规则:
从而得到正则化后时序矩阵F。
对于输入为不同用户的电力计量数据而言,通过预处理和正则化算法,能够将不同用电规模、电功率波动范围上下限不同的数据统一在相同的尺度下,方便后续算法步骤的处理。
数据降维模块PCA
由于电力用户的日计量数据每日采样96次(15分钟间隔),如果直接应用于特征提取,高维的时序特征将不能准确反映用电的主要特征,并带来大量的重复和无效数据。对于全省规模的电力用户时序序列,也将造成巨大的计算量。同时,在交易品种设置所涉及的峰、平、谷三时段的低维描述向量之间也不能构建直接的映射关系。因此有必要对计量数据进行降维处理,提取用电时序特征,方便后续处理与计算。
降维算法有奇异值分解(SVD),主成分分析(PCA),因子分析(FA) 和独立成分分析(ICA)等多种。考虑到后续步骤需要将降维后的特征应用聚类,以对用户用电特征集中归类,在参考其他研究结果后,选择使用主成分分析算法,以实现对用户用电特征较好的聚类效果,同时降低计算开销。
PCA(Principal Component Analysis),即主成分分析方法,是一种使用最广泛的数据降维算法。主成分分析试图在力保数据信息丢失最少的原则下,对多个变量进行最佳综合简化,即对高维变量空间进行降维处理。将n 维特征映射到k维上,这k维是全新的正交特征也被称为主成分,是在原有n 维特征的基础上重新构造出来的k维特征。
具体步骤如下:
第一个新坐标轴选择是原始数据中方差最大的方向。
第二个新坐标轴选取是与第一个坐标轴正交的平面中使得方差最大的。
第三个轴是与第1,2个轴正交的平面中方差最大的。
依次类推,可以得到n个这样的坐标轴。
保留前面k个含有绝大部分方差的坐标轴,即实现了数据特征的降维。
K平均聚类模块
聚类算法,可以实现样本集按特征归类的目的。对于以时间为自变量的用电特征相近的用户,聚类算法能够将其有效将客户数据实现分割,实现用电特征模式的识别,进而可以将交易品种的参数设置与用户特征向对应,实现对特定类用户在某一交易品种下收益情况的估算,并且减少收益测算时对每一用户独立测算的计算量。
K-means算法又称为K平均算法,对于大规模数据的计算效率较高,因此选择该方法对用电特征进行聚类。算法原理是指对于给定的特征样本集,按照样本之间的距离大小,将样本集划分为K个簇。让每一簇内的点尽量紧密的连在一起,而让簇间的距离尽量的大。
该算法的基本步骤为:
输入是样本集D={x1,x2,…xm},聚类的簇树k,最大迭代次数N
输出簇划分C={C1,C2,…Cm}
从样本集D中随机选择k个样本作为初始的k个质心向量:μ1,μ2,…μm
对于n=1,2,...,N:
如果所有的k个质心向量都没有发生变化,则转到步骤c)
输出簇划分C={C1,C2,…Cm}
数据流程描述与算法测试
数据与业务模型
以下将简述本应用中优化算法各步骤:
以用户计量数据提取为典型负荷
用电特征点计算
特征负荷模型构建
用户设定批发市场约束条件
用户设定交易品种类型以其品种参数约束
建立交易品种和零售侧用户映射关系
选定收益回测时间约束
计算回测期内收益
在各数据模型的转化处理关系中,用户计量数据至用户典型日用电负荷需要使用预处理和正则化算法以及K平均聚类算法,用电特征点模型需要使用数据降维PCA算法,特征用电负荷模型的构建需要K平均聚类算法
算法测试结果
现使用某省专变大用户单日负荷曲线,总计70728个进行用电特征提取后的结果数据,作为本应用交易品种收益计算的模型输入。其输入数据如图7 所示:
测试结果的输出中,该模型中包含的要素为:
用户用电特征点(图中为4时,6时,8时…22时,24时等在x轴上标记的时间点)
用户特征数目,即满足一定聚类收敛条件的类型数目,本例中共有5类特征用电负荷,在各用电特征时刻的归一化负荷结果
在本例数据中可见类型1为晚高峰型;类型2为早高峰用电型;类型3 为日间平峰型;类型4为夜间用电型;类型5为日间峰谷型。不同的用电类型取决于用户的行业类型、对电价的敏感性等多种因素。
在交易收益测算中,设置峰谷电价和固定价格两类品种,对模型中的各类用电用户类型一天内的售电收益展开计算与对比,峰谷时刻依照广东市目录电价中规定进行划分,以0.7元/千瓦时为基准价格,分别执行固定价格、 8/7/5峰平谷电价比例,9/7/4峰平谷电价比例。
如图8分别为各交易品种的收益测算结果,通过对比可以看出,日间峰谷型和晚高峰型的售电收益较高。对于晚高峰型和日间平峰型用户,提高峰值电价交易品种价格能够显著改善收益。夜间用电型对以上三种交易品种的设置不敏感。
同时根据以上收益结果,可以按时间轴区间,对各时段内的不同类型用户的收益情况叠加。用户在应用中可调整各类型用户的比例,查看在相同时间内各交易品种组合的总体收益情况和分布。以下表中的各用户比例作为输入,在总交易电量不变的前提下,计算收益情况按时间分布情况。样例A为各类型在某省分布的真实统计结果如下表所示,样例B假设各类型分布平均,样例C为只争取从收益测算中得知的收益较高的用户类型(类型3和类型5)。
如图9所示,从时间分布结果可知,由于峰谷电价的时间设置,在午后和晚高峰两段时间(12时-18时以及18时之后),在不自主选择用户类型的前提下,午间电价高峰和晚间电价高峰带来的较大收益。根据交易品种特性,若选择特定的用户类型(样例C),能够在相同的总额电量下,争取到更大的收益空间。
在应用场景测试中,因为电力用户电压等级、所在地域数据的缺失,对交易品种对应的潜在用户营销范围未能给出预计。在后续应用开发中,需对接上实际生产数据,以便对算法进行更为有效的评估。
以上显示和描述了本发明的基本原理和主要特征和本发明的优点,对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明;因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内,不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
Claims (9)
1.一种用于电力现货市场的交易品种优化系统,其特征在于:该用于电力现货市场的交易品种优化系统包括价格分析子系统、交易策略优化子系统和交易品种优化系统;
所述价格分析子系统包括数据清洗模块、价格相关性分析模块、价格趋势性分析模块;
所述交易策略优化子系统包括在险价值计算模块和市场报价策略分析模块;
所述交易品种优化系统包括预处理以及正则化模块、数据降维模块和K平均聚类模块。
2.根据权利要求1所述的一种用于电力现货市场的交易品种优化系统,其特征在于:所述数据清洗模块对异常点即数据的缺失、“0”值,由于记录错误导致超出合理的范围、单个值发生跳变进行标定,标定后,通过算法对其进行修补,修补方式为三种,包括:将异常点位设置为定值;对于明显具有周期性的数据,通过手动指定周期长度,平移上一周期对应点位的数据进行修补;借助临近点位插值。
3.根据权利要求1所述的一种用于电力现货市场的交易品种优化系统,其特征在于:所述价格相关性分析模块通过相关性系数的计算,评估因变量和自变量之间的相关性程度,常规数据多为正态分布,一般适用皮尔逊相关系数,采用斯皮尔曼相关系数作为补充,同时,针对假日、排班、机组组合、用户组合等离散类型的数据序列,可以采用肯德尔相关性系数进行分析。
4.根据权利要求1所述的一种用于电力现货市场的交易品种优化系统,其特征在于:所述价格趋势性分析模块采用代表性的季节性时间序列预测算法ARIMA作为价格趋势性分析的核心算法,ARIMA模型运用的流程如下:
1)根据时间序列的散点图、自相关函数和偏自相关函数图识别其平稳性;
2)对非平稳的时间序列数据进行平稳化处理,直到处理后的自相关函数和偏自相关函数的数值不显著;
3)根据所识别出来的特征建立相应的时间序列模型,平稳化处理后,若偏自相关函数是截尾的,而自相关函数是拖尾的,则建立AR模型;若偏自相关函数是拖尾的,而自相关函数是截尾的,则建立MA模型;若偏自相关函数和自相关函数均是拖尾的,则序列适合ARMA模型;
4)参数估计,检验是否具有统计意义;
5)假设检验,判断残差序列是否为白噪声序列;
6)利用已通过检验的模型进行预测。
5.根据权利要求1所述的一种用于电力现货市场的交易品种优化系统,其特征在于:所述在险价值计算模块通过在险价值作为衡量投资损失风险的指标。
6.根据权利要求1所述的一种用于电力现货市场的交易品种优化系统,其特征在于:所述市场报价策略分析模块采用了动态规划DP的方法来进行时间规整的计算,使得两个序列的形态尽可能的一致,得到最大可能的相似度,市场报价策略分析模块通过相似度的阈值,将不同的报价行为曲线有效归类,从而使用户能够直观掌握市场上通行的报价策略。
7.根据权利要求1所述的一种用于电力现货市场的交易品种优化系统,其特征在于:所述预处理以及正则化模块选择使用前后数据为参考点,进行拉格朗日插值,以达到平滑曲线和数据补全的作用,其插值多项式为:其中(x0,y0),(x1,y1)…(xk,yk)为已知的数据点,L(x)为插值函数,lj(x)为插值基函数(拉格朗日基本多项式):
不同规模的电力用户,在计量数据上的取值范围上存在差异,为了能够在统一的框架内进行特征提取,有必要将各采样点分量进行正则化,使得向量保持在(0,1)区间,若有n个电力用户,每日采集点数量为m,原有日时序矩阵可写为:
从而得到正则化后时序矩阵F;
对于输入为不同用户的电力计量数据而言,通过预处理和正则化算法,能够将不同用电规模、电功率波动范围上下限不同的数据统一在相同的尺度下,方便后续算法步骤的处理。
8.根据权利要求1所述的一种用于电力现货市场的交易品种优化系统,其特征在于:所述数据降维模块多个变量进行最佳综合简化,即对高维变量空间进行降维处理,将n维特征映射到k维上,这k维是全新的正交特征也被称为主成分,是在原有n维特征的基础上重新构造出来的k维特征;
具体步骤如下:
第一个新坐标轴选择是原始数据中方差最大的方向;
第二个新坐标轴选取是与第一个坐标轴正交的平面中使得方差最大的;
第三个轴是与第1,2个轴正交的平面中方差最大的;
依次类推,可以得到n个这样的坐标轴;
保留前面k个含有绝大部分方差的坐标轴,即实现了数据特征的降维。
9.根据权利要求1所述的一种用于电力现货市场的交易品种优化系统,其特征在于:所述K平均聚类模块对于给定的特征样本集,按照样本之间的距离大小,将样本集划分为K个簇,让每一簇内的点尽量紧密的连在一起,而让簇间的距离尽量的大;
该算法的基本步骤为:
输入是样本集D={x1,x2,…xm},聚类的簇树k,最大迭代次数N;
输出簇划分C={C1,C2,…Cm};
从样本集D中随机选择k个样本作为初始的k个质心向量:μ1,μ2,…μm;
对于n=1,2,...,N:
如果所有的k个质心向量都没有发生变化,则转到下一步骤;
输出簇划分C={C1,C2,…Cm}。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010485738.7A CN111709779A (zh) | 2020-06-01 | 2020-06-01 | 一种用于电力现货市场的交易品种优化系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010485738.7A CN111709779A (zh) | 2020-06-01 | 2020-06-01 | 一种用于电力现货市场的交易品种优化系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111709779A true CN111709779A (zh) | 2020-09-25 |
Family
ID=72539036
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010485738.7A Pending CN111709779A (zh) | 2020-06-01 | 2020-06-01 | 一种用于电力现货市场的交易品种优化系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111709779A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113377755A (zh) * | 2021-06-23 | 2021-09-10 | 黑龙江大学 | 电力现货数据的完整性检测及缺失修复方法 |
CN115719238A (zh) * | 2022-11-08 | 2023-02-28 | 国网区块链科技(北京)有限公司 | 一种基于区块链的分布式能源需求处理方法及装置 |
CN116090916A (zh) * | 2023-04-10 | 2023-05-09 | 淄博海草软件服务有限公司 | 一种企业内部采购资金核算预警系统 |
CN117217843A (zh) * | 2023-10-18 | 2023-12-12 | 河北建投电力科技服务有限公司 | 基于云计算的电力销售电价数据处理方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107784440A (zh) * | 2017-10-23 | 2018-03-09 | 国网辽宁省电力有限公司 | 一种电力信息系统资源调配系统及方法 |
CN108960490A (zh) * | 2018-06-14 | 2018-12-07 | 国网河南省电力公司经济技术研究院 | 一种基于多品种电力交易的协调优化方法 |
CN110689239A (zh) * | 2019-09-11 | 2020-01-14 | 新奥数能科技有限公司 | 电力用户参与市场实现收益最大化的辅助决策方法及系统 |
-
2020
- 2020-06-01 CN CN202010485738.7A patent/CN111709779A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107784440A (zh) * | 2017-10-23 | 2018-03-09 | 国网辽宁省电力有限公司 | 一种电力信息系统资源调配系统及方法 |
CN108960490A (zh) * | 2018-06-14 | 2018-12-07 | 国网河南省电力公司经济技术研究院 | 一种基于多品种电力交易的协调优化方法 |
CN110689239A (zh) * | 2019-09-11 | 2020-01-14 | 新奥数能科技有限公司 | 电力用户参与市场实现收益最大化的辅助决策方法及系统 |
Non-Patent Citations (2)
Title |
---|
何灵 等: "\"互联网+电网\"模式下智能CRM模型与营销策略研究" * |
曹建军 等: "领域无关数据清洗研究综述" * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113377755A (zh) * | 2021-06-23 | 2021-09-10 | 黑龙江大学 | 电力现货数据的完整性检测及缺失修复方法 |
CN115719238A (zh) * | 2022-11-08 | 2023-02-28 | 国网区块链科技(北京)有限公司 | 一种基于区块链的分布式能源需求处理方法及装置 |
CN115719238B (zh) * | 2022-11-08 | 2024-03-15 | 国网区块链科技(北京)有限公司 | 一种基于区块链的分布式能源需求处理方法及装置 |
CN116090916A (zh) * | 2023-04-10 | 2023-05-09 | 淄博海草软件服务有限公司 | 一种企业内部采购资金核算预警系统 |
CN117217843A (zh) * | 2023-10-18 | 2023-12-12 | 河北建投电力科技服务有限公司 | 基于云计算的电力销售电价数据处理方法 |
CN117217843B (zh) * | 2023-10-18 | 2024-04-19 | 河北建投电力科技服务有限公司 | 基于云计算的电力销售电价数据处理方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Brusaferri et al. | Bayesian deep learning based method for probabilistic forecast of day-ahead electricity prices | |
CN111709779A (zh) | 一种用于电力现货市场的交易品种优化系统 | |
US11966975B2 (en) | Futures margin modeling system | |
Guo et al. | The hybrid PROPHET-SVR approach for forecasting product time series demand with seasonality | |
Di Matteo | Multi-scaling in finance | |
Li et al. | Monthly Henry Hub natural gas spot prices forecasting using variational mode decomposition and deep belief network | |
US11107094B2 (en) | Prediction system and prediction method | |
Rompolis | Retrieving risk neutral densities from European option prices based on the principle of maximum entropy | |
US11704751B2 (en) | Futures margin modeling system having seasonality detection | |
Wu et al. | Predication of futures market by using boosting algorithm | |
CN115660182A (zh) | 基于最大期望样本加权神经网络模型的光伏出力预测方法 | |
Ishaque | Revisiting income and price elasticities of electricity demand in Pakistan | |
Chatterjee et al. | Stock volatility prediction using time series and deep learning approach | |
Fu et al. | Forecasting stock index futures intraday returns: Functional time series model | |
Sudipa et al. | Trend Forecasting of the Top 3 Indonesian Bank Stocks Using the ARIMA Method | |
JP2004252967A (ja) | 電力取引リスク管理システム及び電力取引リスク管理方法 | |
Kim et al. | Estimation and prediction under local volatility jump–diffusion model | |
CN114358359A (zh) | 基于电力市场发展态势感知的电费回收风险预警方法 | |
CN117151276A (zh) | 售电平台的智能化管理系统 | |
CN112348220A (zh) | 一种基于企业行为模式的信用风险评估预测方法及系统 | |
CN115829418A (zh) | 适用于负荷管理的电力用户负荷特性画像构建方法和系统 | |
CN115809927A (zh) | 一种基于数字经济的风险评估方法 | |
CN114066539A (zh) | 一种基于电力市场交易的电力系统生产模拟方法及装置 | |
Tao et al. | Forecasting crude oil prices based on an internet search driven model | |
Han et al. | Quantitative investment decision model based on ARIMA and iterative neural network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200925 |