CN115034473A - 一种电价预测方法、系统及装置 - Google Patents
一种电价预测方法、系统及装置 Download PDFInfo
- Publication number
- CN115034473A CN115034473A CN202210654893.6A CN202210654893A CN115034473A CN 115034473 A CN115034473 A CN 115034473A CN 202210654893 A CN202210654893 A CN 202210654893A CN 115034473 A CN115034473 A CN 115034473A
- Authority
- CN
- China
- Prior art keywords
- data sequence
- electricity price
- feature
- sequence
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000005611 electricity Effects 0.000 title claims abstract description 131
- 238000000034 method Methods 0.000 title claims abstract description 32
- 238000012216 screening Methods 0.000 claims abstract description 50
- 239000011159 matrix material Substances 0.000 claims description 39
- 230000006870 function Effects 0.000 claims description 32
- 238000012549 training Methods 0.000 claims description 16
- 238000000354 decomposition reaction Methods 0.000 claims description 14
- 238000013528 artificial neural network Methods 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 10
- 238000002474 experimental method Methods 0.000 claims description 9
- 230000015654 memory Effects 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 8
- 238000013527 convolutional neural network Methods 0.000 claims description 6
- 238000004422 calculation algorithm Methods 0.000 claims description 5
- 238000010276 construction Methods 0.000 claims description 3
- 238000012360 testing method Methods 0.000 claims 1
- 238000012163 sequencing technique Methods 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 7
- 230000000306 recurrent effect Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 3
- 230000000052 comparative effect Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000003449 preventive effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0283—Price estimation or determination
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S50/00—Market activities related to the operation of systems integrating technologies related to power network operation or related to communication or information technologies
- Y04S50/14—Marketing, i.e. market research and analysis, surveying, promotions, advertising, buyer profiling, customer management or rewards
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Economics (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- General Physics & Mathematics (AREA)
- Marketing (AREA)
- Human Resources & Organizations (AREA)
- General Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- Tourism & Hospitality (AREA)
- General Health & Medical Sciences (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Game Theory and Decision Science (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Primary Health Care (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Water Supply & Treatment (AREA)
- Public Health (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种电价预测方法、系统及装置,通过深入研究电价与负荷的相关关系,对负荷进行分解,深入挖掘其间的相关性,本发明先对特征进行过滤式筛选,再进行包裹式筛选计算特征重要性进行排序,可以减少有效减少冗余信息的输入;将特征按照特征重要性进行重构,可以有效使模型更好的关注到较为重要的特征信息。
Description
技术领域
本发明涉及电价分析与预测技术领域,特别是涉及一种电价预测方法、系统及装置。
背景技术
市场电价很大程度上反映了整个电力行业的经济状况,准确预测短期电价不仅可以帮助市场参与者获取更高利润,还能辅助市场监管机构制定最佳预防性监管措施以最小限度介入、引导市场实现基本目标。电价本质上是高度不稳定的,尽管每个市场都存在波动风险,但电力市场的波动程度要高于其他市场。主要原因是电力供需须保持实时平衡,然而存储电力的成本很高且无法大量存储。一般来说,影响供需平衡的原因很多,因此对电价波动也起着至关重要的作用。
如今,电可等同为其他任何商品,可在电力市场的规划下进行买卖和交易,这是全球电力市场自由化的结果。为了降低风险、增加利润和制定未来的计划,对于电力市场的参与者来说预测未来电价是极其重要的。但目前的现有技术中并没有能够精确预测预测未来电价的方法。
发明内容
为了克服现有技术的不足,本发明的目的是提供一种电价预测方法、系统及装置。
为实现上述目的,本发明提供了如下方案:
一种电价预测方法,包括:
选取目标区域对应指定时间段内的电价数据序列、温度数据序列、湿度数据序列和用电负荷数据序列;
对所述用电负荷数据序列进行分解,得到所述用电负荷数据序列所对应的各个负荷固有模态函数序列与余项;
分别计算所述电价数据序列与预设长度的电价数据序列、所述温度数据序列、所述湿度数据序列、各个所述固有模态函数序列和所述余项的相关性;
根据各个所述相关性对影响电价预测的影响因素进行筛选,得到所述备选特征集;
利用包裹式特征筛选,基于所述备选特征集与所述电价数据序列构建重要度模型,并根据所述重要度模型得到各个所述影响因素的特征重要度;
根据所述备选特征集和所述特征重要度构建特征矩阵;
根据所述特征矩阵和所述电价数据序列对各个待测模型进行训练,并根据训练结果对所述待测模型进行筛选,得到电价预测模型;所述电价预测模型用于对未来电价进行预测。
优选地,所述对所述用电负荷数据序列进行分解,得到所述用电负荷数据序列所对应的各个负荷固有模态函数序列与余项,包括:
令s(n)表示原始的电价数据序列,vi(n)表示第i次添加的服从标准正态分布的白噪声序列,εk为第k个信噪比,并定义Ek(·)为通过EMD算法产生第k个IMF的算子,si(n)表示第i次添加了噪声的电价序列,si(n)=s(n)+ε0,i为实验次数,i=1,2,…,I;I为总实验次数;
将所有si(n)分别进行EMD,并将所有模态分量求和后平均得到第1个模态分量IMF1和唯一余量r1(n)=s(n)-IMF1(n);
优选地,所述分别计算所述电价数据序列与预设长度的电价数据序列、所述温度数据序列、所述湿度数据序列、各个所述固有模态函数序列和所述余项的相关性,包括:
分别基于所述电价数据序列与预设长度的电价数据序列、所述温度数据序列、所述湿度数据序列、各个所述固有模态函数序列和所述余项进行网格划分,得到多个网格;
对每个所述网格中的网格栅进行穷举,计算得到最大互信息系数;
根据所述最大户信息系数确定所述相关性。
优选地,所述根据各个所述相关性对影响电价预测的影响因素进行筛选,得到所述备选特征集,包括:
根据所述相关性设置固定阈值;
根据所述固定阈值对所述影响因素进行筛选,若所述相关性大于所述固定阈值,则将所述相关性对应的序列确定为所述备选特征集中的元素。
优选地,所述重要度模型为XGBoost模型。
优选地,所述根据所述备选特征集和所述特征重要度构建特征矩阵,包括:
将所述备选特征集中的2n个特征分别按照所述特征重要度进行降序排列,并将特征重要度后n个所述特征放在矩阵的第一行,将特征重要度前n个所述特征放到矩阵的第二行,得到所述特征矩阵;其中n为大于或等于1的正整数。
优选地,所述待测模型包括LSTM预测模型、GRU预测模型、RNN预测模型、CNN预测模型和BP神经网络预测模型。
一种电价预测系统,包括:
序列选取模块,用于选取目标区域对应指定时间段内的电价数据序列、温度数据序列、湿度数据序列和用电负荷数据序列;
分解模块,用于对所述用电负荷数据序列进行分解,得到所述用电负荷数据序列所对应的各个负荷固有模态函数序列与余项;
相关性计算模块,用于分别计算所述电价数据序列与预设长度的电价数据序列、所述温度数据序列、所述湿度数据序列、各个所述固有模态函数序列和所述余项的相关性;
筛选模块,用于根据各个所述相关性对影响电价预测的影响因素进行筛选,得到所述备选特征集;
重要度计算模块,用于利用包裹式特征筛选,基于所述备选特征集与所述电价数据序列构建重要度模型,并根据所述重要度模型得到各个所述影响因素的特征重要度;
矩阵构建模块,用于根据所述备选特征集和所述特征重要度构建特征矩阵;
预测模块,用于根据所述特征矩阵和所述电价数据序列对各个待测模型进行训练,并根据训练结果对所述待测模型进行筛选,得到电价预测模型;所述电价预测模型用于对未来电价进行预测。
一种电子设备,包括总线、收发器、存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述收发器、所述存储器和所述处理器通过所述总线相连,其特征在于,所述计算机程序被所述处理器执行时实现如上述方法。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述方法中的步骤。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明提供了一种电价预测方法、系统及装置,深入研究电价与负荷的相关关系时,对负荷进行分解,深入挖掘其间的相关性,先对特征进行过滤式筛选,再进行包裹式筛选计算特征重要性进行排序,可以减少有效减少冗余信息的输入;将特征按照特征重要性进行重构,并在具体实施例中利用LSTM时间步的特点,可以有效使模型更好的关注到较为重要的特征信息。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的实施例中的电价预测方法的流程图;
图2为本发明提供的实施例中的实施步骤框图;
图3为本发明提供的实施例中的原始负荷的CEEMDAN分解后各模态及余项示意图;
图4为本发明提供的实施例中的LSTM模型结构图;
图5为本发明提供的实施例中的LSTM模型电价预测结果。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种电价预测方法、系统及装置,能够精确预测预测未来电价。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
图1为本发明提供的实施例中的电价预测方法的流程图,如图1所示,本发明提供了一种电价预测方法,包括:
步骤100:选取目标区域对应指定时间段内的电价数据序列、温度数据序列、湿度数据序列和用电负荷数据序列;
步骤200:对所述用电负荷数据序列进行分解,得到所述用电负荷数据序列所对应的各个负荷固有模态函数序列与余项;
步骤300:分别计算所述电价数据序列与预设长度的电价数据序列、所述温度数据序列、所述湿度数据序列、各个所述固有模态函数序列和所述余项的相关性;
步骤400:根据各个所述相关性对影响电价预测的影响因素进行筛选,得到所述备选特征集;
步骤500:利用包裹式特征筛选,基于所述备选特征集与所述电价数据序列构建重要度模型,并根据所述重要度模型得到各个所述影响因素的特征重要度;
步骤600:根据所述备选特征集和所述特征重要度构建特征矩阵;
步骤700:根据所述特征矩阵和所述电价数据序列对各个待测模型进行训练,并根据训练结果对所述待测模型进行筛选,得到电价预测模型;所述电价预测模型用于对未来电价进行预测。
图2为本发明提供的实施例中的实施步骤框图,如图2所示,本实施例中公开了如下步骤:
步骤1:选取目标区域对应指定时间段内的电价数据序列、以及温度数据序列、湿度数据序列、用电负荷数据序列;
步骤2:针对用电负荷数据序列进行分解,获得用电负荷数据序列所对应的各个负荷固有模态函数序列与余项;
步骤3:分别计算电价数据序列与其前四十八期电价数据序列的相关性、电价数据序列与温度数据序列的相关性、电价数据序列与湿度数据序列的相关性、电价数据序列与分解后的各个固有模态函数序列和余项的相关性;
步骤4:根据步骤3计算的相关性,设置固定阈值,进行影响电价预测的影响因素的筛选,与电价数据序列相关性高于阈值的因素选进备选特征集中,否则直接不作为构建电价预测时的输入特征;
步骤5:根据步骤4所筛选的备选特征集,使用包裹式特征筛选,将现有备选特征集与电价数据数据序列构建模型,得到各个影响因素的重要度排序;
步骤6:利用特征重要性重构特征矩阵。将2n个特征{x1,x2,x3,…,x2n}分别按照计算得出的特征重要度从高到低,重要度后n个的特征放到矩阵的第一行,重要度前n个的特征放到矩阵的第二行,得到一个新的特征矩阵。
步骤7:以步骤6所重构过的特征矩阵作为输入,电价数据序列为输出,应用指定各个预测模型进行训练,对比进行过特征筛选和重构后的预测模型与未进行过特征筛选和重构的预测模型,获得最终的电价预测模型。
优选地,所述步骤200具体包括:
令s(n)表示原始的电价数据序列,vi(n)表示第i次添加的服从标准正态分布的白噪声序列,εk为第k个信噪比,并定义Ek(·)为通过EMD算法产生第k个IMF的算子,si(n)表示第i次添加了噪声的电价序列,si(n)=s(n)+ε0,i为实验次数,i=1,2,…,I;I为总实验次数;
将所有si(n)分别进行EMD,并将所有模态分量求和后平均得到第1个模态分量IMF1和唯一余量r1(n)=s(n)-IMF1(n);
进一步地,图3为本发明提供的实施例中的原始负荷的CEEMDAN分解后各模态及余项示意图,如图3所示,图3为本实施例中分解后的各项结果示意图,本实施例中步骤2具体包括:
步骤201:令s(n)表示原始电价序列,vi(n)为第i次添加的服从标准正态分布的白噪声序列,εk为第k个信噪比,定义Ek(·)为通过EMD算法产生第k个IMF的算子。si(n)表示第i次添加了噪声的电价序列,si(n)=s(n)+ε0,i为实验次数,i=1,2,…,I。
步骤202:将所有si(n)分别进行EMD,然后将所有模态分量求和后平均得到第1个模态分量IMF1和唯一余量r1(n)=s(n)-IMF1(n)。
步骤203:为了得到第2个模态分量,继续对r1(n)+ε1E1[vi(n)]进行I次分解,得到第1个IMF,最后得到CEEMDAN的第2个IMF,即
步骤204:第k个余量信号计算方法与步骤3相同,k=2,…,K,第k+1个IMF可表示为:
r1(n)=s(n)-IMF1(n)
步骤205:执行步骤4直到所有余量序列不可继续进行分解,也就是余量序列的极值点个数要小于等于两个。
最终得到的余量序列为:
因此原始电价序列被分解为:
优选地,所述步骤300具体包括:
分别基于所述电价数据序列与预设长度的电价数据序列、所述温度数据序列、所述湿度数据序列、各个所述固有模态函数序列和所述余项进行网格划分,得到多个网格;
对每个所述网格中的网格栅进行穷举,计算得到最大互信息系数;
根据所述最大户信息系数确定所述相关性。
具体的,本实施例中步骤3为分别计算电价数据序列与其前四十八期电价数据序列的相关性、电价数据序列与温度数据序列的相关性、电价数据序列与湿度数据序列的相关性、电价数据序列与分解后的各个固有模态函数序列和余项的相关性,对于两个变量,如果两个变量之间有一定的相关性,那么可以在二维平面中通过绘制网格栅(x,y)将两变量组成的散点图的数据点分割开,再通过穷举所有的网格栅的方法计算MIC。该方法基于互信息(MI)的基础提出,不仅有着互信息所有的优良特性,同时还克服了互信息的相关缺陷,它寻找出了一种最优的离散化方式,可以把互信息取值转换成一种度量方式,以MIC值直接代表相关性强弱,其取值范围为[0,1]。
进一步地,步骤3具体包括:
步骤301:给定有限有序的数据集X={x1,x2,x3,...,xn}如果将x轴划分为x个格子,y轴划分为y个格子,那么就可以得到一个x×y的网格划分G,其中x,y是正整数,将落入G的点的数量占X数量的比例看作是其概率密度X|G,而根据不同的网格划分情况得到的概率分布X|G也不同。
步骤302:在X={x1,x2,x3,...,xn}中,两变量xi和xj之间的互信息可以定义为:
步骤303:在x,y给定的情况下,若改变x,y的值,得到的互信息值也会发生变化,记录其中最大的互信息值为I(X,xi,xj)。然后执行归一化以比较不同维数下的数据集,并且归一化后的值在[0,1]之间。通过更改x,y的值,可以获得变量之间归一化后的互信息值特征矩阵。特征矩阵的最大值是两个变量之间的最大信息系数MIC值。
步骤304:X={x1,x2,x3,...,xn}样本容量取值为n,网格化的分数取值小于B(n)。则最大信息系数可以定义为:
MIC(X)=maxxy<B(n){M(X)x,y}
式中,x,y是在x轴y轴方向上的划分格子的个数,也就是网格分布,其中B(n)是一个变量,B(n)的大小一般为数据n的0.6次方左右,即B(n)≈n0.6。
优选地,所述步骤400具体包括:
根据所述相关性设置固定阈值;
根据所述固定阈值对所述影响因素进行筛选,若所述相关性大于所述固定阈值,则将所述相关性对应的序列确定为所述备选特征集中的元素。
进一步地,本实施例中步骤4为:根据步骤3计算的相关性,设置固定阈值,进行影响电价预测的影响因素的筛选,与电价数据序列相关性高于阈值的因素选进备选特征集中,否则直接不作为构建电价预测时的输入特征。
可选地,本实施例中步骤5为根据步骤4所筛选的备选特征集,使用包裹式特征筛选,将现有备选特征集与电价数据数据序列拟合XGBoost模型,XGBoost是一种基于集成学习的树提升模型,思想是不断往模型中添加不同的树,通过特征分裂来生长树模型,每棵树拟合之前所有树预测和的残差。训练过程中,某特征(即影响因素)在所有树中每次分裂结点时带来的总的信息增益可认为是该特征的重要性得分,反映它与模型输出(即电量)之间的相关性。得到各个影响因素的重要度排序;
步骤501:在每一次尝试对树中已有的叶结点进行分裂时,都计算所选取特征的增益θ:
其中,下标L、R分别代表左子树和右子树,为左子树的信息分数,为右子树的信息分数,为当前不分裂的信息分数;G=∑i∈I gi,H=∑i∈Ihi,gi是预测误差对当前模型的一阶导数,hi是预测误差对当前模型的二阶导数,I为每个叶子上面样本的集合;γ是加入新叶子结点引入的复杂度代价。
步骤502:用XGBoost模型对输入数据为备选特征即,输出数据为电价数据序列的数据集进行训练。当生成t棵树时,对n个特征,将每个特征在每棵树结点分裂时的信息增益累加起来,就得到该特征在所有树中每次分裂结点时带来的总的信息增益,也就是该特征的重要性得分。即,对于第i个特征,总的信息增益表示为:
优选地,所述步骤600具体包括:
将所述备选特征集中的2n个特征分别按照所述特征重要度进行降序排列,并将特征重要度后n个所述特征放在矩阵的第一行,将特征重要度前n个所述特征放到矩阵的第二行,得到所述特征矩阵;其中n为大于或等于1的正整数。
进一步地,本实施例中利用特征重要性重构特征矩阵。将2n个特征{x1,x2,x3,...,x2n}分别按照计算得出的特征重要度从高到低,重要度后n个的特征放到矩阵的第一行,重要度前n个的特征放到矩阵的第二行,得到一个新的特征矩阵。
优选地,所述待测模型包括LSTM预测模型、GRU预测模型、RNN预测模型、CNN预测模型和BP神经网络预测模型。
可选地,本实施例中步骤7具体为:以步骤6所重构过的特征矩阵作为输入,电价数据序列为输出,应用指定各个预测模型进行训练,对比进行过特征筛选和重构后的预测模型与未进行过特征筛选和重构的预测模型,获得最终的电价预测模型。
进一步地,本实施例还包括步骤8至步骤12,具体如下:
步骤8:基于MAPE的确定性预测效果评价:使用确定的性能指标平均绝对百分比误差(Mean Absolute Percentage Error,MAPE)值来衡量对比实验中的误差比较。MAPE误差评价指标的计算公式如下所示:
其中,yfi为i时刻的预测值;yri为i时刻的真实值;N为数据数量。
步骤9:基于RMSE的确定性预测效果评价:RMSE的计算公式定义如下:
步骤10:循环神经网络(Recurrent Neural Network,RNN)是一类以序列数据为输入,在序列的演进方向进行递归且所有节点(循环单元)按链式连接的递归神经网络。虽然循环神经网络在对序列的非线性特征进行学习时具有一定优势,但是因为所有的RNN只具有一种重复神经网络模块的链式形式,所以一般的RNN往往存在长期依赖问题。
而长短期记忆人工神经网络(Long Short-Term Memory,LSTM)作为RNN的一种变体,消除了RNN模型因梯度消失而可能带来的负面影响。不同于RNN的单一神经网络层,LSTM在重复模块中加入了一个特殊的“处理器”来判断信息是否有利用价值。在非线性模型建立更大型深度神经网络的时候,LSTM可在其中扮演复杂非线性单元的角色。LSTM模型的具体结构如图4所示。
由图4可知,每个LSTM单元包含3个控制门,浅蓝色为遗忘门,它决定了上一时刻的单元状态Ct-1保存到当前时刻Ct的数量,公式如(6.1)所示,其中Wf表示遗忘门的权重矩阵,遗忘门的偏置项为bf,σ代表sigmoid函数;蓝色为输入门,它决定了单元状态Ct中当前时刻网络输入Xt的数量,下示公式:
ft=σ(Wf·[ht-1,xt]+bf)
it=σ(Wi·[ht-1,xt]+bi)
C’t=tanh(WC·[ht-1,xt]+bC)
为其更新公式;深蓝色为输出门,它控制输出到LSTM当前输出值ht的单元状态Ct的数量,其更新公式如下。
Ct=ft*Ct-1+it*C’t
ot=σ(Wo·[ht-1,xt]+bo)
ht=ot*tanh(Ct)
步骤11:对比实验,如表1和表2所示:
表1
MAPE | RMSE | |
进行过特征筛选 | 7.1122 | 2.4765 |
没有进行特征筛选 | 11.9106 | 3.5089 |
表2
MAPE | RMSE | |
特征经过分解 | 7.1122 | 2.4765 |
特征不经过分解 | 8.7113 | 2.8144 |
从表1和表2中可以明显看出,对于进行过特征分解并且特征筛选以后,再选用LSTM模型进行预测,所得的MAPE值和RMSE值都比不进行特征筛选或不进行特征分解有明显降低,所以进行特征分解和特征筛选是十分有必要的。
步骤12:以上选用的是LSTM模型,下面对比此特征筛选方法是否在其他模型上也适用,在循环神经网络中如表3所示:
表3
以上选用的是循环神经网络中最原始的RNN模型,以及经过变体的GRU模型和LSTM模型,可以看出明显经过特征筛选后的MAPE值和RMSE值都有明显降低。
步骤13:选择其他神经网络算法,无法像LSTM一样经过特征排序重构,所以以下对比经过MIC特征过滤在一些模型预测中的效果,如表4所示:
表4
图5为本发明提供的实施例中的LSTM模型电价预测结果,以上选用的BP神经网络模型,和CNN模型,其中可以看出对于BP神经网络模型和1维CNN模型中,进行特征过滤后,在MAPE和RMSE上都取得了较好的结果,但是对于2维CNN模型,由于在特征中选择了前48期的用电负荷数据及其他相关因素均作为特征进行筛选,虽然筛选前后,MAPE值和RMSE值都有显著降低,但最后的结果相较其他模型效果不是很好,这也说明了模型对于特征的输入有着较高要求,在进行预测建模前,进行特征筛选显得尤为重要。
作为一种可选的实时方式,本实施例可以更加细粒度分析特征与待预测序列(即电价)的相关性,通过特征筛选和重构提高预测模型的精度。
对应上述方法,本实施例还提供了一种电价预测系统,包括:
序列选取模块,用于选取目标区域对应指定时间段内的电价数据序列、温度数据序列、湿度数据序列和用电负荷数据序列;
分解模块,用于对所述用电负荷数据序列进行分解,得到所述用电负荷数据序列所对应的各个负荷固有模态函数序列与余项;
相关性计算模块,用于分别计算所述电价数据序列与预设长度的电价数据序列、所述温度数据序列、所述湿度数据序列、各个所述固有模态函数序列和所述余项的相关性;
筛选模块,用于根据各个所述相关性对影响电价预测的影响因素进行筛选,得到所述备选特征集;
重要度计算模块,用于利用包裹式特征筛选,基于所述备选特征集与所述电价数据序列构建重要度模型,并根据所述重要度模型得到各个所述影响因素的特征重要度;
矩阵构建模块,用于根据所述备选特征集和所述特征重要度构建特征矩阵;
预测模块,用于根据所述特征矩阵和所述电价数据序列对各个待测模型进行训练,并根据训练结果对所述待测模型进行筛选,得到电价预测模型;所述电价预测模型用于对未来电价进行预测。
本实施例还提供了一种电子设备,包括总线、收发器、存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述收发器、所述存储器和所述处理器通过所述总线相连,其特征在于,所述计算机程序被所述处理器执行时实现如上述方法。
本实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述方法中的步骤。
本发明的有益效果如下:
本发明深入研究电价与负荷的相关关系时,对负荷进行分解,深入挖掘其间的相关性,先对特征进行过滤式筛选,再进行包裹式筛选计算特征重要性进行排序,可以减少有效减少冗余信息的输入;将特征按照特征重要性进行重构,利用LSTM时间步的特点,可以有效使模型更好的关注到较为重要的特征信息。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种电价预测方法,其特征在于,包括:
选取目标区域对应指定时间段内的电价数据序列、温度数据序列、湿度数据序列和用电负荷数据序列;
对所述用电负荷数据序列进行分解,得到所述用电负荷数据序列所对应的各个负荷固有模态函数序列与余项;
分别计算所述电价数据序列与预设长度的电价数据序列、所述温度数据序列、所述湿度数据序列、各个所述固有模态函数序列和所述余项的相关性;
根据各个所述相关性对影响电价预测的影响因素进行筛选,得到所述备选特征集;
利用包裹式特征筛选,基于所述备选特征集与所述电价数据序列构建重要度模型,并根据所述重要度模型得到各个所述影响因素的特征重要度;
根据所述备选特征集和所述特征重要度构建特征矩阵;
根据所述特征矩阵和所述电价数据序列对各个待测模型进行训练,并根据训练结果对所述待测模型进行筛选,得到电价预测模型;所述电价预测模型用于对未来电价进行预测。
2.根据权利要求1所述的方法,其特征在于,所述对所述用电负荷数据序列进行分解,得到所述用电负荷数据序列所对应的各个负荷固有模态函数序列与余项,包括:
令s(n)表示原始的电价数据序列,vi(n)表示第i次添加的服从标准正态分布的白噪声序列,εk为第k个信噪比,并定义Ek(·)为通过EMD算法产生第k个IMF的算子,si(n)表示第i次添加了噪声的电价序列,si(n)=s(n)+ε0,i为实验次数,i=1,2,…,I;I为总实验次数;
将所有si(n)分别进行EMD,并将所有模态分量求和后平均得到第1个模态分量IMF1和唯一余量r1(n)=s(n)-IMF1(n);
3.根据权利要求1所述的方法,其特征在于,所述分别计算所述电价数据序列与预设长度的电价数据序列、所述温度数据序列、所述湿度数据序列、各个所述固有模态函数序列和所述余项的相关性,包括:
分别基于所述电价数据序列与预设长度的电价数据序列、所述温度数据序列、所述湿度数据序列、各个所述固有模态函数序列和所述余项进行网格划分,得到多个网格;
对每个所述网格中的网格栅进行穷举,计算得到最大互信息系数;
根据所述最大户信息系数确定所述相关性。
4.根据权利要求1所述的方法,其特征在于,所述根据各个所述相关性对影响电价预测的影响因素进行筛选,得到所述备选特征集,包括:
根据所述相关性设置固定阈值;
根据所述固定阈值对所述影响因素进行筛选,若所述相关性大于所述固定阈值,则将所述相关性对应的序列确定为所述备选特征集中的元素。
5.根据权利要求1所述的方法,其特征在于,所述重要度模型为XGBoost模型。
6.根据权利要求1所述的方法,其特征在于,所述根据所述备选特征集和所述特征重要度构建特征矩阵,包括:
将所述备选特征集中的2n个特征分别按照所述特征重要度进行降序排列,并将特征重要度后n个所述特征放在矩阵的第一行,将特征重要度前n个所述特征放到矩阵的第二行,得到所述特征矩阵;其中n为大于或等于1的正整数。
7.根据权利要求1所述的方法,其特征在于,所述待测模型包括LSTM预测模型、GRU预测模型、RNN预测模型、CNN预测模型和BP神经网络预测模型。
8.一种电价预测系统,其特征在于,包括:
序列选取模块,用于选取目标区域对应指定时间段内的电价数据序列、温度数据序列、湿度数据序列和用电负荷数据序列;
分解模块,用于对所述用电负荷数据序列进行分解,得到所述用电负荷数据序列所对应的各个负荷固有模态函数序列与余项;
相关性计算模块,用于分别计算所述电价数据序列与预设长度的电价数据序列、所述温度数据序列、所述湿度数据序列、各个所述固有模态函数序列和所述余项的相关性;
筛选模块,用于根据各个所述相关性对影响电价预测的影响因素进行筛选,得到所述备选特征集;
重要度计算模块,用于利用包裹式特征筛选,基于所述备选特征集与所述电价数据序列构建重要度模型,并根据所述重要度模型得到各个所述影响因素的特征重要度;
矩阵构建模块,用于根据所述备选特征集和所述特征重要度构建特征矩阵;
预测模块,用于根据所述特征矩阵和所述电价数据序列对各个待测模型进行训练,并根据训练结果对所述待测模型进行筛选,得到电价预测模型;所述电价预测模型用于对未来电价进行预测。
9.一种电子设备,包括总线、收发器、存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述收发器、所述存储器和所述处理器通过所述总线相连,其特征在于,所述计算机程序被所述处理器执行时实现如权利要求1至7中任一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210654893.6A CN115034473A (zh) | 2022-06-10 | 2022-06-10 | 一种电价预测方法、系统及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210654893.6A CN115034473A (zh) | 2022-06-10 | 2022-06-10 | 一种电价预测方法、系统及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115034473A true CN115034473A (zh) | 2022-09-09 |
Family
ID=83122193
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210654893.6A Pending CN115034473A (zh) | 2022-06-10 | 2022-06-10 | 一种电价预测方法、系统及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115034473A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116050270A (zh) * | 2023-02-07 | 2023-05-02 | 合肥学院 | 一种pm2.5浓度预测方法及系统 |
CN116579842A (zh) * | 2023-07-13 | 2023-08-11 | 南开大学 | 基于用户行为数据的信用数据分析方法及系统 |
-
2022
- 2022-06-10 CN CN202210654893.6A patent/CN115034473A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116050270A (zh) * | 2023-02-07 | 2023-05-02 | 合肥学院 | 一种pm2.5浓度预测方法及系统 |
CN116579842A (zh) * | 2023-07-13 | 2023-08-11 | 南开大学 | 基于用户行为数据的信用数据分析方法及系统 |
CN116579842B (zh) * | 2023-07-13 | 2023-10-03 | 南开大学 | 基于用户行为数据的信用数据分析方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Li et al. | Optimal selection of heterogeneous ensemble strategies of time series forecasting with multi-objective programming | |
Moody | Economic forecasting: Challenges and neural network solutions | |
CN110245801A (zh) | 一种基于组合挖掘模型的电力负荷预测方法及系统 | |
CN115034473A (zh) | 一种电价预测方法、系统及装置 | |
CN112884236B (zh) | 一种基于vdm分解与lstm改进的短期负荷预测方法及系统 | |
CN113408869A (zh) | 一种配电网建设目标风险评估方法 | |
Panda et al. | Long term electrical load forecasting: an empirical study across techniques and domains | |
CN113505534A (zh) | 一种考虑需求响应的负荷预测方法 | |
CN114399032A (zh) | 一种电能表计量误差预测方法及系统 | |
Bal et al. | A comparison of different model selection criteria for forecasting EURO/USD exchange rates by feed forward neural network | |
CN112990587A (zh) | 一种对台区用电进行精准预测的方法及系统、设备、介质 | |
CN115600729A (zh) | 一种考虑多属性网格电网负荷预测方法 | |
CN113822499A (zh) | 一种基于模型融合的列车备件损耗预测方法 | |
CN115619025A (zh) | 基于meemd与最优组合集成的电力负荷三角模糊预测方法 | |
CN115409292A (zh) | 一种电力系统短期负荷预测方法及相关装置 | |
CN110738363B (zh) | 一种光伏发电功率预测方法 | |
CN116702992A (zh) | 一种发电功率预测方法、装置、电子设备及存储介质 | |
CN117557304B (zh) | 基于模态分解与神经网络的电量电价层级融合预测方法 | |
Madhavi et al. | Multivariate deep causal network for time series forecasting in interdependent networks | |
Khadr et al. | GA-based implicit stochastic optimization and RNN-based simulation for deriving multi-objective reservoir hedging rules | |
CN114784795A (zh) | 风电功率预测方法、装置、电子设备及存储介质 | |
CN113887570B (zh) | 一种基于神经网络的太阳耀斑二分类预测方法 | |
Cárdenas-Cárdenas et al. | Colombian inflation forecast using long short-term memory approach | |
CN114595890A (zh) | 基于bp-svr组合模型的船舶备件需求预测方法及系统 | |
CN115879590A (zh) | 一种基于小波特征提取与集成学习模型的负荷预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |