CN114626606A - 一种考虑特征重要性值波动的mi-bilstm预测方法 - Google Patents
一种考虑特征重要性值波动的mi-bilstm预测方法 Download PDFInfo
- Publication number
- CN114626606A CN114626606A CN202210256619.3A CN202210256619A CN114626606A CN 114626606 A CN114626606 A CN 114626606A CN 202210256619 A CN202210256619 A CN 202210256619A CN 114626606 A CN114626606 A CN 114626606A
- Authority
- CN
- China
- Prior art keywords
- input
- load
- formula
- prediction
- matrix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 25
- 239000011159 matrix material Substances 0.000 claims abstract description 39
- 238000004364 calculation method Methods 0.000 claims description 11
- 230000006870 function Effects 0.000 claims description 10
- 230000015654 memory Effects 0.000 claims description 10
- 238000009826 distribution Methods 0.000 claims description 8
- 230000008859 change Effects 0.000 claims description 7
- 238000010606 normalization Methods 0.000 claims description 6
- 230000002457 bidirectional effect Effects 0.000 claims description 4
- 238000012937 correction Methods 0.000 claims description 4
- 238000012549 training Methods 0.000 claims description 4
- 239000000203 mixture Substances 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 238000001556 precipitation Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 3
- 239000013589 supplement Substances 0.000 claims description 3
- 150000001875 compounds Chemical class 0.000 claims description 2
- 230000007787 long-term memory Effects 0.000 claims description 2
- 230000008569 process Effects 0.000 claims description 2
- 239000000047 product Substances 0.000 claims description 2
- 238000005070 sampling Methods 0.000 claims description 2
- 238000000638 solvent extraction Methods 0.000 claims description 2
- 230000007547 defect Effects 0.000 abstract description 4
- 239000000284 extract Substances 0.000 abstract description 3
- 230000000694 effects Effects 0.000 description 4
- 238000013135 deep learning Methods 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000000284 resting effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000004146 energy storage Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J3/00—Circuit arrangements for ac mains or ac distribution networks
- H02J3/003—Load forecast, e.g. methods or systems for forecasting future load demand
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Tourism & Hospitality (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- General Business, Economics & Management (AREA)
- Biophysics (AREA)
- Marketing (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Public Health (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Primary Health Care (AREA)
- Evolutionary Biology (AREA)
- Water Supply & Treatment (AREA)
- Power Engineering (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种考虑特征重要性值波动的MI‑BILSTM预测方法,属于电力系统中短期电力负荷预测领域。首先,该方法事先提取不同时刻下输入特征的重要性值,形成重要性值波动矩阵。其次,通过矩阵对原始输入特征进行动态修正,使之内部包含波动信息,即采用互信息法提取特征的重要性值波动,并动态修正原输入特征,使得修正后的输入特征中融合了重要性值波动的信息。最后,将修正后的输入特征带入BILSTM网络中进行短期负荷预测。本发明不仅保留权值共享结构在精简参数方面的优势,并且能够弥补其无法提取重要性值波动的缺陷,提高预测精度。
Description
技术领域
本发明属于电力系统中短期电力负荷预测领域。涉及到互信息法及深度学习相关理论,特别涉及到一种基于互信息提取特征重要性值波动的MI-BILSTM预测方法。
背景技术
短期负荷预测通过对数学、统计学等各种分析工具的运用,探究历史负荷之间的关系与规律,并对未来几个小时或几天的负荷大小进行推测,以保障电力系统的安全运行。近年来,随着储能、新能源、电动汽车接入电网的规模不断增大,以及基于激励、价格的需求侧响应模式的持续发展,短期负荷预测的复杂度明显增加。同时,在电力市场化改革不断推进的背景下,高效、实时的电力交易成为必需,这对短期负荷预测的精确性和可靠性提出了更高的要求。目前,基于深度学习的短期负荷预测已经成为相关领域研究和应用的热点之一。
在深度学习中,LSTM凭借其特有的循环单元,能够同时处理时序性和非线性问题,使得其在短期电力负荷预测中广泛使用。但是,LSTM模型中的权值共享结构具有时不变性,会对负荷预测的精度产生影响。在使用LSTM模型进行短期负荷预测前,需要选取影响负荷变化的因素作为输入特征,包括气象、日期和历史负荷值等。输入特征在不同时刻下对负荷变化的影响力不同,即其重要性值随时间发生了波动。例如,温度在一天中的不同时刻对负荷变化的影响大小具有明显差异。而权值共享结构的时不变性,使之不能动态追踪输入特征的重要性值随时间而产生的波动,进而影响预测精度。因此,需要采用互信息(mutualinformation,MI)度量不同时刻下输入特征的重要性,并进行动态修正,以提高预测精度。
发明内容
本发明的目的是为了追踪输入特征的重要性值随时间出现的波动,进一步提高预测精度,提出一种考虑特征重要性值波动的MI-BILSTM短期负荷预测方法。该方法事先提取不同时刻下输入特征的重要性值,形成重要性值波动矩阵,接着通过矩阵对原始输入特征进行动态修正,使之内部包含波动信息。最后,将修正后的输入特征带入BILSTM网络中进行短期负荷预测,不仅保留权值共享结构在精简参数方面的优势,并且弥补其无法提取重要性值波动的缺陷,提高预测精度。
本发明的技术方案是:
一种考虑特征重要性值波动的MI-BILSTM短期负荷预测方法,包括以下步骤:
步骤1.确定预测日期。
步骤2.将预测日的日期特征、气象特征输入数据库。
步骤3.数据库数据预处理,包括缺失数据补充、数据归一化。
步骤4.采用高斯混合模型聚类(gaussian mixture model,GMM)进行日负荷场景划分。首先将日期特征作为初次GMM聚类的输入,完成日负荷场景的初次划分工作。
所述GMM聚类的求解步骤如下:
(1)初始化k个多元高斯分布的参数α、μ和Σ,三组参数如式(1)所示:
式中,αj、μj和∑j分别为第j个高斯分布的权重、均值和协方差;k为高斯分布的总个数。
(2)遍历所有样本点,计算样本点xi由第j类别所生成的概率γj(xi),计算公式如式(2)所示:
式中,xi为表征日负荷场景划分的输入数据;n为xi的维度;D为日负荷数据库中的总天数。
(3)按照式(3)得到αj、μj和∑j的更新值αj′、μj′和∑j′。
式中,αj′、μj′和Σj′分别为第j个高斯分布更新后的权重、均值和协方差。
日期特征是影响日负荷场景划分的显著因素。因此,初次GMM聚类以日期特征为输入完成聚类。日期特征分为工作日、周末、法定节假日三种不同的情况,按照one-hot编码形式对日期特征进行编码。即工作日为[1,0,0],周末为[0,1,0],法定节假日为[0,0,1]。当周末与法定节假日重合时,统一按照节假日处理,后续在节假日场景下进行预测时,加入“是否为周末”这一特征作为区分,具体处理见步骤5。将上述经过编码后的三维日期特征作为初次GMM聚类的输入,完成初次聚类,得到以日期特征为划分的日负荷场景。
步骤5.将气象特征作为二次GMM聚类的输入,完成日负荷场景的二次划分工作。
二次GMM聚类以气象特征作为输入,对日负荷场景进一步细分。气象特征包括温度、湿度、降水量等不同类型的数据,由于温度是影响日负荷变化的显著因素,所以选用一天中的最高温度、最低温度、平均温度作为二次GMM聚类的输入,得到最终的日负荷场景划分结果。
步骤6.按照日负荷场景划分结果,确定各个场景下的输入特征,包括日期特征、气象特征和历史负荷特征三部分组成。
步骤7.使用互信息法MI提取预测日所对应的日负荷场景下的重要性值波动矩阵。通过重要性值矩阵对原始输入特征进行动态修正,使之内部包含波动信息。修正后不仅可以保留权值共享结构在精简参数方面的优势,并且弥补其无法提取重要性值波动的缺陷,提高预测精度。用互信息值量化不同时刻下输入特征数据与输出数据之间的相关性,相关性越强说明输入特征越重要。
互信息值的计算公式如式(4)所示。
式中,M(P,Q)为随机变量P和Q之间的互信息值;pPQ(p,q)为随机变量P和Q的联合概率密度函数;pp(p)为随机变量P的边缘概率密度函数;pQ(q)为随机变量Q的边缘概率密度函数。两个变量间的相关性越强,互信息值越大,当两个变量相互独立时,互信息值为0。
基于MI提取重要性值波动矩阵的求解步骤如下:
(1)确定输出负荷数据集。根据上述日负荷场景划分结果,将电力负荷数据集按照一天中的负荷采样点个数n划分成n组,并将其作为输出数据集O[O1,O2,…,Ot,…,On],t时刻的输出负荷向量为Ot;
(2)确定输入特征数据集。取与上述输出负荷数据集相对应的输入特征集I,即
(4)重复计算(3)。t从1到n循环求解不同时刻下输入特征的重要性值,当t=n时,求解完毕。得到随时间变化的输入特征的重要性值波动矩阵M,即
步骤8.采用重要性值波动矩阵动态修正输入特征。
动态修正输入特征如式(7)所示。
步骤9.将原始数据库划分为训练集和预测集,进行日前预测工作。
步骤10.建立基于BILSTM的负荷预测模型,完成预测工作。
将修正后的输入特征I′代入BILSTM中进行负荷预测,LSTM的计算流程如下:
遗忘门:
ft=σ(Wf[ht-1,it]+bf) (8)
式中,Wf为遗忘门权值矩阵;σ为sigmoid函数;ht-1为t-1时刻输出;it为t时刻输入特征;bf为遗忘门偏置矩阵。
输入门:
dt=σ(Wi[ht-1,it]+bi) (9)
式中,Wi为输入门权值矩阵;bi为输入门偏置矩阵。
记忆单元:
输出门:
ut=σ(Wo[ht-1,it]+bo) (12)
式中,Wo为输出门权值矩阵;bo为输出门偏置矩阵;ut为t时刻的输出门状态。
ht=ut⊙tanh(ct) (13)
式中,ht为LSTM单元t时刻的最终输出。
BILSTM由前向LSTM和后向LSTM两部分组成,同时考虑双向时刻的信息流。计算公式如式(14)-式(16)所示。
式中,ht-1为t-1时刻的负荷预测值;ht+1为t+1时刻的负荷预测值;分别为前向和后向LSTM单元t时刻的负荷预测值;分别为LSTM的前向和后向的计算过程;at、bt分别为前向输出权值和后向输出权值;ct为当前时刻的偏置优化参数;Bt为t时刻BILSTM单元最终输出的负荷预测值。
步骤11.判断所有预测日是否均完成预测,如果均完成,则结束预测工作;如果未完全预测,则循环进行步骤1到步骤10。
本发明的效果和益处是:提出了一种考虑特征重要性值波动的MI-BILSTM短期负荷预测方法。采用互信息法提取特征的重要性值波动,并动态修正原输入特征,使得修正后的输入特征中融合了重要性值波动的信息。通过上述做法,不仅保留了现有流行模型中权值共享结构在精简参数方面的优势,并且弥补其无法提取重要性值波动的缺陷,进一步提高预测精度。
附图说明
图1是初次GMM聚类的BIC值。
图2是工作日二次GMM聚类的BIC值。
图3是周末二次GMM聚类的BIC值。
图4是法定节假日二次GMM聚类的BIC值。
图5是步骤6提取重要性值波动矩阵的流程图。
图6是BILSTM模型的结构图。
图7是2014年5月30日的预测结果。
具体实施方式
以下以某地区2012年1月1日-2014年6月30日的真实负荷数据和气象数据为例,结合技术方案和附图详细叙述本发明的具体实施方式。
步骤1:确定预测日期,以下以预测日期为2014年5月30日为例。
步骤2:预测日的日期特征、气象特征进入原始数据库。
步骤3:数据库数据预处理,包括缺失数据补充、数据归一化。
采用线性插值法对电力负荷中的缺失数据进行补全,例如:假设n+j时刻的负荷数据缺失,则其缺失数据可以采用下式(17)计算得出。
式中,ln+j为n+j时刻缺失数据;ln为n时刻的负荷数据;ln+i为n+i时刻缺失数据。
为了消除不同量纲之间的影响,并使得数据更适用于神经网络的训练,需要对原始数据进行归一化处理,归一化公式如式(18)所示。
式中,x'表示归一化后的数据;xmin、xmax分别为数据中的最小值、最大值。
步骤4:采用GMM聚类进行日负荷场景划分。采用贝叶斯信息准则确定GMM聚类的最优分类个数,选取最低贝叶斯信息准则值所对应的聚类数量作为最佳。贝叶斯信息准则值的计算公式和原理见式(19)所示。
B=gln(m)-2ln(L) (19)
式中,B为贝叶斯信息准则值;g为超参数的值(分类个数);m为样本个数;L为似然函数。
超参数k越小模型越简洁,似然函数L越大说明模型拟合程度越好,即贝叶斯信息准则值BIC越小说明模型在保证简单的情况下,拟合程度越好。所以选取B最小时的g值作为高斯混合模型聚类的最优超参数(最优分类个数)。
按照日期特征进行初次GMM聚类,初次GMM聚类的BIC值随g(g=2,3,...,10)逐次增大时发生的变化如图1所示。按照BIC准则,其BIC值在g=3时达到最小值划分完后,原始数据库被划分为3类,分别为556天的普通工作日场景、220天的周末场景和105天的法定节假日场景。
气象特征中,温度是影响负荷变化的显著特征,因此,二次GMM聚类的气象输入特征为三维温度特征:最高温度、最低温度、平均温度。由图2、图3、图4所示,工作日场景划分为三类,分别为工作日1(高温)、工作日2(中温)、工作日3(低温);周末划分为两类,分别为周末1(高温)、周末2(低温);法定节假日同样划分为两类,分别为节假日1(高温)、节假日2(低温)。划分出的日负荷场景及其天数如表1所示。
表1日负荷场景的聚类结果
2014年5月30日,属于工作日1场景。
步骤5.按照日负荷场景划分结果,确定各个场景下的输入特征,包括日期特征、气象特征和历史负荷特征三部分组成。
模型的输入特征数据分为气象特征、日期特征和历史负荷特征。
在所有的日负荷场景下,气象特征保持一致,包括最高温度、最低温度、平均温度、相对湿度和降水量。
对日期特征而言,GMM聚类已经将不同日期特征下的日负荷场景划分,所以日期特征中不需要包括区分工作日、周末、法定节假日的特征。但是当两种日期类型重叠或相邻时,负荷曲线会出现相互影响的情况。对于工作日而言,临近休息日(周末、法定节假日)时,负荷曲线会发生变化,如后一天是休息日时,当天的负荷曲线在后半段会出现跌落,反之前一天是休息日时,当天负荷曲线在前半段会明显较低,所以在工作日场景中加入“是否为休息日前一天”、“是否为休息日后一天”两个特征,如果休息日为周末,该特征取1,如果休息日为法定节假日,该特征取2,如果休息日是周末和法定节假日重叠,该特征取3,不是上述情况取0。对周末而言,主要是受法定节假日导致的调休影响,所以在周末场景下加入“是否为调休日”这一特征,如果该天调休,该特征取1,不调休,该特征取0。由于初次聚类时,将法定节假日和周末的重叠情况统一按照法定节假日处理,为了表示区分,在法定节假日场景下加入“是否为周末”这一特征,如果是周末取1,不是周末取0。
历史负荷特征的选取受短期负荷预测的类型影响,由于本文进行的短期负荷预测类型为日前预测,预测日当天的负荷值默认为未知状态,所以选取的历史负荷特征只能从预测日之前的数据库中选取。对工作日而言,选取同一场景下前一工作日对应时刻的负荷值作为历史负荷特征。在周末场景下,选取同一场景下前一相同周日期对应时刻的负荷值作为历史负荷特征。不同的法定节假日下负荷曲线性质不同,所以选取前一相同节假日对应时刻的负荷值作为历史负荷特征。最终各日负荷场景下的输入特征种类见表2所示。
表2各日负荷场景下的输入特征种类
按照表2,选取工作日场景下的输入特征作为BILSTM模型的输入。步骤6.使用MI提取预测日所对应的日负荷场景下的重要性值波动矩阵。表3为MI提取到的工作日1场景下的重要性值波动矩阵。
表3工作日1场景下的重要性值波动矩阵
从时间维度上看,由于温度往往通过影响人的行为来影响负荷的变化,所以温度在中高温度的场景下(工作日1、工作日2、周末1、节假日1)所表现出的重要性值往往随着人一天中的生产活动规律发生波动,在一天中凌晨至上午,重要性值逐渐下降,随着生产活动的开启,重要性值逐渐增大至高峰,等到一天的下班时间,重要性值陡然下降,接着晚上用电负荷迎来高峰,温度的重要性值也随之升高。值得注意的是,由于负荷曲线具有在时序上连续的特点,“是否为休息日后一天”在一天中的前几个时刻重要性值较大,而“是否为休息日前一天”在一天中的后几个时刻重要性值较大。历史负荷特征的重要性值在一天中的所有时刻下几乎都保持最大。除了上述有明显规律的特征外,其他特征的重要性值在时序上也同样表现出波动特性。
步骤7.按照式(7)使用提取到的重要性值波动矩阵动态修正输入特征。
步骤8.以2014年5月30日的数据为预测集,剩余所有工作日1场景下的数据为训练集,进滚动日前预测。
步骤9.代入BILSTM模型中完成预测,BILSTM模型的结构图如图6所示。2014年5月30日的预测结果如图7所示。
LSTM的预测精度在四种模型中最低;BILSTM由于可以考虑双向信息,预测精度高于LSTM;MI-LSTM将输入特征的重要性值波动考虑在内,预测精度相较于LSTM有了明显的提高;MI-BILSTM模型不仅考虑了双向信息流,还实现了输入特征重要性值波动的动态追踪,预测精度优于其他模型,针对真实负荷曲线具有更好的拟合效果。综上,验证了本文所提MI-BILSTM模型在短期负荷预测中具有更高的预测精度。
以上所述实施例仅表达了本发明的实施方式,但并不能因此而理解为对本发明专利的范围的限制,应当指出,对于本领域的技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些均属于本发明的保护范围。
Claims (3)
1.一种考虑特征重要性值波动的MI-BILSTM预测方法,其特征在于,包括以下步骤:
步骤1.确定预测日期;
步骤2.将预测日的日期特征、气象特征输入数据库;
步骤3.数据库数据预处理,包括缺失数据补充、数据归一化;
步骤4.采用高斯混合模型聚类GMM进行日负荷场景划分;首先将日期特征作为初次GMM聚类的输入,完成日负荷场景的初次划分工作;
日期特征是影响日负荷场景划分的显著因素;因此,初次GMM聚类以日期特征为输入完成聚类;日期特征分为工作日、周末、法定节假日三种不同的情况,按照one-hot编码形式对日期特征进行编码,即工作日为[1,0,0],周末为[0,1,0],法定节假日为[0,0,1];当周末与法定节假日重合时,统一按照节假日处理,后续在节假日场景下进行预测时,加入“是否为周末”这一特征作为区分;将上述经过编码后的三维日期特征作为初次GMM聚类的输入,完成初次聚类,得到以日期特征为划分的日负荷场景;
步骤5.将气象特征作为二次GMM聚类的输入,完成日负荷场景的二次划分工作;
二次GMM聚类以气象特征作为输入,对日负荷场景进一步细分;由于温度是影响日负荷变化的显著因素,所以选用一天中的最高温度、最低温度、平均温度作为二次GMM聚类的输入,得到最终的日负荷场景划分结果;
步骤6.按照日负荷场景划分结果,确定各个场景下的输入特征,包括日期特征、气象特征和历史负荷特征三部分组成;
步骤7.采用MI提取预测日所对应的日负荷场景下的重要性值波动矩阵;通过重要性值矩阵对原始输入特征进行动态修正,使之内部包含波动信息;采用互信息值量化不同时刻下输入特征数据与输出数据之间的相关性,相关性越强说明输入特征越重要;
所述的互信息值的计算公式如式(4)所示;
式中,M(P,Q)为随机变量P和Q之间的互信息值;pPQ(p,q)为随机变量P和Q的联合概率密度函数;pp(p)为随机变量P的边缘概率密度函数;pQ(q)为随机变量Q的边缘概率密度函数;两个变量间的相关性越强,互信息值越大,当两个变量相互独立时,互信息值为0;
基于MI提取重要性值波动矩阵的求解步骤如下:
(1)确定输出负荷数据集;根据上述日负荷场景划分结果,将电力负荷数据集按照一天中的负荷采样点个数n划分成n组,并将其作为输出数据集O[O1,O2,…,Ot,…,On],t时刻的输出负荷向量为Ot;
(2)确定输入特征数据集;取与上述输出负荷数据集相对应的输入特征集I,即:
(4)重复计算(3);t从1到n循环求解不同时刻下输入特征的重要性值,当t=n时,求解完毕;得到随时间变化的输入特征的重要性值波动矩阵M,即:
步骤8.采用重要性值波动矩阵动态修正输入特征;
动态修正输入特征如式(7)所示;
步骤9.将原始数据库划分为训练集和预测集,进行日前预测工作;
步骤10.建立基于BILSTM的负荷预测模型,完成预测工作;
将修正后的输入特征I′代入BILSTM中进行负荷预测,LSTM的计算流程如下:
遗忘门:
ft=σ(Wf[ht-1,it]+bf) (8)
式中,Wf为遗忘门权值矩阵;σ为sigmoid函数;ht-1为t-1时刻输出;it为t时刻输入特征;bf为遗忘门偏置矩阵;
输入门:
dt=σ(Wi[ht-1,it]+bi) (9)
式中,Wi为输入门权值矩阵;bi为输入门偏置矩阵;
记忆单元:
输出门:
ut=σ(Wo[ht-1,it]+bo) (12)
式中,Wo为输出门权值矩阵;bo为输出门偏置矩阵;ut为t时刻的输出门状态;
ht=ut⊙tanh(ct) (13)
式中,ht为LSTM单元t时刻的最终输出;
BILSTM由前向LSTM和后向LSTM两部分组成,同时考虑双向时刻的信息流;计算公式如式(14)-式(16)所示;
式中,ht-1为t-1时刻的负荷预测值;ht+1为t+1时刻的负荷预测值;分别为前向和后向LSTM单元t时刻的负荷预测值;分别为LSTM的前向和后向的计算过程;at、bt分别为前向输出权值和后向输出权值;ct为当前时刻的偏置优化参数;Bt为t时刻BILSTM单元最终输出的负荷预测值;
步骤11.判断所有预测日是否均完成预测,如果均完成,则结束预测工作;如果未完全预测,则循环进行步骤1到步骤10。
2.根据权利要求1所述的一种考虑特征重要性值波动的MI-BILSTM预测方法,其特征在于,步骤4所述GMM聚类的求解步骤如下:
(1)初始化k个多元高斯分布的参数α、μ和Σ,三组参数如式(1)所示:
式中,αj、μj和∑j分别为第j个高斯分布的权重、均值和协方差;k为高斯分布的总个数;
(2)遍历所有样本点,计算样本点xi由第j类别所生成的概率γj(xi),计算公式如式(2):
式中,xi为表征日负荷场景划分的输入数据;n为xi的维度;D为日负荷数据库中的总天数;
(3)按照式(3)得到αj、μj和∑j的更新值αj′、μj′和∑j′;
式中,αj′、μj′和Σj′分别为第j个高斯分布更新后的权重、均值和协方差。
3.根据权利要求1或2所述的一种考虑特征重要性值波动的MI-BILSTM预测方法,其特征在于,步骤5所述的气象特征包括温度、湿度、降水量或其他不同类型的数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210256619.3A CN114626606A (zh) | 2022-03-16 | 2022-03-16 | 一种考虑特征重要性值波动的mi-bilstm预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210256619.3A CN114626606A (zh) | 2022-03-16 | 2022-03-16 | 一种考虑特征重要性值波动的mi-bilstm预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114626606A true CN114626606A (zh) | 2022-06-14 |
Family
ID=81902806
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210256619.3A Pending CN114626606A (zh) | 2022-03-16 | 2022-03-16 | 一种考虑特征重要性值波动的mi-bilstm预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114626606A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116519021A (zh) * | 2023-06-29 | 2023-08-01 | 西北工业大学 | 一种惯性导航系统故障诊断方法、系统及设备 |
CN118246770A (zh) * | 2024-05-23 | 2024-06-25 | 华北电力科学研究院有限责任公司 | 配电网负荷谐波电流预测方法、系统、介质及电子设备 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106779129A (zh) * | 2015-11-19 | 2017-05-31 | 华北电力大学(保定) | 一种考虑气象因素的短期电力负荷预测方法 |
AU2020104000A4 (en) * | 2020-12-10 | 2021-02-18 | Guangxi University | Short-term Load Forecasting Method Based on TCN and IPSO-LSSVM Combined Model |
-
2022
- 2022-03-16 CN CN202210256619.3A patent/CN114626606A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106779129A (zh) * | 2015-11-19 | 2017-05-31 | 华北电力大学(保定) | 一种考虑气象因素的短期电力负荷预测方法 |
AU2020104000A4 (en) * | 2020-12-10 | 2021-02-18 | Guangxi University | Short-term Load Forecasting Method Based on TCN and IPSO-LSSVM Combined Model |
Non-Patent Citations (1)
Title |
---|
孙辉 等: "考虑特征重要性波动的MI-BILSTM短期负荷预测", 《电力系统自动化》, 11 February 2022 (2022-02-11), pages 1 - 3 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116519021A (zh) * | 2023-06-29 | 2023-08-01 | 西北工业大学 | 一种惯性导航系统故障诊断方法、系统及设备 |
CN116519021B (zh) * | 2023-06-29 | 2023-09-15 | 西北工业大学 | 一种惯性导航系统故障诊断方法、系统及设备 |
CN118246770A (zh) * | 2024-05-23 | 2024-06-25 | 华北电力科学研究院有限责任公司 | 配电网负荷谐波电流预测方法、系统、介质及电子设备 |
CN118246770B (zh) * | 2024-05-23 | 2024-09-10 | 华北电力科学研究院有限责任公司 | 配电网负荷谐波电流预测方法、系统、介质及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111199016B (zh) | 一种基于DTW的改进K-means的日负荷曲线聚类方法 | |
CN111178611B (zh) | 一种日电量预测的方法 | |
CN109754113A (zh) | 基于动态时间规整与长短时间记忆的负荷预测方法 | |
Zhang et al. | A novel sequence to sequence data modelling based CNN-LSTM algorithm for three years ahead monthly peak load forecasting | |
CN114626606A (zh) | 一种考虑特征重要性值波动的mi-bilstm预测方法 | |
CN106485262A (zh) | 一种母线负荷预测方法 | |
CN110674999A (zh) | 基于改进聚类和长短期记忆深度学习的小区负荷预测方法 | |
CN114358185B (zh) | 一种基于改进K均值聚类CCA-BiLSTM多维度短期电力负荷预测方法 | |
CN110610382A (zh) | 车辆销售量预测方法、装置、计算机设备和存储介质 | |
CN116186548B (zh) | 电力负荷预测模型训练方法及电力负荷预测方法 | |
CN113255900A (zh) | 一种考虑改进谱聚类与Bi-LSTM神经网络的冲击性负荷预测方法 | |
CN112418476A (zh) | 一种超短期电力负荷预测方法 | |
CN116797274A (zh) | 一种基于Attention-LSTM-LightGBM的共享单车需求量预测方法 | |
CN115759336A (zh) | 一种面向短期电力负荷预测的预测方法及存储介质 | |
CN114548586A (zh) | 一种基于混合模型的短期电力负荷预测方法及系统 | |
CN115099461A (zh) | 基于双分支特征提取的太阳辐射预测方法及系统 | |
CN116187835A (zh) | 一种基于数据驱动的台区理论线损区间估算方法及系统 | |
CN115310782A (zh) | 一种基于神经图灵机的电力用户需求响应潜力评估方法及装置 | |
CN115809719A (zh) | 一种基于形态聚类的短期负荷预测修正方法 | |
CN116542701A (zh) | 一种基于cnn-lstm组合模型的碳价预测方法及系统 | |
CN115238948A (zh) | 小水电发电量预测方法及装置 | |
CN114581141A (zh) | 基于特征选择与lssvr的短期负荷预测方法 | |
CN108509840B (zh) | 基于量子记忆优化机制的高光谱遥感图像波段选择方法 | |
CN113656707A (zh) | 一种理财产品推荐方法、系统、存储介质及设备 | |
CN116565850A (zh) | 一种基于qr-blstm的风电功率超短期预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |