CN111932402A - 一种基于相似日和lstm的短期电力负荷双向组合预测方法 - Google Patents
一种基于相似日和lstm的短期电力负荷双向组合预测方法 Download PDFInfo
- Publication number
- CN111932402A CN111932402A CN202010810359.0A CN202010810359A CN111932402A CN 111932402 A CN111932402 A CN 111932402A CN 202010810359 A CN202010810359 A CN 202010810359A CN 111932402 A CN111932402 A CN 111932402A
- Authority
- CN
- China
- Prior art keywords
- day
- data
- prediction
- days
- similar
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 52
- 230000002457 bidirectional effect Effects 0.000 title claims abstract description 27
- 239000011159 matrix material Substances 0.000 claims abstract description 65
- 238000012549 training Methods 0.000 claims abstract description 55
- 238000005070 sampling Methods 0.000 claims abstract description 25
- 238000012097 association analysis method Methods 0.000 claims abstract description 3
- 238000012360 testing method Methods 0.000 claims description 40
- 238000010606 normalization Methods 0.000 claims description 30
- 238000012545 processing Methods 0.000 claims description 21
- 238000007781 pre-processing Methods 0.000 claims description 3
- 238000013277 forecasting method Methods 0.000 claims 3
- 238000013139 quantization Methods 0.000 claims 1
- 238000013528 artificial neural network Methods 0.000 description 11
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000010219 correlation analysis Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000005611 electricity Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000007637 random forest analysis Methods 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 101001095088 Homo sapiens Melanoma antigen preferentially expressed in tumors Proteins 0.000 description 1
- 102100037020 Melanoma antigen preferentially expressed in tumors Human genes 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000007791 dehumidification Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000012731 temporal analysis Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000000700 time series analysis Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Economics (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Biophysics (AREA)
- Strategic Management (AREA)
- Artificial Intelligence (AREA)
- Human Resources & Organizations (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Tourism & Hospitality (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Supply And Distribution Of Alternating Current (AREA)
Abstract
本发明公开了一种基于相似日和LSTM的短期电力负荷双向组合预测方法,包括以下步骤:S1,将历史日中的影响因素作归一化处理;S2,采用灰色关联分析法在不同范围的历史日中按照关联度大小确定相似日;S3,数据集确定;S4,横向输入矩阵和纵向输入矩阵的建立;S5,将横向输入矩阵和纵向输入矩阵输入到LSTM模型中做横向预测和纵向预测;S6,组合预测;本发明通过相似日选择降低了气象因素、日类型因素等对负荷数据的影响,提高了训练集的质量,对每个采样点进行横向预测与纵向预测之后,使用最小方差法优化其权重系数,既考虑到了数据的时序性与非线性,又考虑到了数据的周期性与非线性。
Description
技术领域
本发明涉及电力负荷预测技术领域,特别是一种基于相似日和LSTM的短期电力负荷双向组合预测方法。
背景技术
准确的负荷预测使工作人员更合理地安排电网内部发动机组的启停,对电力系统的安全、电网的稳定以及电网的规划与调度起着重要作用,有很大的现实意义。
目前,国内外常用的短期电力负荷预测方法大致可分为两类,一类是传统的时间序列分析方法,如时间序列预测、指数平滑分析法、多元线性回归方法等。此类方法对数据的时序性要求很高,但非线性拟合能力不强,随着智能电网的发展,电力数据的爆炸式增长,利用此类方法预测的精度已经不能满足社会发展的需要。为解决上述问题,机器学习方法应运而生,如人工神经网络、支持向量机(Support Vector Machine,SVM)和随机森林(Random Forest,RF)等,此类机器学习方法很好地解决了数据之间的非线性关系,但是用于负荷预测中,需要人为添加时间特征保证预测精度。
随着经济的发展,人民生活水平逐步提高,空调等用电设备的使用量逐年増加,直接导致气象因素、日类型因素对电力负荷的影响越来越大,传统的预测方法难以准确预测。
发明内容
为了克服上述不足,本发明的目的是要提供一种基于相似日和LSTM的短期电力负荷双向组合预测方法。
为达到上述目的,本发明是按照以下技术方案实施的:
一种基于相似日和LSTM的短期电力负荷双向组合预测方法,包括以下步骤:
S1,数据预处理:将历史数据中的影响因素作归一化处理,所述影响因素包括温度、天气类型和日类型;所述历史数据包括影响因素数据和电力负荷数据,所述影响因素数据来源于当地气象局,所述电力负荷数据来自当地配电站、且每15分钟作为一个采样点,1天共96个采样点;
S2,相似日选择:采用灰色关联分析法在不同范围的历史日中按照关联度大小挑选相似日,所述相似日包括测试日、训练集标签日和训练日;
S3,数据集确定:所述数据集包括测试集和训练集,所述训练集包括训练集标签日的电力负荷数据和训练日的电力负荷数据,所述测试集为测试日的电力负荷数据和待预测日的电力负荷数据;
S4,横向输入矩阵和纵向输入矩阵的建立:利用步骤S3中的数据集组成相似日的初始矩阵,将初始矩阵的一行对应同一相似日的若干采样点数据作为横向样本,利用横向样本建立横向输入矩阵,将初始矩阵的一列对应不同相似日同一时刻点的负荷数据作为纵向样本,利用纵向样本建立纵向输入矩阵;
S5,横向与纵向预测:将横向输入矩阵和纵向输入矩阵输入到LSTM模型中做横向预测和纵向预测;
S6,组合预测:将步骤S5中的横向预测结果和纵向预测结果利用最小方差法求出每一个采样点的横向预测权重和纵向预测权重,利用下式得出双向组合预测结果:
式中,f表示一个采样点的组合预测值;q=1,2…,p;p表示预测方法的数量;fq表示一个采样点第q种预测方法的预测值,wq表示一个采样点第q种预测方法的权重系数:
其中,Var(eq)表示一个采样点第q种预测方法的预测方差;
进一步的,步骤S1中,温度的归一化处理采用下式进行处理:
其中X为实际温度,Xmax为温度最大值,Xmin为温度最小值,Z为归一化处理值;
进一步的,步骤S1中,天气类型进行归一化处理时,根据当地的历史日对天气类型进行归一化,越恶劣的天气归一化处理值越大;
进一步的,步骤S1中,日类型包括周二到周四、周一和周五、周六和周日、小长假,在归一化处理时,由于归一化处理值与用电量成正比,选定周二到周四的归一化处理值最小,周一和周五的归一化处理值大于周二到周四,周六和周日的归一化处理值大于周一和周五,小长假的归一化处理值最大;
进一步的,步骤S2中,确定相似日时主要考虑的影响因素有m种,历史天气记录有n天,样本气象数据序列为子序列,则第i天的影响因素序列可表示为:
Xi=(x1i,x2i,…,xmi);
在挑选测试日、训练集标签和训练日时,n的取值不同,分别为26、31和30;m=1,2…5;i=1,2…n;
选取标签日与待预测日的影响因素序列为母序列,可表示为:
X0=(x10,x20,…,xm0);
将子序列和母序列中的每个元素都除以各自向量中的第一个数据进行初值化处理,设初值化处理后的向量为X'i和X'0,设第i个子序列的第k个影响因素与母序列的第k个影响因素的关联系数为:
其中k=1,2…m,i=1,2…n,|X'0(k)-X'i(k)|为子序列与母序列影响因素初值化后的绝对差值,ρ为分辨系数,取值区间为(0,1);由于每个影响因素对应一个关联系数,故关联系数有m个,求其平均值作为子序列和母序列之间的关联度,公式为:
式中,ri越大,表示关联度越大,即相似度越大;
进一步的,步骤S2中,以待预测日的气象信息为母序列,在待测日当月的历史日中按照关联度从大到小挑出7个相似日作为测试日,并将其按照关联度越大、离待预测日越近的顺序在测试数据中排序;以待预测日的气象信息为母序列,在待测日上个月的历史日中挑选与其关联度最大的一天作为标签日;以标签日的气象信息为母序列,在待测日上个月除去标签日的历史日中按照关联度从大到小挑出7个相似日作为训练日;
进一步的,步骤S4中,经过相似日选择后的初始负荷矩阵为:
初始负荷矩阵的形状是(16,96),其中1-7行表示训练集中的训练数据,第8行表示训练集标签数据;9-15行表示测试集中的测试数据,第16行表示待预测数据;负荷矩阵的一行对应同一相似日96个采样点的数据,即横向样本;一列对应不同相似日同一时刻点的负荷数据,即纵向样本;
进一步的,利用横向样本重新调整矩阵X的形状,使其成为一个新矩阵:
Xf1=[x1,1…x1,96…x16,1…x16,96]T;
式中,Xf1为横向输入矩阵;
取初始负荷矩阵的1-8行成为一个新的矩阵Xn,并将其重新调整形状,表示为:
Xn=[x1,1…x8,1…x1,96…x8,96]T;
其中前7个为训练集中的训练日的电力负荷数据,第8个为训练集中标签日的电力负荷数据,按此循环;
取初始负荷数据的9-16行成为一个新的矩阵Xm,并将其重新调整形状,表示为:
Xm=[x9,1…x16,1…x9,96…x16,96]T;
式中,Xm为测试集矩阵;纵向输入矩阵用公式表示为:
与现有技术相比,本发明的基于相似日和LSTM的短期电力负荷双向组合预测方法具备以下有益效果:
本发明通过相似日选择降低了气象因素、日类型因素等对负荷数据的影响,提高了训练集的质量;对每个采样点进行横向预测与纵向预测之后,使用最小方差法优化其权重系数,既考虑到了数据的时序性与非线性,又考虑到了数据的周期性与非线性。通过河南省某县的实际负荷数据验证了本发明的效果更佳。
本发明考虑到历史负荷数据之间有很强的时序性,故使用擅长处理时序性数据的长短期记忆神经网络作为基本模型对电力负荷数据进行预测,该网络可以最大限度地挖掘数据之间时序性与非线性的关系;由于此网络容易忽略影响因素导致负荷数据突变的情况并丢失数据的周期性,因此本发明运用相似日和LSTM神经网络对短期电力负荷进行双向组合预测,通过相似日选择的方法确定数据集以提高输入样本质量,将同一相似日不同时刻的负荷称为横向样本,不同相似日同一时刻的负荷称为纵向样本,把横向样本和纵向样本分别输入LSTM神经网络进行预测,对每一个采样点都采用最小方差法计算横向、纵向预测权重并得出最终预测结果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中的负荷预测结果对比图;
图2为本发明实施例中的绝对误差对比图。
具体实施方式
下面结合附图以及具体实施例对本发明作进一步描述,在此发明的示意性实施例以及说明用来解释本发明,但并不作为对本发明的限定。
本实施例的一种基于相似日和LSTM的短期电力负荷双向组合预测方法,包括以下步骤:
S1,数据预处理:将历史数据中的影响因素作归一化处理,所述影响因素包括温度、天气类型和日类型;所述历史数据包括影响因素数据和电力负荷数据,所述影响因素数据来源于当地气象局,所述电力负荷数据来自当地配电站、且每15分钟作为一个采样点,1天共96个采样点。
S1的具体过程为:
影响短期负荷预测精度的因素随地区的不同而有所差别;本实施例中所用气象因素数据来自河南省某气象局,实验负荷数据来自河南省某县2018年3月和4月某站点。
在河南省某县,对电力负荷影响程度较大的因素有日平均温度、日最高温度、日最低气温、天气类型和日类型。本实施例中,日平均温度为日最高和最低温度的平均值,可在很大程度上反映用电量的变化;日最高温度过高,空调和电扇的使用将增加用电量;日最低气温过低,取暖设备的使用也会增加用电量。不同影响因素量纲不同无法比较,因此需要将影响因素归一化到特定区间,使各个量之间可以有数值上的可比性,为方便后期关联度的计算,将影响因素均归一化到[0,1];本实施例对日平均温度、日最高温度、日最低气温的具体归一化方法如下:
其中X为实际温度,Xmax为温度最大值,Xmin为温度最小值,Z为归一化处理值。在归一化处理时需用三种温度指标各自的最大值与最小值。这样日平均温度、日最高温度、日最低气温分别归一化到[0,1]上。
部分温度归一化处理结果见下表1:
表1温度归一化处理表
Tab 1 Temperature mapping table
天气类型也会导致用电量变化,阴雨天不方便外出会增加用电量,天气阴暗导致视线不好会增加用电量,空气湿度加大,除湿需求也会增加用电量。总体来说,阴雨天比晴天用电量更大。因此本实施例在对天气类型进行归一化时,越恶劣的天气归一化处理值越大,晴天归一化为0.2,多云归一化为0.4,阴归一化为0.5,小雨归一化为0.6,中雨归一化为0.7。
休息日负荷明显低于工作日,周一负荷又会受周日负荷的影响,周五负荷也会因为周六的到来与一般工作日(周二到周四)的负荷有所不同。总体来说,归一化处理值与用电量成正比。因此本实施例将周二—周四归一化为0.2,周一和周五都归一化为0.4,周六—周日归一化为0.6。小长假按情况归一化为0.8—1。天气类型和日类型归一化处理表见下表2。
表2天气类型及日类型归一化处理表
Tab 2 Weather-day mapping table
步骤S2,相似日选择:采用灰色关联分析法挑选历史日中的相似日,所述相似日包括测试日、训练集标签日和训练日;步骤S3,数据集确定:所述数据集包括测试集和训练集,所述训练集包括训练集标签日的电力负荷数据和训练日的电力负荷数据,所述测试集为测试日的电力负荷数据和待预测日的电力负荷数据。
在本实施例中,本文采用灰色关联分析法挑选相似日。灰色关联分析反映了曲线间的关联程度根据关联度大小,先后挑选出测试日、训练集标签日和训练日,在确定相似日时,主要考虑的影响因素有m种,历史天气记录有n天,样本气象数据序列为子序列。则第i天的影响因素序列可表示为:
Xi=(x1i,x2i,…,xmi) (1)
在挑选测试日、训练集标签和训练日时,n的取值不同,分别为26、31和30;m=1,2…5;i=1,2…n。
选取标签日与待预测日的影响因素序列为母序列,可表示为:
X0=(x10,x20,…,xm0) (2)
将子序列和母序列中的每个元素都除以各自向量中的第一个数据进行初值化处理,设初值化处理后的向量为X'i和X'0。
设第i个子序列的第k个影响因素与母序列的第k个影响因素的关联系数为:
其中k=1,2…m,i=1,2…n,|X'0(k)-X'i(k)|为子序列与母序列影响因素初值化后的绝对差值,ρ为分辨系数,一般取值区间为(0,1),在本实施例中ρ=0.5。
计算关联度:每个影响因素对应一个关联系数,故关联系数有m个,不方便比较,所以求其平均值作为子序列和母序列之间的关联度,公式为:
ri越大,表示关联度越大,即相似度越大。
在本实施例中,设定2018年4月27日为待预测日,其负荷数据为待预测数据。
为保证测试集和训练集的学习过程尽可能相似,测试日是以待预测日的气象信息为母序列,在2018年4月1日—2018年4月26日中按照关联度排序挑选出的前7个相似日,如下表3所示:
表3测试日关联度排序
Tab 3 Relevance ranking of test day
取以上7个相似日作为测试日,并将其按照相似度越大,离待预测日越近的顺序在测试数据中排好序。根据表3数据,虽然4月1日在时间上离待预测日最远,但是由于这一天与待预测日的关联度最大,因此在组成测试集时,4月1日的负荷数据在距离上离待预测日最近。测试数据和待预测数据组成测试集。
以2018年4月27日的气象信息序列为母序列,在2018年3月份中挑选与其相似度最大的一天作为标签日,关联度排序如下表4所示:
表4标签日关联度排序
Tab 4 Relevance ranking of tag day
由表4可知,2018年3月31日与待预测日的关联度最大,将其作为标签日,并将其负荷数据作为训练集标签。
训练日是以标签日的气象信息为母序列挑选出的前7个相似日,具体关联度信息如下表5所示:
表5训练日关联度排序
Tab 5 Relevance ranking of training day
取以上7个相似日作为训练日,将其负荷数据和标签数据作为训练集。
S4,横向输入矩阵和纵向输入矩阵的建立:利用步骤S3中的数据集组成相似日的初始矩阵,将初始矩阵的一行对应同一相似日的若干采样点数据作为横向样本,利用横向样本建立横向输入矩阵,将初始矩阵的一列对应不同相似日同一时刻点的负荷数据作为纵向样本,利用纵向样本建立纵向输入矩阵。
具体为:经过相似日选择后的初始矩阵为:
负荷矩阵的形状是(16,96),其中1-7行表示训练集中的训练数据,第8行表示训练集标签数据;9-15行表示测试集中的测试数据,第16行表示待预测数据;负荷矩阵的一行对应同一相似日96个采样点的数据,即横向样本;一列对应不同相似日同一时刻点的负荷数据,即纵向样本。
重新调整矩阵X的形状,使其成为一个新矩阵:
Xf1=[x1,1…x1,96…x16,1…x16,96]T (6)
矩阵Xf1为横向输入矩阵,其形状为(1536,1)。
取1-8行成为一个新矩阵,将其转置矩阵重新调整形状,使其成为一个新矩阵Xn,可表示为:
Xn=[x1,1…x8,1…x1,96…x8,96]T (7)
Xn形状为(768,1),其中前7个为训练集中的训练数据,第8个为训练集中的标签数据,按此循环。
按同样的方法得到测试集矩阵Xm,表示为:
Xm=[x9,1…x16,1…x9,96…x16,96]T (8)
模型的纵向输入矩阵用下式表示为
其形状为(1536,1)。
S5,横向与纵向预测:将横向输入矩阵和纵向输入矩阵输入到LSTM模型中做横向预测和纵向预测;S6,组合预测:将步骤S5中的横向预测结果和纵向预测结果利用最小方差法求出每一个采样点的横向预测权重和纵向预测权重,利用下式得出双向组合预测结果:
式中,f表示一个采样点的组合预测值;q=1,2…,p;p表示预测方法的数量;fq表示一个采样点第q种预测方法的预测值,wq表示一个采样点第q种预测方法的权重系数:
其中,Var(eq)表示一个采样点第q种预测方法的预测方差。
实验分析
本实施例预测评价指标采用平均绝对百分误差(Mean Absolute PercentageError)、平均绝对误差(Mean Absolute Error)和均方根误差(Root Mean Square Error)来衡量,公式为:
其中,yi表示真实值,yp表示预测值,n表示待预测的负荷点数,即96。
实验对比
本文采用河南省某县2018年3月和4月的部分负荷数据进行实验。将加入相似日选择算法后的BP神经网络预测结果、横向预测结果、纵向预测结果与双向预测结果在同样超参数和参数情况下进行可视化对比。横向、纵向预测权重系数如表6所示,负荷预测结果对比如图1所示,绝对误差对比如图2所示,评价结果对比如表7所示。
表6两种模型权重
Tab 6 Weights of two models
每个采样点的真实值、横向预测值和纵向预测值均有差别,所以每个采样点的横向预测权重和纵向预测权重都不同。由于双向组合预测是横向预测和纵向预测的组合,故每一个采样点的横向预测权重与纵向预测权重之和为1。
表7预测评价指标对比
Tab 7 Comparison of prediction results
从图1看出双向预测值曲线更接近真实值曲线。从图2可明显看出双向预测值的波动更小,横向预测次之,纵向预测值与BP神经网络预测值波动较大。这是因为横向预测保留了样本的时序性,纵向预测保留了样本的周期性,电力负荷数据是时序数据,而LSTM神经网络是专门处理时序数据的网络,故横向预测比纵向预测误差要小。从实验结果来看,BP神经网络预测与纵向预测曲线较为接近,误差同样较大,这是因为BP神经网络不善于处理时序数据,其预测能力在很大程度上受到制约。
由表7可知,从相似日选择角度来看,无论是BP神经网络预测、横向预测、纵向预测或双向预测,添加相似日选择算法后的预测精度都要比未添加之前的算法预测精度高;从算法的方向看,本实施例提出的双向预测模型取得了更高的预测精度,其MAPE、MAE和RMSE都有了明显下降,表现出了较好的拟合能力。这是因为选择相似日后,减弱了气象因素、日类型因素突变对负荷数据的影响;横向预测与纵向预测分别考虑了时序性与非线性、周期性与非线性的关系,双向预测模型通过优化两种预测模型的权重系数而兼顾到了三者之间的关系。经过反复试验,双向预测模型预测效果更佳。
本发明的技术方案不限于上述具体实施例的限制,凡是根据本发明的技术方案做出的技术变形,均落入本发明的保护范围之内。
Claims (8)
1.一种基于相似日和LSTM的短期电力负荷双向组合预测方法,其特征在于,包括以下步骤:
S1,数据预处理:将历史数据中的影响因素作归一化处理,所述影响因素包括温度、天气类型和日类型;所述历史数据包括影响因素数据和电力负荷数据,所述影响因素数据来源于当地气象局,所述电力负荷数据来自当地配电站、且每15分钟作为一个采样点,1天共96个采样点;
S2,相似日选择:采用灰色关联分析法在不同范围的历史日中按照关联度大小挑选相似日,所述相似日包括测试日、训练集标签日和训练日;
S3,数据集确定:所述数据集包括测试集和训练集,所述训练集包括训练集标签日的电力负荷数据和训练日的电力负荷数据,所述测试集为测试日的电力负荷数据和待预测日的电力负荷数据;
S4,横向输入矩阵和纵向输入矩阵的建立:利用步骤S3中的数据集组成相似日的初始矩阵,将初始矩阵的一行对应同一相似日的若干采样点数据作为横向样本,利用横向样本建立横向输入矩阵,将初始矩阵的一列对应不同相似日同一时刻点的负荷数据作为纵向样本,利用纵向样本建立纵向输入矩阵;
S5,横向与纵向预测:将横向输入矩阵和纵向输入矩阵输入到LSTM模型中做横向预测和纵向预测;
S6,组合预测:将步骤S5中的横向预测结果和纵向预测结果利用最小方差法求出每一个采样点的横向预测权重和纵向预测权重,利用下式得出双向组合预测结果:
式中,f表示一个采样点的组合预测值;q=1,2…,p;p表示预测方法的数量;fq表示一个采样点第q种预测方法的预测值,;wq表示一个采样点第q种预测方法的权重系数:
其中,Var(eq)表示一个采样点第q种预测方法的预测方差。
3.根据权利要求1所述的基于相似日和LSTM的短期电力负荷双向组合预测方法,其特征在于,步骤S1中,天气类型进行归一化处理时,根据当地的历史日对天气类型进行归一化,越恶劣的天气归一化处理值越大。
4.根据权利要求1所述的基于相似日和LSTM的短期电力负荷双向组合预测方法,其特征在于,步骤S1中,日类型包括周二到周四、周一和周五、周六和周日、小长假,在归一化处理时,由于归一化处理值与用电量成正比,选定周二到周四的归一化处理值最小,周一和周五的归一化处理值大于周二到周四,周六和周日的归一化处理值大于周一和周五,小长假的归一化处理值最大。
5.根据权利要求1所述的基于相似日和LSTM的短期电力负荷双向组合预测方法,其特征在于,步骤S2中,确定相似日时主要考虑的影响因素有m种,历史天气记录有n天,样本气象数据序列为子序列,则第i天的影响因素序列可表示为:
Xi=(x1i,x2i,…,xmi);
在挑选测试日、训练集标签和训练日时,n的取值不同,分别为26、31和30;m=1,2…5;i=1,2…n;
选取标签日与待预测日的影响因素序列为母序列,可表示为:
X0=(x10,x20,…,xm0);
将子序列和母序列中的每个元素都除以各自向量中的第一个数据进行初值化处理,设初值化处理后的向量为X'i和X'0,设第i个子序列的第k个影响因素与母序列的第k个影响因素的关联系数为:
其中k=1,2…m,i=1,2…n,|X'0(k)-X'i(k)|为子序列与母序列影响因素初值化后的绝对差值,ρ为分辨系数,取值区间为(0,1);由于每个影响因素对应一个关联系数,故关联系数有m个,求其平均值作为子序列和母序列之间的关联度,公式为:
式中,ri越大,表示关联度越大,即相似度越大。
6.根据权利要求5所述的基于相似日和LSTM的短期电力负荷双向组合预测方法,其特征在于,步骤S2中,以待预测日的气象信息为母序列,在待测日当月的历史日中按照关联度从大到小挑出7个相似日作为测试日,并将其按照关联度越大、离待预测日越近的顺序在测试数据中排序;以待预测日的气象信息为母序列,在待测日上个月的历史日中挑选与其关联度最大的一天作为标签日;以标签日的气象信息为母序列,在待测日上个月除去标签日之外的历史日中按照关联度从大到小挑出7个相似日作为训练日。
8.根据权利要求7所述的基于相似日和LSTM的短期电力负荷双向组合预测方法,其特征在于,利用横向样本重新调整矩阵X的形状,使其成为一个新矩阵:
Xf1=[x1,1…x1,96…x16,1…x16,96]T;
式中,Xf1为横向输入矩阵;
取初始负荷矩阵的1-8行成为一个新的矩阵Xn,并将其重新调整形状,表示为:
Xn=[x1,1…x8,1…x1,96…x8,96]T;
其中前7个为训练集中的训练日的电力负荷数据,第8个为训练集中标签日的电力负荷数据,按此循环;
取初始负荷数据的9-16行成为一个新的矩阵Xm,并将其重新调整形状,表示为:
Xm=[x9,1…x16,1…x9,96…x16,96]T;
式中,Xm为测试集矩阵;纵向输入矩阵用公式表示为:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010810359.0A CN111932402B (zh) | 2020-08-13 | 2020-08-13 | 一种基于相似日和lstm的短期电力负荷双向组合预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010810359.0A CN111932402B (zh) | 2020-08-13 | 2020-08-13 | 一种基于相似日和lstm的短期电力负荷双向组合预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111932402A true CN111932402A (zh) | 2020-11-13 |
CN111932402B CN111932402B (zh) | 2023-05-30 |
Family
ID=73311584
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010810359.0A Active CN111932402B (zh) | 2020-08-13 | 2020-08-13 | 一种基于相似日和lstm的短期电力负荷双向组合预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111932402B (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112464035A (zh) * | 2020-11-18 | 2021-03-09 | 贵州电网有限责任公司 | 一种基于电网调控数据的数据挖掘方法 |
CN112508286A (zh) * | 2020-12-11 | 2021-03-16 | 上海电力大学 | 一种基于Kmeans-BiLSTM-DMD模型的短期负荷预测方法 |
CN112633604A (zh) * | 2021-01-04 | 2021-04-09 | 重庆邮电大学 | 一种基于i-lstm的短期用电量预测方法 |
CN113159438A (zh) * | 2021-04-30 | 2021-07-23 | 国网湖北省电力有限公司武汉供电公司 | 一种基于差异化多模融合的负荷加权集成预测方法 |
CN113191574A (zh) * | 2021-05-28 | 2021-07-30 | 上海申瑞继保电气有限公司 | 单一产品生产线的日用电预测方法 |
CN113435058A (zh) * | 2021-07-13 | 2021-09-24 | 广东电网有限责任公司 | 配网自愈测试模型的数据降维方法、系统、终端及介质 |
CN113505923A (zh) * | 2021-07-08 | 2021-10-15 | 广西大学 | 一种地区电网短期负荷预测方法及系统 |
CN113516283A (zh) * | 2021-05-08 | 2021-10-19 | 南京工程学院 | 一种基于相似日选取的短期负荷预测方法 |
CN113610319A (zh) * | 2021-08-20 | 2021-11-05 | 西安石油大学 | 一种配电网自动化的分析方法 |
CN115859815A (zh) * | 2022-12-07 | 2023-03-28 | 国网江苏省电力有限公司营销服务中心 | 基于sa-tcn模型的短期可调节负荷预测方法及系统 |
CN116061742A (zh) * | 2022-10-25 | 2023-05-05 | 广州汇锦能效科技有限公司 | 一种分时电价光伏园区内电动汽车的充电控制方法和系统 |
CN116258280A (zh) * | 2023-05-12 | 2023-06-13 | 国网湖北省电力有限公司经济技术研究院 | 一种基于时间序列聚类的短期负荷预测方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108229754A (zh) * | 2018-01-31 | 2018-06-29 | 杭州电子科技大学 | 基于相似日分段和lm-bp网络的短期负荷预测方法 |
CN108932557A (zh) * | 2018-04-28 | 2018-12-04 | 云南电网有限责任公司临沧供电局 | 一种基于气温累积效应和灰色关联度的短期负荷预测模型 |
CN110414788A (zh) * | 2019-06-25 | 2019-11-05 | 国网上海市电力公司 | 一种基于相似日和改进lstm的电能质量预测方法 |
CN111105104A (zh) * | 2020-02-20 | 2020-05-05 | 河南理工大学 | 一种基于相似日和rbf神经网络的短期电力负荷预测方法 |
CN111260136A (zh) * | 2020-01-17 | 2020-06-09 | 上海电力大学 | 一种基于arima-lstm组合模型的楼宇短期负荷预测方法 |
-
2020
- 2020-08-13 CN CN202010810359.0A patent/CN111932402B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108229754A (zh) * | 2018-01-31 | 2018-06-29 | 杭州电子科技大学 | 基于相似日分段和lm-bp网络的短期负荷预测方法 |
CN108932557A (zh) * | 2018-04-28 | 2018-12-04 | 云南电网有限责任公司临沧供电局 | 一种基于气温累积效应和灰色关联度的短期负荷预测模型 |
CN110414788A (zh) * | 2019-06-25 | 2019-11-05 | 国网上海市电力公司 | 一种基于相似日和改进lstm的电能质量预测方法 |
CN111260136A (zh) * | 2020-01-17 | 2020-06-09 | 上海电力大学 | 一种基于arima-lstm组合模型的楼宇短期负荷预测方法 |
CN111105104A (zh) * | 2020-02-20 | 2020-05-05 | 河南理工大学 | 一种基于相似日和rbf神经网络的短期电力负荷预测方法 |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112464035A (zh) * | 2020-11-18 | 2021-03-09 | 贵州电网有限责任公司 | 一种基于电网调控数据的数据挖掘方法 |
CN112508286A (zh) * | 2020-12-11 | 2021-03-16 | 上海电力大学 | 一种基于Kmeans-BiLSTM-DMD模型的短期负荷预测方法 |
CN112633604A (zh) * | 2021-01-04 | 2021-04-09 | 重庆邮电大学 | 一种基于i-lstm的短期用电量预测方法 |
CN112633604B (zh) * | 2021-01-04 | 2022-04-22 | 重庆邮电大学 | 一种基于i-lstm的短期用电量预测方法 |
CN113159438A (zh) * | 2021-04-30 | 2021-07-23 | 国网湖北省电力有限公司武汉供电公司 | 一种基于差异化多模融合的负荷加权集成预测方法 |
CN113516283A (zh) * | 2021-05-08 | 2021-10-19 | 南京工程学院 | 一种基于相似日选取的短期负荷预测方法 |
CN113191574A (zh) * | 2021-05-28 | 2021-07-30 | 上海申瑞继保电气有限公司 | 单一产品生产线的日用电预测方法 |
CN113505923A (zh) * | 2021-07-08 | 2021-10-15 | 广西大学 | 一种地区电网短期负荷预测方法及系统 |
CN113505923B (zh) * | 2021-07-08 | 2022-06-17 | 广西大学 | 一种地区电网短期负荷预测方法及系统 |
CN113435058B (zh) * | 2021-07-13 | 2023-09-19 | 广东电网有限责任公司 | 配网自愈测试模型的数据降维方法、系统、终端及介质 |
CN113435058A (zh) * | 2021-07-13 | 2021-09-24 | 广东电网有限责任公司 | 配网自愈测试模型的数据降维方法、系统、终端及介质 |
CN113610319A (zh) * | 2021-08-20 | 2021-11-05 | 西安石油大学 | 一种配电网自动化的分析方法 |
CN116061742A (zh) * | 2022-10-25 | 2023-05-05 | 广州汇锦能效科技有限公司 | 一种分时电价光伏园区内电动汽车的充电控制方法和系统 |
CN116061742B (zh) * | 2022-10-25 | 2024-05-03 | 广州汇锦能效科技有限公司 | 一种分时电价光伏园区内电动汽车的充电控制方法和系统 |
CN115859815A (zh) * | 2022-12-07 | 2023-03-28 | 国网江苏省电力有限公司营销服务中心 | 基于sa-tcn模型的短期可调节负荷预测方法及系统 |
CN116258280A (zh) * | 2023-05-12 | 2023-06-13 | 国网湖北省电力有限公司经济技术研究院 | 一种基于时间序列聚类的短期负荷预测方法 |
CN116258280B (zh) * | 2023-05-12 | 2023-08-11 | 国网湖北省电力有限公司经济技术研究院 | 一种基于时间序列聚类的短期负荷预测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111932402B (zh) | 2023-05-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111932402B (zh) | 一种基于相似日和lstm的短期电力负荷双向组合预测方法 | |
CN111860979B (zh) | 一种基于tcn与ipso-lssvm组合模型的短期负荷预测方法 | |
CN110097297A (zh) | 一种多维度窃电态势智能感知方法、系统、设备及介质 | |
CN105117810A (zh) | 一种阶梯电价机制下居民用电中期负载预测方法 | |
CN113743673B (zh) | 一种台风期间的电力负荷预测方法 | |
CN112712203B (zh) | 一种配电网日最高负荷预测方法和系统 | |
CN110264107B (zh) | 一种基于大数据技术的台区线损率异常诊断方法 | |
CN102426674A (zh) | 一种基于马尔科夫链的电力系统负荷预测方法 | |
Selvi et al. | Investigation of performance of electric load power forecasting in multiple time horizons with new architecture realized in multivariate linear regression and feed-forward neural network techniques | |
CN112865093B (zh) | 一种短时电力负荷组合式预测方法 | |
CN115860797B (zh) | 一种适应新电价改革形势的电量需求预测方法 | |
CN106600037A (zh) | 一种基于主成分分析的多参量辅助负荷预测方法 | |
CN111723085B (zh) | 公共建筑空调用电能耗数据清洗方法及系统 | |
CN111428745A (zh) | 一种基于聚类分析的低压用户用电特征提取方法 | |
Kwon et al. | Weekly peak load forecasting for 104 weeks using deep learning algorithm | |
CN112926772A (zh) | 一种基于lstm-gpr混合模型的光能预测方法 | |
CN112465266A (zh) | 一种母线负荷预测准确率分析方法、装置及计算机设备 | |
CN115545333A (zh) | 一种多负荷日类型配电网负荷曲线预测方法 | |
CN115796915A (zh) | 一种面向电力交易市场的电价预测方法及系统 | |
CN114186733A (zh) | 一种短期负荷预测方法和装置 | |
CN113902181A (zh) | 公变重过载的短期预测方法及设备 | |
CN111861587A (zh) | 一种基于隐马尔可夫模型和向前算法的居民用电行为分析的系统及方法 | |
CN112598181A (zh) | 负荷预测方法、装置、设备和存储介质 | |
CN115829418A (zh) | 适用于负荷管理的电力用户负荷特性画像构建方法和系统 | |
CN116258280A (zh) | 一种基于时间序列聚类的短期负荷预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |