CN111932024B - 一种能源负荷预测方法、装置、计算机设备及存储介质 - Google Patents

一种能源负荷预测方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN111932024B
CN111932024B CN202010851509.2A CN202010851509A CN111932024B CN 111932024 B CN111932024 B CN 111932024B CN 202010851509 A CN202010851509 A CN 202010851509A CN 111932024 B CN111932024 B CN 111932024B
Authority
CN
China
Prior art keywords
energy load
model
lstm
snapshot
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010851509.2A
Other languages
English (en)
Other versions
CN111932024A (zh
Inventor
张健
石强
熊娇
刘雨桐
王国勋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Resources Digital Technology Co Ltd
Original Assignee
China Resources Digital Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Resources Digital Technology Co Ltd filed Critical China Resources Digital Technology Co Ltd
Priority to CN202010851509.2A priority Critical patent/CN111932024B/zh
Publication of CN111932024A publication Critical patent/CN111932024A/zh
Application granted granted Critical
Publication of CN111932024B publication Critical patent/CN111932024B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Evolutionary Computation (AREA)
  • Strategic Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • General Business, Economics & Management (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • Evolutionary Biology (AREA)
  • Water Supply & Treatment (AREA)
  • Public Health (AREA)
  • Primary Health Care (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Development Economics (AREA)
  • Operations Research (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Supply And Distribution Of Alternating Current (AREA)

Abstract

本发明公开了一种能源负荷预测方法、装置、计算机设备及存储介质,该方法包括:获取能源负荷的时间序列历史数据以及对应的外生变量数据,得到训练数据集和测试数据集;将训练数据集分别输入至多个LSTM快照模型中,对LSTM快照模型进行训练学习;基于测试数据集,利用弹性回归网络从多个LSTM快照模型中选择最优LSTM快照模型,并利用最优LSTM快照模型得到最优能源负荷预测值;将最优能源负荷预测值与真实值、外生变量数据输入至状态空间模型,得到最终的能源负荷预测值,从而构建关于能源负荷的预测模型;利用预测模型对指定时间的能源负荷进行预测。本发明可有效提高能源负荷的预测精度和预测模型的自动化能力,还可改善系统内部状态变化,提高预测精度。

Description

一种能源负荷预测方法、装置、计算机设备及存储介质
技术领域
本发明涉及计算机技术领域,特别涉及一种能源负荷预测方法、装置、计算机设备及存储介质。
背景技术
精准的短期时间序列预测在现实中一直有广泛的应用需求。比如说股票市场的股价预测、物联网的预测性维护以及能源负荷的预测等。时间序列预测技术从20年代初提出的自回归的经典时间序列预测方法,到目前结合机器学习和深度学习的很多模型用于对时间序列数据的拟合,使得时间序列预测在预测性能上得到很大的提升。
现有技术中,在对能源负荷进行时间序列预测时,一般采用的时间序列预测方法需要人为假定很多条件,只有当模型满足一定的设定时才可以得到较为准确的预测结果,所以该时间序列预测方法需要定期人为地更新和维护系统才能保证预测系统的稳定运行,费时费力。
因此如何提供一种既能保证预测的准确性又减少人为更新维护的预测系统是本领域技术人员需要解决的问题。
发明内容
本发明实施例提供了一种能源负荷预测方法、装置、计算机设备及存储介质,旨在提高能源负荷的多变量时间序列预测精度的同时提升预测模型自动化能力。
第一方面,本发明实施例提供了一种能源负荷预测方法,包括:
获取能源负荷的时间序列历史数据以及对应的外生变量数据,对所述能源负荷的时间序列历史数据和外生变量数据进行归一化处理,得到对应的能源负荷数据集,然后将所述能源负荷数据集划分为训练数据集和测试数据集;
将所述训练数据集中的数据分别输入至多个LSTM快照模型中,对所述多个LSTM快照模型进行训练学习;
基于所述测试数据集,利用弹性回归网络从所述多个LSTM快照模型中选择最优LSTM快照模型,并利用所述最优LSTM快照模型得到最优能源负荷预测值;
将所述最优能源负荷预测值与对应的能源负荷真实值、以及对应的外生变量数据输入至状态空间模型,并由所述状态空间模型得到最终的能源负荷预测值,从而构建关于能源负荷多变量时间序列的预测模型;
利用所述预测模型对指定时间的能源负荷进行预测。
进一步的,所述获取能源负荷的时间序列历史数据以及对应的外生变量数据,对所述能源负荷的时间序列历史数据和外生变量数据进行归一化处理,得到对应的能源负荷数据集,然后将所述能源负荷数据集划分为训练数据集和测试数据集,包括:
将所述训练数据集划分为第一训练集和第一验证集;
利用快速傅里叶变换对所述第一训练集中的能源负荷的时间序列历史数据进行变换并得到功率谱,从而得到反映序列周期性的序列长度;
对所述序列长度进行筛选,选择spec最高的前p个序列长度K={k1 k2,…kp},然后对选择的序列长度进行滑窗处理,从而得到p个不同的第一训练集数据。
进一步的,所述对所述序列长度进行筛选,选择spec最高的前p个序列长度K={k1k2,…kp},然后对选择的序列长度进行滑窗处理,包括:
将所述第一训练集中的序列长度ki作为训练集中的预设滑窗的窗口长度,以及将所述第一验证集中的序列长度l作为验证集中的预设滑窗的窗口长度,从而得到所述第一训练集中第i个输入矩阵[(n-ki-l+1),ki],以及得到所述第一验证集中第i个输入矩阵[(n-ki-l+1),l]。
进一步的,所述将所述训练数据集中的数据分别输入至多个LSTM快照模型中,对所述多个LSTM快照模型进行训练学习,包括:
将所述第一训练集中的所有数据依次输入至第一个LSTM快照模型中,对所述第一个LSTM快照模型进行多轮训练,并得到所述第一个LSTM快照模型的第一最优超参数;
将所述第一最优超参数作为第二个LSTM快照模型的参数输入,并将所述第一训练集中的所有数据依次输入至所述第二个LSTM快照模型中,对所述第二个LSTM快照模型进行多轮训练,从而得到所述第二个LSTM快照模型的第二最优超参数;
以此类推,将每一个LSTM快照模型得到的最优超参数作为下一LSTM快照模型的参数输入,直至所有LSTM快照模型训练结束。
进一步的,所述基于所述测试数据集,利用弹性回归网络从所述多个LSTM快照模型中选择最优LSTM快照模型,并利用所述最优LSTM快照模型得到最优能源负荷预测值,包括:
将所述测试数据集划分为第二训练集和第二验证集;
将所述弹性回归网络作为所有LSTM快照模型的元模型,并将所述第二训练集中的数据输入至所述元模型中,然后学习得到各LSTM快照模型的损失函数;
选择损失函数最小的LSTM快照模型作为最优快照模型,并将所述第二验证集中的数据输入至所述最优快照模型中,学习得到对应的输出值,并将所述输出值作为最优能源负荷预测值。
进一步的,所述将所述最优能源负荷预测值与对应的能源负荷真实值、以及对应的外生变量数据输入至状态空间模型,并由所述状态空间模型得到最终的能源负荷预测值,从而构建关于能源负荷多变量时间序列的预测模型,包括:
按照下述状态转移方程计算隐藏状态随时间变化的规律:
lt=Ftlt-1+wtεt,εt~N(0,1)
式中,Ft为隐藏状态的权重,wt为隐藏状态的噪声强度,lt为隐藏状态的结果,初始状态下,
Figure BDA0002644890780000031
其中,μ0为初始状态下的向量均值矩阵,
Figure BDA0002644890780000032
为初始状态下的向量方差矩阵。
按照下述观测模型计算隐藏状态下观测值的条件概率分布p(zt|lt),并得到观测结果zt
zt=Htlt+bt+vtt,∈t~N(0,1)
式中,Ht为观测模型的权重,bt为偏置,vt为观测噪声的强度,zt为观测结果。
进一步的,所述将所述最优能源负荷预测值与对应的能源负荷真实值,以及对应的外生变量数据输入至状态空间模型,并由所述状态空间模型得到最终的能源负荷预测值,还包括:
利用极大似然估计得到最优参数
Figure BDA0002644890780000041
然后将所述最优参数Θt代入至所述状态空间模型中,从而计算得到最终的能源负荷预测值。
第二方面,本发明实施例提供了一种能源负荷预测装置,包括:
获取单元,用于获取能源负荷的时间序列历史数据以及对应的外生变量数据,对所述能源负荷的时间序列历史数据和外生变量数据进行归一化处理,得到对应的能源负荷数据集,然后将所述能源负荷数据集划分为训练数据集和测试数据集;
学习单元,用于将所述训练数据集中的数据分别输入至多个LSTM快照模型中,对所述多个LSTM快照模型进行训练学习;
第一选择单元,用于基于所述测试数据集,利用弹性回归网络从所述多个LSTM快照模型中选择最优LSTM快照模型,并利用所述最优LSTM快照模型得到最优能源负荷预测值;
构建单元,用于将所述最优能源负荷预测值与对应的能源负荷真实值、以及对应的外生变量数据输入至状态空间模型,并由所述状态空间模型得到最终的能源负荷预测值,从而构建关于能源负荷多变量时间序列的预测模型;
预测单元,用于利用所述预测模型对指定时间的能源负荷进行预测。
第三方面,本发明实施例提供了一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上所述的能源负荷预测方法。
第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的能源负荷预测方法。
本发明实施例提供了一种能源负荷预测方法、装置、计算机设备及存储介质,所述方法包括:获取能源负荷的时间序列历史数据以及对应的外生变量数据,对所述能源负荷的时间序列历史数据和外生变量数据进行归一化处理,得到对应的能源负荷数据集,然后将所述能源负荷数据集划分为训练数据集和测试数据集;将所述训练数据集中的数据分别输入至多个LSTM快照模型中,对所述多个LSTM快照模型进行训练学习;基于所述测试数据集,利用弹性回归网络从所述多个LSTM快照模型中选择最优LSTM快照模型,并利用所述最优LSTM快照模型得到最优能源负荷预测值;将所述最优能源负荷预测值与对应的能源负荷真实值、以及对应的外生变量数据输入至状态空间模型,并由所述状态空间模型得到最终的能源负荷预测值,从而构建关于能源负荷多变量时间序列的预测模型;利用所述预测模型对指定时间的能源负荷进行预测。本发明实施例通过融合快照集成的策略对神经网络模型进行深加工,并结合控制理论中的状态空间法,构建关于能源负荷的多变量时间序列预测模型,从而既可以有效提高对能源负荷多变量时间序列预测精度,又能够提升预测模型的自动化能力,同时还可以改善系统内部状态变化,提高模型预测精度。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种能源负荷预测方法的流程示意图;
图2为本发明实施例提供的一种能源负荷预测装置的示意性框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
下面请参见图1,图1为本发明实施例提供的一种能源负荷预测方法的流程示意图,具体包括:步骤S101~S105。
S101、获取能源负荷的时间序列历史数据以及对应的外生变量数据,对所述能源负荷的时间序列历史数据和外生变量数据进行归一化处理,得到对应的能源负荷数据集,然后将所述能源负荷数据集划分为训练数据集和测试数据集;
S102、将所述训练数据集中的数据分别输入至多个LSTM快照模型中,对所述多个LSTM快照模型进行训练学习;
S103、基于所述测试数据集,利用弹性回归网络从所述多个LSTM快照模型中选择最优LSTM快照模型,并利用所述最优LSTM快照模型得到最优能源负荷预测值;
S104、将所述最优能源负荷预测值与对应的能源负荷真实值、以及对应的外生变量数据输入至状态空间模型,并由所述状态空间模型得到最终的能源负荷预测值,从而构建关于能源负荷多变量时间序列的预测模型;
S105、利用所述预测模型对指定时间的能源负荷进行预测。
本实施例中,首先利用能源负荷的训练数据集对LSTM(长短时神经网络)快照模型进行训练,然后利用弹性回归网络从多个LSTM快照模型中选择出最优快照模型,从而预测得到对应时段的预测值,再对最优快照模型输出的能源负荷预测值,以及该能源负荷预测值对应的能源负荷真实值和外生变量一并输入至状态空间模型中,并由所述状态空间模型输出该时段的最终能源负荷预测值,并据此构建对于能源负荷的多变量时间序列预测模型。
本实施例借鉴长短时神经网络对当期和往期数据的学习来自动学习时间序列的季节性。同时,为了避免长短时神经网络落入本地最小值而不是全局最小值,本实施例融合快照集成的策略对神经网络模型进行深加工。另外,考虑到时间序列预测除了会有趋势和季节性的变化,还可能会受到外界因素而造成剧烈波动,因此本实施例还结合了控制理论中的状态空间法(即状态空间模型)。所述状态空间模型将输入与输出之间的信息处理分为两段:一段是输入引起的系统内部状态的变化,另一段是系统内部状态变化引起系统输出的变化。本实施例通过引入可能会引起时间序列变化的自变量(即外生变量),输入到所述状态空间模型中,然后通过所述状态空间模型预测得到一个更为全面的预测,提高对于能源负荷的多变量时间序列的预测精度。而且,本实施通过长短时神经网络、快照集成以及状态空间模型构建出的预测模型,可有效提高模型的自动化预测能力。
需要说明的是,本实施例所提供的预测方法或者搭建的预测模型还可以适用于其他多变量时间序列预测场景。当然,由于在风力发电应用场景中,所存在的外生变量较多,因此本实施例特别适用于风力发电应用场景,即所述能源负荷优选为风能负荷。
还需说明的是,在步骤S101中,所获取的外生变量数据是指对会时间序列数据产生影响的数据,例如温度、天气、降水量、节假日以及季节等数据,并且由于外生变量数据中的数量级或者量纲可能不一致,因此需要对所述外生变量数据进行归一化处理。
在一实施例中,所述步骤S101包括:
将所述训练数据集划分为第一训练集和第一验证集;
利用快速傅里叶变换对所述第一训练集中的能源负荷的时间序列历史数据进行变换并得到功率谱,从而得到反映序列周期性的序列长度;
对所述序列长度进行筛选,选择spec最高的前p个序列长度K={k1 k2,…kp},然后对选择的序列长度进行滑窗处理,从而得到p个不同的第一训练集数据。
本实施例中,利用快速傅里叶变换得到所述第一训练集的功率谱,从而得到反映能源负荷序列周期性的序列长度,然后选择spec最高的前p个序列长度,选择的每个序列长度都会用于下一步的滑窗处理,从而形成p个不同的第一训练集,并分别用于输入至p个LSTM快照模型中。本实施例首先通过快速傅里叶变换找到时间序列的周期性规律,然后选择效果最好的p个序列长度作为训练数据,从而可以使通过p个序列长度训练后的LSTM快照模型表现更好。
可以理解的是,本实施例选择p个序列长度,是由于预先假定设置有p个LSTM快照模型,也就是说,选择的序列长度的个数与LSTM快照模型的个数应相同(或者至少相同)。还需说明的是,本实施例所述的spec最高的前p个序列长度可以理解为效果最好的前p个序列长度,例如规格最高的前p个序列长度。当然,在对序列长度进行选择之前,可以先按照spec从高至低的方式对序列长度进行排序。
在一实施例中,所述对所述序列长度进行筛选,选择spec最高的前p个序列长度K={k1 k2,…kp},然后对选择的序列长度进行滑窗处理,包括:
将所述第一训练集中的序列长度ki作为训练集中的预设滑窗的窗口长度,以及将所述第一验证集中的序列长度l作为验证集中的预设滑窗的窗口长度,从而得到所述第一训练集中第i个输入矩阵[(n-ki-l+1),ki],以及得到所述第一验证集中第i个输入矩阵[(n-ki-l+1),l]。
本实施例中,将快速傅里叶变换得到的序列长度作为第一训练集中的预设滑窗的窗口长度;将第一验证集中序列长度l作为第一验证集中的预设滑窗的窗口长度。假定所述训练数据集包含n个时刻的样本数据,那么可以得到进入第i个LSTM快照模型的第一训练集是一个[(n-ki-l+1),ki]的矩阵;进入第i个LSTM快照模型的第一验证集中是一个[(n-ki-l+1),l]的矩阵。本实施例通过使用不同的训练数据,可以使快照集成避开局部极小值并检测与时间相关的特征。
在一实施例中,所述步骤S102包括:
将所述第一训练集中的所有数据依次输入至第一个LSTM快照模型中,对所述第一个LSTM快照模型进行多轮训练,并得到所述第一个LSTM快照模型的第一最优超参数;
将所述第一最优超参数作为第二个LSTM快照模型的参数输入,并将所述第一训练集中的所有数据依次输入至所述第二个LSTM快照模型中,对所述第二个LSTM快照模型进行多轮训练,从而得到所述第二个LSTM快照模型的第二最优超参数;
以此类推,将每一个LSTM快照模型得到的最优超参数作为下一LSTM快照模型的参数输入,直至所有LSTM快照模型训练结束。
本实施例中,按照快照集成的思想,所述第一训练集中的每个序列长度会分别输入至长短时神经网络中(LSTM)进行训练,从而不断降低LSTM快照模型输出的预测值与对应的真实值之间的误差,使得单次LSTM快照模型收敛于一个局部极小,然后保存此时的模型。本实施例所采用的长短时神经网络模型设置有2层的隐含神经层,其中第一层有128个神经元,第二层有128个神经元,其输出即为待预测的时期的个数。
在一具体实施例中,设定每一LSTM快照模型进行q轮训练,因此在将p个不同的第一训练集数据分别对应输入至p个LSTM快照模型训练后,每一LSTM快照模型进行q轮训练,整个训练过程共需进行p*q轮的训练。优选的,每一轮训练利用Adam优化器对LSTM快照模型的每一轮训练进行优化。在一具体应用场景中,所述q轮为20轮,即每一LSTM快照模型进行过20轮训练。优选的,设定模型退出率为20%,此应用场景表现较好。
在一实施例中,所述步骤S103包括:
将所述测试数据集划分为第二训练集和第二验证集;
将所述弹性回归网络作为所有LSTM快照模型的元模型,并将所述第二训练集中的数据输入至所述元模型中,然后学习得到各LSTM快照模型的损失函数;
选择损失函数最小的LSTM快照模型作为最优快照模型,并将所述第二验证集中的数据输入至所述最优快照模型中,学习得到对应的输出值,并将所述输出值作为最优能源负荷预测值。
本实施例中,利用弹性网络回归(Elastic Net)作为快照集成的元模型,弹性网络回归可以同时考虑L1和L2正则化,因此会比Lasso(Least Absolute Shrinkage andSelection Operator,一种线性回归方法)或者Ridge(即ridge regression,岭回归)更适合于本实施例,所谓L1正则化是在loss function(损失函数)后面加上L1范数,L2正则化则是在loss function后面加上L2范数。具体的,引入所述测试数据集,所述测试数据集同样分为训练集(即第二训练集)和测试集(即第二测试集)。元模型代入所述第二训练集,自动学习得到所有(即p个)LSTM快照模型中损失函数最小的LSTM快照模型,即最优快照模型,然后将所述第二测试集输入至所述最优快照模型,得到1组能源负荷预测值,并将其作为对该段能源负荷的时间序列趋势预测的预测值。
在一实施例中,所述步骤S104包括:
按照下述状态转移方程计算隐藏状态随时间变化的规律:
lt=Ftlt-1+wtεt,εt~N(0,1)
式中,Ft为隐藏状态的权重,wt为隐藏状态的噪声强度,lt为隐藏状态的结果,初始状态下,
Figure BDA0002644890780000101
其中,μ0为初始状态下的向量均值矩阵,
Figure BDA0002644890780000102
为初始状态下的向量方差矩阵。
按照下述观测模型计算隐藏状态下观测值的条件概率分布p(zt|lt),并得到观测结果zt
zt=Htlt+bt+vtt,∈t~N(0,1)
式中,Ht为观测模型的权重,bt为偏置,vt为观测噪声的强度,zt为观测结果。
本实施例中,将所述最优LSTM快照模型的输出结果(即最优能源负荷预测值)、该输出结果对应的能源负荷真实值以及对应的外生变量(即其他可能对时间序列预测造成影响的因素,例如温度、天气和节假日等)输入至状态空间模型,并由所述状态空间模型输出最终的能源负荷预测值,从而完成本实施例所需的模型训练,构建关于能源负荷的预测模型。
状态空间模型起源于平稳时间序列分析,是一种动态时域模型,以隐含着的时间为自变量。本实施例中的状态空间模型包含一个状态转移方程和一个观测模型,前者描述了隐藏状态随时间变化的规律,后者概括了给定隐藏状态下观测值的条件概率分布。本实施例通过将预测值、真实值以及对应的外生变量输入至所述状态空间模型中,可以有效避免外界因素对时间序列预测造成的剧烈波动影响。
在一实施例中,所述将所述最优能源负荷预测值与对应的能源负荷真实值,以及对应的外生变量数据输入至状态空间模型,并由所述状态空间模型得到最终的能源负荷预测值,还包括:
利用极大似然估计得到最优参数
Figure BDA0002644890780000103
然后将所述最优参数Θt代入至所述状态空间模型中,从而计算得到最终的能源负荷预测值。
极大似然估计是建立在极大似然原理的基础上的一个统计方法,是概率论在统计学中的应用。极大似然估计提供了一种给定观察数据来评估模型参数的方法,即:“模型已定,参数未知”。通过若干次试验,观察其结果,利用试验结果得到某个参数值能够使样本出现的概率为最大,则称为极大似然估计。本实施例中,利用极大似然估计得到所述状态空间模型(即“模型已定”)中的参数(即“未知参数”),从而根据得到的参数求得最终的能源负荷预测值。
图2为本发明实施例提供的一种能源负荷预测装置200的示意性框图,该能源负荷预测装置200包括:
获取单元201,用于获取能源负荷的时间序列历史数据以及对应的外生变量数据,对所述能源负荷的时间序列历史数据和外生变量数据进行归一化处理,得到对应的能源负荷数据集,然后将所述能源负荷数据集划分为训练数据集和测试数据集;
学习单元202,用于将所述训练数据集中的数据分别输入至多个LSTM快照模型中,对所述多个LSTM快照模型进行训练学习;
第一选择单元203,用于基于所述测试数据集,利用弹性回归网络从所述多个LSTM快照模型中选择最优LSTM快照模型,并利用所述最优LSTM快照模型得到最优能源负荷预测值;
构建单元204,用于将所述最优能源负荷预测值与对应的能源负荷真实值、以及对应的外生变量数据输入至状态空间模型,并由所述状态空间模型得到最终的能源负荷预测值,从而构建关于能源负荷多变量时间序列的预测模型;
预测单元205,用于利用所述预测模型对指定时间的能源负荷进行预测。
在一实施例中,所述获取单元201包括:
第一划分单元,用于将所述训练数据集划分为第一训练集和第一验证集;
变换单元,用于利用快速傅里叶变换对所述第一训练集中的能源负荷的时间序列历史数据进行变换并得到功率谱,从而得到反映序列周期性的序列长度;
筛选单元,用于对所述序列长度进行筛选,选择spec最高的前p个序列长度K={k1k2,…kp},然后对选择的序列长度进行滑窗处理,从而得到p个不同的第一训练集数据。
在一实施例中,所述筛选单元包括:
矩阵单元,用于将所述第一训练集中的序列长度ki作为训练集中的预设滑窗的窗口长度,以及将所述第一验证集中的序列长度l作为验证集中的预设滑窗的窗口长度,从而得到所述第一训练集中第i个输入矩阵[(n-ki-l+1),ki],以及得到所述第一验证集中第i个输入矩阵[(n-ki-l+1),l]。
在一实施例中,所述学习单元202包括:
第一训练单元,用于将所述第一训练集中的所有数据依次输入至第一个LSTM快照模型中,对所述第一个LSTM快照模型进行多轮训练,并得到所述第一个LSTM快照模型的第一最优超参数;
第二训练单元,用于将所述第一最优超参数作为第二个LSTM快照模型的参数输入,并将所述第一训练集中的所有数据依次输入至所述第二个LSTM快照模型中,对所述第二个LSTM快照模型进行多轮训练,从而得到所述第二个LSTM快照模型的第二最优超参数;
以此类推,将每一个LSTM快照模型得到的最优超参数作为下一LSTM快照模型的参数输入,直至所有LSTM快照模型训练结束。
在一实施例中,所述第一选择单元203包括:
第二划分单元,用于将所述测试数据集划分为第二训练集和第二验证集;
将所述弹性回归网络作为所有LSTM快照模型的元模型,并将所述第二训练集中的数据输入至所述元模型中,然后学习得到各LSTM快照模型的损失函数;
第二选择单元,用于选择损失函数最小的LSTM快照模型作为最优快照模型,并将所述第二验证集中的数据输入至所述最优快照模型中,学习得到对应的输出值,并将所述输出值作为最优能源负荷预测值。
在一实施例中,所述构建单元204包括:
第一计算单元,用于按照下述状态转移方程计算隐藏状态随时间变化的规律:
lt=Ftlt-1+wtεt,εt~N(0,1)
式中,Ft为隐藏状态的权重,wt为隐藏状态的噪声强度,lt为隐藏状态的结果,初始状态下,
Figure BDA0002644890780000121
其中,μ0为初始状态下的向量均值矩阵,
Figure BDA0002644890780000122
为初始状态下的向量方差矩阵。
第二计算单元,用于按照下述观测模型计算隐藏状态下观测值的条件概率分布p(zt|lt),并得到观测结果zt
zt=Htlt+bt+vtt,∈t~N(0,1)
式中,Ht为观测模型的权重,bt为偏置,vt为观测噪声的强度,zt为观测结果。
在一实施例中,所述构建单元204还包括:
第三计算单元,用于利用极大似然估计得到最优参数
Figure BDA0002644890780000123
Figure BDA0002644890780000124
然后将所述最优参数Θt代入至所述状态空间模型中,从而计算得到最终的能源负荷预测值。
由于装置部分的实施例与方法部分的实施例相互对应,因此装置部分的实施例请参见方法部分的实施例的描述,这里暂不赘述。
本发明实施例还提供了一种计算机可读存储介质,其上存有计算机程序,该计算机程序被执行时可以实现上述实施例所提供的步骤。该存储介质可以包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
本发明实施例还提供了一种计算机设备,可以包括存储器和处理器,存储器中存有计算机程序,处理器调用存储器中的计算机程序时,可以实现上述实施例所提供的步骤。当然电子设备还可以包括各种网络接口,电源等组件。
说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围内。
还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的状况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

Claims (9)

1.一种能源负荷预测方法,其特征在于,包括:
获取能源负荷的时间序列历史数据以及对应的外生变量数据,对所述能源负荷的时间序列历史数据和外生变量数据进行归一化处理,得到对应的能源负荷数据集,然后将所述能源负荷数据集划分为训练数据集和测试数据集;所获取的外生变量数据是指会对时间序列数据产生影响的数据;
将所述训练数据集中的数据分别输入至多个LSTM快照模型中,对所述多个LSTM快照模型进行训练学习;
基于所述测试数据集,利用弹性回归网络从所述多个LSTM快照模型中选择最优LSTM快照模型,并利用所述最优LSTM快照模型得到最优能源负荷预测值;
所述基于所述测试数据集,利用弹性回归网络从所述多个LSTM快照模型中选择最优LSTM快照模型,并利用所述最优LSTM快照模型得到最优能源负荷预测值,包括:
将所述测试数据集划分为第二训练集和第二验证集;
将所述弹性回归网络作为所有LSTM快照模型的元模型,并将所述第二训练集中的数据输入至所述元模型中,然后学习得到各LSTM快照模型的损失函数;
选择损失函数最小的LSTM快照模型作为最优快照模型,并将所述第二验证集中的数据输入至所述最优快照模型中,学习得到对应的输出值,并将所述输出值作为最优能源负荷预测值;
将所述最优能源负荷预测值与对应的能源负荷真实值、以及对应的外生变量数据输入至状态空间模型,并由所述状态空间模型得到最终的能源负荷预测值,从而构建关于能源负荷多变量时间序列的预测模型;
利用所述预测模型对指定时间的能源负荷进行预测。
2.根据权利要求1所述的能源负荷预测方法,其特征在于,所述获取能源负荷的时间序列历史数据以及对应的外生变量数据,对所述能源负荷的时间序列历史数据和外生变量数据进行归一化处理,得到对应的能源负荷数据集,然后将所述能源负荷数据集划分为训练数据集和测试数据集,包括:
将所述训练数据集划分为第一训练集和第一验证集;
利用快速傅里叶变换对所述第一训练集中的能源负荷的时间序列历史数据进行变换并得到功率谱,从而得到反映序列周期性的序列长度;
对所述序列长度进行筛选,选择功率谱最高的前p个序列长度
Figure 686834DEST_PATH_IMAGE001
,然后对选择的序列长度进行滑窗处理,从而得到p个不同的第一训练集数据。
3.根据权利要求2所述的能源负荷预测方法,其特征在于,所述对所述序列长度进行筛选,选择功率谱最高的前p个序列长度
Figure 981549DEST_PATH_IMAGE001
,然后对选择的序列长度进行滑窗处理,包括:
将所述第一训练集中的序列长度
Figure 487616DEST_PATH_IMAGE002
作为训练集中的预设滑窗的窗口长度,以及将所述第一验证集中的序列长度l作为验证集中的预设滑窗的窗口长度,从而得到所述第一训练集中第i个输入矩阵
Figure 234993DEST_PATH_IMAGE003
,以及得到所述第一验证集中第i个输入矩阵
Figure 851919DEST_PATH_IMAGE004
4.根据权利要求2所述的能源负荷预测方法,其特征在于,所述将所述训练数据集中的数据分别输入至多个LSTM快照模型中,对所述多个LSTM快照模型进行训练学习,包括:
将所述第一训练集中的所有数据依次输入至第一个LSTM快照模型中,对所述第一个LSTM快照模型进行多轮训练,并得到所述第一个LSTM快照模型的第一最优超参数;
将所述第一最优超参数作为第二个LSTM快照模型的参数输入,并将所述第一训练集中的所有数据依次输入至所述第二个LSTM快照模型中,对所述第二个LSTM快照模型进行多轮训练,从而得到所述第二个LSTM快照模型的第二最优超参数;
以此类推,将每一个LSTM快照模型得到的最优超参数作为下一LSTM快照模型的参数输入,直至所有LSTM快照模型训练结束。
5.根据权利要求1所述的能源负荷预测方法,其特征在于,所述将所述最优能源负荷预测值与对应的能源负荷真实值、以及对应的外生变量数据输入至状态空间模型,并由所述状态空间模型得到最终的能源负荷预测值,从而构建关于能源负荷多变量时间序列的预测模型,包括:
按照下述状态转移方程计算隐藏状态随时间变化的规律:
Figure 751873DEST_PATH_IMAGE005
式中,Ft为隐藏状态的权重,wt为隐藏状态的噪声强度,lt为隐藏状态的结果,初始状态下,
Figure 428842DEST_PATH_IMAGE006
,其中,
Figure 663514DEST_PATH_IMAGE007
为初始状态下的向量均值矩阵,
Figure 615289DEST_PATH_IMAGE008
为初始状态下的向量方差矩阵;
按照下述观测模型计算隐藏状态下观测值的条件概率分布
Figure 822280DEST_PATH_IMAGE009
,并得到观测结果zt
Figure 935729DEST_PATH_IMAGE010
式中,Ht为观测模型的权重,bt为偏置,
Figure 657698DEST_PATH_IMAGE011
t为观测噪声的强度,zt为观测结果。
6.根据权利要求5所述的能源负荷预测方法,其特征在于,所述将所述最优能源负荷预测值与对应的能源负荷真实值,以及对应的外生变量数据输入至状态空间模型,并由所述状态空间模型得到最终的能源负荷预测值,还包括:
利用极大似然估计得到最优参数
Figure 616426DEST_PATH_IMAGE012
Figure 723929DEST_PATH_IMAGE013
〉0,然后将所述最优参数
Figure 742700DEST_PATH_IMAGE014
代入至所述状态空间模型中,从而计算得到最终的能源负荷预测值。
7.一种能源负荷预测装置,其特征在于,包括:
获取单元,用于获取能源负荷的时间序列历史数据以及对应的外生变量数据,对所述能源负荷的时间序列历史数据和外生变量数据进行归一化处理,得到对应的能源负荷数据集,然后将所述能源负荷数据集划分为训练数据集和测试数据集;所获取的外生变量数据是指会对时间序列数据产生影响的数据;
学习单元,用于将所述训练数据集中的数据分别输入至多个LSTM快照模型中,对所述多个LSTM快照模型进行训练学习;
第一选择单元,用于基于所述测试数据集,利用弹性回归网络从所述多个LSTM快照模型中选择最优LSTM快照模型,并利用所述最优LSTM快照模型得到最优能源负荷预测值;
所述第一选择单元包括:
第二划分单元,用于将所述测试数据集划分为第二训练集和第二验证集;
损失函数学习单元,用于将所述弹性回归网络作为所有LSTM快照模型的元模型,并将所述第二训练集中的数据输入至所述元模型中,然后学习得到各LSTM快照模型的损失函数;
第二选择单元,用于选择损失函数最小的LSTM快照模型作为最优快照模型,并将所述第二验证集中的数据输入至所述最优快照模型中,学习得到对应的输出值,并将所述输出值作为最优能源负荷预测值;
构建单元,用于将所述最优能源负荷预测值与对应的能源负荷真实值、以及对应的外生变量数据输入至状态空间模型,并由所述状态空间模型得到最终的能源负荷预测值,从而构建关于能源负荷多变量时间序列的预测模型;
预测单元,用于利用所述预测模型对指定时间的能源负荷进行预测。
8.一种计算机设备,其特征在于,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述的能源负荷预测方法。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的能源负荷预测方法。
CN202010851509.2A 2020-08-21 2020-08-21 一种能源负荷预测方法、装置、计算机设备及存储介质 Active CN111932024B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010851509.2A CN111932024B (zh) 2020-08-21 2020-08-21 一种能源负荷预测方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010851509.2A CN111932024B (zh) 2020-08-21 2020-08-21 一种能源负荷预测方法、装置、计算机设备及存储介质

Publications (2)

Publication Number Publication Date
CN111932024A CN111932024A (zh) 2020-11-13
CN111932024B true CN111932024B (zh) 2022-09-20

Family

ID=73304523

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010851509.2A Active CN111932024B (zh) 2020-08-21 2020-08-21 一种能源负荷预测方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN111932024B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112734106A (zh) * 2021-01-08 2021-04-30 深圳市国电科技通信有限公司 用于预测能源负荷的方法及装置
CN112906974B (zh) * 2021-03-11 2024-03-26 东南大学 一种负荷电量及其碳排放预测与校验方法
CN113486698B (zh) * 2021-04-30 2023-09-26 华中科技大学 一种氢燃料电池工作的识别预测方法、存储介质及系统
CN113722813A (zh) * 2021-07-20 2021-11-30 中科云谷科技有限公司 用于泵车臂架状况监测的方法、装置及泵车
CN114243695B (zh) * 2021-12-17 2023-09-15 中国矿业大学(北京) 一种基于双向长短时记忆神经网络的电力负荷预测方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109829587A (zh) * 2019-02-12 2019-05-31 国网山东省电力公司电力科学研究院 基于深度lstm网络的小区域级超短期负荷预测及可视化方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110059844B (zh) * 2019-02-01 2021-10-08 东华大学 基于集合经验模态分解和lstm的储能装置控制方法
CN109978040A (zh) * 2019-03-19 2019-07-05 西南交通大学 一种交通运力分布预测方法
CN109930658B (zh) * 2019-03-27 2021-02-05 杭州电子科技大学 一种基于系统能观性的供水管网监测点布置方法
CN110191015B (zh) * 2019-05-21 2022-04-29 中山大学 基于cpi指标的云服务性能智能预测方法和装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109829587A (zh) * 2019-02-12 2019-05-31 国网山东省电力公司电力科学研究院 基于深度lstm网络的小区域级超短期负荷预测及可视化方法

Also Published As

Publication number Publication date
CN111932024A (zh) 2020-11-13

Similar Documents

Publication Publication Date Title
CN111932024B (zh) 一种能源负荷预测方法、装置、计算机设备及存储介质
Lin et al. Short-term load forecasting based on LSTM networks considering attention mechanism
CN109816221B (zh) 项目风险决策方法、装置、计算机设备和存储介质
CN116757534B (zh) 一种基于神经训练网络的智能冰箱可靠性分析方法
CN111563706A (zh) 一种基于lstm网络的多变量物流货运量预测方法
CN115293326A (zh) 电力负荷预测模型的训练方法、装置及电力负荷预测方法
Miller et al. Statistical behavior of retrospective patterns and their effects on estimation of stock and harvest status
CN113392594B (zh) 一种基于abc极限学习机的力学性能区间预测方法及装置
CN115587666A (zh) 基于季节趋势分解和混合神经网络的负荷预测方法及系统
Tessoni et al. Advanced statistical and machine learning methods for multi-step multivariate time series forecasting in predictive maintenance
CN111612648B (zh) 光伏发电预测模型的训练方法、装置和计算机设备
CN114330642A (zh) 一种用于多采样时间的建筑电力负荷预测方法
CN117592593A (zh) 基于改进二次模态分解和WOA优化BILSTM-attention的短期电力负荷预测方法
CN117290685A (zh) 一种基于历史数据的电厂电力设备专家诊断系统及方法
Wang et al. A Transformer-based multi-entity load forecasting method for integrated energy systems
CN115496264A (zh) 一种风电机组发电功率的预测方法
Viana et al. Load forecasting benchmark for smart meter data
CN115293406A (zh) 基于CatBoost和Radam-LSTM的光伏发电功率预测方法
CN112581311B (zh) 一种多风电场聚合后出力长期波动特性预测方法及系统
Srivastava et al. Weather Prediction Using LSTM Neural Networks
CN114444798A (zh) 一种基于时空分布技术的接触网运维方法和装置
CN114580151A (zh) 一种基于灰色线性回归-马尔科夫链模型的需水预测方法
CN114266593A (zh) 一种基于kpca和线性回归的电力消费预测方法
Owda et al. Using artificial neural network techniques for prediction of electric energy consumption
Zheng et al. Estimating dynamic stochastic decision models: explore the generalized maximum entropy alternative

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: Room 2301, building 2, Fangda Plaza, No.20, Gaofa West Road, Taoyuan community, Taoyuan Street, Nanshan District, Shenzhen, Guangdong 518000

Applicant after: China Resources Digital Technology Co.,Ltd.

Address before: Room 2301, building 2, Fangda Plaza, No.20, Gaofa West Road, Taoyuan community, Taoyuan Street, Nanshan District, Shenzhen, Guangdong 518000

Applicant before: Runlian software system (Shenzhen) Co.,Ltd.

GR01 Patent grant
GR01 Patent grant