CN112101521A - 一种基于长短期记忆网络混合模型的建筑能耗预测方法 - Google Patents
一种基于长短期记忆网络混合模型的建筑能耗预测方法 Download PDFInfo
- Publication number
- CN112101521A CN112101521A CN202010812762.7A CN202010812762A CN112101521A CN 112101521 A CN112101521 A CN 112101521A CN 202010812762 A CN202010812762 A CN 202010812762A CN 112101521 A CN112101521 A CN 112101521A
- Authority
- CN
- China
- Prior art keywords
- lstm
- energy consumption
- iscoma
- population
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000005265 energy consumption Methods 0.000 title claims abstract description 72
- 238000000034 method Methods 0.000 title claims abstract description 56
- 230000007787 long-term memory Effects 0.000 title claims description 6
- 230000006403 short-term memory Effects 0.000 title claims description 6
- 230000015654 memory Effects 0.000 claims abstract description 37
- 238000005457 optimization Methods 0.000 claims abstract description 13
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 12
- 230000035772 mutation Effects 0.000 claims abstract description 11
- 210000004027 cell Anatomy 0.000 claims description 30
- 230000006870 function Effects 0.000 claims description 27
- 238000003860 storage Methods 0.000 claims description 21
- 238000012360 testing method Methods 0.000 claims description 21
- 239000013598 vector Substances 0.000 claims description 18
- 238000011156 evaluation Methods 0.000 claims description 15
- 230000008569 process Effects 0.000 claims description 14
- 238000007726 management method Methods 0.000 claims description 13
- 238000007405 data analysis Methods 0.000 claims description 9
- 238000007781 pre-processing Methods 0.000 claims description 9
- 238000012545 processing Methods 0.000 claims description 9
- 230000004913 activation Effects 0.000 claims description 7
- 210000002569 neuron Anatomy 0.000 claims description 6
- 238000012854 evaluation process Methods 0.000 claims description 5
- 238000012549 training Methods 0.000 claims description 5
- 238000004891 communication Methods 0.000 claims description 4
- 101001095088 Homo sapiens Melanoma antigen preferentially expressed in tumors Proteins 0.000 claims description 3
- 102100037020 Melanoma antigen preferentially expressed in tumors Human genes 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 3
- 230000003993 interaction Effects 0.000 claims description 3
- 239000011159 matrix material Substances 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 3
- 238000005070 sampling Methods 0.000 claims description 3
- 238000006467 substitution reaction Methods 0.000 claims description 3
- 238000010200 validation analysis Methods 0.000 claims description 2
- 238000011478 gradient descent method Methods 0.000 claims 1
- 230000004044 response Effects 0.000 abstract description 4
- 238000013528 artificial neural network Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 8
- 238000004590 computer program Methods 0.000 description 7
- 238000011160 research Methods 0.000 description 7
- 238000011161 development Methods 0.000 description 6
- 230000007774 longterm Effects 0.000 description 5
- 230000000306 recurrent effect Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 238000001514 detection method Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012407 engineering method Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000001537 neural effect Effects 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 235000000332 black box Nutrition 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000001351 cycling effect Effects 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 239000003344 environmental pollutant Substances 0.000 description 1
- 238000003912 environmental pollution Methods 0.000 description 1
- 239000007789 gas Substances 0.000 description 1
- 239000005431 greenhouse gas Substances 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 231100000719 pollutant Toxicity 0.000 description 1
- 238000010248 power generation Methods 0.000 description 1
- 230000002028 premature Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 238000005057 refrigeration Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 210000000352 storage cell Anatomy 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Economics (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Biophysics (AREA)
- Strategic Management (AREA)
- Artificial Intelligence (AREA)
- Human Resources & Organizations (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Tourism & Hospitality (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明属于电力需求侧响应的控制领域,涉及一种基于长短期记忆网络混合模型的建筑能耗预测方法,提出了一种针对建筑物的能耗预测模型,该模型采用长短期记忆网络LSTM和改进的正弦余弦优化算法,可进行准确并且可靠的建筑能耗预测。同时,引入了一种新型基于Haar小波的突变算子,提高正弦余弦优化算法向全局最优解的发散性。提出的改进的正弦余弦优化算法ISCOA可优化LSTM的超参数(学习率,权重衰减,动量和隐藏单位数)。本方法提出的ISCOA‑LSTM可计算稳定而准确的预测结果,进而作为解决能耗预测问题的有效工具。
Description
技术领域
本发明涉及电力需求侧响应的控制领域,具体涉及一种基于长短期记忆网络混合模型的建筑能耗预测方法。
背景技术
随着全球人口的快速增长,工业化的发展,经济发展以及生活、社会的发展,这些发展对全球能源消耗和环境产生了重大影响。92%的人生活在建筑物之中,从而增加了能源密集型建筑物的运行,以满足人们的生活需求和舒适性,这些需求占整个建筑物使用周期总能耗的80-90%。由于建筑物约占全球能源消耗的39%,温室气体排放约占全球排放量的38%,建筑物已成为最大的能源消耗者。根据《2017年国际能源展望》,“电能是照明,制冷和电器的主要能源,也是2015年至2040年间建筑中增长最快的能源;到2040年,中国和印度将占世界建筑总用电量的四分之一。
最近的研究表明,因为能源资源短缺,全球能源需求不断增加,污染物气体排放以及可再生能源和绿色能源系统的研究差距,能源需求管理已成为重要的研究领域。能耗预测是能源管理系统的重要组成部分,旨在指导电力公司的日常管理,电网规划,并在电网能源管理中做出最佳决策,以确保电力系统的安全可靠运行。通过这种设计准确而强大的能耗预测模型来提高建筑物的能源效率,是能源管理,需求响应程序,故障检测和能源基准测试的有效解决方案。此外,精准的建筑能耗预测模型有助于制定和实施能效政策,减少建筑能耗并减轻环境污染,实现可持续发展。但是,能耗数据的非线性,非平稳性和多季节性以及对天气条件(室内和室外),建筑物环境对状态、时间、占用率等影响因素的依赖性使得能耗预测准确无误成为一项艰巨的任务。
高精度和高鲁棒性的建筑能耗预测模型设计的最新方法可以分为三种,(i)工程方法或白盒方法(EnergyPlus,eQuest,Ecotect等),(ii)统计或灰盒方法(温度频率法,度日法,居民负荷因子法等)和(iii)数字化管理或黑匣子法(神经网络,支持向量机,决策树,回归模型,k最近邻等)。其中,由于数字化管理的易用性,实用性,适应性和较高的预测准确性,因此在建筑能耗预测中获得了好评。此外,数字化管理的方法比工程方法更实用,因为它们基于可用的数据(能耗,气候,时间和占用量)提供了准确的预测,而这些数据很容易通过最新的传感和通信技术从建筑物中获得。
人工神经网络(ANN)及其变体(前馈神经网络(FFNN),递归神经网络(RNN),概率神经网络(PNN)等)用于建筑物能耗预测(短期,中期和长期)以及故障检测和诊断的最常用数字化管理方法。能耗预测的神经网络模型的性质如何,模型参数如何选择(即超参数)都会对给定数据的模型预测准确性产生重大影响。
为了解决这个问题,我们需要自动搜索最佳的超参数,从而可以自动搜索学习模型的超参数空间。因此,使用优化算法或统计技术识别合适的超参数(权重,学习率等)形成了一种众所周知的标准方法,该方法可以提高预测准确性和建筑物能耗预测的一致性。
通常,回归和时间序列预测方法是建筑能耗预测中最常用的数字化管理方法。前者基于多个属性与能耗数据之间的相关性构建模型,并预测建筑能耗。时间序列预测方法识别变量之间相对于时间的相互依赖性和相关性,并预测一段时间内建筑能耗的变化。在传统的时间序列预测模型中,例如自回归移动平均模型(ARMA),自回归综合移动平均模型(ARIMA)和灰色系统,递归神经网络(RNN)已被广泛用于非线性时间序列预测问题,并且已经证明它们在建筑能耗预测中的出色表现。RNN是ANN最强大的变体,用于解决时间序列问题,即按时间顺序列出一系列相关的观察结果。因为它们具有神经元的完全连接结构以及内部记忆和循环,从而使神经网络的信息不断循环。上一个时间步长进入网络,即时间步长之间的信息共享。尽管RNN有其好处,但它仍然有“丢失和超出梯度的问题”,因此难以学习长期的依赖关系。
在工业需求响应聚合商能量优化领域,相关文献中研究的共同特点是在电力市场的竞争结构中,DR项目的作用并未得到全面的评价,且鲜有研究研究整合不同重工业的灵活性潜力。
综上,目前对建筑能耗预测(学校,商业和住宅建筑)研究存在以下不足:
1、最近的文献采用纯LSTM或混合模型(时间序列分解+优化+LSTM),重点是为了提高能耗预测模型的预测精度,在混合模型中,每种技术都用于执行特定任务而不调整LSTM的超参数以提高其性能,从而将预测误差降至最低。LSTM应用于特定实际问题的性能仍然为零。
2、学习模型的潜在劣势在于通过反复试验来确定最佳超参数,相对来说比较麻烦。为了解决这个问题,需要自动搜索最佳的超参数,从而可以自动搜索学习模型的超参数空间。
3、此外,大多数研究工作已经证明了LSTM使用的是静态数据(基准数据集)而不是基于实时运营数据的工作模型进行能耗预测的。
发明内容
发明目的:
针对于现在建筑物能耗预测准确性误差较大的问题,本发明提供一种基于长短期记忆网络混合模型的建筑能耗预测方法,以提高预测的准确性和鲁棒性。
技术方案:
一种基于长短期记忆网络混合模型的建筑能耗预测方法,其特征在于:提出基于改进正弦余弦优化长短期记忆网络的混合模型,采用ISCOA识别LSTM的最佳超参数以提高建筑物能耗预测精度;
提出的能耗预测模型由四层组成,即(i)数据采集和存储层,(ii)数据预处理层,(iii)数据分析层和(iv)应用层;ISCOA-LSTM建筑能耗预测模型中的每个层都由多个模块组成,以执行其预期的功能,具体实现步骤如下:
步骤一:数据采集和存储层
智能建筑采用集中式能源管理系统,是将若干个数字控制器提供异步通信体系结构,与分布式自动化设备进行交互;自动化软件收集,汇总并存储建筑物能耗数据以及其他相关因素到数据库中,以进行进一步处理;采用相关系数分析研究能耗和相关因素之间的相关性;
步骤二:数据预处理层
楼宇自动化软件收集并存储原始数据,采用最小—最大归一化来对[0,1]范围内的数据进行归一化,并减轻权重和学习模型偏差的稳定收敛;将预处理的能耗数据集按60:20:20的比例划分,以随机方式分别进行训练,评估和测试;
步骤三:数据分析层
数据分析层采用LSTM网络来预测用户指定时间的能耗;此外,迭代地使用改进的正余弦优化算法来优化LSTM的超参数,以提高其预测精度;使用测试数据集评估ISCOA-LSTM的有效性;当适合度值最小时,ISCOA-LSTM的学习过程完成;
步骤四:应用层
验证过程完成后,使用ISCOA-LSTM预测用户指定时间间隔的能耗。
基于LSTM的内部预测架构,LSTM由一个或多个存储单元的存储块组成,这些存储单元充当具有乘法输入门(it),更新(gt),忘记(ft)和输出(ot)的神经元;输入门(it)和更新门(gt)在LSTM的存储单元中执行写功能的操作,而忘记门(ft)缩放单元的内部状态,将逐渐遗忘合并到存储单元中;输出门执行读取功能,然后将其与存储单元组合以计算存储单元(ht)输出;每个门均受其激活函数引导,该函数控制信息在存储单元中的流入和流出;
在时间步骤t,门接收两个输入,即:在t(xt)处的输入数据和从先前时间步骤(ht -1)获得的同一存储单元的输出;等式(1)-(5)提供了一组方程式,用于控制LSTM中每个门的工作;
遗忘门(ft)调节要从存储单元中删除信息量;
每个存储单元通过先前状态值(t-1)与写入和遗忘门值的交互来递归更新其值;
ct=ft*ct-1+it*gt (4)
输出门(ot)基于绑定输出值的激活函数控制信息从存储单元流出,并确定输出门(ot)将提供哪个值作为输出;
最后,使用等式计算输出单元(ht)的隐藏状态和LSTM单元(yt)的总输出;(6)和(7):
ht=ot*Tanh(ct) (6)
按照标准,LSTM的权重和偏差的初始值是在训练过程中随机生成的;通常,使用采用标准梯度下降(SGD)方法的反向传播算法来更新权重和偏差;在SGD的性能依赖于超参数的情况下,采用改进正弦余弦确定这些超参数的最佳值以提高LSTM的预测准确性对于时间序列问题。
所述的采用ISCOA识别LSTM的最佳超参数,提出了ISCOA-LSTM的改进方法,其主要目标是通过识别超参数的最佳组合,来最小化LSTM的计算复杂度和预测误差之间的权衡;ISCOA-LSTM的整体工作可以通过四个不同的阶段来详细阐述,即(i)编码策略,即种群的产生,(ii)超参数优化,(iii)种群的更新,即更新的位置;每个人都使用基于Haar小波的变异算子,以及(iv)ISCOA-LSTM的性能评估;ISCOA-LSTM每个阶段的逐步操作过程如下:
步骤1:数据预处理:在[0,1]范围内标准化历史功耗数据集(DPC=x(t);t={1,2,...,n});学习DTrain,评估DEval和测试样本DTest以60:20:20的比率分别使用无替换技术的随机采样进行测试;
步骤2:编码策略:在传统的SCOA中,总体是在指定范围内随机生成的,并根据适应度值获得用于位置更新的最佳总体;ISCOA-LSTM采用矢量编码策略来生成初始种群,因为它必须优化多个参数,每个参数都具有唯一的范围;在这种编码策略中,每个种群的位置都以矢量的形式表示,其长度对应于需要优化的参数数量;在ISCOA-LSTM中,优化了四个超参数,即学习率(ai),权重衰减(bi),动量因子(gi)和隐藏单位数(hi),每个种群矢量都用等式(8)表示:
PoPi=[ai,bi,gi,hi];i=(1,2,...,NPoP) (8)
其中NPoP是人口总数;设定以[0,1]范围内的随机方式生成每个种群矢量,并使用等式(9)将它们转换为它们对应的参数特定范围:
fv=PoPMin+[PoPMax-PoPMin]*PoPv (9)
其中PoPMin和PoPMax是超参数的最小值和最大值;Pv是随机生成的总体;
步骤3:学习LSTM:学习过程中,将从每个总体获得的超参数以及学习数据集DTrain用于学习LSTM;
步骤4:评估LSTM:在评估过程中,使用评估数据集以均方误差MSE作为如下适应度函数;
其中n'是评估数据集中的样本数;yEval和yForecast分别是实际值和预测值;
步骤5:终止条件:LSTM的评估过程返回每个群体的适应度值,并将MSE最小的样本点识别为潜在解决方案;使用测试数据集(DTest)达到终止条件时,根据平均绝对误差MAE,平均绝对百分比误差MAPE,均方误差MSE,均方根RMSE评估LSTM的性能;否则,使用步骤6更新每个样本点的位置;
步骤6:位置更新:使用公式(17)更新每个点的位置;为了克服常规SCOA中的问题,引入了基于Haar小波的变异算子用于SCOA中的位置更新;在此过程中,使用等式(11)计算突变概率Mt;如果满足条件(rand£Mt),则从相应的总体向量中选择随机点,并使用等式(12)获得其对应的变异值;
其中t是当前迭代;T是最大迭代次数;
其中:σ为Haar小波函数;
其中:a是[-2.5,2.5]范围内的随机数。
本发明的优点效果:ISCOA-LSTM在其应用于能耗预测方面和常规方法具有以下不同:
1.多变量或单变量:ISCOA-LSTM适用于多变量和单变量的时间序列能耗数据。
2.单一或混合LSTM以达到预测精度:ISCOA-LSTM通过使用改进的正弦余弦来确定最佳超参数(学习率,动量,权重衰减和隐藏单位数),从而提高LSTM的性能。
3.Haar小波算子在简单有效的提高正弦余弦优化算法的发散性和收敛性方面是一种实时识别LSTM最优超参数值的有效解决方案。
为此,本方法提出了ISCOA-LSTM能耗预测方法,主要优点和益处如下:
1.提出了ISCOA-LSTM建筑能耗预测(一种能耗预测模型),以针对短期预测(STF),中期预测(MTF)和长期预测(LTF)进行准确的能耗预测。
2.ISCOA是SCOA的改进版本,用于识别学习率,权重衰减,动量和隐藏单位数的最佳超参数值,以提高LSTM预测建筑能耗的准确性。
3.通过引入一种新的基于Haar小波的变异算子来最大程度地减少遍历搜索与迭代开发之间的权衡,从而避免过早的收敛,改善了传统SCOA的性能。
4.ISCOA-LSTM可用于需求侧管理程序,定价策略,传输扩展计划,能源异常检测,电力盗窃以及未来负荷与发电预测的设计。
附图说明
图1简单递归神经网络——实时展开拓扑图
图2长短期记忆-记忆块(记忆单元和门单元)
图3 ISCOA-LSTM建筑能耗预测模型
图4提出的ISCO-LSTM建筑能耗预测模型的流程
具体实施方式:
下面结合附图对本发明的具体实施方式进行描述,以便本领域的技术人员更好的理解本发明。
图1为简单递归神经网络——实时展开拓扑图。
通常,神经网络模型可分为前馈神经网络(FFNN)和递归神经网络(RNN)。FFNN被广泛用于处理空间域中的数据,而忽略了有关时间(即时间信息)的数据出现。另一方面,RNN体系结构可以看作是具有互连神经元的环回体系结构,可以在更大范围内对数据之间的顺序和时间依赖性进行建模[43]。
RNN体系结构的标准在图1中给出了。网络中的每个节点都从当前状态(xt)接收输入,并从先前状态(h(t-1))接收隐藏层的隐藏状态值。用更简单的术语来说,单个神经元及其反馈回路分别充当信息处理单元和存储器,因此在时间t的输入将通过循环连接对网络的未来输出产生影响。等式(6)和(7)提供了RNN的基本计算。
通常,使用时间的反向传播来学习RNN网络连接的权重。但是,这种概念在处理长期依赖关系时很脆弱。由于这些值被反向传播到激活函数中,由于在处理长间隔序列时局部误差的传播,RNN存在“丢失或超出梯度的问题”。
LSTM是RNN的一项重大进步,它在隐藏层中使用“自连接”存储单元和门单元来解决RNN中的“丢失梯度的问题”。自连接的存储单元使模型能够在处理顺序数据时学习长期依赖性。此外,四个门单元,即输入门(it),更新门(gt),遗忘门(ft)和输出门(ot)使模型能够写入/更新,遗忘和读取信息。总而言之,具有自连接存储单元,四个门单元,输入节点和内部状态节点的LSTM提供了一种智能方法,通过保留相关信息和“忘记”不相关信息来维持恒定错误。
图2为长短期记忆-记忆块(记忆单元和门单元)。
图2提供了对LSTM内部架构的具体信息。与传统的RNN不同,LSTM由一个或多个存储单元的存储块组成,这些存储单元充当具有乘法输入门(it),更新(gt),忘记(ft)和输出(ot)的神经元。输入门(it)和更新门(gt)在LSTM的存储单元中执行写功能(输入要写入值的输入门;更新门—创建新单元值的向量)的操作,而忘记门(ft)缩放单元的内部状态,将逐渐遗忘合并到存储单元中。输出门执行读取功能,然后将其与存储单元组合以计算存储单元(ht)输出。每个门均受其激活函数(S型或双曲线正切函数)引导,该函数控制信息在存储单元中的流入和流出。
在时间步骤t,门接收两个输入,即:在t(xt)处的输入数据和从先前时间步骤(ht -1)获得的同一存储单元的输出。等式(8)-(12)提供了一组方程式,用于控制LSTM中每个门的工作。
遗忘门(ft)调节要从存储单元中删除信息量(范围:(0,1);0忘记全部和1记住全部)。
每个存储单元通过先前状态值(t-1)与写入和遗忘门值的交互来递归更新其值。
ct=ft*ct-1+it*gt (11)
输出门(ot)基于绑定输出值的激活函数控制信息从存储单元流出,并确定输出门(ot)将提供哪个值作为输出。
最后,使用等式计算输出单元(ht)的隐藏状态和LSTM单元(yt)的总输出。(13)和(14)。
ht=ot*Tanh(ct) (13)
按照标准,LSTM的权重和偏差的初始值是在训练过程中随机生成的。通常,使用采用标准梯度下降(SGD)方法的反向传播算法来更新权重和偏差。但是,SGD的性能依赖于超参数,例如学习率,重量衰减,动量,隐藏单位数等。因此,确定这些超参数的最佳值以提高LSTM的预测准确性对于时间序列问题。
图3为ISCOA-LSTM建筑能耗预测模型。
本方法提出的能耗预测模型由四层组成,即(i)数据采集和存储层,(ii)数据预处理层,(iii)数据分析层和(iv)应用层。ISCOA-LSTM建筑能耗预测模型中的每个层都由多个模块组成,以执行其预期的功能,具体实现步骤如下:
步骤一:数据采集和存储层
智能建筑采用集中式能源管理系统,其特点是若干个数字控制器(传感器,执行器等)提供异步通信体系结构,与分布式自动化设备进行交互。自动化软件收集,汇总并存储建筑物能耗数据以及其他相关因素(例如占用率,气候数据(温度,湿度等)和设备运行状态)到数据库中,以进行进一步处理。采用相关系数分析研究能耗和相关因素之间的相关性。
步骤二:数据预处理层
楼字自动化软件收集并存储原始数据,这些原始数据通常包含由于设备故障或损坏,传输错误等导致的杂乱,不可靠,不完整和丢失的数据。通常,不规则和丢失的数据通过移动平均滤波器,滑动窗口和线性插值技术。除此之外,采用最小—最大归一化来对[0,1]范围内的数据进行归一化,并减轻权重和学习模型偏差的稳定收敛。此外,将预处理的能耗数据集按60:20:20的比例划分,以随机方式分别进行训练,评估和测试。
步骤三:数据分析层
数据分析层采用LSTM网络来预测用户指定时间的能耗。此外,迭代地使用改进的正余弦优化算法来优化LSTM的超参数(学习率,隐藏层数,动量和衰减因子),以提高其预测精度。使用测试数据集(能耗数据集的20%)评估ISCOA-LSTM的有效性。当适合度值(均方误差)最小时,即预测值与实际值之间的差最小时,ISCOA-LSTM的学习过程完成。
步骤四:应用层
验证过程完成后,使用ISCOALSTM预测用户指定时间间隔的能耗。
图4提出的ISCO-LSTM建筑能耗预测模型的流程图
本方法提出了ISCOA-LSTM的改进方法,其主要目标是通过识别超参数的最佳组合,即学习率,权重衰减,动量和隐藏单位数,来最小化LSTM的计算复杂度和预测误差之间的权衡。ISCOA-LSTM的整体工作可以通过四个不同的阶段(算法2)来详细阐述,即(i)编码策略,即种群的产生,(ii)超参数优化,(iii)种群的更新,即更新的位置。每个人都使用基于Haar小波的变异算子,以及(iv)ISCOA-LSTM的性能评估。下面详细介绍了ISCOA-LSTM每个阶段的逐步操作过程。
步骤1:数据预处理:——在[0,1]范围内标准化历史功耗数据集(DPC=x(t);t={1,2,...n})。学习DTrain,评估DEval和测试样本DTest以60:20:20的比率分别使用无替换技术的随机采样进行测试。
步骤2:编码策略:——在传统的SCOA中,总体是在指定范围([下限,上限])内随机生成的,并根据适应度值获得用于位置更新的最佳总体。ISCOA-LSTM采用矢量编码策略来生成初始种群,因为它必须优化多个参数(学习率,重量衰减,动量和隐藏单位数),每个参数都具有唯一的范围。在这种编码策略中,每个种群的位置都以矢量的形式表示,其长度对应于需要优化的参数数量。例如,在ISCOA-LSTM中,我们优化了四个超参数,即学习率(ai),权重衰减(bi),动量因子(gi)和隐藏单位数(hi),因此,每个种群矢量都用等式(8)表示。
PoPi=[ai,bi,gi,hi];i=(1,2,...,NPoP) (8)
其中NPoP是人口总数。向量编码策略的主要缺点是只能在指定范围内生成种群向量。因此,本方法设定以[0,1]范围内的随机方式生成每个种群矢量,并使用等式(9)将它们转换为它们对应的参数特定范围。
fv=PoPMin+[PoPMax-PoPMin]*PoPv (9)
其中PoPMin和PoPMax是超参数的最小值和最大值;Pv是随机生成的总体。
步骤3:学习LSTM:——在学习过程中,将从每个总体(步骤2)获得的超参数以及学习数据集DTrain用于学习LSTM。
步骤4:评估LSTM:——在评估过程中,使用评估数据集以均方误差(MSE)作为适应度函数(等式(10))。
其中n'是评估数据集中的样本数;yEval和yForecast分别是实际值和预测值。
步骤5:终止条件:——LSTM的评估过程返回每个群体的适应度值,并将MSE最小的样本点(适应度值)识别为潜在解决方案。此外,使用测试数据集(DTest)达到终止条件(最大迭代次数)时,根据MAE,MAPE,MSE,RMSE,Theil U1和Theil U2评估LSTM的性能。否则,使用步骤6更新每个样本点的位置。
步骤6:位置更新:——使用公式(17)更新每个点的位置。传统SCOA的明显缺点之一是由于内部参数的随机性,导致局部最优收敛。为了克服常规SCOA中的上述问题,我们引入了基于Haar小波的变异算子用于SCOA中的位置更新。在此过程中,使用等式(11)计算突变概率(Mt);如果满足条件(rand£Mt),则从相应的总体向量中选择随机点(超参数),并使用等式(12)获得其对应的变异值。
其中t是当前迭代;T是最大迭代次数。
其中:σ为Haar小波函数(等式(12))。
其中:a是[-2.5,2.5]范围内的随机数。
本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在本计算机可读存储器中的指令产生包括指令装置的制造品,本指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。
Claims (3)
1.一种基于长短期记忆网络混合模型的建筑能耗预测方法,其特征在于:提出基于改进正弦余弦优化长短期记忆网络的混合模型,采用ISCOA识别LSTM的最佳超参数以提高建筑物能耗预测精度;
提出的能耗预测模型由四层组成,即(i)数据采集和存储层,(ii)数据预处理层,(iii)数据分析层和(iv)应用层;ISCOA-LSTM建筑能耗预测模型中的每个层都由多个模块组成,以执行其预期的功能,具体实现步骤如下:
步骤一:数据采集和存储层
智能建筑采用集中式能源管理系统,是将若干个数字控制器提供异步通信体系结构,与分布式自动化设备进行交互;自动化软件收集,汇总并存储建筑物能耗数据以及其他相关因素到数据库中,以进行进一步处理;采用相关系数分析研究能耗和相关因素之间的相关性;
步骤二:数据预处理层
楼宇自动化软件收集并存储原始数据,采用最小—最大归一化来对[0,1]范围内的数据进行归一化,并减轻权重和学习模型偏差的稳定收敛;将预处理的能耗数据集按60:20:20的比例划分,以随机方式分别进行训练,评估和测试;
步骤三:数据分析层
数据分析层采用LSTM网络来预测用户指定时间的能耗;此外,迭代地使用改进的正余弦优化算法来优化LSTM的超参数,以提高其预测精度;使用测试数据集评估ISCOA-LSTM的有效性;当适合度值最小时,ISCOA-LSTM的学习过程完成;
步骤四:应用层
验证过程完成后,使用ISCOA-LSTM预测用户指定时间间隔的能耗。
2.根据权利要求1所述的基于长短期记忆网络混合模型的建筑能耗预测方法,其特征在于:
基于LSTM的内部预测架构,LSTM由一个或多个存储单元的存储块组成,这些存储单元充当具有乘法输入门(it),更新(gt),忘记(ft)和输出(ot)的神经元;输入门(it)和更新门(gt)在LSTM的存储单元中执行写功能的操作,而忘记门(ft)缩放单元的内部状态,将逐渐遗忘合并到存储单元中;输出门执行读取功能,然后将其与存储单元组合以计算存储单元(ht)输出;每个门均受其激活函数引导,该函数控制信息在存储单元中的流入和流出;
在时间步骤t,门接收两个输入,即:在t(xt)处的输入数据和从先前时间步骤(ht-1)获得的同一存储单元的输出;等式(1)-(5)提供了一组方程式,用于控制LSTM中每个门的工作;
it=s(Wi x*xt+Wi h*ht-1+bi) (1)
遗忘门(ft)调节要从存储单元中删除信息量;
每个存储单元通过先前状态值(t-1)与写入和遗忘门值的交互来递归更新其值;
ct=ft*ct-1+it*gt (4)
输出门(ot)基于绑定输出值的激活函数控制信息从存储单元流出,并确定输出门(ot)将提供哪个值作为输出;
最后,使用等式计算输出单元(ht)的隐藏状态和LSTM单元(yt)的总输出;(6)和(7):
ht=ot*Tanh(ct) (6)
按照标准,LSTM的权重和偏差的初始值是在训练过程中随机生成的;通常,使用采用标准梯度下降方法的反向传播算法来更新权重和偏差;在标准梯度下降的性能依赖于超参数的情况下,采用改进正弦余弦确定这些超参数的最佳值以提高LSTM的预测准确性对于时间序列问题。
3.根据权利要求1所述的基于长短期记忆网络混合模型的建筑能耗预测方法,其特征在于:
所述的采用ISCOA识别LSTM的最佳超参数,提出了ISCOA-LSTM的改进方法,其主要目标是通过识别超参数的最佳组合,来最小化LSTM的计算复杂度和预测误差之间的权衡;ISCOA-LSTM的整体工作可以通过四个不同的阶段来详细阐述,即(i)编码策略,即种群的产生,(ii)超参数优化,(iii)种群的更新,即更新的位置;每个人都使用基于Haar小波的变异算子,以及(iv)ISCOA-LSTM的性能评估;ISCOA-LSTM每个阶段的逐步操作过程如下:
步骤1:数据预处理:在[0,1]范围内标准化历史功耗数据集(DPC=x(t);t={1,2,...,n});学习DTrain,评估DEval和测试样本DTest以60:20:20的比率分别使用无替换技术的随机采样进行测试;
步骤2:编码策略:在传统的SCOA中,总体是在指定范围内随机生成的,并根据适应度值获得用于位置更新的最佳总体;ISCOA-LSTM采用矢量编码策略来生成初始种群,因为它必须优化多个参数,每个参数都具有唯一的范围;在这种编码策略中,每个种群的位置都以矢量的形式表示,其长度对应于需要优化的参数数量;在ISCOA-LSTM中,优化了四个超参数,即学习率(ai),权重衰减(bi),动量因子(gi)和隐藏单位数(hi),每个种群矢量都用等式(8)表示:
PoPi=[ai,bi,gi,hi];i=(1,2,...,NPoP) (8)
其中NPoP是人口总数;设定以[0,1]范围内的随机方式生成每个种群矢量,并使用等式(9)将它们转换为它们对应的参数特定范围:
fv=PoPMin+[PoPMax-PoPMin]*PoPv (9)
其中PoPMin和PoPMax是超参数的最小值和最大值;Pv是随机生成的总体;
步骤3:学习LSTM:学习过程中,将从每个总体获得的超参数以及学习数据集DTrain用于学习LSTM;
步骤4:评估LSTM:在评估过程中,使用评估数据集以均方误差MSE作为如下适应度函数;
其中n'是评估数据集中的样本数;yEval和yForecast分别是实际值和预测值;
步骤5:终止条件:LSTM的评估过程返回每个群体的适应度值,并将MSE最小的样本点识别为潜在解决方案;使用测试数据集(DTest)达到终止条件时,根据平均绝对误差MAE,平均绝对百分比误差MAPE,均方误差MSE,均方根RMSE评估LSTM的性能;否则,使用步骤6更新每个样本点的位置;
步骤6:位置更新:使用公式(17)更新每个点的位置;为了克服常规SCOA中的问题,引入了基于Haar小波的变异算子用于SCOA中的位置更新;在此过程中,使用等式(11)计算突变概率Mt;如果满足条件(rand£Mt),则从相应的总体向量中选择随机点,并使用等式(12)获得其对应的变异值;
其中t是当前迭代;T是最大迭代次数;
其中:σ为Haar小波函数;
其中:a是[-2.5,2.5]范围内的随机数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010812762.7A CN112101521A (zh) | 2020-08-13 | 2020-08-13 | 一种基于长短期记忆网络混合模型的建筑能耗预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010812762.7A CN112101521A (zh) | 2020-08-13 | 2020-08-13 | 一种基于长短期记忆网络混合模型的建筑能耗预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112101521A true CN112101521A (zh) | 2020-12-18 |
Family
ID=73752911
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010812762.7A Pending CN112101521A (zh) | 2020-08-13 | 2020-08-13 | 一种基于长短期记忆网络混合模型的建筑能耗预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112101521A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112712213A (zh) * | 2021-01-15 | 2021-04-27 | 上海交通大学 | 一种集中空调住宅深度迁移学习能耗预测方法及系统 |
CN113191529A (zh) * | 2021-04-07 | 2021-07-30 | 武汉科技大学 | 基于迁移学习的深度对抗神经网络的新建筑能耗预测方法 |
CN113344192A (zh) * | 2021-05-31 | 2021-09-03 | 中国标准化研究院 | 企业级电机系统节能优化自动控制方法及系统 |
CN113835341A (zh) * | 2021-09-18 | 2021-12-24 | 中邮科通信技术股份有限公司 | 一种基于智能建筑ai的能耗分析诊断方法 |
CN113960925A (zh) * | 2021-08-30 | 2022-01-21 | 中科苏州微电子产业技术研究院 | 基于人工智能的楼宇能耗控制方法及装置 |
CN114237049A (zh) * | 2021-12-14 | 2022-03-25 | 西安建筑科技大学 | 一种基于lstm的智能建筑系统预测控制参数整定方法 |
CN114742278A (zh) * | 2022-03-17 | 2022-07-12 | 西安建筑科技大学 | 一种基于改进lstm的建筑能耗预测方法及系统 |
CN117458450A (zh) * | 2023-10-25 | 2024-01-26 | 青岛德士朗电气有限公司 | 电力数据能耗预测分析方法及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109343505A (zh) * | 2018-09-19 | 2019-02-15 | 太原科技大学 | 基于长短期记忆网络的齿轮剩余寿命预测方法 |
CN109685252A (zh) * | 2018-11-30 | 2019-04-26 | 西安工程大学 | 基于循环神经网络和多任务学习模型的建筑能耗预测方法 |
-
2020
- 2020-08-13 CN CN202010812762.7A patent/CN112101521A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109343505A (zh) * | 2018-09-19 | 2019-02-15 | 太原科技大学 | 基于长短期记忆网络的齿轮剩余寿命预测方法 |
CN109685252A (zh) * | 2018-11-30 | 2019-04-26 | 西安工程大学 | 基于循环神经网络和多任务学习模型的建筑能耗预测方法 |
Non-Patent Citations (1)
Title |
---|
SOMU, NIVETHITHA等: "A hybrid model for building energy consumption forecasting using long short term memory networks", 《APPLIED ENERGY》, pages 1 - 20 * |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112712213A (zh) * | 2021-01-15 | 2021-04-27 | 上海交通大学 | 一种集中空调住宅深度迁移学习能耗预测方法及系统 |
CN112712213B (zh) * | 2021-01-15 | 2023-07-04 | 上海交通大学 | 一种集中空调住宅深度迁移学习能耗预测方法及系统 |
CN113191529A (zh) * | 2021-04-07 | 2021-07-30 | 武汉科技大学 | 基于迁移学习的深度对抗神经网络的新建筑能耗预测方法 |
CN113344192A (zh) * | 2021-05-31 | 2021-09-03 | 中国标准化研究院 | 企业级电机系统节能优化自动控制方法及系统 |
CN113960925A (zh) * | 2021-08-30 | 2022-01-21 | 中科苏州微电子产业技术研究院 | 基于人工智能的楼宇能耗控制方法及装置 |
CN113835341A (zh) * | 2021-09-18 | 2021-12-24 | 中邮科通信技术股份有限公司 | 一种基于智能建筑ai的能耗分析诊断方法 |
CN113835341B (zh) * | 2021-09-18 | 2024-05-17 | 中邮科通信技术股份有限公司 | 一种基于智能建筑ai的能耗分析诊断方法 |
CN114237049A (zh) * | 2021-12-14 | 2022-03-25 | 西安建筑科技大学 | 一种基于lstm的智能建筑系统预测控制参数整定方法 |
CN114742278A (zh) * | 2022-03-17 | 2022-07-12 | 西安建筑科技大学 | 一种基于改进lstm的建筑能耗预测方法及系统 |
CN117458450A (zh) * | 2023-10-25 | 2024-01-26 | 青岛德士朗电气有限公司 | 电力数据能耗预测分析方法及系统 |
CN117458450B (zh) * | 2023-10-25 | 2024-04-02 | 青岛德士朗电气有限公司 | 电力数据能耗预测分析方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112101521A (zh) | 一种基于长短期记忆网络混合模型的建筑能耗预测方法 | |
Somu et al. | A hybrid model for building energy consumption forecasting using long short term memory networks | |
CN113962364B (zh) | 一种基于深度学习的多因素用电负荷预测方法 | |
Chen et al. | Modeling and optimization of complex building energy systems with deep neural networks | |
CN111027772A (zh) | 基于pca-dbilstm的多因素短期负荷预测方法 | |
CN112100911B (zh) | 一种基于深度bilstm的太阳辐射预测方法 | |
CN110212524A (zh) | 一种区域电力负荷预测方法 | |
CN113554466A (zh) | 一种短期用电量预测模型构建方法、预测方法和装置 | |
Prauzek et al. | Differential evolution of fuzzy controller for environmentally-powered wireless sensors | |
CN114119273A (zh) | 一种园区综合能源系统非侵入式负荷分解方法及系统 | |
Kaboli et al. | An expression-driven approach for long-term electric power consumption forecasting | |
CN114742278A (zh) | 一种基于改进lstm的建筑能耗预测方法及系统 | |
CN113591368A (zh) | 一种综合能源系统多能负荷预测方法及系统 | |
CN117114438A (zh) | 一种具备灵活性与可解释性的建筑区域能源系统冷热负荷数据驱动预测方法 | |
Fouladfar et al. | Adaptive thermal load prediction in residential buildings using artificial neural networks | |
Zuo | Integrated forecasting models based on LSTM and TCN for short-term electricity load forecasting | |
Feng et al. | Office building energy consumption forecast: Adaptive long short term memory networks driven by improved beluga whale optimization algorithm | |
Wu et al. | Short-term electric load forecasting model based on PSO-BP | |
Wu et al. | Combined IXGBoost-KELM short-term photovoltaic power prediction model based on multidimensional similar day clustering and dual decomposition | |
Ibrahim et al. | LSTM neural network model for ultra-short-term distribution zone substation peak demand prediction | |
CN117390550A (zh) | 考虑排放训练集的低碳园区碳排放动态预测方法及系统 | |
Shayeghi et al. | STLF based on optimized neural network using PSO | |
Kowalski et al. | The comparison of linear models for PM10 and PM2. 5 forecasting | |
Jiahui et al. | Short-term load forecasting based on GA-PSO optimized extreme learning machine | |
Shen et al. | An interval analysis scheme based on empirical error and MCMC to quantify uncertainty of wind speed |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |