CN109685252B - 基于循环神经网络和多任务学习模型的建筑能耗预测方法 - Google Patents
基于循环神经网络和多任务学习模型的建筑能耗预测方法 Download PDFInfo
- Publication number
- CN109685252B CN109685252B CN201811452493.7A CN201811452493A CN109685252B CN 109685252 B CN109685252 B CN 109685252B CN 201811452493 A CN201811452493 A CN 201811452493A CN 109685252 B CN109685252 B CN 109685252B
- Authority
- CN
- China
- Prior art keywords
- output
- energy consumption
- information
- value
- task
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000005265 energy consumption Methods 0.000 title claims abstract description 46
- 238000000034 method Methods 0.000 title claims abstract description 28
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 17
- 125000004122 cyclic group Chemical group 0.000 title description 2
- 238000012549 training Methods 0.000 claims abstract description 30
- 238000012545 processing Methods 0.000 claims abstract description 15
- 230000000306 recurrent effect Effects 0.000 claims abstract description 6
- 238000003062 neural network model Methods 0.000 claims abstract description 4
- 239000013598 vector Substances 0.000 claims description 31
- 230000006870 function Effects 0.000 claims description 27
- 210000004027 cell Anatomy 0.000 claims description 18
- 238000010606 normalization Methods 0.000 claims description 13
- 239000011159 matrix material Substances 0.000 claims description 12
- 230000008569 process Effects 0.000 claims description 7
- 230000001537 neural effect Effects 0.000 claims description 6
- 210000002569 neuron Anatomy 0.000 claims description 6
- 230000000875 corresponding effect Effects 0.000 claims description 4
- 238000012935 Averaging Methods 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 3
- 230000002596 correlated effect Effects 0.000 claims description 3
- 230000003993 interaction Effects 0.000 abstract description 2
- 238000004904 shortening Methods 0.000 abstract 1
- 238000007726 management method Methods 0.000 description 8
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000001351 cycling effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/08—Construction
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Marketing (AREA)
- Tourism & Hospitality (AREA)
- General Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Primary Health Care (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
基于循环神经网络和多任务学习模型的建筑能耗预测方法,涉及综合能源管理技术领域,所解决的是并行预测多类能耗、保证预测精度的同时缩短模型训练时间的技术问题。该方法先获取建筑能耗数据样本,利用“多个相似时间点数据平均”进行缺失数据处理,再根据能耗类型、时间步长和初始时间构造多个学习任务,之后对每个学习任务的数据集进行归一化,再用皮尔逊相关系数度量多个任务训练集之间的相似性。确保多个任务之间的相似性后,创建并训练神经网络模型,最后利用多任务CIFG‑LSTM神经网络模型预测综合能耗。本发明的能耗预测方法使多元能耗能够同时预测,充分利用能耗之间的紧密联系与相互作用,提高了预测精度和速度。
Description
技术领域
本发明属于多元负荷预测技术领域,涉及一种基于循环神经网络和多任务学习模型的建筑能耗预测方法。
背景技术
综合能源管理系统是由电、热、冷、气等多种能源网络耦合而成,发挥多种能源优势互补,推动能源结构转型,推进我国能源革命具有重要意义。准确快速的能耗预测是综合能源管理系统可靠、高效运行的重要组成部分,为使能源合理规划及有效利用,有必要对未来短期内的能源消耗进行准确预测。目前针对单一种类能源的能耗预测技术已经很成熟,比如多元线性回归法、随机时间序列法、指数平滑法、灰色理论法等基于数学模型的预测方法和基于各种人工智能算法的预测方法,预测精度也随之逐步提高。
但是随着综合能源管理系统的推广,对单一能耗的预测不能兼顾到能源之间的互相影响,也忽略了综合能源系统管理能源的多样化。同时,对于综合能源管理系统而言,针对不同类型能源的消耗建立不同的预测模型无疑是大大增加了工作量和系统的复杂度,不利于综合能源管理系统的开发、维护及使用。作为未来能源供应系统的重要发展方向,综合能源管理系统势必会引发多元能耗预测的需求。
多任务学习(Multi-Task Learning,MTL)是一种归纳迁移机制,主要目标是利用隐含在多个相关任务的训练信号中的特定领域信息来提高泛化能力,并通过使用共享表示并行训练多个任务来完成这一目标。实际上,每个任务的训练信号提供的信息可以作为其他任务在特定领域的归纳偏置,通过对不同任务之间的共享特征结构分析和联合训练来确定最优参数,一次学习几个艰难的任务会比分别学习这些相同的任务更容易。神经网络隐含层的参数由多个任务共同训练,各个任务又在输出层分开,来学习任务相关的信息。
CIFG-LSTM(Coupled Input and Forget Gate LSTM)神经网络是由循环神经网络中的LSTM(Long Short Term Memory,长短时记忆神经网络)改进的一种人工智能算法,可充分利用负荷数据之间的相关性,从而提高负荷预测的精度,同时降低所需历史数据的维度大小,对于处理时间序列相关的负荷数据有很好的效果。
发明内容
本发明的目的是提供基于循环神经网络和多任务学习模型的建筑能耗预测方法,解决了多元负荷无法统一预测造成预测过程繁、精度低的问题。
本发明所采用的技术方案是,基于循环神经网络和多任务学习模型的建筑能耗预测方法,具体如下步骤:
步骤1、获取建筑能耗数据样本集,采用“多个相似时间点数据平均”法补齐个别时间点遗缺的数据,得到处理后数据集,数据集结构为M={(m11,m21,...,mk1),(m12,m22,...,mk2)...(m1i,m2i,...,mki)};其中下标k表示不同能耗类型,k∈N*,i表示第i个样本值,i∈N*;
步骤2、根据k种能耗类型构造出k个学习任务,即把步骤1得到的数据集划分为k类,即M'={(m11,m12,...,m1i),(m21,m22,...,m2i)...(mk1,mk2,...,mki)},保证构造的k个学习任务的时间步长h和初始时间t相同,并进行归一化处理,归一化后得到的数据集类型为MR={M1 R,M2 R,...,Mk R},其中Mk R=(mk1 R,mk2 R,...,mki R);对于h和t不相同的数据集要进行丢弃,并重复步骤1;
步骤3、采用皮尔逊相关系数度量多个任务训练集之间的相似性;
步骤4、创建CIFG-LSTM神经网络模型;
步骤5、用k个任务的样本集MR同时训练CIFG-LSTM模型,并获得训练完成后的多任务CIFG-LSTM预测模型;
步骤6、将k个任务的样本集输入到步骤5训练的CIFG-LSTM模型中,得到k组预测能耗值,预测能耗值经过反归一化处理后的预测值与对应的k组真实值进行比较,如果至少有一组预测值和真实值的差值大于预先设定的误差范围,则重复步骤5,否则进行下一步;
步骤7、利用多任务CIFG-LSTM预测模型对综合能源智慧园区的多类能耗进行同时预测,并将得到的结果反归一化处理后作为多类能耗预测值。
本发明的特点还在于,
步骤3具体为:
1)根据皮尔逊积矩相关系数r的计算公式
即任务一的样本集M1和任务二的样本集M2之间的协方差和标准差的商;
2)根据所得皮尔逊积矩相关系数r判断两个任务之间的相似性,如果0.6≤r≤1,表明这两个任务相关性强,适用于本文提出的预测模型;如果0≤r<0.6,表明这两个任务弱相关或无相关,需要丢弃此样本集,重新选择样本集。
步骤4具体为:
训练多任务CIFG-LSTM神经网络预测模型,分别需要计算遗忘门信息,即上一时刻的信息有哪些需要保留到下一时刻;输入门信息,即当前时刻输入的信息需要保留多少;以及输出门信息,即当前状态的信息有多少需要作为当前输出值输出;整个训练过程需要学习的参数有6组,分别是遗忘门的权重矩阵Wf和偏置项bf、输入门的权重矩阵Wc和偏置项bc、输出门的权重矩阵Wo和偏置项bo;
1)首先计算遗忘门信息:ft=sigmoid(Wf[ht-1,Xt]+bf),
其中,sigmoid是sigmoid函数,Wf是遗忘门的权重矩阵,ht-1表示上一时刻输出,Xt表示当前输入、即数据集M,bf是遗忘门的偏置项,[ht-1,Xt]表示把上一时刻输出ht-1和当前输入Xt连接;
2)计算输入门信息:
①创建新的候选值向量:gt=tanh(Wc[ht-1,Xt]+bc);其中tanh表示tanh函数,Wc是输入门的权重,bc是输入门的偏置项;
②确定更新信息:Ct=ft*Ct-1+(1-ft)*gt;其中ft是第一步所得的遗忘门信息,表示需要丢弃的信息,Ct-1表示上一时刻的一个神经单元状态,1-ft表示需要记住的信息,gt表示新的候选值向量;
3)计算输出门信息:
①决定将要被输出的部分:ot=sigmoid(Wo[ht-1+Xt]+bo);其中sigmoid表示sigmoid函数,Wo是输出门的权重,[ht-1,Xt]表示把两个向量连接成一个更长的向量,bo是输出门的偏置项;
②确定最终输出部分:ht=ot*tanh(Ct);其中ot是要被输出的信息,tanh表示tanh函数,Ct表示当前时刻一个神经单元的状态。
步骤5所述训练CIFG-LSTM模型的过程如下:
(1)数据处理:同步输入训练数据,并进行标准化;
(2)定义如下超参数:输入的维度D=1,
num_unrollings=50,batch_size=500,num_nodes=[200,200,150],其中,num_unrollings为与反向传播时间相关的超参数,用于优化LSTM模型;batch_size为单个时间步中考虑的数据样本数;num_nodes为每个cell中隐藏神经元的数量,默认定义三层LSTM;
(3)定义输入和输出,通过Sigmoid函数来调节需要添加到cell状态的值;
(4)定义隐藏层和输出层之间的权重和偏差;
(5)计算候选值
计算每层输出信息,将先前的输出与新输入合并为候选值;
(6)计算更新信息
使用tanh函数创建一个包含所有候选值的向量,输出值范围为[-1,1],然后将步骤(3)cell状态的值乘以tanh函数创建的向量,然后将这些信息添加到下一个cell状态中;
(7)计算输出信息
再次使用tanh函数创建一个向量,将下一个cell预输出值缩放范围为[-1,1],再次使用一个sigmoid函数使用当前输出和下一时刻输入的值生成一个过滤器,以便它可以调节需要从tanh创建的向量中输出的值,将此输出的值乘以tanh创建的向量,并将其作为输出发送出去,并发送到下个cell的隐藏层;
(8)循环第1~7步,直到输出损失率为0.4-0.5,精确度为训练数据真实值的90-95%时停止循环,得到最终模型。
本发明的有益效果是:
1.利用多任务框架,使多元能耗能够同时预测,充分利用能耗之间的紧密联系与相互作用,提高了预测精度和速度。
2.将LSTM的忘记门和输入门相结合,对需要忘记的旧信息和需要添加的新信息同时作出决定,简化了信息的“丢弃”和“更新过程”,默认需要忘记的信息以外的信息便是需要记忆的信息。降低了LSTM的复杂度保证准确度的同时,加快了模型训练速度。
附图说明
图1是本发明基于多任务神经网络的模型结构;
图2是本发明针对多任务神经网络改进的CIFG-LSTM神经网络结构图;
图3是本发明基于CIFG-LSTM算法和多任务学习框架的能耗预测方法的流程图。
具体实施方式
下面结合附图和具体实施方式对本发明进行详细说明,具体流程结构如图3所示,
步骤1、获取建筑能耗数据样本集,采用“多个相似时间点数据平均”法补齐个别时间点遗缺的数据,具体方法如下:
对于某类能耗缺失数据xi,设采集时间点为ti,选定时间步长s,若样本点之间的时间间隔单位为小时,则s为24小时,若样本点之间的时间间隔单位为天,则s为30天,以此类推确定s大小。选择时间点为ti±ns(n=1,2,...)对应的样本点,其中ti±ns的范围在第一个样本点和最后一个样本点对应的时间点范围内。
处理后的数据集结构为M={(m11,m21,...,mk1),(m12,m22,...,mk2)...(m1i,m2i,...,mki)};其中下标k表示不同能耗类型,k∈N*,i表示第几个样本值,i∈N*。
步骤2、对于k种能耗类型构造出k个学习任务,即把步骤1得到的数据集划分为k类,即M'={(m11,m12,...,m1i),(m21,m22,...,m2i)...(mk1,mk2,...,mki)},保证它们的时间步长h(即相邻数据集样本点之间的时间间隔)和初始时间t(即每个数据集第一个样本点的时间点)相同,并进行归一化处理,否则丢弃样本重复步骤1;归一化处理方式如下:
对数据集Mk'写成矩阵形式,如下:
其中下标k表示不同能耗类型,n为天数,t表示采集周期,比如1小时。采用线性函数归一化法对数据集进行归一化,经过归一化后变为矩阵 为变量Mk的最小值,为变量的极差,经过式二变换后,所有数据集值均在0~1之间。
得到的数据集类型为MR={M1 R,M2 R,...,Mk R},其中Mk R=(mk1 R,mk2 R,...,mki R),其中下标k表示不同能耗类型,k∈N*,i表示第i个样本值,i∈N*。
步骤3、采用皮尔逊相关系数度量多个任务训练集之间的相似性。
1)根据皮尔逊积矩相关系数r的计算公式
即任务一的样本集M1和任务二的样本集M2之间的协方差和标准差的商;
根据所得皮尔逊积矩相关系数r判断两个任务之间的相似性。如果0.6≤r≤1,表明这两个任务相关性强,适用于本文提出的预测模型;如果0≤r<0.6,表明这两个任务弱相关或无相关,需要丢弃此样本集,重新选择样本集。对步骤2得到的k个任务的样本集运用皮尔逊积矩相关系数法进行两两比较,得到k个相关任务的样本集,否则重复步骤1。
步骤4、训练多任务CIFG-LSTM神经网络预测模型(如图1所示),分别需要计算遗忘门信息,即上一时刻的信息有哪些需要保留到下一时刻;输入门信息,即当前时刻输入的信息需要保留多少;以及输出门信息,即当前状态的信息有多少需要作为当前输出值输出。整个训练过程需要学习的参数由6组,分别是遗忘门的权重矩阵Wf和偏置项bf、输入门的权重矩阵Wc和偏置项bc、输出门的权重矩阵Wo和偏置项bo。
1)首先计算遗忘门信息:ft=sigmoid(Wf[ht-1,Xt]+bf)。sigmoid是sigmoid函数,Wf是遗忘门的权重矩阵,ht-1表示上一时刻输出,Xt表示当前输入,即数据集M,bf是遗忘门的偏置项。[ht-1,Xt]表示把两个向量连接成一个更长的向量。
2)计算输入信息:
①创建新的候选值向量:gt=tanh(Wc[ht-1,Xt]+bc);其中tanh表示tanh函数,Wc是输入门的权重,[ht-1,Xt]表示把两个向量连接成一个更长的向量,bc是输入门的偏置项。
②确定更新信息:Ct=ft*Ct-1+(1-ft)*gt;其中ft是第一步所得的遗忘门信息,表示需要丢弃的信息,Ct-1表示上一时刻的一个神经单元状态,(1-ft)表示需要记住的信息,gt表示新的候选值向量,*表示按元素相乘。
3)计算输出信息:
①决定将要被输出的部分:ot=sigmoid(Wo[ht-1+Xt]+bo);其中sigmoid表示sigmoid函数,Wo是输出门的权重,[ht-1,Xt]表示把两个向量连接成一个更长的向量,bo是输出门的偏置项。
②确定最终输出部分:ht=ot*tanh(Ct);其中ot是要被输出的信息,tanh表示tanh函数,Ct表示当前时刻一个神经单元的状态。
训练多任务CIFG-LSTM预测模型的步骤如下:
(1)数据处理:同步输入数据,并进行标准化。
(2)定义超参数(根据实际情况自行调整)。D(输入的维度)=1,num_unrollings(与反向传播时间(BPTT)相关的超参数,用于优化LSTM模型)=50,batch_size(单个时间步中考虑的数据样本数)=500,num_nodes(每个cell中隐藏神经元的数量,默认定义三层LSTM)=[200,200,150]。
(3)定义输入和输出。通过Sigmoid函数来调节需要添加到cell状态的值,目的是作为一个滤波器过滤来自上一时刻输出和和当前输入的信息。
(4)定义隐藏层和输出层之间的权重和偏差。
(5)计算候选值。计算每层输出信息,将先前的输出与新输入合并为候选值。
(6)计算更新信息。使用tanh函数创建一个包含所有候选值的向量,输出值范围为[-1,1]。然后将调节滤波器的值(步骤3得到的值)乘以tanh函数创建的向量,然后将这些信息添加到下一个cell状态中。
(7)计算输出信息。再次使用tanh函数创建一个向量,将下一个cell预输出值缩放范围为[-1,1]。再次使用一个sigmoid函数使用当前输出和下一时刻输入的值生成一个过滤器,以便它可以调节需要从tanh创建的向量中输出的值。将此输出的值乘以tanh创建的向量,并将其作为输出发送出去,并发送到下个cell的隐藏层。
(8)循环第1~7步,直到输出损失率为0.4-0.5,精确度为训练数据真实值的90-95%时停止循环,得到最终模型。
训练CIFG-LSTM模型的伪代码如下:
#先前神经元状态prev_ct、先前隐藏状态prev_ht和当前输入input作为输入
def CIFG-LSTMCELL(prev_ct,prev_ht,input):
#把先前隐藏状态prev_ht和当前输入input合并成候选值combine
combin=prev_ht+input
#把候选值combine输入遗忘层forget_layer,决定哪些不相关数据需要被忘记,需要被忘记的信息记为ft
ft=forget_layer(combin)
#把需要忘记的信息之外的信息作为需要更新的信息输入输入层input_layer,决定需要添加进当前神经元的信息it
it=input_layer(1-ft)
#更新当前神经元状态ct
ct=prev_ct*ft+(1-ft)*it
#把combine输入输出层output_layer,计算输出ot
ot=output_layer(combin)
#把输出和当前cell状态进行点乘,得到更新后的隐藏状态
ht=ot*sigmoid(ct)
return ht,ct
ct=[0,0,0]
ht=[0,0,0]
#循环上述过程得到最终模型
for input in inputs:
ct,ht=CIFG-LSTMCELL(ct,ht,input)。
步骤5、用k个任务的样本集MR同时训练CIFG-LSTM模型,并获得训练完成后的多任务CIFG-LSTM预测模型(如图2所示)ht=ot*tanh(Ct),ht即为输出结果矩阵。
步骤6、将k个任务的样本集输入到步骤5训练的CIFG-LSTM模型中,得到k组预测能耗值,预测能耗值经过反归一化处理后与对应的k组真实值进行比较,如果至少有一组预测值和真实值的差值大于预先设定的误差范围,则重复步骤5,否则进行下一步;
其中预先设定的误差范围一般控制在±14.2%,可以根据实际需要作修改;
步骤7、利用多任务CIFG-LSTM神经网络预测模型对综合能源智慧园区的多类能耗进行同时预测,并将得到的结果反归一化处理后作为综合能源智慧园区的多类能耗预测值。
Claims (1)
1.基于循环神经网络和多任务学习模型的建筑能耗预测方法,其特征在于,包括如下步骤:
步骤1、获取建筑能耗数据样本集,采用“多个相似时间点数据平均”法补齐个别时间点遗缺的数据,得到处理后数据集,数据集结构为M={(m11,m21,...,mk1),(m12,m22,...,mk2)...(m1i,m2i,...,mki)};其中下标k表示不同能耗类型,k∈N*,i表示第i个样本值,i∈N*;
步骤2、根据k种能耗类型构造出k个学习任务,即把步骤1得到的数据集划分为k类,即M'={(m11,m12,...,m1i),(m21,m22,...,m2i)...(mk1,mk2,...,mki)},保证构造的k个学习任务的时间步长h和初始时间t相同,并进行归一化处理,归一化后得到的数据集类型为MR={M1 R,M2 R,...,Mk R}其中,Mk R=(mk1 R,mk2 R,...,mki R);对于k个学习任务中h和t不相同的数据集要进行丢弃,并重复步骤1;
步骤3、采用皮尔逊相关系数度量多个任务训练集之间的相似性;
步骤3具体为:
1)根据皮尔逊积矩相关系数r的计算公式
即任务一的样本集M1和任务二的样本集M2之间的协方差和标准差的商;
2)根据所得皮尔逊积矩相关系数r判断两个任务之间的相似性,如果0.6≤r≤1,表明这两个任务相关性强,适用于本文提出的预测模型;如果0≤r<0.6,表明这两个任务弱相关或无相关,需要丢弃此样本集,重新选择样本集;
步骤4、创建CIFG-LSTM神经网络模型;
步骤4具体为:
训练多任务CIFG-LSTM神经网络预测模型,分别需要计算遗忘门信息,即上一时刻的信息有哪些需要保留到下一时刻;输入门信息,即当前时刻输入的信息需要保留多少;以及输出门信息,即当前状态的信息有多少需要作为当前输出值输出;整个训练过程需要学习的参数有6组,分别是遗忘门的权重矩阵Wf和偏置项bf、输入门的权重矩阵Wc和偏置项bc、输出门的权重矩阵Wo和偏置项bo;
1)计算遗忘门信息:ft=sigmoid(Wf[ht-1,Xt]+bf),
其中,sigmoid是sigmoid函数,Wf是遗忘门的权重矩阵,ht-1表示上一时刻输出,Xt表示当前输入、即数据集M,bf是遗忘门的偏置项,[ht-1,Xt]表示把上一时刻输出ht-1和当前输入Xt连接;
2)计算输入门信息:
①创建新的候选值向量:gt=tanh(Wc[ht-1,Xt]+bc);其中tanh表示tanh函数,Wc是输入门的权重,bc是输入门的偏置项;
②确定更新信息:Ct=ft*Ct-1+(1-ft)*gt;其中ft是第一步所得的遗忘门信息,表示需要丢弃的信息,Ct-1表示上一时刻的一个神经单元状态,1-ft表示需要记住的信息,gt表示新的候选值向量;
3)计算输出门信息:
①决定将要被输出的部分:ot=sigmoid(Wo[ht-1+Xt]+bo);其中sigmoid表示sigmoid函数,Wo是输出门的权重,[ht-1,Xt]表示把两个向量连接成一个更长的向量,bo是输出门的偏置项;
②确定最终输出部分:ht=ot*tanh(Ct);其中ot是要被输出的信息,tanh表示tanh函数,Ct表示当前时刻一个神经单元的状态;
步骤5、用k个任务的样本集MR同时训练CIFG-LSTM模型,并获得训练完成后的多任务CIFG-LSTM预测模型;
步骤5所述训练CIFG-LSTM模型的过程如下:
(1)数据处理:同步输入训练数据,并进行标准化;
(2)定义如下超参数:输入的维度D=1,
num_unrollings=50,batch_size=500,num_nodes=[200,200,150],其中,num_unrollings为与反向传播时间相关的超参数,用于优化LSTM模型;batch_size为单个时间步中考虑的数据样本数;num_nodes为每个cell中隐藏神经元的数量,默认定义三层LSTM;
(3)定义输入和输出,通过Sigmoid函数来调节需要添加到cell状态的值;
(4)定义隐藏层和输出层之间的权重和偏差;
(5)计算候选值
计算每层输出信息,将先前的输出与新输入合并为候选值;
(6)计算更新信息
使用tanh函数创建一个包含所有候选值的向量,输出值范围为[-1,1],然后将步骤(3)cell状态的值乘以tanh函数创建的向量,然后将这些信息添加到下一个cell状态中;
(7)计算输出信息
再次使用tanh函数创建一个向量,将下一个cell预输出值缩放范围为[-1,1],再次使用一个sigmoid函数使用当前输出和下一时刻输入的值生成一个过滤器,以便它可以调节需要从tanh创建的向量中输出的值,将此输出的值乘以tanh创建的向量,并将其作为输出发送出去,并发送到下个cell的隐藏层;
(8)循环第1~7步,直到输出损失率为0.4-0.5,精确度为训练数据真实值的90-95%时停止循环,得到最终模型;
步骤6、将k个任务的样本集输入到步骤5训练的CIFG-LSTM模型中,得到k组预测能耗值,预测能耗值经过反归一化处理后的预测值与对应的k组真实值进行比较,如果至少有一组预测值和真实值的差值大于预先设定的误差范围,则重复步骤5,否则进行下一步;
步骤7、利用多任务CIFG-LSTM预测模型对综合能源智慧园区的多类能耗进行同时预测,并将得到的结果反归一化处理后作为多类能耗预测值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811452493.7A CN109685252B (zh) | 2018-11-30 | 2018-11-30 | 基于循环神经网络和多任务学习模型的建筑能耗预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811452493.7A CN109685252B (zh) | 2018-11-30 | 2018-11-30 | 基于循环神经网络和多任务学习模型的建筑能耗预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109685252A CN109685252A (zh) | 2019-04-26 |
CN109685252B true CN109685252B (zh) | 2023-04-07 |
Family
ID=66185908
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811452493.7A Active CN109685252B (zh) | 2018-11-30 | 2018-11-30 | 基于循环神经网络和多任务学习模型的建筑能耗预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109685252B (zh) |
Families Citing this family (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110222840B (zh) * | 2019-05-17 | 2023-05-05 | 中山大学 | 一种基于注意力机制的集群资源预测方法和装置 |
CN110298488A (zh) * | 2019-05-31 | 2019-10-01 | 武汉烽火富华电气有限责任公司 | 一种基于数据挖掘的能源数据分析方法及系统 |
CN110188826A (zh) * | 2019-05-31 | 2019-08-30 | 湖南科技大学 | 基于智能电表数据的家用电器运行状态非侵入式检测方法 |
CN110618610A (zh) * | 2019-08-29 | 2019-12-27 | 杭州华电江东热电有限公司 | 基于LSTM深度学习的燃机NOx超标预警方法与装置 |
CN110826783A (zh) * | 2019-10-25 | 2020-02-21 | 上海电力大学 | 一种神经网络的权重的训练方法及其应用 |
CN110826784B (zh) * | 2019-10-28 | 2023-12-12 | 腾讯科技(深圳)有限公司 | 能源使用效率的预测方法、装置及存储介质和终端设备 |
CN111044617B (zh) * | 2019-11-28 | 2022-08-02 | 东南大学 | 一种基于深度学习与声发射技术的拉索损伤识别方法 |
CN111401547B (zh) * | 2020-02-25 | 2023-08-22 | 江苏大学 | 一种面向乘客流分析的基于循环学习单元的htm设计方法 |
CN111612243B (zh) * | 2020-05-18 | 2023-11-10 | 湖南大学 | 交通速度预测方法、系统及存储介质 |
CN111814956B (zh) * | 2020-06-23 | 2022-04-08 | 哈尔滨工程大学 | 一种基于多维度二次特征提取的多任务学习的空气质量预测方法 |
CN111783947A (zh) * | 2020-06-24 | 2020-10-16 | 上海凯营新能源技术有限公司 | 一种基于lstm神经网络的能耗预测方法 |
CN112101521A (zh) * | 2020-08-13 | 2020-12-18 | 国网辽宁省电力有限公司电力科学研究院 | 一种基于长短期记忆网络混合模型的建筑能耗预测方法 |
CN112328912B (zh) * | 2020-11-03 | 2023-05-19 | 重庆大学 | 一种利用地点感知的QoS预测方法 |
CN112598222A (zh) * | 2020-11-30 | 2021-04-02 | 河南汇祥通信设备有限公司 | 基于长短时记忆循环神经网络的综合管廊运维预测及方法 |
CN112668713A (zh) * | 2020-12-21 | 2021-04-16 | 通号智慧城市研究设计院有限公司 | 一种能耗智能预测方法及系统 |
CN112784479B (zh) * | 2021-01-12 | 2022-09-23 | 河海大学 | 一种洪水流量预测的方法 |
CN113191529A (zh) * | 2021-04-07 | 2021-07-30 | 武汉科技大学 | 基于迁移学习的深度对抗神经网络的新建筑能耗预测方法 |
CN113539517B (zh) * | 2021-08-05 | 2024-04-16 | 浙江大学 | 时序干预效果的预测方法 |
CN113554361B (zh) * | 2021-09-22 | 2022-01-25 | 广东电网有限责任公司东莞供电局 | 一种综合能源系统数据处理计算方法及处理系统 |
CN113807023A (zh) * | 2021-10-04 | 2021-12-17 | 北京亚鸿世纪科技发展有限公司 | 基于门控循环单元网络的工业互联网设备故障预测方法 |
CN114186711A (zh) * | 2021-10-27 | 2022-03-15 | 中山大学 | 一种基于多任务时序学习的工业原料消耗量预测方法 |
CN114819054B (zh) * | 2022-03-11 | 2024-02-27 | 西北工业大学 | 一种基于物理信息神经网络的电力电子系统状态监测方法 |
CN116663434B (zh) * | 2023-07-31 | 2023-12-05 | 江铃汽车股份有限公司 | 一种基于lstm深度神经网络的整车载荷分解方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014105989A (ja) * | 2012-11-28 | 2014-06-09 | Mitsubishi Electric Corp | 建物動力設備のエネルギー消費量予測方法 |
CN106874581A (zh) * | 2016-12-30 | 2017-06-20 | 浙江大学 | 一种基于bp神经网络模型的建筑空调能耗预测方法 |
CN106875004A (zh) * | 2017-01-20 | 2017-06-20 | 清华大学 | 复合模式神经元信息处理方法和系统 |
CN106960252A (zh) * | 2017-03-08 | 2017-07-18 | 深圳市景程信息科技有限公司 | 基于长短时记忆神经网络的电力负荷预测方法 |
CN107590565A (zh) * | 2017-09-08 | 2018-01-16 | 北京首钢自动化信息技术有限公司 | 一种构建建筑能耗预测模型的方法及装置 |
KR20180053453A (ko) * | 2016-11-11 | 2018-05-23 | 한국에너지기술연구원 | 에너지 관리 시스템, 에너지 관리 방법 및 에너지 수요 예측 방법 |
WO2018120016A1 (zh) * | 2016-12-30 | 2018-07-05 | 上海寒武纪信息科技有限公司 | 用于执行lstm神经网络运算的装置和运算方法 |
CN108376285A (zh) * | 2018-03-23 | 2018-08-07 | 中国科学院计算技术研究所 | 一种面向多变异体lstm神经网络加速器及数据处理方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8903554B2 (en) * | 2011-02-22 | 2014-12-02 | The Board Of Trustees Of The Leland Stanford Junior University | Energy plant design and operation |
KR20140043184A (ko) * | 2012-09-28 | 2014-04-08 | 한국전자통신연구원 | 에너지 소비량 예측 장치 및 방법 |
US20180129937A1 (en) * | 2016-11-04 | 2018-05-10 | Salesforce.Com, Inc. | Quasi-recurrent neural network |
-
2018
- 2018-11-30 CN CN201811452493.7A patent/CN109685252B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014105989A (ja) * | 2012-11-28 | 2014-06-09 | Mitsubishi Electric Corp | 建物動力設備のエネルギー消費量予測方法 |
KR20180053453A (ko) * | 2016-11-11 | 2018-05-23 | 한국에너지기술연구원 | 에너지 관리 시스템, 에너지 관리 방법 및 에너지 수요 예측 방법 |
CN106874581A (zh) * | 2016-12-30 | 2017-06-20 | 浙江大学 | 一种基于bp神经网络模型的建筑空调能耗预测方法 |
WO2018120016A1 (zh) * | 2016-12-30 | 2018-07-05 | 上海寒武纪信息科技有限公司 | 用于执行lstm神经网络运算的装置和运算方法 |
CN106875004A (zh) * | 2017-01-20 | 2017-06-20 | 清华大学 | 复合模式神经元信息处理方法和系统 |
CN106960252A (zh) * | 2017-03-08 | 2017-07-18 | 深圳市景程信息科技有限公司 | 基于长短时记忆神经网络的电力负荷预测方法 |
CN107590565A (zh) * | 2017-09-08 | 2018-01-16 | 北京首钢自动化信息技术有限公司 | 一种构建建筑能耗预测模型的方法及装置 |
CN108376285A (zh) * | 2018-03-23 | 2018-08-07 | 中国科学院计算技术研究所 | 一种面向多变异体lstm神经网络加速器及数据处理方法 |
Non-Patent Citations (7)
Title |
---|
Building energy load forecasting using Deep Neural Networks;Daniel L. Marino等;《IECON 2016 - 42nd Annual Conference of the IEEE Industrial Electronics Society》;20161222;7046-7051 * |
GM-WLSSVM模型在办公建筑电力能耗预测中的应用;杜瑞芝等;《计算机应用与软件》;20180912;第35卷(第9期);44-49、55 * |
GRU神经网络短期电力负荷预测研究;周莽等;《科技创新与应用》;20181122(第33期);52、53、57 * |
Residual Autoencoder-LSTM for City Region Vehicle Emission Pollution Prediction;Zhenyi Xu等;《2018 IEEE 14th International Conference on Control and Automation (ICCA)》;20180823;811-816 * |
基于递归神经网络的负荷预测模型与用电规划;梁振宇;《中国优秀硕士学位论文全文数据库 (工程科技Ⅱ辑)》;20180715(第7期);C042-367 * |
夏热冬冷地区办公类建筑能耗预测模型研究;施剑锋等;《安徽建筑》;20160901(第05期);56-58、66 * |
建筑方案能耗快速预测方法研究综述;李紫微等;《暖通空调》;20180515;第48卷(第5期);1-8 * |
Also Published As
Publication number | Publication date |
---|---|
CN109685252A (zh) | 2019-04-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109685252B (zh) | 基于循环神经网络和多任务学习模型的建筑能耗预测方法 | |
CN110223517B (zh) | 基于时空相关性的短时交通流量预测方法 | |
CN108280551B (zh) | 一种利用长短期记忆网络的光伏发电功率预测方法 | |
CN110705743B (zh) | 一种基于长短期记忆神经网络的新能源消纳电量预测方法 | |
CN108764539B (zh) | 一种梯级电站的上下游水位预测方法 | |
CN110619420B (zh) | 一种基于Attention-GRU的短期住宅负荷预测方法 | |
CN111932015A (zh) | 一种区域供冷供热冷热量负荷的预测方法及系统 | |
CN111027772A (zh) | 基于pca-dbilstm的多因素短期负荷预测方法 | |
Barzola-Monteses et al. | Energy consumption of a building by using long short-term memory network: a forecasting study | |
CN111861013A (zh) | 一种电力负荷预测方法及装置 | |
Sheng et al. | Short-term load forecasting based on SARIMAX-LSTM | |
CN114742278A (zh) | 一种基于改进lstm的建筑能耗预测方法及系统 | |
CN114119273A (zh) | 一种园区综合能源系统非侵入式负荷分解方法及系统 | |
Wen et al. | Time series prediction based on LSTM-attention-LSTM model | |
CN116227180A (zh) | 基于数据驱动的机组组合智能决策方法 | |
CN113393119B (zh) | 基于场景缩减-深度学习的梯级水电短期调度决策方法 | |
CN117313201A (zh) | 考虑堆石坝多测点复杂关联性时空融合的变形预测方法及系统 | |
CN110543942A (zh) | 一种多时空长短记忆深度网络精准预测方法 | |
CN115759343A (zh) | 一种基于e-lstm的用户电量预测方法和装置 | |
Qian et al. | Short-term Load Forecasting Based on Multi-model Fusion of CNN-LSTM-LGBM | |
Liu et al. | Network traffic big data prediction model based on combinatorial learning | |
Liu et al. | Short-term Load Forecasting Method Based on LSTM-Attention Mechanism | |
Guillén-Asensio et al. | Battery state prediction in photovoltaic standalone installations | |
CN112183846B (zh) | 基于模糊c均值聚类的tvf-emd-mcqrnn负荷概率预测方法 | |
Yang et al. | Electricity load forecasting based on long and short-term memory neural network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20230719 Address after: 710075 Zone C, 3rd Floor, Synergy Building, No. 12 Gaoxin Second Road, High tech Zone, Xi'an City, Shaanxi Province Patentee after: Zhongfu Software (Xi'an) Co.,Ltd. Address before: 710048 No. 19 Jinhua South Road, Shaanxi, Xi'an Patentee before: XI'AN POLYTECHNIC University |
|
TR01 | Transfer of patent right |