CN113850438A

CN113850438A - 公共建筑能耗预测方法、系统、设备及介质

Info

Publication number: CN113850438A
Application number: CN202111153011.XA
Authority: CN
Inventors: 于军琪; 杨思远; 赵安军; 周敏; 高之坤; 虎群
Original assignee: Xian University of Architecture and Technology
Current assignee: Xian University of Architecture and Technology
Priority date: 2021-09-29
Filing date: 2021-09-29
Publication date: 2021-12-28

Abstract

本发明公开了一种公共建筑能耗预测方法、系统、设备及介质，包括：采用历史公共建筑能耗的主要影响指标数据及低频分量，对RBF神经网络进行训练，并采用TSA算法对RBF神经网络的关键参量进行寻优；采用历史公共建筑能耗的主要影响指标数据及高频分量，对LSTM神经网络进行训练；将优化后的RBF神经网络模型及训练后的LSTM预测模型进行叠加，得到TSA‑RBF&LSTM组合神经网络预测模型；将待预测的公共建筑能耗的主要影响指标数据作为TSA‑RBF&LSTM组合神经网络预测模型的输入，输出得到所述公共建筑能耗的预测结果；本发明相较于现有的单一模型预测，有效提升了预测性能、预测精度和泛化性能。

Description

公共建筑能耗预测方法、系统、设备及介质

技术领域

本发明属于建筑能耗预测技术领域，特别涉及一种公共建筑能耗预测方法、系统、设备及介质。

背景技术

近年来，随着城市化进程的加快和居民生活质量的提高，建筑运行能耗占社会总能耗的比例已达20％以上；其中，公共建筑的能源消耗最为严重；因此，公共建筑的能源管理对节能减排事业具有重要意义。而准确的建筑能耗预测是提高建筑能效、实施建筑节能的关键；因此，研究公共建筑能耗的机理和规律，建立准确、有效的公共建筑能耗预测模型便具有十分重要的现实意义。

目前，基于人工神经网络的预测模型已经能够有效的应用于公共建筑能耗预测中，能够满足实际的应用需求；然而，由于建筑能耗受到多方面因素的影响；如室外温湿度、室内人员流动以及历史能耗等，且建筑能耗数据具有非线性、波动性强的特点，导致使用单一预测模型所得的预测精度低，泛化能力差，并不能很好地适用于大型公共建筑能耗预测；同时，径向基函数神经网络(RBF)的网络参数训练存在收敛速度慢、易陷入局部最优等问题，从而影响模型的预测性能。

发明内容

针对现有技术中存在的技术问题，本发明提供了一种公共建筑能耗预测方法、系统、设备及介质，以解决现有的公共建筑能耗预测精度低，且泛化能力差的技术问题。

为达到上述目的，本发明采用的技术方案为：

本发明提供了一种公共建筑能耗预测方法，包括以下步骤：

获取历史公共建筑能耗的影响构成要素数据；

采用Lasso算法对历史公共建筑能耗的影响构成要素数据进行特征提取，得到历史公共建筑能耗的主要影响指标数据；

采用CEEMDAN算法对历史公共建筑能耗的影响构成要素数据进行分解处理，线性稳态的本征模态函数分量及残余分量；

采用近似熵理论，按照复杂度对线性稳态的本征模态函数分量及残余分量进行划分，得到高频分量和低频分量；

采用历史公共建筑能耗的主要影响指标数据及低频分量，对RBF神经网络进行训练，并采用TSA算法对RBF神经网络的关键参量进行寻优，得到优化后的RBF神经网络模型；

采用历史公共建筑能耗的主要影响指标数据及高频分量，对LSTM神经网络进行训练，得到训练后的LSTM预测模型；

将优化后的RBF神经网络模型及训练后的LSTM预测模型进行叠加，得到TSA-RBF&LSTM组合神经网络预测模型；

将待预测的公共建筑能耗的主要影响指标数据作为TSA-RBF&LSTM组合神经网络预测模型的输入，输出得到所述公共建筑能耗的预测结果。

进一步的，公共建筑能耗的影响构成要素数据包括建筑物室内照明使用数据、室内人员数据、室外干球温度、室外湿球温度、室外相对湿度、室外露点温度、风速、风向、历史当前太阳辐照度、历史前一时刻的太阳辐照度及历史前一时刻的公共建筑能耗。

进一步的，采用Lasso算法对历史公共建筑能耗的影响构成要素数据进行特征提取，得到历史公共建筑能耗的主要影响指标数据的过程中，将Lasso回归优化目标模型的系数向量不为零的历史公共建筑能耗的影响构成要素数据，作为历史公共建筑能耗的主要影响指标数据。

进一步的，历史公共建筑能耗的主要影响指标数据包括建筑物室内照明使用数据、室内人员数据、室外干球温度、室外相对湿度、风速、历史当前太阳辐照度、历史前一时刻的太阳辐照度及历史前一时刻的公共建筑能耗。

进一步的，采用TSA算法对RBF神经网络的关键参量进行寻优的过程，RBF神经网络的关键参量包括中心向量、基宽向量及权值向量。

进一步的，优化后的RBF神经网络模型的表达式为：

其中，

为优化后的RBF神经网络模型的输出；j为第j个神经元；m为隐含层神经元的个数；w_j为隐含层第j个节点优化后的输出权值；X为输入向量；C_j为隐含层第j个节点优化后的中心向量；b_j为隐含层第j个节点优化后的基宽参数。

进一步的，训练后的LSTM预测模型的表达式为：

f_t＝sigmoid(b_f+W_f,h*h_t-1+W_f,x*x_t)

i_t＝sigmoid(b_i+W_i,h*h_t-1+W_i,x*X_t)

c_t＝tanh(b_c+W_c,x*X_t+W_c,h*h_t-1)

c_t＝c_t-1*f_t+i_t*c_t

o_t＝sigmoid(b_o+W_o,h*h_t-1+W_o,x*x_t)

h_t＝o_t*tanh(c_t)

其中，t为任意时间步长；f_t为t时刻遗忘门的输出；i_t为t时刻输入门的输出；c_t为用于更新细胞状态的信息；c_t为t时刻的细胞状态；o_t为t时刻输出门的输出；h_t分别为t时刻隐含层的输出；b_f、W_f,h、W_f,x分别为遗忘门对应的系数；b_i、W_i,h、W_i,x分别为输入门对应的系数；b_c、W_c,h、W_c,x为细胞状态对应的系数；b_o、W_o,h、W_o,x分别为输出门对应的系数；h_t-1为t-1时刻隐含层的输出；x_t为LSTM预测模型的输入；sigmoid、tanh分别为激活函数。

本发明还提供了一种公共建筑能耗预测系统，包括：

数据获取模块，用于获取历史公共建筑能耗的影响构成要素数据；

特征提取模块，用于采用Lasso算法对历史公共建筑能耗的影响构成要素数据进行特征提取，得到历史公共建筑能耗的主要影响指标数据；

分解模块，用于采用CEEMDAN算法对历史公共建筑能耗的影响构成要素数据进行分解处理，线性稳态的本征模态函数分量及残余分量；

划分模块，用于采用近似熵理论，按照复杂度对线性稳态的本征模态函数分量及残余分量进行划分，得到高频分量和低频分量；

RBF模型模块，用于采用历史公共建筑能耗的主要影响指标数据及低频分量，对RBF神经网络进行训练，并采用TSA算法对RBF神经网络的关键参量进行寻优，得到优化后的RBF神经网络模型；

LSTM模型模块，用于采用历史公共建筑能耗的主要影响指标数据及高频分量，对LSTM神经网络进行训练，得到训练后的LSTM预测模型；

模型叠加模块，用于将优化后的RBF神经网络模型及训练后的LSTM预测模型进行叠加，得到TSA-RBF&LSTM组合神经网络预测模型；

预测输出模块，用于将待预测的公共建筑能耗的主要影响指标数据作为TSA-RBF&LSTM组合神经网络预测模型的输入，输出得到所述公共建筑能耗的预测结果。

本发明还提供了一种公共建筑能耗预测设备，包括：

存储器，用于存储计算机程序；

处理器，用于执行所述计算机程序时实现所述的一种公共建筑能耗预测方法的步骤。

本发明还提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现所述一种公共建筑能耗预测方法的步骤。

与现有技术相比，本发明的有益效果为：

本发明提供了一种公共建筑能耗预测方法及系统，采用Lasso算法对公共建筑能耗的影响构成要素进行特征提取，实现对公共建筑能耗的影响构成要素的重要度进行评估，得到公共建筑能耗的主要影响指标数据，有效提高了模型的预测精度；同时，降低了TSA-RBF&LSTM组合神经网络预测模型输入变量的维度，提高了模型的收敛速度，节约了运算成本；采用CEEMDAN算法对历史公共建筑能耗的影响构成要素数据进行分解处理，将具有非线性和非平稳性的影响构成要素数据分解为线性稳态的本征模态函数分量及残余分量，有效降低了影响构成要素数据的复杂程度；同时，采用近似熵理论分析计算的线性稳态的本征模态函数分量及残余分量的复杂度，划分为高频分量和低频分量，为利用具有不同特点的模型预测提供了不同的训练数据；采用TSA算法对RBF神经网络进行优化，消除了RBF神经网络在公共建筑能耗预测的参数最优选择问题；将TSA算法与RBF神经网络结合，降低了RBF神经网络模型的预测误差，使预测性能得到了有效提升；采用低频分量对RBF神经网络模型对进行训练，采用高频分量对LSTM预测模型进行训练，并将优化后的RBF神经网络模型及训练后的LSTM预测模型组合叠加，能够充分利用两种模型的特点，相较于现有的单一模型预测，有效提升了预测性能、预测精度和泛化性能。

附图说明

图1为实施例所述的公共建筑能耗预测方法的流程图；

图2为实施例中公共建筑能耗影响因素Lasso拟合系数轨迹图；

图3为实施例中的CEEMDAN分解流程图；

图4为实施例中的CEEMDAN能耗分解结果图；

图5为实施例中经CEEMADAN分解的能耗分量近似熵值；

图6为实施例中所采用的RBF神经网络结构图；

图7为实施例中所采用的LSTM神经网络结构图；

图8为实施例中采用四种不同预测模型的预测结果对比图；

图9为实施例中采用四种不同预测模型的预测精度对比图；

图10为实施例中TSA-RBF&LSTM预测模型泛化能力证明图。

具体实施方式

为了使本发明所解决的技术问题，技术方案及有益效果更加清楚明白，以下具体实施例，对本发明进行进一步的详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

本发明提供了一种公共建筑能耗预测方法，包括以下步骤：

步骤1、获取历史公共建筑能耗的影响构成要素数据；其中，公共建筑能耗的影响构成要素数据包括建筑物室内照明使用数据、室内人员数据、室外干球温度、室外湿球温度、室外相对湿度、室外露点温度、风速、风向、历史当前太阳辐照度、历史前一时刻的太阳辐照度及历史前一时刻的公共建筑能耗。

步骤2、采用Lasso算法对历史公共建筑能耗的影响构成要素数据进行特征提取，得到历史公共建筑能耗的主要影响指标数据；本发明中，将Lasso回归优化目标模型的系数向量不为零的历史公共建筑能耗的影响构成要素数据，作为历史公共建筑能耗的主要影响指标数据；其中，历史公共建筑能耗的主要影响指标数据包括建筑物室内照明使用数据、室内人员数据、室外干球温度、室外相对湿度、风速、历史当前太阳辐照度、历史前一时刻的太阳辐照度及历史前一时刻的公共建筑能耗。

步骤3、采用CEEMDAN算法对历史公共建筑能耗的影响构成要素数据进行分解处理，线性稳态的本征模态函数分量及残余分量。

步骤4、采用近似熵理论，按照复杂度对线性稳态的本征模态函数分量及残余分量进行划分，得到高频分量和低频分量。

步骤5、采用历史公共建筑能耗的主要影响指标数据及低频分量，对RBF神经网络进行训练，并采用TSA算法对RBF神经网络的关键参量进行寻优，得到优化后的RBF神经网络模型；其中，RBF神经网络的关键参量包括中心向量、基宽向量及权值向量。

其中，优化后的RBF神经网络模型的表达式为：

其中，

步骤6、采用历史公共建筑能耗的主要影响指标数据及高频分量，对LSTM神经网络进行训练，得到训练后的LSTM预测模型。

其中，训练后的LSTM预测模型的表达式为：

f_t＝sigmoid(b_f+W_f,h*h_t-1+W_f,x*x_t)

i_t＝sigmoid(b_i+W_i,h*h_t-1+W_i,x*X_t)

c_t＝tanh(b_c+W_c,x*X_t+W_c,h*h_t-1)

c_t＝c_t-1*f_t+i_t*c_t

o_t＝sigmoid(b_o+W_o,h*h_t-1+W_o,x*x_t)

h_t＝o_t*tanh(c_t)

步骤7、将优化后的RBF神经网络模型及训练后的LSTM预测模型进行叠加，得到TSA-RBF&LSTM组合神经网络预测模型。

步骤8、将待预测的公共建筑能耗的主要影响指标数据作为TSA-RBF&LSTM组合神经网络预测模型的输入，输出得到所述公共建筑能耗的预测结果。

本发明所述的公共建筑能耗预测方法，采用Lasso算法对公共建筑能耗的影响构成要素进行特征提取，实现对公共建筑能耗的影响构成要素的重要度进行评估，得到公共建筑能耗的主要影响指标数据，有效提高了模型的预测精度；同时，降低了TSA-RBF&LSTM组合神经网络预测模型输入变量的维度，提高了模型的收敛速度，节约了运算成本。

采用CEEMDAN算法对历史公共建筑能耗的影响构成要素数据进行分解处理，将具有非线性和非平稳性的影响构成要素数据分解为线性稳态的本征模态函数分量及残余分量，有效降低了影响构成要素数据的复杂程度；同时，采用近似熵理论分析计算的线性稳态的本征模态函数分量及残余分量的复杂度，划分为高频分量和低频分量，为利用具有不同特点的模型预测提供了不同的训练数据。

采用TSA算法对RBF神经网络进行优化，消除了RBF神经网络在公共建筑能耗预测的参数最优选择问题；将TSA算法与RBF神经网络结合，降低了RBF神经网络模型的预测误差，使预测性能得到了有效提升；采用低频分量对RBF神经网络模型对进行训练，采用高频分量对LSTM预测模型进行训练，并将优化后的RBF神经网络模型及训练后的LSTM预测模型组合叠加，能够充分利用两种模型的特点，相较于现有的单一模型预测，有效提升了预测性能、预测精度和泛化性能。

本发明还提供了一种公共建筑能耗预测系统，包括数据获取模块、特征提取模块、分解模块、划分模块、RBF模型模块、LSTM模型模块、模型叠加模块及预测输出模块；数据获取模块，用于获取历史公共建筑能耗的影响构成要素数据；特征提取模块，用于采用Lasso算法对历史公共建筑能耗的影响构成要素数据进行特征提取，得到历史公共建筑能耗的主要影响指标数据；分解模块，用于采用CEEMDAN算法对历史公共建筑能耗的影响构成要素数据进行分解处理，线性稳态的本征模态函数分量及残余分量；划分模块，用于采用近似熵理论，按照复杂度对线性稳态的本征模态函数分量及残余分量进行划分，得到高频分量和低频分量；RBF模型模块，用于采用历史公共建筑能耗的主要影响指标数据及低频分量，对RBF神经网络进行训练，并采用TSA算法对RBF神经网络的关键参量进行寻优，得到优化后的RBF神经网络模型；LSTM模型模块，用于采用历史公共建筑能耗的主要影响指标数据及高频分量，对LSTM神经网络进行训练，得到训练后的LSTM预测模型；模型叠加模块，用于将优化后的RBF神经网络模型及训练后的LSTM预测模型进行叠加，得到TSA-RBF&LSTM组合神经网络预测模型；预测输出模块，用于将待预测的公共建筑能耗的主要影响指标数据作为TSA-RBF&LSTM组合神经网络预测模型的输入，输出得到所述公共建筑能耗的预测结果。

本发明还提供了一种公共建筑能耗预测设备，包括存储器及处理器；存储器，用于存储计算机程序；处理器，用于执行所述计算机程序时实现所述的公共建筑能耗预测方法的步骤。

所述处理器执行所述计算机程序时实现上述公共建筑能耗预测方法的步骤，例如：

获取历史公共建筑能耗的影响构成要素数据；采用Lasso算法对历史公共建筑能耗的影响构成要素数据进行特征提取，得到历史公共建筑能耗的主要影响指标数据；采用CEEMDAN算法对历史公共建筑能耗的影响构成要素数据进行分解处理，线性稳态的本征模态函数分量及残余分量；采用近似熵理论，按照复杂度对线性稳态的本征模态函数分量及残余分量进行划分，得到高频分量和低频分量；采用历史公共建筑能耗的主要影响指标数据及低频分量，对RBF神经网络进行训练，并采用TSA算法对RBF神经网络的关键参量进行寻优，得到优化后的RBF神经网络模型；采用历史公共建筑能耗的主要影响指标数据及高频分量，对LSTM神经网络进行训练，得到训练后的LSTM预测模型；将优化后的RBF神经网络模型及训练后的LSTM预测模型进行叠加，得到TSA-RBF&LSTM组合神经网络预测模型；将待预测的公共建筑能耗的主要影响指标数据作为TSA-RBF&LSTM组合神经网络预测模型的输入，输出得到所述公共建筑能耗的预测结果。

或者，所述处理器执行所述计算机程序时实现上述系统中各模块的功能，例如：数据获取模块，用于获取历史公共建筑能耗的影响构成要素数据；特征提取模块，用于采用Lasso算法对历史公共建筑能耗的影响构成要素数据进行特征提取，得到历史公共建筑能耗的主要影响指标数据；分解模块，用于采用CEEMDAN算法对历史公共建筑能耗的影响构成要素数据进行分解处理，线性稳态的本征模态函数分量及残余分量；划分模块，用于采用近似熵理论，按照复杂度对线性稳态的本征模态函数分量及残余分量进行划分，得到高频分量和低频分量；RBF模型模块，用于采用历史公共建筑能耗的主要影响指标数据及低频分量，对RBF神经网络进行训练，并采用TSA算法对RBF神经网络的关键参量进行寻优，得到优化后的RBF神经网络模型；LSTM模型模块，用于采用历史公共建筑能耗的主要影响指标数据及高频分量，对LSTM神经网络进行训练，得到训练后的LSTM预测模型；模型叠加模块，用于将优化后的RBF神经网络模型及训练后的LSTM预测模型进行叠加，得到TSA-RBF&LSTM组合神经网络预测模型；预测输出模块，用于将待预测的公共建筑能耗的主要影响指标数据作为TSA-RBF&LSTM组合神经网络预测模型的输入，输出得到所述公共建筑能耗的预测结果。

示例性的，所述计算机程序可以被分割成一个或多个模块/单元，所述一个或者多个模块/单元被存储在所述存储器中，并由所述处理器执行，以完成本发明。所述一个或多个模块/单元可以是能够完成预设功能的一系列计算机程序指令段，所述指令段用于描述所述计算机程序在所述公共建筑能耗预测设备中的执行过程。例如，所述计算机程序可以被分割成数据获取模块、特征提取模块、分解模块、划分模块、RBF模型模块、LSTM模型模块、模型叠加模块及预测输出模块，各模块具体功能如下：数据获取模块，用于获取历史公共建筑能耗的影响构成要素数据；特征提取模块，用于采用Lasso算法对历史公共建筑能耗的影响构成要素数据进行特征提取，得到历史公共建筑能耗的主要影响指标数据；分解模块，用于采用CEEMDAN算法对历史公共建筑能耗的影响构成要素数据进行分解处理，线性稳态的本征模态函数分量及残余分量；划分模块，用于采用近似熵理论，按照复杂度对线性稳态的本征模态函数分量及残余分量进行划分，得到高频分量和低频分量；RBF模型模块，用于采用历史公共建筑能耗的主要影响指标数据及低频分量，对RBF神经网络进行训练，并采用TSA算法对RBF神经网络的关键参量进行寻优，得到优化后的RBF神经网络模型；LSTM模型模块，用于采用历史公共建筑能耗的主要影响指标数据及高频分量，对LSTM神经网络进行训练，得到训练后的LSTM预测模型；模型叠加模块，用于将优化后的RBF神经网络模型及训练后的LSTM预测模型进行叠加，得到TSA-RBF&LSTM组合神经网络预测模型；预测输出模块，用于将待预测的公共建筑能耗的主要影响指标数据作为TSA-RBF&LSTM组合神经网络预测模型的输入，输出得到所述公共建筑能耗的预测结果。

所述公共建筑能耗预测设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述公共建筑能耗预测设备可包括，但不仅限于处理器、存储器。本领域技术人员可以理解，上述仅仅是公共建筑能耗预测设备的示例，并不构成对公共建筑能耗预测设备的限定，可以包括更多的部件，或者组合某些部件，或者不同的部件，例如所述公共建筑能耗预测设备还可以包括输入输出设备、网络接入设备、总线等。

所称处理器可以是中央处理单元(CentralProcessingUnit，CPU)，还可以是其他通用处理器、数字信号处理器(DigitalSignalProcessor，DSP)、专用集成电路(ApplicationSpecificIntegratedCircuit，ASIC)、现成可编程门阵列(Field-ProgrammableGateArray，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者所述处理器也可以是任何常规的处理器等，所述处理器是所述公共建筑能耗预测设备的控制中心，利用各种接口和线路连接整个公共建筑能耗预测设备的各个部分。

所述存储器可用于存储所述计算机程序和/或模块，所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块，以及调用存储在存储器内的数据，实现所述公共建筑能耗预测设备的各种功能。

所述存储器可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外，存储器可以包括高速随机存取存储器，还可以包括非易失性存储器，例如硬盘、内存、插接式硬盘，智能存储卡(SmartMediaCard,SMC)，安全数字(SecureDigital,SD)卡，闪存卡(FlashCard)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

本发明还提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现所述的一种公共建筑能耗预测方法的步骤。

所述公共建筑能耗预测系统集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。

基于这样的理解，本发明实现上述公共建筑能耗预测方法中的全部或部分流程，也可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一计算机可读存储介质中，所述计算机程序在被处理器执行时，可实现上述公共建筑能耗预测方法的步骤。其中，所述计算机程序包括计算机程序代码，所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或预设中间形式等。

所述计算机可读存储介质可以包括：能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(Read-OnlyMemory，ROM)、随机存取存储器(RandomAccessMemory，RAM)、电载波信号、电信信号以及软件分发介质等。

需要说明的是，所述计算机可读存储介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减，例如在某些司法管辖区，根据立法和专利实践，计算机可读存储介质不包括电载波信号和电信信号。

实施例

如附图1所示，以某市某大型公共建筑为研究对象，本实施例提供了一种公共建筑能耗预测方法，包括以下步骤：

步骤1、获取历史公共建筑能耗的影响构成要素数据；其中，历史公共建筑能耗的影响构成要素包括建筑物室内照明使用数据、室内人员数据、室外干球温度、室外湿球温度、室外相对湿度、室外露点温度、风速、风向、历史当前太阳辐照度、历史前一时刻的太阳辐照度及历史前一时刻的公共建筑能耗。

步骤2、采用Lasso算法对历史公共建筑能耗的影响构成要素进行特征提取，得到历史公共建筑能耗的主要影响指标；其中，采用将Lasso回归优化目标模型的系数向量不为零的历史公共建筑能耗的影响构成要素数据，作为历史公共建筑能耗的主要影响指标数据。

Lasso算法即为最小绝对值收缩与选择算子方法(least absolute shrinkageand selection operator，Lasso)，其作为一种能够选出稳定而具有可解释性特征子集的特征选择方法；Lasso算法的基本思想是通过加入所有自变量系数绝对值之和小于一个阈值的约束条件，使得在求解多元回归模型时，与预测目标弱相关的自变量系数为零，从而起到特征选择的作用；相较于传统的特征选择算法，Lasso算法具有比最小二乘法更好的预测准确性和解释性，且相比指数算法的计算过程简单。

本实施例中，采用Lasso算法对历史公共建筑能耗的影响构成要素进行特征提取，得到历史公共建筑能耗的主要影响指标的过程，具体包括以下步骤：

步骤21、对获取的历史公共建筑能耗的影响构成要素数据进行数据标准化处理，以消除不同特征量纲不同的影响，得到标准化后的特征数据；其中，按照以下数据标准化公式进行数据标准化处理：

数据标准化公式为：

其中，z^*为标准化后的特征数据，z_mean为原始的影响构成要素数据的算术平均值，z_std为原始的影响构成要素数据的数据的标准差，z为原始的影响构成要素数据。

步骤22、采用N组标准化后的特征数据，构建初始训练集(X_i1,y_i1)，i₁＝1,2,...,N；其中，X_i1为初始训练集的自变量，y_i1为响应变量，i₁为第i₁个影响构成要素标准化后的特征数据组数。

本实施例中，初始训练集的自变量X_i1的表达式为：

其中，

为第i₁个影响构成要素中的第p个特征变量，p为某一影响构成要素数据的特征变量数。

步骤23、建立Lasso回归目标模型；令Lasso回归目标模型的系数向量为

系数向量

的表达式为

其中，

为第p个特征变量的回归系数。

本实施例中，Lasso回归目标模型的表达式为：

其中，

为常数项；

为回归系数；

为第i₁个影响构成要素中的第j₁个特征变量；t₁为约束值，且约束值t₁为对回归系数

的L1范数惩罚，t₁≥0；j₁为第j₁个特征变量。

本实施例中，当约束值t的取值小于预设值时，相关度低的系数就被压缩为零，从而达到特征选择的目的；对于所有的约束值t₁，对常数项

的估算公式为：：

步骤24，设

为完整最小二乘估计，且

令

本实施例中，以均方误差MSE作为Lasso回归目标模型的评价准则，采用交叉验证的模型训练方式，求解模型的最优正则化参数λ。

本实施例中，均方误差MSE的表达式为：

其中，MSE为均方误差，n₁为测试样本个数，y_i1为响应变量的真实值，

为响应变量的预测值。

步骤25、根据模型的最优正则化参数λ，得到Lasso回归优化目标模型的系数向量不为零的特征子集，即将Lasso回归优化目标模型的系数向量不为零的历史公共建筑能耗的影响构成要素数据，作为历史公共建筑能耗的主要影响指标数据。

本实施例中，在特征提取的过程中，采用10折交叉验证的模型训练方式；具体的，其将整体的初始训练样本集分解为10份子样本集，交替地将其中的9份子样本集作为训练集，将剩余的1份子样本集作为测试集来训练模型，最后对10次训练得到的均方误差MSE取平均值；能够有效提升模型的稳定性，增加特征选择结果的可信度，求解最小的均方误差MSE所对应的正则化参数λ，得到Lasso回归优化目标模型的系数向量不为零的特征子集，即为历史公共建筑能耗的主要影响指标数据。

如附图2所示，附图2中给出了采用Lasso算法对历史公共建筑能耗影响构成要素进行特征提取的结果，即本实施例中某大型公共建筑能耗影响因素Lasso拟合系数轨迹图；从附图2中可以看出当模型误差最小时，模型系数不为零的特征变量有照明使用、房间人员、室外干球温度、室外相对湿度、风速、太阳辐照度、前一时刻太阳辐照度以及前一时刻能耗；因此，本实施例中，所筛选的历史公共建筑能耗的主要影响指标数据包括建筑物室内照明使用数据、室内人员数据、室外干球温度、室外相对湿度、风速、历史当前太阳辐照度、历史前一时刻的太阳辐照度及历史前一时刻的公共建筑能耗。

经验模态分解(Empirical Mode Decomposition)作为一种应用十分广泛的时频信号分解方法，能将非线性、非平稳信号自适应分解为线性、稳态的本征模态函数(intrinsic mode function，IMF)与一个残余分量之和；所述的经验模态分解方法在对信号进行分解时无需设定基函数，完全根据数据自身的时间尺度特征处理信号；其与短时傅立叶变换、小波分解等方法相比，经验模态分解EMD的分解过程更为简单、直观；经验模态分解EMD的优点是自适应能力强、完备性好，但模态混叠严重影响经验模态分解EMD的分解精度；作为经验模态分解EMD的改进方法，基于自适应噪声的完全集合经验模态分解(Complete Ensemble Empirical Mode Decomposition with Adaptive Noise，CEEMDAN)算法有效地解决了EMD算法的模态混叠问题。

如附图3所示，采用CEEMDAN算法对历史公共建筑能耗的影响构成要素数据进行分解处理，线性稳态的本征模态函数分量及残余分量的过程，具体包括以下步骤：

步骤31、生成含高斯白噪声的公共建筑能耗信号集x^a(t)；其中，xⁱ(t)的表达式为：

x^a(t)＝x(t)+ω^a(t)

其中，x(t)为原始公共建筑能耗信号；ω^a(t)为满足高斯分布的白噪声，a＝1,2,...,A；A为添加白噪声的次数，即公共建筑能耗信号集的样本总数。

步骤32、对含高斯白噪声的公共建筑能耗信号集x^a(t)进行经验模态分解，得到各样本的1阶线性稳态的本征模态函数分量IMF^a ₁；将各样本的1阶线性稳态的本征模态函数分量IMF^a ₁的均值作为原始公共建筑能耗信号的1阶线性稳态的本征模态函数分量；即：

其中，

为经CEEMDAN分解得到的1阶本征模态函数分量。

步骤33、计算1阶残余分量及2阶线性稳态的本征模态函数分量；其中，1阶残余分量及2阶线性稳态的本征模态函数分量的计算公式如下：

其中，r₁(t)为1阶残余分量；ε₁为1阶残余分量对应的白噪声幅值；E₁(·)为信号的经EMD分解得到的1阶线性稳态的本征模态函数分量；ω^a(t)为第a次添加的白噪声。

步骤34、计算k阶残余分量及k+1阶线性稳态的本征模态函数分量；其中，k＝2,3,...,K，K为线性稳态的本征模态函数分量的最高阶次；k阶残余分量及k+1阶线性稳态的本征模态函数分量的计算公式如下：

其中，r_k(t)为k阶残余分量；r_k-1(t)为k-1阶残余分量；

为经CEEMDAN分解得到的k阶本征模态函数分量；

为经CEEMDAN分解得到的k+1阶本征模态函数分；ε_a为a阶残余分量对应的白噪声幅值；E_k(·)为信号的经EMD分解得到的k阶线性稳态的本征模态函数分量；ωⁱ(t)为第i次添加的白噪声。

步骤35、重复步骤34，直至残余分量R(t)的极值点个数小于3时，则不可再分解，算法终止；最终的分解结果的表达式为：

本实施例中，采用CEEMDAN算法对历史公共建筑能耗的影响构成要素数据进行分解处理的过程中，设置白噪声幅值为0.2，白噪声添加次数为100次，迭代次数为500次；最终的分解结果如附图4所示。

近似熵理论是由Pincus所提出，用来衡量时间序列复杂度的一种方法；近似熵值越大，表明序列越复杂；本实施例中，近似熵求解过程，具体如下：

步骤41、设建筑能耗数据为一个M维的时间序列u(1),u(2),...,u(M)；其中，u(M)为第M个能耗数据样本。

步骤42、确定嵌入维数b，得到b维的向量X(c)；其中，b维的向量X(c)的表达式为：

X(c)＝[u(c),u(c+1),u(c+b-1)]

其中，u(c)为第c个能耗数据样本；u(c+b-1)为第c+b-1个能耗数据样本；c为第c个建筑能耗数据样本所在的维数，c＝1,2,...,M-b+1。

步骤43、计算相空间中，第c个能耗数据样本向量X(c)与第e个能耗数据样本向量X(e)的距离d[X(c),X(e)]；其中，距离d[X(c),X(e)]的表达式为：

d[X(c),X(e)]＝max_0～b-1|u(c+g)-u(e+g)|

其中，u(c+g)为第c+g个能耗数据样本；u(e+g)为第e+g个能耗数据样本；b为嵌入维数。

设定阈值ε，统计在阈值ε以下的距离数量，计算其与总数的比值：

其中，C^b _c(ε)为在阈值ε下当嵌入维数为b时的第c个距离统计参数；U{d(X(c),X(e))＜ε}为向量X(c)与X(e)之间的距离小于阈值ε的数目。

步骤44、将C^b _c(ε)取对数后再求平均值：

其中，φ_m(ε)为在阈值ε下当嵌入维数为b时的距离统计参数均值。

步骤45、增加维数至b+1，重复步骤42-44；得到在阈值ε下当嵌入维数为b+1时的距离统计参数均值φ_b+1(ε)。

步骤46、计算近似熵估计：

ApEn(b,ε,M)＝φ_b(ε)-φ_b+1(ε)

其中，ApEn(b,ε,M)为当嵌入维数为b、阈值为ε、数据样本维数为M时的近似熵值。

本实施例中，采用近似熵理论计算历史公共建筑能耗的影响构成要素数据分解后的线性稳态的本征模态函数分量及残余分量；参数设置为：b＝2，ε＝0.2Std；其中，Std为原始时间序列的标准差。

本实施例中，计算结果如附图5所示，并将IMF1～IMF4划分为高频分量，将IMF5～IMF7以及残余分量R划分为低频分量。

从附图4-5中可以看出本实施例中某大型公共建筑的能耗数据可以分解为7个IMF分量和1个残余分量，且通过近似熵值可以将其划分为高频分量和低频分量，其中，IMF1～IMF4为高频分量，IMF5～IMF7和残余分量R为低频分量。

步骤5、采用历史公共建筑能耗的主要影响指标数据及高频分量，对RBF神经网络进行训练，并采用TSA算法对RBF神经网络的关键参量进行寻优，得到优化后的RBF神经网络模型；其中，RBF神经网络的关键参量包括中心向量、基宽向量及权值向量；采用历史公共建筑能耗的主要影响指标数据及高频分量，对LSTM神经网络进行训练，得到训练后的LSTM预测模型；将优化后的RBF神经网络模型及训练后的LSTM预测模型进行叠加，得到TSA-RBF&LSTM组合神经网络预测模型，能够充分发挥不同模型的预测性能，从而达到提升预测精度的目的。

具体过程如下：

步骤51、建立优化后的RBF神经网络模型；首先，将经过Lasso算法进行特征提取得到的历史公共建筑能耗的主要影响指标数据分别与步骤4中的低频分量结合，并构建训练集和测试集；利用训练集和测试集对RBF神经网络进行训练和优化；其中，训练优化过程，采用TSA算法对RBF神经网络的中心向量、基宽向量和权重向量进行寻优，得到优化后的RBF模型；采用TSA算法进行寻优过程，具体包括以下步骤：

步骤511、确定RBF神经网络的关键参量，并确定RBF神经网络的关键参量的参数范围；本实施例中，RBF神经网络的关键参量包括中心向量、基宽向量及权值向量；其中，将中心向量中的各分量设置为[-3,3]内的随机数；基宽向量的各分量设置为[0,3]内的随机数；权值向量的各分量设置为[-1,1]内的随机数。

步骤512、根据RBF神经网络的关键参量的参数范围，设置TSA算法影响参数的寻优范围；TSA算法的影响参数包括种群规模、搜索趋势参数、优化维度、最大迭代次数、树种种群位置的上限与下限、随机初始化树种种群的位置及TSA算法的适应度函数。

本实施例中，TSA算法的适应度函数设置为均方根误差(Root Mean SquareError)，适应度函数值越小时说明预测值越精确，得到的RBF神经网络的中心向量、基宽向量和权值向量也就越优；其中，均方根误差计算公式如下：

其中，fitness为适应度函数；n₁为测试样本个数，

为响应变量真实值，

为响应变量的预测值。

步骤513、利用低频分量训练集和树种种群信息，得到RBF神经网络的预测值；并根据RBF神经网络的预测值，计算当前种群中所有个体的适应度值，选择当前最优适应度个体，并设置该个体的位置为当前最优。

步骤514、利用TSA算法的控制参数搜索趋势ST对种子个体位置进行迭代更新；其中，当在[0,1]内生成的随机数小于ST，则根据种子的母树、当前最佳树及另一棵随机树的位置进行更新；否则，根据种子的母树和另一棵随机树的位置进行更新。

步骤515、每次迭代更新后，将优化后的RBF神经网络的关键参量传递至RBF神经网络模型。

步骤516、判断迭代循环次数是否达到预设值，若是，则停止对预测精度参数的寻优，得到RBF神经网络模型的最优参数；若非，则继续迭代更新。

本实施例中，RBF神经网络，即径向基函数神经网络(Radical Basis Function,RBF)；其是由J.Moody和C.Darken根据生物神经元具有局部响应的原理提出的一种三层前馈型网络，其具有结构简单、泛化能力强、能够逼近任意非线性函数等优点，已广泛应用于模式识别、信号处理、时间序列预测等领域；其中，RBF神经网络的结构如附图6所示，包括输入层、隐含层和输出层。

隐含层单元的作用函数一般取高斯基函数，隐含层的神经元j的输出为：

j＝1,2,...,m

X＝(x₁,x₂,...,x_n)

C_j＝(c_j1,c_j2,...c_jn)

其中：m为隐含层的神经元个数；X为网络的输入向量；x_n为样本第n维特征变量值；n为样本特征变量数；C_j为第j个神经元节点的中心向量；b_j为第j个节点的基宽参数；c_jn为第j个神经元节点的中心向量的第n个分量。

RBF神经网络的输出层的表达式为：

其中，

为样本的预测值；w_j为隐含层第j个节点到输出层的连接权值；h_j为隐含层第j个节点的输出；m为隐含层神经元个数。

本发明中，由RBF神经网络的训练过程可以看出，RBF神经网络需要训练的关键参量包括中心向量C_j、基宽向量B＝(b₁,b₂,...,b_m)和权值向量W＝(w₁,w₂,...,w_m)。

树种算法(Tree Seed Algorithm,TSA)作为新型的群智能优化算法，它的优化机制是基于自然界中树与种子之间的关系：种子随着时间的推移可以长成新的树，树通过种子进行传播。假设生长树的土地作为优化问题的搜索空间，则认为树和种子的位置是优化问题的可能解。

群体中的每棵树将在每次迭代中产生随机数目的种子，而这些种子根据它们的母树或最佳树的位置同另一随机树的位置更新其位置，更新方法由控制参数搜索趋势(search tendency,ST)决定；其与一般的群智能优化算法相比(如人工蜂群算法(Artificial Bee Colony，ABC)和萤火虫算法)，该算法的局部搜索模式更为剧烈和精细，所以具备了更好的全局寻优能力。

本实施例中，TSA算法的种子位置更新公式为：

其中，i₂为第i₂棵树或种子，i₂＝1,2,...,N₂，N₂为种群规模；j₂为第j₂维，j₂＝1,2,...,d，d为树或种子的维度；ST为搜索趋势，取值范围为[0,1]；

为第i棵树产生的第i₂个种子第j₂维的值；

为第i棵树第j₂维的值；

为当前获得的最佳树第j₂维的值；

为群体中随机选择的第r棵树第j₂维的值；

为在[-1,1]范围内随机产生的缩放因子。

种子的位置更新由搜索趋势ST控制，当在[0,1]范围内随机产生的数值小于搜索趋势ST时，采用公式(1)进行更新；否则，采用公式(2)进行更新；种群中每棵树产生的种子数是随机的，其范围是[0.1N₂,0.25N₂]。

树的初始位置产生公式为：

其中：

为搜索空间下限；

为搜索空间上限；

为在[0,1]范围内产生的随机数。

群体中最佳树的位置产生公式为：

其中：B为最佳树的位置；f(·)为适应度函数；

为第i₂棵树的位置。

步骤52、采用历史公共建筑能耗的主要影响指标数据及高频分量，对LSTM神经网络进行训练，得到训练后的LSTM预测模型；其中，将经Lasso算法特征提取后的公共建筑主要影响指标数据分别与建筑能耗数据分解后的各高频分量结合并构建训练集和测试集；利用训练集及测试集对LSTM神经网络进行训练，得到训练后的LSTM预测模型。

长短期记忆神经网络(Long Short-Term Memory,LSTM)作为一种特殊的循环神经网络(Recurrent Neural Network，RNN)能够学习长期依赖关系，并克服循环神经网络梯度消失问题；长短期记忆神经网络具有准确度高、分布存储以及学习能力强等优势，对噪声神经有较强的鲁棒性和容错能力，能充分逼近复杂的非线性关系，同时还具备联想记忆的功能，从而可以有效地处理时间序列问题。不同于循环神经网络，长短期记忆神经网络在隐藏层的神经节点中，增加了一种被称为记忆单元(Memory Cell)的结构用来记忆过去的信息，并增加了三种“门”结构来控制历史信息的使用，分别是遗忘门、输入门和输出门，如附图7所示。

在LSTM神经网络中，对于每个时间步长t，使用前一时间步长的输入x_t和输出h_t-1计算当前单元细胞状态c_t和输出h_t；LSTM神经网络的第一层遗忘门f控制对上一单元细胞状态c_t-1的遗忘程度：

f_t＝sigmoid(b_f+W_f,h*h_t-1+W_f,x*x_t)

其中，f_t为t时刻遗忘门的输出；sigmoid(·)为激活函数；b_f、W_f,h、W_f,x为遗忘门对应的系数；h_t-1为t-1时刻隐含层的输出；x_t为t时刻的输入；f为遗忘门的输出；h为隐含层的输出；x为输入。

输入门i根据新输入的信息对细胞状态进行更新，将更新后的细胞状态传送到下一单元：

i_t＝sigmoid(b_i+W_i,h*h_t-1+W_i,x*X_t)

c_t＝tanh(b_c+W_c,x*X_t+W_c,h*h_t-1)

其中，i_t为t时刻输入门的输出；b_i、W_i,h、W_i,x为输入门对应的系数；h_t-1为t-1时刻隐含层的输出；x_t为t时刻的输入；c_t为用于更新细胞状态的信息；tanh(·)为激活函数；b_c、W_c,x、W_c,h为细胞状态对应的系数。

输出门o根据输入数据对细胞状态进行过滤，产生本阶段的输出结果：

c_t＝c_t-1*f_t+i_t*c_t

o_t＝sigmoid(b_o+W_o,h*h_t-1+W_o,x*x_t)

h_t＝o_t*tanh(c_t)

其中，c_t为t时刻细胞的状态；c_t-1为t-1时刻细胞的状态；o_t为t时刻输出门的输出；sigmoid(·)为激活函数；b_o、W_o,h、W_o,x为输出门对应的系数；h_t为t时刻隐含层的输出。

步骤53、将优化后的RBF神经网络模型及训练后的LSTM预测模型进行叠加，得到TSA-RBF&LSTM组合神经网络预测模型。

步骤6、将待预测的公共建筑能耗的主要影响指标数据作为TSA-RBF&LSTM组合神经网络预测模型的输入，输出得到所述公共建筑能耗的预测结果。

试验结果：

本实施例，以某市公共建筑能耗监测平台采集得到的建筑能耗相关数据进行预测模型的学习和测试。

如附图8所示，附图8给出了本实施例中某大型公共建筑的能耗预测结果对比情况；从附图8中可以看出，相较于径向基函数神经网络RBF、经TSA算法优化的TSA-RBF、长短期记忆神经网络LSTM三种预测模型，本实施例所述的TSA-RBF&LSTM得到的某大型公共建筑能耗的预测值与真实值的差距最小，部分值几乎完全重合，拟合效果更佳。

同时，为了验证模型预测效果，选取均方根误差(Root Mean Square Error,RMSE)，平均绝对百分误差(Mean Absolute Percentage Error,MAPE)作为模型预测精度的主要评价指标，公式如下：

如附图9所示，附图9中给出了本实施例中的预测精度对比图；从附图9中可以看出，对于案例大型公共建筑，本实施例所述的TSA-RBF&LSTM组合神经网络预测模型的RMSE和MAPE分别为2.8735和0.2％，相较于其他方法均最小，其预测精度更高；另外，从附图9中可以看出，相比于RBF模型，TSA-RBF模型的预测精度有所提高，表明TSA算法可以用于RBF模型的参数优化。

为了进一步验证本实施例所提出的TSA-RBF&LSTM组合神经网络预测模型的泛化性能，利用TSA-RBF&LSTM组合神经网络预测模型分别对该某大型公共建筑4月-9月，这6个月中最后四天的能耗进行预测，当月其余天数的能耗数据作为模型的训练数据，并以是否使用Lasso算法和CEEMDAN算法为自变量进行实验对比。

如附图10所示，附图10给出了本实施例中的泛化能力证明图；从附图10中可以看出，TSA-RBF&LSTM组合神经网络预测模型有着较强的泛化能力，对于不同月份的能耗都有着良好的预测效果，且误差范围稳定在一个很小的区间范围内；与此同时，与未进行Lasso特征提取相比，进行特征提取后的预测效果更好，表明其成功地对原始特征集进行了降维处理，其选择出的特征能够更好地建立预测模型，有效地增加模型预测精度；与未进行CEEMDAN分解相比，进行CEEMDAN分解后的预测效果更好，表明其能够有效地对具有非线性、非平稳性的能耗数据进行预处理，从而进一步提升预测精度。

上述实施例仅仅是能够实现本发明技术方案的实施方式之一，本发明所要求保护的范围并不仅仅受本实施例的限制，还包括在本发明所公开的技术范围内，任何熟悉本技术领域的技术人员所容易想到的变化、替换及其他实施方式。

Claims

1.一种公共建筑能耗预测方法，其特征在于，包括以下步骤：

获取历史公共建筑能耗的影响构成要素数据；

2.根据权利要求1所述的一种公共建筑能耗预测方法，其特征在于，公共建筑能耗的影响构成要素数据包括建筑物室内照明使用数据、室内人员数据、室外干球温度、室外湿球温度、室外相对湿度、室外露点温度、风速、风向、历史当前太阳辐照度、历史前一时刻的太阳辐照度及历史前一时刻的公共建筑能耗。

3.根据权利要求1所述的一种公共建筑能耗预测方法，其特征在于，采用Lasso算法对历史公共建筑能耗的影响构成要素数据进行特征提取，得到历史公共建筑能耗的主要影响指标数据的过程中，将Lasso回归优化目标模型的系数向量不为零的历史公共建筑能耗的影响构成要素数据，作为历史公共建筑能耗的主要影响指标数据。

4.根据权利要求1所述的一种公共建筑能耗预测方法，其特征在于，历史公共建筑能耗的主要影响指标数据包括建筑物室内照明使用数据、室内人员数据、室外干球温度、室外相对湿度、风速、历史当前太阳辐照度、历史前一时刻的太阳辐照度及历史前一时刻的公共建筑能耗。

5.根据权利要求1所述的一种公共建筑能耗预测方法，其特征在于，采用TSA算法对RBF神经网络的关键参量进行寻优的过程，RBF神经网络的关键参量包括中心向量、基宽向量及权值向量。

6.根据权利要求1所述的一种公共建筑能耗预测方法，其特征在于，优化后的RBF神经网络模型的表达式为：

其中，

7.根据权利要求1所述的一种公共建筑能耗预测方法，其特征在于，训练后的LSTM预测模型的表达式为：

f_t＝sigmoid(b_f+W_f,h*h_t-1+W_f,x*x_t)

i_t＝sigmoid(b_i+W_i,h*h_t-1+W_i,x*X_t)

c_t＝tanh(b_c+W_c,x*X_t+W_c,h*h_t-1)

c_t＝c_t-1*f_t+i_t*c_t

o_t＝sigmoid(b_o+W_o,h*h_t-1+W_o,x*x_t)

h_t＝o_t*tanh(c_t)

8.一种公共建筑能耗预测系统，其特征在于，包括：

9.一种公共建筑能耗预测设备，其特征在于，包括：

存储器，用于存储计算机程序；

处理器，用于执行所述计算机程序时实现如权利要求1-7任一项所述的一种公共建筑能耗预测方法的步骤。

10.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1-7任一项所述一种公共建筑能耗预测方法的步骤。