CN112001439A - 基于gbdt的商场建筑空调冷负荷预测方法、存储介质及设备 - Google Patents

基于gbdt的商场建筑空调冷负荷预测方法、存储介质及设备 Download PDF

Info

Publication number
CN112001439A
CN112001439A CN202010839514.1A CN202010839514A CN112001439A CN 112001439 A CN112001439 A CN 112001439A CN 202010839514 A CN202010839514 A CN 202010839514A CN 112001439 A CN112001439 A CN 112001439A
Authority
CN
China
Prior art keywords
model
load
prediction
cold load
prediction model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010839514.1A
Other languages
English (en)
Inventor
于军琪
周昕玮
赵安军
周敏
张万虎
张娜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian University of Architecture and Technology
Original Assignee
Xian University of Architecture and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian University of Architecture and Technology filed Critical Xian University of Architecture and Technology
Priority to CN202010839514.1A priority Critical patent/CN112001439A/zh
Publication of CN112001439A publication Critical patent/CN112001439A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • Economics (AREA)
  • Computational Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Mathematical Optimization (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Mathematical Analysis (AREA)
  • Computational Linguistics (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Probability & Statistics with Applications (AREA)
  • Development Economics (AREA)
  • Algebra (AREA)

Abstract

本发明公开了一种基于GBDT的商场建筑空调冷负荷预测方法、存储介质及设备,收集冷负荷数据,进行归一化处理作为冷负荷能耗预测;建立基于梯度提升决策树算法确定负荷预测模型;将数据预处理后的数据输入预测模型中进行训练,选用网格搜索‑交叉验证方式,对GBDT模型性能影响最大的三个超参数进行优化;通过完成预测模型参数优化,建立最终的冷负荷预测模型,根据预测模型的参数和结构获得预测的冷负荷曲线;对预测模型的预测性能进行评价,采用预测误差进行评估,真实值与预测值之间的偏差构成预测误差,完成商场建筑空调冷负荷预测。本发明具有较好的预测精度、通用性和适用性,特别适用于冷负荷周期性变化的大型公共建筑。

Description

基于GBDT的商场建筑空调冷负荷预测方法、存储介质及设备
技术领域
本发明属于商场建筑空调冷负荷预测技术领域,具体涉及一种基于梯度提升决策树(GBDT)的商场建筑空调冷负荷预测方法、存储介质及设备。
背景技术
建筑能耗在我国能源消耗中所占比例越来越高,从20世纪70年代末的10%上升到目前的28%,正在成为我国城镇生产生活的主要消耗源。我国各类型的大型公共建筑每年的能耗总量是国外发达国家同类建筑的2倍左右。因此,如何在保证人们建筑使用需求的同时,控制建筑用能的增长,实现新建建筑的节能设计,具有非常重要的意义。准确的负荷预测,有助于合理安排各种机电设备机组的起停,能够有效地降低成本,节约能耗,提高经济效益和社会效益。
目前冷负荷预测方法中人工神经网络模型、支持向量机模型以及混合模型应用广泛。商场建筑因其运行特点,冷负荷分布不均匀,节假日冷负荷需求明显高于工作日冷负荷需求,冷负荷在不同日期变化幅度大,传统的单一预测模型难以适应这种变化,组合预测模型复杂度高,实际应用受限。
发明内容
本发明所要解决的技术问题在于针对上述现有技术中的不足,提供一种基于梯度提升决策树(GBDT)的商场建筑空调冷负荷预测方法、存储介质及设备,克服了SVR模型对于工作日、节假日冷负荷分布区分度低的缺点,有效解决深度神经网络需要大量数据训练的不足。
本发明采用以下技术方案:
一种基于GBDT的商场建筑空调冷负荷预测方法,包括以下步骤:
S1、收集商场建筑空调的实时冷负荷数据,与商场建筑空调的历史冷负荷数据进行Pearson分析,筛选出Pearson相关系数在阈值内的特征作为冷负荷预测模型输入特征,对筛选的输入特征数据进行归一化处理,作为冷负荷能耗预测的输入;
S2、建立基于梯度提升决策树算法确定负荷预测模型H(x),将步骤S1归一化处理后的数据输入负荷预测模型中进行训练,优化负荷预测模型的超参数;
S3、选用网格搜索-交叉验证方式对步骤S2建立的负荷预测模型进行超参数优化;
S4、通过步骤S3完成负荷预测模型参数优化,建立最终的负荷预测模型,通过训练对冷负荷数据进行预测,根据负荷预测模型的参数和结构获得预测的冷负荷曲线;
S5、对步骤S4负荷预测模型的预测性能进行评价,采用变异系数的均方根误差CV-RMSE、平均绝对误差MAE和平方决定系数R2对结果进行评价,对比预测模型的预测值与实际值之间的差值,对GBDT网络模型采用预测误差进行评估,真实值与预测值之间的偏差构成预测误差,完成商场建筑空调的冷负荷预测。
具体的,步骤S1具体为:
S101、实时采集夏季使用冰蓄冷空调进行供冷的商场建筑实时冷负荷数据,包括室外干球温度、相对湿度、太阳辐射量、风速和逐时冷负荷数据;
S102、通过对影响模型性能的特征(Xi)与冷负荷(Yi)进行Pearson相关性分析得到相关系数,通过相关系数显示特征与冷负荷之间的相关程度,当相关系数大于设定的阈值时,将特征提取为输入特征;
S103、在进行冷负荷预测模型训练、预测前,采用0均值归一化对输入特征进行归一化处理。
进一步的,步骤S102中,第i个时刻的样本数据(Xi,Yi)间的皮尔逊相关系数r计算如下:
Figure BDA0002640930570000031
其中,Xi和Yi分别为第i个时刻的样本数据;
Figure BDA0002640930570000032
Figure BDA0002640930570000033
为样本的平均值,n为数据集的样本个数。
具体的,步骤S2具体为:
S201、采用梯度提升决策树算法表示的回归树作为基学习器;
S202、强学习器生成的第一步是初始化CART基学习器构建初始模型,确定使损失函数L最小化的常数值C;
S203、在完成m次迭代后,得到最终的负荷预测模型H(x)。
具体的,步骤S203中,负荷预测模型H(x)如下:
Figure BDA0002640930570000034
其中,h0(x)为初始化CART基学习器构建的初始模型,M为表示特征空间划分的单元个数,J为回归树叶子节点的个数,Cmj为通过线性搜索的方式从中寻找使损失函数L达到最小值的预测值,I()为指示函数,如果x属于Qmj区域,则I()为1,相反,如果x不属于Qmj区域,则I()为0,Qmj为对应叶子节点的区域。
具体的,步骤S3中,对GBDT模型性能影响最大的三个超参数:树的数量N、模型的学习率ε、模型的复杂度C进行优化,通过网格搜索确定设定条件下所有的超参数取值组合,再对每一个超参数组合的GBDT模型进行交叉校验,以R2作为交叉校验评价指标,选择预测性能最优的超参数组合及取值;将归一化处理后的包含时间、温度、湿度和太阳辐射、历史冷负荷的输入向量输入到GBDT网络模型中,进行负荷预测模型训练;对训练样本进行训练以调节负荷预测模型的模型参数N、ε、C,达到结束训练的搜索数后保存模型参数。
进一步的,超参数取值组合为N=400,ε=0.1,C=7。
具体的,步骤S5中,变异系数的均方根误差CV-RMSE、平均绝对误差MAE和平方决定系数R2具体为:
Figure BDA0002640930570000045
Figure BDA0002640930570000041
Figure BDA0002640930570000042
其中,yi
Figure BDA0002640930570000043
分别为第i个时刻的实际负荷值和负荷预测值;
Figure BDA0002640930570000044
为空调冷负荷真实值的平均值,n为所有测试集的样本个数。
本发明的另一技术方案是,一种存储一个或多个程序的计算机可读存储介质,所述一个或多个程序包括指令,所述指令当由计算设备执行时,使得所述计算设备执行根据所述的方法中的任一方法。
本发明的另一技术方案是,一种计算设备,包括:
一个或多个处理器、存储器及一个或多个程序,其中一个或多个程序存储在所述存储器中并被配置为所述一个或多个处理器执行,所述一个或多个程序包括用于执行所述的方法中的任一方法的指令。
与现有技术相比,本发明至少具有以下有益效果:
本发明提供了一种基于GBDT的商场建筑空调冷负荷预测方法,针对商场建筑冷负荷分布不均匀,冷负荷在不同日期变化幅度大,传统的单一预测模型难以适应这种变化,组合预测模型复杂度高,实际应用受限这一问题,提出了基于GBDT的商场建筑空调冷负荷预测方法。利用集成学习技术的优点,灵活处理各种类型的数据,包括连续值和离散值,在相对少的调参时间情况下,预测的准备率也可以比较高。采用GBDT模型克服了SVR模型对于工作日、节假日冷负荷分布区分度低的缺点,也有效解决了深度神经网络需要大量数据训练的不足。
进一步的,对所选取的数据进行缺失和异常数据的弥补处理,可以有效解决数据可靠性的问题,为避免输入层参数数量级不同所带来的预测误差,对输入数据进行归一化处理,可以有效解决由于数据误差所带来的网络模型的预测误差。
进一步的,通过步骤S102对影响模型性能的特征(Xi)与冷负荷(Yi)进行Pearson相关性分析,筛选冷负荷预测模型输入特征可以在保证特征信息完整的情况下降低特征维度,避免特征维度过低导致的特征信息丢失以及预测模型输入特征维度过高产生的信息冗余,引入干扰。
进一步的,采用梯度提升决策树算法构建冷负荷预测模型可以使模型的预测结果随着每个CART树的建立一步步逼近真实值,逐步提高模型的预测精度。
进一步的,参数数量少,搜索维度低,且模型容易根据经验获得参数的大概取值范围,粒子群算法(PSO)容易造成资源浪费,所以并不适合本发明中GBDT模型的参数寻优。采用网格搜索-交叉验证方式,对GBDT模型性能影响最大的三个超参数:树的数量(N)、模型的学习率(ε)、模型的复杂度(C)进行优化,选择预测性能最优的超参数组合及取值,可以减少资源浪费。
进一步的,超参数取值组合为N=400,ε=0.1,C=7时,模型的R2最大,模型的预测性能最优。
进一步的,使用变异系数的均方根误差(CV-RMSE)对预测模型精度进行评估既可以消除二个数字序列值平均水平不同对对比离散程度的影响,还可消除二个序列因为量纲单位不同而造成的评价对比影响,可以更完美地反映数列变异程度的大小,使用平均绝对误差(MAE)能更好地反映预测值误差的实际情况。
综上所述,本发明方法准确地预测商场建筑冷负荷,预测精度高于深度神经网络预测模型和支持向量回归预测模型的精度,具有较好的预测精度、通用性和适用性,特别适用于冷负荷周期性变化的大型公共建筑,是冰蓄冷空调系统冷负荷预测控制的有效技术,提供的冷负荷预测数据对节能规划和节能规划更为有用。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
图1为连续一周冷负荷变化图;
图2为相关性分析结果图,其中,(a)为室外干球温度相关分析结果,(b)为太阳辐射量相关分析结果,(c)为历史冷负荷相关分析结果,(d)为相对湿度相关分析结果;
图3为本发明所述方法的流程框图;
图4为DNN、SVM、GBDT预测结果对比图;
图5为8月3日与8月4日预测结果放大效果对比图。
具体实施方式
本发明提供了一种基于梯度提升决策树(GBDT)的商场建筑空调冷负荷预测方法,首先收集原始数据,原始数据集包括室外干球温度、相对湿度、太阳辐射量、风速、逐时冷负荷数据;对商场的空调能耗影响因素进行分析,即对建筑的当前冷负荷与建筑的历史冷负荷、室外干球温度、相对湿度、太阳辐射量、风速进行Pearson分析,筛选冷负荷预测模型输入特征;在进行模型训练、预测前,对输入特征进行归一化处理,这里运用的是0均值归一化方法来对输入特征进行归一化处理;根据样本集合建立初始模型,之后在损失函数负梯度的方向上构建CART回归树,每次新构建的CART树的输出结果都会对当前模型的预测结果进行修正;选用网格搜索-交叉验证方式,对GBDT模型性能影响最大的三个超参数:树的数量N、模型的学习率ε、模型的复杂度C进行优化,通过网格搜索确定设定条件下所有的超参数取值组合,再对每一个超参数组合的GBDT模型进行交叉校验,以R2作为交叉校验评价指标,选择预测性能最优的超参数组合及取值,建立负荷预测模型;采用变异系数的均方根误差CV-RMSE、平均绝对误差MAE和平方决定系数R2来评价预测模型的性能,完成空调冷负荷预测。
请参阅图3,本发明一种基于梯度提升决策树(GBDT)的商场建筑空调冷负荷预测方法,包括以下步骤:
S1、收集商场建筑空调的冷负荷数据(包括历史冷负荷、室外干球温度、相对湿度、太阳辐射量、风速等),对商场建筑空调的当前冷负荷与建筑的历史冷负荷、室外干球温度、相对湿度、太阳辐射量、风速进行Pearson分析,筛选冷负荷预测模型输入特征。对处理后的能耗数据进行归一化处理,作为冷负荷能耗预测;
S101、所使用的数据集来自某商场的实时监测数据,该商场在夏季使用冰蓄冷空调进行供冷。原始数据集包括室外干球温度、相对湿度、太阳辐射量、风速、逐时冷负荷数据,自5月1日记录至8月31日。因为冰蓄冷空调夜间储冰,日间制冷,所以该商场建筑的建筑能耗监测平台每日数据由8点开始记录,22点结束记录,记录时间间隔为1小时。原始数据集部分数据见表1。原始数据集内连续一周的冷负荷分布如图1所示。
表1原始数据部分内容
Figure BDA0002640930570000081
S102、通过对影响模型性能的特征进行Pearson相关性分析,可以得到相关系数,相关系数显示了该特征与冷负荷之间的相关程度,当相关系数大于设定的阈值时,就将该特征提取为输入特征。表2表示对本研究使用的原始数据集中不同物理量与冷负荷之间的皮尔逊相关性分析结果。选取相关系数阈值为0.4,室外干球温度皮尔逊相关系数为0.563,相对湿度的的皮尔逊相关系数为-0.312,太阳辐射量皮尔逊相关系数为0.745,风速的皮尔逊相关系数为0.135,结果表明室外干球温度、太阳辐射量、相对湿度与商场建筑冰蓄冷空调系统的冷负荷之间呈现较强的相关性。
两种样本(Xi,Yi)间的皮尔逊相关系数计算公式如下:
Figure BDA0002640930570000091
其中,Xi和Yi分别为第i个时刻的样本数据;
Figure BDA0002640930570000092
Figure BDA0002640930570000093
为样本的平均值,n为数据集的样本个数。
表2物理量与冷负荷相关性分析
Figure BDA0002640930570000094
图2分别是历史室外干球温度、历史太阳辐射量、历史冷负荷和历史相对湿度与冷负荷值之间皮尔逊相关性分析的结果。分别选取皮尔逊相关性系数的阈值为0.5、0.65、0.8和0.4。t(T)、t(SR)、t-1(SR)、t-2(SR)、t-1(CL)、t-2(CL)和t(RH)被用作本次研究中预测模型的输入特征。
S103、因为模型输入特征的单位、数值范围不同,所以在进行模型训练、预测前,要先对输入特征进行归一化处理,本发明采用0均值归一化被用来对输入特征进行归一化处理,经过处理的数据符合标准正态分布,即均值为0,标准差为1,具体公式为:
Figure BDA0002640930570000095
其中,x为输入特征,μ为输入特征的均值,δ为输入特征的标准差。
S2、基于梯度提升决策树算法的负荷预测模型为:
Figure BDA0002640930570000101
其中,h0(x)为初始化CART基学习器构建的初始模型,M为表示特征空间划分的单元个数,即模型中包含CART回归树的个数,J为回归树叶子节点的个数,Qmj为其对应的叶子节点的区域,Cmj为通过线性搜索的方式从中寻找使损失函数L达到最小值的预测值,I()为指示函数,如果x属于Qmj区域则I()为1,相反,如果x不属于Qmj区域则为0。
基于梯度提升决策树算法的负荷预测方法流程如图3所示,具体为:
S201、梯度提升决策树算法以下式表示的回归树作为基学习器:
Figure BDA0002640930570000102
其中,D={(xi,yi)},(i=1,2,3,...,n)表示使用到的训练样本,M表示特征空间划分的单元个数,
Figure BDA0002640930570000103
表示每一个单元上的一个最优输出,Rm表示切分单元。
S202、强学习器生成的第一步是初始化CART基学习器构建初始模型,确定使损失函数L最小化的常数值C:
Figure BDA0002640930570000104
其中,
Figure BDA0002640930570000105
对初始模型进行m次迭代,m=1,2,3...M。
计算损失函数L的负梯度rmi如下:
Figure BDA0002640930570000106
其中,D={(xi,yi)},i=1,2,3...n,表示使用到的训练样本,hm-1(xi)表示前一轮迭代后第i个特征的回归预测值。
利用(xi,rmi)拟合出第m棵CART回归树,其对应的叶子节点的区域可以表示为Qmj(j=1,2,3...j),J表示叶子节点的个数。
对于叶子节点区域Rmj所代表的预测值,通过线性搜索的方式从中寻找使损失函数L达到最小值的预测值Cmj
Figure BDA0002640930570000111
利用新的CART回归树Cmj,对负荷预测模型更新,得到新的强学习器hm(x):
Figure BDA0002640930570000112
S203、在完成m次迭代后,可以得到最终的负荷预测模型H(x):
Figure BDA0002640930570000113
S3、选用网格搜索-交叉验证方式,对GBDT模型性能影响最大的三个超参数:树的数量N、模型的学习率ε、模型的复杂度C进行优化,通过网格搜索确定设定条件下所有的超参数取值组合,再对每一个超参数组合的GBDT模型进行交叉校验,以R2作为交叉校验评价指标,选择预测性能最优的超参数组合及取值。
表3是GBDT模型超参数的网格搜索取值范围以及搜索步长;起始搜索值为50,结束搜索值为400,搜索步长为10;起始搜索值为0.01,结束搜索值为0.3,搜索步长为0.01;起始搜索值为3,结束搜索值为10,搜索步长为1。
表3超参数的网格搜索
Figure BDA0002640930570000114
Figure BDA0002640930570000121
将归一化处理后的包含时间、温度、湿度和太阳辐射、历史冷负荷的输入向量输入到网络模型中,进行模型训练;对训练样本进行训练以调节预测模型的模型参数:(N、ε、C),达到结束训练的搜索数后保存模型参数。
表4是对本研究使用的GBDT模型进行网格搜索-交叉验证的结果。从表中信息可以知道,在不同的参数取值组合下,模型的预测性能不同。N在数量为400之前,模型的R2随N的增大,但是当N>400之后,N对模型的R2影响变得不明显。ε越小,N越大,这与之前的分析相符。在其他两个参数一定的情况下,C越大,模型的R2越大,但是C的值变化至7以后,R2的变化不明显。最终选择最优的超参数取值组合为N=400,ε=0.1,C=7。
表4超参数搜索部分结果
Figure BDA0002640930570000122
Figure BDA0002640930570000131
S4、通过步骤S3,完成预测模型参数优化,冷负荷预测模型建立。通过训练对冷负荷数据进行预测,在得出预测模型的参数以及结构后,便可获得预测的冷负荷曲线,如图4、图5所示,图4为不同算法的负荷预测结果对比,本实施例选用的是DNN、SVM和GBDT预测结果进行对比,图5为8月3日与8月4日预测结果放大效果对比图。
S5、对模型的预测性能进行评价,采用变异系数的均方根误差(CV-RMSE)、平均绝对误差(MAE)和平方决定系数(R2)对结果进行评价,对比预测模型的预测值与实际值之间的差值,对GBDT网络模型采用预测误差进行评估,真实值与预测值之间的偏差构成预测误差。
变异系数的均方根误差(CV-RMSE)、平均绝对误差(MAE)和平方决定系数(R2)具体为:
Figure BDA0002640930570000132
Figure BDA0002640930570000133
Figure BDA0002640930570000134
其中,yi
Figure BDA0002640930570000135
分别为第i个时刻的实际负荷值和负荷预测值;
Figure BDA0002640930570000136
为空调冷负荷真实值的平均值,n为所有测试集的样本个数。CV-RMSE在之前的研究中被认为是合理的统计评价指标,日前的预测模型CV-RMSE要求低于30%,日内的预测模型CV-RMSE要求低于10%。MAE反映了模型预测的冷负荷与实际冷负荷之间的绝对误差。R2的值越接近1,模型的预测性能越好,R2的值在之前的研究中被认为高于0.97是满足实际应用的。
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中的描述和所示的本发明实施例的组件可以通过各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了验证GBDT模型在冷负荷预测中的优势,使用支持向量机、深度神经网络和本发明中使用的GBDT预测模型进行对比。在本实施例中使用的DNN模型的隐藏层为4层,每层神经元数量分别为15、15、30、15,迭代次数为100次;使用粒子群优化算法(PSO)来确定SVR模型超参数的具体取值,SVR负荷预测模型的超参数优化结果见表5。
表5 SVR的超参数
Figure BDA0002640930570000141
表6是DNN、SVR、GBDT三种冷负荷预测模型评价指标对比结果。
表6 SVM、DNN、GBDT的预测性能
Figure BDA0002640930570000151
从表6可以得出,使用本发明方法与传统的DNN与SVR预测方法相比,预测准确率有了较大的改善。
综上所述,本发明一种基于GBDT的商场建筑空调冷负荷预测方法,针对商场建筑冷负荷分布不均匀,传统的单一预测模型难以适应这种变化,组合预测模型复杂度高,实际应用受限这一问题,引入了基于梯度提升决策树预测模型,以及GBDT在训练网络模型参数时使用网格搜索-交叉验证训练方法,在每次的迭代中,通过网格搜索确定设定条件下所有的超参数取值组合,再对每一个超参数组合的GBDT模型进行交叉校验,以R2作为交叉校验评价指标,选择预测性能最优的超参数组合及取值。由于梯度提升决策树算法利用了集成学习技术的优点,可以灵活处理各种类型的数据,包括连续值和离散值,在相对少的调参时间情况下,预测的准备率也可以比较高。实验结果表明,用本文所提出的方法,不管是在预测精度还是在时间复杂度上来说,都较传统的SVR和DNN预测模型好,克服了SVR模型对于工作日、节假日冷负荷分布区分度低的缺点,也有效解决了深度神经网络需要大量数据训练的不足。是一种有效的商场建筑空调冷负荷预测方法。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上内容仅为说明本发明的技术思想,不能以此限定本发明的保护范围,凡是按照本发明提出的技术思想,在技术方案基础上所做的任何改动,均落入本发明权利要求书的保护范围之内。

Claims (10)

1.一种基于GBDT的商场建筑空调冷负荷预测方法,其特征在于,包括以下步骤:
S1、收集商场建筑空调的实时冷负荷数据,与商场建筑空调的历史冷负荷数据进行Pearson分析,筛选出Pearson相关系数在阈值内的特征作为冷负荷预测模型输入特征,对筛选的输入特征数据进行归一化处理,作为冷负荷能耗预测的输入;
S2、建立基于梯度提升决策树算法确定负荷预测模型H(x),将步骤S1归一化处理后的数据输入负荷预测模型中进行训练,优化负荷预测模型的超参数;
S3、选用网格搜索-交叉验证方式对步骤S2建立的负荷预测模型进行超参数优化;
S4、通过步骤S3完成负荷预测模型参数优化,建立最终的负荷预测模型,通过训练对冷负荷数据进行预测,根据负荷预测模型的参数和结构获得预测的冷负荷曲线;
S5、对步骤S4负荷预测模型的预测性能进行评价,采用变异系数的均方根误差CV-RMSE、平均绝对误差MAE和平方决定系数R2对结果进行评价,对比预测模型的预测值与实际值之间的差值,对GBDT网络模型采用预测误差进行评估,真实值与预测值之间的偏差构成预测误差,完成商场建筑空调的冷负荷预测。
2.根据权利要求1所述的基于GBDT的商场建筑空调冷负荷预测方法,其特征在于,步骤S1具体为:
S101、实时采集夏季使用冰蓄冷空调进行供冷的商场建筑实时冷负荷数据,包括室外干球温度、相对湿度、太阳辐射量、风速和逐时冷负荷数据;
S102、通过对影响模型性能的特征(Xi)与冷负荷(Yi)进行Pearson相关性分析得到相关系数,通过相关系数显示特征与冷负荷之间的相关程度,当相关系数大于设定的阈值时,将特征提取为输入特征;
S103、在进行冷负荷预测模型训练、预测前,采用0均值归一化对输入特征进行归一化处理。
3.根据权利要求2所述的基于GBDT的商场建筑空调冷负荷预测方法,其特征在于,步骤S102中,第i个时刻的样本数据(Xi,Yi)间的皮尔逊相关系数r计算如下:
Figure FDA0002640930560000021
其中,Xi和Yi分别为第i个时刻的样本数据;
Figure FDA0002640930560000022
Figure FDA0002640930560000023
为样本的平均值,n为数据集的样本个数。
4.根据权利要求1所述的基于GBDT的商场建筑空调冷负荷预测方法,其特征在于,步骤S2具体为:
S201、采用梯度提升决策树算法表示的回归树作为基学习器;
S202、强学习器生成的第一步是初始化CART基学习器构建初始模型,确定使损失函数L最小化的常数值C;
S203、在完成m次迭代后,得到最终的负荷预测模型H(x)。
5.根据权利要求1所述的基于GBDT的商场建筑空调冷负荷预测方法,其特征在于,步骤S203中,负荷预测模型H(x)如下:
Figure FDA0002640930560000024
其中,h0(x)为初始化CART基学习器构建的初始模型,M为表示特征空间划分的单元个数,J为回归树叶子节点的个数,Cmj为通过线性搜索的方式从中寻找使损失函数L达到最小值的预测值,I()为指示函数,如果x属于Qmj区域,则I()为1,相反,如果x不属于Qmj区域,则I()为0,Qmj为对应叶子节点的区域。
6.根据权利要求1所述的基于GBDT的商场建筑空调冷负荷预测方法,其特征在于,步骤S3中,对GBDT模型性能影响最大的三个超参数:树的数量N、模型的学习率ε、模型的复杂度C进行优化,通过网格搜索确定设定条件下所有的超参数取值组合,再对每一个超参数组合的GBDT模型进行交叉校验,以R2作为交叉校验评价指标,选择预测性能最优的超参数组合及取值;将归一化处理后的包含时间、温度、湿度和太阳辐射、历史冷负荷的输入向量输入到GBDT网络模型中,进行负荷预测模型训练;对训练样本进行训练以调节负荷预测模型的模型参数N、ε、C,达到结束训练的搜索数后保存模型参数。
7.根据权利要求6所述的基于GBDT的商场建筑空调冷负荷预测方法,其特征在于,超参数取值组合为N=400,ε=0.1,C=7。
8.根据权利要求1所述的基于GBDT的商场建筑空调冷负荷预测方法,其特征在于,步骤S5中,变异系数的均方根误差CV-RMSE、平均绝对误差MAE和平方决定系数R2具体为:
Figure FDA0002640930560000031
Figure FDA0002640930560000032
Figure FDA0002640930560000033
其中,yi
Figure FDA0002640930560000041
分别为第i个时刻的实际负荷值和负荷预测值;
Figure FDA0002640930560000042
为空调冷负荷真实值的平均值,n为所有测试集的样本个数。
9.一种存储一个或多个程序的计算机可读存储介质,其特征在于,所述一个或多个程序包括指令,所述指令当由计算设备执行时,使得所述计算设备执行根据权利要求1至8所述的方法中的任一方法。
10.一种计算设备,其特征在于,包括:
一个或多个处理器、存储器及一个或多个程序,其中一个或多个程序存储在所述存储器中并被配置为所述一个或多个处理器执行,所述一个或多个程序包括用于执行根据权利要求1至8所述的方法中的任一方法的指令。
CN202010839514.1A 2020-08-19 2020-08-19 基于gbdt的商场建筑空调冷负荷预测方法、存储介质及设备 Pending CN112001439A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010839514.1A CN112001439A (zh) 2020-08-19 2020-08-19 基于gbdt的商场建筑空调冷负荷预测方法、存储介质及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010839514.1A CN112001439A (zh) 2020-08-19 2020-08-19 基于gbdt的商场建筑空调冷负荷预测方法、存储介质及设备

Publications (1)

Publication Number Publication Date
CN112001439A true CN112001439A (zh) 2020-11-27

Family

ID=73472757

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010839514.1A Pending CN112001439A (zh) 2020-08-19 2020-08-19 基于gbdt的商场建筑空调冷负荷预测方法、存储介质及设备

Country Status (1)

Country Link
CN (1) CN112001439A (zh)

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112598181A (zh) * 2020-12-23 2021-04-02 国网河北省电力有限公司经济技术研究院 负荷预测方法、装置、设备和存储介质
CN112614010A (zh) * 2020-12-07 2021-04-06 国网北京市电力公司 负荷预测方法及装置、存储介质及电子装置
CN112614006A (zh) * 2020-11-30 2021-04-06 国网北京市电力公司 负荷预测方法、装置、计算机可读存储介质以及处理器
CN112711791A (zh) * 2021-01-05 2021-04-27 浙江大学 基于神经网络弹性权重固化的建筑用能负荷实时预测方法
CN112923435A (zh) * 2021-03-22 2021-06-08 瑞纳智能设备股份有限公司 一种基于人工智能和优化算法的集中供热二次侧调控方法
CN113033016A (zh) * 2021-04-12 2021-06-25 北京信息科技大学 基于混合式的中央空调负荷预测方法和装置
CN113159394A (zh) * 2021-03-30 2021-07-23 国网河北省电力有限公司雄安新区供电公司 一种智能配电网分区冷热负荷预测方法及装置
CN113468794A (zh) * 2020-12-29 2021-10-01 重庆大学 一种小型密闭空间温湿度预测及反向优化方法
CN113496315A (zh) * 2021-09-08 2021-10-12 广东电网有限责任公司湛江供电局 基于分位数梯度提升决策树的负荷区间预测方法及系统
CN113685962A (zh) * 2021-10-26 2021-11-23 南京群顶科技有限公司 一种基于相关性分析的机房温度高效控制方法及其系统
CN113722988A (zh) * 2021-08-18 2021-11-30 扬州大学 定量构效关系模型预测有机物pdms膜-空气分配系数的方法
CN114399097A (zh) * 2021-12-29 2022-04-26 广东电网有限责任公司 基于多源异构数据的杆塔受损预测方法、装置及存储介质
CN114819380A (zh) * 2022-05-12 2022-07-29 福州大学 基于模型融合的电网母线负荷预测方法
CN114811858A (zh) * 2022-03-22 2022-07-29 国网上海市电力公司 一种空调负荷在线学习方法
CN115329661A (zh) * 2022-07-22 2022-11-11 上海环保(集团)有限公司 一种智能投药模型建模、智能投药体系创建、投药方法
CN116780524A (zh) * 2023-06-30 2023-09-19 陕西广林汇程能源科技有限公司 一种基于lstm深度学习的工业企业短期负荷预测方法
CN116893621A (zh) * 2023-09-11 2023-10-17 北京城建智控科技股份有限公司 车站通风系统的控制方法及装置、电子设备及存储介质
CN117236522A (zh) * 2023-11-10 2023-12-15 四川智源能诚售电有限公司 一种电力能耗管理方法、系统、电子设备及介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008027150A (ja) * 2006-07-20 2008-02-07 Nippon Steel Corp 製造負荷予測装置、製造負荷予測方法、コンピュータプログラム、及びコンピュータ読み取り可能な記憶媒体
WO2015172560A1 (zh) * 2014-05-16 2015-11-19 华南理工大学 基于bp神经网络的中央空调冷负荷的预测方法
CN106650037A (zh) * 2016-11-30 2017-05-10 国网江苏省电力公司盐城供电公司 一种基于支持向量机回归的避雷器状态诊断方法
CN108954680A (zh) * 2018-07-13 2018-12-07 电子科技大学 一种基于运行数据的中央空调能耗预测方法
CN109543203A (zh) * 2017-09-22 2019-03-29 山东建筑大学 一种基于随机森林的建筑冷热负荷预测方法
CN110110388A (zh) * 2019-04-12 2019-08-09 天津大学 基于数据前处理及小波分解的建筑空调负荷预测方法
CN110929347A (zh) * 2019-10-25 2020-03-27 东北大学 一种基于梯度提升树模型的热连轧带钢凸度预测方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008027150A (ja) * 2006-07-20 2008-02-07 Nippon Steel Corp 製造負荷予測装置、製造負荷予測方法、コンピュータプログラム、及びコンピュータ読み取り可能な記憶媒体
WO2015172560A1 (zh) * 2014-05-16 2015-11-19 华南理工大学 基于bp神经网络的中央空调冷负荷的预测方法
CN106650037A (zh) * 2016-11-30 2017-05-10 国网江苏省电力公司盐城供电公司 一种基于支持向量机回归的避雷器状态诊断方法
CN109543203A (zh) * 2017-09-22 2019-03-29 山东建筑大学 一种基于随机森林的建筑冷热负荷预测方法
CN108954680A (zh) * 2018-07-13 2018-12-07 电子科技大学 一种基于运行数据的中央空调能耗预测方法
CN110110388A (zh) * 2019-04-12 2019-08-09 天津大学 基于数据前处理及小波分解的建筑空调负荷预测方法
CN110929347A (zh) * 2019-10-25 2020-03-27 东北大学 一种基于梯度提升树模型的热连轧带钢凸度预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
毕云帆;张健;胥晓晖;孙文慧;张智晟;: "基于梯度提升决策树的电力短期负荷预测模型", 青岛大学学报(工程技术版), no. 03, 31 August 2018 (2018-08-31), pages 71 - 74 *

Cited By (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112614006A (zh) * 2020-11-30 2021-04-06 国网北京市电力公司 负荷预测方法、装置、计算机可读存储介质以及处理器
CN112614010A (zh) * 2020-12-07 2021-04-06 国网北京市电力公司 负荷预测方法及装置、存储介质及电子装置
CN112598181A (zh) * 2020-12-23 2021-04-02 国网河北省电力有限公司经济技术研究院 负荷预测方法、装置、设备和存储介质
CN113468794A (zh) * 2020-12-29 2021-10-01 重庆大学 一种小型密闭空间温湿度预测及反向优化方法
CN113468794B (zh) * 2020-12-29 2023-05-19 重庆大学 一种小型密闭空间温湿度预测及反向优化方法
CN112711791B (zh) * 2021-01-05 2022-04-19 浙江大学 基于神经网络弹性权重固化的建筑用能负荷实时预测方法
CN112711791A (zh) * 2021-01-05 2021-04-27 浙江大学 基于神经网络弹性权重固化的建筑用能负荷实时预测方法
CN112923435A (zh) * 2021-03-22 2021-06-08 瑞纳智能设备股份有限公司 一种基于人工智能和优化算法的集中供热二次侧调控方法
CN112923435B (zh) * 2021-03-22 2022-05-13 瑞纳智能设备股份有限公司 一种基于人工智能和优化算法的集中供热二次侧调控方法
CN113159394A (zh) * 2021-03-30 2021-07-23 国网河北省电力有限公司雄安新区供电公司 一种智能配电网分区冷热负荷预测方法及装置
CN113033016A (zh) * 2021-04-12 2021-06-25 北京信息科技大学 基于混合式的中央空调负荷预测方法和装置
CN113033016B (zh) * 2021-04-12 2021-10-22 北京信息科技大学 基于混合式的中央空调负荷预测方法和装置
CN113722988A (zh) * 2021-08-18 2021-11-30 扬州大学 定量构效关系模型预测有机物pdms膜-空气分配系数的方法
CN113722988B (zh) * 2021-08-18 2024-01-26 扬州大学 定量构效关系模型预测有机物pdms膜-空气分配系数的方法
CN113496315A (zh) * 2021-09-08 2021-10-12 广东电网有限责任公司湛江供电局 基于分位数梯度提升决策树的负荷区间预测方法及系统
CN113685962A (zh) * 2021-10-26 2021-11-23 南京群顶科技有限公司 一种基于相关性分析的机房温度高效控制方法及其系统
CN114399097A (zh) * 2021-12-29 2022-04-26 广东电网有限责任公司 基于多源异构数据的杆塔受损预测方法、装置及存储介质
CN114811858A (zh) * 2022-03-22 2022-07-29 国网上海市电力公司 一种空调负荷在线学习方法
CN114811858B (zh) * 2022-03-22 2023-11-10 国网上海市电力公司 一种空调负荷在线学习方法
CN114819380A (zh) * 2022-05-12 2022-07-29 福州大学 基于模型融合的电网母线负荷预测方法
CN115329661A (zh) * 2022-07-22 2022-11-11 上海环保(集团)有限公司 一种智能投药模型建模、智能投药体系创建、投药方法
CN116780524A (zh) * 2023-06-30 2023-09-19 陕西广林汇程能源科技有限公司 一种基于lstm深度学习的工业企业短期负荷预测方法
CN116780524B (zh) * 2023-06-30 2024-03-22 陕西广林汇程能源科技有限公司 一种基于lstm深度学习的工业企业短期负荷预测方法
CN116893621A (zh) * 2023-09-11 2023-10-17 北京城建智控科技股份有限公司 车站通风系统的控制方法及装置、电子设备及存储介质
CN116893621B (zh) * 2023-09-11 2024-01-23 北京城建智控科技股份有限公司 车站通风系统的控制方法及装置、电子设备及存储介质
CN117236522A (zh) * 2023-11-10 2023-12-15 四川智源能诚售电有限公司 一种电力能耗管理方法、系统、电子设备及介质
CN117236522B (zh) * 2023-11-10 2024-02-13 四川智源能诚售电有限公司 一种电力能耗管理方法、系统、电子设备及介质

Similar Documents

Publication Publication Date Title
CN112001439A (zh) 基于gbdt的商场建筑空调冷负荷预测方法、存储介质及设备
CN103912966B (zh) 一种地源热泵制冷系统优化控制方法
CN107730031B (zh) 一种超短期高峰负荷预测方法及其系统
CN103853106B (zh) 一种建筑能源供应设备的能耗预测参数优化方法
Xiao et al. Impacts of data preprocessing and selection on energy consumption prediction model of HVAC systems based on deep learning
CN107590562A (zh) 一种基于变权组合预测法的电力负荷短期预测方法
CN104484715A (zh) 一种基于神经网络和微粒群优化算法的建筑能耗预测方法
CN113554466A (zh) 一种短期用电量预测模型构建方法、预测方法和装置
CN111735177B (zh) 一种基于svr算法的中央空调系统冷负荷预测方法
CN112561207A (zh) 一种考虑气象因素的电网负荷预测方法、装置和电力系统
CN115470862A (zh) 动态自适应负荷预测模型组合方法
CN113762387A (zh) 一种基于混合模型预测的数据中心站多元负荷预测方法
CN114595861A (zh) 基于mstl和lstm模型的中长期电力负荷预测方法
Dong et al. Short-term building cooling load prediction model based on DwdAdam-ILSTM algorithm: A case study of a commercial building
CN116187835A (zh) 一种基于数据驱动的台区理论线损区间估算方法及系统
CN113449257A (zh) 配电网线损的预测方法、控制装置、及存储介质
CN116388150A (zh) 基于数字孪生和神经网络技术的配变短期负荷预测方法
CN116796141A (zh) 一种基于gbdt回归模型的办公建筑能耗预测方法
CN111815039A (zh) 基于天气分类的周尺度风电功率概率预测方法及系统
CN117540938B (zh) 基于td3强化学习优化的集成式建筑能耗预测方法及系统
CN109214610B (zh) 一种基于长短期记忆神经网络的饱和电力负荷预测方法
CN117408394B (zh) 电力系统的碳排放因子预测方法、装置及电子设备
CN116826745B (zh) 一种电力系统背景下的分层分区短期负荷预测方法及系统
CN110598947A (zh) 一种基于改进布谷鸟-神经网络算法的负荷预测方法
CN117634678A (zh) 基于实际运行场景的低碳园区碳排放预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination