CN112257894A - 基于数据驱动的混合建筑电耗预测方法及系统 - Google Patents

基于数据驱动的混合建筑电耗预测方法及系统 Download PDF

Info

Publication number
CN112257894A
CN112257894A CN202010935278.3A CN202010935278A CN112257894A CN 112257894 A CN112257894 A CN 112257894A CN 202010935278 A CN202010935278 A CN 202010935278A CN 112257894 A CN112257894 A CN 112257894A
Authority
CN
China
Prior art keywords
consumption data
building
energy consumption
value
power consumption
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010935278.3A
Other languages
English (en)
Inventor
陈园园
段培永
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Normal University
Original Assignee
Shandong Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Normal University filed Critical Shandong Normal University
Priority to CN202010935278.3A priority Critical patent/CN112257894A/zh
Publication of CN112257894A publication Critical patent/CN112257894A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/08Construction

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Marketing (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Primary Health Care (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Development Economics (AREA)
  • Evolutionary Biology (AREA)
  • Game Theory and Decision Science (AREA)
  • Medical Informatics (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Public Health (AREA)

Abstract

本申请公开了基于数据驱动的混合建筑电耗预测方法及系统,包括:获取混合建筑电耗数据;对建筑电耗数据进行预处理;对预处理后的建筑电耗数据进行聚类处理,得到若干类能耗数据;对聚类处理后的每一类能耗数据中每个小时能耗数据进行模态分解,基于模态分解结果,实现混合建筑电耗预测。

Description

基于数据驱动的混合建筑电耗预测方法及系统
技术领域
本申请涉及建筑电能耗预测技术领域,特别是涉及基于数据驱动的混合建筑电耗预测方法及系统。
背景技术
本部分的陈述仅仅是提到了与本申请相关的背景技术,并不必然构成现有技术。
随着全球工业化和城市化进程的不断加快,建筑能源的需求总量不断增加。随着建筑能耗用量的不断增加,给周围环境也带来了一些负担,二氧化碳的排放,使得全球气候变暖,给人类社会和自然界带来了难以想象的灾难。因此,寻求合适的策略降低建筑能耗,是非常迫切且必要的。
目前的建筑电能耗预测方法,对一所建筑数据进行预测时往往只使用一种方法,即使通过聚类算法进行聚类后,所有的类依旧是使用同一种算法,这忽略了每类数据的线性结构不同,针对一所建筑电耗数据,一种算法是无法满足要求的。每种算法对不同的数据预测效果不同,单单使用一种会降低预测的准确率。同时。预测前的数据预处理时极其重要的,目前最多的数据预处理只是简单的对数据进行归一化,只进行归一化的前提是采集的数据是完全准确的。但是,却忽略了在数据采集过程中,会受到天气,断电,设备准确率等情况的影响,导致产生的空值的数据,部分数据连续循环,离群数据等等,因此,只简单地进行标准化预处理的预测结果往往也不准确。
发明内容
为了解决现有技术的不足,本申请提供了基于数据驱动的混合建筑电耗预测方法及系统;解决数据前期可能存在的异常问题与适合该类数据的最佳预测算法的选择问题,来最大限度的提高预测的准确率。
第一方面,本申请提供了基于数据驱动的混合建筑电耗预测方法;
基于数据驱动的混合建筑电耗预测方法,包括:
获取混合建筑电耗数据;
对建筑电耗数据进行预处理;
对预处理后的建筑电耗数据进行聚类处理,得到若干类能耗数据;
对聚类处理后的每一类能耗数据中每个小时能耗数据进行模态分解,基于模态分解结果,实现混合建筑电耗预测。
第二方面,本申请提供了基于数据驱动的混合建筑电耗预测系统;
基于数据驱动的混合建筑电耗预测系统,包括:
获取模块,其被配置为:获取混合建筑电耗数据;
预处理模块,其被配置为:对建筑电耗数据进行预处理;
聚类模块,其被配置为:对预处理后的建筑电耗数据进行聚类处理,得到若干类能耗数据;
预测模块,其被配置为:对聚类处理后的每一类能耗数据中每个小时能耗数据进行模态分解,基于模态分解结果,实现混合建筑电耗预测。
第三方面,本申请还提供了一种电子设备,包括:一个或多个处理器、一个或多个存储器、以及一个或多个计算机程序;其中,处理器与存储器连接,上述一个或多个计算机程序被存储在存储器中,当电子设备运行时,该处理器执行该存储器存储的一个或多个计算机程序,以使电子设备执行上述第一方面所述的方法。
第四方面,本申请还提供了一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成第一方面所述的方法。
第五方面,本申请还提供了一种计算机程序(产品),包括计算机程序,所述计算机程序当在一个或多个处理器上运行的时候用于实现前述第一方面任意一项的方法。
与现有技术相比,本申请的有益效果是:
解决了目前采集能耗数据都会遇到的部分问题,同时也解决了预测算法存在的不稳定性问题。通过数据的预处理,聚类,模态识别等前期步骤能大幅度的提升建筑负荷预测的准确率。对于节约建筑能耗,改善环境问题具有重大意义。
附图说明
构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。
图1是本申请实施例一的数据预处理的流程图,包括:三种异常数据的处理、聚类、模态分解;
图2是本申请实施例一的最佳模型选择的流程图;
图3是本申请实施例一的根据肘部法,不同的n值对应不同的SSE值,来选择n值;
图4(a)-图4(e)是本申请实施例一的对数据进行模态分解,分为IMF与RES;
图5(a)-图5(d)是本申请实施例一的使用混合模型对某一天的IMF,RES的分别预测,图显示是真实值与预测值的对比;
图6是本申请实施例一的对假期中的某一时刻的IMF与RES分别进行的三种预测算法的结果对比图;
图7是本申请实施例一的对工作日中的某一时刻的IMF与RES分别进行的三种预测算法的结果对比图;
图8是本申请实施例一的对日常周末中的某一时刻的IMF与RES分别进行的三种预测算法的结果对比图。
具体实施方式
应该指出,以下详细说明都是示例性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
实施例一
本实施例提供了基于数据驱动的混合建筑电耗预测方法;
如图1所示,基于数据驱动的混合建筑电耗预测方法,包括:
S101:获取混合建筑电耗数据;
S102:对建筑电耗数据进行预处理;
S103:对预处理后的建筑电耗数据进行聚类处理,得到若干类能耗数据;
S104:对聚类处理后的每一类能耗数据中每个小时能耗数据进行模态分解,基于模态分解结果,实现混合建筑电耗预测。
作为一个或多个实施例,所述S101中,获取混合建筑电耗数据;其中混合建筑电耗数据,包括:
建筑物的电能耗数据和影响建筑物电能耗数据的相关因素数据。
示例性的,所述影响建筑物电能耗数据的相关因素数据,包括:温度和湿度。
作为一个或多个实施例,所述S102中,对建筑电耗数据进行预处理;具体步骤包括:
S1021:对建筑电耗数据进行空值处理;
S1022:对建筑电耗数据进行连续重复值处理;
S1023:对建筑电耗数据进行离散异常值处理。
进一步地,所述S1021:对建筑电耗数据进行空值处理;具体步骤包括:
对空值进行识别;
对空值进行分析,是否是在设定时间范围内(例如:连续三天)连续出现;
如连续出现,则进行舍弃;
如果离散出现,则代表对于后续的预测不会产生较大影响,使用KNN算法进行填补。
应理解的,所述空值在数据采集中显示为零。
示例性的,所述对空值进行识别,是将数据中的“0”替换为“NA”,通过sum(is.na(mydata$Value))计算出每列数据的空值。借用R语言,来识别其中的空值,并对空值进行分析。
进一步地,所述S1022:对建筑电耗数据进行连续重复值处理;具体步骤包括:
对连续重复值进行识别;如果重复值小于等于三个,认为是正常值;如果重复值大于三个,则认为是连续重复值;
将连续重复值的第一个数值保留,将连续重复值中的非第一个数值予以剔除。
应理解的,所述连续重复值,是指一串连续相同的数据。
示例性的,对连续重复值进行识别;是对连续重复值使用R语言的duplicated(mydata$Value)识别。连续重复值的第一个显示为fause,其余的数值显示为true。检测fause本身以及之后的数据,是否为连续的数据。
进一步地,所述S1023:对建筑电耗数据进行离散异常值处理;具体步骤包括:
使用k-means算法对离散异常值进行识别;
不断的继续聚类,将每次聚类识别的离散异常值予以删除处理;直至没有异常值的出现;
使用KNN算法对删除的数据进行补足。
其中,KNN算法输入为连续若干天相同时刻的能耗值及其影响因素,KNN算法的k值通过对预测结果的准确率比较获得。
不同的k值对应填补后的数据不同,通过使用不同的k值填补,选取预测方法进行预测,计算MSE,比较获得最佳的k值。
进一步地,所述对离散异常值进行识别,是指使用k-means算法对离散异常值进行识别。
应理解的,所述离散异常值,为偏离正常数据范围的数据。
通过数据预处理得到了能耗预测所需的数据,包括能耗数据,以及影响能耗数据的相关因素。
进一步地,所述S103:对预处理后的建筑电耗数据进行聚类处理,得到若干类能耗数据;具体步骤包括:
计算每个聚类中样本点与样本中心的距离,取平方值相加,之后将每个聚类相加,得到SSE(sum of the squared errors,误差平方和);
随着n值增大,SSE呈下降的趋势,并逐渐趋于平稳;结果呈现肘部的趋势,取拐角处的n值。
示例性的,所述S103:对预处理后的建筑电耗数据进行聚类处理,得到若干类能耗数据;具体步骤包括:
通过聚类算法对预处理后的建筑电耗数据以天数进行聚类,聚类数为n,得到聚类结果;
聚类数n通过肘部法来获取,获取步骤包括:
k-means将数据分为n个簇,{C1,C2,C3,……Cn}。
设定Ci是数据的第i个簇,p是簇Ci中的样本点,mi是Ci的质心(Ci中所有样本的均值),SSE是所有样本的聚类误差。
Figure BDA0002671704660000071
图3显示的就是不同的n值对应不同的SSE值,画出的图形正好是一个肘部,从图中,显示n值应该取4。
当n值增大时,聚类的数目会更大,样本的划分也就更加详细。
对进行模态分解,由于实时采集的数据是比较杂乱无章的,规律性较差,因此需要加入白噪声,并进行模态分解,提升数据的规律性。分解后的数据包括IMF和RES。
作为一个或多个实施例,如图2所示,所述S104:对聚类处理后的每一类能耗数据中每个小时能耗数据进行模态分解,基于模态分解结果,实现混合建筑电耗预测;具体步骤包括:
S1041:对聚类处理后的每一类能耗数据中每个小时能耗数据进行模态分解,得到每个小时能耗数据对应的若干个本征模函数分量IMF(intrinsic mode function)和一个残差项RES(residual);
S1042:对一个小时下能耗数据的每个本征模函数分量IMF,选择对应的第一最佳预测算法;利用所选择的第一最佳预测算法,输出每个本征模函数分量IMF的最佳预测值;
S1043:对每个小时能耗数据的残差项,选择对应的第二最佳预测算法;利用所选择的第二最佳预测算法,输出所述残差项的最佳预测值;
S1044:对每个小时下的所有本征模函数分量IMF的最佳预测值与残差项的最佳预测值,进行求和;得到每个小时下的建筑电耗预测值;进而得到当前类能耗数据中,全天所有小时的建筑能耗预测值;进而得到所有类能耗数据中的建筑能耗预测值。
示例性的,所述S1041:对聚类处理后的每一类能耗数据中每个小时能耗数据进行模态分解,得到每个小时能耗数据对应的若干个本征模函数分量IMF和一个残差项RES;具体步骤包括:
对C1,C2,C3,……Cn中的每个小时分别进行模态分解,得到比较有规律性的数据结构。
对C1进行模态分解得到:
C11={IMF1,IMF2,IMF3…IMFN,RES}
C12={IMF1,IMF2,IMF3…IMFN,RES}
C13={IMF1,IMF2,IMF3…IMFN,RES}
……
C124={IMF1,IMF2,IMF3…IMFN,RES} (2)。
示例性的,所述S1042:对一个小时下能耗数据的每个本征模函数分量IMF,选择对应的第一最佳预测算法;利用所选择的第一最佳预测算法,输出每个本征模函数分量IMF的最佳预测值;具体步骤包括:
对每个小时的IMF和RES分别进行预测,选取多个预测算法(F1,F2,F3…FN)。
对于C11={IMF1,IMF2,IMF3…IMFN,RES}进行预测,得到:
IMF1的相关影响因素为t1,IMF1预测结果:
QIMF11=F1(t1)
QIMF12=F2(t1)
QIMF13=F3(t1)
……
QIMF1n=FN(t1) (3)
通过算法选择器选取适合IMF1最佳预测算法,设为BQIMF1
IMF2的相关影响因素为t2,IMF2预测结果:
QIMF21=F1(t2)
QIMF22=F2(t2)
QIMF23=F3(t2)
……
QIMF2n=FN(t2) (4)
通过算法选择器选取适合IMF2最佳预测算法,设为BQIMF2
IMF3的相关影响因素为t3,IMF3预测结果:
QIMF31=F1(t3)
QIMF32=F2(t3)
QIMF33=F3(t3)
……
QIMF3n=FN(t3) (5)
通过算法选择器选取适合IMF3最佳预测算法,设为BQIMF3
IMFN的相关影响因素为tN,IMFN预测结果:
QIMFN1=F1(tN)
QIMFN2=F2(tN)
QIMFN3=F3(tN)
……
QIMFNn=FN(tN) (6)
通过算法选择器选取适合IMFN最佳预测算法,设为BQIMFN
示例性的,S1043:对每个小时能耗数据的残差项,选择对应的第二最佳预测算法;利用所选择的第二最佳预测算法,输出所述残差项的最佳预测值;具体步骤包括:
RES的相关影响因素为t,RES预测结果:
QRES1=F1(t)
QRES2=F2(t)
QRES3=F3(t)
……
QRESn=FN(t4) (7)
通过算法选择器选取适合RES最佳预测算法,设为BQRES
S1044:对每个小时下的所有本征模函数分量IMF的最佳预测值与残差项的最佳预测值,进行求和;得到每个小时下的建筑电耗预测值;具体步骤包括:
因此,对于C11而言,得到的最佳的预测结果为:
C11=BQIMF1+BQIMF2+BQIMF3+…+BQIMFN+BQRES (8)
对于预测的每个时辰,分别采取以上方法,最终得到最佳的效果。
对数据分别进行预测,不同算法对于同一数据显示出的预测结果不同,因此为了提高预测的准确率,采用算法选择器,将各个算法预测的结果输入到模型选择器里面,与原始数据进行对比,选取适合该数据的最佳算法。
以济南市某酒店建筑的负荷数据和相关天气数据为研究对象。该酒店建筑面积为67,600平方米,为五星级。电力负荷和天气相关数据是实时收集的。
选取其中部分数据,进行数据的预处理,包括空值,连续重复数据,异常离散数据三部分内容,然后聚类,n值的确定,最后经验模态分解,然后进行最佳模型的选取。
图4(a)-图4(e)显示的是某一时刻的模态分解。初始数据规律性较差,经过模态分解后,数据被分解为IMF和RES,规律性增强。
图5(a)-图5(d)显示的对其中的IMF和RES分别进行预测,选取最佳预测算法后的结果。
图6是使用三种不同算法分别对假期中某一时刻IMF和RES进行预测,从图6可以看出,适合IMF1的最佳预测算法为BP,适合IMF2的最佳预测算法为LSTM,适合IMF3的最佳预测算法为BP,适合RES的最佳预测算法为LSTM。
图7是使用三种不同算法分别对工作日中某一时刻IMF和RES进行预测,从图7可以看出,适合IMF1的最佳预测算法为BP,适合IMF2的最佳预测算法为LSTM,适合IMF3的最佳预测算法为BP,适合RES的最佳预测算法为LSTM。
图8是使用三种不同算法分别对日常周末中某一时刻IMF和RES进行预测,从图8可以看出,适合IMF1的最佳预测算法为Lssvm,适合IMF2的最佳预测算法为Lssvm,适合IMF3的最佳预测算法为LSTM,适合RES的最佳预测算法为LSTM。
实施例二
本实施例提供了基于数据驱动的混合建筑电耗预测系统;
基于数据驱动的混合建筑电耗预测系统,包括:
获取模块,其被配置为:获取混合建筑电耗数据;
预处理模块,其被配置为:对建筑电耗数据进行预处理;
聚类模块,其被配置为:对预处理后的建筑电耗数据进行聚类处理,得到若干类能耗数据;
预测模块,其被配置为:对聚类处理后的每一类能耗数据中每个小时能耗数据进行模态分解,基于模态分解结果,实现混合建筑电耗预测。
此处需要说明的是,上述获取模块、预处理模块、聚类模块和预测模块对应于实施例一中的步骤S101至S104,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例一所公开的内容。需要说明的是,上述模块作为系统的一部分可以在诸如一组计算机可执行指令的计算机系统中执行。
上述实施例中对各个实施例的描述各有侧重,某个实施例中没有详述的部分可以参见其他实施例的相关描述。
所提出的系统,可以通过其他的方式实现。例如,以上所描述的系统实施例仅仅是示意性的,例如上述模块的划分,仅仅为一种逻辑功能划分,实际实现时,可以有另外的划分方式,例如多个模块可以结合或者可以集成到另外一个系统,或一些特征可以忽略,或不执行。
实施例三
本实施例还提供了一种电子设备,包括:一个或多个处理器、一个或多个存储器、以及一个或多个计算机程序;其中,处理器与存储器连接,上述一个或多个计算机程序被存储在存储器中,当电子设备运行时,该处理器执行该存储器存储的一个或多个计算机程序,以使电子设备执行上述实施例一所述的方法。
应理解,本实施例中,处理器可以是中央处理单元CPU,处理器还可以是其他通用处理器、数字信号处理器DSP、专用集成电路ASIC,现成可编程门阵列FPGA或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器可以包括只读存储器和随机存取存储器,并向处理器提供指令和数据、存储器的一部分还可以包括非易失性随机存储器。例如,存储器还可以存储设备类型的信息。
在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。
实施例一中的方法可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器、闪存、只读存储器、可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。为避免重复,这里不再详细描述。
本领域普通技术人员可以意识到,结合本实施例描述的各示例的单元即算法步骤,能够以电子硬件或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
实施例四
本实施例还提供了一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成实施例一所述的方法。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.基于数据驱动的混合建筑电耗预测方法,其特征是,包括:
获取混合建筑电耗数据;
对建筑电耗数据进行预处理;
对预处理后的建筑电耗数据进行聚类处理,得到若干类能耗数据;
对聚类处理后的每一类能耗数据中每个小时能耗数据进行模态分解,基于模态分解结果,实现混合建筑电耗预测。
2.如权利要求1所述的方法,其特征是,获取混合建筑电耗数据;其中混合建筑电耗数据,包括:
建筑物的电能耗数据和影响建筑物电能耗数据的相关因素数据;
所述影响建筑物电能耗数据的相关因素数据,包括:温度和湿度。
3.如权利要求1所述的方法,其特征是,对建筑电耗数据进行预处理;具体步骤包括:
对建筑电耗数据进行空值处理;
对建筑电耗数据进行连续重复值处理;
对建筑电耗数据进行离散异常值处理。
4.如权利要求3所述的方法,其特征是,对建筑电耗数据进行空值处理;具体步骤包括:
对空值进行识别;
对空值进行分析,是否是在设定时间范围内连续出现;
如连续出现,则进行舍弃;
如果离散出现,则代表对于后续的预测不会产生较大影响,使用KNN算法进行填补。
5.如权利要求3所述的方法,其特征是,对建筑电耗数据进行连续重复值处理;具体步骤包括:
对连续重复值进行识别;如果重复值小于等于三个,认为是正常值;如果重复值大于三个,则认为是连续重复值;
将连续重复值的第一个数值保留,将连续重复值中的非第一个数值予以剔除。
6.如权利要求3所述的方法,其特征是,对建筑电耗数据进行离散异常值处理;具体步骤包括:
使用k-means算法对离散异常值进行识别;
不断的继续聚类,将每次聚类识别的离散异常值予以删除处理;直至没有异常值的出现;
使用KNN算法对删除的数据进行补足;
或者,
KNN算法输入为连续若干天相同时刻的能耗值及其影响因素,KNN算法的k值通过对预测结果的准确率比较获得;不同的k值对应填补后的数据不同,通过使用不同的k值填补,选取预测方法进行预测,计算MSE,比较获得最佳的k值;
或者,
对预处理后的建筑电耗数据进行聚类处理,得到若干类能耗数据;具体步骤包括:
计算每个聚类中样本点与样本中心的距离,取平方值相加,之后将每个聚类相加,得到SSE;
随着n值增大,SSE呈下降的趋势,并逐渐趋于平稳;结果呈现肘部的趋势,取拐角处的n值。
7.如权利要求1所述的方法,其特征是,对聚类处理后的每一类能耗数据中每个小时能耗数据进行模态分解,基于模态分解结果,实现混合建筑电耗预测;具体步骤包括:
对聚类处理后的每一类能耗数据中每个小时能耗数据进行模态分解,得到每个小时能耗数据对应的若干个本征模函数分量IMF和一个残差项RES;
对一个小时下能耗数据的每个本征模函数分量IMF,选择对应的第一最佳预测算法;利用所选择的第一最佳预测算法,输出每个本征模函数分量IMF的最佳预测值;
对每个小时能耗数据的残差项,选择对应的第二最佳预测算法;利用所选择的第二最佳预测算法,输出所述残差项的最佳预测值;
对每个小时下的所有本征模函数分量IMF的最佳预测值与残差项的最佳预测值,进行求和;得到每个小时下的建筑电耗预测值;进而得到当前类能耗数据中,全天所有小时的建筑能耗预测值;进而得到所有类能耗数据中的建筑能耗预测值。
8.基于数据驱动的混合建筑电耗预测系统,其特征是,包括:
获取模块,其被配置为:获取混合建筑电耗数据;
预处理模块,其被配置为:对建筑电耗数据进行预处理;
聚类模块,其被配置为:对预处理后的建筑电耗数据进行聚类处理,得到若干类能耗数据;
预测模块,其被配置为:对聚类处理后的每一类能耗数据中每个小时能耗数据进行模态分解,基于模态分解结果,实现混合建筑电耗预测。
9.一种电子设备,其特征是,包括:一个或多个处理器、一个或多个存储器、以及一个或多个计算机程序;其中,处理器与存储器连接,上述一个或多个计算机程序被存储在存储器中,当电子设备运行时,该处理器执行该存储器存储的一个或多个计算机程序,以使电子设备执行上述权利要求1-7任一项所述的方法。
10.一种计算机可读存储介质,其特征是,用于存储计算机指令,所述计算机指令被处理器执行时,完成权利要求1-7任一项所述的方法。
CN202010935278.3A 2020-09-08 2020-09-08 基于数据驱动的混合建筑电耗预测方法及系统 Pending CN112257894A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010935278.3A CN112257894A (zh) 2020-09-08 2020-09-08 基于数据驱动的混合建筑电耗预测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010935278.3A CN112257894A (zh) 2020-09-08 2020-09-08 基于数据驱动的混合建筑电耗预测方法及系统

Publications (1)

Publication Number Publication Date
CN112257894A true CN112257894A (zh) 2021-01-22

Family

ID=74232201

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010935278.3A Pending CN112257894A (zh) 2020-09-08 2020-09-08 基于数据驱动的混合建筑电耗预测方法及系统

Country Status (1)

Country Link
CN (1) CN112257894A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113688774A (zh) * 2021-09-03 2021-11-23 重庆大学 基于深度学习的高层建筑风致响应预测、训练方法及装置
CN116128124A (zh) * 2023-01-09 2023-05-16 北京建筑大学 一种基于异常用能值处理和时序分解的建筑能耗预测方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106126896A (zh) * 2016-06-20 2016-11-16 中国地质大学(武汉) 基于经验模态分解和深度学习的混合模型风速预测方法及系统
CN108520269A (zh) * 2018-03-10 2018-09-11 华北电力大学(保定) 一种风速预测方法及风速预测系统
CN110598170A (zh) * 2019-08-06 2019-12-20 天津大学 一种基于feemd分解时间序列的数据预测方法
CN110633844A (zh) * 2019-08-25 2019-12-31 天津大学 基于emd和ann的建筑能源系统模拟预测方法及应用
CN111144286A (zh) * 2019-12-25 2020-05-12 北京工业大学 一种融合emd和lstm的城市pm2.5浓度预测方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106126896A (zh) * 2016-06-20 2016-11-16 中国地质大学(武汉) 基于经验模态分解和深度学习的混合模型风速预测方法及系统
CN108520269A (zh) * 2018-03-10 2018-09-11 华北电力大学(保定) 一种风速预测方法及风速预测系统
CN110598170A (zh) * 2019-08-06 2019-12-20 天津大学 一种基于feemd分解时间序列的数据预测方法
CN110633844A (zh) * 2019-08-25 2019-12-31 天津大学 基于emd和ann的建筑能源系统模拟预测方法及应用
CN111144286A (zh) * 2019-12-25 2020-05-12 北京工业大学 一种融合emd和lstm的城市pm2.5浓度预测方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
成卫青: "一种基于最大最小距离和SSE的自适应聚类算法", 《南京邮电大学学报( 自然科学版)》 *
王茹: "改进鲸鱼算法构建混合模型的建筑能耗预测", 《计算机测量与控制》 *
申鸿怡: "民用建筑"四节一环保"数据的清洗与修复方法研究", 《北京大学学报(自然科学版)》 *
胡雨沙: "基于数据驱动的造纸过程短期电力负荷预测模型的研究", 《中国优秀硕士学位论文全文数据库工程科技Ⅰ辑》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113688774A (zh) * 2021-09-03 2021-11-23 重庆大学 基于深度学习的高层建筑风致响应预测、训练方法及装置
CN113688774B (zh) * 2021-09-03 2023-09-26 重庆大学 基于深度学习的高层建筑风致响应预测、训练方法及装置
CN116128124A (zh) * 2023-01-09 2023-05-16 北京建筑大学 一种基于异常用能值处理和时序分解的建筑能耗预测方法

Similar Documents

Publication Publication Date Title
CN112257894A (zh) 基于数据驱动的混合建筑电耗预测方法及系统
EP3904894A1 (en) Training device, estimation device, training method, estimation method, training program, and estimation program
CN111259963B (zh) 一种区域植被指标的驱动因素分析方法、装置及存储介质
Meng et al. A two-stage short-term traffic flow prediction method based on AVL and AKNN techniques
CN112330050A (zh) 一种基于双层XGBoost考虑多特征的电力系统负荷预测方法
CN111814964A (zh) 基于空气质量状况预报的空气污染处理方法及存储介质
CN115204536A (zh) 楼宇设备故障预测方法、装置、设备及存储介质
CN114912720A (zh) 基于记忆网络电力负荷预测方法、装置、终端及存储介质
CN113298352A (zh) 企业行业信息处理方法、装置、电子设备及可读存储介质
CN115563477B (zh) 谐波数据识别方法、装置、计算机设备和存储介质
CN116191398A (zh) 负荷预测方法、装置、计算机设备和存储介质
CN114418246A (zh) 基于大数据的项目预测系统
CN113139673A (zh) 一种预测空气质量的方法、装置、终端及存储介质
EP3598349A1 (en) Information processing device, method, program, ic chip, and learned model
CN117166996B (zh) 地质参数门槛值的确定方法、装置、设备及存储介质
CN115691669B (zh) 一种基于量子卷积神经网络的蛋白质结构分类系统
CN117808175B (zh) 一种基于DTformer的短期多能源负荷预测方法
CN113836927B (zh) 命名实体识别模型的训练方法、装置、设备及存储介质
CN114115150B (zh) 基于数据的热泵系统在线建模方法及装置
Jun et al. A paired combinatorial logit route choice model with probit-based equivalent impedance
Dali et al. Demand forecast of equipment spare parts based on EEMD-LSTM
Park et al. Method of benchmarking route choice based on the input similarity using dea
CN116505516A (zh) 功率控制方法、装置、设备、存储介质和计算机程序产品
CN116544910A (zh) 一种电动汽车充电行为预测方法及系统
Xu et al. Multi-objective flexible job shop scheduling transportation problem: Simulation approach

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210122