CN113705889A - 电耗预测方法、系统、终端设备及计算机可读存储介质 - Google Patents
电耗预测方法、系统、终端设备及计算机可读存储介质 Download PDFInfo
- Publication number
- CN113705889A CN113705889A CN202110993274.5A CN202110993274A CN113705889A CN 113705889 A CN113705889 A CN 113705889A CN 202110993274 A CN202110993274 A CN 202110993274A CN 113705889 A CN113705889 A CN 113705889A
- Authority
- CN
- China
- Prior art keywords
- data
- power consumption
- sample data
- prediction
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 52
- 238000005259 measurement Methods 0.000 claims abstract description 15
- 238000012549 training Methods 0.000 claims description 35
- 230000005611 electricity Effects 0.000 claims description 29
- 238000012360 testing method Methods 0.000 claims description 8
- 230000010354 integration Effects 0.000 claims description 3
- 238000004590 computer program Methods 0.000 claims description 2
- 239000000126 substance Substances 0.000 claims description 2
- 230000003245 working effect Effects 0.000 description 21
- 238000005265 energy consumption Methods 0.000 description 19
- 238000010438 heat treatment Methods 0.000 description 12
- 230000001932 seasonal effect Effects 0.000 description 12
- 230000007704 transition Effects 0.000 description 9
- 230000003442 weekly effect Effects 0.000 description 8
- 230000002159 abnormal effect Effects 0.000 description 6
- 230000008859 change Effects 0.000 description 6
- 238000001816 cooling Methods 0.000 description 6
- 238000004378 air conditioning Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 238000005057 refrigeration Methods 0.000 description 5
- 238000003745 diagnosis Methods 0.000 description 4
- 238000012935 Averaging Methods 0.000 description 3
- 238000010219 correlation analysis Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000005286 illumination Methods 0.000 description 3
- 230000002123 temporal effect Effects 0.000 description 3
- 102100024153 Cadherin-15 Human genes 0.000 description 2
- 102100022480 Cadherin-20 Human genes 0.000 description 2
- 101000762242 Homo sapiens Cadherin-15 Proteins 0.000 description 2
- 101000899459 Homo sapiens Cadherin-20 Proteins 0.000 description 2
- 101000602015 Homo sapiens Protocadherin gamma-B4 Proteins 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000011497 Univariate linear regression Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 238000010224 classification analysis Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000000528 statistical test Methods 0.000 description 1
- 238000012353 t test Methods 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/06—Electricity, gas or water supply
Abstract
本发明公开了一种电耗预测方法、系统、终端设备及计算机可读存储介质,该方法包括:获取不同气象数据、社会参数数据下的分项计量数据;根据气温相关度的大小对所述分项计量数据进行分类,得到第一样本数据和第二样本数据;利用所述第一样本数据和回归模型,生成第一预测结果;及利用所述第二样本数据和特征平均模型,生成第二预测结果;将所述第一预测结果和所述第二预测结果进行整合,作为电耗预测结果。本发明相较于现有的电耗预测方法,能够减少预测成本,提高预测精度,同时具有易推广、适用性强的优点。
Description
技术领域
本发明涉及配电网络安全预警技术领域,尤其涉及一种电耗预测方法、系统、终端设备及计算机可读存储介质。
背景技术
在配电网络中,实现对电耗的准确、快速预测尤为关键,关乎到用电的稳定性及安全性问题。其中,电耗预测模型是电耗预测工作中最常采用的工具之一,其原理是将建筑电耗的变化规律用相应的模型形式和参数反映出来,在应用时只需将电耗影响因素作为自变量输入预测模型,即可输出电耗预测结果。
现有的电耗预测模型大致可以分为三类:一是白箱模型,即基于物理法则,通过大量详细的建筑信息和气象参数所建立的预测模型;二是黑箱模型,即利用数据拟合技术,将大量自变量、因变量数据作为训练数据输入模型,训练出反映输入数据特点的预测模型;三是灰箱模型,即通过物理法则搭建模型框架,再运用一定量的数据训练模型,以得到优化模型。
然而,利用上述几种模型进行电耗预测时往往会存在各自的弊端,例如:在使用白箱模型时往往会由于采集的建筑信息和气象参数数据量较少,导致预测结果不准确;且该方法由于需要依赖特定建筑信息,因此模型的通用性较差;而利用黑箱模型或者灰箱模型时,由于均基于机器学习模型,因此需要耗费大量历史数据进行训练,不仅成本高、也不易实施推广。
发明内容
本发明的目的在于提供一种电耗预测方法、系统、终端设备及计算机可读存储介质,以解决现有技术中电耗预测方法中存在的准确度低、成本高、耗时长且难以推广应用的问题。
为实现上述目的,本发明提供一种电耗预测方法,包括:
获取不同气象数据、社会参数数据下的分项计量数据;
根据气温相关度的大小对所述分项计量数据进行分类,得到第一样本数据和第二样本数据;
利用所述第一样本数据和回归模型,生成第一预测结果;及利用所述第二样本数据和特征平均模型,生成第二预测结果;
将所述第一预测结果和所述第二预测结果进行整合,作为电耗预测结果。
作为优选地,所述根据气温相关度的大小对所述分项计量数据进行分类,得到第一样本数据和第二样本数据,包括:
当所述气温相关度大于预设阈值时,将对应的分项计量数据作为所述第一样本数据;
当所述气温相关度小于或等于预设阈值时,将对应的分项计量数据作为所述第二样本数据;其中,所述分项计量数据为电耗数据。
作为优选地,所述利用所述第一样本数据和回归模型,生成第一预测结果,包括:
按不同的时间尺度将所述第一样本数据进行划分,得到第三样本数据;
将所述第三样本数据按照预设比例划分为训练数据和待测数据;
建立回归模型,利用所述训练数据对所述回归模型训练,
对训练后的回归模型进行评估,当训练后的回归模型不满足预设条件时,重新执行建立回归模型,利用所述训练数据对所述回归模型训练步骤,直至训练后的回归模型满足预设条件时,生成目标回归模型;
将所述待测数据输入至所述目标回归模型进行电耗预测,生成所述第一预测结果。
作为优选地,利用拟合优度检验或显著性检验对训练后的回归模型进行评估。
作为优选地,所述利用所述第二样本数据和特征平均模型,生成第二预测结果,包括:
将所述第二样本数据进行按特征划分,并将划分后的数据分别输入至不同的特征平均模型进行预测,生成第二预测结果;其中,
所述特征平均模型包括周特征平均模型、天特征平均模型以及时特征平均模型。
作为优选地,在对所述分项计量数据进行分类之前,还包括对所述分项计量数据进行数据清洗。
本发明还提供一种电耗预测系统,包括:
数据获取单元,用于获取不同气象数据、社会参数数据下的分项计量数据;
分类单元,用于根据气温相关度的大小对所述分项计量数据进行分类,得到第一样本数据和第二样本数据;
预测单元,用于利用所述第一样本数据和回归模型,生成第一预测结果;及利用所述第二样本数据和特征平均模型,生成第二预测结果;
整合单元,用于将所述第一预测结果和所述第二预测结果进行整合,作为电耗预测结果。
作为优选地,所述分类单元,还用于:
当所述气温相关度大于预设阈值时,将对应的分项计量数据作为所述第一样本数据;
当所述气温相关度小于或等于预设阈值时,将对应的分项计量数据作为所述第二样本数据;其中,所述分项计量数据为电耗数据。
本发明还提供一种终端设备,包括:
一个或多个处理器;
存储器,与所述处理器耦接,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上任一项所述的电耗预测方法。
本发明还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上任一项所述的电耗预测方法。
相对于现有技术,本发明的有益效果在于:
本发明公开的一种电耗预测方法,包括获取不同气象数据、社会参数数据下的分项计量数据;对所述分项计量数据进行分类,得到第一样本数据和第二样本数据;利用所述第一样本数据和回归模型,生成第一预测结果;及利用所述第二样本数据和特征平均模型,生成第二预测结果;将所述第一预测结果和所述第二预测结果进行整合,作为电耗预测结果。本发明相较于现有的电耗预测方法,能够减少预测成本,提高预测精度,具有易推广、适用性强的优点。
附图说明
为了更清楚地说明本发明的技术方案,下面将对实施方式中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明某一实施例提供的电耗预测方法的流程示意图;
图2是本发明某一实施例提供的某办公建筑某年逐天总电耗与日均温度的关系示意图;
图3是本发明某一实施例提供的某综合体建筑某年逐天总电耗与日均温度的关系示意图;
图4是本发明某一实施例提供的某商场建筑某年逐天总电耗与日均温度的关系示意图;
图5是本发明某一实施例提供的电耗预测系统的结构示意图;
图6是本发明某一实施例提供的终端设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,文中所使用的步骤编号仅是为了方便描述,不对作为对步骤执行先后顺序的限定。
应当理解,在本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
请参阅图1,本发明某一实施例提供一种电耗预测方法,包括以下步骤:
S10、获取不同气象数据、社会参数数据下的分项计量数据;
S20、根据气温相关度的大小对所述分项计量数据进行分类,得到第一样本数据和第二样本数据;
S30、利用所述第一样本数据和回归模型,生成第一预测结果;及利用所述第二样本数据和特征平均模型,生成第二预测结果;
S40、将所述第一预测结果和所述第二预测结果进行整合,作为电耗预测结果。
需要说明的是,分项计量数据主要是从分项计量系统中获得,而分项计量系统的主要功能就是采集建筑的电耗数据。通过对采集到的历史电耗数据进行分析,可具体分析建筑各分项的电耗范围和用能特点,进而可以用特定的公式和模型反映其内在规律。
现有分项计量系统所调研的建筑基本信息较少,采用白箱模型通过物理法则详细计算电耗的工作量巨大、不易实施;而采用机器学习模型则较需要大量的历史电耗数据,对现有系统要求较高,不方便实施推广。综合适用性和准确性方面的考虑,选用回归模型和特征平均模型作为能耗预测模型,并通过对历史能耗数据的分析确定其模型形式和参数,用于在电力系统能效诊断及安全预警中提供基准电耗值。
需要说明的是,回归模型的适用范围包括总电耗与四大分项电耗的逐周和逐天预测,及除空调分项所含子项外的其他子项电耗的逐天预测,这些电耗均为与气温相关的电耗;而与气温关系不密切的电耗项,如未掺杂空调电耗的照明、动力分项电耗等,此类电耗一般与社会参数信息有关,在特定社会参数的范围内波动范围较小,在本模型中选用特征平均模型来预测其基准电耗。
具体地,在步骤S10中首先获取分项计量数据。本实施例中,气象数据主要包括温度和湿度、社会参数数据主要包括人员密集度和建筑信息,且这些数据均会影响建筑的电耗量,因此步骤S10中首先获取不同气象数据、社会参数数据下的分项计量数据。然后在步骤S20中对所述分项计量数据进行分类得到第一样本数据和第二样本数据。作为优选地,在执行步骤S20之前,还包括对所述分项计量数据进行数据清洗。
在某一个实施例中,所述根据气温相关度的大小对所述分项计量数据进行分类,得到第一样本数据和第二样本数据,包括:
当所述气温相关度大于预设阈值时,将对应的分项计量数据作为所述第一样本数据;
当所述气温相关度小于或等于预设阈值时,将对应的分项计量数据作为所述第二样本数据;其中,所述分项计量数据为电耗数据。
在本实施例中,可以理解的是,当气温相关度大于预设阈值时,则可认为该数据为与气温密切相关的电耗数据;当气温相关度小于或等于预设阈值时,则可认为该数据为与气温不密切相关的电耗数据。其中,预设阈值可根据实际情况来定,在此不作任何限制。
进一步地,在步骤S30中利用第一样本数据和回归模型,生成第一预测结果;及利用第二样本数据和特征平均模型,生成第二预测结果。
在某一个具体实施例中,所述利用所述第一样本数据和回归模型,生成第一预测结果,包括:
按不同的时间尺度将所述第一样本数据进行划分,得到第三样本数据;
将所述第三样本数据按照预设比例划分为训练数据和待测数据;
建立回归模型,利用所述训练数据对所述回归模型训练,
对训练后的回归模型进行评估,当训练后的回归模型不满足预设条件时,重新执行建立回归模型,利用所述训练数据对所述回归模型训练步骤,直至训练后的回归模型满足预设条件时,生成目标回归模型;
将所述待测数据输入至所述目标回归模型进行电耗预测,生成所述第一预测结果。
本实施例中,需要说明的是,回归分析是统计预测方法的一种,采用数学和数理统计的方法建立因果模型,即回归模型。回归模型不仅能够用于预测,还能在一定程度上解释系统内部运行的原因和各个因素之间的关系,适用于有一定数量的被解释变量数据和相应的解释变量数据,且对两类数据间的关系有一定认识的情况下,进行特定解释变量值的预测。其中,根据自变量个数,回归模型可以分为一元回归模型和多元回归模型。在实际问题的研究中,往往需要先假定变量服从的回归方程,才能进行训练和求解。因此,当求出线性回归方程后,通常对回归方程进行显著性检验:一是针对回归方程显著性的F检验;二是针对回归系数显著性的t检验;三是衡量回归拟合程度的拟合优度检验。
为了选择适当的回归模型,作为回归模型,需要依据被解释变量(电耗量)的特点,合理选取因变量(电耗的影响因素)的种类和个数,并指出特定回归模型的精度要求和适用范围。
1)按照电耗数据特点对数据分类汇总:
分析建筑实测电耗的特点,对具有不同特点的电耗数据需要区别对待。对于单体建筑来讲,建筑类型会影响电耗特点,如办公建筑和商场建筑的人员负荷、设备负荷和运营时间等都不尽相同,所以其电耗特点也会差别很大,需要对不同类型的建筑分别进行分析;社会信息也会影响部分用能分项,如办公建筑在工作日运营,在休息日不运营,那么其照明、空调等能耗在不同工作性质的两天里差别会很大,也需要对不同工作性质下的能耗数据分别进行分析。另外,气象参数的不同也会对建筑的空调部分电耗产生影响,而空调电耗在总电耗中占据较大比例,使总电耗也随季节不同呈现不同的用能规律,所以,对总电耗和空调电耗的预测需要依照气象参数划分季节,对不同季节的数据分别分析。
由于不像建筑类型和社会信息属于固定的参数,季节的划分主要是根据建筑电耗和气象参数的关联分析,是对数据分析整理后的结果,属于自定义划分。为了方便使用,季节划分以天为单位,选择当天平均气温作为当天季节判定的标尺。需要注意的是,此处所述的季节划分并非气象学上所说的春夏秋冬的四季,而是以空调系统制热制冷的时间为准绳,所划分的季节称为制冷季、过渡季和采暖季。
为了帮助理解本实施例提供的内容,先以某办公建筑为例,选取一年的实测历史数据,与当年的逐天平均气温进行关联分析,得出相应的季节划分方案。如图2所示,在日均气温处于12℃以下时,该建筑的总电耗和空调电耗大致呈现随温度降低而升高的趋势,属于采暖季;在日均气温处于12℃和20℃之间时,该建筑的总电耗和空调电耗大致在5000kWh和2000kWh附近波动,属于过渡季;在日均气温上升至20℃以上后,该建筑的总电耗和空调电耗大致随着温度的升高而升高,属于制冷季。则可以得出,该办公建筑的季节划分方案以12℃和20℃为划分点,即日均气温处于12℃及以下的天属于采暖季,处于12℃至20℃之间的天属于过渡季,处于20℃及以上的天属于制冷季。
同理,针对某综合体建筑、某商场建筑的季节划分结果分别如图3、图4所示,也可选取其一年的实测历史数据,与当年的逐天平均气温进行关联分析,得出相应的季节划分方案。本实施例中,综合体建筑以12℃和20℃为分界线,而商场建筑则以10℃和15℃为分界线。
此外,在周能耗的预测中,也需要对每周所处的季节进行区别,这里以逐天的季节为基准,定义一周中出现频率最高的逐天季节为该周所处季节,如一周7天中有5天处于制冷季,2天处于过渡季,则定义该周处于制冷季。
将日均气温作为季节划分依据的方法虽然较为粗略,但是通过对实际数据的分析得出,在实际应用中具有较好的适用性。另外,也可以采用日均气温和物业的运行管理时间表一同划分季节的方式,这种方法首先需要运行管理时间表,对现场调研深度的要求较高,其次物业提供的运行管理时间也较为粗略,未必能够精准的划分季节。所以,采用以日均温度为标杆的季节划分,能够对大部分数据进行正确的划分。
2)选择自变量和模型形式:
对上述三栋办公、商场和综合案例建筑,分别建立逐周和逐天电耗预测模型。
a)逐周能耗模型——社会气象参数回归模型:
办公和综合建筑:
制冷季:Y=C0+C1×Days+C2×CDH20;
过渡季:Y=C0+C1×Days+C2×CDH20+C3×HDH12;
采暖季:Y=C0+C1×Days+C2×HDH12;
商场建筑:
制冷季:Y=C0+C1×CDH15;
过渡季:Y=C0+C1×CDH15+C2×HDH10;
采暖季:Y=C0+C1×HDH10;
其中,Y是该项的逐周电耗值(从周日起至周六止),单位为kWh;Day是该周的工作日天数,以国家假日办的公休安排为准,单位为1;CDH是该周的制冷度时数,单位为℃·h;对办公和综合建筑,当该周内某小时的室外时均温度高于20℃时,将高于20℃的度数乘以1h,并将此乘积累加,得到CDH20;对于商场建筑,当该周内某小时的室外时均温度高于15℃,将高于15℃的度数乘以1h,并将此乘积累加,得到CDH15;HDH是该周的采暖度时数,单位为℃·h;对办公和综合建筑,当该周内某小时的室外时均温度低于12℃时,将低于12℃的度数乘以1h,并将此乘积累加,得到HDH12;对于商场建筑,当该周内某小时的室外时均温度低于15℃,将低于15℃的度数乘以1h,并将此乘积累加,得到HDH10;C0、C1、C2、C3是模型回归参数,由训练数据回归得出。
需要说明的是,周能耗模型适用于建筑总电耗和空调电耗的逐周预测,基于以日均温度为标尺的季节划分方案,对制冷、过渡和采暖三个季节进行分段训练、预测;以季节划分中所定的温度分界点为计算制冷、采暖度时数的基准温度,通过一周内度时数的大小表征一周内总电耗和空调电耗的高低。另外,针对办公和综合建筑,由于其运营电耗与工作性质有关,将一周的工作日天数也视为自变量纳入其回归模型。
b)天能耗预测模型——气象参数回归模型:
Y=C0+C1×T+C2×T2+C3×T3;
其中,Y是该项的逐天电耗值,单位为kWh;T是当天的平均温度,单位为℃;C0、C1、C2、C3是模型回归参数,由训练数据回归得出。
需要说明的是,天能耗预测模型适用于建筑总电耗和空调电耗的逐天预测,除了需要按照制冷、过渡和采暖三个季节进行分段以外,与当天工作性质相关的电耗项还需按照工作日和休息日再次分段。也就是说,虽然该模型形式只有一个,但可能因为社会信息和气象参数的原因,做多会将全年的逐天能耗分为六个数据段分别进行回归、预测。另外,考虑到日均气温与总电耗和空调电耗有较强的相关性,可以采用日均温度的三次多项式来表征他们之间的关系。
3)模型的精度要求及剔异处理:
在某一实施例中,利用拟合优度检验或显著性检验对训练后的回归模型进行评估。
为了方便诊断算法中根据能耗数据特点自动选择能耗预测模型,定义统一的模型精度判定标准,只有符合精度要求的模型才能在能耗预测中使用。考虑到多项式回归中统计检验的复杂性,可参考ASHRAE Guideline 14中评价回归模型不确定度的方法,对模型精度的判断进行简化处理。
本实施例中优先选取决定系数R2和残差均方根变异系数CV(RMSE)(Coefficientof Variationof the Root Mean Squared Error)作为模型可用性判断的指标,运用实测历史数据作为训练数据,并结合诊断算法中的诊断流程和精度要求,通过试错法对不同的指标限值进行尝试,最终得到模型可用性的判断标准为:R2>0.6且CV(RMSE)<25%。需要强调,训练数据应为用能正常的历史数据,但实测数据来源于现场采集,建筑运行状况又非一成不变,所选的训练数据未必均能反映用能正常时的能耗特点。所以,除了在选择训练数据时应尽量选择经过调试、运行状态正常的能耗数据以外,还应对实际情况下可能存在的异常数据进行剔除,以保证训练出来的回归模型能够表征用能正常时的能耗数据所反映的用能特点。
具体地,假定训练数据以正常数据为主,所含异常数据的数量较少,当模型精度满足上述可用性判断标准时,证明可能存在的异常数据对得到的回归模型影响较小,无需剔除,认为所得模型可用;当模型精度不满足可用性判断标准时,可能是由于异常数据的存在导致拟合效果差,这时便需要对异常数据进行剔除,之后再重新训练模型。为了保证回归模型表征大部分训练数据,即用能正常数据的能耗特点,剔除的异常数据数量需控制在训练数据总数量的20%以内。若剔除数据量达到训练数据总量的20%后的模型仍不满足可用性判断标准,则认为此时回归模型不适用。
在某一个实施例中,利用第二样本数据和特征平均模型,生成第二预测结果,包括:
将所述第二样本数据进行按特征划分,并将划分后的数据分别输入至不同的特征平均模型进行预测,生成第二预测结果;其中,所述特征平均模型主要包括周预测模型、天预测模型及时预测模型。
具体地,在建筑的分项能耗中,除了总电耗和空调电耗这样随气象参数显著变化的电耗以外,还有与气温关系不密切的电耗项,如未掺杂空调电耗的照明、动力分项电耗等。此类电耗一般与社会参数信息有关,在特定社会参数的范围内波动范围较小,此时可以选用特征平均模型来预测其基准电耗。
针对较为平稳的电耗数据序列,借鉴移动平均法的思想和数据挖掘方法中分类分析的思想来预测基准电耗。具体思路是将历史电耗数据按照其不同的特征分为多个类别,将每个类别中的电耗历史数据求得均值,并作为此类别中的电耗基准值,可以形象的称此方法为特征平均法。如在某项用电的周电耗预测中,同处于采暖季的多个周的周电耗被划分为同一类别,那么求得这几个周的电耗平均值,作为此项能耗在采暖季的预测电耗;又如在某项用电的天电耗预测中,同一月份中同属于工作日的许多天的天电耗被划分为同一类别,那么求得这几天的电耗平均值,作为此项能耗在该月工作日的预测电耗;再如在某项用电的逐时电耗预测中,同处于相同月份、相同工作性质和相同时刻的多个小时的逐时电耗被划分为同一类别,那么求得这些小时的电耗平均值,作为此项电耗在该月份具有该工作性质的天中该时刻的预测电耗。
由于建筑类型和各分项电耗特点的不同,对于不同分项而言,划分类别时所选的特征因素也不尽相同,主要由该项电耗的特点决定,看其是否因划分特征因素的不同而具有不同的变化规律。在周预测模型中,考虑的特征因素是季节;在天预测模型中,考虑的特征因素有季节、月份、工作性质;在时预测模型中,考虑的特征因素是月份、工作性质和时刻。
特征平均模型的适用范围包括:总电耗与四大分项电耗的逐周和逐天预测,除空调分项所含子项外的其他子项的逐天预测和逐时预测。
下面对周特征平均模型、天特征平均模型、时特征平均模型逐一介绍:
A)周特征平均模型:
第一周特征平均模型——针对全年未分开的数据:
其中,x表示逐周电耗数据,单位为kWh;n表示全年的周个数。
第一周特征平均模型适用于逐周电耗与季节无关的电耗项,此时认为该项电耗的周数据在全年范围内较为平稳,可以不对全年的逐周数据进行划分,直接对总的训练数据集求均值,作为预测的基准电耗即可。
第二周特征平均模型——针对按季节分开后的数据:
其中,s表示季节,取制冷、过渡、采暖季;ns表示该季节的周个数。
第二周特征回归模型适用于全年逐周电耗在不同季节内差异较大、但在特定季节内变化较小的电耗项,所以将全年的逐周数据按照季节划分以后,取每个季节内周电耗的均值,作为该季节内此项电耗的预测电耗。
B)天特征平均模型:
第一天特征平均模型——针对工作日与休息日未分开的数据:
其中,yi表示逐日电耗数据,单位为kWh;m表示月份,取1-12;w表示工作性质,取工作日和休息日;pm,w表示该月份该工作性质的天数。
第一天特征平均模型适用于逐天电耗与季节无关且与工作性质无关的电耗项,但考虑到判断电耗与工作性质是否相关时的不确定性,以及不同月份间电耗的差异,按照月份和工作性质将全年的逐天数据划分为12×2=24个训练数据集(月份个数×公休情况个数),取每个数据集内的均值,作为相应月份内具有相应工作性质的天的逐天电耗预测值。
第二天特征平均模型——针对工作日与休息日分开的数据:
其中,yi’表示逐日电耗数据,单位为kWh。
第二天特征平均模型适用于逐天电耗与季节无关、与工作性质相关、但在相同工作性质内变化较小的电耗项,再考虑到不同月份间可能存在的用能差异,所以按照月份和工作性质将全年的逐天数据划分为12×2(月份个数×公休情况个数)个训练数据集,取每个数据集内的均值,作为相应月份内具有相应工作性质的天的逐天电耗预测值。需要注意的是,第一天特征回归模型和第二天特征回归模型在形式上虽然一致,但在实际使用中对应的训练数据集往往不同。
第三天特征平均模型——针对仅按季节分开的数据:
其中,ps表示该季节的天数。
第三天特征平均模型适用于逐天电耗与季节相关、与工作性质无关、但在相同季节内变化较小的电耗项,所以取每个季节内训练数据的均值,作为相应季节内逐天电耗预测值。
第四天特征平均模型——针对按季节和工作性质均分开的数据:
其中,ps,w表示该季节该工作性质的天数。
第四天特征平均模型适用于逐天电耗与季节和工作性质均相关、但在相同季节相同工作性质内变化较小的电耗项,所以取每个季节内相同工作性质的训练数据并求得均值,作为相应季节内逐天电耗预测值。
C)时特征平均模型:
其中,z表示逐日电耗数据,单位为kWh;h表示时刻数,取0-23;qm,w,h表示该月份该工作性质的天中该时刻的小时数。
需要说明的是,时特征平均模型仅有一种形式,适用于照明、动力和特殊分项中子项电耗的逐时预测,将全年8760个小时的历史数据按照月份、工作性质和时刻三个特征因素分为12×2×24=576份,每一份求取平均值作为该时刻的基准值。
最后,将步骤S30生成的第一预测结果和第二预测结果进行整合,作为最终的电耗预测结果。
本发明实施例提供的电耗预测方法,相较于现有的电耗预测方法来说,能够减少预测成本,提高预测精度,同时具有易推广、适用性强的优点。
请参阅图5,本发明某一实施例还提供一种电耗预测系统,包括:
数据获取单元01,用于获取不同气象数据、社会参数数据下的分项计量数据;
分类单元02,用于根据气温相关度的大小对所述分项计量数据进行分类,得到第一样本数据和第二样本数据;
预测单元03,用于利用所述第一样本数据和回归模型,生成第一预测结果;及利用所述第二样本数据和特征平均模型,生成第二预测结果;
整合单元04,用于将所述第一预测结果和所述第二预测结果进行整合,作为电耗预测结果。
进一步地,分类单元02,还用于:
当所述气温相关度大于预设阈值时,将对应的分项计量数据作为所述第一样本数据;
当所述气温相关度小于或等于预设阈值时,将对应的分项计量数据作为所述第二样本数据;其中,所述分项计量数据为电耗数据。
本发明实施例提供的电耗预测系统用于执行如上述实施例所述的电耗预测方法,通过利用该电耗预测系统进行预测,不仅能够减少预测成本,提高预测精度,同时具有易推广、适用性强的优点。
请参阅图6,本发明某一实施例还提供一种终端设备,包括:
一个或多个处理器;
存储器,与所述处理器耦接,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上所述的电耗预测方法。
处理器用于控制该终端设备的整体操作,以完成上述的电耗预测方法的全部或部分步骤。存储器用于存储各种类型的数据以支持在该终端设备的操作,这些数据例如可以包括用于在该终端设备上操作的任何应用程序或方法的指令,以及应用程序相关的数据。该存储器可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,例如静态随机存取存储器(Static Random Access Memory,简称SRAM),电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,简称EEPROM),可擦除可编程只读存储器(Erasable Programmable Read-Only Memory,简称EPROM),可编程只读存储器(Programmable Read-Only Memory,简称PROM),只读存储器(Read-Only Memory,简称ROM),磁存储器,快闪存储器,磁盘或光盘。
在一示例性实施例中,终端设备可以被一个或多个应用专用集成电路(Application Specific 1ntegrated Circuit,简称AS1C)、数字信号处理器(DigitalSignal Processor,简称DSP)、数字信号处理设备(Digital Signal Processing Device,简称DSPD)、可编程逻辑器件(Programmable Logic Device,简称PLD)、现场可编程门阵列(Field Programmable Gate Array,简称FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行如上述任一项实施例所述的电耗预测方法,并达到如上述方法一致的技术效果。
在另一示例性实施例中,还提供一种包括程序指令的计算机可读存储介质,该程序指令被处理器执行时实现如上述任一项实施例所述的电耗预测方法的步骤。例如,该计算机可读存储介质可以为上述包括程序指令的存储器,上述程序指令可由终端设备的处理器执行以完成如上述任一项实施例所述的电耗预测方法,并达到如上述方法一致的技术效果。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。
Claims (10)
1.一种电耗预测方法,其特征在于,包括:
获取不同气象数据、社会参数数据下的分项计量数据;
根据气温相关度的大小对所述分项计量数据进行分类,得到第一样本数据和第二样本数据;
利用所述第一样本数据和回归模型,生成第一预测结果;及利用所述第二样本数据和特征平均模型,生成第二预测结果;
将所述第一预测结果和所述第二预测结果进行整合,作为电耗预测结果。
2.根据权利要求1所述的电耗预测方法,其特征在于,所述根据气温相关度的大小对所述分项计量数据进行分类,得到第一样本数据和第二样本数据,包括:
当所述气温相关度大于预设阈值时,将对应的分项计量数据作为所述第一样本数据;
当所述气温相关度小于或等于预设阈值时,将对应的分项计量数据作为所述第二样本数据;其中,所述分项计量数据为电耗数据。
3.根据权利要求2所述的电耗预测方法,其特征在于,所述利用所述第一样本数据和回归模型,生成第一预测结果,包括:
按不同的时间尺度将所述第一样本数据进行划分,得到第三样本数据;
将所述第三样本数据按照预设比例划分为训练数据和待测数据;
建立回归模型,利用所述训练数据对所述回归模型训练,
对训练后的回归模型进行评估,当训练后的回归模型不满足预设条件时,重新执行建立回归模型,利用所述训练数据对所述回归模型训练步骤,直至训练后的回归模型满足预设条件时,生成目标回归模型;
将所述待测数据输入至所述目标回归模型进行电耗预测,生成所述第一预测结果。
4.根据权利要求3所述的电耗预测方法,其特征在于,利用拟合优度检验或显著性检验对训练后的回归模型进行评估。
5.根据权利要求2所述的电耗预测方法,其特征在于,所述利用所述第二样本数据和特征平均模型,生成第二预测结果,包括:
将所述第二样本数据进行按特征划分,并将划分后的数据分别输入至不同的特征平均模型进行预测,生成第二预测结果;其中,
所述特征平均模型包括周特征平均模型、天特征平均模型以及时特征平均模型。
6.根据权利要求1所述的电耗预测方法,其特征在于,在对所述分项计量数据进行分类之前,还包括对所述分项计量数据进行数据清洗。
7.一种电耗预测系统,其特征在于,包括:
数据获取单元,用于获取不同气象数据、社会参数数据下的分项计量数据;
分类单元,用于根据气温相关度的大小对所述分项计量数据进行分类,得到第一样本数据和第二样本数据;
预测单元,用于利用所述第一样本数据和回归模型,生成第一预测结果;及利用所述第二样本数据和特征平均模型,生成第二预测结果;
整合单元,用于将所述第一预测结果和所述第二预测结果进行整合,作为电耗预测结果。
8.根据权利要求7所述的电耗预测系统,其特征在于,所述分类单元,还用于:
当所述气温相关度大于预设阈值时,将对应的分项计量数据作为所述第一样本数据;
当所述气温相关度小于或等于预设阈值时,将对应的分项计量数据作为所述第二样本数据;其中,所述分项计量数据为电耗数据。
9.一种终端设备,其特征在于,包括:
一个或多个处理器;
存储器,与所述处理器耦接,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-6任一项所述的电耗预测方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-6任一项所述的电耗预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110993274.5A CN113705889A (zh) | 2021-08-26 | 2021-08-26 | 电耗预测方法、系统、终端设备及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110993274.5A CN113705889A (zh) | 2021-08-26 | 2021-08-26 | 电耗预测方法、系统、终端设备及计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113705889A true CN113705889A (zh) | 2021-11-26 |
Family
ID=78655718
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110993274.5A Pending CN113705889A (zh) | 2021-08-26 | 2021-08-26 | 电耗预测方法、系统、终端设备及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113705889A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104915562A (zh) * | 2015-06-11 | 2015-09-16 | 上海新长宁低碳投资管理有限公司 | 建筑能效诊断方法和系统 |
CN107679660A (zh) * | 2017-09-30 | 2018-02-09 | 山东建筑大学 | 基于支持向量机的逐时建筑能耗预测方法 |
CN112183849A (zh) * | 2020-09-25 | 2021-01-05 | 贵州乌江水电开发有限责任公司 | 一种基于人工神经网络的短期电力电量预测方法 |
CN113159424A (zh) * | 2021-04-23 | 2021-07-23 | 平安科技(深圳)有限公司 | 基于机器学习的指标预测方法、装置、设备及存储介质 |
-
2021
- 2021-08-26 CN CN202110993274.5A patent/CN113705889A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104915562A (zh) * | 2015-06-11 | 2015-09-16 | 上海新长宁低碳投资管理有限公司 | 建筑能效诊断方法和系统 |
CN107679660A (zh) * | 2017-09-30 | 2018-02-09 | 山东建筑大学 | 基于支持向量机的逐时建筑能耗预测方法 |
CN112183849A (zh) * | 2020-09-25 | 2021-01-05 | 贵州乌江水电开发有限责任公司 | 一种基于人工神经网络的短期电力电量预测方法 |
CN113159424A (zh) * | 2021-04-23 | 2021-07-23 | 平安科技(深圳)有限公司 | 基于机器学习的指标预测方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Coakley et al. | A review of methods to match building energy simulation models to measured data | |
CN108593990B (zh) | 一种基于电能用户用电行为模式的窃电检测方法和应用 | |
CN110097297A (zh) | 一种多维度窃电态势智能感知方法、系统、设备及介质 | |
CN103853106B (zh) | 一种建筑能源供应设备的能耗预测参数优化方法 | |
US20160041541A1 (en) | Systems and methods for detecting changes in energy usage in a building | |
CN112381476B (zh) | 用于确定状态异常的电能表的方法及装置 | |
CN110070282B (zh) | 一种基于综合关联度的低压台区线损影响因素分析方法 | |
US20190369570A1 (en) | System and method for automatically detecting anomalies in a power-usage data set | |
CN112182720B (zh) | 一种基于建筑能源管理应用场景的建筑能耗模型评价方法 | |
US10417565B1 (en) | System, method, and computer program for modeling and predicting energy consumption in a building | |
CN112446534A (zh) | 一种输变电工程的建设工期预测方法和装置 | |
CN111967717A (zh) | 一种基于信息熵值的数据质量评价方法 | |
CN113705889A (zh) | 电耗预测方法、系统、终端设备及计算机可读存储介质 | |
Panasyuk et al. | Classification of large and socially important enterprises of the region by the levels of their economic solvency | |
CN115907033A (zh) | 一种基于机器学习算法预测每小时用电量的方法及系统 | |
CN115392721A (zh) | 一种大气污染物管理方法、装置、设备和存储介质 | |
Wallnerström et al. | Model of capacity demand under uncertain weather | |
CN116384622A (zh) | 基于电力大数据的碳排放监测方法及装置 | |
CN116187549A (zh) | 能耗预测方法、计算设备及计算机存储介质 | |
Zhao et al. | Performance evaluation of smart meters based on grey relational analysis | |
CN113887986A (zh) | 一种基于模型的能效诊断方法、系统、设备和介质 | |
CN115828134A (zh) | 用电数据样本构建、模型训练、账户类别确定方法和装置 | |
CN115453447A (zh) | 基于嫌疑电表分步补偿剔除的超差电表在线检测方法 | |
Akinsooto et al. | Energy savings reporting and uncertainty in Measurement & Verification | |
CN114625781A (zh) | 一种基于商品住房价值的批量评估方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |