CN114880959B - 一种用于建筑能耗混合模型的输入变量获取方法和系统 - Google Patents
一种用于建筑能耗混合模型的输入变量获取方法和系统 Download PDFInfo
- Publication number
- CN114880959B CN114880959B CN202210815273.6A CN202210815273A CN114880959B CN 114880959 B CN114880959 B CN 114880959B CN 202210815273 A CN202210815273 A CN 202210815273A CN 114880959 B CN114880959 B CN 114880959B
- Authority
- CN
- China
- Prior art keywords
- variable
- variables
- key
- energy consumption
- initial
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000005265 energy consumption Methods 0.000 title claims abstract description 162
- 238000000034 method Methods 0.000 title claims abstract description 128
- 238000004088 simulation Methods 0.000 claims abstract description 68
- 238000005070 sampling Methods 0.000 claims abstract description 63
- 238000005065 mining Methods 0.000 claims abstract description 18
- 238000000605 extraction Methods 0.000 claims abstract description 14
- 238000004422 calculation algorithm Methods 0.000 claims description 19
- 238000004364 calculation method Methods 0.000 claims description 15
- 238000010206 sensitivity analysis Methods 0.000 claims description 14
- 230000002068 genetic effect Effects 0.000 claims description 10
- 238000006243 chemical reaction Methods 0.000 claims description 6
- 230000007812 deficiency Effects 0.000 claims description 6
- 230000001419 dependent effect Effects 0.000 claims description 2
- 230000006870 function Effects 0.000 description 8
- 230000000694 effects Effects 0.000 description 4
- 238000001914 filtration Methods 0.000 description 3
- UCTWMZQNUQWSLP-VIFPVBQESA-N (R)-adrenaline Chemical compound CNC[C@H](O)C1=CC=C(O)C(O)=C1 UCTWMZQNUQWSLP-VIFPVBQESA-N 0.000 description 2
- 238000000546 chi-square test Methods 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005057 refrigeration Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/10—Pre-processing; Data cleansing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
- G06N5/025—Extracting rules from data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Mathematical Physics (AREA)
- Evolutionary Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Business, Economics & Management (AREA)
- Pure & Applied Mathematics (AREA)
- Medical Informatics (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Computing Systems (AREA)
- Algebra (AREA)
- General Health & Medical Sciences (AREA)
- Operations Research (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Geometry (AREA)
- Computer Hardware Design (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- Probability & Statistics with Applications (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
Abstract
本发明提供了一种用于建筑能耗混合模型的输入变量获取方法和系统,其中本发明的方法包括将初始变量划分为负荷相关变量和机电相关变量;对初始变量进行抽样并进行能耗模拟,分析初始变量对输出变量的影响,然后分别针对两种相关变量进行关键变量的提取;并当初始数据集缺少历史能耗数据时,对根据历史能耗数据补全关键变量后的实际建筑数据集进行关键变量的关联规则挖掘,利用挖掘出的关联规则,从已知关键变量对缺失关键变量进行推测,从而获取需要输入的全部关键变量数据。本发明综合考虑了建筑负荷和机电系统的相关变量,使得输入变量的特征更为丰富,同时可以在缺少历史数据的情况下仍可以进行关键变量的提取与关键变量缺失值的推测。
Description
技术领域
本发明属于建筑能耗预测技术领域,具体涉及一种用于建筑能耗混合模型的输入变量获取方法和系统。
背景技术
能耗模型中较少的输入变量无法全面的反映对能耗的影响,过多的输入变量又会导致模型计算时间过长且将增加过拟合的风险。从理论上来讲,所有能耗模型需要输入的变量都与能耗有着或多或少的影响,但输入变量的增加往往会导致数据驱动模型所需的计算量急剧增长,所有的相关变量均作为数据驱动模型的输入势必会造成“维度灾难”。各输入变量对能耗的影响并不是相同的,将对能耗有显著影响的变量作为输入可使模型在可接受的计算量内实现较为准确的能耗预测。
现有采用过滤法、标准回归系数法和偏回归系数法进行输入变量提取方法往往对线性模型有着很好的作用,但对能耗模型这种非线性模型而言效果并不太理想,同时目前现有的输入变量提取方法往往要依赖大量的历史相关数据,缺少历史相关数据时往往无法得到对应结果或者结果误差较大。
发明内容
有鉴于此,本发明旨在解决现有的输入变量提取方法对能耗模型的提取不理想且在缺少历史相关数据时无法得到对应结果或者结果误差较大的问题。
为了解决上述技术问题,本发明提供以下技术方案:
第一方面,本发明提供了一种用于建筑能耗混合模型的输入变量获取方法,包括:
将初始变量划分为负荷相关变量和机电相关变量并进行抽样;
根据初始变量的抽样值进行能耗模拟,分析初始变量对输出变量的影响,针对负荷相关变量和机电相关变量,分别采用敏感性分析方法和嵌入法从初始变量中进行关键变量的提取;
当初始数据集缺少历史能耗数据时,对根据历史能耗数据补全关键变量后的实际建筑数据集进行关键变量的关联规则挖掘,利用挖掘出的关联规则,从初始数据集中的已知关键变量对缺失关键变量进行推测,从而获取需要输入的全部关键变量数据。
进一步地,针对负荷相关变量,采用敏感性分析方法从初始变量中进行关键变量的提取,具体包括:
确定初始变量及其取值范围;
在取值范围内,用Morris方法和拉丁超立方方法分别对初始变量进行抽样,生成一系列初始变量值的集合;
根据初始变量值的集合生成能耗模拟工具的输入,利用能耗模拟工具进行模拟计算,得到能耗值;
将抽样得到的初始变量集合作为输入,能耗模拟值作为输出,分别用 Morris、标准秩回归系数法和偏秩回归系数法方法提取关键变量,其中用Morris方法提取关键变量时,需对应Morris方法抽样得到的初始变量集合作为输入,在使用其他方法提取关键变量时,对应拉丁超立方方法抽样得到的初始变量集合。
进一步地,针对机电相关变量,采用嵌入法从初始变量中进行关键变量的提取,具体包括:
确定初始变量及其取值范围;
在取值范围内,利用拉丁超立方抽样法对初始连续型变量进行抽样、对初始离散型变量进行排列组合;
利用能耗模拟工具建立输入变量和输出变量之间的对应关系;
采用XGBoost算法对机电相关变量中的关键变量进行提取。
进一步地,当初始数据集缺少历史能耗数据时,对缺失关键变量进行推测,具体包括:
根据连续型关键变量的取值范围进行等距离的离散化;
对根据历史能耗数据补全关键变量后的实际建筑数据集进行关键变量的关联规则挖掘;
针对连续型关键变量,若缺失关键变量和已知关键变量之前存在关联关系,则根据已经存在的关联规则表进行缺失值的推测,若已知关键变量大于3项,则根据将已知变量进行2项及3项的排列组合,进行多次推测,然后取多次推测的最大值和最小值作为关键变量推测值的上下限;
针对离散型关键变量,取与缺失的离散型关键变量值最近的两个离散值作为被推测值的上下限,并在上下限区间内采用拉丁超立方抽样,得到被推测值的分布。
进一步地,当初始数据集有历史能耗数据时,对缺失关键变量进行推测,还包括:
利用能耗模拟工具生成的模拟数据将能耗模型灰箱化得到用于关键变量缺失值推测的能耗模拟值预测模型;
确定待推测的关键变量及其取值范围;
初始化待推测关键变量补全输入参数,并利用能耗模拟值预测模型模拟得到逐时的能耗模拟值;
根据历史能耗的颗粒度进行模拟数据颗粒度的转换;
计算实际数据和模拟数据之间的误差,将误差作为遗传算法的目标函数进行迭代计算,直至目标函数收敛,将收敛时的关键变量推测值作为最终的关键变量推测值。
第二方面,本发明提供了一种用于建筑能耗混合模型的输入变量获取系统,包括:
抽样单元,用于将初始变量划分为负荷相关变量和机电相关变量并进行抽样;
关键变量确定单元,用于根据初始变量的抽样值进行能耗模拟,分析初始变量对输出变量的影响,针对负荷相关变量和机电相关变量,分别采用敏感性分析方法和嵌入法从初始变量中进行关键变量的提取;
关键变量获取单元,用于当初始数据集缺少历史能耗数据时,对根据历史能耗数据补全关键变量后的实际建筑数据集进行关键变量的关联规则挖掘,利用挖掘出的关联规则,从初始数据集中的已知关键变量对缺失关键变量进行推测,从而获取需要输入的全部关键变量数据。
进一步地,在关键变量确定单元中,针对负荷相关变量,采用敏感性分析方法从初始变量中进行关键变量的提取,具体包括:
确定初始变量及其取值范围;
在取值范围内,用Morris方法和拉丁超立方方法分别对初始变量进行抽样,生成一系列初始变量值的集合;
根据初始变量值的集合生成能耗模拟工具的输入,利用能耗模拟工具进行模拟计算,得到能耗值;
将抽样得到的初始变量集合作为输入,能耗模拟值作为输出,分别用 Morris、标准秩回归系数法和偏秩回归系数法方法提取关键变量,其中用Morris方法提取关键变量时,需对应Morris方法抽样得到的初始变量集合作为输入,在使用其他方法提取关键变量时,对应拉丁超立方方法抽样得到的初始变量集合。
进一步地,在关键变量确定单元中,针对机电相关变量,采用嵌入法从初始变量中进行关键变量的提取,具体包括:
确定初始变量及其取值范围;
在取值范围内,利用拉丁超立方抽样法对初始连续型变量进行抽样、对初始离散型变量进行排列组合;
利用能耗模拟工具建立输入变量和输出变量之间的对应关系;
采用XGBoost算法对机电相关变量中的关键变量进行提取。
进一步地,在关键变量获取单元中,当初始数据集缺少历史能耗数据时,对缺失关键变量进行推测,具体包括:
根据连续型关键变量的取值范围进行等距离的离散化;
对根据历史能耗数据补全关键变量后的实际建筑数据集进行关键变量的关联规则挖掘;
针对连续型关键变量,若缺失关键变量和已知关键变量之前存在关联关系,则根据已经存在的关联规则表进行缺失值的推测,若已知关键变量大于3项,则根据将已知变量进行2项及3项的排列组合,进行多次推测,然后取多次推测的最大值和最小值作为关键变量推测值的上下限;
针对离散型关键变量,取与缺失的离散型关键变量值最近的两个离散值作为被推测值的上下限,并在上下限区间内采用拉丁超立方抽样,得到被推测值的分布。
进一步地,在关键变量获取单元中,当初始数据集有历史能耗数据时,对缺失关键变量进行推测,还包括:
利用能耗模拟工具生成的模拟数据将能耗模型灰箱化得到用于关键变量缺失值推测的能耗模拟值预测模型;
确定待推测的关键变量及其取值范围;
初始化待推测关键变量补全输入参数,并利用能耗模拟值预测模型模拟得到逐时的能耗模拟值;
根据历史能耗的颗粒度进行模拟数据颗粒度的转换;
计算实际数据和模拟数据之间的误差,将误差作为遗传算法的目标函数进行迭代计算,直至目标函数收敛,将收敛时的关键变量推测值作为最终的关键变量推测值。
综上,本发明提供了一种用于建筑能耗混合模型的输入变量获取方法和系统,其中本发明的方法包括将初始变量划分为负荷相关变量和机电相关变量;对初始变量进行抽样并进行能耗模拟,分析初始变量对输出变量的影响,然后分别针对负荷相关和机电相关变量进行关键变量的提取;并当初始数据集缺少历史能耗数据时,对根据历史能耗数据补全关键变量后的实际建筑数据集进行关键变量的关联规则挖掘,利用挖掘出的关联规则,从初始数据集中的已知关键变量对缺失关键变量进行推测,从而获取需要输入的全部关键变量数据。本发明综合考虑了建筑负荷和机电系统的相关变量,使得输入变量的特征更为丰富,同时可以在缺少历史数据的情况下仍可以进行关键变量的提取与关键变量缺失值的推测。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1为本发明实施例提供的一种用于建筑能耗混合模型的输入变量获取方法的流程示意图;
图2为本发明实施例提供的关键变量提取的流程示意图;
图3为本发明实施例提供的基于遗传算法的关键变量推测的流程示意图。
具体实施方式
为使得本发明的目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本发明一部分实施例,而非全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
能耗模型中较少的输入变量无法全面的反映对能耗的影响,过多的输入变量又会导致模型计算时间过长且将增加过拟合的风险。从理论上来讲,所有能耗模型需要输入的变量都与能耗有着或多或少的影响,但输入变量的增加往往会导致数据驱动模型所需的计算量急剧增长,所有的相关变量均作为数据驱动模型的输入势必会造成“维度灾难”。各输入变量对能耗的影响并不是相同的,将对能耗有显著影响的变量作为输入可使模型在可接受的计算量内实现较为准确的能耗预测。
现有关键变量提取方法有过滤法和敏感性分析法。其中过滤法(filter)利用方差、卡方检验、皮尔森相关系数等方法去除掉包含信息较少或相关性较高的特征。敏感性分析方法包括 Morris 法,标准回归系数法(SRC)和偏回归系数法(PCC)等。
对于现有提取方法用过滤法(filter)、标准回归系数法(SRC)和偏回归系数法(PCC)进行输入变量提取往往对线性模型有着很好的作用,但对能耗模型这种非线性模型而言效果并不太理想;现有能耗模型提取的特征仍不够丰富,鲜少涉及建筑物理相关参数;目前现有的输入变量提取方法往往要依赖大量的历史相关数据,缺少历史相关数据时往往无法得到对应结果或者结果误差较大。
基于此,本发明提供了一种用于建筑能耗混合模型的输入变量获取方法和系统。
以下对本发明的一种用于建筑能耗混合模型的输入变量获取方法的实施例进行详细的介绍。
请参阅图1,本实施例提供一种用于建筑能耗混合模型的输入变量获取方法,包括:
S100:将初始变量划分为负荷相关变量和机电相关变量并进行抽样。
S200:根据初始变量的抽样值进行能耗模拟,分析初始变量对输出变量的影响,针对负荷相关变量和机电相关变量,分别采用敏感性分析方法和嵌入法从初始变量中进行关键变量的提取。
如图2所示,图2是关键变量的提取流程。由于初始变量过多将会导致所需算例过多,且负荷相关变量和机电相关变量对能耗的影响不完全相同,故将初始变量分为建筑负荷相关变量和机电相关变量两类。其次,根据初始变量的抽样值,利用 python 语言和其eppy库程序化地生成能耗模拟工具EnergyPlus所需的IDF文件,并调用EnergyPlus进行能耗模拟,得到制冷能耗和制热能耗。然后,分析初始变量对输出变量的影响。对于建筑负荷相关变量,采用敏感性分析方法从初始变量中提取出建筑负荷相关的关键变量,对于机电系统相关变量,由于这部分变量对能耗的影响并不仅限于峰值,对于这部分变量采用嵌入法进行关键变量的提取。以下对两部分相关变量的关键变量提取进行分别介绍。
(1)负荷部分关键变量
1)确定初始变量及其取值范围;
2)在取值范围内,用Morris方法和拉丁超立方方法分别对初始变量进行抽样,生成一系列初始变量值的集合;
3)根据初始变量集合批量生成EnergyPlus的输入——IDF文件,再调用EnergyPlus进行模拟计算,得到对应的“因变量”——能耗值;
4)将抽样得到的初始变量集合作为输入,能耗模拟值作为输出,分别用Morris、标准秩回归系数法(SRRC)和偏秩回归系数法(PRCC)方法提取关键变量,其中用Morris方法提取关键变量时,需对应Morris方法抽样得到的初始变量集合作为输入,在使用其他方法提取关键变量时,对应拉丁超立方抽样得到的初始变量集合。
(2)机电系统部分关键变量
1)进行确定初始变量及其取值范围;
2)进行初始变量的抽样:利用拉丁超立方抽样法对连续型变量进行抽样、对离散型变量进行排列组合;
3)批量生成算例:同样利用python语言和其eppy库进行模型的批量建立,采用EnergyPlus作为模拟引擎建立输入变量与输出的对应关系。将负荷部分变量固定为规范或手册中的推荐值,将初始变量根据采样值设置到模型中;
4)提取关键变量:采用XGBoost算法对于机电系统部分的关键变量进行提取。
S300:当初始数据集缺少历史能耗数据时,对根据历史能耗数据补全关键变量后的实际建筑数据集进行关键变量的关联规则挖掘,利用挖掘出的关联规则,从初始数据集中的已知关键变量对缺失关键变量进行推测,从而获取需要输入的全部关键变量数据。
在本实施例中,具体涉及两种场景下关键变量缺失值的推测。
第一种场景为存在历史能耗数据时的关键变量缺失值推测,已知的历史数据可能是逐时、逐日或者逐月值。在这种场景下将采用遗传算法进行缺失值的推测,将误差最小的模拟数据对应的关键变量值作为最佳关键变量推测值。
第二种场景为无历史能耗数据的关键变量缺失值推测,在这种场景下无法构建输入与输出之间的关系,将利用关联规则挖掘关键变量之间的联系,从而进行关键变量缺失值的推测。以下为两种场景的具体推测过程。
(1)有历史能耗的关键变量推测-基于遗传算法
1)利用快速模拟工具(白箱模型)生成的模拟数据将能耗模型灰箱化得到用于关键变量缺失值推测的能耗模拟值预测模型:
a)用上述所提到的关键变量提取方法提取关键变量,将其作为灰箱模型的输入变量。
b)用上述提及的快速建模工具进行建模并得到能耗模拟结果作为灰箱模型的输出。
c)利用XGBoost 算法进行建模,得到能耗模拟值预测模型。
2)确定待推测的关键变量及其取值范围。
3)初始化待推测关键变量补全输入参数,并利用能耗模拟值预测模型快速得到逐时的能耗模拟值。
4)根据历史能耗的颗粒度进行模拟数据颗粒度的转换,由于能耗模拟值预测模型的输出颗粒度为最细的逐时值,在进行颗粒度转换(颗粒度由细变粗)时仅需在指定时间内进行数据的加和。
5)计算实际数据和模拟数据之间的误差CV_RMSE,将其作为遗传算法的目标函数。经过多次迭代,目标函数CV_RMSE会逐渐减小直至收敛,将收敛时的关键变量推测值视为最优的关键变量值,并将其作为最终的关键变量推测值。
图3为基于遗传算法的关键变量推测流程。
(2)无历史能耗的关键变量推测--基于关联规则
采用根据历史能耗的数据补全关键变量后的数据集(实际建筑数据集),基于该数据集进行实际建筑中关键变量的关联规则挖掘,在应用时,无需历史能耗数据,直接利用该关联规则,通过已知的关键变量,进行缺失的关键变量值的推测。具体实现步骤如下:
1)将连续变量离散化,由于基于 Apriori 的关联规则挖掘算法仅适用于离散型变量,故首先进行连续变量的离散化,根据连续型关键变量的取值范围进行等距离的离散化。
2)基于上述的实际建筑数据集,进行各变量间关联规则的挖掘,设置最小支持度为0.4,最大的k值为4,进行2项、3项和4项频繁项集的挖掘。
3)若缺失关键变量和已知关键变量之前存在关联关系,则根据关联规则表进行缺失值的推测,若已知关键变量大于3项,则根据将已知变量进行2项及3项的排列组合,进行多次推测,然后取多次推测的最大值和最小值作为关键变量推测值的上下限。
4)进行推测的离散关键变量值的还原,取与该值最近的两个离散值作为该被推测值的上下限,并在该上下限区间内采用拉丁超立方抽样,得到被推测值的分布。若不存在关联关系则假设其在取值范围内均匀分布,并在该区间内进行拉丁超立方抽样,得到被推测值的分布。
本实施例介绍的利用Apriori关联规则挖掘算法,基于已知关键变量进行缺失关键变量值的推测为不确定推测,得到的结果为在推测变量值所在的区间内的抽样结果。
本实施例提供的一种用于建筑能耗混合模型的输入变量获取方法,包括将初始变量划分为负荷相关变量和机电相关变量;对初始变量进行抽样值进行能耗模拟,分析初始变量对输出变量的影响,然后分别针对负荷相关和机电相关变量进行关键变量的提取;并当初始数据集缺少历史能耗数据时,对根据历史能耗数据补全关键变量后的实际建筑数据集进行关键变量的关联规则挖掘,利用挖掘出的关联规则,从初始数据集中的已知关键变量对缺失关键变量进行推测,从而获取需要输入的全部关键变量数据。本发明综合考虑了建筑负荷和机电系统的相关变量,使得输入变量的特征更为丰富,同时可以在缺少历史数据的情况下仍可以进行关键变量的提取与关键变量缺失值的推测。
以上是对本发明的一种用于建筑能耗混合模型的输入变量获取方法的实施例进行的详细介绍,以下将对本发明的一种用于建筑能耗混合模型的输入变量获取系统的实施例进行详细的介绍。
本实施例提供了一种用于建筑能耗混合模型的输入变量获取系统,包括抽样单元、关键变量确定单元和关键变量获取单元。
在本实施例中,抽样单元用于将初始变量划分为负荷相关变量和机电相关变量并进行抽样。
在本实施例中,关键变量确定单元用于根据初始变量的抽样值进行能耗模拟,分析初始变量对输出变量的影响,针对负荷相关变量和机电相关变量,分别采用敏感性分析方法和嵌入法从初始变量中进行关键变量的提取。
具体的,在关键变量确定单元中,针对负荷相关变量,采用敏感性分析方法从初始变量中进行关键变量的提取,具体包括:
确定初始变量及其取值范围;
在取值范围内,用Morris方法和拉丁超立方方法分别对初始变量进行抽样,生成一系列初始变量值的集合;
根据初始变量值的集合生成能耗模拟工具的输入,利用能耗模拟工具进行模拟计算,得到能耗值;
将抽样得到的初始变量集合作为输入,能耗模拟值作为输出,分别用 Morris、标准秩回归系数法和偏秩回归系数法方法提取关键变量,其中用Morris方法提取关键变量时,需对应Morris方法抽样得到的初始变量集合作为输入,在使用其他方法提取关键变量时,对应拉丁超立方方法抽样得到的初始变量集合。
在关键变量确定单元中,针对机电相关变量,采用嵌入法从初始变量中进行关键变量的提取,具体包括:
确定初始变量及其取值范围;
在取值范围内,利用拉丁超立方抽样法对初始连续型变量进行抽样、对初始离散型变量进行排列组合;
利用能耗模拟工具建立输入变量和输出变量之间的对应关系;
采用XGBoost算法对机电相关变量中的关键变量进行提取。
在本实施例中,关键变量获取单元用于当初始数据集缺少历史能耗数据时,对根据历史能耗数据补全关键变量后的实际建筑数据集进行关键变量的关联规则挖掘,利用挖掘出的关联规则,从初始数据集中的已知关键变量对缺失关键变量进行推测,从而获取需要输入的全部关键变量数据。
具体的,在关键变量获取单元中,当初始数据集缺少历史能耗数据时,对缺失关键变量进行推测,具体包括:
根据连续型关键变量的取值范围进行等距离的离散化;
对根据历史能耗数据补全关键变量后的实际建筑数据集进行关键变量的关联规则挖掘;
针对连续型关键变量,若缺失关键变量和已知关键变量之前存在关联关系,则根据已经存在的关联规则表进行缺失值的推测,若已知关键变量大于3项,则根据将已知变量进行2项及3项的排列组合,进行多次推测,然后取多次推测的最大值和最小值作为关键变量推测值的上下限;
针对离散型关键变量,取与缺失的离散型关键变量值最近的两个离散值作为被推测值的上下限,并在上下限区间内采用拉丁超立方抽样,得到被推测值的分布。
另外,在关键变量获取单元中,当初始数据集有历史能耗数据时,对缺失关键变量进行推测,还包括:
利用能耗模拟工具生成的模拟数据将能耗模型灰箱化得到用于关键变量缺失值推测的能耗模拟值预测模型;
确定待推测的关键变量及其取值范围;
初始化待推测关键变量补全输入参数,并利用能耗模拟值预测模型模拟得到逐时的能耗模拟值;
根据历史能耗的颗粒度进行模拟数据颗粒度的转换;
计算实际数据和模拟数据之间的误差,将误差作为遗传算法的目标函数进行迭代计算,直至目标函数收敛,将收敛时的关键变量推测值作为最终的关键变量推测值。
需要说明的是,本实施例提供的输入变量获取系统用于实现前述实施例提供的输入变量获取方法,各单元的具体设置均以完整实现该方法为准,在此不再赘述。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种用于建筑能耗混合模型的输入变量获取方法,其特征在于,包括:
将初始变量划分为负荷相关变量和机电相关变量并进行抽样;
根据所述初始变量的抽样值进行能耗模拟,分析所述初始变量对输出变量的影响,针对所述负荷相关变量和所述机电相关变量,分别采用敏感性分析方法和嵌入法从所述初始变量中进行关键变量的提取;
当初始数据集缺少历史能耗数据时,对实际建筑数据集进行关键变量的关联规则挖掘,利用挖掘出的所述关联规则,从所述初始数据集中的已知关键变量对缺失关键变量进行推测,从而获取需要输入的全部关键变量数据,所述实际建筑数据集为根据自身历史能耗数据补全关键变量后的数据集。
2.根据权利要求1所述的用于建筑能耗混合模型的输入变量获取方法,其特征在于,针对所述负荷相关变量,采用敏感性分析方法从所述初始变量中进行关键变量的提取,具体包括:
确定初始变量及其取值范围;
在取值范围内,用Morris方法和拉丁超立方方法分别对初始变量进行抽样,生成一系列初始变量值的集合;
根据所述初始变量值的集合生成能耗模拟工具的输入,利用所述能耗模拟工具进行模拟计算,得到能耗值;
将抽样得到的初始变量集合作为输入,能耗模拟值作为输出,分别用 Morris、标准秩回归系数法和偏秩回归系数法方法提取关键变量,其中用Morris方法提取所述关键变量时,需对应所述Morris方法抽样得到的初始变量集合作为输入,在使用其他方法提取所述关键变量时,对应所述拉丁超立方方法抽样得到的初始变量集合。
3.根据权利要求1所述的用于建筑能耗混合模型的输入变量获取方法,其特征在于,针对所述机电相关变量,采用嵌入法从所述初始变量中进行关键变量的提取,具体包括:
确定初始变量及其取值范围;
在取值范围内,利用拉丁超立方抽样法对初始连续型变量进行抽样、对初始离散型变量进行排列组合;
利用能耗模拟工具建立输入变量和输出变量之间的对应关系;
采用XGBoost算法对所述机电相关变量中的关键变量进行提取。
4.根据权利要求1所述的用于建筑能耗混合模型的输入变量获取方法,其特征在于,当初始数据集缺少历史能耗数据时,对缺失关键变量进行推测,具体包括:
根据连续型关键变量的取值范围进行等距离的离散化;
对根据历史能耗数据补全关键变量后的实际建筑数据集进行关键变量的关联规则挖掘;
针对连续型关键变量,若所述缺失关键变量和所述已知关键变量之前存在关联关系,则根据已经存在的关联规则表进行缺失值的推测,若已知关键变量大于3项,则根据将已知变量进行2项及3项的排列组合,进行多次推测,然后取多次推测的最大值和最小值作为关键变量推测值的上下限;
针对离散型关键变量,取与缺失的离散型关键变量值最近的两个离散值作为被推测值的上下限,并在上下限区间内采用拉丁超立方抽样,得到被推测值的分布。
5.根据权利要求1所述的用于建筑能耗混合模型的输入变量获取方法,其特征在于,当初始数据集有历史能耗数据时,对缺失关键变量进行推测,还包括:
利用能耗模拟工具生成的模拟数据将能耗模型灰箱化得到用于关键变量缺失值推测的能耗模拟值预测模型;
确定待推测的关键变量及其取值范围;
初始化待推测关键变量补全输入参数,并利用所述能耗模拟值预测模型模拟得到逐时的能耗模拟值;
根据历史能耗的颗粒度进行模拟数据颗粒度的转换;
计算实际数据和所述模拟数据之间的误差,将所述误差作为遗传算法的目标函数进行迭代计算,直至所述目标函数收敛,将收敛时的关键变量推测值作为最终的关键变量推测值。
6.一种用于建筑能耗混合模型的输入变量获取系统,其特征在于,包括:
抽样单元,用于将初始变量划分为负荷相关变量和机电相关变量并进行抽样;
关键变量确定单元,用于根据所述初始变量的抽样值进行能耗模拟,分析所述初始变量对输出变量的影响,针对所述负荷相关变量和所述机电相关变量,分别采用敏感性分析方法和嵌入法从所述初始变量中进行关键变量的提取;
关键变量获取单元,用于当初始数据集缺少历史能耗数据时,对实际建筑数据集进行关键变量的关联规则挖掘,利用挖掘出的所述关联规则,从所述初始数据集中的已知关键变量对缺失关键变量进行推测,从而获取需要输入的全部关键变量数据,所述实际建筑数据集为根据自身历史能耗数据补全关键变量后的数据集。
7.根据权利要求6所述的用于建筑能耗混合模型的输入变量获取系统,其特征在于,在所述关键变量确定单元中,针对所述负荷相关变量,采用敏感性分析方法从所述初始变量中进行关键变量的提取,具体包括:
确定初始变量及其取值范围;
在取值范围内,用Morris方法和拉丁超立方方法分别对初始变量进行抽样,生成一系列初始变量值的集合;
根据所述初始变量值的集合生成能耗模拟工具的输入,利用所述能耗模拟工具进行模拟计算,得到能耗值;
将抽样得到的初始变量集合作为输入,能耗模拟值作为输出,分别用 Morris、标准秩回归系数法和偏秩回归系数法方法提取关键变量,其中用Morris方法提取所述关键变量时,需对应所述Morris方法抽样得到的初始变量集合作为输入,在使用其他方法提取所述关键变量时,对应所述拉丁超立方方法抽样得到的初始变量集合。
8.根据权利要求6所述的用于建筑能耗混合模型的输入变量获取系统,其特征在于,在所述关键变量确定单元中,针对所述机电相关变量,采用嵌入法从所述初始变量中进行关键变量的提取,具体包括:
确定初始变量及其取值范围;
在取值范围内,利用拉丁超立方抽样法对初始连续型变量进行抽样、对初始离散型变量进行排列组合;
利用能耗模拟工具建立输入变量和输出变量之间的对应关系;
采用XGBoost算法对所述机电相关变量中的关键变量进行提取。
9.根据权利要求6所述的用于建筑能耗混合模型的输入变量获取系统,其特征在于,在所述关键变量获取单元中,当初始数据集缺少历史能耗数据时,对缺失关键变量进行推测,具体包括:
根据连续型关键变量的取值范围进行等距离的离散化;
对根据历史能耗数据补全关键变量后的实际建筑数据集进行关键变量的关联规则挖掘;
针对连续型关键变量,若所述缺失关键变量和所述已知关键变量之前存在关联关系,则根据已经存在的关联规则表进行缺失值的推测,若已知关键变量大于3项,则根据将已知变量进行2项及3项的排列组合,进行多次推测,然后取多次推测的最大值和最小值作为关键变量推测值的上下限;
针对离散型关键变量,取与缺失的离散型关键变量值最近的两个离散值作为被推测值的上下限,并在上下限区间内采用拉丁超立方抽样,得到被推测值的分布。
10.根据权利要求6所述的用于建筑能耗混合模型的输入变量获取系统,其特征在于,在所述关键变量获取单元中,当初始数据集有历史能耗数据时,对缺失关键变量进行推测,还包括:
利用能耗模拟工具生成的模拟数据将能耗模型灰箱化得到用于关键变量缺失值推测的能耗模拟值预测模型;
确定待推测的关键变量及其取值范围;
初始化待推测关键变量补全输入参数,并利用所述能耗模拟值预测模型模拟得到逐时的能耗模拟值;
根据历史能耗的颗粒度进行模拟数据颗粒度的转换;
计算实际数据和所述模拟数据之间的误差,将所述误差作为遗传算法的目标函数进行迭代计算,直至所述目标函数收敛,将收敛时的关键变量推测值作为最终的关键变量推测值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210815273.6A CN114880959B (zh) | 2022-07-11 | 2022-07-11 | 一种用于建筑能耗混合模型的输入变量获取方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210815273.6A CN114880959B (zh) | 2022-07-11 | 2022-07-11 | 一种用于建筑能耗混合模型的输入变量获取方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114880959A CN114880959A (zh) | 2022-08-09 |
CN114880959B true CN114880959B (zh) | 2022-12-30 |
Family
ID=82683330
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210815273.6A Active CN114880959B (zh) | 2022-07-11 | 2022-07-11 | 一种用于建筑能耗混合模型的输入变量获取方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114880959B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106597862A (zh) * | 2016-12-13 | 2017-04-26 | 山东建筑大学 | 基于关联规则挖掘的建筑能耗控制装置及方法 |
CN111159884A (zh) * | 2019-12-27 | 2020-05-15 | 任惠 | 一种寒地办公建筑节能设计决策支持系统及方法 |
CN112257174A (zh) * | 2020-10-13 | 2021-01-22 | 南京航空航天大学 | 一种飞机供电系统智能化集成设计系统及方法 |
WO2021063033A1 (zh) * | 2019-09-30 | 2021-04-08 | 北京国双科技有限公司 | 空调能耗模型训练方法与空调系统控制方法 |
CN113343334A (zh) * | 2021-05-28 | 2021-09-03 | 同济大学 | 基于空调能耗敏感变量的跨建筑空调能耗预测方法及装置 |
CN113792762A (zh) * | 2021-08-24 | 2021-12-14 | 华南理工大学 | 基于贝叶斯优化LightGBM的冷水机组故障诊断方法、系统及介质 |
CN114626640A (zh) * | 2022-04-27 | 2022-06-14 | 西安建筑科技大学 | 基于特征工程和lstm神经网络的天然气负荷预测方法及系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113870057A (zh) * | 2021-08-18 | 2021-12-31 | 华建数创(上海)科技有限公司 | 基于多模型融合的建筑能耗关联项挖掘方法 |
-
2022
- 2022-07-11 CN CN202210815273.6A patent/CN114880959B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106597862A (zh) * | 2016-12-13 | 2017-04-26 | 山东建筑大学 | 基于关联规则挖掘的建筑能耗控制装置及方法 |
WO2021063033A1 (zh) * | 2019-09-30 | 2021-04-08 | 北京国双科技有限公司 | 空调能耗模型训练方法与空调系统控制方法 |
CN111159884A (zh) * | 2019-12-27 | 2020-05-15 | 任惠 | 一种寒地办公建筑节能设计决策支持系统及方法 |
CN112257174A (zh) * | 2020-10-13 | 2021-01-22 | 南京航空航天大学 | 一种飞机供电系统智能化集成设计系统及方法 |
CN113343334A (zh) * | 2021-05-28 | 2021-09-03 | 同济大学 | 基于空调能耗敏感变量的跨建筑空调能耗预测方法及装置 |
CN113792762A (zh) * | 2021-08-24 | 2021-12-14 | 华南理工大学 | 基于贝叶斯优化LightGBM的冷水机组故障诊断方法、系统及介质 |
CN114626640A (zh) * | 2022-04-27 | 2022-06-14 | 西安建筑科技大学 | 基于特征工程和lstm神经网络的天然气负荷预测方法及系统 |
Non-Patent Citations (3)
Title |
---|
"Development of a key-variable-based parallel HVAC energy predictive ";Huajin Sha 等;《Building Simulation》;20220218;第15卷(第7期);1193–1208 * |
"基于关联分类技术的短期负荷数据缺损处理";钱进 等;《电力系统及其自动化学报》;20061225(第06期);83-86 * |
"建筑空调能耗关键变量通用提取方法及工具的开发";沙华晶 等;《土木与环境工程学报(中英文)》;20220525;176-184 * |
Also Published As
Publication number | Publication date |
---|---|
CN114880959A (zh) | 2022-08-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10606862B2 (en) | Method and apparatus for data processing in data modeling | |
Bučar et al. | Reliability approximation using finite Weibull mixture distributions | |
CN110149237B (zh) | 一种Hadoop平台计算节点负载预测方法 | |
US20070061144A1 (en) | Batch statistics process model method and system | |
Steiger et al. | An improved batch means procedure for simulation output analysis | |
CN108921359B (zh) | 一种分布式瓦斯浓度预测方法及装置 | |
CN109936113B (zh) | 一种基于随机森林算法的保护动作智能诊断方法及系统 | |
CN115392592B (zh) | 一种存储产品参数配置推荐方法、装置、设备及介质 | |
CN114169645A (zh) | 一种智能电网短期负荷预测方法 | |
CN103885867A (zh) | 一种模拟电路性能的在线评价方法 | |
CN114330642A (zh) | 一种用于多采样时间的建筑电力负荷预测方法 | |
CN111222553A (zh) | 机器学习模型的训练数据处理方法、装置和计算机设备 | |
CN114880959B (zh) | 一种用于建筑能耗混合模型的输入变量获取方法和系统 | |
CN113420506A (zh) | 掘进速度的预测模型建立方法、预测方法及装置 | |
Lourenco et al. | Short-term load forecasting using a Gaussian process model: The influence of a derivative term in the input regressor | |
Liu et al. | An automatic forecasting method for time series | |
Peralta et al. | Unit commitment with load uncertainty by joint chance-constrained programming | |
CN114971736A (zh) | 电力计量物资需求预测方法、装置、电子设备和存储介质 | |
Kesumawati et al. | Forecasting Bank Indonesia Rate based on Fuzzy Time Series with Higher Forecast Accuracy Rate | |
Koen et al. | Developing long-term scenario forecasts to support electricity generation investment decisions | |
Musa | A Hybrid Modern and Classical Algorithm for Indonesian Electricity Demand Forecasting | |
US20240135062A1 (en) | System, server, and method for predicting and controlling emissions in an industrial environment | |
CN113554106B (zh) | 一种面向电力缺失数据的协同补全方法 | |
CN112465268B (zh) | 一种在线家庭负荷用电组合识别与耗电预测的方法 | |
Wen et al. | Reliability Growth Model Based on Bayesian Parameter Inference |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |