CN110781538B - 基于实地监测的开窗仿真算法 - Google Patents
基于实地监测的开窗仿真算法 Download PDFInfo
- Publication number
- CN110781538B CN110781538B CN201910930650.9A CN201910930650A CN110781538B CN 110781538 B CN110781538 B CN 110781538B CN 201910930650 A CN201910930650 A CN 201910930650A CN 110781538 B CN110781538 B CN 110781538B
- Authority
- CN
- China
- Prior art keywords
- principal component
- window
- households
- windowing
- data set
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004422 calculation algorithm Methods 0.000 title claims abstract description 9
- 238000012544 monitoring process Methods 0.000 title claims abstract description 8
- 238000000034 method Methods 0.000 claims abstract description 21
- 230000006399 behavior Effects 0.000 claims abstract description 15
- 238000003064 k means clustering Methods 0.000 claims abstract description 12
- 238000007477 logistic regression Methods 0.000 claims abstract description 8
- 239000011159 matrix material Substances 0.000 claims description 13
- 238000000513 principal component analysis Methods 0.000 claims description 8
- 239000013598 vector Substances 0.000 claims description 5
- 238000003745 diagnosis Methods 0.000 claims description 4
- 238000004088 simulation Methods 0.000 claims description 4
- 230000001419 dependent effect Effects 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 3
- 238000000611 regression analysis Methods 0.000 claims description 3
- 230000009466 transformation Effects 0.000 claims description 3
- 238000013480 data collection Methods 0.000 claims 1
- 238000012216 screening Methods 0.000 claims 1
- 238000013178 mathematical model Methods 0.000 abstract description 2
- 238000005265 energy consumption Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 3
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000009423 ventilation Methods 0.000 description 2
- 244000062793 Sorghum vulgare Species 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 229910002092 carbon dioxide Inorganic materials 0.000 description 1
- 239000001569 carbon dioxide Substances 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 238000011217 control strategy Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 235000019713 millet Nutrition 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 239000013618 particulate matter Substances 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 239000012855 volatile organic compound Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Complex Calculations (AREA)
Abstract
本发明公开了一种基于实地监测的开窗仿真算法。本发明基于对住宅建筑中卧室的窗户状态和相关参数长达一年的连续监测,筛选出开窗行为的显著性驱动因素,建立了开窗状态和其驱动因素的主成分Logistic模型。相比于传统的Logistic回归,该数学模型可有效消除数据的多重共线性,提高模型的稳定性和准确性。同时,考虑到实际住户开窗行为的随机性和多样性,采用了k‑means聚类方法对住户进行分类。根据聚类结果,针对每一类住户分别建立主成分Logistic模型,提高预测的准确率。
Description
技术领域
本发明属于建筑行为、建筑环境及能耗模拟领域,具体涉及一种基于k-means聚类和主成分Logistic模型的开窗仿真算法。
背景技术
我国住宅的自然通风主要通过开窗来实现,开窗行为是一种简单而有效的改善室内空气品质,调节人体热舒适的方式,同时也是建筑模拟软件一个重要的输入项。研究表明,开窗行为显著影响室内颗粒物、总挥发性有机化合物(TVOC)和二氧化碳浓度;开窗通风也会改变室内的温度、风速等热环境条件,从而影响人体的热舒适;同时,合适的开窗控制策略可实现17%~47%的节能。
目前大部分建筑能耗模拟软件都采用固定的时间表来定义人的行为模式,但由于实际建筑中人行为的随机性和多样性,造成建筑模拟能耗和实际运行能耗会产生较大偏差,建立开窗行为模型对于建筑能耗模拟结果的准确性具有重要作用。
发明内容
本发明针对现有大部分建筑能耗模拟软件采用固定的时间表来定义人的行为模式,忽略实际建筑中人行为的随机性的多样性的现状,提出一种基于k-means聚类和主成分Logistic模型的开窗仿真算法。
本发明提出的技术方案如下:基于实地监测的开窗仿真算法,结合了k-means聚类和主成分Logistic回归模型,挖掘出行为数据背后的数学规律,为智能开窗控制方法提供依据。
对住宅建筑中卧室的窗户状态和相关参数(包括室内温湿度、CO2浓度等室内环境数据和室外气象数据)进行长达一年的连续监测。
实施步骤如下:
步骤一:构建窗户状态及其驱动因素的原始数据集;
收集的数据中窗户状态视为目标变量,潜在驱动因素(室内外环境参数和时间)视为解释变量。因窗户状态为二分类变量,可将每种潜在驱动因素分别和窗户状态进行单因素Logistic回归,筛选出具有显著性影响的因子(p<0.05),构建窗户状态及其驱动因素的原始数据集;
步骤二:采用欠采样的方法对不平衡的数据集进行处理;
欠采样可通过保存所有稀有类样本,并在丰富类别中随机选择与稀有类别样本相等数量的样本,重组为平衡的新数据集以进一步建模。
步骤三:多重共线性诊断
多重共线性关系常增大估计参数的标准误,从而降低模型的稳定性,有时还可出现与实际情况相悖的结果,所以,需要对变量进行多重共线性诊断,一般可根据相关系数、方差膨胀因子VIF(the variance inflation factor)、容许值TOL(Tolerance)诊断:
方差膨胀因子的表达式如下:
其中Ri为以变量xi为因变量,其余xj(j=1,2,…,m)为自变量作回归分析的复相关系数。它是诊断多重共线性严重程度的常用指标之一。一般,学者建议当VIF≥5或VIF≥10时,可认为自变量间存在严重共线性。
步骤四:主成分分析
如果存在多重共线性,则采用主成分分析法提取出相互独立的主成分因子来代替原始变量,如果不存在,则直接进入下一步骤。主成分分析常常通过以下4步解决:
(1)对原来的p个指标进行标准化,以消除变量在数量极或量纲上的影响。
(2)根据标准化后的数据矩阵求出协方差或相关阵。
(3)求出协方差矩阵的特征根和特征向量。
(4)确定主成分,建立主成分得分函数。
步骤五:采用k-means聚类法对住户进行分类
考虑到住户开窗行为的多样性,采用k-means聚类方法将住户分为消极、中等、积极三类。
这是一种迭代求解的聚类分析算法,其步骤是随机选取k(k=3)个对象作为初始的聚类中心,然后计算每个对象与各个种子聚类中心之间的距离
把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给它们的对象就代表一个聚类。每分配一个样本,聚类的聚类中心会根据聚类中现有的对象被重新计算。这个过程将不断重复直到满足某个终止条件。终止条件可以是没有(或最小数目)对象被重新分配给不同的聚类,没有(或最小数目)聚类中心再发生变化,误差平方和局部最小。
步骤六:对每一类住户分别建立主成分Logistic模型。
p是窗户为开启状态的概率
F1,…,Fp是主成分因子。
与现有技术相比,本发明的有益效果在于:
(1)相比于传统的Logistic回归,该数学模型可有效消除数据的多重共线性,提高模型的稳定性和准确性。
(2)考虑到实际住户开窗行为的随机性和多样性,采用了k-means聚类方法对住户进行分类,针对每一类住户分别建立主成分Logistic模型,提高预测的准确率。
附图说明
图1:原始数据集的构建流程图
图2:主成分Logistic模型的构建流程图
具体实施方式
以下结合附图和具体实施例来对本发明做进一步的说明。
本发明实施步骤如下:
步骤一:对住宅建筑中卧室的窗户状态和相关参数进行长达一年的连续监测;
采用小米公司的门窗传感器记录窗户状态。当卧室内所有的窗户关闭时,该房间窗户的状态被视为关闭;只要有一个窗户打开,该房间窗户的状态就被视为打开。
基于文献研究,对潜在的开窗驱动因素同时进行监测。室内环境参数采用了ikair公司开发的传感器进行监测,获取包括室内温湿度、CO2浓度等室内环境数据;室外气象参数(温湿度、太阳辐射强度、风速、风向、降雨、PM2.5浓度等)可从附近的气象站点获取;
步骤二:构建窗户状态及其驱动因素的原始数据集;
收集的数据中窗户状态视为目标变量,潜在驱动因素(室内外环境参数和时间)视为解释变量。因窗户状态为二分类变量,可将每种潜在驱动因素分别和窗户状态进行单因素Logistic回归,筛选出具有显著性影响的因子(p<0.05),构建窗户状态及其驱动因素的原始数据集;
步骤三:采用欠采样的方法对不平衡的数据集进行处理;
当遇到不平衡数据时,以总体分类准确率为学习目标的传统分类算法会过多地关注多数类,从而使得少数类样本的分类性能下降。本数据集也存在不平衡的问题,
欠采样可通过保存所有稀有类样本,并在丰富类别中随机选择与稀有类别样本相等数量的样本,重组为平衡的新数据集以进一步建模。
步骤四:多重共线性诊断
多重共线性关系常增大估计参数的标准误,从而降低模型的稳定性,有时还可出现与实际情况相悖的结果。因此,为了合理地估计和解释一个回归模型,需要对变量进行多重共线性诊断,一般可根据相关系数、方差膨胀因子VIF(the variance inflationfactor)、容许值TOL(Tolerance)诊断:
方差膨胀因子首先由Marquardt于1960年引入的。其表达式如下:
其中Ri为以变量xi为因变量,其余xj(j=1,2,…,m)为自变量作回归分析的复相关系数。它是诊断多重共线性严重程度的常用指标之一。如果xi与其他m-1个自变量间无线性相关(即Ri=0),则VIF=1;反之VIF大于1。VIF随着Ri的增大而增大,VIF的值愈大,说明变量间的多重共线性程度愈强。同自变量的相关系数指标一样,利用VIF来诊断多重共线性的问题,其临界值不易确定。一般,学者建议当VIF≥5或VIF≥10时,可认为自变量间存在严重共线性。
步骤五:主成分分析
如果存在多重共线性,则采用主成分分析法提取出相互独立的主成分因子来代替原始变量,如果不存在,则直接进入下一步骤。主成分分析常常通过以下4步解决:
(1)原始数据标准化
设有n个样本,每个样本有p项指标,则原始样本矩阵为:
X=(Xij)n×p i=1,2,…,n j=1,2,…,p
为了消除变量在数量级或量纲上的影响,先将原变量标准化变换,标准化变换选择Z-score法,公式为:
Xj为指标j的均数,Sj为指标j的标准差。变换后的标准化矩阵为:
Z=(ZXij)n×p i=1,2,…,n j=1,2,…,p
(2)根据标准化后的数据矩阵求出相关矩阵R。
R=(rjk)n×k j=1,2,…,p k=1,2,…,p
rjk为指标j与指标k的相关系数,
(3)求出相关矩阵R的特征根、特征向量和方差贡献率。
由特征方程式|λI-R|=0可以求得p个特征根λi(i=1,2,…,p),将其按按大小顺序排列为λ1≥λ2≥…≥λp≥0。λi等于第i个主成分的方差,反映了各主成分对原变量的权重。每一个特征根对应的特征向量根据以下公式计算:
Cij为第i个主成分对应于第j个标准化变量的因子载荷。
(4)确定主成分,建立主成分得分函数。
主成分的个数由方差贡献率决定,选取尽量少的k个主成分(k<P)来进行综合评价,同时还要使损失的信息量尽可能少。
建立主成分得分函数:
Fi=e1izx1+e2izx2+…+epizxp(i=1,2,…,p)
步骤六:采用k-means聚类法对住户进行分类
考虑到住户开窗行为的多样性,采用k-means聚类方法将住户分为消极、中等、积极三类。
这是一种迭代求解的聚类分析算法,其步骤是随机选取k(k=3)个对象作为初始的聚类中心,然后计算每个对象与各个种子聚类中心之间的距离
把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给它们的对象就代表一个聚类。每分配一个样本,聚类的聚类中心会根据聚类中现有的对象被重新计算。这个过程将不断重复直到满足某个终止条件。终止条件可以是没有(或最小数目)对象被重新分配给不同的聚类,没有(或最小数目)聚类中心再发生变化,误差平方和局部最小。
步骤七:对每一类住户分别建立主成分Logistic模型。
p是窗户为开启状态的概率
F1,…,Fp是主成分因子。
Claims (1)
1.基于实地监测的开窗仿真方法,其特征在于:结合k-means聚类和主成分Logistic回归模型;
步骤1):构建窗户状态及其潜在驱动因素的原始数据集,窗户状态包括关闭状态、开启状态;
步骤2):采用欠采样的方法对不平衡的原始数据集进行处理;
步骤3):多重共线性诊断;
步骤4):主成分分析:如果存在多重共线性,则采用主成分分析法提取出相互独立的主成分因子来代替原始变量,如果不存在多重共线性,则直接进入下一步骤;
步骤5):采用k-means聚类法对住户进行分类;
步骤6):对每一类住户分别建立主成分Logistic回归模型;
所述步骤1)具体为:
通过连续监测窗户状态和室内外环境参数进行数据收集,收集的数据中窗户状态视为目标变量,包括室内外环境参数和时间在内的潜在驱动因素视为解释变量;
将每种潜在驱动因素分别和窗户状态进行单因素Logistic回归,筛选出具有显著性影响的因子p<0.05,构建窗户状态及其潜在驱动因素的原始数据集;
所述步骤2)具体为:欠采样通过保存原始数据集中的所有稀有类别样本,并在原始数据集的丰富类别样本中随机选择与稀有类别样本相等数量的样本,重组为平衡的新数据集;
所述步骤3)具体为:对变量进行多重共线性诊断,根据相关系数、方差膨胀因子VIF、容许值TOL诊断:
方差膨胀因子的表达式如下:
其中Ri为以变量xi为因变量,其余变量xj(j=1,2,…,m)为自变量作回归分析的复相关系数;所述步骤4)主成分分析主要步骤包括:
(1)共有n个样本,每个样本有q项指标,则原始样本矩阵为:
X=(Xij)n×q i=1,2,…,n j=1,2,…,q
采用Z-score法对Xij进行标准化变换,以消除在数量级或量纲上的影响,公式为:
其中,Xj为第j个指标的均数,Sj为第j个指标的标准差,变换后得到的标准化样本矩阵为:
Z=(ZXij)n×q i=1,2,…,n j=1,2,…,q
(2)根据标准化样本矩阵求出相关矩阵R;
R=(rjk)n×k j=1,2,…,q k=1,2,…,q
rjk为第j个指标与第k个指标的相关系数;
(3)求出相关矩阵R的特征根、特征向量和方差贡献率;
由特征方程式|λI-R|=0求得q个特征根λi(i=1,2,…,q),将其按大小顺序排列为λ1≥λ2≥…≥λq≥0;λi为第i个主成分的方差,反映各主成分对原变量的权重;每一个特征根对应的特征向量根据以下公式计算:
Cij为第i个主成分对应于第j个标准化变量的因子载荷;
(4)确定主成分,建立主成分得分函数,主成分的个数由方差贡献率决定;
所述步骤5)基于住户开窗行为的多样性,采用k-means聚类方法将住户分为消极、中等、积极三类;
迭代求解的聚类分析算法,其步骤是:
随机选取3个对象作为初始的聚类中心,所述对象为住户;
然后计算每个对象与各个聚类中心之间的距离
把每个对象分配给距离它最近的聚类中心;
聚类中心以及分配给它的对象就代表一个聚类,每分配一个对象,聚类的聚类中心会根据聚类中现有的对象被重新计算;
这个过程将不断重复直到满足终止条件;
终止条件为没有对象被重新分配给不同的聚类,或没有聚类中心发生变化,或误差平方和局部最小;
所述步骤6):
P是窗户为开启状态的概率;
F1,…,FM是主成分因子。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910930650.9A CN110781538B (zh) | 2019-09-29 | 2019-09-29 | 基于实地监测的开窗仿真算法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910930650.9A CN110781538B (zh) | 2019-09-29 | 2019-09-29 | 基于实地监测的开窗仿真算法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110781538A CN110781538A (zh) | 2020-02-11 |
CN110781538B true CN110781538B (zh) | 2024-01-19 |
Family
ID=69384626
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910930650.9A Active CN110781538B (zh) | 2019-09-29 | 2019-09-29 | 基于实地监测的开窗仿真算法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110781538B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116881652B (zh) * | 2023-06-26 | 2024-04-05 | 成都理工大学 | 基于优选负样本和随机森林模型的滑坡易发性评价方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011034542A (ja) * | 2009-07-29 | 2011-02-17 | Masahiro Shirai | “多重共線性”を解消する回帰分析によって適正な標準宅地の評価を行う装置。 |
CN105426624A (zh) * | 2015-12-04 | 2016-03-23 | 浙江工业大学 | 一种基于证据推理迭代算法和熵权的建筑开窗行为仿真方法 |
CN105512389A (zh) * | 2015-12-04 | 2016-04-20 | 浙江工业大学 | 一种基于证据推理分析算法和熵权的建筑开窗行为仿真方法 |
CN109191001A (zh) * | 2018-09-21 | 2019-01-11 | 常州工学院 | 基于主成分分析的教育质量评价方法 |
-
2019
- 2019-09-29 CN CN201910930650.9A patent/CN110781538B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011034542A (ja) * | 2009-07-29 | 2011-02-17 | Masahiro Shirai | “多重共線性”を解消する回帰分析によって適正な標準宅地の評価を行う装置。 |
CN105426624A (zh) * | 2015-12-04 | 2016-03-23 | 浙江工业大学 | 一种基于证据推理迭代算法和熵权的建筑开窗行为仿真方法 |
CN105512389A (zh) * | 2015-12-04 | 2016-04-20 | 浙江工业大学 | 一种基于证据推理分析算法和熵权的建筑开窗行为仿真方法 |
CN109191001A (zh) * | 2018-09-21 | 2019-01-11 | 常州工学院 | 基于主成分分析的教育质量评价方法 |
Non-Patent Citations (3)
Title |
---|
住宅建筑能耗基准确定及用能评价新方法;李郡;俞准;刘政轩;张国强;;土木建筑与环境工程(第02期);全文 * |
多元分析中的多重共线性及其处理方法;杨梅;肖静;蔡辉;;中国卫生统计(第04期);全文 * |
居住建筑工程造价的聚类分析及预测模型研究;李莉;;江西建材(第24期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN110781538A (zh) | 2020-02-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110298487B (zh) | 一种用于满足用户个性化需求的室内温度预测方法 | |
Mo et al. | Developing window behavior models for residential buildings using XGBoost algorithm | |
Zhang et al. | A systematic feature selection procedure for short-term data-driven building energy forecasting model development | |
CN107392368B (zh) | 一种基于气象预报的办公建筑动态热负荷组合预测方法 | |
Yalcintas | An energy benchmarking model based on artificial neural network method with a case example for tropical climates | |
Wang et al. | Fault detection and diagnosis for multiple faults of VAV terminals using self-adaptive model and layered random forest | |
CN109492748B (zh) | 一种基于卷积神经网络的电力系统的中长期负荷预测模型建立方法 | |
CN112524751B (zh) | 一种动态空调系统能耗预测模型构建、预测方法及装置 | |
KR102478684B1 (ko) | 앙상블 학습을 이용한 에너지 소비 예측 방법 및 상기 방법을 수행하는 컴퓨팅 장치 | |
Chen et al. | A whole building fault detection using weather based pattern matching and feature based PCA method | |
CN116992322A (zh) | 一种智慧城市数据中心管理系统 | |
CN116629428A (zh) | 一种基于特征选择和SSA-BiLSTM的建筑能耗预测方法 | |
CN110781538B (zh) | 基于实地监测的开窗仿真算法 | |
CN113255223B (zh) | 一种空调负荷短期预测方法及系统 | |
CN113449909B (zh) | 一种基于改进长短期记忆网络的蓄冷空调冷负荷预测方法 | |
CN116720247B (zh) | 基于随机运行的办公建筑围护结构多目标优化设计方法 | |
CN107544447A (zh) | 一种基于核学习的化工过程故障分类方法 | |
CN115879190B (zh) | 模型构建方法及装置、建筑负荷预测方法及装置 | |
CN112413814B (zh) | 基于综合距离的在线可更新暖通空调传感器故障检测方法 | |
CN115049136A (zh) | 一种变压器负荷预测方法 | |
Anitha et al. | Chicken Swarm Optimization with Deep Learning Based Packaged Rooftop Units Fault Diagnosis Model. | |
CN112348700B (zh) | 一种结合som聚类与ifou方程的线路容量预测方法 | |
CN112508259A (zh) | 一种针对独立用户类别的中长期用电量预测方法及系统 | |
Li | Energy consumption prediction of public buildings based on PCA-RF-AdaBoost | |
Saranya et al. | AI buildings: design of artificially intelligent buildings in the energy sector with an autonomous federated learning approach |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |