CN102289585B - 基于数据挖掘的公共建筑能耗实时监测方法 - Google Patents

基于数据挖掘的公共建筑能耗实时监测方法 Download PDF

Info

Publication number
CN102289585B
CN102289585B CN201110233589.6A CN201110233589A CN102289585B CN 102289585 B CN102289585 B CN 102289585B CN 201110233589 A CN201110233589 A CN 201110233589A CN 102289585 B CN102289585 B CN 102289585B
Authority
CN
China
Prior art keywords
energy consumption
data
building energy
minpts
data point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201110233589.6A
Other languages
English (en)
Other versions
CN102289585A (zh
Inventor
王波
肖丹
卿晓霞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University
Original Assignee
Chongqing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University filed Critical Chongqing University
Priority to CN201110233589.6A priority Critical patent/CN102289585B/zh
Publication of CN102289585A publication Critical patent/CN102289585A/zh
Application granted granted Critical
Publication of CN102289585B publication Critical patent/CN102289585B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明公开了一种基于数据挖掘的公共建筑能耗实时监测方法,属于建筑节能技术领域,包括以下步骤:S1:建立建筑能耗模式判定树;S2:实时采集建筑能耗数据;S3:判别当前建筑能耗数据是否为能耗异常点,将当前建筑能耗数据与所属建筑能耗模式判定树进行模式匹配,判断当前建筑能耗数据是否为离群点;本发明采用通过对历史能耗数据进行聚类分析识别建筑物特有的能耗模式,对数据分类后获得建筑能耗模式判定树,在建筑能耗实时监测过程中对动态采集的能耗数据进行模式匹配,与相同模式历史数据进行离群点分析,可判别当前建筑能耗数据是否异常;该方法具有实时性、通用性和鲁棒性好的特点。

Description

基于数据挖掘的公共建筑能耗实时监测方法
技术领域
本发明属于建筑节能技术领域,涉及一种适用于建筑能耗数据异常的检测方法,特别涉及一种基于数据挖掘的公共建筑能耗实时监测方法。
背景技术
近年来,随着经济的发展,我国的建筑业发展迅猛,建筑能耗已经占据社会总能耗的30%以上,并且有逐年上升的趋势。其中,公共建筑的耗能情况尤为严重,虽然公共建筑数量只占总建筑物数量的5%左右,但其能耗却占建筑总能耗的22%,单位面积的用电能耗为普通住宅的5~15倍。同时,我国正处于能源相对短缺的时期,建筑高能耗状况加大了我国能源压力,制约着国民经济的可持续发展,建筑节能已是刻不容缓。因此,监测、控制和降低公共建筑能耗成为了当前建筑节能工作的一项重要内容。
根据国家和地方政府部门的相关规定,将在全国范围内大力开展公共建筑能耗分项计量工作,以指导节能诊断、挖掘节能潜力。目前,已有部分公共建筑实现了能耗分项计量,在运行过程中积累了相当数量的能耗数据。但是,大量的数据也带来了“数据灾难”,使得建筑管理人员难以快速有效地发现存在的能耗异常问题。传统的监测方法是由能源管理人员设定一个阈值,由此决定耗能的高低,但是这存在两个问题:1)阈值人为设定,过高或过低都可能会影响到实际检测结果;2)没有考虑季节、建筑物能耗模式等因素,不能动态适应上述变化。
海量数据的分析方法,目前应用比较广泛的是数据挖掘(Data Mining),数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。数据挖掘通常包含如下步骤:确定业务对象、数据准备、数据挖掘、结果分析,参见图1;数据挖掘技术主要功能包括:概念描述、关联分析、分类和预测、聚类分析、孤立点分析和时间序列分析。
(1)确定业务对象。清晰地定义出业务问题,认清数据挖掘的目的是数据挖掘的重要一步。挖掘的最后结构是不可预测的,但要探索的问题应是有预见的,为了数据挖掘而数据挖掘则带有盲目性,是不会成功的。
(2)数据准备:其发现方法是应用模糊逻辑进行数据查询、排序等。该工具使用模糊概念和“最近”搜索技术的数据查询工具,它可以让用户指定目标,然后对数据库进行搜索,找出接近目标的所有记录,并对结果进行评估,包括:①数据的选择。搜索所有与业务对象有关的内部和外部数据信息,并从中选择出适用于数据挖掘应用的数据;②数据的预处理。研究数据的质量,为进一步的分析做准备,并确定将要进行的挖掘操作的类型;③数据的转换。将数据转换成一个分析模型,这个分析模型是针对挖掘算法建立的。建立一个真正适合挖掘算法的分析模型是数据挖掘成功的关键。
(3)数据挖掘:对所得到的经过转换的数据进行挖掘。除了完善从选择合适的挖掘算法外,其余一切工作都能自动地完成。
(4)结果分析:解释并评估结果。其使用的分析方法一般应依数据挖掘操作而定,通常会用到可视化技术。
因此急需一种对公共建筑能耗进行实时监测并判定建筑能耗数据是否异常的方法。
发明内容
有鉴于此,为了解决上述问题,本发明提出一种对公共建筑能耗进行实时监测并判定能耗数据是否异常的方法。该方法在对公共建筑能耗特点进行深入研究的基础上,针对常用的公共建筑能耗监测设定能耗阈值方法和基于历史数据的数据挖掘方法在实时性和智能性方面的不足,提出了一种基于数据挖掘技术的公共建筑能耗实时监测方法。
本发明的目的是这样实现的:
本发明提供的基于数据挖掘的公共建筑能耗实时监测方法,包括以下步骤:
S1:建立建筑能耗模式判定树,通过对历史建筑能耗数据进行聚类分析识别建筑物特有的建筑能耗模式,对数据分类后获得建筑能耗模式判定树;
S2:实时采集建筑能耗数据,在建筑能耗实时监测过程中动态采集当前建筑能耗数据;
S3:判别当前建筑能耗数据是否为能耗异常点,将当前建筑能耗数据与所属建筑能耗模式判定树进行模式匹配,判断当前建筑能耗数据是否为离群点。
进一步,所述S1建立建筑能耗模式判断树,具体包括以下步骤:
S11:设定建筑能耗模式的重建周期,设定需要对建筑能耗数据进行重新建立建筑能耗模式的周期;
S12:对历史建筑能耗数据进行数据预处理;
S13:提取历史建筑能耗数据的特征向量用于进行聚类分析发现建筑物特有的能耗模式,所述特征向量包括每小时平均能耗Cavg和每小时最高能耗Cmax;
S14:历史能耗数据的聚类分析,对预处理后的历史能耗时序数据使用聚类算法进行聚类分析,识别历史能耗数据中蕴含的用能模式,并将聚类结果在每一项数据中进行标记;
S15:建立建筑能耗模式判定树,对已标记的历史建筑能耗数据进行分类处理,建立建筑能耗模式判定树;
进一步,所述S3中判别当前建筑能耗数据是否为能耗异常点,具体包括以下步骤:
S31:根据建筑能耗模式判定树,判断当前建筑能耗数据所属的能耗模式;
S32:对当前建筑能耗数据和相同能耗模式的历史数据使用离群点检测算法进行离群点分析,如果当前能耗数据点为离群点,则表明当前建筑能耗数据出现异常,应给出警告;否则说明当前建筑能耗数据正常,则采集下一次当前建筑能耗数据新数据;
S33:如果未采集到当前建筑能耗数据的新数据,则检查是否到达重建周期,如果是则转S11-S15重新建立建筑能耗模式,否则转S31-S32进行采集当前建筑能耗数据的新数据并判别当前建筑能耗数据是否为能耗异常点;
进一步,所述S12对历史建筑能耗数据进行数据预处理,具体包括以下步骤:
S121:对历史建筑能耗数据进行z-score规范化处理,通过以下公式来计算:
v ′ = v - A ‾ σ A
其中,
Figure BDA0000083349530000032
为属性A的均值,σA为属性A的标准差,v表示属性原始值,v’表示规范化值;
S122:对建筑能耗数据中的缺失值采用丢弃处理或者均值填充处理;
进一步,所述S14发现建筑物能耗模式,采用基于密度的聚类算法DBSCAN来挖掘建筑物特有的能耗模式,具体包括以下步骤:
S141:输入参数,所述参数包括邻域半径ε、领域内数据点最小数目MinPts;输入能耗数据集合、计算并存储数据的欧式距离;
S142:确定核心对象,如果数据点p为核心数据点,则其ε领域内至少包含MinPts个数据点;
S143:扫描数据集中的每个数据点p,判断是否已经聚类,如果是则跳过,否则执行下述过程;
S144:判断数据点p是否为核心数据点,如果是核心数据点,给它设置一个新的类标识;
S145:对数据点p的ε领域内每一个数据点q进行判断,如果未遍历过,则为其设置相同的类标识;如果数据点q是核心数据点,则以该数据点q为核心数据点合并密度可达簇;
S146:循环执行上述过程,直到所有数据点都处理完;
进一步,所述S15建立建筑能耗模式判定树,采用C4.5决策树分类算法,具体包括以下步骤:
S151:对于能耗数据集D中每一个属性A∈D,通过以下公式来计算其信息增益:
Gain ( A ) = H ( D ) - Σ i = 1 s p ( D i ) H ( D i ) , H ( D ) = - Σ i = 1 s p i log 2 ( p i )
其中Di为数据集D根据属性A划分为的子集,pi为D中任意元组属于类Ci的概率;S表示类别的数目;
S152:计算属性A的信息增益率
GainRatio ( A ) = Gain ( A ) SplitI ( A ) , SplitI ( A ) = H ( D 1 D , D 2 D , · · · , D s D )
其中,Gain(A)表示信息增益,SplitI(A)为分裂信息值;
S153:选择信息增益率最大的属性A为分裂属性,并在树中创建节点;
S154:根据新节点划分能耗数据集D,如果新数据子集中的元组属于同一类别,则分类完成,否则选择剩下的属性继续进行划分;
进一步,所述S32中判别当前建筑能耗数据是否为能耗异常点,采用基于密度的LOF算法来检测离群点,具体包括以下步骤:
S321:输入参数MinPts,MinPts表示邻域中数据点最小数目,可取10-100内数值;
S322:对能耗数据集D中每个数据点p进行邻域查找,通过下列公式来计算其MinPts距离:MinPts-Distance(p)。
其中,MinPts距离为数据点p到它的MinPts最近邻的最大距离,即当某数据点o满足如下条件时,数据点p与数据点o的距离d(p,o)记为MinPts-Distance(p):
①至少存在MinPts个数据点s∈D\{p},使得d(p,s)≤d(p,o);
②至多存在MinPts-1个数据点s∈D\{p},使得d(p,s)<d(p,o);
S323:查找数据点p的MinPts邻域NMinPts(p)={d(p,q)≤MinPts-Distance(p)},
其中,d(p,q)表示数据点p和q的距离,可使用欧氏距离计算;
S324:通过以下公式来计算数据点p和数据点o的可达距离reach-distMinPts(p,o):
reach-distMinPts(p,o)=max{MinPts-Distance(o),d(p,o)},
其中,d(p,o)表示数据点p和o的距离,可使用欧氏距离计算;reach-distMinPts(p,o)表示可达距离;MinPts-Distance(o)表示MinPts距离;
S325:通过以下公式来计算数据点p的局部可达密度lrdMinPts(p):
lrd MinPts ( p ) = | N MinPts ( p ) | Σ o ∈ N MinPts ( p ) reach - dist MinPts ( p , o ) ,
S326:通过以下公式来计算数据点p的局部离群点因子LOFMinPts(p):
LOF MinPts ( p ) = Σ o ∈ N MinPts ( p ) lrd MinPts ( o ) lrd MinPts ( p ) | N MinPts ( p ) | ,
S327:判断离群点,当LOF值大于设定阈值的数据点为离群点。
本发明的优点在于:本发明通过对历史能耗数据进行聚类分析识别建筑物特有的能耗模式,对数据分类后获得建筑能耗模式判定树,在建筑能耗实时监测过程中对动态采集的能耗数据进行模式匹配,与相同模式历史数据进行离群点分析,可判别当前能耗是否异常。该方法具有实时性、通用性和鲁棒性等特点;克服了常用的公共建筑能耗监测设定能耗阈值方法和基于历史数据的数据挖掘方法在实时性和智能性方面的不足。
本发明具有如下优点:
1)实时性。能够在建筑实际运行过程中对每个采样点的能耗数据进行分析,及时发现和报告能耗异常;
2)通用性。能够识别任意公共建筑运行过程中存在的能耗模式,然后据此对能耗数据进行分析;
3)鲁棒性。由于识别能耗模式采用的聚类算法具有抗噪声干扰能力,即使能耗数据中存在噪声,也不影响实际检测结果。
本发明的其它优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。本发明的目标和其它优点可以通过下面的说明书,权利要求书,以及附图中所特别指出的结构来实现和获得。
附图说明
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步的详细描述,其中:
图1为数据挖掘的一般步骤示意图;
图2为公共建筑能耗监测方法的总体流程图;
图3为DBSCAN算法流程图;
图4为C4.5算法流程图。
具体实施方式
以下将结合附图,对本发明的优选实施例进行详细的描述;应当理解,优选实施例仅为了说明本发明,而不是为了限制本发明的保护范围。
图1为数据挖掘的一般步骤示意图;图2为公共建筑能耗监测方法的总体流程图;图3为DBSCAN算法流程图;图4为C4.5算法流程图,如图所示:本发明提供的基于数据挖掘的公共建筑能耗实时监测方法,包括以下步骤:
S1:建立建筑能耗模式判定树,通过对历史建筑能耗数据进行聚类分析识别建筑物特有的建筑能耗模式,对数据分类后获得建筑能耗模式判定树;具体包括以下步骤:
S11:设定建筑能耗模式的重建周期,设定需要对建筑能耗数据进行重新建立建筑能耗模式的周期;为了准确地判断某一时刻建筑物耗能情况,需要对建筑物所存在的能耗模式进行识别。由于能耗模式可能因为季节、增减设备、改变建筑物功能等因素的变化而有所变化,因此需要定期对能耗模式进行识别。然而,建筑物存在的能耗模式一般比较稳定,且识别能耗模式过程比较耗时,可以设定重建周期(如一天或一星期),以提高该方法的实际运行效率;
S12:对历史建筑能耗数据进行数据预处理,具体包括以下步骤:
S121:对历史建筑能耗数据进行z-score规范化处理,由于能耗值较大,且不同时间段能耗值可能变化较大,因此在聚类之前使用z-score方法进行规范化处理,通过以下公式来计算:
v ′ = v - A ‾ σ A
其中,
Figure BDA0000083349530000062
为属性A的均值,σA为属性A的标准差,v表示属性原始值,v’表示规范化值。
S122:对建筑能耗数据中的缺失值采用丢弃处理或者均值填充处理。
S13:提取历史建筑能耗数据的特征向量用于聚类分析,本发明提供的实施例中采用特征向量来描述,该特征向量包括每小时平均能耗Cavg和每小时最高能耗Cmax;为了使用聚类分析发现建筑潜在的能耗模式,需要从建筑能耗数据中提取出反映能耗情况的重要特征向量:即特征向量:d=(Cavg,Cmax);
S14:不同的公共建筑因为建筑类型、使用方式等原因在能源消耗上表现出一定的差异性,为了准确有效地对当前耗能情况进行分析,首先需要识别建筑的能耗模式。历史能耗数据的聚类分析,对预处理后的历史能耗时序数据使用聚类算法进行聚类分析,识别历史能耗数据中蕴含的能耗模式,并将聚类结果在每一项数据中进行标记;本发明实施例中采用基于密度的聚类算法DBSCAN来发现建筑物特定的能耗模式,应用DBSCAN算法聚类的流程参见图3,具体包括以下步骤:
S141:输入参数(邻域半径ε、领域内数据点最小数目MinPts)、输入能耗数据集合、计算并存储数据的欧式距离;
S142:确定核心数据点,如果p为核心数据点,则其ε领域内至少包含MinPts个数据点;
S143:扫描数据集中的每个数据点p,判断数据点是否已经聚类(used_tag==false,其中used_tag为遍历标记),如果是则跳过这个数据点,不必对其进行处理;否则执行下述过程;
S144:判断点p是否为核心数据点(core_tag==true,core_tag为核心数据点标记),只有核心数据点才能发起一次聚类,如果是核心数据点,给它设置一个新的类标识(class_id=current_class_id,其中class_id为数据点的类标记,current_class_id为新的类标记);
S145:对点p的ε领域内每一个数据点q进行判断,如果未遍历过(used_tag==false,其中used_tag为遍历标记),则为其设置相同的类标识(class_id=core_class_id,其中core_class_id为当前核心数据点p的类标记)。如果点q是核心数据点(core_tag==true,core_tag为核心数据点标记),则以该点为核心数据点合并密度可达簇;
S146:循环执行上述过程,直到所有数据点都处理完。
S151:建立建筑能耗模式判定树,对已标记的历史建筑能耗数据进行分类处理,建立建筑能耗模式判定树。本发明实施例中采用C4.5决策树分类算法,具体包括以下步骤:
S152:对于能耗数据集D中每一个属性A∈D,通过以下公式来计算其信息增益:
Gain ( A ) = H ( D ) - Σ i = 1 s p ( D i ) H ( D i ) ,
其中Di为数据集D根据属性A划分为的子集,
Figure BDA0000083349530000072
pi为D中任意元组属于类Ci的概率,s表示类别的数目;
S153:计算属性A的信息增益率
GainRatio ( A ) = Gain ( A ) SplitI ( A ) , SplitI ( A ) = H ( D 1 D , D 2 D , · · · , D s D ) ;
其中,SplitI(A)为分裂信息值;
S154:选择信息增益率最大的属性A为分裂属性,并在树中创建节点;
S155:根据新节点划分能耗数据集D,如果新数据子集中的元组属于同一类别,则分类未完成,否则选择剩下的属性进行划分。
S2:实时采集建筑能耗数据,在建筑能耗实时监测过程中动态采集当前建筑能耗数据;
S3:判别当前建筑能耗数据是否为能耗异常点,将当前建筑能耗数据与所属建筑能耗模式判定树进行模式匹配,判断当前建筑能耗数据是否为离群点,具体包括以下步骤:
S31:根据建筑能耗模式判定树,判断当前建筑能耗数据所属的建筑能耗模式;
S32:对当前建筑能耗数据和相同能耗模式的历史数据使用离群点检测算法进行离群点分析,如果当前能耗数据点为离群点,则表明当前建筑能耗数据出现异常,应给出警告并记录;否则说明当前建筑能耗数据正常,则采集下一次当前建筑能耗数据新数据;本发明实施例中采用基于密度的LOF算法来检测离群点,具体包括以下步骤:
S321:输入参数MinPts,MinPts表示邻域中数据点最小数目,可取10-100内数值;
S322:对能耗数据集D中每个数据点p进行邻域查找,计算其MinPts距离:MinPts-Distance(p),其中,MinPts距离为数据点p到它的MinPts最近邻的最大距离,即当某数据点o满足如下条件时,数据点p与数据点o的距离d(p,o)记为MinPts-Distance(p):
①至少存在MinPts个数据点s∈D\{p},使得d(p,s)≤d(p,o);
②至多存在MinPts-1个数据点s∈D\{p},使得d(p,s)<d(p,o);
S323:查找数据点p的MinPts邻域NMinPts(p)={d(p,q)≤MinPts-Distance(p)},
其中,d(p,q)表示数据点p和q的距离,可使用欧氏距离计算;
S324:通过以下公式来计算数据点p和数据点o的可达距离reach-distMinPts(p,o):
reach-distMinPts(p,o)=max{MinPts-Distance(o),d(p,o)},
其中,d(p,o)表示数据点p和o的距离,可使用欧氏距离计算;
S325:通过以下公式来计算数据点p的局部可达密度lrdMinPts(p):
lrd MinPts ( p ) = | N MinPts ( p ) | Σ o ∈ N MinPts ( p ) reach - dist MinPts ( p , o ) ,
S326:通过以下公式来计算数据点p的局部离群点因子LOFMinPts(p):
LOF MinPts ( p ) = Σ o ∈ N MinPts ( p ) lrd MinPts ( o ) lrd MinPts ( p ) | N MinPts ( p ) | ,
S327:由于簇中正常数据点的LOF值近似为1,设定阈值为1.5,将LOF值大于该阈值的数据点判定为离群点。
S33:如果未采集到当前建筑能耗数据的新数据,则检查是否到达重建周期,如果是则转S11-S15重新建立建筑能耗模式,否则转S31-S32进行采集当前建筑能耗数据的新数据并判别当前建筑能耗数据是否为能耗异常点。
S4:如果当前建筑能耗数据不是能耗异常点,则在能耗采样周期内重新实时采集建筑能耗数据并进行建筑能耗数据是否为能耗异常点的判断过程;如果当前建筑能耗数据是能耗异常点,则记录和报警。
S5:重复循环在能耗采样周期内重新实时采集建筑能耗数据并进行建筑能耗数据是否为能耗异常点的判断过程。
下面以重庆市某综合楼夏季能耗数据为例进行详细说明:
例如,对重庆市某综合楼夏季能耗数据进行挖掘发现3种能耗模式,通过调查分析,这3种能耗模式分别对应“工作日上班时段”、“节假日上班时段、工作日下班时段”和“节假日下班时段”的用能情况。
为便于分析能耗模式的判别条件,需要构造两个新的属性:能耗标签和是否周末。将聚类得到的数据簇结果填入能耗标签属性中,根据日期判断是否周末将结果填入周末属性中。对构造了新属性之后的能耗数据应用C4.5算法进行分类,使用3/4的数据作为训练集,剩下的1/4数据作为检验集,得到能耗模式判定树。
对于采样到的实时数据,为了判定其耗能情况,需要先判断当前时刻能耗数据点所处的能耗模式,然后与相同能耗模式的历史数据一起进行分析,才能正确反应当前时刻耗能情况;如某一时刻t采样的能耗数据值为212.93kWh,根据之前生成的能耗模式判定树,该点的能耗模式为Cluster1。为判断此时的耗能情况,与相同能耗模式的历史数据一起进行离群点分析。考虑到能耗数据集中可能存在多个密度不一致的簇,且簇之间的位置关系复杂,为提高异常检测准确度,选用基于密度的离群点检测算法;首先,对数据集D中每个对象进行邻域查找,计算其MinPts邻域,并存储每个对象与其邻域中对象的距离;然后,计算每个对象的局部可达密度和局部离群点因子LOF;最后,根据设定的LOF阈值,将LOF值大于该阈值的对象判定为离群点。
离群点分析结果显示:数据集中聚类簇中点LOF的最大值为1.274,最小值为0.906;离群点LOF的最大值为5.621,最小值为1.929,由于t时刻对应数据点的LOF值为4.373,因此该点应为离群点,表明t时刻能耗异常,随即向物业管理人员报警。
以上所述仅为本发明的优选实施例,并不用于限制本发明,显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (1)

1.基于数据挖掘的公共建筑能耗实时监测方法,其特征在于:包括以下步骤:
S1:建立建筑能耗模式判定树,通过对历史建筑能耗数据进行聚类分析识别建筑物特有的建筑能耗模式,对数据分类后获得建筑能耗模式判定树;
S2:实时采集建筑能耗数据,在建筑能耗实时监测过程中动态采集当前建筑能耗数据;
S3:判别当前建筑能耗数据是否为能耗异常点,将当前建筑能耗数据与所属建筑能耗模式判定树进行模式匹配,判断当前建筑能耗数据是否为离群点;
所述S1建立建筑能耗模式判断树,具体包括以下步骤:
S11:设定建筑能耗模式的重建周期,设定需要对建筑能耗数据进行重新建立建筑能耗模式的周期;
S12:对历史建筑能耗数据进行数据预处理;
S13:提取历史建筑能耗数据的特征向量用于进行聚类分析发现建筑物特有的能耗模式,所述特征向量包括每小时平均能耗Cavg和每小时最高能耗Cmax;
S14:历史能耗数据的聚类分析,对预处理后的历史能耗时序数据使用聚类算法进行聚类分析,识别历史能耗数据中蕴含的用能模式,并将聚类结果在每一项数据中进行标记;
S15:建立建筑能耗模式判定树,对已标记的历史建筑能耗数据进行分类处理,建立建筑能耗模式判定树;
所述S3中判别当前建筑能耗数据是否为能耗异常点,具体包括以下步骤:
S31:根据建筑能耗模式判定树,判断当前建筑能耗数据所属的能耗模式;
S32:对当前建筑能耗数据和相同能耗模式的历史数据使用离群点检测算法进行离群点分析,如果当前能耗数据点为离群点,则表明当前建筑能耗数据出现异常,应给出警告;否则说明当前建筑能耗数据正常,则采集下一次当前建筑能耗数据新数据;
S33:如果未采集到当前建筑能耗数据的新数据,则检查是否到达重建周期,如果是则转S11-S15重新建立建筑能耗模式,否则转S31-S32进行采集当前建筑能耗数据的新数据并判别当前建筑能耗数据是否为能耗异常点;
所述S12对历史建筑能耗数据进行数据预处理,具体包括以下步骤:
S121:对历史建筑能耗数据进行z-score规范化处理,通过以下公式来计算:
v ′ = v - A ‾ σ A
其中,
Figure FDA0000449514530000012
为属性A的均值,σA为属性A的标准差,v表示属性原始值,v’表示规范化值;
S122:对建筑能耗数据中的缺失值采用丢弃处理或者均值填充处理;
所述S14发现建筑物能耗模式,采用基于密度的聚类算法DBSCAN来挖掘建筑物特有的能耗模式,具体包括以下步骤:
S141:输入参数,所述参数包括邻域半径ε、领域内数据点最小数目MinPts;输入能耗数据集合、计算并存储数据的欧式距离;
S142:确定核心对象,如果数据点p为核心数据点,则其ε领域内至少包含MinPts个数据点;
S143:扫描数据集中的每个数据点p,判断是否已经聚类,如果是则跳过,否则执行下述过程;
S144:判断数据点p是否为核心数据点,如果是核心数据点,给它设置一个新的类标识;
S145:对数据点p的ε领域内每一个数据点q进行判断,如果未遍历过,则为其设置相同的类标识;如果数据点q是核心数据点,则以该数据点q为核心数据点合并密度可达簇;
S146:循环执行上述过程,直到所有数据点都处理完;
所述S15建立建筑能耗模式判定树,采用C4.5决策树分类算法,具体包括以下步骤:
S151:对于能耗数据集D中每一个属性A∈D,通过以下公式来计算其信息增益:
Gain ( A ) = H ( D ) - Σ i = 1 s p ( D i ) H ( D i ) , H ( D ) = - Σ i = 1 s p i log 2 ( p i )
其中Di为数据集D根据属性A划分为的子集,pi为D中任意元组属于类Ci的概率;S表示类别的数目;
S152:计算属性A的信息增益率
GainRatio ( A ) = Gain ( A ) SplitI ( A ) , SplitI ( A ) = H ( D 1 D , D 2 D , . . . , D s D )
其中,Gain(A)表示信息增益,SplitI(A)为分裂信息值;
S153:选择信息增益率最大的属性A为分裂属性,并在树中创建节点;
S154:根据新节点划分能耗数据集D,如果新数据子集中的元组属于同一类别,则分类完成,否则选择剩下的属性继续进行划分;
所述S32中判别当前建筑能耗数据是否为能耗异常点,采用基于密度的LOF算法来检测离群点,具体包括以下步骤:
S321:输入参数MinPts,MinPts表示邻域中数据点最小数目,取10-100内数值;
S322:对能耗数据集D中每个数据点p进行邻域查找,通过下列公式来计算其MinPts距离:MinPts-Distance(p);
其中,MinPts距离为数据点p到它的MinPts最近邻的最大距离,即当某数据点o满足如下条件时,数据点p与数据点o的距离d(p,o)记为MinPts-Distance(p):
①至少存在MinPts个数据点s∈D\{p},使得d(p,s)≤d(p,o);
②至多存在MinPts-1个数据点s∈D\{p},使得d(p,s)<d(p,o);
S323:查找数据点p的MinPts邻域NMinPts(p)={d(p,q)≤MinPts-Distance(p)},
其中,d(p,q)表示数据点p和q的距离,可使用欧氏距离计算;
S324:通过以下公式来计算数据点p和数据点o的可达距离reach-distMinPts(p,o):
reach-distMinPts(p,o)=max{MinPts-Distance(o),d(p,o)},
其中,d(p,o)表示数据点p和o的距离,可使用欧氏距离计算;reach-distMinPts(p,o)表示可达距离;MinPts-Distance(o)表示MinPts距离;
S325:通过以下公式来计算数据点p的局部可达密度lrdMinPts(p):
lrd MinPts ( p ) = | N MinPts ( p ) | &Sigma; o &Element; N MinPts ( p ) reach - dis t MinPts ( p , o ) ,
S326:通过以下公式来计算数据点p的局部离群点因子LOFMinPts(p):
LOF MinPts ( p ) = &Sigma; o &Element; N MinPts ( p ) lrd MinPts ( o ) lrd MinPts ( p ) | N MinPts ( p ) | ,
S327:判断离群点,当LOF值大于设定阈值的数据点为离群点,设定阈值为1.5。
CN201110233589.6A 2011-08-15 2011-08-15 基于数据挖掘的公共建筑能耗实时监测方法 Expired - Fee Related CN102289585B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110233589.6A CN102289585B (zh) 2011-08-15 2011-08-15 基于数据挖掘的公共建筑能耗实时监测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110233589.6A CN102289585B (zh) 2011-08-15 2011-08-15 基于数据挖掘的公共建筑能耗实时监测方法

Publications (2)

Publication Number Publication Date
CN102289585A CN102289585A (zh) 2011-12-21
CN102289585B true CN102289585B (zh) 2014-06-18

Family

ID=45336007

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110233589.6A Expired - Fee Related CN102289585B (zh) 2011-08-15 2011-08-15 基于数据挖掘的公共建筑能耗实时监测方法

Country Status (1)

Country Link
CN (1) CN102289585B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108765478A (zh) * 2018-06-06 2018-11-06 杭州中科天维科技有限公司 一种建筑点云中分离单体建筑的密度聚类算法

Families Citing this family (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102663232B (zh) * 2012-03-13 2016-03-23 江苏润和软件股份有限公司 一种面向用户能效评估的多维仿真分析系统及其方法
CN103310085A (zh) * 2012-03-13 2013-09-18 杭州核安科技有限公司 一种动态检验处理服从正态分布数据的方法
CN103890806B (zh) * 2012-08-05 2016-06-15 珠海派诺科技股份有限公司 一种建筑周期性负荷能效管理方法
CN102855394B (zh) * 2012-08-17 2016-05-04 北京合众科林自动化工程技术有限公司 一种基于概率分布的检测建筑用能异常的方法
CN103364437B (zh) * 2013-07-11 2015-05-13 山东省计算中心 基于无线组网的建筑群建筑热耗一次性快速检测评估方法
CN104318073B (zh) * 2014-10-08 2018-01-05 中国建筑设计院有限公司 单栋居住建筑的电气能耗模拟及节能的方法
CN104462819A (zh) * 2014-12-09 2015-03-25 国网四川省电力公司信息通信公司 一种基于密度聚类的局部离群点检测方法
CN104636999B (zh) * 2015-01-04 2018-06-22 江苏联宏智慧能源股份有限公司 一种建筑异常用能数据检测方法
CN105228175B (zh) * 2015-09-17 2018-11-06 福建新大陆软件工程有限公司 一种基于决策树的基站能耗优化方法及系统
CN106649339A (zh) * 2015-10-30 2017-05-10 北大方正集团有限公司 离群点的挖掘方法及挖掘装置
CN105373620A (zh) * 2015-12-04 2016-03-02 中国电力科学研究院 大规模电池储能电站海量电池数据异常检测方法及系统
CN105630885B (zh) * 2015-12-18 2019-05-28 国网福建省电力有限公司泉州供电公司 一种用电异常检测方法及系统
CN105759608B (zh) * 2016-02-26 2018-12-28 北京邮电大学 一种节能方法及系统
CN105844102B (zh) * 2016-03-25 2018-05-08 中国农业大学 一种自适应无参空间离群点检测方法
CN107292221B (zh) * 2016-04-01 2022-09-30 北京搜狗科技发展有限公司 一种轨迹处理方法和装置、一种用于轨迹处理的装置
CN106021852B (zh) * 2016-05-06 2018-11-06 鼎泰生物科技(海南)有限公司 基于密度聚类算法的血糖数据异常值计算方法和装置
CN106055696A (zh) * 2016-06-15 2016-10-26 南京威联达自动化技术有限公司 通过数据挖掘技术实现能效管理和节能的电机保护控制器
CN105929777B (zh) * 2016-06-24 2019-03-22 北京博锐尚格节能技术股份有限公司 设备能耗定额管理预警方法和装置
CN106250905B (zh) * 2016-07-08 2020-05-12 复旦大学 一种结合高校建筑结构特征的实时能耗异常检测方法
CN106778009A (zh) * 2016-12-28 2017-05-31 湖南坤宇网络科技有限公司 一种基于决策树系统的锅炉炉膛水垢预警方法
CN106886591A (zh) * 2017-02-21 2017-06-23 华南理工大学 一种基于数据挖掘的智能路灯能耗分析系统
CN106933173A (zh) * 2017-03-06 2017-07-07 广东顺德中山大学卡内基梅隆大学国际联合研究院 一种基于corba的染整设备监控系统
CN106951611B (zh) * 2017-03-07 2020-08-07 哈尔滨工业大学 一种基于使用者行为的严寒地区建筑节能设计优化方法
CN107317891A (zh) * 2017-05-10 2017-11-03 郑州埃文计算机科技有限公司 一种面向动态ip多区域性分布的地理位置定位方法
CN107357970B (zh) * 2017-06-23 2020-08-11 清华大学 基于数据挖掘的建筑信息模型异常元素检测装置和方法
CN107944464A (zh) * 2017-10-12 2018-04-20 华南理工大学 一种办公建筑逐时能耗异常数据在线识别与填补方法
CN107941537B (zh) * 2017-10-25 2019-08-27 南京航空航天大学 一种机械设备健康状态评估方法
CN108083044B (zh) * 2017-11-21 2019-12-24 浙江新再灵科技股份有限公司 一种基于大数据分析的电梯按需维保系统及方法
CN108510104B (zh) * 2018-03-02 2021-06-25 东南大学 基于云计算的建筑能耗分析与优化运行方法
CN108898159B (zh) * 2018-05-31 2022-05-27 中南林业科技大学 基于dbscan算法的虚假林火热点过滤方法
CN108875806B (zh) * 2018-05-31 2022-08-16 中南林业科技大学 基于时空数据的虚假林火热点挖掘方法
CN108932301B (zh) * 2018-06-11 2021-04-27 天津科技大学 数据填充方法及装置
CN110648741A (zh) * 2018-06-27 2020-01-03 清华大学 基于局部离群因子的识别开药异常的医生的方法及装置
CN109471854B (zh) * 2018-10-31 2020-09-15 广东兴发铝业有限公司 一种大数据能耗在线监测系统所采集数据的验证方法
CN109597702B (zh) * 2018-12-03 2022-04-26 深圳前海微众银行股份有限公司 消息总线异常的根因分析方法、装置、设备及存储介质
CN109785184A (zh) * 2018-12-28 2019-05-21 南京天溯自动化控制系统有限公司 正常能耗区间计算方法、异常能耗数据检测方法及装置
CN111487874B (zh) * 2019-01-25 2023-09-12 北京广元科技有限公司 一种用于建筑能耗的复合预测方法
CN110188810A (zh) * 2019-05-23 2019-08-30 西北工业大学 一种基于密度聚类的在线野值检测、识别与修正方法
CN111968356A (zh) * 2020-08-11 2020-11-20 重庆电子工程职业学院 一种智能化建筑能耗监测系统及方法
CN112163728A (zh) * 2020-08-24 2021-01-01 珠海格力电器股份有限公司 一种能耗数据处理方法、装置、电子设备及存储介质
CN112150311B (zh) * 2020-09-09 2023-09-26 日立楼宇技术(广州)有限公司 能耗异常状态检测方法、装置、计算机设备和存储介质
CN112116496B (zh) * 2020-09-27 2023-12-08 施耐德电气(中国)有限公司 能耗诊断规则的配置方法和装置
CN112836720B (zh) * 2020-12-16 2024-03-29 博锐尚格科技股份有限公司 建筑运维设备异常诊断方法、系统及计算机可读存储介质
CN112801129A (zh) * 2020-12-16 2021-05-14 国网辽宁省电力有限公司鞍山供电公司 一种基于用户侧的高耗能企业能耗实时监测方法
CN112699113B (zh) * 2021-01-12 2022-08-05 上海交通大学 时序数据流驱动的工业制造流程运行监测系统
CN113505818A (zh) * 2021-06-17 2021-10-15 广东工业大学 改进决策树算法的熔铝炉能耗异常诊断方法和系统及设备
CN113408659A (zh) * 2021-07-15 2021-09-17 重庆大学 一种基于数据挖掘的建筑能耗集成分析方法
CN113660335A (zh) * 2021-08-17 2021-11-16 北京计算机技术及应用研究所 一种基于物联网的设备精细化管理方法与系统

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
Efendi N.Nasibov等.Robustness of density-based clustering methods with various neighborhood relations.《fuzzy sets and systems》.2009,3601-3615.
Robustness of density-based clustering methods with various neighborhood relations;Efendi N.Nasibov等;《fuzzy sets and systems》;20091231;正文第3602-3604页 *
刘文凤.数据挖掘在公共建筑能耗分析中的应用研究.《中国优秀硕士学位论文全文数据库工程科技II辑》.2011,48-67.
数据挖掘在公共建筑能耗分析中的应用研究;刘文凤;《中国优秀硕士学位论文全文数据库工程科技II辑》;20110315;正文第48-67页 *
李健,等.基于记忆效应的局部异常检测算法.《计算机工程》.2008,第34卷(第12期), *
黄文.决策树的经典算法:ID3与C4.5.《四川文理学院学报(自然科学)》.2007,第17卷(第5期), *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108765478A (zh) * 2018-06-06 2018-11-06 杭州中科天维科技有限公司 一种建筑点云中分离单体建筑的密度聚类算法

Also Published As

Publication number Publication date
CN102289585A (zh) 2011-12-21

Similar Documents

Publication Publication Date Title
CN102289585B (zh) 基于数据挖掘的公共建筑能耗实时监测方法
Chacon-Hurtado et al. Rainfall and streamflow sensor network design: a review of applications, classification, and a proposed framework
WO2021174751A1 (zh) 基于大数据的污染源定位方法、装置、设备及存储介质
Estivill-Castro et al. Data mining techniques for autonomous exploration of large volumes of geo-referenced crime data
CN110059963A (zh) 一种基于模糊多态贝叶斯网络的隧道风险评价方法
CN109858140B (zh) 一种基于信息熵离散型贝叶斯网络冷水机组故障诊断方法
CN106600115A (zh) 一种企业信息系统运维智能分析方法
CN110335168B (zh) 基于gru优化用电信息采集终端故障预测模型的方法及系统
CN105184886A (zh) 一种云数据中心智能巡检系统及方法
CN115081945B (zh) 一种地下水环境监测井的损伤监测与评估方法及系统
CN103278616B (zh) 一种土壤腐蚀性快速评价的多因子方法
CN107404471A (zh) 一种基于admm算法网络流量异常检测方法
CN106649527A (zh) 基于Spark Streaming的广告点击异常检测系统及检测方法
CN116658246A (zh) 一种煤矿水害监测预警系统及方法
Hoarau et al. Suitability of graph representation for bgp anomaly detection
Joshi et al. Rainfall prediction using data visualisation techniques
Wu et al. Traffic sensor health monitoring using spatiotemporal graphical modeling
Xing et al. Discovering traffic outlier causal relationship based on anomalous DAG
CN109448379A (zh) 一种社交媒体数据偶发性交通事件的识别及定位方法
Sedaghat et al. A Heuristic ETL Process to Dynamically Separate and Compress AIS Data
Yan et al. Research on application of data mining technology in risk assessment process of audit
CN114493363A (zh) 城市公交事故风险因素分析方法
Li et al. Domain knowledge in predictive maintenance for water pipe failures
Buccafusco et al. Profiling industrial vehicle duties using CAN bus signal segmentation and clustering.
CN111653087A (zh) 一种城市交通异常探测模型的构建方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20140618

Termination date: 20170815