CN108920790A - 一种基于历史数据的公共建筑用电模式识别模型建立方法 - Google Patents
一种基于历史数据的公共建筑用电模式识别模型建立方法 Download PDFInfo
- Publication number
- CN108920790A CN108920790A CN201810637600.7A CN201810637600A CN108920790A CN 108920790 A CN108920790 A CN 108920790A CN 201810637600 A CN201810637600 A CN 201810637600A CN 108920790 A CN108920790 A CN 108920790A
- Authority
- CN
- China
- Prior art keywords
- user
- history
- electricity consumption
- feature vector
- building
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Geometry (AREA)
- Computer Hardware Design (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于历史数据的公共建筑用电模式识别模型建立方法,包括下列步骤:S1,对历史用电数据库中的缺失数据和超出阈值范围的数据用对应字段平均值进行替代,并根据用户历史小时最高用电负荷x和用户历史小时平均用电负荷y建立特征向量[x,y],每个用户每个小时对应一个特征向量[x,y];S2,对所有特征向量[x,y]进行K‑means聚类分析,找到每个特征向量对应的聚类中心,每个聚类中心对应一个用电模式;S3,根据基于CART算法的决策树,找到每个用电模式与其它用电模式的最优分裂属性以及最优分裂属性值,建立用电模式识别模型。
Description
技术领域
本发明涉及一种基于历史数据的公共建筑用电模式识别模型建立方法。
背景技术
在经济全球化、全球变暖的大背景下,日益严重的能源形势得到了世界各地的高度重视。中国是世界上最大的发展中国家,近年来急剧增长的用电与资源相对短缺之间的矛盾严重制约了国家的发展。能源是经济社会发展的原动力,为了推动节能技术的进步,提高能源的利用效率,促进能源节约和优化用能结构,建设“资源节约型、环境友好型”两型社会,国家和各级省市政府相继出台了多项节能政策、法规,逐步形成具有中国特色的节能长效机制和管理体制。
在线监测企业的水、电、油、气、热等能源的生产和使用情况,准确把握同一行业单位产品的平均用电水平,是政府科学地制定行业节能减排目标的重要依据。通过对企业及公用建筑等用能单位进行用电监测和能效评估,既可以帮助用能单位查找出自身耗能方面的缺口,让其在节能减排中有的放矢,不为了达到国家的节能目标而地拉闸限电,又为政府管理部门核定节能效益提供科学依据。
工业用户及公共建筑的节能评估是一项复杂的系统工程,涉及国家节能相关法律、法规,行业节能设计标准,用能工艺、产品、设备选用,节能技术的适宜性等各个方面。除了一系列工程问题、技术问题之外,还包含管理决策等问题。在各个系统的节能评估和审查过程中,需要采用科学的评估方法进行分析。现行的主要评估方法包括标准对照法,类比工程分析法,专家经验判断法和单位面积指标法等。上述方法大都主观性较强,同时更侧重于从用能系统规划建设的角度进行分析,与其实际运行情况关联不大。目前应用的节能评估平台大都处于数据采集和统计展示的初级阶段,针对实时用能信息进行挖掘算法的研究工作开展不多。
随着我国节能评估平台的建设推广,将会收集大量的用电数据,如何快速有效地从中分析挖掘出有价值的信息,建立用电模式识别的模型,进而发现用能单位的节能潜力,提出有效节能建议,对于提高能源资源利用效率,保障社会的可持续发展具有重要意义。
随着大数据时代的到来和我国节能评估平台的建设推广,将会有海量的用电数据,方便利用数据挖掘技术,建立用电模式识别的模型,其针对性地提出节能方案。深入开展高耗能企业电力能效监测和评估工作,一方面管理部门可以完善电能管理体系,充分挖掘节能潜力,采取有针对性的节能对策和措施,推动企业的节能减排工作。另一方面企业也可以深入了解自身存在的用电问题,针对这些问题实施具体节能措施,进一步根据成本效益分析,做出未来的用能行为规划,以达到企业和社会双赢目标。
发明内容
本发明的目的是为了克服现有技术的不足,提供一种基于历史数据的公共建筑用电模式识别模型建立方法,其对用户的用电模式进行聚类分析,对用户的用电模式进行分类,确定不同用电模式与其他用电模式进行区分的属性以及属性值,建立用电模式的识别模型,为后续对用户的用电异常进监测提供方便。
实现上述目的的一种技术方案是:一种基于历史数据的公共建筑用电模式识别模型建立方法,包括下列步骤:
S1,对历史用电数据库中的缺失数据和超出阈值范围的数据用对应字段平均值进行替代,并根据用户历史小时最高用电负荷x和用户历史小时平均用电负荷y建立特征向量[x,y],每个用户每个小时对应一个特征向量[x,y];
S2,对所有特征向量[x,y]进行K-means聚类分析,找到每个特征向量对应的聚类中心,每个聚类中心对应一个用电模式;
S3,根据基于CART算法的决策树,找到每个用电模式与其它用电模式的最优分裂属性以及最优分裂属性值,建立用电模式识别模型。
进一步的,S2步骤中,先对所有特征向量[x,y]进行规范化,得到规范化特征向量z=[zx,zy],再对规范化特征向量z=[zx,zy]进行K-means聚类分析,规范化的公式为:
和
μ(x)和μ(y)分别代表任一历史采集时间点,所有用户的用户历史小时最高用电负荷的平均值和所有用户的用户历史小时平均用电负荷的平均值,σ(x)和σ(y)分别代表该历史采集时间点,所有用户的用户历史小时最高用电负荷的标准差和所有用户的用户历史小时平均用电负荷的标准差。
再进一步的,S2步骤中对规范化特征向量z=[zx,zy]进行K-means聚类分析的具体步骤为:
S21,在以用户小时最高用电负荷为横坐标,用户小时平均用电负荷为纵坐标的直角坐标系中,拾取k个聚类中心ui(j),其中j=0,i=1,2,……,k;
S22,选取n个规范化特征向量,记为zt,其中t=1,2,……,n,计算每个zt到每个聚类中心ui(j)的欧式距离;
S23,找出关于每个zt最小欧式距离的聚类中心ui(j),zt进入该聚类中心所对应簇,并将每个簇的几何中心记为新聚类中心ui(j+1);
S24,计算所有zt关于与其所在簇对应的新聚类中心ui(j+1)的欧式距离的平方误差Ej,判定平方误差Ej是否在设定值范围内;
S25,若平方误差Ej在设定值范围内,则输出当前所有的聚类中心ui(j+1),以及对应簇内的所有规范化特征向量zt,每个聚类中心作为一个用电模式;
S26,若平方误差Ej不在设定值范围内,则令j=j+1,并返回步骤S23。
更进一步的,S3步骤中对由规范化特征向量zt,其中t=1,2,……,n,所构成的样本集S,以Gain_GINI的值最小的属性与属性值作为最优分裂属性以及最优分裂属性值。
还要进一步的,对于样本集S,
其中oi表示分类结果中第i个用电模式出现的概率;
根据用户历史小时最高用电负荷将样本集S划分成两部分,Gain_GINI计算如下:
最优二分方案为
还要进一步的,对于样本集S,
其中oi表示分类结果中第i个用电模式出现的概率;
根据用户历史小时平均用电负荷将样本集S划分成两部分,Gain_GINI计算如下:
最优二分方案为
采用了本发明的一种基于历史数据的公共建筑用电模式识别模型建立方法,包括下列步骤:S1,对历史用电数据库中的缺失数据和超出阈值范围的数据用对应字段平均值进行替代,并根据用户历史小时最高用电负荷x和用户历史小时平均用电负荷y建立特征向量[x,y],每个用户每个小时对应一个特征向量[x,y];S2,对所有特征向量[x,y]进行K-means聚类分析,找到每个特征向量对应的聚类中心,每个聚类中心对应一个用电模式;S3,根据基于CART算法的决策树,找到每个用电模式与其它用电模式的最优分裂属性以及最优分裂属性值,建立用电模式识别模型。其技术效果是:建立了建筑用电模式识别的模型,方便对建筑用电进行实时监控,使用方式较为简便,在工程实际中,具有广泛的适用性。
附图说明
图1为本发明的一种基于历史数据的公共建筑用电模式识别模型建立方法的流程图。
具体实施方式
请参阅图1,本发明的发明人为了能更好地对本发明的技术方案进行理解,下面通过具体地实施例,并结合附图进行详细地说明:
本发明的一种基于历史数据的公共建筑用电模式识别模型建立方法包括下列步骤:
S1,数据预处理步骤,包括:
错误数据处理步骤:
对历史用电数据库中的缺失数据和超出阈值范围的数据用对应字段平均值进行替代。
数据规范化步骤:
从历史用电数据库中提取特征向量[x,y],其中,x代表用户历史小时最高用电负荷,y代表用户历史小时平均用电负荷。每个用户每个小时都生成一个对应的特征向量[x,y]。
对每个特征向量进行规范化,得到规范化特征向量z=[zx,zy],规范化的公式为:
和
其中z=[zx,zy]代表规范化特征向量,μ(x)和μ(y)分别代表任一历史采集时间点,所有用户的用户历史小时最高用电负荷的平均值和所有用户的用户历史小时平均用电负荷的平均值,σ(x)和σ(y)分别代表该历史采集时间点,所有用户的用户历史小时最高用电负荷的标准差和所有用户的用户历史小时平均用电负荷的标准差。
S2,用电数据聚类分析步骤:
S21,在以用户小时最高用电负荷为横坐标,用户小时平均用电负荷为纵坐标的直角坐标系中,拾取k个聚类中心ui(j),其中j=0,i=1,2,……,k;
S22,选取n个规范化特征向量z=[zx,zy],记为zt,其中t=1,2,……,n,计算每个zt到每个聚类中心ui(j)的欧式距离;
S23,找出关于每个zt最小欧式距离的聚类中心ui(j),zt进入该聚类中心所对应的簇,并将每个簇的几何中心记为新聚类中心ui(j+1);
S24,计算所有zt关于与其所在簇对应的新聚类中心ui(j+1)的欧式距离的平方误差Ej,判定平方误差Ej是否在设定值范围内;
S25,若平方误差Ej在设定值范围内,则输出当前所有的聚类中心ui(j+1),以及对应簇内的所有规范化特征向量zt,每个聚类中心作为一个用电模式;
S26,若平方误差Ej不在设定值范围内,则令j=j+1,并返回步骤S23。
S3,建立用电模式识别模型:
根据每个规范化特征向量zt以及每个规范化特征向量zt所对应的时间,基于CART算法的决策树进行分类。Cart分类树选择Gain_GINI的值最小的属性与属性值作为每个用电模式与其它用电模式进行最优分裂属性以及最优分裂属性值。Gain_GINI的值越小,说明二分后子样本的“纯净度”越高,即说明选择该属性值作为分裂属性值的效果越好。
对于由规范化特征向量zt所构成的样本集S,GINI计算式如下:
oi表示分类结果中第i个用电模式出现的概率。
对于含有n个样本的样本集S,根据用户历史小时最高用电负荷将样本集S划分成两部分,则划分成两部分之后,Gain_GINI计算如下:
或对于含有n个样本的样本集S,根据用户历史小时平均用电负荷将样本集S划分成两部分,则划分成两部分之后,Gain_GINI计算如下:
对于样本集S,计算所有属性的最优二分方案并选取其中最小值,作为样本集S的最优二分方案:
即:或者
即为样本集S的最优分裂属性以及最优分裂属性值。
本发明的一种基于历史数据的公共建筑用电模式识别模型建立方法基于历史用电数据,对用户的用电模式进行聚类分析,对用户的用电模式进行分类,确定不同用电模式与其他用电模式进行区分的属性以及属性值,为后续对用户的用电异常进监测提供方便。
本发明的一种基于历史数据的公共建筑用电模式识别模型建立方法具有如下有益效果:
建立了建筑用电模式识别的基础,方便对建筑用电进行实时监控,使用方式较为简便,在工程实际中,具有广泛的适用性。
本技术领域中的普通技术人员应当认识到,以上的实施例仅是用来说明本发明,而并非用作为对本发明的限定,只要在本发明的实质精神范围内,对以上所述实施例的变化、变型都将落在本发明的权利要求书范围内。
Claims (6)
1.一种基于历史数据的公共建筑用电模式识别模型建立方法,包括下列步骤:
S1,对历史用电数据库中的缺失数据和超出阈值范围的数据用对应字段平均值进行替代,并根据用户历史小时最高用电负荷x和用户历史小时平均用电负荷y建立特征向量[x,y],每个用户每个小时对应一个特征向量[x,y];
S2,对所有特征向量[x,y]进行K-means聚类分析,找到每个特征向量对应的聚类中心,每个聚类中心对应一个用电模式;
S3,根据基于CART算法的决策树,找到每个用电模式与其它用电模式的最优分裂属性以及最优分裂属性值,建立用电模式识别模型。
2.根据权利要求1所述的一种基于历史数据的公共建筑用电模式识别模型建立方法,其特征在于:
S2步骤中,先对所有特征向量[x,y]进行规范化,得到规范化特征向量z=[zx,zy],再对规范化特征向量z=[zx,zy]进行K-means聚类分析,规范化的公式为:
和
μ(x)和μ(y)分别代表任一历史采集时间点,所有用户的用户历史小时最高用电负荷的平均值和所有用户的用户历史小时平均用电负荷的平均值,σ(x)和σ(y)分别代表该历史采集时间点,所有用户的用户历史小时最高用电负荷的标准差和所有用户的用户历史小时平均用电负荷的标准差。
3.根据权利要求2所述的一种基于历史数据的公共建筑用电模式识别模型建立方法,其特征在于:S2步骤中对规范化特征向量z=[zx,zy]进行K-means聚类分析的具体步骤为:
S21,在以用户小时最高用电负荷为横坐标,用户小时平均用电负荷为纵坐标的直角坐标系中,拾取k个聚类中心ui(j),其中j=0,i=1,2,……,k;
S22,选取n个规范化特征向量,记为zt,其中t=1,2,……,n,计算每个zt到每个聚类中心ui(j)的欧式距离;
S23,找出关于每个zt最小欧式距离的聚类中心ui(j),zt进入该聚类中心所对应簇,并将每个簇的几何中心记为新聚类中心ui(j+1);
S24,计算所有zt关于与其所在簇对应的新聚类中心ui(j+1)的欧式距离的平方误差Ej,判定平方误差Ej是否在设定值范围内;
S25,若平方误差Ej在设定值范围内,则输出当前所有的聚类中心ui(j+1),以及对应簇内的所有规范化特征向量zt,每个聚类中心作为一个用电模式;
S26,若平方误差Ej不在设定值范围内,则令j=j+1,并返回步骤S23。
4.根据权利要求3所述的一种基于历史数据的公共建筑用电模式识别模型建立方法,其特征在于:S3步骤中对由规范化特征向量zt,其中t=1,2,……,n,所构成的样本集S,以Gain_GINI的值最小的属性与属性值作为最优分裂属性以及最优分裂属性值。
5.根据权利要求4所述的一种基于历史数据的公共建筑用电模式识别模型建立方法,其特征在于:
对于样本集S,
其中oi表示分类结果中第i个用电模式出现的概率;
根据用户历史小时最高用电负荷将样本集S划分成两部分,Gain_GINI计算如下:
最优二分方案为
6.根据权利要求4所述的一种基于历史数据的公共建筑用电模式识别模型建立方法,其特征在于:
对于样本集S,
其中oi表示分类结果中第i个用电模式出现的概率;
根据用户历史小时平均用电负荷将样本集S划分成两部分,Gain_GINI计算如下:
最优二分方案为
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810637600.7A CN108920790A (zh) | 2018-06-20 | 2018-06-20 | 一种基于历史数据的公共建筑用电模式识别模型建立方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810637600.7A CN108920790A (zh) | 2018-06-20 | 2018-06-20 | 一种基于历史数据的公共建筑用电模式识别模型建立方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108920790A true CN108920790A (zh) | 2018-11-30 |
Family
ID=64420691
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810637600.7A Pending CN108920790A (zh) | 2018-06-20 | 2018-06-20 | 一种基于历史数据的公共建筑用电模式识别模型建立方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108920790A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111523819A (zh) * | 2020-04-28 | 2020-08-11 | 重庆涪陵电力实业股份有限公司 | 一种计及分布式电源出力不确定性的节能潜力评估方法 |
CN112560973A (zh) * | 2020-12-22 | 2021-03-26 | 浙江浙大中控信息技术有限公司 | 一种应用于能源管理系统中可节能设备的自动判断方法 |
CN113449793A (zh) * | 2021-06-28 | 2021-09-28 | 国网北京市电力公司 | 用电状态的确定方法及装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160042143A1 (en) * | 2007-03-16 | 2016-02-11 | Expanse Bioinformatics | Treatment Determination and Impact Analysis |
CN105512768A (zh) * | 2015-12-14 | 2016-04-20 | 上海交通大学 | 大数据环境下用户用电关联因素辨识及用电量预测方法 |
CN107274025A (zh) * | 2017-06-21 | 2017-10-20 | 国网山东省电力公司诸城市供电公司 | 一种实现用电模式智能识别与管理的系统和方法 |
CN107800140A (zh) * | 2017-10-18 | 2018-03-13 | 天津大学 | 一种考虑负荷特征的大用户供电接入决策方法 |
-
2018
- 2018-06-20 CN CN201810637600.7A patent/CN108920790A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160042143A1 (en) * | 2007-03-16 | 2016-02-11 | Expanse Bioinformatics | Treatment Determination and Impact Analysis |
CN105512768A (zh) * | 2015-12-14 | 2016-04-20 | 上海交通大学 | 大数据环境下用户用电关联因素辨识及用电量预测方法 |
CN107274025A (zh) * | 2017-06-21 | 2017-10-20 | 国网山东省电力公司诸城市供电公司 | 一种实现用电模式智能识别与管理的系统和方法 |
CN107800140A (zh) * | 2017-10-18 | 2018-03-13 | 天津大学 | 一种考虑负荷特征的大用户供电接入决策方法 |
Non-Patent Citations (3)
Title |
---|
AVALONIST: "CART树算法详解", 《CSDN博客-HTTPS://BLOG.CSDN.NET/E15273/ARTICLE/DETAILS/79648502》 * |
YAN QI 等: "Load Pattern Recognition Method Based on Fuzzy Clustering and Decision Tree", 《2017 IEEE CONFERENCE ON ENERGY INTERNET AND ENERGY SYSTEM INTEGRATION(E12)》 * |
王守相 等: "计及用电模式的居民负荷梯度提升树分类识别方法", 《电力系统及其自动化学报》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111523819A (zh) * | 2020-04-28 | 2020-08-11 | 重庆涪陵电力实业股份有限公司 | 一种计及分布式电源出力不确定性的节能潜力评估方法 |
CN111523819B (zh) * | 2020-04-28 | 2023-04-21 | 重庆涪陵电力实业股份有限公司 | 一种计及分布式电源出力不确定性的节能潜力评估方法 |
CN112560973A (zh) * | 2020-12-22 | 2021-03-26 | 浙江浙大中控信息技术有限公司 | 一种应用于能源管理系统中可节能设备的自动判断方法 |
CN113449793A (zh) * | 2021-06-28 | 2021-09-28 | 国网北京市电力公司 | 用电状态的确定方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108830324A (zh) | 一种基于数据挖掘技术的公共建筑用电异常判别方法 | |
CN111260211A (zh) | 一种基于ahp-改进的熵权法-topsis的智慧能源系统评价方法及装置 | |
CN108920790A (zh) | 一种基于历史数据的公共建筑用电模式识别模型建立方法 | |
CN111628494B (zh) | 一种基于逻辑回归法的低压配电网拓扑识别方法及系统 | |
CN103955521B (zh) | 一种风电场机群划分方法 | |
CN106294738A (zh) | 一种智能家居场景配置方法 | |
CN106384300A (zh) | 基于大数据和模糊模型的建筑异常用能检测方法及系统 | |
CN105787271A (zh) | 基于大数据分析技术的供热机组可调出力区间评估方法 | |
Beken et al. | Classification of turkey among european countries by years in terms of energy efficiency, total renewable energy, energy consumption, greenhouse gas emission and energy import dependency by using machine learning | |
CN103278616A (zh) | 一种土壤腐蚀性快速评价的多因子方法 | |
CN111539845A (zh) | 一种基于用电模式隶属评分的企业环保管控响应研判方法 | |
CN105574612A (zh) | 一种基于数据挖掘的光伏发电量预测方法 | |
CN116796403A (zh) | 一种基于商业建筑综合能耗预测的建筑节能方法 | |
CN116865258A (zh) | 一种层级构造的分布式电源智能电网构建方法 | |
CN104361135A (zh) | 一种图像检索方法 | |
Miraftabzadeh et al. | K-means and alternative clustering methods in modern power systems | |
CN105445577A (zh) | 一种电能质量干扰源工况辨识方法 | |
CN116861348A (zh) | 一种基于实际距离建立集群分析的光伏电站异常检测方法 | |
CN106340874A (zh) | 电力负荷分解的辨识决策方法和系统 | |
Dong et al. | The research on user short-term electricity load forecasting for judging electric theft | |
CN112488573A (zh) | 一种ppp模式下的综合能源服务模式评价方法 | |
CN111709602A (zh) | 一种泛在电力物联网系统中可靠性的评价方法 | |
CN109657735A (zh) | 基于相关向量机的铝电解槽寿命预测方法 | |
Zhou et al. | Research on coverage control algorithm based on wireless sensor network | |
CN102393946B (zh) | 一种农电系统数据指标终端智能计算的交互方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20181130 |
|
WD01 | Invention patent application deemed withdrawn after publication |