CN108830324A - 一种基于数据挖掘技术的公共建筑用电异常判别方法 - Google Patents
一种基于数据挖掘技术的公共建筑用电异常判别方法 Download PDFInfo
- Publication number
- CN108830324A CN108830324A CN201810637597.9A CN201810637597A CN108830324A CN 108830324 A CN108830324 A CN 108830324A CN 201810637597 A CN201810637597 A CN 201810637597A CN 108830324 A CN108830324 A CN 108830324A
- Authority
- CN
- China
- Prior art keywords
- user
- real
- feature vector
- history
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 230000005856 abnormality Effects 0.000 title claims abstract description 33
- 238000005516 engineering process Methods 0.000 title claims abstract description 22
- 238000007418 data mining Methods 0.000 title claims abstract description 20
- 239000013598 vector Substances 0.000 claims abstract description 65
- 230000005611 electricity Effects 0.000 claims abstract description 40
- 238000003064 k means clustering Methods 0.000 claims abstract description 10
- 238000003909 pattern recognition Methods 0.000 claims abstract description 10
- 238000012544 monitoring process Methods 0.000 claims description 10
- 238000003066 decision tree Methods 0.000 claims description 5
- 240000002853 Nelumbo nucifera Species 0.000 claims description 4
- 235000006508 Nelumbo nucifera Nutrition 0.000 claims description 4
- 235000006510 Nelumbo pentapetala Nutrition 0.000 claims description 4
- 230000000737 periodic effect Effects 0.000 claims description 2
- 230000008569 process Effects 0.000 abstract description 2
- 238000011156 evaluation Methods 0.000 description 9
- 238000004134 energy conservation Methods 0.000 description 6
- 238000010276 construction Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000005265 energy consumption Methods 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 238000013450 outlier detection Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 239000002699 waste material Substances 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000012043 cost effectiveness analysis Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- -1 electricity Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000010792 warming Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2433—Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/10—Pre-processing; Data cleansing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Business, Economics & Management (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于数据挖掘技术的公共建筑用电异常判别方法,包括下列步骤:S1,对历史用电数据库中的数据进行预处理并根据用户历史小时最高用电负荷x和用户历史小时平均用电负荷y建立特征向量[x,y],每个用户每个小时对应一个特征向量[x,y];S2,对所有特征向量[x,y]进行K‑means聚类分析,找到每个特征向量对应的聚类中心,每个聚类中心对应一个用电模式;S3,找到每个用电模式与其它用电模式的最优分裂属性以及最优分裂属性值,建立用电模式识别模型;S4,采集用户实时小时最高用电负荷X和用户实时小时平均用电负荷Y,判定对应的用户是否为用电异常用电户。
Description
技术领域
本发明涉及一种基于数据挖掘技术的公共建筑用电异常判别方法。
背景技术
在经济全球化、全球变暖的大背景下,日益严重的能源形势得到了世界各地的高度重视。中国是世界上最大的发展中国家,近年来急剧增长的用电与资源相对短缺之间的矛盾严重制约了国家的发展。能源是经济社会发展的原动力,为了推动节能技术的进步,提高能源的利用效率,促进能源节约和优化用能结构,建设“资源节约型、环境友好型”两型社会,国家和各级省市政府相继出台了多项节能政策、法规,逐步形成具有中国特色的节能长效机制和管理体制。
在线监测企业的水、电、油、气、热等能源的生产和使用情况,准确把握同一行业单位产品的平均用电水平,是政府科学地制定行业节能减排目标的重要依据。通过对企业及公用建筑等用能单位进行用电监测和能效评估,既可以帮助用能单位查找出自身耗能方面的缺口,让其在节能减排中有的放矢,不为了达到国家的节能目标而地拉闸限电,又为政府管理部门核定节能效益提供科学依据。
工业用户及公共建筑的节能评估是一项复杂的系统工程,涉及国家节能相关法律、法规,行业节能设计标准,用能工艺、产品、设备选用,节能技术的适宜性等各个方面。除了一系列工程问题、技术问题之外,还包含管理决策等问题。在各个系统的节能评估和审查过程中,需要采用科学的评估方法进行分析。现行的主要评估方法包括标准对照法,类比工程分析法,专家经验判断法和单位面积指标法等。上述方法大都主观性较强,同时更侧重于从用能系统规划建设的角度进行分析,与其实际运行情况关联不大。目前应用的节能评估平台大都处于数据采集和统计展示的初级阶段,针对实时用能信息进行挖掘算法的研究工作开展不多。
随着我国节能评估平台的建设推广,将会收集大量的用电数据,如何快速有效地从中分析挖掘出有价值的信息,进而发现用能单位的节能潜力,提出有效节能建议,对于提高能源资源利用效率,保障社会的可持续发展具有重要意义。
随着大数据时代的到来和我国节能评估平台的建设推广,将会有海量的用电数据,方便利用数据挖掘技术对其进行分析并提出节能方案。深入开展高耗能企业电力能效监测和评估工作,一方面管理部门可以完善电能管理体系,充分挖掘节能潜力,采取有针对性的节能对策和措施,推动企业的节能减排工作。另一方面企业也可以深入了解自身存在的用电问题,针对这些问题实施具体节能措施,进一步根据成本效益分析,做出未来的用能行为规划,以达到企业和社会双赢目标。
传统的节能评估与异常监测方法存在用电异常阈值难以确定和不能动态适应季节、气候、地区环境特征等因素的问题。目前也有一些智能监测方法,但往往只是基于历史数据对用电进行静态分析。
发明内容
本发明的目的是为了克服现有技术的不足,提供一种基于数据挖掘技术的公共建筑用电异常判别方法,其对用电模式进行聚类分析并对未来的用电数据进行实时模式识别,可以实现对用户用电的异常监测,同时实现对用能数据价值的有效发掘与充分利用,并提高企业节能决策理论水平。
实现上述目的的一种技术方案是:一种基于数据挖掘技术的公共建筑用电异常判别方法,包括下列步骤:
S1,对历史用电数据库中的缺失数据和超出阈值范围的数据用对应字段平均值进行替代,并根据用户历史小时最高用电负荷x和用户历史小时平均用电负荷y建立特征向量[x,y],每个用户每个小时对应一个特征向量[x,y];
S2,对所有特征向量[x,y]进行K-means聚类分析,找到每个特征向量对应的聚类中心,每个聚类中心对应一个用电模式;
S3,根据基于CART算法的决策树,找到每个用电模式与其它用电模式的最优分裂属性以及最优分裂属性值,建立用电模式识别模型;
S4,用电异常监测步骤,采集用户实时小时最高用电负荷X和用户实时小时平均用电负荷Y,建立每个用户所对应的实时特征向量[X,Y],根据所述用电模式识别模型,确定所述实时特征向量[X,Y]所对应的用电模式,用局部离群因子检测方法判定该实时特征向量[X,Y]的离群程度,根据离群程度确定该实时特征向量[X,Y]所对应的用户是否为用电异常用电户。
进一步的,S2步骤中,先对所有特征向量[x,y]进行规范化,得到规范化特征向量z=[zx,zy],再对规范化特征向量z=[zx,zy]进行K-means聚类分析,规范化的公式为:
μ(x)和μ(y)分别代表任一历史采集时间点,所有用户的用户历史小时最高用电负荷的平均值和所有用户的用户历史小时平均用电负荷的平均值,σ(x)和σ(y)分别代表该历史采集时间点,所有用户的用户历史小时最高用电负荷的标准差和所有用户的用户历史小时平均用电负荷的标准差;
S4步骤中先对所述实时特征向量[X,Y]进行规范化,得到实时规范化特征向量Z=[ZX,ZY],再用局部离群因子检测方法判定所述实时规范化特征向量Z=[ZX,ZY]离群程度;其中μ(X)和μ(Y)分别代表所有用户的用户实时小时最高用电负荷的平均值和所有用户的用户实时小时平均用电负荷的平均值,σ(X)和σ(Y)分别代表所有用户的用户实时小时最高用电负荷的标准差和所有用户的用户实时小时平均用电负荷的标准差。
再进一步的,S2步骤中对规范化特征向量z=[zx,zy]进行K-means聚类分析的具体步骤为:
S21,在以用户小时最高用电负荷为横坐标,用户小时平均用电负荷为纵坐标的直角坐标系中,拾取k个聚类中心ui(j),其中j=0,i=1,2,……,k;
S22,选取n个规范化特征向量,记为zt,其中t=1,2,……,n,计算每个zt到每个聚类中心ui(j)的欧式距离;
S23,找出关于每个zt最小欧式距离的聚类中心ui(j),zt进入该聚类中心所对应的簇,并将每个簇的几何中心记为新聚类中心ui(j+1);
S24,计算所有zt关于与其所在簇对应的新聚类中心ui(j+1)的欧式距离的平方误差Ej,判定平方误差Ej是否在设定值范围内;
S25,若平方误差Ej在设定值范围内,则输出当前所有的聚类中心ui(j+1),以及对应簇内的所有规范化特征向量zt,每个聚类中心作为一个用电模式;
S26,若平方误差Ej不在设定值范围内,则令j=j+1,并返回步骤S23。
更进一步的,S3步骤中对由规范化特征向量zt,其中t=1,2,……,n,所构成的样本集S,以Gain_GINI的值最小的属性与属性值作为最优分裂属性以及最优分裂属性值。
还要进一步的,对于样本集S,
其中oi表示分类结果中第i个用电模式出现的概率;
根据用户历史小时最高用电负荷将样本集S划分成两部分,Gain_GINI计算如下:
最优二分方案为
还要进一步的,对于样本集S,
其中oi表示分类结果中第i个用电模式出现的概率;
根据用户历史小时平均用电负荷将样本集S划分成两部分,Gain_GINI计算如下:
最优二分方案为
再进一步的,对于任意一个对象p,即一个实时规范化特征向量Z=[ZX,ZY];
将p的k距离记作k-distance(p),在样本集S中,存在对象o,对象p相对于对象o的可达距离为:
reachdist(p,o)=max{k-distance(o),||p-o||};
则对应p的局部可达密度为:
局部离群点因子定义如下:
若LOFk(p)的值大于阈值,则判定该实时规范化特征向量所对应的用户用电异常。
进一步的,S1步骤、S2步骤和S3步骤定期重复进行。
采用了本发明的一种基于数据挖掘技术的公共建筑用电异常判别方法的技术方案,包括下列步骤:S1,对历史用电数据库中的缺失数据和超出阈值范围的数据用对应字段平均值进行替代,并根据用户历史小时最高用电负荷x和用户历史小时平均用电负荷y建立特征向量[x,y],每个用户每个小时对应一个特征向量[x,y];S2,对所有特征向量[x,y]进行K-means聚类分析,找到每个特征向量对应的聚类中心,每个聚类中心对应一个用电模式;S3,根据基于CART算法的决策树,找到每个用电模式与其它用电模式的最优分裂属性以及最优分裂属性值,建立用电模式识别模型;S4,用电异常监测步骤,采集用户实时小时最高用电负荷X和用户实时小时平均用电负荷Y,建立每个用户所对应的实时特征向量[X,Y],根据所述用电模式识别模型,确定所述实时特征向量[X,Y]所对应的用电模式,用局部离群因子检测方法判定该实时特征向量[X,Y]的离群程度,根据离群程度确定该实时特征向量[X,Y]所对应的用户是否为用电异常用电户。其技术效果是:可以对不同的用电模式进行识别,对建筑的用电情况有更直观的认识;可实时判断用电异常,及时进行通报,便于相关人员及时得知用电异常,避免电能浪费,达到节能目的;使用方式较为简便,在工程实际中,具有广泛的适用性。
附图说明
图1为本发明的一种基于数据挖掘技术的公共建筑用电异常判别方法的流程图。
具体实施方式
请参阅图1,本发明的发明人为了能更好地对本发明的技术方案进行理解,下面通过具体地实施例,并结合附图进行详细地说明:
本发明的一种基于数据挖掘技术的公共建筑用电异常判别方法包括下列步骤:
S1,数据预处理步骤,包括:
错误数据处理步骤:
对历史用电数据库中的缺失数据和超出阈值范围的数据用对应字段平均值进行替代。
数据规范化步骤:
从历史用电数据库中提取特征向量[x,y],其中,x代表用户历史小时最高用电负荷,y代表用户历史小时平均用电负荷。每个用户每个小时都生成一个对应的特征向量[x,y]。
对每个特征向量进行规范化,得到规范化特征向量z=[zx,zy],规范化的公式为:
和
其中z=[zx,zy]代表规范化特征向量,μ(x)和μ(y)分别代表任一历史采集时间点,所有用户的用户历史小时最高用电负荷的平均值和所有用户的用户历史小时平均用电负荷的平均值,σ(x)和σ(y)分别代表该历史采集时间点,所有用户的用户历史小时最高用电负荷的标准差和所有用户的用户历史小时平均用电负荷的标准差。
S2,用电数据聚类分析步骤:
对规范化特征向量z=[zx,zy]进行K-means聚类分析。K-means聚类算法简洁高效,在多种场景下表现出高性能,具体步骤如下:
S21,在以用户小时最高用电负荷为横坐标,用户小时平均用电负荷为纵坐标的直角坐标系中,拾取k个聚类中心ui(j),其中j=0,i=1,2,……,k;
S22,选取n个规范化特征向量z=[zx,zy],记为zt,其中t=1,2,……,n,计算每个zt到每个聚类中心ui(j)的欧式距离;
S23,找出关于每个zt最小欧式距离的聚类中心ui(j),zt进入该聚类中心所对应的簇,并将每个簇的几何中心记为新聚类中心ui(j+1);
S24,计算所有zt关于与其所在簇对应的新聚类中心ui(j+1)的欧式距离的平方误差Ej,判定平方误差Ej是否在设定值范围内;
S25,若平方误差Ej在设定值范围内,则输出当前所有的聚类中心ui(j+1),以及对应簇内的所有规范化特征向量zt,每个聚类中心作为一个用电模式;
S26,若平方误差Ej不在设定值范围内,则令j=j+1,并返回步骤S23。
S3,建立用电模式识别模型:
根据每个规范化特征向量zt以及每个规范化特征向量zt所对应的时间,基于CART算法的决策树进行分类。Cart分类树选择Gain_GINI的值最小的属性与属性值作为每个用电模式与其它用电模式进行最优分裂属性以及最优分裂属性值。Gain_GINI的值越小,说明二分后子样本的“纯净度”越高,即说明选择该属性值作为分裂属性值的效果越好。
对于由规范化特征向量zt所构成的样本集S,GINI计算式如下:
oi表示分类结果中第i个用电模式出现的概率。
对于含有n个样本的样本集S,根据用户历史小时最高用电负荷将样本集S划分成两部分,则划分成两部分之后,Gain_GINI计算如下:
或对于含有n个样本的样本集S,根据用户历史小时平均用电负荷将样本集S划分成两部分,则划分成两部分之后,Gain_GINI计算如下:
对于样本集S,计算所有属性的最优二分方案并选取其中最小值,作为样本集S的最优二分方案:
即:或者
即为样本集S的最优分裂属性以及最优分裂属性值。
S4,建立用电异常监测模型,具体方法为:
基于用电模式识别模型,对实时采集的用电数据,即用户实时小时最高用电负荷X和用户实时小时平均用电负荷Y,进行用电模式判别,再和相同用电模式的历史数据利用LOF算法进行离群点检测分析,从而判定用电是否异常。另外,在一定周期时间,比如一个月后,诸多因素发生变化,有必要对决策树进行重建,即重新进行S1步骤、S2步骤和S3步骤。
LOF算法即局部离群因子检测方法,是基于密度的离群点检测方法中比较有代表性的算法。
对象p,即任意一个用户的用户实时小时最高用电负荷X和用户实时小时平均用电负荷Y所构成的特征向量[X,Y],经过规范化后得到的实时规范化特征向量Z=[ZX,ZY],其中和找到实时规范化特征向量Z=[ZX,ZY]所对应的用电模式,即根据S3步骤中建立的用电模式识别模型,确定Z=[ZX,ZY]所对应的簇。
μ(X)和μ(Y)分别代表所有用户的用户实时小时最高用电负荷的平均值和所有用户的用户实时小时平均用电负荷的平均值,σ(X)和σ(Y)分别代表所有用户的用户实时小时最高用电负荷的标准差和所有用户的用户实时小时平均用电负荷的标准差。
对象p的k距离记作k-distance(p),在该簇中,存在对象o,其与对象p之间的距离记作d(p,o),k-distance(p)=d(p,o);
即k-distance(p)=max|||p-o|||。
与对象p之间距离小于等于k-distance(p)的对象集合称为对象p的第k距离邻域,记作:Nk(p)。显然,离群度越大的对象的范围往往比较大,而离群度比较小的对象范围小。
对象p相对于对象o的可达距离为:
reachdist(p,o)=max{k-distance(o),||p-o||};
如上式所示,若对象p远离对象o,则两者之间的可达距离就是它们之间的实际距离;但若两者足够近,则实际距离用o的k距离代替。
局部可达密度为:
局部离群点因子,表征了对象p的离群点的程度,定义如下:
如果对象p不是局部离群点,则LOF(p)接近于1。即对象p是局部离群点的程度较小,对象o的局部可达密度和对象p的局部可达密度相似,最后得出的LOF(p)值应该接近1。反之,对象p是局部离群点的程度越大,LOF(p)值越高。通过这种方式在样本空间数据分布不均匀的情况下也可以准确发现离群点,将与离群点对应的用户列为用电异常的用户。
本发明的一种基于数据挖掘技术的公共建筑用电异常判别方法基于节能评估平台中采集的用户用能数据,研究数据清洗与挖掘方法,对用电模式进行聚类分析并对未来的用电数据进行实时模式识别,可以实现对用户用电的异常监测,同时实现对用能数据价值的有效发掘与充分利用,并提高企业节能决策理论水平。
本发明一种基于数据挖掘技术的公共建筑用电异常判别方法具有如下有益效果:可以对不同的用电模式进行识别,对建筑的用电情况有更直观的认识。可实时判断用电异常,及时进行通报,便于相关人员及时得知用电异常,避免电能浪费,达到节能目的。使用方式较为简便,在工程实际中,具有广泛的适用性。
本技术领域中的普通技术人员应当认识到,以上的实施例仅是用来说明本发明,而并非用作为对本发明的限定,只要在本发明的实质精神范围内,对以上所述实施例的变化、变型都将落在本发明的权利要求书范围内。
Claims (8)
1.一种基于数据挖掘技术的公共建筑用电异常判别方法,包括下列步骤:
S1,对历史用电数据库中的缺失数据和超出阈值范围的数据用对应字段平均值进行替代,并根据用户历史小时最高用电负荷x和用户历史小时平均用电负荷y建立特征向量[x,y],每个用户每个小时对应一个特征向量[x,y];
S2,对所有特征向量[x,y]进行K-means聚类分析,找到每个特征向量对应的聚类中心,每个聚类中心对应一个用电模式;
S3,根据基于CART算法的决策树,找到每个用电模式与其它用电模式的最优分裂属性以及最优分裂属性值,建立用电模式识别模型;
S4,用电异常监测步骤,采集用户实时小时最高用电负荷X和用户实时小时平均用电负荷Y,建立每个用户所对应的实时特征向量[X,Y],根据所述用电模式识别模型,确定所述实时特征向量[X,Y]所对应的用电模式,用局部离群因子检测方法判定该实时特征向量[X,Y]的离群程度,根据离群程度确定该实时特征向量[X,Y]所对应的用户是否为用电异常用电户。
2.根据权利要求1所述的一种基于数据挖掘技术的公共建筑用电异常判别方法,其特征在于:
S2步骤中,先对所有特征向量[x,y]进行规范化,得到规范化特征向量z=[zx,zy],再对规范化特征向量z=[zx,zy]进行K-means聚类分析,规范化的公式为:
和
μ(x)和μ(y)分别代表任一历史采集时间点,所有用户的用户历史小时最高用电负荷的平均值和所有用户的用户历史小时平均用电负荷的平均值,σ(x)和σ(y)分别代表该历史采集时间点,所有用户的用户历史小时最高用电负荷的标准差和所有用户的用户历史小时平均用电负荷的标准差;
S4步骤中先对所述实时特征向量[X,Y]进行规范化,得到实时规范化特征向量Z=[ZX,ZY],再用局部离群因子检测方法判定所述实时规范化特征向量Z=[ZX,ZY]离群程度;其中μ(X)和μ(Y)分别代表所有用户的用户实时小时最高用电负荷的平均值和所有用户的用户实时小时平均用电负荷的平均值,σ(X)和σ(Y)分别代表所有用户的用户实时小时最高用电负荷的标准差和所有用户的用户实时小时平均用电负荷的标准差。
3.根据权利要求2所述的一种基于数据挖掘技术的公共建筑用电异常判别方法,其特征在于:S2步骤中对规范化特征向量z=[zx,zy]进行K-means聚类分析的具体步骤为:
S21,在以用户小时最高用电负荷为横坐标,用户小时平均用电负荷为纵坐标的直角坐标系中,拾取k个聚类中心ui(j),其中j=0,i=1,2,……,k;
S22,选取n个规范化特征向量,记为zt,其中t=1,2,……,n,计算每个zt到每个聚类中心ui(j)的欧式距离;
S23,找出关于每个zt最小欧式距离的聚类中心ui(j),zt进入该聚类中心所对应的簇,并将每个簇的几何中心记为新聚类中心ui(j+1);
S24,计算所有zt关于与其所在簇对应的新聚类中心ui(j+1)的欧式距离的平方误差Ej,判定平方误差Ej是否在设定值范围内;
S25,若平方误差Ej在设定值范围内,则输出当前所有的聚类中心ui(j+1),以及对应簇内的所有规范化特征向量zt,每个聚类中心作为一个用电模式;
S26,若平方误差Ej不在设定值范围内,则令j=j+1,并返回步骤S23。
4.根据权利要求3所述的一种基于数据挖掘技术的公共建筑用电异常判别方法,其特征在于:S3步骤中对由规范化特征向量zt,其中t=1,2,……,n,所构成的样本集S,以Gain_GINI的值最小的属性与属性值作为最优分裂属性以及最优分裂属性值。
5.根据权利要求4所述的一种基于数据挖掘技术的公共建筑用电异常判别方法,其特征在于:
对于样本集S,
其中oi表示分类结果中第i个用电模式出现的概率;
根据用户历史小时最高用电负荷将样本集S划分成两部分,Gain_GINI计算如下:
最优二分方案为
6.根据权利要求4所述的一种基于数据挖掘技术的公共建筑用电异常判别方法,其特征在于:
对于样本集S,
其中oi表示分类结果中第i个用电模式出现的概率;
根据用户历史小时平均用电负荷将样本集S划分成两部分,Gain_GINI计算如下:
最优二分方案为
7.根据权利要求2所述的一种基于数据挖掘技术的公共建筑用电异常判别方法,其特征在于:
对于任意一个对象p,即一个实时规范化特征向量Z=[ZX,ZY];
将p的k距离记作k-distance(p),在样本集S中,存在对象o,对象p相对于对象o的可达距离为:
reachdist(p,o)=max{k-distance(o),||p-o||};
则对应p的局部可达密度为:
局部离群点因子定义如下:
若LOFk(p)的值大于阈值,则判定该实时规范化特征向量所对应的用户用电异常。
8.根据权利要求2所述的一种基于数据挖掘技术的公共建筑用电异常判别方法,其特征在于:S1步骤、S2步骤和S3步骤定期重复进行。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810637597.9A CN108830324A (zh) | 2018-06-20 | 2018-06-20 | 一种基于数据挖掘技术的公共建筑用电异常判别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810637597.9A CN108830324A (zh) | 2018-06-20 | 2018-06-20 | 一种基于数据挖掘技术的公共建筑用电异常判别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108830324A true CN108830324A (zh) | 2018-11-16 |
Family
ID=64142844
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810637597.9A Pending CN108830324A (zh) | 2018-06-20 | 2018-06-20 | 一种基于数据挖掘技术的公共建筑用电异常判别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108830324A (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110298552A (zh) * | 2019-05-31 | 2019-10-01 | 国网上海市电力公司 | 一种结合历史用电特征的配电网个体功率异常检测方法 |
CN110826641A (zh) * | 2019-11-13 | 2020-02-21 | 上海积成能源科技有限公司 | 一种基于聚类分析归类居民用电情况的系统及方法 |
CN111222768A (zh) * | 2019-12-29 | 2020-06-02 | 杭州拓深科技有限公司 | 非侵入式负荷识别-用电行为分析用电判断方法及系统 |
CN111523819A (zh) * | 2020-04-28 | 2020-08-11 | 重庆涪陵电力实业股份有限公司 | 一种计及分布式电源出力不确定性的节能潜力评估方法 |
CN111652325A (zh) * | 2020-06-28 | 2020-09-11 | 广东诺信安科技有限公司 | 基于聚类的企业用电模式识别方法、装置及存储介质 |
CN112230056A (zh) * | 2020-09-07 | 2021-01-15 | 国网河南省电力公司电力科学研究院 | 基于OFMMK-Means聚类和复合分位数回归多谐波源贡献计算方法 |
CN112686288A (zh) * | 2020-12-22 | 2021-04-20 | 博锐尚格科技股份有限公司 | 用电行为异常检测方法、装置、及计算机可读存储介质 |
CN112800148A (zh) * | 2021-02-04 | 2021-05-14 | 国网福建省电力有限公司 | 一种基于聚类特征树和离群度量化的散乱污企业研判方法 |
CN113449793A (zh) * | 2021-06-28 | 2021-09-28 | 国网北京市电力公司 | 用电状态的确定方法及装置 |
CN117076991A (zh) * | 2023-10-16 | 2023-11-17 | 云境商务智能研究院南京有限公司 | 治污设备用电异常监测方法、装置及计算机设备 |
CN117220417A (zh) * | 2023-11-07 | 2023-12-12 | 国网山西省电力公司信息通信分公司 | 消费端电负荷动态监测方法及系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103617568A (zh) * | 2013-12-06 | 2014-03-05 | 国家电网公司 | 稳态电能质量预警机制中的异常数据判定阈值设定方法 |
US20140358838A1 (en) * | 2013-06-04 | 2014-12-04 | International Business Machines Corporation | Detecting electricity theft via meter tampering using statistical methods |
CN106250905A (zh) * | 2016-07-08 | 2016-12-21 | 复旦大学 | 一种结合高校建筑结构特征的实时能耗异常检测方法 |
-
2018
- 2018-06-20 CN CN201810637597.9A patent/CN108830324A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140358838A1 (en) * | 2013-06-04 | 2014-12-04 | International Business Machines Corporation | Detecting electricity theft via meter tampering using statistical methods |
US20140358839A1 (en) * | 2013-06-04 | 2014-12-04 | International Business Machines Corporation | Detecting electricity theft via meter tampering using statistical methods |
CN103617568A (zh) * | 2013-12-06 | 2014-03-05 | 国家电网公司 | 稳态电能质量预警机制中的异常数据判定阈值设定方法 |
CN106250905A (zh) * | 2016-07-08 | 2016-12-21 | 复旦大学 | 一种结合高校建筑结构特征的实时能耗异常检测方法 |
Non-Patent Citations (3)
Title |
---|
ZEROKAS: ""CART树算法详解"", 《CSDN博客-HTTPS://BLOG.CSDN.NET/E15273/ARTICLE/DETAILS/79648502》 * |
庄池杰 等: ""基于无监督学习的电力用户异常用电模式检测"", 《中国电机工程学报》 * |
王守相、刘天宇: ""计及用电模式的居民负荷梯度提升树分类识别方法"", 《电力系统及其自动化学报》 * |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110298552B (zh) * | 2019-05-31 | 2023-12-01 | 国网上海市电力公司 | 一种结合历史用电特征的配电网个体功率异常检测方法 |
CN110298552A (zh) * | 2019-05-31 | 2019-10-01 | 国网上海市电力公司 | 一种结合历史用电特征的配电网个体功率异常检测方法 |
CN110826641A (zh) * | 2019-11-13 | 2020-02-21 | 上海积成能源科技有限公司 | 一种基于聚类分析归类居民用电情况的系统及方法 |
CN111222768A (zh) * | 2019-12-29 | 2020-06-02 | 杭州拓深科技有限公司 | 非侵入式负荷识别-用电行为分析用电判断方法及系统 |
CN111523819A (zh) * | 2020-04-28 | 2020-08-11 | 重庆涪陵电力实业股份有限公司 | 一种计及分布式电源出力不确定性的节能潜力评估方法 |
CN111523819B (zh) * | 2020-04-28 | 2023-04-21 | 重庆涪陵电力实业股份有限公司 | 一种计及分布式电源出力不确定性的节能潜力评估方法 |
CN111652325A (zh) * | 2020-06-28 | 2020-09-11 | 广东诺信安科技有限公司 | 基于聚类的企业用电模式识别方法、装置及存储介质 |
CN112230056A (zh) * | 2020-09-07 | 2021-01-15 | 国网河南省电力公司电力科学研究院 | 基于OFMMK-Means聚类和复合分位数回归多谐波源贡献计算方法 |
CN112230056B (zh) * | 2020-09-07 | 2022-04-26 | 国网河南省电力公司电力科学研究院 | 一种基于OFMMK-Means聚类和复合分位数回归多谐波源贡献计算方法 |
CN112686288A (zh) * | 2020-12-22 | 2021-04-20 | 博锐尚格科技股份有限公司 | 用电行为异常检测方法、装置、及计算机可读存储介质 |
CN112800148A (zh) * | 2021-02-04 | 2021-05-14 | 国网福建省电力有限公司 | 一种基于聚类特征树和离群度量化的散乱污企业研判方法 |
CN112800148B (zh) * | 2021-02-04 | 2022-06-07 | 国网福建省电力有限公司 | 一种基于聚类特征树和离群度量化的散乱污企业研判方法 |
CN113449793A (zh) * | 2021-06-28 | 2021-09-28 | 国网北京市电力公司 | 用电状态的确定方法及装置 |
CN117076991A (zh) * | 2023-10-16 | 2023-11-17 | 云境商务智能研究院南京有限公司 | 治污设备用电异常监测方法、装置及计算机设备 |
CN117076991B (zh) * | 2023-10-16 | 2024-01-02 | 云境商务智能研究院南京有限公司 | 治污设备用电异常监测方法、装置及计算机设备 |
CN117220417A (zh) * | 2023-11-07 | 2023-12-12 | 国网山西省电力公司信息通信分公司 | 消费端电负荷动态监测方法及系统 |
CN117220417B (zh) * | 2023-11-07 | 2024-02-09 | 国网山西省电力公司信息通信分公司 | 消费端电负荷动态监测方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108830324A (zh) | 一种基于数据挖掘技术的公共建筑用电异常判别方法 | |
CN106054104B (zh) | 一种基于决策树的智能电表故障实时预测方法 | |
Gellert et al. | A study on forecasting electricity production and consumption in smart cities and factories | |
Zhang et al. | Preselection via classification: A case study on evolutionary multiobjective optimization | |
CN116865258B (zh) | 一种层级构造的分布式电源智能电网构建方法 | |
CN108920790A (zh) | 一种基于历史数据的公共建筑用电模式识别模型建立方法 | |
CN104881735A (zh) | 用于支撑智慧城市运行管理的智能电网大数据挖掘系统及方法 | |
CN106384300A (zh) | 基于大数据和模糊模型的建筑异常用能检测方法及系统 | |
Makhadmeh et al. | Recent advances in multi-objective grey wolf optimizer, its versions and applications | |
CN106294738A (zh) | 一种智能家居场景配置方法 | |
CN104699890A (zh) | 一种城网配变重过载短期预警模型的建模方法 | |
CN116796403A (zh) | 一种基于商业建筑综合能耗预测的建筑节能方法 | |
Huang et al. | Smart energy management system based on reconfigurable AI chip and electrical vehicles | |
Zhou et al. | Distributionally robust energy management for islanded microgrids with variable moment information: An MISOCP approach | |
Kamra et al. | Sustainability of Renewable-Energy-Sources-Classification utilizing Moderator-Intuitionistic-Fuzzy Hybrid Averaging Operator | |
Gamboa-Rosales et al. | Determining Technologies Trends and Evolution of Smart Building Technologies by Bibliometric Analysis from 1984 to 2020: Trends, research opportunities and future perspectives | |
Wang et al. | Scientometric of nearly zero energy building research: A systematic review from the perspective of co-citation analysis | |
Zhang et al. | A density-center-based automatic clustering algorithm for IoT data analysis | |
CN113344073A (zh) | 一种基于融合进化算法的日负荷曲线聚类方法及系统 | |
Dong et al. | The research on user short-term electricity load forecasting for judging electric theft | |
Velascoa et al. | Energy Losses Estimation in Low Voltage Smart Grids by using Loss Maps | |
CN102393946B (zh) | 一种农电系统数据指标终端智能计算的交互方法 | |
CN109657735A (zh) | 基于相关向量机的铝电解槽寿命预测方法 | |
Dong et al. | Planning for Network Expansion Based on Prim Algorithm and Reinforcement Learning | |
Qu et al. | Differential evolution-optimized general regression neural network and application to forecasting water demand in Yellow River Basin |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20181116 |
|
RJ01 | Rejection of invention patent application after publication |