CN108228827A - 一种基于小波变换的负荷聚类和模式识别方法 - Google Patents

一种基于小波变换的负荷聚类和模式识别方法 Download PDF

Info

Publication number
CN108228827A
CN108228827A CN201810002118.6A CN201810002118A CN108228827A CN 108228827 A CN108228827 A CN 108228827A CN 201810002118 A CN201810002118 A CN 201810002118A CN 108228827 A CN108228827 A CN 108228827A
Authority
CN
China
Prior art keywords
cluster
temp
wavelet transformation
method based
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810002118.6A
Other languages
English (en)
Inventor
钱科军
沈杰
韩克勤
郎燕娟
张国骏
阮文俊
杨永标
陈嘉栋
宋杰
王金明
杨世海
陆子刚
赵双双
曹晓冬
支亚薇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
State Grid Jiangsu Electric Power Co Ltd
NARI Group Corp
Nari Technology Co Ltd
NARI Nanjing Control System Co Ltd
Original Assignee
State Grid Corp of China SGCC
State Grid Jiangsu Electric Power Co Ltd
NARI Group Corp
Nari Technology Co Ltd
NARI Nanjing Control System Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, State Grid Jiangsu Electric Power Co Ltd, NARI Group Corp, Nari Technology Co Ltd, NARI Nanjing Control System Co Ltd filed Critical State Grid Corp of China SGCC
Priority to CN201810002118.6A priority Critical patent/CN108228827A/zh
Publication of CN108228827A publication Critical patent/CN108228827A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/14Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
    • G06F17/148Wavelet transforms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Algebra (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于小波变换的负荷聚类和模式识别方法,包括获取n维的日负荷曲线;降低日负荷曲线的维度,生成逼近信号XaL和细节信号XaH;分别对标准化处理后的逼近信号X′aL和细节信号XaH进行聚类,获得簇A和簇D;将簇A和簇D聚合,获得最终的簇C,其聚类中心就是负荷模式中心Ccenter。本发明采用小波变换来减少维数,提高了曲线聚类的有效性,与其他现有的算法相比,聚类的效果要优于其他几种算法。

Description

一种基于小波变换的负荷聚类和模式识别方法
技术领域
本发明涉及一种基于小波变换的负荷聚类和模式识别方法,属于需求响应中负荷聚类和负荷模式识别领域。
背景技术
智能电网是电力能源管理领域的一个现代化应用系统。它利用自动控制和现代通信技术,提高能源消耗的效率、可靠性和安全性。随着智能电网的发展,海量数据资源日益积累。原因之一就是数据记录频率的提高。智能电网中使用的智能电表可以定期记录用户的电力负荷数据,通常是1小时、30分钟、15分钟甚至1分钟。对于电力消费者来说,这些负荷数据有助于获得他们的消费行为模式,也被称为负荷模式。这种负荷模式可以用于消费者分类。近年来,需求响应得到了实质性的发展,电力供应商可以根据负荷模式和消费类别实现有效的能源控制、灵活的定价和需求管理。另一方面,电力终端消费者可以通过对电价波动的响应来了解他们的负荷模式,以减少他们的电费支出。然而,电力负荷数据一般都是高维。以15分钟的间隔为例。当一个智能电表记录每15分钟从0:00到23:45的一个用户的用电负荷数据,它每天就记录了96个值,根据这些值就可以画出一个日负荷曲线。在这种情况下,一年内的日负荷曲线包含365组96值曲线,曲线聚类时可能会将这些曲线分类到不同的集群中,提取负荷模式的困难。解决这一问题的传统方法通常是统计方法。例如,用日负荷值之和代替96个值,或者选择日负荷曲线上的代表时段,如峰值时间、波谷时间。虽然这些方法显著地减少了数据的数量,但它们也会导致信息丢失,导致负荷模式提取的准确性降低。
发明内容
为了解决上述技术问题,本发明提供了一种基于小波变换的负荷聚类和模式识别方法。
为了达到上述目的,本发明所采用的技术方案是:
一种基于小波变换的负荷聚类和模式识别方法,包括以下步骤,
获取n维的日负荷曲线;
降低日负荷曲线的维度,生成逼近信号XaL和细节信号XaH
分别对标准化处理后的逼近信号X′aL和细节信号XaH进行聚类,获得簇A和簇D;
将簇A和簇D聚合,获得最终的簇C,其聚类中心就是负荷模式中心Ccenter
采用多级一维离散沃尔什变换降低日负荷曲线的维度。
逼近信号XaL和细节信号XaH为,
XaL={x1,αL,x2,αL,…xn,αL}
XaH={x1,αH,x2,αH,…xn,αH}
其中,xi,aL=<ai1,ai2,…,ain'>,xi,aH=<di1,di2,…,din'>,1≤i≤n,1≤k≤n′,n′=n/2α,xi,aL、xi,aH分别为第i维α级逼近信号和细节信号,aik为第i维逼近信号的第k个元素,dik为第i维细节信号的第k个元素,α为级数,即α级一维离散沃尔什变换。
对逼近信号XaL进行z-score标准化处理,得到标准化处理后的逼近信号X′aL
X′aL为,
X aL={x'1,αL,x'2,αL,…x'n,αL}
其中,标准化处理后的第i维α级逼近信号x′ia,L=<a′i1,a′i2,…,a′in'>,μi为aik的平均值,σi为aik的标准差,1≤k≤n′。
分别对标准化处理后的逼近信号X′aL和细节信号XaH进行k-means聚类,获得簇A和簇D,k-means聚类的K值由Simplified Silhouette标准确定。
k-means聚类的K值由Simplified Silhouette标准确定的步骤为,
定义日负荷曲线为X={x1,x2,…xn},聚类结果为C={C1,C2,…CK},X的第i条曲线xi属于一个簇Cr,Cr∈C;
其中,是曲线xi根据Simplified Silhouette标准计算得到的数值,为xi到簇Cr的距离,为xi到其他簇之间的最近距离;
其中,μr为簇Cr的中心,μw为簇Cw的中心,Cw∈C,w≠r;
的平均值SSWC为,
SSWC越大,聚类效果越好,当SSWC最大时,对应的K值即为选定值。
簇A和簇D聚合的过程为,
定义簇A={A1,A2,…Ap},簇D={D1,D2,…Dq};
求两个簇的交集,
ADi′j′=Ai′∩Dj′
其中,1≤i′≤p,1≤j′≤q,Ai′是簇A第i′个元素,Dj′是簇D第j'个元素;
如果Ai′=Dj′,将ADi′j′定义为保留的ADi′j′,并加入Creserved,Creserved为所有保留的ADi′j′集合,l1为保留的ADi′j′数量;
如果Ai′≠Dj′且Ai′∩Dj′≠φ,将ADi′j′定义为暂时的ADi′j′,并加入Ctemp,Ctemp为所有暂时的ADi′j′集合,l2为暂时的ADi′j′数量;
如果l2>max{p,q}-l1,对所有包含在Ctemp的日负荷曲线运用k-means聚类,得到新的簇C′temp,这里k-means聚类的K值为max{p,q}-l2
如果l2=max{p,q}-l1,则令Ctemp=C′temp
取C′temp与Creserved的并集作为最终的聚类结果C,
C=Creserved∪C′temp={C1,C2,…,CK},
K=max{p,q},
Ccenter为C的聚类中心的集合,Ccenter={μ12,…,μK},
其中,μi″是Ci″的聚类中心,Ci″∈C,1≤i″≤K。
本发明所达到的有益效果:本发明采用小波变换来减少维数,提高了曲线聚类的有效性,与其他现有的算法相比,聚类的效果要优于其他几种算法。
附图说明
图1为本发明的流程图。
具体实施方式
下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
如图1所示,一种基于小波变换的负荷聚类和模式识别方法,包括以下步骤:
步骤1,获取n维的日负荷曲线。
步骤2,采用多级一维离散沃尔什变换降低日负荷曲线的维度,生成逼近信号XaL和细节信号XaH
逼近信号XaL和细节信号XaH为:
XaL={x1,αL,x2,αL,…xn,αL}
XaH={x1,αH,x2,αH,…xn,αH}
其中,xi,aL=<ai1,ai2,…,ain'>,xi,aH=<di1,di2,…,din'>,1≤i≤n,1≤k≤n′,n′=n/2α,xi,aL、xi,aH分别为第i维α级逼近信号和细节信号,aik为第i维逼近信号的第k个元素,dik为第i维细节信号的第k个元素,α为级数,即α级一维离散沃尔什变换。
步骤3,对逼近信号XaL进行z-score标准化处理,得到标准化处理后的逼近信号X′aL
X′aL={x'1,αL,x'2,αL,…x'n,αL}
其中,标准化处理后的第i维α级逼近信号x′ia,L=<a′i1,a′i2,…,a′in'>,μi为aik的平均值,σi为aik的标准差,1≤k≤n′。
步骤4,分别对标准化处理后的逼近信号X′aL和细节信号XaH进行k-means聚类,获得簇A和簇D。
k-means聚类的K值由Simplified Silhouette标准(SimplifiedSilhouetteWidth Criterion)确定,具体过程为:
定义日负荷曲线为X={x1,x2,…xn},聚类结果为C={C1,C2,…CK},X的第i条曲线xi属于一个簇Cr,Cr∈C;
其中,是曲线xi根据Simplified Silhouette标准计算得到的数值,为xi到簇Cr的距离,为xi到其他簇之间的最近距离;
其中,μr为簇Cr的中心,μw为簇Cw的中心,Cw∈C,w≠r;
的平均值SSWC为,
SSWC越大,聚类效果越好,当SSWC最大时,对应的K值即为选定值。
步骤5,将簇A和簇D聚合,获得最终的簇C,其聚类中心就是负荷模式中心Ccenter
簇A和簇D聚合的过程为:
1)定义簇A={A1,A2,…Ap},簇D={D1,D2,…Dq};
2)求两个簇的交集,
ADi′j′=Ai′∩Dj′
其中,1≤i′≤p,1≤j′≤q,Ai′是簇A第i′个元素,Dj′是簇D第j'个元素;
3)如果Ai′=Dj′,将ADi′j′定义为保留的ADi′j′,并加入Creserved,Creserved为所有保留的ADi′j′集合,l1为保留的ADi′j′数量;
4)如果Ai′≠Dj′且Ai′∩Dj′≠φ,将ADi′j′定义为暂时的ADi′j′,并加入Ctemp,Ctemp为所有暂时的ADi′j′集合,l2为暂时的ADi′j′数量;
5)如果l2>max{p,q}-l1,对所有包含在Ctemp的日负荷曲线运用k-means聚类,得到新的簇C′temp,这里k-means聚类的K值为max{p,q}-l2
6)如果l2=max{p,q}-l1,则令Ctemp=C′temp
7)取C′temp与Creserved的并集作为最终的聚类结果C,
C=Creserved∪C′temp={C1,C2,…,CK},
K=max{p,q},
Ccenter为C的聚类中心的集合,Ccenter={μ12,…,μK},
其中,μi″是Ci″的聚类中心,Ci″∈C,1≤i″≤K。
如表1所示,为上述方法与现有的几个方法的比较。其中,FCCWT是本文提出方法,Original_N基于Z值标准化的但是对原有的日负荷曲线不降维的聚类方法,cA_N和cD们是分别基于Z值标准化后的逼近信号和细节信号进行聚类,逼近信号和细节信号与FCCWT采用一维离散小波变换后具有相同的规模。
常见的聚类有效性指标:Davies-Bouldin Index(DB)、Dunn Validity Index(DVI)和Silhouette Width Criterion(SWC)和Simplified Silhouette Width Criterion(SSWC)。
表1负荷聚类方法的性能比较
DB越小越好,DVI、SWC、SSWC则是越大越好,可以看出FCCWT的算法性能最好。
上述方法采用小波变换来减少维数,提高了曲线聚类的有效性,与其他现有的算法相比,聚类的效果要优于其他几种算法。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。

Claims (8)

1.一种基于小波变换的负荷聚类和模式识别方法,其特征在于:包括以下步骤,
获取n维的日负荷曲线;
降低日负荷曲线的维度,生成逼近信号XaL和细节信号XaH
分别对标准化处理后的逼近信号X′aL和细节信号XaH进行聚类,获得簇A和簇D;
将簇A和簇D聚合,获得最终的簇C,其聚类中心就是负荷模式中心Ccenter
2.根据权利要求1所述的一种基于小波变换的负荷聚类和模式识别方法,其特征在于:采用多级一维离散沃尔什变换降低日负荷曲线的维度。
3.根据权利要求2所述的一种基于小波变换的负荷聚类和模式识别方法,其特征在于:逼近信号XaL和细节信号XaH为,
XaL={x1,αL,x2,αL,…xn,αL}
XaH={x1,αH,x2,αH,…xn,αH}
其中,xi,aL=<ai1,ai2,…,ain'>,xi,aH=<di1,di2,…,din'>,1≤i≤n,1≤k≤n′,n′=n/2α,xi,aL、xi,aH分别为第i维α级逼近信号和细节信号,aik为第i维逼近信号的第k个元素,dik为第i维细节信号的第k个元素,α为级数,即α级一维离散沃尔什变换。
4.根据权利要求1所述的一种基于小波变换的负荷聚类和模式识别方法,其特征在于:对逼近信号XaL进行z-score标准化处理,得到标准化处理后的逼近信号X′aL
5.根据权利要求4所述的一种基于小波变换的负荷聚类和模式识别方法,其特征在于:X′aL为,
X′aL={x'1,αL,x'2,αL,…x'n,αL}
其中,标准化处理后的第i维α级逼近信号x'i,αL=<a′i1,a′i2,…,a′in'>,μi为aik的平均值,σi为aik的标准差,1≤k≤n′。
6.根据权利要求1所述的一种基于小波变换的负荷聚类和模式识别方法,其特征在于:分别对标准化处理后的逼近信号X′aL和细节信号XaH进行k-means聚类,获得簇A和簇D,k-means聚类的K值由Simplified Silhouette标准确定。
7.根据权利要求6所述的一种基于小波变换的负荷聚类和模式识别方法,其特征在于:k-means聚类的K值由Simplified Silhouette标准确定的步骤为,
定义日负荷曲线为X={x1,x2,…xn},聚类结果为C={C1,C2,…CK},X的第i条曲线xi属于一个簇Cr,Cr∈C;
其中,是曲线xi根据Simplified Silhouette标准计算得到的数值,为xi到簇Cr的距离,为xi到其他簇之间的最近距离;
其中,μr为簇Cr的中心,μw为簇Cw的中心,Cw∈C,w≠r;
的平均值SSWC为,
SSWC越大,聚类效果越好,当SSWC最大时,对应的K值即为选定值。
8.根据权利要求1所述的一种基于小波变换的负荷聚类和模式识别方法,其特征在于:簇A和簇D聚合的过程为,
定义簇A={A1,A2,…Ap},簇D={D1,D2,…Dq};
求两个簇的交集,
ADi′j′=Ai′∩Dj′
其中,1≤i′≤p,1≤j′≤q,Ai′是簇A第i′个元素,Dj′是簇D第j'个元素;
如果Ai′=Dj′,将ADi′j′定义为保留的ADi′j′,并加入Creserved,Creserved为所有保留的ADi′j′集合,l1为保留的ADi′j′数量;
如果Ai′≠Dj′且Ai′∩Dj′≠φ,将ADi′j′定义为暂时的ADi′j′,并加入Ctemp,Ctemp为所有暂时的ADi′j′集合,l2为暂时的ADi′j′数量;
如果l2>max{p,q}-l1,对所有包含在Ctemp的日负荷曲线运用k-means聚类,得到新的簇C′temp,这里k-means聚类的K值为max{p,q}-l2
如果l2=max{p,q}-l1,则令Ctemp=C′temp
取C′temp与Creserved的并集作为最终的聚类结果C,
C=Creserved∪C′temp={C1,C2,…,CK},
K=max{p,q},
Ccenter为C的聚类中心的集合,Ccenter={μ12,…,μK},
其中,μi″是Ci″的聚类中心,Ci″∈C,1≤i″≤K。
CN201810002118.6A 2018-01-02 2018-01-02 一种基于小波变换的负荷聚类和模式识别方法 Pending CN108228827A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810002118.6A CN108228827A (zh) 2018-01-02 2018-01-02 一种基于小波变换的负荷聚类和模式识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810002118.6A CN108228827A (zh) 2018-01-02 2018-01-02 一种基于小波变换的负荷聚类和模式识别方法

Publications (1)

Publication Number Publication Date
CN108228827A true CN108228827A (zh) 2018-06-29

Family

ID=62644840

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810002118.6A Pending CN108228827A (zh) 2018-01-02 2018-01-02 一种基于小波变换的负荷聚类和模式识别方法

Country Status (1)

Country Link
CN (1) CN108228827A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112215490A (zh) * 2020-10-12 2021-01-12 国网重庆市电力公司电力科学研究院 一种基于相关性系数改进K-means的电力负荷聚类分析方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102156814A (zh) * 2011-04-06 2011-08-17 广东省电力设计研究院 基于聚类的典型日负荷曲线选取方法及装置
CN107423769A (zh) * 2017-08-03 2017-12-01 四川大学 基于形态特征的电力负荷曲线自适应聚类方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102156814A (zh) * 2011-04-06 2011-08-17 广东省电力设计研究院 基于聚类的典型日负荷曲线选取方法及装置
CN107423769A (zh) * 2017-08-03 2017-12-01 四川大学 基于形态特征的电力负荷曲线自适应聚类方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ZIGUI JIANG等: "A Fused Load Curve Clustering Algorithm Based on Wavelet Transform", 《IEEE》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112215490A (zh) * 2020-10-12 2021-01-12 国网重庆市电力公司电力科学研究院 一种基于相关性系数改进K-means的电力负荷聚类分析方法

Similar Documents

Publication Publication Date Title
Räsänen et al. Feature-based clustering for electricity use time series data
Jiang et al. A fused load curve clustering algorithm based on wavelet transform
US20210056647A1 (en) Method for multi-dimensional identification of flexible load demand response effect
CN110781332A (zh) 基于复合聚类算法的电力居民用户日负荷曲线聚类方法
Rajabi et al. A review on clustering of residential electricity customers and its applications
CN107133652A (zh) 基于K‑means聚类算法的用电客户价值评估方法及系统
CN109146252A (zh) 基于调节潜力指标的用户用电行为聚类分析方法和系统
CN106203478A (zh) 一种用于智能电表大数据的负荷曲线聚类方法
CN110381126A (zh) 基于边缘计算的用电设备识别方法、系统、设备及介质
CN111724278A (zh) 一种面向电力多元负荷用户的精细分类方法及系统
CN107248031B (zh) 一种针对负荷曲线峰谷差的快速电力用户分类方法
CN112819299A (zh) 一种基于中心优化的差分K-means负荷聚类方法
CN106096805A (zh) 一种基于熵权法特征选择的居民用电负荷分类方法
CN110874381B (zh) 一种基于空间密度聚类的用户侧负荷数据异常值识别方法
CN111177216B (zh) 综合能源消费者行为特征的关联规则生成方法及装置
Shamim et al. Multi-domain feature extraction for improved clustering of smart meter data
CN108428055A (zh) 一种考虑负荷纵向特性的负荷聚类方法
CN110543889A (zh) 电力负荷分层聚类方法、装置、计算机设备及存储介质
CN112463849A (zh) 进行台区户变关系识别的方法、计算机可读取的存储介质
Wang et al. Big data analytics for price forecasting in smart grids
Lu et al. Adaptive weighted fuzzy clustering algorithm for load profiling of smart grid customers
CN108228827A (zh) 一种基于小波变换的负荷聚类和模式识别方法
CN110795610B (zh) 一种基于聚类的电力负荷分析方法
CN117236022A (zh) 互感器剩余寿命预测模型训练方法、应用方法及电子设备
CN106651630A (zh) 关键用电行业识别方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180629

RJ01 Rejection of invention patent application after publication