CN108228827A - 一种基于小波变换的负荷聚类和模式识别方法 - Google Patents
一种基于小波变换的负荷聚类和模式识别方法 Download PDFInfo
- Publication number
- CN108228827A CN108228827A CN201810002118.6A CN201810002118A CN108228827A CN 108228827 A CN108228827 A CN 108228827A CN 201810002118 A CN201810002118 A CN 201810002118A CN 108228827 A CN108228827 A CN 108228827A
- Authority
- CN
- China
- Prior art keywords
- cluster
- temp
- wavelet transformation
- method based
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/14—Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
- G06F17/148—Wavelet transforms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Algebra (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于小波变换的负荷聚类和模式识别方法,包括获取n维的日负荷曲线;降低日负荷曲线的维度,生成逼近信号XaL和细节信号XaH;分别对标准化处理后的逼近信号X′aL和细节信号XaH进行聚类,获得簇A和簇D;将簇A和簇D聚合,获得最终的簇C,其聚类中心就是负荷模式中心Ccenter。本发明采用小波变换来减少维数,提高了曲线聚类的有效性,与其他现有的算法相比,聚类的效果要优于其他几种算法。
Description
技术领域
本发明涉及一种基于小波变换的负荷聚类和模式识别方法,属于需求响应中负荷聚类和负荷模式识别领域。
背景技术
智能电网是电力能源管理领域的一个现代化应用系统。它利用自动控制和现代通信技术,提高能源消耗的效率、可靠性和安全性。随着智能电网的发展,海量数据资源日益积累。原因之一就是数据记录频率的提高。智能电网中使用的智能电表可以定期记录用户的电力负荷数据,通常是1小时、30分钟、15分钟甚至1分钟。对于电力消费者来说,这些负荷数据有助于获得他们的消费行为模式,也被称为负荷模式。这种负荷模式可以用于消费者分类。近年来,需求响应得到了实质性的发展,电力供应商可以根据负荷模式和消费类别实现有效的能源控制、灵活的定价和需求管理。另一方面,电力终端消费者可以通过对电价波动的响应来了解他们的负荷模式,以减少他们的电费支出。然而,电力负荷数据一般都是高维。以15分钟的间隔为例。当一个智能电表记录每15分钟从0:00到23:45的一个用户的用电负荷数据,它每天就记录了96个值,根据这些值就可以画出一个日负荷曲线。在这种情况下,一年内的日负荷曲线包含365组96值曲线,曲线聚类时可能会将这些曲线分类到不同的集群中,提取负荷模式的困难。解决这一问题的传统方法通常是统计方法。例如,用日负荷值之和代替96个值,或者选择日负荷曲线上的代表时段,如峰值时间、波谷时间。虽然这些方法显著地减少了数据的数量,但它们也会导致信息丢失,导致负荷模式提取的准确性降低。
发明内容
为了解决上述技术问题,本发明提供了一种基于小波变换的负荷聚类和模式识别方法。
为了达到上述目的,本发明所采用的技术方案是:
一种基于小波变换的负荷聚类和模式识别方法,包括以下步骤,
获取n维的日负荷曲线;
降低日负荷曲线的维度,生成逼近信号XaL和细节信号XaH;
分别对标准化处理后的逼近信号X′aL和细节信号XaH进行聚类,获得簇A和簇D;
将簇A和簇D聚合,获得最终的簇C,其聚类中心就是负荷模式中心Ccenter。
采用多级一维离散沃尔什变换降低日负荷曲线的维度。
逼近信号XaL和细节信号XaH为,
XaL={x1,αL,x2,αL,…xn,αL}
XaH={x1,αH,x2,αH,…xn,αH}
其中,xi,aL=<ai1,ai2,…,ain'>,xi,aH=<di1,di2,…,din'>,1≤i≤n,1≤k≤n′,n′=n/2α,xi,aL、xi,aH分别为第i维α级逼近信号和细节信号,aik为第i维逼近信号的第k个元素,dik为第i维细节信号的第k个元素,α为级数,即α级一维离散沃尔什变换。
对逼近信号XaL进行z-score标准化处理,得到标准化处理后的逼近信号X′aL。
X′aL为,
X ′ aL={x'1,αL,x'2,αL,…x'n,αL}
其中,标准化处理后的第i维α级逼近信号x′ia,L=<a′i1,a′i2,…,a′in'>,μi为aik的平均值,σi为aik的标准差,1≤k≤n′。
分别对标准化处理后的逼近信号X′aL和细节信号XaH进行k-means聚类,获得簇A和簇D,k-means聚类的K值由Simplified Silhouette标准确定。
k-means聚类的K值由Simplified Silhouette标准确定的步骤为,
定义日负荷曲线为X={x1,x2,…xn},聚类结果为C={C1,C2,…CK},X的第i条曲线xi属于一个簇Cr,Cr∈C;
其中,是曲线xi根据Simplified Silhouette标准计算得到的数值,为xi到簇Cr的距离,为xi到其他簇之间的最近距离;
其中,μr为簇Cr的中心,μw为簇Cw的中心,Cw∈C,w≠r;
的平均值SSWC为,
SSWC越大,聚类效果越好,当SSWC最大时,对应的K值即为选定值。
簇A和簇D聚合的过程为,
定义簇A={A1,A2,…Ap},簇D={D1,D2,…Dq};
求两个簇的交集,
ADi′j′=Ai′∩Dj′
其中,1≤i′≤p,1≤j′≤q,Ai′是簇A第i′个元素,Dj′是簇D第j'个元素;
如果Ai′=Dj′,将ADi′j′定义为保留的ADi′j′,并加入Creserved,Creserved为所有保留的ADi′j′集合,l1为保留的ADi′j′数量;
如果Ai′≠Dj′且Ai′∩Dj′≠φ,将ADi′j′定义为暂时的ADi′j′,并加入Ctemp,Ctemp为所有暂时的ADi′j′集合,l2为暂时的ADi′j′数量;
如果l2>max{p,q}-l1,对所有包含在Ctemp的日负荷曲线运用k-means聚类,得到新的簇C′temp,这里k-means聚类的K值为max{p,q}-l2;
如果l2=max{p,q}-l1,则令Ctemp=C′temp;
取C′temp与Creserved的并集作为最终的聚类结果C,
C=Creserved∪C′temp={C1,C2,…,CK},
K=max{p,q},
Ccenter为C的聚类中心的集合,Ccenter={μ1,μ2,…,μK},
其中,μi″是Ci″的聚类中心,Ci″∈C,1≤i″≤K。
本发明所达到的有益效果:本发明采用小波变换来减少维数,提高了曲线聚类的有效性,与其他现有的算法相比,聚类的效果要优于其他几种算法。
附图说明
图1为本发明的流程图。
具体实施方式
下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
如图1所示,一种基于小波变换的负荷聚类和模式识别方法,包括以下步骤:
步骤1,获取n维的日负荷曲线。
步骤2,采用多级一维离散沃尔什变换降低日负荷曲线的维度,生成逼近信号XaL和细节信号XaH。
逼近信号XaL和细节信号XaH为:
XaL={x1,αL,x2,αL,…xn,αL}
XaH={x1,αH,x2,αH,…xn,αH}
其中,xi,aL=<ai1,ai2,…,ain'>,xi,aH=<di1,di2,…,din'>,1≤i≤n,1≤k≤n′,n′=n/2α,xi,aL、xi,aH分别为第i维α级逼近信号和细节信号,aik为第i维逼近信号的第k个元素,dik为第i维细节信号的第k个元素,α为级数,即α级一维离散沃尔什变换。
步骤3,对逼近信号XaL进行z-score标准化处理,得到标准化处理后的逼近信号X′aL。
X′aL={x'1,αL,x'2,αL,…x'n,αL}
其中,标准化处理后的第i维α级逼近信号x′ia,L=<a′i1,a′i2,…,a′in'>,μi为aik的平均值,σi为aik的标准差,1≤k≤n′。
步骤4,分别对标准化处理后的逼近信号X′aL和细节信号XaH进行k-means聚类,获得簇A和簇D。
k-means聚类的K值由Simplified Silhouette标准(SimplifiedSilhouetteWidth Criterion)确定,具体过程为:
定义日负荷曲线为X={x1,x2,…xn},聚类结果为C={C1,C2,…CK},X的第i条曲线xi属于一个簇Cr,Cr∈C;
其中,是曲线xi根据Simplified Silhouette标准计算得到的数值,为xi到簇Cr的距离,为xi到其他簇之间的最近距离;
其中,μr为簇Cr的中心,μw为簇Cw的中心,Cw∈C,w≠r;
的平均值SSWC为,
SSWC越大,聚类效果越好,当SSWC最大时,对应的K值即为选定值。
步骤5,将簇A和簇D聚合,获得最终的簇C,其聚类中心就是负荷模式中心Ccenter。
簇A和簇D聚合的过程为:
1)定义簇A={A1,A2,…Ap},簇D={D1,D2,…Dq};
2)求两个簇的交集,
ADi′j′=Ai′∩Dj′
其中,1≤i′≤p,1≤j′≤q,Ai′是簇A第i′个元素,Dj′是簇D第j'个元素;
3)如果Ai′=Dj′,将ADi′j′定义为保留的ADi′j′,并加入Creserved,Creserved为所有保留的ADi′j′集合,l1为保留的ADi′j′数量;
4)如果Ai′≠Dj′且Ai′∩Dj′≠φ,将ADi′j′定义为暂时的ADi′j′,并加入Ctemp,Ctemp为所有暂时的ADi′j′集合,l2为暂时的ADi′j′数量;
5)如果l2>max{p,q}-l1,对所有包含在Ctemp的日负荷曲线运用k-means聚类,得到新的簇C′temp,这里k-means聚类的K值为max{p,q}-l2;
6)如果l2=max{p,q}-l1,则令Ctemp=C′temp;
7)取C′temp与Creserved的并集作为最终的聚类结果C,
C=Creserved∪C′temp={C1,C2,…,CK},
K=max{p,q},
Ccenter为C的聚类中心的集合,Ccenter={μ1,μ2,…,μK},
其中,μi″是Ci″的聚类中心,Ci″∈C,1≤i″≤K。
如表1所示,为上述方法与现有的几个方法的比较。其中,FCCWT是本文提出方法,Original_N基于Z值标准化的但是对原有的日负荷曲线不降维的聚类方法,cA_N和cD们是分别基于Z值标准化后的逼近信号和细节信号进行聚类,逼近信号和细节信号与FCCWT采用一维离散小波变换后具有相同的规模。
常见的聚类有效性指标:Davies-Bouldin Index(DB)、Dunn Validity Index(DVI)和Silhouette Width Criterion(SWC)和Simplified Silhouette Width Criterion(SSWC)。
表1负荷聚类方法的性能比较
DB越小越好,DVI、SWC、SSWC则是越大越好,可以看出FCCWT的算法性能最好。
上述方法采用小波变换来减少维数,提高了曲线聚类的有效性,与其他现有的算法相比,聚类的效果要优于其他几种算法。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。
Claims (8)
1.一种基于小波变换的负荷聚类和模式识别方法,其特征在于:包括以下步骤,
获取n维的日负荷曲线;
降低日负荷曲线的维度,生成逼近信号XaL和细节信号XaH;
分别对标准化处理后的逼近信号X′aL和细节信号XaH进行聚类,获得簇A和簇D;
将簇A和簇D聚合,获得最终的簇C,其聚类中心就是负荷模式中心Ccenter。
2.根据权利要求1所述的一种基于小波变换的负荷聚类和模式识别方法,其特征在于:采用多级一维离散沃尔什变换降低日负荷曲线的维度。
3.根据权利要求2所述的一种基于小波变换的负荷聚类和模式识别方法,其特征在于:逼近信号XaL和细节信号XaH为,
XaL={x1,αL,x2,αL,…xn,αL}
XaH={x1,αH,x2,αH,…xn,αH}
其中,xi,aL=<ai1,ai2,…,ain'>,xi,aH=<di1,di2,…,din'>,1≤i≤n,1≤k≤n′,n′=n/2α,xi,aL、xi,aH分别为第i维α级逼近信号和细节信号,aik为第i维逼近信号的第k个元素,dik为第i维细节信号的第k个元素,α为级数,即α级一维离散沃尔什变换。
4.根据权利要求1所述的一种基于小波变换的负荷聚类和模式识别方法,其特征在于:对逼近信号XaL进行z-score标准化处理,得到标准化处理后的逼近信号X′aL。
5.根据权利要求4所述的一种基于小波变换的负荷聚类和模式识别方法,其特征在于:X′aL为,
X′aL={x'1,αL,x'2,αL,…x'n,αL}
其中,标准化处理后的第i维α级逼近信号x'i,αL=<a′i1,a′i2,…,a′in'>,μi为aik的平均值,σi为aik的标准差,1≤k≤n′。
6.根据权利要求1所述的一种基于小波变换的负荷聚类和模式识别方法,其特征在于:分别对标准化处理后的逼近信号X′aL和细节信号XaH进行k-means聚类,获得簇A和簇D,k-means聚类的K值由Simplified Silhouette标准确定。
7.根据权利要求6所述的一种基于小波变换的负荷聚类和模式识别方法,其特征在于:k-means聚类的K值由Simplified Silhouette标准确定的步骤为,
定义日负荷曲线为X={x1,x2,…xn},聚类结果为C={C1,C2,…CK},X的第i条曲线xi属于一个簇Cr,Cr∈C;
其中,是曲线xi根据Simplified Silhouette标准计算得到的数值,为xi到簇Cr的距离,为xi到其他簇之间的最近距离;
其中,μr为簇Cr的中心,μw为簇Cw的中心,Cw∈C,w≠r;
的平均值SSWC为,
SSWC越大,聚类效果越好,当SSWC最大时,对应的K值即为选定值。
8.根据权利要求1所述的一种基于小波变换的负荷聚类和模式识别方法,其特征在于:簇A和簇D聚合的过程为,
定义簇A={A1,A2,…Ap},簇D={D1,D2,…Dq};
求两个簇的交集,
ADi′j′=Ai′∩Dj′
其中,1≤i′≤p,1≤j′≤q,Ai′是簇A第i′个元素,Dj′是簇D第j'个元素;
如果Ai′=Dj′,将ADi′j′定义为保留的ADi′j′,并加入Creserved,Creserved为所有保留的ADi′j′集合,l1为保留的ADi′j′数量;
如果Ai′≠Dj′且Ai′∩Dj′≠φ,将ADi′j′定义为暂时的ADi′j′,并加入Ctemp,Ctemp为所有暂时的ADi′j′集合,l2为暂时的ADi′j′数量;
如果l2>max{p,q}-l1,对所有包含在Ctemp的日负荷曲线运用k-means聚类,得到新的簇C′temp,这里k-means聚类的K值为max{p,q}-l2;
如果l2=max{p,q}-l1,则令Ctemp=C′temp;
取C′temp与Creserved的并集作为最终的聚类结果C,
C=Creserved∪C′temp={C1,C2,…,CK},
K=max{p,q},
Ccenter为C的聚类中心的集合,Ccenter={μ1,μ2,…,μK},
其中,μi″是Ci″的聚类中心,Ci″∈C,1≤i″≤K。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810002118.6A CN108228827A (zh) | 2018-01-02 | 2018-01-02 | 一种基于小波变换的负荷聚类和模式识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810002118.6A CN108228827A (zh) | 2018-01-02 | 2018-01-02 | 一种基于小波变换的负荷聚类和模式识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108228827A true CN108228827A (zh) | 2018-06-29 |
Family
ID=62644840
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810002118.6A Pending CN108228827A (zh) | 2018-01-02 | 2018-01-02 | 一种基于小波变换的负荷聚类和模式识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108228827A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112215490A (zh) * | 2020-10-12 | 2021-01-12 | 国网重庆市电力公司电力科学研究院 | 一种基于相关性系数改进K-means的电力负荷聚类分析方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102156814A (zh) * | 2011-04-06 | 2011-08-17 | 广东省电力设计研究院 | 基于聚类的典型日负荷曲线选取方法及装置 |
CN107423769A (zh) * | 2017-08-03 | 2017-12-01 | 四川大学 | 基于形态特征的电力负荷曲线自适应聚类方法 |
-
2018
- 2018-01-02 CN CN201810002118.6A patent/CN108228827A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102156814A (zh) * | 2011-04-06 | 2011-08-17 | 广东省电力设计研究院 | 基于聚类的典型日负荷曲线选取方法及装置 |
CN107423769A (zh) * | 2017-08-03 | 2017-12-01 | 四川大学 | 基于形态特征的电力负荷曲线自适应聚类方法 |
Non-Patent Citations (1)
Title |
---|
ZIGUI JIANG等: "A Fused Load Curve Clustering Algorithm Based on Wavelet Transform", 《IEEE》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112215490A (zh) * | 2020-10-12 | 2021-01-12 | 国网重庆市电力公司电力科学研究院 | 一种基于相关性系数改进K-means的电力负荷聚类分析方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Räsänen et al. | Feature-based clustering for electricity use time series data | |
Jiang et al. | A fused load curve clustering algorithm based on wavelet transform | |
US20210056647A1 (en) | Method for multi-dimensional identification of flexible load demand response effect | |
CN110781332A (zh) | 基于复合聚类算法的电力居民用户日负荷曲线聚类方法 | |
Rajabi et al. | A review on clustering of residential electricity customers and its applications | |
CN107133652A (zh) | 基于K‑means聚类算法的用电客户价值评估方法及系统 | |
CN109146252A (zh) | 基于调节潜力指标的用户用电行为聚类分析方法和系统 | |
CN106203478A (zh) | 一种用于智能电表大数据的负荷曲线聚类方法 | |
CN110381126A (zh) | 基于边缘计算的用电设备识别方法、系统、设备及介质 | |
CN111724278A (zh) | 一种面向电力多元负荷用户的精细分类方法及系统 | |
CN107248031B (zh) | 一种针对负荷曲线峰谷差的快速电力用户分类方法 | |
CN112819299A (zh) | 一种基于中心优化的差分K-means负荷聚类方法 | |
CN106096805A (zh) | 一种基于熵权法特征选择的居民用电负荷分类方法 | |
CN110874381B (zh) | 一种基于空间密度聚类的用户侧负荷数据异常值识别方法 | |
CN111177216B (zh) | 综合能源消费者行为特征的关联规则生成方法及装置 | |
Shamim et al. | Multi-domain feature extraction for improved clustering of smart meter data | |
CN108428055A (zh) | 一种考虑负荷纵向特性的负荷聚类方法 | |
CN110543889A (zh) | 电力负荷分层聚类方法、装置、计算机设备及存储介质 | |
CN112463849A (zh) | 进行台区户变关系识别的方法、计算机可读取的存储介质 | |
Wang et al. | Big data analytics for price forecasting in smart grids | |
Lu et al. | Adaptive weighted fuzzy clustering algorithm for load profiling of smart grid customers | |
CN108228827A (zh) | 一种基于小波变换的负荷聚类和模式识别方法 | |
CN110795610B (zh) | 一种基于聚类的电力负荷分析方法 | |
CN117236022A (zh) | 互感器剩余寿命预测模型训练方法、应用方法及电子设备 | |
CN106651630A (zh) | 关键用电行业识别方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180629 |
|
RJ01 | Rejection of invention patent application after publication |