CN108280479B - 一种基于负荷特性指标加权聚类算法的电网用户分类方法 - Google Patents

一种基于负荷特性指标加权聚类算法的电网用户分类方法 Download PDF

Info

Publication number
CN108280479B
CN108280479B CN201810072661.3A CN201810072661A CN108280479B CN 108280479 B CN108280479 B CN 108280479B CN 201810072661 A CN201810072661 A CN 201810072661A CN 108280479 B CN108280479 B CN 108280479B
Authority
CN
China
Prior art keywords
load
index
load characteristic
characteristic index
load curve
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201810072661.3A
Other languages
English (en)
Other versions
CN108280479A (zh
Inventor
李春燕
蔡文悦
陈骁
余长青
赵溶生
张谦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University
Original Assignee
Chongqing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University filed Critical Chongqing University
Priority to CN201810072661.3A priority Critical patent/CN108280479B/zh
Publication of CN108280479A publication Critical patent/CN108280479A/zh
Application granted granted Critical
Publication of CN108280479B publication Critical patent/CN108280479B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种基于负荷特性指标加权聚类算法的电网用户分类方法,引入负荷曲线聚类,针对现有算法复杂度较高的问题,构建负荷特性指标并对传统AP算法进行降维,以提高算法效率;利用权重改进相似度计算,并以DB指标进行收敛判断。面对主观赋权的不足,设计特性指标贡献度的评价规则,采用熵权法客观自适应地确定负荷特性指标的权重,以衡量各特性指标对聚类结果的区分度大小,提升了权重赋值的合理性,最终提高了用户分类结果的精准度。

Description

一种基于负荷特性指标加权聚类算法的电网用户分类方法
技术领域
本申请涉及用电数据分析技术领域,尤其涉及一种基于负荷特性指标加权聚类算法的电网用户分类方法。
背景技术
根据用户的用电情况对用户进行分类,对电力公司具有重大的意义,电力公司可以根据用户的类型对不同类型的用户的用电情况进行具体分析,并为用户提供更优质的服务,现有技术中,常使用聚类算法对用户进行分类。许多学者对不同聚类算法展开研究,探讨对负荷曲线的聚类效果,不同算法根据其处理目标、数据类型的不同而有所区别,通常分为直接聚类和间接聚类两种。直接聚类是对负荷数据直接进行处理的一种技术,包括Kmeans、FCM、DBSCAN、CFSFDP等,以及针对这些聚类算法的改进。直接聚类的优势是简单快捷,能够充分利用数据自身的特征,但是当面对大量高维数据时在运行效率上不占优势。间接聚类则是先将负荷原始数据进行降维或者特征提取,再对数据进行处理的一种技术。常用方法是利用降维算法进行数据变换,产生或提取数据特征,如SVD、PCA、SOM等。采用该类方法能够对数据进行非线性降维,但提取的特征物理意义不明显,不能为聚类结果提供进一步服务。
AP聚类算法(Affinity propagation Clustering Algorithm,吸引子传播算法)于2007年在Science上发表,该算法具有不需要指定聚类数目和选取初值、聚类结果误差平方和小等优势,在图像、文本及信号处理等领域应用广泛。但算法本身复杂度较高,当处理多维大量数据时,AP聚类算法往往需要长时间计算。并且,常将用户的用电数据加权后再进行聚类,但现有技术中的权重赋值方法是专家评判法,具有主观性且效率较低。
因此如何降低采用聚类算法对用户进行分类时的运算时间,提升权重赋值的合理性,进而提升用户分类结果的精准度成为了本领域技术人员急需解决的问题。
发明内容
针对现有技术存在的上述不足,本申请要解决的技术问题是:如何降低采用聚类算法对用户进行分类时的运算时间,提升权重赋值的合理性,进而提升用户分类结果的精准度。
为解决上述技术问题,本申请采用了如下的技术方案:
一种基于负荷特性指标加权聚类算法的电网用户分类方法,包括:
步骤A:获取待分类用户的负荷曲线dl,l表示不同的待分类用户,l为正整数,执行步骤B;
步骤B:基于所述负荷曲线dl计算负荷特性指标集合Dl=[Vl1,Vl2,...,Vln],Vl1至Vln表示不同的负荷特性指标,n表示所述负荷特性指标集合内负荷特性指标种类的个数,n为正整数,执行步骤C;
步骤C:基于所述负荷特性指标集合Dl=[Vl1,Vl2,...,Vln]设置初始权重集合λ=[λ12,...,λn],并以所述初始权重集合为负荷特性指标权重集合,所述负荷特性指标权重集合中的每个权重即为所述负荷特性指标集合中每种负荷特性指标的权重,设第一迭代次数i为1,设第二迭代次数j为1,设置吸引信息矩阵R和归属信息矩阵A为零,设置DB指标,执行步骤D;
步骤D:基于所述负荷特性指标集合及所述负荷特性指标权重集合生成待分类用户的相似度矩阵
Figure BDA0001558577070000021
其中,median(S)为矩阵S非对角线所有元素的中位数,Vla和Vlb表示任意两种不同的负荷特性指标,λla为Vla的权重,λlb为Vlb的权重,Vla∈Dl,Vlb∈Dl,执行步骤E;
步骤E:基于所述相似度矩阵s(a,b)更新所述吸引信息矩阵R和归属信息矩阵A,执行步骤F;
步骤F:基于所述吸引信息矩阵R及所述归属信息矩阵A利用AP聚类算法对所述待分类用户进行分类;当聚类中心稳定和或第一迭代次数i大于第一预设迭代次数imax时,执行步骤G;否则,将第一迭代次数i加1并执行步骤E;
步骤G:基于熵权法更新所述负荷特性指标权重集合,执行步骤H;
步骤H:基于用户分类的结果计算新的DB指标,当所述新的DB指标满足预设DB阈值时,结束,否则,执行步骤I;
步骤I:当DB<DBnew或第二迭代次数j大于第二预设迭代次数jmax时,执行步骤J;否则,将第二迭代次数j加1并执行步骤D,其中,DBnew为步骤H中计算出的新的DB指标,DB为DBnew之前一次得到的DB指标;
步骤J:更新相似度矩阵
Figure BDA0001558577070000022
DBmin为得到的所有DB指标中最小的DB指标值,δ为搜索阈值,记录最小的DB指标值DBmin所对应的聚类中心,结束。
优选地,所述步骤E中基于所述相似度矩阵s(a,b)更新所述吸引信息矩阵R和归属信息矩阵A的方式包括:
基于公式
Figure BDA0001558577070000031
更新所述吸引信息矩阵R和所述归属信息矩阵A,其中,s(a,b)是负荷曲线a与负荷曲线b之间的相似度,其值表明了b作为a的聚类中心的合适程度,r(a,b)是吸引信息矩阵R中的元素,表示负荷曲线a与负荷曲线b之间的吸引信息,描述负荷曲线a与负荷曲线b的认可程度,a(a,b)是归属信息矩阵A中的元素,表示负荷曲线a与负荷曲线b之间的归属信息,描述负荷曲线a与负荷曲线b作为其聚类中心的适合程度,下标t表示第t次更新,下标t+1表示第t+1次更新,b’是除去b所在列的所有元素值,at(a,b′)是归属信息矩阵A中对应负荷曲线a的除去b列后剩余的归属信息元素值,即除b外其他负荷曲线对负荷曲线a的归属度值,a’是除去a所在行的所有元素值,rt(a′,b)是吸引信息矩阵R中对应负荷曲线b的除去a行后剩余的吸引信息元素值,即负荷曲线b作为除a外其他负荷曲线的聚类中心的相似度值。
优选地,rt+1(a,b)=ω·rt(a,b)+(1-ω)·rt+1(a,b)且at+1(a,b)=ω·at(a,b)+(1-ω)·at+1(a,b),其中,ω为阻尼系数,0<ω<1,r(a,b)是吸引信息矩阵R中的元素,表示负荷曲线a与负荷曲线b之间的吸引信息,描述负荷曲线a与负荷曲线b的认可程度,a(a,b)是归属信息矩阵A中的元素,表示负荷曲线a与负荷曲线b之间的归属信息,描述负荷曲线a与负荷曲线b作为其聚类中心的适合程度,下标t表示第t次更新,下标t+1表示第t+1次更新。
优选地,所述步骤G中基于熵权法更新所述负荷特性指标权重集合的方法包括:
基于公式
Figure BDA0001558577070000032
w=1,2,...,m计算每个负荷特征指标对聚类中心的贡献度Eval,其中,m为聚类中心数,Cw是第w个聚类中心的负荷特性指标值,Xrand代表在第w类中随机选择的负荷特性指标,λi表示与Xrand对应的权重;
基于贡献度Eval形成贡献度矩阵,即为针对m个聚类中心的n个负荷特性指标值的指标矩阵X=(xpq)m×n
基于公式
Figure BDA0001558577070000033
计算第p个聚类中心的第q个负荷特性指标的熵值eq,其中指标占比
Figure BDA0001558577070000034
基于公式
Figure BDA0001558577070000041
q=1,2,...,n计算第q个负荷特性指标的客观权重λi’,其中,λi'∈[0,1],且
Figure BDA0001558577070000042
以计算出的客观权重λi’更新所述负荷特性指标权重集合。
优选地,所述步骤H中基于用户分类的结果计算新的DB指标的方式包括:
基于公式
Figure BDA0001558577070000043
计算所述DB指标,其中,Wα表示α类内数据点到聚类中心Cw的平均距离,Wβ表示β类内数据点到聚类中心Cw的平均距离,Cαβ表示聚类中心α与β之间的距离。
优选地,所述负荷特性指标包括峰时耗电率、谷电系数、平段用电百分比、日负荷率、日平均负荷、日峰谷差率及日最大负荷中的任意一项或多项。
综上所述,本申请公开了一种基于负荷特性指标加权聚类算法的电网用户分类方法,引入负荷曲线聚类,针对现有算法复杂度较高的问题,构建负荷特性指标并对传统AP算法进行降维,以提高算法效率;利用权重改进相似度计算,并以DB指标进行收敛判断。面对主观赋权的不足,设计特性指标贡献度的评价规则,采用熵权法客观自适应地确定负荷特性指标的权重,以衡量各特性指标对聚类结果的区分度大小,提升了权重赋值的合理性,最终提高了用户分类结果的精准度。
附图说明
为了使发明的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步的详细描述,其中:
图1为本申请公开的一种基于负荷特性指标加权聚类算法的电网用户分类方法的流程图;
图2为采用本申请公开的基于负荷特性指标加权聚类算法的电网用户分类方法进行分类的分类1的聚类结果示意图;
图3为采用本申请公开的基于负荷特性指标加权聚类算法的电网用户分类方法进行分类的分类2的聚类结果示意图;
图4为采用本申请公开的基于负荷特性指标加权聚类算法的电网用户分类方法进行分类的分类3的聚类结果示意图;
图5为采用本申请公开的基于负荷特性指标加权聚类算法的电网用户分类方法进行分类的分类4的聚类结果示意图;
图6为采用本申请公开的基于负荷特性指标加权聚类算法的电网用户分类方法进行分类的分类5的聚类结果示意图;
图7为采用本申请公开的基于负荷特性指标加权聚类算法的电网用户分类方法进行分类的分类6的聚类结果示意图;
图8为采用本申请公开的基于负荷特性指标加权聚类算法的电网用户分类方法进行分类的分类7的聚类结果示意图;
图9为采用本申请公开的基于负荷特性指标加权聚类算法的电网用户分类方法进行分类的分类1的聚类中心指标值示意图;
图10为采用本申请公开的基于负荷特性指标加权聚类算法的电网用户分类方法进行分类的分类2的聚类中心指标值示意图;
图11为采用本申请公开的基于负荷特性指标加权聚类算法的电网用户分类方法进行分类的分类3的聚类中心指标值示意图;
图12为采用本申请公开的基于负荷特性指标加权聚类算法的电网用户分类方法进行分类的分类4的聚类中心指标值示意图;
图13为采用本申请公开的基于负荷特性指标加权聚类算法的电网用户分类方法进行分类的分类5的聚类中心指标值示意图;
图14为采用本申请公开的基于负荷特性指标加权聚类算法的电网用户分类方法进行分类的分类6的聚类中心指标值示意图;
图15为采用本申请公开的基于负荷特性指标加权聚类算法的电网用户分类方法进行分类的分类7的聚类中心指标值示意图;
图16为最终权重排列前三的各聚类中心指标值的示意图。
图2至图8中,横坐标为时间,纵坐标表示归一化之后的用电量;图9至图15中,横坐标为时间,纵坐标表示归一化之后的聚类中心指标值;图16中,横坐标为聚类中心,纵坐标为归一化后的负荷特性指标值,曲线A为日平均负荷,曲线B为谷电系数,曲线C为峰时耗电率。
具体实施方式
下面结合附图对本申请作进一步的详细说明。
如图1所示,本发明公开了一种基于负荷特性指标加权聚类算法的电网用户分类方法的流程图,包括:
S101:获取待分类用户的负荷曲线dl,l表示不同的待分类用户,l为正整数,执行S102;
S102:基于负荷曲线dl计算负荷特性指标集合Dl=[Vl1,Vl2,...,Vln],Vl1至Vln表示不同的负荷特性指标,n表示负荷特性指标集合内负荷特性指标种类的个数,n为正整数,执行S103;
智能电网采集的负荷数据是多维的,若将每一个维度视为一个特征,其中存在大量冗余特征,如果对所有特征都进行分析,将使模型变得更加复杂,同时增加运算时间。因此需要选择典型的负荷特性指标,合理降低数据维度,以提高聚类的精准性和算法运行效率。对于负荷特性指标的选取,一般是根据专家经验进行选取。
此外,对于采集的负荷数据,常出现由于信号干扰、通讯设备故障等问题导致数据采集错误或未采集,为保证聚类结果的正确性,需对不良数据进行处理,例如对数据中的缺失值,通过计算近邻数据的平均值进行补充。同时,为消除数据间量级差异的影响,进行离差标准化,把数据映射到[0,1]区间。
S103:基于负荷特性指标集合Dl=[Vl1,Vl2,...,Vln]设置初始权重集合λ=[λ12,...,λn],并以初始权重集合为负荷特性指标权重集合,负荷特性指标权重集合中的每个权重即为负荷特性指标集合中每种负荷特性指标的权重,设第一迭代次数i为1,设第二迭代次数j为1,设置吸引信息矩阵R和归属信息矩阵A为零,设置DB指标,执行S104;
S104:基于负荷特性指标集合及负荷特性指标权重集合生成待分类用户的相似度矩阵
Figure BDA0001558577070000061
其中,median(S)为矩阵S非对角线所有元素的中位数,Vla和Vlb表示任意两种不同的负荷特性指标,λla为Vla的权重,λlb为Vlb的权重,Vla∈Dl,Vlb∈Dl,执行步骤S105;
AP聚类算法本质是基于划分的聚类算法,基于“物以类聚”思想,引入竞争概念进行迭代。算法输入矩阵为相似度矩阵S,它刻画了数据之间的相似度,通常被设定为两点欧氏距离平方的负数。由于本申请模型的输入为各负荷特性指标,并且,为评判每个特性指标对聚类的效果,对其赋予不同的权重,传统的相似度计算方法并不适用。因此,本申请通过计算和更新不同数据之间的负荷特性指标相似度进行聚类中心判断。
S105:基于相似度矩阵s(a,b)更新吸引信息矩阵R和归属信息矩阵A,执行S106;
S106:基于吸引信息矩阵R及归属信息矩阵A利用AP聚类算法对待分类用户进行分类;当聚类中心稳定和或第一迭代次数i大于第一预设迭代次数imax时,执行S107;否则,将第一迭代次数i加1并执行S105;
S107:基于熵权法更新负荷特性指标权重集合,执行S108;
S108:基于用户分类的结果计算新的DB指标,当新的DB指标满足预设DB阈值时,结束,否则,执行S109;
聚类评价指标分为两种:一种是外部标准,通过聚类结果和预期结果的一致性来判断聚类效果的优良;另一种是内部标准,基于数据点聚集中心点的紧密程度来评价聚类质量。由于用电负荷的随机性,无法对聚类结果做出预测,因而,本申请采用内部指标评定聚类效果。在面向降维的聚类算法中,DB指标的计算更为简单且变化范围小,便于应用,更适合作为电力负荷曲线聚类的有效性指标。
S109:当DB<DBnew或第二迭代次数j大于第二预设迭代次数jmax时,执行S110;否则,将第二迭代次数j加1并执行S104,其中,DBnew为S108中计算出的新的DB指标,DB为DBnew之前一次得到的DB指标;
将权重引入相似度计算,利用迭代后更新得到的权重修正各负荷特性指标,能更准确地反应各负荷曲线之间的相似程度。
S110:更新相似度矩阵
Figure BDA0001558577070000071
DBmin为得到的所有DB指标中最小的DB指标值,δ为搜索阈值,记录最小的DB指标值DBmin所对应的聚类中心,结束。
相似度矩阵主对角线上的元素值S(k,k)为偏向参数,其值越大,聚类数目越多。AP聚类算法的稳定性较好,对于多次迭代DB指标范围变动较小。因此,利用DB指标作为AP聚类算法的偏向参数选取和收敛判据,如下式所示。
S(k,k)=median(S)+δ×DBmin
其中,pm为非主对角线(是相似度矩阵S中主对角线元素值,也称为偏向参数)上的所有数的中位数,为初始值;DBmin为当前算法进程计算下的DB最小值;δ为搜索阈值,若要向前搜索,即增大偏向参数值使分类结果数目增加,取δ>0,反之,取δ<0。当负荷曲线数量多,为了方便分析,往往不希望聚类中心数太多,故本申请选择向后搜索,即减小偏向参数值使分类结果数目减少,取δ=-0.1。在算法得到稳定解后,通过对偏向参数的前后调整,寻找在该范围内是否存在更小的DB值,从而得到更好的聚类结果。
具体实施时,S105中基于相似度矩阵s(a,b)更新吸引信息矩阵R和归属信息矩阵A的方式包括基于公式
Figure BDA0001558577070000081
Figure BDA0001558577070000082
更新吸引信息矩阵R和归属信息矩阵A,其中,s(a,b)是负荷曲线a与负荷曲线b之间的相似度,其值表明了b作为a的聚类中心的合适程度,r(a,b)是吸引信息矩阵R中的元素,表示负荷曲线a与负荷曲线b之间的吸引信息,描述负荷曲线a与负荷曲线b的认可程度,a(a,b)是归属信息矩阵A中的元素,表示负荷曲线a与负荷曲线b之间的归属信息,描述负荷曲线a与负荷曲线b作为其聚类中心的适合程度,下标t表示第t次更新,下标t+1表示第t+1次更新,b’是除去b所在列的所有元素值,at(a,b′)是归属信息矩阵A中对应负荷曲线a的除去b列后剩余的归属信息元素值,即除b外其他负荷曲线对负荷曲线a的归属度值,a’是除去a所在行的所有元素值,rt(a′,b)是吸引信息矩阵R中对应负荷曲线b的除去a行后剩余的吸引信息元素值,即负荷曲线b作为除a外其他负荷曲线的聚类中心的相似度值。
具体实施时,rt+1(a,b)=ω·rt(a,b)+(1-ω)·rt+1(a,b)且at+1(a,b)=ω·at(a,b)+(1-ω)·at+1(a,b),其中,ω为阻尼系数,0<ω<1,r(a,b)是吸引信息矩阵R中的元素,表示负荷曲线a与负荷曲线b之间的吸引信息,描述负荷曲线a与负荷曲线b的认可程度,a(a,b)是归属信息矩阵A中的元素,表示负荷曲线a与负荷曲线b之间的归属信息,描述负荷曲线a与负荷曲线b作为其聚类中心的适合程度,下标t表示第t次更新,下标t+1表示第t+1次更新。
在迭代过程较易产生振荡,在每次迭代前都会加上阻尼系数ω,从而消除振荡对分类结果的影响。
具体实施时,S107中基于熵权法更新负荷特性指标权重集合的方法包括:
基于公式
Figure BDA0001558577070000083
w=1,2,...,m计算每个负荷特征指标对聚类中心的贡献度Eval,其中,m为聚类中心数,Cw是第w个聚类中心的负荷特性指标值,Xrand代表在第w类中随机选择的负荷特性指标,λi表示与Xrand对应的权重;
基于贡献度Eval形成贡献度矩阵,即为针对m个聚类中心的n个负荷特性指标值的指标矩阵X=(xpq)m×n
基于公式
Figure BDA0001558577070000084
计算第p个聚类中心的第q个负荷特性指标的熵值eq,其中指标占比
Figure BDA0001558577070000091
基于公式
Figure BDA0001558577070000092
q=1,2,...,n计算第q个负荷特性指标的客观权重λi’,其中,λ'i∈[0,1],且
Figure BDA0001558577070000093
以计算出的客观权重λi’更新负荷特性指标权重集合。
电力系统各类负荷特性指标是用电负荷特点和性质的体现,但不同指标对负荷曲线特性的描述不同,对数据区分度的影响程度也不同,因此需对负荷特性指标进行合理赋权。可运用专家意见对负荷特性指标进行主观赋权确定各指标的权重,其反映了决策人的意向,但决策结果往往具有主观随意性,指标确定的过程也较为繁琐。针对此问题,本申请提出利用熵权法评价各特性指标对聚类结果的贡献,客观确定负荷特性的指标权重。
熵权法的基本思路是根据指标变异性的大小来确定客观权重。通常若某个指标的信息熵越小,表明指标值的变异程度越大,提供的信息量越多,在综合评价中所能起到的作用也越大,其权重也就越大。通过熵权法计算各特性指标的贡献值,具有较强的理论依据,并且计算所得权重能够实现特征选择,即权重越大的指标,在聚类中越重要,越能反应该类负荷曲线的特性。
通过评价每个指标对目标的贡献大小,即各负荷特性指标对聚类的区分度大小,从而确定各指标的权重。可计算属于该类的负荷曲线的负荷特性指标与聚类中心负荷特性指标的差值,来判断该指标在聚类中的贡献大小。如果差值很大,说明聚类中心值与该指标值差异较大,在聚类中的贡献较小。通过熵权法实现客观赋权,能够帮助聚类算法选择更准确的聚类中心,体现各负荷特性指标对聚类中心选择的区分度大小。同时,在对聚类结果进行评估时,也可根据各指标的权重不同进行分析。
具体实施时,S108中基于用户分类的结果计算新的DB指标的方式包括基于公式
Figure BDA0001558577070000094
计算DB指标,其中,Wα表示α类内数据点到聚类中心Cw的平均距离,Wβ表示β类内数据点到聚类中心Cw的平均距离,Cαβ表示聚类中心α与β之间的距离。
具体实施时,负荷特性指标包括峰时耗电率、谷电系数、平段用电百分比、日负荷率、日平均负荷、日峰谷差率及日最大负荷中的任意一项或多项。
负荷特性指标是负荷曲线内部规律的反映,能够快速高效提取高维负荷曲线中的有用信息。各国的负荷特性指标不尽相同,根据我国实际情况,本申请引入7个典型常用负荷特性指标,即峰时耗电率、谷电系数、平段用电百分比、日负荷率、日平均负荷、日峰谷差率、日最大负荷作为特征向量,对负荷曲线进行聚类。各负荷特性指标含义如表1所示。
Figure BDA0001558577070000101
表1
下面为采用本方法对用户进行分类的具体算例:
数据来自爱尔兰电力和天然气行业监管机构于2007年启动的智能计量项目。从中选取了3000条负荷曲线,并对有效负荷曲线进行了归一化处理,执行本申请公开的基于负荷特性指标加权聚类算法的电网用户分类方法,得到7类负荷曲线,结果如图2-8所示。对每类负荷曲线取均值,得到各聚类中心如图9-15所示。
由图2-8可以看出,负荷曲线之间差异较大,可以判断出以负荷特性指标区分的典型用户,其高峰、平段、低谷区间的用电情况变化较明显。如(1)类用户和(3)类用户在0-7时和18-23时用电量水平较高,其白天用电行为频繁,总体负荷较大,属于高负荷率型用户,其家中人口数量较多;(2)类用户早晚用电量较大,在午间用电有明显的回落,属于午间不回家的上班族;(4)类用户从8-22点用电量一直处于较高水平,属于商业用户;(5)类、(6)类和(7)类用户可以看到日负荷曲线有两个峰值,但峰值出现的时间有所不同,峰谷差也有一定差异,其用电特点有所区别。
其中,各特性指标初始权重设置及变化结果如表2所示。根据最终聚类结果权重可以看出,平段用电百分比和日峰谷差率对应的权重变小了,这是因为负荷曲线在进行了归一化之后,这两个特性指标在不同负荷曲线之间的差异不大,在确定聚类中心的时候做出的贡献较少;同时,日平均负荷对应的权重有所上升,这说明日平均负荷特性指标对于数据集的区分度较好。
Figure BDA0001558577070000111
表2
更改初始权重,对数据再次进行聚类计算,所得聚类结果仍为7类,权重变化如表3所示。通过结果可以看出,初始权重的改变对最终熵权法确定的客观权重影响较小,对于该数据集来说,日平均负荷仍为区分度最好的负荷特性指标,说明熵权法能够减轻主观赋权所带来的影响偏差。
Figure BDA0001558577070000121
表3
图16所示为最终权重排列前三的各聚类中心指标值,根据日平均负荷、谷电系数、峰时耗电率进行客户用电行为区分。可以看出,(2)类用户谷电系数高,倾向于在低谷时段用电,是进行需求响应的潜在群体;(4)类用户在低谷时段用电量较大,峰时耗电率较低,可与(2)类用户配合进行调度安排,填补负荷低谷;(5)、(6)类用户虽然具有较高的峰时耗电率,但其日平均负荷较小,并且在一定程度上倾向于非高峰期用电,在制定电价政策时可不作为主要群体考虑;(1)、(3)、(7)类用户日平均负荷和峰时耗电率指标值较高,可针对该类用户制定较高的峰时电价,引导其执行削峰填谷,促进电力资源的优化配置。
因此,采用合理的负荷特性指标对负荷曲线进行降维,既能保留AP聚类算法的优势,又能得到针对数据集的指标权重,为用户用电分析提供服务。
本申请将AP聚类引入负荷曲线聚类,针对负荷曲线的高维度问题,利用负荷特性指标进行降维,并对相似度计算进行改进,加快AP聚类的运行速度,同时采用熵权法思想,对负荷特性指标进行客观赋权,实现负荷特性指标的自适应权重计算,该权重表征各负荷特性指标对聚类结果区分度的大小,既能在聚类迭代过程中指导聚类中心进行收敛,又能对聚类结果进行评价,为进一步用户用电行为分析提供参考。
本申请将负荷特性指标加权的AP聚类算法应用于负荷曲线聚类,在保证算法聚类效果的同时,降低了算法相似度计算的运行时间;
利用熵权法对聚类过程中的负荷特性指标进行客观赋权,将不同负荷特性指标对聚类效果的区分度加以评价。所得权重值既能增加聚类结果的准确度,又能为用户用电行为分析所服务。
最后说明的是,以上实施例仅用以说明本申请的技术方案而非限制,尽管通过参照本申请的优选实施例已经对本申请进行了描述,但本领域的普通技术人员应当理解,可以在形式上和细节上对其作出各种各样的改变,而不偏离所附权利要求书所限定的本申请的精神和范围。

Claims (6)

1.一种基于负荷特性指标加权聚类算法的电网用户分类方法,其特征在于,包括:
步骤A:获取待分类用户的负荷曲线dl,l表示不同的待分类用户,l为正整数,执行步骤B;
步骤B:基于所述负荷曲线dl计算负荷特性指标集合Dl=[Vl1,Vl2,...,Vln],Vl1至Vln表示不同的负荷特性指标,n表示所述负荷特性指标集合内负荷特性指标种类的个数,n为正整数,执行步骤C;
步骤C:基于所述负荷特性指标集合Dl=[Vl1,Vl2,...,Vln]设置初始权重集合λ=[λ12,...,λn],并以所述初始权重集合为负荷特性指标权重集合,所述负荷特性指标权重集合中的每个权重即为所述负荷特性指标集合中每种负荷特性指标的权重,设第一迭代次数i为1,设第二迭代次数j为1,设置吸引信息矩阵R和归属信息矩阵A为零,设置DB指标,执行步骤D;
步骤D:基于所述负荷特性指标集合及所述负荷特性指标权重集合生成待分类用户的相似度矩阵
Figure FDA0002339253710000011
其中,median(S)为矩阵S非对角线所有元素的中位数,Vla和Vlb表示任意两种不同的负荷特性指标,λa为Vla的权重,λb为Vlb的权重,Vla∈Dl,Vlb∈Dl,执行步骤E;
步骤E:基于所述相似度矩阵S(a,b)更新所述吸引信息矩阵R和归属信息矩阵A,执行步骤F;
步骤F:基于所述吸引信息矩阵R及所述归属信息矩阵A利用AP聚类算法对所述待分类用户进行分类;当聚类中心稳定和或第一迭代次数i大于第一预设迭代次数imax时,执行步骤G;否则,将第一迭代次数i加1并执行步骤E;
步骤G:基于熵权法更新所述负荷特性指标权重集合,执行步骤H;
步骤H:基于用户分类的结果计算新的DB指标,当所述新的DB指标满足预设DB阈值时,结束,否则,执行步骤I;
步骤I:当DB<DBnew或第二迭代次数j大于第二预设迭代次数jmax时,执行步骤J;否则,将第二迭代次数j加1并执行步骤D,其中,DBnew为步骤H中计算出的新的DB指标,DB为DBnew之前一次得到的DB指标;
步骤J:更新相似度矩阵
Figure FDA0002339253710000012
DBmin为得到的所有DB指标中最小的DB指标值,δ为搜索阈值,记录最小的DB指标值DBmin所对应的聚类中心,结束。
2.如权利要求1所述的基于负荷特性指标加权聚类算法的电网用户分类方法,其特征在于,所述步骤E中基于所述相似度矩阵S(a,b)更新所述吸引信息矩阵R和归属信息矩阵A的方式包括:
基于公式
Figure FDA0002339253710000021
Figure FDA0002339253710000022
更新所述吸引信息矩阵R和所述归属信息矩阵A,其中,S(a,b)是负荷曲线a与负荷曲线b之间的相似度,其值表明了b作为a的聚类中心的合适程度,rt+1(a,b)是第t+1次更新的吸引信息矩阵R中的元素,表示负荷曲线a与负荷曲线b之间的吸引信息,描述负荷曲线a与负荷曲线b的认可程度,at(a,b)是第t次更新的归属信息矩阵A中的元素,表示负荷曲线a与负荷曲线b之间的归属信息,描述负荷曲线a与负荷曲线b作为其聚类中心的适合程度,下标t表示第t次更新,下标t+1表示第t+1次更新,b’是除去b所在列的所有元素值,at(a,b′)是第t次更新的归属信息矩阵A中对应负荷曲线a的除去b列后剩余的归属信息元素值,即除b外其他负荷曲线对负荷曲线a的归属度值,a’是除去a所在行的所有元素值,rt(a′,b)是第t次更新的吸引信息矩阵R中对应负荷曲线b的除去a行后剩余的吸引信息元素值,即负荷曲线b作为除a外其他负荷曲线的聚类中心的相似度值。
3.如权利要求2所述的基于负荷特性指标加权聚类算法的电网用户分类方法,其特征在于,rt+1(a,b)=ω·rt(a,b)+(1-ω)·rt+1(a,b)且at+1(a,b)=ω·at(a,b)+(1-ω)·at+1(a,b),其中,ω为阻尼系数,0<ω<1,r(a,b)是吸引信息矩阵R中的元素,表示负荷曲线a与负荷曲线b之间的吸引信息,描述负荷曲线a与负荷曲线b的认可程度,a(a,b)是归属信息矩阵A中的元素,表示负荷曲线a与负荷曲线b之间的归属信息,描述负荷曲线a与负荷曲线b作为其聚类中心的适合程度,下标t表示第t次更新,下标t+1表示第t+1次更新。
4.如权利要求1所述的基于负荷特性指标加权聚类算法的电网用户分类方法,其特征在于,所述步骤G中基于熵权法更新所述负荷特性指标权重集合的方法包括:
基于公式
Figure FDA0002339253710000023
计算每个负荷特征指标对聚类中心的贡献度Eval,其中,m为聚类中心数,Cw是第w个聚类中心的负荷特性指标值,Xrand代表在第w类中随机选择的负荷特性指标,λi表示与Xrand对应的权重;
基于贡献度Eval形成贡献度矩阵,即为针对m个聚类中心的n个负荷特性指标值的指标矩阵X=(xpq)m×n
基于公式
Figure FDA0002339253710000031
计算第p个聚类中心的第q个负荷特性指标的熵值eq,其中指标占比
Figure FDA0002339253710000032
基于公式
Figure FDA0002339253710000033
计算第q个负荷特性指标的客观权重λi’,其中,λi'∈[0,1],且
Figure FDA0002339253710000034
以计算出的客观权重λi’更新所述负荷特性指标权重集合。
5.如权利要求1所述的基于负荷特性指标加权聚类算法的电网用户分类方法,其特征在于,所述步骤H中基于用户分类的结果计算新的DB指标的方式包括:
基于公式
Figure FDA0002339253710000035
计算所述DB指标,其中,Wα表示第α类内数据点到聚类中心Cw的平均距离,Wβ表示第β类内数据点到聚类中心Cw的平均距离,Cαβ表示聚类中心α与β之间的距离。
6.如权利要求1-5任一项所述的基于负荷特性指标加权聚类算法的电网用户分类方法,其特征在于,所述负荷特性指标包括峰时耗电率、谷电系数、平段用电百分比、日负荷率、日平均负荷、日峰谷差率及日最大负荷中的任意一项或多项。
CN201810072661.3A 2018-01-25 2018-01-25 一种基于负荷特性指标加权聚类算法的电网用户分类方法 Expired - Fee Related CN108280479B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810072661.3A CN108280479B (zh) 2018-01-25 2018-01-25 一种基于负荷特性指标加权聚类算法的电网用户分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810072661.3A CN108280479B (zh) 2018-01-25 2018-01-25 一种基于负荷特性指标加权聚类算法的电网用户分类方法

Publications (2)

Publication Number Publication Date
CN108280479A CN108280479A (zh) 2018-07-13
CN108280479B true CN108280479B (zh) 2020-06-05

Family

ID=62804990

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810072661.3A Expired - Fee Related CN108280479B (zh) 2018-01-25 2018-01-25 一种基于负荷特性指标加权聚类算法的电网用户分类方法

Country Status (1)

Country Link
CN (1) CN108280479B (zh)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109117872A (zh) * 2018-07-24 2019-01-01 贵州电网有限责任公司信息中心 一种基于自动最优聚类算法的用户用电行为分析方法
CN109871860B (zh) * 2018-11-02 2022-12-13 湖南大学 一种基于核主成分分析的日负荷曲线降维聚类方法
CN109615018B (zh) * 2018-12-24 2020-03-20 广东德诚科教有限公司 用户个性化行为评价方法、装置、计算机设备和存储介质
CN109948695A (zh) * 2019-03-18 2019-06-28 云南电网有限责任公司 一种基于近邻传播聚类算法的电网脆弱节点自动识别方法
CN110109971A (zh) * 2019-04-19 2019-08-09 国网天津市电力公司电力科学研究院 一种低压台区用户用电负荷特性分析方法
CN110097126B (zh) * 2019-05-07 2023-04-21 江苏优聚思信息技术有限公司 基于dbscan聚类算法的核查重点人员、房屋漏登记的方法
CN110263995B (zh) * 2019-06-18 2022-03-22 广西电网有限责任公司电力科学研究院 考虑负荷增长率与用户用电特性的配变重过载预测方法
CN110544123B (zh) * 2019-08-29 2022-02-01 广东电网有限责任公司广州供电局 电力用户分类方法、装置、计算机设备和存储介质
CN110796173B (zh) * 2019-09-27 2023-05-16 昆明电力交易中心有限责任公司 一种基于改进kmeans的负荷曲线形态聚类算法
CN110659699A (zh) * 2019-09-30 2020-01-07 重庆大学 一种基于特征指标降维的分布式双层聚类分析方法
CN110851502B (zh) * 2019-11-19 2023-04-07 国网吉林省电力有限公司 一种基于数据挖掘技术的负荷特征场景分类方法
CN111461921B (zh) * 2020-03-31 2023-11-24 国网湖南省电力有限公司 一种基于机器学习的负荷建模典型用户数据库更新方法
CN111860574A (zh) * 2020-06-04 2020-10-30 远光软件股份有限公司 电网用户分组方法、装置、存储介质及电子设备
CN111784381B (zh) * 2020-06-09 2023-05-16 北京邮电大学 基于隐私保护和som网络的电力客户细分方法及系统
CN112734245B (zh) * 2021-01-14 2022-02-18 深电能科技集团有限公司 低压配电回路监测方法、装置及设备
CN113469500A (zh) * 2021-06-07 2021-10-01 深圳供电局有限公司 一种行业用电大数据特征分析方法及装置
CN114566289B (zh) * 2022-04-26 2022-08-09 之江实验室 一种基于多中心临床数据防作弊分析的疾病预测系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103218675A (zh) * 2013-05-06 2013-07-24 国家电网公司 一种基于聚类和滑动窗口的短期负荷预测方法
CN105825298A (zh) * 2016-03-14 2016-08-03 梁海东 一种基于负荷特性预估的电网计量预警系统及方法
CN107368844A (zh) * 2017-06-02 2017-11-21 西安电子科技大学 一种基于ap聚类和isa双向聚类的双向聚类方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103218675A (zh) * 2013-05-06 2013-07-24 国家电网公司 一种基于聚类和滑动窗口的短期负荷预测方法
CN105825298A (zh) * 2016-03-14 2016-08-03 梁海东 一种基于负荷特性预估的电网计量预警系统及方法
CN107368844A (zh) * 2017-06-02 2017-11-21 西安电子科技大学 一种基于ap聚类和isa双向聚类的双向聚类方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
"An Affinity Propagation Clustering Algorithm for Mixed";Kang Zhang等;《Mathematical Problems in Engineering》;20140929;第1-8页 *
"基于电网安全运行的输电断面研究";何培颖;《中国优秀硕士学位论文全文数据库工程科技II辑》;20170915(第09期);C042-648 *
"改进的近邻传播聚类算法及其应用研究";唐丹;《中国优秀硕士学位论文全文数据库信息科技辑》;20170715(第07期);I138-548 *
"若干改进近邻传播聚类算法及其应用";张利;《中国优秀硕士学位论文全文数据库信息科技辑》;20170315(第03期);I138-3599 *

Also Published As

Publication number Publication date
CN108280479A (zh) 2018-07-13

Similar Documents

Publication Publication Date Title
CN108280479B (zh) 一种基于负荷特性指标加权聚类算法的电网用户分类方法
CN107423769B (zh) 基于形态特征的电力负荷曲线自适应聚类方法
US20210109140A1 (en) Method for identifying parameters of 10 kv static load model based on similar daily load curves
CN106203478A (zh) 一种用于智能电表大数据的负荷曲线聚类方法
CN108898154A (zh) 一种电力负荷som-fcm分层聚类方法
CN108345908A (zh) 电网数据的分类方法、分类设备及存储介质
CN110111024A (zh) 基于ahp模糊综合评价模型的科技成果市场价值评估方法
CN108805213B (zh) 计及小波熵降维的电力负荷曲线双层谱聚类方法
CN110874381B (zh) 一种基于空间密度聚类的用户侧负荷数据异常值识别方法
CN111898839B (zh) 电力用户的重要程度分类方法及装置
CN109657891B (zh) 一种基于自适应k-means++算法的负荷特性分析方法
CN109146252A (zh) 基于调节潜力指标的用户用电行为聚类分析方法和系统
CN111242161B (zh) 一种基于智能学习的非侵入式非居民用户负荷辨识方法
CN117272850B (zh) 配电网安全运行调度弹性空间分析方法
CN106296315A (zh) 基于用户用电数据的情境感知系统
Lu et al. Adaptive weighted fuzzy clustering algorithm for load profiling of smart grid customers
CN111144447B (zh) 一种新能源出力引起的反调峰风险的电网峰谷时段划分方法
CN108898273A (zh) 一种基于形态分析的用户侧负荷特征聚类评价方法
CN111914900A (zh) 一种用户用电模式分类方法
CN110781959A (zh) 基于birch算法和随机森林算法的电力客户分群方法
CN107274025B (zh) 一种实现用电模式智能识别与管理的系统和方法
CN108388911A (zh) 一种面向混合属性的移动用户动态模糊聚类方法
CN109685338A (zh) 一种基于博弈论的配电网可靠性指标权重集结方法
CN108960657A (zh) 一种基于特征优选的楼宇负荷特性分析方法
Martins et al. Hercules: A context-aware multiple application and multisensor data fusion algorithm

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20200605

Termination date: 20210125

CF01 Termination of patent right due to non-payment of annual fee