CN108280479B

CN108280479B - 一种基于负荷特性指标加权聚类算法的电网用户分类方法

Info

Publication number: CN108280479B
Application number: CN201810072661.3A
Authority: CN
Inventors: 李春燕; 蔡文悦; 陈骁; 余长青; 赵溶生; 张谦
Original assignee: Chongqing University
Current assignee: Chongqing University
Priority date: 2018-01-25
Filing date: 2018-01-25
Publication date: 2020-06-05
Anticipated expiration: 2038-01-25
Also published as: CN108280479A

Abstract

本申请公开了一种基于负荷特性指标加权聚类算法的电网用户分类方法，引入负荷曲线聚类，针对现有算法复杂度较高的问题，构建负荷特性指标并对传统AP算法进行降维，以提高算法效率；利用权重改进相似度计算，并以DB指标进行收敛判断。面对主观赋权的不足，设计特性指标贡献度的评价规则，采用熵权法客观自适应地确定负荷特性指标的权重，以衡量各特性指标对聚类结果的区分度大小，提升了权重赋值的合理性，最终提高了用户分类结果的精准度。

Description

一种基于负荷特性指标加权聚类算法的电网用户分类方法

技术领域

本申请涉及用电数据分析技术领域，尤其涉及一种基于负荷特性指标加权聚类算法的电网用户分类方法。

背景技术

根据用户的用电情况对用户进行分类，对电力公司具有重大的意义，电力公司可以根据用户的类型对不同类型的用户的用电情况进行具体分析，并为用户提供更优质的服务，现有技术中，常使用聚类算法对用户进行分类。许多学者对不同聚类算法展开研究，探讨对负荷曲线的聚类效果，不同算法根据其处理目标、数据类型的不同而有所区别，通常分为直接聚类和间接聚类两种。直接聚类是对负荷数据直接进行处理的一种技术，包括Kmeans、FCM、DBSCAN、CFSFDP等，以及针对这些聚类算法的改进。直接聚类的优势是简单快捷，能够充分利用数据自身的特征，但是当面对大量高维数据时在运行效率上不占优势。间接聚类则是先将负荷原始数据进行降维或者特征提取，再对数据进行处理的一种技术。常用方法是利用降维算法进行数据变换，产生或提取数据特征，如SVD、PCA、SOM等。采用该类方法能够对数据进行非线性降维，但提取的特征物理意义不明显，不能为聚类结果提供进一步服务。

AP聚类算法(Affinity propagation Clustering Algorithm，吸引子传播算法)于2007年在Science上发表，该算法具有不需要指定聚类数目和选取初值、聚类结果误差平方和小等优势，在图像、文本及信号处理等领域应用广泛。但算法本身复杂度较高，当处理多维大量数据时，AP聚类算法往往需要长时间计算。并且，常将用户的用电数据加权后再进行聚类，但现有技术中的权重赋值方法是专家评判法，具有主观性且效率较低。

因此如何降低采用聚类算法对用户进行分类时的运算时间，提升权重赋值的合理性，进而提升用户分类结果的精准度成为了本领域技术人员急需解决的问题。

发明内容

针对现有技术存在的上述不足，本申请要解决的技术问题是：如何降低采用聚类算法对用户进行分类时的运算时间，提升权重赋值的合理性，进而提升用户分类结果的精准度。

为解决上述技术问题，本申请采用了如下的技术方案：

一种基于负荷特性指标加权聚类算法的电网用户分类方法，包括：

步骤A：获取待分类用户的负荷曲线d_l，l表示不同的待分类用户，l为正整数，执行步骤B；

步骤B：基于所述负荷曲线d_l计算负荷特性指标集合D_l＝[V_l1,V_l2,...,V_ln]，V_l1至V_ln表示不同的负荷特性指标，n表示所述负荷特性指标集合内负荷特性指标种类的个数，n为正整数，执行步骤C；

步骤C：基于所述负荷特性指标集合D_l＝[V_l1,V_l2,...,V_ln]设置初始权重集合λ＝[λ₁,λ₂,...,λ_n]，并以所述初始权重集合为负荷特性指标权重集合，所述负荷特性指标权重集合中的每个权重即为所述负荷特性指标集合中每种负荷特性指标的权重，设第一迭代次数i为1，设第二迭代次数j为1，设置吸引信息矩阵R和归属信息矩阵A为零，设置DB指标，执行步骤D；

步骤D：基于所述负荷特性指标集合及所述负荷特性指标权重集合生成待分类用户的相似度矩阵

其中，median(S)为矩阵S非对角线所有元素的中位数，V_la和V_lb表示任意两种不同的负荷特性指标，λ_la为V_la的权重，λ_lb为V_lb的权重，V_la∈D_l，V_lb∈D_l，执行步骤E；

步骤E：基于所述相似度矩阵s(a，b)更新所述吸引信息矩阵R和归属信息矩阵A，执行步骤F；

步骤F：基于所述吸引信息矩阵R及所述归属信息矩阵A利用AP聚类算法对所述待分类用户进行分类；当聚类中心稳定和或第一迭代次数i大于第一预设迭代次数i_max时，执行步骤G；否则，将第一迭代次数i加1并执行步骤E；

步骤G：基于熵权法更新所述负荷特性指标权重集合，执行步骤H；

步骤H：基于用户分类的结果计算新的DB指标，当所述新的DB指标满足预设DB阈值时，结束，否则，执行步骤I；

步骤I：当DB<DBnew或第二迭代次数j大于第二预设迭代次数j_max时，执行步骤J；否则，将第二迭代次数j加1并执行步骤D，其中，DBnew为步骤H中计算出的新的DB指标，DB为DBnew之前一次得到的DB指标；

步骤J：更新相似度矩阵

DB_min为得到的所有DB指标中最小的DB指标值，δ为搜索阈值，记录最小的DB指标值DB_min所对应的聚类中心，结束。

优选地，所述步骤E中基于所述相似度矩阵s(a，b)更新所述吸引信息矩阵R和归属信息矩阵A的方式包括：

基于公式

更新所述吸引信息矩阵R和所述归属信息矩阵A，其中，s(a，b)是负荷曲线a与负荷曲线b之间的相似度，其值表明了b作为a的聚类中心的合适程度，r(a，b)是吸引信息矩阵R中的元素，表示负荷曲线a与负荷曲线b之间的吸引信息，描述负荷曲线a与负荷曲线b的认可程度，a(a，b)是归属信息矩阵A中的元素，表示负荷曲线a与负荷曲线b之间的归属信息，描述负荷曲线a与负荷曲线b作为其聚类中心的适合程度，下标t表示第t次更新，下标t+1表示第t+1次更新，b’是除去b所在列的所有元素值，a_t(a,b′)是归属信息矩阵A中对应负荷曲线a的除去b列后剩余的归属信息元素值，即除b外其他负荷曲线对负荷曲线a的归属度值，a’是除去a所在行的所有元素值，r_t(a′,b)是吸引信息矩阵R中对应负荷曲线b的除去a行后剩余的吸引信息元素值，即负荷曲线b作为除a外其他负荷曲线的聚类中心的相似度值。

优选地，r_t+1(a,b)＝ω·rt(a,b)+(1-ω)·r_t+1(a,b)且a_t+1(a,b)＝ω·a_t(a,b)+(1-ω)·a_t+1(a,b)，其中，ω为阻尼系数，0＜ω＜1，r(a，b)是吸引信息矩阵R中的元素，表示负荷曲线a与负荷曲线b之间的吸引信息，描述负荷曲线a与负荷曲线b的认可程度，a(a，b)是归属信息矩阵A中的元素，表示负荷曲线a与负荷曲线b之间的归属信息，描述负荷曲线a与负荷曲线b作为其聚类中心的适合程度，下标t表示第t次更新，下标t+1表示第t+1次更新。

优选地，所述步骤G中基于熵权法更新所述负荷特性指标权重集合的方法包括：

基于公式

w＝1,2,...,m计算每个负荷特征指标对聚类中心的贡献度Eval，其中，m为聚类中心数，C_w是第w个聚类中心的负荷特性指标值，X_rand代表在第w类中随机选择的负荷特性指标，λi表示与X_rand对应的权重；

基于贡献度Eval形成贡献度矩阵，即为针对m个聚类中心的n个负荷特性指标值的指标矩阵X＝(x_pq)_m×n；

基于公式

计算第p个聚类中心的第q个负荷特性指标的熵值eq，其中指标占比

基于公式

q＝1,2,...,n计算第q个负荷特性指标的客观权重λi’，其中，λ_i'∈[0,1]，且

以计算出的客观权重λi’更新所述负荷特性指标权重集合。

优选地，所述步骤H中基于用户分类的结果计算新的DB指标的方式包括：

基于公式

计算所述DB指标，其中，W_α表示α类内数据点到聚类中心C_w的平均距离，W_β表示β类内数据点到聚类中心C_w的平均距离，C_αβ表示聚类中心α与β之间的距离。

优选地，所述负荷特性指标包括峰时耗电率、谷电系数、平段用电百分比、日负荷率、日平均负荷、日峰谷差率及日最大负荷中的任意一项或多项。

综上所述，本申请公开了一种基于负荷特性指标加权聚类算法的电网用户分类方法，引入负荷曲线聚类，针对现有算法复杂度较高的问题，构建负荷特性指标并对传统AP算法进行降维，以提高算法效率；利用权重改进相似度计算，并以DB指标进行收敛判断。面对主观赋权的不足，设计特性指标贡献度的评价规则，采用熵权法客观自适应地确定负荷特性指标的权重，以衡量各特性指标对聚类结果的区分度大小，提升了权重赋值的合理性，最终提高了用户分类结果的精准度。

附图说明

为了使发明的目的、技术方案和优点更加清楚，下面将结合附图对本申请作进一步的详细描述，其中：

图1为本申请公开的一种基于负荷特性指标加权聚类算法的电网用户分类方法的流程图；

图2为采用本申请公开的基于负荷特性指标加权聚类算法的电网用户分类方法进行分类的分类1的聚类结果示意图；

图3为采用本申请公开的基于负荷特性指标加权聚类算法的电网用户分类方法进行分类的分类2的聚类结果示意图；

图4为采用本申请公开的基于负荷特性指标加权聚类算法的电网用户分类方法进行分类的分类3的聚类结果示意图；

图5为采用本申请公开的基于负荷特性指标加权聚类算法的电网用户分类方法进行分类的分类4的聚类结果示意图；

图6为采用本申请公开的基于负荷特性指标加权聚类算法的电网用户分类方法进行分类的分类5的聚类结果示意图；

图7为采用本申请公开的基于负荷特性指标加权聚类算法的电网用户分类方法进行分类的分类6的聚类结果示意图；

图8为采用本申请公开的基于负荷特性指标加权聚类算法的电网用户分类方法进行分类的分类7的聚类结果示意图；

图9为采用本申请公开的基于负荷特性指标加权聚类算法的电网用户分类方法进行分类的分类1的聚类中心指标值示意图；

图10为采用本申请公开的基于负荷特性指标加权聚类算法的电网用户分类方法进行分类的分类2的聚类中心指标值示意图；

图11为采用本申请公开的基于负荷特性指标加权聚类算法的电网用户分类方法进行分类的分类3的聚类中心指标值示意图；

图12为采用本申请公开的基于负荷特性指标加权聚类算法的电网用户分类方法进行分类的分类4的聚类中心指标值示意图；

图13为采用本申请公开的基于负荷特性指标加权聚类算法的电网用户分类方法进行分类的分类5的聚类中心指标值示意图；

图14为采用本申请公开的基于负荷特性指标加权聚类算法的电网用户分类方法进行分类的分类6的聚类中心指标值示意图；

图15为采用本申请公开的基于负荷特性指标加权聚类算法的电网用户分类方法进行分类的分类7的聚类中心指标值示意图；

图16为最终权重排列前三的各聚类中心指标值的示意图。

图2至图8中，横坐标为时间，纵坐标表示归一化之后的用电量；图9至图15中，横坐标为时间，纵坐标表示归一化之后的聚类中心指标值；图16中，横坐标为聚类中心，纵坐标为归一化后的负荷特性指标值，曲线A为日平均负荷，曲线B为谷电系数，曲线C为峰时耗电率。

具体实施方式

下面结合附图对本申请作进一步的详细说明。

如图1所示，本发明公开了一种基于负荷特性指标加权聚类算法的电网用户分类方法的流程图，包括：

S101：获取待分类用户的负荷曲线d_l，l表示不同的待分类用户，l为正整数，执行S102；

S102：基于负荷曲线d_l计算负荷特性指标集合D_l＝[V_l1,V_l2,...,V_ln]，V_l1至V_ln表示不同的负荷特性指标，n表示负荷特性指标集合内负荷特性指标种类的个数，n为正整数，执行S103；

智能电网采集的负荷数据是多维的，若将每一个维度视为一个特征，其中存在大量冗余特征，如果对所有特征都进行分析，将使模型变得更加复杂，同时增加运算时间。因此需要选择典型的负荷特性指标，合理降低数据维度，以提高聚类的精准性和算法运行效率。对于负荷特性指标的选取，一般是根据专家经验进行选取。

此外，对于采集的负荷数据，常出现由于信号干扰、通讯设备故障等问题导致数据采集错误或未采集，为保证聚类结果的正确性，需对不良数据进行处理，例如对数据中的缺失值，通过计算近邻数据的平均值进行补充。同时，为消除数据间量级差异的影响，进行离差标准化，把数据映射到[0,1]区间。

S103：基于负荷特性指标集合D_l＝[V_l1,V_l2,...,V_ln]设置初始权重集合λ＝[λ₁,λ₂,...,λ_n]，并以初始权重集合为负荷特性指标权重集合，负荷特性指标权重集合中的每个权重即为负荷特性指标集合中每种负荷特性指标的权重，设第一迭代次数i为1，设第二迭代次数j为1，设置吸引信息矩阵R和归属信息矩阵A为零，设置DB指标，执行S104；

S104：基于负荷特性指标集合及负荷特性指标权重集合生成待分类用户的相似度矩阵

其中，median(S)为矩阵S非对角线所有元素的中位数，V_la和V_lb表示任意两种不同的负荷特性指标，λ_la为V_la的权重，λ_lb为V_lb的权重，V_la∈D_l，V_lb∈D_l，执行步骤S105；

AP聚类算法本质是基于划分的聚类算法，基于“物以类聚”思想，引入竞争概念进行迭代。算法输入矩阵为相似度矩阵S，它刻画了数据之间的相似度，通常被设定为两点欧氏距离平方的负数。由于本申请模型的输入为各负荷特性指标，并且，为评判每个特性指标对聚类的效果，对其赋予不同的权重，传统的相似度计算方法并不适用。因此，本申请通过计算和更新不同数据之间的负荷特性指标相似度进行聚类中心判断。

S105：基于相似度矩阵s(a，b)更新吸引信息矩阵R和归属信息矩阵A，执行S106；

S106：基于吸引信息矩阵R及归属信息矩阵A利用AP聚类算法对待分类用户进行分类；当聚类中心稳定和或第一迭代次数i大于第一预设迭代次数i_max时，执行S107；否则，将第一迭代次数i加1并执行S105；

S107：基于熵权法更新负荷特性指标权重集合，执行S108；

S108：基于用户分类的结果计算新的DB指标，当新的DB指标满足预设DB阈值时，结束，否则，执行S109；

聚类评价指标分为两种：一种是外部标准，通过聚类结果和预期结果的一致性来判断聚类效果的优良；另一种是内部标准，基于数据点聚集中心点的紧密程度来评价聚类质量。由于用电负荷的随机性，无法对聚类结果做出预测，因而，本申请采用内部指标评定聚类效果。在面向降维的聚类算法中，DB指标的计算更为简单且变化范围小，便于应用，更适合作为电力负荷曲线聚类的有效性指标。

S109：当DB<DBnew或第二迭代次数j大于第二预设迭代次数j_max时，执行S110；否则，将第二迭代次数j加1并执行S104，其中，DBnew为S108中计算出的新的DB指标，DB为DBnew之前一次得到的DB指标；

将权重引入相似度计算，利用迭代后更新得到的权重修正各负荷特性指标，能更准确地反应各负荷曲线之间的相似程度。

S110：更新相似度矩阵

相似度矩阵主对角线上的元素值S(k，k)为偏向参数，其值越大，聚类数目越多。AP聚类算法的稳定性较好，对于多次迭代DB指标范围变动较小。因此，利用DB指标作为AP聚类算法的偏向参数选取和收敛判据，如下式所示。

S(k,k)＝median(S)+δ×DB_min

其中，p_m为非主对角线(是相似度矩阵S中主对角线元素值，也称为偏向参数)上的所有数的中位数，为初始值；DB_min为当前算法进程计算下的DB最小值；δ为搜索阈值，若要向前搜索，即增大偏向参数值使分类结果数目增加，取δ＞0，反之，取δ＜0。当负荷曲线数量多，为了方便分析，往往不希望聚类中心数太多，故本申请选择向后搜索，即减小偏向参数值使分类结果数目减少，取δ＝-0.1。在算法得到稳定解后，通过对偏向参数的前后调整，寻找在该范围内是否存在更小的DB值，从而得到更好的聚类结果。

具体实施时，S105中基于相似度矩阵s(a，b)更新吸引信息矩阵R和归属信息矩阵A的方式包括基于公式

更新吸引信息矩阵R和归属信息矩阵A，其中，s(a，b)是负荷曲线a与负荷曲线b之间的相似度，其值表明了b作为a的聚类中心的合适程度，r(a，b)是吸引信息矩阵R中的元素，表示负荷曲线a与负荷曲线b之间的吸引信息，描述负荷曲线a与负荷曲线b的认可程度，a(a，b)是归属信息矩阵A中的元素，表示负荷曲线a与负荷曲线b之间的归属信息，描述负荷曲线a与负荷曲线b作为其聚类中心的适合程度，下标t表示第t次更新，下标t+1表示第t+1次更新，b’是除去b所在列的所有元素值，a_t(a,b′)是归属信息矩阵A中对应负荷曲线a的除去b列后剩余的归属信息元素值，即除b外其他负荷曲线对负荷曲线a的归属度值，a’是除去a所在行的所有元素值，r_t(a′,b)是吸引信息矩阵R中对应负荷曲线b的除去a行后剩余的吸引信息元素值，即负荷曲线b作为除a外其他负荷曲线的聚类中心的相似度值。

具体实施时，r_t+1(a,b)＝ω·r_t(a,b)+(1-ω)·r_t+1(a,b)且a_t+1(a,b)＝ω·a_t(a,b)+(1-ω)·a_t+1(a,b)，其中，ω为阻尼系数，0＜ω＜1，r(a，b)是吸引信息矩阵R中的元素，表示负荷曲线a与负荷曲线b之间的吸引信息，描述负荷曲线a与负荷曲线b的认可程度，a(a，b)是归属信息矩阵A中的元素，表示负荷曲线a与负荷曲线b之间的归属信息，描述负荷曲线a与负荷曲线b作为其聚类中心的适合程度，下标t表示第t次更新，下标t+1表示第t+1次更新。

在迭代过程较易产生振荡，在每次迭代前都会加上阻尼系数ω，从而消除振荡对分类结果的影响。

具体实施时，S107中基于熵权法更新负荷特性指标权重集合的方法包括：

基于公式

基于公式

基于公式

q＝1,2,...,n计算第q个负荷特性指标的客观权重λi’，其中，λ'_i∈[0,1]，且

以计算出的客观权重λi’更新负荷特性指标权重集合。

电力系统各类负荷特性指标是用电负荷特点和性质的体现，但不同指标对负荷曲线特性的描述不同，对数据区分度的影响程度也不同，因此需对负荷特性指标进行合理赋权。可运用专家意见对负荷特性指标进行主观赋权确定各指标的权重，其反映了决策人的意向，但决策结果往往具有主观随意性，指标确定的过程也较为繁琐。针对此问题，本申请提出利用熵权法评价各特性指标对聚类结果的贡献，客观确定负荷特性的指标权重。

熵权法的基本思路是根据指标变异性的大小来确定客观权重。通常若某个指标的信息熵越小，表明指标值的变异程度越大，提供的信息量越多，在综合评价中所能起到的作用也越大，其权重也就越大。通过熵权法计算各特性指标的贡献值，具有较强的理论依据，并且计算所得权重能够实现特征选择，即权重越大的指标，在聚类中越重要，越能反应该类负荷曲线的特性。

通过评价每个指标对目标的贡献大小，即各负荷特性指标对聚类的区分度大小，从而确定各指标的权重。可计算属于该类的负荷曲线的负荷特性指标与聚类中心负荷特性指标的差值，来判断该指标在聚类中的贡献大小。如果差值很大，说明聚类中心值与该指标值差异较大，在聚类中的贡献较小。通过熵权法实现客观赋权，能够帮助聚类算法选择更准确的聚类中心，体现各负荷特性指标对聚类中心选择的区分度大小。同时，在对聚类结果进行评估时，也可根据各指标的权重不同进行分析。

具体实施时，S108中基于用户分类的结果计算新的DB指标的方式包括基于公式

计算DB指标，其中，W_α表示α类内数据点到聚类中心C_w的平均距离，W_β表示β类内数据点到聚类中心C_w的平均距离，C_αβ表示聚类中心α与β之间的距离。

具体实施时，负荷特性指标包括峰时耗电率、谷电系数、平段用电百分比、日负荷率、日平均负荷、日峰谷差率及日最大负荷中的任意一项或多项。

负荷特性指标是负荷曲线内部规律的反映，能够快速高效提取高维负荷曲线中的有用信息。各国的负荷特性指标不尽相同，根据我国实际情况，本申请引入7个典型常用负荷特性指标，即峰时耗电率、谷电系数、平段用电百分比、日负荷率、日平均负荷、日峰谷差率、日最大负荷作为特征向量，对负荷曲线进行聚类。各负荷特性指标含义如表1所示。

表1

下面为采用本方法对用户进行分类的具体算例：

数据来自爱尔兰电力和天然气行业监管机构于2007年启动的智能计量项目。从中选取了3000条负荷曲线，并对有效负荷曲线进行了归一化处理，执行本申请公开的基于负荷特性指标加权聚类算法的电网用户分类方法，得到7类负荷曲线，结果如图2-8所示。对每类负荷曲线取均值，得到各聚类中心如图9-15所示。

由图2-8可以看出，负荷曲线之间差异较大，可以判断出以负荷特性指标区分的典型用户，其高峰、平段、低谷区间的用电情况变化较明显。如(1)类用户和(3)类用户在0-7时和18-23时用电量水平较高，其白天用电行为频繁，总体负荷较大，属于高负荷率型用户，其家中人口数量较多；(2)类用户早晚用电量较大，在午间用电有明显的回落，属于午间不回家的上班族；(4)类用户从8-22点用电量一直处于较高水平，属于商业用户；(5)类、(6)类和(7)类用户可以看到日负荷曲线有两个峰值，但峰值出现的时间有所不同，峰谷差也有一定差异，其用电特点有所区别。

其中，各特性指标初始权重设置及变化结果如表2所示。根据最终聚类结果权重可以看出，平段用电百分比和日峰谷差率对应的权重变小了，这是因为负荷曲线在进行了归一化之后，这两个特性指标在不同负荷曲线之间的差异不大，在确定聚类中心的时候做出的贡献较少；同时，日平均负荷对应的权重有所上升，这说明日平均负荷特性指标对于数据集的区分度较好。

表2

更改初始权重，对数据再次进行聚类计算，所得聚类结果仍为7类，权重变化如表3所示。通过结果可以看出，初始权重的改变对最终熵权法确定的客观权重影响较小，对于该数据集来说，日平均负荷仍为区分度最好的负荷特性指标，说明熵权法能够减轻主观赋权所带来的影响偏差。

表3

图16所示为最终权重排列前三的各聚类中心指标值，根据日平均负荷、谷电系数、峰时耗电率进行客户用电行为区分。可以看出，(2)类用户谷电系数高，倾向于在低谷时段用电，是进行需求响应的潜在群体；(4)类用户在低谷时段用电量较大，峰时耗电率较低，可与(2)类用户配合进行调度安排，填补负荷低谷；(5)、(6)类用户虽然具有较高的峰时耗电率，但其日平均负荷较小，并且在一定程度上倾向于非高峰期用电，在制定电价政策时可不作为主要群体考虑；(1)、(3)、(7)类用户日平均负荷和峰时耗电率指标值较高，可针对该类用户制定较高的峰时电价，引导其执行削峰填谷，促进电力资源的优化配置。

因此，采用合理的负荷特性指标对负荷曲线进行降维，既能保留AP聚类算法的优势，又能得到针对数据集的指标权重，为用户用电分析提供服务。

本申请将AP聚类引入负荷曲线聚类，针对负荷曲线的高维度问题，利用负荷特性指标进行降维，并对相似度计算进行改进，加快AP聚类的运行速度，同时采用熵权法思想，对负荷特性指标进行客观赋权，实现负荷特性指标的自适应权重计算，该权重表征各负荷特性指标对聚类结果区分度的大小，既能在聚类迭代过程中指导聚类中心进行收敛，又能对聚类结果进行评价，为进一步用户用电行为分析提供参考。

本申请将负荷特性指标加权的AP聚类算法应用于负荷曲线聚类，在保证算法聚类效果的同时，降低了算法相似度计算的运行时间；

利用熵权法对聚类过程中的负荷特性指标进行客观赋权，将不同负荷特性指标对聚类效果的区分度加以评价。所得权重值既能增加聚类结果的准确度，又能为用户用电行为分析所服务。

最后说明的是，以上实施例仅用以说明本申请的技术方案而非限制，尽管通过参照本申请的优选实施例已经对本申请进行了描述，但本领域的普通技术人员应当理解，可以在形式上和细节上对其作出各种各样的改变，而不偏离所附权利要求书所限定的本申请的精神和范围。

Claims

1.一种基于负荷特性指标加权聚类算法的电网用户分类方法，其特征在于，包括：

其中，median(S)为矩阵S非对角线所有元素的中位数，V_la和V_lb表示任意两种不同的负荷特性指标，λ_a为V_la的权重，λ_b为V_lb的权重，V_la∈D_l，V_lb∈D_l，执行步骤E；

步骤J：更新相似度矩阵

2.如权利要求1所述的基于负荷特性指标加权聚类算法的电网用户分类方法，其特征在于，所述步骤E中基于所述相似度矩阵S(a，b)更新所述吸引信息矩阵R和归属信息矩阵A的方式包括：

基于公式

更新所述吸引信息矩阵R和所述归属信息矩阵A，其中，S(a，b)是负荷曲线a与负荷曲线b之间的相似度，其值表明了b作为a的聚类中心的合适程度，r_t+1(a，b)是第t+1次更新的吸引信息矩阵R中的元素，表示负荷曲线a与负荷曲线b之间的吸引信息，描述负荷曲线a与负荷曲线b的认可程度，a_t(a，b)是第t次更新的归属信息矩阵A中的元素，表示负荷曲线a与负荷曲线b之间的归属信息，描述负荷曲线a与负荷曲线b作为其聚类中心的适合程度，下标t表示第t次更新，下标t+1表示第t+1次更新，b’是除去b所在列的所有元素值，a_t(a,b′)是第t次更新的归属信息矩阵A中对应负荷曲线a的除去b列后剩余的归属信息元素值，即除b外其他负荷曲线对负荷曲线a的归属度值，a’是除去a所在行的所有元素值，r_t(a′,b)是第t次更新的吸引信息矩阵R中对应负荷曲线b的除去a行后剩余的吸引信息元素值，即负荷曲线b作为除a外其他负荷曲线的聚类中心的相似度值。

3.如权利要求2所述的基于负荷特性指标加权聚类算法的电网用户分类方法，其特征在于，r_t+1(a,b)＝ω·r_t(a,b)+(1-ω)·r_t+1(a,b)且a_t+1(a,b)＝ω·a_t(a,b)+(1-ω)·a_t+1(a,b)，其中，ω为阻尼系数，0＜ω＜1，r(a，b)是吸引信息矩阵R中的元素，表示负荷曲线a与负荷曲线b之间的吸引信息，描述负荷曲线a与负荷曲线b的认可程度，a(a，b)是归属信息矩阵A中的元素，表示负荷曲线a与负荷曲线b之间的归属信息，描述负荷曲线a与负荷曲线b作为其聚类中心的适合程度，下标t表示第t次更新，下标t+1表示第t+1次更新。

4.如权利要求1所述的基于负荷特性指标加权聚类算法的电网用户分类方法，其特征在于，所述步骤G中基于熵权法更新所述负荷特性指标权重集合的方法包括：

基于公式

计算每个负荷特征指标对聚类中心的贡献度Eval，其中，m为聚类中心数，C_w是第w个聚类中心的负荷特性指标值，X_rand代表在第w类中随机选择的负荷特性指标，λi表示与X_rand对应的权重；

基于公式

计算第p个聚类中心的第q个负荷特性指标的熵值e_q，其中指标占比

基于公式

计算第q个负荷特性指标的客观权重λi’，其中，λ_i'∈[0,1]，且

以计算出的客观权重λi’更新所述负荷特性指标权重集合。

5.如权利要求1所述的基于负荷特性指标加权聚类算法的电网用户分类方法，其特征在于，所述步骤H中基于用户分类的结果计算新的DB指标的方式包括：

基于公式

计算所述DB指标，其中，W_α表示第α类内数据点到聚类中心C_w的平均距离，W_β表示第β类内数据点到聚类中心C_w的平均距离，C_αβ表示聚类中心α与β之间的距离。

6.如权利要求1-5任一项所述的基于负荷特性指标加权聚类算法的电网用户分类方法，其特征在于，所述负荷特性指标包括峰时耗电率、谷电系数、平段用电百分比、日负荷率、日平均负荷、日峰谷差率及日最大负荷中的任意一项或多项。