CN116933962A

CN116933962A - 一种面向电力用户负荷特性和可调节潜力的聚类方法

Info

Publication number: CN116933962A
Application number: CN202310276887.6A
Authority: CN
Inventors: 刘宇; 周孟然; 汪锟; 朱梓伟
Original assignee: Anhui University of Science and Technology
Current assignee: Anhui University of Science and Technology
Priority date: 2023-03-17
Filing date: 2023-03-17
Publication date: 2023-10-24

Abstract

本发明公开了一种面向电力用户负荷特性和可调节潜力的聚类方法，包括：获取智能电表采集的用户负荷数据以及通过调查问卷采集的用户用电行为影响因素基础信息；利用OPTICS聚类方法对用电负荷数据进行一次聚类，获得一次聚类结果；采用PCA将用户用电行为影响因素数据进行特征降维，并将降维后的主成分作为二次聚类的输入层；针对同类型的用电负荷特性用户群进行二次聚类，利用自组织竞争神经网络(SOM)的模式分类性能得到考虑用户可调节潜力的二次聚类结果；基于反向修正原理，将二次聚类结果作为BiGRU神经网络的训练数据集，反向修正一次聚类结果，随后重复二次聚类流程，得到最终的考虑用户负荷特性和可调节潜力的综合聚类结果，确定所述负荷样本的类别。

Description

一种面向电力用户负荷特性和可调节潜力的聚类方法

技术领域

本发明涉及电力负荷数据处理技术领域，具体是涉及一种面向电力用户负荷特性和可调节潜力的聚类方法。

背景技术

随着我国电力企业对客户侧互动和服务的逐渐重视，电力用户逐渐参与到电网公司的各项业务中来，负荷与源、网的互动调节也越来越多。但大规模用户的参与给电网公司开展需求侧调度工作也带来了挑战，用户负荷响应情况参差不齐、用户行为特征差异化严重，亟需开展对电力用户的精准化分类，以支撑更加高质量的电网友好互动调节。针对电力用户的可调节潜力及负荷特性，研究有效的数据分析技术和负荷分类方法对于节约需求响应成本具有重要的研究意义。

发明内容

本发明实施例提供一种面向电力用户负荷特性和可调节潜力的聚类方法，包括：

获取智能电表采集的用户负荷数据以及通过调查问卷采集的用户用电行为影响因素基础信息；

利用OPTICS聚类方法对用电负荷数据进行一次聚类，得到N类用户群体，获得第一次负荷样本聚类结果；

采用PCA将用户用电行为影响因素数据进行特征降维，并将降维后的主成分作为二次聚类的输入层；

针对同类型的用电负荷特性用户群进行二次聚类，利用自组织竞争神经网络(SOM)的模式分类性能得到考虑用户可调节潜力的二次聚类结果；

基于反向修正原理，将二次聚类结果作为BiGRU神经网络的训练数据集，反向修正一次聚类结果，随后重复二次聚类流程，得到最终的考虑用户负荷特性和可调节潜力的综合聚类结果，确定所述负荷样本的类别。

进一步的，用电负荷数据包括：

负荷用电峰值P_max、负荷用电谷值P_min、负荷平均用电功率和负荷最大利用小时数Γ，其中，

式中，P(t)为t时刻负荷用电功率，T为负荷用电数据采集周期。

进一步的，还包括对用户负荷数据的预处理步骤，其包括：

首先，从数据集中随机选取多个特征值来构成特征空间；其次，在选取特征内的最大值和最小值之间随机分割值形成分区，构建孤立树；然后，将构建的孤立树组成iForest；最后，计算每一个点的异常得分。根据负荷数据特点设定相应的阈值，从而判断数据的异常与否，并对异常数据进行修正。修正方法为采用多阶拉格朗日内插值法计算异常数据近邻正常数据的均值进行替代。

进一步的，用户用电行为影响因素包括：

自我影响因素：用户用电模式、用户响应意愿、用户行为偏好；自然环境影响因素：温度变化、湿度变化、风力变化；社会环境影响因素：社会阶层、职业薪酬、家庭情况。

进一步的，利用OPTICS聚类方法对用电负荷数据进行一次聚类具体步骤包括：

1.标记数据集D中所有样本点均为未处理点，设置参数邻域半径ε以及点数MinPts。

2.创建有序队列和结果队列，其中结果队列用来存储样本的输出顺序。

3.若样本数据集D中的所有样本点均被标记为已处理，则算法结束。否则选取一个核心对象，将其直接密度可达点放入有序队列中，并依据可达距离升序排序。

4.若有序队列中已无样本点，则跳转步骤2，否则将有序队列的第一个点放入结果队列中，并做以下操作：1)如果该点不是核心对象则返回4，反之则记录该点所有的密度可达点；2)若直接密度可达点已在结果队列中，则忽略；若在有序队列中，则在新旧可达距离中选择更小的可达距离记录，并按距离远近依次排序；若不在两个队列中，则在有序队列中插入该点并排序。

5.迭代3、4直至算法结束，按顺序输出结果队列中的所有样本点及其对应的可达距离。

6.绘制坐标图，其中x轴是OPTICS算法处理点的先后顺序，y轴是点的最小可达性距离。在y轴上选定阈值，根据具体情况，确定恰当的阈值，以提取聚类，得到N类用户群体。

进一步的，选取PCA对用户用电行为多维影响因素数据进行特征降维，具体步骤包括：

设共有n个电力用户，每个用户的用电行为影响因素数据有p项指标，X₁,X₂,...,X_P为初始设置的随机变量的集合，得到原始数据的矩阵X为

其中，矩阵X的p项指标中的数组做线性组合得：

式中：a_ip为系数，且满足x₁,x₂,...,x_p为各项指标的对应的值；F₁,F₂,...,F_p为新的不相关变量。

具体步骤包括：

1.根据公式首先得到原始数据矩阵X；

2)计算均值

3)计算出协方差矩阵；

4)计算出协方差矩阵的特征向量和特征值；

5)确定主成分。

进一步的，用户用电行为影响因素多维提取主成分时，选取特征值大于1及累计方差贡献率达到85％以上的前k个特征指标，其累计贡献率表示为：将降维后的主成分作为二次聚类的输入层。

进一步的，采用SOM网络对用户可调潜力进行二次聚类的步骤包括：

1.向量归一化。将SOM网络的输入向量，即经过PCA特征降维后的主成分向量Z。

2.寻找获胜节点。当网络得到一个Z时，竞争层的所有W_ij均与Z进行相似性比较，将和Z相似性最大的W_ij判定为竞争获胜节点，记为W_c。其中，相似性的度量通过计算W_ij和Z的欧氏距离(或夹角余弦)确定。

||Z-W_c||＝min{d_j}

式中，W_ij为节点i和节点j之间的权重，W_c为获胜节点的权重。

3.参数调整W_ij。

W_ij(t+1)＝W_ij(t)+η(t)h_c,j(t)(Z_i-W_ij(t))

式中，η(t)是学习速率，为增益函数，η(t)∈(0,1]；h_c,j(t)是领域函数，h_c,j(t)通常采用高斯函数，即：

式中，d_cj是神经元c和领域内任一被激活神经元j之间的距离；r是领域半径。

步骤3完成后需要返回第一步继续训练，当η(t)衰减至0或规定的值时，所有样本训练完成。训练结束后，输出编号一样的神经元就代表了特征上相似的类别，可以划分为同一类。

进一步的，基于反向修正原理，将二次聚类结果作为BiGRU神经网络的训练数据集，将个别用户种类进行调整，得到更为精准的聚类结果，反向修正一次聚类结果，对一次聚类结果进行调节，计算公式包括：

式中，GRU为传统的GRU网络运算过程，为t时刻前后隐藏层的状态与权重；为t时刻后向隐藏层状态与权重；b_t为t时刻隐藏层状态的偏置。

进一步的，采取DB指数(davies-bouldin index，DBI)和轮廓系数(silhouettecoefficient，SI)作为用户负荷特性和可调节潜力综合聚类结果的评价性指标，计算公式包括：

式中，和/>分别为为第i类和第j类所有样本到其所属类中心距离的平均值；M_ij为不同类别的类中心距离。

式中：a_i为某一特征向量到所有它属于的簇中其它点的距离；b_i为某一特征向量到与它相邻最近的一簇内的所有点的平均距离。

进一步的，采用OPTICS算法的一次聚类结果可以得到k类具有类内相似性和类间各异性的用户群体。针对用户基础信息采集数据，将各类用户主成分变量作为自组织竞争神经网络的输入参数进行用户用电行为分类分析，得到考虑用户可调节潜力的二次聚类结果。通过二次聚类，将一次聚类得到的k类不同负荷特性的用户又分为可调节潜力从强到弱的m类。而k类用户中存在偏离聚类中心较远的点，即偏离点，采用BiGRU神经网络反向调整聚类结果。以自组织竞争神经网络的二次聚类结果作为BiGRU神经网络的训练数据集。经BiGRU神经网络反向调节后，将产生修正的用户，能够将用电行为特性相对随机的用户进行精准聚类，最终确定所述负荷样本的类别，如代表负荷特性的第k类中的可调节潜力第m类。

本发明实施例提供一种面向电力用户负荷特性和可调节潜力的聚类方法，与现有技术相比，其有益效果如下：

采用面向用户负荷特性和可调节潜力综合聚类方法较其他常用聚类算法具有更好的聚类质量；采用BiGRU神经网络进行反向修正，解决了仅双层聚类无法识别个别用户的归类问题。

附图说明

图1为本发明实施例提供的一种面向电力用户负荷特性和可调节潜力的聚类方法流程图；

图2为本发明实施例提供的一种面向电力用户负荷特性和可调节潜力的聚类方法OPTICS算法流程图。

图3为本发明实施例提供的一种面向电力用户负荷特性和可调节潜力的聚类方法PCA-SOM算法流程图。

具体实施方式

以下通过具体实施例对本发明做进一步解释说明。

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

参见图1～3，本发明实施例提供一种面向电力用户负荷特性和可调节潜力的聚类方法，该方法包括：

采用OPTICS算法的一次聚类结果可以得到k类具有类内相似性和类间各异性的用户群体。针对用户基础信息采集数据，将各类用户主成分变量作为自组织竞争神经网络的输入参数进行用户用电行为分类分析，得到考虑用户可调节潜力的二次聚类结果。通过二次聚类，将一次聚类得到的k类不同负荷特性的用户又分为可调节潜力从强到弱的m类。而k类用户中存在偏离聚类中心较远的点，即偏离点，采用BiGRU神经网络反向调整聚类结果。以自组织竞争神经网络的二次聚类结果作为BiGRU神经网络的训练数据集。经BiGRU神经网络反向调节后，将产生修正的用户，能够将用电行为特性相对随机的用户进行精准聚类，最终确定所述负荷样本的类别，如代表负荷特性的第k类中的可调节潜力第m类。

实施例：

1、获取智能电表采集的用户负荷数据以及通过调查问卷采集的用户用电行为影响因素基础信息。

其中，用电负荷数据包括：负荷用电峰值P_max、负荷用电谷值P_min、负荷平均用电功率和负荷最大利用小时数Γ，其中，

2、用电负荷数据预处理

3、通过调查问卷采集用户用电行为影响因素

包括：自我影响因素：用户用电模式、用户响应意愿、用户行为偏好；自然环境影响因素：温度变化、湿度变化、风力变化；社会环境影响因素：社会阶层、职业薪酬、家庭情况。

4、利用OPTICS聚类方法对用电负荷数据进行一次聚类

步骤包括：

1)标记数据集D中所有样本点均为未处理点，设置参数邻域半径ε以及点数MinPts。

2)创建有序队列和结果队列，其中结果队列用来存储样本的输出顺序。

3)若样本数据集D中的所有样本点均被标记为已处理，则算法结束。否则选取一个核心对象，将其直接密度可达点放入有序队列中，并依据可达距离升序排序。

4)若有序队列中已无样本点，则跳转步骤2，否则将有序队列的第一个点放入结果队列中，并做以下操作：如果该点不是核心对象则返回步骤4，反之则记录该点所有的密度可达点；若直接密度可达点已在结果队列中，则忽略；若在有序队列中，则在新旧可达距离中选择更小的可达距离记录，并按距离远近依次排序；若不在两个队列中，则在有序队列中插入该点并排序。

5)迭代步骤3、4直至算法结束，按顺序输出结果队列中的所有样本点及其对应的可达距离。

6)绘制坐标图，其中x轴是OPTICS算法处理点的先后顺序，y轴是点的最小可达性距离。在y轴上选定阈值，根据具体情况，确定恰当的阈值，以提取聚类，得到N类用户群体。

4、选取PCA对用户用电行为多维影响因素数据进行特征降维

公式包括：

其中，矩阵X的p项指标中的数组做线性组合得：

具体步骤包括：

1)根据公式首先得到原始数据矩阵X；

2)计算均值

3)计算出协方差矩阵；

4)计算出协方差矩阵的特征向量和特征值；

5)确定主成分。

5、用户用电行为影响因素多维提取主成分时，选取特征值大于1及累计方差贡献率达到85％以上的前k个特征指标，其累计贡献率表示为：将降维后的主成分作为二次聚类的输入层。

6、采用SOM网络对用户可调潜力进行二次聚类

步骤包括：

1)向量归一化。将SOM网络的输入向量，即经过PCA特征降维后的主成分向量Z。

2)寻找获胜节点。当网络得到一个Z时，竞争层的所有W_ij均与Z进行相似性比较，将和Z相似性最大的W_ij判定为竞争获胜节点，记为W_c。其中，相似性的度量通过计算W_ij和Z的欧氏距离(或夹角余弦)确定。

||Z-W_c||＝min{d_j}

3)参数调整W_ij。

W_ij(t+1)＝W_ij(t)+η(t)h_c,j(t)(Z_i-W_ij(t))

7、BiGRU神经网络反向修正一次聚类结果

基于反向修正原理，将二次聚类结果作为BiGRU神经网络的训练数据集，将个别用户种类进行调整，得到更为精准的聚类结果，反向修正一次聚类结果，对一次聚类结果进行调节，计算公式包括：

8、模型性能评估

采取DB指数(davies-bouldin index，DBI)和轮廓系数(silhouettecoefficient，SI)作为用户负荷特性和可调节潜力综合聚类结果的评价性指标，计算公式包括：

对于本领域技术人员而言，显然本发明不限于上述示范性实施例的细节，而且在不背离本发明的精神或基本特征的情况下，能够以其他的具体形式实现本发明。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本发明的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

此外，应当理解，虽然本说明书按照实施方式加以描述，但并非每个实施方式仅包含一个独立的技术方案，说明书的这种叙述方式仅仅是为清楚起见，本领域技术人员应当将说明书作为一个整体，各实施例中的技术方案也可以经适当组合，形成本领域技术人员可以理解的其他实施方式。

Claims

1.一种面向电力用户负荷特性和可调节潜力的聚类方法，其特征在于，包括：

S1、获取智能电表采集的用户负荷数据以及通过调查问卷采集的用户用电行为影响因素基础信息；

S2、利用OPTICS聚类方法对用电负荷数据进行一次聚类，得到N类用户群体，获得负荷样本一次聚类结果；

S3、采用PCA将用户用电行为影响因素数据进行特征降维，并将降维后的主成分作为二次聚类的输入层；

S4、针对同类型的用电负荷特性用户群进行二次聚类，利用自组织竞争神经网络(SOM)的模式分类性能得到考虑用户可调节潜力的二次聚类结果；

S5、基于反向修正原理，将二次聚类结果作为BiGRU神经网络的训练数据集，反向修正一次聚类结果，随后重复二次聚类流程，得到最终的考虑用户负荷特性和可调节潜力的综合聚类结果，确定所述负荷样本的类别。

2.根据权利要求1所述的一种面向电力用户负荷特性和可调节潜力的聚类方法，其特征在于，所述S1中，用电负荷数据包括：

3.根据权利要求1所述的一种面向电力用户负荷特性和可调节潜力的聚类方法，其特征在于，所述S1中，还包括对电力负荷数据的预处理，其包括：

S11、从数据集中随机选取多个特征值来构成特征空间；

S12、在选取特征内的最大值和最小值之间随机分割值形成分区，构建孤立树；

S13、将构建的孤立树组成iForest；

S14、计算每一个点的异常得分。根据负荷数据特点设定相应的阈值，从而判断数据的异常与否，并对异常数据进行修正。修正方法为采用多阶拉格朗日内插值法计算异常数据近邻正常数据的均值进行替代。

4.根据权利要求1所述的一种面向电力用户负荷特性和可调节潜力的聚类方法，其特征在于，所述S1中，用户用电行为影响因素包括：

5.根据权利要求1所述的一种面向电力用户负荷特性和可调节潜力的聚类方法，其特征在于，所述S2中，利用OPTICS聚类方法对用电负荷数据进行一次聚类具体步骤包括：

S21、标记数据集D中所有样本点均为未处理点，设置参数邻域半径ε以及点数MinPts。

S22、创建有序队列和结果队列，其中结果队列用来存储样本的输出顺序。

S23、若样本数据集D中的所有样本点均被标记为已处理，则算法结束。否则选取一个核心对象，将其直接密度可达点放入有序队列中，并依据可达距离升序排序。

S24、若有序队列中已无样本点，则跳转S22，否则将有序队列的第一个点放入结果队列中，并做以下操作：如果该点不是核心对象则返回S24，反之则记录该点所有的密度可达点；若直接密度可达点已在结果队列中，则忽略；若在有序队列中，则在新旧可达距离中选择更小的可达距离记录，并按距离远近依次排序；若不在两个队列中，则在有序队列中插入该点并排序。

S25、迭代S23、S24直至算法结束，按顺序输出结果队列中的所有样本点及其对应的可达距离。

S26、绘制坐标图，其中x轴是OPTICS算法处理点的先后顺序，y轴是点的最小可达性距离。在y轴上选定阈值，根据具体情况，确定恰当的阈值，以提取聚类，得到N类用户群体。

6.根据权利要求1所述的一种面向电力用户负荷特性和可调节潜力的聚类方法，其特征在于，所述S3中，选取PCA对用户用电行为多维影响因素数据进行特征降维，公式包括：

设共有n个电力用户，每个用户的用电行为影响因素数据有p项指标，X₁,X₂,...,X_P为初始设置的随机变量的集合，得到原始数据的矩阵X为：

其中，矩阵X的p项指标中的数组做线性组合得：

式中：a_ip为系数，且满足i＝1,2,...,p；x₁,x₂,...,x_p为各项指标的对应的值；F₁,F₂,...,F_p为新的不相关变量。

具体步骤包括：

S31、根据公式首先得到原始数据矩阵X；

S32、计算均值

S33、计算出协方差矩阵；

S34、计算出协方差矩阵的特征向量和特征值；

S35、确定主成分。

7.根据权利要求1所述的一种面向电力用户负荷特性和可调节潜力的聚类方法，其特征在于，所述S3中，用户用电行为影响因素多维提取主成分时，选取特征值大于1及累计方差贡献率达到85％以上的前k个特征指标，其累计贡献率表示为：将降维后的主成分作为二次聚类的输入层。

8.根据权利要求1所述的一种面向电力用户负荷特性和可调节潜力的聚类方法，其特征在于，所述S4中，采用SOM网络对用户可调潜力进行二次聚类的步骤包括：

S41、向量归一化。将SOM网络的输入向量，即经过PCA特征降维后的主成分向量Z。

S42、寻找获胜节点。当网络得到一个Z时，竞争层的所有W_ij均与Z进行相似性比较，将和Z相似性最大的W_ij判定为竞争获胜节点，记为W_c。其中，相似性的度量通过计算W_ij和Z的欧氏距离(或夹角余弦)确定。

||Z-W_c||＝min{d_j}

S43、参数调整W_ij。

W_ij(t+1)＝W_ij(t)+η(t)h_c,j(t)(Z_i-W_ij(t))

S44、S43完成后需要返回S41继续训练，当η(t)衰减至0或规定的值时，所有样本训练完成。训练结束后，输出编号一样的神经元就代表了特征上相似的类别，可以划分为同一类。

9.根据权利要求1所述的一种面向电力用户负荷特性和可调节潜力的聚类方法，其特征在于，所述S5中，基于反向修正原理，将二次聚类结果作为BiGRU神经网络的训练数据集，将个别用户种类进行调整，得到更为精准的聚类结果，反向修正一次聚类结果，对一次聚类结果进行调节，计算公式包括：

10.根据权利要求1所述的一种面向电力用户负荷特性和可调节潜力的聚类方法，其特征在于，所述S5中，采取DB指数(davies-bouldin index，DBI)和轮廓系数(silhouettecoefficient，SI)作为用户负荷特性和可调节潜力综合聚类结果的评价性指标，计算公式包括：

所述基于电力负荷数据及用户基础信息采集数据的OPTICS-SOM-BiGRU模型得到精准聚类结果的步骤，包括：