CN107918779A

CN107918779A - 一种构建多元负荷聚类模型方法及系统

Info

Publication number: CN107918779A
Application number: CN201710650688.1A
Authority: CN
Inventors: 王丹; 李思维; 吴磊; 于建成; 田世明; 王旭东; 刘茁出; 崇志强; 刘晓丹; 岳靓; 冷曼
Original assignee: State Grid Corp of China SGCC; State Grid Information and Telecommunication Co Ltd; China Electric Power Research Institute Co Ltd CEPRI; State Grid Tianjin Electric Power Co Ltd; Beijing Guodiantong Network Technology Co Ltd; Beijing Fibrlink Communications Co Ltd
Current assignee: State Grid Corp of China SGCC; State Grid Information and Telecommunication Co Ltd; China Electric Power Research Institute Co Ltd CEPRI; State Grid Tianjin Electric Power Co Ltd; Beijing Guodiantong Network Technology Co Ltd; Beijing Fibrlink Communications Co Ltd
Priority date: 2017-08-02
Filing date: 2017-08-02
Publication date: 2018-04-17

Abstract

本发明公开了一种构建多元负荷聚类模型方法包括：采集用户基本信息以及多元负荷数据；对用户基本信息以及多元负荷数据进行预处理，得到能够进行聚类分析的数据集合；对多元负荷分别进行模糊C均值聚类，确定多元负荷数据对应的多个聚类结果；根据确定聚类结果分别对多元负荷分析负荷单体特性，并进行层次聚类得到多元负荷资源聚集模型。可见本发明提供的构建多元负荷聚类模型方法，通过对用户基本信息以及多元负荷数据作为模型输入数据，对数据预处理后通过模糊C均值聚类和层次聚类算法生成多元负荷聚集模型；可实现负荷单体特征提取和多元负荷聚集特征提取；并解决了传统数据聚类方法对海量负荷数据不能进行统一建模的问题。

Description

一种构建多元负荷聚类模型方法及系统

技术领域

本发明涉及数据处理领域，特别是指一种构建多元负荷聚类模型方法及系统。

背景技术

传统用户侧资源的负荷建模，主要是对电力负荷建模，其中使用最多的是模糊C均值聚类算法(FCM)，FCM是一种无监督的分类算法。通过FCM聚类算法是一种柔性的模糊划分可以解决传统聚类硬化分的确定，对负荷进行分类，分析负荷特性，在电力负荷特性分类、电网连锁故障预警等领域已有了较好的应用。

但是用户侧资源不仅包括电力负荷，还包括分布式发电、储能装置等负荷，具有多样性、分散性、随机性等特征，如何对多元负荷建立一个统一模型来表征负荷资源特性较为困难；用户侧资源单体特性和聚合特性的不确定性，也成为多元负荷资源负荷建模的研究难点；另外，随着负荷资源的多样化，多元负荷资源的海量数据使得传统的数据处理方法已不再适用。

发明内容

有鉴于此，本发明的目的在于提出一种适合处理多元负荷资源数据的构建多元负荷聚类模型方法及系统。

基于上述目的本发明提供的构建多元负荷聚类模型方法，包括：

采集用户基本信息以及多元负荷数据；

对用户基本信息以及多元负荷数据进行预处理，得到能够进行聚类分析的数据集合；

对多元负荷分别进行模糊C均值聚类，确定多元负荷数据对应的多个聚类结果；

根据确定的多个聚类结果分别对多元负荷分析负荷单体特性；

根据确定的多个聚类结果进行层次聚类得到多元负荷资源聚集模型。

优选的，所述对用户基本信息以及多元负荷数据进行预处理包括：

将采集到的数据去除不合理数据；

对剩余数据进行归一化处理，包括：同趋化处理和无量纲化处理。

优选的，所述对多元负荷分别进行模糊C均值聚类，确定多元负荷数据对应的多个聚类结果包括：

将经过归一化的数据集X＝[x₁,x₂,……,x_n]分为c个模糊组，并求每组的聚类中心C:

模糊c划分可用矩阵U＝[u_ij]表示，其中矩阵U的元素u_ij表示第j(j＝1,2,……,n)个数据点属于第i(i＝1,2,……,c)类的隶属度；

u_ij满足以下条件：

根据每个给定数据点用值在0和1间的隶属度来确定其属于各个组的程，模糊C均值聚类的目标函数就是所有各点隶属度乘以该点与中心的欧式距离之和，模糊C均值聚类算法就是求使聚类的目标函数最小化的划分矩阵U和聚类中心C，即：

d_ij(x_j,v_i)＝||v_i-x_j||

其中，n是样本数据集的个数，c是聚类中心数，m为加权指数，d_ij是样本点和聚类中心的欧式距离。

优选的，所述用户基本信息包括：用户所属区域、是否私变台区和行业分类信息；

所述多元负荷数据包括：用户电力负荷、分布式发电以及储能装置数据。

优选的，所述对多元负荷分别进行模糊C均值聚类包括：

对用户基本信息以及用户电力负荷数据进行模糊C均值聚类，计算每个用户属于每种分类的隶属度，可用矩阵U₁＝[u_ij]表示，其中矩阵U₁的元素[u_ij]表示第j(j＝1,2,……,n)个用户属于第i(i＝1,2,……,c₁)类的隶属度，c₁是用户电力负荷聚类总数；

对用户基本信息以及分布式发电数据进行模糊C均值聚类，计算每个用户属于每种分类的隶属度，可用矩阵U₂＝[u_ij]表示，其中矩阵U₂的元素[u_ij]表示第j(j＝1,2,……,n)个用户属于第i(i＝1,2,……,c₂)类的隶属度，c₂是分布式发电聚类总数；

对用户基本信息以及用户储能数据进行模糊C均值聚类，计算每个用户属于每种分类的隶属度，可用矩阵U₃＝[u_ij]表示，其中矩阵U₃的元素u_ij表示第j(j＝1,2,……,n)个用户属于第i(i＝1,2,……,c₃)类的隶属度，c₃是用户储能数据聚类总数。

优选的，所述用户电力负荷数据包括：正向有功总、正向有功尖、正向有功峰、正向有功平、正向有功谷以及用户容量；

所述分布式发电数据包括：电动汽车总负荷、并网方式以及光伏发电电量；

储能数据包括：设备容量、并网方式以及用电量信息。

优选的，所述根据确定的多个聚类结果进行层次聚类得到多元负荷资源聚集模型包括：

计算n个对象两两之间的距离；

构造n个单成员聚类C₁,C₂,……,C_n，每一类的高度都为0；

找到两个最近的聚类C_i，C_j，合并C_i和C_j，聚类的个数减少1，以被合并两个类间距作为上层的高度；

计算新生成的聚类与本层中其他聚类的间距，如果满足终止条件，算法结束，否则返回执行步骤：找到两个最近的聚类C_i，C_j，进行合并，聚类的个数减少1，以被合并两个类间距作为上层的高度。

另一方面，本发明还提供构建多元负荷聚类模型系统，包括：

采集数据单元：用于采集用户基本信息以及多元负荷数据；

数据处理单元：用于对用户基本信息以及多元负荷数据进行预处理，得到能够进行聚类分析的数据集合；

构建模型单元：用于对多元负荷分别进行模糊C均值聚类，确定多元负荷数据对应的多个聚类结果，以及用于根据确定的多个聚类结果分别对多元负荷分析负荷单体特性，根据确定的多个聚类结果进行层次聚类得到多元负荷资源聚集模型。

优选的，所述数据处理单元包括：

去除数据模块，用于将采集到的数据去除不合理数据；

归一化数据模块，用于对剩余数据进行归一化处理，包括：同趋化处理和无量纲化处理。

从上面所述可以看出，本发明提供的构建多元负荷聚类模型方法，通过对用户基本信息以及多元负荷数据作为模型输入数据，对数据预处理后，通过模糊C均值聚类和层次聚类两种聚类算法生成多元负荷资源聚集模型；可实现负荷单体特征提取和多元负荷资源聚集特征提取；并解决了传统数据聚类方法对海量负荷数据不能进行统一建模的问题。

附图说明

图1为本发明提供的构建多元负荷聚类模型方法的实施例流程图；

图2为本发明提供的构建多元负荷聚类模型实施例示意图；

图3为本发明提供的构建多元负荷聚类模型系统的实施例示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白，以下结合具体实施例，并参照，图1为本发明提供的构建多元负荷聚类模型方法的实施例流程图，以及图2为构建的模型示意图，对本发明进一步详细说明。

本发明提供的构建所述构建多元负荷聚类模型方法包括：

步骤101，采集用户基本信息以及多元负荷数据。

步骤102，对用户基本信息以及多元负荷数据进行预处理，得到能够进行聚类分析的数据集合。

步骤103，对多元负荷分别进行模糊C均值聚类，确定多元负荷数据对应的多个聚类结果。

步骤104，根据确定的多个聚类结果分别对多元负荷分析负荷单体特性。

步骤105，根据确定的多个聚类结果进行层次聚类得到多元负荷资源聚集模型。

可见本发明提供的构建多元负荷聚类模型方法，通过对用户基本信息以及多元负荷数据作为模型输入数据，对数据预处理后，通过模糊C均值聚类和层次聚类两种聚类算法生成多元负荷资源聚集模型；可实现负荷单体特征提取和多元负荷资源聚集特征提取；并解决了传统数据聚类方法对海量负荷数据不能进行统一建模的问题。

其中，步骤101，采集用户基本信息以及多元负荷数据中：

所述用户基本信息，记为X_up＝{x₁₁,x₁₂,……,x_1n}，x₁₁,x₁₂,……,x_1n为不同用户基本信息数据值；所述用户基本信息包括：用户所属区域、是否私变台区和行业分类信息等，

所述多元负荷数据包括：用户电力负荷数据，记为X_el＝{x₂₁,x₂₂,……,x_2m}；分布式发电数据，记为X_dg＝{x₃₁,x₃₂,……,x_3t}；以及储能装置数据，记为X_es＝{x₄₁,x₄₂,……,x_4s}。

更详细的，所述用户电力负荷数据包括：正向有功总、正向有功尖、正向有功峰、正向有功平、正向有功谷以及用户容量；

储能数据包括：设备容量、并网方式以及用电量信息。

进一步的，步骤102，对用户基本信息以及多元负荷数据进行预处理，包括：

将采集到的数据去除不合理数据。

对剩余数据进行并进行标准化处理，也称为归一化处理，包括：同趋化处理和无量纲化处理，得到能够进行聚类分析的数据集合。

数据同趋化处理主要解决不同性质数据问题，对不同性质指标须先考虑改变逆指标数据性质，使所有指标对测评方案的作用力同趋化，再加总才能得出正确结果；数据无量纲化处理主要解决各个变量的单位和数量级不一样的问题，或称为数据的可比性。

进一步的，步骤103，对多元负荷分别进行模糊C均值聚类，确定多元负荷数据对应的多个聚类结果，包括：

u_ij满足以下条件：

d_ij(x_j,v_i)＝||v_i-x_j||

具体的，对用户基本信息以及用户电力负荷数据进行模糊C均值聚类，计算每个用户属于每种分类的隶属度，可用矩阵U₁＝[u_ij]表示，其中矩阵U₁的元素[u_ij]表示第j(j＝1,2,……,n)个用户属于第i(i＝1,2,……,c₁)类的隶属度，c₁是用户电力负荷聚类总数；

进一步的，步骤105，所述根据确定的多个聚类结果进行层次聚类得到多元负荷资源聚集模型包括：

将获得的聚类结果U₁＝[u_ij]、U₂＝[u_ij]、U₃＝[u_ij]，进行层次聚类得到多元负荷资源聚集模型。

层次聚类法是递归地对数据对象进行合并或者分裂，直到某种终止条件满足为止，层次聚类大多采用合并法，合并法的主要思想是：给定n个对象的集合D，合并型层次聚类得到D的一系列划分：P_n,P_n-1,……,P₁，其中P_n有n个单成员聚类，P₁只有一个聚类，它包含所有的对象。

层次聚类及产生二分树图的基本步骤包括：

计算n个对象两两之间的距离。

构造n个单成员聚类C₁,C₂,……,C_n，每一类的高度都为0。

找到两个最近的聚类C_i，C_j，合并C_i和C_j，聚类的个数减少1，以被合并两个类间距作为上层的高度。

可见本发明提供的构建多元负荷聚类模型方法，通过对用户基本信息以及用户电力负荷、分布式发电、储能装置等数据作为模型输入数据，对数据归一化处理后生成标准化数据，通过模糊C均值聚类和层次聚类两种聚类算法生成多元负荷资源聚集模型；该多元负荷聚类模型不仅可以提取用户电力负荷、分布式发电、储能装置的单体负荷特性，并且基于糊C均值聚类结果，利用层次聚类分析多元负荷资源聚集特性；解决了传统数据聚类方法对海量负荷数据不能进行统一建模的问题。

如图3所示，为本发明提供的构建多元负荷聚类模型系统的实施例示意图所述构建多元负荷聚类模型系统，包括：

采集数据单元301：用于采集用户基本信息以及多元负荷数据；

数据处理单元302：用于对用户基本信息以及多元负荷数据进行预处理，得到能够进行聚类分析的数据集合；

构建模型单元303：用于对多元负荷分别进行模糊C均值聚类，确定多元负荷数据对应的多个聚类结果，以及用于根据确定的多个聚类结果分别对多元负荷分析负荷单体特性，根据确定的多个聚类结果进行层次聚类得到多元负荷资源聚集模型。

进一步的，所述数据处理单元包括：

去除数据模块，用于将采集到的数据去除不合理数据；

进一步的，所述用户基本信息包括：用户所属区域、是否私变台区和行业分类信息；

可见本发明提供的构建多元负荷聚类模型方法及系统，通过对用户基本信息以及用户电力负荷、分布式发电、储能装置等数据作为模型输入数据，对数据归一化处理后生成标准化数据，通过模糊C均值聚类和层次聚类两种聚类算法生成多元负荷资源聚集模型；该多元负荷聚类模型不仅可以提取用户电力负荷、分布式发电、储能装置的单体负荷特性，并且基于糊C均值聚类结果，利用层次聚类分析多元负荷资源聚集特性；解决了传统数据聚类方法对海量负荷数据不能进行统一建模的问题。

所属领域的普通技术人员应当理解：以上任何实施例的讨论仅为示例性的，并非旨在暗示本公开的范围(包括权利要求)被限于这些例子；在本发明的思路下，以上实施例或者不同实施例中的技术特征之间也可以进行组合，步骤可以以任意顺序实现，并存在如上所述的本发明的不同方面的许多其它变化，为了简明它们没有在细节中提供。

另外，为简化说明和讨论，并且为了不会使本发明难以理解，在所提供的附图中可以示出或可以不示出与集成电路(IC)芯片和其它部件的公知的电源/接地连接。此外，可以以框图的形式示出装置，以便避免使本发明难以理解，并且这也考虑了以下事实，即关于这些框图装置的实施方式的细节是高度取决于将要实施本发明的平台的(即，这些细节应当完全处于本领域技术人员的理解范围内)。在阐述了具体细节(例如，电路)以描述本发明的示例性实施例的情况下，对本领域技术人员来说显而易见的是，可以在没有这些具体细节的情况下或者这些具体细节有变化的情况下实施本发明。因此，这些描述应被认为是说明性的而不是限制性的。

尽管已经结合了本发明的具体实施例对本发明进行了描述，但是根据前面的描述，这些实施例的很多替换、修改和变型对本领域普通技术人员来说将是显而易见的。例如，其它存储器架构(例如，动态RAM(DRAM))可以使用所讨论的实施例。

本发明的实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此，凡在本发明的精神和原则之内，所做的任何省略、修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种构建多元负荷聚类模型方法，其特征在于包括：

采集用户基本信息以及多元负荷数据；

2.根据权利要求1所述的构建多元负荷聚类模型方法，其特征在于，所述对用户基本信息以及多元负荷数据进行预处理包括：

将采集到的数据去除不合理数据；

3.根据权利要求2所述的构建多元负荷聚类模型方法，其特征在于，所述对多元负荷分别进行模糊C均值聚类，确定多元负荷数据对应的多个聚类结果包括：

u_ij满足以下条件：

<mrow> <mo>&ForAll;</mo> <mi>j</mi> <mo>,</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>c</mi> </munderover> <msub> <mi>u</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>=</mo> <mn>1</mn> </mrow>

<mrow> <mo>&ForAll;</mo> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>,</mo> <msub> <mi>u</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>&Element;</mo> <mo>&lsqb;</mo> <mn>0</mn> <mo>,</mo> <mn>1</mn> <mo>&rsqb;</mo> </mrow>

<mrow> <mo>&ForAll;</mo> <mi>i</mi> <mo>,</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <msub> <mi>u</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>></mo> <mn>0</mn> </mrow>

<mrow> <mo>(</mo> <mi>min</mi> <mo>)</mo> <msub> <mi>J</mi> <mi>m</mi> </msub> <mo>(</mo> <mi>U</mi> <mo>,</mo> <mi>C</mi> <mo>)</mo> <mo>=</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <munderover> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>c</mi> </munderover> <msubsup> <mi>u</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> <mi>m</mi> </msubsup> <msubsup> <mi>d</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> <mn>2</mn> </msubsup> <mo>(</mo> <msub> <mi>x</mi> <mi>j</mi> </msub> <mo>,</mo> <msub> <mi>c</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow>

d_ij(x_j,v_i)＝||v_i-x_j||

4.根据权利要求3所述的构建多元负荷聚类模型方法，其特征在于，所述用户基本信息包括：用户所属区域、是否私变台区和行业分类信息；

5.根据权利要求4所述的构建多元负荷聚类模型方法，其特征在于，所述对多元负荷分别进行模糊C均值聚类包括：

6.根据权利要求5所述的构建多元负荷聚类模型方法，其特征在于，所述用户电力负荷数据包括：正向有功总、正向有功尖、正向有功峰、正向有功平、正向有功谷以及用户容量；

储能数据包括：设备容量、并网方式以及用电量信息。

7.根据权利要求5所述的构建多元负荷聚类模型方法，其特征在于，所述根据确定的多个聚类结果进行层次聚类得到多元负荷资源聚集模型包括：

计算n个对象两两之间的距离；

构造n个单成员聚类C₁,C₂,……,C_n，每一类的高度都为0；

8.一种构建多元负荷聚类模型系统，其特征在于包括：

采集数据单元：用于采集用户基本信息以及多元负荷数据；

9.根据权利要求8所述的构建多元负荷聚类模型系统，其特征在于，所述数据处理单元包括：

去除数据模块，用于将采集到的数据去除不合理数据；

10.根据权利要求8所述的构建多元负荷聚类模型系统，其特征在于，所述用户基本信息包括：用户所属区域、是否私变台区和行业分类信息；