CN107918779A - 一种构建多元负荷聚类模型方法及系统 - Google Patents
一种构建多元负荷聚类模型方法及系统 Download PDFInfo
- Publication number
- CN107918779A CN107918779A CN201710650688.1A CN201710650688A CN107918779A CN 107918779 A CN107918779 A CN 107918779A CN 201710650688 A CN201710650688 A CN 201710650688A CN 107918779 A CN107918779 A CN 107918779A
- Authority
- CN
- China
- Prior art keywords
- data
- polynary
- load
- mrow
- cluster
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 27
- 230000002776 aggregation Effects 0.000 claims abstract description 21
- 238000004220 aggregation Methods 0.000 claims abstract description 21
- 239000000178 monomer Substances 0.000 claims abstract description 10
- 238000004458 analytical method Methods 0.000 claims abstract description 8
- 238000007621 cluster analysis Methods 0.000 claims abstract description 7
- 239000011159 matrix material Substances 0.000 claims description 27
- 238000004146 energy storage Methods 0.000 claims description 20
- 238000010248 power generation Methods 0.000 claims description 19
- 230000003399 chemotactic effect Effects 0.000 claims description 8
- 230000005611 electricity Effects 0.000 claims description 5
- 238000010276 construction Methods 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims 1
- 238000000605 extraction Methods 0.000 abstract description 5
- 238000010586 diagram Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 4
- 235000006508 Nelumbo nucifera Nutrition 0.000 description 3
- 240000002853 Nelumbo nucifera Species 0.000 description 3
- 235000006510 Nelumbo pentapetala Nutrition 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000007417 hierarchical cluster analysis Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
- G06F18/24137—Distances to cluster centroïds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Economics (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种构建多元负荷聚类模型方法包括:采集用户基本信息以及多元负荷数据;对用户基本信息以及多元负荷数据进行预处理,得到能够进行聚类分析的数据集合;对多元负荷分别进行模糊C均值聚类,确定多元负荷数据对应的多个聚类结果;根据确定聚类结果分别对多元负荷分析负荷单体特性,并进行层次聚类得到多元负荷资源聚集模型。可见本发明提供的构建多元负荷聚类模型方法,通过对用户基本信息以及多元负荷数据作为模型输入数据,对数据预处理后通过模糊C均值聚类和层次聚类算法生成多元负荷聚集模型;可实现负荷单体特征提取和多元负荷聚集特征提取;并解决了传统数据聚类方法对海量负荷数据不能进行统一建模的问题。
Description
技术领域
本发明涉及数据处理领域,特别是指一种构建多元负荷聚类模型方法及系统。
背景技术
传统用户侧资源的负荷建模,主要是对电力负荷建模,其中使用最多的是模糊C均值聚类算法(FCM),FCM是一种无监督的分类算法。通过FCM聚类算法是一种柔性的模糊划分可以解决传统聚类硬化分的确定,对负荷进行分类,分析负荷特性,在电力负荷特性分类、电网连锁故障预警等领域已有了较好的应用。
但是用户侧资源不仅包括电力负荷,还包括分布式发电、储能装置等负荷,具有多样性、分散性、随机性等特征,如何对多元负荷建立一个统一模型来表征负荷资源特性较为困难;用户侧资源单体特性和聚合特性的不确定性,也成为多元负荷资源负荷建模的研究难点;另外,随着负荷资源的多样化,多元负荷资源的海量数据使得传统的数据处理方法已不再适用。
发明内容
有鉴于此,本发明的目的在于提出一种适合处理多元负荷资源数据的构建多元负荷聚类模型方法及系统。
基于上述目的本发明提供的构建多元负荷聚类模型方法,包括:
采集用户基本信息以及多元负荷数据;
对用户基本信息以及多元负荷数据进行预处理,得到能够进行聚类分析的数据集合;
对多元负荷分别进行模糊C均值聚类,确定多元负荷数据对应的多个聚类结果;
根据确定的多个聚类结果分别对多元负荷分析负荷单体特性;
根据确定的多个聚类结果进行层次聚类得到多元负荷资源聚集模型。
优选的,所述对用户基本信息以及多元负荷数据进行预处理包括:
将采集到的数据去除不合理数据;
对剩余数据进行归一化处理,包括:同趋化处理和无量纲化处理。
优选的,所述对多元负荷分别进行模糊C均值聚类,确定多元负荷数据对应的多个聚类结果包括:
将经过归一化的数据集X=[x1,x2,……,xn]分为c个模糊组,并求每组的聚类中心C:
模糊c划分可用矩阵U=[uij]表示,其中矩阵U的元素uij表示第j(j=1,2,……,n)个数据点属于第i(i=1,2,……,c)类的隶属度;
uij满足以下条件:
根据每个给定数据点用值在0和1间的隶属度来确定其属于各个组的程,模糊C均值聚类的目标函数就是所有各点隶属度乘以该点与中心的欧式距离之和,模糊C均值聚类算法就是求使聚类的目标函数最小化的划分矩阵U和聚类中心C,即:
dij(xj,vi)=||vi-xj||
其中,n是样本数据集的个数,c是聚类中心数,m为加权指数,dij是样本点和聚类中心的欧式距离。
优选的,所述用户基本信息包括:用户所属区域、是否私变台区和行业分类信息;
所述多元负荷数据包括:用户电力负荷、分布式发电以及储能装置数据。
优选的,所述对多元负荷分别进行模糊C均值聚类包括:
对用户基本信息以及用户电力负荷数据进行模糊C均值聚类,计算每个用户属于每种分类的隶属度,可用矩阵U1=[uij]表示,其中矩阵U1的元素[uij]表示第j(j=1,2,……,n)个用户属于第i(i=1,2,……,c1)类的隶属度,c1是用户电力负荷聚类总数;
对用户基本信息以及分布式发电数据进行模糊C均值聚类,计算每个用户属于每种分类的隶属度,可用矩阵U2=[uij]表示,其中矩阵U2的元素[uij]表示第j(j=1,2,……,n)个用户属于第i(i=1,2,……,c2)类的隶属度,c2是分布式发电聚类总数;
对用户基本信息以及用户储能数据进行模糊C均值聚类,计算每个用户属于每种分类的隶属度,可用矩阵U3=[uij]表示,其中矩阵U3的元素uij表示第j(j=1,2,……,n)个用户属于第i(i=1,2,……,c3)类的隶属度,c3是用户储能数据聚类总数。
优选的,所述用户电力负荷数据包括:正向有功总、正向有功尖、正向有功峰、正向有功平、正向有功谷以及用户容量;
所述分布式发电数据包括:电动汽车总负荷、并网方式以及光伏发电电量;
储能数据包括:设备容量、并网方式以及用电量信息。
优选的,所述根据确定的多个聚类结果进行层次聚类得到多元负荷资源聚集模型包括:
计算n个对象两两之间的距离;
构造n个单成员聚类C1,C2,……,Cn,每一类的高度都为0;
找到两个最近的聚类Ci,Cj,合并Ci和Cj,聚类的个数减少1,以被合并两个类间距作为上层的高度;
计算新生成的聚类与本层中其他聚类的间距,如果满足终止条件,算法结束,否则返回执行步骤:找到两个最近的聚类Ci,Cj,进行合并,聚类的个数减少1,以被合并两个类间距作为上层的高度。
另一方面,本发明还提供构建多元负荷聚类模型系统,包括:
采集数据单元:用于采集用户基本信息以及多元负荷数据;
数据处理单元:用于对用户基本信息以及多元负荷数据进行预处理,得到能够进行聚类分析的数据集合;
构建模型单元:用于对多元负荷分别进行模糊C均值聚类,确定多元负荷数据对应的多个聚类结果,以及用于根据确定的多个聚类结果分别对多元负荷分析负荷单体特性,根据确定的多个聚类结果进行层次聚类得到多元负荷资源聚集模型。
优选的,所述数据处理单元包括:
去除数据模块,用于将采集到的数据去除不合理数据;
归一化数据模块,用于对剩余数据进行归一化处理,包括:同趋化处理和无量纲化处理。
优选的,所述用户基本信息包括:用户所属区域、是否私变台区和行业分类信息;
所述多元负荷数据包括:用户电力负荷、分布式发电以及储能装置数据。
从上面所述可以看出,本发明提供的构建多元负荷聚类模型方法,通过对用户基本信息以及多元负荷数据作为模型输入数据,对数据预处理后,通过模糊C均值聚类和层次聚类两种聚类算法生成多元负荷资源聚集模型;可实现负荷单体特征提取和多元负荷资源聚集特征提取;并解决了传统数据聚类方法对海量负荷数据不能进行统一建模的问题。
附图说明
图1为本发明提供的构建多元负荷聚类模型方法的实施例流程图;
图2为本发明提供的构建多元负荷聚类模型实施例示意图;
图3为本发明提供的构建多元负荷聚类模型系统的实施例示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照,图1为本发明提供的构建多元负荷聚类模型方法的实施例流程图,以及图2为构建的模型示意图,对本发明进一步详细说明。
本发明提供的构建所述构建多元负荷聚类模型方法包括:
步骤101,采集用户基本信息以及多元负荷数据。
步骤102,对用户基本信息以及多元负荷数据进行预处理,得到能够进行聚类分析的数据集合。
步骤103,对多元负荷分别进行模糊C均值聚类,确定多元负荷数据对应的多个聚类结果。
步骤104,根据确定的多个聚类结果分别对多元负荷分析负荷单体特性。
步骤105,根据确定的多个聚类结果进行层次聚类得到多元负荷资源聚集模型。
可见本发明提供的构建多元负荷聚类模型方法,通过对用户基本信息以及多元负荷数据作为模型输入数据,对数据预处理后,通过模糊C均值聚类和层次聚类两种聚类算法生成多元负荷资源聚集模型;可实现负荷单体特征提取和多元负荷资源聚集特征提取;并解决了传统数据聚类方法对海量负荷数据不能进行统一建模的问题。
其中,步骤101,采集用户基本信息以及多元负荷数据中:
所述用户基本信息,记为Xup={x11,x12,……,x1n},x11,x12,……,x1n为不同用户基本信息数据值;所述用户基本信息包括:用户所属区域、是否私变台区和行业分类信息等,
所述多元负荷数据包括:用户电力负荷数据,记为Xel={x21,x22,……,x2m};分布式发电数据,记为Xdg={x31,x32,……,x3t};以及储能装置数据,记为Xes={x41,x42,……,x4s}。
更详细的,所述用户电力负荷数据包括:正向有功总、正向有功尖、正向有功峰、正向有功平、正向有功谷以及用户容量;
所述分布式发电数据包括:电动汽车总负荷、并网方式以及光伏发电电量;
储能数据包括:设备容量、并网方式以及用电量信息。
进一步的,步骤102,对用户基本信息以及多元负荷数据进行预处理,包括:
将采集到的数据去除不合理数据。
对剩余数据进行并进行标准化处理,也称为归一化处理,包括:同趋化处理和无量纲化处理,得到能够进行聚类分析的数据集合。
数据同趋化处理主要解决不同性质数据问题,对不同性质指标须先考虑改变逆指标数据性质,使所有指标对测评方案的作用力同趋化,再加总才能得出正确结果;数据无量纲化处理主要解决各个变量的单位和数量级不一样的问题,或称为数据的可比性。
进一步的,步骤103,对多元负荷分别进行模糊C均值聚类,确定多元负荷数据对应的多个聚类结果,包括:
将经过归一化的数据集X=[x1,x2,……,xn]分为c个模糊组,并求每组的聚类中心C:
模糊c划分可用矩阵U=[uij]表示,其中矩阵U的元素uij表示第j(j=1,2,……,n)个数据点属于第i(i=1,2,……,c)类的隶属度;
uij满足以下条件:
根据每个给定数据点用值在0和1间的隶属度来确定其属于各个组的程,模糊C均值聚类的目标函数就是所有各点隶属度乘以该点与中心的欧式距离之和,模糊C均值聚类算法就是求使聚类的目标函数最小化的划分矩阵U和聚类中心C,即:
dij(xj,vi)=||vi-xj||
其中,n是样本数据集的个数,c是聚类中心数,m为加权指数,dij是样本点和聚类中心的欧式距离。
具体的,对用户基本信息以及用户电力负荷数据进行模糊C均值聚类,计算每个用户属于每种分类的隶属度,可用矩阵U1=[uij]表示,其中矩阵U1的元素[uij]表示第j(j=1,2,……,n)个用户属于第i(i=1,2,……,c1)类的隶属度,c1是用户电力负荷聚类总数;
对用户基本信息以及分布式发电数据进行模糊C均值聚类,计算每个用户属于每种分类的隶属度,可用矩阵U2=[uij]表示,其中矩阵U2的元素[uij]表示第j(j=1,2,……,n)个用户属于第i(i=1,2,……,c2)类的隶属度,c2是分布式发电聚类总数;
对用户基本信息以及用户储能数据进行模糊C均值聚类,计算每个用户属于每种分类的隶属度,可用矩阵U3=[uij]表示,其中矩阵U3的元素uij表示第j(j=1,2,……,n)个用户属于第i(i=1,2,……,c3)类的隶属度,c3是用户储能数据聚类总数。
进一步的,步骤105,所述根据确定的多个聚类结果进行层次聚类得到多元负荷资源聚集模型包括:
将获得的聚类结果U1=[uij]、U2=[uij]、U3=[uij],进行层次聚类得到多元负荷资源聚集模型。
层次聚类法是递归地对数据对象进行合并或者分裂,直到某种终止条件满足为止,层次聚类大多采用合并法,合并法的主要思想是:给定n个对象的集合D,合并型层次聚类得到D的一系列划分:Pn,Pn-1,……,P1,其中Pn有n个单成员聚类,P1只有一个聚类,它包含所有的对象。
层次聚类及产生二分树图的基本步骤包括:
计算n个对象两两之间的距离。
构造n个单成员聚类C1,C2,……,Cn,每一类的高度都为0。
找到两个最近的聚类Ci,Cj,合并Ci和Cj,聚类的个数减少1,以被合并两个类间距作为上层的高度。
计算新生成的聚类与本层中其他聚类的间距,如果满足终止条件,算法结束,否则返回执行步骤:找到两个最近的聚类Ci,Cj,进行合并,聚类的个数减少1,以被合并两个类间距作为上层的高度。
可见本发明提供的构建多元负荷聚类模型方法,通过对用户基本信息以及用户电力负荷、分布式发电、储能装置等数据作为模型输入数据,对数据归一化处理后生成标准化数据,通过模糊C均值聚类和层次聚类两种聚类算法生成多元负荷资源聚集模型;该多元负荷聚类模型不仅可以提取用户电力负荷、分布式发电、储能装置的单体负荷特性,并且基于糊C均值聚类结果,利用层次聚类分析多元负荷资源聚集特性;解决了传统数据聚类方法对海量负荷数据不能进行统一建模的问题。
如图3所示,为本发明提供的构建多元负荷聚类模型系统的实施例示意图所述构建多元负荷聚类模型系统,包括:
采集数据单元301:用于采集用户基本信息以及多元负荷数据;
数据处理单元302:用于对用户基本信息以及多元负荷数据进行预处理,得到能够进行聚类分析的数据集合;
构建模型单元303:用于对多元负荷分别进行模糊C均值聚类,确定多元负荷数据对应的多个聚类结果,以及用于根据确定的多个聚类结果分别对多元负荷分析负荷单体特性,根据确定的多个聚类结果进行层次聚类得到多元负荷资源聚集模型。
进一步的,所述数据处理单元包括:
去除数据模块,用于将采集到的数据去除不合理数据;
归一化数据模块,用于对剩余数据进行归一化处理,包括:同趋化处理和无量纲化处理。
进一步的,所述用户基本信息包括:用户所属区域、是否私变台区和行业分类信息;
所述多元负荷数据包括:用户电力负荷、分布式发电以及储能装置数据。
可见本发明提供的构建多元负荷聚类模型方法及系统,通过对用户基本信息以及用户电力负荷、分布式发电、储能装置等数据作为模型输入数据,对数据归一化处理后生成标准化数据,通过模糊C均值聚类和层次聚类两种聚类算法生成多元负荷资源聚集模型;该多元负荷聚类模型不仅可以提取用户电力负荷、分布式发电、储能装置的单体负荷特性,并且基于糊C均值聚类结果,利用层次聚类分析多元负荷资源聚集特性;解决了传统数据聚类方法对海量负荷数据不能进行统一建模的问题。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本公开的范围(包括权利要求)被限于这些例子;在本发明的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本发明的不同方面的许多其它变化,为了简明它们没有在细节中提供。
另外,为简化说明和讨论,并且为了不会使本发明难以理解,在所提供的附图中可以示出或可以不示出与集成电路(IC)芯片和其它部件的公知的电源/接地连接。此外,可以以框图的形式示出装置,以便避免使本发明难以理解,并且这也考虑了以下事实,即关于这些框图装置的实施方式的细节是高度取决于将要实施本发明的平台的(即,这些细节应当完全处于本领域技术人员的理解范围内)。在阐述了具体细节(例如,电路)以描述本发明的示例性实施例的情况下,对本领域技术人员来说显而易见的是,可以在没有这些具体细节的情况下或者这些具体细节有变化的情况下实施本发明。因此,这些描述应被认为是说明性的而不是限制性的。
尽管已经结合了本发明的具体实施例对本发明进行了描述,但是根据前面的描述,这些实施例的很多替换、修改和变型对本领域普通技术人员来说将是显而易见的。例如,其它存储器架构(例如,动态RAM(DRAM))可以使用所讨论的实施例。
本发明的实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此,凡在本发明的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种构建多元负荷聚类模型方法,其特征在于包括:
采集用户基本信息以及多元负荷数据;
对用户基本信息以及多元负荷数据进行预处理,得到能够进行聚类分析的数据集合;
对多元负荷分别进行模糊C均值聚类,确定多元负荷数据对应的多个聚类结果;
根据确定的多个聚类结果分别对多元负荷分析负荷单体特性;
根据确定的多个聚类结果进行层次聚类得到多元负荷资源聚集模型。
2.根据权利要求1所述的构建多元负荷聚类模型方法,其特征在于,所述对用户基本信息以及多元负荷数据进行预处理包括:
将采集到的数据去除不合理数据;
对剩余数据进行归一化处理,包括:同趋化处理和无量纲化处理。
3.根据权利要求2所述的构建多元负荷聚类模型方法,其特征在于,所述对多元负荷分别进行模糊C均值聚类,确定多元负荷数据对应的多个聚类结果包括:
将经过归一化的数据集X=[x1,x2,……,xn]分为c个模糊组,并求每组的聚类中心C:
模糊c划分可用矩阵U=[uij]表示,其中矩阵U的元素uij表示第j(j=1,2,……,n)个数据点属于第i(i=1,2,……,c)类的隶属度;
uij满足以下条件:
<mrow>
<mo>&ForAll;</mo>
<mi>j</mi>
<mo>,</mo>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>c</mi>
</munderover>
<msub>
<mi>u</mi>
<mrow>
<mi>i</mi>
<mi>j</mi>
</mrow>
</msub>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mrow>
<mo>&ForAll;</mo>
<mi>i</mi>
<mo>,</mo>
<mi>j</mi>
<mo>,</mo>
<msub>
<mi>u</mi>
<mrow>
<mi>i</mi>
<mi>j</mi>
</mrow>
</msub>
<mo>&Element;</mo>
<mo>&lsqb;</mo>
<mn>0</mn>
<mo>,</mo>
<mn>1</mn>
<mo>&rsqb;</mo>
</mrow>
<mrow>
<mo>&ForAll;</mo>
<mi>i</mi>
<mo>,</mo>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>j</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>n</mi>
</munderover>
<msub>
<mi>u</mi>
<mrow>
<mi>i</mi>
<mi>j</mi>
</mrow>
</msub>
<mo>></mo>
<mn>0</mn>
</mrow>
根据每个给定数据点用值在0和1间的隶属度来确定其属于各个组的程,模糊C均值聚类的目标函数就是所有各点隶属度乘以该点与中心的欧式距离之和,模糊C均值聚类算法就是求使聚类的目标函数最小化的划分矩阵U和聚类中心C,即:
<mrow>
<mo>(</mo>
<mi>min</mi>
<mo>)</mo>
<msub>
<mi>J</mi>
<mi>m</mi>
</msub>
<mo>(</mo>
<mi>U</mi>
<mo>,</mo>
<mi>C</mi>
<mo>)</mo>
<mo>=</mo>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>j</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>n</mi>
</munderover>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>c</mi>
</munderover>
<msubsup>
<mi>u</mi>
<mrow>
<mi>i</mi>
<mi>j</mi>
</mrow>
<mi>m</mi>
</msubsup>
<msubsup>
<mi>d</mi>
<mrow>
<mi>i</mi>
<mi>j</mi>
</mrow>
<mn>2</mn>
</msubsup>
<mo>(</mo>
<msub>
<mi>x</mi>
<mi>j</mi>
</msub>
<mo>,</mo>
<msub>
<mi>c</mi>
<mi>i</mi>
</msub>
<mo>)</mo>
</mrow>
dij(xj,vi)=||vi-xj||
其中,n是样本数据集的个数,c是聚类中心数,m为加权指数,dij是样本点和聚类中心的欧式距离。
4.根据权利要求3所述的构建多元负荷聚类模型方法,其特征在于,所述用户基本信息包括:用户所属区域、是否私变台区和行业分类信息;
所述多元负荷数据包括:用户电力负荷、分布式发电以及储能装置数据。
5.根据权利要求4所述的构建多元负荷聚类模型方法,其特征在于,所述对多元负荷分别进行模糊C均值聚类包括:
对用户基本信息以及用户电力负荷数据进行模糊C均值聚类,计算每个用户属于每种分类的隶属度,可用矩阵U1=[uij]表示,其中矩阵U1的元素[uij]表示第j(j=1,2,……,n)个用户属于第i(i=1,2,……,c1)类的隶属度,c1是用户电力负荷聚类总数;
对用户基本信息以及分布式发电数据进行模糊C均值聚类,计算每个用户属于每种分类的隶属度,可用矩阵U2=[uij]表示,其中矩阵U2的元素[uij]表示第j(j=1,2,……,n)个用户属于第i(i=1,2,……,c2)类的隶属度,c2是分布式发电聚类总数;
对用户基本信息以及用户储能数据进行模糊C均值聚类,计算每个用户属于每种分类的隶属度,可用矩阵U3=[uij]表示,其中矩阵U3的元素uij表示第j(j=1,2,……,n)个用户属于第i(i=1,2,……,c3)类的隶属度,c3是用户储能数据聚类总数。
6.根据权利要求5所述的构建多元负荷聚类模型方法,其特征在于,所述用户电力负荷数据包括:正向有功总、正向有功尖、正向有功峰、正向有功平、正向有功谷以及用户容量;
所述分布式发电数据包括:电动汽车总负荷、并网方式以及光伏发电电量;
储能数据包括:设备容量、并网方式以及用电量信息。
7.根据权利要求5所述的构建多元负荷聚类模型方法,其特征在于,所述根据确定的多个聚类结果进行层次聚类得到多元负荷资源聚集模型包括:
计算n个对象两两之间的距离;
构造n个单成员聚类C1,C2,……,Cn,每一类的高度都为0;
找到两个最近的聚类Ci,Cj,合并Ci和Cj,聚类的个数减少1,以被合并两个类间距作为上层的高度;
计算新生成的聚类与本层中其他聚类的间距,如果满足终止条件,算法结束,否则返回执行步骤:找到两个最近的聚类Ci,Cj,进行合并,聚类的个数减少1,以被合并两个类间距作为上层的高度。
8.一种构建多元负荷聚类模型系统,其特征在于包括:
采集数据单元:用于采集用户基本信息以及多元负荷数据;
数据处理单元:用于对用户基本信息以及多元负荷数据进行预处理,得到能够进行聚类分析的数据集合;
构建模型单元:用于对多元负荷分别进行模糊C均值聚类,确定多元负荷数据对应的多个聚类结果,以及用于根据确定的多个聚类结果分别对多元负荷分析负荷单体特性,根据确定的多个聚类结果进行层次聚类得到多元负荷资源聚集模型。
9.根据权利要求8所述的构建多元负荷聚类模型系统,其特征在于,所述数据处理单元包括:
去除数据模块,用于将采集到的数据去除不合理数据;
归一化数据模块,用于对剩余数据进行归一化处理,包括:同趋化处理和无量纲化处理。
10.根据权利要求8所述的构建多元负荷聚类模型系统,其特征在于,所述用户基本信息包括:用户所属区域、是否私变台区和行业分类信息;
所述多元负荷数据包括:用户电力负荷、分布式发电以及储能装置数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710650688.1A CN107918779A (zh) | 2017-08-02 | 2017-08-02 | 一种构建多元负荷聚类模型方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710650688.1A CN107918779A (zh) | 2017-08-02 | 2017-08-02 | 一种构建多元负荷聚类模型方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107918779A true CN107918779A (zh) | 2018-04-17 |
Family
ID=61898556
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710650688.1A Pending CN107918779A (zh) | 2017-08-02 | 2017-08-02 | 一种构建多元负荷聚类模型方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107918779A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109902949A (zh) * | 2019-02-22 | 2019-06-18 | 云南电网有限责任公司 | 一种需求响应资源分类方法 |
CN111476316A (zh) * | 2020-04-28 | 2020-07-31 | 福建师范大学 | 一种基于云计算下电力负荷特征数据均值聚类的方法及系统 |
CN111833171A (zh) * | 2020-03-06 | 2020-10-27 | 北京芯盾时代科技有限公司 | 异常操作检测和模型训练方法、装置以及可读存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090158074A1 (en) * | 2007-12-12 | 2009-06-18 | Electronics And Telecommunications Research Institute | Cluster system with reduced power consumption and power management method thereof |
CN101478157A (zh) * | 2008-10-13 | 2009-07-08 | 宁波电业局 | 自动发电控制系统及其负荷预测自动综合的优化方法 |
CN103106344A (zh) * | 2013-01-30 | 2013-05-15 | 河海大学 | 一种建立电力系统聚类负荷模型的方法 |
CN103559655A (zh) * | 2013-11-15 | 2014-02-05 | 哈尔滨工业大学 | 基于数据挖掘的微网新型馈线负荷的预测方法 |
TW201410056A (zh) * | 2012-08-17 | 2014-03-01 | Univ Nat Taipei Technology | 無線感測網路之階層式群集方法及系統 |
CN105631483A (zh) * | 2016-03-08 | 2016-06-01 | 国家电网公司 | 一种短期用电负荷预测方法及装置 |
CN105701554A (zh) * | 2014-11-28 | 2016-06-22 | 国家电网公司 | 基于海量计量数据的用电设备能效混沌分析方法 |
CN106169773A (zh) * | 2016-08-29 | 2016-11-30 | 上海交通大学 | 含分布式发电设备的智能配电网供电优化方法 |
-
2017
- 2017-08-02 CN CN201710650688.1A patent/CN107918779A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090158074A1 (en) * | 2007-12-12 | 2009-06-18 | Electronics And Telecommunications Research Institute | Cluster system with reduced power consumption and power management method thereof |
CN101478157A (zh) * | 2008-10-13 | 2009-07-08 | 宁波电业局 | 自动发电控制系统及其负荷预测自动综合的优化方法 |
TW201410056A (zh) * | 2012-08-17 | 2014-03-01 | Univ Nat Taipei Technology | 無線感測網路之階層式群集方法及系統 |
CN103106344A (zh) * | 2013-01-30 | 2013-05-15 | 河海大学 | 一种建立电力系统聚类负荷模型的方法 |
CN103559655A (zh) * | 2013-11-15 | 2014-02-05 | 哈尔滨工业大学 | 基于数据挖掘的微网新型馈线负荷的预测方法 |
CN105701554A (zh) * | 2014-11-28 | 2016-06-22 | 国家电网公司 | 基于海量计量数据的用电设备能效混沌分析方法 |
CN105631483A (zh) * | 2016-03-08 | 2016-06-01 | 国家电网公司 | 一种短期用电负荷预测方法及装置 |
CN106169773A (zh) * | 2016-08-29 | 2016-11-30 | 上海交通大学 | 含分布式发电设备的智能配电网供电优化方法 |
Non-Patent Citations (4)
Title |
---|
PU WANG 等: "Electric load forecasting with recency effect: A big data approach", 《INTERNATIONAL JOURNAL OF FORECASTING》 * |
施培蓓: "数据挖掘技术中聚类算法的研究", 《中国优秀硕士学位论文全文数据库-信息科技辑》 * |
朱红等: "变粒度二次聚类方法", 《山东大学学报(工学版)》 * |
王珂 等: "基于二次聚类的电力负荷异常数据辨识", 《研究与开发》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109902949A (zh) * | 2019-02-22 | 2019-06-18 | 云南电网有限责任公司 | 一种需求响应资源分类方法 |
CN111833171A (zh) * | 2020-03-06 | 2020-10-27 | 北京芯盾时代科技有限公司 | 异常操作检测和模型训练方法、装置以及可读存储介质 |
CN111476316A (zh) * | 2020-04-28 | 2020-07-31 | 福建师范大学 | 一种基于云计算下电力负荷特征数据均值聚类的方法及系统 |
CN111476316B (zh) * | 2020-04-28 | 2023-04-14 | 福建师范大学 | 一种基于云计算下电力负荷特征数据均值聚类的方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhou et al. | Extracting symbolic rules from trained neural network ensembles | |
CN102324038B (zh) | 一种基于数字图像的植物种类识别方法 | |
CN105760888B (zh) | 一种基于属性聚类的邻域粗糙集集成学习方法 | |
CN100595780C (zh) | 一种基于模块神经网络的手写体数字自动识别方法 | |
CN105512679A (zh) | 一种基于极限学习机的零样本分类方法 | |
CN109582782A (zh) | 一种基于用弱监督深度学习的文本聚类方法 | |
CN103728551A (zh) | 一种基于级联集成分类器的模拟电路故障诊断方法 | |
CN107918779A (zh) | 一种构建多元负荷聚类模型方法及系统 | |
CN108333468B (zh) | 一种有源配电网下不良数据的识别方法及装置 | |
CN104809658A (zh) | 一种低压配网台区线损的快速分析方法 | |
CN106778882A (zh) | 一种基于前馈神经网络的智能合约自动分类方法 | |
CN108765194A (zh) | 一种有效的居民用电行为分析系统 | |
KR20190135129A (ko) | 문서 구조와 딥러닝을 이용한 문서 분류 장치 및 방법 | |
CN102609693A (zh) | 基于模糊二维核主成分分析的人脸识别方法 | |
CN111460818A (zh) | 一种基于增强胶囊网络的网页文本分类方法及存储介质 | |
CN109858518A (zh) | 一种基于MapReduce的大型数据集聚类方法 | |
CN106067034A (zh) | 一种基于高维矩阵特征根的配电网负荷曲线聚类方法 | |
CN107194415A (zh) | 一种基于拉普拉斯中心性的峰值聚类方法 | |
CN108898273A (zh) | 一种基于形态分析的用户侧负荷特征聚类评价方法 | |
CN110288028A (zh) | 心电检测方法、系统、设备及计算机可读存储介质 | |
CN108879762A (zh) | 基于二元树复小波变换的孤岛检测方法 | |
Zhang et al. | The community detection algorithm based on the node clustering coefficient and the edge clustering coefficient | |
CN114549897A (zh) | 一种分类模型的训练方法、装置及存储介质 | |
CN102193928A (zh) | 基于多层文本分类器的轻量级本体匹配方法 | |
Li et al. | Multi-task convolutional neural network with coarse-to-fine knowledge transfer for long-tailed classification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180417 |
|
RJ01 | Rejection of invention patent application after publication |