CN113919449A - 基于精准模糊聚类算法的居民电力数据聚类方法及装置 - Google Patents
基于精准模糊聚类算法的居民电力数据聚类方法及装置 Download PDFInfo
- Publication number
- CN113919449A CN113919449A CN202111526678.XA CN202111526678A CN113919449A CN 113919449 A CN113919449 A CN 113919449A CN 202111526678 A CN202111526678 A CN 202111526678A CN 113919449 A CN113919449 A CN 113919449A
- Authority
- CN
- China
- Prior art keywords
- clustering
- fuzzy
- clustering algorithm
- precise
- membership
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/06—Electricity, gas or water supply
Abstract
本发明公开了基于精准模糊聚类算法的居民电力数据聚类方法及装置,该方法包括:步骤1:推导精准模糊聚类算法的目标函数,并定义精准模糊聚类中心,计算隶属矩阵,控制精准模糊聚类算法的误差,使得精准模糊聚类算法的目标函数最小;步骤2:根据评价数据集聚类方法的度量指标,选取与居民电力数据可维护性和响度指标值影响最大的每类加权方法、低耦合度方法、对每个类的响应度方法这三个度量指标算得的度量值重新组合运算,得到一个影响精准模糊隶属矩阵精度的隶属系数,从而确定精准模糊聚类算法的聚类中心,并运用精准模糊聚类算法对数据聚类。本发明提高了聚类算法的准确度和精度,聚类算法的可维护性和响度指标值也得到优化。
Description
技术领域
本发明涉及电力系统用电负荷领域,特别涉及基于精准模糊聚类算法的居民电力数据聚类方法及装置。
背景技术
居民阶梯电价自实施以来,已在一定程度上增强了居民的节能意识,改变了一些不良的用电习惯。在新的阶梯电价制度下,用户群的某些特征(如:不同的收入、家庭结构、生活习惯等)对阶梯电价将产生不同的响应,这所引起的用电行为差异将逐步显现出来,这也使得阶梯电价下的居民用电需求预测变得更加复杂。准确的用电需求预测能科学指导电网的改造与建设,有效降低电网建设成本,提高经济效益和社会效益。
阶梯电价的科学理论基础是通过市场细分的方法区分出不同特征用户群,针对不同用户群采用不同电价机制,以提高资源配置效率。传统的用电需求预测建立的是用户的平均行为模型,这类模型无法揭示各个顾客群体的不同行为,忽略了不同类型用户的用电行为差异性。因此,准确的居民电力用户聚类及捕捉各类用户用电行为特征是现阶段居民用户中期用电需求研究的2个重要方面。
模糊C均值算法已被广泛用于电力数据聚类分析,例如,CN104268402A公开了一种基于模糊C均值的电力系统负荷聚类方法,其特征是所述方法包括:步骤1:确定基于负荷构成的统计综合建模理论;步骤2:在步骤1的基础上,研究负荷建模中的聚类问题之一:行业用户的初选与精选;步骤3:在步骤1的基础上,研究负荷建模中的聚类问题之二:变电站综合负荷静特性分类与综合;步骤4:在步骤2和步骤3的基础上,确定基于模糊C均值的电力系统负荷聚类算法。CN107918779A公开了一种构建多元负荷聚类模型方法包括:采集用户基本信息以及多元负荷数据;对用户基本信息以及多元负荷数据进行预处理,得到能够进行聚类分析的数据集合;对多元负荷分别进行模糊C均值聚类,确定多元负荷数据对应的多个聚类结果;根据确定聚类结果分别对多元负荷分析负荷单体特性,并进行层次聚类得到多元负荷资源聚集模型。
传统模糊C均值算法在确定集群的隶属度方面不够精准,聚类准确性不高。
发明内容
针对现有技术中存在的问题,本发明的目的是提供基于精准模糊聚类算法的居民电力数据聚类方法及装置。
本发明提供基于精准模糊聚类算法的居民电力数据聚类方法,包括:
步骤1、使用传统模糊C聚类算法确定数据集聚类中心,推导精准模糊聚类算法的目标函数,并定义精准模糊聚类中心,计算隶属矩阵,控制精准模糊聚类算法的误差,使得精准模糊聚类算法的目标函数最小;
步骤2、根据评价数据集聚类方法的度量指标,选取与居民电力数据可维护性和响度指标值影响最大的每类加权方法、低耦合度方法、对每个类的响应度方法这三个度量指标算得的度量值重新组合运算,得到一个影响精准模糊隶属矩阵精度的隶属系数,从而确定精准模糊聚类算法的聚类中心,并运用精准模糊聚类算法对数据聚类;
进一步地,所述步骤1具体实现方法如下:
步骤1.1,对目标台区居民用户同一时间段内用电负荷进行负荷特性普查,通过对目标台区的HPLC智能电表进行数据读取,获得用户的用电数据,得到负荷特性数据。
步骤1.2,设S = (s 1 ,s 2 ,s 3 ,s 4 ,s 5, ...,s n )表示数量为n的电力数据集,D = (d 1, d 2, d 3, d 4, d 5, ...d n )表示数据集与其聚类中心的距离。从D中选择的任一d w (w=1,2,...,n)表示从数据集S中选择的s w 与其聚类中心的距离。设k为聚类簇数;然后,通过模糊聚类方法将数据集划分为聚类中心群C = (c 1, c 2, c 3, ...,c k )。
步骤1.4,聚类误差控制函数如公式(2);
式中,d w (w=1,2,...,n)表示从数据集S中选择的s w 与其聚类中心的距离
进一步地,所述步骤2的具体实现方法如下:
步骤2.1,一般的,评价数据集聚类方法有如下度量指标:wmc表示每类加权方法,dit表示继承度,noc表示子类的数量、cbo表示对象耦合度、rfc表示对每个类的响应度,lcom表示低耦合度,ca表示输出耦合度,ce表示传入耦合度,npm表示基于公共方法的数量的方法,loc表示聚类算法代码行,dam表示数据访问量,moa表示数据放大值,mfa表示功能抽象化衡量标准,cam表示类方法内聚力指数,ic表示继承性耦合度指标,cbm表示方法之间的耦合评判指标,amc表示平均方法复杂度,max cc表示最大的类耦合度,avg cc表示平均类耦合度,各度量指标的度量值用MS = (ms 1 ,ms 2 ,ms 3 ,ms 4 ,ms 5 ,...,ms t )表示,t为度量指标的个数。度量值的和用于归一化分析,以确定该数据集是否适用于参数检验。在本发明提出的精准模糊聚类算法中,根据前述度量指标定义的数据集度量值被转换为p (x, y)点;x和y的定义如公式(5),在这个公式中,x是前一半数据集度量指标的平均值,x i 是前一半各数据集各度量指标。y是后一半数据集度量指标的平均值,y i 是后一半各数据集各度量指标,因此度量指标对p(x, y)的确定起决定性作用,聚类中心的确定取决于p(x, y):
步骤2.2,通过设计公式(6)定量描述影响精准模糊隶属矩阵的隶属系数:
通过这个设计,每个隶属度值可以被以±50改变,这是通过各种试验得到的边界值。这意味着,根据数据集的各种度量指标组合,影响隶属度的最小值会发生变化。这个系数是通过用聚类软件测试数据集得到的不同度量值重新组合运算得到的,公式(6)中的wmc i 、lcom i 、rfc i 分别表示数据子集i采用每类加权方法、低耦合度方法、对每个类的响应度方法这三个度量指标算得的度量值,选取这三个度量指标作为本发明提出的精准模糊隶属矩阵生成系数的公式(6)中的运算指标,是根据目前评估聚类方法优劣的可维护性和响度指标值,以及数据测试得出的结论,这也是本发明方法的创新点,选取这三个重要度量指标作为精准模糊隶属矩阵隶属系数,从而确定聚类中心和对数据聚类:
步骤2.3,精准模糊聚类算法流程如下:
步骤2.3.2:基于数据集和聚类中心数定义隶属矩阵U;
步骤2.3.3:遍历所有数据集以创建初始隶属矩阵U;
计算过程如下:
虽然本发明提出的精准模糊聚类算法和模糊C均值之间有一些相似之处,但它们之间有很大的差异。差异从步骤2.3.1中定义的系数开始。在步骤2.3.2中定义隶属矩阵U后,根据系数指定隶属度的值。在中,i表示数据集的索引下标,j表示聚类中心集群的索引下标。这些值的和(sum2)将在下一步中计算。每个根据其模糊参数进行更新,并在步骤2.3.4中将的和赋给sum2。值用步骤2.3.5中描述的公式重新定义。在最后一步中,令max初始值为−1,将max与所有值进行比较。如果, max赋值为,重新计算聚类指标。
步骤2.4,精准模糊聚类算法精度优化算法如下:
如果聚类精度没有达到预期水平,该算法应该重新执行,直到精度达到预期水平。用步骤2.4.1-步骤2.4.4中给出的步骤来确保聚类算法的精度。首先给出了聚类参数和阈值(本发明为 threshold表示,阈值设为0.5)作为算法的输入。的值乘以p(x, y)点与聚类中心的欧氏距离并相加后得到的结果小于阈值,这意味着获得了所需的精度,当获得所需的精度时,暂停聚类计算;否则,重复步骤2.4.2。具体步骤为:
步骤2.4.1:输入聚类参数,阈值与迭代计数;
步骤2.4.3:计算聚类集群中心;
步骤2.4.4:如果J< threshold,跳出迭代,否则返回步骤2.4.2。
本发明还提供基于精准模糊聚类算法的居民电力数据聚类装置,包括:
精准模糊聚类算法实现模块:用于推导精准模糊聚类算法的目标函数,定义精准模糊聚类中心,计算隶属矩阵,控制精准模糊聚类算法的误差,使得精准模糊聚类算法的目标函数最小;
精准模糊聚类算法精度提升模块:根据评价数据集聚类方法的度量指标,选取与居民电力数据可维护性和响度指标值影响最大的每类加权方法、低耦合度方法、对每个类的响应度方法这三个度量指标算得的度量值重新组合运算,得到一个影响精准模糊隶属矩阵精度的隶属系数,从而确定精准模糊聚类算法的聚类中心,并运用精准模糊聚类算法对数据聚类。
精准模糊聚类算法实现模块具体包括用于执行以下步骤:
步骤1.1,对目标台区居民用户同一时间段内用电负荷进行负荷特性普查,通过对目标台区的HPLC智能电表进行数据读取,获得用户的用电数据,得到负荷特性数据;
步骤1.2,设S = (s 1 ,s 2 ,s 3 ,s 4 ,s 5, ...,s n )表示数量为n的电力数据集,D = (d 1, d 2, d 3, d 4, d 5, ...d n )表示数据集与其聚类中心的距离;从D中选择的任一d w (w=1,2,...,n)表示从数据集S中选择的s w 与其聚类中心的距离;设k为聚类簇数;通过模糊聚类方法将数据集划分为聚类中心群C = (c 1, c 2, c 3, ...,c k );
步骤1.4,聚类误差控制函数如公式(2);
式中,d w (w=1,2,...,n)表示从数据集S中选择的s w 与其聚类中心的距离
精准模糊聚类算法精度提升模块具体包括用于执行以下步骤:
步骤2.1,评价数据集聚类方法有如下度量指标:wmc表示每类加权方法,dit表示继承度,noc表示子类的数量、cbo表示对象耦合度、rfc表示对每个类的响应度,lcom表示低耦合度,ca表示输出耦合度,ce表示传入耦合度,npm表示基于公共方法的数量的方法,loc表示聚类算法代码行,dam表示数据访问量,moa表示数据放大值,mfa表示功能抽象化衡量标准,cam表示类方法内聚力指数,ic表示继承性耦合度指标,cbm表示方法之间的耦合评判指标,amc表示平均方法复杂度,max cc表示最大的类耦合度,avg cc表示平均类耦合度,各度量指标的度量值用MS = (ms 1 ,ms 2 ,ms 3 ,ms 4 ,ms 5 ,...,ms t )表示,t为度量指标的个数;度量值的和用于归一化分析,以确定该数据集是否适用于参数检验;在提出的精准模糊聚类算法中,根据前述度量指标定义的数据集度量值被转换为p(x, y)点;x和y的定义如公式(5),在这个公式中,x是前一半数据集度量指标的平均值,x i 是前一半各数据集各度量指标;y是后一半数据集度量指标的平均值,y i 是后一半各数据集各度量指标,因此度量指标对p(x, y)的确定起决定性作用,聚类中心的确定取决于p(x, y):
步骤2.2,通过设计公式(6)定量描述影响精准模糊隶属矩阵的隶属系数:
通过这个设计,每个隶属度值被以±50改变,公式(6)中的wmc i 、lcom i 、rfc i 分别表示数据子集i采用每类加权方法、低耦合度方法、对每个类的响应度方法这三个度量指标算得的度量值,选取这三个重要度量指标作为精准模糊隶属矩阵隶属系数,从而确定聚类中心和对数据聚类;
步骤2.3,精准模糊聚类算法流程如下:
步骤2.3.2:基于数据集和聚类中心数定义隶属矩阵U;
步骤2.3.3:遍历所有数据集以创建初始隶属矩阵U;
计算过程如下:
步骤2.4,精准模糊聚类算法精度优化算法如下:
如果聚类精度没有达到预期水平,该算法应该重新执行,直到精度达到预期水平,用步骤2.4.1-步骤2.4.4中给出的步骤来确保聚类算法的精度;首先给出了聚类参数和阈值threshold,阈值设为0.5,作为算法的输入;的值乘以p(x, y)点与聚类中心的欧氏距离并相加后得到的结果小于阈值,这意味着获得了所需的精度,当获得所需的精度时,暂停聚类计算;否则,重复步骤2.4.2;具体步骤为:
步骤2.4.1:输入聚类参数,阈值与迭代计数;
步骤2.4.3:计算聚类集群中心;
步骤2.4.4:如果J< threshold,跳出迭代,否则返回步骤2.4.2。
本发明的有益效果是:
相比于传统的模糊C均值(FCM)算法在确定集群的隶属度方面不够精准,本发明通过设计一个与聚类算法评估关键度量指标相关的公式,定量描述影响模糊隶属矩阵精准度的隶属系数,通过这个设计,每个隶属度值可以被以±50改变,提高了模糊C均值聚类算法的准确度和精度,聚类算法的可维护性和响度指标值也得到优化,并将该精准模糊聚类算法应用于居民客户聚类工作,应用效果证实了所提出的聚合理论对电力数据的适应性,为电网侧针对不同用户定制异质性电力套餐的过程提供科学的依据。
附图说明
图1为本发明优选实施例中基于精准模糊聚类算法的居民电力数据聚类方法的流程框图;
图2为本发明优选实施例中基于精准模糊聚类算法的居民电力数据聚类装置的结构图;
图3为电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明的一部分实施例,而不是全部的实施例。
如图1所示,基于精准模糊聚类算法的居民电力数据聚类方法,包括:
步骤1、使用传统模糊C聚类算法确定数据集聚类中心,推导精准模糊聚类算法的目标函数,并定义精准模糊聚类中心,计算隶属矩阵,控制精准模糊聚类算法的误差,使得精准模糊聚类算法的目标函数最小;
步骤2、根据评价数据集聚类方法的度量指标,选取与居民电力数据可维护性和响度指标值影响最大的每类加权方法、低耦合度方法、对每个类的响应度方法这三个度量指标算得的度量值重新组合运算,得到一个影响精准模糊隶属矩阵精度的隶属系数,从而确定精准模糊聚类算法的聚类中心,并运用精准模糊聚类算法对数据聚类。
进一步地,所述步骤1具体实现方法如下:
步骤1.1,对目标台区居民用户同一时间段内用电负荷进行负荷特性普查,通过对目标台区的HPLC智能电表进行数据读取,获得用户的用电数据,得到负荷特性数据。
步骤1.2,设S = (s 1 ,s 2 ,s 3 ,s 4 ,s 5, ...,s n )表示数量为n的电力数据集,D = (d 1, d 2, d 3, d 4, d 5, ...d n )表示数据集与其聚类中心的距离。从D中选择的任一d w (w=1,2,...,n)表示从数据集S中选择的s w 与其聚类中心的距离。设k为聚类簇数;然后,通过模糊聚类方法将数据集划分为聚类中心群C = (c 1, c 2, c 3, ...,c k )。
步骤1.4,聚类误差控制函数如公式(2);
式中,d w (w=1,2,...,n)表示从数据集S中选择的s w 与其聚类中心的距离。
进一步地,所述步骤2的具体实现方法如下:
步骤2.1,一般的,评价数据集聚类方法有如下度量指标:wmc表示每类加权方法,dit表示继承度,noc表示子类的数量、cbo表示对象耦合度、rfc表示对每个类的响应度,lcom表示低耦合度,ca表示输出耦合度,ce表示传入耦合度,npm表示基于公共方法的数量的方法,loc表示聚类算法代码行,dam表示数据访问量,moa表示数据放大值,mfa表示功能抽象化衡量标准,cam表示类方法内聚力指数,ic表示继承性耦合度指标,cbm表示方法之间的耦合评判指标,amc表示平均方法复杂度,max cc表示最大的类耦合度,avg cc表示平均类耦合度,各度量指标的度量值用MS = (ms 1 ,ms 2 ,ms 3 ,ms 4 ,ms 5 ,...,ms t )表示,t为度量指标的个数。度量值的和用于归一化分析,以确定该数据集是否适用于参数检验。在本发明提出的精准模糊聚类算法中,根据前述度量指标定义的数据集度量值被转换为p (x, y)点;x和y的定义如公式(5),在这个公式中,x是前一半数据集度量指标的平均值,x i 是前一半各数据集各度量指标。y是后一半数据集度量指标的平均值,y i 是后一半各数据集各度量指标,因此度量指标对p(x, y)的确定起决定性作用,聚类中心的确定取决于p(x, y):
步骤2.2,通过设计公式(6)定量描述影响精准模糊隶属矩阵的隶属系数:
通过这个设计,每个隶属度值可以被以±50改变,这是通过各种试验得到的边界值。这意味着,根据数据集的各种度量指标组合,影响隶属度的最小值会发生变化。这个系数是通过用聚类软件测试数据集得到的不同度量值重新组合运算得到的,公式(6)中的wmc i 、lcom i 、rfc i 分别表示数据子集i采用每类加权方法、低耦合度方法、对每个类的响应度方法这三个度量指标算得的度量值,选取这三个度量指标作为本发明提出的精准模糊隶属矩阵生成系数的公式(6)中的运算指标,是根据目前评估聚类方法优劣的可维护性和响度指标值,以及数据测试得出的结论,这也是本发明方法的创新点,选取这三个重要度量指标作为精准模糊隶属矩阵隶属系数,从而确定聚类中心和对数据聚类:
步骤2.3,精准模糊聚类算法流程如下:
步骤2.3.2:基于数据集和聚类中心数定义隶属矩阵U;
步骤2.3.3:遍历所有数据集以创建初始隶属矩阵U;
计算过程如下:
虽然本发明提出的精准模糊聚类算法和模糊C均值之间有一些相似之处,但它们之间有很大的差异。差异从步骤2.3.1中定义的系数开始。在步骤2.3.2中定义隶属矩阵U后,根据系数指定隶属度的值。在中,i表示数据集的索引下标,j表示聚类中心集群的索引下标。这些值的和(sum2)将在下一步中计算。每个根据其模糊参数进行更新,并在步骤2.3.4中将的和赋给sum2。值用步骤2.3.5中描述的公式重新定义。在最后一步中,令max初始值为−1,将max与所有值进行比较。如果max <, max赋值为,重新计算聚类指标。
步骤2.4,精准模糊聚类算法精度优化算法如下:
如果聚类精度没有达到预期水平,该算法应该重新执行,直到精度达到预期水平。用步骤2.4.1-步骤2.4.4中给出的步骤来确保聚类算法的精度。首先给出了聚类参数和阈值(本发明为 threshold表示,阈值设为0.5)作为算法的输入。的值乘以p(x, y)点与聚类中心的欧氏距离并相加后得到的结果小于阈值,这意味着获得了所需的精度,当获得所需的精度时,暂停聚类计算;否则,重复步骤2.4.2。具体步骤为:
步骤2.4.1:输入聚类参数,阈值与迭代计数;
步骤2.4.3:计算聚类集群中心;
步骤2.4.4:如果J< threshold,跳出迭代,否则返回步骤2.4.2。
为便于对本发明的理解,结合实例对本发明基于精准模糊聚类算法的居民电力数据聚类方法进行较为详细的方法过程描述:
随机选取12个有效样本(参与需求响应的居民用户用电信息)进行聚类,根据需求响应开展的进程,以需求响应时间段为核心选取了8个指标维度,如下表1所示:
表1 居民用电数据
通过基于精准模糊聚类算法的居民电力数据聚类方法进行聚类,可以得到下表2:
表2基于精准模糊聚类算法的居民电力数据聚类结果
聚类中心见下表3:
表3 聚类中心
可以看出:样本3,4,8,9,10,11归为第一类,见下表4:
表4 聚类结果1
样本2,6,12归为第二类,见下表5:
表5聚类结果2
样本1,5,7归为第三类,见下表6:
表6聚类结果3
如图2所示,基于精准模糊聚类算法的居民电力数据聚类装置,包括:
精准模糊聚类算法实现模块210:用于推导精准模糊聚类算法的目标函数,定义精准模糊聚类中心,计算隶属矩阵,控制精准模糊聚类算法的误差,使得精准模糊聚类算法的目标函数最小;
精准模糊聚类算法精度提升模块220:根据评价数据集聚类方法的度量指标,选取与居民电力数据可维护性和响度指标值影响最大的每类加权方法、低耦合度方法、对每个类的响应度方法这三个度量指标算得的度量值重新组合运算,得到一个影响精准模糊隶属矩阵精度的隶属系数,从而确定精准模糊聚类算法的聚类中心,并运用精准模糊聚类算法对数据聚类。
应当理解,图2中的诸模块与参考图1中描述的方法中的各个步骤相对应。由此,上文针对方法描述的操作和特征以及相应的技术效果同样适用于图2中的诸模块,在此不再赘述。
在另一些实施例中,本发明实施例还提供了一种非易失性计算机存储介质,计算机存储介质存储有计算机可执行指令,该计算机可执行指令可执行上述方法实施例中的基于精准模糊聚类算法的居民电力数据聚类方法。
作为一种实施方式,本发明的非易失性计算机存储介质存储有计算机可执行指令,非易失性计算机可读存储介质可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据基于精准模糊聚类算法的居民电力数据聚类装置使用过程中所创建的数据等。此外,非易失性计算机可读存储介质可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,非易失性计算机可读存储介质可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至基于精准模糊聚类算法的居民电力数据聚类装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
本发明实施例还提供一种计算机程序产品,计算机程序产品包括存储在非易失性计算机可读存储介质上的计算机程序,计算机程序包括程序指令,当程序指令被计算机执行时,使计算机执行上述基于精准模糊聚类算法的居民电力数据聚类方法。
图3是本发明实施例提供的电子设备的结构示意图,该设备包括:一个或多个处理器310以及存储器320,图3中以一个处理器310为例。电子设备还可以包括:输入装置330和输出装置340。处理器310、存储器320、输入装置330和输出装置340可以通过总线或者其他方式连接,图3中以通过总线连接为例。存储器320为上述的非易失性计算机可读存储介质。处理器310通过运行存储在存储器320中的非易失性软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例基于精准模糊聚类算法的居民电力数据聚类方法。输入装置330可接收输入的数字或字符信息,以及产生与基于精准模糊聚类算法的居民电力数据聚类装置的用户设置以及功能控制有关的键信号输入。输出装置340可包括显示屏等显示设备。
上述产品可执行本发明实施例所提供的方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明实施例所提供的方法。
作为一种实施方式,上述电子设备应用于基于精准模糊聚类算法的居民电力数据聚类装置中,用于客户端,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行计算机存储介质存储的指令。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (8)
1.基于精准模糊聚类算法的居民电力数据聚类方法,其特征在于:包括以下步骤:
步骤1、使用传统模糊C聚类算法确定数据集聚类中心,推导精准模糊聚类算法的目标函数,并定义精准模糊聚类中心,计算隶属矩阵,控制精准模糊聚类算法的误差,使得精准模糊聚类算法的目标函数最小;
步骤2、根据评价数据集聚类方法的度量指标,选取与居民电力数据可维护性和响度指标值影响最大的每类加权方法、低耦合度方法、对每个类的响应度方法这三个度量指标算得的度量值重新组合运算,得到一个影响精准模糊隶属矩阵精度的隶属系数,从而确定精准模糊聚类算法的聚类中心,并运用精准模糊聚类算法对数据聚类。
2.根据权利要求1所述的基于精准模糊聚类算法的居民电力数据聚类方法,其特征在于:所述步骤1的具体实现方法如下:
步骤1.1,对目标台区居民用户同一时间段内用电负荷进行负荷特性普查,通过对目标台区的HPLC智能电表进行数据读取,获得用户的用电数据,得到负荷特性数据;
步骤1.2,设S = (s 1 ,s 2 ,s 3 ,s 4 ,s 5, ...,s n )表示数量为n的电力数据集,D = (d 1, d 2, d 3, d 4, d 5, ...d n )表示数据集与其聚类中心的距离;从D中选择的任一d w (w=1,2,...,n)表示从数据集S中选择的s w 与其聚类中心的距离;设k为聚类簇数;通过模糊聚类方法将数据集划分为聚类中心群C = (c 1, c 2, c 3, ...,c k );
步骤1.4,聚类误差控制函数如公式(2);
式中,d w (w=1,2,...,n)表示从数据集S中选择的s w 与其聚类中心的距离;
3.根据权利要求2所述的基于精准模糊聚类算法的居民电力数据聚类方法,其特征在于:所述步骤2的具体实现方法如下:
步骤2.1,评价数据集聚类方法有如下度量指标:wmc表示每类加权方法,dit表示继承度,noc表示子类的数量、cbo表示对象耦合度、rfc表示对每个类的响应度,lcom表示低耦合度,ca表示输出耦合度,ce表示传入耦合度,npm表示基于公共方法的数量的方法,loc表示聚类算法代码行,dam表示数据访问量,moa表示数据放大值,mfa表示功能抽象化衡量标准,cam表示类方法内聚力指数,ic 表示继承性耦合度指标,cbm表示方法之间的耦合评判指标,amc表示平均方法复杂度,max cc表示最大的类耦合度,avg cc表示平均类耦合度,各度量指标的度量值用MS = (ms 1 ,ms 2 ,ms 3 ,ms 4 ,ms 5 ,...,ms t )表示,t为度量指标的个数;度量值的和用于归一化分析,以确定该数据集是否适用于参数检验;在提出的精准模糊聚类算法中,根据前述度量指标定义的数据集度量值被转换为p(x, y)点;x和y的定义如公式(5),在这个公式中,x是前一半数据集度量指标的平均值,x i 是前一半各数据集各度量指标;y是后一半数据集度量指标的平均值,y i 是后一半各数据集各度量指标,因此度量指标对p(x, y)的确定起决定性作用,聚类中心的确定取决于p(x, y):
步骤2.2,通过设计公式(6)定量描述影响精准模糊隶属矩阵的隶属系数:
通过这个设计,每个隶属度值被以±50改变,公式(6)中的wmc i 、lcom i 、rfc i 分别表示数据子集i采用每类加权方法、低耦合度方法、对每个类的响应度方法这三个度量指标算得的度量值,选取这三个重要度量指标作为精准模糊隶属矩阵隶属系数,从而确定聚类中心和对数据聚类;
步骤2.3,精准模糊聚类算法流程如下:
步骤2.3.2:基于数据集和聚类中心数定义隶属矩阵U;
步骤2.3.3:遍历所有数据集以创建初始隶属矩阵U;
计算过程如下:
步骤2.4,精准模糊聚类算法精度优化算法如下:
如果聚类精度没有达到预期水平,该算法应该重新执行,直到精度达到预期水平,用步骤2.4.1-步骤2.4.4中给出的步骤来确保聚类算法的精度;首先给出了聚类参数和阈值threshold,阈值设为0.5,作为算法的输入;的值乘以p(x, y)点与聚类中心的欧氏距离并相加后得到的结果小于阈值,这意味着获得了所需的精度,当获得所需的精度时,暂停聚类计算;否则,重复步骤2.4.2;具体步骤为:
步骤2.4.1:输入聚类参数,阈值与迭代计数;
步骤2.4.3:计算聚类集群中心;
步骤2.4.4:如果J< threshold,跳出迭代,否则返回步骤2.4.2。
4.基于精准模糊聚类算法的居民电力数据聚类装置,其特征在于:包括:
精准模糊聚类算法实现模块:用于推导精准模糊聚类算法的目标函数,定义精准模糊聚类中心,计算隶属矩阵,控制精准模糊聚类算法的误差,使得精准模糊聚类算法的目标函数最小;
精准模糊聚类算法精度提升模块:根据评价数据集聚类方法的度量指标,选取与居民电力数据可维护性和响度指标值影响最大的每类加权方法、低耦合度方法、对每个类的响应度方法这三个度量指标算得的度量值重新组合运算,得到一个影响精准模糊隶属矩阵精度的隶属系数,从而确定精准模糊聚类算法的聚类中心,并运用精准模糊聚类算法对数据聚类。
5.根据权利要求4所述的基于精准模糊聚类算法的居民电力数据聚类装置,其特征在于:所述精准模糊聚类算法实现模块具体包括用于执行以下步骤:
步骤1.1,对目标台区居民用户同一时间段内用电负荷进行负荷特性普查,通过对目标台区的HPLC智能电表进行数据读取,获得用户的用电数据,得到负荷特性数据;
步骤1.2,设S = (s 1 ,s 2 ,s 3 ,s 4 ,s 5, ...,s n )表示数量为n的电力数据集,D = (d 1, d 2, d 3, d 4, d 5, ...d n )表示数据集与其聚类中心的距离;从D中选择的任一d w (w=1,2,...,n)表示从数据集S中选择的s w 与其聚类中心的距离;设k为聚类簇数;通过模糊聚类方法将数据集划分为聚类中心群C = (c 1, c 2, c 3, ...,c k );
步骤1.4,聚类误差控制函数如公式(2);
式中,d w (w=1,2,...,n)表示从数据集S中选择的s w 与其聚类中心的距离;
6.根据权利要求5所述的基于精准模糊聚类算法的居民电力数据聚类装置,其特征在于:所述精准模糊聚类算法精度提升模块具体包括用于执行以下步骤:
步骤2.1,评价数据集聚类方法有如下度量指标:wmc表示每类加权方法,dit表示继承度,noc表示子类的数量、cbo表示对象耦合度、rfc表示对每个类的响应度,lcom表示低耦合度,ca表示输出耦合度,ce表示传入耦合度,npm表示基于公共方法的数量的方法,loc表示聚类算法代码行,dam表示数据访问量,moa表示数据放大值,mfa表示功能抽象化衡量标准,cam表示类方法内聚力指数,ic 表示继承性耦合度指标,cbm表示方法之间的耦合评判指标,amc表示平均方法复杂度,max cc表示最大的类耦合度,avg cc表示平均类耦合度,各度量指标的度量值用MS = (ms 1 ,ms 2 ,ms 3 ,ms 4 ,ms 5 ,...,ms t )表示,t为度量指标的个数;度量值的和用于归一化分析,以确定该数据集是否适用于参数检验;在提出的精准模糊聚类算法中,根据前述度量指标定义的数据集度量值被转换为p(x, y)点;x和y的定义如公式(5),在这个公式中,x是前一半数据集度量指标的平均值,x i 是前一半各数据集各度量指标;y是后一半数据集度量指标的平均值,y i 是后一半各数据集各度量指标,因此度量指标对p(x, y)的确定起决定性作用,聚类中心的确定取决于p(x, y):
步骤2.2,通过设计公式(6)定量描述影响精准模糊隶属矩阵的隶属系数:
通过这个设计,每个隶属度值被以±50改变,公式(6)中的wmc i 、lcom i 、rfc i 分别表示数据子集i采用每类加权方法、低耦合度方法、对每个类的响应度方法这三个度量指标算得的度量值,选取这三个重要度量指标作为精准模糊隶属矩阵隶属系数,从而确定聚类中心和对数据聚类;
步骤2.3,精准模糊聚类算法流程如下:
步骤2.3.2:基于数据集和聚类中心数定义隶属矩阵U;
步骤2.3.3:遍历所有数据集以创建初始隶属矩阵U;
计算过程如下:
步骤2.4,精准模糊聚类算法精度优化算法如下:
如果聚类精度没有达到预期水平,该算法应该重新执行,直到精度达到预期水平,用步骤2.4.1-步骤2.4.4中给出的步骤来确保聚类算法的精度;首先给出了聚类参数和阈值threshold,阈值设为0.5,作为算法的输入;的值乘以p(x, y)点与聚类中心的欧氏距离并相加后得到的结果小于阈值,这意味着获得了所需的精度,当获得所需的精度时,暂停聚类计算;否则,重复步骤2.4.2;具体步骤为:
步骤2.4.1:输入聚类参数,阈值与迭代计数;
步骤2.4.3:计算聚类集群中心;
步骤2.4.4:如果J< threshold,跳出迭代,否则返回步骤2.4.2。
7.一种电子设备,其特征在于:包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1至3任一项所述的基于精准模糊聚类算法的居民电力数据聚类方法的步骤。
8.一种存储介质,其上存储有计算机程序,其特征在于:所述程序被处理器执行时实现权利要求1至3任一项所述的基于精准模糊聚类算法的居民电力数据聚类方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111526678.XA CN113919449B (zh) | 2021-12-15 | 2021-12-15 | 基于精准模糊聚类算法的居民电力数据聚类方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111526678.XA CN113919449B (zh) | 2021-12-15 | 2021-12-15 | 基于精准模糊聚类算法的居民电力数据聚类方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113919449A true CN113919449A (zh) | 2022-01-11 |
CN113919449B CN113919449B (zh) | 2022-03-15 |
Family
ID=79249184
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111526678.XA Active CN113919449B (zh) | 2021-12-15 | 2021-12-15 | 基于精准模糊聚类算法的居民电力数据聚类方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113919449B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104268402A (zh) * | 2014-09-25 | 2015-01-07 | 国家电网公司 | 一种基于模糊c均值的电力系统负荷聚类方法 |
WO2015001416A1 (en) * | 2013-07-05 | 2015-01-08 | Tata Consultancy Services Limited | Multi-dimensional data clustering |
CN107133176A (zh) * | 2017-05-09 | 2017-09-05 | 武汉大学 | 一种基于半监督聚类数据筛选的跨项目缺陷预测方法 |
CN109902915A (zh) * | 2019-01-11 | 2019-06-18 | 国网浙江省电力有限公司 | 一种基于模糊c均值模型的电水气用能行为分析方法 |
CN111782512A (zh) * | 2020-06-23 | 2020-10-16 | 北京高质系统科技有限公司 | 基于不平衡噪声集的多特征软件缺陷综合预测方法 |
US20210081827A1 (en) * | 2019-07-15 | 2021-03-18 | Guangdong University Of Technology | Fast clustering algorithm based on kernel fuzzy c-means integrated with spatial constraints |
CN113688960A (zh) * | 2021-10-27 | 2021-11-23 | 南昌工程学院 | 基于灰狼优化ghfcm的居民电力数据聚类方法及装置 |
-
2021
- 2021-12-15 CN CN202111526678.XA patent/CN113919449B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015001416A1 (en) * | 2013-07-05 | 2015-01-08 | Tata Consultancy Services Limited | Multi-dimensional data clustering |
CN104268402A (zh) * | 2014-09-25 | 2015-01-07 | 国家电网公司 | 一种基于模糊c均值的电力系统负荷聚类方法 |
CN107133176A (zh) * | 2017-05-09 | 2017-09-05 | 武汉大学 | 一种基于半监督聚类数据筛选的跨项目缺陷预测方法 |
CN109902915A (zh) * | 2019-01-11 | 2019-06-18 | 国网浙江省电力有限公司 | 一种基于模糊c均值模型的电水气用能行为分析方法 |
US20210081827A1 (en) * | 2019-07-15 | 2021-03-18 | Guangdong University Of Technology | Fast clustering algorithm based on kernel fuzzy c-means integrated with spatial constraints |
CN111782512A (zh) * | 2020-06-23 | 2020-10-16 | 北京高质系统科技有限公司 | 基于不平衡噪声集的多特征软件缺陷综合预测方法 |
CN113688960A (zh) * | 2021-10-27 | 2021-11-23 | 南昌工程学院 | 基于灰狼优化ghfcm的居民电力数据聚类方法及装置 |
Non-Patent Citations (2)
Title |
---|
ROBINSON CRUSOE´ DA CRUZ ET AL: "Using a cluster analysis method for grouping classes according to their inferred testability: an investigation of CK metrics, code coverage and mutation score", 《2017 36TH INTERNATIONAL CONFERENCE OF THE CHILEAN COMPUTER SCIENCE SOCIETY (SCCC)》 * |
周开乐等: "基于改进模糊C均值算法的电力负荷特性分类", 《电力系统保护与控制》 * |
Also Published As
Publication number | Publication date |
---|---|
CN113919449B (zh) | 2022-03-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2020119051A1 (zh) | 云平台资源使用预测方法及终端设备 | |
WO2021208079A1 (zh) | 获取动力电池寿命数据的方法、装置、计算机设备及介质 | |
CN112330077B (zh) | 电力负荷预测方法、装置、计算机设备和存储介质 | |
CN114897451B (zh) | 考虑需求响应用户关键特征的双层聚类修正方法及装置 | |
CN111563821A (zh) | 一种基于支持向量机量化投资的金融股票涨跌预测方法 | |
CN113112099A (zh) | 电网日电量预测模型训练方法和电网日电量预测方法 | |
CN116187835A (zh) | 一种基于数据驱动的台区理论线损区间估算方法及系统 | |
CN115759590A (zh) | 一种基于用电行为特征的工业用户需求响应潜力计算方法 | |
CN113449919B (zh) | 一种基于特征和趋势感知的用电量预测方法及系统 | |
CN114154716A (zh) | 一种基于图神经网络的企业能耗预测方法及装置 | |
CN108647714A (zh) | 负面标签权重的获取方法、终端设备及介质 | |
CN113919449B (zh) | 基于精准模糊聚类算法的居民电力数据聚类方法及装置 | |
Chen et al. | Hybrid methods for stock index modeling | |
TW201518959A (zh) | 不動產估價方法 | |
CN114118608A (zh) | 电网业务配比优化方法、装置、终端及存储介质 | |
CN114154697A (zh) | 房屋维修资源的预测方法、装置、计算机设备和存储介质 | |
CN115829144B (zh) | 电网业务优化模型的建立方法及电子设备 | |
Mougeot et al. | Forecasting intra day load curves using sparse functional regression | |
CN113361960B (zh) | 一种大规模需求响应能力量化方法、介质、装置及设备 | |
CN111311025A (zh) | 一种基于气象相似日的负荷预测方法 | |
CN117435870B (zh) | 一种负荷数据实时填充方法、系统、设备和介质 | |
CN117764638B (zh) | 一种供电企业售电数据预测方法、系统、设备及存储介质 | |
CN115081515A (zh) | 能效评价模型构建方法、装置、终端及存储介质 | |
CN116721565A (zh) | 停车场泊位占用量的多维度预测方法以及系统 | |
CN115545490A (zh) | 基于小样本机器学习的电站工程造价分析方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |