CN113919449A - 基于精准模糊聚类算法的居民电力数据聚类方法及装置 - Google Patents

基于精准模糊聚类算法的居民电力数据聚类方法及装置 Download PDF

Info

Publication number
CN113919449A
CN113919449A CN202111526678.XA CN202111526678A CN113919449A CN 113919449 A CN113919449 A CN 113919449A CN 202111526678 A CN202111526678 A CN 202111526678A CN 113919449 A CN113919449 A CN 113919449A
Authority
CN
China
Prior art keywords
clustering
fuzzy
clustering algorithm
precise
membership
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111526678.XA
Other languages
English (en)
Other versions
CN113919449B (zh
Inventor
俞林刚
樊友杰
刘明
张志立
江峰
刘强
饶员良
舒骁骁
卢婕
李昊翔
刘向向
祝君剑
熊茹
刘丽蕴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Jiangxi Electric Power Co ltd
Power Supply Service Management Center Of State Grid Jiangxi Electric Power Co ltd
State Grid Corp of China SGCC
Original Assignee
State Grid Jiangxi Electric Power Co ltd
Power Supply Service Management Center Of State Grid Jiangxi Electric Power Co ltd
State Grid Corp of China SGCC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Jiangxi Electric Power Co ltd, Power Supply Service Management Center Of State Grid Jiangxi Electric Power Co ltd, State Grid Corp of China SGCC filed Critical State Grid Jiangxi Electric Power Co ltd
Priority to CN202111526678.XA priority Critical patent/CN113919449B/zh
Publication of CN113919449A publication Critical patent/CN113919449A/zh
Application granted granted Critical
Publication of CN113919449B publication Critical patent/CN113919449B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/06Electricity, gas or water supply

Abstract

本发明公开了基于精准模糊聚类算法的居民电力数据聚类方法及装置,该方法包括:步骤1:推导精准模糊聚类算法的目标函数,并定义精准模糊聚类中心,计算隶属矩阵,控制精准模糊聚类算法的误差,使得精准模糊聚类算法的目标函数最小;步骤2:根据评价数据集聚类方法的度量指标,选取与居民电力数据可维护性和响度指标值影响最大的每类加权方法、低耦合度方法、对每个类的响应度方法这三个度量指标算得的度量值重新组合运算,得到一个影响精准模糊隶属矩阵精度的隶属系数,从而确定精准模糊聚类算法的聚类中心,并运用精准模糊聚类算法对数据聚类。本发明提高了聚类算法的准确度和精度,聚类算法的可维护性和响度指标值也得到优化。

Description

基于精准模糊聚类算法的居民电力数据聚类方法及装置
技术领域
本发明涉及电力系统用电负荷领域,特别涉及基于精准模糊聚类算法的居民电力数据聚类方法及装置。
背景技术
居民阶梯电价自实施以来,已在一定程度上增强了居民的节能意识,改变了一些不良的用电习惯。在新的阶梯电价制度下,用户群的某些特征(如:不同的收入、家庭结构、生活习惯等)对阶梯电价将产生不同的响应,这所引起的用电行为差异将逐步显现出来,这也使得阶梯电价下的居民用电需求预测变得更加复杂。准确的用电需求预测能科学指导电网的改造与建设,有效降低电网建设成本,提高经济效益和社会效益。
阶梯电价的科学理论基础是通过市场细分的方法区分出不同特征用户群,针对不同用户群采用不同电价机制,以提高资源配置效率。传统的用电需求预测建立的是用户的平均行为模型,这类模型无法揭示各个顾客群体的不同行为,忽略了不同类型用户的用电行为差异性。因此,准确的居民电力用户聚类及捕捉各类用户用电行为特征是现阶段居民用户中期用电需求研究的2个重要方面。
模糊C均值算法已被广泛用于电力数据聚类分析,例如,CN104268402A公开了一种基于模糊C均值的电力系统负荷聚类方法,其特征是所述方法包括:步骤1:确定基于负荷构成的统计综合建模理论;步骤2:在步骤1的基础上,研究负荷建模中的聚类问题之一:行业用户的初选与精选;步骤3:在步骤1的基础上,研究负荷建模中的聚类问题之二:变电站综合负荷静特性分类与综合;步骤4:在步骤2和步骤3的基础上,确定基于模糊C均值的电力系统负荷聚类算法。CN107918779A公开了一种构建多元负荷聚类模型方法包括:采集用户基本信息以及多元负荷数据;对用户基本信息以及多元负荷数据进行预处理,得到能够进行聚类分析的数据集合;对多元负荷分别进行模糊C均值聚类,确定多元负荷数据对应的多个聚类结果;根据确定聚类结果分别对多元负荷分析负荷单体特性,并进行层次聚类得到多元负荷资源聚集模型。
传统模糊C均值算法在确定集群的隶属度方面不够精准,聚类准确性不高。
发明内容
针对现有技术中存在的问题,本发明的目的是提供基于精准模糊聚类算法的居民电力数据聚类方法及装置。
本发明提供基于精准模糊聚类算法的居民电力数据聚类方法,包括:
步骤1、使用传统模糊C聚类算法确定数据集聚类中心,推导精准模糊聚类算法的目标函数,并定义精准模糊聚类中心,计算隶属矩阵,控制精准模糊聚类算法的误差,使得精准模糊聚类算法的目标函数最小;
步骤2、根据评价数据集聚类方法的度量指标,选取与居民电力数据可维护性和响度指标值影响最大的每类加权方法、低耦合度方法、对每个类的响应度方法这三个度量指标算得的度量值重新组合运算,得到一个影响精准模糊隶属矩阵精度的隶属系数,从而确定精准模糊聚类算法的聚类中心,并运用精准模糊聚类算法对数据聚类;
进一步地,所述步骤1具体实现方法如下:
步骤1.1,对目标台区居民用户同一时间段内用电负荷进行负荷特性普查,通过对目标台区的HPLC智能电表进行数据读取,获得用户的用电数据,得到负荷特性数据。
步骤1.2,设S = (s 1 ,s 2 ,s 3 ,s 4 ,s 5, ...,s n )表示数量为n的电力数据集,D = (d 1, d 2, d 3, d 4, d 5, ...d n )表示数据集与其聚类中心的距离。从D中选择的任一d w (w=1,2,...,n)表示从数据集S中选择的s w 与其聚类中心的距离。设k为聚类簇数;然后,通过模糊聚类方法将数据集划分为聚类中心群C = (c 1, c 2, c 3, ...,c k )
步骤1.3,提出精准模糊聚类算法,其目标函数设为
Figure 893027DEST_PATH_IMAGE001
,其隶属度区间为[0,1];使用式(1)表示
Figure 17846DEST_PATH_IMAGE001
Figure 640458DEST_PATH_IMAGE002
(1)
式中
Figure 412104DEST_PATH_IMAGE003
为模糊指数,
Figure 159481DEST_PATH_IMAGE004
用来计算
Figure 573144DEST_PATH_IMAGE005
与聚类中心
Figure 456787DEST_PATH_IMAGE006
之间的欧氏距离,
Figure 163449DEST_PATH_IMAGE007
表示隶属矩阵,
Figure 398122DEST_PATH_IMAGE008
表示
Figure 84318DEST_PATH_IMAGE009
与聚类中心
Figure 353625DEST_PATH_IMAGE010
的隶属度;
步骤1.4,聚类误差控制函数如公式(2);
Figure 529392DEST_PATH_IMAGE011
(2)
公式(2)的目的是使聚类误差之和最小,n为电力数据集数量,Error()表示聚类标签的误差函数,
Figure 18404DEST_PATH_IMAGE012
表示聚类标签;
步骤1.5,下述公式(3)用来初始化隶属度
Figure 773870DEST_PATH_IMAGE013
Figure 897684DEST_PATH_IMAGE014
(3)
式中,d w (w=1,2,...,n)表示从数据集S中选择的s w 与其聚类中心的距离
步骤1.6,通过公式(4)计算精准模糊聚类中心
Figure 601942DEST_PATH_IMAGE015
,然后迭代计算公式(2)和(3),直到使目标函数
Figure 607944DEST_PATH_IMAGE001
的值最小化:
Figure 901522DEST_PATH_IMAGE016
(4)
进一步地,所述步骤2的具体实现方法如下:
步骤2.1,一般的,评价数据集聚类方法有如下度量指标:wmc表示每类加权方法,dit表示继承度,noc表示子类的数量、cbo表示对象耦合度、rfc表示对每个类的响应度,lcom表示低耦合度,ca表示输出耦合度,ce表示传入耦合度,npm表示基于公共方法的数量的方法,loc表示聚类算法代码行,dam表示数据访问量,moa表示数据放大值,mfa表示功能抽象化衡量标准,cam表示类方法内聚力指数,ic表示继承性耦合度指标,cbm表示方法之间的耦合评判指标,amc表示平均方法复杂度,max cc表示最大的类耦合度,avg cc表示平均类耦合度,各度量指标的度量值用MS = (ms 1 ,ms 2 ,ms 3 ,ms 4 ,ms 5 ,...,ms t )表示,t为度量指标的个数。度量值的和
Figure 879842DEST_PATH_IMAGE017
用于归一化分析,以确定该数据集是否适用于参数检验。在本发明提出的精准模糊聚类算法中,根据前述度量指标定义的数据集度量值被转换为p (x, y)点;xy的定义如公式(5),在这个公式中,x是前一半数据集度量指标的平均值,x i 是前一半各数据集各度量指标。y是后一半数据集度量指标的平均值,y i 是后一半各数据集各度量指标,因此度量指标对p(x, y)的确定起决定性作用,聚类中心的确定取决于p(x, y):
Figure 131832DEST_PATH_IMAGE018
(5)
步骤2.2,通过设计公式(6)定量描述影响精准模糊隶属矩阵的隶属系数:
Figure 64278DEST_PATH_IMAGE019
(6)
通过这个设计,每个隶属度值可以被以±50改变,这是通过各种试验得到的边界值。这意味着,根据数据集的各种度量指标组合,影响隶属度的最小值会发生变化。这个系数是通过用聚类软件测试数据集得到的不同度量值重新组合运算得到的,公式(6)中的wmc i 、lcom i 、rfc i 分别表示数据子集i采用每类加权方法、低耦合度方法、对每个类的响应度方法这三个度量指标算得的度量值,选取这三个度量指标作为本发明提出的精准模糊隶属矩阵生成系数的公式(6)中的运算指标,是根据目前评估聚类方法优劣的可维护性和响度指标值,以及数据测试得出的结论,这也是本发明方法的创新点,选取这三个重要度量指标作为精准模糊隶属矩阵隶属系数,从而确定聚类中心和对数据聚类:
步骤2.3,精准模糊聚类算法流程如下:
步骤2.3.1:以p(x,y)的形式输入所有数据集,模糊指数和隶属矩阵系数,
Figure 161547DEST_PATH_IMAGE020
p (x,y)在横轴上的投影,
Figure 525532DEST_PATH_IMAGE021
p(x,y)在纵轴上的投影;
步骤2.3.2:基于数据集和聚类中心数定义隶属矩阵U
步骤2.3.3:遍历所有数据集以创建初始隶属矩阵U
计算过程如下:
定义隶属度初值
Figure 682844DEST_PATH_IMAGE022
的计算公式如下:
Figure 601122DEST_PATH_IMAGE023
如果根据公式(6)计算得到的
Figure 502082DEST_PATH_IMAGE024
值大于10,则令
Figure 976967DEST_PATH_IMAGE025
如果根据公式(6)计算得到的
Figure 836338DEST_PATH_IMAGE024
值小于或等于10,则令
Figure 507491DEST_PATH_IMAGE026
Figure 212142DEST_PATH_IMAGE022
的值赋予
Figure 114501DEST_PATH_IMAGE027
步骤2.3.4:通过计算
Figure 144774DEST_PATH_IMAGE028
,获得每一个聚类的隶属矩阵,
并令
Figure 303223DEST_PATH_IMAGE029
p、q代表隶属矩阵U的第p行第q列;
步骤2.3.5:令
Figure 280406DEST_PATH_IMAGE030
步骤2.3.6:令max初始值为−1,将max与所有
Figure 706446DEST_PATH_IMAGE031
值进行比较。如果max <
Figure 642041DEST_PATH_IMAGE032
max赋值为
Figure 287786DEST_PATH_IMAGE033
,重新计算聚类指标。
虽然本发明提出的精准模糊聚类算法和模糊C均值之间有一些相似之处,但它们之间有很大的差异。差异从步骤2.3.1中定义的系数开始。在步骤2.3.2中定义隶属矩阵U后,根据系数指定隶属度
Figure 334239DEST_PATH_IMAGE034
的值。在
Figure 850671DEST_PATH_IMAGE034
中,i表示数据集的索引下标,j表示聚类中心集群的索引下标。这些值的和(sum2)将在下一步中计算。每个
Figure 691589DEST_PATH_IMAGE034
根据其模糊参数进行更新,并在步骤2.3.4中将
Figure 794936DEST_PATH_IMAGE034
的和赋给sum2
Figure 113922DEST_PATH_IMAGE034
值用步骤2.3.5中描述的公式重新定义。在最后一步中,令max初始值为−1,将max与所有
Figure 484860DEST_PATH_IMAGE034
值进行比较。如果
Figure 496679DEST_PATH_IMAGE035
max赋值为
Figure 320278DEST_PATH_IMAGE036
,重新计算聚类指标。
步骤2.4,精准模糊聚类算法精度优化算法如下:
如果聚类精度没有达到预期水平,该算法应该重新执行,直到精度达到预期水平。用步骤2.4.1-步骤2.4.4中给出的步骤来确保聚类算法的精度。首先给出了聚类参数和阈值(本发明为 threshold表示,阈值设为0.5)作为算法的输入。
Figure 708534DEST_PATH_IMAGE037
的值乘以p(x, y)点与聚类中心的欧氏距离并相加后得到的结果小于阈值,这意味着获得了所需的精度,当获得所需的精度时,暂停聚类计算;否则,重复步骤2.4.2。具体步骤为:
步骤2.4.1:输入聚类参数,阈值与迭代计数;
步骤2.4.2:计算目标函数
Figure 933979DEST_PATH_IMAGE038
Figure 116699DEST_PATH_IMAGE039
表示求欧氏距离,
Figure 191709DEST_PATH_IMAGE040
表示第q个聚类簇的聚类中心;
步骤2.4.3:计算聚类集群中心;
步骤2.4.4:如果J< threshold,跳出迭代,否则返回步骤2.4.2。
本发明还提供基于精准模糊聚类算法的居民电力数据聚类装置,包括:
精准模糊聚类算法实现模块:用于推导精准模糊聚类算法的目标函数,定义精准模糊聚类中心,计算隶属矩阵,控制精准模糊聚类算法的误差,使得精准模糊聚类算法的目标函数最小;
精准模糊聚类算法精度提升模块:根据评价数据集聚类方法的度量指标,选取与居民电力数据可维护性和响度指标值影响最大的每类加权方法、低耦合度方法、对每个类的响应度方法这三个度量指标算得的度量值重新组合运算,得到一个影响精准模糊隶属矩阵精度的隶属系数,从而确定精准模糊聚类算法的聚类中心,并运用精准模糊聚类算法对数据聚类。
精准模糊聚类算法实现模块具体包括用于执行以下步骤:
步骤1.1,对目标台区居民用户同一时间段内用电负荷进行负荷特性普查,通过对目标台区的HPLC智能电表进行数据读取,获得用户的用电数据,得到负荷特性数据;
步骤1.2,设S = (s 1 ,s 2 ,s 3 ,s 4 ,s 5, ...,s n )表示数量为n的电力数据集,D = (d 1, d 2, d 3, d 4, d 5, ...d n )表示数据集与其聚类中心的距离;从D中选择的任一d w (w=1,2,...,n)表示从数据集S中选择的s w 与其聚类中心的距离;设k为聚类簇数;通过模糊聚类方法将数据集划分为聚类中心群C = (c 1, c 2, c 3, ...,c k )
步骤1.3,提出精准模糊聚类算法,其目标函数设为
Figure 118077DEST_PATH_IMAGE001
,其隶属度区间为[0,1];使用式(1)表示
Figure 198028DEST_PATH_IMAGE001
Figure 551649DEST_PATH_IMAGE041
(1)
式中
Figure 349841DEST_PATH_IMAGE042
为模糊指数,
Figure 814320DEST_PATH_IMAGE043
用来计算
Figure 14357DEST_PATH_IMAGE044
与聚类中心
Figure 804459DEST_PATH_IMAGE045
之间的欧氏距离,
Figure 558788DEST_PATH_IMAGE046
表示隶属矩阵,
Figure 594002DEST_PATH_IMAGE047
表示
Figure 648546DEST_PATH_IMAGE048
与聚类中心
Figure 343970DEST_PATH_IMAGE049
的隶属度;
步骤1.4,聚类误差控制函数如公式(2);
Figure 382333DEST_PATH_IMAGE050
(2)
公式(2)的目的是使聚类误差之和最小,n为电力数据集数量,Error()表示聚类标签的误差函数,
Figure 188615DEST_PATH_IMAGE051
表示聚类标签;
步骤1.5,下述公式(3)用来初始化隶属度
Figure 628823DEST_PATH_IMAGE052
Figure 760728DEST_PATH_IMAGE053
(3)
式中,d w (w=1,2,...,n)表示从数据集S中选择的s w 与其聚类中心的距离
步骤1.6,通过公式(4)计算精准模糊聚类中心
Figure 253763DEST_PATH_IMAGE054
,然后迭代计算公式(2)和(3),直到使目标函数
Figure 129316DEST_PATH_IMAGE001
的值最小化:
Figure 892872DEST_PATH_IMAGE055
(4)
精准模糊聚类算法精度提升模块具体包括用于执行以下步骤:
步骤2.1,评价数据集聚类方法有如下度量指标:wmc表示每类加权方法,dit表示继承度,noc表示子类的数量、cbo表示对象耦合度、rfc表示对每个类的响应度,lcom表示低耦合度,ca表示输出耦合度,ce表示传入耦合度,npm表示基于公共方法的数量的方法,loc表示聚类算法代码行,dam表示数据访问量,moa表示数据放大值,mfa表示功能抽象化衡量标准,cam表示类方法内聚力指数,ic表示继承性耦合度指标,cbm表示方法之间的耦合评判指标,amc表示平均方法复杂度,max cc表示最大的类耦合度,avg cc表示平均类耦合度,各度量指标的度量值用MS = (ms 1 ,ms 2 ,ms 3 ,ms 4 ,ms 5 ,...,ms t )表示,t为度量指标的个数;度量值的和
Figure 930098DEST_PATH_IMAGE056
用于归一化分析,以确定该数据集是否适用于参数检验;在提出的精准模糊聚类算法中,根据前述度量指标定义的数据集度量值被转换为p(x, y)点;xy的定义如公式(5),在这个公式中,x是前一半数据集度量指标的平均值,x i 是前一半各数据集各度量指标;y是后一半数据集度量指标的平均值,y i 是后一半各数据集各度量指标,因此度量指标对p(x, y)的确定起决定性作用,聚类中心的确定取决于p(x, y):
Figure 677475DEST_PATH_IMAGE057
(5)
步骤2.2,通过设计公式(6)定量描述影响精准模糊隶属矩阵的隶属系数:
Figure 825559DEST_PATH_IMAGE058
(6)
通过这个设计,每个隶属度值被以±50改变,公式(6)中的wmc i 、lcom i 、rfc i 分别表示数据子集i采用每类加权方法、低耦合度方法、对每个类的响应度方法这三个度量指标算得的度量值,选取这三个重要度量指标作为精准模糊隶属矩阵隶属系数,从而确定聚类中心和对数据聚类;
步骤2.3,精准模糊聚类算法流程如下:
步骤2.3.1:以p(x,y)的形式输入所有数据集,模糊指数和隶属矩阵系数,
Figure 709202DEST_PATH_IMAGE059
p (x,y)在横轴上的投影,
Figure 917329DEST_PATH_IMAGE060
p(x,y)在纵轴上的投影;
步骤2.3.2:基于数据集和聚类中心数定义隶属矩阵U
步骤2.3.3:遍历所有数据集以创建初始隶属矩阵U
计算过程如下:
定义隶属度初值
Figure 620843DEST_PATH_IMAGE061
的计算公式如下:
Figure 838197DEST_PATH_IMAGE062
如果根据公式(6)计算得到的
Figure 77811DEST_PATH_IMAGE063
值大于10,则令
Figure 456840DEST_PATH_IMAGE064
如果根据公式(6)计算得到的
Figure 913229DEST_PATH_IMAGE063
值小于或等于10,则令
Figure 668695DEST_PATH_IMAGE065
Figure 526930DEST_PATH_IMAGE061
的值赋予
Figure 76860DEST_PATH_IMAGE066
步骤2.3.4:通过计算
Figure 754966DEST_PATH_IMAGE067
,获得每一个聚类的隶属矩阵,
并令
Figure 314123DEST_PATH_IMAGE068
p、q代表隶属矩阵U的第p行第q列;
步骤2.3.5:令
Figure 761285DEST_PATH_IMAGE069
步骤2.3.6:令max初始值为−1,将max与所有
Figure 246231DEST_PATH_IMAGE070
值进行比较;如果max <
Figure 677212DEST_PATH_IMAGE071
max赋值为
Figure 508902DEST_PATH_IMAGE072
,重新计算聚类指标;
步骤2.4,精准模糊聚类算法精度优化算法如下:
如果聚类精度没有达到预期水平,该算法应该重新执行,直到精度达到预期水平,用步骤2.4.1-步骤2.4.4中给出的步骤来确保聚类算法的精度;首先给出了聚类参数和阈值threshold,阈值设为0.5,作为算法的输入;
Figure 76150DEST_PATH_IMAGE073
的值乘以p(x, y)点与聚类中心的欧氏距离并相加后得到的结果小于阈值,这意味着获得了所需的精度,当获得所需的精度时,暂停聚类计算;否则,重复步骤2.4.2;具体步骤为:
步骤2.4.1:输入聚类参数,阈值与迭代计数;
步骤2.4.2:计算目标函数
Figure 233461DEST_PATH_IMAGE038
Figure 886160DEST_PATH_IMAGE074
表示求欧氏距离,
Figure 787120DEST_PATH_IMAGE075
表示第q个聚类簇的聚类中心;
步骤2.4.3:计算聚类集群中心;
步骤2.4.4:如果J< threshold,跳出迭代,否则返回步骤2.4.2。
本发明的有益效果是:
相比于传统的模糊C均值(FCM)算法在确定集群的隶属度方面不够精准,本发明通过设计一个与聚类算法评估关键度量指标相关的公式,定量描述影响模糊隶属矩阵精准度的隶属系数,通过这个设计,每个隶属度值可以被以±50改变,提高了模糊C均值聚类算法的准确度和精度,聚类算法的可维护性和响度指标值也得到优化,并将该精准模糊聚类算法应用于居民客户聚类工作,应用效果证实了所提出的聚合理论对电力数据的适应性,为电网侧针对不同用户定制异质性电力套餐的过程提供科学的依据。
附图说明
图1为本发明优选实施例中基于精准模糊聚类算法的居民电力数据聚类方法的流程框图;
图2为本发明优选实施例中基于精准模糊聚类算法的居民电力数据聚类装置的结构图;
图3为电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明的一部分实施例,而不是全部的实施例。
如图1所示,基于精准模糊聚类算法的居民电力数据聚类方法,包括:
步骤1、使用传统模糊C聚类算法确定数据集聚类中心,推导精准模糊聚类算法的目标函数,并定义精准模糊聚类中心,计算隶属矩阵,控制精准模糊聚类算法的误差,使得精准模糊聚类算法的目标函数最小;
步骤2、根据评价数据集聚类方法的度量指标,选取与居民电力数据可维护性和响度指标值影响最大的每类加权方法、低耦合度方法、对每个类的响应度方法这三个度量指标算得的度量值重新组合运算,得到一个影响精准模糊隶属矩阵精度的隶属系数,从而确定精准模糊聚类算法的聚类中心,并运用精准模糊聚类算法对数据聚类。
进一步地,所述步骤1具体实现方法如下:
步骤1.1,对目标台区居民用户同一时间段内用电负荷进行负荷特性普查,通过对目标台区的HPLC智能电表进行数据读取,获得用户的用电数据,得到负荷特性数据。
步骤1.2,设S = (s 1 ,s 2 ,s 3 ,s 4 ,s 5, ...,s n )表示数量为n的电力数据集,D = (d 1, d 2, d 3, d 4, d 5, ...d n )表示数据集与其聚类中心的距离。从D中选择的任一d w (w=1,2,...,n)表示从数据集S中选择的s w 与其聚类中心的距离。设k为聚类簇数;然后,通过模糊聚类方法将数据集划分为聚类中心群C = (c 1, c 2, c 3, ...,c k )
步骤1.3,提出精准模糊聚类算法,其目标函数设为
Figure 474453DEST_PATH_IMAGE001
,其隶属度区间为[0,1]。使用式(1)表示
Figure 537087DEST_PATH_IMAGE001
Figure 178546DEST_PATH_IMAGE076
(1)
式中
Figure 617618DEST_PATH_IMAGE077
为模糊指数。
Figure 893878DEST_PATH_IMAGE078
用来计算
Figure 392993DEST_PATH_IMAGE079
与聚类中心
Figure 20283DEST_PATH_IMAGE080
之间的欧氏距离,
Figure 263046DEST_PATH_IMAGE081
表示隶属矩阵,
Figure 924971DEST_PATH_IMAGE082
表示
Figure 329408DEST_PATH_IMAGE083
与聚类中心
Figure 178415DEST_PATH_IMAGE054
的隶属度。
步骤1.4,聚类误差控制函数如公式(2);
Figure 723403DEST_PATH_IMAGE084
(2)
公式(2)的目的是使聚类误差之和最小,n为电力数据集数量。Error()表示聚类标签的误差函数;
Figure 974256DEST_PATH_IMAGE085
表示聚类标签;
步骤1.5,下述公式(3)用来初始化隶属度
Figure 80752DEST_PATH_IMAGE052
Figure 151477DEST_PATH_IMAGE086
(3)
式中,d w (w=1,2,...,n)表示从数据集S中选择的s w 与其聚类中心的距离。
步骤1.6,通过公式(4)计算精准模糊聚类中心
Figure 736042DEST_PATH_IMAGE015
,然后迭代计算公式(2)和(3),直到使目标函数
Figure 106980DEST_PATH_IMAGE001
的值最小化:
Figure 118799DEST_PATH_IMAGE087
(4)
进一步地,所述步骤2的具体实现方法如下:
步骤2.1,一般的,评价数据集聚类方法有如下度量指标:wmc表示每类加权方法,dit表示继承度,noc表示子类的数量、cbo表示对象耦合度、rfc表示对每个类的响应度,lcom表示低耦合度,ca表示输出耦合度,ce表示传入耦合度,npm表示基于公共方法的数量的方法,loc表示聚类算法代码行,dam表示数据访问量,moa表示数据放大值,mfa表示功能抽象化衡量标准,cam表示类方法内聚力指数,ic表示继承性耦合度指标,cbm表示方法之间的耦合评判指标,amc表示平均方法复杂度,max cc表示最大的类耦合度,avg cc表示平均类耦合度,各度量指标的度量值用MS = (ms 1 ,ms 2 ,ms 3 ,ms 4 ,ms 5 ,...,ms t )表示,t为度量指标的个数。度量值的和
Figure 207977DEST_PATH_IMAGE088
用于归一化分析,以确定该数据集是否适用于参数检验。在本发明提出的精准模糊聚类算法中,根据前述度量指标定义的数据集度量值被转换为p (x, y)点;xy的定义如公式(5),在这个公式中,x是前一半数据集度量指标的平均值,x i 是前一半各数据集各度量指标。y是后一半数据集度量指标的平均值,y i 是后一半各数据集各度量指标,因此度量指标对p(x, y)的确定起决定性作用,聚类中心的确定取决于p(x, y):
Figure 330654DEST_PATH_IMAGE089
(5)
步骤2.2,通过设计公式(6)定量描述影响精准模糊隶属矩阵的隶属系数:
Figure 57564DEST_PATH_IMAGE090
(6)
通过这个设计,每个隶属度值可以被以±50改变,这是通过各种试验得到的边界值。这意味着,根据数据集的各种度量指标组合,影响隶属度的最小值会发生变化。这个系数是通过用聚类软件测试数据集得到的不同度量值重新组合运算得到的,公式(6)中的wmc i 、lcom i 、rfc i 分别表示数据子集i采用每类加权方法、低耦合度方法、对每个类的响应度方法这三个度量指标算得的度量值,选取这三个度量指标作为本发明提出的精准模糊隶属矩阵生成系数的公式(6)中的运算指标,是根据目前评估聚类方法优劣的可维护性和响度指标值,以及数据测试得出的结论,这也是本发明方法的创新点,选取这三个重要度量指标作为精准模糊隶属矩阵隶属系数,从而确定聚类中心和对数据聚类:
步骤2.3,精准模糊聚类算法流程如下:
步骤2.3.1:以p(x,y)的形式输入所有数据集,模糊指数和隶属矩阵系数,
Figure 240284DEST_PATH_IMAGE091
p (x,y)在横轴上的投影,
Figure 551179DEST_PATH_IMAGE092
p(x,y)在纵轴上的投影;
步骤2.3.2:基于数据集和聚类中心数定义隶属矩阵U
步骤2.3.3:遍历所有数据集以创建初始隶属矩阵U
计算过程如下:
定义隶属度初值
Figure 477547DEST_PATH_IMAGE093
的计算公式如下:
Figure 823078DEST_PATH_IMAGE094
如果根据公式(6)计算得到的
Figure 911119DEST_PATH_IMAGE095
值大于10,则令
Figure 709311DEST_PATH_IMAGE096
如果根据公式(6)计算得到的
Figure 439370DEST_PATH_IMAGE095
值小于或等于10,则令
Figure 639407DEST_PATH_IMAGE097
Figure 662464DEST_PATH_IMAGE093
的值赋予
Figure 947952DEST_PATH_IMAGE098
步骤2.3.4:通过计算
Figure 216122DEST_PATH_IMAGE099
,获得每一个聚类的隶属矩阵,
并令
Figure 536245DEST_PATH_IMAGE100
p、q代表隶属矩阵U的第p行第q列;
步骤2.3.5:令
Figure 293986DEST_PATH_IMAGE101
步骤2.3.6:令max初始值为−1,将max与所有
Figure 66770DEST_PATH_IMAGE102
值进行比较。如果max <
Figure 640096DEST_PATH_IMAGE071
max赋值为
Figure 549146DEST_PATH_IMAGE103
,重新计算聚类指标。
虽然本发明提出的精准模糊聚类算法和模糊C均值之间有一些相似之处,但它们之间有很大的差异。差异从步骤2.3.1中定义的系数开始。在步骤2.3.2中定义隶属矩阵U后,根据系数指定隶属度
Figure 681050DEST_PATH_IMAGE104
的值。在
Figure 675551DEST_PATH_IMAGE104
中,i表示数据集的索引下标,j表示聚类中心集群的索引下标。这些值的和(sum2)将在下一步中计算。每个
Figure 285524DEST_PATH_IMAGE104
根据其模糊参数进行更新,并在步骤2.3.4中将
Figure 49080DEST_PATH_IMAGE104
的和赋给sum2
Figure 351886DEST_PATH_IMAGE104
值用步骤2.3.5中描述的公式重新定义。在最后一步中,令max初始值为−1,将max与所有
Figure 568103DEST_PATH_IMAGE104
值进行比较。如果max <
Figure 981767DEST_PATH_IMAGE104
max赋值为
Figure 363945DEST_PATH_IMAGE105
,重新计算聚类指标。
步骤2.4,精准模糊聚类算法精度优化算法如下:
如果聚类精度没有达到预期水平,该算法应该重新执行,直到精度达到预期水平。用步骤2.4.1-步骤2.4.4中给出的步骤来确保聚类算法的精度。首先给出了聚类参数和阈值(本发明为 threshold表示,阈值设为0.5)作为算法的输入。
Figure 837651DEST_PATH_IMAGE106
的值乘以p(x, y)点与聚类中心的欧氏距离并相加后得到的结果小于阈值,这意味着获得了所需的精度,当获得所需的精度时,暂停聚类计算;否则,重复步骤2.4.2。具体步骤为:
步骤2.4.1:输入聚类参数,阈值与迭代计数;
步骤2.4.2:计算目标函数
Figure 541165DEST_PATH_IMAGE038
Figure 758520DEST_PATH_IMAGE107
表示求欧氏距离,
Figure 496669DEST_PATH_IMAGE108
表示第q个聚类簇的聚类中心;
步骤2.4.3:计算聚类集群中心;
步骤2.4.4:如果J< threshold,跳出迭代,否则返回步骤2.4.2。
为便于对本发明的理解,结合实例对本发明基于精准模糊聚类算法的居民电力数据聚类方法进行较为详细的方法过程描述:
随机选取12个有效样本(参与需求响应的居民用户用电信息)进行聚类,根据需求响应开展的进程,以需求响应时间段为核心选取了8个指标维度,如下表1所示:
表1 居民用电数据
Figure 875697DEST_PATH_IMAGE109
通过基于精准模糊聚类算法的居民电力数据聚类方法进行聚类,可以得到下表2:
表2基于精准模糊聚类算法的居民电力数据聚类结果
Figure 332087DEST_PATH_IMAGE110
聚类中心见下表3:
表3 聚类中心
Figure 979231DEST_PATH_IMAGE111
可以看出:样本3,4,8,9,10,11归为第一类,见下表4:
表4 聚类结果1
Figure 837465DEST_PATH_IMAGE112
样本2,6,12归为第二类,见下表5:
表5聚类结果2
Figure 387396DEST_PATH_IMAGE113
样本1,5,7归为第三类,见下表6:
表6聚类结果3
Figure 331081DEST_PATH_IMAGE114
如图2所示,基于精准模糊聚类算法的居民电力数据聚类装置,包括:
精准模糊聚类算法实现模块210:用于推导精准模糊聚类算法的目标函数,定义精准模糊聚类中心,计算隶属矩阵,控制精准模糊聚类算法的误差,使得精准模糊聚类算法的目标函数最小;
精准模糊聚类算法精度提升模块220:根据评价数据集聚类方法的度量指标,选取与居民电力数据可维护性和响度指标值影响最大的每类加权方法、低耦合度方法、对每个类的响应度方法这三个度量指标算得的度量值重新组合运算,得到一个影响精准模糊隶属矩阵精度的隶属系数,从而确定精准模糊聚类算法的聚类中心,并运用精准模糊聚类算法对数据聚类。
应当理解,图2中的诸模块与参考图1中描述的方法中的各个步骤相对应。由此,上文针对方法描述的操作和特征以及相应的技术效果同样适用于图2中的诸模块,在此不再赘述。
在另一些实施例中,本发明实施例还提供了一种非易失性计算机存储介质,计算机存储介质存储有计算机可执行指令,该计算机可执行指令可执行上述方法实施例中的基于精准模糊聚类算法的居民电力数据聚类方法。
作为一种实施方式,本发明的非易失性计算机存储介质存储有计算机可执行指令,非易失性计算机可读存储介质可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据基于精准模糊聚类算法的居民电力数据聚类装置使用过程中所创建的数据等。此外,非易失性计算机可读存储介质可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,非易失性计算机可读存储介质可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至基于精准模糊聚类算法的居民电力数据聚类装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
本发明实施例还提供一种计算机程序产品,计算机程序产品包括存储在非易失性计算机可读存储介质上的计算机程序,计算机程序包括程序指令,当程序指令被计算机执行时,使计算机执行上述基于精准模糊聚类算法的居民电力数据聚类方法。
图3是本发明实施例提供的电子设备的结构示意图,该设备包括:一个或多个处理器310以及存储器320,图3中以一个处理器310为例。电子设备还可以包括:输入装置330和输出装置340。处理器310、存储器320、输入装置330和输出装置340可以通过总线或者其他方式连接,图3中以通过总线连接为例。存储器320为上述的非易失性计算机可读存储介质。处理器310通过运行存储在存储器320中的非易失性软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例基于精准模糊聚类算法的居民电力数据聚类方法。输入装置330可接收输入的数字或字符信息,以及产生与基于精准模糊聚类算法的居民电力数据聚类装置的用户设置以及功能控制有关的键信号输入。输出装置340可包括显示屏等显示设备。
上述产品可执行本发明实施例所提供的方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明实施例所提供的方法。
作为一种实施方式,上述电子设备应用于基于精准模糊聚类算法的居民电力数据聚类装置中,用于客户端,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行计算机存储介质存储的指令。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (8)

1.基于精准模糊聚类算法的居民电力数据聚类方法,其特征在于:包括以下步骤:
步骤1、使用传统模糊C聚类算法确定数据集聚类中心,推导精准模糊聚类算法的目标函数,并定义精准模糊聚类中心,计算隶属矩阵,控制精准模糊聚类算法的误差,使得精准模糊聚类算法的目标函数最小;
步骤2、根据评价数据集聚类方法的度量指标,选取与居民电力数据可维护性和响度指标值影响最大的每类加权方法、低耦合度方法、对每个类的响应度方法这三个度量指标算得的度量值重新组合运算,得到一个影响精准模糊隶属矩阵精度的隶属系数,从而确定精准模糊聚类算法的聚类中心,并运用精准模糊聚类算法对数据聚类。
2.根据权利要求1所述的基于精准模糊聚类算法的居民电力数据聚类方法,其特征在于:所述步骤1的具体实现方法如下:
步骤1.1,对目标台区居民用户同一时间段内用电负荷进行负荷特性普查,通过对目标台区的HPLC智能电表进行数据读取,获得用户的用电数据,得到负荷特性数据;
步骤1.2,设S = (s 1 ,s 2 ,s 3 ,s 4 ,s 5, ...,s n )表示数量为n的电力数据集,D = (d 1, d 2, d 3, d 4, d 5, ...d n )表示数据集与其聚类中心的距离;从D中选择的任一d w (w=1,2,...,n)表示从数据集S中选择的s w 与其聚类中心的距离;设k为聚类簇数;通过模糊聚类方法将数据集划分为聚类中心群C = (c 1, c 2, c 3, ...,c k )
步骤1.3,提出精准模糊聚类算法,其目标函数设为
Figure 254711DEST_PATH_IMAGE001
,其隶属度区间为[0,1];使用式(1)表示
Figure 906273DEST_PATH_IMAGE001
Figure 154851DEST_PATH_IMAGE002
(1)
式中
Figure 284481DEST_PATH_IMAGE003
为模糊指数,
Figure 567695DEST_PATH_IMAGE004
用来计算
Figure 858999DEST_PATH_IMAGE005
与聚类中心
Figure 860453DEST_PATH_IMAGE006
之间的欧氏距离,
Figure 262616DEST_PATH_IMAGE007
表示隶属矩阵,
Figure 665915DEST_PATH_IMAGE008
表示
Figure 626656DEST_PATH_IMAGE009
与聚类中心
Figure 849827DEST_PATH_IMAGE010
的隶属度;
步骤1.4,聚类误差控制函数如公式(2);
Figure 55680DEST_PATH_IMAGE011
(2)
公式(2)的目的是使聚类误差之和最小,n为电力数据集数量,Error()表示聚类标签的误差函数,
Figure 47907DEST_PATH_IMAGE012
表示聚类标签;
步骤1.5,下述公式(3)用来初始化隶属度
Figure 946593DEST_PATH_IMAGE013
Figure 922639DEST_PATH_IMAGE014
(3)
式中,d w (w=1,2,...,n)表示从数据集S中选择的s w 与其聚类中心的距离;
步骤1.6,通过公式(4)计算精准模糊聚类中心
Figure 666604DEST_PATH_IMAGE015
,然后迭代计算公式(2)和(3),直到使目标函数
Figure 778917DEST_PATH_IMAGE001
的值最小化:
Figure 582924DEST_PATH_IMAGE016
(4) 。
3.根据权利要求2所述的基于精准模糊聚类算法的居民电力数据聚类方法,其特征在于:所述步骤2的具体实现方法如下:
步骤2.1,评价数据集聚类方法有如下度量指标:wmc表示每类加权方法,dit表示继承度,noc表示子类的数量、cbo表示对象耦合度、rfc表示对每个类的响应度,lcom表示低耦合度,ca表示输出耦合度,ce表示传入耦合度,npm表示基于公共方法的数量的方法,loc表示聚类算法代码行,dam表示数据访问量,moa表示数据放大值,mfa表示功能抽象化衡量标准,cam表示类方法内聚力指数,ic 表示继承性耦合度指标,cbm表示方法之间的耦合评判指标,amc表示平均方法复杂度,max cc表示最大的类耦合度,avg cc表示平均类耦合度,各度量指标的度量值用MS = (ms 1 ,ms 2 ,ms 3 ,ms 4 ,ms 5 ,...,ms t )表示,t为度量指标的个数;度量值的和
Figure 279223DEST_PATH_IMAGE017
用于归一化分析,以确定该数据集是否适用于参数检验;在提出的精准模糊聚类算法中,根据前述度量指标定义的数据集度量值被转换为p(x, y)点;xy的定义如公式(5),在这个公式中,x是前一半数据集度量指标的平均值,x i 是前一半各数据集各度量指标;y是后一半数据集度量指标的平均值,y i 是后一半各数据集各度量指标,因此度量指标对p(x, y)的确定起决定性作用,聚类中心的确定取决于p(x, y):
Figure 826879DEST_PATH_IMAGE018
(5)
步骤2.2,通过设计公式(6)定量描述影响精准模糊隶属矩阵的隶属系数:
Figure 793698DEST_PATH_IMAGE019
(6)
通过这个设计,每个隶属度值被以±50改变,公式(6)中的wmc i 、lcom i 、rfc i 分别表示数据子集i采用每类加权方法、低耦合度方法、对每个类的响应度方法这三个度量指标算得的度量值,选取这三个重要度量指标作为精准模糊隶属矩阵隶属系数,从而确定聚类中心和对数据聚类;
步骤2.3,精准模糊聚类算法流程如下:
步骤2.3.1:以p(x,y)的形式输入所有数据集,模糊指数和隶属矩阵系数,
Figure 34186DEST_PATH_IMAGE020
p(x,y)在横轴上的投影,
Figure 453666DEST_PATH_IMAGE021
p(x,y)在纵轴上的投影;
步骤2.3.2:基于数据集和聚类中心数定义隶属矩阵U
步骤2.3.3:遍历所有数据集以创建初始隶属矩阵U
计算过程如下:
定义隶属度初值
Figure 70592DEST_PATH_IMAGE022
的计算公式如下:
Figure 891918DEST_PATH_IMAGE023
如果根据公式(6)计算得到的
Figure 303308DEST_PATH_IMAGE024
值大于10,则令
Figure 708619DEST_PATH_IMAGE025
如果根据公式(6)计算得到的
Figure 598078DEST_PATH_IMAGE026
值小于或等于10,则令
Figure 539489DEST_PATH_IMAGE027
Figure 121780DEST_PATH_IMAGE022
的值赋予
Figure 781431DEST_PATH_IMAGE028
步骤2.3.4:通过计算
Figure 474581DEST_PATH_IMAGE029
,获得每一个聚类的隶属矩阵,
并令
Figure 270498DEST_PATH_IMAGE030
p、q代表隶属矩阵U的第p行第q列;
步骤2.3.5:令
Figure 23691DEST_PATH_IMAGE031
步骤2.3.6:令max初始值为−1,将max与所有
Figure 170638DEST_PATH_IMAGE013
值进行比较;如果max <
Figure 667479DEST_PATH_IMAGE032
max赋值为max =
Figure 917955DEST_PATH_IMAGE032
,重新计算聚类指标;
步骤2.4,精准模糊聚类算法精度优化算法如下:
如果聚类精度没有达到预期水平,该算法应该重新执行,直到精度达到预期水平,用步骤2.4.1-步骤2.4.4中给出的步骤来确保聚类算法的精度;首先给出了聚类参数和阈值threshold,阈值设为0.5,作为算法的输入;
Figure 576469DEST_PATH_IMAGE033
的值乘以p(x, y)点与聚类中心的欧氏距离并相加后得到的结果小于阈值,这意味着获得了所需的精度,当获得所需的精度时,暂停聚类计算;否则,重复步骤2.4.2;具体步骤为:
步骤2.4.1:输入聚类参数,阈值与迭代计数;
步骤2.4.2:计算目标函数
Figure 210713DEST_PATH_IMAGE034
Figure 245665DEST_PATH_IMAGE035
表示求欧氏距离,
Figure 281754DEST_PATH_IMAGE036
表示第q个聚类簇的聚类中心;
步骤2.4.3:计算聚类集群中心;
步骤2.4.4:如果J< threshold,跳出迭代,否则返回步骤2.4.2。
4.基于精准模糊聚类算法的居民电力数据聚类装置,其特征在于:包括:
精准模糊聚类算法实现模块:用于推导精准模糊聚类算法的目标函数,定义精准模糊聚类中心,计算隶属矩阵,控制精准模糊聚类算法的误差,使得精准模糊聚类算法的目标函数最小;
精准模糊聚类算法精度提升模块:根据评价数据集聚类方法的度量指标,选取与居民电力数据可维护性和响度指标值影响最大的每类加权方法、低耦合度方法、对每个类的响应度方法这三个度量指标算得的度量值重新组合运算,得到一个影响精准模糊隶属矩阵精度的隶属系数,从而确定精准模糊聚类算法的聚类中心,并运用精准模糊聚类算法对数据聚类。
5.根据权利要求4所述的基于精准模糊聚类算法的居民电力数据聚类装置,其特征在于:所述精准模糊聚类算法实现模块具体包括用于执行以下步骤:
步骤1.1,对目标台区居民用户同一时间段内用电负荷进行负荷特性普查,通过对目标台区的HPLC智能电表进行数据读取,获得用户的用电数据,得到负荷特性数据;
步骤1.2,设S = (s 1 ,s 2 ,s 3 ,s 4 ,s 5, ...,s n )表示数量为n的电力数据集,D = (d 1, d 2, d 3, d 4, d 5, ...d n )表示数据集与其聚类中心的距离;从D中选择的任一d w (w=1,2,...,n)表示从数据集S中选择的s w 与其聚类中心的距离;设k为聚类簇数;通过模糊聚类方法将数据集划分为聚类中心群C = (c 1, c 2, c 3, ...,c k )
步骤1.3,提出精准模糊聚类算法,其目标函数设为
Figure 376749DEST_PATH_IMAGE001
,其隶属度区间为[0,1];使用式(1)表示
Figure 232710DEST_PATH_IMAGE001
Figure 336932DEST_PATH_IMAGE037
(1)
式中
Figure 430790DEST_PATH_IMAGE038
为模糊指数,
Figure 696686DEST_PATH_IMAGE039
用来计算
Figure 538478DEST_PATH_IMAGE040
与聚类中心
Figure 180812DEST_PATH_IMAGE041
之间的欧氏距离,
Figure 925914DEST_PATH_IMAGE042
表示隶属矩阵,
Figure 362712DEST_PATH_IMAGE043
表示
Figure 927685DEST_PATH_IMAGE044
与聚类中心
Figure 373710DEST_PATH_IMAGE045
的隶属度;
步骤1.4,聚类误差控制函数如公式(2);
Figure 707739DEST_PATH_IMAGE046
(2)
公式(2)的目的是使聚类误差之和最小,n为电力数据集数量,Error()表示聚类标签的误差函数,
Figure 581017DEST_PATH_IMAGE047
表示聚类标签;
步骤1.5,下述公式(3)用来初始化隶属度
Figure 633287DEST_PATH_IMAGE048
Figure 617424DEST_PATH_IMAGE049
(3)
式中,d w (w=1,2,...,n)表示从数据集S中选择的s w 与其聚类中心的距离;
步骤1.6,通过公式(4)计算精准模糊聚类中心
Figure 570074DEST_PATH_IMAGE050
,然后迭代计算公式(2)和(3),直到使目标函数
Figure 614253DEST_PATH_IMAGE001
的值最小化:
Figure 153819DEST_PATH_IMAGE051
(4) 。
6.根据权利要求5所述的基于精准模糊聚类算法的居民电力数据聚类装置,其特征在于:所述精准模糊聚类算法精度提升模块具体包括用于执行以下步骤:
步骤2.1,评价数据集聚类方法有如下度量指标:wmc表示每类加权方法,dit表示继承度,noc表示子类的数量、cbo表示对象耦合度、rfc表示对每个类的响应度,lcom表示低耦合度,ca表示输出耦合度,ce表示传入耦合度,npm表示基于公共方法的数量的方法,loc表示聚类算法代码行,dam表示数据访问量,moa表示数据放大值,mfa表示功能抽象化衡量标准,cam表示类方法内聚力指数,ic 表示继承性耦合度指标,cbm表示方法之间的耦合评判指标,amc表示平均方法复杂度,max cc表示最大的类耦合度,avg cc表示平均类耦合度,各度量指标的度量值用MS = (ms 1 ,ms 2 ,ms 3 ,ms 4 ,ms 5 ,...,ms t )表示,t为度量指标的个数;度量值的和
Figure 941646DEST_PATH_IMAGE052
用于归一化分析,以确定该数据集是否适用于参数检验;在提出的精准模糊聚类算法中,根据前述度量指标定义的数据集度量值被转换为p(x, y)点;xy的定义如公式(5),在这个公式中,x是前一半数据集度量指标的平均值,x i 是前一半各数据集各度量指标;y是后一半数据集度量指标的平均值,y i 是后一半各数据集各度量指标,因此度量指标对p(x, y)的确定起决定性作用,聚类中心的确定取决于p(x, y):
Figure 250268DEST_PATH_IMAGE053
(5)
步骤2.2,通过设计公式(6)定量描述影响精准模糊隶属矩阵的隶属系数:
Figure 465349DEST_PATH_IMAGE054
(6)
通过这个设计,每个隶属度值被以±50改变,公式(6)中的wmc i 、lcom i 、rfc i 分别表示数据子集i采用每类加权方法、低耦合度方法、对每个类的响应度方法这三个度量指标算得的度量值,选取这三个重要度量指标作为精准模糊隶属矩阵隶属系数,从而确定聚类中心和对数据聚类;
步骤2.3,精准模糊聚类算法流程如下:
步骤2.3.1:以p(x,y)的形式输入所有数据集,模糊指数和隶属矩阵系数,
Figure 226631DEST_PATH_IMAGE055
p(x,y)在横轴上的投影,
Figure 818150DEST_PATH_IMAGE056
p(x,y)在纵轴上的投影;
步骤2.3.2:基于数据集和聚类中心数定义隶属矩阵U
步骤2.3.3:遍历所有数据集以创建初始隶属矩阵U
计算过程如下:
定义隶属度初值
Figure 981278DEST_PATH_IMAGE057
的计算公式如下:
Figure 367260DEST_PATH_IMAGE058
如果根据公式(6)计算得到的
Figure 881418DEST_PATH_IMAGE059
值大于10,则令
Figure 509583DEST_PATH_IMAGE060
如果根据公式(6)计算得到的
Figure 527217DEST_PATH_IMAGE059
值小于或等于10,则令
Figure 349680DEST_PATH_IMAGE061
Figure 85555DEST_PATH_IMAGE057
的值赋予
Figure 18876DEST_PATH_IMAGE062
步骤2.3.4:通过计算
Figure 891017DEST_PATH_IMAGE063
,获得每一个聚类的隶属矩阵,
并令
Figure 884380DEST_PATH_IMAGE064
p、q代表隶属矩阵U的第p行第q列;
步骤2.3.5:令
Figure 107551DEST_PATH_IMAGE065
步骤2.3.6:令max初始值为−1,将max与所有
Figure 313405DEST_PATH_IMAGE066
值进行比较;如果max <
Figure 571211DEST_PATH_IMAGE067
max赋值为
Figure 968432DEST_PATH_IMAGE068
,重新计算聚类指标;
步骤2.4,精准模糊聚类算法精度优化算法如下:
如果聚类精度没有达到预期水平,该算法应该重新执行,直到精度达到预期水平,用步骤2.4.1-步骤2.4.4中给出的步骤来确保聚类算法的精度;首先给出了聚类参数和阈值threshold,阈值设为0.5,作为算法的输入;
Figure 678899DEST_PATH_IMAGE069
的值乘以p(x, y)点与聚类中心的欧氏距离并相加后得到的结果小于阈值,这意味着获得了所需的精度,当获得所需的精度时,暂停聚类计算;否则,重复步骤2.4.2;具体步骤为:
步骤2.4.1:输入聚类参数,阈值与迭代计数;
步骤2.4.2:计算目标函数
Figure 688443DEST_PATH_IMAGE034
Figure 66335DEST_PATH_IMAGE070
表示求欧氏距离,
Figure 870343DEST_PATH_IMAGE071
表示第q个聚类簇的聚类中心;
步骤2.4.3:计算聚类集群中心;
步骤2.4.4:如果J< threshold,跳出迭代,否则返回步骤2.4.2。
7.一种电子设备,其特征在于:包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1至3任一项所述的基于精准模糊聚类算法的居民电力数据聚类方法的步骤。
8.一种存储介质,其上存储有计算机程序,其特征在于:所述程序被处理器执行时实现权利要求1至3任一项所述的基于精准模糊聚类算法的居民电力数据聚类方法的步骤。
CN202111526678.XA 2021-12-15 2021-12-15 基于精准模糊聚类算法的居民电力数据聚类方法及装置 Active CN113919449B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111526678.XA CN113919449B (zh) 2021-12-15 2021-12-15 基于精准模糊聚类算法的居民电力数据聚类方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111526678.XA CN113919449B (zh) 2021-12-15 2021-12-15 基于精准模糊聚类算法的居民电力数据聚类方法及装置

Publications (2)

Publication Number Publication Date
CN113919449A true CN113919449A (zh) 2022-01-11
CN113919449B CN113919449B (zh) 2022-03-15

Family

ID=79249184

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111526678.XA Active CN113919449B (zh) 2021-12-15 2021-12-15 基于精准模糊聚类算法的居民电力数据聚类方法及装置

Country Status (1)

Country Link
CN (1) CN113919449B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104268402A (zh) * 2014-09-25 2015-01-07 国家电网公司 一种基于模糊c均值的电力系统负荷聚类方法
WO2015001416A1 (en) * 2013-07-05 2015-01-08 Tata Consultancy Services Limited Multi-dimensional data clustering
CN107133176A (zh) * 2017-05-09 2017-09-05 武汉大学 一种基于半监督聚类数据筛选的跨项目缺陷预测方法
CN109902915A (zh) * 2019-01-11 2019-06-18 国网浙江省电力有限公司 一种基于模糊c均值模型的电水气用能行为分析方法
CN111782512A (zh) * 2020-06-23 2020-10-16 北京高质系统科技有限公司 基于不平衡噪声集的多特征软件缺陷综合预测方法
US20210081827A1 (en) * 2019-07-15 2021-03-18 Guangdong University Of Technology Fast clustering algorithm based on kernel fuzzy c-means integrated with spatial constraints
CN113688960A (zh) * 2021-10-27 2021-11-23 南昌工程学院 基于灰狼优化ghfcm的居民电力数据聚类方法及装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015001416A1 (en) * 2013-07-05 2015-01-08 Tata Consultancy Services Limited Multi-dimensional data clustering
CN104268402A (zh) * 2014-09-25 2015-01-07 国家电网公司 一种基于模糊c均值的电力系统负荷聚类方法
CN107133176A (zh) * 2017-05-09 2017-09-05 武汉大学 一种基于半监督聚类数据筛选的跨项目缺陷预测方法
CN109902915A (zh) * 2019-01-11 2019-06-18 国网浙江省电力有限公司 一种基于模糊c均值模型的电水气用能行为分析方法
US20210081827A1 (en) * 2019-07-15 2021-03-18 Guangdong University Of Technology Fast clustering algorithm based on kernel fuzzy c-means integrated with spatial constraints
CN111782512A (zh) * 2020-06-23 2020-10-16 北京高质系统科技有限公司 基于不平衡噪声集的多特征软件缺陷综合预测方法
CN113688960A (zh) * 2021-10-27 2021-11-23 南昌工程学院 基于灰狼优化ghfcm的居民电力数据聚类方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ROBINSON CRUSOE´ DA CRUZ ET AL: "Using a cluster analysis method for grouping classes according to their inferred testability: an investigation of CK metrics, code coverage and mutation score", 《2017 36TH INTERNATIONAL CONFERENCE OF THE CHILEAN COMPUTER SCIENCE SOCIETY (SCCC)》 *
周开乐等: "基于改进模糊C均值算法的电力负荷特性分类", 《电力系统保护与控制》 *

Also Published As

Publication number Publication date
CN113919449B (zh) 2022-03-15

Similar Documents

Publication Publication Date Title
WO2020119051A1 (zh) 云平台资源使用预测方法及终端设备
WO2021208079A1 (zh) 获取动力电池寿命数据的方法、装置、计算机设备及介质
CN112330077B (zh) 电力负荷预测方法、装置、计算机设备和存储介质
CN114897451B (zh) 考虑需求响应用户关键特征的双层聚类修正方法及装置
CN111563821A (zh) 一种基于支持向量机量化投资的金融股票涨跌预测方法
CN113112099A (zh) 电网日电量预测模型训练方法和电网日电量预测方法
CN116187835A (zh) 一种基于数据驱动的台区理论线损区间估算方法及系统
CN115759590A (zh) 一种基于用电行为特征的工业用户需求响应潜力计算方法
CN113449919B (zh) 一种基于特征和趋势感知的用电量预测方法及系统
CN114154716A (zh) 一种基于图神经网络的企业能耗预测方法及装置
CN108647714A (zh) 负面标签权重的获取方法、终端设备及介质
CN113919449B (zh) 基于精准模糊聚类算法的居民电力数据聚类方法及装置
Chen et al. Hybrid methods for stock index modeling
TW201518959A (zh) 不動產估價方法
CN114118608A (zh) 电网业务配比优化方法、装置、终端及存储介质
CN114154697A (zh) 房屋维修资源的预测方法、装置、计算机设备和存储介质
CN115829144B (zh) 电网业务优化模型的建立方法及电子设备
Mougeot et al. Forecasting intra day load curves using sparse functional regression
CN113361960B (zh) 一种大规模需求响应能力量化方法、介质、装置及设备
CN111311025A (zh) 一种基于气象相似日的负荷预测方法
CN117435870B (zh) 一种负荷数据实时填充方法、系统、设备和介质
CN117764638B (zh) 一种供电企业售电数据预测方法、系统、设备及存储介质
CN115081515A (zh) 能效评价模型构建方法、装置、终端及存储介质
CN116721565A (zh) 停车场泊位占用量的多维度预测方法以及系统
CN115545490A (zh) 基于小样本机器学习的电站工程造价分析方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant