CN114997261A - 一种居民电力数据聚类方法及系统 - Google Patents

一种居民电力数据聚类方法及系统 Download PDF

Info

Publication number
CN114997261A
CN114997261A CN202210399708.3A CN202210399708A CN114997261A CN 114997261 A CN114997261 A CN 114997261A CN 202210399708 A CN202210399708 A CN 202210399708A CN 114997261 A CN114997261 A CN 114997261A
Authority
CN
China
Prior art keywords
clustering
power data
cluster
data
algorithm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210399708.3A
Other languages
English (en)
Inventor
康兵
许志浩
丁贵立
王宗耀
荣仪
张亚楠
韩威
朱卓航
肖辉
肖相燕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanchang Institute of Technology
Original Assignee
Nanchang Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanchang Institute of Technology filed Critical Nanchang Institute of Technology
Priority to CN202210399708.3A priority Critical patent/CN114997261A/zh
Publication of CN114997261A publication Critical patent/CN114997261A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Supply And Distribution Of Alternating Current (AREA)

Abstract

本发明公开一种居民电力数据聚类方法及系统,方法包括:获取用户电力数据,对所述用户电力数据进行数据降维,使得到降维电力数据;采用改进精英蝴蝶算法选择所述降维电力数据的初始聚类点,将所述初始聚类点作为考虑距离和空间限制的多层模糊C均值算法的初始聚类中心,使基于所述多层模糊C均值算法对所述降维电力数据进行聚类。通过改进精英蝴蝶算法选择最优的聚类中心点,使得多层模糊C均值算法能够获得更好的初始迭代值,有效提高了常规FCM聚类算法的质量。

Description

一种居民电力数据聚类方法及系统
技术领域
本发明属于电力系统用电负荷技术领域,尤其涉及一种居民电力数据聚类方法及系统。
背景技术
随着我国经济社会从高速增长向高质量增长转型,用电结构持续优化调整,三产及居民生活用电比重不断上升,负荷尖峰化特征愈发明显。传统电力规划以最大负荷确定电源电网建设规模,存在发电和输变电设备利用率偏低、投资低效、产能浪费、推高全社会用电成本等问题,已不能完全适应电力高质量发展的要求。居民用户是潜力可观的需求响应资源,其参与电力市场可带来显著的安全、经济效益,也将大幅提升分布式能源的消纳能力。
实践经验表明,通过采取一系列源、荷资源协调控制措施,可以有效改善负荷特性,削减尖峰负荷规模,延缓电源电网投资,以较小代价满足用电需求,此外还能带来节能减排等其他额外社会效益。因此,科学合理控制尖峰负荷规模是未来电力高质量发展的重点方向。
发明内容
本发明提供一种居民电力数据聚类方法及装置,用于解决如何科学合理控制尖峰负荷规模的技术问题。
第一方面,本发明提供一种居民电力数据聚类方法,包括:步骤1、获取用户电力数据,对所述用户电力数据进行数据降维,使得到降维电力数据;步骤2、采用改进精英蝴蝶算法选择所述降维电力数据的初始聚类点,将所述初始聚类点作为考虑距离和空间限制的多层模糊C均值算法的初始聚类中心,使基于所述多层模糊C均值算法对所述降维电力数据进行聚类,其中,对所述降维电力数据进行聚类包括:基于改进精英蝴蝶算法来选择所述数据分析矩阵的最优中心点,进行蝴蝶优化位置迭代计算,找出最优的位置;判断迭代次数是否达到阈值以及判断迭代的位置向量是否达到要求;若迭代次数达到阈值以及所述位置向量达到要求,则输出所述位置向量作为多层模糊C均值算法的初始聚类中心,并以所述多层模糊C均值算法的目标函数最小为目标进行迭代计算,计算相对于空间和聚类信息的局部加权广义均值,通过子类计算公式计算子类相关参数,判断迭代次数是否达到阈值以及判断局部加权广义均值和子类参数的计算是否达到标准;若迭代次数达到阈值以及判断局部加权广义均值和子类参数的计算达到标准,则输出结果,并利用多层模糊C 均值算法对所述降维电力数据进行聚类。
第二方面,本发明提供一种居民电力数据聚类系统,包括:降维模块,配置为获取用户电力数据,对所述用户电力数据进行数据降维,使得到降维电力数据;聚类模块,配置为采用改进精英蝴蝶算法选择所述降维电力数据的初始聚类点,将所述初始聚类点作为考虑距离和空间限制的多层模糊C均值算法的初始聚类中心,使基于所述多层模糊C均值算法对所述降维电力数据进行聚类,其中,对所述降维电力数据进行聚类包括:基于改进精英蝴蝶算法来选择所述数据分析矩阵的最优中心点,进行蝴蝶优化位置迭代计算,找出最优的位置;判断迭代次数是否达到阈值以及判断迭代的位置向量是否达到要求;若迭代次数达到阈值以及所述位置向量达到要求,则输出所述位置向量作为多层模糊C均值算法的初始聚类中心,并以所述多层模糊C均值算法的目标函数最小为目标进行迭代计算,计算相对于空间和聚类信息的局部加权广义均值,通过子类计算公式计算子类相关参数,判断迭代次数是否达到阈值以及判断局部加权广义均值和子类参数的计算是否达到标准;若迭代次数达到阈值以及判断局部加权广义均值和子类参数的计算达到标准,则输出结果,并利用多层模糊C均值算法对所述降维电力数据进行聚类。
第三方面,提供一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例的居民电力数据聚类方法的步骤。
第四方面,本发明还提供一种计算机可读存储介质,其上存储有计算机程序,所述程序指令被处理器执行时,使所述处理器执行本发明任一实施例的居民电力数据聚类方法的步骤。
本申请的居民电力数据聚类方法及系统,采用在模糊C均值目标函数中考虑层次和距离限制,有助于提高聚类算法的质量,通过改进精英蝴蝶算法选择最优的聚类中心点,使得多层模糊C均值算法能够获得更好的初始迭代值,有效提高了常规FCM聚类算法的质量。本发明将聚合理论方法用于参与需求响应的居民用户分类中,为电网侧针对不同用户定制异质性电力套餐的过程提供科学的依据。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一实施例提供的一种居民电力数据聚类方法的流程图;
图2为本发明一实施例提供的一种居民电力数据聚类系统的结构框图;
图3是本发明一实施例提供的电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,其示出了本申请的一种居民电力数据聚类方法的流程图。
如图1所示,居民电力数据聚类方法具体包括以下步骤:
步骤1、获取用户电力数据,对所述用户电力数据进行数据降维,使得到降维电力数据。
在本实施例中,根据特性指标对用户电力数据进行数据降维,具体步骤为:
对目标台区居民用户同一时间段内用电负荷进行负荷特性普查,通过对目标台区的HPLC智能电表进行数据读取,获得用户的用电数据,得到负荷特性数据;
数据准备,清除异常数据,对数据进行预处理,得到N个样本的居民用户用电数据集X:
Figure BDA0003599262390000041
式中,X为m×n阶的矩阵,xmn为居民用户用电数据集X中的第m 行,第n列的元素;
将居民用户用电数据集X表示成列向量的形式,即 X=[X1,X2,X3,…,Xm]T,Xm为居民用户用电数据集中的第m行,包含n个元素的行向量,T为向量的转置;
选择计算样本特征的协方差矩阵,并对矩阵进行奇异值求解特征值λ和特征向量μ,将特征值λ按照从大到小的顺序排序,获取将前k个特征值并将其相对应的k个特征向量组成新的特征向量组 {(λ11),(λ22),(λ33),…,(λkk)};
将原始特征投影到选取的特征向量上,得到降维后的k维特征;
计算主成分的综合得分:
Figure BDA0003599262390000042
其中,Lt为第t个指标yt的信息贡献率。
步骤2、采用改进精英蝴蝶算法选择所述数据分析矩阵的初始聚类点,将所述初始聚类点作为考虑距离和空间限制的多层模糊C均值算法的初始聚类中心,使基于所述多层模糊C均值算法对所述居民电力数据进行聚类。
在本实施例中,根据步骤1得到的降维后的用电数据,构成特征向量:
xt=(xt1,xt2,...,xtn),t=1,2,...,m,
式中,xt为第t个样本的特征指标构成,m为样本的个数,n为指标的个数;
利用改进精英蝴蝶算法来选择集群的最优中心点。初始化蝴蝶个体的位置状态为向量X=(x1,x2),向量x1,x2分别对应多层模糊C均值模型的聚类质心和隶属度,每只蝴蝶的位置组合了聚类质心和隶属度的信息,并且每只蝴蝶代表目标函数的一个解,设置算法的初始参数蝴蝶种群数量N、最大迭代次数MaxGen、精英蝴蝶种群分为Land1和 Land2、种群数量分别为population1和population2、蝴蝶迁移率z、迁移期peri、调整率BAR、权重因子α、蝴蝶步长dx、最大步长Maxstep,随机生成N个精英蝴蝶个体,每个精英蝴蝶个体都是满足目标函数的潜在解;
根据目标函数,在迭代初始阶段对种群进行适应度值计算并排序,平均相对误差越小,表明个体适应度越高,选取出适应度值高的keep只蝴蝶个体,标记为精英保留个体;
将种群分为Land1和Land2两部分,执行迁移算子更新Land1的蝴蝶,执行调整算子更新Land2的蝴蝶,合并更新位置后的种群,重新计算适应度值,取出适应度差的keep个蝴蝶做好标记;
用精英蝴蝶对适应度差的蝴蝶进行直接替换,替换后的种群作为下一次迭代的初始种群;
标记本次迭代的适应度值最优的个体,循环迭代,当达到最大迭代次数MaxGen时停止循环,在每代的最优个体中选取出适应度最高的个体作为最终优化结果。
对Land1中的精英蝴蝶个体,迁移算子表示为
Figure BDA0003599262390000051
Figure BDA0003599262390000052
表示在当前第t次迭代下Land1中的一只蝴蝶,根据产生的随机数 r=rand*peri,新生的蝴蝶
Figure BDA0003599262390000053
的每一维从Land1和Land2中选出,当随机数不大于蝴蝶迁移率时,新生蝴蝶
Figure BDA0003599262390000054
的第k维用Land1中随机选择出一只蝴蝶的第k维替换,当随机数大于蝴蝶迁移率时,新生蝴蝶
Figure BDA0003599262390000061
的第 k维用Land2中随机选择出一只蝴蝶的第k维替换;
对Land2中的精英蝴蝶个体,算法执行调整算子。当满足随机数不大于蝴蝶迁移率时,其表达式为
Figure BDA0003599262390000062
Figure BDA0003599262390000063
为Land1和Land2中最优个体的第k维;当随机数大于蝴蝶迁移率,该蝴蝶个体按
Figure BDA0003599262390000064
进行当前位置的更新,蝴蝶
Figure BDA0003599262390000065
从Land2中随机选取出来,
Figure BDA0003599262390000066
为调整后的蝴蝶位置,在此条件下,若满足随机数大于调整率。则该个体的位置则进一步更新为
Figure BDA0003599262390000067
调整率的值在精英蝴蝶算法中设置为与迁移率相等,权重因子
Figure BDA0003599262390000068
为蝴蝶最大步长Maxstep与当前迭代次数t平方的比值,步长
Figure BDA0003599262390000069
通过莱维飞行计算而来。
步骤2.3,与传统的模糊C均值(FCM)算法相比,多层模糊C均值算法算法(MFCM)具有更好的可扩展性和逼近性。其目标函数表示为:
Figure BDA00035992623900000610
将上述方程改写为:
Figure BDA00035992623900000611
式中,OBF为聚类目标函数,
Figure BDA00035992623900000612
为权指数为g时xia的值,
Figure BDA00035992623900000613
为权指数为h时yiab的值,a为某一个聚类,b为某一个子类,xia为隶属度ki在第a个聚类,yiab为满足条件
Figure BDA00035992623900000614
和条件
Figure BDA00035992623900000615
的子类, ld为管理对应点和中心点之间距离的影响的权重因素,kc为最近的数据点,μab为聚类的质心,A为聚类的总数,B为子类的总数,I为数据样本的数量,i为拥有I个数据样本的数据集,g为xia的权指数,h为yiab的权指数,NHi为第i个数据集的邻域项,mdab为子类距离函数。
下面的方程给出了xia、yiab和μab的计算公式:
Figure BDA00035992623900000616
式中,NHi为第i个数据集的邻域项,mdab为子类距离函数,yipb为满足条件
Figure BDA00035992623900000617
和条件
Figure BDA00035992623900000618
的子类,xip为隶属度ki在第p 个聚类,
Figure BDA00035992623900000619
为权指数为h时yiab的值;
Figure BDA0003599262390000071
式中,NHi为第i个数据集的邻域项,mdab为子类距离函数,p为第p 个聚类;
Figure BDA0003599262390000072
由此计算了相对于空间和聚类信息的局部加权广义均值,更改的成员以及子成员由下式确定:
Figure BDA0003599262390000073
Figure BDA0003599262390000074
式中,x′ia为考虑相对于空间和聚类信息的局部加权广义均值的隶属度ki在第a个聚类,xda为与
Figure BDA0003599262390000075
及权指数g相关的第a个聚类的层次空间限制函数,ddp为与
Figure BDA0003599262390000076
及权指数g相关的第p个聚类的层次空间限制函数,p为第p个聚类,y′iab为考虑相对于空间和聚类信息的局部加权广义均值的满足条件
Figure BDA0003599262390000077
和条件
Figure BDA0003599262390000078
的子类, ydab为与
Figure BDA0003599262390000079
及权指数h相关的第a个聚类第b个子类的层次空间限制函数,ydaq为与
Figure BDA00035992623900000710
及权指数h相关的第a个聚类第q个子类的层次空间限制函数。
综上,本申请的方法,通过改进精英蝴蝶算法选择最优的聚类中心点,使得多层模糊C均值算法能够获得更好的初始迭代值,有效提高了常规FCM聚类算法的质量,另外,常规FCM聚类算法没有考虑到层次和距离限制,聚类结果准备性受样本本身的分布影响较大,考虑这些问题,在常规FCM聚类算法目标函数中考虑层次和距离限制,计算相对于空间和聚类信息的局部加权广义均值,通过子类计算公式计算子类相关参数,判断迭代次数是否达到阈值以及判断局部加权广义均值和子类参数的计算是否达到标准,若否,则继续以考虑层次和距离限制的常规 FCM聚类算法的目标函数最小为目标进行迭代计算,有助于进一步提高聚类算法的质量。本发明将聚合理论方法用于参与需求响应的居民用户分类中,为电网侧针对不同用户定制异质性电力套餐的过程提供科学的依据。
请参阅图2,其示出了本申请的一种居民电力数据聚类系统的结构框图。
如图2所示,居民电力数据聚类系统200,包括降维模块210以及聚类模块220。
其中,降维模块210,配置为获取用户电力数据,对所述用户电力数据进行数据降维,使得到降维电力数据;
聚类模块220,配置为采用改进精英蝴蝶算法选择所述降维电力数据的初始聚类点,将所述初始聚类点作为考虑距离和空间限制的多层模糊 C均值算法的初始聚类中心,使基于所述多层模糊C均值算法对所述降维电力数据进行聚类,其中,对所述降维电力数据进行聚类包括:基于改进精英蝴蝶算法来选择所述数据分析矩阵的最优中心点,进行蝴蝶优化位置迭代计算,找出最优的位置;判断迭代次数是否达到阈值以及判断迭代的位置向量是否达到要求;若迭代次数达到阈值以及所述位置向量达到要求,则输出所述位置向量作为多层模糊C均值算法的初始聚类中心,并以所述多层模糊C均值算法的目标函数最小为目标进行迭代计算,计算相对于空间和聚类信息的局部加权广义均值,通过子类计算公式计算子类相关参数,判断迭代次数是否达到阈值以及判断局部加权广义均值和子类参数的计算是否达到标准;若迭代次数达到阈值以及判断局部加权广义均值和子类参数的计算达到标准,则输出结果,并利用多层模糊C均值算法对所述降维电力数据进行聚类。
应当理解,图2中记载的诸模块与参考图1中描述的方法中的各个步骤相对应。由此,上文针对方法描述的操作和特征以及相应的技术效果同样适用于图2中的诸模块,在此不再赘述。
在另一些实施例中,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序指令被处理器执行时,使所述处理器执行上述任意方法实施例中的居民电力数据聚类方法;
作为一种实施方式,本发明的计算机可读存储介质存储有计算机可执行指令,计算机可执行指令设置为:
获取用户电力数据,对所述用户电力数据进行数据降维,使得到降维电力数据;
采用改进精英蝴蝶算法选择所述降维电力数据的初始聚类点,将所述初始聚类点作为考虑距离和空间限制的多层模糊C均值算法的初始聚类中心,使基于所述多层模糊C均值算法对所述降维电力数据进行聚类。
计算机可读存储介质可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据居民电力数据聚类系统的使用所创建的数据等。此外,计算机可读存储介质可以包括高速随机存取存储器,还可以包括存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,计算机可读存储介质可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至居民电力数据聚类系统。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
图3是本发明实施例提供的电子设备的结构示意图,如图3所示,该设备包括:一个处理器310以及存储器320。电子设备还可以包括:输入装置330和输出装置340。处理器310、存储器320、输入装置330和输出装置340可以通过总线或者其他方式连接,图3中以通过总线连接为例。存储器320为上述的计算机可读存储介质。处理器310通过运行存储在存储器320中的非易失性软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例居民电力数据聚类方法。输入装置330可接收输入的数字或字符信息,以及产生与居民电力数据聚类系统的用户设置以及功能控制有关的键信号输入。输出装置340可包括显示屏等显示设备。
上述电子设备可执行本发明实施例所提供的方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明实施例所提供的方法。
作为一种实施方式,上述电子设备应用于居民电力数据聚类系统中,用于客户端,包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够:
获取用户电力数据,对所述用户电力数据进行数据降维,使得到降维电力数据;
采用改进精英蝴蝶算法选择所述降维电力数据的初始聚类点,将所述初始聚类点作为考虑距离和空间限制的多层模糊C均值算法的初始聚类中心,使基于所述多层模糊C均值算法对所述降维电力数据进行聚类。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (8)

1.一种居民电力数据聚类方法,其特征在于,包括:
步骤1、获取用户电力数据,对所述用户电力数据进行数据降维,使得到降维电力数据;
步骤2、采用改进精英蝴蝶算法选择所述降维电力数据的初始聚类点,将所述初始聚类点作为考虑距离和空间限制的多层模糊C均值算法的初始聚类中心,使基于所述多层模糊C均值算法对所述降维电力数据进行聚类,其中,对所述降维电力数据进行聚类包括:
基于改进精英蝴蝶算法来选择所述数据分析矩阵的最优中心点,进行蝴蝶优化位置迭代计算,找出最优的位置;
判断迭代次数是否达到阈值以及判断迭代的位置向量是否达到要求;
若迭代次数达到阈值以及所述位置向量达到要求,则输出所述位置向量作为多层模糊C均值算法的初始聚类中心,并以所述多层模糊C均值算法的目标函数最小为目标进行迭代计算,计算相对于空间和聚类信息的局部加权广义均值,通过子类计算公式计算子类相关参数,判断迭代次数是否达到阈值以及判断局部加权广义均值和子类参数的计算是否达到标准;
若迭代次数达到阈值以及判断局部加权广义均值和子类参数的计算达到标准,则输出结果,并利用多层模糊C均值算法对所述降维电力数据进行聚类。
2.根据权利要求1所述的一种居民电力数据聚类方法,其特征在于,所述多层模糊C均值算法的目标函数的表达式为:
Figure FDA0003599262380000011
式中,OBF为聚类目标函数,a为某一个聚类,b为某一个子类,xia为隶属度ki在第a个聚类,yiab为满足条件
Figure FDA0003599262380000012
和条件
Figure FDA0003599262380000013
的子类,ld为管理对应点和中心点之间距离的影响的权重因素,kc为最近的数据点,μab为聚类的质心,A为聚类的总数,B为子类的总数,I为数据样本的数量,i为拥有I个数据样本的数据集,g为xia的权指数,h为yiab的权指数,
Figure FDA0003599262380000021
为权指数为g时xia的值,
Figure FDA0003599262380000022
为权指数为h时yiab的值。
3.根据权利要求2所述的一种居民电力数据聚类方法,其特征在于,计算隶属度ki在第a个聚类xia的表达式为:
Figure FDA0003599262380000023
式中,NHi为第i个数据集的邻域项,mdab为子类距离函数,yipb为满足条件
Figure FDA0003599262380000024
和条件
Figure FDA0003599262380000025
的子类,
Figure FDA0003599262380000026
为权指数为h时yipb的值;
其中,计算考虑相对于空间和聚类信息的局部加权广义均值的xia的表达式为:
Figure FDA0003599262380000027
式中,x′ia为考虑相对于空间和聚类信息的局部加权广义均值的隶属度ki在第a个聚类,xda为与
Figure FDA0003599262380000028
mdab及权指数g相关的第a个聚类的层次空间限制函数,xdp为与
Figure FDA0003599262380000029
mdab及权指数g相关的第p个聚类的层次空间限制函数,p为第p个聚类。
4.根据权利要求2所述的一种居民电力数据聚类方法,其特征在于,计算满足条件
Figure FDA00035992623800000210
和条件
Figure FDA00035992623800000211
的子类yiab的表达式为:
Figure FDA00035992623800000212
式中,NHi为第i个数据集的邻域项,mdab为子类距离函数,p为第p个聚类;
其中,计算考虑相对于空间和聚类信息的局部加权广义均值的yiab的表达式为:
Figure FDA00035992623800000213
式中,y′iab为考虑相对于空间和聚类信息的局部加权广义均值的满足条件
Figure FDA0003599262380000031
和条件
Figure FDA0003599262380000032
的子类,ydab为与
Figure FDA0003599262380000033
mdab及权指数h相关的第a个聚类第b个子类的层次空间限制函数,ydaq为与
Figure FDA0003599262380000034
mdab及权指数h相关的第a个聚类第q个子类的层次空间限制函数。
5.根据权利要求2所述的一种居民电力数据聚类方法,其特征在于,计算聚类的质心μab的表达式为:
Figure FDA0003599262380000035
式中,NHi为第i个数据集的邻域项。
6.一种居民电力数据聚类系统,其特征在于,包括:
降维模块,配置为获取用户电力数据,对所述用户电力数据进行数据降维,使得到降维电力数据;
聚类模块,配置为采用改进精英蝴蝶算法选择所述降维电力数据的初始聚类点,将所述初始聚类点作为考虑距离和空间限制的多层模糊C均值算法的初始聚类中心,使基于所述多层模糊C均值算法对所述降维电力数据进行聚类,其中,对所述降维电力数据进行聚类包括:
基于改进精英蝴蝶算法来选择所述数据分析矩阵的最优中心点,进行蝴蝶优化位置迭代计算,找出最优的位置;
判断迭代次数是否达到阈值以及判断迭代的位置向量是否达到要求;
若迭代次数达到阈值以及所述位置向量达到要求,则输出所述位置向量作为多层模糊C均值算法的初始聚类中心,并以所述多层模糊C均值算法的目标函数最小为目标进行迭代计算,计算相对于空间和聚类信息的局部加权广义均值,通过子类计算公式计算子类相关参数,判断迭代次数是否达到阈值以及判断局部加权广义均值和子类参数的计算是否达到标准;
若迭代次数达到阈值以及判断局部加权广义均值和子类参数的计算达到标准,则输出结果,并利用多层模糊C均值算法对所述降维电力数据进行聚类。
7.一种电子设备,其特征在于,包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1至5任一项所述的方法。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现权利要求1至5任一项所述的方法。
CN202210399708.3A 2022-04-15 2022-04-15 一种居民电力数据聚类方法及系统 Pending CN114997261A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210399708.3A CN114997261A (zh) 2022-04-15 2022-04-15 一种居民电力数据聚类方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210399708.3A CN114997261A (zh) 2022-04-15 2022-04-15 一种居民电力数据聚类方法及系统

Publications (1)

Publication Number Publication Date
CN114997261A true CN114997261A (zh) 2022-09-02

Family

ID=83023377

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210399708.3A Pending CN114997261A (zh) 2022-04-15 2022-04-15 一种居民电力数据聚类方法及系统

Country Status (1)

Country Link
CN (1) CN114997261A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116125235A (zh) * 2023-04-14 2023-05-16 南昌工程学院 基于超声信号的gis局部放电故障诊断方法
CN116881372A (zh) * 2023-09-08 2023-10-13 清华大学 基于物联网的水表计量大数据优化处理方法及系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116125235A (zh) * 2023-04-14 2023-05-16 南昌工程学院 基于超声信号的gis局部放电故障诊断方法
CN116881372A (zh) * 2023-09-08 2023-10-13 清华大学 基于物联网的水表计量大数据优化处理方法及系统
CN116881372B (zh) * 2023-09-08 2023-12-05 清华大学 基于物联网的水表计量大数据优化处理方法及系统

Similar Documents

Publication Publication Date Title
Zhang et al. A return-cost-based binary firefly algorithm for feature selection
Hassan et al. Operational framework for recent advances in backtracking search optimisation algorithm: A systematic review and performance evaluation
Lan et al. Constructive hidden nodes selection of extreme learning machine for regression
CN106600059B (zh) 基于改进rbf神经网络的智能电网短期负荷预测方法
Valdez et al. Modular neural networks architecture optimization with a new nature inspired method using a fuzzy combination of particle swarm optimization and genetic algorithms
CN110427261A (zh) 一种基于深度蒙特卡洛树搜索的边缘计算任务分配方法
Bae et al. Feature selection with intelligent dynamic swarm and rough set
CN114997261A (zh) 一种居民电力数据聚类方法及系统
CN109983480A (zh) 使用聚类损失训练神经网络
CN111416797B (zh) 改进天牛群算法优化正则化极限学习机的入侵检测方法
Yu et al. Ensemble grey wolf Optimizer and its application for image segmentation
CN106779177A (zh) 基于粒子群优化的多分辨率小波神经网络用电量预测方法
Bacanin et al. RFID network planning by ABC algorithm hybridized with heuristic for initial number and locations of readers
CN110837915B (zh) 一种基于混合集成深度学习的电力系统低压负荷点预测及概率预测方法
Xu et al. QoS-aware service composition using fuzzy set theory and genetic algorithm
Avatefipour et al. A novel electric load consumption prediction and feature selection model based on modified clonal selection algorithm
CN114385376B (zh) 一种异构数据下边缘侧联邦学习的客户端选择方法
CN111355633A (zh) 一种基于pso-delm算法的比赛场馆内手机上网流量预测方法
CN106228235B (zh) 一种顾及格局与过程耦合效应的土地利用空间优化配置方法
Almutairi et al. An intelligent deep learning based prediction model for wind power generation
CN113688960A (zh) 基于灰狼优化ghfcm的居民电力数据聚类方法及装置
Liu et al. A wind speed forcasting model based on rime optimization based VMD and multi-headed self-attention-LSTM
CN111047040A (zh) 基于IFPA算法的Web服务组合方法
Baghban et al. Edge-AI: IoT request service provisioning in federated edge computing using actor-critic reinforcement learning
Wang et al. DeepNetQoE: Self-adaptive QoE optimization framework of deep networks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination