CN113688960A - 基于灰狼优化ghfcm的居民电力数据聚类方法及装置 - Google Patents
基于灰狼优化ghfcm的居民电力数据聚类方法及装置 Download PDFInfo
- Publication number
- CN113688960A CN113688960A CN202111251938.7A CN202111251938A CN113688960A CN 113688960 A CN113688960 A CN 113688960A CN 202111251938 A CN202111251938 A CN 202111251938A CN 113688960 A CN113688960 A CN 113688960A
- Authority
- CN
- China
- Prior art keywords
- wolf
- data
- clustering
- fuzzy
- vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 241000282461 Canis lupus Species 0.000 title claims abstract description 148
- 238000000034 method Methods 0.000 title claims abstract description 56
- 238000005457 optimization Methods 0.000 title claims abstract description 43
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 81
- 230000006870 function Effects 0.000 claims abstract description 68
- 230000009467 reduction Effects 0.000 claims abstract description 34
- 230000005611 electricity Effects 0.000 claims abstract description 27
- 230000004044 response Effects 0.000 claims abstract description 11
- 230000008569 process Effects 0.000 claims abstract description 9
- 238000012545 processing Methods 0.000 claims abstract description 8
- 239000013598 vector Substances 0.000 claims description 99
- 239000011159 matrix material Substances 0.000 claims description 24
- 241000282421 Canidae Species 0.000 claims description 20
- 238000003860 storage Methods 0.000 claims description 14
- 239000003795 chemical substances by application Substances 0.000 claims description 12
- 230000006399 behavior Effects 0.000 claims description 11
- 238000004364 calculation method Methods 0.000 claims description 9
- 230000000694 effects Effects 0.000 claims description 7
- 238000013508 migration Methods 0.000 claims description 7
- 241000160777 Hipparchia semele Species 0.000 claims description 6
- 241001465754 Metazoa Species 0.000 claims description 6
- FFBHFFJDDLITSX-UHFFFAOYSA-N benzyl N-[2-hydroxy-4-(3-oxomorpholin-4-yl)phenyl]carbamate Chemical compound OC1=C(NC(=O)OCC2=CC=CC=C2)C=CC(=C1)N1CCOCC1=O FFBHFFJDDLITSX-UHFFFAOYSA-N 0.000 claims description 6
- 230000001186 cumulative effect Effects 0.000 claims description 6
- 238000009826 distribution Methods 0.000 claims description 6
- 238000012804 iterative process Methods 0.000 claims description 6
- 230000008859 change Effects 0.000 claims description 5
- 238000004590 computer program Methods 0.000 claims description 5
- 230000007246 mechanism Effects 0.000 claims description 5
- 230000005012 migration Effects 0.000 claims description 5
- 238000007781 pre-processing Methods 0.000 claims description 5
- 230000004075 alteration Effects 0.000 claims description 4
- 238000007405 data analysis Methods 0.000 claims description 4
- 230000003247 decreasing effect Effects 0.000 claims description 4
- 241001000340 Sitticus Species 0.000 claims description 3
- 230000002159 abnormal effect Effects 0.000 claims description 3
- 239000002131 composite material Substances 0.000 claims description 3
- 230000008030 elimination Effects 0.000 claims description 3
- 238000003379 elimination reaction Methods 0.000 claims description 3
- 238000004128 high performance liquid chromatography Methods 0.000 claims description 3
- 238000002360 preparation method Methods 0.000 claims description 3
- 238000000513 principal component analysis Methods 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 3
- 230000007423 decrease Effects 0.000 claims description 2
- 230000009286 beneficial effect Effects 0.000 abstract description 4
- 230000002776 aggregation Effects 0.000 abstract description 3
- 238000004220 aggregation Methods 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000004134 energy conservation Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000010248 power generation Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012421 spiking Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Accounting & Taxation (AREA)
- General Engineering & Computer Science (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Entrepreneurship & Innovation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- Water Supply & Treatment (AREA)
- Human Resources & Organizations (AREA)
- Biophysics (AREA)
- Primary Health Care (AREA)
- Public Health (AREA)
- Tourism & Hospitality (AREA)
- Biomedical Technology (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Game Theory and Decision Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于灰狼优化GHFCM的居民电力数据聚类方法及装置,该方法包括:步骤1:根据居民用户的用电特性,利用相关特性指标对用户的电量数据进行降维处理;步骤2:首先采用灰狼优化算法(GWO)选择初始聚类点,然后利用广义层次模糊C均值算法(GHFCM)对居民电力数据进行聚类。本发明采用考虑层次距离函数和空间约束的模糊目标函数,有助于提高聚类算法的质量。并将聚合理论方法用于参与需求响应的居民用户分类中,为电网侧针对不同用户定制异质性电力套餐的过程提供科学的依据。
Description
技术领域
本发明涉及电力系统用电负荷领域,特别涉及一种基于灰狼优化的广义层次模糊C均值算法(GHFCM)的居民电力数据聚类方法及装置。
背景技术
随着我国经济社会从高速增长向高质量增长转型,用电结构持续优化调整,三产及居民生活用电比重不断上升,负荷尖峰化特征愈发明显。传统电力规划以最大负荷确定电源电网建设规模,存在发电和输变电设备利用率偏低、投资低效、产能浪费、推高全社会用电成本等问题,已不能完全适应新时代电力高质量发展的要求。居民用户是潜力可观的需求响应资源,其参与电力市场可带来显著的安全、经济效益,也将大幅提升分布式能源的消纳能力。国内外研究及实践经验表明,通过采取一系列源、荷资源协调控制措施,可以有效改善负荷特性,削减尖峰负荷规模,延缓电源电网投资,以较小代价满足用电需求,此外还能带来节能减排等其他额外社会效益。因此,科学合理控制尖峰负荷规模是未来电力高质量发展的重点方向。
模糊C均值算法已被广泛用于电力数据聚类分析,例如,CN104268402A公开了 一种基于模糊C均值的电力系统负荷聚类方法,其特征是所述方法包括:步骤1:确定基于负荷构成的统计综合建模理论;步骤2:在步骤1的基础上,研究负荷建模中的聚类问题之一:行业用户的初选与精选;步骤3:在步骤1的基础上,研究负荷建模中的聚类问题之二:变电站综合负荷静特性分类与综合;步骤4:在步骤2和步骤3的基础上,确定基于模糊C均值的电力系统负荷聚类算法。CN107918779A公开了一种构建多元负荷聚类模型方法包括:采集用户基本信息以及多元负荷数据;对用户基本信息以及多元负荷数据进行预处理,得到能够进行聚类分析的数据集合;对多元负荷分别进行模糊C均值聚类,确定多元负荷数据对应的多个聚类结果;根据确定聚类结果分别对多元负荷分析负荷单体特性,并进行层次聚类得到多元负荷资源聚集模型。
为了提高了聚类算法的质量,本发明提出广义层次模糊C均值(GHFCM)和灰狼优化算法(GWO)相结合的新型聚类算法应用于居民客户聚类工作,相比于传统的模糊C均值(FCM)算法,本发明进一步将考虑层次距离函数和空间约束的模糊目标函数引入居民电力数据聚类中,有效提高了常规FCM聚类算法的质量。
发明内容
针对现有技术中存在的问题,本发明的目的是提供一种基于灰狼优化的广义层次模糊C均值算法(GHFCM)的居民电力数据聚类方法及装置。
本发明提供一种基于灰狼优化的广义层次模糊C均值算法(GHFCM)的居民电力数据聚类方法,包括:
步骤1、首先输入居民用户电力数据,然后利用特性指标实现数据降维得到数据分析矩阵;
步骤2、采用灰狼优化算法选择初始聚类点,然后利用广义模糊C均值算法对居民电力数据进行聚类:利用灰狼优化算法(GWO)来选择集群的最优中心点,进行灰狼优化(GWO)位置迭代计算,找出最优的位置,判断迭代次数是否达到阈值以及判断迭代的位置向量是否达到要求,若否,则继续进行灰狼优化(GWO)位置迭代计算;若是,则输出向量作为广义层次模糊C均值的初始聚类中心,然后以广义层次模糊C均值(GHFCM)的目标函数最小为目标进行迭代计算,计算相对于空间和聚类信息的局部加权广义均值,通过子类计算公式计算子类相关参数,判断迭代次数是否达到阈值以及判断局部加权广义均值和子类参数的计算是否达到标准,若否,则继续以广义层次模糊C均值(GHFCM)的目标函数最小为目标进行迭代计算;若是,则输出结果,然后利用广义层次模糊C均值算法(GHFCM)对居民电力数据进行聚类。
进一步地,所述步骤1具体实现方法如下:
步骤1.1,对目标台区居民用户同一时间段内用电负荷进行负荷特性普查,通过对目标台区的HPLC智能电表进行数据读取,获得用户的用电数据,得到负荷特性数据;
步骤1.4,选择计算样本特征的协方差矩阵,并对矩阵进行奇异值求解特征值和
特征向量,将特征值按照从大到小的顺序排序,选择最大的前k个并将其相对应的k个特
征向量拿出来,得到一组新的特征向量组;其中特征向量组中
的向量是经过PCA主成分分析投影降维后得到,按照贡献值的从大到小排序,剔除掉贡献值
低的指标,留下来的贡献度高的指标即重要的、对结果有主要影响的指标变量就是降维后
留在特征向量组中的向量;
步骤1.5,将原始特征投影到选取的特征向量上,得到降维后的k维特征;
步骤1.6,计算主成分的综合得分:通过计算主成分的信息贡献率和累积贡献率筛选出主成分,按照得分值的从大到小进行选取;
信息贡献率:
累积贡献率:
计算综合得分
进一步地,所述步骤2的具体实现方法如下:
步骤2.1,根据步骤1得到的降维后的居民用户用电数据,构成特征向量;
狼的位置向量由下式计算:
狼的等级的第一级为领导狼用表示,领导狼对做出最后的决定负有高度的责
任,群体中的其他动物都听从领导狼的命令;这个等级的第二级称为,也就是帮助领导狼
做决定的下属狼;为第三等级狼,这些狼只需要服从领导狼和下属狼的命令;然而,狼并
不是必须属于上述三个等级中的任何一个,当狼不是这三个等级时,狼就被称为;
灰狼有能力识别猎物的位置并包围它们,狩猎活动由领导狼引导,狼群中的
和也可能偶尔参与狩猎;从数学上模拟灰狼的狩猎行为,假设、和对猎物的潜在位
置有更好的了解,因此,保存到目前为止获得的前三个最佳解决方案,并要求其他搜索代理
人根据最佳搜索代理的位置来更新他们的位置;
在这方面,提出了以下公式:
已知第t次的狼的位置,求取t+1次狼的迁移轨迹如下:
步骤2.3,GHFCM的目标函数表示为
将上述方程改写
式中,为拥有I个数据样本的数据集,为聚类的总数,
为子类的总数;隶属度在第a个聚类中用表示,为模糊隶属函数的权指数;是满足条件和条件的子类,h是的权指
数,是管理对应点和中心点之间距离的影响的权重因素;是第i个数据项的邻域项;是最近的数据点,为聚类的质心;为子类距离函数,由欧几里得距离得出;
下面的方程给出了和的计算公式:
表示与及权指数g相关的第个聚类的层次距离和空间约
束函数,表示与及权指数g相关的第p个聚类的层次距离和空间约束函
数,及权指数g相关的第个聚类第b个子类的层次距离和空间
约束函数,及权指数g相关的第个聚类第q个子类的层次距
离和空间约束函数,采用考虑层次距离函数和空间约束的模糊目标函数,提高聚类算法的
质量,通过步骤2.2中的灰狼优化算法选择最优的聚类中心点,然后利用广义层次模糊C均
值算法对居民电力数据进行聚类。
本发明还提供一种基于灰狼优化的广义层次模糊C均值算法(GHFCM)的居民电力数据聚类装置,包括:
降维模块,用于根据居民用户的用电特性,利用相关特性指标对用户的电量数据进行降维处理;
聚类模块:用于基于需求响应激励机制实施前后居民用户用电行为变化数据的分析,提出广义层次模糊C均值和灰狼优化算法相结合的新型聚类算法应用于居民客户聚类工作,首先采用灰狼优化算法选择初始聚类点,然后利用广义层次模糊C均值算法对居民电力数据进行聚类。
聚类模块中对居民电力数据进行聚类的具体步骤如下:
步骤2.1,根据降维模块得到的降维后的居民用户用电数据,构成特征向量;
狼的位置向量由下式计算:
狼的等级的第一级为领导狼用表示,领导狼对做出最后的决定负有高度的责
任,群体中的其他动物都听从领导狼的命令;这个等级的第二级称为,也就是帮助领导狼
做决定的下属狼;为第三等级狼,这些狼只需要服从领导狼和下属狼的命令;然而,狼并
不是必须属于上述三个等级中的任何一个,当狼不是这三个等级时,狼就被称为;
灰狼有能力识别猎物的位置并包围它们,狩猎活动由领导狼引导,狼群中的
和也可能偶尔参与狩猎;从数学上模拟灰狼的狩猎行为,假设、和对猎物的潜在位
置有更好的了解,因此,保存到目前为止获得的前三个最佳解决方案,并要求其他搜索代理
人根据最佳搜索代理的位置来更新他们的位置;
在这方面,提出了以下公式:
已知第t次的狼的位置,求取t+1次狼的迁移轨迹如下:
步骤2.3,GHFCM的目标函数表示为
将上述方程改写
式中,为拥有I个数据样本的数据集,为聚类的总数,为
子类的总数;隶属度在第a个聚类中用表示,为模糊隶属函数的权指数;是满足条件和条件的子类,h是的权
指数,是管理对应点和中心点之间距离的影响的权重因素;是第i个数据项的邻域
项;是最近的数据点,为聚类的质心;为子类距离函数,由欧几里得距离得
出;下面的方程给出了和的计算公式:
表示与及权指数g相关的第个聚类的层次距离和空间约
束函数,表示与及权指数g相关的第p个聚类的层次距离和空间约束函
数,及权指数g相关的第个聚类第b个子类的层次距离和空
间约束函数,及权指数g相关的第个聚类第q个子类的层
次距离和空间约束函数,采用考虑层次距离函数和空间约束的模糊目标函数,提高聚类算
法的质量,通过步骤2.2中的灰狼优化算法选择最优的聚类中心点,然后利用广义层次模糊
C均值算法对居民电力数据进行聚类。
本发明的有益效果是:
相比于传统的模糊C均值(FCM)算法,本发明采用考虑层次距离函数和空间约束的模糊目标函数,有助于提高聚类算法的质量,通过灰狼优化算法选择最优的聚类中心点,广义层次模糊C均值算法能够获得更好的性能,有效提高了常规FCM聚类算法的质量。本发明将聚合理论方法用于参与需求响应的居民用户分类中,为电网侧针对不同用户定制异质性电力套餐的过程提供科学的依据。
附图说明
图1为本发明优选实施例中一种基于灰狼优化GHFCM的居民电力数据聚类方法的流程框图;
图2为本发明优选实施例中一种基于灰狼优化GHFCM的居民电力数据聚类装置的模块组成;
图3为电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明的一部分实施例,而不是全部的实施例。
如图1所示,一种基于灰狼优化的广义层次模糊C均值算法(GHFCM)的居民电力数据聚类方法,
步骤1、首先输入居民用户电力数据,然后利用特性指标实现数据降维得到数据分析矩阵;
步骤2、采用灰狼优化算法选择初始聚类点,然后利用广义模糊C均值算法对居民电力数据进行聚类:利用灰狼优化算法(GWO)来选择集群的最优中心点,进行灰狼优化(GWO)位置迭代计算,找出最优的位置,判断迭代次数是否达到阈值以及判断迭代的位置向量是否达到要求,若否,则继续进行灰狼优化(GWO)位置迭代计算;若是,则输出向量作为广义层次模糊C均值的初始聚类中心,然后以广义层次模糊C均值(GHFCM)的目标函数最小为目标进行迭代计算,计算相对于空间和聚类信息的局部加权广义均值,通过子类计算公式计算子类相关参数,判断迭代次数是否达到阈值以及判断局部加权广义均值和子类参数的计算是否达到标准,若否,则继续以广义层次模糊C均值(GHFCM)的目标函数最小为目标进行迭代计算;若是,则输出结果,然后利用广义层次模糊C均值算法(GHFCM)对居民电力数据进行聚类。
步骤1的具体实现方法如下:
步骤1.1,对目标台区居民用户同一时间段内用电负荷进行负荷特性普查,通过对目标台区的HPLC智能电表进行数据读取,获得用户的用电数据,得到负荷特性数据。
步骤1.4,我们拿到的用户用电负荷数据因为各个特征的单位不同,会给数据分析造成困扰,故在进行运算之前要对数据进行预处理,去除量纲影响。采用零均值处理和标准化处理。虽然数据经过预处理后消除了量纲影响,但考虑到样本数据特征的重要程度有着差异,选择进行样本特征的协方差矩阵计算。
计算样本特征的协方差矩阵:
A是协方差矩阵;Q是正交矩阵,Q的列向量就是A的特征向量;D是由特征值组成的对角矩阵。
通过求解可以得到n个特征值,每一个都对应一个特征向量。将特征值
按照从大到小的顺序排序,选择最大的前k个并将其相对应的k个特征向量拿出来,我们会
得到一组新的特征向量组;
其中特征向量组中的向量是经过PCA主成分分析投影降维后得到的,按照贡献值的从大到
小排序,剔除掉贡献值低的指标,留下来的贡献度高的指标即重要的、对结果有主要影响的
指标变量就是降维后留在特征向量组中的向量。
步骤1.5,将原始特征投影到选取的特征向量上,得到降维后的新k维特征。如下式:
步骤1.6,再通过计算主成分的信息贡献率和累积贡献率筛选出k个主成分,按照得分值的从大到小进行选取。
信息贡献率:
累积贡献率:
计算综合得分
降维之后的数据集:
步骤2:基于需求响应激励机制实施前后居民用户用电行为变化数据的分析,提出广义层次模糊C均值和灰狼优化算法相结合的新型聚类算法应用于居民客户聚类工作,首先采用灰狼优化算法选择初始聚类点,然后利用广义模糊C均值算法对居民电力数据进行聚类;具体实现方法如下:
步骤2.1,根据步骤1得到的降维后的居民用户用电数据,构成特征向量;
狼的位置向量由下式计算:
狼的等级的第一级
为领导狼用表示。领导狼对做出最后的决定负有高度的责任,群体中的其他动物都听从
领导狼的命令。这个等级的第二级称为,也就是帮助领导狼做决定的下属狼。为第三等
级狼,这些狼只需要服从领导狼和下属狼的命令。然而,狼并不是必须属于上述三个等级中
的任何一个,当狼不是这三个等级时,狼就被称为。
灰狼有能力识别猎物的位置并包围它们。狩猎活动通常由领导狼引导。狼群中
的和也可能偶尔参与狩猎。然而,在一个抽象的搜索空间中,一般不知道最佳位置(猎
物)的情况。为了从数学上模拟灰狼的狩猎行为,假设 (最佳候选方案)、和对猎物的
潜在位置有更好的了解。因此,保存到目前为止获得的前三个最佳解决方案,并要求其他搜
索代理人(包括)根据最佳搜索代理的位置来更新他们的位置。
在这方面,提出了以下公式:
已知第t次的狼的位置,求取t+1次狼的迁移轨迹如下
步骤2.3,与传统的模糊C均值(FCM)算法相比,广义层次模糊C均值算法(GHFCM)具有更好的可扩展性和逼近性。其目标函数表示为
将上述方程改写
式中为拥有I个数据样本的数据集,为聚类的总数,为
子类的总数;隶属度在第a个聚类中用表示,为模糊隶属函数的权指数;是满足条件和条件的子类,是的权指数;
是管理对应点和中心点之间距离的影响的权重因素;是第i个数据项的邻域项;是
最近的数据点,为聚类的质心;为子类距离函数,由欧几里得距离得出;下面
的方程给出了和的计算公式:
表示与及权指数g相关的第个聚类的层次距离和空间约
束函数,表示与及权指数g相关的第p个聚类的层次距离和空间约束函
数,及权指数g相关的第个聚类第b个子类的层次距离和
空间约束函数,及权指数g相关的第个聚类第q个子类的
层次距离和空间约束函数。
本发明采用考虑层次距离函数和空间约束的模糊目标函数,有助于提高聚类算法的质量,通过步骤2.2中的灰狼优化算法选择最优的聚类中心点,广义层次模糊C均值算法能够获得更好的性能。
本发明还提供一种基于灰狼优化的广义层次模糊C均值算法的居民电力数据聚类装置,包括:
降维模块,用于根据居民用户的用电特性,利用相关特性指标对用户的电量数据进行降维处理;
聚类模块:用于基于需求响应激励机制实施前后居民用户用电行为变化数据的分析,提出广义层次模糊C均值和灰狼优化算法相结合的新型聚类算法应用于居民客户聚类工作,首先采用灰狼优化算法选择初始聚类点,然后利用广义层次模糊C均值算法对居民电力数据进行聚类。
聚类模块中对居民电力数据进行聚类的具体步骤如下:
步骤2.1,根据降维模块得到的降维后的居民用户用电数据,构成特征向量;
狼的位置向量由下式计算:
狼的等级的第一级为领导狼用表示,领导狼对做出最后的决定负有高度的责
任,群体中的其他动物都听从领导狼的命令;这个等级的第二级称为,也就是帮助领导狼
做决定的下属狼;为第三等级狼,这些狼只需要服从领导狼和下属狼的命令;然而,狼并
不是必须属于上述三个等级中的任何一个,当狼不是这三个等级时,狼就被称为;
灰狼有能力识别猎物的位置并包围它们,狩猎活动由领导狼引导,狼群中的和也可能偶尔参与狩猎;从数学上模拟灰狼的狩猎行为,假设、和对猎物的潜在位置有
更好的了解,因此,保存到目前为止获得的前三个最佳解决方案,并要求其他搜索代理人根
据最佳搜索代理的位置来更新他们的位置;
在这方面,提出了以下公式:
已知第t次的狼的位置,求取t+1次狼的迁移轨迹如下:
步骤2.3,GHFCM的目标函数表示为
将上述方程改写
式中,为拥有I个数据样本的数据集,为聚类的总数,为
子类的总数;隶属度在第a个聚类中用表示,为模糊隶属函数的权指数;是满足条件和条件的子类,h是的权指数,是管理对应点和中心点之间距离的影响的权重因素;是第i个数据项的邻域项;是最近的数据点,为聚类的质心;为子类距离函数,由欧几里得距离得出;
下面的方程给出了和的计算公式:
表示与及权指数g相关的第个聚类的层次距离和空间约束
函数,表示与及权指数g相关的第p个聚类的层次距离和空间约束
函数,及权指数g相关的第个聚类第b个子类的层次距
离和空间约束函数,及权指数g相关的第个聚类第q
个子类的层次距离和空间约束函数,采用考虑层次距离函数和空间约束的模糊目标函数,
提高聚类算法的质量,通过步骤2.2中的灰狼优化算法选择最优的聚类中心点,然后利用广
义层次模糊C均值算法对居民电力数据进行聚类。
为便于对本发明的理解,结合实例对本发明一种基于灰狼优化的广义层次模糊C均值算法的居民电力数据聚类方法进行较为详细的方法过程描述:
随机选取20个有效样本(参与需求响应的居民用户用电信息)进行聚类,根据需求响应开展的进程,以需求响应时间段为核心选取了8个指标维度,如下表1所示:
数据预处理和PCA降维后的数据如下表2所示:
通过基于灰狼优化算法的广义层次模糊C均值聚类方法进行聚类,可以得到下表3:
聚类中心见下表4:
可以看出:样本1,2,3,4,5,9,10,13,14,15,16归为第一类,见下表5:
样本11,20归为第二类,见下表6:
样本6,7,8,12,17,18,19归为第三类,见下表7:
如图2所示,一种基于灰狼优化算法的广义层次模糊C均值聚类装置,包括:
降维模块210,用于根据居民用户的用电特性,利用相关特性指标对用户的电量数据进行降维处理;
聚类模块220:用于基于需求响应激励机制实施前后居民用户用电行为变化数据的分析,提出广义层次模糊C均值和灰狼优化算法相结合的新型聚类算法应用于居民客户聚类工作,首先采用灰狼优化算法选择初始聚类点,然后利用广义层次模糊C均值算法对居民电力数据进行聚类。
应当理解,图2中的诸模块与参考图1中描述的方法中的各个步骤相对应。由此,上文针对方法描述的操作和特征以及相应的技术效果同样适用于图2中的诸模块,在此不再赘述。
在另一些实施例中,本发明实施例还提供了一种非易失性计算机存储介质,计算机存储介质存储有计算机可执行指令,该计算机可执行指令可执行上述方法实施例中的一种基于灰狼优化的广义层次模糊C均值算法的居民电力数据聚类方法;
作为一种实施方式,本发明的非易失性计算机存储介质存储有计算机可执行指令,计算机可执行指令设置为:
第1步 将数据进行降维处理
第2步 计算GWO的位置向量
第3步 迭代计算并更新迁移轨迹,直至达到阈值
第4步 计算GHFCM目标函数、隶属度、聚类中心和子类距离函数
第5步 判断样本的归属
第6步 迭代计算,并更新类及其子类
第7步 输出聚类结果
非易失性计算机可读存储介质可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据一种基于灰狼优化算法的广义层次模糊C均值算法的居民电力数据聚类装置的使用所创建的数据等。此外,非易失性计算机可读存储介质可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,非易失性计算机可读存储介质可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至一种基于灰狼优化算法的广义层次模糊C均值算法的居民电力数据聚类装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
本发明实施例还提供一种计算机程序产品,计算机程序产品包括存储在非易失性计算机可读存储介质上的计算机程序,计算机程序包括程序指令,当程序指令被计算机执行时,使计算机执行上述一种基于灰狼优化的广义层次模糊C均值算法的居民电力数据聚类方法。
图3是本发明实施例提供的电子设备的结构示意图,该设备包括:一个或多个处理器310以及存储器320,图3中以一个处理器310为例。电子设备还可以包括:输入装置330和输出装置340。处理器310、存储器320、输入装置330和输出装置340可以通过总线或者其他方式连接,图3中以通过总线连接为例。存储器320为上述的非易失性计算机可读存储介质。处理器310通过运行存储在存储器320中的非易失性软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例一种基于灰狼优化的广义层次模糊C均值算法的居民电力数据聚类方法。输入装置330可接收输入的数字或字符信息,以及产生与一种基于灰狼优化的广义层次模糊C均值算法的居民电力数据聚类装置的用户设置以及功能控制有关的键信号输入。输出装置340可包括显示屏等显示设备。
上述产品可执行本发明实施例所提供的方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明实施例所提供的方法。
作为一种实施方式,上述电子设备应用于一种基于灰狼优化的广义层次模糊C均值算法的居民电力数据聚类装置中,用于客户端,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行计算机存储介质存储的指令。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (7)
1.一种基于灰狼优化GHFCM的居民电力数据聚类方法,其特征在于:包括以下步骤:
步骤1、首先输入居民用户电力数据,然后利用特性指标实现数据降维得到数据分析矩阵;
步骤2、采用灰狼优化算法选择初始聚类点,然后利用广义模糊C均值算法对居民电力数据进行聚类:利用灰狼优化算法来选择集群的最优中心点,进行灰狼优化位置迭代计算,找出最优的位置,判断迭代次数是否达到阈值以及判断迭代的位置向量是否达到要求,若否,则继续进行灰狼优化位置迭代计算;若是,则输出向量作为广义层次模糊C均值的初始聚类中心,然后以广义层次模糊C均值的目标函数最小为目标进行迭代计算,计算相对于空间和聚类信息的局部加权广义均值,通过子类计算公式计算子类相关参数,判断迭代次数是否达到阈值以及判断局部加权广义均值和子类参数的计算是否达到标准,若否,则继续以广义层次模糊C均值的目标函数最小为目标进行迭代计算;若是,则输出结果,然后利用广义层次模糊C均值算法对居民电力数据进行聚类。
2.根据权利要求1所述的一种基于灰狼优化GHFCM的居民电力数据聚类方法,其特征在于:所述步骤1的具体实现方法如下:
步骤1.1,对目标台区居民用户同一时间段内用电负荷进行负荷特性普查,通过对目标台区的HPLC智能电表进行数据读取,获得用户的用电数据,得到负荷特性数据;
步骤1.4,选择计算样本特征的协方差矩阵,并对矩阵进行奇异值求解特征值和特征
向量,将特征值按照从大到小的顺序排序,选择最大的前k个并将其相对应的k个特征向
量拿出来,得到一组新的特征向量组;其中特征向量组中的向量是
经过PCA主成分分析投影降维后得到,按照贡献值的从大到小排序,剔除掉贡献值低的指
标,留下来的贡献度高的指标即重要的、对结果有主要影响的指标变量就是降维后留在特
征向量组中的向量;
步骤1.5,将原始特征投影到选取的特征向量上,得到降维后的k维特征;
步骤1.6,计算主成分的综合得分:通过计算主成分的信息贡献率和累积贡献率筛选出主成分,按照得分值的从大到小进行选取;
信息贡献率:
累积贡献率:
计算综合得分
3.根据权利要求1所述的一种基于灰狼优化GHFCM的居民电力数据聚类方法,其特征在于:所述步骤2的具体实现方法如下:
步骤2.1,根据步骤1得到的降维后的居民用户用电数据,构成特征向量:
狼的位置向量由下式计算:
狼的等级的第一级为领导狼用表示,领导狼对做出最后的决定负有高度的责任,群体
中的其他动物都听从领导狼的命令;这个等级的第二级称为,也就是帮助领导狼做决定
的下属狼;为第三等级狼,这些狼只需要服从领导狼和下属狼的命令;然而,狼并不是必
须属于上述三个等级中的任何一个,当狼不是这三个等级时,狼就被称为;
灰狼有能力识别猎物的位置并包围它们,狩猎活动由领导狼引导,狼群中的和也
可能偶尔参与狩猎;从数学上模拟灰狼的狩猎行为,假设、和对猎物的潜在位置有更
好的了解,因此,保存到目前为止获得的前三个最佳解决方案,并要求其他搜索代理人根据
最佳搜索代理的位置来更新他们的位置;
在这方面,提出了以下公式:
已知第t次的狼的位置,求取t+1次狼的迁移轨迹如下:
步骤2.3,GHFCM的目标函数表示为
将上述方程改写
式中,为拥有I个数据样本的数据集,为聚类的总数,为子
类的总数;隶属度在第a个聚类中用表示,为模糊隶属函数的权指数;
是满足条件和条件的子类,h是的权指数,是管理
对应点和中心点之间距离的影响的权重因素;是第i个数据项的邻域项;是最近的
数据点,为聚类的质心;为子类距离函数,由欧几里得距离得出;下面的方程给
出了和的计算公式:
4.一种基于灰狼优化GHFCM的居民电力数据聚类装置,其特征在于:包括:
降维模块,用于根据居民用户的用电特性,利用相关特性指标对用户的电量数据进行降维处理;
聚类模块:用于基于需求响应激励机制实施前后居民用户用电行为变化数据的分析,提出广义层次模糊C均值和灰狼优化算法相结合的新型聚类算法应用于居民客户聚类工作,首先采用灰狼优化算法选择初始聚类点,然后利用广义层次模糊C均值算法对居民电力数据进行聚类。
5.根据权利要求4所述的一种基于灰狼优化GHFCM的居民电力数据聚类装置,其特征在于:所述聚类模块中对居民电力数据进行聚类的具体步骤如下:
步骤2.1,根据降维模块得到的降维后的居民用户用电数据,构成特征向量;
狼的位置向量由下式计算:
狼的等级的第一级为领导狼用表示,领导狼对做出最后的决定负有高度的责任,群
体中的其他动物都听从领导狼的命令;这个等级的第二级称为,也就是帮助领导狼做决
定的下属狼;为第三等级狼,这些狼只需要服从领导狼和下属狼的命令;然而,狼并不是
必须属于上述三个等级中的任何一个,当狼不是这三个等级时,狼就被称为;
狼有能力识别猎物的位置并包围它们,狩猎活动由领导狼引导,狼群中的和也
可能偶尔参与狩猎;从数学上模拟灰狼的狩猎行为,假设、和对猎物的潜在位置有
更好的了解,因此,保存到目前为止获得的前三个最佳解决方案,并要求其他搜索代理人根
据最佳搜索代理的位置来更新他们的位置;
在这方面,提出了以下公式:
已知第t次的狼的位置,求取t+1次狼的迁移轨迹如下:
步骤2.3,广义模糊C均值算法的目标函数表示为
将上述方程改写
式中,为拥有I个数据样本的数据集,为聚类的总数,为子类
的总数;隶属度在第a个聚类中用表示,为模糊隶属函数的权指数;是
满足条件和条件的子类,h是的权指数,是管理
对应点和中心点之间距离的影响的权重因素;是第i个数据项的邻域项;是最近的
数据点,为聚类的质心;为子类距离函数,由欧几里得距离得出;下面的方程给
出了和的计算公式:
6.一种电子设备,其特征在于:包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1至3任一项所述的基于灰狼优化GHFCM的居民电力数据聚类方法的步骤。
7.一种存储介质,其上存储有计算机程序,其特征在于:所述程序被处理器执行时实现权利要求1至3任一项所述的基于灰狼优化GHFCM的居民电力数据聚类方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111251938.7A CN113688960A (zh) | 2021-10-27 | 2021-10-27 | 基于灰狼优化ghfcm的居民电力数据聚类方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111251938.7A CN113688960A (zh) | 2021-10-27 | 2021-10-27 | 基于灰狼优化ghfcm的居民电力数据聚类方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113688960A true CN113688960A (zh) | 2021-11-23 |
Family
ID=78588254
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111251938.7A Pending CN113688960A (zh) | 2021-10-27 | 2021-10-27 | 基于灰狼优化ghfcm的居民电力数据聚类方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113688960A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113919449A (zh) * | 2021-12-15 | 2022-01-11 | 国网江西省电力有限公司供电服务管理中心 | 基于精准模糊聚类算法的居民电力数据聚类方法及装置 |
CN114897451A (zh) * | 2022-07-13 | 2022-08-12 | 南昌工程学院 | 考虑需求响应用户关键特征的双层聚类修正方法及装置 |
CN115019359A (zh) * | 2022-04-12 | 2022-09-06 | 重庆邮电大学 | 一种云用户身份识别任务分配与并行处理方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103971363A (zh) * | 2014-03-31 | 2014-08-06 | 南京信息工程大学 | 基于分层模糊c均值的图像分割方法 |
CN106789359A (zh) * | 2017-02-15 | 2017-05-31 | 广东工业大学 | 一种基于灰狼算法的网络流量分类方法及装置 |
CN112289329A (zh) * | 2020-10-22 | 2021-01-29 | 国网青海省电力公司海西供电公司 | 一种基于gwo-kfcm的高压断路器故障诊断方法 |
CN112767432A (zh) * | 2021-02-24 | 2021-05-07 | 长沙民政职业技术学院 | 基于差分变异灰狼优化的核直觉模糊聚类图像分割方法 |
-
2021
- 2021-10-27 CN CN202111251938.7A patent/CN113688960A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103971363A (zh) * | 2014-03-31 | 2014-08-06 | 南京信息工程大学 | 基于分层模糊c均值的图像分割方法 |
CN106789359A (zh) * | 2017-02-15 | 2017-05-31 | 广东工业大学 | 一种基于灰狼算法的网络流量分类方法及装置 |
CN112289329A (zh) * | 2020-10-22 | 2021-01-29 | 国网青海省电力公司海西供电公司 | 一种基于gwo-kfcm的高压断路器故障诊断方法 |
CN112767432A (zh) * | 2021-02-24 | 2021-05-07 | 长沙民政职业技术学院 | 基于差分变异灰狼优化的核直觉模糊聚类图像分割方法 |
Non-Patent Citations (6)
Title |
---|
CHONG GAO等: ""Daily Power Load Curves Analysis Based on Grey Wolf Optimization Clustering Algorithm"", 《PROCEEDINGS OF PURPLE MOUNTAIN FORUM 2019-INTERNATIONAL FORUM ON SMART GRID PROTECTION AND CONTROL》 * |
P.EDWIN DHAS等: ""A novel clustering algorithm by clubbing GHFCM and GWO for microarray gene data"", 《THE JOURNAL OF SUPERCOMPUTING》 * |
SWATI SUCHARITA等: ""A Comprehensive Study on the Application of Grey Wolf Optimization for Microarray Data"", 《HTTPS://ONLINELIBRARY.WILEY.COM/DOI/PDF/10.1002/9781119785620.CH9》 * |
吴亚雄等: ""基于灰狼优化聚类算法的日负荷曲线聚类分析"", 《电力系统保护与控制》 * |
徐常青等: "《数学实验与软件计算》", 31 January 2014, 中国科学技术大学出版社 * |
谢亮亮等: ""基于灰狼优化的模糊C-均值聚类算法"", 《软件导刊》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113919449A (zh) * | 2021-12-15 | 2022-01-11 | 国网江西省电力有限公司供电服务管理中心 | 基于精准模糊聚类算法的居民电力数据聚类方法及装置 |
CN115019359A (zh) * | 2022-04-12 | 2022-09-06 | 重庆邮电大学 | 一种云用户身份识别任务分配与并行处理方法 |
CN114897451A (zh) * | 2022-07-13 | 2022-08-12 | 南昌工程学院 | 考虑需求响应用户关键特征的双层聚类修正方法及装置 |
CN114897451B (zh) * | 2022-07-13 | 2022-09-13 | 南昌工程学院 | 考虑需求响应用户关键特征的双层聚类修正方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Cai et al. | Predicting the energy consumption of residential buildings for regional electricity supply-side and demand-side management | |
CN111199016B (zh) | 一种基于DTW的改进K-means的日负荷曲线聚类方法 | |
CN106600059B (zh) | 基于改进rbf神经网络的智能电网短期负荷预测方法 | |
CN113688960A (zh) | 基于灰狼优化ghfcm的居民电力数据聚类方法及装置 | |
Kang et al. | A weight-incorporated similarity-based clustering ensemble method based on swarm intelligence | |
CN109871860A (zh) | 一种基于核主成分分析的日负荷曲线降维聚类方法 | |
CN104750979B (zh) | 面向体系结构的综合化风险优先数计算方法 | |
CN107203785A (zh) | 多路径高斯核模糊c均值聚类算法 | |
CN109492748B (zh) | 一种基于卷积神经网络的电力系统的中长期负荷预测模型建立方法 | |
CN108805213B (zh) | 计及小波熵降维的电力负荷曲线双层谱聚类方法 | |
CN111460001B (zh) | 一种配电网理论线损率评估方法及系统 | |
CN109544029A (zh) | 一种台区线损的分析方法、分析装置及终端 | |
CN113837311A (zh) | 一种基于需求响应数据的居民客户聚类方法及装置 | |
CN111914900B (zh) | 一种用户用电模式分类方法 | |
CN114897451B (zh) | 考虑需求响应用户关键特征的双层聚类修正方法及装置 | |
CN116468138A (zh) | 空调负荷预测方法、系统、电子设备及计算机存储介质 | |
CN116187835A (zh) | 一种基于数据驱动的台区理论线损区间估算方法及系统 | |
CN109146553A (zh) | 基于多密度聚类与多核svm的实时电价预测系统及其方法 | |
CN115566689A (zh) | 一种改进天鹰优化算法优化负荷峰谷时段划分以及峰谷电价方法 | |
Liu et al. | Stock price trend prediction model based on deep residual network and stock price graph | |
CN113762591B (zh) | 一种基于gru和多核svm对抗学习的短期电量预测方法及系统 | |
CN114997261A (zh) | 一种居民电力数据聚类方法及系统 | |
CN110137951A (zh) | 基于节点电价的市场分区方法及装置 | |
CN108765137A (zh) | 一种信贷需求预测方法和系统、存储介质 | |
CN117034046A (zh) | 一种基于isodata聚类的柔性负荷可调潜力评估方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20211123 |
|
RJ01 | Rejection of invention patent application after publication |