CN113378954A - 一种基于粒子群改进k均值算法的负荷曲线聚类方法及系统 - Google Patents

一种基于粒子群改进k均值算法的负荷曲线聚类方法及系统 Download PDF

Info

Publication number
CN113378954A
CN113378954A CN202110695568.XA CN202110695568A CN113378954A CN 113378954 A CN113378954 A CN 113378954A CN 202110695568 A CN202110695568 A CN 202110695568A CN 113378954 A CN113378954 A CN 113378954A
Authority
CN
China
Prior art keywords
particle
data
load
clustering
fitness
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110695568.XA
Other languages
English (en)
Other versions
CN113378954B (zh
Inventor
覃日升
李胜男
姜訸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Electric Power Research Institute of Yunnan Power Grid Co Ltd
Original Assignee
Electric Power Research Institute of Yunnan Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Electric Power Research Institute of Yunnan Power Grid Co Ltd filed Critical Electric Power Research Institute of Yunnan Power Grid Co Ltd
Priority to CN202110695568.XA priority Critical patent/CN113378954B/zh
Publication of CN113378954A publication Critical patent/CN113378954A/zh
Application granted granted Critical
Publication of CN113378954B publication Critical patent/CN113378954B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Software Systems (AREA)
  • Water Supply & Treatment (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Public Health (AREA)
  • Computational Linguistics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请属于电力系统分析与控制技术领域,提供一种基于粒子群改进K均值算法的负荷曲线聚类方法及系统,所述一种基于粒子群改进K均值算法的负荷曲线聚类方法包括:获取多个用户的原始负荷曲线负荷并进行预处理,获得负荷数据集;采用粒子群算法获得K均值算法的M个初始聚类中心;将数据对象分配到最近的聚类中心,获得M个相应的类簇;分别计算每个类簇中所有数据对象属性值均值,获得M个新聚类中心;根据每个类簇的新聚类中心和初始聚类中心是否相同来选择是否更新初始聚类中心;将新聚类中心作为K均值算法的最终聚类中心。上述基于粒子群改进K均值算法的负荷曲线聚类方法有效提高了日负荷曲线聚类方法的准确性和收敛速度。

Description

一种基于粒子群改进K均值算法的负荷曲线聚类方法及系统
技术领域
本申请属于电力系统分析与控制技术领域,具体涉及一种基于粒子群改进K均值算法的负荷曲线聚类方法及系统。
背景技术
随着智能电网建设的不断推进,数据采集设备可以收集到大量用户的用电情况。不同类型的用户,如民用、商业、工业和农业等,在电力消费模式上存在很大的差异,即使是同一类型的用户,他们的用电模式也可能不一样。如何采取有效的数据挖掘技术,在大数据背景下对不同类型的海量用户负荷曲线数据进行精细化划分,从而挖掘出不同类型负荷间的内在联系及对应的用电行为和用电特性等信息,无疑对负荷预测、电网规划和需求侧响应均有一定的指导意义。
传统的负荷曲线聚类方法主要包括基于原始负荷数据的直接聚类方法和基于降维的间接聚类方法,直接聚类方法通常是将负荷曲线各采样时刻点的负荷值经归一化后,采用K均值、模糊C均值和自组织映射等算法进行聚类,K均值算法是一种快速易实现,效果良好的聚类算法。但传统的K均值算法存在两个固有的缺点,一方面对于随机的初始值选择可能会导致不同的聚类结果,甚至存在无解的情况,第二方面K均值算法是基于梯度下降的算法,因此不可避免地常常陷入局部最优解。
为了克服K均值算法的上述缺陷,可以结合遗传算法对K均值算法进行改进,例如,以K均值算子来代替遗传算法中的交叉算子,提出了一种混合遗传聚类算法。还可以采用聚类中心的浮点编码方式,并设计了浮点数交叉和变异算法来提高搜索效率。
然而,当样本数目、样本维度和样本类别数较大时,上述两种方法常常出现过早的收敛于局部极优的现象,当算法出现早熟时,仅仅依靠较小的变异概率很难从局部极优点跳出,而且由于进化算法在进化过程中可能会产生退化现象,将导致迭代次数过长以及聚类准确率不高。
发明内容
本申请提供一种基于粒子群改进K均值算法的负荷曲线聚类方法及系统,以提供一种准确率更高的日负荷曲线聚类方法及系统。
本申请第一方面提供一种基于粒子群改进K均值算法的负荷曲线聚类方法,所述一种基于粒子群改进K均值算法的负荷曲线聚类方法包括:
步骤1:获取多个用户原始负荷曲线的负荷数据,对原始负荷曲线的负荷数据进行预处理,获得负荷数据集,所述负荷数据集由多个数据对象组成,一个数据对象代表一条负荷曲线的负荷数据;
步骤2:基于负荷数据集预分类的类簇数目确定聚类中心个数M,采用粒子群算法进行多次迭代,获得K均值算法的M个初始聚类中心;
步骤3:分别计算数据对象到所有初始聚类中心的距离,按照最接近原则,将数据对象分配到最近的聚类中心,直到所有数据对象分配完毕,获得M个相应的类簇;
步骤4:分别计算每个类簇中所有数据对象属性值均值,获得M个新聚类中心;
步骤5:判断每个类簇的新聚类中心和初始聚类中心是否相同;若存在类簇的新聚类中心与初始聚类中心不相同,则用所有新聚类中心的编码值更新所有初始聚类中心的编码值,并跳转至步骤3;若所有类簇的新聚类中心与初始聚类中心相同,则跳转至步骤6;
步骤6:将新聚类中心作为K均值算法的最终聚类中心,对负荷数据集中所有的数据对象进行分类。
可选的,所述获取多个用户的原始负荷曲线负荷,对原始负荷曲线负荷进行预处理,获得负荷数据集的步骤,具体为:
查找每条原始负荷曲线负荷的缺失和异常数据,若原始负荷曲线的负荷异常数据大于采集量的10%,则将所述原始负荷曲线剔除,获得第一备用负荷数据,所述异常数据包括骤降、暴增或为负值等数据;
对第一备用负荷数据中缺失和异常数据进行补充和修正,获得第二备用负荷数据;
采用线性函数归一化方法对第二备用负荷数据进行归一化处理,获得负荷数据集。
可选的,所述基于负荷数据集预分类的类簇数目确定聚类中心个数M,采用粒子群算法进行多次迭代,获得K均值算法的M个初始聚类中心的步骤,具体为:
步骤301:初始化粒子,基于负荷数据集预分类的类簇数目随机生成M个聚类中心作为初始粒子的位置编码,随机分配粒子速度;
步骤302:多次执行步骤301,形成初始化粒子群,其中,每执行一次步骤301生成一个初始化粒子;
步骤303:按照每个粒子的位置编码,对数据对象进行聚类划分,选定适应度函数,计算每个粒子的适应度值;
步骤304:根据每个粒子的适应度值和它经历过的适应度值,确定每个粒子的个体极值;
步骤305:根据每个粒子的个体极值,确定整个粒子群的全局极值;
步骤306:按照粒子的更新速度和更新位置公式更新粒子的速度和位置,所述更新速度公式为:
Vi=ωVpresent+C1×rand()×(Pbest-Xpresent)+C2×rand()×(Gbest-Xpresent);
所述更新位置公式为:
Xi=Xpresent+Vi
式中,Vi为第i个粒子更新后的速度,Xi为第i个粒子更新后的位置,Vpresent为第i个粒子当前速度,Xpresent为第i个粒子当前位置,ω为权重系数,C1为个体学习因子,C2为社会学习因子,rand()为0到1之间的随机数,Pbest为第i个粒子的个体极值,Gbest为当前粒子群的全局极值。
步骤307:设定适应度方差函数和最大迭代次数,计算粒子群的适应度方差值,判断适应度方差和设定阈值的大小,若适应度方差小于阈值或迭代次数大于最大迭代次数,则执行步骤308;若适应度方差大于或等于阈值并且迭代次数小于或等于最大迭代次数,则执行步骤303;
步骤308:选取整个粒子群的全局极值作为K均值算法M个初始聚类中心的编码值。
可选的,所述适应度函数为:
Figure BDA0003128188550000031
式中,fi为第i个粒子的适应度值,M为每一类簇的样本数量,K为聚类中心个数,ml为输入样本,cj为输入样本对应的类簇的中心点。
可选的,所述适应度方差函数为:
Figure BDA0003128188550000032
式中,n为粒子群粒子数目,fi为第i个粒子的适应度值,favg为粒子群的平均适应度。
可选的,所述更新速度公式中权重系数、个体学习因子和社会学习因子分别采用以下公式实现,具体为:
权重系数公式,
Figure BDA0003128188550000033
个体学习因子公式,
Figure BDA0003128188550000034
社会学习因子公式,
Figure BDA0003128188550000035
式中,k为当前迭代次数,T为最大迭代次数,ωk为第k次迭代的权重系数,ωmax为权重系数最大值,ωmin为权重系数最小值,C1,k为第k次迭代的个体学习因子,C1,max为个体学习因子最大值,C1,min为个体学习因子最小值,C2,k为第k次迭代的社会学习因子,C2,max为社会学习因子最大值,C2,min为社会学习因子最小值。
本申请第二方面提供一种基于粒子群改进K均值算法的负荷曲线聚类系统,所述一种基于粒子群改进K均值算法的负荷曲线聚类系统用于执行本申请第一方面提供的一种基于粒子群改进K均值算法的负荷曲线聚类方法,包括:
数据获取模块,用于获取多个用户原始负荷曲线的负荷数据;
数据预处理模块,用于对原始负荷曲线的负荷数据进行预处理,获得负荷数据集,所述负荷数据集由多个数据对象组成,一个数据对象代表一条负荷曲线的负荷数据;
粒子群模块,用于采用粒子群算法进行多次迭代,获得K均值算法的M个初始聚类中心;
K均值模块,包括:
分配单元,用于计算数据对象到所有初始聚类中心的距离,按照最接近原则,将数据对象分配到最近的聚类中心,直到所有数据对象分配完毕,获得M个相应的类簇;
更新单元,用于分别计算每个类簇中所有数据对象属性值均值,获得M个新聚类中心;
判定单元,用于判断每个类簇的新聚类中心和初始聚类中心是否相同;若存在类簇的新聚类中心与初始聚类中心不相同,则用所有新聚类中心的编码值更新所有初始聚类中心的编码值,并跳转至分配单元;若所有类簇的新聚类中心与初始聚类中心相同,则跳转至聚类模块;
聚类模块,用于将新聚类中心作为K均值算法的最终聚类中心,对负荷数据集中所有的数据对象进行分类。
可选的,所述数据预处理模块具体包括:
数据清洗单元,用于查找每条原始负荷曲线的负荷数据中缺失和异常数据,所述异常数据包括骤降、暴增或为负值的数据,若原始负荷曲线的负荷异常数据大于采集量的10%,则将所述原始负荷曲线剔除,获得第一备用负荷数据;
数据插值单元,用于采用牛顿插值法对第一备用负荷数据中缺失和异常数据进行补充和修正,获得第二备用负荷数据;
数据归一化单元,用于采用线性函数归一化方法对第二备用负荷数据进行归一化处理,获得负荷数据集。
可选的,所述粒子群模块包括:
初始化单元,用于初始化粒子,基于负荷数据集预分类的类簇数目随机生成M个聚类中心作为初始粒子的位置编码,随机分配粒子速度;以及用于多次随机生成粒子,形成初始化粒子群;
适应度单元,用于按照每个粒子的位置编码,对数据对象进行聚类划分,选定适应度函数,计算每个粒子的适应度值;
速度和位置更新单元,用于根据每个粒子的适应度值和它经历过的适应度值,确定每个粒子的个体极值;以及用于根据每个粒子的个体极值,确定整个粒子群的全局极值;还用于按照粒子的更新速度和更新位置公式更新粒子的速度和位置;
迭代单元,用于设定适应度方差函数和最大迭代次数,计算粒子群的适应度方差值,判断适应度方差和设定阈值的大小,若适应度方差小于阈值或迭代次数大于最大迭代次数,则跳转至选定单元;若适应度方差大于或等于阈值并且迭代次数小于或等于最大迭代次数,则跳转至适应度单元;
选定单元,用于选取整个粒子群的全局极值作为K均值算法M个初始聚类中心的编码值。
可选的,所述适应度函数为:
Figure BDA0003128188550000041
式中,fi为第i个粒子的适应度值,M为每一类簇的样本数量,K为聚类中心个数,ml为输入样本,cj为输入样本对应的类簇的中心点;
所述适应度方差函数为:
Figure BDA0003128188550000051
式中,n为粒子群粒子数目,fi为第i个粒子的适应度值,favg为粒子群的平均适应度。
本申请提供一种基于粒子群改进K均值算法的负荷曲线聚类方法及系统,所述一种基于粒子群改进K均值算法的负荷曲线聚类系统用于执行一种基于粒子群改进K均值算法的负荷曲线聚类方法的步骤,获取多个用户的原始负荷曲线负荷,对所述原始负荷曲线负荷进行预处理,获得负荷数据集;采用粒子群算法多次迭代,获得K均值算法的M个初始聚类中心;按照最接近原则,将数据对象分配到最近的聚类中心,获得M个相应的类簇;分别计算每个类簇中所有数据对象属性值均值,获得M个新聚类中心;根据每个类簇的新聚类中心和初始聚类中心是否相同来选择是否更新初始聚类中心;将新聚类中心作为K均值算法的最终聚类中心,对负荷数据集中所有的数据对象进行分类。
本申请实施例提供的一种基于粒子群改进K均值算法的负荷曲线聚类方法,通过粒子群算法获得K均值算法的初始聚类中心,有效避免了陷入局部最优,提高了负荷曲线聚类方法的准确性和收敛速度。
附图说明
为了更清楚地说明本申请的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的基于粒子群改进K均值算法的负荷曲线聚类方法的流程示意图。
图2是本申请实施例提供的基于粒子群改进K均值算法的负荷曲线聚类系统的结构示意图。
图3是本申请实施例提供的某工业用户日负荷曲线归一化结果示意图。
图4是本申请实施例的粒子群改进K均值算法的负荷曲线聚类结果。
图5是本申请实施例的传统K均值算法的负荷曲线聚类结果。
图6是本申请实施例的30db噪声下粒子群改进K均值算法的负荷曲线聚类结果。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。
如图1所示,为本申请实施例提供的一种基于粒子群改进K均值算法的负荷曲线聚类方法的流程示意图,所述一种基于粒子群改进K均值算法的负荷曲线聚类方法包括步骤1至步骤6。
步骤1,获取多个用户原始负荷曲线的负荷数据,对原始负荷曲线的负荷数据进行预处理,获得负荷数据集,所述负荷数据集由多个数据对象组成,一个数据对象代表一条负荷曲线的负荷数据。
一般聚类算法对异常和缺失数据都较为敏感,负荷数据中的异常数据可能会影响聚类的效果,产生错的分类,所以有必要对负荷数据进行预处理。负荷的缺失和异常数据产生的原因有很多,首先数据测量装置的损坏和异常可能会导致数据缺失,其次线路维护或者安检等电网的正常活动可能会导致负荷数据确实,而负荷数据本身从测量装置到分析端的传输也有可能导致数据异常,例如离群值、噪声和偏差等。对于负荷数据异常和缺失预处理方法有经验修正法、阈值判别法和曲线置换法等。
本申请实施例选取500条原始日负荷曲线,每条原始日负荷曲线上有96个负荷采样点,采样点时间间隔为15分钟,获取负荷数据后对其进行预处理,具体包括步骤S101至步骤S103。
步骤S101,查找每条原始日负荷曲线负荷中缺失和异常数据,异常的数据包括骤降、暴增或为负值的数据,若原始日负荷曲线的负荷异常数据达到采样数量的10%,则认为该条原始日负荷曲线无效,将其剔除,获得第一备用负荷数据,例如获取n条原始日负荷曲线,有x条原始日负荷曲线无效,则有效原始日负荷曲线为n-x条,形成(n-x)×m的矩阵为第一备用负荷数据。
在本申请实施例的500条原始日负荷曲线中,缺失和异常数据在10个采样点的曲线共计18条,剔除这18条曲线后进行下一步操作。
步骤S102,对第一备用负荷数据中缺失和异常数据进行补充和修正,采用牛顿插值法,获得第二备用负荷数据。
本申请实施例采用牛顿插值法对缺失和异常数据进行补充和修正,运算次数少,克服一般插值多项式增加节点时需要重新计算的缺陷。假设一条负荷曲线上有n个点{(x1,f(x1)),(x2,f(x2))…(xn,f(xn))},其中缺失点为(xi,f(xi)),则牛顿插值多项式为:
f(xi)=f(x1)+f[x2,x1](xi-x1)+…
+f[xn,xn-1,…,x1](xi-x1)…(xi-xn-1);
+f[xn,xn-1,…,x1+xi](xi-x1)…(xi-xn)
式中,f(xi)为牛顿插值所得函数值,插值逼近函数为:
Nn(xi)=f(x1)+f[x2,x1](xi-x1)+…
+f[xn,xn-1,…,x1](xi-x1)…(xi-xn-1);
截断误差为:
Rn(x)=f[xn,xn-1,…,x1+xi](xi-x1)…(xi-xn);
步骤S103,对第二备用负荷数据进行归一化处理获得负荷数据集,负荷数据集由多个数据对象组成,一个数据对象代表一条日负荷曲线。
日负荷曲线因用户属性不同量纲往往也不相同,数据归一化处理可消除量纲的影响,使得分析结果更加准确,常用的线性函数归一化公式如下:
Figure BDA0003128188550000071
式中,X′i为归一化后的负荷数据,Xi为归一化前的负荷数据,Xmin为归一化前最小的负荷数据,Xmax为归一化前最大的负荷数据。
由于负荷曲线中负荷最大值和最小值不稳定,易影响归一化的结果,所以本申请实施例采用定值线性函数归一化方法,所述定值线性函数归一化方法利用经验常量值来替代归一化前最小的负荷数据和最大的负荷数据,如图3所示为本申请实施例提供的某条工业用户日负荷曲线归一化结果示意图,图3中由上到下第一个子图为原始日负荷曲线,第二个子图为经线性函数归一化后的日负荷曲线,第三个子图为经定值线性函数归一化后的日负荷曲线,由第二个子图可见,线性函数归一化后虽然日负荷变化与原始曲线相似,但改变了幅值特性,而第三个子图可见,定值线性函数归一化后日负荷曲线特性与原始曲线相似且幅值特性未改变。
步骤2,基于负荷数据集预分类的类簇数目确定聚类中心个数M,采用粒子群算法进行多次迭代,获得K均值算法的M个初始聚类中心。
对于负荷数据集预分类类簇数目的确定有多种方法,例如间隙统计法、肘形判据法和有效性函数指标等,本申请实施例选取的用户样本来自工业、商业、农业和教育类,所以初步确定类簇数目M为4。
K均值算法的初始聚类中心对聚类最终结果影响很大,不同的初始聚类中心,负荷聚类得到的结果也不相同,若选择的初始聚类中心偏出了全局最优的探寻领域,则最终迭代结果会导致局部最优解的出现,所以初始聚类中心的选择尤为重要。本申请实施例采用粒子群算法进行多次迭代,获得K均值算法的M个初始聚类中心的步骤,具体包括步骤S201至步骤S208。
步骤S201,初始化粒子,基于负荷数据集预分类的类簇数目随机生成M个聚类中心作为初始粒子的位置编码,随机分配粒子速度。
根据粒子群算法,一个粒子的位置编码是一个可行解,即每个粒子的位置编码都代表一种负荷数据集的聚类方式,粒子的位置编码方式有很多种,例如,基于聚类中心的编码方式,每个数据对象为96维,分成4类,粒子的位置编码即为4×96维变量;例如,基于分类的编码方式,总共有482个数据对象,分成4类,给予每个数据对象具体分配至某一类的属性值,粒子位置编码即为482维变量。
步骤S202,多次执行步骤301,形成初始化粒子群,其中,每执行一次步骤301生成一个初始化粒子。
步骤S203,按照每个粒子的位置编码,对数据对象进行聚类划分,选定适应度函数,计算每个粒子的适应度值。
所述适应度函数为:
Figure BDA0003128188550000072
式中,fi为第i个粒子的适应度值,M为每一类簇的样本数量,K为聚类中心个数,ml为输入样本,cj为输入样本对应的类簇的中心点。
步骤S204,根据每个粒子的适应度值和它经历过的适应度值,确定每个粒子的个体极值;
步骤S205:根据每个粒子的个体极值,确定整个粒子群的全局极值;
步骤S206:按照粒子的更新速度和更新位置公式更新粒子的速度和位置,所述更新速度公式为:
Vi=ωVpresent+C1×rand()×(Pbest-Xpresent)+C2×rand()×(Gbest-Xpresent);
所述更新位置公式为:
Xi=Xpresent+Vi
式中,Vi为第i个粒子更新后的速度,Xi为第i个粒子更新后的位置,Vpresent为第i个粒子当前速度,Xpresent为第i个粒子当前位置,ω为权重系数,C1为个体学习因子,C2为社会学习因子,rand()为0到1之间的随机数,Pbest为第i个粒子的个体极值,Gbest为当前粒子群的全局极值。
权重系数数值较大时,搜寻全局最优解的能力较强,但局部寻优能力较弱,数值较小时,局部寻优能力较强,但全局寻优能力较弱,所以本申请实施例采用线性递减的方式,将权重系数设置为动态值,根据迭代次数的增加权重系数线性递减,由此可以调整全局和局部寻优性能;同时,对学习因子和社会因子也同样采用线性递减的方式,有效控制粒子得飞行速度,增强算法局部搜索能力,所述更新速度公式中权重系数、个体学习因子和社会学习因子分别采用以下公式实现,具体为:
权重系数公式,
Figure BDA0003128188550000081
个体学习因子公式,
Figure BDA0003128188550000082
社会学习因子公式,
Figure BDA0003128188550000083
式中,k为当前迭代次数,T为最大迭代次数,ωk为第k次迭代的权重系数,ωmax为权重系数最大值,ωmin为权重系数最小值,C1,k为第k次迭代的个体学习因子,C1,max为个体学习因子最大值,C1,min为个体学习因子最小值,C2,k为第k次迭代的社会学习因子,C2,max为社会学习因子最大值,C2,min为社会学习因子最小值。
步骤S207:设定适应度方差函数和最大迭代次数,计算粒子群的适应度方差值,判断适应度方差和设定阈值的大小,若适应度方差小于阈值或迭代次数大于最大迭代次数,则执行步骤308;若适应度方差大于或等于阈值并且迭代次数小于或等于最大迭代次数,则执行步骤303;
粒子群算法常用的传统适应度方差函数为
Figure BDA0003128188550000084
由于δ2的值越小则粒子收敛程度越高,根据δ2的值的大小来确定切换K均值算法的时机,当δ2低于设定阈值时,执行K均值算法进行局部快速寻优。所以本申请实施例采用如下适应度方差函数,可以快速收敛:
Figure BDA0003128188550000091
式中,n为粒子群粒子数目,fi为第i个粒子的适应度值,favg为粒子群的平均适应度。
步骤S208:选取整个粒子群的全局极值作为K均值算法M个初始聚类中心。
步骤3,分别计算数据对象到所有初始聚类中心的距离,按照最接近原则,将数据对象分配到最近的聚类中心,直到所有数据对象分配完毕,获得M个相应的类簇;
本申请实施例采用欧式距离来计算数据对象之间的距离,欧式距离定义如下:
Figure BDA0003128188550000092
式中,n为数据对象的维度,xi为样本X在i维度的坐标值,yi为样本Y在i维度的坐标值。
数据对象所属的聚类可以表示为:
C=minb||x-db||2
式中,b为聚类数,C为聚类,db表示聚类的中心距离。
步骤4,分别计算每个类簇中所有数据对象属性值均值,即所有数据对象的几何中心,获得M个新聚类中心;
步骤5,判断每个类簇的新聚类中心和初始聚类中心是否相同;若存在类簇的新聚类中心与初始聚类中心不相同,则用所有新聚类中心的编码值更新所有初始聚类中心的编码值,并跳转至步骤3;若所有类簇的新聚类中心与初始聚类中心相同,则跳转至步骤6;
步骤6,将新聚类中心作为K均值算法的最终聚类中心,对负荷数据集中所有的数据对象进行分类。
为验证本申请方法的准确性,本申请实施例采用粒子群改进K均值算法和传统K均值算法进行对比分析。如图4所示,为本申请实施例的粒子群改进K均值算法的负荷曲线聚类结果。如图5所示,为本申请实施例的传统K均值算法的负荷曲线聚类结果。从图4可以看出用户负荷曲线分为4类,第Ⅰ类用户呈避峰状态,此类用户白天休息,晚上工作,多为需要避开较贵电价的工业;第Ⅱ类用户表现为白天起负荷且不定期,多为农业机器工作状态,包括农业灌溉和畜牧等;第Ⅲ类用户呈避峰状态,早9点到晚10点为负荷高峰期,多为大型商场负荷状态;第Ⅳ类用户呈双峰状态,此类用户早8点到12点和13点到17点负荷较高,多为教育和市政行业。从图5可以看出,第Ⅱ类用户负荷曲线与第Ⅳ类用户负荷曲线因特征较相似出现交叉混叠的现象,第Ⅳ用户负荷曲线部分分类到第Ⅱ类,这是因为传统的K均值算法易陷入局部最优解,所以很难准确分类特征相似的用户日负荷曲线。
为验证本申请方法的鲁棒性,本申请实施例对原始日负荷曲线增加30db噪声,再采用本申请所提的粒子群改进K均值算法进行验证,如图6所示,为本申请实施例的30db噪声下粒子群改进K均值算法的负荷曲线聚类结果,增加30db噪声后负荷曲线依旧准确分类,且聚类中心之间距离仍较远,
本申请实施例第二方面提供一种基于粒子群改进K均值算法的负荷曲线聚类系统,所述一种基于粒子群改进K均值算法的负荷曲线聚类系统用于执行本申请实施例第一方面提供的一种基于粒子群改进K均值算法的负荷曲线聚类方法,对于本申请实施例第二方面提供的聚类系统中公开的细节,请参见本申请实施例第一方面提供的基于粒子群改进K均值算法的负荷曲线聚类方法。
如图2所示,为本申请实施例提供的基于粒子群改进K均值算法的负荷曲线聚类系统的结构示意图。所述基于融合进化算法的日负荷曲线聚类系统包括数据获取模块、数据预处理模块、粒子群模块、K均值模块、聚类模块。
数据获取模块,用于获取多个用户原始负荷曲线的负荷数据。
数据预处理模块,用于对原始负荷曲线的负荷数据进行预处理,获得负荷数据集,所述负荷数据集由多个数据对象组成,一个数据对象代表一条负荷曲线的负荷数据。
粒子群模块,用于采用粒子群算法进行多次迭代,获得K均值算法的M个初始聚类中心。
K均值模块,包括:
分配单元,用于计算数据对象到所有初始聚类中心的距离,按照最接近原则,将数据对象分配到最近的聚类中心,直到所有数据对象分配完毕,获得M个相应的类簇。
更新单元,用于分别计算每个类簇中所有数据对象属性值均值,获得M个新聚类中心。
判定单元,用于判断每个类簇的新聚类中心和初始聚类中心是否相同;若存在类簇的新聚类中心与初始聚类中心不相同,则用所有新聚类中心的编码值更新所有初始聚类中心的编码值,并跳转至分配单元;若所有类簇的新聚类中心与初始聚类中心相同,则跳转至聚类模块。
聚类模块,用于将新聚类中心作为K均值算法的最终聚类中心,对负荷数据集中所有的数据对象进行分类。
进一步的,所述数据预处理模块具体包括:
数据清洗单元,用于查找每条原始负荷曲线的负荷数据中缺失和异常数据,所述异常数据包括骤降、暴增或为负值的数据,若原始负荷曲线的负荷异常数据大于采集量的10%,则将所述原始负荷曲线剔除,获得第一备用负荷数据。
数据插值单元,用于采用牛顿插值法对第一备用负荷数据中缺失和异常数据进行补充和修正,获得第二备用负荷数据。
数据归一化单元,用于对第二备用负荷数据进行归一化处理,获得负荷数据集。
进一步的,所述粒子群模块包括:
初始化单元,用于初始化粒子,基于负荷数据集预分类的类簇数目随机生成M个聚类中心作为初始粒子的位置编码,随机分配粒子速度;以及用于多次随机生成粒子,形成初始化粒子群。
适应度单元,用于按照每个粒子的位置编码,对数据对象进行聚类划分,选定适应度函数,计算每个粒子的适应度值。
速度和位置更新单元,用于根据每个粒子的适应度值和它经历过的适应度值,确定每个粒子的个体极值;以及用于根据每个粒子的个体极值,确定整个粒子群的全局极值;还用于按照粒子的更新速度和更新位置公式更新粒子的速度和位置。
迭代单元,用于设定适应度方差函数和最大迭代次数,计算粒子群的适应度方差值,判断适应度方差和设定阈值的大小,若适应度方差小于阈值或迭代次数大于最大迭代次数,则跳转至选定单元;若适应度方差大于或等于阈值并且迭代次数小于或等于最大迭代次数,则跳转至适应度单元。
选定单元,用于选取整个粒子群的全局极值作为K均值算法M个初始聚类中心的编码值。
进一步的,所述适应度函数为:
Figure BDA0003128188550000111
式中,fi为第i个粒子的适应度值,M为每一类簇的样本数量,K为聚类中心个数,ml为输入样本,cj为输入样本对应的类簇的中心点;
所述适应度方差函数为:
Figure BDA0003128188550000112
式中,n为粒子群粒子数目,fi为第i个粒子的适应度值,favg为粒子群的平均适应度。
本申请提供一种基于粒子群改进K均值算法的负荷曲线聚类方法及系统,所述一种基于粒子群改进K均值算法的负荷曲线聚类系统用于执行一种基于粒子群改进K均值算法的负荷曲线聚类方法的步骤,获取多个用户的原始负荷曲线负荷,对所述原始负荷曲线负荷进行预处理,获得负荷数据集;采用粒子群算法多次迭代,获得K均值算法的M个初始聚类中心;按照最接近原则,将数据对象分配到最近的聚类中心,获得M个相应的类簇;分别计算每个类簇中所有数据对象属性值均值,获得M个新聚类中心;根据每个类簇的新聚类中心和初始聚类中心是否相同来选择是否更新初始聚类中心;将新聚类中心作为K均值算法的最终聚类中心,对负荷数据集中所有的数据对象进行分类。
本申请实施例提供的一种基于粒子群改进K均值算法的负荷曲线聚类方法,通过粒子群算法获得K均值算法的初始聚类中心,有效避免了陷入局部最优,提高了负荷曲线聚类方法的准确性和收敛速度。
以上结合具体实施方式和范例性实例对本申请进行了详细说明,不过这些说明并不能理解为对本申请的限制。本领域技术人员理解,在不偏离本申请精神和范围的情况下,可以对本申请技术方案及其实施方式进行多种等价替换、修饰或改进,这些均落入本申请的范围内。本申请的保护范围以所附权利要求为准。

Claims (10)

1.一种基于粒子群改进K均值算法的负荷曲线聚类方法,其特征在于,包括:
步骤1:获取多个用户原始负荷曲线的负荷数据,对原始负荷曲线的负荷数据进行预处理,获得负荷数据集,所述负荷数据集由多个数据对象组成,一个数据对象代表一条负荷曲线的负荷数据;
步骤2:基于负荷数据集预分类的类簇数目确定聚类中心个数M,采用粒子群算法进行多次迭代,获得K均值算法的M个初始聚类中心;
步骤3:分别计算数据对象到所有初始聚类中心的距离,按照最接近原则,将数据对象分配到最近的聚类中心,直到所有数据对象分配完毕,获得M个相应的类簇;
步骤4:分别计算每个类簇中所有数据对象属性值均值,获得M个新聚类中心;
步骤5:判断每个类簇的新聚类中心和初始聚类中心是否相同;若存在类簇的新聚类中心与初始聚类中心不相同,则用所有新聚类中心的编码值更新所有初始聚类中心的编码值,并跳转至步骤3;若所有类簇的新聚类中心与初始聚类中心相同,则跳转至步骤6;
步骤6:将新聚类中心作为K均值算法的最终聚类中心,对负荷数据集中所有的数据对象进行分类。
2.根据权利要求1所述的一种基于粒子群改进K均值算法的负荷曲线聚类方法,其特征在于,所述获取多个用户的原始负荷曲线负荷,对原始负荷曲线负荷进行预处理,获得负荷数据集的步骤,具体为:
查找每条原始负荷曲线负荷的缺失和异常数据,若原始负荷曲线的负荷异常数据大于采集量的10%,则将所述原始负荷曲线剔除,获得第一备用负荷数据,所述异常数据包括骤降、暴增或为负值等数据;
对第一备用负荷数据中缺失和异常数据进行补充和修正,获得第二备用负荷数据;
采用线性函数归一化方法对第二备用负荷数据进行归一化处理,获得负荷数据集。
3.根据权利要求1所述的一种基于粒子群改进K均值算法的负荷曲线聚类方法,其特征在于,所述基于负荷数据集预分类的类簇数目确定聚类中心个数M,采用粒子群算法进行多次迭代,获得K均值算法的M个初始聚类中心的步骤,具体为:
步骤301:初始化粒子,基于负荷数据集预分类的类簇数目随机生成M个聚类中心作为初始粒子的位置编码,随机分配粒子速度;
步骤302:多次执行步骤301,形成初始化粒子群,其中,每执行一次步骤301生成一个初始化粒子;
步骤303:按照每个粒子的位置编码,对数据对象进行聚类划分,选定适应度函数,计算每个粒子的适应度值;
步骤304:根据每个粒子的适应度值和它经历过的适应度值,确定每个粒子的个体极值;
步骤305:根据每个粒子的个体极值,确定整个粒子群的全局极值;
步骤306:按照粒子的更新速度和更新位置公式更新粒子的速度和位置,所述更新速度公式为:
Vi=ωVpresent+C1×rand()×(Pbest-Xpresent)+C2×rand()×(Gbest-Xpresent);
所述更新位置公式为:
Xi=Xpresent+Vi
式中,Vi为第i个粒子更新后的速度,Xi为第i个粒子更新后的位置,Vpresent为第i个粒子当前速度,Xpresent为第i个粒子当前位置,ω为权重系数,C1为个体学习因子,C2为社会学习因子,rand()为0到1之间的随机数,Pbest为第i个粒子的个体极值,Gbest为当前粒子群的全局极值;
步骤307:设定适应度方差函数和最大迭代次数,计算粒子群的适应度方差值,判断适应度方差和设定阈值的大小,若适应度方差小于阈值或迭代次数大于最大迭代次数,则执行步骤308;若适应度方差大于或等于阈值并且迭代次数小于或等于最大迭代次数,则执行步骤303;
步骤308:选取整个粒子群的全局极值作为K均值算法M个初始聚类中心。
4.根据权利要求3所述的一种基于粒子群改进K均值算法的负荷曲线聚类方法,其特征在于,所述适应度函数为:
Figure FDA0003128188540000021
式中,fi为第i个粒子的适应度值,M为每一类簇的样本数量,K为聚类中心个数,ml为输入样本,cj为输入样本对应的类簇的中心点。
5.根据权利要求3所述的一种基于粒子群改进K均值算法的负荷曲线聚类方法,其特征在于,所述适应度方差函数为:
Figure FDA0003128188540000022
式中,n为粒子群粒子数目,fi为第i个粒子的适应度值,favg为粒子群的平均适应度。
6.根据权利要求3所述的一种基于粒子群改进K均值算法的负荷曲线聚类方法,其特征在于,所述更新速度公式中权重系数、个体学习因子和社会学习因子分别采用以下公式实现,具体为:
权重系数公式为
Figure FDA0003128188540000023
个体学习因子公式为
Figure FDA0003128188540000024
社会学习因子公式为
Figure FDA0003128188540000025
式中,k为当前迭代次数,T为最大迭代次数,ωk为第k次迭代的权重系数,ωmax为权重系数最大值,ωmin为权重系数最小值,C1,k为第k次迭代的个体学习因子,C1,max为个体学习因子最大值,C1,min为个体学习因子最小值,C2,k为第k次迭代的社会学习因子,C2,max为社会学习因子最大值,C2,min为社会学习因子最小值。
7.一种基于粒子群改进K均值算法的负荷曲线聚类系统,其特征在于,所述一种基于粒子群改进K均值算法的负荷曲线聚类系统用于执行权利要求1-6任一项所述的一种基于粒子群改进K均值算法的负荷曲线聚类方法,包括:
数据获取模块,用于获取多个用户原始负荷曲线的负荷数据;
数据预处理模块,用于对原始负荷曲线的负荷数据进行预处理,获得负荷数据集,所述负荷数据集由多个数据对象组成,一个数据对象代表一条负荷曲线的负荷数据;
粒子群模块,用于采用粒子群算法进行多次迭代,获得K均值算法的M个初始聚类中心;
K均值模块,包括:
分配单元,用于计算数据对象到所有初始聚类中心的距离,按照最接近原则,将数据对象分配到最近的聚类中心,直到所有数据对象分配完毕,获得M个相应的类簇;
更新单元,用于分别计算每个类簇中所有数据对象属性值均值,获得M个新聚类中心;
判定单元,用于判断每个类簇的新聚类中心和初始聚类中心是否相同;若存在类簇的新聚类中心与初始聚类中心不相同,则用所有新聚类中心的编码值更新所有初始聚类中心的编码值,并跳转至分配单元;若所有类簇的新聚类中心与初始聚类中心相同,则跳转至聚类模块;
聚类模块,用于将新聚类中心作为K均值算法的最终聚类中心,对负荷数据集中所有的数据对象进行分类。
8.根据权利要求7所述的一种基于粒子群改进K均值算法的负荷曲线聚类系统,其特征在于,所述数据预处理模块具体包括:
数据清洗单元,用于查找每条原始负荷曲线的负荷数据中缺失和异常数据,所述异常数据包括骤降、暴增或为负值的数据,若原始负荷曲线的负荷异常数据大于采集量的10%,则将所述原始负荷曲线剔除,获得第一备用负荷数据;
数据插值单元,用于采用牛顿插值法对第一备用负荷数据中缺失和异常数据进行补充和修正,获得第二备用负荷数据;
数据归一化单元,用于对第二备用负荷数据进行归一化处理,获得负荷数据集。
9.根据权利要求7所述的一种基于粒子群改进K均值算法的负荷曲线聚类系统,其特征在于,所述粒子群模块包括:
初始化单元,用于初始化粒子,基于负荷数据集预分类的类簇数目随机生成M个聚类中心作为初始粒子的位置编码,随机分配粒子速度;以及用于多次随机生成粒子,形成初始化粒子群;
适应度单元,用于按照每个粒子的位置编码,对数据对象进行聚类划分,选定适应度函数,计算每个粒子的适应度值;
速度和位置更新单元,用于根据每个粒子的适应度值和它经历过的适应度值,确定每个粒子的个体极值;以及用于根据每个粒子的个体极值,确定整个粒子群的全局极值;还用于按照粒子的更新速度和更新位置公式更新粒子的速度和位置;
迭代单元,用于设定适应度方差函数和最大迭代次数,计算粒子群的适应度方差值,判断适应度方差和设定阈值的大小,若适应度方差小于阈值或迭代次数大于最大迭代次数,则跳转至选定单元;若适应度方差大于或等于阈值并且迭代次数小于或等于最大迭代次数,则跳转至适应度单元;
选定单元,用于选取整个粒子群的全局极值作为K均值算法M个初始聚类中心的编码值。
10.根据权利要求9所述的一种基于粒子群改进K均值算法的负荷曲线聚类系统,其特征在于,所述适应度函数为:
Figure FDA0003128188540000031
式中,fi为第i个粒子的适应度值,M为每一类簇的样本数量,K为聚类中心个数,ml为输入样本,cj为输入样本对应的类簇的中心点;
所述适应度方差函数为:
Figure FDA0003128188540000041
式中,n为粒子群粒子数目,fi为第i个粒子的适应度值,favg为粒子群的平均适应度。
CN202110695568.XA 2021-06-23 2021-06-23 一种基于粒子群改进k均值算法的负荷曲线聚类方法及系统 Active CN113378954B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110695568.XA CN113378954B (zh) 2021-06-23 2021-06-23 一种基于粒子群改进k均值算法的负荷曲线聚类方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110695568.XA CN113378954B (zh) 2021-06-23 2021-06-23 一种基于粒子群改进k均值算法的负荷曲线聚类方法及系统

Publications (2)

Publication Number Publication Date
CN113378954A true CN113378954A (zh) 2021-09-10
CN113378954B CN113378954B (zh) 2023-07-21

Family

ID=77578453

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110695568.XA Active CN113378954B (zh) 2021-06-23 2021-06-23 一种基于粒子群改进k均值算法的负荷曲线聚类方法及系统

Country Status (1)

Country Link
CN (1) CN113378954B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115310565A (zh) * 2022-10-12 2022-11-08 西安道法数器信息科技有限公司 一种基于人工智能的网络安全监控方法
CN117172831A (zh) * 2023-11-02 2023-12-05 国网经济技术研究院有限公司 基于用户行为与数量演变的动态分群方法和系统
CN118195106A (zh) * 2024-05-20 2024-06-14 西昌学院 一种基于粒子群算法的物流配送中心选址方法和系统
CN118570334A (zh) * 2024-07-31 2024-08-30 烟台东方威思顿电气有限公司 一种电力负荷曲线重构方法

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050196047A1 (en) * 2004-02-03 2005-09-08 Yuri Owechko Object recognition system incorporating swarming domain classifiers
CN102663100A (zh) * 2012-04-13 2012-09-12 西安电子科技大学 一种两阶段混合粒子群优化聚类方法
CN104361393A (zh) * 2014-09-06 2015-02-18 华北电力大学 基于粒子群优化算法改进的神经网络模型用于数据预测方法
CN108985318A (zh) * 2018-05-28 2018-12-11 中国地质大学(武汉) 一种基于样本密度的全局优化k均值聚类方法及系统
CN109902953A (zh) * 2019-02-27 2019-06-18 华北电力大学 一种基于自适应粒子群聚类的电力用户分类方法
US20190272333A1 (en) * 2018-03-01 2019-09-05 King Fahd University Of Petroleum And Minerals Heuristic for the data clustering problem
CN111368077A (zh) * 2020-02-28 2020-07-03 大连大学 一种基于粒子群位置更新思想灰狼优化算法的K-Means文本分类方法
CN111401638A (zh) * 2020-03-17 2020-07-10 国网上海市电力公司 基于极限学习机与负荷密度指标法的空间负荷预测方法
CN112261000A (zh) * 2020-09-25 2021-01-22 湖南大学 一种基于PSO-K算法的LDoS攻击检测方法
CN112308161A (zh) * 2020-11-06 2021-02-02 汉唐智华(深圳)科技发展有限公司 一种基于人工智能半监督聚类目标下的粒子群算法
CN113011097A (zh) * 2021-03-26 2021-06-22 云南电网有限责任公司电力科学研究院 一种多种群自适应协作优化方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050196047A1 (en) * 2004-02-03 2005-09-08 Yuri Owechko Object recognition system incorporating swarming domain classifiers
CN102663100A (zh) * 2012-04-13 2012-09-12 西安电子科技大学 一种两阶段混合粒子群优化聚类方法
CN104361393A (zh) * 2014-09-06 2015-02-18 华北电力大学 基于粒子群优化算法改进的神经网络模型用于数据预测方法
US20190272333A1 (en) * 2018-03-01 2019-09-05 King Fahd University Of Petroleum And Minerals Heuristic for the data clustering problem
CN108985318A (zh) * 2018-05-28 2018-12-11 中国地质大学(武汉) 一种基于样本密度的全局优化k均值聚类方法及系统
CN109902953A (zh) * 2019-02-27 2019-06-18 华北电力大学 一种基于自适应粒子群聚类的电力用户分类方法
CN111368077A (zh) * 2020-02-28 2020-07-03 大连大学 一种基于粒子群位置更新思想灰狼优化算法的K-Means文本分类方法
CN111401638A (zh) * 2020-03-17 2020-07-10 国网上海市电力公司 基于极限学习机与负荷密度指标法的空间负荷预测方法
CN112261000A (zh) * 2020-09-25 2021-01-22 湖南大学 一种基于PSO-K算法的LDoS攻击检测方法
CN112308161A (zh) * 2020-11-06 2021-02-02 汉唐智华(深圳)科技发展有限公司 一种基于人工智能半监督聚类目标下的粒子群算法
CN113011097A (zh) * 2021-03-26 2021-06-22 云南电网有限责任公司电力科学研究院 一种多种群自适应协作优化方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
GAUTAM KUMAR等: "Satellite image clustering and optimization using K-means and PSO", 《2016 IEEE 1ST INTERNATIONAL CONFERENCE ON POWER ELECTRONICS, INTELLIGENT CONTROL AND ENERGY SYSTEMS (ICPEICES)》 *
覃日升等: "一种基于图信号处理的非侵入式负荷分解方法", 《电气自动化》 *
郭永坤等: "优化初始聚类中心的K-means聚类算法", 《计算机工程与应用》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115310565A (zh) * 2022-10-12 2022-11-08 西安道法数器信息科技有限公司 一种基于人工智能的网络安全监控方法
CN117172831A (zh) * 2023-11-02 2023-12-05 国网经济技术研究院有限公司 基于用户行为与数量演变的动态分群方法和系统
CN117172831B (zh) * 2023-11-02 2024-01-23 国网经济技术研究院有限公司 基于用户行为与数量演变的动态分群方法和系统
CN118195106A (zh) * 2024-05-20 2024-06-14 西昌学院 一种基于粒子群算法的物流配送中心选址方法和系统
CN118195106B (zh) * 2024-05-20 2024-08-20 西昌学院 一种基于粒子群算法的物流配送中心选址方法和系统
CN118570334A (zh) * 2024-07-31 2024-08-30 烟台东方威思顿电气有限公司 一种电力负荷曲线重构方法

Also Published As

Publication number Publication date
CN113378954B (zh) 2023-07-21

Similar Documents

Publication Publication Date Title
CN113378954B (zh) 一种基于粒子群改进k均值算法的负荷曲线聚类方法及系统
CN109871860B (zh) 一种基于核主成分分析的日负荷曲线降维聚类方法
Kuo et al. Application of a hybrid of genetic algorithm and particle swarm optimization algorithm for order clustering
KR102215690B1 (ko) 시계열의 데이터를 모니터링 하는 방법 및 그 장치
CN110245783B (zh) 一种基于c-均值聚类模糊粗糙集的短期负荷预测方法
CN110750524A (zh) 一种有源配电网故障特征的确定方法及系统
CN114048870A (zh) 一种基于日志特征智能挖掘的电力系统异常监测方法
CN115270986A (zh) 数据异常检测方法、装置和计算机设备
CN109344990A (zh) 一种基于dfs和svm特征选择的短期负荷预测方法及系统
CN112862216B (zh) 一种基于深度置信网络的多行业能源需求预测方法
CN111339713A (zh) 风电场的优化设计方法、系统、电子设备和存储介质
CN118411003B (zh) 多类别电力设备的负荷控制方法、系统、设备和存储介质
Pereira et al. Transfer learning for Bayesian networks with application on hard disk drives failure prediction
CN115511384A (zh) 分布式太阳能发电的电力调度方法及装置、设备及介质
CN114781520A (zh) 基于改进lof模型的天然气行为异常检测方法及系统
CN114580763A (zh) 一种基于改进蜻蜓与轻量级梯度提升树模型的电力负荷预测方法
CN117913808A (zh) 一种分布式光伏发电预测方法及其装置
Gavagsaz Efficient parallel processing of k-nearest neighbor queries by using a centroid-based and hierarchical clustering algorithm
CN113344073A (zh) 一种基于融合进化算法的日负荷曲线聚类方法及系统
CN116365519A (zh) 一种电力负荷预测方法、系统、存储介质及设备
CN115313522A (zh) 一种考虑新能源出力预测偏差的备用容量配置方法及系统
CN116628488A (zh) 风电功率预测模型的训练方法、风电功率预测方法及设备
Ghosh et al. A genetic algorithm based clustering approach for piecewise linearization of nonlinear functions
CN115081551A (zh) 基于K-Means聚类和优化RVM线损模型建立方法及系统
CN111222688B (zh) 一种商业楼宇的日负荷预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant