CN109934301B - 一种电力负荷聚类分析方法、装置和设备 - Google Patents

一种电力负荷聚类分析方法、装置和设备 Download PDF

Info

Publication number
CN109934301B
CN109934301B CN201910222416.0A CN201910222416A CN109934301B CN 109934301 B CN109934301 B CN 109934301B CN 201910222416 A CN201910222416 A CN 201910222416A CN 109934301 B CN109934301 B CN 109934301B
Authority
CN
China
Prior art keywords
data
daily load
power
load curve
cluster analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910222416.0A
Other languages
English (en)
Other versions
CN109934301A (zh
Inventor
吴亚雄
曹华珍
高崇
唐俊熙
李�浩
王天霖
何璇
李阳
张俊潇
陈沛东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Power Grid Development Research Institute Co ltd
Guangdong Power Grid Co Ltd
Grid Planning Research Center of Guangdong Power Grid Co Ltd
Original Assignee
Guangdong Power Grid Development Research Institute Co ltd
Guangdong Power Grid Co Ltd
Grid Planning Research Center of Guangdong Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Power Grid Development Research Institute Co ltd, Guangdong Power Grid Co Ltd, Grid Planning Research Center of Guangdong Power Grid Co Ltd filed Critical Guangdong Power Grid Development Research Institute Co ltd
Priority to CN201910222416.0A priority Critical patent/CN109934301B/zh
Publication of CN109934301A publication Critical patent/CN109934301A/zh
Application granted granted Critical
Publication of CN109934301B publication Critical patent/CN109934301B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Supply And Distribution Of Alternating Current (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种电力负荷聚类分析方法、装置和设备,通过动态时间弯曲路径算法计算电力用户的日负荷曲线数据的最短弯曲路径,从而计算最小平均距离,确定电力用户的数据代表,完成了对电力用户历史负荷数据的有效整合,减少了重复信息的冗余计算,有效节省了计算开销,在一定程度上克服了负荷的时间波动性和不确定性导致传统的聚类算法性能下降的问题;根据预置模糊裕度,对数据代表集进行压缩降维处理,使得计算维度大幅下降,提高了计算效率;因此,本申请提供的方法解决了现有的电力负荷聚类分析方法存在的使用原始日负荷数据计算维数高,造成信息冗余和计算效率低下,和因时间不确定性和波动性导致的计算结果误差大的技术问题。

Description

一种电力负荷聚类分析方法、装置和设备
技术领域
本申请涉及电力负荷管理技术领域,尤其涉及一种电力负荷聚类分析方法、装置和设备。
背景技术
随着社会经济的不断发展,电力用户的行业类别不断增加,同类行业用户的日负荷曲线特性的差异性也在逐步提高,传统的以用户报装类别作为负荷分类依据的分析方法已不适于新一代电力系统和能源互联网的发展。
为了对同类性质的电力用户进行负荷分析,通常需要对电力用户的日负荷数据进行聚类分析处理,但是传统的聚类算法直接应用于电力用户日负荷曲线聚类分析往往存在以下缺点:
(1)直接采集的原始日负荷曲线数据维数高,因包含大量历史数据,数据集长度较长,同一用户的历史数据具有高度相似性,造成信息冗余;
(2)即使是具有高度相似性的同一用户的负荷数据,也会因为时间上的不确定性和波动性导致传统聚类所使用的欧氏距离计算结果增大,造成误差。
这些缺点会造成电力负荷聚类分析的复杂度增加、效率低下和误差大的技术问题,因此,如何克服以上缺点是本领域技术人员亟待解决的技术问题。
发明内容
本申请实施例提供了一种电力负荷聚类分析方法、装置和设备,用于解决现有的电力负荷聚类分析方法存在的使用原始日负荷数据计算维数高,造成信息冗余和计算效率低下,和因时间不确定性和波动性导致的计算结果误差大的技术问题。
有鉴于此,本申请第一方面提供了一种电力负荷聚类分析方法,包括以下步骤:
101、从预处理后的电力用户i的日负荷曲线数据中选取一条日负荷曲线作为数据中心,根据动态时间弯曲算法计算所述数据中心与其余日负荷曲线数据的最短弯曲路径,并根据所述最短弯曲路径计算所述数据中心与所述其余日负荷曲线数据的平均距离;
102、遍历所述电力用户i的所有所述日负荷曲线数据,分别计算各所述日负荷曲线数据作为所述数据中心时,所述数据中心与所述其余日负荷曲线数据的平均距离;
103、将所述平均距离取得最小值时对应的所述数据中心作为所述电力用户i的数据代表,得到所有电力用户的数据代表集;
104、根据预置模糊裕度对所述数据代表集进行压缩降维处理,得到降维数据集;
105、对所述降维数据集的数据进行聚类。
优选地,步骤101之前,还包括:
100、获取所有电力用户的日负荷曲线数据,对所述日负荷曲线数据进行预处理,所述预处理包括:对各所述日负荷曲线的原始数据进行清洗和筛选,将数据缺失或异常的所述日负荷曲线剔除。
优选地,所述预处理还包括:
对各所述电力用户的所有所述日负荷曲线进行归一化、离散化和整数化处理。
优选地,所述聚类的聚类算法为K-中心点聚类算法。
本申请第二方面还提供了一种电力负荷聚类分析装置,包括:
距离单元,用于从预处理后的电力用户i的日负荷曲线数据中选取一条日负荷曲线作为数据中心,根据动态时间弯曲算法计算所述数据中心与其余日负荷曲线数据的最短弯曲路径,并根据所述最短弯曲路径计算所述数据中心与所述其余日负荷曲线数据的平均距离;
遍历单元,用于遍历所述电力用户i的所有所述日负荷曲线数据,分别计算各所述日负荷曲线数据作为所述数据中心时,所述数据中心与所述其余日负荷曲线数据的平均距离;
比对单元,用于将所述平均距离取得最小值时对应的所述数据中心作为所述电力用户i的数据代表,得到所有电力用户的数据代表集;
降维单元,用于根据预置模糊裕度对所述数据代表集进行压缩降维处理,得到降维数据集;
聚类单元,用于对所述降维数据集的数据进行聚类。
优选地,还包括:
预处理单元,用于获取所有电力用户的日负荷曲线数据,对所述日负荷曲线数据进行预处理,所述预处理包括:对各所述日负荷曲线的原始数据进行清洗和筛选,将数据缺失或异常的所述日负荷曲线剔除。
优选地,所述预处理单元还用于:对各所述电力用户的所有所述日负荷曲线进行归一化、离散化和整数化处理。
本申请第三方面还提供了一种电力负荷聚类分析设备,所述设备包括处理器以及存储器;
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行第一方面所述的电力负荷聚类分析方法。
本申请第四方面还提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行第一方面所述的电力负荷聚类分析方法。
本申请第五方面还提供了一种包括指令的计算机程序产品,当其在计算机上运行时,使得所述计算机执行第一方面所述的电力负荷聚类分析方法。
从以上技术方案可以看出,本申请实施例具有以下优点:
本申请中,提供了一种电力负荷聚类分析方法,包括:101、从预处理后的电力用户i的日负荷曲线数据中选取一条日负荷曲线作为数据中心,根据动态时间弯曲算法计算数据中心与其余日负荷曲线数据的最短弯曲路径,并根据最短弯曲路径计算数据中心与其余日负荷曲线数据的平均距离;102、遍历电力用户i的所有日负荷曲线数据,分别计算各日负荷曲线数据作为数据中心时,数据中心与其余日负荷曲线数据的平均距离;103、将平均距离取得最小值时对应的数据中心作为电力用户i的数据代表,得到所有电力用户的数据代表集;104、根据预置模糊裕度对数据代表集进行压缩降维处理,得到降维数据集;105、对降维数据集的数据进行聚类。本申请提供的方法,通过动态时间弯曲路径算法计算电力用户的日负荷曲线数据的最短弯曲路径,从而计算最小平均距离,确定电力用户的数据代表,完成了对电力用户历史负荷数据的有效整合,减少了重复信息的冗余计算,有效节省了计算开销,在一定程度上克服了负荷的时间波动性和不确定性导致传统的聚类算法性能下降的问题;根据预置模糊裕度,对数据代表集进行压缩降维处理,使得计算维度大幅下降,提高了计算效率;因此,本申请提供的方法解决了现有的电力负荷聚类分析方法存在的使用原始日负荷数据计算维数高,造成信息冗余和计算效率低下,和因时间不确定性和波动性导致的计算结果误差大的技术问题。
附图说明
图1为本申请提供的一种电力负荷聚类分析方法的一个实施例的流程示意图;
图2为本申请提供的一种电力负荷聚类分析方法的另一个实施例的流程示意图;
图3为本申请提供的一种电力负荷聚类分析装置的一个实施例的结构示意图;
图4为动态时间弯曲最短弯曲路径示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
为了便于理解,请参阅图1,本申请提供的一种电力负荷聚类分析方法的一个实施例,包括:
步骤101、从预处理后的电力用户i的日负荷曲线数据中选取一条日负荷曲线作为数据中心,根据动态时间弯曲算法计算数据中心与其余日负荷曲线数据的最短弯曲路径,并根据最短弯曲路径计算数据中心与其余日负荷曲线数据的平均距离。
需要说明的是,本申请实施例中,对所有电力用户的所有日负荷曲线数据进行预处理后,从预处理后的电力用户i的日负荷曲线数据(用Di表示),选取一天的数据(用Dim表示第m天的第i个电力用户的日负荷曲线数据)作为数据中心,应用动态时间弯曲算法计算其余日负荷曲线数据和数据中心的最短弯曲路径,并计算平均距离。动态时间弯曲可以实现“一对一”数据匹配,也可以实现数据异步匹配,即数据点“一对多”匹配。具体实施如下:
对比Dip和Diq两天数据,得出最短弯曲路径,计算两者之间的距离。
Figure BDA0002004045810000051
Figure BDA0002004045810000052
其中,
Figure BDA0002004045810000053
为预处理后Dip里j点的数据,
Figure BDA0002004045810000054
为预处理后Diq里j点的数据。
定义测距函数:
Figure BDA0002004045810000055
其中,dj,k表示j点和k点的距离。
根据Dip和Diq内不同数据点与点之间的欧氏距离,构成了96×96的动态时间扭曲距离矩阵d
Figure BDA0002004045810000056
从d1,1开始一直走到矩阵的最右下角的元素d96,96,在行进的过程中保持下标的单增性,则称这一过程为路径,记为W={w1,w2,…,wk},其中的第i个元素w=dij,w1=d1,1,wk=d96,96
其中有一条最短的路径称为Dip和Diq的DTW距离,即最短弯曲路径Wbest,如图4所示,图中w1=d1,1,wk=d96,96
Figure BDA0002004045810000057
Figure BDA0002004045810000058
因此,Dip和Diq的DTW距离为
Wbest=DTW(Dip,Diq)=γpq(96,96);
Dim作为数据中心时,与其他数据的平均距离为:
Figure BDA0002004045810000061
步骤102、遍历电力用户i的所有日负荷曲线数据,分别计算各日负荷曲线数据作为数据中心时,数据中心与其余日负荷曲线数据的平均距离。
需要说明的是,本申请实施例中,根据步骤101中的方法,遍历电力用户i的所有日负荷曲线数据,在所有日负荷曲线数据依次作为数据中心时,计算与除数据中心外的其余日负荷曲线数据计算得到的平均距离。因此,可以得到每个电力用户相对应的所有数据中心与其余日负荷曲线数据的所有平均距离。
步骤103、将平均距离取得最小值时对应的数据中心作为电力用户i的数据代表,得到所有电力用户的数据代表集。
需要说明的是,在得到每个电力用户的所有平均距离之后,选择最短路径Si最小平均距离对应的数据中心sik作为该用户的数据代表D′i
即:
Si=min{si1,si2,…,sim}=sik
D′i=Dik
依次检索所有用户的历史数据,计算所有电力用户各自的数据代表,得到数据代表集Q;
Q=[D′1,D′2,…,D′N]T
步骤104、根据预置模糊裕度对数据代表集进行压缩降维处理,得到降维数据集。
需要说明的是,在得到数据代表集Q之后,对数据代表集Q进行压缩降维处理。设置模糊裕度δ,将0到100划分为
Figure BDA0002004045810000062
个区间,δ通常取值为能使得100整除的整数。若某数字处于第i个区间内,则令其等于
Figure BDA0002004045810000063
即区间的中值作为该数据点。对D′i=[d′i1,d′i2,…,d′i96]内的每个数据点进行上述区间的判断,得到新的以区间中值作为数据点的数据代表D′i。然后对新的数据代表进行数据压缩处理,若D′i内前后两个数据相同(处于同一区间),则删除后一数据,仅保留前一个数据,依次检索完整个D′i,得到新的数据集D″′i
D″′i=[d″′i1,d″′i2,…,d″′ia];
其中,ia为新数据的长度,a≤96,能够达到降维目的,并且因动态时间弯曲算法的特性而不会造成信息的丢失。
依次对数据集Q内所有用户的负荷数据进行处理,得到数据集Q'。
步骤105、对降维数据集的数据进行聚类。
需要说明的是,在步骤104结束得到降维数据集之后,对降维数据集内的各数据代表进行聚类处理,将各数据代表进行归类。
本申请实施例中提供的一种电力负荷聚类分析方法,通过动态时间弯曲路径算法计算电力用户的日负荷曲线数据的最短弯曲路径,从而计算最小平均距离,确定电力用户的数据代表,完成了对电力用户历史负荷数据的有效整合,减少了重复信息的冗余计算,有效节省了计算开销,在一定程度上克服了负荷的时间波动性和不确定性导致传统的聚类算法性能下降的问题;根据预置模糊裕度,对数据代表集进行压缩降维处理,使得计算维度大幅下降,提高了计算效率;因此,本申请提供的方法解决了现有的电力负荷聚类分析方法存在的使用原始日负荷数据计算维数高,造成信息冗余和计算效率低下,和因时间不确定性和波动性导致的计算结果误差大的技术问题。
为了便于理解,请参阅图2,本申请提供的一种电力负荷聚类分析方法的另一个实施例,包括:
步骤201、获取所有电力用户的日负荷曲线数据,对各日负荷曲线的原始数据进行清洗和筛选,将数据缺失或异常的日负荷曲线剔除。
需要说明的是,本申请实施例中,首先通过配电网数据采集与监视控制系统采集到各用户的若干条历史日负荷曲线,然后对获取到的数据进行预处理。对每条日负荷曲线的原始数据进行检查,查找缺失和异常数据(主要包括负荷暴增、骤降或数据为负等数据),将缺失或异常的数据清除掉。若单个用户有效的历史数据天数少于m天,一般m可取15~20天,则应从原系统获取更多的负荷历史数据,若无更多历史数据可用,则将该用户剔除。
则历史用电数据可表示为:
D=[D1,D2,…,Dn]T
Di=[Di1,Di2,…,Dim]T
式中,Di为单个用户的所有可用历史日负荷曲线数据,n为用户数;Dim为第i个用户第m天的历史用电数据。
步骤202、对各电力用户的所有日负荷曲线进行归一化、离散化和整数化处理。
需要说明的是,对数据进行预处理还包括对获取到的正常的日负荷曲线数据进行归一化处理,得到单个电力用户的样本数据集DiG
Figure BDA0002004045810000081
式中,Pim为第i个用户第m天采集到的有功功率,DiGm为第i个用户第m天归一化后的历史用电数据。
归一化后的历史用电数据可表示为:
DiG=[DiG1,DiG2,…,DiGm]T
再对归一化后的数据进行离散化和整数化的预处理。动态时间弯曲是通过计算最短弯曲路径来判断两个时间序列的相似性,为了便于计算和度量结果,可对用电负荷曲线进行离散化和整数化,时间取15分钟间隔为单位1,幅值取0.01为单位1对样本数据集DiG里每天的数据DiGm进行离散化和整数化。因配电网数据采集与监视控制系统提供的数据已是15分钟间隔的离散数据,主要操作为对数据集DiGm里每一个数据点乘以100并向下取整进行整数化;
即:
Figure BDA0002004045810000082
步骤203、从预处理后的电力用户i的日负荷曲线数据中选取一条日负荷曲线作为数据中心,根据动态时间弯曲算法计算数据中心与其余日负荷曲线数据的最短弯曲路径,并根据最短弯曲路径计算数据中心与其余日负荷曲线数据的平均距离。
需要说明的是,本申请实施例中,步骤203与上一实施例中的步骤101一致,在此不再进行详细赘述。
步骤204、遍历电力用户i的所有日负荷曲线数据,分别计算各日负荷曲线数据作为数据中心时,数据中心与其余日负荷曲线数据的平均距离。
需要说明的是,本申请实施例中,步骤204与上一实施例中的步骤102一致,在此不再进行详细赘述。
步骤205、将平均距离取得最小值时对应的数据中心作为电力用户i的数据代表,得到所有电力用户的数据代表集。
需要说明的是,本申请实施例中,步骤205与上一实施例中的步骤103一致,在此不再进行详细赘述。
步骤206、根据预置模糊裕度对数据代表集进行压缩降维处理,得到降维数据集。
需要说明的是,本申请实施例中,步骤206与上一实施例中的步骤104一致,在此不再进行详细赘述。
步骤207、对降维数据集的数据进行K-中心点聚类。
需要说明的是,在得到降维数据集之后,对降维数据集内的各数据代表进行K-中心点聚类处理,将各数据代表进行归类。本申请实施例中,应用基于动态时间弯曲的改进K-中心点聚类算法对数据集Q进行聚类,改进K-中心点聚类算法的过程如下:
(1)设置簇的个数k。
(2)随机确定k个聚类中心C1,C2,...Ck,Ci为长度L的向量,
其中,min{l(D″′i)}≤L≤max{l(D″′i)}i=1,2...N,l()为读取某一天数据长度的函数。
(3)对于数据集Q内的每个用户的数据,分别比较其与k个聚类中心之间的动态时间弯曲下的最短距离。
(4)将每个用户划分到距离最小的簇中,在全部样本都被划分完毕之后,重新确定簇中心,新的簇中心按照类似步骤203的方法重新确立。
(5)重复步骤(3),直到各中心下的距离不再改变(聚类中心不再变换),返回最后的聚类结果,即可得到含大量用户历史用电日负荷数据下的聚类分析结果。
传统的K-means算法等对聚类初始点的选取比较敏感,聚类过程易受某些孤立数据的影响,容易陷入局部最优解,降低聚类效果。本申请实施例提供的基于动态时间弯曲改进的K-中心点聚类算法,对于处理完各用户的数据代表应用改进的K-中心点聚类算法进行聚类,通过距离之和最短的计算方式可以减少某些孤立数据对聚类过程的影响,从而使得最终效果更接近真实划分,在实际运行中具有良好的运行效率、聚类效果。
为了便于理解,请参阅图3,本申请提供的一种电力负荷聚类分析装置的一个实施例,包括:
距离单元301,用于从预处理后的电力用户i的日负荷曲线数据中选取一条日负荷曲线作为数据中心,根据动态时间弯曲算法计算数据中心与其余日负荷曲线数据的最短弯曲路径,并根据最短弯曲路径计算数据中心与其余日负荷曲线数据的平均距离。
遍历单元302,用于遍历电力用户i的所有日负荷曲线数据,分别计算各日负荷曲线数据作为数据中心时,数据中心与其余日负荷曲线数据的平均距离。
比对单元303,用于将平均距离取得最小值时对应的数据中心作为电力用户i的数据代表,得到所有电力用户的数据代表集。
降维单元304,用于根据预置模糊裕度对数据代表集进行压缩降维处理,得到降维数据集。
聚类单元305,用于对降维数据集的数据进行聚类。
进一步地,还包括:
预处理单元300,用于获取所有电力用户的日负荷曲线数据,对日负荷曲线数据进行预处理,预处理包括:对各日负荷曲线的原始数据进行清洗和筛选,将数据缺失或异常的日负荷曲线剔除。
进一步地,预处理单元300还用于:对各电力用户的所有日负荷曲线进行归一化、离散化和整数化处理。
进一步地,聚类的聚类算法为K-中心点聚类算法。
本申请实施例还提供了一种电力负荷聚类分析设备的一个实施例,一种电力负荷聚类分析设备包括处理器以及存储器;
存储器用于存储程序代码,并将程序代码传输给处理器;
处理器用于根据程序代码中的指令执行前述的电力负荷聚类分析方法实施例中的电路负荷聚类分析方法。
本申请实施例还提供了一种计算机可读存储介质的一个实施例,一种计算机可读存储介质,用于存储程序代码,程序代码用于执行前述电力负荷聚类分析方法实施例中的电力负荷聚类分析方法。
本申请实施例还提供了一种包括指令的计算机程序产品的一个实施例,一种包括指令的计算机程序产品,当其在计算机上运行时,使得计算机执行前述电力负荷聚类分析方法实施例中的电力负荷聚类分析方法。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文全称:Read-OnlyMemory,英文缩写:ROM)、随机存取存储器(英文全称:Random Access Memory,英文缩写:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (10)

1.一种电力负荷聚类分析方法,其特征在于,包括以下步骤:
101、从预处理后的电力用户i的日负荷曲线数据中选取一条日负荷曲线作为数据中心,根据动态时间弯曲算法计算所述数据中心与其余日负荷曲线数据的最短弯曲路径,并根据所述最短弯曲路径计算所述数据中心与所述其余日负荷曲线数据的平均距离;
102、遍历所述电力用户i的所有所述日负荷曲线数据,分别计算各所述日负荷曲线数据作为所述数据中心时,所述数据中心与所述其余日负荷曲线数据的平均距离;
103、将所述平均距离取得最小值时对应的所述数据中心作为所述电力用户i的数据代表,得到所有电力用户的数据代表集;
104、根据预置模糊裕度对所述数据代表集进行压缩降维处理,得到降维数据集;
105、对所述降维数据集的数据进行聚类。
2.根据权利要求1所述的电力负荷聚类分析方法,其特征在于,步骤101之前,还包括:
100、获取所有电力用户的日负荷曲线数据,对所述日负荷曲线数据进行预处理,所述预处理包括:对各所述日负荷曲线的原始数据进行清洗和筛选,将数据缺失或异常的所述日负荷曲线剔除。
3.根据权利要求2所述的电力负荷聚类分析方法,其特征在于,所述预处理还包括:
对各所述电力用户的所有所述日负荷曲线进行归一化、离散化和整数化处理。
4.根据权利要求1所述的电力负荷聚类分析方法,其特征在于,所述聚类的聚类算法为K-中心点聚类算法。
5.一种电力负荷聚类分析装置,其特征在于,包括:
距离单元,用于从预处理后的电力用户i的日负荷曲线数据中选取一条日负荷曲线作为数据中心,根据动态时间弯曲算法计算所述数据中心与其余日负荷曲线数据的最短弯曲路径,并根据所述最短弯曲路径计算所述数据中心与所述其余日负荷曲线数据的平均距离;
遍历单元,用于遍历所述电力用户i的所有所述日负荷曲线数据,分别计算各所述日负荷曲线数据作为所述数据中心时,所述数据中心与所述其余日负荷曲线数据的平均距离;
比对单元,用于将所述平均距离取得最小值时对应的所述数据中心作为所述电力用户i的数据代表,得到所有电力用户的数据代表集;
降维单元,用于根据预置模糊裕度对所述数据代表集进行压缩降维处理,得到降维数据集;
聚类单元,用于对所述降维数据集的数据进行聚类。
6.根据权利要求5所述的电力负荷聚类分析装置,其特征在于,还包括:
预处理单元,用于获取所有电力用户的日负荷曲线数据,对所述日负荷曲线数据进行预处理,所述预处理包括:对各所述日负荷曲线的原始数据进行清洗和筛选,将数据缺失或异常的所述日负荷曲线剔除。
7.根据权利要求6所述的电力负荷聚类分析装置,其特征在于,所述预处理单元还用于:对各所述电力用户的所有所述日负荷曲线进行归一化、离散化和整数化处理。
8.一种电力负荷聚类分析设备,其特征在于,所述设备包括处理器以及存储器;
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行权利要求1-4任一项所述的电力负荷聚类分析方法。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行权利要求1-4任一项所述的电力负荷聚类分析方法。
10.一种包括指令的计算机程序产品,其特征在于,当其在计算机上运行时,使得所述计算机执行权利要求1-4任一项所述的电力负荷聚类分析方法。
CN201910222416.0A 2019-03-22 2019-03-22 一种电力负荷聚类分析方法、装置和设备 Active CN109934301B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910222416.0A CN109934301B (zh) 2019-03-22 2019-03-22 一种电力负荷聚类分析方法、装置和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910222416.0A CN109934301B (zh) 2019-03-22 2019-03-22 一种电力负荷聚类分析方法、装置和设备

Publications (2)

Publication Number Publication Date
CN109934301A CN109934301A (zh) 2019-06-25
CN109934301B true CN109934301B (zh) 2022-10-04

Family

ID=66987950

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910222416.0A Active CN109934301B (zh) 2019-03-22 2019-03-22 一种电力负荷聚类分析方法、装置和设备

Country Status (1)

Country Link
CN (1) CN109934301B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111026741A (zh) * 2019-12-04 2020-04-17 国网天津市电力公司电力科学研究院 基于时间序列相似性的数据清洗方法及装置
CN111160617B (zh) * 2019-12-06 2022-11-18 北京国电通网络技术有限公司 一种电力日负荷预测方法及装置
CN111191687B (zh) * 2019-12-14 2023-02-10 贵州电网有限责任公司 基于改进K-means算法的电力通信数据聚类方法
CN111815054A (zh) * 2020-03-31 2020-10-23 浙江大学 基于大数据的工业蒸汽热网短期负荷预测方法
CN111583064B (zh) * 2020-05-11 2022-09-09 国网四川省电力公司电力科学研究院 基于动态时间规整的负荷生产时段检测方法和存储介质
CN117454120B (zh) * 2023-12-20 2024-03-15 山西思极科技有限公司 电力通信系统数据的采集分析方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008015921A (ja) * 2006-07-07 2008-01-24 Mitsubishi Electric Corp 電力負荷代表パターン作成装置および電力負荷代表パターン作成プログラム
JP2009294855A (ja) * 2008-06-04 2009-12-17 Hitachi Ltd 類似データ検索システム
CN104361136A (zh) * 2014-12-10 2015-02-18 广东电网有限责任公司电网规划研究中心 基于图论聚类的中压配电网特殊负荷电能质量特性分类方法
CN105844371A (zh) * 2016-05-19 2016-08-10 北京中电普华信息技术有限公司 一种用电客户短期负荷需求预测方法及装置
CN108460410A (zh) * 2018-02-08 2018-08-28 合肥工业大学 居民需求侧的用电模式识别方法和系统、存储介质
CN108462165A (zh) * 2018-01-19 2018-08-28 长沙理工大学 一种新能源接入电力系统的负荷特性评估方法
CN108492043A (zh) * 2018-03-29 2018-09-04 南京财经大学 一种基于聚类算法的电力用户负荷测算方法
CN108596362A (zh) * 2018-03-22 2018-09-28 国网四川省电力公司经济技术研究院 基于自适应分段聚合近似的电力负荷曲线形态聚类方法
CN109272058A (zh) * 2018-11-27 2019-01-25 电子科技大学中山学院 一种集成电力负荷曲线聚类方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008015921A (ja) * 2006-07-07 2008-01-24 Mitsubishi Electric Corp 電力負荷代表パターン作成装置および電力負荷代表パターン作成プログラム
JP2009294855A (ja) * 2008-06-04 2009-12-17 Hitachi Ltd 類似データ検索システム
CN104361136A (zh) * 2014-12-10 2015-02-18 广东电网有限责任公司电网规划研究中心 基于图论聚类的中压配电网特殊负荷电能质量特性分类方法
CN105844371A (zh) * 2016-05-19 2016-08-10 北京中电普华信息技术有限公司 一种用电客户短期负荷需求预测方法及装置
CN108462165A (zh) * 2018-01-19 2018-08-28 长沙理工大学 一种新能源接入电力系统的负荷特性评估方法
CN108460410A (zh) * 2018-02-08 2018-08-28 合肥工业大学 居民需求侧的用电模式识别方法和系统、存储介质
CN108596362A (zh) * 2018-03-22 2018-09-28 国网四川省电力公司经济技术研究院 基于自适应分段聚合近似的电力负荷曲线形态聚类方法
CN108492043A (zh) * 2018-03-29 2018-09-04 南京财经大学 一种基于聚类算法的电力用户负荷测算方法
CN109272058A (zh) * 2018-11-27 2019-01-25 电子科技大学中山学院 一种集成电力负荷曲线聚类方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Power Load Curve Clustering Algorithm Using Fast Dynamic Time Warping and Affinity Propagation;Yu Jin,et al.;《2018 5th International Conference on Systems and Informatics (ICSAI)》;20190103;第1132-1137页 *
Shape-Based Approach to Household Electric Load Curve Clustering and Prediction;Thanchanok Teeraratkul,et al;《 IEEE Transactions on Smart Grid》;20170317;第5196-5206页 *
大数据技术在电力大用户用电特征分类中的应用;沈建良 等;《浙江电力》;20171231;第36卷(第12期);第37-41页 *
智能电网环境下基于大数据挖掘的居民负荷设备识别与负荷建模;杨甲甲 等;《电力建设》;20161231;第37卷(第12期);第11-23页 *

Also Published As

Publication number Publication date
CN109934301A (zh) 2019-06-25

Similar Documents

Publication Publication Date Title
CN109934301B (zh) 一种电力负荷聚类分析方法、装置和设备
CN110826648B (zh) 一种利用时序聚类算法实现故障检测的方法
CN105488539B (zh) 分类模型的生成方法及装置、系统容量的预估方法及装置
CN111612038B (zh) 异常用户检测方法及装置、存储介质、电子设备
WO2020108159A1 (zh) 一种网络故障根因检测方法、系统及存储介质
CN111612041A (zh) 异常用户识别方法及装置、存储介质、电子设备
CN115115265A (zh) 一种基于rfm模型的消费者评估方法、装置及介质
CN112883990A (zh) 数据分类方法及装置、计算机存储介质、电子设备
CN113111924A (zh) 电力客户分类方法及装置
CN113704389A (zh) 一种数据评估方法、装置、计算机设备及存储介质
CN116340388A (zh) 一种基于异常检测的时序数据的压缩存储方法及装置
CN114691868A (zh) 文本聚类方法、装置及电子设备
CN107274025B (zh) 一种实现用电模式智能识别与管理的系统和方法
CN117592595A (zh) 一种配电网负荷预测模型建立、预测方法及装置
CN117236022A (zh) 互感器剩余寿命预测模型训练方法、应用方法及电子设备
CN113839799A (zh) 一种告警关联规则挖掘方法及装置
CN111026741A (zh) 基于时间序列相似性的数据清洗方法及装置
CN115935212A (zh) 一种基于纵向趋势预测的可调节负荷聚类方法及系统
WO2022257457A1 (zh) 产品数据的融合方法、装置、设备及存储介质
CN115034762A (zh) 一种岗位推荐方法、装置、存储介质、电子设备及产品
CN114528378A (zh) 文本分类方法、装置、电子设备及存储介质
CN115542062B (zh) 户变关系异常的识别方法、装置、设备和存储介质
US20020138466A1 (en) Method, computer program and data processing system for data clustering
CN116821718A (zh) 基于Mean-shift聚类和孪生网络的非侵入工业负荷辨识方法及系统
CN114298241A (zh) 用户数据的分类方法、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant