CN111199016B - 一种基于DTW的改进K-means的日负荷曲线聚类方法 - Google Patents
一种基于DTW的改进K-means的日负荷曲线聚类方法 Download PDFInfo
- Publication number
- CN111199016B CN111199016B CN201911021152.9A CN201911021152A CN111199016B CN 111199016 B CN111199016 B CN 111199016B CN 201911021152 A CN201911021152 A CN 201911021152A CN 111199016 B CN111199016 B CN 111199016B
- Authority
- CN
- China
- Prior art keywords
- curve
- clustering
- daily load
- center
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 239000006185 dispersion Substances 0.000 claims abstract description 22
- 238000004364 calculation method Methods 0.000 claims abstract description 3
- 239000011159 matrix material Substances 0.000 claims description 44
- 230000002159 abnormal effect Effects 0.000 claims description 23
- 238000012545 processing Methods 0.000 claims description 11
- 238000005070 sampling Methods 0.000 claims description 10
- 230000001186 cumulative effect Effects 0.000 claims description 6
- 238000005259 measurement Methods 0.000 claims description 5
- 238000005452 bending Methods 0.000 claims description 3
- 238000012937 correction Methods 0.000 claims description 3
- 238000006243 chemical reaction Methods 0.000 claims description 2
- 125000004122 cyclic group Chemical group 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 4
- 238000003064 k means clustering Methods 0.000 abstract 1
- 230000005611 electricity Effects 0.000 description 4
- 238000007418 data mining Methods 0.000 description 2
- 125000003275 alpha amino acid group Chemical group 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000009191 jumping Effects 0.000 description 1
- 230000004660 morphological change Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000011524 similarity measure Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Mathematical Physics (AREA)
- Human Resources & Organizations (AREA)
- Computational Mathematics (AREA)
- Pure & Applied Mathematics (AREA)
- Economics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- General Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Probability & Statistics with Applications (AREA)
- Entrepreneurship & Innovation (AREA)
- Software Systems (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Databases & Information Systems (AREA)
- Algebra (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Quality & Reliability (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Public Health (AREA)
- Computing Systems (AREA)
Abstract
本发明公开了一种基于DTW的改进K‑means的日负荷曲线聚类方法,采用密度函数分别选取初始分布特性聚类中心曲线与动态特性聚类中心曲线,并初始化聚类数目及算法迭代次数。随后,分别采用欧氏距离与DTW综合衡量负荷曲线的分布特性及动态特性,并分别以所得动态特性数值与分布特性数值对各自特性聚类中心进行更新,此过程以每条日负荷曲线分布特性与动态特性相似度衡量值的加权值作为负荷曲线关于聚类中心曲线相似度衡量的手段。最后以聚类结果与聚类离散度的误差值作为算法是否得出聚类结果的判断依据,并基于DBI指标确定最佳聚类数及相应的聚类中心曲线。本方法可以有效改善K‑means聚类计算效果与效率,且聚类结果与实际工程相符,具有一定的工程价值。
Description
技术领域
本发明属于电力系统分析与控制技术领域,特别涉及一种基于DTW的改进K-means的日负荷曲线聚类方法。
背景技术
日负荷曲线聚类是配用电大数据挖掘的基础,对负荷预测、电网规划和需求侧响应均有一定的指导意义。随着智能电网的不断推进,电力系统信息化程度不断提高,用电信息采集系统、配网GIS系统、配网自动化系统等逐渐完善,配用电数据呈现出数据量大、类型多、增长快等大数据特征。如何采取有效的数据挖掘技术,在大数据背景下对不同类型的海量用户进行精细化划分,从而挖掘出不同类型负荷间的内在联系及对应的用电行为、用电特性等信息,无疑对电网公司及电力用户具有重要的意义。
传统的日负荷曲线聚类方法通常以日负荷曲线各采样时刻点的功率值经极大值归一化后,采用K-means、模糊C均值等算法以欧式距离作为相似性判据对日负荷曲线进行聚类。该类方法存在如下两个弊端:1)作为时间序列的负荷曲线来说,曲线之间的相似性易受气温气候、收入、电价政策等许多因素的影响,不能简单通过单纯的欧式距离得到充分反映;2)随着负荷数据规模的不断增长,该类方法在计算效率上面临着巨大的挑战。
并且现在传统聚类方法面临一个重要问题:相似度衡量准确度。传统方法,通常只是单纯选取欧氏距离衡量曲线间相似度,而忽视了曲线形态变化对曲线相似度的影响。因此如何选择合适的相似度衡量指标可以在很大程度上提升日负荷曲线聚类结果的准确性及效率。
发明内容
本发明所解决的技术问题是,针对现有日负荷曲线聚类方法中存在的问题,提出一种基于DTW的改进K-means的日负荷曲线聚类方法,结合DTW与欧氏距离综合考虑日负荷曲线的分布特性与动态特性,并以这两种特征参数分别进行各自特征聚类中心的计算,最后采用加权使每条曲线与自身的分布特性聚类中心和动态特性聚类中心的相似度衡量,以此为依据采用K-means算法进行电力系统中日负荷曲线的聚类。
本发明采取的技术方案为:
一种基于DTW的改进K-means的日负荷曲线聚类方法,包括以下步骤:
步骤1)对日负荷功率曲线数据组中的异常数据进行识别与修正,获得原始数据矩阵,然后对修正后的日负荷功率曲线数据进行标幺化处理,得到标幺化数据矩阵及相应动态数据矩阵,并确定初始聚类数目、迭代次数和最大聚类数目;
步骤2)基于标幺化数据矩阵,以日负荷曲线数据组中数据对象的密度参数集合为依据,将密度参数集合中的密度最大值作为初始分布特性聚类中心曲线,进而得出当前聚类数目下的动态特性聚类中心曲线;
步骤3)以当前聚类数目开始进行循环计算:采用欧氏距离与DTW,分别计算每条日负荷曲线关于分布特性聚类中心曲线及动态特性聚类中心曲线的相似度,再以相似度数值为根据,进行数据组的归类,然后对分布特性与动态特性聚类中心曲线进行更新,并将分布特性与动态特性相似度值的加权值作为K-means算法中曲线相似度的衡量依据;
步骤4)结合步骤3)所得更新后的聚类中心曲线,计算日负荷曲线的综合聚类离散度,若聚类中心曲线或聚类离散度的误差值已满足要求,则停止聚类中心曲线的更新,否则返回步骤3)继续对聚类中心曲线进行更新,直至满足要求为止;然后得到当前循环对应聚类数目下的聚类中心曲线及对应DBI的值,即完成本次循环,再对聚类数目加一后检查是否达到最大聚类数目,没有达到则返回步骤2),计算下一个指定聚类数目的聚类中心曲线及对应DBI值,达到则执行步骤5),其中DBI是类内距离之和与类外距离的比值;
5)结合迭代完成后所得不同聚类数目下的聚类结果,基于DBI确定最佳聚类数目与最终聚类结果,其中DBI越小则聚类结果越好,并以选取DBI数值最小时所对应的聚类数目为最佳聚类数目。
所述的一种基于DTW的改进K-means的日负荷曲线聚类方法,所述步骤1)中,对日负荷功率曲线中的异常数据进行识别,是计算日负荷功率曲线中各采样时刻点的负荷功率的变化率并与预设阈值比较,若超出阈值范围则视为异常数据;对异常数据进行进行修正,是首先判断负荷曲线的数据缺失量和异常量是否小于10%,若是,则先将异常量置为0即置为缺失量,再以一元三点抛物线插值算法对缺失量进行插值拟合,否则直接删除该条负荷曲线。
所述的一种基于DTW的改进K-means的日负荷曲线聚类方法,述步骤1)中,对修正后的日负荷功率曲线数据进行标幺化处理,得到动态数据矩阵的方法为:
记Pk=[pk1,...,pki,...,pkm]∈R1×m为修正后第k条日负荷功率曲线的m点原始有功功率矩阵,k=1,2,3,…,N,N为日负荷功率曲线总条数,pki为第k条日负荷功率曲线的第i点原始有功功率,i=1,2,…,m,m为采样点个数;则P=[P1,...,Pk,...,PN]T∈RN×m为N条日负荷功率曲线的m点原始有功功率矩阵,其中T为矩阵转置符号;
取日负荷功率曲线的功率最大值pk.max=max{pk1,pk2,...,pki,...,pkm}为基准值,根据下式对原始数据样本进行标幺化处理,得到功率点pki的标幺值p'ki:
p'ki=pki/pk.max
进而得到归一化的日负荷功率曲线有功功率标幺值矩阵P'k:
P'k=[p'k1,p'k2,...,p'ki,...,p'km]∈R1×m,则标幺化后的日负荷功率曲线矩阵A=[P1',...,Pk',...,PN']T∈RN×m;
然后由上式获取日负荷曲线有功功率动态数据矩阵:
F'k=[fk1,fk2,...,fki,...,fk(m-1)]∈R1×(m-1);
其中,fki为第k条日负荷功率曲线的第i点的日负荷曲线斜率数据,Δt为相邻有功功率采样点的时间间隔。
所述的一种基于DTW的改进K-means的日负荷曲线聚类方法,所述的初始聚类数目Lmin为2、迭代次数为1000,并预设最大聚类数目N为日负荷功率曲线数据组中的总曲线数目。
所述的一种基于DTW的改进K-means的日负荷曲线聚类方法,所述的步骤2)包括以下过程:
基于标幺化数据矩阵A,得到初始分布特性聚类中心:
首先计算任意两负荷曲线Px=(px1,px2,...,pxn),Py=(py1,py2,...,pyn)之间的欧氏距离d:
再计算得到日负荷曲线之间的平均距离dist:
其中为n条日负荷曲线之间的组合数;
然后计算以每条日负荷曲线为中心基于平均距离的密度参数den,
其中当dist-d(Pi,P)<0时,u(dist-d(Pi,P))=0;当dist-d(Pi,P)≥0时,u(dist-d(Pi,P))=1;
进而得到日负荷曲线的密度参数集合D,根据当前聚类数目L选取前L个密度最大者,且每次选取一个密度最大者之后,将该曲线和与该曲线欧式距离小于dist的负荷曲线从标幺化数据矩阵A中删除,从而得出日负荷曲线的初始分布特性聚类中心曲线集合CL=(c1,c2,...,cL);
通过下式得到动态特性聚类中心曲线集合CL'=(c1',c2',...,cL'):
ci,j'=ci,j+1-ci,j
式中,ci,j为负荷曲线的第i类分布特性聚类中心ci的第j维数据,ci,j'为负荷曲线的第i类动态特性聚类中心ci'的第j维数据。
所述的一种基于DTW的改进K-means的日负荷曲线聚类方法,所述的步骤3)中,采用欧氏距离与DTW,来计算每条日负荷曲线与分布特性聚类中心曲线以及动态特性聚类中心曲线的相似度的过程为:
先计算每条日负荷曲线与分布特性聚类中心曲线相似度D0和动态特性聚类中心曲线的相似度D1:
D0(i,j)=d(Pi,Cj)
D1(i,j)=dtw(Fi',Cj')
其中D0(i,j)表示第i条日负荷曲线Pi关于第j个分布特性聚类中心Cj的相似度,D1(i,j)表示第i条日负荷动态曲线Fi'关于第j个动态特性聚类中心Cj'的相似度;
然后通过加权得到日负荷曲线的综合相似度Dall,其中Dall越小表示相似度越高,最后将日负荷曲线归类于其与所有聚类中心曲线中Dall最小的类别:
Dall(i,j)=a*D0(i,j)+b*D1(i,j)
式中Dall(i,j)表示第i条日负荷曲线Pi与第j类聚类中心曲线的综合相似度;a与b分别是日负荷曲线分布特性相似度与动态特性相似度的权重;
将每条曲线根据归于不同类别之后,对数据组分布特性与动态特性聚类中心曲线进行更新:
按照下式对分布特性聚类中心曲线进行更新;
式中Cj(I+1)表示第I+1次迭代所得的分布特性聚类中心曲线;Nj表示属于第j类聚类中心的日负荷曲线条数;Pn表示属于第j类聚类中心的日负荷曲线;
按照下式对动态特性聚类中心曲线进行更新;
ci,j'=ci+1,j-ci,j
式中,ci,j'表示第j类动态特性聚类中心曲线的第i点;ci+1,j表示第j类分布特性聚类中心曲线的第i+1点;ci,j表示第j类分布特性聚类中心曲线的第i点;欧氏距离衡量相似度的方法如所示;
其中基于DTW衡量相似度的方法为:
设有两负荷曲线Px=(px1,px2,...,pxn),Py=(py1,py2,...,pym),则有:
a)构建n*m的距离矩阵Dn*m,其中元素D(x,y)如下式所示;
b)将矩阵D中每一组相邻元素组成的集合称为弯曲路径,记为K=(K1,K2,K3,..Ks..,Kg),其中g为路径中元素的总个数,元素Ks为路径上第s个点的坐标,即Ks=(x,y);
c)上述的路径K有多条,然后通过DTW找到1条最优弯曲路径,使得序列Px和Py的弯曲总代价最小,即:
式中,D(Ks)为弯曲路径的累积距离,通过动态规划方法来构造一个累积代价矩阵G来求解上式,即Gxy=D(x,y)+min(G(x-1,y-1),G(x,y-1),G(x-1,y)),其中,x=1,2,...,n;y=1,2,...m;G(0,0)=0;G(x,0)=G(o,y)=+∞,可知,时间序列Px和Py的动态时间弯曲距离为DTW(Px,Py)=G(n,m)。
所述的一种基于DTW的改进K-means的日负荷曲线聚类方法,所述的步骤4)中,综合聚类离散度通过以下公式计算:
式中,JN为第N次迭代所得聚类结果的综合聚类离散度;Ci(N)为第N次迭代所得的第i个聚类中心;Pn为属于聚类中心曲线Ci(N)这一类的日负荷曲线;L为聚类数目;
若JN+1-JN<Ω,则聚类停止,其中Ω为预设的收敛极限值。
所述的一种基于DTW的改进K-means的日负荷曲线聚类方法,所述的步骤5)中以基于DBI指标确定最佳聚类数与最终聚类结果的的方法如下:
式中,Ri用来衡量第i类与第j类的相似度;L为聚类数目;
其中,Si用来度量第i个类中数据点的分散程度,通过下式计算:
其中,Xl为第i类中第l个数据点;Ci为第i类的中心;T为第i类中数据点的个数;q取1时Si为各点到中心的距离的均值,q取2时Si为各点到中心距离的标准差,均用于衡量类内分散程度;
其中Mij为第i类中心与第j类中心的距离;Ci为第i类的中心;adi为第i类的中心点Ci的第d个属性的值;p取1时表示1-范数,p取2时表示2-范数,即两个类中心的欧式距离。
本发明的技术效果在于,综合考虑了日负荷曲线的分布特征与动态特征,在大数据背景下可以很大程度上提升日负荷曲线聚类的效率及质量。聚类结果与工程实际相符,能够为电网公司分析用户用电行为,制定合理的用电计划提供有力的支撑。具有良好的应用前景。
附图说明
图1为本方法流程示意图。
图2为DTW路径示意图。
图3为改进k-means算法流程图。
图4为基于DBI指标确定最佳聚类数及聚类结果流程图。
具体实施方式
下面结合附图对本发明作进一步说明:
本实施例的总体思路框图如图1所示,包括以下步骤:
1)对日负荷功率曲线数据进行预处理,获得标幺化数据矩阵A∈RN×m及其动态数据矩阵A'∈RN×(m-1)其中N为日负荷曲线条数,m为维数,并确定初始聚类数目为Lmin为2、迭代次数为1000,并预设N为日负荷功率曲线数据组中的总曲线数目。算法以Lmin为初始聚类数目开始进行循环算法,每次循环完成之后聚类数目加一,直至聚类数目达到Lmax;
2)结合步骤1)所得标幺化数据矩阵A,以日负荷曲线数据组的密度函数为依据选取当前聚类数目下的初始分布特性聚类中心CL=(c1,c2,...,cL)与动态特性聚类中心CL'=(c1',c2',...,cL');
3)将每条日负荷曲线分别采用欧氏距离与DTW衡量其关于分布特性聚类中心曲线与动态特性聚类中心曲线的相似度,根据此相似度参数进行数据组分布特性与动态特性聚类中心曲线的更新,并将此两相似度的加权值作为K-means算法中曲线相似度的衡量依据;
4)结合步骤3)所得更新后的聚类中心曲线,计算日负荷曲线的综合聚类离散度,若聚类中心曲线或聚类离散度的误差值已满足要求,则停止聚类中心曲线的更新,否则返回步骤3)继续对聚类中心曲线进行更新,直至满足要求为止;然后得到当前循环对应聚类数目下的聚类中心曲线及对应DBI的值,即完成本次循环,再对聚类数目加一后检查是否达到最大聚类数目,没有达到则返回步骤2),计算下一个指定聚类数目的聚类中心曲线及对应DBI值,达到则执行步骤5),其中DBI是类内距离之和与类外距离的比值;
5)结合步骤4)所得不同聚类数目下的聚类结果,基于DBI指标确定最佳聚类数与最终聚类结果。
其中步骤1)包括以下步骤:
1-1)对日负荷功率曲线中的异常数据进行识别与修正;
1-2)对修正后的日负荷功率曲线数据进行标幺化处理,并得到相应动态数据矩阵A';
对于以上步骤进行相关解释如下:
所述步骤1-1)中异常数据的识别方法具体为:
记Pk=[pk,1,pk,2…,pk,m]T为某条负荷曲线在各采样时刻点的功率值,以公式(1)对异常数据进行识别。
式中:δk,i为负荷曲线在第i点的负荷功率变化率,当其超过预设的阀值ε后视为异常数据,不失一般性ε可取0.5~0.8。
所述步骤1-1)中异常数据的修正方法具体为:
若某条负荷曲线的数据缺失量和异常量达到10%或以上时,认定该曲线无效直接删除该条负荷曲线。
若某条负荷曲线的数据缺失量和异常量低于10%时,将异常量置为0,再以一元三点抛物线插值算法对缺失量进行插值拟合。一元三点抛物线插值算法的原理为:
设n个节点xi(i=0,1,…,n-1)的函数值为yi=f(xi),有x0<x1<…<xn-1,对应函数值y0<y1<…<yn-1。为计算指定的插值点t的近似函数值z=f(t),选择最靠近t的3个节点:xk-1、xk、xk+1(xk<t<xk+1),然后根据抛物线插值公式(2)计算z的值,即
式中,当|xk-t|<|t-xk+1|时,m=k-1;当|xk-t|>|t-xk+1|时,m=k。
若插值点t不在包含n个节点的区间内,则只选取区间某一端的2个节点来进行线性插值。
所述步骤1-2)中对修正后的日负荷功率曲线数据进行标幺化处理的方法具体为:
记Pk=[pk1,...,pki,...,pkm]∈R1×m为修正后第k条日负荷功率曲线的m点原始有功功率矩阵,k=1,2,3,…,N,N为日负荷功率曲线总条数,pki为第k条日负荷功率曲线的第i点原始有功功率,i=1,2,…,m,m为采样点个数,一般为48;则P=[P1,...,Pk,...,PN]T∈RN ×m为N条日负荷功率曲线的m点原始有功功率矩阵;
取日负荷功率曲线的功率最大值pk.max=max{pk1,pk2,...,pki,...,pkm}为基准值,根据式(3)对原始数据样本进行标幺化处理,
p'ki=pki/pk·max (3)
得到归一化的日负荷功率曲线有功功率标幺值矩阵P'k=[p'k1,p'k2,...,p'ki,...,p'km]∈R1×m,并令该矩阵为A∈RN×m。
通过式(4),获取日负荷曲线有功功率动态数据矩阵F'k=[fk1,fk2,...,fki,...,fk(m-1)]∈R1×(m-1)。
式(4)中,fki为第k条日负荷功率曲线的第i点的日负荷曲线斜率数据,Δt为相邻有功功率采样点的时间间隔。
2)结合步骤1)所得标幺化数据矩阵A,以日负荷曲线数据组的密度函数为依据选取初始分布特性聚类中心CL=(c1,c2,...,cL)与动态特性聚类中心CL'=(c1',c2',...,cL');
2-1)依据数据对象的密度参数集合D,把D中密度最大值作为初始分布特性聚类中心;
2-2)根据初始分布特性聚类中心相应得出动态特性聚类中心
对以上步骤进行相关解释如下:
所述步骤2-1)中由标幺化数据矩阵A中每条日负荷曲线的密度参数集合得出聚类中心的方法具体为:
根据式(4)计算任意两负荷曲线Px=(px1,px2,...,pxn),Py=(py1,py2,...,pyn)之间的欧氏距离d,再通过式(5)得到日负荷曲线之间的平均距离dist,根据式(6)计算以每条日负荷曲线为中心基于平均距离的密度参数den,得到日负荷曲线的密度参数集合D,根据当前聚类数目L选取L个密度最大者,且每次选取一个密度最大者之后,将该曲线和与该曲线欧式距离小于dist的负荷曲线从数据库A中删除,从而得出日负荷曲线初始分布特性聚类中心曲线集合CL=(c1,c2,...,cL)。
式(5)中,为n条日负荷曲线之间的组合数。
式(6)中,当x<0时,u(x)=0;当x≥0式,u(x)=1
所述步骤2-2)中由日负荷曲线初始分布特性聚类中心得出其动态特性聚类中心曲线集合CL'=(c1',c2',...,cL')的方法具体为:
ci,j'=ci,j+1-ci,j (7)
式中,ci,j为负荷曲线的第i类分布特性聚类中心ci的第j维数据,ci,j'为负荷曲线的第i类动态特性聚类中心ci'的第j维数据。
3)将每条日负荷曲线分别采用欧氏距离与DTW衡量其关于分布特性聚类中心曲线与动态特性聚类中心曲线的相似度,以此相似度参数进行数据组分布特性与动态特性聚类中心曲线的更新,并将此两特征参数的加权值作为K-means算法中曲线相似度的衡量依据;
所述步骤3)中采用欧氏距离与DTW衡量日负荷曲线分布特性聚类中心曲线与动态特性聚类中心曲线的相似度的方法步骤为:
3-1)先根据式(8)、式(9)计算每条日负荷曲线关于分布特性聚类中心曲线相似度D0和动态特性聚类中心曲线的相似度D1,并由此加权得到日负荷曲线的加权相似度Dall,且Dall越小表示相似度越高,最后将日负荷曲线归类于其关于所有聚类中心曲线中Dall最小的那个类别;
D0(i,j)=d(Pi,Cj) (8)
式中D0(i,j)表示第i条日负荷曲线Pi与第j个分布特性聚类中心Cj的相似度。
D1(i,j)=dtw(Fi',Cj') (9)
式中D1(i,j)表示第i条日负荷动态曲线Fi'与第j个动态特性聚类中心Cj'的相似度。
Dall(i,j)=a*D0(i,j)+b*D1(i,j) (10)
式中Dall(i,j)表示第i条日负荷曲线Pi与第j类聚类中心曲线的综合相似度;a与b分别是日负荷曲线分布特性相似度与动态特性相似度的权重,经实验验证,通常分别取0.55、0.45聚类效果最佳。
3-2)按照式(11)与式(7)对聚类中心进行更新;
式中Cj(I+1)表示第I+1次迭代所得的第j类聚类中心曲线;Nj表示属于第j类聚类中心的日负荷曲线条数;Pn表示属于第j类聚类中心的日负荷曲线。
所述步骤3-2)中DTW衡量相似度的方法为:
动态时间弯曲(DTW)运用动态规划思想调整时间序列不同时间点对应元素之间的关系来获取一条最优弯曲路径,使沿该路径时间序列间的距离最小,其能很好度量时间序列之间的关系。DTW路径示意图如图2所示。设有两负荷曲线Px=(px1,px2,...,pxn),Py=(py1,py2,...,pym),DTW算法步骤如下:
a)构建n*m的距离矩阵Dn*m,其中元素D(x,y)如(12)式所示;
b)将矩阵D中每一组相邻元素组成的集合称为弯曲路径,记为K=(K1,K2,K3,..Ks..,Kg),其中g为路径中元素(图2中实心方块)的总个数,元素Ks为路径上第s个点的坐标,即Ks=(x,y);
c)上述的路径K有多条,DTW的目的在于找到1条最优弯曲路径,使得序列Px和Py的弯曲总代价最小,即:
式中,D(Ks)为弯曲路径的累积距离,为了求解上式,通过动态规划方法来构造一个累积代价矩阵G,即Gxy=D(x,y)+min(G(x-1,y-1),G(x,y-1),G(x-1,y))其中,x=1,2,...,n;y=1,2,...m;G(0,0)=0;G(x,0)=G(0,y)=+∞,可知,时间序列Px和Py的动态时间弯曲距离为DTW(Px,Py)=G(n,m)。
4)结合步骤3)所得新的聚类中心,计算日负荷曲线的综合聚类离散度,若算法聚类中心不再发生变化或综合聚类离散度已满足要求,则算法跳出循环,得到当前指定聚类数目下的聚类结果;
所述步骤4)如图3所示,其中综合聚类离散度获得的方法如式(14)所示:
式中,JN为第N次迭代所得聚类结果的综合聚类离散度;Ci(N)为第N次迭代所得的第i个聚类中心;Pn为属于聚类中心曲线Ci(N)这一类的日负荷曲线;L为聚类数目;
当JN+1-JN<Ω(Ω为收敛极限值)时,则聚类停止,认为此时聚类划分合理。
5)结合步骤4)所得不同聚类数目下的聚类结果,基于DBI指标确定最佳聚类数与最终聚类结果;
DBI指标是类内距离之和与类外距离的比值。DBI指标越小,代表聚类效果越好。同时,该指标也同时用于选择算法的聚类数目,即选取DBI指标数值最小时所对应的聚类数目L。如图4所示,所述步骤5)中以基于DBI指标确定最佳聚类数与最终聚类结果的的方法如下:
式中,Ri用来衡量第i类与第j类的相似度;L为聚类数目。
其中,Si用来度量第i个类中数据点的分散程度,如下式所示:
其中,Xl为第i类中第l个数据点;Ci为第i类的中心;T为第i类中数据点的个数;q取1时Si为各点到中心的距离的均值,q取2时Si为各点到中心距离的标准差,两者皆可用于衡量类内分散程度。
其中Mij为第i类中心与第j类中心的距离;Ci为第i类的中心;adi为第i类的中心点Ci的第d个属性的值;p取1时表示1-范数,p取2时表示2-范数(即两个类中心的欧式距离)。
本实施例首先从SQL2012数据库里随机选取1000条日负荷曲线,并在对所选负荷曲线进行筛选之后进行归一化处理,且计算出处理之后的日负荷曲线数据的形态变化序列,采用密度函数分别选取初始分布特性聚类中心与动态特性聚类中心,并初始化聚类数目。随后,分别采用欧氏距离与动态时间序列(DTW)综合衡量负荷曲线的分布特性及衡量负荷曲线的动态特性,并分别以所得分布特性数值与动态特性数值对各自特性聚类中心进行更新,并以每条日负荷曲线此两特性的加权值(Dall)作为负荷曲线与聚类中心曲线的相似度衡量手段。最后本算法以聚类中心曲线与聚类离散度的误差值,作为算法是否得出最终聚类结果的判断依据,并基于DBI指标确定最佳聚类数及聚类中心曲线(即分布特性聚类中心曲线)。
Claims (6)
1.一种基于DTW的改进K-means的日负荷曲线聚类方法,其特征在于,包括以下步骤:
步骤1)对日负荷曲线数据组中的异常数据进行识别与修正,获得原始数据矩阵,然后对修正后的日负荷曲线数据进行标幺化处理,得到标幺化数据矩阵及相应动态数据矩阵,并确定初始聚类数目、迭代次数和最大聚类数目;
步骤2)基于标幺化数据矩阵,以日负荷曲线数据组中数据对象的密度参数集合为依据,将密度参数集合中的密度最大值作为初始分布特性聚类中心曲线,进而得出当前聚类数目下的动态特性聚类中心曲线;
步骤3)以当前聚类数目开始进行循环计算:采用欧氏距离与DTW,分别计算每条日负荷曲线关于分布特性聚类中心曲线及动态特性聚类中心曲线的相似度,再以相似度数值为根据,进行数据组的归类,然后对分布特性与动态特性聚类中心曲线进行更新,并将分布特性与动态特性相似度值的加权值作为K-means算法中曲线相似度的衡量依据;
步骤4)结合步骤3)所得更新后的聚类中心曲线,计算日负荷曲线的综合聚类离散度,若聚类中心曲线或聚类离散度的误差值已满足要求,则停止聚类中心曲线的更新,否则返回步骤3)继续对聚类中心曲线进行更新,直至满足要求为止;然后得到当前循环对应聚类数目下的聚类中心曲线及对应DBI的值,即完成本次循环,再对聚类数目加一后检查是否达到最大聚类数目,没有达到则返回步骤2),计算下一个指定聚类数目的聚类中心曲线及对应DBI值,达到则执行步骤5),其中DBI是类内距离之和与类外距离的比值;
5)结合迭代完成后所得不同聚类数目下的聚类结果,基于DBI确定最佳聚类数目与最终聚类结果,其中DBI越小则聚类结果越好,并以选取DBI数值最小时所对应的聚类数目为最佳聚类数目;
所述的步骤2)包括以下过程:
基于标幺化数据矩阵A,得到初始分布特性聚类中心:
首先计算任意两日负荷曲线Px=(px1,px2,...,pxn),Py=(py1,py2,...,pyn)之间的欧氏距离d:
再计算得到日负荷曲线之间的平均距离dist:
其中为n条日负荷曲线之间的组合数;
然后计算以每条日负荷曲线为中心基于平均距离的密度参数den,
其中当dist-d(Pi,P)<0时,u(dist-d(Pi,P))=0;当dist-d(Pi,P)≥0时,u(dist-d(Pi,P))=1;
进而得到日负荷曲线的密度参数集合D,根据当前聚类数目L选取前L个密度最大者,且每次选取一个密度最大者之后,将该曲线和与该曲线欧式距离小于dist的日负荷曲线从标幺化数据矩阵A中删除,从而得出日负荷曲线的初始分布特性聚类中心曲线集合CL=(c1,c2,...,cL);
通过下式得到动态特性聚类中心曲线集合CL'=(c1',c2',...,cL'):
ci,j'=ci,j+1-ci,j
式中,ci,j为日负荷曲线的第i类分布特性聚类中心ci的第j维数据,ci,j'为日负荷曲线的第i类动态特性聚类中心ci'的第j维数据;
所述的步骤3)中,采用欧氏距离与DTW,来计算每条日负荷曲线与分布特性聚类中心曲线以及动态特性聚类中心曲线的相似度的过程为:
先计算每条日负荷曲线与分布特性聚类中心曲线相似度D0和动态特性聚类中心曲线的相似度D1:
D0(i,j)=d(Pi,Cj)
D1(i,j)=dtw(Fi',Cj')
其中D0(i,j)表示第i条日负荷曲线Pi关于第j个分布特性聚类中心Cj的相似度,D1(i,j)表示第i条日负荷动态曲线Fi'关于第j个动态特性聚类中心Cj'的相似度;
然后通过加权得到日负荷曲线的综合相似度Dall,其中Dall越小表示相似度越高,最后将日负荷曲线归类于其与所有聚类中心曲线中Dall最小的类别:
Dall(i,j)=a*D0(i,j)+b*D1(i,j)
式中Dall(i,j)表示第i条日负荷曲线Pi与第j类聚类中心曲线的综合相似度;a与b分别是日负荷曲线分布特性相似度与动态特性相似度的权重;
将每条曲线根据归于不同类别之后,对数据组分布特性与动态特性聚类中心曲线进行更新:
按照下式对分布特性聚类中心曲线进行更新;
式中Cj(I+1)表示第I+1次迭代所得的分布特性聚类中心曲线;Nj表示属于第j类聚类中心的日负荷曲线条数;Pn表示属于第j类聚类中心的日负荷曲线;
按照下式对动态特性聚类中心曲线进行更新;
ci,j'=ci+1,j-ci,j
式中,ci,j'表示第j类动态特性聚类中心曲线的第i点;ci+1,j表示第j类分布特性聚类中心曲线的第i+1点;ci,j表示第j类分布特性聚类中心曲线的第i点;欧氏距离衡量相似度的方法如所示;
其中基于DTW衡量相似度的方法为:
设有两日负荷曲线Px=(px1,px2,...,pxn),Py=(py1,py2,...,pym),则有:
a)构建n*m的距离矩阵Dn*m,其中元素D(x,y)如下式所示;
b)将矩阵D中每一组相邻元素组成的集合称为弯曲路径,记为K=(K1,K2,K3,..Ks..,Kg),其中g为路径中元素的总个数,元素Ks为路径上第s个点的坐标,即Ks=(x,y);
c)上述的路径K有多条,然后通过DTW找到1条最优弯曲路径,使得序列Px和Py的弯曲总代价最小,即:
式中,D(Ks)为弯曲路径的累积距离,通过动态规划方法来构造一个累积代价矩阵G来求解上式,即Gxy=D(x,y)+min(G(x-1,y-1),G(x,y-1),G(x-1,y)),其中,x=1,2,...,n;y=1,2,...m;G(0,0)=0;G(x,0)=G(o,y)=+∞,可知,时间序列Px和Py的动态时间弯曲距离为DTW(Px,Py)=G(n,m)。
2.根据权利要求1所述的一种基于DTW的改进K-means的日负荷曲线聚类方法,其特征在于,所述步骤1)中,对日负荷曲线中的异常数据进行识别,是计算日负荷曲线中各采样时刻点的负荷功率的变化率并与预设阈值比较,若超出阈值范围则视为异常数据;对异常数据进行进行修正,是首先判断日负荷曲线的数据缺失量和异常量是否小于10%,若是,则先将异常量置为0即置为缺失量,再以一元三点抛物线插值算法对缺失量进行插值拟合,否则直接删除该条日负荷曲线。
3.根据权利要求1所述的一种基于DTW的改进K-means的日负荷曲线聚类方法,其特征在于,所述步骤1)中,对修正后的日负荷曲线数据进行标幺化处理,得到动态数据矩阵的方法为:
记Pk=[pk1,...,pki,...,pkm]∈R1×m为修正后第k条日负荷曲线的m点原始有功功率矩阵,k=1,2,3,…,N,N为日负荷曲线总条数,pki为第k条日负荷曲线的第i点原始有功功率,i=1,2,…,m,m为采样点个数;则P=[P1,...,Pk,...,PN]T∈RN×m为N条日负荷曲线的m点原始有功功率矩阵,其中T为矩阵转置符号;
取日负荷曲线的功率最大值pk.max=max{pk1,pk2,...,pki,...,pkm}为基准值,根据下式对原始数据样本进行标幺化处理,得到功率点pki的标幺值p'ki:
p'ki=pki/pk.max
进而得到归一化的日负荷曲线有功功率标幺值矩阵P'k:
P'k=[p'k1,p'k2,...,p'ki,...,p'km]∈R1×m,则标幺化后的日负荷曲线矩阵A=[P1',...,Pk',...,PN']T∈RN×m;
然后由上式获取日负荷曲线有功功率动态数据矩阵:
F'k=[fk1,fk2,...,fki,...,fk(m-1)]∈R1×(m-1);
其中,fki为第k条日负荷曲线的第i点的日负荷曲线斜率数据,Δt为相邻有功功率采样点的时间间隔。
4.根据权利要求1所述的一种基于DTW的改进K-means的日负荷曲线聚类方法,其特征在于,所述的初始聚类数目Lmin为2、迭代次数为1000,并预设最大聚类数目N为日负荷曲线数据组中的总曲线数目。
5.根据权利要求1所述的一种基于DTW的改进K-means的日负荷曲线聚类方法,其特征在于,所述的步骤4)中,综合聚类离散度通过以下公式计算:
式中,JN为第N次迭代所得聚类结果的综合聚类离散度;Ci(N)为第N次迭代所得的第i个聚类中心;Pn为属于聚类中心曲线Ci(N)这一类的日负荷曲线;L为聚类数目;
若JN+1-JN<Ω,则聚类停止,其中Ω为预设的收敛极限值。
6.根据权利要求1所述的一种基于DTW的改进K-means的日负荷曲线聚类方法,其特征在于,所述的步骤5)中以基于DBI指标确定最佳聚类数与最终聚类结果的的方法如下:
式中,Ri用来衡量第i类与第j类的相似度;L为聚类数目;
其中,Si用来度量第i个类中数据点的分散程度,通过下式计算:
其中,Xl为第i类中第l个数据点;Ci为第i类的中心;T为第i类中数据点的个数;q取1时Si为各点到中心的距离的均值,q取2时Si为各点到中心距离的标准差,均用于衡量类内分散程度;
其中Mij为第i类中心与第j类中心的距离;Ci为第i类的中心;adi为第i类的中心点Ci的第d个属性的值;p取1时表示1-范数,p取2时表示2-范数,即两个类中心的欧式距离。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2019109344820 | 2019-09-29 | ||
CN201910934482 | 2019-09-29 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111199016A CN111199016A (zh) | 2020-05-26 |
CN111199016B true CN111199016B (zh) | 2023-11-07 |
Family
ID=70746654
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911021152.9A Active CN111199016B (zh) | 2019-09-29 | 2019-10-25 | 一种基于DTW的改进K-means的日负荷曲线聚类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111199016B (zh) |
Families Citing this family (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111612650B (zh) * | 2020-05-27 | 2022-06-17 | 福州大学 | 一种基于dtw距离的电力用户分群方法及系统 |
CN111539657B (zh) * | 2020-05-30 | 2023-11-24 | 国网湖南省电力有限公司 | 结合用户日用电量曲线的典型用电行业负荷特性分类与综合方法 |
CN112529031B (zh) * | 2020-07-28 | 2022-11-11 | 新汶矿业集团有限责任公司 | 一种基于改进K-means的微震信号聚类方法及装置 |
CN111915451B (zh) * | 2020-08-05 | 2024-03-29 | 国网安徽省电力有限公司电力科学研究院 | 台区日功率曲线计算方法 |
CN112070121A (zh) * | 2020-08-12 | 2020-12-11 | 国网黑龙江省电力有限公司哈尔滨供电公司 | 一种基于变分自编码器的智能电表数据填补方法 |
WO2022032674A1 (en) * | 2020-08-14 | 2022-02-17 | Beijing Didi Infinity Technology And Development Co., Ltd. | Systems and methods for detecting abnormal charging events |
CN112345261B (zh) * | 2020-10-29 | 2022-05-03 | 南京航空航天大学 | 基于改进dbscan算法的航空发动机泵调系统异常检测方法 |
CN112651455B (zh) * | 2020-12-30 | 2022-11-01 | 云南大学 | 一种基于非负矩阵分解与动态时间规整算法的交通流缺失值填充方法 |
CN112819299A (zh) * | 2021-01-21 | 2021-05-18 | 上海电力大学 | 一种基于中心优化的差分K-means负荷聚类方法 |
CN113011702A (zh) * | 2021-02-07 | 2021-06-22 | 国网浙江省电力有限公司金华供电公司 | 一种基于曲线聚类算法的用户用能特征挖掘方法 |
CN113177575B (zh) * | 2021-03-31 | 2022-11-25 | 北京理工大学 | 一种基于动态时间规整与k-means聚类的边坡形变区域划分方法 |
CN113255900A (zh) * | 2021-06-23 | 2021-08-13 | 河北工业大学 | 一种考虑改进谱聚类与Bi-LSTM神经网络的冲击性负荷预测方法 |
CN113780343B (zh) * | 2021-08-05 | 2024-03-05 | 上海电力大学 | 一种基于lttb降维的双边斜率dtw距离负荷谱聚类方法 |
CN113762373A (zh) * | 2021-08-30 | 2021-12-07 | 广东电网有限责任公司 | 一种负荷特性的异常识别方法、装置、电子设备及介质 |
CN114611842B (zh) * | 2022-05-10 | 2022-07-29 | 国网山西省电力公司晋城供电公司 | 一种整县屋顶分布式光伏功率预测方法 |
CN115589000B (zh) * | 2022-12-12 | 2023-04-07 | 广东电网有限责任公司阳江供电局 | 一种基于典型负荷归类的地区电压调整优化方法和系统 |
CN116109009B (zh) * | 2023-04-10 | 2023-07-18 | 山东理工大学 | 基于多特征量提取的光储型园区负荷曲线动态识别方法 |
CN116258280B (zh) * | 2023-05-12 | 2023-08-11 | 国网湖北省电力有限公司经济技术研究院 | 一种基于时间序列聚类的短期负荷预测方法 |
CN116502112B (zh) * | 2023-06-29 | 2023-10-24 | 深圳市联明电源有限公司 | 一种新能源电源测试数据管理方法及系统 |
CN116840606B (zh) * | 2023-09-01 | 2023-11-17 | 国网浙江省电力有限公司余姚市供电公司 | 基于非侵入式负荷的用电异常监测方法 |
CN117076990B (zh) * | 2023-10-13 | 2024-02-27 | 国网浙江省电力有限公司 | 基于曲线降维和聚类的负荷曲线辨识方法、装置及介质 |
CN117878929A (zh) * | 2024-03-12 | 2024-04-12 | 山东德源电力科技股份有限公司 | 基于多源数据融合的负荷控制终端预测方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107565601A (zh) * | 2017-09-20 | 2018-01-09 | 东南大学 | 一种分布式光伏电站集群的动态等值建模方法 |
CN108460410A (zh) * | 2018-02-08 | 2018-08-28 | 合肥工业大学 | 居民需求侧的用电模式识别方法和系统、存储介质 |
CN109871860A (zh) * | 2018-11-02 | 2019-06-11 | 湖南大学 | 一种基于核主成分分析的日负荷曲线降维聚类方法 |
-
2019
- 2019-10-25 CN CN201911021152.9A patent/CN111199016B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107565601A (zh) * | 2017-09-20 | 2018-01-09 | 东南大学 | 一种分布式光伏电站集群的动态等值建模方法 |
CN108460410A (zh) * | 2018-02-08 | 2018-08-28 | 合肥工业大学 | 居民需求侧的用电模式识别方法和系统、存储介质 |
CN109871860A (zh) * | 2018-11-02 | 2019-06-11 | 湖南大学 | 一种基于核主成分分析的日负荷曲线降维聚类方法 |
Non-Patent Citations (2)
Title |
---|
刘永志 ; .基于两点的时间序列相似性研究.盐城工学院学报(自然科学版).2014,(04),全文. * |
沈建良 ; 陆春光 ; 袁健 ; 倪琳娜 ; 张岩 ; .大数据技术在电力大用户用电特征分类中的应用.浙江电力.2017,(12),全文. * |
Also Published As
Publication number | Publication date |
---|---|
CN111199016A (zh) | 2020-05-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111199016B (zh) | 一种基于DTW的改进K-means的日负荷曲线聚类方法 | |
CN109871860B (zh) | 一种基于核主成分分析的日负荷曲线降维聚类方法 | |
CN111444241B (zh) | 一种基于数据挖掘的台区线损异常关联用户精准定位方法 | |
CN107833153B (zh) | 一种基于k-means聚类的电网负荷缺失数据补全方法 | |
CN108805213B (zh) | 计及小波熵降维的电力负荷曲线双层谱聚类方法 | |
CN111461921B (zh) | 一种基于机器学习的负荷建模典型用户数据库更新方法 | |
CN106067034B (zh) | 一种基于高维矩阵特征根的配电网负荷曲线聚类方法 | |
CN108428055B (zh) | 一种考虑负荷纵向特性的负荷聚类方法 | |
CN111008726B (zh) | 一种电力负荷预测中类图片转换方法 | |
CN111539657B (zh) | 结合用户日用电量曲线的典型用电行业负荷特性分类与综合方法 | |
CN116821832A (zh) | 针对高压工商业用户用电负荷的异常数据辨识与修正方法 | |
CN111460001A (zh) | 一种配电网理论线损率评估方法及系统 | |
CN111815026A (zh) | 一种基于特征聚类的多能源系统负荷预测方法 | |
CN114611738A (zh) | 一种基于用户用电行为分析的负荷预测方法 | |
Wang et al. | Big data analytics for price forecasting in smart grids | |
CN109146553A (zh) | 基于多密度聚类与多核svm的实时电价预测系统及其方法 | |
CN115809719A (zh) | 一种基于形态聚类的短期负荷预测修正方法 | |
CN115905904A (zh) | 一种配电网馈线的线损异常评估方法及装置 | |
CN112149052B (zh) | 一种基于plr-dtw的日负荷曲线聚类方法 | |
CN113378954B (zh) | 一种基于粒子群改进k均值算法的负荷曲线聚类方法及系统 | |
Miraftabzadeh et al. | Knowledge Extraction From PV Power Generation With Deep Learning Autoencoder and Clustering-Based Algorithms | |
CN111737924B (zh) | 一种基于多源数据选取典型负荷特性变电站的方法 | |
CN113392877A (zh) | 一种基于蚁群算法与c-k算法的日负荷曲线聚类方法 | |
CN116070458A (zh) | 基于rac-gan的新建风电场场景生成方法 | |
CN116404637A (zh) | 电力系统短期负荷预测方法和电力系统短期负荷预测装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |