CN107423769B - 基于形态特征的电力负荷曲线自适应聚类方法 - Google Patents
基于形态特征的电力负荷曲线自适应聚类方法 Download PDFInfo
- Publication number
- CN107423769B CN107423769B CN201710655080.8A CN201710655080A CN107423769B CN 107423769 B CN107423769 B CN 107423769B CN 201710655080 A CN201710655080 A CN 201710655080A CN 107423769 B CN107423769 B CN 107423769B
- Authority
- CN
- China
- Prior art keywords
- cluster centre
- cluster
- electric load
- load curve
- morphological feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000000877 morphologic effect Effects 0.000 title claims abstract description 78
- 230000003044 adaptive effect Effects 0.000 title claims abstract description 19
- 239000000284 extract Substances 0.000 claims abstract description 3
- 238000004422 calculation algorithm Methods 0.000 claims description 33
- 238000000034 method Methods 0.000 claims description 18
- 238000009499 grossing Methods 0.000 claims description 15
- 238000004364 calculation method Methods 0.000 claims description 10
- 239000011159 matrix material Substances 0.000 claims description 10
- 238000000605 extraction Methods 0.000 claims description 5
- 230000000630 rising effect Effects 0.000 claims description 4
- 238000013016 damping Methods 0.000 claims description 2
- 238000001914 filtration Methods 0.000 claims description 2
- 238000005498 polishing Methods 0.000 claims description 2
- 240000002853 Nelumbo nucifera Species 0.000 claims 1
- 235000006508 Nelumbo nucifera Nutrition 0.000 claims 1
- 235000006510 Nelumbo pentapetala Nutrition 0.000 claims 1
- 230000005611 electricity Effects 0.000 description 7
- 238000011156 evaluation Methods 0.000 description 4
- 238000005192 partition Methods 0.000 description 3
- 101100154696 Pseudomonas aeruginosa (strain ATCC 15692 / DSM 22644 / CIP 104116 / JCM 14847 / LMG 12228 / 1C / PRS 101 / PAO1) tsi1 gene Proteins 0.000 description 2
- 101100154697 Pseudomonas aeruginosa (strain ATCC 15692 / DSM 22644 / CIP 104116 / JCM 14847 / LMG 12228 / 1C / PRS 101 / PAO1) tsi2 gene Proteins 0.000 description 2
- 230000002902 bimodal effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000009412 basement excavation Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000013441 quality evaluation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/231—Hierarchical techniques, i.e. dividing or merging pattern sets so as to obtain a dendrogram
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Economics (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了基于形态特征的电力负荷曲线自适应聚类方法,其提取获取的电力负荷曲线的形态特征,获取设定量个函数密度值作为初始的聚类中心;通过计算最小聚类代价函数值对电力负荷曲线进行分类:当相邻两次迭代的聚类中心变化量小于或等于预设阈值时,将得到的聚类中心存入聚类中心集合;当设定量等于或大于预设阀值时,采用聚类中心集合中的所有聚类中心聚类得到聚类系谱图选取聚类中心和聚类中心数量;当相邻两次迭代的聚类中心变化量小于或等于预设阈值时,获取当前聚类中心,之后采用最小聚类代价函数值对电力负荷曲线进行分类;当所有电力负荷曲线均分类至聚类中心所在电力负荷曲线簇时,输出当前聚类中心,电力负荷曲线簇和聚类中心数量。
Description
技术领域
本发明涉及电力系统大数据挖掘与分析技术领域,具体涉及电力负荷曲线自适应聚类方法。
背景技术
随着电力体制改革不断推进,电力企业不仅要向用户提供高质量的电能,还要对用户的用电行为进行专业化指导,深刻把握用户的用电规律,感知用户的用电特性,对提高配电网馈线负荷预测精度、识别用户用电模式、评估需求响应能力、指导电价制定等具有重要意义。
针对电力数据海量多源异构的特点,目前普遍采用适用于大规模数据的模式识别技术、聚类分析方法、数据挖掘算法实现远程、友好、互动的智能用电控制的关键。其中,聚类算法的主要目标是提取数据在全局范围内的分布特征,把一个数据对象划分为若干个数据子集,每个子集内数据的分布情况、形态特征彼此相似,不同子集之间的数据对象不相似。传统的聚类算法包括划分聚类算法、层次聚类算法、基于网格聚类算法、基于密度聚类算法、基于模型聚类算法等,电力负荷曲线聚类应用比较成熟的包括基于划分的K-means和FCM、层次聚类、基于人工神经网络的自组织映射聚类等方法。
其中,划分式聚类以算法的高效性应用较为广泛,但以欧氏距离为负荷形态相似度判别依据注重曲线的距离,而容易忽略形态特征,已难以高效应用于负荷曲线的特征提取,聚类质量面临着严重的挑战。有学者对算法进行了改进,将层次聚类和划分聚类相结合,提出了一种用户用电曲线的集成聚类算法。该算法虽然在一定程度上可以提高聚类效率和质量,但基于距离的方法只能从整体或宏观上刻画负荷的特征,而不能精准描述负荷曲线的变化趋势,缺乏对曲线形态的识别。又有学者提出以余弦相似度为度量依据,其可以有效识别用电曲线的变化趋势,但算法的质量受数据中“噪音”的影响较大。
此外,还有众多学者提出了基于蚁群优化聚类、基于云计算和量子粒子群算法聚类、三阶段聚类等,但上述算法并没有从根本上解决问题,缺乏从负荷曲线形态相似性进行聚类分析,也有学者提出了一种基于形态特征的聚类算法,但该算法目前仅适用于二维数据,难以适用于三维及更高维度。随着数据规模和维度的增加,只是依靠欧氏距离作为相似度判别的意义也越来越小。
发明内容
针对现有技术中的上述不足,本发明提供的电力负荷曲线自适应聚类方法能够在对电力负荷曲线进行聚类时自动寻找最佳的聚类中心数目和最佳的聚类中心。
为了达到上述发明目的,本发明采用的技术方案为:
提供一种基于形态特征的电力负荷曲线自适应聚类方法,其包括:
S1、获取用户设定时间段内的电力负荷曲线;
S2、提取所述电力负荷曲线的形态特征,并将每个用户的形态特征转换为形态特征向量,所述形态特征至少包括电力负荷曲线的上升、平稳和下降趋势;
S3、根据计算的每个用户形态特征向量的函数密度值,获取设定量个函数密度值作为初始的聚类中心;
S4、通过聚类中心与所有用户的形态特征向量的相似度值加权计算最小聚类代价函数值时,对电力负荷曲线进行分类:
S5、当相邻两次迭代的聚类中心变化量大于预设阈值,采用取众数的方式更新计算最小聚类代价函数值的聚类中心;
S6、当相邻两次迭代的聚类中心变化量小于或等于预设阈值时,将得到的聚类中心存入聚类中心集合,并判断设定量与预设聚类中心数的关系:
S7、当设定量小于预设聚类中心数时,将设定量累加一次,并返回步骤S3;当设定量等于或大于预设聚类中心数时,采用层次聚类算法对聚类中心集合中的所有聚类中心进行聚类得到聚类系谱图;
S8、采用聚类系谱图选取聚类中心和聚类中心数量,并执行步骤S4和步骤S5;
S9、当相邻两次迭代的聚类中心变化量小于或等于预设阈值时,获取当前聚类中心,并停止聚类中心更新,之后采用最小聚类代价函数值对电力负荷曲线进行分类;
S10、当所有电力负荷曲线均分类至聚类中心所在电力负荷曲线簇时,输出当前聚类中心,当前聚类中心所对应的电力负荷曲线簇和采用聚类系谱图选取的聚类中心数量。
本发明的有益效果为:本方案在迭代过程中,通过不停增加聚类中心数量,并将不同数量的聚类中心计算出的聚类代价函数值满足特定条件(相邻两次迭代产生的聚类代价函数值之间的差异小于设定阈值或迭代次数等于设定次数时)所对应的所有聚类中进行存储,通过再次聚类找到最佳的聚类中心数量和聚类中心,并以找到的最佳聚类中心数量和聚类中心再次进行迭代,最终找到误差最小的聚类中心,并通过该聚类中心分类形成电力负荷曲线更接近的电力负荷曲线簇。
通过这种方式实现聚类中心的确定和电力负荷曲线簇的划分过程中,避免了人为确定聚类中心数量造成的算法稳定性差,致使电力负荷曲线分类过程出现准确性差的问题。
附图说明
图1为基于形态特征的电力负荷曲线自适应聚类方法的流程图。
图2为负荷属性特征提取图。
图3为数据平滑处理示意图。
图4为聚类系谱图。
图5为本方案电力负荷曲线自适应聚类方法聚类结果。
图6为FCM聚类结果。
图7为聚类中心形态特征对比图。
图8为聚类数与有效性指标关系。
图9为典型聚类算法的计算时间。
图10为典型聚类算法的质量评价值。
具体实施方式
下面对本发明的具体实施方式进行描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
参考图1,图1示出了基于形态特征的电力负荷曲线自适应聚类方法的流程图;如图1所示,该方法包括步骤S1至步骤S10。
在步骤101中,在步骤S1中,获取用户设定时间段内的电力负荷曲线;此处的设定时间段可以是某段时间内随机选择的几个工作日/节假日,也可以分别选取四个季节中的连续一周。本方案在聚类时,用户每天的电力负荷曲线包括96个时段的负荷数据。
在本发明的一个实施例中,该基于形态特征的电力负荷曲线自适应聚类方法还包括对设定时间段内的电力负荷曲线取平均值,并对取平均值后的电力负荷曲线进行数据平滑处理,之后,采用数据平滑处理后的电力负荷曲线进行形态特征的提取。
聚类过程中,通过对电力负荷曲线取平均值处理后,可以削弱单一用户的负荷数据受某些特殊因素(例如气温骤变、节假日等)发生的异常波动降低整个聚类过程的精度。
实施时,本方案优选对取平均值后的电力负荷曲线进行数据平滑处理进一步包括:采用高斯滤波对取平均值后的电力负荷曲线进行平滑处理;以及采用三次样条插值算法对平滑处理后的电力负荷曲线中缺失的数据进行补齐。
电力负荷曲线进行数据平滑处理的前后图可以参考图3,通过数据平滑处理后,可以降低用户异常数据与缺失数据对聚类精度造成影响。
在步骤S2中,提取所述电力负荷曲线(若电力负荷曲线进行了取平均值或数据平滑处理,那么此处的电力负荷曲线即变为进行取平均值或数据平滑处理后的电力负荷曲线)的形态特征,并将每个用户的形态特征转换为形态特征向量,所述形态特征至少包括电力负荷曲线的上升、平稳和下降趋势。
在本发明的一个实施例中,提取所述电力负荷曲线的形态特征的方法包括:采用差分算法对所述电力负荷曲线取一阶差分值表示负荷数据变化量的差分矩阵;对差分矩阵中的每个子序列采用分位数法刻画负荷数据变化量形成每个用户电力负荷曲线的形态特征。
更进一步说,首先对电力负荷曲线取一阶差分值,将电力负荷曲线上表示负荷数据矩阵D={d1,d2,…,dn}T转化为表示负荷数据变化量的差分矩阵Diff={diff1,diff2,…,diffn}T,其中,差分矩阵由n个m维行向量diffi=[diff1,diff2,…,diffm]组成。
之后对差分后的每个子序列采用分位数刻画其数据分布特征,由于用户用电数据呈现明显的非线性和随机性,采用少量的分位数更有利于刻画负荷曲线的主要特征,本方案选取分位点数为3,置信概率值分别为0.05、0.5和0.95,记曲线形态特征提取后的类属型矩阵为X=[xij]n*m,其中:
式中,max(diffi)和min(diffi)分别表示第i个行向量的最大元素和最小元素。xij为第i个用户的形态特征向量在第j个维度上的形态特征值。
类属型矩阵由3、2、1、0、-1、-2、-3组成的n×m维矩阵,表示n个用户在m个时段用电负荷曲线的上升、平稳和下降等趋势。通过形态特征提取将原始电力负荷曲线数据转化成类属型数据,克服了用户本身的量级差异给聚类分析带来的影响,聚类结果更能代表曲线本身的形态特征,电力负荷曲线的形态特征提取参考图2。
在步骤S3中,根据计算的每个用户形态特征向量的函数密度值,获取设定量个函数密度值作为初始的聚类中心。
实施时,本方案优选通过计算的每个用户的形态特征向量的函数密度值获取设定量个聚类中心进一步包括:计算的每个用户的形态特征向量的函数密度值;对所有用户的函数密度值进行降序排列;以及选取前面设定量个函数密度值作为聚类中心。
在步骤S4中,通过聚类中心与所有用户的形态特征向量的相似度值加权计算最小聚类代价函数值时,对电力负荷曲线进行分类(在计算最小聚类代价函数值过程时,会根据聚类中心,将相似的电力负荷曲线分类至同一个聚类中心所在电力负荷曲线簇中)。
实施时,本方案优选函数密度值的计算公式为:
其中,Xi为第i个用户的形态特征向量;b为指数衰减的速度;e为自然对数;xjz为第j个用户的形态特征向量在第z个时间段上的特征属性;xiz为第i个用户的形态特征向量在第z个维度上的形态特征值;δ表示两个数之间的相似度,若是两个数相等,则δ等于1,否则等于0,本方案中提到的两个数之间的相似度时,其取值都是基于两个数相等时,则δ等于1,否则等于0这一原则。
在步骤S5中,在对电力负荷曲线进行分类时,当相邻两次迭代的聚类中心变化量大于预设阈值,采用取众数的方式更新计算最小聚类代价函数值的聚类中心,之后并一直不停地根据更新的聚类中心计算最小聚类代价函数值,并对电力负荷曲线进行分类,直至相邻两次迭代的聚类中心变化量小于或等于预设阈值。
在本发明的一个实施例中,最小聚类代价函数值的计算公式为:
其中,X为形态特征向量,Q为聚类中心;W为隶属度;U为属性加权值;α为平滑因子;wli为第i个用户的形态特征向量划分至第l类聚类中心的隶属度;ai为惩罚系数;qlz为第l类聚类中心在第z个维度上的形态特征值;δ(xiz,qlz)为xiz和qlz的相似度;uz为形态特征向量在第z个维度上的形态特征值的权值;l为类负荷曲线;i为待聚类形态特征向量;z为特征向量的维度数;k为聚类中心数量;n为待聚类的形态特征向量的数量;m为每个形态特征向量的维度。
实施时,采用取众数的方式更新聚类中心进一步包括:
计算第i个用户的形态特征向量划分至第l类聚类中心的隶属度:
其中,wli为第i个用户的形态特征向量划分至第l类聚类中心的隶属度;Xi为第i个用户的形态特征向量;Ql为第l类的聚类中心;Qh为第h类的聚类中心;d(Ql,Xi)为Xi与Ql之间的相似度;d(Qh,Xi)为Xi与Qh之间的相似度;α为平滑因子;
对每一类中所有数据点在每一维度上取众数,更新每个类的聚类中心:qlj=mode(xij|xi∈Ql),j=1,2,…,m,qlj为第l类聚类中心在第j个维度上的形态特征值;xij为第i个用户的形态特征向量在第j个时间段上的特征属性。
在步骤S6中,在对电力负荷曲线进行分类时,当相邻两次迭代的聚类中心变化量小于或等于预设阈值时,将得到的聚类中心存入聚类中心集合,并判断设定量与预设聚类中心数的关系。
在步骤S7中,当设定量小于预设聚类中心数时,将设定量累加一次,并返回步骤S3;当设定量等于或大于预设聚类中心数时,采用层次聚类算法对聚类中心集合中的所有聚类中心进行聚类得到聚类系谱图;
在步骤S8中,采用聚类系谱图选取聚类中心和聚类中心数量,并执行步骤S4和步骤S5;选取聚类中心和聚类中心数量的具体做法是,对聚类系谱图进行横向截断,选取具有明显高度差时对应的聚类中心和聚类中心数量作为新的初始聚类中心和聚类中心数量。
在步骤S9中,当相邻两次迭代的聚类中心变化量小于或等于预设阈值时,获取当前聚类中心,并停止聚类中心更新,之后采用最小聚类代价函数值对电力负荷曲线进行分类。
在步骤S10中,当所有电力负荷曲线均分类至聚类中心所在电力负荷曲线簇时,输出当前聚类中心,当前聚类中心所对应的电力负荷曲线簇和采用聚类系谱图选取的聚类中心数量。
下面结合具体的实例对本方案的聚类效果进行说明:
本方案选取某地区智能电表实测数据,数据覆盖了4869个用户,每15min采集一次,每天96个采集点,由于工作日和非工作日负荷曲线特性不同,本实施例仅对工作日负荷特性进行研究,选取其中的工作日负荷数据并取平均值,以此作为典型工作日负荷,本实施在单台CPU为3.1Ghz,内存为4GB,程序基于MATLAB完成。
设置采用聚类中心得到聚类系谱图时,设定量更新10次,其初始值为2,每次累加1,通过设定量更新10次得到的聚类中心再次进行聚类得到的聚类系谱图如图4所示,从图4中可以看出,聚类树在k=8时存在明显的高度差,即从k=8处对聚类树截取,并以对应的聚类中心作为初始聚类中心,再次求取满足条件的聚类代价函数值或迭代次数,并输出取满足条件的聚类代价函数值或迭代次数时所对应的聚类中心及通过聚类中心分类完成的电力负荷曲线簇。
通过聚类中心分类完成的电力负荷曲线簇如图5所示,从图5中可以看出,8类曲线主要分为:3类单峰、3类单谷、1类双峰、1类平稳型负荷。
利用FCM算法对选取的某地区智能电表实测数据进行聚类,设置聚类中心数量k=8,聚类结果如图6所示,从图6可以看出,FCM算法虽然可以大致区分出单峰、单谷、双峰和稳定型四类负荷,但聚类质量明显低于本方案的聚类方法,且无法对单峰和单谷负荷进行更为精细的划分。
如图7所示,对同为单峰型负荷的类1和类3的聚类中心形态特征进行对比,类1和类3峰出现和持续的时间不同,类1的峰出现在第30个时序点,第86个时序点结束,而类3的峰持续在第8-88时序点,应用特征差异度量可有效区分各类负荷的特征,聚类结果更能反映负荷曲线的形态特征。
关于本方案聚类的有效性,本方案同时采用SSE、CHI和DBI指标来评价聚类的有效性,对上述数据集进行聚类时并记录每次聚类指标评价值,评价结果如图8所示,其中SSE指标用左侧纵坐标,CHI和DBI用右侧纵坐标:从图8可以看出,当聚类数k=8时,SSE指标出现明显拐点,CHI和DBI指标分别出现极大值和极小值,与本方案从聚类系谱图中截取的聚类中心数量相一致。
关于本方案聚类质量,设置聚类数k=8,对上述数据分别采用k-means和FCM算法进行聚类,并记录每次聚类的SSE、CHI和DBI指标,评价结果如图9所示,从图9可以看到,本方案的聚类方案所达到的聚类质量要明显优于k-means和FCM算法。
关于本方案算法稳定性,k-means算法采用本方案聚类系谱图得到聚类中心数量k=8进行聚类,通过计算两种算法的TSI指标,其中,TSI1表示本方案的TSI指标,TSI2表示k-means的TSI指标,TSI1=1<TSI2=1.667。
上面的TSI指标的计算公式为:
进一步,统计并记录每次聚类归入各类的曲线数量,对比结果如图10所示,从图10可以看出,k-means算法8次的聚类结果相差较大,而本方案8次聚类的结果基本一致,由此可以看出,本方案聚类方法稳定性比k-means好。
Claims (9)
1.基于形态特征的电力负荷曲线自适应聚类方法,其特征在于,包括:
S1、获取用户设定时间段内的电力负荷曲线;
S2、提取所述电力负荷曲线的形态特征,并将每个用户的形态特征转换为形态特征向量,所述形态特征至少包括电力负荷曲线的上升、平稳和下降趋势;
S3、根据计算的每个用户形态特征向量的函数密度值,获取设定量个函数密度值作为初始的聚类中心;
S4、通过聚类中心与所有用户的形态特征向量的相似度值加权计算最小聚类代价函数值时,对电力负荷曲线进行分类:
S5、当相邻两次迭代的聚类中心变化量大于预设阈值,采用取众数的方式更新计算最小聚类代价函数值的聚类中心,之后并一直不停地根据更新的聚类中心计算最小聚类代价函数值,并对电力负荷曲线进行分类,直至相邻两次迭代的聚类中心变化量小于或等于预设阈值;
S6、当相邻两次迭代的聚类中心变化量小于或等于预设阈值时,将得到的聚类中心存入聚类中心集合,并判断设定量与预设聚类中心数的关系:
S7、当设定量小于预设聚类中心数时,将设定量累加一次,并返回步骤S3;当设定量等于或大于预设聚类中心数时,采用层次聚类算法对聚类中心集合中的所有聚类中心进行聚类得到聚类系谱图;
S8、采用聚类系谱图选取聚类中心和聚类中心数量,并执行步骤S4和步骤S5;
S9、当相邻两次迭代的聚类中心变化量小于或等于预设阈值时,获取当前聚类中心,并停止聚类中心更新,之后采用最小聚类代价函数值对电力负荷曲线进行分类;以及
S10、当所有电力负荷曲线均分类至聚类中心所在电力负荷曲线簇时,输出当前聚类中心,当前聚类中心所对应的电力负荷曲线簇和采用聚类系谱图选取的聚类中心数量。
2.根据权利要求1所述的电力负荷曲线自适应聚类方法,其特征在于,所述最小聚类代价函数值的计算公式为:
其中,X为形态特征向量;Q为聚类中心;W为隶属度;U为属性加权值;α为平滑因子;wli为第i个用户的形态特征向量划分至第l类聚类中心的隶属度;ai为惩罚系数;xiz为第i个用户的形态特征向量在第z个维度上的形态特征值;qlz为第l类聚类中心在第z个维度上的形态特征值;δ(xiz,qlz)为xiz和qlz的相似度;uz为形态特征向量在第z个维度上的形态特征值的权值;l为类负荷曲线;i为待聚类形态特征向量;z为特征向量的维度数;k为聚类中心数量;n为待聚类的形态特征向量的数量;m为每个形态特征向量的维度。
3.根据权利要求2所述的电力负荷曲线自适应聚类方法,其特征在于,所述函数密度值的计算公式为:
其中,Xi为第i个用户的形态特征向量;b为指数衰减的速度;e为自然对数;xjz为第j个用户的形态特征向量在第z个时间段上的特征属性。
4.根据权利要求2所述的电力负荷曲线自适应聚类方法,其特征在于,所述采用取众数的方式更新聚类中心进一步包括:
计算第i个用户的形态特征向量划分至第l类聚类中心的隶属度:
其中,wli为第i个用户的形态特征向量划分至第l类聚类中心的隶属度;Xi为第i个用户的形态特征向量;Ql为第l类的聚类中心;Qh为第h类的聚类中心;d(Ql,Xi)为Xi与Ql之间的相似度;d(Qh,Xi)为Xi与Qh之间的相似度;α为平滑因子;
对每一类中所有数据点在每一维度上取众数,更新每个类的聚类中心:qlj=mode(xij|xi∈Ql),j=1,2,…,m,qlj为第l类聚类中心在第j个维度上的形态特征值;xij为第i个用户的形态特征向量在第j个时间段上的特征属性。
5.根据权利要求1-4任一所述的电力负荷曲线自适应聚类方法,其特征在于,还包括对设定时间段内的电力负荷曲线取平均值,并对取平均值后的电力负荷曲线进行数据平滑处理,之后,采用数据平滑处理后的电力负荷曲线进行形态特征的提取。
6.根据权利要求5所述的电力负荷曲线自适应聚类方法,其特征在于,所述对取平均值后的电力负荷曲线进行数据平滑处理进一步包括:
采用高斯滤波对取平均值后的电力负荷曲线进行平滑处理;以及
采用三次样条插值算法对平滑处理后的电力负荷曲线中缺失的数据进行补齐。
7.根据权利要求1-4、6任一所述的电力负荷曲线自适应聚类方法,其特征在于,所述通过计算的每个用户的形态特征向量的函数密度值获取设定量个聚类中心进一步包括:
计算的每个用户的形态特征向量的函数密度值;
对所有用户的函数密度值进行降序排列;以及
选取前面设定量个函数密度值作为聚类中心。
8.根据权利要求1-4、6任一所述的电力负荷曲线自适应聚类方法,其特征在于,提取所述电力负荷曲线的形态特征的方法包括:
采用差分算法对所述电力负荷曲线取一阶差分值表示负荷数据变化量的差分矩阵;
对差分矩阵中的每个子序列采用分位数法刻画负荷数据变化量形成每个用户电力负荷曲线的形态特征。
9.根据权利要求1-4、6任一所述的电力负荷曲线自适应聚类方法,其特征在于,用户每天的电力负荷曲线包括96个时段的负荷数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710655080.8A CN107423769B (zh) | 2017-08-03 | 2017-08-03 | 基于形态特征的电力负荷曲线自适应聚类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710655080.8A CN107423769B (zh) | 2017-08-03 | 2017-08-03 | 基于形态特征的电力负荷曲线自适应聚类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107423769A CN107423769A (zh) | 2017-12-01 |
CN107423769B true CN107423769B (zh) | 2019-10-01 |
Family
ID=60437331
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710655080.8A Active CN107423769B (zh) | 2017-08-03 | 2017-08-03 | 基于形态特征的电力负荷曲线自适应聚类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107423769B (zh) |
Families Citing this family (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108228827A (zh) * | 2018-01-02 | 2018-06-29 | 国电南瑞科技股份有限公司 | 一种基于小波变换的负荷聚类和模式识别方法 |
CN108596362B (zh) * | 2018-03-22 | 2021-12-28 | 国网四川省电力公司经济技术研究院 | 基于自适应分段聚合近似的电力负荷曲线形态聚类方法 |
CN108681744B (zh) * | 2018-04-18 | 2021-09-17 | 西北工业大学 | 一种基于数据划分的电力负荷曲线层次聚类方法 |
CN108764353B (zh) * | 2018-05-25 | 2021-11-30 | 中国电力科学研究院有限公司 | 基于匹配度的大规模电力系统功率曲线分类方法 |
CN108776729B (zh) * | 2018-05-30 | 2019-04-09 | 四川大学 | 一种基于改进聚类算法的电动汽车充电负荷特征提取方法 |
CN109214458B (zh) * | 2018-09-19 | 2021-08-13 | 合肥工业大学 | 一种基于历史数据的城市负荷量化方法 |
CN108898154A (zh) * | 2018-09-29 | 2018-11-27 | 华北电力大学 | 一种电力负荷som-fcm分层聚类方法 |
CN109583763A (zh) * | 2018-12-03 | 2019-04-05 | 国网浙江省电力有限公司台州供电公司 | 分行业用户电力负荷增长特征挖掘算法 |
CN109492048A (zh) * | 2019-01-21 | 2019-03-19 | 国网河北省电力有限公司经济技术研究院 | 一种电力用户用电特性的提取方法、系统及终端设备 |
CN110097261B (zh) * | 2019-04-17 | 2022-11-18 | 三峡大学 | 一种判断用户用电异常的方法 |
CN110334726A (zh) * | 2019-04-24 | 2019-10-15 | 华北电力大学 | 一种基于密度聚类和lstm的电力负荷异常数据的识别与修复方法 |
CN111915107A (zh) * | 2019-05-07 | 2020-11-10 | 华北电力大学 | 一种基于动态聚类的负荷分群控制方法 |
CN110543889A (zh) * | 2019-07-18 | 2019-12-06 | 广州供电局有限公司 | 电力负荷分层聚类方法、装置、计算机设备及存储介质 |
CN110889431A (zh) * | 2019-10-28 | 2020-03-17 | 杭州电子科技大学 | 基于K-Means算法改进的高频职业技能生命曲线聚类方法 |
CN111311431B (zh) * | 2020-01-19 | 2022-05-13 | 国网福建省电力有限公司经济技术研究院 | 一种基于分段斜率的负荷曲线形态聚类方法 |
CN113592122B (zh) * | 2020-04-30 | 2023-09-05 | 北京京东振世信息技术有限公司 | 路线规划的方法和装置 |
CN111881951B (zh) * | 2020-07-13 | 2024-09-13 | 广联达科技股份有限公司 | 工程图纸中的曲线分类方法和分类装置 |
CN112129989B (zh) * | 2020-09-23 | 2021-07-27 | 四川大学 | 一种基于自适应聚类的电压暂降分段刻画方法 |
CN112561138B (zh) * | 2020-12-01 | 2022-10-25 | 广东电网有限责任公司广州供电局 | 电力负荷预测方法、装置、计算机设备和存储介质 |
CN113159106B (zh) * | 2021-02-26 | 2024-02-02 | 国网甘肃省电力公司 | 一种基于形态趋势特征的负荷曲线聚类方法、介质及设备 |
CN113886669B (zh) * | 2021-10-26 | 2024-02-23 | 国家电网有限公司 | 一种电力用户画像自适应聚类方法 |
CN116257745B (zh) * | 2023-05-10 | 2023-08-15 | 杭州致成电子科技有限公司 | 一种负荷电流极端异常数据处理方法和装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010146161A2 (en) * | 2009-06-18 | 2010-12-23 | Innovcoat Nanocoatings And Surface Products Industry, Sales And R&D Incorporation | Photocatalytic nanocomposite structured with boron |
CN103049651A (zh) * | 2012-12-13 | 2013-04-17 | 航天科工深圳(集团)有限公司 | 一种用于电力负荷聚类的方法及装置 |
CN103093394A (zh) * | 2013-01-23 | 2013-05-08 | 广东电网公司信息中心 | 一种基于用户用电负荷数据细分的聚类融合方法 |
CN104809255A (zh) * | 2015-05-21 | 2015-07-29 | 国家电网公司 | 一种负荷形态获取方法和系统 |
CN106203478A (zh) * | 2016-06-27 | 2016-12-07 | 南昌大学 | 一种用于智能电表大数据的负荷曲线聚类方法 |
CN106446967A (zh) * | 2016-10-28 | 2017-02-22 | 国网福建省电力有限公司 | 一种新型电力系统负荷曲线聚类方法 |
-
2017
- 2017-08-03 CN CN201710655080.8A patent/CN107423769B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010146161A2 (en) * | 2009-06-18 | 2010-12-23 | Innovcoat Nanocoatings And Surface Products Industry, Sales And R&D Incorporation | Photocatalytic nanocomposite structured with boron |
CN103049651A (zh) * | 2012-12-13 | 2013-04-17 | 航天科工深圳(集团)有限公司 | 一种用于电力负荷聚类的方法及装置 |
CN103093394A (zh) * | 2013-01-23 | 2013-05-08 | 广东电网公司信息中心 | 一种基于用户用电负荷数据细分的聚类融合方法 |
CN104809255A (zh) * | 2015-05-21 | 2015-07-29 | 国家电网公司 | 一种负荷形态获取方法和系统 |
CN106203478A (zh) * | 2016-06-27 | 2016-12-07 | 南昌大学 | 一种用于智能电表大数据的负荷曲线聚类方法 |
CN106446967A (zh) * | 2016-10-28 | 2017-02-22 | 国网福建省电力有限公司 | 一种新型电力系统负荷曲线聚类方法 |
Non-Patent Citations (8)
Title |
---|
"Thermal conduction in graphite flake-epoxy composites using infrared microscopy";Rajath Kantharaj et al.;《 2017 16th IEEE Intersociety Conference on Thermal and Thermomechanical Phenomena in Electronic Systems》;20170602;全文 * |
"基于信息熵分段聚合近似和谱聚类的负荷分类方法";林顺富 等;《中国电机工程学报》;20170420;第37卷(第8期);全文 * |
"基于功能单元的高压配电网负荷转供分层优化模型";金勇 等;《工程科学与技术》;20170531;第49卷(第3期);全文 * |
"基于多目标聚类的用电集群特征属性计算";刘友波 等;《电力系统自动化》;20091010;第33卷(第19期);全文 * |
"基于形态匹配的大用户直购电撮合模型";胥威汀 等;《2009年中国电机工程学会年会》;20091125;全文 * |
"基于频谱分析的负荷形态分类研究";杨震男 等;《电力需求侧管理》;20150810;第17卷(第3期);全文 * |
"省地一体化电力信息监控平台信息化的动态标尺评价模型";李阳 等;《电力系统自动化》;20170610;第41卷(第11期);全文 * |
"结合负荷形态指标的电力负荷曲线两步聚类算法";彭勃 等;《电力建设》;20160630;第37卷(第6期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN107423769A (zh) | 2017-12-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107423769B (zh) | 基于形态特征的电力负荷曲线自适应聚类方法 | |
CN108280479B (zh) | 一种基于负荷特性指标加权聚类算法的电网用户分类方法 | |
WO2018082523A1 (zh) | 一种负荷周期的模式识别方法 | |
CN104200275B (zh) | 基于用户行为特点的用电模式分类和控制方法 | |
Huang et al. | A clustering based grouping method of nearly zero energy buildings for performance improvements | |
CN106203478A (zh) | 一种用于智能电表大数据的负荷曲线聚类方法 | |
CN106485089B (zh) | 谐波用户典型工况的区间参数获取方法 | |
CN105184402B (zh) | 一种基于决策树的个性化用户短期负荷预测算法 | |
CN112186761B (zh) | 一种基于概率分布的风电功率场景生成方法及系统 | |
CN109670650A (zh) | 基于多目标优化算法的梯级水库群调度模型的求解方法 | |
CN110321934A (zh) | 一种检测用户用电异常数据的方法及系统 | |
CN110245783A (zh) | 一种基于c-均值聚类模糊粗糙集的短期负荷预测方法 | |
CN108345908A (zh) | 电网数据的分类方法、分类设备及存储介质 | |
CN107909208A (zh) | 一种台区配网降损方法 | |
CN110444011A (zh) | 交通流高峰识别方法、装置、电子设备及存储介质 | |
CN113159106A (zh) | 一种基于形态趋势特征的负荷曲线聚类方法、介质及设备 | |
CN106777005A (zh) | 基于大数据技术改进聚类算法的用户用电行为分析方法 | |
Qi et al. | Load pattern recognition method based on fuzzy clustering and decision tree | |
Zhang et al. | Application of decision trees to the determination of the year-end level of a carryover storage reservoir based on the iterative dichotomizer 3 | |
CN110137951A (zh) | 基于节点电价的市场分区方法及装置 | |
CN114722098A (zh) | 一种基于正态云模型和密度聚类算法的典型负荷曲线辨识方法 | |
Lu et al. | Research on creating multi-attribute power consumption behavior portraits for massive users | |
Sharma et al. | Aberration detection in electricity consumption using clustering technique | |
CN109741091B (zh) | 基于基础负荷削减策略的用户负荷分类方法 | |
Shen et al. | A Novel AI-based Method for EV Charging Load Profile Clustering |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |