CN108596362A - 基于自适应分段聚合近似的电力负荷曲线形态聚类方法 - Google Patents
基于自适应分段聚合近似的电力负荷曲线形态聚类方法 Download PDFInfo
- Publication number
- CN108596362A CN108596362A CN201810242171.3A CN201810242171A CN108596362A CN 108596362 A CN108596362 A CN 108596362A CN 201810242171 A CN201810242171 A CN 201810242171A CN 108596362 A CN108596362 A CN 108596362A
- Authority
- CN
- China
- Prior art keywords
- power load
- load curve
- point
- curve
- load
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 56
- 230000003044 adaptive effect Effects 0.000 title claims abstract description 14
- 230000011218 segmentation Effects 0.000 title claims abstract description 8
- 230000009467 reduction Effects 0.000 claims abstract description 34
- 230000009194 climbing Effects 0.000 claims abstract description 31
- 230000002776 aggregation Effects 0.000 claims description 19
- 238000004220 aggregation Methods 0.000 claims description 18
- 230000008859 change Effects 0.000 claims description 14
- 238000012545 processing Methods 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 9
- 238000007781 pre-processing Methods 0.000 claims description 7
- 230000002159 abnormal effect Effects 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 6
- 238000013519 translation Methods 0.000 claims description 6
- 238000006073 displacement reaction Methods 0.000 claims description 4
- 230000002596 correlated effect Effects 0.000 claims description 3
- 230000000875 corresponding effect Effects 0.000 claims description 3
- 238000004422 calculation algorithm Methods 0.000 description 18
- 230000000877 morphologic effect Effects 0.000 description 7
- 230000000694 effects Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000000691 measurement method Methods 0.000 description 2
- 241000221931 Hypomyces rosellus Species 0.000 description 1
- 238000005054 agglomeration Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 230000015271 coagulation Effects 0.000 description 1
- 238000005345 coagulation Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 238000011946 reduction process Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Marketing (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Public Health (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Water Supply & Treatment (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Supply And Distribution Of Alternating Current (AREA)
Abstract
本发明公开了一种基于自适应分段聚合近似的电力负荷曲线形态聚类方法,其包括将原始电力负荷曲线数据序列分为若干数据段,之后通过计算固定时间窗内爬坡事件总数以及基于斜率提取的边缘点总数,并通过爬坡事件总数及边缘点总数对电力负荷曲线进行降维;当电力负荷曲线的维度达到预设维数时,根据聚类数在电力负荷曲线中选取聚类中心,并计算电力负荷曲线的负荷点到每个聚类中心的SBD距离;根据负荷点到聚类中心的SBD距离,将负荷点划分至距离其最近聚类中心所在类别,并更新每个类别的聚类中心;采用更新后的聚类中心对所有电力负荷曲线的负荷点再次聚类,直至迭代次数达到最大迭代次数或所有类别的负荷点不再发生变化时,输出聚类结果。
Description
技术领域
本发明属于电力系统及其自动化领域,具体涉及一种基于自适应分段聚合近似的电力负荷曲线形态聚类方法。
背景技术
目前现有技术中基于电力用户用电模式提取的聚类技术主要分为以下六类及以下方法的组合算法:
(1)基于划分。指定聚类数目,设定初始分组,对于给定的负荷数据集,通过不断迭代重定位改变初始分组使达到最优,如k-means,k-modoids等。(2)层次聚类。分为凝聚的方法或是分裂的方法。凝聚的方法是从低至上,每次迭代中合并相似组,直至满足终止条件;分裂的方法是自顶向下,每次迭代中大组分裂为小组,直至满足终止条件。
(3)基于密度。若临近区域的密度超过某个阈值,就不停止聚类。(4)基于模型。通过拟合给定的数据集和数据模型。如COBWEB、神经网络方法(self-organization,SOM)等.(5)模糊聚类。样本形态和类数方面的中间性利用各个类别的隶属度来表现,如模糊均值法(fuzzy C-means,FCM)。(6)其他聚类方法。蚂蚁聚类、谱聚类、高斯聚类等。
现有成熟的时间序列降维技术有:离散小波变换、符号聚合近似、分段聚合近似、主成分分析和自组织映射等。但是各种聚类方法和降维技术皆有其不同特点,在实际应用中应根据数据的类型和具体的场景来选择不同的算法以期达到最佳的效果。
电力负荷中,曲线的形态特征尤为重要,上述聚类方法或在衡量曲线相似性时并不十分强调其形态特性,或利用传统距离度量方式进行相似性度量并在其基础上进行划分,但传统距离度量方式难以识别距离相近但形态差异较大的曲线。现有的降维技术多对原始数据序列采用等时间分辨率降维,虽可大大减少算法计算时间,但对于具有不同形态特征和波动特性的电力负荷,一昧采用以上降维技术会导致大量关键信息(如极值、斜率等)的丢失,无法准确描述负荷形态。
发明内容
针对现有技术中的上述不足,本发明提供的基于自适应分段聚合近似的电力负荷曲线形态聚类方法解决了电力用户数据日趋多维化使其计算空间复杂度大大增加和时间序列曲线形态难以进行相似性度量的问题。
为了达到上述发明目的,本发明采用的技术方案为:
提供一种基于自适应分段聚合近似的电力负荷曲线形态聚类方法,其包括:
获取若干电力负荷曲线,对其进行预处理后,并将每条预处理后的电力负荷曲线划分成设定量的数据段;
当数据段的极大值与极小值的差值大于等于预设阈值时,将数据段的状态标记为爬坡事件,并累加所有电力负荷曲线在同一时间段内被标记为爬坡事件的数据段得到爬坡事件总数;
当数据段的负荷点斜率变化幅度大于幅度阈值时,将负荷点标记为边缘点,并累加所有电力负荷曲线同一时间段内数据段的所有边缘点得到总边缘点数;
根据爬坡事件总数与波动阈值及总边缘点数与边缘阈值的大小关系,对电力负荷进行降维操作;
当电力负荷曲线的维度未达到预设维数时,按设定比例扩大预设阈值和幅度阈值,直至电力负荷曲线的维度达到预设维数;
当电力负荷曲线的维度达到预设维数时,根据聚类数在电力负荷曲线中选取聚类中心,并计算电力负荷曲线的负荷点到每个聚类中心的SBD距离:
其中,和分别为两条不同的电力负荷曲线;为电力负荷曲线的互相关值;为的自相关值;为的自相关值;w由-m到m依次递增;
根据负荷点到聚类中心的SBD距离,将负荷点划分至距离其最近的聚类中心所在类别,并更新每个类别的聚类中心:
其中,为更新后的聚类中心;为每类簇的电力负荷;pk为分类后的类簇;为两条互相关值的标幺值;
采用更新后的聚类中心对所有电力负荷曲线的负荷点再次聚类,直至迭代次数达到最大迭代次数或所有类别的负荷点不再发生变化时,输出聚类结果。
进一步地,所述根据爬坡事件总数与波动阈值及总边缘点数与边缘阈值的大小关系,对电力负荷进行降维操作进一步包括:
当同一时间段内的爬坡事件总数小于波动阈值,且边缘点总数小于边缘阈值时,分别采用分段聚合近似方法对同一时间段的所有数据段进行降维处理;
当同一时间段内的爬坡事件总数小于波动阈值,且边缘点总数大于边缘阈值时,分别保留同一时间段的所有数据段的极大值和极小值;
当同一时间段内的爬坡事件总数大于波动阈值,且边缘点总数大于边缘阈值时,同一时间段的所有数据段的负荷点均保持不变。
进一步地,所述SBD距离的获取方法包括:
根据两序列互相关关系,固定电力负荷曲线时间窗,平移另一条电力负荷曲线时间窗,对电力负荷曲线和进行全局对齐:
其中,s为电力负荷曲线时间窗的平移量;xm为电力负荷曲线x上的数据点m;m为电力负荷曲线的数据长度;
根据电力负荷曲线的所有平移量s,s∈[-m,m],得到电力负荷曲线和互相关序列:
其中,xl为电力负荷曲线x的数据点l;yl为电力负荷曲线y的数据点l;k∈[-m,m];w由-m到m依次递增;
当达到最大值时,w的位置相对于的最佳位移量为s=w-m,将电力负荷曲线和互相关序列系数归一化后进行标幺值处理:
其中,为的最大值;为电力负荷曲线x的自相关值;为电力负荷曲线y的自相关值;的波动范围在-1到1之间,1代表两序列高度相关;
根据得到SBD距离的计算公式:
其中,SBD值范围为0至2,0代表两条电力负荷曲线完全相似。
进一步地,对所述电力负荷曲线进行预处理的方法包括:
搜索所述电力负荷曲线中存在缺失或数据异常的电力负荷曲线;
当电力负荷曲线的数据缺失量和异常量达到采集量的预设比例时,删除相应电力负荷曲线;
对余下的电力负荷曲线进行极值归一化处理:
其中,xi为第t时刻的负荷点;xi'为归一化后第t时刻的负荷点;ximin为日最小负荷;ximax为日最大负荷。
进一步地,所述负荷点的斜率变化幅度计算方法包括:
获取负荷点左右邻点负荷点的斜率;
当左右邻点负荷点的斜率同为正值或负值时,负荷点的斜率变化幅度为z=||k1|-|k2||;
当左右邻点负荷点的斜率正负符号相反时,负荷点的斜率变化幅度为z=||k1|+|k2||;
其中,z为斜率变化幅度;k1为负荷点左侧的邻点负荷点的斜率;k2为负荷点右侧的邻点负荷点的斜率。
进一步地,采用分段聚合近似方法对数据段进行降维处理的计算公式为:
其中,n是数据段降维前的维数;m是数据段降维后的维数;m<n,且n能被m整除;为降维后的电力负荷曲线x的数据点i;xj为原始电力负荷曲线x的数据点j。
本发明的有益效果为:本方案通过将电力负荷曲线划分为若干数据段,之后根据数据段的形态特征和波动特性确定数据段的状态及每段包含的边缘点数,之后将所有的电力负荷曲线作为一个整体,对同一时间段内所有数据段的总爬坡事件和边缘点数对电力负荷曲线进行降维,通过这种方式在保证准确描述曲线形态的同时可满足降低数据维度的计算需求,提高本方案的运行速度。
本发明所采用的距离度量方式可更好匹配电力用户时序特性,辨识用户数据受到的尺度、位移的变化以及噪声的干扰。本发明所提取的聚类中心与传统聚类方法利用类簇平均值所提取的聚类中心相比,能更准确反应类簇整体波动趋势。
本发明根据负荷特性进行准确、科学分类,以确保在同一类中的负荷曲线具有相似的负荷特性,并提取用户用电模式。根据不同用户用电模式,可进行负荷可调度容量评估、电价和激励机制制定、负荷综合建模、负荷分组控制、用电异常检测以及负荷预测等多方面运用。本发明作为数据挖掘的预处理步骤具有实际性的重要作用。
附图说明
图1为基于自适应分段聚合近似的电力负荷曲线形态聚类方法的流程图。
图2为200条模拟负荷曲线(加10%噪声)原始分类情况。
图3为采用本方案进行降维后进行聚类得到的聚类簇。
图4为具体实例中采用本方案提供的聚类方法对电力负荷曲线进行聚类后形成的聚类簇。
具体实施方式
下面对本发明的具体实施方式进行描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
参考图1,图1示出了基于自适应分段聚合近似的电力负荷曲线形态聚类方法的流程图;如图1所示,该方法100包括步骤101至步骤108。
在步骤101中,获取若干电力负荷曲线(所有的电力负荷曲线的维数都相等),对其进行预处理后,并将每条预处理后的电力负荷曲线划分成设定量的数据段。
这儿的设定量与电力负荷曲线的维数有关,优选设定量等于电力负荷曲线的维数的四分之一,比如电力负荷曲线的维数为96,那么设定量就等于96/4=24。
在本发明的一个实施例中,对电力负荷曲线进行预处理的方法包括:
搜索电力负荷曲线中存在缺失或数据异常的电力负荷曲线;
当电力负荷曲线的数据缺失量和异常量达到采集量的预设比例(预设比例优选为10%)时,删除相应电力负荷曲线;
对余下的电力负荷曲线进行极值归一化处理:
其中,xi为第t时刻的负荷点;xi'为归一化后第t时刻的负荷点;ximin为日最小负荷;ximax为日最大负荷。
在步骤102中,当数据段的极大值与极小值的差值大于等于预设阈值时,将数据段的状态标记为爬坡事件,并累加所有电力负荷曲线在同一时间段内被标记为爬坡事件的数据段得到爬坡事件总数。
在固定时间窗口,电力用户数据大幅度变化的事件,称之为爬坡事件,其可用之来衡量曲线的波动程度。若在该时间窗口T内,某一条负荷数据的极大值与极小值之差|xi|超过预设阈值τ,则定义变量φi:
在该时间段T内,统计N条负荷φi总值为ψ,则该段时间内爬坡事件总数为ψ。
在步骤103中,当数据段的负荷点斜率变化幅度大于幅度阈值时,将负荷点标记为边缘点,并累加所有电力负荷曲线同一时间段内数据段的所有边缘点得到总边缘点数。
具体地为,假设采用200条采集0-24点用户用电情况的的电力负荷曲线,将其分成24段后,每一数据段表示一个小时的,以0-1点的数据段为例对爬坡事件总数和总边缘点数进行说明:
200条电力负荷曲线在0-1点有200个数据段,若200中存在100个数据段的状态被标记为爬坡时间,那么200条电力负荷曲线在0-1点内的爬坡事件总数为100。
假设200条电力负荷曲线在0-1点的200个数据段中每个数据段存在5个边缘点,那么200电力负荷曲线在0-1点的总边缘点数为1000。
实施时,本方案优选负荷点的斜率变化幅度计算方法包括:
获取负荷点左右邻点负荷点的斜率;
当左右邻点负荷点的斜率同为正值或负值时,负荷点的斜率变化幅度为z=||k1|-|k2||;
当左右邻点负荷点的斜率正负符号相反时,负荷点的斜率变化幅度为z=||k1|+|k2‖;
其中,z为斜率变化幅度;k1为负荷点左侧的邻点负荷点的斜率;k2为负荷点右侧的邻点负荷点的斜率。
在步骤104中,根据爬坡事件总数与波动阈值及总边缘点数与边缘阈值的大小关系,对电力负荷进行降维操作。
在本发明的一个实施例中,根据爬坡事件总数与波动阈值及总边缘点数与边缘阈值的大小关系,对电力负荷进行降维操作进一步包括:
当同一时间段内的爬坡事件总数小于波动阈值,且边缘点总数小于边缘阈值时,分别采用分段聚合近似方法对同一时间段的所有数据段进行降维处理;
其中,采用分段聚合近似方法对数据段进行降维处理的计算公式为:
其中,n是数据段降维前的维数;m是数据段降维后的维数;m<n,且n能被m整除;为降维后的电力负荷曲线x的数据点i;xj为原始电力负荷曲线x的数据点j。
当同一时间段内的爬坡事件总数小于波动阈值,且边缘点总数大于边缘阈值时,分别保留同一时间段的所有数据段的极大值和极小值;
当同一时间段内的爬坡事件总数大于波动阈值,且边缘点总数大于边缘阈值时,同一时间段的所有数据段的负荷点均保持不变。
通过上述方式对电力负荷曲线进行降维处理后,首先可以保证每条电力负荷曲线降维之后,每条的维数都相同;其次,通过这种方式在不改变电力负荷曲线的形态特征及波动特性下可以大幅度降低处理时间。
在步骤105中,当电力负荷曲线的维度未达到预设维数时,按设定比例(优选设定比例为10%)扩大预设阈值和幅度阈值,之后返回步骤102中,直至电力负荷曲线的维度达到预设维数,进入步骤106中。
在步骤106中,当电力负荷曲线的维度达到预设维数时,根据聚类数在电力负荷曲线中任意选取与聚类数相等的电力负荷曲线作为聚类中心,并计算电力负荷曲线的负荷点到每个聚类中心的SBD距离:
其中,和分别为两条不同的电力负荷曲线;为电力负荷曲线的互相关值;为的自相关值;为的自相关值;w由-m到m依次递增。
实施时,本方案优选SBD距离的获取方法包括步骤201至步骤204。
在步骤201中,根据两序列互相关关系,固定电力负荷曲线时间窗,平移另一条电力负荷曲线时间窗,对电力负荷曲线和进行全局对齐:
其中,s为电力负荷曲线的平移量;xm为电力负荷曲线x上的数据点m;m为电力负荷曲线的数据长度;
电力负荷曲线和通过全局对齐后,可以便于两条电力负荷曲线和进行全局形状特征比较。
在步骤202中,根据电力负荷曲线的所有平移量s,s∈[-m,m],得到长度为2m-1的电力负荷曲线和互相关序列:
其中,xl为电力负荷曲线x的数据点l;yl为电力负荷曲线y的数据点l;k∈[-m,m];w由-m到m依次递增。
在步骤203中,当达到最大值时,w的位置相对于的最佳位移量为s=w-m,将电力负荷曲线和互相关序列系数归一化后进行标幺值处理:
其中,为的最大值;为电力负荷曲线x的自相关值;为电力负荷曲线y的自相关值;的波动范围在-1到1之间,1代表两序列高度相关。
在步骤203中,根据得到SBD距离的计算公式:
其中,SBD值范围为0至2,0代表两条电力负荷曲线完全相似。
在步骤107中,根据负荷点到聚类中心的SBD距离,将负荷点划分至距离其最近聚类中心所在类别,并更新每个类别的聚类中心:
其中,为更新后的聚类中心;为每类簇的电力负荷;pk为分类后的类簇;为两条互相关值的标幺值;
在更新每个类别的聚类中心时,可以细化为以下步骤:
提取聚类中心找到与每类时间序列平方和的最小序列,即斯坦纳树优化问题:
其中,为聚类中心点;为实域区间内的同维度任一曲线;为分类后类簇的曲线;为两曲线间的欧式距离;Rm为实域;
互相关方法提取的是两时间序列的相似性,而非差异性,可同化式(1)为一个最大化问题。每次迭代中,利用前迭次代中心作为参考并且利用互相关法将所有序列与参考序列对齐。
其中,为更新后的聚类中心;为每类簇的电力负荷。
在步骤108中,采用更新后的聚类中心对所有电力负荷曲线的负荷点再次聚类,即重复步骤106和107直至迭代次数达到最大迭代次数或所有类别的负荷点不再发生变化时,输出聚类结果。
下面结合实施例对本方案的聚类效果进行说明:
模拟4类典型日负荷曲线集(单峰、双峰、三峰、避峰),分别在4类典型日负荷曲线集的每个采集点上添加一定比例为α的高斯白噪声并部分位移,得到每类50条总计200条的日负荷曲线。
200条模拟负荷曲线(加α=10%噪声)原始分类见图2,采用本方案的聚类方法降维后每类簇负荷曲线如图3所示,其中取时间窗T为1h,预设阈值τ为5,幅度阈值d为2。
采用本方案的方式降维后,将原电力负荷数据由原96维数据降维后为63维数据,和原始数据相比,降维后的数据集仍能较好地反应每类曲线形态特征(单峰、双峰、三峰、避峰)及其波动特性。
下面以具体某个地方的实测数据对本方案和现有常用方法进行对比,以对本方案聚类方法的效果进行进一步说明:
以中国某市2015年4月某工作日实测2800条电力用户日负荷曲线为研究对象,每15min采集一次,每日共计96个量测点。经数据预处理后,本算例共含2737条有效日负荷曲线,在采用本方案步骤102至步骤105进行降维过程中,取时间窗T为1h,预设阈值τ为20,幅度阈值d为5,采用本方案的聚类方法进行聚类后,聚类效果如图4所示。
选取2737条日负荷曲线中任意100条,通过聚类分析有效性指标,程序运行时间综合比较APAA-kShape(本方案的聚类方法)、k-Shape(不降维直接采用本方案的106和107步骤进行聚类)、DTW算法三种算法的性能。
每种算法在其指定聚类数上各运行15次以保证每种算法执行时间和指标判断的客观公正性,取其平均值作为最终结果,结果如表1所示。
表1 APAA-kShape、k-Shape、DTW算法性能对比
从表1中的运行时间来看,三种算法的运行时间均随着聚类数的增加而增加,但APAA-kShape算法在运行速度明显高于k-Shape和DTW算法,其运行时间仅为k-Shape的二分之一,DTW的四分之一。
从聚类有效性指标来看,k-Shape算法与其余两种算法综合相比,SIL值更高,DBI值更小,CH值更高;经降维处理后APAA-kShape算法的聚类有效性指标略逊色k-Shape算法。但APAA-kShape算法和k-Shape算法在三个有效性指标上的表现均明显优于DTW算法。
Claims (6)
1.基于自适应分段聚合近似的电力负荷曲线形态聚类方法,其特征在于,包括:
获取若干电力负荷曲线,对其进行预处理后,并将每条预处理后的电力负荷曲线划分成设定量的数据段;
当数据段的极大值与极小值的差值大于等于预设阈值时,将数据段的状态标记为爬坡事件,并累加所有电力负荷曲线在同一时间段内被标记为爬坡事件的数据段得到爬坡事件总数;
当数据段的负荷点斜率变化幅度大于幅度阈值时,将负荷点标记为边缘点,并累加所有电力负荷曲线同一时间段内数据段的所有边缘点得到总边缘点数;
根据爬坡事件总数与波动阈值及总边缘点数与边缘阈值的大小关系,对电力负荷进行降维操作;
当电力负荷曲线的维度未达到预设维数时,按设定比例扩大预设阈值和幅度阈值,直至电力负荷曲线的维度达到预设维数;
当电力负荷曲线的维度达到预设维数时,根据聚类数在电力负荷曲线中选取聚类中心,并计算电力负荷曲线的负荷点到每个聚类中心的SBD距离:
其中,和分别为两条不同的电力负荷曲线;为电力负荷曲线的互相关值;为的自相关值;为的自相关值;w由-m到m依次递增;
根据负荷点到聚类中心的SBD距离,将负荷点划分至距离其最近的聚类中心所在类别,并更新每个类别的聚类中心:
其中,为更新后的聚类中心;为每类簇的电力负荷;pk为分类后的类簇;为和两条互相关值的标幺值;
采用更新后的聚类中心对所有电力负荷曲线的负荷点再次聚类,直至迭代次数达到最大迭代次数或所有类别的负荷点不再发生变化时,输出聚类结果。
2.根据权利要求1所述的基于自适应分段聚合近似的电力负荷曲线形态聚类方法,其特征在于,所述根据爬坡事件总数与波动阈值及总边缘点数与边缘阈值的大小关系,对电力负荷进行降维操作进一步包括:
当同一时间段内的爬坡事件总数小于波动阈值,且边缘点总数小于边缘阈值时,分别采用分段聚合近似方法对同一时间段的所有数据段进行降维处理;
当同一时间段内的爬坡事件总数小于波动阈值,且边缘点总数大于边缘阈值时,分别保留同一时间段的所有数据段的极大值和极小值;
当同一时间段内的爬坡事件总数大于波动阈值,且边缘点总数大于边缘阈值时,同一时间段的所有数据段的负荷点均保持不变。
3.根据权利要求1所述的基于自适应分段聚合近似的电力负荷曲线形态聚类方法,其特征在于,所述SBD距离的获取方法包括:
根据两序列互相关关系,固定电力负荷曲线时间窗,平移另一条电力负荷曲线时间窗,对电力负荷曲线和进行全局对齐:
其中,s为电力负荷曲线时间窗的平移量;xm为电力负荷曲线x上的数据点m;m为电力负荷曲线的数据长度;
根据电力负荷曲线的所有平移量s,s∈[-m,m],得到电力负荷曲线和互相关序列:
其中,xl为电力负荷曲线x的数据点l;yl为电力负荷曲线y的数据点l;k∈[-m,m];w由-m到m依次递增;
当达到最大值时,w的位置相对于的最佳位移量为s=w-m,将电力负荷曲线和互相关序列系数归一化后进行标幺值处理:
其中,为的最大值;为电力负荷曲线x的自相关值;为电力负荷曲线y的自相关值;的波动范围在-1到1之间,1代表两序列高度相关;
根据得到SBD距离的计算公式:
其中,SBD值范围为0至2,0代表两条电力负荷曲线完全相似。
4.根据权利要求1所述的基于自适应分段聚合近似的电力负荷曲线形态聚类方法,其特征在于,对所述电力负荷曲线进行预处理的方法包括:
搜索所述电力负荷曲线中存在缺失或数据异常的电力负荷曲线;
当电力负荷曲线的数据缺失量和异常量达到采集量的预设比例时,删除相应电力负荷曲线;
对余下的电力负荷曲线进行极值归一化处理:
其中,xi为第t时刻的负荷点;xi'为归一化后第t时刻的负荷点;ximin为日最小负荷;ximax为日最大负荷。
5.根据权利要求1所述的基于自适应分段聚合近似的电力负荷曲线形态聚类方法,其特征在于,所述负荷点的斜率变化幅度计算方法包括:
获取负荷点左右邻点负荷点的斜率;
当左右邻点负荷点的斜率同为正值或负值时,负荷点的斜率变化幅度为z=||k1|-|k2||;
当左右邻点负荷点的斜率正负符号相反时,负荷点的斜率变化幅度为z=||k1|+|k2||;
其中,z为斜率变化幅度;k1为负荷点左侧的邻点负荷点的斜率;k2为负荷点右侧的邻点负荷点的斜率。
6.根据权利要求1所述的基于自适应分段聚合近似的电力负荷曲线形态聚类方法,其特征在于,采用分段聚合近似方法对数据段进行降维处理的计算公式为:
其中,n是数据段降维前的维数;m是数据段降维后的维数;m<n,且n能被m整除;为降维后的电力负荷曲线x的数据点i;xj为原始电力负荷曲线x的数据点j。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810242171.3A CN108596362B (zh) | 2018-03-22 | 2018-03-22 | 基于自适应分段聚合近似的电力负荷曲线形态聚类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810242171.3A CN108596362B (zh) | 2018-03-22 | 2018-03-22 | 基于自适应分段聚合近似的电力负荷曲线形态聚类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108596362A true CN108596362A (zh) | 2018-09-28 |
CN108596362B CN108596362B (zh) | 2021-12-28 |
Family
ID=63627221
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810242171.3A Expired - Fee Related CN108596362B (zh) | 2018-03-22 | 2018-03-22 | 基于自适应分段聚合近似的电力负荷曲线形态聚类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108596362B (zh) |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109754333A (zh) * | 2018-12-21 | 2019-05-14 | 国网江苏省电力有限公司苏州供电分公司 | 一种多区域聚合的地区雷电敏感负荷挖掘方法 |
CN109766950A (zh) * | 2019-01-18 | 2019-05-17 | 东北大学 | 一种基于形态聚类和LightGBM的工业用户短期负荷预测方法 |
CN109934301A (zh) * | 2019-03-22 | 2019-06-25 | 广东电网有限责任公司 | 一种电力负荷聚类分析方法、装置和设备 |
CN110097261A (zh) * | 2019-04-17 | 2019-08-06 | 三峡大学 | 一种判断用户用电异常的方法 |
CN110503145A (zh) * | 2019-08-21 | 2019-11-26 | 广东电网有限责任公司 | 一种基于k-shape聚类的典型负荷曲线获取方法 |
CN110796173A (zh) * | 2019-09-27 | 2020-02-14 | 昆明电力交易中心有限责任公司 | 一种基于改进kmeans的负荷曲线形态聚类算法 |
CN111291782A (zh) * | 2020-01-13 | 2020-06-16 | 上海交通大学 | 一种基于信息累积k-Shape聚类算法的累积负荷预测方法 |
CN111311431A (zh) * | 2020-01-19 | 2020-06-19 | 国网福建省电力有限公司经济技术研究院 | 一种基于分段斜率的负荷曲线形态聚类方法 |
CN112039051A (zh) * | 2020-06-30 | 2020-12-04 | 长沙理工大学 | 一种含双馈风力发电机接入变电站母线负荷的实时建模方法 |
CN112072783A (zh) * | 2020-07-29 | 2020-12-11 | 北京市腾河电子技术有限公司 | 秒级负荷数据在端侧和边缘侧设备间传输的方法和装置 |
CN112149052A (zh) * | 2020-04-30 | 2020-12-29 | 国网湖南省电力有限公司 | 一种基于plr-dtw的日负荷曲线聚类方法 |
CN112381137A (zh) * | 2020-11-10 | 2021-02-19 | 重庆大学 | 新能源电力系统可靠性评估方法、装置、设备及存储介质 |
CN112653126A (zh) * | 2020-11-30 | 2021-04-13 | 中南大学 | 一种电网宽频带振荡在线辨识方法和系统 |
CN112651797A (zh) * | 2020-12-18 | 2021-04-13 | 国网青海省电力公司 | 一种基于聚类算法的典型日供需比曲线形成方法 |
CN113095731A (zh) * | 2021-05-10 | 2021-07-09 | 北京人人云图信息技术有限公司 | 一种基于客流时序聚类优化航班调控方法及系统 |
CN113723481A (zh) * | 2021-08-19 | 2021-11-30 | 吉林大学 | 一种基于符号聚合近似表示的多元负荷分类方法和系统 |
CN114139650A (zh) * | 2021-12-09 | 2022-03-04 | 青海大学 | 一种用户负荷双层聚类方法 |
CN117454255A (zh) * | 2023-12-25 | 2024-01-26 | 陕西奥纳泽建筑工程有限公司 | 一种智慧建筑能耗数据优化存储方法 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103093394A (zh) * | 2013-01-23 | 2013-05-08 | 广东电网公司信息中心 | 一种基于用户用电负荷数据细分的聚类融合方法 |
CN103325071A (zh) * | 2013-06-09 | 2013-09-25 | 浙江大学 | 一种基于密度聚类的用户典型负荷曲线的构建方法 |
CN104680261A (zh) * | 2015-03-16 | 2015-06-03 | 朗新科技股份有限公司 | 基于重点大客户负荷曲线聚类的电力负荷运行控制方法 |
CN104809255A (zh) * | 2015-05-21 | 2015-07-29 | 国家电网公司 | 一种负荷形态获取方法和系统 |
CN104881706A (zh) * | 2014-12-31 | 2015-09-02 | 天津弘源慧能科技有限公司 | 一种基于大数据技术的电力系统短期负荷预测方法 |
CN106447227A (zh) * | 2016-10-31 | 2017-02-22 | 国网上海市电力公司 | 城市电网异常状态分析方法及系统 |
US20170083990A1 (en) * | 2014-05-16 | 2017-03-23 | Accenture Global Services Limited | System, method and apparatuses for identifying load volatility of a power customer and a tangible computer readable medium |
CN107423769A (zh) * | 2017-08-03 | 2017-12-01 | 四川大学 | 基于形态特征的电力负荷曲线自适应聚类方法 |
CN107453346A (zh) * | 2016-05-30 | 2017-12-08 | 中国电力科学研究院 | 一种适用于配电网重构的负荷曲线时段划分方法 |
CN107506878A (zh) * | 2017-10-11 | 2017-12-22 | 华中科技大学 | 一种考虑风光平滑效应的电力系统多源调度方法 |
-
2018
- 2018-03-22 CN CN201810242171.3A patent/CN108596362B/zh not_active Expired - Fee Related
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103093394A (zh) * | 2013-01-23 | 2013-05-08 | 广东电网公司信息中心 | 一种基于用户用电负荷数据细分的聚类融合方法 |
CN103325071A (zh) * | 2013-06-09 | 2013-09-25 | 浙江大学 | 一种基于密度聚类的用户典型负荷曲线的构建方法 |
US20170083990A1 (en) * | 2014-05-16 | 2017-03-23 | Accenture Global Services Limited | System, method and apparatuses for identifying load volatility of a power customer and a tangible computer readable medium |
CN104881706A (zh) * | 2014-12-31 | 2015-09-02 | 天津弘源慧能科技有限公司 | 一种基于大数据技术的电力系统短期负荷预测方法 |
CN104680261A (zh) * | 2015-03-16 | 2015-06-03 | 朗新科技股份有限公司 | 基于重点大客户负荷曲线聚类的电力负荷运行控制方法 |
CN104809255A (zh) * | 2015-05-21 | 2015-07-29 | 国家电网公司 | 一种负荷形态获取方法和系统 |
CN107453346A (zh) * | 2016-05-30 | 2017-12-08 | 中国电力科学研究院 | 一种适用于配电网重构的负荷曲线时段划分方法 |
CN106447227A (zh) * | 2016-10-31 | 2017-02-22 | 国网上海市电力公司 | 城市电网异常状态分析方法及系统 |
CN107423769A (zh) * | 2017-08-03 | 2017-12-01 | 四川大学 | 基于形态特征的电力负荷曲线自适应聚类方法 |
CN107506878A (zh) * | 2017-10-11 | 2017-12-22 | 华中科技大学 | 一种考虑风光平滑效应的电力系统多源调度方法 |
Non-Patent Citations (2)
Title |
---|
成乐祥等: "基于加权K-means聚类和遗传算法的变电站规划", 《江苏电机工程》 * |
欧阳庭辉等: "风电功率爬坡事件预测时间窗选取建模", 《中国机电工程学报》 * |
Cited By (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109754333B (zh) * | 2018-12-21 | 2021-06-08 | 国网江苏省电力有限公司苏州供电分公司 | 一种多区域聚合的地区雷电敏感负荷挖掘方法 |
CN109754333A (zh) * | 2018-12-21 | 2019-05-14 | 国网江苏省电力有限公司苏州供电分公司 | 一种多区域聚合的地区雷电敏感负荷挖掘方法 |
CN109766950A (zh) * | 2019-01-18 | 2019-05-17 | 东北大学 | 一种基于形态聚类和LightGBM的工业用户短期负荷预测方法 |
CN109766950B (zh) * | 2019-01-18 | 2023-07-14 | 东北大学 | 一种基于形态聚类和LightGBM的工业用户短期负荷预测方法 |
CN109934301A (zh) * | 2019-03-22 | 2019-06-25 | 广东电网有限责任公司 | 一种电力负荷聚类分析方法、装置和设备 |
CN109934301B (zh) * | 2019-03-22 | 2022-10-04 | 广东电网有限责任公司 | 一种电力负荷聚类分析方法、装置和设备 |
CN110097261A (zh) * | 2019-04-17 | 2019-08-06 | 三峡大学 | 一种判断用户用电异常的方法 |
CN110097261B (zh) * | 2019-04-17 | 2022-11-18 | 三峡大学 | 一种判断用户用电异常的方法 |
CN110503145A (zh) * | 2019-08-21 | 2019-11-26 | 广东电网有限责任公司 | 一种基于k-shape聚类的典型负荷曲线获取方法 |
CN110796173A (zh) * | 2019-09-27 | 2020-02-14 | 昆明电力交易中心有限责任公司 | 一种基于改进kmeans的负荷曲线形态聚类算法 |
CN111291782A (zh) * | 2020-01-13 | 2020-06-16 | 上海交通大学 | 一种基于信息累积k-Shape聚类算法的累积负荷预测方法 |
CN111291782B (zh) * | 2020-01-13 | 2022-09-09 | 上海交通大学 | 一种基于信息累积k-Shape聚类算法的累积负荷预测方法 |
CN111311431A (zh) * | 2020-01-19 | 2020-06-19 | 国网福建省电力有限公司经济技术研究院 | 一种基于分段斜率的负荷曲线形态聚类方法 |
CN111311431B (zh) * | 2020-01-19 | 2022-05-13 | 国网福建省电力有限公司经济技术研究院 | 一种基于分段斜率的负荷曲线形态聚类方法 |
CN112149052A (zh) * | 2020-04-30 | 2020-12-29 | 国网湖南省电力有限公司 | 一种基于plr-dtw的日负荷曲线聚类方法 |
CN112149052B (zh) * | 2020-04-30 | 2023-07-11 | 国网湖南省电力有限公司 | 一种基于plr-dtw的日负荷曲线聚类方法 |
CN112039051A (zh) * | 2020-06-30 | 2020-12-04 | 长沙理工大学 | 一种含双馈风力发电机接入变电站母线负荷的实时建模方法 |
CN112072783A (zh) * | 2020-07-29 | 2020-12-11 | 北京市腾河电子技术有限公司 | 秒级负荷数据在端侧和边缘侧设备间传输的方法和装置 |
CN112072783B (zh) * | 2020-07-29 | 2022-11-08 | 北京市腾河电子技术有限公司 | 秒级负荷数据在端侧和边缘侧设备间传输的方法和装置 |
CN112381137A (zh) * | 2020-11-10 | 2021-02-19 | 重庆大学 | 新能源电力系统可靠性评估方法、装置、设备及存储介质 |
CN112381137B (zh) * | 2020-11-10 | 2024-06-07 | 重庆大学 | 新能源电力系统可靠性评估方法、装置、设备及存储介质 |
CN112653126A (zh) * | 2020-11-30 | 2021-04-13 | 中南大学 | 一种电网宽频带振荡在线辨识方法和系统 |
CN112651797B (zh) * | 2020-12-18 | 2024-04-12 | 国网青海省电力公司 | 一种基于聚类算法的典型日供需比曲线形成方法 |
CN112651797A (zh) * | 2020-12-18 | 2021-04-13 | 国网青海省电力公司 | 一种基于聚类算法的典型日供需比曲线形成方法 |
CN113095731A (zh) * | 2021-05-10 | 2021-07-09 | 北京人人云图信息技术有限公司 | 一种基于客流时序聚类优化航班调控方法及系统 |
CN113723481A (zh) * | 2021-08-19 | 2021-11-30 | 吉林大学 | 一种基于符号聚合近似表示的多元负荷分类方法和系统 |
CN114139650A (zh) * | 2021-12-09 | 2022-03-04 | 青海大学 | 一种用户负荷双层聚类方法 |
CN117454255B (zh) * | 2023-12-25 | 2024-03-29 | 陕西奥纳泽建筑工程有限公司 | 一种智慧建筑能耗数据优化存储方法 |
CN117454255A (zh) * | 2023-12-25 | 2024-01-26 | 陕西奥纳泽建筑工程有限公司 | 一种智慧建筑能耗数据优化存储方法 |
Also Published As
Publication number | Publication date |
---|---|
CN108596362B (zh) | 2021-12-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108596362B (zh) | 基于自适应分段聚合近似的电力负荷曲线形态聚类方法 | |
Kumar et al. | Image based leaf segmentation and counting in rosette plants | |
CN107515895B (zh) | 一种基于目标检测的视觉目标检索方法与系统 | |
CN108805213B (zh) | 计及小波熵降维的电力负荷曲线双层谱聚类方法 | |
CN110781332A (zh) | 基于复合聚类算法的电力居民用户日负荷曲线聚类方法 | |
CN110097060B (zh) | 一种面向树干图像的开集识别方法 | |
CN112613536B (zh) | 一种基于smote和深度学习的近红外光谱柴油牌号识别方法 | |
CN101789005A (zh) | 一种基于感兴趣区域的图像检索方法 | |
CN101526994B (zh) | 一种与采集设备无关的指纹图像分割方法 | |
CN102663447B (zh) | 基于判别相关分析的跨媒体检索方法 | |
CN113920472B (zh) | 一种基于注意力机制的无监督目标重识别方法及系统 | |
Yuvaraj et al. | Shape, Color and Texture Based CBIR System Using Fuzzy Logic Classifier. | |
Golge et al. | Conceptmap: Mining noisy web data for concept learning | |
CN116451097A (zh) | 一种自适应确定聚类数的电力负荷数据加权增量聚类方法 | |
CN109543546A (zh) | 基于深度序分布回归的步态年龄估计方法 | |
CN114139650A (zh) | 一种用户负荷双层聚类方法 | |
CN108985346A (zh) | 融合低层图像特征及cnn特征的现勘图像检索方法 | |
CN102779271B (zh) | 基于谱稀疏典型相关分析的表情语义稀疏量化方法 | |
CN112215490A (zh) | 一种基于相关性系数改进K-means的电力负荷聚类分析方法 | |
CN115273645B (zh) | 一种室内面要素自动聚类的地图制图方法 | |
CN105528793A (zh) | 一种高空间分辨率遥感影像的分割方法及系统 | |
Yan et al. | A clustering method for power time series curves based on improved self-organizing mapping algorithm | |
Tang et al. | Typical power load profiles shape clustering analysis based on adaptive piecewise aggregate approximation | |
CN113159137A (zh) | 一种燃气负荷聚类方法及装置 | |
Chunni | SVM visual classification based on weighted feature of genetic algorithm |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20211228 |
|
CF01 | Termination of patent right due to non-payment of annual fee |