CN106055918B - 一种电力系统负荷数据的辨识及修正方法 - Google Patents

一种电力系统负荷数据的辨识及修正方法 Download PDF

Info

Publication number
CN106055918B
CN106055918B CN201610614563.9A CN201610614563A CN106055918B CN 106055918 B CN106055918 B CN 106055918B CN 201610614563 A CN201610614563 A CN 201610614563A CN 106055918 B CN106055918 B CN 106055918B
Authority
CN
China
Prior art keywords
load
data
clustering
curve
hill climbing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610614563.9A
Other languages
English (en)
Other versions
CN106055918A (zh
Inventor
孔祥玉
胡启安
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin Jintong Electric Power Technology Co ltd
Original Assignee
Tianjin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin University filed Critical Tianjin University
Priority to CN201610614563.9A priority Critical patent/CN106055918B/zh
Publication of CN106055918A publication Critical patent/CN106055918A/zh
Application granted granted Critical
Publication of CN106055918B publication Critical patent/CN106055918B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16ZINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS, NOT OTHERWISE PROVIDED FOR
    • G16Z99/00Subject matter not provided for in other main groups of this subclass

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Supply And Distribution Of Alternating Current (AREA)

Abstract

本发明公开了一种电力系统负荷数据辨识及修复方法:首先,根据用户历史负荷数据,基于爬山法确定样本数据的聚类数及初始聚类中心;其次,基于模糊C均值聚类算法获取历史负荷数据的最终聚类中心及特征曲线;然后,对每一类负荷特征曲线进行加工,获得该类负荷曲线正常数据所处于的可行域区间;随后,根据与每一类负荷特征曲线的相关系数,确定待测负荷曲线的所属类别;最后,基于可行域区间及判定出所属类别的待测负荷曲线,对待测负荷数据进行不良数据辨识及修正。本发明方法以模糊C均值算法为基础,运用爬山函数法,同时确定聚类数和聚类中心以提高聚类效率,并且解决了在初始聚类中心确定及不良数据的辨识效果判断的随机性。

Description

一种电力系统负荷数据的辨识及修正方法
技术领域
本发明涉及电力系统,特别涉及一种电力系统负荷数据的辨识及修正方法。
背景技术
随着电力系统的发展,不同类型的智能测量设备逐渐被应用在工程实际中,电力系统中负荷用电情况将会变得易于测量和感知。负荷数据作为电力系统最重要的基础数据之一,其精确与否,能直接影响到电力系统状态估计、负荷预测、配网优化、需求侧管理等结果的可信度,对电力系统的分析计算和运行决策有直接影响。然而在实际中,由于测量表记的故障、外部通信线路故障、外界干扰、以及用户用电设备的偶然故障等未知因素,电力系统所测量的负荷数据不是全都可靠的,必然会含有一些不良数据,如何辨识和修正这些不良数据成为电力系统领域关注的重点。
数据辨识方法主要分为两大类:传统方法和智能方法。传统方法包括目标函数极值检测法、加权残差或标准化残差检测法、量测量突变检测法等[1-2],此类方法容易引起残差淹没或残差被污染等现象,且有些方法计算量较大;近些年发展起来的基于数据挖掘的一些智能算法,被很好的应用到电力系统不良数据辨识中,包括聚类分析法、神经网络算法、蚁群算法等,这些方法将旧的数据检测原理同新的数据挖掘方法相结合,形成了新的数据辨识方法,极大的提高了数据辨识的速度、精度和准确度。其中聚类分析法是一种研究样品或指标分类的多元统计方法,已广泛用于识别数据内在结构、多关系数据挖掘中。
将聚类算法引入到电力系统不良数据辨识中已经有了一些研究:如基于等价矩阵的模糊聚类算法,以用来检测电力系统实时运行状态下的不良数据,它将测量数据的标准差和相邻时刻的测量差值作为特征值,通过寻找最佳阈值,将量测数据进行动态聚类,进而辨识出不良数据[1]。或者将K-means聚类算法引入到电力系统不良数据的辨识中,以某一节点负荷数据作为研究对象,结合有效性准则提取日特征曲线,最后利用日负荷曲线的横向相似性和纵向相似性进行数据辨识[3]。但上述方法在初始聚类中心是随机选取的,聚类数目的确定过程中含有偶然因素,导致后期辨识可能在时间开销上比较大;或者在不良数据的辨识上及效果判断上有一定的主观因素,部分情况下需要根据经验来选取平滑参数,具有一定的局限性。
另一方面,为了准确地反映负荷特性,对不同负荷点的不同时刻应当有不同的负荷模型,或即使建立同样的模型类,其模型参数也将具有很大的分散性,这是由综合负荷的特点所决定的必然结果;然而从工程实用的角度讲,同一电网所采用的负荷模型应尽可能地简、少,否则使用时就会无所适从。这就是精确的负荷建模与工程应用要求的突出矛盾。
发明内容
本发明的目的是克服现有技术中的不足,提供一种电力系统负荷数据的辨识及修正方法。本发明方法以模糊C均值算法为基础,运用爬山函数法,同时确定聚类数和聚类中心以提高聚类效率,并且解决了在初始聚类中心确定及不良数据的辨识效果判断的随机性。
本发明所采用的技术方案是:一种电力系统负荷数据的辨识及修正方法,包括以下步骤:
(1)根据一段时间内的用户历史负荷数据,基于爬山法确定样本数据的聚类数及初始聚类中心;
(2)确定聚类数及初始聚类中心后,基于模糊C均值聚类算法获取历史负荷数据的最终聚类中心及特征曲线;
(3)对步骤(2)获得的每一类负荷特征曲线进行加工,获得该类负荷曲线正常数据所处于的可行域区间;
(4)根据与步骤(2)获得的每一类负荷特征曲线的相关系数,确定待测负荷曲线的所属类别;
(5)基于步骤(3)获得的可行域区间及步骤(4)判定出所属类别的待测负荷曲线,对待测负荷数据进行不良数据辨识及修正,以用于电力系统的分析计算和运行决策。
步骤(1)中,所述基于爬山法确定样本数据的聚类数及初始聚类中心的步骤具体为:
构建爬山函数,将每一个样本数据代入爬山函数,使爬山函数取得最大值的为第一个初始聚类中心;
修正爬山函数,消除第一个初始聚类中心对爬山函数的影响,将样本数据逐一代入修正后的爬山函数,取得第二个初始聚类中心;
重复上述第二步,直至获得所有初始聚类中心,并确定聚类数。
其中,爬山函数停止修正判定条件为:第t次的爬山函数最大值与第一次爬山函数最大值比值小于给定参数。
步骤(2)中,所述基于模糊C均值聚类算法获取历史负荷数据的最终聚类中心及特征曲线的步骤具体为:
基于爬山法获取的聚类数及初始聚类中心,并初始化隶属度矩阵及聚类参数;
通过迭代求解的方式,求取样本与聚类中心的隶属度矩阵,并生成新的聚类中心,最后一次迭代生成的聚类中心即为最终聚类中心;
根据负荷分类和最终聚类中心形成负荷特征曲线,所述负荷分类即爬山法获取的聚类数。
其中,迭代停止判定条件为:各个样本到各个聚类中心距离的加权平方和的最小值小于给定参数。
步骤(3)中,所述获得每一类负荷曲线正常数据所处于的可行域区间的步骤具体为:
提取所有历史样本数据在同一测量时刻的最大负荷值及最小负荷值;
利用提取出的最大负荷及最小负荷值、结合聚类生成的每一类负荷特征曲线,计算出所有测时刻正常负荷数据所处于的上下限;
基于所有测量时刻的上下限,生成每一类负荷曲线其正常数据所处于的可行域区间。
步骤(4)中,所述确定待测负荷曲线的所属类别的方法具体为:计算待测负荷曲线与每一类负荷特征曲线的相关系数,待测负荷曲线属于使相关系数取得最大值的类。
步骤(5)中,所述不良数据辨识的方法具体为:将待测负荷曲线映射到所属类可行域区间,在特征曲线上部判断其上限,在特征曲线下部判断其下限,映射结果处于可行域上下限之间的为正常数据,反之为不良数据。
步骤(5)中,对所述不良数据采用纵向比较修正法进行修正。
本发明的有益效果是:
1、从聚类流程可以看出,要实现聚类其前提条件是要知道初始的聚类中心及初始聚类数,因此如何确定初始的聚类中心及初始的聚类数是关键。目前较为普遍的方法是采用遗传算法和模拟退火算法的局部搜索能力,来确定初始聚类中心,再利用聚类数通常用有效性函数,来确定聚类数目,这样分开确定,在数据量庞大且维数较高时则显得较为复杂。本发明采用数学中一种比较简单的爬山函数法来同时确定初始聚类中心及聚类数,该方法在一定程度上简化现有算法的复杂程度,提高了聚类效率。
2、基于模糊C均值的聚类算法为解决不良数据辨识问题提供了一种新思路,通常模糊聚类算法的聚类效果会优于K均值聚类和谱系聚类,并且相较于SOM简单,是一种比较适合于负荷曲线聚类的算法,运用此类算法时关键的一步就是预先确定聚类数。本发明在文献[4]的基础上以模糊C均值算法(FCM)为基础,运用数学中的一种爬山函数法,将每一组数据都看成潜在的聚类中心,最终能同时确定聚类数和潜在的聚类中心,在此基础上通过模糊聚类算法,提取历史数据的聚类曲线及负荷的特征曲线,然后根据负荷曲线及历史负荷数据确定负荷数据能在特征曲线上下波动的范围,结合不良数据在时间序列上的奇异行和不规则性,确定不良数据。
3、本发明方法,在保证聚类算法的聚类效果时,利用爬山法首先确定了初始聚类中心及聚类数,提高了聚类的效率。该方法避开了以往类似方法所有时刻负荷数据用单一阈值区间进行判定的缺点,通过训练聚类后的历史负荷数据,得到了不同采样时刻点,正常数据变化的范围,最终形成了正常数据的可行域,并在获得各类特征曲线的同时,完成了对负荷曲线的聚类。
4、采用本发明方法,能辨识出由于量测表记故障、外界干扰、用户用电设备偶然故障等因素引起的量测负荷数据异常,并进行近似修正,能提高辨识效率,有助于电力系统的分析计算和运行决策。
附图说明
图1:本发明电力系统负荷数据的辨识及修正方法流程图;
图2:本发明电力系统负荷数据的辨识及修正方法计算流程示意图;
图3:本发明算例第一类负荷曲线及其特征曲线示意图;
图4:本发明算例第二类负荷曲线及其特征曲线示意图;
图5:本发明算例第三类负荷曲线及其特征曲线示意图;
图6:本发明算例第一类可行域示意图;
图7:本发明算例第二类可行域示意图;
图8:本发明算例第三类可行域示意图;
图9:本发明单点不良数据时待测负荷曲线及其特征曲线示意图;
图10:本发明单点不良数据时待测负荷曲线映射到可行域后的结果示意图;
图11:本发明单点不良数据时修复后的负荷曲线映射到可行域后的结果示意图;
图12:本发明多点不良数据时待测负荷曲线及其特征曲线示意图;
图13:本发明多点不良数据时待测负荷曲线映射到可行域后的结果示意图;
图14:本发明多点不良数据时修复后的负荷曲线映射到可行域的结果示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面对本发明实施方式作进一步的详细描述。
本发明提供一种结合爬山及模糊聚类的负荷数据辨识及修正方法:以模糊C均值算法为基础,运用爬山函数法,将每一组数据都看成潜在的聚类中心,同时确定聚类数和潜在的聚类中心,在此基础上通过模糊聚类算法,提取历史数据的聚类曲线及负荷的特征曲线,然后根据负荷曲线及历史负荷数据确定负荷数据能在特征曲线上下波动的范围,结合不良数据在时间序列上的奇异行和不规则性,确定不良数据。下面对本方法进行详细的描述:
一种电力系统负荷数据的辨识及修正方法,参见图1,包括以下步骤:
101:根据一段时间内的用户历史负荷数据,基于爬山法确定样本数据的聚类数及初始聚类中心。
所述基于爬山法确定样本数据的聚类数及初始聚类中心的步骤具体为:(a)构建爬山函数,将每一个样本数据代入爬山函数,使爬山函数取得最大值的为第一个潜在聚类中心;(b)消除第一个聚类中心对爬山函数的影响并修正爬山函数,将样本数据逐一代入修正后的爬山函数,使之最大的样本数据为第二个潜在聚类中心;(c)重复步骤(b),消除上一个潜在聚类中心对爬山函数的影响并修正爬山函数,计算是时爬山函数取得最大值的样本数据为一个聚类中心,当第t次的爬山函数最大值与第一次爬山函数最大值比值小于给定参数,停止修正爬山函数,此时,获得所有初始聚类中心,并确定聚类数,其中,最终聚类数等于潜在的初始聚类中心个数。
102:确定聚类数及初始聚类中心后,基于模糊C均值聚类算法获取历史负荷数据的最终聚类中心及特征曲线。
所述基于模糊C均值聚类算法获取历史负荷数据的最终聚类中心及特征曲线的步骤具体为:(a)初始化隶属度矩阵及聚类参数,基于爬山法获取的聚类数及初始聚类中心;(b)通过迭代求解的方式,求取样本与聚类中心的隶属度矩阵,并生成新的聚类中心,当各个样本到各个聚类中心距离的加权平方和的最小值小于给定参数时,迭代停止,聚类完成,最后一次迭代生成的聚类中心即为最终聚类中心;(c)根据负荷分类和最终聚类中心形成负荷特征曲线,其中,每一聚类中心采样点之间的连线形成的曲线即为负荷特征曲线。
103:对步骤102获得的每一类负荷特征曲线进行加工,获得该类负荷曲线正常数据所处于的可行域区间。
所述获得每一类负荷曲线正常数据所处于的可行域区间的步骤具体为:(a)提取所有历史样本数据在同一测量时刻的最大负荷值及最小负荷值;(b)利用提取出的最大负荷及最小负荷值、结合聚类生成的每一类负荷特征曲线,计算出所有测时刻正常负荷数据所处于的上下限;(c)基于所有测量时刻的上下限,生成每一类负荷曲线其正常数据所处于的可行域区间。
104:根据与步骤102获得的每一类负荷特征曲线的相关系数,确定待测负荷曲线的所属类别。
所述确定待测负荷曲线的所属类别的方法具体为:计算待测负荷曲线与每一类负荷特征曲线的相关系数,待测负荷曲线属于使相关系数取得最大值的类。
105:基于步骤103获得的可行域区间及步骤104判定出所属类别的待测负荷曲线,进行不良数据辨识及修正。
所述不良数据辨识的方法具体为:将待测负荷曲线映射到所属类可行域区间,在特征曲线上部判断其上限,在特征曲线下部判断其下限,映射结果处于可行域上下限之间的为正常数据,反之为不良数据。
对所述不良数据采用纵向比较修正法进行修,修正后数据为该测量时刻数据与前一测量时刻数据之差加上前一天该测量时刻的前一测量时刻的历史数据。
下面结合具体的计算公式,对上述方案进行详细描述:
201:基于爬山法确定样本数据的聚类数及初始聚类中心。
2011:构建爬山函数。
样品集X中每一个样品都可能成为潜在的聚类中心,定义爬山函数的泛式为:
Figure GDA0001914212080000071
其中,α为正数,表征的是vi以距离的形式对M值的大小的影响,越大表明数据越集中,分类越精细。M越大,说明聚类中心vi与样品的距离越小,所以将能使M取得较大值的vi作为聚类中心。
2012:获得聚类数c和初始的聚类中心V0
对于可能成为聚类中心的xp而言,上式变为:
Figure GDA0001914212080000072
Figure GDA0001914212080000073
(
Figure GDA0001914212080000074
是样品集的某一个样品)时,爬山函数取得最大值,此时
Figure GDA0001914212080000075
可取为第一个聚类中心,令
Figure GDA0001914212080000077
在寻找其他的聚类中心时,要消除
Figure GDA0001914212080000078
的影响,此时爬山函数变为:
Figure GDA0001914212080000081
对上述爬山函数进行求解,获得第二个分类的爬山函数最大值
Figure GDA0001914212080000082
及其对应的负荷样本
Figure GDA0001914212080000083
并令c=2,
Figure GDA0001914212080000084
在求取初始聚类中心的过程中,第t次的爬山函数为:
Figure GDA0001914212080000085
其中,
Figure GDA0001914212080000086
为新的爬山函数,
Figure GDA0001914212080000087
是上一步的爬山函数,
Figure GDA0001914212080000088
Figure GDA0001914212080000089
的最大值。基于此式可求出新的聚类中心。
Figure GDA00019142120800000810
则寻找初始聚类中心的过程就结束了;否则,令c=t,同时令t=t+1,基于式(4)构建新的爬山函数。
经过不断的迭代就可以将所有样品分成了c类,并获得聚类数c和初始的聚类中心
Figure GDA00019142120800000812
上述初始聚类中心V0是基于样本的初始聚类中心,是X的一个子集,并非真正意义的负荷数据中心。权重指标β和收敛系数δ的值对分类均有影响。β值若很大容易使聚类重合;若取值较小,则会导致分类量变大,典型的β可取4、8、16等;δ的影响爬山法的收敛性,取值越小则聚类数会越多,反之则越少,典型的δ值可取0.15。
202:基于模糊C均值聚类方法获得最终负荷聚类中心和特征曲线。
2021:初始化隶属度矩阵。基于由爬山法获取的聚类数目c初始化隶属度矩阵。方法是先用随机生成的方法生成随机矩阵R:
之后基于式(4)初始化隶属度矩阵U0中的元素:
Figure GDA00019142120800000814
隶属度矩阵U=(uij)描述样品与聚类中心的关系,则可生成一个uij(uij∈[0,1])来表示对于第j个样品xj与第i个聚类中心vi的关系用隶属度。上述求解方法可以满足:
Figure GDA0001914212080000091
2022:更新聚类中心元素和隶属度矩阵元素。根据式(8)计算新的聚类中心元素vi及新的隶属度矩阵元素uij
Figure GDA0001914212080000092
式中,w为加权指数,其取值能影响聚类的效果,一般样本可分性越好的时候,w越大,可分性越差时w越小[5]。w取值范围为[1,+∞],实际应用中,w取值范围可以限制在[1.5,2.5]。
2023:获得聚类中心验证指标。以各个样本到各个聚类中心距离的加权平方和的最小值为目标函数:
Figure GDA0001914212080000093
2024:对于负荷聚类效果进行校验。如果Jw(U,V)<ε,则结束;否则,转步骤2022,更新聚类中心元素和隶属度矩阵元素。
2025:输出负荷分类c和描述负荷特性的聚类中心V,形成负荷特征曲线。
上述不断重复的迭代过程,直到目标函数小于给定的正数ε时迭代结束。ε的取值影响负荷聚类的精度,若取值较小,则算法需要较多的计算量。与收敛系数δ可取相同的值,典型的值为0.15。此外,所有样品数据是根据最终的聚类结果来获取的,根据最终迭代获取的隶属度矩阵Uc×n,每个样品属于其与每个聚类中心隶属度最大的那个类。
203:对每一类型的负荷特征曲线进行加工,获得该类负荷曲线正常数据所处于的可行域区间。
对于采样点为m的负荷数据(若15分钟为一个采样点,则m=96),对于获得的c个聚类中心,对应的特征曲线为vi={vi,1,vi,2,…,vi,m}。这时再通过训练已经聚类好的样本负荷曲线及特征曲线来得到一个正常符合数据存在的可行域,具体步骤为:
2031:对于一个具有n个历史负荷数据的样品集合:X={x1,x2,…,xn},在经过上述的聚类过程后,可以计算出每一类负荷数据在同一时刻的最大值和最小值:
Figure GDA0001914212080000101
2032:对于聚类完成后形成的第i类特征曲线vi:(vi,1,vi,2,…,vi,m),计算出可行域的上下限:
Figure GDA0001914212080000102
2033:形成了一个可行域矩阵,对于第i类曲线其可行域矩阵为:
可行域矩阵的每一列元素,表征的是该时刻负荷数据处于正常曲线模式的阈值范围不同采样时刻的阈值范围也是不同的,阈值上下限的变化趋势与每一类负荷特征曲线紧密相关。计算出待测负荷曲线要处在正常曲线模式时,每一采样时刻的负荷数据必须属于的阈值范围,它与特征曲线紧密相关。式(12)计算
Figure GDA0001914212080000105
中的每一列元素是结合了负荷曲线的横向相似性和纵向相似性的特征[6],利用聚类后的特征曲线进行计算的结果。
204:根据与每一类负荷特征曲线的相关系数,确定待测负荷曲线的所属类别。
确定待测负荷曲线的所属类别,即确定待测负荷数据的所属类别。对于待测负荷数据xnew=(xnew,1,xnew,2,…,xnew,m),确定它所属的类别,用相关系数来判断。对于两个长度相同的向量a和b相关程度的指标,用相关系数r(a,b)来表示:
其中,
Figure GDA0001914212080000112
为a和b的协方差,
Figure GDA0001914212080000113
分别为向量a和b的自方差,
Figure GDA0001914212080000115
Figure GDA0001914212080000116
分别为向量a和b的均值。
根据(13)式计算xnew与每一个聚类中心vi的相关系数r(xnew,vi),待测负荷数据xnew属于使相关系数r(xnew,vi)取得最大值的类,即获得待测负荷曲线的所属类别。
205:进行不良数据辨识及修正。
2051:确定待测负荷曲线所属类别后,进行如下判断:在特征曲线上部的数据判断是否越上限,在特征曲线下部的数据判断是否越下限。待测数据,当第j个分量满足xnew,j≥vi,j时,此时待测负荷曲线在特征曲线上部,利用下式计算上限:
Figure GDA0001914212080000117
反之当第j个分量满足xnew,j≤vi,j时,待测负荷曲线在特征曲线下部,利用下式计算下限:
Figure GDA0001914212080000118
当上下限均在可行域范围内时,则认为待检数据是正常的,无不良数据。当出现越限情况时,即可辨识出不良数据。
2052:采用不同类型的修改方法对不良数据进行修正。
由于负荷数据出错原因多样,一般对于不良数据有多种修正还原方法,主要有:横向比较修正法、纵向比较修正法、曲线置换法、插值法、多源数据对比替代法、功率平衡法等。本实施例采用纵向比较修正法对不良数据进行修正,其优点是即使偶有正常的负荷数据被误检为异常数据,用这种方法调整也不会出现大的偏差。
对于采集的样本负荷曲线为xi=(xi,1,xi,2,…,xi,m),若检测其中第j个负荷采集量xi,j发生异常,则将其修正的公式为:
Figure GDA0001914212080000121
其中,
Figure GDA0001914212080000122
Figure GDA0001914212080000123
分别为前一天该样本在第j和第j-1时刻的历史数据。算例和分析
算例样本数据来源于某市半月的部分商业用户历史负荷数据,该数据集中的每个样本数据含有96个采样点,每隔15min采集一次负荷数据,第一个点为凌晨00:00的数据,之后是00:15,以此类推。
根据给定的样本数据,利用爬山法来确定初始的聚类中心。根据式(2),算出了第一个初始化聚类中心(取经验值α=4,β=4),为第22个样品,其实在负荷曲线图上可以观察到在这个样品负荷曲线附近,负荷曲线表现为比较的密集。然后根据式(3),确定了又一个聚类中心第16个样品,利用这种方法,直到满足收敛条件时(取经验值δ=0.15),这个过程结束,最终找到了初始的聚类中心为三个,分别是22、16、36个数据样品点,这样就可以确定聚类数为3。确定了初始聚类中心及聚类数之后,根据式(6)来进行初始隶属度矩阵U0的运算,之后就是式(8)、(9)的迭代,这个过程就是模糊聚类的过程。取加权系数w=2,并且计算新的聚类中心vi。对于每一次的迭代运算,都将计算目标函数Jw(U,V)的值,当Jw(U,V)≤ε(这里取ε=1.0×10-6)时,则判定迭代过程结束,聚类结束。根据最终的隶属度矩阵U来判断每个样品与新的聚类中心之间的关系,将样品负荷曲线进行聚类,聚类结果如图3、图4和图5所示。
图3、图4和图5中的虚线为聚类后的样品负荷曲线,粗实线为负荷特征曲线。完成上述工作后,就要利用上述结果,来训练生成能对不良数据进行判别的可行域。
对于聚类后的数据,首先对第一类负荷曲线进行分析。在96固定采样时刻的数据中,对每一时刻的数据进行纵向分析,例如对第一个时刻采样点,也就是00:00的数据,计算出在第一类数据中所有样品数据在00:00的值,找出最大值
Figure GDA0001914212080000131
和最小值
Figure GDA0001914212080000132
用此法依次找出其他时刻的类里最大值
Figure GDA0001914212080000133
和最小值
Figure GDA0001914212080000134
最后得到的就是式(10)的所有
Figure GDA0001914212080000135
Figure GDA0001914212080000136
接下来就是相同的方法对第二类和第三类数据进行处理。对这些数据进行处理后,可以根据式(11)来计算每一类负荷曲线的可行域的上下限
Figure GDA0001914212080000137
Figure GDA0001914212080000138
对每一类负荷数据的可行域计算后,最终就得到了每一类负荷曲线的可行域矩阵。对于样本数据的计算得到了如图6、图7和图8所示的结果。
先将待测负荷数据经过分类,然后与负荷特征曲线进行比较后,处在两条曲线之间的数据是正常数据,处在两条曲线之外的数据被认为是不良数据。
进行不良数据辨识及修复,待测负荷数据选取2015年该地1月份下旬的数据。首先将1月16日的数据进行测试,将该日的第6个采样点的数据增大70%,这点的数据将变为不良数据。然后判断该负荷曲线所属的大类,计算该负荷曲线与每条特征曲线的相关系数,两条曲线越相似,则相关系数越大,据此可以判定负荷曲线所属的大类。经过测试发现该负荷曲线与第二类特征曲线相似度最大,如图9所示。
根据式(14)、(15)将待测负荷曲线映射到可行域中如虚线所示,比较待测负荷曲线映射后的结果是否全部在可行域中,对于可行域矩阵,其上界
Figure GDA0001914212080000139
和下界
Figure GDA00019142120800001310
结果如图10所示。明显可知第六个采样点的数据明显越过上限,据此认为这个数据A为不良数据。根据式(16)对其进行修复,修复后结果如图11虚线所示。可以看出,修复结果是比较理想的,映射后的负荷曲线处于可行域中。
当该日的96个采样点中出现了多个不良负荷数据时,把第6、11、20、30、41个数据分别增大70%,第15,25点减小70%。按照上述方法,首先运用相关系数法,判断其所属的大类,其异变后的负荷曲线及所属特征曲线如图12所示。
将异常负荷曲线映射到可行域之间,将用式(14)、(15)映射后的值与可行域矩阵上下界注意进行比对,这样异常数据点与正常数据相比,将显现出明显的区别。其结果如图13中虚线所示。可以明显看出,在数据发生异常的点,其映射后的结果都明显已越过了可行域的上下限,据此判断出这些异常数据。将辨识出的异常数据依据(16)式进行修复,修复后的负荷曲线映射到可行域内的结果如图14虚线所示。从图可以看出,越限点基本消除,异常数据的修复实现了一个比较好的修复效果。
本发明方法对电力系统负荷数据的聚类分析提出了一种简单行之有效的数据辨识及修复方法,在保证聚类算发的聚类效果时,利用爬山法首先确定了初始聚类中心及聚类数,提高了聚类的效率。该方法避开了以往类似方法所有时刻负荷数据用单一阈值区间进行判定的缺点,通过训练聚类后的历史负荷数据,得到了不同采样时刻点,正常数据变化的范围,最终形成了正常数据的可行域,并在获得各类特征曲线的同时,完成了对负荷曲线的聚类。利用此法对待测负荷数据进行检测,能够取得比较理想的结果。
参考文献:
[1]蒋德珑,王克文,,王祥东.基于模糊等价矩阵聚类分析的不良数据辨识[J].电力系统保护与控制,2012,39(21):1-6.
[2]艾芊,章健.基于多代理系统的微电网竞价优化策略[J].电网技术,2010,34(2):46-51.
[3]刘莉,王刚,翟登辉.k-means聚类算法在负荷曲线分类中的应用[J].电力系统保护与控制,2011,39(23):65-68.
[4]刘辉舟,周开乐,胡小建.基于模糊负荷聚类的不良负荷数据辨识与修正[J].中国电力,2013,46(10):29-34.
[5]高新波,裴继红,谢维信.模糊c-均值聚类算法中加权指数m的研究[J].电子学报,2000,28(4):80-83.
[6]马平,王茂海,吴新振,等.基于PMU实测小扰动数据的负荷参数辨识方法[J].电力系统自动化,2016,40(2):43-48.

Claims (7)

1.一种电力系统负荷数据的辨识及修正方法,其特征在于,包括以下步骤:
(1)根据一段时间内的用户历史负荷数据,基于爬山法确定样本数据的聚类数及初始聚类中心;所述基于爬山法确定样本数据的聚类数及初始聚类中心的步骤具体包括:
步骤a,构建爬山函数,将每一个样本数据代入爬山函数,使爬山函数取得最大值的为第一个初始聚类中心;
步骤b,修正爬山函数,消除第一个初始聚类中心对爬山函数的影响,将样本数据逐一代入修正后的爬山函数,取得第二个初始聚类中心;
重复上述步骤b,直至获得所有初始聚类中心,并确定聚类数;
(2)确定聚类数及初始聚类中心后,基于模糊C均值聚类算法获取历史负荷数据的最终聚类中心及特征曲线;所述基于模糊C均值聚类算法获取历史负荷数据的最终聚类中心及特征曲线的步骤具体为:
初始化隶属度矩阵及聚类参数,基于爬山法获取的聚类数及初始聚类中心;
通过迭代求解的方式,求取样本与聚类中心的隶属度矩阵,并生成新的聚类中心,最后一次迭代生成的聚类中心即为最终聚类中心;
根据负荷分类和最终聚类中心形成负荷特征曲线;
其中,所述负荷分类即爬山法获取的聚类数;
(3)对步骤(2)获得的每一类负荷特征曲线进行加工,获得该类负荷曲线正常数据所处于的可行域区间;
(4)根据与步骤(2)获得的每一类负荷特征曲线的相关系数,确定待测负荷曲线的所属类别;
(5)基于步骤(3)获得的可行域区间及步骤(4)判定出所属类别的待测负荷曲线,对待测负荷数据进行不良数据辨识及修正,以用于电力系统的分析计算和运行决策。
2.根据权利要求1所述的电力系统负荷数据的辨识及修正方法,其特征在于,步骤(3)中,所述获得每一类负荷曲线正常数据所处于的可行域区间的步骤具体为:
提取所有历史样本数据在同一测量时刻的最大负荷值及最小负荷值;
利用提取出的最大负荷及最小负荷值、结合聚类生成的每一类负荷特征曲线,计算出所有测时刻正常负荷数据所处于的上下限;
基于所有测量时刻的上下限,生成每一类负荷曲线其正常数据所处于的可行域区间。
3.根据权利要求1所述的电力系统负荷数据的辨识及修正方法,其特征在于,步骤(4)中,所述确定待测负荷曲线的所属类别的方法具体为:计算待测负荷曲线与每一类负荷特征曲线的相关系数,待测负荷曲线属于使相关系数取得最大值的类。
4.根据权利要求1所述的电力系统负荷数据的辨识及修正方法,其特征在于,步骤(5)中,所述不良数据辨识的方法具体为:将待测负荷曲线映射到所属类可行域区间,在特征曲线上部判断其上限,在特征曲线下部判断其下限,映射结果处于可行域上下限之间的为正常数据,反之为不良数据。
5.根据权利要求1所述的电力系统负荷数据的辨识及修正方法,其特征在于,步骤(5)中,对所述不良数据采用纵向比较修正法进行修正。
6.根据权利要求1所述的电力系统负荷数据的辨识及修正方法,其特征在于,步骤(1)中,爬山函数停止修正判定条件为:第t次的爬山函数最大值与第一次爬山函数最大值比值小于给定参数。
7.根据权利要求1所述的电力系统负荷数据的辨识及修正方法,其特征在于,步骤(2)中,迭代停止判定条件为:各个样本到各个聚类中心距离的加权平方和的最小值小于给定参数。
CN201610614563.9A 2016-07-26 2016-07-26 一种电力系统负荷数据的辨识及修正方法 Active CN106055918B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610614563.9A CN106055918B (zh) 2016-07-26 2016-07-26 一种电力系统负荷数据的辨识及修正方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610614563.9A CN106055918B (zh) 2016-07-26 2016-07-26 一种电力系统负荷数据的辨识及修正方法

Publications (2)

Publication Number Publication Date
CN106055918A CN106055918A (zh) 2016-10-26
CN106055918B true CN106055918B (zh) 2020-02-21

Family

ID=57195866

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610614563.9A Active CN106055918B (zh) 2016-07-26 2016-07-26 一种电力系统负荷数据的辨识及修正方法

Country Status (1)

Country Link
CN (1) CN106055918B (zh)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106529060B (zh) * 2016-11-15 2021-09-03 中国电力科学研究院有限公司 一种负荷序列建模方法及系统
CN106709816B (zh) * 2016-11-29 2020-04-21 国网陕西省电力公司电力科学研究院 基于非参数回归分析的电力负荷异常数据识别与修正方法
CN108390368B (zh) * 2017-11-07 2023-06-02 华北电力大学 一种不同形态弹性控制负荷的辨识方法
CN108197156B (zh) * 2017-12-08 2020-10-16 囯网河北省电力有限公司电力科学研究院 用电信息采集系统的异常电量数据修复方法及终端设备
CN108155639B (zh) * 2018-03-13 2023-03-21 华北电力大学 一种广域可调节负荷的辨识方法
CN108919044B (zh) * 2018-03-30 2020-09-29 国电南瑞科技股份有限公司 一种基于互校验机制的单元制配电网故障主动识别方法
CN108510006B (zh) * 2018-04-08 2020-06-09 重庆邮电大学 一种基于数据挖掘的企业用电量分析与预测方法
CN109149644B (zh) * 2018-09-29 2020-06-09 南京工程学院 一种基于大数据分析的光储一体在线策略匹配和协同优化方法
CN109407508A (zh) * 2018-10-15 2019-03-01 国网重庆市电力公司电力科学研究院 六氟化硫气体绝缘组合电器运行状态诊断方法及系统
CN109409726A (zh) * 2018-10-19 2019-03-01 深圳供电局有限公司 一种基于二维离散模糊数的非侵入式负荷辨识方法
CN109634944B (zh) * 2018-12-05 2022-11-04 贵州电网有限责任公司 一种基于多维度时空分析的网损数据清洗方法
CN109558467B (zh) * 2018-12-07 2020-09-15 国网江苏省电力有限公司常州供电分公司 用电用户类别识别方法及系统
CN109740648B (zh) * 2018-12-21 2020-11-03 广东电网有限责任公司广州供电局 电力负荷异常数据识别方法、装置和计算机设备
CN110097261B (zh) * 2019-04-17 2022-11-18 三峡大学 一种判断用户用电异常的方法
CN110610121B (zh) * 2019-06-20 2023-04-07 国网重庆市电力公司 基于曲线聚类的小时级源荷功率异常数据辨识与修复方法
CN110579709B (zh) * 2019-08-30 2021-04-13 西南交通大学 一种有轨电车用质子交换膜燃料电池故障诊断方法
CN110674864B (zh) * 2019-09-20 2024-03-15 国网上海市电力公司 一种含同步相量量测装置的风电异常数据辨识方法
CN110991786B (zh) * 2019-10-15 2022-06-24 国网浙江省电力有限公司台州供电公司 基于相似日负荷曲线的10kV静态负荷模型参数辨识方法
CN110932274A (zh) * 2019-12-18 2020-03-27 辽宁工业大学 一种电力系统测量与负荷参数分析辨识方法
CN111667135B (zh) * 2020-03-25 2023-07-28 国网天津市电力公司 一种基于典型特征提取的负荷结构解析方法
CN112488474B (zh) * 2020-11-19 2022-05-20 贵州电网有限责任公司 一种能源互联网综合能耗模型及参数辨识方法
CN113159113B (zh) * 2021-03-09 2022-07-01 西华大学 信息恶意篡改下可修复遥测量的智能电网故障诊断方法
CN113515512B (zh) * 2021-06-22 2024-06-14 国网辽宁省电力有限公司鞍山供电公司 一种工业互联网平台数据的质量治理及提升方法
CN113673551B (zh) * 2021-06-30 2024-05-28 国网山东省电力公司营销服务中心(计量中心) 一种电力计量不良数据辨识方法及系统
CN113791275B (zh) * 2021-08-30 2022-12-06 国网福建省电力有限公司 一种单相谐波数据丢失的修复方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103106344A (zh) * 2013-01-30 2013-05-15 河海大学 一种建立电力系统聚类负荷模型的方法
CN104766175A (zh) * 2015-04-16 2015-07-08 东南大学 一种基于时间序列分析的电力系统异常数据辨识与修正方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7123971B2 (en) * 2004-11-05 2006-10-17 Pegasus Technologies, Inc. Non-linear model with disturbance rejection
US20090125155A1 (en) * 2007-11-08 2009-05-14 Thomas Hill Method and System for Optimizing Industrial Furnaces (Boilers) through the Application of Recursive Partitioning (Decision Tree) and Similar Algorithms Applied to Historical Operational and Performance Data

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103106344A (zh) * 2013-01-30 2013-05-15 河海大学 一种建立电力系统聚类负荷模型的方法
CN104766175A (zh) * 2015-04-16 2015-07-08 东南大学 一种基于时间序列分析的电力系统异常数据辨识与修正方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
基于实测数据的发电机调速系统参数辨识方法;孙闻等;《电力系统及其自动化学报》;20140331;第26卷(第3期);26-30 *
基于模糊等价矩阵聚类分析的不良数据辨识;蒋德珑等;《电力系统保护与控制》;20111101;第39卷(第21期);1-8 *
基于模糊负荷聚类的不良负荷数据辨识与修正;刘辉舟等;《中国电力》;20131031;第46卷(第10期);29-34 *
结合模糊聚类与区域合并的彩色图像分割方法;沈雪冰等;《电视技术》;20150611;第39卷(第9期);32-35 *

Also Published As

Publication number Publication date
CN106055918A (zh) 2016-10-26

Similar Documents

Publication Publication Date Title
CN106055918B (zh) 一种电力系统负荷数据的辨识及修正方法
CN112699913B (zh) 一种台区户变关系异常诊断方法及装置
CN111199016B (zh) 一种基于DTW的改进K-means的日负荷曲线聚类方法
CN110263866B (zh) 一种基于深度学习的电力用户负荷区间预测方法
CN106980910B (zh) 中长期电力负荷测算系统及方法
CN112990500B (zh) 基于改进加权灰色关联分析的台区线损分析方法及系统
CN111539657B (zh) 结合用户日用电量曲线的典型用电行业负荷特性分类与综合方法
CN109948920B (zh) 一种基于证据理论的电力市场结算数据风险处理方法
CN110503153B (zh) 基于差分进化算法和支持向量机的光伏系统故障诊断方法
CN111967717A (zh) 一种基于信息熵值的数据质量评价方法
CN116821832A (zh) 针对高压工商业用户用电负荷的异常数据辨识与修正方法
CN115640969A (zh) 一种基于设备状态与运行年限的电网运维成本分配方法
CN115358437A (zh) 基于卷积神经网络的供电负荷预测方法
CN116578551A (zh) 一种基于gru-gan的电网数据修复方法
CN113866552B (zh) 一种基于机器学习的中压配网用户用电异常诊断方法
CN114330486A (zh) 基于改进Wasserstein GAN的电力系统不良数据辨识方法
CN114266457A (zh) 一种配电线路异损诱因检测的方法
CN107274025B (zh) 一种实现用电模式智能识别与管理的系统和方法
CN117332288A (zh) 一种建筑节能技术评估系统及方法
CN111553434A (zh) 一种电力系统负荷分类方法及系统
CN116451170A (zh) 一种基于多源异构数据的配电网检测方法
CN115659553A (zh) 一种低压供电网络拓扑识别方法及系统
CN114971090A (zh) 一种电供暖负荷预测方法、系统、设备和介质
CN114169226A (zh) 短期电力负荷预测方法、计算机设备以及存储介质
CN111008584B (zh) 一种模糊自组织神经网络的电能质量量测缺失修复方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20240229

Address after: 300461 Tianjin Binhai New Area Free Trade Pilot Zone (Dongjiang Bonded Port Area), 200 Leshan Road, Minghai Center, Building 2-5,6-509

Patentee after: Tianjin Jintong Electric Power Technology Co.,Ltd.

Country or region after: China

Address before: 300072 Tianjin City, Nankai District Wei Jin Road No. 92

Patentee before: Tianjin University

Country or region before: China