CN111091143A - 基于深度信念网络和K-means聚类的配变重过载预警方法 - Google Patents

基于深度信念网络和K-means聚类的配变重过载预警方法 Download PDF

Info

Publication number
CN111091143A
CN111091143A CN201911169828.9A CN201911169828A CN111091143A CN 111091143 A CN111091143 A CN 111091143A CN 201911169828 A CN201911169828 A CN 201911169828A CN 111091143 A CN111091143 A CN 111091143A
Authority
CN
China
Prior art keywords
distribution transformer
distribution
overload
belief network
early warning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911169828.9A
Other languages
English (en)
Other versions
CN111091143B (zh
Inventor
童光华
董亮
任永平
于金平
冉新涛
俞海猛
孙羽森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kuitui Power Supply Co Of State Grid Xinjiang Electric Power Co ltd
NARI Nanjing Control System Co Ltd
Electric Power Research Institute of State Grid Xinjiang Electric Power Co Ltd
Original Assignee
Kuitui Power Supply Co Of State Grid Xinjiang Electric Power Co ltd
NARI Nanjing Control System Co Ltd
Electric Power Research Institute of State Grid Xinjiang Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kuitui Power Supply Co Of State Grid Xinjiang Electric Power Co ltd, NARI Nanjing Control System Co Ltd, Electric Power Research Institute of State Grid Xinjiang Electric Power Co Ltd filed Critical Kuitui Power Supply Co Of State Grid Xinjiang Electric Power Co ltd
Priority to CN201911169828.9A priority Critical patent/CN111091143B/zh
Publication of CN111091143A publication Critical patent/CN111091143A/zh
Application granted granted Critical
Publication of CN111091143B publication Critical patent/CN111091143B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes
    • G06F18/24137Distances to cluster centroïds
    • G06F18/2414Smoothing the distance, e.g. radial basis function networks [RBFN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/06Electricity, gas or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Abstract

本发明公开了一种基于深度信念网络和K‑means聚类的配变重过载预警方法,将待测配变的历史负载率、设备台账信息、环境因素、经济和社会发展统计因素的特征变量输入深度信念网络,深度信念网络输出待测配变是否重过载;将预测的重过载配变的年负荷曲线再通过K‑means方法进行聚类,得到各类聚类中心的年负荷曲线;选出预测的重过载配变中与各类聚类中心相符的重过载配变,进行提前预警。本发明能够提供未来将发生重过载的配变清单,从而更有利于运营人员及时维护更换设备,提升电网迎峰度夏、春节期间等高负荷期的预警和应急能力。

Description

基于深度信念网络和K-means聚类的配变重过载预警方法
技术领域
本发明涉及一种基于深度信念网络和K-means聚类的配变重过载预警方法,属于电力系统负荷预测技术领域。
背景技术
配电网通过一次配变直接接入普通用户,该级网络故障直接影响用户用电,配网供电可靠性直接影响用电客户的满意度。配网供电可靠因素主要包括供电线路的故障率、配电变压器的故障率、作业停运修复时间、用户的密度和分布情况等方面,配电变压器重过载情况对配网的供电可靠性有着至关重要的影响。
随着经济快速发展,工业和生活用电量都急速增加,台区配变数量随之迅猛发展,特别是在负荷较为集中的七八月份和春节等时间段,由于用户负荷剧增,引起配电变压器运行在过负荷状态,可能引起变压器的不正常运行、甚至故障,从而对正常的生活和生产带来较大负面影响。据某省电力公司运监中心的数据显示,截止至2017年10月,该省内重载配变设备已达到255台。如此庞大的重载台区配变数量,一方面给电网带来了较大的安全隐患,另一方面也造成了电网资产的严重浪费。
目前,配电系统运行时产生的多源异构、规模巨大、增长快速、类型丰富的数据,表现出大数据的基本特征。基于数据的机器学习是现代智能技术中的重要方面,这为配变重过载问题的解决提供了新思路。通过基于数据的机器学习理论对配变重过载变压器进行预测分析,可以有效预测配变未来是否会出现重过载现象。
机器学习算法是通过计算机模拟人的行为从而发现和挖掘数据潜在价值。当前,作为人工智能技术的分支,其能够发掘已知数据的潜在规律并且对未来的数据发展做出预测,其中的主要方法有支持向量机(support vector machine,SVM)算法,人工神经网络(artificial neural network,ANN)算法,深度学习算法等。现有文献用于配变重过载预测都是以短期预测为主,且均基于模型的训练样本量较充足的大前提下得出的,当样本数不够充分时,当前方法的有效性有待提升。SVM算法对大规模训练样本难以实施,且用以解决多分类问题存在困难;ANN存在局部极小化、算法收敛速度慢、神经网络结构选择不一、预测和训练的能力相矛盾、样本依赖性等问题;已有文献通过SVM回归模型对小样本数据进行预测,且基于两种分布给出了在某一置信度下的置信区间。
发明内容
目的:为了克服现有技术中存在的不足,为研究配变重过载的小样本精确预测问题,本发明首先给出重过载的定义范畴,通过分析重过载中长期预警模型思路和输入变量特征选取方法,实现负载率特征变量、环境特征变量、设备台账特征变量、经济和社会发展的统计数据特征变量等输入变量特征筛选,进而构建基于深度信念网络的配变重过载预警模型,再基于K-means方法实现对重过载配变年负荷曲线的二次分析,进一步得到更加精确的重过载配变预警清单。本发明提供一种基于深度信念网络和K-means聚类的配变重过载预警方法。
技术方案:为解决上述技术问题,本发明采用的技术方案为:
一种基于深度信念网络和K-means聚类的配变重过载预警方法,包括如下步骤:
将待测配变的历史负载率、设备台账信息、环境因素、经济和社会发展统计因素的特征变量输入深度信念网络,深度信念网络输出待测配变是否重过载;
将预测的重过载配变的年负荷曲线再通过K-means方法进行聚类,得到各类聚类中心的年负荷曲线;
选出预测的重过载配变中与各类聚类中心相符的重过载配变,进行提前预警。
作为优选方案,所述深度信念网络是由多个受限玻尔兹曼机堆叠组成的神经网络模型,其核心是RBM单元;每一个RBM都包括一个隐含层和可见层;此结构中层内神经元之间没有连接,层间所有神经元通过权重全部互相连接;RBM是一种基于能量的模型,对于状态(v,h)确定的RBM系统所具有的能量表示为:
Figure BDA0002284674980000031
式中:θ=(wij,ai,bj)为RBM参数,n、m分别为可见层与隐含层神经元数量;v为可见层输入,其表示异常电表的台账信息输入;vi表示可见层神经元i的状态,设定其偏置值为ai;h为隐含层输出,输出为0或1,表示电表未发生故障或电表发生故障;hj表示隐含层神经元j的状态,设定偏置值为bj;神经元i和j连接权重定义为wij
由能量函数E,可得到(v,h)的联合概率分布为:
Figure BDA0002284674980000041
上式中Z(θ)为归一化因子,其表达式如下式:
Figure BDA0002284674980000042
当学习样本的数量为N时,参数θ通过学习样本的最大对数似然函数得到,公式如下:
Figure BDA0002284674980000043
上式中n为学习样本,p(v|θ)为观测数据v的似然函数,其表达式如下式:
Figure BDA0002284674980000044
从可见层计算隐含层,再反馈到可见层;重建后的可见层神经元再一次计算隐含层神经元的实际状态;根据可见层神经元状态计算隐含层第j个神经元,激活概率为:
Figure BDA0002284674980000045
由隐含层重建可见层第i个神经元,设定p为激活的概率,公式如下:
Figure BDA0002284674980000046
由随机梯度上升法求解最大对数似然函数值,得到深度信念网络参数变化量计算准则为:
Figure BDA0002284674980000051
式中:Δwij、Δai、Δbj分别为wij、ai、bj的变化量,<·>data为原始观测数据模型定义的分布;<·>recon为重构后模型定义的分布;
考虑学习率ε的深度信念网络参数更新准则为:
Figure BDA0002284674980000052
其中,k代表模型迭代计算的次数。
作为优选方案,所述K-means方法实现步骤为:
步骤1选择k个类初始中心;
步骤2进行迭代过程,即对任意一个样本,求其到k个中心的距离,将该样本归到距离最短的中心所在的类;
步骤3计算均值以更新该类的中心值,计算公式为:
Figure BDA0002284674980000053
其中,c为中心值,i为属于该类的样本数量,Xc为该类中心样本均值,Xi为第i个样本;
步骤4对于所有的k个聚类中心,若经过步骤2与步骤3迭代法更新后,中心值收敛,则迭代结束,否则继续迭代。
作为优选方案,所述深度信念网络训练样本为最近三个月的已知重过载情况的配变的历史负载率、设备台账信息、环境因素、经济和社会发展统计因素的特征变量。
作为优选方案,分别计算配变的历史负载率、设备台账信息、环境因素、经济和社会发展统计因素的特征变量的Pearson、MI两个指标,选出均大于Pearson、MI指标阈值的特征变量。
作为优选方案,所述均大于Pearson、MI指标阈值的特征变量分别为:历史负载率的特征变量包括:历史最大负载率、历史平均负载率、历史负载率波动值、历史日平均负载率峰值和历史重过载次数;
环境因素的特征变量包括:历史负载率最大时的最高气温、最低气温和季节信息;
设备台账信息的特征变量包括:设备区县;
经济和社会发展统计因素的特征变量包括:住宅投资增长率、全社会用电增长率和第一产业比重。
作为优选方案,所述Pearson指标计算公式如下:
Figure BDA0002284674980000061
所述MI指标计算公式如下:
Figure BDA0002284674980000062
式中,n为训练样本的数量;X为相应的历史负载率特征变量;Y为是否发生配变重过载,值为0或1,0为重过载,1为未发生重过载,
Figure BDA0002284674980000063
为相应的历史负载率特征变量平均值,xi为第i个历史负载率特征变量,yi为第i个历史负载率特征变量的重过载情况,Cov()表示求协方差,Var()表示求方差;H(X)表示X的不确定度,H(X|Y)表示在已知Y的情况下,X的不确定度;p()表示求相关性的概率分布。
作为优选方案,所述配变重过载设置为配变负载率持续1小时均大于70%。
作为优选方案,预测的重过载配变的年负荷曲线再通过K-means方法进行聚类,得到设备区县、配网类型、配变额定容量、低压用户数四类的聚类中心的年负荷曲线。
有益效果:本发明提供的基于深度信念网络和K-means聚类的配变重过载预警方法,能够提供未来将发生重过载的配变清单,从而更有利于运营人员及时维护更换设备,提升电网迎峰度夏、春节期间等高负荷期的预警和应急能力。
附图说明
图1为本发明方法实施例中配变发生重过载的定义。
图2为本发明方法实施例中重过载中长期预警模型构建思路。
图3为本发明方法实施例中配变重过载的影响因素(输入特征变量)。
图4为本发明方法实施例中负载率特征变量相关性分析箱型图结果。
图5为本发明方法实施例中季节特征变量分析。
图6为本发明方法实施例中区县特征变量分析。
图7为本发明方法实施例中中长期重过载预警的DBN结构模型原理。
图8为本发明方法实施例中重过载配变分布特性统计分析。
图9为本发明方法实施例中扬州市区配变聚类分析。
图10为本发明方法实施例中仪征市配变聚类分析。
图11为本发明方法实施例中宝应县配变聚类分析。
图12为本发明方法实施例中高邮市配变聚类分析。
图13为本发明方法实施例中江都区配变聚类分析。
图14为本发明方法实施例中扬州市区台区容量预警分析结果。
具体实施方式
下面结合附图对本发明作更进一步的说明。
本发明一种基于深度信念网络和K-means聚类的配变重过载预警方法,其一种实施例具体内容如下:
1配变中长期重过载预警模型构建分析
台区重过载预警的目的在于提前一定时间,一般约3个月识别出可能发生重过载的配变,进而及时对这些可能重过载的配变进行维护或更换。
(1)重过载的定义
由于无论识别出的配变是属于重载或是过载,均需要对其进行更换;因此,本发明首要目的在于预测可能的重过载的配变,而不需要细分其属于过载或重载。基于上述原因,本发明在此定义:配变负载率持续1小时均大于70%时,判断该配变发生重过载现象,如图1所示。
(2)重过载中长期预警模型的构建
由于需要提前3个月识别可能的重过载配变,本发明所建立的为中长期预警模型;对该类预警模型的构建,通常有两种实现思路,如图2所示。
其一是建立中长期负荷预测模型,预测配变未来3个月后的负载率,若出现连续1小时负载率预测值大于70%,则可以判断该配变发生重过载。该模型的优点在于容易构建训练样本,计算简便;缺点在于中长期负荷预测精度较低(提前一天预测误差约10%左右,提前3个月预测难以保证精度),且需要较长时间段的历史数据(通常需要5年以上)。因此,中长期负荷预测模型难以有效判断3个月后的配变重过载情况。
其二是建立二分类模型,通过输入历史负载率、设备台账信息、环境因素和社会发展统计因素的特征变量,计算得到输出为0或1(1=会发生重过载/0=不会发生重过载)。二分类模型的优点在于可以直接输出判断某台配变是否过载、且比预测模型有更好的识别精度;但是,该模型实现的前提是需要有类似输入输出的样本作为训练。因此,如何选取输入特征、构建样本,是本发明需要解决的另一个问题。
(3)输入变量特征选取
根据上述分析,建立二分类模型需要有输入、输出对应的样本,其中输出为0或1(即同时需要重过载样本和未发生重过载的样本),输入为与配变发生重过载相关的因素,本发明中主要考虑了四种类型的输入变量特征,包括:历史负载率、设备台账信息、环境因素、经济和社会发展统计因素的特征变量。
2输入变量特征筛选
由于多种维度的特征变量均会影响到配变重过载发生,本发明考虑如表1所示的影响因素,具体结构如图3所示。
表1配变重载的影响因素表
Figure BDA0002284674980000101
由于输入特征变量数目众多,为了选取有效的特征变量、减小输入变量的冗余度,本发明将对上述特征变量进行相关性分析,以精选出反映配变重过载发生特征的输入变量。
(1)历史负载率特征变量
由于历史负载率特征变量为数值型特征,为了研究其与发生重过载的相关性,本发明计算了皮尔逊(Pearson)相关系数和互信息(Mutual Information,MI)两个指标,其中Pearson相关系数反映的是特征变量之间的共线性相关程度,MI反映的是特征变量之间的概率性相关程度,其公式如下:
Figure BDA0002284674980000102
Figure BDA0002284674980000103
式中,n为训练样本的数量;X为相应的历史负载率特征变量;Y为是否发生配变重过载,值为0或1(即重过载和未发生重过载),
Figure BDA0002284674980000104
为相应的历史负载率特征变量平均值,xi为第i个历史负载率特征变量,yi为第i个历史负载率特征变量的重过载情况,Cov()表示求协方差,Var()表示求方差。其中,Person取值在[-1,1],其绝对值越大,相关性越强;MI取值范围为[0,1],取值越大相关性越强,H(X)表示X的不确定度,H(X|Y)表示在已知Y的情况下,X的不确定度;p()表示求相关性的概率分布。根据公式(1)和(2),计算得到历史负载率特征变量的相关性如表2和图4所示。
表2历史负载率特征变量相关性计算结果
Figure BDA0002284674980000111
通过表2的计算结果,发现负载率同比增长率对重过载发生的相关性较小,其他变量对重过载具有一定的相关性;比较图4的箱型图,除了负载率同比增长率特征外,其他的历史负载率特征变量分布归类相似,即重过载配变的历史负载率特征变量中位数高于未重过载的配变。因此,表2和图4的结果一致,经过分析选取Pearson>0.1且MI>0.05的历史负载率特征:历史最大负载率、历史平均负载率、历史负载率波动值(方差)、历史日平均负载率峰值和历史重过载次数。
(2)环境因素特征变量
环境因素特征变量中,极端气温代表历史负载率最大时的最高或最低气温和历史平均气温为数值变量,可以直接计算其相关性;季节信息代表季节、历史是否连续高温/低温和特定节日为标签变量,需要对标签进行编码,然后定义X为相应的环境因素特征变量,Y为是否发生配变重过载,计算其相关程度。计算结果如表3和图5所示。
表3环境特征变量相关性计算结果
Figure BDA0002284674980000121
根据相关性分析结果,历史负载率最大时的最高气温、最低气温和季节信息与是否发生重过载有一定的关联性,满足Pearson>0.1且MI>0.05。此外,根据如图5的季节信息特征变量分析,配变负载率最大通常发生在夏季和冬季;而重过载则在绝大多数情况下发生在夏季。
(3)设备台账特征变量
由X为相应的设备台账特征变量,Y为是否发生配变重过载,经过分析计算得到特征变量的相关程度,如表4和图6所示。
表4负载率特征变量相关性计算结果
Figure BDA0002284674980000122
从分析结果可以看出,设备所在区县的特征变量对是否发生重过载具有一定的相关性。其中,全部配变样本在五个区县上的数量差异不大;而历史发生过重过载的配变样本中,高邮配变样本数量最多,约占重过载配变样本的50%。
(4)经济和社会发展统计因素特征变量
该类统计数据特征均为数值型变量,X为相应的经济和社会发展的统计数据特征变量,Y为是否发生配变重过载,计算其Pearson和MI结果如表5所示。
表5环境特征变量相关性计算结果
Figure BDA0002284674980000131
从分析结果可以看出,大部分经济和社会发展统计因素与重过载的相关性普遍较小。综合分析选取Pearson>0.08且MI>0.01的特征变量为:住宅投资增长率、全社会用电增长率和第一产业比重。
3基于深度信念网络的配变重过载预警方法
3.1深度信念网络原理
深度信念网络(deep belief network,DBN)是一种生成模型,其本身具有较强的从大量样本中提取特征的能力,以便于更好地分类,进而提高分类的准确率。
如图7所示,三层受限玻尔兹曼机(restricted Boltzmann machines,RBM)组成的网络结构。其中,单个RBM(如RBM1)是由一个可见层和一个隐含层构成的对称、无自反馈的随机神经网络模型,层内神经元无连接,层间神经元通过权重全连接。V1为连接观测数据的可见层,H1为隐含层,用于提取输入数据有效特征,W1为可见层与隐含层的连接权重。网络中神经元只有未激活、激活两种状态,通常用二进制0和1表示。
RBM是一种基于能量的模型,用vi表示可见层神经元i的状态,对应偏置值为ai,用hj表示隐含层神经元j的状态,对应的偏置值为bj,神经元i和j连接权重为wij,状态(v,h)确定的RBM系统所具有的能量可表示为:
Figure BDA0002284674980000141
式中:θ=(wij,ai,bj)为RBM参数,n、m分别为可见层与隐含层神经元数量;
由能量函数,可得到(v,h)的联合概率分布为:
Figure BDA0002284674980000142
式中:
Figure BDA0002284674980000143
为归一化因子;
对于数量为N的学习样本,参数θ通过学习样本的最大对数似然函数得到为:
Figure BDA0002284674980000144
式中:n为学习样本,
Figure BDA0002284674980000145
为观测数据V的似然函数。
训练过程中,由于归一化因子Z(θ)计算复杂,一般采用Gibbs等采样方法近似获得。
由于RBM层内各神经元激活状态之间是相互独立的,因此,根据可见层神经元状态计算隐含层第j个神经元,激活概率为:
Figure BDA0002284674980000146
由隐含层重建可见层第i个神经元,激活概率为:
Figure BDA0002284674980000147
从而,用随机梯度上升法求解对数似然函数最大值,各参数变化量计算准则为:
Figure BDA0002284674980000151
式中:Δwij、Δai、Δbj分别为wij、ai、bj的变化量,<·>data为原始观测数据模型定义的分布,<·>recon为重构后模型定义的分布;
考虑学习率ε的参数更新准则为:
Figure BDA0002284674980000152
式中:k代表模型迭代计算的次数,对于本发明中的DBN模型,其变量的具体含义为:h表示可见层输入,代表影响配变重过载的特征变量输入;v表示隐含层输出,其结果为0/1,表示配变未发生重过载或配变将发生重过载;其余变量为模型的中间变量和训练参数;
4基于K-means的配变年负荷曲线聚类
将预测为重过载配变的年负荷曲线通过K-means方法进行聚类,得到数据降维后的设备区县、配网类型、配变额定容量、低压用户数各类聚类中心的年负荷曲线。
本发明选用K-means方法实现配变的年负荷曲线聚类,其算法实现步骤为:
1)选择k个类初始中心;
2)进行迭代过程,即对任意一个样本,求其到k个中心的距离,将该样本归到距离最短的中心所在的类;
3)计算均值以更新该类的中心值,计算公式为:
Figure BDA0002284674980000161
其中,c为中心值,i为属于该类的样本数量,Xc为该类中心样本均值,Xi为第i个样本;
4)对于所有的k个聚类中心,若经过步骤2)与步骤3)迭代法更新后,中心值收敛,则迭代结束,否则继续迭代。
5算例测试验证
5.1输入变量特征筛选结果
根据上一节分析结果,最终精选得到输入特征变量如下表所示。
表6影响配变重过载的精选特征变量列表
Figure BDA0002284674980000162
5.2预警模型识别结果
本发明分别采用了支持向量分类器(SVC)、神经网络分类器(ANN)和深度信念网络分类器(DBN)搭建重过载预警模型,并进行5折交叉验证,得到各分类器模型的准确性如表7所示。
分类准确率ACC和为漏检率FAL的计算公式分别为:
ACC=Ncorrect/Ncv×100% (9)
FAL=NFP/NP×100% (10)
式中:Ncorrect为分类正确的样本个数,Ncv为验证折中的样本个数,NP为重过载的样本个数,NFP为实际重过载而未检测出的样本个数。
表7重过载预警模型的交叉验证准确性
Figure BDA0002284674980000171
经过交叉验证的算例仿真分析,基于深度学习的DBN模型可以更好地学习输入特征与输出间的映射关系,因而具有更高的分类准确率和更低的漏检率,分别为78.11%和27.42%,可以有效地为中长期重过载起指导作用。
通过分析2017年1月至2018年6月的历史数据,实现提前3个月重过载预警,识别出将在2018年夏季发生重过载的配变编号及其台账信息清单如表8所示。
表8预警识别重过载配变清单
Figure BDA0002284674980000172
5.3基于负荷曲线聚类的重过载结果深度分析
根据上表8的重过载配变清单,基于统计技术分析其分布特性如图8所示。对于扬州地区,从统计分析结果可以看出,配变清单中约有54%的重过载配变位于高邮市,超过半数;对于重过载配变的额定容量,主要为100~200kW和300~400kW,其中200~300kW的配变数量很少,小于1%;分析配变下的低压用户数,绝大多数的重过载配变下用户数小于100户,占比约为88%;从配变所属配网类型来看,大部分重过载配变属于农网,占比约为78%。因此,统计分析结果可以很好地反映出重过载配变特性,其中低压侧用户数小于100户、属于农网类型的配变中发生重过载的可能性更多,需要提前预警防范。
通过对预测台区内经深度信念网预测的重过载配变的负荷曲线再经K-means方法进行聚类,得到聚类中心负荷曲线所对应的设备区县、配网类型、配变额定容量、低压用户数,对于符合上述设备区县、配网类型、配变额定容量、低压用户数的重过载配变进行提前预警防范。
具体地,为了深度分析这种分布性规律,本发明对于不同类别的重过载配变的曲线进行聚类分析。由于预警模型的识别时间跨度为3个月,属于中长期分析问题,故选取年负荷曲线进行聚类分析,进而探究聚类结果对重过载的影响。
考虑到负荷曲线类型受到用户类型影响,不同区县的用户类型差异较大,对其配变负荷特性分别进行K-means聚类分析结果如下:
i.对于扬州市区配变,聚类分析后具有两类年负荷曲线,如图9所示。
第一类年负荷曲线具有典型的夏季迎峰特性,在其他时间段负荷趋于平稳、负荷量较低,因而该类负荷极容易在夏季发生重过载,且由于其他季节负载率较低,需要格外注意防范;第二类年负荷曲线较为平稳,受气温因素影响,在夏季和冬季的负荷率略高于春秋季,在春节和国庆假期负荷率低,由于该类负荷平稳,因此对于其中的高负载率配变需要加以关注。
ii.对于仪征市,聚类分析后得到如下三类年负荷曲线,如图10所示。其中,第一类负荷曲线为夏季迎峰型曲线,在夏季具有最高的负载率,且负荷曲线差异较大,夏季负载率峰值远高于其他季节负载率,需要对其夏季迎峰时提前进行重过载预警;第二类年负荷曲线的波动性和随意性较大,但是通常情况下负载率较大,重过载可能性较小;第三类负荷曲线受到气温影响较大,在夏季和冬季的负载率均较高,但在春节假期负载率较低,由于负载率差异比第一类较小,故仅需对其中负载率较大的配变进行重过载预警分析。
iii.对于宝应县,负荷曲线聚类特性结果如图9所示。
聚类结果分为两类,第一类负荷曲线年波动平稳,受到气温影响较小,在国庆和春节假期负载率较低,仅需要对负载率较高的配变进行重过载预警;第二类曲线为夏季迎峰型曲线,在夏季负载率较高。
iv.对于高邮市,负荷曲线聚类特性结果如图9所示。
高邮市负荷曲线聚类结果均为夏季迎峰型负荷曲线,区别在于第一类负荷曲线的负荷量变化较为平稳,波动上下限差异较小;而第二类负荷曲线的夏季负荷波动差异较大,夜间负载率接近零。这两类负荷曲线均需要提前在夏季进行重过载预警分析。
v.对于江都区,负荷曲线聚类特性结果如图9所示。
负荷曲线聚类结果分为三类。第一类和第二类负荷曲线均为夏季迎峰性曲线,其中第一类曲线的季节差异大于第二类,为重过载预警模型中需要格外关注的类别;第三类负荷曲线波动较为平稳,春节假期负荷率较低,仅需要对负载率较高的配变进行重过载分析。
5.4台区容量预警分析
经过上述重过载预警模型计算结果,结合不同区县的负荷曲线聚类情况,可以实现对台区配变容量的预警分析。限于篇幅,本发明在此仅列出扬州市区配变容量预警分析结果,如图14所示,仪征市、宝应县、高邮市、江都区的结果不再赘述。
经过统计计算及分析,扬州市区中负荷类型1(夏季迎峰型负荷)更易发生重过载,占比为60%;对于其中容量在200kW以上、用户数在100户以下的城网配变较多的台区,尤其需要进行容量预警。
以上所述仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (9)

1.一种基于深度信念网络和K-means聚类的配变重过载预警方法,其特征在于:包括如下步骤:
将待测配变的历史负载率、设备台账信息、环境因素、经济和社会发展统计因素的特征变量输入深度信念网络,深度信念网络输出待测配变是否重过载;
将预测的重过载配变的年负荷曲线再通过K-means方法进行聚类,得到各类聚类中心的年负荷曲线;
选出预测的重过载配变中与各类聚类中心相符的重过载配变,进行提前预警。
2.根据权利要求1所述的基于深度信念网络和K-means聚类的配变重过载预警方法,其特征在于:所述深度信念网络是由多个受限玻尔兹曼机堆叠组成的神经网络模型,其核心是RBM单元;每一个RBM都包括一个隐含层和可见层;此结构中层内神经元之间没有连接,层间所有神经元通过权重全部互相连接;RBM是一种基于能量的模型,对于状态(v,h)确定的RBM系统所具有的能量表示为:
Figure FDA0002284674970000011
式中:θ=(wij,ai,bj)为RBM参数,n、m分别为可见层与隐含层神经元数量;v为可见层输入,其表示异常电表的台账信息输入;vi表示可见层神经元i的状态,设定其偏置值为ai;h为隐含层输出,输出为0或1,表示电表未发生故障或电表发生故障;hj表示隐含层神经元j的状态,设定偏置值为bj;神经元i和j连接权重定义为wij
由能量函数E,可得到(v,h)的联合概率分布为:
Figure FDA0002284674970000021
上式中Z(θ)为归一化因子,其表达式如下式:
Figure FDA0002284674970000022
当学习样本的数量为N时,参数θ通过学习样本的最大对数似然函数得到,公式如下:
Figure FDA0002284674970000023
上式中n为学习样本,p(v|θ)为观测数据v的似然函数,其表达式如下式:
Figure FDA0002284674970000024
从可见层计算隐含层,再反馈到可见层;重建后的可见层神经元再一次计算隐含层神经元的实际状态;根据可见层神经元状态计算隐含层第j个神经元,激活概率为:
Figure FDA0002284674970000025
由隐含层重建可见层第i个神经元,设定p为激活的概率,公式如下:
Figure FDA0002284674970000026
由随机梯度上升法求解最大对数似然函数值,得到深度信念网络参数变化量计算准则为:
Figure FDA0002284674970000031
式中:Δwij、Δai、Δbj分别为wij、ai、bj的变化量,<·>data为原始观测数据模型定义的分布;<·>recon为重构后模型定义的分布;
考虑学习率ε的深度信念网络参数更新准则为:
Figure FDA0002284674970000032
其中,k代表模型迭代计算的次数。
3.根据权利要求1所述的基于深度信念网络和K-means聚类的配变重过载预警方法,其特征在于:所述K-means方法实现步骤为:
步骤1选择k个类初始中心;
步骤2进行迭代过程,即对任意一个样本,求其到k个中心的距离,将该样本归到距离最短的中心所在的类;
步骤3计算均值以更新该类的中心值,计算公式为:
Figure FDA0002284674970000033
其中,c为中心值,i为属于该类的样本数量,Xc为该类中心样本均值,Xi为第i个样本;
步骤4对于所有的k个聚类中心,若经过步骤2与步骤3迭代法更新后,中心值收敛,则迭代结束,否则继续迭代。
4.根据权利要求1所述的基于深度信念网络和K-means聚类的配变重过载预警方法,其特征在于:所述深度信念网络训练样本为最近三个月的已知重过载情况的配变的历史负载率、设备台账信息、环境因素、经济和社会发展统计因素的特征变量。
5.根据权利要求1所述的基于深度信念网络和K-means聚类的配变重过载预警方法,其特征在于:分别计算配变的历史负载率、设备台账信息、环境因素、经济和社会发展统计因素的特征变量的Pearson、MI两个指标,选出均大于Pearson、MI指标阈值的特征变量。
6.根据权利要求5所述的基于深度信念网络和K-means聚类的配变重过载预警方法,其特征在于:所述均大于Pearson、MI指标阈值的特征变量分别为:历史负载率的特征变量包括:历史最大负载率、历史平均负载率、历史负载率波动值、历史日平均负载率峰值和历史重过载次数;
环境因素的特征变量包括:历史负载率最大时的最高气温、最低气温和季节信息;
设备台账信息的特征变量包括:设备区县;
经济和社会发展统计因素的特征变量包括:住宅投资增长率、全社会用电增长率和第一产业比重。
7.根据权利要求5所述的基于深度信念网络和K-means聚类的配变重过载预警方法,其特征在于:所述Pearson指标计算公式如下:
Figure FDA0002284674970000041
所述MI指标计算公式如下:
Figure FDA0002284674970000042
式中,n为训练样本的数量;X为相应的历史负载率特征变量;Y为是否发生配变重过载,值为0或1,0为重过载,1为未发生重过载,
Figure FDA0002284674970000051
为相应的历史负载率特征变量平均值,xi为第i个历史负载率特征变量,yi为第i个历史负载率特征变量的重过载情况,Cov()表示求协方差,Var()表示求方差;H(X)表示X的不确定度,H(X|Y)表示在已知Y的情况下,X的不确定度;p()表示求相关性的概率分布。
8.根据权利要求1所述的基于深度信念网络和K-means聚类的配变重过载预警方法,其特征在于:所述配变重过载设置为配变负载率持续1小时均大于70%。
9.根据权利要求1所述的基于深度信念网络和K-means聚类的配变重过载预警方法,其特征在于:预测的重过载配变的年负荷曲线再通过K-means方法进行聚类,得到设备区县、配网类型、配变额定容量、低压用户数四类的聚类中心的年负荷曲线。
CN201911169828.9A 2019-11-22 2019-11-22 基于深度信念网络和K-means聚类的配变重过载预警方法 Active CN111091143B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911169828.9A CN111091143B (zh) 2019-11-22 2019-11-22 基于深度信念网络和K-means聚类的配变重过载预警方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911169828.9A CN111091143B (zh) 2019-11-22 2019-11-22 基于深度信念网络和K-means聚类的配变重过载预警方法

Publications (2)

Publication Number Publication Date
CN111091143A true CN111091143A (zh) 2020-05-01
CN111091143B CN111091143B (zh) 2022-12-23

Family

ID=70393751

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911169828.9A Active CN111091143B (zh) 2019-11-22 2019-11-22 基于深度信念网络和K-means聚类的配变重过载预警方法

Country Status (1)

Country Link
CN (1) CN111091143B (zh)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111784066A (zh) * 2020-07-09 2020-10-16 南方电网科学研究院有限责任公司 一种配电网年运行效率预测方法、系统及设备
CN111984638A (zh) * 2020-07-10 2020-11-24 广州汇通国信科技有限公司 一种基于bp神经网络算法的配变重过载数据治理方法
CN112132331A (zh) * 2020-09-15 2020-12-25 宝信软件(武汉)有限公司 一种基于深度学习的炼钢系统预警方法和系统
CN112258342A (zh) * 2020-10-21 2021-01-22 国网冀北电力有限公司承德供电公司 重过载预警方法、装置以及电子设备
CN112257923A (zh) * 2020-10-21 2021-01-22 国网冀北电力有限公司承德供电公司 重过载预警方法、装置以及电子设备
CN112488360A (zh) * 2020-11-03 2021-03-12 国网河南省电力公司郑州供电公司 基于人工智能的配变异常分析预警方法
CN112541360A (zh) * 2020-12-07 2021-03-23 国泰君安证券股份有限公司 利用超参自适用dbscan聚类的跨平台异常识别转译方法、装置、处理器及存储介质
CN112801333A (zh) * 2020-11-24 2021-05-14 国网福建省电力有限公司宁德供电公司 一种基于XGBoost的配电网线路夏季峰值负荷预测方法
CN113298318A (zh) * 2021-06-18 2021-08-24 国网福建省电力有限公司电力科学研究院 一种新型的配电变压器重过载预测方法
CN113570200A (zh) * 2021-06-30 2021-10-29 国电南瑞科技股份有限公司 一种基于多维信息的电网运行状态监测方法及系统
CN113570109A (zh) * 2021-06-25 2021-10-29 广西电网有限责任公司南宁供电局 一种配变重过载预测的方法
CN114077932A (zh) * 2022-01-07 2022-02-22 国网北京市电力公司 基于大数据的台区异常分析方法、装置、设备及介质
CN114362229A (zh) * 2022-03-21 2022-04-15 广州菲利斯太阳能科技有限公司 一种储能逆变器离网并联的控制系统
CN115936060A (zh) * 2022-12-28 2023-04-07 四川物通科技有限公司 一种基于深度确定性策略梯度的变电站电容温度预警方法
CN116401561A (zh) * 2022-12-08 2023-07-07 国网湖北省电力有限公司信息通信公司 一种基于局部时域特征的设备级运行状态序列的时间关联聚类方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140081793A1 (en) * 2003-02-05 2014-03-20 Steven M. Hoffberg System and method
CN105608512A (zh) * 2016-03-24 2016-05-25 东南大学 一种短期负荷预测方法
CN108647470A (zh) * 2018-05-29 2018-10-12 杭州电子科技大学 一种基于聚类和深度信念网络的漏损初定位方法
CN109270442A (zh) * 2018-08-21 2019-01-25 西安工程大学 基于dbn-ga神经网络的高压断路器故障检测方法
CN109636003A (zh) * 2018-11-14 2019-04-16 北京电力经济技术研究院有限公司 一种高预测精度的电力系统短期负荷预测方法
CN109993278A (zh) * 2017-12-30 2019-07-09 英特尔公司 机器学习环境中的有效卷积
CN110263995A (zh) * 2019-06-18 2019-09-20 广西电网有限责任公司电力科学研究院 考虑负荷增长率与用户用电特性的配变重过载预测方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140081793A1 (en) * 2003-02-05 2014-03-20 Steven M. Hoffberg System and method
CN105608512A (zh) * 2016-03-24 2016-05-25 东南大学 一种短期负荷预测方法
CN109993278A (zh) * 2017-12-30 2019-07-09 英特尔公司 机器学习环境中的有效卷积
CN108647470A (zh) * 2018-05-29 2018-10-12 杭州电子科技大学 一种基于聚类和深度信念网络的漏损初定位方法
CN109270442A (zh) * 2018-08-21 2019-01-25 西安工程大学 基于dbn-ga神经网络的高压断路器故障检测方法
CN109636003A (zh) * 2018-11-14 2019-04-16 北京电力经济技术研究院有限公司 一种高预测精度的电力系统短期负荷预测方法
CN110263995A (zh) * 2019-06-18 2019-09-20 广西电网有限责任公司电力科学研究院 考虑负荷增长率与用户用电特性的配变重过载预测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
XIONGTAO ZHANG 等: "Fuzzy DBN with rule-based knowledge representation and high interpretability", 《2017 12TH INTERNATIONAL CONFERENCE ON INTELLIGENT SYSTEMS AND KNOWLEDGE ENGINEERING (ISKE)》 *
王俊淑 等: "基于深度学习的推荐算法研究综述", 《南京师范大学学报(工程技术版)》 *

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111784066A (zh) * 2020-07-09 2020-10-16 南方电网科学研究院有限责任公司 一种配电网年运行效率预测方法、系统及设备
CN111984638A (zh) * 2020-07-10 2020-11-24 广州汇通国信科技有限公司 一种基于bp神经网络算法的配变重过载数据治理方法
CN112132331A (zh) * 2020-09-15 2020-12-25 宝信软件(武汉)有限公司 一种基于深度学习的炼钢系统预警方法和系统
CN112257923B (zh) * 2020-10-21 2023-02-03 国网冀北电力有限公司承德供电公司 重过载预警方法、装置以及电子设备
CN112258342A (zh) * 2020-10-21 2021-01-22 国网冀北电力有限公司承德供电公司 重过载预警方法、装置以及电子设备
CN112257923A (zh) * 2020-10-21 2021-01-22 国网冀北电力有限公司承德供电公司 重过载预警方法、装置以及电子设备
CN112258342B (zh) * 2020-10-21 2023-02-03 国网冀北电力有限公司承德供电公司 重过载预警方法、装置以及电子设备
CN112488360A (zh) * 2020-11-03 2021-03-12 国网河南省电力公司郑州供电公司 基于人工智能的配变异常分析预警方法
CN112488360B (zh) * 2020-11-03 2023-12-19 国网河南省电力公司郑州供电公司 基于人工智能的配变异常分析预警方法
CN112801333B (zh) * 2020-11-24 2023-12-08 国网福建省电力有限公司宁德供电公司 一种基于XGBoost的配电网线路夏季峰值负荷预测方法
CN112801333A (zh) * 2020-11-24 2021-05-14 国网福建省电力有限公司宁德供电公司 一种基于XGBoost的配电网线路夏季峰值负荷预测方法
CN112541360A (zh) * 2020-12-07 2021-03-23 国泰君安证券股份有限公司 利用超参自适用dbscan聚类的跨平台异常识别转译方法、装置、处理器及存储介质
CN113298318A (zh) * 2021-06-18 2021-08-24 国网福建省电力有限公司电力科学研究院 一种新型的配电变压器重过载预测方法
CN113570109A (zh) * 2021-06-25 2021-10-29 广西电网有限责任公司南宁供电局 一种配变重过载预测的方法
CN113570200B (zh) * 2021-06-30 2023-10-03 国电南瑞科技股份有限公司 一种基于多维信息的电网运行状态监测方法及系统
CN113570200A (zh) * 2021-06-30 2021-10-29 国电南瑞科技股份有限公司 一种基于多维信息的电网运行状态监测方法及系统
CN114077932A (zh) * 2022-01-07 2022-02-22 国网北京市电力公司 基于大数据的台区异常分析方法、装置、设备及介质
CN114362229B (zh) * 2022-03-21 2022-06-14 广州菲利斯太阳能科技有限公司 一种储能逆变器离网并联的控制系统
CN114362229A (zh) * 2022-03-21 2022-04-15 广州菲利斯太阳能科技有限公司 一种储能逆变器离网并联的控制系统
CN116401561A (zh) * 2022-12-08 2023-07-07 国网湖北省电力有限公司信息通信公司 一种基于局部时域特征的设备级运行状态序列的时间关联聚类方法
CN116401561B (zh) * 2022-12-08 2023-10-31 国网湖北省电力有限公司信息通信公司 一种设备级运行状态序列的时间关联聚类方法
CN115936060A (zh) * 2022-12-28 2023-04-07 四川物通科技有限公司 一种基于深度确定性策略梯度的变电站电容温度预警方法
CN115936060B (zh) * 2022-12-28 2024-03-26 四川物通科技有限公司 一种基于深度确定性策略梯度的变电站电容温度预警方法

Also Published As

Publication number Publication date
CN111091143B (zh) 2022-12-23

Similar Documents

Publication Publication Date Title
CN111091143B (zh) 基于深度信念网络和K-means聚类的配变重过载预警方法
CN110909912B (zh) 基于自适应误差反馈的园区电力系统净负荷组合预测方法
CN110705873B (zh) 一种配电网运行状态画像分析方法
CN117977568A (zh) 基于嵌套lstm和分位数计算的电力负荷预测方法
CN111428766B (zh) 一种高维海量量测数据的用电模式分类方法
CN113139596A (zh) 低压台区线损神经网络的优化算法
CN116826710A (zh) 基于负荷预测的削峰策略推荐方法、装置及存储介质
CN111461921A (zh) 一种基于机器学习的负荷建模典型用户数据库更新方法
CN115481788B (zh) 相变储能系统负荷预测方法及系统
CN110689248A (zh) 一种基于云模型和可能度分析的一流城市配电网评估方法
Mao et al. Naive Bayesian algorithm classification model with local attribute weighted based on KNN
CN113762591B (zh) 一种基于gru和多核svm对抗学习的短期电量预测方法及系统
Li et al. Multi‐level refined power system operation mode analysis: A data‐driven approach
CN115186882A (zh) 一种基于聚类的可控负荷空间密度预测方法
Xiaofeng et al. Intelligent identification of potential customers for electricity substitution
Jiayi et al. Power load feature identification and prediction based on structural entropy weight method and improved Bayesian algorithm
CN110852628A (zh) 考虑发展模式影响的农村中长期负荷预测方法
Zhao et al. Short-term Wind Power Prediction Method Based on GCN-LSTM
Shaomin et al. Study of residential power load patterns based on clustering and deep belief network
Liu et al. Line loss prediction method of distribution network based on long short-term memory
Sun et al. Short-term Power Load Forecasting Based on Grey Relational Analysis and Support Vector Machine
CN110728403A (zh) 农村中长期电网负荷预测方法
Luo et al. Data driven load forecasting method considering demand response
Wang et al. Overload analysis of distribution transformers based on relevance analyse and machine learning
Liu et al. A clustering-based feature enhancement method for short-term natural gas consumption forecasting

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant