CN113569462A - 一种计及天气因素的配电网故障等级预测方法及系统 - Google Patents
一种计及天气因素的配电网故障等级预测方法及系统 Download PDFInfo
- Publication number
- CN113569462A CN113569462A CN202110672800.8A CN202110672800A CN113569462A CN 113569462 A CN113569462 A CN 113569462A CN 202110672800 A CN202110672800 A CN 202110672800A CN 113569462 A CN113569462 A CN 113569462A
- Authority
- CN
- China
- Prior art keywords
- data
- distribution network
- fault
- fault level
- meteorological data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000009826 distribution Methods 0.000 title claims abstract description 126
- 238000000034 method Methods 0.000 title claims abstract description 46
- 238000012549 training Methods 0.000 claims abstract description 49
- 238000012706 support-vector machine Methods 0.000 claims abstract description 33
- 238000005457 optimization Methods 0.000 claims abstract description 25
- 238000012545 processing Methods 0.000 claims description 31
- 238000010606 normalization Methods 0.000 claims description 24
- 238000007477 logistic regression Methods 0.000 claims description 19
- 238000007781 pre-processing Methods 0.000 claims description 16
- 238000004422 calculation algorithm Methods 0.000 claims description 11
- 238000012216 screening Methods 0.000 claims description 7
- 238000004140 cleaning Methods 0.000 claims description 6
- 150000001875 compounds Chemical class 0.000 claims description 5
- 238000013501 data transformation Methods 0.000 claims description 5
- 230000010354 integration Effects 0.000 claims description 5
- 238000011156 evaluation Methods 0.000 claims description 3
- 230000006870 function Effects 0.000 description 16
- 230000008569 process Effects 0.000 description 16
- 238000010586 diagram Methods 0.000 description 12
- 238000004364 calculation method Methods 0.000 description 7
- 238000004590 computer program Methods 0.000 description 7
- 230000002159 abnormal effect Effects 0.000 description 5
- 238000012423 maintenance Methods 0.000 description 5
- 239000011159 matrix material Substances 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 2
- 238000007476 Maximum Likelihood Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000005266 casting Methods 0.000 description 2
- 238000010835 comparative analysis Methods 0.000 description 2
- 230000008034 disappearance Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000004880 explosion Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000012886 linear function Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 230000003442 weekly effect Effects 0.000 description 2
- 206010063385 Intellectualisation Diseases 0.000 description 1
- 238000003657 Likelihood-ratio test Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000005315 distribution function Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000000528 statistical test Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2113/00—Details relating to the application field
- G06F2113/04—Power grid distribution networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2119/00—Details relating to the type or aim of the analysis or the optimisation
- G06F2119/02—Reliability analysis or reliability optimisation; Failure analysis, e.g. worst case scenario performance, failure mode and effects analysis [FMEA]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Computer Hardware Design (AREA)
- Geometry (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Supply And Distribution Of Alternating Current (AREA)
Abstract
本发明提供一种计及天气因素的配电网故障等级预测方法及系统,包括:获取设定时段的气象数据;将所述设定时段的气象数据输入到预先优化好的故障等级预测模型中进行预测,得到设定时段配电网的故障等级;其中,所述优化好的故障等级预测模型是基于多支持向量机,采用预先获取的历史气象数据及对应的配电网的历史故障等级进行优化训练得到的。本发明基于多支持向量机模型,提高了对于配电网故障等级预测的准确度,可以有效对配电网的将要发生的故障进行准确预警。
Description
技术领域
本发明涉及电网安全维护技术领域,具体涉及一种计及天气因素的配电网故障等级预测方法及系统。
背景技术
随着现代社会工业化、信息化和智能化水平的不断提高,电能作为二次能源的重要组成部分,不仅在人民生活中不可替代,也在社会发展中起着关键作用。在可靠性工程中,恶劣天气条件是造成配电网设备发生故障的主要原因,可引发一系列电力扰动事故。目前,供电公司对配电网的日常无差别巡视和故障事后被动检修的运维管理方式已不能进一步满足人们日益增长的对供电可靠性的要求。尤其是在已知天气因素的前提下难以准确预测的配电网潜在风险,进行故障预测预警,因此无法有效实施配电网的故障抵御措施,进而容易造成配电网发生故障时无法及时进行维修导致的停电事故及配电网运行线路的损害事故发生。
发明内容
针对现有技术中存在的对于配电网的故障等级预测准确度较低的问题,本发明提供一种计及天气因素的配电网故障等级预测方法,包括:
获取设定时段的气象数据;
将所述设定时段的气象数据输入到预先优化好的故障等级预测模型中进行预测,得到设定时段配电网的故障等级;
其中,所述优化好的故障等级预测模型是基于多支持向量机,采用预先划分好的配电网的故障等级及对应的预处理后的历史气象数据进行优化训练得到的。
优选的,所述故障等级预测模型中的多支持向量机的个数由配电网故障等级的数量确定。
优选的,所述故障等级预测模型的优化训练,包括:
按照所述预先划分好的配电网的故障等级获取对应的历史气象数据,并对所述历史气象数据进行预处理;
利用所述配电网的故障等级和对应的预处理后的历史气象数据构建样本集;
将所述样本集中预处理后的历史气象数据作为模型训练的输入数据,所述配电网的故障等级作为模型的输出数据,利用批量标准化对所述故障等级预测模型进行优化训练,得到优化好的故障等级预测模型。
优选的,所述将所述样本集中预处理后的历史气象数据作为模型训练的输入数据,所述配电网的故障等级作为模型的输出数据,利用批量标准化对所述故障等级预测模型进行优化训练,得到优化好的故障等级预测模型,包括:
计算所有输入数据的均值及方差;
基于所述所有输入数据的均值和方差利用批量标准化公式计算所述每个输入数据经过归一化处理后的向量;
利用所述每个输入数据经过归一化处理后的向量对每个输入数据进行拓展和平移调整,得到调整后的输入和输出;
基于调整后输入和输出对所述故障等级预测模型进行优化训练,得到优化好的故障等级预测模型。
优选的,所述批量标准化公式,如下式所示:
优选的,所述调整后的输入和输出,按下式确定:
式中,yi为第i个调整后的输入对应的调整后的输出,γ、β为可学习参数缩放因子、偏置,BNγ,β(xi)为第i个调整后的输入。
优选的,所述对所述历史气象数据进行预处理,包括:
对获取到的原始气象数据进行数据清洗、数据集成及数据变换处理,得到处理后的原始气象数据;
基于聚类算法对所述处理后的原始气象数据进行聚类,得到聚类结果,并利用聚类结果中包含的每条处理后的原始气象数据之间的误差平方和筛选出离群样本数据并剔除,得到修正后的原始气象数据;
基于所述修正后的原始气象数据作为参数构建逻辑回归模型,利用逻辑回归模型的特征重要性评估方法在所述修正后的原始气象数据中筛选出最优气象特征及对应的预处理后的历史气象数据。
优选的,所述配电网的故障等级的划分是按照配电网在历史设定时段内的停电次数及停电时长比例将所述配电网的故障划分为的一级轻度故障、二级中度故障及三级严重故障。
基于同一发明构思,本发明还提供一种计及天气因素的配电网故障等级预测系统,包括:
获取模块,用于获取设定时段的气象数据;
预测模块,用于将所述设定时段的气象数据输入到预先优化好的故障等级预测模型中进行预测,得到设定时段配电网的故障等级;
其中,所述优化好的故障等级预测模型是基于多支持向量机,采用预先划分好的配电网的故障等级及对应的预处理后的历史气象数据进行优化训练得到的。
优选的,所述预测模块使用的故障等级预测模型中的多支持向量机的个数由配电网故障等级的数量确定。
与现有技术相比,本发明的有益效果为:
1.本发明提供一种计及天气因素的配电网故障等级预测方法及系统,包括:获取设定时段的气象数据;将所述设定时段的气象数据输入到预先优化好的故障等级预测模型中进行预测,得到设定时段配电网的故障等级;其中,所述优化好的故障等级预测模型是基于多支持向量机,采用预先获取的历史气象数据及对应的配电网的历史故障等级进行优化训练得到的。本发明基于多支持向量机模型,提高了对于配电网故障等级预测的准确度,可以有效对配电网的将要发生的故障进行准确预警。
2.根据本发明对配电网的故障等级的精准预测,有利于警示运维管理人员按照配电网的故障等级信息提前检查配电网高风险线路的避雷、防潮装置等,方便配电网安全运维工作的开展进一步降低了配电网停电事故及运行线路的损害事故发生。
附图说明
图1为本发明一种计及天气因素的配电网故障等级预测方法的示意图;
图2为本发明实施例中利用逻辑回归算法选择的特征集合示意图;
图3为本发明实施例中故障等级划分、气象数据预处理及模型优化训练的流程图;
图4为本发明实施例中多回归支持向量机的工作原理示意图;
图5为本发明一种计及天气因素的配电网故障等级预测系统的示意图。
具体实施方式
实施例1
针对现有技术中存在的难以准确预测的配电网故障等级的问题,本发明提供一种计及天气因素的配电网故障等级预测方法,如图1所示,包括:
步骤1,获取设定时段的气象数据;
步骤2,将所述设定时段的气象数据输入到预先优化好的故障等级预测模型中进行预测,得到设定时段配电网的故障等级;
其中,所述优化好的故障等级预测模型是基于多支持向量机,采用预先划分好的配电网的故障等级及对应的预处理后的历史气象数据进行优化训练得到的。
在所述步骤1之前,获取配电网在故障时段的运行数据划分配电网的故障等级,同时对原始气象数据并进行预处理,得到处理后的历史气象数据,然后利用所述划分好的配电网的故障等级及对应的处理后的历史气象数据对故障等级预测模型进行优化训练,得到优化好的故障等级预测模型。
所述故障等级划分,按下述过程进行处理:
获取配电网故障时段的运行数据及对应的原始气象数据,从配电网致障原因的可预测性和预测结果的实际工程可用性出发,为对涉及所处地区气象因素的配电网馈线故障发生等级进行预测而收集所述故障等级预测模型进行训练,收集的配电网故障相关基础数据如表1所示。
表1
所述故障等级的划分过程如下:
根据配电网的历史故障数据,将配电网故障以故障等级形式划分,方便后续进行所述故障等级预测模型的训练及故障等级的预测。
配电网故障风险表示配电网停电发生故障的可能性以及配电网故障导致停电损失的严重程度。配电网故障风险不仅与发生故障的频率有关,还与故障停电时长有关。以配电网区域g为研究对象,以周为统计单位,则该周停电时长比例按下式确定:
式中,Tg为统计周内区域g的停电时长比例,Tgm为区域g统计周内第m次停电事故的停电时间,TgN为区域g的停电总时长,n为统计周内停电次数;
在本实施例中,根据配电网故障风险指标中包含的统计周的区域故障次数和统计周内停电时长比例Tg,将配电网故障等级分为轻度风险、中度风险和严重风险3个等级,如表2所示。
表2
风险等级 | 风险状态 | 每周故障次数n | 周停电时长比例T<sub>i</sub> |
1 | 轻度 | 少于2次 | 小于30% |
2 | 中度 | 3~6次 | 30%~80% |
3 | 严重 | 6次以上 | 80%以上 |
所述历史气象数据的预处理过程如下:
按照所述配电网的故障等级获取对原始气象数据进行划分,并对所述原始气象数据进行预处理,得到预处理后的历史气象数据;
基于所述获取到的原始气象数据,设置正负样本,正样本指馈线发生气象因素相关故障的记录,负样本指馈线未发生气象因素相关故障的记录,可以天、周等适当的时间尺度对数据进行选择;
在本实施例中,由于目前的配电网信息系统仍处于不成熟阶段,其提供的原始气象数据不可避免地会出现不完整、重复甚至异常等情况。为了能为后续故障预测工作提供准确、可靠的参考,按下述流程对原始气象数据进行预处理,具体包括:
数据清洗:删除原始气象数据中的无关数据、重复数据,平滑噪声数据,筛选掉与挖掘主题无关的数据,处理缺失值、异常值等;
数据集成:指将多个数据源合并存放在一个统一的数据存储(如.xls文件、数据库等)中的过程;
数据变换:主要是对原始气象数据进行规范化处理,将原始气象数据转换为易于分析和应用的形式;
离群样本数据剔除:由于原始气象数据来源于不同的类、自然变异、数据测量和收集误差等,得到的多维数据样本中仍可能出现异常数据,这种数据称为离群样本数据,离群样本数据可能会直接影响模型的拟合精度,甚至导致错误的预测结果,因此采用聚类算法检测离群样本数据后将其进行剔除。
利用K-Means算法将样本集聚为k簇,确定各簇的质心;
利用欧式距离计算公式计算各原始气象数据到离它最近的质心的距离与相对距离;
将各原始气象数据到离它最近的质心的相对距离与阈值进行比较,如果大于该阈值,则认为该对象为离群点。
由于本实施例中所使用的原始气象数据的属性多为连续型,因此先对各样本数据进行零均值规范,然后再进行距离计算,零均值规范公式如下式所示:
在本实施例中,采用基于K-Means的聚类算法的离群样本的具体检测步骤如下:
基于每个原始气象数据建立数据矩阵,利用欧式距离分别计算各所述每个原始气象数据到离它最近的质心的距离与相对距离;
所述原始气象数据的数据矩阵如下式所示:
式中,A为原始气象数据的数据矩阵,hnp表示第p个簇中的第n个原始气象数据;
聚类结果中每个簇的质心,按下式确定:
式中,Ei为聚类结果中的第i个簇,ni为第i个簇中原始气象数据的个数,ei为第i个簇Ei的质心,hi为第i个簇中包含的所有原始气象数据。
利用欧氏距离的计算公式计算第i个簇中包含的所有原始气象数据hi与质心ei之间的距离,如下式所示:
式中,dist(ei,hi)为第i个簇中包含的所有原始气象数据hi与质心ei之间的距离,hip为第i个簇中包含的所有原始气象数据hi中的第p个数据。
在本实施例中,使用误差平方和SSE作为度量聚类质量的阈值,对于两种不同的聚类结果,选择SSE较小的一个。
所述误差平方和计算式如下式所示:
式中,SSE为聚类结果的误差平方和,dist(ei,h)为第i个簇Ei的质心ei与第i个簇中包含的所有原始气象数据hi间的距离,Ei为第i个簇,ei为第i个簇Ei的质心,K为簇的数量;
在本实施例中,根据实际数据确定最佳聚类簇数k,这里采用轮廓值法,轮廓系数的核心思想是判断:类间距离与类内距离的相对大小,如果类间距离>类内距离,则说明聚类结果好,反之,则不好。轮廓系数的这种思想与“Fisher线性判别”很相似,都是判定“类间距离”与“类内距离的相对大小。不同的是,轮廓系数是用来衡量“聚类结果”好坏的,而Fisher线性判别中“类间,类内距离比较”是用来“将原始维度数据降到一维线性空间”的,这种降维行为有一个前提,即:使得各类别之间能够在降维后的空间被很好的区分开来。
聚类完成后,需要根据聚类结果评估对象属于簇的程度(离群点得分),其指标主要有两种:一是对象到簇的距离,二是对象到簇的相对距离(点到质心的距离与簇中所有点到质心的距离的中位数之比)。将所述相对距离与设定阈值进行比较,如果大于设定阈值,则认为该对象为离群点;
考虑到各簇的密度不同,利用每个原始气象数据到簇的质心的相对距离进行评估,将所述每个原始气象数据到簇的质心的相对距离大于所述误差平方和SSE的原始气象数据作为离群数据并将其剔除,保证数据的可靠性。
基于上述处理后的原始气象数据,采用逻辑回归模型选取与配电网故障等级预测相关的气象数据的最优特征,将其作为故障特征变量获取对应的处理后的历史气象数据作为所述故障等级预测模型的训练样本数据;
本实施例中采用的LR模型(逻辑回归模型)本质是一个线性模型,每个特征都对应一个模型参数,该参数越大,那么该特征对模型预测结果的影响就会越大,我们就说该特征就越重要,因此LR模型的特征重要性评估方式就是模型参数的大小,即值越大越影响最终累加结果,权重具体使用极大似然估计的方式去预估。一般来说,如果一个特征有助于区分类,并且与任何其他相关特征都没有冗余,那么它就被认为是相关的。
LR通过输入特征空间X中元素的线性函数对后验概率进行建模,同时保证后验概率和为1,且取值保持在[0,1]内。LR模型以J-1logit变换形式表示,如下式所示:
式中,pj为样本x属于j类的概率,βk,j为第j类别下第k个特征的权重,是需要优化的参数,xk为样本x的第k个特征值;
通常采用极大似然法确定模型中的参数,共有(z-1)·(k+1)个参数。
由于LR模型(逻辑回归模型)提供了一套诊断工具,使我们能够量化所提出模型的拟合优度,并相应地选择特征。模型的性能是根据每个特征所获得的对数似然(LogLikelihood,LL)的最大值来评估的。
将偏差D定义为D=-2(当前模型的LL-饱和模型的LL)。饱和模型是指参数个数等于样本大小的模型。偏差的低值表示特征的良好拟合或相当高的预测值。偏差比较两种模型是十分有效的。通过添加新特征减少偏差与似然比统计量相同,后者具有x2卡方分布。
因此,我们可以使用似然比检验在正向选择过程中依次包含特征。如果在添加新特征前后模型偏差的差异等于或高于临界值,那么该气象特征在配电网故障等级预测方面是显著的,否则就不是,以此选定最优气象特征集。
选择最优气象特征集的流程如下:
在该算法中,两个模型偏差的差异可以近似地建模为具有DF(Dgrees ofFreedom)自由度的x2卡方分布,这是由两个模型要估计的参数数量的差异决定的,自由度的临界值一般设定为p=0.01,但也可以任意选择。利用LR算法原理,通过python的sklearn包,可筛选出所需的最优故障特征集,利用实际算例筛选得到的最优故障相关特征,如图2所示,包括:月份、地区、温度、风速、雨天数量、雪天、湿度、3-5级风力天数以及5级以上风力天数。
所述故障等级预测模型的优化训练过程如下:
利用通过上述处理得到的配电网的故障等级和对应的处理后的历史气象数据作为样本数据,针对根据故障程度划分不同等级的多分类问题时,利用多支持向量机的构建故障等级预测模型,即基于MSVM(多支持向量机)的“一对一”方法搭建故障等级预测模型实现配电网故障等级的预测,如图4所示;
将所述历史气象数据作为模型训练的输入数据,所述配电网的历史故障等级作为模型的输出数据对基于多支持向量机构建的故障等级预测模型进行训练,引入目标函数来评价输入数据经模型后的输出值与期望值的一致性程度;
在本实施例中,利用平方折叶损失函数来抑制数值较大的权值,提升模型的泛化性,同时将所述平方折叶函数与正则化惩罚项相结合,得到基于多支持向量机(MSVM)构建的故障等级预测模型的损失函数,如下式所示:
式中,xi为第i个处理后的历史气象数据,其对应的配电网故障等级为yi,f(xi;W)为第j个分类经评分函数f(·)计算的得分,Δ为边界值,W为权重,λ为惩罚强度;
其中,所述权重W是利用Adam优化器进行优化后得到的。
利用所折叶损失函数与所述正则化惩罚项相结合的损失函数来评价输入数据经模型后的输出值与期望值的一致性程度。
在模型训练的过程中引入批标准化层进行模型优化,增加模型的稳定性,加快训练速度;
在本实施例中,为了加快模型收敛速度和提升泛化能力,引入了批标准化层(Batch Normalization,BN),批量标准化层具有正则化效果,可以有效降低过拟合,并能增加模型的稳定性,减少梯度爆炸/消失,加快训练速度。
利用批量标准化层对模型进行优化的过程具体如下:
将所述所有输入数据的代入到均值计算式中计算其均值,如下式所示;
式中,μB为所有输入数据的均值,m为输入数据的数量,xi为第i个输入数据;
将所述所有输入数据的均值及所有输入数据代入到方差计算式中,计算所有输入数据的方差,如下式所示:
基于所述所有输入数据的均值和方差利用批量标准化公式计算每个配电网故障等级下的输入数据经过归一化处理后的向量,如下式所示;
利用所述每个输入数据经过归一化处理后的向量对每个输入数据进行平移和缩放处理,将输入数据强行拉回到均值为0方差为1的标准正态分布,此归一化操作会降低网络的表达能力,故引入β,γ两个可学习参数对数据进行平移和缩放以恢复出原始网络所要学习的特征分布,得到调整后输入和输出;
式中,yi为第i个调整后的输入对应的调整后的输出,γ、β为可学习参数缩放因子、偏置,BNγ,β(xi)为第i个调整后的输入。
基于调整后输入和输出对所述故障等级预测模型进行优化训练,得到优化好的故障等级预测模型。
基于本发明一种计及天气因素的故障等级预测方法优化训练得到的故障等级预测模型及其预测得到预测结果,利用均方根误差(RMSE)、拟合优度(R2)作为性能指标从所述故障等级预测模型的训练样本中选择一部分作为验证数据来评估所述故障等级预测模型的预测精度,选择未进行特征选择的支持向量机及人工神经网络进行建模并做对比分析;
其中,所述故障等级预测模型对应的均方根误差,按下式确定:
式中,yobs为验证数据中给出的输出的观测值,ypred为预测结果对应的预测值;
通过上述均方根误差及拟合优度公式计算出本发明中的故障等级预测模型的均方根误差及拟合优度与所述未进行特征选择的支持向量机及人工神经网络进行对比,基于对比结果可判断本发明中构建的故障等级预测模型的精准度更高。
上述配电网故障等级划分、历史气象数据预处理及故障等级预测模型的优化训练过程还可简化为以下步骤,如图3所示:
S1:根据配电网故障风险指标中包含的统计周的区域故障次数和统计周内停电时长比例划分配电网的故障等级。
S2:获取配电网故障时对应的原始气象数据,并进行清洗、变换、集成、离群样本剔除,再利用逻辑回归模型选取出最优故障特征变量,得到预处理后的历史气象数据;
其中,步骤S2中故障特征变量的获取过程,还包括:
利用逻辑回归方法(Logistic Regression,LR),通过输入特征空间中元素的线性函数对后验概率进行建模,使我们能够量化所提出模型的拟合优度,并相应地选择特征,以此选定最优故障特征集合;
S3:利用多支持向量机(MSVM)构建故障等级预测模型,基于配电网的故障等级与对应的历史气象数据,利用所述利用批量标准化层进行优化训练,得到优化好的故障等级预测模型;
其中,步骤S3具体为:
S31:根据针对的多分类问题,对传统支持向量机(SVM)分类器进行改造,利用多个支持向量机(SVM)进行预测模型的搭建;
S32:在训练过程中进行模型优化,引入批标准化层,增加模型的稳定性,加快训练速度;
S33:评估模型预测精度,并做对比分析,进行预测结果评价。
在所述步骤1中,根据所述最优气象特征集获取设定时段的气象数据,包括:气象数据所在月份、地区及温度、风速、雨天数量、雪天、湿度、3-5级风力天数以及5级以上风力天数。
在所述步骤2中,将获取到的设定时段的气象数据作为所述优化后的故障等级预测模型的输入,利用所述优化后的故障等级预测模型中的每个子分类器都对其进行判别并为相应的故障等级投一票,得票数最多的故障等级被确定为与所述输入对应的设定时段配电网的故障等级。
本发明采用稳定高效的优化后的故障等级预测模型,加之特征选择技术,实现了配电网故障等级的准确预测。特征选择是自动地选择出对于问题最重要的特征子集的过程,并剔除不相关或者冗余的特征,减少无效特征的个数,可降低模型训练的时间,提高模型的准确度。特征选择算法有基于特征权重的递归后向消除算法、基于特征重要性的特征选择方法以及单变量统计测试等。逻辑回归模型作为一个简单的常用的模型,其有非常多的优点,模型简单,容易实现分布式,且具有非常好的可解释性。本发明中采用的支持向量机是一种按监督学习方式对数据进行二元分类的广义线性分类器,通过定义适当的核函数实现非线性变换将输入空间变换到线性可分的高维空间,找到高维空间的最优线性超平面。传统的支持向量机(SVM)用于解决二分类问题,而针对根据故障程度划分不同等级的多分类问题时,本发明采用多类支持向量机(multi-class support vector machine,MSVM),实现多分类,达到很高的分类准确性。
实施例2
基于同一发明构思,本发明还提供一种计及天气因素的配电网故障等级预测系统,如图5所示,包括:
获取模块,用于获取设定时段的气象数据;
预测模块,用于将所述设定时段的气象数据输入到预先优化好的故障等级预测模型中进行预测,得到设定时段配电网的故障等级;
其中,所述优化好的故障等级预测模型是基于多支持向量机,采用预先划分好的配电网的故障等级及对应的预处理后的历史气象数据进行优化训练得到的。
一种计及天气因素的配电网故障等级预测系统,还包括:
配电网故障等级划分模块、历史气象数据预处理模块。
首先获取配电网故障时段的运行数据及对应的原始气象数据,从配电网致障原因的可预测性和预测结果的实际工程可用性出发,为对涉及所处地区气象因素的配电网馈线故障发生等级进行预测而收集所述故障等级预测模型进行训练,收集配电网故障相关基础数据。
所述配电网故障等级的划分模块,用于根据配电网的历史故障数据,将配电网故障以故障等级形式划分,方便后续进行所述故障等级预测模型的训练及故障等级的预测;
在本实施例中,配电网故障等级预测模块根据配电网故障风险指标中包含的统计周的区域故障次数和统计周内停电时长比例,将配电网故障等级分为轻度风险、中度风险和严重风险3个等级。
所述历史气象数据的预处理模块,包括:处理子模块及特征选取子模块;
所述处理子模块,用于按照所述配电网的故障等级获取对原始气象数据进行划分,并对所述原始气象数据进行预处理,得到预处理后的历史气象数据;
在本实施例中,对于所述获取到的原始气象数据设置正负样本,正样本指馈线发生气象因素相关故障的记录,负样本指馈线未发生气象因素相关故障的记录,可以天、周等适当的时间尺度对数据进行选择;
其中,所述处理子模块,包括:数据清洗单元、数据集成单元、数据变换单元及离群样本处理单元;
在本实施例中,由于目前的配电网信息系统仍处于不成熟阶段,其提供的原始气象数据不可避免地会出现不完整、重复甚至异常等情况;为了能为后续故障预测工作提供准确、可靠的参考;
所述数据清洗单元,用于删除原始气象数据中的无关数据、重复数据,平滑噪声数据,筛选掉与挖掘主题无关的数据,处理缺失值、异常值等;
所述数据集成单元,用于将多个数据源合并存放在一个统一的数据存储(如.xls文件、数据库等);
所述数据变换单元,用于对原始气象数据进行规范化处理,将原始气象数据转换为易于分析和应用的形式;
离群样本数据处理单元,用于采用聚类算法检测并剔除针对原始气象数据来源于不同的类、自然变异、数据测量和收集误差等,得到的离群样本数据。
所述特征选取子模块,用于根据所述处理子模块处理后的原始气象数据,采用逻辑回归模型选取与配电网故障等级预测相关的气象数据的最优特征,将其作为故障特征变量获取对应的处理后的历史气象数据作为所述故障等级预测模型的训练样本数据;
其中,通过所述特征选取子模块筛选出的最优特征集中包含的特征有:月份、地区、温度、风速、雨天数量、雪天、湿度、3-5级风力天数以及5级以上风力天数。
所述故障等级预测模型的优化训练过程如下:
利用通过上述处理得到的配电网的故障等级和对应的处理后的历史气象数据作为样本数据,根据故障程度划分不同等级,利用多支持向量机的构建故障等级预测模型;
其中,所述故障等级预测模型中针对种配电网故障等级设计子分类器是基于所述配电网故障等级的数量确定的。
将所述历史气象数据作为模型训练的输入数据,所述配电网的历史故障等级作为模型的输出数据对基于多支持向量机构建的故障等级预测模型进行训练,引入目标函数来评价输入数据经模型后的输出值与期望值的一致性程度;
在本实施例中,利用平方折叶损失函数来抑制数值较大的权值,同时将所述平方折叶函数与正则化惩罚项相结合,得到基于多支持向量机(MSVM)构建的故障等级预测模型的损失函数,提升模型的泛化性;
其中,所述故障等级预测模型中的网络参数是利用Adam优化器进行优化后得到的。
在模型训练的过程中引入批标准化层进行模型优化,增加模型的稳定性,加快训练速度;
在本实施例中,为了加快模型收敛速度和提升泛化能力,引入了批标准化层(Batch Normalization,BN),批量标准化层具有正则化效果,可以有效降低过拟合,并能增加模型的稳定性,减少梯度爆炸/消失,加快训练速度;
利用均值计算公式及方差计算公式计算所有输入数据的均值及方差;
基于所述所有输入数据的均值和方差利用批量标准化公式计算所述每个输入数据经过归一化处理后的向量;
利用所述每个输入数据经过归一化处理后的向量对每个输入数据进行拓展和平移调整,得到调整后的输入和输出;
基于调整后输入和输出对所述故障等级预测模型进行优化训练,得到优化好的故障等级预测模型。
通过均方根误差及拟合优度公式计算出本发明中的故障等级预测模型的均方根误差及拟合优度与所述未进行特征选择的支持向量机及人工神经网络进行对比验证,基于对比结果可判断本发明中构建的故障等级预测模型的精准度更高。
所述获取模块,用于根据所述最优气象特征集获取设定时段的气象数据,包括:气象数据所在月份、地区及温度、风速、雨天数量、雪天、湿度、3-5级风力天数以及5级以上风力天数。
所述预测模块,用于将所述获取模块获取到的设定时段的气象数据作为所述故障等级预测模型的输入,利用所述优化后的故障等级预测模型中的每个子分类器都对其进行判别并为相应的故障等级投一票,得票数最多的故障等级被确定为与所述输入对应的设定时段配电网的故障等级。
显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上仅为本发明的实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均包含在申请待批的本发明的权利要求范围之内。
Claims (10)
1.一种计及天气因素的配电网故障等级预测方法,其特征在于,包括:
获取设定时段的气象数据;
将所述设定时段的气象数据输入到预先优化好的故障等级预测模型中进行预测,得到设定时段配电网的故障等级;
其中,所述优化好的故障等级预测模型是基于多支持向量机,采用预先划分好的配电网的故障等级及对应的预处理后的历史气象数据进行优化训练得到的。
2.根据权利要求1所述方法,其特征在于,所述故障等级预测模型中的多支持向量机的个数由配电网故障等级的数量确定。
3.根据权利要求2所述方法,其特征在于,所述故障等级预测模型的优化训练,包括:
按照所述预先划分好的配电网的故障等级获取对应的历史气象数据,并对所述历史气象数据进行预处理;
利用所述配电网的故障等级和对应的预处理后的历史气象数据构建样本集;
将所述样本集中预处理后的历史气象数据作为模型训练的输入数据,所述配电网的故障等级作为模型的输出数据,利用批量标准化对所述故障等级预测模型进行优化训练,得到优化好的故障等级预测模型。
4.根据权利要求3所述方法,其特征在于,所述将所述样本集中预处理后的历史气象数据作为模型训练的输入数据,所述配电网的故障等级作为模型的输出数据,利用批量标准化对所述故障等级预测模型进行优化训练,得到优化好的故障等级预测模型,包括:
计算所有输入数据的均值及方差;
基于所述所有输入数据的均值和方差利用批量标准化公式计算所述每个输入数据经过归一化处理后的向量;
利用所述每个输入数据经过归一化处理后的向量对每个输入数据进行拓展和平移调整,得到调整后的输入和输出;
基于调整后输入和输出对所述故障等级预测模型进行优化训练,得到优化好的故障等级预测模型。
7.根据权利要求1所述方法,其特征在于,所述对所述历史气象数据进行预处理,包括:
对获取到的原始气象数据进行数据清洗、数据集成及数据变换处理,得到处理后的原始气象数据;
基于聚类算法对所述处理后的原始气象数据进行聚类,得到聚类结果,并利用聚类结果中包含的每条处理后的原始气象数据之间的误差平方和筛选出离群样本数据并剔除,得到修正后的原始气象数据;
基于所述修正后的原始气象数据作为参数构建逻辑回归模型,利用逻辑回归模型的特征重要性评估方法在所述修正后的原始气象数据中筛选出最优气象特征及对应的预处理后的历史气象数据。
8.根据权利要求1所述方法,其特征在于,所述配电网的故障等级的划分是按照配电网在历史设定时段内的停电次数及停电时长比例将所述配电网的故障划分为的一级轻度故障、二级中度故障及三级严重故障。
9.一种计及天气因素的配电网故障等级预测系统,其特征在于,包括:
获取模块,用于获取设定时段的气象数据;
预测模块,用于将所述设定时段的气象数据输入到预先优化好的故障等级预测模型中进行预测,得到设定时段配电网的故障等级;
其中,所述优化好的故障等级预测模型是基于多支持向量机,采用预先划分好的配电网的故障等级及对应的预处理后的历史气象数据进行优化训练得到的。
10.根据权利要求9所述系统,其特征在于,所述预测模块使用的故障等级预测模型中的多支持向量机的个数由配电网故障等级的数量确定。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110672800.8A CN113569462A (zh) | 2021-06-17 | 2021-06-17 | 一种计及天气因素的配电网故障等级预测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110672800.8A CN113569462A (zh) | 2021-06-17 | 2021-06-17 | 一种计及天气因素的配电网故障等级预测方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113569462A true CN113569462A (zh) | 2021-10-29 |
Family
ID=78162213
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110672800.8A Pending CN113569462A (zh) | 2021-06-17 | 2021-06-17 | 一种计及天气因素的配电网故障等级预测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113569462A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113792824A (zh) * | 2021-11-17 | 2021-12-14 | 广东电网有限责任公司佛山供电局 | 一种配电网故障停电影响区域分类方法和系统 |
CN114091705A (zh) * | 2021-11-26 | 2022-02-25 | 国网四川省电力公司电力科学研究院 | 一种电力系统失稳分析方法、装置、电子设备和存储介质 |
CN115270965A (zh) * | 2022-07-29 | 2022-11-01 | 国网浙江省电力有限公司经济技术研究院 | 一种配电网线路故障预测方法和装置 |
-
2021
- 2021-06-17 CN CN202110672800.8A patent/CN113569462A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113792824A (zh) * | 2021-11-17 | 2021-12-14 | 广东电网有限责任公司佛山供电局 | 一种配电网故障停电影响区域分类方法和系统 |
CN114091705A (zh) * | 2021-11-26 | 2022-02-25 | 国网四川省电力公司电力科学研究院 | 一种电力系统失稳分析方法、装置、电子设备和存储介质 |
CN115270965A (zh) * | 2022-07-29 | 2022-11-01 | 国网浙江省电力有限公司经济技术研究院 | 一种配电网线路故障预测方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113569462A (zh) | 一种计及天气因素的配电网故障等级预测方法及系统 | |
CN105117602B (zh) | 一种计量装置运行状态预警方法 | |
CN110837866A (zh) | 基于XGBoost的电力二次设备缺陷程度评估方法 | |
CN110222991B (zh) | 基于rf-gbdt的计量装置故障诊断方法 | |
CN111027615B (zh) | 基于机器学习的中间件故障预警方法和系统 | |
CN111476435B (zh) | 基于密度峰值的充电桩负荷预测方法 | |
CN110297469B (zh) | 基于重采样的集成特征选择算法的生产线故障判断方法 | |
Ge et al. | Comparative study on defect prediction algorithms of supervised learning software based on imbalanced classification data sets | |
CN111369045A (zh) | 一种短期光伏发电功率预测的方法 | |
CN117113235B (zh) | 一种云计算数据中心能耗优化方法及系统 | |
CN112682273B (zh) | 基于代价敏感轻量级梯度提升机的风电机组故障检测方法 | |
CN110717610A (zh) | 一种基于数据挖掘的风电功率预测方法 | |
CN112418476A (zh) | 一种超短期电力负荷预测方法 | |
CN112363896A (zh) | 日志异常检测系统 | |
CN115034485A (zh) | 一种基于数据空间的风电功率区间预测方法及装置 | |
CN110705859A (zh) | 基于pca-自组织神经网络的中低压配电网运行状态评估方法 | |
CN115858794A (zh) | 用于网络运行安全监测的异常日志数据识别方法 | |
CN115526258A (zh) | 基于Spearman相关系数特征提取的电力系统暂稳评估方法 | |
CN113221442B (zh) | 一种电厂设备健康评估模型的构建方法及装置 | |
CN117674119A (zh) | 电网运行风险评估方法、装置、计算机设备和存储介质 | |
CN111984514A (zh) | 基于Prophet-bLSTM-DTW的日志异常检测方法 | |
CN116151799A (zh) | 一种基于bp神经网络的配电线路多工况故障率快速评估方法 | |
Dui et al. | Reliability Evaluation and Prediction Method with Small Samples. | |
CN115392710A (zh) | 一种基于数据过滤的风电机组运行决策方法及系统 | |
CN115034128A (zh) | 一种智慧风电场智慧风电场风电机组评价方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |