CN109490704A - 一种基于随机森林算法的配电网故障区段定位方法 - Google Patents
一种基于随机森林算法的配电网故障区段定位方法 Download PDFInfo
- Publication number
- CN109490704A CN109490704A CN201811202219.4A CN201811202219A CN109490704A CN 109490704 A CN109490704 A CN 109490704A CN 201811202219 A CN201811202219 A CN 201811202219A CN 109490704 A CN109490704 A CN 109490704A
- Authority
- CN
- China
- Prior art keywords
- fault
- sample
- section
- distribution network
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01R—MEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
- G01R31/00—Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere
- G01R31/08—Locating faults in cables, transmission lines, or networks
- G01R31/081—Locating faults in cables, transmission lines, or networks according to type of conductors
- G01R31/086—Locating faults in cables, transmission lines, or networks according to type of conductors in power transmission or distribution networks, i.e. with interconnected conductors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
- Y04S10/52—Outage or fault management, e.g. fault detection or location
Abstract
本发明公开了一种基于随机森林算法的配电网故障区段定位方法,属于配电网及其自动化的技术领域。本发明定义了配电网的馈线开关状态和馈线区段编码,确定了原始故障样本集。通过考虑原始故障样本集的高维不平衡特性,采用过采样和基于学习模型的特征选择方法进行样本预处理。本发明基于预处理后的样本集,提出利用随机森林算法对故障属性与故障区段之间的关联性关系进行数据挖掘,并构建了故障定位预测模型。本发明实现了配电网发生单一和多重故障的区段定位,且对畸变信息具有较强的容错性。
Description
技术领域
本发明涉及一种基于随机森林算法的配电网故障区段定位方法,属于配电网及其自动化技术领域。
背景技术
近年来,随着分布式电源(Distributed Generation,DG)接入配电网,传统配电网由单电源辐射网络变化为功率双向流动的多电源复杂结构。同时,由于配网规模不断扩大且网络拓扑结构越来越复杂,馈线开关和区段数也大幅增加,发生故障时馈线开关故障电流越限与故障区段的关联关系变得复杂。此外,监控终端一般是安装于环境恶劣的户外,在极端天气下会使终端上传的故障信息发生畸变或丢失,利用传统定位方法会造成故障区段的误判或漏判。配网发生故障后的故障定位是配电网故障处理的最基本环节。在目前基于馈线监控终端(Feeder Terminal Unit,FTU)的集中智能配电系统下,对FTU上传畸变故障信息的容错处理直接影响了故障区段定位的准确性。
随着数据挖掘技术的发展,通过对大量的、不完全的数据进行挖掘,从而发现其中隐藏的关系、规则已成为现实,目前也在电力行业得到了广泛的应用。利用数据挖掘技术需要对历史故障数据离线挖掘实现数据的分类,分类的精度决定了定位的准确性。但由于馈线区段数众多、故障位置发生概率不一致,造成历史故障数据特征数、样本数存在高维和不平衡的特性,大大降低了模型的预测精度,所以在建模前需要对原始数据进行预处理。作为数据挖掘技术的实现方法,机器学习算法可用于实现故障区段定位,但定位的快速性和准确性受算法复杂性和收敛性的影响。针对配网故障区段定位要求,合理地选择机器学习算法应用于故障定位,从而进一步提升故障区段定位的准确性和容错性,有着重要的应用价值和意义。
发明内容
为了克服现有技术中存在的不足,本发明提供一种基于随机森林算法的配电网故障区段定位方法。
本发明为解决上述技术问题采用以下技术方案:
本发明提供一种基于随机森林算法的配电网故障区段定位方法,包括如下步骤:
步骤1,定义配电网的馈线开关状态和馈线区段编码;
步骤2,确定原始故障样本集;
步骤3,采用过采样和特征选择方法对原始故障样本集进行预处理;
步骤4,基于预处理后的故障样本集采用随机森林算法构建定位预测模型,实现对故障区段的在线预测;
作为优选方案,所述步骤1具体为:
步骤1-a,配电网发生短路故障时,馈线监控终端FTU采集由配电网系统电源、分布式电源向故障区段输出的高于FTU整定阈值的故障电流信息,其中包括短路电流的方向信息,设定短路电流方向为
步骤1-b,定义配电网馈线的网络正方向:规定主电源到馈线的方向为整个网络的唯一正方向
步骤1-c,定义相间短路故障情形下开关状态编码:
式中,Ij_d为第j个馈线分段开关的状态编码;
步骤1-d,定义配电网馈线区段状态编码:设定馈线区段存在0、1两种状态,0表示区段正常,1表示区段故障。
作为优选方案,所述步骤2具体为:
步骤2-a,根据配电网网络拓扑,将断路器、分段开关从系统电源处的进线开关依次编号;
步骤2-b,定义各馈线分段开关的电流越限信息为故障属性,即原始故障样本集的条件特征,故障属性对应的故障区段为样本集的决策特征,Ij_d为第j个分段开关的故障属性;
步骤2-c,定义故障区段与对应上传的故障属性值为故障样本,原始故障样本集包含所有故障区段发生单重或多重故障时的故障样本。
作为优选方案,所述步骤3具体为:
步骤3-a,根据每个故障区段对应样本数量,将故障区段分为少类和多类两种,其中,少类对应样本为少类样本,多类对应样本为多类样本;
步骤3-b,采用SMOTE过采样技术对原始故障样本集进行平衡预处理:确定每个少类样本相距最近的多个相同少类样本,在当前少类样本与其近邻样本的连线上生成新合成样本,从而补充其与多类样本相差的样本数量;
yi,t=xi,t+(x′i,t-xi,t)×rand[0,1]
i=1,2,…,n1;t=1,2,…,n2
Yi={yi,1,yi,2,…,yi,n2}
式中,xi,t为第i个少类样本的第t个故障属性值;x′i,t为第i个少类样本的近邻样本的第t个故障属性值;n1为少类样本总数;n2为故障属性总数;Yi为第i个少类样本的新合成样本;yi,t为第i个少类新合成样本的第t个故障属性值;rand[0,1]表示在[0,1]之间的一个随机数;
步骤3-c,采用基于学习模型的特征选择方法,通过向步骤3-b形成的新样本集中的条件特征增加小干扰项生成阴影特征,并对步骤3-b形成的新样本集的条件特征进行随机调整,最后根据平均精确度减少指标衡量其对模型预测精度的影响,求得各条件特征的重要度;对比步骤3-b形成的新样本集中的条件特征与阴影特征的重要度大小,若原始特征的重要度高于对应阴影特征的重要度,则该原始特征为重要特征并被提取出来,其余特征被剔除,实现对过采样后故障样本集大量条件特征的降维。
作为优选方案,步骤3-a中少类样本的样本数量低于多类样本的样本数量一半。
作为优选方案,步骤3-c中平均精确度减少指标实现如下式:
λii=1-(η0-RF[Dii])ii=1,2,…,2×n2
式中:λii为第ii个特征的重要度;η0为学习模型对新样本集的分类精度;RF[*]为学习模型分类精度对样本集预测的函数;Dii为随机调整第ii个特征顺序的扩展样本集。
作为优选方案,所述步骤4中基于步骤3预处理后得到的故障样本集,采用随机森林算法构建定位预测模型,包含训练子集的选取、决策树的构建、森林的形成以及森林的扩展,具体为:
步骤4-a,训练子集的选取:定义预处理后的故障样本集作为训练样本集,采用有放回无权重抽样技术从训练样本集中随机抽取ntree个训练子集;
步骤4-b,决策树的构建:根据步骤4-a抽取的ntree个训练子集构建对应规模的决策树,每棵决策树通过随机选取条件特征并将其作为分裂节点进行树的生长;
步骤4-c,森林的形成即定位预测模型的形成:在满足决策树设定规模的前提下,形成森林,即定位预测模型:
式中:H(X)为随机森林定位预测模型;hi(*)为第l个决策树模型;yk为第l个决策树对上传故障信息序列X的分类结果,也即所有故障区段集合Y中第k个故障区段;I(*)为示性函数;
若所有决策树对故障信息序列X的所有分类结果中第k个类别yk的个数最多,那么此类别便作为预测结果,经解析即为该故障信息序列对应的故障区段;
步骤4-d,森林的扩展即定位预测模型的扩展:通过将新增区段发生故障时上传的故障属性值和对应故障区段作为新故障样本,利用SMOTE技术使新故障样本数与原模型中各决策树的训练子集样本数保持相同;根据随机森林算法的可扩展特性,将新故障样本集作为训练样本子集构建对应的CART决策树,并将其作为森林中新生长的决策树加至随机森林模型中,实现对定位预测模型的扩展。
作为优选方案,步骤4-b中随机选取所有故障属性中一半的故障属性作为决策树的分裂节点,采用基于Gini系数的CART算法来确定分裂节点分裂时的分裂属性,并按照其划分实现决策树的分枝生长,公式如下:
式中:M为训练样本集,Gini(M)为M的Gini系数;Ginispilt(M)为M中分裂节点的Gini系数,pb为M中第b个故障区段类别样本数与总样本数的比值;n为故障区段类别总数;M1、M2为采用二分递归的方式产生左右两个分枝的子树将M随机分成的两个子集,m1、m2分别为M1、M2对应样本个数;m为M中的样本总数。
作为优选方案,所述步骤4中随机森林算法的参数设置为:1)随机森林软件包为Random Forest 4.7-10,2)决策树的数量为200,3)分裂节点的个数为10。
本发明采用以上技术方案与现有技术相比,具有以下技术效果:本发明提出的一种基于随机森林算法的配电网故障区段定位方法,考虑了原始故障样本集的高维不平衡特性,采用SMOTE过采样技术实现对样本集的平衡预处理,并利用基于学习模型的特征选择方法实现对样本集的降维处理。本发明提出采用随机森林算法对故障属性与故障区段之间的关联性关系进行数据挖掘,构建了随机森林定位预测模型,实现了配电网馈线发生单一和多重故障的区段定位,提升了定位的准确性和容错性。
附图说明
图1为基于随机森林算法的配电网故障区段定位过程图;
图2为含分布式电源的简单配电网络图;
图3为随机森林模型的构建过程图;
图4为含分布式电源的复杂配电网络图。
具体实施方式
下面详细描述本发明的实施方式,所述实施方式的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
本技术领域技术人员可以理解的是,除非另外定义,这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样定义,不会用理想化或过于正式的含义来解释。
下面结合附图对本发明的技术方案做进一步的详细说明:
如图1所示,一种基于随机森林算法的配电网故障区段定位方法,包括如下步骤:
步骤1,定义配电网的馈线开关状态和馈线区段编码,具体包括以下步骤:
如图2所示,以一个简单配电网络为例,其包含5个馈线区段,一个主电源S,一个分布式电源DG,其中分段开关用黑色圆点表示,编号为1-5;圆点之间的线段表示馈线区段x1-x5;实线箭头代表短路电流流向,区段x3发生故障。
步骤1-a,配电网发生短路故障时,馈线监控终端(Feeder terminal unit,FTU)采集由配电网系统电源、分布式电源向故障区段输出的高于FTU整定阈值的故障电流信息,其中包括短路电流的方向信息,设定短路电流方向为
步骤1-b,定义配电网馈线的网络正方向:规定主电源到馈线的方向为整个网络的唯一正方向
步骤1-c,定义相间短路故障情形下开关状态编码:
式中,Ij_d为第j个馈线分段开关的状态编码。
步骤1-d,定义配电网馈线区段状态编码,设定馈线区段存在0、1两种状态,0表示区段正常,1表示区段故障。
步骤2,确定原始故障样本集,具体包括以下步骤:
步骤2-a,根据配电网网络拓扑,将断路器、分段开关等从系统电源处的进线开关依次编号;
步骤2-b,定义各开关的电流越限信息为故障属性,即原始故障样本集的条件特征,故障属性对应的故障区段为样本集的决策特征,Ij_d为第j个分段开关的故障属性;
步骤2-c,定义故障区段与对应上传的故障属性值为故障样本,原始故障样本集包含所有区段发生单重或多重故障时的故障样本。
步骤3,所述步骤3包括以下步骤:
步骤3-a,考虑到故障发生在配网不同馈线区段的概率不同,导致原始故障样本集中某些故障区段对应的样本数要明显少于其他区段对应的样本数量,较少数量的样本数一般低于数量较多样本的数量一半,则称这些样本数少的故障区段为少类,对应样本称为少类样本;样本数多的故障区段称为多类。多类样本和少类样本组成的原始故障样本集是不平衡样本集;
步骤3-b,采用SMOTE过采样技术进行平衡预处理。根据相距较近的少类样本之间的样本仍是少类样本,通过确定每个少类样本相距最近的多个相同少类样本,然后在该类样本与其近邻样本的连线上生成新样本,从而补充其与多类样本数相差的数量。具体实现如下式:
yi,t=xi,t+(x′i,t-xi,t)×rand[0,1]
i=1,2,…,n1;t=1,2,…,n2
Yi={yi,1,yi,2,…,yi,n2}
式中:xi,t为第i个少类样本的第t个故障属性值;x′i,t为第i个少类样本的近邻样本的第t个故障属性值;n1为少类样本总数;n2为故障属性总数;Yi为第i个少类样本的新合成样本;yi,t为第i个少类新样本的第t个故障属性值;rand[0,1]表示在[0,1]之间的一个随机数;
步骤3-c,配网结构复杂、开关众多造成原始样本集中的条件特征冗余,导致原始样本集存在高维特性;
步骤3-d,采用基于学习模型的特征选择方法,通过向新样本集中的条件特征增加小干扰项生成阴影特征,并对新样本集的特征进行随机调整,最后根据平均精确度减少指标衡量其对模型预测精度的影响,求得各特征的重要度。对比新样本集中的条件特征与阴影特征的重要度大小,若原始特征的重要度高于对应阴影特征的重要度,则该原始特征为重要特征并被提取出来,其余特征被剔除,实现对过采样后故障样本集大量条件特征的降维。其中平均精确度减少指标实现如下式:
λii=1-(η0-RF[Dii])ii=1,2,…,2×n2
式中:λii为第ii个特征的重要度;η0为学习模型对新样本集的分类精度;RF[*]为学习模型分类精度对样本集预测的函数;Dii为随机调整第i个特征顺序的扩展样本集。
步骤4,所述步骤4具体为:
步骤4-a,基于过采样和特征选择预处理后的故障样本集,采用随机森林算法构建定位预测模型,包含训练子集的选取、决策树的构建、森林的形成以及森林的扩展;
步骤4-b,选取训练子集;定义预处理后的样本集作为训练样本集,采用有放回无权重抽样技术(bagging抽样)从训练样本集M中随机抽取ntree个训练子集;
步骤4-c,根据抽取的ntree个训练子集构建对应规模的决策树,每棵决策树通过随机选取条件特征并将其作为分裂节点进行树的生长。随机选取新样本集的所有故障属性中一半的故障属性作为决策树的分裂节点。针对离散故障属性变量,采用基于Gini系数的CART算法来确定分裂节点分裂时的分裂属性,并按照其划分实现决策树的分枝生长。公式如下:
式中:M为训练样本集,Ginispilt(M)为M中分裂节点的Gini系数,Gini(M)为M的Gini系数;pb为样本集M中第b个故障区段类别样本数与总样本数的比值;n为故障区段类别总数;采用二分递归的方式产生左右两个分枝的子树,将M随机分成两个子集M1、M2,对应样本个数分别为m1、m2;m为M中的样本总数;
步骤4-d,在满足决策树设定规模的前提下,形成森林,即定位预测模型。对于预测模型中的每个决策树,从根节点到叶节点的每一条路径相当于一条定位规则。构建的定位预测模型本质上是全部决策树包含的所有定位规则的集合。利用定位预测模型对FTU实时上传的故障信息序列进行预测,获得各个决策树的分类结果,将所有决策树的结果汇总并通过简单多选的投票方式确定最终的预测结果,通过解析得到对应的故障区段。具体实现如下:
式中:H(X)为随机森林定位预测模型;hi(*)为第l个决策树模型;yk为第l个决策树对上传故障信息序列X的分类结果,也即所有故障区段集合Y中第k个故障区段;I(*)为示性函数。若所有决策树对故障信息序列X的所有分类结果中第k个类别yk的个数最多,那么此类别便作为预测结果,经解析即为该故障信息序列对应的故障区段;
步骤4-e,针对开关数和区段数增多导致条件特征和决策特征也随着增多的情形,通过将新增区段发生故障时上传的故障属性值和对应故障区段作为新故障样本,利用SMOTE技术使新故障样本数与原模型中各决策树的训练子集样本数保持相同。根据随机森林算法的可扩展特性,将新故障样本集作为训练样本子集构建对应的CART决策树,并将其作为森林中新生长的决策树加至随机森林模型中,实现对定位预测模型的扩展。随机森林定位模型的构建过程如图3所示。
下面结合图4,以含分布式电源的复杂配电网络为具体实例说明本发明所述模型与算法的可行性和有效性:
如图4所示,为本方法算例中所用含分布式电源的复杂配电网络,共设置23个分段开关,用黑色圆点表示,编号为1-23;圆点之间的线段表示馈线区段,编号为(1)-(23)。其中,分段开关1处为系统主电源S,DG1、DG2、DG3为接入配电网的3个分布式电源,分别设置在馈线末端的分段开关12、20处,以及馈线中分段开关5与6之间,K1-K3为对应分布式电源的接入开关。
本发明采用随机森林算法求解配电网故障区段定位问题,基于R软件编制了基于随机森林算法的配电网故障区段定位算法程序,算法中的参数设置如表1所示。
表1参数设置
参数 | 取值 |
随机森林软件包 | Random Forest 4.7-10 |
决策树的数量 | 200 |
分裂节点的个数 | 10 |
根据图3配电网络构建原始故障样本集,主要包括两个部分:单一故障区段样本集和两重故障区段样本集,其中每种故障区段各设定10个样本。计及不平衡特性,随机设定单一故障区段样本集中的5个不同区段的样本数仅为5个,见表2。
表2原始故障样本集
以区段(8)发生短路故障为例进行分析。根据图3所示含分布式电源配电网,在不考虑上传信息发生畸变的情形下,故障信息序列为[1 1 1 -1 -1 0 0 1 -1 -1 -1 -1 -1-1 -1 -1 -1 -1 -1 -1 0 0 0],将其输入至已离线构建的故障定位预测模型,经其处理和投票选择后能够预测区段(8)为故障区段,满足实际要求。考虑故障信息序列存在变异信息的情形,当开关11处安装的FTU上报的信息发生畸变,在输入定位模型之后,仍能获得故障区段(8),定位结果与预先设置的故障情况相吻合,且符合关于故障区段确定的要求。
考虑两种情形:
情形1:FTU上传故障信息序列不存在畸变信息;
情形2:FTU上传故障信息序列存在畸变信息。
情形1下对含分布式电源配网进行故障区段定位,定位结果如表3所示。当馈线上同一支路或不同支路上发生单一或多重故障时,本发明提出的定位方法能够获得准确的预测结果,具有较高的准确性。
表3定位结果
情形2下FTU实际上传的故障信息序列中存在两个、三个,甚至四个变异信息,且存在不同的畸变情形时,如1畸变为0、-1,-1变为0、1等,采用所提的定位方法进行求解,仿真结果如表4所示。此时定位模型并未受其影响,仍能获得正确的定位结果,表明算法的容错性较好。
表4仿真结果
综合上述两种情形,本发明提出的基于随机森林算法的配电网故障区段定位方法,能实现配网馈线发生单一和多重故障下区段的准确与容错定位。
本文为验证样本集预处理的必要性和有效性,利用OOB数据通过OOB估计误差率来衡量定位预测模型对预处理前后样本集的泛化能力。每棵决策树对OOB样本集分类错误的样本个数与OOB样本集总数的比值即为每棵决策树的OOB误差率,将随机森林中所有决策树的OOB误差率取均值最终获得故障定位预测模型的OOB估计误差率。关于样本集预处理前后的OOB估计误差率,如表5所示。
表5样本集预处理前后的OOB估计误差率
样本集 | OOB估计误差率/% |
原始故障样本集 | 10.39 |
预处理后的平衡样本集 | 0.14 |
由表5可知,基于平衡新样本集构建的定位预测模型的OOB估计误差率仅为0.14%,而基于原始故障样本集构建的预测模型的OOB估计误差率为10.39%,表明本发明对原始故障样本集进行预处理的必要性。
针对本文构建的故障样本集,通过研究随机森林算法的决策树数量与OOB估计误差率之间的关系,分析其对定位预测模型精度的影响,仿真结果如表6所示。由表6可知,森林规模不同大小的设定会造成定位模型的预测精度有所不同。当其取值较小时将导致定位模型倾向决策树,预测精度不高;取值较大又会造成模型分类过细,增加模型构造的复杂度。针对本文的样本集规模,当决策树个数为200时会得到较高的分类精度。
表6仿真结果
森林规模 | OOB估计误差率/% |
10 | 2.14 |
100 | 0.17 |
200 | 0.14 |
400 | 0.15 |
500 | 0.15 |
此外,为验证本发明所提方法在区段定位容错性能上的优越性,比较了基于粗糙集理论(RS)、基于随机森林(RF)和基于粒子群算法(BPSO)定位方法的定位效果。分别利用三种方法对图3配电线路发生不同单一、多重故障,以及计及多个变异信息时上传的故障信息序列进行故障区段定位。其中单一、多重故障分别选取10种不同区段作为故障区段进行分析,并在发生单一故障时准确上传的故障信息序列中分别设定1、3、4个变异信息,且畸变位置不与故障区段相邻。分析上述故障信息序列情形下能够准确定位区段的个数,结果如表7所示。
表7能够准确定位区段的个数
由表7可知,在不存在变异信息时,3种定位方法对上述设定多个故障信息序列情形能够准确定位的个数基本相同,都能较好地实现故障区段准确定位。一旦出现畸变信息,尽管基于BPSO的定位方法具有一定的容错性能,但随着故障信息序列中变异信息数增多,其准确定位不同故障区段的个数会明显下降,导致区段误判。而基于随机森林的定位方法仍能准确定位,从而表明利用本文所提方法能够很大地提升容错性能。
此外,本文采用文献中基于粗糙集与遗传算法结合的定位模型与本文方法的构造速度进行比较,结果见表8。由于基于粗糙集理论的定位方法需要遗传算法的辅助约简处理,所以增加了模型的构造复杂度,因此表4-7显示随机森林模型的构造速度要明显快于基于粗糙集的定位模型。
表8构造速度比较结果
算法类型 | 构造速度/s |
基于RF定位方法 | 1.131 |
基于RS定位方法 | 27.340 |
以上所述仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (9)
1.一种基于随机森林算法的配电网故障区段定位方法,其特征在于,包括如下步骤:
步骤1,定义配电网的馈线开关状态和馈线区段编码;
步骤2,确定原始故障样本集;
步骤3,采用过采样和特征选择方法对原始故障样本集进行预处理;
步骤4,基于预处理后的故障样本集采用随机森林算法构建定位预测模型,实现对故障区段的在线预测。
2.根据权利要求1所述的一种基于随机森林算法的配电网故障区段定位方法,其特征在于,所述步骤1具体为:
步骤1-a,配电网发生短路故障时,馈线监控终端FTU采集由配电网系统电源、分布式电源向故障区段输出的高于FTU整定阈值的故障电流信息,其中包括短路电流的方向信息,设定短路电流方向为
步骤1-b,定义配电网馈线的网络正方向:规定主电源到馈线的方向为整个网络的唯一正方向
步骤1-c,定义相间短路故障情形下开关状态编码:
式中,Ij_d为第j个馈线分段开关的状态编码;
步骤1-d,定义配电网馈线区段状态编码:设定馈线区段存在0、1两种状态,0表示区段正常,1表示区段故障。
3.根据权利要求1所述的一种基于随机森林算法的配电网故障区段定位方法,其特征在于,所述步骤2具体为:
步骤2-a,根据配电网网络拓扑,将断路器、分段开关从系统电源处的进线开关依次编号;
步骤2-b,定义各馈线分段开关的电流越限信息为故障属性,即原始故障样本集的条件特征,故障属性对应的故障区段为样本集的决策特征,Ij_d为第j个分段开关的故障属性;
步骤2-c,定义故障区段与对应上传的故障属性值为故障样本,原始故障样本集包含所有故障区段发生单重或多重故障时的故障样本。
4.根据权利要求1所述的一种基于随机森林算法的配电网故障区段定位方法,其特征在于,所述步骤3具体为:
步骤3-a,根据每个故障区段对应样本数量,将故障区段分为少类和多类两种,其中,少类对应样本为少类样本,多类对应样本为多类样本;
步骤3-b,采用SMOTE过采样技术对原始故障样本集进行平衡预处理:确定每个少类样本相距最近的多个相同少类样本,在当前少类样本与其近邻样本的连线上生成新合成样本,从而补充其与多类样本相差的样本数量;
yi,t=xi,t+(x′i,t-xi,t)×rand[0,1]
i=1,2,…,n1;t=1,2,…,n2
式中,xi,t为第i个少类样本的第t个故障属性值;x′i,t为第i个少类样本的近邻样本的第t个故障属性值;n1为少类样本总数;n2为故障属性总数;Yi为第i个少类样本的新合成样本;yi,t为第i个少类新合成样本的第t个故障属性值;rand[0,1]表示在[0,1]之间的一个随机数;
步骤3-c,采用基于学习模型的特征选择方法,通过向步骤3-b形成的新样本集中的条件特征增加小干扰项生成阴影特征,并对步骤3-b形成的新样本集的条件特征进行随机调整,最后根据平均精确度减少指标衡量其对模型预测精度的影响,求得各条件特征的重要度;对比步骤3-b形成的新样本集中的条件特征与阴影特征的重要度大小,若原始特征的重要度高于对应阴影特征的重要度,则该原始特征为重要特征并被提取出来,其余特征被剔除,实现对过采样后故障样本集大量条件特征的降维。
5.根据权利要求4所述的一种基于随机森林算法的配电网故障区段定位方法,其特征在于,步骤3-a中少类样本的样本数量低于多类样本的样本数量一半。
6.根据权利要求4所述的一种基于随机森林算法的配电网故障区段定位方法,其特征在于,步骤3-c中平均精确度减少指标实现如下式:
λii=1-(η0-RF[Dii])ii=1,2,…,2×n2
式中:λii为第ii个特征的重要度;η0为学习模型对新样本集的分类精度;RF[*]为学习模型分类精度对样本集预测的函数;Dii为随机调整第ii个特征顺序的扩展样本集。
7.根据权利要求1所述的一种基于随机森林算法的配电网故障区段定位方法,其特征在于,所述步骤4中基于步骤3预处理后得到的故障样本集,采用随机森林算法构建定位预测模型,包含训练子集的选取、决策树的构建、森林的形成以及森林的扩展,具体为:
步骤4-a,训练子集的选取:定义预处理后的故障样本集作为训练样本集,采用有放回无权重抽样技术从训练样本集中随机抽取ntree个训练子集;
步骤4-b,决策树的构建:根据步骤4-a抽取的ntree个训练子集构建对应规模的决策树,每棵决策树通过随机选取条件特征并将其作为分裂节点进行树的生长;
步骤4-c,森林的形成即定位预测模型的形成:在满足决策树设定规模的前提下,形成森林,即定位预测模型:
式中:H(X)为随机森林定位预测模型;hi(*)为第l个决策树模型;yk为第l个决策树对上传故障信息序列X的分类结果,也即所有故障区段集合Y中第k个故障区段;I(*)为示性函数;
若所有决策树对故障信息序列X的所有分类结果中第k个类别yk的个数最多,那么此类别便作为预测结果,经解析即为该故障信息序列对应的故障区段;
步骤4-d,森林的扩展即定位预测模型的扩展:通过将新增区段发生故障时上传的故障属性值和对应故障区段作为新故障样本,利用SMOTE技术使新故障样本数与原模型中各决策树的训练子集样本数保持相同;根据随机森林算法的可扩展特性,将新故障样本集作为训练样本子集构建对应的CART决策树,并将其作为森林中新生长的决策树加至随机森林模型中,实现对定位预测模型的扩展。
8.根据权利要求7所述的一种基于随机森林算法的配电网故障区段定位方法,其特征在于,步骤4-b中随机选取所有故障属性中一半的故障属性作为决策树的分裂节点,采用基于Gini系数的CART算法来确定分裂节点分裂时的分裂属性,并按照其划分实现决策树的分枝生长,公式如下:
式中:M为训练样本集,Gini(M)为M的Gini系数;Ginispilt(M)为M中分裂节点的Gini系数,pb为M中第b个故障区段类别样本数与总样本数的比值;n为故障区段类别总数;M1、M2为采用二分递归的方式产生左右两个分枝的子树将M随机分成的两个子集,m1、m2分别为M1、M2对应样本个数;m为M中的样本总数。
9.根据权利要求1所述的一种基于随机森林算法的配电网故障区段定位方法,其特征在于,所述步骤4中随机森林算法的参数设置为:1)随机森林软件包为Random Forest 4.7-10,2)决策树的数量为200,3)分裂节点的个数为10。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811202219.4A CN109490704A (zh) | 2018-10-16 | 2018-10-16 | 一种基于随机森林算法的配电网故障区段定位方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811202219.4A CN109490704A (zh) | 2018-10-16 | 2018-10-16 | 一种基于随机森林算法的配电网故障区段定位方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109490704A true CN109490704A (zh) | 2019-03-19 |
Family
ID=65689542
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811202219.4A Pending CN109490704A (zh) | 2018-10-16 | 2018-10-16 | 一种基于随机森林算法的配电网故障区段定位方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109490704A (zh) |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109936113A (zh) * | 2019-03-29 | 2019-06-25 | 国网浙江省电力有限公司 | 一种基于随机森林算法的保护动作智能诊断方法及系统 |
CN110247420A (zh) * | 2019-07-17 | 2019-09-17 | 四川轻化工大学 | 一种hvdc输电线路故障智能识别方法 |
CN110286279A (zh) * | 2019-06-05 | 2019-09-27 | 武汉大学 | 基于极端随机森林与堆栈式稀疏自编码算法的电力电子电路故障诊断方法 |
CN110427969A (zh) * | 2019-07-01 | 2019-11-08 | 阿里巴巴集团控股有限公司 | 数据处理方法、装置和电子设备 |
CN110515931A (zh) * | 2019-07-02 | 2019-11-29 | 电子科技大学 | 一种基于随机森林算法的电容型设备缺陷预测方法 |
CN111107092A (zh) * | 2019-12-23 | 2020-05-05 | 深圳供电局有限公司 | 基于随机森林算法攻击识别方法及储能协调控制装置 |
CN111159841A (zh) * | 2019-11-25 | 2020-05-15 | 国网浙江省电力有限公司湖州供电公司 | 一种基于数据融合的配电网短路电流计算方法 |
CN111262238A (zh) * | 2020-02-12 | 2020-06-09 | 浙江大学 | 基于机器学习的含iidg配电网短路电流预测方法 |
CN112085335A (zh) * | 2020-08-10 | 2020-12-15 | 国网上海市电力公司 | 一种用于配电网故障预测的改进随机森林算法 |
CN112710923A (zh) * | 2020-12-16 | 2021-04-27 | 中国电建集团华东勘测设计研究院有限公司 | 基于故障后稳态信息的数据驱动单相接地故障选线方法 |
CN112710924A (zh) * | 2020-12-16 | 2021-04-27 | 中国电建集团华东勘测设计研究院有限公司 | 基于故障前后稳态变化量信息的数据驱动单相接地故障选线方法 |
CN112748330A (zh) * | 2020-12-24 | 2021-05-04 | 国网江苏省电力有限公司电力科学研究院 | 基于分布式集成神经网络的高压断路器操作机构故障诊断方法及装置 |
CN112816831A (zh) * | 2021-03-18 | 2021-05-18 | 华北电力大学(保定) | 风电场集电线单相接地故障定位方法 |
CN113067522A (zh) * | 2021-03-29 | 2021-07-02 | 杭州吉易物联科技有限公司 | 基于rf-ga-svm算法的升降机输出电压控制方法 |
CN113625108A (zh) * | 2021-08-02 | 2021-11-09 | 四川轻化工大学 | 一种柔性直流配电网故障识别方法 |
CN113674106A (zh) * | 2021-08-11 | 2021-11-19 | 国网山东省电力公司平阴县供电公司 | 一种中低压配电网接地故障组合定位方法 |
CN114492588A (zh) * | 2021-12-29 | 2022-05-13 | 中国大唐集团科学技术研究总院有限公司华东电力试验研究院 | 一种火电厂辅机设备故障识别方法、系统、设备和存储介质 |
CN116405368A (zh) * | 2023-06-02 | 2023-07-07 | 南京信息工程大学 | 一种高维不平衡数据条件下的网络故障诊断方法、系统 |
CN117278383A (zh) * | 2023-11-21 | 2023-12-22 | 航天科工广信智能技术有限公司 | 一种物联网故障排查方案生成系统及方法 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103434484A (zh) * | 2013-08-20 | 2013-12-11 | 安科智慧城市技术(中国)有限公司 | 车载识别认证装置、移动终端、智能车钥控制系统及方法 |
CN106324429A (zh) * | 2016-08-02 | 2017-01-11 | 天津大学 | 一种基于rs‑ia数据挖掘的配电网故障定位方法 |
CN107016507A (zh) * | 2017-04-07 | 2017-08-04 | 国网技术学院 | 基于数据挖掘技术的电网故障追踪方法 |
CN107290633A (zh) * | 2017-08-18 | 2017-10-24 | 国网江苏省电力公司 | 基于mopso的含分布式光伏配电网故障区段定位方法 |
CN107506799A (zh) * | 2017-09-01 | 2017-12-22 | 北京大学 | 一种基于深度神经网络的开集类别发掘与扩展方法与装置 |
CN107609569A (zh) * | 2017-07-31 | 2018-01-19 | 北京映翰通网络技术股份有限公司 | 一种基于多维特征向量的配电网接地故障定位方法 |
CN107688831A (zh) * | 2017-09-04 | 2018-02-13 | 五邑大学 | 一种基于聚类下采样的不平衡数据分类方法 |
CN108303632A (zh) * | 2017-12-14 | 2018-07-20 | 佛山科学技术学院 | 基于随机森林算法的电路故障诊断方法 |
CN108509982A (zh) * | 2018-03-12 | 2018-09-07 | 昆明理工大学 | 一种处理二分类不平衡医学数据的方法 |
-
2018
- 2018-10-16 CN CN201811202219.4A patent/CN109490704A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103434484A (zh) * | 2013-08-20 | 2013-12-11 | 安科智慧城市技术(中国)有限公司 | 车载识别认证装置、移动终端、智能车钥控制系统及方法 |
CN106324429A (zh) * | 2016-08-02 | 2017-01-11 | 天津大学 | 一种基于rs‑ia数据挖掘的配电网故障定位方法 |
CN107016507A (zh) * | 2017-04-07 | 2017-08-04 | 国网技术学院 | 基于数据挖掘技术的电网故障追踪方法 |
CN107609569A (zh) * | 2017-07-31 | 2018-01-19 | 北京映翰通网络技术股份有限公司 | 一种基于多维特征向量的配电网接地故障定位方法 |
CN107290633A (zh) * | 2017-08-18 | 2017-10-24 | 国网江苏省电力公司 | 基于mopso的含分布式光伏配电网故障区段定位方法 |
CN107506799A (zh) * | 2017-09-01 | 2017-12-22 | 北京大学 | 一种基于深度神经网络的开集类别发掘与扩展方法与装置 |
CN107688831A (zh) * | 2017-09-04 | 2018-02-13 | 五邑大学 | 一种基于聚类下采样的不平衡数据分类方法 |
CN108303632A (zh) * | 2017-12-14 | 2018-07-20 | 佛山科学技术学院 | 基于随机森林算法的电路故障诊断方法 |
CN108509982A (zh) * | 2018-03-12 | 2018-09-07 | 昆明理工大学 | 一种处理二分类不平衡医学数据的方法 |
Non-Patent Citations (3)
Title |
---|
QUAN ZHOU ET.AL.: "Fault location for distribution networks with distributed generation sources using a hybrid DE/PSO algorithm", 《2013 IEEE POWER & ENERGY SOCIETY GENERAL MEETING》 * |
吴凡等: "基于MOPSO的含分布式光伏配电网故障区段定位", 《电力系统保护与控制》 * |
赵晋泉等: "基于数据挖掘的输配网一体化事故响应决策", 《电力系统保护与控制》 * |
Cited By (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109936113A (zh) * | 2019-03-29 | 2019-06-25 | 国网浙江省电力有限公司 | 一种基于随机森林算法的保护动作智能诊断方法及系统 |
CN110286279A (zh) * | 2019-06-05 | 2019-09-27 | 武汉大学 | 基于极端随机森林与堆栈式稀疏自编码算法的电力电子电路故障诊断方法 |
CN110286279B (zh) * | 2019-06-05 | 2021-03-16 | 武汉大学 | 基于极端树与堆栈式稀疏自编码算法的电力电子电路故障诊断方法 |
CN110427969B (zh) * | 2019-07-01 | 2020-11-27 | 创新先进技术有限公司 | 数据处理方法、装置和电子设备 |
CN110427969A (zh) * | 2019-07-01 | 2019-11-08 | 阿里巴巴集团控股有限公司 | 数据处理方法、装置和电子设备 |
CN110515931A (zh) * | 2019-07-02 | 2019-11-29 | 电子科技大学 | 一种基于随机森林算法的电容型设备缺陷预测方法 |
CN110247420A (zh) * | 2019-07-17 | 2019-09-17 | 四川轻化工大学 | 一种hvdc输电线路故障智能识别方法 |
CN111159841A (zh) * | 2019-11-25 | 2020-05-15 | 国网浙江省电力有限公司湖州供电公司 | 一种基于数据融合的配电网短路电流计算方法 |
CN111159841B (zh) * | 2019-11-25 | 2023-06-02 | 国网浙江省电力有限公司湖州供电公司 | 一种基于数据融合的配电网短路电流计算方法 |
CN111107092A (zh) * | 2019-12-23 | 2020-05-05 | 深圳供电局有限公司 | 基于随机森林算法攻击识别方法及储能协调控制装置 |
CN111262238A (zh) * | 2020-02-12 | 2020-06-09 | 浙江大学 | 基于机器学习的含iidg配电网短路电流预测方法 |
CN111262238B (zh) * | 2020-02-12 | 2021-09-03 | 浙江大学 | 基于机器学习的含iidg配电网短路电流预测方法 |
CN112085335A (zh) * | 2020-08-10 | 2020-12-15 | 国网上海市电力公司 | 一种用于配电网故障预测的改进随机森林算法 |
CN112710924B (zh) * | 2020-12-16 | 2022-07-26 | 中国电建集团华东勘测设计研究院有限公司 | 基于故障前后稳态变化量的单相接地故障选线方法 |
CN112710924A (zh) * | 2020-12-16 | 2021-04-27 | 中国电建集团华东勘测设计研究院有限公司 | 基于故障前后稳态变化量信息的数据驱动单相接地故障选线方法 |
CN112710923A (zh) * | 2020-12-16 | 2021-04-27 | 中国电建集团华东勘测设计研究院有限公司 | 基于故障后稳态信息的数据驱动单相接地故障选线方法 |
CN112710923B (zh) * | 2020-12-16 | 2022-07-26 | 中国电建集团华东勘测设计研究院有限公司 | 基于故障后稳态信息的数据驱动单相接地故障选线方法 |
CN112748330A (zh) * | 2020-12-24 | 2021-05-04 | 国网江苏省电力有限公司电力科学研究院 | 基于分布式集成神经网络的高压断路器操作机构故障诊断方法及装置 |
CN112816831A (zh) * | 2021-03-18 | 2021-05-18 | 华北电力大学(保定) | 风电场集电线单相接地故障定位方法 |
CN113067522A (zh) * | 2021-03-29 | 2021-07-02 | 杭州吉易物联科技有限公司 | 基于rf-ga-svm算法的升降机输出电压控制方法 |
CN113067522B (zh) * | 2021-03-29 | 2023-08-01 | 杭州吉易物联科技有限公司 | 基于rf-ga-svm算法的升降机输出电压控制方法 |
CN113625108A (zh) * | 2021-08-02 | 2021-11-09 | 四川轻化工大学 | 一种柔性直流配电网故障识别方法 |
CN113674106A (zh) * | 2021-08-11 | 2021-11-19 | 国网山东省电力公司平阴县供电公司 | 一种中低压配电网接地故障组合定位方法 |
CN114492588A (zh) * | 2021-12-29 | 2022-05-13 | 中国大唐集团科学技术研究总院有限公司华东电力试验研究院 | 一种火电厂辅机设备故障识别方法、系统、设备和存储介质 |
CN116405368A (zh) * | 2023-06-02 | 2023-07-07 | 南京信息工程大学 | 一种高维不平衡数据条件下的网络故障诊断方法、系统 |
CN116405368B (zh) * | 2023-06-02 | 2023-08-22 | 南京信息工程大学 | 一种高维不平衡数据条件下的网络故障诊断方法、系统 |
CN117278383A (zh) * | 2023-11-21 | 2023-12-22 | 航天科工广信智能技术有限公司 | 一种物联网故障排查方案生成系统及方法 |
CN117278383B (zh) * | 2023-11-21 | 2024-02-20 | 航天科工广信智能技术有限公司 | 一种物联网故障排查方案生成系统及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109490704A (zh) | 一种基于随机森林算法的配电网故障区段定位方法 | |
CN107290633B (zh) | 基于mopso的含分布式光伏配电网故障区段定位方法 | |
CN105471647B (zh) | 一种电力通信网故障定位方法 | |
CN106452825B (zh) | 一种基于改进决策树的配用电通信网告警关联分析方法 | |
CN109932627A (zh) | 一种gis耐压试验局部放电的定位方法及系统 | |
CN106229964A (zh) | 一种基于改进二进制粒子群算法的配电网故障定位方法 | |
CN109816032A (zh) | 基于生成式对抗网络的无偏映射零样本分类方法和装置 | |
CN105335752A (zh) | 一种基于主成分分析多变量决策树的接线方式识别方法 | |
CN108931709A (zh) | 一种高容错率的配网故障定位方法 | |
CN109120009A (zh) | 计及分布式电源出力随机变化的主动配电网故障恢复方法 | |
CN108693771A (zh) | 一种基于多种群遗传算法的配电网故障区段定位算法 | |
CN110347881A (zh) | 一种基于路径回溯图嵌入的群体发现方法 | |
Matos et al. | Multicontingency steady state security evaluation using fuzzy clustering techniques | |
CN114169231A (zh) | 一种基于迁移学习获取配电线路故障分类、定位与选线深度学习模型的方法 | |
LU500551B1 (en) | Virtual load dominant parameter identification method based on incremental learning | |
CN110442143A (zh) | 一种基于组合多目标鸽群优化的无人机态势数据聚类方法 | |
CN115618249A (zh) | 一种基于LargeVis降维与DBSCAN聚类的低压配电台区相位识别方法 | |
CN106993296A (zh) | 终端的性能评估方法及装置 | |
CN111965442A (zh) | 一种数字孪生环境下的能源互联网故障诊断方法及装置 | |
CN105069517B (zh) | 基于混合算法的配电网多目标故障恢复方法 | |
CN115494349A (zh) | 有源配电网单相接地故障区段定位方法 | |
Aguas et al. | EDPD’S experience with data analytics and stochastic simulation methods for risk-controlled network planning | |
CN109547248A (zh) | 基于人工智能的在轨飞行器自组网故障诊断方法及装置 | |
CN113852204A (zh) | 一种于数字孪生的变电站三维全景监视系统及方法 | |
CN112327097A (zh) | 一种电力故障线路定位方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190319 |