CN113884807A - 基于随机森林和多层架构聚类的配电网故障预测方法 - Google Patents

基于随机森林和多层架构聚类的配电网故障预测方法 Download PDF

Info

Publication number
CN113884807A
CN113884807A CN202111122275.9A CN202111122275A CN113884807A CN 113884807 A CN113884807 A CN 113884807A CN 202111122275 A CN202111122275 A CN 202111122275A CN 113884807 A CN113884807 A CN 113884807A
Authority
CN
China
Prior art keywords
distribution network
power distribution
clustering
network fault
adopting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111122275.9A
Other languages
English (en)
Other versions
CN113884807B (zh
Inventor
秦丽文
俞小勇
周柯
桂海涛
吴丽芳
奉斌
周杨珺
李珊
骆育腾
陈绍南
李克文
欧世锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Electric Power Research Institute of Guangxi Power Grid Co Ltd
Original Assignee
Electric Power Research Institute of Guangxi Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Electric Power Research Institute of Guangxi Power Grid Co Ltd filed Critical Electric Power Research Institute of Guangxi Power Grid Co Ltd
Priority to CN202111122275.9A priority Critical patent/CN113884807B/zh
Publication of CN113884807A publication Critical patent/CN113884807A/zh
Application granted granted Critical
Publication of CN113884807B publication Critical patent/CN113884807B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01RMEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
    • G01R31/00Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere
    • G01R31/08Locating faults in cables, transmission lines, or networks

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Supply And Distribution Of Alternating Current (AREA)

Abstract

本发明公开了一种基于随机森林和多层架构聚类的配电网故障预测方法,涉及电力系统及其自动化技术领域,获取配电网数据构建数据集,采用随机森林方法对数据集进行配电网故障特征选取,采用多层架构聚类模型对配电网故障特征进行类聚,并对类聚后的配网故障特征采用改进灰色关联分析法确定预测模型的输入样本,采用极限学习机构建预测模型;将输入样本通过所述预测模型进行配电网故障预测。通过随机森林和多层架构聚类的配电网故障预测方法解决了现有的故障处理模式仍然还是依靠配电自动化或者日常巡检来把控,可以通过随机森林和多层架构聚类的配电网故障预测方法来进行预测,实现提前进行故障处理,提高配电网供电可靠性与安全性。

Description

基于随机森林和多层架构聚类的配电网故障预测方法
技术领域
本发明属于电力系统及其自动化技术领域,尤其涉及一种基于随机森林和多层架构聚类的配电网故障预测方法。
背景技术
配电网是一个结构和运行方式复杂的动态系统,而线路故障原因更是多种多样,预防故障发生、以及故障后快速定位是提升配电网安全运行水平、提高供电可靠性的重要手段。据统计,接近一半的故障是可以预警的,准确把握配电网故障源特征分析,找出故障信号与故障的原因之间的关联关系,发现故障早期运行风险特征演化规律,及时提出预警与预防措施,是开展差异化运维、降低故障率的有效手段。多地配电网存在配电设备多、装备水平低、运维人员素质不高、运维手段相对落后、信息化和智能化水平较低等问题;同时,受网架多样化、电源多元化、用户需求多样、运行环境多变等因素影响,配电网的运行控制变得复杂。配电网状态感知与诊断离不开现场量测数据,但海量数据价值密度低、信息采集点欠完备,导致配电网的状态评估、异常与故障分析难度增大,现有的故障处理模式仍然还是依靠配电自动化或者日常巡检来把控,故障风险分析的不足可能导致关联性故障的发生,严重影响了配电网供电可靠性与安全性。
配电网中负荷分散,线路长,设备多,尤其在一些边远地区,由于运行维护条件较差,保护措施较少,在配电网设备运行过程中要经受狂风、暴雨、雷电、大雪等各种恶劣的自然灾害因素影响,同时还要经受各种因为用户故障、配网设备老化等因素引起的配电网故障。当配电网中的保护设备安装不当,参数整定不合理时容易出现保护设备误动作,拒动,严重时可能出现设备损坏,越级跳闸等事故发生。设备温升过高、绝缘下降、甚至设备烧损,主要原因是变压器长期三相不平衡偏相运行,或者设备容量选型偏小。当配电网中过电压达到一定程度时,会造成瓷瓶损坏,绝缘击穿损坏设备。绝缘子老化后会产生裂纹折断,出现接地和短路事故。预防性试验未按周期安排,或者在配电网设备运行过程中维护不及时,留下隐患造成设备故障发生。
随机森林是一种并行的集成学习模型,使用决策树为基础分类器,通过bootstrap重采样技术从原始数据集中随机地抽取K个bootstrap数据集,然后分别训练K个决策树来构成随机森林分类器,最后通过少数服从多数的投票方式进行分类决策。由于训练决策树分类器时遵循了样本随机和特征随机的规则,随机森林算法有泛化能力强、不易过拟合、模型简单和分类效果好等特点,被广泛应用于分类、预测和特征选择等问题中。对随机森林的研究也有很多集中到实际的应用方面,比如空间特征识别、网络完全检测、信息抽取、生物芯片等,都取得了非常好的结果。国内现在关注的重点集中在一些领域的应用上,对理论的探讨还比较少。模糊c均值聚类融合了模糊理论的精髓。相较于k-means的硬聚类,模糊c提供了更加灵活的聚类结果。因为大部分情况下,数据集中的对象不能划分成为明显分离的簇,指派一个对象到一个特定的簇有些生硬,也可能会出错。故,对每个对象和每个簇赋予一个权值,指明对象属于该簇的程度。当然,基于概率的方法也可以给出这样的权值,但是有时候我们很难确定一个合适的统计模型,因此使用具有自然地、非概率特性的模糊c均值就是一个比较好的选择。
随着配电网自动化系统的不断革新以及配网系统中智能终端技术和通信技术的不断提高,系统信息会逐渐的向多元化,高效化发展,我们可通过对这些多源数据信息进行融合和分析,更能有效地排查故障原因。因而,在配电网故障预测的过程中,需考虑多种影响因素对配电网不同故障类型的共同作用,同时根据配电网信息系统数据可获取性原则选择配电网故障类型相关程度高的影响因素形成输入样本,优化预测模型输入,实现配电网故障预测同时提高预测准确性。
发明内容
本发明的目的在于提供一种基于随机森林和多层架构聚类的配电网故障预测方法,从而克服了现有配电网故障处理模式仍然还是依靠配电自动化或者日常巡检来把控的缺点。
为实现上述目的,本发明提供了一种基于随机森林和多层架构聚类的配电网故障预测方法,包括以下步骤:
获取配电网数据构建数据集;
采用随机森林方法对所述数据集进行配电网故障特征选取;
采用多层架构聚类模型对所述配电网故障特征进行类聚,对类聚后的配网故障特征采用改进灰色关联分析法确定输入样本;
采用极限学习机构建预测模型;
将所述输入样本通过所述预测模型进行配电网故障预测。
优选地,对所述数据集进行预处理。
优选地,采用随机森林方法对所述数据集进行配电网故障特征选取包括以下步骤:
对所述数据集的数据进行样本设定,并对所述样本进行初始化,得到初始化的数据集;
计算初始化的数据集的分类准确率;
修改所述初始化的数据集,并根据所述分类准确率的计算方法重新计算分类准确率;
根据重新计算的分类准确率计算特征的相关性程度;
对相关性程度进行降序排列,并选取大于或等于设定阈值的相关性程度对应的特征作为配电网故障特征。
优选地,采用多层架构聚类模型对所述配电网故障特征进行类聚包括以下步骤:
基于范围估值对所述配电网故障特征进行初级聚类;
基于改进模糊C均值类聚方法对初级类聚的配电网故障特征进行二次类聚。
优选地,对类聚后的配网故障特征采用改进灰色关联分析法确定输入样本包括:判别配电网故障的影响因素的所属类别,采用改进灰色关联分析方法,从对应类别的配电网故障特征样本数据中挖掘与待预测对象相似程度最高的少数样本数据作为最终的预测模型输入。
优选地,采用极限学习机构建预测模型包括:
设定序列x=[x1,x2,...,xn]T,xi∈Rn,y=[y1,y2,...,yn]T,yi∈Rn为给定序列的标签,假设模型有l个隐含层节点,激活函数设定为g(x),极限学习机模型T表示为:
Figure BDA0003277402360000041
式(14)中,ωi和bi分别为激活函数的第i个权重值和阈值,i=1,2,...,l,权重值具体表示为ωi=[ωi1,ωi2,...,ωim];βi为极限学习机隐含层第i个节点的权重值,具体表示为βi=[βi1,βi2,...,βim],tm为第m个时刻的状态量;
简化式(14)得到:
TT=H1×lβl×m (15)
式(15)中,H由激活函数等组成,称为输出矩阵。
输出层权值β的计算公式如下:
Figure BDA0003277402360000042
式(16)中,式(16)的实际解为
Figure BDA0003277402360000043
H+表示H的广义逆。
优选地,采用改进粒子群算法对所述预测模型关键性参数进行优化。
优选地,所述改进粒子群算法包括以下步骤:
粒子群算法中“粒子”速度经过t+1次迭代的计算公式为:
Figure BDA0003277402360000044
式(17)中:
Figure BDA0003277402360000045
表示第t+1次迭代粒子飞行速度;
Figure BDA0003277402360000046
表示第t次迭代粒子飞行速度;c1和c2分别表示两个学习因子,取值范围均为[0,2];ω表示惯性权重;rand表示范围在[0,1]之间的随机数值,两个rand均为无关联的随机数值;
粒子群算法中“粒子”位置经过t+1次迭代的计算公式为:
Figure BDA0003277402360000047
式(18)中,
Figure BDA0003277402360000048
表示第t+1次迭代粒子实际位置;
Figure BDA0003277402360000049
表示第t次迭代粒子实际位置;
针对粒子群算法权重ω对粒子群优化算法的影响过大,采用自适应方法对传统粒子群算法进行改进,通过粒子群权重动态化来增强粒子群的局部与全局寻优能力,权重ω的自适应计算公式为:
Figure BDA0003277402360000051
式(19)中,f为当前粒子适应度,favg为粒子群平均适应度,fmax为粒子群最大适应度,fmin为粒子群最大适应度,ωmax为权重的最大值,ωmin为权重的最小值。
与现有的技术相比,本发明具有如下有益效果:
1、本发明所提供的基于随机森林和多层架构聚类的配电网故障预测方法,获取配电网数据构建数据集,采用随机森林方法对数据集进行配电网故障特征选取,采用多层架构聚类模型对配电网故障特征进行类聚,并对类聚后的配网故障特征采用改进灰色关联分析法确定预测模型的输入样本,采用极限学习机构建预测模型;将输入样本通过所述预测模型进行配电网故障预测。通过采用随机森林方法对配电网故障特征选取、采用多层架构聚类模型类聚以及采用改进灰色关联分析方法确定输入样本,解决了配电网故障预测过程中不同数据类型复杂,不利于预测模型的训练和预测;采用极限学习机构建预测模型,有效挖掘影响因素与待预测对象的内在联系,有利于提高配电网故障预测的准确性,解决了现有的故障处理模式仍然还是依靠配电自动化或者日常巡检来把控,可以通过随机森林和多层架构聚类的配电网故障预测方法来进行预测,实现提前进行故障处理,提高配电网供电可靠性与安全性。
2、本发明所提供的基于随机森林和多层架构聚类的配电网故障预测方法,采用改进粒子群算法对预测模型的权重实现动态化优化,避免预测模型训练过程中陷入局部最优解以及过拟合情况,有利于提高预测模型的准确性。
附图说明
为了更清楚地说明本发明的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一个实施例,对于本领域普通技术人员来说,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一种基于随机森林和多层架构聚类的配电网故障预测方法的流程图。
具体实施方式
下面结合本发明实施例中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1示出了本发明所提供的其中一个实施例,基于随机森林和多层架构聚类的配电网故障预测方法,包括以下步骤:
S1、获取配电网数据构建数据集;
S2、采用随机森林方法对所述数据集进行配电网故障特征选取;
S3、采用多层架构聚类模型对所述配电网故障特征进行类聚,对类聚后的配网故障特征采用改进灰色关联分析法确定输入样本;
S4、采用极限学习机构建预测模型;
S5、将所述输入样本通过所述预测模型进行配电网故障预测。
上述的基于随机森林和多层架构聚类的配电网故障预测方法,获取配电网数据构建数据集,采用随机森林方法对数据集进行配电网故障特征选取,采用多层架构聚类模型对配电网故障特征进行类聚,并对类聚后的配网故障特征采用改进灰色关联分析法确定预测模型的输入样本,采用极限学习机构建预测模型;将输入样本通过所述预测模型进行配电网故障预测。通过采用随机森林方法对配电网故障特征选取、采用多层架构聚类模型类聚以及采用改进灰色关联分析方法确定输入样本,解决了配电网故障预测过程中不同数据类型复杂,不利于预测模型的训练和预测;采用极限学习机构建预测模型,有效挖掘影响因素与待预测对象的内在联系,有利于提高配电网故障预测的准确性。
其中一个实施例,步骤S1中,对所述数据集进行预处理。
其中一个实施例,步骤S1中,从配电网信息系统等相关配电数据系统获取配电网在运行过程中的各类数据,各类数据包括配电网在故障时的各类故障指标数据,对于搜集的配电网信息系统的不同类型数据及配电网故障数据,构建对应的数据集,数据集具体包含:电压波形数据、电流波形数据、系统拓扑参数和温度等。为确保收集的数据可以顺利聚类,将所有的数据集进行预处理,即对所有的数据集归一化,对于缺少或者错误的数据利用平均插值法进行处理。
具体的,构建的数据集表示为:
Figure BDA0003277402360000071
式(1)中,A、B、...、X为相关配电网数据系统搜集的不同类型数据,a、b、...、x为不同数据类型的个数。
归一化公式为:
Figure BDA0003277402360000072
式(2)中,
Figure BDA0003277402360000073
表示归一化值,xi表示原数据集值,xmin表示一个样本中原数据集序列最小值,xmax表示一个样本中原数据集序列最大值。
其中一个实施例,步骤S2、采用随机森林方法对所述数据集进行配电网故障特征选取包括以下步骤:
S21、对所述数据集的数据进行样本设定,并对所述样本进行初始化,得到初始化的数据集;
具体的,设定样本具有N个特征,随机抽取K个bootstrap数据集,对应有K个oob数据集;初始化计算为:
k=1 (3)
式(3)中,k为初始化值,1≤k≤K。
S22、计算初始化的数据集的分类准确率;
具体的,利用K个bootstrap数据集对决策树模型进行训练,计算K个oob数据集的分类准确率
Figure BDA0003277402360000081
对oob数据集的特征xi施加扰动,重新计算K个oob数据集的分类准确率
Figure BDA0003277402360000082
S23、修改所述初始化的数据集,并根据所述分类准确率的计算方法重新计算分类准确率;
具体的,改变初始值k的选取,由k值取1到K依次改变,循环步骤S22,计算在不同初始值情况下的分类准确率。
S24、根据重新计算的分类准确率计算特征的相关性程度;
具体的,通过对多特征及添加扰动的分类准确率(即步骤S23的计算得到的分类准确率)进行循环迭代运算,利用不同准确率计算不同特征的相关性程度。相关性程度Pi计算为:
Figure BDA0003277402360000083
式(4)中,K为oob数据集的个数,K为bootstrap数据集的个数,
Figure BDA0003277402360000084
为K个oob数据集的分类准确率,
Figure BDA0003277402360000085
为重新计算的K个oob数据集的分类准确率。
S25、对相关性程度进行降序排列,并选取大于或等于设定阈值的相关性程度对应的特征作为特征选择的结果,即选取得到配电网故障特征。
随机森林是一种集成算法,它隶属于Bagging类型,通过组合多个弱分类器,最终结果通过投票或取均值,使得整体模型的结果具有较高的精确度和泛化性能,因此,利用随机森林对配电网故障特征进行选取,有利于确定相关性程度较高的特征。
其中一个实施例,S3、采用多层架构聚类模型对所述配电网故障特征进行类聚包括以下步骤:
S31、基于范围估值对所述配电网故障特征进行初级聚类;
具体的,采用相对误差的范围估值方法进行初级聚类,确定不同输入类型最为合适的样本数据作为预测模型的输入,包括以下步骤:
S311、构建配电网故障特征的影响因素矩阵,采用相对误差的范围估值方法进行初级聚类,采用相对误差的范围估值方法计算差值的公式为:
Figure BDA0003277402360000091
式(5)中,η(i,j)为差值结果,Xij为经过筛选后的影响因素矩阵元素,Xaj为待预测对象包含的影响因素矩阵元素。
S312、设定第一阈值对计算后的差值进行有效选取,第一阈值设定为6%,有效选取结果公式为:
Figure BDA0003277402360000092
S32、基于改进模糊C均值类聚方法对初级类聚的配电网故障特征进行二次类聚;
具体的,包括以下步骤:
S321、计算配电网故障特征的聚类中心的初始化值:
Figure BDA0003277402360000093
式(7)中,r为聚类中心的邻域半径,c为聚类的类别数量;N为属于邻域半径范围内的样本数量,x和y均为影响因素序列,m为聚类的影响因素序列总数量,byn为影响因素序列y在节点数量为n时的数值,bxn为影响因素序列x在节点数量为n时的数值。
S322、计算聚类中心的邻域半径,邻域半径的公式为:
Figure BDA0003277402360000094
式(8)中,dx为影响因素序列x的序列值,dy为影响因素序列y的序列值。
S323、计算隶属度矩阵,隶属度矩阵随着迭代不断更新,经过t次的迭代的隶属度矩阵uij计算公式为:
Figure BDA0003277402360000101
式(9)中,μij表示第i个对象属于第j类属性的程度,为隶属度矩阵中的元素,x=1,2,...,n,j=1,2,...,c,k为种类数量,bmi为第i个对象数值,Cmk为第k类属性中心聚类数值,Cmj为第j类属性数值。
S324、聚类中心值矩阵随着步骤S323的隶属度矩阵迭代不断更新,经过t次的迭代的聚类中心值矩阵计算公式为:
Figure BDA0003277402360000102
式(10)中,Xi为第i个聚类的影响因素序列,clj表示第i类影响因素的第j类属性的聚类中心值,系数ζ的具体计算为:
Figure BDA0003277402360000103
式(11)中,ω为聚类系数。
S325、设定第二阈值ε以及迭代终止次数作为两个终止迭代条件,当
Figure BDA0003277402360000104
或者达到迭代终止次数时,迭代终止并输出最优隶属度;不满足条件的将重复步骤S324-S325继续进行迭代。
初级聚类已经去除误差较大的样本数据,对剩下的符合要求的样本数据进行二次聚类,采用模糊C均值聚类方法优化初级聚类结果,提高聚类有效性。
配电网故障特征存在一定程度的隐含关系,聚类方法有利于将具有内在关联的故障特征进行汇集,形成区别明显的不同类别。多层架构聚类从粗略聚类到精细化聚类,构建双层架构,深入挖掘不同故障特征的内在关联,提高故障特征聚类准确性。
其中一个实施例,步骤S3中,对类聚后的配网故障特征采用改进灰色关联分析法确定输入样本包括:判别配电网故障的影响因素的所属类别,采用改进灰色关联分析方法,从对应类别的配电网故障特征样本数据中挖掘与待预测对象相似程度最高的少数样本数据作为最终的预测模型输入。
具体的,改进灰色关联分析从数学角度出发,将待预测对象包含的影响因素和同类别的影响因素样本数据均看作时序序列,利用欧式距离对传统的灰色关联分析进行距离优化,从距离和趋势两个方向选取相似程度最高的预测模型输入。
从趋势方向,利用传统的灰色关联分析方法计算相似程度γi1
Figure BDA0003277402360000111
式(12)中,N为单个序列总的节点数量,xi(k)为对比序列第k个节点的数值,ρ为相似程度系数。
从距离方向,利用欧式距离改进计算相似程度γi2
Figure BDA0003277402360000112
根据两个相似程度计算最终相似程度,最终相似程度γi的计算公式为:
Figure BDA0003277402360000113
其中一个实施例,采用极限学习机构建预测模型包括:
设定序列x=[x1,x2,...,xn]T,xi∈Rn,y=[y1,y2,...,yn]T,yi∈Rn为给定序列的标签,假设模型有l个隐含层节点,激活函数设定为g(x),极限学习机模型T表示为:
Figure BDA0003277402360000121
式(14)中,ωi和bi分别为激活函数的第i个权重值和阈值,i=1,2,...,l,权重值具体表示为ωi=[ωi1,ωi2,...,ωim];βi为极限学习机隐含层第i个节点的权重值,具体表示为βi=[βi1,βi2,...,βim],tm为第m个时刻的状态量;
简化式(14)得到:
TT=H1×lβl×m (15)
式(15)中,H由激活函数等组成,称为输出矩阵。
输出层权值β的计算公式如下:
Figure BDA0003277402360000122
式(16)中,式(16)的实际解为
Figure BDA0003277402360000123
H+表示H的广义逆。
极限学习机来源于前馈神经网络的优化和改进,对于监督学习和非监督学习问题表现出有效性和准确性。采用极限学习机构建预测模型,有效挖掘影响因素与待预测对象的内在联系,有利于提高配电网故障预测的准确性。
其中一个实施例,采用改进粒子群算法对所述预测模型关键性参数进行优化,以提高预测模型的准确性。
其中一个实施例,所述改进粒子群算法包括以下步骤:
S51、粒子群算法中“粒子”速度经过t+1次迭代的计算公式为:
Figure BDA0003277402360000124
式(17)中:
Figure BDA0003277402360000125
表示第t+1次迭代粒子飞行速度;
Figure BDA0003277402360000126
表示第t次迭代粒子飞行速度;c1和c2分别表示两个学习因子,取值范围均为[0,2];ω表示惯性权重;rand表示范围在[0,1]之间的随机数值,两个rand均为无关联的随机数值;
S52、粒子群算法中“粒子”位置经过t+1次迭代的计算公式为:
Figure BDA0003277402360000127
式(18)中,
Figure BDA0003277402360000128
表示第t+1次迭代粒子实际位置;
Figure BDA0003277402360000129
表示第t次迭代粒子实际位置;
S53、针对粒子群算法权重ω对粒子群优化算法的影响过大,采用自适应方法对传统粒子群算法进行改进,通过粒子群权重动态化来增强粒子群的局部与全局寻优能力,权重ω的自适应计算公式为:
Figure BDA0003277402360000131
式(19)中,f为当前粒子适应度,favg为粒子群平均适应度,fmax为粒子群最大适应度,fmin为粒子群最大适应度,ωmax为权重的最大值,ωmin为权重的最小值。
粒子群算法源于鸟群觅食行为,是一种基于群体搜索的处理连续或者离散空间内优化问题的算法,具有结构简单、易于调节等优点。基于粒子群算法在迭代过程中权重对收敛速度的影响,采用动态化手段对粒子群算法的权重进行优化,提高粒子群算法的寻优速度。
以上所揭露的仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或变型,都应涵盖在本发明的保护范围之内。

Claims (8)

1.基于随机森林和多层架构聚类的配电网故障预测方法,其特征在于,包括以下步骤:
获取配电网数据构建数据集;
采用随机森林方法对所述数据集进行配电网故障特征选取;
采用多层架构聚类模型对所述配电网故障特征进行类聚,对类聚后的配网故障特征采用改进灰色关联分析法确定输入样本;
采用极限学习机构建预测模型;
将所述输入样本通过所述预测模型进行配电网故障预测。
2.根据权利要求1所述的基于随机森林和多层架构聚类的配电网故障预测方法,其特征在于,对所述数据集进行预处理。
3.根据权利要求1所述的基于随机森林和多层架构聚类的配电网故障预测方法,其特征在于,采用随机森林方法对所述数据集进行配电网故障特征选取包括以下步骤:
对所述数据集的数据进行样本设定,并对所述样本进行初始化,得到初始化的数据集;
计算初始化的数据集的分类准确率;
修改所述初始化的数据集,并根据所述分类准确率的计算方法重新计算分类准确率;
根据重新计算的分类准确率计算特征的相关性程度;
对相关性程度进行降序排列,并选取大于或等于设定阈值的相关性程度对应的特征作为配电网故障特征。
4.根据权利要求1所述的基于随机森林和多层架构聚类的配电网故障预测方法,其特征在于,采用多层架构聚类模型对所述配电网故障特征进行类聚包括以下步骤:
基于范围估值对所述配电网故障特征进行初级聚类;
基于改进模糊C均值类聚方法对初级类聚的配电网故障特征进行二次类聚。
5.根据权利要求1所述的基于随机森林和多层架构聚类的配电网故障预测方法,其特征在于,对类聚后的配网故障特征采用改进灰色关联分析法确定输入样本包括:判别配电网故障的影响因素的所属类别,采用改进灰色关联分析方法,从对应类别的配电网故障特征样本数据中挖掘与待预测对象相似程度最高的少数样本数据作为最终的预测模型输入。
6.根据权利要求1所述的基于随机森林和多层架构聚类的配电网故障预测方法,其特征在于,采用极限学习机构建预测模型包括:
设定序列x=[x1,x2,...,xn]T,xi∈Rn,y=[y1,y2,...,yn]T,yi∈Rn为给定序列的标签,假设模型有l个隐含层节点,激活函数设定为g(x),极限学习机模型T表示为:
Figure FDA0003277402350000021
式(14)中,ωi和bi分别为激活函数的第i个权重值和阈值,i=1,2,...,l,权重值具体表示为ωi=[ωi1,ωi2,...,ωim];βi为极限学习机隐含层第i个节点的权重值,具体表示为βi=[βi1,βi2,...,βim],tm为第m个时刻的状态量;
简化式(14)得到:
TT=H1×lβl×m (15)
式(15)中,H由激活函数等组成,称为输出矩阵。
输出层权值β的计算公式如下:
Figure FDA0003277402350000022
式(16)中,式(16)的实际解为
Figure FDA0003277402350000023
H+表示H的广义逆。
7.根据权利要求1或6所述的基于随机森林和多层架构聚类的配电网故障预测方法,其特征在于,采用改进粒子群算法对所述预测模型关键性参数进行优化。
8.根据权利要求7所述的基于随机森林和多层架构聚类的配电网故障预测方法,其特征在于,所述改进粒子群算法包括以下步骤:
粒子群算法中“粒子”速度经过t+1次迭代的计算公式为:
Figure FDA0003277402350000031
式(17)中:
Figure FDA0003277402350000032
表示第t+1次迭代粒子飞行速度;
Figure FDA0003277402350000033
表示第t次迭代粒子飞行速度;c1和c2分别表示两个学习因子,取值范围均为[0,2];ω表示惯性权重;rand表示范围在[0,1]之间的随机数值,两个rand均为无关联的随机数值;
粒子群算法中“粒子”位置经过t+1次迭代的计算公式为:
Figure FDA0003277402350000034
式(18)中,
Figure FDA0003277402350000035
表示第t+1次迭代粒子实际位置;
Figure FDA0003277402350000036
表示第t次迭代粒子实际位置;
针对粒子群算法权重ω对粒子群优化算法的影响过大,采用自适应方法对传统粒子群算法进行改进,通过粒子群权重动态化来增强粒子群的局部与全局寻优能力,权重ω的自适应计算公式为:
Figure FDA0003277402350000037
式(19)中,f为当前粒子适应度,favg为粒子群平均适应度,fmax为粒子群最大适应度,fmin为粒子群最大适应度,ωmax为权重的最大值,ωmin为权重的最小值。
CN202111122275.9A 2021-09-24 2021-09-24 基于随机森林和多层架构聚类的配电网故障预测方法 Active CN113884807B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111122275.9A CN113884807B (zh) 2021-09-24 2021-09-24 基于随机森林和多层架构聚类的配电网故障预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111122275.9A CN113884807B (zh) 2021-09-24 2021-09-24 基于随机森林和多层架构聚类的配电网故障预测方法

Publications (2)

Publication Number Publication Date
CN113884807A true CN113884807A (zh) 2022-01-04
CN113884807B CN113884807B (zh) 2023-10-20

Family

ID=79006571

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111122275.9A Active CN113884807B (zh) 2021-09-24 2021-09-24 基于随机森林和多层架构聚类的配电网故障预测方法

Country Status (1)

Country Link
CN (1) CN113884807B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115222104A (zh) * 2022-06-24 2022-10-21 南京电力设计研究院有限公司 一种基于极限学习机的智能变电站二次设备状态评估方法
CN115270965A (zh) * 2022-07-29 2022-11-01 国网浙江省电力有限公司经济技术研究院 一种配电网线路故障预测方法和装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106485262A (zh) * 2016-09-09 2017-03-08 国网山西省电力公司晋城供电公司 一种母线负荷预测方法
CN110223193A (zh) * 2019-03-27 2019-09-10 东北电力大学 基于模糊聚类和rs-knn模型用于电网运行状态的判别方法及系统
CN111695639A (zh) * 2020-06-17 2020-09-22 浙江经贸职业技术学院 一种基于机器学习的电力用户用电异常检测方法
AU2020103307A4 (en) * 2020-11-09 2021-01-14 T.J. Deepika Machine Learning-Based Power Quality Improvement System For Micro-Grid
CN112488395A (zh) * 2020-12-01 2021-03-12 湖南大学 一种配电网线损预测方法及系统
CN112924808A (zh) * 2021-01-25 2021-06-08 上海海事大学 一种船舶区域配电电力系统短路故障诊断方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106485262A (zh) * 2016-09-09 2017-03-08 国网山西省电力公司晋城供电公司 一种母线负荷预测方法
CN110223193A (zh) * 2019-03-27 2019-09-10 东北电力大学 基于模糊聚类和rs-knn模型用于电网运行状态的判别方法及系统
CN111695639A (zh) * 2020-06-17 2020-09-22 浙江经贸职业技术学院 一种基于机器学习的电力用户用电异常检测方法
AU2020103307A4 (en) * 2020-11-09 2021-01-14 T.J. Deepika Machine Learning-Based Power Quality Improvement System For Micro-Grid
CN112488395A (zh) * 2020-12-01 2021-03-12 湖南大学 一种配电网线损预测方法及系统
CN112924808A (zh) * 2021-01-25 2021-06-08 上海海事大学 一种船舶区域配电电力系统短路故障诊断方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
卢明 等: "基于灰色投影优化随机森林算法的输电线路舞动预警方法", 电测与仪表, vol. 57, no. 09, pages 45 - 51 *
王继业 等: "基于灰色投影随机森林算法的配网故障量预测模型", 自动化技术与应用, vol. 37, no. 04, pages 75 - 78 *
王辉 等: "基于ReliefF的时频联合特征及随机森林的配电网电缆故障识别方法", 南京师范大学学报(工程技术版), vol. 20, no. 02, pages 44 - 51 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115222104A (zh) * 2022-06-24 2022-10-21 南京电力设计研究院有限公司 一种基于极限学习机的智能变电站二次设备状态评估方法
CN115270965A (zh) * 2022-07-29 2022-11-01 国网浙江省电力有限公司经济技术研究院 一种配电网线路故障预测方法和装置
CN115270965B (zh) * 2022-07-29 2023-05-12 国网浙江省电力有限公司经济技术研究院 一种配电网线路故障预测方法和装置

Also Published As

Publication number Publication date
CN113884807B (zh) 2023-10-20

Similar Documents

Publication Publication Date Title
Adedeji et al. Wind turbine power output very short-term forecast: A comparative study of data clustering techniques in a PSO-ANFIS model
Zhou et al. A novel data-driven approach for transient stability prediction of power systems considering the operational variability
CN105117602B (zh) 一种计量装置运行状态预警方法
CN112348271A (zh) 基于vmd-ipso-gru的短期光伏功率预测方法
CN113496262A (zh) 数据驱动的有源配电网异常状态感知方法及系统
CN110929847A (zh) 一种基于深度卷积神经网络的换流变压器故障诊断方法
CN113378990B (zh) 基于深度学习的流量数据异常检测方法
CN108133225A (zh) 一种基于支持向量机的覆冰闪络故障预警方法
CN113762329A (zh) 一种大型轧机状态预测模型的构建方法及构建系统
CN113884807B (zh) 基于随机森林和多层架构聚类的配电网故障预测方法
CN114676742A (zh) 一种基于注意力机制和残差网络的电网异常用电检测方法
CN115099335A (zh) 多源异构数据的异常辨识和特征筛选方法、系统
CN111680875A (zh) 基于概率基线模型的无人机状态风险模糊综合评价方法
CN115618261A (zh) 一种基于nca与ssa-kelm的光伏接入配电网漏电识别方法
CN114925612A (zh) 基于麻雀搜索算法优化混合核极限学习机的变压器故障诊断方法
CN115964503B (zh) 基于社区设备设施的安全风险预测方法及系统
CN115600729A (zh) 一种考虑多属性网格电网负荷预测方法
CN115564155A (zh) 一种分散式风电机组功率预测方法及相关设备
CN115526258A (zh) 基于Spearman相关系数特征提取的电力系统暂稳评估方法
Zhang et al. Fault diagnosis of oil-immersed power transformer based on difference-mutation brain storm optimized catboost model
CN113033898A (zh) 基于k均值聚类与bi-lstm神经网络的电负荷预测方法及系统
CN115618743B (zh) 一种瞄准镜系统的状态评估方法及状态评估系统
CN116956702A (zh) 一种用电安全预警方法、介质及系统
CN116151799A (zh) 一种基于bp神经网络的配电线路多工况故障率快速评估方法
CN112613227B (zh) 基于混合机器学习的航空发动机剩余使用寿命预测模型

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant