CN113030633B - 基于ga-bp神经网络的配电网故障大数据分析方法和系统 - Google Patents

基于ga-bp神经网络的配电网故障大数据分析方法和系统 Download PDF

Info

Publication number
CN113030633B
CN113030633B CN202011636613.6A CN202011636613A CN113030633B CN 113030633 B CN113030633 B CN 113030633B CN 202011636613 A CN202011636613 A CN 202011636613A CN 113030633 B CN113030633 B CN 113030633B
Authority
CN
China
Prior art keywords
fault
line
principal component
risk
risk value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011636613.6A
Other languages
English (en)
Other versions
CN113030633A (zh
Inventor
汤雪松
王建明
吴彬
余光明
邹建伟
范福来
谢地
周韩
屈劲宇
杜泓江
彭夕彬
周星光
雷乾
池之恒
郑宗伟
赵力思
陈建
李新
肖云凯
王浩男
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
Tongliang Power Supply Co of State Grid Chongqing Electric Power Co Ltd
Original Assignee
State Grid Corp of China SGCC
Tongliang Power Supply Co of State Grid Chongqing Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, Tongliang Power Supply Co of State Grid Chongqing Electric Power Co Ltd filed Critical State Grid Corp of China SGCC
Publication of CN113030633A publication Critical patent/CN113030633A/zh
Application granted granted Critical
Publication of CN113030633B publication Critical patent/CN113030633B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01RMEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
    • G01R31/00Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere
    • G01R31/08Locating faults in cables, transmission lines, or networks
    • G01R31/081Locating faults in cables, transmission lines, or networks according to type of conductors
    • G01R31/086Locating faults in cables, transmission lines, or networks according to type of conductors in power transmission or distribution networks, i.e. with interconnected conductors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Supply And Distribution Of Alternating Current (AREA)

Abstract

本申请提供本发明公开了一种基于GA—BP神经网络的配电网故障大数据分析方法和系统,从而提升配网线路风险评估模型的稳定性,并将该基于GA—BP神经网络的配电网故障大数据分析方法通过基于GA—BP神经网络的配电网故障大数据分析系统实现。其中,方法包括提取配电线路故障原因因子,筛选对故障次数存在显著影响的故障关键因子,获取各故障线路主成分的风险值得分,故障线路风险值计算模型和对线路单元的风险值进行预测评估;配电网线路风险预测评估系统包括数据输入模块、数据中转模块、输出显示模块、原因因子采集模块、关键因子筛选模块、主成分分析模块、线路风险值分析模块和风险预测评估模块。

Description

基于GA-BP神经网络的配电网故障大数据分析方法和系统
技术领域
本发明涉及配电网线路风险预测评估技术领域,具体涉及一种基于GA-BP神经网络的配电网故障大数据分析方法和系统。
背景技术
随着我国经济的高速发展,社会生活每个方面对电能的依赖程度都在不断加深。配电网直接面向广大普通用户,其运行的稳定性、可靠性对生产生活而言至关重要。配网建设的加速升级,运维工作呈现要求高、难度大的特点。传统的凭经验进行运维检修以及工程针对性改造无法科学指导运维工作,更无法对线路状态进行全面了解。国内电力领域一直以来都采用方案检修模式进行电力装置的维护管理,整体来看属于事后维护体系,一旦开启检修工作,就会有很长时间无法供能,对社会生活造成严重影响。传统配电网运维由于其工作模式和技术手段上的局限性,主要存在以下几个问题:一是相关人员工作繁重,配网线路巡视存在人员少、线路长、任务重的问题;二是农村配网线路投入产出比低;三是配网线路故障排查采用地毯式搜寻,没有重点,在寻找故障点上消耗大量抢修时间。传统配电网运维已不能满足现阶段要求,在大数据时代背景下,如何利用现有配电网中的海量数据,通过数据分析,提取配网线路故障的关键影响因素、构建合理的线路故障风险预测模型,为后续线路检修工作进行指导,提升配网运维工作效率就显得尤为重要。
在中国专利申请公开说明书,CN110889587A中公开了一种配电网线路风险评估方法。该方法采用以下5个步骤实现对配电线路进行风险评估:步骤1,将配电网线路划分为若干线路单元,采集配电网线路的历史故障数据,并对所述故障数据进行预处理得到引起线路单元故障的原因因子;步骤2,以线路单元发生故障的次数为因变量,以引起线路单元故障的原因因子作为自变量,采用逐步回归法筛选出对故障次数存在显著影响的故障关键因子;步骤3,对所述故障关键因子进行标准化处理获得标准化特征数据,通过主成分分析法计算各线路单元主成分的PCA得分;步骤4,采用EMLR算法对各线路单元主成分的PCA得分数据集进行回归分析,得到风险值计算模型;步骤5,利用所述风险值计算模型计算各线路单元的风险值,并将所各线路单元的风险值数据集作为BP神经网络训练数据集进行训练的得到各线路单元的风险值的神经网络计算模型;将测试数据导入所述神经网络计算模型实现对线路单元的风险值进行预测评估。
该发明公开了从故障数据收集整理到对配网线路风险进行分析的整套工作流程,但是该发明仅只是使用传统的BP神经网络来训练得到各线路风险值,得到的训练模型不太稳定,且该发明缺少对数据相关性的定量分析以及对结果数据的可靠性分析,同时缺少一套配电网线风险分析系统作为配电网线风险分析方法的执行载体。
发明内容
本发明所要解决的技术问题是提供一种基于GA—BP神经网络的配电网故障大数据分析方法,从而提升配网线路风险评估模型的稳定性,并将该基于GA—BP神经网络的配电网故障大数据分析方法通过基于GA—BP神经网络的配电网故障大数据分析系统实现。
本发明提供1.一种基于GA—BP神经网络的配电网故障大数据分析方法,其特征在于,所述方法包括如下步骤:
步骤1:采集配电网线路的故障数据,对故障数据进行分析,获取导致线路故障的原因因子;
步骤2:以所述原因因子为自变量,以发生线路故障的次数为因变量,采用标准化逐步回归方法,从所述原因因子中筛选出导致线路故障的关键因子;
步骤3:对所述关键因子的数据进行归一化处理,得到归一化特征数据;
步骤4:对所述归一化特征数据进行主成分分析,获取每条故障线路的主成分风险值;
步骤5:对所述每条故障线路的主成分风险值进行回归分析,获得故障线路的主成分风险值计算模型;
步骤6:利用斯皮尔曼系数计算公式,计算得出每条线路的主成分风险值与发生线路故障的次数之间的斯皮尔曼系数ρ,用于量化每条线路的主成分风险值与发生线路故障的次数之间的关系;
步骤7:根据所述斯皮尔曼系数ρ,构造系数修正公式对所述主成分风险值计算模型进行修正,得到主成分风险值计算优化模型,并利用所述主成分风险值计算优化模型重新计算得出每条故障线路的最佳主成分风险值;
步骤8:将所述每条故障线路的最佳主成分风险值组合成为最佳主成分风险值集,将所述最佳主成分风险值集分为训练数据和测试数据,利用GA-BP神经网络对所述训练数据进行训练,得到故障线路的风险值神经网络计算模型;并将所述测试数据导入所述风险值神经网络计算模型,计算获得每条故障线路的实际风险值和预测风险值;
步骤9:引入决定系数计算公式,将所述故障线路的实际风险值和预测风险值代入所述决定系数计算公式进行计算,得到实际风险值和预测风险值之间的决定系数,用于对利用GA-BP神经网络来获得每条故障线路的实际风险值和预测风险值的可靠性进行量化。
进一步,所述步骤1获取原因因子的方法为:
步骤1.1:提取出所有故障原因,按照设备情况、运行情况和外部情况将提取出的故障原因分为3类;
步骤1.2:针对所述故障原因中的每一个故障因子,按照对配电线路故障影响程度的大小进行打分,得到故障原因因子。
进一步,所述步骤2筛选关键因子的具体方法为:
步骤2.1:以所述原因因子为自变量,以发生线路故障的次数为因变量,对所述自变量数据和因变量数据进行Z-score标准化,得到标准化特征数据;
步骤2.2:对所述标准化特征数据进行逐步回归计算,得到标准化回归系数和显著性P值;
步骤2.3:根据所述显著性P值筛选出对配电线路故障影响具有显著性的关键因子。
进一步,所述步骤4获取每条故障线路的主成分风险值的具体方法为:
步骤4.1:对所述归一化特征数据进行主成分分析,得到主成分因子载荷矩阵和各个主成分的贡献率;
步骤4.2:根据所述主成分因子载荷矩阵,将各个主成分转换为用变量的线性组合表示,并计算出各个主成分值;
步骤4.3:构造综合评价函数,将所述各个主成分值代入所述综合评价函数,计算出每条故障线路的主成分风险模拟值;所述综合评价函数的公式为
Figure GDA0003076125850000031
其中,αi表示各主成分的贡献率,Zi表示各主成分值;
步骤4.4:利用公式risk_value=[score+abs(min(score))]×10对所述每条故障线路的主成分风险模拟值进行转换,得到每条故障线路的主成分风险值。
进一步,所述步骤5获得故障线路的主成分风险值计算模型的具体方法为:
步骤5.1:根据EMLR算法构造主成分风险值计算公式,所述主成分风险值计算公式为
Figure GDA0003076125850000041
其中,X=(x1,x2,…,xn)为所有主成分值的数据集合,(α12,…,αi)为需要通过机器学习训练出的系数,f(X)为目标函数值;
步骤5.2:定义损失函数Fcost,采用随机梯度下降算法通过多次迭代计算使所述损失函数Fcost达到最小值的系数集合(α12,…,αi);所述损失函数公式为
Figure GDA0003076125850000042
其中,fi(X)是模型计算得到的输出值,yi是训练集的实际值。
进一步,所述步骤7中所述系数修正公式为
Figure GDA0003076125850000043
其中,ρ为斯皮尔曼系数计算公式,所述斯皮尔曼系数计算公式为
Figure GDA0003076125850000044
其中,xi表示各条线路的主成分风险值,yi表示各条线路发生故障的次数。
进一步,所述步骤7中具体包括如下步骤:
步骤7.1:采集目标配电网单元线路长度、绝缘化率、运行年限、缺陷数、是否过载、雷区程度、周边树木情况和周边异物程度;
步骤7.2:将步骤7.1的数据带入故障线路风险值目标函数,确定于数据对应的配电线路风险值:所述故障线路风险值目标函数如下:
Figure GDA0003076125850000045
其中,risk_value表示故障线路风险值目标函数,X1表示元线路长度,X2表示绝缘化率,X3表示缺陷数,X4表示雷区程度,X5表示运行年限,X6表示是否过载,X7表示周边树木情况,X8表示周边异物程度。
进一步,步骤8中所述GA-BP神经网络模型为利用遗传算法对BP神经网络进行优化后得到的神经网络模型,所述利用遗传算法对BP神经网络进行优化的方法为:定义适应度函数
Figure GDA0003076125850000046
来更新BP神经网络各神经元权值、阈值,其中,k为系数,m为网络输出节点数;yi为BP神经网络第i个节点的期望输出;oi为第i个节点的预测输出。将步骤7所得数据为一组样本存入数据集中,从所述数据集中随机筛选的样本作为训练集,从所述数据集中随机筛选1-的样本作为测试集。可人为设置多次迭代次数,重复随机筛选数据集,对比获得不同样本的训练集和测试集最优结果。
进一步,所述步骤9中所述决定系数计算公式为
Figure GDA0003076125850000051
其中,R表示决定系数,l为样本数,yi(i=1,2,...,l)为第i个样本的真实值,
Figure GDA0003076125850000052
为第i个样本的预测值。
相应地,本申请还提供一种配电网线路风险预测评估系统,其特征在于,所述系统适用于权利要求1-9任一所述网络模型方法,所述系统包括:输入模块、显示模块、中央处理模块、原因因子采集模块、关键因子筛选模块、主成分分析模块、线路风险值计算模块和风险预测评估模块,所述输入模块的输出端与所述中央处理模块的输入端连接,所述显示单元的输入端与所述中央处理模块的输出端连接,所述原因因子采集模块的输出端与所述中央处理单元的输入端连接,所述关键因子筛选模块与所述中央处理模块通信连接,所述主成分分析模块与所述中央处理模块通信连接,所述线路风险值计算模块与所述中央处理模块通信连接,所述风险预测评估模块与所述中央处理模块通信连接;
输入模块,用于将采集到的配网线路故障数据导入风险预测评估系统;原因因子采集模块,用于获取导致配网线路故障的原因因子;关键因子筛选模块,用于从提取的原因因子中筛选出对配电线路故障影响具有显著性的关键因子;主成分分析模块,用于获取每条故障线路的最佳主成分风险值;线路风险值分析模块,用于获取每条故障线路的实际风险值和预测风险值;
所述原因因子采集模块包括:原因提取单元,用于提取出导致配网线路故障的原因;原因分类单元,用于将提取到的故障原因进行分类;故障因子赋值单元,用于对每个故障原因中的各个故障因子按照对配电线路故障影响程度的大小进行赋值;
所述关键因子筛选模块包括:标准化处理单元,用于对数据进行z-score标准化处理;回归系数计算单元,用于根据得到的标准化数据,采用逐步回归方法计算出每个原因因子的标准化回归系数;P值计算单元,用于根据得到的标准化数据,计算各原因因子对故障线路产生影响的显著性值;关键因子筛选单元,用于筛选出对配电线路故障影响具有显著性的关键因子;
所述主成分分析模块包括:归一化处理单元,用于对每条故障线路的关键因子数据进行归一化处理,消除各故障关键因子之间的量纲差异;主成分因子载荷矩阵计算单元,用于根据归一化处理后的数据计得到主成分因子载荷矩阵;贡献率计算单元,用于根据归一化处理后的数据计得到各个主成分的贡献率;主成分计算单元,用于根据主成分因子载荷矩阵将各主成分用变量的线性组合表示,并计算得出各主成分值;主成分风险模拟值计算单元,用于初步计算出每条故障线路的主成分风险模拟值;主成分风险值计算单元,用于对得到的每条故障线路的主成分风险模拟值进行优化,得到每条故障线路的主成分风险值;
所述线路风险值分析模块包括:模型存储单元,用于存储计算模型,供计算时调用;用于调用计算模型,并将数据代入模型进行计算。
本发明的有益技术效果:本申请的神经网络模型的卷积神经网络结构简单,通过遗传算法对BP神经网络隐含层、输出层神经元的初始权值和阈值进行优化,增加了模型的可靠性;此外,通过神经网络来对配电网线路风险进行评估,提供高了评估的精度和评估的效率。
1、本发明一种配电网线路风险预测评估方法,采用遗传算法对BP神经网络隐含层、输出层神经元的初始权值和阈值进行优化,进一步增加了模型的可靠性,较只用BP网络进行训练的效果具有很大改善;
2、本发明一种配电网线路风险预测评估系统,将配电网线路风险预测评估方法进行了模块化处理,使风险预测评估更加方便、快捷,同时实现输出结果可视化;
3、本发明一种配电网线路风险预测评估方法,运用了归一化公式对各故障关键因子数据进行归一化处理,消除了各故障关键因子之间的量纲差异;
4、本发明一种配电网线路风险预测评估方法,引入决定系数、斯皮尔曼系数等,进一步提高了配电网线路风险预测评估效果。
附图说明
此处所说明的附图用来提供对本发明实施例的进一步理解,构成本申请的一部分,并不构成对本发明实施例的限定。在附图中:
图1为配电网线路风险预测评估方法的工作流程图。
图2为配电网线路风险预测评估系统结构示意图。
图3为标准化逐步回归计算结果示意图。
图4为关键因子重要性排序结果示意图。
图5为主成分因子载荷矩阵结果示意图。
图6为各主成分贡献率结果示意图。
图7为部分路线综合主成分得分结果示意图。
图8为非线性系数更新前(左)与更新后(右)风险值分布图。
图9为神经网络测试集预测结果与真实值对比图。
图10为基于遗传算法优化后的BP神经网络算法测试集预测结果与真实值对比图。
图11为BP神经网络算法优化前后训练效果对比图。
图12为本系统的机构示意图。
具体实施方式
以下结合附图对本发明做出进一步的说明:
根据图1所示的配电网线路风险分析方法流程,从收集到的2年内10kV配电线路故障数据中提取出所有故障原因,并对故障原因按照设备情况、运行情况和外部情况分为3类,若故障原因中存在多个故障因子,对每个故障因子按照对配电线路故障影响程度的大小进行赋值。最终得出导致配网线路故障的14个原因因子如下:
绝缘化率:绝缘化率越高,线路风险值越低,为了避免风险与绝缘化率出现反比关系,用1-绝缘化率替换为原来的绝缘化率。
运行年限:该单元线路投运至今的运行时间。单位:年。
缺陷数:该单元线路及设备未消缺的总数量。单位:处。
负载程度:将负载程度分为过载记2,重载记1,轻载及以下记0三个数量等级。
专用客户用电情况差:专用客户用电情况差记为1,无情况差记为0。
雷区程度:雷区程度一般按照强雷、多雷、少雷区分,按照雷区程度,将强雷区域赋值为3,多雷区域赋值为2,少雷区域赋值为1,雷击情况低于少雷标准的视为0。
周边树木情况:将周边树木情况按照茂盛、有、无三个等级进行区分,周边树木生
长茂盛记为2,周边有树木记为1,周边无树木记0。
周边彩钢瓦(异物)程度:彩钢瓦在遇到大风等天气,易对电力线路造成短路及接
地等故障,线路周边有彩钢瓦记为1,无彩钢瓦记为0。
附近氢气球等飞行物:将有氢气球等飞行物记为1,无飞行物记为0。
保护区大型起吊施工:记有大型起吊施工为1,无大型起吊施工为0。
周边鸟类等飞禽频繁:周边鸟类等飞禽活动频繁记为1,无则记为0。
周边蛇活动情况:周边蛇类活动频繁记为1,无则记为0。
保护区山火风险:线路所在地区存在山火风险记为1,无风险记为0。
根据原因因子获取结果,以上述14个原因因子作为自变量,线路发生故障的次数作为因变量,针对自变量数据和因变量数据,运用标准化公式
Figure GDA0003076125850000081
进行z-score标准化,其中,
Figure GDA0003076125850000082
对标准化后的数据进行逐步回归计算得到标准化回归系数和P值(显著性)。如图3所示。根据计算得到的P值筛选出对配电线路故障影响具有显著性的8个关键因子,分别为单元线路长度、绝缘化率、运行年限、缺陷数、是否过载、雷区程度、周边树木情况、周边彩钢瓦(异物)程度。
根据上述计算得到的8个关键因子的标准化回归系数值,按绝对值大小对8个关键因子进行重要性排序。根据排序结果可以看出,缺陷数对线路发生故障次数的影响最大,绝缘化率对线路发生故障次数的影响最小;除运行年限与线路发生故障次数成负相关关系外,其余所有因子与线路发生故障次数均成正相关关系。如图4所示。
分析得出了关键因子后,接下来对关键因子的数据进行主成分分析,获取每条故障线路主成分的风险值得分。包括以下步骤:
(1)运用归一化公式
Figure GDA0003076125850000083
对各关键因子数据进行归一化处理,消除各个关键因子之间的量纲差异。
(2)对经过归一化处理后的各个关键因子数据进行主成分分析,得到主成分载荷矩阵及各主成分的贡献率,如图5、图6所示。根据计算,前7个主成分的累积贡献率已达到96.21%,因而为了降低计算维度,只选择前7个主成分来进行后续计算。
(3)根据所述主成分载荷矩阵将各主成分用变量的线性组合表示,并计算得出各个主成分值;各主成分用变量的线性组合表示为
Figure GDA0003076125850000084
(4)构造综合评价函数
Figure GDA0003076125850000085
计算得出每条故障线路主成分的风险模拟值,其中,αi为各主成分的贡献率,Zi为各主成分值。计算得出的每条故障线路主成分的部分风险模拟值得分如图7所述。
下一步,对得到的每条故障线路主成分的风险值进行回归分析,得到故障线路风险值计算模型,具体方法为:
(1)根据EMLR算法构造主成分风险值计算公。
构造出的主成分风险值计算公式为
Figure GDA0003076125850000091
其中,X=(x1,x2,…,xn)为各所有主成分的分数值数据集合,(α12,…,αi)为需要通过机器学习训练出的系数,f(X)为目标函数值;
(2)构造损失函数
Figure GDA0003076125850000092
运用随机梯度下降法寻找使Fcost达到最小值的系数集合(α12,…,αi),其中,fi(X)是模型计算得到的输出值,yi是训练集的实际值;其中,运用随机梯度下降法寻找使Fcost达到最小值的系数集合(α12,…,αi)的方法为:构建迭代函数hθ(x)=θ01x12x2+…+θnxn,损失函数
Figure GDA0003076125850000093
及权重更新公式
Figure GDA0003076125850000094
多次迭代计算出使Fcost达到最小值的系数集合(α12,…,αi)。
(3)将计算得出的系数集合(α12,…,αi)带入故障线路风险值计算模型目标函数
Figure GDA0003076125850000095
得出故障线路风险值计算模型。
由于经过主成分分析法计算得到的风险值得分score存在负值,因此,在求解使Fcost达到最小值的系数集合(α12,…,αi)之前,引入使用公式risk_value=[score+abs(min(score))]×10将各故障线路主成分的风险值得分进行转换,并将转换后的各故障线路主成分的风险值得分risk_value作为回归方程的因变量的实际值,其中score为步骤S3中得到的主成分得分。将8个关键因子作为回归方程的自变量,对线性部分系数(α12,…,α5)进行求解,得到风险值的表达式为:
Figure GDA0003076125850000096
其中,x1为单元线路长度,x2为1-绝缘化率,x3为缺陷数,x4为雷区强度,x5为年限系数,x6为是否过载,x7为周边树木,x8为周边有无彩钢等异物。
为了量化风险值与故障数的相关关系,并引入斯皮尔曼系数ρ来量化风险值risk_value与故障数的相关关系,所述斯皮尔曼系数ρ的计算公式为
Figure GDA0003076125850000097
经过计算,风险值risk_value与线路故障数的斯皮尔曼系数ρ=0.4069,相关关系较弱。在风险值的表达式中,非线性指数部分的系数(α678)均默认为1,为了增强风险值与故障数的相关关系,保持线性部分系数不变,定义新的损失函数
Figure GDA0003076125850000098
对系数(α678)进行修正。经计算,得到风险值的表达式为:
Figure GDA0003076125850000099
重新计算的风险值risk_value与线路故障数的斯皮尔曼系数ρ=0.4238。
将先路故障数与两个表达式计算出的风险值绘制成散点图,如图8所示,可以看出,不同故障数,更新系数后其对应的风险值相差更加明显。
利用所述故障线路风险值计算模型计算各故障线路的风险值得分,将所各故障线路的风险值数据集作为BP神经网络训练数据集进行训练,得到各线路单元的风险值的神经网络计算;将测试数据导入所述神经网络计算模型实现对线路单元的风险值进行预测评估。
所述GA-BP神经网络的模型采用如下方法构建:
确定神经网络训练集和测试集;
构建BP神经网络,所述神经网络包括输入层、隐含层和输出层,其中,隐含层为单个隐含层,所述输入节点数为8,所述隐含层节点数采用如下方法确定:
M=log2 n
其中,M表示隐含层节点数,n表示输入层的神经元个数;
采用遗传算法对所述BP神经网络的隐含层、输出层神经元的初始权值和阈值进行优化获得遗传BP神经网络模型,所述优化包括构造适应度函数更新各神经元权值和阈值,所述适应度函数如下:
Figure GDA0003076125850000101
其中,F表示适应度函数,k表示系数,m表示网络输出节点数,yi表示BP神经网络第i个节点的期望输出,oi表示第i个节点的预测输出;
采用训练集训练所述遗传BP神经网络模型;
采用测试集测试经过训练后的遗传BP神经网络模型,若通过测试,则进入下一步,若未通过测试,则进入上一步;
确定决定系数,并判断决定系数是否大于预设的阈值,若否,则进入步骤S1,若是,则获得用于评估配电网故障线路风险的遗传BP神经网络模型。其中BP神经网络设计如下:
(1)网络层数
BP神经网络可以包含一个到多个隐含层。不过,理论上已经证明,单个隐含层的网络可以通过适当增加神经元节点的个数实现非线性映射。因此,对于大部分应用场合,单个隐含层即可满足需要。
(2)输入层节点数
输入层节点数取决于输入向量的维数。应用神经网络解决实际问题时,首先应从问题中提炼出一个抽象模型,形成输入空间和输出空间。因此,数据的表达方式会影响输入向量的维数大小。
(3)隐含层节点数
隐含层节点数对BP神经网络的性能有很大影响。一般较多的隐含层节点数可以带来更好的性能,但可能导致训练时间过长,这也是目前BP神经网络的一个缺陷。目前,主要的经验确定隐含层节点数的公式有:
Figure GDA0003076125850000111
其中,m和n分别为输出层和输入层的神经元个数,a∈[0,10]。
②M=log2n,其中,n为输入层的神经元个数。
在该模型中,以8个关键因子作为BP神经网络的输入,x1为单元线路长度,x2为1-绝缘化率,x3为缺陷数,x4为雷区强度,x5为年限系数,x6为是否过载,x7为周边树木,x8为周边有无彩钢等异物;以风险值作为BP神经网络的输出,设置隐含层节点数M=3。
随机选取数据集中80%的样本作为训练集对该BP神经网络进行训练,选取20%的样本作为测试集对该BP神经网络训练效果进行测试,对测试集预测的部分结果如图9所示。
在本实施例中,多次重复随机筛选数据集获得不同样本的训练集和测试集。通过有限的数据集随机筛选获得更多数量的测试集,从而实现有限数据集中随机组合获得海量训练集和测试集,减少训练样本获取难度,同时保障训练样本数量,因BP神经网络采用有监督学习,因此需要有足够多样本对模型进行训练。通过对数据集的随机筛选可获得海量训练集,避免模型仅对特定数据有较好效果,对其他数据集上效果不佳的缺陷,时模型能更好的适应任何数据集,增强模型适用性和普适性。
为了能够定量地对BP神经网络的预测效果进行评价,引入决定系数,其范围在[0,1]内,越接近于1,表明模型的预测效果越好;反之,若越接近于0,则说明模型的预测效果越差。决定系数的表达式为:
Figure GDA0003076125850000112
其中,l为样本数,yi(i=1,2,...,l)为第i个样本的真实值;
Figure GDA0003076125850000113
为第i个样本的预测值。经计算,测试集的决定系数R2=0.9624。
此外,为了增加模型的可靠性,引入遗传算法来优化BP神经网络隐含层、输出层神经元的初始权值和阈值。在使用遗传算法更新各神经元权值、阈值时,适应度函数定义为:
Figure GDA0003076125850000114
其中,k为系数,m为网络输出节点数;yi为BP神经网络第i个节点的期望输出;oi为第i个节点的预测输出。经过计算,对测试集预测的部分结果如下,其决定系数,较仅用BP网络进行训练的效果改善很多。如图10、图11所示。
如图2和图12所示,该系统包括:
数据输入模块,用于将采集到的配网线路故障数据导入风险预测评估系统;数据输出模块,用于输出配电网线路分析结果;原因因子采集模块,用于获取导致配网线路故障的原因因子;关键因子筛选模块,用于从提取的原因因子中筛选出对配电线路故障影响具有显著性的关键因子;主成分分析模块,用于获取每条故障线路的最佳主成分风险值;线路风险值分析模块,用于获取每条故障线路的实际风险值和预测风险值。
作为对本发明的进一步描述,原因因子采集模块包括:原因提取单元,用于提取出导致配网线路故障的原因;原因分类单元,用于将提取到的故障原因进行分类;故障因子赋值单元,用于对每个故障原因中的各个故障因子按照对配电线路故障影响程度的大小进行赋值。
关键因子筛选模块包括:标准化处理单元,用于对数据进行z-score标准化处理;回归系数计算单元,用于根据得到的标准化数据,采用逐步回归方法计算出每个原因因子的标准化回归系数;P值计算单元,用于根据得到的标准化数据,计算各原因因子对故障线路产生影响的显著性值;关键因子筛选单元,用于筛选出对配电线路故障影响具有显著性的关键因子。
主成分分析模块包括:归一化处理单元,用于对每条故障线路的关键因子数据进行归一化处理,消除各故障关键因子之间的量纲差异;主成分因子载荷矩阵计算单元,用于根据归一化处理后的数据计得到主成分因子载荷矩阵;贡献率计算单元,用于根据归一化处理后的数据计得到各个主成分的贡献率;主成分计算单元,用于根据主成分因子载荷矩阵将各主成分用变量的线性组合表示,并计算得出各主成分值;主成分风险模拟值计算单元,用于初步计算出每条故障线路的主成分风险模拟值;主成分风险值计算单元,用于对得到的每条故障线路的主成分风险模拟值进行优化,得到每条故障线路的主成分风险值。
线路风险值分析模块包括:模型存储单元,用于存储计算模型,供计算时调用;模型计算单元,用于调用计算模型,并将数据代入模型进行计算。
使用时,通过数据输入模块将收集到的配电线路故障数据输入风险分析系统,由数据输入模块将数据传送至原因因子采集模块。
原因因子采集模块接收到由数据输入模块发送的故障数据后,原因提取单元根据接收到的故障数据,提取出导致配网线路故障的原因,并将故障原因提取结果传送至原因分类单元;原因分类单元将提取到的故障原因进行分类,并将分类好的故障原因数据发送给故障因子赋值单元,故障因子赋值单元对每个故障原因中的各个故障因子按照对配电线路故障影响程度的大小进行赋值,得出原因因子,同时将结果发送给关键因子筛选模块。
关键因子筛选模块接收到由原因因子采集模块发送的原因因子分析结果后,标准化处理单元对原因因子的数据进行z-score标准化处理;并将标准化处理后的数据发送给回归系数计算单元和P值计算单元;回归系数计算单元根据得到的标准化数据,采用逐步回归方法计算出每个原因因子的标准化回归系数;P值计算单元根据得到的标准化数据,计算各原因因子对故障线路的P值(影响值);回归系数计算单元和P值计算单元分别将计算结果发送给关键因子筛选单元,根据计算结果选出对配电线路故障影响具有显著性的关键因子,同时将提取出的关键因子数据发送给主成分分析模块。
主成分分析模块中的归一化计算单元对各故障关键因子数据进行归一化处理,并将归一化处理后的数据发送给载荷矩阵计算单元和贡献率计算单元;载荷矩阵计算单元根据归一化处理后的数据计得到主成分载荷矩阵,并将主成分载荷矩阵发送给主成分值计算单元;根据归一化处理后的数据计得到各主成分的贡献率;主成分值计算单元根据主成分载荷矩阵将各主成分用变量的线性组合表示,并计算得出各主成分的分数值,同时将各主成分值发送给主成分风险模拟值计算单元来计算各故障线路主成分的风险模拟值;主成分风险模拟值计算单元将计算得出的各故障线路主成分的风险值发送给线路风险值分析模块。
线路风险值分析模块中的模型计算单元从模型存储单元中调取模型,并利用接收到的数据进行计算获得每条故障线路的实际风险值和预测风险值,并将故障线路的实际风险值和预测风险值代入所述决定系数计算公式进行计算,得到实际风险值和预测风险值之间的决定系数,用于对利用GA-BP神经网络来获得每条故障线路的实际风险值和预测风险值的可靠性进行量化。最后将结果发送给数据输出模块。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (9)

1.一种基于GA—BP神经网络的配电网故障大数据分析方法,其特征在于,所述方法包括如下步骤:
步骤1:采集配电网线路的故障数据,对故障数据进行分析,获取导致线路故障的原因因子;
步骤2:以所述原因因子为自变量,以发生线路故障的次数为因变量,采用标准化逐步回归方法,从所述原因因子中筛选出导致线路故障的关键因子;
步骤3:对所述关键因子的数据进行归一化处理,得到归一化特征数据;
步骤4:对所述归一化特征数据进行主成分分析,获取每条故障线路的主成分风险值;
步骤5:对所述每条故障线路的主成分风险值进行回归分析,获得故障线路的主成分风险值计算模型;
步骤6:利用斯皮尔曼系数计算公式,计算得出每条线路的主成分风险值与发生线路故障的次数之间的斯皮尔曼系数ρ,用于量化每条线路的主成分风险值与发生线路故障的次数之间的关系;
步骤7:根据所述斯皮尔曼系数ρ,构造系数修正公式对所述主成分风险值计算模型进行修正,得到主成分风险值计算优化模型,并利用所述主成分风险值计算优化模型重新计算得出每条故障线路的最佳主成分风险值;
步骤8:将所述每条故障线路的最佳主成分风险值组合成为最佳主成分风险值集,将所述最佳主成分风险值集分为训练数据和测试数据,利用GA-BP神经网络对所述训练数据进行训练,得到故障线路的风险值神经网络计算模型;并将所述测试数据导入所述风险值神经网络计算模型,计算获得每条故障线路的实际风险值和预测风险值;
步骤9:引入决定系数计算公式,将所述故障线路的实际风险值和预测风险值代入所述决定系数计算公式进行计算,得到实际风险值和预测风险值之间的决定系数,用于对利用GA-BP神经网络来获得每条故障线路的实际风险值和预测风险值的可靠性进行量化。
2.根据权利要求1所述的基于GA—BP神经网络的配电网故障大数据分析方法,其特征在于,所述步骤1获取原因因子的方法为:
步骤1.1:提取出所有故障原因,按照设备情况、运行情况和外部情况将提取出的故障原因分为3类;
步骤1.2:针对所述故障原因中的每一个故障因子,按照对配电线路故障影响程度的大小进行打分,得到故障原因因子。
3.根据权利要求1所述的基于GA—BP神经网络的配电网故障大数据分析方法,其特征在于,所述步骤2筛选关键因子的具体方法为:
步骤2.1:以所述原因因子为自变量,以发生线路故障的次数为因变量,对所述自变量数据和因变量数据进行Z-score标准化,得到标准化特征数据;
步骤2.2:对所述标准化特征数据进行逐步回归计算,得到标准化回归系数和显著性P值;
步骤2.3:根据所述显著性P值筛选出对配电线路故障影响具有显著性的关键因子。
4.根据权利要求1所述的基于GA—BP神经网络的配电网故障大数据分析方法,其特征在于,所述步骤4获取每条故障线路的主成分风险值的具体方法为:
步骤4.1:对所述归一化特征数据进行主成分分析,得到主成分因子载荷矩阵和各个主成分的贡献率;
步骤4.2:根据所述主成分因子载荷矩阵,将各个主成分转换为用变量的线性组合表示,并计算出各个主成分值;
步骤4.3:构造综合评价函数,将所述各个主成分值代入所述综合评价函数,计算出每条故障线路的主成分风险模拟值;所述综合评价函数的公式为
Figure FDA0004132043380000021
其中,αi表示各主成分的贡献率,Zi表示各主成分值;
步骤4.4:利用公式risk_value=[score+abs(min(score))]×10对所述每条故障线路的主成分风险模拟值进行转换,得到每条故障线路的主成分风险值。
5.根据权利要求1所述的基于GA—BP神经网络的配电网故障大数据分析方法,其特征在于,所述步骤5获得故障线路的主成分风险值计算模型的具体方法为:
步骤5.1:根据EMLR算法构造主成分风险值计算公式,所述主成分风险值计算公式为
Figure FDA0004132043380000022
其中,X=(x1,x2,…,xn)为所有主成分值的数据集合,(α12,…,αi)为需要通过机器学习训练出的系数,f(X)为目标函数值;
步骤5.2:定义损失函数Fcost,采用随机梯度下降算法通过多次迭代计算使所述损失函数Fcost达到最小值的系数集合(α12,…,αi);所述损失函数公式为
Figure FDA0004132043380000023
其中,fi(X)是模型计算得到的输出值,yi是训练集的实际值。
6.根据权利要求1所述的基于GA—BP神经网络的配电网故障大数据分析方法,其特征在于,所述系数修正公式为
Figure FDA0004132043380000031
其中,ρ为斯皮尔曼系数计算公式,所述斯皮尔曼系数计算公式为
Figure FDA0004132043380000032
其中,xi表示各条线路的主成分风险值,yi表示各条线路发生故障的次数。
7.根据权利要求1所述的基于GA—BP神经网络的配电网故障大数据分析方法,其特征在于,所述步骤7中具体包括如下步骤:
步骤7.1:采集目标配电网单元线路长度、绝缘化率、运行年限、缺陷数、是否过载、雷区程度、周边树木情况和周边异物程度;
步骤7.2:将步骤7.1的数据带入故障线路风险值目标函数,确定于数据对应的配电线路风险值:所述故障线路风险值目标函数如下:
Figure FDA0004132043380000033
其中,risk_value表示故障线路风险值目标函数,X1表示元线路长度,X2表示绝缘化率,X3表示缺陷数,X4表示雷区程度,X5表示运行年限,X6表示是否过载,X7表示周边树木情况,X8表示周边异物程度。
8.根据权利要求1所述基于GA—BP神经网络的配电网故障大数据分析方法,其特征在于,所述步骤9中所述决定系数计算公式为
Figure FDA0004132043380000034
其中,R表示决定系数,l为样本数,yi(i=1,2,...,l)为第i个样本的真实值,
Figure FDA0004132043380000035
为第i个样本的预测值。
9.一种基于GA—BP神经网络的配电网故障大数据分析系统,其特征在于,所述系统适用于权利要求1-8任一所述配电网故障大数据分析方法,所述系统包括:输入模块、显示模块、中央处理模块、原因因子采集模块、关键因子筛选模块、主成分分析模块、线路风险值计算模块和风险预测评估模块,所述输入模块的输出端与所述中央处理模块的输入端连接,所述显示模块的输入端与所述中央处理模块的输出端连接,所述原因因子采集模块的输出端与所述中央处理模块的输入端连接,所述关键因子筛选模块与所述中央处理模块通信连接,所述主成分分析模块与所述中央处理模块通信连接,所述线路风险值计算模块与所述中央处理模块通信连接,所述风险预测评估模块与所述中央处理模块通信连接;
输入模块,用于将采集到的配网线路故障数据导入风险预测评估系统;原因因子采集模块,用于获取导致配网线路故障的原因因子;关键因子筛选模块,用于从提取的原因因子中筛选出对配电线路故障影响具有显著性的关键因子;主成分分析模块,用于获取每条故障线路的最佳主成分风险值;线路风险值计算模块,用于获取每条故障线路的实际风险值和预测风险值;
所述原因因子采集模块包括:原因提取单元,用于提取出导致配网线路故障的原因;原因分类单元,用于将提取到的故障原因进行分类;故障因子赋值单元,用于对每个故障原因中的各个故障因子按照对配电线路故障影响程度的大小进行赋值;
所述关键因子筛选模块包括:标准化处理单元,用于对数据进行z-score标准化处理;回归系数计算单元,用于根据得到的标准化数据,采用逐步回归方法计算出每个原因因子的标准化回归系数;P值计算单元,用于根据得到的标准化数据,计算各原因因子对故障线路产生影响的显著性值;关键因子筛选单元,用于筛选出对配电线路故障影响具有显著性的关键因子;
所述主成分分析模块包括:归一化处理单元,用于对每条故障线路的关键因子数据进行归一化处理,消除各故障关键因子之间的量纲差异;主成分因子载荷矩阵计算单元,用于根据归一化处理后的数据计得到主成分因子载荷矩阵;贡献率计算单元,用于根据归一化处理后的数据计得到各个主成分的贡献率;主成分计算单元,用于根据主成分因子载荷矩阵将各主成分用变量的线性组合表示,并计算得出各主成分值;主成分风险模拟值计算单元,用于初步计算出每条故障线路的主成分风险模拟值;主成分风险值计算单元,用于对得到的每条故障线路的主成分风险模拟值进行优化,得到每条故障线路的主成分风险值;
所述线路风险值计算模块包括:模型存储单元,用于存储计算模型,供计算时调用;用于调用计算模型,并将数据代入模型进行计算。
CN202011636613.6A 2020-12-01 2020-12-31 基于ga-bp神经网络的配电网故障大数据分析方法和系统 Active CN113030633B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202011384616 2020-12-01
CN2020113846165 2020-12-01

Publications (2)

Publication Number Publication Date
CN113030633A CN113030633A (zh) 2021-06-25
CN113030633B true CN113030633B (zh) 2023-05-02

Family

ID=76460568

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011636613.6A Active CN113030633B (zh) 2020-12-01 2020-12-31 基于ga-bp神经网络的配电网故障大数据分析方法和系统

Country Status (1)

Country Link
CN (1) CN113030633B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113642253B (zh) * 2021-08-30 2024-04-02 佛山众陶联供应链服务有限公司 一种陶瓷砖半成品在加工中的损耗判断方法和系统
CN114862042A (zh) * 2022-05-27 2022-08-05 安徽继远软件有限公司 配电网线路故障风险分析方法及其系统
CN116090839B (zh) * 2023-04-07 2023-06-16 水利部交通运输部国家能源局南京水利科学研究院 水资源耦合系统多重风险分析与评估方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008133922A1 (en) * 2007-04-24 2008-11-06 University Of South Florida Electric power distribution interruption risk assessment calculator
CN107908638A (zh) * 2017-09-26 2018-04-13 国网甘肃省电力公司 基于大数据挖掘配的电网运行效率评价方法及系统
CN109523155A (zh) * 2018-11-13 2019-03-26 国网甘肃省电力公司电力科学研究院 一种蒙特卡洛及最小二乘支持向量机的电网风险评估方法
CN110488150A (zh) * 2019-08-09 2019-11-22 国网河北省电力有限公司沧州供电分公司 一种基于多算法融合的故障智能诊断方法
CN110533549A (zh) * 2019-07-12 2019-12-03 杭州电子科技大学 一种基于ga优化rs-bp神经网络电网故障定位方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008133922A1 (en) * 2007-04-24 2008-11-06 University Of South Florida Electric power distribution interruption risk assessment calculator
CN107908638A (zh) * 2017-09-26 2018-04-13 国网甘肃省电力公司 基于大数据挖掘配的电网运行效率评价方法及系统
CN109523155A (zh) * 2018-11-13 2019-03-26 国网甘肃省电力公司电力科学研究院 一种蒙特卡洛及最小二乘支持向量机的电网风险评估方法
CN110533549A (zh) * 2019-07-12 2019-12-03 杭州电子科技大学 一种基于ga优化rs-bp神经网络电网故障定位方法
CN110488150A (zh) * 2019-08-09 2019-11-22 国网河北省电力有限公司沧州供电分公司 一种基于多算法融合的故障智能诊断方法

Also Published As

Publication number Publication date
CN113030633A (zh) 2021-06-25

Similar Documents

Publication Publication Date Title
CN113030633B (zh) 基于ga-bp神经网络的配电网故障大数据分析方法和系统
CN107169628B (zh) 一种基于大数据互信息属性约简的配电网可靠性评估方法
CN104809658B (zh) 一种低压配网台区线损的快速分析方法
CN105677791B (zh) 用于分析风力发电机组的运行数据的方法和系统
CN112734204B (zh) 配电网故障线路风险评估方法和系统
CN108876163B (zh) 综合因果分析与机器学习的暂态功角稳定快速评估方法
CN111259947A (zh) 一种基于多模态学习的电力系统故障预警方法和系统
CN106909933A (zh) 一种三阶段多视角特征融合的窃电分类预测方法
CN111738462B (zh) 电力计量装置故障抢修主动服务预警方法
CN107491783B (zh) 基于改进密度峰值聚类算法的变压器故障类型分类方法
CN110569278A (zh) 一种基于大数据分析的变压器缺陷评估方法
CN114118588A (zh) 聚类欠采样下基于博弈特征提取的迎峰度夏停电预测方法
CN108304567A (zh) 高压变压器工况模式识别与数据分类方法及系统
CN110705859A (zh) 基于pca-自组织神经网络的中低压配电网运行状态评估方法
CN113689079A (zh) 基于多元线性回归和聚类分析的台区线损预测方法及系统
CN112016858A (zh) 一种基于主客观赋权法的舆情风险评价方法
CN114118592B (zh) 一种智能电网用电端短期能耗预测系统
CN117473424A (zh) 基于随机森林的变压器故障诊断方法、系统、设备及介质
CN115409264A (zh) 基于馈线故障预测的配电网抢修驻点位置优化方法
CN110059938B (zh) 一种基于关联规则驱动的配电网规划方法
CN113327047B (zh) 基于模糊综合模型的电力营销服务渠道决策方法及系统
CN113505818A (zh) 改进决策树算法的熔铝炉能耗异常诊断方法和系统及设备
CN111209955A (zh) 基于深度神经网络和随机森林的飞机电源系统故障识别方法
CN112434955B (zh) 一种基于多数据融合的配网线路运行风险感知方法
CN113379093B (zh) 油气集输系统能耗分析与优化方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant