CN113030633A - 基于ga-bp神经网络的配电网故障大数据分析方法和系统 - Google Patents
基于ga-bp神经网络的配电网故障大数据分析方法和系统 Download PDFInfo
- Publication number
- CN113030633A CN113030633A CN202011636613.6A CN202011636613A CN113030633A CN 113030633 A CN113030633 A CN 113030633A CN 202011636613 A CN202011636613 A CN 202011636613A CN 113030633 A CN113030633 A CN 113030633A
- Authority
- CN
- China
- Prior art keywords
- fault
- principal component
- line
- data
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01R—MEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
- G01R31/00—Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere
- G01R31/08—Locating faults in cables, transmission lines, or networks
- G01R31/081—Locating faults in cables, transmission lines, or networks according to type of conductors
- G01R31/086—Locating faults in cables, transmission lines, or networks according to type of conductors in power transmission or distribution networks, i.e. with interconnected conductors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Supply And Distribution Of Alternating Current (AREA)
Abstract
本申请提供本发明公开了一种基于GA—BP神经网络的配电网故障大数据分析方法和系统,从而提升配网线路风险评估模型的稳定性,并将该基于GA—BP神经网络的配电网故障大数据分析方法通过基于GA—BP神经网络的配电网故障大数据分析系统实现。其中,方法包括提取配电线路故障原因因子,筛选对故障次数存在显著影响的故障关键因子,获取各故障线路主成分的风险值得分,故障线路风险值计算模型和对线路单元的风险值进行预测评估;配电网线路风险预测评估系统包括数据输入模块、数据中转模块、输出显示模块、原因因子采集模块、关键因子筛选模块、主成分分析模块、线路风险值分析模块和风险预测评估模块。
Description
技术领域
本发明涉及配电网线路风险预测评估技术领域,具体涉及一种基于GA-BP神经网络的配 电网故障大数据分析方法和系统。
背景技术
随着我国经济的高速发展,社会生活每个方面对电能的依赖程度都在不断加深。配电网 直接面向广大普通用户,其运行的稳定性、可靠性对生产生活而言至关重要。配网建设的加 速升级,运维工作呈现要求高、难度大的特点。传统的凭经验进行运维检修以及工程针对性 改造无法科学指导运维工作,更无法对线路状态进行全面了解。国内电力领域一直以来都采 用方案检修模式进行电力装置的维护管理,整体来看属于事后维护体系,一旦开启检修工作, 就会有很长时间无法供能,对社会生活造成严重影响。传统配电网运维由于其工作模式和技 术手段上的局限性,主要存在以下几个问题:一是相关人员工作繁重,配网线路巡视存在人 员少、线路长、任务重的问题;二是农村配网线路投入产出比低;三是配网线路故障排查采 用地毯式搜寻,没有重点,在寻找故障点上消耗大量抢修时间。传统配电网运维已不能满足 现阶段要求,在大数据时代背景下,如何利用现有配电网中的海量数据,通过数据分析,提 取配网线路故障的关键影响因素、构建合理的线路故障风险预测模型,为后续线路检修工作 进行指导,提升配网运维工作效率就显得尤为重要。
在中国专利申请公开说明书,CN110889587A中公开了一种配电网线路风险评估方法。该 方法采用以下5个步骤实现对配电线路进行风险评估:步骤1,将配电网线路划分为若干线 路单元,采集配电网线路的历史故障数据,并对所述故障数据进行预处理得到引起线路单元 故障的原因因子;步骤2,以线路单元发生故障的次数为因变量,以引起线路单元故障的原 因因子作为自变量,采用逐步回归法筛选出对故障次数存在显著影响的故障关键因子;步骤 3,对所述故障关键因子进行标准化处理获得标准化特征数据,通过主成分分析法计算各线 路单元主成分的PCA得分;步骤4,采用EMLR算法对各线路单元主成分的PCA得分数据集进 行回归分析,得到风险值计算模型;步骤5,利用所述风险值计算模型计算各线路单元的风 险值,并将所各线路单元的风险值数据集作为BP神经网络训练数据集进行训练的得到各线 路单元的风险值的神经网络计算模型;将测试数据导入所述神经网络计算模型实现对线路单 元的风险值进行预测评估。
该发明公开了从故障数据收集整理到对配网线路风险进行分析的整套工作流程,但是该 发明仅只是使用传统的BP神经网络来训练得到各线路风险值,得到的训练模型不太稳定, 且该发明缺少对数据相关性的定量分析以及对结果数据的可靠性分析,同时缺少一套配电网 线风险分析系统作为配电网线风险分析方法的执行载体。
发明内容
本发明所要解决的技术问题是提供一种基于GA—BP神经网络的配电网故障大数据分析 方法,从而提升配网线路风险评估模型的稳定性,并将该基于GA—BP神经网络的配电网故 障大数据分析方法通过基于GA—BP神经网络的配电网故障大数据分析系统实现。
本发明提供1.一种基于GA—BP神经网络的配电网故障大数据分析方法,其特征在于,所
述方法包括如下步骤:
步骤1:采集配电网线路的故障数据,对故障数据进行分析,获取导致线路故障的原因 因子;
步骤2:以所述原因因子为自变量,以发生线路故障的次数为因变量,采用标准化逐步 回归方法,从所述原因因子中筛选出导致线路故障的关键因子;
步骤3:对所述关键因子的数据进行归一化处理,得到归一化特征数据;
步骤4:对所述归一化特征数据进行主成分分析,获取每条故障线路的主成分风险值;
步骤5:对所述每条故障线路的主成分风险值进行回归分析,获得故障线路的主成分风 险值计算模型;
步骤6:利用斯皮尔曼系数计算公式,计算得出每条线路的主成分风险值与发生线路故 障的次数之间的斯皮尔曼系数ρ,用于量化每条线路的主成分风险值与发生线路故障的次数 之间的关系;
步骤7:根据所述斯皮尔曼系数ρ,构造系数修正公式对所述主成分风险值计算模型进 行修正,得到主成分风险值计算优化模型,并利用所述主成分风险值计算优化模型重新计算 得出每条故障线路的最佳主成分风险值;
步骤8:将所述每条故障线路的最佳主成分风险值组合成为最佳主成分风险值集,将所 述最佳主成分风险值集分为训练数据和测试数据,利用GA-BP神经网络对所述训练数据进行 训练,得到故障线路的风险值神经网络计算模型;并将所述测试数据导入所述风险值神经网 络计算模型,计算获得每条故障线路的实际风险值和预测风险值;
步骤9:引入决定系数计算公式,将所述故障线路的实际风险值和预测风险值代入所述 决定系数计算公式进行计算,得到实际风险值和预测风险值之间的决定系数,用于对利用 GA-BP神经网络来获得每条故障线路的实际风险值和预测风险值的可靠性进行量化。
进一步,所述步骤1获取原因因子的方法为:
步骤1.1:提取出所有故障原因,按照设备情况、运行情况和外部情况将提取出的故障 原因分为3类;
步骤1.2:针对所述故障原因中的每一个故障因子,按照对配电线路故障影响程度的大 小进行打分,得到故障原因因子。
进一步,所述步骤2筛选关键因子的具体方法为:
步骤2.1:以所述原因因子为自变量,以发生线路故障的次数为因变量,对所述自变量 数据和因变量数据进行Z-score标准化,得到标准化特征数据;
步骤2.2:对所述标准化特征数据进行逐步回归计算,得到标准化回归系数和显著性P 值;
步骤2.3:根据所述显著性P值筛选出对配电线路故障影响具有显著性的关键因子。
进一步,所述步骤4获取每条故障线路的主成分风险值的具体方法为:
步骤4.1:对所述归一化特征数据进行主成分分析,得到主成分因子载荷矩阵和各个主成 分的贡献率;
步骤4.2:根据所述主成分因子载荷矩阵,将各个主成分转换为用变量的线性组合表示, 并计算出各个主成分值;
步骤4.4:利用公式risk_value=[score+abs(min(score))]×10对所述每条故障线路的主成 分风险模拟值进行转换,得到每条故障线路的主成分风险值。
进一步,所述步骤5获得故障线路的主成分风险值计算模型的具体方法为:
步骤5.1:根据EMLR算法构造主成分风险值计算公式,所述主成分风险值计算公式为 其中,X=(x1,x2,…,xn)为所有主成分值的数 据集合,(α1,α2,…,αi)为需要通过机器学习训练出的系数,f(X)为目标函数值;
步骤5.2:定义损失函数Fcost,采用随机梯度下降算法通过多次迭代计算使所述损失函 数Fcost达到最小值的系数集合(α1,α2,…,αi);所述损失函数公式为其 中,fi(X)是模型计算得到的输出值,yi是训练集的实际值。
进一步,所述步骤7中具体包括如下步骤:
步骤7.1:采集目标配电网单元线路长度、绝缘化率、运行年限、缺陷数、是否过载、雷区程度、周边树木情况和周边异物程度;
步骤7.2:将步骤7.1的数据带入故障线路风险值目标函数,确定于数据对应的配电线 路风险值:所述故障线路风险值目标函数如下:
其中,risk_value表示故障线路风险值目标函数,X1表示元线路长度,X2表示绝缘化率, X3表示缺陷数,X4表示雷区程度,X5表示运行年限,X6表示是否过载,X7表示周边树木情况, X8表示周边异物程度。
进一步,步骤8中所述GA-BP神经网络模型为利用遗传算法对BP神经网络进行优化后 得到的神经网络模型,所述利用遗传算法对BP神经网络进行优化的方法为:定义适应度函 数来更新BP神经网络各神经元权值、阈值,其中,k为系数,m为网络输出节点数;yi为BP神经网络第i个节点的期望输出;oi为第i个节点的预测输出。 将步骤7所得数据为一组样本存入数据集中,从所述数据集中随机筛选的样本作为训练集,从所述数据集中随机筛选1-的样本作为测试集。可人为设置多次迭代次数,重复随机筛选数据集,对比获得不同样本的训练集和测试集最优结果。
进一步,所述步骤9中所述决定系数计算公式为
相应地,本申请还提供一种配电网线路风险预测评估系统,其特征在于,所述系统适用 于权利要求1-9任一所述网络模型方法,所述系统包括:输入模块、显示模块、中央处理模 块、原因因子采集模块、关键因子筛选模块、主成分分析模块、线路风险值计算模块和风险 预测评估模块,所述输入模块的输出端与所述中央处理模块的输入端连接,所述显示单元的 输入端与所述中央处理模块的输出端连接,所述原因因子采集模块的输出端与所述中央处理 单元的输入端连接,所述关键因子筛选模块与所述中央处理模块通信连接,所述主成分分析 模块与所述中央处理模块通信连接,所述线路风险值计算模块与所述中央处理模块通信连 接,所述风险预测评估模块与所述中央处理模块通信连接;
输入模块,用于将采集到的配网线路故障数据导入风险预测评估系统;原因因子采集模 块,用于获取导致配网线路故障的原因因子;关键因子筛选模块,用于从提取的原因因子中 筛选出对配电线路故障影响具有显著性的关键因子;主成分分析模块,用于获取每条故障线 路的最佳主成分风险值;线路风险值分析模块,用于获取每条故障线路的实际风险值和预测 风险值;
所述原因因子采集模块包括:原因提取单元,用于提取出导致配网线路故障的原因;原 因分类单元,用于将提取到的故障原因进行分类;故障因子赋值单元,用于对每个故障原因 中的各个故障因子按照对配电线路故障影响程度的大小进行赋值;
所述关键因子筛选模块包括:标准化处理单元,用于对数据进行z-score标准化处理; 回归系数计算单元,用于根据得到的标准化数据,采用逐步回归方法计算出每个原因因子的 标准化回归系数;P值计算单元,用于根据得到的标准化数据,计算各原因因子对故障线路 产生影响的显著性值;关键因子筛选单元,用于筛选出对配电线路故障影响具有显著性的关 键因子;
所述主成分分析模块包括:归一化处理单元,用于对每条故障线路的关键因子数据进行 归一化处理,消除各故障关键因子之间的量纲差异;主成分因子载荷矩阵计算单元,用于根 据归一化处理后的数据计得到主成分因子载荷矩阵;贡献率计算单元,用于根据归一化处理 后的数据计得到各个主成分的贡献率;主成分计算单元,用于根据主成分因子载荷矩阵将各 主成分用变量的线性组合表示,并计算得出各主成分值;主成分风险模拟值计算单元,用于 初步计算出每条故障线路的主成分风险模拟值;主成分风险值计算单元,用于对得到的每条 故障线路的主成分风险模拟值进行优化,得到每条故障线路的主成分风险值;
所述线路风险值分析模块包括:模型存储单元,用于存储计算模型,供计算时调用;用 于调用计算模型,并将数据代入模型进行计算。
本发明的有益技术效果:本申请的神经网络模型的卷积神经网络结构简单,通过遗传 算法对BP神经网络隐含层、输出层神经元的初始权值和阈值进行优化,增加了模型的可靠 性;此外,通过神经网络来对配电网线路风险进行评估,提供高了评估的精度和评估的效率。
1、本发明一种配电网线路风险预测评估方法,采用遗传算法对BP神经网络隐含层、输 出层神经元的初始权值和阈值进行优化,进一步增加了模型的可靠性,较只用BP网络进行 训练的效果具有很大改善;
2、本发明一种配电网线路风险预测评估系统,将配电网线路风险预测评估方法进行了 模块化处理,使风险预测评估更加方便、快捷,同时实现输出结果可视化;
3、本发明一种配电网线路风险预测评估方法,运用了归一化公式对各故障关键因子数 据进行归一化处理,消除了各故障关键因子之间的量纲差异;
4、本发明一种配电网线路风险预测评估方法,引入决定系数、斯皮尔曼系数等,进一 步提高了配电网线路风险预测评估效果。
附图说明
此处所说明的附图用来提供对本发明实施例的进一步理解,构成本申请的一部分,并不 构成对本发明实施例的限定。在附图中:
图1为配电网线路风险预测评估方法的工作流程图。
图2为配电网线路风险预测评估系统结构示意图。
图3为标准化逐步回归计算结果示意图。
图4为关键因子重要性排序结果示意图。
图5为主成分因子载荷矩阵结果示意图。
图6为各主成分贡献率结果示意图。
图7为部分路线综合主成分得分结果示意图。
图8为非线性系数更新前(左)与更新后(右)风险值分布图。
图9为神经网络测试集预测结果与真实值对比图。
图10为基于遗传算法优化后的BP神经网络算法测试集预测结果与真实值对比图。
图11为BP神经网络算法优化前后训练效果对比图。
图12为本系统的机构示意图。
具体实施方式
以下结合附图对本发明做出进一步的说明:
根据图1所示的配电网线路风险分析方法流程,从收集到的2年内10kV配电线路故障 数据中提取出所有故障原因,并对故障原因按照设备情况、运行情况和外部情况分为3类, 若故障原因中存在多个故障因子,对每个故障因子按照对配电线路故障影响程度的大小进行 赋值。最终得出导致配网线路故障的14个原因因子如下:
绝缘化率:绝缘化率越高,线路风险值越低,为了避免风险与绝缘化率出现反比关系, 用1-绝缘化率替换为原来的绝缘化率。
运行年限:该单元线路投运至今的运行时间。单位:年。
缺陷数:该单元线路及设备未消缺的总数量。单位:处。
负载程度:将负载程度分为过载记2,重载记1,轻载及以下记0三个数量等级。
专用客户用电情况差:专用客户用电情况差记为1,无情况差记为0。
雷区程度:雷区程度一般按照强雷、多雷、少雷区分,按照雷区程度,将强雷区域赋值为3,多雷区域赋值为2,少雷区域赋值为1,雷击情况低于少雷标准的视为0。
周边树木情况:将周边树木情况按照茂盛、有、无三个等级进行区分,周边树木生长茂盛记为2,周边有树木记为1,周边无树木记0。
周边彩钢瓦(异物)程度:彩钢瓦在遇到大风等天气,易对电力线路造成短路及接地等故障,线路周边有彩钢瓦记为1,无彩钢瓦记为0。
附近氢气球等飞行物:将有氢气球等飞行物记为1,无飞行物记为0。
保护区大型起吊施工:记有大型起吊施工为1,无大型起吊施工为0。
周边鸟类等飞禽频繁:周边鸟类等飞禽活动频繁记为1,无则记为0。
周边蛇活动情况:周边蛇类活动频繁记为1,无则记为0。
保护区山火风险:线路所在地区存在山火风险记为1,无风险记为0。
根据原因因子获取结果,以上述14个原因因子作为自变量,线路发生故障的次数作为 因变量,针对自变量数据和因变量数据,运用标准化公式进行z-score标准化,其 中,对标准化后的数据进行逐步回归计算得到标准化回归系 数和P值(显著性)。如图3所示。根据计算得到的P值筛选出对配电线路故障影响具有显 著性的8个关键因子,分别为单元线路长度、绝缘化率、运行年限、缺陷数、是否过载、雷 区程度、周边树木情况、周边彩钢瓦(异物)程度。
根据上述计算得到的8个关键因子的标准化回归系数值,按绝对值大小对8个关键因子 进行重要性排序。根据排序结果可以看出,缺陷数对线路发生故障次数的影响最大,绝缘化 率对线路发生故障次数的影响最小;除运行年限与线路发生故障次数成负相关关系外,其余 所有因子与线路发生故障次数均成正相关关系。如图4所示。
分析得出了关键因子后,接下来对关键因子的数据进行主成分分析,获取每条故障线路 主成分的风险值得分。包括以下步骤:
(2)对经过归一化处理后的各个关键因子数据进行主成分分析,得到主成分载荷矩阵 及各主成分的贡献率,如图5、图6所示。根据计算,前7个主成分的累积贡献率已达到96.21%, 因而为了降低计算维度,只选择前7个主成分来进行后续计算。
(3)根据所述主成分载荷矩阵将各主成分用变量的线性组合表示,并计算得出各个主 成分值;各主成分用变量的线性组合表示为
下一步,对得到的每条故障线路主成分的风险值进行回归分析,得到故障线路风险值计 算模型,具体方法为:
(1)根据EMLR算法构造主成分风险值计算公。
(2)构造损失函数运用随机梯度下降法寻找使Fcost达到最小值 的系数集合(α1,α2,…,αi),其中,fi(X)是模型计算得到的输出值,yi是训练集的实际值; 其中,运用随机梯度下降法寻找使Fcost达到最小值的系数集合(α1,α2,…,αi)的方法为:构建 迭代函数hθ(x)=θ0+θ1x1+θ2x2+…+θnxn,损失函数及权重更新公 式多次迭代计算出使Fcost达到最小值的系数集合(α1,α2,…,αi)。
由于经过主成分分析法计算得到的风险值得分score存在负值,因此,在求解使Fcost达 到最小值的系数集合(α1,α2,…,αi)之前,引入使用公式 risk_value=[score+abs(min(score))]×10将各故障线路主成分的风险值得分进行转换,并将 转换后的各故障线路主成分的风险值得分risk_value作为回归方程的因变量的实际值,其中 score为步骤S3中得到的主成分得分。将8个关键因子作为回归方程的自变量,对线性部分 系数(α1,α2,…,α5)进行求解,得到风险值的表达式为:其中,x1为 单元线路长度,x2为1-绝缘化率,x3为缺陷数,x4为雷区强度,x5为年限系数,x6为是否 过载,x7为周边树木,x8为周边有无彩钢等异物。
为了量化风险值与故障数的相关关系,并引入斯皮尔曼系数ρ来量化风险值risk_value 与故障数的相关关系,所述斯皮尔曼系数ρ的计算公式为经 过计算,风险值risk_value与线路故障数的斯皮尔曼系数ρ=0.4069,相关关系较弱。在风 险值的表达式中,非线性指数部分的系数(α6,α7,α8)均默认为1,为了增强风险值与故障数 的相关关系,保持线性部分系数不变,定义新的损失函数对系数(α6,α7,α8)进行修正。 经计算,得到风险值的表达式为:
重新计算的风险值risk_value与线路故障数的斯皮尔曼系数ρ=0.4238。
将先路故障数与两个表达式计算出的风险值绘制成散点图,如图8所示,可以看出,不 同故障数,更新系数后其对应的风险值相差更加明显。
利用所述故障线路风险值计算模型计算各故障线路的风险值得分,将所各故障线路的风 险值数据集作为BP神经网络训练数据集进行训练,得到各线路单元的风险值的神经网络计 算;将测试数据导入所述神经网络计算模型实现对线路单元的风险值进行预测评估。
所述GA-BP神经网络的模型采用如下方法构建:
确定神经网络训练集和测试集;
构建BP神经网络,所述神经网络包括输入层、隐含层和输出层,其中,隐 含层为单个隐含层,所述输入节点数为8,所述隐含层节点数采用如下方法确 定:
M=log2 n
其中,M表示隐含层节点数,n表示输入层的神经元个数;
采用遗传算法对所述BP神经网络的隐含层、输出层神经元的初始权值和阈 值进行优化获得遗传BP神经网络模型,所述优化包括构造适应度函数更新各神 经元权值和阈值,所述适应度函数如下:
其中,F表示适应度函数,k表示系数,m表示网络输出节点数,yi表示BP 神经网络第i个节点的期望输出,oi表示第i个节点的预测输出;
采用训练集训练所述遗传BP神经网络模型;
采用测试集测试经过训练后的遗传BP神经网络模型,若通过测试,则进入 下一步,若未通过测试,则进入上一步;
确定决定系数,并判断决定系数是否大于预设的阈值,若否,则进入步骤 S1,若是,则获得用于评估配电网故障线路风险的遗传BP神经网络模型。其中 BP神经网络设计如下:
(1)网络层数
BP神经网络可以包含一个到多个隐含层。不过,理论上已经证明,单个隐含层的网络可 以通过适当增加神经元节点的个数实现非线性映射。因此,对于大部分应用场合,单个隐含 层即可满足需要。
(2)输入层节点数
输入层节点数取决于输入向量的维数。应用神经网络解决实际问题时,首先应从问题中 提炼出一个抽象模型,形成输入空间和输出空间。因此,数据的表达方式会影响输入向量的 维数大小。
(3)隐含层节点数
隐含层节点数对BP神经网络的性能有很大影响。一般较多的隐含层节点数可以带来更 好的性能,但可能导致训练时间过长,这也是目前BP神经网络的一个缺陷。目前,主要的 经验确定隐含层节点数的公式有:
②M=log2n,其中,n为输入层的神经元个数。
在该模型中,以8个关键因子作为BP神经网络的输入,x1为单元线路长度,x2为1-绝缘化率,x3为缺陷数,x4为雷区强度,x5为年限系数,x6为是否过载,x7为周边树木,x8为 周边有无彩钢等异物;以风险值作为BP神经网络的输出,设置隐含层节点数M=3。
随机选取数据集中80%的样本作为训练集对该BP神经网络进行训练,选取20%的样本作 为测试集对该BP神经网络训练效果进行测试,对测试集预测的部分结果如图9所示。
在本实施例中,多次重复随机筛选数据集获得不同样本的训练集和测试集。通过有限的 数据集随机筛选获得更多数量的测试集,从而实现有限数据集中随机组合获得海量训练集和 测试集,减少训练样本获取难度,同时保障训练样本数量,因BP神经网络采用有监督学习, 因此需要有足够多样本对模型进行训练。通过对数据集的随机筛选可获得海量训练集,避免 模型仅对特定数据有较好效果,对其他数据集上效果不佳的缺陷,时模型能更好的适应任何 数据集,增强模型适用性和普适性。
为了能够定量地对BP神经网络的预测效果进行评价,引入决定系数,其范围在[0,1]内, 越接近于1,表明模型的预测效果越好;反之,若越接近于0,则说明模型的预测效果越差。 决定系数的表达式为:其中,l为样本数,yi(i=1,2,...,l)为第i个样本的真实值;为第i个样本的预测值。经计算,测试 集的决定系数R2=0.9624。
此外,为了增加模型的可靠性,引入遗传算法来优化BP神经网络隐含层、输出层神经 元的初始权值和阈值。在使用遗传算法更新各神经元权值、阈值时,适应度函数定义为:其中,k为系数,m为网络输出节点数;yi为BP神经网络第i 个节点的期望输出;oi为第i个节点的预测输出。经过计算,对测试集预测的部分结果如下, 其决定系数,较仅用BP网络进行训练的效果改善很多。如图10、图11所示。
如图2和图12所示,该系统包括:
数据输入模块,用于将采集到的配网线路故障数据导入风险预测评估系统;数据输出模 块,用于输出配电网线路分析结果;原因因子采集模块,用于获取导致配网线路故障的原因 因子;关键因子筛选模块,用于从提取的原因因子中筛选出对配电线路故障影响具有显著性 的关键因子;主成分分析模块,用于获取每条故障线路的最佳主成分风险值;线路风险值分 析模块,用于获取每条故障线路的实际风险值和预测风险值。
作为对本发明的进一步描述,原因因子采集模块包括:原因提取单元,用于提取出导致 配网线路故障的原因;原因分类单元,用于将提取到的故障原因进行分类;故障因子赋值单 元,用于对每个故障原因中的各个故障因子按照对配电线路故障影响程度的大小进行赋值。
关键因子筛选模块包括:标准化处理单元,用于对数据进行z-score标准化处理;回归 系数计算单元,用于根据得到的标准化数据,采用逐步回归方法计算出每个原因因子的标准 化回归系数;P值计算单元,用于根据得到的标准化数据,计算各原因因子对故障线路产生 影响的显著性值;关键因子筛选单元,用于筛选出对配电线路故障影响具有显著性的关键因 子。
主成分分析模块包括:归一化处理单元,用于对每条故障线路的关键因子数据进行归一 化处理,消除各故障关键因子之间的量纲差异;主成分因子载荷矩阵计算单元,用于根据归 一化处理后的数据计得到主成分因子载荷矩阵;贡献率计算单元,用于根据归一化处理后的 数据计得到各个主成分的贡献率;主成分计算单元,用于根据主成分因子载荷矩阵将各主成 分用变量的线性组合表示,并计算得出各主成分值;主成分风险模拟值计算单元,用于初步 计算出每条故障线路的主成分风险模拟值;主成分风险值计算单元,用于对得到的每条故障 线路的主成分风险模拟值进行优化,得到每条故障线路的主成分风险值。
线路风险值分析模块包括:模型存储单元,用于存储计算模型,供计算时调用;模型计 算单元,用于调用计算模型,并将数据代入模型进行计算。
使用时,通过数据输入模块将收集到的配电线路故障数据输入风险分析系统,由数据输 入模块将数据传送至原因因子采集模块。
原因因子采集模块接收到由数据输入模块发送的故障数据后,原因提取单元根据接收到 的故障数据,提取出导致配网线路故障的原因,并将故障原因提取结果传送至原因分类单元; 原因分类单元将提取到的故障原因进行分类,并将分类好的故障原因数据发送给故障因子赋 值单元,故障因子赋值单元对每个故障原因中的各个故障因子按照对配电线路故障影响程度 的大小进行赋值,得出原因因子,同时将结果发送给关键因子筛选模块。
关键因子筛选模块接收到由原因因子采集模块发送的原因因子分析结果后,标准化处理 单元对原因因子的数据进行z-score标准化处理;并将标准化处理后的数据发送给回归系数 计算单元和P值计算单元;回归系数计算单元根据得到的标准化数据,采用逐步回归方法计 算出每个原因因子的标准化回归系数;P值计算单元根据得到的标准化数据,计算各原因因 子对故障线路的P值(影响值);回归系数计算单元和P值计算单元分别将计算结果发送给 关键因子筛选单元,根据计算结果选出对配电线路故障影响具有显著性的关键因子,同时将 提取出的关键因子数据发送给主成分分析模块。
主成分分析模块中的归一化计算单元对各故障关键因子数据进行归一化处理,并将归一 化处理后的数据发送给载荷矩阵计算单元和贡献率计算单元;载荷矩阵计算单元根据归一化 处理后的数据计得到主成分载荷矩阵,并将主成分载荷矩阵发送给主成分值计算单元;根据 归一化处理后的数据计得到各主成分的贡献率;主成分值计算单元根据主成分载荷矩阵将各 主成分用变量的线性组合表示,并计算得出各主成分的分数值,同时将各主成分值发送给主 成分风险模拟值计算单元来计算各故障线路主成分的风险模拟值;主成分风险模拟值计算单 元将计算得出的各故障线路主成分的风险值发送给线路风险值分析模块。
线路风险值分析模块中的模型计算单元从模型存储单元中调取模型,并利用接收到的数 据进行计算获得每条故障线路的实际风险值和预测风险值,并将故障线路的实际风险值和预 测风险值代入所述决定系数计算公式进行计算,得到实际风险值和预测风险值之间的决定系 数,用于对利用GA-BP神经网络来获得每条故障线路的实际风险值和预测风险值的可靠性进 行量化。最后将结果发送给数据输出模块。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施 例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进 行修改或者等同替换,而不脱离本发明技术方案的宗旨和范围,其均应涵盖在本发明的权利 要求范围当中。
Claims (10)
1.一种基于GA—BP神经网络的配电网故障大数据分析方法,其特征在于,所述方法包括如下步骤:
步骤1:采集配电网线路的故障数据,对故障数据进行分析,获取导致线路故障的原因因子;
步骤2:以所述原因因子为自变量,以发生线路故障的次数为因变量,采用标准化逐步回归方法,从所述原因因子中筛选出导致线路故障的关键因子;
步骤3:对所述关键因子的数据进行归一化处理,得到归一化特征数据;
步骤4:对所述归一化特征数据进行主成分分析,获取每条故障线路的主成分风险值;
步骤5:对所述每条故障线路的主成分风险值进行回归分析,获得故障线路的主成分风险值计算模型;
步骤6:利用斯皮尔曼系数计算公式,计算得出每条线路的主成分风险值与发生线路故障的次数之间的斯皮尔曼系数ρ,用于量化每条线路的主成分风险值与发生线路故障的次数之间的关系;
步骤7:根据所述斯皮尔曼系数ρ,构造系数修正公式对所述主成分风险值计算模型进行修正,得到主成分风险值计算优化模型,并利用所述主成分风险值计算优化模型重新计算得出每条故障线路的最佳主成分风险值;
步骤8:将所述每条故障线路的最佳主成分风险值组合成为最佳主成分风险值集,将所述最佳主成分风险值集分为训练数据和测试数据,利用GA-BP神经网络对所述训练数据进行训练,得到故障线路的风险值神经网络计算模型;并将所述测试数据导入所述风险值神经网络计算模型,计算获得每条故障线路的实际风险值和预测风险值;
步骤9:引入决定系数计算公式,将所述故障线路的实际风险值和预测风险值代入所述决定系数计算公式进行计算,得到实际风险值和预测风险值之间的决定系数,用于对利用GA-BP神经网络来获得每条故障线路的实际风险值和预测风险值的可靠性进行量化。
2.根据权利要求1所述的基于GA—BP神经网络的配电网故障大数据分析方法,其特征在于,所述步骤1获取原因因子的方法为:
步骤1.1:提取出所有故障原因,按照设备情况、运行情况和外部情况将提取出的故障原因分为3类;
步骤1.2:针对所述故障原因中的每一个故障因子,按照对配电线路故障影响程度的大小进行打分,得到故障原因因子。
3.根据权利要求1所述的基于GA—BP神经网络的配电网故障大数据分析方法,其特征在于,所述步骤2筛选关键因子的具体方法为:
步骤2.1:以所述原因因子为自变量,以发生线路故障的次数为因变量,对所述自变量数据和因变量数据进行Z-score标准化,得到标准化特征数据;
步骤2.2:对所述标准化特征数据进行逐步回归计算,得到标准化回归系数和显著性P值;
步骤2.3:根据所述显著性P值筛选出对配电线路故障影响具有显著性的关键因子。
4.根据权利要求1所述的基于GA—BP神经网络的配电网故障大数据分析方法,其特征在于,所述步骤4获取每条故障线路的主成分风险值的具体方法为:
步骤4.1:对所述归一化特征数据进行主成分分析,得到主成分因子载荷矩阵和各个主成分的贡献率;
步骤4.2:根据所述主成分因子载荷矩阵,将各个主成分转换为用变量的线性组合表示,并计算出各个主成分值;
步骤4.4:利用公式risk_value=[score+abs(min(score))]×10对所述每条故障线路的主成分风险模拟值进行转换,得到每条故障线路的主成分风险值。
10.一种基于GA—BP神经网络的配电网故障大数据分析系统,其特征在于,所述系统适用于权利要求1-9任一所述网络模型方法,所述系统包括:输入模块、显示模块、中央处理模块、原因因子采集模块、关键因子筛选模块、主成分分析模块、线路风险值计算模块和风险预测评估模块,所述输入模块的输出端与所述中央处理模块的输入端连接,所述显示单元的输入端与所述中央处理模块的输出端连接,所述原因因子采集模块的输出端与所述中央处理单元的输入端连接,所述关键因子筛选模块与所述中央处理模块通信连接,所述主成分分析模块与所述中央处理模块通信连接,所述线路风险值计算模块与所述中央处理模块通信连接,所述风险预测评估模块与所述中央处理模块通信连接;
输入模块,用于将采集到的配网线路故障数据导入风险预测评估系统;原因因子采集模块,用于获取导致配网线路故障的原因因子;关键因子筛选模块,用于从提取的原因因子中筛选出对配电线路故障影响具有显著性的关键因子;主成分分析模块,用于获取每条故障线路的最佳主成分风险值;线路风险值分析模块,用于获取每条故障线路的实际风险值和预测风险值;
所述原因因子采集模块包括:原因提取单元,用于提取出导致配网线路故障的原因;原因分类单元,用于将提取到的故障原因进行分类;故障因子赋值单元,用于对每个故障原因中的各个故障因子按照对配电线路故障影响程度的大小进行赋值;
所述关键因子筛选模块包括:标准化处理单元,用于对数据进行z-score标准化处理;回归系数计算单元,用于根据得到的标准化数据,采用逐步回归方法计算出每个原因因子的标准化回归系数;P值计算单元,用于根据得到的标准化数据,计算各原因因子对故障线路产生影响的显著性值;关键因子筛选单元,用于筛选出对配电线路故障影响具有显著性的关键因子;
所述主成分分析模块包括:归一化处理单元,用于对每条故障线路的关键因子数据进行归一化处理,消除各故障关键因子之间的量纲差异;主成分因子载荷矩阵计算单元,用于根据归一化处理后的数据计得到主成分因子载荷矩阵;贡献率计算单元,用于根据归一化处理后的数据计得到各个主成分的贡献率;主成分计算单元,用于根据主成分因子载荷矩阵将各主成分用变量的线性组合表示,并计算得出各主成分值;主成分风险模拟值计算单元,用于初步计算出每条故障线路的主成分风险模拟值;主成分风险值计算单元,用于对得到的每条故障线路的主成分风险模拟值进行优化,得到每条故障线路的主成分风险值;
所述线路风险值分析模块包括:模型存储单元,用于存储计算模型,供计算时调用;用于调用计算模型,并将数据代入模型进行计算。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2020113846165 | 2020-12-01 | ||
CN202011384616 | 2020-12-01 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113030633A true CN113030633A (zh) | 2021-06-25 |
CN113030633B CN113030633B (zh) | 2023-05-02 |
Family
ID=76460568
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011636613.6A Active CN113030633B (zh) | 2020-12-01 | 2020-12-31 | 基于ga-bp神经网络的配电网故障大数据分析方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113030633B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113642253A (zh) * | 2021-08-30 | 2021-11-12 | 佛山众陶联供应链服务有限公司 | 一种陶瓷砖半成品在加工中的损耗判断方法和系统 |
CN114418409A (zh) * | 2022-01-21 | 2022-04-29 | 广东电网有限责任公司 | 一种基于多个神经网络的设备安全风险的评估方法及装置 |
CN114862042A (zh) * | 2022-05-27 | 2022-08-05 | 安徽继远软件有限公司 | 配电网线路故障风险分析方法及其系统 |
CN116090839A (zh) * | 2023-04-07 | 2023-05-09 | 水利部交通运输部国家能源局南京水利科学研究院 | 水资源耦合系统多重风险分析与评估方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008133922A1 (en) * | 2007-04-24 | 2008-11-06 | University Of South Florida | Electric power distribution interruption risk assessment calculator |
CN107908638A (zh) * | 2017-09-26 | 2018-04-13 | 国网甘肃省电力公司 | 基于大数据挖掘配的电网运行效率评价方法及系统 |
CN109523155A (zh) * | 2018-11-13 | 2019-03-26 | 国网甘肃省电力公司电力科学研究院 | 一种蒙特卡洛及最小二乘支持向量机的电网风险评估方法 |
CN110488150A (zh) * | 2019-08-09 | 2019-11-22 | 国网河北省电力有限公司沧州供电分公司 | 一种基于多算法融合的故障智能诊断方法 |
CN110533549A (zh) * | 2019-07-12 | 2019-12-03 | 杭州电子科技大学 | 一种基于ga优化rs-bp神经网络电网故障定位方法 |
-
2020
- 2020-12-31 CN CN202011636613.6A patent/CN113030633B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008133922A1 (en) * | 2007-04-24 | 2008-11-06 | University Of South Florida | Electric power distribution interruption risk assessment calculator |
CN107908638A (zh) * | 2017-09-26 | 2018-04-13 | 国网甘肃省电力公司 | 基于大数据挖掘配的电网运行效率评价方法及系统 |
CN109523155A (zh) * | 2018-11-13 | 2019-03-26 | 国网甘肃省电力公司电力科学研究院 | 一种蒙特卡洛及最小二乘支持向量机的电网风险评估方法 |
CN110533549A (zh) * | 2019-07-12 | 2019-12-03 | 杭州电子科技大学 | 一种基于ga优化rs-bp神经网络电网故障定位方法 |
CN110488150A (zh) * | 2019-08-09 | 2019-11-22 | 国网河北省电力有限公司沧州供电分公司 | 一种基于多算法融合的故障智能诊断方法 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113642253A (zh) * | 2021-08-30 | 2021-11-12 | 佛山众陶联供应链服务有限公司 | 一种陶瓷砖半成品在加工中的损耗判断方法和系统 |
CN113642253B (zh) * | 2021-08-30 | 2024-04-02 | 佛山众陶联供应链服务有限公司 | 一种陶瓷砖半成品在加工中的损耗判断方法和系统 |
CN114418409A (zh) * | 2022-01-21 | 2022-04-29 | 广东电网有限责任公司 | 一种基于多个神经网络的设备安全风险的评估方法及装置 |
CN114862042A (zh) * | 2022-05-27 | 2022-08-05 | 安徽继远软件有限公司 | 配电网线路故障风险分析方法及其系统 |
CN116090839A (zh) * | 2023-04-07 | 2023-05-09 | 水利部交通运输部国家能源局南京水利科学研究院 | 水资源耦合系统多重风险分析与评估方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN113030633B (zh) | 2023-05-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113030633B (zh) | 基于ga-bp神经网络的配电网故障大数据分析方法和系统 | |
CN107169628B (zh) | 一种基于大数据互信息属性约简的配电网可靠性评估方法 | |
CN106980905B (zh) | 配电网供电可靠性预测方法和系统 | |
CN112734204B (zh) | 配电网故障线路风险评估方法和系统 | |
CN111738462B (zh) | 电力计量装置故障抢修主动服务预警方法 | |
CN104809658B (zh) | 一种低压配网台区线损的快速分析方法 | |
CN109544399B (zh) | 基于多源异构数据的输电设备状态评价方法及装置 | |
CN106909933A (zh) | 一种三阶段多视角特征融合的窃电分类预测方法 | |
CN108876163B (zh) | 综合因果分析与机器学习的暂态功角稳定快速评估方法 | |
CN114118588A (zh) | 聚类欠采样下基于博弈特征提取的迎峰度夏停电预测方法 | |
CN108304567A (zh) | 高压变压器工况模式识别与数据分类方法及系统 | |
CN113095648A (zh) | 基于数据驱动的配电网故障停电风险指标评估方法及系统 | |
CN110569278A (zh) | 一种基于大数据分析的变压器缺陷评估方法 | |
CN117473424A (zh) | 基于随机森林的变压器故障诊断方法、系统、设备及介质 | |
CN113486291A (zh) | 一种基于深度学习的石油钻机微电网故障预测方法 | |
CN113689079A (zh) | 基于多元线性回归和聚类分析的台区线损预测方法及系统 | |
CN115409264A (zh) | 基于馈线故障预测的配电网抢修驻点位置优化方法 | |
CN114118592B (zh) | 一种智能电网用电端短期能耗预测系统 | |
CN110096723B (zh) | 基于运维检测大数据的高压开关柜绝缘状态分析方法 | |
CN113327047B (zh) | 基于模糊综合模型的电力营销服务渠道决策方法及系统 | |
CN114548493A (zh) | 一种电能表电流过载预测方法与系统 | |
CN113505818A (zh) | 改进决策树算法的熔铝炉能耗异常诊断方法和系统及设备 | |
CN113448840A (zh) | 基于预测缺陷率和模糊综合评价模型的软件质量评价方法 | |
CN106709522B (zh) | 一种基于改进模糊三角数的高压电缆施工缺陷分级方法 | |
CN111126790A (zh) | 一种多层次模糊综合决策的配电网风险评估方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |