CN110703057B - 基于数据增强和神经网络的电力设备局部放电诊断方法 - Google Patents

基于数据增强和神经网络的电力设备局部放电诊断方法 Download PDF

Info

Publication number
CN110703057B
CN110703057B CN201911063623.2A CN201911063623A CN110703057B CN 110703057 B CN110703057 B CN 110703057B CN 201911063623 A CN201911063623 A CN 201911063623A CN 110703057 B CN110703057 B CN 110703057B
Authority
CN
China
Prior art keywords
data
partial discharge
sample
diagnosis
power equipment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911063623.2A
Other languages
English (en)
Other versions
CN110703057A (zh
Inventor
杨祎
辜超
秦佳峰
吕学宾
黄锐
吕俊涛
陈玉峰
杜修明
李�杰
白德盟
李程启
林颖
郑文杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
Electric Power Research Institute of State Grid Shandong Electric Power Co Ltd
Original Assignee
State Grid Corp of China SGCC
Electric Power Research Institute of State Grid Shandong Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, Electric Power Research Institute of State Grid Shandong Electric Power Co Ltd filed Critical State Grid Corp of China SGCC
Priority to CN201911063623.2A priority Critical patent/CN110703057B/zh
Publication of CN110703057A publication Critical patent/CN110703057A/zh
Application granted granted Critical
Publication of CN110703057B publication Critical patent/CN110703057B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01RMEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
    • G01R31/00Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere
    • G01R31/12Testing dielectric strength or breakdown voltage ; Testing or monitoring effectiveness or level of insulation, e.g. of a cable or of an apparatus, for example using partial discharge measurements; Electrostatic testing
    • G01R31/1227Testing dielectric strength or breakdown voltage ; Testing or monitoring effectiveness or level of insulation, e.g. of a cable or of an apparatus, for example using partial discharge measurements; Electrostatic testing of components, parts or materials

Abstract

本发明提出了一种基于数据增强和神经网络的电力设备局部放电诊断方法,针对变压器、GIS、开关柜等电力设备在缺陷时检测的局部放电数据,通过使用多种数据增强方法丰富样本量并建立样本库,针对不同电力设备类型和缺陷类型的特点,采用不同的神经网络进行训练,从而得到泛化能力更强、不同电力设备的不同缺陷诊断针对性更强的诊断算法,提高电力设备局部放电诊断准确性。

Description

基于数据增强和神经网络的电力设备局部放电诊断方法
技术领域
本发明涉及电力设备局部放电检测领域,更具体地,本发明涉及一种基于数据增强和神经网络的电力设备局部放电诊断方法。
背景技术
随着电网规模的快速发展和电网智能化的不断推进,电力设备运行的可靠性和安全性要求也不断提高,电力设备的绝缘性能是恒量设备状态的关键指标,对电力设备的局部放电进行有效、准确的检测和评估,是保障电力设备安全可靠运行的基础。
电力设备投入运行后,由于设计缺陷、表面污秽和接触不良等原因会引起设备发生局部放电现象,发生放电时故障点会产生磁、电、光、声、热等物理信号和气体浓度变化等化学信号,放电产生的各种现象是局部放电检测的依据。电力公司开展了大量开关柜、GIS、变压器等电力设备的局部放电检测工作,包括带电检测、重症监护、在线监测、离线试验等形式,历年来发现并解体验证了一些案例,积累了故障数据样本。局部放电故障数据样本部分存储在电力生产管理系统中,另一部分以离散的形式存储。近年来大数据、云计算和人工智能技术得到了飞速发展,并在各行各业中进行大规模应用,通过分布式计算、数据挖掘等手段给企业提供了关键决策支撑。而样本数据的数量、质量、可用性是保障分析结果关键所在。
目前电力行业处在智能化发展的初级阶段,诸多电力公司均开始探索人工智能算法和大数据技术在数据智能识别、设备状态智能分析的高级应用,取得了小幅成效。但存在的以下问题制约了智能算法的进一步发展:
1、由于局部放电受电力设备的结构设计、制造工艺、运行环境、运维检修情况等多方面因素的影响,历年来积累的解体故障样本数据量少,难以覆盖局部放电的全部种类;
2、各种神经网络算法由于其实现的思路不同,准确率、模型大小、训练/预测的执行效率差异较大,而各神经网络更适应于哪种应用场景需要大量的试验、探索;
发明内容
为了克服现有技术中的上述缺陷,本发明提出一种基于数据增强和神经网络的电力设备局部放电诊断方法,针对电力设备在缺陷时检测的局部放电数据,通过使用多种数据增强方法丰富样本量并建立样本库,针对不同电力设备类型和缺陷类型的特点,采用不同的神经网络进行训练,得到诊断模型,进行放电诊断。
进一步地,所述方法包括以下步骤:
S1:收集历年积累的电力设备在缺陷时检测的局部放电数据,形成原始数据集;
S2:针对所述原始数据集中的样本数据,随机使用有监督和无监督的数据增强方法两种形式下的多种数据增强方法中的一种,进行数据增强,将电力系统历年积累的局部放电数据与通过数据增强生成的新样本进行汇总,构建电力设备局部放电样本库;
S3:搭建基于GPU的训练平台,构建AlexNet、VGG、GoogLeNet、ResNet神经网络,采用所述放电样本库中数据增强后的样本数据,分别训练各个神经网络预测方法;
S4:根据电力设备局部放电的应用场景需求,设定各个神经网络预测方法在不同场景下进行预测的评价指标,进而针对不同的局部放电场景适配不同的神经网络预测方法,得到相应的诊断模型;
S5:采集电力设备缺陷时检测的局部放电数据,进行采样步骤S2中所述的数据增强方法进行增强后,输入步骤S4得到的诊断模型,进行故障诊断,并输出相应的诊断结论。
进一步地,所述步骤S1中,
采集变电站现场一次设备的历史检测数据、一次设备历史解体案例数据和实验室数据,通过人工专家结合变电站环境、检测数据形态、相关检测报告,对数据的有效性和局部放电缺陷的代表性进行分析、筛选,形成原始数据集。
进一步地,步骤S2中,
有监督的数据增强方法包含噪声叠加方法、模糊处理方法和多样本合成方法。
进一步地,所述噪声叠加方法具体包括:
步骤1:定义待增强样本数据为dstImage[x][y],定义增强后样本数据为EnhDstImage[x][y],定义增加高斯随机变量rv后的值为val,通过下式计算val:
val=dstImage[x][y]+rv
步骤2:对val的范围进行修正:
if(val<0){val=0;}
if(val>255){val=255;}
步骤3:对样本数据值重新定义:
EnhDstImage[x][y]=val
对dstImage数组中所有数据经过上述处理后,形成增强后的样本数据EnhDstImage。
进一步地,所述高斯随机变量rv的计算方式如下:
rv=sqrt(-2.0*log(U1))*cos(2*π*U2)
其中随机变量U1和U2表示为:
Figure BDA0002258583080000031
Figure BDA0002258583080000032
式中,假设随机变量U1、U2相互独立,且均服从(0,1)之间的均匀分布;随机变量Z0,Z1服从标准高斯分布且满足正态分布,均值为0,方差为1。
进一步地,所述模糊处理方法包括:
步骤1:对原始数据进行噪声耦合,生成图片文件;
步骤2:输入步骤1转换后的图片文件,提取所述的图片文件的RGB(Red,Green,Blue)值;
步骤3:分别取图片文件中图片的中心点为零点,绘制横纵坐标轴,以二维高斯分布函数计算图片中各像素点的权重,形成权重矩阵,并进一步得到归一化的权重矩阵;
步骤4:以归一化后的权重更新图片文件的RGB值;
步骤5:存储更新RGB值后的图片文件,作为新的样本。
进一步地,所述多样本合成方法包括:
步骤1:局部放电特高频检测单次采集1秒钟的数据,每个周期20ms,将20ms分为60个时间片,取每个时间片中的最大值,得到50×60的二维数组;
步骤2:根据每个局部放电类型在数组中的特征值不一样,通过合并多个样本数据数组的相同下标的值,形成新的样本。
进一步地,所述无监督的数据增强方法包含随机生成与训练数据集分布一致的图谱的数据增强方法、以已有数据为基础学习出适合当前任务的数据增强方法。
进一步地,随机生成与训练数据集分布一致的图谱的数据增强方法具体包括:
依据局部放电特高频检测数据为50×60的二维数组,且数值范围处于0-70dB之间的整数,通过使用随机函数,动态生成3600个数值,依次存储到50×60的二维数组中,形成增强后的样本数据;其中随机数生成代码实现如下:
rand()%(b-a+1)+a
式中,a为随机数的下限即为0,b为随机数的上限即为70。
进一步地,以已有数据为基础学习出适合当前任务的数据增强方法具体包括:
通过准备13种数据增强操作,从13种数据增强操作方法中,随机产生使用该操作的概率,定义为概率组合,共产生5个概率组合,使用该5个概率组合进行增强样本,分别训练AlexNet、VGG、GoogLeNet、ResNet四种神经网络,训练后检查其泛化能力,根据泛化能力排序保留前三种概率组合,将前三种概率组合串接,从而进行数据增强。
进一步地,所述数据增强操作包括放大或减小幅值、平移相位、叠加随机分布噪声和随机稀疏脉冲,通过对这些操作设置不同的数值,来设置13种数据增强操作方法。
进一步地,步骤S4具体包括:
S41:根据电力设备局部放电带电检测、重症监护、在线监测、离线试验的应用场景对诊断算法的诊断准确率、执行效率、运行条件的要求,选择适合应用场景的神经网络诊断预测方法;
S42:根据实际应用效果,调整各应用场景下的神经网络诊断模型选择及优化。
进一步地,所述步骤S41具体包括:
步骤1:计算AlexNet、VGG、GoogLeNet、ResNet四种神经网络训练得出的四种诊断模型,在不同应用场景下的准确率Accuracy;
步骤2:计算四种诊断模型在不同应用场景下的指标F1;
步骤3:制定诊断模型计分标准,根据计分标准的规则计算总分,每个神经网络得出一个总分;
步骤4:根据总分来选择适合不同应用场景的相应诊断模型。
进一步地,所述准确率Accuracy的计算公式如下:
Figure BDA0002258583080000041
式中TP是指标签为正样本,诊断为正样本的数目;FN是指标签为正样本,诊断为负样本的数目;FP是指标签为负样本,诊断为正样本的数目;TN是指标签为负样本,诊断为负样本的数目;
其中,标签是对样本数据进行标注时的分类,局部放电数据根据放电类型分为“正常、电晕、悬浮、气隙、沿面、微粒、噪声、其它”8个类别,对标签A而言,所有标注为A的数据均为正样本,标注非A的数据均为负样本。
进一步地,定义精确度为Precision,其计算公式如下:
Figure BDA0002258583080000051
定义召回率Recall,其计算公式如下:
Figure BDA0002258583080000052
则所述指标F1的计算公式如下:
Figure BDA0002258583080000053
本发明的有益技术效果为:
1、提出了多种数据增强方法,通过在多种数据增强方法中随机选择,构建了全面的样本库,可覆盖不同电力设备不同缺陷。
2、采用数据增强后的样本数据对神经网络预测方法进行训练,提高了预测模型的准确性和灵敏度。
3、根据不同应用场景使用不同神经网络算法,提高了电力设备局部放电检测数据诊断的针对性和准确性。
附图说明
图1是本发明所述方法的流程框架图。
图2是本发明中ResNet网络使用的残差单元结构图。
图3是本发明中ResNet网络输出层架构图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例的附图,对本发明实施例的技术方案进行清楚、完整地描述。显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于所描述的本发明的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。
参照附图1所示的流程图,本发明采取的技术方案是,一种基于数据增强和神经网络的电力设备局部放电诊断方法,包括以下步骤:
(1)局部放电检测数据收集
局部放电检测数据的数据来源主要包含变电站现场的变压器、开关柜、GIS等一次设备的历史检测数据、一次设备历史解体案例数据、实验室数据等。
通过人工专家结合变电站环境、检测数据形态、相关检测报告,对数据的有效性和局部放电缺陷的代表性进行分析、筛选,形成原始数据集。
(2)局部放电检测数据增强
通过随机采用下述有监督数据增强和无监督数据增强两种形式下的多种数据增强方法,对局部放电检测数据集进行数据增强。
1)有监督数据增强:
①噪声叠加方法:
本实施例通过使用高斯噪声来实现,其函数如下:
Figure BDA0002258583080000061
Figure BDA0002258583080000062
式中,根据Box-Muller变换原理,假设随机变量U1、U2相互独立,且均服从(0,1)之间的均匀分布,则经过下面两个式子产生的随机变量Z0,Z1服从标准高斯分布,Z0,Z1满足正态分布,其中均值为0,方差为1,变量U1和U2可以修改为下式:
Figure BDA0002258583080000063
Figure BDA0002258583080000064
在得出随机变量U1和U2后,通过下式计算得出高斯随机变量rv:
rv=sqrt(-2.0*log(U1))*cos(2*π*U2)
进一步地,
通过对待增强样本数据的二维数组进行枚举,在原值上增加高斯随机变量rv,并控制增加rv后的值范围在0到255之间。定义待增强样本数据为dstImage[x][y],定义增强后样本数据为EnhDstImage[x][y],定义增加高斯随机变量rv后的值为val,则val的计算方式如下:
val=dstImage[x][y]+rv
对val的范围进行修正:
if(val<0){val=0;}
if(val>255){val=255;}
对样本数据值重新定义:
EnhDstImage[x][y]=val
经过上述步骤,对dstImage数组中所有值增加高斯随机变量后,形成增强后的样本数据EnhDstImage。
②模糊处理方法:
本实施例通过使用高斯模糊方法来实现,实现步骤如下:
步骤1:对原始数据进行噪声耦合,生成图片文件;具体包括:
输入数据为采集前端采集到的局部放电原始数据;
将输入数据转成以相位为x轴,周期为y轴,幅值为z轴的三维数据;
按照雷达噪声、手机噪声、微波硫灯干扰的数据特征,分别生成各噪声对应的三维数据;
对输入数据和噪声数据的三维数据进行累加,得到噪声耦合后的数据;
将噪声耦合后的数据转换成图片文件。
步骤2:输入步骤1转换后的图片文件,提取所述的图片文件的RGB(Red,Green,Blue)值。
步骤3:分别取图片文件中图片的中心点为零点,绘制横纵坐标轴;
以二维高斯分布函数计算图片中各像素点的权重,形成权重矩阵,并进一步得到归一化的权重矩阵。
所述二维高斯分布函数如下:
Figure BDA0002258583080000071
式中,x,y分别为图中各像素点距离零点的横纵坐标,G(x,y)为该点到零点的权重值,π为圆周率,e为自然常数,σ为正态分布的标准差,σ通常取1至3之间,取值越大图像越平滑。
进一步地,
得到归一化的权重矩阵具体包括:
计算权重矩阵中所有权重数值之和m,对权重矩阵中的每个权重值乘以1/m,得到归一化后的权重矩阵。
步骤4:以归一化后的权重更新图片文件的RGB值。
以权重更新图片的RGB值具体包括:
对每一个零点的权重矩阵,以各归一化后的权重矩阵的权重值乘以该权重值位置的像素值,并求和,作为该零点的新的像素值,以该种权重更新方法对RGB值分别更新,得到更新后的三色像素值。
步骤5:存储更新RGB值后的图片文件,作为新的样本。
③多样本合成方法:
局部放电特高频检测单次采集1秒钟的数据,我国电网频率为50Hz,每个周期20ms,将20ms分为60个时间片,取每个时间片中的最大值,得到50×60的二维数组。在进行样本合成时,每个局部放电类型在数组中的特征值不一样,通过合并多个样本数据数组的相同下标的值,根据不同情况进行分别处理,形成新的样本。设第一个样本数据数组为A,第二个样本数据数组为B,合并后的数组为C,当前对[x][y]下标的数值进行合并,合并策略如下:
当A[x][y]>0、B[x][y]=0时,则C[x][y]=A[x][y];
当A[x][y]=0、B[x][y]>0时,则C[x][y]=A[x][y];
当A[x][y]>0、B[x][y]>0时,则C[x][y]=max(A[x][y],B[x][y]);
当对50×60的二维数组所有下标进行合并后,得到新样本数据C。
2)无监督数据增强
①随机生成与训练数据集分布一致的图谱:
依据局部放电特高频检测数据为50×60的二维数组,且数值范围处于0-70dB之间(因传感器的有效量程在0-70dB)的整数,通过使用随机函数,动态生成3600个数值,依次存储到50×60的二维数组中,随机数生成代码实现如下:
rand()%(b-a+1)+a
式中,a为随机数的下限即为0,b为随机数的上限即为70。
②以已有数据为基础学习出适合当前任务的数据增强方法:
通过准备13种数据增强操作,从13种数据增强操作方法中,随机产生使用该操作的概率,定义为概率组合,共产生5个概率组合,使用该5个概率组合进行增强样本,训练算法后检查其泛化能力,根据情况泛化能力排序保留前三种概率组合,将前三种概率组合串接,作为数据增强的一种方式。
进一步地,
13种数据增强操作定义为:幅值放大5%、幅值放大10%、幅值减少5%、幅值减少10%、相位左移10度、相位左移20度、相位右移10度、相位右移20度、叠加5dB随机分布噪声、叠加10dB随机分布噪声、随机稀疏相位60的脉冲、随机稀疏相位270的脉冲、随机稀疏相位340的脉冲。
进一步地,
本实施例在实现时,产生了如表1所示的5个概率组合:
表1
Figure BDA0002258583080000091
进一步地,
本实施例在实现时,5个概率组合所产生的样本数据,在测试集上的泛化能力如表2所示:
表2
概率组合 在测试集的泛化能力
概率组合1 89%
概率组合2 72%
概率组合3 91%
概率组合4 87%
概率组合5 93%
本实施例中最终选择了概率组合5、概率组合3、概率组合1三种组合形式用于数据样本的增强。
(3)建立局部放电检测数据样本库
使用主流的B/S系统开发框架,使用MySql数据库、Java语言、SpringCloud开发框架、Bootstrap前端开发框架,开发样本库功能。
MySql数据库:根据局放数据需求,设计数据表,数据表包含变电站档案表、一次设备档案表、局放缺陷分类枚举表、检测案例表、样本数据表等;
服务端功能开发:Java语言、SpringCloud开发框架,开发变电站、一次设备、检测案例、样本数据等功能的新建、删除、查询、管理等后台服务,向下与MySql数据库交互,向上为前端功能提供逻辑服务支撑。
前端功能开发:使用Bootstrap前端开发框架,包含变电站、一次设备、检测案例、样本数据等功能模块,通过调用服务端功能与数据库实现交互,实现对检测数据的样本管理。
(4)训练神经网络
针对AlexNet、VGG、GoogLeNet、ResNet四种神经网络算法的训练,其训练步骤一致,本实施例中以ResNet算法训练为例进行说明。
搭建硬件训练平台:使用“CPU:E5-1607v3、内存:64GB DDR4、显卡:GTX 1080Ti、硬盘:960GB SSD企业级固态硬盘”的配置,搭建硬件训练平台;
搭建训练平台的操作系统:安装CentOS7.0操作系统及硬件驱动;
ResNet算法训练:部署ResNet算法模型,将数据增强后的检测数据样本传输到训练服务器中,对算法模型进行训练。本发明中根据局部放电数据的实际应用,对ResNet的卷积部分进行了调优,网络包含输入部分、中间卷积部分、输出部分三部分组成:
1)输入部分
输入数据为224*224的图片数据,共有RGB三个通道,所以输入层规格为(224,224,3)。继输入层之后,对图像数据进行7*7卷积和3*3池化,将数据转换为56*56大小的特征图。输入部分的处理降低了数据的大小,为卷积层的特征提取奠定基础。
2)卷积部分
与ResNet网络的原结构不同,本发明使用的残差单元由三层卷积构成,卷积核大小分别为1*1,3*3,1*1。架构参照图2。
与原版残差单元相比,本发明使用的残差单元创新地引入了1*1卷积结构。对于256维的输入特征,以1*1、3*3、1*1三层卷积拼接成的卷积层参数总量为69632个,而使用两个3*3的原版残差单元的参数总量为1179648个,使用1*1卷积结构可以将计算量简化为原版的5.9%。本发明使用1*1卷积结构的卷积层大大加速了网络的训练,保证了在堆积较多层数的同时维持较低的训练速度。
本发明使用16个上述残差单元结构,共计48层卷积层,构成50层深度的残差神经网络。
3)输出部分
在本发明的应用场景中,诊断结论包括电晕、悬浮、沿面、气隙、微粒、噪声、正常、其他等八类,因此输出层的输出通道数取8,参照图3。
(5)诊断算法应用
使用Java的SpringCloud开发框架,以微服务的形式对算法模型进行封装,部署在应用服务器中,为业务系统提供局部放电检测数据诊断服务。
基于AlexNet、VGG、GoogLeNet、ResNet四种神经网络训练得出的四种诊断模型,在针对“变压器检测数据诊断、GIS检测数据诊断、开关柜检测数据诊断”三种应用场景下,依据“准确率Accuracy、F1 Score”两个指标进行择优选择。实现步骤如下:
步骤1:计算四种诊断模型在三种应用场景下的准确率Accuracy。
计算一些基于二分类任务的基本指标:
标签为正样本,分类为正样本的数目为True Positive,简称TP;
标签为正样本,分类为负样本的数目为False Negative,简称FN;
标签为负样本,分类为正样本的数目为False Positive,简称FP;
标签为负样本,分类为负样本的数目为True Negative,简称TN。
其中,标签是对样本数据进行标注时的分类,局部放电数据根据放电类型分为“正常、电晕、悬浮、气隙、沿面、微粒、噪声、其它”8个类别,对标签A而言,所有标注为A的数据均为正样本,标注非A的数据均为负样本。
准确率Accuracy的计算公式如下:
Figure BDA0002258583080000121
对于变压器、开关柜、GIS三种应用场景,各使用10000条测试样本验证后,记录准确率统计数据如表3所示:
表3
AlexNet VGG GoogLeNet ResNet
变压器检测数据 0.83 0.96 0.82 0.85
开关柜检测数据 0.81 0.79 0.95 0.88
GIS检测数据 0.84 0.83 0.83 0.95
步骤2:计算四种诊断模型在三种应用场景下的F1 Score。
定义精确度为Precision,其计算公式如下:
Figure BDA0002258583080000122
定义召回率Recall,其计算公式如下:
Figure BDA0002258583080000123
F1 Score的计算公式如下:
Figure BDA0002258583080000124
对于变压器、开关柜、GIS三种应用场景,各使用10000条测试样本验证后,记录F1Score统计数据如表4所示:
表4
AlexNet VGG GoogLeNet ResNet
变压器检测数据 0.89 0.88 0.87 0.84
开关柜检测数据 0.83 0.77 0.96 0.87
GIS检测数据 0.81 0.83 0.82 0.95
步骤3:制定模型计分标准。
制定的计分标准如表5所示:
表5
Figure BDA0002258583080000131
步骤4:选择适合应用场景的模型。
根据上述计分标准,变压器、开关柜、GIS三种应用场景的得分如表6所示:
表6
Figure BDA0002258583080000132
依据上表,本实施例中的AlexNet、VGG、GoogLeNet、ResNet四种诊断模型,在实际应用时,VGG适应于变压器检测数据诊断,GoogLeNet适应于开关柜检测数据诊断,ResNet适应于GIS检测数据诊断。
申请人结合说明书附图对本发明的实施例做了详细的说明与描述,但是本领域技术人员应该理解,以上实施例仅为本发明的优选实施方案,详尽的说明只是为了帮助读者更好地理解本发明精神,而并非对本发明保护范围的限制,相反,任何基于本发明的发明精神所作的任何改进或修饰都应当落在本发明的保护范围之内。

Claims (15)

1.一种基于数据增强和神经网络的电力设备局部放电诊断方法,针对电力设备在缺陷时检测的局部放电数据,通过使用多种数据增强方法丰富样本量并建立样本库,针对不同电力设备类型和缺陷类型的特点,采用不同的神经网络进行训练,得到诊断模型进行放电诊断,其特征在于,所述方法包括以下步骤:
S1:收集历年积累的电力设备在缺陷时检测的局部放电数据,形成原始数据集;
S2:针对所述原始数据集中的样本数据,随机使用有监督和无监督的数据增强方法两种形式下的多种数据增强方法中的一种,进行数据增强,将电力系统历年积累的局部放电数据与通过数据增强生成的新样本进行汇总,构建电力设备局部放电样本库;
S3:搭建基于GPU的训练平台,构建AlexNet、VGG、GoogLeNet、ResNet神经网络,采用所述放电样本库中数据增强后的样本数据,分别训练各个神经网络预测方法;
S4:根据电力设备局部放电的应用场景需求,设定各个神经网络预测方法在不同场景下进行预测的评价指标,进而针对不同的局部放电场景适配不同的神经网络预测方法,得到相应的诊断模型;
S5:采集电力设备缺陷时检测的局部放电数据,进行采样步骤S2中所述的数据增强方法进行增强后,输入步骤S4得到的诊断模型,进行故障诊断,并输出相应的诊断结论。
2.根据权利要求1所述的方法,其特征在于,所述步骤S1中,
采集变电站现场一次设备的历史检测数据、一次设备历史解体案例数据和实验室数据,通过人工专家结合变电站环境、检测数据形态、相关检测报告,对数据的有效性和局部放电缺陷的代表性进行分析、筛选,形成原始数据集。
3.根据权利要求1所述的方法,其特征在于,步骤S2中,
有监督的数据增强方法包含噪声叠加方法、模糊处理方法和多样本合成方法。
4.根据权利要求3所述的方法,其特征在于,
所述噪声叠加方法具体包括:
步骤1:定义待增强样本数据为dstImage[x][y],定义增强后样本数据为EnhDstImage[x][y],定义增加高斯随机变量rv后的值为val,通过下式计算val:
val=dstImage[x][y]+rv
步骤2:对val的范围进行修正:
if(val<0){val=0;}
if(val>255){val=255;}
步骤3:对样本数据值重新定义:
EnhDstImage[x][y]=val
对dstImage数组中所有数据经过上述处理后,形成增强后的样本数据EnhDstImage。
5.根据权利要求4所述的方法,其特征在于,
所述高斯随机变量rv的计算方式如下:
rv=sqrt(-2.0*log(U1))*cos(2*π*U2)
其中随机变量U1和U2表示为:
Figure FDA0003200194580000021
Figure FDA0003200194580000022
式中,假设随机变量U1、U2相互独立,且均服从(0,1)之间的均匀分布;随机变量Z0,Z1服从标准高斯分布且满足正态分布,均值为0,方差为1。
6.根据权利要求5所述的方法,其特征在于,
所述模糊处理方法包括:
步骤1:对原始数据进行噪声耦合,生成图片文件;
步骤2:输入步骤1转换后的图片文件,提取所述的图片文件的RGB(Red,Green,Blue)值;
步骤3:分别取图片文件中图片的中心点为零点,绘制横纵坐标轴,以二维高斯分布函数计算图片中各像素点的权重,形成权重矩阵,并进一步得到归一化的权重矩阵;
步骤4:以归一化后的权重更新图片文件的RGB值;
步骤5:存储更新RGB值后的图片文件,作为新的样本。
7.如权利要求3所述的方法,其特征在于,
所述多样本合成方法包括:
步骤1:局部放电特高频检测单次采集1秒钟的数据,每个周期20ms,将20ms分为60个时间片,取每个时间片中的最大值,得到50×60的二维数组;
步骤2:根据每个局部放电类型在数组中的特征值不一样,通过合并多个样本数据数组的相同下标的值,形成新的样本。
8.根据权利要求1所述的方法,其特征在于,所述无监督的数据增强方法包含随机生成与训练数据集分布一致的图谱的数据增强方法、以已有数据为基础学习出适合当前任务的数据增强方法。
9.如权利要求8所述的方法,其特征在于,
随机生成与训练数据集分布一致的图谱的数据增强方法具体包括:
依据局部放电特高频检测数据为50×60的二维数组,且数值范围处于0-70dB之间的整数,通过使用随机函数,动态生成3600个数值,依次存储到50×60的二维数组中,形成增强后的样本数据;其中随机数生成代码实现如下:
rand()%(b-a+1)+a
式中,a为随机数的下限即为0,b为随机数的上限即为70。
10.根据权利要求8所述的方法,其特征在于,以已有数据为基础学习出适合当前任务的数据增强方法具体包括:
通过准备13种数据增强操作,从13种数据增强操作方法中,随机产生使用该操作的概率,定义为概率组合,共产生5个概率组合,使用该5个概率组合进行增强样本,分别训练AlexNet、VGG、GoogLeNet、ResNet四种神经网络,训练后检查其泛化能力,根据泛化能力排序保留前三种概率组合,将前三种概率组合串接,从而进行数据增强。
11.根据权利要求10所述的方法,其特征在于,
所述数据增强操作包括放大或减小幅值、平移相位、叠加随机分布噪声和随机稀疏脉冲,通过对这些操作设置不同的数值,来设置13种数据增强操作方法。
12.根据权利要求11所述的方法,其特征在于,步骤S4具体包括:
S41:根据电力设备局部放电带电检测、重症监护、在线监测、离线试验的应用场景对诊断算法的诊断准确率、执行效率、运行条件的要求,选择适合应用场景的神经网络诊断预测方法;
S42:根据实际应用效果,调整各应用场景下的神经网络诊断模型选择及优化。
13.根据权利要求12所述的方法,其特征在于,
所述步骤S41具体包括:
步骤1:计算AlexNet、VGG、GoogLeNet、ResNet四种神经网络训练得出的四种诊断模型,在不同应用场景下的准确率Accuracy;
步骤2:计算四种诊断模型在不同应用场景下的指标F1;
步骤3:基于所述准确率和指标F1,制定相应的诊断模型计分标准,根据计分标准的规则计算总分,每个神经网络得出一个总分;
步骤4:根据总分来选择适合不同应用场景的相应诊断模型。
14.根据权利要求13所述的方法,其特征在于,
所述准确率Accuracy的计算公式如下:
Figure FDA0003200194580000041
式中TP是指标签为正样本,诊断为正样本的数目;FN是指标签为正样本,诊断为负样本的数目;FP是指标签为负样本,诊断为正样本的数目;TN是指标签为负样本,诊断为负样本的数目;
其中,标签是对样本数据进行标注时的分类,局部放电数据根据放电类型分为“正常、电晕、悬浮、气隙、沿面、微粒、噪声、其它”8个类别,对标签A而言,所有标注为A的数据均为正样本,标注非A的数据均为负样本。
15.根据权利要求14所述的方法,其特征在于,
定义精确度为Precision,其计算公式如下:
Figure DEST_PATH_RE-FDA0003200194580000042
定义召回率Recall,其计算公式如下:
Figure DEST_PATH_RE-FDA0003200194580000043
则所述指标F1的计算公式如下:
Figure DEST_PATH_RE-FDA0003200194580000044
CN201911063623.2A 2019-11-04 2019-11-04 基于数据增强和神经网络的电力设备局部放电诊断方法 Active CN110703057B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911063623.2A CN110703057B (zh) 2019-11-04 2019-11-04 基于数据增强和神经网络的电力设备局部放电诊断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911063623.2A CN110703057B (zh) 2019-11-04 2019-11-04 基于数据增强和神经网络的电力设备局部放电诊断方法

Publications (2)

Publication Number Publication Date
CN110703057A CN110703057A (zh) 2020-01-17
CN110703057B true CN110703057B (zh) 2022-02-25

Family

ID=69203343

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911063623.2A Active CN110703057B (zh) 2019-11-04 2019-11-04 基于数据增强和神经网络的电力设备局部放电诊断方法

Country Status (1)

Country Link
CN (1) CN110703057B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110796206B (zh) * 2019-11-06 2022-08-30 国网山东省电力公司电力科学研究院 一种针对局部放电图谱的数据增强方法及装置
CN111504675B (zh) * 2020-04-14 2021-04-09 河海大学 一种气体绝缘组合电器机械故障在线诊断方法
CN111610466A (zh) * 2020-05-14 2020-09-01 国网江苏省电力有限公司电力科学研究院 一种变压器状态预测方法、装置和存储介质
CN111638428B (zh) * 2020-06-08 2022-09-20 国网山东省电力公司电力科学研究院 一种基于gis特高频局部放电数据的处理方法及系统
CN112034310A (zh) * 2020-07-31 2020-12-04 国网山东省电力公司东营供电公司 一种组合电器局部放电缺陷诊断方法及系统
CN111929548B (zh) * 2020-08-13 2021-09-21 广东电网有限责任公司 放电和干扰信号样本生成方法、计算机设备和存储介质
CN112214851B (zh) * 2020-09-29 2022-06-07 国网福建省电力有限公司 基于支持向量机和遗传算法的开关柜电场预测与优化方法
CN112686333A (zh) * 2021-01-19 2021-04-20 科润智能控制股份有限公司 一种基于深度子域适配迁移网络的开关柜局部放电模式识别方法
CN113391172A (zh) * 2021-05-31 2021-09-14 国网山东省电力公司电力科学研究院 一种基于时序集成的多源超声检测的局放诊断方法及系统
CN113256743B (zh) * 2021-06-16 2022-09-02 图兮数字科技(北京)有限公司 一种图像处理方法、装置、电子设备以及可读存储介质
CN115186772B (zh) * 2022-09-13 2023-02-07 云智慧(北京)科技有限公司 一种电力设备的局部放电的检测方法、装置及设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107067026A (zh) * 2017-02-16 2017-08-18 国网江苏省电力公司电力科学研究院 基于深度神经网络的电力设备故障检测方法
CN109116203A (zh) * 2018-10-31 2019-01-01 红相股份有限公司 基于卷积神经网络的电力设备局部放电故障诊断方法
CN110334865A (zh) * 2019-07-05 2019-10-15 上海交通大学 一种基于卷积神经网络的电力设备故障率预测方法及系统
CN110555513A (zh) * 2019-08-16 2019-12-10 国电南瑞科技股份有限公司 一种基于深度学习的电力设备缺陷集成诊断方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104081301B (zh) * 2012-02-01 2017-02-22 Abb研究有限公司 电力系统中的一次装置的监测

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107067026A (zh) * 2017-02-16 2017-08-18 国网江苏省电力公司电力科学研究院 基于深度神经网络的电力设备故障检测方法
CN109116203A (zh) * 2018-10-31 2019-01-01 红相股份有限公司 基于卷积神经网络的电力设备局部放电故障诊断方法
CN110334865A (zh) * 2019-07-05 2019-10-15 上海交通大学 一种基于卷积神经网络的电力设备故障率预测方法及系统
CN110555513A (zh) * 2019-08-16 2019-12-10 国电南瑞科技股份有限公司 一种基于深度学习的电力设备缺陷集成诊断方法

Also Published As

Publication number Publication date
CN110703057A (zh) 2020-01-17

Similar Documents

Publication Publication Date Title
CN110703057B (zh) 基于数据增强和神经网络的电力设备局部放电诊断方法
CN110361176B (zh) 一种基于多任务特征共享神经网络的智能故障诊断方法
CN110647830B (zh) 基于卷积神经网络和高斯混合模型的轴承故障诊断方法
CN110968069B (zh) 风力发电机组的故障预测方法、相应的装置及电子设备
CN116862081B (zh) 一种污染治理设备运维方法及系统
CN117111544B (zh) 一种自动适配的楼宇物联网监控方法及系统
CN114548199A (zh) 一种基于深度迁移网络的多传感器数据融合方法
CN115793590A (zh) 适用于系统安全运维的数据处理方法及平台
CN114184367A (zh) 旋转机械设备故障诊断方法、装置、设备及可读存储介质
CN115809596A (zh) 一种数字孪生故障诊断方法和装置
CN117034143B (zh) 一种基于机器学习的分布式系统故障诊断方法及装置
CN117519951A (zh) 基于消息中台的实时数据处理方法及系统
CN110807014B (zh) 一种基于交叉验证的台区数据异常甄别方法和装置
CN115356599B (zh) 一种多模态城市电网故障诊断方法及系统
CN116706992A (zh) 一种分布式光伏集群的自适应功率预测方法、装置和设备
CN115982621A (zh) 一种基于时间卷积网络的旋转机械剩余使用寿命预测方法
CN116224950A (zh) 面向无人生产线自组织重构的智能故障诊断方法和系统
CN115598459A (zh) 一种配电网10kV馈线故障停电预测方法
Wang et al. LSTM-based alarm prediction in the mobile communication network
CN113807462A (zh) 一种基于ai的网络设备故障原因定位方法及其系统
CN112989606B (zh) 数据算法模型检验方法、系统及计算机存储介质
CN117527622B (zh) 网络交换机的数据处理方法及系统
CN112884167B (zh) 一种基于机器学习的多指标异常检测方法及其应用系统
CN109474445B (zh) 一种分布式系统根源故障定位方法及装置
O’Donnell et al. Determination of Multi-Component Failure in Automotive System Using Deep Learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant