CN113326873A

CN113326873A - 一种基于数据增强的电力设备分合闸状态自动分类方法

Info

Publication number: CN113326873A
Application number: CN202110548238.8A
Authority: CN
Inventors: 周静波; 刘荣海; 代克顺; 郭新良; 杨迎春; 陈国坤; 焦宗寒; 郑欣; 许宏伟
Original assignee: Electric Power Research Institute of Yunnan Power Grid Co Ltd
Current assignee: Electric Power Research Institute of Yunnan Power Grid Co Ltd
Priority date: 2021-05-19
Filing date: 2021-05-19
Publication date: 2021-08-31
Anticipated expiration: 2041-05-19
Also published as: CN113326873B

Abstract

本申请提供一种基于数据增强的电力设备分合闸状态自动分类方法，所述方法包括预处理电力设备分合闸原始X射线检测图像；通过AutoAugment法对预处理完成的数据进行数据增强；通过生成对抗样本的方式对增强数据进一步增强；通过增强完成的数据集进行神经网络模型对抗训练和通过测试数据评估训练完成的模型性能。本申请利用自动化数据增强技术有效解决数据样本少、多样性不足的问题，利用对抗样本数据增强技术有效增加模型的鲁棒性，通过上述数据增强方式以及X射线图像的自动识别方法，可快速准确识别出GIS设备分合闸中拒分或拒合的缺陷类型，解决GIS、断路器、开关设备等X射线检测图像状态识别效率低、诊断可靠性低等问题。

Description

一种基于数据增强的电力设备分合闸状态自动分类方法

技术领域

本申请涉及电力设备X射线检测及诊断技术领域，尤其涉及一种基于数据增强的电力设备分合闸状态自动分类方法。

背景技术

气体绝缘金属封闭开关设备(Gas Insulated Switchgear,简称GIS)、罐式断路器等封闭式变电设备是电力系统的重要枢纽设备，在电厂及电网变电站广泛应用，由于内部结构复杂，不易拆卸，一旦发生故障，特别是内部缺陷故障，容易引起电站失压、电力中断等严重事故。GIS、断路器、隔离开关、接地开关等设备的分合闸状态直接决定设备电路是连接还是断开，如果设备内部气室、传动机构、操作机构、导体接触面等出现故障，设备就可能出现拒合或拒分的情况，从设备外部无法观测到实际的分合闸状态，用X射线检测技术可以实现GIS等设备内部结构及状态的可视化，确定设备分合闸状态，避免因状态辨识错误而发生设备故障或损坏。

目前，X射线检测技术已成为GIS等封闭式设备分合闸等装配类缺陷的最佳检测手段，广泛应用于设备状态检测及故障诊断中，但还有以下不足：

(1)目前的X射线检测机器人仅能完成检测过程的自动化，检测后图像的处理及诊断仍然需要人类技术专家完成，严重影响检测及诊断的智能化水平，在实际检测中，由于电力设备X射线检测的专业技术人员紧缺，各检测人员缺陷诊断水平参差不齐，人工检测成本高且专业能力不足、疲劳过度等主观因素的影响，在检测过程中易出错，从而导致检测精度低。

(2)由于电力系统缺陷样本非常少，使用常规的数据增强方法比如旋转、裁剪等并不一定适用于当前的数据集，会给识别精度带来严重的影响，所以需要找到适合于当前数据集的数据增强方法。

本申请通过使用基于深度学习的图像自动识别方法来代替传统的X射线数字成像人工检测方法，以提高分合闸分类的精度。鉴于实际场景中分合闸数据非常少，故采用合理的自动数据增强方法和基于对抗样本的数据增强方法来进一步提高分类的准确度。

发明内容

本申请提供了一种基于数据增强的电力设备分合闸状态自动分类方法，以解决上述现有技术中存在数据样本少且缺陷识别人工成本高的技术问题。

本申请提供一种基于数据增强的电力设备分合闸状态自动分类方法，包括：

预处理电力设备分合闸原始X射线检测图像；

通过AutoAugment法对预处理完成的数据进行数据增强；

通过生成对抗样本的方式对增强数据进一步增强；

通过增强完成的数据集进行神经网络模型对抗训练；

通过测试数据评估训练完成的模型性能。

可选的，预处理电力设备分合闸原始X射线检测图像的步骤包括：

灰度化处理：通过加权平均法将原始图像变为合理的灰度图，对于每一个像素点，根据人眼对红色光、绿色光、蓝色光的敏感程度不同而赋予不同的权重，从而得到该点的灰度值，公式表达为：

Gray＝0.30*R+0.59*G+0.11*B；

滤波去噪：通过滤波方式对灰度图中的噪声进行去噪，使用某像素邻域内各点的灰度加权平均值来代替该像素原来的灰度值，得到加权均值滤波，邻域取为N*N的方形窗口，其降噪平滑后的图像表达为：

其中，S为点(x,y)领域内的点集，M为点集S的总点数，w(i,j)为权值；

图像增强：通过直方图均衡化进行图像增强，将原始图像的直方图通过积分概率密度函数转化为概率密度为1的图像，提高对比度；

尺寸归一化：将增强后的图像尺寸调整为224*224，满足卷积神经网络模型的训练要求。

可选的，通过AutoAugment法对预处理完成的数据进行数据增强的步骤包括：

使用增强学习从数据本身寻找最佳图像变换策略，对于不同的任务学习不同的增强方法，将寻找最佳数据增强策略的问题转为离散搜索问题，通过一个策略在给定用于训练神经网络的原始图像的条件下生成增强后的数据，具体做法为在搜索空间中，所述策略由三个子策略组成，对于小批量中的每一张图像，均匀地随机选取一个子策略生成一张变换后的图像训练神经网络，每个子策略由两个操作组成，每个操作都与两个数值相关联，所述两个数值分别为调用操作的概率和操作的幅度。

可选的，通过生成对抗样本的方式对增强数据进一步增强的步骤包括：

采用FGSM生成对抗样本数据，将所述数据加入到训练数据中，针对每个干净的小批量样本，通过所述方法生成与干净样本对抗的样本；核心为使输入图像x∈R^m向类别置信度降低的方向移动，令x∈R^m为输入图像，y为输入x对应的类标签，η为模型参数，ε为步长，J(θ,x,y)为所选的超参数，ΔJ_x(θ,x,y)为训练神经网络的损失函数，θ为损失函数的偏导数，在当前值附近对损失函数线性化得到干扰的最大范数限制：

η＝εSign(ΔJ_x(θ,x,y))，

通过求解下式得到对抗样本：

η在某个范围内随机取值，每一个训练数据附近的一个临域内可以保持识别正确。

可选的，通过增强完成的数据集进行神经网络模型对抗训练的步骤包括：

选取VGG19网络模型提取输入图片特征并分类，使用AdvProp增强型对抗训练方案获取干净样本和对抗样本的特征，将小批量干净样本、干净增强样本和小批量对抗样本送入VGG19网络，由于干净增强样本、对抗样本与原始干净样本的数据分布不匹配，通过VGG19网络减轻所述分布不匹配程度，通过辅助BN将干净样本和对抗样本的分布解耦进行学习，即对原始干净数据使用主BN生成干净样本损失函数，增强后干净数据和对抗样本分别使用辅助BN生成另外两个损失函数，最终目标为最小化三个损失函数之和更新网络参数，最终的损失函数为：

其中ε为对抗性的扰动，D为基础数据分布，L为损失函数，θ为网络参数，x为带有真实标签y的训练样本。

可选的，所述AdvProp训练算法的具体步骤为：

从数据集中采样mini-batch的干净输入x^c和标签y；将数据通过辅助BN产生对抗输入x^a；使用干净输入x^c通过主BN计算损失函数L^c；使用对抗输入x^a通过辅助BN计算损失函数L^a；最小化两种输入的损失函数之和L^a+L^c；

以上步骤为一个训练的step中完成的。

可选的，通过测试数据评估训练完成的模型性能的步骤包括：

输入一张测试用分合闸图像，归一化到224*224，通过训练好的VGG19图像分类模型判断该图像中电力设备的开关处于分闸状态还是合闸状态。

由以上技术方案可知，本申请提供一种基于数据增强的电力设备分合闸状态自动分类方法，所述方法包括预处理电力设备分合闸原始X射线检测图像；通过AutoAugment法对预处理完成的数据进行数据增强；通过生成对抗样本的方式对增强数据进一步增强；通过增强完成的数据集进行神经网络模型对抗训练和通过测试数据评估训练完成的模型性能。

本申请针对对抗样本提出了不同的观点，认为对抗样本可以提高网络模型的识别准确性，由于对抗样本与干净样本具有不同的分布，分布的不匹配会导致图像分类模型的性能下降，因此提出AdvProp，它是一种增强型对抗训练的方法，即使用辅助的BN(归一化)将对抗样本和干净样本的混合分布在归一化层上进行解耦，其具有高识别效率、高泛化能力和高鲁棒性的特点。

附图说明

为了更清楚地说明本申请的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，对于本领域普通技术人员而言，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请提供的一种基于数据增强的电力设备分合闸状态自动分类方法的流程示意图；

图2为本申请提供的一种基于数据增强的电力设备分合闸状态自动分类方法中自动数据增强方法的流程示意图；

图3为本申请提供的一种基于数据增强的电力设备分合闸状态自动分类方法中AdvProp对抗训练的流程示意图；

图4为本申请提供的一种基于数据增强的电力设备分合闸状态自动分类方法中AdvProp对抗训练的数据流图。

具体实施方式

下面将详细地对实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下实施例中描述的实施方式并不代表与本申请相一致的所有实施方式。仅是与权利要求书中所详述的、本申请的一些方面相一致的系统和方法的示例。

X射线数字成像检测方法是GIS、断路器、开关等电力设备内部运行状态及缺陷检测的重要检测手段，其中触头、导体等部件分合闸状态的确认是保障设备处于正确连接或断开位置的重要环节，X射线检测图像的诊断主要依赖于技术专家的专业水平，严重影响检测结果诊断效率及可靠性。

参见图1，为本申请提供的一种基于数据增强的电力设备分合闸状态自动分类方法的流程示意图，包括：

预处理电力设备分合闸原始X射线检测图像；

通过AutoAugment法对预处理完成的数据进行数据增强；

通过生成对抗样本的方式对增强数据进一步增强；

通过增强完成的数据集进行神经网络模型对抗训练；

通过测试数据评估训练完成的模型性能。

在实际应用中，预处理电力设备分合闸原始X射线检测图像的步骤包括：

Gray＝0.30*R+0.59*G+0.11*B；

对电力设备分合闸数据进行预处理操作：首先将拍摄不全的图像删除；然后针对图像中噪声和光照的影响，分合闸位置不清晰的问题，进一步做相应的预处理。

所述灰度化处理可以简化图像信息，突出图像中的主要信息，原理为由于一幅图片有很多个像素点，对于RGB图像来说，像素点是有RGB值的，当R＝G＝B时，称这种颜色是一种灰度，由于RGB都只占8位，所以所述灰度只有256种(0-255)，采用加权平均法将一张RGB彩色图变成一张合理的灰度图。

参见图2，为本申请提供的一种基于数据增强的电力设备分合闸状态自动分类方法中自动数据增强方法的流程示意图，在实际应用中，通过AutoAugment法对预处理完成的数据进行数据增强的步骤包括：

由于干净数据较少，所以使用数据增强的方式来扩充训练数据，从而提高图像分类的准确性，但是当前的数据增强是手动设计的，有些操作并不适合当前数据，AutoAugment 是一种自动选择最好的数据增强方案的研究，也是最早使用自动机器学习技术来搜索数据增强策略的研究，能够帮助模型提高性能，学习到更好的不变性。

这种数据增强方法包括两个部分：搜索算法和搜索空间，搜索算法(实现为控制器RNN)对数据增强策略S进行采样，使用策略S来训练具有固定体系结构的神经网络，然后根据验证准确率R与策略梯度一起来更新控制器，从而随着时间的推移生成更好的数据增强策略。其中数据增强策略S主要包括对现有数据做哪种图像处理操作，每批数据使用该操作的可能性以及操作的大小信息。

在实际应用中，通过生成对抗样本的方式对增强数据进一步增强的步骤包括：

η＝εSign(ΔJ_x(θ,x,y))，

通过求解下式得到对抗样本：

大多数研究者更关心模型的性能却忽略了模型的脆弱性和鲁棒性，在很多情况下机器学习算法模型会对添加轻微扰动后的输入样本产生误判即以高置信度来输出一个错误的结果。“对抗样本”是一种由攻击者精心设计的特殊样本，如果输入到深度学习模型里可以引发模型的分类出现错误，就像是在视觉上让模型产生了幻觉。现有的模型很容易受到“对抗样本”的攻击，它可以使模型产生误判进而使攻击者达到绕过模型检测的目的，甚至可导致基于此类模型的各种异常检测算法失效。

面对上述的模型识别盲区问题，本申请采用FGSM生成对抗样本数据，并且将这些数据加入到训练数据中。这样模型就会尽可能地拟合这些数据，覆盖原本的识别盲区。将对抗样本作为数据集扩增的一部分，可以增强深度学习模型的鲁棒性。

参见图3和图4，为本申请提供的一种基于数据增强的电力设备分合闸状态自动分类方法中AdvProp对抗训练的流程示意图和数据流图，在实际应用中，通过增强完成的数据集进行神经网络模型对抗训练的步骤包括：

在实际应用中，所述AdvProp训练算法的具体步骤为：

以上步骤为一个训练的step中完成的。

本申请使用VGG19网络模型对输入图片提取特征并分类，VGG19卷积神经网络模型由16个卷积层(被5个max-pooling层分割)和3个全连接层以及最后的Softmax分类层组成。大部分卷积层采用3×3过滤器，小部分卷积层采用1×1过滤器，这样可在不影响输入输出特征维数的情况下对输入图像特征进行线性变换，然后进行非线性变换，以提高模型的非线性表达能力。池化层采用2×2过滤器，通过减少网络参数可以完成更多的非线性映射操作，从而提高模型的拟合能力。VGG-19的感受野为224×224，具有较好的执行效果。此外，模型中添加了批规范化(Batch Normalization，BN)以加速网络训练。本发明在模型中添加了批规范化(Batch Normalization，BN)以加速网络训练，并且在反向传播的时候对网络模型的所有卷积层采用L2正则化和所有全连接层采用L1 正则化，以防止模型过拟合。

在实际应用中，通过测试数据评估训练完成的模型性能的步骤包括：

本申请提供的一种基于数据增强的电力设备分合闸状态自动分类方法，包括收集GIS 设备典型缺陷样本，依据电力专家领域知识进行缺陷类型的标注，由于采集得的图像样本数量较少，故采用数据增强技术对数据集进行扩充；然后设计深度卷积神经网络算法模型以提取电力设备X射线影像的关键特征，考虑到VGGNet网络具有精度高、速度快的优点，选择此网络对数据样本进行迁移训练，得到模型的初始结构，再将模型迁移到所研究的X射线缺陷识别中，通过缺陷识别小样本数据通过反向传播对模型进一步的调节，以此得到最终的基于VGGNet网络的缺陷识别模型；最后，通过设计适当的损失函数对缺陷进行分类，考虑到缺陷样本与正常样本的不均衡会导致训练速度变慢以及识别性能下降，本文拟引入非均衡损失函数Focal loss来指导深度卷积神经网络参数更新，以期获得更高的识别精度。本申请提供了一种基于数据增强技术的电力设备分合闸状态自动识别方法，利用自动化数据增强技术有效解决数据样本少、多样性不足的问题，利用对抗样本数据增强技术有效增加模型的鲁棒性，从而适用于实际场景中存在的困难样本，通过上述数据增强方式以及X射线图像的自动识别方法，可快速准确识别出GIS设备分合闸中的拒分或者拒合的缺陷类型，解决GIS、断路器、开关设备等X射线检测图像状态识别效率低、诊断可靠性低等问题。

以上显示和描述了本申请的基本原理和主要特征以及本申请的优点，对于本领域技术人员而言，显然本申请不限于上述示范性实施例的细节，而且在不背离本申请的精神或基本特征的情况下，能够以其他的具体形式实现本申请。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本申请的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本申请内。

此外，应当理解，虽然本说明书按照实施方式加以描述，但并非每个实施方式仅包含一个独立的技术方案，说明书的这种叙述方式仅仅是为清楚起见，本领域技术人员应当将说明书作为一个整体，各实施例中的技术方案也可以经适当组合，形成本领域技术人员可以理解的其他实施方式。

本申请提供的实施例之间的相似部分相互参见即可，以上提供的具体实施方式只是本申请总的构思下的几个示例，并不构成本申请保护范围的限定。对于本领域的技术人员而言，在不付出创造性劳动的前提下依据本申请方案所扩展出的任何其他实施方式都属于本申请的保护范围。

Claims

1.一种基于数据增强的电力设备分合闸状态自动分类方法，其特征在于，包括：

预处理电力设备分合闸原始X射线检测图像；

通过AutoAugment法对预处理完成的数据进行数据增强；

通过生成对抗样本的方式对增强数据进一步增强；

通过增强完成的数据集进行神经网络模型对抗训练；

通过测试数据评估训练完成的模型性能。

2.根据权利要求1所述的一种基于数据增强的电力设备分合闸状态自动分类方法，其特征在于，预处理电力设备分合闸原始X射线检测图像的步骤包括：

Gray＝0.30*R+0.59*G+0.11*B；

3.根据权利要求1所述的一种基于数据增强的电力设备分合闸状态自动分类方法，其特征在于，通过AutoAugment法对预处理完成的数据进行数据增强的步骤包括：

4.根据权利要求1所述的一种基于数据增强的电力设备分合闸状态自动分类方法，其特征在于，通过生成对抗样本的方式对增强数据进一步增强的步骤包括：

η＝εSign(ΔJ_x(θ,x,y))，

通过求解下式得到对抗样本：

5.根据权利要求1所述的一种基于数据增强的电力设备分合闸状态自动分类方法，其特征在于，通过增强完成的数据集进行神经网络模型对抗训练的步骤包括：

6.根据权利要求5所述的一种基于数据增强的电力设备分合闸状态自动分类方法，其特征在于，所述AdvProp训练算法的具体步骤为：

以上步骤为一个训练的step中完成的。

7.根据权利要求1所述的一种基于数据增强的电力设备分合闸状态自动分类方法，其特征在于，通过测试数据评估训练完成的模型性能的步骤包括：