CN113326873A - 一种基于数据增强的电力设备分合闸状态自动分类方法 - Google Patents
一种基于数据增强的电力设备分合闸状态自动分类方法 Download PDFInfo
- Publication number
- CN113326873A CN113326873A CN202110548238.8A CN202110548238A CN113326873A CN 113326873 A CN113326873 A CN 113326873A CN 202110548238 A CN202110548238 A CN 202110548238A CN 113326873 A CN113326873 A CN 113326873A
- Authority
- CN
- China
- Prior art keywords
- data
- image
- enhancement
- opening
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 62
- 238000012549 training Methods 0.000 claims abstract description 47
- 238000001514 detection method Methods 0.000 claims abstract description 30
- 230000002708 enhancing effect Effects 0.000 claims abstract description 12
- 238000012360 testing method Methods 0.000 claims abstract description 11
- 238000007781 pre-processing Methods 0.000 claims abstract description 9
- 238000003062 neural network model Methods 0.000 claims abstract description 8
- 230000006870 function Effects 0.000 claims description 38
- 238000009826 distribution Methods 0.000 claims description 15
- 238000013528 artificial neural network Methods 0.000 claims description 10
- 238000001914 filtration Methods 0.000 claims description 9
- 230000002787 reinforcement Effects 0.000 claims description 9
- 238000010606 normalization Methods 0.000 claims description 7
- 238000013527 convolutional neural network Methods 0.000 claims description 6
- 230000009466 transformation Effects 0.000 claims description 6
- 238000013145 classification model Methods 0.000 claims description 4
- 230000003042 antagnostic effect Effects 0.000 claims description 3
- 230000008485 antagonism Effects 0.000 claims description 3
- 238000009499 grossing Methods 0.000 claims description 3
- 238000005070 sampling Methods 0.000 claims description 3
- 230000035945 sensitivity Effects 0.000 claims description 3
- 230000003014 reinforcing effect Effects 0.000 claims 1
- 230000007547 defect Effects 0.000 abstract description 15
- 238000005516 engineering process Methods 0.000 abstract description 9
- 238000003745 diagnosis Methods 0.000 abstract description 8
- 238000010586 diagram Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 239000004020 conductor Substances 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000013136 deep learning model Methods 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000010304 firing Methods 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N23/00—Investigating or analysing materials by the use of wave or particle radiation, e.g. X-rays or neutrons, not covered by groups G01N3/00 – G01N17/00, G01N21/00 or G01N22/00
- G01N23/02—Investigating or analysing materials by the use of wave or particle radiation, e.g. X-rays or neutrons, not covered by groups G01N3/00 – G01N17/00, G01N21/00 or G01N22/00 by transmitting the radiation through the material
- G01N23/04—Investigating or analysing materials by the use of wave or particle radiation, e.g. X-rays or neutrons, not covered by groups G01N3/00 – G01N17/00, G01N21/00 or G01N22/00 by transmitting the radiation through the material and forming images of the material
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01R—MEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
- G01R31/00—Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere
- G01R31/327—Testing of circuit interrupters, switches or circuit-breakers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/40—Image enhancement or restoration using histogram techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0004—Industrial image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/30—Noise filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/50—Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2223/00—Investigating materials by wave or particle radiation
- G01N2223/03—Investigating materials by wave or particle radiation by transmission
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2223/00—Investigating materials by wave or particle radiation
- G01N2223/10—Different kinds of radiation or particles
- G01N2223/101—Different kinds of radiation or particles electromagnetic radiation
- G01N2223/1016—X-ray
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10116—X-ray image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20076—Probabilistic image processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20172—Image enhancement details
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Software Systems (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Evolutionary Biology (AREA)
- Multimedia (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Quality & Reliability (AREA)
- Image Analysis (AREA)
Abstract
本申请提供一种基于数据增强的电力设备分合闸状态自动分类方法,所述方法包括预处理电力设备分合闸原始X射线检测图像;通过AutoAugment法对预处理完成的数据进行数据增强;通过生成对抗样本的方式对增强数据进一步增强;通过增强完成的数据集进行神经网络模型对抗训练和通过测试数据评估训练完成的模型性能。本申请利用自动化数据增强技术有效解决数据样本少、多样性不足的问题,利用对抗样本数据增强技术有效增加模型的鲁棒性,通过上述数据增强方式以及X射线图像的自动识别方法,可快速准确识别出GIS设备分合闸中拒分或拒合的缺陷类型,解决GIS、断路器、开关设备等X射线检测图像状态识别效率低、诊断可靠性低等问题。
Description
技术领域
本申请涉及电力设备X射线检测及诊断技术领域,尤其涉及一种基于数据增强的电 力设备分合闸状态自动分类方法。
背景技术
气体绝缘金属封闭开关设备(Gas Insulated Switchgear,简称GIS)、罐式断路器等封闭式变电设备是电力系统的重要枢纽设备,在电厂及电网变电站广泛应用,由于内 部结构复杂,不易拆卸,一旦发生故障,特别是内部缺陷故障,容易引起电站失压、电 力中断等严重事故。GIS、断路器、隔离开关、接地开关等设备的分合闸状态直接决定设 备电路是连接还是断开,如果设备内部气室、传动机构、操作机构、导体接触面等出现 故障,设备就可能出现拒合或拒分的情况,从设备外部无法观测到实际的分合闸状态, 用X射线检测技术可以实现GIS等设备内部结构及状态的可视化,确定设备分合闸状态, 避免因状态辨识错误而发生设备故障或损坏。
目前,X射线检测技术已成为GIS等封闭式设备分合闸等装配类缺陷的最佳检测手段,广泛应用于设备状态检测及故障诊断中,但还有以下不足:
(1)目前的X射线检测机器人仅能完成检测过程的自动化,检测后图像的处理及诊断仍然需要人类技术专家完成,严重影响检测及诊断的智能化水平,在实际检测中,由 于电力设备X射线检测的专业技术人员紧缺,各检测人员缺陷诊断水平参差不齐,人工 检测成本高且专业能力不足、疲劳过度等主观因素的影响,在检测过程中易出错,从而 导致检测精度低。
(2)由于电力系统缺陷样本非常少,使用常规的数据增强方法比如旋转、裁剪等并不一定适用于当前的数据集,会给识别精度带来严重的影响,所以需要找到适合于当前 数据集的数据增强方法。
本申请通过使用基于深度学习的图像自动识别方法来代替传统的X射线数字成像人 工检测方法,以提高分合闸分类的精度。鉴于实际场景中分合闸数据非常少,故采用合理的自动数据增强方法和基于对抗样本的数据增强方法来进一步提高分类的准确度。
发明内容
本申请提供了一种基于数据增强的电力设备分合闸状态自动分类方法,以解决上述 现有技术中存在数据样本少且缺陷识别人工成本高的技术问题。
本申请提供一种基于数据增强的电力设备分合闸状态自动分类方法,包括:
预处理电力设备分合闸原始X射线检测图像;
通过AutoAugment法对预处理完成的数据进行数据增强;
通过生成对抗样本的方式对增强数据进一步增强;
通过增强完成的数据集进行神经网络模型对抗训练;
通过测试数据评估训练完成的模型性能。
可选的,预处理电力设备分合闸原始X射线检测图像的步骤包括:
灰度化处理:通过加权平均法将原始图像变为合理的灰度图,对于每一个像素点,根据人眼对红色光、绿色光、蓝色光的敏感程度不同而赋予不同的权重,从而得到该点 的灰度值,公式表达为:
Gray=0.30*R+0.59*G+0.11*B;
滤波去噪:通过滤波方式对灰度图中的噪声进行去噪,使用某像素邻域内各点的灰 度加权平均值来代替该像素原来的灰度值,得到加权均值滤波,邻域取为N*N的方形窗口,其降噪平滑后的图像表达为:
其中,S为点(x,y)领域内的点集,M为点集S的总点数,w(i,j)为权值;
图像增强:通过直方图均衡化进行图像增强,将原始图像的直方图通过积分概率密 度函数转化为概率密度为1的图像,提高对比度;
尺寸归一化:将增强后的图像尺寸调整为224*224,满足卷积神经网络模型的训练要求。
可选的,通过AutoAugment法对预处理完成的数据进行数据增强的步骤包括:
使用增强学习从数据本身寻找最佳图像变换策略,对于不同的任务学习不同的增强 方法,将寻找最佳数据增强策略的问题转为离散搜索问题,通过一个策略在给定用于训练神经网络的原始图像的条件下生成增强后的数据,具体做法为在搜索空间中,所述策 略由三个子策略组成,对于小批量中的每一张图像,均匀地随机选取一个子策略生成一 张变换后的图像训练神经网络,每个子策略由两个操作组成,每个操作都与两个数值相 关联,所述两个数值分别为调用操作的概率和操作的幅度。
可选的,通过生成对抗样本的方式对增强数据进一步增强的步骤包括:
采用FGSM生成对抗样本数据,将所述数据加入到训练数据中,针对每个干净的小批 量样本,通过所述方法生成与干净样本对抗的样本;核心为使输入图像x∈Rm向类别置信 度降低的方向移动,令x∈Rm为输入图像,y为输入x对应的类标签,η为模型参数,ε为 步长,J(θ,x,y)为所选的超参数,ΔJx(θ,x,y)为训练神经网络的损失函数,θ为损失函数 的偏导数,在当前值附近对损失函数线性化得到干扰的最大范数限制:
η=εSign(ΔJx(θ,x,y)),
通过求解下式得到对抗样本:
η在某个范围内随机取值,每一个训练数据附近的一个临域内可以保持识别正确。
可选的,通过增强完成的数据集进行神经网络模型对抗训练的步骤包括:
选取VGG19网络模型提取输入图片特征并分类,使用AdvProp增强型对抗训练方案获取干净样本和对抗样本的特征,将小批量干净样本、干净增强样本和小批量对抗样本 送入VGG19网络,由于干净增强样本、对抗样本与原始干净样本的数据分布不匹配,通 过VGG19网络减轻所述分布不匹配程度,通过辅助BN将干净样本和对抗样本的分布解耦 进行学习,即对原始干净数据使用主BN生成干净样本损失函数,增强后干净数据和对抗 样本分别使用辅助BN生成另外两个损失函数,最终目标为最小化三个损失函数之和更新 网络参数,最终的损失函数为:
其中ε为对抗性的扰动,D为基础数据分布,L为损失函数,θ为网络参数,x为带有真实标签y的训练样本。
可选的,所述AdvProp训练算法的具体步骤为:
从数据集中采样mini-batch的干净输入xc和标签y;将数据通过辅助BN产生对抗输入xa;使用干净输入xc通过主BN计算损失函数Lc;使用对抗输入xa通过辅助BN计算 损失函数La;最小化两种输入的损失函数之和La+Lc;
以上步骤为一个训练的step中完成的。
可选的,通过测试数据评估训练完成的模型性能的步骤包括:
输入一张测试用分合闸图像,归一化到224*224,通过训练好的VGG19图像分类模型判断该图像中电力设备的开关处于分闸状态还是合闸状态。
由以上技术方案可知,本申请提供一种基于数据增强的电力设备分合闸状态自动分 类方法,所述方法包括预处理电力设备分合闸原始X射线检测图像;通过AutoAugment法对预处理完成的数据进行数据增强;通过生成对抗样本的方式对增强数据进一步增强;通过增强完成的数据集进行神经网络模型对抗训练和通过测试数据评估训练完成的模型性能。
本申请针对对抗样本提出了不同的观点,认为对抗样本可以提高网络模型的识别准 确性,由于对抗样本与干净样本具有不同的分布,分布的不匹配会导致图像分类模型的性能下降,因此提出AdvProp,它是一种增强型对抗训练的方法,即使用辅助的BN(归 一化)将对抗样本和干净样本的混合分布在归一化层上进行解耦,其具有高识别效率、 高泛化能力和高鲁棒性的特点。
附图说明
为了更清楚地说明本申请的技术方案,下面将对实施例中所需要使用的附图作简单 地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请提供的一种基于数据增强的电力设备分合闸状态自动分类方法的流程 示意图;
图2为本申请提供的一种基于数据增强的电力设备分合闸状态自动分类方法中自动 数据增强方法的流程示意图;
图3为本申请提供的一种基于数据增强的电力设备分合闸状态自动分类方法中AdvProp对抗训练的流程示意图;
图4为本申请提供的一种基于数据增强的电力设备分合闸状态自动分类方法中AdvProp对抗训练的数据流图。
具体实施方式
下面将详细地对实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下实施例中描述的实 施方式并不代表与本申请相一致的所有实施方式。仅是与权利要求书中所详述的、本申 请的一些方面相一致的系统和方法的示例。
X射线数字成像检测方法是GIS、断路器、开关等电力设备内部运行状态及缺陷检测 的重要检测手段,其中触头、导体等部件分合闸状态的确认是保障设备处于正确连接或断开位置的重要环节,X射线检测图像的诊断主要依赖于技术专家的专业水平,严重影 响检测结果诊断效率及可靠性。
参见图1,为本申请提供的一种基于数据增强的电力设备分合闸状态自动分类方法 的流程示意图,包括:
预处理电力设备分合闸原始X射线检测图像;
通过AutoAugment法对预处理完成的数据进行数据增强;
通过生成对抗样本的方式对增强数据进一步增强;
通过增强完成的数据集进行神经网络模型对抗训练;
通过测试数据评估训练完成的模型性能。
在实际应用中,预处理电力设备分合闸原始X射线检测图像的步骤包括:
灰度化处理:通过加权平均法将原始图像变为合理的灰度图,对于每一个像素点,根据人眼对红色光、绿色光、蓝色光的敏感程度不同而赋予不同的权重,从而得到该点 的灰度值,公式表达为:
Gray=0.30*R+0.59*G+0.11*B;
滤波去噪:通过滤波方式对灰度图中的噪声进行去噪,使用某像素邻域内各点的灰 度加权平均值来代替该像素原来的灰度值,得到加权均值滤波,邻域取为N*N的方形窗口,其降噪平滑后的图像表达为:
其中,S为点(x,y)领域内的点集,M为点集S的总点数,w(i,j)为权值;
图像增强:通过直方图均衡化进行图像增强,将原始图像的直方图通过积分概率密 度函数转化为概率密度为1的图像,提高对比度;
尺寸归一化:将增强后的图像尺寸调整为224*224,满足卷积神经网络模型的训练要求。
对电力设备分合闸数据进行预处理操作:首先将拍摄不全的图像删除;然后针对图 像中噪声和光照的影响,分合闸位置不清晰的问题,进一步做相应的预处理。
所述灰度化处理可以简化图像信息,突出图像中的主要信息,原理为由于一幅图片 有很多个像素点,对于RGB图像来说,像素点是有RGB值的,当R=G=B时,称这种颜色 是一种灰度,由于RGB都只占8位,所以所述灰度只有256种(0-255),采用加权平均 法将一张RGB彩色图变成一张合理的灰度图。
参见图2,为本申请提供的一种基于数据增强的电力设备分合闸状态自动分类方法 中自动数据增强方法的流程示意图,在实际应用中,通过AutoAugment法对预处理完成的数据进行数据增强的步骤包括:
使用增强学习从数据本身寻找最佳图像变换策略,对于不同的任务学习不同的增强 方法,将寻找最佳数据增强策略的问题转为离散搜索问题,通过一个策略在给定用于训练神经网络的原始图像的条件下生成增强后的数据,具体做法为在搜索空间中,所述策 略由三个子策略组成,对于小批量中的每一张图像,均匀地随机选取一个子策略生成一 张变换后的图像训练神经网络,每个子策略由两个操作组成,每个操作都与两个数值相 关联,所述两个数值分别为调用操作的概率和操作的幅度。
由于干净数据较少,所以使用数据增强的方式来扩充训练数据,从而提高图像分类 的准确性,但是当前的数据增强是手动设计的,有些操作并不适合当前数据,AutoAugment 是一种自动选择最好的数据增强方案的研究,也是最早使用自动机器学习技术来搜索数 据增强策略的研究,能够帮助模型提高性能,学习到更好的不变性。
这种数据增强方法包括两个部分:搜索算法和搜索空间,搜索算法(实现为控制器RNN)对数据增强策略S进行采样,使用策略S来训练具有固定体系结构的神经网络,然 后根据验证准确率R与策略梯度一起来更新控制器,从而随着时间的推移生成更好的数 据增强策略。其中数据增强策略S主要包括对现有数据做哪种图像处理操作,每批数据 使用该操作的可能性以及操作的大小信息。
在实际应用中,通过生成对抗样本的方式对增强数据进一步增强的步骤包括:
采用FGSM生成对抗样本数据,将所述数据加入到训练数据中,针对每个干净的小批 量样本,通过所述方法生成与干净样本对抗的样本;核心为使输入图像x∈Rm向类别置信 度降低的方向移动,令x∈Rm为输入图像,y为输入x对应的类标签,η为模型参数,ε为 步长,J(θ,x,y)为所选的超参数,ΔJx(θ,x,y)为训练神经网络的损失函数,θ为损失函数 的偏导数,在当前值附近对损失函数线性化得到干扰的最大范数限制:
η=εSign(ΔJx(θ,x,y)),
通过求解下式得到对抗样本:
η在某个范围内随机取值,每一个训练数据附近的一个临域内可以保持识别正确。
大多数研究者更关心模型的性能却忽略了模型的脆弱性和鲁棒性,在很多情况下机 器学习算法模型会对添加轻微扰动后的输入样本产生误判即以高置信度来输出一个错误 的结果。“对抗样本”是一种由攻击者精心设计的特殊样本,如果输入到深度学习模型里可以引发模型的分类出现错误,就像是在视觉上让模型产生了幻觉。现有的模型很容易 受到“对抗样本”的攻击,它可以使模型产生误判进而使攻击者达到绕过模型检测的目 的,甚至可导致基于此类模型的各种异常检测算法失效。
面对上述的模型识别盲区问题,本申请采用FGSM生成对抗样本数据,并且将这些数 据加入到训练数据中。这样模型就会尽可能地拟合这些数据,覆盖原本的识别盲区。将对抗样本作为数据集扩增的一部分,可以增强深度学习模型的鲁棒性。
参见图3和图4,为本申请提供的一种基于数据增强的电力设备分合闸状态自动分类方法中AdvProp对抗训练的流程示意图和数据流图,在实际应用中,通过增强完成的 数据集进行神经网络模型对抗训练的步骤包括:
选取VGG19网络模型提取输入图片特征并分类,使用AdvProp增强型对抗训练方案获取干净样本和对抗样本的特征,将小批量干净样本、干净增强样本和小批量对抗样本 送入VGG19网络,由于干净增强样本、对抗样本与原始干净样本的数据分布不匹配,通 过VGG19网络减轻所述分布不匹配程度,通过辅助BN将干净样本和对抗样本的分布解耦 进行学习,即对原始干净数据使用主BN生成干净样本损失函数,增强后干净数据和对抗 样本分别使用辅助BN生成另外两个损失函数,最终目标为最小化三个损失函数之和更新 网络参数,最终的损失函数为:
其中ε为对抗性的扰动,D为基础数据分布,L为损失函数,θ为网络参数,x为带有真实标签y的训练样本。
在实际应用中,所述AdvProp训练算法的具体步骤为:
从数据集中采样mini-batch的干净输入xc和标签y;将数据通过辅助BN产生对抗输入xa;使用干净输入xc通过主BN计算损失函数Lc;使用对抗输入xa通过辅助BN计算 损失函数La;最小化两种输入的损失函数之和La+Lc;
以上步骤为一个训练的step中完成的。
本申请使用VGG19网络模型对输入图片提取特征并分类,VGG19卷积神经网络模型由16个卷积层(被5个max-pooling层分割)和3个全连接层以及最后的Softmax分类 层组成。大部分卷积层采用3×3过滤器,小部分卷积层采用1×1过滤器,这样可在不 影响输入输出特征维数的情况下对输入图像特征进行线性变换,然后进行非线性变换, 以提高模型的非线性表达能力。池化层采用2×2过滤器,通过减少网络参数可以完成更 多的非线性映射操作,从而提高模型的拟合能力。VGG-19的感受野为224×224,具有较 好的执行效果。此外,模型中添加了批规范化(Batch Normalization,BN)以加速网络 训练。本发明在模型中添加了批规范化(Batch Normalization,BN)以加速网络训练, 并且在反向传播的时候对网络模型的所有卷积层采用L2正则化和所有全连接层采用L1 正则化,以防止模型过拟合。
在实际应用中,通过测试数据评估训练完成的模型性能的步骤包括:
输入一张测试用分合闸图像,归一化到224*224,通过训练好的VGG19图像分类模型判断该图像中电力设备的开关处于分闸状态还是合闸状态。
本申请提供的一种基于数据增强的电力设备分合闸状态自动分类方法,包括收集GIS 设备典型缺陷样本,依据电力专家领域知识进行缺陷类型的标注,由于采集得的图像样 本数量较少,故采用数据增强技术对数据集进行扩充;然后设计深度卷积神经网络算法模型以提取电力设备X射线影像的关键特征,考虑到VGGNet网络具有精度高、速度快的 优点,选择此网络对数据样本进行迁移训练,得到模型的初始结构,再将模型迁移到所 研究的X射线缺陷识别中,通过缺陷识别小样本数据通过反向传播对模型进一步的调节, 以此得到最终的基于VGGNet网络的缺陷识别模型;最后,通过设计适当的损失函数对缺 陷进行分类,考虑到缺陷样本与正常样本的不均衡会导致训练速度变慢以及识别性能下 降,本文拟引入非均衡损失函数Focal loss来指导深度卷积神经网络参数更新,以期获 得更高的识别精度。本申请提供了一种基于数据增强技术的电力设备分合闸状态自动识 别方法,利用自动化数据增强技术有效解决数据样本少、多样性不足的问题,利用对抗 样本数据增强技术有效增加模型的鲁棒性,从而适用于实际场景中存在的困难样本,通 过上述数据增强方式以及X射线图像的自动识别方法,可快速准确识别出GIS设备分合 闸中的拒分或者拒合的缺陷类型,解决GIS、断路器、开关设备等X射线检测图像状态 识别效率低、诊断可靠性低等问题。
以上显示和描述了本申请的基本原理和主要特征以及本申请的优点,对于本领域技 术人员而言,显然本申请不限于上述示范性实施例的细节,而且在不背离本申请的精神或基本特征的情况下,能够以其他的具体形式实现本申请。因此,无论从哪一点来看, 均应将实施例看作是示范性的,而且是非限制性的,本申请的范围由所附权利要求而不 是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括 在本申请内。
此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应 当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术 人员可以理解的其他实施方式。
本申请提供的实施例之间的相似部分相互参见即可,以上提供的具体实施方式只是 本申请总的构思下的几个示例,并不构成本申请保护范围的限定。对于本领域的技术人员而言,在不付出创造性劳动的前提下依据本申请方案所扩展出的任何其他实施方式都属于本申请的保护范围。
Claims (7)
1.一种基于数据增强的电力设备分合闸状态自动分类方法,其特征在于,包括:
预处理电力设备分合闸原始X射线检测图像;
通过AutoAugment法对预处理完成的数据进行数据增强;
通过生成对抗样本的方式对增强数据进一步增强;
通过增强完成的数据集进行神经网络模型对抗训练;
通过测试数据评估训练完成的模型性能。
2.根据权利要求1所述的一种基于数据增强的电力设备分合闸状态自动分类方法,其特征在于,预处理电力设备分合闸原始X射线检测图像的步骤包括:
灰度化处理:通过加权平均法将原始图像变为合理的灰度图,对于每一个像素点,根据人眼对红色光、绿色光、蓝色光的敏感程度不同而赋予不同的权重,从而得到该点的灰度值,公式表达为:
Gray=0.30*R+0.59*G+0.11*B;
滤波去噪:通过滤波方式对灰度图中的噪声进行去噪,使用某像素邻域内各点的灰度加权平均值来代替该像素原来的灰度值,得到加权均值滤波,邻域取为N*N的方形窗口,其降噪平滑后的图像表达为:
其中,S为点(x,y)领域内的点集,M为点集S的总点数,w(i,j)为权值;
图像增强:通过直方图均衡化进行图像增强,将原始图像的直方图通过积分概率密度函数转化为概率密度为1的图像,提高对比度;
尺寸归一化:将增强后的图像尺寸调整为224*224,满足卷积神经网络模型的训练要求。
3.根据权利要求1所述的一种基于数据增强的电力设备分合闸状态自动分类方法,其特征在于,通过AutoAugment法对预处理完成的数据进行数据增强的步骤包括:
使用增强学习从数据本身寻找最佳图像变换策略,对于不同的任务学习不同的增强方法,将寻找最佳数据增强策略的问题转为离散搜索问题,通过一个策略在给定用于训练神经网络的原始图像的条件下生成增强后的数据,具体做法为在搜索空间中,所述策略由三个子策略组成,对于小批量中的每一张图像,均匀地随机选取一个子策略生成一张变换后的图像训练神经网络,每个子策略由两个操作组成,每个操作都与两个数值相关联,所述两个数值分别为调用操作的概率和操作的幅度。
4.根据权利要求1所述的一种基于数据增强的电力设备分合闸状态自动分类方法,其特征在于,通过生成对抗样本的方式对增强数据进一步增强的步骤包括:
采用FGSM生成对抗样本数据,将所述数据加入到训练数据中,针对每个干净的小批量样本,通过所述方法生成与干净样本对抗的样本;核心为使输入图像x∈Rm向类别置信度降低的方向移动,令x∈Rm为输入图像,y为输入x对应的类标签,η为模型参数,ε为步长,J(θ,x,y)为所选的超参数,ΔJx(θ,x,y)为训练神经网络的损失函数,θ为损失函数的偏导数,在当前值附近对损失函数线性化得到干扰的最大范数限制:
η=εSign(ΔJx(θ,x,y)),
通过求解下式得到对抗样本:
η在某个范围内随机取值,每一个训练数据附近的一个临域内可以保持识别正确。
5.根据权利要求1所述的一种基于数据增强的电力设备分合闸状态自动分类方法,其特征在于,通过增强完成的数据集进行神经网络模型对抗训练的步骤包括:
选取VGG19网络模型提取输入图片特征并分类,使用AdvProp增强型对抗训练方案获取干净样本和对抗样本的特征,将小批量干净样本、干净增强样本和小批量对抗样本送入VGG19网络,由于干净增强样本、对抗样本与原始干净样本的数据分布不匹配,通过VGG19网络减轻所述分布不匹配程度,通过辅助BN将干净样本和对抗样本的分布解耦进行学习,即对原始干净数据使用主BN生成干净样本损失函数,增强后干净数据和对抗样本分别使用辅助BN生成另外两个损失函数,最终目标为最小化三个损失函数之和更新网络参数,最终的损失函数为:
其中ε为对抗性的扰动,D为基础数据分布,L为损失函数,θ为网络参数,x为带有真实标签y的训练样本。
6.根据权利要求5所述的一种基于数据增强的电力设备分合闸状态自动分类方法,其特征在于,所述AdvProp训练算法的具体步骤为:
从数据集中采样mini-batch的干净输入xc和标签y;将数据通过辅助BN产生对抗输入xa;使用干净输入xc通过主BN计算损失函数Lc;使用对抗输入xa通过辅助BN计算损失函数La;最小化两种输入的损失函数之和La+Lc;
以上步骤为一个训练的step中完成的。
7.根据权利要求1所述的一种基于数据增强的电力设备分合闸状态自动分类方法,其特征在于,通过测试数据评估训练完成的模型性能的步骤包括:
输入一张测试用分合闸图像,归一化到224*224,通过训练好的VGG19图像分类模型判断该图像中电力设备的开关处于分闸状态还是合闸状态。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110548238.8A CN113326873B (zh) | 2021-05-19 | 2021-05-19 | 一种基于数据增强的电力设备分合闸状态自动分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110548238.8A CN113326873B (zh) | 2021-05-19 | 2021-05-19 | 一种基于数据增强的电力设备分合闸状态自动分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113326873A true CN113326873A (zh) | 2021-08-31 |
CN113326873B CN113326873B (zh) | 2024-07-23 |
Family
ID=77416067
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110548238.8A Active CN113326873B (zh) | 2021-05-19 | 2021-05-19 | 一种基于数据增强的电力设备分合闸状态自动分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113326873B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114119363A (zh) * | 2021-10-15 | 2022-03-01 | 北京百度网讯科技有限公司 | 数据增广方法、装置、电子设备及存储介质 |
CN117132978A (zh) * | 2023-10-27 | 2023-11-28 | 深圳市敏视睿行智能科技有限公司 | 一种微生物图像识别系统及方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018028255A1 (zh) * | 2016-08-11 | 2018-02-15 | 深圳市未来媒体技术研究院 | 基于对抗网络的图像显著性检测方法 |
CN109800754A (zh) * | 2018-12-06 | 2019-05-24 | 杭州电子科技大学 | 一种基于卷积神经网络的古字体分类方法 |
WO2019109771A1 (zh) * | 2017-12-05 | 2019-06-13 | 南京南瑞信息通信科技有限公司 | 基于多核异构并行计算的电力人工智能视觉分析系统 |
CN110287800A (zh) * | 2019-05-29 | 2019-09-27 | 河海大学 | 一种基于sgse-gan的遥感图像场景分类方法 |
CN111507378A (zh) * | 2020-03-24 | 2020-08-07 | 华为技术有限公司 | 训练图像处理模型的方法和装置 |
CN111600835A (zh) * | 2020-03-18 | 2020-08-28 | 宁波送变电建设有限公司永耀科技分公司 | 一种基于fgsm对抗攻击算法的检测与防御方法 |
US20200380366A1 (en) * | 2018-06-12 | 2020-12-03 | Shenzhen Institutes Of Advanced Technology Chinese Academy Of Sciences | Enhanced generative adversarial network and target sample recognition method |
CN112258415A (zh) * | 2020-10-27 | 2021-01-22 | 浙江工业大学 | 一种基于生成对抗网络的胸部x光片超分辨率和去噪方法 |
-
2021
- 2021-05-19 CN CN202110548238.8A patent/CN113326873B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018028255A1 (zh) * | 2016-08-11 | 2018-02-15 | 深圳市未来媒体技术研究院 | 基于对抗网络的图像显著性检测方法 |
WO2019109771A1 (zh) * | 2017-12-05 | 2019-06-13 | 南京南瑞信息通信科技有限公司 | 基于多核异构并行计算的电力人工智能视觉分析系统 |
US20200380366A1 (en) * | 2018-06-12 | 2020-12-03 | Shenzhen Institutes Of Advanced Technology Chinese Academy Of Sciences | Enhanced generative adversarial network and target sample recognition method |
CN109800754A (zh) * | 2018-12-06 | 2019-05-24 | 杭州电子科技大学 | 一种基于卷积神经网络的古字体分类方法 |
CN110287800A (zh) * | 2019-05-29 | 2019-09-27 | 河海大学 | 一种基于sgse-gan的遥感图像场景分类方法 |
CN111600835A (zh) * | 2020-03-18 | 2020-08-28 | 宁波送变电建设有限公司永耀科技分公司 | 一种基于fgsm对抗攻击算法的检测与防御方法 |
CN111507378A (zh) * | 2020-03-24 | 2020-08-07 | 华为技术有限公司 | 训练图像处理模型的方法和装置 |
CN112258415A (zh) * | 2020-10-27 | 2021-01-22 | 浙江工业大学 | 一种基于生成对抗网络的胸部x光片超分辨率和去噪方法 |
Non-Patent Citations (1)
Title |
---|
许笑;陈奕君;冯诗羽;谢理哲;曹玖新;胡轶宁;: "基于冗余信息压缩的深度学习对抗样本防御方案", 网络空间安全, no. 08, pages 15 - 20 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114119363A (zh) * | 2021-10-15 | 2022-03-01 | 北京百度网讯科技有限公司 | 数据增广方法、装置、电子设备及存储介质 |
CN117132978A (zh) * | 2023-10-27 | 2023-11-28 | 深圳市敏视睿行智能科技有限公司 | 一种微生物图像识别系统及方法 |
CN117132978B (zh) * | 2023-10-27 | 2024-02-20 | 深圳市敏视睿行智能科技有限公司 | 一种微生物图像识别系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113326873B (zh) | 2024-07-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108765373B (zh) | 一种基于集成分类器在线学习的绝缘子异常自动检测方法 | |
CN110598736B (zh) | 一种电力设备红外图像故障定位、识别与预测方法 | |
CN107133943B (zh) | 一种防震锤缺陷检测的视觉检测方法 | |
CN110827251B (zh) | 一种基于航拍图像的输电线路锁紧销缺陷检测方法 | |
CN107944396B (zh) | 一种基于改进深度学习的刀闸状态识别方法 | |
CN112199993B (zh) | 基于人工智能识别任意方向变电站绝缘子红外图像检测模型的方法 | |
CN112183788A (zh) | 一种域自适应设备运检系统和方法 | |
CN112001260A (zh) | 一种基于红外可见光图像融合的电缆沟故障检测方法 | |
CN113344475B (zh) | 基于序列模态分解的变压器套管缺陷识别方法及系统 | |
CN109829916A (zh) | 一种基于cnn的变压器故障诊断方法 | |
CN113326873B (zh) | 一种基于数据增强的电力设备分合闸状态自动分类方法 | |
Chen et al. | Surface defect detection of electric power equipment in substation based on improved YOLOv4 algorithm | |
CN112070104A (zh) | 主变压器局部放电识别方法 | |
CN114529839A (zh) | 一种面向无人机巡检的输电线金具异常检测方法及系统 | |
CN116523881A (zh) | 一种电力设备异常温度检测方法及装置 | |
Niu et al. | Electrical equipment identification method with synthetic data using edge-oriented generative adversarial network | |
Lu et al. | Thermal Fault Diagnosis of Electrical Equipment in Substations Based on Image Fusion. | |
CN112419243B (zh) | 一种基于红外图像分析的配电房设备故障识别方法 | |
CN116485802B (zh) | 一种绝缘子闪络缺陷检测方法、装置、设备及存储介质 | |
CN114581407B (zh) | 一种光伏模块的自适应缺陷检测方法 | |
Liu et al. | Monitoring of Composite Insulators in Transmission Lines: A Hydrophobicity Diagnostic Method Using Aerial Images and Residual Neural Networks | |
Zhang et al. | ECF-STPM: A robust crack detection method for railway catenary components | |
Rongrong et al. | Fault diagnosis method of distribution equipment based on hybrid model of robot and deep learning | |
CN116127302A (zh) | 基于改进AlexNet算法的电动汽车充电装置故障电弧识别方法 | |
CN112861670B (zh) | 一种输电线路金具检测方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |