CN115221233A - 基于深度学习的变电站多类带电检测数据异常检测方法 - Google Patents

基于深度学习的变电站多类带电检测数据异常检测方法 Download PDF

Info

Publication number
CN115221233A
CN115221233A CN202211148833.3A CN202211148833A CN115221233A CN 115221233 A CN115221233 A CN 115221233A CN 202211148833 A CN202211148833 A CN 202211148833A CN 115221233 A CN115221233 A CN 115221233A
Authority
CN
China
Prior art keywords
data
abnormal
transformer substation
lstm
deep learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211148833.3A
Other languages
English (en)
Inventor
陈雨楠
王少荣
郭瑶
杨有行
何曦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huazhong University of Science and Technology
Original Assignee
Huazhong University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huazhong University of Science and Technology filed Critical Huazhong University of Science and Technology
Priority to CN202211148833.3A priority Critical patent/CN115221233A/zh
Publication of CN115221233A publication Critical patent/CN115221233A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明属于电力数据分析技术领域,提供一种基于深度学习的变电站多类带电检测数据异常检测方法,包括以下步骤:建立变电站多类带电检测数据的变电站运检数据库;对变电站运检数据库中的数据进行数据清洗、数据集成、数据融合等预处理;利用基于密度聚类算法和深度学习算法相结合的异常数据识别方法,对变电站运检数据库中结构化数据的异常数据进行检测;利用基于深度学习算法和改进生成对抗网络相结合的异常目标识别方法,对变电站运检数据库中非结构化数据的异常目标进行检测。本发明通过上述技术手段,充分考虑了实际变电站运检过程中监测数据的时序性和规律性,实现变电站多类带电检测数据的异常数据检测和异常目标检测。

Description

基于深度学习的变电站多类带电检测数据异常检测方法
技术领域
本发明属于电力数据分析技术领域,具体涉及一种基于深度学习的变电站多类带电检测数据异常检测方法。
背景技术
在电力系统规模不断扩大以及电气设备复杂度日益提升的当下,电网安全运行正在不断接收新的考验。如何提高设备的运行可靠性以保障电力系统的安全稳定,已经成为电力行业备受关注的研究课题。对电力设备而言,通过检测异常值能够发现电力系统运行过程中的异常情况,及时补救和抢修,保障电力设备设施的正常运转。因此检测变电站运维巡检产生的数据中的异常值,对电网安全有着十分重要的意义。
变电站运维巡检产生的数据以爆炸式方式增长,在状态检修、动态分析工作日益常态化的同时,信息分析不全面、实时性不强、异常检测有漏洞等问题日益突出。面对海量增长的电力数据,传统的状态分析、异常检测方法已无法满足变电站运维巡检的数据分析需求,亟需一套面向变电站运维巡检的异常检测方法以实现电力数据的融合分析和价值挖掘。
发明内容
本发明的目的就是为了克服上述现有技术的不足,提供一种基于深度学习的变电站多类带电检测数据异常检测方法。该方法基于神经网络中的深度学习,将通过变电站传感器网络预处理后的结构化数据与非结构化数据分别进行数据挖掘,结合密度聚类算法、卷积神经网络、长短时记忆网络、生成性对抗网络等方法实现对异常数据、异常目标的检测,保障电力设备设施的正常运转,保证电力系统的稳定运行。
本发明的目的是通过以下技术措施实现的。
一种基于深度学习的变电站多类带电检测数据异常检测方法,包括以下步骤:
建立变电站多类带电检测数据的变电站运检数据库,所述变电站运检数据库包括由监测变压器、隔离开关、断路器、避雷器、电容器等多种状态监控装置和电能计量单元、超高频传感器、SF6传感器等直接获得电能数据和环境数据的在线监测设备获得的文本类结构化数据,以及由机器人巡检所获得的图像类非结构化数据。
对变电站运检数据库中的数据进行数据清洗、数据集成、数据融合等预处理后,将数据暂存于变电站运检数据库中。
利用基于密度聚类算法和深度学习算法相结合的异常数据识别方法,对变电站运检数据库中结构化数据的异常数据进行检测。
利用基于深度学习算法和生成对抗网络相结合的异常目标识别方法,对变电站运检数据库中非结构化数据的异常目标进行检测。
进一步地,“利用基于密度聚类算法和深度学习算法相结合的异常数据识别方法”中密度聚类算法为DBSCAN算法,深度学习算法为LSTM长短时记忆网络,即采用LSTM-DBSCAN结合的方法,应用聚类算法DBSCAN进行异常数据初始识别,选取深度学习算法LSTM网络实现对结构化数据中时序相关数据的准确预测和异常数据检测。
进一步地,所述“应用聚类算法DBSCAN进行异常数据初始识别”是将数据预处理得到DBSCAN所需的数据格式后,选取合适的参数半径和领域点阈值,根据DBSCAN的数据聚类得到一组簇和离群点,实现正常数据和异常数据的自动划分。
进一步地,所述“选取深度学习算法LSTM网络实现对结构化数据中时序相关数据的准确预测和异常数据检测”是利用训练过的深度学习算法LSTM网络,将由DBSCAN算法标记为异常的数据作为输入,利用前n个实测数据对下一个数据进行预测,最后对LSTM长短时记忆网络所得到的预测值作为准确值,设置上下浮动的阈值,将预测值序列和与预测值序列对应的实测值序列进行对比判断,如果实测值超出了由预测值确定的阈值范围,则视为异常数据,继续往前预测,直至序列数据运行结束。
进一步地,“基于深度学习算法和生成对抗网络相结合的异常目标识别方法”中深度学习算法为LSTM长短时记忆神经网络,生成对抗网络指GANomaly改进生成性对抗网络,即采用LSTM-GANomaly结合的方法,由生成器和鉴别器组成GANomaly生成对抗网络。生成器主要由一个编码器-解码器-编码器网络构成,在生成器中学习由原图映射的重建图和由原图编码映射的重建图的编码两个映射关系,将输入图像映射为低维向量,再重建出生成的输出图像,鉴别器由一个编码器网络构成,将生成器生成的图像映射为用潜在向量表示。
由于变电站异常数据检测需要与历史数据、数据趋势等结合对比分析,有较强时序性,为了充分提取时序数据的特征,将LSTM长短时记忆神经网络层加入GANomaly模型的生成器和鉴别器中。
进一步地,LSTM-GANomaly的异常检测实现过程为:用正常的数据样本作为学习样本训练模型,判断经过编码器-解码器-编码器网络后获得的潜在向量和仅经历一次编码器得到的潜在向量差距是否大于某一阈值,由于正常数据通过编码-解码-编码和仅一次编码得到的两个潜在向量差距不大,而异常数据得到的两个潜在向量存在较大差距,因此当两次编码得到的潜在向量差距大于一定阈值时,可判定为该数据为异常数据。
在训练阶段,使用只包含正常样本的训练集;在测试阶段,为了验证异常数据在经 过编码器-解码器-编码器网络后获得的潜在向量和仅经历一次编码器得到的潜在向量形 成较大差距时,模型能将输入图像判断为异常图像,GANomaly通过对单个子网络进行优化 的损失函数共同确定目标损失函数。其中目标损失函数由三个损失函数,也即对抗损失函 数
Figure 22244DEST_PATH_IMAGE001
、重构误差损失函数
Figure 18013DEST_PATH_IMAGE002
和编码器损失函数
Figure 797750DEST_PATH_IMAGE003
组合形成,每一个损失函数都对单个 子网络进行优化。
在测试阶段,对于给定测试图像
Figure 989697DEST_PATH_IMAGE004
,LSTM-GANomaly模型由测量输入图像和生成 图像之间的上下文相似性的重建分数
Figure 348609DEST_PATH_IMAGE005
、测量输入图像和生成图像之间的差异的潜在表 示分数
Figure 967810DEST_PATH_IMAGE006
以及加权参数
Figure 234843DEST_PATH_IMAGE007
的调控下共同确定给定图像异常得分
Figure 981213DEST_PATH_IMAGE008
Figure 650092DEST_PATH_IMAGE009
进一步地,应用特征缩放
Figure 440193DEST_PATH_IMAGE010
将异常分数约束在[0,1]的概率 范围内。
通过召回率和精确度计算均衡分数,根据均衡分数的最大值确定测试数据集异常 的阈值
Figure 725681DEST_PATH_IMAGE011
,对于输入图像
Figure 462693DEST_PATH_IMAGE012
,如果
Figure 799128DEST_PATH_IMAGE013
则判定为异常数据,如果
Figure 494551DEST_PATH_IMAGE014
则认为输入图像 为正常数据。
本发明方法依据人工智能技术,首先构建变电站多类带电检测数据的变电站运检数据库,包括由多种状态监控装置和在线监测设备产生的结构化数据和由巡检机器人获得的图像组成的非结构化数据;针对数据库中的数据进行预处理,包括数据清洗、数据集成、数据融合;针对结构化数据,利用基于密度聚类算法和深度学习算法相结合的异常数据识别方法,实现变电站运检数据库中结构化数据的异常数据检测;针对非结构化数据,利用基于深度学习算法和生成对抗网络相结合的异常目标识别方法,实现变电站运检数据库中非结构化数据的异常目标检测。本发明通过上述技术手段,实现变电站多类带电检测数据的异常数据检测和异常目标检测。
本发明变电站多类带电检测数据异常检测方法,与现有技术相比,其有益效果如下:
1.该方法利用LSTM-DBSCAN结合应用于结构化数据的异常检测,提出融合算法,应用聚类算法进行异常数据初始识别,选取LSTM网络实现对结构化数据中时序相关数据的准确预测和异常数据检测。该方法充分考虑了实际变电站运检过程中监测数据的时序性和规律性,实现异常数据的分层次准确识别。同时避免了传统方法人工特征提取容易发生信息丢失的问题,具有很好的识别效果和实际应用价值。
2.该方法利用LSTM-GANomaly结合应用于非结构化数据的异常检测,GANomaly是一种被验证的用于图像异常检测效果很好的算法模型,内部结构为卷积层只能提取空间信息,本方法将卷积层改为更擅长提取时序特征的长短时神经网络层应用于变电站非结构化数据异常检测中,充分提取数据在时间序列上的特征,有效提高了变电站运检过程中非结构化数据异常目标的检测精度和效果。
附图说明
图1为本发明变电站多类带电检测数据异常检测方法整体实施流程图。
图2为本发明结构化异常数据检测模型LSTM-DBSCAN的整体流程图。
图3为本发明结构化异常数据检测模型中的DBSCAN算法流程图。
图4为本发明结构化异常数据检测模型中的LSTM预测模型结构图。
图5为本发明非结构化异常目标检测模型中的GANomaly网络整体架构图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步的详细说明,以便于理解本发明的上述技术方案。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
本发明实施例提供了一种基于深度学习的变电站多类带电检测数据异常检测方法,整体实施流程如图1所示,具体包括以下步骤:
S1,建立由变电站多类带电检测数据构成的变电站运检数据库,包括由监测变压器、隔离开关、断路器、避雷器、电容器等多种状态监控装置和电能计量单元、超高频传感器、SF6传感器等直接获得电能数据和环境数据的在线监测设备获得的文本类结构化数据,以及由机器人巡检所获得的图像类非结构化数据。
进一步地,步骤S1中所述结构化数据指的是传感器网络中由监测变压器、隔离开关、断路器、避雷器、电容器等多种状态监控装置和电能计量单元、超高频传感器、SF6传感器等直接获得电能数据和环境数据的在线监测设备产生的数据。结构化数据的特征是高度组织和整齐格式化,可以放入电子表格进行储存,能够用统一的数据结构进行表示,如数字、符号等。
进一步地,步骤S1中所述非结构化数据指的是传感器网络中由巡检机器人获得的图像类数据。其不符合任何预定义的模型,存储在非关系数据库中,比较难以轻易地被组织或格式化。
S2,将变电站运检数据库中的数据进行数据清洗、数据集成、数据融合等预处理后,将数据暂存于变电站运检数据库中。
S3,利用基于密度聚类算法和深度学习算法相结合的异常数据识别方法,对变电站运检数据库中结构化数据的异常数据进行检测。所述异常数据识别方法流程图如图2所示。
进一步地,步骤S3中“利用基于密度聚类算法和深度学习算法相结合的异常数据识别方法”,密度聚类算法为DBSCAN算法,深度学习算法为LSTM长短时记忆网络。
具体步骤为:
S3.1,对输入的数据进行分析和基础处理,得到DBSCAN所需的数据格式。
S3.2,利用DBSCAN算法自动划分正常数据和异常数据的标签,即对一年的数据以天为单位进行密度聚类,得到其中的离群点,即包含一天所有的时序采样点的异常数据点。
进一步地,针对S3.2 “利用DBSCAN算法自动划分正常数据和异常数据的标签,得到其中的离群点” 实现过程为:首先由自定义输入参数半径(Eps)以此确定圆形邻域范围,一般半径选取k-距离曲线突变的值,然后输入邻域点阈值(MinPts),确定邻域范围,最后根据数据聚类得到一组簇及其离群点。步骤S3.2所述DBSCAN算法流程图如图3所示。
具体包括以下步骤:
S3.2.1,读取文件,并对文件进行解析,变为符合算法的格式。
S3.2.2,利用欧式距离计算各个样本点间的欧几里德距离。
S3.2.3,计算每个样本点的k-距离,并输出排序后的距离。
S3.2.4,利用图形展示排序距离,标出变化最大的点,即拐点,为确定半径做参考。
S3.2.5,选取合适半径Eps。
S3.2.6,利用半径和领域点阈值找到所有核心点,建立核心点邻域点与他们映射的集合,即所有在最小半径范围内的点并入核心点映射集合。
S3.2.7,找到密度可达的核心点,并入集合,对于不可达的点即为异常点。
S3.2.8,将密度相连的核心点及邻域点放到起,形成一个簇。
S3.2.9,改变半径Eps,使用DBSCAN算法聚类得到的一组簇及离群点,观察对比聚类效果。
进一步地,所述DBSCAN聚类的算法流程具体为:
输入:样本集
Figure 267335DEST_PATH_IMAGE015
,邻域参数(ϵ,MinPts),样本距离度量方式
输出:簇划分C
(1)初始化核心对象集合
Figure 808038DEST_PATH_IMAGE016
,初始化聚类簇数k=0,初始化未访问样本集合
Figure 982667DEST_PATH_IMAGE017
,簇划分
Figure 317834DEST_PATH_IMAGE018
(2)对于
Figure 594225DEST_PATH_IMAGE019
,按下面的步骤找出所有的核心对象:
a) 通过距离度量方式,找到样本
Figure 673040DEST_PATH_IMAGE020
的ϵ-邻域子样本集
Figure 967755DEST_PATH_IMAGE021
b) 如果子样本集样本个数满足
Figure 289801DEST_PATH_IMAGE022
,将样本
Figure 240440DEST_PATH_IMAGE023
加入核心对象样本集 合:
Figure 919683DEST_PATH_IMAGE024
(3)如果核心对象集合
Figure 272167DEST_PATH_IMAGE016
,则算法结束,否则转入步骤(4);
(4)在核心对象集合
Figure 11453DEST_PATH_IMAGE025
中,随机选择一个核心对象
Figure 449387DEST_PATH_IMAGE026
,初始化当前簇核心对象队列
Figure 151895DEST_PATH_IMAGE027
,初始化类别序号
Figure 421203DEST_PATH_IMAGE028
,初始化当前簇样本集合
Figure 534652DEST_PATH_IMAGE029
,更新未访问样本集 合
Figure 256620DEST_PATH_IMAGE030
(5)如果当前簇核心对象队列
Figure 762819DEST_PATH_IMAGE031
,则当前聚类簇
Figure 89895DEST_PATH_IMAGE032
生成完毕,更新簇划分
Figure 905405DEST_PATH_IMAGE033
,更新核心对象集合
Figure 317931DEST_PATH_IMAGE034
,转入步骤(3)。否则更新核心对象集 合
Figure 408247DEST_PATH_IMAGE034
(6)在当前簇核心对象队列
Figure 589830DEST_PATH_IMAGE035
中取出一个核心对象
Figure 61394DEST_PATH_IMAGE036
,通过邻域距离阈值ϵ找出 所有的ϵ-邻域子样本集
Figure 757954DEST_PATH_IMAGE037
,令
Figure 324065DEST_PATH_IMAGE038
,更新当前簇样本集合
Figure 422471DEST_PATH_IMAGE039
,更 新未访问样本集合
Figure 62006DEST_PATH_IMAGE040
,更新
Figure 714704DEST_PATH_IMAGE041
,转入步骤(5);
输出结果为:簇划分
Figure 615664DEST_PATH_IMAGE042
S3.3,构建长短时记忆神经网络LSTM,将所述S3.2中输出的异常数据作为LSTM的时序输入,考虑到一天中的采样点个数s(s取96),具体设置LSTM的最优输入神经元个数为n(n取10),设置最优输出神经元个数为 1,即不断利用前10个序列数据输入LSTM,预测下一个序列数据。
S3.4,在处理过程中,将LSTM的预测值作为准确值,设置上下浮动的阈值,对准确值的序列数据对应的实测值进行判断,若实测值超出以准确值为基准确定的阈值范围,则视为异常值,继续往前预测,直至序列数据运行结束。
进一步地,步骤S3.3和S3.4中所述LSTM预测模型结构如图4所示,具体结构为:
设置输入的时间序列长度为10,输入维度设置为1,输出维度设置为1,构建6层预测模型。其中第1层为LSTM层,对模型进行学习和训练,第2层为Dropout层,在训练过程中控制指定数量的神经元随机停止学习,以此增强网络模型的泛化能力,防止模型在学习过程中陷入过拟合。第3层与第4层作用与第1层和第2层相同,4层模型共同构成多层LSTM 模型。模型第5层为全连接层,将训练结果进行降维得出特征向量。第6层为激活函数,通过激活函数后输出最终的预测结果。
S3.5,输出异常值及其所在序列位置,保存数据信息。
S4,利用基于深度学习算法和生成对抗网络相结合的异常目标识别方法,对变电站运检数据库中非结构化数据的异常目标进行检测。
进一步地,步骤S4中所述“基于深度学习算法和生成对抗网络相结合的异常目标识别方法”具体指的是采用LSTM长短期记忆神经网络和GANomaly改进生成性对抗网络相结合的方法实现变电站巡检图像异常目标检测。具体步骤为:
S4.1,针对部分图像由于采集因素影响产生的高光现象,对出现所述高光的图像进行对比度调整以最大化图像包含的有效信息。
Figure 506260DEST_PATH_IMAGE043
Figure 100052DEST_PATH_IMAGE044
其中,
Figure 708888DEST_PATH_IMAGE045
为输出像素,
Figure 429851DEST_PATH_IMAGE046
为图像的平均像素,
Figure 237270DEST_PATH_IMAGE047
为图像大小,
Figure 205226DEST_PATH_IMAGE048
为-1到1之间的调 整范围参数。
S4.2,构建基于LSTM的GANomaly生成对抗网络异常检测模型。LSTM-GANomaly模型由生成器和鉴别器组成。GANomaly中的生成器主要以一个编码器-解码器-编码器网络构成,学习原图映射重建图和原图的编码映射重建图的两个映射关系,降低输入图像映射的维度,再重建生成输出图像;鉴别器由一个编码器网络构成,将生成器生成的图像映射到潜在向量表示。GANomaly网络整体架构如图5所示。
进一步地,步骤S4.2中“基于LSTM的GANomaly生成对抗网络异常检测模型”构建具体步骤如下所示:
S4.2.1,设计基于LSTM的编码器-解码器-编码器的生成器。生成器中的编码器(ENC1)是使用的3层长短期记忆网络来提取变电站巡检的非结构化数据在时序上的特征;接着连接了3层全连接层(FC)来提取时序数据的潜在特征向量;在每层的全连接层之后会有正则标准化(BN)和ReLU激活函数,正则标准化和激活函数是为了优化中间层输出的分布,使网络学习更加高效,同时能够高效率的提高LSTM-GANomaly模型的非线性拟合能力。解码器(DEC)结构与编码器(ENC1)结构对称,二号编码器(ENC1)与一号编码器(ENC1)结构相同。基于LSTM-GANomaly的非结构化数据异常检测编码器结构下表所示:
Figure 848828DEST_PATH_IMAGE049
S4.2.2,设计基于编码器的判别器。网络一共7层,前三层为长短时记忆神经网络层,提取数据时序特征,后接三层全连接层,将提取到的时序特征进行整合之后分类。最后一层的全连接层使用Sigmoid函数作为激活函数,保证输出范围在0到1之间,解决二分类问题。基于LSTM-GANomaly的非结构化数据异常检测鉴别器结构如下表所示:
Figure 91590DEST_PATH_IMAGE050
S4.3,根据对单个子网络进行优化的损失函数共同确定目标损失函数。
进一步地,步骤S4.3所述“根据对单个子网络进行优化的损失函数共同确定目标 损失函数”是指目标损失函数由三个损失函数,也即对抗损失函数
Figure 956778DEST_PATH_IMAGE051
、重构误差损失函数
Figure 157952DEST_PATH_IMAGE052
和编码器损失函数
Figure 741380DEST_PATH_IMAGE053
组合形成,每一个损失函数都对单个子网络进行优化。具体步骤 如下:
S4.3.1,计算对抗损失函数
Figure 538566DEST_PATH_IMAGE051
,定义函数
Figure 523840DEST_PATH_IMAGE054
,从输入数据分布中提取给定输入
Figure 630336DEST_PATH_IMAGE055
,输出鉴别器D的某个中间层,使用特征匹配计算原始图像和生成图像的特征之间的距离来 进行图像特征层的优化。
Figure 232219DEST_PATH_IMAGE056
其中,
Figure 551204DEST_PATH_IMAGE055
为满足
Figure 398507DEST_PATH_IMAGE057
分布的向量;E表示期望。
S4.3.2,计算重构误差损失函数
Figure 675905DEST_PATH_IMAGE058
,在像素层面减小生成网络中输入图像和生 成图像间的距离,对输入图像和生成图像间的距离进行衡量并对生成网络的更新加以约 束,帮助生成网络学习到输入图像的上下文信息。
Figure 968346DEST_PATH_IMAGE059
S4.3.3,计算编码器损失函数
Figure 622181DEST_PATH_IMAGE053
,LSTM-GANomaly模型的第二部分编码器网络 E 编码重构图像
Figure 316467DEST_PATH_IMAGE060
得到的潜在向量
Figure 249920DEST_PATH_IMAGE061
,对于正常样本,期望编码器网络Enc2生成的潜在向量
Figure 357553DEST_PATH_IMAGE061
与原始图像由Enc1编码得到的潜在向量
Figure 752762DEST_PATH_IMAGE062
之间的距离尽可能小。反之,对于异常样本,期 望两个潜在向量
Figure 98293DEST_PATH_IMAGE062
Figure 202646DEST_PATH_IMAGE061
的距离尽可能大。引入额外的编码器损失
Figure 469679DEST_PATH_IMAGE053
来最小化两者间的距 离。
Figure 730896DEST_PATH_IMAGE063
S4.3.4,计算总体损失函数
Figure 399775DEST_PATH_IMAGE064
Figure 189877DEST_PATH_IMAGE065
其中,
Figure 944206DEST_PATH_IMAGE066
是调整总体目标函数中单个损失分量优势的加权参数。
S4.4,定义图像异常得分计算公式。对于给定的测试图像
Figure 228688DEST_PATH_IMAGE067
,图像异常得分计算式 为:
Figure 548811DEST_PATH_IMAGE068
其中,
Figure 978655DEST_PATH_IMAGE069
是指测量输入图像和生成图像之间的上下文相似性的重建分数,即误 差损失函数
Figure 499242DEST_PATH_IMAGE070
Figure 836682DEST_PATH_IMAGE071
表示测量输入图像和生成图像之间的差异的潜在表示分数,即编码 器损失函数
Figure 480153DEST_PATH_IMAGE072
Figure 612057DEST_PATH_IMAGE073
是控制得分函数相对重要性的加权参数。
将异常分数
Figure 340979DEST_PATH_IMAGE074
在[0,1]的概率范围内进行标度,单个测试样本
Figure 232843DEST_PATH_IMAGE075
的更新异常分数公 式为:
Figure 730820DEST_PATH_IMAGE076
在测试阶段,给LSTM-GANomaly模型设置一个阈值
Figure 33625DEST_PATH_IMAGE077
,对于一幅输入图像
Figure 249843DEST_PATH_IMAGE078
,如果
Figure 679819DEST_PATH_IMAGE079
则判定为异常数据,如果
Figure 829040DEST_PATH_IMAGE080
则认为输入图像为正常数据。
S4.5,根据召回率和精确度确定的均衡分数最大值确定测试数据集异常的阈值
Figure 833905DEST_PATH_IMAGE077
进一步地,步骤S4.5“根据召回率和精确度确定的均衡分数最大值”的具体计算步骤如下:
S4.5.1,计算召回率
Figure 553731DEST_PATH_IMAGE081
Figure 649381DEST_PATH_IMAGE082
其中,
Figure 918689DEST_PATH_IMAGE083
表示被模型预测为正类的正样本数量,
Figure 766559DEST_PATH_IMAGE084
表示被模型预测为负类的正 样本数量。
S4.5.2,计算精确率
Figure 239260DEST_PATH_IMAGE085
Figure 791464DEST_PATH_IMAGE086
其中,
Figure 666010DEST_PATH_IMAGE087
表示被模型预测为正类的负样本数量。
S4.5.3,计算均衡分数
Figure 747099DEST_PATH_IMAGE088
值:
Figure 707095DEST_PATH_IMAGE089
Figure 735094DEST_PATH_IMAGE088
Figure 916677DEST_PATH_IMAGE090
Figure 434246DEST_PATH_IMAGE091
的加权调和平均。
S4.5.4,选择均衡分数
Figure 599648DEST_PATH_IMAGE088
最大的阈值作为测试数据集使用的阈值
Figure 710299DEST_PATH_IMAGE077
S4.6,完成异常图片和正常图片的分类,结束非结构化数据的异常检测。
本说明书中未作详细描述的内容,属于本专业技术人员公知的现有技术。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改﹑等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (4)

1.基于深度学习的变电站多类带电检测数据异常检测方法,其特征在于,包括以下步骤:
建立变电站多类带电检测数据的变电站运检数据库,所述变电站运检数据库中包括由传感器监测变电站设备所获得的文本类结构化数据,以及由机器人巡检所获得的图像类非结构化数据;
对变电站运检数据库中的数据进行数据清洗、数据集成、数据融合预处理;
利用基于密度聚类算法和深度学习算法相结合的异常数据识别方法,对变电站运检数据库中结构化数据的异常数据进行检测;
利用基于深度学习算法和生成对抗网络相结合的异常目标识别方法,对变电站运检数据库中非结构化数据的异常目标进行检测。
2.根据权利要求1所述的基于深度学习的变电站多类带电检测数据异常检测方法,其特征在于:所述结构化数据包括传感器网络中由监测变压器、隔离开关、断路器、避雷器、电容器多种状态监控装置和电能计量单元、超高频传感器、SF6传感器直接获得电能数据和环境数据的在线监测设备获得的文本类结构化数据,所述非结构化数据包括传感器网络中由巡检机器人获得的图像类数据。
3.根据权利要求1所述的基于深度学习的变电站多类带电检测数据异常检测方法,其特征在于:所述基于密度聚类算法和深度学习算法相结合的异常数据识别方法中密度聚类算法为DBSCAN算法,深度学习算法为LSTM长短时记忆网络,即采用LSTM-DBSCAN结合的方法,应用聚类算法DBSCAN进行异常数据初始识别,选取深度学习算法LSTM网络实现对结构化数据中时序相关数据的准确预测和异常数据检测;具体步骤为:
对输入的数据进行分析和基础处理,得到DBSCAN所需的数据格式;
利用DBSCAN算法自动划分正常数据和异常数据的标签,即对一年的数据以天为单位进行密度聚类,得到其中的离群点,即包含一天所有的时序采样点的异常数据点;
将输出的异常数据作为LSTM的时序输入,构建长短时记忆神经网络LSTM,根据一天中的采样点个数s,设置LSTM的最优输入神经元个数为n,设置最优输出神经元个数为1,即不断利用前n个序列数据输入LSTM,预测下一个序列数据;
将LSTM的预测值作为准确值,设置上下浮动的阈值,将预测值序列和与预测值序列对应的实测值序列进行对比判断,如果实测值超出了由预测值确定的阈值范围,则视为异常数据,继续往前预测,直至序列数据运行结束;
输出异常值及其所在序列位置,保存数据信息。
4.根据权利要求1所述的基于深度学习的变电站多类带电检测数据异常检测方法,其特征在于:所述基于深度学习算法和生成对抗网络相结合的异常目标识别方法中深度学习算法为LSTM长短时记忆神经网络,生成对抗网络为GANomaly改进生成性对抗网络,即采用LSTM-GANomaly结合的方法,实现变电站运检数据库中非结构化异常目标识别;具体步骤为:
对巡检机器人收集的图像进行预处理;
构建基于LSTM的GANomaly生成对抗网络异常检测模型,LSTM-GANomaly模型由生成器和鉴别器组成,GANomaly中的生成器由一个编码器-解码器-编码器网络构成,在生成器中学习由原图映射的重建图和由原图编码映射的重建图的编码两个映射关系,将输入图像映射为低维向量,再重建出生成的输出图像,鉴别器由一个编码器网络构成,将生成器生成的图像映射为用潜在向量表示;
将LSTM长短时记忆神经网络层加入GANomaly模型的生成器和鉴别器中;
对于给定测试图像
Figure 545834DEST_PATH_IMAGE001
,LSTM-GANomaly模型由测量输入图像和生成图像之间的上下文相 似性的重建分数
Figure 181083DEST_PATH_IMAGE002
、测量输入图像和生成图像之间差异的潜在表示分数
Figure 164083DEST_PATH_IMAGE003
以及加权参 数
Figure 559292DEST_PATH_IMAGE004
的调控下共同确定给定图像异常得分
Figure 576927DEST_PATH_IMAGE005
Figure 399389DEST_PATH_IMAGE006
应用特征缩放
Figure 635066DEST_PATH_IMAGE007
将异常分数约束在[0,1]的概率范围内;
通过召回率和精确度计算均衡分数,根据均衡分数的最大值确定测试数据集异常的阈 值
Figure 37228DEST_PATH_IMAGE008
,对于输入图像
Figure 706107DEST_PATH_IMAGE009
,如果
Figure 902733DEST_PATH_IMAGE010
则判定为异常数据,如果
Figure 640751DEST_PATH_IMAGE011
则认为输入图像为 正常数据;
完成异常图片和正常图片的分类,结束非结构化数据的异常目标检测。
CN202211148833.3A 2022-09-21 2022-09-21 基于深度学习的变电站多类带电检测数据异常检测方法 Pending CN115221233A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211148833.3A CN115221233A (zh) 2022-09-21 2022-09-21 基于深度学习的变电站多类带电检测数据异常检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211148833.3A CN115221233A (zh) 2022-09-21 2022-09-21 基于深度学习的变电站多类带电检测数据异常检测方法

Publications (1)

Publication Number Publication Date
CN115221233A true CN115221233A (zh) 2022-10-21

Family

ID=83616965

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211148833.3A Pending CN115221233A (zh) 2022-09-21 2022-09-21 基于深度学习的变电站多类带电检测数据异常检测方法

Country Status (1)

Country Link
CN (1) CN115221233A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116846060A (zh) * 2023-03-08 2023-10-03 国网江苏省电力有限公司淮安供电分公司 Iec61850智能变电站工况安全学习系统
CN117630758A (zh) * 2024-01-24 2024-03-01 国能大渡河检修安装有限公司 发电站变压器健康状态监测方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112115769A (zh) * 2020-08-05 2020-12-22 西安交通大学 一种基于视频的无监督稀疏人群异常行为检测算法
CN113240011A (zh) * 2021-05-14 2021-08-10 烟台海颐软件股份有限公司 一种深度学习驱动的异常识别与修复方法及智能化系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112115769A (zh) * 2020-08-05 2020-12-22 西安交通大学 一种基于视频的无监督稀疏人群异常行为检测算法
CN113240011A (zh) * 2021-05-14 2021-08-10 烟台海颐软件股份有限公司 一种深度学习驱动的异常识别与修复方法及智能化系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
周嘉琪: ""基于深度学习的光伏逆变器异常检测系统的研究与实现"", 《中国优秀博硕士学位论文全文数据库(硕士) 工程科技Ⅱ辑》 *
徐京京: ""基于聚类和神经网络的异常数据识别算法研究"", 《中国优秀博硕士学位论文全文数据库(硕士) 工程科技Ⅱ辑》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116846060A (zh) * 2023-03-08 2023-10-03 国网江苏省电力有限公司淮安供电分公司 Iec61850智能变电站工况安全学习系统
CN117630758A (zh) * 2024-01-24 2024-03-01 国能大渡河检修安装有限公司 发电站变压器健康状态监测方法及系统
CN117630758B (zh) * 2024-01-24 2024-05-03 国能大渡河检修安装有限公司 发电站变压器健康状态监测方法及系统

Similar Documents

Publication Publication Date Title
US11921566B2 (en) Abnormality detection system, abnormality detection method, abnormality detection program, and method for generating learned model
CN111210024A (zh) 模型训练方法、装置、计算机设备和存储介质
CN115221233A (zh) 基于深度学习的变电站多类带电检测数据异常检测方法
Wang et al. Transient stability evaluation model based on SSDAE with imbalanced correction
CN115455746B (zh) 一种核动力装置运行监测数据异常检测与校正一体化方法
CN115905959A (zh) 基于缺陷因子的电力断路器关联性故障分析方法及装置
CN113758652B (zh) 换流变压器漏油检测方法、装置、计算机设备和存储介质
CN117407770A (zh) 基于神经网络的高压开关柜故障模式分类及预测方法
Liu et al. An anomaly detection method based on double encoder–decoder generative adversarial networks
CN116861232A (zh) 基于dbn-ocsvm的空气质量数据异常检测模型
CN115684786A (zh) 基于格拉姆角场和并行cnn的逆变器开关管健康诊断方法、装置及系统
Mei et al. A data‐driven approach to state assessment of the converter valve based on oversampling and Shapley additive explanations
CN116359773A (zh) 一种锂离子电池剩余寿命预测方法及系统
Li et al. A fault diagnosis system based on case decision technology for uav inspection of power lines
CN116415485A (zh) 一种基于动态分布自适应的多源域迁移学习的剩余使用寿命预测方法
CN110045691A (zh) 一种多源异构大数据的多任务处理故障监测方法
CN115293249A (zh) 一种基于动态时序预测的电力系统典型场景概率预测方法
Zheng et al. Application based on artificial intelligence in substation operation and maintenance management
Xing et al. Multimodal Mutual Neural Network for Health Assessment of Power Transformer
CN114818827A (zh) 基于seq2point网络的非侵入式负荷分解方法
Liu et al. Component detection for power line inspection using a graph-based relation guiding network
Sadeghi et al. Intelligent estimation of critical current degradation in HTS tapes under repetitive overcurrent cycling for cryo-electric transportation applications
Lin Intelligent Fault Diagnosis of Consumer Electronics Sensor in IoE via Transformer
Bin et al. Simple and effective fault diagnosis method of power lithium-ion battery based on GWA-DBN
Lin et al. A Concept Drift Detection Method for Electricity Forecasting Based on Adaptive Window and Transformer

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20221021

RJ01 Rejection of invention patent application after publication