CN115169465A - 变压器数据异常检测方法、装置、设备、介质和产品 - Google Patents

变压器数据异常检测方法、装置、设备、介质和产品 Download PDF

Info

Publication number
CN115169465A
CN115169465A CN202210831778.1A CN202210831778A CN115169465A CN 115169465 A CN115169465 A CN 115169465A CN 202210831778 A CN202210831778 A CN 202210831778A CN 115169465 A CN115169465 A CN 115169465A
Authority
CN
China
Prior art keywords
data
state data
target
transformer
initial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202210831778.1A
Other languages
English (en)
Inventor
孟令雯
张锐锋
唐赛秋
冯义
张庆伟
王宇
辛明勇
席光辉
汪明媚
刘斌
郭思琪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Electric Power Research Institute of Guizhou Power Grid Co Ltd
Original Assignee
Electric Power Research Institute of Guizhou Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Electric Power Research Institute of Guizhou Power Grid Co Ltd filed Critical Electric Power Research Institute of Guizhou Power Grid Co Ltd
Priority to CN202210831778.1A priority Critical patent/CN115169465A/zh
Publication of CN115169465A publication Critical patent/CN115169465A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Biophysics (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Water Supply & Treatment (AREA)
  • Public Health (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Primary Health Care (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

本申请涉及一种变压器数据异常检测方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:首先获取待处理变压器状态数据,并根据目标模型对获取的待处理变压器状态数据进行特征提取得到目标特征信息,然后获取初始聚类中心,并根据初始聚类中心对目标特征信息进行聚类得到目标聚类中心,最后根据目标聚类中心对目标特征信息进行异常检测,以确定与目标特征信息对应的待处理变压器状态数据是否为异常数据。本方法从待处理变压器状态数据中提取目标特征信息能够提高异常数据检测效率。

Description

变压器数据异常检测方法、装置、设备、介质和产品
技术领域
本申请涉及电力系统技术领域,特别是涉及一种变压器数据异常检测方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术
随着智能变电站建设的不断完善,其产生和储存的数据不断增多,经常出现数据丢失和数据突变等数据异常现象。变压器作为智能变电站不可或缺的设备,也经常出现数据异常的情况。为了提高数据质量、保证变电站正常运行,需要对变压器进行数据异常检测。
目前,常用的变压器数据异常检测方法是基于神经网络的数据异常检测方法和基于模糊理论与聚类分析的数据异常检测方法。基于神经网络的数据异常检测方法在网络训练过程、训练样本以及样本代表性具有很强的依赖性,且神经网络中阈值的选取通常具有很强的主观性;而基于模糊理论与聚类分析的数据异常检测方法虽然可以避免神经网络对样本的依赖性,但是聚类点坐标及目标函数均不是连续分布的,导致存在许多局部极值,影响检测效果。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高异常数据检测效率的变压器数据异常检测方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
第一方面,本申请提供了一种变压器数据异常检测方法,所述方法包括:
获取待处理变压器状态数据;
根据目标模型对所述待处理变压器状态数据进行特征提取得到目标特征信息;
获取初始聚类中心;
根据所述初始聚类中心对所述目标特征信息进行聚类得到目标聚类中心;
根据所述目标聚类中心对所述目标特征信息进行异常检测,以确定与所述目标特征信息对应的所述待处理变压器状态数据是否为异常数据。
在其中一个实施例中,所述获取待处理变压器状态数据,包括:
获取初始变压器状态数据;
对所述初始变压器状态数据进行预处理得到待处理变压器状态数据,所述预处理包括根据互信息对所述初始变压器状态数据进行数据筛选。
在其中一个实施例中,所述根据互信息对所述初始变压器状态数据进行数据筛选,包括:
获取所述初始变压器状态数据对应的互信息的值;
当所述互信息的值小于预设阈值时,则删除所述互信息对应的所述初始变压器状态数据;
当所述互信息的值大于或等于所述预设阈值时,则保留所述互信息对应的所述初始变压器状态数据。
在其中一个实施例中,所述根据目标模型对所述待处理变压器状态数据进行特征提取得到目标特征信息之前,还包括:
获取样本变压器状态数据以及初始模型;
通过粒子群算法以及所述样本变压器状态数据确定所述初始模型中隐含层特征的数量;
根据所述隐含层特征的数量以及所述初始模型确定目标模型。
在其中一个实施例中,所述获取初始聚类中心之前,包括:
通过所述目标模型对所述样本变压器状态数据进行特征提取得到样本特征信息;
根据所述样本特征信息进行聚类计算确定初始聚类中心。
在其中一个实施例中,所述根据所述目标聚类中心对所述目标特征信息进行异常检测,以确定与所述目标特征信息对应的所述待处理变压器状态数据是否为异常数据,包括:
确定所述目标特征信息所对应的目标聚类中心;
计算所述目标特征信息与所述目标聚类中心之间的距离;
当所述距离大于或等于预设值时,则确定与所述目标特征信息对应的所述待处理变压器状态数据为异常数据;
当所述距离小于预设值时,则确定与所述目标特征信息对应的所述待处理变压器状态数据为正常数据。
第二方面,本申请还提供了一种变压器数据异常检测装置,所述装置包括:
第一获取模块,用于获取待处理变压器状态数据;
特征提取模块,用于根据目标模型对所述待处理变压器状态数据进行特征提取得到目标特征信息;
第二获取模块,用于获取初始聚类中心;
聚类模块,用于根据所述初始聚类中心对所述目标特征信息进行聚类得到目标聚类中心;
检测模块,用于根据所述目标聚类中心对所述目标特征信息进行异常检测,以确定与所述目标特征信息对应的所述待处理变压器状态数据是否为异常数据。
第三方面,本申请还提供了一种计算机设备,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述的任意一个实施例中的方法的步骤。
第四方面,本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的任意一个实施例中的方法的步骤。
第五方面,本申请还提供了一种计算机程序产品,所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述的任意一个实施例中的方法的步骤。
上述变压器数据异常检测方法、装置、计算机设备、存储介质和计算机程序产品,首先获取待处理变压器状态数据,并根据目标模型对获取的待处理变压器状态数据进行特征提取得到目标特征信息,然后获取初始聚类中心,并根据初始聚类中心对目标特征信息进行聚类得到目标聚类中心,最后根据目标聚类中心对目标特征信息进行异常检测,以确定与目标特征信息对应的待处理变压器状态数据是否为异常数据。本方法从待处理变压器状态数据中提取目标特征信息能够提高异常数据检测效率。
附图说明
图1为一个实施例中的变压器数据异常检测方法的流程示意图;
图2为一个实施例中的DBN结构示意图;
图3为一个实施例中的变压器数据异常分类图;
图4为一个实施例中的改进DBN的结构图;
图5为另一个实施例中的变压器数据异常检测流程图;
图6为一个实施例中的油温与各负荷之间的互信息值的示意图;
图7为一个实施例中的异常数据检测结果图;
图8为一个实施例中的变压器数据异常检测装置的结构框图;
图9为一个实施例中的计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在一个实施例中,如图1所示,提供了一种变压器数据异常检测方法,本实施例以该方法应用于终端进行举例说明,可以理解的是,该方法也可以应用于服务器,还可以应用于包括终端和服务器的系统,并通过终端和服务器的交互实现。本实施例中,该方法包括以下步骤:
S101、获取待处理变压器状态数据。
其中,待处理变压器状态数据可以是变压器的监测数据,也可以是对变压器的监测数据进行筛选后的数据,在此不做具体限定,例如,待处理变压器状态数据可以是变压器的油温数据、电压数据、电流数据以及负荷数据。
S102、根据目标模型对待处理变压器状态数据进行特征提取得到目标特征信息。
其中,目标模型可以是深度信念网络(Deep Belief Nets,DBN),DBN由多层受限玻尔兹曼机(Restricted Boltzmann Machines,RBM)组成,其中,每一个RBM包含一个可见层和一个隐含层,DBN结构图如图2所示。
目标特征信息是变压器状态数据中有价值的信息,例如变压器的设备故障信息和数据异常信息。
S103、获取初始聚类中心。
其中,初始聚类中心可以由目标模型对样本变压器状态数据进行处理后得到。
S104、根据初始聚类中心对目标特征信息进行聚类得到目标聚类中心。
其中,聚类的方法可以采用K-means算法,初始聚类中心是初始化的这个方法的聚类中心,然后通过执行K-means算法,对聚类中心进行更新,当达到预设的更新次数或者通过对比发现前后两次聚类中心未发生变化时,停止更新聚类中心,并将此时的聚类中心确定为目标聚类中心。
S105、根据目标聚类中心对目标特征信息进行异常检测,以确定与目标特征信息对应的待处理变压器状态数据是否为异常数据。
异常检测是指从待处理变压器状态数据中确定出异常数据,其中通过目标特征信息与目标聚类中心的偏移程度来进行异常检测,例如当目标特征信息与目标聚类中心的距离较大时,则认为目标特征对应的待处理变压器状态数据为异常数据,否则目标特征对应的待处理变压器状态数据为正常数据。
其中,变压器的数据异常情况包括数据缺失、数据不变、孤立噪声、短时有变、高噪声值以及数据突变,变压器数据异常分类图如图3所示。
本实施例提供的变压器数据异常检测方法,首先获取待处理变压器状态数据,并根据目标模型对获取的待处理变压器状态数据进行特征提取得到目标特征信息,然后获取初始聚类中心,并根据初始聚类中心对目标特征信息进行聚类得到目标聚类中心,最后根据目标聚类中心对目标特征信息进行异常检测,以确定与目标特征信息对应的待处理变压器状态数据是否为异常数据。本方法从待处理变压器状态数据中提取目标特征信息能够提高异常数据检测效率。
在一些实施例中,获取待处理变压器状态数据,包括:获取初始变压器状态数据;对初始变压器状态数据进行预处理得到待处理变压器状态数据,预处理包括根据互信息对初始变压器状态数据进行数据筛选。
本步骤中,初始变压器状态数据是由智能变电站二次系统中的终端获取的变压器监测数据。
具体的,在获取初始变压器状态数据之后,由终端将获取到的初始变压器状态数据进行归一化处理得到归一化数据,然后终端从归一化数据中选取一个标签变量,并计算标签变量与归一化数据中剩下的所有变量的互信息的值,最后根据互信息值对归一化数据进行筛选得到待处理变压器状态数据。其中,标签变量选取的是在实际工程经验中重要的变量;每一个变量包含一类变压器状态数据,例如,油温包含变压器状态数据中所有的油温数据,负荷包含变压器状态数据中所有的变压器负荷数据。
归一化公式为:
Figure BDA0003748719430000061
式中,R*表示归一化数据矩阵,R表示初始变压器状态数据矩阵,Rmin表示每一个变量中最小的数据构成的矩阵,Rmax表示每一个变量中最大的数据构成的矩阵。
若选取的标签变量为U,归一化数据中某一个变量为V,当变量U和V为离散型随机变量时,U和V的互信息为:
Figure BDA0003748719430000062
式中,互信息值I(U,V)的大小范围为[0,1],p(u,v)为U、V的联合概率分布,p(u)和p(v)为U、V的边缘概率分布函数。
当变量U和V为连续性随机变量时,则U和V的互信息为:
Figure BDA0003748719430000063
本实施例提供的方法,对初始变压器状态数据进行归一化处理,使所有数据都落到[0,1]的范围内,便于后续对于互信息的计算。
在一些实施例中,根据互信息对初始变压器状态数据进行数据筛选,包括:获取初始变压器状态数据对应的互信息的值;当互信息的值小于预设阈值时,则删除互信息对应的初始变压器状态数据;当互信息的值大于或等于预设阈值时,则保留互信息对应的初始变压器状态数据。
本步骤中,终端根据实际工程经验设置预设阈值,例如,预设阈值为0.5。
由终端判断变量与标签变量的互信息的值I(U,V)是否大于阈值δ,并对相应变量进行处理。具体的,若I(U,V)<δ,则去除相应变量,若I(U,V)≥δ,则保留相应变量,其中,保留的所有变量中的数据就是待处理变压器状态数据。
终端还可以对互信息的值划分层次,以判断变量与标签标量之间的关联程度,例如,可以将互信息的值划分为
Figure BDA0003748719430000071
以及
Figure BDA0003748719430000072
三个层次,当
Figure BDA0003748719430000073
时,变量与标签标量为弱相关,当
Figure BDA0003748719430000074
时,变量与标签标量为中等相关,当
Figure BDA0003748719430000075
时,变量与标签标量为强相关。
本实施例提供的方法,利用互信息原理捕捉两个变量之间的关联程度,并保留关联程度比较高的待处理变压器状态数据,不仅能够减少数据量,减轻后续模型的训练压力,更能够有力的保证数据处理准确性、高效性以及有效性,为后续多元异常数据检测提供支撑。
在一些实施例中,根据目标模型对待处理变压器状态数据进行特征提取得到目标特征信息之前,还包括:获取样本变压器状态数据以及初始模型;通过粒子群算法以及样本变压器状态数据确定初始模型中隐含层特征的数量;根据隐含层特征的数量以及初始模型确定目标模型。
本步骤中,样本变压器状态数据是由智能变电站二次系统中的终端获取的变压器监测数据,其中,样本变压器状态数据和初始变压器状态数据来源于同一变电站。在获取到样本变压器状态数据之后,终端对样本变压器状态数据进行和初始变压器状态数据同样的归一化处理和数据筛选过程得到筛选后的样本变压器状态数据,然后通过粒子群算法(Particle Swarm Optimization,PSO)以及筛选后的样本变压器状态数据确定初始模型中隐含层特征的数量。目标模型即由初始模型以及初始模型中隐含层特征的数量构成。
初始模型为改进DBN,其中,改进DBN的第一层为高斯-伯努利受限玻尔兹曼机(Gauss-Bernoulli restricted Boltzmann machine,GB-RBM),剩下所有层均为RBM,改进DBN的结构图如图4所示。
GB-RBM的能量函数为:
Figure BDA0003748719430000081
式中,σi为高斯分布的方差,v=(v1,v2,…,vm)T、a=(a1,a2,…,am)T为可见层的状态向量与偏置向量,h=(h1,h2,…,hn)T、b=(b1,b2,…,bn)T为隐含层的状态向量与偏置向量;m为可见层特征的个数,n为隐含层特征的个数;θ={ωij,ai,bj}为RBM的训练参数,ω为连接v和h的权值,ωij∈Rm×n
根据能量函数可得,可见层与隐含层之间的条件概率为:
Figure BDA0003748719430000082
Figure BDA0003748719430000083
式中,
Figure BDA0003748719430000084
为sigmoid函数,N(μ,σi 2)为高斯函数,其均值为μ,方差为σi 2
通过粒子群算法确定初始模型中隐含层特征的数量的步骤如下:确定粒子数和最大迭代次数;随机设定每个粒子初始位置、初始速度以及粒子范围;更新粒子的速度、位置以及粒子的适应度函数值;每一个粒子的当前适应度函数值与它经历最好位置的适应度函数值相比较,如果该粒子的当前适应度函数值大于它经历最好位置的适应度函数值,则将该粒子的当前位置和当前适应度函数值更新为最好位置和最好位置对应的适应度函数值;每个粒子的最好位置的适应度函数值和粒子群最好位置的适应度函数值相比较,如果该粒子的最好位置的适应度函数值大于粒子群最好位置的适应度函数值,则将该粒子的最好位置和最好位置的适应度函数值更新为整个粒子群的最好位置和最好位置对应的适应度函数值;更新每一个粒子的速度和位置;判断是否达到最大迭代次数,若达到最大迭代次数,则输出对应的隐含层节点个数,若未达到最大迭代次数,则继续更新粒子的速度、位置以及粒子的适应度函数值。
其中,粒子更新自身速度和位置的公式如下:
vi(t+1)=ωvi(t)+c1×r1×(pi-xi)+c2×r2×(g-xi)
xi(t+1)=xi+vi(t+1)
式中,xi表示第i个粒子在n维空间的位置,xi=(xi1,xi2,…,xin),速度为vi=(vi1,vi2,…,vin);pi表示第i个粒子在n维空间中的最好位置,pi=(pi1,pi2,…,pin);g表示整个粒子群经历过的最好位置,g=(g1,g2,…,gn);t为迭代次数;ω为惯性权重系数;c1、c2为学习因子;r1、r2为均匀分布在[0,1]之间的随机数。
适应度函数为:
f(x)=1/dmax(xi,zi)
式中,dmax(xi,zi)是一点xi与另一点zi之间的最大欧式距离,欧氏距离计算公式为:
Figure BDA0003748719430000091
本实施例提供的方法,采用粒子群算法确定隐含层的特征个数,能够提高DBN的特征提取水平。
在一些实施例中,获取初始聚类中心之前,包括:通过目标模型对样本变压器状态数据进行特征提取得到样本特征信息;根据样本特征信息进行聚类计算确定初始聚类中心。
本步骤中,终端将筛选后的样本变压器状态数据输入目标模型中得到样本特征信息X,X={x1,x2,…,xn},然后采用K-means算法对样本特征信息进行聚类得到初始聚类中心。K-means算法的具体步骤如下:
终端根据实际工程经验确定聚类簇个数k(k≤n),并将聚类簇个数k确定为聚类中心的个数,然后从样本特征信息中随机选择k个数据作为样本聚类中心,用zi(i=1,2,…,k)表示样本聚类中心,并用si(i=1,2,…,k)表示聚类簇。针对样本特征信息中每个样本数据xi,终端计算它到所有样本聚类中心的欧式距离,并将该样本数据分到欧式距离最小的聚类中心所属的聚类簇上,然后计算该聚类簇上包括样本聚类中心在内的所有数据的算数平均值得到新的聚类中心,并判断此时标准测度函数是否收敛,若标准测度函数收敛,则将此时的聚类中心作为该聚类簇的初始聚类中心,若标准测度函数不收敛,则继续利用上述方法计算新的聚类中心。
其中,根据算数平均值计算聚类中心的公式为:
Figure BDA0003748719430000101
式中,Ni为第i个聚类簇中的数据个数。
标准测度函数计算公式为:
Figure BDA0003748719430000102
式中,J是样本特征信息中所有数据的均方差之和。
本实施例提供的方法,利用改进的DBN作为目标模型来提取样本特征信息,使输入目标模型的数据不局限于二项分布,能够避免数据丢失;并且采用原理简单的K-means算法计算聚类中心,更容易实现。
在一些实施例中,根据目标聚类中心对目标特征信息进行异常检测,以确定与目标特征信息对应的待处理变压器状态数据是否为异常数据,包括:确定目标特征信息所对应的目标聚类中心;计算目标特征信息与目标聚类中心之间的距离;当距离大于或等于预设值时,则确定与目标特征信息对应的待处理变压器状态数据为异常数据;当距离小于预设值时,则确定与目标特征信息对应的待处理变压器状态数据为正常数据。
本步骤中,终端利用初始聚类中心和目标特征信息,并结合K-means算法得到k个目标聚类中心。预设值是根据实际工程经验确定的。
本实施例提供的方法,利用数据与目标聚类中心的距离是否大于预设值,能够有效地判断数据点是否异常。
在一个实施例中,如图5所示,图5为本申请实施例提供的一种变压器数据异常检测流程图。终端从智能变电站二次系统中获取变压器监测数据,并将其分为两组,其中一组经过人工清洗,得到正常数据集,其他为异常数据集;针对正常数据集,终端根据变压器与变电站的运维要求,选取一个标签变量,并设置阈值,计算其他变量与标签变量的互信息的值,根据阈值,去除弱相关变量,保留强相关变量,减小模型的计算压力;终端搭建多层的DBN,其中第一层为高斯-伯努利受限玻尔兹曼机,将保留的强相关变量作为改进DBN的输入,得到DBN中各层隐含层节点个数以及提取的特征向量,并运用K-means算法将特征向量进行聚类,得到正常数据集的聚类簇个数k、聚类中心以及数据点到聚类中心的距离;针对异常数据集,终端根据由正常数据集得到的隐含层节点个数、聚类中心,并结合多层DBN和K-means算法,判断异常数据集中的数据点到聚类中心的距离是否大于阈值,若数据点不属于任何聚类簇或者距离大于阈值,则该点为异常数据点;终端比较异常数据点与邻近的其他时刻数据点情况,根据图3对异常数据点进行分类。
在一个实施例中,使用的电力变压器数据集包含变压器负荷数据以及油温数据,其中变压器负荷数据包括高有效负载(High UseFul Load,HUFL)、高无用负载(HighUseLess Load,HULL)、中有效负载(Middle UseFul Load,MUFL)、中无用负载(MiddleUseLess Load,MULL)、低有效负载(Low UseFul Load,LUFL)、低无用负载(Low UseLessLoad,LULL)。在此数据集中选取19000组数据作为实验数据,得到一个19000×7的数据矩阵,将实验数据分为两个数据集,即正常数据集与异常数据集,其中,将前9500组数据经过人工挑选与清洗后,得到正常数据集,将后9500组数据作为异常数据集,并投放60组异常数据到异常数据集中。
运用互信息原理对正常数据集中的数据进行关联度分析。将油温作为标签变量,剩余6个变量为比较变量,建立分析矩阵。根据变压器的数据特点以及运行特征,并且结合专家的意见,设置互信息值在[0,0.4]为弱相关,互信息值在[0.4,0.7]为中等相关,互信息值在[0.7,1]为强相关。图6为油温与各负荷之间的互信息值的示意图,根据图6所示,HULL、MULL、以及LULL为弱相关,则去除这3个变量。
由于隐含层的数量到达4以上时,模型的提取能力下降,所以实验建立4层神经网络;为克服传统的受限玻尔兹曼机导致数据丢失的问题,将DBN的第一层使用高斯-伯努利受限玻尔兹曼机,其他三层使用传统的受限玻尔兹曼机;设置权值学习率为0.01,可见节点的偏置学习率为0.02,隐含节点的偏置学习率为0.01,并且初始化权重;建立粒子群算法优化模型,并且设置最大迭代次数为L=10,粒子数为N=10,适应度函数为聚类点到聚类中心的距离,即f(x)=1/dmax(xi,xj)。
选取HUFL、MUFL、LUFL以及油温四个变量作为输入矩阵,并且将输入矩阵归一化,得到各个隐含层个数为405-70-308-2;将特征提取后的数据矩阵,输入到K-means算法中,经过多次聚类,最后当聚类簇的个数k为3时,聚类效果最好,其中三个聚类中心为(0.014050,0.016 412)、(0.014 051,0.016 413)、(0.014 052,0.016 414),以及聚类点到各自聚类中心的最大距离分别为2.496×10-6、2.944×10-6以及1.184×10-6,其3个数据集所占的比例为35%、21%以及44%。
针对异常数据集的9560组数据,利用本申请构建的数据异常模型进行检测。设置DBN的隐含层节点个数为405-70-308-2,将正常数据集的聚类中心作为异常数据集的初始聚类中心,将聚类点到各自聚类中心的最大距离作为判断异常点的依据,判断异常点共有87个,异常数据检测结果如图7所示。
在异常数据检测结果图中,主要存在以下类型的数据:
(1)在T=953、T=1 248等时间点,聚类中心的距离偏大,但周围时刻的数据均正常,则该数据点是孤立噪声点,可能因为传感器不稳定造成的,应该其数据点进行清洗,以免在后续的数据应用中造成影响。
(2)在T=2 500~2 956,一大段连续数据的异常,可以判断该数据点为高噪声值或者空缺值,推断可能传输设备由于受到环境的干扰导致工作不稳定。对比原始数据后,该处为数据空缺,可能是因为数据传输过程中,导致数据丢失。
(3)在T=7 200~7 210,异常数据检测图中,数据点与聚类中心的聚类保持不变,可以判断该时刻数据为短时不变,判断可能因为变压器异常导致。经过与原始数据对比,该数据保持不变。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的变压器数据异常检测方法的变压器数据异常检测装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个变压器数据异常检测装置实施例中的具体限定可以参见上文中对于变压器数据异常检测方法的限定,在此不再赘述。
在一个实施例中,如图8所示,提供了一种变压器数据异常检测装置800,包括:第一获取模块801、特征提取模块802、第二获取模块803、聚类模块804和检测模块805,其中:
第一获取模块801,用于获取待处理变压器状态数据;
特征提取模块802,用于根据目标模型对待处理变压器状态数据进行特征提取得到目标特征信息;
第二获取模块803,用于获取初始聚类中心;
聚类模块804,用于根据初始聚类中心对目标特征信息进行聚类得到目标聚类中心;
检测模块805,用于根据目标聚类中心对目标特征信息进行异常检测,以确定与目标特征信息对应的待处理变压器状态数据是否为异常数据。
在一个实施例中,第一获取模块801,包括:
获取单元,获取初始变压器状态数据。
预处理单元,对初始变压器状态数据进行预处理得到待处理变压器状态数据,预处理包括根据互信息对初始变压器状态数据进行数据筛选。
在一个实施例中,预处理单元具体用于:获取初始变压器状态数据对应的互信息的值;当互信息的值小于预设阈值时,则删除互信息对应的初始变压器状态数据;当互信息的值大于或等于预设阈值时,则保留互信息对应的初始变压器状态数据。
在一个实施例中,根据目标模型对待处理变压器状态数据进行特征提取得到目标特征信息之前,装置800用于:获取样本变压器状态数据以及初始模型;通过粒子群算法以及样本变压器状态数据确定初始模型中隐含层特征的数量;根据隐含层特征的数量以及初始模型确定目标模型。
在一个实施例中,获取初始聚类中心之前,装置800还用于:通过目标模型对样本变压器状态数据进行特征提取得到样本特征信息;根据样本特征信息进行聚类计算确定初始聚类中心。
在一个实施例中,检测模块805还用于:确定目标特征信息所对应的目标聚类中心;计算目标特征信息与目标聚类中心之间的距离;当距离大于或等于预设值时,则确定与目标特征信息对应的待处理变压器状态数据为异常数据;当距离小于预设值时,则确定与目标特征信息对应的待处理变压器状态数据为正常数据。
上述变压器数据异常检测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图9所示。该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、移动蜂窝网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种变压器数据异常检测方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图9中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:获取待处理变压器状态数据;根据目标模型对待处理变压器状态数据进行特征提取得到目标特征信息;获取初始聚类中心;根据初始聚类中心对目标特征信息进行聚类得到目标聚类中心;根据目标聚类中心对目标特征信息进行异常检测,以确定与目标特征信息对应的待处理变压器状态数据是否为异常数据。
在一个实施例中,处理器执行计算机程序时所实现的获取待处理变压器状态数据,包括:获取初始变压器状态数据;对初始变压器状态数据进行预处理得到待处理变压器状态数据,预处理包括根据互信息对初始变压器状态数据进行数据筛选。
在一个实施例中,处理器执行计算机程序时所实现的根据互信息对初始变压器状态数据进行数据筛选,包括:获取初始变压器状态数据对应的互信息的值;当互信息的值小于预设阈值时,则删除互信息对应的初始变压器状态数据;当互信息的值大于或等于预设阈值时,则保留互信息对应的初始变压器状态数据。
在一个实施例中,处理器执行计算机程序时所实现的根据目标模型对待处理变压器状态数据进行特征提取得到目标特征信息之前,还包括:获取样本变压器状态数据以及初始模型;通过粒子群算法以及样本变压器状态数据确定初始模型中隐含层特征的数量;根据隐含层特征的数量以及初始模型确定目标模型。
在一个实施例中,处理器执行计算机程序时所实现的获取初始聚类中心之前,包括:通过目标模型对样本变压器状态数据进行特征提取得到样本特征信息;根据样本特征信息进行聚类计算确定初始聚类中心。
在一个实施例中,处理器执行计算机程序时所实现的根据目标聚类中心对目标特征信息进行异常检测,以确定与目标特征信息对应的待处理变压器状态数据是否为异常数据,包括:确定目标特征信息所对应的目标聚类中心;计算目标特征信息与目标聚类中心之间的距离;当距离大于或等于预设值时,则确定与目标特征信息对应的待处理变压器状态数据为异常数据;当距离小于预设值时,则确定与目标特征信息对应的待处理变压器状态数据为正常数据。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:获取待处理变压器状态数据;根据目标模型对待处理变压器状态数据进行特征提取得到目标特征信息;获取初始聚类中心;根据初始聚类中心对目标特征信息进行聚类得到目标聚类中心;根据目标聚类中心对目标特征信息进行异常检测,以确定与目标特征信息对应的待处理变压器状态数据是否为异常数据。
在一个实施例中,计算机程序被处理器执行时所实现的获取待处理变压器状态数据,包括:获取初始变压器状态数据;对初始变压器状态数据进行预处理得到待处理变压器状态数据,预处理包括根据互信息对初始变压器状态数据进行数据筛选。
在一个实施例中,计算机程序被处理器执行时所实现的根据互信息对初始变压器状态数据进行数据筛选,包括:获取初始变压器状态数据对应的互信息的值;当互信息的值小于预设阈值时,则删除互信息对应的初始变压器状态数据;当互信息的值大于或等于预设阈值时,则保留互信息对应的初始变压器状态数据。
在一个实施例中,计算机程序被处理器执行时所实现的根据目标模型对待处理变压器状态数据进行特征提取得到目标特征信息之前,还包括:获取样本变压器状态数据以及初始模型;通过粒子群算法以及样本变压器状态数据确定初始模型中隐含层特征的数量;根据隐含层特征的数量以及初始模型确定目标模型。
在一个实施例中,计算机程序被处理器执行时所实现的获取初始聚类中心之前,包括:通过目标模型对样本变压器状态数据进行特征提取得到样本特征信息;根据样本特征信息进行聚类计算确定初始聚类中心。
在一个实施例中,计算机程序被处理器执行时所实现的根据目标聚类中心对目标特征信息进行异常检测,以确定与目标特征信息对应的待处理变压器状态数据是否为异常数据,包括:确定目标特征信息所对应的目标聚类中心;计算目标特征信息与目标聚类中心之间的距离;当距离大于或等于预设值时,则确定与目标特征信息对应的待处理变压器状态数据为异常数据;当距离小于预设值时,则确定与目标特征信息对应的待处理变压器状态数据为正常数据。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:获取待处理变压器状态数据;根据目标模型对所述待处理变压器状态数据进行特征提取得到目标特征信息;获取初始聚类中心;根据所述初始聚类中心对所述目标特征信息进行聚类得到目标聚类中心;根据所述目标聚类中心对所述目标特征信息进行异常检测,以确定与所述目标特征信息对应的所述待处理变压器状态数据是否为异常数据。
在一个实施例中,计算机程序被处理器执行时所实现的所述获取待处理变压器状态数据,包括:获取初始变压器状态数据;对所述初始变压器状态数据进行预处理得到待处理变压器状态数据,所述预处理包括根据互信息对所述初始变压器状态数据进行数据筛选。
在一个实施例中,计算机程序被处理器执行时所实现的所述根据互信息对所述初始变压器状态数据进行数据筛选,包括:获取所述初始变压器状态数据对应的互信息的值;当所述互信息的值小于预设阈值时,则删除所述互信息对应的所述初始变压器状态数据;当所述互信息的值大于或等于所述预设阈值时,则保留所述互信息对应的所述初始变压器状态数据。
在一个实施例中,计算机程序被处理器执行时所实现的所述根据目标模型对所述待处理变压器状态数据进行特征提取得到目标特征信息之前,还包括:获取样本变压器状态数据以及初始模型;通过粒子群算法以及所述样本变压器状态数据确定所述初始模型中隐含层特征的数量;根据所述隐含层特征的数量以及所述初始模型确定目标模型。
在一个实施例中,计算机程序被处理器执行时所实现的所述获取初始聚类中心之前,包括:通过所述目标模型对所述样本变压器状态数据进行特征提取得到样本特征信息;根据所述样本特征信息进行聚类计算确定初始聚类中心。
在一个实施例中,计算机程序被处理器执行时所实现的所述根据所述目标聚类中心对所述目标特征信息进行异常检测,以确定与所述目标特征信息对应的所述待处理变压器状态数据是否为异常数据,包括:确定所述目标特征信息所对应的目标聚类中心;计算所述目标特征信息与所述目标聚类中心之间的距离;当所述距离大于或等于预设值时,则确定与所述目标特征信息对应的所述待处理变压器状态数据为异常数据;当所述距离小于预设值时,则确定与所述目标特征信息对应的所述待处理变压器状态数据为正常数据。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。

Claims (10)

1.一种变压器数据异常检测方法,其特征在于,所述方法包括:
获取待处理变压器状态数据;
根据目标模型对所述待处理变压器状态数据进行特征提取得到目标特征信息;
获取初始聚类中心;
根据所述初始聚类中心对所述目标特征信息进行聚类得到目标聚类中心;
根据所述目标聚类中心对所述目标特征信息进行异常检测,以确定与所述目标特征信息对应的所述待处理变压器状态数据是否为异常数据。
2.根据权利要求1所述的方法,其特征在于,所述获取待处理变压器状态数据,包括:
获取初始变压器状态数据;
对所述初始变压器状态数据进行预处理得到待处理变压器状态数据,所述预处理包括根据互信息对所述初始变压器状态数据进行数据筛选。
3.根据权利要求2所述的方法,其特征在于,所述根据互信息对所述初始变压器状态数据进行数据筛选,包括:
获取所述初始变压器状态数据对应的互信息的值;
当所述互信息的值小于预设阈值时,则删除所述互信息对应的所述初始变压器状态数据;
当所述互信息的值大于或等于所述预设阈值时,则保留所述互信息对应的所述初始变压器状态数据。
4.根据权利要求1所述的方法,其特征在于,所述根据目标模型对所述待处理变压器状态数据进行特征提取得到目标特征信息之前,还包括:
获取样本变压器状态数据以及初始模型;
通过粒子群算法以及所述样本变压器状态数据确定所述初始模型中隐含层特征的数量;
根据所述隐含层特征的数量以及所述初始模型确定目标模型。
5.根据权利要求3所述的方法,其特征在于,所述获取初始聚类中心之前,包括:
通过所述目标模型对所述样本变压器状态数据进行特征提取得到样本特征信息;
根据所述样本特征信息进行聚类计算确定初始聚类中心。
6.根据权利要求1所述的方法,其特征在于,所述根据所述目标聚类中心对所述目标特征信息进行异常检测,以确定与所述目标特征信息对应的所述待处理变压器状态数据是否为异常数据,包括:
确定所述目标特征信息所对应的目标聚类中心;
计算所述目标特征信息与所述目标聚类中心之间的距离;
当所述距离大于或等于预设值时,则确定与所述目标特征信息对应的所述待处理变压器状态数据为异常数据;
当所述距离小于预设值时,则确定与所述目标特征信息对应的所述待处理变压器状态数据为正常数据。
7.一种变压器数据异常检测装置,其特征在于,所述装置包括:
第一获取模块,用于获取待处理变压器状态数据;
特征提取模块,用于根据目标模型对所述待处理变压器状态数据进行特征提取得到目标特征信息;
第二获取模块,用于获取初始聚类中心;
聚类模块,用于根据所述初始聚类中心对所述目标特征信息进行聚类得到目标聚类中心;
检测模块,用于根据所述目标聚类中心对所述目标特征信息进行异常检测,以确定与所述目标特征信息对应的所述待处理变压器状态数据是否为异常数据。
8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
10.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
CN202210831778.1A 2022-07-15 2022-07-15 变压器数据异常检测方法、装置、设备、介质和产品 Withdrawn CN115169465A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210831778.1A CN115169465A (zh) 2022-07-15 2022-07-15 变压器数据异常检测方法、装置、设备、介质和产品

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210831778.1A CN115169465A (zh) 2022-07-15 2022-07-15 变压器数据异常检测方法、装置、设备、介质和产品

Publications (1)

Publication Number Publication Date
CN115169465A true CN115169465A (zh) 2022-10-11

Family

ID=83495991

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210831778.1A Withdrawn CN115169465A (zh) 2022-07-15 2022-07-15 变压器数据异常检测方法、装置、设备、介质和产品

Country Status (1)

Country Link
CN (1) CN115169465A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117574291A (zh) * 2023-11-07 2024-02-20 广州恒沙数字科技有限公司 一种基于子空间簇的多维数据异常值识别方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117574291A (zh) * 2023-11-07 2024-02-20 广州恒沙数字科技有限公司 一种基于子空间簇的多维数据异常值识别方法及系统
CN117574291B (zh) * 2023-11-07 2024-06-28 广州恒沙数字科技有限公司 一种基于子空间簇的多维数据异常值识别方法及系统

Similar Documents

Publication Publication Date Title
Chen et al. Intrusion detection using multi-objective evolutionary convolutional neural network for Internet of Things in Fog computing
CN105224872B (zh) 一种基于神经网络聚类的用户异常行为检测方法
Du et al. GAN-based anomaly detection for multivariate time series using polluted training set
CN113139600A (zh) 基于联邦学习的智能电网设备异常检测方法和系统
CN106060008B (zh) 一种网络入侵异常检测方法
CN112966114A (zh) 基于对称图卷积神经网络的文献分类方法和装置
CN111914253A (zh) 一种入侵检测的方法、系统、设备及可读存储介质
He et al. MTAD‐TF: Multivariate Time Series Anomaly Detection Using the Combination of Temporal Pattern and Feature Pattern
CN110581840A (zh) 基于双层异质集成学习器的入侵检测方法
JP2023012406A (ja) 情報処理装置、情報処理方法及びプログラム
CN114841296A (zh) 设备聚类方法、终端设备以及存储介质
Wang et al. Unsupervised outlier detection for mixed-valued dataset based on the adaptive k-nearest neighbor global network
CN115169465A (zh) 变压器数据异常检测方法、装置、设备、介质和产品
Sheng et al. Network traffic anomaly detection method based on chaotic neural network
Perenda et al. Evolutionary optimization of residual neural network architectures for modulation classification
CN116545733A (zh) 一种电网入侵检测方法及系统
CN116524296A (zh) 设备缺陷检测模型的训练方法、装置和设备缺陷检测方法
CN116415989A (zh) 千兆潜在客户预测方法、装置、计算机设备及存储介质
Rossi et al. Relational similarity machines (RSM): A similarity-based learning framework for graphs
CN115577259A (zh) 高压直流输电系统故障选极方法、装置和计算机设备
Sindhu et al. Comparative analysis among decision tree vs. naive bayes for prediction of weather prognostication
CN115688873A (zh) 图数据处理方法、设备及计算机程序产品
Louhi et al. Incremental nearest neighborhood graph for data stream clustering
Ruz et al. NBSOM: The naive Bayes self-organizing map
João et al. Healthcare Outlier Detection with Hierarchical Self-Organizing Map

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20221011