CN112906288A - 基于正常样本数据的开关柜状态评估方法 - Google Patents

基于正常样本数据的开关柜状态评估方法 Download PDF

Info

Publication number
CN112906288A
CN112906288A CN202110008508.6A CN202110008508A CN112906288A CN 112906288 A CN112906288 A CN 112906288A CN 202110008508 A CN202110008508 A CN 202110008508A CN 112906288 A CN112906288 A CN 112906288A
Authority
CN
China
Prior art keywords
sample
data
state
model
evaluation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110008508.6A
Other languages
English (en)
Inventor
陈攀
徐菁
郑晓玲
范川
宋兆欧
周博文
钟臻
叶浩
向文平
林春江
邓阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shibei Power Supply Branch Of State Grid Chongqing Electric Power Co
Original Assignee
Shibei Power Supply Branch Of State Grid Chongqing Electric Power Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shibei Power Supply Branch Of State Grid Chongqing Electric Power Co filed Critical Shibei Power Supply Branch Of State Grid Chongqing Electric Power Co
Priority to CN202110008508.6A priority Critical patent/CN112906288A/zh
Publication of CN112906288A publication Critical patent/CN112906288A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02BBOARDS, SUBSTATIONS OR SWITCHING ARRANGEMENTS FOR THE SUPPLY OR DISTRIBUTION OF ELECTRIC POWER
    • H02B1/00Frameworks, boards, panels, desks, casings; Details of substations or switching arrangements
    • H02B1/26Casings; Parts thereof or accessories therefor
    • H02B1/30Cabinet-type casings; Parts thereof or accessories therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种基于正常样本数据的开关柜状态评估方法,属于电力设备状态评估领域,包括以下步骤:S1:采集传感器监测数据,构建样本数据集进行样本存储;S2:利用训练样本集构建数据重构模型;S3:构建异常状态识别模型,从而得到初始的状态评估模型;S4:对状态评估模型进行检测并调整,输出最终的状态评估模型;S5:运行所述状态评估模型,对开关柜进行状态评估;S6:采用并行计算更新所述状态评估模型,以月为单位,在串口通信运行间隙,获取样本数据集中已标记好的样本数据进行评估模型的重建。本发明可利用正常样本进行数据重构以及高斯模型的构建,有效识别开关柜异常运行状态并发出警告。

Description

基于正常样本数据的开关柜状态评估方法
技术领域
本发明属于电力设备状态评估领域,涉及一种基于正常样本数据的开关柜状态评估方法。
背景技术
开关柜是电网中最关键、最复杂的电力设备之一,它承担着开合、控制、保护正在发电、输电、配电以及电能转换装置的责任,在保证电网可靠、安全运行起到了至关重要的作用。因此,对开关柜状态进行实时在线评估,可提供有效的诊断信息,辅助工作人员做出更好的巡检、维护决策,保证开关柜稳定运行及电网安全,具有重要的理论意义和现实意义。现阶段,在开关柜状态评估中引入边缘计算,通过设置合理的异构传感器分布,可提高数据传达的效率,缓解云端数据处理压力,实现利用监测数据进行在线状态评估的快速响应。在实际运行条件下,影响开关柜健康状态的因素很多,并没有统一的判定标准,并且对变电站而言,传感器在线检测数据存在故障数据较少或者未标记的现象。在这样的条件下,依托于故障样本数据进行信息融合评估的开关柜状态评估方法很难应用于实际情况中。
状态评估是根据状态参量的特点和变化情况,对设备运行状态进行分析和判断。过去,开关柜状态评估主要从局部放电特征入手,国内外学者通过研究放电次数、放电幅值、放电相位等特征参数与不同放电程度之间的关系,进行开关柜的整体评估。近年来随着电力信息化的建设与推广,大量的设备运行数据得到了有效的采集与存储,基于信息融合方法的状态评估策略伴随着计算机云系统功能的完善得到了快速的发展与常态化。
目前,开关柜状态评估方法主要涉及智能算法的应用,包括模糊综合判别法、粗糙集理论、神经网络、支持向量机、证据理论和专家系统等。然而,一方面,大多数评估算法建模样本的选取来自离线检修数据。离线检修数据存在采集时间跨度大的问题,而开关柜的运行状况随着运行环境、实际工况的影响在不断的变化,因此评估模型的精度和针对性有待提高。另一方面,由于实际电网运行过程中,缺陷和故障属于小概率事件,对于现有变电站而言,故障样本数存在较少和无标记问题,现有的缺陷或者故障样本数据无法满足相应的智能算法对建模样本的需求,制约了评估结果的准确度和评估方法的实用性。
鉴于此,如何依靠正常样本数据,建立实时、准确的开关柜状态评估模型是本领域技术人员需要解决的技术问题。
发明内容
有鉴于此,本发明的目的在于针对在线评估过程中,故障样本缺失的问题,提出一种基于正常样本数据的开关柜状态评估方法,通过挖掘开关柜在线监测数据之间的内在联系,搭建基于大量正常样本数据的评估模型,并设置更新模块进行模型的实时更新,从而实现开关柜的在线评估技术。
为达到上述目的,本发明提供如下技术方案:
一种基于正常样本数据的开关柜状态评估方法,包括以下步骤:
S1:采集传感器监测数据,构建样本数据集进行样本存储;
S2:利用训练样本集构建数据重构模型;
S3:构建异常状态识别模型,从而得到初始的状态评估模型;
S4:对状态评估模型进行检测并调整,输出最终的状态评估模型;
S5:运行所述状态评估模型,对开关柜进行状态评估;
S6:采用并行计算更新所述状态评估模型,以月为单位,在串口通信运行间隙,获取样本数据集中已标记好的样本数据进行评估模型的重建。
进一步,所述步骤S1具体包括:
利用串口通信,实时获取传感器数据,构建样本数据集,根据时间先后对样本进行编号;
对开关柜的各个传感器的监测样本的时间进行识别,将同一时间不同状态特征,按照固定的状态特征顺序,整合到一个样本并对其进行编号;样本集中的样本表示为:X={xi (j)},其中,xi (j)表示为第j个状态特征的第i个样本,n为采集到的样本的总数,m为传感器监测到的状态特征数,i=1,2,…,n;j=1,2,...,m;
进行评估模型构建前,确定所获取的样本数据为正常样本数据,对样本数据进行状态标记,并按6:1的比例分为训练样本集和测试样本集;
在初始化过程中,从PMS2.0系统中获取少量故障样本数据,标注状态信息,添加至测试集,并仅标注作为测试集;
进一步,步骤S2中,在训练样本集输入数据重构模型之前对数据进行归一化处理:
Figure BDA0002884425720000021
其中,xi'表示第i个样本归一化数值(i=1,2,…,n),xi为第i个样本数据(i=1,2,…,n),Xμ为各特征状态的平均值,Xσ为各特征向量的标准差。
进一步,步骤S2具体包括:
利用深度网络结构的自动编码器,学习正常数据中的各状态参数间的相互关系以实现对监测数据的重构,通过分析重构误差、重构结果与原结果的相关性,来实现对开关柜运行状态的异常辨识;
所述自动编码器是在学习输入数据非线性特征表示的基础上尽可能的重构数据,所述自动编码器由编码器和解码器组成;
编码过程是将输入量映射至隐藏层,以获得输入层新的表达特征:
h=μ(W1·x+b1) (13)
式中,x∈Rn为n维输入变量;h∈Rd为d维隐含层特征表达;W1是d×n阶编码权值矩阵,b1为d阶的偏置向量;μ(·)函数为编码非线性sigmoid型传递函数;
解码过程是将隐藏层h映射为原输入,以获得输入的重构变量:
z=σ(W2·h+b2) (14)
式中,z∈Rn为n维重构变量;W1是n×d阶编码权值矩阵;b2为n阶的偏置向量;σ(·)函数为解码非线性sigmoid型传递函数;
自编码学习过程是以损失函数L(x,z)最小化为目标,即:
L(x,z)=||z-x||2 (15)
采用由多个自动编码器堆叠起来的深度网络结构的自动编码器进行数据重构,使其具有深层的非线性映射能力,获取特征参数的高阶表达;
深度网络的自动编码器由n个自动编码器组合而成,在编码阶段,第n-1个自动编码器的隐藏层是第n个自动编码器的输入层;在解码阶段,对第n,n-1,n-2…,1层进行解码;隐藏层节点数由高设置为低;
将归一化训练样本集输入编码层,在每一层编码层工作时,随机让神经网络部分节点不工作,以让神经网络模型去学习训练特征之间的普遍共性。
进一步,所述步骤S3具体包括:
将样本集XN归一化并输入数据重构模型后,将重构数据集数据逆归一化获得重构数据集ZN;对重构数据集ZN进行与原数据集XN的相关性分析,选取各样本的相关系数PX,X、平均绝对误差mae作为相关性评估指标值,计算公式如下:
Figure BDA0002884425720000031
式(5)中,Pzi,xi为第i个重构样本与原始样本的相关系数;xi为第i个样本;zi为第i个重构样本;m为样本集中状态特征总数;其中i=1,2,…,n;
Figure BDA0002884425720000041
式(6)中,maei是第i个重构样本与原始样本的平均绝对误差;xi (j)为第i个样本的第j个特征参数值;zi (j)为第i个样本的第j个特征的重构参数值;其中i=1,2,…,n,j=1,2,…,m;
Pzi,xi用于度量zi与xi之间的线性相关性,maei用于反映重构误差的实际情况,选用这两个相关性评估指标进行高斯模型的构建。
进一步,所述高斯模型构建包括:
对相关性评估指标集征建高斯分布模型,进行异常状态评估的相关性评估指标集为C={Ci},其中i=1,2,…,n,第i个样本的相关性评估指标集Ci={Pzi,xi,maei};
高斯分布的构建过程如式(8)-(10)所示:
Figure BDA0002884425720000042
Figure BDA0002884425720000043
Figure BDA0002884425720000044
其中,μj表示相关性评估指标集各维特征向量的平均值,δj表示相关性评估指标集各维向量方差的平方,p(x)表示高斯分布函数,ε为初始阈值;当p(x)<ε,为异常样本,否则,为正常样本。
进一步,步骤S4中,状态评估模型初始化后,输入测试样本进行检测,利用真阳率(TPR)和假阳率(FPR)作为评价指标,如式(10)、(11);
Figure BDA0002884425720000045
Figure BDA0002884425720000046
其中,TN表示正确地把良好状态的样本分类成正常样本的总数;TP表示实际是异常状态样本分类成异常样本的总数;FN表示错误地把异常状态的样本分类成正常样本的总数;FN表示错误地把正常状态的样本分类成异常样本的总数;
当真阳率达到97%及以上时,假阳率达到3%及以下则测试通过,状态评估模型构建完成;
若真阳率或假阳率未达到要求,则进行k次交叉验证,设置初始阈值为0.0025,将测试集中的正常样本和不正常样本按比例随机分为两部分,并整合成一个验证样本和一个测试样本;若真阳率过低,减小阈值;若假阳率过高,则增大阈值;若同时存在真阳率过低,假阳率过高,则选取劣化程度更多的那一方进行阈值改变;k次交叉验证后,最终确定阈值,输出最终的评估模型。
进一步,所述步骤S5中具体包括以下步骤:
用串口通信获取变电站日常运行监测值,形成样本xa保存于样本数据集中;
将监测数据xa={xa (j)},其中j=1,2,…,m,归一化处理,得到xa'={xa'(j)},其中j=1,2,…,m;
将归一化好的数据集输入构建好的评估模型进行状态评估;首先输入数据重构模型得到重构样本数据za={za (j)},其中,j=1,2,…,m;进行重构样本与原样本的相关性分析,输入高斯分布模型输出评估结果p(x);当监测样本的输出状态评估结果p(x)大于阈值,则为正常样本,否则为异常样本;将样本的评估结果返回样本数据集中,对样本进行状态标记;若样本xa评估结果为正常样本,则返回数据集对xa样本标注为0;若xa为异常样本,则返回数据集对xa标注为1;当为异常样本时,缩短串口通信获取监测值的时间;在一个连续时间段内,连续监测到异常样本,则此开关柜为异常运行状态,并发出警报,否则为系统的短暂干扰;若开关运行状态恢复正常,则恢复串口通信获取监测值的时间。
进一步,步骤S6具体包括:
将标记好的正常样本按照6:1分为训练集和测试集,并在测试集中加入样本数据集中已标记好的故障样本;重复状态评估模型的构建过程,进行状态评估模型的构建;将构建好的状态评估模型替换原状态评估模型,进行模型更新区域的初始化,更新区域暂停使用,等待下次运行。
本发明的有益效果在于:
针对变电站故障样本较少或者几乎为零以及故障样本无标记等现象,本发明可利用正常样本进行数据重构以及高斯模型的构建,有效识别开关柜异常运行状态并发出警告。
在阈值确定环节,本专利采用置信度确定初始阈值,并利用k交叉法进行阈值的确定,更有利于准确把握异常状态的识别边界。
开关柜异常状态识别过程中,具有灵活性,通过改变串口获取监测值的时间,以排除实际扰动带来的误差,提高状态评估的精度。
模型更新区域能够适应开关柜运行过程中,运行环境与工况的变化情况,提高开关柜状态评估模型的精度和针对性。
本装置算法模块具有较好的泛化能力和鲁棒性,算法模块可嵌套于其他电力设备的状态评估算法,便于后续的研究与开发。
本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书来实现和获得。
附图说明
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作优选的详细描述,其中:
图1为深度编码器网络结构图;
图2为异常样本评估过程图;
图3为阈值交叉验证循环图;
图4为本发明所述方法整体流程图。
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
其中,附图仅用于示例性说明,表示的仅是示意图,而非实物图,不能理解为对本发明的限制;为了更好地说明本发明的实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;对本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
本发明实施例的附图中相同或相似的标号对应相同或相似的部件;在本发明的描述中,需要理解的是,若有术语“上”、“下”、“左”、“右”、“前”、“后”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此附图中描述位置关系的用语仅用于示例性说明,不能理解为对本发明的限制,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。
本申请提供了基于正常样本数据的开关柜状态评估方法,可利用传感器传送的监测数据进行开关柜的实时状态评估,解决故障样本缺失情况下模型的建立问题,提升开关柜状态在线评估的准确度与实用性。
为解决上述问题,本发明实例提供以下技术方案:
如图4所示,本发明提供一种基于正常样本数据的开关柜状态评估方法。
首先,采集传感器监测数据,构建样本数据集进行样本存储。获取传感器实时监测数据并构建样本数据集,在对样本进行状态评估后,将返回样本数据集对样本进行状态标记;
其次,搭建基于正常样本数据的状态评估模型。状态评估模型由数据重构和异常状态识别两部分组成,利用深度网络结构的自动编码器搭建数据重构模型,并通过正常样本数据集训练模型,输出数据重构结果。进一步地,对样本的数据重构结果进行分析处理,计算其与输入特征之间的相关系数值、平均绝对误差,将训练样本所获得的这两个特征参数进行高斯分布模型的构建,将高斯分布模型的输出结果p(x)作为状态评估模型的输出结果。
最后,进行异常评估准则的建立。取高斯模型的置信度ε作为评估阈值,当样本的状态评估模型输出p(x)小于ε,则为异常样本,否则为正常样本。当连续一段时间样本评估为异常样本,则开关柜状态评估结果为异常状态。此外,本专利还设置模型更新区域。采用并行计算,避免在模型更新时暂停对开关柜的状态评估,以月为单位,提取样本数据集中的标记样本重新进行模型训练,并在模型训练完成后替换原评估模型,以保证状态评估模型的针对性。
评估模型的建立
样本数据集的建立
利用串口通信,实时获取传感器数据,构建样本数据集,根据时间先后对样本进行编号。由于开关柜运行过程中的各项特征由不同的传感器监测,串口通信所获得的初始样本数据集为各个传感器独立监测的数据,数据存储模块将对各个传感器的监测样本的时间进行识别,将同一时间不同状态特征,按照固定的状态特征顺序,整合到一个样本并对其进行编号。样本集中的样本表示为:X={xi (j)},其中,xi (j)表示为第j个状态特征的第i个样本,n为采集到的样本的总数,m为传感器监测到的状态特征数,i=1,2,…,n;j=1,2,...,m。
进行评估模型构建前,确定所获取的样本数据为正常样本数据,对样本数据进行状态标记,并按6:1的比例分为训练样本集和测试样本集。在初始化过程中,本专利从PMS2.0系统中获取少量故障样本数据,标注状态信息,添加至测试集,并仅标注作为测试集。
在数据输入模型之前需对数据进行归一化处理:
Figure BDA0002884425720000081
其中,xi'表示第i个样本归一化数值(i=1,2,…,n),xi为第i个样本数据(i=1,2,…,n),Xμ为各特征状态的平均值,Xσ为各特征向量的标准差。通过对样本进行归一化处理,可以提高样本模型构建的精度,提高模型构建的效率。
数据重构模型的建立
利用训练样本集构建数据重构模型。由于开关柜运行过程中,各部件间极其复杂的关联耦合特性及非线性控制方式,开关柜各状态参数间存在着较强的非线性相关性,且各状态参数具有自相关性。当开关柜发生异常状态时,各状态参数之间相关性和自相关性都会受到影响。因此,本专利用深度网络结构的自动编码器,学习正常数据中的各状态参数间的相互关系以实现对监测数据的重构,通过分析重构误差、重构结果与原结果的相关性,来实现对开关柜运行状态的异常辨识。
自动编码器是神经网络的一种,是在学习输入数据非线性特征表示的基础上尽可能的重构数据。自动编码器是与数据相关的,它只能尽可能重构与训练的正常样本数据类似的数据,这也是本专利实现基于正常数据的开关柜状态评估的理论基础。自动编码器由编码器和解码器两大部分组成。编码过程是将输入量映射至隐藏层,以获得输入层新的表达特征:
h=μ(W1·x+b1) (24)
式中,x∈Rn为n维输入变量;h∈Rd为d维隐含层特征表达;W1是d×n阶编码权值矩阵,b1为d阶的偏置向量;μ(·)函数为编码非线性sigmoid型传递函数。
解码过程是将隐藏层h映射为原输入,以获得输入的重构变量:
z=σ(W2·h+b2) (25)
式中,z∈Rn为n维重构变量;W1是n×d阶编码权值矩阵;b2为n阶的偏置向量;σ(·)函数为解码非线性sigmoid型传递函数。
自编码学习过程是以损失函数L(x,z)最小化为目标,即:
L(x,z)=||z-x||2 (26)
由于单层自动编码器对多特征参数的重构能力有限,因此采用由多个自动编码器堆叠起来的深度网络结构的自动编码器进行数据重构,使其具有深层的非线性映射能力,获取特征参数的高阶表达。深度网络的自动编码器由n个自动编码器组合而成,在编码阶段,第n-1个自动编码器的隐藏层是第n个自动编码器的输入层;在解码阶段,对第n,n-1,n-2…,1层进行解码。隐藏层节点数可由高设置为低,以含16个状态特征的样本集为例,这时可设置由3个自动编码器堆叠而成,隐藏层节点数可分别设置为20,10,2,输出为16个状态特征的重构数据,如图1所示。
为了使得重构模型更具有泛化能力,将归一化训练样本集输入编码层,在每一层编码层工作时,随机让神经网络部分节点不工作,以让神经网络模型去学习训练特征之间的普遍共性,提高所训练的数据重构模型对特征参数的表达能力。
异常状态识别模型
将样本集XN归一化后输入重构模型后,将重构数据集数据逆归一化获得重构数据集ZN。对重构数据集ZN进行与原数据集XN的相关性分析。选取各样本的相关系数(PX,X')、平均绝对误差(mae)作为相关性评估指标值,计算公式如下:
Figure BDA0002884425720000091
式(5)中,Pzi,xi为第i个重构样本与原始样本的相关系数;xi为第i个样本;zi为第i个重构样本;m为样本集中状态特征总数;其中i=1,2,…,n。
Figure BDA0002884425720000092
式(6)中,maei是第i个重构样本与原始样本的平均绝对误差;xi (j)为第i个样本的第j个特征参数值;zi (j)为第i个样本的第j个特征的重构参数值;其中i=1,2,…,n,j=1,2,…,m。
Pzi,xi是用于度量zi与xi之间的线性相关性,maei能更好地反应重构误差的实际情况。因此选用这两个个相关性评估指标进行高斯模型的构建。
高斯分布是自然界大量存在并且常见的模型,符合数据分布的一般定律,在合成算法上具有易用性。因此本专利对相关性评估指标集征建高斯分布模型,进行异常状态评估的相关性评估指标集为C={Ci},其中i=1,2,…,n,第i个样本的相关性评估指标集Ci={Pzi,xi,maei}。
高斯分布的构建过程如式(8)-(10)所示:
Figure BDA0002884425720000093
Figure BDA0002884425720000094
Figure BDA0002884425720000095
其中,μj表示相关性评估指标集各维特征向量的平均值,δj表示相关性评估指标集各维向量方差的平方,p(x)表示高斯分布函数。取各维向量95%置信度,阈值0.0025作为初始阈值ε进行分类。当p(x)<ε,为异常样本,否则,为正常样本。
状态评估模型的建立
状态模型初始化后,输入测试样本进行检测,利用真阳率(TPR)和假阳率(FPR)作为评价指标,如式(10)、(11)。当真阳率达到97%及以上时,假阳率达到3%及以下则测试通过,状态评估模型构建完成。若真阳率或假阳率未达到要求,则进行k次交叉验证,设置初始阈值为0.0025,将测试集中的正常样本和不正常样本按比例随机分为两部分,并整合成一个验证样本和一个测试样本。若真阳率过低,减小阈值;若假阳率过高,则增大阈值;若同时存在真阳率过低,假阳率过高,则选取劣化程度更多的那一方进行阈值改变。k次交叉验证后,最终确定阈值,输出最终的评估模型。如图2和图3所示。
Figure BDA0002884425720000101
Figure BDA0002884425720000102
其中,TN表示正确地把良好状态的样本分类成正常样本的总数;TP表示实际是异常状态样本分类成异常样本的总数;FN表示错误地把异常状态的样本分类成正常样本的总数;FN表示错误地把正常状态的样本分类成异常样本的总数。
状态评估模型的运行过程
利用串口通信获取变电站日常运行监测值,形成样本xa保存于样本数据集中。将监测数据xa={xa (j)},其中j=1,2,…,m,归一化处理,得到xa'={xa(j)},其中j=1,2,…,m。将归一化好的数据集输入构建好的评估模型进行状态评估。首先输入数据重构模型得到重构样本数据za={za (j)},其中,j=1,2,…,m。进行重构样本与原样本的相关性分析,输入高斯分布模型输出评估结果p(x)。当监测样本的输出状态评估结果p(x)大于阈值,则为正常样本,否则为异常样本。将样本的评估结果返回样本数据集中,对样本进行状态标记。若样本xa评估结果为正常样本,则返回数据集对xa样本标注为0。若xa为异常样本,则返回数据集对xa标注为1。当为异常样本时,缩短串口通信获取监测值的时间。在一个连续时间段内,连续监测到异常样本,则此开关柜为异常运行状态,并发出警报,否则为系统的短暂干扰。若开关运行状态恢复正常,则恢复串口通信获取监测值的时间。
模型更新区域
随着变电站运行时间不断加长,监测数据不断增大,通过最初样本构建的模型缺乏时间滞后性和评估对象的针对性。因此本专利采用并行计算进行模型更新,以月为单位,在串口通信运行间隙,获取样本数据集中已标记好的样本数据进行评估模型的重建。将标记好的正常样本按照6:1分为训练集和测试集,并在测试集中加入样本数据集中已标记好的故障样本(包括PMS2.0中的故障数据)。重复评估模型的构建过程,进行状态评估模型的构建。将构建好的模型替换原评估模型,进行模型更新区域的初始化,更新区域暂停使用,等待下次运行。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (9)

1.一种基于正常样本数据的开关柜状态评估方法,其特征在于:包括以下步骤:
S1:采集传感器监测数据,构建样本数据集进行样本存储;
S2:利用训练样本集构建数据重构模型;
S3:构建异常状态识别模型,从而得到初始的状态评估模型;
S4:对状态评估模型进行检测并调整,输出最终的状态评估模型;
S5:运行所述状态评估模型,对开关柜进行状态评估;
S6:采用并行计算更新所述状态评估模型,以月为单位,在串口通信运行间隙,获取样本数据集中已标记好的样本数据进行评估模型的重建。
2.根据权利要求1所述的基于正常样本数据的开关柜状态评估方法,其特征在于:所述步骤S1具体包括:
利用串口通信,实时获取传感器数据,构建样本数据集,根据时间先后对样本进行编号;
对开关柜的各个传感器的监测样本的时间进行识别,将同一时间不同状态特征,按照固定的状态特征顺序,整合到一个样本并对其进行编号;样本集中的样本表示为:X={xi (j)},其中,xi (j)表示为第j个状态特征的第i个样本,n为采集到的样本的总数,m为传感器监测到的状态特征数,i=1,2,…,n;j=1,2,...,m;
进行评估模型构建前,确定所获取的样本数据为正常样本数据,对样本数据进行状态标记,并按6:1的比例分为训练样本集和测试样本集;
在初始化过程中,从PMS2.0系统中获取少量故障样本数据,标注状态信息,添加至测试集,并仅标注作为测试集。
3.根据权利要求2所述的基于正常样本数据的开关柜状态评估方法,其特征在于:步骤S2中,在训练样本集输入数据重构模型之前对数据进行归一化处理:
Figure FDA0002884425710000011
其中,xi'表示第i个样本归一化数值(i=1,2,…,n),xi为第i个样本数据(i=1,2,…,n),Xμ为各特征状态的平均值,Xσ为各特征向量的标准差。
4.根据权利要求3所述的基于正常样本数据的开关柜状态评估方法,其特征在于:步骤S2具体包括:
利用深度网络结构的自动编码器,学习正常数据中的各状态参数间的相互关系以实现对监测数据的重构,通过分析重构误差、重构结果与原结果的相关性,来实现对开关柜运行状态的异常辨识;
所述自动编码器是在学习输入数据非线性特征表示的基础上尽可能的重构数据,所述自动编码器由编码器和解码器组成;
编码过程是将输入量映射至隐藏层,以获得输入层新的表达特征:
h=μ(W1·x+b1) (2)
式中,x∈Rn为n维输入变量;h∈Rd为d维隐含层特征表达;W1是d×n阶编码权值矩阵,b1为d阶的偏置向量;μ(·)函数为编码非线性sigmoid型传递函数;
解码过程是将隐藏层h映射为原输入,以获得输入的重构变量:
z=σ(W2·h+b2) (3)
式中,z∈Rn为n维重构变量;W1是n×d阶编码权值矩阵;b2为n阶的偏置向量;σ(·)函数为解码非线性sigmoid型传递函数;
自编码学习过程是以损失函数L(x,z)最小化为目标,即:
L(x,z)=||z-x||2 (4)
采用由多个自动编码器堆叠起来的深度网络结构的自动编码器进行数据重构,使其具有深层的非线性映射能力,获取特征参数的高阶表达;
深度网络的自动编码器由n个自动编码器组合而成,在编码阶段,第n-1个自动编码器的隐藏层是第n个自动编码器的输入层;在解码阶段,对第n,n-1,n-2…,1层进行解码;隐藏层节点数由高设置为低;
将归一化训练样本集输入编码层,在每一层编码层工作时,随机让神经网络部分节点不工作,以让神经网络模型去学习训练特征之间的普遍共性。
5.根据权利要求4所述的基于正常样本数据的开关柜状态评估方法,其特征在于:所述步骤S3具体包括:
将样本集XN归一化并输入数据重构模型后,将重构数据集数据逆归一化获得重构数据集ZN;对重构数据集ZN进行与原数据集XN的相关性分析,选取各样本的相关系数PX,X、平均绝对误差mae作为相关性评估指标值,计算公式如下:
Figure FDA0002884425710000021
式(5)中,Pzi,xi为第i个重构样本与原始样本的相关系数;xi为第i个样本;zi为第i个重构样本;m为样本集中状态特征总数;其中i=1,2,…,n;
Figure FDA0002884425710000031
式(6)中,maei是第i个重构样本与原始样本的平均绝对误差;xi (j)为第i个样本的第j个特征参数值;zi (j)为第i个样本的第j个特征的重构参数值;其中i=1,2,…,n,j=1,2,…,m;
Pzi,xi用于度量zi与xi之间的线性相关性,maei用于反映重构误差的实际情况,选用这两个相关性评估指标进行高斯模型的构建。
6.根据权利要求5所述的基于正常样本数据的开关柜状态评估方法,其特征在于:所述高斯模型构建包括:
对相关性评估指标集征建高斯分布模型,进行异常状态评估的相关性评估指标集为C={Ci},其中i=1,2,…,n,第i个样本的相关性评估指标集Ci={Pzi,xi,maei};
高斯分布的构建过程如式(8)-(10)所示:
Figure FDA0002884425710000032
Figure FDA0002884425710000033
Figure FDA0002884425710000034
其中,μj表示相关性评估指标集各维特征向量的平均值,δj表示相关性评估指标集各维向量方差的平方,p(x)表示高斯分布函数,ε为初始阈值;当p(x)<ε,为异常样本,否则,为正常样本。
7.根据权利要求6所述的基于正常样本数据的开关柜状态评估方法,其特征在于:步骤S4中,状态评估模型初始化后,输入测试样本进行检测,利用真阳率(TPR)和假阳率(FPR)作为评价指标,如式(10)、(11);
Figure FDA0002884425710000035
Figure FDA0002884425710000036
其中,TN表示正确地把良好状态的样本分类成正常样本的总数;TP表示实际是异常状态样本分类成异常样本的总数;FN表示错误地把异常状态的样本分类成正常样本的总数;FN表示错误地把正常状态的样本分类成异常样本的总数;
当真阳率达到97%及以上时,假阳率达到3%及以下则测试通过,状态评估模型构建完成;
若真阳率或假阳率未达到要求,则进行k次交叉验证,设置初始阈值为0.0025,将测试集中的正常样本和不正常样本按比例随机分为两部分,并整合成一个验证样本和一个测试样本;若真阳率过低,减小阈值;若假阳率过高,则增大阈值;若同时存在真阳率过低,假阳率过高,则选取劣化程度更多的那一方进行阈值改变;k次交叉验证后,最终确定阈值,输出最终的评估模型。
8.根据权利要求7所述的基于正常样本数据的开关柜状态评估方法,其特征在于:所述步骤S5中具体包括以下步骤:
用串口通信获取变电站日常运行监测值,形成样本xa保存于样本数据集中;
将监测数据xa={xa (j)},其中j=1,2,…,m,归一化处理,得到xa'={xa '(j)},其中j=1,2,…,m;
将归一化好的数据集输入构建好的评估模型进行状态评估;首先输入数据重构模型得到重构样本数据za={za (j)},其中,j=1,2,…,m;进行重构样本与原样本的相关性分析,输入高斯分布模型输出评估结果p(x);当监测样本的输出状态评估结果p(x)大于阈值,则为正常样本,否则为异常样本;将样本的评估结果返回样本数据集中,对样本进行状态标记;若样本xa评估结果为正常样本,则返回数据集对xa样本标注为0;若xa为异常样本,则返回数据集对xa标注为1;当为异常样本时,缩短串口通信获取监测值的时间;在一个连续时间段内,连续监测到异常样本,则此开关柜为异常运行状态,并发出警报,否则为系统的短暂干扰;若开关运行状态恢复正常,则恢复串口通信获取监测值的时间。
9.根据权利要求8所述的基于正常样本数据的开关柜状态评估方法,其特征在于:步骤S6具体包括:
将标记好的正常样本按照6:1分为训练集和测试集,并在测试集中加入样本数据集中已标记好的故障样本;重复状态评估模型的构建过程,进行状态评估模型的构建;将构建好的状态评估模型替换原状态评估模型,进行模型更新区域的初始化,更新区域暂停使用,等待下次运行。
CN202110008508.6A 2021-01-05 2021-01-05 基于正常样本数据的开关柜状态评估方法 Pending CN112906288A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110008508.6A CN112906288A (zh) 2021-01-05 2021-01-05 基于正常样本数据的开关柜状态评估方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110008508.6A CN112906288A (zh) 2021-01-05 2021-01-05 基于正常样本数据的开关柜状态评估方法

Publications (1)

Publication Number Publication Date
CN112906288A true CN112906288A (zh) 2021-06-04

Family

ID=76112243

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110008508.6A Pending CN112906288A (zh) 2021-01-05 2021-01-05 基于正常样本数据的开关柜状态评估方法

Country Status (1)

Country Link
CN (1) CN112906288A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116304766A (zh) * 2023-05-25 2023-06-23 山东艾迈科思电气有限公司 基于多传感器的开关柜状态快速评估方法
CN116992308A (zh) * 2023-09-25 2023-11-03 中国科学院自动化研究所 数据与知识融合的工艺波动分析与优化方法及装置
CN117094705A (zh) * 2023-10-19 2023-11-21 国网安徽省电力有限公司电力科学研究院 一种应用于高压开关柜缺陷预测的方法、系统及设备

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116304766A (zh) * 2023-05-25 2023-06-23 山东艾迈科思电气有限公司 基于多传感器的开关柜状态快速评估方法
CN116992308A (zh) * 2023-09-25 2023-11-03 中国科学院自动化研究所 数据与知识融合的工艺波动分析与优化方法及装置
CN116992308B (zh) * 2023-09-25 2024-01-16 中国科学院自动化研究所 数据与知识融合的工艺波动分析与优化方法及装置
CN117094705A (zh) * 2023-10-19 2023-11-21 国网安徽省电力有限公司电力科学研究院 一种应用于高压开关柜缺陷预测的方法、系统及设备
CN117094705B (zh) * 2023-10-19 2024-01-02 国网安徽省电力有限公司电力科学研究院 一种应用于高压开关柜缺陷预测的方法、系统及设备

Similar Documents

Publication Publication Date Title
CN112906288A (zh) 基于正常样本数据的开关柜状态评估方法
CN105046402B (zh) 一种应用于智能变电站二次设备的状态评估方法
CN109583520B (zh) 一种云模型与遗传算法优化支持向量机的状态评估方法
CN108320043A (zh) 一种基于电力大数据的配电网设备状态诊断预测方法
CN105825271B (zh) 基于证据推理的卫星故障诊断与预测方法
CN112101431A (zh) 电子设备故障诊断系统
CN107065834B (zh) 湿法冶金过程中浓密机的故障诊断方法
CN108921230A (zh) 基于类均值核主元分析和bp神经网络的故障诊断方法
CN109034191A (zh) 基于elm的单维遥测数据异常判读方法
CN101799674A (zh) 一种数控装备服役状态分析方法
CN114519923A (zh) 一种电厂智能诊断预警方法和系统
CN116380445B (zh) 基于振动波形的设备状态诊断方法及相关装置
CN104142680B (zh) 一种基于鲁棒输入训练神经网络的多传感器故障诊断系统及方法
CN114297918A (zh) 基于全注意力深度网络和动态集成学习的航空发动机剩余寿命预测方法
CN111273125A (zh) 基于rst-cnn的电力电缆沟道故障诊断方法
CN111122811A (zh) 一种oica和rnn融合模型的污水处理过程故障监测方法
Yang et al. An intelligent singular value diagnostic method for concrete dam deformation monitoring
CN117609836A (zh) 一种综合模块的电磁敏感预测与健康管理方法
Lei et al. Fault diagnosis of rotating machinery based on a new hybrid clustering algorithm
Li et al. Instance weighting based partial domain adaptation for intelligent fault diagnosis of rotating machinery
CN113283546A (zh) 加热炉完整性管理集控装置的炉况异常报警方法及系统
CN115564075B (zh) 一种城市电网主配一体故障协同诊断方法、系统
CN109492705A (zh) 一种基于马氏距离(md)面积度量的故障诊断方法
CN116109039A (zh) 一种数据驱动异常检测与预警系统
CN110441725A (zh) 基于自适应神经模糊推理的智能电表故障诊断方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination