CN112800686A - 一种变压器dga在线监测数据异常模式判定方法 - Google Patents

一种变压器dga在线监测数据异常模式判定方法 Download PDF

Info

Publication number
CN112800686A
CN112800686A CN202110330366.5A CN202110330366A CN112800686A CN 112800686 A CN112800686 A CN 112800686A CN 202110330366 A CN202110330366 A CN 202110330366A CN 112800686 A CN112800686 A CN 112800686A
Authority
CN
China
Prior art keywords
data
line segment
sequences
sequence
fitting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110330366.5A
Other languages
English (en)
Inventor
童超
朱自伟
张益宁
童军心
李唐兵
王华云
张宇
王鹏
万华
刘玉婷
徐碧川
童涛
曾磊磊
周友武
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
Nanchang University
Electric Power Research Institute of State Grid Jiangxi Electric Power Co Ltd
Original Assignee
State Grid Corp of China SGCC
Nanchang University
Electric Power Research Institute of State Grid Jiangxi Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, Nanchang University, Electric Power Research Institute of State Grid Jiangxi Electric Power Co Ltd filed Critical State Grid Corp of China SGCC
Priority to CN202110330366.5A priority Critical patent/CN112800686A/zh
Publication of CN112800686A publication Critical patent/CN112800686A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01RMEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
    • G01R31/00Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种变压器DGA在线监测数据异常模式判定方法,导入DGA在线监测数据,设置滑动窗口的长度和滑动步长,以一定的步长滑动窗口遍历在线数据集,对截取的每个数据窗口,使用基于最小二乘的滑动数据分段线性化算法拟合,使用拟合所得线段的斜率、包含数据的实际增长率以及该线段的跨度表征拟合出的这条线段,构建描述的线段相似度的模型,并使用K‑means算法对线段集进行聚类分析;线段集的符号化表示,归总不同序列符号化后集合中元素数目;基于Apriori算法的思想,挖掘不同序列之间存在的频繁项集,量化不同序列之间的关联性,根据序列之间的关联性强弱,对判定数据中存在的异常数值类型,分离出不同异常模式的数据。

Description

一种变压器DGA在线监测数据异常模式判定方法
技术领域
本发明涉及一种变压器DGA在线监测数据异常模式判定方法,属于电力设备数据处理技术领域。
背景技术
电力变压器是电能转换与传输的枢纽设备,其安全稳定的运行是对用户供电质量的重要保障。变压器的铁芯接地电流监测数据是对变压器进行状态评估的重要依据。一段时间的监测数据,包含其整体变化趋势、变化中的极值点及跃变点以及数据统计特征,可以从多方面反映电力变压器的内部可能存在的异常情况。
由于设备所处运行环境以及变压器本身存在的一些电磁干扰作用,在线监测装置在数据的采集传输过程中容易出现随机分布的异常数值点,严重时甚至出现数据漂移,传输中断的情况。对数据漂移、数据中断等明显数据异常现象,后台系统可以很快的进行辨别,并针对问题进行报警;但对于那些随机分布于正常在线数据中的异常数值点,对设备状态指标的实时表征起到严重的干扰作用,也对基于指标的状态评价工作产生影响,容易造成设备异常状态的误报、错报等情况,导致设备的运行检修资源的浪费。
经过电力设备的长期运行,已有较大规模的指标数据存储于电力数据库中,其中必然包含不同异常模式的指标数据,通过对已有的指标数据进行关联分析,挖掘出其中存在的关联关系,基于该关联关系分析数据中不同异常模式的数据,有利完善电力设备的综合状态评价体系,提早发现设备装置的异常状态,提高设备检修效率,降低设备的运维成本。
变压器的DGA指标在线数据是对设备绝缘性能的实时监测,基于油色谱数据的分析,可以快速得出变压器所处的实时状态;同时DGA数据中指标维度较多,通过对其中指标的关联关系挖掘,有助于甄别在线数据中不同异常模式的数据,可以增强设备综合状态评价结果的可信度。
变电设备的在线数据通常需要经过采集、转化、传输,最后才能存储在系统数据库中,该数据是对设备状态的实时监控与展示。然而由于人为操作失误、运行环境恶劣、强电磁干扰等因素的影响,系统收集的在线数据中通常存在较多的问题,在线数据对设备状态的表征的可信度受到了较大的影响。
发明内容
本发明所解决的技术问题在于提供一种变压器DGA在线监测数据异常模式判定方法,以解决上述技术背景的问题。
本发明通过以下技术方案来实现,一种变压器DGA在线监测数据异常模式判定方法,具体步骤如下:
S1、DGA在线监测数据的导入与滑动窗口算法的基本参数设置:导入DGA在线监测数据,设置滑动窗口的长度为L,设置滑动步长为l
S2、以一定的步长滑动窗口遍历在线数据集:拖动窗口于整体在线监测数据集上 以滑动步长 l滑动,直至遍历所有数据;令在线监测数据集长度为
Figure 100626DEST_PATH_IMAGE001
,遍历之后得到
Figure 491287DEST_PATH_IMAGE002
个数据窗口,当
Figure 476560DEST_PATH_IMAGE003
为小数时,向下取整,保留构成完整窗口的数据进行分析;导 出所有窗口中的数据,构成待分析数据集DS i
Figure 599368DEST_PATH_IMAGE004
,数据处理将以数据窗口作为分析的基 本单位;
S3、序列数据的分段线性化:以待分析数据集DS i 中某窗口内数据为例进行分析,使用基于最小二乘的滑动数据分段线性化算法,将在线监测数据中不定量的点组合在一起,形成多组数据点集,对同一组的数据点集使用最小二乘法拟合,得到一条包含组内所有点的线段;
S4、数据点集属性表征:使用拟合所得线段的斜率、包含数据的实际增长率以及该线段的跨度(即线段包含数据点的个数),构成线段属性三元组,表征拟合出的这条线段,所有拟合出的线段构成线段集;
S5、构建描述不同线段相似度的模型:基于线段属性三元组中的元素,构建描述的线段相似度的模型,并使用K-means算法对线段集进行聚类分析;
S6、线段集的符号化表示:为每个类型的线段集,分配一个符号,对不同类的线段集赋予不同的符号;集合中的所有线段统一用相应的符号表示;
S7、对所需分析的序列之间进行归总:不同序列线性化的结果各有不同,每两两线段之间进行分析前,先归总不同序列符号化后集合中元素数目,保证所有序列的元素数量相同;
S8、挖掘不同序列之间的关联性:基于Apriori算法的思想,设置最小置信度与支持度,挖掘不同序列之间存在的频繁项集,量化不同序列之间的关联性。
S9、判定DGA在线数据中不同异常模式的数据:根据序列之间的关联性强弱,判定提取的窗口内数据存在的异常数值类型,分离出不同异常模式的数据。
进一步地,步骤S3具体步骤是:
1)形如DGA的设备指标在线监测数据(指的是按一定间隔采样的设备状态指标数据,DGA是其中一种),其本质可以看作为按着一定的时间间隔顺序,一个个采集的状态指标数值;可知数据具有很强的时间属性,可以等效为时间序列数据;
2)对时间序列
Figure 466830DEST_PATH_IMAGE005
,以长度为
Figure 520237DEST_PATH_IMAGE006
的滑动窗口截取数据 点,
Figure 45503DEST_PATH_IMAGE007
指的是分析整体DGA在线数据中含有数据点的个数,对截取窗口内的数据,基于滑动窗 口的思想,对其中含有的数据点进行分段线性拟合;
3)以窗口内的首个数据点为初始线段的拟合起点,令该点为
Figure 588479DEST_PATH_IMAGE008
,假设初始线段的 拟合终点为
Figure 959549DEST_PATH_IMAGE009
,将这
Figure 551067DEST_PATH_IMAGE010
个数据点拟合为一条线段;
4)那么对于这样一条线段,其可以用如下所示的式子表达:
Figure 573250DEST_PATH_IMAGE011
(1)
Figure 37861DEST_PATH_IMAGE012
(2)
上式(1)和式(2)中
Figure 879915DEST_PATH_IMAGE013
表示时间序列中
Figure 275124DEST_PATH_IMAGE014
时刻的采样数值,
Figure 902545DEST_PATH_IMAGE015
表示拟合线段中含 有的数值点数量,
Figure 787325DEST_PATH_IMAGE016
表示拟合线段方程的因变量;
Figure 887915DEST_PATH_IMAGE017
为指标序列数值点
Figure 86815DEST_PATH_IMAGE018
至拟合线段的距离,统计式(1)中所表达的线段区间中 所有的数据点至线段的距离之和作为该条线段的拟合误差
Figure 818011DEST_PATH_IMAGE019
Figure 890003DEST_PATH_IMAGE020
(3)
Figure 441070DEST_PATH_IMAGE021
(4)
5)设置拟合误差阈值为
Figure 256711DEST_PATH_IMAGE022
,如果
Figure 780096DEST_PATH_IMAGE023
,则说明该点短仍然可以继续增加拟 合点,令
Figure 6678DEST_PATH_IMAGE024
,并重复步骤上述步骤4);如果有
Figure 61353DEST_PATH_IMAGE025
,则认为线段拟合至该点为 止;如果有
Figure 602056DEST_PATH_IMAGE026
,则判定该线段无法拟合,保存当前线段的拟合终点为
Figure 307843DEST_PATH_IMAGE027
,记录其数据采样时刻,之后回到步骤3),重置参数
Figure 453129DEST_PATH_IMAGE028
,并以当前拟合终点 作为下一线段的拟合起点进行下一部分的数据拟合,直至该序列中所有的数据点都拟合完 毕。
进一步地,步骤S4中提出的线段属性三元组表示方法主要为:假设拟合的线段的 斜率为
Figure 978789DEST_PATH_IMAGE029
,线段中拟合数值点个数为
Figure 323182DEST_PATH_IMAGE030
,那么该线段拟合数据的实际增长率可以表示为:
Figure 634209DEST_PATH_IMAGE031
Figure 202594DEST_PATH_IMAGE032
表示改线段拟合的起点,以
Figure 231861DEST_PATH_IMAGE033
三个元素构成线段的三 元组
Figure 911104DEST_PATH_IMAGE034
,以该三元组表示拟合出的一条线段。
进一步地,步骤S5中构建线段相似度模型,并基于此模型进行聚类分析的主要步骤是:
1)由于DGA在线监测中不同指标之间存在一定的数量级差异,首先需要对同一序 列中存在的所有线段三元组进行形如
Figure 76637DEST_PATH_IMAGE035
的归一化操作;
Figure 19185DEST_PATH_IMAGE036
指代归一化操 作之后的元素,
Figure 785016DEST_PATH_IMAGE037
指代三元组中任意一个元素,
Figure 15753DEST_PATH_IMAGE038
为指标检测量中最小值,
Figure 222743DEST_PATH_IMAGE039
为指 标监测量中最大值。
2)在聚类分析时,需要建立衡量线段相似度的标准;DGA在线数据反映的是设备实时指标,而其中参数的变化趋势和形态最能体现设备运行状态的变化,因此,在建立衡量线段相似度模型时,对线段三元组中不同属性需要有不同的考虑,本发明使用欧式距离描述线段之间的相似度,在其中以权重的方式表示对线段不同属性的考虑程度。建立的线段相似度模型如下式所示:
Figure 398509DEST_PATH_IMAGE040
(5)
式中,
Figure 74472DEST_PATH_IMAGE041
表示线段相似度,
Figure 298780DEST_PATH_IMAGE042
分别表示在线段相似度模型中斜 率、跨度、增长率所占的权重比率;
3)基于上述的线段相似度模型,对线段集合使用K-means算法进行聚类分析,将相似度最大线段划分在同一集合中。
进一步地,步骤S7具体过程为:
1)由于挖掘序列关联性为两两序列一组进行分析,而不同的序列在线性化的过程中,数值分布特征不一,所以线性分段后,各个序列存在的线段数目也会不同;但挖掘的关联性的前提是不同序列的项集数目相同。
2)假设对于两个参数序列
Figure 438906DEST_PATH_IMAGE043
Figure 519994DEST_PATH_IMAGE044
,其分段线性化之后的端点集合分别为:
Figure 742641DEST_PATH_IMAGE045
Figure 832957DEST_PATH_IMAGE046
,其中
Figure 827588DEST_PATH_IMAGE047
Figure 345158DEST_PATH_IMAGE048
分别为序 列中的线段数量,对
Figure 979401DEST_PATH_IMAGE049
Figure 358561DEST_PATH_IMAGE050
进行合并,并去除其中存在的重复端点,得到参数序列
Figure 722546DEST_PATH_IMAGE051
Figure 161749DEST_PATH_IMAGE052
的合并端点集合
Figure 283289DEST_PATH_IMAGE053
3)根据合并的端点集合
Figure 715407DEST_PATH_IMAGE053
,对两参数序列进行归总,如果初始分段结果中某一 线段中间出现了新的端点,则将此线段从新的端点处分为两条线段,线段符号与初始分段 结果的符号相同。
进一步地,步骤S8中序列关联性挖掘的主要过程为:
1)最小支持度与最小置信度参数的设置;置信度与支持度阈值时判定序列关联与 频繁项集的基础,合适的阈值参数有利于增强关联关系的可信度,记频繁-1与频繁-2项集 的最小支持度阈值为
Figure 681702DEST_PATH_IMAGE054
Figure 541073DEST_PATH_IMAGE055
,序列关联挖掘中的最小置信度阈值为
Figure 962958DEST_PATH_IMAGE056
2)频繁项集的生成;使用经过归总之后的两符号化序列作为事务集,记为
Figure 870872DEST_PATH_IMAGE057
,其中
Figure 943870DEST_PATH_IMAGE058
,DGA在 线指标提取分析的两条气体序列数据对应的所有符号类别为:
Figure 724875DEST_PATH_IMAGE059
Figure 883324DEST_PATH_IMAGE060
,基于Apriori算法的基本思想,本发明通过对事务集的两阶段扫描,得 到序列的频繁项集。根据式(6)计算序列中每个符号的置信度:
Figure 594928DEST_PATH_IMAGE061
(6)
式中
Figure 273165DEST_PATH_IMAGE062
Figure 474339DEST_PATH_IMAGE063
代表的是需要挖掘关联规则的两个指标对象,
Figure 867887DEST_PATH_IMAGE064
表示事务集的个 数,即序列中元素的个数,
Figure 383182DEST_PATH_IMAGE065
表示对项集元素的计数,支持度表示的是项在事务集中的占 比程度,在发掘频繁-1项集时,将支持度大于
Figure 165193DEST_PATH_IMAGE054
的项划分至频繁-1项集的集合中。
记关联挖掘中两序列的频繁-1项集的集合分别为
Figure 288001DEST_PATH_IMAGE066
Figure 421042DEST_PATH_IMAGE067
,根据指标参数将集合 中的项两两配对,构成形如
Figure 287498DEST_PATH_IMAGE068
形式2-项集,
Figure 127278DEST_PATH_IMAGE069
Figure 670255DEST_PATH_IMAGE070
分别表示序列
Figure 41325DEST_PATH_IMAGE071
与序列
Figure 632843DEST_PATH_IMAGE072
中 挖掘出的频繁1项集,计算每个项在该2-项集中的支持度,将支持度大于
Figure 389446DEST_PATH_IMAGE055
的项划 分至频繁-2项集,记为
Figure 116706DEST_PATH_IMAGE073
3)序列关联性的挖掘;将所有序列进行两两组合,分别统计其中存在的频繁-2项集中项的支持度以及对应关联挖掘序列之间的置信度;
首先根据式(7)对所有频繁-2项集在两指标参数之间的支持度累加,并以此作为这两个参数序列在所有多元序列中的支持度计数。
Figure 958761DEST_PATH_IMAGE074
(7)
Figure 353970DEST_PATH_IMAGE075
(8)
Figure 981391DEST_PATH_IMAGE076
(9)
其中
Figure 866171DEST_PATH_IMAGE077
,为对两序列聚类分析之后的所划分出的线段类别总数。
Figure 946253DEST_PATH_IMAGE065
表示对项集元素的计数,
Figure 207470DEST_PATH_IMAGE051
Figure 876349DEST_PATH_IMAGE052
表示为序列
Figure 682762DEST_PATH_IMAGE071
Figure 499409DEST_PATH_IMAGE072
中属于频繁1项集的项集元素。同时 记指标序列层面的最小支持度阈值为
Figure 236420DEST_PATH_IMAGE078
,若参数指标层面的支持度大于设置的阈 值,则计算符号项集组合在两序列中的置信度
Figure 569925DEST_PATH_IMAGE079
,如式(10)所示:
Figure 62086DEST_PATH_IMAGE080
(10)
当置信度大于所设置的最小置信度阈值时,保留关联规则
Figure 116761DEST_PATH_IMAGE081
,使用置信 度描述两指标之间的关联强度,判定两指标存在强关联。
进一步地,步骤S9所述异常数值类型包括由于在线监测装置故障导致的异常类型的数据采样点和反映设备真实异常运行状态的异常类型的数据采样点。
电力变压器经过多年的运行,其DGA在线监测数据通常具有较大的规模,同时对整个数据集进行处理通常会加大算法的复杂程度及服务器的运行压力,可行性较低;本发明根据传回的在线DGA数据特征,在对数据的处理中引入滑动窗口的思想。划定长度的窗口截取DGA在线数据,并以固定的步长拖动窗口滑动,直至遍历整体在线数据;对于划分出的每个窗口,本发明针对序列数据的特点,提出了一种基于最小二乘思想的滑动序列数据分段线性化算法;对于线段化之后的数据,以线段的斜率、跨度等属性表示;基于这些属性,建立相应模型表征不同线段之间的相似性,并基于此模型对线段集合使用K-means算法进行聚类分析,根据聚类结果完成序列数据的符号化。最后将符号化序列进行两两归总,基于Apriori算法思想,以符号化之后的序列数据作为事务集,根据序列置信度与支持度,挖掘不同序列之间的关联性,并根据序列之间的关联性挖掘结果判别在线DGA数据中存在的不同模式异常值。
附图说明
图1为本发明的流程图。
图2为氢气指标在线数据。
图3为甲烷指标在线数据。
图4为乙烷指标在线数据。
图5为乙烯指标在线数据。
图6为乙炔指标在线数据。
图7为氢气指标拟合对比图。
图8为甲烷指标拟合对比图。
图9为乙烷指标拟合对比图。
图10为乙烯指标拟合对比图。
图11为乙炔指标拟合对比图。
图12是氢气与甲烷序列检测出的异常点。
具体实施方式
下面结合附图进一步详细阐明本发明。
参照图1,一种变压器DGA在线监测数据异常模式判定方法,具体步骤如下:
S1、DGA在线监测数据的导入与滑动窗口算法的基本参数设置:导入DGA在线监测数据,设置滑动窗口的长度为L,设置滑动步长为l
S2、以一定的步长滑动窗口遍历在线数据集:拖动滑动窗口在整体在线监测数据 集上以滑动步长l滑动,直至遍历所有数据;令在线监测数据集长度为
Figure 391885DEST_PATH_IMAGE082
,遍历之后得到
Figure 97673DEST_PATH_IMAGE083
个数据窗口,导出所有窗口中的数据,构成待分析数据集DS i
Figure 245888DEST_PATH_IMAGE084
,数据处理 将以数据窗口作为分析的基本单位;
S3、序列数据的分段线性化:对截取的每个数据窗口,使用基于最小二乘的滑动数据分段线性化算法,将在线监测数据中不定量的点组合在一起,形成多组数据点集,对同一组的数据点集使用最小二乘法拟合,得到一条包含组内所有点的线段。
对于截取的数据窗口
Figure 37127DEST_PATH_IMAGE085
,根据DGA监测指标分别提取其对应的序列数据,本发明 主要研究的是DGA中
Figure 115941DEST_PATH_IMAGE086
这5类气体,因此在数据 窗口
Figure 426968DEST_PATH_IMAGE085
中可以得到对应的5个序列。对每条序列进行分段线性化处理,将序列数据转化为 数量不等的线段集合。
序列数据的分段线性化具体步骤是:
1)对于类似DGA的设备指标在线监测数据,其本质可以看作为按着一定的时间间隔顺序,一个个采集的状态指标数值;可知数据具有很强的时间属性,可以等效为时间序列数据;
2)对时间序列
Figure 260932DEST_PATH_IMAGE087
,以长度为
Figure 45127DEST_PATH_IMAGE088
的滑动窗口截取数据 点,对截取窗口内的数据,基于滑动窗口的思想,对其中含有的数据点进行分段线性拟合;
3)以窗口内的首个数据点为初始线段的拟合起点,令该点为
Figure 927633DEST_PATH_IMAGE089
,假设初始线段的 拟合终点为
Figure 342434DEST_PATH_IMAGE090
,将这
Figure 98031DEST_PATH_IMAGE091
个数据点拟合为一条线段;
4)那么对于这样一条线段,其可以用如下所示的式子表达:
Figure 598283DEST_PATH_IMAGE092
(1)
Figure 18900DEST_PATH_IMAGE093
(2)
上式中
Figure 304519DEST_PATH_IMAGE094
表示时间序列中
Figure 480285DEST_PATH_IMAGE095
时刻的采样数值,
Figure 405516DEST_PATH_IMAGE096
表示拟合线段中含有的数值点 数量,
Figure 442873DEST_PATH_IMAGE097
表示拟合线段方程的因变量;
Figure 566687DEST_PATH_IMAGE098
为指标序列数值点
Figure 661157DEST_PATH_IMAGE099
至拟合线段的距离,统计上式所表达的线段区间中所 有的数据点至线段的距离之和作为该条线段的拟合误差
Figure 73684DEST_PATH_IMAGE100
Figure 164000DEST_PATH_IMAGE101
  (3)
Figure 158632DEST_PATH_IMAGE102
(4)
设置拟合误差阈值为
Figure 410622DEST_PATH_IMAGE103
,如果
Figure 310444DEST_PATH_IMAGE104
,则说明该点短仍然可以继续增加拟 合点,令
Figure 689604DEST_PATH_IMAGE105
,并重复步骤上述步骤;如果有
Figure 53590DEST_PATH_IMAGE106
,则认为线段拟合至该点为 止;如果有
Figure 227213DEST_PATH_IMAGE107
,则判定该线段无法拟合,保存当前线段的拟合终点为
Figure 614332DEST_PATH_IMAGE108
,记录其数据采样时刻,之后回到步骤3),重置参数
Figure 46450DEST_PATH_IMAGE109
,并以当前拟合终点作为下一线段的 拟合起点进行下一部分的数据拟合,直至该序列中所有的数据点都拟合完毕。
S4、数据点集属性表征:使用拟合所得线段的斜率、包含数据的实际增长率以及该线段的跨度(即线段包含数据点的个数),构成线段属性三元组,表征拟合出的这条线段。
假设拟合的线段的斜率为
Figure 747166DEST_PATH_IMAGE110
,线段中拟合数值点个数为
Figure 606537DEST_PATH_IMAGE111
,那么该线段拟合数据 的实际增长率可以表示为:
Figure 215373DEST_PATH_IMAGE112
,以
Figure 201915DEST_PATH_IMAGE113
三个元素构成线段的三 元组
Figure 274913DEST_PATH_IMAGE114
,以该数组表示拟合出的一条线段。
由于分段线性化是一种数据拟合过程,拟合效果的好坏均与误差大小有关。考虑 到一般线段的特有属性,本发明使用线段的斜率
Figure 55918DEST_PATH_IMAGE110
,拟合长度
Figure 152050DEST_PATH_IMAGE115
以及线段的增长率
Figure 925971DEST_PATH_IMAGE116
,组成 形如
Figure 604208DEST_PATH_IMAGE117
数组集合表示每条线段。
S5、构建描述不同线段相似度的模型:基于线段属性三元组中的元素,构建描述的线段相似度的模型,并使用K-means算法对线段集进行聚类分析。
对以数组形式表达的线段集合,本发明基于其中的相关参数使用欧式距离的方法 建立描述线段相似度的模型
Figure 805383DEST_PATH_IMAGE118
,并根据此相似度模型,使用K-means聚类算法对线段集合 进行聚类分析,将相似程度较高的线段合并为一个类别。
1)由于DGA在线监测中不同指标之间存在一定的数量级差异,首先需要对同一序 列中存在的所有线段三元组进行形如
Figure 198930DEST_PATH_IMAGE119
的标准化操作;
2)在聚类分析时,需要建立衡量线段相似度的标准;DGA在线数据反映的是设备实时指标,而其中参数的变化趋势和形态最能体现设备运行状态的变化,因此,在建立衡量线段相似度模型时,对线段三元组中不同属性需要有不同的考虑,本发明使用欧式距离描述线段之间的相似度,在其中以权重的方式表示对线段不同属性的考虑程度。建立的线段相似度模型如下式所示:
Figure 448646DEST_PATH_IMAGE120
(5)
式中,
Figure 496237DEST_PATH_IMAGE121
表示线段相似度,
Figure 619044DEST_PATH_IMAGE122
分别表示在线段相似度模型中斜 率、跨度、增长率所占的权重比率。
基于上述的线段相似度模型,对线段集合使用K-means算法进行聚类分析,将相似度最大线段划分在同一集合中。
S6、线段集的符号化表示:为每个类型的线段集,分配一个符号,对不同类的线段集赋予不同的符号;集合中的所有线段统一用相应的符号表示;
S7、对所需分析的序列之间进行归总:不同序列线性化的结果各有不同,每两两线段之间进行分析前,先归总不同序列符号化后集合中元素数目,保证所有序列的元素数量相同。
1)由于挖掘序列关联性为两两序列一组进行分析,而不同的序列在线性化的过程中,数值分布特征不一,所以线性分段后,各个序列存在的线段数目也会不同;但挖掘的关联性的前提是不同序列的项集数目相同。
2)假设对于两个参数序列
Figure 752086DEST_PATH_IMAGE123
Figure 805492DEST_PATH_IMAGE124
,其分段线性化之后的端点集合分别为:
Figure 458322DEST_PATH_IMAGE125
Figure 1298DEST_PATH_IMAGE126
,其中
Figure 293739DEST_PATH_IMAGE127
Figure 963886DEST_PATH_IMAGE128
分别为序列 中的线段数量,对
Figure 530609DEST_PATH_IMAGE129
Figure 244487DEST_PATH_IMAGE130
进行合并,并去除其中存在的重复端点,得到参数序列
Figure 368432DEST_PATH_IMAGE131
Figure 763642DEST_PATH_IMAGE132
的合并端点集合
Figure 109172DEST_PATH_IMAGE133
3)根据合并的端点集合
Figure 10263DEST_PATH_IMAGE133
,对两参数序列进行归总,如果初始分段结果中某一 线段中间出现了新的端点,则将此线段从新的端点处分为两条线段,线段符号与初始分段 结果的符号相同。
S8、挖掘不同序列之间的关联性:基于Apriori算法的思想,设置最小置信度与支持度,挖掘不同序列之间存在的频繁项集,量化不同序列之间的关联性。
1)最小支持度与最小置信度参数的设置;置信度与支持度阈值时判定序列关联与 频繁项集的基础,合适的阈值参数有利于增强关联关系的可信度,记频繁-1与频繁-2项集 的最小支持度阈值为
Figure 339613DEST_PATH_IMAGE134
Figure 538514DEST_PATH_IMAGE135
,序列关联挖掘中的最小置信度阈值为
Figure 754862DEST_PATH_IMAGE136
2)频繁项集的生成;使用经过归总之后的两符号化序列作为事务集,记为
Figure 341702DEST_PATH_IMAGE137
,其中
Figure 640571DEST_PATH_IMAGE138
,两序 列对应的所有符号类别为:
Figure 377583DEST_PATH_IMAGE139
Figure 963285DEST_PATH_IMAGE140
,基于Apriori算法的 基本思想,本发明通过对事务集的两阶段扫描,得到序列的频繁项集。根据式(6)计算序列 中每个符号的置信度:
Figure 471758DEST_PATH_IMAGE141
(6)
式中
Figure 447805DEST_PATH_IMAGE142
Figure 785245DEST_PATH_IMAGE143
代表的是需要挖掘关联规则的两个指标对象,
Figure 507344DEST_PATH_IMAGE144
表示事务集的个 数,即序列中元素的个数,支持度表示的是项在事务集中的占比程度,在发掘频繁-1项集 时,将支持度大于
Figure 639248DEST_PATH_IMAGE134
的项划分至频繁-1项集的集合中。
记关联挖掘中两序列的频繁-1项集的集合分别为
Figure 368170DEST_PATH_IMAGE145
Figure 260034DEST_PATH_IMAGE146
,根据指标参数将集合 中的项两两配对,构成形如
Figure 85907DEST_PATH_IMAGE147
形式2-项集,计算每个项在该2-项集中的支持度,将 支持度大于
Figure 136515DEST_PATH_IMAGE135
的想划分至频繁-2项集,记为
Figure 352733DEST_PATH_IMAGE148
3)序列关联性的挖掘;将所有序列进行两两组合,分别统计其中存在的频繁-2项集中项的支持度以及对应关联挖掘序列之间的置信度;
首先根据式(7)对所有频繁-2项集在两指标参数之间的支持度累加,并以此作为这两个参数序列在所有多元序列中的支持度计数。
Figure 563135DEST_PATH_IMAGE149
(7)
Figure 728668DEST_PATH_IMAGE150
  (8)
Figure 467954DEST_PATH_IMAGE151
  (9)
其中
Figure 905888DEST_PATH_IMAGE152
Figure 405134DEST_PATH_IMAGE153
Figure 674441DEST_PATH_IMAGE154
为对两序列聚类分析之后的所划分出的线段类 别总数,
Figure 600940DEST_PATH_IMAGE109
为两序列归总后线段类别数目。同时记指标序列层面的最小支持度阈值为
Figure 526171DEST_PATH_IMAGE155
,若参数指标层面的支持度大于设置的阈值,则计算符号项集组合在两序列中 的置信度
Figure 812796DEST_PATH_IMAGE156
,如式(10)所示:
Figure 684412DEST_PATH_IMAGE157
(10)
当置信度大于所设置的最小置信度阈值时,保留关联规则
Figure 296659DEST_PATH_IMAGE158
,使用置信 度描述两指标之间的关联强度,判定两指标存在强关联。
本发明对完成归总操作的两条序列,基于Apriori算法的思路,通过设置的不同的 层次的最小支持度阈值
Figure 709186DEST_PATH_IMAGE159
,以及指标层面的最小置信度阈值
Figure 284655DEST_PATH_IMAGE160
,不断的挖 掘序列之间的存在的频繁项集,最终判定指标之间的关联关系强弱。
S9、判定DGA在线数据中不同异常模式的数据:根据序列之间的关联性强弱,对判定数据中存在的异常数值类型,分离出不同异常模式的数据。所述异常数值类型包括由于在线监测装置故障导致的异常类型的数据采样点和反映设备真实异常运行状态的异常类型的数据采样点。
本发明基于关联关系的数据异常模式判别:对于存在强关联关系的指标序列,对其中数据进行异常值监测,当两条序列检测出异常数值的采样时刻较为相近时,则判断该异常值为表征设备状态异常的状态数值,否则判定为监测装置运行异常导致的指标数值异常。
实施例
1、以某台主变设备的DGA历史在线监测数据为研究对象,考虑到油色谱的在线监测数据普遍以天为采样周期,也即一天一个指标采样数据;因此,本发明以接近两年的采样点数量(720个点)作为数据窗口长度,以季度采样点数量(90个点)为步长拖动数据窗口遍历整个历史数据集。以其中截取的一个窗口为例,得到其中五项指标的数据曲线如图2-6所示。
从上述气体指标的可视化结果可以看出,所有指标的在线数据可以等效为一条随采样点波动的数据曲线;因此,通过设置合理的拟合误差阈值,将指标序列进行分段拟合是切实可行的。
2、使用本发明提出的方法对以上截取的窗口序列数据进行分段线性化拟合,此处应注意:由于不同指标数据所处的数量级不同,所以在使用本发明提出的方式进行分段线性化拟合时,对不同的指标数据应该选取适当的拟合误差阈值,各个指标数据的具体闭合结果如图7-11所示。
由图7-11可知,DGA在线数据的五项气体指标拟合较为成功,以两个端点连成的线段表示线段跨度内的所有数据点,且以氢气为例,将其拟合的部分线段相关属性如表1所示。
表1 氢气在线数据分段后部分线段信息
Figure 528554DEST_PATH_IMAGE161
表1进一步证明了本发明提出的在线数据分段线性化算法的可行性,每条线段拟合的误差均小于设置的拟合误差阈值,且拟合的线段能较好的反映拟合区间内在线数据点的变化趋势,算法的有效性得到验证。
3、线段集合的符号化:由于关联关系的挖掘算法是基于布尔型变量设计的,不适用于DGA在线数据这种数值型的变量,因此,在关联关系挖掘之前需要对拟合出的线段集合进行聚类分析,将相似度较高的集合合并为同类,并使用一种符号表示的该类型线段。以氢气与甲烷的数据为例,其序列符号化的结果如表2、表3所示。
表2 氢气序列数据的符号化结果
Figure 983806DEST_PATH_IMAGE162
表3 甲烷序列数据的符号化结果
Figure 696679DEST_PATH_IMAGE163
4、不同符号化序列之间的归总:由于Apriori关联关系挖掘算法的思想是基于项集占比进行的,所以在分析序列关联关系之前需要保证不同符号化序列之间的项集元素个数相同,需要对序列进行归总操作。以氢气与甲烷序列数据为例,两者序列数据的归总结果如表4所示
表4 氢气与甲烷符号序列归总结果
Figure 59527DEST_PATH_IMAGE164
5、序列关联关系的挖掘:得到归总符号化序列之后,使用本发明提出的关联关系 挖掘算法,对序列进行关联关系分析,以氢气与甲烷两指标为例,分析由
Figure 95616DEST_PATH_IMAGE165
的 关联关系过程,其中频繁-1与频繁-2项集的相关信息如表5所示。
表5
Figure 800398DEST_PATH_IMAGE165
规则的频繁-1与频繁-2项集相关信息
Figure 187517DEST_PATH_IMAGE166
得到对应的频繁项集之后,使用本发明提出的方法分析两指标之间的关联性,以 支持度便于置信度表示关联关系的强弱,得到
Figure 354056DEST_PATH_IMAGE165
的支持度与置信度分别为 0.5050与0.6804,均大于所设置的相关最小阈值,表示该规则为强关联规则,说明氢气与甲 烷指标之间存在强关联关系。
6、不同异常模式的数据判别:在已知氢气与甲烷存在强关联关系的情况下,对两指标序列进行异常值检测,发现氢气在线数据在第42至54,第85至91以及201至206个数值采样点出现异常值,而在这些点附近的采样时段中甲烷气体的在线数据未出现异常情况,那么判断这些异常采样点为监测装置运行状态异常造成,划入被清洗的数据集合,作为在线监测装置运行状态判别的依据。
而在第466至471个采样点,甲烷在线监测数据出现异常,在第466至473个采样点,氢气在线监测数据出现异常,两指标在线数据出现异常时段相近,将附近采样时段的指标数据保留,标记为设备运行状态异常点,检测结果如图12所示。

Claims (7)

1.一种变压器DGA在线监测数据异常模式判定方法,其特征在于步骤如下:
S1、DGA在线监测数据的导入与滑动窗口算法的基本参数设置:导入DGA在线监测数据,设置滑动窗口的长度为L,设置滑动步长为l
S2、以一定的步长滑动窗口遍历在线数据集:拖动滑动窗口于整体在线监测数据集上 以滑动步长 l滑动,直至遍历所有数据;令在线监测数据集长度为
Figure 226230DEST_PATH_IMAGE001
,遍历之后得到
Figure 111009DEST_PATH_IMAGE002
个数据窗口,当
Figure 955206DEST_PATH_IMAGE003
为小数时,向下取整,保留构成完整窗口的数据进行分析;导出 所有窗口中的数据,构成待分析数据集DS i
Figure 950844DEST_PATH_IMAGE004
S3、序列数据的分段线性化:以待分析数据集DS i 中某窗口内数据为例进行分析,使用基于最小二乘的滑动数据分段线性化算法,将在线监测数据中不定量的点组合在一起,形成多组数据点集,对同一组的数据点集使用最小二乘法拟合,得到一条包含组内所有点的线段;
S4、数据点集属性表征:使用拟合所得线段的斜率、包含数据的实际增长率以及该线段的跨度,构成线段属性三元组,所有拟合出的线段构成线段集;
S5、构建描述不同线段相似度的模型:基于线段属性三元组中的元素,构建描述的线段相似度的模型,并使用K-means算法对线段集进行聚类分析;
S6、线段集的符号化表示:为每个类型的线段集,分配一个符号,对不同类的线段集赋予不同的符号;集合中的所有线段统一用相应的符号表示;
S7、对所需分析的序列之间进行归总:不同序列线性化的结果各有不同,每两两线段之间进行分析前,先归总不同序列符号化后集合中元素数目,保证所有序列的元素数量相同;
S8、挖掘不同序列之间的关联性:基于Apriori算法的思想,设置最小置信度与支持度,挖掘不同序列之间存在的频繁项集,量化不同序列之间的关联性;
S9、判定DGA在线数据中不同异常模式的数据:根据序列之间的关联性强弱,判定提取的窗口内数据存在的异常数值类型,分离出不同异常模式的数据。
2.根据权利要求1所述的一种变压器DGA在线监测数据异常模式判定方法,其特征是:步骤S3具体步骤是:
S3.1对于形如DGA的设备指标在线监测数据,等效为时间序列数据;
S3.2对时间序列
Figure 432772DEST_PATH_IMAGE005
,以长度为L,L<k的滑动窗口截取数据点,
Figure 754032DEST_PATH_IMAGE006
指的 是分析整体DGA在线数据中含有数据点的个数,对截取窗口内的数据,基于滑动窗口的思 想,对其中含有的数据点进行分段线性拟合;
S3.3以窗口内的首个数据点为初始线段的拟合起点,令该点为
Figure 819946DEST_PATH_IMAGE007
,假设初始线段的拟 合终点为
Figure 884854DEST_PATH_IMAGE008
,将这
Figure 486868DEST_PATH_IMAGE009
个数据点拟合为一条线段;
S3.4那么对于这样一条线段,其可以用如下所示的式子表达:
Figure 713450DEST_PATH_IMAGE010
(1)
Figure 158338DEST_PATH_IMAGE011
(2)
上式(1)和(2)中
Figure 276204DEST_PATH_IMAGE012
表示时间序列中
Figure 981992DEST_PATH_IMAGE013
时刻的采样数值,
Figure 661366DEST_PATH_IMAGE014
表示拟合线段中含有的数 值点数量,
Figure 327971DEST_PATH_IMAGE015
表示拟合线段方程的因变量;
Figure 734681DEST_PATH_IMAGE016
为指标序列数值点
Figure 550103DEST_PATH_IMAGE017
至拟合线段的距离,统计式(1)所表达的线段区间中所有的 数据点至线段的距离之和作为该条线段的拟合误差
Figure 649646DEST_PATH_IMAGE018
Figure 678913DEST_PATH_IMAGE019
 (3)
Figure 623735DEST_PATH_IMAGE020
     (4)
设置拟合误差阈值为
Figure 179481DEST_PATH_IMAGE021
,如果
Figure 699193DEST_PATH_IMAGE022
,则说明该线段仍然可以继续增加拟合 点,令
Figure 199445DEST_PATH_IMAGE023
,并重复上述步骤S3.4;如果有
Figure 698690DEST_PATH_IMAGE024
,则认为线段拟合至该点为 止;如果有
Figure 233577DEST_PATH_IMAGE025
,则判定该线段无法拟合,保存当前线段的拟合终点为
Figure 393031DEST_PATH_IMAGE026
,记录其数据采样时刻,之后回到步骤S3.3,重置参数
Figure 646158DEST_PATH_IMAGE027
,并以当前拟 合终点作为下一线段的拟合起点进行下一部分的数据拟合,直至该序列中所有的数据点都 拟合完毕。
3.根据权利要求2所述的一种变压器DGA在线监测数据异常模式判定方法,其特征是: 步骤S4中提出的线段属性三元组表示方法为:假设拟合的线段的斜率为
Figure 949095DEST_PATH_IMAGE028
,线段中拟合数 值点个数为
Figure 338488DEST_PATH_IMAGE029
,那么该线段拟合数据的实际增长率可以表示为:
Figure 560522DEST_PATH_IMAGE030
Figure 550212DEST_PATH_IMAGE031
表示该线段拟合的起点,以
Figure 906107DEST_PATH_IMAGE032
三个元素构成线段的三元组
Figure 900739DEST_PATH_IMAGE033
,以该三元 组表示拟合出的一条线段。
4.根据权利要求3所述的一种变压器DGA在线监测数据异常模式判定方法,其特征是:步骤S5的具体步骤是:
S5.1由于DGA在线监测数据中不同指标之间存在一定的数量级差异,首先需要对同一 序列中存在的所有线段三元组进行形如
Figure 683887DEST_PATH_IMAGE034
的归一化操作;
Figure 521393DEST_PATH_IMAGE035
指代归一 化操作之后的元素,
Figure 658808DEST_PATH_IMAGE036
指代三元组中任意一个元素,
Figure 288373DEST_PATH_IMAGE037
为指标检测量中最小值,
Figure 727575DEST_PATH_IMAGE038
为 指标监测量中最大值;
S5.2在聚类分析时,建立衡量线段相似度的标准;使用欧式距离描述线段之间的相似度,在其中以权重的方式表示对线段不同属性的考虑程度;建立的线段相似度模型如下式所示:
Figure 177011DEST_PATH_IMAGE039
(5)
式中,
Figure 750075DEST_PATH_IMAGE040
表示线段相似度,
Figure 483414DEST_PATH_IMAGE041
分别表示在线段相似度模型中斜率、跨 度、增长率所占的权重比率;
S5.3基于上述的线段相似度模型,对线段集合使用K-means算法进行聚类分析,将相似度最大线段划分在同一集合中。
5.根据权利要求1所述的一种变压器DGA在线监测数据异常模式判定方法,其特征是:步骤S7具体过程为:
S7.1由于挖掘序列关联性为两两序列一组进行分析,而不同的序列在线性化的过程中,数值分布特征不一,所以线性分段后,各个序列存在的线段数目也会不同;但挖掘的关联性的前提是不同序列的项集数目相同;
S7.2假设对于两个参数序列
Figure 608364DEST_PATH_IMAGE042
Figure 30250DEST_PATH_IMAGE043
,其分段线性化之后的端点集合分别为:
Figure 266059DEST_PATH_IMAGE044
Figure 480003DEST_PATH_IMAGE045
,其中
Figure 25122DEST_PATH_IMAGE046
Figure 449150DEST_PATH_IMAGE047
分别为序 列中的线段数量,对
Figure 973804DEST_PATH_IMAGE048
Figure 166888DEST_PATH_IMAGE049
进行合并,并去除其中存在的重复端点,得到参数序列
Figure 509007DEST_PATH_IMAGE050
Figure 669599DEST_PATH_IMAGE051
的合并端点集合
Figure 512790DEST_PATH_IMAGE052
S7.3根据合并的端点集合
Figure 45534DEST_PATH_IMAGE052
,对两参数序列进行归总,如果初始分段结果中某一线 段中间出现了新的端点,则将此线段从新的端点处分为两条线段,线段符号与初始分段结 果的符号相同。
6.根据权利要求1所述的一种变压器DGA在线监测数据异常模式判定方法,其特征是:步骤S8中序列关联性挖掘的主要过程为:
S8.1最小支持度与最小置信度参数的设置;记频繁-1与频繁-2项集的最小支持度阈值 为
Figure 683189DEST_PATH_IMAGE053
Figure 957175DEST_PATH_IMAGE054
,序列关联挖掘中的最小置信度阈值为
Figure 593605DEST_PATH_IMAGE055
S8.2频繁项集的生成;使用经过归总之后的两符号化序列作为事务集,记为
Figure 761281DEST_PATH_IMAGE056
,其中
Figure 320569DEST_PATH_IMAGE057
,DGA 在线指标提取分析的两条气体序列数据对应的所有符号类别为:
Figure 940907DEST_PATH_IMAGE058
Figure 735687DEST_PATH_IMAGE059
,基于Apriori算法,通过对事务集的两阶段扫描,得到序列的频繁项 集;根据式(6)计算序列中每个符号的置信度:
Figure 7137DEST_PATH_IMAGE060
 (6)
式中
Figure 252174DEST_PATH_IMAGE061
Figure 110540DEST_PATH_IMAGE062
代表的是需要挖掘关联规则的两个指标对象,
Figure 568066DEST_PATH_IMAGE063
表示事务集的个数,即 序列中元素的个数,支持度表示的是项在事务集中的占比程度,在发掘频繁-1项集时,将支 持度大于
Figure 585700DEST_PATH_IMAGE053
的项划分至频繁-1项集的集合中,
Figure 719747DEST_PATH_IMAGE064
表示对项集元素的计数;
记关联挖掘中两序列的频繁-1项集的集合分别为
Figure 49098DEST_PATH_IMAGE065
Figure 326626DEST_PATH_IMAGE066
,根据指标参数将集合中的 项两两配对,构成形如
Figure 323401DEST_PATH_IMAGE067
形式2-项集,
Figure 628349DEST_PATH_IMAGE068
Figure 710575DEST_PATH_IMAGE069
分别表示序列
Figure 650849DEST_PATH_IMAGE070
与序列
Figure 252863DEST_PATH_IMAGE071
中挖掘出 的频繁1项集,计算每个项在该2-项集中的支持度,将支持度大于
Figure 10603DEST_PATH_IMAGE054
的项划分至频 繁-2项集,记为
Figure 581391DEST_PATH_IMAGE072
S8.3序列关联性的挖掘;将所有序列进行两两组合,分别统计其中存在的频繁-2项集中项的支持度以及对应关联挖掘序列之间的置信度;
首先根据式(7)对所有频繁-2项集在两指标参数之间的支持度累加,并以此作为这两个参数序列在所有多元序列中的支持度计数;
Figure 184411DEST_PATH_IMAGE073
(7)
Figure 31144DEST_PATH_IMAGE074
(8)
Figure 444939DEST_PATH_IMAGE075
(9)
其中
Figure 236178DEST_PATH_IMAGE076
,为对两序列聚类分析之后的所划分出的线段类别总数;
Figure 892156DEST_PATH_IMAGE064
表示 对项集元素的计数;
Figure 718029DEST_PATH_IMAGE077
Figure 692939DEST_PATH_IMAGE078
表示的为序列
Figure 722206DEST_PATH_IMAGE070
Figure 932607DEST_PATH_IMAGE071
中属于频繁1项集的项集元素;同时记 指标序列层面的最小支持度阈值为
Figure 596676DEST_PATH_IMAGE079
,若参数指标层面的支持度大于设置的阈值, 则计算符号项集组合在两序列中的置信度
Figure 601541DEST_PATH_IMAGE080
,如式(10)所示:
Figure 118104DEST_PATH_IMAGE081
(10)
当置信度大于所设置的最小置信度阈值时,保留关联规则
Figure 741983DEST_PATH_IMAGE082
,使用置信度描 述两指标之间的关联强度,判定两指标存在强关联。
7.根据权利要求1所述的一种变压器DGA在线监测数据异常模式判定方法,其特征是:步骤S9所述异常数值类型包括由于在线监测装置故障导致的异常类型的数据采样点和反映设备真实异常运行状态的异常类型的数据采样点。
CN202110330366.5A 2021-03-29 2021-03-29 一种变压器dga在线监测数据异常模式判定方法 Pending CN112800686A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110330366.5A CN112800686A (zh) 2021-03-29 2021-03-29 一种变压器dga在线监测数据异常模式判定方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110330366.5A CN112800686A (zh) 2021-03-29 2021-03-29 一种变压器dga在线监测数据异常模式判定方法

Publications (1)

Publication Number Publication Date
CN112800686A true CN112800686A (zh) 2021-05-14

Family

ID=75815850

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110330366.5A Pending CN112800686A (zh) 2021-03-29 2021-03-29 一种变压器dga在线监测数据异常模式判定方法

Country Status (1)

Country Link
CN (1) CN112800686A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113780082A (zh) * 2021-08-10 2021-12-10 南昌大学 一种基于滑动窗口搜索的车道线检测方法
CN113792754A (zh) * 2021-08-12 2021-12-14 国网江西省电力有限公司电力科学研究院 一种先除异后修复的换流变dga在线监测数据处理方法
CN113987033A (zh) * 2021-12-28 2022-01-28 国网江西省电力有限公司电力科学研究院 主变在线监测数据群体偏差识别与校准方法
CN114372093A (zh) * 2021-12-15 2022-04-19 南昌大学 一种变压器dga在线监测数据的处理方法
CN114693110A (zh) * 2022-03-29 2022-07-01 杭州安脉盛智能技术有限公司 一种储能系统的异常监测方法、系统及存储介质
CN115496644A (zh) * 2022-11-18 2022-12-20 山东超华环保智能装备有限公司 基于数据识别的固体废弃物处理设备监测方法
CN115840895A (zh) * 2021-12-31 2023-03-24 江苏常胜电器(淮安)有限公司 一种电子器件温度保护系统
CN116150636A (zh) * 2023-04-18 2023-05-23 苏州上舜精密工业科技有限公司 一种传动模组的故障监测方法及系统
CN116776258A (zh) * 2023-08-24 2023-09-19 北京天恒安科集团有限公司 电力设备监测数据处理方法及系统
CN116881745A (zh) * 2023-09-07 2023-10-13 深圳市特安工业科技有限公司 基于大数据的压力变送器异常监测方法
CN117235519A (zh) * 2023-09-13 2023-12-15 港华数智能源科技(深圳)有限公司 能源数据处理方法、装置及存储介质
CN118282413A (zh) * 2024-05-31 2024-07-02 中建五局第三建设有限公司 一种用于超高层钢结构施工过程的监测数据管理方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106909664A (zh) * 2017-02-28 2017-06-30 国网福建省电力有限公司 一种电力设备数据流故障识别方法
CN110008253A (zh) * 2019-03-28 2019-07-12 浙江大学 基于两阶段频繁项集产生策略的工业数据关联规则挖掘及异常工况预测方法
CN110018670A (zh) * 2019-03-28 2019-07-16 浙江大学 一种基于动态关联规则挖掘的工业过程异常工况预测方法
CN112380274A (zh) * 2020-11-16 2021-02-19 北京航空航天大学 一种面向控制过程的异常检测系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106909664A (zh) * 2017-02-28 2017-06-30 国网福建省电力有限公司 一种电力设备数据流故障识别方法
CN110008253A (zh) * 2019-03-28 2019-07-12 浙江大学 基于两阶段频繁项集产生策略的工业数据关联规则挖掘及异常工况预测方法
CN110018670A (zh) * 2019-03-28 2019-07-16 浙江大学 一种基于动态关联规则挖掘的工业过程异常工况预测方法
CN112380274A (zh) * 2020-11-16 2021-02-19 北京航空航天大学 一种面向控制过程的异常检测系统

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113780082A (zh) * 2021-08-10 2021-12-10 南昌大学 一种基于滑动窗口搜索的车道线检测方法
CN113792754A (zh) * 2021-08-12 2021-12-14 国网江西省电力有限公司电力科学研究院 一种先除异后修复的换流变dga在线监测数据处理方法
CN113792754B (zh) * 2021-08-12 2024-08-16 国网江西省电力有限公司电力科学研究院 一种先除异后修复的换流变dga在线监测数据处理方法
CN114372093A (zh) * 2021-12-15 2022-04-19 南昌大学 一种变压器dga在线监测数据的处理方法
CN113987033A (zh) * 2021-12-28 2022-01-28 国网江西省电力有限公司电力科学研究院 主变在线监测数据群体偏差识别与校准方法
CN113987033B (zh) * 2021-12-28 2022-04-12 国网江西省电力有限公司电力科学研究院 主变在线监测数据群体偏差识别与校准方法
CN115840895B (zh) * 2021-12-31 2024-05-03 江苏常胜电器(淮安)有限公司 一种电子器件温度保护系统
CN115840895A (zh) * 2021-12-31 2023-03-24 江苏常胜电器(淮安)有限公司 一种电子器件温度保护系统
CN114693110A (zh) * 2022-03-29 2022-07-01 杭州安脉盛智能技术有限公司 一种储能系统的异常监测方法、系统及存储介质
CN115496644A (zh) * 2022-11-18 2022-12-20 山东超华环保智能装备有限公司 基于数据识别的固体废弃物处理设备监测方法
CN115496644B (zh) * 2022-11-18 2023-09-26 南通万达能源动力科技有限公司 基于数据识别的固体废弃物处理设备监测方法
CN116150636A (zh) * 2023-04-18 2023-05-23 苏州上舜精密工业科技有限公司 一种传动模组的故障监测方法及系统
CN116776258B (zh) * 2023-08-24 2023-10-31 北京天恒安科集团有限公司 电力设备监测数据处理方法及系统
CN116776258A (zh) * 2023-08-24 2023-09-19 北京天恒安科集团有限公司 电力设备监测数据处理方法及系统
CN116881745B (zh) * 2023-09-07 2023-12-19 深圳市特安工业科技有限公司 基于大数据的压力变送器异常监测方法
CN116881745A (zh) * 2023-09-07 2023-10-13 深圳市特安工业科技有限公司 基于大数据的压力变送器异常监测方法
CN117235519A (zh) * 2023-09-13 2023-12-15 港华数智能源科技(深圳)有限公司 能源数据处理方法、装置及存储介质
CN118282413A (zh) * 2024-05-31 2024-07-02 中建五局第三建设有限公司 一种用于超高层钢结构施工过程的监测数据管理方法

Similar Documents

Publication Publication Date Title
CN112800686A (zh) 一种变压器dga在线监测数据异常模式判定方法
WO2015176565A1 (zh) 一种基于多维时间序列的电气设备故障预测方法
CN110895526A (zh) 一种大气监测系统中数据异常的修正方法
CN109615004A (zh) 一种多源数据融合的防窃电预警方法
Feng et al. Data mining for abnormal power consumption pattern detection based on local matrix reconstruction
CN113792754B (zh) 一种先除异后修复的换流变dga在线监测数据处理方法
CN110889441A (zh) 一种基于距离和点密度的变电设备数据异常识别方法
CN109947815B (zh) 一种基于离群点算法的窃电辨识方法
CN106933097B (zh) 一种基于多层优化pcc-sdg的化工过程故障诊断方法
CN109583679A (zh) 一种多算法融合的窃电疑似度分析方法
CN116756595A (zh) 一种导电滑环故障数据采集监测方法
CN116780781B (zh) 智能电网接入的功率管理方法
CN114372093A (zh) 一种变压器dga在线监测数据的处理方法
CN111709668A (zh) 基于数据挖掘技术的电网设备参数风险识别方法及装置
CN110097141A (zh) 一种采集运维系统智能故障检测方法
CN109142830A (zh) 基于用电信息采集系统大数据的窃电检测方法
CN105445579A (zh) 多尺度时序分析的油色谱在线监测数据可视化系统及方法
CN116203352A (zh) 一种配电网的故障预警方法、装置、设备及介质
CN110348683A (zh) 电能质量扰动事件主成因分析方法、装置设备及存储介质
CN115827577A (zh) 智能电表高频数据压缩与重构的云端协同自适应分治方法
CN115409120A (zh) 一种基于数据驱动的用户窃电行为检测辅助方法
CN111339986A (zh) 基于时域/频域分析的装备用频规律挖掘方法和系统
Pan et al. Study on intelligent anti–electricity stealing early-warning technology based on convolutional neural networks
CN117390546A (zh) 一种面向即时反窃电检测的多模数据库融合存算模型
Zhang et al. Anomalous state detection of dissolved gases in transformer oil based on the canopy hyper sphere model

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210514