CN112800686A - 一种变压器dga在线监测数据异常模式判定方法 - Google Patents
一种变压器dga在线监测数据异常模式判定方法 Download PDFInfo
- Publication number
- CN112800686A CN112800686A CN202110330366.5A CN202110330366A CN112800686A CN 112800686 A CN112800686 A CN 112800686A CN 202110330366 A CN202110330366 A CN 202110330366A CN 112800686 A CN112800686 A CN 112800686A
- Authority
- CN
- China
- Prior art keywords
- data
- line segment
- sequences
- sequence
- fitting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01R—MEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
- G01R31/00—Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Computer Hardware Design (AREA)
- Geometry (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种变压器DGA在线监测数据异常模式判定方法,导入DGA在线监测数据,设置滑动窗口的长度和滑动步长,以一定的步长滑动窗口遍历在线数据集,对截取的每个数据窗口,使用基于最小二乘的滑动数据分段线性化算法拟合,使用拟合所得线段的斜率、包含数据的实际增长率以及该线段的跨度表征拟合出的这条线段,构建描述的线段相似度的模型,并使用K‑means算法对线段集进行聚类分析;线段集的符号化表示,归总不同序列符号化后集合中元素数目;基于Apriori算法的思想,挖掘不同序列之间存在的频繁项集,量化不同序列之间的关联性,根据序列之间的关联性强弱,对判定数据中存在的异常数值类型,分离出不同异常模式的数据。
Description
技术领域
本发明涉及一种变压器DGA在线监测数据异常模式判定方法,属于电力设备数据处理技术领域。
背景技术
电力变压器是电能转换与传输的枢纽设备,其安全稳定的运行是对用户供电质量的重要保障。变压器的铁芯接地电流监测数据是对变压器进行状态评估的重要依据。一段时间的监测数据,包含其整体变化趋势、变化中的极值点及跃变点以及数据统计特征,可以从多方面反映电力变压器的内部可能存在的异常情况。
由于设备所处运行环境以及变压器本身存在的一些电磁干扰作用,在线监测装置在数据的采集传输过程中容易出现随机分布的异常数值点,严重时甚至出现数据漂移,传输中断的情况。对数据漂移、数据中断等明显数据异常现象,后台系统可以很快的进行辨别,并针对问题进行报警;但对于那些随机分布于正常在线数据中的异常数值点,对设备状态指标的实时表征起到严重的干扰作用,也对基于指标的状态评价工作产生影响,容易造成设备异常状态的误报、错报等情况,导致设备的运行检修资源的浪费。
经过电力设备的长期运行,已有较大规模的指标数据存储于电力数据库中,其中必然包含不同异常模式的指标数据,通过对已有的指标数据进行关联分析,挖掘出其中存在的关联关系,基于该关联关系分析数据中不同异常模式的数据,有利完善电力设备的综合状态评价体系,提早发现设备装置的异常状态,提高设备检修效率,降低设备的运维成本。
变压器的DGA指标在线数据是对设备绝缘性能的实时监测,基于油色谱数据的分析,可以快速得出变压器所处的实时状态;同时DGA数据中指标维度较多,通过对其中指标的关联关系挖掘,有助于甄别在线数据中不同异常模式的数据,可以增强设备综合状态评价结果的可信度。
变电设备的在线数据通常需要经过采集、转化、传输,最后才能存储在系统数据库中,该数据是对设备状态的实时监控与展示。然而由于人为操作失误、运行环境恶劣、强电磁干扰等因素的影响,系统收集的在线数据中通常存在较多的问题,在线数据对设备状态的表征的可信度受到了较大的影响。
发明内容
本发明所解决的技术问题在于提供一种变压器DGA在线监测数据异常模式判定方法,以解决上述技术背景的问题。
本发明通过以下技术方案来实现,一种变压器DGA在线监测数据异常模式判定方法,具体步骤如下:
S1、DGA在线监测数据的导入与滑动窗口算法的基本参数设置:导入DGA在线监测数据,设置滑动窗口的长度为L,设置滑动步长为l。
S2、以一定的步长滑动窗口遍历在线数据集:拖动窗口于整体在线监测数据集上
以滑动步长 l滑动,直至遍历所有数据;令在线监测数据集长度为,遍历之后得到个数据窗口,当为小数时,向下取整,保留构成完整窗口的数据进行分析;导
出所有窗口中的数据,构成待分析数据集DS i ,,数据处理将以数据窗口作为分析的基
本单位;
S3、序列数据的分段线性化:以待分析数据集DS i 中某窗口内数据为例进行分析,使用基于最小二乘的滑动数据分段线性化算法,将在线监测数据中不定量的点组合在一起,形成多组数据点集,对同一组的数据点集使用最小二乘法拟合,得到一条包含组内所有点的线段;
S4、数据点集属性表征:使用拟合所得线段的斜率、包含数据的实际增长率以及该线段的跨度(即线段包含数据点的个数),构成线段属性三元组,表征拟合出的这条线段,所有拟合出的线段构成线段集;
S5、构建描述不同线段相似度的模型:基于线段属性三元组中的元素,构建描述的线段相似度的模型,并使用K-means算法对线段集进行聚类分析;
S6、线段集的符号化表示:为每个类型的线段集,分配一个符号,对不同类的线段集赋予不同的符号;集合中的所有线段统一用相应的符号表示;
S7、对所需分析的序列之间进行归总:不同序列线性化的结果各有不同,每两两线段之间进行分析前,先归总不同序列符号化后集合中元素数目,保证所有序列的元素数量相同;
S8、挖掘不同序列之间的关联性:基于Apriori算法的思想,设置最小置信度与支持度,挖掘不同序列之间存在的频繁项集,量化不同序列之间的关联性。
S9、判定DGA在线数据中不同异常模式的数据:根据序列之间的关联性强弱,判定提取的窗口内数据存在的异常数值类型,分离出不同异常模式的数据。
进一步地,步骤S3具体步骤是:
1)形如DGA的设备指标在线监测数据(指的是按一定间隔采样的设备状态指标数据,DGA是其中一种),其本质可以看作为按着一定的时间间隔顺序,一个个采集的状态指标数值;可知数据具有很强的时间属性,可以等效为时间序列数据;
4)那么对于这样一条线段,其可以用如下所示的式子表达:
5)设置拟合误差阈值为,如果,则说明该点短仍然可以继续增加拟
合点,令,并重复步骤上述步骤4);如果有,则认为线段拟合至该点为
止;如果有,则判定该线段无法拟合,保存当前线段的拟合终点为,记录其数据采样时刻,之后回到步骤3),重置参数,并以当前拟合终点
作为下一线段的拟合起点进行下一部分的数据拟合,直至该序列中所有的数据点都拟合完
毕。
进一步地,步骤S4中提出的线段属性三元组表示方法主要为:假设拟合的线段的
斜率为,线段中拟合数值点个数为,那么该线段拟合数据的实际增长率可以表示为:,表示改线段拟合的起点,以三个元素构成线段的三
元组,以该三元组表示拟合出的一条线段。
进一步地,步骤S5中构建线段相似度模型,并基于此模型进行聚类分析的主要步骤是:
1)由于DGA在线监测中不同指标之间存在一定的数量级差异,首先需要对同一序
列中存在的所有线段三元组进行形如的归一化操作;指代归一化操
作之后的元素,指代三元组中任意一个元素,为指标检测量中最小值,为指
标监测量中最大值。
2)在聚类分析时,需要建立衡量线段相似度的标准;DGA在线数据反映的是设备实时指标,而其中参数的变化趋势和形态最能体现设备运行状态的变化,因此,在建立衡量线段相似度模型时,对线段三元组中不同属性需要有不同的考虑,本发明使用欧式距离描述线段之间的相似度,在其中以权重的方式表示对线段不同属性的考虑程度。建立的线段相似度模型如下式所示:
3)基于上述的线段相似度模型,对线段集合使用K-means算法进行聚类分析,将相似度最大线段划分在同一集合中。
进一步地,步骤S7具体过程为:
1)由于挖掘序列关联性为两两序列一组进行分析,而不同的序列在线性化的过程中,数值分布特征不一,所以线性分段后,各个序列存在的线段数目也会不同;但挖掘的关联性的前提是不同序列的项集数目相同。
进一步地,步骤S8中序列关联性挖掘的主要过程为:
1)最小支持度与最小置信度参数的设置;置信度与支持度阈值时判定序列关联与
频繁项集的基础,合适的阈值参数有利于增强关联关系的可信度,记频繁-1与频繁-2项集
的最小支持度阈值为与,序列关联挖掘中的最小置信度阈值为。
2)频繁项集的生成;使用经过归总之后的两符号化序列作为事务集,记为,其中,DGA在
线指标提取分析的两条气体序列数据对应的所有符号类别为:和,基于Apriori算法的基本思想,本发明通过对事务集的两阶段扫描,得
到序列的频繁项集。根据式(6)计算序列中每个符号的置信度:
式中与代表的是需要挖掘关联规则的两个指标对象,表示事务集的个
数,即序列中元素的个数,表示对项集元素的计数,支持度表示的是项在事务集中的占
比程度,在发掘频繁-1项集时,将支持度大于的项划分至频繁-1项集的集合中。
记关联挖掘中两序列的频繁-1项集的集合分别为、,根据指标参数将集合
中的项两两配对,构成形如形式2-项集,与分别表示序列与序列中
挖掘出的频繁1项集,计算每个项在该2-项集中的支持度,将支持度大于的项划
分至频繁-2项集,记为。
3)序列关联性的挖掘;将所有序列进行两两组合,分别统计其中存在的频繁-2项集中项的支持度以及对应关联挖掘序列之间的置信度;
首先根据式(7)对所有频繁-2项集在两指标参数之间的支持度累加,并以此作为这两个参数序列在所有多元序列中的支持度计数。
其中,为对两序列聚类分析之后的所划分出的线段类别总数。
表示对项集元素的计数,与表示为序列、中属于频繁1项集的项集元素。同时
记指标序列层面的最小支持度阈值为,若参数指标层面的支持度大于设置的阈
值,则计算符号项集组合在两序列中的置信度,如式(10)所示:
进一步地,步骤S9所述异常数值类型包括由于在线监测装置故障导致的异常类型的数据采样点和反映设备真实异常运行状态的异常类型的数据采样点。
电力变压器经过多年的运行,其DGA在线监测数据通常具有较大的规模,同时对整个数据集进行处理通常会加大算法的复杂程度及服务器的运行压力,可行性较低;本发明根据传回的在线DGA数据特征,在对数据的处理中引入滑动窗口的思想。划定长度的窗口截取DGA在线数据,并以固定的步长拖动窗口滑动,直至遍历整体在线数据;对于划分出的每个窗口,本发明针对序列数据的特点,提出了一种基于最小二乘思想的滑动序列数据分段线性化算法;对于线段化之后的数据,以线段的斜率、跨度等属性表示;基于这些属性,建立相应模型表征不同线段之间的相似性,并基于此模型对线段集合使用K-means算法进行聚类分析,根据聚类结果完成序列数据的符号化。最后将符号化序列进行两两归总,基于Apriori算法思想,以符号化之后的序列数据作为事务集,根据序列置信度与支持度,挖掘不同序列之间的关联性,并根据序列之间的关联性挖掘结果判别在线DGA数据中存在的不同模式异常值。
附图说明
图1为本发明的流程图。
图2为氢气指标在线数据。
图3为甲烷指标在线数据。
图4为乙烷指标在线数据。
图5为乙烯指标在线数据。
图6为乙炔指标在线数据。
图7为氢气指标拟合对比图。
图8为甲烷指标拟合对比图。
图9为乙烷指标拟合对比图。
图10为乙烯指标拟合对比图。
图11为乙炔指标拟合对比图。
图12是氢气与甲烷序列检测出的异常点。
具体实施方式
下面结合附图进一步详细阐明本发明。
参照图1,一种变压器DGA在线监测数据异常模式判定方法,具体步骤如下:
S1、DGA在线监测数据的导入与滑动窗口算法的基本参数设置:导入DGA在线监测数据,设置滑动窗口的长度为L,设置滑动步长为l。
S2、以一定的步长滑动窗口遍历在线数据集:拖动滑动窗口在整体在线监测数据
集上以滑动步长l滑动,直至遍历所有数据;令在线监测数据集长度为,遍历之后得到个数据窗口,导出所有窗口中的数据,构成待分析数据集DS i ,,数据处理
将以数据窗口作为分析的基本单位;
S3、序列数据的分段线性化:对截取的每个数据窗口,使用基于最小二乘的滑动数据分段线性化算法,将在线监测数据中不定量的点组合在一起,形成多组数据点集,对同一组的数据点集使用最小二乘法拟合,得到一条包含组内所有点的线段。
对于截取的数据窗口,根据DGA监测指标分别提取其对应的序列数据,本发明
主要研究的是DGA中这5类气体,因此在数据
窗口中可以得到对应的5个序列。对每条序列进行分段线性化处理,将序列数据转化为
数量不等的线段集合。
序列数据的分段线性化具体步骤是:
1)对于类似DGA的设备指标在线监测数据,其本质可以看作为按着一定的时间间隔顺序,一个个采集的状态指标数值;可知数据具有很强的时间属性,可以等效为时间序列数据;
4)那么对于这样一条线段,其可以用如下所示的式子表达:
设置拟合误差阈值为,如果,则说明该点短仍然可以继续增加拟
合点,令,并重复步骤上述步骤;如果有,则认为线段拟合至该点为
止;如果有,则判定该线段无法拟合,保存当前线段的拟合终点为
,记录其数据采样时刻,之后回到步骤3),重置参数,并以当前拟合终点作为下一线段的
拟合起点进行下一部分的数据拟合,直至该序列中所有的数据点都拟合完毕。
S4、数据点集属性表征:使用拟合所得线段的斜率、包含数据的实际增长率以及该线段的跨度(即线段包含数据点的个数),构成线段属性三元组,表征拟合出的这条线段。
S5、构建描述不同线段相似度的模型:基于线段属性三元组中的元素,构建描述的线段相似度的模型,并使用K-means算法对线段集进行聚类分析。
对以数组形式表达的线段集合,本发明基于其中的相关参数使用欧式距离的方法
建立描述线段相似度的模型,并根据此相似度模型,使用K-means聚类算法对线段集合
进行聚类分析,将相似程度较高的线段合并为一个类别。
2)在聚类分析时,需要建立衡量线段相似度的标准;DGA在线数据反映的是设备实时指标,而其中参数的变化趋势和形态最能体现设备运行状态的变化,因此,在建立衡量线段相似度模型时,对线段三元组中不同属性需要有不同的考虑,本发明使用欧式距离描述线段之间的相似度,在其中以权重的方式表示对线段不同属性的考虑程度。建立的线段相似度模型如下式所示:
基于上述的线段相似度模型,对线段集合使用K-means算法进行聚类分析,将相似度最大线段划分在同一集合中。
S6、线段集的符号化表示:为每个类型的线段集,分配一个符号,对不同类的线段集赋予不同的符号;集合中的所有线段统一用相应的符号表示;
S7、对所需分析的序列之间进行归总:不同序列线性化的结果各有不同,每两两线段之间进行分析前,先归总不同序列符号化后集合中元素数目,保证所有序列的元素数量相同。
1)由于挖掘序列关联性为两两序列一组进行分析,而不同的序列在线性化的过程中,数值分布特征不一,所以线性分段后,各个序列存在的线段数目也会不同;但挖掘的关联性的前提是不同序列的项集数目相同。
S8、挖掘不同序列之间的关联性:基于Apriori算法的思想,设置最小置信度与支持度,挖掘不同序列之间存在的频繁项集,量化不同序列之间的关联性。
1)最小支持度与最小置信度参数的设置;置信度与支持度阈值时判定序列关联与
频繁项集的基础,合适的阈值参数有利于增强关联关系的可信度,记频繁-1与频繁-2项集
的最小支持度阈值为与,序列关联挖掘中的最小置信度阈值为。
2)频繁项集的生成;使用经过归总之后的两符号化序列作为事务集,记为,其中,两序
列对应的所有符号类别为:和,基于Apriori算法的
基本思想,本发明通过对事务集的两阶段扫描,得到序列的频繁项集。根据式(6)计算序列
中每个符号的置信度:
3)序列关联性的挖掘;将所有序列进行两两组合,分别统计其中存在的频繁-2项集中项的支持度以及对应关联挖掘序列之间的置信度;
首先根据式(7)对所有频繁-2项集在两指标参数之间的支持度累加,并以此作为这两个参数序列在所有多元序列中的支持度计数。
其中,与为对两序列聚类分析之后的所划分出的线段类
别总数,为两序列归总后线段类别数目。同时记指标序列层面的最小支持度阈值为,若参数指标层面的支持度大于设置的阈值,则计算符号项集组合在两序列中
的置信度,如式(10)所示:
本发明对完成归总操作的两条序列,基于Apriori算法的思路,通过设置的不同的
层次的最小支持度阈值,以及指标层面的最小置信度阈值,不断的挖
掘序列之间的存在的频繁项集,最终判定指标之间的关联关系强弱。
S9、判定DGA在线数据中不同异常模式的数据:根据序列之间的关联性强弱,对判定数据中存在的异常数值类型,分离出不同异常模式的数据。所述异常数值类型包括由于在线监测装置故障导致的异常类型的数据采样点和反映设备真实异常运行状态的异常类型的数据采样点。
本发明基于关联关系的数据异常模式判别:对于存在强关联关系的指标序列,对其中数据进行异常值监测,当两条序列检测出异常数值的采样时刻较为相近时,则判断该异常值为表征设备状态异常的状态数值,否则判定为监测装置运行异常导致的指标数值异常。
实施例
1、以某台主变设备的DGA历史在线监测数据为研究对象,考虑到油色谱的在线监测数据普遍以天为采样周期,也即一天一个指标采样数据;因此,本发明以接近两年的采样点数量(720个点)作为数据窗口长度,以季度采样点数量(90个点)为步长拖动数据窗口遍历整个历史数据集。以其中截取的一个窗口为例,得到其中五项指标的数据曲线如图2-6所示。
从上述气体指标的可视化结果可以看出,所有指标的在线数据可以等效为一条随采样点波动的数据曲线;因此,通过设置合理的拟合误差阈值,将指标序列进行分段拟合是切实可行的。
2、使用本发明提出的方法对以上截取的窗口序列数据进行分段线性化拟合,此处应注意:由于不同指标数据所处的数量级不同,所以在使用本发明提出的方式进行分段线性化拟合时,对不同的指标数据应该选取适当的拟合误差阈值,各个指标数据的具体闭合结果如图7-11所示。
由图7-11可知,DGA在线数据的五项气体指标拟合较为成功,以两个端点连成的线段表示线段跨度内的所有数据点,且以氢气为例,将其拟合的部分线段相关属性如表1所示。
表1 氢气在线数据分段后部分线段信息
表1进一步证明了本发明提出的在线数据分段线性化算法的可行性,每条线段拟合的误差均小于设置的拟合误差阈值,且拟合的线段能较好的反映拟合区间内在线数据点的变化趋势,算法的有效性得到验证。
3、线段集合的符号化:由于关联关系的挖掘算法是基于布尔型变量设计的,不适用于DGA在线数据这种数值型的变量,因此,在关联关系挖掘之前需要对拟合出的线段集合进行聚类分析,将相似度较高的集合合并为同类,并使用一种符号表示的该类型线段。以氢气与甲烷的数据为例,其序列符号化的结果如表2、表3所示。
表2 氢气序列数据的符号化结果
表3 甲烷序列数据的符号化结果
4、不同符号化序列之间的归总:由于Apriori关联关系挖掘算法的思想是基于项集占比进行的,所以在分析序列关联关系之前需要保证不同符号化序列之间的项集元素个数相同,需要对序列进行归总操作。以氢气与甲烷序列数据为例,两者序列数据的归总结果如表4所示
表4 氢气与甲烷符号序列归总结果
5、序列关联关系的挖掘:得到归总符号化序列之后,使用本发明提出的关联关系
挖掘算法,对序列进行关联关系分析,以氢气与甲烷两指标为例,分析由的
关联关系过程,其中频繁-1与频繁-2项集的相关信息如表5所示。
得到对应的频繁项集之后,使用本发明提出的方法分析两指标之间的关联性,以
支持度便于置信度表示关联关系的强弱,得到的支持度与置信度分别为
0.5050与0.6804,均大于所设置的相关最小阈值,表示该规则为强关联规则,说明氢气与甲
烷指标之间存在强关联关系。
6、不同异常模式的数据判别:在已知氢气与甲烷存在强关联关系的情况下,对两指标序列进行异常值检测,发现氢气在线数据在第42至54,第85至91以及201至206个数值采样点出现异常值,而在这些点附近的采样时段中甲烷气体的在线数据未出现异常情况,那么判断这些异常采样点为监测装置运行状态异常造成,划入被清洗的数据集合,作为在线监测装置运行状态判别的依据。
而在第466至471个采样点,甲烷在线监测数据出现异常,在第466至473个采样点,氢气在线监测数据出现异常,两指标在线数据出现异常时段相近,将附近采样时段的指标数据保留,标记为设备运行状态异常点,检测结果如图12所示。
Claims (7)
1.一种变压器DGA在线监测数据异常模式判定方法,其特征在于步骤如下:
S1、DGA在线监测数据的导入与滑动窗口算法的基本参数设置:导入DGA在线监测数据,设置滑动窗口的长度为L,设置滑动步长为l;
S2、以一定的步长滑动窗口遍历在线数据集:拖动滑动窗口于整体在线监测数据集上
以滑动步长 l滑动,直至遍历所有数据;令在线监测数据集长度为,遍历之后得到个数据窗口,当为小数时,向下取整,保留构成完整窗口的数据进行分析;导出
所有窗口中的数据,构成待分析数据集DS i ,;
S3、序列数据的分段线性化:以待分析数据集DS i 中某窗口内数据为例进行分析,使用基于最小二乘的滑动数据分段线性化算法,将在线监测数据中不定量的点组合在一起,形成多组数据点集,对同一组的数据点集使用最小二乘法拟合,得到一条包含组内所有点的线段;
S4、数据点集属性表征:使用拟合所得线段的斜率、包含数据的实际增长率以及该线段的跨度,构成线段属性三元组,所有拟合出的线段构成线段集;
S5、构建描述不同线段相似度的模型:基于线段属性三元组中的元素,构建描述的线段相似度的模型,并使用K-means算法对线段集进行聚类分析;
S6、线段集的符号化表示:为每个类型的线段集,分配一个符号,对不同类的线段集赋予不同的符号;集合中的所有线段统一用相应的符号表示;
S7、对所需分析的序列之间进行归总:不同序列线性化的结果各有不同,每两两线段之间进行分析前,先归总不同序列符号化后集合中元素数目,保证所有序列的元素数量相同;
S8、挖掘不同序列之间的关联性:基于Apriori算法的思想,设置最小置信度与支持度,挖掘不同序列之间存在的频繁项集,量化不同序列之间的关联性;
S9、判定DGA在线数据中不同异常模式的数据:根据序列之间的关联性强弱,判定提取的窗口内数据存在的异常数值类型,分离出不同异常模式的数据。
2.根据权利要求1所述的一种变压器DGA在线监测数据异常模式判定方法,其特征是:步骤S3具体步骤是:
S3.1对于形如DGA的设备指标在线监测数据,等效为时间序列数据;
S3.4那么对于这样一条线段,其可以用如下所示的式子表达:
4.根据权利要求3所述的一种变压器DGA在线监测数据异常模式判定方法,其特征是:步骤S5的具体步骤是:
S5.1由于DGA在线监测数据中不同指标之间存在一定的数量级差异,首先需要对同一
序列中存在的所有线段三元组进行形如的归一化操作;指代归一
化操作之后的元素,指代三元组中任意一个元素,为指标检测量中最小值,为
指标监测量中最大值;
S5.2在聚类分析时,建立衡量线段相似度的标准;使用欧式距离描述线段之间的相似度,在其中以权重的方式表示对线段不同属性的考虑程度;建立的线段相似度模型如下式所示:
S5.3基于上述的线段相似度模型,对线段集合使用K-means算法进行聚类分析,将相似度最大线段划分在同一集合中。
5.根据权利要求1所述的一种变压器DGA在线监测数据异常模式判定方法,其特征是:步骤S7具体过程为:
S7.1由于挖掘序列关联性为两两序列一组进行分析,而不同的序列在线性化的过程中,数值分布特征不一,所以线性分段后,各个序列存在的线段数目也会不同;但挖掘的关联性的前提是不同序列的项集数目相同;
6.根据权利要求1所述的一种变压器DGA在线监测数据异常模式判定方法,其特征是:步骤S8中序列关联性挖掘的主要过程为:
S8.2频繁项集的生成;使用经过归总之后的两符号化序列作为事务集,记为,其中,DGA
在线指标提取分析的两条气体序列数据对应的所有符号类别为:和,基于Apriori算法,通过对事务集的两阶段扫描,得到序列的频繁项
集;根据式(6)计算序列中每个符号的置信度:
式中与代表的是需要挖掘关联规则的两个指标对象,表示事务集的个数,即
序列中元素的个数,支持度表示的是项在事务集中的占比程度,在发掘频繁-1项集时,将支
持度大于的项划分至频繁-1项集的集合中,表示对项集元素的计数;
记关联挖掘中两序列的频繁-1项集的集合分别为、,根据指标参数将集合中的
项两两配对,构成形如形式2-项集,与分别表示序列与序列中挖掘出
的频繁1项集,计算每个项在该2-项集中的支持度,将支持度大于的项划分至频
繁-2项集,记为;
S8.3序列关联性的挖掘;将所有序列进行两两组合,分别统计其中存在的频繁-2项集中项的支持度以及对应关联挖掘序列之间的置信度;
首先根据式(7)对所有频繁-2项集在两指标参数之间的支持度累加,并以此作为这两个参数序列在所有多元序列中的支持度计数;
其中,为对两序列聚类分析之后的所划分出的线段类别总数;表示
对项集元素的计数;与表示的为序列、中属于频繁1项集的项集元素;同时记
指标序列层面的最小支持度阈值为,若参数指标层面的支持度大于设置的阈值,
则计算符号项集组合在两序列中的置信度,如式(10)所示:
7.根据权利要求1所述的一种变压器DGA在线监测数据异常模式判定方法,其特征是:步骤S9所述异常数值类型包括由于在线监测装置故障导致的异常类型的数据采样点和反映设备真实异常运行状态的异常类型的数据采样点。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110330366.5A CN112800686A (zh) | 2021-03-29 | 2021-03-29 | 一种变压器dga在线监测数据异常模式判定方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110330366.5A CN112800686A (zh) | 2021-03-29 | 2021-03-29 | 一种变压器dga在线监测数据异常模式判定方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112800686A true CN112800686A (zh) | 2021-05-14 |
Family
ID=75815850
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110330366.5A Pending CN112800686A (zh) | 2021-03-29 | 2021-03-29 | 一种变压器dga在线监测数据异常模式判定方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112800686A (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113780082A (zh) * | 2021-08-10 | 2021-12-10 | 南昌大学 | 一种基于滑动窗口搜索的车道线检测方法 |
CN113792754A (zh) * | 2021-08-12 | 2021-12-14 | 国网江西省电力有限公司电力科学研究院 | 一种先除异后修复的换流变dga在线监测数据处理方法 |
CN113987033A (zh) * | 2021-12-28 | 2022-01-28 | 国网江西省电力有限公司电力科学研究院 | 主变在线监测数据群体偏差识别与校准方法 |
CN114372093A (zh) * | 2021-12-15 | 2022-04-19 | 南昌大学 | 一种变压器dga在线监测数据的处理方法 |
CN114693110A (zh) * | 2022-03-29 | 2022-07-01 | 杭州安脉盛智能技术有限公司 | 一种储能系统的异常监测方法、系统及存储介质 |
CN115496644A (zh) * | 2022-11-18 | 2022-12-20 | 山东超华环保智能装备有限公司 | 基于数据识别的固体废弃物处理设备监测方法 |
CN115840895A (zh) * | 2021-12-31 | 2023-03-24 | 江苏常胜电器(淮安)有限公司 | 一种电子器件温度保护系统 |
CN116150636A (zh) * | 2023-04-18 | 2023-05-23 | 苏州上舜精密工业科技有限公司 | 一种传动模组的故障监测方法及系统 |
CN116776258A (zh) * | 2023-08-24 | 2023-09-19 | 北京天恒安科集团有限公司 | 电力设备监测数据处理方法及系统 |
CN116881745A (zh) * | 2023-09-07 | 2023-10-13 | 深圳市特安工业科技有限公司 | 基于大数据的压力变送器异常监测方法 |
CN117235519A (zh) * | 2023-09-13 | 2023-12-15 | 港华数智能源科技(深圳)有限公司 | 能源数据处理方法、装置及存储介质 |
CN118282413A (zh) * | 2024-05-31 | 2024-07-02 | 中建五局第三建设有限公司 | 一种用于超高层钢结构施工过程的监测数据管理方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106909664A (zh) * | 2017-02-28 | 2017-06-30 | 国网福建省电力有限公司 | 一种电力设备数据流故障识别方法 |
CN110008253A (zh) * | 2019-03-28 | 2019-07-12 | 浙江大学 | 基于两阶段频繁项集产生策略的工业数据关联规则挖掘及异常工况预测方法 |
CN110018670A (zh) * | 2019-03-28 | 2019-07-16 | 浙江大学 | 一种基于动态关联规则挖掘的工业过程异常工况预测方法 |
CN112380274A (zh) * | 2020-11-16 | 2021-02-19 | 北京航空航天大学 | 一种面向控制过程的异常检测系统 |
-
2021
- 2021-03-29 CN CN202110330366.5A patent/CN112800686A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106909664A (zh) * | 2017-02-28 | 2017-06-30 | 国网福建省电力有限公司 | 一种电力设备数据流故障识别方法 |
CN110008253A (zh) * | 2019-03-28 | 2019-07-12 | 浙江大学 | 基于两阶段频繁项集产生策略的工业数据关联规则挖掘及异常工况预测方法 |
CN110018670A (zh) * | 2019-03-28 | 2019-07-16 | 浙江大学 | 一种基于动态关联规则挖掘的工业过程异常工况预测方法 |
CN112380274A (zh) * | 2020-11-16 | 2021-02-19 | 北京航空航天大学 | 一种面向控制过程的异常检测系统 |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113780082A (zh) * | 2021-08-10 | 2021-12-10 | 南昌大学 | 一种基于滑动窗口搜索的车道线检测方法 |
CN113792754A (zh) * | 2021-08-12 | 2021-12-14 | 国网江西省电力有限公司电力科学研究院 | 一种先除异后修复的换流变dga在线监测数据处理方法 |
CN113792754B (zh) * | 2021-08-12 | 2024-08-16 | 国网江西省电力有限公司电力科学研究院 | 一种先除异后修复的换流变dga在线监测数据处理方法 |
CN114372093A (zh) * | 2021-12-15 | 2022-04-19 | 南昌大学 | 一种变压器dga在线监测数据的处理方法 |
CN113987033A (zh) * | 2021-12-28 | 2022-01-28 | 国网江西省电力有限公司电力科学研究院 | 主变在线监测数据群体偏差识别与校准方法 |
CN113987033B (zh) * | 2021-12-28 | 2022-04-12 | 国网江西省电力有限公司电力科学研究院 | 主变在线监测数据群体偏差识别与校准方法 |
CN115840895B (zh) * | 2021-12-31 | 2024-05-03 | 江苏常胜电器(淮安)有限公司 | 一种电子器件温度保护系统 |
CN115840895A (zh) * | 2021-12-31 | 2023-03-24 | 江苏常胜电器(淮安)有限公司 | 一种电子器件温度保护系统 |
CN114693110A (zh) * | 2022-03-29 | 2022-07-01 | 杭州安脉盛智能技术有限公司 | 一种储能系统的异常监测方法、系统及存储介质 |
CN115496644A (zh) * | 2022-11-18 | 2022-12-20 | 山东超华环保智能装备有限公司 | 基于数据识别的固体废弃物处理设备监测方法 |
CN115496644B (zh) * | 2022-11-18 | 2023-09-26 | 南通万达能源动力科技有限公司 | 基于数据识别的固体废弃物处理设备监测方法 |
CN116150636A (zh) * | 2023-04-18 | 2023-05-23 | 苏州上舜精密工业科技有限公司 | 一种传动模组的故障监测方法及系统 |
CN116776258B (zh) * | 2023-08-24 | 2023-10-31 | 北京天恒安科集团有限公司 | 电力设备监测数据处理方法及系统 |
CN116776258A (zh) * | 2023-08-24 | 2023-09-19 | 北京天恒安科集团有限公司 | 电力设备监测数据处理方法及系统 |
CN116881745B (zh) * | 2023-09-07 | 2023-12-19 | 深圳市特安工业科技有限公司 | 基于大数据的压力变送器异常监测方法 |
CN116881745A (zh) * | 2023-09-07 | 2023-10-13 | 深圳市特安工业科技有限公司 | 基于大数据的压力变送器异常监测方法 |
CN117235519A (zh) * | 2023-09-13 | 2023-12-15 | 港华数智能源科技(深圳)有限公司 | 能源数据处理方法、装置及存储介质 |
CN118282413A (zh) * | 2024-05-31 | 2024-07-02 | 中建五局第三建设有限公司 | 一种用于超高层钢结构施工过程的监测数据管理方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112800686A (zh) | 一种变压器dga在线监测数据异常模式判定方法 | |
WO2015176565A1 (zh) | 一种基于多维时间序列的电气设备故障预测方法 | |
CN110895526A (zh) | 一种大气监测系统中数据异常的修正方法 | |
CN109615004A (zh) | 一种多源数据融合的防窃电预警方法 | |
Feng et al. | Data mining for abnormal power consumption pattern detection based on local matrix reconstruction | |
CN113792754B (zh) | 一种先除异后修复的换流变dga在线监测数据处理方法 | |
CN110889441A (zh) | 一种基于距离和点密度的变电设备数据异常识别方法 | |
CN109947815B (zh) | 一种基于离群点算法的窃电辨识方法 | |
CN106933097B (zh) | 一种基于多层优化pcc-sdg的化工过程故障诊断方法 | |
CN109583679A (zh) | 一种多算法融合的窃电疑似度分析方法 | |
CN116756595A (zh) | 一种导电滑环故障数据采集监测方法 | |
CN116780781B (zh) | 智能电网接入的功率管理方法 | |
CN114372093A (zh) | 一种变压器dga在线监测数据的处理方法 | |
CN111709668A (zh) | 基于数据挖掘技术的电网设备参数风险识别方法及装置 | |
CN110097141A (zh) | 一种采集运维系统智能故障检测方法 | |
CN109142830A (zh) | 基于用电信息采集系统大数据的窃电检测方法 | |
CN105445579A (zh) | 多尺度时序分析的油色谱在线监测数据可视化系统及方法 | |
CN116203352A (zh) | 一种配电网的故障预警方法、装置、设备及介质 | |
CN110348683A (zh) | 电能质量扰动事件主成因分析方法、装置设备及存储介质 | |
CN115827577A (zh) | 智能电表高频数据压缩与重构的云端协同自适应分治方法 | |
CN115409120A (zh) | 一种基于数据驱动的用户窃电行为检测辅助方法 | |
CN111339986A (zh) | 基于时域/频域分析的装备用频规律挖掘方法和系统 | |
Pan et al. | Study on intelligent anti–electricity stealing early-warning technology based on convolutional neural networks | |
CN117390546A (zh) | 一种面向即时反窃电检测的多模数据库融合存算模型 | |
Zhang et al. | Anomalous state detection of dissolved gases in transformer oil based on the canopy hyper sphere model |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210514 |