CN107491783B - 基于改进密度峰值聚类算法的变压器故障类型分类方法 - Google Patents
基于改进密度峰值聚类算法的变压器故障类型分类方法 Download PDFInfo
- Publication number
- CN107491783B CN107491783B CN201710640773.XA CN201710640773A CN107491783B CN 107491783 B CN107491783 B CN 107491783B CN 201710640773 A CN201710640773 A CN 201710640773A CN 107491783 B CN107491783 B CN 107491783B
- Authority
- CN
- China
- Prior art keywords
- density
- sample
- fault type
- data
- data set
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/06—Electricity, gas or water supply
Abstract
本发明公开了一种基于改进密度峰值聚类算法的变压器故障类型分类方法,包括:1)收集变压器油色谱监测系统数据,经预处理后形成数据集Ω;2)运用无参密度估计方法获取数据集Ω的密度分布特性;3)利用数据集Ω的密度分布特性ρ及距离分布特性δ构造决策图G,并识别样本密度中心;4)计算数据集Ω的相似度矩阵γ,并基于此构造各故障类型数据子集的密度骨架;5)依据各故障类型数据子集的距离分布特性δ将剩余点归类,完成故障类型识别。本发明解决了由于变压器故障机理复杂导致传统故障诊断方法适应性较差的问题,可针对性用于电力变压器的故障诊断与分类。
Description
技术领域
本发明涉及数据处理技术领域,特别是涉及一种变压器故障类型的诊断方法。
背景技术
随着我国经济的不断发展,对能源的巨大需求促进了电力工业的飞速发展。然而,随着系统规模的增大,电力设备故障给人们的生产和现代生活所带来的影响也越来越大。为了安全生产,针对输配电系统中极其重要的电器设备——变压器的检修维护是不可避免的,然而目前的检修方式依然停留于预防性定期维修和事故检修,前者容易造成资源浪费,后者则无法弥补设备故障可能造成的损失。
作为设备检修的发展方向,状态检修通过结合设备运行、检修过程中提供的信息,判断设备的健康状况及发展趋势,并在设备故障发生前有计划地安排检修,从而克服了传统检修方式的缺陷。而目前,针对状态检修工作各个环节存在的问题及其应对策略的研究仍处于起步阶段,无法全面应用于日常设备检修工作中。
设备故障诊断是实现状态检修的核心。其主要根据设备运行参数,结合设备历史状态信息,进而判断设备性能发展的趋势。基于IEC三比值法的油色谱分析是现有电力变压器故障诊断中最主要的技术手段。然而,三比值法主要存在以下几个方面的不足:(1)三比值法中提供的编码是由实际案例总结而来,应用过程中编码缺失问题较为严重。(2)在未确定变压器出现故障的情况下应用三比值法可能会造成误判。(3)故障状态与故障特征之间存在复杂的对应关系,使用三比值法无法全面反映故障状况。
结合以上几点,针对变压器故障诊断方法的研究对于推动设备的状态检修至关重要。考虑到设备运行状态的多样化和不确定性,使用现有三比值法对进行变压器故障诊断准确性较低且试验操作复杂,已不能满足实际需要。
发明内容
本发明的目的在于提供一种基于改进密度峰值聚类算法的变压器故障类型分类方法,以克服传统诊断方法存在的缺陷。本发明解决了由于变压器故障机理复杂导致传统故障诊断方法适应性较差的问题,可针对性用于电力变压器的故障诊断与分类。
为达到上述目的,本发明采用如下技术方案:
基于改进密度峰值聚类算法的变压器故障类型分类方法,包括以下步骤:
1)、收集变压器油色谱监测系统数据,经预处理后形成数据集Ω;
2)、运用无参密度估计方法获取数据集Ω的密度分布特性ρ;
3)、利用数据集Ω的密度分布特性ρ及距离分布特性δ构造决策图G,并识别样本密度中心;
4)、计算数据集Ω的相似度矩阵γ,并基于相似度矩阵γ构造各故障类型数据子集的密度骨架;
5)、依据各故障类型数据子集的距离分布特性δ将剩余点归类,完成故障类型识别。
进一步的,步骤1)中数据集Ω的大小为n*d,其中n表示样本个数,d表示每个样本包含的色谱监测数据的种类数;每个样本包括的种类相同;步骤1)中的数据预处理方法为极大-极小值法:变压器油色谱监测系统数据中的每个样本均减去所在列样本指标的最小值min随后除以所在列样本指标的极差max-min获得数据集Ω。
进一步的,步骤2)中运用的对数据集Ω进行无参密度估计的公式为:
其中,Xi=(Xi1,Xi2,...,Xid)表示一组观测样本,即数据集Ω中的一行;hj表示第j维度即数据集Ω第j列的带宽;K(·)表示核函数;公式(1)中核函数K(·)以及第j维度带宽hj的表达式分别为:
进一步的,步骤2)中样本i的距离分布特性δi表示样本i与密度更大的样本点间距离的极小值;其中,样本密度即样本密度分布特性ρ采用公式(1)进行计算;距离采用高斯距离,其表达式为:
其中,Δdim表示样本i与样本m之间的高斯距离,Xik与Xmk分别表示样本i与样本m的第k维度样本值。
进一步的,步骤3)中利用样本密度分布特性ρ与距离分布特性δ绘制决策图;在决策图中,自动识别位于决策图右上方的nc个样本作为样本集的密度中心。
进一步的,步骤(4)中相似度γij的定义为:
γij=(1+|Δρij|)×Δdij (6)
其中,Δρij和Δdij分别表示样本点i,j之间的密度分布差异以及距离;相似度矩阵γ定义为γ=[γij]n*n。
进一步的,步骤(4)中构造各故障类型数据子集的密度骨架的流程如下:首先,由已识别的nc个样本密度中心出发,依次选择nn个相似度最高的样本点作为起点;随后,由nn个起点出发,逐步连接相似度最高且样本密度递减的样本点构成骨架结构,直至骨架末尾样本点密度降至本簇密度中心样本点密度的α倍时,完成故障类型数据子集的密度骨架搭建;其中,nn表示常数;0<α<1。
进一步的,nn=5,α=0.5。
进一步的,步骤(5)中将非密度骨架样本点按样本密度由大至小排序,并根据数据子集的距离分布特性δ依次连接至距自身最近且密度更大的样本点,完成所有样本点的归类。
与现有技术相比,本发明具有以下有益的技术效果:
第一,本发明提出的改进密度峰值聚类方法能够避免传统密度峰值算法的连锁效应,大幅提高算法自身的分类效率和准确性。通过采用构造各故障类型数据子集的密度骨架,随后再归类剩余非骨架点的方式,本方法能够清晰地描述各故障类型的分布特性,并行归类的方式同时也大大降低了故障诊断时间。第二,相较于传统基于三比值法的变压器故障诊断而言,本方法自适应性更好,任意变压器色谱状态数据均可利用本方法进行类别划分,从而避免了传统方法自学习能力较差,无法适用于各类故障状态的诊断这一问题,因此本方法可针对性用于电力变压器的故障诊断与分类。
附图说明
图1为步骤(3)中故障样本集密度中心的识别过程图;
图2为本发明基于改进密度峰值聚类算法的变压器故障类型分类方法的实施流程图。
具体实施方式
如图2所示,本发明一种基于改进密度峰值聚类算法的变压器故障类型分类方法,主要包含以下几个步骤:
(1)数据导入与预处理
本发明采用的验证数据收集自广东某电网试验研究所110kV变压器,共计186组油色谱数据,涵盖八类典型的变压器故障。具体的色谱数据分布及对应故障类型如表2所示。所构成的数据集Ω为:
其中,xi,1-xi,5分别表示第i组油色谱数据中的氢气、甲烷、乙烷、乙烯及乙炔五类色谱特征气体经归一化处理后的值,即
(2)执行基于改进密度峰值的聚类算法获取故障分类信息
本例中经过参数优化,最终确定nn取为5,α取为0.5。
2.1)利用归一化后的数据集Ω,运用公式(7)进行无参密度估计获取核密度估计结果
其中,Xi=(Xi1,Xi2,...,Xid)表示一组观测样本,即数据集Ω中的一行;本实施例中d=5;hj表示第j维度,即数据集Ω第j列的带宽;j=1、2、3、4、5;核函数K(·)的表达式为:
x为所需进行密度估计的样本点,xj表示x的第j维度坐标;hj为数据集Ω第j列的带宽;各维度带宽hj采用公式(9)进行估计
2.2)利用公式(10)计算数据集Ω各样本点之间距离
其中,Δdim表示样本i与样本m之间的高斯距离,Xik与Xmk分别表示样本i与样本m的第k维度样本值。
根据计算所得的样本点距离及数据集Ω的密度分布特性ρ,确定数据集Ω的距离分布特性δ为样本i与密度更大的样本点间距离的极小值。得到密度分布特性ρ后,将所有样本点的密度分布特性由大到小进行排序,密度小的样本点到所有密度比自己大的样本点距离的最小值作为自己的距离分布,所有样本点的距离分布构成距离分布特性。
2.3)将计算所得的数据集Ω的密度分布特性ρ作为x轴,距离分布特性δ作为y轴绘制决策图G,识别出图中右上方8个样本作为各个故障类的密度峰值点,如附图1方框内所示。
2.4)根据数据集Ω的密度分布特性ρ以及各样本点之间距离Δdij,获取数据集Ω的相似度矩阵γ=[γij]186*186,其中γij采用公式(6)进行计算。
γij=(1+|Δρij|)×Δdij (11)
其中,Δρij和Δdij分别表示样本点i,j之间的密度分布差异以及距离,相似度矩阵γ可定义为γ=[γij]n*n,n为数据组数,本实施例中n=186。
2.5)由已识别的8个样本密度中心出发,依次选择5个相似度最高的样本点作为起点。随后,由5个起点出发,逐步连接相似度最高且样本密度递减的样本点构成骨架结构,直至骨架末尾样本点密度降至本簇密度中心样本点密度的0.5倍时,完成故障类型数据子集的密度骨架搭建。
2.6)将剩余非密度骨架样本点按样本密度由大至小排序,并根据数据子集的距离分布特性δ依次连接至距自身最近且密度更大的样本点,完成所有样本点的归类,即为故障类型分类。
(3)结果分析与验证
仿真结果主要通过将本发明方法的故障分类结果与传统三比值法的故障诊断结果进行比较,对本发明方法的故障诊断效果进行说明。表1给出了本发明所提出的基于改进密度峰值的聚类算法与传统三比值法故障诊断效果的定量对比结果。与IEC三比值法相比,本发明方法在分辨各类故障的正确率上大幅提高,并且自适应能力较强,不受故障类型的限制。
表1本发明方法与传统三比值法故障诊断效果对比
注:“/”表示无法识别该类型故障
由上表中结果可得,传统三比值法无法识别高能放电相关故障,而本发明方法能够准确的诊断出变压器高能放电及高能放电兼过热故障。同时,在其余各类故障的诊断正确率上均有大幅提升。除此以外,由于本发明方法采用并行分类模式,相比传统三比值法而言,大幅提升了变压器故障诊断的效率。
表2试验色谱数据分布及对应故障类型
Claims (8)
1.基于改进密度峰值聚类算法的变压器故障类型分类方法,其特征在于,包括以下步骤:
1)、收集变压器油色谱监测系统数据,经预处理后形成数据集Ω;
2)、运用无参密度估计方法获取数据集Ω的密度分布特性ρ;
3)、利用数据集Ω的密度分布特性ρ及距离分布特性δ构造决策图G,并识别样本密度中心;
4)、计算数据集Ω的相似度矩阵γ,并基于相似度矩阵γ构造各故障类型数据子集的密度骨架;
5)、依据各故障类型数据子集的距离分布特性δ将剩余点归类,完成故障类型识别;
步骤(4)中构造各故障类型数据子集的密度骨架的流程如下:首先,由已识别的nc个样本密度中心出发,依次选择nn个相似度最高的样本点作为起点;随后,由nn个起点出发,逐步连接相似度最高且样本密度递减的样本点构成骨架结构,直至骨架末尾样本点密度降至本簇密度中心样本点密度的α倍时,完成故障类型数据子集的密度骨架搭建;其中,nn表示常数;0<α<1。
2.根据权利要求1所述的基于改进密度峰值聚类算法的变压器故障类型分类方法,其特征在于,步骤1)中数据集Ω的大小为n*d,其中n表示样本个数,d表示每个样本包含的色谱监测数据的种类数;每个样本包括的种类相同;步骤1)中的数据预处理方法为极大-极小值法:变压器油色谱监测系统数据中的每个样本xij均减去所在列样本指标的最小值minx·j,随后除以所在列样本指标的极差max x·j-min x.j;获得数据集Ω。
5.根据权利要求1所述的基于改进密度峰值聚类算法的变压器故障类型分类方法,其特征在于,步骤3)中利用样本密度分布特性ρ与距离分布特性δ绘制决策图;在决策图中,自动识别位于决策图右上方的nc个样本作为样本集的密度中心。
6.根据权利要求2所述的基于改进密度峰值聚类算法的变压器故障类型分类方法,其特征在于,步骤(4)中相似度γij的定义为:
γij=(1+|Δρij|)×Δdij (6)
其中,Δρij和Δdij分别表示样本点i,j之间的密度分布差异以及距离;相似度矩阵γ定义为γ=[γij]n*n。
7.根据权利要求1所述的基于改进密度峰值聚类算法的变压器故障类型分类方法,其特征在于,nn=5,α=0.5。
8.根据权利要求1所述的基于改进密度峰值聚类算法的变压器故障类型分类方法,其特征在于,步骤(5)中将非密度骨架样本点按样本密度由大至小排序,并根据数据子集的距离分布特性δ依次连接至距自身最近且密度更大的样本点,完成所有样本点的归类。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710640773.XA CN107491783B (zh) | 2017-07-31 | 2017-07-31 | 基于改进密度峰值聚类算法的变压器故障类型分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710640773.XA CN107491783B (zh) | 2017-07-31 | 2017-07-31 | 基于改进密度峰值聚类算法的变压器故障类型分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107491783A CN107491783A (zh) | 2017-12-19 |
CN107491783B true CN107491783B (zh) | 2020-07-21 |
Family
ID=60644034
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710640773.XA Active CN107491783B (zh) | 2017-07-31 | 2017-07-31 | 基于改进密度峰值聚类算法的变压器故障类型分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107491783B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108334898A (zh) * | 2018-01-23 | 2018-07-27 | 华中科技大学 | 一种多模态工业过程模态辨识与故障分类方法 |
CN109063734B (zh) * | 2018-06-29 | 2022-02-25 | 广东工业大学 | 结合多级局部密度聚类的油浸式变压器故障状态评估方法 |
CN109214527B (zh) * | 2018-08-09 | 2020-10-30 | 南瑞集团有限公司 | 一种变压器故障早期诊断预警方法和系统 |
CN109374318A (zh) * | 2018-09-27 | 2019-02-22 | 南京康尼机电股份有限公司 | 基于dpc的轨道车辆多门系统异常检测方法和系统 |
CN110688963A (zh) * | 2019-09-30 | 2020-01-14 | 哈尔滨工业大学 | 基于聚类算法的大跨度桥梁涡激振动自动识别方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105930862A (zh) * | 2016-04-13 | 2016-09-07 | 江南大学 | 一种基于密度自适应距离的密度峰聚类算法 |
CN106093612A (zh) * | 2016-05-26 | 2016-11-09 | 国网江苏省电力公司电力科学研究院 | 一种电力变压器故障诊断方法 |
CN106408939A (zh) * | 2016-10-29 | 2017-02-15 | 浙江大学 | 基于密度峰值聚类的交通流量序列划分方法 |
CN106443259A (zh) * | 2016-09-29 | 2017-02-22 | 国网山东省电力公司电力科学研究院 | 基于欧式聚类和spo‑svm的变压器故障诊断新方法 |
CN106770939A (zh) * | 2016-12-08 | 2017-05-31 | 贵州电网有限责任公司电力科学研究院 | 一种基于支持向量描述和k近质心近邻的变压器故障诊断方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI336055B (en) * | 2007-01-05 | 2011-01-11 | Compal Electronics Inc | Symbol recognition method |
-
2017
- 2017-07-31 CN CN201710640773.XA patent/CN107491783B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105930862A (zh) * | 2016-04-13 | 2016-09-07 | 江南大学 | 一种基于密度自适应距离的密度峰聚类算法 |
CN106093612A (zh) * | 2016-05-26 | 2016-11-09 | 国网江苏省电力公司电力科学研究院 | 一种电力变压器故障诊断方法 |
CN106443259A (zh) * | 2016-09-29 | 2017-02-22 | 国网山东省电力公司电力科学研究院 | 基于欧式聚类和spo‑svm的变压器故障诊断新方法 |
CN106408939A (zh) * | 2016-10-29 | 2017-02-15 | 浙江大学 | 基于密度峰值聚类的交通流量序列划分方法 |
CN106770939A (zh) * | 2016-12-08 | 2017-05-31 | 贵州电网有限责任公司电力科学研究院 | 一种基于支持向量描述和k近质心近邻的变压器故障诊断方法 |
Non-Patent Citations (4)
Title |
---|
An Improved Fuzzy C-means Clustering Algorithm for Transformer Fault;SONGPING TANG 等;《2016 China International Conference on Electricity Distribution (CICED 2016)》;20160813;1-5 * |
Effectively clustering by finding density backbone based-on kNN;Mei Chen 等;《Pattern Recognition》;20160524;486-498 * |
一种基于簇中心点自动选择策略的密度峰值聚类算法;马春来 等;《计算机科学》;20160731;第43卷(第7期);255-258+280 * |
基于局部密度估计的多模态过程故障检测;刘帮莉 等;《化工学报》;20140831;第65卷(第8期);3071-3080 * |
Also Published As
Publication number | Publication date |
---|---|
CN107491783A (zh) | 2017-12-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107491783B (zh) | 基于改进密度峰值聚类算法的变压器故障类型分类方法 | |
CN109685340B (zh) | 一种配电设备健康状态评估方法及系统 | |
CN105512799B (zh) | 一种基于海量在线历史数据的电力系统暂态稳定评估方法 | |
CN107132310B (zh) | 基于高斯混合模型的变压器设备健康状态判别方法 | |
CN104809658B (zh) | 一种低压配网台区线损的快速分析方法 | |
CN108320043A (zh) | 一种基于电力大数据的配电网设备状态诊断预测方法 | |
CN106770939A (zh) | 一种基于支持向量描述和k近质心近邻的变压器故障诊断方法 | |
CN110726898B (zh) | 一种配电网故障类型识别方法 | |
CN109784383B (zh) | 一种基于图域特征和ds证据理论融合的钢轨裂纹识别方法 | |
CN108304567B (zh) | 高压变压器工况模式识别与数据分类方法及系统 | |
WO2016004749A1 (zh) | 一种大型数控铣床刀具磨损程度识别方法 | |
CN108122057B (zh) | 一种智能园区能源利用方案综合评价方法及装置 | |
CN111539657A (zh) | 结合用户日用电量曲线的典型用电行业负荷特性分类与综合方法 | |
CN111680875A (zh) | 基于概率基线模型的无人机状态风险模糊综合评价方法 | |
CN110705859A (zh) | 基于pca-自组织神经网络的中低压配电网运行状态评估方法 | |
CN114118588A (zh) | 聚类欠采样下基于博弈特征提取的迎峰度夏停电预测方法 | |
CN115600088A (zh) | 一种基于振动信号的配电变压器故障诊断方法 | |
CN115587290A (zh) | 基于变分自编码生成对抗网络的航空发动机故障诊断方法 | |
CN113030633B (zh) | 基于ga-bp神经网络的配电网故障大数据分析方法和系统 | |
CN113469252A (zh) | 一种考虑不平衡样本的特高压换流阀运行状态评估方法 | |
CN110569888A (zh) | 基于有向无环图支持向量机的变压器故障诊断方法及装置 | |
CN112684295A (zh) | 一种基于相似离度的高渗透率下配电网故障选线方法及系统 | |
CN111339167A (zh) | 基于K-means和主成分线性回归的台区线损率影响因素分析方法 | |
CN112748331A (zh) | 一种基于ds证据融合的断路器机械故障识别方法及装置 | |
CN116561692A (zh) | 一种动态更新的实时量测数据检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |