CN107491783A - 基于改进密度峰值聚类算法的变压器故障类型分类方法 - Google Patents

基于改进密度峰值聚类算法的变压器故障类型分类方法 Download PDF

Info

Publication number
CN107491783A
CN107491783A CN201710640773.XA CN201710640773A CN107491783A CN 107491783 A CN107491783 A CN 107491783A CN 201710640773 A CN201710640773 A CN 201710640773A CN 107491783 A CN107491783 A CN 107491783A
Authority
CN
China
Prior art keywords
mrow
msub
sample
density
mfrac
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710640773.XA
Other languages
English (en)
Other versions
CN107491783B (zh
Inventor
唐松平
彭刚
张云
钟振鑫
林志明
黄晓波
曾力
吴涛
史良
肖云
董玉玺
王云龙
柯祖梁
巫小彬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huizhou Power Supply Bureau of Guangdong Power Grid Co Ltd
Original Assignee
Huizhou Power Supply Bureau of Guangdong Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huizhou Power Supply Bureau of Guangdong Power Grid Co Ltd filed Critical Huizhou Power Supply Bureau of Guangdong Power Grid Co Ltd
Priority to CN201710640773.XA priority Critical patent/CN107491783B/zh
Publication of CN107491783A publication Critical patent/CN107491783A/zh
Application granted granted Critical
Publication of CN107491783B publication Critical patent/CN107491783B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Economics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Business, Economics & Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Primary Health Care (AREA)
  • Marketing (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
  • Housings And Mounting Of Transformers (AREA)

Abstract

本发明公开了一种基于改进密度峰值聚类算法的变压器故障类型分类方法,包括:1)收集变压器油色谱监测系统数据,经预处理后形成数据集Ω;2)运用无参密度估计方法获取数据集Ω的密度分布特性;3)利用数据集Ω的密度分布特性ρ及距离分布特性δ构造决策图G,并识别样本密度中心;4)计算数据集Ω的相似度矩阵γ,并基于此构造各故障类型数据子集的密度骨架;5)依据各故障类型数据子集的距离分布特性δ将剩余点归类,完成故障类型识别。本发明解决了由于变压器故障机理复杂导致传统故障诊断方法适应性较差的问题,可针对性用于电力变压器的故障诊断与分类。

Description

基于改进密度峰值聚类算法的变压器故障类型分类方法
技术领域
本发明涉及数据处理技术领域,特别是涉及一种变压器故障类型的诊断方法。
背景技术
随着我国经济的不断发展,对能源的巨大需求促进了电力工业的飞速发展。然而,随着系统规模的增大,电力设备故障给人们的生产和现代生活所带来的影响也越来越大。为了安全生产,针对输配电系统中极其重要的电器设备——变压器的检修维护是不可避免的,然而目前的检修方式依然停留于预防性定期维修和事故检修,前者容易造成资源浪费,后者则无法弥补设备故障可能造成的损失。
作为设备检修的发展方向,状态检修通过结合设备运行、检修过程中提供的信息,判断设备的健康状况及发展趋势,并在设备故障发生前有计划地安排检修,从而克服了传统检修方式的缺陷。而目前,针对状态检修工作各个环节存在的问题及其应对策略的研究仍处于起步阶段,无法全面应用于日常设备检修工作中。
设备故障诊断是实现状态检修的核心。其主要根据设备运行参数,结合设备历史状态信息,进而判断设备性能发展的趋势。基于IEC三比值法的油色谱分析是现有电力变压器故障诊断中最主要的技术手段。然而,三比值法主要存在以下几个方面的不足:(1)三比值法中提供的编码是由实际案例总结而来,应用过程中编码缺失问题较为严重。(2)在未确定变压器出现故障的情况下应用三比值法可能会造成误判。(3)故障状态与故障特征之间存在复杂的对应关系,使用三比值法无法全面反映故障状况。
结合以上几点,针对变压器故障诊断方法的研究对于推动设备的状态检修至关重要。考虑到设备运行状态的多样化和不确定性,使用现有三比值法对进行变压器故障诊断准确性较低且试验操作复杂,已不能满足实际需要。
发明内容
本发明的目的在于提供一种基于改进密度峰值聚类算法的变压器故障类型分类方法,以克服传统诊断方法存在的缺陷。本发明解决了由于变压器故障机理复杂导致传统故障诊断方法适应性较差的问题,可针对性用于电力变压器的故障诊断与分类。
为达到上述目的,本发明采用如下技术方案:
基于改进密度峰值聚类算法的变压器故障类型分类方法,包括以下步骤:
1)、收集变压器油色谱监测系统数据,经预处理后形成数据集Ω;
2)、运用无参密度估计方法获取数据集Ω的密度分布特性ρ;
3)、利用数据集Ω的密度分布特性ρ及距离分布特性δ构造决策图G,并识别样本密度中心;
4)、计算数据集Ω的相似度矩阵γ,并基于相似度矩阵γ构造各故障类型数据子集的密度骨架;
5)、依据各故障类型数据子集的距离分布特性δ将剩余点归类,完成故障类型识别。
进一步的,步骤1)中数据集Ω的大小为n*d,其中n表示样本个数,d表示每个样本包含的色谱监测数据的种类数;每个样本包括的种类相同;步骤1)中的数据预处理方法为极大-极小值法:变压器油色谱监测系统数据中的每个样本均减去所在列样本指标的最小值min随后除以所在列样本指标的极差max-min获得数据集Ω。
进一步的,步骤2)中运用的对数据集Ω进行无参密度估计的公式为:
其中,Xi=(Xi1,Xi2,...,Xid)表示一组观测样本,即数据集Ω中的一行;hj表示第j维度即数据集Ω第j列的带宽;K(·)表示核函数;公式(1)中核函数K(·)以及第j维度带宽hj的表达式分别为:
x为所需进行密度估计的样本点,xj表示x的第j维度坐标;hj为数据集Ω第j列的带宽;公式(3)中的表达式为:
进一步的,步骤2)中样本i的距离分布特性δi表示样本i与密度更大的样本点间距离的极小值;其中,样本密度即样本密度分布特性ρ采用公式(1)进行计算;距离采用高斯距离,其表达式为:
其中,Δdim表示样本i与样本m之间的高斯距离,Xik与Xmk分别表示样本i与样本m的第k维度样本值。
进一步的,步骤3)中利用样本密度分布特性ρ与距离分布特性δ绘制决策图;在决策图中,自动识别位于决策图右上方的nc个样本作为样本集的密度中心。
进一步的,步骤(4)中相似度γij的定义为:
γij=(1+|Δρij|)×Δdij (6)
其中,Δρij和Δdij分别表示样本点i,j之间的密度分布差异以及距离;相似度矩阵γ定义为γ=[γij]n*n
进一步的,步骤(4)中构造各故障类型数据子集的密度骨架的流程如下:首先,由已识别的nc个样本密度中心出发,依次选择nn个相似度最高的样本点作为起点;随后,由nn个起点出发,逐步连接相似度最高且样本密度递减的样本点构成骨架结构,直至骨架末尾样本点密度降至本簇密度中心样本点密度的α倍时,完成故障类型数据子集的密度骨架搭建;其中,nn表示常数;0<α<1。
进一步的,nn=5,α=0.5。
进一步的,步骤(5)中将非密度骨架样本点按样本密度由大至小排序,并根据数据子集的距离分布特性δ依次连接至距自身最近且密度更大的样本点,完成所有样本点的归类。
与现有技术相比,本发明具有以下有益的技术效果:
第一,本发明提出的改进密度峰值聚类方法能够避免传统密度峰值算法的连锁效应,大幅提高算法自身的分类效率和准确性。通过采用构造各故障类型数据子集的密度骨架,随后再归类剩余非骨架点的方式,本方法能够清晰地描述各故障类型的分布特性,并行归类的方式同时也大大降低了故障诊断时间。第二,相较于传统基于三比值法的变压器故障诊断而言,本方法自适应性更好,任意变压器色谱状态数据均可利用本方法进行类别划分,从而避免了传统方法自学习能力较差,无法适用于各类故障状态的诊断这一问题,因此本方法可针对性用于电力变压器的故障诊断与分类。
附图说明
图1为步骤(3)中故障样本集密度中心的识别过程图;
图2为本发明基于改进密度峰值聚类算法的变压器故障类型分类方法的实施流程图。
具体实施方式
如图2所示,本发明一种基于改进密度峰值聚类算法的变压器故障类型分类方法,主要包含以下几个步骤:
(1)数据导入与预处理
本发明采用的验证数据收集自广东某电网试验研究所110kV变压器,共计186组油色谱数据,涵盖八类典型的变压器故障。具体的色谱数据分布及对应故障类型如表2所示。所构成的数据集Ω为:
其中,xi,1-xi,5分别表示第i组油色谱数据中的氢气、甲烷、乙烷、乙烯及乙炔五类色谱特征气体经归一化处理后的值,即
minx·j为xij所在列样本指标的最小值;max为xij所在列样本指标的最大值;
(2)执行基于改进密度峰值的聚类算法获取故障分类信息
本例中经过参数优化,最终确定nn取为5,α取为0.5。
2.1)利用归一化后的数据集Ω,运用公式(7)进行无参密度估计获取核密度估计结果
其中,Xi=(Xi1,Xi2,...,Xid)表示一组观测样本,即数据集Ω中的一行;本实施例中d=5;hj表示第j维度,即数据集Ω第j列的带宽;j=1、2、3、4、5;核函数K(·)的表达式为:
x为所需进行密度估计的样本点,xj表示x的第j维度坐标;hj为数据集Ω第j列的带宽;各维度带宽hj采用公式(9)进行估计
2.2)利用公式(10)计算数据集Ω各样本点之间距离
其中,Δdim表示样本i与样本m之间的高斯距离,Xik与Xmk分别表示样本i与样本m的第k维度样本值。
根据计算所得的样本点距离及数据集Ω的密度分布特性ρ,确定数据集Ω的距离分布特性δ为样本i与密度更大的样本点间距离的极小值。得到密度分布特性ρ后,将所有样本点的密度分布特性由大到小进行排序,密度小的样本点到所有密度比自己大的样本点距离的最小值作为自己的距离分布,所有样本点的距离分布构成距离分布特性。
2.3)将计算所得的数据集Ω的密度分布特性ρ作为x轴,距离分布特性δ作为y轴绘制决策图G,识别出图中右上方8个样本作为各个故障类的密度峰值点,如附图1方框内所示。
2.4)根据数据集Ω的密度分布特性ρ以及各样本点之间距离Δdij,获取数据集Ω的相似度矩阵γ=[γij]186*186,其中γij采用公式(6)进行计算。
γij=(1+|Δρij|)×Δdij (11)
其中,Δρij和Δdij分别表示样本点i,j之间的密度分布差异以及距离,相似度矩阵γ可定义为γ=[γij]n*n,n为数据组数,本实施例中n=186。
2.5)由已识别的8个样本密度中心出发,依次选择5个相似度最高的样本点作为起点。随后,由5个起点出发,逐步连接相似度最高且样本密度递减的样本点构成骨架结构,直至骨架末尾样本点密度降至本簇密度中心样本点密度的0.5倍时,完成故障类型数据子集的密度骨架搭建。
2.6)将剩余非密度骨架样本点按样本密度由大至小排序,并根据数据子集的距离分布特性δ依次连接至距自身最近且密度更大的样本点,完成所有样本点的归类,即为故障类型分类。
(3)结果分析与验证
仿真结果主要通过将本发明方法的故障分类结果与传统三比值法的故障诊断结果进行比较,对本发明方法的故障诊断效果进行说明。表1给出了本发明所提出的基于改进密度峰值的聚类算法与传统三比值法故障诊断效果的定量对比结果。与IEC三比值法相比,本发明方法在分辨各类故障的正确率上大幅提高,并且自适应能力较强,不受故障类型的限制。
表1本发明方法与传统三比值法故障诊断效果对比
注:“/”表示无法识别该类型故障
由上表中结果可得,传统三比值法无法识别高能放电相关故障,而本发明方法能够准确的诊断出变压器高能放电及高能放电兼过热故障。同时,在其余各类故障的诊断正确率上均有大幅提升。除此以外,由于本发明方法采用并行分类模式,相比传统三比值法而言,大幅提升了变压器故障诊断的效率。
表2试验色谱数据分布及对应故障类型

Claims (9)

1.基于改进密度峰值聚类算法的变压器故障类型分类方法,其特征在于,包括以下步骤:
1)、收集变压器油色谱监测系统数据,经预处理后形成数据集Ω;
2)、运用无参密度估计方法获取数据集Ω的密度分布特性ρ;
3)、利用数据集Ω的密度分布特性ρ及距离分布特性δ构造决策图G,并识别样本密度中心;
4)、计算数据集Ω的相似度矩阵γ,并基于相似度矩阵γ构造各故障类型数据子集的密度骨架;
5)、依据各故障类型数据子集的距离分布特性δ将剩余点归类,完成故障类型识别。
2.根据权利要求1所述的基于改进密度峰值聚类算法的变压器故障类型分类方法,其特征在于,步骤1)中数据集Ω的大小为n*d,其中n表示样本个数,d表示每个样本包含的色谱监测数据的种类数;每个样本包括的种类相同;步骤1)中的数据预处理方法为极大-极小值法:变压器油色谱监测系统数据中的每个样本xij均减去所在列样本指标的最小值minx.j,随后除以所在列样本指标的极差maxx·j-minx.j;获得数据集Ω。
3.根据权利要求1所述的基于改进密度峰值聚类算法的变压器故障类型分类方法,其特征在于,步骤2)中运用的对数据集Ω进行无参密度估计的公式为:
<mrow> <msub> <mover> <mi>f</mi> <mo>^</mo> </mover> <mi>n</mi> </msub> <mrow> <mo>(</mo> <mi>x</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mn>1</mn> <mi>n</mi> </mfrac> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <mfrac> <mn>1</mn> <mrow> <msub> <mi>h</mi> <mn>1</mn> </msub> <msub> <mi>h</mi> <mn>2</mn> </msub> <mo>...</mo> <msub> <mi>h</mi> <mi>d</mi> </msub> </mrow> </mfrac> <mi>K</mi> <mrow> <mo>(</mo> <mfrac> <mrow> <msub> <mi>X</mi> <mrow> <mi>i</mi> <mn>1</mn> </mrow> </msub> <mo>-</mo> <msub> <mi>x</mi> <mn>1</mn> </msub> </mrow> <msub> <mi>h</mi> <mn>1</mn> </msub> </mfrac> <mo>,</mo> <mfrac> <mrow> <msub> <mi>X</mi> <mrow> <mi>i</mi> <mn>2</mn> </mrow> </msub> <mo>-</mo> <msub> <mi>x</mi> <mn>2</mn> </msub> </mrow> <msub> <mi>h</mi> <mn>2</mn> </msub> </mfrac> <mo>,</mo> <mo>...</mo> <mo>,</mo> <mfrac> <mrow> <msub> <mi>X</mi> <mrow> <mi>i</mi> <mi>d</mi> </mrow> </msub> <mo>-</mo> <msub> <mi>x</mi> <mi>d</mi> </msub> </mrow> <msub> <mi>h</mi> <mi>d</mi> </msub> </mfrac> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow>
其中,Xi=(Xi1,Xi2,...,Xid)表示一组观测样本,即数据集Ω中的一行;hj表示第j维度即数据集Ω第j列的带宽;K(·)表示核函数;公式(1)中核函数K(·)以及第j维度带宽hj的表达式分别为:
<mrow> <mi>K</mi> <mrow> <mo>(</mo> <mo>&amp;CenterDot;</mo> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mn>1</mn> <msup> <mrow> <mo>(</mo> <mn>2</mn> <mi>&amp;pi;</mi> <mo>)</mo> </mrow> <mrow> <mi>d</mi> <mo>/</mo> <mn>2</mn> </mrow> </msup> </mfrac> <mi>exp</mi> <mrow> <mo>(</mo> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>d</mi> </munderover> <mo>-</mo> <mfrac> <mn>1</mn> <mn>2</mn> </mfrac> <msup> <mrow> <mo>(</mo> <mfrac> <mrow> <msub> <mi>X</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>-</mo> <msub> <mi>x</mi> <mi>j</mi> </msub> </mrow> <msub> <mi>h</mi> <mi>j</mi> </msub> </mfrac> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>2</mn> <mo>)</mo> </mrow> </mrow>
<mrow> <msub> <mi>h</mi> <mi>j</mi> </msub> <mo>=</mo> <mi>arg</mi> <mi> </mi> <mi>m</mi> <mi>a</mi> <mi>x</mi> <mrow> <mo>(</mo> <mfrac> <mn>1</mn> <mi>n</mi> </mfrac> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <mover> <msubsup> <mi>f</mi> <mi>n</mi> <mrow> <mo>-</mo> <mi>i</mi> </mrow> </msubsup> <mo>^</mo> </mover> <mo>(</mo> <mi>x</mi> <mo>)</mo> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>3</mn> <mo>)</mo> </mrow> </mrow>
x为所需进行密度估计的样本点,xj表示x的第j维度坐标;hj为数据集Ω第j列的带宽;公式(3)中的表达式为:
<mrow> <mover> <msubsup> <mi>f</mi> <mi>n</mi> <mrow> <mo>-</mo> <mi>i</mi> </mrow> </msubsup> <mo>^</mo> </mover> <mrow> <mo>(</mo> <msub> <mi>X</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mn>1</mn> <mrow> <mrow> <mo>(</mo> <mrow> <mi>n</mi> <mo>-</mo> <mn>1</mn> </mrow> <mo>)</mo> </mrow> <msub> <mi>h</mi> <mn>1</mn> </msub> <msub> <mi>h</mi> <mn>2</mn> </msub> <mn>...</mn> <msub> <mi>h</mi> <mi>d</mi> </msub> </mrow> </mfrac> <munderover> <mi>&amp;Sigma;</mi> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> <mo>,</mo> <mi>j</mi> <mo>&amp;NotEqual;</mo> <mi>i</mi> </mrow> <mi>n</mi> </munderover> <mi>K</mi> <mrow> <mo>(</mo> <mrow> <mfrac> <mrow> <msub> <mi>X</mi> <mrow> <mi>i</mi> <mn>1</mn> </mrow> </msub> <mo>-</mo> <msub> <mi>X</mi> <mrow> <mi>j</mi> <mn>1</mn> </mrow> </msub> </mrow> <msub> <mi>h</mi> <mn>1</mn> </msub> </mfrac> <mo>,</mo> <mfrac> <mrow> <msub> <mi>X</mi> <mrow> <mi>i</mi> <mn>2</mn> </mrow> </msub> <mo>-</mo> <msub> <mi>X</mi> <mrow> <mi>j</mi> <mn>2</mn> </mrow> </msub> </mrow> <msub> <mi>h</mi> <mn>2</mn> </msub> </mfrac> <mo>,</mo> <mn>...</mn> <mo>,</mo> <mfrac> <mrow> <msub> <mi>X</mi> <mrow> <mi>i</mi> <mi>d</mi> </mrow> </msub> <mo>-</mo> <msub> <mi>X</mi> <mrow> <mi>j</mi> <mi>d</mi> </mrow> </msub> </mrow> <msub> <mi>h</mi> <mi>d</mi> </msub> </mfrac> </mrow> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>4</mn> <mo>)</mo> </mrow> </mrow>
4.根据权利要求1所述的基于改进密度峰值聚类算法的变压器故障类型分类方法,其特征在于,步骤2)中样本i的距离分布特性δi表示样本i与密度更大的样本点间距离的极小值;其中,样本密度即样本密度分布特性ρ采用公式(1)进行计算;距离采用高斯距离,其表达式为:
<mrow> <msub> <mi>&amp;Delta;d</mi> <mrow> <mi>i</mi> <mi>m</mi> </mrow> </msub> <mo>=</mo> <msqrt> <mrow> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>k</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>d</mi> </munderover> <msup> <mrow> <mo>(</mo> <msub> <mi>X</mi> <mrow> <mi>i</mi> <mi>k</mi> </mrow> </msub> <mo>-</mo> <msub> <mi>X</mi> <mrow> <mi>m</mi> <mi>k</mi> </mrow> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> </mrow> </msqrt> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>10</mn> <mo>)</mo> </mrow> </mrow>
其中,Δdim表示样本i与样本m之间的高斯距离,Xik与Xmk分别表示样本i与样本m的第k维度样本值。
5.根据权利要求1所述的基于改进密度峰值聚类算法的变压器故障类型分类方法,其特征在于,步骤3)中利用样本密度分布特性ρ与距离分布特性δ绘制决策图;在决策图中,自动识别位于决策图右上方的nc个样本作为样本集的密度中心。
6.根据权利要求1所述的基于改进密度峰值聚类算法的变压器故障类型分类方法,其特征在于,步骤(4)中相似度γij的定义为:
γij=(1+|Δρij|)×Δdij (6)
其中,Δρij和Δdij分别表示样本点i,j之间的密度分布差异以及距离;相似度矩阵γ定义为γ=[γij]n*n
7.根据权利要求1所述的基于改进密度峰值聚类算法的变压器故障类型分类方法,其特征在于,步骤(4)中构造各故障类型数据子集的密度骨架的流程如下:首先,由已识别的nc个样本密度中心出发,依次选择nn个相似度最高的样本点作为起点;随后,由nn个起点出发,逐步连接相似度最高且样本密度递减的样本点构成骨架结构,直至骨架末尾样本点密度降至本簇密度中心样本点密度的α倍时,完成故障类型数据子集的密度骨架搭建;其中,nn表示常数;0<α<1。
8.根据权利要求7所述的基于改进密度峰值聚类算法的变压器故障类型分类方法,其特征在于,nn=5,α=0.5。
9.根据权利要求1所述的基于改进密度峰值聚类算法的变压器故障类型分类方法,其特征在于,步骤(5)中将非密度骨架样本点按样本密度由大至小排序,并根据数据子集的距离分布特性δ依次连接至距自身最近且密度更大的样本点,完成所有样本点的归类。
CN201710640773.XA 2017-07-31 2017-07-31 基于改进密度峰值聚类算法的变压器故障类型分类方法 Active CN107491783B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710640773.XA CN107491783B (zh) 2017-07-31 2017-07-31 基于改进密度峰值聚类算法的变压器故障类型分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710640773.XA CN107491783B (zh) 2017-07-31 2017-07-31 基于改进密度峰值聚类算法的变压器故障类型分类方法

Publications (2)

Publication Number Publication Date
CN107491783A true CN107491783A (zh) 2017-12-19
CN107491783B CN107491783B (zh) 2020-07-21

Family

ID=60644034

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710640773.XA Active CN107491783B (zh) 2017-07-31 2017-07-31 基于改进密度峰值聚类算法的变压器故障类型分类方法

Country Status (1)

Country Link
CN (1) CN107491783B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108334898A (zh) * 2018-01-23 2018-07-27 华中科技大学 一种多模态工业过程模态辨识与故障分类方法
CN109063734A (zh) * 2018-06-29 2018-12-21 广东工业大学 结合多级局部密度聚类的油浸式变压器故障状态评估方法
CN109214527A (zh) * 2018-08-09 2019-01-15 南瑞集团有限公司 一种变压器故障早期诊断预警方法和系统
CN109374318A (zh) * 2018-09-27 2019-02-22 南京康尼机电股份有限公司 基于dpc的轨道车辆多门系统异常检测方法和系统
CN110688963A (zh) * 2019-09-30 2020-01-14 哈尔滨工业大学 基于聚类算法的大跨度桥梁涡激振动自动识别方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080166055A1 (en) * 2007-01-05 2008-07-10 Compal Electronics, Inc. Symbol Recognition Method
CN105930862A (zh) * 2016-04-13 2016-09-07 江南大学 一种基于密度自适应距离的密度峰聚类算法
CN106093612A (zh) * 2016-05-26 2016-11-09 国网江苏省电力公司电力科学研究院 一种电力变压器故障诊断方法
CN106408939A (zh) * 2016-10-29 2017-02-15 浙江大学 基于密度峰值聚类的交通流量序列划分方法
CN106443259A (zh) * 2016-09-29 2017-02-22 国网山东省电力公司电力科学研究院 基于欧式聚类和spo‑svm的变压器故障诊断新方法
CN106770939A (zh) * 2016-12-08 2017-05-31 贵州电网有限责任公司电力科学研究院 一种基于支持向量描述和k近质心近邻的变压器故障诊断方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080166055A1 (en) * 2007-01-05 2008-07-10 Compal Electronics, Inc. Symbol Recognition Method
CN105930862A (zh) * 2016-04-13 2016-09-07 江南大学 一种基于密度自适应距离的密度峰聚类算法
CN106093612A (zh) * 2016-05-26 2016-11-09 国网江苏省电力公司电力科学研究院 一种电力变压器故障诊断方法
CN106443259A (zh) * 2016-09-29 2017-02-22 国网山东省电力公司电力科学研究院 基于欧式聚类和spo‑svm的变压器故障诊断新方法
CN106408939A (zh) * 2016-10-29 2017-02-15 浙江大学 基于密度峰值聚类的交通流量序列划分方法
CN106770939A (zh) * 2016-12-08 2017-05-31 贵州电网有限责任公司电力科学研究院 一种基于支持向量描述和k近质心近邻的变压器故障诊断方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
MEI CHEN 等: "Effectively clustering by finding density backbone based-on kNN", 《PATTERN RECOGNITION》 *
SONGPING TANG 等: "An Improved Fuzzy C-means Clustering Algorithm for Transformer Fault", 《2016 CHINA INTERNATIONAL CONFERENCE ON ELECTRICITY DISTRIBUTION (CICED 2016)》 *
刘帮莉 等: "基于局部密度估计的多模态过程故障检测", 《化工学报》 *
马春来 等: "一种基于簇中心点自动选择策略的密度峰值聚类算法", 《计算机科学》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108334898A (zh) * 2018-01-23 2018-07-27 华中科技大学 一种多模态工业过程模态辨识与故障分类方法
CN109063734A (zh) * 2018-06-29 2018-12-21 广东工业大学 结合多级局部密度聚类的油浸式变压器故障状态评估方法
CN109063734B (zh) * 2018-06-29 2022-02-25 广东工业大学 结合多级局部密度聚类的油浸式变压器故障状态评估方法
CN109214527A (zh) * 2018-08-09 2019-01-15 南瑞集团有限公司 一种变压器故障早期诊断预警方法和系统
CN109374318A (zh) * 2018-09-27 2019-02-22 南京康尼机电股份有限公司 基于dpc的轨道车辆多门系统异常检测方法和系统
CN110688963A (zh) * 2019-09-30 2020-01-14 哈尔滨工业大学 基于聚类算法的大跨度桥梁涡激振动自动识别方法

Also Published As

Publication number Publication date
CN107491783B (zh) 2020-07-21

Similar Documents

Publication Publication Date Title
CN107491783A (zh) 基于改进密度峰值聚类算法的变压器故障类型分类方法
CN103914064B (zh) 基于多分类器和d-s证据融合的工业过程故障诊断方法
CN104535865A (zh) 基于多参数的电力变压器运行故障综合诊断方法
CN104052612B (zh) 一种电信业务的故障识别与定位的方法及系统
CN107132310B (zh) 基于高斯混合模型的变压器设备健康状态判别方法
CN106770939A (zh) 一种基于支持向量描述和k近质心近邻的变压器故障诊断方法
CN107862114A (zh) 基于三比值特征量的小波pso‑svm变压器故障诊断方法
CN105138413B (zh) 一种配电网在线数据异常检测方法
CN106250934B (zh) 一种缺陷数据的分类方法及装置
CN110488164B (zh) 一种高压电缆绝缘老化状态综合评估预警方法及系统
CN108197639A (zh) 一种基于随机森林的变压器故障诊断方法
CN107219446A (zh) 一种基于光声光谱信息的气体绝缘组合电器绝缘故障识别方法
CN110197222A (zh) 一种基于多分类支持向量机变压器故障诊断的方法
CN106526370A (zh) 一种基于化学反应算法的rvm变压器故障诊断方法
CN108304931A (zh) 一种变电设备状态检修故障诊断方法
CN108709744A (zh) 一种变负载工况下电机轴承故障诊断方法
CN109376626A (zh) 一种基于辐射电场特征参数支持向量机的gis开关缺陷诊断方法
CN112200263A (zh) 一种应用于配电物联网的自组织联邦聚类方法
CN110059773B (zh) 一种变压器故障复合诊断方法
CN105137238A (zh) 一种气体绝缘组合电器故障诊断系统
Demirci et al. Comparative dissolved gas analysis with machine learning and traditional methods
CN114372693A (zh) 一种基于云模型和改进ds证据理论的变压器故障诊断方法
CN110020637A (zh) 一种基于多粒度级联森林的模拟电路间歇故障诊断方法
CN106022636B (zh) 一种宇航元器件pid实施成效评价方法
CN113721002A (zh) 一种基于硬投票集成学习的变压器故障诊断的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant