CN106202922A - 一种基于聚类算法的变压器故障诊断系统 - Google Patents
一种基于聚类算法的变压器故障诊断系统 Download PDFInfo
- Publication number
- CN106202922A CN106202922A CN201610538557.XA CN201610538557A CN106202922A CN 106202922 A CN106202922 A CN 106202922A CN 201610538557 A CN201610538557 A CN 201610538557A CN 106202922 A CN106202922 A CN 106202922A
- Authority
- CN
- China
- Prior art keywords
- sample
- module
- max
- clusters
- center
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000003745 diagnosis Methods 0.000 title claims abstract description 37
- 238000012549 training Methods 0.000 claims abstract description 58
- 230000001537 neural effect Effects 0.000 claims abstract description 36
- 230000007935 neutral effect Effects 0.000 claims abstract description 35
- 238000012360 testing method Methods 0.000 claims abstract description 34
- 238000000034 method Methods 0.000 claims abstract description 29
- 238000007621 cluster analysis Methods 0.000 claims abstract description 27
- 238000003064 k means clustering Methods 0.000 claims abstract description 27
- 238000004458 analytical method Methods 0.000 claims abstract description 22
- 238000007781 pre-processing Methods 0.000 claims abstract description 16
- 230000006872 improvement Effects 0.000 claims abstract description 15
- 238000012216 screening Methods 0.000 claims abstract description 8
- 239000011159 matrix material Substances 0.000 claims description 21
- 230000008859 change Effects 0.000 claims description 14
- 206010020843 Hyperthermia Diseases 0.000 claims description 7
- 208000036626 Mental retardation Diseases 0.000 claims description 7
- 230000001174 ascending effect Effects 0.000 claims description 7
- 230000036031 hyperthermia Effects 0.000 claims description 7
- 238000013021 overheating Methods 0.000 claims description 7
- 238000011156 evaluation Methods 0.000 description 6
- 238000005070 sampling Methods 0.000 description 6
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 6
- 238000013459 approach Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 2
- 230000004888 barrier function Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/26—Oils; Viscous liquids; Paints; Inks
- G01N33/28—Oils, i.e. hydrocarbon liquids
- G01N33/2835—Specific substances contained in the oils or fuels
- G01N33/2841—Gas in oils, e.g. hydrogen in insulating oils
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01R—MEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
- G01R31/00—Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere
- G01R31/12—Testing dielectric strength or breakdown voltage ; Testing or monitoring effectiveness or level of insulation, e.g. of a cable or of an apparatus, for example using partial discharge measurements; Electrostatic testing
- G01R31/1227—Testing dielectric strength or breakdown voltage ; Testing or monitoring effectiveness or level of insulation, e.g. of a cable or of an apparatus, for example using partial discharge measurements; Electrostatic testing of components, parts or materials
- G01R31/1263—Testing dielectric strength or breakdown voltage ; Testing or monitoring effectiveness or level of insulation, e.g. of a cable or of an apparatus, for example using partial discharge measurements; Electrostatic testing of components, parts or materials of solid or fluid materials, e.g. insulation films, bulk material; of semiconductors or LV electronic components or parts; of cable, line or wire insulation
- G01R31/1281—Testing dielectric strength or breakdown voltage ; Testing or monitoring effectiveness or level of insulation, e.g. of a cable or of an apparatus, for example using partial discharge measurements; Electrostatic testing of components, parts or materials of solid or fluid materials, e.g. insulation films, bulk material; of semiconductors or LV electronic components or parts; of cable, line or wire insulation of liquids or gases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/12—Computing arrangements based on biological models using genetic models
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16Z—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS, NOT OTHERWISE PROVIDED FOR
- G16Z99/00—Subject matter not provided for in other main groups of this subclass
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Chemical & Material Sciences (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Genetics & Genomics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Oil, Petroleum & Natural Gas (AREA)
- Food Science & Technology (AREA)
- Medicinal Chemistry (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
Abstract
本发明公开了一种基于聚类算法的变压器故障诊断系统,包括:样本采集模块,用于采集变压器的油中溶解气体数据,并将所述油中溶解气体数据作为原始样本;数据预处理模块,用于对原始样本中的数据进行清洗和筛选预处理;样本分析聚类模块,用于采用改进的K‑means聚类方法对预处理后的原始样本进行聚类分析,得到训练样本和测试样本;神经网络训练模块,用于构建神经网络,并进行优化训练,确定隐藏层的个数、中心位置、宽度以及输出权值;故障类别判断模块,用于向训练好的神经网络输入训练样本,求解后验概率,判断故障类别。本发明容易实施、能够提高故障诊断正确率及工作效率。
Description
技术领域
本发明涉及变压器故障诊断领域,具体涉及一种基于聚类算法的变压器故障诊断系统。
背景技术
电力变压器作为电力系统中最重要的设备之一,其运行状态直接影响到整个电力系统的安全性和稳定性。由于电力变压器内部结构的复杂性,运行环境的特殊性,在变压器的长期运行当中,发生故障是不可避免的。一旦发生故障,将会严重影响社会的生产和人们的生活,造成严重的经济损失。
发明内容
针对上述问题,本发明提供一种容易实施、能够提高故障诊断正确率及工作效率的基于聚类算法的变压器故障诊断系统。
本发明的目的采用以下技术方案来实现:
一种基于聚类算法的变压器故障诊断系统,包括样本采集模块、数据预处理模块、样本分析聚类模块、神经网络训练模块和故障类别判断模块;
所述样本采集模块用于采集变压器的油中溶解气体数据,并将所述油中溶解气体数据作为原始样本;
所述数据预处理模块,用于对原始样本中的数据进行清洗和筛选预处理;
所述样本分析聚类模块,用于采用改进的K-means聚类方法对预处理后的原始样本进行聚类分析,得到训练样本和测试样本;
所述神经网络训练模块,用于构建神经网络,并进行优化训练,确定隐藏层的个数、中心位置、宽度以及输出权值;
所述故障类别判断模块,用于向训练好的神经网络输入训练样本,求解后验概率,判断故障类别。
其中,所述故障类别包括中低温过热、中温过热、高温过热、局部放电、低能放电、高能放电。
优选地,所述神经网络为RBF神经网络,所述RBF神经网络由网络输入和网络输出两部分组成。
其中,所述油中溶解气体数据中的气体包括:H2、CH4、C2H6、C2H4、C2H2。
其中,所述采用改进的K-means聚类方法对对预处理后的原始样本进行聚类分析,具体为:
1)设将所述原始样本划分为n个子样本,对n个子样本进行向量化,通过夹角余弦函数计算所有子样本两两之间的相似度,得到相似度矩阵XS;
2)对相似度矩阵XS的每一行进行求和,计算出每一个子样本与整个原始样本的相似度,设XS=[sim(ai,aj)]n×n,i,j=1,…,n,其中sim(ai,aj)表示样本ai,aj间的相似度,求和公式为:
3)按降序排列XSp,p=1,…,n,设XSp按从大到小排列的前4个值为XSmax,XSmax-1,XSmax-2,XSmax-3,若选择与最大值XSmax相对应的子样本作为第一个初始的聚簇中心,否则选择与XSmax,XSmax-1,XSmax-2,XSmax-3对应的四个子样本的均值作为第一个初始的簇中心;
4)将最大值为XSmax对应的矩阵中行向量的元素进行升序排列,假设前k-1个最小的元素为XSpq,q=1,…,k-1,选择前k-1个最小的元素XSpq相对应的子样本作为剩余的k-1个初始的聚簇中心,其中所述k值为隐藏层个数,根据多次试验确定;
5)计算剩余样本与各初始的聚簇中心之间的相似度,将剩余样本分发到相似度最高的聚簇中,形成变化后的k个聚簇;
6)计算变化后的聚簇中各样本的均值,将其作为更新后的聚簇中心代替更新前的聚簇中心;
7)若更新前的聚簇中心与更新后的聚簇中心相同,或者目标函数达到了最小值,停止更新,所述目标函数为:
其中,Cl表示k个聚簇中的第l个聚簇,ax为第l个聚簇中的样本,为第l个聚簇的中心。
其中,所述设定的比例值T的取值范围为[1.4,1.8]。
本发明的有益效果为:
1、容易实施、工作效率高;
2、设置样本分析聚类模块、神经网络训练模块,通过改进的K-means聚类方法对预处理后的原始样本进行聚类分析,得到训练样本和测试样本,就完全可以避免以往由于随机挑选训练样本和测试样本所带来的问题,而良好的测试样本能够对神经网络进行更为完整的测试,从而确保神经网络得到正确合理的评价;
3、通过改进的K-means聚类方法对预处理后的原始样本进行聚类分析,有效避免单一采取随机抽样方法所带来的偶然性,解决原有算法在选取初始化聚类中心时所存在的问题,提高了聚类稳定性,进一步提高了提高变压器故障诊断系统的诊断正确率。
附图说明
利用附图对本发明作进一步说明,但附图中的实施例不构成对本发明的任何限制,对于本领域的普通技术人员,在不付出创造性劳动的前提下,还可以根据以下附图获得其它的附图。
图1是本发明各模块的连接示意图;
图2是本发明系统运作流程示意图。
附图标记:
样本采集模块1、数据预处理模块2、样本分析聚类模块3、神经网络训练模块4、故障类别判断模块5。
具体实施方式
结合以下实施例对本发明作进一步描述。
实施例1
参见图1、图2,本实施例的基于聚类算法的变压器故障诊断系统,包括样本采集模块1、数据预处理模块2、样本分析聚类模块3、神经网络训练模块4、故障类别判断模块5;
所述样本采集模块1用于采集变压器的油中溶解气体数据,并将所述油中溶解气体数据作为原始样本;
所述数据预处理模块2,用于对原始样本中的数据进行清洗和筛选预处理;
所述样本分析聚类模块3,用于采用改进的K-means聚类方法对预处理后的原始样本进行聚类分析,得到训练样本和测试样本;
所述神经网络训练模块4,用于构建神经网络,并进行优化训练,确定隐藏层的个数、中心位置、宽度以及输出权值;
所述故障类别判断模块5,用于向训练好的神经网络输入训练样本,求解后验概率,判断故障类别。
其中,所述故障类别包括中低温过热、中温过热、高温过热、局部放电、低能放电、高能放电。
其中,所述神经网络为RBF神经网络,所述RBF神经网络由网络输入和网络输出两部分组成。
其中,所述油中溶解气体数据中的气体包括:H2、CH4、C2H6、C2H4、C2H2。
其中,所述采用改进的K-means聚类方法对对预处理后的原始样本进行聚类分析,具体为:
1)设将所述原始样本划分为n个子样本,对n个子样本进行向量化,通过夹角余弦函数计算所有子样本两两之间的相似度,得到相似度矩阵XS;
2)对相似度矩阵XS的每一行进行求和,计算出每一个子样本与整个原始样本的相似度,设XS=[sim(ai,aj)]n×n,i,j=1,…,n,其中sim(ai,aj)表示样本ai,aj间的相似度,求和公式为:
3)按降序排列XSp,p=1,…,n,设XSp按从大到小排列的前4个值为XSmax,XSmax-1,XSmax-2,XSmax-3,若选择与最大值XSmax相对应的子样本作为第一个初始的聚簇中心,否则选择与XSmax,XSmax-1,XSmax-2,XSmax-3对应的四个子样本的均值作为第一个初始的簇中心;
4)将最大值为XSmax对应的矩阵中行向量的元素进行升序排列,假设前k-1个最小的元素为XSpq,q=1,…,k-1,选择前k-1个最小的元素XSpq相对应的子样本作为剩余的k-1个初始的聚簇中心,其中所述k值为隐藏层个数,根据多次试验确定;
5)计算剩余样本与各初始的聚簇中心之间的相似度,将剩余样本分发到相似度最高的聚簇中,形成变化后的k个聚簇;
6)计算变化后的聚簇中各样本的均值,将其作为更新后的聚簇中心代替更新前的聚簇中心;
7)若更新前的聚簇中心与更新后的聚簇中心相同,或者目标函数达到了最小值,停止更新,所述目标函数为:
其中,Cl表示k个聚簇中的第l个聚簇,ax为第l个聚簇中的样本,为第l个聚簇的中心。
本实施例容易实施、工作效率高;设置样本分析聚类模块3、神经网络训练模块4,通过改进的K-means聚类方法对预处理后的原始样本进行聚类分析,得到训练样本和测试样本,就完全可以避免以往由于随机挑选训练样本和测试样本所带来的问题,而良好的测试样本能够对神经网络进行更为完整的测试,从而确保神经网络得到正确合理的评价;通过改进的K-means聚类方法对预处理后的原始样本进行聚类分析,有效避免单一采取随机抽样方法所带来的偶然性,解决原有算法在选取初始化聚类中心时所存在的问题,提高了聚类稳定性,进一步提高了提高变压器故障诊断系统的诊断正确率,其中设定比例值T=1.4,诊断正确率相对提高了3.5%。
实施例2
参见图1、图2,本实施例的基于聚类算法的变压器故障诊断系统,包括样本采集模块1、数据预处理模块2、样本分析聚类模块3、神经网络训练模块4、故障类别判断模块5;
所述样本采集模块1用于采集变压器的油中溶解气体数据,并将所述油中溶解气体数据作为原始样本;
所述数据预处理模块2,用于对原始样本中的数据进行清洗和筛选预处理;
所述样本分析聚类模块3,用于采用改进的K-means聚类方法对预处理后的原始样本进行聚类分析,得到训练样本和测试样本;
所述神经网络训练模块4,用于构建神经网络,并进行优化训练,确定隐藏层的个数、中心位置、宽度以及输出权值;
所述故障类别判断模块5,用于向训练好的神经网络输入训练样本,求解后验概率,判断故障类别。
其中,所述故障类别包括中低温过热、中温过热、高温过热、局部放电、低能放电、高能放电。
其中,所述神经网络为RBF神经网络,所述RBF神经网络由网络输入和网络输出两部分组成。
其中,所述油中溶解气体数据中的气体包括:H2、CH4、C2H6、C2H4、C2H2。
其中,所述采用改进的K-means聚类方法对对预处理后的原始样本进行聚类分析,具体为:
1)设将所述原始样本划分为n个子样本,对n个子样本进行向量化,通过夹角余弦函数计算所有子样本两两之间的相似度,得到相似度矩阵XS;
2)对相似度矩阵XS的每一行进行求和,计算出每一个子样本与整个原始样本的相似度,设XS=[aim(ai,aj)]n×n,i,j=1,…,n,其中sim(ai,aj)表示样本ai,aj间的相似度,求和公式为:
3)按降序排列XSp,p=1,…,n,设XSp按从大到小排列的前4个值为XSmax,XSmax-1,XSmax-2,XSmax-3,若选择与最大值XSmax相对应的子样本作为第一个初始的聚簇中心,否则选择与XSmax,XSmax-1,XSmax-2,XSmax-3对应的四个子样本的均值作为第一个初始的簇中心;
4)将最大值为XSmax对应的矩阵中行向量的元素进行升序排列,假设前k-1个最小的元素为XSpq,q=1,…,k-1,选择前k-1个最小的元素XSpq相对应的子样本作为剩余的k-1个初始的聚簇中心,其中所述k值为隐藏层个数,根据多次试验确定;
5)计算剩余样本与各初始的聚簇中心之间的相似度,将剩余样本分发到相似度最高的聚簇中,形成变化后的k个聚簇;
6)计算变化后的聚簇中各样本的均值,将其作为更新后的聚簇中心代替更新前的聚簇中心;
7)若更新前的聚簇中心与更新后的聚簇中心相同,或者目标函数达到了最小值,停止更新,所述目标函数为:
其中,Cl表示k个聚簇中的第l个聚簇,ax为第l个聚簇中的样本,为第l个聚簇的中心。
本实施例容易实施、工作效率高;设置样本分析聚类模块3、神经网络训练模块4,通过改进的K-means聚类方法对预处理后的原始样本进行聚类分析,得到训练样本和测试样本,就完全可以避免以往由于随机挑选训练样本和测试样本所带来的问题,而良好的测试样本能够对神经网络进行更为完整的测试,从而确保神经网络得到正确合理的评价;通过改进的K-means聚类方法对预处理后的原始样本进行聚类分析,有效避免单一采取随机抽样方法所带来的偶然性,解决原有算法在选取初始化聚类中心时所存在的问题,提高了聚类稳定性,进一步提高了提高变压器故障诊断系统的诊断正确率,其中设定比例值T=1.5,诊断正确率相对提高了4%。
实施例3
参见图1、图2,本实施例的基于聚类算法的变压器故障诊断系统,包括样本采集模块1、数据预处理模块2、样本分析聚类模块3、神经网络训练模块4、故障类别判断模块5;
所述样本采集模块1用于采集变压器的油中溶解气体数据,并将所述油中溶解气体数据作为原始样本;
所述数据预处理模块2,用于对原始样本中的数据进行清洗和筛选预处理;
所述样本分析聚类模块3,用于采用改进的K-means聚类方法对预处理后的原始样本进行聚类分析,得到训练样本和测试样本;
所述神经网络训练模块4,用于构建神经网络,并进行优化训练,确定隐藏层的个数、中心位置、宽度以及输出权值;
所述故障类别判断模块5,用于向训练好的神经网络输入训练样本,求解后验概率,判断故障类别。
其中,所述故障类别包括中低温过热、中温过热、高温过热、局部放电、低能放电、高能放电。
其中,所述神经网络为RBF神经网络,所述RBF神经网络由网络输入和网络输出两部分组成。
其中,所述油中溶解气体数据中的气体包括:H2、CH4、C2H6、C2H4、C2H2。
其中,所述采用改进的K-means聚类方法对对预处理后的原始样本进行聚类分析,具体为:
1)设将所述原始样本划分为n个子样本,对n个子样本进行向量化,通过夹角余弦函数计算所有子样本两两之间的相似度,得到相似度矩阵XS;
2)对相似度矩阵XS的每一行进行求和,计算出每一个子样本与整个原始样本的相似度,设XS=[sim(ai,aj)]n×n,i,j=1,…,n,其中sim(ai,aj)表示样本ai,aj间的相似度,求和公式为:
3)按降序排列XSp,p=1,…,n,设XSp按从大到小排列的前4个值为XSmax,XSmax-1,XSmax-2,XSmax-3,若选择与最大值XSmax相对应的子样本作为第一个初始的聚簇中心,否则选择与XSmax,XSmax-1,XSmax-2,XSmax-3对应的四个子样本的均值作为第一个初始的簇中心;
4)将最大值为XSmax对应的矩阵中行向量的元素进行升序排列,假设前k-1个最小的元素为XSpq,q=1,…,k-1,选择前k-1个最小的元素XSpq相对应的子样本作为剩余的k-1个初始的聚簇中心,其中所述k值为隐藏层个数,根据多次试验确定;
5)计算剩余样本与各初始的聚簇中心之间的相似度,将剩余样本分发到相似度最高的聚簇中,形成变化后的k个聚簇;
6)计算变化后的聚簇中各样本的均值,将其作为更新后的聚簇中心代替更新前的聚簇中心;
7)若更新前的聚簇中心与更新后的聚簇中心相同,或者目标函数达到了最小值,停止更新,所述目标函数为:
其中,Cl表示k个聚簇中的第l个聚簇,ax为第l个聚簇中的样本,为第l个聚簇的中心。
本实施例容易实施、工作效率高;设置样本分析聚类模块3、神经网络训练模块4,通过改进的K-means聚类方法对预处理后的原始样本进行聚类分析,得到训练样本和测试样本,就完全可以避免以往由于随机挑选训练样本和测试样本所带来的问题,而良好的测试样本能够对神经网络进行更为完整的测试,从而确保神经网络得到正确合理的评价;通过改进的K-means聚类方法对预处理后的原始样本进行聚类分析,有效避免单一采取随机抽样方法所带来的偶然性,解决原有算法在选取初始化聚类中心时所存在的问题,提高了聚类稳定性,进一步提高了提高变压器故障诊断系统的诊断正确率,其中设定比例值T=1.6,诊断正确率相对提高了3%。
实施例4
参见图1、图2,本实施例的基于聚类算法的变压器故障诊断系统,包括样本采集模块1、数据预处理模块2、样本分析聚类模块3、神经网络训练模块4、故障类别判断模块5;
所述样本采集模块1用于采集变压器的油中溶解气体数据,并将所述油中溶解气体数据作为原始样本;
所述数据预处理模块2,用于对原始样本中的数据进行清洗和筛选预处理;
所述样本分析聚类模块3,用于采用改进的K-means聚类方法对预处理后的原始样本进行聚类分析,得到训练样本和测试样本;
所述神经网络训练模块4,用于构建神经网络,并进行优化训练,确定隐藏层的个数、中心位置、宽度以及输出权值;
所述故障类别判断模块5,用于向训练好的神经网络输入训练样本,求解后验概率,判断故障类别。
其中,所述故障类别包括中低温过热、中温过热、高温过热、局部放电、低能放电、高能放电。
其中,所述神经网络为RBF神经网络,所述RBF神经网络由网络输入和网络输出两部分组成。
其中,所述油中溶解气体数据中的气体包括:H2、CH4、C2H6、C2H4、C2H2。
其中,所述采用改进的K-means聚类方法对对预处理后的原始样本进行聚类分析,具体为:
1)设将所述原始样本划分为n个子样本,对n个子样本进行向量化,通过夹角余弦函数计算所有子样本两两之间的相似度,得到相似度矩阵XS;
2)对相似度矩阵XS的每一行进行求和,计算出每一个子样本与整个原始样本的相似度,设XS=[sim(ai,aj)]n×n,i,j=1,…,n,其中sim(ai,aj)表示样本ai,aj间的相似度,求和公式为:
3)按降序排列XSp,p=1,…,n,设XSp按从大到小排列的前4个值为XSmax,XSmax-1,XSmax-2,XSmax-3,若选择与最大值XSmax相对应的子样本作为第一个初始的聚簇中心,否则选择与XSmax,XSmax-1,XSmax-2,XSmax-3对应的四个子样本的均值作为第一个初始的簇中心;
4)将最大值为XSmax对应的矩阵中行向量的元素进行升序排列,假设前k-1个最小的元素为XSpq,q=1,…,k-1,选择前k-1个最小的元素XSpq相对应的子样本作为剩余的k-1个初始的聚簇中心,其中所述k值为隐藏层个数,根据多次试验确定;
5)计算剩余样本与各初始的聚簇中心之间的相似度,将剩余样本分发到相似度最高的聚簇中,形成变化后的k个聚簇;
6)计算变化后的聚簇中各样本的均值,将其作为更新后的聚簇中心代替更新前的聚簇中心;
7)若更新前的聚簇中心与更新后的聚簇中心相同,或者目标函数达到了最小值,停止更新,所述目标函数为:
其中,=l表示k个聚簇中的第l个聚簇,ax为第l个聚簇中的样本,为第l个聚簇的中心。
本实施例容易实施、工作效率高;设置样本分析聚类模块3、神经网络训练模块4,通过改进的K-means聚类方法对预处理后的原始样本进行聚类分析,得到训练样本和测试样本,就完全可以避免以往由于随机挑选训练样本和测试样本所带来的问题,而良好的测试样本能够对神经网络进行更为完整的测试,从而确保神经网络得到正确合理的评价;通过改进的K-means聚类方法对预处理后的原始样本进行聚类分析,有效避免单一采取随机抽样方法所带来的偶然性,解决原有算法在选取初始化聚类中心时所存在的问题,提高了聚类稳定性,进一步提高了提高变压器故障诊断系统的诊断正确率,其中设定比例值T=1.7,诊断正确率相对提高了2.1%。
实施例5
参见图1、图2,本实施例的基于聚类算法的变压器故障诊断系统,包括样本采集模块1、数据预处理模块2、样本分析聚类模块3、神经网络训练模块4、故障类别判断模块5;
所述样本采集模块1用于采集变压器的油中溶解气体数据,并将所述油中溶解气体数据作为原始样本;
所述数据预处理模块2,用于对原始样本中的数据进行清洗和筛选预处理;
所述样本分析聚类模块3,用于采用改进的K-means聚类方法对预处理后的原始样本进行聚类分析,得到训练样本和测试样本;
所述神经网络训练模块4,用于构建神经网络,并进行优化训练,确定隐藏层的个数、中心位置、宽度以及输出权值;
所述故障类别判断模块5,用于向训练好的神经网络输入训练样本,求解后验概率,判断故障类别。
其中,所述故障类别包括中低温过热、中温过热、高温过热、局部放电、低能放电、高能放电。
其中,所述神经网络为RBF神经网络,所述RBF神经网络由网络输入和网络输出两部分组成。
其中,所述油中溶解气体数据中的气体包括:H2、CH4、C2H6、C2H4、C2H2。
其中,所述采用改进的K-means聚类方法对对预处理后的原始样本进行聚类分析,具体为:
1)设将所述原始样本划分为n个子样本,对n个子样本进行向量化,通过夹角余弦函数计算所有子样本两两之间的相似度,得到相似度矩阵XS;
2)对相似度矩阵XS的每一行进行求和,计算出每一个子样本与整个原始样本的相似度,设XS=[sim(ai,aj)]n×n,i,j=1,…,n,其中sim(ai,aj)表示样本ai,aj间的相似度,求和公式为:
3)按降序排列XSp,p=1,…,n,设XSp按从大到小排列的前4个值为XSmax,XSmax-1,XSmax-2,XSmax-3,若选择与最大值XSmax相对应的子样本作为第一个初始的聚簇中心,否则选择与XSmax,XSmax-1,XSmax-2,XSmax-3对应的四个子样本的均值作为第一个初始的簇中心;
4)将最大值为XSmax对应的矩阵中行向量的元素进行升序排列,假设前k-1个最小的元素为XSpq,q=1,…,k-1,选择前k-1个最小的元素XSpq相对应的子样本作为剩余的k-1个初始的聚簇中心,其中所述k值为隐藏层个数,根据多次试验确定;
5)计算剩余样本与各初始的聚簇中心之间的相似度,将剩余样本分发到相似度最高的聚簇中,形成变化后的k个聚簇;
6)计算变化后的聚簇中各样本的均值,将其作为更新后的聚簇中心代替更新前的聚簇中心;
7)若更新前的聚簇中心与更新后的聚簇中心相同,或者目标函数达到了最小值,停止更新,所述目标函数为:
其中,Cl表示k个聚簇中的第l个聚簇,ax为第l个聚簇中的样本,为第l个聚簇的中心。
本实施例容易实施、工作效率高;设置样本分析聚类模块3、神经网络训练模块4,通过改进的K-means聚类方法对预处理后的原始样本进行聚类分析,得到训练样本和测试样本,就完全可以避免以往由于随机挑选训练样本和测试样本所带来的问题,而良好的测试样本能够对神经网络进行更为完整的测试,从而确保神经网络得到正确合理的评价;通过改进的K-means聚类方法对预处理后的原始样本进行聚类分析,有效避免单一采取随机抽样方法所带来的偶然性,解决原有算法在选取初始化聚类中心时所存在的问题,提高了聚类稳定性,进一步提高了提高变压器故障诊断系统的诊断正确率,其中设定比例值T=1.8,诊断正确率相对提高了1.5%。
最后应当说明的是,以上实施例仅用以说明本发明的技术方案,而非对本发明保护范围的限制,尽管参照较佳实施例对本发明作了详细地说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的实质和范围。
Claims (6)
1.一种基于聚类算法的变压器故障诊断系统,其特征在于,包括样本采集模块、数据预处理模块、样本分析聚类模块、神经网络训练模块和故障类别判断模块;
所述样本采集模块用于采集变压器的油中溶解气体数据,并将所述油中溶解气体数据作为原始样本;
所述数据预处理模块,用于对原始样本中的数据进行清洗和筛选预处理;
所述样本分析聚类模块,用于采用改进的K-means聚类方法对预处理后的原始样本进行聚类分析,得到训练样本和测试样本;
所述神经网络训练模块,用于构建神经网络,并进行优化训练,确定隐藏层的个数、中心位置、宽度以及输出权值;
所述故障类别判断模块,用于向训练好的神经网络输入训练样本,求解后验概率,判断故障类别。
2.根据权利要求1所述的一种基于聚类算法的变压器故障诊断系统,其特征在于,所述故障类别包括中低温过热、中温过热、高温过热、局部放电、低能放电、高能放电。
3.根据权利要求1所述的一种基于聚类算法的变压器故障诊断系统,其特征在于,所述神经网络为RBF神经网络,所述RBF神经网络由网络输入和网络输出两部分组成。
4.根据权利要求1所述的一种基于聚类算法的变压器故障诊断系统,其特征在于,所述油中溶解气体数据中的气体包括:H2、CH4、C2H6、C2H4、C2H2。
5.根据权利要求1所述的一种基于聚类算法的变压器故障诊断系统,其特征在于,所述采用改进的K-means聚类方法对对预处理后的原始样本进行聚类分析,具体为:
1)设将所述原始样本划分为n个子样本,对n个子样本进行向量化,通过夹角余弦函数计算所有子样本两两之间的相似度,得到相似度矩阵XS;
2)对相似度矩阵XS的每一行进行求和,计算出每一个子样本与整个原始样本的相似度,设XS=[sim(ai,aj)]n×n,i,j=1,…,n,其中sim(ai,aj)表示样本ai,aj间的相似度,求和公式为:
3)按降序排列XSp,p=1,…,n,设XSp按从大到小排列的前4个值为XSmax,XSmax-1,XSmax-2,XSmax-3,若选择与最大值XSmax相对应的子样本作为第一个初始的聚簇中心,否则选择与XSmax,XSmax-1,XSmax-2,XSmax-3对应的四个子样本的均值作为第一个初始的簇中心;
4)将最大值为XSmax对应的矩阵中行向量的元素进行升序排列,假设前k-1个最小的元素为XSpq,q=1,…,k-1,选择前k-1个最小的元素XSpq相对应的子样本作为剩余的k-1个初始的聚簇中心,其中所述k值为隐藏层个数,根据多次试验确定;
5)计算剩余样本与各初始的聚簇中心之间的相似度,将剩余样本分发到相似度最高的聚簇中,形成变化后的k个聚簇;
6)计算变化后的聚簇中各样本的均值,将其作为更新后的聚簇中心代替更新前的聚簇中心;
7)若更新前的聚簇中心与更新后的聚簇中心相同,或者目标函数达到了最小值,停止更新,所述目标函数为:
其中,Cl表示k个聚簇中的第l个聚簇,ax为第l个聚簇中的样本,为第l个聚簇的中心。
6.根据权利要求1所述的一种基于聚类算法的变压器故障诊断系统,其特征在于,所述设定的比例值T的取值范围为[1.4,1.8]。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610538557.XA CN106202922A (zh) | 2016-07-06 | 2016-07-06 | 一种基于聚类算法的变压器故障诊断系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610538557.XA CN106202922A (zh) | 2016-07-06 | 2016-07-06 | 一种基于聚类算法的变压器故障诊断系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106202922A true CN106202922A (zh) | 2016-12-07 |
Family
ID=57474211
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610538557.XA Withdrawn CN106202922A (zh) | 2016-07-06 | 2016-07-06 | 一种基于聚类算法的变压器故障诊断系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106202922A (zh) |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107194465A (zh) * | 2017-06-16 | 2017-09-22 | 华北电力大学(保定) | 一种利用虚拟样本训练神经网络诊断变压器故障的方法 |
CN107656154A (zh) * | 2017-09-18 | 2018-02-02 | 杭州安脉盛智能技术有限公司 | 基于改进模糊c均值聚类算法的变压器故障诊断方法 |
CN108038847A (zh) * | 2017-12-05 | 2018-05-15 | 国网内蒙古东部电力有限公司 | 基于深度学习的变压器巡检图像智能识别和故障检测系统 |
CN108344812A (zh) * | 2017-11-24 | 2018-07-31 | 北京国网富达科技发展有限责任公司 | 一种变压器故障诊断方法、装置及存储介质 |
CN109063734A (zh) * | 2018-06-29 | 2018-12-21 | 广东工业大学 | 结合多级局部密度聚类的油浸式变压器故障状态评估方法 |
CN109061426A (zh) * | 2018-11-02 | 2018-12-21 | 国网河北省电力有限公司电力科学研究院 | 变压器局部放电故障诊断方法及在线监测装置 |
CN109164248A (zh) * | 2018-09-18 | 2019-01-08 | 山东理工大学 | 一种变压器油中溶解气体浓度预测方法 |
CN109374324A (zh) * | 2018-09-29 | 2019-02-22 | 国网山西省电力公司阳泉供电公司 | 基于振动信号特征矩阵相似度的变压器机械故障诊断方法 |
CN109472308A (zh) * | 2018-11-08 | 2019-03-15 | 华南理工大学 | 一种基于人工智能的免标记仪器设备特征锚点检测方法 |
CN110163531A (zh) * | 2019-06-02 | 2019-08-23 | 南京邮电大学盐城大数据研究院有限公司 | 基于k-聚类的电网变压器异常状态预警方法 |
CN110196165A (zh) * | 2019-04-29 | 2019-09-03 | 杭州电子科技大学 | 一种基于K-means聚类和证据推理的旋转机械滚珠轴承故障诊断方法 |
CN110209658A (zh) * | 2019-06-04 | 2019-09-06 | 北京字节跳动网络技术有限公司 | 数据清洗方法和装置 |
CN110275868A (zh) * | 2019-06-21 | 2019-09-24 | 厦门嵘拓物联科技有限公司 | 一种智能工厂中多模态制造数据预处理的方法 |
CN110488147A (zh) * | 2019-07-16 | 2019-11-22 | 国网吉林省电力有限公司白城供电公司 | 基于gps时钟无线同步的投运电缆局部放电在线监测方法 |
CN110890146A (zh) * | 2019-11-04 | 2020-03-17 | 广东德澳智慧医疗科技有限公司 | 一种用于智慧病房的床旁智能交互系统 |
CN111079750A (zh) * | 2019-12-13 | 2020-04-28 | 国网电力科学研究院武汉南瑞有限责任公司 | 一种基于局部区域聚类的电力设备故障区域提取方法 |
WO2020108159A1 (zh) * | 2018-11-26 | 2020-06-04 | 中兴通讯股份有限公司 | 一种网络故障根因检测方法、系统及存储介质 |
CN111610026A (zh) * | 2020-06-28 | 2020-09-01 | 盐城工学院 | 一种基于深度聚类的旋转机械故障诊断方法 |
-
2016
- 2016-07-06 CN CN201610538557.XA patent/CN106202922A/zh not_active Withdrawn
Cited By (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107194465A (zh) * | 2017-06-16 | 2017-09-22 | 华北电力大学(保定) | 一种利用虚拟样本训练神经网络诊断变压器故障的方法 |
CN107656154A (zh) * | 2017-09-18 | 2018-02-02 | 杭州安脉盛智能技术有限公司 | 基于改进模糊c均值聚类算法的变压器故障诊断方法 |
CN108344812A (zh) * | 2017-11-24 | 2018-07-31 | 北京国网富达科技发展有限责任公司 | 一种变压器故障诊断方法、装置及存储介质 |
CN108038847A (zh) * | 2017-12-05 | 2018-05-15 | 国网内蒙古东部电力有限公司 | 基于深度学习的变压器巡检图像智能识别和故障检测系统 |
CN109063734A (zh) * | 2018-06-29 | 2018-12-21 | 广东工业大学 | 结合多级局部密度聚类的油浸式变压器故障状态评估方法 |
CN109063734B (zh) * | 2018-06-29 | 2022-02-25 | 广东工业大学 | 结合多级局部密度聚类的油浸式变压器故障状态评估方法 |
CN109164248A (zh) * | 2018-09-18 | 2019-01-08 | 山东理工大学 | 一种变压器油中溶解气体浓度预测方法 |
CN109374324A (zh) * | 2018-09-29 | 2019-02-22 | 国网山西省电力公司阳泉供电公司 | 基于振动信号特征矩阵相似度的变压器机械故障诊断方法 |
CN109061426A (zh) * | 2018-11-02 | 2018-12-21 | 国网河北省电力有限公司电力科学研究院 | 变压器局部放电故障诊断方法及在线监测装置 |
CN109472308A (zh) * | 2018-11-08 | 2019-03-15 | 华南理工大学 | 一种基于人工智能的免标记仪器设备特征锚点检测方法 |
WO2020108159A1 (zh) * | 2018-11-26 | 2020-06-04 | 中兴通讯股份有限公司 | 一种网络故障根因检测方法、系统及存储介质 |
CN110196165A (zh) * | 2019-04-29 | 2019-09-03 | 杭州电子科技大学 | 一种基于K-means聚类和证据推理的旋转机械滚珠轴承故障诊断方法 |
CN110163531A (zh) * | 2019-06-02 | 2019-08-23 | 南京邮电大学盐城大数据研究院有限公司 | 基于k-聚类的电网变压器异常状态预警方法 |
CN110209658A (zh) * | 2019-06-04 | 2019-09-06 | 北京字节跳动网络技术有限公司 | 数据清洗方法和装置 |
CN110275868A (zh) * | 2019-06-21 | 2019-09-24 | 厦门嵘拓物联科技有限公司 | 一种智能工厂中多模态制造数据预处理的方法 |
CN110488147A (zh) * | 2019-07-16 | 2019-11-22 | 国网吉林省电力有限公司白城供电公司 | 基于gps时钟无线同步的投运电缆局部放电在线监测方法 |
CN110890146A (zh) * | 2019-11-04 | 2020-03-17 | 广东德澳智慧医疗科技有限公司 | 一种用于智慧病房的床旁智能交互系统 |
CN110890146B (zh) * | 2019-11-04 | 2020-07-14 | 广东德澳智慧医疗科技有限公司 | 一种用于智慧病房的床旁智能交互系统 |
CN111079750A (zh) * | 2019-12-13 | 2020-04-28 | 国网电力科学研究院武汉南瑞有限责任公司 | 一种基于局部区域聚类的电力设备故障区域提取方法 |
CN111079750B (zh) * | 2019-12-13 | 2022-05-24 | 国网电力科学研究院武汉南瑞有限责任公司 | 一种基于局部区域聚类的电力设备故障区域提取方法 |
CN111610026A (zh) * | 2020-06-28 | 2020-09-01 | 盐城工学院 | 一种基于深度聚类的旋转机械故障诊断方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106202922A (zh) | 一种基于聚类算法的变压器故障诊断系统 | |
CN110045209A (zh) | 用电数据异常的检测方法、装置、设备及可读存储介质 | |
CN106101252A (zh) | 基于大数据和可信计算的信息安全风险防护系统 | |
CN102289682B (zh) | 基于集成学习Bagging算法的变压器故障诊断方法 | |
CN107632590B (zh) | 一种基于优先级的底事件排序方法 | |
CN107145959A (zh) | 一种基于大数据平台的电力数据处理方法 | |
CN103268450B (zh) | 基于测试的移动智能终端系统安全评估体系模型与评估方法 | |
CN110532298B (zh) | 多属性铁路事故致因权重分析方法 | |
CN107478963A (zh) | 基于电网大数据的小电流接地系统单相接地故障选线方法 | |
CN102291392A (zh) | 一种基于Bagging算法的复合式入侵检测方法 | |
CN108833139A (zh) | 一种基于类别属性划分的ossec报警数据聚合方法 | |
CN107819790A (zh) | 攻击报文的识别方法及装置 | |
CN105488628A (zh) | 一种面向电力大数据可视化的数据挖掘方法 | |
CN109698823A (zh) | 一种网络威胁发现方法 | |
CN108523907A (zh) | 基于深度收缩稀疏自编码网络的疲劳状态识别方法及系统 | |
Avrachenkov et al. | Pagerank based clustering of hypertext document collections | |
CN117077153A (zh) | 基于大规模语言模型的静态应用安全检测误报判别方法 | |
CN105550578A (zh) | 一种基于特征选择和决策树的网络异常分类规则提取方法 | |
CN109711707A (zh) | 一种船舶动力装置综合状态评估方法 | |
CN116090819A (zh) | 一种基于关联规则的配电网风险态势预测方法 | |
CN103034869A (zh) | 一种邻域自适应的局部保持投影方法 | |
Worner et al. | Prioritizing the risk of plant pests by clustering methods; self-organising maps, k-means and hierarchical clustering | |
CN108446562A (zh) | 基于禁忌与人工蜂群双向优化支持向量机的入侵检测方法 | |
CN105955927B (zh) | 基于分解-并行遗传算法的约束优化方法 | |
CN104680257A (zh) | 面向抽油机工作过程的智能优化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C04 | Withdrawal of patent application after publication (patent law 2001) | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20161207 |