CN116400168A - 一种基于深度特征聚类的电网故障诊断方法及系统 - Google Patents
一种基于深度特征聚类的电网故障诊断方法及系统 Download PDFInfo
- Publication number
- CN116400168A CN116400168A CN202310336650.2A CN202310336650A CN116400168A CN 116400168 A CN116400168 A CN 116400168A CN 202310336650 A CN202310336650 A CN 202310336650A CN 116400168 A CN116400168 A CN 116400168A
- Authority
- CN
- China
- Prior art keywords
- sample
- fault diagnosis
- feature
- labeled
- cnn
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003745 diagnosis Methods 0.000 title claims abstract description 145
- 238000000034 method Methods 0.000 title claims abstract description 88
- 238000012549 training Methods 0.000 claims abstract description 75
- 238000012544 monitoring process Methods 0.000 claims abstract description 25
- 230000008569 process Effects 0.000 claims abstract description 24
- 238000010276 construction Methods 0.000 claims abstract description 4
- 238000013527 convolutional neural network Methods 0.000 claims description 93
- 238000005457 optimization Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 10
- 238000011176 pooling Methods 0.000 claims description 9
- 238000003860 storage Methods 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 4
- 230000003321 amplification Effects 0.000 claims description 3
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 3
- 230000006870 function Effects 0.000 description 19
- 238000010586 diagram Methods 0.000 description 9
- 238000005070 sampling Methods 0.000 description 7
- 238000012360 testing method Methods 0.000 description 7
- 238000004422 calculation algorithm Methods 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 239000013598 vector Substances 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 4
- 238000004088 simulation Methods 0.000 description 4
- 230000004913 activation Effects 0.000 description 2
- 230000000903 blocking effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 230000032683 aging Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01R—MEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
- G01R31/00—Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere
- G01R31/08—Locating faults in cables, transmission lines, or networks
- G01R31/081—Locating faults in cables, transmission lines, or networks according to type of conductors
- G01R31/086—Locating faults in cables, transmission lines, or networks according to type of conductors in power transmission or distribution networks, i.e. with interconnected conductors
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01R—MEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
- G01R31/00—Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere
- G01R31/08—Locating faults in cables, transmission lines, or networks
- G01R31/088—Aspects of digital computing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
- Y04S10/52—Outage or fault management, e.g. fault detection or location
Landscapes
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了电网故障诊断领域的一种基于深度特征聚类的电网故障诊断方法及系统,包括:将所述实时监测数据经过SMOTE过采样后输入至预先搭建的CNN故障诊断模型获得故障诊断结果;所述CNN故障诊断模型的搭建过程包括:利用训练后的特征提取器提取有标签样本特征和无标签样本特征;对有标签样本特征和无标签样本特征进行半监督聚类形成簇;根据簇确定无标签样本特征的标签,建立有标签样本特征训练集;利用有标签样本特征训练集对CNN故障诊断模型进行训练,重复迭代获得故障诊断准确率大于设定阈值的CNN故障诊断模型;本发明克服现有技术中存在故障诊断正确率和误报率不能兼顾的技术问题。
Description
技术领域
本发明属于故障诊断技术领域,具体涉及电网故障诊断方法及系统。
背景技术
随着工业化和城市化进程的迅速开展,电力系统也变得更加庞大与复杂,发电机也朝着高电压、大容量的方向发展;受设备老化和自然灾害等的影响,电力系统运行过程中难免会发生故障,而及时准确地诊断出故障元件,有助于恢复电力系统的正常运行。当电力设备发生故障时,调度中心会同时收到大量的信号,如何从大量信号中快速辨识出发生故障的设备,即所谓的“故障诊断”,对于保证和提升系统运行安全性具有重要意义。
迄今为止,电力系统故障诊断的主要方法包括专家系统(expert systems,ESs)、解析模型方法、人工神经网络(artificialneural networks,ANNs)、Petri网(petri nets,PNs)、贝叶斯网络(bayesian networks,BNs)、多代理系统法(multi-agent system,MAS)、遗传算法(genetic algorithms,GA)和基于优化算法等方法;
所述电网的故障诊断还存在如下难点:①标签故障数据样本少。电网故障诊断过程中所获取的信息通常都是不完备的,并且电网在社会中处于重要地位,因此也难以获得大量的故障数据。②故障数据样本不平衡。电网中不同类型的故障发生的频率并不一致。某些故障,如短路故障,在遭遇极端天气等情况下较容易发生,而某些故障则很难出现。这就造成了数据的不平衡,难以进行充分训练,导致现有技术中存在故障诊断正确率和误报率不能兼顾的技术问题。
发明内容
本发明提供了一种基于深度特征聚类的电网故障诊断方法及系统,以克服现有技术中存在故障诊断正确率和误报率不能兼顾的技术问题。
为达到上述目的,本发明所采用的技术方案是:
本发明第一方面提供了一种基于深度特征聚类的电网故障诊断方法,包括:
采集电网的实时监测数据,将所述实时监测数据经过SMOTE过采样后输入至预先搭建的CNN故障诊断模型获得故障诊断结果;
所述CNN故障诊断模型的搭建过程包括:
由电网监测数据库中获取有标签样本集和无标签样本集;根据电网故障类型搭建特征提取器,并通过有标签样本集对特征提取器进行训练;将有标签样本集和无标签样本集输入训练后的特征提取器,提取有标签样本特征和无标签样本特征;
对有标签样本特征和无标签样本特征进行半监督聚类形成簇;根据无标签样本特征和有标签样本特征所在的簇确定无标签样本特征的标签,将无标签样本特征转化为有标签样本特征,建立有标签样本特征训练集;
基于卷积神经网络构建CNN故障诊断模型,利用有标签样本特征训练集对CNN故障诊断模型进行训练,采用RMSprop优化方法调节CNN故障诊断模型的权值和偏置,重复迭代获得故障诊断准确率大于设定阈值的CNN故障诊断模型。
优选的,所述特征提取器依次包括一维卷积层、一维池化层、一维卷积层、一维池化层、Dropout层、扁平层、全连接层、Dropout层、全连接层、Dropout层和全连接层。
优选的,对有标签样本特征和无标签样本特征进行半监督聚类形成簇的方法包括:
基于故障类别对有标签样本特征进行分类,随机选择某一故障类别An中的有标签样本特征作为类中心;
随机选择下一个故障类别An+1;计算故障类别An+1中每个有标签样本特征与故障类别An的初始类中心的最短距离ρ;基于最短距离ρ计算故障类别An+1中每个有标签样本特征作为故障类别An+1中心的概率,并获得概率区间;生成[0,1]之间的随机数,若随机数落在概率区间内,则随机选择故障类别An+1中的有标签样本特征作为下一类中心;重复迭代直至获得全部K个类中心;
计算未标注为类中心的每个有标签样本特征以及每个无标签样本特征与类中心之间的距离ρP,根据距离ρP对未标注为类中心的每个有标签样本特征以及每个无标签样本特征进行划分形成簇。
优选的,计算未标注为类中心的每个有标签样本特征以及每个无标签样本特征与类中心之间的距离ρP,表达公式为:
公式中,X=[x1,x2,…,xm],Y=[y1,y2,…,ym];X,Y分别表示为样本特征,所述样本特征包含未标注为类中心的每个有标签样本特征以及每个无标签样本特征;x1,x2,…,xm表示为样本特征X的变量;y1,y2,…,ym表示为样本特征Y的变量。
优选的,根据距离ρP对未标注为类中心的每个有标签样本特征以及每个无标签样本特征进行划分形成簇的方法包括:
将未标注为类中心的每个有标签样本特征以及每个无标签样本特征分配至距离ρP最近的类中心,形成初始簇;
计算每个初始簇中所有样本特征的均值,作为每个初始簇的新类中心;
再次计算所有样本特征与K个新类中心的距离ρP,将样本特征分配至距离ρP最近的新类中心;以所有样本特征与新类中心的总体误差平方最小为优化目标,重复迭代输出最终划分的簇。
优选的,所有样本特征与新类中心的总体误差平方,计算公式为:
公式中,Ce为所有样本特征与新类中心的总体误差平方;Γi表示为第i个簇;Yi表示为第i个簇中的样本特征;Ni为第i个簇内包含有样本特征的个数。
优选的,利用有标签样本特征训练集对CNN故障诊断模型进行训练,采用RMSprop优化方法调节CNN故障诊断模型的权值和偏置的方法包括:
构建CNN故障诊断模型的交叉摘损失函数;利用有标签样本特征训练集对CNN故障诊断模型进行训练,根据微分的链式法则计算训练迭代过程中CNN故障诊断模型的参数梯度;
根据当前训练迭代过程中CNN故障诊断模型的参数梯度与上一次训练迭代过程中CNN故障诊断模型的参数梯度计算平方加权和ΔS,基于平方加权和ΔS对CNN故障诊断模型的参数进行更新,表达公式为:
公式中,β表示为可调权重值,L表示为CNN故障诊断模型的交叉摘损失值;θ表示为CNN故障诊断模型的参数,其包含CNN故障诊断模型的权值和偏置;表示为第d次训练迭代中CNN故障诊断模型的参数梯度;α表示为可调参数,ε为平滑项。
优选的,将所述实时监测数据进行SMOTE过采样的方法包括:
选择样本特征数量小于设定的数量阈值的簇,记为簇Γa,随机选择簇Γa中一个样本特征作为初始样本特征Xa;由簇Γa中寻找与初始样本特征邻近的k个样本特征,记为近邻样本;
基于初始样本特征Xa与近邻样本扩增簇Γa中的新样本特征XSMOTE,计算公式为:
公式中,XSMOTE=[xSMOTE,1,xSMOTE,2,…,xSMOTE,t,…,xSMOTE,m],xSMOTE,t表示为新样本特征XSMOTE的第t个属性值,γ表述为随机数;xa,t表示为初始样本特征Xa的第t个属性值,表示为第j个近邻样本的的第t个属性值;
重复此过程直至簇Γa中的样本特征数量达到设定的数量阈值。
第二方面提供了一种基于深度特征聚类的电网故障诊断系统,包括:
诊断模块,用于采集电网的实时监测数据,将所述实时监测数据经过SMOTE过采样后输入至预先搭建的CNN故障诊断模型获得故障诊断结果;
提取模块,用于由电网监测数据库中获取有标签样本集和无标签样本集;根据电网故障类型搭建特征提取器,并通过有标签样本集对特征提取器进行训练;将有标签样本集和无标签样本集输入训练后的特征提取器,提取有标签样本特征和无标签样本特征;
分类模块,用于对有标签样本特征和无标签样本特征进行半监督聚类形成簇;根据无标签样本特征和有标签样本特征所在的簇确定无标签样本特征的标签,将无标签样本特征转化为有标签样本特征,建立有标签样本特征训练集;
训练模块,用于基于卷积神经网络构建CNN故障诊断模型,利用有标签样本特征训练集对CNN故障诊断模型进行训练,采用RMSprop优化方法调节CNN故障诊断模型的权值和偏置,重复迭代获得故障诊断准确率大于设定阈值的CNN故障诊断模型。
本发明第三方面提供了计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现所述电网故障诊断方法的步骤。
与现有技术相比,本发明的有益效果:
本发明由电网监测数据库中获取有标签样本集和无标签样本集;根据电网故障类型搭建特征提取器,并通过有标签样本集对特征提取器进行训练;将有标签样本集和无标签样本集输入训练后的特征提取器,提取有标签样本特征和无标签样本特征;对有标签样本特征和无标签样本特征进行半监督聚类形成簇;根据无标签样本特征和有标签样本特征所在的簇确定无标签样本特征的标签,将无标签样本特征转化为有标签样本特征,建立有标签样本特征训练集;通过扩增有标签样本特征训练集,减少了样本获取的成本,以满足了CNN故障诊断模型对于有标签样本特征数量的需求。
本发明采集电网的实时监测数据,将所述实时监测数据经过SMOTE过采样后输入至预先搭建的CNN故障诊断模型获得故障诊断结果,避免了因为有标签样本特征训练集的不平衡,导致CNN故障诊断模型忽略数量较少样本特征,对不常出现的故障类型进行精确诊断,克服现有技术中存在故障诊断正确率和误报率不能兼顾的技术问题。
附图说明
图1是本发明实施例提供的特征提取器的结构图;
图2是本发明实施例提供的CNN故障诊断模型的结构图;
图3是本发明实施例提供的电网故障诊断方法的流程图;
图4是本发明实施例提供的模型迭代过程中损失函数值的折线图;
图5是本发明实施例提供的迭代次数和模型准确率的关系图。
具体实施方式
下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
实施例一
如图1至图3所示,一种基于深度特征聚类的电网故障诊断方法,包括:
采集电网的实时监测数据,将所述实时监测数据进行SMOTE过采样的方法包括:
选择样本特征数量小于设定的数量阈值的簇,记为簇Γa,随机选择簇Γa中一个样本特征作为初始样本特征Xa;由簇Γa中寻找与初始样本特征邻近的k个样本特征,记为近邻样本;
基于初始样本特征Xa与近邻样本扩增簇Γa中的新样本特征XSMOTE,计算公式为:
公式中,XSMOTE=[xSMOTE,1,xSMOTE,2,…,xSMOTE,t,…,xSMOTE,m],xSMOTE,t表示为新样本特征XSMOTE的第t个属性值,γ表述为随机数;xa,t表示为初始样本特征Xa的第t个属性值,表示为第j个近邻样本的的第t个属性值;
重复此过程直至簇Γa中的样本特征数量达到设定的数量阈值;将所述实时监测数据经过SMOTE过采样后输入至预先搭建的CNN故障诊断模型获得故障诊断结果。
所述CNN故障诊断模型的搭建过程包括:
由电网监测数据库中获取有标签样本集和无标签样本集;根据电网故障类型搭建特征提取器,并通过有标签样本集对特征提取器进行训练;其中不同电网故障类型对应构建不同特征提取器,将有标签样本集和无标签样本集输入训练后的特征提取器,提取有标签样本特征和无标签样本特征;
如图1所示,本实施例提供的一种特征提取器依次包括一维卷积层、一维池化层、一维卷积层、一维池化层、Dropout层、扁平层、全连接层、Dropout层、全连接层、Dropout层和全连接层;特征提取器一维卷积的表达公式为:
公式中,s(m)表示为输入特征提取器的原始信号,k(·)为l×l阶的一维卷积核;f(l)为特征提取器输出的特征序列;Q为原始信号的长度;q为采样的物理量的个数。
所述特征提取器在对有标签样本特征和无标签样本特征进行卷积之前先对信号两端补齐0值,使得卷积前后的样本特征与卷积之前的样本特征长度一致;再通过池化层对卷积后的信号进行降维;增加Dropout层使得在训练过程中,一个神经元有一定的概率会被舍弃,不进行修改,通过这个技巧让特征提取器在训练的过程中不易过拟合。
对有标签样本特征和无标签样本特征进行半监督聚类形成簇的方法包括:
基于故障类别对有标签样本特征进行分类,随机选择某一故障类别An中的有标签样本特征作为类中心;
随机选择下一个故障类别An+1;计算故障类别An+1中每个有标签样本特征与故障类别An的初始类中心的最短距离ρ;基于最短距离ρ计算故障类别An+1中每个有标签样本特征作为故障类别An+1中心的概率,并获得概率区间;生成[0,1]之间的随机数,若随机数落在概率区间内,则随机选择故障类别An+1中的有标签样本特征作为下一类中心;重复迭代直至获得全部K个类中心;
计算未标注为类中心的每个有标签样本特征以及每个无标签样本特征与类中心之间的距离ρP,表达公式为:
公式中,X=[x1,x2,…,xm],Y=[y1,y2,…,ym];X,Y分别表示为样本特征,所述样本特征包含未标注为类中心的每个有标签样本特征以及每个无标签样本特征;x1,x2,…,xm表示为样本特征X的变量;y1,y2,…,ym表示为样本特征Y的变量。
将未标注为类中心的每个有标签样本特征以及每个无标签样本特征分配至距离ρP最近的类中心,形成初始簇;
计算每个初始簇中所有样本特征的均值,作为每个初始簇的新类中心;
再次计算所有样本特征与K个新类中心的距离ρP,将样本特征分配至距离ρP最近的新类中心;以所有样本特征与新类中心的总体误差平方最小为优化目标,重复迭代输出最终划分的簇。
所有样本特征与新类中心的总体误差平方,计算公式为:
公式中,Ce为所有样本特征与新类中心的总体误差平方;Γi表示为第i个簇;Yi表示为第i个簇中的样本特征;Ni为第i个簇内包含有样本特征的个数。
电网的运行负荷以及发电机的负载大小会影响其运行数据的幅值,但是对于同一运行状态的发电机来说,其参数波形具有一定的相似性。因此对于不同样本之间的距离,不能简单地使用欧氏距离来表示,而是要判断样本之间波形的相似程度。基于相关系数计算样本特征之间距离ρP,将距离ρP接近的样本将被划分成一簇,从而提高了簇划分的准确性。
根据无标签样本特征和有标签样本特征所在的簇确定无标签样本特征的标签,将无标签样本特征转化为有标签样本特征,建立有标签样本特征训练集;通过扩增有标签样本特征训练集,减少了样本获取的成本,以满足了CNN故障诊断模型对于有标签样本特征数量的需求。
基于卷积神经网络构建CNN故障诊断模型;如图2所示,所述CNN故障诊断模型由输入层、卷积层、池化层(降采样层)、全连接层、输出层组成。
卷积层内部包含若干卷积核,卷积操作是卷积层的主要操作,其中决定卷积层输出特征图尺寸大小的参数有:卷积核大小、步长和填充。卷积核越大,可提取的特征越复杂。卷积核与局部输入信号卷积,将卷积后的结果输入到激活函数中,再对其进行非线性映射,得到输入信号的特征。CNN的输入信号是有标签样本特征训练集中有标签样本特征对应的特征向量组成的样本矩阵,由卷积核与样本矩阵进行卷积,经过激活函数得到一个特征面;本实施例中激活函数是Relu函数。
池化层,也被称为降采样层;卷积运算后的降采样层是对卷积层的输出特征进行筛选过滤,去除非重要的特征参数,在这一层进行下采样降维操作,主要作用为减小数据和参数的数量,减轻计算负载,有效控制过拟合,在本本实施例中池化层采用均值采样法。
全连接层与输出层相连,卷积与池化多次后的特征图输入全连接层后,会被展开成一维向量,输入全连接网络进行整合,用于后面的故障分类处理。在全连接层中,神经网络输入数据在经过了多层卷积与池化后被映射到隐层特征空间,形成的特征图还需要通过全连接层与设定的输出样本标签互相映射;本实施例中全连接层使用的是softmax函数进行分类。
利用有标签样本特征训练集对CNN故障诊断模型进行训练,采用RMSprop优化方法调节CNN故障诊断模型的权值和偏置的方法包括:
构建CNN故障诊断模型的交叉摘损失函数;利用有标签样本特征训练集对CNN故障诊断模型进行训练,根据微分的链式法则计算训练迭代过程中CNN故障诊断模型的参数梯度;
根据当前训练迭代过程中CNN故障诊断模型的参数梯度与上一次训练迭代过程中CNN故障诊断模型的参数梯度计算平方加权和ΔS,基于平方加权和ΔS对CNN故障诊断模型的参数进行更新,表达公式为:
公式中,β表示为可调权重值,β取值为0.9,L表示为CNN故障诊断模型的交叉摘损失值;θ表示为CNN故障诊断模型的参数,其包含CNN故障诊断模型的权值和偏置;表示为第d次训练迭代中CNN故障诊断模型的参数梯度;α表示为可调参数,α取值为0.001,ε为平滑项。
重复迭代获得故障诊断准确率大于设定阈值的CNN故障诊断模型;通过训练后的CNN故障诊断模型,能够克服现有技术中存在故障诊断正确率和误报率不能兼顾的技术问题。
下面本实施例中进行仿真验证说明:
在该仿真实例中,通过仿真证明了所提出的基于卷积神经网络的深度特征聚类的电网故障诊断方案的效率。由于电网原始故障数据为三维张量,第一维表示物理量采样的次数,第二维表示被采样的物理量个数,第三维表示样本的个数。因此本发明仿真的数据采用电磁功率,无功功率,加速功率和功角这四种物理量作为样本的特征参数。测试的故障包括三相永久性短路、单相永久性短路、单极闭锁、双极闭锁和直流连续两次换向失败。样本为故障发生时的发电机运行参数,样本分为有标签样本和无标签样本。每个物理量包含1000ms内的109次采样值。将样本组成三维张量进行聚类和训练。
不同故障类型的运行参数,经过特征提取器提取之后的特征之间存在不同,因此将其利用半监督聚类进行区分。特征提取器的个数为4个,与检测的物理量个数一致,每个提取器提取出的特征为长度是32的向量,将4个特征提取器中提取的特征向量合并为一个向量后,对特征进行半监督聚类。
表1半监督聚类样本数目对比表
为了测试深度特征半聚类的效果,从有标签样本中取出部分样本假定为需要被半监督聚类赋予标签的样本。通过对真实标签值与半监督聚类得到的标签值进行比较验证方法的有效性。在每一类故障中取出20个样本用于半监督聚类,聚类结果如表1所示;通过特征提取器提取的故障特征可以有效地被半监督聚类所利用,其中三永、单极闭锁和两次换向失败均达到了100%的准确率,为样本正确地打上标签,使无标签样本也能参与到故障诊断中,增加了样本的数量。
经过半监督聚类之后,利用样本特征训练电网故障诊断模型,得到总共包含396个故障样本,其中三永故障150个、单永故障120个;双极闭锁、单极闭锁和换向失败均为63个。
为了避免数据不平衡带来的问题,经过SMOTE算法过采样后,每个故障类型的样本个数均为150个,总共为750个样本。选取80%的样本为训练集,送入CNN训练识别,剩余20%的样本为测试集。CNN故障诊断模型的输入维度为四维,每个样本要输入109个采样点的数据。
不同参数下的损失函数值如图4所示,误差损失随着迭代次数的增加而收敛并趋于0。学习率升高的过程中,初始的损失值减小,但是收敛的过程逐渐缓慢。当学习率到达0.6的时候,损失函数已经无法随着训练的过程而减小了,在测试集上出现了明显的过拟合现象。虽然当学习率为0.01时初始的损失函数值是最大的,但是随着迭代次数增加,与其他学习率相比,损失函数值收敛到了最小的程度。
因此需要选择适合的参数保持损失函数的收敛又不会产生过拟合影响准确率,本实施例中CNN故障诊断模型选择的训练次数为4000次,学习率为0.01。损失函数为交叉熵损失函数,本实施例方法和仅使用CNN故障诊断模型的故障检测准确率,如表2所示。
未经过半监督聚类添加样本和过采样处理的数据,仅使用训练后得到的CNN故障诊断模型测试平均准确率为96.71%。经过SMOTE过采样后训练的CNN故障诊断模型测试平均准确率为98.14%。测试结果表明,本实施例提出的方法对于发电机运行故障的识别具有优异的性能,能够有效地利用无标签故障数据进行训练,增加样本数量并提高诊断的准确率。
表2故障诊断准确率对比表
CNN模型中卷积核选取对实验结果影响:
在相同参数情况下,通过对CNN故障诊断模型学习训练过程中卷积核的变化来测试其对模型准确率的影响,分别取4×4和3×3的卷积核。如表3所示,卷积核越大,准确率越低;卷积核越小准确率越高。
表3不同卷积核对应的故障诊断准确率表
因为卷积时据卷积核越小,对输入数据特征提取运算次数增加,相应的,特征更明显,输出特征与输入互相映射的准确率也会增加,因此模型的分类能力会更好。
迭代次数对实验结果影响:
为了避免在输入数据量不够多的情况下模型准确率受到影响,设置了迭代次数。分别取迭代次数为5、10、20、30、35,训练模型,计算训练准确率,如图5所示;当迭代次数在30之前时,准确率递增,越接近30,增率越小。当取到迭代次数30时,训练准确率几乎达到平衡,再往后几乎不变。这表明,故障诊断模型已经对训练集的故障特征有了充分的学习。为避免过拟合,迭代次数也不宜过高,所以选择30即可。
结合上述实验结果可知,CNN故障诊断模型中卷积核取值越小,输入数据特征被提取的越细,诊断准确率也越高。诊断准确率同时也被迭代次数影响,通常为了避免过拟合,迭代次数在适当取值范围内次数越多,准确率越高。
本实施例首先利用卷积神经网络搭建起特征提取器来提取时序数据的高层特征,然后对提取的特征进行半监督聚类,从而为无标签样本获得对应的标签,进而可以确定无标签样本所属的故障类别并加以利用;然后将不同类型的故障样本经过采样算法采样后,使用卷积神经网络搭建的分类器对故障类别进行分类识别;在历史样本不足的情况下对样本进行相应扩充,保证有足够多的样本可以用于训练学习;最后通过数据仿真,验证了本实施例可以准确地对无标签样本赋予正确的类别标签,对多种故障类型具有良好的故障诊断效果,对比常用的诊断方法,本实施例提供的电网故障诊断方法具备较强的数据特征提取与诊断能力,能快速准确地对电网故障进行相应诊断,具有更高的识别准确率。
实施例二
如图1所示,一种基于深度特征聚类的电网故障诊断系统,本实施例提供的系统可以应用于实施例一所述的方法,电网故障诊断系统包括:
诊断模块,用于采集电网的实时监测数据,将所述实时监测数据经过SMOTE过采样后输入至预先搭建的CNN故障诊断模型获得故障诊断结果;
提取模块,用于由电网监测数据库中获取有标签样本集和无标签样本集;根据电网故障类型搭建特征提取器,并通过有标签样本集对特征提取器进行训练;将有标签样本集和无标签样本集输入训练后的特征提取器,提取有标签样本特征和无标签样本特征;
分类模块,用于对有标签样本特征和无标签样本特征进行半监督聚类形成簇;根据无标签样本特征和有标签样本特征所在的簇确定无标签样本特征的标签,将无标签样本特征转化为有标签样本特征,建立有标签样本特征训练集;
训练模块,用于基于卷积神经网络构建CNN故障诊断模型,利用有标签样本特征训练集对CNN故障诊断模型进行训练,采用RMSprop优化方法调节CNN故障诊断模型的权值和偏置,重复迭代获得故障诊断准确率大于设定阈值的CNN故障诊断模型。
实施例三
计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现实施例一所述电网故障诊断方法的步骤。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。
Claims (10)
1.一种基于深度特征聚类的电网故障诊断方法,其特征在于,包括:
采集电网的实时监测数据,将所述实时监测数据经过SMOTE过采样后输入至预先搭建的CNN故障诊断模型获得故障诊断结果;
所述CNN故障诊断模型的搭建过程包括:
由电网监测数据库中获取有标签样本集和无标签样本集;根据电网故障类型搭建特征提取器,并通过有标签样本集对特征提取器进行训练;将有标签样本集和无标签样本集输入训练后的特征提取器,提取有标签样本特征和无标签样本特征;
对有标签样本特征和无标签样本特征进行半监督聚类形成簇;根据无标签样本特征和有标签样本特征所在的簇确定无标签样本特征的标签,将无标签样本特征转化为有标签样本特征,建立有标签样本特征训练集;
基于卷积神经网络构建CNN故障诊断模型,利用有标签样本特征训练集对CNN故障诊断模型进行训练,采用RMSprop优化方法调节CNN故障诊断模型的权值和偏置,重复迭代获得故障诊断准确率大于设定阈值的CNN故障诊断模型。
2.根据权利要求1所述的一种基于深度特征聚类的电网故障诊断方法,其特征在于,所述特征提取器依次包括一维卷积层、一维池化层、一维卷积层、一维池化层、Dropout层、扁平层、全连接层、Dropout层、全连接层、Dropout层和全连接层。
3.根据权利要求1所述的一种基于深度特征聚类的电网故障诊断方法,其特征在于,对有标签样本特征和无标签样本特征进行半监督聚类形成簇的方法包括:
基于故障类别对有标签样本特征进行分类,随机选择某一故障类别An中的有标签样本特征作为类中心;
随机选择下一个故障类别An+1;计算故障类别An+1中每个有标签样本特征与故障类别An的初始类中心的最短距离ρ;基于最短距离ρ计算故障类别An+1中每个有标签样本特征作为故障类别An+1中心的概率,并获得概率区间;生成[0,1]之间的随机数,若随机数落在概率区间内,则随机选择故障类别An+1中的有标签样本特征作为下一类中心;重复迭代直至获得全部K个类中心;
计算未标注为类中心的每个有标签样本特征以及每个无标签样本特征与类中心之间的距离ρP,根据距离ρP对未标注为类中心的每个有标签样本特征以及每个无标签样本特征进行划分形成簇。
5.根据权利要求4所述的一种基于深度特征聚类的电网故障诊断方法,其特征在于,根据距离ρP对未标注为类中心的每个有标签样本特征以及每个无标签样本特征进行划分形成簇的方法包括:
将未标注为类中心的每个有标签样本特征以及每个无标签样本特征分配至距离ρP最近的类中心,形成初始簇;
计算每个初始簇中所有样本特征的均值,作为每个初始簇的新类中心;
再次计算所有样本特征与K个新类中心的距离ρP,将样本特征分配至距离ρP最近的新类中心;以所有样本特征与新类中心的总体误差平方最小为优化目标,重复迭代输出最终划分的簇。
7.根据权利要求1所述的一种基于深度特征聚类的电网故障诊断方法,其特征在于,利用有标签样本特征训练集对CNN故障诊断模型进行训练,采用RMSprop优化方法调节CNN故障诊断模型的权值和偏置的方法包括:
构建CNN故障诊断模型的交叉摘损失函数;利用有标签样本特征训练集对CNN故障诊断模型进行训练,根据微分的链式法则计算训练迭代过程中CNN故障诊断模型的参数梯度;
根据当前训练迭代过程中CNN故障诊断模型的参数梯度与上一次训练迭代过程中CNN故障诊断模型的参数梯度计算平方加权和ΔS,基于平方加权和ΔS对CNN故障诊断模型的参数进行更新,表达公式为:
8.根据权利要求1所述的一种基于深度特征聚类的电网故障诊断方法,其特征在于,将所述实时监测数据进行SMOTE过采样的方法包括:
选择样本特征数量小于设定的数量阈值的簇,记为簇Γa,随机选择簇Γa中一个样本特征作为初始样本特征Xa;由簇Γa中寻找与初始样本特征邻近的k个样本特征,记为近邻样本;
基于初始样本特征Xa与近邻样本扩增簇Γa中的新样本特征XSMOTE,计算公式为:
公式中,XSMOTE=[xSMOTE,1,xSMOTE,2,…,xSMOTE,t,…,xSMOTE,m],xsMOTE,t表示为新样本特征XSMOTE的第t个属性值,γ表述为随机数;xa,t表示为初始样本特征Xa的第t个属性值,表示为第j个近邻样本的的第t个属性值;
重复此过程直至簇Γa中的样本特征数量达到设定的数量阈值。
9.根据权利要求1至权利要求8任一项所述的一种基于深度特征聚类的电网故障诊断方法的应用系统,其特征在于,包括:
诊断模块,用于采集电网的实时监测数据,将所述实时监测数据经过SMOTE过采样后输入至预先搭建的CNN故障诊断模型获得故障诊断结果;
提取模块,用于由电网监测数据库中获取有标签样本集和无标签样本集;根据电网故障类型搭建特征提取器,并通过有标签样本集对特征提取器进行训练;将有标签样本集和无标签样本集输入训练后的特征提取器,提取有标签样本特征和无标签样本特征;
分类模块,用于对有标签样本特征和无标签样本特征进行半监督聚类形成簇;根据无标签样本特征和有标签样本特征所在的簇确定无标签样本特征的标签,将无标签样本特征转化为有标签样本特征,建立有标签样本特征训练集;
训练模块,用于基于卷积神经网络构建CNN故障诊断模型,利用有标签样本特征训练集对CNN故障诊断模型进行训练,采用RMSprop优化方法调节CNN故障诊断模型的权值和偏置,重复迭代获得故障诊断准确率大于设定阈值的CNN故障诊断模型。
10.计算机可读存储介质,其特征在于其上存储有计算机程序,该程序被处理器执行时实现权利要求1至权利要求8任一项所述电网故障诊断方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310336650.2A CN116400168A (zh) | 2023-03-31 | 2023-03-31 | 一种基于深度特征聚类的电网故障诊断方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310336650.2A CN116400168A (zh) | 2023-03-31 | 2023-03-31 | 一种基于深度特征聚类的电网故障诊断方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116400168A true CN116400168A (zh) | 2023-07-07 |
Family
ID=87008518
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310336650.2A Pending CN116400168A (zh) | 2023-03-31 | 2023-03-31 | 一种基于深度特征聚类的电网故障诊断方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116400168A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117290742A (zh) * | 2023-11-27 | 2023-12-26 | 北京航空航天大学 | 一种基于动态聚类的信号时序数据故障诊断方法及系统 |
-
2023
- 2023-03-31 CN CN202310336650.2A patent/CN116400168A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117290742A (zh) * | 2023-11-27 | 2023-12-26 | 北京航空航天大学 | 一种基于动态聚类的信号时序数据故障诊断方法及系统 |
CN117290742B (zh) * | 2023-11-27 | 2024-03-29 | 北京航空航天大学 | 一种基于动态聚类的信号时序数据故障诊断方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109308522B (zh) | 一种基于循环神经网络的gis故障预测方法 | |
Yin et al. | Wasserstein generative adversarial network and convolutional neural network (WG-CNN) for bearing fault diagnosis | |
CN109116834B (zh) | 一种基于深度学习的间歇过程故障检测方法 | |
CN110929847A (zh) | 一种基于深度卷积神经网络的换流变压器故障诊断方法 | |
CN112686775A (zh) | 基于孤立森林算法的电力网络攻击检测方法及系统 | |
CN112381248A (zh) | 一种基于深度特征聚类和lstm的配电网故障诊断方法 | |
CN115021679B (zh) | 一种基于多维离群点检测的光伏设备故障检测方法 | |
CN112215279B (zh) | 一种基于免疫rbf神经网络的电网故障诊断方法 | |
CN111126820A (zh) | 反窃电方法及系统 | |
CN116167010B (zh) | 具有智能迁移学习能力的电力系统异常事件快速识别方法 | |
CN111881159B (zh) | 一种基于代价敏感极端随机森林的故障检测方法及装置 | |
CN114609994A (zh) | 基于多粒度正则化重平衡增量学习的故障诊断方法及装置 | |
CN112504682A (zh) | 基于粒子群优化算法的底盘发动机故障诊断方法及系统 | |
CN115018512A (zh) | 基于Transformer神经网络的窃电检测方法及装置 | |
CN116400168A (zh) | 一种基于深度特征聚类的电网故障诊断方法及系统 | |
CN112633315A (zh) | 一种电力系统扰动分类方法 | |
CN113177357B (zh) | 一种电力系统暂态稳定评估方法 | |
Sharma et al. | A semi-supervised generalized vae framework for abnormality detection using one-class classification | |
CN113987910A (zh) | 一种耦合神经网络与动态时间规划的居民负荷辨识方法及装置 | |
CN113255661A (zh) | 一种输电线路涉鸟故障相关鸟种图像识别方法 | |
CN112817954A (zh) | 一种基于多种方法集成学习的缺失值插补方法 | |
CN115035966B (zh) | 基于主动学习和符号回归的超导体筛选方法、装置及设备 | |
CN114881162A (zh) | 计量自动化主站的故障预测方法、装置、设备及介质 | |
CN113935413A (zh) | 一种基于卷积神经网的配网录波文件波形识别方法 | |
CN109782156B (zh) | 基于人工免疫诊断网络的模拟电路故障诊断方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |