CN117992873A - 基于异构联邦学习的变压器故障分类方法及模型训练方法 - Google Patents
基于异构联邦学习的变压器故障分类方法及模型训练方法 Download PDFInfo
- Publication number
- CN117992873A CN117992873A CN202410318809.2A CN202410318809A CN117992873A CN 117992873 A CN117992873 A CN 117992873A CN 202410318809 A CN202410318809 A CN 202410318809A CN 117992873 A CN117992873 A CN 117992873A
- Authority
- CN
- China
- Prior art keywords
- training
- model
- client
- transformer
- fault
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012549 training Methods 0.000 title claims abstract description 109
- 238000000034 method Methods 0.000 title claims abstract description 56
- 238000013145 classification model Methods 0.000 claims abstract description 70
- 230000002776 aggregation Effects 0.000 claims abstract description 25
- 238000004220 aggregation Methods 0.000 claims abstract description 25
- 230000008569 process Effects 0.000 claims abstract description 13
- 238000000605 extraction Methods 0.000 claims abstract description 9
- 230000006870 function Effects 0.000 claims description 22
- 238000003745 diagnosis Methods 0.000 claims description 9
- 230000011218 segmentation Effects 0.000 claims description 7
- 230000010355 oscillation Effects 0.000 claims description 6
- 230000004931 aggregating effect Effects 0.000 claims description 4
- 239000006185 dispersion Substances 0.000 claims description 3
- 238000013473 artificial intelligence Methods 0.000 abstract description 4
- 238000004891 communication Methods 0.000 description 6
- 238000012795 verification Methods 0.000 description 6
- 238000004804 winding Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000009795 derivation Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical group [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01R—MEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
- G01R31/00—Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/0985—Hyperparameter optimisation; Meta-learning; Learning-to-learn
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Probability & Statistics with Applications (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及人工智能和电力变压器故障分类技术领域,尤其是一种基于异构联邦学习的变压器故障分类方法及模型训练方法。本发明中,在变压器故障分类模型的参数聚合过程中,对特征提取和分类器分开聚合,聚合后再在本地先训练特征提取器,再训练分类器。本发明在客户端训练过程中,分别固定特征提取器和分类器,降低了模型训练的偏差;使用全局特征提取参数指导各客户端的特征提取器训练,解决了异构模型特征空间不同的问题;使用分类器聚合操作,提高了模型的泛化性。
Description
技术领域
本发明涉及人工智能和电力变压器故障分类技术领域,尤其是一种基于异构联邦学习的变压器故障分类方法及模型训练方法。
背景技术
在现代电力系统中,变压器被广泛用于电能转换与能量传输,其可靠运行对电力系统的安全运行有着极为重要的意义。但是变压器的故障可能会对电网运行造成严重影响,甚至导致大规模停电等问题。为了提高变压器故障分类的准确性,采用人工智能技术是一种有效的方法。然而,训练人工智能模型需要大量的有标注样本,在现实场景中,由于人工标注具有高成本、耗时、需要先验知识的问题,有标注的变压器故障数据的数量有限。现有方法大都需要将来自不同变电站的数据样本收集到一个数据中心,集中训练模型。由于变压器故障数据包含高度敏感的变电站设备隐私信息,出于隐私保护的考虑,变电站往往不愿意将数据与他人共享。
联邦学习是一种分布式机器学习方法,允许在不共享数据的情况下对模型进行训练。传统的联邦学习要求客户端采用统一的模型,但是不同变电站的数据可能有故障类别不平衡、故障数据规模不同以及运行速度要求不同的问题,需要针对不同变电站的实际情况选择适合的深度学习算法。可见,在隐私保护的前提下,电力变压器故障分类存在异构性的问题,成为上述方法实际应用的阻碍。
发明内容
为了克服上述现有技术中现代电力系统中变压器故障分类模型训练困难的缺陷,本发明提出了一种基于异构联邦学习的变压器故障分类模型训练方法,考虑到各变电站变压器故障数据的隐私性以及故障数据分布和适用模型的异构性,对传统的联邦学习方法进行改进,提出模型分步训练方法,设计特征提取器聚合、分类器聚合机制,提高了模型故障分类的准确率和稳定性
本发明提出的一种基于异构联邦学习的变压器故障分类模型训练方法,包括以下步骤:
S1、令用于本地训练和部署变电站的变压器故障分类模型的计算机为客户端,令对各个客户端上的变压器故障分类模型进行聚合的计算器为服务端;获取各个客户端的故障数据集,故障数据集用于存储客户端对应的变电站的变压器故障数据Di;对各故障数据集中的各故障数据Di进行切分,以构建各个变电站的学习样本{xi,yi};xi为故障数据Di的切分数据;yi为切分数据xi的故障类别,yi的形式为独热向量;1≤i≤N,N为客户端的数量;
S2、各个客户端的变压器故障分类模型进行本地训练;
S3、服务端对各客户端的特征提取器参数进行聚合,以获取全局特征提取参数θ;服务器对各客户端的分类器参数进行加权聚合,以获取对应各客户端的聚合分类参数ω'i;
θ=∑N i=1[θi×Di num/∑N i=1Di num]
ω'i=∑N j=1(αij×ωj)
αij=[logθi-logθj]/[logθi N-logΠN k=1θk]
其中,Di num表示第i个客户端的故障数据集的数据量;ωj表示第j个客户端的分类器参数,αij为聚合系数,ω'i表示第i个客户端的聚合分类参数;θi表示第i个客户端的特征提取器的参数,θj表示第j个客户端的特征提取器的参数,θk表示第k个客户端的特征提取器的参数;Π表示连乘;
S4、各客户端采用服务端下发的对应的聚合分类参数ω'i更新变压器故障分类模型的分类器;
S5、客户端将分类器参数更新为对应的聚合分类参数ω'i后的变压器故障分类模型记作本地模型,客户端的本地模型的特征提取器参数更新为全局特征提取参数θ后记作参照模型;
S6、通过对比本地模型的预测结果和参照模型的预测结果的差异在,本地的学习样本构成的训练集上训练本地模型的特征提取器;特征提取器收敛后,再在本地的学习样本构成的训练集上训练本地模型的分类器,获取分类器收敛后的本地模型作为训练完成的变压器故障分类模型;
S7、循环步骤S1-S6,直至参数聚合次数达到设定的聚合次数阈值。
优选的,S6中,第i个客户端的特征提取器的训练过程包括以下分步骤:
S61、从第i个客户端的学习样本中抽取Q2个训练样本,将训练样本分别代入本地模型和参照模型,令本地模型对第q2个训练样本的预测结果向量记作ps,i,q2,令参照模型对第q2个训练样本的预测结果向量记作pt,i,q2;1≤q2≤Q2;
S62、计算本地模型的损失函数Lf(θi,θ,ωi);
Lf(θi,θ,ωi)=∑Q2 q2=1[-ps,i,q2×logpt,i,q2(yi,q2/pt,i,q2)λ+DKL(θi||θ)]
其中,yi,q2为第q2个训练样本的真实类别向量;λ为人工设置的超参数,可在区间(0,1]上取值;DKL(θi||θ)表示θi和θ的离散度;
S63、判断损失函数是否收敛;否,则结合损失函数Lf(θi,θ,ωi)更新本地模型的特征提取器参数,然后返回步骤S61;是,则固定本地模型的特征提取器参数,然后训练本地模型的分类器。
优选的,S63中,令结合损失函数Lf(θi,θ,ωi)更新后的本地模型的特征提取器参数更新为θ'i,
θ'i=θi-ηf▽(θi,Lf(θi,θ,ωi))
其中,ηf为人工设置的超参数,▽(θi,Lf(θi,θ,ωi))表示Lf(θi,θ,ωi)对θi的求导。
优选的:
DKL(θi||θ)=∑G g=1[θi,g×log(θi,g/θg)]
其中,θi,g为θi的第g维数值,θg为θ的第g维数值,G为θi的数据维度总数。
优选的,S6中,第i个客户端的分类器的训练方式为:从第i个客户端的学习样本中选择训练样本,根据本地模型在训练样本上的第一损失函数更新分类器,直至本地模型收敛;
第一损失函数为:LCE(ωi,θi)=-∑Q3 q'=1∑C h=1(yi,q',h×logy'i,q',h)
其中,C为故障类别总数,Q3为分类器训练过程中每个批次迭代的训练样本数量,yi,q',h为第q'个训练样本的真实标签yi在第h个类别下的取值,y'i,q',h为本地模型预测第q'个训练样本为第h个类别的概率值。
优选的,S6中,令第i个客户端的本地模型中,迭代前的分类器参数记作ωi,令第i个客户端的本地模型中,迭代后的分类器参数记作ω''i;
则,ω''i=ωi-ηc▽(ωi,LCE(ωi,θi))
其中,ηc为人工设置的超参数;▽(ωi,LCE(ωi,θi))表示LCE(ωi,θi)对ωi的求导;S6中,本地模型的分类器迭代过程中,ωi的初始化值为ω'i。
优选的,各客户端的学习样本的构建方式为:获取客户端对应的变电站的变压器故障数据Di;设定长度为s的窗口,以步长k对故障数据Di进行切分,以获取多个切分数据构建学习样本;0.25s≤k≤0.75s。
本发明提出的一种变压器故障分类方法,包括以下步骤:
SA1、首先采用所述的基于异构联邦学习的变压器故障分类模型训练方法,对各客户端的变压器故障分类模型进行联邦训练;
SA2、然后采集变压器的振荡数据,对振荡数据进行切片以形成切片样本,切片样本与学习样本中的数据xi等长,将切片样本输入本地的故障分类模型;
SA3、故障分类模型输出各切片样本对应的故障类别概率分布,故障类别概率分布中最大值对应的故障类别作为切片样本的故障诊断结果;
SA4、统计振荡数据切分后的所有切片样本中各故障诊断结果的出现频次,取频次最高的故障诊断结果作为当前诊断结果。
本发明的优点在于:
(1)本发明使用联邦学习框架完成变电站的变压器故障分类模型的训练,在保护变电站数据隐私的前提下,使模型达到较高的准确率。本发明将深度学习网络模型拆分为特征提取器和分类器,分别进行训练,解决了模型异构的问题。
(2)本发明在客户端训练过程中,分别固定特征提取器和分类器模块,降低了模型训练的偏差;使用全局特征提取参数指导各客户端的特征提取器训练,解决了异构模型特征空间不同的问题;使用分类器聚合操作,提高了模型的泛化性。
附图说明
图1为基于异构联邦学习的变压器故障分类模型训练方法流程图;
图2为客户端和服务端的通信示意图;
图3为客户端在全局聚合后进行本地更新的流程图;
图4为本发明方法训练的变压器故障分类模型精确度统计;
图5为传统联邦学习方法训练的变压器故障分类模型精确度统计。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本实施方式中,令用于本地训练和部署变电站的变压器故障分类模型的计算机为客户端,令对各个客户端上的变压器故障分类模型进行聚合的计算器为服务端;客户端的数量为N;服务端数量为1个;令第i个变电站的变压器故障数据记作Di;1≤i≤N。
变压器故障分类模型划分为特征提取器和分类器,特征提取器用于提取数据样本的数据特征,分类器基于数据特征判断变压器的故障类别;第i个变电站对应的变压器故障分类模型的特征提取器参数记作θi,第i个变电站对应的变压器故障分类模型的分类器参数记作ωi;
变压器的故障类别具体可设置为:接地短路、匝间短路、铁芯松动、绕组变形、直流偏磁、绕组松动,一共6类。
参照图1、图2,本实施方式提供的基于异构联邦学习的变压器故障分类模型训练方法,包括以下步骤:
S1、获取各个客户端的故障数据集,故障数据集用于存储客户端对应的变电站的变压器故障数据Di;对各故障数据集中的各故障数据Di进行切分,以构建各个变电站的学习样本{xi,yi};xi为故障数据Di的切分数据,其长度为设定的切片窗口长度;yi为切分数据xi的故障类别,即变电站在生成切分数据xi时的故障类别,以独热向量表示;
具体实施时,可设定长度为s的窗口,以步长k对故障数据Di进行切分,以获取多个切分数据构建学习样本;相邻切分数据的重叠率r=(s-k)/s;
S2、各个客户端的变压器故障分类模型进行本地训练;
第i个客户端的变压器故障分类模型的本地训练包括以下分步骤:
S21、抽取第i个客户端的多个学习样本作为训练样本,令变压器故障分类模型对训练样本进行学习;
S22、抽取第i个客户端的Q1个学习样本作为验证样本,令变压器故障分类模型预测验证样本的故障类别概率分布,结合验证样本的故障类别预测值和真实值计算模型损失;
模型损失的计算公式为:
LCE=-∑Q1 q=1∑C h=1(yi,q,h×logy'i,q,h)
其中,C为故障类别总数;yi,q,h为第q个验证样本的真实标签yi在第h个类别下的取值,如果第q个验证样本属于第h个类别,则yi,q,h=1,反之yi,q,h=0;y'i,q,h为变压器故障分类模型预测的第q个验证样本的故障类别概率分布中第h个类别对应的概率值。
S23、判断模型损失是否收敛;否,则返回步骤S21;是,则完成本地训练。
S3、服务端对各客户端的特征提取器参数θi进行聚合,以获取全局特征提取参数θ;服务器对各客户端的分类器参数ωi进行加权聚合,以获取对应各客户端的聚合分类参数ω'i;
θ=∑N i=1[θi×Di num/∑N i=1Di num]
其中,Di num表示第i个客户端的故障数据集的数据量。
ω'i=∑N j=1(αij×ωj)
αij=[logθi-logθj]/[logθi N-logΠN k=1θk]
其中,αij为聚合系数,ω'i表示第i个客户端的聚合分类参数;θj表示第j个客户端的特征提取器的参数,θk表示第k个客户端的特征提取器的参数;Π表示连乘;
S4、第i个客户端采用服务端下发的聚合分类参数ω'i更新变压器故障分类模型的分类器;
S5、令第i个客户端将分类器参数更新为聚合分类参数ω'i后的变压器故障分类模型记作本地模型,将第i个客户端的本地模型的特征提取器参数更新为全局特征提取参数θ后记作第i个客户端的参照模型;
S6、训练各个客户端的特征提取器和分类器;
参照图3,第i个客户端的特征提取器的训练过程包括以下分步骤:
S61、从第i个客户端的学习样本中抽取Q2个训练样本,将训练样本分别代入本地模型和参照模型,令本地模型对第q2个训练样本的预测结果向量记作ps,i,q2,令参照模型对训练样本的预测结果向量记作pt,i,q2;1≤q2≤Q2;
S62、计算本地模型的损失函数Lf(θi,θ,ωi);
Lf(θi,θ,ωi)=∑Q2 q2=1[-ps,i,q2×logpt,i,q2(yi,q2/pt,i,q2)λ+DKL(θi||θ)]
其中,yi,q2为第q2个训练样本的真实类别向量;λ为人工设置的超参数,可在区间(0,1]上取值;DKL(θi||θ)表示θi和θ的离散度;
DKL(θi||θ)=∑G g=1[θi,g×log(θi,g/θg)]
其中,θi,g为θi的第g维数值,θg为θ的第g维数值,G为θi的数据维度总数;
值得注意的是,为了提高训练效率,S61中对学习样本采用不放回抽样方式,随机抽取训练样本。
S63、判断损失函数是否收敛;否,则将本地模型的特征提取器参数更新为θ'i,然后返回步骤S61;是,则固定本地模型的特征提取器参数,然后训练本地模型的分类器;
θ'i=θi-ηf▽(θi,Lf(θi,θ,ωi))
其中,ηf为人工设置的超参数,可在区间(0,0.1]上取值;▽(θi,Lf(θi,θ,ωi))表示Lf(θi,θ,ωi)对θi的求导。
本实施方式中,判断损失函数收敛的条件为:连续M1次的损失函数变化幅度小于设定的损失浮差值。
本地模型的分类器的训练方式为:从第i个客户端的学习样本中选择训练样本,根据本地模型在训练样本上的第一损失函数更新分类器,直至本地模型收敛;
具体的,第一损失函数,可以是任意损失,比如均方差损失、交叉熵损失等。
本实施例中,定义第一损失函数的计算公式为:
LCE(ωi,θi)=-∑Q3 q'=1∑C h=1(yi,q',h×logy'i,q',h)
其中,C为故障类别总数,Q3为分类器训练过程中每个批次迭代的训练样本数量;yi,q',h为第q'个训练样本的真实标签yi在第h个类别下的取值,如果第q'个训练样本属于第h个类别,则yi,q',h=1,反之yi,q',h=0;y'i,q',h为本地模型预测第q'个训练样本为第h个类别的概率值。
第i个客户端的分类器的训练过程包括以下分步骤:
S64、从第i个客户端的学习样本中抽取Q3个训练样本,令本地模型对训练样本进行预测,输出预测的故障类别概率分布;
S65、计算第一损失函数,判断第一损失函数是否收敛;是,则固定本地模型,执行步骤S7;否,则根据第一损失函数将本地模型的分类器参数更新为ω''i,然后返回步骤S64;
ω''i=ωi-ηc▽(ωi,LCE(ωi,θi))
其中,ηc为人工设置的超参数,可在区间(0,0.1]上取值;▽(ωi,LCE(ωi,θi))表示LCE(ωi,θi)对ωi的求导;ωi为本地模型迭代前的分类器参数,本地模型的分类器迭代过程中,ωi的初始化值为ω'i。
S7、判断客户端的参数聚合次数是否达到设定的聚合次数阈值;否,则客户端的变压器故障分类模型更新为本地模型,然后返回步骤S3;是,则完成训练。
实施例
本实施例中,选取多个不同地区的变电站故障状态下采集到的变压器振动数据作为研究对象,训练变压器故障分类模型,以对本发明提出的基于异构联邦学习的变压器故障分类方法进行验证。
本实施例中,采用上述变压器故障分类模型对上述故障数据进行分类。
令用于本地训练和部署变电站的变压器故障分类模型的计算机为客户端,令对各个客户端上的变压器故障分类模型进行聚合的计算器为服务端。
本实施例中,变压器的故障类别设置为6类,包括:接地短路、匝间短路、铁芯松动、绕组变形、直流偏磁、绕组松动,故障标注以独热向量表示,例如向量100000表示接地短路,010000表示匝间短路,以此类推。
本实施例中,以变电站采集到的变压器振动数据作为客户端的故障数据集,构建各客户端的学习样本{xi,yi},为xi变压器振动数据切片;本实施例中,构建学习样本时,设置s=512,r=0.5;即针对变电站采集到的变压器振动数据采用宽度为s的窗口以步长256进行切片获取数据xi,以构建学习样本。
本实施例中,将学习样本按照7:3的比例分为训练集和测试集。
在训练集上分别采用本发明提供的基于异构联邦学习的变压器故障分类模型训练方法和传统的联邦学习方法FedAvg对客户端上的变压器故障分类模型进行训练;在测试集上对变压器故障分类模型的精确度进行测试。
本实施例中,采用本发明提供的基于异构联邦学习的变压器故障分类模型训练方法训练变压器故障分类模型时,超参数设置为:λ=0.9,ηf=ηc=0.01。
本实施例中,模型训练的终止条件设置为:客户端与服务器总计通信200次,即参数聚合200次。
本实施例中,为了验证本方法在解决异构电力变压器分类模型训练问题方面的有效性,按照提供的数据量,设置不同客户端的变压器故障分类模型的结构;具体的,提供数据量最少的变电站电力变压器故障分类模型选用MLP模型,提供数据量最多的变电站电力变压器故障分类模型选用Transformer模型,其他变电站电力变压器故障分类模型选用12层一维卷积神经网络模型。
本实施例中,在本发明提供的基于异构联邦学习的变压器故障分类模型训练方法下,各变压器故障分类模型的诊断结果的正确率随全局通信轮次的变化曲线图如图4所示;在传统联邦学习方法FedAvg的训练方法下,各变压器故障分类模型的分类结果的正确率随全局通信轮次的变化曲线如图5所示。结合图4、图5可知,本发明提供的基于异构联邦学习的变压器故障分类模型训练方法下,全局通信次数达到50次时,变压器故障分类模型的准确率达到70%以上,且随着全局通信次数的增加,模型的准确性波动较小,模型收敛时的精确度可达到77%左右;传统联邦学习方法FedAvg的训练方法下,变压器故障分类模型的准确率始终未达到70%,且随着全局通信次数的增加,模型的准确性波动较为剧烈。可见,相较于FedAvg方法在分类准确率和稳定性方面都有较大的提升。
当然,对于本领域技术人员而言,本发明不限于上述示范性实施例的细节,而还包括在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现的相同或类似结构。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。
本发明未详细描述的技术、形状、构造部分均为公知技术。
Claims (8)
1.一种基于异构联邦学习的变压器故障分类模型训练方法,其特征在于,包括以下步骤:
S1、令用于本地训练和部署变电站的变压器故障分类模型的计算机为客户端,令对各个客户端上的变压器故障分类模型进行聚合的计算器为服务端;获取各个客户端的故障数据集,故障数据集用于存储客户端对应的变电站的变压器故障数据Di;对各故障数据集中的各故障数据Di进行切分,以构建各个变电站的学习样本{xi,yi};xi为故障数据Di的切分数据;yi为切分数据xi的故障类别,yi的形式为独热向量;1≤i≤N,N为客户端的数量;
S2、各个客户端的变压器故障分类模型进行本地训练;
S3、服务端对各客户端的特征提取器参数进行聚合,以获取全局特征提取参数θ;服务器对各客户端的分类器参数进行加权聚合,以获取对应各客户端的聚合分类参数ω'i;
θ=∑N i=1[θi×Di num/∑N i=1Di num]
ω'i=∑N j=1(αij×ωj)
αij=[logθi-logθj]/[logθi N-logΠN k=1θk]
其中,Di num表示第i个客户端的故障数据集的数据量;ωj表示第j个客户端的分类器参数,αij为聚合系数,ω'i表示第i个客户端的聚合分类参数;θi表示第i个客户端的特征提取器的参数,θj表示第j个客户端的特征提取器的参数,θk表示第k个客户端的特征提取器的参数;Π表示连乘;
S4、各客户端采用服务端下发的对应的聚合分类参数ω'i更新变压器故障分类模型的分类器;
S5、客户端将分类器参数更新为对应的聚合分类参数ω'i后的变压器故障分类模型记作本地模型,客户端的本地模型的特征提取器参数更新为全局特征提取参数θ后记作参照模型;
S6、通过对比本地模型的预测结果和参照模型的预测结果的差异,在本地的学习样本构成的训练集上训练本地模型的特征提取器;特征提取器收敛后,再在本地的学习样本构成的训练集上训练本地模型的分类器,获取分类器收敛后的本地模型作为训练完成的变压器故障分类模型;
S7、循环步骤S1-S6,直至参数聚合次数达到设定的聚合次数阈值。
2.如权利要求1所述的基于异构联邦学习的变压器故障分类模型训练方法,其特征在于,S6中,第i个客户端的特征提取器的训练过程包括以下分步骤:
S61、从第i个客户端的学习样本中抽取Q2个训练样本,将训练样本分别代入本地模型和参照模型,令本地模型对第q2个训练样本的预测结果向量记作ps,i,q2,令参照模型对第q2个训练样本的预测结果向量记作pt,i,q2;1≤q2≤Q2;
S62、计算本地模型的损失函数Lf(θi,θ,ωi);
Lf(θi,θ,ωi)=∑Q2 q2=1[-ps,i,q2×logpt,i,q2(yi,q2/pt,i,q2)λ+DKL(θi||θ)]
其中,yi,q2为第q2个训练样本的真实类别向量;λ为人工设置的超参数,可在区间(0,1]上取值;DKL(θi||θ)表示θi和θ的离散度;
S63、判断损失函数是否收敛;否,则结合损失函数Lf(θi,θ,ωi)更新本地模型的特征提取器参数,然后返回步骤S61;是,则固定本地模型的特征提取器参数,然后训练本地模型的分类器。
3.如权利要求2所述的基于异构联邦学习的变压器故障分类模型训练方法,其特征在于,S63中,令结合损失函数Lf(θi,θ,ωi)更新后的本地模型的特征提取器参数更新为θ'i,
θ'i=θi-ηf▽(θi,Lf(θi,θ,ωi))
其中,ηf为人工设置的超参数,▽(θi,Lf(θi,θ,ωi))表示Lf(θi,θ,ωi)对θi的求导。
4.如权利要求2所述的基于异构联邦学习的变压器故障分类模型训练方法,其特征在于:
DKL(θi||θ)=∑G g=1[θi,g×log(θi,g/θg)]
其中,θi,g为θi的第g维数值,θg为θ的第g维数值,G为θi的数据维度总数。
5.如权利要求1所述的基于异构联邦学习的变压器故障分类模型训练方法,其特征在于,S6中,第i个客户端的分类器的训练方式为:从第i个客户端的学习样本中选择训练样本,根据本地模型在训练样本上的第一损失函数更新分类器,直至本地模型收敛;
第一损失函数为:LCE(ωi,θi)=-∑Q3 q'=1∑C h=1(yi,q',h×logy'i,q',h)
其中,C为故障类别总数,Q3为分类器训练过程中每个批次迭代的训练样本数量,yi,q',h为第q'个训练样本的真实标签yi在第h个类别下的取值,y'i,q',h为本地模型预测第q'个训练样本为第h个类别的概率值。
6.如权利要求5所述的基于异构联邦学习的变压器故障分类模型训练方法,其特征在于,S6中,令第i个客户端的本地模型中,迭代前的分类器参数记作ωi,令第i个客户端的本地模型中,迭代后的分类器参数记作ω''i;
则,ω''i=ωi-ηc▽(ωi,LCE(ωi,θi))
其中,ηc为人工设置的超参数;▽(ωi,LCE(ωi,θi))表示LCE(ωi,θi)对ωi的求导;S6中,本地模型的分类器迭代过程中,ωi的初始化值为ω'i。
7.如权利要求1所述的基于异构联邦学习的变压器故障分类模型训练方法,其特征在于,各客户端的学习样本的构建方式为:获取客户端对应的变电站的变压器故障数据Di;设定长度为s的窗口,以步长k对故障数据Di进行切分,以获取多个切分数据构建学习样本;0.25s≤k≤0.75s。
8.一种采用如权利要求1-7任一项所述的基于异构联邦学习的变压器故障分类模型训练方法的变压器故障分类方法,其特征在于,包括以下步骤:
SA1、首先采用如权利要求1-7任一项所述的基于异构联邦学习的变压器故障分类模型训练方法,对各客户端的变压器故障分类模型进行联邦训练;
SA2、然后采集变压器的振荡数据,对振荡数据进行切片以形成切片样本,切片样本与学习样本中的数据xi等长,将切片样本输入本地的故障分类模型;
SA3、故障分类模型输出各切片样本对应的故障类别概率分布,故障类别概率分布中最大值对应的故障类别作为切片样本的故障诊断结果;
SA4、统计振荡数据切分后的所有切片样本中各故障诊断结果的出现频次,取频次最高的故障诊断结果作为当前诊断结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410318809.2A CN117992873B (zh) | 2024-03-20 | 2024-03-20 | 基于异构联邦学习的变压器故障分类方法及模型训练方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410318809.2A CN117992873B (zh) | 2024-03-20 | 2024-03-20 | 基于异构联邦学习的变压器故障分类方法及模型训练方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117992873A true CN117992873A (zh) | 2024-05-07 |
CN117992873B CN117992873B (zh) | 2024-06-11 |
Family
ID=90890737
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410318809.2A Active CN117992873B (zh) | 2024-03-20 | 2024-03-20 | 基于异构联邦学习的变压器故障分类方法及模型训练方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117992873B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022105022A1 (zh) * | 2020-11-18 | 2022-05-27 | 杭州趣链科技有限公司 | 基于联邦学习的机器学习方法、电子装置和存储介质 |
CN115438714A (zh) * | 2022-08-01 | 2022-12-06 | 华南理工大学 | 分簇式联邦学习驱动的机械故障诊断方法、装置及介质 |
CN115731424A (zh) * | 2022-12-03 | 2023-03-03 | 北京邮电大学 | 基于强化联邦域泛化的图像分类模型训练方法及系统 |
CN115905978A (zh) * | 2022-11-18 | 2023-04-04 | 安徽工业大学 | 基于分层联邦学习的故障诊断方法及系统 |
CN116166406A (zh) * | 2023-04-25 | 2023-05-26 | 合肥工业大学智能制造技术研究院 | 个性化边缘卸载调度方法、模型训练方法和系统 |
CN116910652A (zh) * | 2023-07-20 | 2023-10-20 | 浙江大学 | 一种基于联邦自监督学习的设备故障诊断方法 |
CN116992336A (zh) * | 2023-09-04 | 2023-11-03 | 南京理工大学 | 一种基于联邦局部迁移学习的轴承故障诊断方法 |
-
2024
- 2024-03-20 CN CN202410318809.2A patent/CN117992873B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022105022A1 (zh) * | 2020-11-18 | 2022-05-27 | 杭州趣链科技有限公司 | 基于联邦学习的机器学习方法、电子装置和存储介质 |
CN115438714A (zh) * | 2022-08-01 | 2022-12-06 | 华南理工大学 | 分簇式联邦学习驱动的机械故障诊断方法、装置及介质 |
CN115905978A (zh) * | 2022-11-18 | 2023-04-04 | 安徽工业大学 | 基于分层联邦学习的故障诊断方法及系统 |
CN115731424A (zh) * | 2022-12-03 | 2023-03-03 | 北京邮电大学 | 基于强化联邦域泛化的图像分类模型训练方法及系统 |
CN116166406A (zh) * | 2023-04-25 | 2023-05-26 | 合肥工业大学智能制造技术研究院 | 个性化边缘卸载调度方法、模型训练方法和系统 |
CN116910652A (zh) * | 2023-07-20 | 2023-10-20 | 浙江大学 | 一种基于联邦自监督学习的设备故障诊断方法 |
CN116992336A (zh) * | 2023-09-04 | 2023-11-03 | 南京理工大学 | 一种基于联邦局部迁移学习的轴承故障诊断方法 |
Non-Patent Citations (2)
Title |
---|
TAILIN ZHOU, ETAL.: "FedFA: Federated Learning with Feature Anchors to Align Features and Classifiers for Heterogeneous Data", IEEE TRANSACTIONS ON MOBILE COMPUTING, 17 October 2023 (2023-10-17), pages 1 - 20 * |
周天任: "基于联邦学习的端边云协同心电检测系统设计与实现", 中国优秀硕士学位论文全文数据库 (基础科学辑), 15 January 2024 (2024-01-15), pages 1 - 73 * |
Also Published As
Publication number | Publication date |
---|---|
CN117992873B (zh) | 2024-06-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20200200813A1 (en) | Online diagnosis method for deformation position on trasnformation winding | |
CN109635928B (zh) | 基于深度学习模型融合的电压暂降原因识别方法 | |
Tong et al. | Detection and classification of transmission line transient faults based on graph convolutional neural network | |
US11967823B2 (en) | Method for monitoring short-term voltage stability of power system | |
CN105678343B (zh) | 基于自适应加权组稀疏表达的水电机组噪声异常诊断方法 | |
CN113904786B (zh) | 一种基于线路拓扑分析和潮流特性的虚假数据注入攻击辨识方法 | |
US20230083078A1 (en) | Method for intelligent fault detection and location of power distribution network | |
Costello et al. | Machine learning model for event-based prognostics in gas circulator condition monitoring | |
CN109190672A (zh) | 电力系统运行工况无监督聚类方法及装置 | |
CN113792754B (zh) | 一种先除异后修复的换流变dga在线监测数据处理方法 | |
Shi et al. | Improving power grid monitoring data quality: An efficient machine learning framework for missing data prediction | |
CN113283491A (zh) | 一种基于优化深度置信网络的电动汽车交流充电桩的故障诊断方法 | |
CN114118150A (zh) | 一种配电网单相接地故障选线方法及系统 | |
CN116894215B (zh) | 一种基于半监督动态图注意的齿轮箱故障诊断方法 | |
Jia et al. | Validity evaluation of transformer DGA online monitoring data in grid edge systems | |
CN111291918B (zh) | 平稳子空间外源矢量自回归的旋转机械退化趋势预测方法 | |
CN114676435A (zh) | 一种基于知识图谱的软件漏洞可利用性预测方法 | |
CN115734274A (zh) | 一种基于深度学习和知识图谱的蜂窝网络故障诊断方法 | |
CN112949201B (zh) | 一种风速预测方法、装置、电子设备及存储介质 | |
CN117992873B (zh) | 基于异构联邦学习的变压器故障分类方法及模型训练方法 | |
CN115564075A (zh) | 一种城市电网主配一体故障协同诊断方法、系统 | |
CN114755529A (zh) | 一种基于深度学习的多特征融合单相接地故障类型辨识方法 | |
CN114295981A (zh) | 一种基于rn网络电流多特征形态识别的电机故障诊断方法 | |
Shan et al. | Power system fault diagnosis based on logistic regression deep neural network | |
Rongrong et al. | Fault diagnosis method of distribution equipment based on hybrid model of robot and deep learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |