CN116992362A - 一种基于夏普利值的变压器故障表征特征量筛选方法和装置 - Google Patents
一种基于夏普利值的变压器故障表征特征量筛选方法和装置 Download PDFInfo
- Publication number
- CN116992362A CN116992362A CN202310824156.0A CN202310824156A CN116992362A CN 116992362 A CN116992362 A CN 116992362A CN 202310824156 A CN202310824156 A CN 202310824156A CN 116992362 A CN116992362 A CN 116992362A
- Authority
- CN
- China
- Prior art keywords
- transformer
- tree structure
- fault
- structure algorithm
- diagnosis model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 238000012216 screening Methods 0.000 title claims abstract description 39
- 238000012512 characterization method Methods 0.000 title claims abstract description 24
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 91
- 238000003745 diagnosis Methods 0.000 claims abstract description 91
- 238000012549 training Methods 0.000 claims abstract description 41
- 238000012795 verification Methods 0.000 claims abstract description 22
- 238000009795 derivation Methods 0.000 claims abstract description 15
- 238000012545 processing Methods 0.000 claims abstract description 13
- 238000012360 testing method Methods 0.000 claims description 37
- 238000004590 computer program Methods 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 8
- 238000002790 cross-validation Methods 0.000 claims description 7
- 238000004458 analytical method Methods 0.000 claims description 6
- 238000005457 optimization Methods 0.000 claims description 5
- 239000000654 additive Substances 0.000 claims description 3
- 230000000996 additive effect Effects 0.000 claims description 3
- 238000010276 construction Methods 0.000 claims description 3
- 238000007637 random forest analysis Methods 0.000 claims description 3
- 238000007873 sieving Methods 0.000 claims 1
- 230000007547 defect Effects 0.000 abstract 1
- 230000001419 dependent effect Effects 0.000 abstract 1
- 238000007619 statistical method Methods 0.000 abstract 1
- 239000007789 gas Substances 0.000 description 22
- 239000004215 Carbon black (E152) Substances 0.000 description 5
- 229930195733 hydrocarbon Natural products 0.000 description 5
- 150000002430 hydrocarbons Chemical class 0.000 description 5
- 238000011208 chromatographic data Methods 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000012854 evaluation process Methods 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 108091029480 NONCODE Proteins 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000013021 overheating Methods 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
Abstract
本发明公开了一种基于夏普利值的变压器故障表征特征量筛选方法和装置,该方法收集在运或故障变压器的油中溶解气体数据,构建变压器故障样本集;然后,对变压器样本数据进行特征衍生处理,并对基于树状结构算法的变压器故障诊断模型进行训练学习和验证;最后,结合夏普利值分析所有特征量对变压器不同故障的贡献度,得到不同故障类型的表征特征量。本发明能够克服传统变压器故障诊断特征量选取过于依赖现场经验,可大幅度缩减特征量筛选中的统计分析工作,也可提出针对变压器不同故障类型的专用特征量,提升变压器故障诊断方法的科学性和实用性。
Description
技术领域
本发明涉及变压器故障诊断技术,具体涉及一种基于夏普利值的变压器故障表征特征量筛选方法和装置。
背景技术
近年来,人工智能方法在变压器故障诊断中的应用逐步增多,这些方法一定程度上促进了变压器故障诊断技术的发展和进步,但其在现场应用中也存在诸多不可忽视的问题。对于现场运维人员而言,基于人工智能方法的变压器故障诊断模型无一例外都是“黑盒子”,无法建立起故障诊断结果与变压器运行数据间的直观联系,这既降低了故障诊断模型的可信度,也不利于经验积累。因此,若能结合人工智能诊断方法,筛选得到表征变压器故障类型的特征量,对提升故障诊断模型的可解释性和实用性均有积极作用。
针对变压器故障表征特征量筛选问题,现有方法大多基于经验或数据统计,如三比值法根据变压器油色谱中的气体组分含量,统计得到了不同故障类型与H2、CH4、C2H6、C2H4、C2H2这5种气体间相互比值的关系;或采用关联规则,计算不同特征量对变压器不同故障类型的支持度和置信度,根据支持度高低选择其相应的表征特征量。上述方法在特征量筛选及获取方面取得了一定成果,但仍存在一定问题:(1)特征量筛选需要一定的现场经验,特征量的初始选择范围直接决定了筛选结果的好坏;(2)特征量筛选工作量大,大多依赖人工统计和手动计算,智能化程度低;(3)特征量筛选结果的验证同样消耗大量的人力,特征量筛选及验证易受数据质量的影响。
发明内容
发明目的:本发明的一个目的在于提供一种夏普利值的变压器故障表征特征量筛选方法,该方法可筛选用于表征不同故障类型的专用特征量,克服传统特征量筛选中对人工统计及经验的限制,有助于进一步增加变压器智能诊断算法的可解释性。
本发明的另一目的在于提供一种基于夏普利值的变压器故障表征特征量筛选装置。
技术方案:本发明的基于夏普利值变压器故障表征特征量筛选方法,包括如下步骤:
收集在运或故障变压器的油中溶解气体数据和故障类型,构建包含有若干变压器故障样本的变压器故障样本集;
对每个变压器故障样本中变压器的油中溶解气体数据进行特征衍生处理,形成变压器样本集;
将变压器样本集按比例划分为训练集、测试集和验证集,利用训练集对预先构建的初始的基于树状结构算法的变压器故障诊断模型进行训练,同时利用测试集对初始的基于树状结构算法的变压器故障诊断模型进行测试,再用验证集来验证训练后的初始的基于树状结构算法的变压器故障诊断模型的泛化能力,得到预期的基于树状结构算法的变压器故障诊断模型;
对基于树状结构算法的变压器故障诊断模型,采用树状结构计算夏普利值得到不同故障类型对应特征量的贡献度;以及
针对不同故障类型,分析不同特征量的影响度和内在联系,依次筛选得到表征不同故障类型的特征量。
进一步的,利用训练集对预先构建的初始的基于树状结构算法的变压器故障诊断模型进行训练,同时利用测试集对初始的基于树状结构算法的变压器故障诊断模型进行测试,再用验证集来验证训练后的初始的基于树状结构算法的变压器故障诊断模型的泛化能力,得到预期的基于树状结构算法的变压器故障诊断模型,包括:
设置树状结构算法的参数空间,利用训练集对预先构建的初始的基于树状结构算法的变压器故障诊断模型进行训练,并在训练集下,采用十折交叉验证法对初始的基于树状结构算法的变压器故障诊断模型进行参数寻优;
同时利用测试集对初始的基于树状结构算法的变压器故障诊断模型进行测试;
当训练集和测试集准确率在预设阈值以内时,停止对初始的基于树状结构算法的变压器故障诊断模型训练;
采用验证集对基于树状结构算法的变压器故障诊断模型的泛化能力进一步测试,当基于树状结构算法的变压器故障诊断模型的输出结果的准确率高于预设值时,输出此时的基于树状结构算法的变压器故障诊断模型。
更进一步的,在训练集下,采用十折交叉验证法对初始的基于树状结构算法的变压器故障诊断模型进行参数寻优
进一步的,所述树状结构算法为XGBoost算法、CART树、随机森林、GBDT、AdaBoost中的一种。
进一步的,对基于树状结构算法的变压器故障诊断模型,采用树状结构计算夏谱利值得到不同故障类型对应特征量的贡献度,包括:
计算树状结构算法对输入样本的预测结果的期望值φ0;
采用加性模型G(x)对训练后的基于树状结构算法的变压器故障诊断模型F(x)进行拟合;以及
计算样本中xj特征在不同特征子集的夏普里值φj,得到故障特征量的贡献度。
进一步的,计算样本中xj特征在不同特征子集的夏普利值φj,得到故障特征量的贡献度,其中,故障特征量的贡献度的计算公式为
式中,{x1,x2,…xn}表示所有DGA样本特征的集合。
进一步的,对每个变压器故障样本中变压器的油中溶解气体数据进行特征衍生处理,形成变压器样本集,包括:
对每个变压器故障样本中变压器的油中溶解气体数据进行特征衍生处理,得到若干特征量,所有特征量组合形成变压器样本集。
本发明还包括一种基于夏普利值的变压器故障表征特征量筛选装置,包括
数据获取模块,用于收集在运或故障变压器的油中溶解气体数据和故障类型,构建包含有若干变压器故障样本的变压器故障样本集;
处理模块,用于对每个变压器故障样本中变压器的油中溶解气体数据进行特征衍生处理,形成变压器样本集;
模型构建模块,将变压器样本集按比例划分为训练集、测试集和验证集,利用训练集对预先构建的初始的基于树状结构算法的变压器故障诊断模型进行训练,同时利用测试集对初始的基于树状结构算法的变压器故障诊断模型进行测试,再用验证集来验证训练后的初始的基于树状结构算法的变压器故障诊断模型的泛化能力,得到预期的基于树状结构算法的变压器故障诊断模型;
计算模块,用于对基于树状结构算法的变压器故障诊断模型,采用树状结构算法计算夏普利值得到不同故障类型对应特征量的贡献度;
分析模块,用于针对不同故障类型,分析不同特征量的影响度和内在联系,依次筛选得到表征不同故障类型的特征量。
本发明还包括一种装置设备,包括存储器和处理器,其中:
存储器,用于存储能够在处理器上运行的计算机程序;
处理器,用于在运行所述计算机程序时,执行所述一种基于夏普利值的变压器故障表征特征量筛选方法的步骤。
本发明还包括一种计算机可读存储介质,所述存储介质上存储有计算机程序,所述计算机程序被至少一个处理器执行时实现所述一种基于夏普利值的变压器故障表征特征量筛选方法的步骤。
有益效果:本发明的技术方案与现有技术相比,其有益效果在于:可有效解决当前基于机器学习算法的变压器故障诊断方法的“黑盒问题”,即实现对基于机器学习算法的诊断结果的可视化解释,一方面可提升变压器故障诊断方法的可解释性,另一方面也可为变压器故障诊断提供更多的备选特征量或针对不同故障类型筛选其专用特征量,将极大程度提升变压器故障诊断的科学性和实用性。
附图说明
图1为本发明所述方法的流程图;
图2为本发明实施例中十折交叉验证示意图;
图3为本发明实施例中高温过热特征分析图;
图4为本发明实施例中验证例单条样本特征贡献图。
具体实施方式
下面结合具体实施方式和说明书附图对本发明的技术方案进行详细介绍。
如图1所示,本发明的夏普利值的变压器故障表征特征量筛选方法,包括如下步骤:
S1:收集在运或故障变压器的油中溶解气体数据和故障类型,构建变压器故障样本集,该变压器故障样本集包含有若干变压器故障样本;其中,油中溶解气体数据包括H2、CH4、C2H6、C2H4和C2H2和TG(烃类气体含量之和);故障类型为以下六种之一:低温过热(T<300℃)、中高温过热(T≥300℃)、局部放电、低能放电、高能放电或其他。
S2:对每个变压器故障样本中变压器的油中溶解气体数据进行特征衍生处理,形成变压器样本集;
在此步骤中,对每个变压器故障样本中变压器的油中溶解气体数据进行特征衍生处理,得到若干特征量,所有特征量组合形成变压器样本集。
本实施例中,采用三比值编码法、气体无编码比值法对油中溶解气体进行特征衍生,共得到下述16个特征量。
序号 | 特征量 | 序号 | 特征量 |
1 | M(H2) | 9 | C(C2H4/C2H6) |
2 | M(CH4) | 10 | K(H2/(H2+TG)) |
3 | M(C2H4) | 11 | K(C2H4/TG) |
4 | M(C2H6) | 12 | K(C2H6/TG) |
5 | M(C2H2) | 13 | K(C2H2/TG) |
6 | M(TG) | 14 | K((CH4+C2H4)/TG) |
7 | C(C2H2/C2H4) | 15 | K((C2H4+C2H6)/TG) |
8 | C(CH4/H2) | 16 | K((C2H2+C2H4)/TG) |
其中,M代表气体含量,C代表三比值编码,K代表气体无编码比值。
S3:将变压器样本集按比例划分为训练集、测试集和验证集,利用训练集对预先构建的初始的基于树状结构算法的变压器故障诊断模型进行训练,同时利用测试集对初始的基于树状结构算法的变压器故障诊断模型进行测试,再用验证集来验证训练后的初始的基于树状结构算法的变压器故障诊断模型的泛化能力,得到预期的基于树状结构算法的变压器故障诊断模型,具体步骤如下:
S3.1:设置树状结构算法的参数空间,利用训练集对预先构建的初始的基于树状结构算法的变压器故障诊断模型进行训练,并在训练集下,采用十折交叉验证法对初始的基于树状结构算法的变压器故障诊断模型进行参数寻优;
S3.2:同时利用测试集对初始的基于树状结构算法的变压器故障诊断模型进行测试;
S3.3:当训练集和测试集准确率在10%以内时,停止对初始的基于树状结构算法的变压器故障诊断模型训练;
S3.4:采用验证集对基于树状结构算法的变压器故障诊断模型的泛化能力进一步测试,当基于树状结构算法的变压器故障诊断模型的输出结果的准确率高于86%时,输出此时的基于树状结构算法的变压器故障诊断模型。
在此步骤中,树状结构算法为XGBoost算法、CART树、随机森林、GBDT、AdaBoost中的一种。
本实施例中,共收集1057条已知变压器故障的油中溶解气体数据,包含了低温过热(T1)、中高温过热(T2)、局部放电(T1)、局部放电(D1)、低能放电(D2)、高能放电(D3)和其他(N)。在完成特征衍生后,样本按6:3:1划分为训练集、测试集和验证集。各故障类型样本分布如下表所示:
类别 | N | T1 | T2 | D1 | D2 | D3 |
数量 | 228 | 180 | 245 | 82 | 125 | 197 |
将收集的变压器样本集作为基于树状结构算法的变压器故障诊断模型的输入,如图2所示,采用十折交叉验证对模型参数结果寻优,结果如下。
参数名称 | 参数含义 | 调优结果 |
num_boost_round | 弱分类器数量 | 225 |
eta | 学习率 | 0.40 |
booster | 指定使用的弱分类器 | ‘gbtree’ |
colsample_by_tree | 每一棵树特征采样比例 | 0.50 |
colsample_by_node | 节点特征采样比例 | 0.95 |
gamma | 目标函数中叶子数量系数 | 1.00 |
lambda | 正则项系数 | 3.30 |
min_child_weight | 叶子节点最小样本权重 | 0.70 |
max_depth | 最大数深度 | 7 |
subsamples | 样本采样比率 | 0.85 |
基于树状结构算法的变压器故障诊断模型在十折交叉验证下的平均准确率为88.6%,在训练集下的准确率为96.2%,测试集下准确率为89.7%,验证集下准确率为90.2%,表明本发明提出的基于树状结构算法的变压器故障诊断模型较好的泛化性能。
S4:对基于树状结构算法的变压器故障诊断模型,采用树状结构算法计算夏普利值得到不同故障类型对应特征量的贡献度,具体包括以下:
S4.1:计算树状结构算法对输入样本的预测结果的期望值φ0;
S4.2:采用加性模型G(x)对训练后的基于树状结构算法的变压器故障诊断模型F(x)进行拟合;
S4.3:计算样本中xj特征在不同特征子集的夏普利值φj,得到故障特征量的贡献度。
在此步骤中,计算样本中xj特征在不同特征子集的夏普利值φj,得到故障特征量的贡献度,其中,故障特征量的贡献度的计算公式为
式中,{x1,x2,…xn}表示所有DGA样本特征的集合。
本实施例中,结合每个特征量的数值计算对应的夏普利值,得出高温过热特征分析图,如图3所示,图中以XGBoost预测高温过热的期望值φ0为基准线,特征量对应的夏普利值分布在基准线两侧,左侧代表抑制区域,右侧代表促进区域。由图3可知,C2H4/TG、H2/(H2+TG)、C2H4/C2H6、C2H4和C2H2/TG对高温过热影响较为显著。其中,影响高温过热最重要的特征为C2H4/TG,且呈现一定的正相关关系,C2H4含量在总烃中占比越小,出现高温过热的概率也越小,但随着C2H4含量在总烃增大时,会促进高温过热的发生。而对于H2/(H2+TG),其与高温过热呈现一定的负相关关系。除此之外,三比值编码特征C2H4/C2H6对高温过热的影响表现出一定的分段关系,C2H4/C2H6编码由0到1时,会抑制高温过热的发生,而当C2H4/C2H6编码由1到2时,出现高温过热的可能性会增大。不难发现,编码特征量C2H4/C2H6和高温过热之间的关联性和DL/T 722-2014《油中溶解气体分析和判断导则》中的高温过热发展趋势一致。
S5:针对六种故障类型,分析不同特征量的影响度和内在联系,依次筛选得到下表不同故障类型的表征特征量。
验证例:
某地区变电站500kV主变C相油色谱在线测量装置在4月份报总烃超标告警,后加强色谱跟踪频次至6月,对主变停运,并进行相关的离线试验和解体检查。从数据库分别选取下表2月、4月和6月中三次离线油色谱数据采用本发明筛选的表征特征量进行诊断。
特征气体 | H2 | CH4 | C2H6 | C2H4 | C2H2 |
2月(μL/L) | 7.39 | 1.97 | 0.17 | 0.31 | 0 |
4月(μL/L) | 21.0 | 98.7 | 25.7 | 40.6 | 0.2 |
6月(μL/L) | 96.0 | 132.4 | 50.1 | 157.5 | 0.4 |
对上述三组油色谱数据进行特征衍生处理,并将其作为训练好的XGBoost诊断模型的输入量。图4中的(a)图表示2月其他故障样本评估过程,(b)图表示4月低温过热样本评估过程,(c)图表示6月中高温过热样本评估过程。基于XGBoost变压器故障诊断模型对2月样本数据诊断结果为正常,对4月样本数据诊断结果为低温过热,对6月样本数据诊断结果为中高温过热。引入TreeSHAP模型对上述三次诊断结果的影响因素进行可解释性分析,如图4所示。结合高温过热的表征特征量,基于6月份离线色谱数据,从图4(c)可以得出XGBoost模型判断变压器存在高温过热故障的原因是:C2H4占总烃含量46%,SHAP值为0.96,对高温过热的预测结果的贡献最大,C2H2/TG、C2H4含量、(CH4+C2H4)/TG和C2H4/C2H6的SHAP值均为正,促使预测结果向高温过热移动,而H2/(H2+TG)的SHAP值为-0.74,一定程度上抑制高温过热的预测。XGBoost对高温过热预测期望值为0.90,而最终输出结果为2.3,所以6月份最终故障预测结果为中高温过热。
该主变经返厂解体检查发现,中压线圈存在明显的股间短路现象,分析变压器故障原因为股间短路引发环流导致高温过热。
本发明还包括一种基于夏普利值的变压器故障表征特征量筛选装置,包括
数据获取模块,用于收集在运或故障变压器的油中溶解气体数据和故障类型,构建包含有若干变压器故障样本的变压器故障样本集;
处理模块,用于对每个变压器故障样本中变压器的油中溶解气体数据进行特征衍生处理,形成变压器样本集;
模型构建模块,将变压器样本集按比例划分为训练集、测试集和验证集,利用训练集对预先构建的初始的基于树状结构算法的变压器故障诊断模型进行训练,同时利用测试集对初始的基于树状结构算法的变压器故障诊断模型进行测试,再用验证集来验证训练后的初始的基于树状结构算法的变压器故障诊断模型的泛化能力,得到预期的基于树状结构算法的变压器故障诊断模型;
计算模块,用于对基于树状结构算法的变压器故障诊断模型,采用树状结构算法计算夏普利值得到不同故障类型对应特征量的贡献度;
分析模块,用于针对不同故障类型,分析不同特征量的影响度和内在联系,依次筛选得到表征不同故障类型的特征量。
本发明还包括一种装置设备,包括存储器和处理器,其中:
存储器,用于存储能够在处理器上运行的计算机程序;
处理器,用于在运行所述计算机程序时,执行一种基于夏普利值的变压器故障表征特征量筛选方法的步骤。
本发明还包括一种计算机可读存储介质,所述存储介质上存储有计算机程序,所述计算机程序被至少一个处理器执行时实现一种基于夏普利值的变压器故障表征特征量筛选方法的步骤。
Claims (10)
1.一种基于夏普利值的变压器故障表征特征量筛选方法,其特征在于,包括如下步骤:
收集在运或故障变压器的油中溶解气体数据和故障类型,构建包含有若干变压器故障样本的变压器故障样本集;
对每个变压器故障样本中变压器的油中溶解气体数据进行特征衍生处理,形成变压器样本集;
将变压器样本集按比例划分为训练集、测试集和验证集,利用训练集对预先构建的初始的基于树状结构算法的变压器故障诊断模型进行训练,同时利用测试集对初始的基于树状结构算法的变压器故障诊断模型进行测试,再用验证集来验证训练后的初始的基于树状结构算法的变压器故障诊断模型的泛化能力,得到预期的基于树状结构算法的变压器故障诊断模型;
对基于树状结构算法的变压器故障诊断模型,采用树状结构算法计算夏普利值得到不同故障类型对应特征量的贡献度;以及
针对不同故障类型,分析不同特征量的影响度和内在联系,依次筛选得到表征不同故障类型的特征量。
2.根据权利要求1所述的基于夏普利值的变压器故障表征特征量筛选方法,其特征在于,利用训练集对预先构建的初始的基于树状结构算法的变压器故障诊断模型进行训练,同时利用测试集对初始的基于树状结构算法的变压器故障诊断模型进行测试,再用验证集来验证训练后的初始的基于树状结构算法的变压器故障诊断模型的泛化能力,得到预期的基于树状结构算法的变压器故障诊断模型,包括:
设置树状结构算法的参数空间,利用训练集对预先构建的初始的基于树状结构算法的变压器故障诊断模型进行训练,并在训练集下,对初始的基于树状结构算法的变压器故障诊断模型进行参数寻优;
同时利用测试集对初始的基于树状结构算法的变压器故障诊断模型进行测试;
当训练集和测试集准确率的差值在预设阈值以内时,停止对初始的基于树状结构算法的变压器故障诊断模型训练;
采用验证集对基于树状结构算法的变压器故障诊断模型的泛化能力进一步测试,当基于树状结构算法的变压器故障诊断模型的输出结果的准确率高于预设值时,输出此时的基于树状结构算法的变压器故障诊断模型。
3.根据权利要求1所述的基于夏普利值的变压器故障表征特征量筛选方法,其特征在于,在训练集下,采用十折交叉验证法对初始的基于树状结构的变压器故障诊断模型进行参数寻优。
4.根据权利要求1所述的基于夏普利值的变压器故障表征特征量筛选方法,其特征在于,所述树状结构算法为XGBoost算法、CART树、随机森林、GBDT、AdaBoost中的一种。
5.根据权利要求1所述的基于树状结构算法的变压器故障表征特征量筛选方法,其特征在于,对基于树状结构算法的变压器故障诊断模型,采用树状结构算法计算夏普利值得到不同故障类型对应特征量的贡献度,包括:
计算树状结构算法对输入样本的预测结果的期望值φ0;
采用加性模型G(x)对训练后的基于树状结构算法的变压器故障诊断模型F(x)进行拟合;以及
计算样本中xj特征在不同特征子集的夏普利值φj,得到故障特征量的贡献度。
6.根据权利要求5所述的基于夏普利值的变压器故障表征特征量筛选方法,其特征在于,计算样本中xj特征在不同特征子集的夏普利值φj,得到故障特征量的贡献度,其中,故障特征量的贡献度的计算公式为
式中,{x1,x2,…xn}表示所有DGA样本特征的集合。
7.根据权利要求1所述的基于夏普利值的变压器故障表征特征量筛选方法,其特征在于,对每个变压器故障样本中变压器的油中溶解气体数据进行特征衍生处理,形成变压器样本集,包括:
对每个变压器故障样本中变压器的油中溶解气体数据进行特征衍生处理,得到若干特征量,所有特征量组合形成变压器样本集。
8.一种基于夏普利值的变压器故障表征特征量筛选装置,其特征在于:包括
数据获取模块,用于收集在运或故障变压器的油中溶解气体数据和故障类型,构建包含有若干变压器故障样本的变压器故障样本集;
处理模块,用于对每个变压器故障样本中变压器的油中溶解气体数据进行特征衍生处理,形成变压器样本集;
模型构建模块,用于将变压器样本集按比例划分为训练集、测试集和验证集,利用训练集对预先构建的初始的基于树状结构算法的变压器故障诊断模型进行训练,同时利用测试集对初始的基于树状结构算法的变压器故障诊断模型进行测试,再用验证集来验证训练后的初始的基于树状结构算法的变压器故障诊断模型的泛化能力,得到预期的基于树状结构算法的变压器故障诊断模型;
计算模块,用于对基于树状结构算法的变压器故障诊断模型,采用树状结构算法计算夏普利值得到不同故障类型对应特征量的贡献度;
分析模块,用于针对不同故障类型,分析不同特征量的影响度和内在联系,依次筛选得到表征不同故障类型的特征量。
9.一种装置设备,其特征在于,包括存储器和处理器,其中:
存储器,用于存储能够在处理器上运行的计算机程序;
处理器,用于在运行所述计算机程序时,执行如权利要求1-7任一项所述一种基于夏普利值的变压器故障表征特征量筛选方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述存储介质上存储有计算机程序,所述计算机程序被至少一个处理器执行时实现如权利要求1-7任一项所述一种基于夏普利值的变压器故障表征特征量筛选方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310824156.0A CN116992362A (zh) | 2023-07-06 | 2023-07-06 | 一种基于夏普利值的变压器故障表征特征量筛选方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310824156.0A CN116992362A (zh) | 2023-07-06 | 2023-07-06 | 一种基于夏普利值的变压器故障表征特征量筛选方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116992362A true CN116992362A (zh) | 2023-11-03 |
Family
ID=88524093
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310824156.0A Pending CN116992362A (zh) | 2023-07-06 | 2023-07-06 | 一种基于夏普利值的变压器故障表征特征量筛选方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116992362A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117192312A (zh) * | 2023-11-07 | 2023-12-08 | 云南电网有限责任公司 | 基于机器学习的二次交流电缆绝缘异常监测方法及系统 |
-
2023
- 2023-07-06 CN CN202310824156.0A patent/CN116992362A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117192312A (zh) * | 2023-11-07 | 2023-12-08 | 云南电网有限责任公司 | 基于机器学习的二次交流电缆绝缘异常监测方法及系统 |
CN117192312B (zh) * | 2023-11-07 | 2024-04-19 | 云南电网有限责任公司 | 基于机器学习的二次交流电缆绝缘异常监测方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110348615B (zh) | 基于蚁群优化支持向量机的电缆线路故障概率预测方法 | |
CN110929847A (zh) | 一种基于深度卷积神经网络的换流变压器故障诊断方法 | |
CN110969262A (zh) | 一种变压器故障诊断方法 | |
CN108051660A (zh) | 一种变压器故障组合诊断模型建立方法及诊断方法 | |
CN105677564A (zh) | 基于改进的Adaboost软件缺陷不平衡数据分类方法 | |
CN112756759B (zh) | 点焊机器人工作站故障判定方法 | |
CN116992362A (zh) | 一种基于夏普利值的变压器故障表征特征量筛选方法和装置 | |
CN111340248A (zh) | 一种基于智能集成算法的变压器故障诊断方法及系统 | |
CN116401532B (zh) | 一种电力系统受扰后频率失稳识别方法及系统 | |
CN111695288B (zh) | 一种基于Apriori-BP算法的变压器故障诊断方法 | |
CN113342784A (zh) | 一种电网主变设备风险评估的数据库设计方法 | |
CN110705859A (zh) | 基于pca-自组织神经网络的中低压配电网运行状态评估方法 | |
CN113435759A (zh) | 一种基于深度学习的一次设备风险智能评估方法 | |
CN116562121A (zh) | 基于XGBoost和FocalLoss结合的电缆老化状态评估方法 | |
CN108988347B (zh) | 一种电网暂态电压稳定样本集类别失衡的调节方法及系统 | |
CN109557434A (zh) | 基于复合字典稀疏表示分类的强背景噪声下局部放电信号识别方法 | |
Wang et al. | A combined fault diagnosis method for power transformer in big data environment | |
CN111880957A (zh) | 一种基于随机森林模型的程序错误定位方法 | |
CN112380763A (zh) | 一种基于数据挖掘的堆内构件可靠性分析系统及方法 | |
CN105741184A (zh) | 一种变压器状态评估方法及装置 | |
CN111737993A (zh) | 一种配电网设备的故障缺陷文本提取设备健康状态方法 | |
CN116562114A (zh) | 一种基于图卷积神经网络的电力变压器故障诊断方法 | |
CN115407053B (zh) | 征兆优选方法、计算机设备以及可读存储介质 | |
CN114139408A (zh) | 一种电力变压器健康状态评估方法 | |
CN115239502A (zh) | 一种分析师模拟方法、系统、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |