CN114358116A - 油浸式变压器故障诊断方法、系统及可读存储介质 - Google Patents

油浸式变压器故障诊断方法、系统及可读存储介质 Download PDF

Info

Publication number
CN114358116A
CN114358116A CN202111414926.1A CN202111414926A CN114358116A CN 114358116 A CN114358116 A CN 114358116A CN 202111414926 A CN202111414926 A CN 202111414926A CN 114358116 A CN114358116 A CN 114358116A
Authority
CN
China
Prior art keywords
fault diagnosis
transformer
data
training
gas
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111414926.1A
Other languages
English (en)
Inventor
梁栋炀
石鑫
房方
王婷婷
罗兵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CSG Electric Power Research Institute
North China Electric Power University
Original Assignee
CSG Electric Power Research Institute
North China Electric Power University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CSG Electric Power Research Institute, North China Electric Power University filed Critical CSG Electric Power Research Institute
Priority to CN202111414926.1A priority Critical patent/CN114358116A/zh
Publication of CN114358116A publication Critical patent/CN114358116A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Housings And Mounting Of Transformers (AREA)

Abstract

本发明提供了一种油浸式变压器故障诊断方法、系统及可读存储介质,包括:S1:获取不同故障状态下和正常状态下对应的气体含量;S2:对S1中的气体进行筛选,选择具备集中性和完整性的气体作为特征气体输入模型,并将特征气体对应的变压器状态进行整数编码作为模型训练的输出结果;S3:进行预处理,保留有效数据作为第一训练集;S4:进行分层划分、样本合成平衡和标准化处理;S5:进行训练和测试;S6:进行变压器故障诊断。本发明可以弥补现有的基于传统人工智能算法的油浸式变压器故障诊断算法的不足,提高油浸式变压器故障诊断的准确率,提高供电可靠性。

Description

油浸式变压器故障诊断方法、系统及可读存储介质
【技术领域】
本发明涉及变压器故障诊断技术领域,基于SMOTE-XGBoost集成学习算法实现,具体为一种油浸式变压器故障诊断方法、系统及可读存储介质。
【背景技术】
变压器故障诊断是变电站进行日常运行维护的重要内容,它关系到供电的安全性与可靠性,是保障电网安全运行的关键环节之一。变压器故障诊断是通过对变电设备进行状态监测,及时对变压器的一些关键状态数据进行分析挖掘,通过经验或者大数据分析算法来判断变压器可能出现的故障类型,以及时安排检修。随着大数据技术及先进传感器的应用,变压器故障诊断的运维策略已经从最开始的修复性维护、定期维护等被动式维护逐渐过渡到基于状态监测的主动式维护。基于油浸式变压器状态监测的主动式维护是在不需要设备停机,即设备运行的状况下,通过传感器等相关仪器获得变压器设备的状态量信息,通过相关大数据挖掘算法分析变压器的实际运行情况,进而判断和预测可能出现故障。
当前,油浸式电力变压器故障诊断方法基本上都是在基于油中气体分析法(Dissolved gas analysis,DGA)的基础上发展起来的,而基于油中溶解气体的分析方法可\为传统的定性经验法和基于数据驱动的人工智能方法。
定性经验法是人们在大量实际经验的基础上,通过对所得到的数据进行了归纳总结,从而认为界定变压器故障类型。定性经验法可分为特征气体法和三比值法等。特征气体法是将油浸式变压器绝缘油裂解产生的挥发性气体分为主要、次要气体,然后根据大量的实践经验,依据主要、次要气体的浓度直接判断出变压器故障类型。该种方法简单易行,但没有分析特征气体间的关系,主观性很强,且非常依赖于实际经验,难以大规模应用。三比值法是基于油浸式变压器绝缘油中溶解的个别特征气体的比例来进行变压器故障诊断。通过选定特征气体,对特征气体浓度构成三对比值,并对其进行编码,然后通过编码的组合来判断变压器故障类型。该方法考虑了气体间的一些简单的耦合,采用特征气体的比值来做判断依据,但缺乏严密的数学公式,实质上仍然是依赖于经验的定性判断,因此仍然具有较强的主观性。
基于数据驱动的人工智能诊断方法利用变压器的大量历史运行数据训练模型,改模型能够分析不同特征气体间的复杂耦合关系,模型具有严密的数学推导公式,诊断结果避免了主观性且准确率较高,此外,还能够实现在线诊断,从而成为国内外变压器故障诊断研究的焦点。基于数据驱动的变压器人工智能故障诊断方法有:多层感知机(MultilayerPerceptron,MLP)、K近邻(k-Nearest Neighbor,KNN)、自编码网络(Auto-EncoderNetwork,AE)、模糊逻辑(Fuzzy Logic,FL)、支持向量机(Support Vector Machine,SVM)、决策树(Decision Tree,DT)、梯度提升决策树(Gradient Boosting Decision Tree,GBDT)和随机森林(Random Forest)等。基于传统的人工智能变压器故障诊断方法虽然能够取得较好的故障诊断效果,但仍然面临着诸多问题。变压器出现故障从本质上来说是一种少数类事件,因此实际我们获取的变压器运行数据往往绝大多数对应的是正常运行状态,故障样本只占有极少数,这使得基于数据驱动的变压器故障诊断变成了不平衡的学习过程。而变压器故障类型又分为过热性故障和放电性故障,过热故障和放电故障又有不同的程度。因此,实际的变压器故障诊断是一个基于不平衡样本分布的多分类难题。不平衡的样本会使得传统的人工智能算法的模型学习过程更加侧重于多数类样本,而忽略少数类样本。这会极大损害模型的学习效果,降低模型的泛化能力,最终甚至会导致诊断分类结果出现严重的偏差。同时,对于多分类问题,尤其是不平衡样本的多分类问题,不能简单地选择准确率作为评估指标,因为如果我们将所有结果都判断为正常状况也能够取得较高的准确率,而这样的结果却不符合实际情况。故对于变压器故障诊断要选择合适的模型算法才能取得较好的诊断效果。
基于SMOTE-XGBoost算法的变压器故障诊断方法是专门针对变压器样本中存在的样本不平衡问题而提出来的,能够很好地处理不平衡的学习问题,从而使得模型训练结果更加可靠,故障诊断效率更高,泛化能力更强。其中,合成少数类过采样技术(SyntheticMinority Over-Sampling Technique,SMOTE)改善了随机过采样算法容易造成过拟合的问题,它的基本思想是根据少数类样本的k近邻人工合成新样本,从而实现数据集中各类别样本数量的平衡。XGBoost(eXtreme Gradient Boosting)极度梯度提升,是一种基于梯度提升决策树GBDT(Gradient Boosting Decision Tree)的一种改进算法,其目标在于最大程度地提升算法的速度和效率。与GBDT相比,XGBoost的最大改进在于目标函数的设置,它的目标函数采用由损失函数和正则项两项相加构成。其中,泰勒公式二阶导数展开使得损失函数的梯度下降更快更准,结果更加精确;正则项的使用则控制了模型的复杂度,最大程度上避免了模型过拟合,提高模型泛化能力。
导致变压器出现故障的因素错综复杂,各种因素又互相耦合,而且实际变电站拥有众多变压器,人工检修工作量巨大且非常依赖于检修人员的经验,具有很大主观性。而传统的人工智能故障诊断算法虽然克服了主观性,大大降低了人的工作量,但又面临缺乏高质量的历史数据集和数据集分布严重不平衡的挑战,这导致基于传统的人工智能算法准确率低,诊断结果不可靠等。
因此,有必要研究一种油浸式变压器故障诊断方法、系统及可读存储介质来应对现有技术的不足,以解决或减轻上述一个或多个问题。
【发明内容】
有鉴于此,本发明的目的在于弥补现有的基于传统人工智能算法的油浸式变压器故障诊断算法的不足,本发明基于SMOTE过采样技术和XGBoost集成学习算法对进行变压器故障诊断,提供一种油浸式变压器故障诊断方法、系统及可读存储介质,以提高油浸式变压器故障诊断的准确率,提高供电可靠性。
一方面,本发明提供一种油浸式变压器故障诊断方法,所述故障诊断方法包括:
S1:从历史数据库中获取变压器故障样本和正常样本,通过气体分析法从样本中获取不同故障状态下和正常状态下对应的气体含量;
S2:对S1中的气体进行筛选,选择具备集中性和完整性的气体数据作为特征气体输入模型,并将特征气体对应的变压器状态进行整数编码作为模型训练的输出结果;
S3:对模型的输入数据和输出结果进行预处理,保留有效数据作为第一训练集;
S4:对第一训练集进行分层划分、样本合成平衡和标准化处理,获取第二训练集;
S5:将第二训练集输入XGBoost算法中进行训练和测试;
S6:通过宏平均后的准确率、召回率和F1得分对S5中训练和测试的结果进行变压器故障诊断。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述S1中获取不同故障状态下和正常状态下的气体种类包括但不限于H2、CH4、C2H6、C2H4、C2H2、CO和CO2
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述S2中特征气体包括H2、CH4、C2H6、C2H4和C2H2
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述S2中变压器状态包括正常、局部放电、低能放电、高能放电、中低温过热和高温过热。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述S3中数据预处理具体为:对数据中存在缺失值、极端值和/或负值的结果进行剔除,保留有效数据。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述S4中分层划分具体为:以历史数据库中的变压器故障样本和正常样本的比例作为预设比例条件,对第一训练集进行同比例分层划分。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述S4中样本合成平衡具体为:采用合成少数类样本方法SMOTE,对少数类样本进行识别分析并合成新的少数类样本。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述S4中标准化处理具体为:对数据集进行标准化处理,标准化公式采用:
Figure BDA0003374904550000051
其中,x*表示标准化后的数据,x为原始数据,
Figure BDA0003374904550000052
和xstd分别为均值和标准差。
如上所述的方面和任一可能的实现方式,进一步提供一种油浸式变压器故障诊断系统,用于完成任意一项所述的故障诊断方法,所述故障诊断系统包括:
数据获取模块,用于获取不同故障状态下和正常状态下对应的气体含量;
数据筛选模块,用于筛选具备集中性和完整性的气体作为特征气体输入模型,并将特征气体对应的变压器状态进行整数编码作为模型训练的输出结果;
数据预处理模块,用于对输入模型和输出结果进行预处理,保留有效数据作为第一训练集;
分层平衡和标准化模块,用于对第一训练集进行分层划分、样本合成平衡和标准化处理,获取第二训练集;
模型训练测试模块,用于将第二训练集输入XGBoost算法中进行训练和测试;
故障诊断模块,通过宏平均后的准确率、召回率和F1得分对模型训练测试模块的结果进行变压器故障诊断。
如上所述的方面和任一可能的实现方式,进一步提供一种可读存储介质,包括:存储器,所述存储器存储有程序;处理器,所述处理器执行所述程序时实现任一项所述的故障诊断方法。
与现有技术相比,本发明可以获得包括以下技术效果:
1):本发明采用SMOTE过采样技术解决变压器故障诊断问题中存在的分类样本严重不平衡问题,尤其是故障样本严重稀缺的问题,提高后续使用人工智能算法训练模型的可靠性。
2):本发明采用XGBoost集成学习算法进行变压器故障诊断,该模型高效、灵活、鲁棒和泛化能力强。相较于传统人工智能算法,该模型能够使得变压器故障诊断结果更加准确、高效和可靠,有效节省大量人力和物力,降低运维成本。
当然,实施本发明的任一产品并不一定需要同时达到以上所述的所有技术效果。
【附图说明】
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1是本发明一个实施例提供的数据集中变压器各类样本数据分布图;
图2是本发明一个实施例提供的变压器故障诊断模型在每轮迭代过程中的对数损失曲线图;
图3是本发明一个实施例提供的的变压器故障诊断模型在每轮迭代过程中的分类错误率曲线图;
图4是本发明一个实施例提供的变压器故障诊断中的混淆矩阵图;
图5是本发明一个实施例提供的故障诊断方法的步骤流程示意图。
【具体实施方式】
为了更好的理解本发明的技术方案,下面结合附图对本发明实施例进行详细描述。
应当明确,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
本发明基于SMOTE过采样技术和XGBoost集成学习算法对进行变压器故障诊断,提供一种油浸式变压器故障诊断方法、系统及可读存储介质,以提高油浸式变压器故障诊断的准确率,提高供电可靠性。
一种油浸式变压器故障诊断方法,所述故障诊断方法包括:
S1:从历史数据库中获取变压器故障样本和正常样本,通过气体分析法从样本中获取不同故障状态下和正常状态下对应的气体含量;
S2:对S1中的气体进行筛选,选择具备集中性和完整性的气体数据作为特征气体输入模型,并将特征气体对应的变压器状态进行整数编码作为模型训练的输出结果;
S3:对模型的输入数据和输出结果进行预处理,保留有效数据作为第一训练集;
S4:对第一训练集进行分层划分、样本合成平衡和标准化处理,获取第二训练集;
S5:将第二训练集输入XGBoost算法中进行训练和测试;
S6:通过宏平均后的准确率、召回率和F1得分对S5中训练和测试的结果进行变压器故障诊断。
所述S1中获取不同故障状态下和正常状态下的气体种类包括但不限于H2、CH4、C2H6、C2H4、C2H2、CO和CO2。所述S2中特征气体包括H2、CH4、C2H6、C2H4和C2H2
所述S2中变压器状态包括正常、局部放电、低能放电、高能放电、中低温过热和高温过热。
所述S3中数据预处理具体为:对数据中存在缺失值、极端值和/或负值的结果进行剔除,保留有效数据。
所述S4中分层划分具体为:以历史数据库中的变压器故障样本和正常样本的比例作为预设比例条件,对第一训练集进行同比例分层划分。样本合成平衡具体为:采用合成少数类样本方法SMOTE,对少数类样本进行识别分析并合成新的少数类样本。标准化处理具体为:对数据集进行标准化处理,标准化公式采用:
Figure BDA0003374904550000081
其中,x*表示标准化后的数据,x为原始数据,
Figure BDA0003374904550000082
和xstd分别为均值和标准差。
本发明还提供一种油浸式变压器故障诊断系统,用于完成任意一项所述的故障诊断方法,所述故障诊断系统包括:
数据获取模块,用于获取不同故障状态下和正常状态下对应的气体含量;
数据筛选模块,用于筛选具备集中性和完整性的气体作为特征气体输入模型,并将特征气体对应的变压器状态进行整数编码作为模型训练的输出结果;
数据预处理模块,用于对输入模型和输出结果进行预处理,保留有效数据作为第一训练集;
分层平衡和标准化模块,用于对第一训练集进行分层划分、样本合成平衡和标准化处理,获取第二训练集;
模型训练测试模块,用于将第二训练集输入XGBoost算法中进行训练和测试;
故障诊断模块,通过宏平均后的准确率、召回率和F1得分对模型训练测试模块的结果进行变压器故障诊断。
本发明还包括一种可读存储介质,包括:存储器,所述存储器存储有程序;处理器,所述处理器执行所述程序时实现任一项所述的故障诊断方法。
本发明基于SMOTE-XGBoost的油浸式变压器故障诊断方法在进行实际操作时方法具体如下:
S1:利用变压器油色谱在线监测系统对油浸式变压器运行时的油中气体含量进行采集,选取尽可能多的油浸式变压器正常运行状况和故障状况下的油中气体含量数据,即DGA数据。
S2:确定出H2、CH4、C2H6、C2H4、C2H25种特征气体作为模型输入,对变压器的6种状态类型:包含正常、局部放电、低能放电、高能放电、中低温过热和高温过热,进行0-5的整数编码作为模型的输出。
S3:对数据进行预处理。对缺失数据进行简单的删除,并对一些极端值或负值进行剔除。
S4:然后对预处理后的数据集按照8:2的比例分层划分为训练集与测试集。
S5:采用SMOTE过采样技术对训练集数据进行少数类样本的合成,达到平衡数据集的目的。
S6::对训练集和测试集的输入数据进行0-1归一化处理,避免模型训练过程中可能出现的数值计算问题。
S7:采用XGBoost集成学习算法对SMOTE平衡后的训练集数据进行模型的训练,然后使用训练好的XGBoost模型对测试集数据进行预测,得到预测的诊断结果。
S8:采用多分类问题的评估指标对测试集的诊断结果进行模型的性能评估,基于评估的结果,决定是否需要反向调整模型参数并进行多次试验得到期望的模型性能。
本发明工作原理如下:
本发明公开了一种基于SMOTE-XGBoost集成学习算法的油浸式变压器故障诊断方法。其工作原理是通过以下详细步骤实现的:
S1:根据先验知识,采用油浸式变压器故障诊断方法普遍选取的的油中气体分析法,选取尽可能多的变压器故障样本和正常样本,每个样本都包含变压器油中的各种气体含量和对应的故障状态。
S2:油浸式变压器绝缘油裂解产生油中的H2、CH4、C2H6、C2H4、C2H2、CO和CO2等多种气体,由于CO、CO2两种气体非常少,且具有分散性、现场采集不完整等缺点,所以挑选出H2、CH4、C2H6、C2H4、C2H25种特征气体作为模型的输入。变压器处于不同运行状态时油中的5种特征气体含量不同。根据我国《变压器油中溶解气体分析和判断导则》(DL/T722—2000)将变压器故障类型分为:正常、局部放电、低能放电、高能放电、中低温过热和高温过热6种状态。将该6种状态分别给予0-5的整数编码,以此作为模型训练的输出。
S3:由于变压器故障从本质上来讲属于稀有事件,所以搜集的数据不可能是时序数据。实际采集的数据可能存在缺失值、极端值、甚至负值,故要对原始数据进行预处理。由于不是时序数据,前后数据之间不会产生关联,故对缺失值、极端值甚至是负值进行简单的剔除。
S4:由于变压器故障样本存在严重的不平衡分布,即大量样本对应的是正常状态,少量样本对应的是故障样本。故在数据集划分训练集和测试集时,不能采取简单的随机划分策略,不然将导致训练集和测试集样本中正常状态和故障状态的严重不平衡,这将扰乱之后模型的训练,带来重大错误。所以应当采取分层划分的原则,保证训练集和测试集中各类样本所占比例与原数据集中的各类样本所占比例相同。
S5:经过分层划分后的训练集中各类样本的比例与元数据集中各类样本比例相同,即仍然存在着各类样本分布严重不平衡的问题。这种不平衡分布将会大大损害人工智能算法的训练学习过程,因为模型学习过程往往会偏向于多数类样本,而忽视少数类样本。这就使得学习后的模型对多数类样本的识别效果很好,而对少数类样本的识别效果很差,从而导致模型泛化能力大大下降。故需要对训练集的样本分布进行平衡。测试集是用来进行模型的评估,因此测试集样本不需要进行平衡。
S6:采用合成少数类样本技术SMOTE,可以对少数类样本进行识别分析并合成新的少数类样本,以达到平衡数据集的目的,并降低随机过采样可能导致的过拟合问题。其算法流程如下:
(1)对于少数类样本集合Pm,从集合Pm中随机选取其中一个少数类样本xi,xi∈Pm,以欧式距离计算其他少数类样本到xi的距离,选取距离xi最近的K个少数类样本
Figure BDA0003374904550000111
得到xi的K近邻;
(2)对于每一个选择的K近邻样本,在于与原样本xi的连线上随机生成新样本,公式为:
Figure BDA0003374904550000121
其中,xnew为合成的新样本,ε为区间(0,1)之间的随机数,||表示求欧式距离。步骤6:
由于各种特征气体变化相差较大,为保证数值计算稳定,要对数据集进行标准化
处理,标准化公式采用:
Figure BDA0003374904550000122
其中,x*表示标准化后的数据,x为原始数据,
Figure BDA0003374904550000123
和xstd分别为均值和标准差。
S7:经SMOTE平衡后且标准化的数据集送入XGBoost算法中进行训练和测试。XGBoost算法本质上是一种基于梯度提升的算法,是在GBDT算法上进行的改进,最大的区别在于目标函数的设置不同。XGBoost是由多个分类与回归树(Classification andRegression Trees,CART)模型组成的加法模型,该加法模型为
Figure BDA0003374904550000124
其中,
Figure BDA0003374904550000125
表示第i个预测结果,K表示CART树的棵数,fk表示具体的CART树的模型。
XGBoost的目标函数定义为:
Figure BDA0003374904550000126
其中Objxgb表示XGBoost模型的目标函数,
Figure BDA0003374904550000127
表示自定义的损失函数,例如,根据任务的不同,回归问题可采用均方差函数作为损失函数,分类问题可采用对数损失函数等。Ω(fk)表示CART树的正则项,n为样本数量。
XGBoost模型的训练过程是基于Boost梯度提升的迭代过程,目的是使得目标函数达到最小。经过每一棵CART树的梯度提升迭代过程和泰勒公式二阶导数展开,最后化简可得到最终的损失函数表达式为:
Figure BDA0003374904550000131
其中,
Figure BDA0003374904550000132
Figure BDA0003374904550000133
分别表示叶子结点j所包含样本一阶偏导数的累加之和与二阶偏导数累加之和,且两个量都是常量。Ij={i|q(xi)=j}表示将属于第j个叶子结点的所有样本xi划入到一个叶子节点的样本集合中。
Figure BDA0003374904550000134
是第t-1次迭代的第i个变量的预测结果,
Figure BDA0003374904550000135
是第t次迭代后第i个变量的预测结果。T表示叶子数量,γ表示叶子数量系数,γ越大表示施加的惩罚越大,就越希望获得结构简单的树,该参数可以有效防止叶子数过多。λ表示叶子节点的权重向量系数,实际上是正则法中的步长调节,λ越大也表示越希望获得结构简单的树。
上式给出了目标函数的最终结果,在实际求解中,λ和γ为自定义参数,应先求出每个节点每个样本的一阶导数si和二阶导数pi,然后针对每个节点对所含样本求和得到Sj和Pj,最后遍历决策树的节点即可得到目标函数。
在实际训练过程中,由于树的结构不确定,XGBoost采用贪婪算法来找到叶子节点的最优切分点,并计算分裂节点的收益。则对于目标函数来说,分裂后的收益为
Figure BDA0003374904550000136
其中,L表示左子树,R表示右子树。增益越大,意味着分裂前比分裂后的差距越大,也就意味着梯度下降得越明显。
S8:对于变压器故障诊断这个基于不平衡数据的多分类问题,评估指标不应采用正确率,这可能会引起评估结果产生重大偏差。因为变压器各种故障类型的重要性相同,故应当采用基于宏平均的准确率、召回率和F1得分。而这三个指标基本上都是基于混淆矩阵计算得来的,混淆矩阵的定义如下表1所示:
Figure BDA0003374904550000141
表1对于类别数为L个的分类问题,基于宏平均的准确率、召回率和F1得分分别定义为:
Figure BDA0003374904550000142
Figure BDA0003374904550000143
Figure BDA0003374904550000144
本发明收集到的油浸式变压器故障数据集共包含6910条数据,每条数据包含H2、CH4、C2H6、C2H4、C2H2五种特征气体及其对应的标签。数据集中变压器各类样本数据分布如图1所示。基于SMOTE-XGBoost算法的变压器故障诊断模型在每轮迭代过程中的对数损失曲线如图2所示,图中,x轴表示模型迭代次数,y轴表示模型的对数损失。实现和虚线分别表示训练集和测试集的对数损失曲线。从图中可以看出随着迭代步数的增加,训练集比测试集具有更低的对数损失,这表明模型并没产生明显的过拟合现象,性能符合预期。
同时,基于SMOTE-XGBoost算法的变压器故障诊断模型在每轮迭代过程中的分类错误率曲线如图3所示,图中,x轴表示模型迭代次数,y轴表示模型的分类错误率。实现和虚线分别表示训练集和测试集的分类错误率曲线。从图中可以看出随着迭代步数的增加,训练集比测试集具有更低的分类错误率,这与对数损失曲线的变化情况基本一致。
最终的基于SMOTE-XGBoost算法的变压器故障诊断分类结果,如图4中混淆矩阵所示:与其他算法进行对比,得到变压器故障诊断模型的性能对比结果如表2所示:
Figure BDA0003374904550000151
表2
由仿真对比结果可知,XGBoost与GBDT相比,模型精度和训练速度得到了提升,采用SMOTE过采样会使得训练样本大大增加,所以SMOTE-XGBoost模型的训练时间加长,但同时,提出的SMOTE-XGBoost算法具有最高的宏平均F1得分,能够取得更加精准的油浸式变压器故障诊断分类效果。
以上对本申请实施例所提供的油浸式变压器故障诊断方法、系统及可读存储介质,进行了详细介绍。以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
如在说明书及权利要求书当中使用了某些词汇来指称特定组件。本领域技术人员应可理解,硬件制造商可能会用不同名词来称呼同一个组件。本说明书及权利要求书并不以名称的差异来作为区分组件的方式,而是以组件在功能上的差异来作为区分的准则。如在通篇说明书及权利要求书当中所提及的“包含”、“包括”为一开放式用语,故应解释成“包含/包括但不限定于”。“大致”是指在可接收的误差范围内,本领域技术人员能够在一定误差范围内解决所述技术问题,基本达到所述技术效果。说明书后续描述为实施本申请的较佳实施方式,然所述描述乃以说明本申请的一般原则为目的,并非用以限定本申请的范围。本申请的保护范围当视所附权利要求书所界定者为准。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的商品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种商品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的商品或者系统中还存在另外的相同要素。
应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
上述说明示出并描述了本申请的若干优选实施例,但如前所述,应当理解本申请并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述申请构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本申请的精神和范围,则都应在本申请所附权利要求书的保护范围内。

Claims (10)

1.一种油浸式变压器故障诊断方法,其特征在于,所述故障诊断方法包括:
S1:从历史数据库中获取变压器故障样本和正常样本,通过气体分析法从样本中获取不同故障状态下和正常状态下对应的气体含量;
S2:对S1中的气体进行筛选,选择具备集中性和完整性的气体数据作为特征气体输入模型,并将特征气体对应的变压器状态进行整数编码作为模型训练的输出结果;
S3:对模型的输入数据和输出结果进行预处理,保留有效数据作为第一训练集;
S4:对第一训练集进行分层划分、样本合成平衡和标准化处理,获取第二训练集;
S5:将第二训练集输入XGBoost算法中进行训练和测试;
S6:通过宏平均后的准确率、召回率和F1得分对S5中训练和测试的结果进行变压器故障诊断。
2.根据权利要求1所述的故障诊断方法,其特征在于,所述S1中获取不同故障状态下和正常状态下的气体种类包括但不限于H2、CH4、C2H6、C2H4、C2H2、CO和CO2
3.根据权利要求2所述的故障诊断方法,其特征在于,所述S2中特征气体包括H2、CH4、C2H6、C2H4和C2H2
4.根据权利要求1所述的故障诊断方法,其特征在于,所述S2中变压器状态包括正常、局部放电、低能放电、高能放电、中低温过热和高温过热。
5.根据权利要求1所述的故障诊断方法,其特征在于,所述S3中数据预处理具体为:对数据中存在缺失值、极端值和/或负值的结果进行剔除,保留有效数据。
6.根据权利要求1所述的故障诊断方法,其特征在于,所述S4中分层划分具体为:以历史数据库中的变压器故障样本和正常样本的比例作为预设比例条件,对第一训练集进行同比例分层划分。
7.根据权利要求1所述的故障诊断方法,其特征在于,所述S4中样本合成平衡具体为:采用合成少数类样本方法SMOTE,对少数类样本进行识别分析并合成新的少数类样本。
8.根据权利要求1所述的故障诊断方法,其特征在于,所述S4中标准化处理具体为:对数据集进行标准化处理,标准化公式采用:
Figure FDA0003374904540000021
其中,x*表示标准化后的数据,x为原始数据,
Figure FDA0003374904540000022
和xstd分别为均值和标准差。
9.一种油浸式变压器故障诊断系统,用于完成任意一项如权利要求1-8所述的故障诊断方法,其特征在于,所述故障诊断系统包括:
数据获取模块,用于获取不同故障状态下和正常状态下对应的气体含量;
数据筛选模块,用于筛选具备集中性和完整性的气体作为特征气体输入模型,并将特征气体对应的变压器状态进行整数编码作为模型训练的输出结果;
数据预处理模块,用于对输入模型和输出结果进行预处理,保留有效数据作为第一训练集;
分层平衡和标准化模块,用于对第一训练集进行分层划分、样本合成平衡和标准化处理,获取第二训练集;
模型训练测试模块,用于将第二训练集输入XGBoost算法中进行训练和测试;
故障诊断模块,通过宏平均后的准确率、召回率和F1得分对模型训练测试模块的结果进行变压器故障诊断。
10.一种可读存储介质,包括:存储器,所述存储器存储有程序;处理器,所述处理器执行所述程序时实现如权利要求1至8中任一项所述的故障诊断方法。
CN202111414926.1A 2021-11-25 2021-11-25 油浸式变压器故障诊断方法、系统及可读存储介质 Pending CN114358116A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111414926.1A CN114358116A (zh) 2021-11-25 2021-11-25 油浸式变压器故障诊断方法、系统及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111414926.1A CN114358116A (zh) 2021-11-25 2021-11-25 油浸式变压器故障诊断方法、系统及可读存储介质

Publications (1)

Publication Number Publication Date
CN114358116A true CN114358116A (zh) 2022-04-15

Family

ID=81095602

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111414926.1A Pending CN114358116A (zh) 2021-11-25 2021-11-25 油浸式变压器故障诊断方法、系统及可读存储介质

Country Status (1)

Country Link
CN (1) CN114358116A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115267614A (zh) * 2022-06-02 2022-11-01 汇网电气有限公司 一种用于智能变压器的检测方法及系统
CN117668738A (zh) * 2024-01-31 2024-03-08 天津通安变压器有限公司 一种大型油浸式变压器的故障检测方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115267614A (zh) * 2022-06-02 2022-11-01 汇网电气有限公司 一种用于智能变压器的检测方法及系统
CN117668738A (zh) * 2024-01-31 2024-03-08 天津通安变压器有限公司 一种大型油浸式变压器的故障检测方法
CN117668738B (zh) * 2024-01-31 2024-05-10 天津通安变压器有限公司 一种大型油浸式变压器的故障检测方法

Similar Documents

Publication Publication Date Title
CN110929918B (zh) 一种基于CNN和LightGBM的10kV馈线故障预测方法
CN105117602B (zh) 一种计量装置运行状态预警方法
CN109164343B (zh) 基于特征信息量化与加权knn的变压器故障诊断方法
CN112116058B (zh) 一种基于粒子群算法优化多粒度级联森林模型的变压器故障诊断方法
CN110929847A (zh) 一种基于深度卷积神经网络的换流变压器故障诊断方法
CN112070128B (zh) 一种基于深度学习的变压器故障诊断方法
CN105677791B (zh) 用于分析风力发电机组的运行数据的方法和系统
CN109460618A (zh) 一种滚动轴承剩余寿命在线预测方法及系统
CN107784325A (zh) 基于数据驱动增量融合的螺旋式故障诊断模型
CN106021771A (zh) 一种故障诊断方法及装置
CN114358116A (zh) 油浸式变压器故障诊断方法、系统及可读存储介质
CN110837866A (zh) 基于XGBoost的电力二次设备缺陷程度评估方法
CN109000930A (zh) 一种基于堆叠去噪自编码器的涡轮发动机性能退化评估方法
CN106920007A (zh) 基于二阶自组织模糊神经网络的pm2.5智能预测方法
CN111539553A (zh) 基于svr算法和偏峰度的风电机组发电机故障预警方法
CN108876163A (zh) 综合因果分析与机器学习的暂态功角稳定快速评估方法
CN111797365B (zh) 一种换流变压器温度异常判断方法及系统
CN114065605A (zh) 一种智能电能表运行状态检测评估系统和方法
CN116842337A (zh) 基于LightGBM优选特征与COA-CNN模型的变压器故障诊断方法
CN107295537A (zh) 一种测评无线传感器网络可靠性的方法及系统
CN110705859A (zh) 基于pca-自组织神经网络的中低压配电网运行状态评估方法
CN111695288B (zh) 一种基于Apriori-BP算法的变压器故障诊断方法
CN112904810A (zh) 基于有效特征选择的流程工业非线性过程监测方法
CN111275204B (zh) 一种基于混合采样和集成学习的变压器状态识别方法
CN116562114A (zh) 一种基于图卷积神经网络的电力变压器故障诊断方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination