CN111340248A - 一种基于智能集成算法的变压器故障诊断方法及系统 - Google Patents

一种基于智能集成算法的变压器故障诊断方法及系统 Download PDF

Info

Publication number
CN111340248A
CN111340248A CN202010124440.3A CN202010124440A CN111340248A CN 111340248 A CN111340248 A CN 111340248A CN 202010124440 A CN202010124440 A CN 202010124440A CN 111340248 A CN111340248 A CN 111340248A
Authority
CN
China
Prior art keywords
algorithm
fault mode
diagnosis
fault
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010124440.3A
Other languages
English (en)
Inventor
王健一
程涣超
张书琦
汤浩
刘雪丽
汪可
王琳
赵晓林
赵志刚
孙建涛
遇心如
赵晓宇
徐征宇
邓俊宇
吴超
杨帆
梁宁川
吕晓露
李熙宁
谭瑞娟
李刚
李戈琦
高彬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
China Electric Power Research Institute Co Ltd CEPRI
Original Assignee
State Grid Corp of China SGCC
China Electric Power Research Institute Co Ltd CEPRI
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, China Electric Power Research Institute Co Ltd CEPRI filed Critical State Grid Corp of China SGCC
Priority to CN202010124440.3A priority Critical patent/CN111340248A/zh
Publication of CN111340248A publication Critical patent/CN111340248A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Supply And Distribution Of Alternating Current (AREA)

Abstract

本发明公开了一种基于智能集成算法的变压器故障诊断方法及系统,包括:对获取的油色谱数据进行预处理,并经过预处理的油色谱数据进行特征构建,以获取多个特征;分别确定不同类型的变压器故障诊断算法对应的输入特征;根据确定的不同类型的变压器故障诊断算法对应的输入特征,构建基于智能集成算法的变压器故障模式诊断模型;分别确定每个变压器故障模式诊断模型在每种故障模式下的故障诊断准确率,并根据故障诊断准确率确定每种故障模式对应的算法和各算法的权重;利用所述基于智能集成算法的变压器故障模式诊断模型对待诊断的油色谱数据进行诊断,确定故障模式结果,并根据所述故障模式结果中每种故障模式的优先级系数确定诊断结果。

Description

一种基于智能集成算法的变压器故障诊断方法及系统
技术领域
本发明涉及电力设备故障诊断技术领域,并且更具体地,涉及一种基于智能集成算法的变压器故障诊断方法及系统。
背景技术
近年来,电能在整个能源行业中的消耗比例逐年增长,保证电网的安全稳定运行是维持与促进经济发展的重要条件。变压器是电网中的重要装置,是实现电能变换、减少电能损耗的重要载体,及时发现其故障隐患、保证其安全运行可有效减少电网故障的发生概率。随着数据挖掘技术和机器学习技术的发展,配电变压器智能故障诊断技术开始逐步得到研究应用。采用支持向量机、神经网络和极限学习机等智能算法分析油色谱数据中的气体含量与故障类型的映射关系,模拟人类专家对变压器的运行状态和故障做出正确判断和决策。
但是现有的故障诊断方法的准确率不高。因此,为高效而准确地利用油色谱数据对变压器的故障模式进行诊断,需要一种基于智能集成算法的变压器故障诊断方法。
发明内容
本发明提出一种基于智能集成算法的变压器故障诊断方法及系统,以解决如何准确地确定变压器故障的问题。
为了解决上述问题,根据本发明的一个方面,提供了一种基于智能集成算法的变压器故障诊断方法,所述方法包括:
对获取的油色谱数据进行预处理,并经过预处理的油色谱数据进行特征构建,以获取多个特征;其中,所述油色谱数据包括:CH4、C2H4、C2H6、C2H2、H2、CO、CO2和总烃;
分别确定不同类型的变压器故障诊断算法对应的输入特征;
根据确定的不同类型的变压器故障诊断算法对应的输入特征,构建基于智能集成算法的变压器故障模式诊断模型;
对基于智能集成算法的变压器故障模式诊断模型进行训练,分别确定每个变压器故障模式诊断模型在每种故障模式下的故障诊断准确率,并根据故障诊断准确率确定每种故障模式对应的算法和各算法的权重;
利用所述基于智能集成算法的变压器故障模式诊断模型对待诊断的油色谱数据进行诊断,确定故障模式结果,并根据所述故障模式结果中每种故障模式的优先级系数确定诊断结果。
优选地,其中所述对获取的油色谱数据进行预处理,包括:
采用相似样本对获取的油色谱数据中缺失值少于预设个数的数据进行插补,以及
将获取的油色谱数据中缺失值大于预设个数的数据直接剔除。
优选地,其中所述分别确定不同类型的变压器故障诊断算法对应的输入特征,包括:
根据预设的经验数据确定第一类型算法对应的输入特征;其中,所述第一类型算法包括:三比值法、大卫三角形法和大卫五边形法;
基于基尼不纯度的特征选择方法,确定机器学习类型算法中的以决策树为基学习器的算法对应的输入特征;其中,所述以决策树为基学习器的算法,包括:随机森林RandomForest算法、梯度提升树XGBoost算法和分类提升树CatBoost算法;
基于Relief-F相关统计量的特征选择方法,确定机器学习类型算法中的与特征权重相关或为高复杂度的算法对应的输入特征;其中,所述与特征权重相关或为高复杂度的算法,包括:核支持向量机kernel-SVM算法、K近邻算法、神经网络Neural Network算法。
优选地,其中所述基于基尼不纯度的特征选择方法,确定机器学习类型算法中的以决策树为基学习器的算法对应的输入特征,包括:
分别对每个特征进行基尼Gini不纯度系数计算,在构建树模型时,选择基尼不纯度最小的特征作为最优划分特征,直至样本全部分类完成,将没有选中的特征剔除,并将剩余的特征作为所述机器学习算法中的以决策树为基学习器的算法对应的输入特征;其中,Gini不纯度系数IG(p)的计算公式为:
Figure BDA0002393992180000031
其中,D和Dv为总样本集和在特征j上样本值为jv的样本集合;V为特征j样本有V种取值;pk为样本属于第k类故障的概率;m表示故障类型数。
优选地,其中所述基于Relief-F相关统计量的特征选择方法,确定机器学习类型算法中的与特征权重相关或为高复杂度的算法对应的输入特征,包括:
分别计算所有特征的相关统计量,并按照降序顺序选择前预设阈值个数的特征作为所述机器学习算法中的与特征权重相关或为高复杂度的算法对应的输入特征;其中,特征j的相关统计量δj的计算公式为:
Figure BDA0002393992180000032
其中,
Figure BDA0002393992180000033
表示第i个样本在特征j上的取值,属于第k类;
Figure BDA0002393992180000034
表示与
Figure BDA0002393992180000035
同类型中的最近邻样本,属于第k类;
Figure BDA0002393992180000036
表示与
Figure BDA0002393992180000037
不同类型中的猜错最近邻样本,属于第l类;pl表示第l类样本占总样本集的比例;
Figure BDA0002393992180000038
表示样本
Figure BDA0002393992180000039
和同类型最近邻样本
Figure BDA00023939921800000310
在属性j上的距离。
优选地,其中所述根据确定的不同类型的变压器故障诊断算法对应的输入特征,构建基于智能集成算法的变压器故障模式诊断模型,包括:
利用三比值法对应的输入特征的编码组合和预设的三比值法故障模式判断规则,构建基于三比值的变压器故障模式诊断模型;
通过逻辑回归训练出的二分类边界优化三角形和五边形的设定边界,并构建基于逻辑回归改进的大卫三角形法和五边形的变压器故障模式诊断模型;
根据机器学习类型算法中不同算法对应的输入特征进行基模型的训练,分别构建基于随机森林算法、梯度提升树算法、分类提升树算法、核支持向量机算法、K近邻算法和神经网络算法的变压器故障模式诊断模型。
优选地,其中所述根据故障诊断准确率确定每种故障模式对应的算法和各算法的权重,包括:
对于每一种故障模式,分别筛选故障诊断准确率大于预设准确率阈值的算法,作为该故障模式对应的算法;
计算每种故障模式对应的算法的权重因子,包括:
Figure BDA0002393992180000041
其中,ωi为第i个算法在第故障模式j下的权重因子;accij表示第i个算法基模型在故障模式j下的准确率;m表示故障模式j对应的算法的个数。
优选地,其中所述根据所述故障模式结果中每种故障模式的优先级系数确定诊断结果,包括:
计算所述故障模式结果中每种故障模式的优先级系数,并选取最大的优先级系数对应的故障模式为诊断结果;其中,利用如下公式计算每种故障模式的优先级系数:
Figure BDA0002393992180000042
其中,Rj为故障模式j对应的优先级系数;Flagi表示第i个算法对应的变压器故障模式诊断模型得出的故障标签。
根据本发明的另一个方面,提供了一种基于智能集成算法的变压器故障诊断系统,所述系统包括:
特征获取单元,用于对获取的油色谱数据进行预处理,并经过预处理的油色谱数据进行特征构建,以获取多个特征;其中,所述油色谱数据包括:CH4、C2H4、C2H6、C2H2、H2、CO、CO2和总烃;
输入特征确定单元,用于分别确定不同类型的变压器故障诊断算法对应的输入特征;
变压器故障模式诊断模型构建单元,用于根据确定的不同类型的变压器故障诊断算法对应的输入特征,构建基于智能集成算法的变压器故障模式诊断模型;
故障模式对应的算法和权重确定单元,用于对基于智能集成算法的变压器故障模式诊断模型进行训练,分别确定每个变压器故障模式诊断模型在每种故障模式下的故障诊断准确率,并根据故障诊断准确率确定每种故障模式对应的算法和各算法的权重;
故障模式诊断单元,用于利用所述基于智能集成算法的变压器故障模式诊断模型对待诊断的油色谱数据进行诊断,确定故障模式结果,并根据所述故障模式结果中每种故障模式的优先级系数确定诊断结果。
优选地,其中所述特征获取单元,对获取的油色谱数据进行预处理,包括:
采用相似样本对获取的油色谱数据中缺失值少于预设个数的数据进行插补,以及
将获取的油色谱数据中缺失值大于预设个数的数据直接剔除。
优选地,其中所述输入特征确定单元,分别确定不同类型的变压器故障诊断算法对应的输入特征,包括:
根据预设的经验数据确定第一类型算法对应的输入特征;其中,所述第一类型算法包括:三比值法、大卫三角形法和大卫五边形法;
基于基尼不纯度的特征选择方法,确定机器学习类型算法中的以决策树为基学习器的算法对应的输入特征;其中,所述以决策树为基学习器的算法,包括:随机森林RandomForest算法、梯度提升树XGBoost算法和分类提升树CatBoost算法;
基于Relief-F相关统计量的特征选择方法,确定机器学习类型算法中的与特征权重相关或为高复杂度的算法对应的输入特征;其中,所述与特征权重相关或为高复杂度的算法,包括:核支持向量机kernel-SVM算法、K近邻算法、神经网络Neural Network算法。
优选地,其中所述输入特征确定单元,基于基尼不纯度的特征选择方法,确定机器学习类型算法中的以决策树为基学习器的算法对应的输入特征,包括:
分别对每个特征进行基尼Gini不纯度系数计算,在构建树模型时,选择基尼不纯度最小的特征作为最优划分特征,直至样本全部分类完成,将没有选中的特征剔除,并将剩余的特征作为所述机器学习算法中的以决策树为基学习器的算法对应的输入特征;其中,Gini不纯度系数IG(p)的计算公式为:
Figure BDA0002393992180000061
其中,D和Dv为总样本集和在特征j上样本值为jv的样本集合;V为特征j样本有V种取值;pk为样本属于第k类故障的概率;m表示故障类型数。
优选地,其中所述输入特征确定单元,基于Relief-F相关统计量的特征选择方法,确定机器学习类型算法中的与特征权重相关或为高复杂度的算法对应的输入特征,包括:
分别计算所有特征的相关统计量,并按照降序顺序选择前预设阈值个数的特征作为所述机器学习算法中的与特征权重相关或为高复杂度的算法对应的输入特征;其中,特征j的相关统计量δj的计算公式为:
Figure BDA0002393992180000062
其中,
Figure BDA0002393992180000063
表示第i个样本在特征j上的取值,属于第k类;
Figure BDA0002393992180000064
表示与
Figure BDA0002393992180000065
同类型中的最近邻样本,属于第k类;
Figure BDA0002393992180000066
表示与
Figure BDA0002393992180000067
不同类型中的猜错最近邻样本,属于第I类;pl表示第I类样本占总样本集的比例;
Figure BDA0002393992180000068
表示样本
Figure BDA0002393992180000069
和同类型最近邻样本
Figure BDA00023939921800000610
在属性j上的距离。
优选地,其中所述变压器故障模式诊断模型构建单元,根据确定的不同类型的变压器故障诊断算法对应的输入特征,构建基于智能集成算法的变压器故障模式诊断模型,包括:
利用三比值法对应的输入特征的编码组合和预设的三比值法故障模式判断规则,构建基于三比值的变压器故障模式诊断模型;
通过逻辑回归训练出的二分类边界优化三角形和五边形的设定边界,并构建基于逻辑回归改进的大卫三角形法和五边形的变压器故障模式诊断模型;
根据机器学习类型算法中不同算法对应的输入特征进行基模型的训练,分别构建基于随机森林算法、梯度提升树算法、分类提升树算法、核支持向量机算法、K近邻算法和神经网络算法的变压器故障模式诊断模型。
优选地,其中所述故障模式对应的算法和权重确定单元,根据故障诊断准确率确定每种故障模式对应的算法和各算法的权重,包括:
对于每一种故障模式,分别筛选故障诊断准确率大于预设准确率阈值的算法,作为该故障模式对应的算法;
计算每种故障模式对应的算法的权重因子,包括:
Figure BDA0002393992180000071
其中,ωi为第i个算法在第故障模式j下的权重因子;accij表示第i个算法基模型在故障模式j下的准确率;m表示故障模式j对应的算法的个数。
优选地,其中所述故障模式诊断单元,根据所述故障模式结果中每种故障模式的优先级系数确定诊断结果,包括:
计算所述故障模式结果中每种故障模式的优先级系数,并选取最大的优先级系数对应的故障模式为诊断结果;其中,利用如下公式计算每种故障模式的优先级系数:
Figure BDA0002393992180000072
其中,Rj为故障模式j对应的优先级系数;Flagi表示第i个算法对应的变压器故障模式诊断模型得出的故障标签。
本发明提供了一种基于智能集成算法的变压器故障诊断方法及系统,通过大数据分析技术对电网中变压器的故障模式进行诊断,为设备运行后的检修和预防提供了一定的参考本发明为了对现有算法和机器学习算法在诊断效果上的不足的考虑,决定优化输入的油色谱气体比值特征参量,在此基础上构建基于多种算法的智能集成算法的变压器故障诊断模型,以提高模型诊断的准确性和稳定性,该基于智能集成算法的变压器故障模式诊断方法的优点包括:(1)集成算法模型泛化能力好,准确率更高,对异常值的鲁棒性更强;(2)由于该诊断方法是第一类型算法和机器类型算法综合分析的产物,所以解释性较高。
附图说明
通过参考下面的附图,可以更为完整地理解本发明的示例性实施方式:
图1为根据本发明实施方式的基于智能集成算法的变压器故障诊断方法100的流程图;
图2为根据本发明实施方式的基于智能集成算法的变压器故障模式诊断模型的技术路线图;
图3为根据本发明实施方式的进行故障诊断的示意图;以及
图4为根据本发明实施方式的基于智能集成算法的变压器故障诊断系统400的结构示意图。
具体实施方式
现在参考附图介绍本发明的示例性实施方式,然而,本发明可以用许多不同的形式来实施,并且不局限于此处描述的实施例,提供这些实施例是为了详尽地且完全地公开本发明,并且向所属技术领域的技术人员充分传达本发明的范围。对于表示在附图中的示例性实施方式中的术语并不是对本发明的限定。在附图中,相同的单元/元件使用相同的附图标记。
除非另有说明,此处使用的术语(包括科技术语)对所属技术领域的技术人员具有通常的理解含义。另外,可以理解的是,以通常使用的词典限定的术语,应当被理解为与其相关领域的语境具有一致的含义,而不应该被理解为理想化的或过于正式的意义。
图1为根据本发明实施方式的基于智能集成算法的变压器故障诊断方法100的流程图。如图1所示,本发明实施方式提供的基于智能集成算法的变压器故障诊断方法,通过大数据分析技术对电网中变压器的故障模式进行诊断,为设备运行后的检修和预防提供了一定的参考,该基于智能集成算法的变压器故障模式诊断方法泛化能力好,准确率更高,对异常值的鲁棒性更强;由于该诊断方法是第一类型算法和机器类型算法综合分析的产物,所以解释性较高。本发明实施方式提供的基于智能集成算法的变压器故障诊断方法100从步骤101处开始,在步骤101对获取的油色谱数据进行预处理,并经过预处理的油色谱数据进行特征构建,以获取多个特征;其中,所述油色谱数据包括:CH4、C2H4、C2H6、C2H2、H2、CO、CO2和总烃。
优选地,其中所述对获取的油色谱数据进行预处理,包括:
采用相似样本对获取的油色谱数据中缺失值少于预设个数的数据进行插补,以及将获取的油色谱数据中缺失值大于预设个数的数据直接剔除。
在本发明的实施方式中,原始数据主要是指8种基本油色谱数据,包括:CH4、C2H4、C2H6、C2H2、H2、CO、CO2和总烃。在构建油色谱气体比值特征参量前,对数据进行缺失值处理,其中对于缺少少量缺失值的样本采用相似样本进行插补,对于缺失过多的样本直接剔除,已降低对模型诊断的影响。
在步骤102,分别确定不同类型的变压器故障诊断算法对应的输入特征。
优选地,其中所述分别确定不同类型的变压器故障诊断算法对应的输入特征,包括:
根据预设的经验数据确定第一类型算法对应的输入特征;其中,所述第一类型算法包括:三比值法、大卫三角形法和大卫五边形法;
基于基尼不纯度的特征选择方法,确定机器学习类型算法中的以决策树为基学习器的算法对应的输入特征;其中,所述以决策树为基学习器的算法,包括:随机森林RandomForest算法、梯度提升树XGBoost算法和分类提升树CatBoost算法;
基于Relief-F相关统计量的特征选择方法,确定机器学习类型算法中的与特征权重相关或为高复杂度的算法对应的输入特征;其中,所述与特征权重相关或为高复杂度的算法,包括:核支持向量机kernel-SVM算法、K近邻算法、神经网络Neural Network算法。
优选地,其中所述基于基尼不纯度的特征选择方法,确定机器学习类型算法中的以决策树为基学习器的算法对应的输入特征,包括:
分别对每个特征进行基尼Gini不纯度系数计算,在构建树模型时,选择基尼不纯度最小的特征作为最优划分特征,直至样本全部分类完成,将没有选中的特征剔除,并将剩余的特征作为所述机器学习算法中的以决策树为基学习器的算法对应的输入特征;其中,Gini不纯度系数IG(p)的计算公式为:
Figure BDA0002393992180000101
其中,D和Dv为总样本集和在特征j上样本值为jv的样本集合;V为特征j样本有V种取值;pk为样本属于第k类故障的概率;m表示故障类型数。
优选地,其中所述基于Relief-F相关统计量的特征选择方法,确定机器学习类型算法中的与特征权重相关或为高复杂度的算法对应的输入特征,包括:
分别计算所有特征的相关统计量,并按照降序顺序选择前预设阈值个数的特征作为所述机器学习算法中的与特征权重相关或为高复杂度的算法对应的输入特征;其中,特征j的相关统计量δj的计算公式为:
Figure BDA0002393992180000102
其中,
Figure BDA0002393992180000103
表示第i个样本在特征j上的取值,属于第k类;
Figure BDA0002393992180000104
表示与
Figure BDA0002393992180000105
同类型中的最近邻样本,属于第k类;
Figure BDA0002393992180000106
表示与
Figure BDA0002393992180000107
不同类型中的猜错最近邻样本,属于第l类;pl表示第l类样本占总样本集的比例;
Figure BDA0002393992180000108
表示样本
Figure BDA0002393992180000109
和同类型最近邻样本
Figure BDA00023939921800001010
在属性j上的距离。
图2为根据本发明实施方式的基于智能集成算法的变压器故障模式诊断模型的技术路线图。如图2所示,在本发明的实施方式中,构建的新特征包括第一类型算法(三比值、三角形法、五边形法等)特征17个,专家经验特征9个,合计34个数据特征,如表1所示。
表1全部特征集合(34个)
Figure BDA0002393992180000111
故障模式,分别为:低能放电、低能放电兼过热、低温过热、高能放电、高能放电兼过热、高温过热、局部放电、中温过热,在最终的模式诊断中将中温过热和低温过热合并为中低温过热,因此,共7种。
在确定变压器油色谱故障诊断模型的特征时,对于变压器故障诊断第一类型算法来说,通过经验选择特征。第一类型算法包括:三比值法、大卫三角形法和大卫五边形法。
三比值的输入特征为:C2H2/C2H4、CH4/H2和C2H4/C2H6
大卫三角形法输入特征为:CH4/(CH4+C2H4+C2H2)、C2H4/(CH4+C2H4+C2H2)、C2H2/(CH4+C2H4+C2H2)、CH4/(CH4+C2H6+H2)、C2H6/(CH4+C2H6+H2)、H2/(CH4+C2H6+H2)和C2H6/(CH4+C2H4+C2H6)。
大卫五边形法的输入特征为:CH4/氢烃总量、C2H4/氢烃总量、C2H6/氢烃总量、C2H2/氢烃总量和H2/氢烃总量。
对于机器学习类型算法来说,机器学习类型算法包括:随机森林(RandomForest)、梯度提升树(XGBoost)、分类提升树(CatBoost)、核支持向量机(kernel-SVM)、K近邻(K-NN)和神经网络(Neural Network)。为了提升模型计算效率,减少模型过拟合风险,增强其泛化性能,提高故障诊断的准确率,需要进行特征选择和优化。针对不同的机器学习算法采用不同的特征选择方法对所有特征量进行优化选择;最后根据优选的特征量作为对应算法的输入进行变压器故障诊断分析。具体方法如下:
a.基于基尼不纯度的特征选择算法
主要针对随机森林(Random Forest)、梯度提升树(XGBoost)、分类提升树(CatBoost)这一类以决策树为基学习器的算法,对每个特征进行Gini不纯度系数计算,以此确定树结构的最优切分点,Gini不纯度系数IG(p)的计算公式如下:
Figure BDA0002393992180000121
其中:D和Dv表示总样本集和在特征j上样本值为jv的样本集合;V表示特征j样本有V种取值;pk表示样本属于第k类故障的概率;m表示故障类别数。
在构建树模型时,选择基尼不纯度最小的特征作为最优划分特征,直至样本全部分类完成,没有选中的特征则剔除。
b.基于Relief-F相关统计量的特征选择算法
主要针对核支持向量机(kernel-SVM)、K近邻(K-NN)、神经网络(Neural Network)这一类对特征含有权重或计算复杂度较高算法,能够优化特征规模,找出分类能力最强的特征子集。特征j的相关统计量δj计算公式如下:
Figure BDA0002393992180000122
其中,
Figure BDA0002393992180000123
表示第i个样本在特征j上的取值,属于第k类;
Figure BDA0002393992180000124
表示与
Figure BDA0002393992180000125
同类别中的最近邻样本,属于第k类;
Figure BDA0002393992180000126
表示与
Figure BDA0002393992180000127
不同类别中的猜错最近邻样本,属于第I类;p/表示第I类样本占总样本集的比例;
Figure BDA0002393992180000128
表示样本
Figure BDA0002393992180000129
和同类别最近邻样本
Figure BDA00023939921800001210
在属性j上的距离;
在本发明的实施方式中,分别计算出34个特征的相关统计量并进行排序,选择前29个特征(占总特征量的85%)作为后续模型的输入。其中,对于选择特征的个数可以根据实际情况进行自定义设置。
在步骤103,根据确定的不同类型的变压器故障诊断算法对应的输入特征,构建基于智能集成算法的变压器故障模式诊断模型。
优选地,其中所述根据确定的不同类型的变压器故障诊断算法对应的输入特征,构建基于智能集成算法的变压器故障模式诊断模型,包括:
利用三比值法对应的输入特征的编码组合和预设的三比值法故障模式判断规则,构建基于三比值的变压器故障模式诊断模型;
通过逻辑回归训练出的二分类边界优化三角形和五边形的设定边界,并构建基于逻辑回归改进的大卫三角形法和五边形的变压器故障模式诊断模型;
根据机器学习类型算法中不同算法对应的输入特征进行基模型的训练,分别构建基于随机森林算法、梯度提升树算法、分类提升树算法、核支持向量机算法、K近邻算法和神经网络算法的变压器故障模式诊断模型。
本发明实施方式的基于智能集成算法的变压器故障模式诊断模型的构建,包括:
1)基于三比值的变压器故障模式诊断模型的构建;
利用五种气体(CH4、C2H4、C2H6、C2H2、H2)的三对比值(C2H2/C2H4、CH4/H2和C2H4/C2H6)的编码组合来实现对变压器故障模式的诊断。其中,三比值的编码规则如表2所示;三比值法故障模式判断方法如表3所示。
表2三比值编码规则
Figure BDA0002393992180000131
表3三比值法故障类型(模式)判断方法
Figure BDA0002393992180000132
Figure BDA0002393992180000141
2)基于逻辑回归改进的大卫三角形法和五边形的变压器故障模式诊断模型的构建;
通过逻辑回归(Logistics Regression)训练出的二分类边界优化三角形和五边形的设定边界,改进后的三角形和五边形的区域边界如表4和表5所示。
表4改进大卫三角形区域边界
Figure BDA0002393992180000142
表5改进大卫五边形区域边界
Figure BDA0002393992180000143
3)基于机器学习类型算法的变压器故障模式诊断模型构建;
分别采用随机森林(Random Forest)、梯度提升树(XGBoost)、分类提升树(CatBoost)、核支持向量机(kernel-SVM)、K近邻(K-NN)和神经网络(Neural Network)算法构建故障诊断基模型,即在特征选择的基础上训练基模型。然后统计各个基模型在7种故障模式下的诊断准确率作为后续综合评估权重的设定准则。
在步骤104,对基于智能集成算法的变压器故障模式诊断模型进行训练,分别确定每个变压器故障模式诊断模型在每种故障模式下的故障诊断准确率,并根据故障诊断准确率确定每种故障模式对应的算法和各算法的权重。
优选地,其中所述根据故障诊断准确率确定每种故障模式对应的算法和各算法的权重,包括:
对于每一种故障模式,分别筛选故障诊断准确率大于预设准确率阈值的算法,作为该故障模式对应的算法;
计算每种故障模式对应的算法的权重因子,包括:
Figure BDA0002393992180000151
其中,ωi为第i个算法在第故障模式j下的权重因子;accij表示第i个算法基模型在故障模式j下的准确率;m表示故障模式j对应的算法的个数。
在本发明的实施方式中,根据训练集数据分别训练第一类型算法中3个算法和机器学习类型算法中6个算法的基模型,并计算在7种故障模式下的故障诊断准确率,根据准确率筛选算法,给出权重占比。具体地,包括:
(1)在7种故障模式下,筛选9个基模型中准确率大于70%的算法,筛选结果如表6所示;
(2)计算每种故障模式j中,筛选出的算法的权重因子ωi,各算法权重因子如表7所示,公式如下:
Figure BDA0002393992180000161
其中,ωi为第i个算法在第故障模式j下的权重因子;accij表示第i个算法基模型在故障模式j下的准确率;m表示故障模式j对应的算法的个数。
表6算法筛选结果
故障模式 算法
低能放电 随机森林、XGBoost、Catboost、大卫三角形
低能放电兼过热 随机森林、XGBoost、Catboost、KNN、大卫五边形
高能放电 随机森林、XGBoost、Catboost、kernel-SVM、三比值、神经网络
高能放电兼过热 XGBoost、随机森林、Catboost、三比值
高温过热 XGBoost、随机森林、大卫五边形、三比值、KNN
中低温过热 Catboost、随机森林、XGBoost、三比值
局部放电 XGBoost、随机森林、大卫五边形、三比值、KNN
表7各算法的权重因子
Figure BDA0002393992180000162
在步骤105,利用所述基于智能集成算法的变压器故障模式诊断模型对待诊断的油色谱数据进行诊断,确定故障模式结果,并根据所述故障模式结果中每种故障模式的优先级系数确定诊断结果。
优选地,其中所述根据所述故障模式结果中每种故障模式的优先级系数确定诊断结果,包括:
计算所述故障模式结果中每种故障模式的优先级系数,并选取最大的优先级系数对应的故障模式为诊断结果;其中,利用如下公式计算每种故障模式的优先级系数:
Figure BDA0002393992180000171
其中,Rj为故障模式j对应的优先级系数;Flagi表示第i个算法对应的变压器故障模式诊断模型得出的故障标签。
图3为根据本发明实施方式的进行故障诊断的示意图。如图3所示,在进行故障模式诊断时,在输入层确定匹配参数,并在计算层进行故障诊断,最后将输出结果在输出层展示。
例如,采用上述9种诊断算法对一条油色谱数据样本进行诊断,得到诊断结果分别为:{中低温过热、中低温过热、高温过热、高温过热、高温过热、高温过热、高温过热、中低温过热、中低温过热},即诊断结果出现两种不同的诊断结论:{“高温过热”}和{“中低温过热”}。则针对该油色谱数据,利用优先级系数的计算公式,可以得出如下结论:
“高温过热”状态的优先级系数为:
R高温过热=0*1+0.2122*1+0.2052*1+0.2122*1+0.1978*1=0.8274;
“中低温过热”状态的优先级系数为:
R中低温过热=0.2087*1+0*1+0*1+0*1=0.2087
可以发现“高温过热”状态的优先级系数R高温过热大于“中低温过热”状态的优先级系数R中低温过热,因此,对于该条油色谱数据的最终诊断结论为“高温过热”。并且原故障状态也为“高温过热”,说明诊断正确,充分表明该融合思路的可行性以及集成算法的准确性和稳定性。
在本发明的实施方式中,通过统计分析,得到基于智能集成算法的诊断准确率,如表8所示。
表8智能集成算法诊断准确率
Figure BDA0002393992180000172
Figure BDA0002393992180000181
经过测试以及统计发现,智能集成算法的准确率高达94.83%,充分说明了该集成算法的准确性和稳定性。
图4为根据本发明实施方式的基于智能集成算法的变压器故障诊断系统400的结构示意图。如图4所示,本发明实施方式提供的基于智能集成算法的变压器故障诊断系统400,包括:特征获取单元401、输入特征确定单元402、变压器故障模式诊断模型构建单元403、故障模式对应的算法和权重确定单元404和故障模式诊断单元405。
优选地,所述特征获取单元401,用于对获取的油色谱数据进行预处理,并经过预处理的油色谱数据进行特征构建,以获取多个特征;其中,所述油色谱数据包括:CH4、C2H4、C2H6、C2H2、H2、CO、CO2和总烃。
优选地,其中所述特征获取单元401,对获取的油色谱数据进行预处理,包括:采用相似样本对获取的油色谱数据中缺失值少于预设个数的数据进行插补,以及将获取的油色谱数据中缺失值大于预设个数的数据直接剔除。
优选地,所述输入特征确定单元402,用于分别确定不同类型的变压器故障诊断算法对应的输入特征。
优选地,其中所述输入特征确定单元402,分别确定不同类型的变压器故障诊断算法对应的输入特征,包括:
根据预设的经验数据确定第一类型算法对应的输入特征;其中,所述第一类型算法包括:三比值法、大卫三角形法和大卫五边形法;
基于基尼不纯度的特征选择方法,确定机器学习类型算法中的以决策树为基学习器的算法对应的输入特征;其中,所述以决策树为基学习器的算法,包括:随机森林RandomForest算法、梯度提升树XGBoost算法和分类提升树CatBoost算法;
基于Relief-F相关统计量的特征选择方法,确定机器学习类型算法中的与特征权重相关或为高复杂度的算法对应的输入特征;其中,所述与特征权重相关或为高复杂度的算法,包括:核支持向量机kernel-SVM算法、K近邻算法、神经网络Neural Network算法。
优选地,其中所述输入特征确定单元402,基于基尼不纯度的特征选择方法,确定机器学习类型算法中的以决策树为基学习器的算法对应的输入特征,包括:
分别对每个特征进行基尼Gini不纯度系数计算,在构建树模型时,选择基尼不纯度最小的特征作为最优划分特征,直至样本全部分类完成,将没有选中的特征剔除,并将剩余的特征作为所述机器学习算法中的以决策树为基学习器的算法对应的输入特征;其中,Gini不纯度系数IG(p)的计算公式为:
Figure BDA0002393992180000191
其中,D和Dv为总样本集和在特征j上样本值为jv的样本集合;V为特征j样本有V种取值;pk为样本属于第k类故障的概率;m表示故障类型数。
优选地,其中所述输入特征确定单元402,基于Relief-F相关统计量的特征选择方法,确定机器学习类型算法中的与特征权重相关或为高复杂度的算法对应的输入特征,包括:
分别计算所有特征的相关统计量,并按照降序顺序选择前预设阈值个数的特征作为所述机器学习算法中的与特征权重相关或为高复杂度的算法对应的输入特征;其中,特征j的相关统计量δj的计算公式为:
Figure BDA0002393992180000192
其中,
Figure BDA0002393992180000193
表示第i个样本在特征j上的取值,属于第k类;
Figure BDA0002393992180000194
表示与
Figure BDA0002393992180000195
同类型中的最近邻样本,属于第k类;
Figure BDA0002393992180000196
表示与
Figure BDA0002393992180000197
不同类型中的猜错最近邻样本,属于第l类;pl表示第l类样本占总样本集的比例;
Figure BDA0002393992180000198
表示样本
Figure BDA0002393992180000199
和同类型最近邻样本
Figure BDA00023939921800001910
在属性j上的距离。
优选地,所述变压器故障模式诊断模型构建单元403,用于根据确定的不同类型的变压器故障诊断算法对应的输入特征,构建基于智能集成算法的变压器故障模式诊断模型。
优选地,其中所述变压器故障模式诊断模型构建单元403,根据确定的不同类型的变压器故障诊断算法对应的输入特征,构建基于智能集成算法的变压器故障模式诊断模型,包括:
利用三比值法对应的输入特征的编码组合和预设的三比值法故障模式判断规则,构建基于三比值的变压器故障模式诊断模型;
通过逻辑回归训练出的二分类边界优化三角形和五边形的设定边界,并构建基于逻辑回归改进的大卫三角形法和五边形的变压器故障模式诊断模型;
根据机器学习类型算法中不同算法对应的输入特征进行基模型的训练,分别构建基于随机森林算法、梯度提升树算法、分类提升树算法、核支持向量机算法、K近邻算法和神经网络算法的变压器故障模式诊断模型。
优选地,所述故障模式对应的算法和权重确定单元404,用于对基于智能集成算法的变压器故障模式诊断模型进行训练,分别确定每个变压器故障模式诊断模型在每种故障模式下的故障诊断准确率,并根据故障诊断准确率确定每种故障模式对应的算法和各算法的权重。
优选地,其中所述故障模式对应的算法和权重确定单元404,根据故障诊断准确率确定每种故障模式对应的算法和各算法的权重,包括:
对于每一种故障模式,分别筛选故障诊断准确率大于预设准确率阈值的算法,作为该故障模式对应的算法;
计算每种故障模式对应的算法的权重因子,包括:
Figure BDA0002393992180000201
其中,ωi为第i个算法在第故障模式j下的权重因子;accij表示第i个算法基模型在故障模式j下的准确率;m表示故障模式j对应的算法的个数。
优选地,所述故障模式诊断单元405,用于利用所述基于智能集成算法的变压器故障模式诊断模型对待诊断的油色谱数据进行诊断,确定故障模式结果,并根据所述故障模式结果中每种故障模式的优先级系数确定诊断结果。
优选地,其中所述故障模式诊断单元405,根据所述故障模式结果中每种故障模式的优先级系数确定诊断结果,包括:
计算所述故障模式结果中每种故障模式的优先级系数,并选取最大的优先级系数对应的故障模式为诊断结果;其中,利用如下公式计算每种故障模式的优先级系数:
Figure BDA0002393992180000211
其中,Rj为故障模式j对应的优先级系数;Flagi表示第i个算法对应的变压器故障模式诊断模型得出的故障标签。
本发明的实施例的基于智能集成算法的变压器故障诊断系统400与本发明的另一个实施例的基于智能集成算法的变压器故障诊断方法100相对应,在此不再赘述。
已经通过参考少量实施方式描述了本发明。然而,本领域技术人员所公知的,正如附带的专利权利要求所限定的,除了本发明以上公开的其他的实施例等同地落在本发明的范围内。
通常地,在权利要求中使用的所有术语都根据他们在技术领域的通常含义被解释,除非在其中被另外明确地定义。所有的参考“一个/所述/该[装置、组件等]”都被开放地解释为所述装置、组件等中的至少一个实例,除非另外明确地说明。这里公开的任何方法的步骤都没必要以公开的准确的顺序运行,除非明确地说明。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。

Claims (16)

1.一种基于智能集成算法的变压器故障诊断方法,其特征在于,所述方法包括:
对获取的油色谱数据进行预处理,并经过预处理的油色谱数据进行特征构建,以获取多个特征;其中,所述油色谱数据包括:CH4、C2H4、C2H6、C2H2、H2、CO、CO2和总烃;
分别确定不同类型的变压器故障诊断算法对应的输入特征;
根据确定的不同类型的变压器故障诊断算法对应的输入特征,构建基于智能集成算法的变压器故障模式诊断模型;
对基于智能集成算法的变压器故障模式诊断模型进行训练,分别确定每个变压器故障模式诊断模型在每种故障模式下的故障诊断准确率,并根据故障诊断准确率确定每种故障模式对应的算法和各算法的权重;
利用所述基于智能集成算法的变压器故障模式诊断模型对待诊断的油色谱数据进行诊断,确定故障模式结果,并根据所述故障模式结果中每种故障模式的优先级系数确定诊断结果。
2.根据权利要求1所述的方法,其特征在于,所述对获取的油色谱数据进行预处理,包括:
采用相似样本对获取的油色谱数据中缺失值少于预设个数的数据进行插补,以及
将获取的油色谱数据中缺失值大于预设个数的数据直接剔除。
3.根据权利要求1所述的方法,其特征在于,所述分别确定不同类型的变压器故障诊断算法对应的输入特征,包括:
根据预设的经验数据确定第一类型算法对应的输入特征;其中,所述第一类型算法包括:三比值法、大卫三角形法和大卫五边形法;
基于基尼不纯度的特征选择方法,确定机器学习类型算法中的以决策树为基学习器的算法对应的输入特征;其中,所述以决策树为基学习器的算法,包括:随机森林RandomForest算法、梯度提升树XGBoost算法和分类提升树CatBoost算法;
基于Relief-F相关统计量的特征选择方法,确定机器学习类型算法中的与特征权重相关或为高复杂度的算法对应的输入特征;其中,所述与特征权重相关或为高复杂度的算法,包括:核支持向量机kernel-SVM算法、K近邻算法、神经网络Neural Network算法。
4.根据权利要求3所述的方法,其特征在于,所述基于基尼不纯度的特征选择方法,确定机器学习类型算法中的以决策树为基学习器的算法对应的输入特征,包括:
分别对每个特征进行基尼Gini不纯度系数计算,在构建树模型时,选择基尼不纯度最小的特征作为最优划分特征,直至样本全部分类完成,将没有选中的特征剔除,并将剩余的特征作为所述机器学习算法中的以决策树为基学习器的算法对应的输入特征;其中,Gini不纯度系数IG(p)的计算公式为:
Figure FDA0002393992170000021
其中,D和Dv为总样本集和在特征j上样本值为jv的样本集合;V为特征j样本有V种取值;pk为样本属于第k类故障的概率;m表示故障类型数。
5.根据权利要求3所述的方法,其特征在于,所述基于Relief-F相关统计量的特征选择方法,确定机器学习类型算法中的与特征权重相关或为高复杂度的算法对应的输入特征,包括:
分别计算所有特征的相关统计量,并按照降序顺序选择前预设阈值个数的特征作为所述机器学习算法中的与特征权重相关或为高复杂度的算法对应的输入特征;其中,特征j的相关统计量δj的计算公式为:
Figure FDA0002393992170000022
其中,
Figure FDA0002393992170000023
表示第i个样本在特征j上的取值,属于第k类;
Figure FDA0002393992170000024
表示与
Figure FDA0002393992170000031
同类型中的最近邻样本,属于第k类;
Figure FDA0002393992170000032
表示与
Figure FDA0002393992170000033
不同类型中的猜错最近邻样本,属于第l类;pl表示第l类样本占总样本集的比例;
Figure FDA0002393992170000034
表示样本
Figure FDA0002393992170000035
和同类型最近邻样本
Figure FDA0002393992170000036
在属性j上的距离。
6.根据权利要求3所述的方法,其特征在于,所述根据确定的不同类型的变压器故障诊断算法对应的输入特征,构建基于智能集成算法的变压器故障模式诊断模型,包括:
利用三比值法对应的输入特征的编码组合和预设的三比值法故障模式判断规则,构建基于三比值的变压器故障模式诊断模型;
通过逻辑回归训练出的二分类边界优化三角形和五边形的设定边界,并构建基于逻辑回归改进的大卫三角形法和五边形的变压器故障模式诊断模型;
根据机器学习类型算法中不同算法对应的输入特征进行基模型的训练,分别构建基于随机森林算法、梯度提升树算法、分类提升树算法、核支持向量机算法、K近邻算法和神经网络算法的变压器故障模式诊断模型。
7.根据权利要求1所述的方法,其特征在于,所述根据故障诊断准确率确定每种故障模式对应的算法和各算法的权重,包括:
对于每一种故障模式,分别筛选故障诊断准确率大于预设准确率阈值的算法,作为该故障模式对应的算法;
计算每种故障模式对应的算法的权重因子,包括:
Figure FDA0002393992170000037
其中,ωi为第i个算法在第故障模式j下的权重因子;accij表示第i个算法基模型在故障模式j下的准确率;m表示故障模式j对应的算法的个数。
8.根据权利要求1所述的方法,其特征在于,所述根据所述故障模式结果中每种故障模式的优先级系数确定诊断结果,包括:
计算所述故障模式结果中每种故障模式的优先级系数,并选取最大的优先级系数对应的故障模式为诊断结果;其中,利用如下公式计算每种故障模式的优先级系数:
Figure FDA0002393992170000041
其中,Rj为故障模式j对应的优先级系数;Flagi表示第i个算法对应的变压器故障模式诊断模型得出的故障标签。
9.一种基于智能集成算法的变压器故障诊断系统,其特征在于,所述系统包括:
特征获取单元,用于对获取的油色谱数据进行预处理,并经过预处理的油色谱数据进行特征构建,以获取多个特征;其中,所述油色谱数据包括:CH4、C2H4、C2H6、C2H2、H2、CO、CO2和总烃;
输入特征确定单元,用于分别确定不同类型的变压器故障诊断算法对应的输入特征;
变压器故障模式诊断模型构建单元,用于根据确定的不同类型的变压器故障诊断算法对应的输入特征,构建基于智能集成算法的变压器故障模式诊断模型;
故障模式对应的算法和权重确定单元,用于对基于智能集成算法的变压器故障模式诊断模型进行训练,分别确定每个变压器故障模式诊断模型在每种故障模式下的故障诊断准确率,并根据故障诊断准确率确定每种故障模式对应的算法和各算法的权重;
故障模式诊断单元,用于利用所述基于智能集成算法的变压器故障模式诊断模型对待诊断的油色谱数据进行诊断,确定故障模式结果,并根据所述故障模式结果中每种故障模式的优先级系数确定诊断结果。
10.根据权利要求9所述的系统,其特征在于,所述特征获取单元,对获取的油色谱数据进行预处理,包括:
采用相似样本对获取的油色谱数据中缺失值少于预设个数的数据进行插补,以及
将获取的油色谱数据中缺失值大于预设个数的数据直接剔除。
11.根据权利要求9所述的系统,其特征在于,所述输入特征确定单元,分别确定不同类型的变压器故障诊断算法对应的输入特征,包括:
根据预设的经验数据确定第一类型算法对应的输入特征;其中,所述第一类型算法包括:三比值法、大卫三角形法和大卫五边形法;
基于基尼不纯度的特征选择方法,确定机器学习类型算法中的以决策树为基学习器的算法对应的输入特征;其中,所述以决策树为基学习器的算法,包括:随机森林RandomForest算法、梯度提升树XGBoost算法和分类提升树CatBoost算法;
基于Relief-F相关统计量的特征选择方法,确定机器学习类型算法中的与特征权重相关或为高复杂度的算法对应的输入特征;其中,所述与特征权重相关或为高复杂度的算法,包括:核支持向量机kernel-SVM算法、K近邻算法、神经网络Neural Network算法。
12.根据权利要求11所述的系统,其特征在于,所述输入特征确定单元,基于基尼不纯度的特征选择方法,确定机器学习类型算法中的以决策树为基学习器的算法对应的输入特征,包括:
分别对每个特征进行基尼Gini不纯度系数计算,在构建树模型时,选择基尼不纯度最小的特征作为最优划分特征,直至样本全部分类完成,将没有选中的特征剔除,并将剩余的特征作为所述机器学习算法中的以决策树为基学习器的算法对应的输入特征;其中,Gini不纯度系数IG(p)的计算公式为:
Figure FDA0002393992170000051
其中,D和Dv为总样本集和在特征j上样本值为jv的样本集合;V为特征j样本有V种取值;pk为样本属于第k类故障的概率;m表示故障类型数。
13.根据权利要求11所述的系统,其特征在于,所述输入特征确定单元,基于Relief-F相关统计量的特征选择方法,确定机器学习类型算法中的与特征权重相关或为高复杂度的算法对应的输入特征,包括:
分别计算所有特征的相关统计量,并按照降序顺序选择前预设阈值个数的特征作为所述机器学习算法中的与特征权重相关或为高复杂度的算法对应的输入特征;其中,特征j的相关统计量δj的计算公式为:
Figure FDA0002393992170000061
其中,
Figure FDA0002393992170000062
表示第i个样本在特征j上的取值,属于第k类;
Figure FDA0002393992170000063
表示与
Figure FDA0002393992170000064
同类型中的最近邻样本,属于第k类;
Figure FDA0002393992170000065
表示与
Figure FDA0002393992170000066
不同类型中的猜错最近邻样本,属于第l类;pl表示第l类样本占总样本集的比例;
Figure FDA0002393992170000067
表示样本
Figure FDA0002393992170000068
和同类型最近邻样本
Figure FDA0002393992170000069
在属性j上的距离。
14.根据权利要求11所述的系统,其特征在于,所述变压器故障模式诊断模型构建单元,根据确定的不同类型的变压器故障诊断算法对应的输入特征,构建基于智能集成算法的变压器故障模式诊断模型,包括:
利用三比值法对应的输入特征的编码组合和预设的三比值法故障模式判断规则,构建基于三比值的变压器故障模式诊断模型;
通过逻辑回归训练出的二分类边界优化三角形和五边形的设定边界,并构建基于逻辑回归改进的大卫三角形法和五边形的变压器故障模式诊断模型;
根据机器学习类型算法中不同算法对应的输入特征进行基模型的训练,分别构建基于随机森林算法、梯度提升树算法、分类提升树算法、核支持向量机算法、K近邻算法和神经网络算法的变压器故障模式诊断模型。
15.根据权利要求9所述的系统,其特征在于,所述故障模式对应的算法和权重确定单元,根据故障诊断准确率确定每种故障模式对应的算法和各算法的权重,包括:
对于每一种故障模式,分别筛选故障诊断准确率大于预设准确率阈值的算法,作为该故障模式对应的算法;
计算每种故障模式对应的算法的权重因子,包括:
Figure FDA0002393992170000071
其中,ωi为第i个算法在第故障模式j下的权重因子;accij表示第i个算法基模型在故障模式j下的准确率;m表示故障模式j对应的算法的个数。
16.根据权利要求9所述的系统,其特征在于,所述故障模式诊断单元,根据所述故障模式结果中每种故障模式的优先级系数确定诊断结果,包括:
计算所述故障模式结果中每种故障模式的优先级系数,并选取最大的优先级系数对应的故障模式为诊断结果;其中,利用如下公式计算每种故障模式的优先级系数:
Figure FDA0002393992170000072
其中,Rj为故障模式j对应的优先级系数;Flagi表示第i个算法对应的变压器故障模式诊断模型得出的故障标签。
CN202010124440.3A 2020-02-27 2020-02-27 一种基于智能集成算法的变压器故障诊断方法及系统 Pending CN111340248A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010124440.3A CN111340248A (zh) 2020-02-27 2020-02-27 一种基于智能集成算法的变压器故障诊断方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010124440.3A CN111340248A (zh) 2020-02-27 2020-02-27 一种基于智能集成算法的变压器故障诊断方法及系统

Publications (1)

Publication Number Publication Date
CN111340248A true CN111340248A (zh) 2020-06-26

Family

ID=71185641

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010124440.3A Pending CN111340248A (zh) 2020-02-27 2020-02-27 一种基于智能集成算法的变压器故障诊断方法及系统

Country Status (1)

Country Link
CN (1) CN111340248A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112183590A (zh) * 2020-09-14 2021-01-05 浙江大学 一种基于OneclassSVM算法的变压器故障诊断方法
CN112733878A (zh) * 2020-12-08 2021-04-30 国网辽宁省电力有限公司锦州供电公司 一种基于kmeans-SVM算法的变压器故障诊断方法
CN113009293A (zh) * 2021-02-25 2021-06-22 重庆大学 应用油中特征气体参量辨识混合绝缘油变压器故障的方法
CN113343581A (zh) * 2021-06-28 2021-09-03 山东华科信息技术有限公司 基于图马尔可夫神经网络的变压器故障的诊断方法
CN113702728A (zh) * 2021-07-12 2021-11-26 广东工业大学 一种基于组合采样和LightGBM的变压器故障诊断方法及系统
CN117560267A (zh) * 2024-01-11 2024-02-13 南京邮电大学 一种多模场域网的故障诊断方法及快速恢复方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112183590A (zh) * 2020-09-14 2021-01-05 浙江大学 一种基于OneclassSVM算法的变压器故障诊断方法
CN112733878A (zh) * 2020-12-08 2021-04-30 国网辽宁省电力有限公司锦州供电公司 一种基于kmeans-SVM算法的变压器故障诊断方法
CN113009293A (zh) * 2021-02-25 2021-06-22 重庆大学 应用油中特征气体参量辨识混合绝缘油变压器故障的方法
CN113343581A (zh) * 2021-06-28 2021-09-03 山东华科信息技术有限公司 基于图马尔可夫神经网络的变压器故障的诊断方法
CN113343581B (zh) * 2021-06-28 2022-11-11 山东华科信息技术有限公司 基于图马尔可夫神经网络的变压器故障的诊断方法
CN113702728A (zh) * 2021-07-12 2021-11-26 广东工业大学 一种基于组合采样和LightGBM的变压器故障诊断方法及系统
CN117560267A (zh) * 2024-01-11 2024-02-13 南京邮电大学 一种多模场域网的故障诊断方法及快速恢复方法
CN117560267B (zh) * 2024-01-11 2024-03-26 南京邮电大学 一种多模场域网的故障诊断方法及快速恢复方法

Similar Documents

Publication Publication Date Title
CN111340248A (zh) 一种基于智能集成算法的变压器故障诊断方法及系统
CN111337768B (zh) 变压器油中溶解气体的深度并行故障诊断方法及系统
CN110348615B (zh) 基于蚁群优化支持向量机的电缆线路故障概率预测方法
CN110929847A (zh) 一种基于深度卷积神经网络的换流变压器故障诊断方法
CN106897821A (zh) 一种暂态评估特征选择方法及装置
CN111722046A (zh) 一种基于深度森林模型的变压器故障诊断方法
CN112147432A (zh) 基于注意力机制的BiLSTM模块、变压器状态诊断方法和系统
CN106597154B (zh) 基于dag-svm的变压器故障诊断提升方法
CN111695288B (zh) 一种基于Apriori-BP算法的变压器故障诊断方法
CN116842337A (zh) 基于LightGBM优选特征与COA-CNN模型的变压器故障诊断方法
CN114416707A (zh) 工业时序数据的自动化特征工程方法和装置
CN115018512A (zh) 基于Transformer神经网络的窃电检测方法及装置
CN117113166A (zh) 一种基于改进的集成学习的工业锅炉故障检测方法
CN114358116A (zh) 油浸式变压器故障诊断方法、系统及可读存储介质
CN110826587B (zh) 基于改进的加权一类支持向量机的涡轴发动机故障检测方法
CN112380763A (zh) 一种基于数据挖掘的堆内构件可靠性分析系统及方法
CN115729761B (zh) 一种硬盘故障预测方法、系统、设备及介质
CN111880957A (zh) 一种基于随机森林模型的程序错误定位方法
CN116992362A (zh) 一种基于夏普利值的变压器故障表征特征量筛选方法和装置
Huan et al. River dissolved oxygen prediction based on random forest and LSTM
CN116664928A (zh) 一种基于CNN与Transformer的糖尿病视网膜病变分级方法与系统
CN116224950A (zh) 面向无人生产线自组织重构的智能故障诊断方法和系统
CN109886288A (zh) 一种用于电力变压器的状态评价方法及装置
CN109977030A (zh) 一种深度随机森林程序的测试方法及设备
CN109342862A (zh) 基于非监督聚类与和svm分类的变压器故障诊断方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination