CN110927478B - 一种确定电力系统变压器设备的状态的方法和系统 - Google Patents

一种确定电力系统变压器设备的状态的方法和系统 Download PDF

Info

Publication number
CN110927478B
CN110927478B CN201911017379.6A CN201911017379A CN110927478B CN 110927478 B CN110927478 B CN 110927478B CN 201911017379 A CN201911017379 A CN 201911017379A CN 110927478 B CN110927478 B CN 110927478B
Authority
CN
China
Prior art keywords
state
initial
value
determining
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911017379.6A
Other languages
English (en)
Other versions
CN110927478A (zh
Inventor
张书琦
王健一
程涣超
汪可
刘雪丽
遇心如
孙建涛
赵志刚
汤浩
吴超
赵晓宇
赵晓林
王琳
徐征宇
杨帆
梁宁川
吕晓露
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
China Electric Power Research Institute Co Ltd CEPRI
Original Assignee
State Grid Corp of China SGCC
China Electric Power Research Institute Co Ltd CEPRI
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, China Electric Power Research Institute Co Ltd CEPRI filed Critical State Grid Corp of China SGCC
Priority to CN201911017379.6A priority Critical patent/CN110927478B/zh
Publication of CN110927478A publication Critical patent/CN110927478A/zh
Application granted granted Critical
Publication of CN110927478B publication Critical patent/CN110927478B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01RMEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
    • G01R31/00Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/15Correlation function computation including computation of convolution operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Testing Relating To Insulation (AREA)
  • Supply And Distribution Of Alternating Current (AREA)

Abstract

本发明提供一种确定电力系统变压器设备的状态的方法和系统。所述方法和系统通过对采集的确定电力系统变压器设备的状态的N种气体的特征值数据进行处理后,生成有效样本集,按照预先设置的比例对有效样本集进行分配,生成训练集和测试集;根据建立的logistic回归模型,以及训练集和测试集确定最优logistic分类器,并利用所述最优logistic分类器,根据变压器设备的实际运行中的N种气体的特征值数据,输出电力系统变压器的状态。所述方法利用正样本合成算法,对模型的精准度有一定的提升,而且模型对数据的要求较低,对于海量的变压器气体特征值的分析能力较强,能够较好地实现分类,进而对变压器的运行状态做出判断。

Description

一种确定电力系统变压器设备的状态的方法和系统
技术领域
本发明涉及电力设备监控领域,并且更具体地,涉及一种确定电力系统变压器设备的状态的方法和系统。
背景技术
传统的电力设备检修方法主要基于对设备的油中溶解气体的组分和含量进行分析的油中溶解气体分析方法(Dissolved Gas Analysis,DGA)。近年来,大量的学者们将各种大数据分析的方法广泛运用于电力设备的状态检修工作中,取得了较好的成果。主要的方法为:BP神经网络、模糊聚类、随机森林和支持向量机等非参数的方法,此类方法在一定程度上极大地提升了状态评价的准确性,但结果还是相对比较模糊,无法显示表现各气体组分与电力设备之间存在的相关性。
发明内容
为了解决现有技术中电力设备检修方法的结果相对模糊,无法显示表现各气体组分与电力设备之间存在的相关性的技术问题,本发明提供一种确定电力系统变压器设备的状态的方法,所述方法包括:
采集若干组确定电力系统变压器设备的状态的N种气体的特征值数据,生成初始样本集,其中,所述变压器设备的状态包括正常和异常;
对初始样本集中的数据进行缺失值和异常值处理,并对所述初始样本集中的正样本进行正样本合成,建立有效样本集,其中,所述缺失值是样本中缺失的N种气体的特征值,异常值是预先设置的N种气体特征值的极端值;
按照预先设置的比例对有效样本集进行分配,生成训练集和测试集;
建立以变压器的状态为响应变量,以N种气体的特征值数据为解释变量的logistic回归模型;
基于训练集和设置的所述回归模型的误差限值,确定所述logistic回归模型的回归参数,生成确定变压器设备的状态的第一初始logistic分类器;
基于训练集,采用交叉验证法对所述第一初始logistic分类器进行训练和测试,生成确定变压器设备的状态的第二原始logistic分类器;
基于测试集和确定变压器设备的状态的第二原始logistic分类器,生成确定变压器设备的状态的最优logistic分类器;
基于确定的最优logistic分类器,根据变压器设备的实际运行中的N种气体的特征值数据,输出电力系统变压器的状态。
进一步地,所述对初始样本集中的数据进行缺失值和异常值处理,并对所述初始样本集中的正样本进行正样本合成,建立有效样本集包括:
去除原始样本集中存在无效数据的样本,其中,所述无效数据是指一组样本中有n个缺失值和/或异常值;
当一组样本中存在小于n个的缺失值和/或异常值时,采用邻近均值法替代所述样本中的缺失值和/或异常值;
对于原始样本集中的正样本,采用SMOTE过采样算法进行正样本合成,生成新的正样本;
将新的正样本加入原始样本集中,形成有效样本集。
进一步地,所述建立以变压器的状态为响应变量,以N种气体的特征值数据为解释变量的logistic回归模型,所述logistic回归模型的表达式为:
Figure BDA0002246131000000021
式中,p表示设备处于正常状态时的概率,Y为变压器设备的状态,1表示正常,X为模型的输入,即所述有效样本集中N种气体的特征值数据,β为回归系数,β0为截距项,其中,所述β0的设置的常数,β的初始值为随机设定的值;
当训练集的样本数据为m时,其目标函数为:
Figure BDA0002246131000000031
采用最小二乘法或者梯度下降法确定使所述目标函数最小的回归系数β。
进一步地,所述基于训练集和设置的所述回归模型的误差限值,确定所述logistic回归模型的回归参数,生成确定变压器设备的状态的第一初始logistic分类器包括:
步骤1、引入sigmoid函数将所述训练集中的连续化的数值离散化;
步骤2、将所述β的初始值代入logistic回归模型hβ(x)进行训练;
步骤3、根据所述训练的误差小于设置的误差限值时的回归参数β的值,生成确定变压器设备的状态的第一初始logistic分类器;
步骤4、当所述训练的误差大于等于设置的误差限值时,采用最小二乘法或者梯度下降法调整回归参数β,并返回步骤2。
进一步地,所述基于训练集,采用交叉验证法优化回归参数,生成确定变压器设备的状态的最优logistic分类器是指采用随机抽样的方法将训练集中的一部分作为测试集,其余的部分作为新的训练集,构建logistic回归模型,并求解所述logistic回归模型的平均误差,将最小平均误差所对应的logistic回归模型作为最优logistic分类器。
根据本发明的另一方面,本发明提供一种确定电力系统变压器设备的状态的系统,所述系统包括:
初始样本单元,其用于采集若干组确定电力系统变压器设备的状态的N种气体的特征值数据,生成初始样本集,其中,所述变压器设备的状态包括正常和异常;
有效样本单元,其用于对初始样本集中的数据进行缺失值和异常值处理,并对所述初始样本集中的正样本进行正样本合成,建立有效样本集,其中,所述缺失值是样本中缺失的N种气体的特征值,异常值是预先设置的N种气体特征值的极端值;
样本分配单元,其用于按照预先设置的比例对有效样本集进行分配,生成训练集和测试集;
模型建立单元,其用于建立以变压器的状态为响应变量,以N种气体的特征值数据为解释变量的logistic回归模型;
初始模型单元,其用于基于训练集和设置的所述回归模型的误差限值,确定所述logistic回归模型的回归参数,生成确定变压器设备的状态的第一初始logistic分类器,以及基于训练集,采用交叉验证法对所述第一初始logistic分类器进行训练和测试,生成确定变压器设备的状态的第二原始logistic分类器;
最优模型单元,其用于基于测试集和确定变压器设备的状态的第二原始logistic分类器,生成确定变压器设备的状态的最优logistic分类器;
状态确定单元,其用于基于确定的最优logistic分类器,根据变压器设备的实际运行中的N种气体的特征值数据,输出电力系统变压器的状态。
进一步地,所述有效样本单元包括:
第一处理单元,其用于去除原始样本集中存在无效数据的样本,其中,所述无效数据是指一组样本中有n个缺失值和/或异常值;
第二处理单元,其用于当一组样本中存在小于n个的缺失值和/或异常值时,采用邻近均值法替代所述样本中的缺失值和/或异常值;
第三处理单元,其用于对于原始样本集中的正样本,采用SMOTE过采样算法进行正样本合成,生成新的正样本;
样本合并单元,其用于将新的正样本加入原始样本集中,形成有效样本集。
进一步地,所述模型建立单元确定的logistic回归模型的表达式为:
Figure BDA0002246131000000041
式中,p表示设备处于正常状态时的概率,Y为变压器设备的状态,1表示正常,X为模型的输入,即所述有效样本集中N种气体的特征值数据,β为回归系数,β0为截距项,其中,所述β0的设置的常数,β的初始值为随机设定的值;
当训练集的样本数据为m时,其目标函数为:
Figure BDA0002246131000000051
采用最小二乘法或者梯度下降法确定使所述目标函数最小的回归系数β。
进一步地,所述初始模型单元基于训练集和设置的所述回归模型的误差限值,确定所述logistic回归模型的回归参数,生成确定变压器设备的状态的第一初始logistic分类器包括:
步骤1、引入sigmoid函数将所述训练集中的连续化的数值离散化;
步骤2、将所述β的初始值代入logistic回归模型hβ(x)进行训练;
步骤3、根据所述训练的误差小于设置的误差限值时的回归参数β的值,生成确定变压器设备的状态的第一初始logistic分类器;
步骤4、当所述训练的误差大于等于设置的误差限值时,采用最小二乘法或者梯度下降法调整回归参数β,并返回步骤2。
进一步地,所述最优模型单元基于训练集,采用交叉验证法优化回归参数,生成确定变压器设备的状态的最优logistic分类器是指采用随机抽样的方法将训练集中的一部分作为测试集,其余的部分作为新的训练集,构建logistic回归模型,并求解所述logistic回归模型的平均误差,将最小平均误差所对应的logistic回归模型作为最优logistic分类器。
本发明技术方案提供的确定电力系统变压器设备的状态的方法和系统通过对采集的确定电力系统变压器设备的状态的N种气体的特征值数据进行处理后,生成有效样本集,按照预先设置的比例对有效样本集进行分配,生成训练集和测试集;根据建立的logistic回归模型,以及训练集和测试集确定最优logistic分类器,并利用所述最优logistic分类器,根据变压器设备的实际运行中的N种气体的特征值数据,输出电力系统变压器的状态。本发明所述的确定电力系统变压器设备的状态的方法和系统采用logistic回归模型对设备的运行状态进行评价,其有益效果为:
首先,利用正样本合成算法,解决了实际生产信息化系统中的数据缺失严重、类别不平衡问题,对模型的精准度有一定的提升;
其次,logistic模型较其他分类模型而言,能够较好地处理二分类问题,并且可以极大程度上避免模型的“过拟合”,同时该模型可以显示表达回归方程,也即模型的可解释能力较强;
最后,在实际应用中,模型易于实现,对数据的要求较低,对于海量的变压器气体特征值的分析能力较强,能够较好地实现分类,进而对变压器的运行状态做出判断。
附图说明
通过参考下面的附图,可以更为完整地理解本发明的示例性实施方式:
图1为根据本发明优选实施方式的确定电力系统变压器设备的状态的方法的流程图;
图2为根据本发明优选实施方式的确定电力系统变压器设备的状态的系统的结构示意图。
具体实施方式
现在参考附图介绍本发明的示例性实施方式,然而,本发明可以用许多不同的形式来实施,并且不局限于此处描述的实施例,提供这些实施例是为了详尽地且完全地公开本发明,并且向所属技术领域的技术人员充分传达本发明的范围。对于表示在附图中的示例性实施方式中的术语并不是对本发明的限定。在附图中,相同的单元/元件使用相同的附图标记。
除非另有说明,此处使用的术语(包括科技术语)对所属技术领域的技术人员具有通常的理解含义。另外,可以理解的是,以通常使用的词典限定的术语,应当被理解为与其相关领域的语境具有一致的含义,而不应该被理解为理想化的或过于正式的意义。
图1为根据本发明优选实施方式的确定电力系统变压器设备的状态的方法的流程图。如图1所示,本优选实施方式所述的确定电力系统变压器设备的状态的方法100从步骤101开始。
在步骤101,采集若干组确定电力系统变压器设备的状态的N种气体的特征值数据,生成初始样本集,其中,所述变压器设备的状态包括正常和异常。
在本优选实施方式中,所述气体一共8种,分别是CH4、C2H6、C2H4、C2H2、H2、CO、CO2
在步骤102,对初始样本集中的数据进行缺失值和异常值处理,并对所述初始样本集中的正样本进行正样本合成,建立有效样本集,其中,所述缺失值是样本中缺失的N种气体的特征值,异常值是预先设置的N种气体特征值的极端值。
在实际应用中,由于目前在线监测装置在传回数据时具有不稳定性,所述数据中会存在缺失值和异常值。至于变压器工作异常本身就是一个绝对稀少的小概率事件,对正样本进行合成,构建数量均衡的样本,对建立准确的评估模型意义重大。
优选地,所述对初始样本集中的数据进行缺失值和异常值处理,并对所述初始样本集中的正样本进行正样本合成,建立有效样本集包括:
去除原始样本集中存在无效数据的样本,其中,所述无效数据是指一组样本中有n个缺失值和/或异常值;
当一组样本中存在小于n个的缺失值和/或异常值时,采用邻近均值法替代所述样本中的缺失值和/或异常值;
对于原始样本集中的正样本,采用SMOTE过采样算法进行正样本合成,生成新的正样本;
将新的正样本加入原始样本集中,形成有效样本集。
在本优选实施方式中,采用SMOTE算法合成新的正样本的策略是对每个正样本a,从它的最近邻中随机选一个样本b,然后在a、b之间的连线上随机选一点作为新合成的正样本。
具体步骤如下:
1、对于每一个正样本a,以欧氏距离为标准计算它到少数类样本集中所有样本的距离,得到其k近邻。
2、根据样本不平衡比例设置一个采样比例以确定采样倍率N,对于每一个正样本a,从其k近邻中随机选择若干个样本,假设选择的近邻为b。
3、对于每一个随机选出的近邻b,分别与原样本a按照如下的公式构建新的样本:c=a+rand(0,1)*|a-b|。
在步骤103,按照预先设置的比例对有效样本集进行分配,生成训练集和测试集。通常设置的比例为7:3,或者8:2。
在步骤104,建立以变压器的状态为响应变量,以N种气体的特征值数据为解释变量的logistic回归模型。
优选地,所述建立以变压器的状态为响应变量,以N种气体的特征值数据为解释变量的logistic回归模型,所述logistic回归模型的表达式为:
Figure BDA0002246131000000081
式中,p表示设备处于正常状态时的概率,Y为变压器设备的状态,1表示正常,X为模型的输入,即所述有效样本集中N种气体的特征值数据,β为回归系数,β0为截距项,其中,所述β0是预先设置的常数,β的初始值为随机设定的值;
当训练集的样本数据为m时,其目标函数为:
Figure BDA0002246131000000082
采用最小二乘法或者梯度下降法确定使所述目标函数最小的回归系数β。
在步骤105,基于训练集和设置的所述回归模型的误差限值,确定所述logistic回归模型的回归参数,生成确定变压器设备的状态的第一初始logistic分类器。
优选地,所述基于训练集和设置的所述回归模型的误差限值,确定所述logistic回归模型的回归参数,生成确定变压器设备的状态的第一初始logistic分类器包括:
步骤1、引入sigmoid函数将所述训练集中的连续化的数值离散化;
步骤2、将所述β的初始值代入logistic回归模型hβ(x)进行训练;
步骤3、根据所述训练的误差小于设置的误差限值时的回归参数β的值,生成确定变压器设备的状态的第一初始logistic分类器;
步骤4、当所述训练的误差大于等于设置的误差限值时,采用最小二乘法或者梯度下降法调整回归参数β,并返回步骤2。
Logistic回归处理二分类问题的实质就是对数据集建立回归公式,进而实现分类。为了更好的实现分类,引入sigmoid函数将连续化的数值离散化,这样的计算结果只会是[0,1]之间的值,故将0.5以上的归为一类,0.5以下的归为一类。其核心问题就是分类器的训练,也即最优回归参数的确定,实质上就是根据已知的数据(训练集)确定一个使得目标函数的值最小的a(参数向量/回归系数)的过程。
在步骤106,基于训练集,采用交叉验证法对所述第一初始logistic分类器进行训练和测试,生成确定变压器设备的状态的第二原始logistic分类器。
优选地,所述基于训练集,采用交叉验证法优化回归参数,生成确定变压器设备的状态的最优logistic分类器是指采用随机抽样的方法将训练集中的一部分作为测试集,其余的部分作为新的训练集,构建logistic回归模型,并求解所述logistic回归模型的平均误差,将最小平均误差所对应的logistic回归模型作为最优logistic分类器。
在步骤107,基于测试集和确定变压器设备的状态的第二原始logistic分类器,生成确定变压器设备的状态的最优logistic分类器。
一般情况下可以利用logistic分类器的整体正确率来对模型的预测性能进行评价,但是,作为一个分类任务,我们更需要关注的是该模型在每种类别上的预测能力,所以采用FPR(特异度)和TPR(灵敏度)对模型的分类效果做一个综合评价,一个好的分类器,灵敏度应接近1,特异度应接近0。
基于logistic回归模型确定变压器的设备状态的混淆矩阵如表1所示:
表1混淆矩阵
Figure BDA0002246131000000101
基于混淆矩阵,可以计算模型的特异度和灵敏度,公式分别为:
Figure BDA0002246131000000102
Figure BDA0002246131000000103
本发明所述的最优logistic分类器充分考虑模型的泛化能力和稳定性,并采用交叉验证方法避免“欠拟合”问题,通过校核,最优logistic分类器预测的准确率为86.25%,召回率(TPR)为94.29%。
在步骤108,基于确定的最优logistic分类器,根据变压器设备的实际运行中的N种气体的特征值数据,输出电力系统变压器的状态。
图2为根据本发明优选实施方式的确定电力系统变压器设备的状态的系统的结构示意图。如图2所示,本优选实施方式所述的确定电力系统变压器设备的系统200包括:
初始样本单元201,其用于采集若干组确定电力系统变压器设备的状态的种气体的特征值数据,生成初始样本集,其中,所述变压器设备的状态包括正常和异常;
有效样本单元202,其用于对初始样本集中的数据进行缺失值和异常值处理,并对所述初始样本集中的正样本进行正样本合成,建立有效样本集,其中,所述缺失值是样本中缺失的种气体的特征值,异常值是预先设置的种气体特征值的极端值;
样本分配单元203,其用于按照预先设置的比例对有效样本集进行分配,生成训练集和测试集;
模型建立单元204,其用于建立以变压器的状态为响应变量,以种气体的特征值数据为解释变量的logistic回归模型;
初始模型单元205,其用于基于训练集和设置的所述回归模型的误差限值,确定所述logistic回归模型的回归参数,生成确定变压器设备的状态的第一初始logistic分类器,以及基于训练集,采用交叉验证法对所述第一初始logistic分类器进行训练和测试,生成确定变压器设备的状态的第二原始logistic分类器;
最优模型单元206,其用于基于测试集和确定变压器设备的状态的第二原始logistic分类器,生成确定变压器设备的状态的最优logistic分类器;
状态确定单元207,其用于基于确定的最优logistic分类器,根据变压器设备的实际运行中的种气体的特征值数据,输出电力系统变压器的状态。
优选地,所述有效样本单元202包括:
第一处理单元221,其用于去除原始样本集中存在无效数据的样本,其中,所述无效数据是指一组样本中有个缺失值和/或异常值;
第二处理单元222,其用于当一组样本中存在小于个的缺失值和/或异常值时,采用邻近均值法替代所述样本中的缺失值和/或异常值;
第三处理单元223,其用于对于原始样本集中的正样本,采用SMOTE过采样算法进行正样本合成,生成新的正样本;
样本合并单元224,其用于将新的正样本加入原始样本集中,形成有效样本集。
优选地,所述模型建立单元204确定的logistic回归模型的表达式为:
Figure BDA0002246131000000111
式中,p表示设备处于正常状态时的概率,Y为变压器设备的状态,1表示正常,X为模型的输入,即所述有效样本集中N种气体的特征值数据,β为回归系数,β0为截距项,其中,所述β0的设置的常数,β的初始值为随机设定的值;
当训练集的样本数据为m时,其目标函数为:
Figure BDA0002246131000000121
采用最小二乘法或者梯度下降法确定使所述目标函数最小的回归系数β。
优选地,所述初始模型单元205基于训练集和设置的所述回归模型的误差限值,确定所述logistic回归模型的回归参数,生成确定变压器设备的状态的第一初始logistic分类器包括:
步骤1、引入sigmoid函数将所述训练集中的连续化的数值离散化;
步骤2、将所述的初始值代入logistic回归模型进行训练;
步骤3、根据所述训练的误差小于设置的误差限值时的回归参数的值,生成确定变压器设备的状态的第一初始logistic分类器;
步骤4、当所述训练的误差大于等于设置的误差限值时,采用最小二乘法或者梯度下降法调整回归参数,并返回步骤2。
优选地,所述最优模型单元206基于训练集,采用交叉验证法优化回归参数,生成确定变压器设备的状态的最优logistic分类器是指采用随机抽样的方法将训练集中的一部分作为测试集,其余的部分作为新的训练集,构建logistic回归模型,并求解所述logistic回归模型的平均误差,将最小平均误差所对应的logistic回归模型作为最优logistic分类器。
本发明所述确定电力系统变压器设备的状态的系统确定电力系统变压器设备的状态的步骤与本发明所述确定电力系统变压器设备的状态的方法的步骤相同,并且达到的技术效果也相同,此处不再赘述。
已经通过参考少量实施方式描述了本发明。然而,本领域技术人员所公知的,正如附带的专利权利要求所限定的,除了本发明以上公开的其他的实施例等同地落在本发明的范围内。
通常地,在权利要求中使用的所有术语都根据他们在技术领域的通常含义被解释,除非在其中被另外明确地定义。所有的参考“一个/所述/该[装置、组件等]”都被开放地解释为所述装置、组件等中的至少一个实例,除非另外明确地说明。这里公开的任何方法的步骤都没必要以公开的准确的顺序运行,除非明确地说明。

Claims (10)

1.一种确定电力系统变压器设备的状态的方法,其特征在于,所述方法包括:
采集若干组确定电力系统变压器设备的状态的
Figure DEST_PATH_IMAGE001
种气体的特征值数据,生成初始样本集,其中,所述变压器设备的状态包括正常和异常;
对初始样本集中的数据进行缺失值和异常值处理,并对所述初始样本集中的正样本进行正样本合成,建立有效样本集,其中,所述缺失值是样本中缺失的
Figure 708136DEST_PATH_IMAGE001
种气体的特征值,异常值是预先设置的
Figure 461328DEST_PATH_IMAGE001
种气体特征值的极端值;
按照预先设置的比例对有效样本集进行分配,生成训练集和测试集;
建立以变压器的状态为响应变量,以
Figure 591964DEST_PATH_IMAGE001
种气体的特征值数据为解释变量的logistic回归模型;
基于训练集和设置的所述回归模型的误差限值,确定所述logistic回归模型的回归参数,生成确定变压器设备的状态的第一初始logistic分类器;
基于训练集,采用交叉验证法对所述第一初始logistic分类器进行训练和测试,生成确定变压器设备的状态的第二原始logistic分类器;
基于测试集和确定变压器设备的状态的第二原始logistic分类器,生成确定变压器设备的状态的最优logistic分类器;
基于确定的最优logistic分类器,根据变压器设备的实际运行中的
Figure 823225DEST_PATH_IMAGE001
种气体的特征值数据,输出电力系统变压器的状态。
2.根据权利要求1所述的方法,其特征在于,所述对初始样本集中的数据进行缺失值和异常值处理,并对所述初始样本集中的正样本进行正样本合成,建立有效样本集包括:
去除原始样本集中存在无效数据的样本,其中,所述无效数据是指一组样本中有
Figure 739229DEST_PATH_IMAGE002
个缺失值和/或异常值;
当一组样本中存在小于
Figure 384361DEST_PATH_IMAGE002
个的缺失值和/或异常值时,采用邻近均值法替代所述样本中的缺失值和/或异常值;
对于原始样本集中的正样本,采用SMOTE过采样算法进行正样本合成,生成新的正样本;
将新的正样本加入原始样本集中,形成有效样本集。
3.根据权利要求1所述的方法,其特征在于,所述logistic回归模型的表达式为:
Figure 753026DEST_PATH_IMAGE004
式中,
Figure DEST_PATH_IMAGE005
表示设备处于正常状态时的概率,
Figure 256819DEST_PATH_IMAGE006
为变压器设备的状态,1表示正常,
Figure DEST_PATH_IMAGE007
为模型的输入,即所述有效样本集中
Figure 745438DEST_PATH_IMAGE001
种气体的特征值数据,
Figure 309275DEST_PATH_IMAGE008
为回归系数,
Figure DEST_PATH_IMAGE009
为截距项,其中,所述
Figure 617765DEST_PATH_IMAGE009
的值为设置的常数,
Figure 456408DEST_PATH_IMAGE008
的初始值为随机设定的值;
当训练集的样本数据为
Figure 550266DEST_PATH_IMAGE010
组时,其目标函数为:
Figure DEST_PATH_IMAGE011
采用最小二乘法或者梯度下降法确定使所述目标函数最小的回归系数
Figure 534272DEST_PATH_IMAGE012
4.根据权利要求3所述的方法,其特征在于,所述基于训练集和设置的所述回归模型的误差限值,确定所述logistic回归模型的回归参数,生成确定变压器设备的状态的第一初始logistic分类器包括:
步骤1、引入sigmoid函数将所述训练集中的连续化的数值离散化;
步骤2、将所述
Figure 346370DEST_PATH_IMAGE008
的初始值代入logistic回归模型
Figure DEST_PATH_IMAGE013
进行训练;
步骤3、根据所述训练的误差小于设置的误差限值时的回归参数
Figure 709743DEST_PATH_IMAGE008
的值,生成确定变压器设备的状态的第一初始logistic分类器;
步骤4、当所述训练的误差大于等于设置的误差限值时,采用最小二乘法或者梯度下降法调整回归参数
Figure 189265DEST_PATH_IMAGE008
,并返回步骤2。
5.根据权利要求1所述的方法,其特征在于,基于训练集,采用交叉验证法对所述第一初始logistic分类器进行训练和测试,生成确定变压器设备的状态的第二原始logistic分类器是指采用随机抽样的方法将训练集中的一部分作为测试集,其余的部分作为新的训练集,求解所述第一初始logistic分类器的平均误差,将最小平均误差所对应的第一初始logistic分类器作为第二原始logistic分类器。
6.一种确定电力系统变压器设备的状态的系统,其特征在于,所述系统包括:
初始样本单元,其用于采集若干组确定电力系统变压器设备的状态的
Figure 360484DEST_PATH_IMAGE001
种气体的特征值数据,生成初始样本集,其中,所述变压器设备的状态包括正常和异常;
有效样本单元,其用于对初始样本集中的数据进行缺失值和异常值处理,并对所述初始样本集中的正样本进行正样本合成,建立有效样本集,其中,所述缺失值是样本中缺失的
Figure 174725DEST_PATH_IMAGE001
种气体的特征值,异常值是预先设置的
Figure 89591DEST_PATH_IMAGE001
种气体特征值的极端值;
样本分配单元,其用于按照预先设置的比例对有效样本集进行分配,生成训练集和测试集;
模型建立单元,其用于建立以变压器的状态为响应变量,以
Figure 158041DEST_PATH_IMAGE001
种气体的特征值数据为解释变量的logistic回归模型;
初始模型单元,其用于基于训练集和设置的所述回归模型的误差限值,确定所述logistic回归模型的回归参数,生成确定变压器设备的状态的第一初始logistic分类器,以及基于训练集,采用交叉验证法对所述第一初始logistic分类器进行训练和测试,生成确定变压器设备的状态的第二原始logistic分类器;
最优模型单元,其用于基于测试集和确定变压器设备的状态的第二原始logistic分类器,生成确定变压器设备的状态的最优logistic分类器;
状态确定单元,其用于基于确定的最优logistic分类器,根据变压器设备的实际运行中的
Figure 15008DEST_PATH_IMAGE001
种气体的特征值数据,输出电力系统变压器的状态。
7.根据权利要求6所述的系统,其特征在于,所述有效样本单元包括:
第一处理单元,其用于去除原始样本集中存在无效数据的样本,其中,所述无效数据是指一组样本中有
Figure 67277DEST_PATH_IMAGE002
个缺失值和/或异常值;
第二处理单元,其用于当一组样本中存在小于
Figure 520256DEST_PATH_IMAGE002
个的缺失值和/或异常值时,采用邻近均值法替代所述样本中的缺失值和/或异常值;
第三处理单元,其用于对于原始样本集中的正样本,采用SMOTE过采样算法进行正样本合成,生成新的正样本;
样本合并单元,其用于将新的正样本加入原始样本集中,形成有效样本集。
8.根据权利要求6所述的系统,其特征在于,所述模型建立单元确定的logistic回归模型的表达式为:
Figure 223638DEST_PATH_IMAGE014
式中,
Figure 2238DEST_PATH_IMAGE005
表示设备处于正常状态时的概率,
Figure 276225DEST_PATH_IMAGE006
为变压器设备的状态,1表示正常,
Figure 64052DEST_PATH_IMAGE007
为模型的输入,即所述有效样本集中
Figure 359292DEST_PATH_IMAGE001
种气体的特征值数据,
Figure 574373DEST_PATH_IMAGE008
为回归系数,
Figure 70076DEST_PATH_IMAGE009
为截距项,其中,所述
Figure 661594DEST_PATH_IMAGE009
的值为设置的常数,
Figure 808411DEST_PATH_IMAGE008
的初始值为随机设定的值;
当训练集的样本数据为
Figure 194393DEST_PATH_IMAGE010
组时,其目标函数为:
Figure 442972DEST_PATH_IMAGE011
采用最小二乘法或者梯度下降法确定使所述目标函数最小的回归系数
Figure 307022DEST_PATH_IMAGE012
9.根据权利要求8所述的系统,其特征在于,所述初始模型单元基于训练集和设置的所述回归模型的误差限值,确定所述logistic回归模型的回归参数,生成确定变压器设备的状态的第一初始logistic分类器包括:
步骤1、引入sigmoid函数将所述训练集中的连续化的数值离散化;
步骤2、将所述
Figure 573924DEST_PATH_IMAGE008
的初始值代入logistic回归模型
Figure 130808DEST_PATH_IMAGE013
进行训练;
步骤3、根据所述训练的误差小于设置的误差限值时的回归参数
Figure 601103DEST_PATH_IMAGE008
的值,生成确定变压器设备的状态的第一初始logistic分类器;
步骤4、当所述训练的误差大于等于设置的误差限值时,采用最小二乘法或者梯度下降法调整回归参数
Figure 534424DEST_PATH_IMAGE008
,并返回步骤2。
10.根据权利要求6所述的系统,其特征在于,所述初始模型单元基于训练集,采用交叉验证法对所述第一初始logistic分类器进行训练和测试,生成确定变压器设备的状态的第二原始logistic分类器是指采用随机抽样的方法将训练集中的一部分作为测试集,其余的部分作为新的训练集,求解所述第一初始logistic分类器的平均误差,将最小平均误差所对应的第一初始logistic分类器作为第二原始logistic分类器。
CN201911017379.6A 2019-10-24 2019-10-24 一种确定电力系统变压器设备的状态的方法和系统 Active CN110927478B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911017379.6A CN110927478B (zh) 2019-10-24 2019-10-24 一种确定电力系统变压器设备的状态的方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911017379.6A CN110927478B (zh) 2019-10-24 2019-10-24 一种确定电力系统变压器设备的状态的方法和系统

Publications (2)

Publication Number Publication Date
CN110927478A CN110927478A (zh) 2020-03-27
CN110927478B true CN110927478B (zh) 2022-11-08

Family

ID=69849404

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911017379.6A Active CN110927478B (zh) 2019-10-24 2019-10-24 一种确定电力系统变压器设备的状态的方法和系统

Country Status (1)

Country Link
CN (1) CN110927478B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111723342B (zh) * 2020-06-22 2023-11-07 杭州电力设备制造有限公司 一种基于弹性网络回归模型的变压器顶层油温预测方法
CN112766537B (zh) * 2020-12-24 2023-06-06 沈阳工程学院 一种短期电负荷预测方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104535865A (zh) * 2014-12-30 2015-04-22 西安工程大学 基于多参数的电力变压器运行故障综合诊断方法
CN108663582A (zh) * 2017-11-30 2018-10-16 全球能源互联网研究院有限公司 一种变压器的故障诊断方法及系统
CN109030790A (zh) * 2018-08-21 2018-12-18 华北电力大学(保定) 一种电力变压器故障诊断方法和装置
CN109298258A (zh) * 2018-09-18 2019-02-01 四川大学 结合rvm和dbn的变压器故障诊断方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11099219B2 (en) * 2018-03-26 2021-08-24 Oracle International Corporation Estimating the remaining useful life of a power transformer based on real-time sensor data and periodic dissolved gas analyses

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104535865A (zh) * 2014-12-30 2015-04-22 西安工程大学 基于多参数的电力变压器运行故障综合诊断方法
CN108663582A (zh) * 2017-11-30 2018-10-16 全球能源互联网研究院有限公司 一种变压器的故障诊断方法及系统
CN109030790A (zh) * 2018-08-21 2018-12-18 华北电力大学(保定) 一种电力变压器故障诊断方法和装置
CN109298258A (zh) * 2018-09-18 2019-02-01 四川大学 结合rvm和dbn的变压器故障诊断方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Assessment of the Health Condition of Oil-Immersed Transformers Using Logistic Regression and Poisson Distribution;Sultanul Areffin .et al;《2017 3rd International Conference on Electrical Information and Communication Technology (EICT)》;20171209;1-5 *
变压器可靠性评价及状态评估方法综述;许修乐 等;《高压电器》;20170816;第53卷(第8期);211-216 *

Also Published As

Publication number Publication date
CN110927478A (zh) 2020-03-27

Similar Documents

Publication Publication Date Title
CN106650797B (zh) 一种基于集成elm的配电网窃电嫌疑用户智能识别方法
CN107122790B (zh) 基于混合神经网络和集成学习的非侵入式负荷识别算法
CN107169628B (zh) 一种基于大数据互信息属性约简的配电网可靠性评估方法
CN110417011B (zh) 一种基于互信息与迭代随机森林的在线动态安全评估方法
CN110927478B (zh) 一种确定电力系统变压器设备的状态的方法和系统
CN111723367B (zh) 一种电力监控系统业务场景处置风险评价方法及系统
CN109193650A (zh) 一种基于高维随机矩阵理论的电网薄弱点评估方法
CN109165242B (zh) 一种基于熵排序与时空分析的故障诊断及预警方法
CN109033513A (zh) 电力变压器故障诊断方法与电力变压器故障诊断装置
CN109240276B (zh) 基于故障敏感主元选择的多块pca故障监测方法
Carson et al. Exponentially weighted moving average (EWMA) control charts for monitoring an analytical process
CN109740890A (zh) 一种质量影响因素相关性分析方法
CN117113166A (zh) 一种基于改进的集成学习的工业锅炉故障检测方法
Bartz-Beielstein Experimental analysis of evolution strategies: Overview and comprehensive introduction
Alonso et al. A note on the indeterminacy of the random-effects distribution in hierarchical models
CN109784777B (zh) 基于时序信息片段云相似度度量的电网设备状态评估方法
Triantafyllou Simulation-based comparative analysis of nonparametric control charts with runs-type rules
Bell et al. MIPHENO: data normalization for high throughput metabolite analysis
CN108053093A (zh) 一种基于平均影响值数据变换的k-近邻故障诊断方法
CN115907178A (zh) 一种净生态系统co2交换量的预测方法
CN109886316A (zh) 基于云系相似度权重分配的变压器状态参量组合预测方法
CN114970311A (zh) 一种远端模块寿命预测模型的建立方法与寿命预测方法
WO2021017284A1 (zh) 基于皮质学习的异常检测方法、装置、终端设备及存储介质
Bogdan et al. On the Empirical Bayes approach to the problem of multiple testing
CN118010614B (zh) 共混型互穿网络热塑性弹性体的耐腐蚀性检测方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant