CN110569278A - 一种基于大数据分析的变压器缺陷评估方法 - Google Patents

一种基于大数据分析的变压器缺陷评估方法 Download PDF

Info

Publication number
CN110569278A
CN110569278A CN201910771786.XA CN201910771786A CN110569278A CN 110569278 A CN110569278 A CN 110569278A CN 201910771786 A CN201910771786 A CN 201910771786A CN 110569278 A CN110569278 A CN 110569278A
Authority
CN
China
Prior art keywords
defect
transformer
data
value
tree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910771786.XA
Other languages
English (en)
Inventor
邬蓉蓉
黎大健
焦健
张炜
陈荭
谢植飚
兰依
陈炜智
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Electric Power Research Institute of Guangxi Power Grid Co Ltd
Original Assignee
Electric Power Research Institute of Guangxi Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Electric Power Research Institute of Guangxi Power Grid Co Ltd filed Critical Electric Power Research Institute of Guangxi Power Grid Co Ltd
Priority to CN201910771786.XA priority Critical patent/CN110569278A/zh
Publication of CN110569278A publication Critical patent/CN110569278A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06395Quality analysis or management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/06Electricity, gas or water supply

Abstract

本发明属于变电站巡检技术领域,具体涉及一种基于大数据分析的变压器缺陷评估方法,具体步骤包括S1:采集数据;S2:数据预处理;S3:对数据集进行挖掘,建立缺陷特征向量;S4:构建基于XGBoost算法的变电变压器缺陷趋势评估模型,根据所述缺陷特征对变压器运行健康度进行评价。采用本发明可以充分挖掘变电站设备巡检数据价值,通过设备健康度评分,实现缺陷自动判别,可节省90%以上人工,效率提升10倍以上,将变电站巡维工作由“经验判断”变为“数据驱动”;由“计划检修”转向“状态检查”;由“事后被动处理”转向“事前主动预防”,实现运行设备精益化管理,为变电站巡检工作提供增值服务。

Description

一种基于大数据分析的变压器缺陷评估方法
技术领域
本发明属于变电站巡检技术领域,具体涉及一种基于大数据分析的变压器缺陷评估方法。
背景技术
随着无人值守变电站的发展,变电站采用多种智能巡检方式,如:机器人巡检、无人机巡检、高清视频监控等多种巡检监控方式。但是各系统未基于周期评价结果进行趋势预判,无法诊断出变压器的质量异常情况,缺陷风险无法及时消除。变压器轮换方案往往依赖于固定周期,易造成资源浪费。历史巡检数据未充分挖掘,各系统海量数据价值未被有效利用。变压器的缺陷预测及质量分析评价依赖于人工分析,极大影响了处理效率。
发明内容
为了解决上述问题,本发明提供了一种基于大数据分析的变压器缺陷评估方法,具体技术方案如下:
一种基于大数据分析的变压器缺陷评估方法,包括以下步骤:
S1:采集数据:采集海量准实时数据服务平台、地理信息系统、气象数据、集控子站系统、视频监控系统、资产管理系统、集控管理主站的数据;
S2:数据预处理:对采集的数据进行去重处理、异常值处理、缺失值处理;
S3:对数据集进行挖掘,建立缺陷特征向量;
S4:构建基于XGBoost算法的变电变压器缺陷趋势评估模型,根据所述缺陷特征对变压器运行健康度进行评价。
优选地,所述步骤S2中对数据进行缺失值处理具体为:采用平均值代替缺失值数据并做平滑化处理。
优选地,所述步骤S3中的缺陷特征包括绕组缺陷、铁芯缺陷、主绝缘缺陷、引线缺陷、分接缺陷和套管缺陷。
优选地,所述步骤S4具体包括以下步骤:
S41:正则化学习目标函数:
对于给定的m个特征、n个样本的训练集,D={(xi,yi)}(i=1,2,...,n,xi∈Rm,yi∈R,|D|=n),树的集成模型为K个子函数相加获得的最终输出,如下式所示:
式中,F={f(x)=wq(x),}(q:Rm→T,w∈RT);
其中,代表预测值,K代表CART树的数量,q代表样本映射到相应的叶子节点的决策规则,T代表一棵树的叶子节点数量,f代表CART树,fk代表第k棵决策树,w代表叶子的权重,F所有CART树的集合;
XGBoost算法在训练模式是:保留前一次t-1轮的预测不变,加入新的函数ft到模型中,则:
最小化下列正则化目标函数:
其中,L为损失函数,用于描述模型模拟数据的程度;Ω为正则化项,用于描述模型复杂程度;γ为复杂参数,λ为固定系数,T为树的叶子节点数量;
S42:采用梯度树提升算法:
表示第t次迭代的第i个实例,并将ft添加到下列目标函数中:
使用二阶近似优化上述目标函数,则:
其中,为一阶偏导数,为二阶偏导数,去除常数项,获得简化的目标函数为:
其中Ij={i|q(xi)=j},为叶子节点j的实例,对于一个固定的结构q(x),可以计算叶子节点j的最优权重由此可以计算出对应的最优值:
用贪婪算法,迭代添加枝干,:IL、IR分别为分割点左边和右边的样本集,且I=IL∪IR,则损失函数减少量如下所示:
上式用来评价分割的候选节点;
S43:采用建立的目标函数评估变压器缺陷趋势:
根据模型输出的变压器运行健康度的预测值,判断变压器状态,分值越高表示变压器越健康,分值按照健康度分为缺陷、健康两种。
本发明的有益效果为:采用本发明可以充分挖掘变电站设备巡检数据价值,通过设备健康度评分,实现缺陷自动判别,可节省90%以上人工,效率提升10倍以上,将变电站巡维工作由“经验判断”变为“数据驱动”;由“计划检修”转向“状态检查”;由“事后被动处理”转向“事前主动预防”,实现运行设备精益化管理,为变电站巡检工作提供增值服务。
附图说明
图1为本发明中的流程图。
具体实施方式
为了更好的理解本发明,下面结合附图和具体实施例对本发明作进一步说明:
如图1所示,一种基于大数据分析的变压器缺陷评估方法,包括以下步骤:
S1:采集数据:采集海量准实时数据服务平台、地理信息系统、气象数据、集控子站系统、视频监控系统、资产管理系统、集控管理主站的数据;采集数据时间跨度为1年。
S2:数据预处理:各系统数据存在字段描述不统一、编码规则不对应、数据字段缺失等问题,通过制定数据质量、完整性等校验规则,行标准化处理;具体对采集的数据进行去重处理、异常值处理、缺失值处理,完成数据预处理工作;对数据进行缺失值处理具体为:采用平均值代替缺失值数据并做平滑化处理。
S3:对数据集进行挖掘,建立缺陷特征向量;具体为:
S31:分析变压器巡检报告的特征分布;
S32:根据历史变压器缺陷类型,可将缺陷特征划分为绕组缺陷、铁芯缺陷、主绝缘缺陷、引线缺陷、分接缺陷和套管缺陷等6类;
S33:模型特征提取,采用最大信息相关系数作为评价标准,不同特征的选取范围相对误差呈先增大后减小,综合考虑模型的精度与运算时间,本发明选取排名前50%的强关联因素。绕组缺陷包括:绕组低温过热、绕组匝间短路、绕组断线;铁芯缺陷包括:悬浮放点、铁芯多点节点、散热不均;主绝缘缺陷包括:绝缘击穿、围屏放电、油流带电;引线缺陷包括:对地闪络、引线断股、引线过热;分接缺陷包括:拨叉放点、触头烧损、断线;套管缺陷包括:套管闪络、套管过热、均匀球悬浮放电;
S34:将特征量化成一组特征向量。
S4:构建基于XGBoost算法的变电变压器缺陷趋势评估模型,根据所述缺陷特征对变压器运行健康度进行评价。具体包括以下步骤:
S41:正则化学习目标函数:
对于给定的m个特征、n个样本的训练集,D={(xi,yi)}(i=1,2,...,n,xi∈Rm,yi∈R,|D|=n),本实施例数据集中有748个样本,6个特征x1、x2、x3、x4、x5、x6,则数据集如下表所示:
表1数据集
树的集成模型为K个子函数相加获得的最终输出,如下式所示:
式中,F={f(x)=wq(x),}(q:Rm→T,w∈RT);
其中,代表预测值,K代表CART树的数量,q代表样本映射到相应的叶子节点的决策规则,T代表一棵树的叶子节点数量,f代表CART树,fk代表第k棵决策树,w代表叶子的权重,F所有CART树的集合;
XGBoost算法在训练模式是:保留前一次t-1轮的预测不变,加入新的函数ft到模型中,则:
对于一个给定的样本,可以使用数中的决策规则将它分类到对应的叶子节点,并且将对应叶子节点的得分加起来作为最后的预测值,为了在模型中获得相应的函数簇,最小化下列正则化目标函数:
其中,L为损失函数,用于描述模型模拟数据的程度;Ω为正则化项,用于描述模型复杂程度;γ为复杂参数,λ为固定系数,T为树的叶子节点数量。
S42:采用梯度树提升算法:
表示第t次迭代的第i个实例,并将ft添加到下列目标函数中:
使用二阶近似优化上述目标函数,则:
其中,为一阶偏导数,为二阶偏导数,则每个样本的一阶、二阶导数的值为:
表2每个样本的一阶、二阶导数的值
ID 1 2 3 4 5 6 7 8 9 10 11 748
g<sub>i</sub> 0.5 0.5 -0.5 -0.5 -0.5 -0.5 -0.5 0.5 0.5 -0.5 -0.5 0.5
h<sub>i</sub> 0.25 0.25 0.25 0.25 0.25 0.25 0.25 0.25 0.25 0.25 0.25 0.25 0.25
去除常数项,获得简化的目标函数为:
其中Ij={i|q(xi)=j},为叶子节点j的实例,对于一个固定的结构q(x),可以计算叶子节点j的最优权重由此可以计算出对应的最优值:
用贪婪算法,迭代添加枝干,:IL、IR分别为分割点左边和右边的样本集,且I=IL∪IR,则损失函数减少量如下所示:
上式用来评价分割的候选节点;
本发明使用XGBoost包来训练模型,结合AUC评分,选定模型最优参数,XGBoost调参结果表如下所示:
表3模型的优化参数
S43:采用建立的目标函数评估变压器缺陷趋势:
根据模型输出的变压器运行健康度的预测值,判断变压器状态,分值越高表示变压器越健康,分值按照健康度分为缺陷、健康两种。
设定变压器缺陷概率为p,则健康概率为(1-p),缺陷与健康的概率比odds=p/(1-p),从而定义评分卡的分割值为:score=A-Blog(odds);
假设odds=θ0时,对应的score值为P0;odds=2θ0时,score的变化值为ΔP,则:
由上式可解得:A=P0+B log(θ0)。
综合XGBoost模型计算的结果和评分卡结合评价变压器的健康分值,根据历史巡检经验,我们将变压器健康的类别概率达70%以上。即设定θ0=0.7时,判定变压器为健康状态;分值为60(设定P0=60),当缺陷比上升一倍时,分值下降5分,即设定ΔP=5,将θ0=0.7、P0=60、ΔP=5代入score=A-Blog(odds)计算健康分值,748条样本健康分值如下表4所示:
表4样本的健康值
分值区间 数量
[0,20) 8
[20,30) 55
[30,40) 78
[40,23) 75
[50,24) 89
[60,25) 51
[70,26) 136
[80,27) 133
[100,28) 123
本实施案例以XGBoost算法为基础,对设备缺陷预测并输出健康分值,实现对设备运行状态的综合评价。
本发明不局限于以上所述的具体实施方式,以上所述仅为本发明的较佳实施案例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (4)

1.一种基于大数据分析的变压器缺陷评估方法,其特征在于:包括以下步骤:
S1:采集数据:采集海量准实时数据服务平台、地理信息系统、气象数据、集控子站系统、视频监控系统、资产管理系统、集控管理主站的数据;
S2:数据预处理:对采集的数据进行去重处理、异常值处理、缺失值处理;
S3:对数据集进行挖掘,建立缺陷特征向量;
S4:构建基于XGBoost算法的变电变压器缺陷趋势评估模型,根据所述缺陷特征对变压器运行健康度进行评价。
2.根据权利要求1所述的一种基于大数据分析的变压器缺陷评估方法,其特征在于:所述步骤S2中对数据进行缺失值处理具体为:采用平均值代替缺失值数据并做平滑化处理。
3.根据权利要求1所述的一种基于大数据分析的变压器缺陷评估方法,其特征在于:所述步骤S3中的缺陷特征包括绕组缺陷、铁芯缺陷、主绝缘缺陷、引线缺陷、分接缺陷和套管缺陷。
4.根据权利要求1所述的一种基于大数据分析的变压器缺陷评估方法,其特征在于:所述步骤S4具体包括以下步骤:
S41:正则化学习目标函数:
对于给定的m个特征、n个样本的训练集,D={(xi,yi)}(i=1,2,...,n,xi∈Rm,yi∈R,|D|=n),树的集成模型为K个子函数相加获得的最终输出,如下式所示:
式中,F={f(x)=wq(x),}(q:Rm→T,w∈RT);
其中,代表预测值,K代表CART树的数量,q代表样本映射到相应的叶子节点的决策规则,T代表一棵树的叶子节点数量,f代表CART树,fk代表第k棵决策树,w代表叶子的权重,F所有CART树的集合;
XGBoost算法在训练模式是:保留前一次t-1轮的预测不变,加入新的函数ft到模型中,则:
最小化下列正则化目标函数:
其中,L为损失函数,用于描述模型模拟数据的程度;Ω为正则化项,用于描述模型复杂程度,γ为复杂参数,λ为固定系数,T为树的叶子节点数量;
S42:采用梯度树提升算法:
表示第t次迭代的第i个实例,并将ft添加到下列目标函数中:
使用二阶近似优化上述目标函数,则:
其中,为一阶偏导数,为二阶偏导数,去除常数项,获得简化的目标函数为:
其中Ij={i|q(xi)=j},为叶子节点j的实例,对于一个固定的结构q(x),可以计算叶子节点j的最优权重由此可以计算出对应的最优值:
用贪婪算法,迭代添加枝干,:IL、IR分别为分割点左边和右边的样本集,且I=IL∪IR,则损失函数减少量如下所示:
上式用来评价分割的候选节点;
S43:采用建立的目标函数评估变压器缺陷趋势:
根据模型输出的变压器运行健康度的预测值,判断变压器状态,分值越高表示变压器越健康,分值按照健康度分为缺陷、健康两种。
CN201910771786.XA 2019-08-21 2019-08-21 一种基于大数据分析的变压器缺陷评估方法 Pending CN110569278A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910771786.XA CN110569278A (zh) 2019-08-21 2019-08-21 一种基于大数据分析的变压器缺陷评估方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910771786.XA CN110569278A (zh) 2019-08-21 2019-08-21 一种基于大数据分析的变压器缺陷评估方法

Publications (1)

Publication Number Publication Date
CN110569278A true CN110569278A (zh) 2019-12-13

Family

ID=68775775

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910771786.XA Pending CN110569278A (zh) 2019-08-21 2019-08-21 一种基于大数据分析的变压器缺陷评估方法

Country Status (1)

Country Link
CN (1) CN110569278A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111067483A (zh) * 2019-12-16 2020-04-28 杭州电子科技大学 一种啮齿动物疼痛程度分级评估数据集的构建方法
CN112685949A (zh) * 2020-11-25 2021-04-20 江苏科技大学 一种基于数字孪生的变压器健康预测方法
CN113484723A (zh) * 2021-07-08 2021-10-08 上海交通大学 基于XGBoost算法的变压器故障诊断与健康评估系统及方法
CN113779005A (zh) * 2021-08-02 2021-12-10 南方电网深圳数字电网研究院有限公司 一次设备的缺陷评估方法和装置、存储介质
CN113872186A (zh) * 2021-09-06 2021-12-31 广西电网有限责任公司电力科学研究院 基于模仿学习的微电网控制策略推荐模型训练系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109147949A (zh) * 2018-08-16 2019-01-04 辽宁大学 一种基于分类回归树来用于检测教师亚健康状态的方法
CN109190670A (zh) * 2018-08-02 2019-01-11 大连理工大学 一种基于可扩展提升树的充电桩故障预测方法
CN109297689A (zh) * 2018-09-11 2019-02-01 中国水利水电科学研究院 一种引入权重因子的大型水力机械智能诊断方法
CN110119339A (zh) * 2019-05-07 2019-08-13 上海电气集团股份有限公司 工业设备的健康状态的评估方法、系统、设备和存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109190670A (zh) * 2018-08-02 2019-01-11 大连理工大学 一种基于可扩展提升树的充电桩故障预测方法
CN109147949A (zh) * 2018-08-16 2019-01-04 辽宁大学 一种基于分类回归树来用于检测教师亚健康状态的方法
CN109297689A (zh) * 2018-09-11 2019-02-01 中国水利水电科学研究院 一种引入权重因子的大型水力机械智能诊断方法
CN110119339A (zh) * 2019-05-07 2019-08-13 上海电气集团股份有限公司 工业设备的健康状态的评估方法、系统、设备和存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
包月青: "基于机器学习的软件缺陷预测研究", 《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》 *
陈明华 等: "基于XGBoost 的电力系统暂态稳定预测方法", 《电网技术》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111067483A (zh) * 2019-12-16 2020-04-28 杭州电子科技大学 一种啮齿动物疼痛程度分级评估数据集的构建方法
CN112685949A (zh) * 2020-11-25 2021-04-20 江苏科技大学 一种基于数字孪生的变压器健康预测方法
CN113484723A (zh) * 2021-07-08 2021-10-08 上海交通大学 基于XGBoost算法的变压器故障诊断与健康评估系统及方法
CN113779005A (zh) * 2021-08-02 2021-12-10 南方电网深圳数字电网研究院有限公司 一次设备的缺陷评估方法和装置、存储介质
CN113872186A (zh) * 2021-09-06 2021-12-31 广西电网有限责任公司电力科学研究院 基于模仿学习的微电网控制策略推荐模型训练系统

Similar Documents

Publication Publication Date Title
CN110569278A (zh) 一种基于大数据分析的变压器缺陷评估方法
CN111047082B (zh) 设备的预警方法及装置、存储介质和电子装置
CN108320043B (zh) 一种基于电力大数据的配电网设备状态诊断预测方法
CN111768082A (zh) 一种基于大数据分析的电力设备状态评估方法
CN110705873B (zh) 一种配电网运行状态画像分析方法
CN110598726A (zh) 一种基于随机森林的输电杆塔鸟害风险预测方法
CN111143447B (zh) 一种电网薄弱环节动态监测预警决策系统及方法
CN109784348A (zh) 一种红外电力设备识别和在线诊断方法及其系统
CN110515931B (zh) 一种基于随机森林算法的电容型设备缺陷预测方法
CN108764684A (zh) 基于模糊层次分析法的智能箱式变电站健康状态评估方法
CN108629491B (zh) 一种换流变检修质量综合评估方法
CN110766313B (zh) 一种基于运维检修制度的电缆隧道综合状态评价方法
CN116797404A (zh) 基于大数据和数据处理的智能建筑运维监管系统
CN116742799A (zh) 一种基于物联网技术的配电辅助监测预警系统
CN112668943A (zh) 一种配电线路健康状态评估方法及系统
CN110555058A (zh) 基于改进决策树的电力通信设备状态的预测方法
CN112200263B (zh) 一种应用于配电物联网的自组织联邦聚类方法
CN116862081B (zh) 一种污染治理设备运维方法及系统
CN110705887A (zh) 一种基于神经网络模型的低压台区运行状态综合评价方法
CN111339661B (zh) 一种高压电缆巡检周期自动规划方法
CN116359652A (zh) 一种用于电力设备的状态监测系统
CN112367400A (zh) 一种边云协同的电力物联网智能巡检方法及系统
CN115689114A (zh) 一种基于组合神经网络的海底电缆运行状态预测方法
CN113030633B (zh) 基于ga-bp神经网络的配电网故障大数据分析方法和系统
CN116700357A (zh) 一种架空输电线路无人机编队智能巡检方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20191213