CN110569278A - 一种基于大数据分析的变压器缺陷评估方法 - Google Patents
一种基于大数据分析的变压器缺陷评估方法 Download PDFInfo
- Publication number
- CN110569278A CN110569278A CN201910771786.XA CN201910771786A CN110569278A CN 110569278 A CN110569278 A CN 110569278A CN 201910771786 A CN201910771786 A CN 201910771786A CN 110569278 A CN110569278 A CN 110569278A
- Authority
- CN
- China
- Prior art keywords
- defect
- transformer
- data
- value
- tree
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06395—Quality analysis or management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/06—Electricity, gas or water supply
Abstract
本发明属于变电站巡检技术领域,具体涉及一种基于大数据分析的变压器缺陷评估方法,具体步骤包括S1:采集数据;S2:数据预处理;S3:对数据集进行挖掘,建立缺陷特征向量;S4:构建基于XGBoost算法的变电变压器缺陷趋势评估模型,根据所述缺陷特征对变压器运行健康度进行评价。采用本发明可以充分挖掘变电站设备巡检数据价值,通过设备健康度评分,实现缺陷自动判别,可节省90%以上人工,效率提升10倍以上,将变电站巡维工作由“经验判断”变为“数据驱动”;由“计划检修”转向“状态检查”;由“事后被动处理”转向“事前主动预防”,实现运行设备精益化管理,为变电站巡检工作提供增值服务。
Description
技术领域
本发明属于变电站巡检技术领域,具体涉及一种基于大数据分析的变压器缺陷评估方法。
背景技术
随着无人值守变电站的发展,变电站采用多种智能巡检方式,如:机器人巡检、无人机巡检、高清视频监控等多种巡检监控方式。但是各系统未基于周期评价结果进行趋势预判,无法诊断出变压器的质量异常情况,缺陷风险无法及时消除。变压器轮换方案往往依赖于固定周期,易造成资源浪费。历史巡检数据未充分挖掘,各系统海量数据价值未被有效利用。变压器的缺陷预测及质量分析评价依赖于人工分析,极大影响了处理效率。
发明内容
为了解决上述问题,本发明提供了一种基于大数据分析的变压器缺陷评估方法,具体技术方案如下:
一种基于大数据分析的变压器缺陷评估方法,包括以下步骤:
S1:采集数据:采集海量准实时数据服务平台、地理信息系统、气象数据、集控子站系统、视频监控系统、资产管理系统、集控管理主站的数据;
S2:数据预处理:对采集的数据进行去重处理、异常值处理、缺失值处理;
S3:对数据集进行挖掘,建立缺陷特征向量;
S4:构建基于XGBoost算法的变电变压器缺陷趋势评估模型,根据所述缺陷特征对变压器运行健康度进行评价。
优选地,所述步骤S2中对数据进行缺失值处理具体为:采用平均值代替缺失值数据并做平滑化处理。
优选地,所述步骤S3中的缺陷特征包括绕组缺陷、铁芯缺陷、主绝缘缺陷、引线缺陷、分接缺陷和套管缺陷。
优选地,所述步骤S4具体包括以下步骤:
S41:正则化学习目标函数:
对于给定的m个特征、n个样本的训练集,D={(xi,yi)}(i=1,2,...,n,xi∈Rm,yi∈R,|D|=n),树的集成模型为K个子函数相加获得的最终输出,如下式所示:
式中,F={f(x)=wq(x),}(q:Rm→T,w∈RT);
其中,代表预测值,K代表CART树的数量,q代表样本映射到相应的叶子节点的决策规则,T代表一棵树的叶子节点数量,f代表CART树,fk代表第k棵决策树,w代表叶子的权重,F所有CART树的集合;
XGBoost算法在训练模式是:保留前一次t-1轮的预测不变,加入新的函数ft到模型中,则:
…
最小化下列正则化目标函数:
其中,L为损失函数,用于描述模型模拟数据的程度;Ω为正则化项,用于描述模型复杂程度;γ为复杂参数,λ为固定系数,T为树的叶子节点数量;
S42:采用梯度树提升算法:
用表示第t次迭代的第i个实例,并将ft添加到下列目标函数中:
使用二阶近似优化上述目标函数,则:
其中,为一阶偏导数,为二阶偏导数,去除常数项,获得简化的目标函数为:
其中Ij={i|q(xi)=j},为叶子节点j的实例,对于一个固定的结构q(x),可以计算叶子节点j的最优权重由此可以计算出对应的最优值:
用贪婪算法,迭代添加枝干,:IL、IR分别为分割点左边和右边的样本集,且I=IL∪IR,则损失函数减少量如下所示:
上式用来评价分割的候选节点;
S43:采用建立的目标函数评估变压器缺陷趋势:
根据模型输出的变压器运行健康度的预测值,判断变压器状态,分值越高表示变压器越健康,分值按照健康度分为缺陷、健康两种。
本发明的有益效果为:采用本发明可以充分挖掘变电站设备巡检数据价值,通过设备健康度评分,实现缺陷自动判别,可节省90%以上人工,效率提升10倍以上,将变电站巡维工作由“经验判断”变为“数据驱动”;由“计划检修”转向“状态检查”;由“事后被动处理”转向“事前主动预防”,实现运行设备精益化管理,为变电站巡检工作提供增值服务。
附图说明
图1为本发明中的流程图。
具体实施方式
为了更好的理解本发明,下面结合附图和具体实施例对本发明作进一步说明:
如图1所示,一种基于大数据分析的变压器缺陷评估方法,包括以下步骤:
S1:采集数据:采集海量准实时数据服务平台、地理信息系统、气象数据、集控子站系统、视频监控系统、资产管理系统、集控管理主站的数据;采集数据时间跨度为1年。
S2:数据预处理:各系统数据存在字段描述不统一、编码规则不对应、数据字段缺失等问题,通过制定数据质量、完整性等校验规则,行标准化处理;具体对采集的数据进行去重处理、异常值处理、缺失值处理,完成数据预处理工作;对数据进行缺失值处理具体为:采用平均值代替缺失值数据并做平滑化处理。
S3:对数据集进行挖掘,建立缺陷特征向量;具体为:
S31:分析变压器巡检报告的特征分布;
S32:根据历史变压器缺陷类型,可将缺陷特征划分为绕组缺陷、铁芯缺陷、主绝缘缺陷、引线缺陷、分接缺陷和套管缺陷等6类;
S33:模型特征提取,采用最大信息相关系数作为评价标准,不同特征的选取范围相对误差呈先增大后减小,综合考虑模型的精度与运算时间,本发明选取排名前50%的强关联因素。绕组缺陷包括:绕组低温过热、绕组匝间短路、绕组断线;铁芯缺陷包括:悬浮放点、铁芯多点节点、散热不均;主绝缘缺陷包括:绝缘击穿、围屏放电、油流带电;引线缺陷包括:对地闪络、引线断股、引线过热;分接缺陷包括:拨叉放点、触头烧损、断线;套管缺陷包括:套管闪络、套管过热、均匀球悬浮放电;
S34:将特征量化成一组特征向量。
S4:构建基于XGBoost算法的变电变压器缺陷趋势评估模型,根据所述缺陷特征对变压器运行健康度进行评价。具体包括以下步骤:
S41:正则化学习目标函数:
对于给定的m个特征、n个样本的训练集,D={(xi,yi)}(i=1,2,...,n,xi∈Rm,yi∈R,|D|=n),本实施例数据集中有748个样本,6个特征x1、x2、x3、x4、x5、x6,则数据集如下表所示:
表1数据集
树的集成模型为K个子函数相加获得的最终输出,如下式所示:
式中,F={f(x)=wq(x),}(q:Rm→T,w∈RT);
其中,代表预测值,K代表CART树的数量,q代表样本映射到相应的叶子节点的决策规则,T代表一棵树的叶子节点数量,f代表CART树,fk代表第k棵决策树,w代表叶子的权重,F所有CART树的集合;
XGBoost算法在训练模式是:保留前一次t-1轮的预测不变,加入新的函数ft到模型中,则:
…
对于一个给定的样本,可以使用数中的决策规则将它分类到对应的叶子节点,并且将对应叶子节点的得分加起来作为最后的预测值,为了在模型中获得相应的函数簇,最小化下列正则化目标函数:
其中,L为损失函数,用于描述模型模拟数据的程度;Ω为正则化项,用于描述模型复杂程度;γ为复杂参数,λ为固定系数,T为树的叶子节点数量。
S42:采用梯度树提升算法:
用表示第t次迭代的第i个实例,并将ft添加到下列目标函数中:
使用二阶近似优化上述目标函数,则:
其中,为一阶偏导数,为二阶偏导数,则每个样本的一阶、二阶导数的值为:
表2每个样本的一阶、二阶导数的值
ID | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | … | 748 |
g<sub>i</sub> | 0.5 | 0.5 | -0.5 | -0.5 | -0.5 | -0.5 | -0.5 | 0.5 | 0.5 | -0.5 | -0.5 | … | 0.5 |
h<sub>i</sub> | 0.25 | 0.25 | 0.25 | 0.25 | 0.25 | 0.25 | 0.25 | 0.25 | 0.25 | 0.25 | 0.25 | 0.25 | 0.25 |
去除常数项,获得简化的目标函数为:
其中Ij={i|q(xi)=j},为叶子节点j的实例,对于一个固定的结构q(x),可以计算叶子节点j的最优权重由此可以计算出对应的最优值:
用贪婪算法,迭代添加枝干,:IL、IR分别为分割点左边和右边的样本集,且I=IL∪IR,则损失函数减少量如下所示:
上式用来评价分割的候选节点;
本发明使用XGBoost包来训练模型,结合AUC评分,选定模型最优参数,XGBoost调参结果表如下所示:
表3模型的优化参数
S43:采用建立的目标函数评估变压器缺陷趋势:
根据模型输出的变压器运行健康度的预测值,判断变压器状态,分值越高表示变压器越健康,分值按照健康度分为缺陷、健康两种。
设定变压器缺陷概率为p,则健康概率为(1-p),缺陷与健康的概率比odds=p/(1-p),从而定义评分卡的分割值为:score=A-Blog(odds);
假设odds=θ0时,对应的score值为P0;odds=2θ0时,score的变化值为ΔP,则:
由上式可解得:A=P0+B log(θ0)。
综合XGBoost模型计算的结果和评分卡结合评价变压器的健康分值,根据历史巡检经验,我们将变压器健康的类别概率达70%以上。即设定θ0=0.7时,判定变压器为健康状态;分值为60(设定P0=60),当缺陷比上升一倍时,分值下降5分,即设定ΔP=5,将θ0=0.7、P0=60、ΔP=5代入score=A-Blog(odds)计算健康分值,748条样本健康分值如下表4所示:
表4样本的健康值
分值区间 | 数量 |
[0,20) | 8 |
[20,30) | 55 |
[30,40) | 78 |
[40,23) | 75 |
[50,24) | 89 |
[60,25) | 51 |
[70,26) | 136 |
[80,27) | 133 |
[100,28) | 123 |
本实施案例以XGBoost算法为基础,对设备缺陷预测并输出健康分值,实现对设备运行状态的综合评价。
本发明不局限于以上所述的具体实施方式,以上所述仅为本发明的较佳实施案例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (4)
1.一种基于大数据分析的变压器缺陷评估方法,其特征在于:包括以下步骤:
S1:采集数据:采集海量准实时数据服务平台、地理信息系统、气象数据、集控子站系统、视频监控系统、资产管理系统、集控管理主站的数据;
S2:数据预处理:对采集的数据进行去重处理、异常值处理、缺失值处理;
S3:对数据集进行挖掘,建立缺陷特征向量;
S4:构建基于XGBoost算法的变电变压器缺陷趋势评估模型,根据所述缺陷特征对变压器运行健康度进行评价。
2.根据权利要求1所述的一种基于大数据分析的变压器缺陷评估方法,其特征在于:所述步骤S2中对数据进行缺失值处理具体为:采用平均值代替缺失值数据并做平滑化处理。
3.根据权利要求1所述的一种基于大数据分析的变压器缺陷评估方法,其特征在于:所述步骤S3中的缺陷特征包括绕组缺陷、铁芯缺陷、主绝缘缺陷、引线缺陷、分接缺陷和套管缺陷。
4.根据权利要求1所述的一种基于大数据分析的变压器缺陷评估方法,其特征在于:所述步骤S4具体包括以下步骤:
S41:正则化学习目标函数:
对于给定的m个特征、n个样本的训练集,D={(xi,yi)}(i=1,2,...,n,xi∈Rm,yi∈R,|D|=n),树的集成模型为K个子函数相加获得的最终输出,如下式所示:
式中,F={f(x)=wq(x),}(q:Rm→T,w∈RT);
其中,代表预测值,K代表CART树的数量,q代表样本映射到相应的叶子节点的决策规则,T代表一棵树的叶子节点数量,f代表CART树,fk代表第k棵决策树,w代表叶子的权重,F所有CART树的集合;
XGBoost算法在训练模式是:保留前一次t-1轮的预测不变,加入新的函数ft到模型中,则:
…
最小化下列正则化目标函数:
其中,L为损失函数,用于描述模型模拟数据的程度;Ω为正则化项,用于描述模型复杂程度,γ为复杂参数,λ为固定系数,T为树的叶子节点数量;
S42:采用梯度树提升算法:
用表示第t次迭代的第i个实例,并将ft添加到下列目标函数中:
使用二阶近似优化上述目标函数,则:
其中,为一阶偏导数,为二阶偏导数,去除常数项,获得简化的目标函数为:
其中Ij={i|q(xi)=j},为叶子节点j的实例,对于一个固定的结构q(x),可以计算叶子节点j的最优权重由此可以计算出对应的最优值:
用贪婪算法,迭代添加枝干,:IL、IR分别为分割点左边和右边的样本集,且I=IL∪IR,则损失函数减少量如下所示:
上式用来评价分割的候选节点;
S43:采用建立的目标函数评估变压器缺陷趋势:
根据模型输出的变压器运行健康度的预测值,判断变压器状态,分值越高表示变压器越健康,分值按照健康度分为缺陷、健康两种。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910771786.XA CN110569278A (zh) | 2019-08-21 | 2019-08-21 | 一种基于大数据分析的变压器缺陷评估方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910771786.XA CN110569278A (zh) | 2019-08-21 | 2019-08-21 | 一种基于大数据分析的变压器缺陷评估方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110569278A true CN110569278A (zh) | 2019-12-13 |
Family
ID=68775775
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910771786.XA Pending CN110569278A (zh) | 2019-08-21 | 2019-08-21 | 一种基于大数据分析的变压器缺陷评估方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110569278A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111067483A (zh) * | 2019-12-16 | 2020-04-28 | 杭州电子科技大学 | 一种啮齿动物疼痛程度分级评估数据集的构建方法 |
CN112685949A (zh) * | 2020-11-25 | 2021-04-20 | 江苏科技大学 | 一种基于数字孪生的变压器健康预测方法 |
CN113484723A (zh) * | 2021-07-08 | 2021-10-08 | 上海交通大学 | 基于XGBoost算法的变压器故障诊断与健康评估系统及方法 |
CN113779005A (zh) * | 2021-08-02 | 2021-12-10 | 南方电网深圳数字电网研究院有限公司 | 一次设备的缺陷评估方法和装置、存储介质 |
CN113872186A (zh) * | 2021-09-06 | 2021-12-31 | 广西电网有限责任公司电力科学研究院 | 基于模仿学习的微电网控制策略推荐模型训练系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109147949A (zh) * | 2018-08-16 | 2019-01-04 | 辽宁大学 | 一种基于分类回归树来用于检测教师亚健康状态的方法 |
CN109190670A (zh) * | 2018-08-02 | 2019-01-11 | 大连理工大学 | 一种基于可扩展提升树的充电桩故障预测方法 |
CN109297689A (zh) * | 2018-09-11 | 2019-02-01 | 中国水利水电科学研究院 | 一种引入权重因子的大型水力机械智能诊断方法 |
CN110119339A (zh) * | 2019-05-07 | 2019-08-13 | 上海电气集团股份有限公司 | 工业设备的健康状态的评估方法、系统、设备和存储介质 |
-
2019
- 2019-08-21 CN CN201910771786.XA patent/CN110569278A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109190670A (zh) * | 2018-08-02 | 2019-01-11 | 大连理工大学 | 一种基于可扩展提升树的充电桩故障预测方法 |
CN109147949A (zh) * | 2018-08-16 | 2019-01-04 | 辽宁大学 | 一种基于分类回归树来用于检测教师亚健康状态的方法 |
CN109297689A (zh) * | 2018-09-11 | 2019-02-01 | 中国水利水电科学研究院 | 一种引入权重因子的大型水力机械智能诊断方法 |
CN110119339A (zh) * | 2019-05-07 | 2019-08-13 | 上海电气集团股份有限公司 | 工业设备的健康状态的评估方法、系统、设备和存储介质 |
Non-Patent Citations (2)
Title |
---|
包月青: "基于机器学习的软件缺陷预测研究", 《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》 * |
陈明华 等: "基于XGBoost 的电力系统暂态稳定预测方法", 《电网技术》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111067483A (zh) * | 2019-12-16 | 2020-04-28 | 杭州电子科技大学 | 一种啮齿动物疼痛程度分级评估数据集的构建方法 |
CN112685949A (zh) * | 2020-11-25 | 2021-04-20 | 江苏科技大学 | 一种基于数字孪生的变压器健康预测方法 |
CN113484723A (zh) * | 2021-07-08 | 2021-10-08 | 上海交通大学 | 基于XGBoost算法的变压器故障诊断与健康评估系统及方法 |
CN113779005A (zh) * | 2021-08-02 | 2021-12-10 | 南方电网深圳数字电网研究院有限公司 | 一次设备的缺陷评估方法和装置、存储介质 |
CN113872186A (zh) * | 2021-09-06 | 2021-12-31 | 广西电网有限责任公司电力科学研究院 | 基于模仿学习的微电网控制策略推荐模型训练系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110569278A (zh) | 一种基于大数据分析的变压器缺陷评估方法 | |
CN111047082B (zh) | 设备的预警方法及装置、存储介质和电子装置 | |
CN108320043B (zh) | 一种基于电力大数据的配电网设备状态诊断预测方法 | |
CN111768082A (zh) | 一种基于大数据分析的电力设备状态评估方法 | |
CN110705873B (zh) | 一种配电网运行状态画像分析方法 | |
CN110598726A (zh) | 一种基于随机森林的输电杆塔鸟害风险预测方法 | |
CN111143447B (zh) | 一种电网薄弱环节动态监测预警决策系统及方法 | |
CN109784348A (zh) | 一种红外电力设备识别和在线诊断方法及其系统 | |
CN110515931B (zh) | 一种基于随机森林算法的电容型设备缺陷预测方法 | |
CN108764684A (zh) | 基于模糊层次分析法的智能箱式变电站健康状态评估方法 | |
CN108629491B (zh) | 一种换流变检修质量综合评估方法 | |
CN110766313B (zh) | 一种基于运维检修制度的电缆隧道综合状态评价方法 | |
CN116797404A (zh) | 基于大数据和数据处理的智能建筑运维监管系统 | |
CN116742799A (zh) | 一种基于物联网技术的配电辅助监测预警系统 | |
CN112668943A (zh) | 一种配电线路健康状态评估方法及系统 | |
CN110555058A (zh) | 基于改进决策树的电力通信设备状态的预测方法 | |
CN112200263B (zh) | 一种应用于配电物联网的自组织联邦聚类方法 | |
CN116862081B (zh) | 一种污染治理设备运维方法及系统 | |
CN110705887A (zh) | 一种基于神经网络模型的低压台区运行状态综合评价方法 | |
CN111339661B (zh) | 一种高压电缆巡检周期自动规划方法 | |
CN116359652A (zh) | 一种用于电力设备的状态监测系统 | |
CN112367400A (zh) | 一种边云协同的电力物联网智能巡检方法及系统 | |
CN115689114A (zh) | 一种基于组合神经网络的海底电缆运行状态预测方法 | |
CN113030633B (zh) | 基于ga-bp神经网络的配电网故障大数据分析方法和系统 | |
CN116700357A (zh) | 一种架空输电线路无人机编队智能巡检方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20191213 |