CN113269351A - 一种面向电网设备故障概率预测的特征选择方法 - Google Patents

一种面向电网设备故障概率预测的特征选择方法 Download PDF

Info

Publication number
CN113269351A
CN113269351A CN202110468250.8A CN202110468250A CN113269351A CN 113269351 A CN113269351 A CN 113269351A CN 202110468250 A CN202110468250 A CN 202110468250A CN 113269351 A CN113269351 A CN 113269351A
Authority
CN
China
Prior art keywords
feature selection
model
features
selection method
probability prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110468250.8A
Other languages
English (en)
Inventor
俞虹
代洲
程文美
唐诚旋
蒋群群
陈珏伊
张秀
徐一蝶
王钧泽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guizhou Power Grid Co Ltd
Original Assignee
Guizhou Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guizhou Power Grid Co Ltd filed Critical Guizhou Power Grid Co Ltd
Priority to CN202110468250.8A priority Critical patent/CN113269351A/zh
Publication of CN113269351A publication Critical patent/CN113269351A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Educational Administration (AREA)
  • Game Theory and Decision Science (AREA)
  • Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Supply And Distribution Of Alternating Current (AREA)

Abstract

本发明公开了一种面向电网设备故障概率预测的特征选择方法,包括,融合在线监测数据、历史缺陷数据和气象数据;基于机器学习构建特征选择模型;利用所述特征选择模型将选择的特征去掉冗余特征,仅保留重要特征。本发明利用多种模型对特征进行了筛选,去除了冗余的特征,提高下游的预测任务的性能,同时减少了数据的存储。

Description

一种面向电网设备故障概率预测的特征选择方法
技术领域
本发明涉及电网设备故障概率预测、特征选择的技术领域,尤其涉及一种面向电网设备故障概率预测的特征选择方法。
背景技术
电网系统的平稳健康运行,对人民生产生活非常重要。但是电网系统太过庞大,设备也不可能一直完好无损的运行。极端天气、突发情况以及设备老化等都可能导致电网故障。
对于电网的设备物资而言,主要有三类:日常设备物资、应急设备物资和重大灾害缺陷物资。本发明主要针对的是应急设备物资。当设备发生故障时,就需要在各地仓库备有以进行更换来保证电网的正常运行。但是各地仓库应该每类物资应该采购多少,才能既不缺物资,又不会过度仓储,就成了一个值得研究的问题。
但是电网系统中,不同的区域、不同的物资数据分布很不一样。以修文县的真实数据分布为例,本体、复合绝缘子和金具本体的分布不一样。同时可以看到,数据的分布没有很强的规律性。因此,针对不同物资的故障概率预测,起作用的特征也非常不一样。
进行特征筛选,可以提高训练和预测计算的效率,同时可以节省数据存储的总量,获取有益的效果。
发明内容
本部分的目的在于概述本发明的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本申请的说明书摘要和发明名称中可能会做些简化或省略以避免使本部分、说明书摘要和发明名称的目的模糊,而这种简化或省略不能用于限制本发明的范围。
鉴于上述现有存在的问题,提出了本发明。
因此,本发明提供了一种面向电网设备故障概率预测的特征选择方法,能够解决现有方法存在的粗放性和无效性的问题。
为解决上述技术问题,本发明提供如下技术方案:包括,融合在线监测数据、历史缺陷数据和气象数据;基于机器学习构建特征选择模型;利用所述特征选择模型将选择的特征去掉冗余特征,仅保留重要特征。
作为本发明所述的面向电网设备故障概率预测的特征选择方法的一种优选方案,其中:所述特征选择模型包括,极端梯度提升模型、基于IV值得模型和逻辑回归模型。
作为本发明所述的面向电网设备故障概率预测的特征选择方法的一种优选方案,其中:构建所述特征选择模型包括,
Figure BDA0003044891260000021
其中,
Figure BDA0003044891260000022
为梯度提升树和极端梯度提升模型的缺陷物资预测值,fk为第k棵分类回归树,K为分类回归树的数量,Γ为分类回归树的空间,训练得到模型之后,依据模型构建时利用特征最多的次数等方式,来获得最重要的特征。
作为本发明所述的面向电网设备故障概率预测的特征选择方法的一种优选方案,其中:所述特征选择模型针对所有特征计算IV值,根据所述IV值进行排序,利用排序的结果筛选有辨识力的特征,即IV>0.2的特征。
作为本发明所述的面向电网设备故障概率预测的特征选择方法的一种优选方案,其中:所述特征选择模型包括,逻辑回归模型,如下,
Figure BDA0003044891260000023
其中,当模型训练完成之后,特征的参数θ的取值进行排序,针对取值大的top特征进行选择。
作为本发明所述的面向电网设备故障概率预测的特征选择方法的一种优选方案,其中:所述缺陷物资包括,金具本体、本体、拉线本体、混凝土电杆、瓷质绝缘子、CPU插件、架空导线、分合闸接触器、充电模块、复合绝缘子。
作为本发明所述的面向电网设备故障概率预测的特征选择方法的一种优选方案,其中:构建的所述特征选择模型采用特征选择方法,其基于XgBoost算法进行建立。
作为本发明所述的面向电网设备故障概率预测的特征选择方法的一种优选方案,其中:所述特征选择方法选择的特征需进行求交集。
本发明的有益效果:本发明利用多种模型对特征进行了筛选,去除了冗余的特征,提高下游的预测任务的性能,同时减少了数据的存储。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。其中:
图1为本发明一个实施例所述的面向电网设备故障概率预测的特征选择方法的流程示意图;
图2为本发明一个实施例所述的面向电网设备故障概率预测的特征选择方法的对比示意图;
图3为本发明一个实施例所述的面向电网设备故障概率预测的特征选择方法的模型训练速度对比示意图;
图4为本发明一个实施例所述的面向电网设备故障概率预测的特征选择方法的预测准确率对比示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合说明书附图对本发明的具体实施方式做详细的说明,显然所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明的保护的范围。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。
其次,此处所称的“一个实施例”或“实施例”是指可包含于本发明至少一个实现方式中的特定特征、结构或特性。在本说明书中不同地方出现的“在一个实施例中”并非均指同一个实施例,也不是单独的或选择性的与其他实施例互相排斥的实施例。
本发明结合示意图进行详细描述,在详述本发明实施例时,为便于说明,表示器件结构的剖面图会不依一般比例作局部放大,而且所述示意图只是示例,其在此不应限制本发明保护的范围。此外,在实际制作中应包含长度、宽度及深度的三维空间尺寸。
同时在本发明的描述中,需要说明的是,术语中的“上、下、内和外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一、第二或第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
本发明中除非另有明确的规定和限定,术语“安装、相连、连接”应做广义理解,例如:可以是固定连接、可拆卸连接或一体式连接;同样可以是机械连接、电连接或直接连接,也可以通过中间媒介间接相连,也可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
实施例1
参照图1和图2,为本发明的第一个实施例,提供了一种面向电网设备故障概率预测的特征选择方法,其特征在于:包括,
S1:融合在线监测数据、历史缺陷数据和气象数据。
S2:基于机器学习构建特征选择模型。
S3:利用特征选择模型将选择的特征去掉冗余特征,仅保留重要特征。
具体的,本实施例还需要详细说明的是,特征选择模型包括,极端梯度提升模型、基于IV值得模型和逻辑回归模型;构建特征选择模型包括:
Figure BDA0003044891260000041
其中,
Figure BDA0003044891260000042
为梯度提升树和极端梯度提升模型的缺陷物资预测值,fk为第k棵分类回归树,K为分类回归树的数量,Γ为分类回归树的空间,训练得到模型之后,依据模型构建时利用特征最多的次数等方式,来获得最重要的特征。
较佳的是,特征选择模型针对所有特征计算IV值,根据IV值进行排序,利用排序的结果筛选有辨识力的特征,即IV>0.2的特征。
特征选择模型包括,逻辑回归模型,如下,
Figure BDA0003044891260000043
其中,当模型训练完成之后,特征的参数θ的取值进行排序,针对取值大的top特征进行选择。
进一步的,缺陷物资包括,金具本体、本体、拉线本体、混凝土电杆、瓷质绝缘子、CPU插件、架空导线、分合闸接触器、充电模块、复合绝缘子;构建的特征选择模型采用特征选择方法,其基于XgBoost算法进行建立,特征选择方法选择的特征需进行求交集。
优选的,本实施例通过合并气象数据、在线监测数据和气象数据,形成整体的特征数据集,并针对故障概率预测,提出了特征选择的方法,以提高对数据的利用率和数据存储的效率。
其中需要说明的是,特征选择模型包括极端梯度提升(XgBoost,eXtremeGradient Boosting)模型、IV值和逻辑回归模型。
极端梯度提升模型,其对特征选择的方式是:有2种方式对特征进行筛选,weight为权重,即某特征在整个树群节点中出现的次数,出现越多,价值就越高。
Gain为增益,是某特征在整个树群作为分裂节点的信息增益之和再除以某特征出现的频次。
XgBoost通过这两种方式对特征重要性进行排序,选择排名top的特征作为保留特征。
基于IV值的特征选择,其主要依据IV值的可解释性进行筛选,而IV值的可解释性如下表所示:
表1:IV值的可解释性表。
Figure BDA0003044891260000051
参照表1,逻辑回归的特征选择,则在于其可以根据特征权重来对特征进行筛选,如果特征的权重非常小甚至为0,那么这类特征可以被忽略;利用上述三种方式对特征的重要性进行筛选,再对各自筛选出来的重要特征求交集,得到最终的特征集合。
优选的是,本发明通过极端梯度提升树、逻辑回归和IV值,对各个区县、各类物资的故障概率预测的特征重要性进行了筛选,对各类任务得到了重要特征,为数据存储空间的节省、还有提高计算效率提供了有效指导。
实施例2
参照图3和图4,为本发明的第二个实施例,提供了一种面向电网设备故障概率预测的特征选择方法的实验测试,具体包括:
为了更好地对本发明方法中采用的技术效果加以验证说明,本实施例选择以传统的技术方案与本发明方法进行对比测试,以科学论证的手段对比试验结果,验证本发明方法所具有的真实效果。
传统的技术方案:传统技术方案不对特征进行筛选,很多特征存在相关性,会对模型预测结果产生不利影响,同时,冗余特征也使得计算的效率下降,对于故障概率预测有不利影响。
为验证本发明方法相对于传统方法具有较高的性能和更高的预测准确度,本实施例中将采用传统方法和本发明方法分别对设备故障概率的精度和性能进行对比。
测试环境:采用气象数据、历史缺陷数据和在线监测数据,将利用特征选择的方法选得的特征与未利用特征选择的特征集合,进行模型训练,分别对比预测的精度和模型训练与预测的速度,通过特征选择方法,精简了大量的特征。
参照图3和图4,能够直观的看出,本发明方法与传统方法相比,具有较高的性能和更高的预测准确度。
应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (8)

1.一种面向电网设备故障概率预测的特征选择方法,其特征在于:包括,
融合在线监测数据、历史缺陷数据和气象数据;
基于机器学习构建特征选择模型;
利用所述特征选择模型将选择的特征去掉冗余特征,仅保留重要特征。
2.根据权利要求1所述的面向电网设备故障概率预测的特征选择方法,其特征在于:所述特征选择模型包括,极端梯度提升模型、基于IV值得模型和逻辑回归模型。
3.根据权利要求1或2所述的面向电网设备故障概率预测的特征选择方法,其特征在于:构建所述特征选择模型包括,
Figure FDA0003044891250000011
其中,
Figure FDA0003044891250000012
为梯度提升树和极端梯度提升模型的缺陷物资预测值,fk为第k棵分类回归树,K为分类回归树的数量,Γ为分类回归树的空间,训练得到模型之后,依据模型构建时利用特征最多的次数等方式,来获得最重要的特征。
4.根据权利要求3所述的面向电网设备故障概率预测的特征选择方法,其特征在于:所述特征选择模型针对所有特征计算IV值,根据所述IV值进行排序,利用排序的结果筛选有辨识力的特征,即IV>0.2的特征。
5.根据权利要求4所述的面向电网设备故障概率预测的特征选择方法,其特征在于:所述特征选择模型包括,逻辑回归模型,如下,
Figure FDA0003044891250000013
其中,当模型训练完成之后,特征的参数θ的取值进行排序,针对取值大的top特征进行选择。
6.根据权利要求5所述的面向电网设备故障概率预测的特征选择方法,其特征在于:所述缺陷物资包括,金具本体、本体、拉线本体、混凝土电杆、瓷质绝缘子、CPU插件、架空导线、分合闸接触器、充电模块、复合绝缘子。
7.根据权利要求6所述的面向电网设备故障概率预测的特征选择方法,其特征在于:构建的所述特征选择模型采用特征选择方法,其基于XgBoost算法进行建立。
8.根据权利要求7所述的面向电网设备故障概率预测的特征选择方法,其特征在于:所述特征选择方法选择的特征需进行求交集。
CN202110468250.8A 2021-04-28 2021-04-28 一种面向电网设备故障概率预测的特征选择方法 Pending CN113269351A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110468250.8A CN113269351A (zh) 2021-04-28 2021-04-28 一种面向电网设备故障概率预测的特征选择方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110468250.8A CN113269351A (zh) 2021-04-28 2021-04-28 一种面向电网设备故障概率预测的特征选择方法

Publications (1)

Publication Number Publication Date
CN113269351A true CN113269351A (zh) 2021-08-17

Family

ID=77229670

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110468250.8A Pending CN113269351A (zh) 2021-04-28 2021-04-28 一种面向电网设备故障概率预测的特征选择方法

Country Status (1)

Country Link
CN (1) CN113269351A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113985207A (zh) * 2021-10-28 2022-01-28 国网北京市电力公司 一种电网运行设备故障监测方法、系统、装置及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111325410A (zh) * 2020-03-13 2020-06-23 安图实验仪器(郑州)有限公司 基于样本分布的通用故障预警系统及其预警方法
CN111338950A (zh) * 2020-02-25 2020-06-26 北京高质系统科技有限公司 一种基于谱聚类的软件缺陷特征选择方法
CN111429970A (zh) * 2019-12-24 2020-07-17 大连海事大学 基于极端梯度提升方法进行特征选择来获取多基因风险评分的方法及系统
CN111583031A (zh) * 2020-05-15 2020-08-25 上海海事大学 一种基于集成学习的申请评分卡模型建立方法
CN111639815A (zh) * 2020-06-02 2020-09-08 贵州电网有限责任公司 一种多模型融合预测电网缺陷物资的方法及系统
CN112132589A (zh) * 2020-11-30 2020-12-25 四川新网银行股份有限公司 一种基于多次融合构建欺诈识别模型的方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111429970A (zh) * 2019-12-24 2020-07-17 大连海事大学 基于极端梯度提升方法进行特征选择来获取多基因风险评分的方法及系统
CN111338950A (zh) * 2020-02-25 2020-06-26 北京高质系统科技有限公司 一种基于谱聚类的软件缺陷特征选择方法
CN111325410A (zh) * 2020-03-13 2020-06-23 安图实验仪器(郑州)有限公司 基于样本分布的通用故障预警系统及其预警方法
CN111583031A (zh) * 2020-05-15 2020-08-25 上海海事大学 一种基于集成学习的申请评分卡模型建立方法
CN111639815A (zh) * 2020-06-02 2020-09-08 贵州电网有限责任公司 一种多模型融合预测电网缺陷物资的方法及系统
CN112132589A (zh) * 2020-11-30 2020-12-25 四川新网银行股份有限公司 一种基于多次融合构建欺诈识别模型的方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113985207A (zh) * 2021-10-28 2022-01-28 国网北京市电力公司 一种电网运行设备故障监测方法、系统、装置及存储介质

Similar Documents

Publication Publication Date Title
CN111639237B (zh) 一种基于聚类和关联规则挖掘的电力通信网风险评估系统
CN110034581B (zh) 风电并网下电力系统的区间电气介数脆弱性评估方法
CN103679544A (zh) 一种智能配电网运行综合评估方法
CN105471647B (zh) 一种电力通信网故障定位方法
CN109120009A (zh) 计及分布式电源出力随机变化的主动配电网故障恢复方法
CN115169931B (zh) 一种基于数字孪生的输电线路安全状态评估方法
CN112308425A (zh) 一种构建配变健康评价指标体系的方法
CN113269351A (zh) 一种面向电网设备故障概率预测的特征选择方法
CN111652478B (zh) 基于伞式算法的电力系统电压稳定评估误分类约束方法
CN115187013A (zh) 一种锂电池性能评分计算方法及系统
CN113095648A (zh) 基于数据驱动的配电网故障停电风险指标评估方法及系统
CN112686404B (zh) 一种基于配电网故障抢修的协同优化方法
CN112613684B (zh) 一种基于配网故障预测的特殊差异化运维方法
CN111105218A (zh) 一种基于全息影像技术的配电网运行监视方法
CN113722868A (zh) 一种融合结构洞特征的多指标电网节点脆弱性评估方法
CN109299752A (zh) 一种基于聚类与信息熵的废旧动力电池一致性指标的优选方法
CN116304713A (zh) 风电场故障场景预测模型的生成方法、装置和计算机设备
CN113516280A (zh) 一种基于大数据的电网设备故障概率预测的优化方法
CN115577292A (zh) 基于抽象对偶网络和连锁故障超网络的脆弱线路辨识方法
CN113466630A (zh) 一种基于rsspn模型的配电网故障原因分类方法
CN111553040B (zh) 一种基于gpu加速的电网拓扑分析高性能计算方法及装置
CN114219120A (zh) 一种输电线路的故障类型预测方法及装置
CN113705973A (zh) 一种基于神经网络学习的电网安全风险在线评估方法
CN107508279B (zh) 一种电力网络的稳定性仿真方法
CN112308424A (zh) 一种基于配变数据的供电能力分析方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination