CN109492783A - 一种基于gbdt的电力计量设备故障风险预测方法 - Google Patents
一种基于gbdt的电力计量设备故障风险预测方法 Download PDFInfo
- Publication number
- CN109492783A CN109492783A CN201811350524.8A CN201811350524A CN109492783A CN 109492783 A CN109492783 A CN 109492783A CN 201811350524 A CN201811350524 A CN 201811350524A CN 109492783 A CN109492783 A CN 109492783A
- Authority
- CN
- China
- Prior art keywords
- failure
- application
- power metering
- gbdt
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 55
- 238000013058 risk prediction model Methods 0.000 claims abstract description 36
- 238000009825 accumulation Methods 0.000 claims abstract description 18
- 230000007257 malfunction Effects 0.000 claims abstract description 16
- 239000010754 BS 2869 Class F Substances 0.000 claims abstract description 8
- 238000012549 training Methods 0.000 claims description 23
- 238000012360 testing method Methods 0.000 claims description 13
- 238000012544 monitoring process Methods 0.000 abstract description 6
- 238000012423 maintenance Methods 0.000 description 11
- 238000003066 decision tree Methods 0.000 description 5
- 230000002265 prevention Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000009412 basement excavation Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000005611 electricity Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000011056 performance test Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
- 238000012954 risk control Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/20—Administration of product repair or maintenance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Health & Medical Sciences (AREA)
- Educational Administration (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供的基于GBDT的电力计量设备故障风险预测方法,包括:根据获取的待预测的电力计量设备样本的基本数据,确定与待预测的电力计量设备样本对应的故障风险预测模型和特征集,其中,特征集包括与电力计量设备样本对应的故障大类F、故障小类f、闲置时间T、在运时间R和产权单位;将特征集作为特征集故障风险预测模型的输入,确定待预测的电力计量设备样本的预测寿命,其中,预测寿命为:与指定的电力计量设备故障概率对应的累积使用时间;或与指定的累积使用时间在对应的电力计量设备故障概率。本发明提供的预测方法,可以准确地确定电力计量设备的预测寿命,从而实现对电力计量设备运行状态的有效监控。
Description
技术领域
本发明涉及电网运维技术领域,并且更具体地,涉及一种基于GBDT的电力计量设备故障风险预测方法。
背景技术
目前,难以对电网中投入的电力计量设备进行有效的监控,会发生大面积范围内发生计量设备故障的运维事故。
另外,目前,电力计量设备通常采用定时更换的维修模式。也就是,达到预先设定的投入年限后,同一生产批次的电力计量设备会全部更换为新的智能电能表。
这种维修模式造带来大量的维修工作,造成大量尚未失效的智能电能表提前终止使用,造成了资金和工人作业时间上的浪费。
发明内容
本发明提供了一种基于GBDT的电力计量设备故障风险预测方法,以实现对智能电表运行状态的有效监控,并通过采取必要的运维措施,控制或预防大面积范围内发生计量设备故障。
本发明提供的基于GBDT的电力计量设备故障风险预测方法,包括:
根据获取的待预测的电力计量设备样本的基本数据,确定与待预测的电力计量设备样本对应的故障风险预测模型和特征集,其中,特征集包括与电力计量设备样本对应的故障大类F、故障小类f、闲置时间T、在运时间R和产权单位;
将特征集作为特征集故障风险预测模型的输入,确定待预测的电力计量设备样本的预测寿命,其中,预测寿命为:与指定的电力计量设备故障概率对应的累积使用时间;或
与指定的累积使用时间在对应的电力计量设备故障概率。
进一步地,该方法中,
故障风险预测模型包括基于GBDT回归器的寿命预测子模型;
基于GBDT回归器的寿命预测子模型的输入特征集包括至少一个故障小类和/或至少一个故障小类的发生概率;
基于GBDT回归器的寿命预测子模型的输出特征集包括:电力计量设备的预测寿命。
进一步地,该方法中,故障风险预测模型还包括基于GBDT分类器的故障小类预测子模型;
基于GBDT分类器的故障小类预测子模型的输入特征集包括至少一个故障大类和/或至少一个故障大类的发生概率;
基于GBDT分类器的故障小类预测子模型的输出特征集包括:至少一个故障小类和/或至少一个故障小类的发生概率;
寿命预测子模型的输入特征集包括故障小类预测子模型的输出特征集。
进一步地,该方法中,故障风险预测模型还包括基于GBDT分类器的故障大类预测子模型;
基于GBDT分类器的故障大类预测子模型的输入特征包括:闲置时间T和产权单位;
基于GBDT分类器的故障大类预测子模型的输出特征包括:至少一个故障大类和/或至少一个故障大类的发生概率;
故障小类预测子模型的输入特征集包括故障大类预测子模型的输出特征集。
进一步地,该方法中,在确定与待预测的电力计量设备样本对应的故障风险预测模型和特征集之前,还包括:
根据获取的已拆卸的电力计量设备样本的基本数据,形成与厂商编号或招标批次号或产权单位相对应的故障设备训练集和故障设备测试集,其中,故障设备训练集和故障设备测试集中包括故障设备的寿命L;
利用故障设备训练集和故障设备测试集,确定基于GBDT分类器和/或GBDT回归器的故障风险预测模型,故障风险预测模型中包括至少一个基于GBDT分类器和/或GBDT回归器的预测子模型。
进一步地,该方法中,特征集中还包括:与产权单位对应的环境温湿度信息。
进一步地,该方法中,在确定待预测的电力计量设备样本的预测寿命后,根据预先设定的运维红线,生成红线累积使用时间。
进一步地,该方法中,闲置时间T为安装时间与到货时间的差值。
进一步地,该方法中,在运时间R为当前时间与安装时间的差值。
进一步地,该方法中,故障设备的寿命L为拆卸时间与安装时间的差值。
与现有技术相比,本发明提供的基于GBDT的电力计量设备故障风险预测方法,采用了GBDT来进行电力计量设备运维数据的挖掘,形成故障风险预测模型的稳定性和准确性得到大幅提高;根据用电信息采集系统获取的电力计量设备的基本数据,可以准确地确定电力计量设备的预测寿命,从而实现对电力计量设备运行状态的有效监控,并通过采取必要的运维措施,控制或预防大面积范围内发生计量设备故障。
附图说明
通过参考下面的附图,可以更为完整地理解本发明的示例性实施方式:
图1为本发明优选实施方式的基于GBDT的电力计量设备故障风险预测方法的流程示意图;
图2是本发明优选实施方式的基于GBDT的电力计量设备故障风险预测方法的流程示意图;
图3是本发明优选实施方式中智能电表的寿命曲线示意图。
具体实施方式
现在参考附图介绍本发明的示例性实施方式,然而,本发明可以用许多不同的形式来实施,并且不局限于此处描述的实施例,提供这些实施例是为了详尽地且完全地公开本发明,并且向所属技术领域的技术人员充分传达本发明的范围。对于表示在附图中的示例性实施方式中的术语并不是对本发明的限定。在附图中,相同的单元/元件使用相同的附图标记。
除非另有说明,此处使用的术语(包括科技术语)对所属技术领域的技术人员具有通常的理解含义。另外,可以理解的是,以通常使用的词典限定的术语,应当被理解为与其相关领域的语境具有一致的含义,而不应该被理解为理想化的或过于正式的意义。
目前,电网用户用电基础信息不断完善,用电信息采集范围和采集成功率逐步扩大提高,用电信息采集系统所积累的海量运行数据已能够为计量装置在线监测、故障知识库建立等诸多业务提供数据支持。
通大数据挖掘等相关技术手段,有效利用故障数据和历史运行数据,对计量装置的故障形态和潜伏形式进行挖掘分析,可望实现对电网现场设备运行风险的有效预测和监控,并为设备运维工作提供有效的技术支撑。
如图1所示,本发明一个实施例的基于GBDT的电力计量设备故障风险预测方法,包括:
步骤S100:根据获取的待预测的电力计量设备样本的基本数据,确定与待预测的电力计量设备样本对应的故障风险预测模型和特征集,其中,特征集包括与电力计量设备样本对应的故障大类F、故障小类f、闲置时间T、在运时间R和产权单位;
应该理解为,待预测的电力计量设备样本的基本数据是通过用电信息采集系统获取的。
待预测的电力计量设备样本可以从采用相同技术规范、具有相同检定证书的电力计量设备中选取,如具有相同的厂商编号,或相同的招标批次号,或相同的产权单位的多个电力计量设备。
步骤S200:将特征集作为特征集故障风险预测模型的输入,确定待预测的电力计量设备样本的预测寿命,其中,预测寿命为:与指定的电力计量设备故障概率对应的累积使用时间;或
与指定的累积使用时间在对应的电力计量设备故障概率。
进一步地,该方法中,
故障风险预测模型包括基于GBDT回归器的寿命预测子模型;
基于GBDT回归器的寿命预测子模型的输入特征集包括至少一个故障小类和/或至少一个故障小类的发生概率;
基于GBDT回归器的寿命预测子模型的输出特征集包括:电力计量设备的预测寿命。
进一步地,该方法中,故障风险预测模型还包括基于GBDT分类器的故障小类预测子模型;
基于GBDT分类器的故障小类预测子模型的输入特征集包括至少一个故障大类和/或至少一个故障大类的发生概率;
基于GBDT分类器的故障小类预测子模型的输出特征集包括:至少一个故障小类和/或至少一个故障小类的发生概率;
寿命预测子模型的输入特征集包括故障小类预测子模型的输出特征集。
进一步地,该方法中,故障风险预测模型还包括基于GBDT分类器的故障大类预测子模型;
基于GBDT分类器的故障大类预测子模型的输入特征包括:闲置时间T和产权单位;
基于GBDT分类器的故障大类预测子模型的输出特征包括:至少一个故障大类和/或至少一个故障大类的发生概率;
故障小类预测子模型的输入特征集包括故障大类预测子模型的输出特征集。
进一步地,该方法中,在确定与待预测的电力计量设备样本对应的故障风险预测模型和特征集之前,还包括:
根据获取的已拆卸的电力计量设备样本的基本数据,形成与厂商编号或招标批次号或产权单位相对应的故障设备训练集和故障设备测试集,其中,故障设备训练集和故障设备测试集中包括故障设备的寿命L;
利用故障设备训练集和故障设备测试集,确定基于GBDT分类器和/或GBDT回归器的故障风险预测模型,故障风险预测模型中包括至少一个基于GBDT分类器和/或GBDT回归器的预测子模型。
应该理解为,已拆卸的电力计量设备样本的基本数据是通过用电信息采集系统获取的。
进一步地,该方法中,特征集中还包括:与产权单位对应的环境温湿度信息。
进一步地,该方法中,在确定待预测的电力计量设备样本的预测寿命后,根据预先设定的运维红线,生成红线累积使用时间。
应该理解为,这里的运维红线,即预先设定的故障概率,或可靠度。
该红线累积使用时间用于向运维人员发出警示,以提醒运维人员通过采取必要的运维措施,控制或预防大面积范围内发生计量设备故障。
进一步地,该方法中,闲置时间T为安装时间与到货时间的差值。
进一步地,该方法中,在运时间R为当前时间与安装时间的差值。
进一步地,该方法中,故障设备的寿命L为拆卸时间与安装时间的差值。
以下以对电力计量设备中常用的智能电表的潜在故障风险类别进行有效预测为例,对本发明提供的方法进行说明。本实施例的智能电表故障风险预测方法可以实现对智能电表运行状态的有效监控,通过采取必要的运维措施,控制或预防大面积范围内发生计量设备故障。
具体地,如图2所示,该基于GBDT的电力计量设备故障风险预测方法,包括:
1)、对用电信息采集系统获取的电力计量设备的数据进行预处理。
具体地,可以将用电信息采集系统获取的原始数据,进行变量选择、数据替换、过滤异常、变量替换、数据分割到数据集等诸多处理。
以上数据处理方法均为本领域技术人员所公知,这里不再赘述。
具体地,针对用电信息采集系统获取的智能电表的原始数据,采用如下方法来抽取数据中的特征:
(1)定义闲置时间T,闲置时间=安装时间–到货时间;
(2)定义寿命L,寿命=拆除时间–安装时间
(3)定义在运时间R,在运时间=当前时间–安装时间
(4)将故障小类f及产权单位标签化。
需要说明的是,闲置时间T和寿命L的物理单位均选择为“天”,从而便于后续进行寿命预测。
应该理解为,当前时间即当前预测时的自然时间,单位为天。
需要说明的是,针对在运(尚未因故障而拆卸)的智能电表,其在运时间也作为一个故障风险预测的输入特征。需要说明的是,鉴于故障大类的总数量较少,可以直接将其自然序号的编号作为每一个故障大类的标签。如表1所列,“工作质量”这一故障大类对应的标签为“1”。
为便于建立基于GBDT分类器的故障小类预测子模型,可以采用英文字母序列(全部为大写或者全部为小写)或自然数序列逐一对应地为多个故障小类f设置标签;
相似地,可以采用英文字母序列(全部为大写或者全部为小写)或自然数序列逐一对应地为多个产权单位设置标签。
需要说明的是,表1中列出的故障大类和故障小类的具体内容,可以是故障原因,也可以是故障表征。
需要说明的是,针对用电信息采集系统获取的智能电表的运维数据,还可以确定表1所示的各故障大类和各故障小类分别对应的发生概率。
表1故障大类及故障小类列表
经过上述的预处理后,最终确定的用于智能电表故障风险预测的特征可以包括:厂商编号、招标批次号、故障大类F、故障小类f、闲置时间T、寿命L和产权单位。以上多个特征均加入到智能电表故障风险预测模型对应的特征集中。
根据以往运行经验表明,智能电表的寿命取决于智能电表内部的电子元器件的使用寿命。而智能电表内部的电子元器件的使用寿命会受到天气的影响,例如在多雨潮湿的气候条件下电子元器件的寿命会缩短。
因此,根据智能电表所属的产权单位所属的地理位置,进一步可以从公开的天气预报或信息网页中爬取自安装时间或自到货时间到拆除时间为止,该地理位置对应的详细的天气信息,预处理后得到电表在运期间的环境温湿度信息,如以天为间隔的温度和/或湿度数据。
优选地,将产权单位对应的环境温湿度信息也作为一个特征加入到智能电表故障风险预测模型对应的特征集中。
需要说明的是,默认采用相同技术规范、具有相同检定证书的智能电表具有相同的故障模式和寿命曲线,可以采用相同的故障风险预测模型来预测其寿命。
而采用相同技术规范、具有相同检定证书的智能电表可能具有相同的厂商编号,或相同的招标批次号,或相同的产权单位。
在进行指定的产权单位的智能电表的故障风险预测时,首先选择采用相同技术规范、具有相同检定证书,已经利用训练集预先训练且经过测试集验证过准确度和稳定性的故障风险预测模型。
2)、对电力计量设备进行故障风险预测
在对电力计量设备进行故障风险预测时使用的故障风险预测模型中,故障风险预测的目标依次有三个:故障大类和其发生概率、故障小类和其发生概率以及设备寿命。
具体地,如图2所示,该故障风险预测模型依次包括三个梯度提升决策树GBDT(Gradient Boosting Decision Tree,以下简称GBDT)子模型;依次利用这三个子模型,可以逐一地预测得到上述三个预测目标值。并且,这3个预测目标值之间具有相关性,前一个步骤预测得到的目标值作为后一个的输入值。
具体地,将当前待预测的智能电表样本的闲置时间T、产权单位信息作为输入,利用故障大类预测子模型预测得到当前待预测的智能电表样本对应的故障大类和其发生概率;
随后,将预测得到的故障大类、闲置时间T和产权单位信息作为故障小类预测子模型的输入,利用故障小类预测子模型预测得到当前待预测的智能电表样本对应的故障小类和其发生概率;
随后,将闲置时间T、产权单位信息、预测得到的故障大类和/或其发生概率、预测得到的故障小类和/或其发生概率作为寿命预测子模型的输入,利用寿命预测子模型预测得到当前待预测的智能电表样本对应的预测寿命;
其中,预测寿命的表达方法为:与指定的智能电表故障概率对应的累积使用时间。
或与指定的累积使用时间在对应的故障概率。
在故障小类预测时,由于实际运维工作中更关心设备本身因素导致的故障,即表1中列出的第4类故障大类,为提高预测模型的适用性和预测效率,将故障大类作为整个故障风险预测模型的一个限制条件加入特征集中;并且,在训练故障小类预测子模型时,只选择故障大类为4的数据作为训练集。
优选地,具体实施时,以智能电表的闲置时间、产权单位和/或在运时间为输入特征,利用基于GBDT分类器的故障大类预测子模型得到发生概率最大的两个故障大类F1和F2;
随后,将这两个故障大类F1和F2分别作为输入特征,利用基于GBDT分类器的故障小类子预测模型得到发生概率最大的两个故障小类f1和f2;
随后,将这两个故障大类F1和F2与两个故障小类f1和f2的发生概率交叉相乘,可得到两个故障大类与这两个故障小类组合后对应的4个发生概率p1,p2,p3,p4。
将这两个故障大类与这两个故障小类组合及对应的4个发生概率p1,p2,p3,p4作为输入特征,利用基于GBDT回归器的寿命预测子模型分别预测以上故障大类和故障小类组合后的智能电表的寿命,得到故障风险预测模型的最终输出,也即当前待预测的智能电表样本对应的故障概率或预测的累积使用时间。
需要说明的是,为了避免故障风险预测模型准确度对预测结果准确度的影响,在本实施例中,分别输出4种故障原因组合及其对应的故障概率或预测的累积使用时间,从而可以进一步提高模型的可用性,对实际工作提供有效的指导。
这时,这四种输出结果均可作为当前待预测的智能电表样本对应的预测寿命。
进一步地,利用故障风险预测模型得到的针对厂商编号和/或招标批次号和/或产权单位的智能电表的预测寿命服从正态分布,也即满足如图3所示的故障概率累计分布曲线。
图3中,实线为智能电表的故障概率相对于安装时间(也即累积使用时间)的变化趋势。从图3中可以看出,当智能电表的累积使用日期(也即上述安装时间)到达某一天时,智能电表发生故障的概率开始随时间不断增加,直至为1。
如图3所示,根据以往运维经验,可以设定故障概率40%为运维红线。当智能电表发生故障的概率到达40%(如图3中虚线所示)时,即发出警告提示运维人员,以方便其提前准备好更换设备及人员安排,从而可以有效地为国网运维工作提供技术支撑。
综上,该基于GBDT的电力计量设备故障风险预测方法采用了GBDT来进行数据挖掘,使得计量设备故障风险预测的稳定性和准确性得到了大幅提高。
需要说明的是,在利用预先确定的训练集和测试集训练故障风险预测模型并最终确定图2所示的2个GBDT分类器和1个GBDT回归器时,分别选择了查准率、查全率和F1分数作为评价分类器性能的指标。
查准率也称精确率,是指在一定实验条件下的多个测定值中,满足限定条件的测定值所占的比例;查全率也称召回率,是指预测出的真正例和实际值所有的真正例的比率;F1分数可以看作是模型的查准率和查全率的一种加权平均。
在利用预先确定的训练集和测试集训练故障风险预测模型时,除外基于GBDT的分类器和回归器之外,还分别采用了逻辑回归、神经网络、adaboost和决策树等多种分类器和回归器。经过验证,GBDT在电力计量设备故障风险预测模型建立及执行预测任务时,准确度和训练速度都明显好过其他的分类器或回归器。
如具体地,在故障大类预测子模型训练时,分别将训练集和测试集经过上述多种分类器进行分类,并将预测得到的故障大类结果与真实的故障大类结果进行比对,以智能电表的故障大类的命中率作为性能测试的准确率。
经过验证,基于GBDT分类器的故障大类预测子模型在模型建立及执行预测任务时,准确度和训练速度都明显好过其他的分类器。
究其原因,在于由于GBDT将多个决策树组合在一起来并行地逼近真实值,可以经过反复调参不断提升模型精确度。
另外,模型训练时,也验证了以下结论:在决策树深度超过3以后基本对准确度的提升没有太大作用,反而严重影响训练速度。
以上已经通过参考少量实施方式描述了本发明。然而,本领域技术人员所公知的,正如附带的专利权利要求所限定的,除了本发明以上公开的其他的实施例等同地落在本发明的范围内。
通常地,在权利要求中使用的所有术语都根据他们在技术领域的通常含义被解释,除非在其中被另外明确地定义。所有的参考“一个/所述/该[装置、组件等]”都被开放地解释为所述装置、组件等中的至少一个实例,除非另外明确地说明。这里公开的任何方法的步骤都没必要以公开的准确的顺序运行,除非明确地说明。
Claims (10)
1.一种基于GBDT的电力计量设备故障风险预测方法,其特征在于,包括:
根据获取的待预测的电力计量设备样本的基本数据,确定与所述待预测的电力计量设备样本对应的故障风险预测模型和特征集,其中,所述特征集包括与所述电力计量设备样本对应的故障大类F、故障小类f、闲置时间T、在运时间R和产权单位;
将所述特征集作为所述特征集故障风险预测模型的输入,确定待预测的电力计量设备样本的预测寿命,其中,所述预测寿命为:与指定的电力计量设备故障概率对应的累积使用时间;或
与指定的累积使用时间在对应的电力计量设备故障概率。
2.根据权利要求1所述的方法,其特征在于,
所述故障风险预测模型包括基于GBDT回归器的寿命预测子模型;
所述基于GBDT回归器的寿命预测子模型的输入特征集包括至少一个故障小类和/或所述至少一个故障小类的发生概率;
所述基于GBDT回归器的寿命预测子模型的输出特征集包括:所述电力计量设备的预测寿命。
3.根据权利要求2所述的方法,其特征在于,
所述故障风险预测模型还包括基于GBDT分类器的故障小类预测子模型;
所述基于GBDT分类器的故障小类预测子模型的输入特征集包括至少一个故障大类和/或所述至少一个故障大类的发生概率;
所述基于GBDT分类器的故障小类预测子模型的输出特征集包括:至少一个故障小类和/或所述至少一个故障小类的发生概率;
所述寿命预测子模型的输入特征集包括所述故障小类预测子模型的输出特征集。
4.根据权利要求3所述的方法,其特征在于,
所述故障风险预测模型还包括基于GBDT分类器的故障大类预测子模型;
所述基于GBDT分类器的故障大类预测子模型的输入特征包括:闲置时间T和产权单位;
所述基于GBDT分类器的故障大类预测子模型的输出特征包括:至少一个故障大类和/或所述至少一个故障大类的发生概率;
所述故障小类预测子模型的输入特征集包括所述故障大类预测子模型的输出特征集。
5.根据权利要求1所述的方法,其特征在于,
在确定与所述待预测的电力计量设备样本对应的故障风险预测模型和特征集之前,还包括:
根据获取的已拆卸的电力计量设备样本的基本数据,形成与厂商编号或招标批次号或产权单位相对应的故障设备训练集和故障设备测试集,其中,所述故障设备训练集和故障设备测试集中包括故障设备的寿命L;
利用所述故障设备训练集和故障设备测试集,确定基于GBDT分类器和/或GBDT回归器的故障风险预测模型,所述故障风险预测模型中包括至少一个基于GBDT分类器和/或GBDT回归器的预测子模型。
6.根据权利要求1所述的方法,其特征在于,
所述特征集中还包括:与产权单位对应的环境温湿度信息。
7.根据权利要求1所述的方法,其特征在于,
在确定待预测的电力计量设备样本的预测寿命后,根据预先设定的运维红线,生成红线累积使用时间。
8.根据权利要求1所述的方法,其特征在于,
所述闲置时间T为安装时间与到货时间的差值。
9.根据权利要求1所述的方法,其特征在于,
所述在运时间R为当前时间与安装时间的差值。
10.根据权利要求5所述的方法,其特征在于,
所述故障设备的寿命L为拆卸时间与安装时间的差值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811350524.8A CN109492783B (zh) | 2018-11-14 | 2018-11-14 | 一种基于gbdt的电力计量设备故障风险预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811350524.8A CN109492783B (zh) | 2018-11-14 | 2018-11-14 | 一种基于gbdt的电力计量设备故障风险预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109492783A true CN109492783A (zh) | 2019-03-19 |
CN109492783B CN109492783B (zh) | 2023-09-15 |
Family
ID=65695821
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811350524.8A Active CN109492783B (zh) | 2018-11-14 | 2018-11-14 | 一种基于gbdt的电力计量设备故障风险预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109492783B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111275298A (zh) * | 2020-01-15 | 2020-06-12 | 杭州华网信息技术有限公司 | 一种基于电网的地质灾害风险预警方法 |
CN112948205A (zh) * | 2021-02-22 | 2021-06-11 | 国网新疆电力有限公司营销服务中心(资金集约中心、计量中心) | 一种新型电力计量监控系统 |
CN114089257A (zh) * | 2021-10-27 | 2022-02-25 | 国网湖南省电力有限公司 | 一种电能表烧表在线监测方法、系统及介质 |
CN114202432A (zh) * | 2022-02-18 | 2022-03-18 | 深圳市金斧子网络科技有限公司 | 一种私募基金风险评级方法、装置及存储介质 |
CN114236448A (zh) * | 2021-11-23 | 2022-03-25 | 国网山东省电力公司日照供电公司 | 一种基于大数据的计量装置故障检修系统 |
CN115600695A (zh) * | 2022-09-06 | 2023-01-13 | 北京航天计量测试技术研究所(Cn) | 一种计量设备的故障诊断方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110004419A1 (en) * | 2009-07-01 | 2011-01-06 | Kohji Ue | Apparatus, system, and method of determining apparatus state |
CN106154209A (zh) * | 2016-07-29 | 2016-11-23 | 国电南瑞科技股份有限公司 | 基于决策树算法的电能表故障预测方法 |
CN206431773U (zh) * | 2017-02-10 | 2017-08-22 | 国网山东省电力公司东营供电公司 | 智能电力塔杆拉线防盗装置 |
CN107967485A (zh) * | 2017-11-16 | 2018-04-27 | 国网冀北电力有限公司电力科学研究院 | 用电计量设备故障分析方法及装置 |
CN108375715A (zh) * | 2018-03-08 | 2018-08-07 | 中国电力科学研究院有限公司 | 一种配电网线路故障风险日预测方法及系统 |
CN108681750A (zh) * | 2018-05-21 | 2018-10-19 | 阿里巴巴集团控股有限公司 | Gbdt模型的特征解释方法和装置 |
-
2018
- 2018-11-14 CN CN201811350524.8A patent/CN109492783B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110004419A1 (en) * | 2009-07-01 | 2011-01-06 | Kohji Ue | Apparatus, system, and method of determining apparatus state |
CN106154209A (zh) * | 2016-07-29 | 2016-11-23 | 国电南瑞科技股份有限公司 | 基于决策树算法的电能表故障预测方法 |
CN206431773U (zh) * | 2017-02-10 | 2017-08-22 | 国网山东省电力公司东营供电公司 | 智能电力塔杆拉线防盗装置 |
CN107967485A (zh) * | 2017-11-16 | 2018-04-27 | 国网冀北电力有限公司电力科学研究院 | 用电计量设备故障分析方法及装置 |
CN108375715A (zh) * | 2018-03-08 | 2018-08-07 | 中国电力科学研究院有限公司 | 一种配电网线路故障风险日预测方法及系统 |
CN108681750A (zh) * | 2018-05-21 | 2018-10-19 | 阿里巴巴集团控股有限公司 | Gbdt模型的特征解释方法和装置 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111275298A (zh) * | 2020-01-15 | 2020-06-12 | 杭州华网信息技术有限公司 | 一种基于电网的地质灾害风险预警方法 |
CN111275298B (zh) * | 2020-01-15 | 2023-11-28 | 国网浙江省电力有限公司杭州供电公司 | 一种基于电网的地质灾害风险预警方法 |
CN112948205A (zh) * | 2021-02-22 | 2021-06-11 | 国网新疆电力有限公司营销服务中心(资金集约中心、计量中心) | 一种新型电力计量监控系统 |
CN114089257A (zh) * | 2021-10-27 | 2022-02-25 | 国网湖南省电力有限公司 | 一种电能表烧表在线监测方法、系统及介质 |
CN114089257B (zh) * | 2021-10-27 | 2023-08-18 | 国网湖南省电力有限公司 | 一种电能表烧表在线监测方法、系统及介质 |
CN114236448A (zh) * | 2021-11-23 | 2022-03-25 | 国网山东省电力公司日照供电公司 | 一种基于大数据的计量装置故障检修系统 |
CN114202432A (zh) * | 2022-02-18 | 2022-03-18 | 深圳市金斧子网络科技有限公司 | 一种私募基金风险评级方法、装置及存储介质 |
CN115600695A (zh) * | 2022-09-06 | 2023-01-13 | 北京航天计量测试技术研究所(Cn) | 一种计量设备的故障诊断方法 |
CN115600695B (zh) * | 2022-09-06 | 2023-10-17 | 北京航天计量测试技术研究所 | 一种计量设备的故障诊断方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109492783B (zh) | 2023-09-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109492783A (zh) | 一种基于gbdt的电力计量设备故障风险预测方法 | |
CN109614997A (zh) | 一种基于深度学习的窃电风险预测方法及装置 | |
Lopez | Methods for evaluating value-at-risk estimates | |
CN108897954A (zh) | 基于BootStrap置信度计算的风电机组温度预警方法及其系统 | |
CN110097297A (zh) | 一种多维度窃电态势智能感知方法、系统、设备及介质 | |
CN106154209A (zh) | 基于决策树算法的电能表故障预测方法 | |
CN103488869A (zh) | 一种最小二乘支持向量机的风力发电短期负荷预测方法 | |
CN109508835A (zh) | 一种融合环境反馈的智慧电网短期电力负荷预测方法 | |
CN112149873B (zh) | 一种基于深度学习的低压台区线损合理区间预测方法 | |
CN107229993A (zh) | 一种基于km‑apso‑svm模型的短期电力负荷预测方法 | |
CN107665385A (zh) | 一种微电网系统用的基于支持向量机的短期负荷预测方法 | |
CN111949939B (zh) | 基于改进topsis和聚类分析的智能电表运行状态评价方法 | |
CN105406461B (zh) | 一种配电网停电事件的负荷自适应动态监测方法 | |
CN107730097B (zh) | 一种母线负荷预测方法、装置及计算设备 | |
CN110535149A (zh) | 一种公变台区电力负荷三相不平衡预测方法 | |
CN110535159A (zh) | 一种规模化储能电站运行单元故障预警的方法及系统 | |
CN107644297A (zh) | 一种电机系统节能量计算和验证方法 | |
Xu et al. | Intelligent Systems for Stability Assessment and Control of Smart Power Grids | |
CN107679089A (zh) | 一种用于电力传感数据的清洗方法、装置和系统 | |
CN110968703B (zh) | 基于lstm端到端抽取算法的异常计量点知识库构建方法及系统 | |
Zhao et al. | Short-term microgrid load probability density forecasting method based on k-means-deep learning quantile regression | |
CN109978236A (zh) | 一种基于特征组合的小水电短期功率精细化预测方法 | |
CN106845755A (zh) | 一种停电检修计划编制业务水平评估方法及系统 | |
CN111310121A (zh) | 一种新能源出力概率预测方法和系统 | |
CN110135511A (zh) | 电力系统时间断面的确定方法、装置以及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |