CN111222709A - 一种国家电网树线放电预测方法 - Google Patents
一种国家电网树线放电预测方法 Download PDFInfo
- Publication number
- CN111222709A CN111222709A CN202010041126.9A CN202010041126A CN111222709A CN 111222709 A CN111222709 A CN 111222709A CN 202010041126 A CN202010041126 A CN 202010041126A CN 111222709 A CN111222709 A CN 111222709A
- Authority
- CN
- China
- Prior art keywords
- information
- sub
- historical
- tree
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 26
- 208000028659 discharge Diseases 0.000 claims abstract description 71
- 230000005540 biological transmission Effects 0.000 claims abstract description 60
- 238000012549 training Methods 0.000 claims abstract description 15
- 238000012952 Resampling Methods 0.000 claims abstract description 11
- 238000012423 maintenance Methods 0.000 claims description 6
- 239000011159 matrix material Substances 0.000 claims description 6
- 230000001502 supplementing effect Effects 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 3
- 230000007547 defect Effects 0.000 claims description 3
- 238000002372 labelling Methods 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 3
- 238000010801 machine learning Methods 0.000 abstract description 2
- 230000002354 daily effect Effects 0.000 description 9
- 230000000694 effects Effects 0.000 description 6
- 230000003203 everyday effect Effects 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 238000003066 decision tree Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/06—Electricity, gas or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Abstract
本发明公开了一种国家电网树线放电预测方法,涉及机器学习领域,用于对国家电网的电力塔杆、电力传输线路以及电力传输通道进行树线放电风险预测,包括如下步骤:采集历史信息,形成完整的历史数据,对完整的历史数据进行重采样,训练LightGBM模型,采集当前信息,形成完整的当前数据;利用训练好的LightGBM模型进行树线放电风险预测。本发明所提供的国家电网树线放电预测方法可以预测电力塔杆以及电力传输线路发生树线放电风险的概率和风险等级,提前部署相应措施。
Description
【技术领域】
本发明涉及机器学习领域,具体涉及一种国家电网树线放电预测方法。
【背景技术】
在电力行业,树障是难以清理的巨大安全隐患,一直以来,“树线”矛盾都是困扰供电安全的沉疴顽疾。每当遇到大风、雨雪等强对流天气,树木极易擦碰或倒伏在电力线路上造成跳闸,这种树木枝叶对国家电网线路造成的损害称之为树线放电。树线放电严重影响政府机关正常工作和居民日常生活,同时也给电网造成了不小的人力财力物力的损失。但是,目前对于国家电网的电力塔杆、电力传输线路出现树线放电的主要应对措施还处于加强防护和对于出现问题以后的应急,并没有对国家电网的电力塔杆、电力传输线路以及电力传输通道出现树线放电风险的可能性提前做出预警。
【发明内容】
为解决前述问题,本发明提供了一种国家电网树线放电预测方法,以预测电力塔杆、电力传输线路以及电力传输通道发生树线放电风险的概率和风险等级。
为了达到上述目的,本发明采用如下技术方案:
一种国家电网树线放电预测方法,所述国家电网树线放电预测方法用于对国家电网的电力塔杆、电力传输线路以及电力传输通道进行树线放电风险预测,包括如下步骤:
采集历史信息,对历史信息进行整理,形成完整的历史数据,完整的历史数据具有若干维度;
采用MAHAKIL算法对完整的历史数据进行重采样,形成训练数据集;
利用训练数据集训练LightGBM模型;
采集当前信息,对当前信息进行整理,形成完整的当前数据;
基于完整的当前数据,利用训练好的LightGBM模型进行树线放电风险预测。
可选的,采集历史信息包括现场维修部门部署历史信息、塔杆及线路台账历史信息、树木类型历史信息、净空距离历史信息和气象历史信息;
现场维修部门部署历史信息包括线路缺陷子信息、隐患子信息、故障子信息;
气象历史信息包括天气状况子信息、气温子信息、湿度子信息、风速子信息、风向子信息。
可选的,对历史信息进行整理,形成完整的历史数据具体包括:
基于国家电网的电力传输线路,将与同一条电力传输线路相关的历史信息及其子信息作为一条完整的历史数据,一条完整的历史数据下,不同的历史信息及其子信息作为该完整的历史数据下不同的维度;
对历史信息进行整理,确定各个历史信息下的数值子信息和/或非数值子信息;
对各个历史信息下缺失的数值子信息补充完整;
对各个历史信息下的非数值子信息进行独热编码;
独热编码后,对气象历史信息构建气象子信息,构建的气象子信息包括每日温度、每日湿度、每日风速以及每日气压的平均统计、最大值统计、最小值统计,还包括月平均降雨频数统计、月平均降雨频率统计、月平均降雪频数统计、月平均降雪频率统计。
可选的,对各个历史信息下缺失的数值子信息补充完整时,如果某一历史信息下的数值子信息缺失量超过一半,则删除该历史信息及其数值子信息;如果该历史信息下的数值子信息缺失量未超过一半,则使用该历史信息下数值子信息的平均数、中位数或行/列众数对该历史信息补充完整。
可选的,对非数值子信息进行独热编码时,将同一历史信息下的各个非数值子信息分别作为状态值,所述状态值的位数与该历史信息下的各个非数值子信息的个数相等,每个状态值中只有一位为1,其余位为0。
可选的,采用MAHAKIL算法对完整的历史数据进行重采样具体包括:
从完整的历史数据中筛选出正类样本,所述正类样本为完整的历史数据中与树线放电相关的数据;
将筛选出的正类样本记为bin,对于bin中的每一个正类样本计算马氏距离,计算公式为:
按照马氏距离对bin排序并标号,将bin从标号的中位数处一分为二,分别记为bin1、bin2,并且按标号为bin1、bin2中的每个样本指定一个唯一标签;
分别从bin1、bin2中各自随机选择一个正类样本,构成样本对,计算样本对均值,作为重采样的新的样本。
可选的,需要优化的LightGBM参数包括:基分类器个数、树最大深度、叶节点数、学习率、工具箱数、单个叶子上数据的最小数量、每次迭代中随机选择特征的比例、不进行重采样的情况下随机选择的数据。
可选的,所述LightGBM模型输出的AUC值作为LightGBM模型的适应度值。
可选的,利用训练好的LightGBM模型进行树线放电风险预测,包括对电力塔杆预测、对电力传输线路预测以及对电力传输通道;
对待预测区域的国家电网的电力传输线路划分第一区间,在任一第一区间内,任一电力塔杆的预测结果为有树线放电风险,则该第一区间电力塔杆的树线放电风险发生状态为有风险;且树线放电风险发生概率为该第一区间内所有电力塔杆预测结果为有风险的概率最大值;
在任一第一区间内,所有电力塔杆的预测结果均为无树线放电风险,则该第一区间电力塔杆的树线放电风险发生状态为无风险;
对电力传输线路的预测为待预测区域内所有第一区间电力塔杆的树线放电风险发生状态中出现次数最多的风险发生状态,电力传输线路风险发生概率为:取待预测区域内所有第一区间的电力塔杆的树线放电风险发生概率的最大值;
对待预测区域的国家电网的电力传输通道划分第二区间,对电力传输通道的预测为待预测区域内所有第二区间电力塔杆的树线放电风险发生状态中出现次数最多的风险发生状态,电力传输通道风险发生概率为:取待预测区域内所有第二区间的电力塔杆的树线放电风险发生概率的最大值。
可选的,采集的当前信息与采集的历史信息的类目相同;对当前信息进行整理,形成完整的当前数据,与对历史信息进行整理,形成完整的历史数据的步骤相同。
本发明具有如下有益效果:
1、由于国家电网树线放电数据来源不同,脏数据比较多,因此,对采集的数据进行处理,对缺失的数据补全,对非数值型的数据进行编码,不仅便于计算机识别,也避免了脏数据、缺失数据对算法效果造成负面影响。而树线放电风险在现实环境中较少,因此树线放电风险数据是不平衡数据。为了避免数据不平衡对算法效果造成负面影响,本申请采用MAHAKIL算法对数据进行重采样,使训练集中样本数量得到有效扩充,既保证了样本的多样性,又避免了生成的新样本超出边界的问题,保证数据的准确以及预测结果的准确;
2、采用LightGBM模型,避免了对于训练数据集中数据的过拟合,并且,LightGBM模型拥有更快的训练速度和更高的准确率,能够支持GPU,便于处理大规模数据,面对电网每天产生的海量数据能够及时有效的处理。以便及时发现风险并避免风险,根据风险等级辅助确定治理措施,减少人力物力的损失,提高员工工作效率。
本发明的这些特点和优点将会在下面的具体实施方式以及附图中进行详细的揭露。本发明最佳的实施方式或手段将结合附图来详尽表现,但并非是对本发明技术方案的限制。另外,在每个下文和附图中出现的这些特征、要素和组件是具有多个,并且为了表示方便而标记了不同的符号或数字,但均表示相同或相似构造或功能的部件。
【附图说明】
下面结合附图对本发明作进一步说明:
图1为本发明实施例的流程图。
【具体实施方式】
下面结合本发明实施例的附图对本发明实施例的技术方案进行解释和说明,但下述实施例仅为本发明的优选实施例,并非全部。基于实施方式中的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得其他实施例,都属于本发明的保护范围。
在本说明书中引用的“一个实施例”或“实例”或“例子”意指结合实施例本身描述的特定特征、结构或特性可被包括在本专利公开的至少一个实施例中。短语“在一个实施例中”在说明书中的各位置的出现不必都是指同一个实施例。
实施例:
如图1所示,本实施例提供一种国家电网树线放电预测方法,用于对国家电网的电力塔杆、电力传输线路以及电力传输通道进行树线放电风险预测,包括如下步骤:
采集历史信息,包括现场维修部门部署历史信息、塔杆及线路台账历史信息、树木类型历史信息、净空距离历史信息和气象历史信息,其中,现场维修部门部署历史信息包括线路缺陷子信息、隐患子信息、故障子信息;气象历史信息包括天气状况子信息、气温子信息、湿度子信息、风速子信息、风向子信息。
对采集的上述历史信息进行整理,形成完整的历史数据,完整的历史数据具有若干维度。由于国家电网树线放电数据来源不同,脏数据比较多,因此,需要对采集的历史信息进行处理,对缺失的数据补全,以避免脏数据、缺失数据对后续算法效果造成负面影响,还需要对非数值型的数据进行编码,以便于计算机读取、识别。对历史信息进行整理,形成完整的历史数据具体包括如下子步骤:
基于国家电网的电力传输线路,将与同一条电力传输线路相关的历史信息及其子信息作为一条完整的历史数据,一条完整的历史数据下,不同的历史信息及其子信息作为该完整的历史数据下不同的维度;
对历史信息进行整理,确定各个历史信息下的数值子信息和/或非数值子信息;
对各个历史信息下缺失的数值子信息补充完整:如果某一历史信息下的数值子信息缺失量超过一半,则删除该历史信息及其数值子信息;如果该历史信息下的数值子信息缺失量未超过一半,则采用相近的数值子信息合理地对缺失数值子信息的历史信息进行填补,具体可使用该历史信息下数值子信息的平均数、中位数或行/列众数对该历史信息补充完整,本实施例优选采用中位数对缺失数值子信息的历史信息补充完整。
对各个历史信息下的非数值子信息进行独热编码:将同一历史信息下的各个非数值子信息分别作为状态值,状态值的位数与该历史信息下的各个非数值子信息的个数相等,每个状态值中只有一位为1,其余位为0。进行独热编码后,各个历史信息下的非数值子信息可由计算机读取、识别并计算。
独热编码后,对气象历史信息构建气象子信息,构建的气象子信息包括每日温度、每日湿度、每日风速以及每日气压的平均统计、最大值统计、最小值统计,还包括月平均降雨频数统计、月平均降雨频率统计、月平均降雪频数统计、月平均降雪频率统计。
完成了对历史信息的整理和补全,形成完整的历史数据以后,由于树线放电风险在现实环境中较少,因此树线放电风险的完整的历史数据是不平衡数据。为了避免不平衡数据对后续算法效果的影响,保证数据的准确以及预测结果的准确,本实施例采用MAHAKIL算法对完整的历史数据进行重采样,形成训练数据集。MAHAKIL算法模拟遗传学中的繁殖过程,生成正类数据共有的新的正类数据,具体包括如下子步骤:
从完整的历史数据中筛选出正类样本,正类样本为完整的历史数据中与树线放电相关的数据;
将筛选出的正类样本记为bin,对于bin中的每一个正类样本计算马氏距离,计算公式为:
按照马氏距离对bin排序并标号,将bin从标号的中位数处一分为二,分别记为bin1、bin2,并且按标号为bin1、bin2中的每个样本指定一个唯一标签;
分别从bin1、bin2中各自随机选择一个正类样本,构成样本对,计算样本对均值,作为重采样的新的样本。
传统的样本过采样方法如SMOTE、Borderline-SMOTE、ADASYN等,都是采用K近邻方法选取样本点的最近点与之结合产生新的样本。这些方法虽然在处理不平衡样本时有不错的效果,但选择的样本都是最近邻或者是距离非常近。因此相当于只是复制了已存在的样本,并没有对分类器提供更多的信息,导致了少数类样本单一性。同时,产生的新的样本可能会拓宽少数类样本集合边界。而MAHAKIL算法既保证了少数类样本的多样性,又避免了生成的新样本超出边界的问题。
至此,已经完成了从历史信息到训练数据集的转换,利用训练数据集训练LinghtGBM模型。需要优化的LightGBM参数包括:基分类器个数、树最大深度、叶节点数、学习率、工具箱数、单个叶子上数据的最小数量、每次迭代中随机选择特征的比例、不进行重采样的情况下随机选择的数据,采用LightGBM模型输出的AUC值作为LightGBM模型的适应度值。
国家电网每天都会产生大量数据,由于树线放电数据是不平衡数据,对数据进行重采样之后会产生更多的数据。因此,本实施例采用LightGBM模型对树线放电风险进行预测。LightGBM模型主要有基于梯度的单边梯度采样(Gradient-based One-Side Sampling,GOSS)和独立特征合并(Exclusive Feature Bundle,EFB)两个方面的改进提升:
GOSS技术主要通过区分不同梯度的实例,保留较大梯度实例同时对较小梯度随机采样的方式减少计算量,从而达到提升效率的目的;
EFB主要针对高维稀疏的特征空间,由于许多特征是互斥的,将这些互斥特征绑定一个单一的特征中,通过特征扫描算法,构建与个体特征类似的基于特征束的特征直方图,以提高训练速度。
此外,LightGBM模型采用了基于直方图优化Histogram算法,将连续的特征分桶(buckets)装进离散的箱子(bins)中,优化速度和内存;采用Leaf-wise的决策树生长策略,避免了对整层节点分裂法,而采用了对增益最大的节点进行深入分解的方法。为克服过拟合,还可以采用控制单个决策树的最大深度控制;采取并行化学习的方式提高算法效率等方式。LightGBM算法拥有更快的训练速度和更高的准确率,并且能够支持GPU、便于处理大规模数据,面对电网每天产生的海量数据能够及时有效的处理,以便及时发现风险并避免风险,根据风险等级辅助确定治理措施,减少人力物力的损失,提高员工工作效率。
采集当前信息,对当前信息进行整理,形成完整的当前数据,采集的当前信息与采集的历史信息的类目相同;对当前信息进行整理,形成完整的当前数据,与对历史信息进行整理,形成完整的历史数据的步骤相同,在此不再赘述。
基于完整的当前数据,利用训练好的LightGBM模型进行树线放电风险预测,包括对电力塔杆预测、对电力传输线路预测以及对电力传输通道预测。由于建模对象是电力塔杆,而业务评估的最终对象包括电力传输线路和电力传输通道,因此本实施例中,采用分而治之的思想对电力传输线路和电力传输通道的风险状态作评估预测,即对待预测区域的国家电网进行区间划分,把电力传输线路和电力传输通道视作由若干个区间构成,再把每个区间作为由若干根连续的电力塔杆构成。因此,可以通过对电力塔杆的风险状态预测,进而评估整条电力传输线路和电力传输通道的风险状态。但是,由于国家标准对于电力传输通道作出了标准性的规定,因此,对于电力传输通道的区间划分,应在国家标准对于电力传输通道所做规定的基础上进行,其划分的方式亦在国家标准中有相关规定,因而依照国家标准规定执行;而对于电力传输线路的区间划分,则可根据实际预测需求灵活进行,本实施例中采用3km*3km的网格进行划分。电力传输线路和电力传输通道不同的划分依据导致了对于电力传输线路的区间划分和对于电力传输通道的区间划分不可通用,本实施例中,对于电力传输线路的区间划分记作第一区间,对电力传输通道的区间划分记作第二区间,以示区别:
在任一第一区间内,任一电力塔杆的预测结果为有树线放电风险,则该第一区间电力塔杆的树线放电风险发生状态为有风险;训练好的LightGBM模型可以直接计算出任一电力塔杆预测结果为有风险的概率,在本实施例中,某一第一区间树线放电风险发生概率为该第一区间内所有电力塔杆预测结果为有风险的概率的最大值;
在任一第一区间内,所有电力塔杆的预测结果均为无树线放电风险,则该第一区间电力塔杆的树线放电风险发生状态为无风险;
对电力传输线路的预测为待预测区域内所有第一区间电力塔杆的树线放电风险发生状态中出现次数最多的风险发生状态,电力传输线路风险发生概率为:取待预测区域内所有第一区间的电力塔杆的树线放电风险发生概率的最大值;
对电力传输通道的预测为待预测区域内所有第二区间电力塔杆的树线放电风险发生状态中出现次数最多的风险发生状态,电力传输通道风险发生概率为:取待预测区域内所有第二区间的电力塔杆的树线放电风险发生概率的最大值。
预测结果总体如下表所示:
以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,熟悉该本领域的技术人员应该明白本发明包括但不限于附图和上面具体实施方式中描述的内容。任何不偏离本发明的功能和结构原理的修改都将包括在权利要求书的范围中。
Claims (10)
1.一种国家电网树线放电预测方法,其特征在于,所述国家电网树线放电预测方法用于对国家电网的电力塔杆、电力传输线路以及电力传输通道进行树线放电风险预测,包括如下步骤:
采集历史信息,对历史信息进行整理,形成完整的历史数据,完整的历史数据具有若干维度;
采用MAHAKIL算法对完整的历史数据进行重采样,形成训练数据集;
利用训练数据集训练LightGBM模型;
采集当前信息,对当前信息进行整理,形成完整的当前数据;
基于完整的当前数据,利用训练好的LightGBM模型进行树线放电风险预测。
2.根据权利要求1所述的国家电网树线放电预测方法,其特征在于,采集历史信息包括现场维修部门部署历史信息、塔杆及线路台账历史信息、树木类型历史信息、净空距离历史信息和气象历史信息;
现场维修部门部署历史信息包括线路缺陷子信息、隐患子信息、故障子信息;
气象历史信息包括天气状况子信息、气温子信息、湿度子信息、风速子信息、风向子信息。
3.根据权利要求2所述的国家电网树线放电预测方法,其特征在于,对历史信息进行整理,形成完整的历史数据具体包括:
基于国家电网的电力传输线路,将与同一条电力传输线路相关的历史信息及其子信息作为一条完整的历史数据,一条完整的历史数据下,不同的历史信息及其子信息作为该完整的历史数据下不同的维度;
对历史信息进行整理,确定各个历史信息下的数值子信息和/或非数值子信息;
对各个历史信息下缺失的数值子信息补充完整;
对各个历史信息下的非数值子信息进行独热编码;
独热编码后,对气象历史信息构建气象子信息,构建的气象子信息包括每日温度、每日湿度、每日风速以及每日气压的平均统计、最大值统计、最小值统计,还包括月平均降雨频数统计、月平均降雨频率统计、月平均降雪频数统计、月平均降雪频率统计。
4.根据权利要求3所述的国家电网树线放电预测方法,其特征在于,对各个历史信息下缺失的数值子信息补充完整时,如果某一历史信息下的数值子信息缺失量超过一半,则删除该历史信息及其数值子信息;如果该历史信息下的数值子信息缺失量未超过一半,则使用该历史信息下数值子信息的平均数、中位数或行/列众数对该历史信息补充完整。
5.根据权利要求3所述的国家电网树线放电预测方法,其特征在于,对非数值子信息进行独热编码时,将同一历史信息下的各个非数值子信息分别作为状态值,所述状态值的位数与该历史信息下的各个非数值子信息的个数相等,每个状态值中只有一位为1,其余位为0。
6.根据权利要求1所述的国家电网树线放电预测方法,其特征在于,采用MAHAKIL算法对完整的历史数据进行重采样具体包括:
从完整的历史数据中筛选出正类样本,所述正类样本为完整的历史数据中与树线放电相关的数据;
将筛选出的正类样本记为bin,对于bin中的每一个正类样本计算马氏距离,计算公式为:
按照马氏距离对bin排序并标号,将bin从标号的中位数处一分为二,分别记为bin1、bin2,并且按标号为bin1、bin2中的每个样本指定一个唯一标签;
分别从bin1、bin2中各自随机选择一个正类样本,构成样本对,计算样本对均值,作为重采样的新的样本。
7.根据权利要求1所述的国家电网树线放电预测方法,其特征在于,需要优化的LightGBM参数包括:基分类器个数、树最大深度、叶节点数、学习率、工具箱数、单个叶子上数据的最小数量、每次迭代中随机选择特征的比例、不进行重采样的情况下随机选择的数据。
8.根据权利要求1所述的国家电网树线放电预测方法,其特征在于,所述LightGBM模型输出的AUC值作为LightGBM模型的适应度值。
9.根据权利要求1所述的国家电网树线放电预测方法,其特征在于,利用训练好的LightGBM模型进行树线放电风险预测,包括对电力塔杆预测、对电力传输线路预测以及对电力传输通道预测;
对待预测区域的国家电网的电力传输线路划分第一区间,在任一第一区间内,任一电力塔杆的预测结果为有树线放电风险,则该第一区间电力塔杆的树线放电风险发生状态为有风险;且树线放电风险发生概率为该第一区间内所有电力塔杆预测结果为有风险的概率最大值;
在任一第一区间内,所有电力塔杆的预测结果均为无树线放电风险,则该第一区间电力塔杆的树线放电风险发生状态为无风险;
对电力传输线路的预测为待预测区域内所有第一区间电力塔杆的树线放电风险发生状态中出现次数最多的风险发生状态,电力传输线路风险发生概率为:取待预测区域内所有第一区间的电力塔杆的树线放电风险发生概率的最大值;
对待预测区域的国家电网的电力传输通道划分第二区间,对电力传输通道的预测为待预测区域内所有第二区间电力塔杆的树线放电风险发生状态中出现次数最多的风险发生状态,电力传输通道风险发生概率为:取待预测区域内所有第二区间的电力塔杆的树线放电风险发生概率的最大值。
10.根据权利要求1至9之一所述的国家电网树线放电预测方法,其特征在于,采集的当前信息与采集的历史信息的类目相同;对当前信息进行整理,形成完整的当前数据,与对历史信息进行整理,形成完整的历史数据的步骤相同。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010041126.9A CN111222709B (zh) | 2020-01-15 | 2020-01-15 | 一种国家电网树线放电预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010041126.9A CN111222709B (zh) | 2020-01-15 | 2020-01-15 | 一种国家电网树线放电预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111222709A true CN111222709A (zh) | 2020-06-02 |
CN111222709B CN111222709B (zh) | 2023-12-12 |
Family
ID=70829508
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010041126.9A Active CN111222709B (zh) | 2020-01-15 | 2020-01-15 | 一种国家电网树线放电预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111222709B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114504157A (zh) * | 2022-01-21 | 2022-05-17 | 国网山东省电力公司寿光市供电公司 | 多功能安全帽及其工作方法 |
CN115512844A (zh) * | 2021-06-03 | 2022-12-23 | 四川大学 | 基于smote技术和随机森林算法的代谢综合征风险预测方法 |
CN117824757A (zh) * | 2024-03-06 | 2024-04-05 | 国网辽宁省电力有限公司抚顺供电公司 | 一种基于恶劣气象条件下的智能感知预警系统 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120197558A1 (en) * | 2009-10-11 | 2012-08-02 | Moshe Henig | Loads management and outages detection for smart grid |
CN105447625A (zh) * | 2015-11-12 | 2016-03-30 | 北京林业大学 | 一种架空输电线路通道树障隐患的自动判别方法 |
CN106779170A (zh) * | 2016-11-22 | 2017-05-31 | 国网安徽省电力公司 | 一种自动判别通道树障隐患的方法及装置 |
CN106845731A (zh) * | 2017-02-20 | 2017-06-13 | 重庆邮电大学 | 一种基于多模型融合的潜在换机用户发现方法 |
CN107807309A (zh) * | 2017-10-27 | 2018-03-16 | 广东电网有限责任公司中山供电局 | 一种基于大数据的输电线路故障预警方法及系统 |
CN108764544A (zh) * | 2018-05-17 | 2018-11-06 | 广东电网有限责任公司 | 线路隐患预测方法及装置 |
CN109325844A (zh) * | 2018-06-25 | 2019-02-12 | 南京工业大学 | 多维数据下的网贷借款人信用评价方法 |
CN109522599A (zh) * | 2018-10-16 | 2019-03-26 | 国电南瑞科技股份有限公司 | 一种台风导致的输电线路突发故障预警方法 |
CN109657977A (zh) * | 2018-12-19 | 2019-04-19 | 重庆誉存大数据科技有限公司 | 一种风险识别方法和系统 |
CN110675243A (zh) * | 2019-08-30 | 2020-01-10 | 北京银联金卡科技有限公司 | 一种融合机器学习的信贷预测逾期方法及系统 |
-
2020
- 2020-01-15 CN CN202010041126.9A patent/CN111222709B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120197558A1 (en) * | 2009-10-11 | 2012-08-02 | Moshe Henig | Loads management and outages detection for smart grid |
CN105447625A (zh) * | 2015-11-12 | 2016-03-30 | 北京林业大学 | 一种架空输电线路通道树障隐患的自动判别方法 |
CN106779170A (zh) * | 2016-11-22 | 2017-05-31 | 国网安徽省电力公司 | 一种自动判别通道树障隐患的方法及装置 |
CN106845731A (zh) * | 2017-02-20 | 2017-06-13 | 重庆邮电大学 | 一种基于多模型融合的潜在换机用户发现方法 |
CN107807309A (zh) * | 2017-10-27 | 2018-03-16 | 广东电网有限责任公司中山供电局 | 一种基于大数据的输电线路故障预警方法及系统 |
CN108764544A (zh) * | 2018-05-17 | 2018-11-06 | 广东电网有限责任公司 | 线路隐患预测方法及装置 |
CN109325844A (zh) * | 2018-06-25 | 2019-02-12 | 南京工业大学 | 多维数据下的网贷借款人信用评价方法 |
CN109522599A (zh) * | 2018-10-16 | 2019-03-26 | 国电南瑞科技股份有限公司 | 一种台风导致的输电线路突发故障预警方法 |
CN109657977A (zh) * | 2018-12-19 | 2019-04-19 | 重庆誉存大数据科技有限公司 | 一种风险识别方法和系统 |
CN110675243A (zh) * | 2019-08-30 | 2020-01-10 | 北京银联金卡科技有限公司 | 一种融合机器学习的信贷预测逾期方法及系统 |
Non-Patent Citations (2)
Title |
---|
贺梅,顾汉明: "致密砂岩气藏储层类型识别——类不均衡问题讨论" * |
邵亚洁: "基于复合CatBoost模型的P2P网贷违约分类预测" * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115512844A (zh) * | 2021-06-03 | 2022-12-23 | 四川大学 | 基于smote技术和随机森林算法的代谢综合征风险预测方法 |
CN115512844B (zh) * | 2021-06-03 | 2023-05-23 | 四川大学 | 基于smote技术和随机森林算法的代谢综合征风险预测方法 |
CN114504157A (zh) * | 2022-01-21 | 2022-05-17 | 国网山东省电力公司寿光市供电公司 | 多功能安全帽及其工作方法 |
CN117824757A (zh) * | 2024-03-06 | 2024-04-05 | 国网辽宁省电力有限公司抚顺供电公司 | 一种基于恶劣气象条件下的智能感知预警系统 |
Also Published As
Publication number | Publication date |
---|---|
CN111222709B (zh) | 2023-12-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111222709B (zh) | 一种国家电网树线放电预测方法 | |
CN110598726A (zh) | 一种基于随机森林的输电杆塔鸟害风险预测方法 | |
CN111275193A (zh) | 一种国家电网雷击预测方法 | |
CN112749904A (zh) | 基于深度学习的配电网故障风险预警方法及系统 | |
CN111080039B (zh) | 一种风机集群故障预测方法及系统 | |
CN111797146A (zh) | 一种基于大数据的设备缺陷关联分析方法 | |
CN116231871B (zh) | 一种基于数字孪生的电网态势监管方法、系统及存储介质 | |
CN116307212B (zh) | 一种空气质量预测方法及系统 | |
CN111210086B (zh) | 一种国家电网覆冰灾害预测方法 | |
CN110766215B (zh) | 基于特征自适应选择和wdnn的风电爬坡事件预测方法 | |
CN113379005B (zh) | 一种电网电力设备能源智能管理系统及方法 | |
CN111291027B (zh) | 一种数据预处理方法 | |
CN110909994A (zh) | 基于大数据驱动的小水电群发电量预测方法 | |
CN113536944A (zh) | 基于图像识别的配电线路巡检数据识别及分析方法 | |
CN112817954A (zh) | 一种基于多种方法集成学习的缺失值插补方法 | |
CN110273818B (zh) | 一种基于轴变换粗细度分类的风机叶片结冰故障监测方法 | |
CN116663393A (zh) | 一种基于随机森林的配电网持续高温下故障风险等级预测方法 | |
CN116050666A (zh) | 一种辐照特征聚类的光伏发电功率预测方法 | |
CN111310785A (zh) | 一种国家电网机械外破预测方法 | |
KR101286909B1 (ko) | 수치모델에 접합 가능한 유전알고리즘 인터페이스 시스템 | |
CN112925760B (zh) | 一种异构同源的电网灾害数据共享服务实现方法 | |
CN114330478A (zh) | 针对电网风速预报的风速分类订正方法 | |
CN111275298B (zh) | 一种基于电网的地质灾害风险预警方法 | |
CN113219303B (zh) | 一种小电流接地系统单相接地故障数据的提取方法 | |
CN113902346B (zh) | 一种电力抢修队伍的智能调拨方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20231107 Address after: 102488 No. 3 Jinguang Road, Liangxiang Industrial Development Zone, Fangshan District, Beijing Applicant after: Ultra high voltage branch of State Grid Jibei Electric Power Co.,Ltd. Address before: Room B1-201-28, No. 198, Qidi Road, Xiaoshan Economic and Technological Development Zone, Xiaoshan District, Hangzhou City, Zhejiang Province, 311200 Applicant before: HANGZHOU HUAWANG INFORMATION TECHNOLOGY CO.,LTD. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |