CN111275193A - 一种国家电网雷击预测方法 - Google Patents

一种国家电网雷击预测方法 Download PDF

Info

Publication number
CN111275193A
CN111275193A CN202010041688.3A CN202010041688A CN111275193A CN 111275193 A CN111275193 A CN 111275193A CN 202010041688 A CN202010041688 A CN 202010041688A CN 111275193 A CN111275193 A CN 111275193A
Authority
CN
China
Prior art keywords
information
sub
historical information
historical
lightning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010041688.3A
Other languages
English (en)
Inventor
吴和俊
熊志刚
王敏康
陆宇宁
程田宝
胡驰远
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Huawang Information Technology Co ltd
Original Assignee
Hangzhou Huawang Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Huawang Information Technology Co ltd filed Critical Hangzhou Huawang Information Technology Co ltd
Priority to CN202010041688.3A priority Critical patent/CN111275193A/zh
Publication of CN111275193A publication Critical patent/CN111275193A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/174Redundancy elimination performed by the file system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/12Computing arrangements based on biological models using genetic models
    • G06N3/126Evolutionary algorithms, e.g. genetic algorithms or genetic programming
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Software Systems (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Biology (AREA)
  • Quality & Reliability (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Development Economics (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Game Theory and Decision Science (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Primary Health Care (AREA)
  • Water Supply & Treatment (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Public Health (AREA)
  • Educational Administration (AREA)
  • Physiology (AREA)
  • Genetics & Genomics (AREA)
  • Biomedical Technology (AREA)

Abstract

本发明公开了一种国家电网雷击预测方法,涉及机器学习领域,用于对国家电网的电力传输线路、电力塔杆进行雷击风险预测,包括如下步骤:采集历史信息,形成完整的历史数据,完整的历史数据的维度即为数据特征,对数据特征进行选择,训练Catboost模型,采集当前信息,形成完整的当前数据,利用训练好的Catboost模型进行雷击风险预测。本发明所提供的方法可以预测电力塔杆以及电力传输线路发生雷击风险的概率和风险等级,提前部署应对措施。

Description

一种国家电网雷击预测方法
【技术领域】
本发明涉及机器学习领域,具体涉及一种国家电网雷击预测方法。
【背景技术】
随着我国电力行业的不断发展壮大,国家电网的输电线路规模也在不断扩大。但是由于很多输电线路都设铺设野外,并且电力塔杆本身高度较高,因而经常遭受到雷击,造成线路跳闸、损毁,严重影响电力系统的正常运行,对居民生活造成不便。目前,面对国家电网可能遭受的雷击风险,主要措施还停留在加强避雷措施、加强输电线路本体强度、采取一些应急措施等方法进行应对,并没有对国家电网的电力塔杆、电力传输线路以及电力传输通道出现雷击风险的可能性提前做出预警。
【发明内容】
为解决前述问题,本发明提供了一种国家电网雷击预测方法,以预测电力塔杆、电力传输线路以及电力传输通道发生雷击风险的概率和风险等级。
为了达到上述目的,本发明采用如下技术方案:
一种国家电网雷击预测方法,所述国家电网雷击预测方法用于对国家电网的电力塔杆、电力传输线路以及电力传输通道进行雷击风险预测,包括如下步骤:
采集历史信息,对历史信息进行整理,形成完整的历史数据,完整的历史数据具有若干维度,所述维度即为数据特征;
采用遗传算法对数据特征进行选择,得到训练特征集;
利用训练特征集中的训练特征训练Catboost模型;
采集当前信息,对当前信息进行整理,形成完整的当前数据;
基于完整的当前数据,利用训练好的Catboost模型进行雷击风险预测。
可选的,集历史信息包括现场维修部门部署历史信息、雷电历史信息、地形地貌历史信息、塔杆及线路台账历史信息和气象历史信息;
现场维修部门部署历史信息包括线路缺陷子信息、隐患子信息、故障子信息;
气象历史信息包括天气状况子信息、气温子信息、湿度子信息、风速子信息、风向子信息。
可选的,对历史信息进行整理,形成完整的历史数据具体包括:
基于国家电网的电力传输线路,将与同一条电力传输线路相关的历史信息及其子信息作为一条完整的历史数据,一条完整的历史数据下,不同的历史信息及其子信息作为该完整的历史数据下不同的维度;
对历史信息进行整理,确定各个历史信息下的数值子信息和/或非数值子信息;
对各个历史信息下缺失的数值子信息补充完整;
对各个历史信息下的非数值子信息进行独热编码;
独热编码后,对气象历史信息构建气象子信息,构建的气象子信息包括每日温度、每日湿度、每日风速以及每日气压的平均统计、最大值统计、最小值统计,还包括月平均降雨频数统计、月平均降雨频率统计、月平均降雪频数统计、月平均降雪频率统计。
可选的,对各个历史信息下缺失的数值子信息补充完整时,如果某一历史信息下的数值子信息缺失量超过一半,则删除该历史信息及其数值子信息;如果该历史信息下的数值子信息缺失量未超过一半,则使用该历史信息下数值子信息的平均数、中位数或行/列众数对该历史信息补充完整。
可选的,对非数值子信息进行独热编码时,将同一历史信息下的各个非数值子信息分别作为状态值,所述状态值的位数与该历史信息下的各个非数值子信息的个数相等,每个状态值中只有一位为1,其余位为0。
可选的,采用遗传算法对数据特征进行选择具体包括:
步骤1:设置初始的种群的大小M、终止代数T、选择概率、交叉概率以及变异概率,其中,所述种群为对所有数据特征是否选择的编码,初始的种群的大小M为随机生成的对数据特征是否选择的编码的个数;
步骤2:将训练特征进行编码;
步骤3:确定适应度函数,计算种群中每个个体的适应度;
步骤4:根据选择概率从父代种群中选择个体;
步骤5:以交叉概率进行交叉操作,在确定交叉码位后,通过交换双亲的部分码位产生新的个体;
步骤6:以变异概率进行变异操作,将个体染色体编码串中的基因座上的部分基因值用该基因座上的其它等位基因替换,从而形成新的个体;
步骤7:如果当前迭代的代数t<终止代数T,则对当前迭代的代数t加1,转到步骤2重新进行,如果当前迭代的代数t=终止代数T,结束运算,将运算得到的适应度最大的个体作为最优解输出。
可选的,所述Catboost模型被训练的参数包括学习率learning_rate、树最大深度max_depth、最大决策树数目iterations、L2正则化系数l2_leaf_reg、损失函数loss_function、数值特征分割数border_count、类别特征分割数ctr_border_count。
可选的,所述Catboost模型输出的AUC值作为Catboost模型的适应度值。
可选的,利用训练好的Catboost模型进行雷击风险预测,包括对电力塔杆预测、对电力传输线路预测和对电力传输通道预测;
对待预测区域的国家电网的电力传输线路划分第一区间,在任一第一区间内,任一电力塔杆的预测结果是有雷击风险,则该第一区间电力塔杆的雷击风险发生状态为有风险;且雷击风险发生概率为该第一区间内所有电力塔杆预测结果为有风险的概率最大值;
在任一第一区间内,所有电力塔杆的预测结果均为无雷击风险,则该第一区间电力塔杆的雷击风险发生状态为无风险;
对电力传输线路的预测为待预测区域内所有第一区间电力塔杆的雷击风险发生状态中出现次数最多的风险发生状态,电力传输线路风险发生概率为取待预测区域内所有第一区间的电力塔杆的雷击风险发生概率的最大值;
对待预测区域的国家电网的电力传输通道划分第二区间,对电力传输通道的预测为待预测区域内所有第二区间电力塔杆的雷击风险发生状态中出现次数最多的风险发生状态,电力传输通道风险发生概率为取待预测区域内所有第二区间的电力塔杆的雷击风险发生概率的最大值。
可选的,采集的当前信息与采集的历史信息的类目相同;对当前信息进行整理,形成完整的当前数据,与对历史信息进行整理,形成完整的历史数据的步骤相同。
本发明具有如下有益效果:
1、由于国家电网遭受雷击的数据来源不同,脏数据比较多,因此,对采集的数据进行处理,对缺失的数据补全,对非数值型的数据进行编码,不仅便于计算机识别,也避免了脏数据、缺失数据对算法效果造成负面影响。而由于雷击风险数据来源较多,并且数据的维度较高,因此,采用遗传算法高效的、并行的筛选出数量合适的最优数据作为训练集,避免数据冗余导致计算速度减慢,同时还能保证数据的准确以及预测结果的准确;
2、采用Catboost模型,避免了对于训练集过拟合的问题,减少从低频类别获得的噪声,同时具有卓越的性能和鲁棒性,易于使用,进一步保证预测结果的准确性和稳定性,以便及时发现风险并避免风险,根据风险等级辅助确定治理措施,减少人力物力的损失,提高员工工作效率。
本发明的这些特点和优点将会在下面的具体实施方式以及附图中进行详细的揭露。本发明最佳的实施方式或手段将结合附图来详尽表现,但并非是对本发明技术方案的限制。另外,在每个下文和附图中出现的这些特征、要素和组件是具有多个,并且为了表示方便而标记了不同的符号或数字,但均表示相同或相似构造或功能的部件。
【附图说明】
下面结合附图对本发明作进一步说明:
图1为本发明实施例的流程图;
图2为本发明实施例中采用遗传算法对数据特征进行选择的流程图。
【具体实施方式】
下面结合本发明实施例的附图对本发明实施例的技术方案进行解释和说明,但下述实施例仅为本发明的优选实施例,并非全部。基于实施方式中的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得其他实施例,都属于本发明的保护范围。
在本说明书中引用的“一个实施例”或“实例”或“例子”意指结合实施例本身描述的特定特征、结构或特性可被包括在本专利公开的至少一个实施例中。短语“在一个实施例中”在说明书中的各位置的出现不必都是指同一个实施例。
实施例:
如图1所示,本实施例提供一种国家电网雷击预测方法,用于对国家电网的电力塔杆、电力传输线路和电力传输通道进行雷击风险预测,包括如下步骤:
采集历史信息,包括现场维修部门部署历史信息、雷电历史信息、地形地貌历史信息、塔杆及线路台账历史信息和气象历史信息,其中,现场维修部门部署历史信息包括线路缺陷子信息、隐患子信息、故障子信息;气象历史信息包括天气状况子信息、气温子信息、湿度子信息、风速子信息、风向子信息。
对历史信息进行整理,形成完整的历史数据,完整的历史数据具有若干维度,维度即为数据特征。由于国家电网机械外破数据来源不同,脏数据比较多,因此,需要对采集的历史信息进行处理,对缺失的数据补全,以避免脏数据、缺失数据对后续算法效果造成负面影响,还需要对非数值型的数据进行编码,以便于计算机读取、识别。对历史信息进行整理,形成完整的历史数据具体包括如下子步骤:
基于国家电网的电力传输线路,将与同一条电力传输线路相关的历史信息及其子信息作为一条完整的历史数据,一条完整的历史数据下,不同的历史信息及其子信息作为该完整的历史数据下不同的维度;
对历史信息进行整理,确定各个历史信息下的数值子信息和/或非数值子信息;
对各个历史信息下缺失的数值子信息补充完整:如果某一历史信息下的数值子信息缺失量超过一半,则删除该历史信息及其数值子信息;如果该历史信息下的数值子信息缺失量未超过一半,则采用相近的数值子信息合理地对缺失数值子信息的历史信息进行填补,具体可使用该历史信息下数值子信息的平均数、中位数或行/列众数对该历史信息补充完整,本实施例优选采用中位数对缺失数值子信息的历史信息补充完整。
对各个历史信息下的非数值子信息进行独热编码:将同一历史信息下的各个非数值子信息分别作为状态值,状态值的位数与该历史信息下的各个非数值子信息的个数相等,每个状态值中只有一位为1,其余位为0。进行独热编码后,各个历史信息下的非数值子信息可由计算机读取、识别并计算。
独热编码后,对气象历史信息构建气象子信息,构建的气象子信息包括每日温度、每日湿度、每日风速以及每日气压的平均统计、最大值统计、最小值统计,还包括月平均降雨频数统计、月平均降雨频率统计、月平均降雪频数统计、月平均降雪频率统计。
完成了对历史信息的整理和补全,形成完整的历史数据以后,由于完整的历史数据的维度,即数据特征较多,因此,需要对众多的数据特征进行筛选,筛选出数量适中的最优特征作为训练特征集,以避免数据冗余导致计算速度减慢,本实施例采用遗传算法对数据特征进行选择,得到训练特征集,具体包括:
步骤1:设置初始的种群的大小M、终止代数T、选择概率、交叉概率以及变异概率,其中,种群即对所有数据特征是否选择的编码,初始的种群的大小M为随机生成的对数据特征是否选择的编码的个数;
步骤2:将训练特征进行编码;
步骤3:确定适应度函数,计算种群中每个个体的适应度;
步骤4:根据选择概率从父代种群中选择个体;
步骤5:以交叉概率进行交叉操作,在确定交叉码位后,通过交换双亲的部分码位产生新的个体;
步骤6:以变异概率进行变异操作,将个体染色体编码串中的基因座上的部分基因值用该基因座上的其它等位基因替换,从而形成新的个体;
步骤7:如果当前迭代的代数t<终止代数T,则对当前迭代的代数t加1,转到步骤2重新进行,如果当前迭代的代数t=终止代数T,结束运算,将运算得到的适应度最大的个体作为最优解输出,选择出一组最优特征,将余下的特征作为训练特征集。
遗传算法是一种随机全局搜索和优化的方法,它模仿了自然界生物进化的机制,借鉴了达尔文和孟德尔的遗传学说,是一种高效的、并行的、全局搜索的方法,可以自动地获取和积累有关的搜索空间知识,并且能够自适应地控制搜索过程从而求得最优解。
至此,已经完成了从历史信息到训练特征集的转换,利用得到的训练特征集训练Catboost模型。Catboost模型被训练的参数包括学习率learning_rate、树最大深度max_depth、最大决策树数目iterations、L2正则化系数l2_leaf_reg、损失函数loss_function、数值特征分割数border_count、类别特征分割数ctr_border_count;Catboost模型输出的AUC值作为Catboost模型的适应度值。
Catboost模型是一个新的开源的梯度提升框架,其优点如下:
自动处理类别特征:传统式的集成学习算法对于类别特征处理都是直接转换为数值型特征,如one-hot编码,但是类别特征并没有大小之分。另一种类别特征的处理方式是采用标签计算一些统计量,但是容易过度拟合。而Catboost模型为了避免过拟合,使用了更有效的策略,对于输入的集合进行随机排列,生成多个随机排列,添加先验值有助于减少从低频类别获得的噪声。
特征组合:Catboost模型中采用的是对称完成二叉树,每次划分两条路径,划分的顺序是随机的,特征划分后维度数并没有减少,但是用来划分的特征会与另一个类别特征相结合以形成新特征,即从所有可能的组合中选择出最最优解。
克服梯度偏差:Catboost模型和所有标准梯度提升算法一样,都是通过构建新树来拟合当前模型的梯度。然而,所有经典的提升算法都存在由有偏的点态梯度估计引起的过拟合问题。许多利用GBDT技术的算法(例如,XGBoost、LightGBM),构建一棵树分为两个阶段:选择树结构和在树结构固定后计算叶子节点的值。为了选择最佳的树结构,算法通过枚举不同的分割,用这些分割构建树,对得到的叶子节点中计算值,然后对得到的树计算评分,最后选择最佳的分割。两个阶段叶子节点的值都是被当做梯度或牛顿步长的近似值来计算。CatBoost第一阶段采用梯度步长的无偏估计,第二阶段使用传统的GBDT方案执行。
Catboost模型具有卓越的性能和鲁棒性,易于使用,进一步保证预测结果的准确性和稳定性,以便及时发现风险并避免风险,根据风险等级辅助确定治理措施,减少人力物力的损失,提高员工工作效率。
采集当前信息,对当前信息进行整理,形成完整的当前数据,采集的当前信息与采集的历史信息的类目相同;对当前信息进行整理,形成完整的当前数据,与对历史信息进行整理,形成完整的历史数据的步骤相同,在此不再赘述。
基于完整的当前数据,利用训练好的Catboost模型进行机械外破风险预测,包括对电力塔杆预测、电力传输线路和电力传输通道预测。由于建模对象是电力塔杆,而业务评估的最终对象包括电力传输线路和电力传输通道,因此本实施例中,采用分而治之的思想对电力传输线路和电力传输通道风险状态作评估预测,即对待预测区域的国家电网进行区间划分,把电力传输线路和电力传输通道视作由若干个区间构成,再把每个区间作为由若干根连续的电力塔杆构成。因此,可以通过对电力塔杆的风险状态预测,进而评估整条电力传输线路和电力传输通道的风险状态。但是,由于国家标准对于电力传输通道作出了标准性的规定,因此,对于电力传输通道的区间划分,应在国家标准对于电力传输通道所做规定的基础上进行,其划分的方式亦在国家标准中有相关规定,因而依照国家标准规定执行;而对于电力传输线路的区间划分,则可根据实际预测需求灵活进行,本实施例中采用3km*3km的网格进行划分。电力传输线路和电力传输通道不同的划分依据导致了对于电力传输线路的区间划分和对于电力传输通道的区间划分不可通用,本实施例中,对于电力传输线路的区间划分记作第一区间,对电力传输通道的区间划分记作第二区间,以示区别:
在任一第一区间内,任一电力塔杆的预测结果是有雷击风险,则该第一区间电力塔杆的雷击风险发生状态为有风险;训练好的Catboost模型可以直接计算出任一电力塔杆预测结果为有风险的概率,在本实施例中,某一第一区间雷击风险发生概率为该第一区间内所有电力塔杆预测结果为有风险的概率的最大值;
在任一第一区间内,所有电力塔杆的预测结果均为无雷击风险,则该第一区间电力塔杆的雷击风险发生状态为无风险;
对电力传输线路的预测为待预测区域内所有第一区间电力塔杆的雷击风险发生状态中出现次数最多的风险发生状态,电力传输线路风险发生概率为:取待预测区域内所有第一区间的电力塔杆的雷击风险发生概率的最大值;
对电力传输通道的预测为待预测区域内所有第二区间电力塔杆的雷击风险发生状态中出现次数最多的风险发生状态,电力传输通道风险发生概率为取待预测区域内所有第二区间的电力塔杆的雷击风险发生概率的最大值。
预测结果总体如下表所示:
Figure BDA0002367984880000071
以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,熟悉该本领域的技术人员应该明白本发明包括但不限于附图和上面具体实施方式中描述的内容。任何不偏离本发明的功能和结构原理的修改都将包括在权利要求书的范围中。

Claims (10)

1.一种国家电网雷击预测方法,其特征在于,所述国家电网雷击预测方法用于对国家电网的电力塔杆、电力传输线路和电力传输通道进行雷击风险预测,包括如下步骤:
采集历史信息,对历史信息进行整理,形成完整的历史数据,完整的历史数据具有若干维度,所述维度即为数据特征;
采用遗传算法对数据特征进行选择,得到训练特征集;
利用训练特征集中的训练特征训练Catboost模型;
采集当前信息,对当前信息进行整理,形成完整的当前数据;
基于完整的当前数据,利用训练好的Catboost模型进行雷击风险预测。
2.根据权利要求1所述的国家电网雷击预测方法,其特征在于,采集历史信息包括现场维修部门部署历史信息、雷电历史信息、地形地貌历史信息、塔杆及线路台账历史信息和气象历史信息;
现场维修部门部署历史信息包括线路缺陷子信息、隐患子信息、故障子信息;
气象历史信息包括天气状况子信息、气温子信息、湿度子信息、风速子信息、风向子信息。
3.根据权利要求1所述的国家电网雷击预测方法,其特征在于,对历史信息进行整理,形成完整的历史数据具体包括:
基于国家电网的电力传输线路,将与同一条电力传输线路相关的历史信息及其子信息作为一条完整的历史数据,一条完整的历史数据下,不同的历史信息及其子信息作为该完整的历史数据下不同的维度;
对历史信息进行整理,确定各个历史信息下的数值子信息和/或非数值子信息;
对各个历史信息下缺失的数值子信息补充完整;
对各个历史信息下的非数值子信息进行独热编码;
独热编码后,对气象历史信息构建气象子信息,构建的气象子信息包括每日温度、每日湿度、每日风速以及每日气压的平均统计、最大值统计、最小值统计,还包括月平均降雨频数统计、月平均降雨频率统计、月平均降雪频数统计、月平均降雪频率统计。
4.根据权利要求3所述的国家电网雷击预测方法,其特征在于,对各个历史信息下缺失的数值子信息补充完整时,如果某一历史信息下的数值子信息缺失量超过一半,则删除该历史信息及其数值子信息;如果该历史信息下的数值子信息缺失量未超过一半,则使用该历史信息下数值子信息的平均数、中位数或行/列众数对该历史信息补充完整。
5.根据权利要求3所述的国家电网雷击预测方法,其特征在于,对非数值子信息进行独热编码时,将同一历史信息下的各个非数值子信息分别作为状态值,所述状态值的位数与该历史信息下的各个非数值子信息的个数相等,每个状态值中只有一位为1,其余位为0。
6.根据权利要求1所述的国家电网雷击预测方法,其特征在于,采用遗传算法对数据特征进行选择具体包括:
步骤1:设置初始的种群的大小M、终止代数T、选择概率、交叉概率以及变异概率,其中,所述种群为对所有数据特征是否选择的编码,初始的种群的大小M为随机生成的对数据特征是否选择的编码的个数;
步骤2:将训练特征进行编码;
步骤3:确定适应度函数,计算种群中每个个体的适应度;
步骤4:根据选择概率从父代种群中选择个体;
步骤5:以交叉概率进行交叉操作,在确定交叉码位后,通过交换双亲的部分码位产生新的个体;
步骤6:以变异概率进行变异操作,将个体染色体编码串中的基因座上的部分基因值用该基因座上的其它等位基因替换,从而形成新的个体;
步骤7:如果当前迭代的代数t<终止代数T,则对当前迭代的代数t加1,转到步骤2重新进行,如果当前迭代的代数t=终止代数T,结束运算,将运算得到的适应度最大的个体作为最优解输出。
7.根据权利要求1所述的国家电网雷击预测方法,其特征在于,所述Catboost模型被训练的参数包括学习率learning_rate、树最大深度max_depth、最大决策树数目iterations、L2正则化系数l2_leaf_reg、损失函数loss_function、数值特征分割数border_count、类别特征分割数ctr_border_count。
8.根据权利要求1所述的国家电网雷击预测方法,其特征在于,所述Catboost模型输出的AUC值作为Catboost模型的适应度值。
9.根据权利要求1所述的国家电网雷击预测方法,其特征在于,利用训练好的Catboost模型进行雷击风险预测,包括对电力塔杆预测、对电力传输线路预测和对电力传输通道预测;
对待预测区域的国家电网的电力传输线路划分第一区间,在任一第一区间内,任一电力塔杆的预测结果是有雷击风险,则该第一区间电力塔杆的雷击风险发生状态为有风险;且雷击风险发生概率为该第一区间内所有电力塔杆预测结果为有风险的概率最大值;
在任一第一区间内,所有电力塔杆的预测结果均为无雷击风险,则该第一区间电力塔杆的雷击风险发生状态为无风险;
对电力传输线路的预测为待预测区域内所有第一区间电力塔杆的雷击风险发生状态中出现次数最多的风险发生状态,电力传输线路风险发生概率为取待预测区域内所有第一区间的电力塔杆的雷击风险发生概率的最大值;
对待预测区域的国家电网的电力传输通道划分第二区间,对电力传输通道的预测为待预测区域内所有第二区间电力塔杆的雷击风险发生状态中出现次数最多的风险发生状态,电力传输通道风险发生概率为取待预测区域内所有第二区间的电力塔杆的雷击风险发生概率的最大值。
10.根据权利要求1至9之一所述的国家电网雷击预测方法,其特征在于,采集的当前信息与采集的历史信息的类目相同;对当前信息进行整理,形成完整的当前数据,与对历史信息进行整理,形成完整的历史数据的步骤相同。
CN202010041688.3A 2020-01-15 2020-01-15 一种国家电网雷击预测方法 Pending CN111275193A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010041688.3A CN111275193A (zh) 2020-01-15 2020-01-15 一种国家电网雷击预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010041688.3A CN111275193A (zh) 2020-01-15 2020-01-15 一种国家电网雷击预测方法

Publications (1)

Publication Number Publication Date
CN111275193A true CN111275193A (zh) 2020-06-12

Family

ID=71000296

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010041688.3A Pending CN111275193A (zh) 2020-01-15 2020-01-15 一种国家电网雷击预测方法

Country Status (1)

Country Link
CN (1) CN111275193A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112016246A (zh) * 2020-08-26 2020-12-01 国网湖南省电力有限公司长沙市望城区供电分公司 基于防雷效率预测的电磁泄流型避雷器分布优化方法
CN112147718A (zh) * 2020-09-23 2020-12-29 广东电网有限责任公司 一种架空输电线路的雷击预测方法、装置、存储介质
CN114386537A (zh) * 2022-03-23 2022-04-22 中国华能集团清洁能源技术研究院有限公司 基于CatBoost的锂电池故障诊断方法、装置及电子设备
CN116363116A (zh) * 2023-04-12 2023-06-30 周晓菲 输电铁塔雷击概率分时判断系统
CN117934482A (zh) * 2024-03-25 2024-04-26 云南能源投资股份有限公司 一种风电机的雷击概率预测方法、装置、设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016146046A (ja) * 2015-02-06 2016-08-12 株式会社Jsol 予測装置、予測方法及びプログラム
CN106780141A (zh) * 2016-12-15 2017-05-31 贵州电网有限责任公司电力科学研究院 一种基于流形学习的输电线路检修计划优化方法及系统
CN107832875A (zh) * 2017-10-27 2018-03-23 云南电网有限责任公司电力科学研究院 一种改进遗传算法优化支持向量机的输电线路雷击缺陷预测方法
CN110533265A (zh) * 2019-09-20 2019-12-03 云南电网有限责任公司电力科学研究院 一种配电网雷击预警方法以及配电网雷击预警装置
CN110675243A (zh) * 2019-08-30 2020-01-10 北京银联金卡科技有限公司 一种融合机器学习的信贷预测逾期方法及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016146046A (ja) * 2015-02-06 2016-08-12 株式会社Jsol 予測装置、予測方法及びプログラム
CN106780141A (zh) * 2016-12-15 2017-05-31 贵州电网有限责任公司电力科学研究院 一种基于流形学习的输电线路检修计划优化方法及系统
CN107832875A (zh) * 2017-10-27 2018-03-23 云南电网有限责任公司电力科学研究院 一种改进遗传算法优化支持向量机的输电线路雷击缺陷预测方法
CN110675243A (zh) * 2019-08-30 2020-01-10 北京银联金卡科技有限公司 一种融合机器学习的信贷预测逾期方法及系统
CN110533265A (zh) * 2019-09-20 2019-12-03 云南电网有限责任公司电力科学研究院 一种配电网雷击预警方法以及配电网雷击预警装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
邵亚洁: "基于复合CatBoost模型的P2P网贷违约分类预测" *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112016246A (zh) * 2020-08-26 2020-12-01 国网湖南省电力有限公司长沙市望城区供电分公司 基于防雷效率预测的电磁泄流型避雷器分布优化方法
CN112147718A (zh) * 2020-09-23 2020-12-29 广东电网有限责任公司 一种架空输电线路的雷击预测方法、装置、存储介质
CN114386537A (zh) * 2022-03-23 2022-04-22 中国华能集团清洁能源技术研究院有限公司 基于CatBoost的锂电池故障诊断方法、装置及电子设备
CN114386537B (zh) * 2022-03-23 2023-02-07 中国华能集团清洁能源技术研究院有限公司 基于CatBoost的锂电池故障诊断方法、装置及电子设备
CN116363116A (zh) * 2023-04-12 2023-06-30 周晓菲 输电铁塔雷击概率分时判断系统
CN116363116B (zh) * 2023-04-12 2023-09-01 周晓菲 输电铁塔雷击概率分时判断系统
CN117934482A (zh) * 2024-03-25 2024-04-26 云南能源投资股份有限公司 一种风电机的雷击概率预测方法、装置、设备及存储介质
CN117934482B (zh) * 2024-03-25 2024-05-28 云南能源投资股份有限公司 一种风电机的雷击概率预测方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN111275193A (zh) 一种国家电网雷击预测方法
CN112910690A (zh) 基于神经网络模型的网络流量预测方法、装置及设备
CN112561190B (zh) 一种基于离散粒子群算法的光伏电站清洗模型预测方法
CN111222709B (zh) 一种国家电网树线放电预测方法
CN114580762A (zh) 一种基于XGBoost的水文预报误差校正方法
KR20230056606A (ko) 머신 러닝 기반의 시뮬레이션된 자연 생태 식생 구축 방법, 시스템 및 장비
CN106919645A (zh) 复杂地貌大景区的景点气象要素智能精细预测方法
CN116993000A (zh) 基于随机森林及元胞自动机的果树病虫害防治预测方法
CN113052386A (zh) 基于随机森林算法的分布式光伏日发电量预测方法和装置
CN116340830B (zh) 一种基于深层记忆模型的高速公路机电系统故障分类方法
CN116702937A (zh) 一种基于K-means均值聚类及优化BP神经网络的光伏出力日前预测方法
CN104268635A (zh) 一种基于再分析资料的测风网络布局优化方法
CN116340726A (zh) 一种能源经济大数据清洗方法、系统、设备及存储介质
CN116050666A (zh) 一种辐照特征聚类的光伏发电功率预测方法
CN111210086B (zh) 一种国家电网覆冰灾害预测方法
CN117761802A (zh) 一种基于联邦学习的风电场气象预报算法
CN116663393A (zh) 一种基于随机森林的配电网持续高温下故障风险等级预测方法
CN117477536A (zh) 一种考虑光伏的居民非侵入式负荷分解方法、系统及介质
CN112686404A (zh) 一种基于配电网故障抢修的协同优化方法
Su et al. A new data mining model for hurricane intensity prediction
CN117290673A (zh) 一种基于多模型融合的船舶能耗高精度预测系统
CN117114185A (zh) 一种气象灾害下配电系统故障预警方法及系统
CN116562641A (zh) 基于mobwo-km算法的高耗能工厂负荷特性分析方法
CN117033923A (zh) 一种基于可解释性机器学习的犯罪数量预测方法及系统
CN111310785A (zh) 一种国家电网机械外破预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200612