CN111292020B - 一种基于随机森林的电网实时运行风险评估方法及系统 - Google Patents
一种基于随机森林的电网实时运行风险评估方法及系统 Download PDFInfo
- Publication number
- CN111292020B CN111292020B CN202010174831.6A CN202010174831A CN111292020B CN 111292020 B CN111292020 B CN 111292020B CN 202010174831 A CN202010174831 A CN 202010174831A CN 111292020 B CN111292020 B CN 111292020B
- Authority
- CN
- China
- Prior art keywords
- power grid
- real
- data
- random forest
- operation risk
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000007637 random forest analysis Methods 0.000 title claims abstract description 90
- 238000000034 method Methods 0.000 title claims abstract description 85
- 238000012502 risk assessment Methods 0.000 title claims abstract description 39
- 238000012549 training Methods 0.000 claims abstract description 62
- 238000012360 testing method Methods 0.000 claims abstract description 33
- 238000012795 verification Methods 0.000 claims abstract description 29
- 238000004458 analytical method Methods 0.000 claims abstract description 27
- 238000004364 calculation method Methods 0.000 claims abstract description 11
- 238000003066 decision tree Methods 0.000 claims description 32
- 230000008569 process Effects 0.000 claims description 15
- 230000005540 biological transmission Effects 0.000 claims description 10
- 238000004422 calculation algorithm Methods 0.000 claims description 8
- 230000009466 transformation Effects 0.000 claims description 7
- 238000007781 pre-processing Methods 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 4
- 238000010200 validation analysis Methods 0.000 claims 3
- 239000000203 mixture Substances 0.000 claims 1
- 238000005457 optimization Methods 0.000 claims 1
- 239000002994 raw material Substances 0.000 claims 1
- 238000012854 evaluation process Methods 0.000 abstract description 2
- 238000011156 evaluation Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 6
- 238000003860 storage Methods 0.000 description 6
- 238000004590 computer program Methods 0.000 description 5
- 238000001556 precipitation Methods 0.000 description 4
- 238000009826 distribution Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J3/00—Circuit arrangements for ac mains or ac distribution networks
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Development Economics (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Quality & Reliability (AREA)
- Life Sciences & Earth Sciences (AREA)
- Power Engineering (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Educational Administration (AREA)
- Evolutionary Computation (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于随机森林的电网实时运行风险评估方法及系统,包括,数据中心模块将电网运行风险历史数据和实时数据进行预处理,分别得到训练集、验证集和测试集;控制模块对获得的训练集和测试集进行随机森林生成训练,生成电网运行风险判定随机森林智能体,结合计算模块判定验证集的准确率是否满足结果输出要求;分析模块利用满足准确率的随机森林智能体进行实时运行风险判定分析,实时获得电网运行风险判定结果。本发明能够根据相关因素的取值情况直接评估运行风险,从而避免复杂的电网全景建模、设备可靠性评估过程,在满足实时判定误差要求的前提下,大幅降低实时判定的耗时,有力支撑大电网运行风险在线分析的要求。
Description
技术领域
本发明涉及电网风险评估技术领域,尤其涉及一种基于随机森林的电网实时运行风险评估方法及系统。
背景技术
传统的电网实时运行风险评估方法需要对电网全景建模,考虑不同的气象条件下输变电设备故障概率,扫描不同类型、不同概率故障发生后的事故风险,并量化其事故后果,通过统计不同概率下的事故风险后果,计算电网实时运行风险。上述实施过程中,无论电网全景建模、设备可靠性评估还是事故后果量化,每一个环节均涉及复杂的建模过程和庞大的计算工作量,导致准确评估耗时极长。为此,当前主要通过简化模型来提高计算效率。然而即便如此,任意时刻的电网运行风险评估都往往需要消耗几个甚至十几个小时,依然难以满足实时运行要求。
本文提出一种基于随机森林的电网实时运行风险评估方法。通过挖掘电网运行特征实现对运行风险的评估,结合电网实时运行风险评估问题实际,构建了运行风险相关因素库,利用历史数据对随机森林智能体训练,实现了对电网实时运行风险等级的高效辨识。
发明内容
本部分的目的在于概述本发明的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本申请的说明书摘要和发明名称中可能会做些简化或省略以避免使本部分、说明书摘要和发明名称的目的模糊,而这种简化或省略不能用于限制本发明的范围。
鉴于上述现有存在的问题,提出了本发明。
因此,本发明提供了一种基于随机森林的电网实时运行风险评估方法,能够大幅降低实时判定的耗时。
为解决上述技术问题,本发明提供如下技术方案:包括,数据中心模块将电网运行风险历史数据和实时数据进行预处理,分别得到训练集、验证集和测试集;控制模块对获得的所述训练集和所述测试集进行随机森林生成训练,生成电网运行风险判定随机森林智能体,结合计算模块判定所述验证集的准确率是否满足结果输出要求;分析模块利用满足所述准确率的所述随机森林智能体进行实时运行风险判定分析,实时获得所述电网运行风险判定结果。
作为本发明所述的一种基于随机森林的电网实时运行风险评估方法的一种优选方案,其中:判定所述验证集的所述准确率是否满足所述结果输出要求,包括,若所述准确率满足所述结果输出要求,则输出电网运行风险判定结果数据,所述随机森林智能体训练完成;若所述准确率不满足所述结果输出要求,则增加决策树数量,重新训练生成所述随机森立智能体,直至所述准确率满足所述结果输出要求。
作为本发明所述的一种基于随机森林的电网实时运行风险评估方法的一种优选方案,其中:预处理所述电网运行风险历史数据和所述实时数据包括,利用所述电网运行历史数据采集所述电网运行数据及其他相关数据;对所述电网运行进行全景建模,扫描典型的故障类型,评估不同的所述故障类型的危害与后果;利用所述数据中心模块测算运行风险,获得电网运行风险历史数据集;随机采集所述电网运行实时数据,利用所述数据中心模块测算运行风险,获得电网运行风险实时数据集。
作为本发明所述的一种基于随机森林的电网实时运行风险评估方法的一种优选方案,其中:获得所述训练集、所述测试集和所述验证集包括,所述数据中心模块处理所述电网运行风险历史数据集,获得两类无交集的数据样本,生成所述训练集和所述验证集;所述数据中心模块处理所述电网运行风险实时数据集,生成所述测试集。
作为本发明所述的一种基于随机森林的电网实时运行风险评估方法的一种优选方案,其中:所述控制模块利用所述训练集和所述测试集进行所述随机森林生成训练,构建多个决策树综合分析得到最终判定结果,提升整体决策分析的准确率,包括,预处理所述所述训练集和所述测试集内的所述数据样本,建立模型;设定子集属性数量;训练决策树;汇总所述决策树的判定结果数据。
作为本发明所述的一种基于随机森林的电网实时运行风险评估方法的一种优选方案,其中:训练生成所述随机森林智能体具体包括,剔除所述训练集中的无效数据,补齐其中的数据缺失项,并将不满足数据类型要求的属性转化为离散化的属性取值;设定所述子集属性数log2d为所述训练集中随机选出后续所述决策树训练生成的属性范围;采用决策树算法策略进行训练,在设定的所述子集属性数基础上对每个所述决策树优先选定所述属性;利用综合策略将所述随机森林智能体中所述决策树的判定结果汇总,形成整体判定结果。
作为本发明所述的一种基于随机森林的电网实时运行风险评估方法的一种优选方案,其中:利用所述随机森林智能体判定所述验证集的准确率具体包括,所述随机森林智能体判断所述验证集中各样本数据的运行风险,与离线策略下计算得到的风险值对比,判定所述验证集准确率。
作为本发明所述的一种基于随机森林的电网实时运行风险评估方法的一种优选方案,其中:进行所述实时运行风险判定分析需计算数据集的属性类型,即数据类型,包括,电网运行属性类型:字符型;设备状态属性类型:离散数值型;外界环境属性类型:连续数值型。
作为本发明所述的一种基于随机森林的电网实时运行风险评估方法的一种优选方案,其中:所述属性类型具体包括,电网实时运行状态类型数据;电网运行中各类输发变电设备运行状态参数;影响电网及其设备可靠运行的外界环境参数。
作为本发明所述的一种基于随机森林的电网实时运行风险评估系统的一种优选方案,其中:数据中心模块,用于处理所述电网运行风险历史数据集和所述实时数据集;控制模块,用于控制所述训练集和所述测试集进行所述随机森林生成训练;计算模块,用于计算所述随机森林智能体判定所述验证集的准确率;分析模块,用于分析判定所述电网实时运行风险结果。
本发明的有益效果:本发明能够根据相关因素的取值情况直接评估运行风险,从而避免复杂的电网全景建模、设备可靠性评估过程,在满足实时判定误差要求的前提下,大幅降低实时判定的耗时,有力支撑大电网运行风险在线分析的要求。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。其中:
图1为本发明第一个实施例所述的基于随机森林的电网实时运行风险评估方法的流程示意图;
图2为本发明第一个实施例所述的基于随机森林的电网实时运行风险评估方法的电网实时运行风险判定实施框架示意图;
图3为本发明第一个实施例所述的基于随机森林的电网实时运行风险评估方法的随机森林智能体训练示意图;
图4为本发明第一个实施例所述的基于随机森林的电网实时运行风险评估方法的地区电网网架结构示意图;
图5为本发明第一个实施例所述的基于随机森林的电网实时运行风险评估方法的样本运行风险分布直方示意图;
图6为本发明第一个实施例所述的基于随机森林的电网实时运行风险评估方法的测试集判定结果对比示意图;
图7为本发明第二个实施例所述的基于随机森林的电网实时运行风险评估系统的模块结构分布示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合说明书附图对本发明的具体实施方式做详细的说明,显然所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明的保护的范围。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。
其次,此处所称的“一个实施例”或“实施例”是指可包含于本发明至少一个实现方式中的特定特征、结构或特性。在本说明书中不同地方出现的“在一个实施例中”并非均指同一个实施例,也不是单独的或选择性的与其他实施例互相排斥的实施例。
本发明结合示意图进行详细描述,在详述本发明实施例时,为便于说明,表示器件结构的剖面图会不依一般比例作局部放大,而且所述示意图只是示例,其在此不应限制本发明保护的范围。此外,在实际制作中应包含长度、宽度及深度的三维空间尺寸。
同时在本发明的描述中,需要说明的是,术语中的“上、下、内和外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一、第二或第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
本发明中除非另有明确的规定和限定,术语“安装、相连、连接”应做广义理解,例如:可以是固定连接、可拆卸连接或一体式连接;同样可以是机械连接、电连接或直接连接,也可以通过中间媒介间接相连,也可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
实施例1
随机森林,本质上是一种仅由决策树构成的集成学习智能体,其基本思想在于通过构建多个独立性较强的决策树,综合分析得到最终的判定结果,以提升整体决策分析的准确率。其中构成随机森林的每一个决策树称为基学习器,与其他集成学习算法相比,随机森林具有更高的泛化误差和训练效率,意味着随机森林算法能在更短的时间内获得独立性更加显著的基学习器,使得其能够更有效地解决复杂度更高的实际问题,避免陷入局部最优解。
参照图1~图6,为本发明的第一个实施例,提供了一种基于随机森林的电网实时运行风险评估方法,包括:
S1:数据中心模块100将电网运行风险历史数据和实时数据进行预处理,分别得到训练集、验证集和测试集。其中需要说明的是,预处理电网运行风险历史数据和实时数据包括:
利用电网运行历史数据采集电网运行数据及其他相关数据;
对电网运行进行全景建模,扫描典型的故障类型,评估不同的故障类型的危害与后果;
利用数据中心模块100测算运行风险,获得电网运行风险历史数据集;
随机采集电网运行实时数据,利用数据中心模块100测算运行风险,获得电网运行风险实时数据集。
具体的,获得训练集、测试集和验证集包括:
数据中心模块100处理电网运行风险历史数据集,获得两类无交集的数据样本,生成训练集和验证集;
数据中心模块100处理电网运行风险实时数据集,生成测试集。
S2:控制模块200对获得的训练集和测试集进行随机森林生成训练,生成电网运行风险判定随机森林智能体,结合计算模块300判定验证集的准确率是否满足结果输出要求。本步骤需要说明的是,控制模块200利用训练集和测试集进行随机森林生成训练,构建多个决策树综合分析得到最终判定结果,提升整体决策分析的准确率,包括:
预处理训练集和测试集内的数据样本,建立模型;
设定子集属性数量;
训练决策树;
汇总决策树的判定结果数据。
具体的,训练生成随机森林智能体具体包括:
剔除训练集中的无效数据,补齐其中的数据缺失项,并将不满足数据类型要求的属性转化为离散化的属性取值;
设定子集属性数log2d为训练集中随机选出后续决策树训练生成的属性范围;
采用决策树算法策略进行训练,在设定的子集属性数基础上对每个决策树优先选定属性;
利用综合策略将随机森林智能体中决策树的判定结果汇总,形成整体判定结果。
进一步的,判定验证集的准确率是否满足结果输出要求,包括:
若准确率满足结果输出要求,则输出电网运行风险判定结果数据,随机森林智能体训练完成;
若准确率不满足结果输出要求,则增加决策树数量,重新训练生成随机森立智能体,直至准确率满足结果输出要求。
较佳的,其中还需要说明的是,利用随机森林智能体判定验证集的准确率具体包括:
随机森林智能体判断验证集中各样本数据的运行风险,与离线策略下计算得到的风险值对比,判定验证集准确率。
S3:分析模块400利用满足准确率的随机森林智能体进行实时运行风险判定分析,实时获得电网运行风险判定结果。本步骤还需要说明的是,进行实时运行风险判定分析需计算数据集的属性类型,即数据类型,包括:
电网运行属性类型:字符型;
设备状态属性类型:离散数值型;
外界环境属性类型:连续数值型。
进一步的,属性类型具体包括:
电网实时运行状态类型数据;
电网运行中各类输发变电设备运行状态参数;
影响电网及其设备可靠运行的外界环境参数。
较佳的,本实施例通过挖掘电网运行特征实现对运行风险的评估,利用电网运行历史数据,对运行风险相关因素进行分析,生成面向电网运行风险评估的随机森林智能体,能够根据相关因素的取值情况直接评估运行风险,拥有较高的监测错误率,从而避免复杂的电网全景建模、设备可靠性评估;进一步的,随机森林的泛化误差上界构成该随机森林各决策树之间的平均相关系数(即决策树之间的分类强度),对比国际通用的数据分析数据库glass数据库和auto-mpg数据库,能够发现随机森林智能体的监测错误率比其他Bagging类型的集成学习智能算法高4%,由此验证本实施例提供的发明方法能够更有效地解决复杂度较高的实际问题。
优选的,随机森林中所包含的决策树越多,其训练生成速度越慢,在实时判断分析中耗时也相应增加,而本发明方法能够获得满足准确率要求的计算开支最小的随机森林智能体,用于电网实时运行风险计算,并能根据随机森林决策分析需要,不同类型数据转化为范围确定的离散数值,提升决策树的训练生成效率;字符类型:取值均为字符类型数据的属性类型,例如部分降水数据中,降水量是以“暴雨”“大雨”“中雨”“小雨”等不同字符型数据类型表示,考虑到当前电网运行风险评估问题中所涉及的字符类型属性均为取值范围确定且有限的字符类型属性,可将根据其属性取值范围将其转换为对应的离散数值,例如上述降水数据中,将“暴雨”“大雨”等四类降水字符数据等效转换为4至1的离散数据;离散数值类型:取值为范围有限的离散数值的属性类型,例如输变电设备运行状态,往往以“1”代表投入运行,“0”代表停电状态,这种数值类型不需要转换,可直接使用;连续数值类型:取值为范围有限的连续数值的属性类型,例如输变电设备的潮流,取值一般在0至其最大传输能力范围内连续取值,可通过给定离散幅度将其转换为离散数值。
优选的是,为验证本发明方法的有效性,参照图4,为本实施例在某地区电网实际数据基础上构造算例,该地区电网范围共有5个变电站、8条输电线路、3个发电厂、6台发电机组,本实施例结合该地区电网实际数据,实现电网运行风险分析考虑共计66项属性,通过2条输电线路与主网联络,利用基础数据分析运行风险属性,从而获得该地区电网运行风险分析判断结果,各类属性如表1所示:
表1:运行风险分析属性表。
优选的是,为了对本发明方法中采用的技术效果加以验证说明,本实施例选择以传统电网运行风险分析方法与本实施例提供的基于随机森林的电网实时运行风险评估方法进行对比测试,以科学论证的手段对比实验结果,以验证本发明方法所具有的真实效果。传统的电网运行风险分析方法需建模分析计算该时刻的运行风险,评估耗时较长,为验证本发明方法相较于传统评估方法具有较短评估时长、准确的评估结果,本实施例将采用传统电网运行风险评估方法与本发明方法分别对逐日电网运行状态进行分析,传统评估方法测试条件:分析2018年逐日电网运行状态,随机选取20个时刻的运行参数,得到7300个样本数据,以7000个样本数据为训练集,3000个样本数据为验证集;本发明方法测试条件:在7000个样本数据为训练集、3000个样本数据为验证集的基础上,从2019年1月中随机抽取20个时刻作为测试集,利用随机森林算法进行智能体训练,测算分析运行风险;测试结果:参照图5,能够看出传统的评估方法在该地区全网运行风险均在1~4范围内,超出该风险范围的样本数仅占样本总数的18%;参照图6,本发明方法利用离线判断测试集和随机森林智能体判定测试集,两种判断方法测试精度和耗时对比如下表所示:
表2:判断方法对比分析表。
参照表2和图6,能够看出相比于离线判定方法,本发明方法判定误差仅为3%,且每次测试样本耗时不超过2分钟,不足离线判定方法的0.2%,充分验证了本发明方法能够满足大电网实时运行风险分析的需要,大幅降低运行风险的判定耗时。
实施例2
参照图7,为本发明的第二个实施例,该实施例不同于第一个实施例的是,提供了一种基于随机森林的电网实时运行风险评估系统,包括,
数据中心模块100,用于处理电网运行风险历史数据集和实时数据集。
控制模块200,用于控制训练集和测试集进行随机森林生成训练。
计算模块300,用于计算随机森林智能体判定验证集的准确率。
分析模块400,用于分析判定电网实时运行风险结果。
应当认识到,本发明的实施例可以由计算机硬件、硬件和软件的组合、或者通过存储在非暂时性计算机可读存储器中的计算机指令来实现或实施。所述方法可以使用标准编程技术-包括配置有计算机程序的非暂时性计算机可读存储介质在计算机程序中实现,其中如此配置的存储介质使得计算机以特定和预定义的方式操作——根据在具体实施例中描述的方法和附图。每个程序可以以高级过程或面向对象的编程语言来实现以与计算机系统通信。然而,若需要,该程序可以以汇编或机器语言实现。在任何情况下,该语言可以是编译或解释的语言。此外,为此目的该程序能够在编程的专用集成电路上运行。
此外,可按任何合适的顺序来执行本文描述的过程的操作,除非本文另外指示或以其他方式明显地与上下文矛盾。本文描述的过程(或变型和/或其组合)可在配置有可执行指令的一个或多个计算机系统的控制下执行,并且可作为共同地在一个或多个处理器上执行的代码(例如,可执行指令、一个或多个计算机程序或一个或多个应用)、由硬件或其组合来实现。所述计算机程序包括可由一个或多个处理器执行的多个指令。
进一步,所述方法可以在可操作地连接至合适的任何类型的计算平台中实现,包括但不限于个人电脑、迷你计算机、主框架、工作站、网络或分布式计算环境、单独的或集成的计算机平台、或者与带电粒子工具或其它成像装置通信等等。本发明的各方面可以以存储在非暂时性存储介质或设备上的机器可读代码来实现,无论是可移动的还是集成至计算平台,如硬盘、光学读取和/或写入存储介质、RAM、ROM等,使得其可由可编程计算机读取,当存储介质或设备由计算机读取时可用于配置和操作计算机以执行在此所描述的过程。此外,机器可读代码,或其部分可以通过有线或无线网络传输。当此类媒体包括结合微处理器或其他数据处理器实现上文所述步骤的指令或程序时,本文所述的发明包括这些和其他不同类型的非暂时性计算机可读存储介质。当根据本发明所述的方法和技术编程时,本发明还包括计算机本身。计算机程序能够应用于输入数据以执行本文所述的功能,从而转换输入数据以生成存储至非易失性存储器的输出数据。输出信息还可以应用于一个或多个输出设备如显示器。在本发明优选的实施例中,转换的数据表示物理和有形的对象,包括显示器上产生的物理和有形对象的特定视觉描绘。
如在本申请所使用的,术语“组件”、“模块”、“系统”等等旨在指代计算机相关实体,该计算机相关实体可以是硬件、固件、硬件和软件的结合、软件或者运行中的软件。例如,组件可以是,但不限于是:在处理器上运行的处理、处理器、对象、可执行文件、执行中的线程、程序和/或计算机。作为示例,在计算设备上运行的应用和该计算设备都可以是组件。一个或多个组件可以存在于执行中的过程和/或线程中,并且组件可以位于一个计算机中以及/或者分布在两个或更多个计算机之间。此外,这些组件能够从在其上具有各种数据结构的各种计算机可读介质中执行。这些组件可以通过诸如根据具有一个或多个数据分组(例如,来自一个组件的数据,该组件与本地系统、分布式系统中的另一个组件进行交互和/或以信号的方式通过诸如互联网之类的网络与其它系统进行交互)的信号,以本地和/或远程过程的方式进行通信。
应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。
Claims (10)
1.一种基于随机森林的电网实时运行风险评估方法,其特征在于:包括,
数据中心模块(100)将电网运行风险历史数据和实时数据进行预处理,分别得到训练集、验证集和测试集,预处理所述电网运行风险历史数据和所述实时数据包括:
利用所述电网运行历史数据采集电网运行数据及其他相关数据;
对所述电网运行进行全景建模,扫描典型的故障类型,评估不同的故障类型的危害与后果;
利用数据中心模块(100)测算运行风险,获得电网运行风险历史数据集;
随机采集电网运行实时数据,利用数据中心模块(100)测算运行风险,获得电网运行风险实时数据集;
所述数据中心模块(100)处理所述电网运行风险历史数据集,获得两类无交集的数据样本,生成所述训练集和所述验证集;
所述数据中心模块(100)处理所述电网运行风险实时数据集,生成所述测试集;
控制模块(200)对获得的所述训练集和所述测试集进行随机森林生成训练,生成电网运行风险判定随机森林智能体,结合计算模块(300)判定所述验证集的准确率是否满足结果输出要求;
利用所述随机森林的泛化误差上界构成所述随机森林各决策树之间的平均相关系数优化训练,其中,pmax为随机森林的泛化误差上限、p(1-s2)为构成随机森林各决策树之间的平均相关系数,s2为决策树之间的分类强度;
分析模块(400)利用满足所述准确率的所述随机森林智能体进行实时运行风险判定分析,实时获得所述电网运行风险判定结果。
2.如权利要求1所述的基于随机森林的电网实时运行风险评估方法,其特征在于:判定所述验证集的所述准确率是否满足所述结果输出要求,包括,
若所述准确率满足所述结果输出要求,则输出电网运行风险判定结果数据,所述随机森林智能体训练完成;
若所述准确率不满足所述结果输出要求,则增加决策树数量,重新训练生成所述随机森立智能体,直至所述准确率满足所述结果输出要求。
3.如权利要求1或2所述的基于随机森林的电网实时运行风险评估方法,其特征在于:预处理所述电网运行风险历史数据和所述实时数据包括,
利用所述电网运行历史数据采集所述电网运行数据及其他相关数据;
对所述电网运行进行全景建模,扫描典型的故障类型,评估不同的所述故障类型的危害与后果;
利用所述数据中心模块(100)测算运行风险,获得电网运行风险历史数据集;
随机采集所述电网运行实时数据,利用所述数据中心模块(100)测算运行风险,获得电网运行风险实时数据集。
4.如权利要求3所述的基于随机森林的电网实时运行风险评估方法,其特征在于:获得所述训练集、所述测试集和所述验证集包括,
所述数据中心模块(100)处理所述电网运行风险历史数据集,获得两类无交集的数据样本,生成所述训练集和所述验证集;
所述数据中心模块(100)处理所述电网运行风险实时数据集,生成所述测试集。
5.如权利要求1或4所述的基于随机森林的电网实时运行风险评估方法,其特征在于:所述控制模块(200)利用所述训练集和所述测试集进行所述随机森林生成训练,构建多个决策树综合分析得到最终判定结果,提升整体决策分析的准确率,包括,
预处理所述训练集和所述测试集内的数据样本,建立模型;
设定子集属性数量;
训练决策树;
汇总所述决策树的判定结果数据。
6.如权利要求5所述的基于随机森林的电网实时运行风险评估方法,其特征在于:训练生成所述随机森林智能体具体包括,
剔除所述训练集中的无效数据,补齐其中的数据缺失项,并将不满足数据类型要求的属性转化为离散化的属性取值;
设定所述子集属性数log2d为所述训练集中随机选出后续所述决策树训练生成的属性范围;
采用决策树算法策略进行训练,在设定的所述子集属性数基础上对每个所述决策树优先选定所述属性;
利用综合策略将所述随机森林智能体中所述决策树的判定结果汇总,形成整体判定结果。
7.如权利要求6所述的基于随机森林的电网实时运行风险评估方法,其特征在于:利用所述随机森林智能体判定所述验证集的准确率具体包括,
所述随机森林智能体判断所述验证集中各样本数据的运行风险,与离线策略下计算得到的风险值对比,判定所述验证集准确率。
8.如权利要求1或7所述的基于随机森林的电网实时运行风险评估方法,其特征在于:进行所述实时运行风险判定分析需计算数据集的属性类型,即数据类型,包括,
电网运行属性类型:字符型;
设备状态属性类型:离散数值型;
外界环境属性类型:连续数值型。
9.如权利要求8所述的基于随机森林的电网实时运行风险评估方法,其特征在于:所述属性类型具体包括,
电网实时运行状态类型数据;
电网运行中各类输发变电设备运行状态参数;
影响电网及其设备可靠运行的外界环境参数。
10.如权利要求1所述的一种基于随机森林的电网实时运行风险评估方法,其特征在于:其通过基于随机森林的电网实时运行风险评估系统模块进行实现,包括:
数据中心模块(100),用于处理电网运行风险历史数据集和实时数据集;
控制模块(200),用于控制训练集和测试集进行随机森林生成训练;
计算模块(300),用于计算随机森林智能体判定验证集的准确率;
分析模块(400),用于分析判定所述电网实时运行风险结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010174831.6A CN111292020B (zh) | 2020-03-13 | 2020-03-13 | 一种基于随机森林的电网实时运行风险评估方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010174831.6A CN111292020B (zh) | 2020-03-13 | 2020-03-13 | 一种基于随机森林的电网实时运行风险评估方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111292020A CN111292020A (zh) | 2020-06-16 |
CN111292020B true CN111292020B (zh) | 2020-12-15 |
Family
ID=71028612
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010174831.6A Active CN111292020B (zh) | 2020-03-13 | 2020-03-13 | 一种基于随机森林的电网实时运行风险评估方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111292020B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111914881A (zh) * | 2020-06-18 | 2020-11-10 | 北京百度网讯科技有限公司 | 随机森林的生成方法、装置、电子设备及存储介质 |
CN112734274B (zh) * | 2021-01-20 | 2023-11-03 | 国家电网公司华中分部 | 一种低碳电网运营主导影响因素挖掘及综合评估方法 |
CN113159615B (zh) * | 2021-05-10 | 2024-09-17 | 麦荣章 | 一种工业控制系统信息安全风险智能测定系统及方法 |
CN114997573A (zh) * | 2022-04-25 | 2022-09-02 | 河北华电石家庄热电有限公司 | 燃气-蒸汽联合循环热电机组的性能在线评估方法及系统 |
CN116090834B (zh) * | 2023-03-07 | 2023-06-13 | 安徽农业大学 | 基于Flink平台的林业管理方法、装置 |
CN117131464B (zh) * | 2023-10-25 | 2024-01-09 | 湖北华中电力科技开发有限责任公司 | 一种电网数据的可用性评估方法及系统 |
CN117689214B (zh) * | 2024-01-31 | 2024-05-14 | 天津华凯电气有限公司 | 一种柔性直流牵引供电系统能量路由器动态安全评估方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108537683A (zh) * | 2018-04-13 | 2018-09-14 | 贵州电网有限责任公司 | 一种基于相似日选取及随机森林算法的负荷预测方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107392363A (zh) * | 2017-07-12 | 2017-11-24 | 河海大学 | 一种ceemd和随机森林的短期风功率预测方法 |
CN109948839B (zh) * | 2019-03-06 | 2023-02-03 | 国网河南省电力公司电力科学研究院 | 架空输电线路舞动风险的预测和预警方法及系统 |
CN110232499A (zh) * | 2019-04-26 | 2019-09-13 | 中国电力科学研究院有限公司 | 一种配电网信息物理侧风险预警方法及系统 |
CN110417011B (zh) * | 2019-07-31 | 2022-11-08 | 三峡大学 | 一种基于互信息与迭代随机森林的在线动态安全评估方法 |
CN110311376B (zh) * | 2019-07-31 | 2022-12-20 | 三峡大学 | 一种电力系统动态安全评估综合模型及时空可视化方法 |
-
2020
- 2020-03-13 CN CN202010174831.6A patent/CN111292020B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108537683A (zh) * | 2018-04-13 | 2018-09-14 | 贵州电网有限责任公司 | 一种基于相似日选取及随机森林算法的负荷预测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111292020A (zh) | 2020-06-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111292020B (zh) | 一种基于随机森林的电网实时运行风险评估方法及系统 | |
CN111900694B (zh) | 一种基于自动识别的继电保护设备信息采集方法及系统 | |
CN114723285A (zh) | 一种电网设备安全性评估预测方法 | |
CN109711707B (zh) | 一种船舶动力装置综合状态评估方法 | |
CN115529315B (zh) | 一种云边协同系统 | |
CN112308436A (zh) | 一种配电网评估诊断分析方法、装置、设备及存储介质 | |
CN112183643A (zh) | 基于声发射的硬岩拉剪破裂识别方法及装置 | |
CN111199469A (zh) | 用户还款模型生成方法、装置及电子设备 | |
CN112200238A (zh) | 基于声响特征的硬岩拉剪破裂识别方法与装置 | |
CN114970357A (zh) | 节能效果评价方法、系统、装置及存储介质 | |
CN114151293A (zh) | 风机变桨系统的故障预警方法、系统、设备及存储介质 | |
CN113313304A (zh) | 一种基于大数据决策树的电网事故异常分析方法及系统 | |
CN116566839A (zh) | 一种电力企业通信资源质量评估系统 | |
CN115987692A (zh) | 一种基于流量回溯分析的安全防护系统及方法 | |
CN116187932A (zh) | 一种信息系统工程监理项目风险自适应评估方法 | |
CN113408816B (zh) | 一种基于深度神经网络的电网灾情评估方法 | |
CN107679478A (zh) | 输电线路空间负荷状态的提取方法和系统 | |
CN114548307A (zh) | 分类模型训练方法和装置、分类方法和装置 | |
CN111680572A (zh) | 一种电网运行场景动态判定方法及系统 | |
CN110827111A (zh) | 一种基于动态扩展模型的实时信用分析方法及系统 | |
Zhang et al. | Two‐stage nonparametric framework for missing data imputation, uncertainty quantification, and incorporation in system identification | |
CN118293988B (zh) | 基于物联网感知的环境站房设备运行状态监测系统及方法 | |
CN117455124B (zh) | 企业的环保设备监测方法、系统、介质及电子设备 | |
CN118296061A (zh) | 电力数据的分析处理方法、系统、终端及存储介质 | |
Zou et al. | Maintenance Evaluation of Power Grid Fault Equipment Based on Random Forest |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |