CN112287018A - 一种台风灾害下10kV杆塔受损风险评估方法及系统 - Google Patents
一种台风灾害下10kV杆塔受损风险评估方法及系统 Download PDFInfo
- Publication number
- CN112287018A CN112287018A CN202011233274.7A CN202011233274A CN112287018A CN 112287018 A CN112287018 A CN 112287018A CN 202011233274 A CN202011233274 A CN 202011233274A CN 112287018 A CN112287018 A CN 112287018A
- Authority
- CN
- China
- Prior art keywords
- tower
- data
- typhoon
- damage risk
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 83
- 238000011156 evaluation Methods 0.000 claims abstract description 37
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 36
- 238000012545 processing Methods 0.000 claims abstract description 27
- 238000012549 training Methods 0.000 claims abstract description 24
- 238000012502 risk assessment Methods 0.000 claims abstract description 20
- 238000011160 research Methods 0.000 claims abstract description 18
- 238000010801 machine learning Methods 0.000 claims abstract description 16
- 238000010219 correlation analysis Methods 0.000 claims abstract description 15
- 238000012360 testing method Methods 0.000 claims abstract description 15
- 238000007781 pre-processing Methods 0.000 claims abstract description 10
- 230000008030 elimination Effects 0.000 claims abstract description 7
- 238000003379 elimination reaction Methods 0.000 claims abstract description 7
- 238000004364 calculation method Methods 0.000 claims description 20
- 239000002689 soil Substances 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 9
- 238000007637 random forest analysis Methods 0.000 claims description 9
- 238000003860 storage Methods 0.000 claims description 7
- 238000013461 design Methods 0.000 claims description 6
- 238000010586 diagram Methods 0.000 claims description 6
- 238000006243 chemical reaction Methods 0.000 claims description 5
- 238000000546 chi-square test Methods 0.000 claims description 4
- 238000012937 correction Methods 0.000 claims description 4
- 230000003746 surface roughness Effects 0.000 claims description 4
- 230000006870 function Effects 0.000 claims description 2
- 238000010606 normalization Methods 0.000 claims description 2
- 238000007689 inspection Methods 0.000 abstract 1
- 239000011159 matrix material Substances 0.000 description 16
- 238000009826 distribution Methods 0.000 description 7
- 230000000875 corresponding effect Effects 0.000 description 5
- 238000013480 data collection Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 230000002146 bilateral effect Effects 0.000 description 2
- 238000007792 addition Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 239000004576 sand Substances 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/26—Visual data mining; Browsing structured data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/248—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Quality & Reliability (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Educational Administration (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Remote Sensing (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种台风灾害下10kV杆塔受损风险评估方法及系统,包括收集研究区域的数据,所述数据包括台风信息、电网信息和地理信息;对数据进行处理与分析,建立输入信息数据体系,所述处理与分析包括数据预处理、分类变量处理、样本均衡、相关性分析和变量剔除;基于多种机器学习算法,分别建立台风灾害下10kV杆塔受损风险评估模型,对各模型进行训练和测试,并对研究区域10kV杆塔进行受损风险评估;以拟合优度和时间两类指标作为模型评价指标,对比各模型的风险评估结果,基于层次分析法和熵权法对各指标进行综合赋权,选择最优模型,并将风险评估结果进行可视化。本发明满足不同场景下最优模型选择时的需求,为及时进行灾前巡检调拨提供实际数据支撑。
Description
技术领域
本发明涉及电力系统风险评估领域,具体涉及到一种台风灾害下10kV杆塔受损风险评估方法及系统。
背景技术
台风灾害往往会导致受灾区域电网输配电设备大量受损,给沿海地区电网带来了巨大威胁。专利文献CN103049646B提供了一种电网500kv终端变电站建设的综合风险评估方法,基于500kv终端变电站和周边的500kv电网、220kv电网的主要元件风险基础数据进行了研究。相比于主网,配网网络结构更为复杂,安全环境相对较差,影响其稳定运行的风险因素也相对较多,更易受到极端自然灾害的影响。同时,配网10kV杆塔设计规范相对较低,且数量较大,在台风灾害下更易发生断杆、倒杆等事故。
本申请发明人在实施本发明的过程中,发现现有技术的方法,至少存在如下技术问题:
目前已有研究者利用物理模型来实现电网的风险预测,物理模型具有预测精度较高的特点,但由于模型较为复杂,因此模型一般仅适用于样本数量较少的情况,且往往忽略了微地形对设备风险的影响,当样本数量增加或者自变量数量增加时,易导致模型运行时间过长,运行效率不高。在利用数据驱动模型进行风险评估的研究方面,由于电网数据收集体系的运行尚处于初级阶段,样本数量和数据质量欠佳,故模型的精度大多较低,因此现有模型大多将重点放在主网设备损失预测和模型预测精度的提升上,对更易受损的配网设备损失预测较少,且大多没有考虑模型运行时间对模型优劣的影响。但由于台风实时性较强,一些模型为了追求模型精度,可能在模型训练时间或者运行时间上耗费较多,对制定及时的应急调度策略造成一定影响。因此,本发明提出综合考虑模型精度和运行时间,研究基于数据驱动的10kV杆塔受损风险评估方法,对及时制定电网防风应急方案有重要意义。
发明内容
有鉴于此,本发明提供了一种台风灾害下10kV杆塔受损风险评估方法,用以解决配网杆塔受损预测模型较少、模型运行效率低、模型考虑因素不全面等技术问题。
为了解决上述技术问题,本发明提供了一种台风灾害下10kV杆塔受损风险评估方法,包括以下步骤:
步骤S1,收集研究区域的数据,所述数据包括台风信息、电网信息和地理信息;
步骤S2,对数据进行处理与分析,建立输入信息数据体系,所述处理与分析包括数据预处理、分类变量处理、样本均衡、相关性分析和变量剔除;
步骤S3,基于多种机器学习算法,建立各算法下的台风灾害下10kV杆塔受损风险评估模型,输入步骤S2处理完成的数据,对各模型进行训练和测试,并对研究区域10kV杆塔进行受损风险评估;
步骤S4,以拟合优度和时间两类指标作为模型评价指标,对比各模型的风险评估结果,基于层次分析法和熵权法对各指标进行综合赋权,选择最优模型,并将风险评估结果进行可视化。
而且,步骤S1中,台风信息由气象部门提供,包括台风下的最大阵风风速V;电网信息由电力部门提供,包括杆塔设计风速Vd、运行年限T、是否加固F、特殊区段Spe、所处位置Loc和土质情况Soi;地理信息包括经度Lon、纬度Lat、海拔Alt、坡向SA、坡度Sl、坡位SP、下垫面类型US、地表类型ST和地表粗糙度R。
而且,步骤S2的实现方式包括以下子步骤,
步骤S2.1,数据预处理包括数据的缺省值填充、基准换算、标准化,实现如下,
对于数据不全的杆塔,采用中位数填充方式处理离散型数值变量,插值填充方式处理连续型数值变量,众数填充的方式处理分类变量;
将风速按Alt为杆塔所处海拔高度进行折算;
将存在量纲的原始数据进行标准化处理。
步骤S2.2,分类变量处理,包括对离散型多分类变量采用独热编码,所述多分类变量包括所处位置Loc、土质情况Soi、坡位SP、下垫面类型US和地表类型ST;
步骤S2.3,样本均衡,包括采用CondensedNearestNeighbour算法下采样组合SMOTE算法过采样对受损样本进行样本均衡;
步骤S2.4,相关性分析,对于连续型变量和二分类变量,绘制相关性热力图,由参数间的皮尔逊相关性系数大小判断拥有强相关性的变量,并综合考虑各因素对相关性较强的变量进行剔除;对于多分类变量,首先对变量进行独热编码,然后两两组合进行卡方检验,判断其显著性差异,用P值作为指标进行相关性判断,最后综合各多分类变量间的相关性和变量类型,剔除相应变量。
而且,步骤S3采用5种机器学习算法分别建立台风灾害下10kV杆塔受损风险评估模型,包括AdaBoost、梯度提升回归、K近邻回归、随机森林、支持向量回归算法。
而且,步骤S4中,拟合优度指标包括平均绝对误差MAE、均方误差MSE、矫正决定系数R2_adj;时间指标包括训练时间Ttest、预测时间Trun。
而且,步骤S4最优模型选择实现方式包括以下子步骤,
步骤S4.1,基于层次分析法的指标主观赋权,输出主观权值计算结果;
步骤S4.2,基于熵权法的指标客观赋权,输出客观权值计算结果;
步骤S4.3,综合赋权,包括采用线性加权的方式进行综合权值的计算如下,
ω=αω1+(1-α)ω2
式中,ω为综合权值,α为主观权重比例系数,ω1为基于AHP的主观权值计算结果,(1-α)为客观权重比例系数,ω2为基于熵权法的客观权值计算结果;
对各指标进行综合赋权后,根据各指标的综合权值对各种算法计算综合得分,对比各算法综合得分以选择所需场景下的最优模型,综合得分越高,代表综合考虑当前模型主观偏好性和客观性下该模型越优。
本发明还相应提供一种基于台风灾害下10kV杆塔受损风险评估系统,用于实现如上所述的一种基于台风灾害下10kV杆塔受损风险评估方法。
而且,包括以下模块,
第一模块,用于收集研究区域的数据,所述数据包括台风信息、电网信息和地理信息;
第二模块,用于对数据进行处理与分析,建立输入信息数据体系,所述处理与分析包括数据预处理、分类变量处理、样本均衡、相关性分析和变量剔除;
第三模块,用于基于多种机器学习算法,建立各算法下的台风灾害下10kV杆塔受损风险评估模型,输入处理完成的数据,对各模型进行训练和测试,并对研究区域10kV杆塔进行受损风险评估;
第四模块,用于以拟合优度和时间两类指标作为模型评价指标,对比各模型的风险评估结果,基于层次分析法和熵权法对各指标进行综合赋权,选择最优模型,并将风险评估结果进行可视化。
或者,包括处理器和存储器,存储器用于存储程序指令,处理器用于调用存储器中的存储指令执行如上所述的一种基于台风灾害下10kV杆塔受损风险评估方法。
或者,包括可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序执行时,实现如上所述的一种基于台风灾害下10kV杆塔受损风险评估方法。
本发明充分考虑了台风信息、电网信息和地理信息对杆塔受损的影响,通过相关性分析剔除部分变量以获取较为合理的输入数据,通过机器学习充分挖掘变量与杆塔受损之间的关系,并结合主观和客观因素进行最优模型的选择,该方法可满足电力运维部门在不同场景下最优模型选择时的需求,提供较为直观的10kV杆塔高风险区域分布图,具有较强的直观性和可操作性,可为及时进行灾前巡检和调拨等提供实际数据支撑。
附图说明
图1为本发明实施例台风灾害下10kV杆塔受损风险评估方法框架图。
具体实施方式
以下结合附图和实施例具体说明本发明的技术方案。
本发明在大量的研究与实践基础上发现:大多利用物理模型来实现极端天气下电网设备风险评估的方法往往较为复杂,一般仅适用于样本数量较少的情况,当样本数量增加或者自变量数量增加时,易导致模型运行时间过长,运行效率不高。由于电网数据收集体系的运行尚处于初级阶段,样本数量和数据质量欠佳,利用数据驱动模型进行风险评估的方法大多将重点放在主网设备损失预测,对更易受损的配网设备损失预测较少,且大多没有考虑模型运行时间对模型优劣的影响。
因此,本发明提供的一种台风灾害下10kV杆塔受损风险评估方法,首先,收集台风信息、电网信息和地理信息,对收集和提取的数据进行基准换算、标准化、分类变量处理、样本均衡、相关性分析等处理,并基于皮尔逊相关系数绘制相关性热力图,根据相关性分析结果选择最终输入数据;其次,利用AdaBoost、GBR、KNNR、RF、SVR等5种机器学习算法建立10kV杆塔受损风险评估模型;再次,基于层次分析法和熵权法进行拟合优度指标和时间指标的综合赋权,并对各模型进行评估,实现最优模型选取;最后,通过结果可视化输出杆塔受损风险评估结果。
参见图1,本实施例提供了一种台风灾害下10kV杆塔受损风险评估方法,该方法包括:
S1:收集研究区域的台风信息、电网信息和地理信息等;
在一种实施方式中,S1收集研究区域的数据中,台风信息由气象部门提供,主要指台风下的最大阵风风速V;电网信息由电力部门提供,主要包括:杆塔设计风速Vd、运行年限T、是否加固F、特殊区段Spe、所处位置Loc、土质情况Soi;地理信息主要包括:经度Lon、纬度Lat、海拔Alt、坡向SA、坡度Sl、坡位SP、下垫面类型US、地表类型ST、地表粗糙度R。
S2:对数据进行处理与分析,建立输入信息数据体系,具体包括数据的缺省值填充、基准换算、标准化、分类变量处理、样本均衡、相关性分析、变量剔除等;
在一种实施方式中,S2数据处理具体包括:
S2.1:数据预处理包括数据的缺省值填充、基准换算、标准化。
对于数据不全的杆塔,采用中位数填充方式处理离散型数值变量,插值填充方式处理连续型数值变量,众数填充的方式处理分类变量(包括二分类变量和离散型多分类变量),其中,训练样本中提前剔除数据缺失严重的杆塔样本。
考虑海拔高度对风速值的影响,将风速按式(1)进行折算:
式中,V1为折算后风速值(m/s);Alt为杆塔所处海拔高度(m);气象检测站一般监测风速为当地10米高的风速值,故实施例中V为离地10米高的最大阵风风速(m/s);μ为地面粗糙度指数。
为了在不改变原始数据分布的情况下,增强不同量纲变量之间的可比性,将数据进行标准化处理:
式中,x’为标准化后的变量,x为存在量纲的原始数据,min(x)为同一类型变量中的最小值,max(x)为同一类型变量中的最大值。
S2.2:分类变量处理。对于离散型多分类变量,其取值没有大小的意义,因此使用独热编码解决模型应用时分类变量导致的偏序性问题。多分类变量包括:所处位置Loc、土质情况Soi、坡位SP、下垫面类型US、地表类型ST。
具体来说,以土质情况Soi为例,若杆塔1土质为可塑土,杆塔2为软塑土、杆塔3为细沙土、杆塔4为硬塑土,则杆塔1~4的编码方式如表1所示。
表1土质情况分类编码
S2.3:样本均衡。采用CondensedNearestNeighbour算法下采样组合SMOTE算法过采样对受损样本进行样本均衡。
CNN(CondensedNearestNeighbor)是最早的基于近邻分类的实例选择算法。SMOTE(Synthetic Minority Oversampling Technique)是合成少数类过采样技术。具体实现为现有技术,本发明不予赘述。
本发明提出利用CondensedNearestNeighbour算法,主要用于数据清洗,采用近邻的方法进行迭代以判断某样本应该保留还是剔除可有效剔除噪音数据,减少训练时间,同时提高样本质量,避免噪音样本对训练结果产生影响,防止过拟合。
S2.4:相关性分析。为了降低强相关性变量在模型训练中造成的影响,并且减轻模型在应用过程中数据收集的压力,对现有变量进行变量间的相关性分析。在相关性分析中,对于连续型变量和二分类变量,绘制相关性热力图,由参数间的皮尔逊相关性系数大小判断拥有强相关性的变量,并且,本发明进一提出综合考虑各因素对相关性较强的变量进行剔除。对于多分类变量,首先对变量进行独热编码,然后两两组合进行卡方检验,判断其显著性差异,用P值(双侧伴随概率)作为指标进行相关性判断,最后综合各多分类变量间的相关性和变量类型等,剔除相应变量。
具体来说,对于连续型变量(V1、Vd、T、Alt、SA、Sl、R)和二分类变量(F、Spe),绘制相关性热力图。根据参数间的皮尔逊相关性系数大小得出,海拔Alt与坡度Sl之间呈强正相关性,此外,杆塔设计风速VD、运行年限T、是否加固F之间存在中等正相关性。由于海拔对实际风速有一定影响,在数据预处理时也需考虑海拔因素,因此保留变量Alt,剔除变量Sl。
为了避免多分类变量的偏序性在模型拟合时造成的影响,对多分类变量进行独热编码,多分类变量包括:所处位置Loc、土质情况Soi、坡位SP、下垫面类型US、地表类型ST。将各多分类变量进行独热编码后,两两组合进行卡方检验,判断其显著性差异。首先绘制皮尔逊相关性系数图,然后用P值(双侧伴随概率)作为指标进行相关性判断,其中P值越接近于0,说明检验变量之间存在的相关性越显著,选择0.05为显著性水平。
用该方法对比多分类变量之间的两两相关性,可得其相关性强弱关系,在综合考虑相关性和分类数量的前提下,剔除多分类变量中的所处位置Loc。
S3:基于5种机器学习算法,建立各算法下的台风灾害下10kV杆塔受损风险评估模型,输入处理完成的数据,将输入数据随机划分为测试集和训练集,其中测试集占输入数据的80%,训练集占20%,对各模型进行训练和测试,并输出测试集的各评价指标结果;
具体实施时,可根据需要选择现有机器学习算法,实现方式可参考相应文献,本发明不予赘述。在一种实施方式中,S3的5种机器学习算法具体包括:AdaBoost、梯度提升回归(Gradient Boosting Regression,GBR)、K近邻回归(K Nearest Neighbor Regressor,KNNR)、随机森林(Random Forest,RF)、支持向量回归(Support Vector Regression,SVR),基于这5种机器学习算法分别建立台风灾害下10kV杆塔受损风险评估模型。以AdaBoost算法为例,首先将处理完成的数据作为输入,具体包括:最大阵风风速V、杆塔设计风速Vd、运行年限T、是否加固F、特殊区段Spe、土质情况Soi、经度Lon、纬度Lat、海拔Alt、坡向SA、坡位SP、地表类型ST、地表粗糙度R;接着将AdaBoost算法进行超参数优化,并调用算法进行模型的训练和测试,参数优化结果具体为:base_estimator=None,learning_rate=0.5,loss='linear',n_estimators=50;然后对数据集按照测试集数据为80%,训练集为20%进行100次随机划分,并分别进行模型训练和测试;最后输出测试集评价指标在100次评估后的平均值。
在一种实施方式中,S4的评价指标主要包括拟合优度指标和时间指标两大类,其中拟合优度指标具体包括:平均绝对误差(Mean Absolute Error,MAE)、均方误差(MeanSquare Error,MSE)、矫正决定系数(Adjusted R-Square,R2_adj);时间指标具体包括:训练时间(Ttest)、预测时间(Trun)。
其中,R2为决定系数。
具体来说,用最终保留的变量作为输入,对5种机器学习算法进行参数寻优,并基于各算法对模型进行训练和测试,获得各模型风险评估效果对比如表2所示。
表2各模型风险评估效果对比
从表2中可见,拟合优度指标相对较优的模型是RF和GBR,MSE均在0.05以下,MAE均在0.12以下,R2_adj均在0.80以上,其次为KNNR和SVR,Adaboost的拟合优度指标相对较差,说明在侧重考虑模型预测精度的前提下,RF和GBR模型相较于其他模型更优。模型训练时间最短的模型为KNNR,适用于实际受损样本数据实时更新,需要模型同步训练的场景。预测时间最短的为Adaboost,适用于样本数量巨大且时间紧迫的场景。
S4:以拟合优度和时间两类指标作为模型评价指标,对比各模型的风险评估结果,基于层次分析法和熵权法对各指标进行综合赋权,选择最优模型,使用最优模型对研究区域的所有杆塔数据作为输入,进行基于最优模型的10kV杆塔受损风险评估,并将风险评估结果进行可视化。
在一种实施方式中,S4最优模型选择具体包括:
S4.1:基于层次分析法(The Analytic Hierarchy Process,AHP)的指标主观赋权。具体实施时,AHP计算主观权值的步骤为:
1)确定研究问题的层次结构,目标层为判断最优模型,准则层包括5个评价指标:MAE、MSE、R2_adj、Ttest、Trun,方案层包括5种机器学习算法:AdaBoost、GBR、KNNR、RF、SVR。
2)采用1~9分标度法对指标之间的重要性进行重要度量化,获得判断矩阵。
3)对判断矩阵进行一致性检验。
一致性比率CR和一致性指标CI的计算公式如式(7)-(8):
式中,RI为随机一致性指标,其取值与判断矩阵的阶数n有关;λmax为判断矩阵的最大特征值。CI越大,代表判断矩阵的不一致程度越严重,当CI小于0.1时,认为判断矩阵的不一致程度在容许范围内,需重新构建判断矩阵。
4)输出主观权值计算结果。
具体来说,假设场景为距离台风登陆还有一定时间,模型已经训练完成,对训练时间要求较低,预测时间要求较低,但对预测的准确度要求较高,获得判断矩阵如表3所示。
构造判断矩阵时,数值越大,代表该行所代表的指标相对于该列所代表的指标重要程度越高。例:矫正决定系数R2_adj相对训练时间Ttest极端重要,则取值为9,Ttest相对于R2_adj取值就是1/9;预测时间Trun相对训练时间Ttest较强重要,则取值为5;平均绝对误差MAE相对均方差MSE重要度相同,则取值为1。
表3判断矩阵
经过计算得一致性比率CR=0.037,小于0.1,判断矩阵通过一致性检验。各指标主观权值计算结果如表4所示。
表4各指标主观权值
S4.2:基于熵权法的指标客观赋权,计算客观权值步骤为:
1)对各指标进行标准化计算,构造评价矩阵。
对评价矩阵R的元素进行标准化。正向指标按照式(9)进行标准化计算,负向指标按式(10)计算。正向指标代表数值越大,模型效果越好,反之则为负向指标,如R2_adj为正向指标,MSE、MAE、Ttest、Trun为负向指标。
为防止标准化计算后结果为0的数据计算权值时权重过小,信息熵过大,将标准化结果为0的数字用0.01替代。
利用标准化后的数据构造评价矩阵。设采用m种算法,共有n个指标,则评价矩阵R=(rij)m×n,其中rij代表第j个指标下第i个项目的评价值。
2)计算第j个指标的熵值ej:
式中,Pij和k为中间变量。
3)计算第j个指标的熵权ωj:
4)输出客观权值计算结果。
具体来说,各指标客观权值计算结果如表5所示。
表5各指标客观权值
S4.3:综合赋权。为了适应不同使用者在不同应用场景中的偏好,采用线性加权的方式进行综合权值的计算。计算方法如式(15):
ω=αω'+βω” (15)
式中,ω为综合权值,α为主观权值比例系数,ω'为主观权值计算结果,β为客观权值比例系数,ω”为客观权值计算结果。其中:
α+β=1 (16)
为了剔除较大波动数据的干扰,引入距离函数的概念,采用线性组合法计算α和β。令ω'和ω”间的差异与α和β间的差异相同,即主观权值与客观权值的距离D(ω',ω”)等于主观权值比例系数与客观权值比例系数的距离D(α,β):
D(ω',ω”)=D(α,β) (17)
其中:
D(α,β)=|α-β| (19)
式中,下标i代表第i个指标,n为指标数量。
获得各指标的主观权值和客观权值后,联立式(16)和式(17),即可求出α和β,并得到各指标的综合权值。
对各指标进行综合赋权后,采用综合优度计算的方式对的5种算法进行评估:
对比各算法综合优度以选择所需场景下的最优模型,综合优度值越大,代表综合考虑当前模型主观偏好性和客观性下该模型越优。
具体来说,根据主观和客观权值计算结果,联立方程组计算得主观权值比例系数为0.598,客观权值比例系数0.402,得各指标综合权值,并根据综合权值对5种模型进行综合优度对比,获得各模型综合优度如表6所示。
表6基于综合权值的各模型综合优度结果
从表6可见,评估结果最优的是GBR模型,其次为RF和KNNR,SVR和Adaboost模型综合优度较低,说明在对精度要求较高的假设场景下,综合考虑拟合优度指标和时间指标的前提下,GBR模型拥有最好的评估效果。
具体实施时,本发明技术方案提出的方法可由本领域技术人员采用计算机软件技术实现自动运行流程,实现方法的系统装置例如存储本发明技术方案相应计算机程序的计算机可读存储介质以及包括运行相应计算机程序的计算机设备,也应当在本发明的保护范围内。
在一些可能的实施例中,提供一种基于台风灾害下10kV杆塔受损风险评估系统,包括以下模块,
第一模块,用于收集研究区域的数据,所述数据包括台风信息、电网信息和地理信息;
第二模块,用于对数据进行处理与分析,建立输入信息数据体系,所述处理与分析包括数据预处理、分类变量处理、样本均衡、相关性分析和变量剔除;
第三模块,用于基于多种机器学习算法,建立各算法下的台风灾害下10kV杆塔受损风险评估模型,输入处理完成的数据,对各模型进行训练和测试,并对研究区域10kV杆塔进行受损风险评估;
第四模块,用于以拟合优度和时间两类指标作为模型评价指标,对比各模型的风险评估结果,基于层次分析法和熵权法对各指标进行综合赋权,选择最优模型,并将风险评估结果进行可视化。
在一些可能的实施例中,提供一种基于台风灾害下10kV杆塔受损风险评估系统,包括处理器和存储器,存储器用于存储程序指令,处理器用于调用存储器中的存储指令执行如上所述的一种基于台风灾害下10kV杆塔受损风险评估方法。
在一些可能的实施例中,提供一种基于台风灾害下10kV杆塔受损风险评估系统,包括可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序执行时,实现如上所述的一种基于台风灾害下10kV杆塔受损风险评估方法。
本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。
Claims (10)
1.一种台风灾害下10kV杆塔受损风险评估方法,其特征在于,包括以下步骤:
步骤S1,收集研究区域的数据,所述数据包括台风信息、电网信息和地理信息;
步骤S2,对数据进行处理与分析,建立输入信息数据体系,所述处理与分析包括数据预处理、分类变量处理、样本均衡、相关性分析和变量剔除;
步骤S3,基于多种机器学习算法,建立各算法下的台风灾害下10kV杆塔受损风险评估模型,输入步骤S2处理完成的数据,对各模型进行训练和测试,并对研究区域10kV杆塔进行受损风险评估;
步骤S4,以拟合优度和时间两类指标作为模型评价指标,对比各模型的风险评估结果,基于层次分析法和熵权法对各指标进行综合赋权,选择最优模型,并将风险评估结果进行可视化。
2.如权利要求1所述的台风灾害下10kV杆塔受损风险评估方法,其特征在于:步骤S1中,台风信息由气象部门提供,包括台风下的最大阵风风速V;电网信息由电力部门提供,包括杆塔设计风速Vd、运行年限T、是否加固F、特殊区段Spe、所处位置Loc和土质情况Soi;地理信息包括经度Lon、纬度Lat、海拔Alt、坡向SA、坡度Sl、坡位SP、下垫面类型US、地表类型ST和地表粗糙度R。
3.如权利要求2所述的台风灾害下10kV杆塔受损风险评估方法,其特征在于:步骤S2的实现方式包括以下子步骤,
步骤S2.1,数据预处理包括数据的缺省值填充、基准换算、标准化,实现如下,
对于数据不全的杆塔,采用中位数填充方式处理离散型数值变量,插值填充方式处理连续型数值变量,众数填充的方式处理分类变量;
将风速按Alt为杆塔所处海拔高度进行折算;
将存在量纲的原始数据进行标准化处理;
步骤S2.2,分类变量处理,包括对离散型多分类变量采用独热编码,所述多分类变量包括所处位置Loc、土质情况Soi、坡位SP、下垫面类型US和地表类型ST;
步骤S2.3,样本均衡,包括采用CondensedNearestNeighbour算法下采样组合SMOTE算法过采样对受损样本进行样本均衡;
步骤S2.4,相关性分析,对于连续型变量和二分类变量,绘制相关性热力图,由参数间的皮尔逊相关性系数大小判断拥有强相关性的变量,并综合考虑各因素对相关性较强的变量进行剔除;对于多分类变量,首先对变量进行独热编码,然后两两组合进行卡方检验,判断其显著性差异,用P值作为指标进行相关性判断,最后综合各多分类变量间的相关性和变量类型,剔除相应变量。
4.如权利要求1或2或3所述的台风灾害下10kV杆塔受损风险评估方法,其特征在于:步骤S3采用5种机器学习算法分别建立台风灾害下10kV杆塔受损风险评估模型,包括AdaBoost、梯度提升回归、K近邻回归、随机森林、支持向量回归算法。
5.如权利要求1或2或3所述的台风灾害下10kV杆塔受损风险评估方法,其特征在于:步骤S4中,拟合优度指标包括平均绝对误差MAE、均方误差MSE、矫正决定系数R2_adj;时间指标包括训练时间Ttest、预测时间Trun。
6.如权利要求1或2或3所述的台风灾害下10kV杆塔受损风险评估方法,其特征在于:步骤S4最优模型选择实现方式包括以下子步骤,
步骤S4.1,基于层次分析法的指标主观赋权,输出主观权值计算结果;
步骤S4.2,基于熵权法的指标客观赋权,输出客观权值计算结果;
步骤S4.3,综合赋权,包括采用线性加权的方式进行综合权值的计算如下,
ω=αω1+(1-α)ω2
式中,ω为综合权值,α为主观权重比例系数,ω1为基于AHP的主观权值计算结果,(1-α)为客观权重比例系数,ω2为基于熵权法的客观权值计算结果;
对各指标进行综合赋权后,根据各指标的综合权值对各种算法计算综合得分,对比各算法综合得分以选择所需场景下的最优模型,综合得分越高,代表综合考虑当前模型主观偏好性和客观性下该模型越优。
7.一种基于台风灾害下10kV杆塔受损风险评估系统,其特征在于:用于实现如权利要求1-6任一项所述的一种基于台风灾害下10kV杆塔受损风险评估方法。
8.根据权利要求7所述基于台风灾害下10kV杆塔受损风险评估系统,其特征在于:包括以下模块,
第一模块,用于收集研究区域的数据,所述数据包括台风信息、电网信息和地理信息;
第二模块,用于对数据进行处理与分析,建立输入信息数据体系,所述处理与分析包括数据预处理、分类变量处理、样本均衡、相关性分析和变量剔除;
第三模块,用于基于多种机器学习算法,建立各算法下的台风灾害下10kV杆塔受损风险评估模型,输入处理完成的数据,对各模型进行训练和测试,并对研究区域10kV杆塔进行受损风险评估;
第四模块,用于以拟合优度和时间两类指标作为模型评价指标,对比各模型的风险评估结果,基于层次分析法和熵权法对各指标进行综合赋权,选择最优模型,并将风险评估结果进行可视化。
9.根据权利要求7所述基于台风灾害下10kV杆塔受损风险评估系统,其特征在于:包括处理器和存储器,存储器用于存储程序指令,处理器用于调用存储器中的存储指令执行如权利要求1-6任一项所述的一种基于台风灾害下10kV杆塔受损风险评估方法。
10.根据权利要求7所述基于台风灾害下10kV杆塔受损风险评估系统,其特征在于:包括可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序执行时,实现如权利要求1-6任一项所述的一种基于台风灾害下10kV杆塔受损风险评估方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011233274.7A CN112287018B (zh) | 2020-11-06 | 2020-11-06 | 一种台风灾害下10kV杆塔受损风险评估方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011233274.7A CN112287018B (zh) | 2020-11-06 | 2020-11-06 | 一种台风灾害下10kV杆塔受损风险评估方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112287018A true CN112287018A (zh) | 2021-01-29 |
CN112287018B CN112287018B (zh) | 2024-03-01 |
Family
ID=74351306
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011233274.7A Active CN112287018B (zh) | 2020-11-06 | 2020-11-06 | 一种台风灾害下10kV杆塔受损风险评估方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112287018B (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113177858A (zh) * | 2021-03-31 | 2021-07-27 | 国网浙江省电力有限公司温州供电公司 | 一种多维度的电网抗台风评价方法 |
CN113298438A (zh) * | 2021-06-22 | 2021-08-24 | 中国平安财产保险股份有限公司 | 区域风险等级的评估方法、装置、计算机设备及存储介质 |
CN113361807A (zh) * | 2021-06-30 | 2021-09-07 | 中国电信股份有限公司 | 号码识别模型优化方法及装置、电子设备 |
CN113554266A (zh) * | 2021-06-08 | 2021-10-26 | 国网湖南省电力有限公司 | 一种台风条件下强风导致电网受损风险预警方法和系统 |
CN113705093A (zh) * | 2021-08-25 | 2021-11-26 | 广东电网有限责任公司广州供电局 | 一种杆塔力学响应预测方法、装置、设备和介质 |
CN113869586A (zh) * | 2021-09-28 | 2021-12-31 | 广东电网有限责任公司 | 台风灾害下配网用户停电数量预测方法和预测装置 |
CN113887798A (zh) * | 2021-09-28 | 2022-01-04 | 广东电网有限责任公司 | 台风灾害下停电网格分布预测方法、系统、设备和介质 |
CN114154841A (zh) * | 2021-11-29 | 2022-03-08 | 山东农业大学 | 基于连阴雨灾害预警模型的苹果园灾害预警方法 |
CN115510669A (zh) * | 2022-10-11 | 2022-12-23 | 昆明理工大学 | 一种基于gis模糊分析的输电线路地震损失评估方法 |
CN116720728A (zh) * | 2023-04-26 | 2023-09-08 | 广州地铁设计研究院股份有限公司 | 风险评估方法、电子设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109299208A (zh) * | 2018-10-30 | 2019-02-01 | 武汉理工大学 | 一种台风灾害下输电杆塔智能可视化风险评估方法 |
CN109359896A (zh) * | 2018-12-10 | 2019-02-19 | 国网福建省电力有限公司 | 一种基于svm的电网线路故障风险预警方法 |
CN109785976A (zh) * | 2018-12-11 | 2019-05-21 | 青岛中科慧康科技有限公司 | 一种基于Soft-Voting的痛风病分期预测系统 |
CN111582386A (zh) * | 2020-05-11 | 2020-08-25 | 四川师范大学 | 一种基于随机森林的地质灾害多灾种综合风险评价方法 |
-
2020
- 2020-11-06 CN CN202011233274.7A patent/CN112287018B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109299208A (zh) * | 2018-10-30 | 2019-02-01 | 武汉理工大学 | 一种台风灾害下输电杆塔智能可视化风险评估方法 |
CN109359896A (zh) * | 2018-12-10 | 2019-02-19 | 国网福建省电力有限公司 | 一种基于svm的电网线路故障风险预警方法 |
CN109785976A (zh) * | 2018-12-11 | 2019-05-21 | 青岛中科慧康科技有限公司 | 一种基于Soft-Voting的痛风病分期预测系统 |
CN111582386A (zh) * | 2020-05-11 | 2020-08-25 | 四川师范大学 | 一种基于随机森林的地质灾害多灾种综合风险评价方法 |
Non-Patent Citations (5)
Title |
---|
HUI HOU 等: ""Risk Assessment and Its Visualization of Power Tower under Typhoon Disaster Based on Machine Learning Algorithms"", 《ENERGIES》, vol. 12, 9 January 2019 (2019-01-09), pages 1 - 23 * |
何静: ""基于机器学习的滑坡灾害空间预测及风险评估"", 《中国优秀硕士学位论文全文数据库(工程科技Ⅱ辑)》, 15 July 2020 (2020-07-15), pages 1 - 80 * |
卢耀健 等: ""基于组合权重和模糊随机方法的台风灾害风险评估"", 《模糊系统与数学》, vol. 34, no. 2, 30 April 2020 (2020-04-30), pages 151 - 163 * |
张彦彬;苏杨;许亚春;彭速标;徐国江;刘阳丽;钟志光;萧达辉;: "基于LSTM神经网络模型对大宗矿产资源放行风险预测研究", 中国口岸科学技术, no. 06, 15 June 2020 (2020-06-15) * |
郑凌铭 等: ""强台风环境下基于格点化和支持向量机的10 kV杆塔受损量预测方法"", 《高电压技术》, vol. 46, no. 1, 31 January 2020 (2020-01-31), pages 42 - 51 * |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113177858B (zh) * | 2021-03-31 | 2022-11-08 | 国网浙江省电力有限公司温州供电公司 | 一种多维度的电网抗台风评价方法 |
CN113177858A (zh) * | 2021-03-31 | 2021-07-27 | 国网浙江省电力有限公司温州供电公司 | 一种多维度的电网抗台风评价方法 |
CN113554266A (zh) * | 2021-06-08 | 2021-10-26 | 国网湖南省电力有限公司 | 一种台风条件下强风导致电网受损风险预警方法和系统 |
CN113554266B (zh) * | 2021-06-08 | 2024-01-30 | 国网湖南省电力有限公司 | 一种台风条件下强风导致电网受损风险预警方法和系统 |
CN113298438A (zh) * | 2021-06-22 | 2021-08-24 | 中国平安财产保险股份有限公司 | 区域风险等级的评估方法、装置、计算机设备及存储介质 |
CN113361807A (zh) * | 2021-06-30 | 2021-09-07 | 中国电信股份有限公司 | 号码识别模型优化方法及装置、电子设备 |
CN113705093A (zh) * | 2021-08-25 | 2021-11-26 | 广东电网有限责任公司广州供电局 | 一种杆塔力学响应预测方法、装置、设备和介质 |
CN113705093B (zh) * | 2021-08-25 | 2024-03-01 | 广东电网有限责任公司广州供电局 | 一种杆塔力学响应预测方法、装置、设备和介质 |
CN113887798A (zh) * | 2021-09-28 | 2022-01-04 | 广东电网有限责任公司 | 台风灾害下停电网格分布预测方法、系统、设备和介质 |
CN113869586A (zh) * | 2021-09-28 | 2021-12-31 | 广东电网有限责任公司 | 台风灾害下配网用户停电数量预测方法和预测装置 |
CN114154841A (zh) * | 2021-11-29 | 2022-03-08 | 山东农业大学 | 基于连阴雨灾害预警模型的苹果园灾害预警方法 |
CN115510669A (zh) * | 2022-10-11 | 2022-12-23 | 昆明理工大学 | 一种基于gis模糊分析的输电线路地震损失评估方法 |
CN116720728A (zh) * | 2023-04-26 | 2023-09-08 | 广州地铁设计研究院股份有限公司 | 风险评估方法、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112287018B (zh) | 2024-03-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112287018B (zh) | 一种台风灾害下10kV杆塔受损风险评估方法及系统 | |
CN106651211B (zh) | 一种不同尺度区域洪水灾害风险评估的方法 | |
CN111861133A (zh) | 一种山洪灾害防治能力评价方法 | |
CN113627735B (zh) | 工程建设项目安全风险的预警方法及系统 | |
CN109299208B (zh) | 一种台风灾害下输电杆塔智能可视化风险评估方法 | |
CN114723283A (zh) | 一种面向城市群的生态承载力遥感评估方法及装置 | |
CN113033997A (zh) | 基于改进集对分析的城市水质等级确定方法、装置及介质 | |
CN114881396A (zh) | 一种基于ahp和topsis的隧道坍塌风险评估方法 | |
CN114444910A (zh) | 一种面向电力物联网的边缘网络系统健康度评估方法 | |
CN112950048A (zh) | 基于模糊综合评价的国家高等教育体系健康评价 | |
CN117648870A (zh) | 一种基于迁移学习的跨区域滑坡易发性评价方法和装置 | |
CN114882373A (zh) | 基于深度神经网络的多特征融合沙尘暴预测方法 | |
CN113516303B (zh) | 一种提取多模式最优信息进行降水集合预测的方法、装置和介质 | |
Zhong et al. | Fuzzy risk assessment of flash floods using a cloud-based information diffusion approach | |
CN117522652A (zh) | 人居环境脆弱性评价方法、系统、智能终端及存储介质 | |
CN115510767B (zh) | 基于深度时空网络的区域气温预测方法 | |
CN112200619A (zh) | 遥感数据与社会调查结合的区域经济发展估算方法及系统 | |
CN109165854B (zh) | 空管运行效率等级评估方法及其装置 | |
CN115345488A (zh) | 一种湿地生态系统服务评估方法、装置、服务器及介质 | |
CN116128345A (zh) | 一种基于动态过程本底的国家公园综合成效评价方法 | |
CN115906669A (zh) | 一种顾及负样本选取策略的密集残差网络滑坡易发性评价方法 | |
CN112348066A (zh) | 一种基于灰色聚类算法的线路不停电等级评估方法 | |
CN112381422A (zh) | 光伏电站性能的确定方法和装置 | |
CN110751335A (zh) | 一种区域生态质量年景预测评价方法及装置 | |
CN110674471A (zh) | 基于GIS与Logistic回归模型的泥石流易发性预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |