CN117973180A - 复杂混联电网雷害风险评估简化模型的构建方法及系统 - Google Patents
复杂混联电网雷害风险评估简化模型的构建方法及系统 Download PDFInfo
- Publication number
- CN117973180A CN117973180A CN202311788814.1A CN202311788814A CN117973180A CN 117973180 A CN117973180 A CN 117973180A CN 202311788814 A CN202311788814 A CN 202311788814A CN 117973180 A CN117973180 A CN 117973180A
- Authority
- CN
- China
- Prior art keywords
- lightning
- variables
- correlation
- variable
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012502 risk assessment Methods 0.000 title claims abstract description 26
- 238000010276 construction Methods 0.000 title claims abstract description 24
- 239000013598 vector Substances 0.000 claims abstract description 54
- 208000025274 Lightning injury Diseases 0.000 claims abstract description 52
- 238000007621 cluster analysis Methods 0.000 claims abstract description 40
- 238000000034 method Methods 0.000 claims abstract description 40
- 238000010219 correlation analysis Methods 0.000 claims abstract description 32
- 238000012545 processing Methods 0.000 claims abstract description 25
- 238000012795 verification Methods 0.000 claims abstract description 18
- 238000012549 training Methods 0.000 claims abstract description 11
- 238000004364 calculation method Methods 0.000 claims description 21
- 238000000611 regression analysis Methods 0.000 claims description 19
- 238000012876 topography Methods 0.000 claims description 14
- 238000012163 sequencing technique Methods 0.000 claims description 12
- 238000010606 normalization Methods 0.000 claims description 11
- 230000000903 blocking effect Effects 0.000 claims description 10
- 230000001419 dependent effect Effects 0.000 claims description 9
- 238000007477 logistic regression Methods 0.000 claims description 8
- 238000013480 data collection Methods 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 4
- 238000004804 winding Methods 0.000 claims description 2
- 238000004458 analytical method Methods 0.000 description 8
- 230000000875 corresponding effect Effects 0.000 description 8
- 230000008030 elimination Effects 0.000 description 2
- 238000003379 elimination reaction Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000012897 Levenberg–Marquardt algorithm Methods 0.000 description 1
- 238000000540 analysis of variance Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000013016 damping Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 239000012212 insulator Substances 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012821 model calculation Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Supply And Distribution Of Alternating Current (AREA)
Abstract
本发明提供了一种复杂混联电网雷害风险评估简化模型的构建方法及系统,该方法包括以下步骤:基于待评估电网的历史数据,收集线路雷击故障特征向量,并对线路雷击故障特征向量进行编码处理;对编码处理后的线路雷击故障特征向量进行相关性分析,将相关性排序处于设定名次区间的线路雷击故障特征向量作为初步因子;将初步因子作为回归模型的输入变量,对回归模型进行训练,根据训练完成的回归模型验证初步因子的合理性;对编码处理后的线路雷击故障特征向量进行聚类分析,根据聚类分析结果在通过合理性验证的初步因子中选取致灾因子;基于待评估电网的历史数据,构建用于表征致灾因子和雷害风险数学关系的简化模型。本发明可以有效评估雷害风险。
Description
技术领域
本发明属于电网技术领域,具体涉及一种复杂混联电网雷害风险评估简化模型的构建方法及系统。
背景技术
现有技术中缺乏对雷害风险评估的方法,导致电网运行过程中,无法对雷害风险进行有效的规避,容易造成安全隐患和财产损失。
发明内容
本发明的目的就是为了解决上述背景技术存在的不足,提供一种复杂混联电网雷害风险评估简化模型的构建方法及系统,可以有效评估雷害风险。
本发明采用的技术方案是:一种复杂混联电网雷害风险评估简化模型的构建方法,包括以下步骤:
基于待评估电网的历史数据,收集线路雷击故障特征向量,并对线路雷击故障特征向量进行编码处理;
对编码处理后的线路雷击故障特征向量进行相关性分析,将相关性排序处于第一名至设定名次所在区间的线路雷击故障特征向量作为初步因子;
将初步因子作为回归模型的输入变量,对回归模型进行训练,根据训练完成的回归模型验证初步因子的合理性;
对编码处理后的线路雷击故障特征向量进行聚类分析,根据聚类分析结果在通过合理性验证的初步因子中选取致灾因子;
基于待评估电网的历史数据,构建用于表征致灾因子和雷害风险数学关系的简化模型。
上述技术方案中,所述线路雷击故障特征向量包括:省份、电压等级、跳闸月份、闪络形式、同塔回数、雷电流幅值、防雷措施、塔型、塔高、接地电阻、保护角、大号侧挡距、小号侧挡距、地形地貌、地面倾角、海拔高度、地闪密度、雷暴日和放电痕迹数量。
上述技术方案中,所述编码处理的过程包括:针对线路雷击故障特征向量中不具备序列特征的变量,使用虚拟编码方法将其编码为虚拟变量;对于放电痕迹数量直接进行序列编码处理;对定类变量按类别赋予数字编码;对保护角和地面倾角使用比例归一化处理;对定量变量使用最小最大归一化处理。
上述技术方案中,相关性分析的过程中,定类变量之间使用Cramer’s V系数计算相关性;定序变量和定量变量之间使用Spearman秩相关计算相关性;定序变量之间使用Somer’s D计算相关性;定类变量与定量变量之间使用eta系数计算相关性;将定序变量视为定类变量,使用Cramer’s V系数计算定类变量和定序变量之间的相关性。
上述技术方案中,省份、跳闸月份、闪络形式、同塔回数、防雷措施、塔型、地形地貌为定类变量;电压等级、放电痕迹数量为定序变量;雷电流幅值、塔高、接地电阻、保护角、大号侧档距、小号侧档距、地面倾角、海拔高度、地闪密度、雷暴日为定量变量。
上述技术方案中,回归模型将放电痕迹数量作为因变量。
上述技术方案中,回归模型采用Logistic回归模型;当放电痕迹数量小于等于设定值时标记为类别0,当放电痕迹数量大于设定值时标记为类别1。
上述技术方案中,基于训练完成的回归模型,计算每个输入变量的显著性,判定显著性小于设定值的输入变量通过合理性验证。
上述技术方案中,聚类分析中因变量的分类根据放电痕迹数量确定。
上述技术方案中,通过聚类分析得到线路雷击故障特征向量的F值并从大到小排序,选择排序处于第一名至设定名次所在区间且通过合理性验证的到线路雷击故障特征向量作为致灾因子。
上述技术方案中,所述雷害风险表征为闪络形式;所述闪络形式包括绕击和反击。
上述技术方案中,所述简化模型的数学表达式为:
其中,b为常量;xn,n=1,2,...,7为致灾因子;wn为第n个致灾因子的相应权重,f(X)表示雷害风险。
上述技术方案中,基于待评估电网的历史数据对简化模型进行拟合计算,求解得到每个致灾因子的相应权重取值。
本发明还提供了一种复杂混联电网雷害风险评估简化模型的构建系统,其特征在于:包括数据收集模块、编码处理模块、相关性分析模块、回归分析模块、聚类分析模块和简化模型构建模块;其中,
数据收集模块用于基于待评估电网的历史数据,收集线路雷击故障特征向量;
编码处理模块用于对线路雷击故障特征向量进行编码处理;
相关性分析模块用于对编码处理后的线路雷击故障特征向量进行相关性分析,将相关性排序处于设定名次区间的线路雷击故障特征向量作为初步因子;
回归分析模块用于将初步因子作为回归模型的输入变量,对回归模型进行训练,根据训练完成的回归模型验证初步因子的合理性;
聚类分析模块用于对编码处理后的线路雷击故障特征向量进行聚类分析,根据聚类分析结果在通过合理性验证的初步因子中选取致灾因子;
简化模型构建模块用于基于待评估电网的历史数据,构建用于表征致灾因子和雷害风险数学关系的简化模型。
上述技术方案中,所述编码处理模块针对线路雷击故障特征向量中不具备序列特征的变量,使用虚拟编码方法将其编码为虚拟变量;对于放电痕迹数量直接进行序列编码处理;对定类变量按类别赋予数字编码;对保护角和地面倾角使用比例归一化处理;对定量变量使用最小最大归一化处理。
上述技术方案中,所述相关性分析模块在相关性分析的过程中,定类变量之间使用Cramer’s V系数计算相关性;定序变量和定量变量之间使用Spearman秩相关计算相关性;定序变量之间使用Somer’s D计算相关性;定类变量与定量变量之间使用eta系数计算相关性;将定序变量视为定类变量,使用Cramer’s V系数计算定类变量和定序变量之间的相关性。
上述技术方案中,回归分析模块中回归模型采用Logistic回归模型;当放电痕迹数量小于等于设定值时标记为类别0,当放电痕迹数量大于设定值时标记为类别1。
上述技术方案中,回归分析模块中基于训练完成的回归模型,计算每个输入变量的显著性,判定显著性小于设定值的输入变量通过合理性验证。
上述技术方案中,聚类分析模块通过聚类分析得到线路雷击故障特征向量的F值并从大到小排序,选择排序处于第一名至设定名次所在区间且通过合理性验证的到线路雷击故障特征向量作为致灾因子。
上述技术方案中,简化模型构建模块中简化模型的数学表达式为:
其中,b为常量;xn,n=1,2,...,7为致灾因子;wn为第n个致灾因子的相应权重,f(X)表示雷害风险。
本发明还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述技术方案所述的复杂混联电网雷害风险评估简化模型的构建方法。
本发明的有益效果是:本发明通过将多组线路雷击故障数据进行相关性分析、回归模型分析和聚类分析,提取出雷击致灾因子,简化了不同典型场景下雷害风险评估模型,提高了电力系统雷害评估和预防的效率。
进一步地,本发明所选取的线路雷击故障特征,能够充分表征线路的雷击状态,提高风险评估的有效性。
进一步地,本发明提出的另一种虚拟编码方法,能够将纯文本的数据采用数字进行表达,为后续的关联性分析提供数据支撑,有效节约计算成本并提高计算精度。
进一步地,本发明采用不同的方法,计算不同类型变量之间的相关性,贴合不同变量的特性,有效提高计算结果的可信度。
进一步地,本发明依据不同雷击故障特征的数据属性,将数据分为定类变量、定序变量及定量变量,方便计算不同类型变量之间的相关性,进一步提高计算结果的可信度。
进一步地,在衡量雷害及分布规律时,考虑到目前线路雷击跳闸表现形式较为单一,并且数据仅有跳闸后的记录,若遭受雷击没有跳闸,此类数据难以搜寻,因此本发明根据现场运维人员巡线和事故分析报告中,对放电痕迹数量作为重点观察对象,应用于回归分析和聚类分析,有效获取雷击记录,提高后续数据分析和模型应用的可信度。
进一步地,本发明所设置放电痕迹数量的类别数大于2,采用Logistic回归模型,能够完成非线性、多分类的任务。
进一步地,本发明通过显著性可以判断参与模型计算的变量是否对模型有贡献,有贡献的变量认为通过了合理性验证,可以作为致灾因子的选取对象,有效保证致灾因子选取的有效性,能够提高简化模型的可信度。
进一步地,本发明通过因子之间的对聚类簇的影响大小来判断因子的重要性,保证致灾因子选取的可信度。
进一步地,由于复杂混联电网雷击故障的形式主要分感应雷故障、反击过电压、绕击过电压三种,考虑到感应雷故障数据量过小,且特征不明显,难以训练可信模型,故本发明选取绕击反击表征雷害风险,保证简化模型的输出结果的有效性。
进一步地,本发明将复杂的雷害形式关联机理简化为数学模型,按照给定的参数即可以极高的准确率得到雷害风险,保证评估结果精度的同时,节约了计算成本。
进一步地,本发明以大量、真实的历史数据进行简化模型的拟合,能够有效提高模型的可信度以及结果的准确性。
附图说明
图1为本发明的方法流程示意图;
图2为具体实施例的相关性分析结果示意图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步的详细说明,便于清楚地了解本发明,但它们不对本发明构成限定。
如图1所示,本发明提供了一种复杂混联电网雷害风险评估简化模型的构建方法,包括以下步骤:
基于待评估电网的历史数据,收集线路雷击故障特征向量,并对线路雷击故障特征向量进行编码处理;
对编码处理后的线路雷击故障特征向量进行相关性分析,将相关性排序处于设定名次区间的线路雷击故障特征向量作为初步因子;
将初步因子作为回归模型的输入变量,对回归模型进行训练,根据训练完成的回归模型验证初步因子的合理性;
对编码处理后的线路雷击故障特征向量进行聚类分析,根据聚类分析结果在通过合理性验证的初步因子中选取致灾因子;
基于待评估电网的历史数据,构建用于表征致灾因子和雷害风险数学关系的简化模型。
本发明还提供了一种复杂混联电网雷害风险评估简化模型的构建系统,其特征在于:包括数据收集模块、编码处理模块、相关性分析模块、回归分析模块、聚类分析模块和简化模型构建模块;其中,
数据收集模块用于基于待评估电网的历史数据,收集线路雷击故障特征向量;
编码处理模块用于对线路雷击故障特征向量进行编码处理;
相关性分析模块用于对编码处理后的线路雷击故障特征向量进行相关性分析,将相关性排序处于设定名次区间的线路雷击故障特征向量作为初步因子;
回归分析模块用于将初步因子作为回归模型的输入变量,对回归模型进行训练,根据训练完成的回归模型验证初步因子的合理性;
聚类分析模块用于对编码处理后的线路雷击故障特征向量进行聚类分析,根据聚类分析结果在通过合理性验证的初步因子中选取致灾因子;
简化模型构建模块用于基于待评估电网的历史数据,构建用于表征致灾因子和雷害风险数学关系的简化模型。
本发明还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述技术方案所述的复杂混联电网雷害风险评估简化模型的构建方法。
下面结合具体实施例进一步说明本发明的原理。
本具体实施例提出了一种输电线路雷害风险评估简化模型的建立方法。主要包括如下步骤:
步骤S1:基于待评估线路的历史数据,统计雷击事故,收集线路雷击故障特征向量,对数据进行预处理。
汇总发生雷击事故的各条线路,收集线路雷击故障特征变量:省份、电压等级、跳闸月份、闪络形式、同塔回数、雷电流幅值、防雷措施、塔型、塔高、接地电阻、保护角、大号侧挡距、小号侧挡距、地形地貌、地面倾角、海拔高度、地闪密度、雷暴日和放电痕迹数量并对数据进行预处理,所述预处理包括剔除空值、错值、归一化等。
变量数据说明如表1所示。
表1雷击故障特征及关联性分析数据说明表
步骤S2:对原始文本数据进行编码处理,对编码数据进行标准化处理。由于原始收集的数据为纯文本数据,无法进行关联性分析,因此本具体是实施例提出一种文本数据编码方式,具体来说对于塔型、防雷措施等不具备序列特征的变量,使用虚拟编码方法DummyEncoding将其编码为虚拟变量Dummy Variable;对于放电痕迹数量直接进行序列编码处理;其他定类变量按类别赋予数字编码;保护角和地面倾角使用比例归一化进行归一化处理,定量变量使用min-max归一化进行归一化处理。
雷击故障特征变量编码处理如表2所示。
表2雷击故障特征及关联性分析编码表
步骤S3:基于历史数据,对编码处理后的线路雷击故障特征向量进行相关分析、回归分析和聚类分析,提取出雷击致灾因子。具体分析方法流程如下:
(1)首先进行相关分析:省份、跳闸月份、闪络形式、同塔回数、防雷措施、塔型、地形地貌为定类变量;电压等级、放电痕迹数量为定序变量;雷电流幅值、塔高、接地电阻、保护角、大号侧档距、小号侧档距、地面倾角、海拔高度、地闪密度(主放电)、地闪密度(回击)、雷暴日为定量变量。
每两个定类变量之间使用Cramer’s V系数计算相关性。
其中Oi为当前参与Cramer’s V系数计算的变量之间列联表中i水平的观测频数,pi为i水平的期望频率,n为总样本量,class_A、class_B分别为当前参与Cramer’s V系数计算的变量的类别数,k=class_A×class_B。
如果参与计算的是跳闸月份与闪络形式,那么class_A为跳闸月份的类别数(1~12,12),class_B为闪络形式的类别数(反击、绕击,2)。
如果参与计算的是地形地貌与塔型,那么class_A为地形地貌的类别数,class_B为塔型的类别数。
每个定序变量和每个定量变量之间使用Spearman秩相关计算相关性。
其中dj为第j条样本中,当前参与Spearman计算的两变量之间的排序位次之差。如变量电压等级1~5,若某条数据的电压等级为4,那么其电压等级的排序位次即为2。
排序位次说明,对于变量A和B,第j条样本在变量A中排序为3,在变量B中排序为5,那么第j条样本在两个变量间的排序位次之差为2。
每两个定序变量之间使用Somer’s D计算相关性。
其中NC是一致对的数量,ND是不一致对的数量,NT是并列对的数量。
比如:对于一对数(x1,y1)和(x2,y2),x和y表示排序位次:x1表示数据1在定序变量1中的位次,y1表示数据1在定序变量2中的位次;x2表示数据2在定序变量1中的位次,y2表示数据2在定序变量2中的位次。
若(x1>x2&&y1>y2)||(x1<x2&&y1<y2),则称(x1,y1)和(x2,y2)是一致的;
若(x1>x2&&y1<y2)||(x1<x2&&y1>y2),则称(x1,y1)和(x2,y2)是不一致的;
若(x1=x2&&y1=y2),则称(x1,y1)和(x2,y2)是并序的。
定类变量与定量变量之间使用eta系数计算相关性。
其中h为当前参与eta系数计算的两变量之间定类变量的类别数,为属于定类变量各类别下的定量变量的平均值,/>为定量变量的平均值。
由于定类变量和定序变量无相关性计算方法,故将定序变量视为定类变量,使用Cramer’s V系数计算两者的相关性。
相关分析最终计算结果如图2所示,对上述所有相关性的计算结果进行排序,将排序靠前的变量作为对雷害影响较大的因子,且相关性高的因子可作为回归模型的输入变量。本具体实施例中相关性高的因子包括:省份、月份、塔型、地形地貌、海拔高度、地闪密度(主放电)、地闪密度(回击)与雷暴日。
(2)然后进行回归分析:将因变量设为放电痕迹数量,将省份、月份、塔型、地形地貌、海拔高度、地闪密度(主放电)、地闪密度(回击)与雷暴日设为自变量。显著性水平p<0.05表示纳入回归性分析方程组的自变量至少有一个是有效的,进而表明整个回归方程的建立是有意义的。
给定预处理及相关分析后的数据集合S包含相关性分析中相关性大小排名前NL的变量;对于每个Xn,有Xn={m1,m2,…,mQ},Xn包含Q个维度,与具体实施例中的变量所对应。
第一步:建立有序Logistic回归的模型方程:
其中,P(Y≤r)是因变量小于或等于r的概率,αr是第r个等级的截距,β1,β2,...,βQ是特征系数。
第二步:将因变量的类别分为0和1两种,其中当Y≤r时表示为类别0,当Y>r时表示1。即,当放电痕迹数量小于等于设定值时标记为类别0,当放电痕迹数量大于设定值时标记为类别1。
第三步:对于每个二元Logistic回归模型,使用Log-Likelihood函数作为损失函数进行参数估计和模型训练。
其中p(Y=1)是因变量为1的概率,pn是根据模型和参数β计算得到的第n个样本的预测概率,yn是第n个样本的实际类别。通过梯度下降最小化负Log-Likelihood函数来估计参数β。
第四步:令r=r+1,重复第二步和第三步R次,R为有序Logistic回归因变量的类别数减1。
利用上述构建的模型方程和损失函数,进行回归模型训练,通过训练后的回归模型,可以验证相关分析所提取的致灾因子是否合理:通过计算每个输入变量的显著性,判定显著性小于设定值的输入变量通过合理性验证。
本具体实施例中,回归分析中导线是否损坏以及绝缘子是否损坏的显著性均小于0.05,表示这两个变量对于模型的回归方程是有效的,回归分析的最终计算结果如表3所示。
表3回归分析结果(参数估计值)
(3)聚类分析:
本具体实施例采用K-means聚类分析对省份、电压等级、跳闸月份、闪络形式、同塔回数、雷电流幅值、防雷措施、塔型、塔高、接地电阻、保护角、大号侧挡距、小号侧挡距、地形地貌、地面倾角、海拔高度、地闪密度(主放电)、地闪密度(回击)和雷暴日19个属性进行聚类。
其中分类数据为:省份、电压等级、跳闸月份、闪络形式、同塔回数、防雷措施、塔型和地形地貌;定序数据为雷电流幅值、塔高、接地电阻、保护角、大号侧挡距、小号侧挡距、地面倾角、海拔高度、地闪密度(主放电)、地闪密度(回击)和雷暴日。
聚类分析使用SPSS软件进行计算,其计算步骤如下:
给定预处理后的数据集合D={X1,X2,…,XN},D包含N个变量;对于每个Xn,有Xn={m1,m2,…,mQ},Xn包含Q个维度,与具体实施例中的变量所对应。
第一步,随机初始化K个聚类中心{C1,C2,…,CK},1<K≤N,K具体的取值依据分析采用手肘法确定,Ck,1≤k≤K代表第k个聚类的中心。
第二步,计算每个对象到每个聚类中心的欧氏距离,计算公式为其中dis(Xn,Ck)代表对象Xn到Ck的欧式距离,Xn,q代表Xn中第q维的属性,Cn,q代表Cn中第q维的属性。
第三步,对于每个Xn,依据dis(Xn,Ck)将其分配到欧式距离最小的Ck中,得到更新后的K个类簇{S1,S2,…,SK}。并重新确定每个类簇的聚类中心Ck,Sk,num代表属于Sk类簇的Xn有num个。
第四步,重复第二步,第三步,直至Ck不发生改变。
最终,经过聚类分析所得出的方差分析表,得到线路雷击故障特征向量的F值并从大到小排序,选择排序靠前且通过合理性验证的线路雷击故障特征向量作为致灾因子。
聚类分析中采用欧式距离来衡量数据与聚类中心之间的距离。由于因变量为放电痕迹数量,有5类:{0,1,2,3,4},所以设定聚类簇数为5,本具体实施例聚类分析的最终计算结果如表4所示。
表4聚类分析结果(方差分析表)
步骤S4:依据相关分析、回归分析和聚类分析所提取的致灾因子,综合提取出7个因子构建雷害风险评估简化模型。
本具体实施例依据相关分析变量相关性分析结果,回归分析中参数估算值表和聚类分析中方差分析表,依据每个变量所对应F值的高低,提取出简化模型所需的致灾因子。
将雷害风险评估简化为闪络形式的判断,具体来说判断闪络形式为绕击还是反击。将模型简化为公式:
其中b为常量,xn,n=1,2,...,7为自变量,其为三种关联性分析方法综合提取出的致灾因子。wn为第n个致灾因子的相应权重,f(X)表示雷害风险。
基于待评估电网的历史数据对简化模型进行拟合计算,求解得到每个致灾因子的相应权重取值。
简化模型采用LevenBerg-Marquardt算法进行拟合,计算方法如下。
其中J表示雅克比行列式,I表示单位矩阵,λ为阻尼因子,an为模型的参数。
损失函数使用残差平方和(RSS),计算方法如下。
其中fi表示实际值,表示预测值。
本具体实施例将70%的数据用作训练,30%的数据作为测试,最终简化模型为:
该简化模型在训练集上正确率为96.00%,测试集上93.53%。
本说明书中未作详细描述的内容属于本领域专业技术人员公知的现有技术。
Claims (21)
1.一种复杂混联电网雷害风险评估简化模型的构建方法,其特征在于:包括以下步骤:
基于待评估电网的历史数据,收集线路雷击故障特征向量,并对线路雷击故障特征向量进行编码处理;
对编码处理后的线路雷击故障特征向量进行相关性分析,将相关性排序处于第一名至设定名次所在区间的线路雷击故障特征向量作为初步因子;
将初步因子作为回归模型的输入变量,对回归模型进行训练,根据训练完成的回归模型验证初步因子的合理性;
对编码处理后的线路雷击故障特征向量进行聚类分析,根据聚类分析结果在通过合理性验证的初步因子中选取致灾因子;
基于待评估电网的历史数据,构建用于表征致灾因子和雷害风险数学关系的简化模型。
2.根据权利要求1所述的一种方法,其特征在于:所述线路雷击故障特征向量包括:省份、电压等级、跳闸月份、闪络形式、同塔回数、雷电流幅值、防雷措施、塔型、塔高、接地电阻、保护角、大号侧挡距、小号侧挡距、地形地貌、地面倾角、海拔高度、地闪密度、雷暴日和放电痕迹数量。
3.根据权利要求1所述的一种方法,其特征在于:所述编码处理的过程包括:针对线路雷击故障特征向量中不具备序列特征的变量,使用虚拟编码方法将其编码为虚拟变量;对于放电痕迹数量直接进行序列编码处理;对定类变量按类别赋予数字编码;对保护角和地面倾角使用比例归一化处理;对定量变量使用最小最大归一化处理。
4.根据权利要求1所述的一种方法,其特征在于:相关性分析的过程中,定类变量之间使用Cramer’s V系数计算相关性;定序变量和定量变量之间使用Spearman秩相关计算相关性;定序变量之间使用Somer’s D计算相关性;定类变量与定量变量之间使用eta系数计算相关性;将定序变量视为定类变量,使用Cramer’s V系数计算定类变量和定序变量之间的相关性。
5.根据权利要求4所述的一种方法,其特征在于:省份、跳闸月份、闪络形式、同塔回数、防雷措施、塔型、地形地貌为定类变量;电压等级、放电痕迹数量为定序变量;雷电流幅值、塔高、接地电阻、保护角、大号侧档距、小号侧档距、地面倾角、海拔高度、地闪密度、雷暴日为定量变量。
6.根据权利要求2所述的一种方法,其特征在于:回归模型将放电痕迹数量作为因变量。
7.根据权利要求6所述的一种方法,其特征在于:回归模型采用Logistic回归模型;当放电痕迹数量小于等于设定值时标记为类别0,当放电痕迹数量大于设定值时标记为类别1。
8.根据权利要求6所述的一种方法,其特征在于:基于训练完成的回归模型,计算每个输入变量的显著性,判定显著性小于设定值的输入变量通过合理性验证。
9.根据权利要求3所述的一种方法,其特征在于:聚类分析中因变量的分类根据放电痕迹数量确定。
10.根据权利要求9所述的一种方法,其特征在于:通过聚类分析得到线路雷击故障特征向量的F值并从大到小排序,选择排序处于第一名至设定名次所在区间且通过合理性验证的到线路雷击故障特征向量作为致灾因子。
11.根据权利要求2所述的一种方法,其特征在于:所述雷害风险表征为闪络形式;所述闪络形式包括绕击和反击。
12.根据权利要求11所述的一种方法,其特征在于:所述简化模型的数学表达式为:
其中,b为常量;xn,n=1,2,...,7为致灾因子;wn为第n个致灾因子的相应权重,f(X)表示雷害风险。
13.根据权利要求12所述的一种方法,其特征在于:基于待评估电网的历史数据对简化模型进行拟合计算,求解得到每个致灾因子的相应权重取值。
14.一种复杂混联电网雷害风险评估简化模型的构建系统,其特征在于:包括数据收集模块、编码处理模块、相关性分析模块、回归分析模块、聚类分析模块和简化模型构建模块;其中,
数据收集模块用于基于待评估电网的历史数据,收集线路雷击故障特征向量;
编码处理模块用于对线路雷击故障特征向量进行编码处理;
相关性分析模块用于对编码处理后的线路雷击故障特征向量进行相关性分析,将相关性排序处于设定名次区间的线路雷击故障特征向量作为初步因子;
回归分析模块用于将初步因子作为回归模型的输入变量,对回归模型进行训练,根据训练完成的回归模型验证初步因子的合理性;
聚类分析模块用于对编码处理后的线路雷击故障特征向量进行聚类分析,根据聚类分析结果在通过合理性验证的初步因子中选取致灾因子;
简化模型构建模块用于基于待评估电网的历史数据,构建用于表征致灾因子和雷害风险数学关系的简化模型。
15.根据权利要求14所述的一种复杂混联电网雷害风险评估简化模型的构建系统,其特征在于:所述编码处理模块针对线路雷击故障特征向量中不具备序列特征的变量,使用虚拟编码方法将其编码为虚拟变量;对于放电痕迹数量直接进行序列编码处理;对定类变量按类别赋予数字编码;对保护角和地面倾角使用比例归一化处理;对定量变量使用最小最大归一化处理。
16.根据权利要求14所述的一种复杂混联电网雷害风险评估简化模型的构建系统,其特征在于:所述相关性分析模块在相关性分析的过程中,定类变量之间使用Cramer’s V系数计算相关性;定序变量和定量变量之间使用Spearman秩相关计算相关性;定序变量之间使用Somer’s D计算相关性;定类变量与定量变量之间使用eta系数计算相关性;将定序变量视为定类变量,使用Cramer’s V系数计算定类变量和定序变量之间的相关性。
17.根据权利要求14所述的一种复杂混联电网雷害风险评估简化模型的构建系统,其特征在于:回归分析模块中回归模型采用Logistic回归模型;当放电痕迹数量小于等于设定值时标记为类别0,当放电痕迹数量大于设定值时标记为类别1。
18.根据权利要求14所述的一种复杂混联电网雷害风险评估简化模型的构建系统,其特征在于:回归分析模块中基于训练完成的回归模型,计算每个输入变量的显著性,判定显著性小于设定值的输入变量通过合理性验证。
19.根据权利要求14所述的一种复杂混联电网雷害风险评估简化模型的构建系统,其特征在于:聚类分析模块通过聚类分析得到线路雷击故障特征向量的F值并从大到小排序,选择排序处于第一名至设定名次所在区间且通过合理性验证的到线路雷击故障特征向量作为致灾因子。
20.根据权利要求14所述的一种复杂混联电网雷害风险评估简化模型的构建系统,其特征在于:简化模型构建模块中简化模型的数学表达式为:
其中,b为常量;xn,n=1,2,...,7为致灾因子;wn为第n个致灾因子的相应权重,f(X)表示雷害风险。
21.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1-13中任一项所述的复杂混联电网雷害风险评估简化模型的构建方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311788814.1A CN117973180A (zh) | 2023-12-25 | 2023-12-25 | 复杂混联电网雷害风险评估简化模型的构建方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311788814.1A CN117973180A (zh) | 2023-12-25 | 2023-12-25 | 复杂混联电网雷害风险评估简化模型的构建方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117973180A true CN117973180A (zh) | 2024-05-03 |
Family
ID=90853852
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311788814.1A Pending CN117973180A (zh) | 2023-12-25 | 2023-12-25 | 复杂混联电网雷害风险评估简化模型的构建方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117973180A (zh) |
-
2023
- 2023-12-25 CN CN202311788814.1A patent/CN117973180A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107169628B (zh) | 一种基于大数据互信息属性约简的配电网可靠性评估方法 | |
CN109217296B (zh) | 一种基于加权潮流熵和电压稳定的电网关键节点辨识方法 | |
CN109308571B (zh) | 配电线路线变关系检测方法 | |
CN110348615B (zh) | 基于蚁群优化支持向量机的电缆线路故障概率预测方法 | |
CN103366123B (zh) | 基于缺陷分析的软件风险评估方法 | |
CN110598726A (zh) | 一种基于随机森林的输电杆塔鸟害风险预测方法 | |
CN105303331A (zh) | 一种变压器维修风险决策方法 | |
CN110417011A (zh) | 一种基于互信息与迭代随机森林的在线动态安全评估方法 | |
CN110378549B (zh) | 一种基于fahp-熵权法的输电杆塔鸟害等级评估方法 | |
CN110580387B (zh) | 基于熵权法的直流保护系统混合威布尔可靠性评价方法 | |
CN109934500A (zh) | 一种配电台区的低电压评价方法、装置、设备及存储介质 | |
CN113591256B (zh) | 一种山区输电线路杆塔雷击概率结果评估方法 | |
CN114139946A (zh) | 一种输电线路的风险评估方法、系统、设备和介质 | |
CN111695775A (zh) | 基于偏好比率-熵值法最优组合赋权的输电线路雷击风险评估方法 | |
CN111177004A (zh) | 软件测试综合评价方法、装置、电子设备及存储介质 | |
CN105912857A (zh) | 一种配电设备状态监测传感器的选配方法 | |
CN111523088A (zh) | 一种基于dpsir模型的生态环境评价方法 | |
CN109359896A (zh) | 一种基于svm的电网线路故障风险预警方法 | |
CN110783964A (zh) | 电网静态安全的风险评估方法和装置 | |
CN110209996A (zh) | 一种用于评价继电保护装置的健康水平的方法及系统 | |
CN110889565B (zh) | 一种基于多维矩阵决策的配网巡检周期计算方法 | |
CN115545479A (zh) | 一种配电网重要节点或重要线路的确定方法及装置 | |
CN111814284A (zh) | 基于相关性检测与改进随机森林的在线电压稳定评估方法 | |
CN115033591A (zh) | 一种电费数据异常智能检测方法、系统、存储介质及计算机设备 | |
Vahidi et al. | Determining arresters best positions in power system for lightning shielding failure protection using simulation optimization approach |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination |