CN108133280A - 一种基于偏互信息法的覆冰闪络影响因素筛选方法 - Google Patents

一种基于偏互信息法的覆冰闪络影响因素筛选方法 Download PDF

Info

Publication number
CN108133280A
CN108133280A CN201710995427.3A CN201710995427A CN108133280A CN 108133280 A CN108133280 A CN 108133280A CN 201710995427 A CN201710995427 A CN 201710995427A CN 108133280 A CN108133280 A CN 108133280A
Authority
CN
China
Prior art keywords
variable
flashover
icing
mutual information
influence factor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710995427.3A
Other languages
English (en)
Inventor
常康
郁琛
程松
任龙飞
褚云龙
段乃欣
吕友杰
谢云云
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
STATE GRID NORTHWEST CHINA GRID Co Ltd
Nanjing University of Science and Technology
Nari Technology Co Ltd
Nanjing NARI Group Corp
Original Assignee
STATE GRID NORTHWEST CHINA GRID Co Ltd
Nanjing University of Science and Technology
Nari Technology Co Ltd
Nanjing NARI Group Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by STATE GRID NORTHWEST CHINA GRID Co Ltd, Nanjing University of Science and Technology, Nari Technology Co Ltd, Nanjing NARI Group Corp filed Critical STATE GRID NORTHWEST CHINA GRID Co Ltd
Priority to CN201710995427.3A priority Critical patent/CN108133280A/zh
Publication of CN108133280A publication Critical patent/CN108133280A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Operations Research (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Game Theory and Decision Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Quality & Reliability (AREA)
  • Probability & Statistics with Applications (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于偏互信息法的覆冰闪络影响因素筛选方法,属于电力系统故障预警技术领域。本发明基于偏互信息法考虑因素之间的相关影响,筛选出覆冰闪络故障的主要影响因素。本发明以筛选覆冰闪络故障主要影响因素为目标,大大减少了覆冰闪络预测模型的复杂度,使得覆冰闪络特性研究成果可以在覆冰闪络故障预警中得以应用。

Description

一种基于偏互信息法的覆冰闪络影响因素筛选方法
技术领域
本发明属于电力系统故障预警技术领域,更准确地说,本发明涉及一种基于偏互信息法的覆冰闪络影响因素的筛选方法。
背景技术
由于电力系统长期暴露有自然环境中,输电线路会经常受到自然灾害的影响,而自然灾害引发电网故障的预警是保证电网安全稳定运行的重要途径。覆冰灾害是影响电力系统运行最为严重的灾害之一。覆冰灾害不仅会造成输电线路跳闸,还会引起一次系统损坏,造成长时间线路停运,一直以来是电网灾害防御的重点。由于覆冰闪络的影响因素较多,所以对于覆冰闪络故障预警的研究也较为复杂。
在目前的覆冰闪络研究中,普遍的做法是给出一个或多个因素与覆冰闪络电压直接的定量表达式。但在实际电网运行过程中,覆冰闪络是多个因素共同作用的结果,且实际参数分布与实验室模拟有很大差别,另外数据的采集也存在误差,使得现有覆冰闪络特性研究成果难以在覆冰闪络故障预警中直接应用。
随着数据挖掘技术的发展,近年来基于数据驱动的方法逐渐在电力系统中得到了广泛的应用。覆冰闪络特性模型中的参数能够反应覆冰闪络的整体特性,同样适用数据挖掘方法发掘其规律。但是由于覆冰闪络影响因素较多,在预测模型中考虑全部因素将增加模型的复杂度,首先需要提取出关键的影响因素。而常用的偏最小二乘法和Schmidt变换虽能够对输入变量进行特征提取以降低维数和消除相关性,但其在求解非线性问题中的表现较差,故难以应用到覆冰闪络特性模型的数据挖掘中。
互信息(mutual information,MI)是以信息论中的熵为基础,用于反映变量间的线性和非线性相关关系的一种方法,能够定量地反映变量间的相关程度,并且在描述线性和非线性变量时都具有较好的性能。在互信息的基础上,偏互信息(partial mutualinformation,PMI)用条件期望剔除变量间的相关关系再计算其互信息,消除了变量之间的联系,有效地提高了变量选择的精确性。中国专利申请CN201410713154.5就公开了一种耦合偏互信息和CFS集合预报的小水电发电能力预测方法。如能将偏互信息应用到覆冰闪络特性模型的数据挖掘中,必然能准确地预测冰闪故障提供帮助。
发明内容
本发明目的是:结合现有技术中的偏互信息方法,提供一种基于偏互信息法的覆冰闪络影响因素筛选方法。
具体地说,本发明是采用以下技术方案实现的,包括如下步骤:
1)选取N个输电线路覆冰闪络的影响因素放入变量集X中,设输出因变量为Y,Y代表是否发生冰闪跳闸现象,最优输入变量集为S,将S初始化为空集;
2)对于X中每个变量,计算其与Y的互信息I(Xi,Y),其中Xi代表X中第i个变量;
3)记使I(Xi,Y)值最大的X中的那个变量为XS,根据XS计算AIC值,并将XS从X中移入S;
AIC值的计算公式为:
式中,ri为根据已选变量计算的Y回归残差;n为取值个数;p为已选变量个数,log对数取2为底,单位为比特;
4)若X不为空,对于其中每一个变量,计算ui=Xi-mXi(S)与v=Y-mY(S),并计算I(ui,v),其中:
mXi(S)=E[xi|S=Xs]
mY(S)=E[y|S=Xs]
其中,xi、y分别代表Xi和Y的取值;
5)根据使I(ui,v)值最大的X中的那个变量重新计算AIC值,若AIC减小,则将该变量做为新的XS并从X中移入S,返回步骤4),否则终止筛选。
上述技术方案的进一步特征在于,所述输电线路覆冰闪络的影响因素为覆冰厚度、覆冰水电导率、覆冰前污秽程度、风速、外界环境温度、所在地区海拔、绝缘子串长以及绝缘子伞径。
上述技术方案的进一步特征在于,对于各输电线路覆冰闪络的影响因素,按以下方式对其数据进行预处理:随机选取3个数据点作为聚类中心,计算其他数据点到这3个点的欧氏距离,将数据归为3个聚类,分别计算3个聚类的聚类中心,将所有数据重新聚类,迭代直至聚类中心不再变化,计算每个聚类内数据点到聚类中心的距离,得到距离均值,若某个点到该聚类中心的距离超过了上述均值的3倍,则将其视为异常点剔除。
本发明的有益效果如下:本发明结合偏互信息方法打破了原先以一个或多个因素与覆冰闪络电压的定量表达式研究覆冰闪络特性的现状,筛选出覆冰闪络影响的关键因素,大大减少了覆冰闪络预测模型的复杂度,使得覆冰闪络特性研究成果可以在覆冰闪络故障预警中得以应用。
附图说明
图1是本发明的流程示意图。
具体实施方式
下面参照附图对本发明作进一步详细描述。
互信息定量地表征了两个或多个变量间共享的信息量,互信息的大小反映了变量间的相关程度,并且在描述线性和非线性变量时都具有较好的性能。但当输入变量间存在耦合关系时,互信息的计算将产生偏差。偏互信息法则采用条件期望剔除变量间的相关关系再计算其互信息,从而有效地提高了变量选择的精确性。偏互信息法的基本原理如下:
对一个变量X,其取值的平均不确定性可以通过信息熵来度量,信息熵H(X)定义为:
式中,n为取值个数,pi为X在各个取值下的概率分布,式中对数一般取2为底,单位为比特,以下不再重复指出。
如果存在一个与X相关的变量Y,则将两个变量相关的部分定义为互信息,互信息的信息熵为:
式中,m,n分别为两个变量的取值个数,pi,pi分别为两个变量在各个取值下的概率分布,pij为两个变量的联合分布概率。在X和Y取值个数相等的情况下,有m=n。
由于一般情况下已知X和Y的样本数据而未知其概率分布,故一般采用概率密度估计的方法代替,此时在m=n时,上式可以近似为:
式中,xi、yi分别为X和Y的第i个取值,f为基于相应变量的n个样本数据的估计概率密度函数。一般可用核密度计算方法,选取标准正态函数作为核函数,将核函数叠加起来得到相应变量的估计概率密度函数。以变量X为例,则X的核密度估计的概率密度函数具体如下:
式中,n为取值个数,d为X的维数,x为X的取值;当X为一维时,∑为X的方差,当X为二维时,∑为协方差矩阵。h为尺度参数,一般h的最优值为:
对于多输入系统,设输入为X和Z,输出为Y,x、y、z分别为X、Y和Z的取值。如变量X和Z之间若具有耦合关系,将使X与Y、Z与Y之间互信息计算出现偏差,因此使用条件期望剔除Z后的X、Y分别记为u、v,即令
mX(Z)=E[x|Z=z]及mY(Z)=E[y|Z=z],则v=Y-mY(Z)和u=X-mX(Z)。
由此可将X、Y的偏互信息记为:
PMI(X,Y)=I(u,v)
本发明的步骤如图1所示,具体如下:
步骤一,选取N个输电线路覆冰闪络的影响因素放入变量集X中,设输出因变量为Y,Y代表是否发生冰闪跳闸现象,最优输入变量集为S(初始值为空集)。
步骤二,对于X中每个变量,计算其与Y的互信息I(Xi,Y),其中Xi代表X中第i个变量。
步骤三,记使I(Xi,Y)值最大的X中的那个变量为XS,根据XS计算AIC值,并将XS从X中移入S;
AIC值的作用是作为收敛结束的判断条件,能够平衡样本规模和收敛精度,它的计算公式为:
式中,ri为根据已选变量计算的Y回归残差;n为取值个数;p为已选变量个数。随着变量的筛选,AIC的值不断减小,当AIC达到最小值时,最优自变量集合筛选完毕。
步骤四,若X不为空,对于其中每一个变量,计算ui=Xi-mXi(S)与v=Y-mY(S),并计算I(ui,v),其中:
mXi(S)=E[xi|S=Xs]
mY(S)=E[y|S=Xs]
其中,xi、y分别代表Xi和Y的取值;
步骤五,根据使I(ui,v)值最大的X中的那个变量重新计算AIC值,若AIC减小,则将该变量做为新的XS并从X中移入S,返回步骤四,否则终止筛选。
以下给出上述方法的具体实施例。本实施例以某覆冰多发地区输电线路绝缘子串为研究对象,选取覆冰厚度x1(cm/片)、覆冰水电导率x2(μS/cm)、覆冰前污秽程度x3(mg/cm2)、风速x4(m/s)、外界环境温度x5(℃)、所在地区海拔x6(m)、绝缘子串长x7(m)以及绝缘子伞径x8(m)共八个因素作为初始输入变量,将是否发生冰闪跳闸现象作为输出变量y(若发生跳闸,则将输出y置为1,否则置为0),整理该地区近年一、二月份覆冰监测数据共计330组。采用k-means聚类算法处理数据,随机选取3个数据点作为聚类中心,计算其他数据点到这3个点的欧氏距离,将数据归为3个聚类;分别计算3个聚类的聚类中心,将所有数据重新聚类,迭代直至聚类中心不再变化;计算每个聚类内数据点到聚类中心的距离,得到距离均值,若某个点到该聚类中心的距离超过了上述均值的3倍,则将其视为异常点剔除。经过此方法筛选后最终保留了303组数据,其中发生绝缘子覆冰闪络的数据共158组,正常工作情况下的数据共145组。
通过下式将数据归一化处理到区间[-1,1]:
式中,x为数据的实际值,x'为归一后的值,xmin和xmax为各影响因素数据各自的最小值和最大值。
应用PMI变量选择方法对这303组数据进行计算,每一轮的计算结果如表1所示。
表1
从表1的计算结果可以看出,第一轮的计算中,x1对应的互信息值最大,则认为覆冰厚度是对该地区绝缘子覆冰闪络影响最大的因素,将覆冰厚度加入到最优变量集C中,并计算由覆冰厚度拟合的AIC指标为-490.1057。第二轮的筛选中,剔除其余七个变量与覆冰厚度的耦合关系,并计算与输出变量的偏互信息值,比较后将偏互信息值最大对于的x3(覆冰前污秽程度)加入最优变量集C中,由公式计算已选两个变量对应的AIC指标为-493.5660。以此类推,前四轮筛选中AIC值不断减小,最小值为-575.3941。对应第五次筛选的AIC值-553.5540已大于前一轮的AIC值,因此不保留此轮筛选结果,最终PMI变量选择输出结果为覆冰厚度、覆冰前污秽程度、覆冰水电导率、海拔。
由上可知,本发明的方法能够筛选出覆冰闪络影响的关键因素,大大减少了覆冰闪络预测模型的复杂度,为覆冰闪络故障预警提供了可靠的因素筛选方法。
虽然本发明已以较佳实施例公开如上,但实施例并不是用来限定本发明的。在不脱离本发明之精神和范围内,所做的任何等效变化或润饰,同样属于本发明之保护范围。因此本发明的保护范围应当以本申请的权利要求所界定的内容为标准。

Claims (3)

1.一种基于偏互信息法的覆冰闪络影响因素筛选方法,其特征在于,包括以下步骤:
1)选取N个输电线路覆冰闪络的影响因素放入变量集X中,设输出因变量为Y,Y代表是否发生冰闪跳闸现象,最优输入变量集为S,将S初始化为空集;
2)对于X中每个变量,计算其与Y的互信息I(Xi,Y),其中Xi代表X中第i个变量;
3)记使I(Xi,Y)值最大的X中的那个变量为XS,根据XS计算AIC值,并将XS从X中移入S;
AIC值的计算公式为:
式中,ri为根据已选变量计算的Y回归残差;n为取值个数;p为已选变量个数;log对数取2为底,单位为比特;
4)若X不为空,对于其中每一个变量,计算ui=Xi-mXi(S)与v=Y-mY(S),并计算I(ui,v),其中:
mXi(S)=E[xi|S=Xs]
mY(S)=E[y|S=Xs]
其中,xi、y分别代表Xi和Y的取值;
5)根据使I(ui,v)值最大的X中的那个变量重新计算AIC值,若AIC减小,则将该变量做为新的XS并从X中移入S,返回步骤4),否则终止筛选。
2.根据权利要求1所述的基于偏互信息法的覆冰闪络影响因素筛选方法,其特征在于,所述输电线路覆冰闪络的影响因素为覆冰厚度、覆冰水电导率、覆冰前污秽程度、风速、外界环境温度、所在地区海拔、绝缘子串长以及绝缘子伞径。
3.根据权利要求2所述的基于偏互信息法的覆冰闪络影响因素筛选方法,其特征在于,对于各输电线路覆冰闪络的影响因素,按以下方式对其数据进行预处理:随机选取3个数据点作为聚类中心,计算其他数据点到这3个点的欧氏距离,将数据归为3个聚类,分别计算3个聚类的聚类中心,将所有数据重新聚类,迭代直至聚类中心不再变化,计算每个聚类内数据点到聚类中心的距离,得到距离均值,若某个点到该聚类中心的距离超过了上述均值的3倍,则将其视为异常点剔除。
CN201710995427.3A 2017-10-23 2017-10-23 一种基于偏互信息法的覆冰闪络影响因素筛选方法 Pending CN108133280A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710995427.3A CN108133280A (zh) 2017-10-23 2017-10-23 一种基于偏互信息法的覆冰闪络影响因素筛选方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710995427.3A CN108133280A (zh) 2017-10-23 2017-10-23 一种基于偏互信息法的覆冰闪络影响因素筛选方法

Publications (1)

Publication Number Publication Date
CN108133280A true CN108133280A (zh) 2018-06-08

Family

ID=62388673

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710995427.3A Pending CN108133280A (zh) 2017-10-23 2017-10-23 一种基于偏互信息法的覆冰闪络影响因素筛选方法

Country Status (1)

Country Link
CN (1) CN108133280A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113288122A (zh) * 2021-05-21 2021-08-24 河南理工大学 一种可穿戴坐姿监测装置和坐姿监测方法
CN116307282A (zh) * 2023-05-19 2023-06-23 济南作为科技有限公司 一种基于机理模型和数据驱动的风电功率预测方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102175203A (zh) * 2011-01-30 2011-09-07 西安工程大学 一种输电线路覆冰突出影响因素分析方法
US20120249286A1 (en) * 2011-03-31 2012-10-04 General Electric Company System and method for assuring utility network security and reliability
CN105785243A (zh) * 2016-04-08 2016-07-20 国家电网公司 一种特高压交流输电线路绝缘子覆冰闪络风险评估方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102175203A (zh) * 2011-01-30 2011-09-07 西安工程大学 一种输电线路覆冰突出影响因素分析方法
US20120249286A1 (en) * 2011-03-31 2012-10-04 General Electric Company System and method for assuring utility network security and reliability
CN105785243A (zh) * 2016-04-08 2016-07-20 国家电网公司 一种特高压交流输电线路绝缘子覆冰闪络风险评估方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
刘吉臻 等: ""基于偏互信息的变量选择方法及其在火电厂SCR系统建模中的应用"", 《中国电机工程学报》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113288122A (zh) * 2021-05-21 2021-08-24 河南理工大学 一种可穿戴坐姿监测装置和坐姿监测方法
CN113288122B (zh) * 2021-05-21 2023-12-19 河南理工大学 一种可穿戴坐姿监测装置和坐姿监测方法
CN116307282A (zh) * 2023-05-19 2023-06-23 济南作为科技有限公司 一种基于机理模型和数据驱动的风电功率预测方法及系统

Similar Documents

Publication Publication Date Title
CN108133225A (zh) 一种基于支持向量机的覆冰闪络故障预警方法
CN110542819B (zh) 一种基于半监督dbnc的变压器故障类型诊断方法
CN107292478B (zh) 一种灾害对配电网影响态势的获取方法
Moayyed et al. A Cyber-Secure generalized supermodel for wind power forecasting based on deep federated learning and image processing
CN113904786B (zh) 一种基于线路拓扑分析和潮流特性的虚假数据注入攻击辨识方法
CN110738355A (zh) 一种基于神经网络的城市内涝预测方法
CN112415331B (zh) 基于多源故障信息的电网二次系统故障诊断方法
CN115169724A (zh) 一种基于时空图卷积神经网络的径流预测方法
CN106485333A (zh) 一种输电线路运行状态评估方法
Li et al. Analysis and modelling of flood risk assessment using information diffusion and artificial neural network
CN108133280A (zh) 一种基于偏互信息法的覆冰闪络影响因素筛选方法
AU2019100631A4 (en) Self-correcting multi-model numerical rainfall ensemble forecasting method
Azimi et al. Anomaly detection and reliability analysis of groundwater by crude Monte Carlo and importance sampling approaches
CN116021981A (zh) 配电网线路覆冰故障预测方法、装置、设备及存储介质
CN115580446A (zh) 一种基于去中心化联邦学习的非侵入式负荷检测方法
CN114513367A (zh) 基于图神经网络的蜂窝网络异常检测方法
Li et al. Drought assessment based on data fusion and deep learning
Wang et al. Multi‐harmonic sources location based on sparse component analysis and complex independent component analysis
CN117674119A (zh) 电网运行风险评估方法、装置、计算机设备和存储介质
ul Hassan et al. Online static security assessment for cascading failure using stacked De-noising Auto-encoder
CN117314240A (zh) 极端天气条件下园区综合能源系统韧性评估方法和系统
CN116151799A (zh) 一种基于bp神经网络的配电线路多工况故障率快速评估方法
Mei et al. A data‐driven approach to state assessment of the converter valve based on oversampling and Shapley additive explanations
CN113408816B (zh) 一种基于深度神经网络的电网灾情评估方法
CN114692729A (zh) 基于深度学习的新能源场站不良数据辨识与修正方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180608