一种配电网建设项目成效评价方法
技术领域
本发明涉及配电网项目建设成效评价领域,尤其涉及一种基于历史数据挖掘的配电网项目建设成效评价方法。
背景技术
配电网直接面向用户,具有电压等级多,网络结构复杂,设备类型多样,安全环境相对较差等特点,因此配电网的安全风险因素也相对较多。配电网建设项目是完善配电网结构、提升配电网性能的重要途径。
由于配电网覆盖面广、规模大,每年的配电网建设项目多、任务重,对项目建设成效的评价涉及较少。对配电网建设项目的建设效果进行评价有利于反映配电网建设项目的建设效果,总结项目建设的成效,为后期配电网建设项目的规划提供参考依据。
目前常用的配电网项目评价方法多是从配电网建设的各个环节出发,分别列出各类评价指标,利用各种方法进行赋权打分,最终得到一个评价结果,这类方法在指标确定、权重分配、打分标准上皆存在较大的主观性,而且评价结果的通用性较差,评价方法的可移植性也较差。如有的利用模糊数学隶属函数的方法来对不同指标的权重进行计算,有的利用模糊关系矩阵来确定指标的权重,过程中隶属函数的确定都需要人为选取。
经过多年的建设,电网公司积累了丰富的配网建设项目信息以及电网运行状态信息,电网的运行状态与配电网建设项目的成效之间存在着较强的关联关系,通过挖掘配网建设项目及电网运行状态数据中所蕴含的信息,可对配电网建设项目的成效进行定量评价,并可在此基础上实现配电网计划建设项目成效的预测。
发明内容
本发明所解决的技术问题在于提供一种基于历史数据挖掘的配电网建设项目成效评价方法,以解决上述背景技术中的问题。
本发明通过下述技术方案来实现,一种配电网建设项目成效评价方法,步骤如下:
S1、以配电网建设项目的建设情况为输入变量,所对应的配电网运行指标改善情况为输出变量,建立项目建设情况与网络运行指标改善之间的关联关系,按下式计算项目建设指标与运行状态指标改善之间的相关系数rij:
式中,x
i为第i个项目建设指标,y
j为第j个运行状态指标,
为项目建设指标平均值,
为运行状态指标平均值;
S2、对相关系数进行判断,选取其中相关系数大的项目建设指标作为该运行状态指标的待筛变量;如0.5≤|rij|,则项目建设指标xi为运行状态指标yj的待筛变量;
S3、采用逐步回归选元法对建设成效评价分析模型的变量进行选择;
S4、根据S3中选元结果,根据统计所得配网建设项目样本X及配网状态改善指标样本Y,利用最小二乘法对X和Y的回归参数进行估计
得到各变量的回归系数β
0,β
1,β
2,…,β
n,建立配网运行指标改善与所选项目建设指标之间的回归模型:
yi=β0+β1xk+β2xl…+βnxn
式中k,l,n∈i,xk,xl,xn为从xi中筛选出来的项目建设指标;
至此,可得到一个由历史记录信息确定的成效评价模型,其各指标的关联关系及权重都由历史记录信息所确定;
S5、利用该回归模型进行项目建设成效评价时,将项目的具体指标按前述变量的方式组织成一个输入向量X',输入该回归模型,该模型可输出线路3个指标变化量的评价值Y';以该评价值为基准,将项目建设后实际线路指标的变化量Yi与评价值进行比较:
具体的,步骤S1中,以县公司为统计单位,统计县公司建设项目的建设指标作为输入,具体包括:
(1)新建项目数(x1)。以县公司为单位,统计县公司内每年实施的新建项目总数。
(2)改造项目数(x2)。以县公司为单位,统计县公司内每年实施的改造项目总数。
(3)项目投资额(x3)。以县公司为单位,统计县公司内每年建设项目经费的总额。
(4)配电台区项目数(x4)。以县公司为单位,统计县公司内每年实施的针对配电台区的项目总数。
(5)中压线路项目数(x5)。以县公司为单位,统计县公司内每年实施的针对中压线路的项目总数。
(6)10kV项目数(x6)。以县公司为单位,统计县公司内每年实施的电压等级为10kV的项目总数。
(7)380v项目数(x7)。以县公司为单位,统计县公司内每年实施的电压等级为380v的项目总数。
(8)新建变压器容量(x8)。以县公司为单位,统计县公司内每年新建的变压器容量之和。
(9)改造变压器容量(x9)。以县公司为单位,统计县公司内每年改造的变压器容量之和。
(10)新建10Kv线路的长度(x10)。以县公司为单位,统计县公司内每年新建的10Kv线路长度之和。
(11)改造10Kv线路的长度(x11)。以县公司为单位,统计县公司内每年改造的10Kv线路长度之和。
(12)新建380v线路的长度(x12)。以县公司为单位,统计县公司内每年新建的380v线路长度之和。
(13)改造380v线路的长度(x13)。以县公司为单位,统计县公司内每年改造的380v线路长度之和。
将上述指标作为输入变量X=(x1,……,x13)。
具体的,步骤S1中,反映配电网运行状态改变的指标有:
(1)线路跳闸率变化量。反映线路跳闸率比项目建设前减少的情况。以县公司为单位,统计县公司内每年的线路跳闸率,并与上一年的跳闸率进行比较,计算改造后线路跳闸率的变化量:
y1=ya(i-1)-yai
其中,线路的跳闸率
其中m为县公司该年度的线路跳闸总次数,l为县公司的线路总条数。
(2)线路过载率变化量。反映线路过载率比项目建设前减少的情况。以县公司为单位,统计县公司内每年的线路过载率,并与上一年的过载率进行比较,计算改造后线路过载率的变化量:
y2=yb(i-1)-ybi
其中,线路的过载率
其中n为县公司该年度的线路过载的总次数,l为县公司的线路总条数。
(3)线路重载率变化量。反映线路重载率比项目建设前较少的情况。以县公司为单位,统计县公司内每年的线路重载率,并与上一年的重载率进行比较,计算改造后线路重载率的变化量:
y3=yc(i-1)-yci
其中,线路的重载率
其中k为县公司该年度的线路重载的总次数,l为县公司的线路总条数。
由此,得项目建设情况下配电网运行指标的改善输出Y=(y1,y2,y3)。
在配电网其他条件不变的情况下,可认为配网运行状态的改善是上述项目建设的结果。
将前述项目建设情况和对应的指标改善形成样本(X,Y)。一般的,为保证所得方法的准确性,所用到建设项目的信息及指标改善的信息不少于3年的数据。
进一步优选,步骤S3的具体过程是:
(a).确定显著性检验最大F值及其对应的变量;
利用配网运行状态指标改善量yj,(j=1,2,3)与建设项目xi,(i=1,2,…m)(m为步骤(2)筛选出的待筛变量的个数)分别进行回归分析,建立一元回归模型;
yj=β0+βixi,其中β0、βi为回归系数
分别计算每一个变量x
i相应的回归系数的F检验统计值
若最大的F值
在给定的显著性水平α=0.05下满足
则该建设项目指标x
k,k∈(1,2,…m)首先被选中;
(b)建立因变量y
j与自变量子集{x
k,x
1},……{x
k,x
m}之间的二元回归模型,计算变量的回归系数F检验的统计量值,选其中最大者
同样,若偏F统计量
则建设项目指标x
l被选中;
(c)因变量yj与自变量子集{xk,xl,xi}的回归重复步骤(b);xk,xl为(a)、(b)中筛选出的项目建设指标,xi为余下的项目建设指标;
依此方法重复进行,每次从未引入的自变量中选取一个,直到经检验没有变量引入为止。
本发明的有益效果:
(1)以配电网建设项目及运行状态相关的历史信息为依据,提取反映配电网建设项目成效的具体信息,并由此得到配电网建设项目成效的评价模型,可用来对规划建设项目可能的成效进行评价。
(2)配电网建设项目的历史信息作为输入。提取配电网建设项目的关键信息,包括新建项目数、改造项目数、项目投资额、配电台区项目数、中压线路项目数、10kV项目数、380v项目数、新建变压器容量、改造变压器容量、新建10Kv线路的长度、改造10Kv线路的长度、新建380v线路的长度、改造380v线路的长度。
(3)配电网项目建设前后运行指标的改进作为输出。以县为单位统计配电网项目实施前后运行指标的改善情况。包括线路跳闸减少率、线路过载减少率、线路重载减少率、配变低电压减少率、配变过载减少率、配变重载减少率。
(4)采用逐步回归选元法对影响配网建设成效的项目建设指标进行筛选,逐步回归选元是一个不断吐故纳新的过程,对配网运行状态改善不重要的建设信息最终是不会被引入的,即使开始时被引入最后也会被剔除。
(5)以配电网历史数据确定建设项目与指标提升之间的关联关系。利用最小二乘法建立建设成效与建设项目指标之间的回归模型,通过众多的历史数据体现建设项目与性能指标提升之间的关联关系,无需人为指定。
(6)以训练后的神经网络模型输出为评价基准,线路实际的指标变化量与基准值的比较结果来判断项目建成的成效。
具体实施方式
下面对本发明作进一步详细说明。
一种配电网建设项目成效评价方法,步骤如下:
S1、以配电网建设项目的建设情况为输入变量,所对应的配电网运行指标改善情况为输出变量,建立项目建设情况与网络运行指标改善之间的关联关系,
以县公司为统计单位,统计县公司建设项目的建设指标作为输入,具体包括:
(1)新建项目数(x1)。以县公司为单位,统计县公司内每年实施的新建项目总数。
(2)改造项目数(x2)。以县公司为单位,统计县公司内每年实施的改造项目总数。
(3)项目投资额(x3)。以县公司为单位,统计县公司内每年建设项目经费的总额。
(4)配电台区项目数(x4)。以县公司为单位,统计县公司内每年实施的针对配电台区的项目总数。
(5)中压线路项目数(x5)。以县公司为单位,统计县公司内每年实施的针对中压线路的项目总数。
(6)10kV项目数(x6)。以县公司为单位,统计县公司内每年实施的电压等级为10kV的项目总数。
(7)380v项目数(x7)。以县公司为单位,统计县公司内每年实施的电压等级为380v的项目总数。
(8)新建变压器容量(x8)。以县公司为单位,统计县公司内每年新建的变压器容量之和。
(9)改造变压器容量(x9)。以县公司为单位,统计县公司内每年改造的变压器容量之和。
(10)新建10Kv线路的长度(x10)。以县公司为单位,统计县公司内每年新建的10Kv线路长度之和。
(11)改造10Kv线路的长度(x11)。以县公司为单位,统计县公司内每年改造的10Kv线路长度之和。
(12)新建380v线路的长度(x12)。以县公司为单位,统计县公司内每年新建的380v线路长度之和。
(13)改造380v线路的长度(x13)。以县公司为单位,统计县公司内每年改造的380v线路长度之和。
将上述指标作为输入变量X=(x1,……,x13)。
反映配电网运行状态改变的指标有:
(1)线路跳闸率变化量。反映线路跳闸率比项目建设前减少的情况。以县公司为单位,统计县公司内每年的线路跳闸率,并与上一年的跳闸率进行比较,计算改造后线路跳闸率的变化量:
y1=ya(i-1)-yai
其中,线路的跳闸率
其中m为县公司该年度的线路跳闸总次数,l为县公司的线路总条数。
(2)线路过载率变化量。反映线路过载率比项目建设前减少的情况。以县公司为单位,统计县公司内每年的线路过载率,并与上一年的过载率进行比较,计算改造后线路过载率的变化量:
y2=yb(i-1)-ybi
其中,线路的过载率
其中n为县公司该年度的线路过载的总次数,l为县公司的线路总条数。
(3)线路重载率变化量。反映线路重载率比项目建设前较少的情况。以县公司为单位,统计县公司内每年的线路重载率,并与上一年的重载率进行比较,计算改造后线路重载率的变化量:
y3=yc(i-1)-yci
其中,线路的重载率
其中k为县公司该年度的线路重载的总次数,l为县公司的线路总条数。
由此,得项目建设情况下配电网运行指标的改善输出Y=(y1,y2,y3)。
在配电网其他条件不变的情况下,可认为配网运行状态的改善是上述项目建设的结果。
将前述项目建设情况和对应的指标改善形成样本(X,Y)。一般的,为保证所得方法的准确性,所用到建设项目的信息及指标改善的信息不少于3年的数据。
按下式计算项目建设指标与运行状态指标改善之间的相关系数rij:
式中,x
i为第i个项目建设指标,y
j为第j个运行状态指标,
为项目建设指标平均值,
为运行状态指标平均值;
S2、对相关系数进行判断,选取其中相关系数大的项目建设指标作为该运行状态指标的待筛变量;如0.5≤|rij|,则项目建设指标xi为运行状态指标yj的待筛变量;
S3、采用逐步回归选元法对建设成效评价分析模型的变量进行选择;
(a).确定显著性检验最大F值及其对应的变量;
利用配网运行状态指标改善量yj,(j=1,2,3)与建设项目xi,(i=1,2,…m)(m为步骤(2)筛选出的待筛变量的个数)分别进行回归分析,建立一元回归模型;
yj=β0+βixi,其中β0、βi为回归系数
分别计算每一个变量x
i相应的回归系数的F检验统计值
若最大的F值
在给定的显著性水平α=0.05下满足
则该建设项目指标x
k,k∈(1,2,…m)首先被选中;
(b)建立因变量y
j与自变量子集{x
k,x
1},……{x
k,x
m}之间的二元回归模型y
j=β
0+β
kx
k+β
ix
i,计算变量的回归系数F检验的统计量值,选其中最大者
同样,若偏F统计量
则建设项目指标x
l被选中;
(c)因变量yj与自变量子集{xk,xl,xi}的回归重复步骤(b);xk,xl为(a)、(b)中筛选出的项目建设指标,xi为余下的项目建设指标;
依此方法重复进行,每次从未引入的自变量中选取一个,直到经检验没有变量引入为止。
S4、根据S3中选元结果,根据统计所得配网建设项目样本X及配网状态改善指标样本Y,利用最小二乘法对X和Y的回归参数进行估计
得到各变量的回归系数β
0,β
1,β
2,…,β
n,建立配网运行指标改善与所选项目建设指标之间的回归模型:
yi=β0+β1xk+β2xl…+βnxn
式中k,l,n∈i,xk,xl,xn为从xi中筛选出来的项目建设指标;
至此,可得到一个由历史记录信息确定的成效评价模型,其各指标的关联关系及权重都由历史记录信息所确定。该模型可对县公司的总体项目建设情况进行评价,也可对其中某一具体的项目建设情况进行评价。
S5、利用该回归模型进行项目建设成效评价时,将项目的具体指标按前述变量的方式组织成一个输入向量X',输入该回归模型,该模型可输出线路3个指标变化量的评价值Y';以该评价值为基准,将项目建设后实际线路指标的变化量Yi与评价值进行比较:
da<-0.5,线路的跳闸率建设成效评价为差;
-0.5≤da≤0,线路的跳闸率建设成效评价为较差;
0<da≤0.5,线路的跳闸率建设成效评价为良好;
0.5<da,线路的跳闸率建设成效评价为优秀;
db<-0.5,线路的过载率建设成效评价为差;
-0.5≤db≤0,线路的过载率建设成效评价为较差;
0<db≤0.5,线路的过载率建设成效评价为良好;
0.5<db,线路的过载率建设成效评价为优秀;
dc<-0.5,线路的重载率建设成效评价为差;
-0.5≤dc≤0,线路的重载率建设成效评价为较差;
0<dc≤0.5,线路的重载率建设成效评价为良好;
0.5<dc,线路的重载率建设成效评价为优秀。
实施例:
为了使本发明实现的技术手段、创作特征、达成目的与功效易于明白清晰,下面结合具体实施例,进一步阐述本发明。
(1)收集某县供电公司2013-2018年的项目建设情况及2013-2019年的线路运行情况。
(2)统计汇总该县公司2013、2014、2015、2016、2017、2018五年的项目建设情况X=(x1,……,x13)。得到项目建设情况记录:
(3)统计该县公司2014、2015、2016、2017、2018、2019六年的线路跳闸率、过载率和重载率,并分别计算其跳闸率的变化量Y=(yda,ydb,ydc)得到该公司线路指标改善情况记录。
跳闸率改变量y1 |
过载率改变量y2 |
重载率变化量y3 |
-0.89957 |
-0.21378 |
0.93579 |
-0.86844 |
0.29496 |
-0.976835 |
-0.93521 |
-0.25113 |
2.33308 |
-3.11745 |
0 |
0.51696 |
0.226089 |
0.013158 |
-1.333758 |
-0.60721 |
-0.01316 |
0.33674 |
(4)计算配网运行指标改变量与项目建设量之间的相关系数:
|
x1 |
x2 |
x3 |
x4 |
x5 |
x6 |
x7 |
x8 |
x9 |
x10 |
x11 |
x12 |
x13 |
y1 |
-0.8014 |
-0.7623 |
-0.1703 |
-0.2637 |
-0.8603 |
-0.3222 |
-0.9735 |
0.0780 |
0.0589 |
0.0475 |
0.0446 |
0.0440 |
-0.3231 |
y2 |
0.0785 |
0.1335 |
-0.2292 |
0.3611 |
-0.1832 |
0.2620 |
0.0140 |
-0.6466 |
-0.5075 |
-0.5587 |
-0.5651 |
-0.5591 |
0.1185 |
y3 |
0.2348 |
0.0723 |
0.2250 |
-0.5166 |
0.3308 |
-0.4757 |
0.2057 |
0.5094 |
0.2818 |
0.7472 |
0.7520 |
0.7474 |
-0.0777 |
针对因变量y1,筛选出x1,x2,x5,x7与y1的相关性比较高;针对因变量y2,筛选出x8,x9,x10,x11,x12与y2的相关性比较高;针对y3,筛选出x4,x8,x10,x11,x12与y3的相关性比较高。
(5)在相关分析后选择x1(新建项目数)、x2(改造项目数)、x5(中压线路项目数)、x7(380V项目数)分别与y1(跳闸率变化量)进行一元回归分析,其计算所得结果F分别为7.183、5.55、11.39、72.38,此时查表可知F0.05(1,4)=7.71,最大的F值为x7的72.38,大于临界值,则我们首先选择x7进多元回归模型。
在已经选择了x7的基础上,再分别加入x1、x2、x5后对y做二元线性回归,计算它们的F值,(x7,x1)的F值为:37.04,(x7,x2)的F值为:27.37,(x7,x5)的F值为:27.69;此时临界值F0.05(2,3)=9.55。因为最大的F值为37.04>9.55,所以我们选择对应的(x7,x1)加入模型。
重复上述步骤,在选择了(x7,x1)的基础上,再加入x2、x5,建立三元回归方程,(x7,x1,x2)对应的F值53.77大于(x7,x1,x5)对应的F值22.09,同时也大于此时的临界值F0.05(3,2)=19.16,所以我们继续在模型中加入x2。
最后,我们再检验一下将x5加入模型后,即变量为(x7,x1,x2,x5)的F统计量效果如何,建模后可得,F值为24.7,然而此时的临界值F0.05(4,1)=225,F值小于临界值,所以在逐步回归最优模型里,我们不需要把x5加入。
可得到指标改善量y1和建设项目x7,x1,x2之间的回归关系:
y1=2.179-0.00153x1+0.00137x2-0.00551x7
y2=0.1272-6.234×10-6x8-7.141×10-6x12
y3=-0.1224+3.357×10-5x11
(6)根据所得的回归模型对该县公司某年的建设成效进行评价,该年该县公司建设项目的情况为:
将相关项目信息代入上述回归模型,计算可得各指标改善量的期望值:
y'1=2.179-0.00153×736+0.00137×98-0.00551×340=-0.68622
y'2=0.1272-6.234×10-6×8400-7.141×10-6×12.052=0.074749
y3=-0.1224+3.357×10-5×3.892=-0.12227
该公司下一年实际的运行指标改善情况为:
Y=[-0.01448-0.01852-0.01852]
分别计算该公司该年项目建设跳闸率、过载率和重载率的改善评价:
根据以上结果,依据前述评价标准,可得:
该县公司的项目在跳闸率、过载率及重载率改善3个方面都属于“差”的等级。