CN114330485A - 基于pls-svm-ga算法的电网投资能力预测方法 - Google Patents

基于pls-svm-ga算法的电网投资能力预测方法 Download PDF

Info

Publication number
CN114330485A
CN114330485A CN202111358222.7A CN202111358222A CN114330485A CN 114330485 A CN114330485 A CN 114330485A CN 202111358222 A CN202111358222 A CN 202111358222A CN 114330485 A CN114330485 A CN 114330485A
Authority
CN
China
Prior art keywords
power grid
pls
algorithm
svm
investment capacity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111358222.7A
Other languages
English (en)
Inventor
张晓曼
程序
李红建
耿鹏云
陈太平
安磊
齐霞
张妍
刘宣
路妍
董海鹏
曾凡梅
相静
张萌萌
谢品杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
Economic and Technological Research Institute of State Grid Hebei Electric Power Co Ltd
Original Assignee
State Grid Corp of China SGCC
Economic and Technological Research Institute of State Grid Hebei Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, Economic and Technological Research Institute of State Grid Hebei Electric Power Co Ltd filed Critical State Grid Corp of China SGCC
Priority to CN202111358222.7A priority Critical patent/CN114330485A/zh
Publication of CN114330485A publication Critical patent/CN114330485A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P80/00Climate change mitigation technologies for sector-wide applications
    • Y02P80/10Efficient use of energy, e.g. using compressed air or pressurized fluid as energy carrier

Abstract

本发明公开了一种基于PLS‑SVM‑GA算法的电网投资能力预测方法,包括步骤:S101、确定电网企业投资能力的初始影响因素;S102、根据灰色关联度分析进行变量的初步选择;S103、利用偏最小二乘法中的主成分分析对初始影响因素进行提取;S104、将提取出的成分通过支持向量机模型构建训练样本集;S105、利用遗传算法对支持向量机的参数进行优化;S106、对电网投资能力的拟合效果进行评价;S107、利用优化后的支持向量机对电网投资能力进行预测并输出评价指标。本发明兼顾支持向量机和遗传算法的优点,能够更好地考虑非线性因素影响,使模型具有较好的鲁棒性和预测稳定性,从而大大提高预测结果的准确性。

Description

基于PLS-SVM-GA算法的电网投资能力预测方法
技术领域
本发明涉及一种电网投资能力预测方法,尤其涉及一种基于PLS-SVM-GA算法的电网投资能力预测方法。
背景技术
在改革和规范电网企业运营模式的新电改背景下,对电网企业投资能力的研究越来越迫切。合理、客观地把握企业的投资能力是企业管理策略研究的核心内容之一。并且,随着电力市场化和电网企业体制改革的逐步深化,电网企业的经济效益因素在投资决策中所占的比重日益增大。因此,为满足电网企业对资金项目计划和预算管理的需要,有必要采取科学的方法对电网投资能力进行客观的预测,从而对电网公司的投资能力预测提供一定的决策支持。
大多数学者采用主成分分析法提取影响因素,但是在影响因素选择上,电网投资涉及的影响因素众多,包括经营状况、管理水平、市场贡献、经济环境和政策环境等多方面指标的多层次、多维度的影响,已有文献有的仅从电网企业投资的内部因素或者外部因素进行分析,有的从内外部都分析了投资因素,均不够全面、客观。
在预测方法选取上,应用较为广泛的方法包括计量回归方法以及综合评价方法。计量回归方法主要集中在多元回归以及协整分析,但是传统回归方法的重要缺点是没有考虑影响因素对电网投资规模的非线性影响,并且大多数文献在使用计量模型预测电网投资规模的时候忽略了计量模型的内生性问题。另外,许多学者利用综合评价方法建立电网投资影响因素体系,并在此基础上分析预测电网企业的投资能力。然而,综合评价方法在指标重要程度的判定上有很大的主观性,并且电网企业的投资的因素影响通常是非线性的,从而大大影响了预测的准确性。
发明内容
本发明所要解决的技术问题是提供一种基于PLS-SVM-GA算法的电网投资能力预测方法,能够更好地考虑非线性因素影响,使模型具有较好的鲁棒性和预测稳定性,从而大大提高预测结果的准确性。
本发明为解决上述技术问题而采用的技术方案是提供一种基于PLS-SVM-GA算法的电网投资能力预测方法,包括以下步骤:步骤S101、确定电网企业投资能力的初始影响因素;步骤S102、根据灰色关联度分析进行变量的初步选择;步骤S103、利用偏最小二乘法中的主成分分析对初始影响因素进行提取;步骤S104、将提取出的成分通过支持向量机模型构建训练样本集;步骤S105、利用遗传算法对支持向量机的参数进行优化;步骤S106、对电网投资能力的拟合效果进行评价;步骤S107、利用优化后的支持向量机对电网投资能力进行预测并输出评价指标。
进一步地,所述步骤S101中初始影响因素包括:主营业务成本、资产负债率、净资产收益率、单位资产售电量、运行维护费、线损率、售电量、电力行业景气指数、全年高峰负荷、销售电价、GDP、固定资产投资额、城市化率、第二产业占比、能源消费强度、碳排放强度、经济发展目标和贷款利率。
进一步地,所述步骤S102对步骤S101中的初始影响因素分别进行灰色绝对关联度、灰色相对关联度分析,进而计算灰色综合关联度,并选择灰色综合关联度在0.5以上的影响因素进行下一步分析。
进一步地,所述步骤S102中灰色综合关联度ρ0i的计算公式如下:
ρ0i=θε0i+(1-θ)r0i
其中,θ∈[0,1],取θ=0.5,表示对绝对量之间的关系和变化速率同等重视,r0i为灰色相对关联度,ε0i为灰色绝对关联度。
进一步地,所述步骤S103包括:对数据进行标准化处理,生成标准化矩阵E0和F0
Figure BDA0003358052870000021
表示xij标准化后的数值;
Figure BDA0003358052870000022
表示yi标准化后的数值;xij表示解释变量矩阵X中第j个变量xj的第i个样本点;yi表示因变量y的第i个样本值;通过交叉有效性原则来确定PLS回归中成分的提取个数;依次提取第一个主成分t1、第二成分t2、…和第h成分th,在确定h后停止迭代,其中h小于X的秩。
进一步地,所述PLS回归中成分的提取个数确定过程如下:记yi为原始数据,t1,t2,…,tm是在PLS回归过程中提取的成分,
Figure BDA0003358052870000023
为使用全部样本点并取成分t1,t2,…,th回归建模所得的第i个样本点的拟合值,而
Figure BDA0003358052870000024
是在回归时删去样本点i,再利用成分t1,t2,…,th回归所得yi的拟合值;
Figure BDA0003358052870000025
Figure BDA0003358052870000031
则交叉有效性的定义为:
Figure BDA0003358052870000032
Figure BDA0003358052870000033
时,停止增加新的成分th
进一步地,所述步骤S104包括:将步骤S103提取的主成分t1,t2,…,th作为支持向量机的样本输入,u1=f(t)作为支持向量机的输出;构建训练集样本{(ti,yi),i=1,2,…h};其中ti(ti∈Rd)是第i个训练样本的输入列向量,yi∈R为对应的输出值,建立如下回归函数:
f(t)=wΦ(t)+b
其中Φ(t)为将数据映射到高维特征空间的非线性映射函数;w为特征权向量;b∈R为阈值。
进一步地,所述步骤S105通过控制误差ε的取值对偏最小二乘支持向量回归模型中的参数集采用遗传算法进行近似寻优,将训练样本的均方误差MSE作为遗传算法的适应度函数,通过选择、交叉和变异操作来判断当前是否满足目标精度要求,若满足条件则通过解码输出SVM模型的最优参组合,否则重新用遗传算法进行计算。
进一步地,所述步骤S105包括:步骤1:确定惩罚因子c和核参数σ的大致范围,对c、σ进行二进制编码,生成初始种群;步骤2:构造适应度函数作为遗传算法与SVM的接口,将训练样本的均方误差MSE作为遗传算法的适应度函数,通过判断适应度函数的大小来决定是否终止参数寻优;步骤3:设定种群规模、终止进化代数、交叉概率和变异概率;步骤4:应用遗传算子选择、交叉、变异运算来产生下一代种群,然后转到步骤2来判断适应度值大小。
进一步地,所述步骤S106根据所得的预测模型,输入测试样本进行预测,并对输出数据反归一化处理;根据预测值和实际值的比较,采用评价预测模型的平均绝对误差MAE、平均相对误差MPE、均方根误差RMSE和Theil不等系数对所建预测模型进行评价。
本发明提供的电网投资能力预测方法,可以从行业内外部角度进行分析,并利用GA-PLS-SVM模型对各指标及电网投资能力进行测算。本发明对比现有技术有如下的有益效果:1、本发明通过灰色关联度进行变量的初步选择,综合考虑内部指标以及外部指标共18个影响因素,提高预测结果的准确性。2、在成分提取上,大多数学者采用主成分分析法提取影响因素,本发明利用PLS(Partial least squares regression,偏最小二乘法回归))方法对初始影响因素进行提取,PLS方法是多元线性回归、典型相关分析和主成分分析的集成和发展。它与主成分分析法(PCA)的主要区别是它在特征提取过程中采用了信息综合和筛选技术。它所提取的成分既能很好地概括自变量系统中的信息,又能最好地解释因变量,同时又消除了系统中的噪声干扰。因而,PLS不仅能够完成类似PCA的降维工作,而且有效地解决了自变量间多重相关性情况下的回归建模问题。3、作为预测方法的一种,支持向量机(Support Vector Machines,SVM))可以更好地考虑了因素的非线性影响,本发明把利用PLS方法提取的主成分作为输入变量用于SVM回归建模,使模型具有较好的鲁棒性和预测稳定性。
附图说明
图1为本发明电网投资能力预测流程示意图;
图2为本发明电网投资能力GA和SVM相结合的流程示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的描述。
请参见图1,本发明提供的基于PLS-SVM-GA算法的电网投资能力预测方法,包括:获取电网投资能力影响因素;根据灰色关联度来进行变量的初步选择;根据偏最小二乘法特征提取主成分;将主成分输入支持向量机,构建训练样本集;根据遗传算法优化参数;拟合评价效果;电网投资能力预测。本发明可以从行业内外部角度进行分析,并利用GA-PLS-SVM模型对各指标及电网投资能力进行测算。
为了得到电网投资能力预测值,选择灰色综合关联度在0.5以上的因素进行下一步分析。本发明根据偏最小二乘法特征提取主成分之后,兼顾支持向量机和遗传算法(Genetic Algorithm,GA)两种智能算法的优点,先将提取的主成分输入支持向量机,构建训练样本集,再通过控制误差ε的取值对偏最小二乘支持向量回归模型中的参数集采用遗传算法进行近似寻优,之后采用偏最小二乘支持向量回归对电网投资能力进行预测,从而构建一套GA-SVM的预测模型体系进行回归预测。
本发明建立的GA-SVM预测模型的预测步骤如图2所示:
(1)输入电网投资能力影响因素。
(2)采用灰色综合关联度来进行变量的初步筛选。
(3)根据偏最小二乘法特征提取主成分。
(4)设置SVM模型参数寻优区间以及遗传算法的初始化和参数设置。
(5)利用GA算法对SVM的模型参数进行寻优。将训练样本的均方误差MSE作为GA的适应度函数,通过选择、交叉和变异等遗传操作来判断当前是否满足目标精度要求,若满足条件则通过解码输出SVM模型的最优参数γ和σ2组合,否则重新用遗传算法进行计算。
(6)建立参数优化后的SVM预测模型。根据步骤(3)得到的最佳参数γ和σ2,利用训练样本,训练SVM预测模型,最后根据所得的预测模型,输入测试样本进行预测,并对输出数据反归一化处理。
(7)根据预测值和实际值的比较,采用评价预测模型的性能指标MAE、MPE、RMSE和Theil不等系数对所建预测模型进行评价。
(8)最后利用训练好的GA-SVM进行预测,预测得到未来某一时刻的电网投资能力指标数值,再进行投资能力的相关分析。
下面对本发明的每个步骤一一展开说明。
1、获取电网投资能力影响因素
面对错综复杂的经济和社会环境,不仅需要从行业内部的角度来研究电网企业投资能力,还需要从宏观环境的角度审视经济发展对投资能力的影响,因此,需要分别从行业内部、外部来选取影响电网投资能力的指标,同时基于相关性、全面性、代表以及数据的可得性等原则,构建了如表1所示电网投资能力影响因素指标体系。
表1电网投资能力影响因素
Figure BDA0003358052870000051
2、根据灰色综合关联度来进行变量的筛选
本发明对上文确定的18个指标与电网投资能力分别进行灰色绝对关联度、灰色相对关联度分析,进而计算灰色综合关联度,选择灰色综合关联度在0.5以上的因素进而下一步分析。
灰色绝对关联度、灰色相对关联度和灰色综合关联度基本原理和计算方法如下:
(1)灰色绝对关联度
Xi=(xi(1),xi(2),…,xi(n))(i=1,2,…,m)
记折线
(xi(1)-(xi(1),xi(2)-(xi(1),…,xi(n)-(xi(1))为
Figure BDA0003358052870000061
Figure BDA0003358052870000062
Figure BDA0003358052870000063
则,灰色绝对关联度为
Figure BDA0003358052870000064
灰色绝对关联度ε0i表征了折线X0与Xi的绝对增量间的关系,用两条序列折线间所夹的面积大小来衡量两序列的关联性的大小,折线X0与Xi的绝对增量越相似,ε0i越大,反之就越小。
(2)灰色相对关联度
Xi=(xi(1),xi(2),…,xi(n))(i=1,2,…,m)
则,灰色相关关联度为
Figure BDA0003358052870000065
其中,
Figure BDA0003358052870000071
X'i=Xi/xi(1),i=0,1,2,…,m
灰色相对关联度r0i表征了序列X0与Xi相对于始点的变化速率之间的关系,X0与Xi的变化速率越接近,r0i越大,反之就越小。
(3)灰色综合关联度
灰色综合关联度ρ0i既体现了折线X0与Xi的相似程度,又反映出X0与Xi相对于始点的变化速率的接近程度,是较为全面地表征序列之间是否紧密的一个数量指标。其计算公式如下:
ρ0i=θε0i+(1-θ)r0i
其中,θ∈[0,1]。为表示对绝对量之间的关系和变化速率同等重视,取θ=0.5。
3、根据偏最小二乘法(PLS,Partial Least-Squares Regression)提取主成分
对于上述根据灰色综合关联度筛选出来电网投资能力影响因素,进一步利用PLS回归分析相比于主成分分析,可以有监督地提取主成分,所以可以说PLS回归分析是主成分、典型相关分析及多元线性回归分析的有机结合,其具体步骤如下:
(1)数据标准化处理
其目的在于使样本点的集合重心和原点重合,减少运算误差。
Figure BDA0003358052870000072
其中,xij表示解释变量矩阵X中第j个变量xj的第i个样本点;
Figure BDA0003358052870000073
表示解释变量矩阵X中第j个变量xj的均值;sj表示xj的标准差;yi表示因变量y的第i个样本值;
Figure BDA0003358052870000074
表示y的均值;sy表示y的标准差;
Figure BDA0003358052870000075
表示xij标准化后的数值;
Figure BDA0003358052870000076
表示yi标准化后的数值。
(2)第一成分t1的提取
对于标准化矩阵E0和F0,从E0中提取第一个主成分t1=E0w1,其中w1为E0的第一主轴,即||w1||=1。
则有
Figure BDA0003358052870000081
Figure BDA0003358052870000082
其中,E0i(i=1,2,…,k)表示E0的第i列;r(xj,y)(i=1,2,…,k)表示xj和y的相关系数。求得轴w1后,可得成分t1。接下来,分别求E0和F0对t1的回归方程
E0=t1P1 T+E1,F0=t1r1+F1 (3-4)
其中,
Figure BDA0003358052870000083
为E0对t1的回归系数;
Figure BDA0003358052870000084
为F0对t1的回归系数。并由此可以求得回归方程(4-32)的残差矩阵为:
E1=E0-t1P1 T,F1=F0-t1r1 (3-5)
(3)第二成分t2的提取
以E1取代E0,F1取代F0,重复建模步骤(2),可以求得第一主轴w1和第二成分t2,此时,注意到E1不再是标准化矩阵,故有:
Figure BDA0003358052870000085
t2=E1w2(3-7)
其中,Cov(E1j,y)表示E1j与y的协方差。然后再施行E1、F1对t2的回归,有
Figure BDA0003358052870000086
其中,
Figure BDA0003358052870000087
为E1对t2的回归系数;r2=F1 Tt2/||t2||2为F1对t2的回归系数。
(4)第h成分th的提取
重复上述步骤(2)(3),可以求得第h成分th。PLS回归中成分的提取个数h可以使用交叉有效性来确定,在确定h后停止迭代,其中h小于X的秩。
(5)交叉有效性原则
根据上述PLS回归建模步骤,可以知道,PLS回归方程并不需要选用全部的成分进行回归建模,对此,可以通过考察增加一个新的成分后,能否对模型的预测功能有明显的改进来考虑,即可以通过交叉有效性原则来确定PLS回归中成分的提取个数。
记yi为原始数据,t1,t2,…,tm是在PLS回归过程中提取的成分,
Figure BDA0003358052870000091
为使用全部样本点并取成分t1,t2,…,th回归建模所得的第i个样本点的拟合值,而
Figure BDA0003358052870000092
是在回归时删去样本点i,再利用成分t1,t2,…,th回归所得yi的拟合值。记:
Figure BDA0003358052870000093
Figure BDA0003358052870000094
则,交叉有效性的定义为:
Figure BDA0003358052870000095
所谓交叉有效性原则是指,当
Figure BDA0003358052870000096
时,停止增加新的成分th
4、将主成分输入支持向量机,构建训练样本集
在利用PLS法从自变量X和因变量Y中分别提取主成分t1,t2,…,th和u1后(它们包含自变量与因变量的绝大部分信息),将以上提取的主成分t1,t2,…,th作为支持向量机的样本输入,u1=f(t)作为支持向量机的输出。携带自变量X绝大部分信息的前h个主成分被提取出来,构成了支持向量机的输入空间,从而实现了输入空间由Rn→Rh的变换,达到了特征提取和变量降维的目的,从而提高了模型运行的效率和预测的精度。
将上面提取的主成分构建训练集样本{(ti,yi),i=1,2,…h}(其中ti(ti∈Rd)是第i个训练样本的输入列向量,yi∈R为对应的输出值),建立如下回归函数:
f(t)=wΦ(t)+b (4-1)
其中Φ(t)为将数据映射到高维特征空间的非线性映射函数;w为特征权向量;b∈R为阈值。
定义ε的线性不敏感损失函数:
Figure BDA0003358052870000097
其中,f(t)为回归拟合函数的预测值;y对应的实际值,即表示若f(t)与y之间的差别小于等于ε,则损失等于0。
引入松弛变量ξi
Figure BDA0003358052870000101
建立如下约束条件:
Figure BDA0003358052870000102
s.t.yi-wΦ(ti)-b≤ε+ξi
Figure BDA0003358052870000103
Figure BDA0003358052870000104
i=1,2,…,l
其中,C为惩罚因子。
引入Largrange函数,并将其转化为对偶形式:
Figure BDA0003358052870000105
Figure BDA0003358052870000106
0≤αi≤C
Figure BDA0003358052870000107
其中,C为惩罚因子,K(ti,tj)=Φ(ti)Φ(tj)为核函数。
计算此规划问题求得最优解α和α*
利用KKT(Karush-Kuhn-Tucker)条件,即
Figure BDA0003358052870000108
或者
Figure BDA0003358052870000109
计算得到偏置量b*
得到SVM回归预测的拟合函数为:
Figure BDA00033580528700001010
5、根据遗传算法优化参数
遗传算法在非线性优化问题中表现良好,它对模型的连续性、是否线性、可微性没有严格的要求,也不受待优化参数个数的限制,通过自适应学习能够很快获得最优解。目前GA算法已经在神经网络、结构设计、机器学习、函数优化以及图像处理领域有广泛的应用。
遗传算法不同于搜索算法、启发式、枚举等传统算法,它通常具有以下的特点:
a.将问题参数间接的抽象为参数编码集。
b.可以处理复杂的非结构化问题,具有智能性、灵活的组织性和适应性。不需要事先描述整个问题的特点。
c.具有较强的并行化,思想简单,实现步骤规范,易于将实际问题具体化。
综上分析遗传算法具有很强的全局搜索能力,用遗传算法寻找有效的最小二乘支持向量机的参数是一种可行的方式。
由SVM的算法过程知道,不敏感损失函数中的ε、惩罚因子C和径向基函数中的σ2(也称径向核)这3个参数取值不同将得到不同的支持向量机模型,因此,本发明将通过控制误差ε的取值对参数集(C,σ2)采用遗传算法进行近似寻优,从而构建GA-PLS-SVM模型进行回归预测。
(1)建立位串空间
位串空间:SL={a1,a2,...ak},ak=(ak1,ak2,...,akL),akl∈{0,1}将位串个体从位串空间转化成问题参数空间的译码函数Ω:{0,1}L→[u,v]的公式定义如下:
Figure BDA0003358052870000111
可以利用二进制对p、q编码。本发明算法采用5位二进制码对p、q进行编码,编码长度L=10,设前5位表示p,后5位表示q,由此构成候选解空间S,其大小为2L
(2)自适应交叉算子
本发明引进一种新的自适应遗传算子,建立交叉算子和适应度函数f(x)的关系,从而使交叉概率Pc随着适应度的波动而灵活改变,使Pc满足时变性,提高算法的灵活度。交叉算子和适应度函数f(x)的关系如下:
Figure BDA0003358052870000121
(3)自适应变异算子
本发明采用基本位变异对个体编码串以变异概率Pm随机指定某一位或某几位基因作变异运算。建立Pm与适应度函数f(x)的关系如下:
Figure BDA0003358052870000122
(4)GA优化PLS-SVM模型参数
主要的实现步骤如下:
步骤1:确定惩罚因子c和核参数σ的大致范围,对c、σ进行二进制编码,生成初始种群。
步骤2:构造适应度函数,这是遗传算法与SVM的接口,通过判断适应度函数的大小来决定是否终止参数寻优。
步骤3:对本算法的实际问题设定种群规模(如M=20)、终止进化代数(T=60)、交叉概率(Pc=0.85)、变异概率(Pm=0.001)。遗传算子中的选择运算是根据每个个体的适应度大小来确定的,本算法试验中适应度值小的个体将有大的概率被选择到下一代。
步骤4:应用遗传算子选择、交叉、变异运算来产生下一代种群,然后转到步骤2来判断适应度值大小。
6、预测效果评价
利用以下指标评价模型的预测能力:
平均绝对误差:
Figure BDA0003358052870000123
平均相对误差:
Figure BDA0003358052870000124
均方根误差:
Figure BDA0003358052870000125
Theil不等系数:
Figure BDA0003358052870000131
其中,yk为实际值,
Figure BDA0003358052870000132
则为预测值,N为时间序列的长度。其中,MAE和RMSE这两个统计量受因变量量纲影响,可以用来比较不同模型的预测效果,其值越小,表明相应模型的预测效果越好。其余两个统计量与因变量量纲无关的相对指标,MPE反映了相对误差的大小,其值亦是越小越好;Theil不等系数U通常介于0~1之间,其中当其值为0时,表示拟合程度达至100%。
虽然本发明已以较佳实施例揭示如上,然其并非用以限定本发明,任何本领域技术人员,在不脱离本发明的精神和范围内,当可作些许的修改和完善,因此本发明的保护范围当以权利要求书所界定的为准。

Claims (10)

1.一种基于PLS-SVM-GA算法的电网投资能力预测方法,其特征在于,包括以下步骤:
步骤S101、确定电网企业投资能力的初始影响因素;
步骤S102、根据灰色关联度分析进行变量的初步选择;
步骤S103、利用偏最小二乘法中的主成分分析对初始影响因素进行提取;
步骤S104、将提取出的成分通过支持向量机模型构建训练样本集;
步骤S105、利用遗传算法对支持向量机的参数进行优化;
步骤S106、对电网投资能力的拟合效果进行评价;
步骤S107、利用优化后的支持向量机对电网投资能力进行预测并输出评价指标。
2.如权利要求1所述的基于PLS-SVM-GA算法的电网投资能力预测方法,其特征在于,所述步骤S101中初始影响因素包括:主营业务成本、资产负债率、净资产收益率、单位资产售电量、运行维护费、线损率、售电量、电力行业景气指数、全年高峰负荷、销售电价、GDP、固定资产投资额、城市化率、第二产业占比、能源消费强度、碳排放强度、经济发展目标和贷款利率。
3.如权利要求1所述的基于PLS-SVM-GA算法的电网投资能力预测方法,其特征在于,所述步骤S102对步骤S101中的初始影响因素分别进行灰色绝对关联度、灰色相对关联度分析,进而计算灰色综合关联度,并选择灰色综合关联度在0.5以上的影响因素进行下一步分析。
4.如权利要求3所述的基于PLS-SVM-GA算法的电网投资能力预测方法,其特征在于,所述步骤S102中灰色综合关联度ρ0i的计算公式如下:
ρ0i=θε0i+(1-θ)r0i
其中,θ∈[0,1],取θ=0.5,表示对绝对量之间的关系和变化速率同等重视,r0i为灰色相对关联度,ε0i为灰色绝对关联度。
5.如权利要求1所述的基于PLS-SVM-GA算法的电网投资能力预测方法,其特征在于,所述步骤S103包括:
对数据进行标准化处理,生成标准化矩阵E0和F0
Figure FDA0003358052860000011
表示xij标准化后的数值;
Figure FDA0003358052860000012
表示yi标准化后的数值;xij表示解释变量矩阵X中第j个变量xj的第i个样本点;yi表示因变量y的第i个样本值;
通过交叉有效性原则来确定PLS回归中成分的提取个数;
依次提取第一个主成分t1、第二成分t2、…和第h成分th,在确定h后停止迭代,其中h小于X的秩。
6.如权利要求5所述的基于PLS-SVM-GA算法的电网投资能力预测方法,其特征在于,所述PLS回归中成分的提取个数确定过程如下:
记yi为原始数据,t1,t2,…,tm是在PLS回归过程中提取的成分,
Figure FDA0003358052860000021
为使用全部样本点并取成分t1,t2,…,th回归建模所得的第i个样本点的拟合值,而
Figure FDA0003358052860000022
是在回归时删去样本点i,再利用成分t1,t2,…,th回归所得yi的拟合值;
Figure FDA0003358052860000023
Figure FDA0003358052860000024
则交叉有效性的定义为:
Figure FDA0003358052860000025
Figure FDA0003358052860000026
时,停止增加新的成分th
7.如权利要求1所述的基于PLS-SVM-GA算法的电网投资能力预测方法,其特征在于,所述步骤S104包括:
将步骤S103提取的主成分t1,t2,…,th作为支持向量机的样本输入,u1=f(t)作为支持向量机的输出;
构建训练集样本{(ti,yi),i=1,2,…h};其中ti(ti∈Rd)是第i个训练样本的输入列向量,yi∈R为对应的输出值,建立如下回归函数:
f(t)=wΦ(t)+b
其中Φ(t)为将数据映射到高维特征空间的非线性映射函数;w为特征权向量;b∈R为阈值。
8.如权利要求1所述的基于PLS-SVM-GA算法的电网投资能力预测方法,其特征在于,所述步骤S105通过控制误差ε的取值对偏最小二乘支持向量回归模型中的参数集采用遗传算法进行近似寻优,将训练样本的均方误差MSE作为遗传算法的适应度函数,通过选择、交叉和变异操作来判断当前是否满足目标精度要求,若满足条件则通过解码输出SVM模型的最优参组合,否则重新用遗传算法进行计算。
9.如权利要求1所述的基于PLS-SVM-GA算法的电网投资能力预测方法,其特征在于,所述步骤S105包括:
步骤1:确定惩罚因子c和核参数σ的大致范围,对c、σ进行二进制编码,生成初始种群;
步骤2:构造适应度函数作为遗传算法与SVM的接口,将训练样本的均方误差MSE作为遗传算法的适应度函数,通过判断适应度函数的大小来决定是否终止参数寻优;
步骤3:设定种群规模、终止进化代数、交叉概率和变异概率;
步骤4:应用遗传算子选择、交叉、变异运算来产生下一代种群,然后转到步骤2来判断适应度值大小。
10.如权利要求1所述的基于PLS-SVM-GA算法的电网投资能力预测方法,其特征在于,所述步骤S106根据所得的预测模型,输入测试样本进行预测,并对输出数据反归一化处理;根据预测值和实际值的比较,采用评价预测模型的平均绝对误差MAE、平均相对误差MPE、均方根误差RMSE和Theil不等系数对所建预测模型进行评价。
CN202111358222.7A 2021-11-16 2021-11-16 基于pls-svm-ga算法的电网投资能力预测方法 Pending CN114330485A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111358222.7A CN114330485A (zh) 2021-11-16 2021-11-16 基于pls-svm-ga算法的电网投资能力预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111358222.7A CN114330485A (zh) 2021-11-16 2021-11-16 基于pls-svm-ga算法的电网投资能力预测方法

Publications (1)

Publication Number Publication Date
CN114330485A true CN114330485A (zh) 2022-04-12

Family

ID=81045179

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111358222.7A Pending CN114330485A (zh) 2021-11-16 2021-11-16 基于pls-svm-ga算法的电网投资能力预测方法

Country Status (1)

Country Link
CN (1) CN114330485A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116596095A (zh) * 2023-07-17 2023-08-15 华能山东发电有限公司众泰电厂 基于机器学习的碳排放量预测模型的训练方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116596095A (zh) * 2023-07-17 2023-08-15 华能山东发电有限公司众泰电厂 基于机器学习的碳排放量预测模型的训练方法及装置
CN116596095B (zh) * 2023-07-17 2023-11-07 华能山东泰丰新能源有限公司 基于机器学习的碳排放量预测模型的训练方法及装置

Similar Documents

Publication Publication Date Title
CN109461025B (zh) 一种基于机器学习的电能替代潜在客户预测方法
CN112990556A (zh) 一种基于Prophet-LSTM模型的用户用电能耗预测方法
Shen et al. Weighted nonlinear dynamic system for deep extraction of nonlinear dynamic latent variables and industrial application
CN105740984A (zh) 一种基于性能预测的产品概念性能评价方法
Eskandarnia et al. An embedded deep-clustering-based load profiling framework
CN113506121A (zh) 价格影响因素的分析方法及装置
CN114819395A (zh) 一种基于长短期记忆神经网络和支持向量回归组合模型的行业中长期负荷预测方法
Wang et al. Causal carbon price interval prediction using lower upper bound estimation combined with asymmetric multi-objective evolutionary algorithm and long short-term memory
CN114330485A (zh) 基于pls-svm-ga算法的电网投资能力预测方法
Zhang et al. A new medium and long-term power load forecasting method considering policy factors
Wu et al. A forecasting model based support vector machine and particle swarm optimization
CN111090679B (zh) 基于时序影响和图嵌入的时序数据表示学习方法
CN110533249B (zh) 一种基于集成长短期记忆网络的冶金企业能耗预测方法
CN116561569A (zh) 一种基于EO特征选择结合AdaBoost算法的工业电力负荷辨识方法
CN116703644A (zh) 一种基于Attention-RNN的短期电力负荷预测方法
CN116108963A (zh) 一种基于集成学习模块的电力碳排放预测方法及设备
CN116029434A (zh) 一种原料油及重馏分油中氢含量的预测方法及其系统
CN112348275A (zh) 一种基于在线增量学习的区域生态环境变化预测方法
CN114066004A (zh) 一种基于电力大数据的gdp现时预测方法
Li et al. A comparison between linear regression, lasso regression, decision tree, XGBoost, and RNN for asset price strategies
CN111160715A (zh) 基于bp神经网络新旧动能转换绩效评价方法和装置
Yang et al. Asset price prediction via machine-learning method: a review
Amalnik et al. Cash flow prediction using artificial neural network and GA-EDA optimization
CN116780524B (zh) 一种基于lstm深度学习的工业企业短期负荷预测方法
Zhang Application of ARIMA and LSTM Model to the Forecast of CSI 300 Close Price

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination