CN115759380A - 基于SHAP-XGBoost算法的电力系统惯量短期预测方法 - Google Patents

基于SHAP-XGBoost算法的电力系统惯量短期预测方法 Download PDF

Info

Publication number
CN115759380A
CN115759380A CN202211412496.4A CN202211412496A CN115759380A CN 115759380 A CN115759380 A CN 115759380A CN 202211412496 A CN202211412496 A CN 202211412496A CN 115759380 A CN115759380 A CN 115759380A
Authority
CN
China
Prior art keywords
inertia
model
prediction
short
term
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211412496.4A
Other languages
English (en)
Inventor
张磊
陶千惠
叶婧
黄悦华
李振华
薛田良
杨楠
程江州
肖繁
徐雄军
潘鹏程
徐恒山
陈庆
卢天林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Three Gorges University CTGU
Original Assignee
China Three Gorges University CTGU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Three Gorges University CTGU filed Critical China Three Gorges University CTGU
Priority to CN202211412496.4A priority Critical patent/CN115759380A/zh
Publication of CN115759380A publication Critical patent/CN115759380A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

基于SHAP‑XGBoost算法的电力系统惯量短期预测方法,确定电力系统短期惯量预测输入特征,构建基于XGBoost的短期惯量预测学习模型;基于建立的短期惯量预测学习模型,提出基于SHAP‑XGBoost的解释性学习算法,实现所述短期惯量预测学习模型的深度学习;构建电力系统短期惯量预测框架,实现预测模型的在线部署与应用。本发明充分利用XGBoost机器学习模型的解释性机制,在保证了电力系统惯量短期预测较高准确率的同时还可以掌握模型内部的特征相关性,有利于电网调度部门制定相应的控制措施。

Description

基于SHAP-XGBoost算法的电力系统惯量短期预测方法
技术领域
本发明涉及电力系统运行分析领域,具体涉及一种基于SHAP-XGBoost算法的电力系统惯量短期预测方法。
背景技术
随着传统化石能源枯竭和环境问题突出,新能源迅速发展,大量新能源以电力电子装备并网引起电力系统惯量降低,造成频率问题突出,威胁电力系统的安全稳定运行。电力系统惯量作为电力系统中一个重要的参数,由同步发电机和水轮机的转动质量决定,当发电和需求不平衡时,惯量会影响即时频率响应。因此,快速、准确地预测电力系统短期惯量,提前掌握系统惯量水平以预警系统何时面临惯量薄弱的风险,不仅是高渗透新能源电力系统中保证系统运行与经济调度的关键变量,还是保证系统进行优化运行决策的重要前提。
目前,电力系统惯量短期预测方法的研究主要有统计学方法和机器学习方法。统计学方法主要有回归分析法、差分自回归移动平均模型,最小方差有限脉冲响应滤波器,贝叶斯模型等。基于统计学方法的预测需假定系统惯量仅由同步发电机产生。然而,该方法缺少对新型电力系统中其他复杂非线性虚拟惯量的表征。机器学习方法则避免了对电网复杂特性的分析和高维非线性公式推导,相对于线性模型在进行预测时往往有更好的精度,但机器学习模型的预测过程类似于“黑箱”,模型缺乏可解释性,其结果难以为电网调度部门的具体决策提供相关解释性信息,是目前机器学习方法在惯量短期预测应用中的主要问题。
在面对系统惯量短期预测的大规模数据问题上,XGBoost模型的复杂度与预测精度间难以平衡。近年来的研究将解释与机器学习模型分离,其可解释性方法包括全局代理模型、局部代理模型等。这类方法在保证较高的准确率的同时可以掌握模型内部的特征相关性,已应用于生物医疗预测、金融预测、计算机视觉等领域,但在电力系统惯量预测研究中鲜有应用。因此,为保证系统经济性与安全性,亟需提出一种可解释性XGBoost的电力系统惯量短期预测方法,从而实现预测精度与可解释性之间的平衡,促进系统安全运行与经济调度。
发明内容
为解决上述现有技术的缺陷和不足,本发明提供一种基于SHAP-XGBoost算法的电力系统惯量短期预测方法,其目的是充分利用机器学习模型的可解释性方法,以提升电力系统惯量短期预测的准确性。该方法具备成本低、简单高效、数据完整准确、无需实验以及复杂的计算过程的优点。
本发明采取的技术方案为:
基于SHAP-XGBoost算法的电力系统惯量短期预测方法,包括以下步骤:
步骤1:考虑电力系统频率时空变化机理,确定电力系统短期惯量预测输入特征,构建基于XGBoost的短期惯量预测学习模型;
步骤2:基于步骤1建立的短期惯量预测学习模型,考虑传统机器学习模型不可解释性的影响,提出基于SHAP-XGBoost的解释性学习算法,实现所述短期惯量预测学习模型的深度学习;
步骤3:构建电力系统短期惯量预测框架,实现预测模型的电力系统惯量预测。
所述步骤1中,首先基于广域测量管理系统WAMS采集历史数据,提取影响系统惯量预测的相关物理量作为输入特征。由于在特征数据采集过程中难以避免数据存在缺失值、异常值等噪声数据。故在使用之前需要进行数据预处理,对数据集进行数据清洗和填充,对于缺失值直接通过数值运算进行填充,异常值用均值代替异常样本,在保留特征的同时还能够保证数据的无偏估计,经过一系列的处理最终得到能够供预测学习模型训练的数据集,
其中:样本数据集描述如式(1)~式(2)所示,输入样本集每一行与输出样本集相对应:
Figure BDA0003939251260000021
Y=[y1,y2,…,yn]T (2);
式中,X是输入样本数据集;Y是输出样本数据集;上标m是输入特征的维度;下标n是输入样本的数目。其中,X的每一行表示一个输入样本。
在选取输入特征的时候,一方面要能很好的反映系统惯量特性,另一方面计算要保证时间上的快速性。故为了保证电力系统惯量预测的准确性,依据系统有功-频率动态变化中电力系统惯量响应方程,如式(3)所示,选取合适的特征;
Figure BDA0003939251260000022
式(3)中,Hsys和Dsys分别为系统惯量、系统阻尼,△P是系统功率变化率,△fCOI是惯量中心频率偏差;由式(3)知,影响系统惯性的因素有频率和各类能源的有功功率。因此,在选取输入特征的时候考虑系统频率和负荷需求。
基于XGBoost的短期惯量预测学习模型:
XGBoost是一种Boosting的集成学习模型,采用CART(Classification andRegression Tree)作为基学习器,具体如下所示:
Figure BDA0003939251260000031
式中:
Figure BDA0003939251260000032
为模型预测值;xi为第i个样本;fk为空间中的一个独立函数;F为所有CART组成的函数空间。XGBoost在损失函数中加入正则化项防止过拟合,其目标函数如下所示:
Figure BDA0003939251260000033
Figure BDA0003939251260000034
式(5)中:第一项表示预测值和实际值之间的误差,第二项为正则化项。
式(6)中:T是叶子节点数;ωj是叶子节点权重;γ和λ是预先给定的超参数,分别用于控制叶子节点的个数和分数。由于目标函数的优化参数是树模型,故将其迭代分解成树学习过程。在保持原模型不变的前提下,采用增量训练的方式以最小化目标函数,每次迭代后更新目标函数为:
Figure BDA0003939251260000035
二阶泰勒展开将式(7)转换为关于自变量ωj的一元二次函数的形式。
Figure BDA0003939251260000036
Ij是节点j的样本集,得到最优解
Figure BDA0003939251260000037
和对应的最优目标函数值为:
Figure BDA0003939251260000038
Figure BDA0003939251260000039
在训练过程中,生成树模型的分裂准则采用贪心算法,选取使得节点分裂前后目标函数的增益最大的特征节点为分裂点,表示如下:
Figure BDA0003939251260000041
式中,GL,HL,GR,HR分别为分裂时当前节点左右子树的一阶二阶导数和。
所述步骤2中,考虑传统机器学习模型不可解释性的影响,具体为:机器学习模型分为白盒子模型和黑盒子模型,简单的线性模型,单棵决策树属于白盒子模型,其将输入映射为输出的方式,可以完全被理解,而许多决策树组成的随机森林,提升树,以及深度神经网络都属于黑盒子模型,这些模型输入到输出的映射非常复杂,想完整了解机器的内部运作方式几乎不可能。
基于SHAP构建可解释性XGBoost模型,通过计算Shapley值来全局解释各特征的重要程度,就可以从多个维度将黑盒结构进行解构分析特征对单个输出结果的影响。
所述步骤2中,利用SHAP嵌套XGBoost方法筛选变量,SHAP是基于Shapley value的计算,用于衡量特征如何影响因变量,从一个初始朴素模型开始,基于样本集中观测值得误差,建立新模型进行拟合,并以加法形式添加至现有模型,反复迭代此过程形成集成模型。
步骤2包括如下步骤:
S2.1:通过sigmoid函数将模型预测值与SHAP解释模型g(x′)相关联,构建可解释性XGBoost模型,如式(11)所示:
Figure BDA0003939251260000042
式(11)中,e-g(x′)表示一个以自然常数e为底的指数函数。
S2.2:对于集成树模型来说,当做分类任务时,模型输出的是一个概率值。SHAP可计算每一个特征的Shapley值,以此来衡量出每个特征对于最终预测的贡献度。假设g代表解释模型,SHAP将解释模型描述为样本预测的基准值φ0与所有输入特征Shapley值之和的形式如式(12)所示:
Figure BDA0003939251260000043
式(12)中:φj是样本第j个特征的Shapley值;m是样本的特征数目;x′j∈{0,1}m表示特征xj是否存在。
Figure BDA0003939251260000044
式(13)中:z是样本的全体特征向量的集合,
Figure BDA0003939251260000051
x1,x2,…,xm代表的就是m个不同的特征向量。
z\j是z中不含特征xj的特征子集;Fx(z)是可解释性XGBoost模型对于样本x输入特征为z时得到的预测输出,Fx(z)与Fx(z\i)之差为特征xj对预测结果的贡献。
每个特征的SHAP值表示以该特征为条件时预期模型预测的变化。对于每个功能,SHAP值说明了该特征对于总体预测结果的贡献,以说明实例的平均模型预测与实际预测之间的差异。
基于以上步骤,拆解并定量映射各个特征对模型预测结果的贡献,并完成电力系统短期惯量预测学习模型的深度学习。
所述步骤3包括如下步骤:
S3.1:构建电力系统短期惯量预测框架,将经由预处理过后的数据集划分为训练集与测试集,通过读取数据、参数设置等过程训练可解释性XGBoost模型。
电力系统短期惯量预测框架具体如图2所示,其具体内容为依据该框架对系统惯量短期预测,可以将其过程大致分为数据预处理、模型训练、结果输出三个部分,具体为:基于WAMS采集的历史数据,提取影响系统惯量预测的相关物理量作为输入特征,经预处理得到可供模型训练的数据集。然后将数据集划分为训练集与测试集,训练集用于训练可解释性XGBoost模型,测试集用于模型评价及结果验证。最后对输出系统惯量值和特征相关性进行分析,并可视化展示特征对电力系统惯量短期预测模型的全局和局部影响。
S3.2:利用TreeSHAP计算出的所有样本中对应该变量的SHAP值,将其平均值作为该特征变量的重要性值,从而得到全局解释;
S3.3:对系统惯量进行短期预测,对输出的系统惯量值及特征相关性进行分析,并可视化展示特征对于电力系统惯量短期预测模型的全局和局部影响。
基于SHAP归因方法构建的可解释性XGBoost模型满足局部精确性、允许缺失和一致性的特性。其中,局部精确性解释模型对单个样本的预测结果。缺失性表示样本的特征对模型的预测没有贡献,XGBoost不对变量进行插补处理。当模型结构发生变化时,输入特征的边际贡献与输入特征的Shapley值变化一致,Shapley值自身的可加性、虚拟性和对称性的性质得到SHAP的一致性。
从全局和局部两个维度对电力系统惯量短期预测模型进行解释分析,表示为:
(1)全局可解释性:解释模型如何基于整个特征空间和模型结构、参数等做出决策:据式(13)得到样本集中全部特征的Shapley值,从样本全体的角度考虑,对每项特征的Shapley值求平均绝对值,该值大小反映特征对模型输出结果的全局贡献程度;此外,根据每个特征的Shapley值与特征自身数值的分布关系,挖掘该特征数值大小与模型输出的正负相关性;
(2)局部可解释性:不考虑模型的复杂情况只关注于单个样本:将单个样本的输出可以表示为式(12)各项特征的Shapley值之和的形式,解释特征如何影响单个样本的结果输出,进而确定该样本的局部主导特征;结合全局分析的特征正负相关性,明确特征对样本的输出结果的偏高或偏低影响。
S3.4:对于经由电力系统惯量短期预测模型预测出的结果,使用平均绝对误差(Mean Absolute Error,MAE)、均方误差(Mean Squared Error,MSE)、平均绝对百分比误差(Mean Absolute Percentage Error,MAPE)和决定系数(Coefficient of Determination,R2)几种方法进行评价,如式(14)~式(17)所示:
Figure BDA0003939251260000061
Figure BDA0003939251260000062
Figure BDA0003939251260000063
Figure BDA0003939251260000064
式中,i为样本编号;n为样本数量;
Figure BDA0003939251260000065
为预测得到的系统惯量值;yi为系统惯量的实际值。
其中,MAE、MSE、MAPE越小,表示模型拟合效果越好,R2越大表示模型拟合效果越好。
本发明一种基于SHAP-XGBoost算法的电力系统惯量短期预测方法,技术效果如下:
1)本发明构建的可解释性XGBoost模型以一致的方式量化特征对系统惯量短期预测的影响。全局可解释性挖掘了影响系统惯量的关键物理量,局部可解释性对每次预测结果进行因果判断,提高了预测结果的可信度。
2)本发明利用SHAP值与目标特征值之间的正负性关系,结合领域知识解释特征,该方法能够拆解并定量映射出各个样本中特征对模型预测结果的贡献程度。不仅保证了系统惯量短期预测精度的要求还使黑箱模型更加容易被理解,提高了预测的可信度。
3)本发明充分利用XGBoost机器学习模型的解释性机制,在保证了电力系统惯量短期预测较高准确率的同时还可以掌握模型内部的特征相关性,有利于电网调度部门制定相应的控制措施。
附图说明
图1为可解释性XGBoost算法框架图。
图2为电力系统惯量短期预测流程图。
图3为电力系统惯量预测实际值与预测值对比图。
图4是电力系统惯量预测模型特征重要性对比图。
图5为负荷需求特征Shapley值关系曲线图。
图6为光伏功率特征Shapley值关系曲线图。
图7为某年12月31日0点系统惯量预测结果图。
图8为某年12月31日12点系统惯量预测结果图。
具体实施方式
基于SHAP-XGBoost算法的电力系统惯量短期预测方法,包括以下步骤:
步骤1:考虑电力系统频率时空变化机理,确定电力系统短期惯量预测输入特征,构建基于XGBoost的短期惯量预测学习模型。
电力系统频率时空变化机理为:
电力系统中大型发电机运行中突然故障停机时,突发的有功功率缺额会引起系统频率的波动,已有的研究表明,电力系统的频率变化具有时空分布的特性。随着我国电力系统转型升级,以新能源为主体的新型电力系统中同步机逐步被取代,系统惯量在特点及形式上发生改变。由此带来的低惯量问题改变了系统频率特性,引起多起频率安全事故,这表明系统惯量支撑能力不足成为引发系统稳定弱化的重要因素。因此,对电力系统短期惯量进行快速、准确地预测,可以帮助提前掌握系统惯量水平以预警何时面临惯量薄弱的风险。
采用基于SHAP的可解释性XGBoost模型,其算法框架图如图1所示,所述步骤1中,首先,基于广域测量管理系统WAMS采集历史数据,提取影响系统惯量预测的相关物理量作为输入特征;考虑电力系统频率时空变化机理,构建基于XGBoost的短期惯量预测学习模型。其中,样本数据集描述如式(1)~式(2)所示,输入样本集每一行与输出样本集相对应:
Figure BDA0003939251260000071
Y=[y1,y2,…,yn]T (2);
式中,X是输入样本数据集;Y是输出样本数据集;上标m是输入特征的维度;下标n是输入样本的数目。其中,X的每一行表示一个输入样本。
在选取输入特征的时候,一方面要能很好的反映系统惯量特性,另一方面计算要保证时间上的快速性。为了保证电力系统惯量预测的准确性,依据系统有功-频率动态变化中电力系统惯量响应方程如式(3),选取合适的特征。
Figure BDA0003939251260000081
其中,Hsys和Dsys分别为系统惯量和系统阻尼,△P是系统功率变化率,△fCOI是惯量中心频率偏差。由式(3)知,影响系统惯性的因素有频率和各类能源的有功功率。因此,在选取输入特征的时候应该考虑系统频率和负荷需求。
在特征数据采集过程中难以避免数据存在缺失值、异常值等噪声数据。所以在使用之前需要进行数据预处理,对数据集进行数据清洗和填充,缺失值可以直接通过数值运算进行填充,检测出异常值用均值代替异常样本,最终得到可供模型训练的数据集。
基于XGBoost的短期惯量预测学习模型:
XGBoost是一种Boosting的集成学习模型,采用CART(Classification andRegression Tree)作为基学习器。具体如下所示:
Figure BDA0003939251260000082
式中:
Figure BDA0003939251260000083
为模型预测值;xi为第i个样本;fk为空间中的一个独立函数;F为所有CART组成的函数空间。XGBoost在损失函数中加入正则化项防止过拟合,其目标函数如下所示:
Figure BDA0003939251260000084
Figure BDA0003939251260000085
式(5)中:第一项表示预测值和实际值之间的误差,第二项为正则化项。式(6)中:T是叶子节点数;ωj是叶子节点权重;γ和λ是预先给定的超参数,分别用于控制叶子节点的个数和分数。由于目标函数的优化参数是树模型,故将其迭代分解成树学习过程。在保持原模型不变的前提下,采用增量训练的方式以最小化目标函数,每次迭代后更新目标函数为:
Figure BDA0003939251260000091
二阶泰勒展开将式(7)转换为关于自变量ωj的一元二次函数的形式。令
Figure BDA0003939251260000092
Ij是节点j的样本集,得到最优解
Figure BDA0003939251260000093
和对应的最优目标函数值为:
Figure BDA0003939251260000094
Figure BDA0003939251260000095
在训练过程中,生成树模型的分裂准则采用贪心算法,选取使得节点分裂前后目标函数的增益最大的特征节点为分裂点,表示如下:
Figure BDA0003939251260000096
式中,GL,HL,GR,HR分别为分裂时当前节点左右子树的一阶二阶导数和。
步骤2:基于步骤1建立的短期惯量预测学习模型,考虑传统机器学习模型不可解释性的影响,提出基于SHAP-XGBoost的解释性学习算法,实现所述短期惯量预测学习模型的深度学习;
传统机器学习模型不可解释性的影响具体为:
机器学习模型分为白盒子模型和黑盒子模型。简单的线性模型,单科决策树属于白盒子模型,其将输入映射为输出的方式,可以完全被理解,而许多决策树组成的随机森林,提升树,以及深度神经网络都属于黑盒子模型,这些模型输入到输出的映射非常复杂,想完整了解机器的内部运作方式几乎不可能。基于SHAP构建可解释性XGBoost模型,通过计算Shapley值来全局解释各特征的重要程度,就可以从多个维度将黑盒结构进行解构分析特征对单个输出结果的影响。
利用SHAP嵌套XGBoost方法筛选变量,从一个初始朴素模型开始,基于样本集中观测值得误差,建立新模型进行拟合,并以加法形式添加至现有模型,反复迭代此过程形成集成模型。具体为:通过sigmoid函数将模型预测值与SHAP解释模型g(x′)相关联,构建可解释性XGBoost模型,如式(11)所示:
Figure BDA0003939251260000097
然后,基于合作博弈论理论计算的Shapley值,SHAP将解释模型描述为样本预测的基准值φ0与所有输入特征Shapley值之和的形式如式(12)所示:
Figure BDA0003939251260000101
Figure BDA0003939251260000102
式(12)中:φj是样本第j个特征的Shapley值;m是样本的特征数目;x′j∈{0,1}m表示特征xj是否存在。式(13)中:z是样本的全体特征向量的集合,
Figure BDA0003939251260000103
x1,x2,…,xm代表的就是m个不同的特征向量。z\j是z中不含特征xj的特征子集。Fx(z)是可解释性XGBooost模型对于样本x输入特征为z时得到的预测输出,Fx(z)与Fx(z\i)之差为特征xj对预测结果的贡献。
基于以上步骤,拆解并定量映射各个特征对模型预测结果的贡献,并完成电力系统短期惯量预测模型的深度学习。
步骤3:构建电力系统短期惯量预测框架,实现预测模型的在线部署与应用。
构建电力系统短期惯量预测框架,其具体的预测流程如图2所示。可以将其过程大致分为数据预处理、模型训练、结果输出三个部分,具体为:基于WAMS采集的历史数据,提取影响系统惯量预测的相关物理量作为输入特征,经预处理得到可供模型训练的数据集。然后将经由步骤1中预处理过后的数据集划分为训练集与测试集,训练集用于训练可解释性XGBoost模型,测试集用于模型评价及结果验证。
同时利用TreeSHAP计算出所有样本中对应该变量的SHAP值,将其平均值作为该特征变量的重要性值,从而得到全局解释;然后,对系统惯量进行短期预测,对输出的系统惯量值及特征相关性进行分析,并可视化展示特征对于电力系统惯量短期预测模型的全局和局部影响。
基于SHAP归因方法构建的可解释性XGBoost模型满足局部精确性、允许缺失和一致性的特性。其中,局部精确性解释模型对单个样本的预测结果。缺失性表示样本的特征对模型的预测没有贡献,XGBoost不对变量进行插补处理。当模型结构发生变化时,输入特征的边际贡献与输入特征的Shapley值变化一致,Shapley值自身的可加性、虚拟性和对称性的性质得到SHAP的一致性。从全局和局部两个维度对模型进行解释分析,表示为:
(1)全局可解释性:解释模型如何基于整个特征空间和模型结构、参数等做出决策:据式(13)得到样本集中全部特征的Shapley值,从样本全体的角度考虑,对每项特征的Shapley值求平均绝对值,该值大小反映特征对模型输出结果的全局贡献程度。此外,根据每个特征的Shapley值与特征自身数值的分布关系,挖掘该特征数值大小与模型输出的正负相关性;
(2)局部可解释性:不考虑模型的复杂情况只关注于单个样本:将单个样本的输出可以表示为式(12)各项特征的Shapley值之和的形式,解释特征如何影响单个样本的结果输出,进而确定该样本的局部主导特征。结合全局分析的特征正负相关性,明确特征对样本的输出结果的偏高或偏低影响。
预测方法预测出结果的指标使用平均绝对误差(Mean Absolute Error,MAE)、均方误差(Mean Squared Error,MSE)、平均绝对百分比误差(Mean Absolute PercentageError,MAPE)和决定系数(Coefficient of Determination,R2),其定义如式(14)-(17)所示:
Figure BDA0003939251260000111
Figure BDA0003939251260000112
Figure BDA0003939251260000113
Figure BDA0003939251260000114
式中,i为样本编号;N为样本数量;
Figure BDA0003939251260000115
为预测得到的系统惯量值;yi为系统惯量的实际值。其中,MAE、MSE、MAPE越小表示模型拟合效果越好,R2越大表示模型拟合效果越好。
实施例:
采用基于SHAP的可解释性XGBoost短期惯量预测模型,对某国电网进行系统惯量短期预测,首先基于WAMS采集某国国家电网某年1月1日-该年12月31日的实测数据,时间分辨率为5分钟,输入特征选择气象特征、常规机组及新能源功率和负荷需求等,收集到28维输入特征类型如表1所示。
表1为系统惯量预测的输入特征集
Table 1 Input features for system inertia prediction
Figure BDA0003939251260000116
Figure BDA0003939251260000121
然后,使用MAE指标、MSE指标、MAPE指标、R2指标4个指标进行模型评估,由于模型的训练优化具有随机性,对各模型的5次计算结果取均值,结果见表2所示。
表2为与主流机器学习算法误差的结果对比
Table 2 Comparison with error results of mainstream machine learningalgorithms
Figure BDA0003939251260000122
其结果表明,XGBoost模型在测试数据上预测精度最高,R2为0.985意味着它可以正确预测电力系统惯量短期的变化趋势,其预测曲线如图3所示。
在集成算法中,GradientBoost、Bagging和ExtraTree的R2评价均高于0.90,而AdaBoost仅为0.815。AdaBoost算法的其他各项评价指标与集成算法均不在一个数量级,使用XGBoost模型的平均绝对误差为2.911%,均方误差为0.172%,平均绝对百分比误差为0.538%,预测结果精确,远优于其他机器学习模型。
其中,可解释性XGBoost算法从全局可解释性和局部可解释性对输出结果进行解释分析。从全局的角度来看,将影响系统惯量的因素根据特征重要性进行排序,得到基于SHAP的可解释性XGBoost模型的特征重要性如图4所示。图4中的点代表每一个样本,横坐标为特征的Shapley值,将每个特征的Shapley值分布情况与用不同颜色代表的特征值大小关联起来,特征的颜色分布说明对模型的影响效果,样本点颜色越红表示该特征本身的Shapley值越大。纵轴为28维特征值的重要性排序,特征按重要性从大到小依次排列,特征值越大其重要性越高。从图4可以看出,对于电力系统惯量预测模型而言,最重要的是负荷需求、光伏功率和煤电功率等特征。其中,负荷需求的特征值最大,数值分布方差显著高于其他特征,Shapley值大量聚集在平均值以下。蓝色的小负荷需求对模型预测结果带来正向的影响,反之红色的大负荷需求是负向影响,该颜色分布表明,负荷需求越高,系统惯量值越大,与电力系统实际运行的认知一致。
以负荷需求和光伏功率特征为例,图5和图6进一步展示各自Shapley值与特征自身数值的关系。可以发现,负荷需求小于35000MW时,该特征的Shapley值与特征成负相关,说明随着负荷需求的增加模型对系统惯量值呈现降低的预测趋势。光伏出力为0时,特征的Shapley值小于0,表示此时系统惯量值更可能低于基准值。从物理意义的角度看,负荷需求增加系统惯量呈增加趋势,说明更多的同步机组被启动,但当负荷需求进一步增加,瞬间的功率缺口给电网运行带来负担,系统可能面临低惯量的风险;光伏资源匮乏时,等效的系统惯量呈减少趋势。
从局部的角度来看,选择该年12月31日0点和12点的样本对其进行解释,通过SHAP解释有助于理解输入特征如何进行预测,两个时刻的预测结果分别是图7和图8,图中红色的特征表示其Shapley值为正,会给预测值带来正向的贡献,即增大系统惯量的预测值,且色块的面积越大意味着对模型结果的影响越大。0点负荷需求带来的正向影响最大,光伏功率带来的负向影响最大,模型预测的输出结果为5.559高于预测基准值5.378,说明此时系统不处于低惯量水平。相反12点光伏功率带来的正向影响最大,负荷需求带来的负向影响最大,12点模型预测输出结果低于预测基准值,系统惯量有进一步下降的趋势,严重时存在低惯量运行场景下切负荷/切机风险。
结合图5和图6所反映的特征正负相关性趋势分析,图7和图8中0点与12点负荷需求以35000MW界,分别为27708MW和37190MW,使模型对相应样本预测惯量值增加了0.160和减少了0.142。在不同样本个体中,特征对于模型决策影响存在差异,但负荷需求和光伏特征等全局重要性较高的特征对不同样本个体的预测结果影响均较大,与图4结论一致。

Claims (8)

1.基于SHAP-XGBoost算法的电力系统惯量短期预测方法,其特征在于包括以下步骤:
步骤1:确定电力系统短期惯量预测输入特征,构建基于XGBoost的短期惯量预测学习模型;
步骤2:基于步骤1建立的短期惯量预测学习模型,提出基于SHAP-XGBoost的解释性学习算法,实现所述短期惯量预测学习模型的深度学习;
步骤3:构建电力系统短期惯量预测框架,实现预测模型的电力系统惯量预测。
2.根据权利要求1所述基于SHAP-XGBoost算法的电力系统惯量短期预测方法,其特征在于:所述步骤1中,首先基于广域测量管理系统WAMS采集历史数据,提取影响系统惯量预测的相关物理量作为输入特征,作为预测学习模型训练的数据集;
其中:样本数据集描述如式(1)~式(2)所示,输入样本集每一行与输出样本集相对应:
Figure FDA0003939251250000011
Y=[y1,y2,…,yn]T (2);
式中,X是输入样本数据集;Y是输出样本数据集;上标m是输入特征的维度;下标n是输入样本的数目;其中,X的每一行表示一个输入样本;
依据系统有功-频率动态变化中电力系统惯量响应方程,如式(3)所示,选取合适的特征;
Figure FDA0003939251250000012
式(3)中,Hsys和Dsys分别为系统惯量、系统阻尼,△P是系统功率变化率,△fCOI是惯量中心频率偏差;由式(3)知,影响系统惯性的因素有频率和各类能源的有功功率;因此,在选取输入特征的时候考虑系统频率和负荷需求。
3.根据权利要求1所述基于SHAP-XGBoost算法的电力系统惯量短期预测方法,其特征在于:所述步骤1中,基于XGBoost的短期惯量预测学习模型,具体如下:
XGBoost采用CART(Classification and Regression Tree)作为基学习器,具体如式(4)所示:
Figure FDA0003939251250000013
式中:
Figure FDA0003939251250000021
为模型预测值;xi为第i个样本;fk为空间中的一个独立函数;F为所有CART组成的函数空间;XGBoost在损失函数中加入正则化项防止过拟合,其目标函数如下所示:
Figure FDA0003939251250000022
Figure FDA0003939251250000023
式(5)中:第一项表示预测值和实际值之间的误差,第二项为正则化项;
式(6)中:T是叶子节点数;ωj是叶子节点权重;γ和λ是预先给定的超参数,分别用于控制叶子节点的个数和分数;由于目标函数的优化参数是树模型,故将其迭代分解成树学习过程;在保持原模型不变的前提下,采用增量训练的方式以最小化目标函数,每次迭代后更新目标函数为:
Figure FDA0003939251250000024
二阶泰勒展开将式(7)转换为关于自变量ωj的一元二次函数的形式;
Figure FDA0003939251250000025
Ij是节点j的样本集,得到最优解
Figure FDA0003939251250000026
和对应的最优目标函数值为:
Figure FDA0003939251250000027
Figure FDA0003939251250000028
在训练过程中,生成树模型的分裂准则采用贪心算法,选取使得节点分裂前后目标函数的增益最大的特征节点为分裂点,表示如下:
Figure FDA0003939251250000029
式中,GL,HL,GR,HR分别为分裂时当前节点左右子树的一阶二阶导数和。
4.根据权利要求1所述基于SHAP-XGBoost算法的电力系统惯量短期预测方法,其特征在于:所述步骤2中,利用SHAP嵌套XGBoost方法筛选变量,SHAP是基于Shapley value的计算,用于衡量特征如何影响因变量,从一个初始朴素模型开始,基于样本集中观测值得误差,建立新模型进行拟合,并以加法形式添加至现有模型,反复迭代此过程形成集成模型。
5.根据权利要求4所述基于SHAP-XGBoost算法的电力系统惯量短期预测方法,其特征在于:步骤2包括如下步骤:
S2.1:通过sigmoid函数将模型预测值与SHAP解释模型g(x′)相关联,构建可解释性XGBoost模型,如式(11)所示:
Figure FDA0003939251250000031
式(11)中,e-g(x′)表示一个以自然常数e为底的指数函数;
S2.2:设g代表解释模型,SHAP将解释模型描述为样本预测的基准值φ0与所有输入特征Shapley值之和的形式如式(12)所示:
Figure FDA0003939251250000032
式(12)中:φj是样本第j个特征的Shapley值;m是样本的特征数目;x′j∈{0,1}m表示特征xj是否存在;
Figure FDA0003939251250000033
式(13)中:z是样本的全体特征向量的集合,
Figure FDA0003939251250000034
x1,x2,…,xm代表的就是m个不同的特征向量;
z\j是z中不含特征xj的特征子集;Fx(z)是可解释性XGBoost模型对于样本x输入特征为z时得到的预测输出,Fx(z)与Fx(z\i)之差为特征xj对预测结果的贡献;
基于以上步骤,拆解并定量映射各个特征对模型预测结果的贡献,并完成电力系统短期惯量预测学习模型的深度学习。
6.根据权利要求5所述基于SHAP-XGBoost算法的电力系统惯量短期预测方法,其特征在于:所述步骤3包括如下步骤:
S3.1:构建电力系统短期惯量预测框架,将经由预处理过后的数据集划分为训练集与测试集,通过读取数据、参数设置过程,训练可解释性XGBoost模型;
S3.2:利用TreeSHAP计算出的所有样本中对应该变量的SHAP值,将其平均值作为该特征变量的重要性值,从而得到全局解释;
S3.3:对系统惯量进行短期预测,对输出的系统惯量值及特征相关性进行分析,并可视化展示特征对于电力系统惯量短期预测模型的全局和局部影响。
7.根据权利要求6所述基于SHAP-XGBoost算法的电力系统惯量短期预测方法,其特征在于:从全局和局部两个维度对电力系统惯量短期预测模型进行解释分析,表示为:
(1)全局可解释性:解释模型如何基于整个特征空间和模型结构、参数等做出决策:据式(13)得到样本集中全部特征的Shapley值,从样本全体的角度考虑,对每项特征的Shapley值求平均绝对值,该值大小反映特征对模型输出结果的全局贡献程度;此外,根据每个特征的Shapley值与特征自身数值的分布关系,挖掘该特征数值大小与模型输出的正负相关性;
(2)局部可解释性:不考虑模型的复杂情况只关注于单个样本:将单个样本的输出可以表示为式(12)各项特征的Shapley值之和的形式,解释特征如何影响单个样本的结果输出,进而确定该样本的局部主导特征;结合全局分析的特征正负相关性,明确特征对样本的输出结果的偏高或偏低影响。
8.根据权利要求6所述基于SHAP-XGBoost算法的电力系统惯量短期预测方法,其特征在于:还包括:
S3.4:对于经由电力系统惯量短期预测模型预测出的结果,使用平均绝对误差(MeanAbsolute Error,MAE)、均方误差(Mean Squared Error,MSE)、平均绝对百分比误差(MeanAbsolute Percentage Error,MAPE)和决定系数(Coefficient of Determination,R2)几种方法进行评价,如式(14)~式(17)所示:
Figure FDA0003939251250000041
Figure FDA0003939251250000042
Figure FDA0003939251250000043
Figure FDA0003939251250000044
式中,i为样本编号;n为样本数量;
Figure FDA0003939251250000045
为预测得到的系统惯量值;yi为系统惯量的实际值;其中,MAE、MSE、MAPE越小,表示模型拟合效果越好,R2越大表示模型拟合效果越好。
CN202211412496.4A 2022-11-11 2022-11-11 基于SHAP-XGBoost算法的电力系统惯量短期预测方法 Pending CN115759380A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211412496.4A CN115759380A (zh) 2022-11-11 2022-11-11 基于SHAP-XGBoost算法的电力系统惯量短期预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211412496.4A CN115759380A (zh) 2022-11-11 2022-11-11 基于SHAP-XGBoost算法的电力系统惯量短期预测方法

Publications (1)

Publication Number Publication Date
CN115759380A true CN115759380A (zh) 2023-03-07

Family

ID=85369694

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211412496.4A Pending CN115759380A (zh) 2022-11-11 2022-11-11 基于SHAP-XGBoost算法的电力系统惯量短期预测方法

Country Status (1)

Country Link
CN (1) CN115759380A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116578948A (zh) * 2023-07-12 2023-08-11 宁德时代新能源科技股份有限公司 数据相关性识别方法、装置、电子设备及介质
CN117192312A (zh) * 2023-11-07 2023-12-08 云南电网有限责任公司 基于机器学习的二次交流电缆绝缘异常监测方法及系统
CN117977581A (zh) * 2024-03-29 2024-05-03 江苏冉闻信息科技有限公司 基于深度学习的电网风险预测方法及系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116578948A (zh) * 2023-07-12 2023-08-11 宁德时代新能源科技股份有限公司 数据相关性识别方法、装置、电子设备及介质
CN117192312A (zh) * 2023-11-07 2023-12-08 云南电网有限责任公司 基于机器学习的二次交流电缆绝缘异常监测方法及系统
CN117192312B (zh) * 2023-11-07 2024-04-19 云南电网有限责任公司 基于机器学习的二次交流电缆绝缘异常监测方法及系统
CN117977581A (zh) * 2024-03-29 2024-05-03 江苏冉闻信息科技有限公司 基于深度学习的电网风险预测方法及系统

Similar Documents

Publication Publication Date Title
CN115759380A (zh) 基于SHAP-XGBoost算法的电力系统惯量短期预测方法
US11436395B2 (en) Method for prediction of key performance parameter of an aero-engine transition state acceleration process based on space reconstruction
CN109885907B (zh) 一种基于云模型的卫星姿控系统健康状态评估和预测方法
CN106951695B (zh) 多工况下的机械设备剩余使用寿命计算方法及系统
Saldivar et al. Self-organizing tool for smart design with predictive customer needs and wants to realize Industry 4.0
CN104820716B (zh) 基于数据挖掘的装备可靠性评估方法
CN110097297A (zh) 一种多维度窃电态势智能感知方法、系统、设备及介质
CN108320016A (zh) 一种建筑能耗短期预测方法
Lindemann et al. Anomaly detection and prediction in discrete manufacturing based on cooperative LSTM networks
CN106980910B (zh) 中长期电力负荷测算系统及方法
CN116150897A (zh) 一种基于数字孪生的机床主轴性能测评方法及系统
CN108647838B (zh) 一种基于随机矩阵理论和在线序列极限学习机的电网态势感知方法
CN111178585A (zh) 基于多算法模型融合的故障接报量预测方法
CN111401749A (zh) 一种基于随机森林与极限学习回归的动态安全评估方法
CN112508442A (zh) 基于自动化和可解释机器学习的暂态稳定评估方法及系统
CN111460001B (zh) 一种配电网理论线损率评估方法及系统
CN116316599A (zh) 一种智能用电负荷预测方法
CN110070202A (zh) 一种通过用电量数据预测经济产出的方法
Lu Research on GDP forecast analysis combining BP neural network and ARIMA model
CN115438726A (zh) 一种基于数字孪生技术的设备寿命与故障类型预测方法及系统
Li et al. Aero-engine exhaust gas temperature prediction based on LightGBM optimized by improved bat algorithm
Evans et al. Multivariate data analytics in PV manufacturing—Four case studies using manufacturing datasets
Stiasny et al. Transient stability analysis with physics-informed neural networks
CN115545333A (zh) 一种多负荷日类型配电网负荷曲线预测方法
CN116933010A (zh) 一种基于多源数据融合与深度学习的负载率分析评价方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination