CN115759380A

CN115759380A - 基于SHAP-XGBoost算法的电力系统惯量短期预测方法

Info

Publication number: CN115759380A
Application number: CN202211412496.4A
Authority: CN
Inventors: 张磊; 陶千惠; 叶婧; 黄悦华; 李振华; 薛田良; 杨楠; 程江州; 肖繁; 徐雄军; 潘鹏程; 徐恒山; 陈庆; 卢天林
Original assignee: China Three Gorges University CTGU
Current assignee: China Three Gorges University CTGU
Priority date: 2022-11-11
Filing date: 2022-11-11
Publication date: 2023-03-07

Abstract

基于SHAP‑XGBoost算法的电力系统惯量短期预测方法，确定电力系统短期惯量预测输入特征，构建基于XGBoost的短期惯量预测学习模型；基于建立的短期惯量预测学习模型，提出基于SHAP‑XGBoost的解释性学习算法，实现所述短期惯量预测学习模型的深度学习；构建电力系统短期惯量预测框架，实现预测模型的在线部署与应用。本发明充分利用XGBoost机器学习模型的解释性机制，在保证了电力系统惯量短期预测较高准确率的同时还可以掌握模型内部的特征相关性，有利于电网调度部门制定相应的控制措施。

Description

基于SHAP-XGBoost算法的电力系统惯量短期预测方法

技术领域

本发明涉及电力系统运行分析领域，具体涉及一种基于SHAP-XGBoost算法的电力系统惯量短期预测方法。

背景技术

随着传统化石能源枯竭和环境问题突出，新能源迅速发展，大量新能源以电力电子装备并网引起电力系统惯量降低，造成频率问题突出，威胁电力系统的安全稳定运行。电力系统惯量作为电力系统中一个重要的参数，由同步发电机和水轮机的转动质量决定，当发电和需求不平衡时，惯量会影响即时频率响应。因此，快速、准确地预测电力系统短期惯量，提前掌握系统惯量水平以预警系统何时面临惯量薄弱的风险，不仅是高渗透新能源电力系统中保证系统运行与经济调度的关键变量，还是保证系统进行优化运行决策的重要前提。

目前，电力系统惯量短期预测方法的研究主要有统计学方法和机器学习方法。统计学方法主要有回归分析法、差分自回归移动平均模型，最小方差有限脉冲响应滤波器，贝叶斯模型等。基于统计学方法的预测需假定系统惯量仅由同步发电机产生。然而，该方法缺少对新型电力系统中其他复杂非线性虚拟惯量的表征。机器学习方法则避免了对电网复杂特性的分析和高维非线性公式推导，相对于线性模型在进行预测时往往有更好的精度，但机器学习模型的预测过程类似于“黑箱”，模型缺乏可解释性，其结果难以为电网调度部门的具体决策提供相关解释性信息，是目前机器学习方法在惯量短期预测应用中的主要问题。

在面对系统惯量短期预测的大规模数据问题上，XGBoost模型的复杂度与预测精度间难以平衡。近年来的研究将解释与机器学习模型分离，其可解释性方法包括全局代理模型、局部代理模型等。这类方法在保证较高的准确率的同时可以掌握模型内部的特征相关性，已应用于生物医疗预测、金融预测、计算机视觉等领域，但在电力系统惯量预测研究中鲜有应用。因此，为保证系统经济性与安全性，亟需提出一种可解释性XGBoost的电力系统惯量短期预测方法，从而实现预测精度与可解释性之间的平衡，促进系统安全运行与经济调度。

发明内容

为解决上述现有技术的缺陷和不足，本发明提供一种基于SHAP-XGBoost算法的电力系统惯量短期预测方法，其目的是充分利用机器学习模型的可解释性方法，以提升电力系统惯量短期预测的准确性。该方法具备成本低、简单高效、数据完整准确、无需实验以及复杂的计算过程的优点。

本发明采取的技术方案为：

基于SHAP-XGBoost算法的电力系统惯量短期预测方法，包括以下步骤：

步骤1：考虑电力系统频率时空变化机理，确定电力系统短期惯量预测输入特征，构建基于XGBoost的短期惯量预测学习模型；

步骤2：基于步骤1建立的短期惯量预测学习模型，考虑传统机器学习模型不可解释性的影响，提出基于SHAP-XGBoost的解释性学习算法，实现所述短期惯量预测学习模型的深度学习；

步骤3：构建电力系统短期惯量预测框架，实现预测模型的电力系统惯量预测。

所述步骤1中，首先基于广域测量管理系统WAMS采集历史数据，提取影响系统惯量预测的相关物理量作为输入特征。由于在特征数据采集过程中难以避免数据存在缺失值、异常值等噪声数据。故在使用之前需要进行数据预处理，对数据集进行数据清洗和填充，对于缺失值直接通过数值运算进行填充，异常值用均值代替异常样本，在保留特征的同时还能够保证数据的无偏估计，经过一系列的处理最终得到能够供预测学习模型训练的数据集，

其中：样本数据集描述如式(1)～式(2)所示，输入样本集每一行与输出样本集相对应：

Y＝[y₁,y₂,…,y_n]^T (2)；

式中，X是输入样本数据集；Y是输出样本数据集；上标m是输入特征的维度；下标n是输入样本的数目。其中，X的每一行表示一个输入样本。

在选取输入特征的时候，一方面要能很好的反映系统惯量特性，另一方面计算要保证时间上的快速性。故为了保证电力系统惯量预测的准确性，依据系统有功-频率动态变化中电力系统惯量响应方程，如式(3)所示，选取合适的特征；

式(3)中，H_sys和D_sys分别为系统惯量、系统阻尼，△P是系统功率变化率，△f_COI是惯量中心频率偏差；由式(3)知，影响系统惯性的因素有频率和各类能源的有功功率。因此，在选取输入特征的时候考虑系统频率和负荷需求。

基于XGBoost的短期惯量预测学习模型：

XGBoost是一种Boosting的集成学习模型，采用CART(Classification andRegression Tree)作为基学习器，具体如下所示：

式中：

为模型预测值；x_i为第i个样本；f_k为空间中的一个独立函数；F为所有CART组成的函数空间。XGBoost在损失函数中加入正则化项防止过拟合，其目标函数如下所示：

式(5)中：第一项表示预测值和实际值之间的误差，第二项为正则化项。

式(6)中：T是叶子节点数；ω_j是叶子节点权重；γ和λ是预先给定的超参数，分别用于控制叶子节点的个数和分数。由于目标函数的优化参数是树模型，故将其迭代分解成树学习过程。在保持原模型不变的前提下，采用增量训练的方式以最小化目标函数，每次迭代后更新目标函数为：

二阶泰勒展开将式(7)转换为关于自变量ω_j的一元二次函数的形式。

令

I_j是节点j的样本集，得到最优解

和对应的最优目标函数值为：

在训练过程中，生成树模型的分裂准则采用贪心算法，选取使得节点分裂前后目标函数的增益最大的特征节点为分裂点，表示如下：

式中，G_L，H_L，G_R，H_R分别为分裂时当前节点左右子树的一阶二阶导数和。

所述步骤2中，考虑传统机器学习模型不可解释性的影响，具体为：机器学习模型分为白盒子模型和黑盒子模型，简单的线性模型，单棵决策树属于白盒子模型，其将输入映射为输出的方式，可以完全被理解，而许多决策树组成的随机森林，提升树，以及深度神经网络都属于黑盒子模型，这些模型输入到输出的映射非常复杂，想完整了解机器的内部运作方式几乎不可能。

基于SHAP构建可解释性XGBoost模型，通过计算Shapley值来全局解释各特征的重要程度，就可以从多个维度将黑盒结构进行解构分析特征对单个输出结果的影响。

所述步骤2中，利用SHAP嵌套XGBoost方法筛选变量，SHAP是基于Shapley value的计算，用于衡量特征如何影响因变量，从一个初始朴素模型开始，基于样本集中观测值得误差，建立新模型进行拟合，并以加法形式添加至现有模型，反复迭代此过程形成集成模型。

步骤2包括如下步骤：

S2.1：通过sigmoid函数将模型预测值与SHAP解释模型g(x′)相关联，构建可解释性XGBoost模型，如式(11)所示：

式(11)中，e^-g(x′)表示一个以自然常数e为底的指数函数。

S2.2：对于集成树模型来说，当做分类任务时，模型输出的是一个概率值。SHAP可计算每一个特征的Shapley值，以此来衡量出每个特征对于最终预测的贡献度。假设g代表解释模型，SHAP将解释模型描述为样本预测的基准值φ₀与所有输入特征Shapley值之和的形式如式(12)所示：

式(12)中：φ_j是样本第j个特征的Shapley值；m是样本的特征数目；x′^j∈{0,1}^m表示特征x^j是否存在。

式(13)中：z是样本的全体特征向量的集合，

x¹,x²,…,x^m代表的就是m个不同的特征向量。

z_\j是z中不含特征x^j的特征子集；F_x(z)是可解释性XGBoost模型对于样本x输入特征为z时得到的预测输出，F_x(z)与F_x(z_\i)之差为特征x^j对预测结果的贡献。

每个特征的SHAP值表示以该特征为条件时预期模型预测的变化。对于每个功能，SHAP值说明了该特征对于总体预测结果的贡献，以说明实例的平均模型预测与实际预测之间的差异。

基于以上步骤，拆解并定量映射各个特征对模型预测结果的贡献，并完成电力系统短期惯量预测学习模型的深度学习。

所述步骤3包括如下步骤：

S3.1：构建电力系统短期惯量预测框架，将经由预处理过后的数据集划分为训练集与测试集，通过读取数据、参数设置等过程训练可解释性XGBoost模型。

电力系统短期惯量预测框架具体如图2所示，其具体内容为依据该框架对系统惯量短期预测，可以将其过程大致分为数据预处理、模型训练、结果输出三个部分，具体为：基于WAMS采集的历史数据，提取影响系统惯量预测的相关物理量作为输入特征，经预处理得到可供模型训练的数据集。然后将数据集划分为训练集与测试集，训练集用于训练可解释性XGBoost模型，测试集用于模型评价及结果验证。最后对输出系统惯量值和特征相关性进行分析，并可视化展示特征对电力系统惯量短期预测模型的全局和局部影响。

S3.2：利用TreeSHAP计算出的所有样本中对应该变量的SHAP值，将其平均值作为该特征变量的重要性值，从而得到全局解释；

S3.3：对系统惯量进行短期预测，对输出的系统惯量值及特征相关性进行分析，并可视化展示特征对于电力系统惯量短期预测模型的全局和局部影响。

基于SHAP归因方法构建的可解释性XGBoost模型满足局部精确性、允许缺失和一致性的特性。其中，局部精确性解释模型对单个样本的预测结果。缺失性表示样本的特征对模型的预测没有贡献，XGBoost不对变量进行插补处理。当模型结构发生变化时，输入特征的边际贡献与输入特征的Shapley值变化一致，Shapley值自身的可加性、虚拟性和对称性的性质得到SHAP的一致性。

从全局和局部两个维度对电力系统惯量短期预测模型进行解释分析，表示为：

(1)全局可解释性：解释模型如何基于整个特征空间和模型结构、参数等做出决策：据式(13)得到样本集中全部特征的Shapley值，从样本全体的角度考虑，对每项特征的Shapley值求平均绝对值，该值大小反映特征对模型输出结果的全局贡献程度；此外，根据每个特征的Shapley值与特征自身数值的分布关系，挖掘该特征数值大小与模型输出的正负相关性；

(2)局部可解释性：不考虑模型的复杂情况只关注于单个样本：将单个样本的输出可以表示为式(12)各项特征的Shapley值之和的形式，解释特征如何影响单个样本的结果输出，进而确定该样本的局部主导特征；结合全局分析的特征正负相关性，明确特征对样本的输出结果的偏高或偏低影响。

S3.4：对于经由电力系统惯量短期预测模型预测出的结果，使用平均绝对误差(Mean Absolute Error，MAE)、均方误差(Mean Squared Error，MSE)、平均绝对百分比误差(Mean Absolute Percentage Error，MAPE)和决定系数(Coefficient of Determination，R²)几种方法进行评价，如式(14)～式(17)所示：

式中，i为样本编号；n为样本数量；

为预测得到的系统惯量值；y_i为系统惯量的实际值。

其中，MAE、MSE、MAPE越小，表示模型拟合效果越好，R²越大表示模型拟合效果越好。

本发明一种基于SHAP-XGBoost算法的电力系统惯量短期预测方法，技术效果如下：

1)本发明构建的可解释性XGBoost模型以一致的方式量化特征对系统惯量短期预测的影响。全局可解释性挖掘了影响系统惯量的关键物理量，局部可解释性对每次预测结果进行因果判断，提高了预测结果的可信度。

2)本发明利用SHAP值与目标特征值之间的正负性关系，结合领域知识解释特征，该方法能够拆解并定量映射出各个样本中特征对模型预测结果的贡献程度。不仅保证了系统惯量短期预测精度的要求还使黑箱模型更加容易被理解，提高了预测的可信度。

3)本发明充分利用XGBoost机器学习模型的解释性机制，在保证了电力系统惯量短期预测较高准确率的同时还可以掌握模型内部的特征相关性，有利于电网调度部门制定相应的控制措施。

附图说明

图1为可解释性XGBoost算法框架图。

图2为电力系统惯量短期预测流程图。

图3为电力系统惯量预测实际值与预测值对比图。

图4是电力系统惯量预测模型特征重要性对比图。

图5为负荷需求特征Shapley值关系曲线图。

图6为光伏功率特征Shapley值关系曲线图。

图7为某年12月31日0点系统惯量预测结果图。

图8为某年12月31日12点系统惯量预测结果图。

具体实施方式

步骤1：考虑电力系统频率时空变化机理，确定电力系统短期惯量预测输入特征，构建基于XGBoost的短期惯量预测学习模型。

电力系统频率时空变化机理为：

电力系统中大型发电机运行中突然故障停机时,突发的有功功率缺额会引起系统频率的波动,已有的研究表明,电力系统的频率变化具有时空分布的特性。随着我国电力系统转型升级，以新能源为主体的新型电力系统中同步机逐步被取代，系统惯量在特点及形式上发生改变。由此带来的低惯量问题改变了系统频率特性，引起多起频率安全事故，这表明系统惯量支撑能力不足成为引发系统稳定弱化的重要因素。因此，对电力系统短期惯量进行快速、准确地预测，可以帮助提前掌握系统惯量水平以预警何时面临惯量薄弱的风险。

采用基于SHAP的可解释性XGBoost模型，其算法框架图如图1所示，所述步骤1中，首先，基于广域测量管理系统WAMS采集历史数据，提取影响系统惯量预测的相关物理量作为输入特征；考虑电力系统频率时空变化机理，构建基于XGBoost的短期惯量预测学习模型。其中，样本数据集描述如式(1)～式(2)所示，输入样本集每一行与输出样本集相对应：

Y＝[y₁,y₂,…,y_n]^T (2)；

在选取输入特征的时候，一方面要能很好的反映系统惯量特性，另一方面计算要保证时间上的快速性。为了保证电力系统惯量预测的准确性，依据系统有功-频率动态变化中电力系统惯量响应方程如式(3)，选取合适的特征。

其中，H_sys和D_sys分别为系统惯量和系统阻尼，△P是系统功率变化率，△f_COI是惯量中心频率偏差。由式(3)知，影响系统惯性的因素有频率和各类能源的有功功率。因此，在选取输入特征的时候应该考虑系统频率和负荷需求。

在特征数据采集过程中难以避免数据存在缺失值、异常值等噪声数据。所以在使用之前需要进行数据预处理，对数据集进行数据清洗和填充，缺失值可以直接通过数值运算进行填充，检测出异常值用均值代替异常样本，最终得到可供模型训练的数据集。

基于XGBoost的短期惯量预测学习模型：

XGBoost是一种Boosting的集成学习模型，采用CART(Classification andRegression Tree)作为基学习器。具体如下所示：

式中：

式(5)中：第一项表示预测值和实际值之间的误差，第二项为正则化项。式(6)中：T是叶子节点数；ω_j是叶子节点权重；γ和λ是预先给定的超参数，分别用于控制叶子节点的个数和分数。由于目标函数的优化参数是树模型，故将其迭代分解成树学习过程。在保持原模型不变的前提下，采用增量训练的方式以最小化目标函数，每次迭代后更新目标函数为：

二阶泰勒展开将式(7)转换为关于自变量ω_j的一元二次函数的形式。令

I_j是节点j的样本集，得到最优解

和对应的最优目标函数值为：

传统机器学习模型不可解释性的影响具体为：

机器学习模型分为白盒子模型和黑盒子模型。简单的线性模型，单科决策树属于白盒子模型，其将输入映射为输出的方式，可以完全被理解，而许多决策树组成的随机森林，提升树，以及深度神经网络都属于黑盒子模型，这些模型输入到输出的映射非常复杂，想完整了解机器的内部运作方式几乎不可能。基于SHAP构建可解释性XGBoost模型，通过计算Shapley值来全局解释各特征的重要程度，就可以从多个维度将黑盒结构进行解构分析特征对单个输出结果的影响。

利用SHAP嵌套XGBoost方法筛选变量，从一个初始朴素模型开始，基于样本集中观测值得误差，建立新模型进行拟合，并以加法形式添加至现有模型，反复迭代此过程形成集成模型。具体为：通过sigmoid函数将模型预测值与SHAP解释模型g(x′)相关联，构建可解释性XGBoost模型，如式(11)所示：

然后，基于合作博弈论理论计算的Shapley值，SHAP将解释模型描述为样本预测的基准值φ₀与所有输入特征Shapley值之和的形式如式(12)所示：

式(12)中：φ_j是样本第j个特征的Shapley值；m是样本的特征数目；x^′j∈{0,1}^m表示特征x^j是否存在。式(13)中：z是样本的全体特征向量的集合，

x¹,x²,…,x^m代表的就是m个不同的特征向量。z_\j是z中不含特征x^j的特征子集。F_x(z)是可解释性XGBooost模型对于样本x输入特征为z时得到的预测输出，F_x(z)与F_x(z_\i)之差为特征x^j对预测结果的贡献。

基于以上步骤，拆解并定量映射各个特征对模型预测结果的贡献，并完成电力系统短期惯量预测模型的深度学习。

步骤3：构建电力系统短期惯量预测框架，实现预测模型的在线部署与应用。

构建电力系统短期惯量预测框架，其具体的预测流程如图2所示。可以将其过程大致分为数据预处理、模型训练、结果输出三个部分，具体为：基于WAMS采集的历史数据，提取影响系统惯量预测的相关物理量作为输入特征，经预处理得到可供模型训练的数据集。然后将经由步骤1中预处理过后的数据集划分为训练集与测试集，训练集用于训练可解释性XGBoost模型，测试集用于模型评价及结果验证。

同时利用TreeSHAP计算出所有样本中对应该变量的SHAP值，将其平均值作为该特征变量的重要性值，从而得到全局解释；然后，对系统惯量进行短期预测，对输出的系统惯量值及特征相关性进行分析，并可视化展示特征对于电力系统惯量短期预测模型的全局和局部影响。

基于SHAP归因方法构建的可解释性XGBoost模型满足局部精确性、允许缺失和一致性的特性。其中，局部精确性解释模型对单个样本的预测结果。缺失性表示样本的特征对模型的预测没有贡献，XGBoost不对变量进行插补处理。当模型结构发生变化时，输入特征的边际贡献与输入特征的Shapley值变化一致，Shapley值自身的可加性、虚拟性和对称性的性质得到SHAP的一致性。从全局和局部两个维度对模型进行解释分析，表示为：

(1)全局可解释性：解释模型如何基于整个特征空间和模型结构、参数等做出决策：据式(13)得到样本集中全部特征的Shapley值，从样本全体的角度考虑，对每项特征的Shapley值求平均绝对值，该值大小反映特征对模型输出结果的全局贡献程度。此外，根据每个特征的Shapley值与特征自身数值的分布关系，挖掘该特征数值大小与模型输出的正负相关性；

(2)局部可解释性：不考虑模型的复杂情况只关注于单个样本：将单个样本的输出可以表示为式(12)各项特征的Shapley值之和的形式，解释特征如何影响单个样本的结果输出，进而确定该样本的局部主导特征。结合全局分析的特征正负相关性，明确特征对样本的输出结果的偏高或偏低影响。

预测方法预测出结果的指标使用平均绝对误差(Mean Absolute Error，MAE)、均方误差(Mean Squared Error，MSE)、平均绝对百分比误差(Mean Absolute PercentageError，MAPE)和决定系数(Coefficient of Determination，R²)，其定义如式(14)-(17)所示：

式中，i为样本编号；N为样本数量；

为预测得到的系统惯量值；y_i为系统惯量的实际值。其中，MAE、MSE、MAPE越小表示模型拟合效果越好，R²越大表示模型拟合效果越好。

实施例：

采用基于SHAP的可解释性XGBoost短期惯量预测模型，对某国电网进行系统惯量短期预测，首先基于WAMS采集某国国家电网某年1月1日-该年12月31日的实测数据，时间分辨率为5分钟，输入特征选择气象特征、常规机组及新能源功率和负荷需求等，收集到28维输入特征类型如表1所示。

表1为系统惯量预测的输入特征集

Table 1 Input features for system inertia prediction

然后，使用MAE指标、MSE指标、MAPE指标、R²指标4个指标进行模型评估，由于模型的训练优化具有随机性，对各模型的5次计算结果取均值，结果见表2所示。

表2为与主流机器学习算法误差的结果对比

Table 2 Comparison with error results of mainstream machine learningalgorithms

其结果表明，XGBoost模型在测试数据上预测精度最高，R²为0.985意味着它可以正确预测电力系统惯量短期的变化趋势，其预测曲线如图3所示。

在集成算法中，GradientBoost、Bagging和ExtraTree的R²评价均高于0.90，而AdaBoost仅为0.815。AdaBoost算法的其他各项评价指标与集成算法均不在一个数量级，使用XGBoost模型的平均绝对误差为2.911％，均方误差为0.172％，平均绝对百分比误差为0.538％，预测结果精确，远优于其他机器学习模型。

其中，可解释性XGBoost算法从全局可解释性和局部可解释性对输出结果进行解释分析。从全局的角度来看，将影响系统惯量的因素根据特征重要性进行排序，得到基于SHAP的可解释性XGBoost模型的特征重要性如图4所示。图4中的点代表每一个样本，横坐标为特征的Shapley值，将每个特征的Shapley值分布情况与用不同颜色代表的特征值大小关联起来，特征的颜色分布说明对模型的影响效果，样本点颜色越红表示该特征本身的Shapley值越大。纵轴为28维特征值的重要性排序，特征按重要性从大到小依次排列，特征值越大其重要性越高。从图4可以看出，对于电力系统惯量预测模型而言，最重要的是负荷需求、光伏功率和煤电功率等特征。其中，负荷需求的特征值最大，数值分布方差显著高于其他特征，Shapley值大量聚集在平均值以下。蓝色的小负荷需求对模型预测结果带来正向的影响，反之红色的大负荷需求是负向影响，该颜色分布表明，负荷需求越高，系统惯量值越大，与电力系统实际运行的认知一致。

以负荷需求和光伏功率特征为例，图5和图6进一步展示各自Shapley值与特征自身数值的关系。可以发现，负荷需求小于35000MW时，该特征的Shapley值与特征成负相关，说明随着负荷需求的增加模型对系统惯量值呈现降低的预测趋势。光伏出力为0时，特征的Shapley值小于0，表示此时系统惯量值更可能低于基准值。从物理意义的角度看，负荷需求增加系统惯量呈增加趋势，说明更多的同步机组被启动，但当负荷需求进一步增加，瞬间的功率缺口给电网运行带来负担，系统可能面临低惯量的风险；光伏资源匮乏时，等效的系统惯量呈减少趋势。

从局部的角度来看，选择该年12月31日0点和12点的样本对其进行解释，通过SHAP解释有助于理解输入特征如何进行预测，两个时刻的预测结果分别是图7和图8，图中红色的特征表示其Shapley值为正，会给预测值带来正向的贡献，即增大系统惯量的预测值，且色块的面积越大意味着对模型结果的影响越大。0点负荷需求带来的正向影响最大，光伏功率带来的负向影响最大，模型预测的输出结果为5.559高于预测基准值5.378，说明此时系统不处于低惯量水平。相反12点光伏功率带来的正向影响最大，负荷需求带来的负向影响最大，12点模型预测输出结果低于预测基准值，系统惯量有进一步下降的趋势，严重时存在低惯量运行场景下切负荷/切机风险。

结合图5和图6所反映的特征正负相关性趋势分析，图7和图8中0点与12点负荷需求以35000MW界，分别为27708MW和37190MW，使模型对相应样本预测惯量值增加了0.160和减少了0.142。在不同样本个体中，特征对于模型决策影响存在差异，但负荷需求和光伏特征等全局重要性较高的特征对不同样本个体的预测结果影响均较大，与图4结论一致。

Claims

1.基于SHAP-XGBoost算法的电力系统惯量短期预测方法，其特征在于包括以下步骤：

步骤1：确定电力系统短期惯量预测输入特征，构建基于XGBoost的短期惯量预测学习模型；

步骤2：基于步骤1建立的短期惯量预测学习模型，提出基于SHAP-XGBoost的解释性学习算法，实现所述短期惯量预测学习模型的深度学习；

2.根据权利要求1所述基于SHAP-XGBoost算法的电力系统惯量短期预测方法，其特征在于：所述步骤1中，首先基于广域测量管理系统WAMS采集历史数据，提取影响系统惯量预测的相关物理量作为输入特征，作为预测学习模型训练的数据集；

Y＝[y₁,y₂,…,y_n]^T (2)；

式中，X是输入样本数据集；Y是输出样本数据集；上标m是输入特征的维度；下标n是输入样本的数目；其中，X的每一行表示一个输入样本；

依据系统有功-频率动态变化中电力系统惯量响应方程，如式(3)所示，选取合适的特征；

式(3)中，H_sys和D_sys分别为系统惯量、系统阻尼，△P是系统功率变化率，△f_COI是惯量中心频率偏差；由式(3)知，影响系统惯性的因素有频率和各类能源的有功功率；因此，在选取输入特征的时候考虑系统频率和负荷需求。

3.根据权利要求1所述基于SHAP-XGBoost算法的电力系统惯量短期预测方法，其特征在于：所述步骤1中，基于XGBoost的短期惯量预测学习模型，具体如下：

XGBoost采用CART(Classification and Regression Tree)作为基学习器，具体如式(4)所示：

式中：

为模型预测值；x_i为第i个样本；f_k为空间中的一个独立函数；F为所有CART组成的函数空间；XGBoost在损失函数中加入正则化项防止过拟合，其目标函数如下所示：

式(5)中：第一项表示预测值和实际值之间的误差，第二项为正则化项；

式(6)中：T是叶子节点数；ω_j是叶子节点权重；γ和λ是预先给定的超参数，分别用于控制叶子节点的个数和分数；由于目标函数的优化参数是树模型，故将其迭代分解成树学习过程；在保持原模型不变的前提下，采用增量训练的方式以最小化目标函数，每次迭代后更新目标函数为：

二阶泰勒展开将式(7)转换为关于自变量ω_j的一元二次函数的形式；

令

I_j是节点j的样本集，得到最优解

和对应的最优目标函数值为：

4.根据权利要求1所述基于SHAP-XGBoost算法的电力系统惯量短期预测方法，其特征在于：所述步骤2中，利用SHAP嵌套XGBoost方法筛选变量，SHAP是基于Shapley value的计算，用于衡量特征如何影响因变量，从一个初始朴素模型开始，基于样本集中观测值得误差，建立新模型进行拟合，并以加法形式添加至现有模型，反复迭代此过程形成集成模型。

5.根据权利要求4所述基于SHAP-XGBoost算法的电力系统惯量短期预测方法，其特征在于：步骤2包括如下步骤：

式(11)中，e^-g(x′)表示一个以自然常数e为底的指数函数；

S2.2：设g代表解释模型，SHAP将解释模型描述为样本预测的基准值φ₀与所有输入特征Shapley值之和的形式如式(12)所示：

式(12)中：φ_j是样本第j个特征的Shapley值；m是样本的特征数目；x^′j∈{0,1}^m表示特征x^j是否存在；

式(13)中：z是样本的全体特征向量的集合，

x¹,x²,…,x^m代表的就是m个不同的特征向量；

z_\j是z中不含特征x^j的特征子集；F_x(z)是可解释性XGBoost模型对于样本x输入特征为z时得到的预测输出，F_x(z)与F_x(z_\i)之差为特征x^j对预测结果的贡献；

6.根据权利要求5所述基于SHAP-XGBoost算法的电力系统惯量短期预测方法，其特征在于：所述步骤3包括如下步骤：

S3.1：构建电力系统短期惯量预测框架，将经由预处理过后的数据集划分为训练集与测试集，通过读取数据、参数设置过程，训练可解释性XGBoost模型；

7.根据权利要求6所述基于SHAP-XGBoost算法的电力系统惯量短期预测方法，其特征在于：从全局和局部两个维度对电力系统惯量短期预测模型进行解释分析，表示为：

8.根据权利要求6所述基于SHAP-XGBoost算法的电力系统惯量短期预测方法，其特征在于：还包括：

S3.4：对于经由电力系统惯量短期预测模型预测出的结果，使用平均绝对误差(MeanAbsolute Error，MAE)、均方误差(Mean Squared Error，MSE)、平均绝对百分比误差(MeanAbsolute Percentage Error，MAPE)和决定系数(Coefficient of Determination，R²)几种方法进行评价，如式(14)～式(17)所示：

式中，i为样本编号；n为样本数量；

为预测得到的系统惯量值；y_i为系统惯量的实际值；其中，MAE、MSE、MAPE越小，表示模型拟合效果越好，R²越大表示模型拟合效果越好。