CN116702629B

CN116702629B - 一种具备可迁移能力的电力系统暂态稳定评估方法

Info

Publication number: CN116702629B
Application number: CN202310973064.9A
Authority: CN
Inventors: 曲莹; 李�瑞; 刘新元; 牛哲文; 程雪婷; 张谦; 庞硕; 韩肖清; 郝捷; 王玮茹; 高宏; 武宇翔; 冀岳; 薄利明; 崔校瑞; 张颖; 暴悦爽; 芦耀辉; 李梓豪
Original assignee: State Grid Electric Power Research Institute Of Sepc; Taiyuan University of Technology
Current assignee: State Grid Electric Power Research Institute Of Sepc; Taiyuan University of Technology
Priority date: 2023-08-04
Filing date: 2023-08-04
Publication date: 2023-10-10
Anticipated expiration: 2043-08-04
Also published as: CN116702629A

Abstract

本发明公开了一种具备可迁移能力的电力系统暂态稳定评估方法，涉及电力系统的人工智能应用领域。首先，通过时域仿真软件PSASP生成反映不同潮流运行方式与故障条件的原始数据集，提取暂态电气量作为输入特征；将数据集随机划分为训练集与测试集，训练集用于XGBoost模型的构建，测试集用于评估模型性能，并根据测试结果对模型参数进行调整；同时，分别对原始样本集和模型参数进行目标域下的迁移，在目标域的测试集下对模型的泛化能力进行验证；在线应用时，基于PMU提供的实时量测信息进行特征筛选，即可快速判定系统的暂态功角稳定性。本发明在模型泛化能力、数据预处理及模型训练方面，均取得了大幅度的进步。

Description

一种具备可迁移能力的电力系统暂态稳定评估方法

技术领域

本发明涉及电力系统的人工智能应用领域，具体为一种具备可迁移能力的电力系统暂态稳定评估方法。

背景技术

新能源快速发展为传统电力系统稳定带来严峻考验，新型电力系统呈现高比例新能源、高比例电力电子化的特点，电网不确定性急剧增长，因此快速、准确地识别系统运行状态对保障电力系统安全稳定至关重要。传统的时域仿真法虽然可以精确定位故障，但随着电网规模的增大，系统高维非线性的特点使计算复杂度和时间近乎成指数增长，且对不同电力网络，需要重新建模。因此急需引入能兼具快速性、准确性和普适性的暂态稳定评估（transient stability assessment, TSA）方法。

随着人工智能技术和同步相量测量单元（phase measurement unit, PMU）等量测工具的快速普及，为研究基于数据驱动的电力系统暂态稳定评估提供了支撑，不少学者在算法和数据上作了研究。在算法方面，文献（李淼,雷鸣,周挺等.基于深度森林的电力系统暂态稳定评估方法[J].电测与仪表,2021,58(02):53-58）使用深度随机森林作为分类模型，与深度神经网络相比，参数设置简单、训练速度更快，抗过拟合能力强；文献（田芳,周孝信,于之虹.基于支持向量机综合分类模型和关键样本集的电力系统暂态稳定评估[J].电力系统保护与控制,2017,45(22):1-8）基于关键样本集构建了支持向量机，减少了将失稳样本判定为稳定的样本数；文献（孙黎霞,白景涛,周照宇等.基于双向长短期记忆网络的电力系统暂态稳定评估[J].电力系统自动化,2020,44(13):64-72）依据电力系统暂态过程数据的时序特性构建了双向长短期记忆网络，建立了底层量测数据与电力系统暂态稳定类别之间的非线性映射关系。但现有研究普遍未考虑到因样本不均衡导致模型误判率的增大，而少数类样本往往对模型决策边界起重要作用，严重影响暂态稳定评估结果的可靠性（刘书池,刘颂凯,张磊等.考虑样本不平衡的电力系统鲁棒暂态稳定评估[J].智慧电力,2022,50(07):16-22+73），同时当系统拓扑结构和运行工况发生改变时，缺少自适应的泛化能力，无法满足在线评估的快速性要求。

在数据方面，PMU实时采集到的电网信息通常含有部分噪声，使量测数据与真实值之间存在随机误差，增加了TSA模型过拟合的风险，选择高质量的输入特征是实现准确评估的前提，详情请见（杜一星,胡志坚,陈纬楠等.基于改进CatBoost的电力系统暂态稳定评估方法[J].电力自动化设备,2021,41(12):115-122）。文献（卢锦玲,郭鲁豫.基于改进深度残差收缩网络的电力系统暂态稳定评估[J].电工技术学报, 2021,36(11):2233-2244）通过注意力机制，采用软阈值函数自动学习噪声阈值，减小噪声及无关特征干扰；文献（温涛,张敏,王怀远.基于堆叠稀疏降噪自编码器的暂态稳定评估模型[J].电力工程技术,2022,41(01):207-212）利用堆叠稀疏降噪自编码器减少了输入数据中的噪声对特征提取的干扰，增强了模型的鲁棒性；文献（杨东升,吉明佳,周博文等.基于双生成器生成对抗网络的电力系统暂态稳定评估方法[J].电网技术,2021,45(08):2934-2945）通过交替训练学习暂态数据的分布特性,批量生成符合真实分布的新样本,解决了样本多样性不足的问题；文献（周挺,杨军,周强明等.基于改进LightGBM的电力系统暂态稳定评估方法[J].电网技术,2019,43(06):1931-1940.）引入直方图算法对原始数据进行离散化以增强模型对噪声的鲁棒性，在噪声干扰的环境下降低了过拟合风险。然而，未能从根本上对离群值和异常值进行检测，且无法保证人工拟合生成的样本符合原时间序列分布，容易对模型暂态稳定评估结果产生干扰。

基于上述分析，目前基于人工智能技术的电力系统暂态稳定评估方法主要在数据处理、算法精度、可迁移能力方面存在瓶颈，限制了其大规模在线评估应用：（1）在特征提取层面，现有同步向量量测（phasor measurement unit, PMU）实时采集到的电网信息通常含有部分噪声，使量测数据与真实值之间存在随机误差，增加了暂态稳定评估模型过拟合的风险，选择高质量的输入特征是实现准确评估的前提。然而，现有研究普遍未能从根本上对离群值和异常值进行检测，且无法保证人工拟合生成的样本符合原时间序列分布，容易对模型暂态稳定评估结果产生干扰；（2）在模型算法精度方面，现有方法普遍未考虑到因样本不均衡导致模型误判率的增大，而少数类样本往往对模型决策边界起重要作用，缺乏对重要样本的着重关注，尤其在实际电网中，稳定样本数远多于失稳样本，容易引起模型的漏判，造成大规模断电等一系列连锁故障；（3）在迁移能力方面，受负荷功率及新能源出力波动影响，潮流运行方式处于动态变化中，且当发生故障时，为防止故障进一步扩散，通常采取切机切负荷的措施。因此，当系统拓扑结构和运行工况发生改变时，现有算法通常需要重新离线训练，缺少自适应的泛化能力，无法满足在线评估的快速性要求。因此需要改进现有的电力系统暂态稳定评估方法。

发明内容

本发明为了解决背景技术中所存在的问题，提供了一种具备可迁移能力的电力系统暂态稳定评估方法。

本发明是通过如下技术方案来实现的：本发明应用数据驱动思想、样本增强的数据预处理方法和模型—样本迁移方法，研究动态变化下的电力系统暂态稳定性。总体方案包括离线训练及在线训练两部分，为保障电力系统暂态稳定提供了支撑手段和分析参考方法。

一种具备可迁移能力的电力系统暂态稳定评估方法，包括如下步骤：

阶段一：特征选择与数据预处理：

1）特征选择：输入特征的选取和构建会直接影响暂态稳定评估模型的评估性能；现有研究中的暂态稳定特征集可分为2种：第一种是基于专家知识，考虑暂态过程中能全面反映系统动态特征的状态量，运用经过数学运算得到的组合特征，但计算复杂，无法保证在线评估的即时性；第二种是直接使用PMU的时序量测数据作为输入，可以减少因人工介入带来的主观性，提升算法的计算速度；本发明旨在构建一种可以面向底层测量数据进行在线分析的TSA模型，为保证涵盖暂态信息的全面性，选择母线电压幅值、相角，发电机功角、角速度、有功功率、无功功率，交流线路有功、无功功率，负荷有功功率、无功功率作为初始输入特征，这些电气量均通过PMU直接获得；

2）标签构建：对于电力系统TSA问题，通常归类为二分类问题，本发明引入系统经过大扰动后暂态功角稳定评估指标T_SI(transient stability index，TSI)，如公式（1）所示：

（1）

式中：为任意时刻两台发电机间最大功角差；当<360°，即T_SI>0时，系统暂态稳定，此时样本标注为0；反之，系统暂态失稳，将样本标签设置为1；

3）数据降噪：PMU提取的时间序列包含离群值和异常值，本发明采用梯度检测法，滑动时间窗口大小设置为5，在每段中筛选出梯度变化最小的样本点；避免极端数据对样本预测的干扰，同时显著降低了样本维度；

阶段二：基于不平衡样本交叉熵的损失函数改进方法，即基于交叉熵损失函数改进的XGBoost模型：

1）含正则项的XGBoost：XGBoost是由若干基模型并行运算的集成算法，其目标函数O_bj由模型的损失函数L与抑制模型复杂度的正则项组成，如公式（2）所示：

（2）

式中：i表示样本，t表示基模型，表示第i个样本的预测值，表示第i个样本的真实值，L为损失函数，n为样本容量，k为迭代次数，为各基础模型的复杂度；

取损失函数为平方损失或逻辑损失；将基模型取为决策树时，模型的复杂度由叶子数及叶子节点的权重决定；将损失函数取为平方损失并通过泰勒展开进行简化，得到目标函数为：

（3）

（4）

（5）

式中：T为树模型的个数，和是为了防止模型过拟合的正则化系数；

求每个节点每个样本的一阶导数和二阶导数，然后针对每个节点对所含样本求和得到的和，最后遍历决策树的节点即可得到目标函数；为评估各树结构的好坏，采取精确贪心(exact greedy, EG)算法，当树分裂节点时，通过计算公式（6）来判断：

（6）

式中：为若分裂左节点得到的损失值，为若分裂右节点得到的损失值，为若不分裂节点通过父节点得到的损失值；如果大于0，则继续分裂该节点，否则停止分裂；

2）损失函数改进：交叉熵CE (cross entropy)是机器学习领域最常用的损失函数之一，在分类任务中常被用于指导模型训练，其公式为：

（7）

由公式（7）可知，当与的距离越远时，的值越大，对模型设置的惩罚项越大；在实际电力系统中，暂态失稳样本远少于稳定样本，导致模型更加侧重预测稳定样本，从而增大对不稳定样本的误判。对于此类样本不均衡问题，目前主要有2种方法：在数据层面，采用包括超采样、欠采样以及数据增强等方法；在算法层面，使用加权损失函数等方式，本发明通过引入焦点损失函数对进行改进，公式如下：

（8）

式中：(0,1)为平衡因子，用于平衡多数类和少数类样本的比例；[0,+∞]为调制因子，可以减少多数类样本的损失函数值，从而扩大少数样本与多数样本的损失函数值差距，使得模型增强对少数样本的权重；其余各参数与公式（7）中的定义保持一致；

3）模型性能评估指标：即关注模型对失稳样本的识别能力；准确率是评价机器学习模型性能最常用的指标，但无法体现对少数类别样本的重视程度。在实际应用中，忽视失稳样本的判定将可能引发大规模连锁故障，造成比将稳定样本错判为失稳样本更严重的后果，因此需要额外关注模型对失稳样本的识别能力，而不能用单一的总体准确率指标衡量暂态电压稳定评估模型的性能。定义暂态功角稳定评估的混淆矩阵为，、、、分别表示正确预测稳定、正确预测失稳、稳定错误预测为失稳、失稳预测为稳定的样本数量；据此定义模型性能评估指标准确率、误判率和召回率如公式（9）-（11）所示：

（9）

（10）

（11）

阶段三：基于模型参数和样本增强的迁移学习：

数据驱动的暂态稳定评估方法，在训练时仅针对所研究的特定拓扑结构和工况。而当拓扑结构或运行方式发生较大变化时，针对拓扑变化前训练得到的分类模型很可能不再适用。实际电网规模庞大，运行方式多样，重新训练适合当前运行方式的样本难以满足在线实时评估的要求。因此，本发明通过迁移学习微调原评估模型的参数，使其能够在新的运行方式下仍然具有较好的评估效果。

参数微调是模型迁移的一种方法，将源域中已训练好的模型网络结构和参数全部迁移至新的模型，即作为目标域下新模型的初始值，可降低薪模型的训练时间；在模型迁移的基础上，利用目标域的新训练集微调网络，快速得到适用于新工况的分类模型；迁移方案的实施离不开目标域下的新样本集，为了减少新工况样本生成时间并降低目标域样本数量，本发明首先结合相似拓扑结构生成源域下的样本，然后利用样本迁移将原系统中的数据处理后应用于目标域系统；从源系统中筛选可用于迁移样本的计算公式如式（12）所示：

（12）

式中：为用于迁移的样本集；为欧氏距离计算函数；Z为源域样本的输入特征；l为源域样本状态标签；为预设常数；T为目标域样本集；

当样本子集中所有元素和目标域样本集的小于阈值时，对应的样本子集可作为迁移样本集；将和在线生成的部分样本合并，为保证目标域数据分布与所合成的数据分布基本一致，通过交叉熵CE对失稳样本进行增强，最终得到适用于目标域系统的暂态稳定预测模型，有效地解决了迁移学习的样本生成耗时和样本选择问题。

本发明所述方法，首先，通过时域仿真软件PSASP生成反映不同潮流运行方式与故障条件的原始数据集，提取暂态电气量作为输入特征；将数据集随机划分为训练集与测试集，训练集用于 XGBoost模型的构建，测试集用于评估模型性能，并根据测试结果对模型参数进行调整；同时，分别对原始样本集和模型参数进行目标域下的迁移，在目标域的测试集下对模型的泛化能力进行验证；在线应用时，基于PMU提供的实时量测信息进行特征筛选，即可快速判定系统的暂态功角稳定性。

与现有技术相比本发明具有以下有益效果：本发明所提供的一种具备可迁移能力的电力系统暂态稳定评估方法，（1）在模型泛化能力方面，当系统拓扑结构和运行方式发生改变时，所提出的基于模型参数和样本增强的迁移学习方法，具有较强的自适应能力，各项评估指标相比未调整和样本迁移方法得到明显改善，并且计算速度明显提高，能够满足在线评估要求，相较于传统的样本迁移，具有更强的适应能力；（2）在数据预处理方面，梯度检测法降低了因噪声干扰产生的极端数据，交叉熵改进方法通过指导模型增强对少数类失稳样本的关注，与现有机器学习方法相比，显著提升了评估的准确率；（3）在模型训练方面，基于交叉熵改进了损失函数，使模型增强对少数失稳样本的关注度，提升决策边界分类能力。

附图说明

图1是本发明所提出的技术方案流程图。

图2是本发明所提出的基于梯度检测的样本去噪效果图。

图3是不同模型训练效果随迭代次数变化关系。

具体实施方式

以下结合具体实施例对本发明作进一步说明。

本实施例针对拓扑结构变化的场景，针对IEEE 39节点系统，为了增强断线故障或紧急控制后系统结构发生改变情况的适应性，对其拓扑结构进行修改，新增3处目标场景，其拓扑变化及仿真设置如表1所示。

表1

本实施例所采用的一种具备可迁移能力的电力系统暂态稳定评估方法，如图1所示，包括如下步骤：

阶段一：特征选择与数据预处理：

1）特征选择：输入特征的选取和构建会直接影响暂态稳定评估模型的评估性能；现有研究中的暂态稳定特征集可分为2种：第一种是基于专家知识，考虑暂态过程中能全面反映系统动态特征的状态量，运用经过数学运算得到的组合特征，但计算复杂，无法保证在线评估的即时性；第二种是直接使用PMU的时序量测数据作为输入，可以减少因人工介入带来的主观性，提升算法的计算速度；本实施例旨在构建一种可以面向底层测量数据进行在线分析的TSA模型，为保证涵盖暂态信息的全面性，选择母线电压幅值、相角，发电机功角、角速度、有功功率、无功功率，交流线路有功、无功功率，负荷有功功率、无功功率作为初始输入特征，这些电气量均通过PMU直接获得；

2）标签构建：对于电力系统TSA问题，通常归类为二分类问题，本实施例引入系统经过大扰动后暂态功角稳定评估指标T_SI，如公式（1）所示：

（1）

3）数据降噪：PMU提取的时间序列包含离群值和异常值，本实施例采用梯度检测法，滑动时间窗口大小设置为5，在每段中筛选出梯度变化最小的样本点；避免极端数据对样本预测的干扰，如图2所示，同时显著降低了样本维度；

（2）

（3）

（4）

（5）

求每个节点每个样本的一阶导数和二阶导数，然后针对每个节点对所含样本求和得到的和，最后遍历决策树的节点即可得到目标函数；为评估各树结构的好坏，采取精确贪心EG算法，当树分裂节点时，通过计算公式（6）来判断：

（6）

2）损失函数改进：交叉熵CE是机器学习领域最常用的损失函数之一，在分类任务中常被用于指导模型训练，其公式为：

（7）

由公式（7）可知，当与的距离越远时，的值越大，对模型设置的惩罚项越大；在实际电力系统中，暂态失稳样本远少于稳定样本，导致模型更加侧重预测稳定样本，从而增大对不稳定样本的误判。对于此类样本不均衡问题，目前主要有2种方法：在数据层面，采用包括超采样、欠采样以及数据增强等方法；在算法层面，使用加权损失函数等方式，本实施例通过引入焦点损失函数对进行改进，公式如下：

（8）

3）模型性能评估指标：即关注模型对失稳样本的识别能力；准确率是评价机器学习模型性能最常用的指标，但无法体现对少数类别样本的重视程度。在实际应用中，忽视失稳样本的判定将可能引发大规模连锁故障，造成比将稳定样本错判为失稳样本更严重的后果，因此需要额外关注模型对失稳样本的识别能力，而不能用单一的总体准确率指标衡量暂态电压稳定评估模型的性能。定义暂态功角稳定评估的混淆矩阵为，且如表2 所示。

表2

、、、分别表示正确预测稳定、正确预测失稳、稳定错误预测为失稳、失稳预测为稳定的样本数量；据此定义模型性能评估指标准确率、误判率和召回率如公式（9）-（11）所示：

（9）

（10）

（11）

阶段三：基于模型参数和样本增强的迁移学习：

数据驱动的暂态稳定评估方法，在训练时仅针对所研究的特定拓扑结构和工况。而当拓扑结构或运行方式发生较大变化时，针对拓扑变化前训练得到的分类模型很可能不再适用。实际电网规模庞大，运行方式多样，重新训练适合当前运行方式的样本难以满足在线实时评估的要求。因此，本实施例通过迁移学习微调原评估模型的参数，使其能够在新的运行方式下仍然具有较好的评估效果。

参数微调是模型迁移的一种方法，将源域中已训练好的模型网络结构和参数全部迁移至新的模型，即作为目标域下新模型的初始值，可降低薪模型的训练时间；在模型迁移的基础上，利用目标域的新训练集微调网络，快速得到适用于新工况的分类模型；迁移方案的实施离不开目标域下的新样本集，为了减少新工况样本生成时间并降低目标域样本数量，本实施例首先结合相似拓扑结构生成源域下的样本，然后利用样本迁移将原系统中的数据处理后应用于目标域系统；从源系统中筛选可用于迁移样本的计算公式如式（12）所示：

（12）

当样本子集中所有元素和目标域样本集的小于阈值时，对应的样本子集可作为迁移样本集；将和在线生成的部分样本合并，为保证目标域数据分布与所合成的数据分布基本一致，通过交叉熵CE对失稳样本进行增强，最终得到适用于目标域系统的暂态稳定预测模型。

针对不同的拓扑结构，采用本实施例所涉及的样本迁移方法设置合适的，生成 3000个训练样本，1200个测试样本。将迁移前、样本集微调以及本实施例所提样本—模型迁移方法的性能效果进行对比，测试结果如表3所示；针对运行工况变化的场景，在相同拓扑结构条件下设置发电机、负荷水平变化情况如表4所示，每种工况下生成3000个训练样本， 1200个测试样本。将迁移前、样本集微调以及本实施例所提样本—模型迁移方法的性能效果进行对比，测试结果如表5所示。为比较所涉及迁移方法在训练时间成本上的优越性，将所提方法和重新训练各阶段的耗时对比如表6所示。

表3

表4

表5

表6

表7对比了常用机器学习模型人工神经网络、多层感知机、随机森林、支持向量机与本发明所提改进XGBoost模型的评估性能，图3为不同模型评估准确率随迭代次数变化的关系，可见本发明所提模型的各项指标相较于传统机器学习方法均达到最优。

表7

本发明要求保护的范围不限于以上具体实施方式，而且对于本领域技术人员而言，本发明可以有多种变形和更改，凡在本发明的构思与原则之内所作的任何修改、改进和等同替换都应包含在本发明的保护范围之内。

Claims

1.一种具备可迁移能力的电力系统暂态稳定评估方法，其特征在于：包括如下步骤：

阶段一：特征选择与数据预处理：

1）特征选择：选取和构建输入特征，由于所要构建的模型目的为面向底层测量数据进行在线分析的TSA模型，选择母线电压幅值、相角，发电机功角、角速度、有功功率、无功功率，交流线路有功、无功功率，负荷有功功率、无功功率作为初始输入特征，这些电气量均通过PMU直接获得；

2）标签构建：对于电力系统TSA问题，引入系统经过大扰动后暂态功角稳定评估指标T_SI，如公式（1）所示：

（1）

式中：为任意时刻两台发电机间最大功角差；当/><360°，即T_SI>0时，系统暂态稳定，此时样本标注为0；反之，系统暂态失稳，将样本标签设置为1；

3）数据降噪：PMU提取的时间序列采用梯度检测法，滑动时间窗口大小设置为5，在每段中筛选出梯度变化最小的样本点；

（2）

式中：i表示样本，t表示基模型，表示第i个样本的预测值，/>表示第i个样本的真实值，L为损失函数，n为样本容量，k为迭代次数，/>为各基础模型的复杂度；

（3）

（4）

（5）

式中：T为树模型的个数，和/>是为了防止模型过拟合的正则化系数；

求每个节点每个样本的一阶导数和二阶导数/>，然后针对每个节点对所含样本求和得到的/>和/>，最后遍历决策树的节点即可得到目标函数；为评估各树结构的好坏，采取精确贪心EG算法，当树分裂节点时，通过计算公式（6）来判断：

（6）

式中：为若分裂左节点得到的损失值，/>为若分裂右节点得到的损失值，/>为若不分裂节点通过父节点得到的损失值；如果/>大于0，则继续分裂该节点，否则停止分裂；

2）损失函数改进：采用交叉熵CE作为机器学习领域的损失函数，其公式为：

（7）

由公式（7）可知，当与/>的距离越远时，/>的值越大，对模型设置的惩罚项越大；通过引入焦点损失函数对/>进行改进，公式如下：

（8）

式中：(0,1)为平衡因子，用于平衡多数类和少数类样本的比例；/>[0,+∞]为调制因子，可以减少多数类样本的损失函数值，从而扩大少数样本与多数样本的损失函数值差距，使得模型增强对少数样本的权重；其余各参数与公式（7）中的定义保持一致；

3）模型性能评估指标：即关注模型对失稳样本的识别能力；定义暂态功角稳定评估的混淆矩阵为，/>、/>、/>、/>分别表示正确预测稳定、正确预测失稳、稳定错误预测为失稳、失稳预测为稳定的样本数量；据此定义模型性能评估指标准确率、误判率和召回率如公式（9）-（11）所示：

（9）

（10）

（11）

阶段三：基于模型参数和样本增强的迁移学习：

通过迁移学习微调原评估模型的参数，使在拓扑结构或运行方式发生变化时，仍然适用；参数微调是模型迁移的一种方法，将源域中已训练好的模型网络结构和参数全部迁移至新的模型，即作为目标域下新模型的初始值；在模型迁移的基础上，利用目标域的新训练集微调网络，快速得到适用于新工况的分类模型；首先结合相似拓扑结构生成源域下的样本，然后利用样本迁移将原系统中的数据处理后应用于目标域系统；从源系统中筛选可用于迁移样本的计算公式如式（12）所示：

（12）

式中：为用于迁移的样本集；/>为欧氏距离计算函数；Z为源域样本的输入特征；l为源域样本状态标签；/>为预设常数；T为目标域样本集；

当样本子集中所有元素和目标域样本集的小于阈值时，对应的样本子集可作为迁移样本集；将/>和在线生成的部分样本合并，为保证目标域数据分布与所合成的数据分布一致，通过交叉熵CE对失稳样本进行增强，最终得到适用于目标域系统的暂态稳定预测模型。