CN114240069A

CN114240069A - 一种基于回归学习与特征挖掘的电网在线风险计算方法

Info

Publication number: CN114240069A
Application number: CN202111406653.6A
Authority: CN
Inventors: 王天昊; 刘伟; 鄂志君; 马世乾; 董紫珩; 侯恺; 李振斌; 刘颂; 范瑞卿; 王珍珍; 马钢; 于光耀; 杨帮宇; 王坤; 宋国辰
Original assignee: State Grid Corp of China SGCC; State Grid Tianjin Electric Power Co Ltd; Electric Power Research Institute of State Grid Tianjin Electric Power Co Ltd
Current assignee: State Grid Corp of China SGCC; State Grid Tianjin Electric Power Co Ltd; Electric Power Research Institute of State Grid Tianjin Electric Power Co Ltd
Priority date: 2021-11-24
Filing date: 2021-11-24
Publication date: 2022-03-25

Abstract

本发明涉及一种基于回归学习与特征挖掘的电网在线风险计算方法，包括以下步骤：步骤1、基于离线建模的数据收集；步骤2、基于多目标粒子群的特征变量的选择；步骤3、基于改进蚁群算法选择SVM模型最适参数；步骤4、结合训练模型的关键参数建立回归向量机模型，使用特征筛选后的模型驱动获取的数据输入回归模型进行一次离线训练；步骤5、根据步骤2的结果对系统运行状态进行特征筛选并输入复用网络即可获取相应状态下的节点停电风险；再根据节点风险与状态概率进行加权求和，获得年化期望风险指标。本发明所覆盖的运行状态更加全面，能更充分反映系统不确定信息，使评估结果更具有系统全局性。

Description

一种基于回归学习与特征挖掘的电网在线风险计算方法

技术领域

本发明属于电力系统运行风险实时评估技术领域，涉及电网在线风险计算方法，尤其是一种基于回归学习与特征挖掘的电网在线风险计算方法。

背景技术

现代电力系统集成了监控和数据采集(SCADA)以及相量测量单元(PMU)等设备数据采集系统，在给电力系统的运行与控制提供更多电力系统信息的同时，这些海量数据也为电力系统数据处理的实时性与数据挖掘能力提出了更高要求。现代电力系统的规模和复杂度逐渐升高，传统基于模型的方法的建模难度与求解模型的难度也随之提升；现代电力系统更多运行在接近极限的情况下[1]，系统在面临扰动和异动的运行状况下面临更高的风险。由于现代电力系统的以上三个表现，有必要寻求一种充分利用电力系统数据信息对电力系统快速精准地建立实时风险评估与提供超前风险预警。人工智能与机器学习技术近年来不断的成熟与发展，能够提供一种脱离系统建模的风险计算方法，在实时运算、对抗噪声、鲁棒计算方面具有更突出的优势[2]。

运行风险评估基于对预想事故状态下系统的状态分析，重点关注威胁系统稳定安全运行的电压越限、线路过载等不安全因素，从而采取切削负荷的方式来保证安全运行。因此，风险评估需要对电力系统N在N-1\N-2系统条件的大量非线性潮流方程进行逐一求解，计算量很大，通常是离线求解。而对于现代电力系统，特别是考虑可再生能源具有高度的随机性，系统的运行状态在短时间内可能经理多种运行状态的变化，这就对系统运行风险的评估速度提出了更高要求。

当前，对于电网风险评估的思路可以分为两大类，即基于模型驱动的风险评估和基于数据驱动的风险评估：模型驱动的风险评估方法通常包括系统状态生成、系统状态评估、可靠性指标计算等主要步骤。其中，系统状态生成通常采用蒙特卡洛模拟法和状态枚举法。但无论是状态枚举法还是蒙特卡洛法，均需要对大量系统故障状态进行分析计算，才能得到满足精度要求的风险指标，其计算效率偏低，尤其在运行风险评估和在线决策时，计算效率往往很难满足实时性要求。系统状态生成之后，需要对每一个系统状态进行潮流分析；最后，在风险指标计算环节，通过定量计算可靠性指标以准确度量系统的实际运行风险水平。但是，由于系统的复杂性和庞大性，风险指标目前无法由单一指标进行表征，如何准确建立反映系统或元件的各类风险指标，以及在多个侧面建立科学且全面的风险指标体系，需要更加深入的探讨和研究。

综上所述，模型驱动的风险评估方法是目前主流思路，国内外对模型驱动的电力系统风险评估技术已有了深入讨论，但现有方法难以快速处理风险评估所需的庞大系统状态集，因而难以满足在线应用的实时性要求。

因此，随着新一代人工智能的发展，以数据驱动的思想为基础，利用机器学习技术加速系统状态生成或系统状态评估环节，以提升运行风险评估的计算效率，为电力能源系统规划和运行决策都具有参考价值，已经成为电力系统领域研究技术人员有待解决的难题。

经检索，未发现与本发明相同或相近似的现有技术的文献。

发明内容

本发明的目的在于克服现有技术的不足，提出一种基于回归学习与特征挖掘的电网在线风险计算方法，所覆盖的运行状态更加全面，能更充分反映系统不确定信息，使评估结果更具有系统全局性。

本发明解决其现实问题是采取以下技术方案实现的：

一种基于回归学习与特征挖掘并计及时变运行状态的电力系统在线风险计算方法，包括以下步骤：

步骤1、基于离线建模的数据收集，获得测试数据集和训练数据集；

步骤2、基于多目标粒子群的特征变量的选择，以最小化特征数量和预测误差为目标，去除冗余；

步骤3、基于改进蚁群算法选择SVM模型最适参数，以进一步降低预测误差，提升风险评估精度；

步骤4、结合训练模型的关键参数建立回归向量机模型，使用特征筛选后的模型驱动获取的数据输入回归模型进行一次离线训练，即可快速建立系统运行状态与风险的关联关系；

步骤5、在线应用阶段，根据步骤2的结果对系统运行状态进行特征筛选并输入复用网络即可获取相应状态下的节点停电风险；再根据节点风险与状态概率进行加权求和，获得年化期望风险指标。

而且，所述步骤1的具体步骤包括：

(1)输入已知结构的电力系统相关的发电机可靠性参数、发电机设备出力、年负荷曲线的运行相关的参数，基于元件的可修复强迫失效二态模型建立系统元件不确定因素概率模型，依照公式(1)建立元件不可用率U，并依据该不确定因素概率模型和负荷需求年化曲线使用蒙特卡洛法进行系统状态抽样，生成运行状态集合；

其中，以年计量的MTTF和MTTR分别为故障前运行小时数和故障修复小时数。

(2)对每个运行状态进行最优潮流计算，以运行状态的节点注入能量、节点电压幅值、相角的关键电气信息作为输入数据，以节点负荷损失作为数据标签；所得的潮流结果与历史信息进行比对修正，综合建立状态大数据库；

输入数据由最优潮流计算获得或直接通过量测装置获取，包括发电机节点的有功出力、电压幅值、电压相角，以及源于历史负荷曲线的用能需求，构成如下形式的输入

[P_G1,P_G2…U_G1,U_G2…q_G1,q_G2…L_D1,L_D2…] (2)

以最小化供能风险为目标的最优潮流计算过程构建如下

目标函数

等式约束

P_i(V,q)-P_load,i+LC_i＝0,i∈N_D

Q_i(V,q)-Q_load,i＝0,i∈N_D (4)

不等式约束

P_G,i,min≤P_i(V,q)≤P_G,i,max,i∈N_G

Q_G,i,min≤Q_i(V,q)≤Q_G,i,max,i∈N_G

U_i,min≤U_i(V,q)≤U_i,max,i∈N_G∪N_D (5)

0≤LC_i≤P_load,i

T_k(V,q)≤T_k,max,k∈L

式中，LC为节点负荷削减的功率；下标i,k分别为节点编号与传输线路编号；集合N_D、N_G、L分别代表负荷节点集合、发电机节点集合、传输线路组成的集合；P、Q分别为节点的有功功率与无功功率，P_load、Q_load为相应节点的有功负荷与无功负荷，P_G、Q_G分别是节点的有功出力、无功出力；V、θ分别指电压幅值与电压相角，相量U_i为节点电压；T表示线路段的实际潮流(单位MVA)，T_max则为线路的容量上限。P_i、Q_i与T_k是节点电压幅值V与节点电压相角θ的函数，通过交流电力系统的潮流方程可得。

最优潮流通过matpower工具包进行求解，求取每个状态下的负荷损失量，同时保存潮流计算的电压相角、电压幅值等结果，比对PMU量测单元采集的有关状态下的数据再次进行潮流信息的修正，形成完整的电力系统运行数据-负荷损失风险大数据库；

(3)依据负荷损失情况将数据分为有风险数据集和无风险数据集的两类；

(4)从两类数据集中提取等量的数据，再按照7:3的比例重新分配为测试数据集与训练数据集，从而使得每个数据集中的有风险状态数量与无风险状态数量大致相当。

而且，所述步骤2的具体步骤包括：

(1)在通用的SVM回归模型中，输入训练集的原始特征数据；并根据训练集数据维度k，建立单位容量大小的k维超立方体空间；

(2)在单位体积超立方体的部分顶点位置上随机生成粒子，粒子坐标作为特征选择的保留指示位过滤训练集，从而为每个粒子建立对应的特征训练集。粒子在某一维度上的坐标v_i,j取值为1(或0)，表示第j维度的变量被/不被选作特征变量；

(3)输入每一个粒子坐标指示的特征训练集，训练得到不同的回归模型；

(4)适应度评估：以训练后回归模型在训练集上表现出的预测误差作为评价当前粒子的适应度要素，另一要素为粒子到原点的欧式距离，适应度

函数为二者的加权和，如下式；

其中，多项式第一部分为粒子群对应的回归器平均误差，第二个多项式F||表示特征指示变量的模长，即粒子到原点的欧氏距离；w₁,w₂分别是两部分的权重。

(5)根据适应度对粒子进行排序，本问题中以适应度函数最小的粒子坐标对应为最优历史位置，计入历史最优位置与所有粒子的综合最优历史位置权重r₁,r₂的形式求和，用于更新粒子速度v、粒子位置s；

其中，c₁,c₂,rand均为0，1之间服从均匀分布的随机变量，p_i*表示第i个粒子的历史最优位置，p_g*为全局所有粒子的综合最优历史位置，对应权重分别为r₁,r₂,s_i表示粒子位置，它是其速度矢量v_i的函数，v_i,j是粒子速度在第j个维度上的分量。

(6)判断平均适应度是否达到误差容限的要求，若当前误差过大，则以更新后的粒子位置作为新状态下的粒子分布，重复步骤2的(3)、(4)、(5)环节继续粒子寻优；若达到误差要求，则记录当前状态下的全局最优粒子坐标。进入步骤3；

而且，所述步骤2第(4)步所用到的回归学习的训练模型为支持向量回归模型，其数学关系可以表述为具体为：

y_i＝f(x_i)＝w^Th(x_i)+b (9)

其中，w,b是其中的权值和偏，其数值大小可以基于现有的数据集进行最优化拟合来确定，h(x)是一种非线性映射关系，可以拟合任意函数关系，其功能是将一维输入向量x_i映射到实值的输出y_i。对于ε-SV回归问题，学习目标是建立输入输出向量之间的尽可能平滑的函数映射关系y＝f(x)使得实际输出与目标输出

的误差在误差边界ε的范围内；所建立的函数的平滑性能够保证模型不会出现过拟合的问题，这便对于权重的欧几里得范数||w||²提出了最小化的要求。建立松弛变量来考虑预测偏差，因此，回归模型的学习目标可以转化为以下优化模型：

其中，z_i是第i个样本代入回归学习目标函数的实际值，C是与经验误差与泛化误差有关的罚系数，ζ，ζ’分别为向上和向下的松弛变量，ε为容许的误差限，回归学习的过程本质上是确定(9)的参数w,b，通过拉格朗日乘子λ建立对偶问题求解可得到w，再回代到(9)中得到的函数映射为：

其中，指数部分可以为径向基函数的核函数，因此，决定回归效果的关键参数为核参数γ，误差容限ε以及罚因子C。对于这些参数的优选对于网络展现的效果极为关键，将在后续部分的步骤3介绍用于优选这三个参数的蚁群算法。

而且，所述步骤3的具体步骤包括：

(1)确定蚁群算法的种群规模、信息素损失率等参数；

(2)对于本次参数优化问题，有三个参数有待搜索，所以问题维度为3，对于每个维度都对应一个不同的高斯核函数，即G1,G2,G3。

(3)在连续三维空间内随机生成蚁群，蚁群中每个蚂蚁个体的坐标用三维空间坐标值(三维向量)表示，三个维度j＝1,2,3分别代表回归向量机的支持向量机的核参数γ，误差容限ε以及罚因子C三个参数取值；每个维度都对应一个不同的高斯核函数G_j，具体由k个高斯子函数g_j ⁱ按照权重w_i叠加组成:

(4)n个蚂蚁个体坐标代表的γ、C、ε取值，对应构成n个不同的回归向量机，输入步骤2所得的特征向量和标签数据训练；

(5)训练完毕后以测试集上(N个样本)的均方误差作为评价蚁群的适应度函数，按照适应度排序并记录历史最优蚂蚁和当前种群的最优蚂蚁个体

(6)根据信息素更新位置：信息素的感知影响蚂蚁的移动，进而影响蚁群的位置分布，某一个蚂蚁个体接受到的整个蚁群的信息素等效影响可以通过个体与蚁群的平均距离计算。用信息素影响高斯概率分布的标准差可以模拟信息素对蚂蚁移动的影响，其作用关系式如下：

(7)判断训练后的模型应用在测试集上的误差是否达到设定的误差标准，若误差超过标准，则执行环节(8)；若误差满足要求，则保存最优蚂蚁个体的参数组成的坐标和相应的支持向量模型，进入步骤4；

(8)蚁群更新位置和当前最优，回到(4)重新对新阶段的蚁群训练n个支持向量回归器。

本发明的优点和有益效果：

1、本发明首先设计了基于离线建模的样本生成技术抽样并模拟系统不确定性运行状态，相比于单纯使用历史数据建立进行不确定性状态大数据库，所覆盖的运行状态更加全面，能更充分反映系统不确定信息，使评估结果更具有系统全局性。

2、状态大数据库建立完毕之后，本发明为训练数据的获取设计了类平衡等量抽取环节，该环节避免了产生局部过学习和局部欠学习，提升了本发明方法对于运行状态和系统风险的关联学习的泛化性能。

3、本发明随后在步骤2中基于多目标粒子群的优化技术对原始输入特征进行优选，设计以最小化特征数目与最小化映射误差为综合优化目标，从而使本发明方法在保证信息充分的情况下实现计算维度降低，从而减小存储规模并提升了训练、计算速度。

4、本发明在步骤2、步骤3中均设计了不同的优化算法改善运算准确性。步骤2中以最小化映射误差作为多目标粒子群问题的一个优化对象，步骤3基于改进蚁群算法专注于最小化预测误差的单一优化目标，分别通过特征向量和SVM回归器的超参数的优选两个角度提升系统风险的预测精度。

附图说明

图1是本发明的一种基于回归学习与特征挖掘的电网在线风险计算方法的处理流程图；

图2是本发明的在线风险计算测试系统示意图；

图3是本发明的算例系统负荷节点运行风险计算效果图；

图4是本发明的算例系统负荷节点运行风险计算效果图。

具体实施方式

以下对本发明实施例作进一步详述：

步骤1:基于离线建模的数据收集，获得测试数据集和训练数据集；

所述步骤1的具体步骤包括：

(1)输入已知结构的电力系统相关的发电机可靠性参数、发电机设备出力、年负荷曲线等运行相关的参数(见表1、表2、表3、表4)，基于元件的可修复强迫失效二态模型建立系统元件不确定因素概率模型，即依照公式(1)建立元件不可用率U，并依据该不确定因素概率模型和负荷需求年化曲线使用蒙特卡洛法进行系统状态抽样，生成运行状态集合；

其中以年计量的MTTF和MTTR分别为故障前运行小时数和故障修复小时数。

表1电网发电机容量与运行故障参数信息

表2周峰值负荷相对年峰值变化信息

表3每日峰值负荷相对周中峰值变化信息

表4每小时峰值负荷相对当日峰值变化信息

上述表格为所用示例系统的数据内容，包括电量供求和不确定因素信息，示例系统的网络结构属于其非数据信息，为节省篇幅在此以图片取代表格形式呈现，如附图2所示，展示的是步骤1中所涉及的系统拓扑信息。

(2)对每个运行状态进行最优潮流计算，以运行状态的节点注入能量、节点电压幅值、相角等关键电气信息作为输入数据，以节点负荷损失作为数据标签；所得的潮流结果与历史信息进行比对修正，综合建立状态大数据库。

输入数据可以由最优潮流计算获得或直接通过量测装置获取，故主要包括发电机节点的有功出力、电压幅值、电压相角，以及源于历史负荷曲线的用能需求，构成如下形式的输入

[P_G1,P_G2…U_G1,U_G2…q_G1,q_G2…L_D1,L_D2…] (2)

以最小化供能风险为目标的最优潮流计算过程构建如下

目标函数

等式约束

P_i(V,q)-P_load,i+LC_i＝0,i∈N_D

Q_i(V,q)-Q_load,i＝0,i∈N_D (4)

不等式约束

P_G,i,min≤P_i(V,q)≤P_G,i,max,i∈N_G

Q_G,i,min≤Q_i(V,q)≤Q_G,i,max,i∈N_G

U_i,min≤U_i(V,q)≤U_i,max,i∈N_G∪N_D (5)

0≤LC_i≤P_load,i

T_k(V,q)≤T_k,max,k∈L

最优潮流通过matpower工具包进行求解，求取每个状态下的负荷损失量，同时保存潮流计算的电压相角、电压幅值等结果，比对PMU量测单元采集的有关状态下的数据再次进行潮流信息的修正，形成完整的电力系统运行数据-负荷损失风险大数据库。

(4)从两类数据集中提取等量的数据，再按照7:3的比例重新分配为测试数据集与训练数据集，从而使得每个数据集中的有风险状态数量与无风险状态数量大致相当；

步骤2:基于多目标粒子群的特征变量的选择，以最小化特征数量和预测误差为目标，去除冗余；

所述步骤2的具体步骤包括：

(2)在单位体积超立方体的部分顶点位置上随机生成粒子，粒子坐标作为特征选择的保留指示位过滤训练集，从而为每个粒子建立对应的特征训练集。粒子在某一维度上的坐标v_i,j取值为1(或0)，表示第j维度的变量被(不被)选作特征变量，例如原点位置[0,0,…,0]代表所有原始输入都不被选为特征变量；

(4)适应度评估：以训练后回归模型在训练集上表现出的预测误差作为评价当前粒子的适应度要素，另一要素为粒子到原点的欧式距离，适应度函数为二者的加权和，如下式；

其中，多项式第一部分为粒子群对应的回归器平均误差，第二个多项式||F||表示特征指示变量的模长，即粒子到原点的欧氏距离；w₁,w₂分别是两部分的权重。

(6)判断平均适应度是否达到误差容限的要求，若当前误差过大，则以更新后的粒子位置作为新状态下的粒子分布，重复步骤2的(3)、(4)、(5)环节继续粒子寻优；若达到误差要求，则记录当前状态下的全局最优粒子坐标。进入步骤3.

所述步骤2第(4)步所用到的回归学习的训练模型为支持向量回归模型，其数学关系可以表述为具体为：

y_i＝f(x_i)＝w^Th(x_i)+b (9)

的误差在误差边界ε的范围内。所建立的函数的平滑性能够保证模型不会出现过拟合的问题，这便对于权重的欧几里得范数||w||²提出了最小化的要求。建立松弛变量来考虑预测偏差，因此，回归模型的学习目标可以转化为以下优化模型。

其中，z_i是第i个样本代入回归学习目标函数的实际值，C是与经验误差与泛化误差有关的罚系数，ζ，ζ’分别为向上和向下的松弛变量，ε为容许的误差限，回归学习的过程本质上是确定(9)的参数w,b，通过拉格朗日乘子λ建立对偶问题求解可得到w，再回代到(9)中得到的函数映射为

所述步骤2多目标粒子群特征选择算法的具体方法为：

对于回归型学习任务，最为重要的是把握数据特征。对于电力系统而言，信息采集系统和潮流运算前后所涉及的电气量数目种类繁多，其中一部分电气量之间具有高度相关关系，还有一部分数据是冗余的。而过多数据组成的高维数据输入将降低数据挖掘的能力，也对神经网络的学习性能提出了更高要求，因此有必要采取特征提取技术作为一种降维手段。特征提取虽然属于一种降维方式，但相比于其他降维方法，是通过选择现有特征的子集而非应用数据变换实现的。因此，对于具有n个特征的特征集，特征提取的方式是从中提取出规模为m的特征子集来使目标函数最小化。对于电力系统而言，不同维度特征的降维算法不适用于电力系统的风险评估，因为系统中的PMU装置通常安装在变电站和发电厂位置，一般的改变维度特征进行变化的降维法仍然需要在所有的n个节点设置信息采集装置，而特征提取的方法则只需要选取其中的m个节点来获取必要的特征信息。

步骤2的目的是从表征电力系统运行状态的大量输入中选出关键部分，构成特征变量，一方面要保证神经网络的表现效果，另一方面应提取出尽可能少的特征数量，属于双目标优化的问题，所以采用多目标粒子群优化来进行步骤2的特征选择。

优化的目标函数为

同时待优化的函数也可以作为适应度函数来评判所提取的特征组合的结果。其中，N是样本数量，F是粒子坐标的向量表示。由于PMU装置安装在发电厂和主要变电站处，根据其能够提供的数据信息，选择原始输入为发电机节点的有功出力、电压幅值、电压相角，以及源于历史负荷曲线的用能需求。

在本实施例中，均衡地按照有风险状态与无风险状态从库中提取数据，并按照比例分配为训练集与测试集。由于PMU装置安装在发电厂和主要变电站处，根据其能够提供的数据信息，选择输入回归向量机的原始输入为发电机节点的有功出力、电压幅值、电压相角，以及源于历史负荷曲线的用能需求组成的一维向量x_i。

x_i＝[P_G1,P_G2…U_G1,U_G2…q_G1,q_G2…L_D1,L_D2…] (13)

在风险状态数据向量空间内建立同等维度的超立方体，并在超立方体顶点位置上随机生成粒子。粒子坐标数据与x_i具有相同长度，将代表对应状态数据的保留标志位，其中每个坐标元素代表数据选择与否的状态标志，均为0-1向量。因此坐标数据F的可行域仅仅是超立方体的顶点，形式类似下式，

F＝[0,1…1,0…0,0…1,1…] (14)

按照粒子坐标选择数据集中的相应数据输入回归向量机训练，为每一个粒子建立的回归向量机模型如下，

y_i＝f(x_i)＝w^Th(x_i)+b (15)

其中，w,b是其中的权值和偏，其数值大小可以基于现有的数据集进行最优化拟合来确定，h(x)是一种非线性映射关系。对于ε-SV回归问题，学习目标是建立输入输出向量之间的尽可能平滑的函数映射关系y＝f(x)使得实际输出与目标输出

的误差在误差边界ε的范围内。所建立的函数的平滑性能够保证模型不会出现过拟合的问题，这便对于权重的欧几里得范数||w||²提出了最小化的要求。对于偏差则可以建立松弛变量ζ来考虑。因此，回归模型的学习目标可以转化为以下优化模型。

其中，C是与经验误差与泛化误差有关的罚系数。通过拉格朗日乘子λ建立对偶问题求解上述优化问题，得到的函数映射为

其中，γ是核参数，ε是误差容限，C表示罚因子，三者是决定回归效果的关键参数。

每一个粒子对应的拟合误差以及到原点的距离(反映特征向量的数量)将作为最小化的目标函数，即

同时待优化的函数也作为适应度函数来评判所提取的特征组合的结果。其中，N是样本数量，||F||是粒子到原点的欧式距离，反映了特征集中的特征个数。

运用多目标粒子群算法经过设定的代际后获得粒子最优位置，基于该粒子坐标指示特征数据选择，形成特征数据库。

步骤3:基于改进蚁群算法选择SVM模型最适参数，以进一步降低预测误差，提升风险评估精度；

所述步骤3的具体步骤包括：

(1)确定蚁群算法的种群规模、信息素损失率等参数；

(6)根据信息素更新位置：信息素的感知影响蚂蚁的移动，进而影响蚁群的位置分布，某一个蚂蚁个体接受到的整个蚁群的信息素等效影响可以通过个体与蚁群的平均距离计算。本技术方法中，蚂蚁的位置选择遵从高斯概率分布，因此用信息素影响高斯概率分布的标准差可以模拟信息素对蚂蚁移动的影响，其作用关系式如下：

所述步骤3中改进蚁群算法的回归模型参数优化的具体方法为：

本发明提出了一种蚁群优化(ACO)已经被用于调整超参数建立拟合问题，ACO能够处理寻找可变问题组件的最佳组合或排列，并被提议用于解决组合优化问题。从而服务于在线应用，使用蚁群算法的优化目标函数是

其中，

是目标输出值，通过求解最优潮流方程得到，Y是实际输出，N是样本数量。蚁群算法中，每个蚂蚁个体所在的位置坐标都对应一个参数取值组合，因此以上述目标函数作为个体的适应度函数。

蚁群的历史位置将影响后续蚂蚁个体对于位置的选择，这种影响方式可以理解为蚂蚁之间传递信息的“信息素”。蚂蚁将在其所在的坐标上留下信息，信息素的浓度更高的地点将更吸引后续的蚂蚁，因此具有影响个体选择的更高权重w_i。传统的蚁群算法用于解决离散点路径寻优，构建的解也是离散解，概率分布是离散型的，因而不适用于本发明的参数寻优问题。参数取值对应的蚂蚁位置坐标，可以在一个连续立方空间内任何一处，所以选用连续高斯核函数来表示蚁群的概率分布。高斯核函数能够表示成为n个蚂蚁个体的一维高斯概率密度函数的加权和。

对于本发明的参数优化问题，有三个参数有待搜索，所以问题维度为3，对于每个维度都对应一个不同的高斯核函数，即G1,G2,G3。其中，w_i是权重，权重也可以按照高斯函数计算：

权重可以表示为与种群规模、强化因子q有关的函数。i表示蚂蚁在蚁群中个体适应度的排名，排名靠前的高斯密度被选择的概率更高。强化因子随排名位次递减。qk为高斯函数的标准差。q较小时，首选排名第一的解，而当q值较大时，概率分布更加均匀，因此，使用高斯概率密度分布函数可平衡当前最优和历史最优。

本发明提出了将权重与历史最优位置相关联的方法，即将所出现过的所有适应度排序中最佳适应的的也作为一只虚拟蚂蚁，即0号蚂蚁，并在种群中虚拟蚂蚁始终保持最高的适应度，其位置不改变，因此其他蚂蚁名次则顺延一位。按照本发明改进的蚁群规则，历史最优能够被保留而不会损失，权重便能够与历史最优建立关联，而不再是与当前个体中最优值关联，这种修改能够进一步加快对于最优参数选择的求解速度。

因此，改进的蚁群算法需要考虑0号蚂蚁，高斯概率函数的权表示为

蚂蚁将在一定的概率下选择新的位置。原始方法中，产生的信解用于修改信息素表，但在连续空间的寻优计算中，则用于动态地生成概率密度函数。在每次迭代蚂蚁选择第i个高斯函数的概率则用P_i表示，因此，新的蚁群则按照如下规则产生，其中，δ是通过高斯分布生成的随机数，

其中，S_i为第i个蚂蚁个体的在某一维度上的位置坐标信息，σ_i是第i个个体的概率分布标准差，可以通过求解个体与蚁群平均距离计算，系数η考虑了信息素的损失

经过多次更新后，蚂蚁的信息素会逐渐吸引彼此相互靠近，蚁群分布将缩减在一定的小范围之内，对应参数的最优取值范围；而所产生的历史最优个体，将作为参数的最优取值。

在本实施例中，使用改进的蚁群算法对支持向量机的核参数γ、罚因子C、误差限ε进行参数优选，找寻可变组合形式中能使拟合误差最小的最佳搭配，从而提升在线应用的精度，因此使用蚁群算法的优化目标函数是

其中，

是回归模型所预测的负荷削减水平，通过求解最优潮流方程得到，LC是系统实际的负荷削减两输出，N是评估的样本数量,Ω_Test是测试数据集。蚁群算法中，每个蚂蚁个体所在的位置坐标都对应一个参数取值组合，因此以上述目标函数作为个体的适应度函数。

接着建立连续域内的蚁群概率分布模型，在连续域对应的三维立方空间内部随机生成蚂蚁个体，蚂蚁所在位置的三维坐标分别对应参数的取值组合。由于蚂蚁坐标的可行域是一个连续完整的立方空间，所以选用连续高斯核函数来表示蚁群的概率分布。高斯核函数能够表示成为n个蚂蚁个体的一维高斯概率密度函数的加权和。

其中，w_i是权重，由于零号蚂蚁的引入，需要将每只实际蚂蚁的排位顺位后移，形成了如下的权重计算式：

为每个蚂蚁建立使用坐标对应参数的支持向量机进行训练并按照拟合误差评判其适应度，更新历史最优位置作为0号蚂蚁的位置，对蚂蚁个体进行适应度排序，次序通过改变概率密度影响后续蚂蚁的移动；按照概率更新蚂蚁位置并重新评判种群适应度，以良逐劣的方式更新蚁群并更新历史最优位置。蚂蚁对于新位置的选择将在一定的概率下进行，在连续空间的寻优计算中，蚂蚁信息素的浓度排位则用于动态地生成概率密度函数，信息素通过改变子高斯函数的标准差更新整体的概率密度函数。

系数η为正数，它考虑了信息素的损失，取值越大则蚁群位置收敛越慢。直到拟合误差达到停止条件，蚁群因信息素的吸引而分布范围缩小，对应参数的最优取值范围，同时蚁群的概率密度最高之处也反映了参数的最优组合。

步骤4:结合训练模型的关键参数建立回归向量机模型，使用特征筛选后的模型驱动获取的数据输入回归模型进行一次离线训练，即可快速建立系统运行状态与风险的关联关系；

在本实施例中，将特征数据输入基于优选参数的支持向量机进行训练，建立系统状态-运行风险的关联映射。对PMU系统实时采集的系统运行数据按照上述方式产生的特征挖掘规则进行筛选并输入支持向量机即可立即获得当前运行风险水平。

步骤5:在线应用阶段，根据步骤2的结果对系统运行状态进行特征筛选并输入复用网络即可获取相应状态下的节点停电风险。再根据节点风险与状态概率进行加权求和，获得年化期望风险指标。

所用的风险指标为负荷削减率(Loss of Load probability,LOLP)以及年负荷损失量(Expected energy not supplied,EENS)，具体表示如下，可见风险评估的关键要素是确定状态的负荷损失。

负荷削减率，无量纲，衡量系统发生负荷削减的可能性。

LOLP＝∑P(s)Z(s) (34)

式中，P(s)表示系统状态概率，Z(s)为0-1变量，在系统状态引发负荷削减时取值为1。

负荷损失指标，单位MWh/时间段

EENS＝∑P(s)LC(s)T (35)

式中，LC(s)为切削负荷的功率(MW),T为时间跨度(h)，故此指标衡量一定时间范围内的电能损失。

由于所评估的可能系统状态都是由蒙特卡洛法得到，且抽取的状态数量十分可观，因此系统状态概率近似等于该状态出现的频率，其期望值近似等于输出结果的平均值。

通过本发明所述的技术方法，对于已知现行运行状态的电力系统(示例系统如附图2所示)能够建立并综合后续可能出现的种种运行状态下的停电风险从而评价当前系统的风险水平。传统方式使用蒙特卡洛模拟法(Monte Carlo Simulation,MCS)进行风险评估，在评估状态的数目过万时其风险评估值基本稳定在真实的系统风险附近，该方法使用的交流最优潮流求解属于一种精确的潮流求解方法；而本发明提出的基于特征选择与回归训练的方式是一种模拟的最优潮流求解方式，故这里使用传统蒙特卡洛法作为数据标准，对比本发明结果的准确度，对比结果如附图3、附图4所示。

附图3呈现了系统节点的年化负荷缺供电量，单位MWh/yr，浅色条块代表传统蒙特卡洛模拟法的计算结果，深色条块表示本发明所提方法的计算结果，可见二者的运算结果基本一致，表明本发明方法能够提供电力系统内部每一个负荷的风险信息，同时在评估每个负荷节点的风险水平时具有高准确度。

附图4呈现了附图2示例系统在不同运行场景下的全系统全年尺度的负荷缺供电量情况，单位MWh/yr，横轴代表由电能供求波动所引起的系统运行状态的变化，深色与浅色分别代表传统蒙特卡洛法与本发明所提方法对全系统风险的计算结果，两种方法的计算结果基本重叠，表明本发明方法能够评估全系统风险，同时对电力系统供求状态的变化具有很高的适应度。

综上所述，本发明所提方法能够同时反映系统层面和节点层面的风险信息，本发明方法具有高精度和强适应度的特点。

需要强调的是，本发明所述实施例是说明性的，而不是限定性的，因此本发明包括并不限于具体实施方式中所述实施例，凡是由本领域技术人员根据本发明的技术方案得出的其他实施方式，同样属于本发明保护的范围。

Claims

1.一种基于回归学习与特征挖掘的电网在线风险计算方法，其特征在于：包括以下步骤：

步骤4、结合训练模型的关键参数建立回归向量机模型，使用特征筛选后的模型驱动获取的数据输入回归模型进行一次离线训练，进而快速建立系统运行状态与风险的关联关系；

2.根据权利要求1所述的一种基于回归学习与特征挖掘的电网在线风险计算方法，其特征在于：所述步骤1的具体步骤包括：

其中，以年计量的MTTF和MTTR分别为故障前运行小时数和故障修复小时数；

[P_G1,P_G2…U_G1,U_G2…q_G1,q_G2…L_D1,L_D2…] (2)

以最小化供能风险为目标的最优潮流计算过程构建如下

目标函数

等式约束

P_i(V,q)-P_load,i+LC_i＝0,i∈N_D

Q_i(V,q)-Q_load,i＝0,i∈N_D (4)

不等式约束

式中，LC为节点负荷削减的功率；下标i,k分别为节点编号与传输线路编号；集合N_D、N_G、L分别代表负荷节点集合、发电机节点集合、传输线路组成的集合；P、Q分别为节点的有功功率与无功功率，P_load、Q_load为相应节点的有功负荷与无功负荷，P_G、Q_G分别是节点的有功出力、无功出力；V、θ分别指电压幅值与电压相角，相量U_i为节点电压；T表示线路段的实际潮流，T_max则为线路的容量上限；P_i、Q_i与T_k是节点电压幅值V与节点电压相角θ的函数，通过交流电力系统的潮流方程可得；

3.根据权利要求1所述的一种基于回归学习与特征挖掘的电网在线风险计算方法，其特征在于：所述步骤2的具体步骤包括：

(2)在单位体积超立方体的部分顶点位置上随机生成粒子，粒子坐标作为特征选择的保留指示位过滤训练集，从而为每个粒子建立对应的特征训练集；粒子在某一维度上的坐标v_i,j取值为1(或0)，表示第j维度的变量被/不被选作特征变量；

其中，多项式第一部分为粒子群对应的回归器平均误差，第二个多项式||F||表示特征指示变量的模长，即粒子到原点的欧氏距离；w₁,w₂分别是两部分的权重；

其中，c₁,c₂,rand均为0，1之间服从均匀分布的随机变量，p_i*表示第i个粒子的历史最优位置，p_g*为全局所有粒子的综合最优历史位置，对应权重分别为r₁,r₂,s_i表示粒子位置，它是其速度矢量v_i的函数，v_i,j是粒子速度在第j个维度上的分量；

(6)判断平均适应度是否达到误差容限的要求，若当前误差过大，则以更新后的粒子位置作为新状态下的粒子分布，重复步骤2的(3)、(4)、(5)环节继续粒子寻优；若达到误差要求，则记录当前状态下的全局最优粒子坐标；进入步骤3。

4.根据权利要求3所述的一种基于回归学习与特征挖掘的电网在线风险计算方法，其特征在于：所述步骤2第(4)步所用到的回归学习的训练模型为支持向量回归模型，其数学关系可以表述为具体为：

y_i＝f(x_i)＝w^Th(x_i)+b (9)

其中，w,b是其中的权值和偏，其数值大小可以基于现有的数据集进行最优化拟合来确定，h(x)是一种非线性映射关系，可以拟合任意函数关系，其功能是将一维输入向量x_i映射到实值的输出y_i；

回归模型的学习目标可以转化为以下优化模型：

z_i,z′_i≥0,i＝1,2… (10)

其中，指数部分可以为径向基函数的核函数，因此，决定回归效果的关键参数为核参数γ，误差容限ε以及罚因子C。

5.根据权利要求1所述的一种基于回归学习与特征挖掘的电网在线风险计算方法，其特征在于：所述步骤3的具体步骤包括：

(1)确定蚁群算法的种群规模、信息素损失率等参数；

(2)对于本次参数优化问题，有三个参数有待搜索，所以问题维度为3，对于每个维度都对应一个不同的高斯核函数，即G1,G2,G3；

(3)在连续三维空间内随机生成蚁群，蚁群中每个蚂蚁个体的坐标用三维空间坐标值表示，三个维度j＝1,2,3分别代表回归向量机的支持向量机的核参数γ，误差容限ε以及罚因子C三个参数取值；每个维度都对应一个不同的高斯核函数G_j，具体由k个高斯子函数g_j ⁱ按照权重w_i叠加组成:

(5)训练完毕后以测试集上的均方误差作为评价蚁群的适应度函数，按照适应度排序并记录历史最优蚂蚁和当前种群的最优蚂蚁个体

(6)根据信息素更新位置：信息素的感知影响蚂蚁的移动，进而影响蚁群的位置分布，某一个蚂蚁个体接受到的整个蚁群的信息素等效影响可以通过个体与蚁群的平均距离计算；用信息素影响高斯概率分布的标准差可以模拟信息素对蚂蚁移动的影响，其作用关系式如下：