CN111651932A - 一种基于集成分类模型的电力系统在线动态安全评估方法 - Google Patents

一种基于集成分类模型的电力系统在线动态安全评估方法 Download PDF

Info

Publication number
CN111651932A
CN111651932A CN202010425310.3A CN202010425310A CN111651932A CN 111651932 A CN111651932 A CN 111651932A CN 202010425310 A CN202010425310 A CN 202010425310A CN 111651932 A CN111651932 A CN 111651932A
Authority
CN
China
Prior art keywords
sample
samples
formula
power system
class
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010425310.3A
Other languages
English (en)
Inventor
刘颂凯
毛丹
段雨舟
刘炼
程江洲
龚小玉
杨楠
李振华
袁波
王彦淞
程杉
粟世玮
卢云
陈曦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Three Gorges University CTGU
Original Assignee
China Three Gorges University CTGU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Three Gorges University CTGU filed Critical China Three Gorges University CTGU
Priority to CN202010425310.3A priority Critical patent/CN111651932A/zh
Publication of CN111651932A publication Critical patent/CN111651932A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Evolutionary Computation (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Tourism & Hospitality (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Quality & Reliability (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Medical Informatics (AREA)
  • Game Theory and Decision Science (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Evolutionary Biology (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Complex Calculations (AREA)

Abstract

一种基于集成分类模型的电力系统在线动态安全评估方法,步骤1:建立一个电力系统安全评估的初始样本集;步骤2:通过特征选择构建一个包含关键变量和相应动态安全分类标签的高效样本集;步骤3:获得能够准确预测电力系统运行状态的动态安全评估模型;步骤4:将实时数据作为动态安全评估模型的输入实现电力系统的在线动态安全评估。本发明的目的是为了解决电力系统DSA过程中的评估数据的不平衡问题和误分类问题所带来的评估误差。

Description

一种基于集成分类模型的电力系统在线动态安全评估方法
技术领域
本法发明涉及电力系统动态安全评估领域,具体涉及一种基于集成分类模型的电力系统在线动态安全评估方法。
背景技术
随着电力系统规模的逐步增大,以及新能源的并网规模不断扩大,给系统的安全稳定运行带来了巨大的挑战,如何保证系统在更经济的条件下安全稳定运行已显得愈来愈重要。因此,电力系统的动态安全分析已经发展成为了研究的重要热点。电力系统的数据具有数据量大、数据种类混杂的特点,快速、准确捕捉电力系统的事故安全报警信号变得更加困难且格外的重要。采用电力系统动态安全评估(Dynamic Security Assessment,DSA)模型对电力系统数据进行安全分类总是存在以下两个问题:
第一、系统中数据样本的分类往往存在两种误分类,即将稳定状态误判为不稳定状态和将不稳定状态误判为稳定状态两种情况,错误的分类对电力系统的危害程度是不一样的,因此迫切需要能有效降低分类误差的方法来提高电力系统的稳定状况;
第二、电力系统中的不平衡数据集分类效果往往不是非常理想,数据的非平衡采样可能会使分类的结果并不能符合实际情况,因此迫切需要新的方法来解决非平衡数据采样带来的影响,提高系统动态安全稳定预测的精确度。
目前常用于电力系统DSA的分类方法有人工神经网络(Artificial NeuralNetwork,ANN),决策树(Decision Tree,DTs)、随机森林(Random Forest,RF)、支持向量机(Support Vector Machine,SVM)、极限学习机(Extreme Learning Machine,ELM)等。但这些方法往往集中在提高DSA总体分类精度上,将两种误分类同等对待,增加了DSA的误差,并且这些分类方法无法很好的处理数据样本中数据不平衡的问题,对DSA的评估精度产生了一定的影响。
授权公告为CN106849069B的专利文献公开了一种基于Pin-SVM的电力系统暂态稳定评估方法:该方法首先构建原始特征集,分为训练样本数据和测试样本数据;由训练样本数据训练电力系统的暂态稳定评估模型;采用电力系统暂态稳定评估模型对用测试样本数据模拟的电力系统状态进行稳定性评估,针对实际电力系统的故障类型,依据电力系统特征子集相对于电力系统稳定类与不稳定类的隶属度将故障划归到相应的类,当分类为不稳定类,则认为该故障为严重故障;反之,则认为该故障为不严重故障;在故障筛选和稳定评估完成的同时得到评价指标。该发明的缺点是没有考虑不平衡数据及样本数据的误分类对评估结果造成的影响,致使评估结果在置信度方面存在不足。
综上所述,目前的安全评估方法并不能满足现代电力系统对DSA方法的高适应性、高精度的需求。
发明内容
本发明为了解决电力系统DSA过程中的评估数据的不平衡问题和误分类问题所带来的评估误差,提出了一种基于集成分类模型的电力系统动态安全评估方法,采用样本分层的双向过采样(Stratified Bi-directional Oversampling,SBO)方法获取样本,并使用三种高精度NP分类器集成一个DSA模型,对于多个NP分类器的结果采用多数投票的方式得到系统DSA的最终结果,有效提高了DSA的精度。
为了实现上述发明目的,本发明采用了以下方案:
一种基于集成分类模型的电力系统在线动态安全评估方法,包括以下步骤:
步骤1:构建动态安全分类标签,基于电力系统历史运行数据与故障仿真产生的数据,建立一个电力系统安全评估的初始样本集;
步骤2:基于样本分层的双向过采样方法对初始样本集进行采样,并对采样的数据进行预处理,通过特征选择构建一个包含关键变量和相应动态安全分类标签的高效样本集;
步骤3:用获得的高效样本集对基于伞式算法的奈曼皮尔逊综合分类动态安全评估模型进行离线训练及更新,获得能够准确预测电力系统运行状态的动态安全评估模型;
步骤4:基于同步相量测量装置收集的实时数据,将实时数据作为动态安全评估模型的输入实现电力系统的在线动态安全评估。
在步骤1中,根据系统故障潮流仿真计算各种故障对应的极限切除时间(CriticalClearing Time,CCT),并基于CCT构建相应的动态安全指标如公式(1)所示:
Figure BDA0002498496170000021
式中:CCT是电力系统某个位置发生故障的极限切除时间;ACT为故障点的实际切除时间;
基于构建的DSI,构建相应的安全分类标签如公式(2)所示:
Figure BDA0002498496170000022
式中:η为用户自定义的阈值。
在步骤2中,基于SBO方法对初始样本集进行采样,电力系统仿真样本中,大部分样本为安全运行的样本,只有少数异常的包含电力系统不安全运行信息的样本。因此,该方法首先将样本集分为少数类样本和多数类样本,然后基于少数类样本的最高密度点和类内平均距离将少数类样本划分成密集层和稀疏层,然后找到密集层的边界样本,最后对这些边界样本和稀疏层样本进行双向过采样。
在对初始样本集进行采样时,包括以下步骤:
步骤(1)首先将样本分层;
步骤(2)将样本分层后,确定少数类样本的样本密集层边界区域;
步骤(3)得到密集层的边界区域后,采用双向过采样在互为近邻的少数类样本之间合成新样本。
在步骤(1)中,令初始样本集T={(x1,y1),(x2,y2),...,(xn,yn)},其中yi∈{-1,1}(i=1,2,...,n),T为包含n个样本点的二分类数据集,yi=1表示对应的样本点属于少数类,记为Q={(x1,1),(x2,1),...,(xq,1)},其中q代表少数类样本数,yi=-1表示对应的样本点属于多数类,记为M={(x1,-1),(x2,-1),...,(xm,-1)},其中m代表多数类样本数,T=Q∪M;
在步骤(2)中,将样本分层后,通过以下四步确定少数类样本的样本密集层边界区域:
a、对
Figure BDA0002498496170000034
属性个数为d,首先根据公式(3)求两个样本点xi,xj之间的欧式距离D(xi,xj),并通过公式(4)计算Q中每个样本的密度Density(xi),找到最高密度点xmax
Figure BDA0002498496170000031
Figure BDA0002498496170000032
b、通过公式(5)计算少数类样本之间的平均距离dist_aver:
Figure BDA0002498496170000033
c、根据公式(6)和公式(7)得到Q的密集层Den_area和稀疏层Spar_area如下:
Den_area={D(xj,xmax)≤dist_aver,xj∈Q} (6)
Spar_area={D(xj,xmax)>dist_aver,xj∈Q} (7)
d、根据公式(8)和公式(9)得到密集层的边界及其边界区域:
Figure BDA0002498496170000041
Figure BDA0002498496170000042
在步骤(3)中,得到密集层的边界区域后,采用双向过采样在互为近邻的少数类样本之间合成新样本,对
Figure BDA0002498496170000044
将双向过采样的样本集定义为Bi_Sample,如公式(10)所示:
Bi_Sample={(xi,xj)|xi∈Nk(xj)∩xj∈Nk(xi)} (10)
式中:Nk(xi)表示xi的k个近邻。
在步骤2中,基于经过采样后的样本集,采用部分互信息(Partial MutualInformation,PMI)工具对样本集进行特征选择,探索样本集中各输入变量与安全分类标签之间的相关性,构建一个高效样本集;PMI的定义如公式(11)所示:
Figure BDA0002498496170000043
式中:x,y是在条件z下的随机变量;p为变量x,y的联合概率分布。
在步骤3中,用基于NP准则的伞式算法对多种传统分类器进行改造,最终得到一系列对应的NP分类器;在对多种NP分类器进行训练之前,首先根据电力系统实际需求调整NP分类器的参数,并设置一类分类错误阈值上限α、违规率δ及训练集循环分裂次数N,然后再将高效样本集作为输入进行NP分类器的训练。
在进行NP分类器的训练时,采用以下训练步骤:
(1)根据设定的分裂次数N,将训练集中不稳定分类样本S0随机分裂得到样本
Figure BDA0002498496170000045
和样本
Figure BDA0002498496170000046
结合稳定分类样本S1用于基本分类器;
(2)
Figure BDA0002498496170000047
用于分类器计算违章率上限vk,并通过计算得到每个样本等级阈值k*对应的分数阈值
Figure BDA0002498496170000048
Figure BDA0002498496170000049
结合S1训练各分类器得分函数fi,违章率上限vk和等级阈值k*的表达式分别如公式(12)和公式(13)所示;
Figure BDA0002498496170000051
k*=min{k∈(1,...,n):v(k)≤δ} (13)
(3)将fi应用于
Figure BDA0002498496170000058
得到一组分数阈值候选项τi,并将τi中元素按递增顺序排序得到sort(τi),找到每一个等级阈值k*对应的分数阈值
Figure BDA0002498496170000059
τi、sort(τi)和k*的表达式分别如公式(14)-(16)所示:
τi={ti,1,...,ti,n}={fi(x1),...,fi(xn)} (14)
sort(τi)={ti,(1),...,ti,(n)} (15)
Figure BDA0002498496170000052
(4)基于得分函数和阈值如公式(17)所示构造NP分类器:
Figure BDA0002498496170000053
(5)重复步骤(1)至(4),将训练集进行循环分裂训练N次,对于每种类型NP分类器分别构造N多个NP分类器,将一类分类错误分类结果按照公式(18)加权投票的集成方法作为该NP分类器最终结果输出:
Figure BDA0002498496170000054
最后通过对比分类结果的一类分类错误率(Error I)、准确率(AC)、精确率(PR)与安全类样本召回率(RE)的调和平均值F1指标来评判各个分类器的性能,并选择三种性能较为优良的分类器来构造DSA模型,对于三种分类器结果采用多数投票的形式获得DSA模型的最终结果,以此得到一个高精度的集成DSA模型。其中Error I、AC、PR、RE和F1的计算公式分别如公式(19)-(23)所示:
Figure BDA0002498496170000055
Figure BDA0002498496170000056
Figure BDA0002498496170000057
Figure BDA0002498496170000061
Figure BDA0002498496170000062
式中:F11表示将实际是稳定状态的样本预测为稳定状态的样本数;F10表示将实际是稳定状态的样本预测为不稳定状态的样本数;F01表示将实际是不稳定状态的样本预测为稳定状态的样本数;F00表示将实际是不稳定状态的样本预测为不稳定状态的样本数。
一种对电力系统安全评估的初始样本集进行采样的方法,它包括以下步骤:
步骤(1)首先将样本分层;
步骤(2)将样本分层后,确定少数类样本的样本密集层边界区域;
步骤(3)得到密集层的边界区域后,采用双向过采样在互为近邻的少数类样本之间合成新样本。
在步骤(1)中,令初始样本集T={(x1,y1),(x2,y2),...,(xn,yn)},其中yi∈{-1,1}(i=1,2,...,n),T为包含n个样本点的二分类数据集,yi=1表示对应的样本点属于少数类,记为Q={(x1,1),(x2,1),...,(xq,1)},其中q代表少数类样本数,yi=-1表示对应的样本点属于多数类,记为M={(x1,-1),(x2,-1),...,(xm,-1)},其中m代表多数类样本数,T=Q∪M;
在步骤(2)中,将样本分层后,通过以下四步确定少数类样本的样本密集层边界区域:
a、对
Figure BDA0002498496170000066
属性个数为d,首先根据公式(3)求两个样本点xi,xj之间的欧式距离D(xi,xj),并通过公式(4)计算Q中每个样本的密度Density(xi),找到最高密度点xmax
Figure BDA0002498496170000063
Figure BDA0002498496170000064
b、通过公式(5)计算少数类样本之间的平均距离dist_aver:
Figure BDA0002498496170000065
c、根据公式(6)和公式(7)得到Q的密集层Den_area和稀疏层Spar_area如下:
Den_area={D(xj,xmax)≤dist_aver,xj∈Q} (6)
Spar_area={D(xj,xmax)>dist_aver,xj∈Q} (7)
d、根据公式(8)和公式(9)得到密集层的边界及其边界区域:
Figure BDA0002498496170000071
Figure BDA0002498496170000072
在步骤(3)中,得到密集层的边界区域后,采用双向过采样在互为近邻的少数类样本之间合成新样本,对
Figure BDA0002498496170000073
将双向过采样的样本集定义为Bi_Sample,如公式(10)所示:
Bi_Sample={(xi,xj)|xi∈Nk(xj)∩xj∈Nk(xi)} (10)
式中:Nk(xi)表示xi的k个近邻。
一种对奈曼皮尔逊分类器进行训练的方法,首先根据电力系统实际需求调整NP分类器的参数,并设置一类分类错误阈值上限α、违规率δ及训练集循环分裂次数N,然后再将高效样本集作为输入进行NP分类器的训练,其训练过程包括以下步骤:
(1)根据设定的分裂次数N,将训练集中不稳定分类样本S0随机分裂得到样本
Figure BDA0002498496170000074
和样本
Figure BDA0002498496170000075
结合稳定分类样本S1用于基本分类器;
(2)
Figure BDA0002498496170000076
用于分类器计算违章率上限vk,并通过计算得到每个样本等级阈值k*对应的分数阈值
Figure BDA0002498496170000079
Figure BDA00024984961700000710
结合S1训练各分类器得分函数fi,违章率上限vk和等级阈值k*的表达式分别如公式(12)和公式(13)所示;
Figure BDA0002498496170000077
k*=min{k∈(1,...,n):v(k)≤δ} (13)
(3)将fi应用于
Figure BDA00024984961700000711
得到一组分数阈值候选项τi,并将τi中元素按递增顺序排序得到sort(τi),找到每一个等级阈值k*对应的分数阈值
Figure BDA0002498496170000078
τi、sort(τi)和k*的表达式分别如公式(14)-(16)所示:
τi={ti,1,...,ti,n}={fi(x1),...,fi(xn)} (14)
sort(τi)={ti,(1),...,ti,(n)} (15)
Figure BDA0002498496170000081
(4)基于得分函数和阈值如公式(17)所示构造NP分类器:
Figure BDA0002498496170000082
(5)重复步骤(1)至(4),将训练集进行循环分裂训练N次,对于每种类型NP分类器分别构造N多个NP分类器,将一类分类错误分类结果按照公式(18)加权投票的集成方法作为该NP分类器最终结果输出:
Figure BDA0002498496170000083
最后通过对比分类结果的一类分类错误率(Error I)、准确率(AC)、精确率(PR)与安全类样本召回率(RE)的调和平均值F1指标来评判各个分类器的性能,并选择三种性能较为优良的分类器来构造DSA模型,对于三种分类器结果采用多数投票的形式获得DSA模型的最终结果,以此得到一个高精度的集成DSA模型。其中Error I、AC、PR、RE和F1的计算公式分别如公式(19)-(23)所示:
Figure BDA0002498496170000084
Figure BDA0002498496170000085
Figure BDA0002498496170000086
Figure BDA0002498496170000087
Figure BDA0002498496170000088
式中:F11表示将实际是稳定状态的样本预测为稳定状态的样本数;F10表示将实际是稳定状态的样本预测为不稳定状态的样本数;F01表示将实际是不稳定状态的样本预测为稳定状态的样本数;F00表示将实际是不稳定状态的样本预测为不稳定状态的样本数。
采用上述技术方案,能带来以下技术效果:
(1)本发明首先将初始样本中的少数类样本分为密集层和稀疏层,然后对密集层边界样本和稀疏层样本进行双向过采样,增加整个初始样本中少数类样本的占比,降低了电力系统安全评估中非平衡数据采样带来的影响,提高了模型的泛化能力;
(2)本技术采用NP准则对传统分类器进行改造,将3种性能良好的NP分类器集成到一个DSA模型中,并对三种NP分类器的结果采用多数投票的机制来确定整个集成DSA模型的最终结果,有效提高了评估模型的分类精度。
附图说明
图1是本发明的整体流程图;
图2是本发明的集成方案示意图;
图3是本发明的双向过采样流程图。
具体实施方式
一种基于集成分类模型的电力系统在线动态安全评估方法,其整体流程图和集体方案示意图分别如图1和图2所示,包括以下步骤:
步骤1:构建动态安全分类标签,基于电力系统历史运行数据与故障仿真产生的数据,建立一个电力系统安全评估的初始样本集;
步骤2:基于样本分层的双向过采样(Stratified Bi-directionalOversampling,SBO)方法对初始样本集进行采样,并对采样的数据进行预处理,通过特征选择构建一个包含关键变量和相应动态安全分类标签的高效样本集;
步骤3:用获得的高效样本集对基于伞式算法的奈曼皮尔逊(Neyman-Pearson,NP)综合分类动态安全评估(Dynamic Security Assessment,DSA)模型进行离线训练及更新,获得能够准确预测电力系统运行状态的DSA模型;
步骤4:基于同步相量测量装置(Phasor Measurement Units,PMUs)收集的实时数据,将实时数据作为DSA模型的输入实现电力系统的在线DSA。
在步骤1中,根据系统故障潮流仿真计算各种故障对应的极限切除时间(CriticalClearing Time,CCT),并基于CCT构建相应的动态安全指标如公式(1)所示:
Figure BDA0002498496170000091
式中:CCT是电力系统某个位置发生故障的极限切除时间;ACT为故障点的实际切除时间。
基于构建的DSI,构建相应的安全分类标签如公式(2)所示:
Figure BDA0002498496170000101
式中:η为用户自定义的阈值。
在步骤2中,基于SBO方法对初始样本集进行采样,采样过程如图3所示,该方法首先基于最高密度点和类内平均距离将少数类样本划分成密集层和稀疏层,然后找到少数类样本密集层的边界样本,最后对这些边界样本和稀疏层样本进行双向过采样,可以有效降低非平衡数据采样带来的影响。该方法的具体步骤如下:
(1)首先将样本分层:
令初始样本集T={(x1,y1),(x2,y2),...,(xn,yn)},其中yi∈{-1,1}(i=1,2,...,n),T为包含n个样本点的二分类数据集,yi=1表示对应的样本点属于少数类,记为Q={(x1,1),(x2,1),...,(xq,1)},其中q代表少数类样本数,yi=-1表示对应的样本点属于多数类,记为M={(x1,-1),(x2,-1),...,(xm,-1)},其中m代表多数类样本数,T=Q∪M。
(2)将样本分层后,通过以下四步确定少数类样本的样本密集层边界区域:
a、对
Figure BDA0002498496170000105
属性个数为d,首先根据公式(3)求两个样本点xi,xj之间的欧式距离D(xi,xj),并通过公式(4)计算Q中每个样本的密度Density(xi),找到最高密度点xmax
Figure BDA0002498496170000102
Figure BDA0002498496170000103
b、通过公式(5)计算少数类样本之间的平均距离dist_aver:
Figure BDA0002498496170000104
c、根据公式(6)和公式(7)得到Q的密集层Den_area和稀疏层Spar_area如下:
Den_area={D(xj,xmax)≤dist_aver,xj∈Q} (6)
Spar_area={D(xj,xmax)>dist_aver,xj∈Q} (7)
d、根据公式(8)和公式(9)得到密集层的边界及其边界区域:
Figure BDA0002498496170000111
Figure BDA0002498496170000112
(3)得到密集层的边界区域后,采用双向过采样在互为近邻的少数类样本之间合成新样本,对
Figure BDA0002498496170000113
将双向过采样的样本集定义为Bi_Sample,如公式(10)所示:
Bi_Sample={(xi,xj)|xi∈Nk(xj)∩xj∈Nk(xi)} (10)
式中:Nk(xi)表示xi的k个近邻。
针对采样后的样本集,用PMI工具对样本集进行特征选择,探索样本集中各输入变量与安全分类标签之间的相关性,构建一个高效样本集。PMI的定义如公式(11)所示:
Figure BDA0002498496170000114
式中:x,y是在条件z下的随机变量;p为变量x,y的联合概率分布。
在步骤3中,用基于NP准则的伞式算法对多种传统分类器进行改造,其中包括RF、AdaBoost、SVM、LDA和Penlog,最终得到一系列对应的NP分类器NP-RF、NP-ADA、NP-SVM、NP-LDA、NP-Penlog。
在对多种NP分类器进行训练之前,首先根据电力系统实际需求调整NP分类器的参数,并设置一类分类错误阈值上限α、违规率δ及训练集循环分裂次数N,然后再将高效样本集作为输入进行NP分类器的训练,训练过程如下:
(1)根据设定的分裂次数N,将训练集中不稳定分类样本S0随机分裂得到样本
Figure BDA0002498496170000115
和样本
Figure BDA0002498496170000116
结合稳定分类样本S1用于基本分类器;
(2)
Figure BDA0002498496170000117
用于分类器计算违章率上限vk,并通过计算得到每个样本等级阈值k*对应的分数阈值
Figure BDA0002498496170000118
Figure BDA0002498496170000119
结合S1训练各分类器得分函数fi,违章率上限vk和等级阈值k*的表达式分别如公式(12)和公式(13)所示;
Figure BDA00024984961700001110
k*=min{k∈(1,...,n):v(k)≤δ} (13)
(3)将fi应用于
Figure BDA0002498496170000121
得到一组分数阈值候选项τi,并将τi中元素按递增顺序排序得到sort(τi),找到每一个等级阈值k*对应的分数阈值
Figure BDA0002498496170000122
τi、sort(τi)和k*的表达式分别如公式(14)-(16)所示:
τi={ti,1,...,ti,n}={fi(x1),...,fi(xn)} (14)
sort(τi)={ti,(1),...,ti,(n)} (15)
Figure BDA0002498496170000123
(4)基于得分函数和阈值如公式(17)所示构造NP分类器:
Figure BDA0002498496170000124
(5)重复步骤(1)至(4),将训练集进行循环分裂训练N次,对于每种类型NP分类器分别构造N多个NP分类器,将一类分类错误分类结果按照公式(18)加权投票的集成方法作为该NP分类器最终结果输出:
Figure BDA0002498496170000125
最后通过对比分类结果的一类分类错误率(Error I)、准确率(AC)、精确率(PR)与安全类样本召回率(RE)的调和平均值F1指标来评判各个分类器的性能,并选择三种性能较为优良的分类器来构造DSA模型,对于三种分类器结果采用多数投票的形式获得DSA模型的最终结果,以此得到一个高精度的集成DSA模型。其中Error I、AC、PR、RE和F1的计算公式分别如公式(19)-(23)所示:
Figure BDA0002498496170000126
Figure BDA0002498496170000127
Figure BDA0002498496170000128
Figure BDA0002498496170000129
Figure BDA0002498496170000131
式中:F11表示将实际是稳定状态的样本预测为稳定状态的样本数;F10表示将实际是稳定状态的样本预测为不稳定状态的样本数;F01表示将实际是不稳定状态的样本预测为稳定状态的样本数;F00表示将实际是不稳定状态的样本预测为不稳定状态的样本数。
在步骤4中,将PMUs实时收集的系统运行特征数据作为DSA模型的输入,实现电力系统的实时DSA。
实施例:
本发明在一个IEEE 23节点系统和一个IEEE 50机系统进行了测试。其中IEEE 23节点系统包含6台发电机、23个节点以及10台变压器;IEEE 50机系统包含50台发电机、145条母线和453条传输线。测试是在一台装有Intel Core i7处理器和8GB内存的计算机上执行的。基于历史数据库和三相短路故障仿真产生的样本,本次测试IEEE 23节点系统和IEEE50机系统分别获得了2847个样本和5230个样本。对于每个系统获得的样本,其中80%用于训练,20%用于性能测试。
通过五倍交叉验证测试了五个NP分类器的分类性能如表1所示,通过对比各个分类器的Error I、AC和F1值可以看出这五个分类器总体性能较好,选择其中的三种性能相对较好的NP-ADA、NP-RF和NP-SVM分类器集合成一个DSA模型,并对集成DSA模型的性能进行测试。将α=0.04,δ=0.05,N=1作为DSA模型中NP分类器的基准参数,测试结果如表2所示,由表可知在两个系统的测试中,集成DSA模型的准确率都高达98%以上。并在基准条件下,对以下三种情况进行了分析:固定违规率和分裂次数的条件下改变阈值α、固定阈值和分裂次数的条件下改变违规率δ、固定阈值和违规率的条件下改变分裂次数N。测试结果如表3所示,由表3可知不同条件下的集成DSA模型也具有较高的分类精度,符合现代电力系统的运行要求。
表1
五种NP分类器性能测试
Figure BDA0002498496170000132
Figure BDA0002498496170000141
表2
集成DSA模型的性能测试
Figure BDA0002498496170000142
表3
集成DSA模型在不同阈值、违规率和分裂次数下的性能测试
Figure BDA0002498496170000143

Claims (10)

1.一种基于集成分类模型的电力系统在线动态安全评估方法,其特征在于,包括以下步骤:
步骤1:构建动态安全分类标签,基于电力系统历史运行数据与故障仿真产生的数据,建立一个电力系统安全评估的初始样本集;
步骤2:基于样本分层的双向过采样方法对初始样本集进行采样,并对采样的数据进行预处理,通过特征选择构建一个包含关键变量和相应动态安全分类标签的高效样本集;
步骤3:用获得的高效样本集对基于伞式算法的奈曼皮尔逊综合分类动态安全评估模型进行离线训练及更新,获得能够准确预测电力系统运行状态的动态安全评估模型;
步骤4:基于同步相量测量装置收集的实时数据,将实时数据作为动态安全评估模型的输入实现电力系统的在线动态安全评估。
2.根据权利要求1所述的一种基于集成分类模型的电力系统在线动态安全评估方法,其特征在于:在步骤1中,根据系统故障潮流仿真计算各种故障对应的极限切除时间(Critical Clearing Time,CCT),并基于CCT构建相应的动态安全指标如公式(1)所示:
Figure FDA0002498496160000011
式中:CCT是电力系统某个位置发生故障的极限切除时间;ACT为故障点的实际切除时间;
基于构建的DSI,构建相应的安全分类标签如公式(2)所示:
Figure FDA0002498496160000012
式中:η为用户自定义的阈值。
3.根据权利要求1所述的一种基于集成分类模型的电力系统在线动态安全评估方法,其特征在于:在步骤2中,基于SBO方法对初始样本集进行采样,首先将样本集分为少数类样本和多数类样本,然后基于少数类样本的最高密度点和类内平均距离将少数类样本划分成密集层和稀疏层,然后找到密集层的边界样本,最后对这些边界样本和稀疏层样本进行双向过采样。
4.根据权利要求3所述的一种基于集成分类模型的电力系统在线动态安全评估方法,其特征在于,在对初始样本集进行采样时,包括以下步骤:
步骤(1)首先将样本分层;
步骤(2)将样本分层后,确定少数类样本的样本密集层边界区域;
步骤(3)得到密集层的边界区域后,采用双向过采样在互为近邻的少数类样本之间合成新样本。
5.根据权利要求4所述的一种基于集成分类模型的电力系统在线动态安全评估方法,其特征在于,在步骤(1)中,令初始样本集T={(x1,y1),(x2,y2),...,(xn,yn)},其中yi∈{-1,1}(i=1,2,...,n),T为包含n个样本点的二分类数据集,yi=1表示对应的样本点属于少数类,记为Q={(x1,1),(x2,1),...,(xq,1)},其中q代表少数类样本数,yi=-1表示对应的样本点属于多数类,记为M={(x1,-1),(x2,-1),...,(xm,-1)},其中m代表多数类样本数,T=Q∪M;
在步骤(2)中,将样本分层后,通过以下四步确定少数类样本的样本密集层边界区域:
a、对
Figure FDA0002498496160000021
属性个数为d,首先根据公式(3)求两个样本点xi,xj之间的欧式距离D(xi,xj),并通过公式(4)计算Q中每个样本的密度Density(xi),找到最高密度点xmax
Figure FDA0002498496160000022
Figure FDA0002498496160000023
b、通过公式(5)计算少数类样本之间的平均距离dist_aver:
Figure FDA0002498496160000024
c、根据公式(6)和公式(7)得到Q的密集层Den_area和稀疏层Spar_area如下:
Den_area={D(xj,xmax)≤dist_aver,xj∈Q} (6)
Spar_area={D(xj,xmax)>dist_aver,xj∈Q} (7)
d、根据公式(8)和公式(9)得到密集层的边界及其边界区域:
Figure FDA0002498496160000025
Figure FDA0002498496160000026
在步骤(3)中,得到密集层的边界区域后,采用双向过采样在互为近邻的少数类样本之间合成新样本,对
Figure FDA0002498496160000031
将双向过采样的样本集定义为Bi_Sample,如公式(10)所示:
Bi_Sample={(xi,xj)|xi∈Nk(xj)∩xj∈Nk(xi)} (10)
式中:Nk(xi)表示xi的k个近邻。
6.根据权利要求4或5所述的一种基于集成分类模型的电力系统在线动态安全评估方法,其特征在于:在步骤2中,基于经过采样后的样本集,采用部分互信息(Partial MutualInformation,PMI)工具对样本集进行特征选择,探索样本集中各输入变量与安全分类标签之间的相关性,构建一个高效样本集;PMI的定义如公式(11)所示:
Figure FDA0002498496160000032
式中:x,y是在条件z下的随机变量;p为变量x,y的联合概率分布。
7.根据权利要求1至5其中之一所述的一种基于集成分类模型的电力系统在线动态安全评估方法,其特征在于:在步骤3中,用基于NP准则的伞式算法对多种传统分类器进行改造,最终得到一系列对应的NP分类器;在对多种NP分类器进行训练之前,首先根据电力系统实际需求调整NP分类器的参数,并设置一类分类错误阈值上限α、违规率δ及训练集循环分裂次数N,然后再将高效样本集作为输入进行NP分类器的训练。
8.一种对电力系统安全评估的初始样本集进行采样的方法,其特征在于,它包括以下步骤:
步骤(1)首先将样本分层;
步骤(2)将样本分层后,确定少数类样本的样本密集层边界区域;
步骤(3)得到密集层的边界区域后,采用双向过采样在互为近邻的少数类样本之间合成新样本。
9.根据权利要求8所述的对电力系统安全评估的初始样本集进行采样的方法,其特征在于:在步骤(1)中,令初始样本集T={(x1,y1),(x2,y2),...,(xn,yn)},其中yi∈{-1,1}(i=1,2,...,n),T为包含n个样本点的二分类数据集,yi=1表示对应的样本点属于少数类,记为Q={(x1,1),(x2,1),...,(xq,1)},其中q代表少数类样本数,yi=-1表示对应的样本点属于多数类,记为M={(x1,-1),(x2,-1),...,(xm,-1)},其中m代表多数类样本数,T=Q∪M;
在步骤(2)中,将样本分层后,通过以下四步确定少数类样本的样本密集层边界区域:
a、对
Figure FDA0002498496160000041
属性个数为d,首先根据公式(3)求两个样本点xi,xj之间的欧式距离D(xi,xj),并通过公式(4)计算Q中每个样本的密度Density(xi),找到最高密度点xmax
Figure FDA0002498496160000042
Figure FDA0002498496160000043
b、通过公式(5)计算少数类样本之间的平均距离dist_aver:
Figure FDA0002498496160000044
c、根据公式(6)和公式(7)得到Q的密集层Den_area和稀疏层Spar_area如下:
Den_area={D(xj,xmax)≤dist_aver,xj∈Q} (6)
Spar_area={D(xj,xmax)>dist_aver,xj∈Q} (7)
d、根据公式(8)和公式(9)得到密集层的边界及其边界区域:
Figure FDA0002498496160000045
Figure FDA0002498496160000046
在步骤(3)中,得到密集层的边界区域后,采用双向过采样在互为近邻的少数类样本之间合成新样本,对
Figure FDA0002498496160000047
将双向过采样的样本集定义为Bi_Sample,如公式(10)所示:
Bi_Sample={(xi,xj)|xi∈Nk(xj)∩xj∈Nk(xi)} (10)
式中:Nk(xi)表示xi的k个近邻。
10.一种对奈曼皮尔逊分类器进行训练的方法,其特征在于,首先根据电力系统实际需求调整NP分类器的参数,并设置一类分类错误阈值上限α、违规率δ及训练集循环分裂次数N,然后再将高效样本集作为输入进行NP分类器的训练,其训练过程包括以下步骤:
(1)根据设定的分裂次数N,将训练集中不稳定分类样本S0随机分裂得到样本
Figure FDA0002498496160000051
和样本
Figure FDA0002498496160000052
结合稳定分类样本S1用于基本分类器;
(2)
Figure FDA0002498496160000053
用于分类器计算违章率上限υk,并通过计算得到每个样本等级阈值k*对应的分数阈值
Figure FDA0002498496160000054
Figure FDA0002498496160000055
结合S1训练各分类器得分函数fi,违章率上限υk和等级阈值k*的表达式分别如公式(12)和公式(13)所示;
Figure FDA0002498496160000056
k*=min{k∈(1,...,n):υ(k)≤δ} (13)
(3)将fi应用于
Figure FDA0002498496160000057
得到一组分数阈值候选项τi,并将τi中元素按递增顺序排序得到sort(τi),找到每一个等级阈值k*对应的分数阈值
Figure FDA0002498496160000058
τi、sort(τi)和k*的表达式分别如公式(14)-(16)所示:
τi={ti,1,...,ti,n}={fi(x1),...,fi(xn)} (14)
sort(τi)={ti,(1),...,ti,(n)} (15)
Figure FDA0002498496160000059
(4)基于得分函数和阈值如公式(17)所示构造NP分类器:
Figure FDA00024984961600000510
(5)重复步骤(1)至(4),将训练集进行循环分裂训练N次,对于每种类型NP分类器分别构造N多个NP分类器,将一类分类错误分类结果按照公式(18)加权投票的集成方法作为该NP分类器最终结果输出:
Figure FDA00024984961600000511
最后通过对比分类结果的一类分类错误率(Error I)、准确率(AC)、精确率(PR)与安全类样本召回率(RE)的调和平均值F1指标来评判各个分类器的性能,并选择三种性能较为优良的分类器来构造DSA模型,对于三种分类器结果采用多数投票的形式获得DSA模型的最终结果,以此得到一个高精度的集成DSA模型,其中Error I、AC、PR、RE和F1的计算公式分别如公式(19)-(23)所示:
Figure FDA0002498496160000061
Figure FDA0002498496160000062
Figure FDA0002498496160000063
Figure FDA0002498496160000064
Figure FDA0002498496160000065
式中:F11表示将实际是稳定状态的样本预测为稳定状态的样本数;F10表示将实际是稳定状态的样本预测为不稳定状态的样本数;F01表示将实际是不稳定状态的样本预测为稳定状态的样本数;F00表示将实际是不稳定状态的样本预测为不稳定状态的样本数。
CN202010425310.3A 2020-05-19 2020-05-19 一种基于集成分类模型的电力系统在线动态安全评估方法 Pending CN111651932A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010425310.3A CN111651932A (zh) 2020-05-19 2020-05-19 一种基于集成分类模型的电力系统在线动态安全评估方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010425310.3A CN111651932A (zh) 2020-05-19 2020-05-19 一种基于集成分类模型的电力系统在线动态安全评估方法

Publications (1)

Publication Number Publication Date
CN111651932A true CN111651932A (zh) 2020-09-11

Family

ID=72346699

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010425310.3A Pending CN111651932A (zh) 2020-05-19 2020-05-19 一种基于集成分类模型的电力系统在线动态安全评估方法

Country Status (1)

Country Link
CN (1) CN111651932A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112235293A (zh) * 2020-10-14 2021-01-15 西北工业大学 一种面向恶意流量检测正负样本均衡生成的过采样方法
CN112564090A (zh) * 2020-11-20 2021-03-26 东北电力大学 基于mblda的交直流系统暂态电压稳定监测方法
CN116031880A (zh) * 2023-03-27 2023-04-28 山东大学 一种电网暂态稳定极限切除时间预测方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030200010A1 (en) * 2002-04-22 2003-10-23 Hsiao-Dong Chiang Method and system for on-line dynamical screening of electric power system
CN110311376A (zh) * 2019-07-31 2019-10-08 三峡大学 一种电力系统动态安全评估综合模型及时空可视化方法
CN110417011A (zh) * 2019-07-31 2019-11-05 三峡大学 一种基于互信息与迭代随机森林的在线动态安全评估方法
CN110428005A (zh) * 2019-07-31 2019-11-08 三峡大学 一种基于伞式算法的电力系统动态安全误分类约束方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030200010A1 (en) * 2002-04-22 2003-10-23 Hsiao-Dong Chiang Method and system for on-line dynamical screening of electric power system
CN110311376A (zh) * 2019-07-31 2019-10-08 三峡大学 一种电力系统动态安全评估综合模型及时空可视化方法
CN110417011A (zh) * 2019-07-31 2019-11-05 三峡大学 一种基于互信息与迭代随机森林的在线动态安全评估方法
CN110428005A (zh) * 2019-07-31 2019-11-08 三峡大学 一种基于伞式算法的电力系统动态安全误分类约束方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
周晓敏等: "一种基于样本分层的双向过采样方法", 《计算机科学》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112235293A (zh) * 2020-10-14 2021-01-15 西北工业大学 一种面向恶意流量检测正负样本均衡生成的过采样方法
CN112235293B (zh) * 2020-10-14 2022-09-09 西北工业大学 一种面向恶意流量检测正负样本均衡生成的过采样方法
CN112564090A (zh) * 2020-11-20 2021-03-26 东北电力大学 基于mblda的交直流系统暂态电压稳定监测方法
CN112564090B (zh) * 2020-11-20 2023-04-07 东北电力大学 基于mblda的交直流系统暂态电压稳定监测方法
CN116031880A (zh) * 2023-03-27 2023-04-28 山东大学 一种电网暂态稳定极限切除时间预测方法及系统

Similar Documents

Publication Publication Date Title
CN111651932A (zh) 一种基于集成分类模型的电力系统在线动态安全评估方法
CN110428005B (zh) 一种基于伞式算法的电力系统动态安全误分类约束方法
CN112508442B (zh) 基于自动化和可解释机器学习的暂态稳定评估方法及系统
CN111523785A (zh) 一种基于生成对抗网络的电力系统动态安全评估方法
CN111478314B (zh) 一种电力系统暂态稳定评估方法
Ondel et al. A method to detect broken bars in induction machine using pattern recognition techniques
CN111401749A (zh) 一种基于随机森林与极限学习回归的动态安全评估方法
CN110718910A (zh) 贝叶斯优化LightGBM的暂态稳定评估方法
CN109298225B (zh) 一种电压量测数据异常状态自动识别模型系统及方法
CN115048988B (zh) 基于高斯混合模型的不平衡数据集分类融合方法
CN110223193A (zh) 基于模糊聚类和rs-knn模型用于电网运行状态的判别方法及系统
CN111507504A (zh) 基于数据重采样的Adaboost集成学习电网故障诊断系统及方法
CN108364015A (zh) 一种具有安全机制的半监督超限学习机分类方法
CN111680875A (zh) 基于概率基线模型的无人机状态风险模糊综合评价方法
CN111652478B (zh) 基于伞式算法的电力系统电压稳定评估误分类约束方法
CN111343147A (zh) 一种基于深度学习的网络攻击检测装置及方法
CN111400966B (zh) 一种基于改进AdaBoost的电力系统静态电压稳定评估方法
Liu et al. An improved weighted KNN algorithm for imbalanced data classification
CN115526258A (zh) 基于Spearman相关系数特征提取的电力系统暂稳评估方法
CN115712871A (zh) 一种结合重采样和集成学习的电力电子系统故障诊断方法
Ramirez-Gonzalez et al. Convolutional neural network based approach for static security assessment of power systems
CN111585277A (zh) 一种基于混合集成模型的电力系统动态安全评估方法
CN116305683A (zh) 基于样本均衡化的电力系统暂态稳定评估方法及系统
Dehghani et al. Distribution feeder classification based on self organized maps (case study: Lorestan province, Iran)
CN115409335A (zh) 基于深度学习考虑未知扰动类型的电力系统扰动识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200911