CN111651932A - 一种基于集成分类模型的电力系统在线动态安全评估方法 - Google Patents
一种基于集成分类模型的电力系统在线动态安全评估方法 Download PDFInfo
- Publication number
- CN111651932A CN111651932A CN202010425310.3A CN202010425310A CN111651932A CN 111651932 A CN111651932 A CN 111651932A CN 202010425310 A CN202010425310 A CN 202010425310A CN 111651932 A CN111651932 A CN 111651932A
- Authority
- CN
- China
- Prior art keywords
- sample
- samples
- formula
- power system
- class
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 238000013145 classification model Methods 0.000 title claims abstract description 14
- 238000011156 evaluation Methods 0.000 claims abstract description 13
- 238000012549 training Methods 0.000 claims description 39
- 230000002457 bidirectional effect Effects 0.000 claims description 16
- 238000005070 sampling Methods 0.000 claims description 14
- 238000004088 simulation Methods 0.000 claims description 8
- 238000004422 calculation algorithm Methods 0.000 claims description 6
- 230000010354 integration Effects 0.000 claims description 5
- 230000035945 sensitivity Effects 0.000 claims description 5
- 230000001174 ascending effect Effects 0.000 claims description 4
- 125000004122 cyclic group Chemical group 0.000 claims description 4
- 230000002194 synthesizing effect Effects 0.000 claims description 4
- 238000005259 measurement Methods 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 230000001360 synchronised effect Effects 0.000 claims description 3
- 230000001131 transforming effect Effects 0.000 claims description 3
- 230000001788 irregular Effects 0.000 claims 1
- 238000013210 evaluation model Methods 0.000 abstract description 4
- 238000012360 testing method Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000007637 random forest analysis Methods 0.000 description 3
- 238000012706 support-vector machine Methods 0.000 description 3
- 230000001052 transient effect Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000011056 performance test Methods 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Evolutionary Computation (AREA)
- Entrepreneurship & Innovation (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Business, Economics & Management (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Tourism & Hospitality (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Quality & Reliability (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Medical Informatics (AREA)
- Game Theory and Decision Science (AREA)
- Computer Hardware Design (AREA)
- Geometry (AREA)
- Evolutionary Biology (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Complex Calculations (AREA)
Abstract
一种基于集成分类模型的电力系统在线动态安全评估方法,步骤1:建立一个电力系统安全评估的初始样本集;步骤2:通过特征选择构建一个包含关键变量和相应动态安全分类标签的高效样本集;步骤3:获得能够准确预测电力系统运行状态的动态安全评估模型;步骤4:将实时数据作为动态安全评估模型的输入实现电力系统的在线动态安全评估。本发明的目的是为了解决电力系统DSA过程中的评估数据的不平衡问题和误分类问题所带来的评估误差。
Description
技术领域
本法发明涉及电力系统动态安全评估领域,具体涉及一种基于集成分类模型的电力系统在线动态安全评估方法。
背景技术
随着电力系统规模的逐步增大,以及新能源的并网规模不断扩大,给系统的安全稳定运行带来了巨大的挑战,如何保证系统在更经济的条件下安全稳定运行已显得愈来愈重要。因此,电力系统的动态安全分析已经发展成为了研究的重要热点。电力系统的数据具有数据量大、数据种类混杂的特点,快速、准确捕捉电力系统的事故安全报警信号变得更加困难且格外的重要。采用电力系统动态安全评估(Dynamic Security Assessment,DSA)模型对电力系统数据进行安全分类总是存在以下两个问题:
第一、系统中数据样本的分类往往存在两种误分类,即将稳定状态误判为不稳定状态和将不稳定状态误判为稳定状态两种情况,错误的分类对电力系统的危害程度是不一样的,因此迫切需要能有效降低分类误差的方法来提高电力系统的稳定状况;
第二、电力系统中的不平衡数据集分类效果往往不是非常理想,数据的非平衡采样可能会使分类的结果并不能符合实际情况,因此迫切需要新的方法来解决非平衡数据采样带来的影响,提高系统动态安全稳定预测的精确度。
目前常用于电力系统DSA的分类方法有人工神经网络(Artificial NeuralNetwork,ANN),决策树(Decision Tree,DTs)、随机森林(Random Forest,RF)、支持向量机(Support Vector Machine,SVM)、极限学习机(Extreme Learning Machine,ELM)等。但这些方法往往集中在提高DSA总体分类精度上,将两种误分类同等对待,增加了DSA的误差,并且这些分类方法无法很好的处理数据样本中数据不平衡的问题,对DSA的评估精度产生了一定的影响。
授权公告为CN106849069B的专利文献公开了一种基于Pin-SVM的电力系统暂态稳定评估方法:该方法首先构建原始特征集,分为训练样本数据和测试样本数据;由训练样本数据训练电力系统的暂态稳定评估模型;采用电力系统暂态稳定评估模型对用测试样本数据模拟的电力系统状态进行稳定性评估,针对实际电力系统的故障类型,依据电力系统特征子集相对于电力系统稳定类与不稳定类的隶属度将故障划归到相应的类,当分类为不稳定类,则认为该故障为严重故障;反之,则认为该故障为不严重故障;在故障筛选和稳定评估完成的同时得到评价指标。该发明的缺点是没有考虑不平衡数据及样本数据的误分类对评估结果造成的影响,致使评估结果在置信度方面存在不足。
综上所述,目前的安全评估方法并不能满足现代电力系统对DSA方法的高适应性、高精度的需求。
发明内容
本发明为了解决电力系统DSA过程中的评估数据的不平衡问题和误分类问题所带来的评估误差,提出了一种基于集成分类模型的电力系统动态安全评估方法,采用样本分层的双向过采样(Stratified Bi-directional Oversampling,SBO)方法获取样本,并使用三种高精度NP分类器集成一个DSA模型,对于多个NP分类器的结果采用多数投票的方式得到系统DSA的最终结果,有效提高了DSA的精度。
为了实现上述发明目的,本发明采用了以下方案:
一种基于集成分类模型的电力系统在线动态安全评估方法,包括以下步骤:
步骤1:构建动态安全分类标签,基于电力系统历史运行数据与故障仿真产生的数据,建立一个电力系统安全评估的初始样本集;
步骤2:基于样本分层的双向过采样方法对初始样本集进行采样,并对采样的数据进行预处理,通过特征选择构建一个包含关键变量和相应动态安全分类标签的高效样本集;
步骤3:用获得的高效样本集对基于伞式算法的奈曼皮尔逊综合分类动态安全评估模型进行离线训练及更新,获得能够准确预测电力系统运行状态的动态安全评估模型;
步骤4:基于同步相量测量装置收集的实时数据,将实时数据作为动态安全评估模型的输入实现电力系统的在线动态安全评估。
在步骤1中,根据系统故障潮流仿真计算各种故障对应的极限切除时间(CriticalClearing Time,CCT),并基于CCT构建相应的动态安全指标如公式(1)所示:
式中:CCT是电力系统某个位置发生故障的极限切除时间;ACT为故障点的实际切除时间;
基于构建的DSI,构建相应的安全分类标签如公式(2)所示:
式中:η为用户自定义的阈值。
在步骤2中,基于SBO方法对初始样本集进行采样,电力系统仿真样本中,大部分样本为安全运行的样本,只有少数异常的包含电力系统不安全运行信息的样本。因此,该方法首先将样本集分为少数类样本和多数类样本,然后基于少数类样本的最高密度点和类内平均距离将少数类样本划分成密集层和稀疏层,然后找到密集层的边界样本,最后对这些边界样本和稀疏层样本进行双向过采样。
在对初始样本集进行采样时,包括以下步骤:
步骤(1)首先将样本分层;
步骤(2)将样本分层后,确定少数类样本的样本密集层边界区域;
步骤(3)得到密集层的边界区域后,采用双向过采样在互为近邻的少数类样本之间合成新样本。
在步骤(1)中,令初始样本集T={(x1,y1),(x2,y2),...,(xn,yn)},其中yi∈{-1,1}(i=1,2,...,n),T为包含n个样本点的二分类数据集,yi=1表示对应的样本点属于少数类,记为Q={(x1,1),(x2,1),...,(xq,1)},其中q代表少数类样本数,yi=-1表示对应的样本点属于多数类,记为M={(x1,-1),(x2,-1),...,(xm,-1)},其中m代表多数类样本数,T=Q∪M;
在步骤(2)中,将样本分层后,通过以下四步确定少数类样本的样本密集层边界区域:
b、通过公式(5)计算少数类样本之间的平均距离dist_aver:
c、根据公式(6)和公式(7)得到Q的密集层Den_area和稀疏层Spar_area如下:
Den_area={D(xj,xmax)≤dist_aver,xj∈Q} (6)
Spar_area={D(xj,xmax)>dist_aver,xj∈Q} (7)
d、根据公式(8)和公式(9)得到密集层的边界及其边界区域:
Bi_Sample={(xi,xj)|xi∈Nk(xj)∩xj∈Nk(xi)} (10)
式中:Nk(xi)表示xi的k个近邻。
在步骤2中,基于经过采样后的样本集,采用部分互信息(Partial MutualInformation,PMI)工具对样本集进行特征选择,探索样本集中各输入变量与安全分类标签之间的相关性,构建一个高效样本集;PMI的定义如公式(11)所示:
式中:x,y是在条件z下的随机变量;p为变量x,y的联合概率分布。
在步骤3中,用基于NP准则的伞式算法对多种传统分类器进行改造,最终得到一系列对应的NP分类器;在对多种NP分类器进行训练之前,首先根据电力系统实际需求调整NP分类器的参数,并设置一类分类错误阈值上限α、违规率δ及训练集循环分裂次数N,然后再将高效样本集作为输入进行NP分类器的训练。
在进行NP分类器的训练时,采用以下训练步骤:
k*=min{k∈(1,...,n):v(k)≤δ} (13)
(3)将fi应用于得到一组分数阈值候选项τi,并将τi中元素按递增顺序排序得到sort(τi),找到每一个等级阈值k*对应的分数阈值τi、sort(τi)和k*的表达式分别如公式(14)-(16)所示:
τi={ti,1,...,ti,n}={fi(x1),...,fi(xn)} (14)
sort(τi)={ti,(1),...,ti,(n)} (15)
(4)基于得分函数和阈值如公式(17)所示构造NP分类器:
(5)重复步骤(1)至(4),将训练集进行循环分裂训练N次,对于每种类型NP分类器分别构造N多个NP分类器,将一类分类错误分类结果按照公式(18)加权投票的集成方法作为该NP分类器最终结果输出:
最后通过对比分类结果的一类分类错误率(Error I)、准确率(AC)、精确率(PR)与安全类样本召回率(RE)的调和平均值F1指标来评判各个分类器的性能,并选择三种性能较为优良的分类器来构造DSA模型,对于三种分类器结果采用多数投票的形式获得DSA模型的最终结果,以此得到一个高精度的集成DSA模型。其中Error I、AC、PR、RE和F1的计算公式分别如公式(19)-(23)所示:
式中:F11表示将实际是稳定状态的样本预测为稳定状态的样本数;F10表示将实际是稳定状态的样本预测为不稳定状态的样本数;F01表示将实际是不稳定状态的样本预测为稳定状态的样本数;F00表示将实际是不稳定状态的样本预测为不稳定状态的样本数。
一种对电力系统安全评估的初始样本集进行采样的方法,它包括以下步骤:
步骤(1)首先将样本分层;
步骤(2)将样本分层后,确定少数类样本的样本密集层边界区域;
步骤(3)得到密集层的边界区域后,采用双向过采样在互为近邻的少数类样本之间合成新样本。
在步骤(1)中,令初始样本集T={(x1,y1),(x2,y2),...,(xn,yn)},其中yi∈{-1,1}(i=1,2,...,n),T为包含n个样本点的二分类数据集,yi=1表示对应的样本点属于少数类,记为Q={(x1,1),(x2,1),...,(xq,1)},其中q代表少数类样本数,yi=-1表示对应的样本点属于多数类,记为M={(x1,-1),(x2,-1),...,(xm,-1)},其中m代表多数类样本数,T=Q∪M;
在步骤(2)中,将样本分层后,通过以下四步确定少数类样本的样本密集层边界区域:
b、通过公式(5)计算少数类样本之间的平均距离dist_aver:
c、根据公式(6)和公式(7)得到Q的密集层Den_area和稀疏层Spar_area如下:
Den_area={D(xj,xmax)≤dist_aver,xj∈Q} (6)
Spar_area={D(xj,xmax)>dist_aver,xj∈Q} (7)
d、根据公式(8)和公式(9)得到密集层的边界及其边界区域:
Bi_Sample={(xi,xj)|xi∈Nk(xj)∩xj∈Nk(xi)} (10)
式中:Nk(xi)表示xi的k个近邻。
一种对奈曼皮尔逊分类器进行训练的方法,首先根据电力系统实际需求调整NP分类器的参数,并设置一类分类错误阈值上限α、违规率δ及训练集循环分裂次数N,然后再将高效样本集作为输入进行NP分类器的训练,其训练过程包括以下步骤:
k*=min{k∈(1,...,n):v(k)≤δ} (13)
(3)将fi应用于得到一组分数阈值候选项τi,并将τi中元素按递增顺序排序得到sort(τi),找到每一个等级阈值k*对应的分数阈值τi、sort(τi)和k*的表达式分别如公式(14)-(16)所示:
τi={ti,1,...,ti,n}={fi(x1),...,fi(xn)} (14)
sort(τi)={ti,(1),...,ti,(n)} (15)
(4)基于得分函数和阈值如公式(17)所示构造NP分类器:
(5)重复步骤(1)至(4),将训练集进行循环分裂训练N次,对于每种类型NP分类器分别构造N多个NP分类器,将一类分类错误分类结果按照公式(18)加权投票的集成方法作为该NP分类器最终结果输出:
最后通过对比分类结果的一类分类错误率(Error I)、准确率(AC)、精确率(PR)与安全类样本召回率(RE)的调和平均值F1指标来评判各个分类器的性能,并选择三种性能较为优良的分类器来构造DSA模型,对于三种分类器结果采用多数投票的形式获得DSA模型的最终结果,以此得到一个高精度的集成DSA模型。其中Error I、AC、PR、RE和F1的计算公式分别如公式(19)-(23)所示:
式中:F11表示将实际是稳定状态的样本预测为稳定状态的样本数;F10表示将实际是稳定状态的样本预测为不稳定状态的样本数;F01表示将实际是不稳定状态的样本预测为稳定状态的样本数;F00表示将实际是不稳定状态的样本预测为不稳定状态的样本数。
采用上述技术方案,能带来以下技术效果:
(1)本发明首先将初始样本中的少数类样本分为密集层和稀疏层,然后对密集层边界样本和稀疏层样本进行双向过采样,增加整个初始样本中少数类样本的占比,降低了电力系统安全评估中非平衡数据采样带来的影响,提高了模型的泛化能力;
(2)本技术采用NP准则对传统分类器进行改造,将3种性能良好的NP分类器集成到一个DSA模型中,并对三种NP分类器的结果采用多数投票的机制来确定整个集成DSA模型的最终结果,有效提高了评估模型的分类精度。
附图说明
图1是本发明的整体流程图;
图2是本发明的集成方案示意图;
图3是本发明的双向过采样流程图。
具体实施方式
一种基于集成分类模型的电力系统在线动态安全评估方法,其整体流程图和集体方案示意图分别如图1和图2所示,包括以下步骤:
步骤1:构建动态安全分类标签,基于电力系统历史运行数据与故障仿真产生的数据,建立一个电力系统安全评估的初始样本集;
步骤2:基于样本分层的双向过采样(Stratified Bi-directionalOversampling,SBO)方法对初始样本集进行采样,并对采样的数据进行预处理,通过特征选择构建一个包含关键变量和相应动态安全分类标签的高效样本集;
步骤3:用获得的高效样本集对基于伞式算法的奈曼皮尔逊(Neyman-Pearson,NP)综合分类动态安全评估(Dynamic Security Assessment,DSA)模型进行离线训练及更新,获得能够准确预测电力系统运行状态的DSA模型;
步骤4:基于同步相量测量装置(Phasor Measurement Units,PMUs)收集的实时数据,将实时数据作为DSA模型的输入实现电力系统的在线DSA。
在步骤1中,根据系统故障潮流仿真计算各种故障对应的极限切除时间(CriticalClearing Time,CCT),并基于CCT构建相应的动态安全指标如公式(1)所示:
式中:CCT是电力系统某个位置发生故障的极限切除时间;ACT为故障点的实际切除时间。
基于构建的DSI,构建相应的安全分类标签如公式(2)所示:
式中:η为用户自定义的阈值。
在步骤2中,基于SBO方法对初始样本集进行采样,采样过程如图3所示,该方法首先基于最高密度点和类内平均距离将少数类样本划分成密集层和稀疏层,然后找到少数类样本密集层的边界样本,最后对这些边界样本和稀疏层样本进行双向过采样,可以有效降低非平衡数据采样带来的影响。该方法的具体步骤如下:
(1)首先将样本分层:
令初始样本集T={(x1,y1),(x2,y2),...,(xn,yn)},其中yi∈{-1,1}(i=1,2,...,n),T为包含n个样本点的二分类数据集,yi=1表示对应的样本点属于少数类,记为Q={(x1,1),(x2,1),...,(xq,1)},其中q代表少数类样本数,yi=-1表示对应的样本点属于多数类,记为M={(x1,-1),(x2,-1),...,(xm,-1)},其中m代表多数类样本数,T=Q∪M。
(2)将样本分层后,通过以下四步确定少数类样本的样本密集层边界区域:
b、通过公式(5)计算少数类样本之间的平均距离dist_aver:
c、根据公式(6)和公式(7)得到Q的密集层Den_area和稀疏层Spar_area如下:
Den_area={D(xj,xmax)≤dist_aver,xj∈Q} (6)
Spar_area={D(xj,xmax)>dist_aver,xj∈Q} (7)
d、根据公式(8)和公式(9)得到密集层的边界及其边界区域:
Bi_Sample={(xi,xj)|xi∈Nk(xj)∩xj∈Nk(xi)} (10)
式中:Nk(xi)表示xi的k个近邻。
针对采样后的样本集,用PMI工具对样本集进行特征选择,探索样本集中各输入变量与安全分类标签之间的相关性,构建一个高效样本集。PMI的定义如公式(11)所示:
式中:x,y是在条件z下的随机变量;p为变量x,y的联合概率分布。
在步骤3中,用基于NP准则的伞式算法对多种传统分类器进行改造,其中包括RF、AdaBoost、SVM、LDA和Penlog,最终得到一系列对应的NP分类器NP-RF、NP-ADA、NP-SVM、NP-LDA、NP-Penlog。
在对多种NP分类器进行训练之前,首先根据电力系统实际需求调整NP分类器的参数,并设置一类分类错误阈值上限α、违规率δ及训练集循环分裂次数N,然后再将高效样本集作为输入进行NP分类器的训练,训练过程如下:
k*=min{k∈(1,...,n):v(k)≤δ} (13)
(3)将fi应用于得到一组分数阈值候选项τi,并将τi中元素按递增顺序排序得到sort(τi),找到每一个等级阈值k*对应的分数阈值τi、sort(τi)和k*的表达式分别如公式(14)-(16)所示:
τi={ti,1,...,ti,n}={fi(x1),...,fi(xn)} (14)
sort(τi)={ti,(1),...,ti,(n)} (15)
(4)基于得分函数和阈值如公式(17)所示构造NP分类器:
(5)重复步骤(1)至(4),将训练集进行循环分裂训练N次,对于每种类型NP分类器分别构造N多个NP分类器,将一类分类错误分类结果按照公式(18)加权投票的集成方法作为该NP分类器最终结果输出:
最后通过对比分类结果的一类分类错误率(Error I)、准确率(AC)、精确率(PR)与安全类样本召回率(RE)的调和平均值F1指标来评判各个分类器的性能,并选择三种性能较为优良的分类器来构造DSA模型,对于三种分类器结果采用多数投票的形式获得DSA模型的最终结果,以此得到一个高精度的集成DSA模型。其中Error I、AC、PR、RE和F1的计算公式分别如公式(19)-(23)所示:
式中:F11表示将实际是稳定状态的样本预测为稳定状态的样本数;F10表示将实际是稳定状态的样本预测为不稳定状态的样本数;F01表示将实际是不稳定状态的样本预测为稳定状态的样本数;F00表示将实际是不稳定状态的样本预测为不稳定状态的样本数。
在步骤4中,将PMUs实时收集的系统运行特征数据作为DSA模型的输入,实现电力系统的实时DSA。
实施例:
本发明在一个IEEE 23节点系统和一个IEEE 50机系统进行了测试。其中IEEE 23节点系统包含6台发电机、23个节点以及10台变压器;IEEE 50机系统包含50台发电机、145条母线和453条传输线。测试是在一台装有Intel Core i7处理器和8GB内存的计算机上执行的。基于历史数据库和三相短路故障仿真产生的样本,本次测试IEEE 23节点系统和IEEE50机系统分别获得了2847个样本和5230个样本。对于每个系统获得的样本,其中80%用于训练,20%用于性能测试。
通过五倍交叉验证测试了五个NP分类器的分类性能如表1所示,通过对比各个分类器的Error I、AC和F1值可以看出这五个分类器总体性能较好,选择其中的三种性能相对较好的NP-ADA、NP-RF和NP-SVM分类器集合成一个DSA模型,并对集成DSA模型的性能进行测试。将α=0.04,δ=0.05,N=1作为DSA模型中NP分类器的基准参数,测试结果如表2所示,由表可知在两个系统的测试中,集成DSA模型的准确率都高达98%以上。并在基准条件下,对以下三种情况进行了分析:固定违规率和分裂次数的条件下改变阈值α、固定阈值和分裂次数的条件下改变违规率δ、固定阈值和违规率的条件下改变分裂次数N。测试结果如表3所示,由表3可知不同条件下的集成DSA模型也具有较高的分类精度,符合现代电力系统的运行要求。
表1
五种NP分类器性能测试
表2
集成DSA模型的性能测试
表3
集成DSA模型在不同阈值、违规率和分裂次数下的性能测试
Claims (10)
1.一种基于集成分类模型的电力系统在线动态安全评估方法,其特征在于,包括以下步骤:
步骤1:构建动态安全分类标签,基于电力系统历史运行数据与故障仿真产生的数据,建立一个电力系统安全评估的初始样本集;
步骤2:基于样本分层的双向过采样方法对初始样本集进行采样,并对采样的数据进行预处理,通过特征选择构建一个包含关键变量和相应动态安全分类标签的高效样本集;
步骤3:用获得的高效样本集对基于伞式算法的奈曼皮尔逊综合分类动态安全评估模型进行离线训练及更新,获得能够准确预测电力系统运行状态的动态安全评估模型;
步骤4:基于同步相量测量装置收集的实时数据,将实时数据作为动态安全评估模型的输入实现电力系统的在线动态安全评估。
3.根据权利要求1所述的一种基于集成分类模型的电力系统在线动态安全评估方法,其特征在于:在步骤2中,基于SBO方法对初始样本集进行采样,首先将样本集分为少数类样本和多数类样本,然后基于少数类样本的最高密度点和类内平均距离将少数类样本划分成密集层和稀疏层,然后找到密集层的边界样本,最后对这些边界样本和稀疏层样本进行双向过采样。
4.根据权利要求3所述的一种基于集成分类模型的电力系统在线动态安全评估方法,其特征在于,在对初始样本集进行采样时,包括以下步骤:
步骤(1)首先将样本分层;
步骤(2)将样本分层后,确定少数类样本的样本密集层边界区域;
步骤(3)得到密集层的边界区域后,采用双向过采样在互为近邻的少数类样本之间合成新样本。
5.根据权利要求4所述的一种基于集成分类模型的电力系统在线动态安全评估方法,其特征在于,在步骤(1)中,令初始样本集T={(x1,y1),(x2,y2),...,(xn,yn)},其中yi∈{-1,1}(i=1,2,...,n),T为包含n个样本点的二分类数据集,yi=1表示对应的样本点属于少数类,记为Q={(x1,1),(x2,1),...,(xq,1)},其中q代表少数类样本数,yi=-1表示对应的样本点属于多数类,记为M={(x1,-1),(x2,-1),...,(xm,-1)},其中m代表多数类样本数,T=Q∪M;
在步骤(2)中,将样本分层后,通过以下四步确定少数类样本的样本密集层边界区域:
b、通过公式(5)计算少数类样本之间的平均距离dist_aver:
c、根据公式(6)和公式(7)得到Q的密集层Den_area和稀疏层Spar_area如下:
Den_area={D(xj,xmax)≤dist_aver,xj∈Q} (6)
Spar_area={D(xj,xmax)>dist_aver,xj∈Q} (7)
d、根据公式(8)和公式(9)得到密集层的边界及其边界区域:
Bi_Sample={(xi,xj)|xi∈Nk(xj)∩xj∈Nk(xi)} (10)
式中:Nk(xi)表示xi的k个近邻。
7.根据权利要求1至5其中之一所述的一种基于集成分类模型的电力系统在线动态安全评估方法,其特征在于:在步骤3中,用基于NP准则的伞式算法对多种传统分类器进行改造,最终得到一系列对应的NP分类器;在对多种NP分类器进行训练之前,首先根据电力系统实际需求调整NP分类器的参数,并设置一类分类错误阈值上限α、违规率δ及训练集循环分裂次数N,然后再将高效样本集作为输入进行NP分类器的训练。
8.一种对电力系统安全评估的初始样本集进行采样的方法,其特征在于,它包括以下步骤:
步骤(1)首先将样本分层;
步骤(2)将样本分层后,确定少数类样本的样本密集层边界区域;
步骤(3)得到密集层的边界区域后,采用双向过采样在互为近邻的少数类样本之间合成新样本。
9.根据权利要求8所述的对电力系统安全评估的初始样本集进行采样的方法,其特征在于:在步骤(1)中,令初始样本集T={(x1,y1),(x2,y2),...,(xn,yn)},其中yi∈{-1,1}(i=1,2,...,n),T为包含n个样本点的二分类数据集,yi=1表示对应的样本点属于少数类,记为Q={(x1,1),(x2,1),...,(xq,1)},其中q代表少数类样本数,yi=-1表示对应的样本点属于多数类,记为M={(x1,-1),(x2,-1),...,(xm,-1)},其中m代表多数类样本数,T=Q∪M;
在步骤(2)中,将样本分层后,通过以下四步确定少数类样本的样本密集层边界区域:
b、通过公式(5)计算少数类样本之间的平均距离dist_aver:
c、根据公式(6)和公式(7)得到Q的密集层Den_area和稀疏层Spar_area如下:
Den_area={D(xj,xmax)≤dist_aver,xj∈Q} (6)
Spar_area={D(xj,xmax)>dist_aver,xj∈Q} (7)
d、根据公式(8)和公式(9)得到密集层的边界及其边界区域:
Bi_Sample={(xi,xj)|xi∈Nk(xj)∩xj∈Nk(xi)} (10)
式中:Nk(xi)表示xi的k个近邻。
10.一种对奈曼皮尔逊分类器进行训练的方法,其特征在于,首先根据电力系统实际需求调整NP分类器的参数,并设置一类分类错误阈值上限α、违规率δ及训练集循环分裂次数N,然后再将高效样本集作为输入进行NP分类器的训练,其训练过程包括以下步骤:
k*=min{k∈(1,...,n):υ(k)≤δ} (13)
(3)将fi应用于得到一组分数阈值候选项τi,并将τi中元素按递增顺序排序得到sort(τi),找到每一个等级阈值k*对应的分数阈值τi、sort(τi)和k*的表达式分别如公式(14)-(16)所示:
τi={ti,1,...,ti,n}={fi(x1),...,fi(xn)} (14)
sort(τi)={ti,(1),...,ti,(n)} (15)
(4)基于得分函数和阈值如公式(17)所示构造NP分类器:
(5)重复步骤(1)至(4),将训练集进行循环分裂训练N次,对于每种类型NP分类器分别构造N多个NP分类器,将一类分类错误分类结果按照公式(18)加权投票的集成方法作为该NP分类器最终结果输出:
最后通过对比分类结果的一类分类错误率(Error I)、准确率(AC)、精确率(PR)与安全类样本召回率(RE)的调和平均值F1指标来评判各个分类器的性能,并选择三种性能较为优良的分类器来构造DSA模型,对于三种分类器结果采用多数投票的形式获得DSA模型的最终结果,以此得到一个高精度的集成DSA模型,其中Error I、AC、PR、RE和F1的计算公式分别如公式(19)-(23)所示:
式中:F11表示将实际是稳定状态的样本预测为稳定状态的样本数;F10表示将实际是稳定状态的样本预测为不稳定状态的样本数;F01表示将实际是不稳定状态的样本预测为稳定状态的样本数;F00表示将实际是不稳定状态的样本预测为不稳定状态的样本数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010425310.3A CN111651932A (zh) | 2020-05-19 | 2020-05-19 | 一种基于集成分类模型的电力系统在线动态安全评估方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010425310.3A CN111651932A (zh) | 2020-05-19 | 2020-05-19 | 一种基于集成分类模型的电力系统在线动态安全评估方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111651932A true CN111651932A (zh) | 2020-09-11 |
Family
ID=72346699
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010425310.3A Pending CN111651932A (zh) | 2020-05-19 | 2020-05-19 | 一种基于集成分类模型的电力系统在线动态安全评估方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111651932A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112235293A (zh) * | 2020-10-14 | 2021-01-15 | 西北工业大学 | 一种面向恶意流量检测正负样本均衡生成的过采样方法 |
CN112564090A (zh) * | 2020-11-20 | 2021-03-26 | 东北电力大学 | 基于mblda的交直流系统暂态电压稳定监测方法 |
CN116031880A (zh) * | 2023-03-27 | 2023-04-28 | 山东大学 | 一种电网暂态稳定极限切除时间预测方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030200010A1 (en) * | 2002-04-22 | 2003-10-23 | Hsiao-Dong Chiang | Method and system for on-line dynamical screening of electric power system |
CN110311376A (zh) * | 2019-07-31 | 2019-10-08 | 三峡大学 | 一种电力系统动态安全评估综合模型及时空可视化方法 |
CN110417011A (zh) * | 2019-07-31 | 2019-11-05 | 三峡大学 | 一种基于互信息与迭代随机森林的在线动态安全评估方法 |
CN110428005A (zh) * | 2019-07-31 | 2019-11-08 | 三峡大学 | 一种基于伞式算法的电力系统动态安全误分类约束方法 |
-
2020
- 2020-05-19 CN CN202010425310.3A patent/CN111651932A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030200010A1 (en) * | 2002-04-22 | 2003-10-23 | Hsiao-Dong Chiang | Method and system for on-line dynamical screening of electric power system |
CN110311376A (zh) * | 2019-07-31 | 2019-10-08 | 三峡大学 | 一种电力系统动态安全评估综合模型及时空可视化方法 |
CN110417011A (zh) * | 2019-07-31 | 2019-11-05 | 三峡大学 | 一种基于互信息与迭代随机森林的在线动态安全评估方法 |
CN110428005A (zh) * | 2019-07-31 | 2019-11-08 | 三峡大学 | 一种基于伞式算法的电力系统动态安全误分类约束方法 |
Non-Patent Citations (1)
Title |
---|
周晓敏等: "一种基于样本分层的双向过采样方法", 《计算机科学》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112235293A (zh) * | 2020-10-14 | 2021-01-15 | 西北工业大学 | 一种面向恶意流量检测正负样本均衡生成的过采样方法 |
CN112235293B (zh) * | 2020-10-14 | 2022-09-09 | 西北工业大学 | 一种面向恶意流量检测正负样本均衡生成的过采样方法 |
CN112564090A (zh) * | 2020-11-20 | 2021-03-26 | 东北电力大学 | 基于mblda的交直流系统暂态电压稳定监测方法 |
CN112564090B (zh) * | 2020-11-20 | 2023-04-07 | 东北电力大学 | 基于mblda的交直流系统暂态电压稳定监测方法 |
CN116031880A (zh) * | 2023-03-27 | 2023-04-28 | 山东大学 | 一种电网暂态稳定极限切除时间预测方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111651932A (zh) | 一种基于集成分类模型的电力系统在线动态安全评估方法 | |
CN110428005B (zh) | 一种基于伞式算法的电力系统动态安全误分类约束方法 | |
CN112508442B (zh) | 基于自动化和可解释机器学习的暂态稳定评估方法及系统 | |
CN111523785A (zh) | 一种基于生成对抗网络的电力系统动态安全评估方法 | |
CN111478314B (zh) | 一种电力系统暂态稳定评估方法 | |
Ondel et al. | A method to detect broken bars in induction machine using pattern recognition techniques | |
CN111401749A (zh) | 一种基于随机森林与极限学习回归的动态安全评估方法 | |
CN110718910A (zh) | 贝叶斯优化LightGBM的暂态稳定评估方法 | |
CN109298225B (zh) | 一种电压量测数据异常状态自动识别模型系统及方法 | |
CN115048988B (zh) | 基于高斯混合模型的不平衡数据集分类融合方法 | |
CN110223193A (zh) | 基于模糊聚类和rs-knn模型用于电网运行状态的判别方法及系统 | |
CN111507504A (zh) | 基于数据重采样的Adaboost集成学习电网故障诊断系统及方法 | |
CN108364015A (zh) | 一种具有安全机制的半监督超限学习机分类方法 | |
CN111680875A (zh) | 基于概率基线模型的无人机状态风险模糊综合评价方法 | |
CN111652478B (zh) | 基于伞式算法的电力系统电压稳定评估误分类约束方法 | |
CN111343147A (zh) | 一种基于深度学习的网络攻击检测装置及方法 | |
CN111400966B (zh) | 一种基于改进AdaBoost的电力系统静态电压稳定评估方法 | |
Liu et al. | An improved weighted KNN algorithm for imbalanced data classification | |
CN115526258A (zh) | 基于Spearman相关系数特征提取的电力系统暂稳评估方法 | |
CN115712871A (zh) | 一种结合重采样和集成学习的电力电子系统故障诊断方法 | |
Ramirez-Gonzalez et al. | Convolutional neural network based approach for static security assessment of power systems | |
CN111585277A (zh) | 一种基于混合集成模型的电力系统动态安全评估方法 | |
CN116305683A (zh) | 基于样本均衡化的电力系统暂态稳定评估方法及系统 | |
Dehghani et al. | Distribution feeder classification based on self organized maps (case study: Lorestan province, Iran) | |
CN115409335A (zh) | 基于深度学习考虑未知扰动类型的电力系统扰动识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200911 |