CN116561573A - 一种电压稳定评估的训练集循环分裂训练方法 - Google Patents
一种电压稳定评估的训练集循环分裂训练方法 Download PDFInfo
- Publication number
- CN116561573A CN116561573A CN202310415366.4A CN202310415366A CN116561573A CN 116561573 A CN116561573 A CN 116561573A CN 202310415366 A CN202310415366 A CN 202310415366A CN 116561573 A CN116561573 A CN 116561573A
- Authority
- CN
- China
- Prior art keywords
- training
- classifier
- class
- classification
- umbrella
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012549 training Methods 0.000 title claims abstract description 73
- 238000000034 method Methods 0.000 title claims abstract description 36
- 238000011156 evaluation Methods 0.000 title claims abstract description 22
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 18
- 238000012360 testing method Methods 0.000 claims abstract description 15
- 238000002790 cross-validation Methods 0.000 claims abstract description 5
- 239000013598 vector Substances 0.000 claims description 12
- 238000012216 screening Methods 0.000 claims description 8
- 238000010187 selection method Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 5
- 125000004122 cyclic group Chemical group 0.000 claims description 5
- 238000013097 stability assessment Methods 0.000 claims description 5
- 230000008569 process Effects 0.000 claims description 4
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 claims description 3
- 230000000452 restraining effect Effects 0.000 claims description 2
- 239000000523 sample Substances 0.000 claims 12
- 230000000875 corresponding effect Effects 0.000 description 24
- 230000007246 mechanism Effects 0.000 description 11
- 230000006870 function Effects 0.000 description 10
- 230000015556 catabolic process Effects 0.000 description 8
- 238000005259 measurement Methods 0.000 description 7
- 230000008859 change Effects 0.000 description 5
- 238000003066 decision tree Methods 0.000 description 5
- 238000013210 evaluation model Methods 0.000 description 5
- 230000007547 defect Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 230000006641 stabilisation Effects 0.000 description 2
- 238000011105 stabilization Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000001052 transient effect Effects 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000011056 performance test Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000000192 social effect Effects 0.000 description 1
- 238000007711 solidification Methods 0.000 description 1
- 230000008023 solidification Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000033772 system development Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Educational Administration (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Development Economics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Entrepreneurship & Innovation (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Supply And Distribution Of Alternating Current (AREA)
Abstract
一种电压稳定评估的训练集循环分裂训练方法,它将高效样本集采用十倍交叉验证法分为训练集和测试集,将其送入到伞式NP分类器中进行模型离线训练,基于伞式算法对多种传统分离器进行改造,得到一系列对应NP分类器的伞式NP分类器;在模型训练阶段,在保证总体分类精度的前提下,根据一类分类错误和二类分类错误性质的不同基于伞式NP分类器对一类误分类错误设置一类分类错误阈值上限进行约束,并且通过设置训练集循环分裂训练次数M控制每种NP分类器的训练模式,获得一系列子NP分类器,并对各种类型的NP分类器的子NP分类器采用加权投票方式获得各NP分类器的稳定不稳定分类结果,从而优化VSA模型的分类性能。
Description
技术领域
本发明属于电力系统电压稳定评估领域,具体涉及一种电压稳定评估的训练集循环分裂训练方法,本发明是申请号为“2020104264273”发明名称为“基于伞式算法的电力系统电压稳定评估误分类约束方法”的发明专利的分案申请。
背景技术
电力系统是世界上最复杂的工业系统之一,其安全运行一直是系统发展所关注的问题。近年来,现代电力系统的广域互联、可再生能源的投入、新设备的应用、负荷的快速增长、输电容量的局限性等趋势越来越明显。电力系统的运行负担越来越重,运行状态越来越接近极限。静态电压稳定作为一个备受关注的问题,许多大停电事故都与其相关,可能会造成巨大的经济损失和不良的社会影响。因此,进行可靠的电压稳定评估(VoltageStability Assessment,VSA)已引起越来越多的研究人员的兴趣和研究,这对电力系统的安全运行具有重要意义。传统的分析方法用于实时VSA存在耗时、计算速度慢等缺陷,而目前基于数据驱动的解决方案也存在一些限制:
①电力系统VSA中存在两种类型的误分类情况:将不安全状态判断为安全状态的一类分类错误;将安全状态判定为不安全状态的二类分类错误。目前大多数VSA研究主要集中在如何提高VSA的总体分类精度上,容易忽略一类分类错误约束。在实际电力系统运行中,一类分类错误和二类分类错误对系统运行及社会影响是不同的。一类分类错误相较于二类分类错误后果更为严重。②对于VSA性能的研究,传统的VSA模型一般集中于以某一特定数据驱动工具为核心进行VSA模型的构建。对于电力系统复杂多变的运行环境,这种VSA模型提供的结果容易受限于模型本身性能优良,模型的泛化能力不强。③传统的模型训练机制采用比较单一固化的离线与在线相结合方式,当面对新的运行工况时,一般都是当前评估模型不满足评估要求时就立即启动模型重新训练机制。这种模型更新机制,对于系统不可见的运行工况会加大实时VSA时模型离线训练的负担,对离线训练的要求较高。
综上所述,目前的VSA方法不能有效地约束评估误分类给电力系统安全运行带来的影响,且对于电力系统复杂多变的运行环境,在线VSA方法设计也存在一些局限性。
授权公告号为CN105139289A的专利文献公开了一种基于错分代价分类学习的电网暂态电压稳定评估方法,以同步相量测量单元的动态量测数据为基础,从大量动态量测数据构成的时间序列中提取出与电网状态密切相关的关键子序列;通过设定电网稳定、失稳状态的不同错分代价,向学习样本引入权重系数;利用融入样本权重系数的决策树算法进行分类学习,得到决策树模型,将决策树模型用于在线监测,对电网暂态电压稳定状况实施评估。它的缺陷在于:
①不能很好的权衡总体分类精度与一类分类错误率关系,根据VSA不同误分类严重程度不同对一类分类错误进行约束,降低一类分类错误对系统运行的风险;②仅依赖于决策树构造的VSA模型,当数据集中对象属性有缺失值,树的性能可能有问题,且树节点中属性的次序可能对性能具有负面影响。使得仅仅依靠决策树构造的VSA模型的适泛化能力得不到保障;③对于在线VSA的实施,缺乏可靠的模型更新机制,难以保证在线VSA对于不可见的运行工况的有效性。
发明内容
本发明为了解决传统基于数据驱动工具构建的VSA模型在误分类约束及模型更新机制方面存在的局限性,提出基于伞式算法的电力系统电压稳定评估误分类约束方法,使得VSA模型可提供权衡总体分类精度与一类分类错误约束的VSA结果。
为了实现上述发明目的,本发明采取如下技术方案:
基伞式算法的电力系统电压稳定评估误分类约束方法,包括以下步骤:
步骤1:构建初始数据集,并基于电力系统电压稳定评估规则,构建电压稳定安全分类标签;
步骤2:利用线性及非线性关系探索工具用于特征选择,对初始样本集的运行变量与电压稳定安全分类标签之间的关联程度进行探索,选择关键运行变量构建高效样本集;
步骤3:基于伞式算法同时部署多种类型奈曼皮尔逊分类器构建电压稳定评估模型,将高效样本集及其对应的电压稳定安全分类标签作为模型输入,对电压稳定评估模型进行离线训练;
步骤4:考虑电力系统运行拓扑结构变化、发电机/负荷间功率分布变化、相量测量单元数据丢失等因素对系统影响,将新的运行工况条件下产生的新样本集送入电压稳定评估模型中进行模型更新;
步骤5:基于广域监测系统的相量测量单元实时收集的电力系统运行数据,选择相应的特征,利用已训练好的电压稳定评估模型完成在线电压稳定评估。
在步骤1中,通过电力系统PMUs对系统运行数据的实时更新收集,获取历史系统工作点的运行数据,构建初始数据集,利用连续潮流CPF法模拟各种运行工况的电压崩溃情况,使工作点从基本情况向崩溃点逐渐移动,当电力系统不能满足不断增加的负荷需求时,潮流方程的雅可比矩阵奇异,潮流不能收敛,出现电压崩溃点,利用工作点与电压崩溃点之间的负载有功功率差值关系,量化当前运行点与崩溃点电压之间的关系。
构建电压稳定指标VSI如公式(1)所示:
式中:P0初始负载有功功率,Pmax为对应的最大可承受有功功率;
VSI值代表电力系统安全水平,在0到100%之间变化,为了建立安全分类规则可对VSI可设置一个适当可接受的阈值η来明显区分电压安全状态,则构建电压稳定标签如公式(2)所示:
在步骤2中,在特征选择过程考虑系统运行变量关系的复杂多变,结合具有线性关系探索功能的PCC和具有非线性关系探索功能的MIC作为特征选择方法,有效地探索运行变量(如发电机/支路的有功/无功功率、电压幅值等)与电压稳定指标之间的线性关系和非线性关系,确保筛选出有效性的关键运行变量,构建高效样本集,解决数据高维问题。
将电力系统第i个运行点的各个特征及其对应VSI构建特征描述集合F的一个行向量Fi={x1,x2,...,xm,yi}(1≤i≤m),则n种运行工况运行数据的特征描述集合F={X1,X2,...,Xm,Y},其中Xk为各种运行工况下的同一个特征量构成的列向量(1≤k≤n),Y={y1,y2,...,yn}代表个运行工况的VSI集合,对各种运行工况的运行数据变量集合X和对应的VSI集合Y分别采用PCC及MIC检测各运行变量与VSI之间的相关性,分别筛选出与VSI高度相关的高排名的线性关系运行变量及非线性运行变量;
对于线性关系探索PCC:设ρ(X,Y)为特征量X,Y的皮尔逊相关系数,计算公式如公式(3)所示:
式中:n为单个特征量的维度;X及Y分别为X和Y所含元素的平均值;
PCC的取值范围为-1至1,且具有如下几个属性:
1)ρ(x,y)>0说明X和Y之间存在正相关;
2)ρ(x,y)=0说明X和Y之间无线性相关性;
3)ρ(x,y)<0表示X与Y之间存在负相关;
4)ρ(x,y)绝对值越大,表示X与Y之间存在较强的线性相关关系;
对于非线性关系探索MIC:给定一个有限有序对向量数据集D={(xi,yi),i=1,2,...,n},若X和Y轴分别被划分为x和y个格子,获得x*y网格G,D中的变量值落入G的网格中得到相应地概率分布D|G,其中x和y是正整数,在固定网格划分数的前提下,通过改变网格划分位置,会得到不同的互信息值,其中最大互信息值如公式(4)下所示:
I*(D,x,y)=maxI(D|G) (4)
式中:I(D|G)代表D|G内数据点之间的互信息;
为了方便在不同的维数之间进行比较,对公式(4)进行归一化如公式(5)所示,使其取值在区间[0,1]:
已知样本量为n的有序对数据集D,则定义该集合中两变量X、Y的MIC如公式(6)所示:
式中:xy≤B(n){B(n)=na,通常设置为n0.6};
MIC的取值范围为0至1,且具有如下几个属性:
1)对于具有趋于无噪声的函数关系的两变量,其MIC值趋于1;
2)对于更广泛类别的无噪声关系,其MIC值趋于1;
3)对于在统计学上相互独立的两变量,其MIC值趋于0。
将高效样本集采用十倍交叉验证法分为训练集和测试集,将其送入到伞式NP分类器中进行模型离线训练,基于伞式算法对多种传统分离器进行改造,得到一系列对应NP分类器的伞式NP分类器,在模型训练阶段,在保证总体分类精度的前提下,可以根据一类分类错误和二类分类错误性质的不同基于伞式NP分类器对一类误分类错误设置一类分类错误阈值上限α进行约束,并且可以通过设置训练集循环分裂训练次数M控制每种NP分类器的训练模式,获得一系列子NP分类器,并对各种类型的NP分类器的子NP分类器采用加权投票方式获得各NP分类器的稳定不稳定分类结果,从而优化VSA模型的分类性能。
一种用于电压稳定评估中特性选择过程的特征选择方法,结合具有线性关系探索功能的PCC和具有非线性关系探索功能的MIC作为特征选择方法,探索运行变量与电压稳定指标之间的线性关系和非线性关系,确保筛选出有效性的关键运行变量,构建高效样本集;所述运行变量包括发电机的有功和/或无功功率、支路的有功和/或无功功率、电压幅值。
将电力系统第i个运行点的各个特征及其对应VSI构建特征描述集合F的一个行向量Fi={x1,x2,...,xm,yi}(1≤i≤m),则n种运行工况运行数据的特征描述集合F={X1,X2,...,Xm,Y},其中Xk为各种运行工况下的同一个特征量构成的列向量(1≤k≤n),Y={y1,y2,...,yn}代表个运行工况的VSI集合,对各种运行工况的运行数据变量集合X和对应的VSI集合Y分别采用PCC及MIC检测各运行变量与VSI之间的相关性,分别筛选出与VSI高度相关的高排名的线性关系运行变量及非线性运行变量;
对于线性关系探索PCC:设ρ(X,Y)为特征量X,Y的皮尔逊相关系数,计算公式如公式(3)所示:
式中:n为单个特征量的维度;及/>分别为X和Y所含元素的平均值;
PCC的取值范围为-1至1,且具有如下几个属性:
1)ρ(x,y)>0说明X和Y之间存在正相关;
2)ρ(x,y)=0说明X和Y之间无线性相关性;
3)ρ(x,y)<0表示X与Y之间存在负相关;
4)ρ(x,y)绝对值越大,表示X与Y之间存在较强的线性相关关系,
对于非线性关系探索MIC:给定一个有限有序对向量数据集D={(xi,yi),i=1,2,...,n},若X和Y轴分别被划分为x和y个格子,获得x*y网格G,D中的变量值落入G的网格中得到相应地概率分布D|G,其中x和y是正整数;在固定网格划分数的前提下,通过改变网格划分位置,会得到不同的互信息值,其中最大互信息值如公式(4)下所示:
I*(D,x,y)=maxI(D|G) (4)
式中:I(D|G)代表D|G内数据点之间的互信息;
为了方便在不同的维数之间进行比较,对公式(4)进行归一化如公式(5)所示,使其取值在区间[0,1]:
已知样本量为n的有序对数据集D,则定义该集合中两变量X、Y的MIC如公式(6)所示:
式中:xy≤B(n){B(n)=na,通常设置为n0.6};
MIC的取值范围为0至1,且具有如下几个属性:
1)对于具有趋于无噪声的函数关系的两变量,其MIC值趋于1;
2)对于更广泛类别的无噪声关系,其MIC值趋于1;
3)对于在统计学上相互独立的两变量,其MIC值趋于0。
一种电压稳定评估的训练集循环分裂训练方法,将高效样本集采用多倍交叉验证法分为训练集和测试集,将其送入到伞式NP分类器中进行模型离线训练,基于伞式算法对多种传统分离器进行改造,得到一系列对应NP分类器的伞式NP分类器,在模型训练阶段,在保证总体分类精度的前提下,可以根据一类分类错误和二类分类错误性质的不同基于伞式NP分类器对一类误分类错误设置一类分类错误阈值上限α进行约束,并且可以通过设置训练集循环分裂训练次数M控制每种NP分类器的训练模式,获得一系列子NP分类器,并对各种类型的NP分类器的子NP分类器采用加权投票方式获得各NP分类器的稳定不稳定分类结果,从而优化VSA模型的分类性能。
伞式算法包括如下步骤:
1)根据设定的M,对训练集中的0类样本S0(不稳定判定为稳定的误分类样本)进行二等份随机分裂得到样本和样本/>结合1类样本S1(稳定判定为不稳定的误分类样本)用于基本分类器;
2)用于分类器计算违章率上限υ(k)如公式(7)所示,计算每个样本等级阈值k*如公式(8);将/>结合S1训练各分类器(如RF)得分函数fi:
式中:α为一类分类错误阈值;
k*=min{k∈(1,...,n):υ(k)≤δ} (8)
式中:δ为一类分类错误阈值的违规率,
3)将fi应用于得到一组分数阈值候选项τi如公式(9),且将τi中元素按公式(10)递增顺序排序得到sort(τi),并找到等级阈值k*对应的分数阈值/>如公式(11):
τi={ti,1,...,ti,n}={fi(x1),...,fi(xn)} (9)
sort(τi)={ti,(1),...,ti,(n)} (10)
4)基于得分函数和阈值如公式(12)所示构造NP分类器:
5)重复步骤1)至4),将训练集进行循环分裂训练M次,构造M多个NP分类器,将一类分类错误结果按照公式(13)加权投票的集成方法作为最终结果输出:
采用上述技术方案,具有以下技术效果:
(1)本技术方案考虑了电力系统VSA研究中容易忽略的误分类问题,针对后果较为严重的一类分类错误,根据实际运行需求设置一类分类错误阈值,在确保总体分类精度的前提下约束一类分类错误,从而达到权衡总体分类精度与一类分类错误的作用,降低电力系统的一类分类错误带来的运行风险。
(2)本技术方案对于数据高维问题,在采取特征选择处理时同时兼顾了数据线性与非线性关系,通过非线性关系探索的MIC及线性关系探索的PCC来确保数据降维时的特征可靠性。
(3)本技术方案基于伞式NP算法可同时部署多种类型的NP分类器,设计一种新的VSA模型更新机制,通过在线可同时调用多个分类器来减少模型在线应用时模型训练负担,可有效保证无缝的VSA实现。同时对于一组训练集采用循环分裂模式训练VSA模型,避免传统VSA模型训练模式太依赖于训练数据的弊端,保证VSA模型训练的有效性方面。
附图说明
图1是本发明整体方案流程图;
图2是本发明VSA模型更新流程图;
图3是本发明23节点系统拓扑结构图;
图4是本发明不同NP分类器ROC带示意图。
具体实施方式
下面结合附图与实施例对本发明作进一步说明。
如图1所示为基于伞式算法的电力系统电压稳定评估误分类约束方法流程图,包括以下步骤:
步骤1:构建初始数据集,并基于电力系统电压稳定评估规则,构建电压稳定安全分类标签;
步骤2:利用线性及非线性关系探索工具用于特征选择,对初始样本集的运行变量与电压稳定安全分类标签之间的关联程度进行探索,选择关键运行变量构建高效样本集;
步骤3:基于伞式算法同时部署多种类型NP分类器构建电压稳定评估VSA模型,将高效样本集及其对应的电压稳定安全分类标签作为模型输入,对VSA模型进行离线训练;
步骤4:考虑电力系统运行拓扑结构变化、发电机/负荷间功率分布变化、相量测量单元PMU数据丢失等因素对系统影响,将新的运行工况条件下产生的新样本集送入VSA模型中进行模型更新;
步骤5:对PMU实时测量数据进行在线VSA。
在图1步骤1中,通过电力系统PMUs对系统运行数据的实时更新收集,可从电力公司获取大量历史系统工作点的运行数据,构建初始数据集。利用连续潮流CPF法模拟各种运行工况的电压崩溃情况。随着负荷需求的缓慢增加,工作点将从基本情况向崩溃点逐渐移动。当电力系统不能满足不断增加的负荷需求时,潮流方程的雅可比矩阵奇异,潮流不能收敛,出现电压崩溃点。利用工作点与电压崩溃点之间的负载有功功率差值关系,量化当前运行点与崩溃点电压之间的关系,构建电压稳定指标VSI如公式(1)所示:
式中:P0初始负载有功功率,Pmax为对应的最大可承受有功功率。
VSI值代表电力系统安全水平,在0到100%之间变化。为了建立安全分类规则可对VSI可设置一个适当可接受的阈值η来明显区分电压安全状态,则构建电压稳定标签如公式(2)所示:
在图1步骤2中,电力系统在线VSA需快速利用系统实时运行的海量数据对系统状态进行判断。在特征选择过程考虑系统运行变量关系的复杂多变,结合具有线性关系探索功能的PCC和具有非线性关系探索功能的MIC作为特征选择方法,有效地探索运行变量(如发电机/支路的有功/无功功率、电压幅值等)与电压稳定指标之间的线性关系和非线性关系,确保筛选出有效性的关键运行变量,构建高效样本集,解决数据高维问题。
将电力系统第i个运行点的各个特征及其对应VSI构建特征描述集合F的一个行向量Fi={x1,x2,...,xm,yi}(1≤i≤m),则n种运行工况运行数据的特征描述集合F={X1,X2,...,Xm,Y},其中Xk为各种运行工况下的同一个特征量构成的列向量(1≤k≤n),Y={y1,y2,...,yn}代表个运行工况的VSI集合。对各种运行工况的运行数据变量集合X和对应的VSI集合Y分别采用PCC及MIC检测各运行变量与VSI之间的相关性,分别筛选出与VSI高度相关的高排名的线性关系运行变量及非线性运行变量。
对于线性关系探索PCC:设ρ(X,Y)为特征量X,Y的皮尔逊相关系数,计算公式如公式(3)所示:
式中:n为单个特征量的维度;及/>分别为X和Y所含元素的平均值。
PCC的取值范围为-1至1,且具有如下几个属性:
1)ρ(x,y)>0说明X和Y之间存在正相关;
2)ρ(x,y)=0说明X和Y之间无线性相关性;
3)ρ(x,y)<0表示X与Y之间存在负相关;
4)ρ(x,y)绝对值越大,表示X与Y之间存在较强的线性相关关系。
对于非线性关系探索MIC:给定一个有限有序对向量数据集D={(xi,yi),i=1,2,...,n},若X和Y轴分别被划分为x和y个格子,获得x*y网格G,D中的变量值落入G的网格中得到相应地概率分布D|G,其中x和y是正整数。在固定网格划分数的前提下,通过改变网格划分位置,会得到不同的互信息值,其中最大互信息值如公式(4)下所示:
I*(D,x,y)=maxI(D|G) (4)
式中:I(D|G)代表D|G内数据点之间的互信息。
为了方便在不同的维数之间进行比较,对公式(4)进行归一化如公式(5)所示,使其取值在区间[0,1]:
已知样本量为n的有序对数据集D,则定义该集合中两变量X、Y的MIC如公式(6)所示:
式中:xy≤B(n){B(n)=na,通常设置为n0.6}。
MIC的取值范围为0至1,且具有如下几个属性:
1)对于具有趋于无噪声的函数关系的两变量,其MIC值趋于1;
2)对于更广泛类别的无噪声关系,其MIC值趋于1;
3)对于在统计学上相互独立的两变量,其MIC值趋于0。
在图1步骤3中,将高效样本集采用十倍交叉验证法分为训练集和测试集,将其送入到伞式NP分类器中进行模型离线训练,基于伞式算法对多种传统分离器:RF、AdaBoost、SVM、NB、NNB、Penlog等进行改造,得到一系列对应NP分类器的伞式NP分类器:NP-RF、NP-ADA、NP-SVM、NP-NB、NP-NNB、NP-Penlog。在模型训练阶段,在保证总体分类精度的前提下,可以根据一类分类错误和二类分类错误性质的不同基于伞式NP分类器对一类误分类错误设置一类分类错误阈值上限α进行约束,并且可以通过设置训练集循环分裂训练次数M控制每种NP分类器的训练模式,获得一系列子NP分类器,并对各种类型的NP分类器的子NP分类器采用加权投票方式获得各NP分类器的稳定不稳定分类结果,从而优化VSA模型的分类性能。
其中伞式算法的具体流程如下:
1)根据设定的M,对训练集中的0类样本S0(不稳定判定为稳定的误分类样本)进行二等份随机分裂得到样本和样本/>结合1类样本S1(稳定判定为不稳定的误分类样本)用于基本分类器;
2)用于分类器计算违章率上限υ(k)如公式(7)所示,计算每个样本等级阈值k*如公式(8);将/>结合S1训练各分类器(如RF)得分函数fi:
式中:α为一类分类错误阈值。
k*=min{k∈(1,...,n):υ(k)≤δ} (8)
式中:δ为一类分类错误阈值的违规率。
3)将fi应用于得到一组分数阈值候选项τi如公式(9),且将τi中元素按公式(10)递增顺序排序得到sort(τi),并找到等级阈值k*对应的分数阈值/>如公式(11):
τi={ti,1,...,ti,n}={fi(x1),...,fi(xn)} (9)
sort(τi)={ti,(1),...,ti,(n)} (10)
4)基于得分函数和阈值如公式(12)所示构造NP分类器:
5)重复步骤1)至4),将训练集进行循环分裂训练M次,构造M多个NP分类器,将一类分类错误结果按照公式(13)加权投票的集成方法作为最终结果输出:
在图1步骤4中,对于模型的更新如图2所示,具体更新方式如下:
1)第一种情况:当所改变的新运行工况存在于当前离线数据库列表中,当前的VSA模型将立即被对应的新模型所替代,进行VSA。
2)第二种情况:当对于改变的新运行工况,目前使用VSA模型NP分类器能提供可接受的评价结果时,模型继续使用。实现快速的VSA。
3)第三种情况:当出现了不可见的运行工况,现有VSA模型中的所有NP分类器都不能提供可接受的评估结果。通过将更新的样本集用于伞式NP分类器重新训练,构造新的VSA模型适用于新的运行工况。
在图1步骤4中,对于第三种情况的VSA模型重新训练更新,为了快速评估每个NP分类器对于新运行工况的训练效果,采用了由ROC曲线演化而来的具有两条ROC曲线的ROC带及其对应的AUC值来评估各NP分类器分类性能。其中ROC曲线越接近左上角,对应的分类器性能越好。而AUC值在0到1之间,当AUC值大于0.5时,AUC值越高,分类性能越好,ROC带上下曲线对应的AUC值分别表示为AUC.U和AUC.L。
在图1步骤5中,对于系统PMUs实时收集的系统运行数据,通过提出的方案快速选择需要的特征数据,送入到已训练好的VSA模型中进行在线VSA,快速给出部署的满足评估要求的S种NP分类器结果。同时为了保证VSA结果的可靠性,获取可置信的VSA结果,对各个NP分类器的结果采用如下少数服从多数投票机制,获取在线VSA的最终结果。
1)当S为奇数时,大于S的NP分类器输出安全标签为1,则给出在线VSA结果为系统安全;大于/>S的NP分类器输出安全标签为0,则给出在线VSA结果为系统不安全;
2)当S为偶数时,剔除分类性能最差的NP分类器结果,然后按照步骤1)所示获取最终的VSA结果。
实施例:
本发明在一个23节点系统和一个实际7917节点系统中进行了测试,其中23节点系统如图3所示包含23个节点,10个变压器及6台发电机。而7917节点系统包含7917个节点、1325台发电机和5590个负载。为了捕获更多系统行为以丰富数据库,考虑到不同的操作条件,在软件PSS/E中使用Python程序自动执行一系列模拟。发电机/负载功率分布随机地在80%和120%之间变化,并且基于一系列连续潮流模拟,23节点系统获得3896个样本,7917系统获得9876个样本。测试是在一台装有Intel Core i7处理器和8GB内存的计算机上执行的。
图4、表1所示为23节点系统测试的6种NP分类器对应的ROC带及AUC值(AUC.U和AUC.L分别代表上ROC带和下ROC带面积),可以看出6个ROC带均靠近左上角且对应的AUC值均大于0.5。表明VSA模型部署的6种NP分类器都表现出令人满意的VSA性能,但是通过对比也可以看出,NP-RF,NP-ADA,NP-Penlog三种分类器的性能更为优良。因此,在以下23节点系统和7917节点系统的VSA测试中,选择了性能较好的NP-RF、NP-ADA和NP-SVM三种NP分类器构造VSA模型用于VSA模型测试。其中23节点系统选择α=0.006,δ=0.05和M=3作为分类器基准参数。7917节点系统选择α=0.02,δ=0.05和M=3作为分类器基准参数。并采用总体分类精度(AC)、I型分类错误率(FD)及F值(FM)作为VSA分类性能检测指标,分别由公式(14)(15)(16):
式中:F11,F10,F00,F01分别表示将稳定样本判定为稳定个数,稳定样本判定为不稳定个数,不稳定样本判定为不稳定个数及不稳定样本判定为稳定个数。
表1不同NP分类器AUC值
AUC面积 | NP-RF | NP-ADA | NP-Penlog | NP-SVM | NP-NB | NP-NNB |
AUC.L | 0.9899 | 0.9897 | 0.9883 | 0.9700 | 0.9471 | 0.9580 |
AUC.U | 0.9956 | 0.9997 | 0.9906 | 0.9866 | 0.9364 | 0.9469 |
表2所示为基准参数条件下三种NP分类器与传统分类器在两个系统中的性能测试结果,分别记录系统的分类精度、一类分类错误率及F值。通过结果分析可知,NP分类器相较于传统分类器的总体分类精度更高,一类分类错误率更低,用于评价分类器对于不稳定样本的分类能力的F值更是总体相对较高,这基于伞式算法部署的这三种NP分类器为构建性能优良的VSA模型提供了基础。
表2三种NP分类器与传统分类器性能对比结果
表3基准参数条件下VSA模型投票机制测试结果
如表3所示为两个系统中对三种NP分类器结果采用投票机制得到的VSA模型评估结果,可以看出经过投票机制的VSA模型的分类性能更佳,且具有较好的一类分类错误约束能力。因此,VSA模型的少数服从多数的投票可以提高VSA结果质量,降低VSA误分类对电力系统运行的风险。
表4所示为调整一类分类错误阈值α时三种NP分类器及其VSA模型投票机制的一类分类错误率,可以得知调节一类错误阈值确实可以约束一类分类错误在规定的范围内,同时控制训练集的训练模式确实可以得到更为理想的分类结果。因此,调节VSA模型的阈值参数可以更好的根据电力系统实际运行需求提供可供选择的模型,该方案在保证电力系统安全运行方面具有一定的应用前景。
表4不同阈值α条件下NP分类器的一类分类错误
表5所示为两个系统模拟不同拓扑结构发生变化时,VSA模型及其NP分类器的总体分类精度和一类分类错误率的评估结果。可以看出当系统发生拓扑结构变化时,两个系统仍可以保持较好的总体分类精度及一类分类错误约束。因此对于电力系统实际运行拓扑结构的变化影响,该方案仍具有较好的适用性。
表5不同拓扑结构条件下VSA模型及其NP分类器的性能
通过各种测试的三种NP分类器的结果及VSA模型投票机制结果可知,伞式算法部署的三种NP分类器都具有良好的误分类约束性能,这为提出的方案具备高的VSA质量及误分类约束能力提供了保障,也证明了方案的适用性及灵活性。
Claims (8)
1.一种电压稳定评估的训练集循环分裂训练方法,其特征在于:将高效样本集采用十倍交叉验证法分为训练集和测试集,将其送入到伞式NP分类器中进行模型离线训练,基于伞式算法对多种传统分离器进行改造,得到一系列对应NP分类器的伞式NP分类器;
在模型训练阶段,在保证总体分类精度的前提下,根据一类分类错误和二类分类错误性质的不同基于伞式NP分类器对一类误分类错误设置一类分类错误阈值上限α进行约束,并且通过设置训练集循环分裂训练次数M控制每种NP分类器的训练模式,获得一系列子NP分类器,并对各种类型的NP分类器的子NP分类器采用加权投票方式获得各NP分类器的稳定不稳定分类结果,从而优化VSA模型的分类性能。
2.根据权利要求1所述的方法,其特征在于,所述伞式算法包括以下步骤:
步骤1)根据设定的M,对训练集中的0类样本S0进行二等份随机分裂得到样本和样本结合1类样本S1用于基本分类器;
步骤2)用于分类器计算违章率上限υ(k)如公式(7)所示,计算每个样本等级阈值k*如公式(8);将/>结合S1训练各分类器(如RF)得分函数fi:
式中:α为一类分类错误阈值,
k*=min{k∈(1,...,n):υ(k)≤δ} (8)
式中:δ为一类分类错误阈值的违规率;
步骤3)将fi应用于得到一组分数阈值候选项τi如公式(9),且将τi中元素按公式(10)递增顺序排序得到sort(τi),并找到等级阈值k*对应的分数阈值/>如公式(11):
τi={ti,1,...,ti,n}={fi(x1),...,fi(xn)} (9)
sort(τi)={ti,(1),...,ti,(n)} (10)
步骤4)基于得分函数和阈值如公式(12)所示构造NP分类器:
步骤5)重复步骤1)至4),将训练集进行循环分裂训练M次,构造M多个NP分类器,将一类分类错误结果按照公式(13)加权投票的集成方法作为最终结果输出:
3.根据权利要求2所述的方法,其特征在于,其中S0指的是不稳定判定为稳定的误分类样本;S1指的是稳定判定为不稳定的误分类样本。
4.一种用于电压稳定评估中特性选择过程的特征选择方法,其特征在于:结合具有线性关系探索功能的PCC和具有非线性关系探索功能的MIC作为特征选择方法,探索运行变量与电压稳定指标之间的线性关系和非线性关系,确保筛选出有效性的关键运行变量,构建高效样本集;所述运行变量包括发电机的有功和/或无功功率、支路的有功和/或无功功率、电压幅值;
将电力系统第i个运行点的各个特征及其对应VSI构建特征描述集合F的一个行向量Fi={x1,x2,...,xm,yi}(1≤i≤m),则n种运行工况运行数据的特征描述集合F={X1,X2,...,Xm,Y},其中Xk为各种运行工况下的同一个特征量构成的列向量(1≤k≤n),Y={y1,y2,...,yn}代表个运行工况的VSI集合,对各种运行工况的运行数据变量集合X和对应的VSI集合Y分别采用PCC及MIC检测各运行变量与VSI之间的相关性,分别筛选出与VSI高度相关的高排名的线性关系运行变量及非线性运行变量。
5.根据权利要求4所述的方法,其特征在于,
对于线性关系探索PCC:设ρ(X,Y)为特征量X,Y的皮尔逊相关系数,计算公式如公式(3)所示:
式中:n为单个特征量的维度;及/>分别为X和Y所含元素的平均值。
6.根据权利要求5所述的方法,其特征在于,
PCC的取值范围为-1至1,且具有如下几个属性:
1)ρ(x,y)>0说明X和Y之间存在正相关;
2)ρ(x,y)=0说明X和Y之间无线性相关性;
3)ρ(x,y)<0表示X与Y之间存在负相关;
4)ρ(x,y)绝对值越大,表示X与Y之间存在较强的线性相关关系。
7.根据权利要求4所述的方法,其特征在于,
对于非线性关系探索MIC:给定一个有限有序对向量数据集D={(xi,yi),i=1,2,...,n},若X和Y轴分别被划分为x和y个格子,获得x*y网格G,D中的变量值落入G的网格中得到相应地概率分布D|G,其中x和y是正整数;在固定网格划分数的前提下,通过改变网格划分位置,会得到不同的互信息值,其中最大互信息值如公式(4)下所示:
I*(D,x,y)=max I(D|G) (4)
式中:I(D|G)代表D|G内数据点之间的互信息;
为了方便在不同的维数之间进行比较,对公式(4)进行归一化如公式(5)所示,使其取值在区间[0,1]:
已知样本量为n的有序对数据集D,则定义该集合中两变量X、Y的MIC如公式(6)所示:
式中:xy≤B(n){B(n)=na,通常设置为n0.6}。
8.根据权利要求7所述的方法,其特征在于,
MIC的取值范围为0至1,且具有如下几个属性:
1)对于具有趋于无噪声的函数关系的两变量,其MIC值趋于1;
2)对于更广泛类别的无噪声关系,其MIC值趋于1;
3)对于在统计学上相互独立的两变量,其MIC值趋于0。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310415366.4A CN116561573A (zh) | 2020-05-19 | 2020-05-19 | 一种电压稳定评估的训练集循环分裂训练方法 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310415366.4A CN116561573A (zh) | 2020-05-19 | 2020-05-19 | 一种电压稳定评估的训练集循环分裂训练方法 |
CN202010426427.3A CN111652478B (zh) | 2020-05-19 | 2020-05-19 | 基于伞式算法的电力系统电压稳定评估误分类约束方法 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010426427.3A Division CN111652478B (zh) | 2020-05-19 | 2020-05-19 | 基于伞式算法的电力系统电压稳定评估误分类约束方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116561573A true CN116561573A (zh) | 2023-08-08 |
Family
ID=72343809
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310415366.4A Pending CN116561573A (zh) | 2020-05-19 | 2020-05-19 | 一种电压稳定评估的训练集循环分裂训练方法 |
CN202010426427.3A Active CN111652478B (zh) | 2020-05-19 | 2020-05-19 | 基于伞式算法的电力系统电压稳定评估误分类约束方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010426427.3A Active CN111652478B (zh) | 2020-05-19 | 2020-05-19 | 基于伞式算法的电力系统电压稳定评估误分类约束方法 |
Country Status (1)
Country | Link |
---|---|
CN (2) | CN116561573A (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113466634B (zh) * | 2021-08-20 | 2023-12-29 | 青岛鼎信通讯股份有限公司 | 一种基于故障指示器的接地故障波形识别方法 |
CN115166618B (zh) * | 2022-09-06 | 2022-11-25 | 武汉格蓝若智能技术有限公司 | 一种非平稳输出的电流互感器误差评估方法 |
CN116467579B (zh) * | 2023-04-12 | 2023-11-14 | 宁波送变电建设有限公司运维分公司 | 基于特征挖掘技术的电力设备健康定级方法及系统 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103279638B (zh) * | 2013-04-23 | 2017-02-08 | 国家电网公司 | 一种基于响应的大电网全态势在线一体化量化评估方法 |
JP6726959B2 (ja) * | 2015-12-16 | 2020-07-22 | 株式会社日立製作所 | 電圧安定度監視装置および方法 |
CN109033702A (zh) * | 2018-08-23 | 2018-12-18 | 国网内蒙古东部电力有限公司电力科学研究院 | 一种基于卷积神经网络cnn的电力系统暂态电压稳定评估方法 |
CN110428005B (zh) * | 2019-07-31 | 2022-11-08 | 三峡大学 | 一种基于伞式算法的电力系统动态安全误分类约束方法 |
CN110311376B (zh) * | 2019-07-31 | 2022-12-20 | 三峡大学 | 一种电力系统动态安全评估综合模型及时空可视化方法 |
-
2020
- 2020-05-19 CN CN202310415366.4A patent/CN116561573A/zh active Pending
- 2020-05-19 CN CN202010426427.3A patent/CN111652478B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN111652478A (zh) | 2020-09-11 |
CN111652478B (zh) | 2023-06-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110428005B (zh) | 一种基于伞式算法的电力系统动态安全误分类约束方法 | |
CN108551167B (zh) | 一种基于XGBoost算法的电力系统暂态稳定判别方法 | |
CN111652478B (zh) | 基于伞式算法的电力系统电压稳定评估误分类约束方法 | |
CN102074955B (zh) | 基于知识发现技术的电力系统稳定评估及控制方法 | |
CN112508442B (zh) | 基于自动化和可解释机器学习的暂态稳定评估方法及系统 | |
Li et al. | Transient stability assessment of power system based on XGBoost and factorization machine | |
He et al. | A data mining framework for online dynamic security assessment: Decision trees, boosting, and complexity analysis | |
CN104268576A (zh) | 一种基于tnn-svm的电力系统暂态稳定分类方法 | |
CN110705831A (zh) | 电力系统故障后功角失稳模式预判模型构建方法及其应用 | |
CN111400966B (zh) | 一种基于改进AdaBoost的电力系统静态电压稳定评估方法 | |
CN112633315A (zh) | 一种电力系统扰动分类方法 | |
Lin et al. | One-class classifier based fault detection in distribution systems with varying penetration levels of distributed energy resources | |
CN111651932A (zh) | 一种基于集成分类模型的电力系统在线动态安全评估方法 | |
Ramirez-Gonzalez et al. | Convolutional neural network based approach for static security assessment of power systems | |
CN116896093A (zh) | 一种风电场并网振荡稳定性在线分析与优化方法 | |
CN116882838A (zh) | 一种基于Stacking集成策略的短期电压稳定性评估方法 | |
CN111585277A (zh) | 一种基于混合集成模型的电力系统动态安全评估方法 | |
CN116305683A (zh) | 基于样本均衡化的电力系统暂态稳定评估方法及系统 | |
He et al. | A method for transient stability assessment based on pattern recognition | |
Wang et al. | Transient stability assessment in bulk power grids using sequential minimal optimization based support vector machine with pinball loss | |
Qiao et al. | Transient stability assessment for ac-dc hybrid systems based on bayesian optimization xgboost | |
Zamzam et al. | A two-stage CNN-LSTM model-based transient stability assessment for power system | |
CN111814394A (zh) | 一种基于相关性和冗余性检测的电力系统安全评估方法 | |
Dunwen et al. | A trainsient voltage stability evaluation model based on morphological similarity distance online calculation | |
Lin et al. | A Concept Drift Detection Method for Electricity Forecasting Based on Adaptive Window and Transformer |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |