CN110223193A - 基于模糊聚类和rs-knn模型用于电网运行状态的判别方法及系统 - Google Patents

基于模糊聚类和rs-knn模型用于电网运行状态的判别方法及系统 Download PDF

Info

Publication number
CN110223193A
CN110223193A CN201910236266.9A CN201910236266A CN110223193A CN 110223193 A CN110223193 A CN 110223193A CN 201910236266 A CN201910236266 A CN 201910236266A CN 110223193 A CN110223193 A CN 110223193A
Authority
CN
China
Prior art keywords
variable
sample
power networks
data
state
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910236266.9A
Other languages
English (en)
Inventor
娄建楼
时丹丹
孟勃
曲朝阳
王蕾
郭晓利
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northeast Electric Power University
Original Assignee
Northeast Dianli University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northeast Dianli University filed Critical Northeast Dianli University
Priority to CN201910236266.9A priority Critical patent/CN110223193A/zh
Publication of CN110223193A publication Critical patent/CN110223193A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Water Supply & Treatment (AREA)
  • Public Health (AREA)
  • Primary Health Care (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Supply And Distribution Of Alternating Current (AREA)

Abstract

本发明公开了一种基于模糊聚类和RS‑KNN模型用于电网运行状态的判别方法,包括如下步骤:Step 1:选择用于电网运行状态判别的特征变量;Step 2:使用模糊聚类算法,将电网运行的健康状态按照健康程度分为四种类型,分别为健康、亚健康、一般病态和严重病态。在聚类前,为了消除数据量纲的影响,需要采用归一化方法对电网的特征变量数据进行处理。Step 3:将步骤1中得到的特征变量,作为训练集的输入变量,将步骤2中得到的已经分类电网运行状态所对应的数据作为训练集,训练集的输出为对应的电网运行状态,健康、亚健康、一般病态和严重病态这四种电网运行状态所对应的标签分别设定为1、2、3和4。Step 4:将得到的四种电网运行状态的数据用来训练RS‑KNN模型。

Description

基于模糊聚类和RS-KNN模型用于电网运行状态的判别方法及 系统
技术领域
本发明涉及电网运行状态判别领域,具体涉及一种基于模糊聚类和RS-KNN模型用于电网运行状态的判别方法及系统。
背景技术
各国大规模的停电事故,所造成的经济损失和社会影响极其严重,给电网的安全稳定运行敲响了警钟,对电网运行状态的准确及时判别至关重要。针对传统电网运行状态判别方法存在的问题。一方面,忽略数据中的价值,另一方面,不能满足电网运行状态判断实时性要求。
发明内容
为解决上述问题,本发明提供了一种基于模糊聚类和RS-KNN模型用于电网运行状态的判别方法及系统。
为实现上述目的,本发明采取的技术方案为:
基于模糊聚类和RS-KNN模型用于电网运行状态的判别方法,包括如下步骤:
Step 1:选择用于电网运行状态判别的特征变量;
Step 2:划分电网运行状态类型
使用模糊聚类算法,将电网运行的健康状态按照健康程度分为四种类型,分别为健康、亚健康、一般病态和严重病态。在聚类前,为了消除数据量纲的影响,需要采用归一化方法对电网的特征变量数据进行处理。
Step 3:构造训练集
将步骤1中得到的特征变量,作为训练集的输入变量,将步骤2中得到的已经分类电网运行状态所对应的数据作为训练集,训练集输出结果是对应的电网运行状态,健康、亚健康、一般病态和严重病态这四种电网运行状态所对应的标签分别设定为1、2、3和4。
Step 4:训练 RS-KNN模型
首先使用随机子空间方法在原训练样本的特征空间中随机抽样,构造新的训练集。然后,利用新的样本训练集来训练基分类器KNN。最后,通过多数投票规则融合多个KNN基分类器,输出的结果是电网运行状态的分类结果。
进一步地,所述步骤Step1具体包括如下步骤:
S11:使用使数据集中的电网运行正常样本和故障样本相对平衡;
S12:随机森林-递归特征消除用于选取重要变量;
S12.1训练集是利用初始变量集构建的,包含多个训练样本,其输入为:
训练集的输出为:
其中,为训练样本总数,是指第个变量,是指第个输入样本,则是代表第个输入样本的第个变量。是指电网运行状态判别的标签,其中,1用于表示电网正常状态,而–1表示电网故障状态。
S12.2利用随机森林得到10个初始变量集中各变量的重要度,并且记录当变量个数为初始变量集时的分类正确率。
S12.3每次删除一个最不重要的变量,使用删除变量后的变量集重新构造一个新的训练集,并重新测试训练集的分类正确率。
S12.4重复12.3直到只剩下一个重要性最大的变量,所有的变量都被搜索结束。
在步骤S12后,初始变量集即10个变量的重要度排序被得到,也可以得到不同变量所对应训练集的分类正确率。获得最高分类正确率时,所用的输入变量就是重要变量。
进一步地,所述步骤S11具体包括如下步骤:
Step1:在故障样本集中,为故障样本集中的每个样本找到距离该样本最近的个样本,度量标准采用欧式距离。
Step2:随机在每个电网故障样本个最近邻样本中抽取样本数为为采样倍率,由正常样本数与故障样本数的比值确定。
Step3:基于式(1),构建新的故障样本之间的随机线性插值,其中是随机选择的最近邻样本,是故障样本。
(1)
上式中代表一个随机数,其取值范围在[0,1]区间。
Step4:把生成的电网故障样本与原始数据集组合,获得两个类别数量比较平衡的数据集。
进一步地,所述步骤S12.2具体包括如下步骤:
Step 1:生成随机森林模型
(1.1)首先抽取样本数据构造决策树,使用抽样对样本数据进行抽取,随机的、有放回的从原始训练样本中抽取个样本,且未被选中的个样本作为袋外数据
(1.2)在决策数的节点中,选择初始变量集合中的个变量,计算包含在每个变量的信息量,在个变量中,选择一个变量实施节点分裂,要求这个变量是分类能力最好的。
(1.3)每棵树都自然生长,不进行剪枝。
(1.4)重复上述步骤次,就会得到随机森林其中,随机森林含有棵决策树。
Step 2:针对袋外数据,通过RF中的每个决策树进行分类并计算电网运行状态样本的分类正确率
Step 3:训练集中每个初始变量记作新的袋外数据记作是依次对袋外数据添加随机噪声干扰得到的,电网运行状态样本的分类正确率是通过针对袋外数据,使用每棵决策树对其实施分类并计算得到的。
Step 4:计算变量的重要度,具体计算见下式。
进一步地, 假设指标为观测值为所述步骤Step2中:
对于越大越优的指标数据,采用以下公式进行归一化处理
其中,
对于越小越优和中间型的指标数据,采用以下公式归一化处理
通过对指标进行归一化,将其取值范围规范到[0,1]之间,这有利于整体的综合评估;
本发明还一提供了基于模糊聚类和RS-KNN模型用于电网运行状态的判别系统,该系统基于Spark的Spark Streaming实时读取数据,然后通过上述的判别方法输出判别结果。
本发明具有以下有益效果:
1.本发明通过考察电网运行状态的相关特征,收集影响电网运行的各类指标,从负荷、电压、线路、功率四个方面初步建立描述电网运行状态的指标体系,再通过随机森林-特征消除(RF-RFE)算法,从数据的角度入手选取重要变量,使构建的最终指标体系用于电网运行状态评估更加准确,为调度人员从高维复杂的电网指标中高效地选择出重要指标。
2.本发明通过采用监督学习与无监督学习相结合的方式对电网运行状态进行判别,采用模糊聚类与最近邻算法相结合,对电网的健康、亚健康、一般病态、严重病态四种电网状态进行判别,得到的结果更加精确且误判的严重程度较低,为预防电网大面积停电事故的发生,调度人员有必要及时准确的把握电网的运行状态。
附图说明
图1为初步指标体系;
图2为随机森林模型图;
图3为RF-RFE算法流程图;
图4为变量重要度;
图5为分类正确率与变量个数之间的关系;
图6 为FCM-RS-KNN;
图7为模型参数与分类正确率关系;
图 8为模型的混淆矩阵;
图9为IEEE9节点系统;
图10为IEEE39节点系统。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进。这些都属于本发明的保护范围。
本发明实施例提供了一种基于模糊聚类和RS-KNN模型用于电网运行状态的判别方法,包括如下步骤:
步骤一、基于RF-RFE的电网运行状态判别指标体系的构建
首先依据评价指标体系构建的基本原则入手,构建初始变量集;使用RF计算变量的重要性后并对其进行排序;然后每次删除一个最不重要的变量,使用删除变量后的变量集重新构造一个新的训练集,利用随机森林重新计算新的训练集的分类正确率。重复以上过程直到训练集只剩下一个重要性最大的变量,得到不同变量数量所对应的分类准确度。最佳分类准确率对应的变量是指标系统的重要变量。具体的包括如下步骤:
Step 1:使用使数据集中的电网运行正常样本和故障样本相对平衡;
Step 2:随机森林-递归特征消除用于选取重要变量;
(2.1)训练集是利用初始变量集构建的,包含多个训练样本,其输入为:
训练集的输出为:
其中,为训练样本总数,是指第个变量,是指第个输入样本,则是代表第个输入样本的第个变量。是指电网运行状态判别的标签,其中,1用于表示电网正常状态,而–1表示电网故障状态。
(2.2)利用随机森林得到10个初始变量集中各变量的重要度,并且记录当变量个数为初始变量集时的分类正确率。
(2.3)每次删除一个最不重要的变量,使用删除变量后的变量集重新构造一个新的训练集,并重新测试训练集的分类正确率。
(2.4)重复2.3直到只剩下一个重要性最大的变量,所有的变量都被搜索结束。
在步骤S12后,初始变量集,即10个变量的重要度排序被得到,也可以得到不同变量所对应训练集的分类正确率。获得最高分类正确率时,所用的输入变量就是重要变量。
1.1指标变量的选取原则
按以下原则来筛选出构建电网运行状态的指标体系。
(1) 科学性原则:要求采用的指标为影响系统稳定运行的内部自身因素和外部环境因素,使其具有充分的科学内涵。而且每个指标都要求定义明确,选取方法科学,计算合理以保证最后的结果科学合理;
(2) 实用化原则:指标体系的建立要根据规范化和实用化的基本要求。并且,由于各个地区电网所处环境的差别,指标体系必须具有一定的弹性空间,这样才能在实时变化的电力系统中精确地表征系统的运行状态。在建立指标体系的过程中,必须有大量的原始数据来支持每项指标的设定;尽量采用、吸收和融合已有文献和最新研究果实,使指标更加完善;
(3) 先导性原则:对于电网运行状态判断,选取的指标要具有一定的先导性,其变化敏感性要高于整体电网状态变化的敏感性。
(4) 完备性原则:对于电网这样一个庞大复杂的系统进行判断,选取的指标必须要全面覆盖能引起系统不稳定的各个因素,这样才能表现出系统的当前运行状态和未来的变化的情况。这样设计出来的指标体系才算是一个合格的、完整的、能够精确反映评估目标的体系;
(5) 定性与定量相结合的原则:对于能够准确表征系统某方面状态的指标,在选择过程中,无论是定性的指标还是定量的指标都可以选取;
(6) 近因原则:引起电网动荡的原因多种多样,比如引起电压不稳定的因素就有非常多的原因,在指标选取过程中,应该选取与系统关系最近,最有可能直接引起该问题的指标;
(7) 简约性原则:简约性原则包括指标简约和指标体系简约两部分,首先指标要尽可能选择代表性强、易于获取和计算的指标以提高可行性;建立指标体系时,也必须使指标体系有高度概括能力,避免指标体系过于繁琐;以上七条原则是建立电网运行判断指标体系的基本要求和标准,目的是使指标体系能够从不同层次、不同角度覆盖整个电网,保证接下来研究的科学性和可靠性。
1.2平衡数据集
选用标准SMOTE平衡电网运行状态判断样本,具体实现步骤如下:
Step1:在故障样本集中,为故障样本集中的每个样本找到距离该样本最近的个样本,度量标准采用欧式距离。
Step2:随机在每个电网故障样本个最近邻样本中抽取样本数为为采样倍率,由正常样本数与故障样本数的比值确定。
Step3:基于式(1),构建新的故障样本之间的随机线性插值,其中是随机选择的最近邻样本,是故障样本。
(1)
上式中代表一个随机数,其取值范围在[0,1]区间。
Step4:把生成的电网故障样本与原始数据集组合,获得两个类别数量比较平衡的数据集。
1.3初始变量集的构建
本发明将电网运行状态指标体系分为三个层次,如表1所示。
表1电网运行状态指标体系层次划分
将电网运行状态评估设定为总目标,以电网的负荷、电压、线路和功率情况这4个一级指标作为准则层。指标层包括负荷(供电裕度、实时供电水平、负荷下降速率、负荷上升速率),电压(安全稳定性、电压裕度、PV曲线斜率),线路(支路负载率),功率(线路功率因数、无功缺额)等,具体见下图1:
1.3.1各类指标的定义与求取方法
电网中负荷情况的变化对电网运行状态判断影响巨大,本发明采用供电裕度、实时负荷水平和负荷的上升速率和负荷下降速率4个指标来表征系统负荷情况变化对电网的影响。
(1)供电裕度
(2)
式中
它反映了系统中节点抵御干扰的能力。从指标的定义可以看出,指数值越小,系统中的负载压力越大,系统的供电裕度就越小。
(2)满足安全供电能力,避免系统出现过负荷对电网运行来说是必要的。
实时供电水平:
(3)
式中
随着智能电网的快速发展,影响负荷波动的不确定因素也增多了,比如分布式电源的接入及新能源发电;若当前负荷运行情况与同时期标准的运行曲线相差较大,这意味着系统有可能失去稳定性;同时,从指标的定义可以看出,指标的值越大,系统中的供电情况就越平衡。
(3)负荷下降速率:负荷迅速下降会使无功功率发生变化。如果系统中无功功率不足,系统节点的电压将会被严重影响,进一步影响电气设备的绝缘以及用户用电的功率。
(4)负荷上升速率:同负荷下降速率一样,当负荷急剧上升而不及时采取措施,这将会使系统的稳定严重受损。因此,负荷上升速度需要实时监控。
近年来由电压崩溃所造成的电网失稳事故持续上升,这个问题也引起了越来越多研究者的关注。本发明选择安全稳定性,电压裕度和PV曲线斜率三个指标来评估系统中的电压变化。
(5)安全稳定性
(4)
式中
由已有研究知,当电力系统在正常条件下运行时,。如果,电力系统将崩溃。因此,指标值设定为:
(5)
(6)电压裕度
(6)
式中
本发明既考虑了系统运行期间的电压变化是否超过限定值,还考虑了电压在限定值边缘运行时的系统。
(7)PV曲线斜率
(7)
式中
当系统越不稳定,PV曲线斜率就越大。所以为指数的值越小越好。
从线路和功率角度看,用支路过载率、线路功率因数以及无功功率缺额指标用于表征电网的运行健康状况。
(8)支路负载率:该指标的值由线路的当前电流和最大允许电流比值确定。当支路满载或者超载运行时,其能够对支路进行评估及预警。
(9)线路功率因数
(8)
式中
(10)无功缺额
(9)
式中
1.3.2各类指标的评判标准
指标的类型分为越大越好型、适中区间型和越小越好型三类。越大越好型指标,指的是在一定上下限区间里,该指标的数值越大则说明该指标的健康程度越高。越小越好型指标的含义同理。适中区间型指标,指的是该指标的数值有它的最适合区间,在这个区间内该指标值是最健康的,超过或没有达到这个区间的值都是不满足要求的。
有明确规定的指标,比如供电裕度指标,它可表明系统的承受功率变化的能力,在50%~60%为最佳运行状况。安全稳定性指标可以用来说明系统是否处在安全稳定的运行中,当该指标值不小于 0.8 时,说明系统平稳运行,一般不允许低于0.5之下。本发明所述的电压裕度仅考虑超过标准限值的情况,一般情况下,系统要求电压变化量不能超过 0%~7%,否则将系统作不稳定考虑。支路负载率是个典型的适中区间型指标,它在 50%~100%时,表明系统正常运行,当该指标已处于正常区间中时,则指标值越接近50%越好。查阅各类文献以及国网公司相关规定,各个指标的类型和取值范围表 2所示。
表2指标的类型和取值范围
1.3.3 指标无量纲化
在电网运行过程中,各个指标的数值在数量级上是不同的,为了消除指标的量纲,使用极值法对指标进行归一化。具体如下,假设指标为观测值为标准化方法如下公式:
对于越大越优的指标数据,采用公式
10)
其中,
对于越小越优以及中间型的指标数据,采用公式
(11)
通过对指标进行归一化,将其取值范围规范到[0,1]之间,这有利于整体的综合评估;
1.4基于 RF-RFE 的变量选择
本发明采用随机森林-递归特征消除算法从电网运行状态判断的初始变量中选择重要变量。
随机森林(RF)与变量重要性分析
算法主要步骤如下:
Step 1:生成随机森林模型(模型示意图如图2所示)。
(1.1)首先抽取样本数据构造决策树,使用抽样对样本数据进行抽取,随机的、有放回的从原始训练样本中抽取个样本,且未被选中的-个样本作为袋外数据。
(1.2)在决策数的节点中,选择初始变量集合中的个变量,计算包含在每个变量的信息量,在个变量中,选择一个变量实施节点分裂,要求这个变量是分类能力最好的。
(1.3)每棵树都自然生长,不进行剪枝。
(1.4)重复上述步骤次,就会得到随机森林,其中,随机森林含有棵决策树。
Step 2:针对袋外数据,通过RF中的每个决策树进行分类并计算电网运行状态样本的分类正确率。
Step 3:训练集中每个初始变量记作,新的袋外数据记作是依次对袋外数据的添加随机噪声干扰得到的,电网运行状态样本的分类正确率是通过针对袋外数据,使用每棵决策树对其实施分类并计算得到的。
Step 4:计算变量的重要度,具体计算见式(12)。
(12)
RF-RFE算法流程如图3 所示。
首先依据评价指标体系构建的基本原则入手,构建初始变量集;使用RF计算变量的重要性后并对其进行排序;然后每次删除一个最不重要的变量,使用删除变量后的变量集重新构造一个新的训练集,利用随机森林重新计算新的训练集的分类正确率。重复以上过程直到训练集只剩下一个重要性最大的变量,得到不同变量数量所对应的分类准确度。最佳分类准确率对应的变量是指标系统的重要变量。实验结果及分析
实验数据预处理
对实测数据进行整理,对故障数据进行整理,本文研究选择 23个电网运行典型故障数据用于电网运行状态重要变量的选取。数据集组成如表3所示。
表3数据集的组成
采用过采样技术平衡电网数据集中的两种类型样本,其邻近采样点设置为5,过采样的倍率设定为300%,用过采样技术即SMOTE增加数据集中的典型电网故障样本个数,最终得到训练集中正常样本与故障样本都为8144。参照1.3.3的归一化公式,将指标数据的取值范围规范到[0,1]之间,以消除不同量纲的影响。
变量选择
变量选择要实现两个功能,一个是采用RF-RFE对电网运行状态的初始变量重要性进行评价,另一个是并初始变量集中选出重要变量。随机特征变量的数量是其中一个要被确定的参数,其取值为特征变量总数的平方根即4。另一个参数是决策树数量,设置为100。所得初始变量按照重要度降序排列为:{I5,I1,I8,I9,I6, I2, I7,I3,I4 ,I10},变量重要度如图4所示。每次删除重要性最小的特征变量后,分类正确率都会随着变量个数的减少而被重新计算。变量个数与分类正确率的变化关系如图5所示。
从图中可以看出,变量数最大即是初始变量集合10个变量时,随着变量个数的减少,分类正确率呈现的是上升趋势,这是因为减少了不重要变量的冗余信息对算法产生的影响。由图知当变量数量为6时所对应的分类正确率是最佳的,但是当变量个数减少时,即重要性较大的变量被删除时,带来的后果就是分类正确率的不断减小。因此,选择重要性最大的前6个变量(安全稳定性、供电裕度、支路负载率、线路功率因数、电压裕度、实时供电水平)作为电网运行状态判断的重要变量。使用重要变量构建训练集,训练集输入矩阵为:
其中,是代表第j个输入样本的第i个变量,每一行代表一个训练样本,每一列代表一个电网运行状态重要变量。电网故障对应的输出为-1,电网正常运行对应的输出为1。前8144个样本输出为-1,后8144输出为1。
步骤二、基于模糊聚类和RS-KNN的电网状态判别
流程如图6所示,主要包括以下四个步骤:
Step 1:基于步骤一筛选重要变量,用于电网运行状态判别。
Step 2:划分电网运行状态类型
使用模糊聚类算法,将电网运行的健康状态按照健康程度分为四种类型,分别为健康、亚健康、一般病态和严重病态。在聚类前,为了消除数据量纲的影响,需要采用归一化方法对电网的特征变量数据进行处理。归一化公式参照1.3.3。
Step 3:构造训练集。将步骤1中得到的特征变量,作为训练集的输入变量,将步骤2中得到的已经分类电网运行状态所对应的数据作为训练集,训练集输出结果是对应的电网运行状态,健康、亚健康、一般病态和严重病态这四种电网运行状态所对应的标签分别设定为1、2、3和4。
Step 4:训练 RS-KNN模型
首先使用随机子空间方法在原训练样本的特征空间中随机抽样,构造新的训练集。然后,利用新的样本训练集来训练基分类器KNN。最后,通过多数投票规则融合多个KNN基分类器,输出的结果是电网运行状态的分类结果。
模糊C均值聚类
FCM(Fuzzy C-Means)是一种无监督模糊聚类算法,通过优化目标函数得到各个样本点的隶属度。目标是自动分类样本数据,将高维空间分布数据划分为特定的类别。
FCM是将给定的样本集划分为k个模糊簇目标函数为:
(13)
其中,是第个模糊簇的聚类中心,表示样本点属于簇的隶属度,表示隶属度矩阵;为模糊加权指数,用来控制隶属度的影响。满足约束条件:
(14)
FCM 算法的具体步骤为:
Step1:初始化聚类簇数,及隶属度矩,迭代次数和迭代结束阈值,以及模糊加权指数
Step2:计算模糊聚类中心:
(15)
Step3:更新模糊聚类的隶属度矩阵
(16)
其中,表示样本点与聚类中心的欧式距离。
Step4:比较隶属度矩阵,如果,测说明目标函数已达到极小值,迭代终止;否则返回Step2,继续迭代。
RS-KNN
本发明采用随机子空间算法集成最近邻分类器。
最近邻(KNN)
KNN 算法基本步骤如下:
Step 1:找到和待分类对象个最近邻即个最接近的训练样本。欧氏距离是度量“最近邻”的常用标准。待分类对象的特征序列和训练样本的特征序列之间的欧式距离:
(17)
Step 2:分别计算待分类对象属于每一类的权重, 属于类的权重为:
(18)
其中,为待分类对象与第个最近领训练样本之间的相似度。
(19)
Step 3:将待分类对象划分到权重最大一类。
随机子空间(RS)
RS算法可总结为以下三个步骤:
Step 1:对于维数据集为分类标签,投影生成个新的维数据集,其中为随机投影,通过均匀概率分布,从随机选择的维子集,设
Step 2:训练基分类器将新的数据集拿来训练基分类器。
Step 3:采用一定的决策规则,融合基分类器的结果,确定最终集成的分类器
实验结果及分析
基于模糊聚类的电网运行状态划分
使用模糊聚类算法,将电网运行的健康状态按照健康程度分为四种类型,分别为健康、亚健康、一般病态和严重病态。各电网运行状态下,安全稳定性、供电裕度、支路负载率、线路功率因数、电压裕度、实时供电水平聚类中心分别为:[0.8952,0.6953, 0.5456,0.4947],[54.9611,45.0105,40.9568,37.4863],[58.5166, 44.9688, 40.8624,37.5038],[0.9747,0.8871,0.8243,0.7488],[3.0092, 7.7567, 10.243, 12.466]和[94.4771, 87.0333, 53.0654, 40.9668]。1,2,3,4分别代表属于健康、亚健康、一般病态、严重病态的隶属度,对各指标聚类中心进行分析并结合隶属度给出分类结果如表4。
表4 分类结果
RS-KNN的训练
使用80%的聚类数据构建训练集,使用五折交叉验证方法来训练RS-KNN模型,在一定程度上可以避免过度学习模型。
在训练RS-KNN模型前,需要确定的参数有两个,一个是KNN分类器的个数即子空间的个数,另一个是每个子空间的特征维数。通过分析参数值的变化对电网运行状态分类正确率的影响来确定两个参数的值。由图7可以看出子空间维数为4,子空间个数为30的时候对应的电网运行状态的判别正确率最高。
为了测试RS-KNN模型对电网运行状态判别的性能,采用20%的数据同时测试标准K 最近邻模型(KNN)与RS-KNN模型。KNN中的相邻点数量的取值为10,此时的分类效果是最佳的。如图8的混合矩阵所示,能清晰的对比两个模型的电网运行状态的判别结果。
模型正确判别电网运行状态用绿色格子表示,模型错误电网运行状态用红色方块表示,这两类方格中的百分比是指判断结果占所有判别结果的值,比如最左上角的绿色方块代表有95个样本被正确判别即95个健康状态被正确判别,所占比例是95/288,结果为33%。如第一行的第二个方块代表RS-KNN错误将标签为2的亚健康状态错误判别为标签为1的健康状态,其百分比是判别结果占判别总数的比例为1.7%(5/288)。灰色方块用来表示某一类运行状态的结果,其中绿色的百分比是指正确判别这类结果占这类输出结果总数的比例,红色的百分比则是错误判别这类结果占这类结果输出总数的比例。如第一行的灰色方格是指判别为健康状态的结果中,95%(95/100)是正确的,5%(5/100)是错误的。从整体判别率而言,RS-KNN 模型比KNN模型提高了3.2%。RS-KNN模型发生错误判断的时候,其电网运行状态输出结果与目标状态只相差一种类型,而KNN模型发生较为严重的错误判断,存在相差两种类型的误判情况。
仿真分析
算例简介
本实施例采用IEEE9节点、IEEE39节点算例进行电网状态判别的研究。这些算例在电力系统稳定性分析中具有普遍性,并且在电力系统分析仿真时具有一定的典型性。本实施例在IEEE9中和IEEE39中选取的变化节点分别为7和8节点,分别仿真研究,电力系统的运行状态随着节点各参数变化时的情况。IEEE9节点、IEEE39节点系统拓扑图如 9 和 10所示。
算例分析
仿真研究的总体思路为:在潮流程序中改变IEEE9、IEEE39节点系统中变化节点有功负荷或者无功负荷的值,比如:同时对有功和无功进行减少或者增加;只增加无功负荷;只增加有功负荷等。通过监测改变量并计算系统变化后所对应指标体系的变化,并通过本实施例前面提出的电网运行状态判别模型对系统改变后的运行状态进行判别,以此来证明该判断方法的可行性。
(1)同时以一定的比例对系统变化节点增加无功和有功负荷
取IEEE9 系统的7节点为研究节点,IEEE9系统的初始状态如表5的第一行,对7节点依次以第一行为基数增加0.3倍得到第二行,对第二行增加0.7、1.24、1.78倍得到三四五行,在这个过程负荷被改变,潮流参数也会随之变化,供电裕度、安全稳定性等指标的也一定会发生变化,最终的结果电网运行状态也会发生变化。IEEE9系统运行状态的情况如表 5所示。
表 5 IEEE9 算例7节点按比例增加负荷至系统崩溃的判别结果
有功(MW) 无功(MW) 电压(pu) 相角(度) 电网运行状态
100 35 0.976 -2.031 健康
130 45.5 0.967 -7.581 健康
221 77.35 0.912 -23.457 亚健康
291.2 101.9 0.812 -37.101 一般病态
361.4 126.49 0.795 -51.879 严重病态
同理对 IEEE39系统的 8 节点进行改变,其结果如表 6所示。
表 6 IEEE39 算例8节点按比例增加负荷至系统崩溃的判别结果
有功(MW) 无功(MW) 电压(pu) 相角(度) 电网运行状态
512 171 0.998 -10.7 健康
1024 342 0.951 -22.325 健康
1536 513 0.873 -37.294 亚健康
1664 555.75 0.803 -44.356 一般病态
1792 598.5 0.790 -50.214 严重病态
综上,同时按一定比例增加负荷后,判别模型可以较为清晰的反映系统收到负荷增加的影响。
(2)对系统变化节点只持续增加无功负荷
当有功负荷不变,只对IEEE9节点系统7节点增加无功负荷,研究此情况下系统运行状态变化情况。如表7所示。
表7 IEEE9 算例7节点只增加无功至系统崩溃的判别结果
有功(MW) 无功(MW) 电压(pu) 相角(度) 电网运行状态
100 35 0.976 -2.031 健康
100 65 0.951 -1.922 健康
100 145 0.887 -1.635 亚健康
100 200 0.832 -1.456 一般病态
100 230 0.669 -1.585 严重病态
由上表可知,无功负荷为230MVar的时候,系统接近崩溃。对IEEE39节点系统8节点同样只增加无功负荷,结果如表8所示。
表 8 IEEE39 算例8节点只增加无功至系统崩溃的判别结果
有功(MW) 无功(MW) 电压(pu) 相角(度) 电网运行状态
512 171 0.998 -10.7 健康
512 544 0.942 -11.982 健康
512 944 0.872 -12.563 亚健康
512 1524 0.759 -14.934 一般病态
512 1744 0.572 -19.201 严重病态
综上,判别模型可以清晰的体现系统运行状态在只增加无功负荷条件下的变化情况。
(3)对系统变化节点只持续增加有功负荷
当无功负荷不变,只对IEEE9节点系统7节点增加有功负荷,研究此情况下系统运行状态变化情况。如表9所示。
表9 IEEE9算例7节点只增加有功至系统崩溃的判别结果
有功(MW) 无功(MW) 电压(pu) 相角(度) 电网运行状态
100 35 0.976 -2.031 健康
140 35 0.970 -6.215 健康
170 35 0.966 -10.463 亚健康
220 35 0.955 -20.853 一般病态
470 35 0.883 -51.868 严重病态
由表9知,有功负荷增加到480MW时,系统接近崩溃。对IEEE39节点系统8节点同样只增加有功负荷,结果如表10所示。
表10 IEEE39 算例8节点只增加有功至系统崩溃的判别结果
有功(MW) 无功(MW) 电压(pu) 相角(度) 电网运行状态
512 171 0.998 -10.7 健康
710 171 0.988 -15.424 健康
1010 171 0.976 -21.354 亚健康
1810 171 0.901 -43.012 一般病态
2010 171 0.862 -51.875 严重病态
从上述仿真计算的结果可以看出,本发明的模型能够比较清晰的体现出各种情况下电网运行状态变化的情况,在一定程度上证明了本发明方法的可行性和实用性。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变化或修改,这并不影响本发明的实质内容。在不冲突的情况下,本申请的实施例和实施例中的特征可以任意相互组合。

Claims (6)

1.基于模糊聚类和RS-KNN模型用于电网运行状态的判别方法,其特征在于:包括如下步骤:
Step 1:选择用于电网运行状态判别的特征变量;
Step 2:划分电网运行状态类型
使用模糊聚类算法,将电网运行的健康状态按照健康程度分为四种类型,分别为健康、亚健康、一般病态和严重病态。在聚类前,为了消除数据量纲的影响,需要采用归一化方法对电网的特征变量数据进行处理。
Step 3:构造训练集
将步骤1中得到的特征变量,作为训练集的输入变量,将步骤2中得到的已经分类电网运行状态所对应的数据作为训练集,训练集输出结果是对应的电网运行状态,健康、亚健康、一般病态和严重病态这四种电网运行状态所对应的标签分别设定为1、2、3和4
Step 4:训练 RS-KNN模型
首先使用随机子空间方法在原训练样本的特征空间中随机抽样,构造新的训练集。然后,利用新的样本训练集来训练基分类器KNN。最后,通过多数投票规则融合多个KNN基分类器,输出的结果是电网运行状态的分类结果。
2.如权利要求1所述的基于模糊聚类和RS-KNN模型用于电网运行状态的判别方法,其特征在于:所述步骤Step1具体包括如下步骤:
S11:使用使数据集中的电网运行正常样本和故障样本相对平衡;
S12:随机森林-递归特征消除用于选取重要变量;
S12.1训练集是利用初始变量集构建的,包含多个训练样本,其输入为:
训练集的输出为:
其中,为训练样本总数,是指第个变量,是指第个输入样本,则是代表第个输入样本的第个变量。变量的内容如图2-1。是指电网运行状态判别的标签,其中,1用于表示电网正常状态,而–1表示电网故障状态。
S12.2利用随机森林得到10个初始变量集中各变量的重要度,并且记录当变量个数为初始变量集时的分类正确率。
S12.3每次删除一个最不重要的变量,使用删除变量后的变量集重新构造一个新的训练集,并重新测试训练集的分类正确率。
S12.4重复12.3直到只剩下一个重要性最大的变量,所有的变量都被搜索结束。
在步骤S12后,初始变量集即10个变量的重要度排序被得到,也可以得到不同变量所对应训练集的分类正确率。获得最高分类正确率时,所用的输入变量就是重要变量。
3.如权利要求2所述的基于模糊聚类和RS-KNN模型用于电网运行状态的判别方法,其特征在于:所述步骤S11具体包括如下步骤:
Step1:在故障样本集中,为故障样本集中的每个样本找到距离该样本最近的个样本,度量标准采用欧式距离。
Step2:随机在每个电网故障样本个最近邻样本中抽取样本数为为采样倍率,由正常样本数与故障样本数的比值确定。
Step3:基于式(1),构建新的故障样本之间的随机线性插值,其中是随机选择的最近邻样本,是故障样本。
(1)
上式中代表一个随机数,其取值范围在[0,1]区间。
Step4:把生成的电网故障样本与原始数据集组合,获得两个类别数量比较平衡的数据集。
4.如权利要求2所述的基于模糊聚类和RS-KNN模型用于电网运行状态的判别方法,其特征在于:所述步骤S12.2具体包括如下步骤:
Step 1:生成随机森林模型
(1.1)首先抽取样本数据构造决策树,使用抽样对样本数据进行抽取,随机的、有放回的从原始训练样本中抽取个样本,且未被选中的个样本作为袋外数据
(1.2)在决策数的节点中,选择初始变量集合中的个变量,计算包含在每个变量的信息量,在个变量中,选择一个变量实施节点分裂,要求这个变量是分类能力最好的。
(1.3)每棵树都自然生长,不进行剪枝。
(1.4)重复上述步骤次,就会得到随机森林其中,随机森林含有棵决策树。
Step 2:针对袋外数据,通过RF中的每个决策树进行分类并计算电网运行状态样本的分类正确率
Step 3:训练集中每个初始变量记作新的袋外数据记作是依次对袋外数据添加随机噪声干扰得到的,电网运行状态样本的分类正确率是通过针对袋外数据,使用每棵决策树对其实施分类并计算得到的。
Step 4:计算变量的重要度,具体计算见下式。
5.如权利要求1所述的基于模糊聚类和RS-KNN模型用于电网运行状态的判别方法,其特征在于:假设指标为观测值为所述步骤Step2中:
对于越大越优的指标数据,采用以下公式进行归一化处理
其中,
对于越小越优和中间型的指标数据,采用以下公式归一化处理。
通过对指标进行归一化,将其取值范围规范到[0,1]之间,这有利于整体的综合评估。
6.基于模糊聚类和RS-KNN模型用于电网运行状态的判别系统,其特征在于:该系统基于Spark的Spark Streaming实时读取数据,然后通过权利要求1-4任一项所述的判别方法输出判别结果。
CN201910236266.9A 2019-03-27 2019-03-27 基于模糊聚类和rs-knn模型用于电网运行状态的判别方法及系统 Pending CN110223193A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910236266.9A CN110223193A (zh) 2019-03-27 2019-03-27 基于模糊聚类和rs-knn模型用于电网运行状态的判别方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910236266.9A CN110223193A (zh) 2019-03-27 2019-03-27 基于模糊聚类和rs-knn模型用于电网运行状态的判别方法及系统

Publications (1)

Publication Number Publication Date
CN110223193A true CN110223193A (zh) 2019-09-10

Family

ID=67822437

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910236266.9A Pending CN110223193A (zh) 2019-03-27 2019-03-27 基于模糊聚类和rs-knn模型用于电网运行状态的判别方法及系统

Country Status (1)

Country Link
CN (1) CN110223193A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110927527A (zh) * 2019-12-11 2020-03-27 国网河南省电力公司 基于暂态能量双通道及信息融合的瞬时性故障感知方法
CN111429027A (zh) * 2020-04-15 2020-07-17 国网福建省电力有限公司经济技术研究院 一种基于大数据的地区输电网运行多维度分析方法
CN111428780A (zh) * 2020-03-20 2020-07-17 上海理工大学 基于数据驱动的电网异常运行状态识别方法
CN111638449A (zh) * 2020-06-03 2020-09-08 国网北京市电力公司 一种配电自动化开关故障诊断方法、设备及可读存储介质
CN111814917A (zh) * 2020-08-28 2020-10-23 成都千嘉科技有限公司 一种存在模糊态的字轮图像数字识别方法
CN113884807A (zh) * 2021-09-24 2022-01-04 广西电网有限责任公司电力科学研究院 基于随机森林和多层架构聚类的配电网故障预测方法
CN116842454A (zh) * 2023-06-06 2023-10-03 南京财经大学 基于支持向量机算法的金融资产分类方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170003352A1 (en) * 2014-01-03 2017-01-05 Commissariat A L'energie Atomique Et Aux Energies Alternatives Method, device and system for estimating the state of health of a battery in an electric or hybrid vehicle during operation thereof, and method for creating model for estimation of said type
CN108551167A (zh) * 2018-04-25 2018-09-18 浙江大学 一种基于XGBoost算法的电力系统暂态稳定判别方法
CN109507535A (zh) * 2018-12-10 2019-03-22 国网河南省电力公司电力科学研究院 变电站接地网运行阶段及运行寿命预测方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170003352A1 (en) * 2014-01-03 2017-01-05 Commissariat A L'energie Atomique Et Aux Energies Alternatives Method, device and system for estimating the state of health of a battery in an electric or hybrid vehicle during operation thereof, and method for creating model for estimation of said type
CN108551167A (zh) * 2018-04-25 2018-09-18 浙江大学 一种基于XGBoost算法的电力系统暂态稳定判别方法
CN109507535A (zh) * 2018-12-10 2019-03-22 国网河南省电力公司电力科学研究院 变电站接地网运行阶段及运行寿命预测方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
商强: "基于机器学习的交通状态判别与预测方法研究", 《中国优秀博士学位论文全文数据库 工程科技II辑》 *

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110927527A (zh) * 2019-12-11 2020-03-27 国网河南省电力公司 基于暂态能量双通道及信息融合的瞬时性故障感知方法
CN111428780A (zh) * 2020-03-20 2020-07-17 上海理工大学 基于数据驱动的电网异常运行状态识别方法
CN111428780B (zh) * 2020-03-20 2023-04-07 上海理工大学 基于数据驱动的电网异常运行状态识别方法
CN111429027B (zh) * 2020-04-15 2023-03-31 国网福建省电力有限公司经济技术研究院 一种基于大数据的地区输电网运行多维度分析方法
CN111429027A (zh) * 2020-04-15 2020-07-17 国网福建省电力有限公司经济技术研究院 一种基于大数据的地区输电网运行多维度分析方法
CN111638449A (zh) * 2020-06-03 2020-09-08 国网北京市电力公司 一种配电自动化开关故障诊断方法、设备及可读存储介质
CN111638449B (zh) * 2020-06-03 2022-08-05 国网北京市电力公司 一种配电自动化开关故障诊断方法、设备及可读存储介质
CN111814917B (zh) * 2020-08-28 2020-11-24 成都千嘉科技有限公司 一种存在模糊态的字轮图像数字识别方法
CN111814917A (zh) * 2020-08-28 2020-10-23 成都千嘉科技有限公司 一种存在模糊态的字轮图像数字识别方法
CN113884807A (zh) * 2021-09-24 2022-01-04 广西电网有限责任公司电力科学研究院 基于随机森林和多层架构聚类的配电网故障预测方法
CN113884807B (zh) * 2021-09-24 2023-10-20 广西电网有限责任公司电力科学研究院 基于随机森林和多层架构聚类的配电网故障预测方法
CN116842454A (zh) * 2023-06-06 2023-10-03 南京财经大学 基于支持向量机算法的金融资产分类方法及系统
CN116842454B (zh) * 2023-06-06 2024-04-30 南京财经大学 基于支持向量机算法的金融资产分类方法及系统

Similar Documents

Publication Publication Date Title
CN110223193A (zh) 基于模糊聚类和rs-knn模型用于电网运行状态的判别方法及系统
CN112699913B (zh) 一种台区户变关系异常诊断方法及装置
CN106355030B (zh) 一种基于层次分析法和加权投票决策融合的故障检测方法
CN110837866A (zh) 基于XGBoost的电力二次设备缺陷程度评估方法
CN106021771A (zh) 一种故障诊断方法及装置
CN109816031B (zh) 一种基于数据不均衡度量的变压器状态评估聚类分析方法
CN104299115B (zh) 基于模糊c均值聚类算法的智能变电站二次系统状态分析方法
CN101738998B (zh) 一种基于局部判别分析的工业过程监测系统及方法
CN110059714A (zh) 基于多分类支持向量机的变压器故障诊断方法
CN110428005A (zh) 一种基于伞式算法的电力系统动态安全误分类约束方法
CN113077020B (zh) 一种变压器集群管理方法及系统
CN108334894B (zh) 基于无监督机器学习的变压器油温异常识别方法
CN109389325B (zh) 基于小波神经网络的变电站电子式互感器状态评估方法
CN109711707B (zh) 一种船舶动力装置综合状态评估方法
CN110705887A (zh) 一种基于神经网络模型的低压台区运行状态综合评价方法
CN110348683A (zh) 电能质量扰动事件主成因分析方法、装置设备及存储介质
CN116933010A (zh) 一种基于多源数据融合与深度学习的负载率分析评价方法和系统
CN110968703B (zh) 基于lstm端到端抽取算法的异常计量点知识库构建方法及系统
CN113125903A (zh) 线损异常检测方法、装置、设备及计算机可读存储介质
CN115526258A (zh) 基于Spearman相关系数特征提取的电力系统暂稳评估方法
CN111651932A (zh) 一种基于集成分类模型的电力系统在线动态安全评估方法
CN110596490A (zh) 铁路道岔故障的智能检测方法
CN114676749A (zh) 一种基于数据挖掘的配电网运行数据异常判定方法
CN114358116A (zh) 油浸式变压器故障诊断方法、系统及可读存储介质
CN113469252A (zh) 一种考虑不平衡样本的特高压换流阀运行状态评估方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190910

RJ01 Rejection of invention patent application after publication