CN113945855A - 基于数据挖掘的分布式发电孤岛检测改进方法 - Google Patents
基于数据挖掘的分布式发电孤岛检测改进方法 Download PDFInfo
- Publication number
- CN113945855A CN113945855A CN202111049627.2A CN202111049627A CN113945855A CN 113945855 A CN113945855 A CN 113945855A CN 202111049627 A CN202111049627 A CN 202111049627A CN 113945855 A CN113945855 A CN 113945855A
- Authority
- CN
- China
- Prior art keywords
- learning
- sample
- meta
- classification
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 59
- 238000000034 method Methods 0.000 title claims abstract description 45
- 238000007418 data mining Methods 0.000 title claims abstract description 27
- 230000006872 improvement Effects 0.000 title claims abstract description 6
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 48
- 238000007635 classification algorithm Methods 0.000 claims abstract description 18
- 238000010801 machine learning Methods 0.000 claims abstract description 12
- 238000005065 mining Methods 0.000 claims abstract description 7
- 230000010354 integration Effects 0.000 claims abstract description 4
- 238000012549 training Methods 0.000 claims description 18
- 238000000354 decomposition reaction Methods 0.000 claims description 17
- 239000013598 vector Substances 0.000 claims description 15
- 238000005070 sampling Methods 0.000 claims description 14
- 238000010248 power generation Methods 0.000 claims description 13
- 239000011159 matrix material Substances 0.000 claims description 10
- 238000001228 spectrum Methods 0.000 claims description 8
- 230000008569 process Effects 0.000 claims description 7
- 238000005192 partition Methods 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 5
- 230000001052 transient effect Effects 0.000 claims description 5
- 230000006870 function Effects 0.000 claims description 4
- 239000004576 sand Substances 0.000 claims description 4
- 230000009977 dual effect Effects 0.000 claims description 3
- 238000003745 diagnosis Methods 0.000 abstract description 2
- 230000008859 change Effects 0.000 description 12
- 230000006698 induction Effects 0.000 description 6
- 238000004088 simulation Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 201000004569 Blindness Diseases 0.000 description 2
- 238000011217 control strategy Methods 0.000 description 2
- 238000003066 decision tree Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000001965 increasing effect Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 101100499229 Mus musculus Dhrsx gene Proteins 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000007257 malfunction Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01R—MEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
- G01R31/00—Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere
- G01R31/40—Testing power supplies
Landscapes
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明属于电网故障诊断技术领域,特别是涉及一种基于数据挖掘的分布式发电孤岛检测改进方法,采用机器学习中的元学习方式确定孤岛检测的阈值,包括:步骤1,采用RELIEF算法在分类前识别孤岛检测的关键特征,所述关键特征中包括稳态量特征和暂态量特征;步骤2,基于基学习器和元学习器进行分类算法,实施分布式发电孤岛检测。步骤2包括:步骤21,数据流挖掘:采用增量方式,兼顾算法的时间和空间效率;步骤22,元学习:利用不同分类器的互补性提高数据挖掘和机器学习的适应性;步骤23,在线自学习:采用滑动数据窗和多分类器集成方法实现在线自学习,保持分类精度始终维持在较高水平。
Description
技术领域
本发明属于电网故障诊断技术领域,特别是涉及一种基于数据挖掘的分布式发电孤岛检测改进方法。
背景技术
分布式发电系统中的一个重要问题就是孤岛检测问题。孤岛是指电网故障后,分布式发电系统与大电网链接处开关断开,导致其带有一定容量的本地负荷和本地DG,构成了一个独立运行的孤岛,电力公司无法对其进行控制。一般认为发生孤岛必须立即断开所有分布式电源,因为DG一般在电流控制模式下运行,孤岛形成将造成电压无法稳定控制,损坏设备及给检修人员带来安全隐患。然而,随着DG并网发电容量的不断增加,为保证供电的稳定性,提出孤岛运行控制策略,能够使DG具备孤岛运行能力。然而,DG并网运行和孤岛运行控制策略并不相同。因此研究孤岛检测的方法非常有必要。
现有技术包括如下几种方法:
1、基于频率变化率ROCOF特征作为分布式发电系统发生孤岛与否的位移判据,提出了检测时间对功率不平衡度曲线的概念。在这个概念基础上,分析了不同的能够影响ROCOF 孤岛检测能力的因素以及引发误动作的直线故障。然而这种方法并不涉及如何避免高概率的保护装置误动作,并且ROCOF方法不适用于功率不平衡度低于15%的情况。
2、基于主动频率偏移法的改进方案,为了防止主动检测法中谐波造成的污染,影响电网电能质量,不仅可以加快检测速度,降低盲区范围,更能有效提高电能质量,避免被谐波污染。然而所使用的仿真模型与实际情况区别较大。
3、运用数据挖掘的方法,采用特定特征判据获取孤岛整定阈值的过程,然而选用特征量比较常规,分类方法也并不是最优,并且单一分类算法鲁棒性相对较弱。后期发展为通过建立决策树对孤岛被动检测值进行分类的方法,以此判断孤岛产生与否,然而其训练数据少,并未考虑功率不平衡度对结论的显著影响,因此获得的整定阈值适应性弱,对事件特殊性依赖性强。后期采用小波特性,提出一种能够良好分辨电网电压扰动和孤岛产生的特征量奇异谱熵,分类效果优化,但是并不涉及该特征量鉴别电压扰动以外其他的伪孤岛干扰效果。
因此现有技术存在如下问题:
1、未进行关键特征选择。
在数据挖掘中,特征判据十分重要,因为其是根据原始采样数据提取的判断依据,所有的后续分析结论都和特征判据所表征出来的信息密切关联。特征判据选择过于单一,遗漏重要的特征判据所含有的关键信息,选择过于全面的话,不同判据的内涵信息与分析结论的关联程度不一,甚至还有可能形成冲突的情形。需要尽可能多且典型的特征判据中找出分歧度低且包含关键信息的判据组合。
2、采用单一分类器,未考虑归纳偏置现象。
当学习器预测其未遇到过的输入的结果时,会做一些假设。而学习算法中的归纳偏置则是这些假设的集合。机器学习试图去建造一个可以学习的算法,用来预测某个目标的结果。要达到这一效果,需要给予学习算法一些训练样本,样本说明输入与输出之间的预期关系,然后假设学习器在预测中逼近正确的结果,其中包括在训练中未出现的样本。既然位置状况可以是任意的结果,若没有其他额外的假设,就无法解决。这种关于目标函数的必要假设就称为归纳偏置,以往数据挖掘在电力系统的研究中很少考虑单分类器归纳偏置对于分类预测结果的影响,优秀的算法会因为这个限制在某些情况下变得不再使用。
3、采用离线的分类器训练方法,未考虑概念漂移现象。
在考虑了综合利用多分类器的策略来抵消归纳偏置问题后,在将理论的数据挖掘结果应用于实践必要考虑的一个问题为数据流的实时性。由于未来的事物变化无法预测,因此数据流的变化也无法预测,当未来的事件发生一些以前没有的变化时,那么根据之前样本搭建的再完备的学习策略和算法也无法进行正确预测。样本的统计特性随着时间推移或环境改变而发生不可预知的变化,其结果会导致离线获得的分类器模型的分类准确度逐渐下降。这种现象再数据挖掘中被称作概念漂移。
因此,对于传动的主动孤岛检测方案,虽然检测精度高、检测盲区小,但通常都会对电网和本地微网电能质量有负面影响;被动检测方法实现简单,但是存在盲区,无法识别的弱点。开关检测法,虽然盲区较小,但是花费较高,设计复杂,对通信可靠性要求高,并未能够在分布式发电系统中获得广泛应用。因此能够结合主动检测和被动检测的有点,走低成本的检测路线,结合本地电气信息进行数据挖掘处理,实现分布式数据挖掘是很必要的。
发明内容
本发明的目的在于提供一种基于数据挖掘的分布式发电孤岛检测改进方法,采用机器学习中的元学习方式确定孤岛检测的阈值,从而避免孤岛检测正定的盲目性,包括:
步骤1,采用RELIEF算法在分类前识别孤岛检测的关键特征,所述关键特征中包括稳态量特征和暂态量特征;
步骤2,基于基学习器和元学习器进行分类算法,实施分布式发电孤岛检测。
优选的,所述步骤2包括:
步骤21,数据流挖掘:采用增量方式,兼顾算法的时间和空间效率;
步骤22,元学习:利用不同分类器的互补性提高数据挖掘和机器学习的适应性;
步骤23,在线自学习:采用滑动数据窗和多分类器集成方法实现在线自学习,保持分类精度始终维持在较高水平。
优选的,所述稳态量特征作为常规特征的判据,其中所述稳态量特征为
优选的,所述暂态量特征作为多分辨率奇异熵的暂态特征判据,包括:将DRi采样电压Vs作为目标离散信号,计算各层多分辨率奇异熵。
优选的,所述多分辨率奇异熵计算过程包括:
1)选择合适的小波基函数和分解层数。设确定的分解层数为m,对离散信号 f(k)(k=1,2…,N)(N为采样点数)进行快速小波分解,得到各层细节分量d1,d2,...,dm和第m层的概念要分量cm,采用Mallat快速算法进行处理,f(k) 的离散二进小波变换采用下式确定:
2)对分解后的各层信号进行小波变换系数重构,重构公式为:
cj-1=H*cj+G*dj;
公式中,H*和G*分别为H和G的对偶算子;
3)对每层的重构信号进行相空间重构,将DRi采样电压Vs作为目标离散信号,计算各层分辨率奇异熵;设i层熵的重构信号为Di={di(k)},假设要重构1个n维相空间;将Di中的di(1),di(2),...,di(n)作为n维相空间的第1个矢量;将Di中的 di(2),...,di(n+1)组为第2个矢量,如此类推,构造出一个(N-n+1)×n阶的矩阵A:
式中,pji为一不确定的概率分布;Hi为第i层分布所具有的信息熵。
优选的,所述RELIEF算法的基本原理为:如果某个特征为关键特征,那么在同类样本中,该特征的值应相同;而在异类样本中,该特征的值应不同所述RELIEF算法包括:首先从所有的训练样本集中随机选择m个样本,对每个所选择的样本,根据欧式距离找出其在同类样本和非同类样本中的最临近点,即nearest hit和nearest miss。
优选的,样本空间中任意两个输入样本向量xr和xs之间的欧式距离drs由下式计算获得:
式中,“·”表示内积,nearest hit和nearest miss分别是同类样本和非同类样本中与所选样本之间欧式距离最小的两个样本向量。第j个特征的权值Wj可由所选择的m个样本通过下式迭代得到:
优选的,所述RELIEF算法包括:
1)给定样本集合E={(Xi,yi)}(i=1,...n),其特征集合为 A(X)={a(j)}(j=1,...d);
2)对各特征的值做归一化处理,设定各特征的初始权重ωj=0;对集合E的采样次数为T;
3)for t=1 to T do
随机从E中选取一个样本(x,y);
找到与样本欧式距离最近的同类样本H(x)和异类样本M(x);
For j=1 to d do
ωj=ωj+|X(j)-M(j)(x)|-|x(j)-H(j)(x)|
end for
end for
由此,同类样本与异类样本特征统计量差异越明显,则RELIEF算法对于该特征赋予权值越高,并且该算法独立于具体的分类方法,作为分类前的一个独立环节。
优选的,所述数据流挖掘采用C4.5处理,包括∶
根据属性的值,对数据集排序,用不同的阈值将数据集动态的进行划分,当输出改变时确定一个阈值,取两个实际值中的中点作为一个阈值;取两个划分,所有样本都在这两个划分中,得到所有可能的阈值、增益及增益比,在每一个属性会变为两个取值,即小于阈值或大于阈值。
优选的,所述元学习的元学习方法包括:
组合元学习策略
将以原始样本集合E={(xi,yi)},i=1,2…n为训练集的分类器称为基学习器(base learner),设由K个基学习器Ck(k=1,…K)。为了表示方便,用C(xi)表示xi的类别标签,即真实分类yi,而用Ck(xi)表示基学习器Ck对xi的分类结果。利用如下方法产生新的样本集合T:
T={xi,C1(xi),C2(xi),...,CK(xi),C(xi)|xi∈E};
其中,前面d列为基学习器的特征,从d+1到d+k列为由k个基学习器的分类结果构成的特征,最后一列为类别标签。将以T为训练集的分类器称作元学习器(meta learner),由此构成元学习系统,基学习器以原始样本集作为输入,而元学习器的样本中则增加了基学习器的分类结果;
裁决元学习系统
裁决元学习系统采用一个公正的分类器作为判决器,将在基学习器无法达成一致时,采纳该判决器的分类结果作为最终结果,判决其本身是一个分类器,其依据和其他分类器的分类判定结果做出判断,裁决元学习系统具有自身的裁决规则和裁决器,基于基学习器决定最终结果。
与现有技术相比,本发明具有以下有益效果:
(1)样本中的低相关特征会降低分类算法的准确度和导致过度你和问题,利用RELIEF 算法能够识别孤岛检测的关键特征,该算法独立于所选用的分类器,且适用于各种孤岛检测情况,采用关键特征后分类算法的准确度得以明显提高。
(2)不同的分类算法采用不同的归纳偏置,会使得单一分类器存在准确度和适应性平静。分类算法存在归纳偏置现象,使得单一分类器存在精度和适应性平静。基于元学习的检测,利用多个基学习器之间的互补性以及元学习器的在学习能力提高整体分类的适应性。
(3)利用数据挖掘的方法消除了功率不平衡度对于被动检测的显著影响。
附图说明
图1为根据本发明优选实施例的方法流程图;
图2为根据本发明优选实施例的RELIEF算法流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1,本发明的目的在于提供一种基于数据挖掘的分布式发电孤岛检测改进方法,采用机器学习中的元学习方式确定孤岛检测的阈值,从而避免孤岛检测正定的盲目性,包括:
步骤1,采用RELIEF算法在分类前识别孤岛检测的关键特征,所述关键特征中包括稳态量特征和暂态量特征,采用关键特征后分类算法的准确性提高。样本的弱相关特征会降低分类算法的精度,并导致过度拟合,利用RELIEF算法识别孤岛检测的关键特征,独立于所选用的分类器,适用于各种孤岛检测情况。如果训练样本中包含不相关或弱相关的特性,会造成特征冲突以及关键特征被低估的问题,对分类器造成困扰,影响分类的可信度。
步骤2,基于基学习器和元学习器进行分类算法,实施分布式发电孤岛检测,包括:
步骤21,数据流挖掘:由于数据流是一个无限的时间序列,难以利用批处理方式完成训练和测试,因此必需采用增量方式,算法的时间和空间效率在衡量算法实用性方面更为重要;
步骤22,元学习:由于归纳偏置现象的存在,使得单一分类器虽然能够针对训练样本取得比较理想的分类精度,但是对于未知实例的泛化能力可能严重下降,预测倾向与其采用的归纳偏置关系密切,采用元学习方法,利用不同分类器的互补性提高数据挖掘和机器学习的适应性。
步骤23,在线自学习:数据流的特点之一就是其数据的走向及分布将随着时间的流逝而不断变化,这种分布不断变化形成概念漂移,从而使得离线获得的分类模型的分类精度逐渐降低以至于无法使用,步骤23采用滑动数据窗和多分类器集成方法实现在线自学习,保持分类精度始终维持在较高水平。
本实施例中以分布式能源的孤岛检测为例,根据IEEE Std.1547.1构建孤岛模型,其中E={(xi,yi)}(i=1,...n)为训练样本集合,n为样本总数,(Xi,yi)为一个样本实例。其中,为d维的特征向量,yi∈{0,1} 为该样本的类别标签。分类器的任务就是试图归纳特征向量与类别之间的函数关系,包括:
(1)稳态常规特征的判据:孤岛会破坏配电网有功功率平衡,进而引起频率变化,所以有功P及其变化率dP/dt、频率f及其变化率df/dt很早就作为孤岛检测特征。在孤岛/非孤岛运行方式下,无功的平衡方式也发生变化,这样电压U、功率因数也可构成有效判据。本实施例中,采用如下的稳态量特征:
(2)多分辨率奇异熵的暂态特征判据:将DRi采样电压Vs作为目标离散信号,计算各层多分辨率奇异熵,在分布式能源的孤岛检测中,多分辨率奇异熵作为特征向量具有显著的检测效果。
多分辨率奇异熵计算过程包括:
1)选择合适的小波基函数和分解层数。设确定的分解层数为m,对离散信号 f(k)(k=1,2…,N)(N为采样点数)进行快速小波分解,得到各层细节分量d1,d2,...,dm和第m层的概念要分量cm,本实施例采用Mallat快速算法进行处理,f(k)的离散二进小波变换采用下式确定:
2)对分解后的各层信号进行小波变换系数重构,重构公式为:
cj-1=H*cj+G*dj;
公式中,H*和G*分别为H和G的对偶算子。
3)对每层的重构信号进行相空间重构,将DRi采样电压Vs作为目标离散信号,计算各层分辨率奇异熵。设i层熵的重构信号为Di={di(k)},假设要重构1个n维相空间。将Di中的di(1),di(2),...,di(n)作为n维相空间的第1个矢量;将Di中的di(2),...,di(n+1)组为第2个矢量,如此类推,构造出一个(N-n+1)×n阶的矩阵A:
4)对每层矩阵进行奇异值分解(singular value decomposition,SVD),计算信号奇异谱熵。矩阵A(N-n+1)×n进行奇异值分解,得到其中Al×l的非零对角元素λji(j=1,2,...,l)为第i层A的奇异值。定义信号奇异谱熵为:
式中,pji为一不确定的概率分布;Hi为第i层分布所具有的信息熵。
在孤岛特征判据经过RELIEF选择以及之后的仿真验证都表明:多分辨率奇异熵具有良好的分类效果,对于区分孤岛事件,电能质量事件,本地负荷,DG投切事件具有非常靠前的RELIEF算法排名和显著的预测可靠性。
参见图2,作为优选的实施方式,所述采用RELIEF(Recursive elimination ofFeatures) 算法进行特征选择,是一种基于实例的特征选择方法,其基本原理为:如果某个特征为关键特征,那么在同类样本中,该特征的值应相同;而在异类样本中,该特征的值应不同。
基于RELIEF算法:首先从所有的训练样本集中随机选择m个样本,对每个所选择的样本,根据欧式距离找出其在同类样本和非同类样本中的最临近点,即nearest hit和nearest miss。样本空间中任意两个输入样本向量xr和xs之间的欧式距离drs由下式计算获得:
式中,“·”表示内积,nearest hit和nearest miss分别是同类样本和非同类样本中与所选样本之间欧式距离最小的两个样本向量。第j个特征的权值Wj可由所选择的m个样本通过下式迭代得到:
RELIEF算法的执行流程如下:
1)给定样本集合E={(xi,yi)}(i=1,...n),其特征集合为 A(x)={a(j)}(j=1,...d);
2)对各特征的值做归一化处理,设定各特征的初始权重ωj=0;对集合E的采样次数为T;
3)for t=1 to T do
随机从E中选取一个样本(x,y);
找到与样本欧式距离最近的同类样本H(x)和异类样本M(x);
For j=1 to d do
ωj=ωj+| X(j)-M(j)(x)|-|x(j)-H(j)(x)|
end for
end for
由此,同类样本与异类样本特征统计量差异越明显,则RELIEF算法对于该特征赋予权值越高,并且该算法独立于具体的分类方法,可以作为分类前的一个独立环节,并可以使用多分类器场景。
作为优选的实施方式,数据流挖掘采用C4.5处理,过程如下:
根据属性的值,对数据集排序,用不同的阈值将数据集动态的进行划分,当输出改变时确定一个阈值,取两个实际值中的中点作为一个阈值。取两个划分,所有样本都在这两个划分中,得到所有可能的阈值、增益及增益比,在每一个属性会变为两个取值,即小于阈值或大于阈值。
作为优选的实施方式,元学习的目标是在并行独立和固有分布式数据库的集合上通过应用学习来计算若干独立的分类(概念或模型)方案。在机器学习领域中,元学习具有两种实际应用:一种是利用元学习实现学习算法中自由参数的自动调整,即元学习利用学习过程中获得经验对这些参数进行修正和优化,从而提高学习算法的性能;另一种是利用元学习实现多个相关任务的知识转移。本实施例采用第一种应用,即利用学习经验调整基学习算法的学习步长,提高学习系统的性能。元学习算法和基学习算法所在的自适应层面是不同的:基学习算法是在基级上调整一个自适应系统的参数,而元学习算法是在元级上调整一个基学习算法的参数。元学习是一种两层机器学习架构,元学习器既可以采用基学习器的分类算法,也可以采用不同的分类算法:样本集合T的产生方法具有很多种。
本实施例中采用两种元学习方法:
一、组合元学习策略
将以原始样本集合E={(xi,yi)},i=1,2…n为训练集的分类器称为基学习器(base learner),设由K个基学习器Ck(k=1,…K)。为了表示方便,用C(xi)表示xi的类别标签,即真实分类yi,而用Ck(xi)表示基学习器Ck对xi的分类结果。利用如下方法产生新的样本集合T:
T={xi,C1(xi),C2(xi),...,CK(xi),C(xi)|xi∈E};
其中,前面d列为基学习器的特征,从d+1到d+k列为由k个基学习器的分类结果构成的特征,最后一列为类别标签。将以T为训练集的分类器称作元学习器(meta learner)。由此构成元学习系统,基学习器以原始样本集作为输入,而元学习器的样本中则增加了基学习器的分类结果。新样本集合T中可能存在三类样本:(1)所有基分类器皆是分类正确;(2)所有基础、分类器皆分类错误;(3)基分类器结果存在矛盾。元学习器并不试图对基学习器中挑选最佳学习器,而是对基学习器的结果进行再学习,试图对基学习器错误的分类进行纠正,而对正确的分类加以巩固。这样元学习器的分类精度不限于最佳的基学习器,而是优于所有基分类器。
二、裁决元学习系统
裁决元学习系统采用一个公正的分类器作为判决器,将在基学习器无法达成一致时,采纳该判决器的分类结果作为最终结果。因此,判决其本身是一个分类器,其依据和其他分类器的分类判定结果做出判断。裁决元学习系统具有自身的裁决规则和裁决器,基于基学习器决定最终结果。
实施例的典型应用算例:
一、算例设计:系统中包含三个分布式电源DG1-3,利用PSCAD仿真模型,主电网采用无穷大电源,分布式电源采用同步电机模型,采样频率为4000Hz,孤岛检测实现设定为250ms。
1、选择DG1作为研究整定阈值的对象。
2、、仿真随机生成不同的实例。
3、检测分布式电源DG1出口处的电气量。
4、经过Matlab预处理获得常规判据Xi和多奇异谱熵判据X’i,以及实力类别标志Ci={islanding,nonislanding}。
5、重复步骤2-4直至遍历所有N个设定实例。
6、根据{Xi,X’i,Ci}N*1构建决策树或生成判定规则。
拟仿真实例分为三类:孤岛、本地负荷及其他DG投切、电网电能质量干扰。在电压扰动事件中,电压骤升、骤降幅度为20-30%,持续事件为3-4个系统周期,即0.06-0.08s,电压脉冲幅度为2.5-3倍电压幅值,持续时间为3-5ms。并且考虑功率不平衡度PI(POWERIMBALANCE)对孤岛检测精度的影响。
其中PI定义为:
其中,Psys为主电网经公共耦合点流入本地配电网的有功功率,PDG为本地分布式电源所发出的有功功率,其中PI∈[0,1]。利用PSCAD软件生成936组训练样本,其中孤岛、负荷及其他DG投切、电压扰动按照1∶1∶1的比例设定。对目标信号进行4层小波分解,提取多奇异谱熵特征向量,采用Db4小波和100维相空间重构,即生成4个901*! 00维的矩阵,通过奇异值分解和求熵运算,得到分析目标DG1采样电压的熵值,进而获得特征向量。判据单位为常用计量单位Hz,kV,kA,kVar,degree,熵值单位为E.U.(Energy Unit)。稳态判据为取事件发生8个系统周期后的值作为稳态值,取峰值作为判据值,变化率判据均取事件发生直至峰值期间的平均变化率作为判据值。
二、确定关键特征判据:以12个常规判据作为候选特征,加上4个多奇异分辨率熵,共16个特征判据,利用RELIEF算法计算这些特征的权重,计算中采用10-fold交叉验证,取10次的均值并按权重进行排序。对特征权重进行归一化发现,前6个特征权重之和超过0.75,剩下特征权重皆不足0.01.综合考虑特征的总权重和单独权重,选取前6个特征作为关键特征集合。
(1)关键特征中兼有稳态量特征和暂态量特征,稳态量特征具有各岗位清晰的物理意义,暂态量特征的多分辨率分析能力更能表征信号的内在特征。
(2)不考虑频率变化率用于孤岛检测,当功率不平衡度较低时,频率变化率保护与频率保护很难协调,RELIEF算法没有在频率变化率与是否孤岛之间检测到足够强的联系,因此被赋予了较低的权重。
(3)DGl为同步发电机,能够在较大的范围内调整有功和武功输出。则选择为关键特征;若DG1为不具备大范围调整有功、无功输出能力的可再生能源(如光伏),则不会被选为关键特征,需要针对每个分布式电源进行机器学习。
本实施例中:
(1)样本中的低相关特征会降低分类算法的准确度和导致过度你和问题,利用RELIEF 算法能够识别孤岛检测的关键特征,该算法独立于所选用的分类器,且适用于各种孤岛检测情况,采用关键特征后分类算法的准确度得以明显提高。
(2)不同的分类算法采用不同的归纳偏置,会使得单一分类器存在准确度和适应性平静。分类算法存在归纳偏置现象,使得单一分类器存在精度和适应性平静。基于元学习的检测,利用多个基学习器之间的互补性以及元学习器的在学习能力提高整体分类的适应性。
(3)利用数据挖掘的方法消除了功率不平衡度对于被动检测的显著影响。
以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本发明的原理和实际应用,从而使所属技术领域人员能很好的理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制。
Claims (10)
1.一种基于数据挖掘的分布式发电孤岛检测改进方法,其特征在于采用机器学习中的元学习方式确定孤岛检测的阈值,包括:
步骤1,采用RELIEF算法在分类前识别孤岛检测的关键特征,所述关键特征中包括稳态量特征和暂态量特征;
步骤2,基于基学习器和元学习器进行分类算法,实施分布式发电孤岛检测。
2.根据权利要求1所述的一种基于数据挖掘的分布式发电孤岛检测改进方法,其特征在于,所述步骤2包括:
步骤21,数据流挖掘:采用增量方式,兼顾算法的时间和空间效率;
步骤22,元学习:利用不同分类器的互补性提高数据挖掘和机器学习的适应性;
步骤23,在线自学习:采用滑动数据窗和多分类器集成方法实现在线自学习,保持分类精度始终维持在较高水平。
4.根据权利要求2所述的一种基于数据挖掘的分布式发电孤岛检测改进方法,其特征在于,所述暂态量特征作为多分辨率奇异熵的暂态特征判据,包括:将DRi采样电压Vs作为目标离散信号,计算各层多分辨率奇异熵。
5.根据权利要求2所述的一种基于数据挖掘的分布式发电孤岛检测改进方法,其特征在于,所述多分辨率奇异熵计算过程包括:
1)选择合适的小波基函数和分解层数。设确定的分解层数为m,对离散信号f(k)(k=1,2...,N)(N为采样点数)进行快速小波分解,得到各层细节分量d1,d2,...,dm和第m层的概念要分量cm,采用Mallat快速算法进行处理,f(k)的离散二进小波变换采用下式确定:
2)对分解后的各层信号进行小波变换系数重构,重构公式为:
cj-1=H*cj+G*dj;
公式中,H*和G*分别为H和G的对偶算子;
3)对每层的重构信号进行相空间重构,将DRi采样电压Vs作为目标离散信号,计算各层分辨率奇异熵;设i层熵的重构信号为Di={di(k)},假设要重构1个n维相空间;将Di中的di(1),di(2),...,di(n)作为n维相空间的第1个矢量;将Di中的di(2),...,di(n+1)组为第2个矢量,如此类推,构造出一个(N-n+1)×n阶的矩阵A:
式中,pji为一不确定的概率分布;Hi为第i层分布所具有的信息熵。
6.根据权利要求1所述的一种基于数据挖掘的分布式发电孤岛检测改进方法,其特征在于,所述RELIEF算法的基本原理为:如果某个特征为关键特征,那么在同类样本中,该特征的值应相同;而在异类样本中,该特征的值应不同所述RELIEF算法包括:首先从所有的训练样本集中随机选择m个样本,对每个所选择的样本,根据欧式距离找出其在同类样本和非同类样本中的最临近点,即nearest hit和nearest miss。
8.根据权利要求7所述的一种基于数据挖掘的分布式发电孤岛检测改进方法,其特征在于,所述RELIEF算法包括:
1)给定样本集合E={(xi,yi)}(i=1,...n),其特征集合为A(x)={a(j)}(j=1,...d);
2)对各特征的值做归一化处理,设定各特征的初始权重ωj=0;对集合E的采样次数为T;
3)for t=1 to T do
随机从E中选取一个样本(x,y);
找到与样本欧式距离最近的同类样本H(x)和异类样本M(x);
For j=1 to d do
ωj=ωj+|x(j)-M(j)(x)|-|x(j)-H(j)(x)|
end for
end for
由此,同类样本与异类样本特征统计量差异越明显,则RELIEF算法对于该特征赋予权值越高,并且该算法独立于具体的分类方法,作为分类前的一个独立环节。
9.根据权利要求2所述的一种基于数据挖掘的分布式发电孤岛检测改进方法,其特征在于,所述数据流挖掘采用C4.5处理,包括:
根据属性的值,对数据集排序,用不同的阈值将数据集动态的进行划分,当输出改变时确定一个阈值,取两个实际值中的中点作为一个阈值;取两个划分,所有样本都在这两个划分中,得到所有可能的阈值、增益及增益比,在每一个属性会变为两个取值,即小于阈值或大于阈值。
10.根据权利要求2所述的一种基于数据挖掘的分布式发电孤岛检测改进方法,其特征在于,所述元学习的元学习方法包括:
组合元学习策略
将以原始样本集合E={(xi,yi)},i=1,2…n为训练集的分类器称为基学习器(baselearner),设由K个基学习器Ck(k=1,...K)。为了表示方便,用C(xi)表示xi的类别标签,即真实分类yi,而用Ck(xi)表示基学习器Ck对xi的分类结果。利用如下方法产生新的样本集合T:
T={xi,C1(xi),C2(xi),...,CK(xi),C(xi)|xi∈E};
其中,前面d列为基学习器的特征,从d+1到d+k列为由k个基学习器的分类结果构成的特征,最后一列为类别标签。将以T为训练集的分类器称作元学习器(meta learner),由此构成元学习系统,基学习器以原始样本集作为输入,而元学习器的样本中则增加了基学习器的分类结果;
裁决元学习系统
裁决元学习系统采用一个公正的分类器作为判决器,将在基学习器无法达成一致时,采纳该判决器的分类结果作为最终结果,判决其本身是一个分类器,其依据和其他分类器的分类判定结果做出判断,裁决元学习系统具有自身的裁决规则和裁决器,基于基学习器决定最终结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111049627.2A CN113945855A (zh) | 2021-09-08 | 2021-09-08 | 基于数据挖掘的分布式发电孤岛检测改进方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111049627.2A CN113945855A (zh) | 2021-09-08 | 2021-09-08 | 基于数据挖掘的分布式发电孤岛检测改进方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113945855A true CN113945855A (zh) | 2022-01-18 |
Family
ID=79327935
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111049627.2A Pending CN113945855A (zh) | 2021-09-08 | 2021-09-08 | 基于数据挖掘的分布式发电孤岛检测改进方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113945855A (zh) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103778569A (zh) * | 2014-02-13 | 2014-05-07 | 上海交通大学 | 一种基于元学习的分布式发电孤岛检测方法 |
-
2021
- 2021-09-08 CN CN202111049627.2A patent/CN113945855A/zh active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103778569A (zh) * | 2014-02-13 | 2014-05-07 | 上海交通大学 | 一种基于元学习的分布式发电孤岛检测方法 |
Non-Patent Citations (1)
Title |
---|
谭啸风: "分布式发电孤岛检测中的数据挖掘方法", 硕士电子期刊, 15 June 2015 (2015-06-15), pages 1 - 70 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Li et al. | A hierarchical data-driven method for event-based load shedding against fault-induced delayed voltage recovery in power systems | |
CN106093612B (zh) | 一种电力变压器故障诊断方法 | |
An et al. | A data-driven method for transient stability margin prediction based on security region | |
CN107153845A (zh) | 一种基于机器学习的自适应并网光伏系统的孤岛检测法 | |
CN116467667B (zh) | 一种基于数据融合的停电监测预警方法及系统 | |
CN103778569A (zh) | 一种基于元学习的分布式发电孤岛检测方法 | |
CN115329669A (zh) | 基于深度贝叶斯主动学习的电力系统暂态稳定评估方法 | |
Fan et al. | Post-fault transient stability assessment based on k-nearest neighbor algorithm with Mahalanobis distance | |
CN113884807B (zh) | 基于随机森林和多层架构聚类的配电网故障预测方法 | |
CN113222067B (zh) | 基于SVM-Adaboost算法的孤岛智能检测方法 | |
CN111062569A (zh) | 一种基于bp神经网络的小电流故障判别方法 | |
Singh et al. | Power system fault diagnosis using fuzzy decision tree | |
CN113033898A (zh) | 基于k均值聚类与bi-lstm神经网络的电负荷预测方法及系统 | |
CN113298296A (zh) | 一种自下而上的输电变电站日前负荷概率预测方法 | |
CN113945855A (zh) | 基于数据挖掘的分布式发电孤岛检测改进方法 | |
CN107454084B (zh) | 基于杂交带的最近邻入侵检测算法 | |
Hamlich et al. | Machine learning methods against false data injection in smart grid | |
Bai et al. | Contingency-based voltage stability monitoring via neural network with multi-level feature fusion | |
Qiao et al. | Transient stability assessment for ac-dc hybrid systems based on bayesian optimization xgboost | |
Munir et al. | Learning Vector Quantization with Local Mean Based to Determine K Value in the K-Nearest Neighbor Method | |
Mohammadi et al. | Most influential feature form for supervised learning in voltage sag source localization | |
Huang | Static security assessment of a power system using query-based learning approaches with genetic enhancement | |
Jie et al. | The study for data mining of distribution network based on particle swarm optimization with clustering algorithm method | |
Lin et al. | A Concept Drift Detection Method for Electricity Forecasting Based on Adaptive Window and Transformer | |
Niimura et al. | Machine learning approach to power system dynamic security analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |