CN110147760B - 一种高效电能质量扰动图像特征提取与识别新方法 - Google Patents

一种高效电能质量扰动图像特征提取与识别新方法 Download PDF

Info

Publication number
CN110147760B
CN110147760B CN201910416221.XA CN201910416221A CN110147760B CN 110147760 B CN110147760 B CN 110147760B CN 201910416221 A CN201910416221 A CN 201910416221A CN 110147760 B CN110147760 B CN 110147760B
Authority
CN
China
Prior art keywords
image
feature
classification
gray
disturbance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910416221.XA
Other languages
English (en)
Other versions
CN110147760A (zh
Inventor
林琳
王影
刘麒
陈玲玲
高兴泉
韩光信
孙明革
张慧颖
李鑫
吴雪莉
郑立军
于波
李佳
邢雪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei Jiuzhou Longteng Scientific And Technological Achievement Transformation Co ltd
Jiangsu Xiou Electronics Co ltd
Original Assignee
Jilin Institute of Chemical Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jilin Institute of Chemical Technology filed Critical Jilin Institute of Chemical Technology
Priority to CN201910416221.XA priority Critical patent/CN110147760B/zh
Publication of CN110147760A publication Critical patent/CN110147760A/zh
Application granted granted Critical
Publication of CN110147760B publication Critical patent/CN110147760B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/02Preprocessing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E10/00Energy generation through renewable energy sources
    • Y02E10/50Photovoltaic [PV] energy
    • Y02E10/56Power conversion systems, e.g. maximum power point trackers

Abstract

本公开是一种高效电能质量扰动图像特征提取与识别新方法,该方法包括:将电能质量信号转换为灰度图像,使用伽马校正、边缘检测与峰谷检测3种方法增强扰动特征后得到二值图像,提取面积、欧拉数、角二阶矩、对比度、相关性、均值、方差、逆差矩和熵9种特征构建原始特征集;以特征基尼重要度为依据进行排序,确定对分类影响最大的特征;综合考虑分类精度和效率,确定随机森林中树的个数,使用最优特征子集构建随机森林分类器对电能质量扰动信号进行识别。本公开能够实现不同噪声环境下电压暂降、电压暂升、电压中断、闪变、暂态振荡、谐波、电压切痕、电压尖峰8类常见电能质量扰动信号的高效、准确识别,并提高了扰动信号特征提取效率。

Description

一种高效电能质量扰动图像特征提取与识别新方法
技术领域
本公开涉及电气技术领域,具体而言,是一种高效电能质量扰动图像特征提取与识别新方法。
背景技术
随着各种电力电子设备、非线性负载等在现代电力系统中的大量应用,电力系统中的电能质量问题日趋严重。此外,具有间歇性、随机性等出力特性的分布式光伏、风电等新能源并网,进一步影响电能质量。电能质量问题给国民经济带来巨大损失,严重影响工业生产和居民生活。因此,电能质量问题的治理刻不容缓。电能质量扰动类型种类多且发生频繁,准确识别各类常见电能扰动类型,以便进行针对性治理是提高电力系统电能质量问题的重要前提。此外,随着目前各种传感器设备信号采样率的提高,大量监测点采集的海量高采样率信号对电能质量扰动识别的实时性提出了更高要求。
目前,虽然已有研究采用数字图像处理技术对电能质量扰动信号特征进行增强,但是特征提取不足,应用受到限制。因此,需要提供一种或多种至少能够解决上述技术问题的技术方案。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开的目的在于提供一种高效电能质量扰动图像特征提取与识别新方法。可实现不同噪声环境下,在图像处理技术对原始电能质量信号进行变换与增强后,对电压暂降、电压暂升、电压中断、闪变、暂态振荡、谐波、电压切痕和电压尖峰8类常见的电能质量扰动信号进行基于伽马校正(Gamma corrections)、边缘检测(Edge detection)与峰谷检测(Peaks and valley detection)三种图像增强变换。将传统一维电能质量信号转化为二值图像,并在此基础上,提取9类共45种原始特征构建原始特征集合。之后,在原始特征集合基础上,以随机森林(Random Forest,RF)为分类器,以分类准确率为决策变量,开展基于特征基尼(Gini)重要度的前向特征选择,最终确定最优特征子集与最优分类器结构。该方法实现了基于图像处理技术的电能质量信号的增强与高效特征提取,构建了完整的基于图像处理技术的电能质量信号原始图像特征集,并在此基础上,基于基尼重要度与随机森林确定了最优特征子集与最优随机森林分类器。新方法实现了高效率、高准确率的电能质量扰动识别问题,能够提高特征提取的效率。具体实现步骤如下:
1) 将电能质量信号转换为灰度图像,使用伽马校正、边缘检测与峰谷检测3种数字图像处理方法对扰动特征进行增强后得到的5类二值图像,之后,提取包括面积、欧拉数、角二阶矩、对比度、相关性、均值、方差、逆差矩和熵在内的9种特征,构建更全面的45维原始特征集合;将原始电能质量扰动信号转换为二维图像的转换规则为:
Figure 720190DEST_PATH_IMAGE001
(1)
标准电能质量信号转化为灰度图像后,其灰度变化均匀,无突变。若在信号中出现扰动成分,则在其灰度图像中可以发现明显的灰度变化,即采用图像处理方法对电能质量识别扰动信号进行识别的基础。
进一步地,采用的扰动图像增强方法有伽马校正、边缘检测与峰谷检测3种,对灰度图像进行处理其公式分别为:
Figure 758554DEST_PATH_IMAGE002
伽马校正公式为:
Figure 581147DEST_PATH_IMAGE003
(2)
式中,y为输入灰度图像,s为校正后灰度图像,cr均为常数;其中: r>1时,图像的高灰度区域对比度增强;r<1时,图像的低灰度区域对比度增强; r=1时,图像无变化。
在伽马校正后进一步突出扰动信号畸变特征,采用最大类间方差法选取最优阈值将灰度图像转换为二值图像,其中最大类间方差法计算图像的最佳阈值公式为:
Figure 693460DEST_PATH_IMAGE004
(3)
式中,当分割阈值为t时,w0为背景比例,u0为背景均值,w1为前景比例,u1为前景均值,u为整幅图像的均值;令以上表达式值最大的t,即为分割图像的最佳阈值;
Figure 90943DEST_PATH_IMAGE005
边缘检测方法采用坎尼边缘算子,使用高斯滤波器对需要处理的图像进行平滑滤波,其公式表示为:
Figure 288706DEST_PATH_IMAGE006
(4)
式中,G为梯度强度,I为待平滑的图像,J为平滑后的图像;
计算平滑图像J中各个像素点的梯度方向和幅值,该过程表示为:
Figure 429837DEST_PATH_IMAGE007
(5)
式中, J x J y 分别表示平滑图像Jxy方向上的梯度;梯度的方向
Figure 458973DEST_PATH_IMAGE008
和幅值
Figure 699462DEST_PATH_IMAGE009
如下面公式所示:
Figure 463150DEST_PATH_IMAGE010
(6)
Figure 80076DEST_PATH_IMAGE011
(7)
Figure 963718DEST_PATH_IMAGE012
峰谷检测方法将灰度图像看作三维图像,即x轴和y轴分别表示像素的位置,z轴表示像素强度;其中灰度值较高的位置和灰度值较低的位置相当于地形图中的山峰和低谷,即局部极大值和局部极小值。
分析以上由不同图像增强方法所得二值图像可知,由于各种图像增强方法的原理各异,因此不同的图像增强方法对各种扰动类型的增强效果不同。伽马校正方法适用于电压暂降(Sag)、电压暂升(Swell)、闪变(Flicker)等信号;峰谷检测方法对电压中断(Interruption)、电压切痕(Nocth)、电压尖峰(Spike)等信号具有较好的特征增强效果;边缘检测方法对暂态振荡(Transient)信号特征增强效果较好。考虑到在电能质量扰动识别的实际工程应用中各类扰动类型的未知性,为了全面增强未知扰动的特征,新方法在特征提取之前,使用以上3种图像增强方法同时对各类扰动信号进行处理。在此基础上,对所得二值图像提取扰动特征,由此构建信息丰富、有效的原始特征集合。
进一步地,对经过以上3种图像增强方法处理后得到的5类二值图像,包括采用伽马校正方法分别在r=0.125与r=8时所得2类二值图像、边缘检测方法所得二值图像和峰谷检测方法所得局部极小值、极大值2类二值图像。在传统的面积和欧拉数特征基础上,增加了角二阶矩、对比度、相关性、均值、方差、逆差矩和熵共9种特征,提取每类图像9种特征,共计45维特征,各特征的计算公式如下:
角二阶矩:
Figure 437425DEST_PATH_IMAGE013
(8)
对比度:
Figure 609780DEST_PATH_IMAGE014
(9)
式中,t为灰度级;
相关性:
Figure 92714DEST_PATH_IMAGE015
(10)
式中,
Figure 34125DEST_PATH_IMAGE016
Figure 426536DEST_PATH_IMAGE017
为均值,
Figure 148504DEST_PATH_IMAGE018
Figure 107233DEST_PATH_IMAGE019
为方差,表达式分别为:
Figure 231047DEST_PATH_IMAGE020
Figure 249818DEST_PATH_IMAGE021
Figure 927924DEST_PATH_IMAGE022
Figure 503393DEST_PATH_IMAGE023
均值:
Figure 419397DEST_PATH_IMAGE024
(11)
方差:
Figure 671387DEST_PATH_IMAGE025
(12)
式中,
Figure 305630DEST_PATH_IMAGE026
Figure 668478DEST_PATH_IMAGE027
的均值
逆差矩:
Figure 438988DEST_PATH_IMAGE028
(13)
熵:
Figure 596300DEST_PATH_IMAGE029
(14)
其中, L为二值图像中灰度级数目,mn分别代表灰度图像中像素点的行号和列号, P(m,n)为第m行、第n列的灰度值。
2)在随机森林训练过程中,不同特征分割节点的分类效果可以用基尼指数来衡量。以特征的基尼重要度为依据对45维特征进行降序排序,使用前项选择法(SequentialForward Selection,SFS)选取最优特征子集,最终确定其中包含对分类影响最大的15维特征,避免冗余特征对分类的影响;
随机森林(Random Forest, RF)是一种优秀的集成分类算法,它将决策树(Decision Tree,DT)与集成学习结合,构成新型分类器集合:
Figure 265310DEST_PATH_IMAGE030
(15)
式中,
Figure 369532DEST_PATH_IMAGE031
是由CART(Classification And Regression Tree)算法生成的分类决策树元分类器;x是输入向量, k为元分类器个数;
Figure 322445DEST_PATH_IMAGE032
是独立同分布的随机向量。随机森林在各决策树不同节点产生随机特征子集,并选择分类效果最好的特征作为分类特征,再汇总不同决策树的分类结论最终实现准确分类。
给定分类器集合
Figure 853920DEST_PATH_IMAGE033
,每一个分类器的训练集都是从原始数据集(X,Y)中随机抽取所得,余量函数定义为:
Figure 259494DEST_PATH_IMAGE034
(16)
式中,
Figure 698565DEST_PATH_IMAGE035
为示性函数,
Figure 443668DEST_PATH_IMAGE036
表示取平均值,Y为正确分类的向量, j为不正确分类的向量。mg(X,Y)值越大,分类性能越优秀,置信度越高。由此,得到用于评估分类器分类能力的泛化误差PE *
PE*=P X,Y (mg(X,Y)<0) (17)
式中, XY表示定义空间。
基于随机森林的电能质量扰动分类流程为:
Figure 959094DEST_PATH_IMAGE002
从原始特征集合N中有放回地随机抽取n个样本构成自助样本集,重复L次,新方法在特征选择阶段L的取值为200;
Figure 789646DEST_PATH_IMAGE005
训练过程中,从特征空间M中随机选择扰动特征作为非叶子节点分类候选特征,用每个候选特征分割节点并选择分割效果最好的特征作为该节点分割特征,重复这一过程直至每棵树的非叶子节点都分类完成,结束训练过程;
Figure 32409DEST_PATH_IMAGE012
分类时,对每个元分类器分类结果采用多数投票法,确定最优分类结果。
特征的基尼指数是一种节点不纯度的度量方式。基尼重要度计算方法为:假设S是一个含有s个样本的数据集,可以分为n类,s i 表示其中第i类包含的样本数(i=1,2,…,n),则集合S的基尼指数表示为:
Figure 959914DEST_PATH_IMAGE037
(18)
式中, P i =s i /s,表示任意样本属于第i类的概率;当S中只包含一类时,其基尼指数为0;当S中所有类别均匀分布时,基尼指数取得最大值;当随机森林使用某个特征对节点进行划分时,可以将集合S分为m个子集(S j , j=1,2,3,…,m),则划分后集合S的基尼指数为:
Figure 833192DEST_PATH_IMAGE038
(19)
式中,S j 为集合S中样本数,具有最小Gini split 值的特征划分效果最好。
计算特征基尼重要度排序的过程为:首先,使用原始特征集合训练随机森林分类器,计算每一个特征分割该节点后的Gini split 值,并用分割节点前节点的基尼指数减去该值,得到所有特征的基尼重要度;之后,选择基尼重要度值最大的特征作为该节点的分割特征;最后,在随机森林构建完成后,把同一个特征的所有基尼重要度进行线性叠加并降序排序,得到所有特征的基尼重要度排序。
得到原始特征集合中所有特征的基尼重要度后,即可进行基于随机森林分类器与基尼重要度的前向搜索策略。首先,按照已得的特征重要度降序排序,将特征依次加入已选特征集合Q中;每加入一个特征,则用新的特征集合Q重新训练随机森林分类器,并记录该特征集合下的分类准确率,重复以上过程直至所有特征都加入到Q中;最后,综合考虑分类准确率和集合Q的特征维数,确定最优特征子集。
3)在尽量保证最优分类结果的前提下,使用上述15维特征子集构建随机森林分类器,在保证最优分类效果的前提下,尽量减少树的个数,从而提高分类效率,最终选取森林中树的个数为90,而后建立随机森林模型对电能质量扰动信号进行识别。
在确定最优特征子集后,使用最优特征子集训练随机森林分类器用于电能质量扰动识别。随机森林是一种集成分类算法,其分类效果与森林中树的个数有关,树的个数决定了随机森林的规模。随机森林规模越大,其分类误差越小,特征的基尼重要度分析越准确。因此,在特征选择环节,随机森林中树的个数定为200棵,但是,随机森林的分类效率会随着树的个数的增加而降低。因此,在保证最优分类效果的前提下,应尽量使树的个数最小,从而提升随机森林的分类效率。
本公开示例性实施例中的关于高效电能质量扰动图像特征提取与识别新方法通过将电能质量原始信号转换为灰度图像,并通过伽马校正、边缘检测与峰谷检测3种数字图像处理方法对扰动特征进行增强,得到扰动信号二值图像。在此基础上提取扰动特征,构建原始特征集合,而后以随机森林为分类器,以分类准确率为决策变量,开展基于特征基尼重要度的前向特征选择,最终确定最优特征子集与最优分类器结构。新方法实现了基于图像处理技术的电能质量信号的增强与高效特征提取,构建了完整的基于图像处理技术的电能质量信号原始图像特征集,并在此基础上,基于基尼重要度与随机森林确定了最优特征子集与最优随机森林分类器。该方法可有效反映不同扰动类型的特点,且相较于S变换,经验模态分解等信号处理方法,新方法信号处理效率得到显著提高。另外,以特征基尼重要度衡量不同特征分类能力,并以此为依据,采用序列前向搜索方法进行特征选择实现了对特征的有效分析,去除了原始特征集合中的冗余特征,同时有效提高特征计算效率,简化分类器结构。使用随机森林分类器实现了不同噪声环境下对电能质量扰动信号的有效识别,改善了现有电能质量扰动识别研究中存在的信号处理效率低、有效特征选择分析不足等缺点,实现了高效率、高准确率的电能质量扰动识别,提高了特征提取的效率。
附图说明
图1示出了根据本公开一示例性实施例的高效电能质量扰动图像特征提取与识别新方法流程图;
图2示出了根据本公开一示例性实施例的8类扰动信号经伽马校正后由最大类间方差法确定最优阈值后所得二值图;(a)r=0.125时伽马校正后二值图;(b)r=8时伽马校正后二值图;
图3示出了根据本公开一示例性实施例的8类扰动信号经边缘检测处理后所得二值图;
图4示出了根据本公开一示例性实施例的8类扰动信号经峰谷检测处理后所得二值图;(a)局部极小值二值图;(b)局部极大值二值图;
图5示出了根据本公开一示例性实施例的特征基尼重要度降序排序及各特征子集下分类准确率图;
图6示出了根据本公开一示例性实施例的随机森林规模对分类误差的影响图。
具体实施方式
现在将参考附图更全面地描述示例实施例。然而,示例实施例能够以多种形式实施,且不应被理解为限于在此阐述的实施例;相反,提供这些实施例使得本公开将全面和完整,并将示例实施例的构思全面地传达给本领域的技术人员。
在本示例实施例中,提供了高效电能质量扰动图像特征提取与识别新方法。参考图1所示,该高效电能质量扰动图像特征提取与识别新方法可以包括以下步骤:
步骤1,将电能质量信号转换为灰度图像,而后使用伽马校正、边缘检测与峰谷检测 3种数字图像处理方法对扰动特征进行增强后得到的5类二值图像,提取包括面积、欧拉数、角二阶矩、对比度、相关性、均值、方差、逆差矩和熵9种特征,构建更全面的45维原始特征集合;
步骤2,以特征基尼重要度为依据对45维特征进行降序排序,使用前项选择策略选取最优特征子集,最终确定其中包含对分类影响最大的15维特征,避免冗余特征对分类的影响;
步骤3,在尽量保证最优分类结果的前提下,使用上述15维特征子集构建随机森林分类器,在保证最优分类效果的前提下,尽量使树的个数最小,提高分类效率;最终选取森林中树的个数为90,而后建立随机森林模型对电能质量扰动信号进行识别。
关于高效电能质量扰动图像特征提取与识别新方法通过将电能质量原始信号转换为灰度图像,并通过伽马校正、边缘检测与峰谷检测3种数字图像处理方法对扰动特征进行增强,得到扰动信号二值图像。在此基础上提取扰动特征,构建原始特征集合,而后以随机森林为分类器,以分类准确率为决策变量,开展基于特征基尼重要度的前向特征选择,最终确定最优特征子集与最优分类器结构。新方法实现了基于图像处理技术的电能质量信号的增强与高效特征提取,构建了完整的基于图像处理技术的电能质量信号原始图像特征集,并在此基础上,基于基尼重要度与随机森林确定了最优特征子集与最优随机森林分类器。可有效反映不同扰动类型的特点,相较于S变换,经验模态分解等信号处理方法,新方法信号处理效率得到显著提高。另外,以特征基尼重要度衡量不同特征分类能力,并以此为依据,采用序列前向搜索方法进行特征选择实现了对特征的有效分析,去除了原始特征集合中的冗余特征,同时有效提高特征计算效率,简化分类器结构。使用随机森林分类器实现了不同噪声环境下对电能质量扰动信号的有效识别,改善了现有电能质量扰动识别研究中存在的信号处理效率低、对有效特征选择分析不足等缺点,实现了高效率、高准确率的电能质量扰动识别,提高了特征提取的效率。
在步骤1中首先将电能质量信号转化为灰度图像,而后进行图像增强,提取原始特征集:
原始电能质量扰动信号进行按照以下规则转换为二维图像:
Figure 947778DEST_PATH_IMAGE039
(1)
标准电能质量信号转化为灰度图像后,其灰度变换均匀,无突变。若在信号中出现扰动成分,则在其灰度图像中可以发现明显的灰度变化,即采用图像处理方法对电能质量识别扰动信号进行识别的基础。
扰动图像增强方法包括伽马校正、边缘检测与峰谷检测 3种,公式分别为:
Figure 197494DEST_PATH_IMAGE002
伽马校正公式为:
Figure 467588DEST_PATH_IMAGE040
(2)
式中,y为输入灰度图像,s为校正后灰度图像,cr均为常数;其中: r>1时,图像的高灰度区域对比度增强;r<1时,图像的低灰度区域对比度增强; r=1时,图像无变化。为了全面刻画扰动特征,新方法分别选取参数r=0.125与r=8对灰度图像进行增强。
伽马校正后进一步突出扰动信号畸变特征,采用最大类间方差法选取最优阈值将灰度图像转换为二值图像,其中最大类间方差法计算图像的最佳阈值公式为:
Figure 574084DEST_PATH_IMAGE041
(3)
式中,当分割的阈值为t时,w0为背景比例,u0为背景均值,w1为前景比例,u1为前景均值,u为整幅图像的均值;令以上表达式值最大的t,即为分割图像的最佳阈值。
Figure 113650DEST_PATH_IMAGE005
边缘检测方法采用坎尼边缘算子,使用高斯滤波器对图像进行平滑滤波,其公式表示为:
Figure 963794DEST_PATH_IMAGE042
(4)
式中,G为梯度强度,I为待平滑的图像,J为平滑后的图像。
计算平滑图像J中各个像素点的梯度方向和幅值,该过程表示为:
Figure 537995DEST_PATH_IMAGE043
(5)
式中,J x J y 分别表示平滑图像Jxy方向上的梯度;梯度的方向
Figure 815393DEST_PATH_IMAGE008
和幅值
Figure 655304DEST_PATH_IMAGE009
如下面公式所示:
Figure 981243DEST_PATH_IMAGE044
(6)
Figure 737847DEST_PATH_IMAGE045
(7)
Figure 123829DEST_PATH_IMAGE012
峰谷检测方法将灰度图像看作三维图像,即x轴和y轴分别表示像素的位置,z轴表示像素强度。其中灰度值较高的位置和灰度值较低的位置相当于地形图中的山峰和低谷,即局部极大值和局部极小值。
采用不同图像增强方法后效果分别如图2、图3和图4所示,分析不同图像增强方法所得二值图像可知,由于各种图像增强方法的原理不同,因此对各种扰动类型的增强效果也不同。伽马校正方法适用于电压暂降(Sag)、电压暂升(Swell)、闪变(Flicker)等信号;峰谷检测方法对电压中断(Interruption)、电压切痕(Nocth)、电压尖峰(Spike)等信号具有较好的特征增强效果;边缘检测方法对暂态振荡(Transient)信号特征增强效果较好。考虑到电能质量扰动识别实际工程应用中各类扰动类型的未知性,新方法在特征提取之前使用以上3种图像增强方法分别对各类扰动信号进行处理,在此基础上对所得二值图像提取扰动特征,构建信息丰富、有效的原始特征集合。
提取经图像增强技术处理过的扰动特征构建原始特征集,在传统的面积和欧拉数特征基础上,增加了角二阶矩、对比度、相关性、均值、方差、逆差矩、熵等特征,其公式表示如下:
角二阶矩:
Figure 700303DEST_PATH_IMAGE046
(8)
对比度:
Figure 361092DEST_PATH_IMAGE047
(9)
式中,t为灰度级;
相关性:
Figure 722934DEST_PATH_IMAGE048
(10)
式中,
Figure 76555DEST_PATH_IMAGE016
Figure 78009DEST_PATH_IMAGE017
为均值,
Figure 73647DEST_PATH_IMAGE049
Figure 476947DEST_PATH_IMAGE050
为方差,其表达式分别为:
Figure 1469DEST_PATH_IMAGE020
Figure 303268DEST_PATH_IMAGE021
Figure 40280DEST_PATH_IMAGE022
Figure 360403DEST_PATH_IMAGE051
均值:
Figure 259089DEST_PATH_IMAGE052
(11)
方差:
Figure 297452DEST_PATH_IMAGE053
(12)
式中,
Figure 369313DEST_PATH_IMAGE026
Figure 481626DEST_PATH_IMAGE027
的均值;
逆差矩:
Figure 361333DEST_PATH_IMAGE028
(13)
熵:
Figure 621413DEST_PATH_IMAGE029
(14)
其中,L为二值图像中灰度级数目,mn分别代表灰度图像中像素点的行号和列号, P(m,n)为第m行、第n列的灰度值。
由以上3种图像增强方法处理后得到5类二值图像,包括伽马校正方法分别在r=0.125与r=8下所得2类二值图像、边缘检测方法所得二值图像和峰谷检测方法所得局部极小值、极大值2类二值图像共5类图像,每类图像9种特征,共可提取45维特征组成原始特征集合。
在步骤2中,随机森林训练过程中,不同特征分割节点的分类效果可以用基尼指数来衡量。以特征的基尼重要度为依据对45维特征进行降序排序,使用前项选择策略选取最优特征子集,最终选取对分类影响最大的15维特征,避免冗余特征对分类的影响;
随机森林是一种优秀的集成分类算法,它将决策树与集成学习结合,构成新型分类器集合:
Figure 700227DEST_PATH_IMAGE054
(15)
式中,
Figure 729363DEST_PATH_IMAGE055
是由CART(Classification And Regression Tree)算法生成的分类决策树元分类器;x是输入向量,k为元分类器个数;
Figure 235431DEST_PATH_IMAGE056
是独立同分布的随机向量。随机森林在各决策树不同节点产生随机特征子集,并选择分类效果最好的特征作为分类特征,再汇总不同决策树的分类结论最终实现准确分类。
给定分类器集合
Figure 982807DEST_PATH_IMAGE057
,每一个分类器的训练集都是从原始数据集(X,Y)中随机抽取所得,余量函数定义为:
Figure 147203DEST_PATH_IMAGE034
(16)
式中,
Figure 234108DEST_PATH_IMAGE035
为示性函数,
Figure 973394DEST_PATH_IMAGE036
表示取平均值,Y为正确分类的向量,j为不正确分类的向量。mg(X,Y)值越大,分类性能越优秀,置信度越高。由此,得到用于评估分类器分类能力的泛化误差PE *
PE*=P X,Y (mg(X,Y)<0) (17)
式中, XY表示定义空间。
基于随机森林的电能质量扰动分类流程为:
① 从原始特征集合N中有放回地随机抽取n个样本构成自助样本集,重复L次,新方法在特征选择阶段L的取值为200;
② 训练过程中,从特征空间M中随机选择扰动特征作为非叶子节点分类候选特征,用每个候选特征分割节点并选择分割效果最好的特征作为该节点的分割特征。重复这一过程直至每棵树的非叶子节点都分类完成,结束训练过程;
③ 分类时,对每个元分类器分类结果采用多数投票法,确定最优分类结果。
特征的基尼指数是一种节点不纯度的度量方式。基尼重要度计算方法为:假设S是一个含有s个样本的数据集,可以分为n类,s i 表示其中第i类包含的样本数(i=1,2,…,n),则集合S的基尼指数表示为:
Figure 145749DEST_PATH_IMAGE058
(18)
式中, P i =s i /s,表示任意样本属于第i类的概率;当S中只包含一类时,其基尼指数为0;当S中所有类别均匀分布时,基尼指数取得最大值;当随机森林使用某个特征对节点进行划分时,可以将集合S分为m个子集(S j ,j=1,2,3,…,m),则划分后集合S的基尼指数为:
Figure 363104DEST_PATH_IMAGE059
(19)
式中,S j 为集合S中样本数,具有最小Gini split 值的特征划分效果最好。
特征基尼重要度排序过程为:首先,使用原始特征集合训练随机森林分类器,计算每一个特征分割该节点后的Gini split 值,并用分割节点前节点的基尼指数减去该值,得到所有特征的基尼重要度;而后,选择基尼重要度值最大的特征作为该节点的分割特征;在构建完随机森林后,把同一个特征的所有基尼重要度进行线性叠加并降序排序,即可得到所有特征的基尼重要度排序。
在得到原始特征集合中所有特征的基尼重要度后,进行基于随机森林分类器与基尼重要度的前向搜索策略。首先,按照特征重要度降序排序,将特征依次加入已选特征集合Q中;每加入一个特征后,用新的特征集合Q重新训练随机森林分类器,并记录该特征集合下的分类准确率,重复以上过程直至所有特征都加入到Q中;最后,综合考虑分类准确率和集合Q的特征维数,确定最优特征子集。
在此,仿真生成信噪比为20dB-50dB之间、具有随机参数的扰动信号每类各600组,作为训练集合,用于训练随机森林分类器。同时,在相同环境下仿真生成每类信号各200组作为验证集,用于完成特征选择工作。之后,以训练集训练随机森林分类器,计算原始特征集合中各特征的基尼重要度。按照重要度从大到小的顺序依次将各个特征加入特征子集Q中,并记录此时在Q下的随机森林分类准确率。最后,综合考虑特征重要度和特征维数,确定最优特征子集。特征基尼重要度降序排序及各特征子集下分类准确率如图5所示。
观察图5中折线图可知,在特征选择过程中,当特征维数为15维时,分类准确率达到最高值99.33%。在加入剩余特征之后,分类准确率波动不明显。在保证良好的分类准确率的前提下,减少特征维数可有效提高特征提取与分类效率、简化分类器结构。因此,综合考虑分类准确率与特征维数,新方法确定采用特征基尼重要度降序排序,并选取前15维特征组成最优特征子集。
在步骤3中,使用步骤2中确定的特征子集构建随机森林器,在保证最优分类效果和效率的前提下,确定森林中树的个数,而后建立随机森林模型对电能质量扰动信号进行识别。
随机森林是一种集成分类算法,其分类效果与森林中树的个数有关,树的个数决定了随机森林的规模,规模越大,其分类误差越小,特征的基尼重要度分析越准确。因此,在特征选择环节,随机森林中树的个数定为200,但随机森林的分类效率会随着树的个数的增加而降低。因此,在保证最优分类效果的前提下,应尽量使树的个数最小,提高随机森林的分类效率。图6示出在各噪声环境下随机森林中树的个数与分类误差对比情况。由图6分析可知,当树的个数超过90个时,在各噪声环境下随机森林的识别准确率达到稳定水平。继续增加树的个数对分类效果的贡献不明显,而分类效率会因树的个数的增加而显著降低。因此,综合考虑分类效率与分类准确率,最终选取随机森林中树的个数为90,此时,在保证随机森林良好分类效果的同时,仍具有较高的分类效率。
为了全面测试新方法在复杂噪声环境下的有效性,使用Matlab R2016b仿真生成具有随机扰动参数且信噪比分别为20dB、30dB、40dB、50dB的9类信号,每类信号各200组。分别使用随机森林(Random Forest,RF)与支持向量机(Support Vector Machine,SVM)、极限学习机(Extreme Learning Machine,ELM)、决策树(Decision Tree,DT)分类器对各组信号进行识别,其结果如表1所示:
表1 扰动信号在不同分类器下分类效果
Figure 366832DEST_PATH_IMAGE060
其中C0~C8分别表示标准信号和电压暂降、电压暂升、电压中断、闪变、暂态振荡、谐波、电压切痕、电压尖峰8类常见电能质量扰动信号,由表1分析可知,采用新方法在信噪比为30dB及以上时,分类准确率可达到99.44%以上;信噪比为20dB时,由于噪声影响,准确率有明显降低,但也达到了96.22%。相较于其他分类器方法,在不同噪声环境下,新方法结合随机森林分类器均可获得较高准确率,证明了新方法在不同噪声环境下的有效性。
此外,上述附图仅是根据本发明实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解。应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明公开的范围仅由所附的权利要求来限定。

Claims (1)

1.一种高效电能质量扰动图像特征提取与识别新方法,可实现对不同噪声环境下,在图像处理技术对原始电能质量信号进行变换与增强后,对电压暂降、电压暂升、电压中断、闪变、暂态振荡、谐波、电压切痕、电压尖峰8类常见的电能质量扰动信号进行基于伽马校正(Gamma corrections)、边缘检测(Edge detection)与峰谷检测(Peaks and valleydetection)三种图像增强变换;将传统一维电能质量信号转化为二值图像,并在此基础上,提取9类共45种原始特征构建原始特征集合;之后,在此原始特征集合基础上,以随机森林(Random Forest,RF)为分类器,以分类准确率为决策变量,开展基于特征基尼(Gini)重要度的前向特征选择,最终确定最优特征子集与最优分类器结构;新方法实现了基于图像处理技术的电能质量信号的增强与高效特征提取,构建了完整的基于图像处理技术的电能质量信号原始图像特征集,并在此基础上,基于基尼重要度与随机森林确定了最优特征子集与最优随机森林分类器;新方法实现了高效率、高准确率的电能质量扰动识别问题,能够提高特征提取的效率;具体实现步骤如下:
(1)将电能质量信号转换为灰度图像,使用伽马校正、边缘检测与峰谷检测3种数字图像处理方法对扰动特征进行增强后得到的5类二值图像,之后,提取包括面积、欧拉数、角二阶矩、对比度、相关性、均值、方差、逆差矩和熵在内的9种特征,构建更全面的45维原始特征集合;将原始电能质量扰动信号转换为二维图像的转换规则为:
Figure 939648DEST_PATH_IMAGE001
(1)
采用的扰动图像增强方法有伽马校正、边缘检测与峰谷检测3种,其中,伽马校正公式为:
Figure 528892DEST_PATH_IMAGE002
(2)
式中,y为输入灰度图像,s为校正后灰度图像,cr均为常数;其中: r>1时,图像的高灰度区域对比度增强;r<1时,图像的低灰度区域对比度增强; r=1时,图像无变化;
在伽马校正后进一步突出扰动信号畸变特征,采用最大类间方差法选取最优阈值,将灰度图像转换为二值图像,其中最大类间方差法计算图像的最佳阈值公式为:
Figure 308629DEST_PATH_IMAGE003
(3)
式中,当分割阈值为t时,w0为背景比例,u0为背景均值,w1为前景比例,u1为前景均值,u为整幅图像的均值;令以上表达式值最大的t,即为分割图像的最佳阈值;
边缘检测方法采用坎尼边缘算子,使用高斯滤波器对需要处理的图像进行平滑滤波,其公式表示为:
Figure 438259DEST_PATH_IMAGE004
(4)
式中,G为梯度强度,I为待平滑的图像,J为平滑后的图像;
计算平滑图像J中各个像素点的梯度方向和幅值,该过程表示为:
Figure 252632DEST_PATH_IMAGE005
(5)
式中, J x J y 分别表示平滑图像Jxy方向上的梯度;梯度的方向
Figure 871832DEST_PATH_IMAGE006
和幅值
Figure 138865DEST_PATH_IMAGE007
如下 面公式所示:
Figure 72186DEST_PATH_IMAGE008
(6)
Figure 741065DEST_PATH_IMAGE009
(7)
峰谷检测方法将灰度图像看作三维图像,即x轴和y轴分别表示像素的位置,z轴表示像素强度;其中灰度值较高的位置和灰度值较低的位置相当于地形图中的山峰和低谷,即局部极大值和局部极小值;
对经过以上3种图像增强方法处理后得到的5类二值图像,包括采用伽马校正方法分别在r=0.125与r=8时所得2类二值图像、边缘检测方法所得二值图像和峰谷检测方法所得局部极小值、极大值2类二值图像;在传统的面积和欧拉数特征基础上,增加了角二阶矩、对比度、相关性、均值、方差、逆差矩和熵共9种特征,提取5类图像共计45维特征;
各个特征的公式表示如下:
角二阶矩:
Figure 655800DEST_PATH_IMAGE010
(8)
对比度:
Figure 410129DEST_PATH_IMAGE011
(9)
式中,t为灰度级;
相关性:
Figure 881562DEST_PATH_IMAGE012
(10)
式中,
Figure 404947DEST_PATH_IMAGE013
Figure 834792DEST_PATH_IMAGE014
为均值,
Figure 873155DEST_PATH_IMAGE015
Figure 148278DEST_PATH_IMAGE016
为方差,其表达式分别为:
Figure 526170DEST_PATH_IMAGE017
Figure 861336DEST_PATH_IMAGE018
Figure 262362DEST_PATH_IMAGE019
Figure 341176DEST_PATH_IMAGE020
均值:
Figure 573574DEST_PATH_IMAGE021
(11)
方差:
Figure 345221DEST_PATH_IMAGE022
(12)
式中,
Figure 92598DEST_PATH_IMAGE023
Figure 975103DEST_PATH_IMAGE024
的均值;
逆差矩:
Figure 62008DEST_PATH_IMAGE025
(13)
熵:
Figure 4556DEST_PATH_IMAGE026
(14)
其中, L为二值图像中灰度级数目,mn分别代表灰度图像中像素点的行号和列号, P(m,n)为第m行、第n列的灰度值;
(2)以特征的基尼重要度为依据对45维特征进行降序排序,使用前项选择策略选取最优特征子集,最终确定其中包含对分类影响最大的15维特征,避免冗余特征对分类的影响;
基尼重要度计算方法为:假设S是一个含有s个样本的数据集,可以分为n类,s i 表示其中第i类包含的样本数 (i=1,2,3,…,n),则集合S的基尼指数表示为:
Figure 862397DEST_PATH_IMAGE027
(15)
式中, P i =s i /s,表示任意样本属于第i类的概率;当S中只包含一类时,其基尼指数为0;当S中所有类别均匀分布时,基尼指数取得最大值;当随机森林使用某个特征对节点进行划分时,可以将集合S分为m个子集(S j , j=1,2,3,…,m),则划分后集合S的基尼指数为:
Figure 283014DEST_PATH_IMAGE028
(16)
式中,S j 为集合S中样本数,具有最小Gini split 值的特征划分效果最好;
(3)在尽量保证最优分类结果的前提下,使用上述15维特征子集构建随机森林分类器,在保证最优分类效果的前提下,尽量减少树的个数,从而提高分类效率,最终选取森林中树的个数为90,而后建立随机森林模型对电能质量扰动信号进行识别。
CN201910416221.XA 2019-05-20 2019-05-20 一种高效电能质量扰动图像特征提取与识别新方法 Active CN110147760B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910416221.XA CN110147760B (zh) 2019-05-20 2019-05-20 一种高效电能质量扰动图像特征提取与识别新方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910416221.XA CN110147760B (zh) 2019-05-20 2019-05-20 一种高效电能质量扰动图像特征提取与识别新方法

Publications (2)

Publication Number Publication Date
CN110147760A CN110147760A (zh) 2019-08-20
CN110147760B true CN110147760B (zh) 2022-08-12

Family

ID=67591815

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910416221.XA Active CN110147760B (zh) 2019-05-20 2019-05-20 一种高效电能质量扰动图像特征提取与识别新方法

Country Status (1)

Country Link
CN (1) CN110147760B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110852990B (zh) * 2019-10-09 2023-02-24 北京理工华汇智能科技有限公司 一种基于图像处理的橡胶树斜刀痕检测方法
CN110808580B (zh) * 2019-10-25 2023-07-28 国网天津市电力公司电力科学研究院 基于小波变换和极限学习机的电压暂降源快速辨识方法
CN112653126A (zh) * 2020-11-30 2021-04-13 中南大学 一种电网宽频带振荡在线辨识方法和系统
CN113188662B (zh) * 2021-03-16 2023-05-23 云南电网有限责任公司玉溪供电局 一种红外热成像故障自动识别系统和方法
CN113221880B (zh) * 2021-04-29 2022-08-05 上海勃池信息技术有限公司 基于基尼不纯度的ocr版面分析方法
CN114419719B (zh) * 2022-03-29 2022-08-12 北京爱笔科技有限公司 一种生物特征的处理方法及装置
CN115277322B (zh) * 2022-07-13 2023-07-28 金陵科技学院 基于图及持续性熵特征的cr信号调制识别方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102831433A (zh) * 2012-06-06 2012-12-19 西南交通大学 一种基于时频域多特征量的电能质量混合扰动分类方法
WO2016138750A1 (zh) * 2015-03-04 2016-09-09 江苏省电力公司常州供电公司 一种电能质量扰动源定位系统及定位方法
CN107832777A (zh) * 2017-10-12 2018-03-23 吉林化工学院 一种采用时域压缩多分辨率快速s变换特征提取的电能质量扰动识别方法
CN108052863A (zh) * 2017-11-10 2018-05-18 华北电力大学(保定) 基于最大方差展开法的电能质量扰动识别方法
CN108664901A (zh) * 2018-04-20 2018-10-16 三峡大学 基于改进lmd的微电网电能质量扰动信号检测方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102831433A (zh) * 2012-06-06 2012-12-19 西南交通大学 一种基于时频域多特征量的电能质量混合扰动分类方法
WO2016138750A1 (zh) * 2015-03-04 2016-09-09 江苏省电力公司常州供电公司 一种电能质量扰动源定位系统及定位方法
CN107832777A (zh) * 2017-10-12 2018-03-23 吉林化工学院 一种采用时域压缩多分辨率快速s变换特征提取的电能质量扰动识别方法
CN108052863A (zh) * 2017-11-10 2018-05-18 华北电力大学(保定) 基于最大方差展开法的电能质量扰动识别方法
CN108664901A (zh) * 2018-04-20 2018-10-16 三峡大学 基于改进lmd的微电网电能质量扰动信号检测方法

Non-Patent Citations (10)

* Cited by examiner, † Cited by third party
Title
An image processing based method for power quality event identification;Hussain Shareef;《Electrical Power and Energy Systems》;20121123;184-198 *
Enhanced Kalman Filter Through Modified Empirical Mode Decomposition For Wind Profile Exogenous Disturbance Extraction & Isolation in Wind Turbines;Jack P. Salameh;《2018 7th International Conference on Systems and Control (ICSC)》;20181227;1-5 *
基于不完全S变换与梯度提升树的电能质量复合扰动识别;许立武;《电力系统保护与控制》;20190509;24-31 *
基于卷积神经网络的电能质量扰动分类;瞿合祚等;《武汉大学学报(工学版)》;20180628(第06期);1-4 *
基于数字图像处理技术的暂态 电能质量扰动分类;郑岳怀;《中国优秀硕士学位论文全文数据库 (工程科技Ⅱ辑)》;20151215;C042-304 *
基于纹理的高寒地区人为扰动地表信息提取;毕永清等;《测绘与空间地理信息》;20180425(第04期);1-4 *
基于遗传算法优化支持向量机的电能质量暂态扰动识别新方法;林琳;《水电能源科学》;20161231;200-203 *
复杂噪声环境下电能质量复合扰动特征选择;黄南天等;《仪器仪表学报》;20180415(第04期);1-3 *
文本分类中基于基尼指数的特征选择算法研究;尚文倩;《计算机研究与发展》;20061107;1688-1694 *
采用改进多分辨率快速S变换的电能质量扰动识别;黄南天;《电网技术》;20150531;1412-1418 *

Also Published As

Publication number Publication date
CN110147760A (zh) 2019-08-20

Similar Documents

Publication Publication Date Title
CN110147760B (zh) 一种高效电能质量扰动图像特征提取与识别新方法
CN111126386B (zh) 场景文本识别中基于对抗学习的序列领域适应方法
CN110726898B (zh) 一种配电网故障类型识别方法
CN109344845B (zh) 一种基于Triplet深度神经网络结构的特征匹配方法
CN108520215B (zh) 基于多尺度联合特征编码器的单样本人脸识别方法
CN111564179B (zh) 一种基于三元组神经网络的物种生物学分类方法及系统
CN114548190B (zh) 一种基于自适应残差神经网络的风力涡轮机故障诊断方法及装置
CN112257738A (zh) 机器学习模型的训练方法、装置和图像的分类方法、装置
Feng et al. Fsrf: an improved random forest for classification
CN114742097A (zh) 一种基于轴承振动信号自动确定变分模态分解参数的优化算法
CN106295478A (zh) 一种图像特征提取方法和装置
CN117516937A (zh) 基于多模态特征融合增强的滚动轴承未知故障检测方法
CN110610203A (zh) 基于dwt和极限学习机的电能质量扰动分类方法
CN113111774B (zh) 一种基于主动增量式微调的雷达信号调制方式识别方法
CN112014821B (zh) 一种基于雷达宽带特征的未知车辆目标识别方法
CN108710920B (zh) 示功图识别方法及装置
CN113989567A (zh) 垃圾图片分类方法及装置
CN109948516B (zh) 一种基于能量最大化与核svm的复合电能质量扰动识别方法及方法
CN115131296B (zh) 一种用于图像识别的分布式计算方法及系统
CN113076438B (zh) 一种不平衡数据集下基于多数类转化为少数类的分类方法
CN117315400A (zh) 一种基于特征频率的自蒸馏实现方法
CN117376070A (zh) 一种基于深度学习模型的无线电信号调制识别方法
CN116778218A (zh) 一种基于连续滑窗Transformer和DS证据理论的滚动轴承增强诊断方法、装置
CN114358054A (zh) 复杂环境下宽带无线通信信号检测方法及系统
De Aguiar et al. ST-NILM: A Wavelet Scattering-Based Architecture for Feature Extraction and Multi-Label Classification in NILM Signals

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20230330

Address after: 230000 Room 203, building 2, phase I, e-commerce Park, Jinggang Road, Shushan Economic Development Zone, Hefei City, Anhui Province

Patentee after: Hefei Jiuzhou Longteng scientific and technological achievement transformation Co.,Ltd.

Address before: 132022 No. 45 Chengde street, Longtan District, Jilin, Jilin

Patentee before: JILIN INSTITUTE OF CHEMICAL TECHNOLOGY

Effective date of registration: 20230330

Address after: 226200 South Zone of Qidong Development Zone, Nantong City, Jiangsu Province (Western Europe science and Technology Park)

Patentee after: JIANGSU XIOU ELECTRONICS Co.,Ltd.

Address before: 230000 Room 203, building 2, phase I, e-commerce Park, Jinggang Road, Shushan Economic Development Zone, Hefei City, Anhui Province

Patentee before: Hefei Jiuzhou Longteng scientific and technological achievement transformation Co.,Ltd.