CN113191419B - 一种基于轨迹关键点匹配及区域划分的暂降同源事件检测、类型辨识方法 - Google Patents
一种基于轨迹关键点匹配及区域划分的暂降同源事件检测、类型辨识方法 Download PDFInfo
- Publication number
- CN113191419B CN113191419B CN202110458815.4A CN202110458815A CN113191419B CN 113191419 B CN113191419 B CN 113191419B CN 202110458815 A CN202110458815 A CN 202110458815A CN 113191419 B CN113191419 B CN 113191419B
- Authority
- CN
- China
- Prior art keywords
- sag
- data
- key point
- homologous
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/462—Salient features, e.g. scale invariant feature transforms [SIFT]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/50—Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于轨迹关键点匹配及区域划分的暂降同源事件检测、类型辨识方法,包括:基于尺度不变特征转换算法提取暂降有效值波形灰度轨迹的特征关键点,基于关键点的方向信息匹配归算数据库中与基准数据同源的暂降事件。同时,利用所提取特征关键点的图上位置信息,基于像素域划分的暂降轨迹特征提取方法,构建了暂降样本特征矩阵,基于LightGBM树结构分类模型实现了暂降类型的准确辨识。本发明所提算法避免了重复记录的暂降数据致使运维人员对暂降严重程度的过评估,并帮助运维人员正确判断电压暂降的类型,提高暂降的运维效率。算法的性能更优,表达更直观,对实测数据的鲁棒性更强,应用价值和前景巨大。
Description
技术领域
本发明属于暂降监测领域,具体涉及一种基于轨迹关键点匹配及区域划分的暂降同源事件检测、类型辨识方法。
背景技术
由于我国制造业的蓬勃发展,一大批智能高新产业应运而生,产品生产线也趋于集成化和精密化,使得企业负荷对供电质量尤其是电压质量的要求也越来越高。目前,各省级电力公司已开展了对省内高新产业园区、开发区以及敏感负荷集中地区的电压质量情况的监测,意在通过对监测数据的分析,有针对性的制定暂降问题的治理方案。
随着暂降监测范围的不断扩大,暂降监测数据的体量也在不断增大。然而,事实上在电网中并没有相应数量的暂降事件发生。这是由于暂降在电网中传播,使得监测数据库中包含多个监测终端在传播时间片内重复记录同一暂降事件的情况。重复记录的暂降数据,不仅造成了大量的冗余分析计算,而且还易导致对节点暂降严重程度的过评估,影响了运维人员对暂降事件分析的聚焦性和准确性。因此,有必要对暂降监测数据进行同源检测,归算其中重复记录的暂降事件,确定暂降发生的源头,提高暂降问题分析治理效率。
在现有对暂降问题的研究中,一些学者首次提到了同源检测的概念,提出使用基于 Wasserstein距离的相似度计算方法作为同源数据的检测手段,并对监测点在时间片内(10min)监测的暂降数据以相似度结果为依据进行聚类,将同一类簇的样本归算为同源事件,实现对同源暂降数据的归算。由文章可知,上述方法包含以下三点关键信息:1、对数据有时间片范围的严格要求,将所有监测点在时间片内监测的所有暂降数据共同汇集成同源检测集;2、分析暂降数据时需有效截取完整的暂降域,将未包含完整暂降域的数据视为“坏数据”;3、无法逐一对数据进行同源检测,也就是说文章默认在所分析的数据集内必存在与基准数据同源的暂降数据(这样才能得到有效的聚类结果),并将未重复记录(只记录一次)的暂降数据视作噪点处理。
然而实际情况中,监测数据的质量以及数据库环境并没有这么理想,未记录完整或一条数据同时包含两个暂降事件的情况常常发生,并且在数据库中并没有对发生在同一时间片内的暂降事件进行清晰的划分,需要人工先确定基准事件,然后按时间先后排序,筛选出满足条件的监测数据后,再进行同源检测。并且,该算法的总体比对过程较为复杂,不具备可视化功能,难免会影响检测方法在各地市、县等基层单位的应用与推广。
发明内容
发明目的:为了克服现有技术中存在的不足,提供一种基于轨迹关键点匹配及区域划分的暂降同源事件检测、类型辨识方法,以有效解决一次暂降事件被多个监测点重复记录导致数据冗余的问题,避免重复记录的暂降数据导致运维人员对节点暂降严重程度的过评估,提高运维人员对暂降事件分析的聚焦性和准确性,并帮助运维人员正确判断电压暂降的类型,为治理电压暂降问题提供针对性的理论指导。
技术方案:为实现上述目的,本发明提供一种基于轨迹关键点匹配及区域划分的暂降同源事件检测、类型辨识方法,包括如下步骤:
S1:基于尺度不变特征转换(Scale-invariant feature transform,SIFT)算法提取暂降有效值波形灰度轨迹的特征关键点,并获得特征关键点的方向信息和图上位置信息;
S2:基于特征关键点匹配的方法归算数据库中与基准数据同源的暂降事件;
使用所提取特征关键点的图上位置信息,基于像素域划分的暂降轨迹特征提取方法构建暂降样本特征矩阵,基于LightGBM树结构分类模型实现暂降类型的辨识。
进一步地,所述步骤S1中特征关键点的提取方法具体为:
A1:采用高斯卷积核将灰度图像进行多尺度分解;
A2:基于多尺度分解后的灰度图像,构建高斯金字塔,图像金字塔的层数与原始图像和最小尺度图像的大小相关;
A3:获得图像的高斯金字塔之后,利用SIFT算法计算On层相邻尺度图像之间的差分结果,利用高斯多尺度差分(Difference of Gauss,DoG)来检测图像中的灰度极值点;
A4:利用对比度测试和边缘测试来剔除低对比度和边缘响应不稳定点的极值点,最终保留下来的极值点作为由SIFT算法检测得到的特征关键点。
进一步地,所述步骤S2中基于关键点匹配的方法归算数据库中与基准数据同源的暂降事件的方法为:
B1:计算两灰度图像中相应点邻域像素的梯度值和梯度方向,若两者一致则认为两关键点对应;
B2:以关键点邻域16个种子信息点,共128维(16*8)特征向量,来唯一的描述暂降RMS波形轨迹的一个关键点;
B3:根据特征关键点信息的唯一性,利用基于暂降RMS轨迹关键点匹配的同源检测方法实现关键点匹配。
进一步地,所述步骤S2中暂降样本特征矩阵的构建方法为:
C1:计算关键点的梯度权重,保留包含主要轨迹信息的关键点;
C2:利用基于图像像素域分段的暂降RMS轨迹特征提取方法,将每张暂降轨迹图划分为纵向高度相同的若干像素段;
C3:提取关键点在图上像素段位置特征构建特征矩阵,将暂降轨迹的最大梯度权重作为补充特征,对每个暂降事件分别用三相特征数据进行表达。
进一步地,所述步骤S3中基于LightGBM树结构分类模型实现暂降类型的准确辨识的过程为:
D1:按照要进行分裂的特征的所有绝对值大小降序排序,再利用单边梯度采样减少所需处理的样本数量;
D2:采用EFB对互斥特征进行融合,根据样本特征数据构建加权无向图,计算特征之间的互斥程度,融合连接权重值高的特征并建立捆绑特征包,以减少样本特征的总体冲突,以有效实现特征降维;
D3:基于直方图的统计思想,将样本特征数据离散的统计到若干的数据段内,以直方图数据块的形式保存样本信息;
D4:基于LightGBM算法,利用带深度限制的leaf-wise生长策略提高特征数据的处理效率,实现暂降类型的准确辨识。
本发明首先将暂降监测数据的有效值(Root Mean Square,RMS)波形转换为二维灰度图像,采用基于尺度不变特征转换(Scale-invariant feature transform,SIFT)算法提取暂降 RMS波形灰度轨迹的特征关键点,然后基于关键点匹配方法,归算与基准样本同源的暂降数据。在类型辨识部分,基于关键点权重计算方法筛选出RMS轨迹上重要位置的关键点,然后通过像素域划分的方法获取关键点的图像位置特征,最终实现对暂降事件类型的辨识。
有益效果:本发明与现有技术相比,具备如下优点:
1、基于轨迹关键点匹配的方法可对逐一数据存储池中的暂降事件直接进行同源检测,在摆脱时间片约束的同时,可任意指定检测基准数据,无需确保检测数据集中必有与基准数据同源的事件,降低了对检测数据集条件的要求,具有更强的工程适用性。
2、提出了基于像素域划分的关键点特征提取方法,充分利用了关键点的图上位置信息,准确描述了各类型暂降轨迹的特征,并且采用LightGBM树结构模型构建了快速、轻巧的暂降类型分类器,实现了多种暂降类型的辨识,准确率可达98.8%。
附图说明
图1为本发明方法的流程示意图;
图2为图像灰度极值点计算流程图;
图3为关键点方向信息计算原理图;
图4为关键点计算结果图;
图5为关键点梯度筛选结果图;
图6为像素段划分示意图;
图7为三相特征向量图;
图8为level-wise与leaf-wise示意图;
图9为LightGBM模型主要参数寻优图;
图10为案例一同源与非同源暂降RMS轨迹示意图;
图11为案例一匹配计算结果图;
图12为案例二暂降事件示意图;
图13为案例二中A相的关键点匹配连线图;
图14为案例二匹配结果图;
图15为案例三暂降事件示意图;
图16为案例三C相的关键点匹配连线图;
图17为案例三匹配结果图;
图18为像素区段参数α以及最优关键点数量的寻优图;
图19为特征重要度示意图。
具体实施方式
下面结合附图和具体实施例,进一步阐明本发明,应理解这些实施例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。
本发明提供一种基于轨迹关键点匹配及区域划分的暂降同源事件检测、类型辨识方法,如图1所示,其包括如下步骤:
S1:基于尺度不变特征转换(Scale-invariant feature transform,SIFT)算法提取暂降有效值波形灰度轨迹的特征关键点,确定特征关键点的方向信息和图上位置信息;
S2:使用所提取特征关键点的方向信息,基于关键点匹配的方法归算数据库中与基准数据同源的暂降事件;
使用所提取特征关键点的图上位置信息,基于像素域划分的暂降轨迹特征提取方法构建暂降样本特征矩阵,基于LightGBM树结构分类模型实现暂降类型的准确辨识。
步骤S1中特征关键点的提取方法具体为:
A1:采用高斯卷积核将灰度图像进行多尺度分解;
A2:基于多尺度分解后的灰度图像,构建高斯金字塔,图像金字塔的层数与原始图像和最小尺度图像的大小相关;
A3:获得图像的高斯金字塔之后,利用SIFT算法计算On层相邻尺度图像之间的差分结果,利用高斯多尺度差分(Difference ofGauss,DoG)来检测图像中的灰度极值点;
A4:利用对比度测试和边缘测试来剔除低对比度和边缘响应不稳定点的极值点,最终保留下来的极值点作为由SIFT算法检测得到的特征关键点。
步骤S2中基于关键点匹配的方法归算数据库中与基准数据同源的暂降事件的方法为:
B1:计算两灰度图像中相应点邻域像素的梯度值和梯度方向,若两者一致则认为两关键点对应;
B2:以关键点邻域16个种子信息点,共128维(16*8)特征向量,来唯一的描述暂降RMS波形轨迹的一个关键点;
B3:根据特征关键点信息的唯一性,利用基于暂降RMS轨迹关键点匹配的同源检测方法实现关键点匹配。
步骤S2中暂降样本特征矩阵的构建方法为:
C1:计算关键点的梯度权重,保留包含主要轨迹信息的关键点;
C2:利用基于图像像素域分段的暂降RMS轨迹特征提取方法,将每张暂降轨迹图划分为纵向高度相同的若干像素段;
C3:提取关键点在图上像素段位置特征构建特征矩阵,将暂降轨迹的最大梯度权重作为补充特征,对每个暂降事件分别用三相特征数据进行表达。
步骤S2中基于LightGBM树结构分类模型实现暂降类型的准确辨识的过程为:
D1:按照要进行分裂的特征的所有绝对值大小降序排序,再利用单边梯度采样减少所需处理的样本数量;
D2:采用EFB对互斥特征进行融合,根据样本特征数据构建加权无向图,计算特征之间的互斥程度,融合连接权重值高的特征并建立捆绑特征包,以减少样本特征的总体冲突,以有效实现特征降维;
D3:基于直方图的统计思想,将样本特征数据离散的统计到若干的数据段内,以直方图数据块的形式保存样本信息;
D4:基于LightGBM算法,利用带深度限制的leaf-wise生长策略提高特征数据的处理效率,实现暂降类型的准确辨识。
基于上述方案,本实施例将上述方案进行实例应用,具体如下:
1、电压暂降经变压器传变规律
暂降经变压器传变规律的分析是同源检测研究的理论基础。电压暂降在实际电力系统中传播,经过连接方式不同的变压器后会发生暂降相、幅值、相角等特征的变化。基于变压器类型及连接方式的分析,可大致将传变类型分为两大类,分别是单级传变和多级传变,单级传变又可分为经I类(YNyn),II类(Yy,Dd,Dz)和III类(Yd,Dy,Yz)变压器传变。多级传变可分为经2~6台I类,II类,III类级联传变的情况,可最终将传变规律归纳为表1所示的8种变化关系。表中T1~T8种传变规律可表达经过i台I类,j台 II类,k台III类变压器所有情况的传变关系,i,j,k可为任意值。
表1暂降事件经变压器传变后的影响规律
2、基于SIFT的关键点提取
SIFT的关键点提取算法最早由Lowe提出,该算法主要包含基于高斯尺度空间的特征关键点提取以及关键点方向信息计算两部分内容,以下分别进行详细介绍。
基于高斯尺度空间的特征关键点提取
采用高斯卷积核将灰度图像进行多尺度分解,尺度空间中卷积分解如下:
其中
I(x,y)表示灰度图像,L(x,y,σ)表示空间中不同的尺度层,G(x,y,σ)为高斯卷积核函数,其中σ表示尺度空间因子,该变量表示高斯核函数平滑图像的程度,值越大表明对图像平滑的程度越深。其计算公式如下:
将灰度图像进行多尺度分解,构建高斯金字塔,其中O表示高斯金字塔尺度所在的层(Octave)数,,S表示Octave内的子层数,s表示子层索引。σ0表示基准层尺度(与图2 中虚框①内的σ含义相同),对于层内子层尺度的索引可统一由k来表达,则k可表示为:
k作为相邻两层之间尺度相差的比例因子,则每个子尺度层的平滑因子可表达为kn2nσ,如图2虚框②所示。
图像金字塔的层数与原始图像和最小尺度图像的大小相关,如式(5)所示:
layer=log2{min(M,N)-a} (5)
式中M,N为原始图像大小(长和宽),a为最小尺度图像大小,本发明所生成的单相暂降RMS波形的原始灰度图像大小为256×256,最小图像大小为16×16,则本发明中金字塔层数选为4层,高斯金字塔如图2虚线框①所示。
获得图像的高斯金字塔之后,SIFT算法计算On层相邻尺度图像之间的差分结果,利用高斯多尺度差分(Difference of Gauss,DoG)来检测图像中的灰度极值点。DoG算子的具体公式如式(6)所示:
D为高斯多尺度差分计算结果,如图2虚线框②中深灰色数据层所示。
在DoG尺度空间下检测灰度极值点,将每个点的灰度值(红点)和其周围的8邻域内的像素点以及相邻尺度下的邻域点(绿点)做比较,如图所示虚线框③所示。在26(8+9+9)个点中选取其中的灰度极值点作为候选点,随后,利用对比度测试和边缘测试来剔除低对比度和边缘响应不稳定点的极值点。最终保留下来的极值点作为由SIFT 算法检测得到的特征关键点。
由上述关键点检测理论可知,图像中灰度极值的计算是得到特征关键点的理论依据。因此,二维暂降RMS波形灰度图片来说,RMS波形轨迹即为灰度值变化最为剧烈的地方,因此,SIFT算法所检测到的特征关键点应全部落在RMS波形轨迹的关键位置上,正如图3的SIFT计算结果所示。换句话说,SIFT算法所检测出的特征关键点可代替采样时间序列来描述不同暂降事件RMS波形轨迹的特征。
部分学者指出使用16个种子信息点来描述一个特征关键点可使得图像匹配的误差最小。如图3所示,关键点为16*16个方格(每个方格代表一个像素点)的中心,每4*4 个方格决定1个种子信息点的梯度信息(图中8*8个方格可决定4个),每个点共8个梯度方向,采用直方图统计的方式计算每个梯度方向的累加值,即可形成一个种子信息点。因此,本实施例中以关键点邻域16个种子信息点,共128维(16*8)特征向量,来唯一的描述暂降RMS波形轨迹的一个关键点,关键点计算结果如图3所示,红色圆点表示特征关键点所在位置。
由于特征关键点信息具有唯一性,因此,对暂降事件是否同源的判断可看作两暂降RMS轨迹上的特征关键点信息是否匹配的问题。因此,本发明提出了基于暂降RMS轨迹关键点匹配的同源检测方法,具体计算公式如下:
其中Si表示特征关键点i的匹配度,dis()表示欧式距离计算。im1(i)表示基准暂降波形图中关键点i的128维方向信息,im2(j)表示待匹配暂降波形图中关键点j的方向信息。m,n分别表示基准图和待匹配图的关键点个数。Pi为基准图中关键点i与待匹配图中所有关键点遍历计算后的结果集合,Pi1、Pi2分别表示集合中最小和次小的距离结果。当二者之比小于设定阈值时,则认为两特征关键点匹配,本发明中的阈值设定为0.5(经验取值)。该检测方法表达的含义是,点i与对应匹配点的方向信息相似度应明显优于其余关键点,保证特征关键点匹配的准确性。
3、基于关键点梯度优化及LightGBM模型的暂降类型辨识算法
3.1关键点梯度优化筛选
由图4所示,暂降波形的关键点基本覆盖了暂降轨迹中每一处波动特征,对于暂降轨迹关键处,如暂降的起止位置,暂降域上都覆盖了密集的关键点(所述关键处如图5 中灰色虚线框内所示)。然而,众多关键点中并不是每个点都同等重要,减少部分冗余的关键点,可在保证表达波形关键特征的同时减轻计算负担,降低对数据存储配置的要求。基于此,本发明提出了基于梯度权重计算的关键点筛选法,以保留包含主要轨迹信息的关键点,计算公式如下:
ε=dis(I(xi+1,yi+1),I(xi,yi)) +dis(I(xi-1,yi-1),I(xi,yi)) (8)
其中I(x,y)表示灰度图中特征关键点的像素位置。ε表示权重计算结果。对每个点的ε大小进行排序,取其中前N个权重占比较大的关键点作为暂降类型辨识分析的依据,计算结果如图5所示。
图中黑色圆圈表示保留下来的特征关键点,红色竖线表示该特征关键点的梯度,竖线的长度越长,则梯度权重越高。如图5中灰色虚线框所示,暂降的起止位置,暂降域等重要暂降波形的轨迹信息都很好的保留了下来,并且重要位置的关键点权重相比于其他关键点也是更高的。
3.2关键点像素段位置统计分析
由于每张暂降轨迹图绘制的大小以及数据区间都是一致(根据国标电压暂降的定义,暂降波形范围为0.1(p.u.)~0.9(p.u.);暂升情况一般小于1.8(p.u.),因此,RMS波形的纵坐标绘制范围为0.1(p.u.)~1.8(p.u.),横坐标由采样点数量决定)。由于不同暂降类型的有效值波形轨迹(如暂降深度,暂降持续时间)都有着明显的区别,因此,由图6可见,描述轨迹特征的关键点的分布也有着各自的特征。因此,本发明提出基于图像像素域分段的暂降RMS轨迹特征提取方法,将每张暂降轨迹图划分为纵向高度相同的若干像素段 (图6中灰色背景线所示),对于暂降、暂升、感应电机启动、变压器投切以及暂降、暂升复合的具体分段情况如图6中的(a)~(e)所示。
由图6可见,图像的长和宽均为256个像素点,不同暂降类型有效值轨迹的最优关键点所在划分区段的分布各不相同,如图6中的(a)暂降的RMS轨迹,在暂降域内的关键点处于[160~180]的像素段内,而正常轨迹的关键点则处于[120~140]内。因此,本发明以关键点在图上像素段位置特征(也就是各个像素段关键点聚集的数量)来刻画各类型暂降波形的轨迹特征,并构建相应的特征矩阵。同时,关键点的梯度权重特征往往反应了暂降电压幅值的跌落程度,如图6中的(a)、图6中的(b)、图6中的(e),故障型暂降的关键点梯度权重明显高于其他类型暂降。因此,为反应暂降深度特征,增大各类暂降的特征向量区分度,本发明将暂降轨迹的最大梯度权重,如图6中的(a),作为轨迹区段特征的补充特征,则三相暂降电压数据的特征的构建方式如图7所示。对暂降事件的每一相分别进行特征计算,其中像素段的跨度设置为参数α,分段数设置为参数l,最大梯度特征由ε表示。则每个暂降事件分别由三相特征数据进行表达。
3.3基于LightGBM的暂降类型辨识算法
LightGBM是一种新型集成学习树结构分类模型,该算法通过对特征数据进行单边梯度重采样、特征绑定融合以及直方图离散归算三步骤的分析,大幅减小了多维特征的复杂度,相比于传统的树模型,LightGBM在处理精度以及运行速度上都有了显著的提升。本发明选择该模型作为暂降事件类型的分类器。
3.3.1基于单边梯度采样(Gradient-based One-Side Sampling,GOSS)与互斥稀疏特征绑定(Exclusive Feature Bundling,EFB)方法特征预处理
在特征数据中,梯度较大的样本数据对分类决策的贡献明显优于其他的数据,但若直接丢弃信息增益较小的数据势必会影响数据的总体分布,因此,GOSS首先将要进行分裂的特征的所有取值按照绝对值大小降序排序,选取前a×100%个样本,然后在剩下的较小梯度样本中随机选择b×100%个样本;将b×100%个样本乘以一个常数((1-a)/b)×100%,最后将(a+b)×100%作为新的训练样本,减少所需处理的样本数量;
同时,采用EFB对互斥特征进行融合,其中互斥程度使用冲突比率进行衡量,根据样本特征数据构建加权无向图,无向图中特征间的联系权重反映了所连接特征之间的互斥程度,权重值越大,则互斥程度越高。对所有特征间的互斥权重值进行降序排序,融合连接权重值高的特征并建立捆绑特征包,以减少样本特征的总体冲突,以有效实现特征降维(其中特征包的个数远小于特征的总个数)。
最后,基于直方图的统计思想,将样本特征数据离散的统计到若干的数据段内(在模型中参数中称为“bin”),以直方图数据块的形式保存样本信息。将所有样本数据统计完成后,每个特征根据不同的数据分布形成了各自唯一的直方图模型,该模型使得在树结构算法寻找最优分割点时无需对比每个样本的特征值,有效减轻了算法的计算负担。
3.3.2带深度限制的leaf-wise生长策略
为进一步提升算法的计算效率,LightGBM使用带有深度限制的按叶子生长(leaf-wise)的策略(图8中的(b))。相比于传统的按层生长(level-wise)的决策树生长策略(图 8中的(a)),leaf-wise找到分裂增益最大的叶子分裂,利用叶子的个数nl来限制树的深度,放弃对分裂增益较低的部分叶子进行处理,使得整个树结构模型对特征数据的处理效率更高。同时,为避免树结构发生过拟合的现象,LightGBM在leaf-wise之上增加了一个最大深度的限制,通过最大深度和叶子个数很好的建立了模型结构的边界约束,使得模型在训练过程中规避过拟合情况的同时有效改善分类精度。
综上所述,本发明所提暂降同源检测及类型辨识的算法步骤流程,参照图1,具体如下所示:
首先,基于SIFT算法计算出暂降RMS波形轨迹的关键点。其中关键点的不同信息应用于暂降问题的不同分析方向。对于关键点的方向信息,根据其唯一性的特点,根据公式(8)关键点匹配的计算方法对暂降的同源数据进行检测,其中同源匹配的条件为若事件的三相RMS轨迹上的都存在至少3个满足匹配度Si阈值的关键点,则认为两暂降事件为同源事件。对于关键点的图上位置信息,基于像素区段划分及梯度权重计算法,建立暂降事件RMS轨迹特征矩阵,通过所构建的LightGBM树结构模型,实现对暂降类型的辨识。在这里需要指出的是,同源检测时要计算T1~T8所有传变情况的关键点,并与待检测数据进行一一比较。在类型辨识时,只需要对基准数据(或T1)的暂降类型进行辨识。在进行LightGBM模型训练时,调整分类器计算性能的主要参数有训练迭代次数,学习率,最大深度,叶子个数,共4个。本实施例采用基于python3.6,pytorch框架下构建的LightGBM模型,利用表3中的实测数据对模型参数进行了寻优,寻优结果如图 9所示,纵坐标R为损失函数(本发明选择均方根误差作为损失函数),每寻优一个参数时,其他参数保持不变。最终参数选择为迭代次数i=80,学习率l=0.082,最大深度D=4,叶子个数nl=9。
4、算例分析
以下分别对本发明所提出的暂降同源检测和类型辨识算法进行详细的算例分析,算例分析所采用的硬件平台配置为英特尔i7-9700处理器,64位WIN10操作系统,内存32GB,显卡显存为6GB。
4.1暂降数据同源检测算法
基于全文所述同源检测算法,若两暂降事件数据为同源,则两数据中将包含多个相互匹配的关键点。反之,若不同源,两数据中的关键点梯度信息则相差甚远,难以达到匹配度阈值的要求。以下将分三个案例情况具体介绍该同源检测算法的执行过程和分析结果。
案例一:同源与非同源检测的结果差异
图10中的(a)为待匹配暂降数据,图10中的(b)、图10中的(c)为待检测暂降数据,由图10中三个暂降事件波形图的轨迹可明显的看出图10中的(b)为同源数据,图10中的(c)为非同源数据。对图10中的(a)进行关键点分析后,共得到37个关键点,图10中的(b)、图10中的(c)分别得到41和53个关键点。将图10中的(a)37个关键点分别与图 10中的(b)、图10中的(c)关键点进行同源检测计算,得到如图11的关键Si计算结果。在37个关键点中,图10中的(b)有15个点满足匹配要求,而图10中的(c)则没有一个点满足。检测结果证明了同源与非同源暂降关键点的匹配结果有明显的差异,依据匹配结果可容易的判断出两暂降事件是否为同源。
案例二:参照图12,未完全记录事件的同源检测
在实际情况中,暂降监测终端并不是对每个暂降事件都能做到完整的录播,部分学者提出,对于未完整录播的暂降事件的处理方法是将该数据作为“坏数据”并剔除。然而,事实上,如图12中的(a)所示,该事件虽未能将整个暂降过程完全的记录下来,但仍可清晰的得到事件中如暂降深度、暂降类型、暂降相等关键信息,若直接将其剔除,势必会造成数据的浪费。其次,该事件虽未能完整录播,但客观上依然对监测节点的电压质量造成了影响,仍需被统计在列,后续可为电网暂降局部凹陷域的分析提供支撑。若直接将其作为“坏数据”剔除,则会影响后续暂降影响严重性、传播特性及治理措施分析的准确性。本发明所提方法能够很好的处理此种情况。
图13为图12中的(a)、图12中的(b)两数据中A相关键点的匹配连线,同样,对于不完整B相和C相,本发明所提检测算法依然能够找到匹配的关键点,三相满足要求的同源计算结果如图14所示,A相、B相和C相分别包含13个,26个,12个匹配关键点。计算结果证明,本发明所提算法,无需进行“坏数据”剔除,和暂降域截取,可简单有效的实现此案例情况的同源检测。
案例三:基准数据是一个暂降,待检测数据包含两个暂降同时包含两暂降事件的同源检测。
在一个暂降数据中可能包含两次暂降事件,如图15中的(a)所示,若想要检测图15中的(a)和图15中的(b)两组暂降数据是否同源,传统的处理方法是首先在数据库中找出包含两次暂降事件的数据集,然后将两次暂降事件分割再进行同源检测。而本发明所提方法本发明所提算法不需要做暂降事件的分割,便可直接进行暂降事件的同源检测,暂降事件如图15所示。
两暂降数据关于c相的关键点对应情况如图16所示:
A相、B相和C相分别包含12个,9个,11个匹配关键点。
基于上述案例可知,当两个样本数据为同源事件时,每相的RMS轨迹都有多个满足匹配条件的关键点。以下对江苏苏南某地区暂降实测数据进行离线同源检测分析。本发明将人工认定同源事件为对比标准,则同源检测结果如下表所示:
由表2可知,若本发明所提算法设置的同源检测条件为每相至少有1个关键点满足匹配时,结果出现了19条样本数据的误检测,每相至少有2个关键点时,有4条事件误检测,这是由于RMS灰度轨迹的头和尾可能会出现匹配点,导致算法误将两样本检测为同源数据。当设置为至少3个关键点时,便可100%的实现暂降事件的同源检测。
表2实测数据同源检测分析
4.2基于LightGBM的暂降类型辨识
本发明采用苏南某地区10kV配电系统6月份上传的暂降事件实测数据对本发明所提算法性能进行验证。样本数据的分布如下表所示,本发明将70%的数据划分为训练数据,30%为测试数据。
表3实测暂降数据样本分布
本发明将暂降事件共分为6类,包括单相故障(C1),两相故障(C2),三相故障(C3),暂升、暂降复合故障(C4),感应电机启动(C5),变压器投切(C6)共6种。部分学者对多级暂降情况进行了讨论(这里特指由两相故障演变为三相故障的情况),并进行了详细分析。在这里,作者需要指出的是,在配电网的保护体系中,若线路发生两相或三相短路 (包括两相演变为三相的情况)时必然会导致保护动作,相应的运维人员也会第一时间拿到故障信息(包括告警、合闸信号、故障录播等),并及时赶赴现场处理故障。可见该情况已经引起了我们足够的重视,因此,电能质量系统对其进行额外统计的意义并不大,本发明未作详细讨论。但对于本发明所指出的暂升、暂降复合故障(C4)来说,该情况多为由单相故障演变为三相故障的情况(我国配电系统中单相故障必存在暂升相),但依据传统的配电网保护体系,单相故障发生时并不会触发保护动作,线路依旧保持运行,并不会引起运维人员的关注,直到故障演变为三相时,才会及时响应。若某地区C4类型的事件发生次数较多,则反映出该地区电网较为脆弱,应当引起运维人员足够的重视,采取相应的措施以保障系统安全运行,因此,对C4类型的识别与分析具有重要的实际意义。
本实例中具体的匹配结果如图17所示。
根据上述关键点及像素域分段内容的描述,本发明分别对像素区段参数α以及最优关键点数量进行了寻优,计算结果如图18所示。
本发明将区段跨度α取[1,50]时(横坐标),分别考察选取梯度权重在前20、30、40、50个关键点四种情况下暂降类型辨识准确率(纵坐标),图中曲线出现了两个正确率尖峰,一是当α=20时,最高正确率达到了98.8%(关键点选取50个)。二是当α=40时,最高正确率达到了95.5%。第二种情况的像素段跨度过大,取得如此理想的分类效果是由于最大梯度权重特征的贡献,相比之下,像素区段的特征贡献很低。而在第一种情况中,各特征的贡献比更为合理,特征贡献结果如图19所示:
每相共有14个特征,最后一个特征为最大梯度权重,每个暂降样本由维度为1×42的特征向量表示。由图中权重结果可知,处于像素区段在[120,180]内的特征贡献度更高。
5、结论
为解决暂降数据同源归算及类型辨识的问题,本发明通过对暂降RMS轨迹的分析提出了基于轨迹关键点匹配及像素域划分的暂降同源事件检测、类型辨识的方法,算法的具体优势如下:
1)基于轨迹关键点匹配的方法可对逐一数据存储池中的暂降事件直接进行同源检测,在摆脱时间片约束的同时,可任意指定检测基准数据,无需确保检测数据集中必有与基准数据同源的事件,降低了对检测数据集条件的要求,具有更强的工程适用性。
2)提出了基于像素域划分的关键点特征提取方法,充分利用了关键点的图上位置信息,准确描述了各类型暂降轨迹的特征。采用LightGBM树结构模型构建了快速、轻巧的暂降类型分类器,实现了C1~C6种暂降类型的辨识,准确率可达98.8%。
3)本发明算例验证了所提算法有效性与准确性,相比于已有研究,该算法不仅对监测数据的分析有更强的鲁棒性,并且整体算法的执行过程更加形象、直观,工程实用性及推广性更强,可为后续基于图像特征的电力大数据智能应用研究提供重要借鉴。
Claims (5)
1.一种基于轨迹关键点匹配及区域划分的暂降同源事件检测、类型辨识方法,其特征在于,包括如下步骤:
S1:基于尺度不变特征转换算法提取暂降有效值波形灰度轨迹的特征关键点,并获得特征关键点的方向信息和图上位置信息;
S2:基于特征关键点匹配的方法归算数据库中与基准数据同源的暂降事件;
使用所提取特征关键点的图上位置信息,基于像素域划分的暂降轨迹特征提取方法构建暂降样本特征矩阵,基于LightGBM树结构分类模型实现暂降类型的辨识;
所述步骤S2中暂降样本特征矩阵的构建方法为:
C1:计算关键点的梯度权重,保留包含轨迹信息的关键点;
C2:利用基于图像像素域分段的暂降RMS轨迹特征提取方法,将每张暂降轨迹图划分为纵向高度相同的若干像素段;
C3:提取关键点在图上像素段位置特征构建特征矩阵,将暂降轨迹的最大梯度权重作为补充特征,对每个暂降事件分别用三相特征数据进行表达。
2.根据权利要求1所述的一种基于轨迹关键点匹配及区域划分的暂降同源事件检测、类型辨识方法,其特征在于,所述步骤S1中特征关键点的提取方法具体为:
A1:采用高斯卷积核将灰度图像进行多尺度分解;
A2:基于多尺度分解后的灰度图像,构建高斯金字塔;
A3:获得图像的高斯金字塔之后,利用SIFT算法计算On层相邻尺度图像之间的差分结果,利用高斯多尺度差分来检测图像中的灰度极值点;
A4:利用对比度测试和边缘测试来剔除低对比度和边缘响应不稳定点的极值点,最终保留下来的极值点作为由SIFT算法检测得到的特征关键点。
3.根据权利要求1所述的一种基于轨迹关键点匹配及区域划分的暂降同源事件检测、类型辨识方法,其特征在于,所述步骤S2中基于关键点匹配的方法归算数据库中与基准数据同源的暂降事件的方法为:
B1:计算两灰度图像中相应点邻域像素的梯度值和梯度方向,若两者一致则认为两关键点对应;
B2:以关键点邻域16个种子信息点,共128维特征向量,来唯一的描述暂降RMS波形轨迹的一个关键点;
B3:根据特征关键点信息的唯一性,利用基于暂降RMS轨迹关键点匹配的同源检测方法实现关键点匹配。
4.根据权利要求1所述的一种基于轨迹关键点匹配及区域划分的暂降同源事件检测、类型辨识方法,其特征在于,所述步骤S2中基于LightGBM树结构分类模型实现暂降类型的辨识的过程为:
D1:按照要进行分裂的特征的所有绝对值大小降序排序,再利用单边梯度采样减少所需处理的样本数量;
D2:采用EFB对互斥特征进行融合,根据样本特征数据构建加权无向图,计算特征之间的互斥程度,融合连接权重值高的特征并建立捆绑特征包,以减少样本特征的总体冲突,以有效实现特征降维;
D3:基于直方图的统计思想,将样本特征数据离散的统计到若干的数据段内,以直方图数据块的形式保存样本信息;
D4:基于LightGBM算法,利用带深度限制的leaf-wise生长策略提高特征数据的处理效率,实现暂降类型的准确辨识。
5.根据权利要求1所述的一种基于轨迹关键点匹配及区域划分的暂降同源事件检测、类型辨识方法,其特征在于,所述步骤S2中暂降类型包括单相故障,两相故障,三相故障,暂升、暂降复合故障,感应电机启动,变压器投切。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110458815.4A CN113191419B (zh) | 2021-04-27 | 2021-04-27 | 一种基于轨迹关键点匹配及区域划分的暂降同源事件检测、类型辨识方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110458815.4A CN113191419B (zh) | 2021-04-27 | 2021-04-27 | 一种基于轨迹关键点匹配及区域划分的暂降同源事件检测、类型辨识方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113191419A CN113191419A (zh) | 2021-07-30 |
CN113191419B true CN113191419B (zh) | 2022-10-14 |
Family
ID=76979351
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110458815.4A Active CN113191419B (zh) | 2021-04-27 | 2021-04-27 | 一种基于轨迹关键点匹配及区域划分的暂降同源事件检测、类型辨识方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113191419B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114461982B (zh) * | 2022-01-13 | 2023-04-07 | 四川大学 | 一种输电线路保护特性识别及电压暂降持续时间估计方法 |
CN116539167B (zh) * | 2023-07-04 | 2023-09-08 | 陕西威思曼高压电源股份有限公司 | 一种高压电源工作温度分布数据分析方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107967477B (zh) * | 2017-12-12 | 2021-06-01 | 福州大学 | 一种改进的sift特征联合匹配方法 |
CN109784276A (zh) * | 2019-01-16 | 2019-05-21 | 东南大学 | 一种基于dbn的电压暂降特征提取与暂降源辨识方法 |
-
2021
- 2021-04-27 CN CN202110458815.4A patent/CN113191419B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN113191419A (zh) | 2021-07-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108765373B (zh) | 一种基于集成分类器在线学习的绝缘子异常自动检测方法 | |
CN110264448B (zh) | 一种基于机器视觉的绝缘子故障检测方法 | |
CN102622607B (zh) | 一种基于多特征融合的遥感图像分类方法 | |
CN113191419B (zh) | 一种基于轨迹关键点匹配及区域划分的暂降同源事件检测、类型辨识方法 | |
CN108985380B (zh) | 一种基于聚类集成的转辙机故障识别方法 | |
CN104809658B (zh) | 一种低压配网台区线损的快速分析方法 | |
CN107784661A (zh) | 基于区域生长法的变电站设备红外图像分类识别方法 | |
Wang et al. | Recognition and drop-off detection of insulator based on aerial image | |
CN113592822B (zh) | 一种电力巡检图像的绝缘子缺陷定位方法 | |
CN105894041A (zh) | 基于高光谱遥感影像提取配电网系统中变电站信息的方法 | |
CN111652240B (zh) | 一种基于cnn的图像局部特征检测与描述方法 | |
CN112926556B (zh) | 一种基于语义分割的航拍输电线路散断股识别方法及系统 | |
CN113591948A (zh) | 一种缺陷模式识别方法、装置、电子设备和存储介质 | |
Wan et al. | LFRNet: Localizing, focus, and refinement network for salient object detection of surface defects | |
Jiao et al. | A deep learning model for small-size defective components detection in power transmission tower | |
CN112116265A (zh) | 一种电力数据驱动的行业景气指数构建方法 | |
CN110363053A (zh) | 一种遥感影像居民地提取方法及装置 | |
CN110276747B (zh) | 一种基于图像分析的绝缘子故障检测和故障评级方法 | |
CN115170520A (zh) | 一种基于结构对比信息叠层的金属网栅缺陷检测方法 | |
Liu et al. | Few-Shot Object Detection in Remote Sensing Images via Label-Consistent Classifier and Gradual Regression | |
CN109829511B (zh) | 基于纹理分类的下视红外图像中云层区域检测方法 | |
CN116109849A (zh) | 基于surf特征匹配的高压隔离开关定位与状态识别方法 | |
CN114818849A (zh) | 基于大数据信息的卷积神经网络和遗传算法的反窃电方法 | |
CN112801028A (zh) | 基于归纳表示学习网络的光谱和空间图高光谱图像分类方法 | |
CN110334776A (zh) | 一种基于区域双三次插值技术的图像分类识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |