CN109298225A - 一种电压量测数据异常状态自动识别模型及方法 - Google Patents
一种电压量测数据异常状态自动识别模型及方法 Download PDFInfo
- Publication number
- CN109298225A CN109298225A CN201811149219.2A CN201811149219A CN109298225A CN 109298225 A CN109298225 A CN 109298225A CN 201811149219 A CN201811149219 A CN 201811149219A CN 109298225 A CN109298225 A CN 109298225A
- Authority
- CN
- China
- Prior art keywords
- voltage
- data
- metric data
- sample
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01R—MEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
- G01R19/00—Arrangements for measuring currents or voltages or for indicating presence or sign thereof
- G01R19/0084—Arrangements for measuring currents or voltages or for indicating presence or sign thereof measuring voltage only
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Supply And Distribution Of Alternating Current (AREA)
Abstract
本发明公开了一种电压量测数据异常状态自动识别模型及方法,包括:数据预处理模块:用于排除噪声数据;最优参数匹配模块:用于匹配出密度聚类算法DBSCAN的最优组合输入参数;异常状态边界求解模块:用于求解出正常数据样本的相对误差最大值,并作为异常状态边界的判定值;离群电压量测数据判定模块:用于利用最优参数匹配模块提供的最优组合参数作为密度聚类算法DBSCAN的输入条件,分离出明显远离中心区域的点,即分离出状态异常点;电压量测数据异常状态判定模块:利用异常状态边界求解模块提供的异常状态边界完成电压量测数据异常状态判定,实现了快速准确地在线分析电压量测数据的状态,具有识别精度高,速度快、操作性强的技术效果。
Description
技术领域
本发明涉及电力系统大数据分析领域,具体地,涉及一种电压量测数据异常状态自动识别模型及方法,应用于满足基尔霍夫电压定律的多维电压量测数据场合。
背景技术
电压量测数据的有效传变是保证电力系统安全稳定运行的前提。保护系统利用电压量测数据实时监测电网运行情况,实现有选择性地隔离电网中的故障;自动化系统以电压为监测对象进行动态无功补偿,保持电网电压在经济可靠要求范围内;计量系统利用电压量测数据实现电能计量。
变电站电压量测数据的传变过程为电网一次电压经电压互感器变换形成二次电压,电压互感器二次输出的电压经二次回路、测控装置/保护装置/电能表、站控层网络传输给监控后台和远动装置;远动装置利用调度数据网将电压量测数据传输给调度主站。传变过程中任意一个环节出现故障都会导致电压量测数据异常。
由基尔霍夫电压定律得到同一根母线上的多支电压互感器的一次电压值(A相或B相或C相)相等。以此为前提,多支电压互感器的一次电压值构成了同一时间刻度不同维度的电压量测数据。
现有的方法均采用基于电压互感器物理参数建模实现判断变电站电压量测传变数据异常。这种方法根据电压互感器的结构,分析电压互感器局部故障与二次输出电压之间关系,确定异常电压量测数据的判断门槛值。该方法中存在两个问题:第一变电站电压会随着电网负荷变化而波动,而国家标准规定的电压波动小于±5%(最苛刻条件),导致该方法存在电压识别死区;第二电压互感器的相对误差值也会随着温度、湿度、电磁干扰等环境的影响而改变,现有方法也未考虑运行变差对设定门槛值的影响。综上,现有识别方法是基于电压互感器物理模型,以时间为尺度分析某支电压互感器输出的电压量测数据状态,因此电网负荷变化导致电压波动、运行变差增大等因素都会导致现有识别方法不准确、识别死区较大,造成误识别和不识别。
发明内容
本发明提供了一种电压量测数据异常状态自动识别模型及方法,解决了现有识别方法不准确、识别死区较大,造成误识别和不识别的技术问题,实现了快速准确地在线分析电压量测数据的状态,具有识别精度高,速度快、操作性强的技术效果。
本发明建立电网二次量测数据异常状态识别模型,利用电压量测多维数据实现自动匹配出密度聚类算法输入参数的最优解、自动训练电网二次量测值异常的判定边界值,完成模型的离线校核与判定边界值确定;以某一时刻的电网二次量测数据为识别对象,自动识别出异常电压量测数据,实现变电站海量电压数据有效利用,为在变电站监控后台和调度主站上开展电网一二次设备状态评价提供基础方法。
为实现上述发明目的,本申请一方面提供了一种电压量测数据异常状态自动识别模型,所述自动识别模型包括:
数据预处理模块:用于排除噪声数据,保证训练样本中无状态异常的数据样本;
最优参数匹配模块:用于利用输入的训练样本,遍历样本最大集,匹配出密度聚类算法DBSCAN的最优组合输入参数;
异常状态边界求解模块:用于求解出正常数据样本的相对误差最大值,并作为异常状态边界的判定值;
离群电压量测数据判定模块:用于利用最优参数匹配模块提供的最优组合参数作为密度聚类算法DBSCAN(Density-Based Spatial Clustering of Applications withNoise,基于密度的噪声应用空间聚类)的输入条件,分离出明显远离中心区域的点,即分离出状态异常点;
电压量测数据异常状态判定模块:利用异常状态边界求解模块提供的异常状态边界完成电压量测数据异常状态判定。
进一步的,所述噪声数据包括:人工停电检修、电网故障停电、二次电压量测数据传变回路故障引入的非正常电压量测数据。
进一步的,自动识别模型首先利用训练样本自动完成训练,得到DBSCAD密度聚类的两个输入参数扫描半径R和最小包含点数K的最优解,以及异常状态边界值;然后利用训练得到的R、K以及某时刻t1的多维电压量测样本作为DBSCAN的密度聚类算法的三个输入条件,自动识别出离群点和聚类点;将识别出的离群点作为异常电压量测数据处理;将聚类点作为进一步分析识别的输入条件;比较某时刻t1的电压量测值与异常状态边界值的大小,大于边界值的数据点判为异常数据,小于等于边界值的数据点判为正常数据。
进一步的,自动识别模型利用训练样本完成密度聚类算法最优输入条件的确定和异常状态判定边界值的计算,具体包括:
定义一个训练样本{XM×N},M为挂在变电站同一根母线上的线路电压互感器或母线电压互感器的支数,N为电压量测数据的采样时刻,其特征为无异常的电压量测值;其中X11LX1N为{XM×N}中第一支电压互感器的t1L tN时刻的电压量测值,X1NL XMN为{XM×N}中tN时刻M支PT的电压量测值;
将电压值小于10%的一次电压额定值UN的数据定义为电压量测值的噪声;
训练样本{XM×N}送入数据预处理模块后,遍历{XM×N}中样本点,去除样本点小于0.1UN所对应时刻的样本点,形成无异常状态数据的数据集{Xi×j},1≤i≤M,1≤j≤N,i表示经过数据预处理模块后,挂在变电站同一根母线上的线路电压互感器或母线电压互感器的支数,j表示经过数据预处理模块后,电压量测数据的采样时刻;
在最优参数匹配模块中,将{Xi×j}中tk时刻电压量测数据、组合参数(Rl,Ki)作为密度聚类算法DBSCAN的三个输入变量条件,遍历{Xi×j}中的列数据,其中δ为电压互感器校验规程中规定的相对误差值,tk为1至j之间任意一列数据所对应的时刻,k为1至j之间任意一个数,0.1δUN<1<δUN;
以Rl为横坐标轴、Ki为纵坐标轴画出二维平面坐标,形成RK最优决策树;在决策树中找到符合预设要求的(R,K)作为训练结果;
预设要求是指Rl最小,Ki最大的组合情况;
在异常状态边界求解模块中,将{Xi×j}中tk时刻电压量测数据、聚类簇数l作为k-mean聚类算法的两个输入参数,求取{Xi×j}的均值X(j)mean,然后利用下述计算相对误差公式求解{Xi×j}中j列的相对误差值{εj(%)};
遍历{εj(%)},将其最大值(Cupmax,Cdownmax)作为电压异常状态判定边界值c。
进一步的,将计算的最优输入参数(R,K)作为电压量测数据离群判定模块的输入条件,将电压量测数据离群判定模块的输出数据、异常状态判定边界值c作为电压量测数据异常状态判定模块的输入条件,识别出t1时刻多维电压量测样本中异常数据,具体包括:
定义一组待识别多维电压量测样本值{UM×1},里面包含了M支PT的t1时刻的电压量测值;
在电压量测数据离群判定模块中,将待识别样本{UM×1}、最优参数匹配模块输出的(R,K)作为密度聚类DBSCAN算法的三个输入条件,自动识别出离群点和聚类点;离群点{Ufocus}被判定为t1时刻状态异常电压数据,聚类点被送入电压量测数据异常状态判定模块;
在电压量测数据异常状态判定模块中,比较{Ufocus}中样本点与c的大小,大于c的样本点被判定为状态异常,小于c的样本点被判为状态正常。
另一方面,本申请还提供了一种电压量测数据异常状态自动识别方法,所述方法包括:
自动识别模型首先利用训练样本自动完成训练,得到DBSCAD密度聚类的两个输入参数半径R和样本点数K的最优解,以及异常状态边界值;然后利用训练得到的R、K以及某时刻t1的多维电压量测样本作为DBSCAN的密度聚类算法的三个输入条件,自动识别出离群点和聚类点;将识别出的离群点作为异常电压量测数据处理;将聚类点作为进一步分析识别的输入条件;比较某时刻t1的电压量测值与异常状态边界值的大小,大于边界值的数据点判为异常数据,小于等于边界值的数据点判为正常数据。
进一步的,所述自动识别模型包括:
数据预处理模块:用于排除噪声数据,保证训练样本中无状态异常的数据样本;
最优参数匹配模块:用于利用输入的训练样本,遍历样本最大集,匹配出密度聚类算法DBSCAN的最优组合输入参数;
异常状态边界求解模块:用于求解出正常数据样本的相对误差最大值,并作为异常状态边界的判定值;
离群电压量测数据判定模块:用于利用最优参数匹配模块提供的最优组合参数作为密度聚类算法DBSCAN的输入条件,分离出明显远离中心区域的点,即分离出状态异常点;
电压量测数据异常状态判定模块:利用异常状态边界求解模块提供的异常状态边界完成电压量测数据异常状态判定。
进一步的,所述噪声数据包括:人工停电检修、电网故障停电、二次电压量测数据传变回路故障引入的非正常电压量测数据。
进一步的,自动识别模型利用训练样本完成密度聚类算法最优输入条件的确定和异常状态判定边界值的计算,具体包括:
定义一个训练样本{XM×N},M为挂在变电站同一根母线上的线路电压互感器或母线电压互感器的支数,N为电压量测数据的采样时刻,其特征为无异常的电压量测值;其中X11LX1N为{XM×N}中第一支电压互感器的t1L tN时刻的电压量测值,X1NL XMN为{XM×N}中tN时刻M支PT的电压量测值;
将电压值小于10%的一次电压额定值UN的数据定义为电压量测值的噪声;
训练样本{XM×N}送入数据预处理模块后,遍历{XM×N}中样本点,去除样本点小于0.1UN所对应时刻的样本点,形成无异常状态数据的数据集{Xi×j},1≤i≤M,1≤j≤N,i表示经过数据预处理模块后,挂在变电站同一根母线上的线路电压互感器或母线电压互感器的支数,j表示经过数据预处理模块后,电压量测数据的采样时刻;
在最优参数匹配模块中,将{Xi×j}中tk时刻电压量测数据、组合参数(Rl,Ki)作为密度聚类算法DBSCAN的三个输入变量条件,遍历{Xi×j}中的列数据,其中δ为电压互感器校验规程中规定的相对误差值,tk为1至j之间任意一列数据所对应的时刻,k为1至j之间任意一个数,0.1δUN<l<δUN;
以Rl为横坐标轴、Ki为纵坐标轴画出二维平面坐标;形成RK最优决策树;在决策树中找到符合预设要求的(R,K)作为训练结果;
预设要求是指Rl最小,Ki最大的组合情况;
在异常状态边界求解模块中,将{Xi×j}中tk时刻电压量测数据、聚类簇数l作为k-mean聚类算法的两个输入参数,求取{Xi×j}的均值X(j)mean,然后利用下述计算相对误差公式求解{Xi×j}中j列的相对误差值{εj(%)};
遍历{εj(%)},将其最大值(Cupmax,Cdownmax)作为电压异常状态判定边界值c。
进一步的,将计算的最优输入参数(R,K)作为电压量测数据离群判定模块的输入条件,将电压量测数据离群判定模块的输出数据、异常状态判定边界值c作为电压量测数据异常状态判定模块的输入条件,识别出t1时刻多维电压量测样本中异常数据,具体包括:
定义一组待识别多维电压量测样本值{UM×1},里面包含了M支PT的t1时刻的电压量测值;
在电压量测数据离群判定模块中,将待识别样本{UM×1}、最优参数匹配模块输出的(R,K)作为密度聚类DBSCAN算法的三个输入条件,自动识别出离群点和聚类点;离群点{Ufocus}被判定为t1时刻状态异常电压数据,聚类点被送入电压量测数据异常状态判定模块;
在电压量测数据异常状态判定模块中,比较{Ufocus}中样本点与c的大小,大于c的样本点被判定为状态异常,小于c的样本点被判为状态正常。
本申请提供的一个或多个技术方案,至少具有如下技术效果或优点:
由于本方法仅利用变电站现有电压量测数据就可达到异常电压识别精度小于0.5%的效果,而无需新增测量设备。所以,实现了快速准确地在线分析电压量测数据的状态,具有识别精度高,速度快、操作性强的技术效果。
附图说明
此处所说明的附图用来提供对本发明实施例的进一步理解,构成本申请的一部分,并不构成对本发明实施例的限定;
图1是本申请中电压量测数据异常状态自动识别模型的组成示意图;
图2是本申请中电压量测数据异常状态自动识别方法的流程示意图。
具体实施方式
本发明提供了一种电压量测数据异常状态自动识别模型及方法,解决了现有识别方法不准确、识别死区较大,造成误识别和不识别的技术问题,实现了快速准确地在线分析电压量测数据的状态,具有识别精度高,速度快、操作性强的技术效果。
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在相互不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述范围内的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
请参考图1-图2,本申请提供了一种电压量测数据异常状态自动识别模型及方法,模型构成及实现方法:
1、基于多维数据的电压量测数据异常状态自动识别模型的构成及功能:
(1)基于多维数据的电压量测数据异常状态自动识别模型包括数据预处理模块、最优参数匹配模块、异常状态边界求解模块、离群电压量测数据判定模块、电压量测数据异常状态判定模块。该模型首先利用训练样本自动完成训练,得到DBSCAD密度聚类的两个输入参数(半径R和样本点数K)最优解,以及异常状态边界值;然后利用第一步中训练得到的R、K以及某时刻t1的多维电压量测样本作为DBSCAN的密度聚类算法的三个输入条件,自动识别出离群点和聚类点;将识别出的离群点作为异常电压量测数据处理;为提高精度,将聚类点作为进一步分析识别的输入条件;最后比较某时刻t1的电压量测值与异常状态边界值的大小,大于边界值的数据点判为异常数据,小于等于边界值的数据点判为正常数据。
1)数据预处理模块的功能:排除人工停电检修操作、电网故障停电、二次电压量测数据传变回路故障等引入的噪声数据,保证训练样本中无状态异常的数据样本;
2)最优参数匹配模块的功能:利用输入的训练样本,遍历样本最大集,匹配出密度聚类算法DBSCAN的最优组合输入参数,满足半径R尽可能小,样本点数K尽可能大的要求。
3)异常状态边界求解模块:求解出正常数据样本的相对误差最大值,并作为异常状态边界的判定值。
4)离群电压量测数据判定模块:利用最优参数匹配模块提供的最优组合参数作为密度聚类算法DBSCAN的输入条件,分离出明显远离中心区域的点,即分离出状态异常点。
5)电压量测数据异常状态判定模块:进一步完成电压量测数据异常状态判定,识别精度高于离群PT量测数据判定模块。
2、提前训练:自动识别模型利用训练样本完成密度聚类算法最优输入条件的确定和异常状态判定边界值的计算:
(2)定义一个训练样本{XM×N},特征为无异常的电压量测值。其中X11L X1N为{XM×N}中第一支PT的t1L tN时刻的电压量测值,X1NL XMN为{XM×N}中tN时刻M支PT的电压量测值。
(3)将电压值小于一次电压额定值(UN)10%的数据定义为电压量测值的噪声,引入噪声的原因为人工停电检修操作、电网故障停电、二次电压量测数据传变回路故障。
(4)训练样本{XM×N}送入数据预处理模块后,遍历{XM×N}中样本点,去除小于0.1UN样本点所对应的列,形成无异常状态数据的数据集{Xi×j},1≤i≤M,1≤j≤N。
(5)在最优参数匹配模块中,将{Xi×j}中tk时刻的i维电压数据、组合参数(R1,0.1,L,δUN,K2,1,L,i)作为密度聚类算法DBSCAN的三个输入变量条件,遍历{Xi×j}中的列数据。其中δ为电压互感器校验规程中规定的相对误差值。
(6)以Rk为横坐标轴、Kl为纵坐标轴画出二维平面坐标,形成RK最优决策树。在决策树中找到半径R尽可能小、样本点数K尽可能大的(R,K)作为训练结果。
(7)在异常状态边界求解模块中,将{Xi×j}中tk时刻的i维电压数据、聚类簇数1作为k-mean聚类算法的两个输入参数,求取{Xi×j}的均值X(j)mean,然后利用下述计算相对误差公式求解{Xi×j}中j列的相对误差值{εj(%)}。
(8)遍历{εj(%)},将其最大值(Cupmax,Cdownmax)作为电压异常状态判定边界值c。
3、将上述计算的最优输入参数(R,K)作为电压量测数据离群判定模块的输入条件,将电压量测数据离群判定模块的输出数据、异常状态判定边界值c作为电压量测数据异常状态判定模块的输入条件,识别出t1时刻多维电压量测样本中异常数据。
(9)定义一组待识别多维电压量测样本值{UM×1},里面包含了M支PT的t1时刻的电压量测值。
(10)在电压量测数据离群判定模块中,将待识别样本{UM×1}、最优参数匹配模块输出的(R,K)作为密度聚类DBSCAN算法的三个输入条件,自动识别出离群点和聚类点。离群点{Ufocus}被判定为t1时刻状态异常电压数据,聚类点被送入电压量测数据异常状态判定模块。
(11)在电压量测数据异常状态判定模块中,比较{Ufocus}中样本点与c的大小,大于c的样本点被判定为状态异常,小于c的样本点被判为状态正常。
本发明提供了一种基于多维数据的变电站电压量测数据异常状态自动识别模型及方法,属于电力系统大数据分析领域。利用本发明专利提供的方法,可在变电站监控后台或调度主站上部署一个软件模块,快速准确地在线分析电压量测数据的状态,具有识别精度高,速度快、操作性强的优点。识别精度小于0.5%。
密度聚类算法DBSCAN介绍:
DBSCAN(Density-Based Spatial Clustering of Applications with Noise,基于密度的噪声应用空间聚类)是一种基于密度的聚类算法。假定类别可以通过样本分布的紧密程度决定。同一类别的样本,他们之间的紧密相连的,也就是说,在该类别任意样本周围不远处一定有同类别的样本存在。通过将紧密相连的样本划为一类,这样就得到了一个聚类类别。通过将所有各组紧密相连的样本划为各个不同的类别,则我们就得到了最终的所有聚类类别结果。由密度可达关系导出的最大密度相连的样本集合,即为我们最终聚类的一个类别,或者说一个簇。
这个DBSCAN的簇里面可以有一个或者多个核心对象。如果只有一个核心对象,则簇里其他的非核心对象样本都在这个核心对象的∈∈-邻域里;如果有多个核心对象,则簇里的任意一个核心对象的∈∈-邻域中一定有一个其他的核心对象,否则这两个核心对象无法密度可达。这些核心对象的∈∈-邻域里所有的样本的集合组成的一个DBSCAN聚类簇。
那么怎么才能找到这样的簇样本集合呢?DBSCAN使用的方法很简单,它任意选择一个没有类别的核心对象作为种子,然后找到所有这个核心对象能够密度可达的样本集合,即为一个聚类簇。接着继续选择另一个没有类别的核心对象去寻找密度可达的样本集合,这样就得到另一个聚类簇。一直运行到所有核心对象都有类别为止。
聚类算法k-mean介绍:
K-means算法是很典型的基于距离的聚类算法,采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大。该算法认为簇是由距离靠近的对象组成的,因此把得到紧凑且独立的簇作为最终目标。具体实施过程如下:
1、从D中随机取k个元素,作为k个簇各自的中心。
2、分别计算剩下的元素到k个簇中心的相异度,将这些元素分别划归到相异度最低的簇。相异度一般用欧氏距离或者马氏距离来运算,距离越小,说明二者之间越相似。
3、根据聚类结果,重新计算k个簇各自的中心,计算方法是取簇中所有元素各自维度的算术平均数。
4、将D中全部元素按照新的中心重新聚类。
5、重复第4步,直到聚类结果不再变化。
6、将结果输出。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (10)
1.一种电压量测数据异常状态自动识别模型,其特征在于,所述自动识别模型包括:
数据预处理模块:用于排除噪声数据,保证训练样本中无状态异常的数据样本;
最优参数匹配模块:用于利用输入的训练样本,遍历样本最大集,匹配出密度聚类算法DBSCAN的最优组合输入参数;
异常状态边界求解模块:用于求解出正常数据样本的相对误差最大值,并作为异常状态边界的判定值;
离群电压量测数据判定模块:用于利用最优参数匹配模块提供的最优组合参数作为密度聚类算法DBSCAN的输入条件,分离出明显远离中心区域的点,即分离出状态异常点;
电压量测数据异常状态判定模块:利用异常状态边界求解模块提供的异常状态边界完成电压量测数据异常状态判定。
2.根据权利要求1所述的电压量测数据异常状态自动识别模型,其特征在于,所述噪声数据包括:人工停电检修、电网故障停电、二次电压量测数据传变回路故障引入的非正常电压量测数据。
3.根据权利要求1所述的电压量测数据异常状态自动识别模型,其特征在于,自动识别模型首先利用训练样本自动完成训练,得到DBSCAD密度聚类的两个输入参数扫描半径R和最小包含点数K的最优解,以及异常状态边界值;然后利用训练得到的R、K以及某时刻t1的多维电压量测样本作为DBSCAN的密度聚类算法的三个输入条件,自动识别出离群点和聚类点;将识别出的离群点作为异常电压量测数据处理;将聚类点作为进一步分析识别的输入条件;比较某时刻t1的电压量测值与异常状态边界值的大小,大于边界值的数据点判为异常数据,小于等于边界值的数据点判为正常数据。
4.根据权利要求1所述的电压量测数据异常状态自动识别模型,其特征在于,自动识别模型利用训练样本完成密度聚类算法最优输入条件的确定和异常状态判定边界值的计算,具体包括:
定义一个训练样本{XM×N},M为挂在变电站同一根母线上的线路电压互感器或母线电压互感器的支数,N为电压量测数据的采样时刻,其特征为无异常的电压量测值;其中X11L X1N为{XM×N}中第一支电压互感器的t1L tN时刻的电压量测值,X1NL XMN为{XM×N}中tN时刻M支PT的电压量测值;
将电压值小于10%的一次电压额定值UN的数据定义为电压量测值的噪声;
训练样本{XM×N}送入数据预处理模块后,遍历{XM×N}中样本点,去除样本点小于0.1UN所对应时刻的样本点,形成无异常状态数据的数据集{Xi×j},1≤i≤M,1≤j≤N,i表示经过数据预处理模块后,挂在变电站同一根母线上的线路电压互感器或母线电压互感器的支数,j表示经过数据预处理模块后,电压量测数据的采样时刻;
在最优参数匹配模块中,将{Xi×j}中tk时刻电压量测数据、组合参数(Rl,Ki)作为密度聚类算法DBSCAN的三个输入变量条件,遍历{Xi×j}中的列数据,其中δ为电压互感器校验规程中规定的相对误差值,tk为1至j之间任意一列数据所对应的时刻,k为1至j之间任意一个数,0.1δUN<1<δUN;
以Rl为横坐标轴、Ki为纵坐标轴画出二维平面坐标;形成RK最优决策树;在决策树中找到符合预设要求的(R,K)作为训练结果;
预设要求是指Rl最小,Ki最大的组合情况;
在异常状态边界求解模块中,将{Xi×j}中tk时刻电压量测数据、聚类簇数l作为k-mean聚类算法的两个输入参数,求取{Xi×j}的均值X(j)mean,然后利用下述计算相对误差公式求解{Xi×j}中j列的相对误差值{εj(%)};
遍历{εj(%)},将其最大值(Cupmax,Cdownmax)作为电压异常状态判定边界值c。
5.根据权利要求4所述的电压量测数据异常状态自动识别模型,其特征在于,将计算的最优输入参数(R,K)作为电压量测数据离群判定模块的输入条件,将电压量测数据离群判定模块的输出数据、异常状态判定边界值c作为电压量测数据异常状态判定模块的输入条件,识别出t1时刻多维电压量测样本中异常数据,具体包括:
定义一组待识别多维电压量测样本值{UM×1},里面包含了M支PT的t1时刻的电压量测值;
在电压量测数据离群判定模块中,将待识别样本{UM×1}、最优参数匹配模块输出的(R,K)作为密度聚类DBSCAN算法的三个输入条件,自动识别出离群点和聚类点;离群点{Ufocus}被判定为t1时刻状态异常电压数据,聚类点被送入电压量测数据异常状态判定模块;
在电压量测数据异常状态判定模块中,比较{Ufocus}中样本点与c的大小,大于c的样本点被判定为状态异常,小于c的样本点被判为状态正常。
6.一种电压量测数据异常状态自动识别方法,其特征在于,所述方法包括:
自动识别模型首先利用训练样本自动完成训练,得到DBSCAD密度聚类的两个输入参数半径R和样本点数K的最优解,以及异常状态边界值;然后利用训练得到的R、K以及某时刻多维电压量测样本作为DBSCAN的密度聚类算法的三个输入条件,自动识别出离群点和聚类点;将识别出的离群点作为异常电压量测数据处理;将聚类点作为进一步分析识别的输入条件;比较某时刻的电压量测值与异常状态边界值的大小,大于边界值的数据点判为异常数据,小于等于边界值的数据点判为正常数据。
7.根据权利要求6所述的电压量测数据异常状态自动识别方法,其特征在于,所述自动识别模型包括:
数据预处理模块:用于排除噪声数据,保证训练样本中无状态异常的数据样本;
最优参数匹配模块:用于利用输入的训练样本,遍历样本最大集,匹配出密度聚类算法DBSCAN的最优组合输入参数;
异常状态边界求解模块:用于求解出正常数据样本的相对误差最大值,并作为异常状态边界的判定值;
离群电压量测数据判定模块:用于利用最优参数匹配模块提供的最优组合参数作为密度聚类算法DBSCAN的输入条件,分离出明显远离中心区域的点,即分离出状态异常点;
电压量测数据异常状态判定模块:用于完成电压量测数据异常状态判定,识别精度高于离群PT量测数据判定模块。
8.根据权利要求7所述的电压量测数据异常状态自动识别方法,其特征在于,所述噪声数据包括:人工停电检修操作、电网故障停电、二次电压量测数据传变回路故障引入的噪声数据。
9.根据权利要求7所述的电压量测数据异常状态自动识别方法,其特征在于,自动识别模型利用训练样本完成密度聚类算法最优输入条件的确定和异常状态判定边界值的计算,具体包括:
定义一个训练样本{XM×N},M为挂在变电站同一根母线上的线路电压互感器或母线电压互感器的支数,N为电压量测数据的采样时刻,其特征为无异常的电压量测值;其中X11L X1N为{XM×N}中第一支电压互感器的t1L tN时刻的电压量测值,X1NL XMN为{XM×N}中tN时刻M支PT的电压量测值;
将电压值小于10%的一次电压额定值UN的数据定义为电压量测值的噪声;
训练样本{XM×N}送入数据预处理模块后,遍历{XM×N}中样本点,去除样本点小于0.1UN所对应时刻的样本点,形成无异常状态数据的数据集{Xi×j},1≤i≤M,1≤j≤N,i表示经过数据预处理模块后,挂在变电站同一根母线上的线路电压互感器或母线电压互感器的支数,j表示经过数据预处理模块后,电压量测数据的采样时刻;
在最优参数匹配模块中,将{Xi×j}中tk时刻电压量测数据、组合参数(Rl,Ki)作为密度聚类算法DBSCAN的三个输入变量条件,遍历{Xi×j}中的列数据,其中δ为电压互感器校验规程中规定的相对误差值,tk为1至j之间任意一列数据所对应的时刻,k为1至j之间任意一个数,0.1δUN<1<δUN;
以Rl为横坐标轴、Ki为纵坐标轴画出二维平面坐标;形成RK最优决策树;在决策树中找到符合预设要求的(R,K)作为训练结果;
预设要求是指Rl最小,Ki最大的组合情况;
在异常状态边界求解模块中,将{Xi×j}中tk时刻电压量测数据、聚类簇数l作为k-mean聚类算法的两个输入参数,求取{Xi×j}的均值X(j)mean,然后利用下述计算相对误差公式求解{Xi×j}中j列的相对误差值{εj(%)};
遍历{εj(%)},将其最大值(Cupmax,Cdownmax)作为电压异常状态判定边界值c。
10.根据权利要求9所述的电压量测数据异常状态自动识别方法,其特征在于,将计算的最优输入参数(R,K)作为电压量测数据离群判定模块的输入条件,将电压量测数据离群判定模块的输出数据、异常状态判定边界值c作为电压量测数据异常状态判定模块的输入条件,识别出t1时刻多维电压量测样本中异常数据,具体包括:
定义一组待识别多维电压量测样本值{UM×1},里面包含了M支PT的t1时刻的电压量测值;
在电压量测数据离群判定模块中,将待识别样本{UM×1}、最优参数匹配模块输出的(R,K)作为密度聚类DBSCAN算法的三个输入条件,自动识别出离群点和聚类点;离群点{Ufocus}被判定为t1时刻状态异常电压数据,聚类点被送入电压量测数据异常状态判定模块;
在电压量测数据异常状态判定模块中,比较{Ufocus}中样本点与c的大小,大于c的样本点被判定为状态异常,小于c的样本点被判为状态正常。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811149219.2A CN109298225B (zh) | 2018-09-29 | 2018-09-29 | 一种电压量测数据异常状态自动识别模型系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811149219.2A CN109298225B (zh) | 2018-09-29 | 2018-09-29 | 一种电压量测数据异常状态自动识别模型系统及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109298225A true CN109298225A (zh) | 2019-02-01 |
CN109298225B CN109298225B (zh) | 2020-10-09 |
Family
ID=65161240
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811149219.2A Active CN109298225B (zh) | 2018-09-29 | 2018-09-29 | 一种电压量测数据异常状态自动识别模型系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109298225B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110084158A (zh) * | 2019-04-15 | 2019-08-02 | 杭州拓深科技有限公司 | 一种基于智能算法的用电设备识别方法 |
CN110362401A (zh) * | 2019-06-20 | 2019-10-22 | 深圳壹账通智能科技有限公司 | 数据跑批方法、装置、存储介质及集群中的成员主机 |
CN111579727A (zh) * | 2020-06-05 | 2020-08-25 | 广东电网有限责任公司广州供电局 | 一种用于配电房的多气体传感检测装置及方法 |
CN111880035A (zh) * | 2020-08-06 | 2020-11-03 | 国网四川省电力公司电力科学研究院 | 基于多源量测数据的配电网故障监测系统及方法 |
CN115015683A (zh) * | 2022-08-09 | 2022-09-06 | 深圳永贵技术有限公司 | 电缆生产的性能测试方法、装置、设备及存储介质 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101908065A (zh) * | 2010-07-27 | 2010-12-08 | 浙江大学 | 一种支持动态更新的在线属性异常点检测方法 |
WO2014087965A1 (ja) * | 2012-12-03 | 2014-06-12 | 三菱電機株式会社 | 異常検出装置、異常検出方法、及びプログラム |
CN103985381A (zh) * | 2014-05-16 | 2014-08-13 | 清华大学 | 一种基于参数融合优化决策的音频索引方法 |
CN104462819A (zh) * | 2014-12-09 | 2015-03-25 | 国网四川省电力公司信息通信公司 | 一种基于密度聚类的局部离群点检测方法 |
CN105512206A (zh) * | 2015-11-27 | 2016-04-20 | 河海大学 | 一种基于聚类的离群点检测方法 |
CN106093703A (zh) * | 2016-06-07 | 2016-11-09 | 湖南大学 | 一种智能配电网故障的辨识与定位方法 |
CN106093771A (zh) * | 2016-08-16 | 2016-11-09 | 国网天津市电力公司 | 一种断路器分合闸线圈电流信号识别方法 |
CN106291239A (zh) * | 2016-08-02 | 2017-01-04 | 昆明理工大学 | 一种采用滤波器支路电流和主成分分析方法的直流输电线路故障识别方法 |
CN106709662A (zh) * | 2016-12-30 | 2017-05-24 | 山东鲁能软件技术有限公司 | 一种电力设备运行工况划分方法 |
CN106991508A (zh) * | 2017-05-25 | 2017-07-28 | 华北电力大学 | 一种基于dbscan的风电机组运行状态识别方法 |
CN108508294A (zh) * | 2018-03-29 | 2018-09-07 | 深圳众厉电力科技有限公司 | 一种高铁电能质量监测系统 |
US20180307943A1 (en) * | 2017-04-25 | 2018-10-25 | The Johns Hopkins University | Method and apparatus for clustering, analysis and classification of high dimensional data sets |
-
2018
- 2018-09-29 CN CN201811149219.2A patent/CN109298225B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101908065A (zh) * | 2010-07-27 | 2010-12-08 | 浙江大学 | 一种支持动态更新的在线属性异常点检测方法 |
WO2014087965A1 (ja) * | 2012-12-03 | 2014-06-12 | 三菱電機株式会社 | 異常検出装置、異常検出方法、及びプログラム |
CN103985381A (zh) * | 2014-05-16 | 2014-08-13 | 清华大学 | 一种基于参数融合优化决策的音频索引方法 |
CN104462819A (zh) * | 2014-12-09 | 2015-03-25 | 国网四川省电力公司信息通信公司 | 一种基于密度聚类的局部离群点检测方法 |
CN105512206A (zh) * | 2015-11-27 | 2016-04-20 | 河海大学 | 一种基于聚类的离群点检测方法 |
CN106093703A (zh) * | 2016-06-07 | 2016-11-09 | 湖南大学 | 一种智能配电网故障的辨识与定位方法 |
CN106291239A (zh) * | 2016-08-02 | 2017-01-04 | 昆明理工大学 | 一种采用滤波器支路电流和主成分分析方法的直流输电线路故障识别方法 |
CN106093771A (zh) * | 2016-08-16 | 2016-11-09 | 国网天津市电力公司 | 一种断路器分合闸线圈电流信号识别方法 |
CN106709662A (zh) * | 2016-12-30 | 2017-05-24 | 山东鲁能软件技术有限公司 | 一种电力设备运行工况划分方法 |
US20180307943A1 (en) * | 2017-04-25 | 2018-10-25 | The Johns Hopkins University | Method and apparatus for clustering, analysis and classification of high dimensional data sets |
CN106991508A (zh) * | 2017-05-25 | 2017-07-28 | 华北电力大学 | 一种基于dbscan的风电机组运行状态识别方法 |
CN108508294A (zh) * | 2018-03-29 | 2018-09-07 | 深圳众厉电力科技有限公司 | 一种高铁电能质量监测系统 |
Non-Patent Citations (3)
Title |
---|
YIFAN ZHOU ET.AL: "A Semi-supervised Anomaly Detection Method for Wind Farm Power Data Preprocessing", 《IEEE XPLORE》 * |
周培培 等: "基于DBSCAN聚类算法的异常轨迹检测", 《红外与激光工程》 * |
沙朝锋: "基于密度的聚类和异常检测", 《万方学位论文数据库》 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110084158A (zh) * | 2019-04-15 | 2019-08-02 | 杭州拓深科技有限公司 | 一种基于智能算法的用电设备识别方法 |
CN110362401A (zh) * | 2019-06-20 | 2019-10-22 | 深圳壹账通智能科技有限公司 | 数据跑批方法、装置、存储介质及集群中的成员主机 |
CN111579727A (zh) * | 2020-06-05 | 2020-08-25 | 广东电网有限责任公司广州供电局 | 一种用于配电房的多气体传感检测装置及方法 |
CN111880035A (zh) * | 2020-08-06 | 2020-11-03 | 国网四川省电力公司电力科学研究院 | 基于多源量测数据的配电网故障监测系统及方法 |
CN111880035B (zh) * | 2020-08-06 | 2022-08-09 | 国网四川省电力公司电力科学研究院 | 基于多源量测数据的配电网故障监测系统及方法 |
CN115015683A (zh) * | 2022-08-09 | 2022-09-06 | 深圳永贵技术有限公司 | 电缆生产的性能测试方法、装置、设备及存储介质 |
CN115015683B (zh) * | 2022-08-09 | 2022-11-04 | 深圳永贵技术有限公司 | 电缆生产的性能测试方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN109298225B (zh) | 2020-10-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109298225A (zh) | 一种电压量测数据异常状态自动识别模型及方法 | |
CN110991786B (zh) | 基于相似日负荷曲线的10kV静态负荷模型参数辨识方法 | |
CN112699913A (zh) | 一种台区户变关系异常诊断方法及装置 | |
US8756181B2 (en) | System and method employing a self-organizing map load feature database to identify electric load types of different electric loads | |
CN109829497B (zh) | 一种基于监督学习的台区用户识别及判别方法 | |
CN109145949A (zh) | 基于集成学习的非侵入式电力负荷监测与分解方法及系统 | |
CN111368904B (zh) | 一种基于电力指纹的电器设备识别方法 | |
CN111625991A (zh) | 一种低压配电网拓扑校验方法 | |
US20130138669A1 (en) | System and method employing a hierarchical load feature database to identify electric load types of different electric loads | |
CN110333474A (zh) | 一种在线检测互感器计量异常状态的方法和系统 | |
CN110363432A (zh) | 基于改进熵权-灰色关联的配电网可靠性影响分析方法 | |
CN111537939A (zh) | 一种基于多指标融合的电压互感器状态评估方法及装置 | |
CN109816033A (zh) | 一种基于优化的监督学习进行台区用户识别的方法 | |
CN110298369A (zh) | 一种电力系统不良数据的辨识方法及系统 | |
CN104123678A (zh) | 一种基于状态等级评估模型的电力继电保护状态检修方法 | |
CN108182257A (zh) | 一种基于区域密度统计方法优化的gsa不良数据检测与辨识方法 | |
CN116681186B (zh) | 一种基于智能终端的用电质量分析方法及装置 | |
CN112070118A (zh) | 基于数据聚类拟合分析的台区相序识别方法 | |
CN113922412A (zh) | 一种新能源多场站短路比全景化评估方法、系统、存储介质及计算设备 | |
CN116011158A (zh) | 一种低压台区的拓扑识别方法、系统及装置 | |
Yang et al. | Event detection, localization, and classification based on semi-supervised learning in power grids | |
CN112508254B (zh) | 变电站工程项目投资预测数据的确定方法 | |
CN113687292B (zh) | 大数据、云环境下电能表错误接线的检测系统及方法 | |
CN109784777B (zh) | 基于时序信息片段云相似度度量的电网设备状态评估方法 | |
CN111476502A (zh) | 一种基于多层感知机的中压配电网线损区间计算方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |