CN112464848B - 一种基于密度空间聚类的信息流异常数据监测方法及装置 - Google Patents
一种基于密度空间聚类的信息流异常数据监测方法及装置 Download PDFInfo
- Publication number
- CN112464848B CN112464848B CN202011418335.7A CN202011418335A CN112464848B CN 112464848 B CN112464848 B CN 112464848B CN 202011418335 A CN202011418335 A CN 202011418335A CN 112464848 B CN112464848 B CN 112464848B
- Authority
- CN
- China
- Prior art keywords
- data
- electric energy
- phase angle
- energy information
- amplitude
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/08—Feature extraction
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01R—MEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
- G01R19/00—Arrangements for measuring currents or voltages or for indicating presence or sign thereof
- G01R19/165—Indicating that current or voltage is either above or below a predetermined value or within or outside a predetermined range of values
- G01R19/16566—Circuits and arrangements for comparing voltage or current with one or several thresholds and for indicating the result not covered by subgroups G01R19/16504, G01R19/16528, G01R19/16533
- G01R19/16571—Circuits and arrangements for comparing voltage or current with one or several thresholds and for indicating the result not covered by subgroups G01R19/16504, G01R19/16528, G01R19/16533 comparing AC or DC current with one threshold, e.g. load current, over-current, surge current or fault current
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01R—MEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
- G01R19/00—Arrangements for measuring currents or voltages or for indicating presence or sign thereof
- G01R19/165—Indicating that current or voltage is either above or below a predetermined value or within or outside a predetermined range of values
- G01R19/16566—Circuits and arrangements for comparing voltage or current with one or several thresholds and for indicating the result not covered by subgroups G01R19/16504, G01R19/16528, G01R19/16533
- G01R19/16576—Circuits and arrangements for comparing voltage or current with one or several thresholds and for indicating the result not covered by subgroups G01R19/16504, G01R19/16528, G01R19/16533 comparing DC or AC voltage with one threshold
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01R—MEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
- G01R25/00—Arrangements for measuring phase angle between a voltage and a current or between voltages or currents
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/12—Classification; Matching
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Power Engineering (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biophysics (AREA)
- Evolutionary Biology (AREA)
- Probability & Statistics with Applications (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Testing And Monitoring For Control Systems (AREA)
- Supply And Distribution Of Alternating Current (AREA)
Abstract
本发明公开了一种基于密度空间聚类的信息流异常数据监测方法及装置,包括:S1、实时采集电能信息交互设备上传主站电能量测数据,将电能测量数据分组为幅值量测数据和相角量测数据;S2、利用长短期记忆LSTM方法计算电能信息交互测量数据幅值特征分量;S3、利用斜率特征量计算电能信息数据相角特征分量;S4、采用基于密度空间聚类DBSC监测模型,将所述幅值特征分量、相角特征分量分别输入基于密度空间聚类DBSC监测模型,并进行聚类分析以监测电能信息交互设备量测值中的幅值或相角异常数据,并输出监测结果。本发明大大提高了动态条件下监测和筛选异常数据的精度,满足现场实际应用的大部分需求。
Description
技术领域
本发明涉及电力系统技术领域,具体涉及一种基于密度空间聚类的信息流异常数据监测方法及装置。
背景技术
随着国家电网公司不断提高供电可靠性、减少停电时间,提升电能服务能力的要求,势必要实现电力系统电能信息全覆盖、多维度的实时采集。新型电能信息交互设备由于其快速、实时、准确的特点而广泛用于电力系统的动态监测、自适应保护等领域。然而,随着电能信息交互设备的推广应用,因互感器误差,设备故障、时间同步偏差、通信系统中断等诸多因素,现场部分实测电能信息流数据容易出现丢失、跳变、偏差等数据异常问题。另外,随着现代电力系统交互信息不断融合,系统调控中心对实时量测数据的依赖程度越来越高,导致电能信息监测数据面临着较高的潜在网络攻击风险。同时,因信息交互主站利用卫星信号授时,容易受到许多内外因素的影响,例如信道干扰,卫星定位系统(GPS或北斗导航系统)信号丢失和设备错误,都将大大降低系统的可观性,甚至影响电力系统的安全性和稳定性。
针对监测电力系统电能信息交互设备可能存在的信息流异常数据,目前业内存在很多方法,目前大致可以划分为基于系统拓扑状态估计和基于数据驱动的两类方法。其中,基于系统拓扑状态估计的方法需要预先掌握电力系统拓扑及状态参数,尽管其异常数据监测精度很高,但是当发生系统拓扑错误时,很容易引起误判。而随着数据挖掘技术的兴起,引申出一系列基于神经网络和深度学习的异常数据监测方法。这些方法在静态情况下取得了良好的异常数据监测效果。但是在动态条件(低频振荡、次同步振荡等)下,由于电能信息交互数据本身也在随时间发生振荡波动,导致其中某些不良数据与系统正常数据间仅存在细微差别。因此,在此类动态工况下,传统数据学习方法的在动态条件下误检率很高,难以大面积推广应用。
发明内容
本发明所要解决的技术问题是现有技术下传统的信息流异常数据监测方法普遍存在动态条件下无法放大并辨识异常数据细微特征,最终导致误检率大幅增高的问题。
基于此,本发明基于密度空间聚类(density-based spatial clustering,DBSC)方法,提出了一种基于密度空间聚类的信息流异常数据监测方法及装置,该方法通过长短期记忆(long short-term memory,LSTM)神经网络有选择地使用电能信息采集数据,从相角斜率特征出发,通过计算残差值放大了异常数据的特征信息,最后通过DBSC对电能信息流数据幅值/相角特征进行聚类分析,有效解决动态条件下电能信息流数据幅值和相位角数据监测异常的问题。该方法通过长短期记忆LSTM神经网络有选择地使用电能信息流数据,从电能信息测量值相角数据的斜率特征出发,通过计算残差值放大了异常数据的特征信息,最后通过基于密度空间聚类DBSC对电能信息幅值/相角特征进行聚类分析,有效解决动态条件下电能信息流数据幅值和相位角数据监测异常的问题。根据实施例结果表明,本发明方法能够抑制外界干扰因素对异常数据监测的影响,大大提高了动态条件下监测和筛选异常数据的精度,满足现场实际应用的大部分需求。
本发明通过下述技术方案实现:
一方面,本发明提供了一种基于密度空间聚类的信息流异常数据监测方法,该方法包括以下步骤:
S1、实时采集电能信息交互设备上传主站电能量测数据,将电能测量数据分组为幅值量测数据和相角量测数据;
S2、将所述幅值量测数据的幅值序列分为训练集和测试集两类,采用长短期记忆LSTM神经网络,并将所述训练集和测试集分别输入到所述长短期记忆LSTM神经网络进行训练得到映射的神经网络特征,作为电能信息流交互数据幅值特征分量;
S3、对所述相角量测数据的相角序列进行相位变换计算新的相位差序列,计算相角斜率特征量,即角速度特征量,作为电能信息流交互数据相角特征分量;
S4、采用基于密度空间聚类DBSC监测模型,将所述幅值特征分量、相角特征分量分别输入基于密度空间聚类DBSC监测模型,并进行聚类分析以监测电能信息交互设备量测值中的幅值或相角异常数据,并输出监测结果。
进一步地,步骤S2中所述长短期记忆LSTM神经网络的结构包括遗忘门、输入门、输出门和储存单元,所述遗忘门,用于电能量测数据的训练集数据输入口;所述输入门,用于电能量测数据的测试集数据输入口;所述储存单元,用于LSTM神经网络模型训练过程中的中间数据存储;所述输出门,用于训练和测试结果的输出。
进一步地,步骤S2中利用长短期记忆LSTM方法计算电能信息交互测量数据幅值特征分量的具体步骤如下:
S21:将前一时刻的电能信息测量数据幅值特征分量ht-1和当前时刻的待训练的输入信号xt输入遗忘门模块,计算得到当前时刻遗忘门的状态参数ft:
ft=σ(Wf·[ht-1,xt]+bf)
其中:Wf是遗忘门的权重系数矩阵;xt是待训练的输入信号,此处特指当前时刻的电压或电流采样数据;ht-1是前一时刻的电能信息测量数据幅值特征分量,bf是遗忘门的偏项,σ是sigmoid函数,其表达式为:σ(x)=1/1+e-x;
同时,通过将xt数据保存到输入门得到当前时刻输入门的状态参数it:
it=σ(Wi·[ht-1,xt]+bi)
其中:Wi是输入门的权重系数矩阵;bi是输入门的偏项;
其中:Wc是长期记忆储存单元的权重系数矩阵;激活函数的表达式为tanh(x)=(ex-e-x)/(ex+e-x);bc是记忆储存单元的偏项;
S24:输出门控制多个ct输出长短期记忆LSTM神经网络的最终输出结果ht,即电能信息测量数据幅值特征分量:
ht=otοtanh(ct)
其中:ot=σ(Wo·[ht-1,xt]+bo);Wo是输出门的权重系数矩阵;bo是输入门的偏项;
S25:利用LSTM网络强大的存储和抗噪功能,通过不断将电能信息流历史数据输入长短期记忆LSTM神经网络,得到LSTM神经网络训练模型,依次循环,迭代获得预测值将电能信息实际测量h0和预测数据用计算残差e,直至所述残差e达到预设值,得到最终的幅值特征分量ht;其中并通过残差值得到预设值来控制后续DBSC聚类模块监测幅值发生异常的电能信息数据。
进一步地,步骤S3中利用斜率特征量计算电能信息数据相角特征分量,是利用两相邻采样时刻的相角测量值做差计算其变化率,即相角的角速度,以此作为电能信息数据相角特征分量ω(tn):
进一步地,基于密度空间聚类DBSC与传统K-means聚类方法不同,它是一种基于密度的聚类方法。本发明基于密度空间聚类DBSC法将现有数据点分为三类:
第一类为核心点(Core Point):如果该对象的Eps邻域至少包含最小数目MinPts的对象,则称该对象为核心点;
第二类为边界点(Border Point):如果该对象不是核心点,但落在某个核心点的Eps邻域内,则称该对象为边界点;
第三类为噪声点(Noise Point):不属于任何群集的点称为噪声点。
其中:Eps代表不同对象点的半径全局参数;MinPts代表样本点密度全局参数。
步骤S4包括以下子步骤:
S41:从所述幅值特征分量、相角特征分量组成的数据集中随机选择一个数据作为对象点;
S42:通过检查数据集中每个点的Eps邻域来搜索簇,如果对象点的Eps邻域包含的点多于MinPts,则创建一个以该对象点为核心对象的簇;
S43:如果所选数据对象是边界点,则继续选择另一个数据作为对象点;
S44:重复步骤S41至S43,迭代地聚集从这些核心对象,直到遍历所有点,最终识别出电能信息测量值中的正常数据和异常数据,被聚在核心点簇的数据为正常数据,否则为异常数据(包括边界点和噪声点);
另一方面,本发明还提供了一种基于密度空间聚类的信息流异常数据监测装置,该装置支持所述的一种基于密度空间聚类的信息流异常数据监测方法,该装置包括:
获取单元,获取实时采集的电能信息交互设备上传主站电能量测数据,并将电能测量数据分组为幅值量测数据和相角量测数据;
第一计算单元,将所述幅值量测数据的幅值序列分为训练集和测试集两类,利用长短期记忆LSTM神经网络计算电能信息交互测量数据幅值特征分量;
第二计算单元,对所述相角量测数据的相角序列进行相位变换计算新的相位差序列,计算相角斜率特征量,即角速度特征量,作为电能信息流交互数据相角特征分量;
监测单元,根据所述幅值特征分量和相角特征分量,采用基于密度空间聚类DBSC监测模型进行聚类分析以监测电能信息交互设备量测值中的幅值或相角异常数据;
输出单元,输出监测单元的监测结果。
进一步地,所述第一计算单元中的长短期记忆LSTM神经网络结构包括遗忘门、输入门、输出门和储存单元,所述遗忘门,用于电能量测数据的训练集数据输入口;所述输入门,用于电能量测数据的测试集数据输入口;所述储存单元,用于LSTM神经网络模型训练过程中的中间数据存储;所述输出门,用于训练和测试结果的输出。
进一步地,所述第一计算单元执行过程如下:
将前一时刻的电能信息测量数据幅值特征分量ht-1和当前时刻的待训练的输入信号xt输入遗忘门模块,计算得到当前时刻遗忘门的状态参数ft:
ft=σ(Wf·[ht-1,xt]+bf)
其中:Wf是遗忘门的权重系数矩阵;xt是待训练的输入信号,此处特指当前时刻的电压或电流采样数据;ht-1是前一时刻的电能信息测量数据幅值特征分量,bf是遗忘门的偏项,σ是sigmoid函数,其表达式为:σ(x)=1/1+e-x;
同时,通过将xt数据保存到输入门得到当前时刻输入门的状态参数it:
it=σ(Wi·[ht-1,xt]+bi)
其中:Wi是输入门的权重系数矩阵;bi是输入门的偏项;
其中:Wc是长期记忆储存单元的权重系数矩阵;激活函数的表达式为tanh(x)=(ex-e-x)/(ex+e-x);bc是记忆储存单元的偏项;
输出门控制多个ct输出长短期记忆LSTM神经网络的最终输出结果ht,即电能信息测量数据幅值特征分量:
ht=otοtanh(ct)
其中:ot=σ(Wo·[ht-1,xt]+bo);Wo是输出门的权重系数矩阵;bo是输入门的偏项;
利用LSTM网络强大的存储和抗噪功能,通过不断将电能信息流历史数据输入长短期记忆LSTM神经网络,得到LSTM神经网络训练模型,依次循环,迭代获得预测值将电能信息实际测量h0和预测数据用计算残差e,直至所述残差e达到预设值,得到最终的幅值特征分量ht;其中并通过残差值得到预设值来控制后续DBSC聚类模块监测幅值发生异常的电能信息数据。
进一步地,所述第二计算单元利用斜率特征量计算电能信息数据相角特征分量,是利用两相邻采样时刻的相角测量值做差计算其变化率,即相角的角速度,以此作为电能信息数据相角特征分量ω(tn):
进一步地,所述监测单元执行过程如下:
从所述幅值特征分量、相角特征分量组成的数据集中随机选择一个数据作为对象点;
通过检查数据集中每个点的Eps邻域来搜索簇,如果对象点的Eps邻域包含的点多于MinPts,则创建一个以该对象点为核心对象的簇;
如果所选数据对象是边界点,则继续选择另一个数据作为对象点;
重复上述过程,迭代地聚集从这些核心对象,直到遍历所有点,最终识别出电能信息测量值中的正常数据和异常数据,被聚在核心点簇的数据为正常数据,否则为异常数据;
其中:Eps代表不同对象点的半径全局参数;MinPts代表样本点密度全局参数。
本发明与现有技术相比,具有如下的优点和有益效果:
1、本发明通过LSTM神经网络进行训练得到电能信息测量数据幅值特征分量,通过相位变换计算新的相位差序列,计算相角斜率特征量,得到电能信息数据相角特征分量,放大了动态信号量测数据中异常数据与信号本身动态波动间存在的细微差别;
2、本发明利用基于密度空间聚类方法,对计算、训练得到的幅值、相角特征分量进行聚类分析、判别,大大提高了动态条件下监测和筛选异常数据的精度;
3、本发明在幅值、相角发生动态调制的工况下,相较于K-means聚类和谱聚类方法,无论是单个或多个幅值、相角发生数据异常,均具有更高的监测精度,且能够至少抵抗60dB高斯白噪声带来的干扰影响,满足现场实际应用的大部分需求。
附图说明
此处所说明的附图用来提供对本发明实施例的进一步理解,构成本申请的一部分,并不构成对本发明实施例的限定。在附图中:
图1为本发明所采用的LSTM神经网络结构示意图。
图2为本发明利用斜率特征量计算电能信息数据相角特征分量的变化曲线图。
图3为本发明基于密度空间聚类DBSC方法将现有数据点分为三类的示意图。
图4为本发明一种基于密度空间聚类的信息流异常数据监测方法流程图。
图5为本发明实施例仿真结果图。
图6为本发明基于密度空间聚类法、现有谱聚类法和现有K-means聚类法进行对比和分析示意图一。
图7为本发明基于密度空间聚类法、现有谱聚类法和现有K-means聚类法进行对比和分析示意图二。
图8为本发明基于密度空间聚类法、现有谱聚类法和现有K-means聚类法进行对比和分析示意图三。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施例和附图,对本发明作进一步的详细说明,本发明的示意性实施方式及其说明仅用于解释本发明,并不作为对本发明的限定。
在以下描述中,为了提供对本发明的透彻理解阐述了大量特定细节。然而,对于本领域普通技术人员显而易见的是:不必采用这些特定细节来实行本发明。在其他实例中,为了避免混淆本发明,未具体描述公知的结构、电路、材料或方法。
在整个说明书中,对“一个实施例”、“实施例”、“一个示例”或“示例”的提及意味着:结合该实施例或示例描述的特定特征、结构或特性被包含在本发明至少一个实施例中。因此,在整个说明书的各个地方出现的短语“一个实施例”、“实施例”、“一个示例”或“示例”不一定都指同一实施例或示例。此外,可以以任何适当的组合和、或子组合将特定的特征、结构或特性组合在一个或多个实施例或示例中。此外,本领域普通技术人员应当理解,在此提供的示图都是为了说明的目的,并且示图不一定是按比例绘制的。这里使用的术语“和/或”包括一个或多个相关列出的项目的任何和所有组合。
在本发明的描述中,需要理解的是,术语“前”、“后”、“左”、“右”、“上”、“下”、“竖直”、“水平”、“高”、“低”“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明保护范围的限制。
实施例1
如图1至图8所示,本发明一种基于密度空间聚类的信息流异常数据监测方法,如图4所示,图4为本发明一种基于密度空间聚类的信息流异常数据监测方法流程图。
该方法包括以下步骤:
S1、实时采集电能信息交互设备上传主站电能量测数据,将电能测量数据分组为幅值量测数据和相角量测数据;
S2、将所述幅值量测数据的幅值序列分为训练集和测试集两类,采用长短期记忆LSTM神经网络,并将所述训练集和测试集分别输入到所述长短期记忆LSTM神经网络进行训练得到映射的神经网络特征,作为电能信息流交互数据幅值特征分量;
S3、对所述相角量测数据的相角序列进行相位变换计算新的相位差序列,计算相角斜率特征量,即角速度特征量,作为电能信息流交互数据相角特征分量;
S4、采用基于密度空间聚类DBSC监测模型,将所述幅值特征分量、相角特征分量分别输入基于密度空间聚类DBSC监测模型,并进行聚类分析以监测电能信息交互设备量测值中的幅值或相角异常数据,并输出监测结果。
本实施例中,步骤S2中所述长短期记忆LSTM神经网络的结构如图1所示,它由四个关键结构组成,分别是:遗忘门(Forget Gate)、输入门(Input Gate)、输出门(OutputGate)和储存单元(Cell State);所述遗忘门,用于电能量测数据的训练集数据输入口;所述输入门,用于电能量测数据的测试集数据输入口;所述储存单元,用于LSTM神经网络模型训练过程中的中间数据存储;所述输出门,用于训练和测试结果的输出。
本实施例中,步骤S2中利用长短期记忆LSTM方法计算电能信息交互测量数据幅值特征分量的具体步骤如下:
S21:将前一时刻的电能信息测量数据幅值特征分量ht-1和当前时刻的待训练的输入信号xt输入遗忘门模块,计算得到当前时刻遗忘门的状态参数ft:
ft=σ(Wf·[ht-1,xt]+bf)
其中:Wf是遗忘门的权重系数矩阵;xt是待训练的输入信号,此处特指当前时刻的电压或电流采样数据;ht-1是前一时刻的电能信息测量数据幅值特征分量,bf是遗忘门的偏项,σ是sigmoid函数,其表达式为:σ(x)=1/1+e-x;
同时,通过将xt数据保存到输入门得到当前时刻输入门的状态参数it:
it=σ(Wi·[ht-1,xt]+bi)
其中:Wi是输入门的权重系数矩阵;bi是输入门的偏项;
其中:Wc是长期记忆储存单元的权重系数矩阵;激活函数的表达式为tanh(x)=(ex-e-x)/(ex+e-x);bc是记忆储存单元的偏项;
S24:输出门控制多个ct输出长短期记忆LSTM神经网络的最终输出结果ht,此处特指电能信息测量数据幅值特征分量:
ht=otοtanh(ct)
其中:ot=σ(Wo·[ht-1,xt]+bo);Wo是输出门的权重系数矩阵;bo是输入门的偏项;
S25:利用LSTM网络强大的存储和抗噪功能,通过不断将电能信息流历史数据输入长短期记忆LSTM神经网络,得到LSTM神经网络训练模型,依次循环,迭代获得预测值将电能信息实际测量h0和预测数据用计算残差e,直至所述残差e达到预设值,得到最终的幅值特征分量ht;其中并通过残差值得到预设值来控制后续DBSC聚类模块监测幅值发生异常的电能信息数据。
本实施例中,如图2所示,电能信息相角量测数据通常在-180°和180°之间呈锯齿形变化,并且其波动范围相对较大。因此,当电能信息测量数据出现相角异常时,相角差的响应会远大于相角本身的应激响应,这样的方法变放大了二者之间的差异使其更加容易监测。
基于此,步骤S3中利用斜率特征量计算电能信息数据相角特征分量,是利用两相邻采样时刻的相角测量值做差计算其变化率,即相角的角速度,以此作为电能信息数据相角特征分量ω(tn):
本实施例中,基于密度空间聚类DBSC与传统K-means聚类方法不同,它是一种基于密度的聚类方法。如图3所示,本发明基于密度空间聚类DBSC法将现有数据点分为三类:
第一类为核心点(Core Point):如果该对象的Eps邻域至少包含最小数目MinPts的对象,则称该对象为核心点;
第二类为边界点(Border Point):如果该对象不是核心点,但落在某个核心点的Eps邻域内,则称该对象为边界点;
第三类为噪声点(Noise Point):不属于任何群集的点称为噪声点。
其中:Eps代表不同对象点的半径全局参数;MinPts代表样本点密度全局参数。
步骤S4包括以下子步骤:
S41:从所述幅值特征分量、相角特征分量组成的数据集中随机选择一个数据作为对象点;
S42:通过检查数据集中每个点的Eps邻域来搜索簇,如果对象点的Eps邻域包含的点多于MinPts,则创建一个以该对象点为核心对象的簇;
S43:如果所选数据对象是边界点,则继续选择另一个数据作为对象点;
S44:重复步骤S41至S43,迭代地聚集从这些核心对象,直到遍历所有点,最终识别出电能信息测量值中的正常数据和异常数据,被聚在核心点簇的数据为正常数据,否则为异常数据(包括边界点和噪声点);
实施时,仿真实验如下:
为了验证本发明方法的有效性,利用标准的幅值调制和相角调制两种动态信号来测试本发明所提出的基于密度空间聚类的信息流异常数据监测方法分别识别幅值和相角异常数据的准确度。
采用幅值+相角调制模型来模拟动态变化下的电力振荡信号,其表达式如下:
其中:Xm是幅值初始值,这里取220V;λ是幅值调制深度,这里取0.6%;fm是幅值调制频率,这里取5Hz;是幅值调制的初相角,这里取0°;f0是电力系统的标称额定频率,这里取50Hz;Xk是相角调制深度,这里取6°;fa是幅值调制频率,这里取5Hz;是动态信号的初相角,这里取60°。
A、幅值调制动态信号下的仿真
对于上述动态调制信号,添加了具有0.5%幅值偏差的异常数据,并添加了60dB高斯白噪声作为干扰分量测试方法的监测精度和抗干扰性能。
从图5中的仿真结果可以看出,当设置DBSC模块中Eps=0.5,MinPts=3时,实时电能信息实际测量中出现单个较小幅度的异常数据时。本发明提出的方法可以准确监测到单个幅值发生异常的数据(图5中“ο”标记为异常数据)。
而当先后设置了十个幅值由0.5%变化到3%的异常数据,并添加了60dB高斯白噪声时。采用K-means聚类法和谱聚类法与本发明所提方法进行对比和分析,如图6所示。当设置DBSC模块中Eps=0.15,MinPts=3时,电能信息测量数据中出现多个较小幅度的异常数据时。本发明所提的DBSC监测方法具有比其他两种对比方法更高的异常数据监测精度。(图6中“ο”标记为异常数据)。
B、相角调制动态信号下的仿真
对于上述动态调制信号,添加了具有单个0.2%相角偏差的异常数据,并添加了60dB高斯白噪声作为干扰分量。
通常,电能信息交互数据中的相角异常由于波动较小且差异细微而难以监测,从图7中的仿真结果可以看出,当设置DBSC模块中Eps=0.12,MinPts=3时,本发明提出的方法可以准确监测到单个相角发生异常的数据,而K-means聚类和谱聚类方法则很难区分(图7中“ο”标记为异常数据)。
而当先后设置了十个相角由0.2%变化到1%的异常数据,并添加了60dB高斯白噪声时。如图8所示。设置DBSC模块中Eps=0.01,MinPts=3时,电能信息测量数据中出现多个较小幅度的相角异常数据。本发明提出的DBSC方法可以准确监测到全部10个相角数据发生异常,而K-means聚类和谱聚类方法同样很难区分(图8中“ο”标记为异常数据)。
本发明方法通过长短期记忆LSTM神经网络有选择地使用电能信息流数据,从电能信息测量值相角数据的斜率特征出发,通过计算残差值放大了异常数据的特征信息,最后通过基于密度空间聚类DBSC对电能信息幅值/相角特征进行聚类分析,有效解决动态条件下电能信息流数据幅值和相位角数据监测异常的问题。根据实施例结果表明,本发明方法能够抑制外界干扰因素对异常数据监测的影响,大大提高了动态条件下监测和筛选异常数据的精度,满足现场实际应用的大部分需求。
本发明方法对于提高电能信息交互数据质量,确保电力系统安全稳定运行中起着至关重要的作用。
实施例2
如图1至图8所示,本实施例与实施例1的区别在于,本实施例提供了一种基于密度空间聚类的信息流异常数据监测装置,该装置支持实施例1所述的一种基于密度空间聚类的信息流异常数据监测方法,该装置包括:
获取单元,获取实时采集的电能信息交互设备上传主站电能量测数据,并将电能测量数据分组为幅值量测数据和相角量测数据;
第一计算单元,将所述幅值量测数据的幅值序列分为训练集和测试集两类,利用长短期记忆LSTM神经网络计算电能信息交互测量数据幅值特征分量;
第二计算单元,对所述相角量测数据的相角序列进行相位变换计算新的相位差序列,计算相角斜率特征量,即角速度特征量,作为电能信息流交互数据相角特征分量;
监测单元,根据所述幅值特征分量和相角特征分量,采用基于密度空间聚类DBSC监测模型进行聚类分析以监测电能信息交互设备量测值中的幅值或相角异常数据;
输出单元,输出监测单元的监测结果。
进一步地,所述第一计算单元中的长短期记忆LSTM神经网络结构包括遗忘门、输入门、输出门和储存单元,所述遗忘门,用于电能量测数据的训练集数据输入口;所述输入门,用于电能量测数据的测试集数据输入口;所述储存单元,用于LSTM神经网络模型训练过程中的中间数据存储;所述输出门,用于训练和测试结果的输出。
进一步地,所述第一计算单元执行过程如下:
将前一时刻的电能信息测量数据幅值特征分量ht-1和当前时刻的待训练的输入信号xt输入遗忘门模块,计算得到当前时刻遗忘门的状态参数ft:
ft=σ(Wf·[ht-1,xt]+bf)
其中:Wf是遗忘门的权重系数矩阵;xt是待训练的输入信号,此处特指当前时刻的电压或电流采样数据;ht-1是前一时刻的电能信息测量数据幅值特征分量,bf是遗忘门的偏项,σ是sigmoid函数,其表达式为:σ(x)=1/1+e-x;
同时,通过将xt数据保存到输入门得到当前时刻输入门的状态参数it:
it=σ(Wi·[ht-1,xt]+bi)
其中:Wi是输入门的权重系数矩阵;bi是输入门的偏项;
其中:Wc是长期记忆储存单元的权重系数矩阵;激活函数的表达式为tanh(x)=(ex-e-x)/(ex+e-x);bc是记忆储存单元的偏项;
输出门控制多个ct输出长短期记忆LSTM神经网络的最终输出结果ht,即电能信息测量数据幅值特征分量:
ht=otοtanh(ct)
其中:ot=σ(Wo·[ht-1,xt]+bo);Wo是输出门的权重系数矩阵;bo是输入门的偏项。
利用LSTM网络强大的存储和抗噪功能,通过不断将电能信息流历史数据输入长短期记忆LSTM神经网络,得到LSTM神经网络训练模型,依次循环,迭代获得预测值将电能信息实际测量h0和预测数据用计算残差e,直至所述残差e达到预设值,得到最终的幅值特征分量ht;其中并通过残差值得到预设值来控制后续DBSC聚类模块监测幅值发生异常的电能信息数据。
进一步地,所述第二计算单元利用斜率特征量计算电能信息数据相角特征分量,是利用两相邻采样时刻的相角测量值做差计算其变化率,即相角的角速度,以此作为电能信息数据相角特征分量ω(tn):
进一步地,所述监测单元执行过程如下:
从所述幅值特征分量、相角特征分量组成的数据集中随机选择一个数据作为对象点;
通过检查数据集中每个点的Eps邻域来搜索簇,如果对象点的Eps邻域包含的点多于MinPts,则创建一个以该对象点为核心对象的簇;
如果所选数据对象是边界点,则继续选择另一个数据作为对象点;
重复上述过程,迭代地聚集从这些核心对象,直到遍历所有点,最终识别出电能信息测量值中的正常数据和异常数据,被聚在核心点簇的数据为正常数据,否则为异常数据;
其中:Eps代表不同对象点的半径全局参数;MinPts代表样本点密度全局参数。
本装置通过LSTM神经网络进行训练得到电能信息测量数据幅值特征分量,通过相位变换计算新的相位差序列,计算相角斜率特征量,得到电能信息数据相角特征分量,放大了动态信号量测数据中异常数据与信号本身动态波动间存在的细微差别;本发明利用基于密度空间聚类方法,对计算、训练得到的幅值、相角特征分量进行聚类分析、判别,大大提高了动态条件下监测和筛选异常数据的精度;本发明在幅值、相角发生动态调制的工况下,相较于K-means聚类和谱聚类方法,无论是单个或多个幅值、相角发生数据异常,均具有更高的监测精度,且能够至少抵抗60dB高斯白噪声带来的干扰影响,满足现场实际应用的大部分需求。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (8)
1.一种基于密度空间聚类的信息流异常数据监测方法,其特征在于,该方法包括以下步骤:
S1、实时采集电能信息交互设备上传主站电能量测数据,将电能测量数据分组为幅值量测数据和相角量测数据;
S2、将所述幅值量测数据的幅值序列分为训练集和测试集两类,采用长短期记忆LSTM神经网络,并将所述训练集和测试集分别输入到所述长短期记忆LSTM神经网络进行训练得到映射的神经网络特征,作为电能信息流交互数据幅值特征分量;
S3、对所述相角量测数据的相角序列进行相位变换计算新的相位差序列,计算相角斜率特征量,即角速度特征量,作为电能信息流交互数据相角特征分量;
S4、采用基于密度空间聚类DBSC监测模型,将所述幅值特征分量、相角特征分量分别输入基于密度空间聚类DBSC监测模型,并进行聚类分析以监测电能信息交互设备量测值中的幅值或相角异常数据,并输出监测结果;
步骤S3中利用斜率特征量计算电能信息数据相角特征分量,是利用两相邻采样时刻的相角测量值做差计算其变化率,即相角的角速度,以此作为电能信息数据相角特征分量ω(tn):
步骤S4包括以下子步骤:
S41:从所述幅值特征分量、相角特征分量组成的数据集中随机选择一个数据作为对象点;
S42:通过检查所述数据集中每个点的Eps邻域来搜索簇,如果对象点的Eps邻域包含的点多于MinPts,则该对象点记作核心点,且创建一个以该对象点为核心对象的簇;
S43:如果所选数据对象是边界点,则继续选择另一个数据作为对象点;
S44:重复步骤S41至S43,迭代地聚集这些核心对象,直到遍历所有点,最终识别出电能信息测量值中的正常数据和异常数据,被聚在核心点簇的数据为正常数据,否则为异常数据;
其中:Eps代表不同对象点的半径全局参数;MinPts代表样本点密度全局参数。
2.根据权利要求1所述的一种基于密度空间聚类的信息流异常数据监测方法,其特征在于,步骤S2中所述长短期记忆LSTM神经网络的结构包括遗忘门、输入门、输出门和储存单元,所述遗忘门,用于电能量测数据的训练集数据输入口;所述输入门,用于电能量测数据的测试集数据输入口;所述储存单元,用于LSTM神经网络模型训练过程中的中间数据存储;所述输出门,用于训练和测试结果的输出。
3.根据权利要求2所述的一种基于密度空间聚类的信息流异常数据监测方法,其特征在于,步骤S2中利用长短期记忆LSTM方法计算电能信息交互测量数据幅值特征分量的具体步骤如下:
S21:将前一时刻的电能信息测量数据幅值特征分量ht-1和当前时刻的待训练的输入信号xt输入遗忘门模块,计算得到当前时刻遗忘门的状态参数ft:
ft=σ(Wf·[ht-1,xt]+bf)
其中:Wf是遗忘门的权重系数矩阵;xt是待训练的输入信号,指当前时刻的电压或电流采样数据;ht-1是前一时刻的电能信息测量数据幅值特征分量,bf是遗忘门的偏项,σ是sigmoid函数,其表达式为:σ(x)=1/1+e-x;
同时,通过将xt数据保存到输入门得到当前时刻输入门的状态参数it:
it=σ(Wi·[ht-1,xt]+bi)
其中:Wi是输入门的权重系数矩阵;bi是输入门的偏项;
其中:Wc是长期记忆储存单元的权重系数矩阵;激活函数的表达式为tanh(x)=(ex-e-x)/(ex+e-x);bc是记忆储存单元的偏项;
S24:输出门控制多个ct输出长短期记忆LSTM神经网络的最终输出结果ht,即电能信息测量数据幅值特征分量:
其中:ot=σ(Wo·[ht-1,xt]+bo);Wo是输出门的权重系数矩阵;bo是输入门的偏项;
4.一种基于密度空间聚类的信息流异常数据监测装置,其特征在于,该装置支持如权利要求1至3中任意一项所述的一种基于密度空间聚类的信息流异常数据监测方法,该装置包括:
获取单元,获取实时采集的电能信息交互设备上传主站电能量测数据,并将电能测量数据分组为幅值量测数据和相角量测数据;
第一计算单元,将所述幅值量测数据的幅值序列分为训练集和测试集两类,利用长短期记忆LSTM神经网络计算电能信息交互测量数据幅值特征分量;
第二计算单元,对所述相角量测数据的相角序列进行相位变换计算新的相位差序列,计算相角斜率特征量,即角速度特征量,作为电能信息流交互数据相角特征分量;
监测单元,根据所述幅值特征分量和相角特征分量,采用基于密度空间聚类DBSC监测模型进行聚类分析以监测电能信息交互设备量测值中的幅值或相角异常数据;
输出单元,输出监测单元的监测结果。
5.根据权利要求4所述的一种基于密度空间聚类的信息流异常数据监测装置,其特征在于,所述第一计算单元中的长短期记忆LSTM神经网络结构包括遗忘门、输入门、输出门和储存单元,所述遗忘门,用于电能量测数据的训练集数据输入口;所述输入门,用于电能量测数据的测试集数据输入口;所述储存单元,用于LSTM神经网络模型训练过程中的中间数据存储;所述输出门,用于训练和测试结果的输出。
6.根据权利要求5所述的一种基于密度空间聚类的信息流异常数据监测装置,其特征在于,所述第一计算单元执行过程如下:
将前一时刻的电能信息测量数据幅值特征分量ht-1和当前时刻的待训练的输入信号xt输入遗忘门模块,计算得到当前时刻遗忘门的状态参数ft:
ft=σ(Wf·[ht-1,xt]+bf)
其中:Wf是遗忘门的权重系数矩阵;xt是待训练的输入信号,指当前时刻的电压或电流采样数据;ht-1是前一时刻的电能信息测量数据幅值特征分量,bf是遗忘门的偏项,σ是sigmoid函数,其表达式为:σ(x)=1/1+e-x;
同时,通过将xt数据保存到输入门得到当前时刻输入门的状态参数it:
it=σ(Wi·[ht-1,xt]+bi)
其中:Wi是输入门的权重系数矩阵;bi是输入门的偏项;
其中:Wc是长期记忆储存单元的权重系数矩阵;激活函数的表达式为tanh(x)=(ex-e-x)/(ex+e-x);bc是记忆储存单元的偏项;
输出门控制多个ct输出长短期记忆LSTM神经网络的最终输出结果ht,即电能信息测量数据幅值特征分量:
其中:ot=σ(Wo·[ht-1,xt]+bo);Wo是输出门的权重系数矩阵;bo是输入门的偏项;
8.根据权利要求4所述的一种基于密度空间聚类的信息流异常数据监测装置,其特征在于,所述监测单元执行过程如下:
从所述幅值特征分量、相角特征分量组成的数据集中随机选择一个数据作为对象点;
通过检查数据集中每个点的Eps邻域来搜索簇,如果对象点的Eps邻域包含的点多于MinPts,则创建一个以该对象点为核心对象的簇;
如果所选数据对象是边界点,则继续选择另一个数据作为对象点;
重复上述过程,迭代地聚集这些核心对象,直到遍历所有点,最终识别出电能信息测量值中的正常数据和异常数据,被聚在核心点簇的数据为正常数据,否则为异常数据;
其中:Eps代表不同对象点的半径全局参数;MinPts代表样本点密度全局参数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011418335.7A CN112464848B (zh) | 2020-12-07 | 2020-12-07 | 一种基于密度空间聚类的信息流异常数据监测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011418335.7A CN112464848B (zh) | 2020-12-07 | 2020-12-07 | 一种基于密度空间聚类的信息流异常数据监测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112464848A CN112464848A (zh) | 2021-03-09 |
CN112464848B true CN112464848B (zh) | 2023-04-07 |
Family
ID=74801568
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011418335.7A Active CN112464848B (zh) | 2020-12-07 | 2020-12-07 | 一种基于密度空间聚类的信息流异常数据监测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112464848B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113886118A (zh) * | 2021-09-16 | 2022-01-04 | 杭州安恒信息技术股份有限公司 | 异常资源处理方法、装置、系统、电子装置和存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109345408A (zh) * | 2018-08-23 | 2019-02-15 | 国网江苏省电力有限公司 | 基于长短期记忆网络的异常数据甄别方法 |
CN109698724A (zh) * | 2017-10-24 | 2019-04-30 | 中国移动通信集团安徽有限公司 | 入侵检测方法、装置、设备及存储介质 |
CN110336377A (zh) * | 2019-07-09 | 2019-10-15 | 南京新虹佳电器设备有限公司 | 一种基于云计算的智能配电系统 |
CN110458230A (zh) * | 2019-08-12 | 2019-11-15 | 江苏方天电力技术有限公司 | 一种基于多判据融合的配变用采数据异常甄别方法 |
CN110765454A (zh) * | 2019-10-22 | 2020-02-07 | 深圳大学 | 一种电力系统的运行状态重构方法及终端 |
CN111027058A (zh) * | 2019-11-12 | 2020-04-17 | 深圳供电局有限公司 | 一种电力系统检测数据攻击的方法、计算机设备和存储介质 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2004092549A1 (en) * | 2003-04-15 | 2004-10-28 | Toyota Jidosha Kabushiki Kaisha | Apparatus for abnormal diagnosis of variable valve timing mechanism |
CN104914467B (zh) * | 2015-05-22 | 2018-04-03 | 中国石油天然气股份有限公司 | 提取分类模型道的地震相聚类分析方法 |
CN108181508A (zh) * | 2018-01-10 | 2018-06-19 | 云南电网有限责任公司电力科学研究院 | 一种同步相量测量单元大数据快速处理的方法 |
CN109239739B (zh) * | 2018-08-24 | 2019-09-06 | 中国电子科技集团公司第二十九研究所 | 一种铷原子钟漂移自主故障处理方法 |
CN109322655B (zh) * | 2018-09-05 | 2024-04-09 | 深圳市联恒星科技有限公司 | 一种基于神经网络与双频差分模型的微波含水率检测装置及方法 |
CN110705456A (zh) * | 2019-09-29 | 2020-01-17 | 华南理工大学 | 一种基于迁移学习的微型电机异常检测方法 |
CN111398679B (zh) * | 2020-03-09 | 2021-05-25 | 华北电力大学 | 基于pmu测量相量的次同步振荡识别与告警方法 |
CN111738520A (zh) * | 2020-06-24 | 2020-10-02 | 中国电子科技集团公司第二十八研究所 | 一种融合孤立森林与长短期记忆网络的系统负载预测方法 |
-
2020
- 2020-12-07 CN CN202011418335.7A patent/CN112464848B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109698724A (zh) * | 2017-10-24 | 2019-04-30 | 中国移动通信集团安徽有限公司 | 入侵检测方法、装置、设备及存储介质 |
CN109345408A (zh) * | 2018-08-23 | 2019-02-15 | 国网江苏省电力有限公司 | 基于长短期记忆网络的异常数据甄别方法 |
CN110336377A (zh) * | 2019-07-09 | 2019-10-15 | 南京新虹佳电器设备有限公司 | 一种基于云计算的智能配电系统 |
CN110458230A (zh) * | 2019-08-12 | 2019-11-15 | 江苏方天电力技术有限公司 | 一种基于多判据融合的配变用采数据异常甄别方法 |
CN110765454A (zh) * | 2019-10-22 | 2020-02-07 | 深圳大学 | 一种电力系统的运行状态重构方法及终端 |
CN111027058A (zh) * | 2019-11-12 | 2020-04-17 | 深圳供电局有限公司 | 一种电力系统检测数据攻击的方法、计算机设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112464848A (zh) | 2021-03-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wang et al. | A novel safety assurance method based on the compound equivalent modeling and iterate reduce particle‐adaptive Kalman filtering for the unmanned aerial vehicle lithium ion batteries | |
CN106505557B (zh) | 一种遥测错误辨识方法及装置 | |
CN112051481B (zh) | 一种基于lstm的交直流混联电网故障区域诊断方法和系统 | |
CN108053128B (zh) | 一种基于elm和tf的电网暂态稳定快速评估方法 | |
Darong et al. | Fault diagnosis for the motor drive system of urban transit based on improved Hidden Markov Model | |
CN105676085A (zh) | 基于多传感器信息融合的特高压gis局部放电检测方法 | |
CN105929340B (zh) | 一种基于arima估算电池soc的方法 | |
CN105512962A (zh) | 一种气体绝缘组合电器绝缘状态综合评估方法 | |
CN108680890A (zh) | 智能电能表寿命特征检测方法 | |
CN110542819A (zh) | 一种基于半监督dbnc的变压器故障类型诊断方法 | |
CN117748507B (zh) | 基于高斯回归模型的配网谐波接入不确定性评估方法 | |
CN116467950A (zh) | 一种基于不确定表征的无人机飞行数据异常检测方法 | |
Kong et al. | A remote estimation method of smart meter errors based on neural network filter and generalized damping recursive least square | |
CN112464848B (zh) | 一种基于密度空间聚类的信息流异常数据监测方法及装置 | |
Zhang et al. | Fault location method based on SVM and similarity model matching | |
Wiel et al. | Identification of topology changes in power grids using phasor measurements | |
CN112345972B (zh) | 基于停电事件的配电网线变关系异常诊断方法、装置及系统 | |
Habib et al. | Deep statistical solver for distribution system state estimation | |
CN106646106B (zh) | 基于变点探测技术的电网故障检测方法 | |
CN117526561A (zh) | 基于数字孪生的变电站设备异常监控和预警方法及系统 | |
CN107918704A (zh) | 电荷放大器贮存寿命预测方法、装置、存储介质和计算机设备 | |
CN105741184A (zh) | 一种变压器状态评估方法及装置 | |
Asprou et al. | The effect of instrument transformer accuracy class on the WLS state estimator accuracy | |
CN107132500A (zh) | 一种同步相量测量单元在线校准方法与装置 | |
Wu et al. | Research on a location method for complex voltage sag sources based on random matrix theory |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |