CN112464439A - 基于三层数据挖掘的电力系统故障类型分析方法及装置 - Google Patents

基于三层数据挖掘的电力系统故障类型分析方法及装置 Download PDF

Info

Publication number
CN112464439A
CN112464439A CN202011203187.7A CN202011203187A CN112464439A CN 112464439 A CN112464439 A CN 112464439A CN 202011203187 A CN202011203187 A CN 202011203187A CN 112464439 A CN112464439 A CN 112464439A
Authority
CN
China
Prior art keywords
sample library
original data
data
fault
layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011203187.7A
Other languages
English (en)
Inventor
吴艳娟
王云亮
王小东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin University of Technology
Original Assignee
Tianjin University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin University of Technology filed Critical Tianjin University of Technology
Priority to CN202011203187.7A priority Critical patent/CN112464439A/zh
Publication of CN112464439A publication Critical patent/CN112464439A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2113/00Details relating to the application field
    • G06F2113/04Power grid distribution networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2119/00Details relating to the type or aim of the analysis or the optimisation
    • G06F2119/02Reliability analysis or reliability optimisation; Failure analysis, e.g. worst case scenario performance, failure mode and effects analysis [FMEA]

Abstract

本发明提供了一种基于三层数据挖掘的电力系统故障类型分析方法及装置,包括:S1:获取第一原始数据样本库,原始数据样本库用于建立电力系统故障预测模型,对第一原始数据样本库进行预处理和数据融合以获取第二原始数据样本库;S2:对第二原始数据样本库进行k‑means聚类方法以对第二原始数据样本库进行第一层数据挖掘,并获取第一样本库;S3:对第一样本库通过关联规则进行第二层数据挖掘,并获取第二样本库;S4:基于第二样本库构建电网故障类型预测模型,以判断电网发生的故障类型。通过本发明提供的方法及装置可以为电网故障提供诊断并为故障后补救措施提供依据,提高电力系统的安全性。

Description

基于三层数据挖掘的电力系统故障类型分析方法及装置
技术领域
本发明涉及电力分析的技术领域,尤其是涉及一种基于三层数据挖掘的电力系统故障类型分析方法及装置。
背景技术
随着电力系统的不断扩展,其安全性牵系着整个国民经济的发展,为了保证电力系统的可靠性和稳定性,对即将发生的电力故障,提前预测并做出相应的预防措施,可以有效防止电力事故的发生,减少经济损失。目前电力故障诊断主要还是利用各级继电保护装置进行工作,通过保护装置的运行状态判断电力系统是否发生故障。并且,工作人员通过对电气设备巡视检查,根据实时的电压电流数据和产生报警装置的各项状态,来找出故障位置所在。但继电保护装置只能根据当前的运行状况,决定是否动作,未能考虑电气量之间的相关性,更不能判断出发生的是哪种类型故障,因此也影响了故障后的及时处理。影响工作人员及时采取合适的故障后补救措施,严重的不但不能及时处理故障,还可能引起更严重的电网故障,扩大故障损失范围。
随着数据库系统的广泛应用和网络技术的高速发展,数据挖掘方法的出现,在很大层面上提升了故障诊断的各项性能,提高了故障诊断与预测的精确度。为了对电力故障类型进行正确判断,预防更严重故障的发生,利用大数据知识和机器学习算法,对故障历史数据进行挖掘,找到其相关性和潜在的规律,并且通过训练数据建立预测模型,成为目前一个重要并且很有价值的研究方向。数据挖掘是数据分析的前沿技术,是统计学、数据库技术和人工智能技术的综合。能从各种各样类型的数据中,快速获得有价值的信息。数据挖掘是从大量的、不完备的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中潜在有用的信息和知识,并且寻找其规律的技术。
发明内容
有鉴于此,本发明的目的在于提供了一种基于三层数据挖掘的电力系统故障类型分析方法及装置,为故障提供诊断并为故障后补救措施提供依据,提高电力系统的安全性。
第一方面,本发明提供了一种基于三层数据挖掘的电力系统故障类型分析方法,包括:
S1:获取第一原始数据样本库,所述原始数据样本库用于建立电力系统故障预测模型,对所述第一原始数据样本库进行预处理和数据融合以获取第二原始数据样本库;
S2:对所述第二原始数据样本库进行k-means聚类方法以对第二原始数据样本库进行第一层数据挖掘,并获取第一样本库;
S3:对所述第一样本库通过关联规则进行第二层数据挖掘,并获取第二样本库;
S4:基于第二样本库构建电网故障类型预测模型,以判断电网发生的故障类型。
优选的,所述获取第一原始数据样本库,所述原始数据样本库用于建立电力系统故障预测模型,对所述第一原始数据样本库进行预处理和数据融合以获取第二原始数据样本库的步骤包括;
将所述第一原始数据样本库不同源的数据进行数据融合。
优选的,所述对所述第二原始数据样本库进行k-means聚类方法以对第二原始数据样本库进行第一层数据挖掘,并获取第一样本库的步骤包括:
采用如下公式获取欧几里得距离:
Figure BDA0002756102950000031
X=(x1,x2,...,xn)—n维空间的未被归类的样本;
Yj=(yj 1,yj 2,...,yj n)—第j个簇中心;
构建如下准则函数:
Figure BDA0002756102950000032
Yj ——第j个簇中心;
yj i—Yj中的第i个元素数据;
K—簇的个数,Xj为第j个簇中的任意样本;
xj i—Xj中的第i个元素数据;
采用如下公式获取轮廓系数:
Figure BDA0002756102950000033
αk—簇的内聚度;
bk—簇的内聚度。
优选的,所述S3:对所述第一样本库通过关联规则进行第二层数据挖掘,并获取第二样本库的步骤包括:
将所述第一样本库中的样本进行整合,获取依据支持度、置信度、以及提升度对整合后的第一样本库进行筛选。
优选的,所述步骤基于第二样本库构建电网故障类型预测模型,以判断电网发生的故障类型包括:
建故障类型预测模型满足线性关系:
f(XIIj)=wT(XIIj)+b
w—模型参数向量;
b—截距;
wT(XIIj)—样本组向量XIIj和模型参数向量w的内积;
采用梯度下降法获取故障类型模型的最优解:
采用如下构建SVM型损失函数:
Figure BDA0002756102950000041
其中,E(w,b)—经验风险(即损失函数的期望);
αR(w)—结构风险;
L(Fj,f(XIIj))=log(1+exp(-Fjf(XIIj)))—损失函数
Fj—真实值
正则项R(w)可采用如下形式:
Figure BDA0002756102950000042
优化目标函数如下:
Figure BDA0002756102950000043
按照如下给出的梯度公式更新迭代模型参数:
Figure BDA0002756102950000044
η—是控制参数空间中步长的学习率,且η按如下公式递减:
Figure BDA0002756102950000045
优选的所述步骤基于第二样本库构基于所述第二样本库判断电网发生的故障类型包括的步骤包括:
电网发生的故障类型满足如下模型:
f(a,x)=a1xn+a2xn-1+...+anx+an+1
优化目标函数为求取使下列χ2量最小的系数(a1,a2,...,an)
Figure BDA0002756102950000051
yj—真实值。
第二方面,本发明提供了一种基于三层数据挖掘的电力系统故障类型分析装置,包括:
预处理模块:用于获取第一原始数据样本库,所述原始数据样本库用于建立电力系统故障预测模型,对所述第一原始数据样本库进行预处理和数据融合以获取第二原始数据样本库;
第一数据挖掘模块:用于对所述第二原始数据样本库进行k-means聚类方法以对第二原始数据样本库进行第一层数据挖掘,并获取第一样本库;
第二数据挖掘模块:用于对所述第一样本库通过关联规则进行第二层数据挖掘,并获取第二样本库;
故障判断模块:用于基于第二样本库构建电网故障类型预测模型,以判断电网发生的故障类型。
本发明实施例带来了以下有益效果:本发明提供了一种基于三层数据挖掘的电力系统故障类型分析方法,包括:S1:获取第一原始数据样本库,原始数据样本库用于建立电力系统故障预测模型,对第一原始数据样本库进行预处理和数据融合以获取第二原始数据样本库;S2:对第二原始数据样本库进行k-means聚类方法以对第二原始数据样本库进行第一层数据挖掘,并获取第一样本库;S3:对第一样本库通过关联规则进行第二层数据挖掘,并获取第二样本库;S4:基于第二样本库构建电网故障预测模型,以判断电网发生的故障类型。通过本发明提供的方法及装置可以为故障提供诊断并为故障后补救措施提供依据,提高电力系统的安全性。
本发明的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种基于三层数据挖掘的电力系统故障类型分析方法流程图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
目前,目前电力故障诊断主要还是利用各级继电保护装置进行工作,通过保护装置的运行状态判断电力系统是否发生故障。并且,工作人员通过对电气设备巡视检查,根据实时的电压电流数据和产生报警装置的各项状态,来找出故障位置所在。但继电保护装置只能根据当前的运行状况,决定是否动作,未能考虑电气量之间的相关性,更不能判断出发生的是哪种类型故障,因此也影响了故障后的及时处理。影响工作人员及时采取合适的故障后补救措施,严重的不但不能及时处理故障,还可能引起更严重的电网故障,扩大故障损失范围,基于此,本发明实施例提供的一种基于三层数据挖掘的电力系统故障类型分析方法及装置,可以为故障提供诊断并为故障后补救措施提供依据,提高电力系统的安全性。
为便于对本实施例进行理解,首先对本发明实施例所公开的一种基于三层数据挖掘的电力系统故障类型分析方法进行详细介绍。
实施例一:
本发明实施例一提供了一种基于三层数据挖掘的电力系统故障类型分析方法,包括:
S1:获取第一原始数据样本库,所述原始数据样本库用于建立电力系统故障预测模型,对所述第一原始数据样本库进行预处理和数据融合以获取第二原始数据样本库;
具体的,通过上述数据收集、数据预处理和数据融合完成后,提取出来源数据样本库形式如下:{X,F},其中,X={X1,X2,...,Xi,...}为源样本库中除故障信息外的数据样本,F={F1,F2,...,Fi,...}为故障信息样本。将Fi定义为训练时每组样本的故障类型标签,本发明以电力系统最常发生的短路故障作为实施例,但不局限于此,则当F1=1表示单相短路故障,F2=2表示两相相间短路故障,F3=3表示两相接地短路故障,F4=4表示三相短路故障,F5=5表示单相断路故障,F6=6表示两相断路故障等。
S2:对所述第二原始数据样本库进行k-means聚类方法以对第二原始数据样本库进行第一层数据挖掘,并获取第一样本库;
具体的,第一层数据挖掘是对收集到源数据样本库中的故障数据{X}进行分类处理,对电力系统故障数据进行收集和预处理后,进行第一层数据挖掘,对源数据进行分类或聚类,对源数据分类或聚类的目的是将源数据分成相互有明显区分的多个簇。分类需要解决以下几个问题:(1)分类方法;(2)怎样判断分类结束;(3)分簇数目怎样确定。数据分类和聚类方法有多种,本发明以k-means聚类方法为实施例通过解决上述问题说明第一层数据挖掘的分类方法,其他分类方法也在该发明方法保护范围:
S3:对所述第一样本库通过关联规则进行第二层数据挖掘,并获取第二样本库;
为了提高故障类型判断与预测的精确性,需要将与各故障相关性强的数据挖掘出来,本发明中采用关联规则对所述3.1聚类后的数据样本进行第二层数据挖掘。以挖掘频繁项集的关联规则算法为实施例,其他关联规则方法也在本发明保护范围之内,挖掘方法及规则如下:
3.2.1以挖掘频繁项集的关联规则算法为实施例的第二层数据挖掘处理方法
把第二原始数据样本库中的XI中的元素和F合并为一个整体样本库M:{Z1,Z2,...,Zi},把样本库M的每行样本作为一个样本组,通过频繁项集的关联规则来找出样本组中两两样本或者多个样本之间存在的关联性。通过计算支持度,置信度和提升度三个指标衡量样本之间的关联程度,筛选出满足支持度、置信度和提升度要求的非空集合。
(1)支持度
支持度表示样本组中Zx和Zy同时出现的概率。
(2)置信度
置信度表示样本组Zx出现时,Zy同时出现的概率。
(3)提升度
提升度表示样本组Zx出现时,Zy同时出现的概率与Zy出现的概率之比。基于关联规则的第二层挖掘规则如下:
1)首先设置最小支持度和置信度,扫描样本库M找到所有的N阶频繁项集(其中,N从1开始递增)。
2)在N阶频繁项集的基础上通过连接和剪枝找到N+1阶候选项集(其中,N+1=(2,3,,,)。
3)扫描样本库M并找出N+1阶候选项集中所有大于最小支持度的非空集合作为N+1阶频繁项集。
4)如果N+1阶频繁项集为空集,则计算所有阶频繁项集组成的规则的置信度,提升度,找出满足最小置信度和提升度大于1的规则作为强关联规则。若为非空集,则返回2)继续寻找更高阶的频繁项集。
满足强关联规则的样本组构成关联库,把和故障类型Fi相关的样本组都提取出来,按照故障类型把样本分类整理出来,记为样本库Ⅱ:{XIIj,Fj}。其中,Fj代表第j个故障类型,XIIj是对应于第j个故障类型Fj的强相关样本集。
S4:基于第二样本库构建电网故障类型预测模型,以判断电网发生的故障类型。
优选的,所述获取第一原始数据样本库,所述原始数据样本库用于建立电力系统故障预测模型,对所述第一原始数据样本库进行预处理和数据融合以获取第二原始数据样本库的步骤包括;
将所述第一原始数据样本库不同源的数据进行数据融合。
进一步的,将目前电力系统已经发展或正在发展的数据采集系统作为获取电力系统故障原始数据的数据源:如(1)物联网技术实时采集系统和数据库系统;(2)电力网信息系统如SCANDA;(3)实际运行系统的仿真运行数据;(4)天气情况数据;(5)市政建设工程情况数据;(5)交通信息数据信息等。
收集上述不同源数据时需要进行数据校验、数据纠错、数据过滤、缺失数据补充等数据预处理。例如奇偶校验、冗余纠错、阈值过滤和加权平均值补充等方法。
对上述收集的不同源数据进行相同属性的数据融合,按照电力系统故障类型诊断与预测目的,按照数据格式、系统归属、时间、位置(如节点和支路等)、故障类型等属性相同的方法对收集的不同源数据进行数据融合,获得原始数据样本库。
在本发明提供的实施例中,为了获得第一次数据挖掘的K-means聚类最优分簇数,采用计算不同分簇数聚类的轮廓系数方法,并通过比较这些轮廓系数,找到轮廓系数最大的分簇数作为最优分簇数。对于簇的每个样本,轮廓系数计算方法如下:对于其中一个样本X:(1)首先计算簇的内聚度αk。(X到所有它属于的簇中其他点的平均距离)(2)计算簇与其它簇之间的分离度bk。(X到各个非本身所在簇的所有点的平均距离)(3)计算轮廓系数Si。即αk和bk的差,除以两者中较大的那一个。
优选的:所述对所述第二原始数据样本库进行k-means聚类方法以对第二原始数据样本库进行第一层数据挖掘,并获取第一样本库的步骤包括:
采用如下公式获取欧几里得距离:
Figure BDA0002756102950000101
X=(x1,x2,...,xn)—n维空间的未被归类的样本;
Yj=(yj 1,yj 2,...,yj n)—第j个簇中心;
构建如下准则函数:
Figure BDA0002756102950000102
Yj ——第j个簇中心;
yj i—Yj中的第i个元素数据;
K—簇的个数,Xj为第j个簇中的任意样本;
xj i—Xj中的第i个元素数据;
采用如下公式获取轮廓系数:
Figure BDA0002756102950000111
αk—簇的内聚度;
bk—簇的内聚度。
优选的,所述S3:对所述第一样本库通过关联规则进行第二层数据挖掘,并获取第二样本库的步骤包括:
将所述第一样本库中的样本进行整合,获取依据支持度、置信度、以及提升度对整合后的第一样本库进行筛选。
实施例二:
本发明实施例二对所述步骤基于第二样本库构建电网故障类型预测模型,以判断电网发生的故障的步骤进行了阐述:
具体的,故障类型预测模型满足线性关系:
f(XIIj)=wT(XIIj)+b
w—模型参数向量;
b—截距;
wT(XIIj)—样本组向量XIIj和模型参数向量w的内积;
采用梯度下降法获取故障类型模型的最优解:
采用如下构建SVM型损失函数:
Figure BDA0002756102950000112
其中,E(w,b)—经验风险(即损失函数的期望);
αR(w)—结构风险;
L(Fj,f(XIIj))=log(1+exp(-Fjf(XIIj)))—损失函数
Fj—真实值
正则项R(w)可采用如下形式:
Figure BDA0002756102950000113
优化目标函数如下:
Figure BDA0002756102950000121
按照如下给出的梯度公式更新迭代模型参数:
Figure BDA0002756102950000122
η—是控制参数空间中步长的学习率,且η按如下公式递减:
Figure BDA0002756102950000123
实施例三:
本发明实施三对所述步骤基于第二样本库构建电网故障类型预测模型,以判断电网发生的故障类型的另一种实施方式进行了阐述,具体的:
电网发生的故障类型满足如下预测模型:
f(a,x)=a1xn+a2xn-1+...+anx+an+1
5.2在非线性预测模型(4-2),优化目标函数为求取使下列χ2量最小的系数(a1,a2,...,an)
Figure BDA0002756102950000124
yj---真实值。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
另外,在本发明实施例的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (7)

1.一种基于三层数据挖掘的电力系统故障类型分析方法,其特征在于,包括:
S1:获取第一原始数据样本库,所述原始数据样本库用于建立电力系统故障预测模型,对所述第一原始数据样本库进行预处理和数据融合以获取第二原始数据样本库;
S2:对所述第二原始数据样本库进行k-means聚类方法以对第二原始数据样本库进行第一层数据挖掘,并获取第一样本库;
S3:对所述第一样本库通过关联规则进行第二层数据挖掘,并获取第二样本库;
S4:基于第二样本库构建电网故障预测模型,以判断电网发生的故障类型。
2.根据权利要求1所述的方法,其特征在于:所述获取第一原始数据样本库,所述原始数据样本库用于建立电力系统故障预测模型,对所述第一原始数据样本库进行预处理和数据融合以获取第二原始数据样本库的步骤包括;
将所述第一原始数据样本库不同源的数据进行预处理和数据融合。
3.根据权利要求1所述的方法,其特征在于:所述对所述第二原始数据样本库进行k-means聚类方法以对第二原始数据样本库进行第一层数据挖掘,并获取第一样本库的步骤包括:
采用如下公式获取欧几里得距离:
Figure FDA0002756102940000011
X=(x1,x2,...,xn)—n维空间的未被归类的样本;
Yj=(yj 1,yj 2,...,yj n)—第j个簇中心;
构建如下准则函数:
Figure FDA0002756102940000021
Yj——第j个簇中心;
yj i—Yj中的第i个元素数据;
K—簇的个数,Xj为第j个簇中的任意样本;
xj i—Xj中的第i个元素数据;
采用如下公式获取轮廓系数:
Figure FDA0002756102940000022
αk—簇的内聚度;
bk—簇的内聚度。
4.根据权利要求1所述的方法,其特征在于,所述S3:对所述第一样本库通过关联规则进行第二层数据挖掘,并获取第二样本库的步骤包括:
将所述第一样本库中的样本进行整合,获取依据支持度、置信度、以及提升度对整合后的第一样本库进行筛选。
5.根据权利要求1所述的方法,其特征在于,所述步骤基于第二样本库构建电网故障类型预测模型,以判断电网发生的故障类型包括:
建故障类型预测模型满足线性关系:
f(XIIj)=wT(XIIj)+b
w—模型参数向量;
b—截距;
wT(XIIj)—样本组向量XIIj和模型参数向量w的内积;
采用梯度下降法获取故障类型模型的最优解:
采用如下构建SVM型损失函数:
Figure FDA0002756102940000031
其中,E(w,b)—经验风险(即损失函数的期望);
αR(w)—结构风险;
L(Fj,f(XIIj))=log(1+exp(-Fjf(XIIj)))—损失函数
Fj—真实值
正则项R(w)可采用如下形式:
Figure FDA0002756102940000032
优化目标函数如下:
Figure FDA0002756102940000033
按照如下给出的梯度公式更新迭代模型参数:
Figure FDA0002756102940000034
η—是控制参数空间中步长的学习率,且η按如下公式递减:
Figure FDA0002756102940000035
6.根据权利要求4所述的方法,其特征在于,所述步骤基于第二样本库构建电网故障类型预测模型,以判断电网发生的故障类型包括的步骤包括:
电网发生的故障类型满足如下预测模型:
f(a,x)=a1xn+a2xn-1+...+anx+an+1
优化目标函数为求取使下列χ2量最小的系数(a1,a2,...,an)
Figure FDA0002756102940000041
yj—真实值。
7.一种基于三层数据挖掘的电力系统故障类型分析装置,其特征在于,包括:
预处理模块:用于获取第一原始数据样本库,所述原始数据样本库用于建立电力系统故障预测模型,对所述第一原始数据样本库进行预处理和数据融合以获取第二原始数据样本库;
第一数据挖掘模块:用于对所述第二原始数据样本库进行k-means聚类方法以对第二原始数据样本库进行第一层数据挖掘,并获取第一样本库;
第二数据挖掘模块:用于对所述第一样本库通过关联规则进行第二层数据挖掘,并获取第二样本库;
故障类型判断模块:用于基于第二样本库构建电网故障类型预测模型,以判断电网发生的故障类型。
CN202011203187.7A 2020-11-02 2020-11-02 基于三层数据挖掘的电力系统故障类型分析方法及装置 Pending CN112464439A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011203187.7A CN112464439A (zh) 2020-11-02 2020-11-02 基于三层数据挖掘的电力系统故障类型分析方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011203187.7A CN112464439A (zh) 2020-11-02 2020-11-02 基于三层数据挖掘的电力系统故障类型分析方法及装置

Publications (1)

Publication Number Publication Date
CN112464439A true CN112464439A (zh) 2021-03-09

Family

ID=74834975

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011203187.7A Pending CN112464439A (zh) 2020-11-02 2020-11-02 基于三层数据挖掘的电力系统故障类型分析方法及装置

Country Status (1)

Country Link
CN (1) CN112464439A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113589098A (zh) * 2021-07-12 2021-11-02 国网河南省电力公司灵宝市供电公司 基于大数据驱动的电网故障预测和诊断方法
CN114397842A (zh) * 2022-01-04 2022-04-26 中国南方电网有限责任公司超高压输电公司南宁监控中心 电力监控网络安全智能巡检加固方法
JP7240691B1 (ja) 2021-09-08 2023-03-16 山東大学 データドライブの能動配電網異常状態検知方法及びシステム
CN117572159A (zh) * 2024-01-17 2024-02-20 成都英华科技有限公司 基于大数据分析的电力故障检测方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103996077A (zh) * 2014-05-22 2014-08-20 中国南方电网有限责任公司电网技术研究中心 一种基于多维时间序列的电气设备故障预测方法
CN104020396A (zh) * 2014-06-12 2014-09-03 国家电网公司 一种基于数据挖掘的电网故障诊断方法
CN105372557A (zh) * 2015-12-03 2016-03-02 国家电网公司 基于关联规则的电网资源故障诊断方法
CN109739209A (zh) * 2018-12-11 2019-05-10 深圳供电局有限公司 一种基于分类数据挖掘的电网故障诊断方法
CN111695301A (zh) * 2020-06-16 2020-09-22 中国科学院深圳先进技术研究院 电池电荷状态的预测方法及预测装置、存储介质、设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103996077A (zh) * 2014-05-22 2014-08-20 中国南方电网有限责任公司电网技术研究中心 一种基于多维时间序列的电气设备故障预测方法
CN104020396A (zh) * 2014-06-12 2014-09-03 国家电网公司 一种基于数据挖掘的电网故障诊断方法
CN105372557A (zh) * 2015-12-03 2016-03-02 国家电网公司 基于关联规则的电网资源故障诊断方法
CN109739209A (zh) * 2018-12-11 2019-05-10 深圳供电局有限公司 一种基于分类数据挖掘的电网故障诊断方法
CN111695301A (zh) * 2020-06-16 2020-09-22 中国科学院深圳先进技术研究院 电池电荷状态的预测方法及预测装置、存储介质、设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王云亮等: "Power_System_Fault_Classification_and_Prediction_Based_on_a_Three-Layer_Data_Mining_Structure", 《IEEE ACCESS》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113589098A (zh) * 2021-07-12 2021-11-02 国网河南省电力公司灵宝市供电公司 基于大数据驱动的电网故障预测和诊断方法
JP7240691B1 (ja) 2021-09-08 2023-03-16 山東大学 データドライブの能動配電網異常状態検知方法及びシステム
JP2023042527A (ja) * 2021-09-08 2023-03-27 山東大学 データドライブの能動配電網異常状態検知方法及びシステム
CN114397842A (zh) * 2022-01-04 2022-04-26 中国南方电网有限责任公司超高压输电公司南宁监控中心 电力监控网络安全智能巡检加固方法
CN117572159A (zh) * 2024-01-17 2024-02-20 成都英华科技有限公司 基于大数据分析的电力故障检测方法及系统
CN117572159B (zh) * 2024-01-17 2024-03-26 成都英华科技有限公司 基于大数据分析的电力故障检测方法及系统

Similar Documents

Publication Publication Date Title
CN112464439A (zh) 基于三层数据挖掘的电力系统故障类型分析方法及装置
CN108564254B (zh) 基于大数据的配电设备状态可视化平台
CN106779505B (zh) 一种基于大数据驱动的输电线路故障预警方法及系统
CN105467975B (zh) 一种设备故障诊断方法
CN113496262B (zh) 数据驱动的有源配电网异常状态感知方法及系统
CN111768082A (zh) 一种基于大数据分析的电力设备状态评估方法
CN111368890A (zh) 故障检测方法及装置、信息物理融合系统
CN109816031B (zh) 一种基于数据不均衡度量的变压器状态评估聚类分析方法
CN109753591A (zh) 业务流程预测性监控方法
CN112528519A (zh) 发动机质量预警服务的方法、系统、可读介质和电子设备
CN115099335A (zh) 多源异构数据的异常辨识和特征筛选方法、系统
CN113762329A (zh) 一种大型轧机状态预测模型的构建方法及构建系统
CN109389325B (zh) 基于小波神经网络的变电站电子式互感器状态评估方法
CN114201374A (zh) 基于混合机器学习的运维时序数据异常检测方法及系统
CN115454778A (zh) 大规模云网络环境下的时序指标异常智能监控系统
CN114254818A (zh) 一种基于风险评估模型的低压配电网连锁故障预警方法
CN111325410B (zh) 基于样本分布的通用故障预警系统及其预警方法
CN108459933B (zh) 一种基于深度递归网络的大数据计算机系统故障检测方法
CN112949874B (zh) 一种配电终端缺陷特征自诊断方法及系统
CN111737993B (zh) 一种配电网设备的故障缺陷文本提取设备健康状态方法
CN116468426A (zh) 基于Apriori算法的电网故障确定方法及存储介质
CN110956281A (zh) 一种基于Log分析的电力设备异常检测报警系统
CN110837953A (zh) 一种自动化异常实体定位分析方法
CN114597886A (zh) 基于区间二型模糊聚类分析的配电网运行状态评估方法
Mbuli et al. Root causes analysis and fault prediction in intelligent transportation systems: coupling unsupervised and supervised learning techniques

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination