CN112183656B - 一种电网故障中scada数据频繁项集挖掘方法 - Google Patents

一种电网故障中scada数据频繁项集挖掘方法 Download PDF

Info

Publication number
CN112183656B
CN112183656B CN202011087278.9A CN202011087278A CN112183656B CN 112183656 B CN112183656 B CN 112183656B CN 202011087278 A CN202011087278 A CN 202011087278A CN 112183656 B CN112183656 B CN 112183656B
Authority
CN
China
Prior art keywords
data
power grid
scada data
event
fault
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011087278.9A
Other languages
English (en)
Other versions
CN112183656A (zh
Inventor
马晓磊
庄红山
李永光
张彦军
刘冉
马丽亚
汪凯威
高子文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
State Grid Xinjiang Electric Power Co Ltd
Original Assignee
State Grid Corp of China SGCC
State Grid Xinjiang Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, State Grid Xinjiang Electric Power Co Ltd filed Critical State Grid Corp of China SGCC
Priority to CN202011087278.9A priority Critical patent/CN112183656B/zh
Publication of CN112183656A publication Critical patent/CN112183656A/zh
Application granted granted Critical
Publication of CN112183656B publication Critical patent/CN112183656B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Probability & Statistics with Applications (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Supply And Distribution Of Alternating Current (AREA)

Abstract

本发明公开了一种电网故障中SCADA数据频繁项集挖掘方法,包括以下步骤:首先采集并整理电网故障的SCADA数据,对采集到的SCADA数据进行分类,将同一个变电站的SCADA数据划分到一起;然后对分类完成的SCADA数据按照时间进行排列,并根据时序进行事件折叠窗口的划分,将独立的SCADA数据划分为几个一组的事件;再将划分后的事件的属性进行离散化处理;最后,使用FP‑growth算法对按事件折叠窗口进行划分的SCADA数据进行频繁项集的挖掘,并对频繁项集进行关联性分析,找出潜在的关联性,从而有助于调度人员找出电力系统的故障原因。

Description

一种电网故障中SCADA数据频繁项集挖掘方法
技术领域
本发明属于电网故障诊断技术,具体涉及一种电网故障中SCADA数据频繁项集挖掘方法。
背景技术
电力系统的故障诊断是实现电网自我修复和迭代的重要方法。电网的故障诊断通常是利用故障前后的电气量信息、开关量信息和保护动作信息的变化来发现故障原因和完成故障定位的。准确的故障识别能够大幅的提高故障的诊断速度,同时降低故障损失。目前在故障诊断领域常见的故障诊断方法运用故障历史数据加之一定的机器学习或深度学习算法,如专家系统、贝叶斯网络、Petri网、粗糙集理论、人工神经网络等。这些算法往往对故障数据的要求较高,故障数据的稍微变化会对整个诊断的结果产生重要的影响。
随着5G时代的到来和智能电网的加速推进,一方面,太阳能及风能等间歇式能源的接入使得电网复杂度不断增加;另一方面,智能电表的大量部署、故障录波信息网的建设与应用使得信息的获取渠道更为多元。这些都导致信息管理侧的数据更加的复杂及庞大,因此当电网发生故障时,调度中心的调度人员面对的是多达数万条甚至数十万条的数据,对这些数据的使用需要进行逻辑关联及属性设定,这就要求调度人员掌握电网运行特点和基本的保护原理,工作量异常大并且琐碎。因此本发明提出了使用FP-growth算法对SCADA数据进行频繁项集的挖掘,并找出数据潜在的关联性,从而提高辅助分析决策的能力。
发明内容
发明目的:针对电网故障时大量数据涌入电网调度平台,调度人员难以及时处理大量数据并对故障及时做出诊断和处理的问题,本发明的提供一种电网故障中SCADA数据频繁项集挖掘方法。
技术方案:一种电网故障中SCADA数据频繁项集挖掘方法,所述方法基于FP-growth算法,包括以下步骤:
(1)采集电网故障的SCADA数据,包括电网故障设备信息、故障时间点和设备运行数据;
(2)对SCADA数据进行预处理和分类,基于故障数据文本的相似度计算进行数据的删除,包括去重、异常值过滤和数据重组,并将处理完的SCADA数据以变电站进行数据分类;
(3)将分类处理后的SCADA数据按照时间进行排序,并确定事件折叠窗口的时间度,并根据事件窗口将排序好的SCADA数据进行事件的划分,将同属于一个事件折叠窗口的SCADA数据化分为同一个事件;
(4)将经过划分后的独立事件的属性进行离散化处理,同时将相同的电网设备贴上相同的标识,然后将离散化后的属性与电网标识相结合构成简化后的数据项;
(5)基于FP-growth算法对事件集进行频繁项集挖掘,包括设定支持度和设定置信度,并构建FP-tree,所述频繁项集为支持度大于等于最小支持度的集合;
(6)将步骤(5)得到的频繁项集进行语义转化,将离散化和模糊化的独立事件转化描述成具体的对应的变电站和遥测事件信息,确定电网各故障事件之间的相互关联关系,从而分析出故障发生后可能发生的潜在电网故障事件。
进一步的,步骤(1)所述的电网故障设备包括变电站名称、故障设备名称;所述的故障时间点指的是故障发生的具体的年月日及时分秒;所述的设备运行数据包括设备故障类型、遥测值、越线极值及越线时间。
步骤(2)所述的判断数据相似度以删除重复数据的方法是:将SCADA数据遥信信息按时序排列方式输入文本相似度计算模型,其计算表达式如下:
上式中,N(A,B)表示字符串A,B之间的最长公共子串长度;L(A)和L(B)分别表示字符串A和B的长度。
当2条信息长度一致且文本相似度为1时,删除1条数据。步骤(2)所述的数据分类是通过将上述数据处理后的数据,与变电站信息词库进行匹配,以此将数据按照变电站进行分类。
步骤(3)所述的事件折叠窗口的时间度设置为1小时,并通过事件折叠窗口对有序的SCADA数据进行事务集的划分,将属于同一事件窗口的SCADA数据称作一个事件,事件中的每个SCADA数据称作项。
步骤(4)中所述的数据属性离散化处理,是通过使用K-means算法对属性遥测值、越限极值和越线时间进行聚类处理,设置聚类中心的数目为3。优选处理,对于遥测值和越线极值将聚类中心值最小的称为“低”,最大的称为“高”,中间值称为“中”;对于越线时间将聚类中心值最小的称为“短”,最大的称为“长”,中间值称为“中”。然后将模糊化的属性与电网设备的简化字母结合组成简化的数据项,以此便于后续的处理。
步骤(5)中所述的支持度表达式为:
其中N代表事务集的总数,∑(X,Y)代表包含{X,Y}的事务集的个数。置信度表达式为:
其中∑(X)代表包含{X}项的事务集的个数。并将支持度和置信度阈值设为0.5,通过扫描事务集并根据支持度和置信度来构建FP-tree,然后确定频繁项集和特征指标集。具体如下:
(51)先扫描一遍事务集,得到项数为1的包含属性的项目集,删除小于支持度的1项目集,同时删除原始事务集中的对应的项,然后将1项目集进行降序排列,并将原始事务集的每个事务中的项进行按1项目集的次数降序排列;
(52)再次扫描原始事务集,每扫描一条事务就将该事务中的每个项以结点的形式添加到以null为头结点的FP树中,并记录每个项的出现的次数,如果该项没有在FP树中出现则新创建节点,如果已出现则将该结点次数加1;
(53)根据(52)构建的FP树,从叶子节点向上找到条件模式基,以所查找的项为结尾的路径集合;
(54)每一条路径就是一条前缀路径,根据条件模式基找出后续项目集,并删除不满足支持度和置信度的项目集,得到频繁项集。
步骤(6)中对频繁项集的语义转化和分析,将根据步骤(5)中对SCADA数据的精简过程的反向过程,对频繁项集进行语义的填补,转化为具体的变电站的各故障事件,从而确定某故障发生后,可能发生的潜在故障事件,以此来帮助调度人员提前做好应对准备。
有益效果:与现有的Apriori算法多次扫描数据库,每次利用候选频繁集产生频繁项集,本发明所述方法中FP-growth则利用树形结构,无需产生候选项集而是直接得到频繁项集,大大减少了访问数据库的次数,从而提高了算法的效率,而面对电网大量的数据,提高执行效率有利于调度人员快速做出决策,避免更大的损失。
附图说明
图1为本发明所述的FP-growth算法的流程图。
具体实施方式
为详细的说明本发明所公开的技术方案,下面结合说明书附图和具体实施例做进一步的阐述。
本发明所提供的一种电网故障中SCADA数据频繁项集挖掘方法,其实施流程如图1所示,所述方法基于FP-growth算法,包括以下步骤:
(1)采集电网故障的SCADA数据,包括电网故障设备信息、日期时间说明和设备运行数据;
(2)对步骤(1)采集的电网故障数据进行预处理,主要通过计算文本相似度来对重复性的数据进行删减,并将处理完的数据进行分类;
(3)将步骤(2)中经分类处理后的数据按照时间进行排序,并确定事件折叠窗口的时间度,并根据事件窗口将排序好的SCADA数据进行事件的划分,将同属于一个事件折叠窗口的SCADA数据化分为同一个事件;
(4)将步骤(3)中划分后的独立事件的属性进行离散化处理,同时将相同的电网设备使用相同的简化字母进行标识,然后将离散化后的属性与电网标识字母相结合构成了简化后的数据项;
(5)利用FP-growth算法对事件集进行频繁项集的挖掘,包括设定支持度和设定置信度,并构建FP-tree(频繁模式树),所述频繁项集为支持度大于等于最小支持度的集合;
(6)将步骤(5)得到的频繁项集进行语义转化,将离散化和模糊化的独立事件转化描述成具体的对应的变电站和遥测事件信息,因此可以通过转化后的描述信息来确定,电网各故障事件之间的相互关联关系,从而分析出某故障发生后,可能发生的潜在的故障事件,以此来帮助调度人员提前做好应对准备。
具体以某地区2020年5月份SCADA系统的遥测信息数据记录表,共6个属性,3159条信息。作为示例,表1只列了前几项数据。该数据记录表中包含了连续量、开关量和事件信息,使用数据库SQL Server 2000进行管理。通过数据挖掘来确定故障发生的原因,为加快事故的分析处理和设备维修提供依据。
步骤1、完成数据的电网故障SCADA数据及变电站等设备数据的收集处理。
经由电网调度系统采集的电网SCADA数据,包括电网故障设备、电网数据采集日期时间和设备运行数据。作为示例,下面仅例举了前几项数据,如表1所示。
表1.SCADA数据事务集
步骤2、进行数据预处理,完成文本相似度计算,数据的去重、简化以及分类处理。
判断数据相似度以删除重复数据的方法是:将SCADA数据遥信信息按时序排列方式输入文本相似度计算模型:
当2条信息长度一致且文本相似度为1时,删除1条数据。上式中,N(A,B)表示字符串A,B之间的最长公共子串长度;L(A)和L(B)分别表示字符串A和B的长度;数据分类是通过,将上述数据处理后的数据,与变电站信息词库进行匹配,以此将数据按照变电站进行分类。
表2.分类后数据
步骤3、划分事件窗口
事件折叠窗口的时间度设置为1小时,并通过事件折叠窗口对有序的SCADA数据进行事务集的划分,将属于同一事件窗口的SCADA数据称作一个事件,事件中的每个SCADA数据称作项。
当一组事件发生在一个指定的时间段内,就可以被认为发生在一个相同的事件折叠窗口,以此减少数据的记录条数,时间度的确定主要依靠电网故障处理的经验,根据事件窗口将排序好的SCADA数据进行事件的划分,将同属于一个事件折叠窗口的SCADA数据化分为同一个事件。
步骤4、数据属性离散化处理
数据属性离散化处理,是通过使用K-means算法对属性遥测值、越限极值和越线时间进行聚类处理,设置聚类中心的数目为3。为了便于处理,对于遥测值和越线极值将聚类中心值最小的称为“低”,最大的称为“高”,中间值称为“中”;对于越线时间将聚类中心值最小的称为“短”,最大的称为“长”,中间值称为“中”。然后将模糊化的属性与电网设备的简化字母结合组成简化的数据项,以此便于后续的处理。
表3.简化数据表
例如,属性遥测值和越限极值将值低于3000的归为低、将值为3000-10000的归为中、将超过10000的值归为高;而对于越线时间而言将低于100000的归为短、将100000-1000000的归为中、将超过1000000的归为长。由此就将数据属性离散化了,之后将离散化后的属性与设备名称一起称为一个事件。
步骤5、完成FP-tree的构建
构建FP-tree需要对数据事务集进行扫描,将扫描结果中满足支持度和置信度的事务建立表格,然后扫描表来建立FP-tree。其中所述的支持度表达式为:
其中N代表事务集的总数,∑(X,Y)代表包含{X,Y}的事务集的个数。置信度表达式为:
其中∑(X)代表包含{X}项的事务集的个数。并将支持度和置信度阈值设为0.5,根据FP-tree来确定特征指标集。
步骤6、分析关联性
对频繁项集的语义转化和分析,将根据步骤(5)中对SCADA数据的精简过程的反向过程,对频繁项集进行语义的填补,转化为具体的变电站的各故障事件,从而确定某故障发生后,可能发生的潜在故障事件,以此来帮助调度人员提前做好应对准备。
表4.挖掘结果
表4中给出了使用FP-growth算法挖掘SCADA数据频繁项集的最终结果,表中可以看出,对于支持度和置信度满足要求的项集都作为算法的输出结果,对于表中的数据A(extreme为“高”,keepTime为“长”)=>B(extreme为“低”,keepTime为“短”),可解释为:在1号主变有功功率越线,并且越线的极值较高,保持时间很长时,将会导致211馈线短期的电流越线。

Claims (7)

1.一种电网故障中SCADA数据频繁项集挖掘方法,所述方法基于FP-growth算法,其特征在于:包括以下步骤:
(1)采集电网故障的SCADA数据,包括电网故障设备信息、故障时间点和设备运行数据;
(2)对SCADA数据进行预处理和分类,基于故障数据文本的相似度计算进行数据的删除,包括去重、异常值过滤和数据重组,并将处理完的SCADA数据以变电站进行数据分类;
(3)将分类处理后的SCADA数据按照时间进行排序,并确定事件折叠窗口的时间度,并根据事件窗口将排序好的SCADA数据进行事件的划分,将同属于一个事件折叠窗口的SCADA数据化分为同一个事件;
(4)将经过划分后的独立事件的属性进行离散化处理,同时将相同的电网设备贴上相同的标识,然后将离散化后的属性与电网标识相结合构成简化后的数据项;
(5)基于FP-growth算法对事件集进行频繁项集挖掘,包括设定支持度和设定置信度,并构建FP-tree,所述频繁项集为支持度大于等于最小支持度的集合;
所述的支持度表达式为:
其中N代表事务集的总数,∑(X,Y)代表包含{X,Y}的事务集的个数;
置信度表达式如下:
其中∑(X)代表包含{X}项的事务集的个数,并将支持度和置信度阈值设为0.5,通过扫描事务集并根据支持度和置信度来构建FP-tree,然后确定频繁项集和特征指标集;
具体还包括如下过程:
(51)先扫描一遍事务集,得到项数为1的包含属性的项目集,且删除小于所述支持度的项目集,同时删除原始事务集中的对应的项,然后将该项目集进行降序排列,并将原始事务集的每个事务中的项进行按该项目集的次数降序排列;
(52)再次扫描原始事务集,每扫描一条事务就将该事务中的每个项以结点的形式添加到以null为头结点的FP树中,并记录每个项的出现的次数,如果该项没有在FP树中出现则新创建节点,如果已出现则将该结点次数加1;
(53)根据(52)构建的FP树,从叶子节点向上找到条件模式基,以所查找的项为结尾的路径集合;
(54)每一条路径就是一条前缀路径,根据条件模式基找出后续项目集,并删除不满足支持度和置信度的项目集,得到频繁项集;
(6)将步骤(5)得到的频繁项集进行语义转化,将离散化和模糊化的独立事件转化描述成具体的对应的变电站和遥测事件信息,确定电网各故障事件之间的关联性,从而分析出故障发生后可能发生的潜在电网故障事件。
2.根据权利要求1所述的电网故障中SCADA数据频繁项集挖掘方法,其特征在于:步骤(1)所述的电网故障设备信息包括变电站名称、故障设备名称;所述的设备运行数据包括设备故障类型、遥测值、越线极值及越线时间。
3.根据权利要求1所述的电网故障中SCADA数据频繁项集挖掘方法,其特征在于:步骤(2)中将SCADA数据遥信信息按时序排列方式输入文本相似度计算模型,计算表达式如下:
上式中,N(A,B)表示字符串A,B之间的最长公共子串长度;L(A)和L(B)分别表示字符串A和B的长度。
4.根据权利要求1所述的电网故障中SCADA数据频繁项集挖掘方法,其特征在于:步骤(3)中的事件折叠窗口的时间度设置为1小时,并通过事件折叠窗口对有序的SCADA数据进行事务集的划分,将属于同一事件窗口的SCADA数据称作一个事件,事件中的每个SCADA数据称作项。
5.根据权利要求1所述的电网故障中SCADA数据频繁项集挖掘方法,其特征在于:步骤(4)中所述的数据属性离散化处理是通过使用K-means算法对属性遥测值、越限极值和越线时间进行聚类处理,设置聚类中心的数目为3。
6.根据权利要求5所述的电网故障中SCADA数据频繁项集挖掘方法,其特征在于:对于遥测值和越线极值将聚类中心值最小的称为“低”,最大的称为“高”,中间值称为“中”;对于越线时间将聚类中心值最小的称为“短”,最大的称为“长”,中间值称为“中”,包括将模糊化的属性与电网标识的简化字母结合组成简化的数据项。
7.根据权利要求1所述的电网故障中SCADA数据频繁项集挖掘方法,其特征在于:步骤(6)中对频繁项集的语义转化和分析是指对根据步骤(5)中SCADA数据的简化过程进行反向过处理,对频繁项集进行语义的填补,转化为具体的变电站的各故障事件,从而确定某故障发生后可能发生的潜在故障事件。
CN202011087278.9A 2020-10-12 2020-10-12 一种电网故障中scada数据频繁项集挖掘方法 Active CN112183656B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011087278.9A CN112183656B (zh) 2020-10-12 2020-10-12 一种电网故障中scada数据频繁项集挖掘方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011087278.9A CN112183656B (zh) 2020-10-12 2020-10-12 一种电网故障中scada数据频繁项集挖掘方法

Publications (2)

Publication Number Publication Date
CN112183656A CN112183656A (zh) 2021-01-05
CN112183656B true CN112183656B (zh) 2023-09-29

Family

ID=73949341

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011087278.9A Active CN112183656B (zh) 2020-10-12 2020-10-12 一种电网故障中scada数据频繁项集挖掘方法

Country Status (1)

Country Link
CN (1) CN112183656B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113610278A (zh) * 2021-07-15 2021-11-05 华中科技大学 一种故障风险预测分析方法、装置、电子设备及存储介质
CN115271263B (zh) * 2022-09-27 2022-12-27 佰聆数据股份有限公司 基于改进关联规则的电力设备缺陷预警方法、系统及介质
CN115470831B (zh) * 2022-11-03 2023-04-18 四川中电启明星信息技术有限公司 一种基于频繁项集推理的水电信号异常判断方法
CN117114116A (zh) * 2023-08-04 2023-11-24 北京杰成合力科技有限公司 一种基于机器学习的根因分析方法、介质和设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016029570A1 (zh) * 2014-08-28 2016-03-03 北京科东电力控制系统有限责任公司 一种面向电网调度的智能告警分析方法
CN109409668A (zh) * 2018-09-21 2019-03-01 华中科技大学 基于数据挖掘的抽水蓄能机组故障关联关系分析方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016029570A1 (zh) * 2014-08-28 2016-03-03 北京科东电力控制系统有限责任公司 一种面向电网调度的智能告警分析方法
CN109409668A (zh) * 2018-09-21 2019-03-01 华中科技大学 基于数据挖掘的抽水蓄能机组故障关联关系分析方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于数据挖掘的电网故障关联性分析与研究;鲁慧民;冯博琴;;微电子学与计算机(第12期);全文 *

Also Published As

Publication number Publication date
CN112183656A (zh) 2021-01-05

Similar Documents

Publication Publication Date Title
CN112183656B (zh) 一种电网故障中scada数据频繁项集挖掘方法
CN114048870A (zh) 一种基于日志特征智能挖掘的电力系统异常监测方法
CN104020396A (zh) 一种基于数据挖掘的电网故障诊断方法
CN112907222B (zh) 一种多源异构电网运监业务数据融合方法
CN113869791A (zh) 一种基于日志模型的电网运维修复方法
Lin et al. Short-term metro passenger flow prediction based on random forest and LSTM
Suo et al. Computer assistance analysis of power grid relay protection based on data mining
CN116521898A (zh) 一种电厂发电设备故障知识图谱的构建方法
CN116541782A (zh) 一种电力营销数据异常识别方法
CN114880584B (zh) 一种基于社区发现的发电机组故障分析方法
CN116010368A (zh) 基于多元日志数据分析的日志审计方法和系统
CN115759562A (zh) 一种核电厂大修预防性维修工单逻辑关系和工期计算算法
CN115203290A (zh) 一种基于多维prefixspan算法的故障诊断方法
CN112329432B (zh) 一种基于改进Apriori的配电网电压越限问题关联分析方法
Zhou et al. A review of a text classification technique: K-Nearest Neighbor
CN112084332A (zh) 一种基于深度双向语言文本处理网络的违章分类方法
Zhao et al. Mining fault association rules in the perception layer of electric power sensor network based on improved Eclat
Hammad Automatic class decomposition using clustering
CN113064924A (zh) 一种核电大数据经验检索与推送方法
CN112052277A (zh) 一种基于大数据的电压暂降严重度评估方法及设备
Li et al. Multi-source heterogeneous log fusion technology of power information system based on big data and imprecise reasoning theory
Zhang Intelligent Mining Method of Massive Digital Archives Based on Artificial Intelligence
CN117829435B (zh) 一种基于大数据的城市数据质量管理方法及系统
CN114185957B (zh) 一种适用于电力大数据业务需求的智能挖掘方法
CN117892212B (zh) 一种分布式异构能源站点态势感知监测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant