CN103488802A - 一种基于粗糙集关联规则的超高压电网故障规则挖掘方法 - Google Patents

一种基于粗糙集关联规则的超高压电网故障规则挖掘方法 Download PDF

Info

Publication number
CN103488802A
CN103488802A CN201310490344.0A CN201310490344A CN103488802A CN 103488802 A CN103488802 A CN 103488802A CN 201310490344 A CN201310490344 A CN 201310490344A CN 103488802 A CN103488802 A CN 103488802A
Authority
CN
China
Prior art keywords
decision
collection
rule
attribute
decision table
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201310490344.0A
Other languages
English (en)
Inventor
梁勇超
马瑞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
Maintenance Co of State Grid Hunan Electric Power Co Ltd
Original Assignee
State Grid Corp of China SGCC
Maintenance Co of State Grid Hunan Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, Maintenance Co of State Grid Hunan Electric Power Co Ltd filed Critical State Grid Corp of China SGCC
Priority to CN201310490344.0A priority Critical patent/CN103488802A/zh
Publication of CN103488802A publication Critical patent/CN103488802A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种基于粗糙集关联规则的超高压电网故障规则挖掘方法,该方法采用分布式数据挖掘的思想,运用以粗糙集理论为基础的关联规则挖掘方法对超高压电网历史故障数据进行故障规则挖掘,利用基于信息熵的属性约简算法对分布式决策表进行属性约简,然后在约简后的决策表上应用关联规则中的Apriori算法进行故障规则提取。本发明能够有效地解决传统数据挖掘方法对于大数据量的历史故障数据库的不适应性,降低了规则提取的复杂度,具有故障规则挖掘效率高的优点。

Description

一种基于粗糙集关联规则的超高压电网故障规则挖掘方法
技术领域
本发明属于电力系统故障数据挖掘领域,涉及一种基于粗糙集关联规则的超高压电网故障规则挖掘方法。
背景技术
随着当前电网规模的扩大、超高电压等级网架建设的国情,准确、快速的判断电网故障,实现事故情况下科学调度成为保证电网安全、稳定、经济运行的重要手段。电网事故情况下虽然所获得的信息更加完备和全面,但随着电网故障信息传输量的增加,由此而带来的电网调度运行人员所需关注、处理的信息量也大大增加,导致调度运行人员在海量故障信息前对于快速准确地识别故障信号和分析事故原因、判断事故性质造成了一定的难度。利用历史故障数据库中大量故障信息,通过数据挖掘技术找出各种故障的故障特征,从而提取故障规则。能够为调度人员提供辅助决策作用。由于超高压电网历史故障数据库中故障信息量巨大,传统的数据挖掘算法无法实现高效、准确的故障规则挖掘。基于历史故障数据库分析故障规则数据挖掘技术的研究甚少,未形成超高压电网下基于历史故障数据分析的直观全面的故障规则挖掘方法。
发明内容
本发明要解决的技术问题是提供一种能够有效地解决传统数据挖掘方法对于大数据量的历史故障数据库的不适应性,降低了规则提取的复杂度,故障规则挖掘效率高的基于粗糙集关联规则的超高压电网故障规则挖掘方法。
为了解决上述技术问题,本发明采用的技术方案为:
一种基于粗糙集关联规则的超高压电网故障规则挖掘方法,其实施步骤如下:
1)从历史故障数据库获取故障数据并通过属性筛选、数据清洗建立待挖掘故障样本库;
2)采用分布式故障规则挖掘方法,把所述待挖掘故障样本库的故障数据样本按照每一个变电站下的故障设备类型进行分类分割成多个故障数据样本库;针对每一个故障数据样本库,将故障数据中涉及到的断路器和保护信号作为故障分类的条件属性集、将故障设备作为决策属性集从而得到该故障数据样本库对应的一个决策表;
3)通过运用基于信息熵的属性约简算法对所述决策表进行约简;
4)针对约简后的决策表运用Apriori算法进行关联规则挖掘故障规则;
5)建立故障规则库,按照变电站所在故障区域为第一层、故障设备类型为第二层逐层分类储存各个决策表得到的故障规则。
作为本发明基于粗糙集关联规则的超高压电网故障规则挖掘方法的进一步改进:
所述步骤3)的详细步骤如下:
3.1)根据式(1)计算每一个决策表中决策属性集的信息熵、根据式(2)计算决策属性集相对条件属性集的信息熵;
H ( D ) = - Σ j = 1 m p ( Y j ) log p ( Y j ) p ( Y j ) = | Y j | | U | ( j = 1,2 , . . . , m ) - - - ( 1 )
式(1)中,D表示决策属性集,H(D)表示信息熵,U为决策表的样本对象,Y={Y1,Y2,...,Ym}是决策表的样本对象U中根据决策属性集D分成的等价类的集合;p(Yj)为Yi在样本集上出现的概率,即某一种故障设备在故障样本中出现的概率;
H ( D | C ) = - Σ i = 1 n p ( X i ) Σ j = 1 m p ( Y j | X i ) log p ( Y j | X i ) p ( Y j | X i ) = | Y j ∩ X i | | X i | ( i = 1,2 , . . . , n ; j = 1,2 , . . . , m ) - - - ( 2 )
式(2)中,C表示条件属性集,H(D|C)表示决策属性集D相对条件属性集C的信息熵,U为决策表的样本对象,X={X1,X2,...,Xn}是决策表的样本对象U中根据条件属性集C分成的等价类的集合,Y={Y1,Y2,...,Ym}是决策表的样本对象U中根据决策属性集D分成的等价类的集合;∩表示同时包含Yj和Xi;p(Xi)为Xi在样本集上出现的概率,即某一种断路器和保护装置组合在故障样本中出现的概率;p(Yj|Xi)为Xi出现时,Yi会同时出现的概率,即某一种断路器和保护装置组合动作时,某种设备故障出现的概率;
3.2)根据式(3)计算每一个决策表中条件属性集对决策属性集的互信息量;
I(C,D)=H(D)-H(D|C)    (3)
式(3)中,I(C,D)代表条件属性集C对决策属性集D的互信息量,H(D)代表决策属性集D的信息熵,H(D|C)代表决策属性集D相对条件属性集C的信息熵;
3.3)计算每一个决策表中条件属性集相对决策属性集的核属性集,且记录保存非核条件属性得到非核条件属性集;
3.4)针对非核条件属性集中的任意元素,计算器对决策属性集的互信息量,找出使得互信息量最大的非核条件属性作为重要属性,得到重要属性集;
3.5)计算所述重要属性集对决策属性集的互信息量,如果所述重要属性集对决策属性集的互信息量的值与条件属性集对决策属性集的互信息量的值相等,则将核属性集作为约简后的决策表,并跳转执行步骤4);否则跳转执行步骤3.4)。
所述步骤4)的详细步骤如下:
4.1)根据式(4)设定支持度阈值和置信度阈值;
Support=|Xi∨Yj|/|U|    (4)
Confidence=|Xi∧Yj|/|Xi|
式(4)中,Support表示支持度阈值,Confidence表示置信度阈值;U为决策表的样本对象,X={X1,X2,...,Xn}是决策表的样本对象U中根据条件属性集C分成的等价类的集合,Y={Y1,Y2,...,Ym}是决策表的样本对象U中根据决策属性集D分成的等价类的集合;∧表示逻辑运算“与”,表示Xi出现的同时Yj也同时出现;
4.2)把条件属性集和决策属性集取值用“0”和“1”来表示,从而将约简后的决策表转化为基于布尔属性的新决策表;将新决策表针对条件属性集和决策属性集运用Apriori算法首先生成频繁1项集,分别删除其中支持度小于所述支持度阈值的项并得到在符合条件的条件属性1项集、决策属性1项集;在所述符合条件的条件属性1项集、决策属性1项集的基础上根据式(4)运用Apriori算法继续生成频繁i项集:
LCi=LCi-1×LC1(1<i≤条件属性集的长度)    (5)
LDj-LDj-1×LD1(1<j≤决策属性集的长度)
式(5)中,LC1代表符合条件的条件属性1项集、LD1代表符合条件的决策属性1项集,LCi代表针对条件属性集生成的频繁i项集,LDj代表针对决策属性集生成的频繁j项集,LCi-1代表针对条件属性集生成的频繁i-1项集,LDj-1代表针对决策属性集生成的频繁j-1项集;×为连接符号,表示将两个项集组合在一起;
4.3)将每一轮针对条件属性集生成的频繁i项集、针对决策属性集生成的频繁j项集根据式(5)进行连接运算生成长度为i+j的频繁项集,将所述频繁项集中支持度大于或等于支持度阈值、置信度大于或等于置信度阈值的频繁项集放入规则集;
Li+j=LCi×LDj    (6)
式(6)中,Li+j代表生成的长度为i+j的频繁项集,LCi代表针对条件属性集生成的频繁i项集,LDj代表针对决策属性集生成的频繁j项集;×为连接符号,表示将两个项集组合在一起;
4.4)对所述规则集中的规则进行合并优化作为挖掘得到的故障规则存入规则库。
本发明基于粗糙集关联规则的超高压电网故障规则挖掘方法具有下述优点:
1、本发明以超高压电网规模以及主要设备为依据,采用分布式故障规则挖掘方法,把所述待挖掘故障样本库的故障数据样本按照每一个变电站下的故障设备类型(母线、变压器、线路)进行分类分割成多个故障数据样本库,并针对每一个故障数据样本库,将故障数据中涉及到的断路器和保护信号作为故障分类的条件属性集、将故障设备作为决策属性集从而得到该故障数据样本库对应的一个决策表,建立多个分布式决策表,降低了决策表的规模和规则提取的复杂度,而且进一步通过运用基于信息熵的属性约简算法对所述决策表进行约简,能够有效地解决传统数据挖掘方法对于大数据量的历史故障数据库的不适应性,降低了规则提取的复杂度,具有故障规则挖掘效率高的优点。
2、本发明利用基于信息熵的属性约简算法,通过运用基于信息熵的属性约简算法对所述决策表进行约简,消除了不重要的属性,减少了属性数目。
3、本发明通过建立故障规则库,按照变电站所在故障区域为第一层、故障设备类型为第二层逐层分类储存各个决策表得到的故障规则,实现了故障规则的分类储存,能够将故障规则库按各个决策表模块进行故障规则储存,并按照决策表属性(故障区域和故障设备类型)将故障规则进行标识,能够根据故障区域、故障设备类型快速搜索到故障规则,避免了盲目搜索故障库,提高了故障规则搜索的效率。
附图说明
图1是本发明实施例挖掘方法的基本流程示意图。
图2是本发明实施例挖掘方法进行分布式规则挖掘的原理示意图。
图3是本发明实施例中对决策表进行约简的流程示意图。
具体实施方式
如图1和图2所示,运用基于粗糙集理论与关联规则相结合的超高压电网故障规则挖掘方法,基于粗糙集理论的属性约简主要思想是在保持分类能力不变的前提下,删除冗余或不重要的属性,从而减少搜索空间,提高效率。再通过关联规则的思想,通过分析故障特征(即故障样本中条件属性值)与故障区域(决策属性值)之间的可信度关系,确定故障特征与故障区域的相关程度及隐含的关联关系。本实施例基于粗糙集关联规则的超高压电网故障规则挖掘方法的实施步骤如下:
1)从历史故障数据库获取故障数据并通过属性筛选、数据清洗建立待挖掘故障样本库。
本实施例选取每条故障数据中的断路器信息、保护装置信息、故障区域信息和故障装置信息建立待挖掘规则的超高压电网的待挖掘故障样本库,因此本实施例中进行属性筛选、数据清洗时,仅仅保留同时具备的断路器信息、保护装置信息、故障区域信息和故障装置信息四种信息的故障数据,将针对断路器信息、保护装置信息、故障区域信息和故障装置信息四种信息任一种缺失的故障数据都进行去除。
2)采用分布式故障规则挖掘方法,把待挖掘故障样本库的故障数据样本按照每一个变电站下的故障设备类型进行分类分割成多个故障数据样本库;针对每一个故障数据样本库,将故障数据中涉及到的断路器和保护信号作为故障分类的条件属性集、将故障设备作为决策属性集从而得到该故障数据样本库对应的一个决策表。
如图2所示,本实施例中把故障样本逐层进行分类,首先按照故障区域以变电站为单位进行第一层分类。在每个变电站下按照故障设备类型“母线、变压器、线路”再进行第二层分类,并以每个变电站下的故障设备为单元建立的故障数据样本集建立决策表。将故障样本集中涉及到的断路器和保护信号作为条件属性集,故障设备作为决策属性集。条件属性取值为“0”或“1”,其中“1”表示断路器由闭合变位为断开或保护动作,“0”表示断路器未变位或保护未动作。并将决策属性用一维数字编码表示各区域各设备类型下的故障设备。每一条故障信息样本对应决策表每一行数据,即条件属性集中每一条故障信息的故障设备对应动作的断路器和保护装置取值为“1”,其他未动作的断路器和保护装置取值为“0”,决策属性集对应故障设备的数字编码。分布式故障规则挖掘使得决策表的规模大为减小,降低了规则提取的复杂度。
3)通过运用基于信息熵的属性约简算法对决策表进行约简。
如图3所示,步骤3)的详细步骤如下:
3.1)根据式(1)计算每一个决策表中决策属性集D的信息熵H(D)、根据式(2)计算决策属性集D相对条件属性集C的信息熵H(D|C)。
H ( D ) = - Σ j = 1 m p ( Y j ) log p ( Y j ) p ( Y j ) = | Y j | | U | ( j = 1,2 , . . . , m ) - - - ( 1 )
式(1)中,D表示决策属性集,H(D)表示信息熵,U为决策表的样本对象(即决策表的样本对象),Y={Y1,Y2,...,Ym}是决策表的样本对象U中根据决策属性集D分成的等价类的集合;p(Yj)为Yi在样本集上出现的概率,即某一种故障设备在故障样本中出现的概率;
H ( D | C ) = - Σ i = 1 n p ( X i ) Σ j = 1 m p ( Y j | X i ) log p ( Y j | X i ) p ( Y j | X i ) = | Y j ∩ X i | | X i | ( i = 1,2 , . . . , n ; j = 1,2 , . . . , m ) - - - ( 2 )
式(2)中,C表示条件属性集,H(D|C)表示决策属性集D相对条件属性集C的信息熵,U为决策表的样本对象,X={X1,X2,...,Xn}是决策表的样本对象U中根据条件属性集C分成的等价类的集合,Y={Y1,Y2,...,Ym}是决策表的样本对象U中根据决策属性集D分成的等价类的集合;∩表示同时包含Yj和Xi,即“且”的意思;p(Xi)为Xi在样本集上出现的概率,即某一种断路器和保护装置组合在故障样本中出现的概率;p(Yj|Xi)为Xi出现时,Yi会同时出现的概率,即某一种断路器和保护装置组合动作时,某种设备故障出现的概率;式(1)和式(2)中,U为决策表的样本对象,X={X1,X2,...,Xn}为条件属性集C在U上的划分,即故障样本中出现的断路器和保护装置的所有组合情况;Y={Y1,Y2,...,Ym}为决策属性集D在U上的划分,即所有故障设备的集合。
3.2)根据式(3)计算每一个决策表中条件属性集C对决策属性集D的互信息量I(C,D);
I(C,D)=H(D)-H(D|C)    (3)
式(3)中,I(C,D)代表条件属性集C对决策属性集D的互信息量,H(D)代表决策属性集D的信息熵,H(D|C)代表决策属性集D相对条件属性集C的信息熵。
3.3)计算每一个决策表中条件属性集C相对决策属性集D的核属性集C0,且记录保存非核条件属性得到非核条件属性集M,即M=C-R。
Figure BDA0000396875830000061
若有f(x,D)≠f(y,D)且f(x,C-a)≠f(y,C-a),则a=C0,其中x,y为样本对象,a为条件属性,f(x,D)中,f为信息函数,表示x与D对应的映射关系,即样本x所对应的决策属性D及其对应的属性值,f(x,C-a)表示去掉a属性后的条件属性与样本x之间的映射关系,即样本x所对应的去掉a属性后的条件属性及其对应的属性值。即对两决策属性值不相同(即故障设备不同)的样本对象,将条件属性集中去掉某一个属性后,两样本对象条件属性集取值相同,则该条件属性为核属性。记核属性C0的集合为核属性集R,将非核条件属性记入集合M中,即M=C-R。
3.4)针对非核条件属性集中的任意元素,计算器对决策属性集的互信息量,找出使得互信息量最大的非核条件属性作为重要属性,得到重要属性集;对
Figure BDA0000396875830000062
计算其对决策属性集D的互信息量I(a,D),互信息量I(a,D)可由3.1)、3.2)中公式得到。找出使互信息量最大的属性,即该属性为重要属性。则R=R∪a。
3.5)计算重要属性集R对决策属性集D的互信息量I(R,D),如果重要属性集对决策属性集的互信息量的值I(R,D)与条件属性集对决策属性集的互信息量的值I(C,D)相等(即I(R,D)=I(C,D)成立),则将核属性集作为约简后的决策表,并跳转执行步骤4);否则跳转执行步骤3.4)。
4)针对约简后的决策表运用Apriori算法进行关联规则挖掘故障规则。
本实施例中,步骤4)的详细步骤如下:
4.1)根据式(4)设定支持度阈值和置信度阈值;
Support=|Xi∨Yj|/|U|    (4)
Confidence=|Xi∧Yj|/|Xi|
式(4)中,Support表示支持度阈值,Confidence表示置信度阈值;U为决策表的样本对象,X={X1,X2,...,Xn}是决策表的样本对象U中根据条件属性集C分成的等价类的集合,Y={Y1,Y2,...,Ym}是决策表的样本对象U中根据决策属性集D分成的等价类的集合;∧表示_逻辑运算“与”,即Xi出现的同时Yj也同时出现。
4.2)把条件属性集和决策属性集取值用“0”和“1”来表示,从而将约简后的决策表转化为基于布尔属性的新决策表;将新决策表针对条件属性集和决策属性集运用Apriori算法首先生成频繁1项集,分别删除其中支持度小于支持度阈值的项并得到在符合条件的条件属性1项集、决策属性1项集(分别记为LC1、LD1);在符合条件的条件属性1项集、决策属性1项集的基础上根据式(5)运用Apriori算法继续生成频繁i项集:
LCi=LCi-1×LC1(1<i≤条件属性集的长度)    (5)
LDj-LDj-1×LD1(1<j≤决策属性集的长度)
式(5)中,LC1代表符合条件的条件属性1项集、LD1代表符合条件的决策属性1项集,LCi代表针对条件属性集生成的频繁i项集,LDj代表针对决策属性集生成的频繁j项集,LCi-1代表针对条件属性集生成的频繁i-1项集,LDj-1代表针对决策属性集生成的频繁j-1项集;×表示为连接符号,即将两个项集组合在一起。
本实施例中将约简后的决策表转化为基于布尔属性的新决策表,即把条件属性集和决策属性集取值用“0”和“1”来表示。由于条件属性集取值原本就为“0”和“1”,只需将决策属性中用一维数据表示的故障设备转变为多维数据表示。例如把决策属性中用一维数字编码表示的n种不同的故障设备转化为用n维数据来表示,把故障设备变为决策属性,“1”表示设备故障,“0”表示设备未故障。
4.3)将每一轮针对条件属性集生成的频繁i项集LCi、针对决策属性集生成的频繁j项集LDj根据式(5)进行连接运算生成长度为i+j的频繁项集Li+j,将频繁项集Li+j中支持度大于或等于支持度阈值、置信度大于或等于置信度阈值的频繁项集放入规则集;
Li+j=LCi×LDj    (6)
式(6)中,Li+j代表生成的长度为i+j的频繁项集,LCi代表针对条件属性集生成的频繁i项集,LDj代表针对决策属性集生成的频繁j项集;×表示为连接符号,即将两个项集组合在一起;
4.4)对规则集中的规则进行合并优化作为挖掘得到的故障规则存入规则库。
本实施例步骤4.1)~步骤4.4)针对约简后的决策表运用Apriori算法进行关联规则挖掘故障规则,利用支持度和置信度设定阈值,提取满足支持度和置信度要求的频繁项集,该算法只需一次扫描决策表就可产生决策规则,减少了数据集扫描次数。
5)建立故障规则库,按照变电站所在故障区域为第一层、故障设备类型为第二层逐层分类储存各个决策表得到的故障规则。参见图2,本实施例中按照故障区域、故障设备类型逐层进行分类储存各个决策表得到的故障规则。将故障规则库按各个决策表模块进行故障规则储存并按照决策表属性(故障区域和故障设备类型)将故障规则进行标识,能够根据故障区域、故障设备类型快速搜索到故障规则,从而避免了盲目搜索故障库,提高了故障规则搜索的效率。
本实施例通过上述步骤1)至步骤5),首先运用分布式规则挖掘的思想对历史数据进行分割,分布式挖掘故障规则;然后运用粗糙集理论思想对分割的数据建立决策表并进行属性约简,运用关联规则对属性约简后的决策表进行规则提取;并将提取的规则分类储存在故障规则库中,能够针对复杂的、冗余的、大数据量的超高压电网历史故障数据快速、有效地提取故障规则,且基于粗糙集的关联规则挖掘算法解决了在大数据库下数据挖掘关联规则不适应性和粗糙集理论挖掘算法冗余性高的弱点。
以上所述仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (3)

1.一种基于粗糙集关联规则的超高压电网故障规则挖掘方法,其特征在于实施步骤如下:
1)从历史故障数据库获取故障数据并通过属性筛选、数据清洗建立待挖掘故障样本库;
2)采用分布式故障规则挖掘方法,把所述待挖掘故障样本库的故障数据样本按照每一个变电站下的故障设备类型进行分类分割成多个故障数据样本库;针对每一个故障数据样本库,将故障数据中涉及到的断路器和保护信号作为故障分类的条件属性集、将故障设备作为决策属性集从而得到该故障数据样本库对应的一个决策表;
3)通过运用基于信息熵的属性约简算法对所述决策表进行约简;
4)针对约简后的决策表运用Apriori算法进行关联规则挖掘故障规则;
5)建立故障规则库,按照变电站所在故障区域为第一层、故障设备类型为第二层逐层分类储存各个决策表得到的故障规则。
2.根据权利要求1所述的基于粗糙集关联规则的超高压电网故障规则挖掘方法,其特征在于,所述步骤3)的详细步骤如下:
3.1)根据式(1)计算每一个决策表中决策属性集的信息熵、根据式(2)计算决策属性集相对条件属性集的信息熵;
H ( D ) = - Σ j = 1 m p ( Y j ) log p ( Y j ) p ( Y j ) = | Y j | | U | ( j = 1,2 , . . . , m ) - - - ( 1 )
式(1)中,D表示决策属性集,H(D)表示信息熵,U为决策表的样本对象,Y={Y1,Y2,...,Ym}是决策表的样本对象U中根据决策属性集D分成的等价类的集合;p(Yj)为Yi在样本集上出现的概率,即某一种故障设备在故障样本中出现的概率;
H ( D | C ) = - Σ i = 1 n p ( X i ) Σ j = 1 m p ( Y j | X i ) log p ( Y j | X i ) p ( Y j | X i ) = | Y j ∩ X i | | X i | ( i = 1,2 , . . . , n ; j = 1,2 , . . . , m ) - - - ( 2 )
式(2)中,C表示条件属性集,H(D|C)表示决策属性集D相对条件属性集C的信息熵,U为决策表的样本对象,X={X1,X2,...,Xn}是决策表的样本对象U中根据条件属性集C分成的等价类的集合,Y={Y1,Y2,...,Ym}是决策表的样本对象U中根据决策属性集D分成的等价类的集合;∩表示同时包含Yj和Xi;p(Xi)为Xi在样本集上出现的概率,即某一种断路器和保护装置组合在故障样本中出现的概率;p(Yj|Xi)为Xi出现时,Yi会同时出现的概率,即某一种断路器和保护装置组合动作时,某种设备故障出现的概率;
3.2)根据式(3)计算每一个决策表中条件属性集对决策属性集的互信息量;
I(C,D)=H(D)-H(D|C)    (3)
式(3)中,I(C,D)代表条件属性集C对决策属性集D的互信息量,H(D)代表决策属性集D的信息熵,H(D|C)代表决策属性集D相对条件属性集C的信息熵;
3.3)计算每一个决策表中条件属性集相对决策属性集的核属性集,且记录保存非核条件属性得到非核条件属性集;
3.4)针对非核条件属性集中的任意元素,计算器对决策属性集的互信息量,找出使得互信息量最大的非核条件属性作为重要属性,得到重要属性集;
3.5)计算所述重要属性集对决策属性集的互信息量,如果所述重要属性集对决策属性集的互信息量的值与条件属性集对决策属性集的互信息量的值相等,则将核属性集作为约简后的决策表,并跳转执行步骤4);否则跳转执行步骤3.4)。
3.根据权利要求2所述的基于粗糙集关联规则的超高压电网故障规则挖掘方法,其特征在于,所述步骤4)的详细步骤如下:
4.1)根据式(4)设定支持度阈值和置信度阈值;
Support=|Xi∨Yj|/|U|    (4)
Confidence=|Xi∧Yj|/|Xi|
式(4)中,Support表示支持度阈值,Confidence表示置信度阈值;U为决策表的样本对象,X={X1,X2,...,Xn}是决策表的样本对象U中根据条件属性集C分成的等价类的集合,Y={Y1,Y2,...,Ym}是决策表的样本对象U中根据决策属性集D分成的等价类的集合;∧表示逻辑运算“与”,表示Xi出现的同时Yj也同时出现;
4.2)把条件属性集和决策属性集取值用“0”和“1”来表示,从而将约简后的决策表转化为基于布尔属性的新决策表;将新决策表针对条件属性集和决策属性集运用Apriori算法首先生成频繁1项集,分别删除其中支持度小于所述支持度阈值的项并得到在符合条件的条件属性1项集、决策属性1项集;在所述符合条件的条件属性1项集、决策属性1项集的基础上根据式(5)运用Apriori算法继续生成频繁i项集:
LCi=LCi-1×LC1(1<i≤条件属性集的长度)    (5)
LDj=LDj-1×LD1(1<j≤决策属性集的长度)
式(5)中,LC1代表符合条件的条件属性1项集、LD1代表符合条件的决策属性1项集,LCi代表针对条件属性集生成的频繁i项集,LDj代表针对决策属性集生成的频繁j项集,LCi-1代表针对条件属性集生成的频繁i-1项集,LDj-1代表针对决策属性集生成的频繁j-1项集;×表示连接符号,表示将两个项集组合在一起;
4.3)将每一轮针对条件属性集生成的频繁i项集、针对决策属性集生成的频繁j项集根据式(6)进行连接运算生成长度为i+j的频繁项集,将所述频繁项集中支持度大于或等于支持度阈值、置信度大于或等于置信度阈值的频繁项集放入规则集;
Li+j=LCi×LDj    (6)
式(6)中,Li+j代表生成的长度为i+j的频繁项集,LCi代表针对条件属性集生成的频繁i项集,LDj代表针对决策属性集生成的频繁j项集;×为连接符号,表示将两个项集组合在一起;
4.4)对所述规则集中的规则进行合并优化作为挖掘得到的故障规则存入规则库。
CN201310490344.0A 2013-10-16 2013-10-16 一种基于粗糙集关联规则的超高压电网故障规则挖掘方法 Pending CN103488802A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310490344.0A CN103488802A (zh) 2013-10-16 2013-10-16 一种基于粗糙集关联规则的超高压电网故障规则挖掘方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310490344.0A CN103488802A (zh) 2013-10-16 2013-10-16 一种基于粗糙集关联规则的超高压电网故障规则挖掘方法

Publications (1)

Publication Number Publication Date
CN103488802A true CN103488802A (zh) 2014-01-01

Family

ID=49829028

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310490344.0A Pending CN103488802A (zh) 2013-10-16 2013-10-16 一种基于粗糙集关联规则的超高压电网故障规则挖掘方法

Country Status (1)

Country Link
CN (1) CN103488802A (zh)

Cited By (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103489138A (zh) * 2013-10-16 2014-01-01 国家电网公司 一种输电网故障信息与线路越限信息的相关度分析法
CN103901298A (zh) * 2014-03-13 2014-07-02 广东电网公司电力科学研究院 变电站设备运行状态的检测方法与系统
CN104020396A (zh) * 2014-06-12 2014-09-03 国家电网公司 一种基于数据挖掘的电网故障诊断方法
CN104463706A (zh) * 2014-12-10 2015-03-25 深圳供电局有限公司 一种用于电网检测电压暂降事件原因的方法和系统
CN104731966A (zh) * 2015-04-07 2015-06-24 河海大学 一种基于数据挖掘的地铁故障诊断方法
CN104731669A (zh) * 2015-03-12 2015-06-24 深圳供电局有限公司 一种电力设备缺陷数据自动校验的方法及系统
CN105139278A (zh) * 2015-08-19 2015-12-09 国家电网公司 一种人为因素对电网连锁故障影响分析方法
CN105843210A (zh) * 2016-03-22 2016-08-10 清华大学 电力变压器缺陷信息数据挖掘方法
CN106294715A (zh) * 2016-08-09 2017-01-04 中国地质大学(武汉) 一种基于属性约简的关联规则挖掘方法及装置
CN106324429A (zh) * 2016-08-02 2017-01-11 天津大学 一种基于rs‑ia数据挖掘的配电网故障定位方法
CN106451503A (zh) * 2016-11-08 2017-02-22 温州商学院 带有温度和振动告警单元的三相不平衡治理装置及其实现方法
CN106529806A (zh) * 2016-11-08 2017-03-22 温州职业技术学院 带有现场振动告警功能的三相不平衡治理装置及其实现方法
CN106655225A (zh) * 2016-11-08 2017-05-10 浙江百固电气科技股份有限公司 一种三相不平衡治理装置及实现方法
CN107084853A (zh) * 2017-03-06 2017-08-22 上海大学 云制造下设备故障预测方法
CN107169628A (zh) * 2017-04-14 2017-09-15 华中科技大学 一种基于大数据互信息属性约简的配电网可靠性评估方法
CN107302222A (zh) * 2017-07-25 2017-10-27 南京工程学院 一种基于粗糙集的无功优化设备动作次数分析方法
CN108228800A (zh) * 2017-12-29 2018-06-29 无锡十新能源投资有限公司 一种基于数据挖掘的光伏发电系统异常检测系统及方法
CN108280120A (zh) * 2017-07-11 2018-07-13 厦门君沣信息科技有限公司 一种基于关联规则的心理健康预警系统及方法
CN108717786A (zh) * 2018-07-17 2018-10-30 南京航空航天大学 一种基于普适性元规则的交通事故致因挖掘方法
CN108876138A (zh) * 2018-06-12 2018-11-23 国网天津市电力公司 一种基于大数据分析的变电站监控信息漏监检测方法
CN109038540A (zh) * 2018-06-12 2018-12-18 国网天津市电力公司 一种基于大数据分析的变电站监控信息甄别系统
CN109636660A (zh) * 2018-10-22 2019-04-16 广东精点数据科技股份有限公司 一种基于信息熵的农业气象数据冗余消除方法及系统
CN110244184A (zh) * 2019-07-04 2019-09-17 国网江苏省电力有限公司 一种频繁项集的配网线路故障规律挖掘方法、系统及介质
CN110442609A (zh) * 2019-08-02 2019-11-12 云南电网有限责任公司电力科学研究院 一种智能变电站二次设备关联缺陷的识别方法
CN110456231A (zh) * 2019-08-29 2019-11-15 南方电网科学研究院有限责任公司 一种非健全故障信息下的配电网多重故障诊断方法
CN110765177A (zh) * 2019-10-17 2020-02-07 大连理工大学 一种基于粗糙集理论的航空发动机故障规则生成方法
CN111563647A (zh) * 2020-03-26 2020-08-21 国网福建省电力有限公司信息通信分公司 基于关联规则和dea的电力信息系统检测方法及系统
CN111882409A (zh) * 2020-09-28 2020-11-03 武汉卓尔数字传媒科技有限公司 一种推荐主体的方法、装置及电子设备
CN112488181A (zh) * 2020-11-26 2021-03-12 哈尔滨工程大学 一种基于MIDS-Tree的服务故障高响应匹配方法
CN113064934A (zh) * 2021-03-26 2021-07-02 安徽继远软件有限公司 电力传感网感知层故障关联规则挖掘方法及系统
CN113094651A (zh) * 2020-11-27 2021-07-09 北京航空航天大学 一种基于粗糙集的高光谱成像参数优化设计方法
CN114004457A (zh) * 2021-10-11 2022-02-01 云南电网有限责任公司 一种配电网规划问题根源精准定位方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102736562A (zh) * 2012-07-10 2012-10-17 北京信息科技大学 面向数控机床故障诊断与故障预报的知识库构建方法
CN102928738A (zh) * 2012-10-31 2013-02-13 辽宁省电力有限公司沈阳供电公司 一种智能电网故障的动态层次诊断装置及方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102736562A (zh) * 2012-07-10 2012-10-17 北京信息科技大学 面向数控机床故障诊断与故障预报的知识库构建方法
CN102928738A (zh) * 2012-10-31 2013-02-13 辽宁省电力有限公司沈阳供电公司 一种智能电网故障的动态层次诊断装置及方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
吴尚智 等: ""粗糙集和信息熵的属性约简算法及其应用""", 《计算机工程》 *
杨一展: ""数据挖掘技术在故障诊断中的应用研究"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
苏蓬: ""基于信息熵最优约简算法的电网故障诊断模型"", 《河北电力技术》 *
贺超波 等: ""基于粗糙集的关联规则挖掘方法"", 《计算机应用》 *

Cited By (49)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103489138B (zh) * 2013-10-16 2016-03-09 国家电网公司 一种输电网故障信息与线路越限信息的相关度分析法
CN103489138A (zh) * 2013-10-16 2014-01-01 国家电网公司 一种输电网故障信息与线路越限信息的相关度分析法
CN103901298A (zh) * 2014-03-13 2014-07-02 广东电网公司电力科学研究院 变电站设备运行状态的检测方法与系统
CN104020396A (zh) * 2014-06-12 2014-09-03 国家电网公司 一种基于数据挖掘的电网故障诊断方法
CN104463706A (zh) * 2014-12-10 2015-03-25 深圳供电局有限公司 一种用于电网检测电压暂降事件原因的方法和系统
CN104463706B (zh) * 2014-12-10 2017-10-03 深圳供电局有限公司 一种用于电网检测电压暂降事件原因的方法和系统
CN104731669A (zh) * 2015-03-12 2015-06-24 深圳供电局有限公司 一种电力设备缺陷数据自动校验的方法及系统
CN104731669B (zh) * 2015-03-12 2017-10-03 深圳供电局有限公司 一种电力设备缺陷数据自动校验的方法及系统
CN104731966A (zh) * 2015-04-07 2015-06-24 河海大学 一种基于数据挖掘的地铁故障诊断方法
CN105139278A (zh) * 2015-08-19 2015-12-09 国家电网公司 一种人为因素对电网连锁故障影响分析方法
CN105139278B (zh) * 2015-08-19 2018-11-13 国家电网公司 一种人为因素对电网连锁故障影响分析方法
CN105843210A (zh) * 2016-03-22 2016-08-10 清华大学 电力变压器缺陷信息数据挖掘方法
CN105843210B (zh) * 2016-03-22 2018-11-09 清华大学 电力变压器缺陷信息数据挖掘方法
CN106324429B (zh) * 2016-08-02 2023-06-02 天津大学 一种基于rs-ia数据挖掘的配电网故障定位方法
CN106324429A (zh) * 2016-08-02 2017-01-11 天津大学 一种基于rs‑ia数据挖掘的配电网故障定位方法
CN106294715B (zh) * 2016-08-09 2020-01-03 中国地质大学(武汉) 一种关联规则数据挖掘方法及装置
CN106294715A (zh) * 2016-08-09 2017-01-04 中国地质大学(武汉) 一种基于属性约简的关联规则挖掘方法及装置
CN106529806A (zh) * 2016-11-08 2017-03-22 温州职业技术学院 带有现场振动告警功能的三相不平衡治理装置及其实现方法
CN106451503A (zh) * 2016-11-08 2017-02-22 温州商学院 带有温度和振动告警单元的三相不平衡治理装置及其实现方法
CN106655225A (zh) * 2016-11-08 2017-05-10 浙江百固电气科技股份有限公司 一种三相不平衡治理装置及实现方法
CN107084853A (zh) * 2017-03-06 2017-08-22 上海大学 云制造下设备故障预测方法
CN107169628A (zh) * 2017-04-14 2017-09-15 华中科技大学 一种基于大数据互信息属性约简的配电网可靠性评估方法
CN107169628B (zh) * 2017-04-14 2021-05-07 华中科技大学 一种基于大数据互信息属性约简的配电网可靠性评估方法
CN108280120A (zh) * 2017-07-11 2018-07-13 厦门君沣信息科技有限公司 一种基于关联规则的心理健康预警系统及方法
CN107302222A (zh) * 2017-07-25 2017-10-27 南京工程学院 一种基于粗糙集的无功优化设备动作次数分析方法
CN107302222B (zh) * 2017-07-25 2020-04-24 南京工程学院 一种基于粗糙集的无功优化设备动作次数分析方法
CN108228800A (zh) * 2017-12-29 2018-06-29 无锡十新能源投资有限公司 一种基于数据挖掘的光伏发电系统异常检测系统及方法
CN108228800B (zh) * 2017-12-29 2022-03-15 无锡十一新能源投资有限公司 一种基于数据挖掘的光伏发电系统异常检测系统及方法
CN108876138A (zh) * 2018-06-12 2018-11-23 国网天津市电力公司 一种基于大数据分析的变电站监控信息漏监检测方法
CN109038540A (zh) * 2018-06-12 2018-12-18 国网天津市电力公司 一种基于大数据分析的变电站监控信息甄别系统
CN108717786A (zh) * 2018-07-17 2018-10-30 南京航空航天大学 一种基于普适性元规则的交通事故致因挖掘方法
CN109636660A (zh) * 2018-10-22 2019-04-16 广东精点数据科技股份有限公司 一种基于信息熵的农业气象数据冗余消除方法及系统
CN110244184A (zh) * 2019-07-04 2019-09-17 国网江苏省电力有限公司 一种频繁项集的配网线路故障规律挖掘方法、系统及介质
CN110442609B (zh) * 2019-08-02 2023-05-16 云南电网有限责任公司电力科学研究院 一种智能变电站二次设备关联缺陷的识别方法
CN110442609A (zh) * 2019-08-02 2019-11-12 云南电网有限责任公司电力科学研究院 一种智能变电站二次设备关联缺陷的识别方法
CN110456231B (zh) * 2019-08-29 2020-07-28 南方电网科学研究院有限责任公司 一种非健全故障信息下的配电网多重故障诊断方法
CN110456231A (zh) * 2019-08-29 2019-11-15 南方电网科学研究院有限责任公司 一种非健全故障信息下的配电网多重故障诊断方法
CN110765177A (zh) * 2019-10-17 2020-02-07 大连理工大学 一种基于粗糙集理论的航空发动机故障规则生成方法
CN110765177B (zh) * 2019-10-17 2020-12-11 大连理工大学 一种基于粗糙集理论的航空发动机故障规则生成方法
CN111563647A (zh) * 2020-03-26 2020-08-21 国网福建省电力有限公司信息通信分公司 基于关联规则和dea的电力信息系统检测方法及系统
CN111882409B (zh) * 2020-09-28 2020-12-08 武汉卓尔数字传媒科技有限公司 一种推荐主体的方法、装置及电子设备
CN111882409A (zh) * 2020-09-28 2020-11-03 武汉卓尔数字传媒科技有限公司 一种推荐主体的方法、装置及电子设备
CN112488181A (zh) * 2020-11-26 2021-03-12 哈尔滨工程大学 一种基于MIDS-Tree的服务故障高响应匹配方法
CN113094651A (zh) * 2020-11-27 2021-07-09 北京航空航天大学 一种基于粗糙集的高光谱成像参数优化设计方法
CN113094651B (zh) * 2020-11-27 2023-06-09 北京航空航天大学 一种基于粗糙集的高光谱成像参数优化设计方法
CN113064934A (zh) * 2021-03-26 2021-07-02 安徽继远软件有限公司 电力传感网感知层故障关联规则挖掘方法及系统
CN113064934B (zh) * 2021-03-26 2023-12-08 安徽继远软件有限公司 电力传感网感知层故障关联规则挖掘方法及系统
CN114004457A (zh) * 2021-10-11 2022-02-01 云南电网有限责任公司 一种配电网规划问题根源精准定位方法及系统
CN114004457B (zh) * 2021-10-11 2024-05-24 云南电网有限责任公司 一种配电网规划问题根源精准定位方法及系统

Similar Documents

Publication Publication Date Title
CN103488802A (zh) 一种基于粗糙集关联规则的超高压电网故障规则挖掘方法
CN106019084B (zh) 基于配用电数据关联的中压配电网断线故障诊断方法
Singh et al. Transmission line fault detection and classification
CN103499753B (zh) 快速识别高压直流输电系统暂态故障的智能系统
CN103400214B (zh) 基于多维多层关联规则的电压暂降预测分析方法
CN104616092A (zh) 一种基于分布式日志分析的行为模式处理方法
CN105093066A (zh) 基于小波分析与支持向量机的线路故障判断方法
CN103489138B (zh) 一种输电网故障信息与线路越限信息的相关度分析法
Peiravi et al. A fast algorithm for intentional islanding of power systems using the multilevel kernel k-means approach
CN108520370A (zh) 基于主配电网一体化的告警归并及溯源方法
CN105244903A (zh) 一种背靠背异步联网混合直流输电系统的可靠性评估方法
CN105989427B (zh) 一种基于数据挖掘的设备状态趋势分析和预警方法
CN107844540A (zh) 一种用于电力数据的时间序列挖掘方法
CN109193585B (zh) 一种高压交流线路保护跳闸序列识别方法
CN116500385B (zh) 输电网监测校验方法、装置、设备和介质
CN104506137A (zh) 一种设备故障诊断方法和装置
CN103473712A (zh) 一种配电网故障影响分析表的建立方法
Zhou et al. Robustness analysis of power system dynamic process and repair strategy
Reddy et al. Bilayered fault detection and classification scheme for low-voltage DC microgrid with weighted KNN and decision tree
CN104764979A (zh) 一种基于概率推理的虚拟信息融合电网报警方法
CN104465233B (zh) 一种兼顾低压脱扣器电压暂降特性的配置方法
Hor et al. Extracting knowledge from substations for decision support
CN106022950B (zh) 一种配电网二次设备类型识别方法及系统
CN108599145B (zh) 一种电网多重故障筛选方法和系统
CN107862144B (zh) 基于电网的计算机模拟方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20140101

WD01 Invention patent application deemed withdrawn after publication