CN113064934A - 电力传感网感知层故障关联规则挖掘方法及系统 - Google Patents

电力传感网感知层故障关联规则挖掘方法及系统 Download PDF

Info

Publication number
CN113064934A
CN113064934A CN202110325798.7A CN202110325798A CN113064934A CN 113064934 A CN113064934 A CN 113064934A CN 202110325798 A CN202110325798 A CN 202110325798A CN 113064934 A CN113064934 A CN 113064934A
Authority
CN
China
Prior art keywords
items
item
transactions
screened
judged
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110325798.7A
Other languages
English (en)
Other versions
CN113064934B (zh
Inventor
吕玉祥
董亚文
杨阳
曾鉴
罗劲瑭
吴庆
吴昊
吴辉
刘江
杜广东
徐彬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
State Grid Information and Telecommunication Co Ltd
State Grid Sichuan Electric Power Co Ltd
Anhui Jiyuan Software Co Ltd
Economic and Technological Research Institute of State Grid Sichuan Electric Power Co Ltd
Original Assignee
State Grid Corp of China SGCC
State Grid Information and Telecommunication Co Ltd
State Grid Sichuan Electric Power Co Ltd
Anhui Jiyuan Software Co Ltd
Economic and Technological Research Institute of State Grid Sichuan Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, State Grid Information and Telecommunication Co Ltd, State Grid Sichuan Electric Power Co Ltd, Anhui Jiyuan Software Co Ltd, Economic and Technological Research Institute of State Grid Sichuan Electric Power Co Ltd filed Critical State Grid Corp of China SGCC
Priority to CN202110325798.7A priority Critical patent/CN113064934B/zh
Publication of CN113064934A publication Critical patent/CN113064934A/zh
Application granted granted Critical
Publication of CN113064934B publication Critical patent/CN113064934B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Fuzzy Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供一种电力传感网感知层故障关联规则挖掘方法及系统,属于数据挖掘技术领域。所述方法包括:获取待挖掘的数据集以及对应的最小支持度;归并数据集以得到候选项集;分别计算候选项集中每个项的支持度;遍历每个项,筛选出支持度大于最小支持度的项;判断筛选出的项的数量是否为0;在判断筛选出的项的数量不为0的情况下,将筛选出的项加入频繁项集中;采用基于冗余容量的交叉计数方法从筛选出的项中计算出新的候选项集;再次分别计算候选项集中每个项的支持度,并执行方法的相应步骤,直到判断筛选出的项的数量为0;在判断筛选出的项的数量为0的情况下,输出频繁项集。

Description

电力传感网感知层故障关联规则挖掘方法及系统
技术领域
本发明涉及数据挖掘技术领域,具体地涉及一种电力传感网感知层故障关联规则挖掘方法及系统。
背景技术
感知层是电力传感网中的基础和重要功能应用层,感知层由各类物联网传感器、智能终端、本地通信网络、边缘物联代理组成,可以实现传感信息的采集、汇聚、边缘计算和上送。随着电力传感网建设进程的推进,感知层的规模逐渐扩大、业务类型丰富多样、通信方式异构融合,使得感知层网络变得异常复杂,一台设备的故障可能导致与之相关的设备也产生大量告警。数量庞大的故障信息不但不能有效帮助技术人员定位故障源、确定故障原因,反而会将反应故障本质的根本信息淹没,加大故障诊断难度。
故障关联规则挖掘可以在技术人员处理故障信息之前对故障进行过滤、合并和转化,进而发现根故障,辅助技术人员及时准确定位故障。故障关联规则挖掘作为通信网络故障诊断的重要手段之一,引起了广泛关注。
现有的故障关联规则方法大多基于FP-growth或Apriori算法,其中最经典的Apriori算法需要多次重复扫描数据集,会产生大量候选集占用大量内存,同时该算法候选项集的生成和测试效率较低;而FP-growth算法不产生候选集,通过将数据压缩到一颗频繁模式树(FP-tree)后采用模式增长方式生成频繁项集,因此效率比Apriori算法有所提高,但递归生成条件数据库和条件FP-tree要耗费较多的时间与内存,在使用低支持度时会产生大量条件模式树等问题。因此这些算法的运行效率难以满足大规模故障关联规则挖掘要求。
发明内容
本发明实施例的目的是提供一种电力传感网感知层故障关联规则挖掘方法及系统,该方法及系统能够克服现有技术中故障关联规则挖掘算法运行效率低的技术问题。
为了实现上述目的,本发明实施例提供一种电力传感网感知层故障关联规则挖掘方法,所述方法包括:
获取待挖掘的数据集以及对应的最小支持度,其中,所述数据集包括多个事务,每个所述事务包括多个项;
归并所述数据集以得到候选项集,其中,所述候选项集包括多个项,每个所述项对应有多个事务;
分别计算所述候选项集中每个所述项的支持度;
遍历每个所述项,筛选出支持度大于所述最小支持度的项;
判断筛选出的所述项的数量是否为0;
在判断筛选出的所述项的数量不为0的情况下,将筛选出的所述项加入频繁项集中;
采用基于冗余容量的交叉计数方法从筛选出的所述项中计算出新的所述候选项集;
再次分别计算所述候选项集中每个所述项的支持度,并执行所述方法的相应步骤,直到判断所述筛选出的所述项的数量为0;
在判断筛选出的所述项的数量为0的情况下,输出所述频繁项集。
可选地,所述采用基于冗余容量的交叉计数方法从筛选出的所述项中计算出新的所述候选项集包括:
在所述筛选出的所述项中按照对应的事务的数量从小到大的顺序执行筛选操作。
可选地,所述采用基于冗余容量的交叉计数方法从筛选出的所述项中计算出新的所述候选项集包括:
对筛选出的所述项按照每个所述项对应的事务的数量按照从大到小的顺序排列;
按照从右向左的顺序对筛选出的所述项执行筛选操作。
可选地,所述采用基于冗余容量的交叉计数方法从筛选出的所述项中计算出新的所述候选项集包括:
对筛选出的所述项按照每个所述项对应的事务的数量按照从小到大的顺序排列;
按照从左向右的顺序对筛选出的所述项执行筛选操作。
可选地,所述基于冗余容量的交叉计数方法包括:
输入待计算的两个所述项;
根据公式(1)分别计算两个所述项的冗余容量,
R=count(N)-minsup*|T|, (1)
其中,R为冗余容量,count(N)为项N对应的事务的数量,minsup为所述最小支持度,|T|为所有所述事务的总数量;
分别在两个所述项中选择序号最小的事务;
判断选择的两个事务的序号是否相等;
在判断选择的两个事务的序号相等的情况下,从两个所述项中取出选择的两个事务,并将选择的两个所述事务中的一个加入两个所述项的交集中;
在判断选择的两个事务的序号不相等的情况下,选择所述两个事务的序号较小者对应的所述项,从选择的所述项中删除所述较小者,并根据公式(2)更新选择的所述项的冗余容量,
R1=R-1, (2)
其中,R1为更新后的所述冗余容量,R为更新前的所述冗余容量;
判断两个所述项是否至少存在一个为空集;
在判断两个所述项至少存在一个为空集的情况下,将所述交集加入新的所述候选项集中;
在判断两个所述项均为非空集的情况下,判断两个所述项对应的冗余容量是否存在至少一个小于0;
在判断两个所述项对应的冗余容量存在至少一个小于0的情况下,对所述交集执行剪枝操作;
在判断两个所述项对应的冗余容量均大于或等于0的情况下,再次分别在两个所述项中选择序号最小的事务,并执行所述方法的相应步骤。
可选地,所述分别计算所述候选项集中每个所述项的支持度包括:
根据公式(3)计算所述支持度,
Figure BDA0002994624160000041
其中,sup(X)为项X的支持度,|T|为所述事务的总数量,count(X)为项X所对应的事务的数量。
另一方面,本发明还提供一种电力传感网感知层故障关联规则挖掘系统,所述系统包括处理器,所述处理器用于被机器读取以使得所述机器执行如上述任一所述的方法。
再一方面,本发明还提供一种存储介质,所述存储介质存储有指令,所述指令用于被机器读取以使得所述机器执行如上述任一所述的方法。
通过上述技术方案,本发明提供的电力传感网感知层故障关联规则挖掘方法及系统通过将原本水平数据的数据集转化为垂直数据的数据集,使得数据集能够适应Eclat算法的挖掘要求。再结合基于冗余容量的交叉计数方法,对数据集进行进一步地挖掘,提高了交叉计数的速度,使得即使在事务较多的稀疏数据集下,该关联规则挖掘方法也能够实现高效率的规则挖掘。
本发明实施例的其它特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
附图是用来提供对本发明实施例的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本发明实施例,但并不构成对本发明实施例的限制。在附图中:
图1是根据本发明的一个实施方式的电力传感网感知层故障关联规则挖掘方法的流程图;
图2是根据本发明的一个实施方式的搜索树的示例图;
图3是根据本发明的一个实施方式的搜索树的示例图;以及
图4是本发明的一个实施方式的基于冗余容量的交叉计数方法的流程图。
具体实施方式
以下结合附图对本发明实施例的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本发明实施例,并不用于限制本发明实施例。
如图1所示是根据本发明的一个实施方式的电力传感网感知层故障关联规则挖掘方法的流程图。在图1中,该方法可以包括:
在步骤S10中,获取待挖掘的数据集以及对应的最小支持度。其中,该数据集可以包括多个事务,每个事务可以包括多个项。具体地,在该数据集中,每个事务可以用于表示系统的故障类型,而其中所包括的多个项则可以表示为与该故障类型相关联的系统模块。
在步骤S11中,归并该数据集以得到候选项集。其中,该候选项集可以包括多个项,每个项可以对应有多个事务。
在现有技术中,由于系统每次的故障事件在统计时都会基于故障类型来统计,例如先确定故障类型,再基于故障类型对相关联的系统模块进行统计,从而得到了在步骤S10中的基于水平数据的数据集。
对于这种水平数据的数据集,现有技术主要是基于FP-growth或Apriori算法来挖掘。其中,最经典的Apriori算法需要多次重复扫描数据集,这就会产生大量候选集,从而占用大量内存。同时,该算法候选项集的生成和测试效率也较低。相较于前者而言,FP-growth算法不产生候选集,而是通过将数据压缩到一颗频繁模式树(FP-tree)后采用模式增长方式生成频繁项集,因此效率比Apriori算法有所提高。但是,在该算法中,递归生成条件数据库和条件FP-tree要耗费较多的时间与内存,在使用低支持度时会产生大量条件模式树,因此该算法的运行效率也难以满足大规模故障关联规则挖掘要求。
Eclat算法是一种基于垂直数据的数据挖掘方法,相较于常规的FP-growth或Apriori算法而言,具备更高的数据处理效率。但是,这种算法是基于垂直数据,而本发明实施方式中的数据集却是水平数据,因此不能直接采用Eclat算法。
所以在该步骤S11中,首先要对水平数据的数据集执行归并操作,从而得到垂直数据的候选项集。对于该水平数据和垂直数据的具体事例,则可以是如表1和表2所示,
表1水平数据
Figure BDA0002994624160000061
Figure BDA0002994624160000071
表2垂直数据
系统模块 TID
i<sub>1</sub> 1,3,5,6
i<sub>2</sub> 1,2,3,4
i<sub>3</sub> 2,3,6
i<sub>4</sub> 2,4,6
i<sub>5</sub> 3,6
其中,TID表示故障类型。
在步骤S12中,分别计算候选项集中每个项的支持度。其中,该支持度的计算方式可以是本领域人员所知的多种形式。在本发明的一个示例中,该支持度可以是根据公式(1)来计算,
Figure BDA0002994624160000081
其中,sup(X)为项X的支持度,|T|为事务的总数量,count(X)为项X所对应的事务的数量。在该实施方式中,该事务即为上述故障类型,项即为上述系统模块,事务的数量即为故障类型的种类。
在步骤S13中,遍历每个项,筛选出支持度大于最小支持度的项。
在步骤S14中,判断筛选出的项的数量是否为0。
在步骤S15中,在判断筛选出的项的数量不为0的情况下,将筛选出的项加入频繁项集中。
在步骤S16中,采用基于冗余容量的交叉计数方法从筛选出的项中计算出新的候选项集。
再次分别计算候选项集中每个项的支持度,并执行该方法的相应步骤,直到判断筛选出的项的数量为0。
在步骤S17中,在判断筛选出的项的数量为0的情况下,输出频繁项集。
在该实施方式中,步骤S13筛选出的项满足支持度大于最小支持度,此时说明候选项集中仍然有频繁项,因此需要将筛选出的项加入频繁项集中。另一方面,候选项集中仍然有频繁项说明该候选项集仍然需要进一步挖掘频繁项。因此,在判断筛选出的项的数量不为0的情况下,可以首先将该次挖掘的频繁项加入频繁项集中,并将新挖掘出的频繁项再次作为新一轮的候选项集,以进行下一轮的挖掘。相反地,如果步骤S14判断筛选出的项的数量为0,此时说明该数据集中已经没有频繁项,因此不需要再继续挖掘。即输出频繁项集。最终,本领域人员可以通关该频繁项集得到故障关联规则。
虽然Eclat算法思想具备更高的数据处理效率,但是传统的Eclat算法思想主要是按照事务的数量从大到小的顺序执行的。这样的方法虽然在一定程度上相较于FP-growth或Apriori算法具备更高的执行效率,但是也存在自身的缺陷。以图2中所示出的搜索树为例,首轮得到的频繁项为I1至I5。如果以常规的Eclat算法思想进行进一步地挖掘,则是从左向右进行挖掘。这样的挖掘方式在挖掘的过程中会产生大量的冗余项,并且在最小支持度的数值较小的情况下,即使事务的数量小于最小支持度,该算法仍然会继续求交集(挖掘)并计数,从而大大降低了算法执行的效率。但是,如果按照从右向左的挖掘顺序,其产生的搜索树如图3所示,其中椭圆虚线代表的项集为非频繁项集,椭圆实线代表的为频繁项集,其中null表示其父节点求交集后为空。从该图3中可以看出,在按照从右到左顺序时,所产生的冗余项大大减少,在降低系统内存的同时,算法的执行效率自然也就大大提高。
因此,在本发明的一个优选示例中,步骤S16对筛选出的项执行筛选操作时,可以按照对应的事务的数量从小到大的顺序执行筛选操作。具体地,为了便于算法程序的设计,可以是先对筛选出的项按照每个项对应的事务的数量按照从大到小的顺序排列,再按照从右向左的顺序对筛选出的项执行筛选操作;反之,也可以先对筛选出的项按照每个项对应的事务的数量按照从小到大的顺序排列,再按照从左向右的顺序对筛选出的项执行筛选操作。
对于该步骤S16中的基于冗余容量的交叉计数方法,虽然可以是本领域人员所知的多种形式。但是,为了在挖掘的过程中,减少多余的冗余项。该步骤S16可以通过一边挖掘一边剪枝的操作,实现冗余项数量的限制,从而提高算法的执行效率。具体地,该步骤S16可以包括如图3所示的步骤。在图3中,该基于冗余容量的交叉计数方法可以包括:
在步骤S20中,输入待计算的两个项;
在步骤S21中,根据公式(1)分别计算两个项的冗余容量,
R=count(N)-minsup*|T|, (1)
其中,R为冗余容量,count(N)为项N对应的事务的数量,minsup为最小支持度,|T|为所有事务的总数量;
在步骤S22中,分别在两个项中选择序号最小的事务;
在步骤S23中,判断选择的两个事务的序号是否相等;
在步骤S24中,在判断选择的两个事务的序号相等的情况下,从两个项中取出选择的两个事务,并将选择的两个事务中的一个加入两个项的交集中。在该步骤S24中,判断两个事务的序号相等,此时说明在两个项中分别取出的事务时相同的,那么,此时说明这两个相同的事务必然是两个项的交集中的事务,因此可以先取出这两个事务,并将其中的一个加入交集中。
在步骤S25中,在判断选择的两个事务的序号不相等的情况下,选择两个事务的序号较小者对应的项,从选择的项中删除较小者,并根据公式(2)更新选择的项的冗余容量,
R1=R-1, (2)
其中,R1为更新后的冗余容量,R为更新前的冗余容量。其中,判断两个事务的序号不相等,那么按照本发明提供的从小到大的筛选顺序,则可以删除其中序号较小的事务,并将对应的项的冗余容量减一,避免出现即使事务的数量小于最小支持度,算法仍然会继续求交集(挖掘)并计数的情况。
在步骤S26中,判断两个项是否至少存在一个为空集。
在步骤S27中,在判断两个项至少存在一个为空集的情况下,将交集加入新的候选项集中。其中,如果两个项中至少一个存在空集,此时说明两个项的交集中已经不可能再加入任何一个事务,因此可以直接结束算法,并输出当前两个项所对应的交集。
在步骤S28中,在判断两个项均为非空集的情况下,判断两个项对应的冗余容量是否存在至少一个小于0。
在步骤S29中,在判断两个项对应的冗余容量存在至少一个小于0的情况下,对交集执行剪枝操作。在该步骤中,判断两个项对应的冗余容量存在至少一个小于0,说明此时其中至少一个项所对应的事务的数量小于最小支持度,此时继续进行挖掘操作显然会陷入前文中所提到的算法效率低的技术问题,因此可以直接执行剪枝操作,即删除该交集。
在判断两个项对应的冗余容量均大于或等于0的情况下,再次分别在两个项中选择序号最小的事务,并执行该方法的相应步骤。与步骤S26相反的是,如果两个项均为非空集,则说明算法依然可以继续挖掘两个项的交集,因此可以返回执行步骤S22。
另一方面,本发明还提供一种电力传感网感知层故障关联规则挖掘系统,所述系统包括处理器,所述处理器用于被机器读取以使得所述机器执行如上述任一所述的方法。
再一方面,本发明还提供一种存储介质,所述存储介质存储有指令,所述指令用于被机器读取以使得所述机器执行如上述任一所述的方法。
通过上述技术方案,本发明提供的电力传感网感知层故障关联规则挖掘方法及系统通过将原本水平方向的数据集转化为垂直方向的数据集,使得数据集能够适应Eclat算法的挖掘要求。再结合基于冗余容量的交叉计数方法,对数据集进行进一步地挖掘,提高了交叉计数的速度,使得即使在低支持度下,该关联规则挖掘方法也能够实现高效率的规则挖掘。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (8)

1.一种电力传感网感知层故障关联规则挖掘方法,其特征在于,所述方法包括:
获取待挖掘的数据集以及对应的最小支持度,其中,所述数据集包括多个事务,每个所述事务包括多个项;
归并所述数据集以得到候选项集,其中,所述候选项集包括多个项,每个所述项对应有多个事务;
分别计算所述候选项集中每个所述项的支持度;
遍历每个所述项,筛选出支持度大于所述最小支持度的项;
判断筛选出的所述项的数量是否为0;
在判断筛选出的所述项的数量不为0的情况下,将筛选出的所述项加入频繁项集中;
采用基于冗余容量的交叉计数方法从筛选出的所述项中计算出新的所述候选项集;
再次分别计算所述候选项集中每个所述项的支持度,并执行所述方法的相应步骤,直到判断所述筛选出的所述项的数量为0;
在判断筛选出的所述项的数量为0的情况下,输出所述频繁项集。
2.根据权利要求1所述的方法,其特征在于,所述采用基于冗余容量的交叉计数方法从筛选出的所述项中计算出新的所述候选项集包括:
在所述筛选出的所述项中按照对应的事务的数量从小到大的顺序执行筛选操作。
3.根据权利要求2所述的方法,其特征在于,所述采用基于冗余容量的交叉计数方法从筛选出的所述项中计算出新的所述候选项集包括:
对筛选出的所述项按照每个所述项对应的事务的数量按照从大到小的顺序排列;
按照从右向左的顺序对筛选出的所述项执行筛选操作。
4.根据权利要求2所述的方法,其特征在于,所述采用基于冗余容量的交叉计数方法从筛选出的所述项中计算出新的所述候选项集包括:
对筛选出的所述项按照每个所述项对应的事务的数量按照从小到大的顺序排列;
按照从左向右的顺序对筛选出的所述项执行筛选操作。
5.根据权利要求1所述的方法,其特征在于,所述基于冗余容量的交叉计数方法包括:
输入待计算的两个所述项;
根据公式(1)分别计算两个所述项的冗余容量,
R=count(N)-minsup*|T|,(1)
其中,R为冗余容量,count(N)为项N对应的事务的数量,minsup为所述最小支持度,||为所有所述事务的总数量;
分别在两个所述项中选择序号最小的事务;
判断选择的两个事务的序号是否相等;
在判断选择的两个事务的序号相等的情况下,从两个所述项中取出选择的两个事务,并将选择的两个所述事务中的一个加入两个所述项的交集中;
在判断选择的两个事务的序号不相等的情况下,选择所述两个事务的序号较小者对应的所述项,从选择的所述项中删除所述较小者,并根据公式(2)更新选择的所述项的冗余容量,
R1=R-1,(2)
其中,R1为更新后的所述冗余容量,R为更新前的所述冗余容量;
判断两个所述项是否至少存在一个为空集;
在判断两个所述项至少存在一个为空集的情况下,将所述交集加入新的所述候选项集中;
在判断两个所述项均为非空集的情况下,判断两个所述项对应的冗余容量是否存在至少一个小于0;
在判断两个所述项对应的冗余容量存在至少一个小于0的情况下,对所述交集执行剪枝操作;
在判断两个所述项对应的冗余容量均大于或等于0的情况下,再次分别在两个所述项中选择序号最小的事务,并执行所述方法的相应步骤。
6.根据权利要求1所述的方法,其特征在于,所述分别计算所述候选项集中每个所述项的支持度包括:
根据公式(3)计算所述支持度,
Figure FDA0002994624150000031
其中,sup(X)为项X的支持度,|T|为所述事务的总数量,count(X)为项X所对应的事务的数量。
7.一种电力传感网感知层故障关联规则挖掘系统,其特征在于,所述系统包括处理器,所述处理器用于被机器读取以使得所述机器执行如权利要求1至6任一所述的方法。
8.一种存储介质,其特征在于,所述存储介质存储有指令,所述指令用于被机器读取以使得所述机器执行如权利要求1至6任一所述的方法。
CN202110325798.7A 2021-03-26 2021-03-26 电力传感网感知层故障关联规则挖掘方法及系统 Active CN113064934B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110325798.7A CN113064934B (zh) 2021-03-26 2021-03-26 电力传感网感知层故障关联规则挖掘方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110325798.7A CN113064934B (zh) 2021-03-26 2021-03-26 电力传感网感知层故障关联规则挖掘方法及系统

Publications (2)

Publication Number Publication Date
CN113064934A true CN113064934A (zh) 2021-07-02
CN113064934B CN113064934B (zh) 2023-12-08

Family

ID=76563692

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110325798.7A Active CN113064934B (zh) 2021-03-26 2021-03-26 电力传感网感知层故障关联规则挖掘方法及系统

Country Status (1)

Country Link
CN (1) CN113064934B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113886396A (zh) * 2021-10-20 2022-01-04 电子科技大学 基于高效用频繁模式挖掘的电力系统故障检测方法及系统

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103488802A (zh) * 2013-10-16 2014-01-01 国家电网公司 一种基于粗糙集关联规则的超高压电网故障规则挖掘方法
CN103871003A (zh) * 2014-03-31 2014-06-18 国家电网公司 一种应用历史故障数据的配电网故障诊断方法
CN103902816A (zh) * 2014-03-12 2014-07-02 郑州轻工业学院 基于数据挖掘技术的带电检测数据处理方法
CN104239437A (zh) * 2014-08-28 2014-12-24 国家电网公司 一种面向电网调度的智能告警分析方法
CN104679828A (zh) * 2015-01-19 2015-06-03 云南电力调度控制中心 一种基于规则的电网故障诊断智能系统
CN104809665A (zh) * 2015-05-14 2015-07-29 国家电网公司 一种基于改进Apriori算法的配电网预警方法
CN105069690A (zh) * 2015-06-11 2015-11-18 国家电网公司 一种电网运行数据处理方法
CN106127607A (zh) * 2016-06-24 2016-11-16 广西电网有限责任公司南宁供电局 一种电力事故上下层级原因相关度的分析方法
CN106570128A (zh) * 2016-11-03 2017-04-19 南京邮电大学 一种基于关联规则分析的挖掘算法
CN106991141A (zh) * 2017-03-21 2017-07-28 北京邮电大学 一种基于深度剪枝策略的关联规则挖掘方法
CN107066587A (zh) * 2017-04-17 2017-08-18 贵州大学 一种基于组链表的高效频繁项集挖掘方法
US20190207667A1 (en) * 2018-01-04 2019-07-04 Hua Zhou Beam Failure Recovery Procedure
CN110222090A (zh) * 2019-06-03 2019-09-10 哈尔滨工业大学(威海) 一种海量数据频繁项集挖掘方法
US20190294528A1 (en) * 2018-03-26 2019-09-26 Ca, Inc. Automated software deployment and testing

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103488802A (zh) * 2013-10-16 2014-01-01 国家电网公司 一种基于粗糙集关联规则的超高压电网故障规则挖掘方法
CN103902816A (zh) * 2014-03-12 2014-07-02 郑州轻工业学院 基于数据挖掘技术的带电检测数据处理方法
CN103871003A (zh) * 2014-03-31 2014-06-18 国家电网公司 一种应用历史故障数据的配电网故障诊断方法
CN104239437A (zh) * 2014-08-28 2014-12-24 国家电网公司 一种面向电网调度的智能告警分析方法
CN104679828A (zh) * 2015-01-19 2015-06-03 云南电力调度控制中心 一种基于规则的电网故障诊断智能系统
CN104809665A (zh) * 2015-05-14 2015-07-29 国家电网公司 一种基于改进Apriori算法的配电网预警方法
CN105069690A (zh) * 2015-06-11 2015-11-18 国家电网公司 一种电网运行数据处理方法
CN106127607A (zh) * 2016-06-24 2016-11-16 广西电网有限责任公司南宁供电局 一种电力事故上下层级原因相关度的分析方法
CN106570128A (zh) * 2016-11-03 2017-04-19 南京邮电大学 一种基于关联规则分析的挖掘算法
CN106991141A (zh) * 2017-03-21 2017-07-28 北京邮电大学 一种基于深度剪枝策略的关联规则挖掘方法
CN107066587A (zh) * 2017-04-17 2017-08-18 贵州大学 一种基于组链表的高效频繁项集挖掘方法
US20190207667A1 (en) * 2018-01-04 2019-07-04 Hua Zhou Beam Failure Recovery Procedure
US20190294528A1 (en) * 2018-03-26 2019-09-26 Ca, Inc. Automated software deployment and testing
CN110222090A (zh) * 2019-06-03 2019-09-10 哈尔滨工业大学(威海) 一种海量数据频繁项集挖掘方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李文博;朱元振;刘玉田;: "交直流混联系统连锁故障搜索模型及故障关联分析", 电力系统自动化, no. 22, pages 87 - 100 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113886396A (zh) * 2021-10-20 2022-01-04 电子科技大学 基于高效用频繁模式挖掘的电力系统故障检测方法及系统
CN113886396B (zh) * 2021-10-20 2022-03-29 电子科技大学 基于高效用频繁模式挖掘的电力系统故障检测方法及系统

Also Published As

Publication number Publication date
CN113064934B (zh) 2023-12-08

Similar Documents

Publication Publication Date Title
CN109033340B (zh) 一种基于Spark平台的点云K邻域的搜索方法及装置
CN106557486A (zh) 一种数据的存储方法和装置
JP2004518226A (ja) データベースシステムおよびクエリオプティマイザ
CN110019384B (zh) 一种血缘数据的获取方法、提供血缘数据的方法及装置
CN108205571B (zh) 键值数据表的连接方法及装置
JP2004519039A (ja) 圧縮データの構造を問い合わせる方法
US10810458B2 (en) Incremental automatic update of ranked neighbor lists based on k-th nearest neighbors
CN113064934B (zh) 电力传感网感知层故障关联规则挖掘方法及系统
CN111125199A (zh) 一种数据库访问方法、装置及电子设备
CN114328601A (zh) 数据降采样和数据查询方法、系统及存储介质
CN112348420A (zh) 储位信息获取方法及系统、存储介质和电子设备
CN110928941B (zh) 一种数据分片抽取方法及装置
CN116303822A (zh) 数据仓库管理方法、装置、计算机设备和存储介质
US20220247620A1 (en) Identification of Clusters of Elements Causing Network Performance Degradation or Outage
US20190354617A1 (en) Database revalidation using parallel distance-based groups
US10803053B2 (en) Automatic selection of neighbor lists to be incrementally updated
CN115658732A (zh) 一种sql语句的优化查询方法、装置、电子设备及介质
CN106648550B (zh) 用于并发执行任务的方法与设备
CN114489481A (zh) 硬盘存储数据并访问的方法及系统
CN112948188A (zh) 一种日志文件筛查方法、系统及介质
US20200195550A1 (en) Tree structure-based smart inter-computing routing model
CN110991177A (zh) 一种物料排重方法及装置
KR20120069388A (ko) 정적 결함 분류 및 보고 자동화 시스템 및 그 방법
CN117472888A (zh) 精细化的数据问题分析方法及系统
CN118193032A (zh) 消除无效依赖库的方法、装置、设备、介质和程序产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant