CN107908665A - 一种有向无环图电网企业频繁节点挖掘方法及挖掘系统 - Google Patents

一种有向无环图电网企业频繁节点挖掘方法及挖掘系统 Download PDF

Info

Publication number
CN107908665A
CN107908665A CN201710989431.9A CN201710989431A CN107908665A CN 107908665 A CN107908665 A CN 107908665A CN 201710989431 A CN201710989431 A CN 201710989431A CN 107908665 A CN107908665 A CN 107908665A
Authority
CN
China
Prior art keywords
node
mrow
frequent
directed acyclic
acyclic graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710989431.9A
Other languages
English (en)
Other versions
CN107908665B (zh
Inventor
冯昊
于晓彦
张旭东
成敬周
刘福炎
张泓
张一泓
刘晓枫
宋国超
王珂
李兵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Yuwei Technology Co Ltd
State Grid Zhejiang Electric Power Co Ltd
Zhejiang Huayun Information Technology Co Ltd
Jinhua Power Supply Co of State Grid Zhejiang Electric Power Co Ltd
Economic and Technological Research Institute of State Grid Zhejiang Electric Power Co Ltd
Original Assignee
Hangzhou Yuwei Technology Co Ltd
State Grid Zhejiang Electric Power Co Ltd
Zhejiang Huayun Information Technology Co Ltd
Jinhua Power Supply Co of State Grid Zhejiang Electric Power Co Ltd
Economic and Technological Research Institute of State Grid Zhejiang Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Yuwei Technology Co Ltd, State Grid Zhejiang Electric Power Co Ltd, Zhejiang Huayun Information Technology Co Ltd, Jinhua Power Supply Co of State Grid Zhejiang Electric Power Co Ltd, Economic and Technological Research Institute of State Grid Zhejiang Electric Power Co Ltd filed Critical Hangzhou Yuwei Technology Co Ltd
Priority to CN201710989431.9A priority Critical patent/CN107908665B/zh
Publication of CN107908665A publication Critical patent/CN107908665A/zh
Application granted granted Critical
Publication of CN107908665B publication Critical patent/CN107908665B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/06Electricity, gas or water supply
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/03Data mining

Abstract

本发明公开了一种有向无环图的电网企业频繁节点挖掘方法及系统。本发明以有效找出反应真实电网企业中复杂网络情况的频繁项集,构建候选频繁集二进制表,并构建二进制表的有向无环图,借鉴PageRank排名算法,结合复杂网络节点重要性评估特点,快速的评估有向无环图中节点的重要性,提高频繁集的挖掘效率为目的,分为以下步骤:a)对目标数据库进行一次遍历,将数据库投影至二进制位表,并根据所生成的二进制位表进行频繁项统计,构建有向无环图,并将频繁项支持度设为连接权值;b)借鉴PageRank排序算法思想,采用有向加权复杂网络节点重要性评估指标对网络中频繁节点进行评估,最终得到频繁集节点。

Description

一种有向无环图电网企业频繁节点挖掘方法及挖掘系统
技术领域
本发明涉及电网企业的数据挖掘与分析,具体地说是一种结合PageRank的有向无环图电网企业频繁节点挖掘方法及挖掘系统。
背景技术
随着电力行业的信息化发展,电网企业运营的数据也得到了快速增长,对电力大数据进行研究,对电能资源的优化配置,能源效率水平的提升,电网企业运营利润率的提高有重要意义。关联规则作为数据挖掘中的一项重要研究内容已经应用在许多领域,它的主要工作是挖掘数据间隐藏的关联关系,如何高效的产生频繁项集是最后发掘关联规则的关键,已然成为目前国内外学者研究的重点之一。
Apriori算法是挖掘关联规则的重要算法,主要通过最小支持度和置信度的框架实现关联规则的有效挖掘。近年来也有许多国内外学者在此基础上做了广泛而深入的研究,刘步中(基于频繁项集挖掘算法的改进与研究[J].计算机应用研究,2012,29(2):475-477)提出了一种称为Inter-Apriori的改进算法,该算法使用交集策略减少扫描数据库的次数,从而使算法达到较高的效率,可以在不扫描整个数据库的状态下找到频繁项集,节省大量比较时间,但是没有考虑分类后的规则依然存在冗余项的问题;刘青宝、金燕、侯东风等人(数据流层次窗口模型及聚集查询算法[J].计算机科学,2007,34(5):194-196)提出了一种基于线性链表的改进算法,将事务数据库转换到线性链表中,进而对线性链表进行规则挖掘,减少了扫描事务数据库的次数,但没有考虑如果数据集过于庞大则容易引起内存溢出的问题。总体而言,多次扫描数据库是发掘频繁项集效率低下的一个主要原因,同时当数据量巨大时,产生的大量冗余候选项集也不容忽视。
发明内容
本发明所要解决的技术问题是克服上述现有技术存在的缺陷,提供一种结合PageRank的有向无环图电网企业频繁节点挖掘方法,以有效找出反应真实电网企业中复杂网络情况的频繁项集,构建候选频繁项集的二进制表,并构建二进制表的有向无环图,借鉴PageRank排名算法,结合复杂网络节点重要性评估特点,快速地评估有向无环图中节点的重要性,以提高频繁项集的挖掘效率。
为此,本发明采用如下的技术方案:一种有向无环图电网企业频繁节点挖掘方法,其包括:
构建候选频繁项集二进制表及其有向无环图的过程;借鉴PageRank排名算法,采用有向加权复杂网络节点重要性评估指标对网络中频繁节点进行评估,最终得到频繁项集节点。
作为上述技术方案的补充,其具体步骤如下:首先,通过一次遍历将事物数据库投影到二进制位表,避免了因频繁操作数据库读取数据导致的I/O过载问题;其次,根据生成二进制位表时统计的各个频繁项,构建有向无环图,记录每个事物中各组成项的出现频次,计算出每一项的支持度,并将频繁项支持度设为连接权值;最后,遍历构建的有向无环图,借鉴PageRank排名算法,采用有向加权复杂网络节点重要性评估指标对网络中的频繁节点进行评估,并最终得到频繁项集节点。
作为上述技术方案的补充,所述构建候选频繁项集二进制表及其有向无环图的过程,包括以下步骤:
a1)针对事物数据库D中的某一项,该项在事物数据库中的存在情况属于逻辑性是非门,该事物项在对应位置中若存在则设值为“1”,反之设值为“0”;对整个事物数据库D进行一次遍历,假设事物j中的第i个项存在于该事物中,对于该事物表示为j(i)=1,反之则设置为j(i)=0,对事物数据库中的每个事物做相同的操作,最后每个事物会产生一维二进制码,并且每个事物对应的一维二进制码的l1范数即表示该事物的支持度,至此完成事物数据库至二进制位表的映射过程;
a2)按支持度值从小到大的次序依次扫描步骤a1所得的每一个事物所对应的二进制向量,当扫描的事物对应的位置是数字1时,取出该事物并构造一个顶点;接着扫描下一个二进制向量相应的位置,若该值为1时,取出该二进制向量所对应事物项并构造此项的顶点,并将此顶点与上一顶点相连,边的权值设为1;若扫描所得的值为0,则跳过改二进制向量,进行下一二进制向量的扫描,直至扫描完所有的二进制向量;
a3)返回支持度最低的二进制向量,扫描下一个位置值为1的项,重复步骤a2),若图中需要添加点的位置已经存在,则将边的权值加1;建立完支持度最低项的有向无环图后再建立下一个事物项的有向无环图,直至所有项的有向无环图构建完成。
作为上述技术方案的补充,有向无环网络模型用G表示,G=(V,E),V={v1,v2,…,vn}为节点集合,E={e1,e2,…,em}∈V*V,为边集合,网络的节点数目为n=|V|,边数为m=|E|,vi∈V,i=1,2,…,n,表示网络中的一个节点,(vi,vj)∈E,表示节点vi到节点vj的一条有向边,ω(vi,vj)表示有向边(vi,vj)的权值;根据典型网络方向性的特点,定义节点强度包括入强度和出强度,每个节点的入强度Sin(vi)=Σω(vj,vi),其中vj∈Vin(vi),表示所有指向节点vi的节点的集合;每个节点的出强度Sout(vi)=Σω(vj,vi),其中vj∈Vout(vi),表示节点vi所指向的所有节点的集合。
作为上述技术方案的补充,借鉴PageRank算法,根据“从优质网页链接而来的网页必定还是优质网页”的回归关系,得公式如下:
其中,PR(x)为网页x的PageRank值,PR(Yi)为连接到网页x的网页Yi的PageRank值,Cout(Yi)为网页Yi的出链数量,σ为阻尼系数,表示任意时刻用户继续浏览的概率,阻尼系数越大,页面级别的收益越大,n为网页总数。
作为上述技术方案的补充,针对一个具有n个节点的有向加权复杂网络,假定对于节点v,其连接分别来自节点v1,v2,…,vi,ω(vi,v)表示节点vi到节点v的权值,其中i∈[1,l],则节点重要性指标NodeRank值NR(x)的计算公式列为:
其中,σ∈(0,1)为阻尼系数,NR(vi)为指向节点v的节点源vi自身的NodeRank值,为节点源vi的出强度Sout(vi),其中Vout(vi)={z1,z2,…,zmi},即节点源vi与包括节点v在内的z1,z2,…,zmi共mi个节点直接相连;节点v获得节点源vi的权重用边(vi,v)的权值与节点vi的出强度的比值来表示,即:
通过该权重对PageRank算法中的平均分配不合理性进行改进,通过对不同连接赋予不同的权值,提高相关之间重要节点的权重值,进一步得到准确的频繁项节点。
本发明的另一目的是提供一种有向无环图电网企业频繁节点挖掘系统,包括:
投影模块:通过一次遍历将事物数据库投影到二进制位表;
有向无环图构建模块:根据生成二进制位表时统计的各个频繁项,构建有向无环图,记录每个事物中各组成项的出现频次,计算出每一项的支持度,并将频繁项支持度设为连接权值;
频繁节点评估模块:遍历构建的有向无环图,借鉴PageRank排名算法,采用有向加权复杂网络节点重要性评估指标对网络中的频繁节点进行评估,并最终得到频繁项集节点。
本发明具有的有益效果如下:本发明借鉴PageRank排名算法,结合复杂网络节点重要性评估特点,快速地评估有向无环图中节点的重要性,提高了频繁项集的挖掘效率。
附图说明
图1是本发明对扫描数据库并获取有限无环图的流程图;
图2是本发明扫描所得有向无环图及其连接权值图;
图3是本发明保留连接权值较高的有向无环图;
图4是本发明方法与传统Apriori在不同支持阈值下的时间消耗对比图。
具体实施方式
下面结合说明书附图和具体实施方式对本发明作进一步说明。
实施例1
一种结合PageRank的有向无环图电网企业频繁节点挖掘方法,包括构建候选频繁项集二进制表及其有向无环图的过程、采用有向加权复杂网络节点重要性评估指标对网络中的频繁节点进行评估并最终得到频繁项节点的过程。
a)构建候选频繁项集二进制表及其有向无环图的过程,包括以下步骤:
a1)针对事务数据库D中的某一项,该项在事物数据库中的存在情况属于逻辑性是非门,因此,该事物项在对应位置中若存在则设值为“1”,反之设值为“0”。对整个事物数据库D进行一次遍历,假设事物j中的第i个项存在于该事物中,对于该事物可以表示为j(i)=1,反之则设置j(i)=0,对事物数据表中的每个事物做相同的操作,最后每个事物会产生一维二进制码,并且每个事物对应的一维二进制码的l1范数即可表示该事物的支持度,至此完成了事物数据库至二进制位表的映射过程。
a2)按支持度值从小到大的次序依次扫描步骤a1)所得的每一个事物所对应的二进制向量,当扫描的事物对应的位置是数字1时,取出该事物并构造一个顶点。接着扫描下一个二进制向量相应的位置,若该值为1时,取出该二进制向量所对应事物项并构造此项的顶点,并将此顶点与上一顶点相连,边的权值设为1;若扫描所有的值为0,则跳过改二进制向量,进行下一二进制向量的扫描,直至扫描完所以的二进制向量。
a3)返回支持度最低的二进制向量,扫描下一个位置值为1的项,重复步骤a2),若图中需要添加点的位置已经存在,则将边的权值加1。建立完支持度最低项的有向无环图后再建立下一个事物项的有向无环图,直至所有项的有向无环图构建完成。
b)采用有向加权复杂网络节点重要性评估网络中的频繁节点,包括以下步骤:
b1)有向无环网络模型用G表示,G=(V,E)。V={v1,v2,…,vn}为节点集合,E={e1,e2,…,em}∈V*V,为边集合。网络的节点数目为n=|V|,边数为m=|E|。vi∈V,(i=1,2,…,n),表示网络中的一个节点,(vi,vj)∈E,表示节点vi到节点vj的一条有向边,ω(vi,vj)表示有向边(vi,vj)的权值。根据典型网络方向性的特点,定义节点强度包括入强度和出强度,故每个节点的入强度Sin(vi)=Σω(vj,vi),vj∈Vin(vi),表示所有指向节点vi的节点的集合;每个节点的出强度Sout(vi)=Σω(vj,vi),其中vj∈Vout(vi),表示节点vi所指向的所有节点的集合。
b2)借鉴PageRank算法的思想,根据“从优质网页链接而来的网页必定还是优质网页”的回归关系,可得公式如下:
其中,PR(x)为网页x的PageRank值,PR(Yi)为连接到网页x的网页Yi的PageRank值,Cout(Yi)为网页Yi的出链数量,σ为阻尼系数,表示任意时刻用户继续浏览的概率,阻尼系数越大,页面级别的收益越大,n为网页总数。
b3)针对一个具有n个节点的有向加权复杂网络,假定对于节点v,其连接分别来自节点v1,v2,…,vi。ω(vi,v)表示节点vi到节点v的权值,其中i∈[1,l]。则节点重要性指标NodeRank值NR(x)的计算公式可列为:
其中,σ∈(0,1)为阻尼系数,NR(vi)为指向节点v的节点源vi自身的NodeRank值,为节点源vi的出强度Sout(vi),其中Vout(vi)={z1,z2,…,zmi},即节点源vi与包括节点v在内的z1,z2,…,zmi等mi个节点直接相连。节点v获得节点源vi的权重可以用边(vi,v)的权值与节点vi的出强度的比值来表示,即:
通过该权重可对PageRank算法中的平均分配不合理性进行改进,通过对不同连接赋予不同的权值,提高相关之间重要节点的权重值,进一步得到准确的频繁项节点。
以表1中的事物数据库集D为例,在此设置最小支持值为min_s=3,根据定义1对该数据库集D的支持度进行计算,计算出数据集的1-项候选项集及各个项的支持度,1-项候选项集见表2。经过判断和填充后的事务项二进制位表表示见表3。
表1事物数据集D
表2 1-项候选集项
表3二进制位表D’
实施例2
本实施例提供一种有向无环图电网企业频繁节点挖掘系统,包括:
投影模块:通过一次遍历将事物数据库投影到二进制位表;
有向无环图构建模块:根据生成二进制位表时统计的各个频繁项,构建有向无环图,记录每个事物中各组成项的出现频次,计算出每一项的支持度,并将频繁项支持度设为连接权值;
频繁节点评估模块:遍历构建的有向无环图,借鉴PageRank排名算法,采用有向加权复杂网络节点重要性评估指标对网络中的频繁节点进行评估,并最终得到频繁项集节点。
以上实施方式仅用于说明本发明,而并非对本发明的限制,有关技术领域的普通技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明的范畴,本发明的保护范围应由权利要求限定。

Claims (7)

1.一种有向无环图电网企业频繁节点挖掘方法,其包括:
构建候选频繁项集二进制表及其有向无环图的过程;借鉴PageRank排名算法,采用有向加权复杂网络节点重要性评估指标对网络中频繁节点进行评估,最终得到频繁项集节点。
2.根据权利要求1所述的有向无环图电网企业频繁节点挖掘方法,其特征在于,具体步骤如下:首先,通过一次遍历将事物数据库投影到二进制位表;其次,根据生成二进制位表时统计的各个频繁项,构建有向无环图,记录每个事物中各组成项的出现频次,计算出每一项的支持度,并将频繁项支持度设为连接权值;最后,遍历构建的有向无环图,借鉴PageRank排名算法,采用有向加权复杂网络节点重要性评估指标对网络中的频繁节点进行评估,并最终得到频繁项集节点。
3.根据权利要求1或2所述的有向无环图电网企业频繁节点挖掘方法,其特征在于,所述构建候选频繁项集二进制表及其有向无环图的过程中,包括以下步骤:
a1)针对事物数据库D中的某一项,该项在事物数据库中的存在情况属于逻辑性是非门,该事物项在对应位置中若存在则设值为“1”,反之设值为“0”;对整个事物数据库D进行一次遍历,假设事物j中的第i个项存在于该事物中,对于该事物表示为j(i)=1,反之则设置为j(i)=0,对事物数据库中的每个事物做相同的操作,最后每个事物会产生一维二进制码,并且每个事物对应的一维二进制码的l1范数即表示该事物的支持度,至此完成事物数据库至二进制位表的映射过程;
a2)按支持度值从小到大的次序依次扫描步骤a1所得的每一个事物所对应的二进制向量,当扫描的事物对应的位置是数字1时,取出该事物并构造一个顶点;接着扫描下一个二进制向量相应的位置,若该值为1时,取出该二进制向量所对应事物项并构造此项的顶点,并将此顶点与上一顶点相连,边的权值设为1;若扫描所得的值为0,则跳过改二进制向量,进行下一二进制向量的扫描,直至扫描完所有的二进制向量;
a3)返回支持度最低的二进制向量,扫描下一个位置值为1的项,重复步骤a2),若图中需要添加点的位置已经存在,则将边的权值加1;建立完支持度最低项的有向无环图后再建立下一个事物项的有向无环图,直至所有项的有向无环图构建完成。
4.根据权利要求1或2所述的有向无环图电网企业频繁节点挖掘方法,其特征在于,
有向无环网络模型用G表示,G=(V,E),V={v1,v2,…,vn}为节点集合,E={e1,e2,…,em}∈V*V,为边集合,网络的节点数目为n=|V|,边数为m=|E|,vi∈V,i=1,2,…,n,表示网络中的一个节点,(vi,vj)∈E,表示节点vi到节点vj的一条有向边,ω(vi,vj)表示有向边(vi,vj)的权值;根据典型网络方向性的特点,定义节点强度包括入强度和出强度,每个节点的入强度Sin(vi)=Σω(vj,vi),其中vj∈Vin(vi),表示所有指向节点vi的节点的集合;每个节点的出强度Sout(vi)=Σω(vj,vi),其中vj∈Vout(vi),表示节点vi所指向的所有节点的集合。
5.根据权利要求4所述的有向无环图电网企业频繁节点挖掘方法,其特征在于,借鉴PageRank算法,根据“从优质网页链接而来的网页必定还是优质网页”的回归关系,得公式如下:
<mrow> <mi>P</mi> <mi>R</mi> <mrow> <mo>(</mo> <mi>x</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <mn>1</mn> <mo>-</mo> <mi>&amp;sigma;</mi> </mrow> <mi>n</mi> </mfrac> <mo>+</mo> <mi>&amp;sigma;</mi> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <mfrac> <mrow> <mi>P</mi> <mi>R</mi> <mrow> <mo>(</mo> <msub> <mi>Y</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> </mrow> <mrow> <msub> <mi>C</mi> <mrow> <mi>o</mi> <mi>u</mi> <mi>t</mi> </mrow> </msub> <mrow> <mo>(</mo> <msub> <mi>Y</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>,</mo> </mrow>
其中,PR(x)为网页x的PageRank值,PR(Yi)为连接到网页x的网页Yi的PageRank值,Cout(Yi)为网页Yi的出链数量,σ为阻尼系数,表示任意时刻用户继续浏览的概率,阻尼系数越大,页面级别的收益越大,n为网页总数。
6.根据权利要求5所述的有向无环图电网企业频繁节点挖掘方法,其特征在于,
针对一个具有n个节点的有向加权复杂网络,假定对于节点v,其连接分别来自节点v1,v2,…,vi,ω(vi,v)表示节点vi到节点v的权值,其中i∈[1,l],则节点重要性指标NodeRank值NR(x)的计算公式列为:
<mrow> <mi>N</mi> <mi>R</mi> <mrow> <mo>(</mo> <mi>v</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <mn>1</mn> <mo>-</mo> <mi>&amp;sigma;</mi> </mrow> <mi>n</mi> </mfrac> <mo>+</mo> <mi>&amp;sigma;</mi> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mn>1</mn> </munderover> <mfrac> <mrow> <mi>&amp;omega;</mi> <mrow> <mo>(</mo> <msub> <mi>v</mi> <mi>i</mi> </msub> <mo>,</mo> <mi>v</mi> <mo>)</mo> </mrow> </mrow> <mrow> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <msub> <mi>m</mi> <mi>i</mi> </msub> </munderover> <mi>&amp;omega;</mi> <mrow> <mo>(</mo> <msub> <mi>v</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>z</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> </mrow> </mfrac> <mi>N</mi> <mi>R</mi> <mrow> <mo>(</mo> <msub> <mi>v</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>,</mo> </mrow>
其中,σ∈(0,1)为阻尼系数,NR(vi)为指向节点v的节点源vi自身的NodeRank值,为节点源vi的出强度Sout(vi),其中Vout(vi)={z1,z2,…,zmi},即节点源vi与包括节点v在内的z1,z2,…,zmi共mi个节点直接相连;节点v获得节点源vi的权重用边(vi,v)的权值与节点vi的出强度的比值来表示,即:
<mrow> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <msub> <mi>m</mi> <mi>i</mi> </msub> </munderover> <mi>&amp;omega;</mi> <mrow> <mo>(</mo> <msub> <mi>v</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>z</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mo>,</mo> </mrow>
通过该权重对PageRank算法中的平均分配不合理性进行改进,通过对不同连接赋予不同的权值,提高相关之间重要节点的权重值,进一步得到准确的频繁项节点。
7.一种有向无环图电网企业频繁节点挖掘系统,其特征在于,包括:
投影模块:通过一次遍历将事物数据库投影到二进制位表;
有向无环图构建模块:根据生成二进制位表时统计的各个频繁项,构建有向无环图,记录每个事物中各组成项的出现频次,计算出每一项的支持度,并将频繁项支持度设为连接权值;
频繁节点评估模块:遍历构建的有向无环图,借鉴PageRank排名算法,采用有向加权复杂网络节点重要性评估指标对网络中的频繁节点进行评估,并最终得到频繁项集节点。
CN201710989431.9A 2017-10-20 2017-10-20 一种有向无环图电网企业频繁节点挖掘方法及挖掘系统 Active CN107908665B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710989431.9A CN107908665B (zh) 2017-10-20 2017-10-20 一种有向无环图电网企业频繁节点挖掘方法及挖掘系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710989431.9A CN107908665B (zh) 2017-10-20 2017-10-20 一种有向无环图电网企业频繁节点挖掘方法及挖掘系统

Publications (2)

Publication Number Publication Date
CN107908665A true CN107908665A (zh) 2018-04-13
CN107908665B CN107908665B (zh) 2021-01-08

Family

ID=61841465

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710989431.9A Active CN107908665B (zh) 2017-10-20 2017-10-20 一种有向无环图电网企业频繁节点挖掘方法及挖掘系统

Country Status (1)

Country Link
CN (1) CN107908665B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108877895A (zh) * 2018-05-08 2018-11-23 天津大学 一种饮食管理系统及其管理方法
CN110110529A (zh) * 2019-05-20 2019-08-09 北京理工大学 一种基于复杂网络的软件网络关键节点挖掘方法
CN110442616A (zh) * 2018-05-02 2019-11-12 中国科学院声学研究所 一种针对大数据量的页面访问路径分析方法与系统
CN115858875A (zh) * 2023-02-10 2023-03-28 武汉中科通达高新技术股份有限公司 基于频繁图模式挖掘的企业员工层级关系发现方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100011410A1 (en) * 2008-07-10 2010-01-14 Weimin Liu System and method for data mining and security policy management
CN103823823A (zh) * 2013-07-08 2014-05-28 电子科技大学 基于频繁项集挖掘算法的反规范化策略选择方法
CN104715073A (zh) * 2015-04-03 2015-06-17 江苏物联网研究发展中心 基于改进Apriori算法的关联规则挖掘系统
CN105740245A (zh) * 2014-12-08 2016-07-06 北京邮电大学 频繁项集挖掘方法
CN106649479A (zh) * 2016-09-29 2017-05-10 国网山东省电力公司电力科学研究院 一种基于概率图的变压器状态关联规则挖掘方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100011410A1 (en) * 2008-07-10 2010-01-14 Weimin Liu System and method for data mining and security policy management
CN103823823A (zh) * 2013-07-08 2014-05-28 电子科技大学 基于频繁项集挖掘算法的反规范化策略选择方法
CN105740245A (zh) * 2014-12-08 2016-07-06 北京邮电大学 频繁项集挖掘方法
CN104715073A (zh) * 2015-04-03 2015-06-17 江苏物联网研究发展中心 基于改进Apriori算法的关联规则挖掘系统
CN106649479A (zh) * 2016-09-29 2017-05-10 国网山东省电力公司电力科学研究院 一种基于概率图的变压器状态关联规则挖掘方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110442616A (zh) * 2018-05-02 2019-11-12 中国科学院声学研究所 一种针对大数据量的页面访问路径分析方法与系统
CN110442616B (zh) * 2018-05-02 2022-10-14 郑州芯兰德网络科技有限公司 一种针对大数据量的页面访问路径分析方法与系统
CN108877895A (zh) * 2018-05-08 2018-11-23 天津大学 一种饮食管理系统及其管理方法
CN110110529A (zh) * 2019-05-20 2019-08-09 北京理工大学 一种基于复杂网络的软件网络关键节点挖掘方法
CN110110529B (zh) * 2019-05-20 2020-12-11 北京理工大学 一种基于复杂网络的软件网络关键节点挖掘方法
CN115858875A (zh) * 2023-02-10 2023-03-28 武汉中科通达高新技术股份有限公司 基于频繁图模式挖掘的企业员工层级关系发现方法及装置

Also Published As

Publication number Publication date
CN107908665B (zh) 2021-01-08

Similar Documents

Publication Publication Date Title
CN107908665A (zh) 一种有向无环图电网企业频繁节点挖掘方法及挖掘系统
Coenen et al. The effect of threshold values on association rule based classification accuracy
CN103823823B (zh) 基于频繁项集挖掘算法的反规范化策略选择方法
Rahman et al. Discretization of continuous attributes through low frequency numerical values and attribute interdependency
CN106203507A (zh) 一种基于分布式计算平台改进的k均值聚类方法
CN105678607A (zh) 一种基于改进的K-Means算法的订单分批方法
CN108334580A (zh) 一种结合链接和属性信息的社区发现方法
CN106326637A (zh) 一种基于局部有效路径度的链路预测方法
CN104765839A (zh) 一种基于属性间相关系数的数据分类方法
CN109978050A (zh) 基于svm-rf的决策规则提取及约简方法
CN103455612B (zh) 基于两阶段策略的非重叠与重叠网络社区检测方法
Jiang et al. A method for discrete stochastic MADM problems based on the ideal and nadir solutions
CN108765180A (zh) 基于影响力与种子扩展的重叠社区发现方法
CN107870956A (zh) 一种高效用项集挖掘方法、装置及数据处理设备
CN105260387A (zh) 一种面向海量事务数据库的关联规则分析方法
Liu et al. A multi-objective model for discovering high-quality knowledge based on data quality and prior knowledge
CN106251241A (zh) 一种基于特征选择改进的LR‑Bagging算法
CN103310027B (zh) 用于地图模板匹配的规则提取方法
CN109978051A (zh) 基于混合神经网络的监督分类方法
CN109344963A (zh) 极限学习机中超大规模隐含层节点快速选择方法
CN103294828B (zh) 数据挖掘模型维度的验证方法和验证装置
CN106952198A (zh) 一种基于Apriori算法的学生就业数据分析方法
Arevalillo-Herráez et al. Improving distance based image retrieval using non-dominated sorting genetic algorithm
Hsu et al. A study of data fusion in Cayley graphs G (s/sub n/, p/sub n/)
Ninoria et al. A survey on high utility itemsets mining

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant