CN104361036A - 告警事件关联规则挖掘方法 - Google Patents
告警事件关联规则挖掘方法 Download PDFInfo
- Publication number
- CN104361036A CN104361036A CN201410591113.3A CN201410591113A CN104361036A CN 104361036 A CN104361036 A CN 104361036A CN 201410591113 A CN201410591113 A CN 201410591113A CN 104361036 A CN104361036 A CN 104361036A
- Authority
- CN
- China
- Prior art keywords
- support
- frequent
- item
- binomial
- array
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2453—Query optimisation
Abstract
本发明涉及网络管理技术领域,是一种告警事件关联规则挖掘方法,基于分支筛选优化策略和Apriori算法:依次读取数据库里的每个事务项,并生成与每个事务项相对应的支持度计算支撑数组;在Apriori算法的基础上,执行分支筛选优化策略,生成频繁项集;在频繁项集和支持度计算支撑数组的基础上,执行关联规则的置信度计算,在最小置信度约束下,得到有效的关联规则。本发明通过构建支持度计算支撑数组,简化了支持度的计算,大大减少了读取数据库的次数,提高了算法效率;通过构建邻接字典链表,可以动态发现满足支持度要求的二项频繁集,提供了分支筛选优化策略的执行基础;动态删除无效分支,快速生成二项频繁集,提高了算法效率。
Description
技术领域
本发明涉及网络管理技术领域,是一种告警事件关联规则挖掘方法。
背景技术
网络告警事件的关联规则技术作为现代网络管理中的标志性技术,在网络故障管理和数据挖掘中占据着重要地位。随着网络规模的不断扩张,网络告警事件频发,但大部分网络告警事件是无用的。如何在这些事件中找到可用的部分,如何对可用部分进行分析,这是近年来的研究热点。因此,网络告警事件的管理规则挖掘在网络管理中得到了大量应用和进一步发展。
算法是一种可用于网络告警事件关联规则挖掘的优秀算法,在实践中得到了广泛应用,很多专家学者对其进行了深入研究并做了大量改进。Apriori算法通过迭代计算Ck和Lk来寻找候选集,消耗在C1、L1、C2、L2生成上的时间太多,效率比较低(随着K的增大,Ck和LK减少的很快,特别是当支持度比较大的时候);此外,Apriori算法在执行过程中,需要频繁读取数据库,这也极大地影响了计算效率。
发明内容
本发明提供了一种告警事件关联规则挖掘方法,克服了上述现有技术之不足,其能有效解决现有Apriori算法中存在的通过迭代计算Ck和Lk来寻找候选集,消耗在C1、L1、C2、L2生成上的时间太多,效率比较低的问题,以及Apriori算法在执行过程中,需要频繁读取数据库,极大地影响计算效率的问题。
本发明的技术方案是通过以下措施来实现的:一种告警事件关联规则挖掘方法,基于分支筛选优化策略和Apriori算法,具体按照以下步骤进行:步骤101,依次读取数据库中的每个事务项,并生成与每个事务项相对应的支持度计算支撑数组;步骤102,在Apriori算法的基础上,执行分支筛选优化策略,生成频繁项集;步骤103,在频繁项集和支持度计算支撑数组的基础上,执行关联规则的置信度计算,在最小置信度约束下,得到关联规则。
下面是对上述发明技术方案的进一步优化或/和改进:
上述在步骤101中,所述支持度计算支撑数组的构建方式为
其中,令t代表数据库中的事务项的数量,则支持度计算支撑数组的数量为t,i的取值范围为1至t;n代表数据项的数量,当某个数据项在事务中存在时,设置相应的数组元素为1,否则设置相应的数组元素为0。
上述在步骤102中,对第一个事务项所属的数据项集执行笛卡尔乘积,得到二项频繁集候选集,并建立邻接字典链表,将二项频繁集与邻接字典链表一一对应;迭代地生成第2至第t个事务项的二项频繁集候选集;分支筛选优化策略为:根据支持度计算支撑数组来计算相应二项频繁集的支持度,并动态的根据最小支持度,剔除掉无用的数据项;基于Apriori算法,在二项频繁集候选集的基础上依次生成三项频繁集候选集和三项以上的频繁集候选集,直到完成候选集的计算。
上述根据支持度计算支撑数组计算相应二项频繁集的支持度的算法为:
其中,p、q、r为数据项。
上述建立邻接字典链表的方式为:计算邻接字典链表中母节点的数量
其中
为二项频繁项集中二项频繁集的个数,
为确保
大于
的最小次幂;
确定二项频繁集候选集中所有数据项的位置:
其中
代表二项频繁集中第一项的索引,
代表二项频繁集中第二项的索引。
本发明在Apriori算法的基础上,采用分支筛选优化策略,来对告警事件的关联规则进行挖掘。本发明通过构建支持度计算支撑数组,简化了支持度的计算,并且大大减少了读取数据库的次数,提高了算法效率;通过构建邻接字典链表,可以动态发现满足支持度要求的二项频繁集,提供了分支筛选优化策略的执行基础;采用了分支筛选优化策略,动态删除无效分支,快速生成二项频繁集,大大提高了算法效率。
附图说明
附图1为本发明告警事件关联规则挖掘方法的示意图。
附图2为为邻接字典链表示意图。
附图3为本发明告警事件关联规则挖掘方法的逻辑判断流程示意图。
具体实施方式
本发明不受下述实施例的限制,可根据本发明的技术方案与实际情况来确定具体的实施方式。
下面结合实施例及附图对本发明作进一步描述:
如附图1所示,该告警事件关联规则挖掘方法,基于分支筛选优化策略和Apriori算法,具体按照以下步骤进行:
步骤101,依次读取数据库中的每个事务项,并生成与每个事务项相对应的支持度计算支撑数组;
步骤102,在Apriori算法的基础上,执行分支筛选优化策略,生成频繁项集;
步骤103,在频繁项集和支持度计算支撑数组的基础上,执行关联规则的置信度计算,在最小置信度约束下,得到关联规则。
如附图2所示,本发明方法构建的邻接字典链表中母节点有N项,N的计算公式为:
其中
为二项频繁项集中二项频繁集的个数,
为确保
大于
的最小次幂。
确定二项频繁集候选集中所有数据项的位置:
其中I
m
代表二项频繁集中第一项的索引,I
n
代表二项频繁集中第二项的索引。
每个母节点对应着一个节点{ N1,N2,Number,Flag },其中N1和N2为二项频繁集中数据项的两个索引,这与母节点的Value是一一对应的,Number为{ N1,N2 }节点出现的次数,Flag标示初始值为0,当Number的值达到最小支持度,Flag的值置为1。
当Flag值为1时,对所属的两个数据项做“已选定”标记,在接下来的所有算法流程中不再参与计算,这就实现了动态删除无效分支,大大提高了算法效率。
如附图3所示,本发明方法所述分支筛选优化策略的流程为:
对第一个事务所属的数据项集执行笛卡尔乘积,得到二项频繁集候选集,并建立邻接字典链表,将二项频繁集与其一一对应;
迭代地生成第2至第t个事务的二项频繁集候选集,在算法执行过程中,根据支持度计算支撑数组来计算相应二项频繁集的支持度,并动态的根据最小支持度剔除掉无用的数据项,达到分支筛选的效果;
根据Apriori算法的思想,在二项频繁集候选集的基础上生成三项频繁集候选集、四项频繁集候选集、五项频繁集候选集……直到完成候选集的计算。
以上技术特征构成了本发明的最佳实施例,其具有较强的适应性和最佳实施效果,可根据实际需要增减非必要的技术特征,来满足不同情况的需求。
Claims (5)
1.一种告警事件关联规则挖掘方法,其特征在于基于分支筛选优化策略和Apriori算法,具体按照以下步骤进行:
步骤101,依次读取数据库中的每个事务项,并生成与每个事务项相对应的支持度计算支撑数组;
步骤102,在Apriori算法的基础上,执行分支筛选优化策略,生成频繁项集;
步骤103,在频繁项集和支持度计算支撑数组的基础上,执行关联规则的置信度计算,在最小置信度约束下,得到关联规则。
2.根据权利要求1所述的告警事件关联规则挖掘方法,其特征在于在步骤101中,所述支持度计算支撑数组的构建方式为
其中,令t代表数据库中的事务项的数量,则支持度计算支撑数组的数量为t,i的取值范围为1至t;n代表数据项的数量,当某个数据项在事务中存在时,设置相应的数组元素为1,否则设置相应的数组元素为0。
3.根据权利要求2所述的告警事件关联规则挖掘方法,其特征在于在步骤102中,对第一个事务项所属的数据项集执行笛卡尔乘积,得到二项频繁集候选集,并建立邻接字典链表,将二项频繁集与邻接字典链表一一对应;
迭代地生成第2至第t个事务项的二项频繁集候选集;
分支筛选优化策略为:根据支持度计算支撑数组来计算相应二项频繁集的支持度,并动态的根据最小支持度,剔除掉无用的数据项;
基于Apriori算法,在二项频繁集候选集的基础上依次生成三项频繁集候选集和三项以上的频繁集候选集,直到完成候选集的计算。
4.根据权利要求3所述的告警事件关联规则挖掘方法,其特征在于根据支持度计算支撑数组计算相应二项频繁集的支持度的算法为:
其中,p、q、r为数据项。
5.根据权利要求3或4所述的告警事件关联规则挖掘方法,其特征在于建立邻接字典链表的方式为:
计算邻接字典链表中母节点的数量
其中为二项频繁项集中二项频繁集的个数,为确保大于的最小次幂;
确定二项频繁集候选集中所有数据项的位置:
其中代表二项频繁集中第一项的索引,代表二项频繁集中第二项的索引。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410591113.3A CN104361036B (zh) | 2014-10-29 | 2014-10-29 | 告警事件关联规则挖掘方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410591113.3A CN104361036B (zh) | 2014-10-29 | 2014-10-29 | 告警事件关联规则挖掘方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104361036A true CN104361036A (zh) | 2015-02-18 |
CN104361036B CN104361036B (zh) | 2017-10-17 |
Family
ID=52528298
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410591113.3A Active CN104361036B (zh) | 2014-10-29 | 2014-10-29 | 告警事件关联规则挖掘方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104361036B (zh) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105677759A (zh) * | 2015-12-30 | 2016-06-15 | 国家电网公司 | 一种信息通信网络中的告警关联性分析方法 |
CN105760279A (zh) * | 2016-03-09 | 2016-07-13 | 北京国电通网络技术有限公司 | 分布式数据库集群故障预警关联树生成方法及系统 |
CN106844736A (zh) * | 2017-02-13 | 2017-06-13 | 北方工业大学 | 基于时空网络的时空同现模式挖掘方法 |
CN107835087A (zh) * | 2017-09-14 | 2018-03-23 | 北京科东电力控制系统有限责任公司 | 一种基于频繁模式挖掘的安全设备告警规则自动提取方法 |
CN109189736A (zh) * | 2018-08-01 | 2019-01-11 | 中国联合网络通信集团有限公司 | 一种告警关联规则的生成方法和装置 |
CN109358602A (zh) * | 2018-10-23 | 2019-02-19 | 山东中创软件商用中间件股份有限公司 | 一种故障分析方法、装置及相关设备 |
CN109412867A (zh) * | 2018-12-06 | 2019-03-01 | 国家电网有限公司信息通信分公司 | 一种告警关联合并方法、装置、系统、设备和存储介质 |
CN110399278A (zh) * | 2019-07-24 | 2019-11-01 | 江苏物联网研究发展中心 | 基于数据中心异常监控的告警融合系统及方法 |
CN110399262A (zh) * | 2019-06-17 | 2019-11-01 | 平安科技(深圳)有限公司 | 运维监测告警收敛方法、装置、计算机设备及存储介质 |
CN110992109A (zh) * | 2019-12-16 | 2020-04-10 | 重庆锐云科技有限公司 | 基于关联规则的房地产客户分析方法、装置及存储介质 |
CN111431736A (zh) * | 2020-02-27 | 2020-07-17 | 华为技术有限公司 | 告警关联规则生成方法和装置 |
CN111680973A (zh) * | 2020-05-29 | 2020-09-18 | 成都新希望金融信息有限公司 | 一种催收系统的催收任务优先级智能编排方法 |
CN113835919A (zh) * | 2021-09-26 | 2021-12-24 | 中国联合网络通信集团有限公司 | 数据处理方法、服务器及存储介质 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108267962B (zh) * | 2016-12-30 | 2021-08-06 | 中国移动通信有限公司研究院 | 一种控制方法和装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080315961A1 (en) * | 2007-06-19 | 2008-12-25 | Harris Stratex Networks Operating Corporation | Quality of Phase Lock and Loss of Lock Detector |
CN101937447A (zh) * | 2010-06-07 | 2011-01-05 | 华为技术有限公司 | 一种告警关联规则挖掘方法、规则挖掘引擎及系统 |
-
2014
- 2014-10-29 CN CN201410591113.3A patent/CN104361036B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080315961A1 (en) * | 2007-06-19 | 2008-12-25 | Harris Stratex Networks Operating Corporation | Quality of Phase Lock and Loss of Lock Detector |
CN101937447A (zh) * | 2010-06-07 | 2011-01-05 | 华为技术有限公司 | 一种告警关联规则挖掘方法、规则挖掘引擎及系统 |
Non-Patent Citations (1)
Title |
---|
朱秋艳: ""基于关联规则挖掘的网络告警关联"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105677759B (zh) * | 2015-12-30 | 2019-11-12 | 国家电网公司 | 一种信息通信网络中的告警关联性分析方法 |
CN105677759A (zh) * | 2015-12-30 | 2016-06-15 | 国家电网公司 | 一种信息通信网络中的告警关联性分析方法 |
CN105760279A (zh) * | 2016-03-09 | 2016-07-13 | 北京国电通网络技术有限公司 | 分布式数据库集群故障预警关联树生成方法及系统 |
CN105760279B (zh) * | 2016-03-09 | 2018-09-07 | 北京国电通网络技术有限公司 | 分布式数据库集群故障预警关联树生成方法及系统 |
CN106844736A (zh) * | 2017-02-13 | 2017-06-13 | 北方工业大学 | 基于时空网络的时空同现模式挖掘方法 |
CN107835087A (zh) * | 2017-09-14 | 2018-03-23 | 北京科东电力控制系统有限责任公司 | 一种基于频繁模式挖掘的安全设备告警规则自动提取方法 |
CN107835087B (zh) * | 2017-09-14 | 2022-09-02 | 北京科东电力控制系统有限责任公司 | 一种基于频繁模式挖掘的安全设备告警规则自动提取方法 |
CN109189736A (zh) * | 2018-08-01 | 2019-01-11 | 中国联合网络通信集团有限公司 | 一种告警关联规则的生成方法和装置 |
CN109189736B (zh) * | 2018-08-01 | 2021-01-26 | 中国联合网络通信集团有限公司 | 一种告警关联规则的生成方法和装置 |
CN109358602A (zh) * | 2018-10-23 | 2019-02-19 | 山东中创软件商用中间件股份有限公司 | 一种故障分析方法、装置及相关设备 |
CN109412867B (zh) * | 2018-12-06 | 2022-02-08 | 国家电网有限公司信息通信分公司 | 一种告警关联合并方法、装置、系统、设备和存储介质 |
CN109412867A (zh) * | 2018-12-06 | 2019-03-01 | 国家电网有限公司信息通信分公司 | 一种告警关联合并方法、装置、系统、设备和存储介质 |
CN110399262A (zh) * | 2019-06-17 | 2019-11-01 | 平安科技(深圳)有限公司 | 运维监测告警收敛方法、装置、计算机设备及存储介质 |
CN110399278A (zh) * | 2019-07-24 | 2019-11-01 | 江苏物联网研究发展中心 | 基于数据中心异常监控的告警融合系统及方法 |
CN110399278B (zh) * | 2019-07-24 | 2023-06-06 | 江苏物联网研究发展中心 | 基于数据中心异常监控的告警融合系统及方法 |
CN110992109A (zh) * | 2019-12-16 | 2020-04-10 | 重庆锐云科技有限公司 | 基于关联规则的房地产客户分析方法、装置及存储介质 |
CN111431736B (zh) * | 2020-02-27 | 2022-05-13 | 华为技术有限公司 | 告警关联规则生成方法和装置 |
CN111431736A (zh) * | 2020-02-27 | 2020-07-17 | 华为技术有限公司 | 告警关联规则生成方法和装置 |
CN111680973A (zh) * | 2020-05-29 | 2020-09-18 | 成都新希望金融信息有限公司 | 一种催收系统的催收任务优先级智能编排方法 |
CN111680973B (zh) * | 2020-05-29 | 2023-10-24 | 成都新希望金融信息有限公司 | 一种催收系统的催收任务优先级智能编排方法 |
CN113835919A (zh) * | 2021-09-26 | 2021-12-24 | 中国联合网络通信集团有限公司 | 数据处理方法、服务器及存储介质 |
CN113835919B (zh) * | 2021-09-26 | 2023-06-13 | 中国联合网络通信集团有限公司 | 数据处理方法、服务器及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN104361036B (zh) | 2017-10-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104361036A (zh) | 告警事件关联规则挖掘方法 | |
CN104657418B (zh) | 一种基于隶属度传播的复杂网络模糊社团挖掘方法 | |
Ouyang et al. | Spatial co-location pattern discovery from fuzzy objects | |
CN107147110B (zh) | 考虑多风场预测误差时空相关性的储能容量优化配置方法 | |
CN109902203A (zh) | 基于边的随机游走的网络表示学习方法和装置 | |
CN103020267B (zh) | 基于三角簇多标签传播的复杂网络社区结构挖掘方法 | |
CN102306183B (zh) | 一种对事务数据流进行闭合加权频繁模式挖掘的方法 | |
CN105740245A (zh) | 频繁项集挖掘方法 | |
CN103678671A (zh) | 一种社交网络中的动态社区检测方法 | |
CN103577896A (zh) | 一种大规模电网整定计算的区域划分方法 | |
CN104408127A (zh) | 基于深度优先的不确定数据最大模式挖掘方法 | |
CN107194498A (zh) | 一种水文监测网络的优化方法 | |
CN107145609A (zh) | 基于FP‑Growth算法的隧道交通事故关联规则算法 | |
CN109697206A (zh) | 一种分布式函数依赖关系挖掘方法 | |
CN104112236A (zh) | 风电场发电功率的计算方法 | |
CN104346442A (zh) | 一种面向流程对象数据的规则提取方法 | |
CN104731885A (zh) | 一种基于层次-语义的多尺度空间数据拓扑关系维护方法 | |
CN105760549B (zh) | 基于属性图模型的近邻查询方法 | |
Le et al. | An efficient incremental mining approach based on IT-tree | |
CN104462095A (zh) | 一种查询语句公共部分的提取方法及装置 | |
Liu et al. | The Kirchhoff index of folded hypercubes and some variant networks | |
CN103699690A (zh) | 一种寻找流程模型中最小变化区域的精确方法 | |
Sheng et al. | A novel parameter estimation method for Muskingum model using new Newton-type trust region algorithm | |
CN103763302B (zh) | 一种web服务组合生成方法 | |
CN104991964A (zh) | 基于时间维度的同比环比计算方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |