CN100393048C - 一种建立网络故障诊断规则库的方法 - Google Patents

一种建立网络故障诊断规则库的方法 Download PDF

Info

Publication number
CN100393048C
CN100393048C CNB2006100181534A CN200610018153A CN100393048C CN 100393048 C CN100393048 C CN 100393048C CN B2006100181534 A CNB2006100181534 A CN B2006100181534A CN 200610018153 A CN200610018153 A CN 200610018153A CN 100393048 C CN100393048 C CN 100393048C
Authority
CN
China
Prior art keywords
attribute
rule
subclass
information table
collection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB2006100181534A
Other languages
English (en)
Other versions
CN1801745A (zh
Inventor
周建国
晏蒲柳
郭成城
吴静
陈立家
江昊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University WHU
Original Assignee
Wuhan University WHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University WHU filed Critical Wuhan University WHU
Priority to CNB2006100181534A priority Critical patent/CN100393048C/zh
Publication of CN1801745A publication Critical patent/CN1801745A/zh
Application granted granted Critical
Publication of CN100393048C publication Critical patent/CN100393048C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明涉及一种建立网络故障诊断规则库的方法,其步骤包括:(1)网络中的设备将故障数据输入的步骤;(2)对故障数据中的条件属性进行预处理的步骤;(3)将预处理后的故障数据组成一个决策信息表的步骤;(4)对决策信息表进行约简的步骤;(5)生成规则库并存储的步骤。本发明方法的对决策信息表进行约简的步骤利用各对象之间的差异性得到对象分类的规则,利用同类对象属性之间的相似性对得到的规则合并,并最终得到最佳规则,即规则数最少,规则包含的属性最少。这样规则存储空间少,在进行故障诊断时速度更快。

Description

一种建立网络故障诊断规则库的方法
技术领域
本发明涉及计算机网络,具体涉及用于诊断计算机网络故障的规则库,特别是建立网络故障诊断规则库的方法。
背景技术
计算机网络中,网络管理软件每天都产生大量的数据存于网络管理数据库中,这些数据中包括轮询得到的MIB变量(设备自带的管理信息库变量)、网络性能测量数据、网络告警等。网络管理员被大量的信息所淹没,无法发现数据中存在的知识,导致了“数据爆炸而知识贫乏”。如何利用知识发现技术,从这些数据中挖掘出新颖的知识并且进行故障预测和故障的自动恢复是一项很有应用前景的技术。有关的技术包括基于关联规则的网络告警数据库知识发现、基于粗集理论的MIB变量开采、基于贝叶斯网络的告警关联等等。其大体的步骤都是从网络管理数据库中提取故障数据,对数据进行预处理,依照一定的模型或者一定的知识抽取方法从这些数据中提取知识,将这些知识用规则或者图表的形式表达,从而便于以后的网络故障诊断。
现有的网络故障知识获取的方法主要有基于粗集理论的MIB变量开采技术,该技术通过对网络故障采集的MIB变量离散化,运用粗集方法去除错误和不必要的数据,找出反映网络故障现象的MIB变量组及其逻辑组合关系,提取表现故障现象的规则,并将规则用于设计计算机网络故障诊断。其相关文章有:《武汉大学学报(理学版)》(2001,Vol.47,No.3)的文章“基于粗集理论的MIB变量开采”、《兵工自动化》(2003,Vol.22,No.3)的文章“基于粗集理论的规则知识获取”。
现有的获取网络故障诊断规则库方法的具体步骤如下:
(1)网络中的设备将故障数据输入的步骤;
(2)对故障数据中的条件属性进行预处理的步骤,它为对故障数据中的条件属性(由MIB变量表征)进行量化编码,并进行预处理的步骤,具体包括:
①对于本身是离散值的变量,直接利用其值。
②对于表示定性含义的变量,简单地用自然数编码。
③对于取值有限且不会经常改变的表示定量含义的变量,直接利用其值。
④对于累加型变量,计算单位时间内的数值变化,划分合理的量化区间进行编码。
(3)将预处理后的故障数据组成一个决策信息表的步骤,决策信息表的每列对应一个变量,最后一列表示故障原因。
(4)对决策信息表进行约简的步骤,具体包括:
①删除重复的列:从列序号最大者开始删除,需要优先保留的变量放在靠前的列。
②删除冗余的列:从最后一列依次往前选取列,忽略该列后再计算正域,如果与原正域相同则删除这一列,否则保留。
正域就是那些对于知识R能完全确定地归入集合X的对象的集合,用数学表示就是: R _ ( X ) = ∪ { Y ∈ U / R ; Y ⊆ X } . U/R表示使用知识对离散表示空间U进行划分的结果。
正域的具体的计算方法:所有相容的故障数据构成了正域。这里的不相容指条件属性相同而决策属性不同。
③删除并合并重复的行:从行序号最大者开始删除完全相同的行,重新计算正域,将正域外具有相同条件属性值的行合并,即决策属性用逻辑或连接起来,得到简化了的决策数据表,得到诊断故障的必要条件组合。
④用核值表法进行简化的步骤,简化决策表第一行最后一列开始,忽略该变量所在列后将该行与其他各行比较,如果出现不相容则该变量值是这一条规则的核值,把该值保留在核值表中相应位置,反之核值表中相应位置标示“-”,此过程循环到最后一行,核值表中的保留属性为诊断故障的充分条件组合。将核值表中的剩余条件属性用逻辑与连接起来,且将有相同决策属性的列合并,既把有相同决策属性列的条件组合逻辑或起来,形成规则库并存储。
(5)生成规则库并存储的步骤。
用一个实例来说明其具体步骤:它为两个子网间通过cisco1601、cisco2620连接,对路由器之间的连接故障进行MIB变量开采。
将经过预处理后的数据组成一个决策表,每列对应一个变量,最后一列表示故障原因,每次实验的数据按顺序排成一行,从而得到类似表的二维表格。对示例中的2620串口提取接口组MIB变量(公有24个,私有36个),经过预处理并去掉明显无用的变量,得到决策表(见表1),其属性说明如下:
属性A1:对应MIB 1.3.6.1.2.1.2.2.1.3,为接口协议类型(23为PPP,22为HDLC);
属性A2:对应MIB 1.3.6.1.2.1.2.2.1.7,为接口管理状态(1为开,2为关);
属性A3:对应MIB 1.3.6.1.2.1.2.2.1.8,为接口当前状态(1为up,2为down);
属性A4:对应MIB 1.3.6.1.2.1.2.2.1.14,为输入出错包数(0为不增,1为增加);
属性A5:对应MIB 1.3.6.1.2.1.2.2.1.15,为丢弃的包数(0为不增,1为增加);
属性A6:对应1.3.6.1.4.1.9.2.2.1.1.2,为链路连接状态(1为up,0为down);
属性A7:对应1.3.6.1.4.1.9.2.2.1.1.7,为平均输入流量(1为增加,2为不定);
属性A8:对应1.3.6.1.4.1.9.2.2.1.1.9,为平均输出流量(1为增加,2为不定);
属性A9:对应1.3.6.1.4.1.9.2.2.1.1.13,为CRC错包数(0为不增,1为增加);
属性A10:对应1.3.6.1.4.1.9.2.2.1.1.17,为内部重启次数(0为不增,1为增加);
属性A11:对应1.3.6.1.4.1.9.2.2.1.1.21,为收到CD个数(0为不增,1为增加);
属性A12:对应1.3.6.1.4.1.9.2.2.2.1.2,为串口DCE检测(1为up,0为down);
属性A13:对应1.3.6.1.4.1.9.2.2.2.1.5,为串口DTE检测(1为up,0为down);
属性D:为故障原因
表1:2620串口故障预处理后的决策表
  序号   A1   A2   A3   A4   A5   A6   A7   A8   A9   A10   A11   A12   A13   D
  1   23   1   1   0   0   0   1   2   2   0   0   1   1   正常
  2   23   1   1   0   0   1   1   1   0   0   0   1   1   正常
  3   23   1   2   0   0   0   0   0   0   1   0   0   1   连线中间断
  4   23   1   2   0   0   0   0   0   0   1   0   0   1   连线中间断
  5   23   1   2   0   0   0   0   0   0   1   0   0   1   1601端故障
  6   23   1   2   0   0   0   0   0   0   1   0   0   1   1601端故障
  7   23   1   2   0   0   0   0   0   0   1   0   1   0   2620卡故障
  8   23   1   2   0   0   0   0   0   0   1   0   1   0   2620卡故障
  9   23   2   2   0   0   0   0   0   0   0   0   1   0   管理性关闭
  10   23   2   2   0   0   0   0   0   0   0   0   1   0   管理性关闭
  11   22   1   2   1   1   0   0   0   1   1   1   1   1   链路协议错
  12   22   1   2   1   1   0   0   0   1   1   1   1   1   链路协议错
删除冗余的行、列之后得到的结果(表2)所示:
表2:简化后的决策数据表
  序号   A1   A2   A3   A12   D
  1   23   1   1   1   正常
  2   23   1   2   0   连线断或1601端故障
  3   23   1   2   1   2620卡故障
  4   23   2   2   1   管理性关闭
  5   22   1   2   1   链路协议错
进一步求其核值表的结果(表3),生成规则库。
规则库对应规则表示为:
(1)A3=1:串行接口工作正常;
(2)A1=23 and A 2=1 and A 3=2 and A 12=0:串口电缆或对方设备故障;
(3)A1=23 and A 2=1 and A 3=2 and A 12=1:串口硬件故障;
(4)A2=2:串口被管理性关闭故障;
(5)A1=22:串口数据链路协议配置错误。
表3:规则库:
  序号   A1   A2   A3   A12   D
  1   -   -   1   -   正常
  2   23   1   2   0   连线断或1601端故障
  3   23   1   2   1   2620卡故障
  4   -   2   -   -   管理性关闭
  5   22   -   -   -   链路协议错
基于粗集理论的MIB变量开采不需要关于数据的任何先验信息,分析隐藏在故障数据中的知识,从众多MIB变量中找到对诊断特定故障最有用的MIB变量集合,这样既可以减少系统处理MIB变量的复杂度,又可以舒缓网络传输负担。但该方法存在以下缺陷:1、该方法只能针对MIB变量进行开采,不能涉及到其它类型的网络信息处理(如性能参数等);2、对决策信息表进行约简的步骤未考虑故障原因之间的相似性,规则数多,规则包含的属性多,规则存储空间大,在进行故障诊断时速度慢;3、网络故障知识获取只限于对以往的所有故障数据进行挖掘,在新的网管数据加入时,只能对新、旧数据一起进行知识获取的操作,效率低。
发明内容
本发明所要解决的技术问题之一是:提供一种建立网络故障诊断规则库的方法,该方法的规则数少,规则包含的属性少,规则存储空间少,在进行故障诊断时速度快。
本发明所要解决的技术问题之二是:提供一种建立网络故障诊断规则库的方法,该方法可在新的网管数据加入时,高效地获取更多的网络故障诊断规则库知识。
本发明所要解决的技术问题之三是:提供一种建立网络故障诊断规则库的方法,该方法不仅可针对MIB变量进行开采,还可对性能等数据进行取值处理。
本发明解决上述技术问题所采用的技术方案是:
一种建立网络故障诊断规则库的方法,其步骤包括:
(1)网络中的设备将故障数据输入的步骤;
(2)对故障数据中的条件属性进行预处理的步骤;
(3)将预处理后的故障数据组成一个决策信息表的步骤;
(4)对决策信息表进行约简的步骤;
(5)生成规则库并存储的步骤;
对决策信息表进行约简的步骤具体包括:
①对决策信息表中一个对象的故障原因与其它对象的故障原因进行对比的步骤;
②故障原因不同的,一一对比各属性,取得各属性中有差异的属性,建立差异属性集并存储的步骤;或故障原因相同的,一一对比各属性,取得各属性中相同的属性,建立相似属性集并存储的步骤;
③将差异属性集中属性数量为一的属性合并得到基属性集并存储的步骤;
④获得修正子集的步骤,修正子集满足如下条件:修正子集与差异属性集中每个元素的交集不为空,且修正子集与相似属性集的合并度最大;
⑤取基属性集和修正子集的并集得到候选属性集并存储的步骤;
⑥将候选属性集作为条件,该对象的故障原因作为结果,生成约简规则;
⑦循环步骤①-⑥,直至决策信息表中的每个对象与其它对象进行一一对比完毕;
⑧合并相同约简规则的步骤。
上述方案中还包括增量式知识获取的步骤,其具体步骤包括:
A、从决策信息表获得对象条件属性数量、故障原因数量;从规则库获得规则的数量;
B、建立具有故障原因、候选属性集、每条规则所含的对象数量、每条规则所含的对象除候选属性集外的属性值的规则库信息表并存储的步骤;
C、网络中的设备将新的故障数据输入的步骤;
D、对新的故障数据中的条件属性进行预处理的步骤;
E、将预处理后的新的故障数据添加到决策信息表的步骤;
F、从规则库信息表中提取与新故障数据的故障原因不同的规则,新的对象与其中一个规则所含的各对象的属性进行一一对比,取得各属性中有差异的属性并存储的步骤:
如果差异属性的元素与候选属性集交集不为空,则该对象对应的原规则不修改;
如果差异属性的元素与候选属性集交集为空,则进行以下步骤,修改该对象对应的原规则;
a、获得修正子集的步骤,修正子集满足如下条件:修正子集与差异属性集中每个元素的交集不为空,且修正子集与相似属性集的合并度最大;
b、从修正子集得到候选属性集并存储的步骤;
c、并同时修改对应的候选属性集、每条规则所含的对象数量、每条规则所含的对象除候选属性集外的属性值;
G、重复步骤F,直至新的对象与规则库信息表中与新故障数据的故障原因不同的各规则包含的所有对象进行一一对比完毕;
H、将差异属性集中属性数量为一的属性合并得到基属性集并存储的步骤;获得修正子集的步骤,修正子集满足如下条件:修正子集与差异属性集中每个元素的交集不为空,且修正子集与相似属性集的合并度最大;取基属性集和修正子集的并集得到候选属性集并存储的步骤;将候选属性集作为条件,该对象的故障原因作为结果,生成约简规则;
I、合并相同约简规则,生成规则库并存储的步骤。
上述方案中,对故障数据中的条件属性进行预处理的步骤还包括对性能数据值进行相对值处理的步骤。
与现有技术相比,本发明方法具有以下优点:
1、本发明方法利用各对象之间的差异性得到对象分类的规则,利用同类对象属性之间的相似性对得到的规则合并,并最终得到最佳规则,即规则数最少,规则包含的属性最少。这样规则存储空间少,在进行故障诊断时速度更快。
2、本发明方法采用增量式网络故障知识获取方法,可满足增长式机器学习的需要,亦即在知识库中除了包含约简规则信息外,还包含原始各对象的参数信息,当加入某类新样本(对象)时,只要将该对象与知识库中各规则进行相应性与合并性检测。从而确定原知识库中各规则是否要修改;或者是否将其合并到知识库中某一规则;或者是否要对知识库增加一新规则。最后修改原知识库的参数信息,从而实现对知识库的动态维护(包括对规则修改,删除与增补等)。可以更快地从新增加的数据中获取新的知识,而不需要对新、旧数据一起进行知识获取的操作,提高了效率。
3、本发明方法不仅针对MIB变量进行了开采,还可以对性能数据进行预处理。
具体实施方式
本发明建立网络故障诊断规则库的方法实施例,其步骤包括:
(1)网络中的设备将故障数据输入的步骤。
(2)对故障数据中的条件属性进行预处理的步骤;它包括MIB变量值的处理方法和对性能数据值(cpu利用率,路径延迟等)进行相对值处理的步骤,其中MIB变量值的处理方法同粗集理论MIB开采方法。
对性能数据值进行相对值处理的步骤可按照相对值计算:
A c = A f A a
其中,Af表示原始数据值,Aa表示30s的时间间隔内的平均值,Ac为计算后得到的相对值。
相对值也可按其它方法得到。
本实施例中将加入一个新的属性:A14,表示路径延迟。由于延迟量是一个实数型的连续变量,需要离散化。规定大于某个阈值的情况为2,表示不正常;反之为1,表示正常。
(3)将预处理后的故障数据组成一个决策信息表的步骤;
将预处理后的故障数据列表,每列对应一个变量,最后一列表示故障原因,合并重复的行,得到决策信息表(见表4)。
其中:
t1:正常
t2:连线中间断
t3:1601端故障
t4:2620卡故障
t5:管理性关闭
t6:链路协议错
表4:
  序号   A1   A2   A3   A4   A5   A6   A7   A8   A9   A10   A11   A12   A13   A14   D
  1   23   1   1   0   0   0   1   2   0   0   0   1   1   1   t1
  2   23   1   1   0   0   1   1   1   0   0   0   1   1   1   t1
  3   23   1   2   0   0   0   0   0   0   1   0   0   1   1   t2
  4   23   1   2   0   0   0   0   0   0   1   0   0   1   1   t2
  5   23   1   2   0   0   0   0   0   0   1   0   0   1   2   t3
  6   23   1   2   0   0   0   0   0   0   1   0   0   1   2   t3
  7   23   1   2   0   0   0   0   0   0   1   0   1   0   1   t4
  8   23   1   2   0   0   0   0   0   0   1   0   1   0   1   t4
  9   23   2   2   0   0   0   0   0   0   0   0   1   0   1   t5
  10   23   2   2   0   0   0   0   0   0   0   0   1   0   1   t5
  11   22   1   2   1   1   0   0   0   1   1   1   1   1   1   t6
  12   22   1   2   1   1   0   0   0   1   1   1   1   1   1   t6
       1     2      3       4       5     6      7    8     9a     b       c      d        e
(4)对决策信息表进行约简的步骤;
①对决策信息表中一个对象的故障原因与其它对象的故障原因进行对比的步骤;
②故障原因不同的,一一对比各属性,取得各属性中有差异的属性,建立差异属性集并存储的步骤;或故障原因相同的,一一对比各属性,取得各属性中相同的属性,建立相似属性集并存储的步骤;
③将差异属性集中属性数量为一的属性合并得到基属性集并存储的步骤;
④获得修正子集的步骤,修正子集满足如下条件:修正子集与差异属性集中每个元素的交集不为空,且修正子集与相似属性集的合并度最大;
⑤取基属性集和修正子集的并集得到候选属性集并存储的步骤;
⑥将候选属性集作为条件,该对象的故障原因作为结果,生成约简规则;
⑦循环步骤①-⑥,直至决策信息表中的每个对象与其它对象进行一一对比完毕;
步骤①②③④⑥⑦具体为:
得到决策信息表对应的差异相似矩阵Mds,见表5
表5:
  1   2   3   4   5   6   7   8   9   a   b   c
M ds = 0 1 . . 579 . . e 378 ac 378 ac 378 ace 378 ace 378 ad 378 ad 2378 d 2378 d 13 . . 57 . . b 13 . . 57 . . b 0 36 . . 8 ac 36 . . 8 ac 36 . . 8 ace 36 . . 8 ace 36 . . 8 ad 36 . . 8 ad 236 . . 8 d 236 . . 8 d 13 . . b 13 . . b 0 1 . . e e e cd cd 2 acd 2 acd 1459 bc 1459 bc 0 e e cd cd 2 acd 2 acd 1459 bc 1459 bc 0 1 . . e c . . e c . . e 2 ac . . e 2 ac . . e 1459 bce 1459 bce 0 c . . e c . . e 2 ac . . e 2 ac . . e 1459 bce 1459 bce 0 1 . . e 2 a 2 a 1459 bd 1459 bd 0 2 a 2 a 1459 bd 1459 bd 0 1 . . e 12459 . . bd 12459 . . bd 0 12459 . . bd 12459 . . bd 0 1 . . e 0
为清楚起见,将差异相似矩阵写成表格形式(见表6):
表6:
  1   2   3   4   5   6   7   8   9   10   11   12
  1   0   1..57a<u>..e</u>   378ac   378ac   378ace   378ace   378ad   378ad   2378d   2378d   13..57..b   13..57..b
  2   0   36..8ac   36..8ac   36..8ace   36..8ace   36..8ad   36..8ad   236..8d   236..8d   13..b   13..b
  3   0   1..e   e   e   cd   cd   2acd   2acd   1459bc   1459bc
  4   0   e   e   cd   cd   2acd   2acd   1459bc   1459bc
  5   e   e   0   1..e   c..e   c..e   2ac..e   2ac..e   1459bce   1459bce
  6   e   e   0   c..e   c..e   2ac..e   2ac..e   1459bce   1459bce
  7   0   1..e   2a   2a   1459bd   1459bd
  8   0   2a   2a   1459bd   1459bd
  9   0   1..e   12459..bd   12459..bd
  10   0   12459..bd   12459..bd
  11 0 1..e
  12 0
具有下划线的为相似的元素,其它为差异元素,0表示自身。
根据对象属性的差异性与相似性,定义了一种差异相似性矩阵DSM(DifferenceSimilitude Matrix),矩阵中元素值定义为:
m ij s = c &Element; C : f ( c , x i ) = f ( c , x j ) , D ( x i ) = D ( x j ) &phi; : f ( c , x i ) &NotEqual; f ( c , x j ) , D ( x i ) = D ( x j ) 0 : i = j
m ij d = c &Element; C : f ( c , x i ) &NotEqual; f ( c , x j ) , D ( x i ) &NotEqual; D ( x j ) &phi; : f ( c , x i ) = f ( c , x j ) , D ( x i ) &NotEqual; D ( x j )
f(c,xi)是样本i的条件属性c的值,D(xi)是样本i的决策属性值。
mij s针对同类样本,mij d针对不同类样本。
M(C,D)中任一行i的mij d与mij s分别描述了对象Xi与Xj的差异性与相似性。显然,若 m ij d = &phi; , 则表示不同类对象Xi与Xj是不相容的,它们在知识约简时,不可能生成合理的规则。同理,若 m ij s = &phi; , 则表示相同决策类的对象Xi与Xj是无关联的(即无相似性),故在知识约简时,它们不可能进行规则的合并(即规则约简),若 | m ij s | = | c | , 则表示相同决策类的对象Xi与Xj是全相关的(即Xi与Xj完全相同),故可能将它合而为一,以消除冗余对象。
求出对应每个条目的基本属性Ci 0,基本属性的定义: | m ij d | = 1 , 则对应属性为基本属性Ci 0
求出对应每个条目的最佳属性约简集Bi op的修正子集P(Ci 0)op
为保证得到的规则最少,P(Ci 0)op满足如下条件:
&ForAll; ( m ij d ) &cap; B i op &NotEqual; &Phi; u ( i , j ) &RightArrow; max
其中i=1~n-1,j=js~je.js和je分别表示同类对象在M(C,D)的起、末标号。u(i,j)表示知识约简时的合并度,其定义如下:对于给定的信息系统,对象Xi与同类其它对象Xl,在知识约简时的合并度定义为:
u ( i , l ) = &delta; ( &Sigma; j = 1 n | m il s &cap; m ij d | ) , l = j s ~ j e , j &Element; &OverBar; [ j s &CenterDot; &CenterDot; &CenterDot; j e ]
它表示当以mil s为候选约简属性集时,对象Xi与Xl的可能合并程度(以属性个数记)。而
Figure C20061001815300129
由上述定义可知:当u(i,l)=0,则表示对象Xi与Xj在知识约简时其规则是不能合并的,而当u(i,l)>0时,则表示Xi与Xl在知识约简时,其规则是可合并的,且其值就表示它们具有相同属性值的数目。
计算每个条目的最佳属性约简集Bi op
a)设信息系统的M(C,D)中的任一行i的基本属性集为 C i 0 &NotEqual; &Phi; , 若Ci 0与该行所有mij d的交集均不为空集,即: &ForAll; ( m ij d ) &cap; C i 0 &NotEqual; &Phi; , j=1,2,…,n,则该行i所对应原规则的最佳约简属性集 B i op = C i 0 .
b)设信息系统的M(C,D)中某行i的基本属性集 C i 0 &NotEqual; &Phi; , 若至少存在一个mij d与Ci 0之交集为空集,即: &Exists; ( m ij d ) &cap; C i 0 = &phi; , j=1,2,…,n,则Ci 0只是该行所对应原规则的最佳候选约简属性集Bi op的子集,即 C i 0 &SubsetEqual; B i op . 而对应的Bi op应为: B i op = C i 0 &cup; P ( C &OverBar; i 0 ) op .
列出每个条目对应的规则Bi op→D(xi)。
求出{ci b,Bi op,ri}i=1..An,An表示样本数据个数(见表6)。
表6
  c<sub>i</sub><sup>b</sup>   B<sub>i</sub><sup>op</sup>   r<sub>i</sub>
  1   φ   3(3,7)   1→t1
  2   φ   3(3,7)   1→t1
  3   e   ce   01→t2
  4   e   ce   01→t2
  5   e   e   2→t3
  6   e   e   2→t3
  7   φ   2(2,a)d   10→t4
  8   φ   2(2,a)d   10→t4
  9   φ   2   2→t5
  10   φ   2   2→t5
  11   φ   1(1,4,5,9,b)   22→t6
  12   φ   1(1,4,5,9,b)   22→t6
⑧合并相同约简规则的步骤。
(5)生成规则库(见表7)并存储的步骤;
表7
  r
  1   A3=1→t1
  2   {A12=0,A14=1}→t2
  3   A14=2→t3
  4   {A2=1,A13=0}→t4
  5   A2=2→t5
  6   A1=22→t6
(6)增量式知识获取的步骤:
①从决策信息表获得对象条件属性数量AN、故障原因数量TN;从规则库获得规则的数量RN;
RN=6,AN=14,TN=6。
②建立具有故障原因RTN(k)、候选属性集Bk op(vk)、每条规则所含的对象数量RON(k)、每条规则所含的对象除候选属性集外的属性值RAC(k)的规则库信息表并存储的步骤;
规则库信息表(见表8):
表8
  RTN B<sub>i</sub><sup>vp</sup>(v<sub>i</sub>)  RON RAC
  t1 A3=1  2 (A1=23,A2=A7=A12..A14=1,A4=A5=A9..A11=0)(1,2),A6=0(1),A6=1(2),A8=2(1),A8=1(2)
  t2 A12=0,A14=1  2 (A1=23,A2=A10=A13=1,A3=2,A4..A9=A11=0)(3,4)
  t3 A14=2  2 (A1=23,A2=A10=A13=1,A3=2,A4..A9=A11=A12=0)(5,6)
  t4 A2=1,A13=0  2 (A1=23,A10=A12=A14=1,A3=2,A4..A9=A11=0)(7,8)
  t5 A2=2  2 (A1=23,A3=2,A4..A11=A13=0,A12=A14=1)(9,10)
  t6 A1=22  2 (A2=A4=A5=A9..A14=1,A3=2,A6..A8=0)(11,12)
③网络中的设备将新的故障数据输入的步骤;
增加一个对象(见表9):x13:
表9
  序号   A1   A2   A3   A4   A5   A6   A7   A8   A9   A10   A11   A12   A13   A14   D
  13   23   1   1   0   1   1   0   0   0   0   0   1   1   1   t7
④对新的故障数据中的条件属性进行预处理的步骤;
同步骤(2)
⑤将预处理后的新的故障数据添加到决策信息表的步骤;
⑥从规则库信息表中提取与新故障数据的故障原因不同的规则,新的对象与其中一个规则所含的各对象的属性进行一一对比,取得各属性中有差异的属性并存储的步骤:
如果差异属性的元素与候选属性集交集不为空,则该对象对应的原规则不修改;
如果差异属性的元素与候选属性集交集为空,则进行以下步骤,修改该对象对应的原规则;
a、获得修正子集的步骤,修正子集满足如下条件:修正子集与差异属性集中每个元素的交集不为空,且修正子集与相似属性集的合并度最大;
b、从修正子集得到候选属性集并存储的步骤;
c、并同时修改对应的候选属性集、每条规则所含的对象数量、每条规则所含的对象除候选属性集外的属性值;
⑦重复步骤⑥,直至新的对象与各规则包含的所有对象进行一一对比完毕;
步骤⑥⑦具体为:
求出知识库参数和规则库信息表。
x13:{A1=23,A2=A3=A5=A6=A12..A14=1,A4=A7..A11=0}→t7.
首先处理RTN(k)≠t7的规则。
对于r1:A3=1→t2,包含样本x1和x2,所以检查x1和x2:
x 1 : B 1 vp &cup; { A 1 = 23 , A 2 = A 7 = A 12 . . A 14 = 1 , A 4 . . A 6 = A 9 . . A 11 = 0 , A 8 = 2 } &RightArrow; t 1
M 13,1 d = &cup; { q &Element; C : f ( q , x 1 ) &NotEqual; f ( q , x 13 ) } = 5678 , M 13,1 d &cap; B 1 vp = &phi; , 故x1对应于r1的规则需要修改,∵ | M 13,1 d | = 4 , 于是需要(5678)中选取一个属性(选合并度最大的属性),∵μA5(x1,A5=0)=|(x1,x2)|=2,∵μA6(x1,A6=0)=|(x1)|=1,∵μA7(x1,A7=1)=|(x1,x2)|=2,∵μA8(x1,A8=2)=|(x1)|=1,故应选取5(5,7),亦即,对于x1的新规则为:{A3=1}∪{A5=0}={A3=1,A5=0}→t1,而对应的RAC应修改为(A1=23,A2=A7=A12..A14=1,A4=A6=A9..A11=0,A8=2)(1)。
x 2 : B 1 vp &cup; { A 1 = 23 , A 2 = A 7 = A 12 . . A 14 = 1 , A 4 . . A 6 = A 8 . . A 11 = 0 } &RightArrow; t 1
M 13,2 d = &cup; { q &Element; C : f ( q , x 2 ) &NotEqual; f ( q , x 13 ) } = 578 , M 13,2 d &cap; B 1 vp = &phi; , 故x2对应于r1的规则需要修改,∵ | M 13,2 d | = 3 , 于是需要(578)中选取一个属性(选合并度最大的属性),∵μA5(x2,A5=0)=|(x1,x2)|=2,∵μA7(x2,A7=1)=|(x1,x2)|=2,∵μA8(x2,A8=1)=|(x2)|=1,故应选取5(5,7),亦即,对于x2的新规则为:{A3=1}∪{A5=0}={A3=1,A5=0}→t1,而对应的RAC应修改为(A1=23,A2=A6..A8=A12..A14=1,A4=A9..A11=0)(2)。
对于r2:{A12=0,A14=1}→t2,包含样本x3和x4,所以检查x3和x4:
x 3 : B 2 vp &cup; { A 1 = 23 , A 2 = A 10 = A 13 = 1 , A 3 = 2 , A 4 . . A 9 = A 11 = 0 } &RightArrow; t 2
M 13,3 d = &cup; { q &Element; C : f ( q , x 3 ) &NotEqual; f ( q , x 13 ) } = 356 ac , M 13,3 d &cap; B 2 vp = c &NotEqual; &phi; , 故对应于r2的规则,则不需要修改。
同理:x4与x13比较后,不需要修改r2
对于r3:A14=2→t3,包含样本x5和x6,所以检查x5和x6:
x 5 : B 3 vp &cup; { A 1 = 23 , A 2 = A 10 = A 13 = 1 , A 3 = 2 , A 4 . . A 9 = A 11 = A 12 = 0 } &RightArrow; t 3
M 13,5 d = &cup; { q &Element; C : f ( q , x 5 ) &NotEqual; f ( q , x 13 ) } = 356 ace , M 13,5 d &cap; B 3 vp = e &NotEqual; &phi; , 故对应于r3的规则,则不需要修改。
同理:x6与x13比较后,不需要修改r3
对于r4:{A2=1,A13=0}→t4,包含样本x7和x8,所以检查x7和x8:
x 7 : B 4 vp &cup; { A 1 = 23 , A 10 = A 12 = A 14 = 1 , A 3 = 2 , A 4 . . A 9 = A 11 = 0 } &RightArrow; t 4
M 13,7 d = &cup; { q &Element; C : f ( q , x 7 ) &NotEqual; f ( q , x 13 ) } = 356 ad , M 13,7 d &cap; B 4 vp = d &NotEqual; &phi; , 故对应于r4的规则,则不需要修改。
同理:x8与x13比较后,不需要修改r4
对于r5:A2=2→t5,包含样本x9和x10,所以检查x9和x10:
x 9 : B 5 vp &cup; { A 1 = 23 , A 3 = 2 , A 4 . . A 11 = A 13 = 0 , A 12 = A 14 = 1 } &RightArrow; t 5
M 13,9 d = &cup; { q &Element; C : f ( q , x 9 ) &NotEqual; f ( q , x 13 ) } = 2356 d , M 13,9 d &cap; B 5 vp = 2 &NotEqual; &phi; , 故对应于r5的规则,则不需要修改。
同理:x10与x13比较后,不需要修改r5
对于r6:A1=22→t6,包含样本x11和x12,所以检查x11和x12:
x 11 : B 6 vp &cup; { A 2 = A 4 = A 5 = A 9 . . A 14 = 1 , A 3 = 2 , A 6 . . A 8 = 0 } &RightArrow; t 6
M 13,11 d = &cup; { q &Element; C : f ( q , x 11 ) &NotEqual; f ( q , x 13 ) } = 13469 ab M 13,11 d &cap; B 3 vp = 1 &NotEqual; &phi; , 故对应于r6的规则,则不需要修改。
同理:x12与x13比较后,不需要修改r6
⑧将差异属性集中属性数量为一的属性合并得到基属性集并存储的步骤;获得修正子集的步骤,修正子集满足如下条件:修正子集与差异属性集中每个元素的交集不为空,且修正子集与相似属性集的合并度最大;取基属性集和修正子集的并集得到候选属性集并存储的步骤;将候选属性集作为条件,该对象的故障原因作为结果,生成约简规则;
求x13的约简规则。
c 13 b = &cup; { m 13 , j d : | m 13 , j d | = 1 , j = 3 ~ 12 } = &phi; , 又∵ c 13 b &cap; ( &ForAll; m 13 , d d ) = &phi; , 故需要求其补充属性集:
表10
  1   2   3   4   5   6   7   8   9   10   11   12   13
  13   5678   578   356ac   356ac   356ace   356ace   356ad   356ad   2356d   2356d   13469ab   13469ab   0
x13的可选集合为3(3,6)5(5,7,8),候选属性集为 B 13 op = 35 .
故x13的约简规则为: B 13 op ( v 13 ) = { A 3 = 1 , A 5 = 1 } &RightArrow; t 7 , 而对应的RAC应修改为:
(A1=23,A2=A6=A12..A14=1,A4=A7..A11=0)(13)。
⑨合并相同约简规则,生成规则库并存储的步骤。
新规则库(表11):
表11
 RTN B<sub>i</sub><sup>vp</sup>(v<sub>i</sub>)  RON RAC
  t1 A3=1,A5=0   1 (A1=23,A2=A7=A12..A14=1,A4=A6=A9..A11=0,A8=2)(1)
  t1 A3=1,A5=0   1 (A1=23,A2=A6..A8=A12..A14=1,A4=A9..A11=0)(2)
  t2 A12=0,A14=1   2 (A1=23,A2=A10=A13=1,A3=2,A4..A9=A11=0)(3,4)
  t3 A14=2   2 (A1=23,A2=A10=A13=1,A3=2,A4..A9=A11=A12=0)(5,6)
  t4 A2=1,A13=0   2 (A1=23,A10=A12=A14=1,A3=2,A4..A9=A11=0)(7,8)
  t5 A2=2   2 (A1=23,A3=2,A4..A11=A13=0,A12=A14=1)(9,10)
  t6 A1=22   2 (A2=A4=A5=A9..A14=1,A3=2,A6..A8=0)(11,12)
  t7 A3=1,A5=1   1 (A1=23,A2=A6=A12..A14=1,A4=A7..A11=0)(13)
合并之后得到:
RN=7,AN=14,TN=7。
规则库(表12)为:
表12
  RTN B<sub>i</sub><sup>vp</sup>(v<sub>i</sub>) RON RAC
  t1 A3=1,A5=0   2 (A1=23,A2=A7=A12..A14=1,A4=A9..A11=0)(1,2),A6=0(1),A6=1(2),A8=2(1),A8=1(2)
  t2 A12=0,A14=1   2 (A1=23,A2=A10=A13=1,A3=2,A4..A9=A11=0)(3,4)
  t3 A14=2   2 (A1=23,A2=A10=A13=1,A3=2,A4..A9=A11=A12=0)(5,6)
  t4 A2=1,A13=0   2 (A1=23,A10=A12=A14=1,A3=2,A4..A9=A11=0)(7,8)
  t5 A2=2   2 (A1=23,A3=2,A4..A11=A13=0,A12=A14=1)(9,10)
  t6  A1=22   2 (A2=A4=A5=A9..A14=1,A3=2,A6..A8=0)(11,12)
  t7 A3=1,A5=1   1 (A1=23,A2=A6=A12..A14=1,A4=A7..A11=0)(13)
本发明实施例采用差异相似矩阵表征网络数据的不同点和相同点,基于差异相似矩阵的网络知识获取方法充分利用了不同样本属性之间的差异得到对样本分类的规则,利用同类样本属性之间的相似性对得到的规则合并,并最终得到最佳规则,即规则数最少,规则包含的属性最少。这样规则存储空间少,在进行故障诊断时速度加快。

Claims (3)

1.一种建立网络故障诊断规则库的方法,其步骤包括:
(1)网络中的设备将故障数据输入的步骤;
(2)对故障数据中的条件属性进行预处理的步骤;
(3)将预处理后的故障数据组成一个决策信息表的步骤;
(4)对决策信息表进行约简的步骤;
(5)生成规则库并存储的步骤;
其特征在于:
对决策信息表进行约简的步骤具体包括:
①对决策信息表中一个对象的故障原因与其它对象的故障原因进行对比的步骤;
②故障原因不同的,一一对比各属性,取得各属性中有差异的属性,建立差异属性集并存储的步骤;或故障原因相同的,一一对比各属性,取得各属性中相同的属性,建立相似属性集并存储的步骤;
③将差异属性集中属性数量为一的属性合并得到基属性集并存储的步骤;
④获得修正子集的步骤,修正子集满足如下条件:修正子集与差异属性集中每个元素的交集不为空,且修正子集与相似属性集的合并度最大;
⑤取基属性集和修正子集的并集得到候选属性集并存储的步骤;
⑥将候选属性集作为条件,该对象的故障原因作为结果,生成约简规则;
⑦循环步骤①-⑥,直至决策信息表中的每个对象与其它对象进行一一对比完毕;
⑧合并相同约简规则的步骤。
2.如权利要求1所述的方法,其特征在于:它还包括增量式知识获取的步骤,其具体步骤包括:
A、从决策信息表获得对象条件属性数量、故障原因数量;从规则库获得规则的数量;
B、建立具有故障原因、候选属性集、每条规则所含的对象数量、每条规则所含的对象除候选属性集外的属性值的规则库信息表并存储的步骤;
C、网络中的设备将新的故障数据输入的步骤;
D、对新的故障数据中的条件属性进行预处理的步骤;
E、将预处理后的新的故障数据添加到决策信息表的步骤;
F、从规则库信息表中提取与新故障数据的故障原因不同的规则,新的对象与其中一个规则所含的各对象的属性进行一一对比,取得各属性中有差异的属性并存储的步骤:
如果差异属性的元素与候选属性集交集不为空,则该对象对应的原规则不修改;
如果差异属性的元素与候选属性集交集为空,则进行以下步骤,修改该对象对应的原规则;
a、获得修正子集的步骤,修正子集满足如下条件:修正子集与差异属性集中每个元素的交集不为空,且修正子集与相似属性集的合并度最大;
b、从修正子集得到候选属性集并存储的步骤;
c、并同时修改对应的候选属性集、每条规则所含的对象数量、每条规则所含的对象除候选属性集外的属性值;
G、重复步骤F,直至新的对象与规则库信息表中与新故障数据的故障原因不同的各规则包含的所有对象进行一一对比完毕;
H、将差异属性集中属性数量为一的属性合并得到基属性集并存储的步骤;获得修正子集的步骤,修正子集满足如下条件:修正子集与差异属性集中每个元素的交集不为空,且修正子集与相似属性集的合并度最大;取基属性集和修正子集的并集得到候选属性集并存储的步骤;将候选属性集作为条件,该对象的故障原因作为结果,生成约简规则;
I、合并相同约简规则,生成规则库并存储的步骤。
3.如权利要求1所述的方法,其特征在于:对故障数据中的条件属性进行预处理的步骤还包括对性能数据值进行相对值处理的步骤。
CNB2006100181534A 2006-01-13 2006-01-13 一种建立网络故障诊断规则库的方法 Expired - Fee Related CN100393048C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB2006100181534A CN100393048C (zh) 2006-01-13 2006-01-13 一种建立网络故障诊断规则库的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2006100181534A CN100393048C (zh) 2006-01-13 2006-01-13 一种建立网络故障诊断规则库的方法

Publications (2)

Publication Number Publication Date
CN1801745A CN1801745A (zh) 2006-07-12
CN100393048C true CN100393048C (zh) 2008-06-04

Family

ID=36811521

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2006100181534A Expired - Fee Related CN100393048C (zh) 2006-01-13 2006-01-13 一种建立网络故障诊断规则库的方法

Country Status (1)

Country Link
CN (1) CN100393048C (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101897147B (zh) * 2008-06-19 2013-04-24 华为技术有限公司 一种数据指纹保存方法及装置

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101178703B (zh) * 2007-11-23 2010-05-19 西安交通大学 基于网络分割的故障诊断谱聚类方法
CN102098175B (zh) * 2011-01-26 2015-07-01 浪潮通信信息系统有限公司 一种移动互联网告警关联规则获取方法
CN102184234B (zh) * 2011-05-13 2014-12-10 百度在线网络技术(北京)有限公司 用于查询、增加、更新或删除信息处理规则的方法和设备
DE112013006475T5 (de) * 2013-11-29 2015-10-08 Hitachi, Ltd. Verwaltungssystem und Verfahren zur Unterstützung einer Analyse in Bezug auf eine Hauptursache eines Ereignisses
CN106202420A (zh) * 2016-07-12 2016-12-07 中国石油大学(华东) 一种野外露头知识库的建立方法
CN108319695A (zh) * 2018-02-02 2018-07-24 华自科技股份有限公司 水电站故障数据处理方法、装置、计算机设备和存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5724263A (en) * 1993-10-21 1998-03-03 At&T Corp Automatic temporospatial pattern analysis and prediction in a telecommunications network using rule induction
CN1120366C (zh) * 1999-03-22 2003-09-03 西安交通大学 基于非线性频谱分析的故障检测与诊断方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5724263A (en) * 1993-10-21 1998-03-03 At&T Corp Automatic temporospatial pattern analysis and prediction in a telecommunications network using rule induction
CN1120366C (zh) * 1999-03-22 2003-09-03 西安交通大学 基于非线性频谱分析的故障检测与诊断方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
基于粗糙集神经网络的网络故障诊断新方法. 李千目,戚湧,张宏,刘凤玉.计算机研究与发展,第41卷第10期. 2004
基于粗糙集神经网络的网络故障诊断新方法. 李千目,戚湧,张宏,刘凤玉.计算机研究与发展,第41卷第10期. 2004 *
基于粗集理论的MIB变量开采. 郭成城,左敏,晏蒲柳.武汉大学学报(理学版),第47卷第3期. 2001
基于粗集理论的MIB变量开采. 郭成城,左敏,晏蒲柳.武汉大学学报(理学版),第47卷第3期. 2001 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101897147B (zh) * 2008-06-19 2013-04-24 华为技术有限公司 一种数据指纹保存方法及装置

Also Published As

Publication number Publication date
CN1801745A (zh) 2006-07-12

Similar Documents

Publication Publication Date Title
CN100393048C (zh) 一种建立网络故障诊断规则库的方法
JP5092165B2 (ja) データ構築方法とシステム
US20130097125A1 (en) Automated analysis of unstructured data
US8180786B2 (en) Symbolic query exploration
CN107688748A (zh) 基于漏洞指纹的脆弱性代码克隆检测方法及其装置
CN107944705B (zh) 一种基于模块度划分通信社团的全端可靠性计算方法
CN110287382B (zh) 一种面向电池生产数据的关联规则的挖掘方法
CN104899292A (zh) 一种面向属性图集的频繁近似子图挖掘方法
CN105260387A (zh) 一种面向海量事务数据库的关联规则分析方法
Hibshman et al. Towards interpretable graph modeling with vertex replacement grammars
CN115357572A (zh) 一种数据质量检查规则构建方法、存储介质及系统
CN115576840A (zh) 基于机器学习的静态程序插桩检测方法及装置
CN115185818A (zh) 一种基于二进制集合的程序依赖簇检测方法
CN107579844A (zh) 一种基于业务路径和频度矩阵的动态关联故障挖掘方法
Cantone et al. Approximate String Matching Allowing for Inversions and Translocations.
CN101604365B (zh) 确定计算机恶意程序样本家族数的系统和方法
Hadzic et al. UNI3-efficient algorithm for mining unordered induced subtrees using TMG candidate generation
Wei et al. Loggrep: Fast and cheap cloud log storage by exploiting both static and runtime patterns
CN106407475A (zh) 内容筛选方法、装置及服务器
CN104657473A (zh) 一种保证质量单调性的大规模数据挖掘方法
Li et al. A single-scan algorithm for mining sequential patterns from data streams
Gago-Alonso et al. Full duplicate candidate pruning for frequent connected subgraph mining
CN106649859B (zh) 用于对基于字符串的文件进行压缩的方法和装置
Na Linear-time construction of compressed suffix arrays using o (n log n)-bit working space for large alphabets
CN109298686A (zh) 用于针对基于规则的制造工艺设计使用商业智能的系统和方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C19 Lapse of patent right due to non-payment of the annual fee
CF01 Termination of patent right due to non-payment of annual fee