CN100393048C

CN100393048C - 一种建立网络故障诊断规则库的方法

Info

Publication number: CN100393048C
Application number: CNB2006100181534A
Authority: CN
Inventors: 周建国; 晏蒲柳; 郭成城; 吴静; 陈立家; 江昊
Original assignee: Wuhan University WHU
Current assignee: Wuhan University WHU
Priority date: 2006-01-13
Filing date: 2006-01-13
Publication date: 2008-06-04
Anticipated expiration: 2026-01-13
Also published as: CN1801745A

Abstract

本发明涉及一种建立网络故障诊断规则库的方法，其步骤包括：(1)网络中的设备将故障数据输入的步骤；(2)对故障数据中的条件属性进行预处理的步骤；(3)将预处理后的故障数据组成一个决策信息表的步骤；(4)对决策信息表进行约简的步骤；(5)生成规则库并存储的步骤。本发明方法的对决策信息表进行约简的步骤利用各对象之间的差异性得到对象分类的规则，利用同类对象属性之间的相似性对得到的规则合并，并最终得到最佳规则，即规则数最少，规则包含的属性最少。这样规则存储空间少，在进行故障诊断时速度更快。

Description

一种建立网络故障诊断规则库的方法

技术领域

本发明涉及计算机网络，具体涉及用于诊断计算机网络故障的规则库，特别是建立网络故障诊断规则库的方法。

背景技术

计算机网络中，网络管理软件每天都产生大量的数据存于网络管理数据库中，这些数据中包括轮询得到的MIB变量(设备自带的管理信息库变量)、网络性能测量数据、网络告警等。网络管理员被大量的信息所淹没，无法发现数据中存在的知识，导致了“数据爆炸而知识贫乏”。如何利用知识发现技术，从这些数据中挖掘出新颖的知识并且进行故障预测和故障的自动恢复是一项很有应用前景的技术。有关的技术包括基于关联规则的网络告警数据库知识发现、基于粗集理论的MIB变量开采、基于贝叶斯网络的告警关联等等。其大体的步骤都是从网络管理数据库中提取故障数据，对数据进行预处理，依照一定的模型或者一定的知识抽取方法从这些数据中提取知识，将这些知识用规则或者图表的形式表达，从而便于以后的网络故障诊断。

现有的网络故障知识获取的方法主要有基于粗集理论的MIB变量开采技术，该技术通过对网络故障采集的MIB变量离散化，运用粗集方法去除错误和不必要的数据，找出反映网络故障现象的MIB变量组及其逻辑组合关系，提取表现故障现象的规则，并将规则用于设计计算机网络故障诊断。其相关文章有：《武汉大学学报(理学版)》(2001，Vol.47，No.3)的文章“基于粗集理论的MIB变量开采”、《兵工自动化》(2003，Vol.22，No.3)的文章“基于粗集理论的规则知识获取”。

现有的获取网络故障诊断规则库方法的具体步骤如下：

(1)网络中的设备将故障数据输入的步骤；

(2)对故障数据中的条件属性进行预处理的步骤，它为对故障数据中的条件属性(由MIB变量表征)进行量化编码，并进行预处理的步骤，具体包括：

①对于本身是离散值的变量，直接利用其值。

②对于表示定性含义的变量，简单地用自然数编码。

③对于取值有限且不会经常改变的表示定量含义的变量，直接利用其值。

④对于累加型变量，计算单位时间内的数值变化，划分合理的量化区间进行编码。

(3)将预处理后的故障数据组成一个决策信息表的步骤，决策信息表的每列对应一个变量，最后一列表示故障原因。

(4)对决策信息表进行约简的步骤，具体包括：

①删除重复的列：从列序号最大者开始删除，需要优先保留的变量放在靠前的列。

②删除冗余的列：从最后一列依次往前选取列，忽略该列后再计算正域，如果与原正域相同则删除这一列，否则保留。

正域就是那些对于知识R能完全确定地归入集合X的对象的集合，用数学表示就是：

R_(X) = \cup {Y &Element; U / R; Y &SubsetEqual; X} .

U/R表示使用知识对离散表示空间U进行划分的结果。

正域的具体的计算方法：所有相容的故障数据构成了正域。这里的不相容指条件属性相同而决策属性不同。

③删除并合并重复的行：从行序号最大者开始删除完全相同的行，重新计算正域，将正域外具有相同条件属性值的行合并，即决策属性用逻辑或连接起来，得到简化了的决策数据表，得到诊断故障的必要条件组合。

④用核值表法进行简化的步骤，简化决策表第一行最后一列开始，忽略该变量所在列后将该行与其他各行比较，如果出现不相容则该变量值是这一条规则的核值，把该值保留在核值表中相应位置，反之核值表中相应位置标示“-”，此过程循环到最后一行，核值表中的保留属性为诊断故障的充分条件组合。将核值表中的剩余条件属性用逻辑与连接起来，且将有相同决策属性的列合并，既把有相同决策属性列的条件组合逻辑或起来，形成规则库并存储。

(5)生成规则库并存储的步骤。

用一个实例来说明其具体步骤：它为两个子网间通过cisco1601、cisco2620连接，对路由器之间的连接故障进行MIB变量开采。

将经过预处理后的数据组成一个决策表，每列对应一个变量，最后一列表示故障原因，每次实验的数据按顺序排成一行，从而得到类似表的二维表格。对示例中的2620串口提取接口组MIB变量(公有24个，私有36个)，经过预处理并去掉明显无用的变量，得到决策表(见表1)，其属性说明如下：

属性A1：对应MIB 1.3.6.1.2.1.2.2.1.3，为接口协议类型(23为PPP，22为HDLC)；

属性A2：对应MIB 1.3.6.1.2.1.2.2.1.7，为接口管理状态(1为开，2为关)；

属性A3：对应MIB 1.3.6.1.2.1.2.2.1.8，为接口当前状态(1为up，2为down)；

属性A4：对应MIB 1.3.6.1.2.1.2.2.1.14，为输入出错包数(0为不增，1为增加)；

属性A5：对应MIB 1.3.6.1.2.1.2.2.1.15，为丢弃的包数(0为不增，1为增加)；

属性A6：对应1.3.6.1.4.1.9.2.2.1.1.2，为链路连接状态(1为up，0为down)；

属性A7：对应1.3.6.1.4.1.9.2.2.1.1.7，为平均输入流量(1为增加，2为不定)；

属性A8：对应1.3.6.1.4.1.9.2.2.1.1.9，为平均输出流量(1为增加，2为不定)；

属性A9：对应1.3.6.1.4.1.9.2.2.1.1.13，为CRC错包数(0为不增，1为增加)；

属性A10：对应1.3.6.1.4.1.9.2.2.1.1.17，为内部重启次数(0为不增，1为增加)；

属性A11：对应1.3.6.1.4.1.9.2.2.1.1.21，为收到CD个数(0为不增，1为增加)；

属性A12：对应1.3.6.1.4.1.9.2.2.2.1.2，为串口DCE检测(1为up，0为down)；

属性A13：对应1.3.6.1.4.1.9.2.2.2.1.5，为串口DTE检测(1为up，0为down)；

属性D：为故障原因

表1：2620串口故障预处理后的决策表

序号	A1	A2	A3	A4	A5	A6	A7	A8	A9	A10	A11	A12	A13	D
序号	A1	A2	A3	A4	A5	A6	A7	A8	A9	A10	A11	A12	A13	D	1	23	1	1	0	0	0	1	2	2	0	0	1	1	正常
2	23	1	1	0	0	1	1	1	0	0	0	1	1	正常	1	23	1	1	0	0	0	1	2	2	0	0	1	1	正常
2	23	1	1	0	0	1	1	1	0	0	0	1	1	正常	3	23	1	2	0	0	0	0	0	0	1	0	0	1	连线中间断
4	23	1	2	0	0	0	0	0	0	1	0	0	1	连线中间断	3	23	1	2	0	0	0	0	0	0	1	0	0	1	连线中间断
4	23	1	2	0	0	0	0	0	0	1	0	0	1	连线中间断	5	23	1	2	0	0	0	0	0	0	1	0	0	1	1601端故障
6	23	1	2	0	0	0	0	0	0	1	0	0	1	1601端故障	5	23	1	2	0	0	0	0	0	0	1	0	0	1	1601端故障
6	23	1	2	0	0	0	0	0	0	1	0	0	1	1601端故障	7	23	1	2	0	0	0	0	0	0	1	0	1	0	2620卡故障
8	23	1	2	0	0	0	0	0	0	1	0	1	0	2620卡故障	7	23	1	2	0	0	0	0	0	0	1	0	1	0	2620卡故障
8	23	1	2	0	0	0	0	0	0	1	0	1	0	2620卡故障	9	23	2	2	0	0	0	0	0	0	0	0	1	0	管理性关闭
10	23	2	2	0	0	0	0	0	0	0	0	1	0	管理性关闭	9	23	2	2	0	0	0	0	0	0	0	0	1	0	管理性关闭
10	23	2	2	0	0	0	0	0	0	0	0	1	0	管理性关闭	11	22	1	2	1	1	0	0	0	1	1	1	1	1	链路协议错
12	22	1	2	1	1	0	0	0	1	1	1	1	1	链路协议错	11	22	1	2	1	1	0	0	0	1	1	1	1	1	链路协议错

删除冗余的行、列之后得到的结果(表2)所示：

表2：简化后的决策数据表

序号	A1	A2	A3	A12	D
序号	A1	A2	A3	A12	D	1	23	1	1	1	正常
2	23	1	2	0	连线断或1601端故障	1	23	1	1	1	正常
2	23	1	2	0	连线断或1601端故障	3	23	1	2	1	2620卡故障
4	23	2	2	1	管理性关闭	3	23	1	2	1	2620卡故障
4	23	2	2	1	管理性关闭	5	22	1	2	1	链路协议错

进一步求其核值表的结果(表3)，生成规则库。

规则库对应规则表示为：

(1)A3＝1：串行接口工作正常；

(2)A1＝23 and A 2＝1 and A 3＝2 and A 12＝0：串口电缆或对方设备故障；

(3)A1＝23 and A 2＝1 and A 3＝2 and A 12＝1：串口硬件故障；

(4)A2＝2：串口被管理性关闭故障；

(5)A1＝22：串口数据链路协议配置错误。

表3：规则库：

序号	A1	A2	A3	A12	D
序号	A1	A2	A3	A12	D	1	-	-	1	-	正常
2	23	1	2	0	连线断或1601端故障	1	-	-	1	-	正常
2	23	1	2	0	连线断或1601端故障	3	23	1	2	1	2620卡故障
4	-	2	-	-	管理性关闭	3	23	1	2	1	2620卡故障
4	-	2	-	-	管理性关闭	5	22	-	-	-	链路协议错

基于粗集理论的MIB变量开采不需要关于数据的任何先验信息，分析隐藏在故障数据中的知识，从众多MIB变量中找到对诊断特定故障最有用的MIB变量集合，这样既可以减少系统处理MIB变量的复杂度，又可以舒缓网络传输负担。但该方法存在以下缺陷：1、该方法只能针对MIB变量进行开采，不能涉及到其它类型的网络信息处理(如性能参数等)；2、对决策信息表进行约简的步骤未考虑故障原因之间的相似性，规则数多，规则包含的属性多，规则存储空间大，在进行故障诊断时速度慢；3、网络故障知识获取只限于对以往的所有故障数据进行挖掘，在新的网管数据加入时，只能对新、旧数据一起进行知识获取的操作，效率低。

发明内容

本发明所要解决的技术问题之一是：提供一种建立网络故障诊断规则库的方法，该方法的规则数少，规则包含的属性少，规则存储空间少，在进行故障诊断时速度快。

本发明所要解决的技术问题之二是：提供一种建立网络故障诊断规则库的方法，该方法可在新的网管数据加入时，高效地获取更多的网络故障诊断规则库知识。

本发明所要解决的技术问题之三是：提供一种建立网络故障诊断规则库的方法，该方法不仅可针对MIB变量进行开采，还可对性能等数据进行取值处理。

本发明解决上述技术问题所采用的技术方案是：

一种建立网络故障诊断规则库的方法，其步骤包括：

(1)网络中的设备将故障数据输入的步骤；

(2)对故障数据中的条件属性进行预处理的步骤；

(3)将预处理后的故障数据组成一个决策信息表的步骤；

(4)对决策信息表进行约简的步骤；

(5)生成规则库并存储的步骤；

对决策信息表进行约简的步骤具体包括：

①对决策信息表中一个对象的故障原因与其它对象的故障原因进行对比的步骤；

②故障原因不同的，一一对比各属性，取得各属性中有差异的属性，建立差异属性集并存储的步骤；或故障原因相同的，一一对比各属性，取得各属性中相同的属性，建立相似属性集并存储的步骤；

③将差异属性集中属性数量为一的属性合并得到基属性集并存储的步骤；

④获得修正子集的步骤，修正子集满足如下条件：修正子集与差异属性集中每个元素的交集不为空，且修正子集与相似属性集的合并度最大；

⑤取基属性集和修正子集的并集得到候选属性集并存储的步骤；

⑥将候选属性集作为条件，该对象的故障原因作为结果，生成约简规则；

⑦循环步骤①-⑥，直至决策信息表中的每个对象与其它对象进行一一对比完毕；

⑧合并相同约简规则的步骤。

上述方案中还包括增量式知识获取的步骤，其具体步骤包括：

A、从决策信息表获得对象条件属性数量、故障原因数量；从规则库获得规则的数量；

B、建立具有故障原因、候选属性集、每条规则所含的对象数量、每条规则所含的对象除候选属性集外的属性值的规则库信息表并存储的步骤；

C、网络中的设备将新的故障数据输入的步骤；

D、对新的故障数据中的条件属性进行预处理的步骤；

E、将预处理后的新的故障数据添加到决策信息表的步骤；

F、从规则库信息表中提取与新故障数据的故障原因不同的规则，新的对象与其中一个规则所含的各对象的属性进行一一对比，取得各属性中有差异的属性并存储的步骤：

如果差异属性的元素与候选属性集交集不为空，则该对象对应的原规则不修改；

如果差异属性的元素与候选属性集交集为空，则进行以下步骤，修改该对象对应的原规则；

a、获得修正子集的步骤，修正子集满足如下条件：修正子集与差异属性集中每个元素的交集不为空，且修正子集与相似属性集的合并度最大；

b、从修正子集得到候选属性集并存储的步骤；

c、并同时修改对应的候选属性集、每条规则所含的对象数量、每条规则所含的对象除候选属性集外的属性值；

G、重复步骤F，直至新的对象与规则库信息表中与新故障数据的故障原因不同的各规则包含的所有对象进行一一对比完毕；

H、将差异属性集中属性数量为一的属性合并得到基属性集并存储的步骤；获得修正子集的步骤，修正子集满足如下条件：修正子集与差异属性集中每个元素的交集不为空，且修正子集与相似属性集的合并度最大；取基属性集和修正子集的并集得到候选属性集并存储的步骤；将候选属性集作为条件，该对象的故障原因作为结果，生成约简规则；

I、合并相同约简规则，生成规则库并存储的步骤。

上述方案中，对故障数据中的条件属性进行预处理的步骤还包括对性能数据值进行相对值处理的步骤。

与现有技术相比，本发明方法具有以下优点：

1、本发明方法利用各对象之间的差异性得到对象分类的规则，利用同类对象属性之间的相似性对得到的规则合并，并最终得到最佳规则，即规则数最少，规则包含的属性最少。这样规则存储空间少，在进行故障诊断时速度更快。

2、本发明方法采用增量式网络故障知识获取方法，可满足增长式机器学习的需要，亦即在知识库中除了包含约简规则信息外，还包含原始各对象的参数信息，当加入某类新样本(对象)时，只要将该对象与知识库中各规则进行相应性与合并性检测。从而确定原知识库中各规则是否要修改；或者是否将其合并到知识库中某一规则；或者是否要对知识库增加一新规则。最后修改原知识库的参数信息，从而实现对知识库的动态维护(包括对规则修改，删除与增补等)。可以更快地从新增加的数据中获取新的知识，而不需要对新、旧数据一起进行知识获取的操作，提高了效率。

3、本发明方法不仅针对MIB变量进行了开采，还可以对性能数据进行预处理。

具体实施方式

本发明建立网络故障诊断规则库的方法实施例，其步骤包括：

(1)网络中的设备将故障数据输入的步骤。

(2)对故障数据中的条件属性进行预处理的步骤；它包括MIB变量值的处理方法和对性能数据值(cpu利用率，路径延迟等)进行相对值处理的步骤，其中MIB变量值的处理方法同粗集理论MIB开采方法。

对性能数据值进行相对值处理的步骤可按照相对值计算：

A_{c} = \frac{A_{f}}{A_{a}}

其中，A_f表示原始数据值，A_a表示30s的时间间隔内的平均值，A_c为计算后得到的相对值。

相对值也可按其它方法得到。

本实施例中将加入一个新的属性：A14，表示路径延迟。由于延迟量是一个实数型的连续变量，需要离散化。规定大于某个阈值的情况为2，表示不正常；反之为1，表示正常。

(3)将预处理后的故障数据组成一个决策信息表的步骤；

将预处理后的故障数据列表，每列对应一个变量，最后一列表示故障原因，合并重复的行，得到决策信息表(见表4)。

其中：

t1：正常

t2：连线中间断

t3：1601端故障

t4：2620卡故障

t5：管理性关闭

t6：链路协议错

表4：

序号	A1	A2	A3	A4	A5	A6	A7	A8	A9	A10	A11	A12	A13	A14	D
序号	A1	A2	A3	A4	A5	A6	A7	A8	A9	A10	A11	A12	A13	A14	D	1	23	1	1	0	0	0	1	2	0	0	0	1	1	1	t1
2	23	1	1	0	0	1	1	1	0	0	0	1	1	1	t1	1	23	1	1	0	0	0	1	2	0	0	0	1	1	1	t1
2	23	1	1	0	0	1	1	1	0	0	0	1	1	1	t1	3	23	1	2	0	0	0	0	0	0	1	0	0	1	1	t2
4	23	1	2	0	0	0	0	0	0	1	0	0	1	1	t2	3	23	1	2	0	0	0	0	0	0	1	0	0	1	1	t2
4	23	1	2	0	0	0	0	0	0	1	0	0	1	1	t2	5	23	1	2	0	0	0	0	0	0	1	0	0	1	2	t3
6	23	1	2	0	0	0	0	0	0	1	0	0	1	2	t3	5	23	1	2	0	0	0	0	0	0	1	0	0	1	2	t3
6	23	1	2	0	0	0	0	0	0	1	0	0	1	2	t3	7	23	1	2	0	0	0	0	0	0	1	0	1	0	1	t4
8	23	1	2	0	0	0	0	0	0	1	0	1	0	1	t4	7	23	1	2	0	0	0	0	0	0	1	0	1	0	1	t4
8	23	1	2	0	0	0	0	0	0	1	0	1	0	1	t4	9	23	2	2	0	0	0	0	0	0	0	0	1	0	1	t5
10	23	2	2	0	0	0	0	0	0	0	0	1	0	1	t5	9	23	2	2	0	0	0	0	0	0	0	0	1	0	1	t5
10	23	2	2	0	0	0	0	0	0	0	0	1	0	1	t5	11	22	1	2	1	1	0	0	0	1	1	1	1	1	1	t6
12	22	1	2	1	1	0	0	0	1	1	1	1	1	1	t6	11	22	1	2	1	1	0	0	0	1	1	1	1	1	1	t6

1 2 3 4 5 6 7 8 9a b c d e

(4)对决策信息表进行约简的步骤；

步骤①②③④⑥⑦具体为：

得到决策信息表对应的差异相似矩阵M_ds，见表5

表5：

1

2

3

4

5

6

7

8

9

a

b

c

M_{ds} = [\begin{matrix} 0 & 1 . . 579 . . e & 378 ac & 378 ac & 378 ace & 378 ace & 378 ad & 378 ad & 2378 d & 2378 d & 13 . . 57 . . b & 13 . . 57 . . b \\ 0 & 36 . . 8 ac & 36 . . 8 ac & 36 . . 8 ace & 36 . . 8 ace & 36 . . 8 ad & 36 . . 8 ad & 236 . . 8 d & 236 . . 8 d & 13 . . b & 13 . . b \\ 0 & 1 . . e & e & e & cd & cd & 2 acd & 2 acd & 1459 bc & 1459 bc \\ 0 & e & e & cd & cd & 2 acd & 2 acd & 1459 bc & 1459 bc \\ 0 & 1 . . e & c . . e & c . . e & 2 ac . . e & 2 ac . . e & 1459 bce & 1459 bce \\ 0 & c . . e & c . . e & 2 ac . . e & 2 ac . . e & 1459 bce & 1459 bce \\ 0 & 1 . . e & 2 a & 2 a & 1459 bd & 1459 bd \\ 0 & 2 a & 2 a & 1459 bd & 1459 bd \\ 0 & 1 . . e & 12459 . . bd & 12459 . . bd \\ 0 & 12459 . . bd & 12459 . . bd \\ 0 & 1 . . e \\ 0 \end{matrix}]

为清楚起见，将差异相似矩阵写成表格形式(见表6)：

表6：

	1	2	3	4	5	6	7	8	9	10	11	12
	1	2	3	4	5	6	7	8	9	10	11	12	1	0	1..57a<u>..e</u>	378ac	378ac	378ace	378ace	378ad	378ad	2378d	2378d	13..57..b	13..57..b
2		0	36..8ac	36..8ac	36..8ace	36..8ace	36..8ad	36..8ad	236..8d	236..8d	13..b	13..b	1	0	1..57a<u>..e</u>	378ac	378ac	378ace	378ace	378ad	378ad	2378d	2378d	13..57..b	13..57..b
2		0	36..8ac	36..8ac	36..8ace	36..8ace	36..8ad	36..8ad	236..8d	236..8d	13..b	13..b	3			0	1..e	e	e	cd	cd	2acd	2acd	1459bc	1459bc
4				0	e	e	cd	cd	2acd	2acd	1459bc	1459bc	3			0	1..e	e	e	cd	cd	2acd	2acd	1459bc	1459bc
4				0	e	e	cd	cd	2acd	2acd	1459bc	1459bc	5			e	e	0	1..e	c..e	c..e	2ac..e	2ac..e	1459bce	1459bce
6			e	e		0	c..e	c..e	2ac..e	2ac..e	1459bce	1459bce	5			e	e	0	1..e	c..e	c..e	2ac..e	2ac..e	1459bce	1459bce
6			e	e		0	c..e	c..e	2ac..e	2ac..e	1459bce	1459bce	7							0	1..e	2a	2a	1459bd	1459bd
8								0	2a	2a	1459bd	1459bd	7							0	1..e	2a	2a	1459bd	1459bd
8								0	2a	2a	1459bd	1459bd	9									0	1..e	12459..bd	12459..bd
10										0	12459..bd	12459..bd	9									0	1..e	12459..bd	12459..bd
10										0	12459..bd	12459..bd	11											0	1..e
12												0	11											0	1..e

具有下划线的为相似的元素，其它为差异元素，0表示自身。

根据对象属性的差异性与相似性，定义了一种差异相似性矩阵DSM(DifferenceSimilitude Matrix)，矩阵中元素值定义为：

m_{ij}^{s} = \{\begin{matrix} c &Element; C & : f (c, x_{i}) = f (c, x_{j}), D (x_{i}) = D (x_{j}) \\ φ & : f (c, x_{i}) &NotEqual; f (c, x_{j}), D (x_{i}) = D (x_{j}) \\ 0 & : i = j \end{matrix}

m_{ij}^{d} = \{\begin{matrix} c &Element; C & : f (c, x_{i}) &NotEqual; f (c, x_{j}), D (x_{i}) &NotEqual; D (x_{j}) \\ φ & : f (c, x_{i}) = f (c, x_{j}), D (x_{i}) &NotEqual; D (x_{j}) \end{matrix}

f(c，x_i)是样本i的条件属性c的值，D(x_i)是样本i的决策属性值。

m_ij ^s针对同类样本，m_ij ^d针对不同类样本。

M(C，D)中任一行i的m_ij ^d与m_ij ^s分别描述了对象X_i与X_j的差异性与相似性。显然，若

m_{ij}^{d} = φ,

则表示不同类对象X_i与X_j是不相容的，它们在知识约简时，不可能生成合理的规则。同理，若

m_{ij}^{s} = φ,

则表示相同决策类的对象X_i与X_j是无关联的(即无相似性)，故在知识约简时，它们不可能进行规则的合并(即规则约简)，若

| m_{ij}^{s} | = | c |,

则表示相同决策类的对象X_i与X_j是全相关的(即X_i与X_j完全相同)，故可能将它合而为一，以消除冗余对象。

求出对应每个条目的基本属性C_i ⁰，基本属性的定义：

| m_{ij}^{d} | = 1,

则对应属性为基本属性C_i ⁰。

求出对应每个条目的最佳属性约简集B_i ^op的修正子集P(C_i ⁰)_op。

为保证得到的规则最少，P(C_i ⁰)_op满足如下条件：

\{\begin{matrix} &ForAll; (m_{ij}^{d}) \cap B_{i}^{op} &NotEqual; Φ \\ u (i, j) &RightArrow; \max \end{matrix}

其中i＝1～n-1，j＝j_s～j_e.j_s和j_e分别表示同类对象在M(C，D)的起、末标号。u(i，j)表示知识约简时的合并度，其定义如下：对于给定的信息系统，对象X_i与同类其它对象X_l，在知识约简时的合并度定义为：

u (i, l) = δ (Σ_{j = 1}^{n} | m_{il}^{s} \cap m_{ij}^{d} |), l = j_{s} ~ j_{e}, j \overset{&OverBar;}{&Element;} [j_{s} \cdot \cdot \cdot j_{e}]

它表示当以m_il ^s为候选约简属性集时，对象X_i与X_l的可能合并程度(以属性个数记)。而

由上述定义可知：当u(i，l)＝0，则表示对象X_i与X_j在知识约简时其规则是不能合并的，而当u(i，l)＞0时，则表示X_i与X_l在知识约简时，其规则是可合并的，且其值就表示它们具有相同属性值的数目。

计算每个条目的最佳属性约简集B_i ^op：

a)设信息系统的M(C，D)中的任一行i的基本属性集为

C_{i}^{0} &NotEqual; Φ,

若C_i ⁰与该行所有m_ij ^d的交集均不为空集，即：

&ForAll; (m_{ij}^{d}) \cap C_{i}^{0} &NotEqual; Φ,

j＝1，2，…，n，则该行i所对应原规则的最佳约简属性集

B_{i}^{op} = C_{i}^{0} .

b)设信息系统的M(C，D)中某行i的基本属性集

C_{i}^{0} &NotEqual; Φ,

若至少存在一个m_ij ^d与C_i ⁰之交集为空集，即：

&Exists; (m_{ij}^{d}) \cap C_{i}^{0} = φ,

j＝1，2，…，n，则C_i ⁰只是该行所对应原规则的最佳候选约简属性集B_i ^op的子集，即

C_{i}^{0} &SubsetEqual; B_{i}^{op} .

而对应的B_i ^op应为：

B_{i}^{op} = C_{i}^{0} \cup P {({\overset{&OverBar;}{C}}_{i}^{0})}_{op} .

列出每个条目对应的规则B_i ^op→D(x_i)。

求出{c_i ^b，B_i ^op，r_i}i＝1..An，An表示样本数据个数(见表6)。

表6

	c<sub>i</sub><sup>b</sup>	B<sub>i</sub><sup>op</sup>	r<sub>i</sub>
	c<sub>i</sub><sup>b</sup>	B<sub>i</sub><sup>op</sup>	r<sub>i</sub>	1	φ	3(3，7)	1→t1
2	φ	3(3，7)	1→t1	1	φ	3(3，7)	1→t1
2	φ	3(3，7)	1→t1	3	e	ce	01→t2
4	e	ce	01→t2	3	e	ce	01→t2
4	e	ce	01→t2	5	e	e	2→t3
6	e	e	2→t3	5	e	e	2→t3
6	e	e	2→t3	7	φ	2(2，a)d	10→t4
8	φ	2(2，a)d	10→t4	7	φ	2(2，a)d	10→t4
8	φ	2(2，a)d	10→t4	9	φ	2	2→t5
10	φ	2	2→t5	9	φ	2	2→t5
10	φ	2	2→t5	11	φ	1(1，4，5，9，b)	22→t6
12	φ	1(1，4，5，9，b)	22→t6	11	φ	1(1，4，5，9，b)	22→t6

⑧合并相同约简规则的步骤。

(5)生成规则库(见表7)并存储的步骤；

表7

	r
	r	1	A3＝1→t1
2	{A12＝0，A14＝1}→t2	1	A3＝1→t1
2	{A12＝0，A14＝1}→t2	3	A14＝2→t3
4	{A2＝1，A13＝0}→t4	3	A14＝2→t3
4	{A2＝1，A13＝0}→t4	5	A2＝2→t5
6	A1＝22→t6	5	A2＝2→t5

(6)增量式知识获取的步骤：

①从决策信息表获得对象条件属性数量AN、故障原因数量TN；从规则库获得规则的数量RN；

RN＝6，AN＝14，TN＝6。

②建立具有故障原因RTN(k)、候选属性集B_k ^op(v_k)、每条规则所含的对象数量RON(k)、每条规则所含的对象除候选属性集外的属性值RAC(k)的规则库信息表并存储的步骤；

规则库信息表(见表8)：

表8

RTN	B<sub>i</sub><sup>vp</sup>(v<sub>i</sub>)	RON	RAC
RTN	B<sub>i</sub><sup>vp</sup>(v<sub>i</sub>)	RON	RAC	t1	A3＝1	2	(A1＝23，A2＝A7＝A12..A14＝1，A4＝A5＝A9..A11＝0)(1，2)，A6＝0(1)，A6＝1(2)，A8＝2(1)，A8＝1(2)
t2	A12＝0，A14＝1	2	(A1＝23，A2＝A10＝A13＝1，A3＝2，A4..A9＝A11＝0)(3，4)	t1	A3＝1	2
t2	A12＝0，A14＝1	2	(A1＝23，A2＝A10＝A13＝1，A3＝2，A4..A9＝A11＝0)(3，4)	t3	A14＝2	2	(A1＝23，A2＝A10＝A13＝1，A3＝2，A4..A9＝A11＝A12＝0)(5，6)
t4	A2＝1，A13＝0	2	(A1＝23，A10＝A12＝A14＝1，A3＝2，A4..A9＝A11＝0)(7，8)	t3	A14＝2	2	(A1＝23，A2＝A10＝A13＝1，A3＝2，A4..A9＝A11＝A12＝0)(5，6)
t4	A2＝1，A13＝0	2	(A1＝23，A10＝A12＝A14＝1，A3＝2，A4..A9＝A11＝0)(7，8)	t5	A2＝2	2	(A1＝23，A3＝2，A4..A11＝A13＝0，A12＝A14＝1)(9，10)
t6	A1＝22	2	(A2＝A4＝A5＝A9..A14＝1，A3＝2，A6..A8＝0)(11，12)	t5	A2＝2	2	(A1＝23，A3＝2，A4..A11＝A13＝0，A12＝A14＝1)(9，10)

③网络中的设备将新的故障数据输入的步骤；

增加一个对象(见表9)：x13：

表9

序号	A1	A2	A3	A4	A5	A6	A7	A8	A9	A10	A11	A12	A13	A14	D
序号	A1	A2	A3	A4	A5	A6	A7	A8	A9	A10	A11	A12	A13	A14	D	13	23	1	1	0	1	1	0	0	0	0	0	1	1	1	t7

④对新的故障数据中的条件属性进行预处理的步骤；

同步骤(2)

⑤将预处理后的新的故障数据添加到决策信息表的步骤；

⑥从规则库信息表中提取与新故障数据的故障原因不同的规则，新的对象与其中一个规则所含的各对象的属性进行一一对比，取得各属性中有差异的属性并存储的步骤：

b、从修正子集得到候选属性集并存储的步骤；

⑦重复步骤⑥，直至新的对象与各规则包含的所有对象进行一一对比完毕；

步骤⑥⑦具体为：

求出知识库参数和规则库信息表。

x13：{A1＝23，A2＝A3＝A5＝A6＝A12..A14＝1，A4＝A7..A11＝0}→t7.

首先处理RTN(k)≠t7的规则。

对于r1：A3＝1→t2，包含样本x1和x2，所以检查x1和x2：

x 1 : B_{1}^{vp} \cup {A 1 = 23, A 2 = A 7 = A 12 . . A 14 = 1, A 4 . . A 6 = A 9 . . A 11 = 0, A 8 = 2} &RightArrow; t 1

∴

M_{13,1}^{d} = \cup {q &Element; C : f (q, x_{1}) &NotEqual; f (q, x_{13})} = 5678,

∵

M_{13,1}^{d} \cap B_{1}^{vp} = φ,

故x1对应于r₁的规则需要修改，∵

| M_{13,1}^{d} | = 4,

于是需要(5678)中选取一个属性(选合并度最大的属性)，∵μ_A5(x₁，A5＝0)＝|(x₁，x₂)|＝2，∵μ_A6(x₁，A6＝0)＝|(x₁)|＝1，∵μ_A7(x₁，A7＝1)＝|(x₁，x₂)|＝2，∵μ_A8(x₁，A8＝2)＝|(x₁)|＝1，故应选取5(5，7)，亦即，对于x₁的新规则为：{A3＝1}∪{A5＝0}＝{A3＝1，A5＝0}→t1，而对应的RAC应修改为(A1＝23，A2＝A7＝A12..A14＝1，A4＝A6＝A9..A11＝0，A8＝2)(1)。

x 2 : B_{1}^{vp} \cup {A 1 = 23, A 2 = A 7 = A 12 . . A 14 = 1, A 4 . . A 6 = A 8 . . A 11 = 0} &RightArrow; t 1

∴

M_{13,2}^{d} = \cup {q &Element; C : f (q, x_{2}) &NotEqual; f (q, x_{13})} = 578,

∵

M_{13,2}^{d} \cap B_{1}^{vp} = φ,

故x2对应于r₁的规则需要修改，∵

| M_{13,2}^{d} | = 3,

于是需要(578)中选取一个属性(选合并度最大的属性)，∵μ_A5(x₂，A5＝0)＝|(x₁，x₂)|＝2，∵μ_A7(x₂，A7＝1)＝|(x₁，x₂)|＝2，∵μ_A8(x₂，A8＝1)＝|(x₂)|＝1，故应选取5(5，7)，亦即，对于x₂的新规则为：{A3＝1}∪{A5＝0}＝{A3＝1，A5＝0}→t1，而对应的RAC应修改为(A1＝23，A2＝A6..A8＝A12..A14＝1，A4＝A9..A11＝0)(2)。

对于r2：{A12＝0，A14＝1}→t2，包含样本x3和x4，所以检查x3和x4：

x 3 : B_{2}^{vp} \cup {A 1 = 23, A 2 = A 10 = A 13 = 1, A 3 = 2, A 4 . . A 9 = A 11 = 0} &RightArrow; t 2

∴

M_{13,3}^{d} = \cup {q &Element; C : f (q, x_{3}) &NotEqual; f (q, x_{13})} = 356 ac,

∵

M_{13,3}^{d} \cap B_{2}^{vp} = c &NotEqual; φ,

故对应于r₂的规则，则不需要修改。

同理：x4与x13比较后，不需要修改r₂。

对于r3：A14＝2→t3，包含样本x5和x6，所以检查x5和x6：

x 5 : B_{3}^{vp} \cup {A 1 = 23, A 2 = A 10 = A 13 = 1, A 3 = 2, A 4 . . A 9 = A 11 = A 12 = 0} &RightArrow; t 3

∴

M_{13,5}^{d} = \cup {q &Element; C : f (q, x_{5}) &NotEqual; f (q, x_{13})} = 356 ace,

∵

M_{13,5}^{d} \cap B_{3}^{vp} = e &NotEqual; φ,

故对应于r₃的规则，则不需要修改。

同理：x6与x13比较后，不需要修改r₃。

对于r4：{A2＝1，A13＝0}→t4，包含样本x7和x8，所以检查x7和x8：

x 7 : B_{4}^{vp} \cup {A 1 = 23, A 10 = A 12 = A 14 = 1, A 3 = 2, A 4 . . A 9 = A 11 = 0} &RightArrow; t 4

∴

M_{13,7}^{d} = \cup {q &Element; C : f (q, x_{7}) &NotEqual; f (q, x_{13})} = 356 ad,

∵

M_{13,7}^{d} \cap B_{4}^{vp} = d &NotEqual; φ,

故对应于r₄的规则，则不需要修改。

同理：x8与x13比较后，不需要修改r₄。

对于r5：A2＝2→t5，包含样本x9和x10，所以检查x9和x10：

x 9 : B_{5}^{vp} \cup {A 1 = 23, A 3 = 2, A 4 . . A 11 = A 13 = 0, A 12 = A 14 = 1} &RightArrow; t 5

∴

M_{13,9}^{d} = \cup {q &Element; C : f (q, x_{9}) &NotEqual; f (q, x_{13})} = 2356 d,

∵

M_{13,9}^{d} \cap B_{5}^{vp} = 2 &NotEqual; φ,

故对应于r₅的规则，则不需要修改。

同理：x10与x13比较后，不需要修改r₅。

对于r6：A1＝22→t6，包含样本x11和x12，所以检查x11和x12：

x 11 : B_{6}^{vp} \cup {A 2 = A 4 = A 5 = A 9 . . A 14 = 1, A 3 = 2, A 6 . . A 8 = 0} &RightArrow; t 6

∴

M_{13,11}^{d} = \cup {q &Element; C : f (q, x_{11}) &NotEqual; f (q, x_{13})} = 13469 ab

∵

M_{13,11}^{d} \cap B_{3}^{vp} = 1 &NotEqual; φ,

故对应于r₆的规则，则不需要修改。

同理：x12与x13比较后，不需要修改r₆。

⑧将差异属性集中属性数量为一的属性合并得到基属性集并存储的步骤；获得修正子集的步骤，修正子集满足如下条件：修正子集与差异属性集中每个元素的交集不为空，且修正子集与相似属性集的合并度最大；取基属性集和修正子集的并集得到候选属性集并存储的步骤；将候选属性集作为条件，该对象的故障原因作为结果，生成约简规则；

求x₁₃的约简规则。

c_{13}^{b} = \cup {m_{13, j}^{d} : | m_{13, j}^{d} | = 1, j = 3 ~ 12} = φ,

又∵

c_{13}^{b} \cap (&ForAll; m_{13, d}^{d}) = φ,

故需要求其补充属性集：

表10

	1	2	3	4	5	6	7	8	9	10	11	12	13
	1	2	3	4	5	6	7	8	9	10	11	12	13	13	5678	578	356ac	356ac	356ace	356ace	356ad	356ad	2356d	2356d	13469ab	13469ab	0

x₁₃的可选集合为3(3，6)5(5，7，8)，候选属性集为

B_{13}^{op} = 35 .

故x₁₃的约简规则为：

B_{13}^{op} (v_{13}) = {A 3 = 1, A 5 = 1} &RightArrow; t 7,

而对应的RAC应修改为：

(A1＝23，A2＝A6＝A12..A14＝1，A4＝A7..A11＝0)(13)。

⑨合并相同约简规则，生成规则库并存储的步骤。

新规则库(表11)：

表11

RTN	B<sub>i</sub><sup>vp</sup>(v<sub>i</sub>)	RON	RAC
RTN	B<sub>i</sub><sup>vp</sup>(v<sub>i</sub>)	RON	RAC	t1	A3＝1，A5＝0	1	(A1＝23，A2＝A7＝A12..A14＝1，A4＝A6＝A9..A11＝0，A8＝2)(1)
t1	A3＝1，A5＝0	1	(A1＝23，A2＝A6..A8＝A12..A14＝1，A4＝A9..A11＝0)(2)	t1	A3＝1，A5＝0	1	(A1＝23，A2＝A7＝A12..A14＝1，A4＝A6＝A9..A11＝0，A8＝2)(1)
t1	A3＝1，A5＝0	1	(A1＝23，A2＝A6..A8＝A12..A14＝1，A4＝A9..A11＝0)(2)	t2	A12＝0，A14＝1	2	(A1＝23，A2＝A10＝A13＝1，A3＝2，A4..A9＝A11＝0)(3，4)
t3	A14＝2	2	(A1＝23，A2＝A10＝A13＝1，A3＝2，A4..A9＝A11＝A12＝0)(5，6)	t2	A12＝0，A14＝1	2	(A1＝23，A2＝A10＝A13＝1，A3＝2，A4..A9＝A11＝0)(3，4)
t3	A14＝2	2	(A1＝23，A2＝A10＝A13＝1，A3＝2，A4..A9＝A11＝A12＝0)(5，6)	t4	A2＝1，A13＝0	2	(A1＝23，A10＝A12＝A14＝1，A3＝2，A4..A9＝A11＝0)(7，8)
t5	A2＝2	2	(A1＝23，A3＝2，A4..A11＝A13＝0，A12＝A14＝1)(9，10)	t4	A2＝1，A13＝0	2	(A1＝23，A10＝A12＝A14＝1，A3＝2，A4..A9＝A11＝0)(7，8)
t5	A2＝2	2	(A1＝23，A3＝2，A4..A11＝A13＝0，A12＝A14＝1)(9，10)	t6	A1＝22	2	(A2＝A4＝A5＝A9..A14＝1，A3＝2，A6..A8＝0)(11，12)
t7	A3＝1，A5＝1	1	(A1＝23，A2＝A6＝A12..A14＝1，A4＝A7..A11＝0)(13)	t6	A1＝22	2	(A2＝A4＝A5＝A9..A14＝1，A3＝2，A6..A8＝0)(11，12)

合并之后得到：

RN＝7，AN＝14，TN＝7。

规则库(表12)为：

表12

RTN	B<sub>i</sub><sup>vp</sup>(v<sub>i</sub>)	RON	RAC
RTN	B<sub>i</sub><sup>vp</sup>(v<sub>i</sub>)	RON	RAC	t1	A3＝1，A5＝0	2	(A1＝23，A2＝A7＝A12..A14＝1，A4＝A9..A11＝0)(1，2)，A6＝0(1)，A6＝1(2)，A8＝2(1)，A8＝1(2)
t2	A12＝0，A14＝1	2	(A1＝23，A2＝A10＝A13＝1，A3＝2，A4..A9＝A11＝0)(3，4)	t1	A3＝1，A5＝0	2
t2	A12＝0，A14＝1	2	(A1＝23，A2＝A10＝A13＝1，A3＝2，A4..A9＝A11＝0)(3，4)	t3	A14＝2	2	(A1＝23，A2＝A10＝A13＝1，A3＝2，A4..A9＝A11＝A12＝0)(5，6)
t4	A2＝1，A13＝0	2	(A1＝23，A10＝A12＝A14＝1，A3＝2，A4..A9＝A11＝0)(7，8)	t3	A14＝2	2	(A1＝23，A2＝A10＝A13＝1，A3＝2，A4..A9＝A11＝A12＝0)(5，6)
t4	A2＝1，A13＝0	2	(A1＝23，A10＝A12＝A14＝1，A3＝2，A4..A9＝A11＝0)(7，8)	t5	A2＝2	2	(A1＝23，A3＝2，A4..A11＝A13＝0，A12＝A14＝1)(9，10)
t6	A1＝22	2	(A2＝A4＝A5＝A9..A14＝1，A3＝2，A6..A8＝0)(11，12)	t5	A2＝2	2	(A1＝23，A3＝2，A4..A11＝A13＝0，A12＝A14＝1)(9，10)
t6	A1＝22	2	(A2＝A4＝A5＝A9..A14＝1，A3＝2，A6..A8＝0)(11，12)	t7	A3＝1，A5＝1	1	(A1＝23，A2＝A6＝A12..A14＝1，A4＝A7..A11＝0)(13)

本发明实施例采用差异相似矩阵表征网络数据的不同点和相同点，基于差异相似矩阵的网络知识获取方法充分利用了不同样本属性之间的差异得到对样本分类的规则，利用同类样本属性之间的相似性对得到的规则合并，并最终得到最佳规则，即规则数最少，规则包含的属性最少。这样规则存储空间少，在进行故障诊断时速度加快。

Claims

1.一种建立网络故障诊断规则库的方法，其步骤包括：

(1)网络中的设备将故障数据输入的步骤；

(2)对故障数据中的条件属性进行预处理的步骤；

(3)将预处理后的故障数据组成一个决策信息表的步骤；

(4)对决策信息表进行约简的步骤；

(5)生成规则库并存储的步骤；

其特征在于：

对决策信息表进行约简的步骤具体包括：

⑧合并相同约简规则的步骤。

2.如权利要求1所述的方法，其特征在于：它还包括增量式知识获取的步骤，其具体步骤包括：

C、网络中的设备将新的故障数据输入的步骤；

D、对新的故障数据中的条件属性进行预处理的步骤；

E、将预处理后的新的故障数据添加到决策信息表的步骤；

b、从修正子集得到候选属性集并存储的步骤；

I、合并相同约简规则，生成规则库并存储的步骤。

3.如权利要求1所述的方法，其特征在于：对故障数据中的条件属性进行预处理的步骤还包括对性能数据值进行相对值处理的步骤。