CN1801745A - 一种建立网络故障诊断规则库的方法 - Google Patents
一种建立网络故障诊断规则库的方法 Download PDFInfo
- Publication number
- CN1801745A CN1801745A CN 200610018153 CN200610018153A CN1801745A CN 1801745 A CN1801745 A CN 1801745A CN 200610018153 CN200610018153 CN 200610018153 CN 200610018153 A CN200610018153 A CN 200610018153A CN 1801745 A CN1801745 A CN 1801745A
- Authority
- CN
- China
- Prior art keywords
- attribute
- rule
- subclass
- collection
- information table
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明涉及一种建立网络故障诊断规则库的方法,其步骤包括:(1)网络中的设备将故障数据输入的步骤;(2)对故障数据中的条件属性进行预处理的步骤;(3)将预处理后的故障数据组成一个决策信息表的步骤;(4)对决策信息表进行约简的步骤;(5)生成规则库并存储的步骤。本发明方法的对决策信息表进行约简的步骤利用各对象之间的差异性得到对象分类的规则,利用同类对象属性之间的相似性对得到的规则合并,并最终得到最佳规则,即规则数最少,规则包含的属性最少。这样规则存储空间少,在进行故障诊断时速度更快。
Description
技术领域
本发明涉及计算机网络,具体涉及用于诊断计算机网络故障的规则库,特别是建立网络故障诊断规则库的方法。
背景技术
计算机网络中,网络管理软件每天都产生大量的数据存于网络管理数据库中,这些数据中包括轮询得到的MIB变量(设备自带的管理信息库变量)、网络性能测量数据、网络告警等。网络管理员被大量的信息所淹没,无法发现数据中存在的知识,导致了“数据爆炸而知识贫乏”。如何利用知识发现技术,从这些数据中挖掘出新颖的知识并且进行故障预测和故障的自动恢复是一项很有应用前景的技术。有关的技术包括基于关联规则的网络告警数据库知识发现、基于粗集理论的MIB变量开采、基于贝叶斯网络的告警关联等等。其大体的步骤都是从网络管理数据库中提取故障数据,对数据进行预处理,依照一定的模型或者一定的知识抽取方法从这些数据中提取知识,将这些知识用规则或者图表的形式表达,从而便于以后的网络故障诊断。
现有的网络故障知识获取的方法主要有基于粗集理论的MIB变量开采技术,该技术通过对网络故障采集的MIB变量离散化,运用粗集方法去除错误和不必要的数据,找出反映网络故障现象的MIB变量组及其逻辑组合关系,提取表现故障现象的规则,并将规则用于设计计算机网络故障诊断。其相关文章有:《武汉大学学报(理学版)》(2001,Vol.47,No.3)的文章“基于粗集理论的MIB变量开采”、《兵工自动化》(2003,Vol.22,No.3)的文章“基于粗集理论的规则知识获取”。
现有的获取网络故障诊断规则库方法的具体步骤如下:
(1)网络中的设备将故障数据输入的步骤;
(2)对故障数据中的条件属性进行预处理的步骤,它为对故障数据中的条件属性(由MIB变量表征)进行量化编码,并进行预处理的步骤,具体包括:
①对于本身是离散值的变量,直接利用其值。
②对于表示定性含义的变量,简单地用自然数编码。
③对于取值有限且不会经常改变的表示定量含义的变量,直接利用其值。
④对于累加型变量,计算单位时间内的数值变化,划分合理的量化区间进行编码。
(3)将预处理后的故障数据组成一个决策信息表的步骤,决策信息表的每列对应一个变量,最后一列表示故障原因。
(4)对决策信息表进行约简的步骤,具体包括:
①删除重复的列:从列序号最大者开始删除,需要优先保留的变量放在靠前的列。
②删除冗余的列:从最后一列依次往前选取列,忽略该列后再计算正域,如果与原正域相同则删除这一列,否则保留。
正域就是那些对于知识R能完全确定地归入集合X的对象的集合,用数学表示就是: U/R表示使用知识对离散表示空间U进行划分的结果。
正域的具体的计算方法:所有相容的故障数据构成了正域。这里的不相容指条件属性相同而决策属性不同。
③删除并合并重复的行:从行序号最大者开始删除完全相同的行,重新计算正域,将正域外具有相同条件属性值的行合并,即决策属性用逻辑或连接起来,得到简化了的决策数据表,得到诊断故障的必要条件组合。
④用核值表法进行简化的步骤,简化决策表第一行最后一列开始,忽略该变量所在列后将该行与其他各行比较,如果出现不相容则该变量值是这一条规则的核值,把该值保留在核值表中相应位置,反之核值表中相应位置标示“-”,此过程循环到最后一行,核值表中的保留属性为诊断故障的充分条件组合。将核值表中的剩余条件属性用逻辑与连接起来,且将有相同决策属性的列合并,既把有相同决策属性列的条件组合逻辑或起来,形成规则库并存储。
(5)生成规则库并存储的步骤。
用一个实例来说明其具体步骤:它为两个子网间通过cisco1601、cisco2620连接,对路山器之间的连接故障进行MIB变量开采。
将经过预处理后的数据组成一个决策表,每列对应一个变量,最后一列表示故障原因,每次实验的数据按顺序排成一行,从而得到类似表的二维表格。对示例中的2620串口提取接口组MIB变量(公有24个,私有36个),经过预处理并去掉明显无用的变量,得到决策表(见表1),其属性说明如下:
属性A 1:对应MIB 1.3.6.1.2.1.2.2.1.3,为接口协议类型(23为PPP,22为HDLC);
属性A 2:对应MIB 1.3.6.1.2.1.2.2.1.7,为接口管理状态(1为开,2为关);
属性A 3:对应MIB 1.3.6.1.2.1.2.2.1.8,为接口当前状态(1为up,2为down);
属性A 4:对应MIB 1.3.6.1.2.1.2.2.1.14,为输入出错包数(0为不增,1为增加);
属性A 5:对应MIB 1.3.6.1.2.1.2.2.1.15,为丢弃的包数(0为不增,1为增加);
属性A 6:对应1.3.6.1.4.1.9.2.2.1.1.2,为链路连接状态(1为up,0为down);
属性A 7:对应1.3.6.1.4.1.9.2.2.1.1.7,为平均输入流量(1为增加,2为不定);
属性A 8:对应1.3.6.1.4.1.9.2.2.1.1.9,为平均输出流量(1为增加,2为不定);
属性A 9:对应1.3.6.1.4.1.9.2.2.1.1.13,为CRC错包数(0为不增,1为增加);
属性A 10:对应1.3.6.1.4.1.9.2.2.1.1.17,为内部重启次数(0为不增,1为增加);
属性A 11:对应1.3.6.1.4.1.9.2.2.1.1.21,为收到CD个数(O为不增,1为增加);
属性A 12:对应1.3.6.1.4.1.9.2.2.2.1.2,为串口DCE检测(1为up,0为down);
属性A 13:对应1.3.6.1.4.1.9.2.2.2.1.5,为串口DTE检测(1为up,0为down);
属性D:为故障原因
表1:2620串口故障预处理后的决策表
序号 | A1 | A2 | A3 | A4 | A5 | A6 | A7 | A8 | A9 | A10 | A11 | A12 | A13 | D |
1 | 23 | 1 | 1 | 0 | 0 | 0 | 1 | 2 | 2 | 0 | 0 | 1 | 1 | 正常 |
2 | 23 | 1 | 1 | 0 | 0 | 1 | 1 | 1 | 0 | 0 | 0 | 1 | 1 | 正常 |
3 | 23 | 1 | 2 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 1 | 连线中间断 |
4 | 23 | 1 | 2 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 1 | 连线中间断 |
5 | 23 | 1 | 2 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 1 | 1601端故障 |
6 | 23 | 1 | 2 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 1 | 1601端故障 |
7 | 23 | 1 | 2 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 1 | 0 | 2620卡故障 |
8 | 23 | 1 | 2 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 1 | 0 | 2620卡故障 |
9 | 23 | 2 | 2 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 管理性关闭 |
10 | 23 | 2 | 2 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 管理性关闭 |
11 | 22 | 1 | 2 | 1 | 1 | 0 | 0 | 0 | 1 | 1 | 1 | 1 | 1 | 链路协议错 |
12 | 22 | 1 | 2 | 1 | 1 | 0 | 0 | 0 | 1 | 1 | 1 | 1 | 1 | 链路协议错 |
删除冗余的行、列之后得到的结果(表2)所示:
表2:简化后的决策数据表
序号 | A1 | A2 | A3 | A12 | D |
1 | 23 | 1 | 1 | 1 | 正常 |
2 | 23 | 1 | 2 | 0 | 连线断或1601端故障 |
3 | 23 | 1 | 2 | 1 | 2620卡故障 |
4 | 23 | 2 | 2 | 1 | 管理性关闭 |
5 | 22 | 1 | 2 | 1 | 链路协议错 |
进一步求其核值表的结果(表3),生成规则库。
规则库对应规则表示为:
(1)A3=1:串行接口工作正常;
(2)A1=23 and A2=1 and A3=2 and A12=0:串口电缆或对方设备故障;
(3)A1=23 and A2=1 and A3=2 and A12=1:串口硬件故障;
(4)A2=2:串口被管理性关闭故障;
(5)A1=22:串口数据链路协议配置错误。
表3:规则库:
序号 | A1 | A2 | A3 | A12 | D |
1 | - | - | 1 | - | 正常 |
2 | 23 | 1 | 2 | 0 | 连线断或1601端故障 |
3 | 23 | 1 | 2 | 1 | 2620卡故障 |
4 | - | 2 | - | - | 管理性关闭 |
5 | 22 | - | - | - | 链路协议错 |
基于粗集理论的MIB变量开采不需要关于数据的任何先验信息,分析隐藏在故障数据中的知识,从众多MIB变量中找到对诊断特定故障最有用的MIB变量集合,这样既可以减少系统处理MIB变量的复杂度,又可以舒缓网络传输负担。但该方法存在以下缺陷:1、该方法只能针对MIB变量进行开采,不能涉及到其它类型的网络信息处理(如性能参数等);2、对决策信息表进行约简的步骤未考虑故障原因之间的相似性,规则数多,规则包含的属性多,规则存储空间大,在进行故障诊断时速度慢;3、网络故障知识获取只限于对以往的所有故障数据进行挖掘,在新的网管数据加入时,只能对新、旧数据一起进行知识获取的操作,效率低。
发明内容
本发明所要解决的技术问题之一是:提供一种建立网络故障诊断规则库的方法,该方法的规则数少,规则包含的属性少,规则存储空间少,在进行故障诊断时速度快。
本发明所要解决的技术问题之二是:提供一种建立网络故障诊断规则库的方法,该方法可在新的网管数据加入时,高效地获取更多的网络故障诊断规则库知识。
本发明所要解决的技术问题之三是:提供一种建立网络故障诊断规则库的方法,该方法不仅可针对MIB变量进行开采,还可对性能等数据进行取值处理。
本发明解决上述技术问题所采用的技术方案是:
一种建立网络故障诊断规则库的方法,其步骤包括:
(1)网络中的设备将故障数据输入的步骤;
(2)对故障数据中的条件属性进行预处理的步骤;
(3)将预处理后的故障数据组成一个决策信息表的步骤;
(4)对决策信息表进行约简的步骤;
(5)生成规则库并存储的步骤;
对决策信息表进行约简的步骤具体包括:
①对决策信息表中一个对象的故障原因与其它对象的故障原因进行对比的步骤;
②故障原因不同的,一一对比各属性,取得各属性中有差异的属性,建立差异属性集并存储的步骤;或故障原因相同的,一一对比各属性,取得各属性中相同的属性,建立相似属性集并存储的步骤;
③将差异属性集中属性数量为一的属性合并得到基属性集并存储的步骤;
④获得修正子集的步骤,修正子集满足如下条件:修正子集与差异属性集中每个元素的交集不为空,且修正子集与相似属性集的合并度最大;
⑤取基属性集和修正子集的并集得到候选属性集并存储的步骤;
⑥将候选属性集作为条件,该对象的故障原因作为结果,生成约简规则;
⑦循环步骤①-⑥,直至决策信息表中的每个对象与其它对象进行一一对比完毕;
⑧合并相同的生成约简规则的步骤。
上述方案中还包括增量式知识获取的步骤,其具体步骤包括:
①从决策信息表获得对象条件属性数量、故障原因数量;从规则库获得规则的数量;
②建立具有故障原因、候选属性集、每条规则所含的对象数量、每条规则所含的对象除候选属性集外的属性值的规则库信息表并存储的步骤;
③网络中的设备将新的故障数据输入的步骤;
④对新的故障数据中的条件属性进行预处理的步骤;
⑤将预处理后的新的故障数据添加到决策信息表的步骤;
⑥从规则库信息表中提取与新故障数据的故障原因不同的规则,新的对象与其中一个规则所含的各对象的属性进行一一对比,取得各属性中有差异的属性并存储的步骤:
如果差异属性的元素与候选属性集交集不为空,则该对象对应的原规则不修改;
如果差异属性的元素与候选属性集交集为空,则进行以下步骤,修改该对象对应的原规则;
a、获得修正子集的步骤,修正子集满足如下条件:修正子集与差异属性集中每个元素的交集不为空,且修正子集与相似属性集的合并度最大;
b、从修正子集得到候选属性集并存储的步骤;
c、并同时修改对应的候选属性集、每条规则所含的对象数量、每条规则所含的对象除候选属性集外的属性值;
⑦重复步骤⑥,直至新的对象与各规则包含的所有对象进行一一对比完毕;
⑧将差异属性集中属性数量为一的属性合并得到基属性集并存储的步骤;获得修正子集的步骤,修正子集满足如下条件:修正子集与差异属性集中每个元素的交集不为空,且修正子集与相似属性集的合并度最大;取基属性集和修正子集的并集得到候选属性集并存储的步骤;将候选属性集作为条件,该对象的故障原因作为结果,生成约简规则;
⑨合并相同规则,生成规则库并存储的步骤。
上述方案中,对故障数据中的条件属性进行预处理的步骤还包括对性能数据值进行相对值处理的步骤。
与现有技术相比,本发明方法具有以下优点:
1、本发明方法利用各对象之间的差异性得到对象分类的规则,利用同类对象属性之间的相似性对得到的规则合并,并最终得到最佳规则,即规则数最少,规则包含的属性最少。这样规则存储空间少,在进行故障诊断时速度更快。
2、本发明方法采用增量式网络故障知识获取方法,可满足增长式机器学习的需要,亦即在知识库中除了包含约简规则信息外,还包含原始各对象的参数信息,当加入某类新样本(对象)时,只要将该对象与知识库中各规则进行相应性与合并性检测。从而确定原知识库中各规则是否要修改;或者是否将其合并到知识库中某一规则;或者是否要对知识库增加一新规则。最后修改原知识库的参数信息,从而实现对知识库的动态维护(包括对规则修改,删除与增补等)。可以更快地从新增加的数据中获取新的知识,而不需要对新、旧数据一起进行知识获取的操作,提高了效率。
3、本发明方法不仅针对MIB变量进行了开采,还可以对性能数据进行预处理。
具体实施方式
本发明建立网络故障诊断规则库的方法实施例,其步骤包括:
(1)网络中的设备将故障数据输入的步骤。
(2)对故障数据中的条件属性进行预处理的步骤;它包括MIB变量值的处理方法和对性能数据值(cpu利用率,路径延迟等)进行相对值处理的步骤,其中MIB变量值的处理方法同粗集理论MIB开采方法。
对性能数据值进行相对值处理的步骤可按照相对值计算:
其中,Af表示原始数据值,Aa表示30s的时间间隔内的平均值,Ac为计算后得到的相对值。
相对值也可按其它方法得到。
本实施例中将加入一个新的属性:A14,表示路径延迟。由于延迟量是一个实数型的连续变量,需要离散化。规定大于某个阈值的情况为2,表示不正常:反之为1,表示正常。
(3)将预处理后的故障数据组成一个决策信息表的步骤;
将预处理后的故障数据列表,每列对应一个变量,最后一列表示故障原因,合并重复的行,得到决策信息表(见表4)。
其中:
t1:正常
t2:连线中间断
t3:1601端故障
t4:2620卡故障
t5:管理性关闭
t6:链路协议错
表4:
序号 | A1 | A2 | A3 | A4 | A5 | A6 | A7 | A8 | A9 | A10 | A11 | A12 | A13 | A14 | D |
1 | 23 | 1 | 1 | 0 | 0 | 0 | 1 | 2 | 0 | 0 | 0 | 1 | 1 | 1 | t1 |
2 | 23 | 1 | 1 | 0 | 0 | 1 | 1 | 1 | 0 | 0 | 0 | 1 | 1 | 1 | t1 |
3 | 23 | 1 | 2 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 1 | 1 | t2 |
4 | 23 | 1 | 2 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 1 | 1 | t2 |
5 | 23 | 1 | 2 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 1 | 2 | t3 |
6 | 23 | 1 | 2 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 1 | 2 | t3 |
7 | 23 | 1 | 2 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 1 | 0 | 1 | t4 |
8 | 23 | 1 | 2 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 1 | 0 | 1 | t4 |
9 | 23 | 2 | 2 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 1 | t5 |
10 | 23 | 2 | 2 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 1 | t5 |
11 | 22 | 1 | 2 | 1 | 1 | 0 | 0 | 0 | 1 | 1 | 1 | 1 | 1 | 1 | t6 |
12 | 22 | 1 | 2 | 1 | 1 | 0 | 0 | 0 | 1 | 1 | 1 | 1 | 1 | 1 | t6 |
1 2 3 4 5 6 7 8 9a b c d e
(4)对决策信息表进行约简的步骤;
①对决策信息表中一个对象的故障原因与其它对象的故障原因进行对比的步骤;
②故障原因不同的,一一对比各属性,取得各属性中有差异的属性,建立差异属性集并存储的步骤;或故障原因相同的,一一对比各属性,取得各属性中相同的属性,建立相似属性集并存储的步骤;
③将差异属性集中属性数量为一的属性合并得到基属性集并存储的步骤;
④获得修正子集的步骤,修正子集满足如下条件:修正子集与差异属性集中每个元素的交集不为空,且修正子集与相似属性集的合并度最大;
⑤取基属性集和修正子集的并集得到候选属性集并存储的步骤;
⑥将候选属性集作为条件,该对象的故障原因作为结果,生成约简规则;
⑦循环步骤①-⑥,直至决策信息表中的每个对象与其它对象进行一一对比完毕;
步骤①②③④⑥⑦具体为:
得到决策信息表对应的差异相似矩阵Mds,见表5
表5:
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | a | b | c |
为清楚起见,将差异相似矩阵写成表格形式(见表6):
表6:
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | |
1 | 0 | 1..57a ..e | 378ac | 378ac | 378ace | 378ace | 378ad | 378ad | 2378d | 2378d | 13..57..b | 13..57..b |
2 | 0 | 36..8ac | 36..8ac | 36..8ace | 36..8ace | 36..8ad | 36..8ad | 236..8d | 236..8d | 13..b | 13..b | |
3 | 0 | 1..e | e | e | cd | cd | 2acd | 2acd | 1459bc | 1459bc | ||
4 | 0 | e | e | cd | cd | 2acd | 2acd | 1459bc | 1459bc | |||
5 | e | e | 0 | 1..e | c..e | c..e | 2ac..e | 2ac..e | 1459bce | 1459bce | ||
6 | e | e | 0 | c..e | c..e | 2ac..e | 2ac..e | 1459bce | 1459bce | |||
7 | 0 | 1..e | 2a | 2a | 1459bd | 1459bd | ||||||
8 | 0 | 2a | 2a | 1459bd | 1459bd | |||||||
9 | 0 | 1..e | 12459..bd | 12459..bd | ||||||||
10 | 0 | 12459..bd | 12459..bd | |||||||||
11 | 0 | 1..e | ||||||||||
12 | 0 |
具有下划线的为相似的元素,其它为差异元素,0表示自身。
根据对象属性的差异性与相似性,定义了一种差异相似性矩阵DSM(DifferenceSimilitude Matrix),矩阵中元素值定义为:
f(c,xi)是样本i的条件属性c的值,D(xi)是样本i的决策属性值。
mij s针对同类样本,mij d针对不同类样本。
M(C,D)中任一行i的mij d与mij s分别描述了对象xi与xj的差异性与相似性。显然,若 则表示不同类对象xi与xj是不相容的,它们在知识约简时,不可能生成合理的规则。同理,若
则表示相同决策类的对象xi与xj是无关联的(即无相似性),故在知识约简时,它们不可能进行规则的合并(即规则约简),若
则表示相同决策类的对象xi与xj是全相关的(即xi与xj完全相同),故可能将它合而为一,以消除冗余对象。
求出对应每个条目的基本属性Ci 0,基本属性的定义:
则对应属性为基本属性Ci 0。
求出对应每个条目的最佳属性约简集Bi op的修正子集P(
Ci 0)op。
为保证得到的规则最少,P(
Ci 0)op满足如下条件:
其中i=1~n-1,j=js~je,js和je分别表示同类对象在M(C,D)的起、末标号。u(i,j)表示知识约简时的合并度,其定义如下:
对于给定的信息系统,对象xi与同类其它对象xi,在知识约简时的合并度定义为:
它表示当以mij s为候选约简属性集时,对象xi与xi的可能合并程度(以属性个数记)。而
由上述定义可知:当u(i,1)=0,则表示对象xi与xi在知识约简时其规则是不能合并的,而当u(i,1)>0时,则表示xi与xi在知识约简时,其规则是可合并的,且其值就表示它们具有相同属性值的数目。
计算每个条目的最佳属性约简集Bi op:
a)设信息系统的M(C,D)中的任一行i的基本属性集为
若Ci o该行所有mij d的交集均不为空集,即:
j=1,2,...,n,则该行i所对应原规则的最佳约简属性集
b)设信息系统的M(C,D)中某行i的基本属性集
若至少存在一个mij d与Ci 0交集为空集,即:
j=1,2,...,n,则Ci 0只是该行所对应原规则的最佳候选约简属性集Bi op严的子集,即
而对应的Bi op应为:
列出每个条目对应的规则Bi op→D(xi)。
求出{ci b,Bi op,ri}i=1..An,An表示样本数据个数(见表6)。
表6
ci b | Bi op | ri | |
1 | φ | 3(3,7) | 1→t1 |
2 | φ | 3(3,7) | 1→t1 |
3 | e | ce | 01→t2 |
4 | e | ce | 01→t2 |
5 | e | e | 2→t3 |
6 | e | e | 2→t3 |
7 | φ | 2(2,a)d | 10→t4 |
8 | φ | 2(2,a)d | 10→t4 |
9 | φ | 2 | 2→t5 |
10 | φ | 2 | 2→t5 |
11 | φ | 1(1,4,5,9,b) | 22→t6 |
12 | φ | 1(1,4,5,9,b) | 22→t6 |
⑧合并相同的生成约简规则的步骤。
(5)生成规则库(见表7)并存储的步骤;
表7
r | |
1 | A3=1→ti |
2 | {A12=0,A14=1}→t2 |
3 | A14=2→t3 |
4 | (A2=1,A13=0)→t4 |
5 | A2=2→t5 |
6 | A1=22→t6 |
(6)增量式知识获取的步骤:
①从决策信息表获得对象条件属性数量AN、故障原因数量TN;从规则库获得规则的数量RN:
RN=6,AN=14,TN=6。
②建立具有故障原因RTN(k)、候选属性集Bk op(vk)、每条规则所含的对象数量RON(k)、每条规则所含的对象除候选属性集外的属性值RAC(k)的规则库信息表并存储的步骤;
规则库信息表(见表8):
表8
RTN | Bi vp(vi) | RON | RAC |
t1 | A3=1 | 2 | (A1=23,A2=A7=A12..A14=1,A4=A5=A9..A11=0)(1,2),A6=0(1),A6=1(2),A8=2(1),A8=1(2) |
t2 | A12=0,A14=1 | 2 | (A1=23,A2=A10=A13=1,A3=2,A4..A9=A11=0)(3,4) |
t3 | A14=2 | 2 | (A1=23,A2=A10=A13=1,A3=2,A4..A9=A11=A12=0)(5,6) |
t4 | A2=1,A13=0 | 2 | (A1=23,A10=A12=A14=1,A3=2,A4..A9=A11=0)(7,8) |
t5 | A2=2 | 2 | (A1=23,A3=2,A4..A11=A13=0,A12=A14=1)(9,10) |
t6 | A1=22 | 2 | (A2=A4=A5=A9..A14=1,A3=2,A6..A8=0)(11,12) |
③网络中的设备将新的故障数据输入的步骤;
增加一个对象(见表9):x13:
表9
序号 | A1 | A2 | A3 | A4 | A5 | A6 | A7 | A8 | A9 | A10 | A11 | A12 | A13 | A14 | D |
13 | 23 | 1 | 1 | 0 | 1 | 1 | 0 | 0 | 0 | 0 | 0 | 1 | 1 | 1 | t7 |
④对新的故障数据中的条件属性进行预处理的步骤;
同步骤(2)
⑤将预处理后的新的故障数据添加到决策信息表的步骤;
⑥从规则库信息表中提取与新故障数据的故障原因不同的规则,新的对象与其中一个规则所含的各对象的属性进行一一对比,取得各属性中有差异的属性并存储的步骤:
如果差异属性的元素与候选属性集交集不为空,则该对象对应的原规则不修改;
如果差异属性的元素与候选属性集交集为空,则进行以下步骤,修改该对象对应的原规则;
a、获得修正子集的步骤,修正子集满足如下条件:修正子集与差异属性集中每个元素的交集不为空,且修正子集与相似属性集的合并度最大;
b、从修正子集得到候选属性集并存储的步骤;
c、并同时修改对应的候选属性集、每条规则所含的对象数量、每条规则所含的对象除候选属性集外的属性值;
⑦重复步骤⑥,直至新的对象与各规则包含的所有对象进行一一对比完毕;
步骤⑥⑦具体为:
求出知识库参数和规则库信息表。
x13:{A1=23,A2=A3=A5=A6=A12..A14=1,A4=A7..A11=0}→t7.
首先处理RTN(k)≠t7的规则。
对于r1:A3=1→t2,包含样本x1和x2,所以检查x1和x2:
x1:
∴
∵
故x1对应于r1的规则需要修改,∵
于是需要(5678)中选取一个属性(选合并度最大的属性),∵μA5(x1,A5=0)=|(x1,x2)|=2,∵μA6(x1,A6=0)=|(x1)|=1,∵μA7(x1,A7=1)=|(x1,x2)|=2,∵μA8(x1,A8=2)=|(x1)|=1,故应选取5(5,7),亦即,对于x1的新规则为:{A3=1}∪{A5=0}={A3=1,A5=0}→t1,而对应的RAC应修改为(A1=23,A2=A7=A12..A14=1,A4=A6=A9..A11=0,A8=2)(1)。
x2:
∴
∵
故x2对应于r1的规则需要修改,∵
于是需要(578)中选取一个属性(选合并度最大的属性),∵μA5(x2,A5=0)=|(x1,x2)|=2,∵μA7(x2,A7=1)=|(x1,x2)|=2,∵μA8(x2,A8=1)=|(x2)|=1,故应选取5(5,7),亦即,对于x2的新规则为:{A3=1}∪{A5=0}={A3=1,A5=0}→t1,而对应的RAC应修改为(A1=23,A2=A6..A8=A12..A14=1,A4=A9..A11=0)(2)。
对于r2:{A12=0,A14=1}→t2,包含样本x3和x4,所以检查x3和x4:
x3:
∴
∵
故对应于r2的规则,则不需要修改。
同理:x4与x13比较后,不需要修改r2。
对于r3:A14=2→t3,包含样本x5和x6,所以检查x5和x6:
x5:
∴
∵
故对应于r3的规则,则不需要修改。
同理:x6与x13比较后,不需要修改r3。
对于r4:{A2=1,A13=0}→t4,包含样本x7和x8,所以检查x7和x8:
x7:
∴
∵
故对应于r4的规则,则不需要修改。
同理:x8与x13比较后,不需要修改r4。
对于r5:A2=2→t5,包含样本x9和x10,所以检查x9和x10:
x9:
∴
∵
故对应于r5的规则,则不需要修改。
同理:x10与x13比较后,不需要修改r5。
对于r6:A1=22→t6,包含样本x11和x12,所以检查x11和x12:
x11:
∴
∵
故对应于r6的规则,则不需要修改。
同理:x12与x13比较后,不需要修改r6。
⑧将差异属性集中属性数量为一的属性合并得到基属性集并存储的步骤;获得修正子集的步骤,修正子集满足如下条件:修正子集与差异属性集中每个元素的交集不为空,且修正子集与相似属性集的合并度最大;取基属性集和修正子集的并集得到候选属性集并存储的步骤;将候选属性集作为条件,该对象的故障原因作为结果,生成约简规则;
求x13的约简规则。
∵
又∵
故需要求其补充属性集;
表10
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | |
13 | 5678 | 578 | 356ac | 356ac | 356ace | 356ace | 356ad | 356ad | 2356d | 2356d | 13469ab | 13469ab | 0 |
x13的可选集合为3(3,6)5(5,7,8),候选属性集为
故x13的约简规则为:
而对应的RAC应修改为:
(A1=23,A2=A6=A12..A14=1,A4=A7..A11=0)(13)。
⑨合并相同规则,生成规则库并存储的步骤。
新规则库(表11):
表11
RTN | Bi vp(vi) | RON | RAC |
t1 | A3=1,A5=0 | 1 | (A1=23,A2=A7=A12..A14=1,A4=A6=A9..A11=0,A8=2)(1) |
t1 | A3=1,A5=0 | 1 | (A1=23,A2=A6..A8=A12..A14=1,A4=A9..A11=0)(2) |
t2 | A12=0,A14=1 | 2 | (A1=23,A2=A10=A13=1,A3=2,A4..A9=A11=0)(3,4) |
t3 | A14=2 | 2 | (A1=23,A2=A10=A13=1,A3=2,A4..A9=A11=A12=0)(5,6) |
t4 | A2=1,A13=0 | 2 | (A1=23,A10=A12=A14=1,A3=2,A4..A9=A11=0)(7,8) |
t5 | A2=2 | 2 | (A1=23,A3=2,A4..A11=A13=0,A12=A14=1)(9,10) |
t6 | A1=22 | 2 | (A2=A4=A5=A9..A14=1,A3=2,A6..A8=0)(11,12) |
t7 | A3=1,A5=1 | 1 | (A1=23,A2=A6=A12..A14=1,A4=A7..A11=0)(13) |
合并之后得到:
RN=7,AN=14,TN=7。
规则库(表12)为:
表12
RTN | Bi vp(vi) | RON | RAC |
t1 | A3=1,A5=0 | 2 | (A1=23,A2=A7=A12..A14=1,A4=A9..A11=0)(1,2),A6=0(1),A6=1(2),A8=2(1),A8=1(2) |
t2 | A12=0,A14=1 | 2 | (A1=23,A2=A10=A13=1,A3=2,A4..A9=A11=0)(3,4) |
t3 | A14=2 | 2 | (A1=23,A2=A10=A13=1,A3=2,A4..A9=A11=A12=0)(5,6) |
t4 | A2=1,A13=0 | 2 | (A1=23,A10=A12=A14=1,A3=2,A4..A9=A11=0)(7,8) |
t5 | A2=2 | 2 | (A1=23,A3=2,A4..A11=A13=0,A12=A14=1)(9,10) |
t6 | A1=22 | 2 | (A2=A4=A5=A9..A14=1,A3=2,A6..A8=0)(11,12) |
t7 | A3=1,A5=1 | 1 | (A1=23,A2=A6=A12..A14=1,A4=A7..A11=0)(13) |
本发明实施例采用差异相似矩阵表征网络数据的不同点和相同点,基于差异相似矩阵的网络知识获取方法充分利用了不同样本属性之间的差异得到对样本分类的规则,利用同类样本属性之间的相似性对得到的规则合并,并最终得到最佳规则,即规则数最少,规则包含的属性最少。这样规则存储空间少,在进行故障诊断时速度加快。
Claims (3)
1、一种建立网络故障诊断规则库的方法,其步骤包括:
(1)网络中的设备将故障数据输入的步骤;
(2)对故障数据中的条件属性进行预处理的步骤;
(3)将预处理后的故障数据组成一个决策信息表的步骤;
(4)对决策信息表进行约简的步骤;
(5)生成规则库并存储的步骤;
其特征在于:
对决策信息表进行约简的步骤具体包括:
①对决策信息表中一个对象的故障原因与其它对象的故障原因进行对比的步骤;
②故障原因不同的,一一对比各属性,取得各属性中有差异的属性,建立差异属性集并存储的步骤;或故障原因相同的,一一对比各属性,取得各属性中相同的属性,建立相似属性集并存储的步骤;
③将差异属性集中属性数量为一的属性合并得到基属性集并存储的步骤;
④获得修正子集的步骤,修正子集满足如下条件:修正子集与差异属性集中每个元素的交集不为空,且修正子集与相似属性集的合并度最大;
⑤取基属性集和修正子集的并集得到候选属性集并存储的步骤;
⑥将候选属性集作为条件,该对象的故障原因作为结果,生成约简规则;
⑦循环步骤①-⑥,直至决策信息表中的每个对象与其它对象进行一一对比完毕;
⑧合并相同的生成约简规则的步骤。
2、如权利要求1所述的方法,其特征在于:它还包括增量式知识获取的步骤,其具体步骤包括:
①从决策信息表获得对象条件属性数量、故障原因数量;从规则库获得规则的数量;
②建立具有故障原因、候选属性集、每条规则所含的对象数量、每条规则所含的对象除候选属性集外的属性值的规则库信息表并存储的步骤;
③网络中的设备将新的故障数据输入的步骤;
④对新的故障数据中的条件属性进行预处理的步骤;
⑤将预处理后的新的故障数据添加到决策信息表的步骤;
⑥从规则库信息表中提取与新故障数据的故障原因不同的规则,新的对象与其中一个规则所含的各对象的属性进行一一对比,取得各属性中有差异的属性并存储的步骤:
如果差异属性的元素与候选属性集交集不为空,则该对象对应的原规则不修改;
如果差异属性的元素与候选属性集交集为空,则进行以下步骤,修改该对象对应的原规则;
a、获得修正子集的步骤,修正子集满足如下条件:修正子集与差异属性集中每个元素的交集不为空,且修正子集与相似属性集的合并度最大;
b、从修正子集得到候选属性集并存储的步骤;
c、并同时修改对应的候选属性集、每条规则所含的对象数量、每条规则所含的对象除候选属性集外的属性值;
⑦重复步骤⑥,直至新的对象与各规则包含的所有对象进行一一对比完毕;
⑧将差异属性集中属性数量为一的属性合并得到基属性集并存储的步骤;获得修正子集的步骤,修正子集满足如下条件:修正子集与差异属性集中每个元素的交集不为空,且修正子集与相似属性集的合并度最大;取基属性集和修正子集的并集得到候选属性集并存储的步骤;将候选属性集作为条件,该对象的故障原因作为结果,生成约简规则;
⑨合并相同规则,生成规则库并存储的步骤。
3、如权利要求1所述的方法,其特征在于:对故障数据中的条件属性进行预处理的步骤还包括对性能数据值进行相对值处理的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB2006100181534A CN100393048C (zh) | 2006-01-13 | 2006-01-13 | 一种建立网络故障诊断规则库的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB2006100181534A CN100393048C (zh) | 2006-01-13 | 2006-01-13 | 一种建立网络故障诊断规则库的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1801745A true CN1801745A (zh) | 2006-07-12 |
CN100393048C CN100393048C (zh) | 2008-06-04 |
Family
ID=36811521
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2006100181534A Expired - Fee Related CN100393048C (zh) | 2006-01-13 | 2006-01-13 | 一种建立网络故障诊断规则库的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN100393048C (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101178703B (zh) * | 2007-11-23 | 2010-05-19 | 西安交通大学 | 基于网络分割的故障诊断谱聚类方法 |
CN102098175A (zh) * | 2011-01-26 | 2011-06-15 | 浪潮通信信息系统有限公司 | 一种移动互联网告警关联规则获取方法 |
CN102184234A (zh) * | 2011-05-13 | 2011-09-14 | 百度在线网络技术(北京)有限公司 | 用于查询、增加、更新或删除信息处理规则的方法和设备 |
CN104903866A (zh) * | 2013-11-29 | 2015-09-09 | 株式会社日立制作所 | 对事件根本原因的分析予以支援的管理系统以及方法 |
CN106202420A (zh) * | 2016-07-12 | 2016-12-07 | 中国石油大学(华东) | 一种野外露头知识库的建立方法 |
CN108319695A (zh) * | 2018-02-02 | 2018-07-24 | 华自科技股份有限公司 | 水电站故障数据处理方法、装置、计算机设备和存储介质 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101610281B (zh) * | 2008-06-19 | 2012-11-21 | 华为技术有限公司 | 一种数据指纹保存方法和装置 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2129510C (en) * | 1993-10-21 | 1999-04-13 | Sasisekharan Raguram | Automatic temporospatial pattern analysis and prediction in a telecommunications network using rule induction |
CN1120366C (zh) * | 1999-03-22 | 2003-09-03 | 西安交通大学 | 基于非线性频谱分析的故障检测与诊断方法 |
-
2006
- 2006-01-13 CN CNB2006100181534A patent/CN100393048C/zh not_active Expired - Fee Related
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101178703B (zh) * | 2007-11-23 | 2010-05-19 | 西安交通大学 | 基于网络分割的故障诊断谱聚类方法 |
CN102098175A (zh) * | 2011-01-26 | 2011-06-15 | 浪潮通信信息系统有限公司 | 一种移动互联网告警关联规则获取方法 |
CN102184234A (zh) * | 2011-05-13 | 2011-09-14 | 百度在线网络技术(北京)有限公司 | 用于查询、增加、更新或删除信息处理规则的方法和设备 |
CN104903866A (zh) * | 2013-11-29 | 2015-09-09 | 株式会社日立制作所 | 对事件根本原因的分析予以支援的管理系统以及方法 |
CN106202420A (zh) * | 2016-07-12 | 2016-12-07 | 中国石油大学(华东) | 一种野外露头知识库的建立方法 |
CN108319695A (zh) * | 2018-02-02 | 2018-07-24 | 华自科技股份有限公司 | 水电站故障数据处理方法、装置、计算机设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN100393048C (zh) | 2008-06-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1801745A (zh) | 一种建立网络故障诊断规则库的方法 | |
CN1168216C (zh) | 文档管理设备,数据压缩方法和数据解压缩方法 | |
CN100337407C (zh) | 对结构化文档进行编码和解码的方法和系统 | |
CN1152305C (zh) | 虚拟机系统 | |
CN1680959A (zh) | 进程编辑设备和方法以及进程管理设备和方法 | |
CN1924734A (zh) | 一种在线质量检测的控制方法 | |
CN1319836A (zh) | 转换表达方式的方法和装置 | |
CN101048773A (zh) | 文件分析系统、以及文件适应系统 | |
CN1955991A (zh) | 在业务模型中集成模型语义和领域语义的方法和装置 | |
CN101061688A (zh) | 基于简单网络管理协议的网络管理设备和方法 | |
CN1845213A (zh) | 一种实现sms4密码算法中加解密处理的方法 | |
CN101030257A (zh) | 基于汉字特征的文档图像分割方法 | |
CN1900959A (zh) | 设计制造的支援装置、支援程序和支援方法 | |
CN1144004A (zh) | 多个客户机共有的数据库系统、数据更新方法及面向文字处理装置的应用 | |
CN101065725A (zh) | 命令供给装置 | |
CN1722138A (zh) | 结构化文档管理设备、搜索设备、存储和搜索方法及程序 | |
CN101055569A (zh) | 一种电子数据表的函数收集方法和装置 | |
CN1321273A (zh) | 操作系统和虚拟计算机系统 | |
CN101055566A (zh) | 一种电子数据表的函数收集方法和装置 | |
CN101047555A (zh) | 一种设备质量检查方法 | |
CN1334942A (zh) | 规律性析取的系统方法 | |
CN1261740A (zh) | 滤波器及获得滤波器系数的方法 | |
CN1841982A (zh) | 一种高速译码芯片 | |
CN1949225A (zh) | Xml文件预处理方法、装置、文件结构、读取方法和装置 | |
CN1910588A (zh) | 验证装置和验证方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C19 | Lapse of patent right due to non-payment of the annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |