CN102420700B - 网络故障诊断系统 - Google Patents

网络故障诊断系统 Download PDF

Info

Publication number
CN102420700B
CN102420700B CN201110383354.5A CN201110383354A CN102420700B CN 102420700 B CN102420700 B CN 102420700B CN 201110383354 A CN201110383354 A CN 201110383354A CN 102420700 B CN102420700 B CN 102420700B
Authority
CN
China
Prior art keywords
network
knowledge
rule
module
knowledge base
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201110383354.5A
Other languages
English (en)
Other versions
CN102420700A (zh
Inventor
陈晶
傅建明
杜瑞颖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University WHU
Original Assignee
Wuhan University WHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University WHU filed Critical Wuhan University WHU
Priority to CN201110383354.5A priority Critical patent/CN102420700B/zh
Publication of CN102420700A publication Critical patent/CN102420700A/zh
Application granted granted Critical
Publication of CN102420700B publication Critical patent/CN102420700B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Computer And Data Communications (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明提供一种网络故障诊断系统,包括SNMP通信模块、数据库管理模块、核心诊断模块、知识管理模块和用户交互模块,采用专家系统进行智能故障监控。并且设计一种适合网络知识特点的层次关联知识表示模型,用于进行知识表示;在新型知识表示模型基础上,根据网络故障的特点,设计高效的推理机规则匹配算法。本发明特别适用于用于中小型局域网,不仅可以将网络故障监控与管理智能或半智能化,提高网络管理的效率,有效降低成本,其中的知识表示方法还可以方便应用到其他工程领域,具有广泛适用性。

Description

网络故障诊断系统
技术领域
本发明涉及中小型局域网的网络故障诊断系统。
背景技术
随着网络规模的迅速扩大,网络结构日趋复杂,网络设备类型日益繁多,网络安全威胁更加严重,网络管理越来越受到重视,同时对网络管理也提出了更高的要求。网络管理的目的是维护网络的正常运行,提高网络的资源利用率,保证网络的性能、服务质量以及安全性。网络管理的功能包括故障管理、计费管理、配置管理、性能管理和安全管理,网络故障管理是其中的一个重要方面。网络故障管理是在网络出现异常时及时作出警报,并定位、分析和诊断网络故障,尽可能地隔离故障以不至于影响整个网络的正常运行。
传统的网络故障管理是基于对网络运行状况信息的搜集,集中于依靠监控网络流量等少量的统计信息。SNMP协议是网络信息收集的最常用方法,几乎所有的网络设备厂商都对SNMP提供支持,是网络管理工业上的事实标准。采用SNMP协议开发的网络故障诊断系统通常能够提供网络环境各种设备的详细统计信息,包括设备基本信息,与设备相关的各种实时网络信息(比如TCP/IP报文数量等)。该类型的网络管理系统的优势是各种统计信息详细,并且适应网络拓扑结构的变化,而它的缺点也非常明显,就是必须要有比较专业的网络管理人员的参与,分析网络的统计信息并对网络状况做出判断。
传统的网络故障管理方式不仅需要专业网络管理人员的长期参与,而且只能对网络故障作出简单的表面分析,无法提供引起网络故障的内在原因,以及提前预测网络故障。具体的不足体现在:(1)故障诊断能力不强,只能进行简单的信息收集和Trap(陷阱,是指代理用来报告一个关于被管理子系统的警告或其他异步事件的方式)通知报警,对于越来越复杂的网络故障无有效的应对能力;(2)对于具有一定规模的网络环境,使用SNMP协议进行故障管理会出现效率不高,反应不灵敏,同时对整体的网络运行效率也产生一定的影响。(3)由于网络环境的复杂性以及网络体系结构本身的特性,决定了网络故障的多样性和内在关联性,基于SNMP的网络管理系统难以给予网络故障更加深层、内在的因果解释,往往故障发生的时候还必须有专业人员参与网络故障的诊断和修复;(4)由于SNMP协议本身的安全设计缺陷,使得使用运用该协议进行网络管理存在一定的安全风险,虽然正式的SNMPv3对安全性做了很大的改进,但是很多当前正在使用的网络管理软件仍然是基于SNMPv1和SNMPv2,因此依旧存在对安全性的顾虑。
随着人工智能技术的快速发展,将人工智能相关技术引入网络故障管理不仅成为现实,还取得了非常好的实际效果。基于知识的专家系统在网络故障管理中有着长久且广泛的应用,并颇具成效。
专家系统是一种模拟人类专家解决领域问题的计算机程序系统。专家系统故障诊断方法结合计算机采集被诊断系统的信息,通过内置其中的推理结构进行一定的事件推理来进行故障诊断的新方法。根据专家系统内部的推理过程,不仅可以诊断较为复杂的故障事件,还可以对诊断的结果做出有效的解释。基于规则的推理是以被诊断系统产生的事件与内置的专家级知识规则相匹配来进行推理的专家系统,是应用最早最成熟的智能诊断技术之一,但是基于规则的专家系统还未应用到网络故障诊断领域。
发明内容
本发明提出了一种网络故障诊断系统,其目的在于将网络故障管理从简单的流量等信息的统计提升为以收集的网络运行状态信息为依据的智能诊断和管理,以提高网络故障诊断和恢复的效率,降低网络管理的成本。
    本发明的技术方案为一种网络故障诊断系统,包括SNMP通信模块、数据库管理模块、核心诊断模块、知识管理模块和用户交互模块;
SNMP通信模块,用于通过SNMP协议获取网络状态信息,所得网络状态信息经过结构化封装形成事实后送入数据库管理模块;
数据库管理模块,用于对数据库的管理和维护,所述数据库包括存放事实的事实库和存放规则的知识库,所述事实由SNMP通信模块输入,所述规则是网络故障知识;并向知识管理模块提供对知识库中规则进行操作的数据库接口;
核心诊断模块,用于从数据库管理模块中提取知识库中的规则和事实库中的事实,并将知识库中的规则与事实库中的事实进行匹配,如果有规则被成功匹配,则激活该规则,触发相应的故障告警,并反馈给用户交互模块;
知识管理模块,用于根据用户交互界面的操作信息通过数据块接口对知识库中规则进行相关操作,并通过数据库接口提取知识库中规则并向用户交互界面提供;
用户交互模块,用于向用户输出核心诊断模块反馈的故障告警、知识管理模块提供的知识库中规则的列表,接受用户对知识库中规则进行操作的操作信息并转发到知识管理模块。
而且,所述知识库采用层次关联网络故障知识表示模型表示网络故障知识。
而且,所述核心诊断模块采用S-Rete算法实现将知识库中的规则与事实库中的事实进行匹配。
而且,所述SNMP通信模块同时使用管理站周期轮询和代理Trap通知两种方式获取网络状态信息,获取的网络状态信息经过结构化封装形成事实后送入数据库管理模块,数据库管理模块激活核心诊断模块将知识库中的规则与事实进行匹配。
本发明根据网络故障的特点对知识库和推理机进行设计,在知识表示上设计了一种新型的层次关联网络故障知识表示模型,从底层提升网络故障诊断系统的诊断效率。在该知识表示模型基础之上,结合网络诊断的特点,设计了高效的推理机模式匹配算法,进一步提升系统的运行效率和诊断能力。
附图说明
图1是本发明实施例的系统结构图。
图2是本发明实施例的层次关联网络故障知识表示模型。
图3是本发明实施例的元对象结构。
图4是本发明实施例的S-Rete算法网络结构。
图5是本发明实施例的运行环境示意图。
具体实施方式
以下结合附图和实施例详细说明本发明技术方案。
参见图1,本发明实施例提供的系统包括以下几部分:
SNMP通信模块,用于通过SNMP协议获取网络状态信息,所得网络状态信息经过结构化封装形成事实后送入数据库管理模块。SNMP(Simple Network Management Protocol),是简单网络管理协议,由互联网工程工作小组(IETF,Internet Engineering Task Force)负责制定,该协议能够支持网络管理系统,用以监测连接到网络上的设备是否有任何引起管理上关注的情况。事实,在专家系统中是指系统当前要处理的对象的信息,也被称为工作内存。网络状态信息可以从网络的各代理中采集。
数据库管理模块,用于对数据库的管理和维护,所述数据库包括存放事实的事实库和存放规则的知识库,所述事实由SNMP通信模块输入,所述规则是网络故障知识;并向知识管理模块提供对知识库中规则进行操作的数据库接口。知识,在专家系统中是指解决某领域问题的技术、经验、理论等。
核心诊断模块,用于从数据库管理模块中提取知识库中的规则和事实库中的事实,并将知识库中的规则与事实库中的事实进行匹配,如果有规则被成功匹配(即满足规则的条件部分),则激活该规则,触发相应的故障告警,并反馈给用户交互模块;
知识管理模块,用于根据用户交互界面的操作信息通过数据块接口对知识库中规则进行相关操作(例如对规则的添加、删除、修改、检索等),并通过数据库接口提取知识库中规则并向用户交互界面提供;
用户交互模块,用于向用户输出核心诊断模块反馈的故障告警、知识管理模块提供的知识库中规则的列表,接受用户对知识库中规则进行操作的操作信息并转发到知识管理模块。
综上所述,为了实现网络故障诊断,SNMP通信模块连接到数据库管理模块,并通过连接传输事实到数据库管理模块;数据库管理模块与核心诊断模块连接,并通过连接传输事实和规制到核心诊断模块;核心诊断模块连接用户交互模块,并通过连接传输故障告警到用户交互模块。为了便于用户查看和管理知识库,数据库管理模块与知识管理模块双向连接,知识管理模块与用户交互模块双向连接,从用户交互输入的用户的操作信息经知识管理模块输入数据库管理模块,数据库管理模块提供的知识库中规则经知识管理模块输入用户交互模块。
具体实施时,还可以设计更多的用户交互功能,例如:在输出知识管理模块提供的知识库中规则的列表供用户查看时,用户交互模块可以向用户提供知识管理的可视化接口,并提供相关操作的详细说明,便于用户输入对知识库中规则进行操作的操作信息时参考。还可以由数据库管理模块向用户交互模块提供接口,用户交互模块通过接口直接调用数据库管理模块中知识库和规则库存放的数据信息,并显示给用户,便于用户直接查看数据库内容。
实施例的各模块可以采用计算机软件技术实现,也可以采用硬件技术实现软件固化。为便于实施参考起见,提供实施例具体说明如下:
1.知识库和相应的知识管理模块
网络故障诊断信息被抽象成为规则,所有的规则形成网络故障诊断的知识库。专家系统对问题的求解是以知识和知识表示为基础的,知识表示形式决定了知识库的存储形式,系统解决问题的能力范围,知识库的可扩展性,问题求解的解释能力,而且直接影响推理机求解的效率。本发明实施例根据SNMP管理信息库、网络体系结构以及网络故障知识结构特点设计了一种新型的用于产生式规则的知识表示模型,即层次关联网络故障知识表示模型,将网络故障知识高度形式化、抽象化,具有普遍适用性,可根据不同的应用环境设计相应的知识表示结构,很适合计算机内部的处理,可以有效提高专家系统的推理效率。
如图2所示,规则                                                由条件部分的前件和结论部分的后件组成,由于后件一般是触发一个行为或另一条规则,因此设计的重点在于规则的前件。一条规则的前件可以包含多个条件,称为条件模式(
Figure 2011103833545100002DEST_PATH_IMAGE002
),对于每一个条件模式由元模式(
Figure 2011103833545100002DEST_PATH_IMAGE003
)和比较对象(
Figure 2011103833545100002DEST_PATH_IMAGE004
)以及它们要进行的条件运算(
Figure 2011103833545100002DEST_PATH_IMAGE005
)构成。元模式是条件模式的核心,其中的元对象()决定了哪些事实知识适用于该条件模式。元模式中设置了元运算()以增强规则的表达能力。元对象与具体的知识形式相关,根据网络知识的结构,由系统标识(
Figure 2011103833545100002DEST_PATH_IMAGE008
)、知识类别标识(
Figure 2011103833545100002DEST_PATH_IMAGE009
)、应用标识(
Figure 2011103833545100002DEST_PATH_IMAGE010
)和对象标识(
Figure 2011103833545100002DEST_PATH_IMAGE011
)共同构成。
对于一条规则,
Figure 2011103833545100002DEST_PATH_IMAGE012
             (式1)
多个条件模式
Figure 2011103833545100002DEST_PATH_IMAGE013
,记为条件模式
Figure 2011103833545100002DEST_PATH_IMAGE014
取1,2,…
Figure 2011103833545100002DEST_PATH_IMAGE016
Figure 999107DEST_PATH_IMAGE016
为条件模式个数。
其中,
Figure DEST_PATH_IMAGE017
    (式2)
Figure 2011103833545100002DEST_PATH_IMAGE018
    (式3)
Figure DEST_PATH_IMAGE019
  (式4)
Figure 2011103833545100002DEST_PATH_IMAGE020
   (式5)
Figure DEST_PATH_IMAGE021
            (式6)
Figure 2011103833545100002DEST_PATH_IMAGE022
              (式7)
对式子做相关说明:
条件模式
Figure 215062DEST_PATH_IMAGE002
由待比较对象
Figure 610272DEST_PATH_IMAGE003
、比较对象
Figure 237693DEST_PATH_IMAGE004
以及条件运算符
Figure 60156DEST_PATH_IMAGE005
组成。式6表明
Figure 327189DEST_PATH_IMAGE005
可以取得的六种比较运算符。由式4可知
Figure 905850DEST_PATH_IMAGE004
可以是整型
Figure DEST_PATH_IMAGE023
、浮点型、字符
Figure DEST_PATH_IMAGE025
或者字符串
Figure 2011103833545100002DEST_PATH_IMAGE026
。需要特别指明的是,
Figure 450095DEST_PATH_IMAGE004
为字符时,表明这是一个变量,用于规则与事实的部分匹配。式5中的
Figure DEST_PATH_IMAGE027
表示自然数。
待比较对象称为元模式
Figure 443459DEST_PATH_IMAGE003
,本发明实施例设置
Figure 260105DEST_PATH_IMAGE003
而不直接使用是为了增强规则的表达能力,可以在规则中进行简单的运算,由此不难理解式3中
Figure 832087DEST_PATH_IMAGE003
的结构。式7指明
Figure 261931DEST_PATH_IMAGE006
可以进行的运算种类。
式3表明上述的知识模型限制对象仅可以有一个二元运算,为了继续增强知识模型的计算能力(比如多元运算),将
Figure 503556DEST_PATH_IMAGE003
设计为二元运算单元(OPU,Operations Unit)为核心,即
    (式8)
    (式9)
在实际的应用中,应当坚持最简原则,满足当前知识的表示需求即可。
以上各式中,大写(如MP)指类型,小写(如mp)指该类型的元素。
元对象
Figure 654046DEST_PATH_IMAGE006
是规则所要匹配的对象元素,被设计为对具体知识形式的封装,用一个无符号32位整型0xFFFFFFFF表示。由式5可知
Figure 297517DEST_PATH_IMAGE006
由4部分组成,各部分占用比特数如图3所示。系统标识(
Figure 632683DEST_PATH_IMAGE008
)占用第26~31位,知识类别标识(
Figure 423922DEST_PATH_IMAGE009
)占用第24、25位,应用标识(
Figure 502736DEST_PATH_IMAGE010
)占用第16~23位,对象标识()占用第0~15位。
在MIB的定义中,对象包括标量对象和表对象,表对象中包含多个列对象标识。变量位和序列位分别用于表示该表对象标识和其中的某个列对象标识。为了表示表对象,需要将
Figure 2011103833545100002DEST_PATH_IMAGE030
分为两部分:变量位和序列位,各占8个比特。对于普通的对象,仅含变量位,对于表项对象,同时包含两部分。
本发明实施例的SNMP管理信息库参考MIB设计,知识表示模型是用于表示一个产生式规则的,具有一定的通用性;而MIB描述SNMP中被管理对象信息 ,因此以MIB为知识表示模型中
Figure 83945DEST_PATH_IMAGE006
。不采用MIB而设计
Figure 96901DEST_PATH_IMAGE006
的原因是:1.MIB的oid标识为字符串,比较效率低;2.MIB只是方便和满足SNMP协议的,而在一条有意义的规则中,比较对象的表示需要包含更多的信息。该知识表示模型的优势在于,对于上层来说,
Figure 979406DEST_PATH_IMAGE006
是透明的,这样就可以将模型应用到其他领域的知识表示中。在知识库开发中,可以简单地将
Figure 331890DEST_PATH_IMAGE006
设计为一个有意义的整数,也可以设计为较为复杂但更灵活的类。但对于上层模型来说,
Figure 87487DEST_PATH_IMAGE006
仅仅是一个数据类型。根据知识模型可以开发出整个规则知识的程序框架,仅留下
Figure 525422DEST_PATH_IMAGE006
接口以设计针对具体知识,这样就大大提升了程序的可移植性和应用范围。
知识管理模块提供对知识库相关维护操作,包括对规则的添加、删除、修改、检索等。实施例的知识管理模块向用户交互模块提供系统当前的知识库规则列表,用户选定某条规则并对其修改后,本模块接受用户交互模块相应接口提供的修改后规则描述信息,然后对描述信息按数据库中规则的存储结构进行数据提取,并调用数据库管理模块提供的相应接口完成新规则的修改。规则的添加与删除操作与上述过程类似。
2.核心诊断模块
核心诊断模块也就是专家系统的推理机,而推理机的核心就是规则与事实的模式匹配算法。SNMP采集信息的特点决定了该系统产生的事实的特点,本发明在充分分析网络故障诊断的特点情况下,通过改进经典的Rete模式匹配算法,设计出高效且有针对性的S-Rete算法,以提高系统的诊断性能。Rete模式匹配算法是1979年由卡内基—梅隆大学的Charles L.Forgy在OPS专家系统外壳研究室的博士论文中首次提出,后逐步经过发展成为CLIPS、ART、OPS5及OPS83等产生式系统普遍采用的模式匹配算法。S-Rete算法仍然将整个网络结构分为模式网络和连接网络两部分,根据网络故障诊断的特点,充分结合所设计的网络故障知识模型,使整个网络易于构建,整个匹配过程更加高效。该算法具有网络结构简单、占用较小内存空间、最大限度利用网络结构相似性等特点。
由于大多数专家系统均具有时间冗余性和结构相似性的特征,因此Rete算法采用模式网络和连接网络完成事实与规则的匹配,前者完成规则中每个条件模式的匹配,成功匹配的事实存入到称为alpha memory的节点中,并激活连接网络中的相关节点,进行条件模式之间的变量约束匹配,匹配成功后存入到称为beta memory的节点中,并继续激活下一级节点,直到匹配失败或整个规则的匹配完成。alpha memory和beta memory解决时间冗余性问题,连接网络解决条件模式的共用即结构相似性问题。
S-Rete算法的网络结构和匹配过程与Rete算法相似,但在本发明中,由于采用SNMP轮询的策略来获取网络信息(即待匹配的事实),得到的事实不仅没有时间冗余性,而且具有单一的属性值,因此所设计的S-Rete算法的网络结构中没有alpha memory和beta memory,而且模式匹配与部分匹配互斥,即单一属性的事实要么进行常量的比较(模式匹配),要么作为变量符号进行模式间的变量约束(部分匹配)。参见图4,S-Rete算法网络结构包括模式网络和连接网络,模式网络中包括root节点(根节点)、type节点(类型节点)、元对象节点、元运算节点、条件运算节点、比较对象节点;连接网络中包括约束节点和规则(rule1、rule2、rule3),激活规则后存储到Agenda(议程)。
S-Rete算法的匹配过程如下:对于局域网,首先根据知识库中的规则构建网络结构;对于新生成的事实,根据节点类型查找到对应的元对象节点。判断该元对象节点的子节点类型,如果是条件运算节点,根据条件运算符以及比较对象值判定是否满足匹配说明;如果是约束节点,比较其左右输入元对象节点的取值是否满足变量约束匹配说明;如果是元运算节点,根据其左右输入的元对象节点进行对应的元运算,并激活其子节点,并根据该子节点类型进行上述三种情况的判定并继续完成匹配过程。当一个条件模式匹配成功后,检查与其相关联规则的其他条件模式是否匹配成功,如果全部匹配成功,则该规则被成功激活,否则,规则未被激活。
3.SNMP通信模块
SNMP通信模块模块是本发明的实时网络环境信息获取模块,主要功能包括:根据所设计知识库中规则的具体内容,选择性获取被管理设备中相关的MIB对象信息,并将获得的原始数据信息封装为特定结构;网络信息的获取方式采用管理站周期轮询和代理Trap(陷阱)通知两种;本模块同时获取各子网被管理网络设备的RMON MIB对象信息,用于实时监控和分析网络子网整体的运行状况。RMON(Remote Network Monitoring),是对SNMP的重要扩展,使SNMP能更为有效、更为积极主动地管理和监控各局域分网及远程设备。
实施例中,本模块使用SNMP++库进行开发,其中采用的主要算法包括通过网络拓扑发现算法构造所监控网络的拓扑结构;采用合适的轮询算法进行周期轮询,避免频繁的轮询造成网络荷载过大,间隔较大的轮询无法获取有效的设备信息。本模块同时实现数据信息的结构化封装,以满足事实和规则的结构形式。SNMP++,是一套C++类的集合,是对SNMP底层实现的封装,具有易用、安全可移植,可扩展等特点。
4.数据库管理模块
数据库管理模块提供数据库的管理和维护功能。在本发明中,通过SNMP协议获取的网络信息(即事实库)、知识库(即规则库)都要存储到数据库中。网络故障信息首先被整理成各种规则,然后经过知识表示模型表示一定的形式化结构,形成知识库,然后预先存储进数据库中。同样,通过SNMP获取的网络实时信息被结构化为事实库,并存储于数据库中。在具体实施时,事实库和知识库可以在实现本系统的服务器上实现,也可以另行采用数据库服务器实现,但仍可视为属于数据库管理模块。
本模块提供的主要功能是对数据表添加、查询、删除等操作的高效封装,提供相应的接口供SNMP通信模块、知识管理模块使用。具体实施时,还可提供接口给用户交互模块直接使用。
为便于实施参考起见,提供实施例的数据库中主要的数据表见表1。
表1 数据库表单
序号 表名称 描述
1 db_pattern 保存所有的条件模式
2 db_rule 保存每条规则包含的条件模式以及其他信息
3 db_facts 保存所有的事实信息
表db_pattern存储条件模式的各个组成部分,包括元模式、比较运算符和比较对象,根据实际需要,元模式采用单二元运算单元。为了方便规则的共享以及规则的删除,在每个条件模式里增加一个该模式的使用计数。表db_pattern的字段见表2。
表2 表db_pattern字段清单
序号 字段名 描述
1 p_index 条件模式索引
2 counter 规则使用计数器
3 mob_left 元模式的左元对象
4 mob_right 元模式的右元对象
5 mop 元模式的元运算符
6 cop 比较运算符
7 cob 比较对象
表db_rule用于指明每条规则包含那些条件模式,可以根据需要设定规则所能包含的最大模式个数N(如N=5)。每条规则的模式条件是无序的,规则的触发可能有多种情况,比如提示某些信息或者接着触发其他的规则等。另外,每条规则需要包含详细解释信息以及可信度等可选属性。为了更好地处理非标准规则,可以将标准规则单独建立在一张表中,非标准规则按照设计的不同另建数据表。表db_rule的字段见表3。
表3  表db_rule字段清单
序号 字段名 描述
1 r_index 规则索引
2 r_type 规则类型,0-标准规则,1-非标准规则
3 p_index_i r_type=0时,规则所包含的第i条件模式索引
4 action 规则的触发类别,0-提示信息,1..i表示触发第i条规则
5 message action=0时的提示信息
6 description 规则的详细解释
7 reliability 规则可信度
8 reserve r_type=1时根据设计不同的保留项
表db_facts存储所有的事实信息,一个事实必须拥有它的元对象以及对应的当前值,由于采用的是轮询机制,需要同时保存两个对象值。事实虽然与具体的被管设备无关,一旦规则触发之后,就需要相应的被管设备信息,因此需要与设备信息表关联,表db_facts的字段见表4。
表4 表db_facts字段清单
序号 字段名 描述
1 device_id 产生事实的设备id
2 oid 事实对应的oid标识
3 f_mob 事实代表的元对象
4 early_cob
Figure 2011103833545100002DEST_PATH_IMAGE031
时刻事实的元对象值
5 late_cob
Figure 2011103833545100002DEST_PATH_IMAGE032
时刻事实的元对象值
6 time 当前时间戳
Figure 2011103833545100002DEST_PATH_IMAGE033
7 time_trap f_mob中类别标识为trap时收到trap的时间
(3)用户交互模块
实施例的用户交互模块可实现以下功能:
提供友好的交互主界面,功能划分清晰合理、界面简洁、最大程度运用信息可视化技术使得信息的表示更加丰富;
提供与知识库管理的图形接口,方便用户对知识库的查看、添加、删除和修改等操作。另外,在这些知识库的操作界面上,尽可能提供关于知识描述格式等的详细说明,使用户能够轻易完成知识管理操作;
提供与网络通信模块的良好接口,积极使用可视化的相关技术,使用户可以浏览和理解网络环境当前状况数据信息,包括使用各种分析图表表现当前网络环境的总体状况;
提供统一的诊断报警界面,包含发生警报的网络设备、警报原因、时间、具体数据信息以及诊断依据,提供对警报的详细解释。对于部分警报,给出相关的操作建议;
提供对当前网络整体状况的统计和分析功能,尽可能将网络整体访问信息反应给用户,使用户能够实时掌握整体网络状况,及时应对各种突发事件;
提供详细的日志审查功能,结合统计分析功能,为用户的操作提供参考依据。
本领域技术人员根据功能设计即可实现,属于现有软件技术。
5.运行环境
本发明针对中小型局域网的网络故障管理,实施例的运行环境采用典型部署方法,参见图5:首先设置连接Internet的路由器,路由器连接以太网交换机,以太网交换机连接各工作组的工作组交换机,工作组交换机连接大型机、服务器、FTP服务器、电子邮件服务器、PC等终端,也可以继续连接工作组交换机,为更多PC终端提供网络连接。设置连接以太网交换机的管理站服务器,这样将网络故障诊断系统运行在较高层次的服务器上,负责整个网络环境的信息收集和处理,进行故障检测和报警。各级主代理(主要是服务器)和子代理(主要是PC)运行SNMP等相关的协议,按设计要求与网络故障诊断系统进行通信。
由于当前大多数的网络环境已经相当复杂,并且多为分级的层次结构,因此传统的单一网络管理者模式在多层网络环境下将会使网络管理者成为瓶颈,从而影响网络的整体性能并增加故障监测的误报率。根据网络结构的复杂程度,可以采用多级管理方式,即最高级别为网络管理站,其中运行网络故障诊断系统;二级子管理站用于对其对应网络子环境进行管理,并与网络管理站运行的系统软件进行通信;最底层为被管理的网络设备。
将单一的网络管理者转变为多级管理,将网络管理者的部分功能下放到子管理者,以减轻网络管理者的负担,增强网络故障监测的准确性。分层多级管理结构是本发明实现时的研发方向。
6.系统工作流程
网络故障诊断系统通过SNMP通信模块以周期轮询和代理Trap(陷阱)两种方式收集网络环境的运行信息,并将这些数据信息结构化后通过数据库管理模块存入相应的数据表中,由于事实数据表中生成了新的事实信息,激活核心诊断模块,启动诊断流程。核心诊断模块将新生成的事实与知识库中的规则信息进行匹配,在本次轮询中产生的新事实如果能够成功匹配某些规则,那么这些规则将触发相应的警报,并通过用户交互界面显示给管理员。用户交互界面还将显示本次轮询生成的网络环境运行状况的统计信息,系统为准备下一轮的轮询做准备。诊断系统随时接受代理设备发送的Trap通知,并将这些信息结构化为事实激活核心诊断模块,启动诊断流程。

Claims (2)

1.一种网络故障诊断系统,其特征在于:包括SNMP通信模块、数据库管理模块、核心诊断模块、知识管理模块和用户交互模块;
SNMP通信模块,用于通过SNMP协议获取网络状态信息,所得网络状态信息经过结构化封装形成事实后送入数据库管理模块;
数据库管理模块,用于对数据库的管理和维护,所述数据库包括存放事实的事实库和存放规则的知识库,所述事实由SNMP通信模块输入,所述规则是网络故障知识,所述知识库采用层次关联网络故障知识表示模型表示网络故障知识;并向知识管理模块提供对知识库中规则进行操作的数据库接口;
所述层次关联网络故障知识表示模型中,一条规则的前件包含多个条件模式P,每一个条件模式P由元模式MP、比较对象COB以及条件运算COP构成,元模式MP中包括元对象MOB和元运算MOP,元对象MOB由系统标识SId、知识类别标识CId、应用标识AId和对象标识OId共同构成;
核心诊断模块,用于从数据库管理模块中提取知识库中的规则和事实库中的事实,并将知识库中的规则与事实库中的事实进行匹配,如果有规则被成功匹配,则激活该规则,触发相应的故障告警,并反馈给用户交互模块;所述核心诊断模块采用S‐Rete算法实现将知识库中的规则与事实库中的事实进行匹配,所述S-Rete算法的网络结构中没有alpha memory节点和beta memory节点,S-Rete算法的匹配过程如下,
对于局域网,首先根据知识库中的规则构建网络结构;对于新生成的事实,根据节点类型查找到对应的元对象节点,判断该元对象节点的子节点类型,
(1)如果是条件运算节点,根据条件运算符以及比较对象值判定是否满足匹配说明;
(2)如果是约束节点,比较其左右输入元对象节点的取值是否满足变量约束匹配说明;
(3)如果是元运算节点,根据其左右输入的元对象节点进行对应的元运算,并激活其子节点;并根据该子节点类型进行上述三种情况的判定并继续完成匹配过程;当一个条件模式匹配成功后,检查与其相关联规则的其他条件模式是否匹配成功,如果全部匹配成功,则该规则被成功激活,否则,规则未被激活;
知识管理模块,用于根据用户交互界面的操作信息通过数据块接口对知识库中规则进行相关操作,并通过数据库接口提取知识库中规则并向用户交互界面提供;
用户交互模块,用于向用户输出核心诊断模块反馈的故障告警、知识管理模块提供的知识库中规则的列表,接受用户对知识库中规则进行操作的操作信息并转发到知识管理模块。
2.如权利要求1所述网络故障诊断系统,其特征在于:所述SNMP通信模块同时使用管理站周期轮询和代理Trap通知两种方式获取网络状态信息,获取的网络状态信息经过结构化封装形成事实后送入数据库管理模块,数据库管理模块激活核心诊断模块将知识库中的规则与事实进行匹配。
CN201110383354.5A 2011-11-28 2011-11-28 网络故障诊断系统 Expired - Fee Related CN102420700B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110383354.5A CN102420700B (zh) 2011-11-28 2011-11-28 网络故障诊断系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110383354.5A CN102420700B (zh) 2011-11-28 2011-11-28 网络故障诊断系统

Publications (2)

Publication Number Publication Date
CN102420700A CN102420700A (zh) 2012-04-18
CN102420700B true CN102420700B (zh) 2014-06-18

Family

ID=45944948

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110383354.5A Expired - Fee Related CN102420700B (zh) 2011-11-28 2011-11-28 网络故障诊断系统

Country Status (1)

Country Link
CN (1) CN102420700B (zh)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103414581A (zh) * 2013-07-24 2013-11-27 佳都新太科技股份有限公司 一种基于数据挖掘的设备故障报警预测处理机制
CN103426028A (zh) * 2013-08-23 2013-12-04 北京化工大学 一种基于继承模式的故障诊断专家系统及故障诊断方法
EP3151480B1 (en) * 2014-06-30 2020-02-26 Huawei Technologies Co., Ltd. Message processing method and device
EP3446439A1 (de) * 2016-04-22 2019-02-27 Hirschmann Automation and Control GmbH Mib-orientiertes protokoll für hochwirksame http-verwaltungsprozeduren
CN107703912A (zh) * 2017-09-13 2018-02-16 陕西千山航空电子有限责任公司 一种基于航电设备的故障诊断方法
CN107896165B (zh) * 2017-11-28 2021-05-07 新华三技术有限公司 定位网络故障的方法、装置和自动化测试设备
CN108228800B (zh) * 2017-12-29 2022-03-15 无锡十一新能源投资有限公司 一种基于数据挖掘的光伏发电系统异常检测系统及方法
CN108092824B (zh) * 2018-01-15 2020-05-01 淮阴师范学院 一种基于复杂动态网络的控制系统诊断方法
CN108615047B (zh) * 2018-03-23 2022-07-01 绍兴诺雷智信息科技有限公司 面向风电机组设备的故障诊断知识模型的构建方法
CN108416443A (zh) * 2018-03-29 2018-08-17 北京润科通用技术有限公司 一种故障诊断方法及装置
CN111198817B (zh) * 2019-12-30 2021-06-04 武汉大学 一种基于卷积神经网络的SaaS软件故障诊断方法及装置
CN111444291A (zh) * 2020-03-27 2020-07-24 上海爱数信息技术股份有限公司 一种基于流处理引擎和规则引擎的实时数据告警方法
CN112000085B (zh) * 2020-09-08 2021-08-31 广州云也科技有限公司 一种基于5g大数据的网络传输性能诊断系统
CN113419908B (zh) * 2021-05-31 2023-02-03 西南电子技术研究所(中国电子科技集团公司第十研究所) 监测数字通信模块失效模式的方法
CN117978612B (zh) * 2024-03-28 2024-06-04 成都格理特电子技术有限公司 网络故障检测方法、存储介质以及电子设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1633081A1 (fr) * 2004-09-03 2006-03-08 Alcatel DIispositif de diagnostic modulaire à base de connaissances évolutive, pour un réseau de communications
CN102083116A (zh) * 2011-01-10 2011-06-01 浪潮通信信息系统有限公司 基于元知识的智能化通信告警故障定位专家系统的构建方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1633081A1 (fr) * 2004-09-03 2006-03-08 Alcatel DIispositif de diagnostic modulaire à base de connaissances évolutive, pour un réseau de communications
CN102083116A (zh) * 2011-01-10 2011-06-01 浪潮通信信息系统有限公司 基于元知识的智能化通信告警故障定位专家系统的构建方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
《一种故障诊断专家系统在网络管理中的设计与实现》;李增智等;《计算机工程与应用》;20010930(第17期);第24-26页 *
李增智等.《一种故障诊断专家系统在网络管理中的设计与实现》.《计算机工程与应用》.2001,(第17期),第24-26页.

Also Published As

Publication number Publication date
CN102420700A (zh) 2012-04-18

Similar Documents

Publication Publication Date Title
CN102420700B (zh) 网络故障诊断系统
CN101854269B (zh) 电力二次系统信息安全运维监管平台
CN110336703A (zh) 基于边缘计算的工业大数据监测系统
CN107294764A (zh) 智能监管方法和智能监管系统
CN107491375A (zh) 一种云计算环境下的设备检测及故障预警系统及方法
CN102123149B (zh) 面向服务的大规模网络安全态势评估装置及方法
CN107886238A (zh) 一种基于海量数据分析的业务流程管理系统及方法
CN107995049A (zh) 电力安全区跨区同步故障监测方法、装置和系统
CN106789412A (zh) 监测信息采集主站性能的方法、装置及系统
CN101095307A (zh) 网络管理设备
CN107770797A (zh) 一种无线网络告警管理的关联分析方法及系统
CN201623722U (zh) 电力二次系统信息安全运维监管平台
Wan et al. Event-Based Anomaly Detection for Non-Public Industrial Communication Protocols in SDN-Based Control Systems.
CN107510914A (zh) 一种面向园区的智慧消防远程监控系统及其方法
CN109634816A (zh) 应用管理方法及终端设备
CN112910696A (zh) 一种网络拓扑自动化建模分析方法
CN107547228A (zh) 一种基于大数据的安全运维管理平台的实现架构
CN106713281A (zh) 监控系统
CN103166776A (zh) 一种接入网设备综合管理系统
CN114531273A (zh) 一种防御工业网络系统分布式拒绝服务攻击的方法
García et al. Automatic alarm prioritization by data mining for fault management in cellular networks
CN104022907A (zh) 一种校园网的故障侦测系统与方法
CN102045186B (zh) 一种事件分析方法及系统
Zhao et al. Design of wireless sensor network middleware for agricultural applications
CN109743208A (zh) 智能管控自动数据采集系统和方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20140618

Termination date: 20141128

EXPY Termination of patent right or utility model