CN103152219B - 一种计算机网络系统的事件监控系统及事件监控方法 - Google Patents

一种计算机网络系统的事件监控系统及事件监控方法 Download PDF

Info

Publication number
CN103152219B
CN103152219B CN201310052717.6A CN201310052717A CN103152219B CN 103152219 B CN103152219 B CN 103152219B CN 201310052717 A CN201310052717 A CN 201310052717A CN 103152219 B CN103152219 B CN 103152219B
Authority
CN
China
Prior art keywords
event
model
information
result
failure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310052717.6A
Other languages
English (en)
Other versions
CN103152219A (zh
Inventor
方扬
李笠
李博
田斌
赵同
贺安辉
薛大宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN201310052717.6A priority Critical patent/CN103152219B/zh
Publication of CN103152219A publication Critical patent/CN103152219A/zh
Application granted granted Critical
Publication of CN103152219B publication Critical patent/CN103152219B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Debugging And Monitoring (AREA)
  • Computer And Data Communications (AREA)

Abstract

本发明提供一种计算机网络系统的事件监控系统及事件监控方法,该事件监控系统包括:事件模型生成装置、事件采集装置、事件适配装置、执行处理装置和事件存储装置;所述事件模型生成装置,连接所述事件适配装置;所述事件采集装置,连接所述事件适配装置;所述事件适配装置,连接所述执行处理装置;所述执行处理装置,连接所述事件存储装置。本发明简化了监控处理过程,减少了事件监控系统的开发工作量,提高了事件监控效率,降低了系统维护成本。

Description

一种计算机网络系统的事件监控系统及事件监控方法
技术领域
本发明涉及计算机网络技术领域,具体地,涉及一种计算机网络系统的事件监控系统及事件监控方法。
背景技术
对于复杂环境下的计算机网络系统,其物理架构以及逻辑结构相当复杂,当其中组件出现问题时,问题就会很难定位,为此计算机网络系统中引入了事件监控系统,当组件出现问题时,事件监控系统会产生一个故障事件的报警信息,以便系统维护人员可以根据该报警信息进行故障排查,以解决问题而使计算机网络系统尽快恢复正常的运转。
目前常见的计算机网络系统中,针对不同的厂商或者应用组件,各种事件的发生逻辑各不相同,事件监控系统就要遵循不同的逻辑去定义不同事件的相关信息,从而在处理不同事件的相关信息时,事件监控系统所采用的处理逻辑也相应不同;例如操作系统报警、数据库报警、中间件报警等,各有一百个字段,而这些字段各不相同,为了维护这些报警事件,至少需要三类数据库表来保存不同的故障事件信息,因此就会就存在如下问题:首先,由于这些故障事件信息的字段中,并不是所有字段都是有意义的,可能对系统维护人员来说只是关注其中的某些字段,所以对这些冗余字段的存储,加大了数据库本身的存储成本;其次,由于这三类数据库表的字段结构各不相同,系统进行不同事件查询的时候,至少需要三类SQL语句,这样无形中增加了系统的查询成本;再次,由于此类故障事件信息一般来说比较专业,所以对于维护人员的要求较高,需要维护人员理解不同系统故障事件信息的含义,这也增加了维护的成本。此外,目前的计算机网络系统的事件监控系统对事件进行处理时,采用的是将不同故障事件信息集中进行归集处理的方式,即对于不同内容,不同格式的监控事件,都统一上送到服务器端进行处理,这样对于不同类型的故障事件,需要有不同处理逻辑,从而增加了程序的二次开发量,同时,由于处理逻辑不同,所以增加了故障事件解析的复杂性,从而降低了系统的效率和吞吐量。
发明内容
本发明实施例的主要目的在于提供一种计算机网络系统的事件监控系统及事件监控方法,以解决现有计算机网络系统的事件监控系统对不同的故障事件采用不同的处理逻辑,而导致监控处理过程复杂,效率低下、软件开发难度高、维护成本高等缺陷。
为了实现上述目的,本发明实施例提供一种计算机网络系统的事件监控系统,所述事件监控系统包括:事件模型生成装置、事件采集装置、事件适配装置、执行处理装置和事件存储装置;
所述事件模型生成装置,连接所述事件适配装置,用于根据计算机网络系统中的各种故障事件类型生成对应的事件模型,并将所述事件模型发送给所述事件适配装置;
所述事件采集装置,连接所述事件适配装置,用于采集原始故障事件信息,并将所述原始故障事件信息发送给所述事件适配装置;
所述事件适配装置,连接所述执行处理装置,用于接收并存储所述事件模型,当接收到原始故障事件信息时,根据所述原始故障事件信息所属的故障事件类型确定对应的事件模型,根据该确定的事件模型对所述原始故障事件信息进行归集处理,得到归集处理后事件信息,将所述归集处理后事件信息发送给所述执行处理装置;其中,所述归集处理后事件信息符合预设的统一标准格式;
所述执行处理装置,连接所述事件存储装置,用于接收所述归集处理后事件信息并对其进行处理,然后将处理结果发送给所述事件存储装置;
所述事件存储装置,用于存储所述处理结果。
一种计算机网络系统的事件监控方法,所述事件监控方法包括:
采集原始故障事件信息;
根据所述原始故障事件信息所属的故障事件类型确定对应的事件模型;其中,所述事件模型为预先生成的,并且所述事件模型与计算机网络系统中的各种故障事件类型相对应;
根据所述确定的事件模型对所述原始故障事件信息进行归集处理,得到归集处理后事件信息;其中,所述归集处理后事件信息符合预设的统一标准格式;
对所述归集处理后事件信息进行处理,得到处理结果;
存储所述处理结果。
借助于上述技术方案,本发明根据计算机网络系统中不同的故障事件类型生成相应的事件模型,并根据事件模型对原始故障事件信息进行归集处理,由于归集处理后事件信息具有统一的标准格式,因此针对不同的故障事件,事件监控系统都可以采用统一的处理逻辑进行监控处理,相比于现有技术,本发明简化了监控处理过程,减少了事件监控系统的开发工作量,提高了事件监控效率,降低了系统维护成本。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例一提供的计算机网络系统的事件监控系统的结构示意图;
图2是本发明实施例一提供的事件模型生成装置结构示意图;
图3是本发明实施例一提供的采用XMLSchema定义的通用事件模型要素示意图;
图4是本发明实施例一提供的另一种事件模型生成装置结构示意图;
图5是本发明实施例一提供的事件存储装置结构示意图;
图6是本发明实施例一提供的另一种计算机网络系统的事件监控系统的结构示意图;
图7是本发明实施例二提供的计算机网络系统的事件监控系统的结构示意图;
图8是本发明实施例三提供的计算机网络系统的事件监控方法流程示意图;
图9是本发明实施例四提供的计算机网络系统的事件监控方法流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
本实施例提供一种计算机网络系统的事件监控系统,如图1所示,该事件监控系统包括:事件模型生成装置11、事件采集装置12、事件适配装置13、执行处理装置14和事件存储装置15;
所述事件模型生成装置11,连接所述事件适配装置13,用于根据计算机网络系统中的各种故障事件类型生成对应的事件模型,并将所述事件模型发送给所述事件适配装置13;
所述事件采集装置12,连接所述事件适配装置13,用于采集原始故障事件信息,并将所述原始故障事件信息发送给所述事件适配装置13;
所述事件适配装置13,连接所述执行处理装置14,用于接收并存储所述事件模型,当接收到原始故障事件信息时,根据所述原始故障事件信息所属的故障事件类型确定对应的事件模型,根据该确定的事件模型对所述原始故障事件信息进行归集处理,得到归集处理后事件信息,将所述归集处理后事件信息发送给所述执行处理装置14;其中,所述归集处理后事件信息符合预设的统一标准格式;
所述执行处理装置14,连接所述事件存储装置15,用于接收所述归集处理后事件信息并对其进行处理,然后将处理结果发送给所述事件存储装置15;
所述事件存储装置15,用于存储所述处理结果。
具体的,由于在计算机网络系统中,不同故障事件类型所对应的原始故障事件信息的逻辑不同,例如描述不同故障事件信息的字段结构不同,为了能够简化事件监控系统的处理逻辑,本实施例中,事件模型生成装置11根据计算机网络系统中各种故障事件类型的特点生成相应的事件模型,该事件模型的作用是总结归纳相应故障事件类型对应的原始故障事件信息的逻辑特征(如字段结构特征),以使事件适配装置13可根据相应的事件模型对原始故障事件信息进行解析及归集处理,得到符合统一标准格式的归集处理后事件信息,进一步的,执行处理装置14就可以采用统一的处理逻辑对具有统一标准格式的归集处理后事件信息进行监控处理,从而简化了事件监控处理过程,减少了事件监控系统的开发工作量,提高了事件监控效率,降低了系统维护成本。
本实施例中,归集处理后事件信息所符合的统一标准格式是预先设定的,并且本实施例对其不作具体限定,可根据应用本事件监控系统的计算机网络系统的实际需要,确定合适的统一标准格式。
优选的,如图2所示,本实施例中,事件模型生成装置11具体可包括:故障类型处理器111、事件模型处理器112、事件模型发送器113;
所述故障类型处理器111,连接所述事件模型处理器112,用于确定所述计算机网络系统中的各种故障事件类型,并将所述各种故障事件类型发送给所述事件模型处理器112;
所述事件模型处理器112,连接所述事件模型发送器113,用于接收所述各种故障事件类型,根据预设的通用事件模型要素对所述各种故障事件类型进行解析,根据所述解析的结果生成所述各种故障事件类型对应的事件模型,将所述生成的事件模型发送给所述事件模型发送器113;
所述事件模型发送器113,连接所述事件适配装置13,用于将所述事件模型发送给所述事件适配装置13。
具体的,本实施例中,事件模型处理器112所采用的通用事件模型要素是预先设定的,其设定原则是:对计算机网络系统中的各种故障事件类型进行解析,总结归纳出能够表征故障事件的特征要素,通过这些特征要素能够清楚明确的表达出故障事件信息,并且能够唯一表征出相应的故障事件。
进一步的,事件模型处理器112根据各种故障事件类型对应的原始故障事件信息的逻辑特点(例如原始故障事件信息的字段结构特点),基于所述通用事件模型要素,构建出与每一故障事件类型相对应的事件模型。
本实施例对所采用的通用事件模型要素不作具体限定,可根据应用本事件监控系统的计算机网络系统的实际需要,确定合适的通用事件模型要素。
基于常见的计算机网络系统,本实施例提供了以下多种通用事件模型要素,如表1所示:
表1
属性名称 类型 含义描述
ComponentType String 事件类别
Component String 事件大类
SubComponent String 事件子类
EventName String 事件名称
InstanceID String 事件对象标识
NodeIP String 事件的IP地址
NodeName String 事件的主机名
InstanceValue String 事件相关的监控对象状态
Severity String 事件的严重等级
Msg String 事件信息或错误原因的详细描述
SequenceNumber Long 集成系统的事件原始序列号
Business String 事件相关的业务系统名称
Application String 事件相关的应用系统名称
FirstOccurence Long 事件最早发生的时间
LastOccurence Long 事件最后发生的时间
RepeatCount Short 事件发生次数
Location String 事件发生的区域
Tally Integer 事件发生次数
otherData String 其它信息
如表1所示,针对常见的计算机网络系统,本实施例提供了多种通用事件模型要素以表征故障事件的各种特征要素,通过这些特征要素能够清楚明确的表达出故障事件信息,并且能够唯一表征出相应的故障事件。
考虑到在不同的应用场景中,针对不同的故障事件,系统所要关注的故障事件特征也不尽相同,为了达到精简最终形成的归集处理后事件信息的目的,优选的,本实施例所采用的通用事件模型要素至少包括:事件类别、事件大类、事件子类、事件名称和事件对象标识。
具体的,事件类别是事件的最高分类,定义了事件有哪些类别,例如主机事件、网络事件、开放平台操作系统事件、应用事件、设备事件和安全事件等;
事件大类是定义每种类别有哪些事件种类,对于非应用类事件,为AIX操作系统和Oracle数据库等信息,对于应用类事件,则为应用名称的英文简称。事件类别和事件大类是一对多关系;
事件子类是事件大类的更细划分,例如资源类事件、CPU类事件和表空间类事件。事件类别或事件大类和事件子类也是一对多关系,但事件大类和事件子类是多对多关系,例如CPU类事件会在AIX、Solaris等操作系统中使用;
事件名称是对于一个事件子类中具体事件的定义,一般情况下一个事件子类会包含多个事件名称,例如CPU类事件会有CPU使用率和CPU一分钟负载等事件名称;
事件对象标识是事件发生对象的唯一标识,如发生故障的某个CPU的唯一标识。
较佳的,本实施例所采用的通用事件模型要素还可以包括:事件发生次数、事件最早发生的时间和事件最后发生的时间等,进一步使得生成的事件模型能够表征出故障事件的状态信息,最终可使得执行处理装置14根据归集处理后的事件信息对故障事件的状态进行更新。
考虑到常见计算机网络系统需要用到的通用事件模型要素繁多,为了能够清楚的定义各种通用事件模型要素及其之间的关系,本实施例采用XMLSchema(.xsd)来定义各种通用事件模型要素,例如图3所示为采用XMLSchema定义的事件类别、事件大类、事件子类、事件名称和事件对象标识,由于XMLSchema利用了面向对象的思想,将各种通用事件模型要素按照树状结构进行组织和划分,因此可以显著提高系统开发人员根据业务需求去定义各种通用事件模型要素,为最终构建合理的事件模型提供了较好的保障。
优选的,如图4所示,本实施例中,事件模型生成装置11还可以包括:故障类型过滤器114;
所述故障类型过滤器114,分别连接所述故障类型处理器111和事件模型处理器112,用于根据预设的过滤条件,对所述故障类型处理器111发送给所述事件模型处理器112的各种故障事件类型进行过滤,并将过滤后的故障事件类型发送给所述事件模型处理器112。
在具体实施中,系统开发人员可根据计算机网络系统的实际需要,设置过滤条件,从故障类型处理器111确定的所有故障事件类型中过滤掉不需要关注的故障事件类型,留下需要关注的故障事件类型,通过该方式可进一步提高事件监控的处理效率。
优选的,本实施例中,所述事件采集装置12与所述事件适配装置13的数量都至少为一个,且所述事件采集装置12与所述事件适配装置13一一对应,相对应的所述事件采集装置12与所述事件适配装置13相连接并作为一个监控组合,不同监控组合的事件采集装置12和事件适配装置13对应不同的故障事件类型;
所述事件模型发送器113还用于根据所述每一监控组合对应的故障事件类型,将相应的事件模型发送给该监控组合中的事件适配装置13。
具体的,为了提高事件监控系统的安全性和稳定性,针对计算机网络系统中的不同故障事件类型,本实施例采用不同的事件采集装置12采集相应的原始故障信息,并采用不同的事件适配装置13存储对应不同故障事件类型的事件模型,令对应相同故障事件类型的事件采集装置12和时间适配装置一一对应并连接作为一个监控组合,通过这种方式,当其中某一监控组合出现问题时,不会影响到其他监控组合的正常工作,从而提高了整个事件监控系统的安全性和稳定性。
优选的,本实施例中,执行处理装置14接收所述归集处理后事件信息并对其进行处理时,具体用于:
根据所述归集处理后事件信息,判断当前故障事件是否首次出现;
若是,则将所述归集处理后事件信息作为处理结果发送给所述事件存储装置15;
若否,则对当前故障事件的状态信息进行更新,并将更新后的状态信息作为处理结果发送给所述事件存储装置15。
具体的,由于归集处理后事件信息符合统一的标准格式,因此当执行处理装置14接收到归集处理后事件信息时就可以采用统一的处理逻辑对其进行监控处理;为了进一步的提高监控处理效率,本实施例可在具有统一标准格式的归集处理后事件信息的基础上,采用更进一步的处理操作,将归集处理后事件信息进行精简处理,得到能够表征当前故障事件的唯一标识信息,例如:执行处理装置14可根据归集处理后事件信息获取当前故障事件对应的事件类别ComponentType、事件大类Component、事件子类SubComponent、事件名称EventName和事件对象标识InstanceID等信息;进一步,可通过这些信息形成一个能够唯一标识当前故障事件的标识号Identity(例如,Identity=ComponentType+Component+SubComponent+EventName+InstanceID);然后执行处理装置14通过判断该Identity是否为首次出现,若是,则将该Identity发送给事件存储装置15进行存储,否则,就更新该Identity对应的故障事件的事件发生次数Tally和事件最后发生的时间LastOccurence等状态信息,并将该更新后的状态信息发送给事件存储装置15进行存储;通过上述过程,事件存储装置15中就会存储有计算机网络系统中的各种故障事件及其状态信息。
例如,当前故障事件为操作系统报警,其Identity对应的各字段信息如表2所示:
表2
ComponentType 操作系统
Component Windows
SubComponent 磁盘
EventName 磁盘空间使用率
InstanceID D:
则其Identity=“操作系统”+“Windows”+“磁盘”+“磁盘空间使用率”+“D:”
若该执行处理装置14判断该Identity为首次出现,则将其对应的故障事件作为一条新的事件进行处理,即将相应的归集处理后事件信息发送给事件存储装置15;
若该执行处理装置14判断该Identity不是首次出现,则更新该故障事件的事件发生次数Tally和事件最后发生的时间LastOccurence等信息,并将更新后的信息发送给事件存储装置15。
优选的,如图5所示,本实施例中,所述事件存储装置15包括:实时存储器151和永久存储器152;
所述实时存储器151,连接所述执行处理装置14,用于实时接收所述执行处理装置14发送的处理结果并保存;
所述永久存储器152,连接所述实时存储器151,用于根据预设的时间间隔,从所述实时存储器151中获取所述处理结果并保存,同时将所述获取的处理结果从所述实时存储其中删除。
具体的,为了实现故障事件的持久化存储,本实施例在事件存储装置15设置了实时存储器151和永久存储器152,分别对应两个数据库,其中,实时存储器151只存储当前接收的处理结果,并且每隔预定的时间间隔,永久存储器152就会将实时存储器151中存储的处理结果提取出来并保存,通过这种方式,事件监控系统不仅可以通过实时存储器151获取实时发生的故障事件信息,还可以从永久存储器152调取曾经发生的故障事件信息,以满足系统维护人员的各种需要。
优选的,如图6所示,所述事件监控系统还包括:事件显示装置16;
所述事件显示装置16,连接所述事件存储装置,用于从所述事件存储装置获取处理结果并显示给用户。
优选的,事件显示装置16具体包括:权限设置器、结果操作器和显示器;
所述权限设置器,用于设置用户对所述事件存储装置15中存储的处理结果的操作权限;
所述结果操作器,连接所述权限设置器,用于根据所述权限设置器设置的操作权限对所述事件存储装置15中存储的处理结果进行确认和/或删除操作;
所述显示器,连接所述结果操作器,用于根据所述结果操作器的操作结果将所述操作之后的处理结果显示给用户。
具体的,计算机网络系统通过发送指令给权限设置器,以设置不同用户的操作权限,例如高级别的用户具有确认和删除处理结果的权限,而低级别的用户仅有确认处理结果的权限;结果操作器接收用户输入的操作命令,并依据权限设置器设置的操作权限判断是否执行该操作命令。
优选的,本实施例中,事件采集装置12至少可包括:操作系统收集器、数据库收集器、中间件收集器和VMware虚拟机收集器;
所述操作系统收集器,用于收集CPU、内存、磁盘信息;
所述数据库收集器,用于收集表空间使用率、游标使用率、会话使用率;
所述中间件收集器,用于收集中间件JVM(JavaVirtualMachine,Java虚拟机)使用率、垃圾回收时间占比;
所述VMware虚拟机收集器,用于收集VMwareCPU资源池、内存资源池、存储信息。
实施例二
本实施例提供一具体的计算机网络系统的事件监控系统,如图7所示,该系统包括:事件模型生成装置71、监控组合N(N=1,2,3…)、执行处理装置72、事件存储装置73、事件显示装置74;其中,监控组合N由事件采集装置N和事件适配装置N连接组成;事件模型生成装置71连接事件适配装置N,事件适配装置N连接执行处理装置72,执行处理装置72连接事件存储装置73,事件存储装置73连接事件显示装置74。
本实施例提供的计算机网络系统的事件监控系统采用分布式系统架构,其中每一监控组合对应不同的故障事件类型,这种分布式系统架构提高了整个事件监控系统的安全性和稳定性,简化了系统的开发和维护工作,为后续扩展系统功能提供了方便。
本实施例提供的计算机网络系统的事件监控系统中,各功能装置的具体工作原理及内部结构请参见实施例一,此处不再赘述。
实施例三
本实施例提供一种计算机网络系统的事件监控方法,如图8所示,该事件监控方法包括:
步骤S81,采集原始故障事件信息;
步骤S82,根据所述原始故障事件信息所属的故障事件类型确定对应的事件模型;其中,所述事件模型为预先生成的,并且所述事件模型与计算机网络系统中的各种故障事件类型相对应;
步骤S83,根据所述确定的事件模型对所述原始故障事件信息进行归集处理,得到归集处理后事件信息;其中,所述归集处理后事件信息符合预设的统一标准格式;
步骤S84,对所述归集处理后事件信息进行处理,得到处理结果;
步骤S85,存储所述处理结果。
优选的,所述事件模型的生成方法包括:
确定所述计算机网络系统中的各种故障事件类型;
根据预设的通用事件模型要素对所述各种故障事件类型进行解析;
根据所述解析的结果生成所述各种故障事件类型对应的事件模型。
优选的,所述根据预设的通用事件模型要素对所述各种故障事件类型进行解析之前,还包括:
根据预设的过滤条件,对所述各种故障事件类型进行过滤;
则所述根据预设的通用事件模型要素对所述各种故障事件类型进行解析,具体为:
根据预设的通用事件模型要素对所述过滤后的故障事件类型进行解析。
优选的,本实施例提供的事件监控方法还包括:
根据所述原始故障事件信息所属的故障事件类型确定不存在对应的事件模型时,进行报警处理。
具体的,当事件适配装置中没有存储与所述原始故障事件信息所属的故障事件类型相对应的事件模型时,执行报警处理,例如写入报错日志log中。
优选的,上述步骤S84中,所述对所述归集处理后事件信息进行处理,得到处理结果,具体包括:
根据所述归集处理后事件信息,判断当前故障事件是否首次出现;
若是,则将所述归集处理后事件信息确定为处理结果;
若否,则对当前故障事件的状态信息进行更新,并将更新后的状态信息确定为处理结果。
优选的,本实施例提供的事件监控方法还包括:
将所述处理结果显示给用户。
优选的,所述将所述处理结果显示给用户,具体包括:
设置用户对所述处理结果的操作权限;
根据所述操作权限对所述处理结果进行确认和/或删除操作;
将所述操作之后的处理结果显示给用户。
本实施例提供的事件监控方法的具体实施方式可参见实施例一,在此不再赘述。
实施例四
本实施例提供一具体的计算机网络系统的事件监控方法,如图9所示:
步骤S91,事件采集装置监控到故障事件,采集相应的原始故障事件信息,并将该原始故障事件信息发送给事件适配装置;
步骤S92,事件适配装置确定该原始故障事件信息所属的故障事件类型,并判断自身是否存储有与该故障事件类型相对应的事件模型,若是,则执行步骤S93,否则,执行步骤S94;
步骤S93,利用与该故障事件类型相对应的事件模型,对该原始故障事件信息进行归集处理,得到归集处理后事件信息并将其发送给执行处理装置,继续执行步骤S95;
步骤S94,写入报错日志log,结束本次流程;
步骤S95,执行处理装置根据接收到的归集处理后事件信息,生成对应当前故障事件的标识号Identity,其中,Identity=事件类别ComponentType+事件大类Component+事件子类SubComponent+事件名称EventName+事件对象标识InstanceID;
步骤S96,执行处理装置判断该标识号Identity是否首次出现,若是,则执行步骤S97,否则,执行步骤S98,
步骤S97,将该标识号Identity对应的归集处理后事件信息作为处理结果发送给事件存储装置进行存储,继续执行步骤S99;
步骤S98,将该标识号Identity对应的故障事件的状态信息进行更新,然后将更新的结果作为处理结果发送给事件存储装置进行存储,继续执行步骤S99;
步骤S99,事件存储装置将处理结果发送给事件显示装置进行显示。
综上所述,本发明实施例提供的计算机网络系统的事件监控系统及事件监控方法具有简化监控处理过程,减少事件监控系统的开发工作量,提高事件监控效率,降低系统维护成本等有益效果。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (14)

1.一种计算机网络系统的事件监控系统,其特征在于,所述事件监控系统包括:事件模型生成装置、事件采集装置、事件适配装置、执行处理装置和事件存储装置;
所述事件模型生成装置,连接所述事件适配装置,用于根据计算机网络系统中的各种故障事件类型生成对应的事件模型,并将所述事件模型发送给所述事件适配装置;
所述事件采集装置,连接所述事件适配装置,用于采集原始故障事件信息,并将所述原始故障事件信息发送给所述事件适配装置;
所述事件适配装置,连接所述执行处理装置,用于接收并存储所述事件模型,当接收到原始故障事件信息时,根据所述原始故障事件信息所属的故障事件类型确定对应的事件模型,根据确定的事件模型对所述原始故障事件信息进行归集处理,得到归集处理后事件信息,将所述归集处理后事件信息发送给所述执行处理装置;其中,所述归集处理后事件信息符合预设的统一标准格式;
所述执行处理装置,连接所述事件存储装置,用于接收所述归集处理后事件信息并对其进行处理,然后将处理结果发送给所述事件存储装置;
所述事件存储装置,用于存储所述处理结果;
其中,所述事件模型生成装置具体包括:故障类型处理器、事件模型处理器、事件模型发送器;
所述故障类型处理器,连接所述事件模型处理器,用于确定所述计算机网络系统中的各种故障事件类型,并将所述各种故障事件类型发送给所述事件模型处理器;
所述事件模型处理器,连接所述事件模型发送器,用于接收所述各种故障事件类型,根据预设的通用事件模型要素对所述各种故障事件类型进行解析,根据所述解析的结果生成所述各种故障事件类型对应的事件模型,将所述生成的事件模型发送给所述事件模型发送器;
所述事件模型发送器,连接所述事件适配装置,用于将所述事件模型发送给所述事件适配装置。
2.根据权利要求1所述的事件监控系统,其特征在于,所述事件模型生成装置还包括:故障类型过滤器;
所述故障类型过滤器,分别连接所述故障类型处理器和事件模型处理器,用于根据预设的过滤条件,对所述故障类型处理器发送给所述事件模型处理器的各种故障事件类型进行过滤,并将过滤后的故障事件类型发送给所述事件模型处理器。
3.根据权利要求1所述的事件监控系统,其特征在于,所述事件采集装置与所述事件适配装置的数量都至少为一个,且所述事件采集装置与所述事件适配装置一一对应,相对应的所述事件采集装置与所述事件适配装置相连接并作为一个监控组合,不同监控组合的事件采集装置和事件适配装置对应不同的故障事件类型;
所述事件模型发送器还用于根据每一监控组合对应的故障事件类型,将相应的事件模型发送给该监控组合中的事件适配装置。
4.根据权利要求1所述的事件监控系统,其特征在于,所述执行处理装置接收所述归集处理后事件信息并对其进行处理时,具体用于:
根据所述归集处理后事件信息,判断当前故障事件是否首次出现;
若是,则将所述归集处理后事件信息作为处理结果发送给所述事件存储装置;
若否,则对当前故障事件的状态信息进行更新,并将更新后的状态信息作为处理结果发送给所述事件存储装置。
5.根据权利要求1所述的事件监控系统,其特征在于,所述事件存储装置包括:实时存储器和永久存储器;
所述实时存储器,连接所述执行处理装置,用于实时接收所述执行处理装置发送的处理结果并保存;
所述永久存储器,连接所述实时存储器,用于根据预设的时间间隔,从所述实时存储器中获取所述处理结果并保存,同时将所述获取的处理结果从所述实时存储器中删除。
6.根据权利要求1所述的事件监控系统,其特征在于,所述事件监控系统还包括:事件显示装置;
所述事件显示装置,连接所述事件存储装置,用于从所述事件存储装置获取处理结果并显示给用户。
7.根据权利要求6所述的事件监控系统,其特征在于,所述事件显示装置具体包括:权限设置器、结果操作器和显示器;
所述权限设置器,用于设置用户对所述事件存储装置中存储的处理结果的操作权限;
所述结果操作器,连接所述权限设置器,用于根据所述权限设置器设置的操作权限对所述事件存储装置中存储的处理结果进行确认和/或删除操作;
所述显示器,连接所述结果操作器,用于根据所述结果操作器的操作结果将所述操作之后的处理结果显示给用户。
8.根据权利要求1所述的事件监控系统,其特征在于,所述事件采集装置至少包括:操作系统收集器、数据库收集器,中间件收集器和VMware虚拟机收集器;
所述操作系统收集器,用于收集CPU、内存、磁盘信息;
所述数据库收集器,用于收集表空间使用率、游标使用率、会话使用率;
所述中间件收集器,用于收集中间件使用率、垃圾回收时间占比;
所述VMware虚拟机收集器,用于收集VMwareCPU资源池、内存资源池、存储信息。
9.一种计算机网络系统的事件监控方法,其特征在于,所述事件监控方法包括:
采集原始故障事件信息;
根据所述原始故障事件信息所属的故障事件类型确定对应的事件模型;其中,所述事件模型为预先生成的,并且所述事件模型与计算机网络系统中的各种故障事件类型相对应;
根据确定的事件模型对所述原始故障事件信息进行归集处理,得到归集处理后事件信息;其中,所述归集处理后事件信息符合预设的统一标准格式;
对所述归集处理后事件信息进行处理,得到处理结果;
存储所述处理结果;
其中,所述事件模型的生成方法包括:
确定所述计算机网络系统中的各种故障事件类型;
根据预设的通用事件模型要素对所述各种故障事件类型进行解析;
根据所述解析的结果生成所述各种故障事件类型对应的事件模型。
10.根据权利要求9所述的事件监控方法,其特征在于,所述根据预设的通用事件模型要素对所述各种故障事件类型进行解析之前,还包括:
根据预设的过滤条件,对所述各种故障事件类型进行过滤;
则所述根据预设的通用事件模型要素对所述各种故障事件类型进行解析,具体为:
根据预设的通用事件模型要素对过滤后的故障事件类型进行解析。
11.根据权利要求9所述的事件监控方法,其特征在于,还包括:
根据所述原始故障事件信息所属的故障事件类型确定不存在对应的事件模型时,进行报警处理。
12.根据权利要求9所述的事件监控方法,其特征在于,所述对所述归集处理后事件信息进行处理,得到处理结果,具体包括:
根据所述归集处理后事件信息,判断当前故障事件是否首次出现;
若是,则将所述归集处理后事件信息确定为处理结果;
若否,则对当前故障事件的状态信息进行更新,并将更新后的状态信息确定为处理结果。
13.根据权利要求9所述的事件监控方法,其特征在于,所述事件监控方法还包括:
将所述处理结果显示给用户。
14.根据权利要求13所述的事件监控方法,其特征在于,所述将所述处理结果显示给用户,具体包括:
设置用户对所述处理结果的操作权限;
根据所述操作权限对所述处理结果进行确认和/或删除操作;
将所述操作之后的处理结果显示给用户。
CN201310052717.6A 2013-02-18 2013-02-18 一种计算机网络系统的事件监控系统及事件监控方法 Active CN103152219B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310052717.6A CN103152219B (zh) 2013-02-18 2013-02-18 一种计算机网络系统的事件监控系统及事件监控方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310052717.6A CN103152219B (zh) 2013-02-18 2013-02-18 一种计算机网络系统的事件监控系统及事件监控方法

Publications (2)

Publication Number Publication Date
CN103152219A CN103152219A (zh) 2013-06-12
CN103152219B true CN103152219B (zh) 2015-12-09

Family

ID=48550094

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310052717.6A Active CN103152219B (zh) 2013-02-18 2013-02-18 一种计算机网络系统的事件监控系统及事件监控方法

Country Status (1)

Country Link
CN (1) CN103152219B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106681849B (zh) 2015-11-10 2020-11-24 创新先进技术有限公司 数据处理方法及装置
CN106411612A (zh) * 2016-11-10 2017-02-15 无线生活(杭州)信息科技有限公司 一种分布式系统告警分析方法及装置
CN107391284A (zh) * 2017-08-18 2017-11-24 郑州云海信息技术有限公司 一种事件处理方法及装置
CN115695142A (zh) * 2022-10-25 2023-02-03 浪潮通信信息系统有限公司 一种面向网络运维的事件监控方法及装置
CN116132214A (zh) * 2022-12-30 2023-05-16 中国联合网络通信集团有限公司 基于事件总线模型的事件传输方法、装置、设备及介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5440688A (en) * 1991-01-31 1995-08-08 Nec Corporation Network management system employing a main processor and an auxiliary processor to receive alarm messages and transmit recovery commands
CN1529455A (zh) * 2003-09-29 2004-09-15 港湾网络有限公司 网络故障实时相关性分析方法及系统
CN2747792Y (zh) * 2003-09-29 2005-12-21 北京港湾网络有限公司 网络故障实时相关性分析系统
CN101145982A (zh) * 2007-10-29 2008-03-19 广州复旦奥特科技股份有限公司 一种基于对象模型与协议组态配置的通用网关设计方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5440688A (en) * 1991-01-31 1995-08-08 Nec Corporation Network management system employing a main processor and an auxiliary processor to receive alarm messages and transmit recovery commands
CN1529455A (zh) * 2003-09-29 2004-09-15 港湾网络有限公司 网络故障实时相关性分析方法及系统
CN2747792Y (zh) * 2003-09-29 2005-12-21 北京港湾网络有限公司 网络故障实时相关性分析系统
CN101145982A (zh) * 2007-10-29 2008-03-19 广州复旦奥特科技股份有限公司 一种基于对象模型与协议组态配置的通用网关设计方法

Also Published As

Publication number Publication date
CN103152219A (zh) 2013-06-12

Similar Documents

Publication Publication Date Title
US8863224B2 (en) System and method of managing data protection resources
CN103152219B (zh) 一种计算机网络系统的事件监控系统及事件监控方法
EP3036633B1 (en) Cloud deployment infrastructure validation engine
CN108234170B (zh) 一种服务器集群的监控方法和装置
US7536370B2 (en) Inferential diagnosing engines for grid-based computing systems
CN100417081C (zh) 检查和修复网络配置的方法和系统
US8140565B2 (en) Autonomic information management system (IMS) mainframe database pointer error diagnostic data extraction
CN101321084A (zh) 在计算机环境中利用关联规则挖掘为计算实体产生配置规则的方法和装置
CN102937930A (zh) 应用程序监控系统及方法
US11706080B2 (en) Providing dynamic serviceability for software-defined data centers
CN101136799B (zh) 一种实现通讯设备故障集中告警处理的方法
WO2016188100A1 (zh) 信息系统故障场景信息收集方法及系统
US10747529B2 (en) Version management system and version management method
WO2019047070A1 (zh) 一种数据库维护方法及其系统
CN110063042B (zh) 一种数据库故障的响应方法及其终端
CN110971464A (zh) 一种适合灾备中心的运维自动化系统
CN113553242A (zh) 基于Zabbix的煤矿联网系统故障处置方法及系统
CN111782345A (zh) 容器云平台日志收集及分析告警方法
CN113570274A (zh) 一种资产全过程管理系统
JP3916232B2 (ja) ナレッジ型運用管理システム,方法およびプログラム
CN108809729A (zh) 一种分布式系统中ctdb服务的故障处理方法及装置
CN114661569B (zh) 用户行为数据动态埋点采集方法
WO2011051999A1 (ja) 情報処理装置及び情報処理装置の制御方法
US20120215492A1 (en) Methods & apparatus for remotely diagnosing grid-based computing systems
KR20030056301A (ko) 시스템 장애 통합관리방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant