CN104243236A - 一种监控系统运维告警数据分析的方法、系统及服务器 - Google Patents

一种监控系统运维告警数据分析的方法、系统及服务器 Download PDF

Info

Publication number
CN104243236A
CN104243236A CN201410472998.5A CN201410472998A CN104243236A CN 104243236 A CN104243236 A CN 104243236A CN 201410472998 A CN201410472998 A CN 201410472998A CN 104243236 A CN104243236 A CN 104243236A
Authority
CN
China
Prior art keywords
client
server
warning information
alarm
alarm level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410472998.5A
Other languages
English (en)
Other versions
CN104243236B (zh
Inventor
王旭勇
郭庆涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Power Supply Bureau Co Ltd
Original Assignee
Shenzhen Power Supply Bureau Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Power Supply Bureau Co Ltd filed Critical Shenzhen Power Supply Bureau Co Ltd
Priority to CN201410472998.5A priority Critical patent/CN104243236B/zh
Publication of CN104243236A publication Critical patent/CN104243236A/zh
Application granted granted Critical
Publication of CN104243236B publication Critical patent/CN104243236B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明提供一种监控系统运维告警数据分析的方法,所述方法包括获取各服务器及各客户端的配置信息,且设置多个参数对应其配置信息,得到IT构架拓扑模型;收集各服务器及各客户端的告警信息,并根据IT架构拓扑模型,将告警信息进行统一归类和标准化处理;获取标准化处理的各服务器及各客户端的告警信息中的告警级别,并根据预设的告警分析算法,重新确定在同一IT组件条件下,各服务器及各客户端对应的告警级别;将重新确定的各服务器及各客户端对应的告警级别推送至显示设备上显示。实施本发明实施例,能够满足管理简便性要求,降低数据处理复杂性,同时在处理告警事件的性能上满足实时性和准确性的要求,从而实现省时省力的目的。

Description

一种监控系统运维告警数据分析的方法、系统及服务器
技术领域
本发明涉及电力系统技术领域,尤其涉及一种监控系统运维告警数据分析的方法、系统及服务器。
背景技术
当前,电网IT基础环境下软硬件资源复杂繁多,监控手段也非常丰富,随之而来的是各种告警信息,往往很难决定一个既定时间会不会带来麻烦。通过人工数据分析方法,让管理员对每一条数据信息都进行心思缜密的严格分析从而判断当前的态势并不现实,因为大量的数据信息让人工来处理违背了管理简便性的初衷,其缺点在于:实际网络环境的复杂性使得管理难度及数据处理复杂性加大,且耗时耗力。
同时,随着IT规模的扩大和设备的增多,告警信息数据也呈级数递增趋势,处理数据上的激增给系统的告警事件分析能力带来了挑战,上述人工数据分析方法还存在着在处理告警事件的性能上无法满足实时性和准确性的问题。                                                   
发明内容
本发明实施例所要解决的技术问题在于,提供一种监控系统运维告警数据分析的方法、系统及服务器,能够满足管理简便性要求,降低数据处理复杂性,同时在处理告警事件的性能上满足实时性和准确性的要求,从而实现省时省力的目的。
为了解决上述技术问题,本发明实施例提供了一种监控系统运维告警数据分析的方法,其在多个客户端与多个服务器互联的网络中实现,所述方法包括:
通过拓扑扫描获取各服务器及各客户端的配置信息,且设置多个参数,并将所述各服务器及各客户端的配置信息增加至对应的参数中,得到IT构架拓扑模型;其中,所述多个参数包括IT服务、IT系统和IT组件,所述IT组件对应于所述配置信息中的操作系统类型、数据库类型和中间件类型,所述IT系统对应于所述配置信息中的主机名和IP地址,所述IT服务包括应用服务、数据库服务和其它服务; 
收集所述各服务器及各客户端的告警信息,并根据所述构建的IT架构拓扑模型,将所述收集到的各服务器及各客户端的告警信息进行统一归类和标准化处理;
获取所述标准化处理的各服务器及各客户端的告警信息中的告警级别,并根据预设的告警分析算法,重新确定在同一IT组件条件下,各服务器及各客户端对应的告警级别;
将所述重新确定的各服务器及各客户端对应的告警级别推送至显示设备上显示。
其中,所述收集所述各服务器及各客户端的告警信息,并根据所述构建的IT架构拓扑模型,将所述收集到的各服务器及各客户端的告警信息进行统一归类和标准化处理的具体步骤包括:
收集所述各服务器及各客户端的告警信息,并根据所述IT架构拓扑模型中的IT组件对所述收集到的各服务器及各客户端的告警信息进行统一归类;
将所述归类的各服务器及各客户端的告警信息中的字段均进行截取,形成多个独立的记录,并根据所述截取的任一字段设定规则进行过滤及分析,得到多个处理后的告警信息;
将所述得到的每一处理后的告警信息均增加唯一标识,并根据所述唯一标识对所述得到的每一处理后的告警信息进行压缩;以及
将所述压缩后的每一告警信息转换统一的格式,并进行统一处理和存储。
其中,所述将所述收集到的各服务器及各客户端的告警信息中的字段均进行截取,形成多个独立的记录,并根据所述截取的任一字段设定规则进行过滤及分析,得到多个处理后的告警信息的步骤进一步包括:
增加新的字段,根据所述增加的字段设立规则,将所述收集到的各服务器及各客户端的告警信息进行过滤及分析,得到所述多个处理后的告警信息。
其中,所述获取所述标准化处理的各服务器及各客户端的告警信息中的告警级别,并根据预设的告警分析算法,重新确定在同一IT组件条件下,各服务器及各客户端对应的告警级别的具体步骤包括:
获取所述标准化处理的各服务器及各客户端的告警信息中的告警级别,且将所述各服务器及各客户端均作为一节点,分别统计出同一IT组件条件下节点总数量以及每一节点对应的告警级别,并将所述统计的同一IT组件条件下每一节点对应的告警级别由高到低进行排序,得到各IT组件条件下对应的告警级别排序队列;其中,所述告警级别包括由高到低依序下降的严重、重大、警告和正常;
选择任一IT组件条件,根据公式                                               ,得到查找数值M,并根据所述得到的查找数值M在所选的IT组件条件下对应的告警级别排序队列中,确定第M个告警级别为所选IT组件条件下的告警级别;其中,N为所述统计的同一IT组件条件下节点总数量,P为预设的比例值,M为正整数,当M为小数时,则M取整后再加1。
其中,所述将所述重新确定的各服务器及各客户端对应的告警级别推送至显示设备上显示的步骤具体为:
基于Flex或HTML5技术将所述各服务器及各客户端,以及所述各服务器及各客户端重新确定的告警级别以Web图形方式展现至所述显示设备上。
其中,所述将所述重新确定的各服务器及各客户端对应的告警级别推送至显示设备上显示的步骤进一步包括:
响应用户对所述Web图形的操作,并触发所述Web图形获取鼠标悬浮信息以及告警详细信息钻取。
本发明实施例还提供了一种监控系统运维告警数据分析的系统,其在多个客户端与多个服务器互联的网络中实现,所述系统包括模型构造单元、告警数据标准化单元、告警数据分析单元和显示单元;其中,
所述模型构造单元,用于通过拓扑扫描获取各服务器及各客户端的配置信息,且设置多个参数,并将所述各服务器及各客户端的配置信息增加至对应的参数中,得到IT构架拓扑模型;其中,所述多个参数包括IT服务、IT系统和IT组件,所述IT组件对应于所述配置信息中的操作系统类型、数据库类型和中间件类型,所述IT系统对应于所述配置信息中的主机名和IP地址,所述IT服务包括应用服务、数据库服务和其它服务; 
所述告警数据标准化单元,用于收集所述各服务器及各客户端的告警信息,并根据所述构建的IT架构拓扑模型,将所述收集到的各服务器及各客户端的告警信息进行统一归类和标准化处理;
所述告警数据分析单元,用于获取所述标准化处理的各服务器及各客户端的告警信息中的告警级别,并根据预设的告警分析算法,重新确定在同一IT组件条件下,各服务器及各客户端对应的告警级别;
所述显示单元,用于将所述重新确定的各服务器及各客户端对应的告警级别推送至显示设备上显示。
其中,所述告警数据标准化单元包括:
归类模块,用于收集所述各服务器及各客户端的告警信息,并根据所述IT架构拓扑模型中的IT组件对所述收集到的各服务器及各客户端的告警信息进行统一归类;
过滤及分析模块,用于将所述归类的各服务器及各客户端的告警信息中的字段均进行截取,形成多个独立的记录,并根据所述截取的任一字段设定规则进行过滤及分析,得到多个处理后的告警信息;
标识模块,用于将所述得到的每一处理后的告警信息均增加唯一标识,并根据所述唯一标识对所述得到的每一处理后的告警信息进行压缩; 
标准化模块,用于将所述压缩后的每一告警信息转换统一的格式,并进行统一处理和存储。
其中,所述告警数据标准化单元还包括新增字段过滤及分析模块,所述新增字段过滤及分析模块用于增加新的字段,根据所述增加的字段设立规则,将所述收集到的各服务器及各客户端的告警信息进行过滤及分析,得到所述多个处理后的告警信息。
其中,所述告警数据分析单元包括:
统计模块,用于获取所述标准化处理的各服务器及各客户端的告警信息中的告警级别,且将所述各服务器及各客户端均作为一节点,分别统计出同一IT组件条件下节点总数量以及每一节点对应的告警级别,并将所述统计的同一IT组件条件下每一节点对应的告警级别由高到低进行排序,得到各IT组件条件下对应的告警级别排序队列;其中,所述告警级别包括由高到低依序下降的严重、重大、警告和正常;
告警级别确定模块,用于选择任一IT组件条件,根据公式,得到查找数值M,并根据所述得到的查找数值M在所选的IT组件条件下对应的告警级别排序队列中,确定第M个告警级别为所选IT组件条件下的告警级别;其中,N为所述统计的同一IT组件条件下节点总数量,P为预设的比例值,M为正整数,当M为小数时,则M取整后再加1。
本发明实施例还提供了一种服务器,包括前述的系统。
实施本发明实施例,具有如下有益效果:
1、在本发明实施例中,由于通过构建IT构架拓扑模型,从繁多、庞杂的告警事件中,经过分类、分组、关联等技术手段进行标准化处理,以及通过告警数据分析为管理者展现出可视化的分析结果,从而简化管理过程,为用户提供决策的依据,能够满足管理简便性要求,降低数据处理复杂性;
2、在本发明实施例中,由于通过预设的告警分析算法,重新确定在同一IT组件条件下,各服务器及各客户端对应的告警级别,在处理告警事件的性能上满足实时性和准确性的要求,从而实现省时省力的目的。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,根据这些附图获得其他的附图仍属于本发明的范畴。
图1为本发明实施例提供的监控系统运维告警数据分析的方法的流程图;
图2为本发明实施例提供的监控系统运维告警数据分析的系统的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述。
如图1所示,为本发明实施例提供的一种监控系统运维告警数据分析的方法,其在多个客户端与多个服务器互联的网络中实现,所述方法包括:
步骤S101、通过拓扑扫描获取各服务器及各客户端的配置信息,且设置多个参数,并将所述各服务器及各客户端的配置信息增加至对应的参数中,得到IT构架拓扑模型;其中,所述多个参数包括IT服务、IT系统和IT组件,所述IT组件对应于所述配置信息中的操作系统类型、数据库类型和中间件类型,所述IT系统对应于所述配置信息中的主机名和IP地址,所述IT服务包括应用服务、数据库服务和其它服务; 
具体过程为,IT服务、IT系统和IT组件的属性有
--IP地址:
--主机名:Hostname;
--类型:操作系统类(Unix、Linux、Windows)、数据库类(Oracle、DB2、SQL Server等)、中间件类(Web logic、WAS、Tomcat等);
--状态:通过颜色反映不同的告警级别;
---时间:告警更新时的时间。
其中,IT服务:支撑业务功能所需要的IT资源,ITIL((Information Technology Infrastructure Library, 信息技术基础架构库)把IT服务定义为“支撑业务流程的一个或多个IT系统”,例如:邮件服务、DNS服务、FTP服务、WEB服务和应用服务等。IT系统:IT系统是一组软件或硬件组件,提供特定功能用以支撑IT服务,例如:主机名、IP地址、数据库实例、WAS实例。IT组件:支撑一个或多个IT系统的逻辑或物理资产,例如:操作系统、数据库、中间件等。
步骤S102、收集所述各服务器及各客户端的告警信息,并根据所述构建的IT架构拓扑模型,将所述收集到的各服务器及各客户端的告警信息进行统一归类和标准化处理;
本发明实施例中,告警信息采集采用IBM Tivoli OMNIbus通过针对不同接口的探针实现,将事件进行收集、过滤和标准化,使不同来源的事件能够进行统一处理。OMNIbus具有丰富的接口探针,可针对1000多种不同的设备和网络环境利用不同方式如SOAP 、Syslog、SNMP Trap等搜集来自网元或网元管理系统的故障告警,同时提供多种灵活可定制的探针如Generic探针、Generic Log File探针等可对各种非标准接口或事件信息的采集汇总和分析。
SNMP Trap、SOAP、EIF和Socket协议是比较常用的事件采集方式。采集的事件以统一可定制的格式(Common Event Format)汇总到OMNIbus主动式内存数据库中进行智能化的压缩和关联,具体实现方式如下:
收集各服务器及各客户端的告警信息,并根据IT架构拓扑模型中的IT组件对收集到的各服务器及各客户端的告警信息进行统一归类;
将归类的各服务器及各客户端的告警信息中的字段均进行截取,形成多个独立的记录,并根据所述截取的任一字段设定规则进行过滤及分析,得到多个处理后的告警信息;当然,还进一步包括:增加新的字段,根据增加的字段设立规则,将收集到的各服务器及各客户端的告警信息进行过滤及分析,得到多个处理后的告警信息;
将得到的每一处理后的告警信息均增加唯一标识,并根据唯一标识对得到的每一处理后的告警信息进行压缩;以及
将压缩后的每一告警信息转换统一的格式,并进行统一处理和存储。
应当说明的是,探针在完成时间规范化之后,将所有告警实时传送给内存数据库,并由内存数据库对告警进行处理,而后进入统一告警管理平台完成压缩后的每一告警信息转换成统一的格式,并进行统一处理和存储。
步骤S103、获取所述标准化处理的各服务器及各客户端的告警信息中的告警级别,并根据预设的告警分析算法,重新确定在同一IT组件条件下,各服务器及各客户端对应的告警级别;
具体过程为,获取标准化处理的各服务器及各客户端的告警信息中的告警级别,且将各服务器及各客户端均作为一节点,分别统计出同一IT组件条件下节点总数量以及每一节点对应的告警级别,并将统计的同一IT组件条件下每一节点对应的告警级别由高到低进行排序,得到各IT组件条件下对应的告警级别排序队列;其中,告警级别包括由高到低依序下降的严重、重大、警告和正常;
选择任一IT组件条件,根据公式,得到查找数值M,并根据得到的查找数值M在所选的IT组件条件下对应的告警级别排序队列中,确定第M个告警级别为所选IT组件条件下的告警级别;其中,N为统计的同一IT组件条件下节点总数量,P为预设的比例值,M为正整数,当M为小数时,则M取整后再加1。
作为一个例子,告警的级别定义为【重大, 严重, 警告, 正常】四级,级别从高至低,其中“正常”为最低级,即正常状态。在同一IT组件条件下,如Oracle数据库,对所有节点的当前告警进行从高至低的排序,对应位置编号为1至n,n为节点的总数,告警值M为n*p。如果该值为小数那么取大于该数的最小整数,该数就是告警位置编号。
举例说明:有4个节点,其n=4;假设认为告警节点超过35%就会影响到整个集群,p=35%;某时刻4个节点告警排序后为【重大、严重、正常、正常】,对应的位置为1,2,3,4
计算过程:M=n*p=4*35%=1.4<2,得到位置值M为2,从【重大、严重、正常、正常】 中得到的告警是“严重”,即集群当前的状态是“严重”。 
假设认为告警节点超过55%就会影响到整个集群,p=55%,M=n*p=4*35%=2.2<3,得到位置值M为3,集群当前的状态是“正常”。
步骤S104、将所述重新确定的各服务器及各客户端对应的告警级别推送至显示设备上显示。
具体为,基于Flex或HTML5技术将各服务器及各客户端,以及各服务器及各客户端重新确定的告警级别以Web图形方式展现至显示设备上。当然,进一步包括:响应用户对Web图形的操作,并触发Web图形获取鼠标悬浮信息以及告警详细信息钻取。
如图2所示,本发明实施例还提供一种监控系统运维告警数据分析的系统,其在多个客户端与多个服务器互联的网络中实现,所述系统包括模型构造单元210、告警数据标准化单元220、告警数据分析单元230和显示单元240;其中,
所述模型构造单元210,用于通过拓扑扫描获取各服务器及各客户端的配置信息,且设置多个参数,并将所述各服务器及各客户端的配置信息增加至对应的参数中,得到IT构架拓扑模型;其中,所述多个参数包括IT服务、IT系统和IT组件,所述IT组件对应于所述配置信息中的操作系统类型、数据库类型和中间件类型,所述IT系统对应于所述配置信息中的主机名和IP地址,所述IT服务包括应用服务、数据库服务和其它服务; 
所述告警数据标准化单元220,用于收集所述各服务器及各客户端的告警信息,并根据所述构建的IT架构拓扑模型,将所述收集到的各服务器及各客户端的告警信息进行统一归类和标准化处理;
所述告警数据分析单元230,用于获取所述标准化处理的各服务器及各客户端的告警信息中的告警级别,并根据预设的告警分析算法,重新确定在同一IT组件条件下,各服务器及各客户端对应的告警级别;
所述显示单元240,用于将所述重新确定的各服务器及各客户端对应的告警级别推送至显示设备上显示。
其中,告警数据标准化单元220包括:
归类模块2201,用于收集所述各服务器及各客户端的告警信息,并根据所述IT架构拓扑模型中的IT组件对所述收集到的各服务器及各客户端的告警信息进行统一归类;
过滤及分析模块2202,用于将所述归类的各服务器及各客户端的告警信息中的字段均进行截取,形成多个独立的记录,并根据所述截取的任一字段设定规则进行过滤及分析,得到多个处理后的告警信息;
标识模块2203,用于将所述得到的每一处理后的告警信息均增加唯一标识,并根据所述唯一标识对所述得到的每一处理后的告警信息进行压缩; 
标准化模块2204,用于将所述压缩后的每一告警信息转换统一的格式,并进行统一处理和存储。
其中,告警数据标准化单元220还包括新增字段过滤及分析模块2205,新增字段过滤及分析模块2205用于增加新的字段,根据所述增加的字段设立规则,将所述收集到的各服务器及各客户端的告警信息进行过滤及分析,得到所述多个处理后的告警信息。
其中,告警数据分析单元230包括:
统计模块2301,用于获取所述标准化处理的各服务器及各客户端的告警信息中的告警级别,且将所述各服务器及各客户端均作为一节点,分别统计出同一IT组件条件下节点总数量以及每一节点对应的告警级别,并将所述统计的同一IT组件条件下每一节点对应的告警级别由高到低进行排序,得到各IT组件条件下对应的告警级别排序队列;其中,所述告警级别包括由高到低依序下降的严重、重大、警告和正常;
告警级别确定模块2302,用于选择任一IT组件条件,根据公式,得到查找数值M,并根据所述得到的查找数值M在所选的IT组件条件下对应的告警级别排序队列中,确定第M个告警级别为所选IT组件条件下的告警级别;其中,N为所述统计的同一IT组件条件下节点总数量,P为预设的比例值,M为正整数,当M为小数时,则M取整后再加1。
本发明实施例还提供一种服务器,包括前述的系统,具体请参见图2所示的细节,在此不再赘述。
实施本发明实施例,具有如下有益效果:
1、在本发明实施例中,由于通过构建IT构架拓扑模型,从繁多、庞杂的告警事件中,经过分类、分组、关联等技术手段进行标准化处理,以及通过告警数据分析为管理者展现出可视化的分析结果,从而简化管理过程,为用户提供决策的依据,能够满足管理简便性要求,降低数据处理复杂性;
2、在本发明实施例中,由于通过预设的告警分析算法,重新确定在同一IT组件条件下,各服务器及各客户端对应的告警级别,在处理告警事件的性能上满足实时性和准确性的要求,从而实现省时省力的目的。
值得注意的是,上述系统实施例中,所包括的各个系统单元只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以存储于一计算机可读取存储介质中,所述的存储介质,如ROM/RAM、磁盘、光盘等。
以上所揭露的仅为本发明一种较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。

Claims (11)

1.一种监控系统运维告警数据分析的方法,其特征在于,其在多个客户端与多个服务器互联的网络中实现,所述方法包括:
通过拓扑扫描获取各服务器及各客户端的配置信息,且设置多个参数,并将所述各服务器及各客户端的配置信息增加至对应的参数中,得到IT构架拓扑模型;其中,所述多个参数包括IT服务、IT系统和IT组件,所述IT组件对应于所述配置信息中的操作系统类型、数据库类型和中间件类型,所述IT系统对应于所述配置信息中的主机名和IP地址,所述IT服务包括应用服务、数据库服务和其它服务; 
收集所述各服务器及各客户端的告警信息,并根据所述构建的IT架构拓扑模型,将所述收集到的各服务器及各客户端的告警信息进行统一归类和标准化处理;
获取所述标准化处理的各服务器及各客户端的告警信息中的告警级别,并根据预设的告警分析算法,重新确定在同一IT组件条件下,各服务器及各客户端对应的告警级别;
将所述重新确定的各服务器及各客户端对应的告警级别推送至显示设备上显示。
2.如权利要求1所述的方法,其特征在于,所述收集所述各服务器及各客户端的告警信息,并根据所述构建的IT架构拓扑模型,将所述收集到的各服务器及各客户端的告警信息进行统一归类和标准化处理的具体步骤包括:
收集所述各服务器及各客户端的告警信息,并根据所述IT架构拓扑模型中的IT组件对所述收集到的各服务器及各客户端的告警信息进行统一归类;
将所述归类的各服务器及各客户端的告警信息中的字段均进行截取,形成多个独立的记录,并根据所述截取的任一字段设定规则进行过滤及分析,得到多个处理后的告警信息;
将所述得到的每一处理后的告警信息均增加唯一标识,并根据所述唯一标识对所述得到的每一处理后的告警信息进行压缩;以及
将所述压缩后的每一告警信息转换统一的格式,并进行统一处理和存储。
3.如权利要求2所述的方法,其特征在于,所述将所述收集到的各服务器及各客户端的告警信息中的字段均进行截取,形成多个独立的记录,并根据所述截取的任一字段设定规则进行过滤及分析,得到多个处理后的告警信息的步骤进一步包括:
增加新的字段,根据所述增加的字段设立规则,将所述收集到的各服务器及各客户端的告警信息进行过滤及分析,得到所述多个处理后的告警信息。
4.如权利要求1所述的方法,其特征在于,所述获取所述标准化处理的各服务器及各客户端的告警信息中的告警级别,并根据预设的告警分析算法,重新确定在同一IT组件条件下,各服务器及各客户端对应的告警级别的具体步骤包括:
获取所述标准化处理的各服务器及各客户端的告警信息中的告警级别,且将所述各服务器及各客户端均作为一节点,分别统计出同一IT组件条件下节点总数量以及每一节点对应的告警级别,并将所述统计的同一IT组件条件下每一节点对应的告警级别由高到低进行排序,得到各IT组件条件下对应的告警级别排序队列;其中,所述告警级别包括由高到低依序下降的严重、重大、警告和正常;
选择任一IT组件条件,根据公式                                               ,得到查找数值M,并根据所述得到的查找数值M在所选的IT组件条件下对应的告警级别排序队列中,确定第M个告警级别为所选IT组件条件下的告警级别;其中,N为所述统计的同一IT组件条件下节点总数量,P为预设的比例值,M为正整数,当M为小数时,则M取整后再加1。
5.如权利要求1所述的方法,其特征在于,所述将所述重新确定的各服务器及各客户端对应的告警级别推送至显示设备上显示的步骤具体为:
基于Flex或HTML5技术将所述各服务器及各客户端,以及所述各服务器及各客户端重新确定的告警级别以Web图形方式展现至所述显示设备上。
6.如权利要求5所述的方法,其特征在于,所述将所述重新确定的各服务器及各客户端对应的告警级别推送至显示设备上显示的步骤进一步包括:
响应用户对所述Web图形的操作,并触发所述Web图形获取鼠标悬浮信息以及告警详细信息钻取。
7.一种监控系统运维告警数据分析的系统,其特征在于,其在多个客户端与多个服务器互联的网络中实现,所述系统包括模型构造单元、告警数据标准化单元、告警数据分析单元和显示单元;其中,
所述模型构造单元,用于通过拓扑扫描获取各服务器及各客户端的配置信息,且设置多个参数,并将所述各服务器及各客户端的配置信息增加至对应的参数中,得到IT构架拓扑模型;其中,所述多个参数包括IT服务、IT系统和IT组件,所述IT组件对应于所述配置信息中的操作系统类型、数据库类型和中间件类型,所述IT系统对应于所述配置信息中的主机名和IP地址,所述IT服务包括应用服务、数据库服务和其它服务; 
所述告警数据标准化单元,用于收集所述各服务器及各客户端的告警信息,并根据所述构建的IT架构拓扑模型,将所述收集到的各服务器及各客户端的告警信息进行统一归类和标准化处理;
所述告警数据分析单元,用于获取所述标准化处理的各服务器及各客户端的告警信息中的告警级别,并根据预设的告警分析算法,重新确定在同一IT组件条件下,各服务器及各客户端对应的告警级别;
所述显示单元,用于将所述重新确定的各服务器及各客户端对应的告警级别推送至显示设备上显示。
8.如权利要求7所述的系统,其特征在于,所述告警数据标准化单元包括:
归类模块,用于收集所述各服务器及各客户端的告警信息,并根据所述IT架构拓扑模型中的IT组件对所述收集到的各服务器及各客户端的告警信息进行统一归类;
过滤及分析模块,用于将所述归类的各服务器及各客户端的告警信息中的字段均进行截取,形成多个独立的记录,并根据所述截取的任一字段设定规则进行过滤及分析,得到多个处理后的告警信息;
标识模块,用于将所述得到的每一处理后的告警信息均增加唯一标识,并根据所述唯一标识对所述得到的每一处理后的告警信息进行压缩; 
标准化模块,用于将所述压缩后的每一告警信息转换统一的格式,并进行统一处理和存储。
9.如权利要求8所述的系统,其特征在于,所述告警数据标准化单元还包括新增字段过滤及分析模块,所述新增字段过滤及分析模块用于增加新的字段,根据所述增加的字段设立规则,将所述收集到的各服务器及各客户端的告警信息进行过滤及分析,得到所述多个处理后的告警信息。
10.如权利要求7所述的系统,其特征在于,所述告警数据分析单元包括:
统计模块,用于获取所述标准化处理的各服务器及各客户端的告警信息中的告警级别,且将所述各服务器及各客户端均作为一节点,分别统计出同一IT组件条件下节点总数量以及每一节点对应的告警级别,并将所述统计的同一IT组件条件下每一节点对应的告警级别由高到低进行排序,得到各IT组件条件下对应的告警级别排序队列;其中,所述告警级别包括由高到低依序下降的严重、重大、警告和正常;
告警级别确定模块,用于选择任一IT组件条件,根据公式,得到查找数值M,并根据所述得到的查找数值M在所选的IT组件条件下对应的告警级别排序队列中,确定第M个告警级别为所选IT组件条件下的告警级别;其中,N为所述统计的同一IT组件条件下节点总数量,P为预设的比例值,M为正整数,当M为小数时,则M取整后再加1。
11.一种服务器,其特征在于,包括如权利要求7至10中任一项所述的系统。
CN201410472998.5A 2014-09-17 2014-09-17 一种监控系统运维告警数据分析的方法、系统及服务器 Active CN104243236B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410472998.5A CN104243236B (zh) 2014-09-17 2014-09-17 一种监控系统运维告警数据分析的方法、系统及服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410472998.5A CN104243236B (zh) 2014-09-17 2014-09-17 一种监控系统运维告警数据分析的方法、系统及服务器

Publications (2)

Publication Number Publication Date
CN104243236A true CN104243236A (zh) 2014-12-24
CN104243236B CN104243236B (zh) 2017-10-03

Family

ID=52230633

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410472998.5A Active CN104243236B (zh) 2014-09-17 2014-09-17 一种监控系统运维告警数据分析的方法、系统及服务器

Country Status (1)

Country Link
CN (1) CN104243236B (zh)

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104636243A (zh) * 2015-02-13 2015-05-20 北京北交信控科技有限公司 Gsm-r网络测试日志数据可视化回放与统计分析系统及方法
CN105843878A (zh) * 2016-03-17 2016-08-10 杭州优云软件有限公司 一种it系统事件标准化实现方法
CN107800556A (zh) * 2016-09-06 2018-03-13 中兴通讯股份有限公司 界面生成系统、钻取服务层装置、数据发送方法
CN108073611A (zh) * 2016-11-14 2018-05-25 国网江苏省电力公司镇江供电公司 一种告警信息的过滤方法及装置
CN108880852A (zh) * 2017-11-22 2018-11-23 北京视联动力国际信息技术有限公司 一种设备故障的处理方法和系统
CN109889373A (zh) * 2019-01-22 2019-06-14 视联动力信息技术股份有限公司 一种告警信息的传输方法、装置和系统
CN109934759A (zh) * 2019-03-20 2019-06-25 中国铁道科学研究院集团有限公司 一种机车监测数据分析方法及系统
CN110557283A (zh) * 2019-08-29 2019-12-10 海南电网有限责任公司 配电通信网管控方法、服务器、系统及可读存储介质
CN110601885A (zh) * 2019-09-06 2019-12-20 贵州省广播电视信息网络股份有限公司 一种人工智能公有云异常指示报警系统
CN111028121A (zh) * 2019-12-25 2020-04-17 中国银行股份有限公司 报警信息的处理方法及装置
CN111181785A (zh) * 2019-12-30 2020-05-19 上海汇付数据服务有限公司 基于反馈式链路的监控方法和装置
CN111245669A (zh) * 2019-12-09 2020-06-05 微神马科技(大连)有限公司 一种基于Zabbix和Prometheus的监控系统和方法
CN113821412A (zh) * 2021-09-26 2021-12-21 中国建设银行股份有限公司 一种设备运维管理方法及装置
CN114070719A (zh) * 2020-11-03 2022-02-18 北京市天元网络技术股份有限公司 一种告警业务处理方法及系统
CN114501502A (zh) * 2022-02-10 2022-05-13 中盈优创资讯科技有限公司 一种5g核心网设备告警归一化方法及装置
CN114826874A (zh) * 2022-04-24 2022-07-29 上海碳泽信息科技有限公司 一种安全告警日志自动化处置方法、系统及存储介质
CN114840219A (zh) * 2022-07-06 2022-08-02 湖南傲思软件股份有限公司 分布式事件处理系统
CN115225453A (zh) * 2022-06-09 2022-10-21 广东省智能网联汽车创新中心有限公司 一种车辆告警管理方法与系统
CN116915509A (zh) * 2023-09-12 2023-10-20 北京微步在线科技有限公司 一种流量告警处理方法、装置、计算机设备及存储介质
CN117527523A (zh) * 2023-11-23 2024-02-06 广东堡塔安全技术有限公司 一种基于云计算的服务器安全监控系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102717815A (zh) * 2012-05-15 2012-10-10 江苏物泰信息科技有限公司 一种特种车智能告警方法及其告警系统
WO2012155682A1 (zh) * 2011-06-30 2012-11-22 中兴通讯股份有限公司 一种无源光网络终端设备告警管理的方法和装置
CN202798762U (zh) * 2012-09-10 2013-03-13 中国电力科学研究院 用于电力通信故障信息分析告警装置
CN103178991A (zh) * 2011-12-21 2013-06-26 中国移动通信集团黑龙江有限公司 一种多网络关系分析的方法和系统
CN103326874A (zh) * 2012-03-22 2013-09-25 西门子公司 告警管理系统及方法
CN103700031A (zh) * 2013-12-19 2014-04-02 国家电网公司 调控一体化模式下的电力告警信息发布方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012155682A1 (zh) * 2011-06-30 2012-11-22 中兴通讯股份有限公司 一种无源光网络终端设备告警管理的方法和装置
CN103178991A (zh) * 2011-12-21 2013-06-26 中国移动通信集团黑龙江有限公司 一种多网络关系分析的方法和系统
CN103326874A (zh) * 2012-03-22 2013-09-25 西门子公司 告警管理系统及方法
CN102717815A (zh) * 2012-05-15 2012-10-10 江苏物泰信息科技有限公司 一种特种车智能告警方法及其告警系统
CN202798762U (zh) * 2012-09-10 2013-03-13 中国电力科学研究院 用于电力通信故障信息分析告警装置
CN103700031A (zh) * 2013-12-19 2014-04-02 国家电网公司 调控一体化模式下的电力告警信息发布方法

Cited By (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104636243A (zh) * 2015-02-13 2015-05-20 北京北交信控科技有限公司 Gsm-r网络测试日志数据可视化回放与统计分析系统及方法
CN105843878A (zh) * 2016-03-17 2016-08-10 杭州优云软件有限公司 一种it系统事件标准化实现方法
CN105843878B (zh) * 2016-03-17 2019-04-26 杭州优云软件有限公司 一种it系统事件标准化实现方法
CN107800556A (zh) * 2016-09-06 2018-03-13 中兴通讯股份有限公司 界面生成系统、钻取服务层装置、数据发送方法
CN107800556B (zh) * 2016-09-06 2022-04-29 中兴通讯股份有限公司 界面生成系统、钻取服务层装置、数据发送方法
CN108073611A (zh) * 2016-11-14 2018-05-25 国网江苏省电力公司镇江供电公司 一种告警信息的过滤方法及装置
CN108880852A (zh) * 2017-11-22 2018-11-23 北京视联动力国际信息技术有限公司 一种设备故障的处理方法和系统
CN109889373A (zh) * 2019-01-22 2019-06-14 视联动力信息技术股份有限公司 一种告警信息的传输方法、装置和系统
CN109934759A (zh) * 2019-03-20 2019-06-25 中国铁道科学研究院集团有限公司 一种机车监测数据分析方法及系统
CN110557283A (zh) * 2019-08-29 2019-12-10 海南电网有限责任公司 配电通信网管控方法、服务器、系统及可读存储介质
CN110557283B (zh) * 2019-08-29 2022-06-17 海南电网有限责任公司 配电通信网管控方法、服务器、系统及可读存储介质
CN110601885A (zh) * 2019-09-06 2019-12-20 贵州省广播电视信息网络股份有限公司 一种人工智能公有云异常指示报警系统
CN111245669A (zh) * 2019-12-09 2020-06-05 微神马科技(大连)有限公司 一种基于Zabbix和Prometheus的监控系统和方法
CN111028121A (zh) * 2019-12-25 2020-04-17 中国银行股份有限公司 报警信息的处理方法及装置
CN111028121B (zh) * 2019-12-25 2023-06-06 中国银行股份有限公司 报警信息的处理方法及装置
CN111181785A (zh) * 2019-12-30 2020-05-19 上海汇付数据服务有限公司 基于反馈式链路的监控方法和装置
CN114070719A (zh) * 2020-11-03 2022-02-18 北京市天元网络技术股份有限公司 一种告警业务处理方法及系统
CN114070719B (zh) * 2020-11-03 2024-03-29 北京市天元网络技术股份有限公司 一种告警业务处理方法及系统
CN113821412A (zh) * 2021-09-26 2021-12-21 中国建设银行股份有限公司 一种设备运维管理方法及装置
CN114501502A (zh) * 2022-02-10 2022-05-13 中盈优创资讯科技有限公司 一种5g核心网设备告警归一化方法及装置
CN114501502B (zh) * 2022-02-10 2024-01-05 中盈优创资讯科技有限公司 一种5g核心网设备告警归一化方法及装置
CN114826874A (zh) * 2022-04-24 2022-07-29 上海碳泽信息科技有限公司 一种安全告警日志自动化处置方法、系统及存储介质
CN115225453B (zh) * 2022-06-09 2024-03-01 广东省智能网联汽车创新中心有限公司 一种车辆告警管理方法与系统
CN115225453A (zh) * 2022-06-09 2022-10-21 广东省智能网联汽车创新中心有限公司 一种车辆告警管理方法与系统
CN114840219A (zh) * 2022-07-06 2022-08-02 湖南傲思软件股份有限公司 分布式事件处理系统
CN116915509A (zh) * 2023-09-12 2023-10-20 北京微步在线科技有限公司 一种流量告警处理方法、装置、计算机设备及存储介质
CN117527523A (zh) * 2023-11-23 2024-02-06 广东堡塔安全技术有限公司 一种基于云计算的服务器安全监控系统

Also Published As

Publication number Publication date
CN104243236B (zh) 2017-10-03

Similar Documents

Publication Publication Date Title
CN104243236A (zh) 一种监控系统运维告警数据分析的方法、系统及服务器
Rettig et al. Online anomaly detection over big data streams
CN110855473B (zh) 一种监控方法、装置、服务器及存储介质
CN110493348B (zh) 一种基于物联网的智能监控报警系统
CN107577588B (zh) 一种海量日志数据智能运维系统
CN104407964B (zh) 一种基于数据中心的集中监控系统及方法
CN106371986A (zh) 一种日志处理运维监控系统
CN108039959B (zh) 一种数据的态势感知方法、系统及相关装置
CN109902072A (zh) 一种日志处理系统
US20160359701A1 (en) Parallel coordinate charts for flow exploration
KR20210019564A (ko) 운영 유지 시스템 및 방법
CN110650038B (zh) 面向多类监管对象的安全事件日志采集处理方法和系统
CN111885012A (zh) 基于多种网络设备信息采集的网络态势感知方法及系统
CN103425750A (zh) 一种跨平台跨应用的日志收集系统及其收集管理方法
CN102567531B (zh) 一种通用的轻量级数据库状态监控方法
CN108809701A (zh) 一种数据中心智慧数据平台及其实现方法
CN111259073A (zh) 基于日志、流量和业务访问的业务系统运行状态智能研判系统
CN113505048A (zh) 基于应用系统画像的统一监控平台及实现方法
CN104574219A (zh) 电网业务信息系统运行工况的监测预警方法及系统
CN114244676A (zh) 一种智能it综合网关系统
CN105227405A (zh) 监控方法及系统
CN104637265A (zh) 调度自动化多级一体化智能值班报警系统
CN106210124A (zh) 一种统一的云数据中心监控系统
CN102801548B (zh) 一种智能预警的方法、装置及信息系统
Wang et al. An algorithm for mining of association rules for the information communication network alarms based on swarm intelligence

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant