CN107562601A - 一种告警方法及装置 - Google Patents

一种告警方法及装置 Download PDF

Info

Publication number
CN107562601A
CN107562601A CN201710819297.8A CN201710819297A CN107562601A CN 107562601 A CN107562601 A CN 107562601A CN 201710819297 A CN201710819297 A CN 201710819297A CN 107562601 A CN107562601 A CN 107562601A
Authority
CN
China
Prior art keywords
resource
alarm
operation information
information
abnormal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710819297.8A
Other languages
English (en)
Inventor
杨勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201710819297.8A priority Critical patent/CN107562601A/zh
Publication of CN107562601A publication Critical patent/CN107562601A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种告警方法及装置,包括:当云计算数据中心的第一资源出现异常时,获取第一资源的运行信息以及云计算数据中心中与第一资源关联的第二资源的运行信息;根据第一资源和第二资源的运行信息确定告警信息,该告警信息包括第一资源出现异常的原因。本发明实施例方便了用户根据告警信息直接地获知第一资源出现异常的原因,避免了用户根据自己的经验找出第一资源出现异常的原因,减少了用户的工作量。

Description

一种告警方法及装置
技术领域
本发明涉及云计算数据中心技术,尤指一种告警方法及装置。
背景技术
云计算数据中心是一种基于云计算架构的关于计算、存储及网络资源的松耦合,具有设备的虚拟化程度高、自动化管理程度高、绿色节能程度高的特点。设备虚拟化表现在对服务器、存储、网络、应用等的虚拟化,使用户可以按需调用各种资源;自动化管理表现在对物理服务器、虚拟服务器的管理,对相关业务的自动化流程管理、对客户服务的收费等自动化管理;绿色节能表现在云计算数据中心在各方面符合绿色节能标准,一般电源使用效率(Power Usage Effectiveness,PUE)的值不超过1.5。
在实际应用中,由于云计算数据中心往往会包含多种类型的设备、多个虚拟化系统、多种监控系统和多个业务系统等资源,各个资源之间关联密切,一个资源的运行异常将会引发多个资源出现异常,对每个出现异常的资源都会发出告警,以通知用户资源出现了异常,用户需要综合多个资源的告警,从中判断筛选出引发告警最根本的原因,这不仅导致了用户的工作效率低,还会导致用户的工作量很大。
发明内容
为了解决上述技术问题,本发明提供了一种告警方法及装置,能够确定包括资源出现异常的原因的告警信息,方便了用户直接、快速地获知资源出现异常的原因。
为了达到本发明目的,本发明提供了一种告警方法,包括:
当云计算数据中心的第一资源出现异常时,获取第一资源的运行信息以及云计算数据中心中与第一资源关联的第二资源的运行信息;
根据第一资源和第二资源的运行信息确定包括第一资源出现异常的原因的告警信息。
进一步地,所述确定告警信息之后,还包括:
从预先设置的数据库中查找与所述告警信息对应的告警说明和告警处理方案。
进一步地,所述告警说明包括以下之一或任意组合:告警级别、所述第一资源出现异常的原因的说明、被告警的资源、告警类型。
进一步地,所述获取第一资源的运行信息以及云计算数据中心中与第一资源关联的第二资源的运行信息,包括:
以所述第一资源最近一次开始出现异常的时间为基准,获取在该时间之前的第一时间段内的所述第一资源的运行信息和所述第二资源的运行信息,以及在该时间之后的第二时间段内的所述第一资源的运行信息和所述第二资源的运行信息。
进一步地,所述根据第一资源和第二资源的运行信息确定告警信息,包括:
从预先设置的告警模型库中获取与所述第一资源的运行信息和所述第二资源的运行信息匹配的告警模型,其中所述第一资源的运行信息以及所述第二资源的运行信息与该匹配的告警模型中的资源运行信息一致;
从预先设置的告警模型与告警信息的对应关系中查询该匹配的告警模型对应的告警信息,将查询到的告警信息作为所述确定的告警信息。
本发明提供了一种告警装置,包括:
获取模块,用于当云计算数据中心的第一资源出现异常时,获取第一资源的运行信息以及云计算数据中心中与第一资源关联的第二资源的运行信息;
确定模块,用于根据第一资源和第二资源的运行信息确定告警信息,该告警信息包括第一资源出现异常的原因。
进一步地,还包括:
查找模块,用于从预先设置的数据库中查找与所述告警信息对应的告警说明和告警处理方案。
进一步地,所述告警说明包括以下之一或任意组合:告警级别、所述第一资源出现异常的原因的说明、被告警的资源、告警类型。
进一步地,所述获取模块具体用于,
以所述第一资源最近一次开始出现异常的时间为基准,获取在该时间之前的第一时间段内的所述第一资源的运行信息和所述第二资源的运行信息,以及在该时间之后的第二时间段内的所述第一资源的运行信息和所述第二资源的运行信息。
进一步地,所述确定模块包括:
获取单元,用于从预先设置的告警模型库中获取与所述第一资源的运行信息和所述第二资源的运行信息匹配的告警模型,其中所述第一资源的运行信息以及所述第二资源的运行信息与该匹配的告警模型中的资源运行信息一致;
确定单元,用于从预先设置的告警模型与告警信息的对应关系中查询该匹配的告警模型对应的告警信息,将查询到的告警信息作为所述确定的告警信息。
本发明至少包括当云计算数据中心的第一资源出现异常时,获取第一资源的运行信息以及云计算数据中心中与第一资源关联的第二资源的运行信息;根据第一资源和第二资源的运行信息确定告警信息,该告警信息包括第一资源出现异常的原因。从本发明实施例可见,方便了用户根据告警信息直接地获知第一资源出现异常的原因,避免了用户根据经验利用所有异常的资源的告警找出第一资源出现异常的原因,不仅减少了用户的工作量,还降低了对用户的专业技能的要求。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
附图说明
附图用来提供对本发明技术方案的进一步理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本发明的技术方案,并不构成对本发明技术方案的限制。
图1为本发明实施例提供的一种告警方法的流程示意图;
图2为本发明实施例提供的另一种告警方法的流程示意图;
图3为本发明实施例提供的一种告警装置的结构示意图;
图4为本发明实施例提供的另一种告警装置的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下文中将结合附图对本发明的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。
在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行。并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本发明实施例提供一种告警方法,如图1所示,该告警方法包括:
步骤101、当云计算数据中心的第一资源出现异常时,获取第一资源的运行信息以及云计算数据中心中与第一资源关联的第二资源的运行信息。
云计算数据中心包括多个系统,例如,虚拟化系统、交换机系统、服务器系统和监控系统,每个系统包括多个资源,例如虚拟化系统中包括多个宿主机,交换机系统中包括多个交换机,服务器系统中包括多个服务器。步骤101包括:调用云计算数据中心的系统接口来获取系统中各资源的运行信息,将获取到的运行信息存储到数据库中,将各资源的运行信息与预先制定的判断标准进行比较,以判断各资源的运行是否异常。若判断出第一资源出现异常,则对第一资源生成一条告警,但该告警并不展示给用户,以及获取第一资源的运行信息和与第一资源关联的第二资源的运行信息。具体通过调用第一资源所在的系统接口来获取第一资源的运行信息,以及调用第二资源所在的系统接口来获取第二资源的运行信息。其中运行信息包括运行时的性能参数(例如可用内存的大小)、硬件运行情况(例如内部芯片是否出现故障)、业务运行情况(例如业务的应用程序是否正常运行)。
另外,在步骤101之前,预先建立云计算数据中心中的各资源之间的关联关系,从该预先建立的关联关系中找到与第一资源关联的第二资源。该关联关系包括:服务器和交换机之间的关联关系(例如A、B、C三个服务器与D交换机关联)、宿主机和交换机之间的关联关系、存储和宿主机之间的关联关系(例如E存储与F、G、H三个宿主机关联)。虚拟化系统中资源的关联关系从虚拟化系统中自动同步。
步骤102、根据第一资源和第二资源的运行信息确定告警信息,该告警信息包括第一资源出现异常的原因。
根据第一资源以及与第一资源关联的第二资源的运行信息,确定最终展示给用户的告警信息,由于该告警信息包括第一资源出现异常的原因,用户通过该告警信息能够直接地获知引发告警的原因,而非将所有异常的资源的告警都展示给用户供用户根据自己的经验分析出引发告警的原因,不仅减轻了用户的工作量、提高了工作效率,还降低了对用户在专业技术上的要求。告警信息中包括的第一资源出现异常的原因是第一资源出现异常的根本原因,根本原因指的是引起资源发生异常最本质、最深入的原因,也就是说是导致资源发生异常的因果关系链条的初始原因,根本原因用于描述因果关系链条之中最深的层次,在这种层次之上,通过合理有效地实施某种干预措施,从而解决了资源的异常。例如,服务器出现异常,与服务器相连的所有交换机也出现了异常,导致服务器和交换机出现异常的根本原因在于服务器的硬件出现故障,引发了服务器和与服务器相连的交换机都出现异常,如果更换服务器中出现故障的硬件,服务器和与服务器相连的交换机也都会恢复正常。
进一步地,在图1对应实施例的基础上,步骤102之后还包括:
从预先设置的数据库中查找与告警信息对应的告警说明和告警处理方案。
具体地,预先在数据库中存储对每条告警信息对应的告警说明和告警处理方案,在生成告警信息之后,从该数据库中查找与告警信息对应的告警说明,即将生成的告警信息转换成容易被用户理解的信息。即使告警信息是代码或者英文,用户根据告警说明可以很容易理解告警信息。以及在数据库中查找针对告警信息的告警处理方案,即给予了用户针对告警信息的解决方法,便于用户对告警进行处理,进一步地降低了对用户在专业技术上的要求。可以在将告警信息展示给用户的同时,将该告警说明和告警处理方案也展示给用户。
进一步地,告警说明包括以下之一或任意组合:告警级别、第一资源出现异常的原因的说明、被告警的资源、告警类型。
其中,告警级别包括:高级告警、中级告警和低级告警,告警级别越高,说明告警信息就越重要,越需要用户去重视该告警信息。通过对第一资源出现异常的原因进行说明,即将告警信息转换成容易被用户理解的信息,当告警信息是代码或者英文时,用户根据该说明可以很容易理解告警信息,当告警信息是中文时,用户根据该说明可以更加深入地、清楚地理解告警信息。对于被告警的资源,例如,服务器异常引发与服务器相连的交换机异常,被告警的资源包括服务器和交换机。告警类型包括硬件故障告警(例如交换机中的一个芯片损坏)、性能告警(例如服务器的可用内存小于5%)和业务告警(例如服务器的应用程序有漏洞)。例如,对交换机进行告警,交换机是第一资源,与交换机关联的第二资源是与交换机相连的3台服务器,交换机的芯片温度达到告警值,与交换机相连的3台服务器连接失败,告警级别是中级告警,告警原因是交换机出现故障,被告警的资源是交换机,告警类型硬件故障告警。
进一步地,在图1对应实施例的基础上,步骤101包括:
以第一资源最近一次开始出现异常的时间为基准,获取在该时间之前的第一时间段内的第一资源的运行信息和第二资源的运行信息,以及在该时间之后的第二时间段内的第一资源的运行信息和第二资源的运行信息。
具体地,当第一资源的运行开始出现异常时,调用第一资源所在的系统接口对第一资源的运行信息进行窗口观察,窗口观察指的是以第一资源最近一次开始出现异常的时间为基准,获取在该时间之前的第一时间段(例如该时间之前30分钟)内的第一资源和第二资源的运行信息以及在该时间之后的第二时间段(例如该时间之后的10分钟)内的第一资源和第二资源的运行信息。
进一步地,在图1对应实施例的基础上,步骤102包括:
从预先设置的告警模型库中获取与所述第一资源的运行信息和所述第二资源的运行信息匹配的告警模型,其中所述第一资源的运行信息以及所述第二资源的运行信息与该匹配的告警模型中的资源运行信息一致;从预先设置的告警模型与告警信息的对应关系中查询该匹配的告警模型对应的告警信息,将查询到的告警信息作为所述确定的告警信息。
具体地,可以根据技术人员的工作经验预先设置告警模型库,或者对样本数据进行学习,以设置告警模型库。告警模型库中可以包括告警模型与告警信息的对应关系,在该对应关系中多个告警模型和多个告警信息一一对应,每个告警模型包括资源运行信息。将第一资源的运行信息以及第二资源的运行信息与每个告警模型中的资源运行信息进行比较,若第一资源的运行信息以及第二资源的运行信息与其中一个告警模型中的资源运行信息一致,则确定第一资源的运行信息以及第二资源的运行信息与该告警模型匹配。例如,第一个告警模型中的资源运行信息包括:交换机的CPU出现异常、与交换机关联的服务器无法连接,该告警模型对应的告警信息为交换机的CPU故障,第二个告警模型中的资源运行信息包括:访问服务器的业务失败、与服务器关联的存储由于可用空间小于1%导致的异常,该告警模型对应的告警信息为服务器的存储写满。如果第一资源是交换机,第二资源是与交换机相关联的服务器,第一资源的运行信息包括交换机的CPU出现异常,第二资源的运行信息包括服务器无法连接,即第一资源和第二资源的运行信息与告警模型库中的第一条告警模型匹配,则展示给用户的告警信息为交换机的CPU故障。告警模型库中还可以包括误报模型,若从告警模型库中获取到的告警模型为误报模型,则不进行告警。例如,误报模型中的资源运行信息包括:服务器的基板管理控制器(Baseboard Management Controller,BMC,是成在服务器主板上的独立硬件芯片)失去连接,PING和安全外壳协议(Secure Shell,SSH)都正常,CPU内存磁盘利用率等也正常,若第一资源和第二资源的运行信息与该误报模型匹配,则说明该异常属于误报,没有告警信息,即不将第一资源的运行异常上报给用户。其中PING(Packet Internet Groper)是Windows、Unix和Linux系统下的一个命令,PING也属于一个通信协议,是TCP/IP协议的一部分。利用PING命令可以检查网络是否连通,可以很好地分析和判定网络故障。当从告警模型库中无法获取与第一资源的运行信息以及第二资源的运行信息匹配的告警模型,将第一资源的运行异常原样上报,以防止产生告警漏洞。在将第一资源的运行异常原样上报并确定该异常的原因后,可以根据第一资源的运行信息和第二资源的运行信息构建新的告警模型,并将该新的告警模型添加到告警模型库中,以对告警模型库进行更新和完善。
本发明实施例所提供的告警方法,当云计算数据中心的第一资源出现异常时,获取第一资源的运行信息以及云计算数据中心中与第一资源关联的第二资源的运行信息;根据第一资源和第二资源的运行信息确定告警信息,该告警信息包括第一资源出现异常的原因。从本发明实施例可见,方便了用户根据告警信息直接地获知第一资源出现异常的原因,避免了用户根据经验利用所有异常的资源的告警找出第一资源出现异常的原因,不仅减少了用户的工作量,还降低了对用户的专业技能的要求。
本发明实施例提供另一种告警方法,如图2所示,该告警方法包括:
步骤201、定时调用云计算数据中心的系统接口采集各资源的运行信息。
其中,通过适配对接系统接口以调用系统接口来采集各资源的运行信息,系统接口包括:虚拟化系统接口(包括性能查询接口和配置查询接口)、服务器的智能平台管理接口(Intelligent Platform Management Interface,IPM)、交换机的基于简单网络管理协议(Simple Network Management Protocol,SNMP)的接口、操作系统的基于简单网络管理协议的接口、柜机的路由器后台管理中心(Router Manager Center,RMC)的接口,Linux的基于安全外壳协议的接口和业务系统的基于超文本传输协议(HyperText TransferProtocol,HTTP)的接口。例如,通过虚拟化系统接口从宿主机中采集宿主机的运行信息,通过基于简单网络管理协议的接口从交换机中采集交换机的运行信息,通过智能平台管理接口从服务器中采集服务器的运行信息,通过基于安全外壳协议的接口从Linux主机中采集Linux主机的运行信息。
步骤202、将采集到的运行信息存储到数据库中。
步骤203、根据数据库中的运行信息确定资源的运行是否异常。
具体地,将各资源的运行信息与预先制定的判断标准进行比较,以判断各资源的运行是否异常。
步骤204、若第一资源出现异常,则获取第一资源的运行信息以及与第一资源关联的第二资源的运行信息。
具体地,以第一资源最近一次开始出现异常的时间为基准,获取在该时间之前的第一时间段内和在该时间之后的第二时间段内的第一资源的运行信息和第二资源的运行信息。
步骤205、若获取到的运行信息与告警模型库中的一告警模型匹配,则将该告警模型对应的告警信息作为待展示给用户的告警信息,该告警信息中包括第一资源异常的原因。
具体地,将告警模型中的资源运行信息与获取到的运行信息进行比较,若两者一致,则确定获取到的运行信息与该告警模型匹配。
步骤206、从预先设置的数据库中查找与告警信息对应的针对该告警信息的说明和告警处理方案。
可以说在该数据库中不仅存储有各资源的运行信息,还存储有告警信息的说明和告警处理方案,当然也可以在该数据库中存储告警模型库。由于该数据库不负责报表功能,因此该数据库数据量不会很大,选用传统关系型数据库即可,方便数据库接口与系统接口对接和关联关系查询。
步骤207、输出告警信息、该告警信息的说明和告警处理方案。
本发明实施例提供一种告警装置,如图3所示,该告警装置3包括:
获取模块31,用于当云计算数据中心的第一资源出现异常时,获取第一资源的运行信息以及云计算数据中心中与第一资源关联的第二资源的运行信息。
确定模块32,用于根据第一资源和第二资源的运行信息确定告警信息,该告警信息包括第一资源出现异常的原因。
进一步地,在图3对应实施例的基础上,本发明提供另一种告警装置,如图4所示,该告警装置3还包括:
查找模块33,用于从预先设置的数据库中查找与告警信息对应的告警说明和告警处理方案。
进一步地,告警说明包括以下之一或任意组合:告警级别、第一资源出现异常的原因的说明、被告警的资源、告警类型。
进一步地,图3或图4中的获取模块31具体用于,
以第一资源最近一次开始出现异常的时间为基准,获取在该时间之前的第一时间段内的第一资源的运行信息和第二资源的运行信息,以及在该时间之后的第二时间段内的第一资源的运行信息和第二资源的运行信息。
进一步地,在图4对应实施例的基础上,确定模块32包括:
获取单元321,用于从预先设置的告警模型库中获取与所述第一资源的运行信息和所述第二资源的运行信息匹配的告警模型,其中所述第一资源的运行信息以及所述第二资源的运行信息与该匹配的告警模型中的资源运行信息一致。
确定单元322,用于从预先设置的告警模型与告警信息的对应关系中查询该匹配的告警模型对应的告警信息,将查询到的告警信息作为所述确定的告警信息。
在实际应用中,获取模块31、确定模块32和查找模块33均可由告警装置3中的CPU、微处理器(Micro Processor Unit,MPU)、数字信号处理器(Digital Signal Processor,DSP)或现场可编程门阵列(Field Programmable Gate Array,FPGA)等实现。
本发明实施例所提供的告警装置,当云计算数据中心的第一资源出现异常时,获取第一资源的运行信息以及云计算数据中心中与第一资源关联的第二资源的运行信息;根据第一资源和第二资源的运行信息确定告警信息,该告警信息包括第一资源出现异常的原因。从本发明实施例可见,方便了用户根据告警信息直接地获知第一资源出现异常的原因,避免了用户根据经验利用所有异常的资源的告警找出第一资源出现异常的原因,不仅减少了用户的工作量,还降低了对用户的专业技能的要求。
本发明实施例提供又一种告警装置,该告警装置包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现的步骤包括:
当云计算数据中心的第一资源出现异常时,获取第一资源的运行信息以及云计算数据中心中与第一资源关联的第二资源的运行信息;
根据第一资源和第二资源的运行信息确定包括第一资源出现异常的原因的告警信息。
进一步地,上述处理器执行计算机程序时实现的步骤还包括:
从预先设置的数据库中查找与告警信息对应的告警说明和告警处理方案。
进一步地,告警说明包括以下之一或任意组合:告警级别、第一资源出现异常的原因的说明、被告警的资源、告警类型。
进一步地,上述处理器执行计算机程序时实现的步骤具体包括:
以第一资源最近一次开始出现异常的时间为基准,获取在该时间之前的第一时间段内的第一资源的运行信息和第二资源的运行信息,以及在该时间之后的第二时间段内的第一资源的运行信息和第二资源的运行信息。
进一步地,上述处理器执行计算机程序时实现的步骤具体包括:
从预先设置的告警模型库中获取与第一资源的运行信息和第二资源的运行信息匹配的告警模型,其中第一资源的运行信息以及第二资源的运行信息与该匹配的告警模型中的资源运行信息一致;
从预先设置的告警模型与告警信息的对应关系中查询该匹配的告警模型对应的告警信息,将查询到的告警信息作为确定的告警信息。
虽然本发明所揭露的实施方式如上,但所述的内容仅为便于理解本发明而采用的实施方式,并非用以限定本发明。任何本发明所属领域内的技术人员,在不脱离本发明所揭露的精神和范围的前提下,可以在实施的形式及细节上进行任何的修改与变化,但本发明的专利保护范围,仍须以所附的权利要求书所界定的范围为准。

Claims (10)

1.一种告警方法,其特征在于,包括:
当云计算数据中心的第一资源出现异常时,获取第一资源的运行信息以及云计算数据中心中与第一资源关联的第二资源的运行信息;
根据第一资源和第二资源的运行信息确定包括第一资源出现异常的原因的告警信息。
2.根据权利要求1所述的告警方法,其特征在于,所述确定告警信息之后,还包括:
从预先设置的数据库中查找与所述告警信息对应的告警说明和告警处理方案。
3.根据权利要求2所述的告警方法,其特征在于,所述告警说明包括以下之一或任意组合:告警级别、所述第一资源出现异常的原因的说明、被告警的资源、告警类型。
4.根据权利要求1或2所述的告警方法,其特征在于,所述获取第一资源的运行信息以及云计算数据中心中与第一资源关联的第二资源的运行信息,包括:
以所述第一资源最近一次开始出现异常的时间为基准,获取在该时间之前的第一时间段内的所述第一资源的运行信息和所述第二资源的运行信息,以及在该时间之后的第二时间段内的所述第一资源的运行信息和所述第二资源的运行信息。
5.根据权利要求1或2所述的告警方法,其特征在于,所述根据第一资源和第二资源的运行信息确定告警信息,包括:
从预先设置的告警模型库中获取与所述第一资源的运行信息和所述第二资源的运行信息匹配的告警模型,其中所述第一资源的运行信息以及所述第二资源的运行信息与该匹配的告警模型中的资源运行信息一致;
从预先设置的告警模型与告警信息的对应关系中查询该匹配的告警模型对应的告警信息,将查询到的告警信息作为所述确定的告警信息。
6.一种告警装置,其特征在于,包括:
获取模块,用于当云计算数据中心的第一资源出现异常时,获取第一资源的运行信息以及云计算数据中心中与第一资源关联的第二资源的运行信息;
确定模块,用于根据第一资源和第二资源的运行信息确定告警信息,该告警信息包括第一资源出现异常的原因。
7.根据权利要求6所述的告警装置,其特征在于,还包括:
查找模块,用于从预先设置的数据库中查找与所述告警信息对应的告警说明和告警处理方案。
8.根据权利要求7所述的告警装置,其特征在于,所述告警说明包括以下之一或任意组合:告警级别、所述第一资源出现异常的原因的说明、被告警的资源、告警类型。
9.根据权利要求6或7所述的告警装置,其特征在于,所述获取模块具体用于,
以所述第一资源最近一次开始出现异常的时间为基准,获取在该时间之前的第一时间段内的所述第一资源的运行信息和所述第二资源的运行信息,以及在该时间之后的第二时间段内的所述第一资源的运行信息和所述第二资源的运行信息。
10.根据权利要求6或7所述的告警装置,其特征在于,所述确定模块包括:
获取单元,用于从预先设置的告警模型库中获取与所述第一资源的运行信息和所述第二资源的运行信息匹配的告警模型,其中所述第一资源的运行信息以及所述第二资源的运行信息与该匹配的告警模型中的资源运行信息一致;
确定单元,用于从预先设置的告警模型与告警信息的对应关系中查询该匹配的告警模型对应的告警信息,将查询到的告警信息作为所述确定的告警信息。
CN201710819297.8A 2017-09-12 2017-09-12 一种告警方法及装置 Pending CN107562601A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710819297.8A CN107562601A (zh) 2017-09-12 2017-09-12 一种告警方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710819297.8A CN107562601A (zh) 2017-09-12 2017-09-12 一种告警方法及装置

Publications (1)

Publication Number Publication Date
CN107562601A true CN107562601A (zh) 2018-01-09

Family

ID=60980794

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710819297.8A Pending CN107562601A (zh) 2017-09-12 2017-09-12 一种告警方法及装置

Country Status (1)

Country Link
CN (1) CN107562601A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108920833A (zh) * 2018-07-03 2018-11-30 北京天华星航科技有限公司 基于云管理平台的分析方法及系统
CN109597746A (zh) * 2018-12-26 2019-04-09 荣科科技股份有限公司 故障分析方法及装置
CN110164101A (zh) * 2019-04-09 2019-08-23 烽台科技(北京)有限公司 一种处理报警信息的方法及设备
CN110502404A (zh) * 2019-07-22 2019-11-26 平安科技(深圳)有限公司 一种基于数据治理平台的预警处理方法及相关设备
CN110515701A (zh) * 2019-08-28 2019-11-29 杭州数梦工场科技有限公司 一种虚拟机的热迁移方法及装置
CN112583643A (zh) * 2020-12-14 2021-03-30 浪潮云信息技术股份公司 一种跨设备告警关联方法
CN113849378A (zh) * 2021-10-13 2021-12-28 京东科技信息技术有限公司 资源监测装置、系统、资源监测方法、电子及介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102664760A (zh) * 2012-04-28 2012-09-12 华为技术有限公司 一种通信系统中的告警方法、设备及通信系统
CN103378982A (zh) * 2012-04-17 2013-10-30 深圳市腾讯计算机系统有限公司 互联网业务运行监测方法和系统
CN104331354A (zh) * 2014-11-20 2015-02-04 普华基础软件股份有限公司 一种云计算的实时综合监控方法
CN104618161A (zh) * 2015-02-02 2015-05-13 浪潮软件股份有限公司 一种应用集群监控装置及方法
CN105243004A (zh) * 2015-09-15 2016-01-13 浪潮集团有限公司 一种故障资源检测方法及装置
CN106789366A (zh) * 2017-02-22 2017-05-31 郑州云海信息技术有限公司 一种业务层面的网络服务监控系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103378982A (zh) * 2012-04-17 2013-10-30 深圳市腾讯计算机系统有限公司 互联网业务运行监测方法和系统
CN102664760A (zh) * 2012-04-28 2012-09-12 华为技术有限公司 一种通信系统中的告警方法、设备及通信系统
CN104331354A (zh) * 2014-11-20 2015-02-04 普华基础软件股份有限公司 一种云计算的实时综合监控方法
CN104618161A (zh) * 2015-02-02 2015-05-13 浪潮软件股份有限公司 一种应用集群监控装置及方法
CN105243004A (zh) * 2015-09-15 2016-01-13 浪潮集团有限公司 一种故障资源检测方法及装置
CN106789366A (zh) * 2017-02-22 2017-05-31 郑州云海信息技术有限公司 一种业务层面的网络服务监控系统

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108920833A (zh) * 2018-07-03 2018-11-30 北京天华星航科技有限公司 基于云管理平台的分析方法及系统
CN108920833B (zh) * 2018-07-03 2019-08-06 北京天华星航科技有限公司 数据存储以及数据访问方法及系统
CN109597746A (zh) * 2018-12-26 2019-04-09 荣科科技股份有限公司 故障分析方法及装置
CN109597746B (zh) * 2018-12-26 2022-05-13 荣科科技股份有限公司 故障分析方法及装置
CN110164101A (zh) * 2019-04-09 2019-08-23 烽台科技(北京)有限公司 一种处理报警信息的方法及设备
CN110502404A (zh) * 2019-07-22 2019-11-26 平安科技(深圳)有限公司 一种基于数据治理平台的预警处理方法及相关设备
CN110515701A (zh) * 2019-08-28 2019-11-29 杭州数梦工场科技有限公司 一种虚拟机的热迁移方法及装置
CN110515701B (zh) * 2019-08-28 2020-11-06 杭州数梦工场科技有限公司 一种虚拟机的热迁移方法及装置
CN112583643A (zh) * 2020-12-14 2021-03-30 浪潮云信息技术股份公司 一种跨设备告警关联方法
CN113849378A (zh) * 2021-10-13 2021-12-28 京东科技信息技术有限公司 资源监测装置、系统、资源监测方法、电子及介质

Similar Documents

Publication Publication Date Title
CN107562601A (zh) 一种告警方法及装置
CN113407507B (zh) 告警类型关联规则的生成方法、装置及系统、存储介质
CN107995049B (zh) 电力安全区跨区同步故障监测方法、装置和系统
CN111221702A (zh) 基于日志分析的异常处理方法、系统、终端及介质
WO2018103453A1 (zh) 检测网络的方法和装置
CN107992398A (zh) 一种业务系统的监控方法和监控系统
CN109271793B (zh) 物联网云平台设备类别识别方法及系统
EP3255833B1 (en) Alarm information processing method, relevant device and system
CN112596975A (zh) 对网络设备进行监控处理的方法、系统、设备和存储介质
CN104243236A (zh) 一种监控系统运维告警数据分析的方法、系统及服务器
WO2015192664A1 (zh) 设备监控方法及装置
CN113051147A (zh) 一种数据库集群的监控方法、装置、系统、以及设备
WO2023071761A1 (zh) 一种异常定位方法及装置
CN110708316A (zh) 针对企业网络安全运营管理的方法以及系统架构
CN112491805A (zh) 一种应用于云平台的网络安全设备管理系统
CN112699007B (zh) 监控机器性能的方法、系统、网络设备及存储介质
CN111162950A (zh) 故障事件处理方法、装置及系统
CN108234189B (zh) 一种告警数据处理方法和装置
CN105373118A (zh) 一种智能设备数据采集方法
CN113792554A (zh) 一种基于知识图谱的变更影响评估方法和装置
CN110968479A (zh) 一种针对应用程序的业务级全链路监控方法及服务器
CN118014558A (zh) 故障处理的方法及装置、非易失性存储介质、电子设备
CN114374600A (zh) 一种基于大数据的网络运维方法、装置、设备及产品
CN106789395B (zh) 一种基于Web的分布式PDM系统数据传输监控方法
TW201303753A (zh) 應用於影像監控平台的分散式運算系統

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180109