CN108763038A - 告警数据的管理方法、装置、计算机设备及存储介质 - Google Patents

告警数据的管理方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN108763038A
CN108763038A CN201810897093.0A CN201810897093A CN108763038A CN 108763038 A CN108763038 A CN 108763038A CN 201810897093 A CN201810897093 A CN 201810897093A CN 108763038 A CN108763038 A CN 108763038A
Authority
CN
China
Prior art keywords
data
alarm
status
processed result
alarm data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810897093.0A
Other languages
English (en)
Other versions
CN108763038B (zh
Inventor
李嘉勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201810897093.0A priority Critical patent/CN108763038B/zh
Priority to PCT/CN2018/108271 priority patent/WO2020029407A1/zh
Publication of CN108763038A publication Critical patent/CN108763038A/zh
Application granted granted Critical
Publication of CN108763038B publication Critical patent/CN108763038B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/327Alarm or error message display

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)
  • Alarm Systems (AREA)

Abstract

本申请实施例公开了一种告警数据的管理方法、装置、计算机设备及存储介质,其中方法包括:定时轮询服务器以采集服务器的状态数据,状态数据包括标识位信息;在判断出状态数据为有效数据时,根据标识位信息确定状态数据中的告警数据,将告警数据保存在第一预设数据表中;定时轮询第一预设数据表获取告警数据,采用预设处理规则处理告警数据以得到数据处理结果,将数据处理结果保存至第二预设数据表中;定时轮询第二预设数据表以获取数据处理结果,根据数据处理结果生成待处理事件,将待处理事件发送至终端以使终端显示待处理事件。该方法不仅可以提供及时准确的报警,还可以对告警信息进行追溯分析。

Description

告警数据的管理方法、装置、计算机设备及存储介质
技术领域
本申请涉及互联网技术领域,尤其涉及一种告警数据的管理方法、装置、计算机设备及存储介质。
背景技术
目前,随着互联网技术的发展,对服务器集群多采用管理平台进行集中管理,但是现有的服务器的告警数据的处理与展示通常有以下问题:页面展示的告警信息比较模糊,比如只展示哪些服务器发生故障,不能清晰清晰地展示出故障的原因;对于已恢复的告警没有提供追溯功能,不能清楚地看到告警恢复的具体时间,没对恢复的告警数据进行二次利用。因此现有的服务器的告警信数据的处理方式,不能满足用户的需求。因此,有必要提供一种告警数据的管理方法以解决上述问题。
发明内容
本申请提供了一种告警数据的管理方法、装置、计算机设备及存储介质,旨在提供及时准确的告警信息。
本申请提供了一种告警数据的管理方法,其包括:
定时轮询服务器集群的服务器以采集所述服务器的状态数据,所述状态数据包括标识位信息;
判断所述状态数据是否为有效数据;
若所述状态数据为有效数据,根据所述标识位信息确定所述状态数据中的告警数据,将所述告警数据保存在第一预设数据表中;
定时轮询所述第一预设数据表获取所述告警数据,采用预设处理规则处理所述告警数据以得到数据处理结果,将所述数据处理结果保存至第二预设数据表中;
定时轮询所述第二预设数据表以获取所述数据处理结果,根据所述数据处理结果生成待处理事件,将所述待处理事件发送至终端以使所述终端显示所述待处理事件。
本申请提供了一种告警数据的管理装置,其包括:
数据采集单元,用于定时轮询服务器集群的服务器以采集所述服务器的状态数据,所述状态数据包括标识位信息;
数据判断单元,用于判断所述状态数据是否为有效数据;
数据确定单元,用于若所述状态数据为有效数据,根据所述标识位信息确定所述状态数据中的告警数据,将所述告警数据保存在第一预设数据表中;
数据处理单元,用于定时轮询所述第一预设数据表获取所述告警数据,采用预设处理规则处理所述告警数据以得到数据处理结果,将所述数据处理结果保存至第二预设数据表中;
事件生成单元,用于定时轮询所述第二预设数据表以获取所述数据处理结果,根据所述数据处理结果生成待处理事件,将所述待处理事件发送至终端以使所述终端显示所述待处理事件。
本申请还提供了一种计算机设备,其包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现本申请提供的任意一项所述的告警数据的管理方法的步骤。
本申请还提供了一种计算机存储介质,其中所述计算机存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器执行本申请提供的任意实施例所述的告警数据的管理方法的步骤。
本申请实施例提供了告警数据的管理方法、装置、计算机设备及存储介质,通过定时轮询服务器集群的服务器以采集所述服务器的状态数据,所述状态数据包括标识位信息;在判断出所述状态数据为有效数据时,根据所述标识位信息确定所述状态数据中的告警数据,将所述告警数据保存在第一预设数据表中;定时轮询所述第一预设数据表获取所述告警数据,采用预设处理规则处理所述告警数据以得到数据处理结果,将所述数据处理结果保存至第二预设数据表中;定时轮询所述第二预设数据表以获取所述数据处理结果,根据所述数据处理结果生成待处理事件,将所述待处理事件发送至终端以使所述终端显示所述待处理事件。该方法不仅可以提供及时准确的报警,还可以对告警信息进行追溯分析。
附图说明
为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一实施例提供的一种告警数据的管理方法的示意流程图;
图2是图1中告警数据的管理方法的子步骤示意流程图;
图3是图1中告警数据的管理方法的子步骤示意流程图;
图4是本申请另一实施例提供的一种告警数据的管理方法的示意流程图;
图5是本申请一实施例提供的一种告警数据的管理装置的示意性框图;
图6是本申请另一实施例提供的一种告警数据的管理装置的示意性框图;
图7是本申请一实施例提供的一种计算机设备的示意性框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
本申请实施例提供了一种告警数据的管理方法、装置、计算机设备和存储介质。该邮件生成方法应用于集中管理平台对应的服务端。
其中,该集中管理平台为基于带外设备而开发的平台软件系统,该平台软件系统括客户端和服务端,其中客户端配置在终端中,服务端配置在管理服务器中,管理服务器和终端配合实现对服务器集群中的服务器进行集中管理。该带外设备可例如为BMC(BaseboardManagement Controller,基板管理控制器)。在服务器安装该带外设备的情况下,基于IPMI/REDFISH协议即可开发出PC(Personal Computer,个人计算机)硬件运维自动化平台,也称为带外管理平台。REDFISH除了支持服务器,还可支持数据中心供电/冷却领域以及网络交换机。其采用基础架构的RESTfulAPI行业标准,使用HTTPS协议和JSON数据格式,更容易与DevOps工具对接,基于IPMI和REDFISH这套业界标准,为开发一套工具以获取PC硬件的物理状态数据,同时也可以对其远程管理提供了可能。若再将此数据及管理功能集中,就可以搭建一套PC硬件运维管理平台,即集中管理平台。
请参阅图1,图1是本申请一实施例提供的一种告警数据的管理的示意流程图。该管理方法应用管理服务器中,该管理服务器配置有集中管理平台的服务端。如图1所示,该管理方法包括步骤S101~S105。
S101、定时轮询服务器集群的服务器以采集所述服务器的状态数据,所述状态数据包括标识位信息。
在本实施例中,该定时轮询所对应的时长可以根据实际情况进行设定,比如可以根据管理服务器的处理能力进行设定等,具体时长在此不做限定,比如2分钟或者4分钟等。服务器的状态数据是指服务器的硬件组件的状态数据,所述硬件组件据包括硬盘、内存、电源和风扇等。所述状态数据由服务器中的自带检测工具进行采集,该状态数据包括标识位信息,所述标识位信息包括:正常标识、异常标识或告警标识等。
S102、判断所述状态数据是否为有效数据。
在本实施例中,具体是根据状态数据的数据值判断所述状态数据是否为有效数据。具体包括:获取所述状态数据对应的数据值;根据所述数据值判断所述状态数据是否为有效数据。检测该状态数据的数据值是否为有效值,若状态数据对应的数据值为有效值,则判定所述状态数据是有效数据,若所述状态数据为有效数据,执行步骤S103。检测该状态数据的数据值是否为有效值,比如检测状态数据对应的数据值是否为空值,若状态数据对应的数据值为空值,则判定所述状态数据是无效数据。若所述状态数据为无效数据,则获取无效数据所对应的原因,该原因包括:网络不通、认证密码错误或脚本出错等。
具体地,造成无效数据原因,包括:获取状态数据时检查网络是否正常,如果网络不通。则就直接会造成无效数据,并把这数据标志为网络不通;则进行输入相应的密码进行认证,如果认证失败会造成无效数据,并把这数据标志为认证密码错误;如果网络正常则调用脚本获取各种各样的硬件信息数值,如果脚本报错了,则会造成无效数据标记为脚本出错。
S103、根据所述标识位信息确定所述状态数据中的告警数据,将所述告警数据保存在第一预设数据表中。
在本实施例中,所述有效数据中包括标识位信息,该标识位信息具体为正常、异常和告警等标识,如果标识位信息为异常标识或告警标识,则表明所述有效状态数据存在告警数据,并将标识位信息对应的告警数据保存至第一预设数据表中,其中第一预设数据表保存在预设数据库中,所述预设数据库为管理服务器对应的数据库,该管理数据库配置有所述集中管理平台。
S104、定时轮询所述第一预设数据表获取所述告警数据,采用预设处理规则处理所述告警数据以得到数据处理结果,将所述数据处理结果保存至第二预设数据表中。
在本实施例中,定时轮询对应的时长也可根据实际情况进行设定,根据设定的时长轮询所述第一预设数据表以获取所述告警数据。并采用预设处理规则对获取的告警数据进行处理以得到数据处理结果,并将所述数据处理结果保存至第二预设数据表中,该第二预设数据表也保存在预设数据库中,所述预设数据库为所述管理服务器所对应的数据库,其中,第一预设数据表和第二预设数据表的设置便于告警数据数处理和分析。
在一实施例中,所述采用预设处理规则处理所述有效告警数据以得到数据处理结果,具体包括:子步骤S104a至S104d。如图2所示,其中S104a、获取所述服务器的组件类型和主机标识,根据所述组件类别将所述告警数据进行分类以得到组件告警数据;S104b、根据所述主机标识获取所述服务器的主机信息;S104c、根据所述组件告警数据对应的组件类别对所述组件告警数据作重复告警处理;S104d、根据经过所述重复告警处理的组件告警数据和所述主机信息生成数据处理结果。
具体地,该组件类别为服务器的不同硬件组件对应的组件名称,比如硬盘、电源、内存、磁盘阵列和风扇等。主机标识为主机SN号,当然也可以使用主机名。根据所述组件类别将所述告警数据进行分类,比如分为硬盘告警数据、电源告警数据和内存告警数据等。根据所述主机标识搜索并获取所述服务器的主机信息,其中所述主机信息包括主机名、主机SN号、主机品牌、KVM IP、主机厂商和主机型号等。根据所述组件告警数据对应的组件类别对所述组件告警数据作重复告警处理,是指去除同一组件重复告警处理,比如采集到硬盘组件告警数据在不同时间均出现了报警,则一条组件告警数据。根据经过所述重复告警处理的组件告警数据和所述主机信息生成所述第一数据处理结果,具体可以根据组件告警数据和主机信息生成告警数据记录,该告警数据记录即为第一数据处理结果。
S105、定时轮询所述第二预设数据表以获取所述数据处理结果,根据所述数据处理结果生成待处理事件,将所述待处理事件发送至终端以使所述终端显示所述待处理事件。
在本实施例中,定时轮询所对应的时长可以根据实际情况进行设定,具体时长在此不做限定,比如2分钟或者4分钟等,定时轮询所述第二预设数据表以从所述第二预设数据表中获取所述数据处理结果,根据所述数据处理结果生成待处理事件,其中所述待处理事件包括主机信息以及根据组件告警数据生成的报警数量、报警组件和待处理时间等。将所述待处理事件发布在集中管理平台上并按照待处理事件的生成时间对应顺序进行显示,以便管理人员通过处理该待处理时间实现对所述告警数据进行管理。
在一实施例中,步骤S105包括:子步骤S105a至S105d。如图3所示,其中S105a、根据所述数据处理结果生成待处理事件,所述待处理事件中包括忽略控件,所述忽略控件用于触发显示供用户选择的忽略时间;S105b、将所述待处理事件发送至终端使所述终端通过集中管理平台显示所述待处理事件;S105c、接收所述终端发送的用户选择的忽略时间;S105d、根据所述忽略时间修改所述第一预设数据表中的告警数据的标识位信息。
具体地,根据所述数据处理结果生成待处理事件,所述待处理事件包括主机信息以及根据组件告警数据生成的报警数量和报警组件等,其中所述待处理事件中包括忽略控件。当检测到用户点击所述忽略控件时,显示供用户选择的预设设置的忽略时间,该忽略时间比如忽略7天或忽略30天等。获取所述用户选择的忽略时间,比如用户选择忽略30天。根据所述忽略时间修改所述状态数据中的标识位信息,具体将状态数据中的标识位信息由告警标识替换为正常标识,期限为30天,并重复执行所述根据所述标识位信息确定所述状态数据中的告警数据的步骤。
此外,所述根据所述忽略时间修改所述第一预设数据表中的告警数据的标识位信息之后,还包括:根据所述告警数据中的标识位信息判断所述告警数据是否为消失告警;若所述告警数据为消失告警,则根据所述告警数据对应的服务器的主机信息对所述告警数据归档分类;并将归档分类结果发送至终端通过集中管理平台的报表页面进行展示。具体地,如果对待处理事件进行处理,比如用户选择相应的忽略时间,则根据处理结果返回修改第一预设数据表中的告警数据的标识位信息,由此根据所述告警数据中的标识位信息判断所述告警数据是否为消失告警。若所述告警数据为消失告警,则根据服务器的品牌、组件、地点或用途对所述告警数据进行分类,并按不同归档分类结果使用不同的报表进行显示。
上述实施例的方法通过定时轮询服务器集群的服务器以采集所述服务器的状态数据,所述状态数据包括标识位信息;在判断出所述状态数据为有效数据时,根据所述标识位信息确定所述状态数据中的告警数据,将所述告警数据保存在第一预设数据表中;定时轮询所述第一预设数据表获取所述告警数据,采用预设处理规则处理所述告警数据以得到数据处理结果,将所述数据处理结果保存至第二预设数据表中;定时轮询所述第二预设数据表以获取所述数据处理结果,根据所述数据处理结果生成待处理事件,将所述待处理事件发送至终端以使所述终端显示所述待处理事件。该方法不仅可以提供及时准确的报警,还可以对告警信息进行追溯分析。
请参阅图4,图4是本申请另一实施例提供的一种告警数据的管理的示意流程图。该管理方法应用管理服务器中,该管理服务器配置有集中管理平台的服务端。如图4所示,该管理方法包括步骤S201~S207。
S201、定时轮询服务器集群的服务器以采集所述服务器的状态数据,所述状态数据包括标识位信息。
在本实施例中,服务器的状态数据是指服务器的硬件组件的状态数据,所述硬件组件据包括硬盘、内存、电源和风扇等。所述状态数据由服务器中的自带检测工具进行采集,该状态数据包括标识位信息,所述标识位信息包括:正常标识、异常标识或告警标识等。
S202、判断所述状态数据是否为有效数据。
在本实施例中,具体是根据状态数据的数据值判断所述状态数据是否为有效数据。检测所述状态数据对应的数据值是否为空值,若状态数据对应的数据值不为空值,则判定所述状态数据是有效数据;若状态数据对应的数据值为空值,则判定所述状态数据是无效数据。判断所述状态数据是否为有效数据,若所述状态数据为有效数据,则执行步骤S203;若所述状态数据为无效数据,则执行步骤S205。
S203、根据所述标识位信息确定所述状态数据中的告警数据,将所述告警数据保存在第一预设数据表中。
在本实施例中,所述有效数据中包括标识位信息,该标识位信息具体为正常、异常和告警等标识,如果标识位信息为异常标识或告警标识,则表明所述有效状态数据存在告警数据,并将标识位信息对应的告警数据保存至第一预设数据表中,其中第一预设数据表保存在预设数据库中,所述预设数据库为管理服务器对应的数据库,该管理数据库配置有所述集中管理平台。
S204、定时轮询所述第一预设数据表获取所述告警数据,采用预设处理规则处理所述告警数据以得到数据处理结果,将所述数据处理结果保存至第二预设数据表中。
在本实施例中,根据设定时长定时循环轮询所述第一预设数据表以获取所述告警数据。并采用预设处理规则对获取的告警数据进行处理以得到数据处理结果,并将所述数据处理结果保存至第二预设数据表中,该第二预设数据表也保存在预设数据库中,所述预设数据库为所述管理服务器所对应的数据库,其中,第一预设数据表和第二预设数据表的设置便于告警数据数处理和分析。
S205、获取所述状态数据为无效数据所对应的无效原因。
在本实施例中,获取所述状态数据为无效数据对应的时间信息;根据所述时间信息从所述服务器中获取与所述时间信息对应的日志信息;根据所述日志信息获取所述无效数据所对应的无效原因。因为服务器的日志信息记录着无效数据的原因,该原因包括:网络不通、认证密码错误或脚本出错等。
S206、将所述状态数据和所述无效原因作为所述数据处理结果保存至所述第二预设数据表中。
在本实施例中,将所述状态数据和所述无效原因对应作为所述数据处理结果保存至所述第二预设数据表中以生成待处理事件发送终端显示,以便管理人员根据该待处理事件进行及时处理。
S207、定时轮询所述第二预设数据表以获取所述数据处理结果,根据所述数据处理结果生成待处理事件,将所述待处理事件发送至终端以使所述终端显示所述待处理事件。
在本实施例中,根据设定时长定时循环轮询所述第二预设数据表以获取所述数据处理结果,根据所述数据处理结果生成待处理事件,将所述待处理事件发送至终端以使所述终端通过集中管理平台显示所述待处理事件,以便管理人员根据所述待处理事件进行处理。
上述实施例的方法将采集的状态数据进行处理得到有效数据,再确认有效状态数据中的告警数据,将所述告警数据保存在第一预设数据表,再将处理结果保存至第二预设数据表中,以便做收敛去重处理和归档处理,根据处理结果生成待处理事件,将所述待处理事件发布在集中管理平台上,通过集中管理平台可实现对告警数据的管理。进而实现了对故障数据的准确分析以及便于故障数据的统计。
图5是本申请实施例提供的一种告警数据的管理装置的示意性框图。如图5所示,对应于以上告警数据的管理方法,本申请还提供一种告警数据的管理装置。该告警数据的管理装置包括用于执行上述告警数据的管理的单元,该装置可以被配置于服务器中。如图5所示,告警数据的管理装置400包括:数据采集单元401、数据判断单元402、数据确定单元403、数据处理单元404和事件生成单元405。
数据采集单元401,用于定时轮询服务器集群的服务器以采集所述服务器的状态数据,所述状态数据包括标识位信息。
数据判断单元402,用于判断所述状态数据是否为有效数据。
数据确定单元403,用于根据所述标识位信息确定所述状态数据中的告警数据,将所述告警数据保存在第一预设数据表中。
数据处理单元404,用于定时轮询所述第一预设数据表获取所述告警数据,采用预设处理规则处理所述告警数据以得到数据处理结果,将所述数据处理结果保存至第二预设数据表中。
其中,数据处理单元404,包括:标识获取子单元4041、信息获取子单元4042、重复处理子单元4043和结果生成子单元4044。具体地,标识获取子单元4041,用于获取所述服务器的组件类型和主机标识,根据所述组件类别将所述告警数据进行分类以得到组件告警数据;信息获取子单元4042,用于根据所述主机标识获取所述服务器的主机信息;重复处理子单元4043,用于根据所述组件告警数据对应的组件类别对所述组件告警数据作重复告警处理;结果生成子单元4044,用于根据经过所述重复告警处理的组件告警数据和所述主机信息生成数据处理结果。
事件生成单元405,用于定时轮询所述第二预设数据表以获取所述数据处理结果,根据所述数据处理结果生成待处理事件,将所述待处理事件发送至终端以使所述终端显示所述待处理事件。
其中,事件生成单元405,包括:事件生成子单元4051、事件显示子单元4052、时间接收子单元4053和标识修改子单元4054。具体地,事件生成子单元4051,用于根据所述数据处理结果生成待处理事件,所述待处理事件中包括忽略控件,所述忽略控件用于触发显示供用户选择的忽略时间;事件显示子单元4052,用于将所述待处理事件发送至终端使所述终端通过集中管理平台显示所述待处理事件;时间接收子单元4053,用于接收所述终端发送的用户选择的忽略时间;标识修改子单元4054,用于根据所述忽略时间修改所述第一预设数据表中的告警数据的标识位信息。
此外,事件生成单元405,还用于:根据所述告警数据中的标识位信息判断所述告警数据是否为消失告警;若所述告警数据为消失告警,则根据所述告警数据对应的服务器的主机信息对所述告警数据归档分类;并将归档分类结果发送至终端通过集中管理平台的报表页面进行展示。
图6是本申请的另一实施例提供的一种告警数据的管理装置的示意性框图。如图6所示,对应于以上告警数据的管理方法,本申请还提供一种告警数据的管理装置。该告警数据的管理装置包括用于执行上述告警数据的管理的单元,该装置可以被配置于服务器中。如图6所示,告警数据的管理装置500包括:数据采集单元501、数据判断单元502、数据确定单元503、数据处理单元504、原因获取单元505、结果保存单元506和事件生成单元507。
数据采集单元501,用于定时轮询服务器集群的服务器以采集所述服务器的状态数据,所述状态数据包括标识位信息。
数据判断单元502,用于判断所述状态数据是否为有效数据。
数据确定单元503,用于根据所述标识位信息确定所述状态数据中的告警数据,将所述告警数据保存在第一预设数据表中。
数据处理单元504,用于定时轮询所述第一预设数据表获取所述告警数据,采用预设处理规则处理所述告警数据以得到数据处理结果,将所述数据处理结果保存至第二预设数据表中。
原因获取单元505,用于获取所述状态数据为无效数据所对应的无效原因。
结果保存单元506,用于将所述状态数据和所述无效原因作为所述数据处理结果保存至所述第二预设数据表中。
事件生成单元507,用于定时轮询所述第二预设数据表以获取所述数据处理结果,根据所述数据处理结果生成待处理事件,将所述待处理事件发送至终端以使所述终端显示所述待处理事件。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的告警数据的管理装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
上述装置可以实现为一种计算机程序的形式,计算机程序可以在如图7所示的计算机设备上运行。
请参阅图7,图7是本申请实施例提供的一种计算机设备的示意性框图。该计算机设备700设备可以是服务器。
参照图7,该计算机设备700包括通过系统总线710连接的处理器720、存储器和网络接口750,其中,存储器可以包括非易失性存储介质730和内存储器740。
该非易失性存储介质730可存储操作系统731和计算机程序732。该计算机程序732被执行时,可使得处理器720执行任意一种告警数据的管理方法。
该处理器720用于提供计算和控制能力,支撑整个计算机设备700的运行。
该内存储器740为非易失性存储介质730中的计算机程序732的运行提供环境,该计算机程序732被处理器720执行时,可使得处理器720执行任意一种告警数据的管理方法。
该网络接口750用于进行网络通信,如发送分配的任务等。本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备700的限定,具体的计算机设备700可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。其中,所述处理器720用于运行存储在存储器中的程序代码,以实现如下步骤:
定时轮询服务器集群的服务器以采集所述服务器的状态数据,所述状态数据包括标识位信息;判断所述状态数据是否为有效数据;若所述状态数据为有效数据,根据所述标识位信息确定所述状态数据中的告警数据,将所述告警数据保存在第一预设数据表中;定时轮询所述第一预设数据表获取所述告警数据,采用预设处理规则处理所述告警数据以得到数据处理结果,将所述数据处理结果保存至第二预设数据表中;定时轮询所述第二预设数据表以获取所述数据处理结果,根据所述数据处理结果生成待处理事件,将所述待处理事件发送至终端以使所述终端显示所述待处理事件。
在一实施例中,所述处理器720用于运行存储在存储器中的程序代码实现所述采用预设处理规则处理所述有效告警数据以得到数据处理结果时,具体实现如下步骤:
获取所述服务器的组件类型和主机标识,根据所述组件类别将所述告警数据进行分类以得到组件告警数据;根据所述主机标识获取所述服务器的主机信息;根据所述组件告警数据对应的组件类别对所述组件告警数据作重复告警处理;根据经过所述重复告警处理的组件告警数据和所述主机信息生成数据处理结果。
在一实施例中,所述处理器720用于运行存储在存储器中的程序代码实现所述根据所述数据处理结果生成待处理事件,将所述待处理事件发送至终端以使所述终端显示所述待处理事件,具体实现如下步骤:
根据所述数据处理结果生成待处理事件,所述待处理事件中包括忽略控件,所述忽略控件用于触发显示供用户选择的忽略时间;将所述待处理事件发送至终端使所述终端通过集中管理平台显示所述待处理事件;接收所述终端发送的用户选择的忽略时间;根据所述忽略时间修改所述第一预设数据表中的告警数据的标识位信息。
在一实施例中,所述处理器720用于运行存储在存储器中的程序代码实现所述根据所述忽略时间修改所述第一预设数据表中的告警数据的标识位信息之后,还实现如下步骤:
根据所述告警数据中的标识位信息判断所述告警数据是否为消失告警;若所述告警数据为消失告警,则根据所述告警数据对应的服务器的主机信息对所述告警数据归档分类。
在一实施例中,所述处理器720用于运行存储在存储器中的程序代码实现所述判断所述状态数据是否为有效数据之后,还实现如下步骤:
若所述状态数据为无效数据,获取所述状态数据为无效数据所对应的无效原因;以及将所述状态数据和所述无效原因作为所述数据处理结果保存至所述第二预设数据表中。
在一实施例中,所述处理器720用于运行存储在存储器中的程序代码实现所述获取所述状态数据为无效数据所对应的无效原因时,具体实现如下步骤:
获取所述状态数据为无效数据对应的时间信息;根据所述时间信息从所述服务器中获取与所述时间信息对应的日志信息;根据所述日志信息获取所述无效数据所对应的无效原因。
在一实施例中,所述处理器720用于运行存储在存储器中的程序代码实现所述判断所述状态数据是否为有效数据时,具体实现如下步骤:
获取所述状态数据对应的数据值;根据所述数据值判断所述状态数据是否为有效数据。
应当理解,在本申请实施例中,处理器720可以是中央处理单元(CentralProcessingUnit,CPU),该处理器720还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable GateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
本领域技术人员可以理解,图7中示出的计算机设备700结构并不构成对计算机设备700的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
本领域普通技术人员可以理解的是实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,计算机程序可存储于一存储介质中,该存储介质为计算机可读存储介质。如本发明实施例中,该计算机程序可存储于计算机系统的存储介质中,并被该计算机系统中的至少一个处理器执行,以实现包括如上述各方法的实施例的流程步骤。
该计算机可读存储介质可以是磁碟、光盘、U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的几个实施例中,应该理解到,所揭露的告警数据的管理装置和方法,可以通过其它的方式实现。例如,以上所描述的告警数据的管理装置实施例仅仅是示意性的。例如,各个单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
本申请实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。
本申请实施例装置中的单元可以根据实际需要进行合并、划分和删减。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
该集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,终端,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种告警数据的管理方法,其特征在于,包括:
定时轮询服务器集群的服务器以采集所述服务器的状态数据,所述状态数据包括标识位信息;
判断所述状态数据是否为有效数据;
若所述状态数据为有效数据,根据所述标识位信息确定所述状态数据中的告警数据,将所述告警数据保存在第一预设数据表中;
定时轮询所述第一预设数据表获取所述告警数据,采用预设处理规则处理所述告警数据以得到数据处理结果,将所述数据处理结果保存至第二预设数据表中;
定时轮询所述第二预设数据表以获取所述数据处理结果,根据所述数据处理结果生成待处理事件,将所述待处理事件发送至终端以使所述终端显示所述待处理事件。
2.根据权利要求1所述的告警数据的管理方法,其特征在于,所述采用预设处理规则处理所述有效告警数据以得到数据处理结果,包括:
获取所述服务器的组件类型和主机标识,根据所述组件类别将所述告警数据进行分类以得到组件告警数据;
根据所述主机标识获取所述服务器的主机信息;
根据所述组件告警数据对应的组件类别对所述组件告警数据作重复告警处理;
根据经过所述重复告警处理的组件告警数据和所述主机信息生成数据处理结果。
3.根据权利要求1所述的告警数据的管理方法,其特征在于,所述根据所述数据处理结果生成待处理事件,将所述待处理事件发送至终端以使所述终端显示所述待处理事件,包括:
根据所述数据处理结果生成待处理事件,所述待处理事件中包括忽略控件,所述忽略控件用于触发显示供用户选择的忽略时间;
将所述待处理事件发送至终端使所述终端通过集中管理平台显示所述待处理事件;
接收所述终端发送的用户选择的忽略时间;
根据所述忽略时间修改所述第一预设数据表中的告警数据的标识位信息。
4.根据权利要求3所述的告警数据的管理方法,其特征在于,所述根据所述忽略时间修改所述第一预设数据表中的告警数据的标识位信息之后,还包括:
根据所述告警数据中的标识位信息判断所述告警数据是否为消失告警;
若所述告警数据为消失告警,则根据所述告警数据对应的服务器的主机信息对所述告警数据归档分类。
5.根据权利要求1所述的告警数据的管理方法,其特征在于,所述判断所述状态数据是否为有效数据之后,还包括:
若所述状态数据为无效数据,获取所述状态数据为无效数据所对应的无效原因;以及
将所述状态数据和所述无效原因作为所述数据处理结果保存至所述第二预设数据表中。
6.根据权利要求5所述的告警数据的管理方法,其特征在于,所述获取所述状态数据为无效数据所对应的无效原因,包括:
获取所述状态数据为无效数据对应的时间信息;
根据所述时间信息从所述服务器中获取与所述时间信息对应的日志信息;
根据所述日志信息获取所述无效数据所对应的无效原因。
7.根据权利要求1所述的告警数据的管理方法,其特征在于,所述判断所述状态数据是否为有效数据,包括:
获取所述状态数据对应的数据值;
根据所述数据值判断所述状态数据是否为有效数据。
8.一种告警数据的管理装置,其特征在于,包括:
数据采集单元,用于定时轮询服务器集群的服务器以采集所述服务器的状态数据,所述状态数据包括标识位信息;
数据判断单元,用于判断所述状态数据是否为有效数据;
数据确定单元,用于若所述状态数据为有效数据,根据所述标识位信息确定所述状态数据中的告警数据,将所述告警数据保存在第一预设数据表中;
数据处理单元,用于定时轮询所述第一预设数据表获取所述告警数据,采用预设处理规则处理所述告警数据以得到数据处理结果,将所述数据处理结果保存至第二预设数据表中;
事件生成单元,用于定时轮询所述第二预设数据表以获取所述数据处理结果,根据所述数据处理结果生成待处理事件,将所述待处理事件发送至终端以使所述终端显示所述待处理事件。
9.一种计算机设备,其特征在于,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至7中任意一项所述方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器执行如权利要求1至7任意一项所述方法的步骤。
CN201810897093.0A 2018-08-08 2018-08-08 告警数据的管理方法、装置、计算机设备及存储介质 Active CN108763038B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201810897093.0A CN108763038B (zh) 2018-08-08 2018-08-08 告警数据的管理方法、装置、计算机设备及存储介质
PCT/CN2018/108271 WO2020029407A1 (zh) 2018-08-08 2018-09-28 告警数据的管理方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810897093.0A CN108763038B (zh) 2018-08-08 2018-08-08 告警数据的管理方法、装置、计算机设备及存储介质

Publications (2)

Publication Number Publication Date
CN108763038A true CN108763038A (zh) 2018-11-06
CN108763038B CN108763038B (zh) 2022-04-12

Family

ID=63969354

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810897093.0A Active CN108763038B (zh) 2018-08-08 2018-08-08 告警数据的管理方法、装置、计算机设备及存储介质

Country Status (2)

Country Link
CN (1) CN108763038B (zh)
WO (1) WO2020029407A1 (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110287241A (zh) * 2019-06-27 2019-09-27 深圳前海微众银行股份有限公司 一种生成告警数据报表的方法及装置
CN110321362A (zh) * 2019-07-05 2019-10-11 广东利元亨智能装备股份有限公司 数据处理方法、装置及电子设备
CN110675079A (zh) * 2019-09-30 2020-01-10 腾讯科技(深圳)有限公司 故障数据处理方法、装置和计算机设备
CN111260170A (zh) * 2018-11-30 2020-06-09 重庆小雨点小额贷款有限公司 农产品管理方法、装置、服务器及存储介质
CN111339293A (zh) * 2020-02-11 2020-06-26 支付宝(杭州)信息技术有限公司 告警事件的数据处理方法、装置和告警事件的分类方法
WO2021174694A1 (zh) * 2020-03-06 2021-09-10 平安科技(深圳)有限公司 基于数据中心的运维监控方法、装置、设备及存储介质
CN113448763A (zh) * 2021-07-16 2021-09-28 广东电网有限责任公司 全生命周期管理的可动态扩展分组告警服务方法
CN113487074A (zh) * 2021-06-28 2021-10-08 平安信托有限责任公司 基于产品出库的事故预警方法、装置、设备及存储介质
CN113778800A (zh) * 2021-09-14 2021-12-10 上海绚显科技有限公司 一种报错信息处理方法、装置、系统、设备及存储介质
CN114116282A (zh) * 2021-11-12 2022-03-01 苏州浪潮智能科技有限公司 一种网络附加存储故障上报并修复的方法和装置

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111427749B (zh) * 2020-04-01 2023-07-11 山东汇贸电子口岸有限公司 一种openstack环境下针对ironic服务的监控工具及方法
CN112052287A (zh) * 2020-09-02 2020-12-08 北京世纪互联宽带数据中心有限公司 数据中心集群的集中管理方法、装置以及系统
CN114650218B (zh) * 2020-12-17 2023-12-12 中移(苏州)软件技术有限公司 一种数据获取方法、设备、系统及存储介质
CN113542253B (zh) * 2021-07-12 2023-04-07 杭州安恒信息技术股份有限公司 一种网络流量检测方法、装置、设备及介质
CN117113340B (zh) * 2023-10-20 2024-01-23 杭州美创科技股份有限公司 主机失陷检测方法、装置、计算机设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101296466A (zh) * 2008-06-12 2008-10-29 广东高新兴通信股份有限公司 一种对基站产生告警的屏蔽方法
CN106778873A (zh) * 2016-12-19 2017-05-31 北京市天元网络技术股份有限公司 一种基于白名单规则的告警信息分类处置方法及装置
CN107832200A (zh) * 2017-10-24 2018-03-23 平安科技(深圳)有限公司 告警处理方法、装置、计算机设备及存储介质
US20180113500A1 (en) * 2016-10-24 2018-04-26 Wandering WiFi LLC Systems and methods for monitoring battery life

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1308278A (zh) * 2001-02-15 2001-08-15 华中科技大学 集群服务器的ip容错方法
CN103401698B (zh) * 2013-07-02 2017-03-15 北京奇虎科技有限公司 用于服务器集群运算中对服务器状况报警的监控系统
CN105718351B (zh) * 2016-01-08 2018-02-09 北京汇商融通信息技术有限公司 一种面向Hadoop集群的分布式监控管理系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101296466A (zh) * 2008-06-12 2008-10-29 广东高新兴通信股份有限公司 一种对基站产生告警的屏蔽方法
US20180113500A1 (en) * 2016-10-24 2018-04-26 Wandering WiFi LLC Systems and methods for monitoring battery life
CN106778873A (zh) * 2016-12-19 2017-05-31 北京市天元网络技术股份有限公司 一种基于白名单规则的告警信息分类处置方法及装置
CN107832200A (zh) * 2017-10-24 2018-03-23 平安科技(深圳)有限公司 告警处理方法、装置、计算机设备及存储介质

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111260170A (zh) * 2018-11-30 2020-06-09 重庆小雨点小额贷款有限公司 农产品管理方法、装置、服务器及存储介质
CN110287241A (zh) * 2019-06-27 2019-09-27 深圳前海微众银行股份有限公司 一种生成告警数据报表的方法及装置
CN110287241B (zh) * 2019-06-27 2023-09-08 深圳前海微众银行股份有限公司 一种生成告警数据报表的方法及装置
CN110321362A (zh) * 2019-07-05 2019-10-11 广东利元亨智能装备股份有限公司 数据处理方法、装置及电子设备
CN110675079A (zh) * 2019-09-30 2020-01-10 腾讯科技(深圳)有限公司 故障数据处理方法、装置和计算机设备
CN111339293B (zh) * 2020-02-11 2023-08-22 支付宝(杭州)信息技术有限公司 告警事件的数据处理方法、装置和告警事件的分类方法
CN111339293A (zh) * 2020-02-11 2020-06-26 支付宝(杭州)信息技术有限公司 告警事件的数据处理方法、装置和告警事件的分类方法
WO2021174694A1 (zh) * 2020-03-06 2021-09-10 平安科技(深圳)有限公司 基于数据中心的运维监控方法、装置、设备及存储介质
CN113487074A (zh) * 2021-06-28 2021-10-08 平安信托有限责任公司 基于产品出库的事故预警方法、装置、设备及存储介质
CN113448763A (zh) * 2021-07-16 2021-09-28 广东电网有限责任公司 全生命周期管理的可动态扩展分组告警服务方法
CN113448763B (zh) * 2021-07-16 2022-07-26 广东电网有限责任公司 全生命周期管理的可动态扩展分组告警服务方法
CN113778800B (zh) * 2021-09-14 2023-08-18 上海绚显科技有限公司 一种报错信息处理方法、装置、系统、设备及存储介质
CN113778800A (zh) * 2021-09-14 2021-12-10 上海绚显科技有限公司 一种报错信息处理方法、装置、系统、设备及存储介质
CN114116282B (zh) * 2021-11-12 2023-08-18 苏州浪潮智能科技有限公司 一种网络附加存储故障上报并修复的方法和装置
CN114116282A (zh) * 2021-11-12 2022-03-01 苏州浪潮智能科技有限公司 一种网络附加存储故障上报并修复的方法和装置

Also Published As

Publication number Publication date
WO2020029407A1 (zh) 2020-02-13
CN108763038B (zh) 2022-04-12

Similar Documents

Publication Publication Date Title
CN108763038A (zh) 告警数据的管理方法、装置、计算机设备及存储介质
CN108897665B (zh) 日志管理方法、装置、计算机设备及存储介质
CN104202201B (zh) 一种日志处理方法、装置及终端
JP5684946B2 (ja) イベントの根本原因の解析を支援する方法及びシステム
CN113328872B (zh) 故障修复方法、装置和存储介质
EP3616066B1 (en) Human-readable, language-independent stack trace summary generation
CN109189640A (zh) 服务器的监控方法、装置、计算机设备及存储介质
CN104252479B (zh) 信息的处理方法、装置和系统
CN110213068A (zh) 一种消息中间件的监控方法及相关设备
US10437695B2 (en) Fault information providing server and fault information providing method for users of in-vehicle terminals
JP6780655B2 (ja) ログ分析システム、方法およびプログラム
CN108063699A (zh) 网络性能监控方法、装置、电子设备、存储介质
CN108762966A (zh) 系统异常拦截方法、装置、计算机设备及存储介质
CN108880897A (zh) 服务器的验收方法、装置、计算机设备及存储介质
CN106547501A (zh) 信息的显示方法及装置
JP2014153721A (ja) ログ可視化装置及び方法及びプログラム
CN108897496A (zh) 磁盘阵列配置管理方法、装置、计算机设备及存储介质
WO2017110720A1 (ja) ログ分析システム、ログ分析方法及びプログラムを格納した記録媒体
CN108920103A (zh) 服务器的管理方法、装置、计算机设备及存储介质
CN108540582A (zh) 一种终端标识的处理方法、服务器及终端
GB2508499A (en) Determining related messages for filtering groups of error messages
CN112491625A (zh) 基于即时通讯平台的运维告警方法、装置及设备
JP2019204407A (ja) 異常操作検知装置、異常操作検知方法、およびプログラム
JP2005242988A (ja) ログ情報管理システム、サービス提供システム、ログ情報管理プログラムおよびサービス提供プログラム、並びにログ情報管理方法およびサービス提供方法
CN109302336A (zh) 邮件生成方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant