CN109189640A - 服务器的监控方法、装置、计算机设备及存储介质 - Google Patents

服务器的监控方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN109189640A
CN109189640A CN201810973009.9A CN201810973009A CN109189640A CN 109189640 A CN109189640 A CN 109189640A CN 201810973009 A CN201810973009 A CN 201810973009A CN 109189640 A CN109189640 A CN 109189640A
Authority
CN
China
Prior art keywords
server
status data
event
processed
default
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810973009.9A
Other languages
English (en)
Inventor
彭磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201810973009.9A priority Critical patent/CN109189640A/zh
Publication of CN109189640A publication Critical patent/CN109189640A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/321Display for diagnostics, e.g. diagnostic result display, self-test user interface

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Human Computer Interaction (AREA)
  • Mathematical Physics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请实施例公开了一种服务器的监控方法、装置、计算机设备及存储介质,其中该监控方法包括:通过轮询预设带外设备获取服务器的状态数据,所述预设带外设备安装在所述服务器中并与所述服务器建立通信连接,所述状态数据包括所述服务器的多个硬件组件对应的组件数据;基于预设检测规则,根据所述组件数据检测所述状态数据是否存在故障;若所述状态数据中存在故障,根据预设等级确定规则确定所述状态数据对应的故障等级;获取所述服务器的主机信息,根据所述主机信息和状态数据生成待处理事件;将确定的故障等级添加至所述待处理事件并发送至终端以使所述终端显示所述待处理事件。该方法可以提高服务器故障的监控效率。

Description

服务器的监控方法、装置、计算机设备及存储介质
技术领域
本申请涉及计算机技术领域,尤其涉及一种服务器的监控方法、装置、计算机设备及存储介质。
背景技术
目前,随着互联网的发展,企业的业务线越来越复杂以及用户的需求越来越多样化,由此需要大幅增加服务器的数量,同时对于服务器的性能、业务状态等方面的实时把握,异常的及时处理等都是个不小的挑战。目前多采用搭建服务器监控系统,通过该监控系统实时监控服务器的运行状态,具体是服务器中安装操作系统,在该操作系统检测服务器的硬件对应的故障数据,将该故障数据上报至监控系统完成监控,一旦服务器出现严重异常,该监控系统将无法完成对服务器的监控。如果采用人工巡检的方式进行监控,无疑增加了人工成本,同时降低了服务器的监控效率。因此,有必要提供一种服务器的监控方法以解决上述问题。
发明内容
本申请提供了一种服务器的监控方法、装置、计算机设备及存储介质,以提高服务器的故障监控效率。
本申请提供了一种服务器的监控方法,其包括:
通过轮询预设带外设备获取服务器的状态数据,所述预设带外设备安装在所述服务器中并与所述服务器建立通信连接,所述状态数据包括所述服务器的多个硬件组件对应的组件数据;
基于预设检测规则,根据所述组件数据检测所述状态数据是否存在故障;
若所述状态数据中存在故障,根据预设等级确定规则确定所述状态数据对应的故障等级;
获取所述服务器的主机信息,根据所述主机信息和状态数据生成待处理事件;
将确定的故障等级添加至所述待处理事件并发送至终端以使所述终端显示所述待处理事件。
本申请提供了一种服务器的监控装置,其包括:
轮询获取单元,用于通过轮询预设带外设备获取服务器的状态数据,所述预设带外设备安装在所述服务器中并与所述服务器建立通信连接,所述状态数据包括所述服务器的多个硬件组件对应的组件数据;
故障检测单元,用于基于预设检测规则,根据所述组件数据检测所述状态数据是否存在故障;
等级确定单元,用于若所述状态数据中存在故障,根据预设等级确定规则确定所述状态数据对应的故障等级;
获取生成单元,用于获取所述服务器的主机信息,根据所述主机信息和状态数据生成待处理事件;
添加发送单元,用于将确定的故障等级添加至所述待处理事件并发送至终端以使所述终端显示所述待处理事件。
本申请还提供了一种计算机设备,其包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现本申请提供的任意一项所述的服务器的监控方法的步骤。
本申请还提供了一种计算机存储介质,其中所述计算机存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器执行本申请提供的任意实施例所述的服务器的监控方法的步骤。
本申请实施例提供了一种服务器的监控方法、装置、计算机设备及存储介质,通过轮询预设带外设备获取服务器的状态数据,所述预设带外设备安装在所述服务器中并与所述服务器建立通信连接;基于预设检测规则,根据所述状态数据的组件数据检测所述状态数据是否存在故障;若所述状态数据中存在故障,根据预设等级确定规则确定所述状态数据对应的故障等级;获取所述服务器的主机信息,根据所述主机信息和状态数据生成待处理事件;将确定的故障等级添加至所述待处理事件并发送至终端以使所述终端显示所述待处理事件。该方法可实现在服务器出现严重异常时依然可以确保对服务器的监控,同时还通过预设等级确定规则快速地确定所述状态数据对应的故障等级,根据故障等级对应的显示方式进行显示以使用户快速处理该服务器的状态数据,由此提高服务器故障的监控效率。
附图说明
为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一实施例提供的一种服务器的监控方法的应用场景示意图;
图2是本申请一实施例提供的一种服务器的监控方法的示意流程图;
图3是本申请一实施例提供的确定故障等级的步骤的示意流程图;
图4是本申请一实施例提供的事件生成的步骤的示意流程图;
图5是本申请另一实施例提供的确定故障等级的步骤的示意流程图;
图6是本申请一实施例提供的一种服务器的监控装置的示意性框图;
图7是本申请一实施例提供的一种计算机设备的示意性框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
本申请实施例提供了一种服务器的监控方法、装置、计算机设备和存储介质。
为了便于理解,先对本申请实施例的服务器的监控方法所适用的应用场景组成进行介绍。如图1所示,该应用场景包括终端、管理服务器和服务器集群。
其中,终端可以是智能手机、平板电脑、笔记本电脑、台式电脑、个人数字助理或穿戴式设备等电子设备;管理服务器可以是独立的服务器,也可以是多个服务器组成的服务器群;服务器集群包括多个待管理的服务器。
具体地,该服务器的监控方法应用于集中管理平台的服务端,该服务端具体可被配置于管理服务器中,以实现对服务器集群中的服务器进行监督管理。
其中,该集中管理平台为基于带外设备而开发的平台软件系统,该平台软件系统包括客户端和服务端,其中客户端配置终端中,服务端配置在管理服务器中,管理服务器和终端配合实现对服务器集群中的服务器进行集中管理。该带外设备可例如为BMC(BaseboardManagement Controller,基板管理控制器)。在服务器安装该带外设备的情况下,基于IPMI/REDFISH协议即可开发出PC(Personal Computer,个人计算机)硬件运维自动化平台,也称为带外管理平台。REDFISH除了支持服务器,还可支持数据中心供电/冷却领域以及网络交换机。其采用基础架构的RESTfulAPI行业标准,使用HTTPS协议和JSON数据格式,更容易与DevOps工具对接,基于IPMI和REDFISH这套业界标准,为开发一套工具以获取PC硬件的物理状态数据,同时也可以对其远程管理提供了可能。若再将此数据及管理功能集中,就可以搭建一套PC硬件运维管理平台,即所述集中管理平台。
请参阅图2,图2是本申请一实施例提供的一种服务器的监控方法的示意流程图。该服务器的监控方法应用于管理服务器中,如图2所示,该监控方法包括步骤S101~S105。
S101、通过轮询预设带外设备获取服务器的状态数据,所述预设带外设备安装在所述服务器中并与所述服务器建立通信连接,所述状态数据包括所述服务器的多个硬件组件对应的组件数据。
具体地,按照预设轮询时间轮询服务器的预设带外设备获取所述服务器的状态数据,并将所述状态数据保存在所述轮询服务器对应的数据库中;定期轮询所述数据库以获取所述服务器的状态数据。
其中,所述硬件组件包括RAID、磁盘、硬盘、风扇、内存和电源等;所述状态数据中包括RAID组件数据、磁盘组件数据、硬盘组件数据、内存组件数据和电源组件数据等;所述预设带外设备具体可以为BMC设备,安装在服务器中并与服务器建立通信连接。通过轮询预设带外设备以获取服务器的状态数据,具体可以是轮询服务器按照预设轮询时间轮询服务器集群中的服务器的预设带外设备以获取服务器的状态数据,并将所述状态数据保存在该轮询服务器对应的数据库中,定期轮询该数据库中以获取服务器的状态数据。
S102、基于预设检测规则,根据所述组件数据检测所述状态数据是否存在故障。
具体地,获取组件数据对应的组件类别以及所述组件类别对应的预设标准值,该组件类别包括磁盘、硬盘、风扇、内存和电源等类别。根据预设检测规则检测所述状态数据中的组件数据中是否存在故障数据。比如,服务器的CPU组件数据包括CPU温度,如果CPU温度大于预设标准值,即为检测出所述状态数据中存在故障。
S103、若所述状态数据中存在故障,根据预设等级确定规则确定所述状态数据对应的故障等级。
其中,步骤S103包括确定故障等级的步骤,该步骤具体包括以下内容:获取所述组件数据中的参数值,所述参数值为所述硬件组件的状态采集值;根据所述参数值确定所述状态数据对应的故障等级。所述参数值比如风扇的转速值或CPU的温度值等。
具体地,所述根据所述参数值确定所述状态数据对应的故障等级,包括:步骤S103a至S103c。如图3所示,S103a、判断所述参数值是否大于预设标准值;S103b、若所述参数值大于所述预设标准值,获取所述参数值的程度等级;S103c、根据所述程度等级确定所述状态数据对应的故障等级。
譬如,判断出CPU的温度大于预设标准值,获取该CPU温度值的程度等级。具体地,该程度等级包括第一程度等级、第二程度等级和第三程度等级,分别对应第一故障等级、第二故障等级和第三故障等级。比如,获取该CPU温度值的程度等级为第二程度等级,则确定所述状态数据对应的故障等级为第二故障等级。
S104、获取所述服务器的主机信息,根据所述主机信息和状态数据生成待处理事件。
具体地,所述主机信息包括:主机序列号(主机序列号即主机SN号(SerialNumber))、主机名称、KVM IP(KeyboardVideo Mouse Internet Protocol)、主机品牌、主机型号、地域信息、机柜信息和开机状态等。
在本实施例中,步骤S104包括事件生成的步骤,如图4所示,该步骤包括以下内容:S104a、获取所述状态数据中存在故障的组件数据及对应的组件类别;S104b、根据所述组件类别确定报警数量;S104c、根据所述主机信息、报警数量和组件类别生成待处理事件。
具体地,确定所述状态数据中存在故障的组件数据对应的组件类别,比如组件类别包括磁盘类别、硬盘类别、内存类别或电源类别。每一个硬件组件出现故障,则报警数量统计1次,由此报警数量为4次。根据主机信息、报警数量和组件类别生成所述待处理事件,即是该待处理事件中包括主机信息、报警数量和组件类别,由此方便用户查看该待处理事件由此方便用户查那台主机出现报警和主机的详细信息,以及报警的数量和组件,进而方便用户进行针对性的处理。
S105、将确定的故障等级添加至所述待处理事件并发送至终端以使所述终端显示所述待处理事件。
具体地,将所述故障等级添加至所述待处理事件并发送至终端以使所述终端确定所述故障等级对应的预设显示方式并通过所述预设显示方式显示待处理事件。其中,所述故障等级可以为等级标识,将所述等级标识添加至所述待处理事件中,并将该待处理事件发送至终端以使终端根据该等级标识查询其对应的预设显示方式,并通过该预设显示方式显示所述待处理事件,根据所述故障等级的不同优先显示等级较高的待处理事件。
在本实施例中,该监控方法通过轮询预设带外设备的方式,可实现在服务器出现严重异常时依然可以确保对服务器的监控,同时还通过预设等级确定规则快速地确定所述状态数据对应的故障等级,根据故障等级对应的显示方式进行显示以使用户快速处理该服务器的状态数据,由此提高了服务器故障的监控效率。
在一实施例中,步骤S103还包括另一确定故障等级的步骤,如图5所示,该步骤具体包括:
S201、获取所述服务器的日志信息。
具体地,在所述服务器的状态数据出现故障时,获取所述出现故障对应时间信息;根据所述时间信息获取所述服务器的日志信息。该日志信息为出现故障时对应的日志信息,所述日志信息记录有组件类别对应的报警级别、报警时间、报警组件和详细描述等。
S202、确定存在故障的组件数据所对应的组件类别。
具体地,确定存在故障的组件数据,再确定组件数据对应的组件类别,比如,硬盘组件数据中存在故障,则对应的组件类别为硬盘。
S203、根据所述日志信息确定所述组件类别对应的报警级别,并从所述报警级别中选定最高报警级别。
具体地,由于所述日志信息记录有组件类别对应的报警级别,因此可以根据所述日志信息确定所述组件类别对应的报警级别。如果存在多个组件类别存在故障,则从多个组件类别对应的报警级别中确定最高报警级别;如果多个组件类别对应的报警级别相同,则选定相同的报警级别为最高报警级别;若只有一个组件类别报警,则选定该组件类别对应的报警级别为最高报警级别。
S204、根据所述最高报警级别确定所述状态数据对应的故障等级。
具体地,可以预先建立报警级别和故障等级的对应关系,该报警级别为最高报警级别,根据报警级别和故障等级之间预设的对应关系,可以确定所述状态数据对应的故障等级。比如该对应关系如表1所示。
表1为报警级别和故障等级的对应关系表
序号 报警级别 故障等级
1 Information 普通
2 Caution 告警
3 Repaired 紧急
上述确定故障等级的方法,可以快速准确地确定出状态数据对应的故障级别,由此便于对服务器的故障处理。
图6是本申请实施例提供的一种服务器的监控装置的示意性框图。如图6所示,对应于以上服务器的监控方法,本申请还提供一种服务器的监控装置。该服务器的监控装置包括用于执行上述服务器的监控方法的单元,该服务器的监控装置可以被配置于管理服务器中。如图6所示,服务器的监控装置300包括:轮询获取单元301、故障检测单元302、等级确定单元303、获取生成单元304和添加发送单元305。
轮询获取单元301,用于通过轮询预设带外设备获取服务器的状态数据,所述预设带外设备安装在所述服务器中并与所述服务器建立通信连接,所述状态数据包括所述服务器的多个硬件组件对应的组件数据。
故障检测单元302,用于基于预设检测规则,根据所述组件数据检测所述状态数据是否存在故障。
等级确定单元303,用于若所述状态数据中存在故障,根据预设等级确定规则确定所述状态数据对应的故障等级。
其中,等级确定单元303,包括:数值判断子单元3031,用于判断所述组件数据中的数值是否大于所述预设标准值;等级获取子单元3032,用于若所述组件数据中的数值大于所述预设标准值,获取所述组件数据中的数值大于所述预设标准值的程度等级;等级确子单元3033,用于根据所述程度等级确定所述状态数据对应的故障等级。
获取生成单元304,用于获取所述服务器的主机信息,根据所述主机信息和状态数据生成待处理事件。
其中,获取生成单元304,包括:数据获取子单元3041,用于获取所述状态数据中存在故障的组件数据及对应的组件类别;数据确定子单元3042,用于根据所述组件类别确定报警数量;事件生成单元3043,用于根据所述主机信息、报警数量和组件类别生成待处理事件。
添加发送单元305,用于将确定的故障等级添加至所述待处理事件并发送至终端以使所述终端显示所述待处理事件。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的服务器的监控装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
上述服务器的监控装置可以实现为一种计算机程序的形式,计算机程序可以在如图7所示的计算机设备上运行。
请参阅图7,图7是本申请实施例提供的一种计算机设备的示意性框图。该计算机设备700可以是服务器。
参照图7,该计算机设备700包括通过系统总线710连接的处理器720、存储器和网络接口750,其中,存储器可以包括非易失性存储介质730和内存储器740。
该非易失性存储介质730可存储操作系统731和计算机程序732。该计算机程序732被执行时,可使得处理器720执行任意一种服务器的监控方法。
该处理器720用于提供计算和控制能力,支撑整个计算机设备700的运行。
该内存储器740为非易失性存储介质730中的计算机程序732的运行提供环境,该计算机程序732被处理器720执行时,可使得处理器720执行任意一种服务器的监控方法。
该网络接口750用于进行网络通信,如发送分配的任务等。本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备700的限定,具体的计算机设备700可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。其中,所述处理器720用于运行存储在存储器中的程序代码,以实现如下步骤:
通过轮询预设带外设备获取服务器的状态数据,所述预设带外设备安装在所述服务器中并与所述服务器建立通信连接,所述状态数据包括所述服务器的多个硬件组件对应的组件数据;基于预设检测规则,根据所述组件数据检测所述状态数据是否存在故障;若所述状态数据中存在故障,根据预设等级确定规则确定所述状态数据对应的故障等级;获取所述服务器的主机信息,根据所述主机信息和状态数据生成待处理事件;将确定的故障等级添加至所述待处理事件并发送至终端以使所述终端显示所述待处理事件。
在一实施例中,所述处理器720用于运行存储在存储器中的程序代码实现所述根据预设等级确定规则确定所述状态数据对应的故障等级时,具体实现如下步骤:
获取所述服务器的日志信息;确定存在故障的组件数据所对应的组件类别;根据所述日志信息确定所述组件类别对应的报警级别;根据所述报警级别确定所述状态数据对应的故障等级。
在一实施例中,所述处理器720用于运行存储在存储器中的程序代码实现所述根据预设等级确定规则确定所述状态数据对应的故障等级时,具体实现如下步骤:
获取所述组件数据中的参数值,所述参数值为所述硬件组件的状态采集值;根据所述参数值确定所述状态数据对应的故障等级。
在一实施例中,所述处理器720用于运行存储在存储器中的程序代码实现所述根据所述参数值确定所述状态数据对应的故障等级时,具体实现如下步骤:
判断所述参数值是否大于预设标准值;若所述参数值大于所述预设标准值,获取所述参数值大于所述预设标准值的程度等级;根据所述程度等级确定所述状态数据对应的故障等级。
在一实施例中,所述处理器720用于运行存储在存储器中的程序代码实现所述根据所述主机信息和状态数据生成待处理事件,具体实现如下步骤:
获取所述状态数据中存在故障的组件数据及对应的组件类别;根据所述组件类别确定报警数量;以及根据所述主机信息、报警数量和组件类别生成待处理事件。
在一实施例中,所述处理器720用于运行存储在存储器中的程序代码实现所述通过轮询预设带外设备获取服务器的状态数据时,具体实现如下步骤:
按照预设轮询时间轮询服务器的预设带外设备获取所述服务器的状态数据,并将所述状态数据保存在所述轮询服务器对应的数据库中;定期轮询所述数据库以获取所述服务器的状态数据。
在一实施例中,所述处理器720用于运行存储在存储器中的程序代码实现所述将确定的故障等级添加至所述待处理事件并发送至终端以使所述终端显示所述待处理事件时,具体实现如下步骤:
将所述故障等级添加至所述待处理事件并发送至终端以使所述终端确定所述故障等级对应的预设显示方式并通过所述预设显示方式显示待处理事件。
应当理解,在本申请实施例中,处理器720可以是中央处理单元(CentralProcessingUnit,CPU),该处理器720还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable GateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
本领域技术人员可以理解,图7中示出的计算机设备700结构并不构成对计算机设备700的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
本领域普通技术人员可以理解的是实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,计算机程序可存储于一存储介质中,该存储介质为计算机可读存储介质。如本发明实施例中,该计算机程序可存储于计算机系统的存储介质中,并被该计算机系统中的至少一个处理器执行,以实现包括如上述各方法的实施例的流程步骤。
该计算机可读存储介质可以是磁碟、光盘、U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的几个实施例中,应该理解到,所揭露的服务器的监控装置和方法,可以通过其它的方式实现。例如,以上所描述的服务器的监控装置实施例仅仅是示意性的。例如,各个单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
本申请实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。
本申请实施例装置中的单元可以根据实际需要进行合并、划分和删减。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
该集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,终端,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种服务器的监控方法,其特征在于,包括:
通过轮询预设带外设备获取服务器的状态数据,所述预设带外设备安装在所述服务器中并与所述服务器建立通信连接,所述状态数据包括所述服务器的多个硬件组件对应的组件数据;
基于预设检测规则,根据所述组件数据检测所述状态数据是否存在故障;
若所述状态数据中存在故障,根据预设等级确定规则确定所述状态数据对应的故障等级;
获取所述服务器的主机信息,根据所述主机信息和状态数据生成待处理事件;
将确定的故障等级添加至所述待处理事件并发送至终端以使所述终端显示所述待处理事件。
2.根据权利要求1所述的服务器的监控方法,其特征在于,所述根据预设等级确定规则确定所述状态数据对应的故障等级,包括:
获取所述服务器的日志信息;
确定存在故障的组件数据所对应的组件类别;
根据所述日志信息确定所述组件类别对应的报警级别,并从所述报警级别中选定最高报警级别;;
根据所述最高报警级别确定所述状态数据对应的故障等级。
3.根据权利要求1所述的服务器的监控方法,其特征在于,所述根据预设等级确定规则确定所述状态数据对应的故障等级,包括:
获取所述组件数据中的参数值,所述参数值为所述硬件组件的状态采集值;
根据所述参数值确定所述状态数据对应的故障等级。
4.根据权利要求3所述的服务器的监控方法,其特征在于,所述根据所述参数值确定所述状态数据对应的故障等级,包括:
判断所述参数值是否大于预设标准值;
若所述参数值大于所述预设标准值,获取所述参数值的程度等级;
根据所述程度等级确定所述状态数据对应的故障等级。
5.根据权利要求2所述的服务器的监控方法,其特征在于,所述确定存在故障的组件数据所对应的组件类别之后,包括:
根据所述组件类别确定报警数量;以及
根据所述主机信息、报警数量和组件类别生成待处理事件。
6.根据权利要求1所述的服务器的监控方法,其特征在于,所述通过轮询预设带外设备获取服务器的状态数据,包括:
定期轮询第一服务器的数据库以获取所述服务器的状态数据,其中,所述服务器的状态数据由所述第一服务器按照预设轮询时间轮询所述预设带外设备获得并保存于所述数据库中。
7.根据权利要求1所述的服务器的监控方法,其特征在于,所述将确定的故障等级添加至所述待处理事件并发送至终端以使所述终端显示所述待处理事件,包括:
将所述故障等级添加至所述待处理事件并发送至终端以使所述终端确定所述故障等级对应的预设显示方式并通过所述预设显示方式显示所述待处理事件。
8.一种服务器的监控装置,其特征在于,包括:
轮询获取单元,用于通过轮询预设带外设备获取服务器的状态数据,所述预设带外设备安装在所述服务器中并与所述服务器建立通信连接,所述状态数据包括所述服务器的多个硬件组件对应的组件数据;
故障检测单元,用于基于预设检测规则,根据所述组件数据检测所述状态数据是否存在故障;
等级确定单元,用于若所述状态数据中存在故障,根据预设等级确定规则确定所述状态数据对应的故障等级;
获取生成单元,用于获取所述服务器的主机信息,根据所述主机信息和状态数据生成待处理事件;
添加发送单元,用于将确定的故障等级添加至所述待处理事件并发送至终端以使所述终端显示所述待处理事件。
9.一种计算机设备,其特征在于,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至7中任意一项所述方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器执行如权利要求1至7任意一项所述方法的步骤。
CN201810973009.9A 2018-08-24 2018-08-24 服务器的监控方法、装置、计算机设备及存储介质 Pending CN109189640A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810973009.9A CN109189640A (zh) 2018-08-24 2018-08-24 服务器的监控方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810973009.9A CN109189640A (zh) 2018-08-24 2018-08-24 服务器的监控方法、装置、计算机设备及存储介质

Publications (1)

Publication Number Publication Date
CN109189640A true CN109189640A (zh) 2019-01-11

Family

ID=64919773

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810973009.9A Pending CN109189640A (zh) 2018-08-24 2018-08-24 服务器的监控方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN109189640A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110674149A (zh) * 2019-09-12 2020-01-10 金蝶软件(中国)有限公司 业务数据处理方法、装置、计算机设备和存储介质
CN110781914A (zh) * 2019-09-12 2020-02-11 腾讯科技(深圳)有限公司 一种设备故障的监控处理方法、装置、设备和存储介质
CN111444031A (zh) * 2020-02-27 2020-07-24 平安科技(深圳)有限公司 服务器故障预警方法、装置、计算机设备及存储介质
CN111552615A (zh) * 2020-04-30 2020-08-18 深圳市智微智能软件开发有限公司 独立的计算机状态监测方法、装置、设备及存储介质
CN112084090A (zh) * 2020-09-03 2020-12-15 深信服科技股份有限公司 服务器管理方法、服务器、管理终端及存储介质
CN112215368A (zh) * 2020-09-18 2021-01-12 安徽三禾一信息科技有限公司 一种设备故障检测系统
CN112419655A (zh) * 2020-11-16 2021-02-26 浙江大华技术股份有限公司 一种报警信息推送方法、装置、设备及介质
CN113156999A (zh) * 2021-05-08 2021-07-23 一飞(海南)科技有限公司 一种集群编队飞机异常故障等级处理的方法、系统及应用
CN113326072A (zh) * 2021-05-24 2021-08-31 北京计算机技术及应用研究所 一种飞腾服务器平台下基于非易失内存的实时监控方法
CN113535506A (zh) * 2020-04-21 2021-10-22 上海际链网络科技有限公司 服务系统的监控方法及装置、存储介质、计算机设备
CN113708986A (zh) * 2020-05-21 2021-11-26 鸿富锦精密电子(天津)有限公司 服务器监控装置、方法及计算机可读存储介质
CN113722136A (zh) * 2021-08-11 2021-11-30 浪潮(山东)计算机科技有限公司 一种服务器故障处理方法、系统、电子设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040225689A1 (en) * 2003-05-08 2004-11-11 International Business Machines Corporation Autonomic logging support
CN105224436A (zh) * 2015-10-29 2016-01-06 曙光信息产业股份有限公司 一种服务器运行状态监控方法及装置
CN105791033A (zh) * 2016-05-09 2016-07-20 浪潮电子信息产业股份有限公司 一种调控服务器运行状态的方法、装置及系统
CN106227636A (zh) * 2016-07-20 2016-12-14 国网安徽省电力公司信息通信分公司 一种基于ipmi的数据中心带外管理系统
CN106603265A (zh) * 2015-10-14 2017-04-26 广达电脑股份有限公司 管理方法、服务控制器装置以及非暂态计算机可读介质
CN107483268A (zh) * 2017-09-20 2017-12-15 深圳市中润四方信息技术有限公司 一种告警处理方法及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040225689A1 (en) * 2003-05-08 2004-11-11 International Business Machines Corporation Autonomic logging support
CN106603265A (zh) * 2015-10-14 2017-04-26 广达电脑股份有限公司 管理方法、服务控制器装置以及非暂态计算机可读介质
CN105224436A (zh) * 2015-10-29 2016-01-06 曙光信息产业股份有限公司 一种服务器运行状态监控方法及装置
CN105791033A (zh) * 2016-05-09 2016-07-20 浪潮电子信息产业股份有限公司 一种调控服务器运行状态的方法、装置及系统
CN106227636A (zh) * 2016-07-20 2016-12-14 国网安徽省电力公司信息通信分公司 一种基于ipmi的数据中心带外管理系统
CN107483268A (zh) * 2017-09-20 2017-12-15 深圳市中润四方信息技术有限公司 一种告警处理方法及系统

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110781914B (zh) * 2019-09-12 2024-04-16 腾讯科技(深圳)有限公司 一种设备故障的监控处理方法、装置、设备和存储介质
CN110781914A (zh) * 2019-09-12 2020-02-11 腾讯科技(深圳)有限公司 一种设备故障的监控处理方法、装置、设备和存储介质
CN110674149B (zh) * 2019-09-12 2022-03-11 金蝶软件(中国)有限公司 业务数据处理方法、装置、计算机设备和存储介质
CN110674149A (zh) * 2019-09-12 2020-01-10 金蝶软件(中国)有限公司 业务数据处理方法、装置、计算机设备和存储介质
CN111444031A (zh) * 2020-02-27 2020-07-24 平安科技(深圳)有限公司 服务器故障预警方法、装置、计算机设备及存储介质
WO2021169270A1 (zh) * 2020-02-27 2021-09-02 平安科技(深圳)有限公司 服务器故障预警方法、装置、计算机设备及存储介质
CN113535506A (zh) * 2020-04-21 2021-10-22 上海际链网络科技有限公司 服务系统的监控方法及装置、存储介质、计算机设备
CN111552615A (zh) * 2020-04-30 2020-08-18 深圳市智微智能软件开发有限公司 独立的计算机状态监测方法、装置、设备及存储介质
CN113708986A (zh) * 2020-05-21 2021-11-26 鸿富锦精密电子(天津)有限公司 服务器监控装置、方法及计算机可读存储介质
US11537501B2 (en) 2020-05-21 2022-12-27 Fulian Precision Electronics (Tianjin) Co., Ltd. Method and device for monitoring server based on recordings of data from sensors, and non-transitory storage medium
CN112084090A (zh) * 2020-09-03 2020-12-15 深信服科技股份有限公司 服务器管理方法、服务器、管理终端及存储介质
CN112084090B (zh) * 2020-09-03 2024-02-23 深信服科技股份有限公司 服务器管理方法、服务器、管理终端及存储介质
CN112215368A (zh) * 2020-09-18 2021-01-12 安徽三禾一信息科技有限公司 一种设备故障检测系统
CN112419655A (zh) * 2020-11-16 2021-02-26 浙江大华技术股份有限公司 一种报警信息推送方法、装置、设备及介质
CN112419655B (zh) * 2020-11-16 2022-09-20 浙江大华技术股份有限公司 一种报警信息推送方法、装置、设备及介质
CN113156999A (zh) * 2021-05-08 2021-07-23 一飞(海南)科技有限公司 一种集群编队飞机异常故障等级处理的方法、系统及应用
CN113326072A (zh) * 2021-05-24 2021-08-31 北京计算机技术及应用研究所 一种飞腾服务器平台下基于非易失内存的实时监控方法
CN113326072B (zh) * 2021-05-24 2023-11-24 北京计算机技术及应用研究所 一种飞腾服务器平台下基于非易失内存的实时监控方法
CN113722136A (zh) * 2021-08-11 2021-11-30 浪潮(山东)计算机科技有限公司 一种服务器故障处理方法、系统、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN109189640A (zh) 服务器的监控方法、装置、计算机设备及存储介质
JP6373482B2 (ja) コンピュータ環境を統制し分析するためのインターフェース
US10462027B2 (en) Cloud network stability
CN108897665A (zh) 日志管理方法、装置、计算机设备及存储介质
CN101883028B (zh) 网络文件系统服务器的检测方法及装置
CN108763038A (zh) 告警数据的管理方法、装置、计算机设备及存储介质
US9092296B1 (en) Selectively updating firmware for multiple connected devices
JP7341244B2 (ja) クラスタ管理方法、装置、およびシステム
US9143412B1 (en) Proxy reporting for central management systems
US11012298B2 (en) Methods, systems, and computer readable mediums for selecting and configuring a computing system to support a replicated application
CN108880897A (zh) 服务器的验收方法、装置、计算机设备及存储介质
CN108153590A (zh) 管理硬件资源
CN108920103B (zh) 服务器的管理方法、装置、计算机设备及存储介质
CN112380089A (zh) 一种数据中心监控预警方法及系统
US9734709B1 (en) Instantiating an application based on connection with a device via a universal serial bus
US10282245B1 (en) Root cause detection and monitoring for storage systems
US10176033B1 (en) Large-scale event detector
CN104536926B (zh) 串口设备的控制方法及装置
CN109271270A (zh) 存储系统中底层硬件的故障排除方法、系统及相关装置
US20180139114A1 (en) Availability Counting Apparatus and Method
US10223189B1 (en) Root cause detection and monitoring for storage systems
US11861133B1 (en) Apparatus and methods of analyzing status of computing servers
CN113254245A (zh) 一种存储集群的故障检测方法和系统
CN115242602B (zh) 网络设备生命周期管理方法、装置、设备及介质
US11366651B2 (en) Framework for hardware-specific analytic plugins

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190111