CN118193316A - 服务器状态监控方法、装置和计算机设备 - Google Patents

服务器状态监控方法、装置和计算机设备 Download PDF

Info

Publication number
CN118193316A
CN118193316A CN202410277054.6A CN202410277054A CN118193316A CN 118193316 A CN118193316 A CN 118193316A CN 202410277054 A CN202410277054 A CN 202410277054A CN 118193316 A CN118193316 A CN 118193316A
Authority
CN
China
Prior art keywords
state
state information
target server
abnormal
component
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202410277054.6A
Other languages
English (en)
Inventor
刘岚
秦晓宁
陈颖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ningchang Information Technology Hangzhou Co ltd
Original Assignee
Ningchang Information Technology Hangzhou Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ningchang Information Technology Hangzhou Co ltd filed Critical Ningchang Information Technology Hangzhou Co ltd
Priority to CN202410277054.6A priority Critical patent/CN118193316A/zh
Publication of CN118193316A publication Critical patent/CN118193316A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Computer And Data Communications (AREA)

Abstract

本申请涉及一种服务器状态监控方法、装置和计算机设备。该方法包括:向目标服务器发送状态监控请求,状态监控请求用于获取目标服务器上部署的智能管理工具采集的目标服务器的部件状态信息;基于部件状态信息,确定目标服务器的状态监控结果。采用本方法能够高效对服务器状态进行监控。

Description

服务器状态监控方法、装置和计算机设备
技术领域
本申请涉及计算机安全技术领域,特别是涉及一种服务器状态监控方法、装置和计算机设备。
背景技术
随着计算机技术的飞速发展,服务器的应用场景越来越广泛。
相关技术中,服务器中的硬件部件较多,一旦服务器部件出现异常,就可能导致服务器无法正常运行。因此,对服务器的运行状态进行监控显得尤为重要。
发明内容
基于此,有必要针对上述技术问题,提供一种能够高效对服务器状态进行监控的服务器状态监控方法、装置和计算机设备。
第一方面,本申请提供了一种服务器状态监控方法,应用于状态监测终端,方法包括:
向目标服务器发送状态监控请求,状态监控请求用于获取目标服务器上部署的智能管理工具采集的目标服务器的部件状态信息;
基于部件状态信息,确定目标服务器的状态监控结果。
本申请实施例提供的技术方案中,状态监测终端向目标服务器发送状态监控请求,获取目标服务器上部署的智能管理工具采集的目标服务器的部件状态信息,接着基于部件状态信息,确定目标服务器的状态监控结果。该方法中,状态监测终端向目标服务器发送状态监控请求,以获取智能管理工具采集的目标服务器的部件状态信息,相当于状态监测终端通过调用智能管理工具,远程采集目标服务器的部件状态信息,在保障部件状态信息准确性的同时,提升了部件状态信息的采集效率。在此基础上,状态监测终端根据部件状态信息确定的状态监控结果也更准确。
在其中一个实施例中,基于部件状态信息,确定目标服务器的状态监控结果,包括:
检测部件状态信息中是否存在异常部件状态信息;
若存在,则根据异常部件状态信息确定目标服务器的状态监控结果;
若不存在,则确定目标服务器的状态监控结果为正常。
本申请实施例提供的技术方案中,对部件状态信息进行检测,在部件状态信息存在异常部件状态信息的情况下,缩小了确定状态监控结果的检测范围,并以该异常部件状态信息为依据,进一步确定状态监控结果,在一定程度上提升了状态监控结果的获取速度和有效性。
在其中一个实施例中,根据异常部件状态信息确定目标服务器的状态监控结果,包括:
根据异常部件状态信息获取对应的状态信息白名单表格;
若异常部件状态信息处于状态信息白名单表格中,则确定目标服务器的状态监控结果为正常;
若异常部件状态信息未处于状态信息白名单表格中,则确定目标服务器的状态监控结果为异常。
本申请实施例提供的技术方案中,将状态信息白名单表格与异常部件状态信息进行对比,将处于状态信息白名单表格中的异常部件状态信息进行过滤,排除目标服务器由于客观因素导致的异常部件状态信息,提升状态监控结果的准确性。
在其中一个实施例中,异常部件状态信息包括异常部件传感器和异常部件日志;根据异常部件状态信息获取对应的状态信息白名单表格,包括:
根据异常部件传感器,从状态信息白名单中确定传感器白名单表格;
根据异常部件日志,从状态信息白名单中确定日志白名单表格。
本申请实施例提供的技术方案中,对异常部件状态信息进行类型识别,根据异常部件状态信息的类型,快速有效确定出对应的日志白名单表格,进而提升异常部件状态信息与状态信息白名单表格的对比速度。
在其中一个实施例中,该方法还包括:
若异常部件状态信息未处于状态信息白名单表格中,根据异常部件状态信息生成异常信息表格;
输出异常信息表格。
本申请实施例提供的技术方案中,在异常部件状态信息未处于状态信息白名单表格中的情况下,根据状态监控结果为异常时对应的异常部件状态信息,生成异常信息表格,并将异常信息表格进行可视化展示,以便于管理人员及时获知目标服务器的异常状态,进而对目标服务器进行针对性维修。
在其中一个实施例中,状态监控请求携带采集间隔;采集间隔用于指示智能管理工具按照采集间隔采集目标服务器的部件状态信息。
本申请实施例提供的技术方案中,状态监测终端向目标服务器发送携带采集间隔的状态监控请求,指示智能管理工具按照采集间隔采集目标服务器的部件状态信息,在减轻智能管理工具采集部件状态信息压力的同时,也降低了状态监测终端对部件状态信息进行判断所产生的计算负担。
在其中一个实施例中,该方法还包括:
获取智能管理工具的运行状态;
在运行状态异常的情况下,向目标服务器发送采集停止指令;采集停止指令用于指示智能管理工具停止采集目标服务器的部件状态信息。
本申请实施例提供的技术方案中,在智能管理工具运行异常的情况下,指示智能管理工具停止采集目标服务器的部件状态信息,避免智能管理工具采集无效的部件状态信息,提升状态监测终端根据部件状态信息确定的状态监控结果的准确性。
在其中一个实施例中,获取智能管理工具的运行状态,包括:
向目标服务器发送运行状态请求,运行状态请求中携带状态上报周期;
接收目标服务器按照状态上报周期发送的智能管理工具的运行状态。
本申请实施例提供的技术方案中,状态监测终端以智能管理工具发送的运行状态为依据,确保智能管理工具采集的部件状态信息的有效性。另外,状态监测终端是按照状态上报周期接收的运行状态,相较于实时接收运行状态的方式而言,在达到相同监测效果的情况下,本申请实施例中的状态监测终端的计算负担更小。
第二方面,本申请还提供了一种服务器状态监控装置,该装置包括:
发送模块,用于向目标服务器发送状态监控请求,状态监控请求用于获取目标服务器上部署的智能管理工具采集的目标服务器的部件状态信息;
确定模块,用于基于部件状态信息,确定目标服务器的状态监控结果。
第三方面,本申请还提供了一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现上述第一方面中任一项实施例中的方法的步骤。
第四方面,本申请还提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述第一方面中任一项实施例中的方法的步骤。
第五方面,本申请还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述第一方面中任一项实施例中的方法的步骤。
附图说明
为了更清楚地说明本申请实施例或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为一个实施例中服务器状态监控方法的应用环境图;
图2为一个实施例中服务器状态监控方法的流程示意图;
图3为一个实施例中状态监控结果确定步骤的流程示意图;
图4为另一个实施例中状态监控结果确定步骤的流程示意图;
图5为一个实施例中异常信息表格获取步骤的流程示意图;
图6为另一个实施例中服务器状态监控方法的流程示意图;
图7为一个实施例中运行状态获取步骤的流程示意图;
图8为另一个实施例中服务器状态监控方法的流程示意图;
图9为一个实施例中服务器状态监控装置的结构框图;
图10为一个实施例中状态监测终端的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例提供的服务器状态监控方法,可以应用于如图1所示的应用环境中。其中,状态监测终端102通过网络与目标服务器104进行通信。数据存储系统可以存储目标服务器104需要处理的数据。数据存储系统可以集成在目标服务器104上,也可以放在云上或其他网络目标服务器上。其中,状态监测终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备,物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。
随着计算机技术的飞速发展,服务器的应用场景越来越广泛。在此情况下,对服务器的运行状态进行监控显得尤为重要。相关技术中,在对服务器的运行状态进行监控时,通常是对服务器的多个硬件进行长期监控,这样的监控方法往往需要投入大量的人力资源,并存在延长项目周期的潜在风险。基于此,如何提供一种高效的状态监控方法为亟待解决的技术问题。
下面以具体的实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
在一个示例性的实施例中,如图2所示,提供了一种服务器状态控制方法,以该方法应用于图1中的状态监测终端为例进行说明,包括以下步骤:
S201,向目标服务器发送状态监控请求,状态监控请求用于获取目标服务器上部署的智能管理工具采集的目标服务器的部件状态信息。
其中,目标服务器可以是边缘服务器,由于边缘服务器通常部署在极端环境中,为保障目标服务器的正常运行以及运维,需要对其状态进行监控。
本申请实施例中,状态监测终端与目标服务器远程通信连接,以支持状态监测终端远程监测目标服务器的运行状态。
在实际应用中,状态监测终端可以与多台服务器连接,同时实现对多台服务器的状态监控,即目标服务器可以是一台,也可以是一个服务器集群对应多台服务器。为简洁清楚地对本申请实施例的技术方案进行说明,下述以一台目标服务器为例进行说明。
可选的,状态监测终端预先部署有目标服务器的状态监控程序,通过执行该状态监控程序实现目标服务器的状态监控,获取状态监控结果。
具体的,状态监测终端向目标服务器发送状态监控请求,目标服务器响应于该状态监控请求,调用智能管理工具(比如ipmitool )采集目标服务器的部件状态信息,比如目标服务器上各硬件的温度信息、开关状态等。
其中,ipmitool是一款开源的命令行工具,通过智能化平台管理接口(Intelligent Platform Management Interface,IPMI)与目标服务器进行通信,用于管理远程服务器的硬件,可以直接运行在目标服务器上,获取目标服务器上各硬件对应的传感器采集到的信息,即部件状态信息,比如温度、电压、风扇工作状态、电源状态以及系统推送的记录异常事件的日志等。
在另一种场景中,智能管理工具还可以部署在状态监测终端,状态监测终端调用智能管理工具,获取目标服务器的部件状态信息。
S202,基于部件状态信息,确定目标服务器的状态监控结果。
状态监测终端在接收到智能管理工具发送的部件状态信息之后,进一步对部件状态信息进行判断,得到目标服务器的状态监控结果。本申请实施例,对状态监测终端对部件状态信息进行判断的方式不作限制。
示例性地,状态监测终端部署有状态监控模型,将部件状态信息输入至状态监控模型中,通过状态监控模型对部件状态信息进行识别,得到目标服务器的状态监控结果。
示例性地,状态监测终端调用第三方监测工具,将第三方监测工具对部件状态信息的识别结果作为目标服务器的状态监控结果。
本申请实施例中,状态监测终端向目标服务器发送状态监控请求,获取目标服务器上部署的智能管理工具采集的目标服务器的部件状态信息,接着基于部件状态信息,确定目标服务器的状态监控结果。该方法中,状态监测终端向目标服务器发送状态监控请求,以获取智能管理工具采集的目标服务器的部件状态信息,相当于状态监测终端通过调用智能管理工具,远程采集目标服务器的部件状态信息,在保障部件状态信息准确性的同时,提升了部件状态信息的采集效率。在此基础上,状态监测终端根据部件状态信息确定的状态监控结果也更准确。
前述实施例对获取状态监控结果的方式不作限制,也就意味着状态监测终端可以采用多种方式(比如模型识别、调用第三方工具等)对部件状态信息进行甄别,以获取状态监控结果。基于此,下面通过一个实施例对确定状态监控结果的一种可实现方式进行说明。
在一个示例性的实施例中,如图3所示,基于部件状态信息,确定目标服务器的状态监控结果,包括:
S301,检测部件状态信息中是否存在异常部件状态信息。
状态监测终端预先存储有各部件的状态管理标准,比如IPMI标准,按照预设的状态管理标准对部件状态信息进行检查,判断部件状态信息中是否存在异常部件状态信息。
S302,若存在,则根据异常部件状态信息确定目标服务器的状态监控结果。
需要说明的是,状态管理标准是适用于各服务器异常部件状态信息的普适性检测标准。
若部件状态信息中存在异常部件状态信息,意味着目标服务器可能存在运行隐患,此时可以对异常部件状态信息进行进一步检查,进而确定目标服务器的状态监控结果。
S303,若不存在,则确定目标服务器的状态监控结果为正常。
若部件状态信息中不存在异常部件状态信息,意味着目标服务器各部件的状态符合状态管理标准,则确定目标服务器的状态监控结果为正常。
本申请实施例中,对部件状态信息进行检测,在部件状态信息存在异常部件状态信息的情况下,缩小了确定状态监控结果的检测范围,并以该异常部件状态信息为依据,进一步确定状态监控结果,在一定程度上提升了状态监控结果的获取速度和有效性。
接下来,对前述实施例中在部件状态信息存在异常部件状态信息的情况下,以异常部件状态信息为依据,如何确定状态监控结果的一种实现方式进行说明。
在一个示例性的实施例中,如图4所示,根据异常部件状态信息确定目标服务器的状态监控结果,包括:
S401,根据异常部件状态信息获取对应的状态信息白名单表格。
状态监测终端预先存储有状态信息白名单表格,通过对比状态信息白名单表格与异常部件状态信息,确定目标服务器的状态监控结果。
其中,状态信息白名单表格是与目标服务器所对应的,包括由于客观原因导致目标服务器状态异常的部件状态信息表格,用于排除异常部件状态信息中客观的故障部件状态。
状态信息白名单表格可以是在目标服务器进行状态监控之前,工作人员手动检查目标服务器的实际部件在位情况,考虑到监控不在位传感器的状态位ns,读值为noreading属于正常情况,将这部分信息提前添加到对应的白名单表格里;并提前抓取sdr和sel日志信息,将抓取到的信息初步筛选出读值为no reading的连续传感器和状态为ns的离散传感器,以及服务器在运行期间不应该被记录的日志,记录在对应的白名单表格里。
需要强调的是,状态信息白名单表格与前述实施例中判断异常部件状态信息虽然都是用于对状态信息进行判断,但是二者的判断标准及目的均不相同。具体是,状态监测终端根据适用于所有服务器的普适性判断标准,对部件状态信息进行异常部件状态信息筛选,状态监测终端根据专门适用于目标服务器的判断标准(状态信息白名单表格),对异常部件状态信息进行客观性排查。
S402,若异常部件状态信息处于状态信息白名单表格中,则确定目标服务器的状态监控结果为正常。
若异常部件状态信息处于状态信息白名单表格中,意味着异常部件状态信息为客观原因导致的目标服务器的部件故障,不属于目标服务器的运行故障,则确定目标服务器的状态监控结果为正常。
S403,若异常部件状态信息未处于状态信息白名单表格中,则确定目标服务器的状态监控结果为异常。
若异常部件状态信息未处于状态信息白名单表格中,意味着异常部件状态信息属于目标服务器在运行过程中产生的故障,则确定目标服务器的状态监控结果为异常。
本申请实施例中,将状态信息白名单表格与异常部件状态信息进行对比,将处于状态信息白名单表格中的异常部件状态信息进行过滤,排除目标服务器由于客观因素导致的异常部件状态信息,提升状态监控结果的准确性。
由前述实施例可知,状态信息白名单表格可以是包括不同类别信息的状态白名单表格的汇总,比如传感器白名单表格、日志白名单表格等。基于此,状态监测终端对异常部件状态信息进行识别,确定异常部件状态信息的类别,接着,从状态信息白名单表格中确定与异常部件状态信息类别对应的状态信息白名单表格。
则在一个示例性的实施例中,异常部件状态信息包括异常部件传感器和异常部件日志;根据异常部件状态信息获取对应的状态信息白名单表格,包括:
根据异常部件传感器,从状态信息白名单中确定传感器白名单表格;根据异常部件日志,从状态信息白名单中确定日志白名单表格。
其中,异常部件传感器是指传感器检测到的硬件信息为异常,异常日志是指传感器监测到的某一连续时间段内的信息为异常。
状态监测终端在识别到异常部件状态信息为异常部件传感器的情况下,从状态信息白名单中确定与异常部件传感器对应的传感器白名单表格。具体的,若异常部件传感器为连续传感器,则确定连续传感器白名单表格,若异常部件传感器为离散传感器,则确定离散传感器白名单表格。
在识别到异常部件状态信息为异常部件日志的情况下,从状态信息白名单中确定与异常部件日志对应的日志白名单表格。
本申请实施例中,对异常部件状态信息进行类型识别,根据异常部件状态信息的类型,快速有效确定出对应的日志白名单表格,进而提升异常部件状态信息与状态信息白名单表格的对比速度。
在确定目标服务器的状态监控结果为异常的情况下,还可以进一步出具目标服务器异常的详细报告,以便于对目标服务器进行修复。则在一个示例性的实施例中,如图5所示,该方法还包括:
S501,若异常部件状态信息未处于状态信息白名单表格中,根据异常部件状态信息生成异常信息表格。
异常部件状态信息未处于状态信息白名单表格中,意味着异常部件状态信息属于目标服务器在运行过程中产生的故障,则将异常部件状态信息进行分类并汇总至预设的故障表格中,生成异常信息表格。
以异常部件状态信息包括异常连续传感器状态信息、异常离散传感器状态信息和异常日志信息为例,将异常连续传感器状态信息填充至异常连续传感器表格中、将异常离散传感器状态信息填充至异常离散传感器表格中,以及将异常日志信息填充至异常日志表格中,接着将异常连续传感器表格、异常离散传感器表格中和异常日志表格进行汇总,生成异常信息表格。
S502,输出异常信息表格。
将异常信息表格进行可视化展示,以便于管理人员及时获悉目标传感器的异常状态,以及异常状态对应的部件,实现针对性的管理。
本申请实施例中,在异常部件状态信息未处于状态信息白名单表格中的情况下,根据状态监控结果为异常时对应的异常部件状态信息,生成异常信息表格,并将异常信息表格进行可视化展示,以便于管理人员及时获知目标服务器的异常状态,进而对目标服务器进行针对性维修。
通常情况下,目标服务器上的部件繁多,且通常需要长时间监控。在此情况下,考虑到智能管理工具的采集压力以及状态监测终端的计算压力,可以指示智能管理工具对部件状态信息进行定时抓取,实现对目标服务器的状态监控。
则在一个示例性的实施例中,状态监控请求携带采集间隔;采集间隔用于指示智能管理工具按照采集间隔采集目标服务器的部件状态信息。
状态监测终端向目标服务器发送携带采集间隔的状态监控请求,指示智能管理工具按照采集间隔采集目标服务器的部件状态信息。这样一来,状态监测终端只需在各采集间隔,对智能管理工具采集的部件状态信息进行判断,获取一次目标服务器的状态监控结果。
本申请实施例中,状态监测终端向目标服务器发送携带采集间隔的状态监控请求,指示智能管理工具按照采集间隔采集目标服务器的部件状态信息,在减轻智能管理工具采集部件状态信息压力的同时,也降低了状态监测终端对部件状态信息进行判断所产生的计算负担。
状态监测终端对目标服务器进行状态监控的过程,是在智能管理工具采集目标服务器的部件状态信息的基础上进行的。可见,智能管理工具的正常运行,对获取准确的部件状态信息,以及获取准确的状态监控监控至关重要。基于此,有必要对智能管理工具的运行状态进行监控。
在一个示例性的实施例中,如图6所示,该方法还包括:
S601,获取智能管理工具的运行状态。
智能管理工具部署在目标服务器上,状态监测终端与目标服务器通信连接。基于此,目标服务器可以实时或者定时向状态监测终端发送智能管理工具的运行状态。
在一种场景中,状态监测终端按照预设的上报周期,接收目标服务器上报的智能管理工具的运行状态。其中,上报周期大于或等于智能管理工具采集部件状态信息的采集间隔。
在一个示例性的实施例中,如图7所示,获取智能管理工具的运行状态,包括:
S701,向目标服务器发送运行状态请求,运行状态请求中携带状态上报周期。
状态监测终端向目标服务器发送携带状态上报周期的运行状态请求,以指示目标服务器按照状态上报周期,向状态监测终端发送智能管理工具的运行状态。
S702,接收目标服务器按照状态上报周期发送的智能管理工具的运行状态。
按照状态上报周期,接收智能管理工具的运行状态。若运行状态正常,则忽略不计,继续根据部件状态信息确定目标服务器的状态监控结果;若运行异常,意味着智能管理工具采集到的部件状态信息可能存在偏差,此时可以采取必要的保护措施,例如停止监控、发起警报等。
本申请实施例中,状态监测终端以智能管理工具发送的运行状态为依据,确保智能管理工具采集的部件状态信息的有效性。另外,状态监测终端是按照状态上报周期接收的运行状态,相较于实时接收运行状态的方式而言,在达到相同监测效果的情况下,本申请实施例中的状态监测终端的计算负担更小。
S602,在运行状态异常的情况下,向目标服务器发送采集停止指令;采集停止指令用于指示智能管理工具停止采集目标服务器的部件状态信息。
若智能管理工具运行状态异常,意味着智能管理工具采集到的部件状态信息可能并不准确,也就无需继续进行状态监控,则指示智能管理工具停止采集目标服务器的部件状态信息。
若智能管理工具运行状态正常,则继续根据部件状态信息确定目标服务器的状态监控结果。
本申请实施例中,在智能管理工具运行异常的情况下,指示智能管理工具停止采集目标服务器的部件状态信息,避免智能管理工具采集无效的部件状态信息,提升状态监测终端根据部件状态信息确定的状态监控结果的准确性。
在一个实施例中,如图8所示,提供了一种服务器状态监控方法,应用于状态监测终端,该方法包括:
S801,向目标服务器发送状态监控请求,获取目标服务器上的部件状态信息。
状态监控请求用于获取目标服务器上部署的智能管理工具采集的目标服务器的部件状态信息。
S802,检测部件状态信息中是否存在异常部件状态信息。
S803,若存在,则根据异常部件状态信息获取对应的状态信息白名单表格。
根据异常部件离散传感器,确定离散传感器白名单表格;根据异常部件连续传感器,确定连续传感器白名单表格;根据异常部件日志,确定日志白名单表格。
S804,判断异常部件状态信息是否处于状态信息白名单表格中。
S805,若异常部件状态信息处于状态信息白名单表格中,则确定目标服务器的状态监控结果为正常。
另外,在部件状态信息中不存在异常部件状态信息的情况下,也确定目标服务器的状态监控结果为正常。
S806,若异常部件状态信息未处于状态信息白名单表格中,则确定目标服务器的状态监控结果为异常。
S807,根据异常部件状态信息生成异常信息表格。
S808,输出异常信息表格。
S809,接收目标服务器按照状态上报周期发送的智能管理工具的运行状态。
S810,在运行状态异常的情况下,向目标服务器发送采集停止指令;采集停止指令用于指示智能管理工具停止采集目标服务器的部件状态信息。
本申请实施例中,状态监测终端向目标服务器发送状态监控请求,获取目标服务器上部署的智能管理工具采集的目标服务器的部件状态信息,接着基于部件状态信息,确定目标服务器的状态监控结果。该方法中,状态监测终端向目标服务器发送状态监控请求,以获取智能管理工具采集的目标服务器的部件状态信息,相当于状态监测终端通过调用智能管理工具,远程采集目标服务器的部件状态信息,在保障部件状态信息准确性的同时,提升了部件状态信息的采集效率。在此基础上,状态监测终端根据部件状态信息确定的状态监控结果也更准确。
以状态监控终端通过执行状态监控程序,对目标服务器进行状态监控为例,对服务器状态监控方法进行说明,在一个实施例中,该方法包括:
(1)工作人员手动检查目标服务器的配置,根据目标服务器的用途确认正常的日志记录情况。
将不在位部件对应的连续传感器读值为no reading,输出到连续传感器白名单表格;将不在位部件对应的离散传感器状态为ns,输出到离散传感器白名单表格;将服务器在重启压力测试时可将重启日志输出到日志白名单表格,服务器正常运行时不会触发日志记录。
另外,设置状态监控程序运行状态的状态上报间隔。
(2)执行状态监控终端,判断智能管理工具采集的部件状态信息是否存在异常状态信息,并在部件状态信息中存在异常状态信息的情况下,将异常状态信息与对应的白名单表格进行对比,将不属于白名单表格的异常传感器章台信息或异常日志完整的记录到异常信息表格。
将连续传感器读值为No Reading,与连续传感器白名单表格对比,属于白名单则忽略,不属于白名单则保存到连续传感器异常表格;将离散传感器状态为ns,与离散传感器白名单表格对比,属于白名单则忽略,不属于白名单则保存到离散传感器异常表格;将抓取到的日志与日志白名单表格对比,属于白名单则忽略,不属于白名单则保存到日志异常表格。
(3)将异常信息表格可视化输出,并按照状态上报间隔,输出状态监控程序的运行状态。
本申请实施例中,通过智能管理工具抓取传感器和sel日志信息,将抓取到的信息与白名单表格对比后自动筛选出由部分由正常监控状态变为异常监控的传感器,以及在目标服务器运行期间不应备记录的日志,再把判断为异常的传感器和日志通知到管理人员;当状态监控程序没有抓取到服务器异常的情况时,按照状态上报间隔向管理人员反馈程序的运行情况。也就是说,本申请提供的技术方案中,需要在状态监控程序实际运行前检查目标服务器的各部件在位情况,将不监控的传感器和在目标服务器运行时会记录的正常日志提前加入的白名单表格中。在此基础上运行状态监控程序,将全程监控传感器状态与日志记录情况,自动排除由于客观原因无法监控的部件后实时监控目标服务器状态,并及时反馈状态监控程序的运行状态。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的服务器状态监控方法的服务器状态监控装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个服务器状态监控装置实施例中的具体限定可以参见上文中对于服务器状态监控方法的限定,在此不再赘述。
在一个示例性的实施例中,如图9所示,提供了一种服务器状态监控装置,包括:发送模块901和确定模块902,其中:
发送模块901,用于向目标服务器发送状态监控请求,状态监控请求用于获取目标服务器上部署的智能管理工具采集的目标服务器的部件状态信息;
确定模块902,用于基于部件状态信息,确定目标服务器的状态监控结果。
在一个示例性的实施例中,确定模块902,包括异常检测单元、第一确定单元和第二确定单元,其中:
异常检测单元,用于检测部件状态信息中是否存在异常部件状态信息;
第一确定单元,用于若存在,则根据异常部件状态信息确定目标服务器的状态监控结果;
第二确定单元,用于若不存在,则确定目标服务器的状态监控结果为正常。
在一个示例性的实施例中,第一确定单元包括:白名单获取子单元、第一确定子单元和第二确定子单元,其中:
白名单获取子单元,用于根据异常部件状态信息获取对应的状态信息白名单表格;
第一确定子单元,用于若异常部件状态信息处于状态信息白名单表格中,则确定目标服务器的状态监控结果为正常;
第二确定子单元,用于若异常部件状态信息未处于状态信息白名单表格中,则确定目标服务器的状态监控结果为异常。
在一个示例性的实施例中,白名单获取子单元,包括第一获取子单元和第二获取子单元,其中:
第一获取子单元,用于根据异常部件传感器,从状态信息白名单中确定传感器白名单表格;
第二获取子单元,用于根据异常部件日志,从状态信息白名单中确定日志白名单表格。
在一个示例性的实施例中,服务器状态监控装置,还包括:表格生成模块和表格输出模块,其中:
表格生成模块,用于若异常部件状态信息未处于状态信息白名单表格中,根据异常部件状态信息生成异常信息表格;
表格输出模块,用于输出异常信息表格。
在一个示例性的实施例中,状态监控请求携带采集间隔;采集间隔用于指示智能管理工具按照采集间隔采集目标服务器的部件状态信息。
在一个示例性的实施例中,服务器状态监控装置,还包括:状态获取模块和采集停止模块,其中:
状态获取模块,用于获取智能管理工具的运行状态;
采集停止模块,用于在运行状态异常的情况下,向目标服务器发送采集停止指令;采集停止指令用于指示智能管理工具停止采集目标服务器的部件状态信息。
在一个示例性的实施例中,状态获取模块,包括请求发送单元和状态接收单元,其中:
请求发送单元,用于向目标服务器发送运行状态请求,运行状态请求中携带状态上报周期;
状态接收单元,用于接收目标服务器按照状态上报周期发送的智能管理工具的运行状态。
上述服务器状态监控装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个示例性的实施例中,提供了一种计算机设备,该计算机设备可以是状态监测终端,其内部结构图可以如图10所示。该计算机设备包括处理器、存储器、输入/输出接口、通信接口、显示单元和输入装置。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口、显示单元和输入装置通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、移动蜂窝网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种服务器状态监控方法。该计算机设备的显示单元用于形成视觉可见的画面,可以是显示屏、投影装置或虚拟现实成像装置。显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图10中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个示例性的实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
向目标服务器发送状态监控请求,状态监控请求用于获取目标服务器上部署的智能管理工具采集的目标服务器的部件状态信息;
基于部件状态信息,确定目标服务器的状态监控结果。
在一个示例性的实施例中,处理器执行计算机程序时还实现以下步骤:
检测部件状态信息中是否存在异常部件状态信息;
若存在,则根据异常部件状态信息确定目标服务器的状态监控结果;
若不存在,则确定目标服务器的状态监控结果为正常。
在一个示例性的实施例中,处理器执行计算机程序时还实现以下步骤:
根据异常部件状态信息获取对应的状态信息白名单表格;
若异常部件状态信息处于状态信息白名单表格中,则确定目标服务器的状态监控结果为正常;
若异常部件状态信息未处于状态信息白名单表格中,则确定目标服务器的状态监控结果为异常。
在一个示例性的实施例中,处理器执行计算机程序时还实现以下步骤:
根据异常部件传感器,从状态信息白名单中确定传感器白名单表格;
根据异常部件日志,从状态信息白名单中确定日志白名单表格。
在一个示例性的实施例中,处理器执行计算机程序时还实现以下步骤:
若异常部件状态信息未处于状态信息白名单表格中,根据异常部件状态信息生成异常信息表格;
输出异常信息表格。
在一个示例性的实施例中,状态监控请求携带采集间隔;采集间隔用于指示智能管理工具按照采集间隔采集目标服务器的部件状态信息。
在一个示例性的实施例中,处理器执行计算机程序时还实现以下步骤:
获取智能管理工具的运行状态;
在运行状态异常的情况下,向目标服务器发送采集停止指令;采集停止指令用于指示智能管理工具停止采集目标服务器的部件状态信息。
在一个示例性的实施例中,处理器执行计算机程序时还实现以下步骤:
向目标服务器发送运行状态请求,运行状态请求中携带状态上报周期;
接收目标服务器按照状态上报周期发送的智能管理工具的运行状态。
在一个示例性的实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
向目标服务器发送状态监控请求,状态监控请求用于获取目标服务器上部署的智能管理工具采集的目标服务器的部件状态信息;
基于部件状态信息,确定目标服务器的状态监控结果。
在一个示例性的实施例中,计算机程序被处理器执行时还实现以下步骤:
检测部件状态信息中是否存在异常部件状态信息;
若存在,则根据异常部件状态信息确定目标服务器的状态监控结果;
若不存在,则确定目标服务器的状态监控结果为正常。
在一个示例性的实施例中,计算机程序被处理器执行时还实现以下步骤:
根据异常部件状态信息获取对应的状态信息白名单表格;
若异常部件状态信息处于状态信息白名单表格中,则确定目标服务器的状态监控结果为正常;
若异常部件状态信息未处于状态信息白名单表格中,则确定目标服务器的状态监控结果为异常。
在一个示例性的实施例中,计算机程序被处理器执行时还实现以下步骤:
根据异常部件传感器,从状态信息白名单中确定传感器白名单表格;
根据异常部件日志,从状态信息白名单中确定日志白名单表格。
在一个示例性的实施例中,计算机程序被处理器执行时还实现以下步骤:
若异常部件状态信息未处于状态信息白名单表格中,根据异常部件状态信息生成异常信息表格;
输出异常信息表格。
在一个示例性的实施例中,状态监控请求携带采集间隔;采集间隔用于指示智能管理工具按照采集间隔采集目标服务器的部件状态信息。
在一个示例性的实施例中,计算机程序被处理器执行时还实现以下步骤:
获取智能管理工具的运行状态;
在运行状态异常的情况下,向目标服务器发送采集停止指令;采集停止指令用于指示智能管理工具停止采集目标服务器的部件状态信息。
在一个示例性的实施例中,计算机程序被处理器执行时还实现以下步骤:
向目标服务器发送运行状态请求,运行状态请求中携带状态上报周期;
接收目标服务器按照状态上报周期发送的智能管理工具的运行状态。
在一个示例性的实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
向目标服务器发送状态监控请求,状态监控请求用于获取目标服务器上部署的智能管理工具采集的目标服务器的部件状态信息;
基于部件状态信息,确定目标服务器的状态监控结果。
在一个示例性的实施例中,计算机程序被处理器执行时还实现以下步骤:
检测部件状态信息中是否存在异常部件状态信息;
若存在,则根据异常部件状态信息确定目标服务器的状态监控结果;
若不存在,则确定目标服务器的状态监控结果为正常。
在一个示例性的实施例中,计算机程序被处理器执行时还实现以下步骤:
根据异常部件状态信息获取对应的状态信息白名单表格;
若异常部件状态信息处于状态信息白名单表格中,则确定目标服务器的状态监控结果为正常;
若异常部件状态信息未处于状态信息白名单表格中,则确定目标服务器的状态监控结果为异常。
在一个示例性的实施例中,计算机程序被处理器执行时还实现以下步骤:
根据异常部件传感器,从状态信息白名单中确定传感器白名单表格;
根据异常部件日志,从状态信息白名单中确定日志白名单表格。
在一个示例性的实施例中,计算机程序被处理器执行时还实现以下步骤:
若异常部件状态信息未处于状态信息白名单表格中,根据异常部件状态信息生成异常信息表格;
输出异常信息表格。
在一个示例性的实施例中,状态监控请求携带采集间隔;采集间隔用于指示智能管理工具按照采集间隔采集目标服务器的部件状态信息。
在一个示例性的实施例中,计算机程序被处理器执行时还实现以下步骤:
获取智能管理工具的运行状态;
在运行状态异常的情况下,向目标服务器发送采集停止指令;采集停止指令用于指示智能管理工具停止采集目标服务器的部件状态信息。
在一个示例性的实施例中,计算机程序被处理器执行时还实现以下步骤:
向目标服务器发送运行状态请求,运行状态请求中携带状态上报周期;
接收目标服务器按照状态上报周期发送的智能管理工具的运行状态。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要符合相关规定。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。

Claims (10)

1.一种服务器状态监控方法,其特征在于,应用于状态监测终端,所述方法包括:
向目标服务器发送状态监控请求,所述状态监控请求用于获取所述目标服务器上部署的智能管理工具采集的所述目标服务器的部件状态信息;
基于所述部件状态信息,确定所述目标服务器的状态监控结果。
2.根据权利要求1所述的方法,其特征在于,所述基于所述部件状态信息,确定所述目标服务器的状态监控结果,包括:
检测所述部件状态信息中是否存在异常部件状态信息;
若存在,则根据所述异常部件状态信息确定所述目标服务器的状态监控结果;
若不存在,则确定所述目标服务器的状态监控结果为正常。
3.根据权利要求2所述的方法,其特征在于,所述根据所述异常部件状态信息确定所述目标服务器的状态监控结果,包括:
根据所述异常部件状态信息获取对应的状态信息白名单表格;
若所述异常部件状态信息处于所述状态信息白名单表格中,则确定所述目标服务器的状态监控结果为正常;
若所述异常部件状态信息未处于所述状态信息白名单表格中,则确定所述目标服务器的状态监控结果为异常。
4.根据权利要求3所述的方法,其特征在于,所述异常部件状态信息包括异常部件传感器和异常部件日志;所述根据所述异常部件状态信息获取对应的状态信息白名单表格,包括:
根据所述异常部件传感器,从所述状态信息白名单中确定传感器白名单表格;
根据所述异常部件日志,从所述状态信息白名单中确定日志白名单表格。
5.根据权利要求3或4所述的方法,其特征在于,所述方法还包括:
若所述异常部件状态信息未处于所述状态信息白名单表格中,根据所述异常部件状态信息生成异常信息表格;
输出所述异常信息表格。
6.根据权利要求1-4任一项所述的方法,其特征在于,所述状态监控请求携带采集间隔;所述采集间隔用于指示所述智能管理工具按照所述采集间隔采集所述目标服务器的部件状态信息。
7.根据权利要求1-4任一项所述的方法,其特征在于,所述方法还包括:
获取所述智能管理工具的运行状态;
在所述运行状态异常的情况下,向所述目标服务器发送采集停止指令;所述采集停止指令用于指示所述智能管理工具停止采集所述目标服务器的部件状态信息。
8.根据权利要求7所述的方法,其特征在于,所述获取所述智能管理工具的运行状态,包括:
向所述目标服务器发送运行状态请求,所述运行状态请求中携带状态上报周期;
接收所述目标服务器按照所述状态上报周期发送的所述智能管理工具的运行状态。
9.一种服务器状态监控装置,其特征在于,所述装置包括:
发送模块,用于向目标服务器发送状态监控请求,所述状态监控请求用于获取所述目标服务器上部署的智能管理工具采集的所述目标服务器的部件状态信息;
确定模块,用于基于所述部件状态信息,确定所述目标服务器的状态监控结果。
10.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至8中任一项所述的方法的步骤。
CN202410277054.6A 2024-03-11 2024-03-11 服务器状态监控方法、装置和计算机设备 Pending CN118193316A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410277054.6A CN118193316A (zh) 2024-03-11 2024-03-11 服务器状态监控方法、装置和计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410277054.6A CN118193316A (zh) 2024-03-11 2024-03-11 服务器状态监控方法、装置和计算机设备

Publications (1)

Publication Number Publication Date
CN118193316A true CN118193316A (zh) 2024-06-14

Family

ID=91406081

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410277054.6A Pending CN118193316A (zh) 2024-03-11 2024-03-11 服务器状态监控方法、装置和计算机设备

Country Status (1)

Country Link
CN (1) CN118193316A (zh)

Similar Documents

Publication Publication Date Title
US9569325B2 (en) Method and system for automated test and result comparison
CN106101130B (zh) 一种网络恶意数据检测方法、装置及系统
CN109669798B (zh) 崩溃分析方法、装置、电子设备,及存储介质
JPH08297598A (ja) 計算機システム解析装置
US20140215279A1 (en) Scalable structured data store operations
CN108073499B (zh) 应用程序的测试方法及装置
CN102075368A (zh) 一种业务故障诊断方法、装置和系统
CN113708986B (zh) 服务器监控装置、方法及计算机可读存储介质
CN114398354A (zh) 数据监测方法、装置、电子设备及存储介质
CN114675791B (zh) 一种磁盘处理方法、系统及电子设备
JP6238221B2 (ja) ソフトウェアの実行を監視する装置、方法およびプログラム
CN115145788A (zh) 一种针对智能运维系统的检测数据生成方法和装置
JP2020525944A (ja) バス監視システム、方法および装置
CN118193316A (zh) 服务器状态监控方法、装置和计算机设备
CN116680147A (zh) Led显示屏的运行监控方法、装置及电子设备
CN116758645A (zh) 机器人巡检方法、系统、计算机设备和存储介质
JP2007207213A (ja) ワイヤレスデバイスのリアルタイム診断に適用する診断情報収集手法
JPH11212826A (ja) 障害情報出力方式及び装置
CN114024867B (zh) 网络异常检测方法及装置
JP2019028573A (ja) 表示制御プログラム、表示制御方法及び表示制御装置
CN117194157A (zh) 监控指标检查方法、装置、设备、介质和程序产品
JP2003345629A (ja) システム監視装置及びそれに用いるシステム監視方法並びにそのプログラム
CN117407282A (zh) 应用程序告警方法、装置、设备、存储介质和程序产品
CN115357138A (zh) 一种屏幕调试方法、设备及介质
CN118297399A (zh) 本质安全问题分析方法、装置、设备、存储介质和产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination