CN111694707A - 一种小型服务器集群管理系统及方法 - Google Patents

一种小型服务器集群管理系统及方法 Download PDF

Info

Publication number
CN111694707A
CN111694707A CN202010444885.XA CN202010444885A CN111694707A CN 111694707 A CN111694707 A CN 111694707A CN 202010444885 A CN202010444885 A CN 202010444885A CN 111694707 A CN111694707 A CN 111694707A
Authority
CN
China
Prior art keywords
cluster
docking interface
terminal
information
remote terminal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202010444885.XA
Other languages
English (en)
Inventor
胥志泉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202010444885.XA priority Critical patent/CN111694707A/zh
Publication of CN111694707A publication Critical patent/CN111694707A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3089Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents
    • G06F11/3093Configuration details thereof, e.g. installation, enabling, spatial arrangement of the probes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/327Alarm or error message display
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/60Software deployment
    • G06F8/65Updates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/4401Bootstrapping
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/4401Bootstrapping
    • G06F9/442Shutdown

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Computing Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Mathematical Physics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明提供一种小型服务器集群管理系统及方法,所述系统包括:WEB端和远程终端,所述WEB端设有集群对接接口和终端对接接口;所述集群对接接口对接服务器集群;所述终端对接接口对接远程终端;所述WEB端包括数据处理层和数据存储层,所述数据处理层按照保存在所述数据存储层的规则对从集群对接接口上传的数据进行处理,并利用终端对接接口将处理结果发送至远程终端。本发明能够实时监控集群内的节点状态,并将监控结果发送至远程管理端,便于运维人员及时查看和处理,此外还能对集群内的节点进行开关机及重启管理和固件升级,实现了对小型集群的基本管理。

Description

一种小型服务器集群管理系统及方法
技术领域
本发明属于服务器技术领域,具体涉及一种小型服务器集群管理系统及方法。
背景技术
现有单个服务监控基本通过BMC、CMC、RMC来实现,其中BMC为单服务器的监控,CMC与RMC需要通过CMC板卡与RMC板卡来实现服务器多节点的监控。
大型的数据中心一般通过服务器管理软件来实现服务器管理,但对于小型的数据中心,大型的管理软件相对来说较为浪费,且软件金额较大。
目前,小型的数据中心并没有有效的监管方法,为了节省成本,很多小型数据中心无法采用数据中心的管理软件,因此大多依赖人工维护,对人力资源需求较大,且维护效果具有滞后性,降低了小型数据中心的使用性能。
发明内容
针对现有技术的上述不足,本发明提供一种小型服务器集群管理系统及方法,以解决上述技术问题。
第一方面,本发明提供一种小型服务器集群管理系统,包括:
WEB端和远程终端,所述WEB端设有集群对接接口和终端对接接口;所述集群对接接口对接服务器集群;所述终端对接接口对接远程终端;
所述WEB端包括数据处理层和数据存储层,所述数据处理层按照保存在所述数据存储层的规则对从集群对接接口上传的数据进行处理,并利用终端对接接口将处理结果发送至远程终端。
进一步的,所述数据存储层包括:
集群节点信息库、规则库、固件版本库和固件更新工具库。
进一步的,所述规则包括:
通过关键词筛选从各节点日志中筛选错误日志,若存在错误日志则生成报错信息;
从各节点BMC监控参数筛选超过预设阈值的异常参数,若存在异常参数则生成报错信息。
进一步的,所述终端对接接口包括:
命令接收模块,配置用于接收远程终端上传的命令;
文件接收模块,配置用于接收远程终端上传的固件升级文件;
报错推送模块,配置用于将报错信息推送至远程终端;
数据返回模块,配置用于将远程终端通过命令请求的数据返回至远程终端。
进一步的,所述集群对接接口包括:
节点信息调取模块,配置用于根据集群局域网地址列表从局域网通信服务器采集集群节点信息;
集群监控管理模块,配置用于通过IPMI指令采集集群各节点监控信息并通过IPMI指令控制集群节点运行状态。
进一步的,所述数据处理层还用于:
根据远程终端的固件升级指令从数据存储层调取相应固件版本升级文件;通过集群对接接口将固件版本升级文件发送至目标节点;调用固件升级工具通过集群对接接口向目标节点发送带外固件刷新指令。
第二方面,本发明提供一种小型服务器集群管理方法,包括:
通过集群对接接口从局域网通信服务器采集集群节点信息,所述集群节点信息用于远程登录集群各节点;
通过集群对接接口向集群目标节点发送IPMI信息采集命令采集目标节点的监控信息;
数据处理层根据保存在所述数据存储层的规则对采集的监控信息进行处理;
所述数据处理层将根据监控信息生成的报错信息通过终端对接接口推送至远程终端。
进一步的,所述方法还包括:
通过终端对接接口接收远终端发送的状态控制指令和目标节点信息,所述状态控制指令为开机指令、关机指令和重置指令的任意一种;
数据处理层生成与所述状态控制指令对应的IPMI电源控制命令;
将所述IPMI电源控制命令通过集群对接接口发送至所述目标节点。
进一步的,所述方法还包括:
通过终端对接接口接收远程终端发送的信息查看指令和目标节点信息;
数据处理层生成与所述信息查看指令对应的IPMI数据采集命令;
将所述IPMI数据采集命令通过集群对接接口发送至所述目标节点,调取目标节点的监控信息;
将所述监控信息通过终端对接接口发送至远程终端。
进一步的,所述方法还包括:
通过终端对接接口接收远程终端发送的固件更新文件和固件更新命令;
所述数据处理层将所述固件更新文件保存至数据存储层;
所述数据处理层根据固件更新命令将所述固件更新文件通过集群对接接口下发至目标节点;
所述数据处理层调用固件更新工具通过集群对接接口向目标节点下发带外固件刷新指令。
第三方面,提供一种终端,包括:
处理器、存储器,其中,
该存储器用于存储计算机程序,
该处理器用于从存储器中调用并运行该计算机程序,使得终端执行上述的终端的方法。
第四方面,提供了一种计算机存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述各方面所述的方法。
本发明的有益效果在于,
本发明提供的小型服务器集群管理系统及方法,通过建立WEB平台,并在WEB平台开设接口,使WEB平台能够对接集群和远程终端,并通过WEB平台对集群监控和处理,从而实现对小型集群的管理。本发明能够实时监控集群内的节点状态,并将监控结果发送至远程管理端,便于运维人员及时查看和处理,此外还能对集群内的节点进行开关机及重启管理和固件升级,实现了对小型集群的基本管理。
此外,本发明设计原理可靠,结构简单,具有非常广泛的应用前景。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一个实施例的系统的示意性框图。
图2是本发明一个实施例的方法的示意性流程图。
具体实施方式
为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
实施例1
本实施例提供一种小型服务器集群管理系统,系统包括:
WEB端和远程终端,WEB端设有集群对接接口和终端对接接口;集群对接接口对接服务器集群;终端对接接口对接远程终端;
WEB端包括数据处理层和数据存储层,数据处理层按照保存在数据存储层的规则对从集群对接接口上传的数据进行处理,并利用终端对接接口将处理结果发送至远程终端。
由此可以实现对集群监控信息的采集、处理和转发,维护人员可从远程终端实时获取集群信息。远程终端可以是手机APP。
实施例2
请参考图1,本实施例提供一种小型服务器集群管理系统,包括:
WEB端和远程终端,WEB端设有集群对接接口和终端对接接口;集群对接接口对接服务器集群;终端对接接口对接远程终端;
WEB端包括数据处理层和数据存储层,数据处理层按照保存在数据存储层的规则对从集群对接接口上传的数据进行处理,并利用终端对接接口将处理结果发送至远程终端。数据处理层还用于:根据远程终端的固件升级指令从数据存储层调取相应固件版本升级文件;通过集群对接接口将固件版本升级文件发送至目标节点;调用固件升级工具通过集群对接接口向目标节点发送带外固件刷新指令。
其中,数据存储层包括集群节点信息库、规则库、固件版本库和固件更新工具库。集群节点信息库中存储集群各节点的数据IP、BMCIP。规则库中保存规则包括通过关键词筛选从各节点日志中筛选错误日志,若存在错误日志则生成报错信息;从各节点BMC监控参数筛选超过预设阈值的异常参数,若存在异常参数则生成报错信息。固件版本库中保存远程终端上传的固件更新文件。固件更新工具库中保存常用的固件更新工具,如yafuflash工具。
终端对接接口包括:命令接收模块,配置用于接收远程终端上传的命令;文件接收模块,配置用于接收远程终端上传的固件升级文件;报错推送模块,配置用于将报错信息推送至远程终端;数据返回模块,配置用于将远程终端通过命令请求的数据返回至远程终端。
集群对接接口包括:节点信息调取模块,配置用于根据集群局域网地址列表从局域网通信服务器采集集群节点信息;集群监控管理模块,配置用于通过IPMI指令采集集群各节点监控信息并通过IPMI指令控制集群节点运行状态。
实施例3
图2是本发明一个实施例的方法的示意性流程图。如图2所示,该方法100包括:
步骤210,通过集群对接接口从局域网通信服务器采集集群节点信息,所述集群节点信息用于远程登录集群各节点;
步骤220,通过集群对接接口向集群目标节点发送IPMI信息采集命令采集目标节点的监控信息;
步骤230,数据处理层根据保存在所述数据存储层的规则对采集的监控信息进行处理;
步骤240,所述数据处理层将根据监控信息生成的报错信息通过终端对接接口推送至远程终端。
具体的,所述小型服务器集群管理方法包括:
S1、通过集群对接接口从局域网通信服务器采集集群节点信息,所述集群节点信息用于远程登录集群各节点
小型集群数据中心部署完成后,WEB平台通过集群服务器MAC列表(局域网地址列表)从DHCP((动态主机配置协议)是一个局域网的网络协议。)服务器识别集群所有节点的信息,如节点网络IP、BMC IP。自动将识别的节点添加至WEB平台,实现集群节点的快速上线管理。
将集群节点BMC设置为免密码登录,或者对节点登录密码进行统一设置。在获取到集群内所有节点的网络IP和BMC IP后,登录各计算节点和BMC。
S3、通过集群对接接口向集群目标节点发送IPMI信息采集命令采集目标节点的监控信息;数据处理层根据保存在所述数据存储层的规则对采集的监控信息进行处理;所述数据处理层将根据监控信息生成的报错信息通过终端对接接口推送至远程终端。
WEB端通过集群对接接口从已登录的BMC中实时采集监控参数,如风扇转速、CPU温度等。此外还采集BMC的告警信息。预先设置需要上报的告警项目(即设定规则),如风扇停转等严重影响节点运行的告警(也可以根据需要设置各监控参数项的告警阈值),将设定好的规则保存至规则库。然后数据处理层判断采集的BMC告警信息中是否有需要上报的告警项目,若有则需要生成平台告警。
从已登录的计算节点中实时采集系统日志,采集方法例如:集群对接接口通过ipmi协议获取日志,获取事件日志及所有日志,依据告警级别筛选警告、严重日志信息
获取系统事件日志:ipmitool–I lanplus–H ip
-U–P sel list
获取BMC故障日志:ipmitool–I lanplus–H ip-U–P raw 0x3c0x43 0x02
数据处理层从系统日志中筛选错误日志。预先设置需要上报的告警项目,如CPU占用率过高,通过关键词筛选判断错误日志中是否存在需要上报的告警项目,若存在则生成平台告警,若不存在则继续监控。
WEB端通过终端对接接口将平台告警推送至远程终端,远程终端为维护人员管理的终端,可以是手机APP,也可以是电脑程序。
S4、利用IPMI命令控制集群各节点的运行状态。
若WEB端终端对接接口接收到远程终端的状态控制指令,则数据处理层生成相应的IPMI电源控制命令,将IPMI电源控制命令通过集群对接接口下发至目标节点即可实现对目标节点运行状态的控制切换。
例如通过ipmi协议进行开关机控制,ipmitool–I lanplus–H ip-U–P chassispower off/on
S5、利用Yafuflash工具更新集群各节点的固件版本。
首先将更新需要的固件更新文件通过终端对接接口上传至WEB端的固件版本库,并发送固件更新命令,固件更新命令包括目标节点IP。WEB端根据固件更新命令从固件库中调取相应固件更新文件,将固件更新文件下发至目标节点,并调用Yafuflash工具(一种用于安装固件更新的工具),在目标节点安装固件更新文件,然后重启目标节点即可,固件刷新命令为:;./Yafuflash-nw-u<username>-p<password>-ip<BMCIP><image名称>。
S6、WEB端通过终端对接接口接收远程终端发送的信息查看指令和目标节点信息,数据处理层生成与所述信息查看指令对应的IPMI数据采集命令,IPMI数据采集命令与步骤S3相同。将IPMI数据采集命令通过集群对接接口发送至目标节点,调取目标节点的监控信息。将所述监控信息通过终端对接接口发送至远程终端。
尽管通过参考附图并结合优选实施例的方式对本发明进行了详细描述,但本发明并不限于此。在不脱离本发明的精神和实质的前提下,本领域普通技术人员可以对本发明的实施例进行各种等效的修改或替换,而这些修改或替换都应在本发明的涵盖范围内/任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (10)

1.一种小型服务器集群管理系统,其特征在于,所述系统包括:
WEB端和远程终端,所述WEB端设有集群对接接口和终端对接接口;所述集群对接接口对接服务器集群;所述终端对接接口对接远程终端;
所述WEB端包括数据处理层和数据存储层,所述数据处理层按照保存在所述数据存储层的规则对从集群对接接口上传的数据进行处理,并利用终端对接接口将处理结果发送至远程终端。
2.根据权利要求1所述的系统,其特征在于,所述数据存储层包括:
集群节点信息库、规则库、固件版本库和固件更新工具库。
3.根据权利要求1所述的系统,其特征在于,所述规则包括:
通过关键词筛选从各节点日志中筛选错误日志,若存在错误日志则生成报错信息;
从各节点BMC监控参数筛选超过预设阈值的异常参数,若存在异常参数则生成报错信息。
4.根据权利要求3所述的系统,其特征在于,所述终端对接接口包括:
命令接收模块,配置用于接收远程终端上传的命令;
文件接收模块,配置用于接收远程终端上传的固件升级文件;
报错推送模块,配置用于将报错信息推送至远程终端;
数据返回模块,配置用于将远程终端通过命令请求的数据返回至远程终端。
5.根据权利要求1所述的系统,其特征在于,所述集群对接接口包括:
节点信息调取模块,配置用于根据集群局域网地址列表从局域网通信服务器采集集群节点信息;
集群监控管理模块,配置用于通过IPMI指令采集集群各节点监控信息并通过IPMI指令控制集群节点运行状态。
6.根据权利要求2所述的系统,其特征在于,所述数据处理层还用于:
根据远程终端的固件升级指令从数据存储层调取相应固件版本升级文件;通过集群对接接口将固件版本升级文件发送至目标节点;调用固件升级工具通过集群对接接口向目标节点发送带外固件刷新指令。
7.一种小型服务器集群管理方法,其特征在于,所述方法包括:
通过集群对接接口从局域网通信服务器采集集群节点信息,所述集群节点信息用于远程登录集群各节点;
通过集群对接接口向集群目标节点发送IPMI信息采集命令采集目标节点的监控信息;
数据处理层根据保存在所述数据存储层的规则对采集的监控信息进行处理;
所述数据处理层将根据监控信息生成的报错信息通过终端对接接口推送至远程终端。
8.根据权利要求7所述的方法,其特征在于,所述方法还包括:
通过终端对接接口接收远终端发送的状态控制指令和目标节点信息,所述状态控制指令为开机指令、关机指令和重置指令的任意一种;
数据处理层生成与所述状态控制指令对应的IPMI电源控制命令;
将所述IPMI电源控制命令通过集群对接接口发送至所述目标节点。
9.根据权利要求7所述的方法,其特征在于,所述方法还包括:
通过终端对接接口接收远程终端发送的信息查看指令和目标节点信息;
数据处理层生成与所述信息查看指令对应的IPMI数据采集命令;
将所述IPMI数据采集命令通过集群对接接口发送至所述目标节点,调取目标节点的监控信息;
将所述监控信息通过终端对接接口发送至远程终端。
10.根据权利要求7所述的方法,其特征在于,所述方法还包括:
通过终端对接接口接收远程终端发送的固件更新文件和固件更新命令;
所述数据处理层将所述固件更新文件保存至数据存储层;
所述数据处理层根据固件更新命令将所述固件更新文件通过集群对接接口下发至目标节点;
所述数据处理层调用固件更新工具通过集群对接接口向目标节点下发带外固件刷新指令。
CN202010444885.XA 2020-05-23 2020-05-23 一种小型服务器集群管理系统及方法 Withdrawn CN111694707A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010444885.XA CN111694707A (zh) 2020-05-23 2020-05-23 一种小型服务器集群管理系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010444885.XA CN111694707A (zh) 2020-05-23 2020-05-23 一种小型服务器集群管理系统及方法

Publications (1)

Publication Number Publication Date
CN111694707A true CN111694707A (zh) 2020-09-22

Family

ID=72477485

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010444885.XA Withdrawn CN111694707A (zh) 2020-05-23 2020-05-23 一种小型服务器集群管理系统及方法

Country Status (1)

Country Link
CN (1) CN111694707A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112286755A (zh) * 2020-09-24 2021-01-29 曙光信息产业股份有限公司 集群服务器带外数据采集方法、装置和计算机设备
CN112468330A (zh) * 2020-11-13 2021-03-09 苏州浪潮智能科技有限公司 一种故障节点的设置方法、系统、设备以及介质
CN114301898A (zh) * 2022-01-13 2022-04-08 深圳市坤同智能仓储科技有限公司 设备数据动态下发及远程控制系统
CN114443439A (zh) * 2022-01-29 2022-05-06 北京百度网讯科技有限公司 基于arm服务器的控制方法、装置、设备以及存储介质

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112286755A (zh) * 2020-09-24 2021-01-29 曙光信息产业股份有限公司 集群服务器带外数据采集方法、装置和计算机设备
CN112286755B (zh) * 2020-09-24 2023-05-05 曙光信息产业股份有限公司 集群服务器带外数据采集方法、装置和计算机设备
CN112468330A (zh) * 2020-11-13 2021-03-09 苏州浪潮智能科技有限公司 一种故障节点的设置方法、系统、设备以及介质
CN112468330B (zh) * 2020-11-13 2022-12-06 苏州浪潮智能科技有限公司 一种故障节点的设置方法、系统、设备以及介质
CN114301898A (zh) * 2022-01-13 2022-04-08 深圳市坤同智能仓储科技有限公司 设备数据动态下发及远程控制系统
CN114301898B (zh) * 2022-01-13 2024-03-15 深圳市坤同智能仓储科技有限公司 设备数据动态下发及远程控制系统
CN114443439A (zh) * 2022-01-29 2022-05-06 北京百度网讯科技有限公司 基于arm服务器的控制方法、装置、设备以及存储介质

Similar Documents

Publication Publication Date Title
CN111694707A (zh) 一种小型服务器集群管理系统及方法
US8838286B2 (en) Rack-level modular server and storage framework
US9189349B2 (en) Distributed blade server system, management server and switching method
CN107612748B (zh) 一种多节点服务器功耗管理系统
JP2008519327A (ja) ネットワーク管理アプライアンス
CN102521099A (zh) 一种进程监控方法及进程监控系统
CN110851320A (zh) 一种服务器宕机监管方法、系统、终端及存储介质
CN105429791A (zh) 一种分布式服务状态检测器及方法
US8943191B2 (en) Detection of an unresponsive application in a high availability system
CN105450472A (zh) 一种自动获取服务器物理部件状态的方法及装置
CN102479142A (zh) 一种机架服务器系统及其监控方法
CN111698127A (zh) 一种网络内设备的状态监控系统、方法和装置
CN111488258A (zh) 一种用于软硬件运行状态分析与预警的系统
US20180324063A1 (en) Cloud-based system for device monitoring and control
CN113872795A (zh) 一种分布式服务器智能监控分析及故障处理系统及方法
CN111343016A (zh) 云服务器集群管理方法和装置
EP1622310B1 (en) Administration method and system for network management systems
US20030018780A1 (en) Method and apparatus for managing network devices
CN116149957A (zh) 一种通过bmc保存服务器上下电记录的方法
US11237892B1 (en) Obtaining data for fault identification
KR101556781B1 (ko) 네트웍 장비 예측 장애 및 수명 정보 서비스 시스템
TWI685740B (zh) 運用於資料中心的機櫃異常狀態的遠端排除方法(一)
JP2009014516A (ja) 地震警報システム
CN114510391A (zh) 一种融合基础架构监控管理系统
CN111414274A (zh) 运用于数据中心的机柜异常状态的远端排除方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20200922

WW01 Invention patent application withdrawn after publication