CN110851320A - 一种服务器宕机监管方法、系统、终端及存储介质 - Google Patents

一种服务器宕机监管方法、系统、终端及存储介质 Download PDF

Info

Publication number
CN110851320A
CN110851320A CN201910932131.6A CN201910932131A CN110851320A CN 110851320 A CN110851320 A CN 110851320A CN 201910932131 A CN201910932131 A CN 201910932131A CN 110851320 A CN110851320 A CN 110851320A
Authority
CN
China
Prior art keywords
information
server
utilization rate
abnormal information
resource utilization
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201910932131.6A
Other languages
English (en)
Inventor
张日洪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Wave Intelligent Technology Co Ltd
Original Assignee
Suzhou Wave Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Wave Intelligent Technology Co Ltd filed Critical Suzhou Wave Intelligent Technology Co Ltd
Priority to CN201910932131.6A priority Critical patent/CN110851320A/zh
Publication of CN110851320A publication Critical patent/CN110851320A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3024Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a central processing unit [CPU]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明提供一种服务器宕机监管方法、系统、终端及存储介质,包括:登录所有被监管服务器BMC;获取被监管服务器BMC日志并对所述日志进行故障信息筛查;利用Zabbix工具监控被监管服务器各部件资源使用率,并将超过预设阈值的部件资源使用率上报为异常信息;控制异常信息所在被监管服务器关闭多余后台进程;根据故障信息筛查到的故障信息和所述异常信息生成报警信息。本发明能够为后续分析故障原因、解决问题,提供准确的数据支撑,提高了运维人员工作效率,也避免了更大的宕机事故产生,从而实现了对所有服务器的监控管理。

Description

一种服务器宕机监管方法、系统、终端及存储介质
技术领域
本发明涉及服务器技术领域,具体涉及一种服务器宕机监管方法、系统、终端及存储介质。
背景技术
服务器宕机,一般情况下指的就是服务器主机出现意外故障而死机,或者一些服务器的某些服务挂掉了,或者锁死等都可以称为宕机。如今服务器使用在各行各业之中,担任着计算,存储,运算等重要作用,它给人们在工作和学习上提供了极大的方便。由于数量庞大的服务器不断负载运行的同时,不可避免会遇到各种宕机,故障等问题。如何有效的对服务器宕机进行监控管理,分析原因、判断故障、解决问题,这对于服务器的正常运行是非常有必要的。
发明内容
针对现有技术的上述不足,本发明提供一种服务器宕机监管方法、系统、终端及存储介质,以解决上述技术问题。
第一方面,本发明提供一种服务器宕机监管方法,包括:
登录所有被监管服务器BMC;
获取被监管服务器BMC日志并对所述日志进行故障信息筛查;
利用Zabbix工具监控被监管服务器各部件资源使用率,并将超过预设阈值的部件资源使用率上报为异常信息;
控制异常信息所在被监管服务器关闭多余后台进程;
根据故障信息筛查到的故障信息和所述异常信息生成报警信息。
进一步的,所述利用Zabbix工具监控被监管服务器各部件资源使用率并将超过预设阈值的部件资源使用率上报为异常信息,包括:
利用Zabbix工具监控被监管服务器的CPU使用率、内存使用率和硬盘使用率;
设置阈值为95%;
将超过95%的部件使用率上报为异常信息。
进一步的,所述控制异常信息所在被监管服务器关闭多余后台进程,包括:
采集所述异常信息所在被监管服务器的进程信息;
将监控时间段内未更新的进程关闭;
采集进程关闭后的被监管服务器的各部件资源使用率,若未超过预设阈值则删除所述异常信息。
进一步的,所述根据故障信息筛查到的故障信息和所述异常信息生成报警信息,包括:
获取所述异常信息的持续时间;
若所述持续时间超过预设时间阈值则将所述异常信息写入报警信息;
根据预存管理员通讯信息将所述报警信息推送至管理员终端。
第二方面,本发明提供一种服务器宕机监管系统,包括:
节点登录单元,配置用于登录所有被监管服务器BMC;
日志筛查单元,配置用于获取被监管服务器BMC日志并对所述日志进行故障信息筛查;
节点监控单元,配置用于利用Zabbix工具监控被监管服务器各部件资源使用率,并将超过预设阈值的部件资源使用率上报为异常信息;
进程关闭单元,配置用于控制异常信息所在被监管服务器关闭多余后台进程;
报警生成单元,配置用于根据故障信息筛查到的故障信息和所述异常信息生成报警信息。
进一步的,所述节点监控单元包括:
资源监控模块,配置用于利用Zabbix工具监控被监管服务器的CPU使用率、内存使用率和硬盘使用率;
阈值设置模块,配置用于设置阈值为95%;
异常上报模块,配置用于将超过95%的部件使用率上报为异常信息。
进一步的,所述进程关闭单元包括:
进程采集模块,配置用于采集所述异常信息所在被监管服务器的进程信息;
进程关闭模块,配置用于将监控时间段内未更新的进程关闭;
异常更新模块,配置用于采集进程关闭后的被监管服务器的各部件资源使用率,若未超过预设阈值则删除所述异常信息。
进一步的,所述报警生成单元包括:
时间获取模块,配置用于获取所述异常信息的持续时间;
写入判断模块,配置用于若所述持续时间超过预设时间阈值则将所述异常信息写入报警信息;
报警推送模块,配置用于根据预存管理员通讯信息将所述报警信息推送至管理员终端。
第三方面,提供一种终端,包括:
处理器、存储器,其中,
该存储器用于存储计算机程序,
该处理器用于从存储器中调用并运行该计算机程序,使得终端执行上述的终端的方法。
第四方面,提供了一种计算机存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述各方面所述的方法。
本发明的有益效果在于,
本发明提供的服务器宕机监管方法、系统、终端及存储介质,通过收集所有服务器节点BMC IP,收集后获取被监管服务器BMC日志,筛选其中的故障信息作为初步自检结果。然后利用Zabbix工具监控被监管服务器各部件资源使用率,并将超过预设阈值的部件资源使用率上报为异常信息,对于即将发生宕机故障的服务器,临时发送远程控制指令,关闭多余无效进程,降低资源的使用率等,避免发生更多更严重的服务器宕机事故。并及时发送预警报告给客户,让客户及时知晓,快速进行处理解决。本发明能够为后续分析故障原因、解决问题,提供准确的数据支撑,提高了运维人员工作效率,也避免了更大的宕机事故产生,从而实现了对所有服务器的监控管理。
此外,本发明设计原理可靠,结构简单,具有非常广泛的应用前景。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一个实施例的方法的示意性流程图。
图2是本发明一个实施例的系统的示意性框图。
图3为本发明实施例提供的一种终端的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
下面对本发明中出现的关键术语进行解释。
图1是本发明一个实施例的方法的示意性流程图。其中,图1执行主体可以为一种服务器宕机监管系统。
如图1所示,该方法100包括:
步骤110,登录所有被监管服务器BMC;
步骤120,获取被监管服务器BMC日志并对所述日志进行故障信息筛查;
步骤130,利用Zabbix工具监控被监管服务器各部件资源使用率,并将超过预设阈值的部件资源使用率上报为异常信息;
步骤140,控制异常信息所在被监管服务器关闭多余后台进程;
步骤150,根据故障信息筛查到的故障信息和所述异常信息生成报警信息。
可选地,作为本发明一个实施例,所述利用Zabbix工具监控被监管服务器各部件资源使用率并将超过预设阈值的部件资源使用率上报为异常信息,包括:
利用Zabbix工具监控被监管服务器的CPU使用率、内存使用率和硬盘使用率;
设置阈值为95%;
将超过95%的部件使用率上报为异常信息。
可选地,作为本发明一个实施例,所述控制异常信息所在被监管服务器关闭多余后台进程,包括:
采集所述异常信息所在被监管服务器的进程信息;
将监控时间段内未更新的进程关闭;
采集进程关闭后的被监管服务器的各部件资源使用率,若未超过预设阈值则删除所述异常信息。
可选地,作为本发明一个实施例,所述根据故障信息筛查到的故障信息和所述异常信息生成报警信息,包括:
获取所述异常信息的持续时间;
若所述持续时间超过预设时间阈值则将所述异常信息写入报警信息;
根据预存管理员通讯信息将所述报警信息推送至管理员终端。
为了便于对本发明的理解,下面以本发明服务器宕机监管方法的原理,结合实施例中对服务器进行宕机监管的过程,对本发明提供的服务器宕机监管方法做进一步的描述。
具体的,所述服务器宕机监管方法包括:
S1、登录所有被监管服务器BMC。
首先搭配一个主机该主机为测试机,确保主机和机房内各RMC以及各服务器的BMCIP能够ping通,并可根据默认用户名密码有效登陆。
S2、获取被监管服务器BMC日志并对所述日志进行故障信息筛查。
将机柜上RMC以及所有节点的syslog server IP设置为主机的IP,配置主机syslog服务器,确保主机能够接收到RMC以及BMC下的log.各节点系统IP和主机配置无密码,便于获取节点系统log。
预先设置日志采集周期,每隔采集周期采集所有被监管服务器的BMC日志,设置故障筛选关键词(如ERROR等)筛选BMC日志中的故障信息,将筛选出的故障信息标记所属服务器IP并保存。
S3、利用Zabbix工具监控被监管服务器各部件资源使用率,并将超过预设阈值的部件资源使用率上报为异常信息。
若步骤S2中未筛选出故障信息,则进一步执行本步骤,开始由Zabbix工具全面监控服务器运行状态,该工具也可根据BMC IP登陆web,分布式监空所有服务器,通过IPMI协议访问BMC,获取服务器所有硬件,软件信息,以及服务器后台运行程序的进度,CPU、内存、硬盘和其他部件使用率等。
当服务器各部件资源使用率达到95%时,就将该服务器的资源使用率信息生成异常信息上报。
S4、控制异常信息所在被监管服务器关闭多余后台进程。
设置一个进程更新监控时间段,实时采集异常信息所在被监管服务器的所有进程信息,监控时间持续设置的进程更新监控时间段后,将在这期间未更新的进程关闭。
当多余进程关闭完成后,重新执行步骤S3,此时若该服务器的资源使用率降低到不足95%后就将该服务器的异常信息删除。若还在95%以上则异常信息保持。
此外还可控制异常信息所在服务器的风扇全速转动或重启该服务器等。
S5、根据故障信息筛查到的故障信息和所述异常信息生成报警信息。
预存管理员通讯信息(如邮箱或手机号码)。若监管系统里某被监管服务器的异常信息持续时间达到预设的异常信息持续时间,则根据该异常信息生成报警信息,步骤S2中筛选出的故障信息也可写入报警信息,然后将报警信息通过通讯信息推送给管理员。
如图2示,该系统200包括:
节点登录单元210,配置用于登录所有被监管服务器BMC;
日志筛查单元220,配置用于获取被监管服务器BMC日志并对所述日志进行故障信息筛查;
节点监控单元230,配置用于利用Zabbix工具监控被监管服务器各部件资源使用率,并将超过预设阈值的部件资源使用率上报为异常信息;
进程关闭单元240,配置用于控制异常信息所在被监管服务器关闭多余后台进程;
报警生成单元250,配置用于根据故障信息筛查到的故障信息和所述异常信息生成报警信息。
可选地,作为本发明一个实施例,所述节点监控单元包括:
资源监控模块,配置用于利用Zabbix工具监控被监管服务器的CPU使用率、内存使用率和硬盘使用率;
阈值设置模块,配置用于设置阈值为95%;
异常上报模块,配置用于将超过95%的部件使用率上报为异常信息。
可选地,作为本发明一个实施例,所述进程关闭单元包括:
进程采集模块,配置用于采集所述异常信息所在被监管服务器的进程信息;
进程关闭模块,配置用于将监控时间段内未更新的进程关闭;
异常更新模块,配置用于采集进程关闭后的被监管服务器的各部件资源使用率,若未超过预设阈值则删除所述异常信息。
可选地,作为本发明一个实施例,所述报警生成单元包括:
时间获取模块,配置用于获取所述异常信息的持续时间;
写入判断模块,配置用于若所述持续时间超过预设时间阈值则将所述异常信息写入报警信息;
报警推送模块,配置用于根据预存管理员通讯信息将所述报警信息推送至管理员终端。
图3为本发明实施例提供的一种终端系统300的结构示意图,该终端系统300可以用于执行本发明实施例提供的服务器宕机监管方法。
其中,该终端系统300可以包括:处理器310、存储器320及通信单元330。这些组件通过一条或多条总线进行通信,本领域技术人员可以理解,图中示出的服务器的结构并不构成对本发明的限定,它既可以是总线形结构,也可以是星型结构,还可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
其中,该存储器320可以用于存储处理器310的执行指令,存储器320可以由任何类型的易失性或非易失性存储终端或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。当存储器320中的执行指令由处理器310执行时,使得终端300能够执行以下上述方法实施例中的部分或全部步骤。
处理器310为存储终端的控制中心,利用各种接口和线路连接整个电子终端的各个部分,通过运行或执行存储在存储器320内的软件程序和/或模块,以及调用存储在存储器内的数据,以执行电子终端的各种功能和/或处理数据。所述处理器可以由集成电路(Integrated Circuit,简称IC)组成,例如可以由单颗封装的IC所组成,也可以由连接多颗相同功能或不同功能的封装IC而组成。举例来说,处理器310可以仅包括中央处理器(Central Processing Unit,简称CPU)。在本发明实施方式中,CPU可以是单运算核心,也可以包括多运算核心。
通信单元330,用于建立通信信道,从而使所述存储终端可以与其它终端进行通信。接收其他终端发送的用户数据或者向其他终端发送用户数据。
本发明还提供一种计算机存储介质,其中,该计算机存储介质可存储有程序,该程序执行时可包括本发明提供的各实施例中的部分或全部步骤。所述的存储介质可为磁碟、光盘、只读存储记忆体(英文:read-only memory,简称:ROM)或随机存储记忆体(英文:random access memory,简称:RAM)等。
因此,本发明通过收集所有服务器节点BMC IP,收集后获取被监管服务器BMC日志,筛选其中的故障信息作为初步自检结果。然后利用Zabbix工具监控被监管服务器各部件资源使用率,并将超过预设阈值的部件资源使用率上报为异常信息,对于即将发生宕机故障的服务器,临时发送远程控制指令,关闭多余无效进程,降低资源的使用率等,避免发生更多更严重的服务器宕机事故。并及时发送预警报告给客户,让客户及时知晓,快速进行处理解决。本发明能够为后续分析故障原因、解决问题,提供准确的数据支撑,提高了运维人员工作效率,也避免了更大的宕机事故产生,从而实现了对所有服务器的监控管理,本实施例所能达到的技术效果可以参见上文中的描述,此处不再赘述。
本领域的技术人员可以清楚地了解到本发明实施例中的技术可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明实施例中的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中如U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质,包括若干指令用以使得一台计算机终端(可以是个人计算机,服务器,或者第二终端、网络终端等)执行本发明各个实施例所述方法的全部或部分步骤。
本说明书中各个实施例之间相同相似的部分互相参见即可。尤其,对于终端实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例中的说明即可。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统、系统和方法,可以通过其它的方式实现。例如,以上所描述的系统实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,系统或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
尽管通过参考附图并结合优选实施例的方式对本发明进行了详细描述,但本发明并不限于此。在不脱离本发明的精神和实质的前提下,本领域普通技术人员可以对本发明的实施例进行各种等效的修改或替换,而这些修改或替换都应在本发明的涵盖范围内/任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (10)

1.一种服务器宕机监管方法,其特征在于,包括:
登录所有被监管服务器BMC;
获取被监管服务器BMC日志并对所述日志进行故障信息筛查;
利用Zabbix工具监控被监管服务器各部件资源使用率,并将超过预设阈值的部件资源使用率上报为异常信息;
控制异常信息所在被监管服务器关闭多余后台进程;
根据故障信息筛查到的故障信息和所述异常信息生成报警信息。
2.根据权利要求1所述的方法,其特征在于,所述利用Zabbix工具监控被监管服务器各部件资源使用率并将超过预设阈值的部件资源使用率上报为异常信息,包括:
利用Zabbix工具监控被监管服务器的CPU使用率、内存使用率和硬盘使用率;
设置阈值为95%;
将超过95%的部件使用率上报为异常信息。
3.根据权利要求1所述的方法,其特征在于,所述控制异常信息所在被监管服务器关闭多余后台进程,包括:
采集所述异常信息所在被监管服务器的进程信息;
将监控时间段内未更新的进程关闭;
采集进程关闭后的被监管服务器的各部件资源使用率,若未超过预设阈值则删除所述异常信息。
4.根据权利要求1所述的方法,其特征在于,所述根据故障信息筛查到的故障信息和所述异常信息生成报警信息,包括:
获取所述异常信息的持续时间;
若所述持续时间超过预设时间阈值则将所述异常信息写入报警信息;
根据预存管理员通讯信息将所述报警信息推送至管理员终端。
5.一种服务器宕机监管系统,其特征在于,包括:
节点登录单元,配置用于登录所有被监管服务器BMC;
日志筛查单元,配置用于获取被监管服务器BMC日志并对所述日志进行故障信息筛查;
节点监控单元,配置用于利用Zabbix工具监控被监管服务器各部件资源使用率,并将超过预设阈值的部件资源使用率上报为异常信息;
进程关闭单元,配置用于控制异常信息所在被监管服务器关闭多余后台进程;
报警生成单元,配置用于根据故障信息筛查到的故障信息和所述异常信息生成报警信息。
6.根据权利要求5所述的系统,其特征在于,所述节点监控单元包括:
资源监控模块,配置用于利用Zabbix工具监控被监管服务器的CPU使用率、内存使用率和硬盘使用率;
阈值设置模块,配置用于设置阈值为95%;
异常上报模块,配置用于将超过95%的部件使用率上报为异常信息。
7.根据权利要求5所述的系统,其特征在于,所述进程关闭单元包括:
进程采集模块,配置用于采集所述异常信息所在被监管服务器的进程信息;
进程关闭模块,配置用于将监控时间段内未更新的进程关闭;
异常更新模块,配置用于采集进程关闭后的被监管服务器的各部件资源使用率,若未超过预设阈值则删除所述异常信息。
8.根据权利要求5所述的系统,其特征在于,所述报警生成单元包括:
时间获取模块,配置用于获取所述异常信息的持续时间;
写入判断模块,配置用于若所述持续时间超过预设时间阈值则将所述异常信息写入报警信息;
报警推送模块,配置用于根据预存管理员通讯信息将所述报警信息推送至管理员终端。
9.一种终端,其特征在于,包括:
处理器;
用于存储处理器的执行指令的存储器;
其中,所述处理器被配置为执行权利要求1-4任一项所述的方法。
10.一种存储有计算机程序的计算机可读存储介质,其特征在于,该程序被处理器执行时实现如权利要求1-4中任一项所述的方法。
CN201910932131.6A 2019-09-29 2019-09-29 一种服务器宕机监管方法、系统、终端及存储介质 Withdrawn CN110851320A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910932131.6A CN110851320A (zh) 2019-09-29 2019-09-29 一种服务器宕机监管方法、系统、终端及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910932131.6A CN110851320A (zh) 2019-09-29 2019-09-29 一种服务器宕机监管方法、系统、终端及存储介质

Publications (1)

Publication Number Publication Date
CN110851320A true CN110851320A (zh) 2020-02-28

Family

ID=69596212

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910932131.6A Withdrawn CN110851320A (zh) 2019-09-29 2019-09-29 一种服务器宕机监管方法、系统、终端及存储介质

Country Status (1)

Country Link
CN (1) CN110851320A (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111882163A (zh) * 2020-06-28 2020-11-03 京东数字科技控股有限公司 任务执行时效预警方法、装置、系统及存储介质
CN112486785A (zh) * 2020-11-06 2021-03-12 苏州浪潮智能科技有限公司 一种服务器定位宕机阶段的方法、系统、终端及存储介质
US20210334153A1 (en) * 2020-04-24 2021-10-28 Jabil Circuit (Shanghai) Co., Ltd. Remote error detection method adapted for a remote computer device to detect errors that occur in a service computer device
CN113590424A (zh) * 2021-07-30 2021-11-02 北京京东振世信息技术有限公司 一种故障监控方法、装置、设备及存储介质
CN113868036A (zh) * 2021-08-27 2021-12-31 苏州浪潮智能科技有限公司 服务器时序异常监测方法、系统、终端及存储介质
CN113901530A (zh) * 2021-09-10 2022-01-07 苏州浪潮智能科技有限公司 一种硬盘防御性预警保护的方法、装置、设备及可读介质
CN114157585A (zh) * 2021-12-09 2022-03-08 京东科技信息技术有限公司 一种业务资源监测的方法和装置
WO2022161100A1 (zh) * 2021-01-29 2022-08-04 苏州浪潮智能科技有限公司 一种边缘计算服务器复位的方法和设备
CN115858303A (zh) * 2022-12-24 2023-03-28 北京新数科技有限公司 一种基于Zabbix的服务器性能监控方法及系统
CN113672456B (zh) * 2021-08-06 2024-06-11 济南浪潮数据技术有限公司 应用平台的模块化自监听方法、系统、终端及存储介质

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210334153A1 (en) * 2020-04-24 2021-10-28 Jabil Circuit (Shanghai) Co., Ltd. Remote error detection method adapted for a remote computer device to detect errors that occur in a service computer device
CN111882163A (zh) * 2020-06-28 2020-11-03 京东数字科技控股有限公司 任务执行时效预警方法、装置、系统及存储介质
CN112486785A (zh) * 2020-11-06 2021-03-12 苏州浪潮智能科技有限公司 一种服务器定位宕机阶段的方法、系统、终端及存储介质
WO2022161100A1 (zh) * 2021-01-29 2022-08-04 苏州浪潮智能科技有限公司 一种边缘计算服务器复位的方法和设备
CN113590424A (zh) * 2021-07-30 2021-11-02 北京京东振世信息技术有限公司 一种故障监控方法、装置、设备及存储介质
CN113590424B (zh) * 2021-07-30 2024-05-17 北京京东振世信息技术有限公司 一种故障监控方法、装置、设备及存储介质
CN113672456B (zh) * 2021-08-06 2024-06-11 济南浪潮数据技术有限公司 应用平台的模块化自监听方法、系统、终端及存储介质
CN113868036B (zh) * 2021-08-27 2023-08-15 苏州浪潮智能科技有限公司 服务器时序异常监测方法、系统、终端及存储介质
CN113868036A (zh) * 2021-08-27 2021-12-31 苏州浪潮智能科技有限公司 服务器时序异常监测方法、系统、终端及存储介质
CN113901530B (zh) * 2021-09-10 2024-01-09 苏州浪潮智能科技有限公司 一种硬盘防御性预警保护的方法、装置、设备及可读介质
CN113901530A (zh) * 2021-09-10 2022-01-07 苏州浪潮智能科技有限公司 一种硬盘防御性预警保护的方法、装置、设备及可读介质
CN114157585A (zh) * 2021-12-09 2022-03-08 京东科技信息技术有限公司 一种业务资源监测的方法和装置
CN115858303A (zh) * 2022-12-24 2023-03-28 北京新数科技有限公司 一种基于Zabbix的服务器性能监控方法及系统
CN115858303B (zh) * 2022-12-24 2023-08-22 北京新数科技有限公司 一种基于Zabbix的服务器性能监控方法及系统

Similar Documents

Publication Publication Date Title
CN110851320A (zh) 一种服务器宕机监管方法、系统、终端及存储介质
CN108600029B (zh) 一种配置文件更新方法、装置、终端设备及存储介质
CN107612787B (zh) 一种基于Openstack开源云平台的云主机故障检测方法
CN103812699A (zh) 基于云计算的监控管理系统
CN107508722B (zh) 一种业务监控方法和装置
CN110309130A (zh) 一种用于主机性能监控的方法及装置
CN112073262B (zh) 一种云平台监控方法、装置、设备及系统
CN110727556A (zh) 一种bmc健康状态监控方法、系统、终端及存储介质
CN109254922B (zh) 一种服务器BMC Redfish功能的自动化测试方法及装置
CN103716173A (zh) 一种存储监控系统及监控告警发布的方法
CN108199901B (zh) 硬件报修方法、系统、设备、硬件管理服务器与存储介质
CN112529223A (zh) 一种设备故障报修方法、装置、服务器及储存介质
CN104618161A (zh) 一种应用集群监控装置及方法
CN108920103B (zh) 服务器的管理方法、装置、计算机设备及存储介质
CN113608964A (zh) 一种集群自动化监控方法、装置、电子设备及存储介质
CN115658420A (zh) 数据库监控方法及系统
CN111625386A (zh) 一种针对系统设备上电超时的监控方法和装置
CN108809729A (zh) 一种分布式系统中ctdb服务的故障处理方法及装置
CN113487182B (zh) 设备健康状态评估方法、装置、计算机设备和介质
CN111062503B (zh) 一种电网监控告警处理方法、系统、终端及存储介质
CN109271270A (zh) 存储系统中底层硬件的故障排除方法、系统及相关装置
CN115202958A (zh) 一种电力异常监控方法、装置、电子设备及存储介质
CN112486785B (zh) 一种服务器定位宕机阶段的方法、系统、终端及存储介质
CN114911578A (zh) 存储系统监控及故障收集方法、装置、终端及存储介质
CN114374627A (zh) 基板管理控制器重启的方法、装置、系统及服务器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20200228