CN112769652B - 一种节点服务监控方法、装置、设备及介质 - Google Patents

一种节点服务监控方法、装置、设备及介质 Download PDF

Info

Publication number
CN112769652B
CN112769652B CN202110050026.7A CN202110050026A CN112769652B CN 112769652 B CN112769652 B CN 112769652B CN 202110050026 A CN202110050026 A CN 202110050026A CN 112769652 B CN112769652 B CN 112769652B
Authority
CN
China
Prior art keywords
service
node
monitoring
ctdb
target service
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110050026.7A
Other languages
English (en)
Other versions
CN112769652A (zh
Inventor
李二明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202110050026.7A priority Critical patent/CN112769652B/zh
Publication of CN112769652A publication Critical patent/CN112769652A/zh
Application granted granted Critical
Publication of CN112769652B publication Critical patent/CN112769652B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0823Errors, e.g. transmission errors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • H04L41/064Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis involving time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/50Testing arrangements

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请公开了一种节点服务监控方法、装置、设备及介质,包括:从CTDB的配置文件中获取目标服务对应的监控管理字段;若所述监控管理字段的内容为进行监控,则与所述目标服务的服务进程建立通信连接;定时执行服务检测命令,通过所述通信连接向所述服务进程发送请求消息;若在预设超时时间内没有获取到所述服务进程发送的应答消息,则判定所述目标服务存在异常。这样,以定时与相应的服务进程进行消息交互的方式对目标服务进行监控,能够提升服务监控的准确性,从而增强集群的稳定性。

Description

一种节点服务监控方法、装置、设备及介质
技术领域
本申请涉及集群技术领域,特别涉及一种节点服务监控方法、装置、设备及介质。
背景技术
集群通过某种服务对外提供业务,如samba、NFS等,如果该服务异常而无法被及时识别到,则可能会对业务造成影响。通过对该提供业务的服务进行监控管理是避免该问题的方法之一。
在现有的技术中,对节点进行服务监控的方法是通过查看服务的状态,如果状态正常,则认为该服务能够正常的为客户端提供业务。但实际场景中,虽然该服务状态是正常的,但进程内部可能存在错误,如进程阻塞、进程卡死等问题,这时该服务实际上是不能对外提供服务的。
发明内容
有鉴于此,本申请的目的在于提供一种节点服务监控方法、装置、设备及介质,能够提升服务监控的准确性,从而增强集群的稳定性。其具体方案如下:
第一方面,本申请公开了一种节点服务监控方法,包括:
从CTDB的配置文件中获取目标服务对应的监控管理字段;
若所述监控管理字段的内容为进行监控,则与所述目标服务的服务进程建立通信连接;
定时执行服务检测命令,通过所述通信连接向所述服务进程发送请求消息;
若在预设超时时间内没有获取到所述服务进程发送的应答消息,则判定所述目标服务存在异常。
可选的,所述方法还包括:
获取针对所述配置文件的配置信息;
基于所述配置信息在所述配置文件中配置所述监控管理字段、所述服务检测命令的执行间隔以及所述预设超时时间。
可选的,所述定时执行服务检测命令,包括:
启动定时检测事件,通过所述定时检测事件定时执行所述服务检测命令。
可选的,所述若在预设超时时间内没有获取到所述服务进程发送的应答消息,则判定所述目标服务存在异常之后,还包括:
对所述目标服务进行拉起操作。
可选的,所述若在预设超时时间内没有获取到所述服务进程发送的应答消息,则判定所述目标服务存在异常,包括:
通过CTDB主进程获取所述服务检测命令的执行结果;其中,所述执行结果为是否在预设超时时间内获取到所述服务进程发送的应答消息对应的标识信息;
若所述执行结果表示在预设超时时间内没有获取到所述服务进程发送的应答消息,则判定所述目标服务存在异常。
可选的,所述方法还包括:
若所述执行结果表示在预设超时时间内获取到所述服务进程发送的应答消息,则判定所述目标服务当前状态正常,并基于当前状态设置本节点的CTDB状态标志。
可选的,所述若在预设超时时间内没有获取到所述服务进程发送的应答消息,则判定所述目标服务存在异常之后,还包括:
将本节点的CTDB状态标志置为异常状态对应的标志值,以便集群主节点通过恢复进程监测到所述CTDB状态标志为异常状态对应的标志值时,进行数据库恢复操作以及虚拟IP重分配操作。
第二方面,本申请公开了一种节点服务监控装置,包括:
从CTDB的配置文件中获取目标服务对应的监控管理字段;
若所述监控管理字段的内容为进行监控,则与所述目标服务的服务进程建立通信连接;
定时执行服务检测命令,通过所述通信连接向所述服务进程发送请求消息;
若在预设超时时间内没有获取到所述服务进程发送的应答消息,则判定所述目标服务存在异常。
第三方面,本申请公开了一种电子设备,包括:
存储器,用于保存计算机程序;
处理器,用于执行所述计算机程序,以实现前述的节点服务监控方法。
第四方面,本申请公开了一种计算机可读存储介质,用于保存计算机程序,所述计算机程序被处理器执行时实现前述的节点服务监控方法。
可见,本申请先从CTDB的配置文件中获取目标服务对应的监控管理字段,若所述监控管理字段的内容为进行监控,则与所述目标服务的服务进程建立通信连接,定时执行服务检测命令,通过所述通信连接向所述服务进程发送请求消息;若在预设超时时间内没有获取到所述服务进程发送的应答消息,则判定所述目标服务存在异常。也即,本申请基于CTDB的配置文件中服务对应的监控管理字段,确定目标服务是否需要被监控,若需要监控,则以定时与相应的服务进程进行消息交互的方式对目标服务进行监控,这样,能够提升服务监控的准确性,从而增强集群的稳定性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请公开的一种节点服务监控方法流程图;
图2为本申请公开的一种具体的节点服务监控方法流程图;
图3为本申请公开的一种具体的节点服务监控方法流程图;
图4为本申请公开的一种具体的节点服务监控方法子流程图;
图5为本申请公开的一种节点服务监控装置结构示意图;
图6为本申请公开的一种电子设备结构图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
在现有的技术中,对节点进行服务监控的方法是通过查看服务的状态,如果状态正常,则认为该服务能够正常的为客户端提供业务。但实际场景中,虽然该服务状态是正常的,但进程内部可能存在错误,如进程阻塞、进程卡死等问题,这时该服务实际上是不能对外提供服务的。为此,本申请提供了一种节点服务监控方法,能够提升服务监控的准确性,从而增强集群的稳定性。
参见图1所示,本申请实施例公开了一种节点服务监控方法,包括:
步骤S11:从CTDB(Cluster Trivial Database,集群TDB数据库)的配置文件中获取目标服务对应的监控管理字段。
在具体的实施方式中,本实施例可以获取针对所述配置文件的配置信息;基于所述配置信息在所述配置文件中配置所述监控管理字段、服务检测命令的执行间隔以及预设超时时间。
步骤S12:若所述监控管理字段的内容为进行监控,则与所述目标服务的服务进程建立通信连接。
在具体的实施方式中,本申请实施例可以提供一个服务管理开关,配置在CTDB的配置文件中,如果需要CTDB管理某种服务,则需配置相应的监控管理字段并将该字段置为YES,若无需CTDB管理某种服务,则需将相应的监控管理字段删除或置为NO。CTDB运行时,通过判断相应的字段来确认是否管理该服务。
并且,在具体的实施方式中,本申请实施例可以与所述目标服务的服务进程建立TCP连接。
步骤S13:定时执行服务检测命令,通过所述通信连接向所述服务进程发送请求消息。
在具体的实施方式中,本申请实施例可以启动定时检测事件,通过所述定时检测事件定时执行所述服务检测命令。
步骤S14:若在预设超时时间内没有获取到所述服务进程发送的应答消息,则判定所述目标服务存在异常。
进一步的,在具体的实施方式中,本实施例在判定所述目标服务存在异常之后,还可以对所述目标服务进行拉起操作。
例如,参见图2所示,图2为本申请实施例中公开的一种具体的节点服务监控方法流程图。通过CTDB对samba服务进行监控管理。CTDB启动时,CTDB从配置文件中获取samba服务的监控管理字段CTDB_SMB_MANGERS,判断该字段是否为YES,若为YES,则CTDB将与SMB进程建立相应的TCP连接,并启动定时检测事件,完成后CTDB正常启动运行。若无该字段或该字段配置为NO,则不会影响CTDB的正常启动及运行。若CTDB确认管理samba服务,则定时检测事件启动之后,会间隔一定时间去检测该服务是否异常,该定时检测事件执行时间间隔,可在CTDB的配置文件中进行配置。
这样,可以通过定时检测事件执行CTDB服务检测命令,向进行监控管理的服务发送消息,如果在规定的时间内收到回复消息,则认为该服务运行正常;如果在超时仍未收到消息回复,则认为该服务异常,CTDB对该服务执行相应的拉起操作。
可见,本申请实施例先从CTDB的配置文件中获取目标服务对应的监控管理字段,若所述监控管理字段的内容为进行监控,则与所述目标服务的服务进程建立通信连接,定时执行服务检测命令,通过所述通信连接向所述服务进程发送请求消息;若在预设超时时间内没有获取到所述服务进程发送的应答消息,则判定所述目标服务存在异常。也即,本申请实施例基于CTDB的配置文件中服务对应的监控管理字段,确定目标服务是否需要被监控,若需要监控,则以定时与相应的服务进程进行消息交互的方式对目标服务进行监控,这样,能够提升服务监控的准确性,从而增强集群的稳定性。
参见图3所示,本申请实施例公开了一种具体的节点服务监控方法,包括:
步骤S21:从CTDB的配置文件中获取目标服务对应的监控管理字段。
步骤S22:若所述监控管理字段的内容为进行监控,则与所述目标服务的服务进程建立通信连接。
步骤S23:定时执行服务检测命令,通过所述通信连接向所述服务进程发送请求消息。
步骤S24:若在预设超时时间内没有获取到所述服务进程发送的应答消息,则判定所述目标服务存在异常。
步骤S25:将本节点的CTDB状态标志置为异常状态对应的标志值,以便集群主节点通过恢复进程监测到所述CTDB状态标志为异常状态对应的标志值时,进行数据库恢复操作以及虚拟IP重分配操作。
在具体的实施方式中,本实施例可以通过CTDB主进程获取所述服务检测命令的执行结果;其中,所述执行结果为是否在预设超时时间内获取到所述服务进程发送的应答消息对应的标识信息;若所述执行结果表示在预设超时时间内没有获取到所述服务进程发送的应答消息,则判定所述目标服务存在异常。并且,若所述执行结果表示在预设超时时间内获取到所述服务进程发送的应答消息,则判定所述目标服务当前状态正常,并基于当前状态设置本节点的CTDB状态标志。
例如,参见图4所示,图4为本申请实施例公开的一种具体的节点服务监控方法子流程图。定时事件到来之后,该定时事件执行该CTDB检测命令,该命令执行时,通过已经建立的TCP连接向SMB进程发送request消息,如果在超时时间内收到response消息,则该命令执行结果返回0,并将该结果返回到CTDB主进程。若在超时时间内没有收到response消息,则该命令的执行结果返回-1并将该结果返回给CTDB进程,并尝试拉起该服务。主进程在收到该命令的执行结果后,如果为0,则将该节点的CTDB状态标志修改为OK,若已经为OK,则不作修改;若该结果为-1,则主进程将该节点的CTDB状态标志修改为UNHEALTHY,当集群中主节点的CTDB恢复进程检测到CTDB状态标志为UNHEALTHY,则CTDB恢复进程会执行数据库恢复和虚拟IP重分配操作,将故障节点的IP分配至集群中正常节点。
需要指出的是,当节点中服务出现异常时,及时的识别服务异常,并进行数据库恢复以及虚拟IP重分配,能够减少对客户端业务的影响。
参见图5所示,本申请实施例公开了一种节点服务监控装置,包括:
监控管理字段获取模块11,用于从CTDB的配置文件中获取目标服务对应的监控管理字段;
通信连接建立模块12,用于若所述监控管理字段的内容为进行监控,则与所述目标服务的服务进程建立通信连接;
服务检测命令执行模块13,用于定时执行服务检测命令,通过所述通信连接向所述服务进程发送请求消息;
目标服务状态判断模块14,用于若在预设超时时间内没有获取到所述服务进程发送的应答消息,则判定所述目标服务存在异常。
可见,本申请实施例先从CTDB的配置文件中获取目标服务对应的监控管理字段,若所述监控管理字段的内容为进行监控,则与所述目标服务的服务进程建立通信连接,定时执行服务检测命令,通过所述通信连接向所述服务进程发送请求消息;若在预设超时时间内没有获取到所述服务进程发送的应答消息,则判定所述目标服务存在异常。也即,本申请实施例基于CTDB的配置文件中服务对应的监控管理字段,确定目标服务是否需要被监控,若需要监控,则以定时与相应的服务进程进行消息交互的方式对目标服务进行监控,这样,能够提升服务监控的准确性,从而增强集群的稳定性。
并且,所述装置还包括:
配置信息获取模块,用于获取针对所述配置文件的配置信息;
配置文件配置模块,用于基于所述配置信息在所述配置文件中配置所述监控管理字段、所述服务检测命令的执行间隔以及所述预设超时时间。
其中,所述服务检测命令执行模块13,具体用于启动定时检测事件,通过所述定时检测事件定时执行所述服务检测命令。
所述装置还包括:
服务拉起模块,用于对所述目标服务进行拉起操作。
其中,所述目标服务状态判断模块14,具体用于通过CTDB主进程获取所述服务检测命令的执行结果;其中,所述执行结果为是否在预设超时时间内获取到所述服务进程发送的应答消息对应的标识信息;若所述执行结果表示在预设超时时间内没有获取到所述服务进程发送的应答消息,则判定所述目标服务存在异常;若所述执行结果表示在预设超时时间内获取到所述服务进程发送的应答消息,则判定所述目标服务当前状态正常。
进一步的,所述装置还包括CTDB状态标志设置模块,用于若目标服务状态判断模块14判定所述目标服务当前状态正常,基于当前状态设置本节点的CTDB状态标志。
并且,所述CTDB状态标志设置模块,还用于若所述目标服务状态判断模块14判定所述目标服务存在异常,则将本节点的CTDB状态标志置为异常状态对应的标志值,以便集群主节点通过恢复进程监测到所述CTDB状态标志为异常状态对应的标志值时,进行数据库恢复操作以及虚拟IP重分配操作。
参见图6所述,本申请实施例公开了一种电子设备20,包括处理器21和存储器22;其中,所述存储器22,用于保存计算机程序;所述处理器21,用于执行所述计算机程序,以实现以下步骤:
从CTDB的配置文件中获取目标服务对应的监控管理字段;若所述监控管理字段的内容为进行监控,则与所述目标服务的服务进程建立通信连接;定时执行服务检测命令,通过所述通信连接向所述服务进程发送请求消息;若在预设超时时间内没有获取到所述服务进程发送的应答消息,则判定所述目标服务存在异常。
可见,本申请实施例先从CTDB的配置文件中获取目标服务对应的监控管理字段,若所述监控管理字段的内容为进行监控,则与所述目标服务的服务进程建立通信连接,定时执行服务检测命令,通过所述通信连接向所述服务进程发送请求消息;若在预设超时时间内没有获取到所述服务进程发送的应答消息,则判定所述目标服务存在异常。也即,本申请实施例基于CTDB的配置文件中服务对应的监控管理字段,确定目标服务是否需要被监控,若需要监控,则以定时与相应的服务进程进行消息交互的方式对目标服务进行监控,这样,能够提升服务监控的准确性,从而增强集群的稳定性。
关于上述步骤的具体过程可以参考前述实施例中公开的相应内容,在此不再进行赘述。
并且,所述存储器22作为资源存储的载体,可以是只读存储器、随机存储器、磁盘或者光盘等,存储方式可以是短暂存储或者永久存储。
另外,所述电子设备20还包括电源23、通信接口24、输入输出接口25和通信总线26;其中,所述电源23用于为所述电子设备20上的各硬件设备提供工作电压;所述通信接口24能够为所述电子设备20创建与外界设备之间的数据传输通道,其所遵循的通信协议是能够适用于本申请技术方案的任意通信协议,在此不对其进行具体限定;所述输入输出接口25,用于获取外界输入数据或向外界输出数据,其具体的接口类型可以根据具体应用需要进行选取,在此不进行具体限定。
进一步的,本申请实施例还公开了一种计算机可读存储介质,用于保存计算机程序,其中,所述计算机程序被处理器执行时实现前述实施例公开的节点服务监控方法。
关于上述节点服务监控方法的具体过程可以参考前述实施例中公开的相应内容,在此不再进行赘述。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上对本申请所提供的一种节点服务监控方法、装置、设备及介质进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (9)

1.一种节点服务监控方法,其特征在于,包括:
从CTDB的配置文件中获取目标服务对应的监控管理字段;
若所述监控管理字段的内容为进行监控,则与所述目标服务的服务进程建立通信连接;
定时执行服务检测命令,通过所述通信连接向所述服务进程发送请求消息;
若在预设超时时间内没有获取到所述服务进程发送的应答消息,则判定所述目标服务存在异常;
所述若在预设超时时间内没有获取到所述服务进程发送的应答消息,则判定所述目标服务存在异常之后,还包括:将本节点的CTDB状态标志置为异常状态对应的标志值,以便集群主节点通过恢复进程监测到所述CTDB状态标志为异常状态对应的标志值时,进行数据库恢复操作以及虚拟IP重分配操作;其中,所述虚拟IP重分配操作,具体为将故障节点的虚拟IP分配至集群中正常节点。
2.根据权利要求1所述的节点服务监控方法,其特征在于,还包括:
获取针对所述配置文件的配置信息;
基于所述配置信息在所述配置文件中配置所述监控管理字段、所述服务检测命令的执行间隔以及所述预设超时时间。
3.根据权利要求1所述的节点服务监控方法,其特征在于,所述定时执行服务检测命令,包括:
启动定时检测事件,通过所述定时检测事件定时执行所述服务检测命令。
4.根据权利要求1所述的节点服务监控方法,其特征在于,所述若在预设超时时间内没有获取到所述服务进程发送的应答消息,则判定所述目标服务存在异常之后,还包括:
对所述目标服务进行拉起操作。
5.根据权利要求1所述的节点服务监控方法,其特征在于,所述若在预设超时时间内没有获取到所述服务进程发送的应答消息,则判定所述目标服务存在异常,包括:
通过CTDB主进程获取所述服务检测命令的执行结果;其中,所述执行结果为是否在预设超时时间内获取到所述服务进程发送的应答消息对应的标识信息;
若所述执行结果表示在预设超时时间内没有获取到所述服务进程发送的应答消息,则判定所述目标服务存在异常。
6.根据权利要求5所述的节点服务监控方法,其特征在于,所述方法还包括:
若所述执行结果表示在预设超时时间内获取到所述服务进程发送的应答消息,则判定所述目标服务当前状态正常,并基于当前状态设置本节点的CTDB状态标志。
7.一种节点服务监控装置,其特征在于,包括:
监控管理字段获取模块,用于从CTDB的配置文件中获取目标服务对应的监控管理字段;
通信连接建立模块,用于若所述监控管理字段的内容为进行监控,则与所述目标服务的服务进程建立通信连接;
服务检测命令执行模块,用于定时执行服务检测命令,通过所述通信连接向所述服务进程发送请求消息;
目标服务状态判断模块,用于若在预设超时时间内没有获取到所述服务进程发送的应答消息,则判定所述目标服务存在异常;
所述若在预设超时时间内没有获取到所述服务进程发送的应答消息,则判定所述目标服务存在异常之后,还包括:将本节点的CTDB状态标志置为异常状态对应的标志值,以便集群主节点通过恢复进程监测到所述CTDB状态标志为异常状态对应的标志值时,进行数据库恢复操作以及虚拟IP重分配操作;其中,所述虚拟IP重分配操作,具体为将故障节点的虚拟IP分配至集群中正常节点。
8.一种电子设备,其特征在于,包括:
存储器,用于保存计算机程序;
处理器,用于执行所述计算机程序,以实现如权利要求1至6任一项所述的节点服务监控方法。
9.一种计算机可读存储介质,其特征在于,用于保存计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的节点服务监控方法。
CN202110050026.7A 2021-01-14 2021-01-14 一种节点服务监控方法、装置、设备及介质 Active CN112769652B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110050026.7A CN112769652B (zh) 2021-01-14 2021-01-14 一种节点服务监控方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110050026.7A CN112769652B (zh) 2021-01-14 2021-01-14 一种节点服务监控方法、装置、设备及介质

Publications (2)

Publication Number Publication Date
CN112769652A CN112769652A (zh) 2021-05-07
CN112769652B true CN112769652B (zh) 2022-12-16

Family

ID=75700733

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110050026.7A Active CN112769652B (zh) 2021-01-14 2021-01-14 一种节点服务监控方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN112769652B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113672451B (zh) * 2021-07-21 2023-12-22 济南浪潮数据技术有限公司 一种bmc服务检测方法、装置、设备及可读存储介质
CN114442790A (zh) * 2022-02-24 2022-05-06 中汽创智科技有限公司 一种闲置汽车应用服务的资源管理方法及系统
CN114691404A (zh) * 2022-03-25 2022-07-01 北京青云科技股份有限公司 服务进程的监测方法、装置、电子设备、存储介质及产品
CN115437881B (zh) * 2022-08-25 2023-03-28 北京万里开源软件有限公司 一种基于用户态文件系统的数据库进程异常处理方法
CN117097599B (zh) * 2023-10-20 2024-01-16 深圳高灯计算机科技有限公司 网络服务检测方法、装置、计算机设备和存储介质

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103383689A (zh) * 2012-05-03 2013-11-06 阿里巴巴集团控股有限公司 一种服务进程故障检测方法、装置及服务节点
CN103034552B (zh) * 2012-12-11 2015-11-25 太仓市同维电子有限公司 一种在软件系统中实现软件看门狗的方法
CN106844137B (zh) * 2016-12-08 2020-05-19 腾讯科技(深圳)有限公司 服务器的监控方法和装置
CN111064590B (zh) * 2018-10-16 2021-12-14 腾讯科技(深圳)有限公司 异常状态的修复方法、装置及可读存储介质
CN110515820B (zh) * 2019-08-29 2022-07-08 北京浪潮数据技术有限公司 一种服务器故障维护方法、装置、服务器及存储介质
CN110798375B (zh) * 2019-09-29 2021-10-01 烽火通信科技股份有限公司 一种增强容器集群高可用性的监控方法、系统及终端设备
CN110933142A (zh) * 2019-11-07 2020-03-27 浪潮电子信息产业股份有限公司 一种icfs集群网卡监控方法、装置和设备及介质
CN111565135A (zh) * 2020-04-30 2020-08-21 吉林省鑫泽网络技术有限公司 监控服务器运行的方法、监控服务器和存储介质

Also Published As

Publication number Publication date
CN112769652A (zh) 2021-05-07

Similar Documents

Publication Publication Date Title
CN112769652B (zh) 一种节点服务监控方法、装置、设备及介质
CN109714202B (zh) 一种客户端离线原因判别方法和集群式安全管理系统
CN108737574B (zh) 一种节点离线判断方法、装置、设备及可读存储介质
CN104506392B (zh) 一种宕机检测方法及设备
CN112506702B (zh) 数据中心容灾方法、装置、设备及存储介质
CN110768873B (zh) 分布式心跳检测方法、系统、装置和计算机设备
CN113407383B (zh) 主备系统切换方法、装置、服务器及主备系统
US11930292B2 (en) Device state monitoring method and apparatus
CN113438292A (zh) 一种基于自动化运维工具的代理部署方法及装置
CN114697191A (zh) 一种资源迁移方法、装置、设备及存储介质
CN115314361B (zh) 一种服务器集群管理方法及其相关组件
CN114817134B (zh) 一种快照任务监控方法、装置、设备及介质
CN116483543A (zh) 一种任务处理方法、装置、设备及存储介质
CN107087021B (zh) 主从服务器确定方法及装置
CN112685063B (zh) 特征库更新方法、装置、网络设备及可读存储介质
CN114780305A (zh) 一种单节点启动方法、装置、设备及介质
CN114666302B (zh) 域名解析方法、系统、电子设备和存储介质
CN106851703B (zh) 云接入控制器处理告警信息的方法和装置
CN112486781B (zh) 一种集群设备告警方法和系统
CN112769889B (zh) 服务数据的推送方法、装置、存储介质以及电子装置
CN114237887A (zh) 一种计划任务执行方法、装置、设备及介质
CN109683924B (zh) 应用软件升级方法、系统、设备及计算机可读存储介质
CN116821247A (zh) 一种数据同步方法、装置、设备及存储介质
CN115604077A (zh) 一种监控方法、装置、设备及介质
CN115242820A (zh) 一种集群节点故障处理方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant