CN107656847A - 基于分布式集群的节点管理方法、系统、装置及存储介质 - Google Patents

基于分布式集群的节点管理方法、系统、装置及存储介质 Download PDF

Info

Publication number
CN107656847A
CN107656847A CN201710852613.1A CN201710852613A CN107656847A CN 107656847 A CN107656847 A CN 107656847A CN 201710852613 A CN201710852613 A CN 201710852613A CN 107656847 A CN107656847 A CN 107656847A
Authority
CN
China
Prior art keywords
node
server node
server
distributed type
monitoring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710852613.1A
Other languages
English (en)
Inventor
张大帅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201710852613.1A priority Critical patent/CN107656847A/zh
Publication of CN107656847A publication Critical patent/CN107656847A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • H04L67/1004Server selection for load balancing
    • H04L67/1008Server selection for load balancing based on parameters of servers, e.g. available memory or workload

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • General Physics & Mathematics (AREA)
  • Environmental & Geological Engineering (AREA)
  • Computer And Data Communications (AREA)

Abstract

本发明公开了一种基于分布式集群的节点管理方法,通过监测服务器节点的监控服务进程;判断该监控服务进程是否为主监控服务进程;若是,则开启所述本服务器节点的主管理服务进程以对其它服务器节点进行管理。其中,分布式集群中具有多个用于处理数据业务的服务器节点;因此,通过判断主监控服务进程所在的服务器节点,则将该服务器节点的主管理服务进程开启以管理其他的服务器节点,该服务器节点同时提供监控服务、管理服务以及数据业务服务,避免了专门设置两台服务器对服务器节点进行管理,提高了节点的利用率。本发明还公开了一种基于分布式集群的节点管理系统、装置及存储介质同样能实现上述技术效果。

Description

基于分布式集群的节点管理方法、系统、装置及存储介质
技术领域
本发明涉及分布式集群领域,特别涉及基于分布式集群的节点管理方法、系统、装置及存储介质。
背景技术
为了便于用户对分布式集群的性能、服务进行查看和管理,分布式集群系统中会部署管理系统模块,该模块提供一个公共的管理平台,用户登录此管理平台后可通过界面查看和管理集群性能、硬件设备及服务。
传统的分布式集群管理系统的管理系统主进程会专门部署于一台管理服务器节点上,该管理服务器节点在集群中不提供数据业务服务,只用来对集群进行管理。集群其他的数据节点中均部署管理系统子进程,管理节点通过管理系统主进程与数据节点的管理系统子进程通信,以获取数据节点的状态以及管理其相关服务等。传统的分布式集群管理系统容灾方案是提供一台备用服务器节点,该节点也部署了管理系统主进程,在正常情况下该备用服务器节点并不提供管理服务,只有当管理服务器节点出现异常或宕机时才接替管理服务器节点提供管理服务。
采用该种方法会存在两个问题,第一,专门利用两台服务器节点来提供管理服务和管理系统灾备冗余,节点利用率低。第二,若在一些异常情况下,管理节点和备用节点均出现故障,那么集群管理系统将会瘫痪。
因此,如何解决分布式集群中的节点利用率低是本领域技术人员需要解决的问题。
发明内容
本发明的目的在于提供基于分布式集群的节点管理方法、系统及可读存储介质,解决了分布式集群中的节点利用率低的问题。
为实现上述目的,本发明实施例提供了如下技术方案:
一方面,本发明实施例提供了一种基于分布式集群的节点管理方法,包括:监测本服务器节点的监控服务进程;所述分布式集群中具有多个可用于处理数据业务的服务器节点;
判断所述监控服务进程是否为主监控服务进程;
若是,则开启所述本服务器节点的主管理服务进程以对其它服务器节点进行管理。
优选的,若所述监控服务进程为主监控服务进程,则开启所述本服务器节点的主管理服务进程以对其它服务器节点进行管理之后,还包括:
检测所述本服务器节点是否正常;
若否,从其它服务器节点中选取目标服务器节点,将所述目标服务器节点的监控服务进程设置为主监控服务进程以启动所述目标服务器节点的主管理服务进程。
优选的,所述从其它服务器节点中选取目标服务器节点包括:
从其它服务器节点中选取负荷最小的服务器节点作为目标服务器节点。
优选的,所述从其它服务器节点中选取目标服务器节点包括:
从其它服务器节点中选取资源使用率最小的服务器节点作为目标服务器节点。
另一方面,本发明实施例提供了一种基于分布式集群的节点管理系统,包括:多个服务器节点,各所述服务器节点均安装有状态监测模块、监控服务进程以及主管理服务进程;各所述服务器节点均可用于处理数据业务;
所述服务器节点的状态监测模块用于监测本服务器的监控服务进程,当所述监控服务进程为主监控服务进程,则开启所述本服务器节点的主管理服务进程以对其它服务器节点进行管理。
优选的,还包括:服务器节点检测模块,用于检测所述本服务器节点是否正常;目标服务器节点选取模块,用于本服务器节点异常时,从其它服务器节点中选取目标服务器节点,将所述目标服务器节点的监控服务进程设置为主监控服务进程以启动所述目标服务器节点的主管理服务进程。
优选的,所述目标服务器节点选取模块包括:第一目标服务器节点选取单元,用于从其它服务器节点中选取负荷最小的服务器节点作为目标服务器节点。
优选的,所述目标服务器节点选取模块包括:
第二目标服务器节点选取单元,用于从其它服务器节点中选取资源使用率最小的服务器节点作为目标服务器节点。
另一方面,本发明实施例提供了一种基于分布式集群的节点管理装置,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述存储器中存储的计算机程序以实现如上所述的任一项基于分布式集群监控进程的管理方法的步骤。
另一方面,本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的任一项基于分布式集群监控进程的管理方法的步骤。
可见,在本方案中,通过监测服务器节点的监控服务进程;判断该监控服务进程是否为主监控服务进程;若是,则开启所述本服务器节点的主管理服务进程以对其它服务器节点进行管理。其中,分布式集群中具有多个用于处理数据业务的服务器节点;因此,通过判断主监控服务进程所在的服务器节点,则将该服务器节点的主管理服务进程开启以管理其他的服务器节点,该服务器节点同时提供监控服务、管理服务以及数据业务服务,避免了专门设置两台服务器对服务器节点进行管理,提高了节点的利用率。本发明还公开了一种基于分布式集群的节点管理系统、装置及存储介质同样能实现上述技术效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种基于分布式集群的节点管理方法流程示意图;
图2为本发明实施例提供的一种基于分布式集群的节点管理系统结构示意图;
图3为本发明实施例提供的一种基于分布式集群的节点管理装置结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例公开了一种基于分布式集群的节点管理方法、系统及可读存储介质,解决了分布式集群中的节点利用率低的问题。
请参见图1,图1为本发明实施例提供的一种基于分布式集群的节点管理方法流程示意图,包括:
S101、监测本服务器节点的监控服务进程;所述分布式集群中具有多个可用于处理数据业务的服务器节点;
具体的,本发明实施例中的监控服务进程为本服务器节点中的监控整个分布式集群系统状态的进程,其可以分为主监控服务进程和非主监控服务进程,当为主监控服务进程时,该服务器节点为主节点,从而利用该主节点监控整个分布式集群系统状态;服务器节点可处理的数据业务包括数据传输,数据读写等。根据具体的网络环境,可以有不同的数据业务类型,在此不作限定。
S102、判断所述监控服务进程是否为主监控服务进程;
具体的,本实施例中的主监控服务进程所在的服务器节点可以为管理员预先设定的,其可以根据服务器节点的唯一标识进行优先级设定。其中,唯一标识可以为服务器节点的标识号、服务器节点的生产批号等。
S103、若所述监控服务进程为主监控服务进程,则开启所述本服务器节点的主管理服务进程以对其它服务器节点进行管理。
具体的,本实施例中的主管理服务进程为本服务器节点中的具有管理其他服务器节点功能的进程,当本服务器节点具有主管理服务进程时,则将该服务器节点设置为管理节点,通过该管理节点管理其他服务器节点的工作状态、工作进程等;其中,各服务器节点还安装有子管理服务进程。当本服务器节点为主管理服务进程时,通过其他节点的子管理服务进程与本服务器节点进行通信。其中,该管理节点可以通过SSH协议与其他的服务器节点进行通信,当然,根据具体的网络环境,也可以选择其他类型的通讯协议实现管理节点与其他服务器节点之间的通信,在此并不作限定。
进一步,本实施例中,当开启服务器节点的管理服务主进程之后将该服务器节点作为管理节点,该管理节点的负载信息和故障信息可以实时的上报至管理界面,以便于管理员通过管理界面实时查看管理节点的工作状态;同时,也可以设置管理节点的负载阈值,当管理节点的负载超过该负载阈值时进行报警。当然,当该管理节点出现故障时,也可以进行报警以提醒管理员。其中,管理界面与管理节点之间可以通过http协议、snmp协议、mail协议或其它类型的协议进行通信。
可见,在本实施例中,通过监测服务器节点的监控服务进程;判断该监控服务进程是否为主监控服务进程;若是,则开启所述本服务器节点的主管理服务进程以对其它服务器节点进行管理。其中,分布式集群中具有多个用于处理数据业务的服务器节点;因此,通过判断主监控服务进程所在的服务器节点,则将该服务器节点的主管理服务进程开启以管理其他的服务器节点,该服务器节点同时提供监控服务、管理服务以及数据业务服务,避免了专门设置两台服务器对服务器节点进行管理,提高了节点的利用率。
基于上述实施例,本实施例中若所述监控服务进程为主监控服务进程,则开启所述本服务器节点的主管理服务进程以对其它服务器节点进行管理之后,还包括:
检测所述本服务器节点是否正常;
若否,从其它服务器节点中选取目标服务器节点,将所述目标服务器节点的监控服务进程设置为主监控服务进程以启动所述目标服务器节点的主管理服务进程。
具体的,本实施例中的本服务器节点异常时,具体表现为该本服务器节点中的主管理服务进程停止运行,或整个服务器处于宕机状态。当本服务器节点异常时,从其他的服务器节点中选择下一个用来监控整个分布式集群系统状态的服务器节点;其中,由于整个分布式集群自身的灾备机制,选取下一个服务器节点所需的时间较短;下一个服务器节点的选择原则可根据管理员优先设定的优先级选择,例如,管理员可优先对每一个服务器节点进行编号,当本服务器节点处于宕机状态时,根据服务器节点的编号顺序自动选择下一个服务器节点,并将该服务器节点的监控服务进程设置为主监控服务进程以启动该服务器节点的主管理服务进程;当然,选择下一个服务器节点也可以有其他的选择方式,在此并不作限定。
可见,本实施例中,通过实时的检测本服务器节点是否处于正常状态,并在服务器节点故障时,自动选择下一个服务器节点以即时启动该服务器节点的主监控服务进程和主管理服务进程以保证整个分布式集群的正常运行,避免了整个分布式集群系统的瘫痪。
基于上述实施例,本实施例中,所述从其它服务器节点中选取目标服务器节点包括:
从其它服务器节点中选取负荷最小的服务器节点作为目标服务器节点。
具体的,本实施例中的负荷最小的服务器节点为该服务器节点正在处理的数据业务最少的服务器节点,当原服务器节点处于宕机状态时,将该负荷最小的服务器节点的监控服务进程设置为主监控服务进程,并开启该负荷最小的服务器节点的主管理服务进程,使该负荷最小的服务器节点同时提供监控服务、管理服务以及数据业务服务。
可见,本实施例中,通过自动选择负荷最小的服务器节点作为目标服务器节点以即时启动该服务器节点的主监控服务进程和主管理服务进程以保证整个分布式集群的正常运行,避免了整个分布式集群系统的瘫痪。
基于上述实施例,在本实施例中,所述从其它服务器节点中选取目标服务器节点包括:从其它服务器节点中选取资源使用率最小的服务器节点作为目标服务器节点。
具体的,本实施例中的资源使用率最小的服务器节点为该服务器节点中资源被占用最少的节点,当原服务器节点处于宕机状态时,将该资源使用率最小的服务器节点的监控服务进程设置为主监控服务进程,并开启该资源使用率最小的服务器节点的主管理服务进程,使该资源使用率最小的服务器节点同时提供监控服务、管理服务以及数据业务服务。
可见,本实施例中,通过自动选择资源使用率最小的服务器节点作为目标服务器节点以即时启动该服务器节点的主监控服务进程和主管理服务进程以保证整个分布式集群的正常运行,避免了整个分布式集群系统的瘫痪。
请参见图2,图2为本发明实施例提供的一种基于分布式集群的节点管理系统结构示意图,包括:
多个服务器节点10,各所述服务器节点均安装有状态监测模块101、监控服务进程102以及主管理服务进程103;各所述服务器节点10均可用于处理数据业务;
所述服务器节点的状态监测模块101用于监测本服务器的监控服务进程102,当所述监控服务进程102为主监控服务进程,则开启所述本服务器节点的主管理服务进程103以对其它服务器节点进行管理。
可见,在本方案中,通过状态监测模块101监测服务器节点的监控服务进程102;判断该监控服务进程102是否为主监控服务进程;若是,则开启所述本服务器节点的主管理服务进程以对其它服务器节点进行管理;其中,分布式集群中具有多个用于处理数据业务的服务器节点;因此,通过判断主监控服务进程所在的服务器节点,则将该服务器节点的主管理服务进程开启以管理其他的服务器节点,该服务器节点同时提供监控服务、管理服务以及数据业务服务,避免了专门设置两台服务器对服务器节点进行管理,提高了节点的利用率。
基于上述实施例,在本实施例中,还包括:
服务器节点检测模块,用于检测所述本服务器节点是否正常;
目标服务器节点选取模块,用于本服务器节点异常时,从其它服务器节点中选取目标服务器节点,将所述目标服务器节点的监控服务进程设置为主监控服务进程以启动所述目标服务器节点的主管理服务进程。
基于上述实施例,在本实施例中,所述目标服务器节点选取模块包括:
第一目标服务器节点选取单元,用于从其它服务器节点中选取负荷最小的服务器节点作为目标服务器节点。
基于上述实施例,在本实施例中,所述目标服务器节点选取模块包括:
第二目标服务器节点选取单元,用于从其它服务器节点中选取资源使用率最小的服务器节点作为目标服务器节点。
请参见图3,图3为本发明实施例提供的一种基于分布式集群的节点管理装置结构示意图,包括:
存储器20,用于存储计算机程序;
处理器30,用于执行所述存储器中存储的计算机程序以实现如上所述的任意一项基于分布式集群监控进程的管理方法的步骤。
可见,在本实施例中,通过处理器30执行存储器20存储的计算机程序以实现监测服务器节点的监控服务进程;判断该监控服务进程是否为主监控服务进程;若是,则开启所述本服务器节点的主管理服务进程以对其它服务器节点进行管理的步骤。其中,分布式集群中具有多个用于处理数据业务的服务器节点;因此,通过判断主监控服务进程所在的服务器节点,则将该服务器节点的主管理服务进程开启以管理其他的服务器节点,该服务器节点同时提供监控服务、管理服务以及数据业务服务,避免了专门设置两台服务器对服务器节点进行管理,提高了节点的利用率。
为了更好的理解本发明,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上任一项所述的基于分布式集群监控进程的管理方法的步骤。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种基于分布式集群的节点管理方法,其特征在于,包括:
监测本服务器节点的监控服务进程;所述分布式集群中具有多个可用于处理数据业务的服务器节点;
判断所述监控服务进程是否为主监控服务进程;
若是,则开启所述本服务器节点的主管理服务进程以对其它服务器节点进行管理。
2.根据权利要求1所述的基于分布式集群监控进程的节点管理方法,其特征在于,若所述监控服务进程为主监控服务进程,则开启所述本服务器节点的主管理服务进程以对其它服务器节点进行管理之后,还包括:
检测所述本服务器节点是否正常;
若否,从其它服务器节点中选取目标服务器节点,将所述目标服务器节点的监控服务进程设置为主监控服务进程以启动所述目标服务器节点的主管理服务进程。
3.根据权利要求2所述的基于分布式集群的节点管理方法,其特征在于,所述从其它服务器节点中选取目标服务器节点包括:
从其它服务器节点中选取负荷最小的服务器节点作为目标服务器节点。
4.根据权利要求2所述的基于分布式集群的节点管理方法,其特征在于,所述从其它服务器节点中选取目标服务器节点包括:
从其它服务器节点中选取资源使用率最小的服务器节点作为目标服务器节点。
5.一种基于分布式集群的节点管理系统,其特征在于,包括:
多个服务器节点,各所述服务器节点均安装有状态监测模块、监控服务进程以及主管理服务进程;各所述服务器节点均可用于处理数据业务;
所述服务器节点的状态监测模块用于监测本服务器的监控服务进程,当所述监控服务进程为主监控服务进程,则开启所述本服务器节点的主管理服务进程以对其它服务器节点进行管理。
6.根据权利要求5所述的基于分布式集群的节点管理系统,其特征在于,还包括:
服务器节点检测模块,用于检测所述本服务器节点是否正常;
目标服务器节点选取模块,用于本服务器节点异常时,从其它服务器节点中选取目标服务器节点,将所述目标服务器节点的监控服务进程设置为主监控服务进程以启动所述目标服务器节点的主管理服务进程。
7.根据权利要求5所述的基于分布式集群的节点管理系统,其特征在于,所述目标服务器节点选取模块包括:
第一目标服务器节点选取单元,用于从其它服务器节点中选取负荷最小的服务器节点作为目标服务器节点。
8.根据权利要求5所述的基于分布式集群的节点管理系统,其特征在于,所述目标服务器节点选取模块包括:
第二目标服务器节点选取单元,用于从其它服务器节点中选取资源使用率最小的服务器节点作为目标服务器节点。
9.一种基于分布式集群的节点管理装置,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述存储器中存储的计算机程序以实现如权利要求1至4任一项所述基于分布式集群监控进程的管理方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至4任一项所述的基于分布式集群监控进程的管理方法的步骤。
CN201710852613.1A 2017-09-19 2017-09-19 基于分布式集群的节点管理方法、系统、装置及存储介质 Pending CN107656847A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710852613.1A CN107656847A (zh) 2017-09-19 2017-09-19 基于分布式集群的节点管理方法、系统、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710852613.1A CN107656847A (zh) 2017-09-19 2017-09-19 基于分布式集群的节点管理方法、系统、装置及存储介质

Publications (1)

Publication Number Publication Date
CN107656847A true CN107656847A (zh) 2018-02-02

Family

ID=61129695

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710852613.1A Pending CN107656847A (zh) 2017-09-19 2017-09-19 基于分布式集群的节点管理方法、系统、装置及存储介质

Country Status (1)

Country Link
CN (1) CN107656847A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108616421A (zh) * 2018-04-13 2018-10-02 郑州云海信息技术有限公司 一种多节点集群的状态检测方法、装置及设备
CN108924202A (zh) * 2018-06-25 2018-11-30 郑州云海信息技术有限公司 一种分布式集群的数据容灾方法以及相关装置
CN108989080A (zh) * 2018-05-29 2018-12-11 华为技术有限公司 管理节点的方法和装置
CN109445927A (zh) * 2018-11-12 2019-03-08 郑州云海信息技术有限公司 一种存储集群的任务管理方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090252057A1 (en) * 2008-04-02 2009-10-08 Flemming Diane G Wireless service processor connections
CN103019889A (zh) * 2012-12-21 2013-04-03 曙光信息产业(北京)有限公司 分布式文件系统及其故障处理方法
CN105407087A (zh) * 2015-10-28 2016-03-16 杭州数梦工场科技有限公司 消息发送方法和装置
CN106161090A (zh) * 2016-07-12 2016-11-23 许继集团有限公司 一种分区集群系统的监测方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090252057A1 (en) * 2008-04-02 2009-10-08 Flemming Diane G Wireless service processor connections
CN103019889A (zh) * 2012-12-21 2013-04-03 曙光信息产业(北京)有限公司 分布式文件系统及其故障处理方法
CN105407087A (zh) * 2015-10-28 2016-03-16 杭州数梦工场科技有限公司 消息发送方法和装置
CN106161090A (zh) * 2016-07-12 2016-11-23 许继集团有限公司 一种分区集群系统的监测方法及装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108616421A (zh) * 2018-04-13 2018-10-02 郑州云海信息技术有限公司 一种多节点集群的状态检测方法、装置及设备
CN108989080A (zh) * 2018-05-29 2018-12-11 华为技术有限公司 管理节点的方法和装置
CN108989080B (zh) * 2018-05-29 2021-02-05 华为技术有限公司 管理节点的方法和装置
CN108924202A (zh) * 2018-06-25 2018-11-30 郑州云海信息技术有限公司 一种分布式集群的数据容灾方法以及相关装置
CN109445927A (zh) * 2018-11-12 2019-03-08 郑州云海信息技术有限公司 一种存储集群的任务管理方法及装置
CN109445927B (zh) * 2018-11-12 2021-09-17 郑州云海信息技术有限公司 一种存储集群的任务管理方法及装置

Similar Documents

Publication Publication Date Title
CN105187249B (zh) 一种故障恢复方法及装置
CN108173911B (zh) 一种微服务故障检测处理方法及装置
CN107656847A (zh) 基于分布式集群的节点管理方法、系统、装置及存储介质
CN104798341B (zh) 在电子网络上表征服务水平
US9680722B2 (en) Method for determining a severity of a network incident
CN106713487A (zh) 数据的同步方法和装置
CN106656682B (zh) 集群心跳检测方法、系统及装置
CN103795570B (zh) 环形拓扑的堆叠交换机系统的单播报文恢复方法及装置
CN106331098A (zh) 一种服务器集群系统
CN104253745B (zh) 一种路由撤销方法和网络设备
CN103138988B (zh) 网络故障的定位处理方法及装置
US20220052916A1 (en) Orchestration of Activities of Entities Operating in a Network Cloud
CN106294073A (zh) 服务调用方法及装置
CN110532096B (zh) 一种多节点分组并行部署的系统和方法
CN103490914A (zh) 一种网络应用设备多机热备的切换系统及方法
CN106464541B (zh) 基于网络功能虚拟化的故障处理方法及设备
CN113949649B (zh) 故障检测协议的部署方法、装置、电子设备及存储介质
CN102143011B (zh) 一种实现网络保护的装置及方法
CN104158843B (zh) 分布式文件存储系统的存储单元失效检测方法及装置
EP2693706A1 (en) Method and device for implementing multi-protection overlapped protection groups
CN114301763B (zh) 分布式集群故障的处理方法及系统、电子设备及存储介质
CN105871524B (zh) 一种基于tipc协议实现双机热备的方法及系统
CN103763170B (zh) 环网保护方法及装置
CN106657355A (zh) 一种集群管理方法及设备
CN102946321B (zh) 一种基于irf网络的故障处理方法和设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180202