CN102710438B - 一种节点管理方法、装置及系统 - Google Patents

一种节点管理方法、装置及系统 Download PDF

Info

Publication number
CN102710438B
CN102710438B CN201210168252.6A CN201210168252A CN102710438B CN 102710438 B CN102710438 B CN 102710438B CN 201210168252 A CN201210168252 A CN 201210168252A CN 102710438 B CN102710438 B CN 102710438B
Authority
CN
China
Prior art keywords
node
management
information
following
management node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201210168252.6A
Other languages
English (en)
Other versions
CN102710438A (zh
Inventor
郑元辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201210168252.6A priority Critical patent/CN102710438B/zh
Publication of CN102710438A publication Critical patent/CN102710438A/zh
Application granted granted Critical
Publication of CN102710438B publication Critical patent/CN102710438B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种节点管理方法、装置及系统,包括:管理节点之间通过信息传递确定系统中的管理节点成员信息,并在各个管理节点中传递所述管理节点成员信息;跟随节点向一个管理节点发送跟随节点信息,该管理节点根据获取的跟随节点发送来的跟随节点信息确定系统中的跟随节点成员信息,并将所述跟随节点成员信息通知其他管理节点;系统中的各个管理节点维护所述管理节点成员信息和跟随节点成员信息。本发明实施例的实现令系统中的跟随节点信息不需要传递到系统的所有节点,因此即使系统内跟随节点的数目再多,也不会延长信息的传递时间,这就能够有效避免因信息传递延迟而发生系统重组,从而使得系统能够支持更多节点的灵活扩展。

Description

一种节点管理方法、装置及系统
技术领域
本发明涉及通信技术领域,尤其涉及一种节点管理方法、装置及系统。
背景技术
目前,现有的HA系统(High Availability系统,高可靠性系统,通常是指通过尽量缩短因日常维护操作和突发的系统崩溃所导致的停机时间,从而提高系统和应用的可用性;HA系统是指高可用系统)或集群系统大多采用单环协议管理系统内的节点关系;所谓的单环协议就是指将系统内的各个节点按照一定顺序排列,然后通过数据线将相邻的两个节点头尾相连,从而组成一个环;环中的每个节点地位平等,周期性发送的心跳信息依次按照环中节点的连接顺序进行传递。这一管理方式能够解决单点故障的问题,即在系统中的任何一个节点出现故障后,系统都能立刻感知,并进行节点的重组,从而最终稳定系统内的节点关系。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:
随着系统内节点的逐渐增多,心跳信息在系统内传递一圈的时间就会逐渐变长;如果客户的响应时间不能延长,那么在这个过程中很可能会出现心跳信息传输延迟现象,进而会导致集群重组;因此现有的HA系统或集群系统存在节点的容量限制问题。
发明内容
本发明实施例的目的是提供一种节点管理方法、装置及系统,以便于解除HA系统或集群系统中节点的容量限制,从而使HA系统或集群系统能够支持更多节点的灵活扩展。
本发明实施例的目的是通过以下技术方案实现的:
一种节点管理方法,包括:
管理节点之间通过信息传递确定系统中的管理节点成员信息,并在各个管理节点中传递所述管理节点成员信息;
跟随节点向一个管理节点发送跟随节点信息,该管理节点根据获取的跟随节点发送来的跟随节点信息确定系统中的跟随节点成员信息,并将所述跟随节点成员信息通知其他管理节点;
系统中的各个管理节点维护所述管理节点成员信息和跟随节点成员信息。
一种节点管理方法,包括:
管理节点接收管理节点成员信息和跟随节点成员信息,并维护该管理节点成员信息和跟随节点成员信息;其中,所述管理节点成员信息是系统中管理节点之间通过信息传递确定,所述的跟随节点成员信息由与跟随节点进行信息传递的管理节点确定。
一种节点管理方法,包括:
跟随节点向系统中的一个管理节点发送跟随节点信息,以用于该管理节点将该跟随节点信息加入到跟随节点成员信息中并在各个管理节点之间传递。
一种节点管理装置,包括:
管理节点成员信息接收模块,用于接收管理节点成员信息;所述管理节点成员信息是系统中管理节点之间通过信息传递确定;
管理节点成员信息维护模块,用于维护所述管理节点成员信息接收模块接收的管理节点成员信息;
跟随节点成员信息接收模块,用于接收跟随节点成员信息;所述的跟随节点成员信息由与跟随节点进行信息传递的管理节点确定;
跟随节点成员信息维护模块,用于维护所述跟随节点成员信息接收模块接收的跟随节点成员信息。
一种节点管理装置,包括:
跟随节点信息通信模块,用于向系统中的一人管理节点发送跟随节点信息,以用于管理节点将该跟随节点信息加入到跟随节点成员信息中并在各个管理节点之间传递。
一种节点管理系统,包括:多个管理节点和多个跟随节点,且所述管理节点设置上述第一个节点管理装置,所述跟随节点设置上述第二个节点管理装置。
由上述本发明实施例提供的技术方案可以看出,系统中的跟随节点将自身的跟随节点信息传递到系统中的一个管理节点,再由该管理节点将跟随节点的跟随节点信息同步到各个管理节点,也就是说,系统中的跟随节点信息不需要传递到系统的所有节点,因此即使系统内跟随节点的数目再多,也不会延长信息的传递时间,这就能够有效避免因信息传递延迟而发生系统重组,从而使得系统能够支持更多节点的灵活扩展。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。
图1为本发明实施例提供的节点管理方法的流程示意图一;
图2为本发明实施例提供的应用本发明所述节点管理方法的集群系统结构示意图一;
图3为本发明实施例提供的节点管理方法的流程示意图二;
图4为本发明实施例提供的节点管理方法的流程示意图三;
图5为本发明实施例提供的节点管理方法的流程示意图四;
图6为本发明实施例提供的应用本发明所述节点管理方法的集群系统结构示意图二;
图7为本发明实施例提供的节点管理方法的流程示意图五;
图8为本发明实施例提供的节点管理方法的流程示意图六;
图9为本发明实施例提供的应用本发明所述节点管理方法的集群系统结构示意图三;
图10为本发明实施例提供的装置的结构示意图一;
图11为本发明实施例提供的装置的结构示意图二;
图12为本发明实施例提供的装置的结构示意图三;
图13为本发明实施例提供的装置的结构示意图四。
具体实施方式
下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明的保护范围。
本发明实施例所提供的节点管理方法可以应用在HA系统或集群系统当中,特别适用于需要支持成百上千个节点的大HA系统或大集群系统,但本发明实施例的适用范围并不仅限于这些系统;后续描述仅以本发明实施例应用于集群系统为例进行说明,但这并不构成对本发明的限制。
为便于理解,下面将本发明实施例所提供的节点管理方法作一详细描述。
如图1所示,本发明实施例所提供的节点管理方法具体可以包括:
步骤1:管理节点之间通过信息传递确定系统中的管理节点成员信息,并在各个管理节点中传递所述管理节点成员信息。
其中,相应的管理节点成员信息可以用于记录系统中的管理节点对应的管理节点信息;相应的管理节点信息可以包括管理节点的标识信息,管理节点的地址信息、管理节点的性能参数信息等等,该管理节点信息的具体信息格式和具体信息内容可以根据本发明实际应用的通信系统进行灵活设置。
具体地,系统在启动时可以建立初始的管理节点成员信息,并将其在管理节点之间顺序传递;每个管理节点可以接收该管理节点成员信息,并可以将自身的管理节点信息加入到该管理节点成员信息中,以更新相应的管理节点信息;当该管理节点成员信息传遍系统的每个管理节点后,即可确定出系统中的管理节点成员信息。系统中的管理节点成员信息确定后,还需要在系统中的各个管理节点之间传递,以使得系统中的管理节点成员信息能够被传送到系统中的每个管理节点。
步骤2:跟随节点向系统中的一个管理节点发送跟随节点信息,该管理节点根据获取的跟随节点发送来的跟随节点信息确定系统中的跟随节点成员信息,并将确定的跟随节点成员信息通知系统中的其他管理节点。
其中,相应的一个管理节点可以是系统中的任意一个管理节点,也可以是系统中选出来的用于与跟随节点进行信息传递的管理节点,该一个管理节点也可以称其为系统中的协调节点,相应的管理节点通信信息即为协调节点的协调节点通信信息。一个系统中可以存在一个或多个协调节点,该一个或多个协调节点通过与跟随节点进行信息传递的方式来管理系统中的一个或多个跟随节点。
相应的跟随节点成员信息可以用于记录系统中现存跟随节点的跟随节点信息;相应的跟随节点信息可以但不限于包括跟随节点的标识信息或跟随节点的地址信息等,该跟随节点信息的具体信息格式及具体信息内容可以根据本发明实际应用的通信系统进行灵活设置;
具体地,系统在启动时可以建立初始的跟随节点成员信息,并且系统中的协调节点向一个或多个跟随节点发送自身的协调节点通信信息;跟随节点接收到协调节点所发送的协调节点通信信息后,则向该协调节点发送自身的跟随节点信息,以使该跟随节点与该协调节点建立连接;协调节点接收跟随节点发送的跟随节点信息,并可以将该跟随节点信息加入到跟随节点成员信息中。当协调节点将系统中每个跟随节点的跟随节点信息都加入到跟随节点成员信息中时即可确定出系统中的跟随节点成员信息。系统中的跟随节点成员信息确定后,系统中的管理节点之间将会传递该跟随节点成员信息,直至系统中的跟随节点成员信息传到系统中的每个管理节点。
当系统中存在多个协调节点时,则可以同时将多个协调节点对应的多个协调节点通信信息都发给跟随节点,并由跟随节点可以在收到的多个协调节点通信信息中选择(如随机选择或按某算法选择等)一个与其通信的协调节点,或者,也可以由多个协调节点之间协商确定仅将各个协调节点各自负责的跟随节点,并仅将负责该跟随节点的协调节点对应的协调节点通信信息发送给相应的跟随节点。
步骤3:各个管理节点维护接收到的管理节点成员信息和跟随节点成员信息。
具体地,相应的管理节点成员信息的维护过程可以包括:各个管理节点之间通过单环协议监测各个管理节点是否出现故障或离开,进而维护系统中的管理节点成员信息;相应的跟随节点成员信息的维护过程可以包括:跟随节点在与协调节点建立连接后,该跟随节点就可以周期性地向该协调节点发送自身的跟随节点心跳信息;该协调节点可以根据该跟随节点周期性发送的跟随节点心跳信息确定该跟随节点是否处于正常工作状态,进而维护系统中的跟随节点成员信息。
在维护管理节点成员信息和跟随节点成员信息的过程中,若管理节点成员信息和/或跟随节点成员信息进行了更新,则将会在系统中的每个管理节点之间传递更新后的管理节点成员信息和/或跟随节点成员信息,接收到更新后的管理节点成员信息和/或跟随节点成员信息的管理节点更新本地保存的管理节点成员信息和/或跟随节点成员信息,并将更新后的管理节点成员信息和/或跟随节点成员信息发送给后继管理节点,直至更新后的管理节点成员信息和/或跟随节点成员信息传遍系统中的每个管理节点,以达到维护管理节点成员信息和跟随节点成员信息的目的。
在上述技术方案中,每个跟随节点都是独立与系统中协调节点进行信息传递,这样,跟随节点与系统中协调节点进行信息传递过程并不会影响管理节点之间进行信息传递的过程,因此跟随节点的数量并不会影响到管理节点之间进行信息传递的过程;也就是说,即使跟随节点的数量再多也不会使管理节点之间进行信息传递的过程发生延迟。可见,本发明实施例所提供的节点管理方法可以解除HA系统或集群系统中节点的容量限制,从而使HA系统或集群系统能够支持更多节点的灵活扩展。
为使本发明的目的、技术方案和优点更加清楚,下面列举实施例并结合附图,对本发明实施例具体应用过程作进一步地详细描述。
本发明实施例所提供的节点管理方法在具体实施过程中可以包括将系统中节点划分成管理节点和跟随节点的系统配置过程,以及对系统中管理节点和跟随节点进行管理的节点管理过程。下面将分别对两个过程进行描述。
(一)将系统中节点划分成管理节点和跟随节点的系统配置过程
本发明实施例中是将系统中节点划分成管理节点和跟随节点,该划分过程具体可以通过相应的系统配置过程实现;
其中,相应的管理节点是指通过信息传递维护系统中管理节点成员信息和跟随节点成员信息的节点;相应的跟随节点是指被管理节点管理的普通节点。为此,相应的管理节点最好选用系统中性能较好的节点,这不仅有利于提高管理节点的稳定性,避免发生不必要的系统重组,而且有利于在管理节点管理更多的跟随节点。
具体地,将系统中的节点配置成管理节点和跟随节点的过程可以但不限于通过以下实现方式中的任意一种实现:
方式一,用户利用独立于本系统之外的记载了计算机程序指令的硬件来检测每个节点的性能,然后根据性能检测结果人工选择几个性能较好(如性能满足预定要求)的节点配置成管理节点,并将系统中的其他节点配置成跟随节点;
方式二,系统通过运行计算机程序指令来检测每个节点的性能,然后按照用户预设的管理节点数目自动选择性能较好的节点配置成管理节点,并将系统中的其他节点配置成跟随节点。
以如图2所示的集群系统为例,该集群系统中包含节点A1、A2和A3,以及节点a1、a2、a3......an。在系统配置过程中,首先通过运行计算机程序指令来检测系统中每个节点的性能;经检测,该集群系统中的节点A1性能最好,节点A2和节点A3的性能状况次之;由于该集群系统中用户预设的管理节点数为3或者只有节点A1、A2和A3的性能符合预定的要求,因此该集群系统将节点A1、A2和A3配置为管理节点,并将系统中的节点a1、a2、a3......an配置为跟随节点。
(二)对系统中管理节点和跟随节点进行管理的节点管理过程
该节点管理过程具体包括对系统中管理节点进行管理的过程和对系统中的跟随节点进行管理的过程,下面将分别进行描述。
(1)对系统中管理节点进行管理的过程
在该管理过程中,管理节点之间通过信息传递确定系统中的管理节点成员信息,并在各个管理节点中传递相应的管理节点成员信息,以使得各个管理节点均可以获得并维护相应的管理节点成员信息。
具体地,如图3所示,管理节点之间通过信息传递确定系统中的管理节点成员信息,并在各个管理节点中传递所述管理节点成员信息的过程可以但不限于包括:
步骤11:系统选取一个管理节点,并在该管理节点中建立初始的管理节点成员信息;其中,建立的初始的管理节点成员信息包含该管理节点对应的管理节点信息,在后续处理过程中还可以更新该管理节点成员信息,即将各个管理节点对应的管理节点信息增加到该管理节点成员信息;
具体地,系统选取一个管理节点的方式可以为以下任一种:
方式一,系统通过运行计算机程序指令从管理节点中随即选取一个管理节点;
方式二,系统通过运行计算机程序指令直接将基于用户操作所指定的管理节点作为所要选取一个管理节点;
方式三,系统通过运行计算机程序指令将性能最好的管理节点作为所要选取一个管理节点;
方式四,系统通过运行计算机程序指令随机选择一个管理节点作为所要选取一个管理节点。
步骤12:系统所选取管理节点向其他管理节点发送建立的初始的管理节点成员信息,以便于其他管理节点将自身的管理节点信息加入到该管理节点成员信息中;
具体地,系统所选取的管理节点可以将初始的管理节点成员信息发送给下一跳管理节点,相应的下一跳管理节点的确定方式可以包括:在建立初始的管理节点成员信息之前,管理节点之间通过信息传递已经获了相互之间的连接关系,例如,在任一管理节点中已经记录了其对应的下一跳管理节点,这样,在需要时,管理节点很容易就可以确定相应的下一跳管理节点了。
步骤13:接收到该管理节点成员信息的管理节点将自身的管理节点信息加入到该管理节点成员信息中,并继续传递更新后的管理节点成员信息;
每个收到管理节点成员信息的管理节点均执行该步骤描述的处理,直至该管理节点成员信息传遍系统中的每个管理节点,即可确定出系统中的管理节点成员信息。
即每个管理节点接收其他管理节点发送来的管理节点成员信息后,都将自身的管理节点信息加入到该管理节点成员信息中,并将更新后管理节点成员信息继续发送给下一跳的管理节点;依次类推,当该管理节点成员信息传遍系统中的每个管理节点,即可以确定出系统中的管理节点成员信息。
例如,在如图2所示的集群系统中,管理节点A2接收管理节点A1发送的管理节点成员信息,则将自身的管理节点信息加入到该管理节点成员信息中,再将更新后的管理节点成员信息发送给管理节点A2的下一跳管理节点(即管理节点A3);依此类推,由于该集群系统的管理节点A1、A2和A3遵照单环协议组成了一个管理节点环,因此当管理节点A3将更新后的管理节点成员信息发送给管理节点A1后,管理节点A1可以根据单环协议确定出所述管理节点成员信息已经在系统中的每个管理节点中传递了一边,即所述管理节点成员信息已经传遍了该集群系统的每一个管理节点,因此管理节点A1所接收到的管理节点成员信息就是系统中的管理节点成员信息。
步骤14:系统的管理节点成员信息确定后,在各个管理节点之间传递相应的管理节点成员信息。
例如,在如图2所示的集群系统,管理节点A1在确定出所接收到的管理节点成员信息就是系统中的管理节点成员信息后,则将该管理节点成员信息传递给管理节点A1的下一跳管理节点(即管理节点A2),管理节点A2收到该管理节点成员信息后保存并继续向其下一跳管理节点(即管理节点A3)发送,依次类推,直至各个管理节点中均润滑保存了相应的管理节点成员信息。
通过上述步骤11至步骤14的处理,系统中的各个管理节点可以获得相应的包含系统中的各个管理节点对应的管理节点信息的管理节点成员信息,这样,后续处理过程中便可以基于该管理节点成员信息实现对系统中的各个管理节点的有效管理。
(2)对系统中的跟随节点进行管理的过程
在该过程中,跟随节点获取一个管理节点发送的管理节点通信信息后,则向该管理节点发送跟随节点信息,该管理节点根据获取的跟随节点发送来的跟随节点信息确定系统中的跟随节点成员信息,并将相应的跟随节点成员信息通知其他管理节点。
具体地,如图4所示,对系统中的跟随节点进行管理的过程可以包括:
步骤21:将选出的一个或多个管理节点对应的管理节点通信信息向系统中的跟随节点发送。
相应的选出的一个或多个管理节点用于管理与其进行信息传递的跟随节点,该选出的一个或多个管理节点或者也可以称其为协调节点,对应的协调节点的管理节点通信信息也可以称为协调节点通信信息。由于协调节点除了需要与系统中的跟随节点进行信息传递外,仍需要完成普通管理节点的工作,因此系统在选取协调节点时,可以尽量在管理节点中选取性能较好的管理节点,从而可以提高与跟随节点进行信息传递的稳定性,以避免发生不必要的系统重组,并且为扩展更多的跟随节点提供有利的条件。
在系统中,相应的协调节点的数目以及选择协调节点的方式可以根据实际需求进行确定,例如,可以由用户根据需要在系统中预先设定一个或多个用于作为协调节点的管理节点,或者,也可以在系统中根据管理节点的性能自动选择一个或多个用于作为协调节点的管理节点,或者,也可以采用其他方式进行设定。例如,系统可以检测系统中每个节点的性能状况,并根据需要设定的协调节点数目选取性能状况较好的一个或多个管理节点作为相应的协调节点。
步骤22:跟随节点获取一个管理节点对应的管理节点通信信息后,向该作为协调节点的管理节点发送跟随节点信息。
在该步骤中,若跟随节点接收到多个管理节点对应的多个管理节点通信信息,即收到多个协调节点对应的多个协调节点通信信息,则跟随节点可以从多个协调节点中采用随机或其他预定方式(例如,选择最先收到的管理节点通信信息对应的管理节点作为选定的协调节点)选择一个协调节点,并向该协调节点发送跟随节点信息,以与该协调节点建立连接。
进一步地,跟随节点在向协调节点发送跟随节点信息之前还可能先判断是否与该协调节点建立连接,如果应该建立连接,则该跟随节点向该协调节点发送自身的跟随节点信息,以使该跟随节点与该协调节点建立连接,否则,不向相应的协调节点发送相应的跟随节点信息;其中,该跟随节点判断是否与该协调节点建立连接的方式可以但不限于包括:跟随节点获取用户输入的指示,并根据该用户输入的指示所表达的意愿判断是否应该与该协调节点建立连接,若用户输入的指示表明跟随节点不与协调节点建立连接,则跟随节点不向协调节点发送跟随节点信息,反之,则跟随节点向协调节点发送跟随节点信息,以建立与协调节点之间的连接。
例如,在如图2所示的集群系统中,协调节点A1在分别向系统中的跟随节点a1、a2、a3......an等发送出自身的协调节点通信信息后,跟随节点a1、a2、a3......an分别接收到了协调节点A1发送的协调节点通信信息;相应的跟随节点a1、a2、a3......an判断需要与协调节点建立连接,则跟随节点a1、a2、a3......an分别向协调节点A1发送自身的跟随节点信息,从而使跟随节点a1、a2、a3......an分别与协调节点A1建立连接。
步骤23:作为协调节点的管理节点接收跟随节点所发送的跟随节点信息后,则根据跟随节点信息确定出系统中的跟随节点成员信息。
具体地,协调节点可以在接收跟随节点发送的跟随节点信息后,将该跟随节点信息加入到跟随节点成员信息中;当协调节点将与其建立连接的每个跟随节点的跟随节点信息都加入到跟随节点成员信息中时即可确定出包含与其建立连接的每个跟随节点对应的跟随节点信息的跟随节点成员信息。
例如,在如图2所示的集群系统中,协调节点A1接收跟随节点a1、a2、a3......an分别发送来的跟随节点信息,则将跟随节点a1、a2、a3......an对应的跟随节点信息加入到跟随节点成员信息中,即确定出相应的跟随节点成员信息。
步骤24:作为协调节点的管理节点确定相应的跟随节点成员信息后,则在系统中的各个管理节点之间传递相应的跟随节点成员信息,以便于各个管理节点可以获得相应的跟随节点成员信息,便于后续对跟随节点的管理。
需要说明的是,若系统中包含多个协调节点,则各个管理节点在收到不同的协调节点发来的跟随节点成员信息后还需要将相应的跟随节点成员信息进行合并处理,以获得包含整个系统中各个跟随节点对应的跟随节点信息的跟随节点成员信息(即系统中的跟随节点成员信息)。
经过上述对系统中管理节点进行管理的过程和对系统中的跟随节点进行管理的过程,在各个管理节点中便会保存着相应的管理节点成员信息和跟随节点成员信息,以记录系统中包含的管理节点和跟随节点。在此之后,由于系统中包含的管理节点和跟随节点随时都可能发生变化,如节点的退出或加入等将导致相应的管理节点成员信息和跟随节点成员信息发生变化,为此,系统中的各个管理节点还需要维护相应的管理节点成员信息和跟随节点成员信息,以保证管理节点成员信息和跟随节点成员信息可以实时准确地反映系统中包含的管理节点和跟随节点。
下面将对系统中的管理节点维护相应的管理节点成员信息和跟随节点成员信息的处理过程进行描述。
(一)相应的针对管理节点成员信息的维护过程可以包括管理节点加入的处理过程和管理节点离开(或故障)的处理过程,其中:
(1)管理节点加入的处理过程
如图5所示,管理节点加入到系统中的处理过程可以包括:
步骤31:待加入的管理节点向系统中的管理节点发送管理节点请求加入信息;
如图6所示,若待加入的管理节点B1希望以管理节点的身份加入到集群系统中,则需要发送管理节点请求加入信息。
步骤32:系统中的管理节点获取管理节点请求加入信息后,根据管理节点请求加入信息将待加入的管理节点的管理节点信息加入到管理节点成员信息中。
其中,负责将请求加入的管理节点对应的管理节点信息加入到管理节点成员信息中的管理节点可以是预先设定的特定管理节点(如之前描述的协调节点,或者与待加入的管理节点连接的下一跳管理节点,或者其他预先设定的管理节点),也可以是系统中接收到相应的管理节点请求加入信息的任意一个管理节点,若为任意一个管理节点,则管理节点在将相应的管理节点信息加入到管理节点成员信息中之前需要判断该管理节点信息是否已经存在于管理节点成员信息中,并仅在不存在的情况下,才将相应的管理节点信息加入到管理节点成员信息中。
具体地,若系统中基于单环协议实现针对各个管理节点的管理,则在该步骤中,系统中的管理节点收到相应的请求加入信息后,可以基于单环协议将待加入的管理节点的管理节点信息加入到管理节点成员信息中。
上述步骤32也可以替换为下述步骤32',即:
步骤32':系统中的管理节点获取管理节点请求加入信息后,向待加入的管理节点发送本系统的管理节点成员信息,之后,由待加入的管理节点将自身的管理节点信息加入到所述管理节点成员信息中。
同样,负责向待加入的管理节点发送本系统的管理节点成员信息的管理节点可以是预先设定的特定管理节点(如之前描述的协调节点,或者与待加入的管理节点连接的下一跳管理节点,或者其他预先设定的管理节点),也可以是系统中接收到相应的管理节点请求加入信息的任意一个管理节点。
步骤33:在将待加入的管理节点的管理节点信息加入到管理节点成员信息中后,相应的管理节点将更新后的管理节点成员信息通知其他的管理节点。
通过该步骤的操作可以将更新后的管理节点成员信息传递到系统中的各个管理节点,以使得系统中的各个管理节点均可以获得更新后的管理节点成员信息,实现了针对节点的管理。
步骤34:若系统中的管理节点成员信息发生了变化,还可以重新在系统中确定相应的一个或多个协调节点;
具体地,在重新确定相应的一个或多个协调节点的过程中,若系统中的原协调节点仍能够正常工作(例如,原协调节点仍作为一个正常的管理节点存在于管理节点成员信息中),通常可以将在原系统中的协调节点确定为更新后系统中的协调节点;若系统中的原协调节点不能正常工作(例如,管理节点成员信息中已经不再包含原协调节点对应的管理节点信息),则更新后的系统可以按照之前描述的选取协调节点的方式重新确定更新后系统中协调节点,并将系统中重新确定的协调节点通知相应的跟随节点;
例如,如图6所示,管理节点A1作为协调节点管理着系统中的跟随节点a1、a2、a3......an;当管理节点B1加入到该集群系统中后,系统中的管理节点成员信息发生更新;由于管理节点A1仍然能够正常工作,因此更新后的系统中仍将管理节点A1作为协调节点管理系统中的跟随节点a1、a2、a3......an;若图5中的管理节点A1无法正常工作,则需要重新确定相应的协调节点,例如,确定管理节点B1为协调节点,确定了新的协调节点后还需要将作为协调节点的管理节点B1的管理节点通信信息通知系统中的跟随节点a1、a2、a3......an。
需要说明的是上述步骤33和步骤34可以并列执行,也可以顺序执行,如执行完步骤33之后执行步骤34,或者,执行完步骤34之后执行步骤33。图中仅以执行完步骤33之后执行步骤34为例,但并不构成对本发明的限定。
(2)管理节点离开(或故障)的处理过程
如图7所示,系统内的管理节点离开(或故障)的处理过程可以包括:
步骤41:管理节点之间进行信息传递,若确定系统中存在发生故障或离开的管理节点,则更新系统中的管理节点成员信息。
具体地,管理节点之间可以基于单环协议进行令牌的传递,若令牌丢失,则确定系统中存在发生故障或离开的管理节点;或者,也可以通过其他方式监测管理节点是否离开或故障,例如,
相应的更新系统中的管理节点成员信息的方式可以但不限于采用以下任一方式:
方式1:在确定系统中存在发生故障或离开的管理节点后,则发起重新确定管理节点成员信息的处理过程,该过程与系统启动(即初始状态下)时确定管理节点成员信息的处理过程相同,在此不再详述;若系统中各个管理节点之间为基于单环协议进行信息的传递,则该重新确定管理成员信息的处理过程即为:重新组装新的环,并重新确定环中包含的管理节点建立新的管理成员信息的处理过程。
方式2:在确定系统中存在发生故障或离开的管理节点后,则删除管理节点成员信息中出现故障的管理节点对应的管理节点信息,并发送更新后的管理节点成员信息,以使得系统中的各个管理节点可以获得更新后的管理节点成员信息。
例如,在如图6所示的集群系统中,管理节点A1、A2、A3和B1遵照单环协议组成一个管理节点环,当确定系统中的管理节点B1发生故障时,则系统将删除管理节点成员信息中管理节点B1对应的管理节点信息,并在系统中的各个管理节点传递更新后的管理节点成员信息。具体的删除操作可以由系统中发现管理节点B1出现故障的管理节点执行,或者,也可以由发现故障的管理节点通知指定的管理节点执行。
步骤42:若系统中的管理节点成员信息更新,则还可以重新在系统中确定相应的一个或多个协调节点;
具体地,在重新确定相应的一个或多个协调节点的过程中,若系统中的原协调节点仍能够正常工作(例如,原协调节点仍作为一个正常的管理节点存在于管理节点成员信息中),通常可以将在原系统中的协调节点确定为更新后系统中的协调节点;若系统中的原协调节点不能正常工作(例如,管理节点成员信息中已经不再包含原协调节点对应的管理节点信息),则更新后的系统可以按照之前描述的选取协调节点的方式重新确定更新后系统中协调节点,并将系统中重新确定的协调节点通知相应的跟随节点。
(二)相应的针对跟随节点成员信息的维护过程可以包括跟随节点加入的处理过程和跟随节点离开(或故障)的处理过程,其中:
(1)跟随节点加入的处理过程
如图8所示,跟随节点加入到系统中的处理过程可以包括:
步骤51:待加入的跟随节点向系统中的管理节点发送跟随节点请求加入信息。
具体地,当待加入的跟随节点需要加入时,首先需要向本系统发出跟随节点请求加入信息;由于待加入的跟随节点在发送请求加入信息时并不知晓系统中任何管理节点的管理节点通信信息,因此待加入的跟随节点所发出跟随节点请求加入信息并不针对系统中的某一特定管理节点,而是针对本系统中的任何一个管理节点;
例如,如图9所示,待加入的跟随节点b1希望以跟随节点的身份加入到集群系统中,因此该待加入的跟随节点b1需要向集群系统发出跟随节点请求加入信息;该跟随节点请求加入信息将会被发送给集群系统中的管理节点A1、A2和A3。
步骤52:系统中的一个管理节点获取跟随节点发送来的跟随节点请求加入信息,并根据该跟随节点请求加入信息更新系统中的跟随节点成员信息。
其中,相应的系统中的一个管理节点可以为相应的协调节点,当协调节点获取到跟随节点发送来的跟随节点请求加入信息后,可以按照以下任意一种方式进行处理:
方式一,该协调节点根据所述跟随节点请求加入信息将该跟随节点的跟随节点信息加入到本系统的跟随节点成员信息中,以更新本系统的跟随节点成员信息,从而使待加入跟随节点成为系统中新加入的跟随节点。
进一步地,该协调节点在将跟随节点信息加入到本系统的跟随节点成员信息中后,向该待加入的跟随节点发送该协调节点的协调节点通信信息;该待加入的跟随节点获取该协调节点的协调节点通信信息后,周期性地向该协调节点发送自身的跟随节点心跳信息,以便于该协调节点能够根据该跟随节点心跳信息确定该跟随节点在加入本系统后是否正常工作。
例如,如图9所示,待加入的跟随节点b1向集群系统发出跟随节点请求加入信息,作为协调节点的管理节点A1会对所述跟随节点请求加入信息进行处理。当管理节点A1获取到跟随节点b1所发出跟随节点请求加入信息后,将该跟随节点对应的跟随节点信息加入到本系统的跟随节点成员信息中,以更新本系统的跟随节点成员信息,从而使待加入的跟随节点b1成为系统中新加入的跟随节点b1;随后,管理节点A1根据跟随节点b1的跟随节点通信信息向跟随节点b1发送管理节点A1的管理节点通信信息;跟随节点b1获取相应的管理节点通信信息后,则周期性地向管理节点A1发送自身的跟随节点心跳信息,以便于该管理节点A1根据跟随节点心跳信息确定跟随节点b1是否正常工作。
方式二,该协调节点根据跟随节点请求加入信息向该待加入的跟随节点发送该协调自身的协调节点通信信息;该待加入的跟随节点获取该协调节点的协调节点通信信息后,则向该协调节点发送自身的跟随节点心跳信息;该协调节点获取该待加入的跟随节点发送的跟随节点心跳信息,则将待加入的跟随节点的跟随节点信息加入到本系统的跟随节点成员信息中,以更新本系统的跟随节点成员信息,从而使待加入跟随节点成为系统中的跟随节点。另一方面,协调节点还可以根据后续是否收到相应的跟随节点心跳信息确定该跟随节点在加入本系统后是否正常工作。
例如,如图9所示,待加入的跟随节点b1向集群系统发出跟随节点请求加入信息;由作为协调节点的管理节点A1对所述跟随节点请求加入信息进行处理。当管理节点A1获取到跟随节点b1所发出跟随节点请求加入信息后向跟随节点b1发送管理节点A1的管理节点通信信息;跟随节点b1获取相应的管理节点通信信息后,周期性地向管理节点A1发送自身的跟随节点心跳信息;管理节点A1获取跟随节点b1发送的跟随节点心跳信息后,则将跟随节点b1的跟随节点信息加入到本系统的跟随节点成员信息中,以更新本系统的跟随节点成员信息,从而使待加入的跟随节点b1成为系统中新加入的跟随节点b1。同时,该管理节点A1还根据周期性获取的跟随节点b1的跟随节点心跳信息确定该跟随节点b1在加入本系统后是否正常工作。
需要说明的是,当系统中存在多个协调节点时,若采用上述方式一,则在协调节点收到跟随节点请示加入信息后,相应的多个协调节点之间可以协商确定由哪一个协调节点负责后续的处理操作;若采用上述方式二,则在协调节点收到跟随节点请示加入信息后,相应的多个协调节点可以分别将自身的协调节点通信信息发送给跟随节点,由跟随节点选择一个与其通信的协调节点,并向该协调节点发送跟随节点心跳信息,之后,则接收到跟随节点心跳信息的协调节点负责后续的处理操作。
步骤53:协调节点在对跟随节点成员信息进行更新后,将更新后的跟随节点成员信息通知系统中的其他管理节点,以便于其他管理节点实时更新其保存的跟随节点成员信息,从而保证管理节点中维护的跟随节点成员信息的准确性。
例如,在如图9所示的集群系统中,当协调节点A1将跟随节点b1的跟随节点信息更新到系统的跟随节点成员信息后,协调节点A1将更新后的跟随节点成员信息传递给后继管理节点A2,管理节点A2保存相应的更新后的跟随节点成员信息后,继续将其传送给管理节点A3,以将更新后的跟随节点成员信息传遍该集群系统的每一个管理节点。
(2)跟随节点离开(或故障)的处理过程
跟随节点在加入的过程中,其将与系统中的一个作为协调节点的管理节点建立连接,跟随节点在与一个协调节点建立连接后,该跟随节点就可以周期性地向该协调节点发送自身的跟随节点心跳信息;该协调节点可以根据该跟随节点周期性发送的跟随节点心跳信息确定该跟随节点是否正常(即是否离开或是否出现故障),进而维护系统中的跟随节点成员信息。
具体地,若该协调节点在预定的时间内无法获取到跟随节点发送来的跟随节点心跳信息,则该协调节点确定该跟随节点出现异常,如该跟随节点可能退出系统(即离开)或出现故障,此时,需要将该跟随节点对应的跟随节点信息从相应的跟随节点成员信息删除,并且将更新后的跟随节点成员信息通知系统中的其他管理节点。
可见,跟随节点仅与系统中作为协调节点的管理节点进行通信,跟随节点的加入或离开也仅由作为协调节点的管理节点来确定,因此对于每个跟随节点而言,与该系统的信息交互过程就是与一个作为协调节点的管理节点进行通信的过程,而且跟随节点与作为协调节点的管理节点进行通信的过程并不影响管理节点之间进行信息传递;这不仅使跟随节点能够快速完成加入或离开系统的操作,而且改善了HA系统或集群系统中节点的容量限制问题,即使跟随节点数目再多也不会延长信息在系统中的传输时间,从而使HA系统或集群系统能够支持更多节点的灵活扩展。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
本发明实施例还提供了应用于管理节点的节点管理装置、应用于跟随节点的节点管理装置以及相应的节点管理系统;下面将分别对其进行详细描述。
(一)应用于管理节点的节点管理装置
如图10所示,本发明实施例提供了一种应用于管理节点的节点管理装置,其具体结构可以包括:
管理节点成员信息接收模块101,用于接收管理节点成员信息,相应的管理节点成员信息是系统中管理节点之间通过信息传递确定。
具体地,管理节点之间通过信息传递确定出系统中的管理节点成员信息后,系统中的管理节点可以通过该管理节点成员信息接收模块101接收到确定后的管理节点成员信息,相应的管理节点成员信息可以同步到系统中的各个管理节点中。
管理节点成员信息维护模块102,用于维护所述管理节点成员信息接收模块101接收的管理节点成员信息。
具体地,系统中的管理节点在通过管理节点成员信息接收模块101接收的管理节点成员信息后,可以通过管理节点成员信息维护模块102进行管理维护,例如,可以根据收到的更新后的管理节点成员信息更新本地保存的管理节点成员信息。
跟随节点成员信息接收模块103,用于接收跟随节点成员信息,相应的跟随节点成员信息由与跟随节点进行信息传递的管理节点确定。
具体地,与跟随节点进行信息传递的管理节点确定出系统中的跟随节点成员信息后,系统中的管理节点可以通过该跟随节点成员信息接收模块103接收到确定后的跟随节点成员信息,相应的跟随节点成员信息可以同步到系统中的各个管理节点中。
跟随节点成员信息维护模块104,用于维护所述跟随节点成员信息接收模块103接收的跟随节点成员信息。
具体地,系统中的管理节点在通过跟随节点成员信息接收模块103接收的跟随节点成员信息后,可以通过跟随节点成员信息维护模块104进行管理维护,例如,可以根据收到的更新后的跟随节点成员信息更新本地保存的跟随节点成员信息。
可选地,如图11所示,该应用于管理节点的节点管理装置在实际用中还可以包括以下结构中的至少一项:
(1)管理节点成员加入处理模块105,用于接收待加入的管理节点发送的管理节点请求加入信息,并根据所述管理节点请求加入信息确定出待加入的管理节点的管理节点信息,再将所述跟随节点信息加入到系统中的跟随节点成员信息,以将更新后的管理节点成员信息发送给待加入的管理节点,或者,管理节点根据获取的所述管理节点请求加入信息向待加入的管理节点发送管理节点成员信息,以通知待加入的管理节点将自身的管理节点信息加入到所述管理节点成员信息中。
具体地,系统中的管理节点可以通过该管理节点成员加入处理模块105将待加入的管理节点加入到系统中,该功能的具体实现方式在前面的节点管理方法实施例中已经有详细描述,故在这里不再赘述。
(2)管理节点成员故障处理模块106,用于确定系统中的管理节点是否出现故障呀是否离开,若出现故障或离开,则删除管理节点成员信息中出现故障的管理节点,并发送更新后的管理节点成员信息,或者,与其他管理节点之间重新通过信息传递确定系统中的管理节点成员信息。
具体地,系统中的管理节点可以通过该管理节点成员故障处理模块106将系统中出现故障或离开的管理节点删除,该功能的具体实现方式在前面的节点管理方法实施例中已经有详细描述,故在这里不再赘述。
(3)跟随节点成员加入处理模块107,用于接收待加入的跟随节点发送的跟随节点请求加入信息,并根据该跟随节点请求加入信息更新跟随节点成员信息,再向系统中的其他管理节点发送更新后的跟随节点成员信息。
可选地,如图12所示,该跟随节点成员加入处理模块具体还可以包括:
第一跟随节点成员加入处理模块1071,用于根据该跟随节点请求加入信息确定出发送该跟随节点请求加入信息的跟随节点对应的跟随节点信息,并将该跟随节点信息加入到跟随节点成员信息中,以更新跟随节点成员信息。
或者,
第二跟随节点成员加入处理模块1072,用于向发送来跟随节点请求加入信息的跟随节点发送该管理节点对应的管理节点通信信息,以通知该跟随节点向该管理节点发送跟随节点心跳信息,该管理节点根据接收到的所述跟随节点心跳信息确定出该跟随节点的跟随节点信息,并将该跟随节点信息加入到跟随节点成员信息中,以更新跟随节点成员信息。
具体地,系统中的管理节点可以通过该跟随节点成员加入处理模块107将待加入的跟随节点加入到系统中,该功能的具体实现方式在前面的节点管理方法实施例中已经有详细描述,故在这里不再赘述。
(4)跟随节点成员故障处理模块108,用于根据跟随节点成员信息周期性地获取系统中的跟随节点发送的跟随节点信息,若该管理节点在预定的跟随节点响应周期内无法获取到一个跟随节点发送的跟随节点信息,则该管理节点将删除所述跟随节点成员信息中该跟随节点的跟随节点信息,并向系统中的其他管理节点发送更新后的跟随节点成员信息。
具体地,系统中的管理节点可以通过该跟随节点成员加入处理模块107将系统中无法正常工作的跟随节点删除,该功能的具体实现方式在前面的节点管理方法实施例中已经有详细描述,故在这里不再赘述。
(5)第一管理节点请求加入模块109,用于向系统中的管理节点发出管理节点请求加入信息,并获取系统中管理节点发送的管理节点成员信息;再将自身的管理节点信息加入到所述的管理节点成员信息中,并向系统中的其他管理节点发送更新后的管理节点成员信息。
具体地,若管理节点需要加入到系统中,则管理节点可以通过该第一管理节点请求加入模块109向系统中的管理节点发送管理节点请求加入信息,并可以通过与系统中管理节点的管理节点成员加入处理模块105进行信息传递加入到系统中;该功能的具体实现方式在前面的节点管理方法实施例中已经有详细描述,故在这里不再赘述。
(6)第二管理节点请求加入模块110,用于向系统中的管理节点发出管理节点请求加入信息,并获取系统中管理节点发送来的更新后的管理节点成员信息,且所述更新后的管理节点成员信息包含该待加入的管理节点对应的管理节点信息。
具体地,若管理节点需要加入到系统中,则管理节点可以通过该第二管理节点请求加入模块110向系统中的管理节点发送管理节点请求加入信息,并可以通过与系统中管理节点的管理节点成员加入处理模块105进行信息传递加入到系统中;该功能的具体实现方式在前面的节点管理方法实施例中已经有详细描述,故在这里不再赘述。
(二)应用于跟随节点的节点管理装置
如图13所示,本发明实施例提供了一种应用于跟随节点的节点管理装置,其具体结构可以包括:
跟随节点信息通信模块201,用于向系统中的一个管理节点发送跟随节点信息,以用于管理节点将该跟随节点信息加入到跟随节点成员信息中并在各个管理节点之间传递,即跟随节点仅与系统中的一个管理节点通信,由该一个管理节点对其进行管理。
具体地,所述的系统中一个管理节点可以是指系统从管理节点中选出的与跟随节点进行信息传递的管理节点,也就是系统中的协调节点,相应的管理节点通信信息即为协调节点的协调节点通信信息。该跟随节点信息通信模块201可以获取一个或多个协调节点所发送的协调节点通信信息,但可以仅选择其中的一个协调节点向其发送自身的跟随节点信息。
可选地,该应用于跟随节点的节点管理装置在实际用中还可以包括:
心跳信息发送模块202,用于根据管理节点通信信息向该管理节点发送跟随节点心跳信息,以用于该管理节点判断该跟随节点是否发生故障或是否离开。
跟随节点请求加入模块203,用于向系统中的管理节点发送跟随节点请求加入信息,用于请求获取所述一个管理节点的管理节点通信信息,从而使得跟随节点信息通信模块201可以获与其通信的一个管理节点的管理节点通信信息,便于后续向该一个管理节点进行信息的传递。
具体地,当跟随节点希望加入到系统中时,跟随节点可以通过该跟随节点请求加入模块203向系统中的管理节点发送跟随节点请求加入信息;该跟随节点请求加入信息会在系统中的之间传递,当系统中选出的与跟随节点进行信息传递的管理节点(或称为协调节点)接收到该跟随节点请求加入信息时,会将一个管理节点(或称协调节点)对应的管理节点通信信息发送给该跟随节点,以便于跟随节点与该一个管理节点之间能够建立连接,之后,跟随节点便可以通过该心跳信息发送模块202向该管理节点发送跟随节点心跳信息,以使得管理节点可以实时监测跟随节点是否离开或是否出现故障,便于及时准确地维护相应的跟随节点成员信息。
(三)节点管理系统
本发明实施例提供了一种节点管理系统,其具体结构可以包括:多个管理节点和多个跟随节点,且所述管理节点设置了上述应用于管理节点的节点管理装置,跟随节点设置了上述应用于跟随节点的节点管理装置。
该节点管理系统中的管理节点上所设置的节点管理装置,其所包含的各个处理模块的功能在上述应用于管理节点的节点管理装置的实施例中已经描述,在此不再详述。该节点管理系统中的跟随节点上所设置的节点管理装置,其所包含的各个处理模块的功能在上述应用于跟随节点的节点管理装置的实施例中已经描述,在此不再详述。
通过上述装置实施例的实现,可以使跟随节点能够快速完成加入或离开系统的操作,而且解除了HA系统或集群系统中节点的容量限制,即使跟随节点数目再多也不会延长信息在系统中的传输时间,使HA系统或集群系统能够支持更多节点的灵活扩展。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书的保护范围为准。

Claims (19)

1.一种节点管理方法,用于HA系统或集群系统,其特征在于,包括: 
管理节点之间通过信息传递确定系统中的管理节点成员信息,并在各个管理节点中传递所述管理节点成员信息; 
跟随节点向一个管理节点发送跟随节点信息,该管理节点根据获取的跟随节点发送来的跟随节点信息确定系统中的跟随节点成员信息,并将所述跟随节点成员信息通知其他管理节点; 
系统中的各个管理节点维护所述管理节点成员信息和跟随节点成员信息。 
2.根据权利要求1所述的节点管理方法,其特征在于,该方法还包括: 
待加入的管理节点向系统中的管理节点发出管理节点请求加入信息,系统中的管理节点根据获取的所述管理节点请求加入信息将待加入的管理节点的管理节点信息加入到管理节点成员信息中,并在各个管理节点中传递更新后的管理节点成员信息,或者,系统中的管理节点根据获取的所述管理节点请求加入信息向待加入的管理节点发送管理节点成员信息,待加入的管理节点将自身的管理节点信息加入到所述管理节点成员信息中,并发送更新后的管理节点成员信息; 
和/或, 
管理节点之间进行信息传递,若确定系统中的一个或多个管理节点出现故障或离开,则删除管理节点成员信息中出现故障或离开的管理节点对应的管理节点信息,并发送更新后的管理节点成员信息,或者,管理节点之间重新通过信息传递确定系统中的管理节点成员信息; 
和/或, 
待加入的跟随节点向系统中的管理节点发送跟随节点请求加入信息,系统中的一个管理节点根据获取的所述跟随节点发送来的跟随节点请求加入信息更新系统中的跟随节点成员信息,并将更新后的跟随节点成员信息通知其他管理节点; 
和/或, 
系统中的一个管理节点根据所述跟随节点成员信息周期性地获取系统中的跟随节点发送的跟随节点心跳信息,若该管理节点在预定的时间内无法获取到一个跟随节点发送的跟随节点心跳信息,则该管理节点将删除所述跟随节点成员信息中该跟随节点的跟随节点信息,并且将更新后的跟随节点成员信息通知其他管理节点。 
3.根据权利要求2所述的节点管理方法,其特征在于,所述的系统中的一个管理节点根据获取的所述跟随节点发送来的跟随节点请求加入信息更新系统中的跟随节点成员信息包括: 
系统中的一个管理节点根据获取的所述跟随节点发送来的跟随节点请求加入信息确定出该跟随节点的跟随节点信息,并且将所述跟随节点信息加入到系统中的跟随节点成员信息; 
或者, 
系统中的一个管理节点根据获取的所述跟随节点发送来的跟随节点请求加入信息向所述跟随节点发送该管理节点的管理节点通信信息;所述跟随节点获取该管理节点的管理节点通信信息后,向该管理节点发送跟随节点心跳信息;该管理节点根据获取的所述跟随节点发送来的跟随节点心跳信息确定出该跟随节点的跟随节点信息,并且将所述跟随节点信息加入到系统中的跟随节点成员信息。 
4.根据权利要求2所述的节点管理方法,其特征在于,与所述跟随节点进行信息传递的一个管理节点为协调节点,且该方法还包括: 
在所述的管理节点成员信息中,管理节点之间通过信息传递确定出一个或多个管理节点作为所述协调节点,且当管理节点成员信息更新时,管理节点之间通过信息传递重新确定出系统中的协调节点;系统中的协调节点确定后,协调节点将自身的协调节点通信信息通知给系统中的跟随节点。 
5.一种节点管理方法,用于HA系统或集群系统,其特征在于,包括: 
管理节点接收管理节点成员信息和跟随节点成员信息,并维护该管理节点成员信息和跟随节点成员信息;其中,所述管理节点成员信息是系统中管理节点之间通过信息传递确定,所述的跟随节点成员信息由与跟随节点进行信息传递的管理节点确定。 
6.根据权利要求5所述的节点管理方法,其特征在于,还包括: 
管理节点接收待加入的管理节点发送的管理节点请求加入信息,并根据所述管理节点请求加入信息确定出待加入的管理节点的管理节点信息,再将所述管理节点信息加入到系统中的管理节点成员信息,发送更新后的管理节点成员信息,或者,管理节点根据获取的所述管理节点请求加入信息向待加入的管理节点发送管理节点成员信息,以通知待加入的管理节点将自身的管理节点信息加入到所述管理节点成员信息中; 
和/或, 
管理节点确定系统中的一个或多个管理节点出现故障或离开,则删除管理节点成员 信息中出现故障或离开的管理节点对应的管理节点信息,并发送更新后的管理节点成员信息,或者,与其他管理节点之间重新通过信息传递确定系统中的管理节点成员信息; 
和/或, 
管理节点接收待加入的跟随节点发送的跟随节点请求加入信息,并根据该跟随节点请求加入信息更新跟随节点成员信息,再向系统中的其他管理节点发送更新后的跟随节点成员信息; 
和/或, 
管理节点根据跟随节点成员信息周期性地获取系统中的跟随节点发送的跟随节点信息,若该管理节点在预定的时间内无法获取到一个跟随节点发送的跟随节点信息,则该管理节点将删除所述跟随节点成员信息中该跟随节点的跟随节点信息,并向系统中的其他管理节点发送更新后的跟随节点成员信息。 
7.根据权利要求6所述的节点管理方法,其特征在于,所述根据该跟随节点请求加入信息更新跟随节点成员信息的步骤包括: 
管理节点根据该跟随节点请求加入信息确定出发送该跟随节点请求加入信息的跟随节点的跟随节点信息,并将该跟随节点信息加入到跟随节点成员信息中,以更新跟随节点成员信息; 
或者, 
管理节点向发送来跟随节点请求加入信息的跟随节点发送该管理节点的管理节点通信信息,用于通知该跟随节点向该管理节点发送跟随节点心跳信息,该管理节点根据接收到的所述跟随节点心跳信息确定出该跟随节点的跟随节点信息,并将该跟随节点信息加入到跟随节点成员信息中,以更新跟随节点成员信息。 
8.根据权利要求5或6所述的节点管理方法,其特征在于,还包括: 
若管理节点需要加入系统中,则向系统中的管理节点发出管理节点请求加入信息,并获取系统中管理节点发送的管理节点成员信息;待加入的管理节点将自身的管理节点信息加入到所述的管理节点成员信息中,并向系统中的其他管理节点发送更新后的管理节点成员信息; 
和/或, 
若管理节点需要加入系统中,则向系统中的管理节点发出管理节点请求加入信息,并获取系统中管理节点发送来的更新后的管理节点成员信息,且所述更新后的管理节点成员信息包含该待加入的管理节点对应的管理节点信息。 
9.一种节点管理方法,用于HA系统或集群系统,其特征在于,包括: 
跟随节点向系统中的一个管理节点发送跟随节点信息,以用于该管理节点将该跟随节点信息加入到跟随节点成员信息中并在各个管理节点之间传递。 
10.根据权利要求9所述的节点管理方法,其特征在于,还包括: 
跟随节点向所述一个管理节点发送跟随节点心跳信息,以用于该管理节点判断该跟随节点是否发生故障或是否离开。 
11.根据权利要求9或10所述的方法,其特征在于,还包括: 
跟随节点向系统中的管理节点发送跟随节点请求加入信息,用于请求获取所述一个管理节点的管理节点通信信息。 
12.一种节点管理装置,用于HA系统或集群系统,其特征在于,包括: 
管理节点成员信息接收模块,用于接收管理节点成员信息;所述管理节点成员信息是系统中管理节点之间通过信息传递确定; 
管理节点成员信息维护模块,用于维护所述管理节点成员信息接收模块接收的管理节点成员信息; 
跟随节点成员信息接收模块,用于接收跟随节点成员信息;所述的跟随节点成员信息由与跟随节点进行信息传递的管理节点确定; 
跟随节点成员信息维护模块,用于维护所述跟随节点成员信息接收模块接收的跟随节点成员信息。 
13.根据权利要求12所述的节点管理装置,其特征在于,还包括: 
管理节点成员加入处理模块,用于接收待加入的管理节点发送的管理节点请求加入信息,并根据所述管理节点请求加入信息确定出待加入的管理节点的管理节点信息,再将所述跟随节点信息加入到系统中的跟随节点成员信息,以将更新后的管理节点成员信息发送给待加入的管理节点; 
和/或, 
管理节点成员故障处理模块,用于确定系统中的管理节点是否出现故障或离开,若出现故障或离开,则删除管理节点成员信息中出现故障或离开的管理节点,并发送更新后的管理节点成员信息,或者,与其他管理节点之间重新通过信息传递确定系统中的管理节点成员信息; 
和/或, 
跟随节点成员加入处理模块,用于接收待加入的跟随节点发送的跟随节点请求加入 信息,并根据该跟随节点请求加入信息更新跟随节点成员信息,再向系统中的其他管理节点发送更新后的跟随节点成员信息; 
和/或, 
跟随节点成员故障处理模块,用于根据跟随节点成员信息周期性地获取系统中的跟随节点发送的跟随节点信息,若该管理节点在预定的时间内无法获取到一个跟随节点发送的跟随节点信息,则该管理节点将删除所述跟随节点成员信息中该跟随节点的跟随节点信息,并向系统中的其他管理节点发送更新后的跟随节点成员信息。 
14.根据权利要求13所述的节点管理装置,其特征在于,所述的跟随节点成员加入处理模块包括: 
第一跟随节点成员加入处理模块,用于根据该跟随节点请求加入信息确定出发送该跟随节点请求加入信息的跟随节点对应的跟随节点信息,并将该跟随节点信息加入到跟随节点成员信息中,以更新跟随节点成员信息; 
或者, 
第二跟随节点成员加入处理模块,用于向发送来跟随节点请求加入信息的跟随节点发送该管理节点对应的管理节点通信信息,以通知该跟随节点向该管理节点发送跟随节点心跳信息,该管理节点根据接收到的所述跟随节点心跳信息确定出该跟随节点的跟随节点信息,并将该跟随节点信息加入到跟随节点成员信息中,以更新跟随节点成员信息。 
15.根据权利要求12或13所述的节点管理装置,其特征在于,还包括: 
第一管理节点请求加入模块,用于向系统中的管理节点发出管理节点请求加入信息,并获取系统中管理节点发送的管理节点成员信息;再将自身的管理节点信息加入到所述的管理节点成员信息中,并向系统中的其他管理节点发送更新后的管理节点成员信息; 
和/或, 
第二管理节点请求加入模块,用于向系统中的管理节点发出管理节点请求加入信息,并获取系统中管理节点发送来的更新后的管理节点成员信息,且所述更新后的管理节点成员信息包含该待加入的管理节点对应的管理节点信息。 
16.一种节点管理装置,用于HA系统或集群系统,其特征在于,包括: 
跟随节点信息通信模块,用于向系统中的一个管理节点发送跟随节点信息,以用于管理节点将该跟随节点信息加入到跟随节点成员信息中并在各个管理节点之间传递。 
17.根据权利要求16所述的节点管理装置,其特征在于,还包括: 
心跳信息发送模块,用于向所述一个管理节点发送跟随节点心跳信息,以用于该管理节点判断该跟随节点是否发生故障或是否离开。 
18.根据权利要求16或17所述的装置,其特征在于,还包括: 
跟随节点请求加入模块,用于向系统中的管理节点发送跟随节点请求加入信息,用于请求获取所述一个管理节点的管理节点通信信息。 
19.一种节点管理系统,用于HA系统或集群系统,其特征在于,包括:多个管理节点和多个跟随节点,且所述管理节点设置如权利要求12至15中任一项所述的节点管理装置,所述跟随节点设置如权利要求16至18中任一项所述的节点管理装置。 
CN201210168252.6A 2012-05-28 2012-05-28 一种节点管理方法、装置及系统 Expired - Fee Related CN102710438B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210168252.6A CN102710438B (zh) 2012-05-28 2012-05-28 一种节点管理方法、装置及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210168252.6A CN102710438B (zh) 2012-05-28 2012-05-28 一种节点管理方法、装置及系统

Publications (2)

Publication Number Publication Date
CN102710438A CN102710438A (zh) 2012-10-03
CN102710438B true CN102710438B (zh) 2015-01-21

Family

ID=46903009

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210168252.6A Expired - Fee Related CN102710438B (zh) 2012-05-28 2012-05-28 一种节点管理方法、装置及系统

Country Status (1)

Country Link
CN (1) CN102710438B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103889021A (zh) * 2012-12-20 2014-06-25 中国移动通信集团公司 低功耗有损网络中成员更新方法及dodag根节点
CN105100175B (zh) * 2014-05-22 2019-01-22 北京猎豹网络科技有限公司 一种服务器集群控制方法、中心服务器及节点服务器
CN108008913B (zh) * 2016-10-27 2020-12-18 杭州海康威视数字技术股份有限公司 一种基于管理节点的扩容方法、装置及存储系统
CN106559490B (zh) * 2016-11-24 2019-10-18 郑州云海信息技术有限公司 一种用于存储集群设备的管理方法
CN107995309A (zh) * 2017-12-18 2018-05-04 苏州蜗牛数字科技股份有限公司 一种分布式数据节点的协调方法及系统
CN108833169A (zh) * 2018-06-21 2018-11-16 郑州云海信息技术有限公司 一种节点上线管理方法和节点
CN111629013B (zh) * 2019-02-27 2024-06-18 北京奇虎科技有限公司 一种业务节点管理的方法、装置和节点网络

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6532494B1 (en) * 1999-05-28 2003-03-11 Oracle International Corporation Closed-loop node membership monitor for network clusters
CN101977385A (zh) * 2010-10-27 2011-02-16 南京航空航天大学 一种支持QoS的规模可扩展单跳ad hoc网络动态时隙分配方法
CN102013991A (zh) * 2009-09-08 2011-04-13 华为技术有限公司 自动扩容的方法、管理设备及系统
CN102118263A (zh) * 2010-01-06 2011-07-06 中兴通讯股份有限公司 配置信息的发布方法及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6532494B1 (en) * 1999-05-28 2003-03-11 Oracle International Corporation Closed-loop node membership monitor for network clusters
CN102013991A (zh) * 2009-09-08 2011-04-13 华为技术有限公司 自动扩容的方法、管理设备及系统
CN102118263A (zh) * 2010-01-06 2011-07-06 中兴通讯股份有限公司 配置信息的发布方法及系统
WO2011082632A1 (zh) * 2010-01-06 2011-07-14 中兴通讯股份有限公司 配置信息的发布方法及系统
CN101977385A (zh) * 2010-10-27 2011-02-16 南京航空航天大学 一种支持QoS的规模可扩展单跳ad hoc网络动态时隙分配方法

Also Published As

Publication number Publication date
CN102710438A (zh) 2012-10-03

Similar Documents

Publication Publication Date Title
CN102710438B (zh) 一种节点管理方法、装置及系统
US10560315B2 (en) Method and device for processing failure in at least one distributed cluster, and system
US11520808B2 (en) System and method for synchronizing data between communication devices in a networked environment without a central server
CN103744809B (zh) 基于vrrp的车辆信息管理系统双机热备方法
CN101729277B (zh) 设备池的管理方法、节点设备和通信系统
US10728099B2 (en) Method for processing virtual machine cluster and computer system
CN104243527A (zh) 数据同步方法、数据同步装置及分布式系统
CN105471622A (zh) 一种基于Galera的控制节点主备切换的高可用方法及系统
CN102394914A (zh) 集群脑裂处理方法和装置
CN109040184B (zh) 一种主节点的选举方法及服务器
CN112260719B (zh) 无线电池管理的跳频通信方法及应用其的系统
CN110971662A (zh) 一种基于Ceph的两节点高可用实现方法及装置
CN107046474B (zh) 一种服务集群
CN112003943A (zh) 语音数据同步方法和装置
CN108667640B (zh) 通信方法及设备、网络接入系统
CN112019614A (zh) 双系统之间通信与通信同步的方法、系统与处理器
CN113194119B (zh) 一种配置文件获取方法及装置
CN113098709B (zh) 基于分布式组网系统的网络恢复方法、装置和计算机设备
KR20140001499A (ko) 고가용성 관리 방법 및 시스템
CN105471619A (zh) 网络节点设备及其主从配置方法和系统
CN106130783B (zh) 一种端口故障处理方法及装置
JP6697158B2 (ja) 情報管理プログラム、情報管理方法、及び情報管理装置
EP2958270B1 (en) Direct-link quality monitoring method, communications device, and system
CN114629747A (zh) 网关连接方法、物联网设备、网关以及物联网系统
CN116781691A (zh) 业务容灾备份方法、业务容灾备份系统及tof节点

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20150121

Termination date: 20180528