CN111258840A - 一种集群节点管理方法、装置及集群 - Google Patents

一种集群节点管理方法、装置及集群 Download PDF

Info

Publication number
CN111258840A
CN111258840A CN201811453596.5A CN201811453596A CN111258840A CN 111258840 A CN111258840 A CN 111258840A CN 201811453596 A CN201811453596 A CN 201811453596A CN 111258840 A CN111258840 A CN 111258840A
Authority
CN
China
Prior art keywords
node
cluster
message middleware
state information
external message
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811453596.5A
Other languages
English (en)
Other versions
CN111258840B (zh
Inventor
翁力帆
邱小冬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Hikvision Digital Technology Co Ltd
Original Assignee
Hangzhou Hikvision Digital Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Hikvision Digital Technology Co Ltd filed Critical Hangzhou Hikvision Digital Technology Co Ltd
Priority to CN201811453596.5A priority Critical patent/CN111258840B/zh
Publication of CN111258840A publication Critical patent/CN111258840A/zh
Application granted granted Critical
Publication of CN111258840B publication Critical patent/CN111258840B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3089Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents
    • G06F11/3093Configuration details thereof, e.g. installation, enabling, spatial arrangement of the probes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/875Monitoring of systems including the internet

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Information Transfer Between Computers (AREA)
  • Hardware Redundancy (AREA)

Abstract

本发明实施例提供了一种集群管理方法、装置及集群。其中,所述方法应用于集群中的子节点,所述子节点包括对外消息中间件,所述集群还包括用于管理所述子节点的主控节点,所述主控节点已经订阅所述对外消息中间件,所述方法包括:将节点状态信息发布至自身的对外消息中间件;通过所述对外消息中间件,将所述节点状态信息推送至已经订阅所述对外消息中间件的主控节点。由于节点状态信息是通过对外消息中间件,推送至主控节点的,子节点无需预先针对主控节点设置对应的上报逻辑,即使主控节点发生变化,只需要将节点状态信息发布至对外消息中间件,因此可以避免因为修改上报逻辑造成的集群管理成本上升,即降低了集群管理成本。

Description

一种集群节点管理方法、装置及集群
技术领域
本发明涉及应用软件技术领域,特别是涉及一种集群节点管理方法、装置及集群。
背景技术
集群系统中包括主控节点和子节点,主控节点为了对子节点进行管理,需要获取子节点的状态,而子节点的状态随时间的变化可能发生变化。相关技术中,可以是预先在子节点中针对主控节点设置对应的上报逻辑,子节点在状态更新后,根据预设的上报逻辑,将更新后的信息上报至主控节点。
但是,如果主控节点发生变化,可能需要对应修改子节点中的上报逻辑,子节点才能够继续将更新后的信息上报至主控节点,而修改上报逻辑可能造成集群管理成本的上升。
发明内容
本发明实施例的目的在于提供一种集群节点管理方法,可以降低集群管理成本。具体技术方案如下:
在本发明实施例的第一方面,提供了一种集群节点管理方法,应用于集群中的子节点,所述子节点包括对外消息中间件,所述集群还包括用于管理所述子节点的主控节点,所述主控节点已经订阅所述对外消息中间件,所述方法包括:
将节点状态信息发布至自身的对外消息中间件;
通过所述对外消息中间件,将所述节点状态信息推送至已经订阅所述对外消息中间件的主控节点。
结合第一方面,在第一种可能的实现方式中,所述子节点还包括单元、组件、对内消息中间件以及信息管理模块,所述节点状态信息包括待上报单元状态信息和组件状态信息;
所述将所述子节点的节点状态信息发布至所述对外消息中间件,包括:
控制所述子节点的单元将单元状态信息发布至所述对内消息中间件;
控制所述对内消息中间件,将所述单元状态信息推送至所述信息管理模块;
控制所述消息管理模块,从所述单元状态信息中筛选出所述待上报单元状态信息,所述待上报单元状态信息为需要上报所述主控节点的单元状态信息;
控制所述消息管理模块将所述待上报单元状态信息发布至所述对外消息中间件;
控制所述子节点的组件将所述组件状态信息发布至所述对外消息中间件。
结合第一方面的第一种可能的实现方式,在第二种可能的实现方式中,在所述控制所述对外消息中间件将所述节点状态信息推送至所述主控节点之后,所述方法还包括:
通过所述对外消息中间件,接收所述主控节点反馈的第一控制信息;
控制所述对外消息中间件,将所述第一控制信息推送至所述组件;
控制所述组件执行所述第一控制信息所对应的控制指令。
在本发明实施例的第二方面,提供了一种集群节点管理方法,应用于集群中的主控节点,所述集群还包括子节点,所述主控节点用于管理所述子节点,所述子节点包括对外消息中间件,所述方法包括:
订阅所述对外消息中间件,以接收所述对外消息中间件所推送的所述子节点的节点状态信息。
结合第二方面,在第一种可能的实现方式中,在所述接受所述对外消息中间件推送的所述子节点的节点状态信息之后,所述方法还包括:
将针对所述节点状态信息反馈的第一控制信息发布至所述对外消息中间件。
结合第二方面的第一种可能的实现方式,在第二种可能的实现方式中,所述集群属于多级级联集群系统,所述多级级联集群系统还包括所述集群的上级集群和外置消息中间件,所述上级集群用于管理所述集群,并且已经订阅所述外置消息中间件,在所述接收对外消息中间件推送的所述子节点的节点状态信息之后,所述方法还包括:
将集群状态信息发布至所述外置消息中间件,所述集群状态信息包括所述节点状态信息和所述集群的标识。
结合第二方面的第二种可能的实现方式,在第三种可能的实现方式中,在所述将集群状态信息发布至所述外置消息中间件之后,所述方法还包括:
接收所述外置消息中间件推送的第二控制信息,所述第二控制信息为所述上级集群的主控节点针对所述集群状态信息发布至所述外置消息中间件的控制信息;
控制所述子节点执行所述第二控制信息所对应的控制指令。
在本发明实施例的第三方面,提供了一种集群节点管理装置,应用于集群中的子节点,所述子节点包括对外消息中间件,所述集群还包括用于管理所述子节点的主控节点,所述主控节点已经订阅所述对外消息中间件,所述装置包括:
消息发布模块,用于将节点状态信息发布至自身的对外消息中间件;
消息推送模块,用于通过所述对外消息中间件,将所述节点状态信息推送至已经订阅所述对外消息中间件的主控节点。
结合第三方面,在第一种可能的实现方式中,所述子节点还包括单元、组件、对内消息中间件以及信息管理模块,所述节点状态信息包括待上报单元状态信息和组件状态信息;
所述消息发布模块,具体用于控制所述子节点的单元将单元状态信息发布至所述对内消息中间件;
控制所述对内消息中间件,将所述单元状态信息推送至所述信息管理模块;
控制所述消息管理模块,从所述单元状态信息中筛选出所述待上报单元状态信息,所述待上报单元状态信息为需要上报所述主控节点的单元状态信息;
控制所述消息管理模块将所述待上报单元状态信息发布至所述对外消息中间件;
控制所述子节点的组件将所述组件状态信息发布至所述对外消息中间件。
结合第三方面的第一种可能的实现方式,在第二种可能的实现方式中,所述装置还包括消息接收模块,用于在所述控制所述对外消息中间件将所述节点状态信息推送至所述主控节点之后,通过所述对外消息中间件,接收所述主控节点反馈的第一控制信息;
控制所述对外消息中间件,将所述第一控制信息推送至所述组件;
控制所述组件执行所述第一控制信息所对应的控制指令。
在本发明实施例的第四方面,一种集群节点管理装置,应用于集群中的主控节点,所述集群还包括子节点,所述主控节点用于管理所述子节点,所述子节点包括对外消息中间件,所述装置包括:
节点订阅模块,用于订阅所述对外消息中间件,以接收所述对外消息中间件所推送的所述子节点的节点状态信息。
结合第四方面,在第一种可能的实现方式中,所述装置还包括节点控制模块,用于在所述接受所述对外消息中间件推送的所述子节点的节点状态信息之后,将针对所述节点状态信息反馈的第一控制信息发布至所述对外消息中间件。
结合第四方面,在第二种可能的实现方式中,所述集群属于多级级联集群系统,所述多级级联集群系统还包括所述集群的上级集群和外置消息中间件,所述上级集群用于管理所述集群,并且已经订阅所述外置消息中间件,所述装置还包括级联交互模块,用于在所述接收对外消息中间件推送的所述子节点的节点状态信息之后,将集群状态信息发布至所述外置消息中间件,所述集群状态信息包括所述节点状态信息和所述集群的标识。
结合第四方面的第二种可能的实现方式,在第三种可能的实现方式中,所述级联交互模块还用于,在所述将集群状态信息发布至所述外置消息中间件之后,接收所述外置消息中间件推送的第二控制信息,所述第二控制信息为所述上级集群的主控节点针对所述集群状态信息发布至所述外置消息中间件的控制信息;
控制所述子节点执行所述第二控制信息所对应的控制指令。
在本发明实施例的第五方面,提供了一种集群,所述集群包括主控节点和子节点,所述子节点包括对外消息中间件;
所述主控节点,用于管理所述子节点,并且所述主控节点已经订阅所述对外消息中间件;
所述子节点,用于将所述子节点的节点状态信息发布至所述对外消息中间件;
所述对外消息中间件,用于将所述节点状态信息推送至所述主控节点。
结合第五方面,在第一种可能的实现方式中,所述子节点还包括单元、组件、对内消息中间件以及信息管理模块,所述消息管理模块已经订阅所述对内消息中间件;
所述单元,用于将所述单元的单元状态信息发布至所述对内消息中间件;
所述对内消息中间件,用于将所述单元状态信息推送至所述信息管理模块;
所述信息管理模块用于从所述单元状态信息中筛选出待上报单元状态信息,所述待上报单元状态信息为需要上报所述主控节点的单元状态信息;并将所述待上报单元状态信息发布至所述对外消息中间件;
所述组件,用于将所述组件的组件状态信息发布至所述对外消息中间件;
所述对外消息中间件,具体用于将所述待上报单元状态信息和所述组件状态信息作为所述子节点的节点状态信息推送至所述主控节点。
结合第五方面的第一种可能的实现方式,在第二种可能的实现方式中,所述主控节点,还用于在接收到所述对外消息中间件推送的所述子节点的节点状态信息后,将针对所述节点状态反馈的第一控制信息发布至所述对外消息中间件;
所述对外中间件,还用于将所述第一控制信息推送至所述组件;
所述组件,还用于执行所述第一控制信息所对应的控制指令。
结合第五方面,在第三种可能的实现方式中,所述集群属于多级级联集群系统,所述多级级联集群系统还包括所述集群的上级集群和外置消息中间件,所述上级集群用于管理所述集群,并且已经订阅所述外置消息中间价;
所述主控节点,还用于在接收到所述对外消息中间件推送的所述子节点的节点状态信息之后,将集群状态信息发布至所述外置消息中间件,所述集群状态信息包括所述节点状态和所述集群的标识。
结合第五方面的第三种可能的实现方式,在第四种可能的实现方式中,所述主控节点,还用于在所述将集群状态信息发布至所述外置消息中间件之后,接收所述外置消息中间件推送的第二控制信息,所述第二控制信息为所述上级集群的主控节点针对所述集群状态信息发布至所述外置消息中间件的控制信息;并控制所述子节点执行所述第二控制信息所对应的控制指令。
结合第五方面,在第五种可能的实现方式中,所述集群还包括备份节点,所述备份节点与所述主控节点之间保持信息同步;
所述备份节点,用于在所述主控节点出现故障后,替代所述主控节点,以作为新的主控节点。
在本发明实施例的第六方面,提供了一种子节点,应用于集群,所述集群还包括用于管理所述子节点的主控节点,所述子节点包括对外消息中间件、存储器以及处理器,所述主控节点已经订阅所述对外消息中间件;
所述存储器,用于存放计算机程序;
所述处理器,用于执行存储器上所存放的程序时,实现权利要求1-3任一所述的方法步骤。
在本发明实施例的第七方面,提供了一种主控节点,应用于集群,所述集群还包括子节点,所述主控节点用于管理所述子节点,所述子节点包括对外消息中间件,所述主控节点包括:
所述存储器,用于存放计算机程序;
所述处理器,用于执行存储器上所存放的程序时,实现权利要求4-7一所述的方法步骤。
在本发明实施例的第七方面,提供了一种计算可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面任一所述的方法步骤。
在本发明实施例的第八方面,提供了一种计算可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述第二方面任一所述的方法步骤。
本发明实施例提供的集群管理方法、装置及集群,由于节点状态信息是通过对外消息中间件,推送至订阅该对外消息中间件的主控节点的,子节点无需预先针对主控节点设置对应的上报逻辑,即使主控节点发生变化,仍然只需要将节点状态信息发布至对外消息中间件,因此可以避免修改上报逻辑造成的集群管理成本上升,即降低了集群管理成本。当然,实施本发明的任一产品或方法并不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1a为本发明实施例提供的集群的一种结构示意图;
图1b为本发明实施例提供的集群的另一种结构示意图;
图2为本发明实施例提供的集群节点管理方法的一种流程示意图;
图3为本发明实施例提供的集群节点管理方法的另一种流程示意图;
图4为本发明实施例提供的集群节点管理方法的另一种流程示意图;
图5为本发明实施例提供的集群的另一种结构示意图;
图6为本发明实施例提供的集群节点管理方法的另一种流程示意图;
图7为本发明实施例提供的集群节点管理方法的另一种流程示意图;
图8为本发明实施例提供的多级级联集群系统的一种结构示意图;
图9为本发明实施例提供的跨级集群节点管理方法的一种流程示意图;
图10为本发明实施例提供的集群节点管理装置的一种结构示意图;
图11为本发明实施例提供的集群节点管理装置的另一种结构示意图;
图12为本发明实施例提供的子节点的一种结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
对于运算复杂度较高的任务,单个计算设备受限制于软件和/或硬件条件,难以执行或者需要花费较长时间才能够完成。因此可以利用多个计算设备组成的集群来执行该类任务,集群中的计算设备可以包括实体计算设备,也可以包括虚拟计算设备(虚拟机、容器),不同的虚拟计算设备可以分布在不同的实体设备中,也可以分布在相同的实体设备中,本实施例对此不做限制。由于包括多个计算设备,因此集群的性能强于单个计算设备,其中,每个计算设备被称为该集群的一个节点。其中节点可以分为子节点和主控节点,主控节点用于管理子节点,子节点用于执行下发至集群的任务。
主控节点为了对子节点进行管理(如对子节点进行配置、下发任务、确定子节点是否存在异常),需要获取子节点的节点状态信息。参见图1a,图1a所示为本发明实施例提供的集群的一种架构示意图,包括主控节点110和多个子节点120,主控节点110用于管理这多个子节点120,子节点120包括对外消息中间件121,主控节点110预先订阅过这多个子节点120的对外消息中间件121。
在其他实施例中,集群也可以包括多个主控节点,示例性的,可以如图1b所示。其中,每个主控节点110用于管理部分子节点120,并且同一个子节点120可以被多个不同的主控节点110管理(在其他可选的实施例中,每个子节点也可以仅被一个主控节点管理)。每个主控节点120预先订阅该主控节点120所管理的子节点120的对外消息中间件121。
在一些可选的实施例中,集群中还可以包括备份节点,备份节点与主控节点之间保持信息同步,用于在主控节点出现故障后,替代主控节点。示例性的,可以主控节点和多个备份节点之间通过热备报文同步消息,当主控节点出现故障后,按照预设规则,从多个备份节点中选举出一个新的主控节点。由于备份节点中的信息与主控节点保持同步,因此备份节点可以替代主控节点实现相应功能。
为讨论方便,下面以集群中的一个子节点为执行主体,对本发明实施例提供的集群节点管理方法进行说明,集群中的其他子节点的原理是相同的,因此不再赘述,参见图2,图2所示为本发明实施例提供的集群节点管理方法的一种流程示意图,该方法应用于子节点,可以包括:
S201,将子节点的节点状态信息发布至对外消息中间件。
根据实际需求,节点状态信息可以包括不同的软件和/或硬件状态信息,示例性的,在本实施例中,节点状态信息可以包括该子节点的CPU(Central Processiing Unit,中央处理器)使用率、GPU(Graphics Processing Unit,图形处理器)使用率、子节点所运行的某个程序的进程状态中的一种或多种信息,在其他可选的实施例中也可以包括其他类型的信息,本发明实施例对此不作限制。由于对外消息中间件位于该子节点内,因此该子节点可以直接将节点状态信息发布至该对外消息中间件。
S202,控制对外消息中间件将节点状态信息推送至主控节点。
消息中间件可以在发布有新的消息后,向订阅该消息中间件的装置推送新的消息,而在本发明实施例中,该主控节点预先订阅了该对外消息中间件,因此该对外消息中间件可以将节点状态信息推送至主控节点。对于集群中包括多个主控节点的情况,对外消息中间件可以将节点状态信息分别推送至所有订阅该对外消息中间件的主控节点。
一方面,消息中间件能够在有新的节点状态信息发布后将新的节点状态信息推送至主控节点,使得主控节点可以实时获取子节点的节点状态信息。另一方面,由于本实施例中,是通过对外消息中间件将节点状态信息推送至主控节点的,因此对于子节点,只需要将节点状态信息发布至对外消息中间件,因此不需要预先针对主控节点设置对应的上报逻辑。因此,即使管理该子节点的主控节点发生变化,如增加了新的主控节点对该子节点进行管理,只需要新增的主控节点订阅该子节点的对外消息中间件即可,不需要修改该子节点的上报逻辑,降低了集群的运维成本和难度。
在一种可能的应用场景中,假设集群中包括一个主控节点和多个子节点,该主控节点用于管理这多个子节点,这多个子节点中的每个子节点包括对外消息中间件(如图1a所示),下面将结合主控节点和一个子节点,对本发明实施例提供的集群节点管理方法进行说明,可以参见图3,包括:
S301,主控节点订阅集群中的每个子节点的对外消息中间件。
主控节点可以是向每个子节点发送订阅报文,该订阅报文中携带有主控节点的标识,每个子节点在接收到订阅报文后,根据所携带的主控节点的标识,在该子节点的对外消息中间件的注册链表中注册主控节点,以使得对外消息中间件在有新的节点状态信息发布后,将新的状态节点状态信息推送至主控节点。
S302,子节点将该子节点的节点状态信息发布至该子节点的对外消息中间件。
该步骤与S201相同,可以参见前述关于S201的描述,在此不再赘述。
S303,子节点中控制对外消息中间件将节点状态信息推送至主控节点。
该步骤与S202相同,可以参见前述关于S202的描述,在此不再赘述。可以理解的是,不同的子节点的节点状态信息的发布和推送是彼此独立的,例如一个子节点可以在另外一个子节点执行S302之前或者正在执行S302时,已经执行完成S303或者正在执行S303。
在一种可能的应用场景中,假设集群中包括多个主控节点和多个子节点,该主控节点用于管理这多个子节点,这多个子节点中的每个子节点包括对外消息中间件(如图1b所示),下面将结合一个主控节点和一个子节点,对本发明实施例提供的集群节点管理方法进行说明,可以参见图3,包括:
S401,主控节点订阅该主控节点所管理的每个子节点的对外消息中间件。
一个主控节点所管理的子节点可以是根据实际需求或者预设规则进行预先分配的。不同主控节点所管理的子节点的数目可以相同,也可以不同。
S402,子节点将该子节点的节点状态信息发布至该子节点的对外消息中间件。
该步骤与S201相同,可以参见前述关于S201的描述,在此不再赘述。子节点
S403,子节点中控制对外消息中间件将节点状态信息推送至主控节点。
该步骤与S202相同,可以参见前述关于S202的描述,在此不再赘述。
在一些应用场景中,子节点中可以包括具备特定功能的组件和用于执行运算任务的单元(在其他应用场景中,子节点也可以只包括组件或者单元),其中,一个子节点中包括的组件的数目和单元的数目根据实际应用场景的不同,可以是多个也可以是一个。为讨论方便,下面以子节点包括多个组件和多个单元为例进行说明。
多个单元可以是相同架构的单元,也可以是不同架构的单元,示例性的,多个单元可以均为X86架构的单元,也可以是其中一部分单元为X86架构的单元,除该部分单元以外的其他单元为ARM(Advanced Reduced instruction set computer Machines,进阶精简指令集机器)架构的单元。每个组件和每个单元在运行的过程中状态均可能发生变化,并在状态发生变化后,将状态信息发布至对外消息中间件,以下称组件发布的状态信息为组件状态信息,单元发布的状态信息为单元状态信息。
但是,主控节点可能对于子节点中的一部分(甚至所有)单元不感兴趣,例如,假设子节点包括单元A,主控节点在对子节点进行配置和下发任务时,并不会基于单元A的单元状态信息,此时可以认为主控节点对于子节点中的单元A不感兴趣。在一些使用场景中,如果子节点中包括大量主控节点不感兴趣的单元,则可能会导致子节点的消息中间件向主控节点推送大量对于主控节点无用的单元状态信息。
为解决上述技术问题,可以参见图5,图5所示为本发明实施例提供的集群的另一种架构示意图,可以包括:主控节点110、子节点120,每个子节点中包括对外消息中间件121、对内消息中间件122、消息管理模块123以及组件124和单元125。下面将对该集群中的一个主控节点、该主控节点所管理的一个子节点,对本发明实施例提供的集群节点管理方法进行说明,可以参见图6,包括:
S601,主控节点订阅该主控节点所管理的每个子节点的对外消息中间件。
该步骤与S401相同,可以参见前述关于S401的描述,在此不再赘述。
S602,子节点的各个单元,将该单元的单元状态信息发布至对内消息中间件。
其中,每个单元可以是在该单元状态发生变化后,将该单元的单元状态信息发布至对内消息中间件。每个单元将该单元的单元状态信息发布至对内消息中间件可以是相互独立的过程。在其他可选的实施例中,如果一个单元的状态没有发生变化,也可以不将该单元的单元状态信息发布至对内消息中间件。
S603,对内消息中间件将各个单元的单元状态信息推送至信息管理模块。
信息管理模块可以预先订阅对内消息中间件,以使得对内消息中间件在单元状态信息发布后,将单元状态信息推送至信息管理模块。
S604,消息管理模块从单元状态信息中筛选出待上报单元状态信息。
其中,待上报单元状态信息为主控节点所感兴趣的单元状态信息。消息管理模块可以是根据预先设置的筛选规则,从单元状态信息中筛选出待上报单元状态信息。示例性的,可以是从单元状态信息中筛选出所有GPU的占用率。
S605,消息管理模块将待上报单元状态信息发布至对外消息中间件。
S606,该子节点的各个组件,将该组件的组件状态信息发布至对外消息中间件。
组件和单元之间可以是相互独立的,在一些应用场景中S606可以是在S602-S605中任一步骤之前执行的,也可以是与S602-S605中任一步骤并行执行的。
S607,对外消息中间件将待上报单元状态信息和组件状态信息作为节点状态信息发布至主控节点。
在其他可选的实施例中,如果在实际的应用场景中,主控节点可能对部分组件状态信息不敢兴趣,在该应用场景中,节点中的各个组件也可以不将组件状态信息直接发布至对外消息中间件,而是将组件状态信息发布至对内消息中间件,对内消息中间件将组件状态信息推送至消息管理模块,消息管理模块从组件状态信息中筛选出待上报组件状态信息,其中,待上报组件状态信息为主控节点感兴趣的组件状态信息,并将待上报组件状态信息发布至对外消息中间件。对外消息中间件,将待上报单元状态信息和待上报组件状态信息推送至主控节点。
选用该实施例,可以通过对内消息中间件和对外消息中间件实现对单元状态信息和组件状态信息的分级管理。在实现汇总单元状态信息和组件状态信息的前提下,对单元状态信息进行筛选,仅将单元状态信息中的待上报单元状态信息推送至主控节点,避免将无用的单元状态信息推送至主控节点。另一方面,汇总的单元状态信息和组件状态信息可以用于子节点对自身的管理。
在一些可能的应用场景中,主控节点可以仅获取子节点的节点状态信息,而不向子节点反馈控制信息,例如主控节点获取子节点的各个CPU的占用率,用于监测子节点的CPU占用率是否存在异常。在另一些可能的应用场景中,主控节点还可以根据获取到的子节点的节点状态信息,对子节点进行配置和/或下发任务。
参见图7,图7所示为本发明实施例提供的集群节点管理方法的另一种流程示意图,可以包括:
S701,主控节点订阅该主控节点所管理的每个子节点的对外消息中间件。
该步骤与S401相同,可以参见前述关于S401的描述,在此不再赘述。
S702,子节点的各个单元,将该单元的单元状态信息发布至对内消息中间件。
该步骤与S602相同,可以参见前述关于S602的描述,在此不再赘述。
S703,对内消息中间件将各个单元的单元状态信息推送至信息管理模块。
该步骤与S603相同,可以参见前述关于S603的描述,在此不再赘述。
S704,消息管理模块从单元状态信息中筛选出待上报单元状态信息。
该步骤与S604相同,可以参见前述关于S604的描述,在此不再赘述。
S705,消息管理模块将待上报单元状态信息发布至对外消息中间件。
S706,该子节点的各个组件,将该组件的组件状态信息发布至对外消息中间件。
S707,对外消息中间件将待上报单元状态信息和组件状态信息作为节点状态信息发布至主控节点。
该步骤与S607相同,可以参见前述关于S607的描述,在此不再赘述。
S708,主控节点将第一控制信息发布至对外消息中间件。
其中,第一控制信息为主控节点针对节点状态信息向子节点反馈的控制信息,根据实际应用场景,第一控制信息可以包括配置信息,和/或任务信息。配置信息用于使得子节点更改子节点的运行参数,任务信息用于使得子节点执行指定的任务。
第一控制信息可以是主控节点生成的,也可以是主控节点获取得到的。示例性的,主控节点在接收到子节点的对外消息中间件推送的节点状态信息后,在预设的页面上显示该节点状态信息,并获取针对所显示的节点状态信息输入的第一控制信息。
S709,对外消息中间件将第一控制信息推送至所属子节点的组件。
在本实施例中,根据实际需求,对外消息中间件可以是将第一控制信息推送至所属子节点的每个组件,也可以是将第一控制信息推送至所属子节点的部分组件。示例性的,假设子节点包括组件A、组件B、组件C,主控节点需要监测这三个组件的状态是否存在异常,并对组件A和组件B下发任务,在这种情况下,对外消息中间件可以不将第一控制信息推送至组件C,在本实施例中,可以是组件A和组件B预先订阅对外消息中间件,而组件C不订阅对外消息中间件。
在其他可选的实施例中,对外消息中间件还可以将第一控制信息推送至消息管理模块,并经由消息管理模块发布至对内消息中间件,对内消息中间件将状态信息推送至所属子节点的每个或者部分单元。
S710,该子节点的组件执行第一控制信息所对应的控制指令。
其中,如果对外消息中间件将第一控制信息推送至所属子节点的每个组件,则每个组件均执行第一控制信息所对应的控制指令。如果对外消息中间件将第一控制信息推送子节点的部分组件,则只有被推送了第一控制信息的组件执行第一控制信息所对应的控制指令,没有被推送第一控制信息的组件不执行第一控制信息所对应的控制指令。
在可选的实施例中,如果对外消息中间件,通过消息管理模块,和对内消息中间件将第一控制信息发布,则该子节点的单元也可以根据实际需求执行或者第一控制信息所对应的控制指令。
选用该实施例,主控节点可以通过将第一控制信息发布至子节点的对外消息节点,以间接控制子节点的组件执行相应的控制操作。
在一些应用场景中,可能不止存在一个集群,这些集群可以构成一个集群系统,集群系统中的集群可以是相互独立的,也可以是非相互独立的,例如,集群之间可以存在级联关系,可以参见图8,图8所示为本发明实施例提供的多级级联集群系统,多级级联集群系统中的集群被划分为多级,为讨论方便下面以被划分为两级的情况进行说明,对于被划分为三级以及三级以上的情况原理是相同的。
多级级联集群系统中可以包括一级集群100和二级集群200以及外置消息中间件300,其中外置消息中间件可以是集成在任一以及集群100中的任一节点,也可以是与一级集群100相互独立。二级集群200用于管理与该二级集群存在级联关系的一级集群100。一级集群100中包括主控节点110和子节点120,子节点120中包括对外消息中间件,关于一级集群100对于自身的管理方法,可以参见上述相关描述,在此不再赘述。
二级集群200的集群架构可以和一级集群100的集群架构相同,下面结合一个一级集群100和管理该一级集群100的二级集群200以及外置消息中间件300,对本发明实施例提供的多级级联集群系统管理流程进行说明,参见图9,可以包括:
S901,一级集群的主控节点,在接收到一级集群的子节点的对外消息中间件推送的节点状态信息后,将集群状态信息发布至外置消息中间件。
其中,集群状态信息包括节点状态信息和一级集群的标识。集群状态信息中可以包括一级集群中的每个子节点的节点状态信息,也可以只包括一级集群中的部分子节点的节点状态信息。示例性的,一级集群的主控节点可以在接收到一级集群所有子节点的节点状态信息后,直接将每个子节点的节点状态信息以及一级集群的标识发布至外置消息中间件,也可以是从所有子节点的节点状态中筛选出二级集群感兴趣的节点状态信息,作为待上报节点状态信息并将待上报节点状态信息和一级集群的标识发布至外置消息中间件。
S902,外置消息中间件将集群状态信息推送至二级集群的主控节点。
二级集群的主控节点预先订阅过该外置消息中间件。进一步的,如果二级集群用于管理多个一级集群,则外置消息中间件可以是在这多个一级集群将集群状态信息发布至该外置消息中间件后,将这多个一级集群的集群状态信息推送至二级集群的主控节点。
S903,二级集群的主控节点将第二控制信息发布至外置消息中间件。
其中,第二控制信息可以为二级集群控制的主控节点针对一级集群的状态信息反馈的控制信息,用于对一级集群中的子节点进行配置和/或下发任务。
S904,外置消息中间件将第二控制信息推送至一级集群的主控节点。
S905,一级集群的主控节点控制一级集群的子节点执行第二控制信息所对应的控制指令。
关于一级集群的主控节点如何控制一级集群的子节点,可以参见前述相关描述,在此不再赘述。
参见图10,图10所示为本发明实施例提供的集群节点管理装置的一种结构示意图,该装置应用于集群中的子节点,子节点包括对外消息中间件,集群还包括用于管理子节点的主控节点,主控节点已经订阅对外消息中间件,该装置可以包括:
消息发布模块1001,用于将节点状态信息发布至自身的对外消息中间件;
消息推送模块1002,用于通过对外消息中间件,将节点状态信息推送至已经订阅对外消息中间件的主控节点。
在一种可选的实施例中,子节点还包括单元、组件、对内消息中间件以及信息管理模块,节点状态信息包括待上报单元状态信息和组件状态信息;
消息发布模块1001,具体用于控制子节点的单元将单元状态信息发布至对内消息中间件;
控制对内消息中间件,将单元状态信息推送至信息管理模块;
控制消息管理模块,从单元状态信息中筛选出待上报单元状态信息,待上报单元状态信息为需要上报主控节点的单元状态信息;
控制消息管理模块将待上报单元状态信息发布至对外消息中间件;
控制子节点的组件将组件状态信息发布至对外消息中间件。
在一种可选的实施例中,装置还包括消息接收模块,用于在控制对外消息中间件将节点状态信息推送至主控节点之后,通过对外消息中间件,接收主控节点反馈的第一控制信息;
控制对外消息中间件,将第一控制信息推送至组件;
控制组件执行第一控制信息所对应的控制指令。
参见图11,图11所示为本发明实施例提供的集群节点管理装置的一种结构示意图,应用于集群中的主控节点,集群还包括子节点,主控节点用于管理子节点,子节点包括对外消息中间件,该装置可以包括:
节点订阅模块1101,用于订阅对外消息中间件,以接收对外消息中间件所推送的子节点的节点状态信息。
在一种可选的实施例中,装置还包括节点控制模块,用于在接受对外消息中间件推送的子节点的节点状态信息之后,将针对节点状态信息反馈的第一控制信息发布至对外消息中间件。
在一种可选的实施例中,集群属于多级级联集群系统,多级级联集群系统还包括集群的上级集群和外置消息中间件,上级集群用于管理集群,并且已经订阅外置消息中间件,装置还包括级联交互模块,用于在接收对外消息中间件推送的子节点的节点状态信息之后,将集群状态信息发布至外置消息中间件,集群状态信息包括节点状态信息和集群的标识。
在一种可选的实施例中,级联交互模块还用于,在将集群状态信息发布至外置消息中间件之后,接收外置消息中间件推送的第二控制信息,第二控制信息为上级集群的主控节点针对集群状态信息发布至外置消息中间件的控制信息;
控制子节点执行第二控制信息所对应的控制指令。
本发明实施例还提供了一种子节点,如图12所示,应用于集群,集群还包括用于管理子节点的主控节点,子节点包括对外消息中间件、存储器以及处理器,主控节点已经订阅对外消息中间件,该子节点包括:
存储器1201,用于存放计算机程序;
处理器1202,用于执行存储器1201上所存放的程序时,实现如下步骤:
将节点状态信息发布至自身的对外消息中间件;
通过对外消息中间件,将节点状态信息推送至已经订阅对外消息中间件的主控节点。
在一种可选的实施例中,子节点还包括单元、组件、对内消息中间件以及信息管理模块,节点状态信息包括待上报单元状态信息和组件状态信息;
将子节点的节点状态信息发布至对外消息中间件,包括:
控制子节点的单元将单元状态信息发布至对内消息中间件;
控制对内消息中间件,将单元状态信息推送至信息管理模块;
控制消息管理模块,从单元状态信息中筛选出待上报单元状态信息,待上报单元状态信息为需要上报主控节点的单元状态信息;
控制消息管理模块将待上报单元状态信息发布至对外消息中间件;
控制子节点的组件将组件状态信息发布至对外消息中间件。
在一种可选的实施例中,在控制对外消息中间件将节点状态信息推送至主控节点之后,方法还包括:
通过对外消息中间件,接收主控节点反馈的第一控制信息;
控制对外消息中间件,将第一控制信息推送至组件;
控制组件执行第一控制信息所对应的控制指令。
本发明实施例还提供了一种主控节点,应用于集群,集群还包括子节点,主控节点用于管理子节点,子节点包括对外消息中间件,该主控节点包括:
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现如下步骤:
订阅对外消息中间件,以接收对外消息中间件所推送的子节点的节点状态信息。
在一种可选的实施例中,在接受对外消息中间件推送的子节点的节点状态信息之后,方法还包括:
将针对节点状态信息反馈的第一控制信息发布至对外消息中间件。
在一种可选的实施例中,集群属于多级级联集群系统,多级级联集群系统还包括集群的上级集群和外置消息中间件,上级集群用于管理集群,并且已经订阅外置消息中间件,在接收对外消息中间件推送的子节点的节点状态信息之后,方法还包括:
将集群状态信息发布至外置消息中间件,集群状态信息包括节点状态信息和集群的标识。
在一种可选的实施例中,在将集群状态信息发布至外置消息中间件之后,方法还包括:
接收外置消息中间件推送的第二控制信息,第二控制信息为上级集群的主控节点针对集群状态信息发布至外置消息中间件的控制信息;
控制子节点执行第二控制信息所对应的控制指令。
上述电子设备提到存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中任一集群节点管理方法。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一集群节点管理方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、子节点、主控节点、计算机可读存储介质、计算机程序产品的实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (24)

1.一种集群节点管理方法,其特征在于,应用于集群中的子节点,所述子节点包括对外消息中间件,所述集群还包括用于管理所述子节点的主控节点,所述主控节点已经订阅所述对外消息中间件,所述方法包括:
将节点状态信息发布至自身的对外消息中间件;
通过所述对外消息中间件,将所述节点状态信息推送至已经订阅所述对外消息中间件的主控节点。
2.根据权利要求1所述的方法,其特征在于,所述子节点还包括单元、组件、对内消息中间件以及信息管理模块,所述节点状态信息包括待上报单元状态信息和组件状态信息;
所述将所述子节点的节点状态信息发布至所述对外消息中间件,包括:
控制所述子节点的单元将单元状态信息发布至所述对内消息中间件;
控制所述对内消息中间件,将所述单元状态信息推送至所述信息管理模块;
控制所述消息管理模块,从所述单元状态信息中筛选出所述待上报单元状态信息,所述待上报单元状态信息为需要上报所述主控节点的单元状态信息;
控制所述消息管理模块将所述待上报单元状态信息发布至所述对外消息中间件;
控制所述子节点的组件将所述组件状态信息发布至所述对外消息中间件。
3.根据权利要求2所述的方法,其特征在于,在所述控制所述对外消息中间件将所述节点状态信息推送至所述主控节点之后,所述方法还包括:
通过所述对外消息中间件,接收所述主控节点反馈的第一控制信息;
控制所述对外消息中间件,将所述第一控制信息推送至所述组件;
控制所述组件执行所述第一控制信息所对应的控制指令。
4.一种集群节点管理方法,其特征在于,应用于集群中的主控节点,所述集群还包括子节点,所述主控节点用于管理所述子节点,所述子节点包括对外消息中间件,所述方法包括:
订阅所述对外消息中间件,以接收所述对外消息中间件所推送的所述子节点的节点状态信息。
5.根据权利要求4所述的方法,其特征在于,在所述接受所述对外消息中间件推送的所述子节点的节点状态信息之后,所述方法还包括:
将针对所述节点状态信息反馈的第一控制信息发布至所述对外消息中间件。
6.根据权利要求4所述的方法,其特征在于,所述集群属于多级级联集群系统,所述多级级联集群系统还包括所述集群的上级集群和外置消息中间件,所述上级集群用于管理所述集群,并且已经订阅所述外置消息中间件,在所述接收对外消息中间件推送的所述子节点的节点状态信息之后,所述方法还包括:
将集群状态信息发布至所述外置消息中间件,所述集群状态信息包括所述节点状态信息和所述集群的标识。
7.根据权利要求6所述的方法,其特征在于,在所述将集群状态信息发布至所述外置消息中间件之后,所述方法还包括:
接收所述外置消息中间件推送的第二控制信息,所述第二控制信息为所述上级集群的主控节点针对所述集群状态信息发布至所述外置消息中间件的控制信息;
控制所述子节点执行所述第二控制信息所对应的控制指令。
8.一种集群节点管理装置,其特征在于,应用于集群中的子节点,所述子节点包括对外消息中间件,所述集群还包括用于管理所述子节点的主控节点,所述主控节点已经订阅所述对外消息中间件,所述装置包括:
消息发布模块,用于将节点状态信息发布至自身的对外消息中间件;
消息推送模块,用于通过所述对外消息中间件,将所述节点状态信息推送至已经订阅所述对外消息中间件的主控节点。
9.根据权利要求8所述的装置,其特征在于,所述子节点还包括单元、组件、对内消息中间件以及信息管理模块,所述节点状态信息包括待上报单元状态信息和组件状态信息;
所述消息发布模块,具体用于控制所述子节点的单元将单元状态信息发布至所述对内消息中间件;
控制所述对内消息中间件,将所述单元状态信息推送至所述信息管理模块;
控制所述消息管理模块,从所述单元状态信息中筛选出所述待上报单元状态信息,所述待上报单元状态信息为需要上报所述主控节点的单元状态信息;
控制所述消息管理模块将所述待上报单元状态信息发布至所述对外消息中间件;
控制所述子节点的组件将所述组件状态信息发布至所述对外消息中间件。
10.根据权利要求9所述的装置,其特征在于,所述装置还包括消息接收模块,用于在所述控制所述对外消息中间件将所述节点状态信息推送至所述主控节点之后,通过所述对外消息中间件,接收所述主控节点反馈的第一控制信息;
控制所述对外消息中间件,将所述第一控制信息推送至所述组件;
控制所述组件执行所述第一控制信息所对应的控制指令。
11.一种集群节点管理装置,其特征在于,应用于集群中的主控节点,所述集群还包括子节点,所述主控节点用于管理所述子节点,所述子节点包括对外消息中间件,所述装置包括:
节点订阅模块,用于订阅所述对外消息中间件,以接收所述对外消息中间件所推送的所述子节点的节点状态信息。
12.根据权利要求11所述的装置,其特征在于,所述装置还包括节点控制模块,用于在所述接受所述对外消息中间件推送的所述子节点的节点状态信息之后,将针对所述节点状态信息反馈的第一控制信息发布至所述对外消息中间件。
13.根据权利要求11所述的装置,其特征在于,所述集群属于多级级联集群系统,所述多级级联集群系统还包括所述集群的上级集群和外置消息中间件,所述上级集群用于管理所述集群,并且已经订阅所述外置消息中间件,所述装置还包括级联交互模块,用于在所述接收对外消息中间件推送的所述子节点的节点状态信息之后,将集群状态信息发布至所述外置消息中间件,所述集群状态信息包括所述节点状态信息和所述集群的标识。
14.根据权利要求13所述的装置,其特征在于,所述级联交互模块还用于,在所述将集群状态信息发布至所述外置消息中间件之后,接收所述外置消息中间件推送的第二控制信息,所述第二控制信息为所述上级集群的主控节点针对所述集群状态信息发布至所述外置消息中间件的控制信息;
控制所述子节点执行所述第二控制信息所对应的控制指令。
15.一种集群,其特征在于,所述集群包括主控节点和子节点,所述子节点包括对外消息中间件;
所述主控节点,用于管理所述子节点,并且所述主控节点已经订阅所述对外消息中间件;
所述子节点,用于将所述子节点的节点状态信息发布至所述对外消息中间件;
所述对外消息中间件,用于将所述节点状态信息推送至所述主控节点。
16.根据权利要求15所述的集群,其特征在于,所述子节点还包括单元、组件、对内消息中间件以及信息管理模块,所述消息管理模块已经订阅所述对内消息中间件;
所述单元,用于将所述单元的单元状态信息发布至所述对内消息中间件;
所述对内消息中间件,用于将所述单元状态信息推送至所述信息管理模块;
所述信息管理模块用于从所述单元状态信息中筛选出待上报单元状态信息,所述待上报单元状态信息为需要上报所述主控节点的单元状态信息;并将所述待上报单元状态信息发布至所述对外消息中间件;
所述组件,用于将所述组件的组件状态信息发布至所述对外消息中间件;
所述对外消息中间件,具体用于将所述待上报单元状态信息和所述组件状态信息作为所述子节点的节点状态信息推送至所述主控节点。
17.根据权利要求16所述的集群,其特征在于,所述主控节点,还用于在接收到所述对外消息中间件推送的所述子节点的节点状态信息后,将针对所述节点状态反馈的第一控制信息发布至所述对外消息中间件;
所述对外中间件,还用于将所述第一控制信息推送至所述组件;
所述组件,还用于执行所述第一控制信息所对应的控制指令。
18.根据权利要求15所述的集群,其特征在于,所述集群属于多级级联集群系统,所述多级级联集群系统还包括所述集群的上级集群和外置消息中间件,所述上级集群用于管理所述集群,并且已经订阅所述外置消息中间价;
所述主控节点,还用于在接收到所述对外消息中间件推送的所述子节点的节点状态信息之后,将集群状态信息发布至所述外置消息中间件,所述集群状态信息包括所述节点状态和所述集群的标识。
19.根据权利要求18所述的集群,其特征在于,所述主控节点,还用于在所述将集群状态信息发布至所述外置消息中间件之后,接收所述外置消息中间件推送的第二控制信息,所述第二控制信息为所述上级集群的主控节点针对所述集群状态信息发布至所述外置消息中间件的控制信息;并控制所述子节点执行所述第二控制信息所对应的控制指令。
20.根据权利要求15所述的集群,其特征在于,所述集群还包括备份节点,所述备份节点与所述主控节点之间保持信息同步;
所述备份节点,用于在所述主控节点出现故障后,替代所述主控节点,以作为新的主控节点。
21.一种子节点,其特征在于,应用于集群,所述集群还包括用于管理所述子节点的主控节点,所述子节点包括对外消息中间件、存储器以及处理器,所述主控节点已经订阅所述对外消息中间件;
所述存储器,用于存放计算机程序;
所述处理器,用于执行存储器上所存放的程序时,实现权利要求1-3任一所述的方法步骤。
22.一种主控节点,其特征在于,应用于集群,所述集群还包括子节点,所述主控节点用于管理所述子节点,所述子节点包括对外消息中间件,所述主控节点包括:
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求4-7一所述的方法步骤。
23.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-3任一所述的方法步骤。
24.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求4-7任一所述的方法步骤。
CN201811453596.5A 2018-11-30 2018-11-30 一种集群节点管理方法、装置及集群 Active CN111258840B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811453596.5A CN111258840B (zh) 2018-11-30 2018-11-30 一种集群节点管理方法、装置及集群

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811453596.5A CN111258840B (zh) 2018-11-30 2018-11-30 一种集群节点管理方法、装置及集群

Publications (2)

Publication Number Publication Date
CN111258840A true CN111258840A (zh) 2020-06-09
CN111258840B CN111258840B (zh) 2023-10-10

Family

ID=70953579

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811453596.5A Active CN111258840B (zh) 2018-11-30 2018-11-30 一种集群节点管理方法、装置及集群

Country Status (1)

Country Link
CN (1) CN111258840B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111930402A (zh) * 2020-08-27 2020-11-13 中山市天启智能科技有限公司 集群服务器的固件升级方法和集群服务器
CN113179324A (zh) * 2021-04-29 2021-07-27 中国人民银行数字货币研究所 一种区块链节点及其执行的业务处理方法

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040240462A1 (en) * 2003-05-27 2004-12-02 Sun Microsystems, Inc. Hashing based messaging approach to a cluster
WO2004107196A1 (en) * 2003-05-27 2004-12-09 Nokia Corporation Data collection in a computer cluster
CN101188575A (zh) * 2007-12-04 2008-05-28 浙江大学 一种面向发布订阅系统的流量控制和消息缓存方法
CN101765225A (zh) * 2008-12-24 2010-06-30 华为技术有限公司 一种虚拟化的集群管理方法和集群节点
WO2012119310A1 (zh) * 2011-03-09 2012-09-13 中国科学院计算机网络信息中心 在计算环境中汇聚队列信息及作业信息的方法
CN103607297A (zh) * 2013-11-07 2014-02-26 上海爱数软件有限公司 一种计算机集群系统的故障处理方法
US20140304399A1 (en) * 2013-04-06 2014-10-09 Citrix Systems, Inc. Systems and methods for providing monitoring in a cluster system
US20150301880A1 (en) * 2014-04-21 2015-10-22 Netapp, Inc. Providing boot data in a cluster network environment
CN105007294A (zh) * 2015-05-26 2015-10-28 华北电力大学(保定) 输变电设备状态监测大数据快速接收和分发系统
CN105791082A (zh) * 2014-12-23 2016-07-20 阿里巴巴集团控股有限公司 计算机集群间基于消息中间件的消息传输方法及其装置
CN106953901A (zh) * 2017-03-10 2017-07-14 重庆邮电大学 一种提高消息传递性能的集群通信系统及其方法
US9769032B1 (en) * 2015-03-20 2017-09-19 Databricks Inc. Cluster instance management system
US20180191663A1 (en) * 2017-01-02 2018-07-05 International Business Machines Corporation Cluster assisted MQTT client coverage for fat-pipe cloud applications

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040240462A1 (en) * 2003-05-27 2004-12-02 Sun Microsystems, Inc. Hashing based messaging approach to a cluster
WO2004107196A1 (en) * 2003-05-27 2004-12-09 Nokia Corporation Data collection in a computer cluster
CN101188575A (zh) * 2007-12-04 2008-05-28 浙江大学 一种面向发布订阅系统的流量控制和消息缓存方法
CN101765225A (zh) * 2008-12-24 2010-06-30 华为技术有限公司 一种虚拟化的集群管理方法和集群节点
WO2012119310A1 (zh) * 2011-03-09 2012-09-13 中国科学院计算机网络信息中心 在计算环境中汇聚队列信息及作业信息的方法
US20140304399A1 (en) * 2013-04-06 2014-10-09 Citrix Systems, Inc. Systems and methods for providing monitoring in a cluster system
CN103607297A (zh) * 2013-11-07 2014-02-26 上海爱数软件有限公司 一种计算机集群系统的故障处理方法
US20150301880A1 (en) * 2014-04-21 2015-10-22 Netapp, Inc. Providing boot data in a cluster network environment
CN105791082A (zh) * 2014-12-23 2016-07-20 阿里巴巴集团控股有限公司 计算机集群间基于消息中间件的消息传输方法及其装置
US9769032B1 (en) * 2015-03-20 2017-09-19 Databricks Inc. Cluster instance management system
CN105007294A (zh) * 2015-05-26 2015-10-28 华北电力大学(保定) 输变电设备状态监测大数据快速接收和分发系统
US20180191663A1 (en) * 2017-01-02 2018-07-05 International Business Machines Corporation Cluster assisted MQTT client coverage for fat-pipe cloud applications
CN106953901A (zh) * 2017-03-10 2017-07-14 重庆邮电大学 一种提高消息传递性能的集群通信系统及其方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111930402A (zh) * 2020-08-27 2020-11-13 中山市天启智能科技有限公司 集群服务器的固件升级方法和集群服务器
CN111930402B (zh) * 2020-08-27 2024-05-07 中山市天启智能科技有限公司 集群服务器的固件升级方法和集群服务器
CN113179324A (zh) * 2021-04-29 2021-07-27 中国人民银行数字货币研究所 一种区块链节点及其执行的业务处理方法
CN113179324B (zh) * 2021-04-29 2024-03-26 中国人民银行数字货币研究所 一种区块链节点及其执行的业务处理方法

Also Published As

Publication number Publication date
CN111258840B (zh) 2023-10-10

Similar Documents

Publication Publication Date Title
JP6325001B2 (ja) 階層データ構造のノードにおいて再帰的イベントリスナを用いる方法およびシステム
US9489443B1 (en) Scheduling of splits and moves of database partitions
CN111143382B (zh) 数据处理方法、系统和计算机可读存储介质
Fehling et al. A collection of patterns for cloud types, cloud service models, and cloud-based application architectures
US9922091B2 (en) Intermediate window results in a streaming environment
US20130007091A1 (en) Methods and apparatuses for storing shared data files in distributed file systems
US20140222856A1 (en) System and methods to configure a query language using an operator dictionary
WO2020215752A1 (zh) 图计算方法及装置
CN104754008A (zh) 网络存储节点、网络存储系统以及用于网络存储节点的装置和方法
CN111258840B (zh) 一种集群节点管理方法、装置及集群
CN104753706A (zh) 一种分布式集群配置管理方法及装置
CN111418187A (zh) 云网络中的可伸缩统计和分析机制
US10580090B2 (en) Batch-computed activity stream updates
US10853370B2 (en) Devices and/or methods to provide a query response based on ephemeral data
CN115987751B (zh) 云网络架构和用于维护具有依赖关系的实体对象的方法
EP4024761A1 (en) Communication method and apparatus for multiple management domains
US20210397599A1 (en) Techniques for generating a consistent view of an eventually consistent database
US11789973B2 (en) Software-defined database replication links
US10666557B2 (en) Method to manage data flow for edge-core distributed analytics systems
Nooraei Abadeh et al. DiffPageRank: an efficient differential PageRank approach in MapReduce
Henning Prototype of a scalable monitoring infrastructure for Industrial DevOps
US9547711B1 (en) Shard data based on associated social relationship
CN114666348B (zh) 一种基于python语言快速构建分布式系统的方法
US20240104069A1 (en) Systems and methods of managing state machine systems with compacting distributed log storage
JP5580754B2 (ja) 排他制御装置および排他制御方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant