CN114237875A - 一种集群管理方法、装置、设备及计算机存储介质 - Google Patents

一种集群管理方法、装置、设备及计算机存储介质 Download PDF

Info

Publication number
CN114237875A
CN114237875A CN202111446256.1A CN202111446256A CN114237875A CN 114237875 A CN114237875 A CN 114237875A CN 202111446256 A CN202111446256 A CN 202111446256A CN 114237875 A CN114237875 A CN 114237875A
Authority
CN
China
Prior art keywords
application
cluster
slave node
state
expected state
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111446256.1A
Other languages
English (en)
Inventor
龚炜林
陈剑华
雷灿添
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sangfor Technologies Co Ltd
Original Assignee
Sangfor Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sangfor Technologies Co Ltd filed Critical Sangfor Technologies Co Ltd
Priority to CN202111446256.1A priority Critical patent/CN114237875A/zh
Publication of CN114237875A publication Critical patent/CN114237875A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5011Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resources being hardware resources other than CPUs, Servers and Terminals
    • G06F9/5016Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resources being hardware resources other than CPUs, Servers and Terminals the resource being the memory
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • G06F15/161Computing infrastructure, e.g. computer clusters, blade chassis or hardware partitioning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • G06F9/5072Grid computing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Mathematical Physics (AREA)
  • Stored Programmes (AREA)

Abstract

本申请实施例公开了一种集群管理方法、装置、设备及计算机存储介质,应用于所述集群中的主节点,其中,所述方法包括:接收应用启动请求,所述应用启动请求中至少包括应用标识和与所述应用标识对应的应用的预期状态;响应于所述应用启动请求,在所述集群中确定出能够启动所述应用的目标从节点;将所述应用标识和所述预期状态发送给所述目标从节点,以使得所述目标从节点调整所述应用的启动状态,直至达到所述预期状态;接收所述目标从节点上报的所述应用的当前状态。

Description

一种集群管理方法、装置、设备及计算机存储介质
技术领域
本申请实施例涉及互联网技术领域,涉及但不限于一种集群管理方法、装置、设备及计算机存储介质。
背景技术
目前,集群管理技术中通常是基于主节点集中管理所有从节点,管理内容包括策略配置、协调调用从节点完成任务等。这样,由于主节点需要协调每一从节点完成任务,集群管理对主节点的性能要求高,主节点出现故障的情况下集群风险大、可靠性低。
发明内容
有鉴于此,本申请实施例提供一种集群管理方法、装置、设备及计算机存储介质。
本申请实施例的技术方案是这样实现的:
第一方面,本申请实施例提供一种集群管理方法,应用于所述集群中的主节点,所述方法包括:接收应用启动请求,所述应用启动请求中至少包括应用标识和与所述应用标识对应的应用的预期状态;响应于所述应用启动请求,在所述集群中确定出能够启动所述应用的目标从节点;将所述应用标识和所述预期状态发送给所述目标从节点,以使得所述目标从节点调整所述应用的启动状态,直至达到所述预期状态;接收所述目标从节点上报的所述应用的当前状态。
第二方面,本申请实施例提供一种集群管理方法,应用于所述集群中的目标从节点,所述方法包括:在所述集群中的主节点响应应用启动请求之后,获取所述主节点发送的应用的应用标识和与所述应用标识对应的应用的预期状态;启动与所述应用标识对应的应用;基于所述预期状态调整所述应用的启动状态,直至达到所述预期状态;向所述主节点上报所述应用的当前状态。
第三方面,本申请实施例提供一种集群管理装置,应用于所述集群中的主节点,所述装置包括:第一接收模块,用于接收应用启动请求,所述应用启动请求中至少包括应用标识和与所述应用标识对应的应用的预期状态;第一确定模块,用于响应于所述应用启动请求,在所述集群中确定出能够启动所述应用的目标从节点;第一发送模块,用于将所述应用标识和所述预期状态发送给所述目标从节点,以使得所述目标从节点调整所述应用的启动状态,直至达到所述预期状态;第二接收模块,用于接收所述目标从节点上报的所述应用的当前状态。
第四方面,本申请实施例提供一种集群管理装置,应用于所述集群中的目标从节点,所述装置包括:第二获取模块,用于在所述集群中的主节点响应应用启动请求之后,获取所述主节点发送的应用的应用标识和与所述应用标识对应的应用的预期状态;启动模块,用于启动与所述应用标识对应的应用;调整模块,用于基于所述预期状态调整所述应用的启动状态,直至达到所述预期状态;上报模块,用于向所述主节点上报所述应用的当前状态。
第五方面,本申请实施例提供一种电子设备,包括存储器和处理器,所述存储器存储有可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述方法。
第六方面,本申请实施例提供一种计算机存储介质,存储有可执行指令,用于引起处理器执行时,实现上述方法。
本申请实施例中,主节点响应于应用启动请求,确定出能够启动应用的目标从节点;并将应用标识和预期状态发送给目标从节点,以使得目标从节点调整应用的启动状态,直至达到预期状态。这样,主节点不需要协调每一从节点完成应用启动,只需要将应用标识和预期状态发送给目标从节点,由目标从节点自主调整应用的启动状态,直至达到预期状态,从而提升了集群的工作效率和可靠性,降低了集群风险。
附图说明
图1A为本申请实施例提供的一种集群的物理拓扑图;
图1B为本申请实施例提供的一种系统架构图;
图1C为本申请实施例提供的一种集群管理方法的流程示意图;
图2为本申请实施例提供的一种集群管理方法的流程示意图;
图3为本申请实施例提供的一种集群管理方法的流程示意图;
图4为本申请实施例提供的一种集群管理方法的流程示意图;
图5A为本申请实施例提供的集群管理装置的组成结构示意图;
图5B为本申请实施例提供的集群管理装置的组成结构示意图;
图6为本申请实施例提供的电子设备的一种硬件实体示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对发明的具体技术方案做进一步详细描述。以下实施例用于说明本申请,但不用来限制本申请的范围。
在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
在以下的描述中,所涉及的术语“第一\第二\第三”仅仅是是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序,以使这里描述的本申请实施例能够以除了在这里图示或描述的以外的顺序实施。
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请。
对本申请实施例进行进一步详细说明之前,对本申请实施例中涉及的名词和术语进行说明,本申请实施例中涉及的名词和术语适用于如下的解释。
(1)集群(cluster):是一组相互独立的、通过高速网络互联的计算设备;
(2)集群事件(Cluster-event):是对集群变更行为的定义,如配置修改、软件故障等;
(3)集群状态(Cluster-state):是指集群的形态,例如,副本数就是集群的形态之一;
(4)用户和实体行为分析技术(user and entity behavior analytics,UEBA):是以用户和实体为对象,结合规则以及机器学习模型,对用户行为进行分析和异常检测,尽可能快速地感知内部用户的可疑非法行为的技术;
(5)身份标识号码(Identity document,ID):也称为序列号或帐号,是某个体系中相对唯一的编码,相当于是一种“身份证”在某一具体的事物中,身份标识号一般是不变的,至于用什么来标识该事物,则由设计者自己制定的规则来确定。
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。
应当理解,此处所描述的一些实施例仅仅用以解释本申请的技术方案,并不用于限定本申请的技术范围。
图1A为本申请实施例提供的一种集群的物理拓扑图,如图1A所示,该集群的物理拓扑10包括主节点11和从节点12,其中,
主节点11,用于获取应用启动请求,并将该应用启动请求发送至目标从节点。
从节点12,用于从主节点11获取应用启动请求,以启动应用并支撑应用的运行,以及,将应用的当前状态上报至主节点11。
图1B为本申请实施例提供的一种系统架构图,如图1B所示,该系统架构包括集群管理13、集群功能14、基础组件15和业务功能16,其中,
在集群管理13中,集群管理的基础功能包括以下至少之一:集群关系建立、基础通信、基础安全控制、策略检查控制等。该集群管理13用于保障上层功能的高可用和高可靠;
集群管理13包括状态统计、集群伸缩、任务管理、离线升级和策略控制,其中,
状态统计,用于统计各组件、各功能状态,以展示给用户;
集群伸缩,用于实现集群主机资源的横向扩展或缩减;
任务管理,用于在集群内执行任务;
离线升级,用于整个集群升级;
策略控制,用于通过定时检测对集群事件和操作做出反应,必要时执行调节功能,以调整集群为健康状态。
集群功能14是集群管理13的附加功能,用于为集群管理的基础功能提供高可用和高可靠支撑;
集群功能14包括授权控制、配置管理、服务路由、状态存储、消息通讯、备份恢复和操作日志,其中,
授权控制,用于实现整个平台的授权机制;
配置管理,用于配置管理整个平台,分为需要同步和不需要同步;
服务路由,用于为组件提供寻址功能;
状态存储,用于为状态统计提供历史记录功能;
消息通讯,用于为所有集群组件之间的交互,提供通信能力。
备份恢复,用于为集群核心配置提供数据;
操作日志,用于记录集群的操作日志。
基础组件15,用于为业务发展,提供后端支撑服务;
基础组件15包括接入层、数据清洗、存储后端和数据计算,其中,
接入层,用于接入数据;
数据清洗,用于对输入的数据,做修改过滤;
存储后端,用于为接入数据、运算数据、业务数据提供存储能力;
数据计算,用于提供数据计算功能。
业务功能16,用于实现实际业务逻辑,其依赖基础组件15完成业务逻辑。
本申请实施例提供的一种集群管理方法,应用于所述集群中的主节点,如图1C所示,该方法包括:
步骤S110、接收应用启动请求,所述应用启动请求中至少包括应用标识和与所述应用标识对应的应用的预期状态;
应用可以是终端(手机、平板电脑、服务器等)上部署的应用软件,对应系统的上层业务功能,是用户可以使用的各种程序设计语言,以及用各种程序设计语言编制的应用程序的集合。应用软件是为满足用户不同领域、不同问题的应用需求而提供的软件,可以拓宽计算机系统的应用领域,放大硬件的功能。举例来说,如图1B所示,应用包括以下至少之一:UEBA、资产管理、联动处置、工单系统、大屏展示、报表、告警、日志搜索、机器学习、关联分析和威胁检测等;
每一应用对应一个应用标识,该应用标识是用于区分其他不同应用的标识,举例来说,可以为应用设置ID。
应用的预期状态包括以下至少之一:正常启动应用、未正常启动应用、应用正常工作、应用未正常工作等。
在实施过程中,集群中的主节点可以接收多个应用启动请求,其中,每一应用启动请求至少包括应用标识和与所述应用的预期状态。
步骤S120、响应于所述应用启动请求,在所述集群中确定出能够启动所述应用的目标从节点;
如图1A所示,目标从节点可以是从集群中的从节点12中确定出的可以响应启动请求的从节点。在实施过程中,主节点11可以基于各从节点12的运行状态和处理应用的情况确定出能够启动应用的目标从节点。
步骤S130、将所述应用标识和所述预期状态发送给所述目标从节点,以使得所述目标从节点调整所述应用的启动状态,直至达到所述预期状态;
在实施过程中,目标从节点接收到主节点对应发布的应用标识和预期状态后,基于预期状态,调整该应用的启动状态,举例来说,主节点发布的预期状态为将应用启动的情况下,从节点通过配置资源等操作启动该应用。
步骤S140、接收所述目标从节点上报的所述应用的当前状态。
在实施过程中,在目标从节点确定该应用的状态达到预期状态的情况下,可以将应用的当前状态上报至主节点;在目标从节点确定该应用的状态未达到预期状态的情况下,也可以将应用的当前状态上报至主节点,以使得主节点及时了解目标从节点启动该应用的情况。
在一些实施例中,主节点可以同时获取多个应用启动请求,在这种情况下多个目标从节点可以同时从主节点获取不同的应用启动请求,各目标从节点并行执行对应的应用启动请求,并上报对应应用的当前状态,以提升集群响应应用启动的效率和处理能力。
本申请实施例中,主节点接收应用启动请求,确定出能够启动应用的目标从节点;将应用标识和预期状态发送给目标从节点,以使得目标从节点调整所述应用的启动状态,直至达到预期状态。这样,主节点不需要协调每一从节点完成应用启动,只需要将应用标识和预期状态发送给目标从节点,由目标从节点自主调整应用的启动状态,直至达到预期状态,提升了集群的工作效率和可靠性,降低了集群风险。
上述步骤S120“响应于所述应用启动请求,在所述集群中确定出能够启动所述应用的目标从节点”可以通过以下步骤实现:
步骤S121、获取所述集群中的每一从节点的运行状态,其中,所述运行状态包括所述从节点的中央处理器利用率和内存占用率;
在一些实施例中,从节点的运行状态为可以表征从节点处理能力的状态特征值,举例来说,从节点的中央处理器利用率是该从节点运行的程序占用的中央处理器资源,可以表征该从节点在某个时间点的运行程序的情况,利用率越高,可以说明该从节点在这个时间上运行了很多程序,反之较少;从节点的内存占用率指的是进程所开销的内存,占内存大的程序不一定会占用很多的中央处理器资源,而占中央处理器大的程序也不一定开销太大的内存。但是某一程序的中央处理器占用率过高会影响其他程序的运行,而某一程序占用内存过大,会影响该从节点的整体性能。
步骤S122、响应于所述应用启动请求,基于所述从节点的中央处理器利用率和内存占用率,在所述集群中确定出能够启动所述应用的目标从节点。
在实施过程中,主节点可以根据集群中各从节点上报的中央处理器利用率和内存占用率,确定出有处理应用启动请求的能力的节点。
本申请实施例中,主节点可以根据集群中各从节点上报的中央处理器利用率和内存占用率,有效确定出有处理应用启动请求的能力的节点。这样,可以实现集群中各从节点的负载均衡。
上述步骤S130“将所述应用标识和所述预期状态发送给所述目标从节点,以使得所述目标从节点调整所述应用的启动状态,直至达到所述预期状态”可以通过以下过程实现:
将所述应用标识和所述预期状态发送给所述目标从节点,以使得所述目标从节点基于所述应用标识和所述预期状态配置所述应用的资源,并基于所述应用的资源启动所述应用,直至所述应用达到所述预期状态。
在实施过程中,在主节点将应用标识和预期状态发送给目标从节点后,目标从节点需要先基于应用标识和预期状态配置用于支持启动该应用的资源,再完成资源配置后再启动应用,并调整应用达到预期状态。
本申请实施例中,目标从节点可以基于应用标识和预期状态配置应用的资源,并基于应用的资源启动应用,这样,可以有效启动应用并调整应用的状态。
在一些实施例中,所述应用的当前状态包括所述应用符合所述预期状态或所述应用不符合所述预期状态;
上述步骤S140“接收所述目标从节点上报的所述应用的当前状态”可以通过以下步骤实现:
步骤141、当所述应用达到所述预期状态时,接收所述目标从节点上报的所述应用符合所述预期状态的上报消息;
步骤142、当所述应用未达到所述预期状态时,接收所述目标从节点上报的所述应用不符合所述预期状态的上报消息。
本申请实施例中,在从节点启动应用达到所述预期状态时,将成功的消息上报至主节点,在从节点启动应用未达到所述预期状态时,将失败的消息上报至主节点。这样,主节点不需要协调各从节点完成应用的启动和状态的调整,只需要获取从节点上报的消息,有效减轻了主节点的协调工作。
本申请实施例提供的一种集群管理方法,应用于所述集群中的主节点,如图2所示,该方法包括:
步骤S210、接收应用启动请求,所述应用启动请求中至少包括应用标识和与所述应用标识对应的应用的预期状态;
步骤S220、响应于所述应用启动请求,在所述集群中确定出能够启动所述应用的目标从节点;
步骤S230、将所述应用标识和所述预期状态发送给所述目标从节点,以使得所述目标从节点调整所述应用的启动状态,直至达到所述预期状态;
步骤S240、接收所述目标从节点上报的所述应用的当前状态;
步骤S250、在接收到所述目标从节点上报的所述应用的当前状态为异常状态的情况下,在所述集群中重新确定出能够启动所述应用的新的目标从节点;
在实施过程中,存在由于各种原因,使得目标从节点无法调整达到预期状态的情况,在主节点接收到目标从节点上报的应用的当前状态为异常状态的情况下,需要在集群中重新确定一个新的目标从节点,以调整应用的启动状态,直至达到所述预期状态。
步骤S260、将所述应用标识和所述预期状态发送给所述新的目标从节点。
本申请实施例中,在目标从节点发生故障,上报的所述应用的当前状态为异常状态的情况下,主节点需要在集群中重新确定出能够启动所述应用的新的目标从节点,以调整应用的启动状态,直至达到所述预期状态。
本申请实施例提供的一种集群管理方法,应用于所述集群中的主节点,如图3所示,该方法包括:
步骤S310、接收应用启动请求,所述应用启动请求中至少包括应用标识和与所述应用标识对应的应用的预期状态;
步骤S320、获取所述集群中的每一从节点的运行状态,其中,所述运行状态包括所述从节点的中央处理器利用率和内存占用率;
步骤S330、响应于所述应用启动请求,基于所述从节点的中央处理器利用率和内存占用率,在所述集群中确定出能够启动所述应用的目标从节点;
步骤S340、将所述应用标识和所述预期状态发送给所述目标从节点,以使得所述目标从节点调整所述应用的启动状态,直至达到所述预期状态;
步骤S350、接收所述目标从节点上报的所述应用的当前状态;
步骤S360、获取所述集群中的每一从节点上报的应用的当前状态;
步骤S370、基于所述集群中的每一从节点的运行状态、和所述每一从节点上报的应用的当前状态,确定所述集群的集群伸缩需求;
步骤S380、基于所述集群伸缩需求,确定扩充所述集群中的从节点的数量或者缩减所述集群中的从节点的数量。
本申请实施例中,主节点首先获取所述集群中的每一从节点上报的应用的当前状态;然后基于所述集群中的每一从节点的运行状态、和所述每一从节点上报的应用的当前状态,确定所述集群的集群伸缩需求;最后基于所述集群伸缩需求,确定扩充所述集群中的从节点的数量或者缩减所述集群中的从节点的数量。这样,主节点可以根据集群中从节点的运行状态和上报的应用的当前状态对集群进行有效的扩充或缩减,以有效支撑上层应用的运行且,及时扩充可以有效避免集群内从节点压力过大的问题,及时缩减可以在保障集群正常工作的情况下,有效节省集群内的运算资源。
本申请实施例提供的一种集群管理方法,应用于所述集群中的目标从节点,如图4所示,该方法包括:
步骤S410、在所述集群中的主节点响应应用启动请求之后,获取所述主节点发送的应用的应用标识和与所述应用标识对应的应用的预期状态;
步骤S420、启动与所述应用标识对应的应用;
步骤S430、基于所述预期状态调整所述应用的启动状态,直至达到所述预期状态;
步骤S440、向所述主节点上报所述应用的当前状态。
本申请实施例中,目标从节点首先获取主节点发送的应用的应用标识和与应用标识对应的应用的预期状态;然后启动与所述应用标识对应的应用;基于所述预期状态调整所述应用的启动状态,直至达到所述预期状态;最后向所述主节点上报所述应用的当前状态。这样,主节点不需要协调每一从节点完成应用启动,只需要将应用标识和预期状态发送给目标从节点,以使得所述目标从节点调整所述应用的启动状态,直至达到所述预期状态,提升了集群的工作效率和可靠性,降低了集群风险。
上述步骤S420“启动与所述应用标识对应的应用”可以通过以下步骤实现:
步骤421、基于所述应用标识和所述预期状态配置所述应用的资源;
步骤422、基于所述应用的资源启动所述应用。
本申请实施例中,目标从节点可以基于应用标识和预期状态配置应用的资源,并基于应用的资源启动应用,这样,可以有效启动应用并调整应用的状态。
基于前述的实施例,本申请实施例提供两种集群管理装置,应用于所述集群中的主节点或从节点,该装置包括所包括的各模块,各模块包括各子模块,可以通过电子设备中的处理器来实现;当然也可通过具体的逻辑电路实现;在实施的过程中,处理器可以为中央处理器(CPU)、微处理器(MPU)、数字信号处理器(DSP)或现场可编程门阵列(FPGA)等。
图5A为本申请实施例提供的一种集群管理装置的组成结构示意图,应用于所述集群中的主节点,如图5A所示,所述装置500包括:
第一接收模块501,用于接收应用启动请求,所述应用启动请求中至少包括应用标识和与所述应用标识对应的应用的预期状态;
第一确定模块502,用于响应于所述应用启动请求,在所述集群中确定出能够启动所述应用的目标从节点;
第一发送模块503,用于将所述应用标识和所述预期状态发送给所述目标从节点,以使得所述目标从节点调整所述应用的启动状态,直至达到所述预期状态;
第二接收模块504,用于接收所述目标从节点上报的所述应用的当前状态。
在一些实施例中,所述第一确定模块502包括获取子模块和确定子模块,其中,所述获取子模块,用于获取所述集群中的每一从节点的运行状态,其中,所述运行状态包括所述从节点的中央处理器利用率和内存占用率;所述确定子模块,用于响应于所述应用启动请求,基于所述从节点的中央处理器利用率和内存占用率,在所述集群中确定出能够启动所述应用的目标从节点。
在一些实施例中,所述第一发送模块503还用于,将所述应用标识和所述预期状态发送给所述目标从节点,以使得所述目标从节点基于所述应用标识和所述预期状态配置所述应用的资源,并基于所述应用的资源启动所述应用,直至所述应用达到所述预期状态。
在一些实施例中,所述应用的当前状态包括所述应用符合所述预期状态或所述应用不符合所述预期状态;所述第二接收模块504包括第一接收子模块和第二接收子模块,其中,所述第一接收子模块,用于当所述应用达到所述预期状态时,接收所述目标从节点上报的所述应用符合所述预期状态的上报消息;所述第二接收子模块,用于当所述应用未达到所述预期状态时,接收所述目标从节点上报的所述应用不符合所述预期状态的上报消息。
在一些实施例中,所述装置还包括第二确定模块和第二发送模块,其中,所述第二确定模块,用于在接收到所述目标从节点上报的所述应用的当前状态为异常状态的情况下,在所述集群中重新确定出能够启动所述应用的新的目标从节点;所述第二发送模块,用于将所述应用标识和所述预期状态发送给所述新的目标从节点。
在一些实施例中,所述装置还包括第一获取模块、第三确定模块和第四确定模块,其中,所述第一获取模块,用于获取所述集群中的每一从节点上报的应用的当前状态;所述第三确定模块,用于基于所述集群中的每一从节点的运行状态、和所述每一从节点上报的应用的当前状态,确定所述集群的集群伸缩需求;所述第四确定模块,用于基于所述集群伸缩需求,确定扩充所述集群中的从节点的数量或者缩减所述集群中的从节点的数量。
图5B为本申请实施例提供的一种集群管理装置的组成结构示意图,应用于所述集群中的目标从节点,如图5B所示,所述装置510包括:
第二获取模块511,用于在所述集群中的主节点响应应用启动请求之后,获取所述主节点发送的应用的应用标识和与所述应用标识对应的应用的预期状态;
启动模块512,用于启动与所述应用标识对应的应用;
调整模块513,用于基于所述预期状态调整所述应用的启动状态,直至达到所述预期状态;
上报模块514,用于向所述主节点上报所述应用的当前状态。
在一些实施例中,所述启动模块512包括配置子模块和启动子模块,其中,所述配置子模块,用于基于所述应用标识和所述预期状态配置所述应用的资源;所述启动子模块,用于基于所述应用的资源启动所述应用。
以上装置实施例的描述,与上述方法实施例的描述是类似的,具有同方法实施例相似的有益效果。对于本申请装置实施例中未披露的技术细节,请参照本申请方法实施例的描述而理解。
需要说明的是,本申请实施例中,如果以软件功能模块的形式实现上述方法,并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得电子设备(可以是手机、平板电脑、笔记本电脑、台式计算机等)执行本申请各个实施例所述方法的全部或部分。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的介质。这样,本申请实施例不限制于任何特定的硬件和软件结合。
对应地,本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述实施例中提供的集群管理方法中的步骤。
对应地,本申请实施例提供一种电子设备,图6为本申请实施例提供的电子设备的一种硬件实体示意图,如图6所示,该设备600的硬件实体包括:包括存储器601和处理器602,所述存储器601存储有可在处理器602上运行的计算机程序,所述处理器602执行所述程序时实现上述实施例中提供的集群管理方法中的步骤。
存储器601配置为存储由处理器602可执行的指令和应用,还可以缓存待处理器602以及电子设备600中各模块待处理或已经处理的数据(例如,图像数据、音频数据、语音通信数据和视频通信数据),可以通过闪存(FLASH)或随机访问存储器(Random AccessMemory,RAM)实现。
这里需要指出的是:以上存储介质和设备实施例的描述,与上述方法实施例的描述是类似的,具有同方法实施例相似的有益效果。对于本申请存储介质和设备实施例中未披露的技术细节,请参照本申请方法实施例的描述而理解。
应理解,说明书通篇中提到的“一个实施例”或“一实施例”意味着与实施例有关的特定特征、结构或特性包括在本申请的至少一个实施例中。因此,在整个说明书各处出现的“在一个实施例中”或“在一实施例中”未必一定指相同的实施例。此外,这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中。应理解,在本申请的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本申请各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(Read Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的介质。
或者,本申请上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得电子设备(可以是手机、平板电脑、笔记本电脑、台式计算机等)执行本申请各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、磁碟或者光盘等各种可以存储程序代码的介质。
本申请所提供的几个方法实施例中所揭露的方法,在不冲突的情况下可以任意组合,得到新的方法实施例。
本申请所提供的几个产品实施例中所揭露的特征,在不冲突的情况下可以任意组合,得到新的产品实施例。
本申请所提供的几个方法或设备实施例中所揭露的特征,在不冲突的情况下可以任意组合,得到新的方法实施例或设备实施例。
以上所述,仅为本申请的实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。

Claims (12)

1.一种集群管理方法,应用于所述集群中的主节点,其特征在于,所述方法包括:
接收应用启动请求,所述应用启动请求中至少包括应用标识和与所述应用标识对应的应用的预期状态;
响应于所述应用启动请求,在所述集群中确定出能够启动所述应用的目标从节点;
将所述应用标识和所述预期状态发送给所述目标从节点,以使得所述目标从节点调整所述应用的启动状态,直至达到所述预期状态;
接收所述目标从节点上报的所述应用的当前状态。
2.如权利要求1所述的方法,其特征在于,所述响应于所述应用启动请求,在所述集群中确定出能够启动所述应用的目标从节点,包括:
获取所述集群中的每一从节点的运行状态,其中,所述运行状态包括所述从节点的中央处理器利用率和内存占用率;
响应于所述应用启动请求,基于所述从节点的中央处理器利用率和内存占用率,在所述集群中确定出能够启动所述应用的目标从节点。
3.如权利要求1所述的方法,其特征在于,所述将所述应用标识和所述预期状态发送给所述目标从节点,以使得所述目标从节点调整所述应用的启动状态,直至达到所述预期状态,包括:
将所述应用标识和所述预期状态发送给所述目标从节点,以使得所述目标从节点基于所述应用标识和所述预期状态配置所述应用的资源,并基于所述应用的资源启动所述应用,直至所述应用达到所述预期状态。
4.如权利要求1所述的方法,其特征在于,所述应用的当前状态包括所述应用符合所述预期状态或所述应用不符合所述预期状态;
所述接收所述目标从节点上报的所述应用的当前状态,包括:
当所述应用达到所述预期状态时,接收所述目标从节点上报的所述应用符合所述预期状态的上报消息;
当所述应用未达到所述预期状态时,接收所述目标从节点上报的所述应用不符合所述预期状态的上报消息。
5.如权利要求1至4任一项所述的方法,其特征在于,所述方法还包括:
在接收到所述目标从节点上报的所述应用的当前状态为异常状态的情况下,在所述集群中重新确定出能够启动所述应用的新的目标从节点;
将所述应用标识和所述预期状态发送给所述新的目标从节点。
6.如权利要求2至4任一项所述的方法,其特征在于,所述方法还包括:
获取所述集群中的每一从节点上报的应用的当前状态;
基于所述集群中的每一从节点的运行状态、和所述每一从节点上报的应用的当前状态,确定所述集群的集群伸缩需求;
基于所述集群伸缩需求,确定扩充所述集群中的从节点的数量或者缩减所述集群中的从节点的数量。
7.一种集群管理方法,应用于所述集群中的目标从节点,其特征在于,所述方法包括:
在所述集群中的主节点响应应用启动请求之后,获取所述主节点发送的应用的应用标识和与所述应用标识对应的应用的预期状态;
启动与所述应用标识对应的应用;
基于所述预期状态调整所述应用的启动状态,直至达到所述预期状态;
向所述主节点上报所述应用的当前状态。
8.如权利要求7所述的方法,其特征在于,所述启动与所述应用标识对应的应用,包括:
基于所述应用标识和所述预期状态配置所述应用的资源;
基于所述应用的资源启动所述应用。
9.一种集群管理装置,应用于所述集群中的主节点,其特征在于,所述装置包括:
第一接收模块,用于接收应用启动请求,所述应用启动请求中至少包括应用标识和与所述应用标识对应的应用的预期状态;
第一确定模块,用于响应于所述应用启动请求,在所述集群中确定出能够启动所述应用的目标从节点;
第一发送模块,用于将所述应用标识和所述预期状态发送给所述目标从节点,以使得所述目标从节点调整所述应用的启动状态,直至达到所述预期状态;
第二接收模块,用于接收所述目标从节点上报的所述应用的当前状态。
10.一种集群管理装置,应用于所述集群中的目标从节点,其特征在于,所述装置包括:
第二获取模块,用于在所述集群中的主节点响应应用启动请求之后,获取所述主节点发送的应用的应用标识和与所述应用标识对应的应用的预期状态;
启动模块,用于启动与所述应用标识对应的应用;
调整模块,用于基于所述预期状态调整所述应用的启动状态,直至达到所述预期状态;
上报模块,用于向所述主节点上报所述应用的当前状态。
11.一种电子设备,包括存储器和处理器,所述存储器存储有可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至6,或者,权利要求7或8任一项所述方法中的步骤。
12.一种计算机存储介质,其特征在于,存储有可执行指令,用于引起处理器执行时,实现权利要求1至6任一项,或者,权利要求7或8所述的方法中的步骤。
CN202111446256.1A 2021-11-30 2021-11-30 一种集群管理方法、装置、设备及计算机存储介质 Pending CN114237875A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111446256.1A CN114237875A (zh) 2021-11-30 2021-11-30 一种集群管理方法、装置、设备及计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111446256.1A CN114237875A (zh) 2021-11-30 2021-11-30 一种集群管理方法、装置、设备及计算机存储介质

Publications (1)

Publication Number Publication Date
CN114237875A true CN114237875A (zh) 2022-03-25

Family

ID=80752344

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111446256.1A Pending CN114237875A (zh) 2021-11-30 2021-11-30 一种集群管理方法、装置、设备及计算机存储介质

Country Status (1)

Country Link
CN (1) CN114237875A (zh)

Similar Documents

Publication Publication Date Title
CN103460203B (zh) 群集唯一标识符
US9208029B2 (en) Computer system to switch logical group of virtual computers
CN102355369B (zh) 虚拟化集群系统及其处理方法和设备
CN113067850B (zh) 一种多云场景下的集群编排系统
CN110287151B (zh) 分布式存储系统、数据写入方法、装置和存储介质
US20190205145A1 (en) Robot task management method, robot using the same and computer readable storage medium
CN111163173B (zh) 集群配置方法、装置、服务器及可读存储介质
US20210160312A1 (en) Service processing methods and systrems based on a consortium blockchain network
CN104158707A (zh) 一种检测并处理集群脑裂的方法和装置
CN104573497A (zh) 一种启动项的处理方法和装置
US8719622B2 (en) Recording and preventing crash in an appliance
JP2019504415A (ja) データ格納サービス処理方法及び装置
CN113132176B (zh) 一种控制边缘节点的方法、节点及边缘计算系统
CN111541762A (zh) 数据处理的方法、管理服务器、设备及存储介质
CN110737425A (zh) 一种计费平台系统的应用程序的建立方法及装置
CN113342893B (zh) 基于区块链的节点同步方法、装置、存储介质及服务器
CN110738156A (zh) 一种基于消息中间件的人脸识别系统及方法
CN114130035A (zh) 一种用户匹配方法、装置、设备及存储介质
CN113326100A (zh) 一种集群管理方法、装置、设备及计算机存储介质
US20150256383A1 (en) Method for transiting operation mode of routing processor
CN114237875A (zh) 一种集群管理方法、装置、设备及计算机存储介质
CN113704024B (zh) 数据处理方法、装置、相关设备及存储介质
CN114064343B (zh) 一种区块链的异常处置方法及装置
CN115914404A (zh) 集群流量管理方法、装置、计算机设备和存储介质
CN114003384B (zh) 任务管理的方法、装置和设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination