CN114880276A - 分布式集群管理方法、装置、存储介质及电子设备 - Google Patents

分布式集群管理方法、装置、存储介质及电子设备 Download PDF

Info

Publication number
CN114880276A
CN114880276A CN202210325426.9A CN202210325426A CN114880276A CN 114880276 A CN114880276 A CN 114880276A CN 202210325426 A CN202210325426 A CN 202210325426A CN 114880276 A CN114880276 A CN 114880276A
Authority
CN
China
Prior art keywords
node
dependent file
file
management
distributed cluster
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210325426.9A
Other languages
English (en)
Inventor
刘司寰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jingdong Technology Information Technology Co Ltd
Original Assignee
Jingdong Technology Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jingdong Technology Information Technology Co Ltd filed Critical Jingdong Technology Information Technology Co Ltd
Priority to CN202210325426.9A priority Critical patent/CN114880276A/zh
Publication of CN114880276A publication Critical patent/CN114880276A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/11File system administration, e.g. details of archiving or snapshots
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/13File access structures, e.g. distributed indices
    • G06F16/134Distributed indices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/14Details of searching files based on file metadata
    • G06F16/148File search processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/182Distributed file systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Library & Information Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开涉及计算机技术领域,具体涉及分布式集群管理方法、分布式集群管理装置、存储介质及电子设备。该分布式集群管理方法包括在监测到集群启动时,集群中的工作节点执行代理进程,以向管理节点发送依赖文件查询请求,所述依赖文件查询请求用于向所述管理节点请求查询所述工作节点的依赖文件;接收所述管理节点返回的依赖文件,以基于所述依赖文件执行业务进程。本公开提供的分布式集群管理方法能够避免分布式集群中节点依赖变化时镜像频繁修改以及维护困难等问题。

Description

分布式集群管理方法、装置、存储介质及电子设备
技术领域
本公开涉及计算机技术领域,具体涉及一种分布式集群管理方法、分布式集群管理装置、存储介质及电子设备。
背景技术
集群(Cluster)是一组相互独立的、通过高速网络互联的计算机,它们构成了一个组,并以单一系统的模式加以管理,集群环境中多个业务单元之间存在资源依赖。
现有技术中,需要为每个类型的节点构建镜像,并将相应依赖放入镜像内某个目录下,并指定好启动命令。由于不同类型的节点所依赖的信息都有所差别,任何的代码、配置文件或脚本的修改都意味着新版本镜像需要构建,这样就需要构建并维护数量庞大的镜像,并频繁进行节点镜像升级。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开的目的在于提供一种分布式集群管理方法、分布式集群管理装置、存储介质及电子设备,旨在解决分布式集群中节点依赖变化时镜像频繁修改以及维护困难的问题。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
根据本公开实施例的一方面,提供了一种分布式集群管理方法,应用于工作节点,包括:在监测到集群启动时,集群中的工作节点执行代理进程,以向管理节点发送依赖文件查询请求,所述依赖文件查询请求用于向所述管理节点请求查询所述工作节点的依赖文件;接收所述管理节点返回的依赖文件,以基于所述依赖文件执行业务进程。
根据本公开的一些实施例,基于前述方案,在接收所述管理节点返回的依赖文件之后,所述方法还包括:对所述依赖文件进行完整性检查。
根据本公开的一些实施例,基于前述方案,所述方法还包括:响应于接收到业务重启指令,所述代理进程重启所述业务进程。
根据本公开的一些实施例,基于前述方案,所述方法还包括:响应于接收到依赖变更指令,所述代理进程变更所述工作节点的所述依赖文件。
根据本公开实施例的第二方面,提供了一种分布式集群管理方法,应用于管理节点,包括:接收集群中的工作节点发送的依赖文件查询请求;查询所述工作节点的依赖文件,并将所述依赖文件返回至所述工作节点,以使所述工作节点基于所述依赖文件执行业务进程。
根据本公开的一些实施例,基于前述方案,所述查询所述工作节点的依赖文件,包括:从共享数据库中查询得到所述工作节点的节点信息;基于所述节点信息从对象数据库中下载所述工作节点的依赖文件;其中,所述依赖文件包括运行环境、可执行文件、配置文件以及启动脚本中的一种或多种。
根据本公开的一些实施例,基于前述方案,在查询所述工作节点的依赖文件之后,所述方法还包括:对所述依赖文件进行压缩整合。
根据本公开实施例的第三方面,提供了一种分布式集群管理装置,包括:请求模块,用于在监测到集群启动时,集群中的工作节点执行代理进程,以向管理节点发送依赖文件查询请求,所述依赖文件查询请求用于向所述管理节点请求查询所述工作节点的依赖文件;执行模块,用于接收所述管理节点返回的依赖文件,以基于所述依赖文件执行业务进程。
根据本公开实施例的第四方面,提供了一种分布式集群管理装置,接收模块,用于接收集群中的工作节点发送的依赖文件查询请求;查询模块,用于查询所述工作节点的依赖文件,并将所述依赖文件返回至所述工作节点,以使所述工作节点基于所述依赖文件执行业务进程。
根据本公开实施例的第五方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如上述实施例中的分布式集群管理方法。
根据本公开实施例的第六方面,提供了一种电子设备,其特征在于,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上述实施例中的分布式集群管理方法。
本公开示例性实施例可以具有以下部分或全部有益效果:
在本公开的一些实施例所提供的技术方案中,为多角色分布式集群中引入管理节点,并为每个工作节点部署可与管理节点通信的代理进程,使得在集群启动时,工作节点能够通过执行代理进程来向管理节点发送依赖文件查询请求,由管理节点查询依赖文件后再回传给该工作节点。本公开提供了一种新的分布式集群管理方法,一方面将版本控制的粒度细化到文件,而不是镜像,使得依赖的存放脱离镜像;另一方面在集群启动时才去动态获取,避免了需要将所有的依赖提前写在镜像内;再一方面,工作节点本身不需要依赖的镜像,只包含代理进程的基础镜像,简化了镜像内容,综上,这种分布式集群管理方法能够多方面对维度地减少集群分布式集群中节点依赖变化时镜像的频繁更迭,进而提高集群的管理效率,降低维护成本。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1示意性示出现有技术中一种分布式集群管理方法;
图2示意性示出本公开示例性实施例中一种分布式集群管理方法的流程示意图;
图3示意性示出本公开示例性实施例中一种分布式集群管理系统的结构示意图;
图4示意性示出本公开示例性实施例中一种分布式集群管理方法的流程图;
图5示意性示出本公开示例性实施例中一种分布式集群管理的数据交互图;
图6示意性示出本公开示例性实施例中一种分布式集群管理装置装置的组成示意图;
图7示意性示出本公开示例性实施例中一种分布式集群管理装置装置的组成示意图;
图8示意性示出本公开示例性实施例中一种计算机可读存储介质的示意图;
图9示意性示出本公开示例性实施例中一种电子设备的计算机系统的结构示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本公开的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本公开的各方面。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
现有技术中,由多个类型的节点组成的分布式集群在启动前,需要为每个类型的节点构建镜像,将相应依赖放入镜像内某个目录下,并指定好启动命令。
图1示意性示出现有技术中一种分布式集群管理方法。参考图1所示,示出了采用正常容器化部署的包含四个节点的分布式集群100,包括A类型的101节点1,和101节点2,B类型的103节点3以及C类型的104节点4,每个节点的节点容器内都包含一个或多个进程负责相关的业务功能,如p1、p2,每个类型节点的所有依赖都打包进各自的镜像内部,在节点启动时执行容器化初始化。
但不同类型的节点所依赖的信息有所差别,而且同一个类型的节点本身就存在很多版本的依赖,任何一点修改都意味着新版本镜像需要构建。所以,上述图1这类依赖管理方式就导致需要构建并维护数量庞大的镜像,并频繁进行节点镜像升级。
针对现有技术的缺点,本公开提供了一种分布式集群管理方法,通过在每个节点上增加代理(agent)进程,并且在集群中增加一个管理节点,进而通过agent主动向管理节点索要相应的依赖,以减少集群分布式集群中节点依赖变化时镜像的频繁更迭。
以下对本公开实施例的技术方案的实现细节进行详细阐述。
图2示意性示出本公开示例性实施例中一种分布式集群管理方法的流程示意图。如图2所示,该分布式集群管理方法包括步骤S201和步骤S202:
步骤S201,在监测到集群启动时,集群中的工作节点执行代理进程,以向管理节点发送依赖文件查询请求,所述依赖文件查询请求用于向所述管理节点请求查询所述工作节点的依赖文件;
步骤S202,接收所述管理节点返回的依赖文件,以基于所述依赖文件执行业务进程。
在本公开的一些实施例所提供的技术方案中,为多角色分布式集群中引入管理节点,并为每个工作节点部署可与管理节点通信的代理进程,使得在集群启动时,工作节点能够通过执行代理进程来向管理节点发送依赖文件查询请求,由管理节点查询依赖文件后再回传给该工作节点。本公开提供了一种新的分布式集群管理方法,一方面将版本控制的粒度细化到文件,而不是镜像,使得依赖的存放脱离镜像;另一方面在集群启动时才去动态获取,避免了需要将所有的依赖提前写在镜像内;再一方面,工作节点本身不需要依赖的镜像,只包含代理进程的基础镜像,简化了镜像内容,综上,这种分布式集群管理方法能够多方面对维度地减少集群分布式集群中节点依赖变化时镜像的频繁更迭,进而提高集群的管理效率,降低维护成本。
下面,将结合附图及实施例对本示例实施方式中的分布式集群管理方法的各个步骤进行更详细的说明。
需要说明的是,本公开提供的分布式集群管理方法在集群首次启动时需要进行初始部署。
图3示意性示出本公开示例性实施例中一种分布式集群管理系统的结构示意图,该系统用于执行本公开提供的分布式集群管理方法。参考图3所示,分布式集群300同样也包括301~304四个工作节点(node);其中,每个工作节点至少都会存在两个进程:业务进程和代理(agent)进程;并且在集群中增加了一个管理节点305(manager),该管理节点305可以与集群外的共享数据库306和对象数据库307进行交互。
集群首次启动时,管理节点使用manger镜像进行部署,其他工作节点统一使用node镜像部署。使用node镜像部署的节点启动后该节点的节点容器内只会有agent进程,而没有预先写好的镜像文件。
图2中所示的步骤S201和步骤S202的执行主体均为集群中的工作节点。
在步骤S201中,在监测到集群启动时,集群中的工作节点执行代理进程,以向管理节点发送依赖文件查询请求,所述依赖文件查询请求用于向所述管理节点请求查询所述工作节点的依赖文件。
具体地,在集群启动时,该集群中工作节点node的agent进程第一时间主动向管理节点manager发送依赖文件查询请求,也就是发起‘/how/to/bootstrap/myself’命令,询问应该如何启动本工作节点的业务进程。
管理节点收到依赖文件查询请求之后,会查询该工作节点对应的依赖文件,然后将依赖文件回传至该工作节点。依赖文件也就是指该工作节点在完成业务功能时所依赖的信息。
在步骤S202中,接收所述管理节点返回的依赖文件,以基于所述依赖文件执行业务进程。
具体地,工作节点node在收到管理节点manager返回的依赖文件,根据依赖文件执行启动脚本,例如bootstrap脚本,初始化业务进程p1或p2乃至更多的进程来完成自己的业务功能。
在本公开的一个实施例中,在接收所述管理节点返回的依赖文件之后,所述方法还包括:对所述依赖文件进行完整性检查。
其中,依赖文件是指该工作节点在完成业务功能时所依赖的信息,通常可以包括运行环境、可执行文件、配置文件以及启动脚本中的一种或多种。
当工作节点node在收到管理节点manager返回的依赖文件之后,可以对依赖文件进行完整性检查,当完整性检查通过时,再根据依赖文件执行启动脚本以完成工作节点的业务进程。
一般情况下,管理节点可以将依赖信息压缩打包后回传,所以工作节点node需要将回传的依赖信息进行解压之后,在进行完整性检查,以获取所需要的的依赖信息。
需要说明的是,agent进程会伴随工作节点的整个生命周期存在,可用于管理业务进程,进而实现其他对依赖文件的管理。
在本公开的一个实施例中,所述方法还包括:响应于接收到业务重启指令,所述代理进程重启所述业务进程。也就是说,可以通过agent进程接受外部命令来控制业务进程的重启。
在本公开的一个实施例中,所述方法还包括:响应于接收到依赖变更指令,所述代理进程变更所述工作节点的所述依赖文件。即可以通过agent进程修改业务进程的依赖文件。
基于上述的方法,这种依赖管理模式将版本控制的粒度细化到文件,而不是镜像;所有的依赖并非在镜像内写死,而是在集群启动时去动态获取;工作节点本身的镜像变成了一个只包含agent的简单基础镜像,避免了镜像版本的频繁更迭;在依赖升级方面,借助agent进程可以对容器内的依赖文件动态修改,重启容器内某一个进程,而不需要为新依赖构建新镜像并重建整个容器。
图4示意性示出本公开示例性实施例中一种分布式集群管理方法的流程图。参考图4所示,该分布式集群管理方法包括步骤S401和步骤S402:
步骤S401,接收集群中的工作节点发送的依赖文件查询请求;
步骤S402,查询所述工作节点的依赖文件,并将所述依赖文件返回至所述工作节点,以使所述工作节点基于所述依赖文件执行业务进程。
图4中所示的步骤S401和步骤S402的执行主体均为集群中的管理节点。
在步骤S401中,接收集群中的工作节点发送的依赖文件查询请求。
具体地,每个工作节点部署了可与管理节点manager通信的agent,并且所有工作节点的依赖管理收口到管理节点。所以管理节点可以接收到集群中的节点发送的依赖文件查询请求,即‘/how/to/bootstrap/myself’命令。
在步骤S402中,查询所述工作节点的依赖文件,并将所述依赖文件返回至所述工作节点,以使所述工作节点基于所述依赖文件执行业务进程。
进一步地,所述查询所述工作节点的依赖文件,包括:从共享数据库中查询得到所述工作节点的节点信息;基于所述节点信息从对象数据库中下载所述工作节点的依赖文件。
首先,管理节点manager在收到依赖文件查询请求后会在共享数据库中查询该工作节点的节点信息。
其中,共享数据库中可以是etcd数据库,etcd比较多的应用场景是用于服务发现,服务发现(Service Discovery)要解决的是分布式系统中最常见的问题之一,即在同一个分布式集群中的进程或服务如何才能找到对方并建立连接。etcd数据库构建了一个高可用的分布式键值(key-value)数据库,etcd内部采用raft协议作为一致性算法,etcd基于Go语言实现。
然后,根据该工作节点的节点信息从对象数据库中下载对应的依赖文件。
其中,对象数据库可以是object storage,也可以称为对象存储服务(ObjectStorage Service,简称OSS)。OSS提供海量、安全、低成本、高可靠的云存储服务,可以在任何应用、任何时间、任何地点存储和访问任意类型的数据。
因此,可以从Object Storage中下载工作节点需要版本的运行环境、可执行文件、配置文件以及启动脚本等信息作为依赖文件。
在本公开的一个实施例中,在查询所述工作节点的依赖文件之后,所述方法还包括:对所述依赖文件进行压缩整合。即将从对象数据库中下载的信息进行整合,压缩打包后回传给工作节点node。
基于上述的方法,上述依赖管理模式通过在多角色分布式集群中引入管理节点(manager),并为每个工作节点部署可与管理节点通信的客户端(agent),将依赖管理收口到管理节点,使得集群中工作节点通过agent向管理节点主动申请所需依赖,管理节点通过客户端提供的信息从第三方存储或者独立服务获取所需依赖并回传给agent节点,将依赖的存放脱离镜像和集群,进一步避免镜像的频繁修改。
图5示意性示出本公开示例性实施例中一种分布式集群管理的数据交互图,如图5所示,该分布式集群管理方法包括以下步骤:
步骤S501,工作节点node利用agent调用/how/to/bootstrap/myself接口,生成依赖文件查询请求。并将依赖文件查询请求发送至管理节点manager;
步骤S502,管理节点manager向etcd数据库发送节点信息查询请求;
步骤S503,etcd数据库响应于节点信息查询请求,查询该node节点对应的节点信息;
步骤S504,etcd数据库将节点信息返回至管理节点manager;
步骤S505,管理节点manager向object storage发送依赖文件查询请求;
步骤S506,object storage响应于依赖文件查询请求,确定该node节点对应的依赖文件;
步骤S507,管理节点manager从object storage中下载依赖文件,
步骤S508,管理节点manager准备依赖文件,并将其进行tar压缩打包;
步骤S509,管理节点manager将打包好的依赖文件回传至发送请求的node节点;
步骤S510,node节点接收依赖文件进行解压,并进行完整性检查可用性;
步骤S511,node节点调用bootstap脚本,启动相关进程。
图6示意性示出本公开示例性实施例中一种分布式集群管理装置的组成示意图,如图6所示,该分布式集群管理装置600可以包括请求模块601以及执行模块602。其中:
请求模块601,用于在监测到集群启动时,集群中的工作节点执行代理进程,以向管理节点发送依赖文件查询请求,所述依赖文件查询请求用于向所述管理节点请求查询所述工作节点的依赖文件;
执行模块602,用于接收所述管理节点返回的依赖文件,以基于所述依赖文件执行业务进程。
根据本公开的示例性实施例,该分布式集群管理装置600还可以包括检查模块,用于在接收所述管理节点返回的依赖文件之后,对所述依赖文件进行完整性检查。
根据本公开的示例性实施例,该分布式集群管理装置600还可以包括重启模块,用于响应于接收到业务重启指令,所述代理进程重启所述业务进程。
根据本公开的示例性实施例,该分布式集群管理装置600还可以包括变更模块,用于响应于接收到依赖变更指令,所述代理进程变更所述工作节点的所述依赖文件。
上述的分布式集群管理装置600中各模块的具体细节已经在对应的分布式集群管理方法中进行了详细的描述,因此此处不再赘述。
图7示意性示出本公开示例性实施例中一种分布式集群管理装置的组成示意图,如图7所示,该分布式集群管理装置700可以包括接收模块701以及查询模块702。其中:
接收模块701,用于接收集群中的工作节点发送的依赖文件查询请求;
查询模块702,用于查询所述工作节点的依赖文件,并将所述依赖文件返回至所述工作节点,以使所述工作节点基于所述依赖文件执行业务进程。
根据本公开的示例性实施例,该查询模块702用于从共享数据库中查询得到所述工作节点的节点信息;基于所述节点信息从对象数据库中下载所述工作节点的依赖文件;其中,所述依赖文件包括运行环境、可执行文件、配置文件以及启动脚本中的一种或多种。
根据本公开的示例性实施例,该分布式集群管理装置700还可以包括压缩模块,用于在查询所述工作节点的依赖文件之后,对所述依赖文件进行压缩整合。
上述的分布式集群管理装置700中各模块的具体细节已经在对应的分布式集群管理方法中进行了详细的描述,因此此处不再赘述。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
在本公开的示例性实施例中,还提供了一种能够实现上述方法的存储介质。图8示意性示出本公开示例性实施例中一种计算机可读存储介质的示意图,如图8所示,描述了根据本公开的实施方式的用于实现上述方法的程序产品800,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如手机上运行。然而,本公开的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
在本公开的示例性实施例中,还提供了一种能够实现上述方法的电子设备。图9示意性示出本公开示例性实施例中一种电子设备的计算机系统的结构示意图。
需要说明的是,图9示出的电子设备的计算机系统900仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图9所示,计算机系统900包括中央处理单元(Central Processing Unit,CPU)901,其可以根据存储在只读存储器(Read-Only Memory,ROM)902中的程序或者从存储部分908加载到随机访问存储器(Random Access Memory,RAM)903中的程序而执行各种适当的动作和处理。在RAM 903中,还存储有系统操作所需的各种程序和数据。CPU 901、ROM 902以及RAM 903通过总线904彼此相连。输入/输出(Input/Output,I/O)接口905也连接至总线904。
以下部件连接至I/O接口905:包括键盘、鼠标等的输入部分906;包括诸如阴极射线管(Cathode Ray Tube,CRT)、液晶显示器(Liquid Crystal Display,LCD)等以及扬声器等的输出部分907;包括硬盘等的存储部分908;以及包括诸如LAN(Local Area Network,局域网)卡、调制解调器等的网络接口卡的通信部分909。通信部分909经由诸如因特网的网络执行通信处理。驱动器910也根据需要连接至I/O接口905。可拆卸介质911,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器910上,以便于从其上读出的计算机程序根据需要被安装入存储部分908。
特别地,根据本公开的实施例,下文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分909从网络上被下载和安装,和/或从可拆卸介质911被安装。在该计算机程序被中央处理单元(CPU)901执行时,执行本公开的系统中限定的各种功能。
需要说明的是,本公开实施例所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、闪存、光纤、便携式紧凑磁盘只读存储器(Compact Disc Read-Only Memory,CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
作为另一方面,本公开还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该电子设备执行时,使得该电子设备实现上述实施例中所述的方法。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、触控终端、或者网络设备等)执行根据本公开实施方式的方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (11)

1.一种分布式集群管理方法,其特征在于,应用于工作节点,所述方法包括:
在监测到集群启动时,集群中的工作节点执行代理进程,以向管理节点发送依赖文件查询请求,所述依赖文件查询请求用于向所述管理节点请求查询所述工作节点的依赖文件;
接收所述管理节点返回的依赖文件,以基于所述依赖文件执行业务进程。
2.根据权利要求1所述的分布式集群管理方法,其特征在于,在接收所述管理节点返回的依赖文件之后,所述方法还包括:
对所述依赖文件进行完整性检查。
3.根据权利要求1所述的分布式集群管理方法,其特征在于,所述方法还包括:
响应于接收到业务重启指令,所述代理进程重启所述业务进程。
4.根据权利要求1所述的分布式集群管理方法,其特征在于,所述方法还包括:
响应于接收到依赖变更指令,所述代理进程变更所述工作节点的所述依赖文件。
5.一种分布式集群管理方法,其特征在于,应用于管理节点,所述方法包括:
接收集群中的工作节点发送的依赖文件查询请求;
查询所述工作节点的依赖文件,并将所述依赖文件返回至所述工作节点,以使所述工作节点基于所述依赖文件执行业务进程。
6.根据权利要求5所述的分布式集群管理方法,其特征在于,所述查询所述工作节点的依赖文件,包括:
从共享数据库中查询得到所述工作节点的节点信息;
基于所述节点信息从对象数据库中下载所述工作节点的依赖文件;其中,所述依赖文件包括运行环境、可执行文件、配置文件以及启动脚本中的一种或多种。
7.根据权利要求5所述的分布式集群管理方法,其特征在于,在查询所述工作节点的依赖文件之后,所述方法还包括:
对所述依赖文件进行压缩整合。
8.一种分布式集群管理装置,其特征在于,应用于工作节点,包括:
请求模块,用于在监测到集群启动时,集群中的工作节点执行代理进程,以向管理节点发送依赖文件查询请求,所述依赖文件查询请求用于向所述管理节点请求查询所述工作节点的依赖文件;
执行模块,用于接收所述管理节点返回的依赖文件,以基于所述依赖文件执行业务进程。
9.一种分布式集群管理装置,其特征在于,应用于管理节点,包括:
接收模块,用于接收集群中的工作节点发送的依赖文件查询请求;
查询模块,用于查询所述工作节点的依赖文件,并将所述依赖文件返回至所述工作节点,以使所述工作节点基于所述依赖文件执行业务进程。
10.一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如权利要求1至7任一项所述的分布式集群管理方法。
11.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1至7任一项所述的分布式集群管理方法。
CN202210325426.9A 2022-03-29 2022-03-29 分布式集群管理方法、装置、存储介质及电子设备 Pending CN114880276A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210325426.9A CN114880276A (zh) 2022-03-29 2022-03-29 分布式集群管理方法、装置、存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210325426.9A CN114880276A (zh) 2022-03-29 2022-03-29 分布式集群管理方法、装置、存储介质及电子设备

Publications (1)

Publication Number Publication Date
CN114880276A true CN114880276A (zh) 2022-08-09

Family

ID=82668897

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210325426.9A Pending CN114880276A (zh) 2022-03-29 2022-03-29 分布式集群管理方法、装置、存储介质及电子设备

Country Status (1)

Country Link
CN (1) CN114880276A (zh)

Similar Documents

Publication Publication Date Title
US11106455B2 (en) Integration of containers with external elements
US11829742B2 (en) Container-based server environments
CN112104723B (zh) 一种多集群的数据处理系统及方法
CN110196731B (zh) 一种运维系统、方法及存储介质
CN109117252B (zh) 基于容器的任务处理的方法、系统及容器集群管理系统
CN112130871B (zh) 远程部署中间件的方法、装置、计算机设备及存储介质
US11106641B2 (en) Supporting graph database backed object unmarshalling
CN112882738A (zh) 一种微服务架构下的配置信息更新方法、装置及电子设备
CN110659104B (zh) 一种业务监控方法及相关设备
CN109408256B (zh) 应用调用方法和装置
CN113419818B (zh) 基础组件部署方法、装置、服务器及存储介质
CN112698930B (zh) 一种获取服务器标识的方法、装置、设备及介质
CN113094395A (zh) 数据查询方法、计算机设备和存储介质
US10073689B2 (en) Managing application lifecycles within a federation of distributed software applications
CN115729590A (zh) 服务部署方法、装置、设备和计算机可读存储介质
US20200272453A1 (en) Real-Time Version Controller
CN114880276A (zh) 分布式集群管理方法、装置、存储介质及电子设备
US11163622B1 (en) Web application implementing a shared set of identifiers for handling links to web application plugins
CN114610446A (zh) 一种自动注入探针的方法、装置及系统
CN114579167A (zh) 一种下载应用升级文件的方法、装置及存储介质
JP2021184235A5 (zh)
US11630705B1 (en) Dynamic generation of cloud platform application programming interface calls
CN117519911B (zh) 自动注入系统、方法、设备、集群以及介质
CN115604345B (zh) 应用程序的开发方法及计算机可读存储介质
US11487606B2 (en) Automated alert augmentation for deployments of software-defined storage

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination