CN109787792B - 一种管理分布式业务集群的系统 - Google Patents

一种管理分布式业务集群的系统 Download PDF

Info

Publication number
CN109787792B
CN109787792B CN201711105884.7A CN201711105884A CN109787792B CN 109787792 B CN109787792 B CN 109787792B CN 201711105884 A CN201711105884 A CN 201711105884A CN 109787792 B CN109787792 B CN 109787792B
Authority
CN
China
Prior art keywords
cluster
node
service
subunit
management
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711105884.7A
Other languages
English (en)
Other versions
CN109787792A (zh
Inventor
夏立
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201711105884.7A priority Critical patent/CN109787792B/zh
Publication of CN109787792A publication Critical patent/CN109787792A/zh
Application granted granted Critical
Publication of CN109787792B publication Critical patent/CN109787792B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Multi Processors (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本申请公开了一种管理分布式业务集群的系统,包括:管理子系统和至少一个与其连接的节点控制子系统;所述管理子系统,用于管理对资源对象进行的操作及管理节点控制子系统的节点控制任务的执行;所述节点控制子系统,用于执行管理子系统下发的节点控制任务。本申请提供的系统能够快速高效地实施对分布式业务集群的各项管理工作。本发明另外提供一种创建分布式业务集群的方法、一种调整分布式业务集群的方法、一种向分布式业务集群提交作业的方法以及一种扩展分布式业务集群业务软件环境的方法。

Description

一种管理分布式业务集群的系统
技术领域
本发明涉及一种管理系统,具体涉及一种管理分布式业务集群的系统。本发明还涉及一种创建分布式业务集群的方法。本申请还涉及一种调整分布式业务集群的方法。本申请还涉及一种向分布式业务集群提交作业的方法。本申请还涉及一种扩展分布式业务集群业务软件环境的方法。
背景技术
对分布式业务集群进行的管理的工作包括建立集群,使用集群实现业务功能,维护集群的软硬件环境和调整集群的软硬件环境等。
其中每一项都包含了更多更细致的工作,例如,建立一个集群需要完成以下工作:
·准备分布式集群需要用到的计算机设备;
·配置每个节点设备的基础环境,例如ssh,java等;
·下载实现业务功能所需的相应的软件包,并安装到集群的每一节点设备上;
·配置软件的参数,设置多个软件之间的配置;
·启动所有软件;
而当完成这个集群的搭建以后,管理人员还会面临管理上的各种问题,例如:
·由于业务功能的不同或改变,需要动态的调整集群规模;
·由于业务的需要,需要快速地在集群节点上安装新的软件或修改配置;
·由于安全原因,需要隔离不同用户之间的资源;
·由于维护的目的,需要快速的感知故障节点并恢复;
·由于业务的需要,需要运行多个不同类型的作业;
·由于维护的目的,需要方便的查看不同类似软件系统的运行状况;
可见分布式集群的管理工作众多而复杂,集群规模越大,复杂度也越高。目前还没有一种通用的能够完成所有管理工作的管理分布式集群的方式,每个集群的每项管理工作都需要管理人员手动操作完成,这导致了管理分布式业务集群的成本高,效率低,速度慢的问题。
发明内容
本发明提供一种管理分布式业务集群的系统,以解决现有管理集群成本高,效率低,速度慢的问题。本发明另外提供一种创建分布式业务集群的方法。本申请还提供一种调整分布式业务集群的方法。本申请还提供一种向分布式业务集群提交作业的方法。本申请还提供一种扩展分布式业务集群业务软件环境的方法。
本发明提供的一种管理分布式业务集群的系统,包括:管理子系统和至少一个与其连接的节点控制子系统;
所述管理子系统,用于管理对资源对象进行的操作及管理节点控制子系统的节点控制任务的执行;
所述节点控制子系统,用于执行管理子系统下发的节点控制任务。
可选的,所述管理子系统还用于通过节点控制子系统管理该节点至子系统所在节点的配置。
可选的,所述节点控制子系统还用于反馈管理子系统下发的节点控制任务的执行结果,收集并反馈节点控制子系统所在节点信息。
可选的,所述管理子系统包括:管理操作单元和至少一个与其相连的集群管控单元;
所述管理操作单元,用于管理对资源对象的执行及结果反馈,管理集群管控单元的集群管控任务的执行,管理集群管控单元和节点;
所述集群管控单元,用于与至少一个节点控制子系统相连接,执行管理操作单元下发的集群管控任务并反馈执行结果,管理节点控制子系统的节点控制任务的执行和收集并反馈节点信息。
可选的,所述管理操作单元包括:主逻辑服务子单元和与其相连接的接口子单元;
所述接口子单元,用于管理对资源对象进行操作的命令或代码的执行并反馈执行结果给相应的命令或代码的发送者,管理主逻辑子单元的指令执行;
所述主逻辑服务子单元,用于与至少一个集群管控单元相链接,管理对资源对象进行的操作,管理对本系统进行的操作,执行接口子单元下发的指令并反馈执行结果,管理集群管控单元的集群管控任务的执行,管理集群管控单元和节点。
可选的,所述接口子单元包括:管理接口子单元和应用程序接口子单元;
所述管理接口子单元,用于与主逻辑服务子单元相连接,管理对资源对象进行操作的命令的执行并反馈执行结果给相应的命令的发送者;管理对本系统进行操作的命令的执行并反馈执行结果给相应命令的发送者;管理相应的主逻辑子单元的指令的执行;
所述应用程序接口子单元,用于与主逻辑服务子单元相连接,管理对资源对象进行操作的代码的执行并反馈执行结果给相应的代码的发送者;管理相应的主逻辑子单元的指令的执行。
可选的,还包括调度单元,所述调度单元与管理操作单元和集群管控单元间相连接;
所述管理操作单元,还能够用于管理调度单元的调度任务的执行并管理调度单元;
所述调度单元,用于执行管理操作单元下发的调度任务并反馈执行结果,管理相应的集群管控单元的集群管控任务;
所述集群管控单元,还能够用于执行调度单元下发的集群管控任务并反馈执行结果。
可选的,所述资源对象包括:作业,执行计划,集群和项目。
可选的,用于创建分布式业务集群;或
用于调整分布式业务集群;或
用于监控分布式业务集群;或
用于提交作业;或,
用于隔离用户可操作资源;或
用于扩展分布式业务集群的软件环境。
此外,本申请还提供一种创建分布式业务集群的方法,其包括:
接收创建分布式业务集群的请求,所述请求包含创建所述业务集群所需的配置信息。
根据所述请求,向相应的集群管控单元发送相应的集群管控任务,所述集群管控任务包含有包含创建所述业务集群所需的集群配置信息;
根据所述集群管控任务,向相应的节点控制单元发送节点控制任务,所节点控制任务包含有包含创建所述业务集群所需的节点配置信息;
执行相应的节点控制任务;
向所述请求的请求者反馈所述创建分布式业务集群的请求的执行结果。
此外,本申请还提供一种调整分布式业务集群的方法,其包括:
接收调整指定的分布式业务集群的请求,所述请求包含有调整所述分布式业务集群所需的调整要求信息及需要调整的集群的配置信息;
根据所述请求向相应的集群管控单元发送相应的集群管控任务,所述集群管控任务包含有调整所述分布式业务集群所需的集群配置信息;
根据所述集群管控任务向相应的节点控制单元发送相应的节点控制任务,所述节点控制任务包含有调整所述分布式业务集群所需的配置信息;
执行所述节点控制任务。
可选的,还包括:
执行所述节点控制任务后向所述请求的请求者反馈所述调整指定的分布式业务集群的请求的执行结果。
此外,本申请还提供一种向分布式业务集群提交作业的方法,其包括:
接收向分布式业务集群的提交作业的请求,所述请求包含有所述作业属性信息;
根据所述请求向相应的调度单元发送相应的调度任务,所述调度任务包含有所述提交所述作业所需的调度角色信息;
根据所述调度任务向相应的集群管控单元发送相应的集群管控任务,所述集群管控任务包含有所示提交所述作业所需的集群配置信息;
根据所述集群管控任务向相应的节点控制单元发送相应的节点控制任务,所述节点控制任务包含有所述提交所述作业所需的节点配置信息;
执行所述节点控制任务。
可选的,还包括:
执行所述节点控制任务后,向所述请求的请求者反馈所述向分布式业务集群提交作业的执行结果。
此外,本申请还提供一种扩展分布式业务集群业务软件环境的方法,包括:
接收扩展指定的分布式业务集群的请求,所述请求包含有所述扩展分布式业务集群业务软件环境所需的配置信息;
根据所述请求向相应的集群管控单元发送相应的集群管控任务,所述集群管控任务包含有所述扩展分布式业务集群业务软件环境所需的集群配置信息;
根据所述集群管控任务向相应的节点控制单元发送相应的节点控制任务,所述节点控制任务包含有所述扩展分布式业务集群业务软件环境所需的节点配置信息;
执行所述节点控制任务。
可选的,还包括:
执行所述节点控制任务后,向所述请求的请求者反馈所述扩展分布式业务集群业务软件环境的请求的执行结果。
与现有技术相比,本申请的其中一个方面具有以下优点:
本申请的系统能够接收命令或代码并将其转化为集群内各个节点相应的节点控制任务在相应的节点上执行,从而能够快速高效地实施对分布式业务集群的各项管理工作,从而达到降低集群管理成本,提高管理效率,加快集群管理的速度的效果。
附图说明
图1是本申请第一实施例一种管理分布式业务集群的系统的结构示意图;
图2是本申请第二实施例一种管理分布式业务集群的系统的结构示意图;
图3是本申请第三实施例一种利用本申请提供的管理分布式业务集群的系统的一种可选方式创建业务集群的方法的示意图;
图4是本申请第四实施例一种利用本申请提供的管理分布式业务集群的系统的一种可选方式调整业务集群的方法的示意图;
图5是本申请第五实施例一种利用本申请提供的管理分布式业务集群的系统的一种可选方式提交作业的方法的示意图;
图6是本申请第六实施例一种利用本申请提供的管理分布式业务集群的系统的一种可选方式进行集群监控的方法的示意图;
图7是本申请第七实施例一种利用本申请提供的管理分布式业务集群的系统的一种可选方式对用户资源进行隔离的方式的管理分布式业务集群的系统的一种可选方式示意图;
图8是本申请第八实施例一种利用本申请提供的管理分布式业务集群的系统的一种可选方式对业务集群的业务软件环境进行扩展的方法的示意图。
具体实施方式
在下面的描述中阐述了很多具体细节以便于充分理解本发明。但是本发明能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施的限制。
本申请第一实施例提供一种管理分布式业务集群的系统,其结构框图如图1所示,包括管理子系统和与其连接的三个节点控制子系统。
其中每个节点控制子系统部署在业务集群内的节点上,通常情况下,业务系统分布于一个或多个节点上,也即分布式业务集群包含一个或更多业务节点。
对于多于一个业务节点的情况,每个业务节点上部署的节点控制子系统都和所述管理子系统相连接。
所述管理子系统与所述节点控制子系统之间的连接,既可以是任何形式的有线连接也可以是任何形式的无线连接,如有线局域网或无线局域网,蓝牙等。通过所述连接,所述管理子系统和所述节点控制子系统之间能够交换数据,所述数据包括可以执行的任务或信息,所述任务包含有可执行指令的集合。
所述管理子系统,用于管理对资源对象进行的操作,管理对本系统进行的操作,管理节点控制子系统的节点控制任务的执行,还可以通过节点控制子系统管理该节点至子系统所在节点的配置。其中,所述资源对象包括:作业,执行计划,业务集群,项目。所述作业包括同一业务集群上的用户业务程序的执行。所述执行计划包括同一或不同业务集群的作业集合。所述业务集群包括实现同一业务功能的分布式业务计算机网络内的软硬件环境。所述项目包括上述作业,执行计划或业务集群的任意组合。
具体而言,所述管理子系统管理对资源对象进行的操作具体是指管理子系统能够将接收到的对资源对象进行操作的命令或代码转换为相应的节点控制任务发送给节点控制子系统。
所述管理子系统管理节点控制子系统的节点控制任务的执行具体是指管理子系统能够将从所述节点控制子系统接收的节点控制任务的执行结果转换为相应的命令或代码的执行结果提供给相应的命令或代码的发送者。
此外所述管理子系统还接收节点控制子系统收集发送来的节点信息并对节点进行管理,如管理节点的参数,节点的状态等。
所述管理子系统还能够对本系统进行管理,如配置参数等操作。
所述管理子系统可以包括管理操作单元和至少一个与其相连的集群管控单元。
所述管理操作单元,用于管理资源对象,管理本系统,管理集群管控单元的集群管控任务的执行,管理集群管控单元和节点。
具体地,所述管理操作单元,将接收到的对资源对象进行操作的命令或代码转换为相应的集群管控任务并发送给所述集群管控单元。
所述管理操作单元,还将从所述集群管控单元接收到的集群管控任务的执行结果转换为相应的命令或代码的执行结果提供给相应的命令或代码的发送者。
此外,所述管理操作单元,还接收集群管控单元发送的节点信息并对节点进行管理。
所述管理操作单元,还能够对本系统进行管理,如配置参数等操作。
所述管理操作单元可以包括主逻辑服务子单元和与其相连接的接口子单元。
所述接口子单元,用于管理对资源对象进行操作的命令或代码的执行并反馈执行结果给相应的命令或代码的发送者,管理主逻辑子单元的指令执行。
所述接口子单元,可以包括管理接口子单元和应用程序接口子单元,所述管理接口子单元和应用程序接口子单元分别与主逻辑单元相连接。
所述管理接口子单元,用于与主逻辑服务子单元相连接,管理对资源对象进行操作的命令的执行并反馈执行结果给相应的命令的发送者;管理对本系统进行操作的命令的执行并反馈执行结果给相应命令的发送者;管理相应的主逻辑子单元的指令的执行。
所述应用程序接口子单元,用于与主逻辑服务子单元相连接,管理对资源对象进行操作的代码的执行并反馈执行结果给相应的代码的发送者;管理相应的主逻辑子单元的指令的执行。
将接口子单元分成管理接口子单元和应用程序接口子单元,有利于隔离用户资源,提高管理系统安全性。
所述主逻辑服务子单元,用于与至少一个集群管控单元相链接,管理对资源对象进行的操作,管理本系统,执行接口子单元下发的指令并反馈执行结果,管理集群管控单元的集群管控任务的执行,管理集群管控单元节点。
所述主逻辑服务子单元,将从接口子单元接收到的对用户可操作对象进行操作的指令转换为相应的集群管控任务并发送给所述集群管控单元,还将从集群管控单元接收到的集群管控任务的执行结果转换为相应的指令的执行结果并发送给所述接口子单元,从所述集群管控单元接收节点信息并对节点进行管理。
所述主逻辑服务子单元,能够对本系统进行管理,如配置参数等操作。
将管理操作单元分成接口子单元和主逻辑子单元便于对资源对象的管理,便于隔离用户资源,提高管理效率。
所述集群管控单元,用于与至少一个节点控制子系统相连接,执行管理操作单元下发的集群管控任务并反馈执行结果,管理节点控制子系统的节点控制任务的执行和收集并反馈节点信息。
具体地,所述集群管控单元,将从所述管理操作单元接收到的集群管控任务转换为相应的节点控制任务并发送给所述节点控制子系统。
所述集群管控单元,还将从所述节点控制子系统接收到的节点控制任务的执行结果转换为相应的集群管控任务的执行结果并发送给所述管理操作单元。
此外,所述集群管控单元,还从与其相连接的节点控制子系统接收节点信息发并发送给所述管理单元。
将管理子系统分为管理操作单元和集群管控单元能够将对不同的业务集群实施的管理分散到不同的集群管控单元完成,分散了管理工作量的同时管理层次更加清晰,在需要管理多个业务集群的场景下,降低了管理的复杂度,提高了管理的效率。
此外,所述管理子系统还可以包括调度单元,所述调度单元分别与管理操作单元和集群管控单元相连接。
所述调度单元,用于执行管理操作单元下发的调度任务并反馈执行结果,管理相应的集群管控单元的集群管控任务。
具体地,所述调度单元从管理操作单元接收调度任务,组织安排将其转换为相应的集群管控任务发送给集群管控单元,并接收集群管控单元反馈的执行结果,将所述结果转换为相应的调度任务的执行结果反馈给管理操作单元。
与之相对应地,所述管理操作单元,还能够用于管理调度单元的调度任务的执行并管理调度单元,即将接收到的对资源对象进行操作的命令或代码转换为相应的调度任务发送给调度单元并接受调度单元发送的执行结果反馈给相应的命令或代码的发送者。所述资源对象的操作具体为作业的提交。
类似地,所述集群管控单元,还能够用于执行调度单元下发的集群管控任务并反馈执行结果。即接收调度单元发送的管控任务,并将其转换为节点控制任务下发给节点控制子系统,接收节点控制子系统发送的任务的执行结果并将其转换为相应的调度任务的执行结果,将所述结果发送给调度单元。
利用调度单元管理作业的提交能够使得管理层次清晰,有利于隔离不同用户可访问的资源。
所述节点控制子系统,用于执行管理子系统下发的节点任务并反馈执行结果,收集并反馈节点信息。
具体地,所述节点控制子系统,用于执行从管理子系统接收到的节点控制任务,并将节点控制任务的执行结果发送给所述管理子系统,收集节点信息,将节点信息发送给所述管理子系统。
本申请第二实施例提供一种管理分布式业务集群的系统的一种可选方式。其结构示意图如图2所示,包括三个节点控制子系统和一个管理子系统。
其中节点控制子系统A,节点控制子系统B和节点控制子系统C分别部署于业务集群内的节点A,节点B和节点C上。所述节点A和节点B属于同一个分布式业务集群A,节点C属于另一分布式业务集群B。
所述管理子系统包括一个管理操作单元,两个集群管控单元和一个调度单元,其中集群管控单元A分别与节点控制子系统A和节点控制子系统B相连接,集群管控单元B与节点控制子系统C相连接。
所述管理操作单元包括主逻辑服务子单元和接口子单元。所述主逻辑接口子单元分别与所述集群管控单元A,集群管控单元B以及调度单元相连接。所述调度单元分别与所述集群管控单元A和集群管控单元B相连接。
所述接口子单元包括管理接口子单元和应用程序接口子单元。
所述管理接口子单元和应用程序接口子单元分别与所述主逻辑服务子单元相连接。
上述各子系统,单元以及子单元的功能可以参考本申请第一实施例中的相关描述,在此不做赘述。
本申请第三实施例提供一种利用本申请提供的管理分布式业务集群的系统的一种可选方式创建业务集群的方法,所述管理分布式业务集群的系统事先部署完成,如图3所示,其中节点控制子系统分别部署在网络中可用于创建所述分布式业务集群的节点上,节点控制器A,节点控制器B和节点控制器C分别部署在节点A,节点B和节点C上,所述方法的流程示意图如图中步骤301至309所示:
步骤301,接口子单元接收创建一个分布式业务集群的请求,所述请求包含有所需节点设备的数量,节点参数,软硬件环境等配置信息。
步骤302,接口子单元根据所述请求发送创建所述分布式业务集群的指令给主逻辑服务子单元。
步骤303,主逻辑服务子单元根据所述指令分配所述分布式业务集群所需的业务节点并完成节点准备工作。所述节点准备工作包括:确定所需节点的参数,所需节点的角色,所需业务节点的基础软件环境和配置等等。
步骤304,主逻辑服务子单元根据所述创建所述分布式业务集群的指令和完成的节点准备工作,向相应的可用于创建所述业务集群的节点下发集群管控任务给集群管控单元,所述集群管控任务包括:
·节点环境初始化,例如java等基础软件和基本的ssh等配置
·节点角色确定并下发,例如Hadoop集群的情况下,哪个节点是master哪些节点是worker,是否有HA等
·节点用户配置初始化,如果用户有自定义的配置,这里会下发下来,替换默认的配置。
·根据角色启动节点基础软件,例如Hadoop集群,那么master节点就会启动resource manager而worker节点会启动node manager
步骤305,集群管控单元接收到所述集群管控任务后,根据不同节点的角色,把不同的节点控制任务分发到不同的节点控制子系统并等待任务的执行结果。
步骤S306,节点控制子系统A,节点控制子系统B和节点控制子系统C分别接收到集群管控单元下发的节点控制任务后分别在各自的节点上执行相应的节点控制任务,执行完成后将执行结果反馈给集群管控单元。若执行失败则将执行失败的信息反馈给所述集群管控单元,如成功则将执行成功的信息反馈给集群管控单元。
步骤307,集群管控单元收集各个节点控制子系统发送的其节点控制任务的执行结果后,根据各个节点控制子系统反馈的节点控制任务的执行结果,生成相应的集群管控任务的执行结果,将所述集群管控任务的执行结果反馈给主逻辑服务子单元。
步骤308,主逻辑服务子单元,根据集群管控单元发送的其集群管控任务的执行结果生成创建所述分布式业务集群的指令的执行结果,将所述执行结果反馈给接口子单元。
步骤309,接口子单元根据主逻辑服务子单元反馈的创建分布式业务集群的指令的执行结果,反馈相应的创建一个分布式业务集群的请求的执行结果给相应的请求者。
至此完成本次创建一个分布式业务集群的工作。
本申请第四实施例提供一种利用本申请提供的管理分布式业务集群的系统的一种可选方式调整业务集群的方法,所述分布式业务集群支持集群动态调整,所述管理分布式业务集群的系统部署完成,如图4所示,其中节点控制子系统分别部署在网络中需要调整的分布式业务集群的节点上,节点控制器A,节点控制器B和节点控制器C分别部署在节点A,节点B和节点C上,所述方法的流程示意图如图中步骤401至408所示:
步骤401,接口子单元接收调整所管理的一个分布式业务集群的请求,所述请求包含有需要调整的集群的配置信息,和需要调整的具体要求。
步骤402,接口子单元根据所述请求向主逻辑服务子单元发送调整所述分布式业务集群的指令。
步骤403,主逻辑服务子单元收到所述指令后,确定需要变更的机器节点(如减少一个节点,使其退出所述分布式业务集群)根据所述业务集群的软件是否能够执行动态变更下发不同的集群管控任务给集群管控单元。
对于支持动态变更的集群软件环境,下发停止节点服务的集群管控任务,对于不支持动态变更的集群软件环境,下发重新启动节点的软件环境的集群管控任务。
步骤404,集群管控单元接收到所述结群管控任务后,向相应的节点控制子系统发送节点控制任务,如向节点控制子系统C发送停止节点C的服务的任务或向所述分布式业务集群中所有节点发送重启节点的软件环境等任务。
步骤405,节点控制子系统执行所接收到的节点控制任务,并在完成以后反馈集群管控单元执行结果。
步骤406,集群管控单元向主逻辑服务子单元发送本次调整分布式业务集群所对应的集群管控任务的执行结果。
步骤407,主逻辑服务子单元向接口子单元反馈本次调整分布式业务集群所对应的指令的执行结果。
步骤408,接口子单元,将本次调整分布式业务集群的执行结果反馈给相应的请求者。
本申请第五实施例提供一种利用本申请提供的管理分布式业务集群的系统的一种可选方式提交作业的方法,所述管理分布式业务集群的系统部署完成,如图5所示,其中节点控制子系统分别部署在分布式业务集群的节点上,节点控制器A,节点控制器B和节点控制器C分别部署在节点A,节点B和节点C上,所述节点A为能够接受作业提交的节点,其角色为master,节点B和节点C的角色均为worker,不能接受作业的提交,需要提交的作业事先存储在相应的业务集群中的可以接受作业提交的节点能够访问到的位置。所述方法的流程示意图如图中步骤501至510所示:
步骤501,接口子单元接收请求者发送的提交作业的请求,所述请求中包含有所述作业存放的位置和访问方式的信息等属性信息。
步骤502,接口子单元根据所述请求发送指令给主逻辑服务子单元。请求执行相应的作业。
步骤503,主逻辑服务子单元接收到所述请求后,将所有作业和其属性信息以及其所对应的业务集群的节点的角色信息(节点A为master,节点B和节点B和节点C为worker)发送给调度单元
步骤504,调度单元保存作业的执行流以及执行状态,并下发集群管控任务给相应的集群管控单元,所述集群管控任务包括所述与所述集群管控单元所管控的集群的作业的执行流和相关信息以及执行节点信息。
步骤505,集群管控单元接收所述集群管控任务后向相应的能够接收作业提交的节点的节点控制子系统发送节点控制任务,所述节点控制任务包含所述业务集群的作业的执行流和其相关的配置信息。
步骤506,节点控制子系统根据所接收到的作业的执行流的相关信息,从相应的存储位置获取相应的作业。执行后将执行结果反馈给集群管单元。
步骤507,集群管控单元反馈调度单元作业的执行情况。
重复步骤507至步骤506,直到所有作业执行结束。
步骤508,调度单元返回主逻辑服务子单元作业执行情况。
步骤509,主逻辑服务子单元向接口子单元发送所述提交作业的请求所对应的指令的执行结果。
步骤510,接口子单元向所述作业提交请求的请求者反馈其所提交的作业的执行结果。
本申请第六实施例提供一种利用本申请提供的管理分布式业务集群的系统的一种可选方式进行集群监控的方法。所述管理分布式业务集群的系统部署完成,如图6所示,其中节点控制子系统分别部署在分布式业务集群的节点上,节点控制器A和节点控制器B分别部署在节点A和节点B上。
所述方法的步骤流程如图中步骤601至步骤604所示。
步骤601,各个节点控制子系统定期在节点上进行节点上指定监控数据的收集。
步骤602,各个节点控制子系统定时将收集到的监控数据发送给集群管控单元。
步骤603,集群管控单元将收集到的各个节点的信息发送给管理操作单元。
步骤604,管理操作单元以不同的业务集群为单位,对不同的集群管控单元发送的不同业务集群的监控数据进行归类处理。保存原始数据,还可以对数据进行一定时间段的均值处理。所述监控数据还可以全部保存到数据库中,以便后续可以对监控数据进行读取和进一步地分析处理。
可见,利用本申请提供的管理分布式业务集群的系统能够方便地收集业务集群的监控数据。
本申请第七实施例提供一种利用本申请提供的管理分布式业务集群的系统的一宗可选方式对用户资源进行隔离的方式。
网络环境中,不同的操作人员需要对不同的资源对象进行操作,对于分布式业务集群相关的操作人员来说,通常需要对下述资源进行操作:作业,执行计划,业务集群,项目等。
本实施例提供的管理分布式业务集群的系统如图7所示,其中节点控制子系统部署在相应业务集群的节点上,其中节点控制子系统A和节点控制子系统B分别部署于业务集群A的业务节点上,与集群管控单元A相连接,节点控制子系统不属于业务集群B的业务节点上,与集群管控单元B相连接。
除了系统账号系统提供的安全控制外,本实施例部署的管理分布式业务集群系统的管理操作单元,集群管控单元和节点控制单元的分层管理提供了更进一步的安全保障。
例如,对于需要执行项目A和执行计划B的用户,尽管其具有对业务集群A和业务集群B的所有资源对象的操作权限,但在本实施例提供的管理分布式业务集群的管理下,其无需自行区分业务集群A和业务集群B,只需通过管理操作单元提交相应的执行请求,本实施例提供的管理分布式业务集群的系统能够在主逻辑服务子单元检查用户对用户资源对象进行操作的权限,对于具有操作权限的操作发送给相应的集群管控单元进行进一步处理,集群管控单元再次对用户的操作进行检查,将具有权限的操作发送给相应的节点控制子系统进行执行。可见,利用本申请提供的管理分布式业务集群的系统不会人为对业务集群A执行对业务集群B的操作,造成错误。从而提高了系统的系统的安全性。
更进一步的,对于本身请提供的管理分布式业务集群的系统的一种可选方式,管理操作单元还可以包括接口子单元和主逻辑服务子单元,所属接口子单元还能够包括管理接口子单元和应用程序接口子单元。基于主逻辑服务子单元的提供的功能,所述管理接口子单元除了提供应用程序接口子单元所对应的功能外,还额外提供本管理系统的管理功能。也即用户通过应用程序接口子单元,不能执行本管理系统提供的管理本系统的功能,从而保障了本管理系统的安全性。
本申请第八实施例提供一种利用本申请提供的管理分布式业务集群的系统的一种可选方式对业务集群的业务软件环境进行扩展的方法,所述管理分布式业务集群的系统部署完成,如图8所示,其中节点控制子系统A,节点控制子系统B和节点控制子系统C分别部署在业务集群的业务节点A,业务节点B和业务节点C上。所述对业务集群的业务软件环境进行扩展的方法如图中步骤801至步骤810所示:
步骤801,接口子单元接收请求者发送的扩展业务集群A的业务软件环境的请求。
步骤802,接口子单元根据所述请求发送指令给主逻辑服务子单元,请求对业务集群A的业务软件环境进行扩展。
步骤803,主逻辑服务子单元根据所述请求,为所述业务集群A分配新的业务节点并确定业务节点的角色和业务节点的相关基础软硬件参数等。
步骤804,主逻辑服务子单元,下发集群管控任务给集群管控单元,所述集群管控任务包括:节点的硬件参数,按照新增业务节点的角色不同,节点的配置,节点的基础软件机器配置,节点上的业务软件配置,启动命令等。
步骤805,集群管控单元根据主逻辑子单元发送的集群管控任务,发送对应的节点控制人物到对应的节点控制子系统。
步骤806,各个节点控制子系统执行接收到节点控制任务,完成相应的业务节点创建工作并下载业务集群A所需的业务软件,配置相关参数并启动业务环境。
步骤807,各个节点控制子系统向集群管控单元返回所述节点控制任务的执行结果。
步骤808,集群管控单元收集到所有节点控制子系统反馈的执行结果后向主逻辑服务子单元返回所述集群管控任务的执行结果。
步骤809,主逻辑服务子单元向接口子单元返回所述指令的执行结果。
步骤810,接口子单元向请求者反馈做事请求的执行结果。
至此完成利用本申请提供的管理分布式业务集群的系统的一种可选方式进行业务集群业务软件环境的扩展工作。
本申请第九实施例提供一种创建分布式业务集群的方法,包括以下步骤:
步骤S901,接收创建分布式业务集群的请求,所述请求包含创建所述业务集群所需的相关信息。
根据所采用的管理分布式业务集群的系统的方式的不同,可以由不同的接收者接收所述请求,例如由本申请提供的管理分布式业务集群的系统的管理操作单元接收,也可以如本申请第三实施例中通过接口子单元由主逻辑服务子单元接收,相应的更加详细的说明可以参考本申请第三实施例中步骤301和步骤302的描述。再次不做赘述。
步骤S902,根据所述请求,向相应的集群管控单元发送相应的集群管控任务,所述集群管控任务包含有包含创建所述业务集群所需的集群相关信息。
本步骤与本申请第三实施例中步骤303和步骤304类似,可以参考相应的描述,在此不做赘述。
步骤S903,根据所述集群管控任务,向相应的节点控制单元发送节点控制任务,所述节点控制任务包含有包含创建所述业务集群所需的节点相关信息。
本步骤与本申请第三实施例中步骤305类似,可以参考相应的描述,在此不做赘述。
步骤S904,执行相应的节点控制任务。
本步骤在相应的节点上执行相应的节点控制任务,建立业务节点。与本申请第三实施例中步骤306执行节点控制任务部分类似,可以参考相应的描述,在此不做赘述。
步骤S905,向所述请求的请求者反馈所述创建分布式业务集群的请求的执行结果。
本步骤通过管理分布式业务集群的系统的各个子系统,单元或子单元,将相应的请求的执行结果反馈给请求者。与本申请第三实施例中步骤306至步骤309类似,可以参考相应的描述,在此不做赘述。
本申请第十实施例提供一种调整分布式业务集群的方法,包括以下步骤:
步骤S1001,接收调整分布式业务集群的请求,所述请求包含调整所述业务集群所需的相关信息。
根据所采用的管理分布式业务集群的系统的方式的不同,可以由不同的接收者接收所述请求,例如由本申请提供的管理分布式业务集群的系统的管理操作单元接收,也可以如本申请第四实施例中通过接口子单元由主逻辑服务子单元接收,相应的更加详细的说明可以参考本申请第四实施例中步骤401和步骤402的描述。再次不做赘述。
步骤S1002,根据所述请求,向相应的集群管控单元发送相应的集群管控任务,所述集群管控任务包含有调整所述业务集群所需的集群相关信息。
本步骤与本申请第四实施例中步骤403类似,可以参考相应的描述,在此不做赘述。
步骤S1003,根据所述集群管控任务,向相应的节点控制单元发送节点控制任务,所述节点控制任务包含有调整所述业务集群所需的节点相关信息。
本步骤与本申请第四实施例中步骤404类似,可以参考相应的描述,在此不做赘述。
步骤S1004,执行相应的节点控制任务。
本步骤在相应的节点上执行相应的节点控制任务,调整业务节点(修改角色,停止服务等)。与本申请第四实施例中步骤405执行节点控制任务部分类似,可以参考相应的描述,在此不做赘述。
步骤S1005,向所述请求的请求者反馈所述调整分布式业务集群的请求的执行结果。
本步骤通过管理分布式业务集群的系统的各个子系统,单元或子单元,将相应的请求的执行结果反馈给请求者。与本申请第四实施例中步骤405至步骤408类似,可以参考相应的描述,在此不做赘述。
本申请第十一实施例提供一种向分布式业务集群提交作业的方法,包括以下步骤:
步骤S1101,接收向分布式业务集群的提交作业的请求,所述请求包含有所述作业相关信息。
根据所采用的管理分布式业务集群的系统的方式的不同,可以由不同的接收者接收所述请求,例如由本申请提供的管理分布式业务集群的系统的管理操作单元接收,也可以如本申请第五实施例中通过接口子单元由主逻辑服务子单元接收,相应的更加详细的说明可以参考本申请第五实施例中步骤501和步骤502的描述。再次不做赘述。
步骤S1102,根据所述请求向相应的调度单元发送相应的调度任务,所述调度任务包含有所述提交所述作业所需的调度相关信息。
本步骤与本申请第五实施例中步骤503类似,可以参考相应的描述,在此不做赘述。
步骤S1103根据所述调度任务向相应的集群管控单元发送相应的集群管控任务,所述集群管控任务包含有所示提交所述作业所需的集群相关信息.
本步骤与本申请第五实施例中步骤504类似,可以参考相应的描述,在此不做赘述。
步骤S1104,根据所述集群管控任务,向相应的节点控制单元发送节点控制任务,所述节点控制任务包含有所述提交所述作业所需的节点相关信息。
本步骤与本申请第五实施例中步骤505类似,可以参考相应的描述,在此不做赘述。
步骤S1105,执行相应的节点控制任务。
本步骤在相应的节点上执行相应的作业。与本申请第五实施例中步骤506执行节点控制任务部分类似,可以参考相应的描述,在此不做赘述。
步骤S1106,向所述请求的请求者反馈所述提交作业的执行结果。
本步骤通过管理分布式业务集群的系统的各个子系统,单元或子单元,将相应的请求的执行结果反馈给请求者。与本申请第四实施例中步骤506至步骤510类似,可以参考相应的描述,在此不做赘述。
本申请第十二实施例提供一种扩展分布式业务集群业务软件环境的方法,包括以下步骤:
步骤S1201,接收创建分布式业务集群的请求,所述请求包含创建所述业务集群所需的相关信息。
根据所采用的管理分布式业务集群的系统的方式的不同,可以由不同的接收者接收所述请求,例如由本申请提供的管理分布式业务集群的系统的管理操作单元接收,也可以如本申请第八实施例中通过接口子单元由主逻辑服务子单元接收,相应的更加详细的说明可以参考本申请第八实施例中步骤801和步骤802的描述。再次不做赘述。
步骤S1202,根据所述请求,向相应的集群管控单元发送相应的集群管控任务,所述集群管控任务包含有包含苦熬真所述业务集群业务软件环境所需的集群相关信息。
本步骤与本申请第八实施例中步骤803和步骤804类似,可以参考相应的描述,在此不做赘述。
步骤S1203,根据所述集群管控任务,向相应的节点控制单元发送节点控制任务,所述节点控制任务包含有包含扩展所述业务集群业务软件环境所需的节点相关信息。
本步骤与本申请第八实施例中步骤805类似,可以参考相应的描述,在此不做赘述。
步骤S1204,执行相应的节点控制任务。
本步骤在相应的节点上执行相应的节点控制任务,扩展业务节点。与本申请第八实施例中步骤806类似,可以参考相应的描述,在此不做赘述。
步骤S1205,向所述请求的请求者反馈所述扩展分布式业务集群业务软件环境的请求的执行结果。
本步骤通过管理分布式业务集群的系统的各个子系统,单元或子单元,将相应的请求的执行结果反馈给请求者。与本申请第八实施例中步骤807至步骤310类似,可以参考相应的描述,在此不做赘述。
本发明虽然以较佳实施例公开如上,但其并不是用来限定本发明,任何本领域技术人员在不脱离本发明的精神和范围内,都可以做出可能的变动和修改,因此本发明的保护范围应当以本发明权利要求所界定的范围为准。

Claims (13)

1.一种管理分布式业务集群的系统,其特征在于,包括:管理子系统和至少一个与其连接的节点控制子系统;
所述管理子系统,用于管理对资源对象进行的操作及管理节点控制子系统的节点控制任务的执行;所述管理子系统包括:管理操作单元、调度单元和至少一个集群管控单元,所述调度单元与管理操作单元和集群管控单元相连接;所述管理操作单元,用于管理对资源对象的执行及结果反馈,管理集群管控单元的集群管控任务的执行,管理集群管控单元和节点,还用于管理调度单元的调度任务的执行并管理调度单元;所述集群管控单元,用于与至少一个节点控制子系统相连接,执行管理操作单元下发的集群管控任务并反馈执行结果,管理节点控制子系统的节点控制任务的执行和收集并反馈节点信息,还用于执行调度单元下发的集群管控任务并反馈执行结果;所述管理调度单元,所述调度单元用于执行管理操作单元下发的调度任务并反馈执行结果,管理相应的集群管控单元的集群管控任务;所述管理操作单元包括:主逻辑服务子单元和与其相连接的接口子单元;所述接口子单元,用于管理对资源对象进行操作的命令或代码的执行并反馈执行结果给相应的命令或代码的发送者,管理主逻辑服务子单元的指令执行;所述主逻辑服务子单元,用于与至少一个集群管控单元相连接,管理对资源对象进行的操作,管理对本系统进行的操作,执行接口子单元下发的指令并反馈执行结果,管理集群管控单元的集群管控任务的执行,管理集群管控单元和节点;
所述节点控制子系统,用于执行管理子系统下发的节点控制任务;
其中,所述管理子系统将接收到的对资源对象进行操作的命令或代码转换为相应的节点控制任务发送给所述节点控制子系统。
2.根据权利要求1所述的管理分布式业务集群的系统,其特征在于,所述管理子系统还用于通过节点控制子系统管理该节点至子系统所在节点的配置。
3.根据权利要求1或2所述的管理分布式业务集群的系统,其特征在于:所述节点控制子系统还用于反馈管理子系统下发的节点控制任务的执行结果,收集并反馈节点控制子系统所在节点信息。
4.根据权利要求1所述的管理分布式业务集群的系统,其特征在于,所述接口子单元包括:管理接口子单元和应用程序接口子单元;
所述管理接口子单元,用于与主逻辑服务子单元相连接,管理对资源对象进行操作的命令的执行并反馈执行结果给相应的命令的发送者;管理对本系统进行操作的命令的执行并反馈执行结果给相应命令的发送者;管理相应的主逻辑服务子单元的指令的执行;
所述应用程序接口子单元,用于与主逻辑服务子单元相连接,管理对资源对象进行操作的代码的执行并反馈执行结果给相应的代码的发送者;管理相应的主逻辑服务子单元的指令的执行。
5.根据权利要求1所述的管理分布式业务集群的系统,其特征在于,所述资源对象包括:作业,执行计划,集群和项目。
6.根据权利要求1所述的管理分布式业务集群的系统,其特征在于,用于创建分布式业务集群;或
用于调整分布式业务集群;或
用于监控分布式业务集群;或
用于提交作业;或,
用于隔离用户可操作资源;或
用于扩展分布式业务集群的软件环境。
7.一种创建分布式业务集群的方法,其特征在于,应用于权利要求1-6任意一项所述的管理分布式业务集群的系统,所述方法包括:
接口子单元接收创建分布式业务集群的请求,所述请求包含创建所述业务集群所需的配置信息;
所述接口子单元根据所述创建分布式业务集群的请求发送创建所述分布式业务集群的指令给主逻辑服务子单元;
所述主逻辑服务子单元根据所述创建分布式业务集群的指令分配所述分布式业务集群所需的业务节点并完成节点准备工作;
所述主逻辑服务子单元根据所述创建分布式业务集群的指令和完成的节点准备工作,向相应的集群管控单元发送相应的集群管控任务,所述集群管控任务包含有创建所述业务集群所需的集群配置信息;
集群管控单元接收到所述集群管控任务,向相应的节点控制单元发送节点控制任务,根据不同节点的角色,把不同的节点控制任务分发到不同的节点控制子系统并等待任务的执行结果,所述节点控制任务包含有创建所述业务集群所需的节点配置信息;
将所述不同的节点控制子系统的执行结果反馈给所述集群管控单元;
所述集群管控单元根据各个节点控制子系统反馈的节点控制任务的执行结果,生成相应的集群管控任务的执行结果,将所述集群管控任务的执行结果反馈给所述主逻辑服务子单元;
所述主逻辑服务子单元,根据所述集群管控单元发送的集群管控任务的执行结果生成创建所述分布式业务集群的指令的执行结果,将所述执行结果反馈给所述接口子单元;
所述接口子单元根据所述主逻辑服务子单元反馈的创建所述分布式业务集群的指令的执行结果,向所述请求的请求者反馈所述创建分布式业务集群的请求的执行结果。
8.一种调整分布式业务集群的方法,其特征在于,应用于权利要求1-6任意一项所述的管理分布式业务集群的系统,所述方法包括:接口子单元接收调整指定的分布式业务集群的请求,所述请求包含有调整所述分布式业务集群所需的调整要求信息及需要调整的集群的配置信息;
所述接口子单元根据所述请求向主逻辑服务子单元发送调整所述分布式业务集群的指令;
所述主逻辑服务子单元收到调整所述分布式业务集群的指令后,确定需要变更的机器节点,向相应的集群管控单元发送相应的集群管控任务,所述集群管控任务包含有调整所述分布式业务集群所需的集群配置信息;
所述集群管控单元接收到所述集群管控任务后,根据所述集群管控任务向相应的节点控制子系统发送相应的节点控制任务,所述节点控制任务包含有调整所述分布式业务集群所需的配置信息;
所述节点控制子系统执行所接收到的节点控制任务,并在完成后反馈所述集群管控单元执行结果;
所述集群管控单元向主逻辑服务子单元发送调整分布式业务集群所对应的集群管控任务的执行结果;
所述主逻辑服务子单元向所述接口子单元反馈本次调整分布式业务集群所对应的指令的执行结果。
9.根据权利要求8所述的调整分布式业务集群的方法,其特征在于,还包括:
执行所述节点控制任务后所述接口子单元向所述请求的请求者反馈所述调整指定的分布式业务集群的请求的执行结果。
10.一种向分布式业务集群提交作业的方法,其特征在于,应用于权利要求1-6任意一项所述的管理分布式业务集群的系统,所述方法包括:
接口子单元接收请求者向分布式业务集群的提交作业的请求,所述请求包含有所述作业的属性信息;
所述接口子单元根据所述请求发送指令给主逻辑服务子单元;
所述主逻辑服务子单元根据所述请求向相应的调度单元发送相应的调度任务,所述调度任务包含有所述提交所述作业所需的调度角色信息;所述调度单元根据所述调度任务向相应的集群管控单元发送相应的集群管控任务,所述集群管控任务包含有所示提交所述作业所需的集群配置信息;
所述集群管控单元根据所述集群管控任务向相应的能够接收作业提交的节点的节点控制子系统发送相应的节点控制任务,所述节点控制任务包含有所述提交所述作业所需的节点配置信息;
所述节点控制子系统根据接收到的作业的相关信息,从相应的存储位置获取相应的作业,执行后将执行结果反馈给所述集群管控单元;
所述集群管控单元反馈所述调度单元作业的执行情况;
所述调度单元返回所述主逻辑服务子单元作业的执行情况;
所述主逻辑服务子单元向所述接口子单元发送所述提交作业的请求所对应的指令的执行结果。
11.根据权利要求10所述的向分布式业务集群提交作业的方法,其特征在于,还包括:
执行所述节点控制任务后,所述接口子单元向所述请求的请求者反馈所述向分布式业务集群提交作业的执行结果。
12.一种扩展分布式业务集群业务软件环境的方法,其特征在于,应用于权利要求1-6任意一项所述的管理分布式业务集群的系统,所述方法包括:
接口子单元接收请求者发送的扩展指定的分布式业务集群的请求,所述请求包含有所述扩展分布式业务集群业务软件环境所需的配置信息;
所述接口子单元根据所述请求发送指令给主逻辑服务子单元请求对分布式业务集群进行扩展;
所述主逻辑服务子单元根据所述请求,为所述分布式业务集群分配新的业务节点并确定业务节点的角色;
所述主逻辑服务子单元根据所述请求向相应的集群管控单元发送相应的集群管控任务,所述集群管控任务包含有所述扩展分布式业务集群业务软件环境所需的集群配置信息;
根据所述集群管控任务向相应的节点控制单元发送相应的节点控制任务,所述节点控制任务包含有所述扩展分布式业务集群业务软件环境所需的节点配置信息;
各个节点控制子系统执行接收到的所述节点控制任务,完成相应的业务节点创建工作;
所述各个节点控制子系统向所述集群管控单元返回所述节点控制任务的执行结果;
所述集群管控单元收集到所有节点控制子系统反馈的执行结果后向主逻辑服务子单元返回所述集群管控任务的执行结果;
所述主逻辑服务子单元向所述接口子单元返回所述指令的执行结果。
13.根据权利要求12所述的扩展分布式业务集群业务软件环境的方法,其特征在于,还包括:
执行所述节点控制任务后,所述接口子单元向所述请求的请求者反馈所述扩展分布式业务集群业务软件环境的请求的执行结果。
CN201711105884.7A 2017-11-10 2017-11-10 一种管理分布式业务集群的系统 Active CN109787792B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711105884.7A CN109787792B (zh) 2017-11-10 2017-11-10 一种管理分布式业务集群的系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711105884.7A CN109787792B (zh) 2017-11-10 2017-11-10 一种管理分布式业务集群的系统

Publications (2)

Publication Number Publication Date
CN109787792A CN109787792A (zh) 2019-05-21
CN109787792B true CN109787792B (zh) 2022-05-13

Family

ID=66485707

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711105884.7A Active CN109787792B (zh) 2017-11-10 2017-11-10 一种管理分布式业务集群的系统

Country Status (1)

Country Link
CN (1) CN109787792B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110806927A (zh) * 2019-10-15 2020-02-18 中国航空无线电电子研究所 分布式系统下的软件运行控制方法
CN117215884A (zh) * 2022-06-02 2023-12-12 华为云计算技术有限公司 分布式协同ai任务评估方法、管理装置、控制装置和系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103797462A (zh) * 2013-10-23 2014-05-14 华为技术有限公司 一种创建虚拟机的方法和装置
CN104506620A (zh) * 2014-12-23 2015-04-08 西安电子科技大学 一种可扩展的自动化计算服务平台及其构建方法
CN105743671A (zh) * 2014-12-10 2016-07-06 华为技术有限公司 一种扩容方法、控制器及系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9769689B2 (en) * 2014-12-09 2017-09-19 Futurewei Technologies, Inc. Method and apparatus for optimizing cell specific antenna configuration parameters
CN105786611A (zh) * 2014-12-16 2016-07-20 中国移动通信集团公司 一种分布式集群的任务调度方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103797462A (zh) * 2013-10-23 2014-05-14 华为技术有限公司 一种创建虚拟机的方法和装置
CN105743671A (zh) * 2014-12-10 2016-07-06 华为技术有限公司 一种扩容方法、控制器及系统
CN104506620A (zh) * 2014-12-23 2015-04-08 西安电子科技大学 一种可扩展的自动化计算服务平台及其构建方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于OpenStack的协同计算平台设计与实现;武磊;《中国优秀硕士学位论文全文数据库·信息科技辑》;20160315;第三章至第四章 *
武磊.基于OpenStack的协同计算平台设计与实现.《中国优秀硕士学位论文全文数据库·信息科技辑》.2016, *

Also Published As

Publication number Publication date
CN109787792A (zh) 2019-05-21

Similar Documents

Publication Publication Date Title
CN108924217B (zh) 一种分布式云系统自动化部署方法
CN110768833B (zh) 基于kubernetes的应用编排部署方法及装置
CN111506412B (zh) 基于Airflow的分布式异步任务构建、调度系统及方法
JP4593078B2 (ja) 異なる計算機環境におけるジョブ実行方法及びそのプログラム
CN113742031B (zh) 节点状态信息获取方法、装置、电子设备及可读存储介质
EP2893443B1 (en) Re-configuration in cloud computing environments
CN111897638B (zh) 分布式任务调度方法及系统
JP5102543B2 (ja) 情報技術インフラストラクチャを動的にプロビジョニングするための方法
CN104579792A (zh) 多适配方式实现多种类型虚拟资源集中管理架构及方法
CN111614729B (zh) 对kubernetes容器集群的控制方法、装置及电子设备
US11704616B2 (en) Systems and methods for distributed business processmanagement
CN113220416B (zh) 基于云平台的集群节点伸缩系统及实现方法和运行方法
CN105786611A (zh) 一种分布式集群的任务调度方法及装置
JP7003874B2 (ja) リソース予約管理装置、リソース予約管理方法およびリソース予約管理プログラム
CN102546839B (zh) 面向大规模网络的高效、可靠的软件分发方法
EP3442201A1 (en) Cloud platform construction method and cloud platform
CN109787792B (zh) 一种管理分布式业务集群的系统
CN114666333A (zh) 一种基于多租户理论面向云计算资源调度问题的控制方法
CN103516735A (zh) 一种网络节点升级的方法及装置
JP6202091B2 (ja) 情報処理装置、及び、配備方法
CN114385126B (zh) 一种基于K8s的多租户深度学习模型研发系统及方法
CN110618821A (zh) 基于Docker的容器集群系统及快速搭建方法
CN115576684A (zh) 任务处理方法、装置、电子设备及存储介质
CN112306640A (zh) 容器分配方法及其装置、设备、介质
Chiu et al. Pilot factory–a condor-based system for scalable pilot job generation in the panda wms framework

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant