WO2021109686A1

WO2021109686A1 - 集群资源的控制方法、装置和云计算系统

Info

Publication number: WO2021109686A1
Application number: PCT/CN2020/117413
Authority: WO
Inventors: 沈伯伟; 都海峰; 李文乔; 王俊; 白石; 韩楚怡
Original assignee: 北京京东尚科信息技术有限公司; 北京京东世纪贸易有限公司
Priority date: 2019-12-05
Filing date: 2020-09-24
Publication date: 2021-06-10
Also published as: US20230004439A1; CN110968427A; JP2023504870A; EP4071611A1; EP4071611A4

Abstract

本公开涉及一种集群资源的控制方法、装置和云计算系统，涉及计算机技术领域。该方法包括：在待控制资源为待扩容资源的情况下，确定待扩容资源与应用之间的绑定关系；将初始化后的待扩容资源添加到与其具有绑定关系的相应应用的资源池中；根据待处理应用的部署类型，生成待处理应用的待执行数据包；将待执行数据包部署在待处理应用的资源池中的待扩容资源上执行。

Description

集群资源的控制方法、装置和云计算系统

相关申请的交叉引用

本申请是以CN申请号为201911232841.4，申请日为2019年12月5日的申请为基础，并主张其优先权，该CN申请的公开内容在此作为整体引入本申请中。

技术领域

本公开涉及计算机技术领域，特别涉及一种集群资源的控制方法、集群资源的控制装置、云计算系统和非易失性计算机可读存储介质。

背景技术

随着云系统在使用过程中对资源的不断消耗，需要对集群中各种产品的进行资源控制(如扩容、缩容)。这种资源控制成为了运维人员定期需要进行的操作。

在相关技术中，针对某种特定场景下集群某种业务的应用，开发扩容方法。

发明内容

根据本公开的一些实施例，提供了一种集群资源的控制方法，包括：在待控制资源为待扩容资源的情况下，确定所述待扩容资源与应用之间的绑定关系；将初始化后的所述待扩容资源添加到与其具有所述绑定关系的相应应用的资源池中；根据待处理应用的部署类型，生成所述待处理应用的待执行数据包；将所述待执行数据包部署在所述待处理应用的资源池中的待扩容资源上执行。

在一些实施例中，所述将初始化后的所述待扩容资源添加到与其具有所述绑定关系的相应应用的资源池中包括：将所述待扩容资源的相关信息传递给相应应用的前置脚本；执行所述前置脚本，以完成所述待扩容资源的初始化。

在一些实施例中，生成待处理应用的待执行数据包包括：在所述部署类型为包部署的情况下，确定所述待扩容资源为物理机，生成所述待处理应用的程序包作为所述待执行数据包；在所述部署类型为镜像部署的情况下，确定所述待扩容资源为容器镜像，生成所述待处理应用的程序包，并根据该程序包和所述待处理应用的运行镜像，生成所述待执行数据包。

在一些实施例中，所述将所述待执行数据包部署在所述待处理应用的资源池中的待扩容资源上执行包括：在待扩容资源为物理机的情况下，将待执行数据包发送给物理机执行；在待扩容资源为容器镜像的情况下，将待执行数据包发送给相应资源池中的空闲物理机执行。

在一些实施例中，所述将所述待执行数据包部署在所述待处理应用的资源池中的待扩容资源上执行包括：获取所述资源池中的待扩容资源的相关信息；通过为所述待处理应用配置的部署接口，将该待扩容资源的相关信息发送给所述待处理应用的第三方程序，以便所述第三方程序根据自己的部署方式，将所述待执行数据包部署在该待扩容资源上执行。

在一些实施例中，该方法还包括：执行待处理应用的后置脚本，后置脚本用于以下处理的至少一项：向集群的管理节点返回扩容结果；为资源池中的扩容资源创建卷；清理扩容处理产生的垃圾。

在一些实施例中，该方法还包括：建立与各待扩容资源的SSH(Secure Shell，安全壳协议)连接，用于执行相应应用的各相关脚本，在同一时间内只能与每个待扩容资源建立一条SSH连接。

在一些实施例中，该方法还包括：在相应应用的待执行数据包执行完毕后，在预设的时间段内保留相应的SSH连接。

在一些实施例中，该方法还包括：在待控制资源为待缩容资源的情况下，判断待缩容资源是否存在重要数据，以及是否存在依赖于待缩容资源的服务；在不存在重要数据，且不存在依赖于待缩容资源的服务的情况下，将待缩容资源从集群中移除。

在一些实施例中，通过配置的缩容接口，传递获取的待缩容资源的相关信息，以便将待缩容资源从集群中移除。

在一些实施例中，该方法还包括：通过轮询配置的查询接口，获取缩容结果。

在一些实施例中，将待缩容资源从集群中移除后，该方法还包括：在待缩容资源为物理机的情况下，将待缩容资源添加到资源池；在待缩容资源为容器镜像的情况下，销毁该容器镜像，并将待缩容资源添加到资源池。

在一些实施例中，该方法还包括：在待缩容资源为物理机的情况下，执行缩容处理的后置脚本，后置脚本用于启动装机流程对待缩容资源进行操作系统重装。

根据本公开的另一些实施例，提供一种集群资源的控制装置，包括：确定单元，用于在待控制资源为待扩容资源的情况下，确定所述待扩容资源与应用之间的绑定关系；添加单元，用于将初始化后的所述待扩容资源添加到与其具有所述绑定关系的应用的资源池中；生成单元，用于根据待处理应用的部署类型，生成所述待处理应用的待执行数据包；执行单元，用于将所述待执行数据包部署在所述待处理应用的资源池中的待扩容资源上执行。

在一些实施例中，添加单元将待扩容资源的相关信息传递给相应应用的前置脚本，执行前置脚本，以完成待扩容资源的初始化。

在一些实施例中，在部署类型为包部署的情况下，确定待扩容资源为物理机，生成单元生成待处理应用的程序包作为待执行数据包；在部署类型为镜像部署的情况下，确定待扩容资源为容器镜像，生成单元生成待处理应用的程序包，并根据该程序包和待处理应用的运行镜像，生成待执行数据包。

在一些实施例中，执行单元在待扩容资源为物理机的情况下，将待执行数据包发送给物理机执行；执行单元在待扩容资源为容器镜像的情况下，将待执行数据包发送给相应资源池中的空闲物理机执行。

在一些实施例中，执行单元获取所述资源池中的待扩容资源的相关信息，通过为待处理应用配置的部署接口，将该待扩容资源的相关信息发送给待处理应用的第三方程序，以便第三方程序根据自己的部署方式，将待执行数据包部署在该待扩容资源上执行。

在一些实施例中，执行单元执行待处理应用的后置脚本，后置脚本用于以下处理的至少一项：向集群的管理节点返回扩容结果；为资源池中的扩容资源创建卷；清理扩容处理产生的垃圾。

在一些实施例中，该装置还包括建立单元，用于建立与各待扩容资源的SSH连接，用于执行相应应用的各相关脚本，在同一时间内只能与每个待扩容资源建立一条SSH连接。

在一些实施例中，建立单元在相应应用的待执行数据包执行完毕后，在预设的时间段内保留相应的SSH连接。

在一些实施例中，该装置还包括缩容单元，用于在待控制资源为待缩容资源的情况下，判断待缩容资源是否存在重要数据，以及是否存在依赖于待缩容资源的服务；缩容单元在不存在重要数据，且不存在依赖于待缩容资源的服务的情况下，将待缩容资源从集群中移除。

在一些实施例中，缩容单元通过配置的缩容接口，传递获取的待缩容资源的相关信息，以便将待缩容资源从集群中移除。

在一些实施例中，缩容单元通过轮询配置的查询接口，获取缩容结果。

在一些实施例中，缩容单元将待缩容资源从集群中移除后，在待缩容资源为物理机的情况下，添加单元将待缩容资源添加到资源池；在待缩容资源为容器镜像的情况下，缩容单元销毁该容器镜像，添加单元将待缩容资源添加到资源池。

在一些实施例中，在待缩容资源为物理机的情况下，执行单元执行缩容处理的后置脚本，后置脚本用于启动装机流程对待缩容资源进行操作系统重装。

根据本公开的又一些实施例，提供一种集群资源的控制装置，包括：存储器；和耦接至存储器的处理器，处理器被配置为基于存储在存储器装置中的指令，执行上述任一个实施例中的集群资源的控制方法。

根据本公开的再一些实施例，提供一种非易失性计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现上述任一个实施例中的集群资源的控制方法。

根据本公开的又一些实施例，提供一种云计算系统，包括：集群资源的控制装置，用于执行上述任一个实施例中的集群资源的控制方法。

附图说明

此处所说明的附图用来提供对本公开的进一步理解，构成本申请的一部分，本公开的示意性实施例及其说明用于解释本公开，并不构成对本公开的不当限定。在附图中：

图1示出本公开的集群资源的控制方法的一些实施例的流程图；

图2示出本公开的集群资源的控制方法的另一些实施例的流程图；

图3示出本公开的集群资源的控制装置的一些实施例的示意图；

图4示出本公开的集群资源的控制方法的又一些实施例的流程图；

图5示出本公开的集群资源的控制装置的另一些实施例的示意图；

图6示出本公开的集群资源的控制装置的又一些实施例的示意图；

图7示出本公开的集群资源的控制方法的一些实施例的示意图；

图8示出本公开的集群资源的控制装置的再一些实施例的示意图；

图9示出本公开的集群资源的控制装置的再一些实施例的示意图；

图10示出本公开的集群资源的控制装置的一些实施例的框图；

图11示出本公开的集群资源的控制装置的另一些实施例的框图；

图12示出本公开的集群资源的控制装置的又一些实施例的框图；

图13示出本公开的集群资源的控制系统的一些实施例的框图。

具体实施方式

下面将结合本公开实施例中的附图，对本公开实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本公开一部分实施例，而不是全部的实施例。以下对至少一个示例性实施例的描述实际上仅仅是说明性的，决不作为对本公开及其应用或使用的任何限制。基于本公开中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本公开保护的范围。

除非另外具体说明，否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。同时，应当明白，为了便于描述，附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论，但在适当情况下，所述技术、方法和设备应当被视为授权说明书的一部分。在这里示出和讨论的所有示例中，任何具体值应被解释为仅仅是示例性的，而不是作为限制。因此，示例性实施例的其它示例可以具有不同的值。应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步讨论。

本公开的发明人发现上述相关技术中存在如下问题：无法适用于不同业务的应用的资源扩容，导致适用性差。

鉴于此，本公开提出了一种集群资源的控制技术方案，能够提高资源扩容的适用性。

图1示出本公开的集群资源的控制方法的一些实施例的流程图。

如图1所示，该方法包括：步骤S11，确定绑定关系；步骤S12，添加待扩容资源；步骤S13，生成待执行数据包；和步骤S14，部署待执行数据包。

在步骤S11中，在待控制资源为待扩容资源的情况下，确定待扩容资源与相应的应用之间的绑定关系。例如，待扩容资源可以是物理机或容器镜像。

在步骤S12中，根据绑定关系，将初始化后的待扩容资源添加到相应的应用的资源池中。

在一些实施例中，将待扩容资源的相关信息传递给相应的应用的前置脚本；执行前置脚本，以完成待扩容资源的初始化。

在步骤S13中，根据待处理应用的部署类型，生成待处理应用的待执行数据包。

在一些实施例中，在部署类型为包部署的情况下，生成待处理应用的程序包作为待执行数据包。在这种情况下，待扩容资源为物理机，。

在一些实施例中，在部署类型为镜像部署的情况下，生成待处理应用的程序包，并根据该程序包和待处理应用的运行镜像生成待执行数据包。在这种情况下，待扩容资源为容器镜像。

在步骤S14中，将待执行数据包部署在待处理应用的资源池中相应的待扩容资源上执行。

在一些实施例中，在待扩容资源为物理机的情况下，将待执行数据包发送给物理机执行；在待扩容资源为容器镜像的情况下，将待执行数据包发送给相应资源池(备机池)中的空闲物理机执行。例如，备机池为云计算系统中的备用物理机资源池。

在一些实施例中，获取该待扩容资源的相关信息；通过为待处理应用配置的部署接口，将该待扩容资源的相关信息发送给待处理应用的第三方程序；第三方程序根据自己的部署方式，将待执行数据包部署在该待扩容资源上执行。

在一些实施例中，执行待处理应用的后置脚本，后置脚本用于以下处理的至少一项：向集群的管理节点返回扩容结果；为相应的扩容资源创建相应的卷(volume)；清理扩容处理产生的垃圾。

在一些实施例中，建立与各待扩容资源的SSH连接，用于执行相应的应用的各相关脚本，在同一时间内只能与每个待扩容资源建立一条SSH连接。

在一些实施例中，在相应的应用的待执行数据包执行完毕后，在预设的时间段内保留相应的SSH连接，以便下次执行该相应的应用的待执行数据包时，复用该SSH连接。

图2示出本公开的集群资源的控制方法的另一些实施例的流程图。

如图2所示，该方法还包括：步骤S21，判断重要数据和依赖服务；和S22，移除待缩容资源。

在步骤S21中，在待控制资源为待缩容资源的情况下，判断待缩容资源是否存在重要数据，以及是否存在依赖于待缩容资源的服务。

在步骤S22中，在不存在重要数据，且不存在依赖于待缩容资源的服务的情况下，将待缩容资源从集群中移除。

在一些实施例中，可以通过配置的缩容接口，在系统中传递获取的待缩容资源的相关信息，以便将待缩容资源从集群中移除；通过轮询配置的查询接口，获取缩容结果。

在一些实施例中，在待缩容资源为物理机的情况下，将待缩容资源添加到资源池(备机池)；在待缩容资源为容器镜像的情况下，销毁该容器镜像，并将待缩容资源添加到资源池。

在一些实施例中，在待缩容资源为物理机的情况下，执行缩容处理的后置脚本。后置脚本用于启动装机流程对待缩容资源进行操作系统重装。例如，可以通过PXE(Preboot eXecution Environment，预启动执行环境)实现重装。

在上述实施例中，根据待扩容资源与应用的绑定关系，将应用的数据包部署在相应的待扩容资源上执行。这样，可以适用于不同业务的应用的资源扩容，从而提高了资源扩容的适用性。

图3示出本公开的集群资源的控制装置的一些实施例的示意图。

如图3所示，用户可以通过前端Web(网络)页面与后端扩容(或缩容)控制器(即控制装置)交互。例如，前端Web页面可以通过Nginx(engine x，x引擎)服务器实现；控制装置可以通过Golang编程语言实现。

控制装置的内部结构可以是一个针对复杂专有云集群的，支持多组件并发扩容、缩容的统一资源控制系统。各业务线脚本可以与控制装置连接。

例如，该控制装置可以包括多组件扩缩容控制器、异构组件资源管理模块、并发扩缩容执行器、组件统一构建系统、多组件部署系统和组件缩容回收系统等多个模块。

在一些实施例中，多组件扩缩容控制器(如包括确定单元、添加单元等)负责控制整体扩容、缩容流程。例如，多组件扩缩容控制器可以协调其他各模块工作；控制调用扩容、缩容中用到的每一个模块；提供必要的数据参数。

在一些实施例中，异构组件资源管理模块负责管理扩容、缩容过程中需要的所有元数据。例如，元数据包括服务器(物理机资源)管理IP(Internet Protocol，互联网协议)、服务器规格参数、扩容缩容应用数据等。

例如，异构组件资源管理模块可以使用关系型数据库MySQL(My Structured Query Language，我的结构化序列语言)持久化存储数据。

例如，异构组件资源管理模块可以独立部署，并向外提供OpenAPI(Open Application Programming Interface，开放式应用编程接口)调用接口。

在一些实施例中，并发扩缩容执行器(如可以包括执行单元、建立单元等)负责执行各中资源服务器在不同阶段所需要运行的脚本。

例如，并发扩缩容执行器的底层可以是一个基于SSH协议实现的连接池。可以通过Golang编程语言实现并发扩缩容执行器，以保证高并发。并发扩缩容执行器可以建立控制装置与待扩容资源的SSH连接。

例如，并发扩缩容执行器可以执行自定义的扩容、缩容流程。如针对IaaS(Infrastructure as a Service，基础设施即服务)的相关应用，可以执行自定义的扩容、缩容流程

例如，并发扩缩容执行器可以执行规范化的扩容、缩容流程。如针对大数据、云存储以及IaaS以外其他服务的相关应用，可以执行自定义的扩容、缩容流程。

例如，并发扩缩容执行器可以触发组件统一构建系统、多组件部署系统和组件缩容回收系统。组件统一构建系统、多组件部署系统和组件缩容回收系统对云计算系统的集群进行扩容、缩容的相关处理。

在一些实施例中，组件统一构建系统(如可以包括生成单元)负责编译各资源服务器上线部署的源代码；基于Docker容器为不同资源服务器准备不同的编译环境。组件统一构建系统可以实现编译环境的隔离，使编译所需要的依赖服务互不干扰，从而保证编译工作顺利进行。

在一些实施例中，多组件部署系统(如可以包括执行单元)负责将编译好的程序上线部署到指定的物理服务器或者容器。

例如，多组件部署系统可以包括包部署和镜像部署两种类型。包部署会将编译后的程序上线到指定的物理机；镜像部署会根据编译时打包的运行镜像，并根据所需要的资源(包括运行所需的中央处理器核数、内存大小、硬盘大小等)部署、启动容器。

在一些实施例中，组件缩容回收系统(如可以包括缩容单元、添加单元)负责将缩容的资源回收。

例如，回收的容器资源会重新放到资源池，回收的物理机则会放到备机池。组件缩容回收系统会销毁容器资源，并对回收的物理机进行重新装机、格式化数据盘。

图4示出本公开的集群资源的控制方法的又一些实施例的流程图。

如图4所示，该方法可以包括扩容流程(图中左侧流程)和缩容流程(图中右侧流程)。扩容流程可以包括规范化扩容流程和自定义扩容流程；缩容流程可以包括规范化缩容流程和自定义缩容流程。

例如，与IaaS、云数据库产品相关的各种资源节点(如MySQL资源节点、大容量存储资源节点等)的扩容、缩容处理都属于自定义扩容、缩容流程；与云存储、数据云有关的各种资源节点(如ds2-datanode资源节点、大数据datanode资源节点等)的扩容、缩容处理都属于规范化扩容、缩容流程。

上述产品的扩容、缩容流程均需要经过分配用途(即将待扩容、缩容资源绑定相应的产品应用)、执行前置脚本和执行后置脚本这三个公共流程。可以提取这些公共流程，建立具有高适用性的资源控制方法。

在一些实施例中，规范化扩容流程主要包括：将待扩容备机(资源)挂载到指定产品应用的备机池中；编译构建应用的程序包或者运行镜像；将程序包或者镜像部署到备机池中的服务器；轮询部署结果。例如，数据云产品的扩容流程主要针对大数据datanode资源节点，该规范化扩容流程可以包括如下步骤。

在步骤1中，为扩容主机分配用途。例如，为待扩容的服务器(资源)分配大数据datanode资源节点的tag标记，从而实现待扩容资源与应用的绑定。

在步骤2中，执行前置脚本。例如，多组件扩缩容控制器可以通过调用管控机的FTP(File Transfer Protocol，文件传输协议)目录中数据云的预置脚本(前置脚本)，将待扩容的服务器的IP列表作为命令行参数传递给预置脚本。例如，管控机可以是集群中运行本公开的控制方法的计算机。

通过执行扩容脚本，可以完成待扩容的服务器的初始化工作。预置脚本主要负责初始化扩容物理机，如安装一些基础软件包。

在步骤3中，挂在扩容主机。例如，将待扩容的物理机挂载到产品服务树中相应的产品线的备机池中，方便统一分配资源。例如，可以根据云计算系统内待部署产品的相关信息，将待扩容资源添加到绑定应用所属产品线的资源池中。

在一些实施例中，云计算系统内待部署产品的相关信息可以采用树形结构存储。例如，可以按照部门、产品线、产品、系统、应用的五级树形结构进行存储。

在步骤4中，编译创建数据包。例如，根据应用的部署类型，编译、构建应用的程序包。如大数据datanode资源节点使用的是包部署，则编译出相应的程序包作为处理数据包；对于镜像部署，则将程序包和运行镜像打包在一起生成待处理数据包。将编译构建好的程序包传到备机池中的绑定待扩容机器上，并执行启动脚本。

在步骤5中，轮询扩容结果。例如，可以定时去轮询部署的情况，将部署结果记录到信息管理模块CMDB(Configuration Management Database，配置管理数据库)的部署单元。Web前端可以通过API接口查询部署结果呈现给用户。

在步骤6中，执行后置脚本，以处理扩容后事务。例如，后置脚本可以将扩容的资源节点告知集群中的管理节点，完成集群的扩容。

在一些实施例中，针对云存储扩容流程，主要完成ds2-datanode资源节点扩容，其流程步骤与上面的数据云类似。但是，云存储扩容流程的后置脚本可以进行创建volume(卷)的过程。

在一些实施例中，规范化缩容流程可以包括业务数据检查、依赖服务检查、移出集群、回收资源、轮询结果、执行后置脚本。例如，该规范化缩容流程可以包括如下步骤。

在步骤1中，对待缩容资源进行业务数据检查，以确定待缩容资源中是否存在重要数据。如果存在重要数据，则待缩容资源不支持缩容操作。

在步骤2中，对待缩容资源进行依赖服务检查，已确定上是否存在依赖其运行的服务。如果存在依赖服务，则待缩容资源不支持缩容操作。

在步骤3中，通知集群的管理节点，将待缩容资源移出集群。

在步骤4中，调用组件缩容回收系统，对缩容资源进行回收。

在步骤5中，轮询缩容结果。

在步骤6中，执行后置脚本，处理缩容后事务。例如，可以触发回收资源的PXE装机操作。

在一些实施例中，自定义扩容流程可以包括：将待扩容备机挂载到指定产品应用备机池中；由第三方提供自己的扩容程序(第三方程序)，该扩容程序必须提供两个规范的扩容接口，即触发扩容接口(部署接口)和查询扩容结果接口(查询接口)；多组件扩缩容控制器调用触发扩容接口，将待扩容的备机信息以参数的形式传递过去；通过查询扩容结果接口轮询扩容结果。

例如，针对IaaS产品的应用的自定义扩容流程可以通过下面的步骤实现。

在步骤1中，为扩容主机分配用途。例如，将待扩容的服务器分配IaaS产品应用的资源节点的tag标记。

在步骤2中，执行前置脚本。例如，多组件扩缩容控制器调用管控机de FTP目录中数据云预置脚本，并将扩容机器的IP列表作为命令行参数传递给预置脚本；执行扩容脚本，完成机器的初始化工作。预置脚本主要负责初始化扩容物理机，例如，安装一些基础软件包。

在步骤3中，挂在扩容主机。例如，将待扩容的物理机挂载到产品的服务树中对应产品线的备机池中，供第三方程序统一获取。

在步骤4中，传递扩容主机。例如，多组件扩缩容控制器触发IaaS的部署接口，从信息管理CMDB获取待扩容的服务器的相关信息；以参数的形式将先关信息传递给IaaS产品；IaaS产品部署程序去备机池获取部署的该待扩容的服务器；IaaS部署服务根据自有业务上线部署。

在步骤5中，调用轮询接口。例如，多组件扩缩容控制器定期轮询IaaS扩容结果；将部署结果记录到信息管理模块CMDB的部署单元；Web前端可以通过API接口查询部署结果呈现给用户。

在步骤6中，执行后置脚本。如果产品没有后置脚本，该步骤可为空。

在一些实施例中，自定义缩容流程可以包括业务数据检查、依赖服务检查、调用自定义缩容接口、轮询缩容结果、回收资源到资源池或备机池、执行后置脚本。例如，可以通过如下步骤实现自定义缩容流程。

在步骤3中，调用自定义的缩容接口，传递待缩容资源的相关信息。

在步骤4中，轮询自定义的缩容结果接口(查询接口)，获取缩容结果。

在步骤5中，将回收的资源放入资源池或备机池中。

图5示出本公开的集群资源的控制装置的另一些实施例的示意图。

如图5所示，异构组件资源管理模块主要由服务层和数据层组成，并通过Http(HyperText Transfer Protocol，超文本传输协议)API向其他服务模块和Web前端UI(User Interface，用户界面)提供元数据。Supervisor可以对异构组件资源管理模块进行服务监视。

在一些实施例中，服务层开一个包括API服务器、服务器信息管理单元、容器信息管理单元、产品信息管理单元、编译信息管理单元以及部署信息管理单元。

例如，API服务器可以是基于Golang开发的Http Server(服务器)。API服务器对外提供Restful(Representational State Transfer，表征状态转移)风格的接口，负责将内部管理的数据安全、合法地提供给使用者。

例如，服务器信息管理单元主要负责管理集群内所有物理机信息。物理机信息可以包括管理节点服务器、已使用资源节点服务器以及待扩缩容资源备机。服务器信息管理单元可以管理全量服务器信息可以为之后服务器的部署、配置、回收提供必要的信息。

例如，容器信息管理单元服务管理集群内所有容器信息。容器信息可以包括容器运行使用的中央处理器核数、内存大小、硬盘大小以及所属物理机、产品应用等。

例如，产品信息管理单元负责管理专有云内部署的产品信息。产品信息可以采用树形结构。树形结构可以按照部门、产品线、产品、系统、应用五级结构划分。在扩容、缩容前需要将待扩缩容物理机分配到具体系统应用，以方便集中管理扩缩容流程。

例如，编译信息管理单元负责管理每个产品应用的编译程序。编译信息管理单元可以基于Jenkins开发，支持自动从源代码仓库(gitlab)拉取代码。编译信息管理单元可以根据配置信息，编译构建出应用二进制程序或者镜像(包括运行镜像和程序包)。

例如，部署信息管理单元负责将编译好的程序包或者打包镜像部署到指定的物理机、容器中，并记录所有的部署记录。

数据层可以包括主存储节点、从存储节点和存储器。主存储节点存储服务层发来的各种信息，并同步备份到从存储节点。例如，可以定时将主存储节点中的数据备份到存储器中，以免在主存储节点和从存储节点均被污染的情况下，获取备份数据。

图6示出本公开的集群资源的控制装置的又一些实施例的示意图。

如图6所示，多组件扩缩容控制器可以是通过Golang构建的SSH控制器。各业务线脚本可以与多组件扩缩容控制器的内部结构连接。

在一些实施例中，多组件扩缩容控制器在执行前置脚本和后置脚本的时候，需要借助并发扩缩容执行器来完成。例如，并发扩缩容执行器的底层是基于Golang的高性能SSH并发连接池，连接池中包括与各待扩容资源的SSH连接。

例如，在连接池的基础上可以封装连接物理机、执行脚本命令等一系列操作接口。由于Golang语言的高并发特性，结合上述连接池，可以保证大规模并发地对服务器、容器进行操作，从而提升扩缩容执行的效率。

例如，为了保证操作安全，连接池对于每台待扩容或待缩容的资源(物理机、容器镜像)只建立一个SSH连接，并定期清理掉过期的SSH连接。

图7示出本公开的集群资源的控制方法的一些实施例的示意图。

如图7所示，该方法包括。用户通过向git分布式版本控制系统提交相关代码；git触发Jenkins自动化服务器的编译构建和上线部署流程。例如，编译构建流程的触发可以包括手动触发以及设置用户提交代码后自动触发两种方式。

Jenkins通过Docker进行编译构建和编译镜像，并进行上线部署。例如，可以根据应用的类型产出程序包或者程序镜像。如大数据datanode资源节点使用的是包部署，即编译构建产出的只为程序包，不包含运行镜像；如镜像部署类型，则会将程序包和运行镜像一起打包为程序镜像。

图8示出本公开的集群资源的控制装置的再一些实施例的示意图。

如图8所示，当应用程序编译构建完成后，多组件扩容控制器根据扩容应用的类型，通过并发扩缩容执行器将组件统一构建系统编译构建的数据包传输到待扩容的物理机或者资源池中的空闲机。

在进行物理机程序包扩容的情况下，多组件部署系统执行启动脚本，将程序包部署在专有云集群的物理机上运行，并检查执行状态；在程序镜像部署的情况下，多组件部署系统启动镜像，检查专有云集群的容器运行状态。

图9示出本公开的集群资源的控制装置的再一些实施例的示意图。

如图9所示，根据应用部署的类型，组件缩容回收系统进行容器资源回收和物理机资源回收。在回收的应用是专有云集群的物理机的情况下，组件缩容回收系统将物理机添加到备机池，并调用PXE重装系统；在回收的是专有云集群的程序镜像(容器)的情况下，组件缩容回收系统会销毁容器，并把资源回收到资源池。

在一些实施例中，在缩容前，组件缩容回收系统需要检查缩容服务器或者容器中是否已经存在业务数据；并且，组件缩容回收系统需要检查是否缩容服务器或者容器是否部署了其他应用依赖的服务。在存在业务数据或者依赖服务的情况下，组件缩容回收系统退出缩容流程。

在一些实施例中，为了将物理机上的已部署服务清除，组件回收系统可以启动PXE装机流程，对缩容物理机进行操作系统重装并格式化数据盘后，将缩容资源放入备机池；或者将容器销毁后，将缩容资源放入资源池。

图10示出本公开的集群资源的控制装置的一些实施例的框图。

如图10所示，集群资源的控制装置10包括确定单元101、添加单元102、生成单元103和执行单元104。

确定单元101在待控制资源为待扩容资源的情况下，确定待扩容资源与相应的应用之间的绑定关系。

添加单元102根据绑定关系，将初始化后的待扩容资源添加到相应的应用的资源池中。

在一些实施例中，添加单元102将待扩容资源的相关信息传递给相应的应用的前置脚本，执行前置脚本，以完成待扩容资源的初始化。

生成单元103根据待处理应用的部署类型，生成待处理应用的待执行数据包。

在一些实施例中，在部署类型为包部署的情况下，待扩容资源为物理机，生成单元103生成待处理应用的程序包作为待执行数据包；在部署类型为镜像部署的情况下，待扩容资源为容器镜像，生成单元103生成待处理应用的程序包，并根据该程序包和待处理应用的运行镜像，生成待执行数据包。

执行单元104将待执行数据包部署在待处理应用的资源池中相应的待扩容资源上执行。

在一些实施例中，执行单元104在待扩容资源为物理机的情况下，将待执行数据包发送给物理机执行；执行单元104在待扩容资源为容器镜像的情况下，将待执行数据包发送给相应资源池中的空闲物理机执行。

在一些实施例中，执行单元104获取该待扩容资源的相关信息，通过为待处理应用配置的部署接口，将该待扩容资源的相关信息发送给待处理应用的第三方程序，以便第三方程序根据自己的部署方式，将待执行数据包部署在该待扩容资源上执行。

在一些实施例中，执行单元104执行待处理应用的后置脚本，后置脚本用于以下处理的至少一项：向集群的管理节点返回扩容结果；为相应的扩容资源创建相应的卷；清理扩容处理产生的垃圾。

在一些实施例中，集群资源的控制装置10还包括建立单元105，用于建立与各待扩容资源的SSH连接。SSH连接用于执行相应的应用的各相关脚本。建立单元105在同一时间内只能与每个待扩容资源建立一条SSH连接。

在一些实施例中，建立单元105在相应的应用的待执行数据包执行完毕后，在预设的时间段内保留相应的SSH连接。

在一些实施例中，集群资源的控制装置10还包括缩容单元106，用于在待控制资源为待缩容资源的情况下，判断待缩容资源是否存在重要数据，以及是否存在依赖于待缩容资源的服务；缩容单元106在不存在重要数据，且不存在依赖于待缩容资源的服务的情况下，将待缩容资源从集群中移除。

在一些实施例中，缩容单元106通过轮询配置的查询接口，获取缩容结果。

在一些实施例中，缩容单元106将待缩容资源从集群中移除后，在待缩容资源为物理机的情况下，添加单元102将待缩容资源添加到资源池；在待缩容资源为容器镜像的情况下，缩容单元106销毁该容器镜像，添加单元将待缩容资源添加到资源池。

在一些实施例中，在待缩容资源为物理机的情况下，执行单元104执行缩容处理的后置脚本，后置脚本用于启动装机流程对待缩容资源进行操作系统重装。

图11示出本公开的集群资源的控制装置的另一些实施例的框图。

如图11所示，该实施例的集群资源的控制装置11包括：存储器111以及耦接至该存储器111的处理器112，处理器112被配置为基于存储在存储器111中的指令，执行本公开中任意一个实施例中的集群资源的控制方法。

其中，存储器111例如可以包括系统存储器、固定非易失性存储介质等。系统存储器例如存储有操作系统、应用程序、引导装载程序、数据库以及其他程序等。

图12示出本公开的集群资源的控制装置的又一些实施例的框图。

如图12所示，该实施例的集群资源的控制装置12包括：存储器1210以及耦接至该存储器1210的处理器1220，处理器1220被配置为基于存储在存储器1210中的指令，执行前述任意一个实施例中的集群资源的控制方法。

存储器1210例如可以包括系统存储器、固定非易失性存储介质等。系统存储器例如存储有操作系统、应用程序、引导装载程序以及其他程序等。

集群资源的控制装置12还可以包括输入输出接口1230、网络接口1240、存储接口1250等。这些接口1230、1240、1250以及存储器1210和处理器1220之间例如可以通过总线1260连接。其中，输入输出接口1230为显示器、鼠标、键盘、触摸屏等输入输出设备提供连接接口。网络接口1240为各种联网设备提供连接接口。存储接口1250为SD卡、U盘等外置存储设备提供连接接口。

本领域内的技术人员应当明白，本公开的实施例可提供为方法、系统、或计算机程序产品。因此，本公开可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用非瞬时性存储介质上实施的计算机程序产品的形式。

如图13所示，云计算系统13包括集群资源的控制装置131，用于执行上述任一个实施例中的集群资源的控制方法。

本领域内的技术人员应当明白，本公开的实施例可提供为方法、系统、或计算机程序产品。因此，本公开可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用非瞬时性存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

至此，已经详细描述了根据本公开的。为了避免遮蔽本公开的构思，没有描述本领域所公知的一些细节。本领域技术人员根据上面的描述，完全可以明白如何实施这里公开的技术方案。

可能以许多方式来实现本公开的方法和系统。例如，可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本公开的方法和系统。用于所述方法的步骤的上述顺序仅是为了进行说明，本公开的方法的步骤不限于以上具体描述的顺序，除非以其它方式特别说明。此外，在一些实施例中，还可将本公开实施为记录在记录介质中的程序，这些程序包括用于实现根据本公开的方法的机器可读指令。因而，本公开还覆盖存储用于执行根据本公开的方法的程序的记录介质。

虽然已经通过示例对本公开的一些特定实施例进行了详细说明，但是本领域的技术人员应该理解，以上示例仅是为了进行说明，而不是为了限制本公开的范围。本领域的技术人员应该理解，可在不脱离本公开的范围和精神的情况下，对以上实施例进行修改。本公开的范围由所附权利要求来限定。

Claims

一种集群资源的控制方法，包括：

在待控制资源为待扩容资源的情况下，确定所述待扩容资源与应用之间的绑定关系；

将初始化后的所述待扩容资源添加到与其具有所述绑定关系的相应应用的资源池中；

根据待处理应用的部署类型，生成所述待处理应用的待执行数据包；

将所述待执行数据包部署在所述待处理应用的资源池中的待扩容资源上执行。
根据权利要求1所述的控制方法，其中，所述将初始化后的所述待扩容资源添加到与其具有所述绑定关系的相应应用的资源池中包括：

将所述待扩容资源的相关信息传递给相应应用的前置脚本；

执行所述前置脚本，以完成所述待扩容资源的初始化。
根据权利要求1所述的控制方法，其中，所述生成所述待处理应用的待执行数据包包括：

在所述部署类型为包部署的情况下，确定所述待扩容资源为物理机，生成所述待处理应用的程序包作为所述待执行数据包；

在所述部署类型为镜像部署的情况下，确定所述待扩容资源为容器镜像，生成所述待处理应用的程序包，并根据该程序包和所述待处理应用的运行镜像，生成所述待执行数据包。
根据权利要求3述的控制方法，其中，所述将所述待执行数据包部署在所述待处理应用的资源池中的待扩容资源上执行包括：

在待扩容资源为物理机的情况下，将所述待执行数据包发送给所述物理机执行；

在待扩容资源为容器镜像的情况下，将所述待执行数据包发送给相应资源池中的空闲物理机执行。
根据权利要求1的控制方法，其中，所述将所述待执行数据包部署在所述待处理应用的资源池中的待扩容资源上执行包括：

获取所述资源池中的待扩容资源的相关信息；

通过为所述待处理应用配置的部署接口，将该待扩容资源的相关信息发送给所述待处理应用的第三方程序，以便所述第三方程序根据自己的部署方式，将所述待执行数据包部署在该待扩容资源上执行。
根据权利要求1的控制方法，还包括：

执行所述待处理应用的后置脚本，所述后置脚本用于以下处理的至少一项：

向集群的管理节点返回扩容结果；

为所述资源池中的扩容资源创建卷；

清理扩容处理产生的垃圾。
根据权利要求1的控制方法，还包括：

建立与各待扩容资源的安全壳协议SSH连接，用于执行所述相应应用的各相关脚本，在同一时间内只能与每个待扩容资源建立一条SSH连接。
根据权利要求7的控制方法，还包括：

在所述相应应用的待执行数据包执行完毕后，在预设的时间段内保留相应的SSH连接。
根据权利要求1-8任一项的控制方法，还包括：

在待控制资源为待缩容资源的情况下，判断所述待缩容资源是否存在重要数据，以及是否存在依赖于所述待缩容资源的服务；

在不存在重要数据，且不存在依赖于所述待缩容资源的服务的情况下，将所述待缩容资源从集群中移除。
根据权利要求9的控制方法，其中，所述将所述待缩容资源从集群中移除包括：

通过配置的缩容接口，传递获取的所述待缩容资源的相关信息，以便将所述待缩容资源从集群中移除；

还包括：

通过轮询配置的查询接口，获取缩容结果。
根据权利要求9的控制方法，将所述待缩容资源从集群中移除后，还包括：

在所述待缩容资源为物理机的情况下，将所述待缩容资源添加到资源池；

在所述待缩容资源为容器镜像的情况下，销毁该容器镜像，并将所述待缩容资源添加到资源池。
根据权利要求11的控制方法，还包括：

在所述待缩容资源为物理机的情况下，执行缩容处理的后置脚本，所述后置脚本用于启动装机流程对所述待缩容资源进行操作系统重装。
一种集群资源的控制装置，包括：

确定单元，用于在待控制资源为待扩容资源的情况下，确定所述待扩容资源与应用之间的绑定关系；

添加单元，用于将初始化后的所述待扩容资源添加到与其具有所述绑定关系的相应应用的资源池中；

生成单元，用于根据待处理应用的部署类型，生成所述待处理应用的待执行数据包；

执行单元，用于将所述待执行数据包部署在所述待处理应用的资源池中的待扩容资源上执行。
一种集群资源的控制装置，包括：

存储器；和

耦接至所述存储器的处理器，所述处理器被配置为基于存储在所述存储器中的指令，执行权利要求1-12任一项所述的集群资源的控制方法。
一种云计算系统，包括：

集群资源的控制装置，用于执行权利要求1-12任一项所述的集群资源的控制方法。
一种非易失性计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现权利要求1-12任一项所述的集群资源的控制方法。