CN115080254B

CN115080254B - 一种用于调整计算集群中计算任务资源的方法和系统

Info

Publication number: CN115080254B
Application number: CN202211015992.6A
Authority: CN
Inventors: 王明亮; 徐达
Original assignee: Beijing Vector Stack Technology Co ltd
Current assignee: Beijing Vector Stack Technology Co ltd
Priority date: 2022-08-24
Filing date: 2022-08-24
Publication date: 2023-09-22
Anticipated expiration: 2042-08-24
Also published as: CN115080254A

Abstract

本发明公开一种用于调整计算集群中计算任务资源的方法和系统，属于集群计算、分布式计算、自动化资源管理、资源使用效率技术领域，特别涉及一种用于调整计算集群中计算任务资源的方法，包括：状态转换触发器读取触发策略；状态转换触发器监测工作负载，并根据触发策略评估、设置工作负载的运行状态，使得工作负载的运行状态被设置为“已暂停”时，控制器释放工作负载占用的资源。本发明方案中，工作负载和状态转换触发器两个模块，分别承担的不同的角色，独立运行，使得整个系统能够更加灵活的处理各种场景，并更加鲁棒。本方案可以自由地配置触发策略，以及动态地修改和加载各种触发策略，可维护性高，便于对计算集群进行系统化的统一管理。

Description

一种用于调整计算集群中计算任务资源的方法和系统

技术领域

本发明属于集群计算、分布式计算、自动化资源管理、资源使用效率技术领域，特别涉及一种用于调整计算集群中计算任务资源的方法和系统。

背景技术

在分布式计算集群（例如Kubernetes，Kubernetes是一个流行的主要由 Google贡献的分布式集群计算管理系统）中，一些工作负载和计算任务，例如 Jupyter Notebook、Dask、MPI、Ray 等，长时间地占用分布式集群中的 CPU、内存、GPU 等计算资源，但是并没有在真正地使用这些资源，从而造成资源的闲置和浪费。

现有技术中，通常采用以下几种方式进行资源调配，以避免资源浪费，包括：

纵向扩展，例如 Kubernetes Autoscaler 是指手动或自动地将计算任务声明的所要使用的计算资源增大或减小。这种方案假设计算任务的运行规模可以通过简单的改变RAM/CPU 需求实现。

横向扩展，例如 Horizontal Pod Autoscaler，这种方法是指手动或自动地将计算任务底层的计算节点（在 Kubernetes 中称为 Pod）的个数增加或减小。这种方案假设计算任务的运行规模可以简单的增减运行的副本数目来实现。

自发弹性伸缩，例如 Elastic Jupyter Operator 中，其将一个特定计算任务切割为一个常驻的网页应用和后台计算的模块，并根据需要开启/终止后台的计算模块。这个方式要求每个特定计算任务本身实现触发策略，并仅对当前计算任务适用，缺乏灵活性。

本发明人经研究发现，现有技术方案中，需要针对特定的计算任务进行相应的适配，甚至要求计算任务底层的运算方式进行较大的变动，现有技术方案灵活性差，不具有通用性。

发明内容

为了至少解决上述技术问题，本发明提供了一种用于调整计算集群中计算任务资源的方法和系统。

根据本发明第一方面，提供了一种用于调整计算集群中计算任务资源的方法，包括：

状态转换触发器读取触发策略；

状态转换触发器监测工作负载，并根据触发策略评估、设置工作负载的运行状态，使得工作负载的运行状态被设置为“已暂停”时，控制器释放工作负载占用的资源。

进一步的，

所述触发策略与工作负载适配设置。

进一步的，

所述工作负载的运行状态包括：“已暂停”状态和“繁忙”状态；

当所述工作负载的运行状态被设置为“已暂停”时，保存当前数据，记录进入“已暂停”状态的时间，停止占用资源的底层Pod；当工作负载从“已暂停”状态恢复，即进入“繁忙”状态时，启动 Pod，并恢复数据，记录进入“繁忙”状态的时间。

进一步的，

所述“已暂停”状态包括：“正常”、“节省”、“暂停”，

其中，“正常”状态用于表示工作负载处于全功能，正常运转状态，使用所有申请的资源；

“节省”状态用于表示工作负载处于低资源使用模式，仅申请能够维持其基本功能的计算资源；

“暂停”状态用于表示工作负载处于暂时终止状态，其还能对外部提供一些基本的反馈。

进一步的，所述触发策略包括：当预设时间内未检测到网络流量时，将工作负载暂停，并将工作负载的状态调整为“已暂停”。

进一步的，

所述触发策略包括：在未接收到任何人机交互指令时，将工作负载暂停，并将工作负载的状态调整为“已暂停”。

进一步的，

状态转换触发器读取触发策略；

状态转换触发器监测工作负载，并根据触发策略评估、设置工作负载的运行状态，使得工作负载的运行状态被设置为“已暂停”时，控制器释放工作负载占用的资源；

所述触发策略为在未接收到任何人机交互指令时，将工作负载暂停，并将工作负载的状态调整为“已暂停”；

“暂停”状态用于表示工作负载处于暂时终止状态，其还能对外部提供一些基本的反馈；

根据本发明第二方面，一种用于调整计算集群中计算任务资源的系统，包括：

工作负载和状态转换触发器；

其中，工作负载用于及时报告运行状态；

状态转换触发器，用于读取触发策略；

用于监测工作负载，并根据触发策略评估、设置工作负载的运行状态，使得工作负载的运行状态被设置为“已暂停”时，控制器释放工作负载占用的资源。

根据本发明第三方面，一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现本发明第一方面中任一项所述方法的步骤。

根据本发明第四方面，一种计算机可读存储介质，所述计算机可读存储介质存储有程序，所述程序被执行时，能够实现本发明第一方面中任一项所述的方法。

本发明的有益效果：本发明方案中的工作负载和状态转换触发器两个模块是互相独立的运算过程；状态触发器负责观测工作负载的状态，并评估触发策略。这两个模块分别承担的不同的角色，独立运行，但遵循预设的协议，使得整个系统能够更加灵活的处理各种场景，并更加鲁棒。另外本方案提供了一个通用的接口和工作模式，可以对多种工作负载提供支持，而不是限制在某一类特定的工作负载。进一步地，本方案可以自由地配置针对哪些种类的工作负载执行触发策略，以及动态地修改和加载各种触发策略，具有高度的可维护性，便于管理员对计算集群进行系统化的统一管理。

附图说明

本发明上述的和 / 或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解，其中，

图1为本发明提供的一种用于调整计算集群中计算任务资源的方法流程图；

图2为本发明提供的一种用于调整计算集群中计算任务资源的系统结构示意图。

具体实施方式

下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，仅用于解释本发明，而不能解释为对本发明的限制。

为了更清楚地说明本发明，下面结合优选实施例和附图对本发明做进一步的说明。附图中相似的部件以相同的附图标记进行表示。本领域技术人员应当理解，下面所具体描述的内容是说明性的而非限制性的，不应以此限制本发明的保护范围。

在本发明的第一方面，提供一种用于调整计算集群中计算任务资源的方法，如图1所示，包括：

步骤101：状态转换触发器读取触发策略；

本发明中，系统管理员可以针对不同的工作负载创建对应的触发策略，状态转换触发器读取触发策略。

步骤102：状态转换触发器监测工作负载，并根据触发策略评估、设置工作负载的运行状态，使得工作负载的运行状态被设置为“已暂停”时，控制器释放工作负载占用的资源。

本发明中，当用户创建工作负载后，状态转换触发器负责监测工作负载的运行并评估其运行状态。工作负载的状态也就是运行状态，包括：已暂停状态和繁忙状态。

工作负载即工作负载接口，设置有一个名为“已暂停”的状态，能够支持进入“已暂停”状态以及从“已暂停”状态恢复。通过工作负载接口实现工作负载运行状态的标记以及状态转换时的各种操作，使得工作负载接口实例中工作负载相关的计算由对应的工作负载负责。

本发明中，当工作负载被设置为“已暂停”状态时，保存当前数据，记录进入“已暂停”状态的时间，停止占用资源的底层Pod；当工作负载从“已暂停”状态恢复，即进入“繁忙”状态时，启动 Pod，并恢复数据，记录进入繁忙状态的时间。

在 Kubernetes 中，工作负载接口可以通过定制资源实现。

进一步地，“已暂停”状态扩展为若干个运行状态，运行状态也可以称之为run-mode，包括：“正常（normal）”、“节省(saving)”，“暂停（Suspended)” 三个递进的状态，其中：

“正常”状态用于表示工作负载处于全功能，正常运转状态，使用所有申请的资源；

更进一步的，“正常”、“节省”、“暂停”三个状态按照使用资源由多至少递减，从每个状态到恢复工作所消耗的时间由短至长，并且可以根据场景的需要进行针对性的选择。

当与工作负载相应的触发策略满足条件时，状态转换触发器根据触发策略设置工作负载的状态，以便其控制器释放所占用的资源，提高资源使用效率。

本发明技术方案可以处理一类工作负载，而不是局限于一个特定的工作负载。

在本发明第一方面的另一个实施例中，下面展示一个工作负载的示例，是在Kubernetes 中通过定制资源机制来运行 Jupyter Notebook 服务，其实现了本方案中所定义的工作负载接口。

apiVersion: tensorstack.dev/v1beta1 kind: Notebook metadata:name:notebook-sample spec:runMode: runningtemplate:spec:containers:- image:tensorflowname: exampleresources:requests:cpu: "8"memory: 16.0Gi status:conditions: - type: Idlestatus: "True"reason: "Nobody is using the Notebook."startTime: "2-03-21T07:08:28Z"

在上面的示例中，是一个类型为 Notebook 的 Kubernetes 定制资源，用于运行一个需要占用 8 个 CPU 和 16Gi 内存的容器。其中 spec.runMode 字段表示该Notebook 的实时状态，值可以是 paused（已暂停）、running（运行中）等。

状态转换触发器将会持续监测该 Notebook 的运行状况，可以通过以下方式：

Notebook 自身主动报告的一些指标，例如在 status.conditions 字段中报告，由于没有人正在使用该 Notebook，正处于 Idle（空闲）状态，并报告了 Idle 状态开始的时间。

状态转换触发器自身主动通过监控系统获取到的有关 Notebook 的一些指标，例如访问 Notebook 容器的网络请求数量、Notebook 容器实际使用的 CPU 个数和内存大小。

结合上述两点，管理员可以综合制定触发策略，例如：

Notebook 报告自身处于 Idle（空闲）状态已经超过 5 分钟。

状态转换触发器观测到访问 Notebook 容器的网络请求数量少于 5 个每分钟，或者 Notebook 容器实际使用的 CPU 小于 0.1 个、内存小于 0.1Gi。

当状态转换触发器通过监测发现该 Notebook 满足上述触发策略时，就会修改其spec.runMode 字段的值为 paused（已暂停），如下所示：

apiVersion: tensorstack.dev/v1beta1 kind: Notebook metadata:name:notebook-sample spec:runMode: pausedtemplate:spec:containers:- image:tensorflowname: exampleresources:requests:cpu: "8"memory: 16.0Gi

status:conditions:- type: Idlestatus: "True"reason: Nobody is usingthe Notebook.startTime: "2-03-21T07:08:28Z"

在本发明中，Notebook 控制器会根据该 Notebook 的 spec 变化，执行预先定义好的暂定动作，例如将占用 CPU 和内存的容器直接删除，以释放计算资源。

当状态转换触发器通过监测发现该 Notebook 已经不满足触发策略时，就会修改其 spec.runMode 字段为 running（运行中）。

Notebook 控制器会根据该 Notebook 的 spec 变化，执行预先定义好的恢复动作，例如重新创建一个占用 8 个 CPU 和 16Gi 内存的 Pod。

在本发明的第二方面，提供一种用于调整计算集群中计算任务资源的系统，如图2所示，包括：

工作负载和状态转换触发器；

其中，工作负载用于及时报告运行状态；

进一步地，运行状态，包括：暂停状态和繁忙状态。

工作负载设置有一个名为“已暂停”的状态，能够支持进入“已暂停”状态以及从“已暂停”状态恢复。

本发明中，当工作负载进入“已暂停”状态时，保存当前数据，记录进入“已暂停”状态的时间，停止占用资源的底层Pod；当工作负载从从“已暂停”状态恢复，即进入“繁忙”状态时，启动 Pod，并恢复数据，记录进入繁忙状态的时间。

在 Kubernetes 中，工作负载可以通过定制资源实现。

在本发明中，上述各状态的命名和个数仅为示意，采取不同的名字不影响本方案的有效性的。

状态转换触发器，用于读取触发策略；

还用于监测工作负载，并根据触发策略评估、设置工作负载的运行状态，使得工作负载的运行状态被设置为“已暂停”时，控制器释放工作负载占用的资源。

进一步地，状态转换触发器具体用于负责监测工作负载实例的运行状态，通过预置的触发策略进行评估，并在触发策略满足时，设置工作负载的工作状态（例如设置为已暂停）。

在本发明的另一个实施例中，状态转换触发器可以通过定时任务来规律性地扫描所有的工作负载实例；还可以在 Kubernetes 中，可以通过一个长期运行的控制器来追踪工作负载的变化情况。

另外，状态转换触发器还用于为特定的工作负载创建适配的触发策略。

在本发明另一实施例中，创建一个典型的触发策略，该典型的触发策略包括：当预设时间内未检测到网络流量时，将工作负载暂停，并将工作负载的状态调整为“已暂停”。

该典型的触发策略还可以为，在未接收到任何人机交互指令时，将工作负载暂停，并将工作负载的状态调整为“已暂停”。

状态转换触发器还用于接受新的触发策略；还用于对已有策略进行修改。

在本发明中，状态转换触发器用于向用户提供接口，以获取工作负载的一些统计指标，获取工作负载的整体运行状态。

本技术领域技术人员可以理解，除非特意声明，这里使用的单数形式“一”、 “一个”、 “所述”和“该”也可包括复数形式。应该进一步理解的是，本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和 / 或组件，但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和 / 或它们的组。应该理解，当我们称元件被“连接”或“耦接”到另一元件时，它可以直接连接或耦接到其他元件，或者也可以存在中间元件。此外，这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和 / 或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。

本技术领域技术人员可以理解，除非另外定义，这里使用的所有术语 ( 包括技术术语和科学术语)，具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是，诸如通用字典中定义的那些术语，应该被理解为具有与现有技术的上下文中的意义一致的意义，并且除非像这里一样被特定定义，否则不会用理想化或过于正式的含义来解释。

应当理解，以上借助优选实施例对本发明的技术方案进行的详细说明是示意性的而非限制性的。本领域的普通技术人员在阅读本发明说明书的基础上可以对各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种用于调整计算集群中计算任务资源的方法，其特征在于，包括：

状态转换触发器读取触发策略；

所述触发策略与工作负载适配设置；

当所述工作负载的运行状态被设置为“已暂停”时，保存当前数据，记录进入“已暂停”状态的时间，停止占用资源的底层Pod；当工作负载从“已暂停”状态恢复，即进入“繁忙”状态时，启动 Pod，并恢复数据，记录进入“繁忙”状态的时间；

所述触发策略包括：当预设时间内未检测到网络流量时，将工作负载暂停，并将工作负载的状态调整为“已暂停”；

所述触发策略包括：在未接收到任何人机交互指令时，将工作负载暂停，并将工作负载的状态调整为“已暂停”；

类型为 Notebook 的 Kubernetes 定制资源，用于运行一个需要占用 8 个 CPU 和16Gi 内存的容器；状态转换触发器将会持续监测该 Notebook 的运行状况；

没有人正在使用该 Notebook，正处于空闲状态，并报告了 Idle 状态开始的时间；

状态转换触发器自身主动通过监控系统获取到的有关 Notebook 的指标，包括：访问Notebook 容器的网络请求数量、Notebook 容器实际使用的 CPU 个数和内存大小；

制定触发策略：状态转换触发器观测到访问 Notebook 容器的网络请求数量少于 5个每分钟，或者 Notebook 容器实际使用的 CPU 小于 0.1 个、内存小于 0.1Gi；

当状态转换触发器通过监测发现该 Notebook 满足触发策略时，修改为“已暂停”，

当状态转换触发器通过监测发现该 Notebook 已经不满足触发策略时，就会修改为：“运行中”。

2.一种用于调整计算集群中计算任务资源的系统，其特征在于，包括：

工作负载和状态转换触发器；

其中，工作负载用于及时报告运行状态；

状态转换触发器，用于读取触发策略；

用于监测工作负载，并根据触发策略评估、设置工作负载的运行状态，使得工作负载的运行状态被设置为“已暂停”时，控制器释放工作负载占用的资源；

所述触发策略与工作负载适配设置；

3.一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，

所述处理器执行所述程序时实现权利要求1所述方法的步骤。

4.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有程序，所述程序被执行时，能够实现如权利要求1所述的方法。