WO2022222975A1

WO2022222975A1 - 负载处理方法、计算节点、计算节点集群及相关设备

Info

Publication number: WO2022222975A1
Application number: PCT/CN2022/088019
Authority: WO
Inventors: 郭雷; 比加利大卫; 胡昊然; 柯晓棣; 彭骞; 杨晔
Original assignee: 华为云计算技术有限公司
Priority date: 2021-04-20
Filing date: 2022-04-20
Publication date: 2022-10-27
Also published as: CN115220862A

Abstract

本申请提供了一种负载处理方法，应用于第一计算节点，该第一计算节点与其他计算节点连接，并且，该第一计算节点与其他计算节点设置在同一计算节点集群。具体的，确定第一计算节点上可用的物理资源和其他计算节点上可用的物理资源，并接收负载运行请求，该负载运行请求用于请求运行目标负载的物理资源，从而第一计算节点判断在第一计算节点上可用的物理资源是否能够满足负载运行请求所请求的物理资源，当能够满足时，从第一计算节点上可用的物理资源中为目标负载分配物理资源。而当不能满足时，将负载运行请求转发至第二计算节点。如此，可以降低调度系统调度物理资源所需的计算量以及调度难度，进而可以增加计算节点集群的规模。

Description

负载处理方法、计算节点、计算节点集群及相关设备

技术领域

本申请涉及云计算技术领域，尤其涉及一种负载处理方法、计算节点、计算节点集群及相关设备。

背景技术

在公有云系统或者私有云系统等计算节点集群中，通常包括多个物理计算节点以及资源管理调度节点。其中，每个计算节点上可以运行属于一个或者多个租户的负载，该负载可以以虚拟机(virtual machine，VM)、容器或者进程等方式运行；资源管理调度节点可以将各个计算节点上的资源纳入管理，并调度计算节点上的资源来运行该计算节点上的负载。

实际应用场景中，计算节点集群中资源管理调度节点的数据处理能力通常有限，这使得当计算节点的数量达到一定程度时，资源管理调度节点对于计算节点的管理以及资源调度的性能难以达到较高水平，从而限制了计算节点集群的规模。

发明内容

本申请提供了一种负载处理方法，用于增加计算节点集群的规模。此外，本申请还提供了一种计算节点、计算节点集群、计算机可读存储介质以及计算机程序产品。

第一方面，本申请提供了一种负载处理方法，该方法应用于第一计算节点，该第一计算节点与其他计算节点连接，并且，该第一计算节点与其他计算节点设置在同一计算节点集群；第一计算节点在执行该负载处理方法时，确定第一计算节点上可用的物理资源和其他计算节点上可用的物理资源，并接收负载运行请求，该负载运行请求用于请求运行目标负载的物理资源，从而第一计算节点判断在第一计算节点上可用的物理资源是否满足负载运行请求所请求的物理资源；在第一计算节点上可用的物理资源满足负载运行请求所请求的物理资源的情况下，从第一计算节点上可用的物理资源中为目标负载分配负载运行请求所请求的物理资源；在第一计算节点上可用的物理资源不满足负载运行请求所请求的物理资源的情况下，从其他计算节点中选择可用的物理资源满足负载运行请求所请求的物理资源的第二计算节点，并将该负载运行请求转发至第二计算节点。

由于是由第一计算节点为目标负载进行细粒度的物理资源调度，并且，在第一计算节点上可用的物理资源不满足创建目标负载所需的物理资源时，第一计算节点可以将负载运行请求转发至其他具有足够物理资源的计算节点中，以便由其他计算节点利用自身的物理资源创建该目标负载。这样，调度系统仅需指示第一计算节点为该目标负载进行物理资源调度，而无需执行复杂的计算过程来确定分配给该负载的具体物理资源，也无需确定接收负载运行请求的第一计算节点是否具有足够的物理资源来创建负载(由第一计算节点自动计算并确定)，从而可以降低调度系统调度物理资源所需的计算量以及调度难度，进而调度系统可以管理和调度更多数量的计算节点，也即增加了计算节点集群的规模。

在一种可能的实施方式中，第一计算节点与调度系统连接，并且，第一计算节点在接收负载运行请求时，具体可以是接收调度系统发送的负载运行请求。如此，第一计算节点在调度系统的调度下，创建并运行目标负载。

其中，调度系统可先获取租户指定的待创建的虚拟实例的规格，举例而言，调度系统可提供配置界面，让租户远程登录配置界面，在配置界面输入待创建的虚拟实例的类型和规格，此时调度系统无需根据该规格在计算节点集群中计算出具有合适的空闲资源的计算节点，而是直接将第一计算节点作为默认的计算节点，向第一计算节点发送指示该规格的负载运行请求，其中该负载运行请求用于请求运行目标负载(即虚拟实例)的与规格匹配的物理资源，再由第一计算节点负责在计算节点集群中计算出具有合适的空闲资源的计算节点(包括第一计算节点自身)，因此调度运算的工作交由第一计算节点完成，调度系统可以避免进行直接的调度运算，从而降低调度系统调度物理资源所需的计算量以及调度难度。

其中，虚拟实例例如为虚拟机或容器。

在一种可能的实施方式中，调度系统设置在公有云的数据中心，而第一计算节点所在的计算节点集群设置在与公有云的数据中心远程连接的边缘云数据中心，如此，通过第一计算节点在边缘云的自动调度，可以实现增加部署于边缘云的计算节点集群的规模，而公有云的调度系统无需为边缘云付出过多的调度算力。

在一种可能的实施方式中，调度系统以及第一计算节点所在的计算节点集群均设置在公有云的数据中心，如此，通过第一计算节点的自动调度，可以实现增加部署于公有云的计算节点集群的规模。

在一种可能的实施方式中，调度系统包括虚拟机调度系统以及容器调度系统。这样，当需要为租户在集群节点集群中的第一计算节点或者其他计算节点上创建虚拟机时，可以由虚拟机调度系统生成针对虚拟机的负载运行请求，并将其发送给第一计算节点，而当需要为租户在集群节点集群中的第一计算节点或者其他计算节点上创建容器时，可以由容器调度系统生成针对容器的负载运行请求，并将其发送给第一计算节点。

在一种可能的实施方式中，从第一计算节点上可用的物理资源中为目标负载分配负载运行请求所请求的物理资源后，第一计算节点可以向调度系统发送响应信息，该响应信息用于通知调度系统该负载运行请求所请求的物理资源已经在第一计算节点上扣减，从而调度系统可以更新第一计算节点上可用的物理资源，以便调度系统在请求创建下一个负载时，可以根据创建下一个负载所需的物理资源以及更新后的第一计算节点上可用的物理资源，确定第一计算节点是否能够调度足够的物理资源来支持下一个负载的创建和运行。

在一种可能的实施方式中，第一计算节点在接收负载运行请求之前，可以向调度系统发送可用的物理资源总量，该可用的物理资源总量包括第一计算节点上的可用的物理资源的资源量以及其他计算节点上可用的物理资源的资源量之和，如此，调度系统可以根据第一计算节点上报的可用的物理资源总量确定是否具有足够的物理资源来创建目标负载。

在一种可能的实施方式中，第一计算节点在接收负载运行请求时，具体可以是接收第一计算节点所在的计算节点集群中的第三计算节点转发的负载运行请求，该第三计算节点上可用的物理资源不满足负载运行请求所请求的物理资源，如此，第一计算节点不仅可以将负载运行请求转发给其他计算节点，也可以是在其他计算节点上的可用的物理资源不足时，接收其他计算节点发送的负载运行请求，并利用其上可用的物理资源创建该负载运行请求所对应的负载。

如上所述，调度系统可先获取租户指定的待创建的虚拟实例的规格，举例而言，调度系统可提供配置界面，让租户远程登录配置界面，在配置界面输入待创建的虚拟实例的类型和规格，此时调度系统无需根据该规格在计算节点集群中计算出具有合适的空闲资源的计算节点，而是直接将第三计算节点作为默认的计算节点，向第三计算节点发送指示该规格的负载运行请求，其中该负载运行请求用于请求运行目标负载(即虚拟实例)的与规格匹配的物理资源，再由第三计算节点负责在计算节点集群中计算出具有合适的空闲资源的计算节点(包括第三计算节点自身)，因此调度运算的工作交由第三计算节点完成，调度系统可以避免进行直接的调度运算，从而降低调度系统调度物理资源所需的计算量以及调度难度。

在本实施方式中，第三计算节点负责在计算节点集群中计算出具有合适的空闲资源的计算节点为第一计算节点，因此发送负载运行请求至第一计算节点。

在一种可能的实施方式中，第一计算节点所接收的负载运行请求中携带有目标负载的类型，其中，该目标负载的类型包括虚拟机和容器，则第一计算节点还可以判断所要创建的目标负载的类型为虚拟机或容器，并且，在第一计算节点上可用的物理资源满足该负载运行请求所请求的物理资源的情况下，在目标负载的类型为虚拟机时，根据分配的负载运行请求所请求的物理资源在第一计算节点创建虚拟机，而在目标负载的类型为容器时，根据分配的负载运行请求所请求的物理资源在第一计算节点创建容器。如此，可以实现在第一计算节点上创建多种不同类型的负载。

在一种可能的实施方式中，第一计算节点在确定其他计算节点上可用的物理资源时，具体可以是先采集其他计算节点的物理资源总量以及其他计算节点已使用的物理资源，并根据其他计算节点的物理资源总量以及其他计算节点已使用的物理资源，确定其他计算节点上可用的物理资源，具体可以是从其他计算节点的物理资源总量扣减该已使用的物理资源，从而剩余的物理资源即可以是其他计算节点上可用的物理资源。

在一种可能的实施方式中，在第一计算节点上可用的物理资源满足负载运行请求所请求的物理资源的情况下，从第一计算节点上可用的物理资源中为目标负载分配的物理资源为第一物理资源；则，当第一计算节点满足重调度条件时，释放该第一物理资源，并从第一计算节点上可用的物理资源中重新为目标负载分配第二物理资源，该第二物理资源与第一物理资源不同，如此，第一计算节点可以根据实际应用的需求重新为负载分配物理资源，从而可以提高第一计算节点分配物理资源的合理性以及资源利用率。

示例性地，第二物理资源的规格与第一物理资源的规格存在差异，或者，第二物理资源包括的资源类型与第一物理资源包括的资源类型存在差异，或者，第二物理资源的性能与第一物理资源的性能存在差异等。

第二方面，本申请提供一种负载处理装置，所述负载处理装置应用于第一计算节点，所述第一计算节点与其他计算节点连接，所述第一计算节点和所述其他计算节点设置在同一计算节点集群，所述负载处理装置包括：资源管理模块，用于确定所述第一计算节点上可用的物理资源和所述其他计算节点上可用的物理资源；通信模块，用于接收负载运行请求，所述负载运行请求用于请求运行目标负载的物理资源；调度模块，用于判断在所述第一计算节点上可用的物理资源是否满足所述负载运行请求所请求的所述物理资源，在所述第一计算节点上可用的物理资源满足所述负载运行请求所请求的所述物理资源的情况下，从所述第一计算节点上可用的物理资源中为所述目标负载分配所述负载运行请求所请求的物理资源，在所述第一计算节点上可用的物理资源不满足所述负载运行请求所请求的所述物理资源的情况下，从所述其他计算节点中选择可用的物理资源满足所述负载运行请求所请求的所述物理资源的第二计算节点，并将所述负载运行请求转发至所述第二计算节点。

在一种可能的实施方式中，所述第一计算节点与调度系统连接，所述通信模块，具体用于接收所述调度系统发送的所述负载运行请求。

在一种可能的实施方式中，所述调度系统设置在公有云的数据中心，所述计算节点集群设置在与所述公有云的数据中心远程连接的边缘云数据中心。

在一种可能的实施方式中，所述调度系统以及所述计算节点集群均设置在所述公有云的数据中心。

在一种可能的实施方式中，所述调度系统包括虚拟机调度系统和容器调度系统。

在一种可能的实施方式中，所述通信模块，还用于从所述第一计算节点上可用的物理资源中为所述目标负载分配所述负载运行请求所请求的物理资源之后，向所述调度系统发送响应信息，其中，所述响应信息用于通知所述调度系统所述负载运行请求所请求的所述物理资源已在所述第一计算节点上扣减。

在一种可能的实施方式中，所述通信模块，还用于在接收所述负载运行请求之前，向所述调度系统发送可用的物理资源总量，所述可用的物理资源总量包括所述第一计算节点上的可用的物理资源的资源量以及所述其他计算节点上可用的物理资源的资源量之和。

在一种可能的实施方式中，所述通信模块，具体用于接收所述计算节点集群中的第三计算节点转发的所述负载运行请求，其中，所述第三计算节点上可用的物理资源不满足所述负载运行请求所请求的所述物理资源。

在一种可能的实施方式中，所述负载运行请求携带有所述目标负载的类型，其中所述目标负载的类型包括虚拟机和容器，所述负载处理装置还包括控制模块；所述控制模块，具体用于：判断所述目标负载的类型为虚拟机或容器；在所述第一计算节点上可用的物理资源满足所述负载运行请求所请求的所述物理资源的情况下，在所述目标负载的类型为虚拟机时，根据分配的所述负载运行请求所请求的物理资源在所述第一计算节点创建虚拟机，在所述目标负载的类型为容器时，根据分配的所述负载运行请求所请求的物理资源在所述第一计算节点创建容器。

在一种可能的实施方式中，所述资源管理模块，具体用于：采集所述其他计算节点的物理资源总量以及所述其他计算节点已使用的物理资源；根据所述其他计算节点的物理资源总量以及所述其他计算节点已使用的物理资源，确定所述其他计算节点上可用的物理资源。

在一种可能的实施方式中，在所述第一计算节点上可用的物理资源满足所述负载运行请求所请求的所述物理资源的情况下，从所述第一计算节点上可用的物理资源中为所述目标负载分配的物理资源为第一物理资源；所述调度模块，还用于：当所述第一计算节点满足重调度条件时，释放所述第一物理资源；从所述第一计算节点上可用的物理资源中重新为所述目标负载分配第二物理资源，所述第二物理资源与所述第一物理资源不同。

第三方面，本申请提供一种计算节点，所述计算节点包括处理器和存储器；该存储器用于存储指令，当该计算节点运行时，该处理器执行该存储器存储的该指令，以使该计算节点执行上述第一方面或第一方面任一种可能实现方式中的负载处理方法。需要说明的是，该存储器可以集成于处理器中，也可以是独立于处理器之外。计算节点还可以包括总线。其中，处理器通过总线连接存储器。其中，存储器可以包括可读存储器以及随机存取存储器。

第四方面，本申请提供一种计算节点集群，其特征在于，所述计算节点集群包括多个计算节点，所述多个计算节点中的一个或者多个计算节点执行上述第一方面或第一方面任一种可能实现方式中的负载处理方法。

第五方面，本申请提供一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当其在计算机设备上运行时，使得计算机设备执行上述第一方面或第一方面的任一种实现方式所述的方法。

第六方面，本申请提供了一种包含指令的计算机程序产品，当其在计算机设备上运行时，使得计算机设备执行上述第一方面或第一方面的任一种实现方式所述的方法。

本申请在上述各方面提供的实现方式的基础上，还可以进行进一步组合以提供更多实现方式。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请中记载的一些实施例，对于本领域普通技术人员来讲，还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种计算节点集群的架构示意图；

图2为本申请实施例提供的一种计算节点200的结构示意图；

图3为在计算节点200上重调度物理资源的示意图；

图4为本申请实施例提供的另一种计算节点200的结构示意图；

图5为本申请实施例提供的一种负载处理方法的流程示意图；

图6为本申请实施例提供的另一种负载处理方法的流程示意图；

图7为本申请实施例提供的一种负载处理装置700的结构示意图；

图8为本申请实施例提供的一种计算节点800的结构示意图。

具体实施方式

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解，这样使用的术语在适当情况下可以互换，这仅仅是描述本申请的实施例中对相同属性的对象在描述时所采用的区分方式。

参见图1，为一种计算节点集群的示例性架构。如图1所示，该计算节点集群包括多个计算节点，该多个计算节点中包括计算节点200、计算节点300以及计算节点400等。并且，该多个计算节点可以被调度系统100进行资源管理和调度。本实施例中，对于计算节点集群所包括的计算节点的数量并不进行限定。实际应用时，各个计算节点，均可以通过服务器等计算设备实现。调度系统100可以运行在一个或者多个设备上，用于管理一个或者多个计算节点集群的物理资源。

其中，计算节点200、计算节点300以及计算节点400可以周期性的向调度系统100上报自身的资源使用情况。以计算节点200为例，其可以向调度系统100上报计算节点200内部的各种物理资源(如计算节点200包括的处理器的数量，每个处理器中的处理器核的数量、内存的大小等)，以及当前运行在计算节点200上的负载所分配到的物理资源(如分配给各个负载的处理器以及内存等)。

计算节点例如为物理服务器，值得注意的是，计算节点也可以是具有一定运算能力的任何计算机。

当需要为租户创建新的负载时，若由调度系统100在计算节点200、计算节点300或者计算节点400上为该负载分配物理资源，具体是对计算节点200或计算节点300上的物理资源进行细粒度的调度，如调度系统100需要指定该负载运行在计算节点200的哪个或者哪些处理器(如CPU、GPU等)，并具体指定该处理器上的哪些处理器核(core)负责运行该负载，同时，还指定将计算节点200的内存中的哪些内存空间分配给该负载等。则，当计算节点集群中包括的计算节点数量越多时，调度系统100在多个计算节点中选择一个目标计算节点，利用该目标计算节点为该负载调度物理资源所需的计算量也会越大，调度物理资源的难度也就越高，从而影响调度速度，并基于此顾虑，一定程度限制了计算节点集群的规模。

其中，负载例如为公有云上的各种虚拟实例，例如为虚拟机或容器。

进一步，调度系统可以提供配置界面或应用程序编程接口，配置界面或应用程序编程接口用于获取租户输入的负载的类型(例如虚拟机或容器)和规格(例如CPU核数量和内存大小)。

基于此，本申请实施例提供了一种负载处理方法，用以提高在计算节点集群中调度物理资源的速度，并增大计算节点集群的规模。具体的，调度系统100在为租户申请的负载调度与租户指定的负载的规格匹配的物理资源时，可以根据计算节点200(此处以计算节点200为例)所记录的可用的物理资源的总量，确定可用的物理资源的总量是否能够满足用户申请的新负载所需的物理资源的资源量，并且在确定能够满足时，直接向计算节点200发送要求所需的物理资源的负载运行请求。计算节点200具有物理资源的调度能力，并可以预先确定计算节点200上可用的物理资源以及计算节点集群中其他计算节点上可用的物理资源。其中，计算节点200上可用的物理资源以及计算节点300、计算节点400、计算节点500、计算节点600上可用的物理资源的资源量之和，即为上述计算节点200所记录的可用的物理资源的总量。然后，计算节点200可以根据接收到的负载运行请求，判断计算节点200上可用的物理资源是否能够满足该负载运行请求所请求的物理资源，并在计算节点200上可用的物理资源能够满足该负载运行请求所请求的物理资源的情况下，从计算节点200可用的物理资源中为该负载分配负载运行请求所请求的物理资源，以便计算节点200能够进一步利用分配的物理资源运行该负载。而在计算节点200上可用的物理资源不满足该负载运行请求所请求的物理资源的情况下，从计算节点集群中选择选择可用的物理资源满足该负载运行请求所请求的物理资源的计算节点300(此处以计算节点300为例)，并将该负载运行请求转发至计算节点300，以便计算节点300基于该负载运行请求为该负载分配物理资源。

由于在为该新的负载调度物理资源的过程中，是由计算节点200为该负载进行细粒度的物理资源调度，即由计算节点200自主调度该负载运行在哪个处理器、由哪些处理器核运行负载以及将哪些内存空间分配给该负载等。并且，在计算节点200上可用的物理资源不满足创建该新的负载所需的物理资源时，计算节点200可以将负载运行请求转发至其他具有足够物理资源的计算节点300中，以便由计算节点300利用自身的物理资源创建该负载。这样，调度系统100仅需指示计算节点200为该负载进行物理资源调度，而无需执行复杂的计算过程来确定分配给该负载的具体物理资源，也无需确定接收负载运行请求的计算节点200是否具有足够的物理资源来创建负载(由计算节点200自动计算并确定)，从而可以降低调度系统100调度物理资源所需的计算量以及调度难度，进而调度系统100可以管理和调度更多数量的计算节点，也即增加了计算节点集群的规模。

实际应用场景中，图1所示的计算节点集群可以部署为公有云或者边缘云。其中，当基于该计算节点集群部署公有云时，该公有云的形态可以包括以公有云数据中心为核心的公有云，边缘云的形态为以基站数据中心为核心的边缘云、以大企业数据中心为核心的企业云、以及以轻量边缘站点数据中心为核心的小型边缘云等。本实施例中，对于如1所示的计算节点集群在实际应用场景中的具体部署形态并不进行限定。作为一种示例，调度系统100以及计算节点集群可以部署于相同的云环境中，如调度系统100以及计算节点集群可以全部设置在公有云的数据中心。而在另一种示例中，调度系统100以及计算节点集群可以分开部署，例如，调度系统100可以设置在公有云的数据中心，而计算节点集群可以设置在与公有云的数据中心远程连接的边缘云数据中心。

值得注意的是，计算节点集群的数量可以是多个，调度系统100可分别与多个计算节点集群连接，调度系统100可选择某个计算节点集群，并向某个计算节点集群中的预定计算节点发送负载运行请求，由该计算节点在本计算节点集群内进行调度运算，从而选出适合运行虚拟实例的计算节点，由于调度系统100无需实现复杂的调度运算，使得调度系统100可支持的计算节点集群数量更多。

可选地，调度系统100可提供配置界面或应用程序编程接口以供租户选择特定的计算节点集群，如边缘云1、边缘云2等，边缘云1表示设置在边缘云数据中心1的计算节点集群，边缘云2表示设置在边缘云数据中心2的计算节点集群。在图1所示的计算节点集群的基础上，参见图2，为本申请实施例中提供一种该集群节点集群中的计算节点200的结构示意图。如图2所示，计算节点200可以包括资源管理模块201、通信模块202、调度模块203、控制模块204。计算节点200可以与其他计算节点连接，以便基于该连接实现与其他计算节点之间的数据通信。本实施例中，其他计算节点可以指计算节点集群中除计算节点200以外的一个或者多个计算节点，如图2中的计算节点300以及计算节点400等。值得注意的是，调度系统100可以位于计算节点集群外部，如图2所示，而在其他可能的实施方式中，调度系统100也可以是位于计算节点集群内部。本实施例对此并不进行限定。

资源管理模块201用于对计算节点200上可用的物理资源进行管理，该物理资源例如可以包括计算资源、存储资源以及网络资源等。其中，计算资源，包括处理器以及内存，其中，处理器例如可以是中央处理器(central processing unit，CPU)、图形处理器(graphics processing unit，GPU)等，并且，每个处理器可以包括一个或者多个处理器核。存储资源，例如可以是云磁盘。网络资源，例如可以是数据通信时所采用的连链路带宽、网口等、弹性公网IP、弹性网卡等。并且，计算节点200上可用的物理资源，可以是指计算节点200上未被分配的剩余物理资源。

实际应用时，资源管理模块201可以采集计算节点200内部的物理资源的总量信息，并对已经分配给运行在该计算节点200上的负载的物理资源进行记录，从而资源管理模块201可以确定计算节点200上当前未被分配给任意负载的物理资源，以下称之为可用的物理资源。进一步的，资源管理模块201所确定的可用的物理资源中，还可以包括已经分配给负载但是该负载在运行时并未使用的物理资源。这样，对于该部分暂未被负载所使用的物理资源，可以在一定时间段内被调度给其他负载进行复用。如此，可以提高计算节点200上的资源利用率。

同时，资源管理模块201还可以基于计算节点200与其他计算节点之间的通信连接，采集其他计算节点上可用的物理资源。与确定计算节点200上可用的物理资源的实现方式类似，资源管理模块201可以采集其他计算节点中的计算节点300以及计算节点400中的物理资源的总量信息以及已经分配的物理资源的信息，从而资源管理模块201可以根据各个计算节点中的物理资源的总量信息以及已经分配的物理资源的信息，分别确定计算节点300中可用的物理资源以及计算节点400中可用的物理资源。当然，在其他可能的实施方式中，计算节点300以及计算节点400可以预先根据自身的物理资源的总量信息以及已经分配的物理资源的信息，确定出各自可用的物理资源，从而资源管理模块201通过其与计算节点300、计算节点400之间的通信连接，获取计算节点300上已经确定的可用的物理资源的信息以及计算节点400上已经确定的可用的物理资源的信息。

进一步的，资源管理模块201可以根据获取的计算节点200上可用的物理资源以及其他计算节点上可用的物理资源，计算出可用的物理资源的总量，并将该可用的物理资源总量上报给调度系统100，如上报计算节点200当前剩余的处理器核的总量、剩余内存的总量、云磁盘的总量、可用带宽总量等。这样，当调度系统100需要为租户创建新的负载(以下称之为目标负载)时，可以根据租户所指定的规格，确定创建目标负载所需的物理资源的资源量，并且当该物理资源的资源量小于计算节点200上报的可用的物理资源的总量时，调度系统100可以为该目标负载生成负载运行请求，并将该负载运行请求发送给计算节点200，以请求计算节点200利用相应的物理资源创建并运行目标负载。

通信模块202，用于接收负载运行请求，该负载运行请求用于请求计算节点200运行目标负载。示例性地，负载运行请求，可以包括目标负载的类型、优先级、运行目标负载所需的物理资源的种类和数量、以及目标负载运行的时间段等。其中，目标负载的类型，例如可以是虚拟机、容器和进程等类型。目标负载的优先级，可以用于指示计算节点200创建目标负载的优先程度。比如，当调度系统100同时向计算节点200发送针对目标负载的负载运行请求以及针对其他负载的负载运行请求时，若目标负载的优先级高于其他负载的优先级，则计算节点200可以优先为目标负载分配物理资源。实际应用时，该负载运行请求中也可以是包括上述信息中的任意一种或多种。或者，负载运行请求还可以包括其他信息，如包括运行该负载的可替换的物理资源。比如，当计算节点200上剩余的GPU资源不足以运行该负载时，计算节点200可以利用CPU资源来支持该负载的运行。然后，通信模块202可以将接收到的负载运行请求提供给调度模块203。

调度模块203在接收到负载运行请求后，可以解析出目标负载的类型、优先级、物理资源的种类和数量以及运行时间段等信息，并向资源管理模块201查询当前计算节点200的可用的物理资源。然后，调度模块203根据解析得到的信息，进一步判断查询到的计算节点200的可用物理资源是否能够满足运行目标负载所需的物理资源。若能够满足，则调度模块203可以从计算节点200上可用的物理资源中选取相应的第一物理资源。例如，当负载运行请求指示了目标负载的优先级时，调度模块203可以根据该优先级的高低确定为目标负载分配第一物理资源的顺序；当负载运行请求指示了物理资源的种类以及数量时，调度模块203可以选取对应类别以及对应数量的物理资源作为第一物理资源；当负载运行请求指示了运行时间段时，调度模块203可以选取在该运行时间段内不被其他负载所使用的物理资源作为第一物理资源。然后，调度模块203将选取的第一物理资源分配给目标负载，例如可以是建立目标负载与第一物理资源的关联关系等。此时，资源管理模块201可以在确定的可用物理资源中扣除已经分配给目标负载的第一物理资源。进一步的，资源管理模块201还可以通过通信模块202向调度系统100发送响应信息，该响应信息用于通知调度系统100该负载运行请求所请求的物理资源已经在计算节点200上完成扣减，从而调度系统100可以根据负载运行请求所请求的物理资源的资源量，对计算节点200上报的可用的物理资源的总量进行相应的扣减。

实际应用时，调度模块203可以预先配置有相应的资源调度策略，从而在为目标负载调度物理资源时，调度模块203根据负载运行请求选择合适的资源调度策略，从而在满足负载运行请求所请求的物理资源的情况，基于该资源调度策略从可用物理资源中为目标负载调度第一物理资源。

作为一些示例，资源调度策略例如可以是均衡调度策略，即在为目标负载调度第一物理资源时，已经分配给各个负载的物理资源在计算节点200上均衡化分布。以计算资源为例，假设计算节点200上包括处理器1以及处理器2，并且每个处理器中可以包括多个处理器核，则调度模块203在将处理器1中的部分处理器核分配给负载1后，即使处理器1中还存在未被分配的剩余处理器核，调度模块203也可以根据该均衡策略将处理器2中的部分处理器核分配给负载2。如此，处理器1以及处理器2上均存在部分处理器核被分配给计算节点200上的负载。

或者，资源调度策略例如可以是顺序调度策略，即在为目标负载调度第一物理资源时，可以将计算节点200上的物理资源顺序调度给该目标负载。仍以为负载分配处理器核为例，调度模块203在将处理器1中的部分处理器核分配给负载1后，由于处理器1中还存在未被分配的剩余处理器核，则调度模块203可以优先将处理器1中未被分配的剩余处理器核分配给负载2。并且，若分配给负载2的处理器核的数量满足负载2的运行所需，则针对负载2的计算资源调度结束，此时，处理器1以及处理器2中针对处理器核的资源分配情况并不均衡。而若分配给负载的处理器核的数量仍然不满足负载2的运行所需，则调度模块203可以继续将处理器2中的处理器核分配给负载2。当然，实际应用时，资源调度策略也可以是采用其他可能的实施方式，如随机选择物理资源进行调度等，本实施例对此并不进行限定。

实际应用场景中，计算节点200还可以包括控制模块204，并且，调度模块203在基于负载运行请求为目标负载分配第一物理资源后，可以将第一物理资源的信息发送给控制模块204。这样，控制模块204可以利用调度模块203所分配的第一物理资源启动运行目标负载，目标负载的类型即为负载运行请求所指示的类型。作为一种实现示例，调度系统100具体可以是虚拟机调度系统，并且，该虚拟机调度系统可以向计算节点200发送创建虚拟机的负载运行请求。这样，控制模块204可以判断目标负载的类型为虚拟机，从而在计算节点200上可用的物理资源能够满足负载运行请求所请求的物理资源的情况下，计算节点200可以根据分配的第一物理资源(也即负载运行请求所请求的物理资源)在计算节点200创建虚拟机。或者，调度系统100具体可以是容器调度系统，并且，该容器调度系统可以向计算节点200发送创建容器的负载运行请求，这样，控制模块204可以判断目标负载的类型为容器，从而在计算节点200上可用的物理资源能够满足负载运行请求所请求的物理资源的情况下，根据分配的第一物理资源(也即负载运行请求所请求的物理资源)在计算节点200创建容器。当然，在其它示例中，调度系统可以同时集成虚拟机调度系统以及容器调度系统的功能，本实施例对此并不进行限定。

另外，当该目标负载结束运行时，如该目标负载的运行时长达到调度系统100所请求的运行时长等，控制模块204还可以停止运行目标负载，并释放分配给目标负载的第一物理资源。此时，资源管理模块201所确定的可用物理资源中可以重新包括该第一物理资源。

进一步地，计算节点200还可以包括监控模块205，该监控模块205用于对计算节点200上当前被使用物理资源进行监控，采集得到资源使用数据，该资源使用数据用于指示运行在计算节点200上的负载在历史时间段(如过去24小时内)使用物理资源的情况。这样，监控模块205可以根据该资源使用数据，预测已经分配给计算节点200上运行的负载但是该负载在未来时间段(如未来24小时内)可能不被使用的物理资源，从而资源管理模块201可以将监控模块205预测的这些不被负载使用的物理资源纳入可用物理资源，以便后续可以将这部分物理资源分配给目标负载并在指定的时间段内进行运行。如此，计算节点200上有限的物理资源可以支持更多数量的负载运行。在另一种示例中，也可以是由资源管理模块201根据监控模块205采集到的资源使用数据预测出未来一段时间内不被负载所使用的物理资源等，本实施例对此并不进行限定。

值得注意的是，计算节点200上可用的物理资源也可能不满足负载运行请求所请求的物理资源。此时，调度模块203可以向资源管理模块201查询其他计算节点上可用的物理资源，从而调度模块203可以根据资源管理模块201反馈的计算节点300上可用的物理资源以及计算节点400上可用的物理资源，确定能够满足负载运行请求所请求的物理资源的计算节点。假设计算节点300上可用的物理资源能够满足负载运行请求所请求的物理资源，则调度模块203可以将通过通信模块202将负载运行请求转发给至计算节点300。这样，计算节点300在接收到该负载运行请求后，可以从自身可用的物理资源中为该负载运行请求分配相应的第一物理资源，并利用该第一物理资源创建并运行目标负载。其中，计算节点300根据接收到的负载运行请求分配第一物理资源并运行目标负载的具体实现方式，与上述计算节点200分配第一物理资源并运行目标负载的具体实现方式类似，可参见前述实施例的相关之处描述，在此不做赘述。

值得注意的是，本实施例中，计算节点200不仅可以从调度系统100中接收到负载运行请求，也可以是从其他计算节点处接收到负载运行请求。比如，在部分应用场景中，调度系统100可以先向计算节点400发送负载运行请求，以请求计算节点400基于该负载运行请求创建目标负载。当计算节点400上可用的物理资源不能满足负载运行请求所请求的物理资源时，计算节点400可以将该负载运行请求转发给能够满足该负载运行请求所请求的物理资源的计算节点200，以便计算节点200利用自身的物理资源基于该负载运行请求创建并运行目标负载。

实际应用时，调度模块203在为计算节点200上的各个负载分配物理资源后，可能会使得计算节点200上存在物理资源碎片。此时，调度模块203可以对计算节点200上各个负载所分配到的物理资源进行重新调度，以此减少计算节点200上的资源碎片率。同时，调度模块203可以通过重新调度多个负载所分配到的物理资源来提升部分负载在运行时的性能。具体实现时，调度模块203在接收到负载运行请求时，可以根据负载运行请求为目标负载分配上述第一物理资源，而当计算节点200满足重调度条件时，调度模块203可以释放该第一物理资源，并从计算节点200上可用的物理资源中重新为该目标负载分配第二物理资源，该第二物理资源与第一物理资源不同。比如，第二物理资源的规格与第一物理资源的规格存在差异，或者，第二物理资源包括的资源类型与第一物理资源包括的资源类型存在差异，或者，第二物理资源的性能与第一物理资源的性能存在差异等。

以计算资源为例，假设计算节点200上包括如图3所示的两个CPU，并且每个 CPU上包括两个非统一内存访问架构(non-uniform memory access，NUMA)节点，每个NUMA节点中集成有8个处理器核，如图3所示的C1至C32。在进行物理资源的初始调度过程中，对于运行在计算节点200上的负载1、负载2以及负载3，调度模块203可以将NUMA0节点中的处理器核C1至C6分配给负载1、将NUMA1节点中的C9至C16以及NUMA2节点中的C17至C20分配给负载2、将NUMA3节点中的C25至C30分配给负载3。这样，计算节点200的NUMA0节点上的处理器核C7至C8、NUMA2节点上的C21至C24、以及NUMA3节点上的C31至C32即为计算节点200中的计算资源碎片，如图3所示。为此，调度模块203可以对分配给负载2以及负载3的物理资源进行重新调度，具体可以将NUMA2节点上的处理器核C17至C24以及NUMA3节点上的C25至28分配给负载3、将NUMA0节点上的处理器核C7至C8以及NUMA3节点上的C29至C32分配给负载2。这样，通过调度模块203对于计算资源的重新调度后，计算节点200上可以剩余完整的NUMA1节点，而在其余NUMA节点上可以不存在计算资源碎片。同时，在对物理资源进行重新调度后，负载3所分配到的新的计算资源全部位于同一CPU，这使得负载3所分配到的处理器核之间可以无需进行跨CPU进行通信，从而可以提高负载3在运行时所具有的性能。

在一些示例中，调度模块203可以是周期性的进行物理资源的重调度，以减少计算节点200上的物理资源碎片；相应的，计算节点200所满足的重调度条件，具体可以是距离上一次执行重调度的时间间隔达到重调度的周期时长等。或者，调度系统100也可以向计算节点200下发重新调度物理资源的指令，从而调度模块203根据该指令执行重新调度物理资源的过程；相应的，计算节点200所满足的重调度条件，具体可以是接收到重调度的指令。又或者，调度模块203可以根据资源管理模块201所确定的计算节点200上可用的物理资源的资源量，当该资源量低于预设阈值时，调度模块203可以主动执行物理资源的重调度过程；相应的，计算节点200所满足的重调度条件，具体可以是计算节点200上可用的物理资源的资源量低于预设阈值。又或者，调度模块203可以根据资源管理模块201所确定的计算节点200上可用的物理资源计算物理资源的碎片率，从而当该碎片率高于预设碎片率时，调度模块203可以主动执行物理资源的重调度过程等；相应的，计算节点200所满足的重调度条件，具体可以是计算节点200的碎片率高于碎片率阈值。又或者，当计算节点200接收到需要提升目标负载在运行时的业务服务质量时，调度模块203可以通过重新调度物理资源的方式提高目标负载的性能，从而提升目标负载对应的业务服务质量；相应的，计算节点200所满足的重调度条件，具体可以是目标负载在运行时的业务服务质量需要被提升。本实施例中，对于如何触发调度模块203重新调度物理资源的具体实现方式并不进行限定。

其中，调度模块203在为各个负载重新调度物理资源时，可以根据监控模块205预测出的各个负载在未来一段时间段内对于物理资源的使用情况，为该各个负载分配适量的物理资源。其中，监控模块205可以根据监控得到的资源使用数据，预测各个负载在未来一段时间段内对于物理资源的使用情况。比如，当监控模块205预测部分负载在未来一段时间内所使用的物理资源小于初始分配该负载的物理资源时，调度模块203在重新为该负载分配物理资源时，可以减少分配的物理资源的资源量。如此，计算节点200上有限的物理资源可以支持更多数量的负载运行。

或者，实际应用场景中，运行在计算节点200上的不同负载为租户提供不同类型的服务，此时，不同负载在运行时所使用的物理资源可能存在较大差异。例如，假设计算节点200上运行有负载1、负载2以及负载3。其中，负载1用于为租户提供文本编辑等办公类服务，负载2用于为租户提供模型训练类型的服务，负载3用于为租户提供数据存储类型的服务。此时，负载1在运行时对于计算资源以及存储资源的需求通常较低；负载2在运行时对于计算资源的需求通常较高，而对于存储资源的需求较低；负载3在运行时对于计算资源的需求较低，而对于存储资源的需求较高。基于此，监控模块205可以根据资源使用数据，对计算节点200上运行的各个负载按照服务类型进行分类，从而调度模块203可以根据各个负载所对应的服务类型，确定重新为各个负载分配的物理资源的资源量。比如，对于负载1，由于该负载实际应用时所使用的计算资源以及存储资源的资源量较小，从而调度模块203在为负载1重新分配物理资源时，可以减少分配的计算资源以及存储资源的资源量。类似的，调度模块203在为负载2重新分配物理资源时，可以减少分配的存储资源的资源量；调度模块203在为负载3重新分配物理资源时，可以减少分配的计算资源的资源量。

进一步的，计算节点200上运行的不同负载之间具有一定的相关性，此时，若其中一个负载对于物理资源的使用情况发生变化，其余负载对于物理资源的使用情况也会发生相应变化。比如，假设计算节点200运行有负载1以及负载2，并且负载2作为负载1的备份，以提高负载1和负载2提供服务的可靠性。此时，若负载1在运行时生成并存储的业务数据的数据量较大时，则从负载1备份至负载2上的业务数据的数据量也较大，也即，负载2对于存储资源的使用需求可以随着负载1对于存储资源的使用需求发生变化而变化。为此，监控模块205根据资源使用数据，对计算节点200上运行的多个负载进行聚合处理，从而调度模块203在为聚合后的多个负载重新调度物理资源时，可以根据该负载的聚合特征，为其分配相应的物理资源。

实际应用时，监控模块205也可以根据监控得到的资源使用数据同时进行上述分类、聚合以及预测处理，从而调度模块203可以根据监控模块205所获得针对各个负载的处理结果(包括分类信息、聚合信息以及预测信息等)，重新为多个负载调度物理资源。

上述图2所示的计算节点200，可以支持一种类型的负载在该计算节点200上运行，而在其他可能的实施例中，计算节点200也可以是同时支持多种类型的负载在其上运行。参阅图4，为另一种计算节点200的结构示意图。如图4所示，该计算节点200仍然可以包括资源管理模块201、通信模块202、调度模块203、控制模块204以及监控模块205。其中，资源管理模块201可以用于管理计算节点200(以及其他计算节点)上的可用物理资源。通信模块202用于接收调度系统100或者其他计算节点发送的负载运行请求，并将该负载运行请求提供给调度模块203。调度模块203可以根据该负载运行请求在计算节点200上调度相应的物理资源并将其分配给目标负载。

与图2所示的计算节点200不同的是，图4所示的计算节点200中，控制模块204可以包括多个控制单元，如图4所示的控制单元1以及控制单元2。其中，不同控制单元用于控制启动以及运行不同类型的负载，如控制单元2041可以控制运行虚拟机类型的负载，控制单元2042可以控制运行容器类型的负载。并且，不同控制单元可以支持不同类型负载所对应的负载控制接口，该不同类型负载所对应的负载控制接口可以由计算节点200上的操作系统进行定义。

因此，在调度模块203为目标负载分配第一物理资源后，控制模块204可以根据负载运行请求所指示的目标负载所属的负载类型，确定与该负载类型对应的控制单元，并进一步通过该控制单元利用分配的第一物理资源启动并运行目标负载。该目标负载(以及运行在计算节点200上的其他负载)在运行时对于物理资源的使用情况，可以由监控模块205进行监控。在图4所示的计算节点200中，由资源管理模块201至监控模块205所构成的计算节点200可以支持多种类型的负载运行以及资源分配，而可以不用为了支持多种类型的负载运行在计算节点200上配置多种调度系统，这可以有效降低计算节点200针对该调度系统的开销，并可以降低整体系统的复杂性。

本实施例中，图2以及图4所示的计算节点200中，资源管理模块201、通信模块202、调度模块203、控制模块204以及监控组件205，可以是通过软件实现，例如可以是运行在计算节点200上的计算机程序，如组件、插件等。其中，当控制模块204通过组件实现时，该控制模块204中的控制单元2041以及控制单元2042可以为预先注册至该控制模块204中的插件等。如控制单元2041可以是基于QEMU的插件，用于支持虚拟机类型的负载运行；控制单元2042可以是基于KATA的插件，用于支持容器类型的负载运行。或者，资源管理模块201、通信模块202、调度模块203、控制模块204以及监控组件205也可以是由硬件实现，如资源管理模块201、调度模块203、控制模块204以及监控组件205可以利用专用集成电路(application-specific integrated circuit，ASIC)实现、或可编程逻辑器件(programmable logic device，PLD)实现的设备等。通信模块202可以利用网卡实现等。其中，上述PLD可以是复杂程序逻辑器件(complex programmable logical device，CPLD)、现场可编程门阵列(field-programmable gate array，FPGA)、通用阵列逻辑(generic array logic，GAL)或其任意组合实现。

需要说明的是，图2以及图4所示的计算节点200所包括的架构，仅作为一种示例性说明，并不用于限定计算节点200的具体实现。例如，在其他可能的实施例中，计算节点200可以包括更多的功能模块以支持计算节点200具有更多其他的功能；或者，计算节点200可以同时支持三种或三种以上类型的负载在该计算节点200上运行等。

为便于理解，下面结合附图，对本申请的实施例进行描述。

参见图5，图5为本申请实施例提供的一种负载处理方法的流程示意图。其中，图5所示的负载处理方法可以应用于图2或图4所示的计算节点200，或者应用于其他可适用的计算节点200中。为便于说明，本实施例中以应用于图2所示的计算节点200为例进行示例性说明。

基于图2所示的计算节点200，图5所示的负载处理方法具体可以包括：

S501：通信模块202接收调度系统100或者其他计算节点发送的负载运行请求。

本实施例中，当计算节点集群需要为租户创建目标负载时，调度系统100可以生成负载运行请求，并将该负载运行请求发送给计算节点200，以请求在计算节点200上为该目标负载调度物理资源并启动运行。实际应用时，计算节点集群中各个计算节点可以周期性的上报自身剩余的物理资源总量信息，从而调度系统100可以根据确定剩余物理资源能够满足该目标负载所需的计算节点200，并将生成的负载运行请求发送给该计算节点200。

而在另一种可能的实施方式中，调度系统100在生成负载运行请求后，可以将该负载运行请求发送给计算节点集群中的预定计算节点，从而该计算节点在接收到该负载运行请求后，可以由该计算节点判断是否具有足够的可用物理资源来支持目标负载的运行。若有，则该计算节点可以为目标负载进行物理资源调度并运行该目标负载。而若没有，则该计算节点可以根据其记录的与计算节点200连接的其他计算节点(如图2中的计算节点300以及计算节点400等)上可用的物理资源，确定计算节点200上可用的物理资源能够满足目标负载所需。此时，该计算节点可以将负载运行请求发送给计算节点200，以便在该计算节点200创建并运行该目标负载。在该实施方式中，计算节点集群可以在局部的多个计算节点中快速实现为目标负载进行物理资源调度，从而可以提高计算节点集群进行资源调度的实时性。

S502：通信模块202将接收到的负载运行请求发送给调度模块203。

S503：调度模块203根据资源管理模块201确定的计算节点200所记录的可用的物理资源，确定是否存在与负载运行请求相匹配的物理资源。若不存在，则执行步骤S504；而若存在，则执行步骤S505。

其中，计算节点200所记录可用的物理资源可以包括计算节点200自身所具有的可用的物理资源，以及与该计算节点200连接的其他一个或者多个计算节点上所具有的可用的物理资源。不同计算节点之间，可以周期性地针对自身所具有的可用的物理资源进行交互并记录，实际应用时，不同计算节点之间可以通过通信模块进行交互。

示例性地，计算节点200上可用的物理资源，例如可以是计算节点200上当前未被分配给任意负载的物理资源。进一步的，可用的物理资源，除了包括未被分配给任意负载的物理资源之外，还可以包括已经分配给负载但是该负载在运行时并未使用的物理资源。其中，物理资源，可以包括计算资源、存储资源以及带宽资源等。

S504：调度模块203拒绝负载运行请求，并结束流程。

实际应用时，在结束流程之前，调度模块203还可以通过通信模块202向调度系统100反馈资源调度失败的通知，以便于调度系统100请求其他计算节点进行物理资源调度。

S505：调度模块203判断与负载运行请求相匹配的物理资源是否位为计算节点200本地的物理资源。若是，则为目标负载分配第一物理资源，并继续执行步骤S508；若否，则继续执行步骤S506。

S506：调度模块203通过通信模块204将负载运行请求转发给具有该物理资源的其他计算节点。

S507：通信模块203确定是否转发成功。若转发成功，则继续执行步骤S508；若转发失败，则继续执行步骤S504。

S508：控制模块204利用分配的第一物理资源，启动目标负载。

S509：资源管理模块201从记录的可用的物理资源中，扣除该为目标负载分配的第一物理资源。

进一步的，当图5所示的负载处理方法应用于图4所示的计算节点200时，控制模块204在启动目标负载的过程中，可以先确定该目标负载所属的负载类型，并根据该负载类型选择与该负载类型相对应的控制单元来启动目标负载。

上述实施例中，是从计算节点200为目标负载调度物理资源的角度进行介绍。实际应用场景中，计算节点200还可以对已经分配给各个负载的物理资源进行重新调度。下面，结合附图对计算节点200重新调度物理资源的具体实现流程进行介绍。

参见图6，为一种重新调度计算节点200上各个负载所分配到的物理资源的流程示意图，该方法可以应用于图2或者图4所示的计算节点200，该方法具体可以包括：

S601：调度模块203确定满足重调度条件。

本实施例中，计算节点200可以在满足预设的重调度条件时，确定重新调度已经分配给计算节点200上运行的负载的物理资源。

作为一些示例，重调度条件，例如可以是接收到调度系统100发送的重调度指令，从而计算节点200可以在该重调度指令的指示下，确定重新调度已经分配给计算节点200上运行的负载的物理资源。比如，当运行在计算节点200上的某个负载需要提升业务服务质量时，调度系统100可以指示计算节点200重新为该负载进行重调度，以此提高该负载在运行时的性能，进而提升负载2对应的业务服务质量。

或者，重调度条件，例如可以是资源管理模块201所确定的可用的物理资源的资源量低于预设阈值，以便计算节点200通过重新调度物理资源来提高分配物理资源的合理性。

又或者，重调度条件，例如可以是计算节点200上物理资源的碎片率低于预设碎片率等，这样，计算节点200通过重新调度物理资源可以减小计算节点200上的物理资源的碎片率。

又或者，计算节点200可以周期性对分配给各个负载的物理资源进行重新调度，则重调度条件，例如可以是计算节点200距离上一次重新调度物理资源的时长达到预设时长(也即重调度周期)。本实施例中，对于重调度条件的具体实现方式并不进行限定。

S602：调度模块203获取资源管理信息以及监控信息，该资源管理信息包括资源管理模块记录的计算节点200上的物理资源总量以及分配给各个负载的物理资源信息，该监控信息包括监控模块205针对运行在计算节点200上各个负载所对应的分类信息、聚合信息以及预测信息。

其中，监控模块205对计算节点200上的各个负载所进行的分类、聚合以及预测处理的具体实现方式，可以参见前述实施例中的相关之处描述，在此不做赘述。

S603：调度模块203判断是否对已经分配给该负载的物理资源进行重新调度。若是，则，继续执行步骤604；若否，则继续执行步骤S607。

实际应用时，调度模块203可以对计算节点200上运行的所有负载进行物理资源重调度，也可以是针对部分负载进行物理资源重调度，比如，调度模块203可以为调度系统100所指定的负载重新调度物理资源等。

S604：调度模块203释放第一物理资源，并为负载重新调度第二物理资源。

在进一步可能的实施方式中，调度模块203在为负载重新调度物理资源之前，还可以查找是否存在相对于当前资源调度策略更加优化的调度方案，该调度方案可以预先设定或者由计算节点200实时生成。其中，该调度方案可以使得负载在运行性能、资源消耗等方面得到优化。若存在，则调度模块203可以基于该调度方案完成对该负载的物理资源重调度，具体可以是先释放已经为负载分配的第一物理资源，并在完成第一物理资源的释放后，从计算节点200当前的可用物理资源中为该负载重新分配第二物理资源。而若不存在，则调度模块203可以基于当前的资源调度策略为负载调度物理资源。

S605：资源管理模块201修正可用的物理资源。

由于调度模块203在为负载重新调度物理资源后，计算节点200上分配给各个负载的物理资源的信息发生变化，因此，资源管理模块201可以根据各个负载重新分配到的物理资源，对重调度之前所记录的资源分配信息进行修正。

S606：控制模块204针对物理资源发生变化的负载，执行负载迁移操作。

具体实现时，控制模块204利用重新分配的物理资源重新运行该负载，以使得该负载基于新分配的物理资源进行运行，完成负载迁移。同时，控制模块204可以释放之前分配给负载的物理资源。

S607：计算节点200上的物理资源重调度过程结束。

基于上述负载处理方法，本申请实施例还提供一种负载处理装置。参阅图7，示出了本申请实施例提供的一种负载处理装置的结构示意图，负载处理装置700可以应用于第一计算节点，该第一计算节点与其他计算节点连接，并且第一计算节点和其他计算节点设置在同一计算节点集群，所述负载处理装置700包括：

资源管理模块701，用于确定所述第一计算节点上可用的物理资源和所述其他计算节点上可用的物理资源；

通信模块702，用于接收负载运行请求，所述负载运行请求用于请求运行目标负载的物理资源；

调度模块703，用于判断在所述第一计算节点上可用的物理资源是否满足所述负载运行请求所请求的所述物理资源，在所述第一计算节点上可用的物理资源满足所述负载运行请求所请求的所述物理资源的情况下，从所述第一计算节点上可用的物理资源中为所述目标负载分配所述负载运行请求所请求的物理资源，在所述第一计算节点上可用的物理资源不满足所述负载运行请求所请求的所述物理资源的情况下，从所述其他计算节点中选择可用的物理资源满足所述负载运行请求所请求的所述物理资源的第二计算节点，并将所述负载运行请求转发至所述第二计算节点。

在一种可能的实施方式中，所述第一计算节点与调度系统连接，所述通信模块702，具体用于接收所述调度系统发送的所述负载运行请求。

在一种可能的实施方式中，所述通信模块702，还用于从所述第一计算节点上可用的物理资源中为所述目标负载分配所述负载运行请求所请求的物理资源之后，向所述调度系统发送响应信息，其中，所述响应信息用于通知所述调度系统所述负载运行请求所请求的所述物理资源已在所述第一计算节点上扣减。

在一种可能的实施方式中，所述通信模块702，还用于在接收所述负载运行请求之前，向所述调度系统发送可用的物理资源总量，所述可用的物理资源总量包括所述第一计算节点上的可用的物理资源的资源量以及所述其他计算节点上可用的物理资源的资源量之和。

在一种可能的实施方式中，所述通信模块702，具体用于接收所述计算节点集群中的第三计算节点转发的所述负载运行请求，其中，所述第三计算节点上可用的物理资源不满足所述负载运行请求所请求的所述物理资源。

在一种可能的实施方式中，所述负载运行请求携带有所述目标负载的类型，其中所述目标负载的类型包括虚拟机和容器，所述负载处理装置还包括控制模块704；

所述控制模块704，具体用于：

判断所述目标负载的类型为虚拟机或容器；

在所述第一计算节点上可用的物理资源满足所述负载运行请求所请求的所述物理资源的情况下，在所述目标负载的类型为虚拟机时，根据分配的所述负载运行请求所请求的物理资源在所述第一计算节点创建虚拟机，在所述目标负载的类型为容器时，根据分配的所述负载运行请求所请求的物理资源在所述第一计算节点创建容器。

在一种可能的实施方式中，所述资源管理模块701，具体用于：

采集所述其他计算节点的物理资源总量以及所述其他计算节点已使用的物理资源；

根据所述其他计算节点的物理资源总量以及所述其他计算节点已使用的物理资源，确定所述其他计算节点上可用的物理资源。

在一种可能的实施方式中，在所述第一计算节点上可用的物理资源满足所述负载运行请求所请求的所述物理资源的情况下，从所述第一计算节点上可用的物理资源中为所述目标负载分配的物理资源为第一物理资源；

所述调度模块703，还用于：

当所述第一计算节点满足重调度条件时，释放所述第一物理资源；

从所述第一计算节点上可用的物理资源中重新为所述目标负载分配第二物理资源，所述第二物理资源与所述第一物理资源不同。

进一步的，负载处理装置700还可以包括更多的功能模块，如还可以包括监控模块705等，该监控模块705用于对已分配以及未分配的物理资源进行监控，以便资源管理模块701可以根据监控结果确定可用的物理资源等。

本实施例提供的负载处理装置700对应于前述实施例中的负载处理方法，因此，本实施例中所提供的各个模块的具体实现方式及其所具有的技术效果，可以参见前述实施例中的相关之处描述，在此不做赘述。具体地，负载处理装置700中的资源管理模块701的具体实现方式及其所具有的技术效果，可以参见前述实施例中的资源管理模块201；负载处理装置700中的通信模块702的具体实现方式及其所具有的技术效果，可以参见前述实施例中的通信模块202；负载处理装置700中的调度模块703的具体实现方式及其所具有的技术效果，可以参见前述实施例中的调度模块203；负载处理装置700中的控制模块704的具体实现方式及其所具有的技术效果，可以参见前述实施例中的控制模块204；负载处理装置700中的监控模块705的具体实现方式及其所具有的技术效果，可以参见前述实施例中的监控模块205等，本实施例在此不做赘述。

另外，本申请实施例还提供了一种计算节点，该计算节点可以是用于实现上述计算节点200的设备。参见图8，示出了该计算节点的硬件结构示意图。

如图8所示，计算节点800包括总线801、处理器802、通信接口803和存储器804。处理器802、存储器804和通信接口803之间通过总线801通信。总线801可以是外设部件互连标准(peripheral component interconnect，PCI)总线或扩展工业标准结构(extended industry standard architecture，EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示，图8中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。通信接口803用于与外部通信，例如接收终端发送的数据获取请求等。

其中，处理器802可以为中央处理器(central processing unit，CPU)。存储器804可以包括易失性存储器(volatile memory)，例如随机存取存储器(random access memory，RAM)。存储器804还可以包括非易失性存储器(non-volatile memory)，例如只读存储器(read-only memory，ROM)，快闪存储器，HDD或SSD。

存储器804中存储有可执行代码，处理器802执行该可执行代码以执行前述计算节点200所执行的方法。

具体地，在实现图7所示实施例的情况下，执行图7中的负载处理装置700的功能所需的软件或程序代码存储在存储器804中，负载处理装置700与其他设备(如其他计算节点)的交互通过通信接口803实现，处理器用于执行存储器804中的指令，实现负载处理装置700的功能，或者执行上述计算节点200所执行的方法。

此外，本申请实施例还提供了一种计算节点集群，如图2以及图4中所示的计算节点集群，所述计算节点集群包括多个计算节点，所述多个计算节点中的一个或者多个计算节点执行上述实施例计算节点200所执行的方法。

此外，本申请实施例还提供了一种计算机可读存储介质，该计算机可读存储介质中存储有指令，当其在计算机设备上运行时，使得计算机设备执行上述实施例计算节点200所执行的方法。

此外，本申请实施例还提供了一种计算机程序产品，所述计算机程序产品被计算机执行时，所述计算机执行前述数据提供方法的任一方法。该计算机程序产品可以为一个软件安装包，在需要使用前述数据提供方法的任一方法的情况下，可以下载该计算机程序产品并在计算机上执行该计算机程序产品。

另外需说明的是，以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外，本申请提供的装置实施例附图中，模块之间的连接关系表示它们之间具有通信连接，具体可以实现为一条或多条通信总线或信号线。

通过以上的实施方式的描述，所属领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件的方式来实现，当然也可以通过专用硬件包括专用集成电路、专用CPU、专用存储器、专用元器件等来实现。一般情况下，凡由计算机程序完成的功能都可以很容易地用相应的硬件来实现，而且，用来实现同一功能的具体硬件结构也可以是多种多样的，例如模拟电路、数字电路或专用电路等。但是，对本申请而言更多情况下软件程序实现是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在可读取的存储介质中，如计算机的软盘、U盘、移动硬盘、ROM、RAM、磁碟或者光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，训练设备，或者网络设备等)执行本申请各个实施例所述的方法。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。

所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、训练设备或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、训练设备或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存储的任何可用介质或者是包含一个或多个可用介质集成的训练设备、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘(Solid State Disk，SSD))等。

Claims

一种负载处理方法，其特征在于，所述方法应用于第一计算节点，所述第一计算节点与其他计算节点连接，所述第一计算节点和所述其他计算节点设置在同一计算节点集群，所述方法包括：

确定所述第一计算节点上可用的物理资源和所述其他计算节点上可用的物理资源；

接收负载运行请求，所述负载运行请求用于请求运行目标负载的物理资源；

判断在所述第一计算节点上可用的物理资源是否满足所述负载运行请求所请求的所述物理资源，在所述第一计算节点上可用的物理资源满足所述负载运行请求所请求的所述物理资源的情况下，从所述第一计算节点上可用的物理资源中为所述目标负载分配所述负载运行请求所请求的物理资源，在所述第一计算节点上可用的物理资源不满足所述负载运行请求所请求的所述物理资源的情况下，从所述其他计算节点中选择可用的物理资源满足所述负载运行请求所请求的所述物理资源的第二计算节点，并将所述负载运行请求转发至所述第二计算节点。
根据权利要求1所述的方法，其特征在于，所述第一计算节点与调度系统连接，所述接收负载运行请求，包括：

接收所述调度系统发送的所述负载运行请求。
根据权利要求2所述的方法，其特征在于，所述调度系统设置在公有云的数据中心，所述计算节点集群设置在与所述公有云的数据中心远程连接的边缘云数据中心。
根据权利要求2所述的方法，其特征在于，所述调度系统以及所述计算节点集群均设置在所述公有云的数据中心。
根据权利要求2至4任一项所述的方法，其特征在于，所述调度系统包括虚拟机调度系统和容器调度系统。
根据权利要求2至5任一项所述的方法，其特征在于，从所述第一计算节点上可用的物理资源中为所述目标负载分配所述负载运行请求所请求的物理资源之后，所述方法还包括：

向所述调度系统发送响应信息，其中，所述响应信息用于通知所述调度系统所述负载运行请求所请求的所述物理资源已在所述第一计算节点上扣减。
根据权利要求2至6任一项所述的方法，其特征在于，在接收所述负载运行请求之前，所述方法还包括：

向所述调度系统发送可用的物理资源总量，所述可用的物理资源总量包括所述第一计算节点上的可用的物理资源的资源量以及所述其他计算节点上可用的物理资源的资源量之和。
根据权利要求1所述的方法，其特征在于，所述接收负载运行请求，包括：

接收所述计算节点集群中的第三计算节点转发的所述负载运行请求，其中，所述第三计算节点上可用的物理资源不满足所述负载运行请求所请求的所述物理资源。
根据权利要求1至8任一项所述的方法，其特征在于，所述负载运行请求携带有所述目标负载的类型，其中所述目标负载的类型包括虚拟机和容器，所述方法还包括：

判断所述目标负载的类型为虚拟机或容器；

在所述第一计算节点上可用的物理资源满足所述负载运行请求所请求的所述物理资源的情况下，在所述目标负载的类型为虚拟机时，根据分配的所述负载运行请求所请求的物理资源在所述第一计算节点创建虚拟机，在所述目标负载的类型为容器时，根据分配的所述负载运行请求所请求的物理资源在所述第一计算节点创建容器。
根据权利要求1至9任一项所述的方法，其特征在于，所述确定其他计算节点上可用的物理资源，包括：

采集所述其他计算节点的物理资源总量以及所述其他计算节点已使用的物理资源；

根据所述其他计算节点的物理资源总量以及所述其他计算节点已使用的物理资源，确定所述其他计算节点上可用的物理资源。
根据权利要求1至10任一项所述的方法，其特征在于，在所述第一计算节点上可用的物理资源满足所述负载运行请求所请求的所述物理资源的情况下，从所述第一计算节点上可用的物理资源中为所述目标负载分配的物理资源为第一物理资源；

所述方法还包括：

当所述第一计算节点满足重调度条件时，释放所述第一物理资源，并从所述第一计算节点上可用的物理资源中重新为所述目标负载分配第二物理资源，所述第二物理资源与所述第一物理资源不同。
一种负载处理装置，其特征在于，所述负载处理装置应用于第一计算节点，所述第一计算节点与其他计算节点连接，所述第一计算节点和所述其他计算节点设置在同一计算节点集群，所述负载处理装置包括：

资源管理模块，用于确定所述第一计算节点上可用的物理资源和所述其他计算节点上可用的物理资源；

通信模块，用于接收负载运行请求，所述负载运行请求用于请求运行目标负载的物理资源；

调度模块，用于判断在所述第一计算节点上可用的物理资源是否满足所述负载运行请求所请求的所述物理资源，在所述第一计算节点上可用的物理资源满足所述负载运行请求所请求的所述物理资源的情况下，从所述第一计算节点上可用的物理资源中为所述目标负载分配所述负载运行请求所请求的物理资源，在所述第一计算节点上可用的物理资源不满足所述负载运行请求所请求的所述物理资源的情况下，从所述其他计算节点中选择可用的物理资源满足所述负载运行请求所请求的所述物理资源的第二计算节点，并将所述负载运行请求转发至所述第二计算节点。
根据权利要求12所述的负载处理装置，其特征在于，所述第一计算节点与调度系统连接，所述通信模块，具体用于接收所述调度系统发送的所述负载运行请求。
根据权利要求13所述的负载处理装置，其特征在于，所述调度系统设置在公有云的数据中心，所述计算节点集群设置在与所述公有云的数据中心远程连接的边缘云数据中心。
根据权利要求13所述的负载处理装置，其特征在于，所述调度系统以及所述计算节点集群均设置在所述公有云的数据中心。
根据权利要求13至15任一项所述的负载处理装置，其特征在于，所述调度系统包括虚拟机调度系统和容器调度系统。
根据权利要求13至16任一项所述的负载处理装置，其特征在于，所述通信模块，还用于从所述第一计算节点上可用的物理资源中为所述目标负载分配所述负载运行请求所请求的物理资源之后，向所述调度系统发送响应信息，其中，所述响应信息用于通知所述调度系统所述负载运行请求所请求的所述物理资源已在所述第一计算节点上扣减。
根据权利要求13至17任一项所述的装置，其特征在于，所述通信模块，还用于在接收所述负载运行请求之前，向所述调度系统发送可用的物理资源总量，所述可用的物理资源总量包括所述第一计算节点上的可用的物理资源的资源量以及所述其他计算节点上可用的物理资源的资源量之和。
根据权利要求12所述的负载处理装置，其特征在于，所述通信模块，具体用于接收所述计算节点集群中的第三计算节点转发的所述负载运行请求，其中，所述第三计算节点上可用的物理资源不满足所述负载运行请求所请求的所述物理资源。
根据权利要求12至19任一项所述的负载处理装置，其特征在于，所述负载运行请求携带有所述目标负载的类型，其中所述目标负载的类型包括虚拟机和容器，所述负载处理装置还包括控制模块；

所述控制模块，具体用于：

判断所述目标负载的类型为虚拟机或容器；

在所述第一计算节点上可用的物理资源满足所述负载运行请求所请求的所述物理资源的情况下，在所述目标负载的类型为虚拟机时，根据分配的所述负载运行请求所请求的物理资源在所述第一计算节点创建虚拟机，在所述目标负载的类型为容器时，根据分配的所述负载运行请求所请求的物理资源在所述第一计算节点创建容器。
根据权利要求12至20任一项所述的负载处理装置，其特征在于，所述资源管理模块，具体用于：

采集所述其他计算节点的物理资源总量以及所述其他计算节点已使用的物理资源；

根据所述其他计算节点的物理资源总量以及所述其他计算节点已使用的物理资源，确定所述其他计算节点上可用的物理资源。
根据权利要求12至21任一项所述的负载处理装置，其特征在于，在所述第一计算节点上可用的物理资源满足所述负载运行请求所请求的所述物理资源的情况下，从所述第一计算节点上可用的物理资源中为所述目标负载分配的物理资源为第一物理资源；

所述调度模块，还用于：

当所述第一计算节点满足重调度条件时，释放所述第一物理资源；

从所述第一计算节点上可用的物理资源中重新为所述目标负载分配第二物理资源，所述第二物理资源与所述第一物理资源不同。
一种计算节点，其特征在于，所述计算节点包括处理器和存储器；

所述处理器用于执行所述存储器中存储的指令，以使得所述计算节点执行权利要求1至11中任一项所述的方法。
一种计算节点集群，其特征在于，所述计算节点集群包括多个计算节点，所述多个计算节点中的一个或者多个计算节点执行如权利要求1至11任一项所述的方法。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有指令，当其在计算设备上运行时，使得所述计算设备执行如权利要求1至11任一项所述的方法。
一种包含指令的计算机程序产品，当其在计算设备上运行时，使得所述计算设备执行如权利要求1至11中任一项所述的方法。