WO2019024508A1

WO2019024508A1 - 资源分配方法、主装置、从装置和分布式计算系统

Info

Publication number: WO2019024508A1
Application number: PCT/CN2018/079159
Authority: WO
Inventors: 倪传蕾; 马庆祥; 张馨予; 陈茁
Original assignee: 北京奇虎科技有限公司
Priority date: 2017-08-04
Filing date: 2018-03-15
Publication date: 2019-02-07
Also published as: CN107515786A; CN107515786B

Abstract

一种资源分配方法、主装置、从装置和分布式计算系统。所述方法包括：获取在分布式集群的各物理节点上可使用的资源总量（S110），为各计算任务设置标准资源限度（S120），将两者下发到相应物理节点上的资源分配从装置中（S130）；当接收到提交的计算任务时，获取各物理节点上当前的可用资源（S140）；根据该计算任务提交的计算任务中配置的资源需求和/或标准资源限度，以及各物理节点上当前的可用资源，确定可运行该计算任务的资源充足的物理节点（S150）；将计算任务分配到资源充足的物理节点上，由资源充足的物理节点上的资源分配从装置在标准资源限度内为该计算任务分配资源（S160）。能够避免出现多个计算任务争抢同一计算资源导致效率低下的问题。

Description

资源分配方法、主装置、从装置和分布式计算系统

技术领域

本发明涉及分布式计算技术领域，具体涉及资源分配方法、主装置、从装置和分布式计算系统。

背景技术

许多分布式系统都通过调度器来分配、调度计算资源，例如Hadoop可以利用Yarn进行资源调度。但是许多分布式计算系统是不支持调度器的，资源的分配方法往往不能满足用户的需求，可能导致效率低下，甚至出现错误。

发明内容

鉴于上述问题，提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的资源分配方法、主装置、从装置和分布式计算系统。

依据本发明的一个方面，提供了一种资源分配方法，该方法包括：

获取在分布式集群的各物理节点上可使用的资源总量；

为各计算任务设置标准资源限度；

将各物理节点上可使用的资源总量和所述标准资源限度下发到相应物理节点上的资源分配从装置中；

当接收到提交的计算任务时，获取各物理节点上当前的可用资源；

根据该计算任务提交的计算任务中配置的资源需求和/或标准资源限度，以及各物理节点上当前的可用资源，确定可运行该计算任务的资源充足的物理节点；

将所述计算任务分配到资源充足的物理节点上，由所述资源充足的物理节点上的资源分配从装置在所述标准资源限度内为该计算任务分配资源。

依据本发明的另一方面，提供了一种资源分配方法，该方法包括：

获取各计算任务的标准资源限度和本物理节点上可使用的物理资源总量；

当接收到下发的计算任务时，根据所述计算任务中配置的资源需求和/或标准资源限度，在所述标准资源限度内为所述计算任务分配资源，将分配的资源记录为已分配资源；

在所述计算任务结束后，释放相应的已分配资源；

当接收到可用资源获取请求时，根据记录的已分配资源和在该物理节点上可用的资源总量，确定该物理节点当前的可用资源并上报。

依据本发明的又一方面，提供了一种资源分配主装置，该装置包括：

资源总量确定单元，适于获取在分布式集群的各物理节点上可使用的资源总量；

资源限度确定单元，适于为各计算任务设置标准资源限度；

资源分配单元，适于将各物理节点上可使用的资源总量和所述标准资源限度下发到相应物理节点上的资源分配从装置中；以及适于当接收到提交的计算任务时，获取各物理节点上当前的可用资源，根据该计算任务提交的计算任务中配置的资源需求和/或标准资源限度，以及各物理节点上当前的可用资源，确定可运行该计算任务的资源充足的物理节点，将所述计算任务分配到资源充足的物理节点上，由所述资源充足的物理节点上的资源分配从装置在所述标准资源限度内为该计算任务分配资源。

依据本发明的再一方面，提供了一种资源分配从装置，该装置包括：

资源预分配单元，适于获取各计算任务的标准资源限度和本物理节点上可使用的物理资源总量；

资源分配单元，适于当接收到下发的计算任务时，根据所述计算任务中配置的资源需求和/或标准资源限度，在所述标准资源限度内为所述计算任务分配资源，将分配的资源记录为已分配资源；以及在所述计算任务结束后，释放相应的已分配资源；

所述资源预分配单元，还适于当接收到可用资源获取请求时，根据记录的已分配资源和在该物理节点上可用的资源总量，确定该物理节点当前的可用资源并上报。

依据本发明的再一方面，提供了一种分布式计算系统，包括一个主节点和至少一个从节点，每个主节点上部署有如上述任一项所述的资源分配主装置，每个从节点上部署有如上述任一项所述的资源分配从装置。

根据本发明的又一个方面，提供了一种计算机可读介质，其中存储了计算机可读代码，当所述计算机可读代码在计算设备上运行时，导致所述计算设备执行所述资源分配方法。

根据本发明的再一个方面，提供了一种计算设备，包括处理器；以及存储了计算机可读代码的存储器，所述计算机可读代码被所述处理器运行时，导致所述计算设备执行所述的资源分配方法。

由上述可知，本发明的技术方案，通过为各计算任务设置标准资源限度，将标准资源限度和各物理节点上可使用的资源总量下发到相应物理节点上的资源分配从装置中，在接收到提交的计算任务时，先获取各物理节点上当前的可用资源来确定资源充足的物理节点，将计算任务分配到这样的物理节点上，由这些物理节点上的资源分配从装置在标准资源限度内分配资源。该技术方案能够保证为各计算任务分配的计算资源互不冲突，同时满足了资源调度的需求，避免出现多个计算任务争抢同一计算资源导致效率低下的问题。

上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本发明的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：

图1示出了根据本发明一个实施例的一种资源分配方法的流程示意图；

图2示出了根据本发明一个实施例的另一种资源分配方法的流程示意图；

图3示出了根据本发明一个实施例的一种资源分配主装置的结构示意图；

图4示出了根据本发明一个实施例的一种资源分配从装置的结构示意图；

图5示出了根据本发明一个实施例的一种分布式计算系统的结构示意图；

图6示出了用于执行根据本发明的资源分配方法的计算设备的框图；以及

图7示出了用于保持或者携带实现根据本发明的资源分配方法的程序代码的存储单元。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

以分布式计算系统Storm为例，其能够支持流式计算的实时处理，但是不支持利用Yarn进行资源的调度。提交到Storm中的计算任务称为Topology，Topology又由Spout和Bolt构成。Storm中存在两种组件，Nimbus和Supervisor，其中Nimbus全局只有一个，负责将任务的代码发送到多个Supervisor上。因此Nimbus相当于主节点，Supervisor相当于从节点。分布式集群中的各物理节点上可以分别启动一个Supervisor，用于监听分配给它所在的物理节点的工作，根据需要启动或关闭工作进程Worker。Worker会利用计算资源来处理相应的计算任务，因此现有技术中，往往通过控制Worker的数量来实现资源的分配，例如令一个Supervisor最多只能启动四个Worker。但是这种方式存在的问题是，对于图像识别等计算任务来说，其耗费的计算资源是巨大的；相对地，有一些计算任务耗费的计算资源很小。这样就可能出现一个Supervisor启动了三个Worker，这三个Worker已经使用了全部的计算资源，但是由于预设的是一个Supervisor可以启动四个Worker，那么还可能出现令这个Supervisor再启动一个Worker，执行另一个计算任务；那么这个计算任务可能被饿死。

下面本发明各实施例所示出的技术方案可以在一定程度上避免这样的事情发生。图1示出了根据本发明一个实施例的一种资源分配方法的流程示意图，其中，该方法应用于分布式计算系统的主节点上，所述分布式计算系统部署在分布式集群中，该方法包括：

步骤S110，获取在分布式集群的各物理节点上可使用的资源总量。本实施例和其他实施例中的资源可以是CPU资源、内存资源、网卡资源中的一种或多种。

当分布式集群中只部署了本分布式计算系统时，那么各物理节点上可使用的资源总量就是相应的物理节点上的所有资源。

步骤S120，为各计算任务设置标准资源限度。

在本步骤中，并不是如同现有技术一样设置可在各物理节点上运行的计算任务的数量，而是为各计算任务设置一个标准资源限度，例如，对于一个Spout，只允许其使用3个CPU核心。

步骤S130，将各物理节点上可使用的资源总量和标准资源限度下发到相应物理节点上的资源分配从装置中。

步骤S140，当接收到提交的计算任务时，获取各物理节点上当前的可用资源。

因为此时，如果一个物理节点上已有运行的计算任务，那么该物理节点上当前的可用资源就小于该物理节点上可使用的资源总量。然后执行步骤S150，根据该计算任务提交的计算任务中配置的资源需求和/或标准资源限度，以及各物理节点上当前的可用资源，确定可运行该计算任务的资源充足的物理节点。

例如，计算任务需求使用2个CPU核心，而物理节点1上只有1个CPU核心空闲，那么物理节点1就不是一个资源充足的物理节点。假如物理节点2上有3个CPU核心空闲，那么物理节点2就是一个资源充足的物理节点。

步骤S160，将计算任务分配到资源充足的物理节点上，由资源充足的物理节点上的资源分配从装置在标准资源限度内为该计算任务分配资源。

这里可以考虑按照计算任务中配置的资源需求为该计算任务分配资源，例如虽然一个计算任务的标准资源限度是3个CPU核心，但是实际提交的一个计算任务只需求2个CPU核心，那么可以分配给该计算任务2个CPU核心。如果计算任务中没有配置资源需求，那么也可以按照标准资源限度，分配给该计算任务3个CPU核心。

可见，图1所示的方法，通过为各计算任务设置标准资源限度，将标准资源限度和各物理节点上可使用的资源总量下发到相应物理节点上的资源分配从装置中，在接收到提交的计算任务时，先获取各物理节点上当前的可用资源来确定资源充足的物理节点，将计算任务分配到这样的物理节点上，由这些物理节点上的资源分配从装置在标准资源限度内分配资源。该技术方案能够保证为各计算任务分配的计算资源互不冲突，同时满足了资源调度的需求，避免出现多个计算任务争抢同一计算资源导致效率低下的问题。

上面的实施例中提及，当分布式集群中只部署了本分布式计算系统时，那么各物理节点上可使用的资源总量就是相应的物理节点上的所有资源。然而事实上，分布式集群往往是被多个分布式系统复用的。因此在本发明的一个实施例中，上述方法中，分布式集群的各物理节点被多个分布式系统复用，分布式计算系统是多个分布式系统中的一个；分布式计算系统在分布式集群的各物理节点上可使用的资源是根据各分布式系统的资源需求量确定的。

例如，Hadoop和Storm如果在同一分布式集群中部署，Hadoop可以由Yarn进行调度，Strom则不行，那么二者中的计算任务就会争抢计算资源。在本实施例中，可以根据各分布式系统的资源需求量来确定各分布式系统在各物理节点上可使用的资源。例如，一个物理节点上有24个CPU核心，那么可以将CPU0～CPU9分配给Storm，CPU10～CPU23分配给Hadoop。

在本发明的一个实施例中，上述方法中，为各计算任务设置标准资源限度包括：在Cgroup limit配置文件中写入各计算任务可使用的标准资源限度；将各物理节点上可使用的资源总量和标准资源限度下发到相应物理节点上的资源分配从装置中包括：为各物理节点生成对应的在Cgroup limit配置文件副本，在各Cgroup limit配置文件副本中写入在相应的物理节点上可使用的资源总量，将Cgroup limit配置文件副本下发到各资源分配从装置。

Cgroup全称为Control Group，可以在Linux系统中实现资源调度，但并不十分好用。在本实施例中选取使用Cgroup limit配置文件的方式来限制各计算任务可使用的资源。

上面的实施例中，标准资源限度对各类型的计算任务可以都是一样的，也就是无论是什么计算任务，一视同仁。当然这也可能造成许多不需要利用太多计算资源的计算任务被申请了过多的计算资源。因此在本发明的一个实施例中，上述方法还包括：按计算任务的业务类型，为各计算任务设置业务资源限度；提交的计算任务在提交前，在相应的业务资源限度内配置资源需求。

也就是说，提交到分布式计算系统中的任务不能够随意地申请资源，这样在有标准资源限度的一道限制下，又增添了一道限制，可以减少出现资源利用率过低的情况。

上面的实施例可以应用在分布式计算系统的主节点上。图2示出了根据本发明一个实施例的另一种资源分配方法的流程示意图，其中，该方法应用于分布式计算系统中的从节点上，分布式计算系统部署在分布式集群中，且各从节点对应部署在分布式集群的一个物理节点上，该方法包括：

步骤S210，获取各计算任务的标准资源限度和本物理节点上可使用的物理资源总量。这些可以是主节点上的资源分配主装置下发的。

步骤S220，当接收到下发的计算任务时，根据计算任务中配置的资源需求和/或标准资源限度，在标准资源限度内为计算任务分配资源，将分配的资源记录为已分配资源。

步骤S230，在计算任务结束后，释放相应的已分配资源。

通过步骤S220和步骤S230就能够维护在本物理节点上已分配的资源总量，也就能计算出剩余的资源总量，这些就是该物理节点上可用的资源总量。因此在步骤S240，当接收到可用资源获取请求时，根据记录的已分配资源和在该物理节点上可用的资源总量，确定该物理节点当前的可用资源并上报。

这时主节点上的资源分配主装置可以按照前述实施例中的方法确定计算任务应该在哪些物理节点上执行，在此不再赘述。

在本发明的一个实施例中，图2所示的方法中，获取各计算任务的标准资源限度包括：接收下发的Cgroup limit配置文件副本，Cgroup limit配置文件副本中写有本物理节点上可使用的资源总量及各计算任务可使用的标准资源限度；在标准资源限度内为计算任务分配资源包括：以Cgroup limit方式启动计算任务。

在前述实施例中介绍了使用Cgroup limit配置文件的方式来限制各计算任务使用的资源，在本实施例中，对Cgroup limit配置文件的利用方式为以Cgroup limit方式启动计算任务，这样就会加载相应的Cgroup limit配置文件副本。

虽然上述实施例能够提高计算任务的执行效率，但也可能出现为计算任务分配的资源过多或过少的情况，因此在本发明的一个实施例中，图2所示的方法还包括：统计各计算任务在预定时间内对相应的已分配资源的资源利用率；根据资源利用率调整各计算任务的已分配资源，和/或在接收到下发的计算任务时，根据与该计算任务同业务类型的计算任务的资源利用率和计算任务中配置的资源需求，在标准资源限度内为计算任务分配资源。

例如，计算任务A申请了3个CPU核心，但资源利用率不到10％，可令其只使用1个CPU核心；计算任务B申请了2个CPU核心，但长时间处于100％负载，那么可以在标准资源限度内容为其额外分配CPU核心，等等。

图3示出了根据本发明一个实施例的一种资源分配主装置的结构示意图，其中，该装置应用于分布式计算系统的主节点上，分布式计算系统部署在分布式集群中。如图3所示，资源分配主装置300包括：

资源总量确定单元310，适于获取在分布式集群的各物理节点上可使用的资源总量。

资源限度确定单元320，适于为各计算任务设置标准资源限度。

资源分配单元330，适于将各物理节点上可使用的资源总量和标准资源限度下发到相应物理节点上的资源分配从装置中；以及适于当接收到提交的计算任务时，获取各物理节点上当前的可用资源，根据该计算任务提交的计算任务中配置的资源需求和/或标准资源限度，以及各物理节点上当前的可用资源，确定可运行该计算任务的资源充足的物理节点，将计算任务分配到资源充足的物理节点上，由资源充足的物理节点上的资源分配从装置在标准资源限度内为该计算任务分配资源。

可见，图3所示的装置，通过各单元的相互配合，为各计算任务设置标准资源限度，将标准资源限度和各物理节点上可使用的资源总量下发到相应物理节点上的资源分配从装置中，在接收到提交的计算任务时，先获取各物理节点上当前的可用资源来确定资源充足的物理节点，将计算任务分配到这样的物理节点上，由这些物理节点上的资源分配从装置在标准资源限度内分配资源。该技术方案能够保证为各计算任务分配的计算资源互不冲突，同时满足了资源调度的需求，避免出现多个计算任务争抢同一计算资源导致效率低下的问题。

在本发明的一个实施例中，上述装置中，分布式集群的各物理节点被多个分布式系统复用，分布式计算系统是多个分布式系统中的一个；分布式计算系统在分布式集群的各物理节点上可使用的资源是根据各分布式系统的资源需求量确定的。

在本发明的一个实施例中，上述装置中，资源包括如下的一种或多种：CPU资源、内存资源、网卡资源。

在本发明的一个实施例中，上述装置中，资源限度确定单元320，适于在Cgroup limit配置文件中写入各计算任务可使用的标准资源限度；资源分配单元330，适于为各物理节点生成对应的在Cgroup limit配置文件副本，在各Cgroup limit配置文件副本中写入在相应的物理节点上可使用的资源总量，将Cgroup limit配置文件副本下发到各资源分配从装置。

在本发明的一个实施例中，上述装置中，资源限度确定单元320，还适于按计算任务的业务类型，为各计算任务设置业务资源限度；提交的计算任务在提交前，在相应的业务资源限度内配置资源需求。

图4示出了根据本发明一个实施例的一种资源分配从装置的结构示意图，其中，该装置应用于分布式计算系统中的从节点上，分布式计算系统部署在分布式集群中，且各从节点分别与分布式集群的一个物理节点对应。如图4所示，资源分配从装置400包括：

资源预分配单元410，适于获取各计算任务的标准资源限度和本物理节点上可使用的物理资源总量。

资源分配单元420，适于当接收到下发的计算任务时，根据计算任务中配置的资源需求和/或标准资源限度，在标准资源限度内为计算任务分配资源，将分配的资源记录为已分配资源；以及在计算任务结束后，释放相应的已分配资源。

资源预分配单元410，还适于当接收到可用资源获取请求时，根据记录的已分配资源和在该物理节点上可用的资源总量，确定该物理节点当前的可用资源并上报。

在本发明的一个实施例中，图4所示的装置中，资源预分配单元410，适于接收下发的Cgroup limit配置文件副本，Cgroup limit配置文件副本中写有本物理节点上可使用的资源总量及各计算任务可使用的标准资源限度；资源分配单元420，适于以Cgroup limit方式启动计算任务。

在本发明的一个实施例中，图4所示的装置还包括：统计单元430，适于统计各计算任务在预定时间内对相应的已分配资源的资源利用率；资源分配单元420，适于根据资源利用率调整各计算任务的已分配资源，和/或适于在接收到下发的计算任务时，根据与该计算任务同业务类型的计算任务的资源利用率和计算任务中配置的资源需求，在标准资源限度内为计算任务分配资源。

需要说明的是，上述各装置实施例的具体实施方式分别与前述对应方法实施例的具体实施方式相同，在此不再赘述。

图5示出了根据本发明一个实施例的一种分布式计算系统的结构示意图，如图5所示，分布式计算系统500包括一个主节点510和至少一个从节点520，每个主节点510上部署有如上述任一实施例所述的资源分配主装置300，每个从节点上部署有如上述任一实施例所述的资源分配从装置400。

综上所述，本发明的技术方案，通过为各计算任务设置标准资源限度，将标准资源限度和各物理节点上可使用的资源总量下发到相应物理节点上的资源分配从装置中，在接收到提交的计算任务时，先获取各物理节点上当前的可用资源来确定资源充足的物理节点，将计算任务分配到这样的物理节点上，由这些物理节点上的资源分配从装置在标准资源限度内分配资源。该技术方案能够保证为各计算任务分配的计算资源互不冲突，同时满足了资源调度的需求，避免出现多个计算任务争抢同一计算资源导致效率低下的问题。

需要说明的是：

在此提供的算法和显示不与任何特定计算机、虚拟装置或者其它设备固有相关。各种通用装置也可以与基于在此的示教一起使用。根据上面的描述，构造这类装置所要求的结构是显而易见的。此外，本发明也不针对任何特定编程语言。应当明白，可以利用各种编程语言实现在此描述的本发明的内容，并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。

在此处所提供的说明书中，说明了大量具体细节。然而，能够理解，本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中，并未详细示出公知的方法、结构和技术，以便不模糊对本说明书的理解。

类似地，应当理解，为了精简本公开并帮助理解各个发明方面中的一个或多个，在上面对本发明的示例性实施例的描述中，本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而，并不应将该公开的方法解释成反映如下意图：即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说，如下面的权利要求书所反映的那样，发明方面在于少于前面公开的单个实施例的所有特征。因此，遵循具体实施方式的权利要求书由此明确地并入该具体实施方式，其中每个权利要求本身都作为本发明的单独实施例。

本领域那些技术人员可以理解，可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件，以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外，可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述，本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外，本领域的技术人员能够理解，尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征，但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如，在下面的权利要求书中，所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

本发明的各个部件实施例可以以硬件实现，或者以在一个或者多个处理器上运行的软件模块实现，或者以它们的组合实现。本领域的技术人员应当理解，可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的资源分配主装置、从装置和分布式计算系统中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如，计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上，或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到，或者在载体信号上提供，或者以任何其他形式提供。

例如，图6示出了可以实现根据本发明的资源分配方法的计算设备的框图。该计算设备传统上包括处理器610和以存储器620形式的计算机程序产品或者计算机可读介质。存储器620可以是诸如闪存、EEPROM(电可擦除可编程只读存储器)、EPROM、硬盘或者ROM之类的电子存储器。存储器620具有存储用于执行上述方法中的任何方法步骤的程序代码631的存储空间630。例如，存储程序代码的存储空间630可以存储分别用于实现上面的方法中的各种步骤的各个程序代码631。这些程序代码可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。这些计算机程序产品包括诸如硬盘，紧致盘(CD)、存储卡或者软盘之类的程序代码载体。这样的计算机程序产品通常为如图7所示的便携式或者固定存储单元。该存储单元可以具有与图6的计算设备中的存储器620类似布置的存储段、存储空间等。程序代码可以例如以适当形式进行压缩。通常，存储单元包括存储有用于执行根据本发明的方法步骤的计算机可读程序代码631’，即可以由例如诸如610之类的处理器读取的程序代码，当这些程序代码由计算设备运行时，导致该计算设备执行上面所描述的方法中的各个步骤。

本文中所称的“一个实施例”、“实施例”或者“一个或者多个实施例”意味着，结合实施例描述的特定特征、结构或者特性包括在本发明的至少一个实施例中。此外，请注意，这里“在一个实施例中”的词语例子不一定全指同一个实施例。

应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制，并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中，不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中，这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

此外，还应当注意，本说明书中使用的语言主要是为了可读性和教导的目的而选择的，而不是为了解释或者限定本发明的主题而选择的。因此，在不偏离所附权利要求书的范围和精神的情况下，对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。对于本发明的范围，对本发明所做的公开是说明性的，而非限制性的，本发明的范围由所附权利要求书限定。

Claims

一种资源分配方法，该方法包括：获取在分布式集群的各物理节点上可使用的资源总量；为各计算任务设置标准资源限度；将各物理节点上可使用的资源总量和所述标准资源限度下发到相应物理节点上的资源分配从装置中；当接收到提交的计算任务时，获取各物理节点上当前的可用资源；根据该计算任务提交的计算任务中配置的资源需求和/或标准资源限度，以及各物理节点上当前的可用资源，确定可运行该计算任务的资源充足的物理节点；将所述计算任务分配到资源充足的物理节点上，由所述资源充足的物理节点上的资源分配从装置在所述标准资源限度内为该计算任务分配资源。
如权利要求1所述的方法，其中，该方法应用于分布式计算系统的主节点上，所述分布式计算系统部署在分布式集群中。
如权利要求2所述的方法，其中，所述分布式集群的各物理节点被多个分布式系统复用，所述分布式计算系统是所述多个分布式系统中的一个；

所述分布式计算系统在所述分布式集群的各物理节点上可使用的资源是根据各分布式系统的资源需求量确定的。
如权利要求2所述的方法，其中，所述资源包括如下的一种或多种：

CPU资源、内存资源、网卡资源。
如权利要求2所述的方法，其中，所述为各计算任务设置标准资源限度包括：在Cgroup limit配置文件中写入各计算任务可使用的标准资源限度；

所述将各物理节点上可使用的资源总量和所述标准资源限度下发到相应物理节点上的资源分配从装置中包括：为各物理节点生成对应的在Cgroup limit配置文件副本，在各Cgroup limit配置文件副本中写入在相应的物理节点上可使用的资源总量，将所述Cgroup limit配置文件副本下发到各资源分配从装置。
如权利要求2所述的方法，其中，该方法还包括：按计算任务的业务类型，为各计算任务设置业务资源限度；

所述提交的计算任务在提交前，在相应的业务资源限度内配置资源需求。
一种资源分配方法，该方法包括：

获取各计算任务的标准资源限度和本物理节点上可使用的物理资源总量；

当接收到下发的计算任务时，根据所述计算任务中配置的资源需求和/或标准资源限度，在所述标准资源限度内为所述计算任务分配资源，将分配的资源记录为已分配资源；

在所述计算任务结束后，释放相应的已分配资源；

当接收到可用资源获取请求时，根据记录的已分配资源和在该物理节点上可用的资源总量，确定该物理节点当前的可用资源并上报。
如权利要求7所述的方法，其中，该方法应用于分布式计算系统中的从节点上，所述分布式计算系统部署在分布式集群中，且各从节点对应部署在分布式集群的一个物理节点上。
如权利要求8所述的方法，其中，所述获取各计算任务的标准资源限度包括：

接收下发的Cgroup limit配置文件副本，所述Cgroup limit配置文件副本中写有本物理节点上可使用的资源总量及各计算任务可使用的标准资源限度；

所述在所述标准资源限度内为所述计算任务分配资源包括：以Cgroup limit方式启动所述计算任务。
如权利要求8所述的方法，其中，该方法还包括：

统计各计算任务在预定时间内对相应的已分配资源的资源利用率；

根据所述资源利用率调整各计算任务的已分配资源，和/或在接收到下发的计算任务时，根据与该计算任务同业务类型的计算任务的资源利用率和所述计算任务中配置的资源需求，在所述标准资源限度内为所述计算任务分配资源。
一种资源分配主装置，该装置包括：

资源总量确定单元，适于获取在分布式集群的各物理节点上可使用的资源总量；

资源限度确定单元，适于为各计算任务设置标准资源限度；

资源分配单元，适于将各物理节点上可使用的资源总量和所述标准资源限度下发到相应物理节点上的资源分配从装置中；以及适于当接收到提交的计算任务时，获取各物理节点上当前的可用资源，根据该计算任务提交的计算任务中配置的资源需求和/或标准资源限度，以及各物理节点上当前的可用资源，确定可运行该计算任务的资源充足的物理节点，将所述计算任务分配到资源充足的物理节点上，由所述资源充足的物理节点上的资源分配从装置在所述标准资源限度内为该计算任务分配资源。
如权利要求11所述的装置，其中，该装置应用于分布式计算系统的主节点上，所述分布式计算系统部署在分布式集群中。
如权利要求12所述的装置，其中，所述分布式集群的各物理节点被多个分布式系统复用，所述分布式计算系统是所述多个分布式系统中的一个；

所述分布式计算系统在所述分布式集群的各物理节点上可使用的资源是根据各分布式系统的资源需求量确定的。
如权利要求13所述的装置，其中，所述资源包括如下的一种或多种：

CPU资源、内存资源、网卡资源。
如权利要求12所述的装置，其中，

所述资源限度确定单元，适于在Cgroup limit配置文件中写入各计算任务可使用的标准资源限度；

所述资源分配单元，适于为各物理节点生成对应的在Cgroup limit配置文件副本，在各Cgroup limit配置文件副本中写入在相应的物理节点上可使用的资源总量，将所述Cgroup limit配置文件副本下发到各资源分配从装置。
如权利要求12所述的装置，其中，

所述资源限度确定单元，还适于按计算任务的业务类型，为各计算任务设置业务资源限度；

所述提交的计算任务在提交前，在相应的业务资源限度内配置资源需求。
一种资源分配从装置该装置包括：

资源预分配单元，适于获取各计算任务的标准资源限度和本物理节点上可使用的物理资源总量；

资源分配单元，适于当接收到下发的计算任务时，根据所述计算任务中配置的资源需求和/或标准资源限度，在所述标准资源限度内为所述计算任务分配资源，将分配的资源记录为已分配资源；以及在所述计算任务结束后，释放相应的已分配资源；

所述资源预分配单元，还适于当接收到可用资源获取请求时，根据记录的已分配资源和在该物理节点上可用的资源总量，确定该物理节点当前的可用资源并上报。
如权利要求17所述的装置，其中，该装置应用于分布式计算系统中的从节点上，所述分布式计算系统部署在分布式集群中，且各从节点分别与分布式集群的一个物理节点对应。
如权利要求18所述的装置，其中，

所述资源预分配单元，适于接收下发的Cgroup limit配置文件副本，所述Cgroup limit配置文件副本中写有本物理节点上可使用的资源总量及各计算任务可使用的标准资源限度；

所述资源分配单元，适于以Cgroup limit方式启动所述计算任务。
如权利要求18所述的装置，其中，该装置还包括：

统计单元，适于统计各计算任务在预定时间内对相应的已分配资源的资源利用率；

所述资源分配单元，适于根据所述资源利用率调整各计算任务的已分配资源，和/或适于在接收到下发的计算任务时，根据与该计算任务同业务类型的计算任务的资源利用率和所述计算任务中配置的资源需求，在所述标准资源限度内为所述计算任务分配资源。
一种分布式计算系统，其中，该系统包括一个主节点和至少一个从节点，每个主节点上部署有如权利要求11-16中任一项所述的资源分配主装置，每个从节点上部署有如权利要求17-20中任一项所述的资源分配从装置。
一种计算机可读介质，其中存储了计算机可读代码，当所述计算机可读代码在计算设备上运行时，导致所述计算设备执行根据权利要求1-10任一个所述的资源分配方法。
一种计算设备，包括：

处理器；以及

存储了计算机可读代码的存储器，所述计算机可读代码被所述处理器运行时，导致所述计算设备执行根据权利要求1-10任一个所述的资源分配方法。