CN115129458A

CN115129458A - 基于容器的进程调度方法、装置、设备及存储介质

Info

Publication number: CN115129458A
Application number: CN202211068759.4A
Authority: CN
Inventors: 彭志光
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2022-09-02
Filing date: 2022-09-02
Publication date: 2022-09-30
Anticipated expiration: 2042-09-02
Also published as: CN115129458B; WO2024046017A1

Abstract

本申请公开了一种基于容器的进程调度方法、装置、设备及存储介质，属于云计算技术领域。该方法包括：对于任意一个容器，周期性获取该容器的主场CPU的运行状态数据；该主场CPU是指与该容器建立绑定关系的CPU；该容器绑定的CPU个数小于目标数目，目标数目是指满足该容器的业务运行需求所需的CPU个数；响应于该主场CPU的运行状态数据满足负载均衡条件，在该主场CPU和客场CPU之间进行业务进程迁移；客场CPU是指与该容器未建立绑定关系的CPU；响应于该容器内的第一业务进程被迁移，确定第一业务进程在迁入的CPU上的运行优先级；根据确定的运行优先级运行第一业务进程。本申请能够兼顾业务性能和资源利用率。

Description

基于容器的进程调度方法、装置、设备及存储介质

技术领域

本申请涉及云计算技术领域，特别涉及一种基于容器的进程调度方法、装置、设备及存储介质。

背景技术

随着IT（Internet Technology，互联网技术）的演进，基础架构方面也在推陈出新，伴随虚拟化技术的不断成熟，云计算也发展到了新的阶段。云计算不但改变了企业的业务架构，还改变了企业的运营模式，将业务部署于云平台是未来业务运营的一种发展趋势。示例性地，容器云是一种基于容器的云平台，通过在设备上创建容器，容器云能够以提供容器的方式为业务提供服务。

目前常采用混合部署的方式在容器云上进行业务部署，即将多种业务的业务进程部署到同一个设备上。为此，在同一个设备上会创建多个容器，以提供给不同的业务使用，比如不同业务的业务进程被隔离在不同的容器内。其中，业务进程的运行依赖于CPU（Central Processing Unit，中央处理单元）资源，在进行业务进程迁移时，还需考虑CPU资源利用是否合理以及业务性能是否达标。比如，不能出现即使某些CPU处于空闲状态也不能运行容器内业务进程的情况，因为该种情况会导致资源利用率低。又比如，不能出现不同业务之间相互冲突的情况。例如时延敏感业务（比如游戏业务）的业务进程和时延不敏感业务（比如机器学习任务）的业务进程可能会竞争CPU资源，进而导致时延敏感业务的业务进程的调度时延较大，从而影响业务性能。

基于以上描述可知，业务进程的调度需要兼顾资源利用率和业务性能。为此，在不影响业务性能的前提下，如何提升资源利用率，便成为本领域在进行进程调度时需要重点关注的一项。

发明内容

本申请实施例提供了一种基于容器的进程调度方法、装置、设备及存储介质，能够在不影响业务性能的前提下，提升资源利用率。所述技术方案包括如下内容。

一方面，提供了一种基于容器的进程调度方法，所述方法包括：

对于任意一个容器，周期性获取所述容器的主场CPU的运行状态数据；其中，所述主场CPU是指设备上与所述容器建立绑定关系的CPU；所述容器绑定的CPU个数小于目标数目，所述目标数目是指满足所述容器的业务运行需求所需的CPU个数；

响应于所述主场CPU的运行状态数据满足负载均衡条件，在所述主场CPU和客场CPU之间进行业务进程迁移；其中，所述客场CPU是指所述设备上与所述容器未建立绑定关系的CPU；

响应于所述容器内的第一业务进程被迁移，确定所述第一业务进程在迁入的CPU上的运行优先级；根据所述第一业务进程的运行优先级，在所述迁入的CPU上运行所述第一业务进程。

在一些可能的实现方式中，所述周期性获取所述容器的主场中央处理单元CPU的运行状态数据，包括以下至少一种：

周期性获取所述主场CPU的负载；

周期性获取所述主场CPU的运行队列中进程的调度时延。

在一些可能的实现方式中，所述周期性获取所述主场CPU的负载，包括：

在当前调度周期内，获取所述主场CPU在固定时长内的平均负载，所述平均负载用于指示所述主场CPU的运行队列中的平均进程数；

获取所述主场CPU在上一个调度周期内的平均负载；

根据所述主场CPU在固定时长内的平均负载和所述主场CPU在上一个调度周期内的平均负载，获取所述主场CPU在当前调度周期内的平均负载。

另一方面，提供了一种基于容器的进程调度装置，所述装置包括：

获取模块，被配置为对于任意一个容器，周期性获取所述容器的主场CPU的运行状态数据；其中，所述主场CPU是指设备上与所述容器建立绑定关系的CPU；所述容器绑定的CPU个数小于目标数目，所述目标数目是指满足所述容器的业务运行需求所需的CPU个数；

调度模块，被配置为响应于所述主场CPU的运行状态数据满足负载均衡条件，在所述主场CPU和客场CPU之间进行业务进程迁移；其中，所述客场CPU是指所述设备上与所述容器未建立绑定关系的CPU；

确定模块，被配置为响应于所述容器内的第一业务进程被迁移，确定所述第一业务进程在迁入的CPU上的运行优先级；

运行模块，被配置为根据所述第一业务进程的运行优先级，在所述迁入的CPU上运行所述第一业务进程。

在一些可能的实现方式中，所述运行状态数据包括所述主场CPU的运行队列中进程的调度时延；所述获取模块，被配置为周期性获取所述主场CPU的主场进程列表中主场进程的调度时延；其中，所述主场进程是指所述容器内的业务进程；周期性获取所述主场CPU的客场进程列表中客场进程的调度时延；其中，所述客场进程是指与所述主场CPU未建立绑定关系的容器内的业务进程。

在一些可能的实现方式中，所述确定模块，被配置为响应于所述迁入的CPU为所述主场CPU，将所述第一业务进程在所述迁入的CPU上的运行优先级设置为第一运行优先级；响应于所述迁入的CPU为与所述容器未建立绑定关系的客场CPU，将所述第一业务进程在所述迁入的CPU上的运行优先级设置为第二运行优先级；其中，所述第一运行优先级高于所述第二运行优先级。

在一些可能的实现方式中，所述运行状态数据包括所述主场CPU的负载；所述调度模块，被配置为在当前调度周期内，响应于所述主场CPU的负载高于第一负载阈值，在与所述容器未建立绑定关系的客场CPU中确定负载最低的第一CPU；将运行在所述主场CPU上的所述第一业务进程迁入所述第一CPU。

在一些可能的实现方式中，所述运行状态数据包括所述主场CPU的运行队列中进程的调度时延；所述调度模块，被配置为在当前调度周期内，响应于所述主场CPU的运行队列中进程的调度时延大于第一时间阈值，在与所述容器未建立绑定关系的客场CPU中确定进程的调度时延最小的第二CPU；将运行在所述主场CPU上的所述第一业务进程迁入所述第二CPU。

在一些可能的实现方式中，所述运行状态数据包括所述主场CPU的负载；所述调度模块，被配置为在当前调度周期内，在迁出的CPU为所述主场CPU且所述迁入的CPU为与所述容器未建立绑定关系的客场CPU的情况下，响应于所述主场CPU的负载低于第二负载阈值，从所述迁入的CPU将所述第一业务进程迁回所述主场CPU。

在一些可能的实现方式中，所述运行状态数据包括所述主场CPU的负载；所述调度模块，还被配置为在当前调度周期内，响应于所述主场CPU的负载位于目标阈值区间，在与所述容器未建立绑定关系的客场CPU中确定负载最低的第一CPU；在所述设备上的全量CPU中确定负载最高的第三CPU；将运行在所述第三CPU上的第二业务进程迁入所述第一CPU；

所述确定模块，还被配置为确定所述第二业务进程在所述第一CPU上的运行优先级；

所述运行模块，还被配置为根据所述第二业务进程的运行优先级，在所述第一CPU上运行所述第二业务进程。

在一些可能的实现方式中，所述运行模块，被配置为在目标时长后，将位于所述第三CPU的运行队列中的所述第二业务进程加入到所述第一CPU的运行队列中；其中，所述目标时长是根据负载均衡周期设置的。

在一些可能的实现方式中，所述运行状态数据包括所述主场CPU的负载；在迁出的CPU为所述主场CPU且所述迁入的CPU为与所述容器未建立绑定关系的客场CPU的情况下，所述调度模块，还被配置为在下一个调度周期内，响应于迁入的CPU的负载高于第三负载阈值，在所述设备上的全量CPU中确定负载最高的第三CPU；将运行在所述第三CPU上的第三业务进程迁入所述主场CPU；

所述确定模块，还被配置为确定所述第三业务进程在所述主场CPU上的运行优先级；

所述运行模块，还被配置为根据所述第三业务进程的运行优先级，在所述主场CPU上运行所述第三业务进程。

在一些可能的实现方式中，所述运行状态数据包括所述主场CPU的运行队列中进程的调度时延；在迁出的CPU为所述主场CPU且所述迁入的CPU为与所述容器未建立绑定关系的客场CPU的情况下，所述调度模块，还被配置为在下一个调度周期内，响应于迁入的CPU的运行队列中进程的调度时延大于第二时间阈值，在所述设备上的全量CPU中确定进程的调度时延最大的第四CPU；将运行在所述第四CPU上的第四业务进程迁入所述主场CPU；

所述确定模块，还被配置为确定所述第四业务进程在所述主场CPU上的运行优先级；

所述运行模块，还被配置为根据所述第四业务进程的运行优先级，在所述主场CPU上运行所述第四业务进程。

在一些可能的实现方式中，所述运行状态数据包括所述主场CPU的运行队列中进程的调度时延；在迁出的CPU为所述主场CPU且所述迁入的CPU为与所述容器未建立绑定关系的客场CPU的情况下，所述调度模块，还被配置为在下一个调度周期内，响应于所述迁入的CPU的运行队列中进程的调度时延大于第三时间阈值，从所述迁入的CPU将所述第一业务进程迁回所述主场CPU。

在一些可能的实现方式中，在所述迁入的CPU为与所述容器未建立绑定关系的客场CPU的情况下，所述确定模块，还被配置为响应于当前未运行所述迁入的CPU的主场进程，且当前在所述迁入的CPU上运行的客场进程中所述第一业务进程所属业务的时延敏感度最高，将所述第一业务进程的运行优先级临时调整为所述第二运行优先级；响应于所述迁入的CPU的主场进程处于就绪状态，将所述第一业务进程的运行优先级调整回所述第一运行优先级。

在一些可能的实现方式中，所述调度模块，还被配置为在当前调度周期内，响应于所述主场CPU的运行状态数据满足负载均衡条件且迁出的CPU为所述主场CPU，根据当前调度周期内的运行状态数据，在与所述容器未建立绑定关系的客场CPU中确定多个候选迁入对象；预测所述多个候选迁入对象在之后多个调度周期内的运行状态数据；根据所述多个候选迁入对象在当前调度周期内的运行状态数据和预测的运行状态数据，在所述多个候选迁入对象中确定所述迁入的CPU；在所述主场CPU和所述迁入的CPU之间进行业务进程迁移。

另一方面，提供了一种计算机设备，所述设备包括处理器和存储器，所述存储器中存储有至少一条程序代码，所述至少一条程序代码由所述处理器加载并执行以实现上述的基于容器的进程调度方法。

另一方面，提供了一种计算机可读存储介质，所述存储介质中存储有至少一条程序代码，所述至少一条程序代码由处理器加载并执行以实现上述的基于容器的进程调度方法。

另一方面，提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机程序代码，该计算机程序代码存储在计算机可读存储介质中，计算机设备的处理器从计算机可读存储介质读取该计算机程序代码，处理器执行该计算机程序代码，使得该计算机设备执行上述的基于容器的进程调度方法。

本申请实施例提供的调度方案首先基于设备上容器与CPU之间的绑定关系提出了主场CPU和客场CPU的概念；对于任意一个容器，与该容器建立绑定关系的CPU称之为该容器的主场CPU，与该容器未建立绑定关系的CPU称之为该容器的客场CPU。且，每个容器绑定的CPU个数小于目标数目，其中，目标数目是指满足每个容器的业务运行需求所需的CPU个数。由于每个容器绑定了较少的CPU，因此能够在同一个设备上部署更多的容器，提供给不同的业务使用，实现了较高的CPU资源超卖，能够提升资源利用率。其中，超卖在此处是指实际拥有的CPU资源小于分配的CPU资源。

另外，本申请实施例还支持业务进程在多个CPU之间进行调度。详细来讲，对于该容器的任意一个主场CPU，响应于该主场CPU的运行状态数据满足负载均衡条件，则在该主场CPU和该容器的客场CPU之间进行业务进程迁移；这种调度方式能够避免出现即使某些CPU处于空闲状态也不能运行业务进程的情况，确保了资源利用率。

另外，本申请实施例还提出了运行优先级的概念；假设该容器内的第一业务进程被迁移，那么会确定第一业务进程在迁入的CPU上的运行优先级，进而根据第一业务进程的运行优先级，在迁入的CPU上运行第一业务进程，该种优先级控制方式能够避免出现不同业务之间相互冲突的情况。其中，第一业务进程在迁入的CPU上按照确定的优先级运行，不会影响与该CPU绑定的容器内业务进程在其上的运行，确保了业务性能。

综上所述，本申请实施例提供的调度方案能够兼顾业务性能和资源利用率。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是根据一示例性实施例示出的一种计算机设备的结构示意图；

图2是根据一示例性实施例示出的一种容器云的系统架构图；

图3是根据一示例性实施例示出的另一种容器云的系统架构图；

图4是根据一示例性实施例示出的一种容器与CPU之间的绑定示意图；

图5是根据一示例性实施例示出的一种基于容器的进程调度方法的流程图；

图6是根据一示例性实施例示出的一种负载检测示意图；

图7是根据一示例性实施例示出的一种优先级控制示意图；

图8是根据一示例性实施例示出的另一种基于容器的进程调度方法的流程图；

图9是根据一示例性实施例示出的一种扩容逻辑的示意图；

图10是根据一示例性实施例示出的又一种基于容器的进程调度方法的流程图；

图11是根据一示例性实施例示出的一种缩容逻辑的示意图；

图12是根据一示例性实施例示出的再一种基于容器的进程调度方法的流程图；

图13是根据一示例性实施例示出的一种基于容器的进程调度装置的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请实施方式作进一步地详细描述。

本申请中术语“第一”、“第二”等字样用于对作用和功能基本相同的相同项或相似项进行区分，应理解，“第一”、“第二”、“第n”之间不具有逻辑或时序上的依赖关系，也不对数量和执行顺序进行限定。还应理解，尽管以下描述使用术语第一、第二等来描述各种元素，但这些元素不应受术语的限制。

这些术语只是用于将一个元素与另一个元素区别开。例如，在不脱离各种示例的范围的情况下，第一元素能够被称为第二元素，并且类似地，第二元素也能够被称为第一元素。第一元素和第二元素都可以是元素，并且在某些情况下，可以是单独且不同的元素。

其中，至少一个是指一个或一个以上，例如，至少一个元素可以是一个元素、两个元素、三个元素等任意大于等于一的整数个元素。而多个是指两个或者两个以上，例如，多个元素可以是两个元素、三个元素等任意大于等于二的整数个元素。

需要说明的是，本申请所涉及的信息（包括但不限于用户设备信息、用户个人信息等）、数据（包括但不限于用于分析的数据、存储的数据、展示的数据等）以及信号，均为经用户授权或者经过各方充分授权的，且相关数据的收样本集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。

本申请实施例提供的基于容器的进程调度方案涉及云技术。其中，云技术是指在广域网或局域网内将硬件、软件、网络等系列资源统一起来，实现数据的计算、储存、处理和共享的一种托管技术。

云技术是基于云计算商业模式应用的网络技术、信息技术、整合技术、管理平台技术、应用技术等的总称，可以组成资源池，按需所用，灵活便利。云计算技术将变成重要支撑。技术网络系统的后台服务需要大量的计算、存储资源，如视频网站、图片类网站和更多的门户网站。伴随着互联网行业的高度发展和应用，将来每个物品都有可能存在自己的识别标志，都需要传输到后台系统进行逻辑处理，不同程度级别的数据将会分开处理，各类行业数据皆需要强大的系统后盾支撑，只能通过云计算来实现。

云计算（Cloud Computing）指IT基础设施的交付和使用模式，指通过网络以按需、易扩展的方式获得所需资源；广义云计算指服务的交付和使用模式，指通过网络以按需、易扩展的方式获得所需服务。这种服务可以是IT和软件、互联网相关，也可是其他服务。云计算是网格计算（Grid Computing）、分布式计算（Distributed Computing）、并行计算（Parallel Computing）、效用计算（Utility Computing）、网络存储（Network StorageTechnologies）、虚拟化（Virtualization）、负载均衡（Load Balance）等传统计算机和网络技术发展融合的产物。

随着互联网、实时数据流、连接设备多样化的发展，以及搜索服务、社会网络、移动商务和开放协作等需求的推动，云计算迅速发展起来。不同于以往的并行分布式计算，云计算的产生从理念上将推动整个互联网模式、企业管理模式发生革命性的变革。

下面先对本申请实施例涉及到的一些关键术语或缩略语进行介绍。

容器（container）：在Linux中，容器技术是一种进程隔离的技术。在计算形态上，容器技术是一种内核轻量级的操作系统层虚拟化技术。容器能够将进程隔离在一个独立环境中。

容器云：是在云计算技术中新兴的一种产品形态，容器云是由容器构成的容器管理平台，为用户使用容器提供了极大的便利。其中，通过在物理机或者虚拟机上创建容器，容器云能够以提供容器的方式为业务提供服务。换一种表达方式，容器云是以容器作为资源分配和调度的基本单位，封装了软件运行的环境，为开发者和系统管理员提供用于构建、发布和运行分布式应用的平台。

混合部署：是指将多种业务的进程部署到同一个设备上。在一些可能的实现方式中，此处提及的业务包括但不限于：游戏业务、搜索业务、信息流业务、电商交易业务、大数据业务、机器学习业务、存储业务等。

进程调度：通常意义上来讲，以一个CPU为例，进程调度是指按照一定规则，动态地将CPU分配给处于运行队列中的某一个进程，以使之执行；换一种表达方式，进程调度是指从运行队列中按照一定规则挑选一个进程，以使之获得CPU。

在本申请实施例中，进程调度是指在不同CPU之间调度进程，以使之执行。

cpuset机制：在Linux中，cpuset的基本功能是限制某些进程只能运行在设备的某些CPU上。示例性地，假设在一个设备上有4个进程和4个CPU，利用cpuset可以让第1个进程和第2个进程只运行在第1个CPU和第2个CPU上。换一种表达方式，cpuset用于限定进程可以运行的CPU范围。

超卖：在本申请实施例中，超卖是指在固定规格的设备上部署更多的容器。

在一些可能的实现方式中，固定规格是指CPU的数量固定。在该种情况下，超卖是指实际部署的容器所需的CPU个数大于设备上拥有的CPU个数。例如，为了保证每个容器的业务服务质量，每个容器需要4个CPU，且设备上仅部署有8个CPU，但是部署2个以上的容器来使用这8个CPU，以提升资源利用率。

下面介绍本申请实施例提供的基于容器的进程调度方案涉及的实施环境。

在一些可能的实现方式中，在设备层面，本申请实施例提供的基于容器的进程调度方法应用于图1所示的计算机设备或在上述计算机设备上创建的虚拟机。其中，上述计算机设备在本申请实施例中也被称为物理机或物理服务器。

图1是根据一示例性实施例示出的一种计算机设备的结构示意图。

参见图1，该计算机设备100可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上中央处理单元（也称处理器）101和一个或一个以上的存储器102，其中，存储器102中存储有至少一条程序代码，该至少一条程序代码由中央处理单元101加载并执行以实现本申请实施例提供的基于容器的进程调度方法。当然，该计算机设备100还可以具有有线或无线网络接口、键盘以及输入输出接口等部件，以便进行输入输出，该计算机设备100还可以包括其他用于实现设备功能的部件，在此不做赘述。

在另一些可能的实现方式中，在系统架构层面，本申请实施例提供的基于容器的进程调度方法应用于图2所示的容器云的系统架构中的内核层。

图2是根据一示例性实施例示出的一种容器云的系统架构图。

参见图2，该系统架构自底向上依次包括设备层201、内核层202、平台层203和业务层204。其中，设备层201包括物理机和虚拟机；内核层202用于提供资源管理以及进程调度功能；示例性地，内核层202还提供cpuset机制和quota机制；而平台层203的容器编排器（全称：Kubernetes，简称：k8s）利用内核层202提供的cpuset机制和quota机制，生成绑核容器或非绑核容器，然后提供给业务层204不同的业务使用。而业务层204包括混合部署的各种业务；需要说明的是，图2仅是示出了业务A、业务B、业务C和业务D这四个业务，实际上业务层204可以包括更多或更少的业务，本申请在此不做限制。

其中，cpuset机制会限制某些容器内的业务进程只能运行在设备的固定CPU上，也即限制业务进程可以使用的CPU资源范围；换一种表达方式，cpuset机制通过绑定CPU的方式分配CPU资源给容器内的业务进程使用；相应地，上述提及的绑核是指设定进程与CPU的内核之间的亲和力（affinity）。设定以后，这个进程便仅在绑定的CPU上运行。而quota机制则不进行容器与CPU的绑定，容器内的业务进程可以运行在任意的CPU上，但是基于quota机制会对每个容器在固定时间周期内可以利用的CPU资源进行限额。

示例性地，假设一个设备上部署有8个CPU，其中，每个容器需要4个CPU。这4个CPU是为了满足容器的业务运行需求所需的CPU个数，换言之，是为了保证容器的业务服务质量所需的CPU资源量。针对cpuset机制，为了避免不同业务之间相互冲突，每个容器独立绑定4个CPU，所以可以为两个容器分配这8个CPU。而在非绑核情况下，通过quota机制可以限制每个容器在固定时间周期内使用的CPU资源份额为400%。其中，上述固定时间周期通常为100ms（毫秒），400%表示在每100ms的时间周期内最多使用400ms的CPU时间，即4个CPU。也即，某个容器内的业务进程可以运行在这8个CPU中的任意4个CPU上。针对该种情况，可以实现一定程度的CPU超卖，比如该设备上虽然只有8个CPU，但是可以为3个或更多数量的容器分配这8个CPU。

综上所述，针对cpuset机制，不同业务之间虽然不会存在冲突，但是CPU的超卖率低，存在即便某些CPU处于空闲状态也不能运行非绑定容器内的业务进程的问题，资源利用率低；针对quota机制，虽然可以实现一定程度的CPU超卖，但由于容器与CPU之间未进行绑定，因此存在业务之间相互冲突的问题，比如时延敏感业务的业务进程和时延不敏感业务的业务进程会竞争CPU资源，可能导致时延敏感业务的业务进程的运行延迟较大，进而影响业务性能。

在同一个设备上部署不同业务的情形下，为了兼顾资源利用率和业务性能，本申请实施例提出了一种基于容器的进程调度方案，能够在同一个设备上部署更多的容器，提供给不同的业务使用，且每个容器能够绑定更少的CPU，从而在不影响业务性能的前提上，实现更高的CPU超卖，显著提升了资源利用率。

图3是根据一示例性实施例示出的另一种容器云的系统架构图。

参见图3，在内核层202上新添加了三个单元，分别是负载检测单元2021、优先级控制单元2022和动态扩缩容单元2023；相应地，针对平台层203，在绑核容器和非绑核容器之外，还增加了一种容器类型，即动态扩缩容器（也称弹性容器）。

为了便于理解上述提及的动态扩缩容，下面先介绍本申请实施例的绑核逻辑。在同一个设备上混合部署多种业务的情形下，对于该设备上的任意一个容器，会建立该容器与设备上部分CPU之间的绑定关系，进而形成该容器的主场CPU；其中，该容器绑定的CPU个数小于目标数目，该目标数目是指满足每个容器的业务运行需求所需的CPU个数。即本申请实施例会为每个容器绑定更少的CPU；而未与该容器建立绑定关系的CPU，在本申请实施例中称为该容器的客场CPU。示例性地，如图4所示，假设设备上一共部署了8个CPU，分别为CPU0-CPU7，其中，每个容器需要4个CPU，但是本申请实施例仅为每个容器绑定2个CPU。以容器1为例，容器1仅与CPU0-CPU1建立了绑定关系，而CPU2-CPU7属于容器1的客场CPU。另外，容器1内的业务进程在本申请实施例中被称为CPU0-CPU1的主场进程，容器2-4内的业务进程在本申请实施例中被称为CPU0-CPU1的客场进程。

综上所述，负载检测单元2021用于获取设备上每个CPU的运行状态数据；以运行状态数据包括负载和运行队列中进程的调度时延为例，则负载检测单元2021用于检测设备上每个CPU的负载变化情况以及运行队列中进程的调度时延；其中，通过获知每个CPU的负载变化情况以及运行队列中进程的调度时延，可以辅助判断每个容器内的业务进程是只能运行在主场CPU上，还是可以扩展到客场CPU上运行。

其中，进程调度的一个非常重要的方面便是运行优先级的控制逻辑；为了实现更高的超卖率，本申请实施例提出了主场CPU和客场CPU的概念；由于容器A的客场CPU可能对应容器B的主场CPU，所以当容器A内的业务进程需要扩展到某一客场CPU上运行时，还需确保不能影响这个客场CPU上的主场进程的运行；为此，本申请实施例提出了优先级控制逻辑。在一些可能的实现方式中，优先级控制模块2022用于确定被迁移的业务进程在迁入的CPU上的运行优先级，其中，业务进程运行在主场CPU和客场CPU上的优先级不同，比如业务进程在主场CPU上的运行优先级高于在客场CPU上的运行优先级。

在另一些可能的实现方式中，扩缩容包括扩容和缩容；其中，扩容是指容器内的业务进程由该容器的主场CPU扩展到该容器的客场CPU上运行；缩容是指将被迁移的业务进程拉回主场CPU运行。也即，容器内业务进程可运行的CPU范围是能够变化的，并不局限于绑定的主场CPU，因此在本申请实施例中容器也被称为弹性容器或动态扩缩容器。另外，由于扩容和缩容能够根据负载检测单元的检测结果动态进行，因此被称为动态扩缩容。相应地，动态扩缩容单元2023用于根据负载检测单元2021的检测结果，来控制每个容器内的业务进程是应该在主场CPU上运行，还是应该扩展到客场CPU上运行；或者，控制业务进程是否需要由所属容器的客场CPU迁回所属容器的主场CPU上运行。

下面介绍本申请实施例提供的基于容器的进程调度方案的应用场景。

在一些可能的实现方式中，本申请实施例提供的基于容器的进程调度方案除了能够应用在容器云场景下之外，还能够应用于在线&在线混部场景、离在线混部场景以及成本优化场景。示例性地，针对在线&在线混部场景、离在线混部场景以及成本优化场景，可能会涉及容器云技术，本申请在此不做限制。

其中，在线是指在线业务，离线是指离线业务。在线服务通常运行时间长，资源利用率有明显的起伏特征，时延敏感，比如信息流业务、电商交易业务等。而离线业务在运行期间通常资源利用率较高，但是对时延一般不敏感，比如机器学习业务。

针对离在线混部场景，混部的含义是，将在线业务和离线业务混合到相同物理资源上，通过资源隔离、调度等控制手段，充分使用资源，同时保证服务的稳定性。换一种表达方式，由于在线业务的资源利用率有明显的起伏特征，所以混部的主要场景是通过填充离线业务将在线业务各个时段的空闲资源利用起来，以减少成本开支。相应地，针对在线&在线混部场景，混部的含义是，将不同的在线业务混合到相同物理资源上。

针对容器云场景，本申请实施例提供的调度方案可以在保证业务性能的基础上，实现更高的资源超卖。另外，为容器云场景下每个容器的资源分配方式，提供了额外的可信方案。

针对在线&在线混部场景，由于本申请实施例提供的调度方案为每个容器固定分配更少的资源（比如绑定更少的CPU），因此可以在同等性能的机器上混部更多的在线业务。

图5是根据一示例性实施例示出的一种基于容器的进程调度方法的流程图。如前所述，在设备层面，该方法的执行主体为计算机设备或在计算机设备上创建的虚拟机，其中，该计算机设备也被称为物理机或物理服务器。在系统架构层面，该方法的执行主体为容器云的系统架构中的内核层。以物理服务器为例，参见图5，该方法流程包括以下步骤。

501、对于任意一个容器，物理服务器周期性获取该容器的主场CPU的运行状态数据；其中，该主场CPU是指设备上与该容器建立绑定关系的CPU；该容器绑定的CPU个数小于目标数目，目标数目是指满足每个容器的业务运行需求所需的CPU个数。

本步骤由物理服务器上部署的CPU的内核提供的负载检测单元执行。其中，步骤501-503提及的主场CPU指代该容器绑定的任意一个主场CPU。在本申请实施例中，负载检测单元会周期性获取设备上每个CPU的运行状态数据，此处仅是以任意一个容器的任意一个主场CPU为例进行举例说明。

在一些可能的实现方式中，上述运行状态数据包括负载和CPU的运行队列中进程的调度时延中的至少一种。以任意一个容器的任意一个主场CPU为例，周期性获取该容器的主场CPU的运行状态数据，包括以下至少一种：

周期性获取该主场CPU的负载；

周期性获取该主场CPU的运行队列中进程的调度时延。

其中，调度时延也称调度延迟，实质上是保证每一个可运行进程都至少运行一次的时间间隔。换一种表达方式，调度时延是指一个进程具备运行的条件（进入CPU的运行队列），到真正执行（获得CPU的执行权）的这段时间。

以运行状态数据包括负载为例，如图6所示，本申请实施例会利用每个CPU上周期性的tick进行负载情况的更新，并根据更新的负载情况来决定业务进程是应该运行在主场CPU上，还是需要扩展到客场CPU上去运行。其中，图6示出了容器1内的业务进程可能需要根据更新的负载情况由原本的CPU0而扩展运行到其他的CPU上。需要说明的是，图6将另一个主场CPU也作为可以扩展运行的对象，实际上还可以仅将客场CPU2-CPU7作为扩展运行的对象，本申请在此不做限制。

其中，tick是操作系统的相对时间单位，也被称为操作系统的时基，来源于定时器的周期性中断（输出脉冲），一次中断表示一个tick，也被称做一个“时钟滴答”。一个tick与时间的对应关系可以在初始化定时器时设定，即tick所对应的时间长度是可以调整的。一般情况下，内核都提供相应的调整机制，可以根据特定情况来改变tick对应的时间长度。例如，可以使操作系统5ms产生一个tick，也可以使操作系统10ms产生一个tick。其中，tick的大小决定了操作系统的时间粒度。

需要说明的是，为了可以敏锐的感知到每个CPU的负载变化又兼顾负载的短时波动情况，并不是每个tick均进行负载统计，而可能是几个tick才进行一次负载统计。在一些可能的实现方式中，只有当时间过了一个调度周期才会利用计算公式去统计一次每个CPU的负载情况。其中，调度周期是指所有可运行进程都在CPU上执行一遍的时间周期。示例性地，调度周期的大小为24ms，本申请在此不做限制。

基于以上描述，在本申请实施例中，周期性获取该主场CPU的负载，包括但不限于如下方式：

在当前调度周期内，获取该主场CPU在固定时长内的平均负载，该平均负载用于指示该主场CPU的运行队列中的平均进程数；获取该主场CPU在上一个调度周期内的平均负载；根据该主场CPU在固定时长内的平均负载和该主场CPU在上一个调度周期内的平均负载，获取该主场CPU在当前调度周期内的平均负载。

其中，上述固定时长内的平均负载是指由内核统计计算得来的

。其中，rq是指运行队列run queue。示例性地，该固定时长为1分钟、5分钟或15分钟，本申请在此不做限制。

在另一些可能的实现方式中，本申请实施例基于如下计算公式获取该主场CPU在当前调度周期内的平均负载。

示例性地，d指代该主场CPU在上一个调度周期内的平均负载，

指代该主场CPU在固定时长内的平均负载，

，

，

指代该主场CPU在当前调度周期内的平均负载。

在本申请实施例中，可以通过上述计算公式来计算每个CPU在任意一个调度周期内的负载。

以上介绍了如何周期性地计算每个CPU的负载情况，下面介绍如何保存每个CPU的负载情况。在一些可能的实现方式中，在每个业务进程的运行过程中，会判断是否更新其对应的主场CPU和客场CPU的负载情况；如果距离上次更新的时间大于了特定时长（一个更新周期的时间间隔），便会触发读取其对应的主场CPU和客场CPU的负载并保存起来。示例性地，更新周期的大小与调度周期的大小一致，均为24ms，本申请在此不做限制。

在另一些可能的实现方式中，周期性获取与该容器建立有绑定关系的主场CPU的运行状态数据，包括但不限于如下方式：

周期性获取该主场CPU的主场进程列表中主场进程的调度时延；其中，此处的主场进程是指该容器内的业务进程；

周期性获取该主场CPU的客场进程列表中客场进程的调度时延；其中，此处的客场进程是指与该主场CPU未建立绑定关系的容器内的业务进程。

换一种表达方式，每个CPU包含一个主场进程列表和一个客场进程列表，针对主场进程列表和客场进行列表，本申请实施例会周期性进行调度时延的统计。示例性地，周期性进行统计的时间间隔既可以与上述调度周期一致，也可以与上述tick一致，本申请在此不做限制。

在另一些可能的实现方式中，每个容器可以绑定的CPU个数，以及可以扩展的CPU个数是可以动态调整的，根据实际情况而赋予不同的值，本申请在此不做限制。示例性地，可以通过sysctl控制参数来控制扩展（扩展的CPU个数）与收缩（绑定的CPU个数）的比例，本申请在此不做限制。

502、响应于该主场CPU的运行状态数据满足负载均衡条件，物理服务器在该主场CPU和设备上客场CPU之间进行业务进程迁移；其中，客场CPU是指设备上与该容器未建立绑定关系的CPU。

本步骤由物理服务器上部署的CPU的内核提供的动态扩缩容单元执行。

其中，业务进程迁移包括扩容逻辑和缩容逻辑。即，对于任意一个容器来讲，响应于该容器的主场CPU和客场CPU的运行状态数据满足负载均衡条件时，会触发扩容和缩容，此时需要能够快速地将业务进程扩展到客场CPU上去运行或者拉回到主场CPU上去运行。示例性地，基于负载均衡的扩容逻辑和缩容逻辑包括但不限于如下情形。

情形一、该容器的主场CPU的运行状态数据满足负载均衡条件，比如负载增高或业务进程的调度时延过大，部分业务进程需要扩展到客场CPU上去运行的扩容逻辑。

情形二、当业务进程运行在客场CPU上，会出现两种情况下的缩容；一种情况是客场CPU的运行状态数据满足负载均衡条件，比如负载增高或迁移过来的业务进程的调度时延过大；另一种情况可以是主场CPU上的负载已经持续一段时间比较低，该业务进程也应该被迁回至主场CPU上去运行。

关于扩容逻辑和缩容逻辑更为详细的描述还请参见下一个实施例。

503、响应于该容器内的第一业务进程被迁移，物理服务器确定第一业务进程在迁入的CPU上的运行优先级；根据第一业务进程的运行优先级，在迁入的CPU上运行第一业务进程。

本步骤由物理服务器上部署的CPU的内核提供的优先级控制单元执行。

在一些可能的实现方式中，业务进程在其对应的主场CPU上的运行优先级要高于在其对应的客场CPU上的运行优先级。相应地，确定第一业务进程在迁入的CPU上的运行优先级，包括但不限于如下方式：响应于迁入的CPU为该主场CPU，将第一业务进程在迁入的CPU上的运行优先级设置为第一运行优先级；响应于迁入的CPU为与该容器未建立绑定关系的客场CPU，将第一业务进程在迁入的CPU上的运行优先级设置为第二运行优先级；其中，第一运行优先级高于第二运行优先级。

示例性地，图7示出了容器1内的某个业务进程由主场CPU（CPU0-CPU1）扩展运行到客场CPU（比如CPU4）上的运行优先级控制情况。参见图7，设备上一共部署具有8个CPU，其中，容器1的主场CPU是CPU0-CPU1，客场 CPU是CPU2-CPU7；容器1内的业务进程运行在CPU0-CPU1上时，设置为高运行优先级；假设CPU1的运行状态数据满足负载均衡条件，符合扩容条件，那么会将容器1内的业务进程扩展运行到其他CPU上，即加入到其他CPU的运行队列中。其中，图7中示出了将容器1内的某个业务进程扩展运行到CPU4上（图7中步骤1），此时会将该业务进程在CPU4上设置为低运行优先级；当CPU4上的主场进程被唤醒需要CPU资源时，该主场进程会以高运行优先级获得CPU资源（图7中步骤2）；当CPU4上的负载增加或者低运行优先级的业务进程的调度时延过大，符合缩容条件，之前迁移过来的业务进程会被迁回至CPU1（图7中步骤3），此时该业务进程的运行优先级设置回高运行优先级。

综上所述，运行优先级的设置策略可以是：业务进程在入队时，判断入队的CPU是否是其对应的主场CPU；如果是，则将该业务进程的运行优先级设置为高运行优先级；或者，业务进程入队时，判断入队的CPU是否是其对应的客场CPU；如果是，则将该业务进程的运行优先级设置为低运行优先级。

本申请实施例提供的调度方案应用于在同一个设备上部署不同业务的情形下，该调度方案首先基于设备上容器与CPU之间的绑定关系提出了主场CPU和客场CPU的概念；对于任意一个容器，与该容器建立绑定关系的CPU称之为该容器的主场CPU，与该容器未建立绑定关系的CPU称之为该容器的客场CPU。且，每个容器绑定的CPU个数小于目标数目，其中，目标数目是指满足每个容器的业务运行需求所需的CPU个数。由于每个容器绑定了较少的CPU，因此能够在同一个设备上部署更多的容器，提供给不同的业务使用，实现了较高的CPU资源超卖，能够提升资源利用率。其中，超卖在此处是指实际拥有的CPU资源小于分配的CPU资源。

另外，本申请实施例还支持业务进程在多个CPU之间进行调度，能够实现高效地业务进程迁移。详细来讲，对于该容器的任意一个主场CPU，响应于该主场CPU的运行状态数据满足负载均衡条件，则在该主场CPU和该容器的客场CPU之间进行业务进程迁移；这种调度方式能够避免出现即使某些CPU处于空闲状态也不能运行业务进程的情况，确保了资源利用率。

综上所述，本申请实施例提供的调度方案能够兼顾业务性能和资源利用率。示例性地，对于容器云场景，本申请实施例提出了为容器分配CPU资源的新方式，兼顾了容器的性能与CPU的超卖率。另外，业务进程运行于主场CPU和客场CPU上具有不同的优先级，从而保证了业务性能。

图8是根据一示例性实施例示出的另一种基于容器的进程调度方法的流程图。如前所述，在设备层面，该方法的执行主体为计算机设备或在计算机设备上创建的虚拟机，其中，该计算机设备也被称为物理机或物理服务器。在系统架构层面，该方法的执行主体为容器云的系统架构中的内核层。以物理服务器为例，参见图8，该方法流程包括以下步骤。

801、物理服务器为创建的每个容器绑定主场CPU；其中，不同容器绑定的主场CPU不同，且每个容器绑定的主场CPU个数小于目标数目，该目标数目是指满足每个容器的业务运行需求所需的CPU个数。

其中，不同容器绑定的主场CPU不同，也即是指每个容器绑定设备上的不同CPU。如图4所示，容器1绑定的CPU为CPU0- CPU1，即容器1的主场CPU为CPU0- CPU1；容器2绑定的CPU为CPU2- CPU3，即容器1的主场CPU为CPU2- CPU3；容器3绑定的CPU为CPU4- CPU5，即容器3的主场CPU为CPU4- CPU5；容器4绑定的CPU为CPU6- CPU7，即容器4的主场CPU为CPU6-CPU7。

802、对于任意一个容器，物理服务器周期性获取该容器的主场CPU的运行状态数据。

在本申请实施例中，负载检测单元会周期性获取设备上每个CPU的运行状态数据，此处仅是以任意一个容器的任意一个主场CPU为例进行举例说明。

在一些可能的实现方式中，上述运行状态数据包括负载和CPU的运行队列中进程的调度时延中的至少一种。以运行状态数据包括负载为例，响应于该主场CPU的负载不满足负载均衡条件，则不进行业务进程调度。示例性地，此处的不满足负载均衡条件，可以是该主场CPU的负载低于某一负载阈值，比如该负载阈值的取值为0.6，本申请在此不做限制。

803、响应于该主场CPU的运行状态数据满足负载均衡条件，物理服务器在该主场CPU和设备上客场CPU之间进行业务进程迁移；其中，客场CPU是指设备上与该容器未建立绑定关系的CPU。

需要说明的是，下文中出现的第一业务进程、第二业务进程、第三业务进程、第四业务进程，第一CPU、第二CPU、第三CPU、第四CPU，第一负载阈值、第二负载阈值、第三负载阈值，第一时间阈值、第二时间阈值，仅是为了对不同的业务进程、CPU、负载阈值和时间阈值进行区分，而不构成任何其他的限定。

以扩容逻辑为例，响应于该主场CPU的运行状态数据满足负载均衡条件，比如负载增高或业务进程的调度时延过大，则部分业务进程需要扩展到客场CPU上去运行。其中，图9是根据一示例性实施例示出的一种扩容逻辑的示意图。在图9中，CPU1作为容器1的主场CPU，其运行状态数据满足负载均衡条件，因此其上的部分业务进程需要扩展到CPU6上去运行，其中，CPU6为该容器的客场CPU。

在本申请实施例中，响应于该主场CPU的运行状态数据满足负载均衡条件，在该主场CPU和设备上客场CPU之间进行业务进程迁移，包括但不限于如下几种情形。其中，步骤8031对应扩容逻辑，步骤8032对应缩容逻辑。

8031、在当前调度周期内，响应于该主场CPU的负载高于第一负载阈值，在与该容器未建立绑定关系的客场CPU中确定负载最低的第一CPU；将运行在该主场CPU上的第一业务进程迁入第一CPU；或，在当前调度周期内，响应于该主场CPU的运行队列中进程的调度时延大于第一时间阈值，在与该容器未建立绑定关系的客场CPU中确定进程的调度时延最小的第二CPU；将运行在该主场CPU上的第一业务进程迁入第二CPU。

需要说明的是，第一CPU和第二CPU既可能是同一CPU，也可能是不同的CPU，本申请在此不做限制。另外，该主场CPU的运行队列中进程的调度时延既可以针对该主场CPU的主场进程，也可以针对该主场CPU的客场进程，本申请在此同样不做限制。

示例性地，上述第一负载阈值可以是0.8，上述第一时间阈值可以是24ms，本申请在此不做限制。以第一负载阈值为0.8，第一时间阈值为24ms为例，假设该主场CPU的负载超过0.8或者进程的调度时延大于24ms，那么动态扩缩容单元会在该容器的客场CPU中挑选最空闲的CPU，并且向该客场CPU发送强制负载均衡的处理器间中断（IPI，Inter-ProcessorInterrupt）；该客场CPU在接收到强制负载均衡的IPI中断后，执行强制负载均衡，直接到该主场CPU的运行队列中拉取业务进程，而不需要等待负载均衡周期的到来。其中，负载均衡周期用于限制执行负载均衡的频次，以避免过于频繁地进行负载均衡。

在一些可能的实现方式中，被迁移的第一业务进程是位于该主场CPU的运行队列中队尾的主场进程。

8032、在当前调度周期内，在迁出的CPU为该主场CPU且迁入的CPU为与该容器未建立绑定关系的客场CPU的情况下，响应于该主场CPU的负载低于第二负载阈值，从迁入的CPU将第一业务进程迁回该主场CPU。

804、响应于该容器内的第一业务进程被迁移，物理服务器确定第一业务进程在迁入的CPU上的运行优先级；根据第一业务进程的运行优先级，在迁入的CPU上运行第一业务进程。

在本申请实施例中，在迁出的CPU为该主场CPU且迁入的CPU为与该容器未建立绑定关系的客场CPU的情况下，第一业务进程在迁入的CPU上的运行优先级会被设置为第二运行优先级，即第一业务进程在迁入的CPU上以较低的优先级运行，以避免影响这个CPU上主场进程的执行。

在迁入的CPU为该主场CPU且迁出的CPU为与该容器未建立绑定关系的客场CPU的情况下，第一业务进程在迁入的CPU上的运行优先级会被设置为第一运行优先级，即第一业务进程在回归其主场CPU后，会较高的优先级运行。

在另一些可能的实现方式中，本申请实施例还包括另外一种扩容逻辑，即参见图10，上述步骤803-804还可以被如下步骤805-806替代。

805、响应于该运行状态数据包括负载，在当前调度周期内，响应于该主场CPU的负载位于目标阈值区间，物理服务器在与该容器未建立绑定关系的客场CPU中确定负载最低的第一CPU；在设备上的全量CPU中确定负载最高的第三CPU；将运行在第三CPU上的第二业务进程迁入第一CPU。

在一些可能的实现方式中，将运行在第三CPU上的第二业务进程迁入第一CPU，包括但不限于如下方式：在目标时长后，将位于第三CPU的运行队列中的第二业务进程加入到第一CPU的运行队列中；其中，目标时长是根据负载均衡周期设置的。

示例性地，该目标阈值区间为0.6-0.8，本申请在此不做限制。

以该目标阈值区间为0.6-0.8为例，假设该主场CPU的负载超过0.6但小于0.8，那么动态扩缩容单元会在该容器的客场CPU中挑选最空闲即负载最低的CPU，并且向该客场CPU发送周期性负载均衡的IPI中断，该客场CPU在接收到周期性负载均衡的IPI中断后，会缩短执行负载均衡的周期，比如在达到一半的负载均衡周期时即进行周期性负载均衡。示例性地，周期性负载均衡会从全局CPU中去寻找最为繁忙的CPU，进而从最为繁忙的CPU上去拉取业务进程。

在另一些可能的实现方式中，被迁移的第二业务进程是位于该CPU的运行队列中队尾的主场进程。

806、物理服务器确定第二业务进程在第一CPU上的运行优先级；根据第二业务进程的运行优先级，在第一CPU上运行第二业务进程。

本步骤与上述步骤804同理，此处不再赘述。

在另一些可能的实现方式中，本申请实施例还包括缩容逻辑。针对缩容逻辑，比如当该主场CPU的业务进程运行在客场CPU上时，响应于该客场CPU的运行状态数据满足负载均衡条件，比如负载增高或迁移过来的业务进程的调度时延过大，那么便会触发缩容操作。其中，图11是根据一示例性实施例示出的一种缩容逻辑的示意图。在图11中，CPU6作为容器1的客场CPU，其运行状态数据满足负载均衡条件，比如CPU6因为运行其主场进程导致负载增高，因此被迁移过来的业务进程需要迁回到其主场CPU即CPU1上去运行。

参见图12，在步骤804之后还包括如下步骤807。

807、响应于运行状态数据包括进程的调度时延；在迁出的CPU为该主场CPU且迁入的CPU为与该容器未建立绑定关系的客场CPU的情况下，在下一个调度周期内，响应于迁入的CPU的运行队列中进程的调度时延大于第三时间阈值，物理服务器从迁入的CPU将第一业务进程迁回该主场CPU。

示例性地，上述第三时间阈值可以是24ms，本申请在此不做限制。

以第三时间阈值为24ms为例，假设在客场CPU上第一业务进程的调度时延大于24ms，那么动态扩缩容单元会向该主场CPU发送强制负载均衡的IPI中断；该主场CPU在接收到强制负载均衡的IPI中断后，执行强制负载均衡，直接到该客场CPU的运行队列中拉取第一业务进程，第一业务进程在回归该主场CPU后，会以较高的优先级运行。

在另一些可能的实现方式中，本申请实施例还包括另外一种缩容逻辑。

其中，在迁出的CPU为该主场CPU且迁入的CPU为与该容器未建立绑定关系的客场CPU的情况下，本申请实施例示出的缩容逻辑还包括：

在下一个调度周期内，响应于迁入的CPU的负载高于第三负载阈值，在设备上的全量CPU中确定负载最高的第三CPU；将运行在第三CPU上的第三业务进程迁入该主场CPU；确定第三业务进程在该主场CPU上的运行优先级；根据第三业务进程的运行优先级，在该主场CPU上运行第三业务进程；或，

在下一个调度周期内，响应于迁入的CPU的运行队列中进程的调度时延大于第二时间阈值，在设备上的全量CPU中确定进程的调度时延最大的第四CPU；将运行在第四CPU上的第四业务进程迁入该主场CPU；确定第四业务进程在该主场CPU上的运行优先级；根据第四业务进程的运行优先级，在该主场CPU上运行第四业务进程。

在另一些可能的实现方式中，第三CPU和第四CPU既可能是同一CPU，也可能是不同的CPU，相应地，第三业务进程和第四业务进程既可能是同一业务进程，也可能是不同的业务进程，本申请在此不做限制。另外，被迁移的第三业务进程和第四业务进程可以是位于相应CPU的运行队列中队尾的主场进程，本申请在此同样不做限制。

示例性地，上述第三负载阈值可以是0.7，上述第二时间阈值可以是18ms，本申请在此不做限制。以第三负载阈值为0.7，第二时间阈值为18ms为例，假设该客场CPU的负载超过0.7或者进程的调度时延大于18ms，那么动态扩缩容单元会向该主场CPU发送周期性负载均衡的IPI中断；该主场CPU在接收到周期性负载均衡的IPI中断后，会忽略负载均衡周期的时间控制，直接进行周期性负载均衡，从全局CPU中寻找最繁忙的CPU，直接到该CPU的运行队列中拉取业务进程。

另外，本申请实施例还支持业务进程在多个CPU之间进行调度，能够实现高效地业务进程迁移。这种调度方式能够避免出现即使某些CPU处于空闲状态也不能运行业务进程的情况，确保了资源利用率。

另外，本申请实施例还提出了运行优先级的概念；示例性地，假设该容器内的第一业务进程被迁移，那么会确定第一业务进程在迁入的CPU上的运行优先级，进而根据第一业务进程的运行优先级，在迁入的CPU上运行第一业务进程，该种优先级控制方式能够避免出现不同业务之间相互冲突的情况。其中，第一业务进程在迁入的CPU上按照确定的优先级运行，不会影响与该CPU绑定的容器内业务进程在其上的运行，确保了业务性能。

在另一些可能的实现方式中，针对上述步骤804，如果第一业务进程迁入的CPU上当前没有运行自己的主场进程，那么可以暂时地按照一定规则将这个CPU上运行的客场进程设置为高优先级，等有主场进程运行时，再切换回低优先级。详细来讲，在迁入的CPU为与该容器未建立绑定关系的客场CPU的情况下，本申请实施例提供的方法还包括：响应于当前未运行迁入的CPU的主场进程，且当前在迁入的CPU上运行的客场进程中第一业务进程所属业务的时延敏感度最高，将第一业务进程的运行优先级临时调整为第二运行优先级；响应于迁入的CPU的主场进程处于就绪状态，将第一业务进程的运行优先级调整回第一运行优先级。其中，时延敏感度用于表征业务对时延的敏感程度。

在另一些可能的实现方式中，响应于该主场CPU的运行状态数据满足负载均衡条件，在该主场CPU和客场CPU之间进行业务进程迁移，还可以包括：在当前调度周期内，响应于该主场CPU的运行状态数据满足负载均衡条件且迁出的CPU为该主场CPU，根据当前调度周期内的运行状态数据，在与该容器未建立绑定关系的客场CPU中确定多个候选迁入对象；预测多个候选迁入对象在之后多个调度周期内的运行状态数据；根据多个候选迁入对象在当前调度周期内的运行状态数据和预测的运行状态数据，在多个候选迁入对象中确定迁入的CPU；在该主场CPU和迁入的CPU之间进行业务进程迁移。示例性地，可以根据每个候选迁入对象的运行队列中进程的个数进行预测，或者，还可以根据每个候选迁入对象绑定的容器所处理的业务类型进行预测，本申请在此不做限制。

图13是根据一示例性实施例示出的一种基于容器的进程调度装置的结构示意图。参见图13，该装置包括以下模块。

获取模块1301，被配置为对于任意一个容器，周期性获取所述容器的主场CPU的运行状态数据；其中，所述主场CPU是指设备上与所述容器建立绑定关系的CPU；所述容器绑定的CPU个数小于目标数目，所述目标数目是指满足所述容器的业务运行需求所需的CPU个数。

调度模块1302，被配置为响应于所述主场CPU的运行状态数据满足负载均衡条件，在所述主场CPU和客场CPU之间进行业务进程迁移；其中，所述客场CPU是指所述设备上与所述容器未建立绑定关系的CPU。

确定模块1303，被配置为响应于所述容器内的第一业务进程被迁移，确定所述第一业务进程在迁入的CPU上的运行优先级。

运行模块1304，被配置为根据所述第一业务进程的运行优先级，在所述迁入的CPU上运行所述第一业务进程。

本申请实施例提供的调度方案，首先基于设备上容器与CPU之间的绑定关系提出了主场CPU和客场CPU的概念；对于任意一个容器，与该容器建立绑定关系的CPU称之为该容器的主场CPU，与该容器未建立绑定关系的CPU称之为该容器的客场CPU。且，每个容器绑定的CPU个数小于目标数目，其中，目标数目是指满足每个容器的业务运行需求所需的CPU个数。由于每个容器绑定了较少的CPU，因此能够在同一个设备上部署更多的容器，提供给不同的业务使用，实现了较高的CPU资源超卖，能够提升资源利用率。其中，超卖在此处是指实际拥有的CPU资源小于分配的CPU资源。

上述所有可选技术方案，可以采用任意结合形成本公开的可选实施例，在此不再一一赘述。

需要说明的是：上述实施例提供的基于容器的进程调度装置在进行进程调度时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将装置的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的基于容器的进程调度装置与基于容器的进程调度方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

在示例性实施例中，还提供了一种计算机可读存储介质，例如包括程序代码的存储器，上述程序代码可由计算机设备中的处理器执行以完成上述实施例中的基于容器的进程调度方法。例如，所述计算机可读存储介质可以是只读存储器（Read-Only Memory，ROM）、随机存取存储器（Random Access Memory，RAM）、光盘只读存储器（Compact Disc Read-Only Memory，CD-ROM）、磁带、软盘和光数据存储设备等。

在示例性实施例中，还提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机程序代码，该计算机程序代码存储在计算机可读存储介质中，计算机设备的处理器从计算机可读存储介质读取该计算机程序代码，处理器执行该计算机程序代码，使得该计算机设备执行上述基于容器的进程调度方法。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本申请的可选实施例，并不用以限制本申请，凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

1.一种基于容器的进程调度方法，其特征在于，所述方法包括：

对于任意一个容器，周期性获取所述容器的主场中央处理单元CPU的运行状态数据；其中，主场CPU是指设备上与所述容器建立绑定关系的CPU；所述容器绑定的CPU个数小于目标数目，所述目标数目是指满足所述容器的业务运行需求所需的CPU个数；

2.根据权利要求1所述的方法，其特征在于，所述运行状态数据包括所述主场CPU的运行队列中进程的调度时延；

所述周期性获取所述容器的主场中央处理单元CPU的运行状态数据，包括：

周期性获取所述主场CPU的主场进程列表中主场进程的调度时延；其中，所述主场进程是指所述容器内的业务进程；

周期性获取所述主场CPU的客场进程列表中客场进程的调度时延；其中，所述客场进程是指与所述主场CPU未建立绑定关系的容器内的业务进程。

3.根据权利要求1所述的方法，其特征在于，所述确定所述第一业务进程在迁入的CPU上的运行优先级，包括：

响应于所述迁入的CPU为所述主场CPU，将所述第一业务进程在所述迁入的CPU上的运行优先级设置为第一运行优先级；

响应于所述迁入的CPU为与所述容器未建立绑定关系的客场CPU，将所述第一业务进程在所述迁入的CPU上的运行优先级设置为第二运行优先级；

其中，所述第一运行优先级高于所述第二运行优先级。

4.根据权利要求1所述的方法，其特征在于，所述运行状态数据包括所述主场CPU的负载和所述主场CPU的运行队列中进程的调度时延；

所述响应于所述主场CPU的运行状态数据满足负载均衡条件，在所述主场CPU和客场CPU之间进行业务进程迁移，包括：

在当前调度周期内，响应于所述主场CPU的负载高于第一负载阈值，在与所述容器未建立绑定关系的客场CPU中确定负载最低的第一CPU；将运行在所述主场CPU上的所述第一业务进程迁入所述第一CPU；或，

在当前调度周期内，响应于所述主场CPU的运行队列中进程的调度时延大于第一时间阈值，在与所述容器未建立绑定关系的客场CPU中确定进程的调度时延最小的第二CPU；将运行在所述主场CPU上的所述第一业务进程迁入所述第二CPU。

5.根据权利要求1所述的方法，其特征在于，所述运行状态数据包括所述主场CPU的负载；

在当前调度周期内，在迁出的CPU为所述主场CPU且所述迁入的CPU为与所述容器未建立绑定关系的客场CPU的情况下，响应于所述主场CPU的负载低于第二负载阈值，从所述迁入的CPU将所述第一业务进程迁回所述主场CPU。

6.根据权利要求1所述的方法，其特征在于，所述运行状态数据包括所述主场CPU的负载；所述方法还包括：

在当前调度周期内，响应于所述主场CPU的负载位于目标阈值区间，在与所述容器未建立绑定关系的客场CPU中确定负载最低的第一CPU；

在所述设备上的全量CPU中确定负载最高的第三CPU；

将运行在所述第三CPU上的第二业务进程迁入所述第一CPU；

确定所述第二业务进程在所述第一CPU上的运行优先级；

根据所述第二业务进程的运行优先级，在所述第一CPU上运行所述第二业务进程。

7.根据权利要求6所述的方法，其特征在于，所述将运行在所述第三CPU上的第二业务进程迁入所述第一CPU，包括：

在目标时长后，将位于所述第三CPU的运行队列中的所述第二业务进程加入到所述第一CPU的运行队列中；

其中，所述目标时长是根据负载均衡周期设置的。

8.根据权利要求1所述的方法，其特征在于，所述运行状态数据包括所述主场CPU的负载和所述主场CPU的运行队列中进程的调度时延；

在迁出的CPU为所述主场CPU且所述迁入的CPU为与所述容器未建立绑定关系的客场CPU的情况下，所述方法还包括：

在下一个调度周期内，响应于迁入的CPU的负载高于第三负载阈值，在所述设备上的全量CPU中确定负载最高的第三CPU；将运行在所述第三CPU上的第三业务进程迁入所述主场CPU；确定所述第三业务进程在所述主场CPU上的运行优先级；根据所述第三业务进程的运行优先级，在所述主场CPU上运行所述第三业务进程；或，

在下一个调度周期内，响应于迁入的CPU的运行队列中进程的调度时延大于第二时间阈值，在所述设备上的全量CPU中确定进程的调度时延最大的第四CPU；将运行在所述第四CPU上的第四业务进程迁入所述主场CPU；确定所述第四业务进程在所述主场CPU上的运行优先级；根据所述第四业务进程的运行优先级，在所述主场CPU上运行所述第四业务进程。

9.根据权利要求1所述的方法，其特征在于，所述运行状态数据包括所述主场CPU的运行队列中进程的调度时延；

在下一个调度周期内，响应于所述迁入的CPU的运行队列中进程的调度时延大于第三时间阈值，从所述迁入的CPU将所述第一业务进程迁回所述主场CPU。

10.根据权利要求3所述的方法，其特征在于，在所述迁入的CPU为与所述容器未建立绑定关系的客场CPU的情况下，所述方法还包括：

响应于当前未运行所述迁入的CPU的主场进程，且当前在所述迁入的CPU上运行的客场进程中所述第一业务进程所属业务的时延敏感度最高，将所述第一业务进程的运行优先级临时调整为所述第二运行优先级；

响应于所述迁入的CPU的主场进程处于就绪状态，将所述第一业务进程的运行优先级调整回所述第一运行优先级。

11.根据权利要求1所述的方法，其特征在于，所述响应于所述主场CPU的运行状态数据满足负载均衡条件，在所述主场CPU和客场CPU之间进行业务进程迁移，包括：

在当前调度周期内，响应于所述主场CPU的运行状态数据满足负载均衡条件且迁出的CPU为所述主场CPU，根据当前调度周期内的运行状态数据，在与所述容器未建立绑定关系的客场CPU中确定多个候选迁入对象；

预测所述多个候选迁入对象在之后多个调度周期内的运行状态数据；

根据所述多个候选迁入对象在当前调度周期内的运行状态数据和预测的运行状态数据，在所述多个候选迁入对象中确定所述迁入的CPU；

在所述主场CPU和所述迁入的CPU之间进行业务进程迁移。

12.一种基于容器的进程调度装置，其特征在于，所述装置包括：

获取模块，被配置为对于任意一个容器，周期性获取所述容器的主场中央处理单元CPU的运行状态数据；其中，主场CPU是指设备上与所述容器建立绑定关系的CPU；所述容器绑定的CPU个数小于目标数目，所述目标数目是指满足所述容器的业务运行需求所需的CPU个数；

13.一种计算机设备，其特征在于，所述设备包括处理器和存储器，所述存储器中存储有至少一条程序代码，所述至少一条程序代码由所述处理器加载并执行以实现如权利要求1至11中任一项权利要求所述的基于容器的进程调度方法。

14.一种计算机可读存储介质，其特征在于，所述存储介质中存储有至少一条程序代码，所述至少一条程序代码由处理器加载并执行以实现如权利要求1至11中任一项权利要求所述的基于容器的进程调度方法。

15.一种计算机程序，其特征在于，所述计算机程序包括计算机程序代码，所述计算机程序代码存储在计算机可读存储介质中，计算机设备的处理器从所述计算机可读存储介质读取所述计算机程序代码，所述处理器执行所述计算机程序代码，使得所述计算机设备执行如权利要求1至11中任一项权利要求所述的基于容器的进程调度方法。