WO2021063339A1

WO2021063339A1 - 集群资源调度方法、装置、设备及储存介质

Info

Publication number: WO2021063339A1
Application number: PCT/CN2020/118691
Authority: WO
Inventors: 陈松; 郑淮城
Original assignee: 星环信息科技(上海)股份有限公司
Priority date: 2019-09-30
Filing date: 2020-09-29
Publication date: 2021-04-08
Also published as: CN110727512B; CN110727512A

Abstract

一种集群资源调度方法、装置、设备（412）及储存介质，方法包括根据获取到的待调度pod，基于预设选择策略对集群中的至少一个预设节点进行筛选得到节点筛选结果（110，210）；当节点筛选结果为不存在符合预设选择策略的可调度节点时，根据节点筛选结果、集群的实时资源使用信息和待调度pod的资源请求，从至少一个预设节点中筛选出至少一个第一节点（120）；基于舍弃资源请求可用性检查的预设选择策略从至少一个第一节点中筛选出可运行待调度pod的至少一个第二节点（130，240）；根据待调度pod的属性和至少一个第二节点的物理资源大小确定pod运行节点（140，250）；将待调度pod与pod运行节点进行绑定（150，260）。

Description

集群资源调度方法、装置、设备及储存介质

本申请要求在2019年9月30日提交中国专利局、申请号为201910945530.6的中国专利申请的优先权，该申请的全部内容通过引用结合在本申请中。

技术领域

本申请实施例涉及云计算技术，例如一种集群资源调度方法、装置、设备及储存介质。

背景技术

资源共享的分布式系统中，任务的调度是基于资源预定义进行划分的。这样系统可以根据当前集群资源情况将任务调度到最合理的节点上，尽可能地增加集群的资源使用率和节点间的负载均衡。

Kubernetes是一套全新的基于容器技术的分布式管理系统。他通过限定任务(pod)的资源requests和limits进行任务资源划分，其中调度模块是通过计算任务的资源requests，通过预定义的打分算法进行任务调度。

但是整个过程是以当前局部最优解作为参考，同时调度信息完全依赖任务预定义的资源requests，没有考虑实时资源的使用情况。从该点看来，Kubernetes是一个基于资源预留的系统。然而在实际使用中，用户对任务的实际使用资源量并不能做出合理的预估，而且在实际的使用中也可以看到，用户为了保证自己的任务能够正常的运行，都会request一个较大值，而在实际的集群资源使用监控中可以看到，任务实际的资源使用小于甚至远小于request值的。这样会造成节点的资源利用率低，并且，集群的节点资源使用不均衡。

发明内容

本申请实施例提供一种集群资源调度方法、装置、设备及储存介质，以实现充分利用集群资源，平衡节点调度。

第一方面，本申请实施例提供了一种集群资源调度方法，包括：

根据获取到的待调度pod，基于预设选择策略对集群中的至少一个预设节点进行筛选，得到节点筛选结果；

当所述节点筛选结果为不存在符合所述预设选择策略的可调度节点时，根据所述节点筛选结果、所述集群的实时资源使用信息和所述待调度pod的资源请求，从所述至少一个预设节点中筛选出至少一个第一节点；

基于舍弃资源请求可用性检查的所述预设选择策略，从所述至少一个第一节点中筛选出可运行所述待调度pod的至少一个第二节点；

根据所述待调度pod的属性和所述至少一个第二节点的物理资源大小确定pod运行节点；

将所述待调度pod与所述pod运行节点进行绑定。

第二方面，本申请实施例还提供了一种集群资源调度装置，该装置包括：

预设节点筛选模块，设置为根据获取到的待调度pod，基于预设选择策略对集群中的至少一个预设节点进行筛选，得到节点筛选结果；

第一节点筛选模块，设置为当所述节点筛选结果为不存在符合所述预设选择策略的可调度节点时，根据所述节点筛选结果、所述集群的实时资源使用信息和所述待调度pod的资源请求，从所述至少一个预设节点中筛选出至少一个第一节点；

第二节点筛选模块，设置为基于舍弃资源请求可用性检查的所述预设选择策略，从所述至少一个第一节点中筛选出可运行所述待调度pod的至少一个第二节点；

pod运行节点确定模块，设置为根据所述待调度pod的属性和所述至少一个第二节点的物理资源大小确定pod运行节点；

pod绑定模块，设置为将所述待调度pod与所述pod运行节点进行绑定。

第三方面，本申请实施例还提供了一种设备，所述设备包括：

至少一个处理器；

存储器，设置为存储至少一个程序；

当所述至少一个程序被所述至少一个处理器执行，使得所述至少一个处理器实现如本申请任意实施例所提供的集群资源调度方法。

第四方面，本申请实施例还提供了一种包含计算机可执行指令的存储介质，所述计算机可执行指令在由计算机处理器执行时用于执行如本申请任意实施例所提供的集群资源调度方法。

附图说明

图1是本申请实施例一中的一种集群资源调度方法的流程图；

图2是本申请实施例二中的一种集群资源调度方法的流程图；

图3是本申请实施例三中的一种集群资源调度装置的结构示意图；

图4是本申请实施例四中的一种计算机设备的结构示意图。

具体实施方式

Kubernetes是一套全新的基于容器技术的分布式管理系统。Kubernetes调度的根本工作任务是根据各种调度算法将pod绑定(bind)到最合适的工作节点，整个调度流程分为三个阶段：预选(Predicates)、优选(Priorities)和抢占(Preempt)。

预选阶段：以所有节点信息作为输入，输出则是满足预选条件的节点。kube-scheduler根据预设选择策略过滤掉不满足条件的节点Node。例如，如果某节点的资源不足或者不满足预设选择策略的条件，如Node的label无法匹配上pod的Selector时则无法通过预选。

优选阶段：以预选阶段筛选出的节点信息作为输入，然后调度器会根据优选策略为通过预选的Node进行打分排名，选择得分最高的Node。例如，资源越充足、负载越小，Node的得分越高。

抢占阶段：经过预选、优选两个阶段，未能找到适合调度当前pod的Node，如果开启了抢占，那么kube-scheduler会启动Preempt流程，根据当前要调度的 pod的优先级以及集群上已经正常运行的pod属性等特点筛选出一个适合抢占的节点，抢占某些低优先级的pod，调度当前pod到该节点上。

调度器每次进行pod调度的决策是基于当前集群状态得到的一个局部最优解。但实际情况是，运行在集群上的任务是复杂多样的：有长时任务和短时任务，有在线任务和离线任务，而且由于用户对于资源使用资源的不准确预估，每个任务实际使用的资源也是和预定义资源请求有出入的。以上事实均表明，原生的Kubernetes调度系统并不能很好地满足复杂多样的任务调度。

本申请实施例提供的技术方案，在调度时依然优先考虑默认调度器的方式。以用户的requests作为优先考虑的调度因素下，基于用户设置资源requests不合理的假设，提出一套能够利用实时资源使用信息来进行调度决策的调度系统，该系统作为实时调度阶段，置于预选和优选阶段之后，放在抢占阶段之前。

实施例一

图1为本申请实施例一提供的一种集群资源调度方法的流程图，本实施例可适用于进行集群资源调度的情况，该方法可以由集群资源调度装置来执行，该装置可以由硬件和/或软件来实现，包括步骤110至步骤150。

在步骤110中，根据获取到的待调度pod，基于预设选择策略对集群中的至少一个预设节点进行筛选，得到节点筛选结果。

其中，在系统开始调度流程时，从pod队列中获取待调度pod。先基于预设选择策略进行筛选，基于优选策略为通过预选的节点进行打分排名，选出得分最高的节点，得分最高的节点用于调度待调度pod。预设选择策略为预选阶段的预设选择策略，如果在预选阶段无法找到可供打分排名的预设节点，那么意味着需要进行实时调度，如果在预选阶段筛选出部分预设节点，就可以进行打分排名，选出最高分的预设节点与待调度pod进行绑定。根据预设选择策略对至少一个预设节点进行筛选，确定预设节点与预设选择策略的匹配情况，由此生成节点筛选结果，节点筛选结果包括不可调度节点；还包括这些节点的错误信息，也就是这些节点在预设选择策略下被认为属于不可调度节点的原因。

在一实施例中，基于预设选择策略对集群中的至少一个预设节点进行筛选，得到节点筛选结果，包括：根据预设选择策略对集群中的至少一个预设节点进行筛选，确定不符合预设选择策略的不可调度节点并记录对应的错误信息；将不可调度节点和对应的错误信息作为节点筛选结果。其中，不可调度节点可能是资源不足不能达到待调度pod的资源请求值，那么，错误信息就是该预设节点资源不足；也可能是节点的标签无法匹配上待调度pod的选择器，那么，错误信息就是节点的标签不匹配待调度pod的选择器。

在步骤120中，当节点筛选结果为不存在符合预设选择策略的可调度节点时，根据节点筛选结果、集群的实时资源使用信息和待调度pod的资源请求，从至少一个预设节点中筛选出至少一个第一节点。

其中，如果经过筛选，没有找到符合预设选择策略的预设节点，就需要采用实时调度策略。依据预选阶段进行筛选时得到的预设节点的信息，以及本阶段得到的集群节点实时利用率筛选出一些可用物理资源满足待调度pod的预设节点作为第一节点。此时筛选出的第一节点具备调度待调度pod的资源。

在步骤130中，基于舍弃资源请求可用性检查的预设选择策略，从至少一个第一节点中筛选出可运行待调度pod的至少一个第二节点。

其中，从预设选择策略中删除对资源请求(request)的可用性检查，再一次针对上一步骤中返回的第一节点运行预设选择策略，筛选出可运行待调度pod的预设节点作为第二节点。

在步骤140中，根据待调度pod的属性和至少一个第二节点的物理资源大小确定pod运行节点。

其中，上一步骤中返回的第二节点都可以用来运行待调度pod，但是还需要根据待调度pod的属性以及第二节点的物理资源大小排序，筛选出最合适的第二节点，经过这一步骤，集群的物理资源使用均衡性得到提高。

在一实施例中，根据待调度pod的属性和至少一个第二节点的物理资源大小确定pod运行节点，包括：根据至少一个第二节点的物理资源大小对至少一个第二节点进行排序；将与待调度pod的属性相匹配且具有最大物理资源的第二节点确定为pod运行节点。

在步骤150中，将待调度pod与pod运行节点进行绑定。

其中，经过以上步骤筛选出集群中的某个预设节点作为pod运行节点，则将待调度pod与pod运行节点进行绑定，以便在该节点上运行待调度pod。

本实施例的技术方案，通过引入实时调度，增加对实时资源使用情况的分析来调用集群资源，避免节点的资源利用率低，集群的节点资源使用不均衡的情况，实现充分利用集群资源，平衡节点调度的效果。

实施例二

图2为本申请实施例二提供的一种集群资源调度方法的流程图，本实施例的技术方案在上述技术方案的基础上进行细化，包括步骤210至步骤260。

在步骤210中，根据获取到的待调度pod，基于预设选择策略对集群中的至少一个预设节点进行筛选，得到节点筛选结果。

在步骤220中，当至少一个预设节点全部为不可调度节点，根据错误信息从至少一个预设节点中过滤掉状态未就绪节点和选择器不匹配节点。

其中，在启动实时调度策略后，根据预选阶段返回的不可调度节点的错误信息，在集群的所有预设节点中过滤掉状态未就绪节点(NodeNotReady)、选择器不匹配节点(NodeSelectorNotMatch)等不可调度节点。

在步骤230中，根据集群的实时资源使用信息和待调度pod的资源请求，从过滤掉状态未就绪节点和选择器不匹配节点后的至少一个预设节点中筛选出可用物理资源满足待调度pod物理资源请求值的至少一个第一节点。

其中，获取集群当前的实时资源使用信息，按照调度待调度pod的需求，从过滤掉状态未就绪节点和选择器不匹配节点后的至少一个预设节点中筛选出可用物理资源满足待调度pod物理资源请求值的节点。

在步骤240中，基于舍弃资源请求可用性检查的预设选择策略，从至少一个第一节点中筛选出可运行待调度pod的至少一个第二节点。

在步骤250中，根据待调度pod的属性和至少一个第二节点的物理资源大小确定pod运行节点。

在步骤260中，将待调度pod与pod运行节点进行绑定。

如果上述的实时调度策略未能筛选出可调度的节点，那么说明当前状态下，集群中的物理资源确实无法满足调度待调度pod的requests所需资源，需要进入抢占阶段。基于集群上任务的复杂多样性，而且任务的资源使用并不是恒定不变的，可以乐观假设集群有能力提供一定的资源供新调度的pod运行，基于这种乐观假设，待调度pod的requests过高，实际上运行它并不需要这么多的资源，而且经过这一段时间，集群的状态很可能发生变化，基于此假设，该待调度pod在逻辑上是可以被调度到节点上运行的。该策略同时输出需要抢占的pod列表作为victims，由于是乐观假设，如果集群真的无法满足当前的资源请求，Eviction manager会优先驱逐这些pod，为集群腾出足够的资源。

在一实施例中，在根据获取到的待调度pod，基于预设选择策略对集群中的至少一个预设节点进行筛选，得到节点筛选结果之后，还包括：

当不存在可用物理资源满足待调度pod物理资源请求值的第一节点时，获取至少一个潜在可调度节点，其中，潜在可调度节点为不违背亲和性且不存在污点的预设节点；获取潜在的可调度节点，这些节点须是不违背亲和性和不存在污点等，例如，不能为NodeNotReady、NodeSelectorNotMatch等节点。

基于至少一个潜在可调度节点的物理资源的优先级从至少一个潜在可调度节点中筛选出可调度节点，并输出可调度节点上待驱逐pod列表；其中，待驱逐pod列表包括因资源抢占而需要驱逐的pod；

将待调度pod与可调度节点进行绑定，并将待驱逐pod列表标记在待调度pod中；

当集群中高优先级的任务资源不足时，驱逐待驱逐pod列表中的pod，以运行待调度pod。

其中，抢占调度策略将上述的待驱逐pod列表标记在待调度pod中，基于乐观假设，不做真正的驱逐，等到集群上其它高优先级的任务资源不足需要发生驱逐时才会做真正的驱逐。上述延迟抢占只进行逻辑上的资源抢占，并没有立即抢占资源，这种延时抢占的调度方法，可以在逻辑上为高优先级的任务腾出资源，在资源没有被充分利用时，继续运行被抢占的任务，可以提高资源的利用率。保证了尽可能多的任务能运行起来，充分地利用了集群的物理资源，同时依赖于集群有压力时的自动驱逐保证了高优先级任务能够得到它需要的物理资源。

实施例三

图3为本申请实施例三提供的一种集群资源调度装置的结构示意图，该装置包括预设节点筛选模块310、第一节点筛选模块320、第二节点筛选模块330、pod运行节点确定模块340以及pod绑定模块350。

预设节点筛选模块310，设置为根据获取到的待调度pod，基于预设选择策略对集群中的至少一个预设节点进行筛选，得到节点筛选结果。

第一节点筛选模块320，设置为当所述节点筛选结果为不存在符合所述预设选择策略的可调度节点时，根据所述节点筛选结果、所述集群的实时资源使用信息和所述待调度pod的资源请求，从所述至少一个预设节点中筛选出至少一个第一节点。

第二节点筛选模块330，设置为基于舍弃资源请求可用性检查的所述预设选择策略，从所述至少一个第一节点中筛选出可运行所述待调度pod的至少一个第二节点。

pod运行节点确定模块340，设置为根据所述待调度pod的属性和所述至少一个第二节点的物理资源大小确定pod运行节点。

pod绑定模块350，设置为将所述待调度pod与所述pod运行节点进行绑定。

在一实施例中，预设节点筛选模块310，设置为：

根据预设选择策略对所述集群中的所述至少一个预设节点进行筛选，确定不符合所述预设选择策略的不可调度节点并记录对应的错误信息；

将所述不可调度节点和对应的所述错误信息作为所述节点筛选结果。

在一实施例中，第一节点筛选模块320，设置为：

当所述至少一个预设节点全部为所述不可调度节点，根据所述错误信息从至少一个预设节点中过滤掉状态未就绪节点和选择器不匹配节点；

根据所述集群的实时资源使用信息和所述待调度pod的资源请求，从过滤掉所述状态未就绪节点和所述选择器不匹配节点后的至少一个预设节点中筛选出可用物理资源满足所述待调度pod物理资源请求值的所述至少一个第一节点。

在一实施例中，pod运行节点确定模块340，设置为：

根据所述至少一个第二节点的物理资源大小对至少一个第二节点进行排序；

将与所述待调度pod的属性相匹配且具有最大物理资源的所述第二节点确定为所述pod运行节点。

在一实施例中，集群资源调度装置还包括：

潜在可调度节点获取模块，设置为在所述根据获取到的待调度pod，基于预设选择策略对集群中的至少一个预设节点进行筛选，得到节点筛选结果之后，当不存在可用物理资源满足所述待调度pod物理资源请求值的所述第一节点时，获取至少一个潜在可调度节点，其中，所述潜在可调度节点为不违背亲和性且不存在污点的预设节点；

可调度节点筛选模块，设置为基于至少一个潜在可调度节点的物理资源的优先级从所述至少一个潜在可调度节点中筛选出可调度节点，并输出所述可调度节点上待驱逐pod列表；其中，所述待驱逐pod列表包括因资源抢占而需要驱逐的pod；

可调度节点绑定模块，设置为将所述待调度pod与所述可调度节点进行绑定，并将所述待驱逐pod列表标记在所述待调度pod中；

pod驱逐模块，设置为当所述集群中高优先级的任务资源不足时，驱逐所述待驱逐pod列表中的pod，以运行所述待调度pod。

本申请实施例所提供的集群资源调度装置可执行本申请任意实施例所提供的集群资源调度方法，具备执行方法相应的功能模块。

实施例四

图4为本申请实施例四提供的一种计算机设备的结构示意图。图4示出了适于用来实现本申请实施方式的示例性计算机设备412的框图。图4显示的计算机设备412仅仅是一个示例，不应对本申请实施例的功能和使用范围带来任何限制。

如图4所示，计算机设备412以通用计算设备的形式表现。计算机设备412的组件可以包括但不限于：至少一个处理器416，存储器428，连接不同系统组件(包括存储器428和处理器416)的总线418。

总线418表示几类总线结构中的至少一种，包括存储器总线或者存储器控制器，外围总线，图形加速端口，处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说，这些体系结构包括但不限于工业标准体系结构(Industry Standard Architecture，ISA)总线，微通道体系结构(Micro Channel Architecture，MCA)总线，增强型ISA总线、视频电子标准协会(Vedio Electronic Standard Association，VESA)局域总线以及外围组件互连(Peripheral Component Interconnect，PCI)总线。

计算机设备412典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备412访问的可用介质，包括易失性和非易失性介质，可移动的和不可移动的介质。

存储器428设置为存储指令。存储器428可以包括易失性存储器形式的计算机系统可读介质，例如随机存取存储器(Random Access Memory，RAM)430和/或高速缓存存储器432。计算机设备412可以包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例，存储系统434可以设置为读写不可移动的、非易失性磁介质(图4未显示，通常称为“硬盘驱动器”)。尽管图4中未示出，可以提供设置为对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器，以及对可移动非易失性光盘(例如便携式紧凑磁盘只读存储器(Compact Disc Read-Only Memory，CD-ROM)，数字通用光盘只读存储器(Digital Versatile Disc-Read Only Memory，DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下，每个驱动器可以通过至少一个数据介质接口与总线418相连。存储器428可以包括至少一个程序产品，该程序产品具有一组(例如至少一个)程序模块，这些程序模块被配置以执行本申请各实施例的功能。

具有一组(至少一个)程序模块442的程序/实用工具440，可以存储在例如存储器428中，这样的程序模块442包括——但不限于——操作系统、至少一个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块442通常执行本申请所描述的实施例中的功能和/或方法。

计算机设备412也可以与至少一个外部设备414(例如键盘、指向设备、显示器424等)通信，还可与至少一个使得用户能与该计算机设备412交互的设备通信，和/或与使得该计算机设备412能与至少一个其它计算设备进行通信的任何设备(例如网卡，调制解调器等等)通信。这种通信可以通过输入/输出(Input/Output，I/O)接口422进行。并且，计算机设备412还可以通过网络适配器420与至少一个网络(例如局域网(Local Area Network，LAN)，广域网(Wide Area Network，WAN)和/或公共网络，例如因特网)通信。如图所示，网络适配器420通过总线418与计算机设备412的其它模块通信。应当明白，尽管图4中未示出，可以结合计算机设备412使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、磁盘阵列(Redundant Arrays of Independent Disks，RAID)系统、磁带驱动器以及数据备份存储系统等。

处理器416通过运行存储在存储器428中的指令，从而执行各种功能应用以及数据处理，例如执行以下操作：根据获取到的待调度pod，基于预设选择策略对集群中的至少一个预设节点进行筛选，得到节点筛选结果；当所述节点筛选结果为不存在符合所述预设选择策略的可调度节点时，根据所述节点筛选结果、所述集群的实时资源使用信息和所述待调度pod的资源请求，从所述至少一个预设节点中筛选出至少一个第一节点；基于舍弃资源请求可用性检查的所述预设选择策略，从所述至少一个第一节点中筛选出可运行所述待调度pod的至少一个第二节点；根据所述待调度pod的属性和所述至少一个第二节点的物理资源大小确定pod运行节点；将所述待调度pod与所述pod运行节点进行绑定。

在一实施例中，处理器416通过运行存储在存储器428中的指令实现根据获取到的待调度pod，基于预设选择策略对集群中的至少一个预设节点进行筛选，得到节点筛选结果的方式如下：

在一实施例中，处理器416通过运行存储在存储器428中的指令实现所述当所述节点筛选结果为不存在符合所述预设选择策略的可调度节点时，根据所述节点筛选结果、所述集群的实时资源使用信息和所述待调度pod的资源请求，从所述至少一个预设节点中筛选出至少一个第一节点的方式如下：

根据所述集群的实时资源使用信息和所述待调度pod的资源请求，筛选出可用物理资源满足所述待调度pod物理资源请求值的所述至少一个第一节点。

在一实施例中，处理器416通过运行存储在存储器428中的指令实现所述根据所述待调度pod的属性和所述至少一个第二节点的物理资源大小确定pod运行节点的方式如下：

在一实施例中，处理器416通过运行存储在存储器428中的指令实现在所述根据获取到的待调度pod，基于预设选择策略对集群中的至少一个预设节点进行筛选，得到节点筛选结果之后，当不存在可用物理资源满足所述待调度pod物理资源请求值的所述第一节点时，获取至少一个潜在可调度节点，其中，所述潜在可调度节点为不违背亲和性且不存在污点的预设节点；

基于至少一个潜在可调度节点的物理资源的优先级从所述至少一个潜在可调度节点中筛选出可调度节点，并输出所述可调度节点上待驱逐pod列表；其中，所述待驱逐pod列表包括因资源抢占而需要驱逐的pod；

将所述待调度pod与所述可调度节点进行绑定，并将所述待驱逐pod列表标记在所述待调度pod中；

当所述集群中高优先级的任务资源不足时，驱逐所述待驱逐pod列表中的pod，以运行所述待调度pod。

实施例五

本申请实施例五提供了一种计算机可读存储介质，存储介质设置为存储指令，指令用于执行本申请任意实施例所提供的集群资源调度方法。

可以采用至少一个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：具有至少一个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(Erasable Programmable Read-Only Memory，EPROM)或闪存、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括——但不限于——无线、电线、光缆、射频(Radio Frequency，RF)等等，或者上述的任意合适的组合。

可以以至少一种程序设计语言或其组合来编写用于执行本申请操作的计算机程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

Claims

一种集群资源调度方法，包括：

根据获取到的待调度pod，基于预设选择策略对集群中的至少一个预设节点进行筛选，得到节点筛选结果；

在所述节点筛选结果为不存在符合所述预设选择策略的可调度节点的情况下，根据所述节点筛选结果、所述集群的实时资源使用信息和所述待调度pod的资源请求，从所述至少一个预设节点中筛选出至少一个第一节点；

基于舍弃资源请求可用性检查的所述预设选择策略，从所述至少一个第一节点中筛选出可运行所述待调度pod的至少一个第二节点；

根据所述待调度pod的属性和所述至少一个第二节点的物理资源大小确定pod运行节点；

将所述待调度pod与所述pod运行节点进行绑定。
根据权利要求1所述的方法，其中，所述根据获取到的待调度pod，基于预设选择策略对集群中的至少一个预设节点进行筛选，得到节点筛选结果，包括：

根据所述预设选择策略对所述集群中的所述至少一个预设节点进行筛选，确定不符合所述预设选择策略的不可调度节点并记录对应的错误信息；

将所述不可调度节点和对应的所述错误信息作为所述节点筛选结果。
根据权利要求2所述的方法，其中，所述在所述节点筛选结果为不存在符合所述预设选择策略的可调度节点的情况下，根据所述节点筛选结果、所述集群的实时资源使用信息和所述待调度pod的资源请求，从所述至少一个预设节点中筛选出至少一个第一节点，包括：

在所述至少一个预设节点全部为所述不可调度节点的情况下，根据所述错误信息从所述至少一个预设节点中过滤掉状态未就绪节点和选择器不匹配节点；

根据所述集群的实时资源使用信息和所述待调度pod的资源请求，从过滤掉所述状态未就绪节点和所述选择器不匹配节点后的至少一个预设节点中筛选出可用物理资源满足所述待调度pod物理资源请求值的所述至少一个第一节点。
根据权利要求1所述的方法，其中，所述根据所述待调度pod的属性和所述至少一个第二节点的物理资源大小确定pod运行节点，包括：

根据所述至少一个第二节点的物理资源大小对所述至少一个第二节点进行排序；

将与所述待调度pod的属性相匹配且具有最大物理资源的第二节点确定为所述pod运行节点。
根据权利要求1所述的方法，在所述根据获取到的待调度pod，基于预设选择策略对集群中的至少一个预设节点进行筛选，得到节点筛选结果之后，还包括：

在不存在可用物理资源满足所述待调度pod物理资源请求值的第一节点的情况下，获取至少一个潜在可调度节点，其中，所述潜在可调度节点为不违背亲和性且不存在污点的预设节点；

基于所述至少一个潜在可调度节点的物理资源的优先级从所述至少一个潜在可调度节点中筛选出可调度节点，并输出所述可调度节点上待驱逐pod列表；其中，所述待驱逐pod列表包括因资源抢占而需要驱逐的pod；

将所述待调度pod与所述可调度节点进行绑定，并将所述待驱逐pod列表标记在所述待调度pod中；

在所述集群中高优先级的任务资源不足的情况下，驱逐所述待驱逐pod列表中的pod，以运行所述待调度pod。
一种集群资源调度装置，包括：

预设节点筛选模块，设置为根据获取到的待调度pod，基于预设选择策略对集群中的至少一个预设节点进行筛选，得到节点筛选结果；

第一节点筛选模块，设置为在所述节点筛选结果为不存在符合所述预设选择策略的可调度节点的情况下，根据所述节点筛选结果、所述集群的实时资源使用信息和所述待调度pod的资源请求，从所述至少一个预设节点中筛选出至少一个第一节点；

第二节点筛选模块，设置为基于舍弃资源请求可用性检查的所述预设选择策略，从所述至少一个第一节点中筛选出可运行所述待调度pod的至少一个第二节点；

pod运行节点确定模块，设置为根据所述待调度pod的属性和所述至少一个第二节点的物理资源大小确定pod运行节点；

pod绑定模块，设置为将所述待调度pod与所述pod运行节点进行绑定。
一种设备，包括：

至少一个处理器；

存储器，设置为存储至少一个程序；

当所述至少一个程序被所述至少一个处理器执行，使得所述至少一个处理器实现如下操作：

根据获取到的待调度pod，基于预设选择策略对集群中的至少一个预设节点进行筛选，得到节点筛选结果；

在所述节点筛选结果为不存在符合所述预设选择策略的可调度节点的情况下，根据所述节点筛选结果、所述集群的实时资源使用信息和所述待调度pod的资源请求，从所述至少一个预设节点中筛选出至少一个第一节点；

基于舍弃资源请求可用性检查的所述预设选择策略，从所述至少一个第一节点中筛选出可运行所述待调度pod的至少一个第二节点；

根据所述待调度pod的属性和所述至少一个第二节点的物理资源大小确定pod运行节点；

将所述待调度pod与所述pod运行节点进行绑定。
根据权利要求7所述的设备，其中，当所述至少一个程序被所述至少一个处理器执行，使得所述至少一个处理器实现所述根据获取到的待调度pod，基于预设选择策略对集群中的至少一个预设节点进行筛选，得到节点筛选结果的方式如下：

根据预设选择策略对所述集群中的所述至少一个预设节点进行筛选，确定不符合所述预设选择策略的不可调度节点并记录对应的错误信息；

将所述不可调度节点和对应的所述错误信息作为所述节点筛选结果。
根据权利要求8所述的设备，其中，当所述至少一个程序被所述至少一个处理器执行，使得所述至少一个处理器实现所述在所述节点筛选结果为不存在符合所述预设选择策略的可调度节点的情况下，根据所述节点筛选结果、所述集群的实时资源使用信息和所述待调度pod的资源请求，从所述至少一个预设节点中筛选出至少一个第一节点的方式如下：

在所述至少一个预设节点全部为所述不可调度节点的情况下，根据所述错误信息从所述至少一个预设节点中过滤掉状态未就绪节点和选择器不匹配节点；

根据所述集群的实时资源使用信息和所述待调度pod的资源请求，从过滤掉所述状态未就绪节点和所述选择器不匹配节点的至少一个预设节点中筛选出可用物理资源满足所述待调度pod物理资源请求值的所述至少一个第一节点。
根据权利要求7所述的设备，其中，当所述至少一个程序被所述至少一个处理器执行，使得所述至少一个处理器实现所述根据所述待调度pod的属性和所述至少一个第二节点的物理资源大小确定pod运行节点的方式如下：

根据所述至少一个第二节点的物理资源大小对所述至少一个第二节点进行排序；

将与所述待调度pod的属性相匹配且具有最大物理资源的的第二节点确定为所述pod运行节点。
根据权利要求9所述的设备，其中，当所述至少一个程序被所述至少一个处理器执行，使得所述至少一个处理器实现在所述根据获取到的待调度pod，基于预设选择策略对集群中的至少一个预设节点进行筛选，得到节点筛选结果之后，还实现以下操作：

在不存在可用物理资源满足所述待调度pod物理资源请求值的第一节点的情况下，获取至少一个潜在可调度节点，其中，所述潜在可调度节点为不违背亲和性且不存在污点的预设节点；

基于至少一个潜在可调度节点的物理资源的优先级从所述至少一个潜在可调度节点中筛选出可调度节点，并输出所述可调度节点上待驱逐pod列表；其中，所述待驱逐pod列表包括因资源抢占而需要驱逐的pod；

将所述待调度pod与所述可调度节点进行绑定，并将所述待驱逐pod列表标记在所述待调度pod中；

在所述集群中高优先级的任务资源不足的情况下，驱逐所述待驱逐pod列表中的pod，以运行所述待调度pod。
一种包含计算机可执行指令的存储介质，所述计算机可执行指令在由计算机处理器执行时，用于执行如权利要求1-5中任一所述的集群资源调度方法。