CN113590294B - 一种自适应的和规则制导的分布式调度方法 - Google Patents

一种自适应的和规则制导的分布式调度方法 Download PDF

Info

Publication number
CN113590294B
CN113590294B CN202110873454.XA CN202110873454A CN113590294B CN 113590294 B CN113590294 B CN 113590294B CN 202110873454 A CN202110873454 A CN 202110873454A CN 113590294 B CN113590294 B CN 113590294B
Authority
CN
China
Prior art keywords
job
weight
resource
node
scheduling
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110873454.XA
Other languages
English (en)
Other versions
CN113590294A (zh
Inventor
罗鑫
王达
吴冬冬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zhongke Flux Technology Co ltd
Original Assignee
Beijing Ruixin High Throughput Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Ruixin High Throughput Technology Co ltd filed Critical Beijing Ruixin High Throughput Technology Co ltd
Priority to CN202110873454.XA priority Critical patent/CN113590294B/zh
Publication of CN113590294A publication Critical patent/CN113590294A/zh
Application granted granted Critical
Publication of CN113590294B publication Critical patent/CN113590294B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
    • G06F9/4881Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • G06F9/5044Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering hardware capabilities

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Multi Processors (AREA)

Abstract

一种自适应的和规则制导的分布式调度方法,该方法在集群中设置了调度服务器和与计算节点一一对应的资源代理,调度服务器对调度规则进行增加、删除、修改和查看、对调度规则进行解释、生成调度决策并将调度决策发送至对应的资源代理以及接收资源代理发送的作业状态报告并更新作业表。资源代理接收调度决策、根据调度决策对作业进行启动、暂停、恢复及停止操作以及监控对应计算节点上各个作业的进度状态和资源占用状态并生成作业状态报告。本发明大大减少了系统部署时所需的配置工作量,可在不修改调度系统源码、不开发任何插件的情况下随时调整系统的调度策略,甚至可以实现多种调度策略同时共存,大大提高了系统对不同应用场景的适应性。

Description

一种自适应的和规则制导的分布式调度方法
技术领域
本发明涉及集群管理和高性能计算领域,具体而言,涉及一种自适应的和规则制导的分布式调度方法。
背景技术
在高性能计算领域,调度系统是一种基础软件。调度系统的核心功能是管理集群计算资源,按照一定算法决定各个排队作业的启动顺序,并为每个作业分配运行节点,同时监控各个已启动作业的运行状况,在必要时进行动态负载均衡,或者重启运行失败的作业。
调度系统的关键技术是调度策略,即如何决定各个排队作业投入运行的顺序,以及如何为每个作业分配最佳的运行节点。调度策略对集群的吞吐率、资源利用率和功耗都有重要影响。在不同应用场景下,所需要的调度策略也不相同,例如,在科学计算领域,需要在尽可能短的时间内完成所有作业;在商用领域,需要以尽可能低的功耗完成所有作业。近年来,随着集群规模的扩大,调度系统在资源管理方面的便利性也变得越来越重要,人们希望在系统初始配置时减少手工操作,也希望在系统缩扩容时能够自动适应。
SLURM是世界上60%以上的超算中心都在使用的集群管理和作业调度系统。SLURM具有三个核心功能,一是,它为用户分配独占或非独占的资源(计算节点)以供用户运行自己的计算任务;二是,它提供了一套在所分配节点上启动、运行、监控用户作业的框架;三是,它提供了一套排队作业对资源争用的仲裁机制。SLURM还可以通过插件形式扩展自身功能,例如记账、资源预留、回填调度、资源配额、多因素作业优先级计算等等。
SLURM的整体架构如图1所示。SLURM有一个中央管理器(slurmctld),用于监控资源和作业。还存在一个备份的管理器,以便在中央管理器失效时接管它的工作。在每个计算节点上运行有一个slurmd守护进程,它等待中央管理器给它分配作业,运行分配给它的作业,并监控作业的状态,然后等待更多的作业。用户使用一组工具程序与SLURM交互,这组工具程序包括:用于提交作业的srun程序,用于终止作业的scancel程序,用来报告系统状态的sinfo程序,用来报告作业状态的squeue程序,等等。
SLURM的缺点主要有两个:
首先,SLURM通过配置文件的方式配置所有计算节点,当计算节点数量较多时,需要进行大量的手工配置工作,此外,当集群中增减节点时,也需要手工调整配置文件。
其次,SLURM使用基于希尔伯特曲线调度或胖树网络拓扑的最佳拟合算法来优化并行计算机上任务分配的局部性,调度策略较为单一,不能适应复杂应用场景下多样化的调度需求。
发明内容
本发明提供一种自适应的和规则制导的分布式调度方法,用以克服上述现有技术中存在的至少一个问题。
为达到上述目的,本发明提供了一种自适应的和规则制导的分布式调度方法,其包括以下步骤:
在集群中设置一调度服务器;
统计集群内的计算节点,为每一计算节点分别设置一与之对应的资源代理;
启动调度服务器,初始化生成一个资源表和一个作业表,此时资源表和作业表均为空;
资源代理分别收集对应计算节点的配置信息和性能指标数据,形成资源注册请求并将其发送给调度服务器,其中,资源注册请求包括初始资源注册请求和定期资源注册请求;
调度服务器接收资源代理发送来的资源注册请求,判断该资源注册请求是否为首次注册,如果为是,则将该资源注册请求对应的资源加入资源表中并启动一对应该资源的定时器,如果为否,则利用该资源注册请求中的信息对资源进行更新并重置对应的定时器;
资源代理退出时,构建一个资源注销请求并将其发送至调度服务器;
调度服务器接收到资源注销请求后,将对应的资源从资源表中删除;
调度服务器定期检查每一资源的定时器,将已到期的资源从资源表中删除;
调度服务器对调度规则进行增加、删除、修改和查看、对调度规则进行解释、生成调度决策并将调度决策发送至对应的资源代理以及接收资源代理发送的作业状态报告并更新作业表;
资源代理接收调度决策、根据调度决策对作业进行启动、暂停、恢复及停止操作以及监控对应计算节点上各个作业的进度状态和资源占用状态并生成作业状态报告。
在本发明的一实施例中,调度规则包括访问控制规则、亲和规则、作业优先级计算规则以及节点优先级计算规则,其中:
访问控制规则为一个二元组{job-filter,node-filter},其中,job-filter为利用作业的属性构造的一个逻辑表达式,用来匹配作业;node-filter为利用节点的属性构造的另一个逻辑表达式,用来匹配节点,访问控制规则的含义如下:满足job-filter条件的作业不允许使用满足node-filter条件的节点,
亲和规则为一个二元组{job-filter1,job-filter2,affinity},job-filter1和job-filter2均为利用作业属性构造的逻辑表达式,affinity表示亲和性,取值为“必须调度到同一节点”或“必须调度到不同节点”,亲和规则的含义如下:满足job-filter1条件的作业,必须和满足job-filter2条件的作业调度到相同的计算节点上,或:满足job-filter1条件的作业,必须和满足job-filter2条件的作业调度到不同的计算节点上,
作业优先级计算规则为一个六元组{job-filter,cpu-weight,memory-weight,disk-weight,bandwidth-weight,queue-time-weight,run-time-weight},其中,job-filter为利用作业属性构造的一个逻辑表达式,cpu-weight表示作业对CPU资源需求量的权重,memory-weight表示作业对内存资源需求量的权重,disk-weight表示作业对磁盘容量需求量的权重,bandwidth-weight表示作业对网络带宽资源需求量的权重,queue-time-weight表示作业等待时间的权重,run-time-weight表示作业预计运行时间的权重,作业优先级计算规则的含义如下:对于每个满足job-filter条件的作业,按照指定的权重计算它的动态优先级,
节点优先级计算规则为一个九元组{node-filter,cpu-weight,memory-weight,disk-weight,cpu-load-weight,memory-load-weight,disk-load-weight,fail-count-weight,fail-rate-weight},其中,node-filter为利用节点属性构造的一个逻辑表达式,cpu-weight表示节点配置的CPU个数的权重,memory-weight表示节点配置的内存容量的权重,disk-weight表示节点配置的磁盘容量的权重,cpu-load-weight表示节点当前CPU占用率的权重,memory-load-weight表示节点当前内存占用率的权重,disk-load-weight表示节点当前磁盘占用率的权重,fail-count-weight表示节点上运行失败的作业总数的权重,fail-rate-weight表示节点上作业运行失败比率的权重,节点优先级计算规则的含义如下:对于每个满足node-filter条件的节点,按照指定的权重计算它的动态优先级。
在本发明的一实施例中,调度服务器按照以下方式执行调度规则:
按照作业优先级计算规则,计算各个排队作业的动态优先级,选出动态优先级最高的作业进行资源分配,
对于任一作业,根据访问控制规则,排除不允许作业使用的节点,
对于任一作业,根据亲和规则,排除不适宜作业使用的节点,
按照节点优先级计算规则,计算各个备选的计算节点的动态优先级,选出动态优先级最高的多个计算节点并对其分配作业。
本发明提供的自适应的和规则制导的分布式调度方法具有以下有益技术效果:
通过动态注册资源,调度服务器能够自动发现集群内所有的计算节点,不需要任何手工配置,大大减少了系统部署时所需的配置工作量,也保证了系统对集群缩扩容的自适应性。
通过引入多种可配置的调度规则,可在不修改调度系统源码、不开发任何插件的情况下随时调整系统的调度策略,甚至可以实现多种调度策略同时共存,大大提高了系统对不同应用场景的适应性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为SLURM的整体架构示意图;
图2为调度服务器和资源代理的示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图2为调度服务器和资源代理的示意图,参照图2所示,本发明提供的自适应的和规则制导的分布式调度方法,其包括以下步骤:
在集群中设置一调度服务器;
统计集群内的计算节点,为每一计算节点分别设置一与之对应的资源代理;
启动调度服务器,初始化生成一个资源表和一个作业表,此时资源表和作业表均为空;
资源代理分别收集对应计算节点的配置信息和性能指标数据,形成资源注册请求并将其发送给调度服务器,其中,资源注册请求包括初始资源注册请求和定期资源注册请求;
调度服务器接收资源代理发送来的资源注册请求,判断该资源注册请求是否为首次注册,如果为是,则将该资源注册请求对应的资源加入资源表中并启动一对应该资源的定时器,如果为否,则利用该资源注册请求中的信息对资源进行更新并重置对应的定时器;
资源代理退出时,构建一个资源注销请求并将其发送至调度服务器;
调度服务器接收到资源注销请求后,将对应的资源从资源表中删除;
调度服务器定期检查每一资源的定时器,将已到期的资源从资源表中删除;
调度服务器对调度规则进行增加、删除、修改和查看、对调度规则进行解释、生成调度决策并将调度决策发送至对应的资源代理以及接收资源代理发送的作业状态报告并更新作业表;
资源代理接收调度决策、根据调度决策对作业进行启动、暂停、恢复及停止操作以及监控对应计算节点上各个作业的进度状态和资源占用状态并生成作业状态报告。
在本实施例中,调度规则包括访问控制规则、亲和规则、作业优先级计算规则以及节点优先级计算规则,其中:
访问控制规则为一个二元组{job-filter,node-filter},其中,job-filter为利用作业的属性构造的一个逻辑表达式,用来匹配作业;node-filter为利用节点的属性构造的另一个逻辑表达式,用来匹配节点,访问控制规则的含义如下:满足job-filter条件的作业不允许使用满足node-filter条件的节点,
亲和规则为一个二元组{job-filter1,job-filter2,affinity},job-filter1和job-filter2均为利用作业属性构造的逻辑表达式,affinity表示亲和性,取值为“必须调度到同一节点”或“必须调度到不同节点”,亲和规则的含义如下:满足job-filter1条件的作业,必须和满足job-filter2条件的作业调度到相同的计算节点上,或:满足job-filter1条件的作业,必须和满足job-filter2条件的作业调度到不同的计算节点上,
作业优先级计算规则为一个六元组{job-filter,cpu-weight,memory-weight,disk-weight,bandwidth-weight,queue-time-weight,run-time-weight},其中,job-filter为利用作业属性构造的一个逻辑表达式,cpu-weight表示作业对CPU资源需求量的权重,memory-weight表示作业对内存资源需求量的权重,disk-weight表示作业对磁盘容量需求量的权重,bandwidth-weight表示作业对网络带宽资源需求量的权重,queue-time-weight表示作业等待时间的权重,run-time-weight表示作业预计运行时间的权重,作业优先级计算规则的含义如下:对于每个满足job-filter条件的作业,按照指定的权重计算它的动态优先级,
节点优先级计算规则为一个九元组{node-filter,cpu-weight,memory-weight,disk-weight,cpu-load-weight,memory-load-weight,disk-load-weight,fail-count-weight,fail-rate-weight},其中,node-filter为利用节点属性构造的一个逻辑表达式,cpu-weight表示节点配置的CPU个数的权重,memory-weight表示节点配置的内存容量的权重,disk-weight表示节点配置的磁盘容量的权重,cpu-load-weight表示节点当前CPU占用率的权重,memory-load-weight表示节点当前内存占用率的权重,disk-load-weight表示节点当前磁盘占用率的权重,fail-count-weight表示节点上运行失败的作业总数的权重,fail-rate-weight表示节点上作业运行失败比率的权重,节点优先级计算规则的含义如下:对于每个满足node-filter条件的节点,按照指定的权重计算它的动态优先级。
在本实施例中,调度服务器按照以下方式执行调度规则:
按照作业优先级计算规则,计算各个排队作业的动态优先级,选出动态优先级最高的作业进行资源分配,
对于任一作业,根据访问控制规则,排除不允许作业使用的节点,
对于任一作业,根据亲和规则,排除不适宜作业使用的节点,
按照节点优先级计算规则,计算各个备选的计算节点的动态优先级,选出动态优先级最高的多个计算节点并对其分配作业。
本发明中,动态注册资源是通过资源动态注册协议实现,资源动态注册协议例如可以通过多播技术(multicast)实现,也可以采用http协议或消息队列等技术实现。
本发明提供的自适应的和规则制导的分布式调度方法具有以下有益技术效果:
通过动态注册资源,调度服务器能够自动发现集群内所有的计算节点,不需要任何手工配置,大大减少了系统部署时所需的配置工作量,也保证了系统对集群缩扩容的自适应性。
通过引入多种可配置的调度规则,可在不修改调度系统源码、不开发任何插件的情况下随时调整系统的调度策略,甚至可以实现多种调度策略同时共存,大大提高了系统对不同应用场景的适应性。
本领域普通技术人员可以理解:附图只是一个实施例的示意图,附图中的模块或流程并不一定是实施本发明所必须的。
本领域普通技术人员可以理解:实施例中的装置中的模块可以按照实施例描述分布于实施例的装置中,也可以进行相应变化位于不同于本实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围。

Claims (3)

1.一种自适应的和规则制导的分布式调度方法,其特征在于,包括以下步骤:
在集群中设置一调度服务器;
统计集群内的计算节点,为每一计算节点分别设置一与之对应的资源代理;
启动调度服务器,初始化生成一个资源表和一个作业表,此时资源表和作业表均为空;
资源代理分别收集对应计算节点的配置信息和性能指标数据,形成资源注册请求并将其发送给调度服务器,其中,资源注册请求包括初始资源注册请求和定期资源注册请求;
调度服务器接收资源代理发送来的资源注册请求,判断该资源注册请求是否为首次注册,如果为是,则将该资源注册请求对应的资源加入资源表中并启动一对应该资源的定时器,如果为否,则利用该资源注册请求中的信息对资源进行更新并重置对应的定时器;
资源代理退出时,构建一个资源注销请求并将其发送至调度服务器;
调度服务器接收到资源注销请求后,将对应的资源从资源表中删除;
调度服务器定期检查每一资源的定时器,将已到期的资源从资源表中删除;
调度服务器对调度规则进行增加、删除、修改和查看、对调度规则进行解释、生成调度决策并将调度决策发送至对应的资源代理以及接收资源代理发送的作业状态报告并更新作业表;
资源代理接收调度决策、根据调度决策对作业进行启动、暂停、恢复及停止操作以及监控对应计算节点上各个作业的进度状态和资源占用状态并生成作业状态报告。
2.根据权利要求1所述的自适应的和规则制导的分布式调度方法,其特征在于,调度规则包括访问控制规则、亲和规则、作业优先级计算规则以及节点优先级计算规则,其中:
访问控制规则为一个二元组{job-filter,node-filter},其中,job-filter为利用作业的属性构造的一个逻辑表达式,用来匹配作业;node-filter为利用节点的属性构造的另一个逻辑表达式,用来匹配节点,访问控制规则的含义如下:满足job-filter条件的作业不允许使用满足node-filter条件的节点,
亲和规则为一个二元组{job-filter1,job-filter2,affinity},job-filter1和job-filter2均为利用作业属性构造的逻辑表达式,affinity表示亲和性,取值为“必须调度到同一节点”或“必须调度到不同节点”,亲和规则的含义如下:满足job-filter1条件的作业,必须和满足job-filter2条件的作业调度到相同的计算节点上,或:满足job-filter1条件的作业,必须和满足job-filter2条件的作业调度到不同的计算节点上,
作业优先级计算规则为一个六元组{job-filter,cpu-weight,memory-weight,disk-weight,bandwidth-weight,queue-time-weight,run-time-weight},其中,job-filter为利用作业属性构造的一个逻辑表达式,cpu-weight表示作业对CPU资源需求量的权重,memory-weight表示作业对内存资源需求量的权重,disk-weight表示作业对磁盘容量需求量的权重,bandwidth-weight表示作业对网络带宽资源需求量的权重,queue-time-weight表示作业等待时间的权重,run-time-weight表示作业预计运行时间的权重,作业优先级计算规则的含义如下:对于每个满足job-filter条件的作业,按照指定的权重计算它的动态优先级,
节点优先级计算规则为一个九元组{node-filter,cpu-weight,memory-weight,disk-weight,cpu-load-weight,memory-load-weight,disk-load-weight,fail-count-weight,fail-rate-weight},其中,node-filter为利用节点属性构造的一个逻辑表达式,cpu-weight表示节点配置的CPU个数的权重,memory-weight表示节点配置的内存容量的权重,disk-weight表示节点配置的磁盘容量的权重,cpu-load-weight表示节点当前CPU占用率的权重,memory-load-weight表示节点当前内存占用率的权重,disk-load-weight表示节点当前磁盘占用率的权重,fail-count-weight表示节点上运行失败的作业总数的权重,fail-rate-weight表示节点上作业运行失败比率的权重,节点优先级计算规则的含义如下:对于每个满足node-filter条件的节点,按照指定的权重计算它的动态优先级。
3.根据权利要求2所述的自适应的和规则制导的分布式调度方法,其特征在于,调度服务器按照以下方式执行调度规则:
按照作业优先级计算规则,计算各个排队作业的动态优先级,选出动态优先级最高的作业进行资源分配,
对于任一作业,根据访问控制规则,排除不允许作业使用的节点,
对于任一作业,根据亲和规则,排除不适宜作业使用的节点,
按照节点优先级计算规则,计算各个备选的计算节点的动态优先级,选出动态优先级最高的多个计算节点并对其分配作业。
CN202110873454.XA 2021-07-30 2021-07-30 一种自适应的和规则制导的分布式调度方法 Active CN113590294B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110873454.XA CN113590294B (zh) 2021-07-30 2021-07-30 一种自适应的和规则制导的分布式调度方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110873454.XA CN113590294B (zh) 2021-07-30 2021-07-30 一种自适应的和规则制导的分布式调度方法

Publications (2)

Publication Number Publication Date
CN113590294A CN113590294A (zh) 2021-11-02
CN113590294B true CN113590294B (zh) 2023-11-17

Family

ID=78253021

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110873454.XA Active CN113590294B (zh) 2021-07-30 2021-07-30 一种自适应的和规则制导的分布式调度方法

Country Status (1)

Country Link
CN (1) CN113590294B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103207814A (zh) * 2012-12-27 2013-07-17 北京仿真中心 一种去中心化的跨集群资源管理与任务调度系统与调度方法
CN107038069A (zh) * 2017-03-24 2017-08-11 北京工业大学 Hadoop平台下动态标签匹配DLMS调度方法
WO2020206705A1 (zh) * 2019-04-10 2020-10-15 山东科技大学 一种基于集群节点负载状态预测的作业调度方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103207814A (zh) * 2012-12-27 2013-07-17 北京仿真中心 一种去中心化的跨集群资源管理与任务调度系统与调度方法
CN107038069A (zh) * 2017-03-24 2017-08-11 北京工业大学 Hadoop平台下动态标签匹配DLMS调度方法
WO2020206705A1 (zh) * 2019-04-10 2020-10-15 山东科技大学 一种基于集群节点负载状态预测的作业调度方法

Also Published As

Publication number Publication date
CN113590294A (zh) 2021-11-02

Similar Documents

Publication Publication Date Title
EP2269136B1 (en) Method, system and computer program for workload scheduling
US20050188075A1 (en) System and method for supporting transaction and parallel services in a clustered system based on a service level agreement
WO2010131778A1 (ja) ワークフロー監視制御システム、監視制御方法および監視制御プログラム
JP2007207225A (ja) ウェブ・アプリケーション・ミドルウェアのための非集中型のアプリケーション配置方法、システム、プログラム
CN112162865A (zh) 服务器的调度方法、装置和服务器
CN110221920B (zh) 部署方法、装置、存储介质及系统
Khalifa¹ et al. Collaborative autonomic resource management system for mobile cloud computing
Gabi et al. Systematic review on existing load balancing techniques in cloud computing
KR20180011222A (ko) 메시지 프로세싱 방법, 장치 및 시스템
CN103905337A (zh) 一种网络资源的处理装置、方法和系统
CN112015549B (zh) 一种基于服务器集群的调度节点的选择抢占方法及系统
CN103744735B (zh) 一种多核资源的调度方法及装置
CN116010064A (zh) Dag作业调度和集群管理的方法、系统及装置
CN110914805A (zh) 用于分层任务调度的计算系统
US9607275B2 (en) Method and system for integration of systems management with project and portfolio management
Pereira et al. Increasing the efficiency of fog nodes through of priority-based load balancing
JPH05216842A (ja) 資源管理装置
WO2020108337A1 (zh) 一种cpu资源调度方法及电子设备
CN113364888B (zh) 服务调度方法、系统、电子设备及计算机可读存储介质
CN104038358A (zh) 一种内容调度方法及内容调度装置
CN116302578B (zh) 一种QoS约束的流应用延迟确保方法及系统
CN113590294B (zh) 一种自适应的和规则制导的分布式调度方法
CN115629854A (zh) 分布式任务调度方法、系统、电子设备和存储介质
Makhlouf et al. Resources Co-allocation Strategies in Grid Computing.
Chen et al. Online scheduling strategy to minimize penalty of tardiness for real-time tasks in mobile edge computing systems

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: Room 711c, 7 / F, block a, building 1, yard 19, Ronghua Middle Road, Beijing Economic and Technological Development Zone, Daxing District, Beijing 102600

Patentee after: Beijing Zhongke Flux Technology Co.,Ltd.

Address before: Room 711c, 7 / F, block a, building 1, yard 19, Ronghua Middle Road, Beijing Economic and Technological Development Zone, Daxing District, Beijing 102600

Patentee before: Beijing Ruixin high throughput technology Co.,Ltd.