CN107168777B - 分布式系统中资源的调度方法以及装置 - Google Patents

分布式系统中资源的调度方法以及装置 Download PDF

Info

Publication number
CN107168777B
CN107168777B CN201610127655.4A CN201610127655A CN107168777B CN 107168777 B CN107168777 B CN 107168777B CN 201610127655 A CN201610127655 A CN 201610127655A CN 107168777 B CN107168777 B CN 107168777B
Authority
CN
China
Prior art keywords
resource
resources
state
scheduling
available
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610127655.4A
Other languages
English (en)
Other versions
CN107168777A (zh
Inventor
张杨
冯亦挥
欧阳晋
韩巧焕
汪方
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Cloud Computing Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201610127655.4A priority Critical patent/CN107168777B/zh
Publication of CN107168777A publication Critical patent/CN107168777A/zh
Application granted granted Critical
Publication of CN107168777B publication Critical patent/CN107168777B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multi Processors (AREA)

Abstract

本申请公开了一种分布式系统中资源的调度方法,包括:接收作业方申请资源的申请请求;读取所述申请请求中包含的所述作业方的资源需求;根据资源集中各个资源各自预设的状态标识,从所述资源集中查找与所述资源需求匹配的可用资源的资源列表;将所述资源列表发送至所述作业方,并将所述资源列表发送至所述资源列表中各个资源对应的资源节点。所述分布式系统中资源的调度方法,通过所述资源集中各个资源预设的状态标识,区别所述资源集中处于不同状态的资源,减少了分布式系统中作业执行受到的影响,提升了分布式系统的稳定性。

Description

分布式系统中资源的调度方法以及装置
技术领域
本申请涉及分布式系统技术领域,具体涉及一种分布式系统中资源的调度方法。本申请同时涉及一种分布式系统中资源的调度装置、另一种分布式系统中资源的调度方法以及装置。
背景技术
随着计算机技术和网络技术的不断发展,分布式系统架构的应用越来越广泛。在分布式系统中,用户发起的作业请求往往不能直接获得实现对象,需要经过多个中间服务构件对用户的作业请求进行协同处理,并最终成功执行作业。分布式系统中通常存在三个角色:资源调度器(ResourceManager)、作业方和机器节点(MachineNode)。在分布式系统中,资源调度器(ResourceManager)用于协调、分配分布式系统中可用资源;作业方包括作业管理器(JobMaster)以及下属的作业节点(JobWorker),其中,作业管理器(JobMaster)用于控制自身下属的所有作业节点(JobWorker),负责代表所有作业节点(JobWorker)向资源调度器(ResourceManager)申请作业资源,以及向机器节点(MachineNode)发送作业程序;作业节点(JobWorker)用于执行具体的作业程序,只与作业管理器(JobMaster)之间进行通信;机器节点(MachineNode)代表机器负责监管作业程序的执行。
目前,现有技术提供的分布式系统中资源的调度方法,当用户发起一个作业请求时,作业管理器(JobMaster)会向资源调度器(ResourceManager)申请一定数量的资源(如CPU、内存)供作业节点(JobWorker)使用;资源调度器(ResourceManager)收到资源的申请请求后,会根据分布式系统中剩余的可用资源计算出可以分配给作业管理器(JobMaster)可用资源列表(如:在A机器上可用1核CPU、1GB内存,在B机器上可用2核CPU、2GB内存),并将资源列表发送给作业管理器(JobMaster)和相应机器节点(MachineNode);作业管理器(JobMaster)在收到资源列表后,会将作业节点(JobWorker)分配到相应的机器节点(MachineNode)执行作业程序;当作业节点(JobWorker)执行完毕时,作业管理器(JobMaster)会通知资源调度器(ResourceManager)归还该作业节点(JobWorker)的资源,资源调度器(ResourceManager)收到归还资源的通知消息后,通知机器节点(MachineNode)针对作业节点(JobWorker)进行资源释放。
上述现有技术提供的分布式系统中资源的调度方法存在明显的缺陷。
上述现有技术提供的分布式系统中资源的调度方法,资源调度器(ResourceManager)向作业管理器(JobMaster)分配机器资源时,与资源调度器(ResourceManager)连接的所有机器都将可能被分配作业,当分布式系统中的机器由于发生硬件故障导致连接中断时,在连接中断的这一时间段内,分配到连接中断的机器上的作业受到影响;此外,当分布式系统中的机器由于发生软件故障进行软件更新或者软件重启时,在进行软件更新或者软件重启的这一时间段内,分配到进行软件更新或者软件重启的机器上的作业同样会受到影响。
发明内容
本申请提供一种分布式系统中资源的调度方法,以解决现有技术的存在的影响作业执行的问题。
本申请同时涉及一种分布式系统中资源的调度装置、另一种分布式系统中资源的调度方法以及装置。
本申请提供一种分布式系统中资源的调度方法,包括:
接收作业方申请资源的申请请求;
读取所述申请请求中包含的所述作业方的资源需求;
根据资源集中各个资源各自预设的状态标识,从所述资源集中查找与所述资源需求匹配的可用资源的资源列表;
将所述资源列表发送至所述作业方,并将所述资源列表发送至所述资源列表中各个资源对应的资源节点。
可选的,所述状态标识包括:
可用状态标识、不可用状态标识和只读状态标识。
可选的,所述资源需求,包括:
资源的数目和类型。
可选的,所述可用资源包括:
状态标识为所述可用状态标识的机器;
相应的,所述资源列表中包含与所述资源需求匹配、且状态标识为所述可用状态标识的各个机器。
可选的,所述从所述资源集中查找与所述资源需求匹配的可用资源的资源列表步骤,采用下述方式:
遍历所述资源集中的机器;
根据所述遍历获得的机器,计算与所述资源需求匹配的可用资源的资源列表。
可选的,按照下述规则进行所述遍历:
遍历所述资源集中状态标识为所述可用状态标识的机器,或者,遍历所述资源集中状态标识为所述不可用状态标识和所述只读状态标识之外的所有机器。
可选的,所述将所述资源列表发送至所述作业方,并将所述资源列表发送至所述资源列表中各个资源对应的资源节点步骤执行后,执行下述步骤:
将所述申请请求插入到所述资源列表中各个资源各自预设的任务队列中。
可选的,所述分布式系统中资源的调度方法,包括:
接收所述资源集中资源的状态标识发生变更的状态变更信息;
根据所述状态变更信息,更新所述状态变更信息对应的资源的状态标识;
结合所述状态变更信息对应的资源在更新前和更新后的状态标识,执行相应的调度动作。
可选的,若更新前的状态标识为所述可用状态标识、更新后的状态标识为所述不可用状态标识,相应的,所述调度动作包括:
遍历所述状态变更信息对应资源各自的任务队列;
向所述任务队列中各个申请请求对应的作业方发送停止作业的消息通知;
根据所述任务队列中申请请求的优先级高低,按照优先级从高到低的顺序依次在所述资源集中为各个申请请求调度相应的资源。
可选的,若更新前的状态标识为所述只读状态标识、更新后的状态标识为所述不可用状态标识,相应的,所述调度动作包括:
遍历所述状态变更信息对应资源各自的任务队列;
向所述任务队列中各个申请请求对应的作业方发送停止作业的消息通知;
根据所述任务队列中申请请求的优先级高低,按照优先级从高到低的顺序依次在所述资源集中依次为各个申请请求调度相应的资源。
可选的,所述将所述资源列表发送至所述作业方,并将所述申请请求插入到所述资源列表中各个资源各自预设的任务队列中步骤执行后,执行下述步骤:
接收所述作业方针对所述可用资源发送的资源释放请求;
通知所述可用资源对应的资源节点进行资源释放。
本申请还提供一种分布式系统中资源的调度装置,包括:
申请请求接收单元,用于接收作业方申请资源的申请请求;
资源需求读取单元,用于读取所述申请请求中包含的所述作业方的资源需求;
资源列表查找单元,用于根据资源集中各个资源各自预设的状态标识,从所述资源集中查找与所述资源需求匹配的可用资源的资源列表;
资源列表发送单元,用于将所述资源列表发送至所述作业方,并将所述资源列表发送至所述资源列表中各个资源对应的资源节点。
可选的,所述状态标识包括:
可用状态标识、不可用状态标识和只读状态标识。
可选的,所述资源需求,包括:
资源的数目和类型。
可选的,所述可用资源包括:
状态标识为所述可用状态标识的机器;
相应的,所述资源列表中包含与所述资源需求匹配、且状态标识为所述可用状态标识的各个机器。
可选的,所述资源列表查找单元,包括:
机器遍历子单元,用于遍历所述资源集中的机器;
资源列表获取子单元,用于根据所述遍历获得的机器,计算与所述资源需求匹配的可用资源的资源列表。
可选的,所述分布式系统中资源的调度装置,包括:
资源列表插入单元,用于将所述申请请求插入到所述资源列表中各个资源各自预设的任务队列中。
可选的,所述分布式系统中资源的调度装置,包括:
状态变更信息接收单元,用于接收所述资源集中资源的状态标识发生变更的状态变更信息;
状态标识更新单元,用于根据所述状态变更信息,更新所述状态变更信息对应的资源的状态标识;
调度动作执行单元,用于结合所述状态变更信息对应的资源在更新前和更新后的状态标识,执行相应的调度动作。
可选的,所述分布式系统中资源的调度装置,包括:
资源释放请求接收单元,用于接收所述作业方针对所述可用资源发送的资源释放请求;
资源释放通知单元,用于通知所述可用资源对应的资源节点进行资源释放。
本申请还提供另一种分布式系统中资源的调度方法,包括:
向资源调度方发送申请资源的申请请求;
接收所述资源调度方发送的、与所述申请请求中包含的所述作业方的资源需求匹配的可用资源的资源列表;
根据所述资源列表,将作业节点分配到所述资源列表中可用资源的资源节点执行作业程序。
可选的,所述资源集中各个资源预设有状态标识,所述状态标识包括:
可用状态标识、不可用状态标识和只读状态标识。
可选的,所述的分布式系统中资源的调度方法,包括:
接收所述资源调度方发送的停止作业的消息通知;
通知所述可用资源的资源节点停止作业。
本申请还提供另一种分布式系统中资源的调度装置,包括:
申请请求发送单元,用于向资源调度方发送申请资源的申请请求;
资源列表接收单元,用于接收所述资源调度方发送的、与所述申请请求中包含的所述作业方的资源需求匹配的可用资源的资源列表;
作业节点分配单元,用于根据所述资源列表,将作业节点分配到所述资源列表中可用资源的资源节点执行作业程序。
与现有技术相比,本申请具有以下优点:
本申请提供的分布式系统中资源的调度方法,包括:接收作业方申请资源的申请请求;读取所述申请请求中包含的所述作业方的资源需求;根据资源集中各个资源各自预设的状态标识,从所述资源集中查找与所述资源需求匹配的可用资源的资源列表;将所述资源列表发送至所述作业方,并将所述资源列表发送至所述资源列表中各个资源对应的资源节点。
本申请提供的分布式系统中资源的调度方法,接收作业方发送的从资源集中申请资源的申请请求,并根据所述申请请求中包含的所述作业方的资源需求,以及根据所述资源集中各个资源预设的状态标识,从所述资源集中查找与所述资源需求匹配的可用资源的资源列表,并将查找到的所述资源列表发送至所述作业方和所述资源列表中各个资源对应的资源节点,所述分布式系统中资源的调度方法,通过所述资源集中各个资源预设的状态标识,区别所述资源集中处于不同状态的资源,从而确定所述资源集中的资源能否被分配作业并执行作业,使发生硬件故障或者软件故障的资源免于被分配作业,降低了分布式系统中作业执行受到的影响,提升了分布式系统的稳定性。
附图说明
附图1是本申请提供的一种分布式系统中资源的调度方法实施例的处理流程图;
附图2是本申请提供的一种分布式系统中资源的调度装置实施例的示意图;
附图3是本申请提供的另一种分布式系统中资源的调度方法实施例的处理流程图;
附图4是本申请提供的另一种分布式系统中资源的调度装置实施例的示意图。
具体实施方式
在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是本申请能够以很多不同于在此描述的其他方式来实施,本领域技术人员可以在不违背本申请内涵的情况下做类似推广,因此本申请不受下面公开的具体实施的限制。
本申请提供一种分布式系统中资源的调度方法,本申请还提供一种分布式系统中资源的调度装置、另一种分布式系统中资源的调度方法以及装置。以下分别结合本申请提供的实施例的附图逐一进行详细说明,并且对方法的各个步骤进行说明。
本申请提供的一种分布式系统中资源的调度方法实施例如下:
参照附图1,其示出了本申请提供的一种分布式系统中资源的调度方法实施例的处理流程图。此外,所述分布式系统中资源的调度方法实施例的各个步骤之间的关系,请根据附图1确定。
步骤S101,接收作业方申请资源的申请请求。
本申请实施例提供的分布式系统,包括资源调度方、作业方和资源节点。所述资源调度方,包括分布式系统中协调和分配资源的角色,例如,分布式系统中的资源调度器(ResourceManager)。
所述作业方,包括分布式系统中用于申请作业资源和执行作业的角色,例如,分布式系统中的作业管理器(JobMaster),以及作业管理器(JobMaster)下属的作业节点(JobWorker)。
所述资源节点,包括分布式系统中管理作业执行的角色,例如,分布式系统中的机器节点(MachineNode)。
在分布式系统中,海量资源不可避免的会出现各种问题,例如,分布式系统中成千上万台的机器,可能有一台或者数台机器出现磁盘故障、网卡故障等硬件问题,也可能有一台或者数台机器出现系统版本需要更新、软件重启等软件问题,不管机器出现硬件问题还是软件问题,都可能导致机器故障,从而导致机器上执行的作业受到影响。在这种情况下,基于分布式系统中的资源调度方,采用本申请提供的分布式系统中资源的调度方法,针对分布式系统资源集中的资源设置状态标识,通过相应的状态标识区别资源集中的资源是否为可用资源,所述资源调度方接收到所述作业方发送的申请资源的申请请求之后,根据申请请求中包含的作业方申请资源的资源需求,在资源集中查找并匹配相应的可用资源,分配给作业方,所述作业方根据所述资源调度方分配的资源,将作业节点分配到资源节点执行作业,从而提升分布式系统的稳定性。
本申请实施例所述的作业方,包括分布式系统中用于申请作业资源和执行作业的角色,例如,分布式系统中的作业管理器(JobMaster)和作业节点(JobWorker)。
所述资源,包括分布式系统中可以使用的对象,以及向用户提供服务的对象,例如,分布式系统机器集群中的机器资源。
所述申请请求,是指所述作业方在收到用户提交的作业之后,向所述资源调度方申请资源时发出的消息请求,例如,分布式系统中的作业管理器(JobMaster)向资源调度器(ResourceManager)申请机器时发出的申请请求。所述消息请求中包含有所述作业方向所述资源调度方申请资源的资源需求。
具体实施时,在所述资源调度方接收所述作业方申请资源的申请请求之前,所述作业方已经接收到用户提交的作业,所述申请请求,正是指所述作业方针对用户提交的作业向所述资源调度方提交的申请请求。本实施例中,接收所述作业方申请资源的申请请求,具体是指接收所述作业方的作业管理器(JobMaster)发送的申请请求,接收到所述申请请求之后,执行下述步骤S102,从所述申请请求中读取所述作业方向所述资源调度方申请资源的资源需求。
步骤S102,读取所述申请请求中包含的所述作业方的资源需求。
本申请实施例所述的资源需求,包括所述作业方在执行用户提交的作业时所需的资源,所述资源需求包括:资源的数目和类型。
例如,分布式系统中,作业管理器(JobMaster)向资源调度器(ResourceManager)申请机器时发出的申请请求中,包含的资源需求为100个CPU和100G内存,表示作业管理器(JobMaster)整体需要的资源为100个CPU和100G内存,该作业管理器(JobMaster)管理的作业节点有100个,每个作业节点需要的资源为1个CPU和1G内存。
如上所述,上述步骤S101接收的所述作业方申请资源的申请请求中,包含所述作业方向所述资源调度方申请资源的资源需求,本步骤中,从所述申请请求中读取所述资源需求。
步骤S103,根据资源集中各个资源各自预设的状态标识,从所述资源集中查找与所述资源需求匹配的可用资源的资源列表。
本申请实施例所述的资源集,是指分布式系统中所有资源的集合,例如,分布式系统中所有机器的机器集合。
所述状态标识,用于区别所述资源集中处于不同状态的资源。所述资源调度方在向所述作业方分配资源时,针对状态标识不同的资源,设置相应的调度策略。
所述状态标识,包括:可用状态标识、不可用状态标识和只读状态标识。
例如,分布式系统中,机器的状态标识为所述可用状态标识,表明该机器运行正常,所述资源调度方在向所述作业方分配资源时,可正常调度该机器;
若机器的状态标识为所述不可用状态标识,表明该机器出现故障,无法正常运行,需要将该机器上执行的作业调度到其他正常运行的机器上;此外,所述资源调度方在向所述作业方分配资源时,由于该机器无法正常工作,因此拒绝向该机器上调度作业,避免了在该机器上执行的作业受到影响;
若机器的状态标识为所述只读状态标识,表明该机器的部分功能受到影响,但该机器当前仍然处于运行状态;此外,所述资源调度方在向所述作业方分配资源时,由于该机器的部分功能受到影响,因此拒绝向该机器上调度作业,进一步避免了在该机器上执行的作业受到影响,待该机器上当前作业执行完毕后,对该机器进行维护,使其恢复正常。
本申请实施例所述的可用资源,包括分布式系统的资源集中状态标识为所述可用状态标识的资源,例如,分布式系统中所有机器的机器集合中状态标识为所述可用状态标识的机器。
所述资源列表,包括所述资源调度方针对所述作业方申请资源的申请请求、向所述作业方调度的所有资源,即:与所述作业方的资源需求匹配的所有资源。并且,所述资源列表中包含的所有资源,均为可用资源,例如,所述资源列表中包含与所述资源需求匹配、且状态标识为所述可用状态标识的各个机器。
本实施例中,根据资源集中各个资源各自预设的状态标识,从所述资源集中查找与所述资源需求匹配的可用资源的资源列表,采用下述方式实现:
遍历所述资源集中的机器;
根据所述遍历获得的机器,计算与所述资源需求匹配的可用资源的资源列表。
例如,如上所述,分布式系统中的作业管理器(JobMaster)向资源调度器(ResourceManager)申请机器时发出的申请请求中,包含的资源需求为100个CPU和100G内存;资源调度器(ResourceManager)遍历分布式系统中的机器,获得有资源剩余的机器,即:CPU和/或内存有剩余的机器;根据遍历获得的CPU和/或内存有剩余的机器,计算出能够满足100个CPU和100G内存的机器组成的机器列表。
具体实施时,在遍历所述资源集中的机器时,按照下述规则进行所述遍历:遍历所述资源集中状态标识为所述可用状态标识的机器。例如,资源调度器(ResourceManager)在遍历分布式系统中的机器时,根据机器各自的状态标识,只遍历状态标识为所述可用状态标识的机器。
除此之外,在遍历所述资源集中的机器时,还可以采用上述规则之外的其他规则进行遍历,例如,遍历所述资源集中状态标识为所述不可用状态标识和所述只读状态标识之外的所有机器,在此不做限定。
步骤S104,将所述资源列表发送至所述作业方,并将所述资源列表发送至所述资源列表中各个资源对应的资源节点。
本申请实施例所述的资源节点,用于代表资源监管用户作业的执行,例如,分布式系统中的机器节点(MachineNode),负责代表机器监管用户作业程序的执行。
分布式系统中的资源节点,在获得所述作业方执行作业的相应资源之后,才允许所述作业方执行作业,例如,分布式系统中的机器,在获得作业节点(JobWorker)的资源(如1个CPU和1G内存)之后,才允许作业节点(JobWorker)执行作业程序,当作业节点(JobWorker)的资源被回收后,机器将强制停止作业节点(JobWorker)执行的作业程序。
上述步骤S103查找到与所述资源需求匹配的可用资源的资源列表,本步骤中,将上述步骤S103查找到的所述资源列表发送至所述作业方,并将所述资源列表发送至所述资源列表中各个资源对应的资源节点,便于所述作业方在所述资源节点执行作业。
具体实施时,所述资源集中的各个资源,预先设置有各自的任务队列,所述任务队列中各个申请请求,表示这些申请请求分别占用了该资源上的相应资源。例如,分布式系统中的各个机器,分别设置有各自的任务队列,每一个机器的任务队列中各个申请请求,表示各个申请请求分别占用了该机器上的相应资源。
由此可知,在本步骤将所述资源列表发送至所述资源列表中各个资源对应的资源节点之后,还包括下述步骤:
将所述申请请求插入到所述资源列表中各个资源各自预设的任务队列中。例如,将所述申请请求分别插入到机器列表中相应机器的任务队列中。
需要说明的是,所述资源预设的任务队列中各个申请请求,还可以用来表示在该资源上执行各个申请请求的相应作业的先后顺序,例如,分布式系统中机器的任务队列中的申请请求,表示在该机器上执行各个申请请求的相应作业程序的先后顺序,优先在该机器上执行插入时间早的申请请求的相应作业程序,在此不做限定。
此外,具体实施时,在将所述申请请求插入到所述资源列表中各个资源各自预设的任务队列中的基础上,还包括所述资源的状态标识变更操作,所述状态标识变更操作采用下述方式实现:
接收所述资源集中资源的状态标识发生变更的状态变更信息;
根据所述状态变更信息,更新所述状态变更信息对应的资源的状态标识;
结合所述状态变更信息对应的资源在更新前和更新后的状态标识,执行相应的调度动作。
如上所述,所述状态标识包括可用状态标识、不可用状态标识和只读状态标识。
(1)若所述资源集中资源的状态标识从所述可用状态标识变更为所述不可用状态标识,则执行下述调度动作:
遍历所述状态变更信息对应资源各自的任务队列;
向所述任务队列中各个申请请求对应的作业方发送停止作业的消息通知;
根据所述任务队列中申请请求的优先级高低,按照优先级从高到低的顺序依次在所述资源集中为各个申请请求调度相应的资源。
分布式系统中的每台机器,都有一个基本的硬件、软件检测程序,当机器出现问题时,检测程序会发出报警或者提示,运维人员通过操作改变机器的状态标识。
例如,分布式系统中,机器由于出现硬件故障无法正常运行,需要立即停止该机器,对其进行故障检修,状态标识从所述可用状态标识变更为所述不可用状态标识,同时,针对该机器的任务队列中的申请请求,需要调度到其他运行正常的机器的任务队列中:
遍历该机器的任务队列;
向该机器的任务队列中各个申请请求对应的作业方发送停止作业的消息通知;
根据所述任务队列中申请请求的优先级高低,按照优先级从高到低的顺序依次在所述资源集中为各个申请请求调度相应的机器。
此外,该机器的状态标识变更为所述不可用状态标识之后,如上所述,在遍历所述资源集中状态标识为所述可用状态标识的机器时,只遍历状态标识为所述可用状态标识的机器,因此,资源调度器(ResourceManager)在调度机器时,会跳过该状态标识为所述不可用状态标识的机器,不会将新的作业调度到该机器上。
(2)若所述资源集中资源的状态标识从所述不可用状态标识变更为所述可用状态标识;
例如:分布式系统中,机器的硬件故障被排除之后,状态标识从所述不可用状态标识变更为所述可用状态标识,如上所述,该机器的状态标识为所述不可用状态标识时,该机器的任务队列中的申请请求被调度到其他运行正常的机器的任务队列中;并且,在该机器的状态标识为所述不可用状态标识这一时间段内,资源调度器(ResourceManager)不会调度新的作业到该机器上,因此,该机器的任务队列为空。
此外,该机器的状态标识表更为所述可用状态标识之后,该机器能够正常运行,如上所述,资源调度器(ResourceManager)会遍历该机器,可将新的作业调度到该机器上。
(3)若所述资源集中资源的状态标识从所述可用状态标识变更为所述只读状态标识;
例如:分布式系统中,机器出现软件故障,但是当前该机器仍然可以运行,需要在该机器的任务队列中的申请请求处理完毕之后,对该机器进行软件更新或者系统重启,因此,该机器的状态标识从所述可用状态标识变更为所述只读状态标识。
此外,该机器的状态标识表更为所述只读状态标识之后,如上所述,在遍历所述资源集中状态标识为所述可用状态标识的机器时,只遍历状态标识为所述可用状态标识的机器,因此,资源调度器(ResourceManager)在调度机器时,会跳过该状态标识为所述只读状态标识的机器,不会将新的作业调度到该机器上。
(4)若所述资源集中资源的状态标识从所述只读状态标识变更为所述可用状态标识;
例如:分布式系统中,机器存在的软件故障被排除之后,状态标识从所述只读状态标识变更为所述可用状态标识,表明该机器能够正常运行,如上所述,资源调度器(ResourceManager)可以将新的作业调度到该机器上。
(5)若所述资源集中资源的状态标识从所述不可用状态标识变更为所述只读状态标识;
例如:分布式系统中,机器存在的硬件故障被排除,但由于出现软件故障,状态标识从所述不可用状态标识变更为所述只读状态标识,如上所述,该机器的状态标识为所述不可用状态标识时,该机器的任务队列中的申请请求被调度到其他运行正常的机器的任务队列中,并且,在该机器的状态标识为所述不可用状态标识这一时间段内,资源调度器(ResourceManager)不会调度该机器,因此该机器的任务队列为空。
此外,该机器的状态标识表更为所述只读状态标识之后,如上所述,资源调度器(ResourceManager)在调度机器时,会跳过该状态标识为所述不可用状态标识的机器,不会将新的作业调度到该机器上。
(6)若所述资源集中资源的状态标识从所述只读状态标识变更为所述不可用状态标识,则执行下述调度动作:
遍历所述状态变更信息对应资源各自的任务队列;
向所述任务队列中各个申请请求对应的作业方发送停止作业的消息通知;
根据所述任务队列中申请请求的优先级高低,按照优先级从高到低的顺序依次在所述资源集中为各个申请请求调度相应的资源。
例如:分布式系统中,机器存在的软件故障被排除,但由于出现硬件故障,状态标识从所述只读状态标识变更为所述不可用状态标识,如上所述,该机器的状态标识为所述只读状态标识时,该机器的任务队列中的申请请求仍然需要处理,资源调度器(ResourceManager)不会将新的作业调度到该机器上,因此,只需处理该机器的任务队列中的各个申请请求即可,将该机器的任务队列中的各个申请请求调度到运行正常的机器的任务队列中。
此外,该机器的状态标识变更为所述不可用状态标识之后,如上所述,资源调度器(ResourceManager)在调度机器时,会跳过该状态标识为所述不可用状态标识的机器,不会将新的作业调度到该机器上。
具体实施时,本步骤执行之后,还可执行资源释放操作,所述资源释放操作具体实现如下:
接收所述作业方针对所述可用资源发送的资源释放请求;
通知所述可用资源对应的资源节点进行资源释放。
例如,分布式系统中,机器对应的机器节点(MachineNode)接收到释放资源的通知消息之后,释放相应作业节点(JobWorker)占用的CPU和/或内存资源,释放后的CPU和/或内存资源可分别给其他作业节点(JobWorker)。
综上所述,所述分布式系统中资源的调度方法,接收作业方发送的从资源集中申请资源的申请请求,并根据所述申请请求中包含的所述作业方的资源需求,以及根据所述资源集中各个资源预设的状态标识,从所述资源集中查找与所述资源需求匹配的可用资源的资源列表,并将查找到的所述资源列表发送至所述作业方和所述资源列表中各个资源对应的资源节点,所述分布式系统中资源的调度方法,通过所述资源集中各个资源预设的状态标识,区别所述资源集中处于不同状态的资源,从而确定所述资源集中的资源能否被分配作业并执行作业,使发生硬件故障或者软件故障的资源免于被分配作业,降低了分布式系统中作业执行受到的影响。
此外,所述分布式系统中资源的调度方法,通过所述资源集中资源状态标识变更操作,针对所述资源集中资源在不同状态标识之间的变更,执行相应的调度动作,完善了分布式系统中由于状态标识的变更作业执行受到的影响,提升了分布式系统的稳定性。
本申请提供的一种分布式系统中资源的调度装置实施例如下:
在上述的实施例中,提供了一种分布式系统中资源的调度方法,与之相对应的,本申请还提供了一种分布式系统中资源的调度装置,下面结合附图进行说明。
参照附图2,其示出了本申请提供的一种分布式系统中资源的调度装置实施例的示意图。
由于装置实施例基本相似于方法实施例,所以描述得比较简单,相关的部分请参见上述提供的方法实施例的对应说明即可。下述描述的装置实施例仅仅是示意性的。
本申请提供一种分布式系统中资源的调度装置,包括:
申请请求接收单元201,用于接收作业方申请资源的申请请求;
资源需求读取单元202,用于读取所述申请请求中包含的所述作业方的资源需求;
资源列表查找单元203,用于根据资源集中各个资源各自预设的状态标识,从所述资源集中查找与所述资源需求匹配的可用资源的资源列表;
资源列表发送单元204,用于将所述资源列表发送至所述作业方,并将所述资源列表发送至所述资源列表中各个资源对应的资源节点。
可选的,所述状态标识包括:可用状态标识、不可用状态标识和只读状态标识。
可选的,所述资源需求,包括:资源的数目和类型。
可选的,所述可用资源包括:状态标识为所述可用状态标识的机器;
相应的,所述资源列表中包含与所述资源需求匹配、且状态标识为所述可用状态标识的各个机器。
可选的,所述资源列表查找单元203,包括:
机器遍历子单元,用于遍历所述资源集中的机器;
资源列表获取子单元,用于根据所述遍历获得的机器,计算与所述资源需求匹配的可用资源的资源列表。
可选的,按照下述规则进行所述遍历:
遍历所述资源集中状态标识为所述可用状态标识的机器,或者,遍历所述资源集中状态标识为所述不可用状态标识和所述只读状态标识之外的所有机器。
可选的,所述分布式系统中资源的调度装置,包括:
资源列表插入单元,用于将所述申请请求插入到所述资源列表中各个资源各自预设的任务队列中。
可选的,所述分布式系统中资源的调度装置,包括:
状态变更信息接收单元,用于接收所述资源集中资源的状态标识发生变更的状态变更信息;
状态标识更新单元,用于根据所述状态变更信息,更新所述状态变更信息对应的资源的状态标识;
调度动作执行单元,用于结合所述状态变更信息对应的资源在更新前和更新后的状态标识,执行相应的调度动作。
可选的,若更新前的状态标识为所述可用状态标识、更新后的状态标识为所述不可用状态标识,相应的,所述调度动作包括:
遍历所述状态变更信息对应资源各自的任务队列;
向所述任务队列中各个申请请求对应的作业方发送停止作业的消息通知;
根据所述任务队列中申请请求的优先级高低,按照优先级从高到低的顺序依次在所述资源集中为各个申请请求调度相应的资源。
可选的,所述分布式系统中资源的调度装置,包括:
资源释放请求接收单元,用于接收所述作业方针对所述可用资源发送的资源释放请求;
资源释放通知单元,用于通知所述可用资源对应的资源节点进行资源释放。
本申请提供的另一种分布式系统中资源的调度方法实施例如下:
在上述的实施例中,提供了一种分布式系统中资源的调度方法,基于分布式系统中的资源调度方实现,与之相对应的,本申请还提供另一种分布式系统中资源的调度方法,基于分布式系统中的作业方实现,下面结合附图进行说明。
参照附图3,其示出了本申请提供的另一种分布式系统中资源的调度方法处理流程图。
由于本实施例与上述分布式系统中资源的调度方法实施例相对应,所以描述得比较简单,相关的部分请参见上述提供的方法实施例的对应说明即可。下述描述的实施例仅仅是示意性的。
本申请提供一种分布式系统中资源的调度方法,包括:
步骤S301,向资源调度方发送申请资源的申请请求;
步骤S302,接收所述资源调度方发送的、与所述申请请求中包含的所述作业方的资源需求匹配的可用资源的资源列表;
步骤S303,根据所述资源列表,将作业节点分配到所述资源列表中可用资源的资源节点执行作业程序。
可选的,所述资源集中各个资源预设有状态标识,所述状态标识包括:可用状态标识、不可用状态标识和只读状态标识。
可选的,所述资源需求,包括:资源的数目和类型。
可选的,所述可用资源包括:状态标识为所述可用状态标识的机器;
相应的,所述资源列表中包含与所述资源需求匹配、且状态标识为所述可用状态标识的各个机器。
可选的,所述分布式系统中资源的调度方法,包括:
接收所述资源调度方发送的停止作业的消息通知;
通知所述可用资源的资源节点停止作业。
本申请提供的另一种分布式系统中资源的调度装置实施例如下:
在上述的实施例中,提供另一种分布式系统中资源的调度方法,与之相对应的,本申请还提供另一种分布式系统中资源的调度装置,下面结合附图进行说明。
参照附图4,其示出了本申请提供的另一种分布式系统中资源的调度装置实施例的示意图。
由于装置实施例基本相似于方法实施例,所以描述得比较简单,相关的部分请参见上述提供的方法实施例的对应说明即可。下述描述的装置实施例仅仅是示意性的。
本申请提供另一种分布式系统中资源的调度装置,包括:
申请请求发送单元401,用于向资源调度方发送申请资源的申请请求;
资源列表接收单元402,用于接收所述资源调度方发送的、与所述申请请求中包含的所述作业方的资源需求匹配的可用资源的资源列表;
作业节点分配单元403,用于根据所述资源列表,将作业节点分配到所述资源列表中可用资源的资源节点执行作业程序。
可选的,所述资源集中各个资源预设有状态标识,所述状态标识包括:可用状态标识、不可用状态标识和只读状态标识。
可选的,所述资源需求,包括:资源的数目和类型。
可选的,所述可用资源包括:状态标识为所述可用状态标识的机器;
相应的,所述资源列表中包含与所述资源需求匹配、且状态标识为所述可用状态标识的各个机器。
可选的,所述分布式系统中资源的调度装置,包括:
停止作业消息通知接收单元,用于接收所述资源调度方发送的停止作业的消息通知;
停止作业执行单元,用于通知所述可用资源的资源节点停止作业。
本申请虽然以较佳实施例公开如上,但其并不是用来限定本申请,任何本领域技术人员在不脱离本申请的精神和范围内,都可以做出可能的变动和修改,因此本申请的保护范围应当以本申请权利要求所界定的范围为准。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
1、计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
2、本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

Claims (22)

1.一种分布式系统中资源的调度方法,其特征在于,包括:
接收作业方申请资源的申请请求;
读取所述申请请求中包含的所述作业方的资源需求;
根据资源集中各个资源各自预设的状态标识,从所述资源集中查找与所述资源需求匹配的可用资源的资源列表;
将所述资源列表发送至所述作业方,并将所述资源列表发送至所述资源列表中各个资源对应的资源节点;
将所述申请请求插入到所述资源列表中各个资源各自预设的任务队列中;
接收所述资源集中资源的状态标识发生变更的状态变更信息;
结合所述状态变更信息对应的资源在更新前和更新后的状态标识,执行相应的调度动作,包括:若更新前的状态标识为可用状态标识、更新后的状态标识为不可用状态标识,相应的,所述调度动作包括:遍历所述状态变更信息对应资源各自的任务队列;向所述任务队列中各个申请请求对应的作业方发送停止作业的消息通知;根据所述任务队列中申请请求的优先级高低,按照优先级从高到低的顺序依次在所述资源集中为各个申请请求调度相应的资源。
2.根据权利要求1所述的分布式系统中资源的调度方法,其特征在于,所述状态标识包括:
可用状态标识、不可用状态标识和只读状态标识。
3.根据权利要求1所述的分布式系统中资源的调度方法,其特征在于,所述资源需求,包括:
资源的数目和类型。
4.根据权利要求2所述的分布式系统中资源的调度方法,其特征在于,所述可用资源包括:
状态标识为所述可用状态标识的机器;
相应的,所述资源列表中包含与所述资源需求匹配、且状态标识为所述可用状态标识的各个机器。
5.根据权利要求4所述的分布式系统中资源的调度方法,其特征在于,所述从所述资源集中查找与所述资源需求匹配的可用资源的资源列表步骤,采用下述方式:
遍历所述资源集中的机器;
根据所述遍历获得的机器,计算与所述资源需求匹配的可用资源的资源列表。
6.根据权利要求5所述的分布式系统中资源的调度方法,其特征在于,按照下述规则进行所述遍历:
遍历所述资源集中状态标识为所述可用状态标识的机器,或者,遍历所述资源集中状态标识为所述不可用状态标识和所述只读状态标识之外的所有机器。
7.根据权利要求2所述的分布式系统中资源的调度方法,其特征在于,所述将所述资源列表发送至所述作业方,并将所述资源列表发送至所述资源列表中各个资源对应的资源节点步骤执行后,执行下述步骤:
将所述申请请求插入到所述资源列表中各个资源各自预设的任务队列中。
8.根据权利要求1所述的分布式系统中资源的调度方法,其特征在于,还包括:
根据所述状态变更信息,更新所述状态变更信息对应的资源的状态标识。
9.根据权利要求1所述的分布式系统中资源的调度方法,其特征在于,若更新前的状态标识为只读状态标识、更新后的状态标识为所述不可用状态标识,相应的,所述调度动作包括:
遍历所述状态变更信息对应资源各自的任务队列;
向所述任务队列中各个申请请求对应的作业方发送停止作业的消息通知;
根据所述任务队列中申请请求的优先级高低,按照优先级从高到低的顺序依次在所述资源集中依次为各个申请请求调度相应的资源。
10.根据权利要求1所述的分布式系统中资源的调度方法,其特征在于,所述将所述资源列表发送至所述作业方,并将所述申请请求插入到所述资源列表中各个资源各自预设的任务队列中步骤执行后,执行下述步骤:
接收所述作业方针对所述可用资源发送的资源释放请求;
通知所述可用资源对应的资源节点进行资源释放。
11.一种分布式系统中资源的调度装置,其特征在于,包括:
申请请求接收单元,用于接收作业方申请资源的申请请求;
资源需求读取单元,用于读取所述申请请求中包含的所述作业方的资源需求;
资源列表查找单元,用于根据资源集中各个资源各自预设的状态标识,从所述资源集中查找与所述资源需求匹配的可用资源的资源列表;
资源列表发送单元,用于将所述资源列表发送至所述作业方,并将所述资源列表发送至所述资源列表中各个资源对应的资源节点;
状态变更信息接收单元,用于接收所述资源集中资源的状态标识发生变更的状态变更信息;
调度动作执行单元,用于结合所述状态变更信息对应的资源在更新前和更新后的状态标识,执行相应的调度动作;
其中,若更新前的状态标识为可用状态标识、更新后的状态标识为不可用状态标识,相应的,所述调度动作包括:遍历所述状态变更信息对应资源各自的任务队列;向所述任务队列中各个申请请求对应的作业方发送停止作业的消息通知;根据所述任务队列中申请请求的优先级高低,按照优先级从高到低的顺序依次在所述资源集中为各个申请请求调度相应的资源。
12.根据权利要求11所述的分布式系统中资源的调度装置,其特征在于,所述状态标识包括:
可用状态标识、不可用状态标识和只读状态标识。
13.根据权利要求11所述的分布式系统中资源的调度装置,其特征在于,所述资源需求,包括:
资源的数目和类型。
14.根据权利要求13所述的分布式系统中资源的调度装置,其特征在于,所述可用资源包括:
状态标识为所述可用状态标识的机器;
相应的,所述资源列表中包含与所述资源需求匹配、且状态标识为所述可用状态标识的各个机器。
15.根据权利要求14所述的分布式系统中资源的调度装置,其特征在于,所述资源列表查找单元,包括:
机器遍历子单元,用于遍历所述资源集中的机器;
资源列表获取子单元,用于根据所述遍历获得的机器,计算与所述资源需求匹配的可用资源的资源列表。
16.根据权利要求12所述的分布式系统中资源的调度装置,其特征在于,包括:
资源列表插入单元,用于将所述申请请求插入到所述资源列表中各个资源各自预设的任务队列中。
17.根据权利要求16所述的分布式系统中资源的调度装置,其特征在于,包括:
状态标识更新单元,用于根据所述状态变更信息,更新所述状态变更信息对应的资源的状态标识。
18.根据权利要求11所述的分布式系统中资源的调度装置,其特征在于,包括:
资源释放请求接收单元,用于接收所述作业方针对所述可用资源发送的资源释放请求;
资源释放通知单元,用于通知所述可用资源对应的资源节点进行资源释放。
19.一种分布式系统中资源的调度方法,其特征在于,包括:
向资源调度方发送申请资源的申请请求;
接收所述资源调度方发送的、与所述申请请求中包含的作业方的资源需求匹配的可用资源的资源列表;
根据所述资源列表,将作业节点分配到所述资源列表中可用资源的资源节点执行作业程序;
其中,资源集中各个资源预设有状态信息,若所述资源集中资源的状态标识发生变更,则所述资源调度方会结合状态变更信息对应的资源在更新前和更新后的状态标识,执行相应的调度动作,包括:若更新前的状态标识为可用状态标识、更新后的状态标识为不可用状态标识,相应的,所述资源调度方的调度动作包括:遍历所述状态变更信息对应资源各自的任务队列;向所述任务队列中各个申请请求对应的作业方发送停止作业的消息通知;根据所述任务队列中申请请求的优先级高低,按照优先级从高到低的顺序依次在所述资源集中为各个申请请求调度相应的资源。
20.根据权利要求19所述的分布式系统中资源的调度方法,其特征在于,所述资源集中各个资源的状态标识包括:
可用状态标识、不可用状态标识和只读状态标识。
21.根据权利要求20所述的分布式系统中资源的调度方法,其特征在于,包括:
接收所述资源调度方发送的停止作业的消息通知;
通知所述可用资源的资源节点停止作业。
22.一种分布式系统中资源的调度装置,其特征在于,包括:
申请请求发送单元,用于向资源调度方发送申请资源的申请请求;
资源列表接收单元,用于接收所述资源调度方发送的、与所述申请请求中包含的作业方的资源需求匹配的可用资源的资源列表;
作业节点分配单元,用于根据所述资源列表,将作业节点分配到所述资源列表中可用资源的资源节点执行作业程序;
其中,资源集中各个资源预设有状态信息,若所述资源集中资源的状态标识发生变更,则所述资源调度方会结合状态变更信息对应的资源在更新前和更新后的状态标识,执行相应的调度动作,包括:若更新前的状态标识为可用状态标识、更新后的状态标识为不可用状态标识,相应的,所述资源调度方的调度动作包括:遍历所述状态变更信息对应资源各自的任务队列;向所述任务队列中各个申请请求对应的作业方发送停止作业的消息通知;根据所述任务队列中申请请求的优先级高低,按照优先级从高到低的顺序依次在所述资源集中为各个申请请求调度相应的资源。
CN201610127655.4A 2016-03-07 2016-03-07 分布式系统中资源的调度方法以及装置 Active CN107168777B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610127655.4A CN107168777B (zh) 2016-03-07 2016-03-07 分布式系统中资源的调度方法以及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610127655.4A CN107168777B (zh) 2016-03-07 2016-03-07 分布式系统中资源的调度方法以及装置

Publications (2)

Publication Number Publication Date
CN107168777A CN107168777A (zh) 2017-09-15
CN107168777B true CN107168777B (zh) 2021-04-30

Family

ID=59849300

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610127655.4A Active CN107168777B (zh) 2016-03-07 2016-03-07 分布式系统中资源的调度方法以及装置

Country Status (1)

Country Link
CN (1) CN107168777B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110708367A (zh) * 2019-09-24 2020-01-17 中信百信银行股份有限公司 应用调用方法、应用发布方法及应用发布系统
CN110704244B (zh) * 2019-09-29 2023-01-10 苏州浪潮智能科技有限公司 一种磁盘离线处理方法、装置、设备及可读存储介质
CN113032112A (zh) * 2019-12-25 2021-06-25 上海商汤智能科技有限公司 资源调度方法及装置、电子设备和存储介质
CN111459678A (zh) * 2020-04-02 2020-07-28 上海极链网络科技有限公司 一种资源调度方法、装置、存储介质及电子设备
CN115362434A (zh) * 2020-04-24 2022-11-18 华为云计算技术有限公司 分布式数据处理的任务调度
CN111818355B (zh) * 2020-07-10 2022-01-21 南京百家云科技有限公司 一种媒体节点的调度方法、装置、计算机设备及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007041899A1 (fr) * 2005-10-10 2007-04-19 Zte Corporation Système et procédé de gestion de la ressource distribuée adaptable dynamique
CN101227335A (zh) * 2008-01-25 2008-07-23 中兴通讯股份有限公司 一种网元设备的软件版本升级方法
CN102945188A (zh) * 2012-11-15 2013-02-27 北京中电普华信息技术有限公司 一种虚拟机资源调度方法和装置
CN102958166A (zh) * 2011-08-29 2013-03-06 华为技术有限公司 一种资源分配方法及资源管理平台
CN103150213A (zh) * 2011-12-06 2013-06-12 北大方正集团有限公司 负载平衡方法和装置
CN103294515A (zh) * 2013-06-28 2013-09-11 北京小米科技有限责任公司 一种获取应用程序的方法、装置和系统
CN103823719A (zh) * 2014-02-26 2014-05-28 杭州群核信息技术有限公司 针对可执行程序的分布式云计算系统及针对可执行程序的分布式云计算方法
CN104823407A (zh) * 2012-11-29 2015-08-05 泰利斯加拿大公司 资源分配或资源释放的方法和装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7631069B2 (en) * 2003-07-28 2009-12-08 Sap Ag Maintainable grid managers
CN100591042C (zh) * 2006-07-17 2010-02-17 华为技术有限公司 半分布式p2p网络流量管理方法、系统及设备

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007041899A1 (fr) * 2005-10-10 2007-04-19 Zte Corporation Système et procédé de gestion de la ressource distribuée adaptable dynamique
CN101227335A (zh) * 2008-01-25 2008-07-23 中兴通讯股份有限公司 一种网元设备的软件版本升级方法
CN102958166A (zh) * 2011-08-29 2013-03-06 华为技术有限公司 一种资源分配方法及资源管理平台
CN103150213A (zh) * 2011-12-06 2013-06-12 北大方正集团有限公司 负载平衡方法和装置
CN102945188A (zh) * 2012-11-15 2013-02-27 北京中电普华信息技术有限公司 一种虚拟机资源调度方法和装置
CN104823407A (zh) * 2012-11-29 2015-08-05 泰利斯加拿大公司 资源分配或资源释放的方法和装置
CN103294515A (zh) * 2013-06-28 2013-09-11 北京小米科技有限责任公司 一种获取应用程序的方法、装置和系统
CN103823719A (zh) * 2014-02-26 2014-05-28 杭州群核信息技术有限公司 针对可执行程序的分布式云计算系统及针对可执行程序的分布式云计算方法

Also Published As

Publication number Publication date
CN107168777A (zh) 2017-09-15

Similar Documents

Publication Publication Date Title
CN107168777B (zh) 分布式系统中资源的调度方法以及装置
US11036553B2 (en) Preempting or traversing allocated resource applications based on job priority and resource demand information
EP3675434B1 (en) Distributed system resource allocation method, device and system
CN106406983B (zh) 一种集群中的任务调度方法及装置
US9319281B2 (en) Resource management method, resource management device, and program product
CN110941481A (zh) 资源调度方法、装置及系统
CN106293893B (zh) 作业调度方法、装置及分布式系统
CN110389843B (zh) 一种业务调度方法、装置、设备及可读存储介质
CN112052068A (zh) 一种Kubernetes容器平台CPU绑核的方法与装置
US20130305245A1 (en) Methods for managing work load bursts and devices thereof
CN111694658A (zh) Cpu资源分配方法、装置、电子设备和存储介质
CN108121599A (zh) 一种资源管理方法、装置及系统
CN111427670A (zh) 任务调度方法和系统
CN111600771B (zh) 网络资源探测系统、方法
CN112698929A (zh) 一种信息采集方法及装置
US8788601B2 (en) Rapid notification system
CN108073453B (zh) 分布式集群中cpu资源的调度方法以及装置
JP2014006573A (ja) タスク実行順序制御機能を含む監視制御システム
CN109101260B (zh) 一种节点软件的升级方法、装置和计算机可读存储介质
CN114661432A (zh) 任务调度方法、装置、设备及存储介质
CN108255820B (zh) 分布式系统中数据入库的方法、装置以及电子设备
CN116302452B (zh) 作业调度方法、系统、装置、通信设备及存储介质
CN116662040B (zh) 一种消息的分发方法、装置、电子设备及存储介质
CN111752701B (zh) 一种系统集群及其资源调度方法
CN111563132A (zh) 数据处理方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20230613

Address after: Room 1-2-A06, Yungu Park, No. 1008 Dengcai Street, Sandun Town, Xihu District, Hangzhou City, Zhejiang Province

Patentee after: Aliyun Computing Co.,Ltd.

Address before: Box 847, four, Grand Cayman capital, Cayman Islands, UK

Patentee before: ALIBABA GROUP HOLDING Ltd.

TR01 Transfer of patent right