CN112148467A - 计算资源的动态分配 - Google Patents

计算资源的动态分配 Download PDF

Info

Publication number
CN112148467A
CN112148467A CN201910578411.1A CN201910578411A CN112148467A CN 112148467 A CN112148467 A CN 112148467A CN 201910578411 A CN201910578411 A CN 201910578411A CN 112148467 A CN112148467 A CN 112148467A
Authority
CN
China
Prior art keywords
resources
computing resources
computing
available
resource group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910578411.1A
Other languages
English (en)
Inventor
张权路
杨凡
周礼栋
杨懋
赵汉宇
韩震华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Technology Licensing LLC
Original Assignee
Microsoft Technology Licensing LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Technology Licensing LLC filed Critical Microsoft Technology Licensing LLC
Priority to CN201910578411.1A priority Critical patent/CN112148467A/zh
Priority to BR112021021732A priority patent/BR112021021732A2/pt
Priority to CA3139693A priority patent/CA3139693A1/en
Priority to JP2021568246A priority patent/JP7506096B2/ja
Priority to AU2020308941A priority patent/AU2020308941A1/en
Priority to PCT/US2020/031250 priority patent/WO2020263414A1/en
Priority to KR1020217042559A priority patent/KR20220025746A/ko
Priority to EP20729307.7A priority patent/EP3991042A1/en
Priority to US17/609,700 priority patent/US20220229701A1/en
Publication of CN112148467A publication Critical patent/CN112148467A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • G06F9/5038Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the execution order of a plurality of tasks, e.g. taking priority or time dependency constraints into consideration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • G06F9/5077Logical partitioning of resources; Management or configuration of virtualized resources
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/50Indexing scheme relating to G06F9/50
    • G06F2209/5011Pool
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/50Indexing scheme relating to G06F9/50
    • G06F2209/502Proximity
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/50Indexing scheme relating to G06F9/50
    • G06F2209/5021Priority

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Multi Processors (AREA)
  • Hardware Redundancy (AREA)

Abstract

根据本公开的实现,提供了一种计算资源动态管理的方案。在该方案中,用于使用计算资源集中的目标数目的计算资源的第一请求被接收,其中计算资源集中的至少一个空闲计算资源被组织为至少一个空闲资源组。在确定第一资源组集合中不包括空闲匹配资源组且至少一个空闲资源组中包括空闲冗余资源组时,通过拆分空闲冗余资源组来为第一请求分配目标数目的计算资源,其中空闲冗余资源组中的资源数目大于目标数目。由此,可以实现计算资源的动态分配。

Description

计算资源的动态分配
背景技术
近年来,随着计算机技术特别是分布式计算的发展,云计算已经成为一种热门的计算模型。云计算是一种能够通过网络以便利的、按需的方式访问一个可配置的计算资源集(包括网络服务器、存储、图形处理单元等)的模式,计算资源集的管理者能够以最少的管理开销来迅速配置、提供或释放资源。云计算的核心问题是计算资源的管理,云计算的资源管理中关于云计算的资源动态分配方法已成为一个研究热点。
发明内容
根据本公开的实现,提供了一种计算资源动态管理的方案。在该方案中,用于使用计算资源集中的目标数目的计算资源的第一请求被接收,其中计算资源集中的至少一个空闲计算资源被组织为至少一个空闲资源组。在确定第一资源组集合中不包括空闲匹配资源组且至少一个空闲资源组中包括空闲冗余资源组时,通过拆分空闲冗余资源组来为第一请求分配目标数目的计算资源,其中空闲冗余资源组中的资源数目大于目标数目。由此,可以实现计算资源的动态分配。
提供发明内容部分是为了简化的形式来介绍对概念的标识,其在下文的具体实施方式中将被进一步描述。发明内容部分无意标识要求保护的主题的关键特征或主要特征,也无意限制要求保护的主题的范围。
附图说明
图1示出了能够在其中实施本公开的多个实现的计算环境的框图;
图2示出了根据本公开的一些实现的计算资源的动态分配的过程的流程图;
图3示出了根据本公开的一些实现的计算资源集的示例拓扑结构的示意图;以及
图4示出了根据本公开的一些实现的利用可用计算资源进行分配的过程的流程图;
图5示出了根据本公开的另一些实现的计算资源的动态分配的过程的流程图;
图6示出了根据本公开的一些实现的示例计算设备的框图。
这些附图中,相同或相似参考符号用于表示相同或相似元素。
具体实施方式
现在将参照若干示例实现来论述本公开。应当理解,论述了这些实现仅是为了使得本领域普通技术人员能够更好地理解且因此实现本公开,而不是暗示对本主题的范围的任何限制。
如本文所使用的,术语“包括”及其变体要被解读为意味着“包括但不限于”的开放式术语。术语“基于”要被解读为“至少部分地基于”。术语“一个实现”和“一种实现”要被解读为“至少一个实现”。术语“另一个实现”要被解读为“至少一个其他实现”。术语“第一”、“第二”等等可以指代不同的或相同的对象。下文还可能包括其他明确的和隐含的定义。
如以上讨论的,云计算的计算资源管理是云计算的核心问题之一。一些传统的方案通过配额管理的方式来为共享计算资源集的多个租户分配计算资源。例如,在多租户共享云计算中的多图形处理单元(GPU)集群的场景中,一个租户可以被分配一定数量的令牌以作为其配额,该租户可以通过消费令牌来获得GPU以处理其提交的作业。然而,传统的方案在计算资源分配的过程中仅考虑了申请资源的租户的配额是否有剩余,而不关注所分配的计算资源的位置。这使得大量的小计算资源需求(例如,单个GPU)的分配将使得计算资源被零散地分割,从而难以为后续需要大量连续计算资源的租户提供服务。
根据本公开的实现,提供了一种计算资源动态管理的方案。在该方案中,用于使用计算资源集中的目标数目的计算资源的第一请求被接收,其中计算资源集中的至少一个空闲计算资源被组织为至少一个空闲资源组。在确定第一资源组集合中不包括空闲匹配资源组且至少一个空闲资源组中包括空闲冗余资源组时,通过拆分空闲冗余资源组来为第一请求分配目标数目的计算资源,其中空闲冗余资源组中的资源数目大于目标数目。由此,可以实现计算资源的动态分配。
以下参考附图来说明本公开的基本原理和若干示例实现。
示例环境
图1示出了能够在其中实施本公开的多个实现的计算环境100的框图。应当理解,图1所示出的计算环境100仅仅是示例性的,而不应当构成对本公开所描述的实现的功能和范围的任何限制。如图1所示,计算环境100包括计算资源调度设备115和计算资源集120,计算资源集120可以包括多个计算资源125-1至125-N(单独或统一称为计算资源125)。在一些实现中,计算资源125可以包括图形处理单元GPU。
在一些实现中,计算资源调度设备115可以被实现为各种用户终端或服务终端。服务终端可以是各种服务提供方提供的服务器、大型计算设备等。用户终端诸如是任何类型的移动终端、固定终端或便携式终端,包括移动手机、多媒体计算机、多媒体平板、互联网节点、通信器、台式计算机、膝上型计算机、笔记本计算机、上网本计算机、平板计算机、个人通信系统(PCS)设备、个人导航设备、个人数字助理(PDA)、音频/视频播放器、数码相机/摄像机、定位设备、电视接收器、无线电广播接收器、电子书设备、游戏设备或者其任意组合,包括这些设备的配件和外设或者其任意组合。
计算资源调度设备115可以用于调度计算资源集120中的计算资源125。计算资源调度设备115接收来自一个或多个应用或租户105的使用目标数目的计算资源的请求110。计算资源调度设备115可以基于下文详细描述的计算资源动态调度过程来从计算资源集125中为该请求110分配目标数目的计算资源。例如,计算资源调度设备115可以为请求110分配计算资源125-1和计算资源125-2。
以下将详细讨论计算资源调度设备115动态分配计算资源的示例实现。
示例过程
图2示出了根据本公开一些实现的计算资源的动态分配的过程200的流程图。过程200可以由计算资源调度设备115来实现。
在202,计算资源调度设备115接收用于使用计算资源集120中的目标数目的计算资源的第一请求110,其中计算资源集120中的至少一个空闲计算资源被组织为至少一个空闲资源组。在一些实现中,计算资源调度设备115可以申请计算资源集120中的计算资源的应用或租户105处接收第一请求110。例如,租户105可以向计算资源调度设备115发出使用2个GPU设备以用于部署机器学习算法的请求。
在一些实现中,计算资源调度设备115可以基于按照预定的规则来将计算资源集120中的空闲计算资源组织为一个或多个空闲资源组。例如,根据对历史事件所接收的请求的分析而确定更多的租户请求2个计算资源,计算资源调度设备115可以优先将空闲的计算资源组织为连续的2个计算资源构成的空闲资源组的形式。
考虑到在计算资源部署的应用越来越多地关注计算设备的邻近性,例如位于同一个PCIe交换机的两个GPU一起工作的性能将远高于位于两个不同计算节点中的GPU。在一些实现中,计算调度资源设备115可以确定与计算资源集110对应的多级拓扑结构,并基于该多级拓扑结构来组织空闲资源组。以下以GPU作为计算资源的示例,并将参考图3来描述组织空闲资源组的过程,图3示出了根据本公开的一些实现的计算资源集的示例拓扑结构300的示意图。
对于按照以下方式组织的多个GPU:其被组织为多个计算节点,并且每个计算节点中包括2个中央处理单元(CPU)插槽,每个CPU插槽进一步连接2个总线和接口标准(PCIe)交换机,每个PCIe交换机连接2个GPU,其对应的拓扑结构300如图3所示。拓扑结构300包括与多个不同层级相关联的多个节点。
具体地,拓扑结构300可以包括第一层级340,其中第一层级340中包括与个体GPU对应的多个GPU节点345-1至345-8(单独或统称为GPU节点345)。例如,GPU节点345-1至345-8分别与图1中的计算资源125-1至125-N相对应(其中,N为8)。拓扑结构300还包括第二层级330,其中第二层级330中包括与将多个GPU连接的PCIe交换机相对应的节点335-1至335-4(单独或统称为PCIe节点335)。
拓扑结构300还包括第三层级320,其中第三层级320包括与将多个PCIe交换机连接的CPU插槽相对应的节点325-1至325-2(单独或统称为CPU节点325)。进一步地,拓扑结构300还包括第一层级310,其中第一层级310包括与将多个CPU插槽连接的计算设备相对应的节点315-1至315-N(单独或统一称为计算设备节点315)。
图3所示的拓扑结构300中的具体节点布置及层级数目仅是示例性的,其不旨在限定本公开的方案。应当理解,可以根据实际拓扑结构而具有附加的层级、更少的层级。例如,当一个CPU插槽连接一个PCIe交换机时,可以省略第二层级330。在一些实现中,多级拓扑结构可以包括第一层级340、第二层级330、第三层级320和第四层级310中的至少两个层级。
在一些实现中,计算资源调度设备115可以基于计算资源集110对应的多级拓扑结构,将至少一个空闲计算资源组织为至少一个空闲资源组,以使得每个空闲资源组包括与多级拓扑结构中的同一节点相关联的全部计算资源,其中多级拓扑结构中的节点对应于计算资源集中的相应计算资源或计算资源集中多个计算资源的连接组件。
在一些实现中,计算资源调度设备115可以将空闲计算资源组织为与可能的最高层级的节点相关联。例如,继续图3的示例,基于多级拓扑结构300,在计算资源125-1至125-N均为空闲的情况下,计算调度资源设备115可以将空闲计算资源125组织为到同一个空闲资源组中,其中该组中的所有空闲资源125均与多级拓扑结构300中的第四层级中的计算设备节点315-2相关联。
作为另一示例,例如当与节点345-1和345-2相对应的计算资源125-1和125-2已经被使用时。基于多级拓扑结构300,计算资源调度设备115可以确定与节点345-3和345-4相对应的计算资源125-3和125-4将被组织为一个空闲资源组370,其中每个计算资源均对应于PCIe节点335-2。类似地,计算资源调度设备115可以将与节点345-5至345-8相对应的计算资源125-5至125-N(N=8)组织为一个空闲资源组380,其中每个计算资源均与CPU节点380相关联。如图3所示,由于与节点345-1和345-2相对应的计算资源125-1和125-2已经被使用,计算资源125-1和125-2将不会与计算资源125-5至125-8被组织为同一个空闲资源组。基于这样的空闲资源组织方式,计算资源调度设备115能够保证被分配的计算资源总是具有邻近性,从而能够提高计算资源运行时的效率。
继续参考图2,在204,计算资源调度设备115确定至少一个空闲资源组中是否包括具有目标数目的计算资源的空闲匹配资源组。在一些实现中,计算资源调度设备115可以维护与空闲资源组的列表。继续图3的示例,当8个计算资源125均为空闲时,计算资源调度设备115可以确定仅有一个计算资源数目为8的空闲资源组。响应于在204确定至少一个空闲资源组中包括空闲匹配资源组,方法200还可以进行到210,其中计算资源调度设备115为第一请求110分配空闲匹配资源组中的计算资源。
响应于在204确定至少一个空闲资源组中不包括空闲匹配资源组,方法200进行到206,其中计算资源调度设备115确定至少一个空闲资源组中是否包括空闲冗余资源组,其中空闲冗余资源组中的资源数目大于目标数目。继续图3的示例,例如,当第一请求110请求使用2个计算资源时,计算资源调度设备115可以确定不存在与数目2相对应的空闲匹配资源组。
计算资源调度设备115可以进一步确定是否存在空闲冗余资源组。在一些实现中,计算资源调度设备115可以按照大小的递增顺序依次寻找是否有上一层级的空闲冗余资源组。例如,计算资源调度设备115当确定不存在大小为2的空闲资源组时,其可以进一步搜索是否存在与第三层级320相对应的空闲资源组(大小为4的资源组),之后在进一步搜索是否存在与第四层级310相对应的空闲资源组(大小为8的资源组)。
响应于在206确定至少一个空闲资源组中包括空闲冗余资源组,方法200进行到208,其中计算资源调度设备115通过拆分空闲冗余资源组来为第一请求分配目标数目的计算资源。在一些实现中,计算资源调度设备115可以将空闲冗余资源组拆分为第一资源组和至少一个第二资源组,其中第一资源组具有目标数目的计算资源,并且为第一请求分配第一资源组中的计算资源。例如,继续图3的示例,当8个计算资源125均为空闲时,并且第一请求110请求的计算资源数目为2,则计算资源调度设备115可以将空闲冗余资源组切分为第一资源组360(包括计算资源125-1和125-2)、空闲资源组370(包括计算资源125-3和125-4)以及空闲资源组380(包括计算资源125-5至125-8)。计算资源调度设备115可以进一步将获得的第一资源360中的计算资源125-1和125-2分配给第一请求110。
在一些实现中,计算资源调度设备115可以按照拓扑层级来拆分空闲冗余资源组。例如,计算资源调度设备115可以将与第四层级310中的节点315-2对应的空闲冗余资源组拆分为2个与第三层级320中的节点325-1和325-2相对应的空闲资源组,并进一步对于节点325-1相对应的空闲资源组进行拆分以获得2个与第四层级330中的节点335-1和335-2相对应的空闲资源组。基于这样的方式,计算资源调度设备115可以在保证所分配资源的邻近性的前提下,进一步保证尽可能保留更大的连续计算资源组,从而使得计算资源能够应对不同大小的使用请求。
在一些实现中,响应于第一请求110执行完成,计算资源调度设备115可以将第一资源组标记为空闲。计算资源调度设备115可以进一步确定至少一个第二资源组中包括的计算资源均为空闲,将第一资源组和至少一个第二资源组中包括的计算资源合并为新的空闲资源组。例如,继续图3的示例,当计算资源调度设备115确定与节点345-1和345-2相对应的计算资源125-1和125-2已经被标记为空闲时,计算资源调度设备115可以首先确定与上一层节点325-1相对应的其他计算资源125-3和125-4是否空空闲,如果是,则可以将该四个计算资源125-1至125-2合并为新的空闲资源组。进一步地,计算资源调度设备115还可以确定与节点325-1上一层的节点315-2相对应的其他计算资源125-5至125-N(N=8)是否空闲,如果是,则计算资源调度设备115可以进一步将计算资源125-1至125-N(N=8)合并为新的空闲资源组,以供处理后续请求。基于这样的方式,计算资源调度设备115总是可以保留更大的连续计算资源组,从而使得计算资源能够应对不同大小的使用请求。
在一些实现中,响应于在206确定至少一个空闲资源组中未包括空闲冗余资源组,方法200还可以进行到212,其中计算资源调度设备115确定第一请求110的优先级是否高于优先级阈值。在一些实现中,应用和/或租户105可以在发送第一请求110时附加指示优先级的信息。例如,应用和/或租户105可以根据要部署的任务的类型来指定特定的优先级。例如,更为重要的任务可以被指定更高的优先级。
在一些实现中,计算资源调度设备115还可以实现所接收请求的优先级控制。图4示出了根据本公开的另一些实现的请求优先级控制的过程的流程图。如图4所示,在框402,计算资源调度设备115可以确定与第一请求相关联的第一租户105已经使用的资源组中的计算资源的第一数目。在框404,计算资源调度设备115可以确定目标数目和第一数目的总和超过与第一租户相对应的计算资源数目上限。在一些实现中,与第一租户相对应的计算资源数目上限等于为第一租户预分配的计算资源的第二数目和租户通过与第二租户交换获得的计算资源的第三数目的总和。
例如,根据租户105所购买的服务,计算资源调度设备11可以为递交第一请求110的第一租户设置其预分配的资源的第二数目(也称为租户额度)为4。在一些实现中,计算资源调度设备115可以支持租户105的预分配的资源的第二数目的动态调整。例如,租户105可以向计算资源调度设备115申请减小在第一时间段内的租户额度来增加第二时间段内的租户额度。基于这样的方式,例如,租户105可以通过将平时空闲的计算资源让出,以换取在某些作业比较集中的时段的更多的计算资源。
在一些实现中,每个租户都可以被预分配一个虚拟私有计算资源集,在该虚拟私有计算资源集中的资源总是可以被该租户以高优先级占用。在一些实现中,虚拟私有计算资源集可以与上文所描述的多层拓扑结构中的一层中的节点相对应,使得租户被分配的计算资源总是具有邻近性。
在一些实现中,计算资源调度设备115还可以支持租户之间的资源交换。例如,计算资源调度设备115可以配置资源交互的预定规则,并收集各个租户所提交的资源交换申请。计算资源调度设备可以判断所递交的资源交换申请是否符合预定规则来执行资源交换。在一些实现中,预定规则可以是基于不同租户的积分来进行交换计算资源。例如,不同的租户可以通过提供计算资源来换取对应的积分,租户A例如可以申请以2个积分换取一个计算资源,租户B可以申请以3个积分换取一个计算资源,租户C可以申请提供计算资源。此时根据预定的规则,计算资源调度设备115可以确定租户B可以以3个积分为代价获取租户C所提供的计算资源,并且租户C可以增加对应的积分。基于这样的方式,计算资源调度设备115可以支持不同租户之间交换所拥有的资源,进一步提升计算资源的利用效率。例如,第一租户105可以通过交换获得额外的2个可用计算资源。
响应于在框404确定该总和超过计算资源数目上限,计算资源调度设备115可以将第一请求的优先级设置为低于优先级阈值。基于这样的方式,计算资源调度设备115可以在租户105可以以较低的优先级占用一些其他租户暂时空闲的计算资源,从而提高了计算资源的利用率。
替代地,响应于在框404确定该总和超过计算资源数目上限,计算资源调度设备115也可以直接挂起第一请求,知道总和小于或等于计算资源数目上限。
替代地,响应于在框404确定该总和超过计算资源数目上限,计算资源调度设备115也可以提醒租户105是否要以低优先级来分配资源以及提示以低优先级分配的资源可能随时被回收。计算资源调度设备115可以在获得租户105确定以低优先级分配资源的确认后,将第一请求110的优先级设置为低于阈值。
继续参考图2,响应于在212确定优先级高于优先级阈值,方法200还可以进行到214,其中计算资源调度设备115确定利用计算资源集中的至少一个可用计算资源来为第一请求分配目标数目的计算资源,其中可用计算资源包括空闲计算资源和候选计算资源,候选计算资源已经分配给优先级小于或等于优先级阈值的第二请求。例如,当经过框202至框206的过程确定该租户已经不具有空闲计算资源,并且此时该租户递交的第一请求的110的优先级还高于阈值时,此时可能是一些低优先级的请求已经占用了已经被分配给租户的虚拟私有资源集中的资源。
在一些实现中,计算资源调度设备115允许具有高于优先级阈值的优先级的请求占用已经分配给小于或等于优先级阈值的优先级的请求的计算资源,这些计算资源也被称为候选计算资源。此时,计算资源调度设备115可以还可以根据与组织空闲资源组相同的方式来将可用的计算资源组织为至少一个可用计算资源组。以下将参考图5来详细描述框214的过程,图5示出了根据本公开的一些实现的利用可用计算资源进行分配的过程500的流程图。
如图5所示,在框502,计算资源调度设备115可以确定至少一个可用资源组中是否包括具有目标数目的计算资源的可用匹配资源组。继续图3的示例,例如与节点345-1和345-2对应的计算资源125-1和125-2是被分配给低于优先级阈值的第二请求,则此时可用资源包括计算资源125-1至125-N(N=8),尽管资源125-1和125-2非空闲。因此,根据上文所描述的方式,计算资源调度设备115可以将可用计算资源125-1至125-8组织为一个可用计算资源组。
响应于在框502确定至少一个可用资源组中包括可用匹配资源组,则方法进行到框502,其中计算资源调度设备115可以回收可用匹配资源组中已经被分配的计算资源。例如,当第一请求110需要使用8个计算资源时,计算资源调度设备115可以直接终止在计算资源125-1和125-2上进行的作业,并回收已经分配给第二请求的计算资源125-1和125-2。在框506,计算资源调度设备115为第一请求110分配可用匹配资源组中的计算资源。例如,计算资源调度设备115可以将可用计算资源125-1至125-N(N=8)分配给第一请求110。
基于这样的方式,计算资源调度设备115可以在支持一些请求临时地占用其他租户所分配的计算资源的同时,还可以保证其他租户总是能够获得其对应的额度内的计算资源。
响应于在框502确定至少一个可用资源组中不包括可用匹配资源组,则方法进行到框508,其中计算资源调度设备115可以确定至少一个可用资源组中是否包括可用冗余资源组,其中可用冗余资源组中的资源数目大于目标数目。
响应于在框508确定至少一个可用资源组中包括可用冗余资源组,则方法进行到框510,其中计算资源调度设备115可以通过拆分可用冗余资源组来为第一请求分配目标数目的计算资源。应当理解,框508和框510的过程与上文针对框206和框208所描述的过程类似,计算资源调度设备115可以通过拆分更大的连续的可用计算资源来获得目标数目的计算资源。
基于以上的方式,计算资源调度设备115可以针对不同优先级的请求执行不同的个性化的分配逻辑,其中高优先级的请求可以在优先分配空闲计算资源的前提下,还进一步可以使用由低优先级请求所占用的计算资源,从而提高了计算资源分配的灵活性。
示例环境
图6示出了可以用来实施本公开的实施例的示例设备600的示意性框图。设备600可以用于实现图1的调度计算设备120。应当理解,图6所示出的设备600仅仅是示例性的,而不应当构成对本公开所描述的实现的功能和范围的任何限制。如图1所示,设备600的组件可以包括但不限于一个或多个处理器或处理单元110、存储器120、存储设备130、一个或多个通信单元140、一个或多个输入设备150以及一个或多个输出设备160。
在一些实现中,设备600可以被实现为各种用户终端或服务终端。服务终端可以是各种服务提供方提供的服务器、大型计算设备等。用户终端诸如是任何类型的移动终端、固定终端或便携式终端,包括移动手机、多媒体计算机、多媒体平板、互联网节点、通信器、台式计算机、膝上型计算机、笔记本计算机、上网本计算机、平板计算机、个人通信系统(PCS)设备、个人导航设备、个人数字助理(PDA)、音频/视频播放器、数码相机/摄像机、定位设备、电视接收器、无线电广播接收器、电子书设备、游戏设备或者其任意组合,包括这些设备的配件和外设或者其任意组合。还可预见到的是,设备600能够支持任何类型的针对用户的接口(诸如“可佩戴”电路等)。
处理单元610可以是实际或虚拟处理器并且能够根据存储器620中存储的程序来执行各种处理。在多处理器系统中,多个处理单元并行执行计算机可执行指令,以提高设备600的并行处理能力。处理单元610也可以被称为中央处理单元(CPU)、微处理器、控制器、微控制器。
设备600通常包括多个计算机存储介质。这样的介质可以是设备600可访问的任何可以获得的介质,包括但不限于易失性和非易失性介质、可拆卸和不可拆卸介质。存储器620可以是易失性存储器(例如寄存器、高速缓存、随机访问存储器(RAM))、非易失性存储器(例如,只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、闪存)或其某种组合。存储器620可以包括一个或多个程序旋律生成模块622,这些程序模块被配置为执行本文所描述的各种实现的功能。旋律生成模块622可以由处理单元610访问和运行,以实现相应功能。存储设备630可以是可拆卸或不可拆卸的介质,并且可以包括机器可读介质,其能够用于存储信息和/或数据并且可以在设备600内被访问。
设备600的组件的功能可以以单个计算集群或多个计算机器来实现,这些计算机器能够通过通信连接进行通信。因此,设备600可以使用与一个或多个其他服务器、个人计算机(PC)或者另一个一般网络节点的逻辑连接来在联网环境中进行操作。设备600还可以根据需要通过通信单元640与一个或多个外部设备(未示出)进行通信,外部设备诸如数据库670、其他存储设备、服务器、显示设备等,与一个或多个使得用户与设备600交互的设备进行通信,或者与使得设备600与一个或多个其他计算设备通信的任何设备(例如,网卡、调制解调器等)进行通信。这样的通信可以经由输入/输出(I/O)接口(未示出)来执行。
输入设备650可以是一个或多个各种输入设备,例如鼠标、键盘、追踪球、语音输入设备、相机等。输出设备660可以是一个或多个输出设备,例如显示器、扬声器、打印机等。
设备600包括资源调度模块622,其被配置为接收用于使用计算资源集中的目标数目的计算资源的第一请求,计算资源集中的至少一个空闲计算资源被组织为至少一个空闲资源组;确定至少一个空闲资源组中是否包括具有目标数目的计算资源的空闲匹配资源组;响应于至少一个空闲资源组中不包括空闲匹配资源组,确定至少一个空闲资源组中是否包括空闲冗余资源组,空闲冗余资源组中的资源数目大于目标数目;以及响应于至少一个空闲资源组中包括空闲冗余资源组,通过拆分空闲冗余资源组来为第一请求分配目标数目的计算资源。
示例实现方式
以下列出了本公开的一些示例实现方式。
在第一方面,提供了一种管理计算资源的方法。该方法包括:接收用于使用计算资源集中的目标数目的计算资源的第一请求,计算资源集中的至少一个空闲计算资源被组织为至少一个空闲资源组;确定至少一个空闲资源组中是否包括具有目标数目的计算资源的空闲匹配资源组;响应于至少一个空闲资源组中不包括空闲匹配资源组,确定至少一个空闲资源组中是否包括空闲冗余资源组,空闲冗余资源组中的资源数目大于目标数目;以及响应于至少一个空闲资源组中包括空闲冗余资源组,通过拆分空闲冗余资源组来为第一请求分配目标数目的计算资源。
在一些实现中,该方法还包括:基于计算资源集对应的多级拓扑结构,将至少一个空闲计算资源组织为至少一个空闲资源组,以使得每个空闲资源组包括与多级拓扑结构中的同一节点相关联的全部计算资源,多级拓扑结构中的节点对应于计算资源集中的相应计算资源或计算资源集中多个计算资源的连接组件。
在一些实现中,计算资源包括图形处理单元,多级拓扑结构包括以下中的至少两项:第一层级,第一层级包括与个体图形处理单元对应的节点;第二层级,第二层级包括与将多个图形处理单元连接的PCIe交换机对应的节点;第三层级,第三层级包括与将多个PCIe交换机连接的CPU插槽对应的节点;以及第四层级,第四层级包括与将多个CPU插槽连接的计算设备对应的节点。
在一些实现中,通过拆分空闲冗余资源组来为第一请求分配目标数目的计算资源包括:将空闲冗余资源组拆分为第一资源组和至少一个第二资源组,第一资源组具有目标数目的计算资源;以及为第一请求分配第一资源组中的计算资源。
在一些实现中,该方法还包括:响应于第一请求执行完成,将第一资源组标记为空闲;以及响应于确定至少一个第二资源组中包括的计算资源均为空闲,将第一资源组和至少一个第二资源组中包括的计算资源合并为新的空闲资源组。
在一些实现中,该方法还包括:响应于确定至少一个空闲资源组中不包括空闲冗余资源组,确定第一请求的优先级是否高于优先级阈值;以及响应于优先级高于优先级阈值,利用计算资源集中的至少一个可用计算资源来为第一请求分配目标数目的计算资源,可用计算资源包括空闲计算资源和候选计算资源,候选计算资源已经分配给优先级小于或等于优先级阈值的第二请求。
在一些实现中,至少一个可用计算资源被组织为至少一个可用资源组,其中利用计算资源集中的可用计算资源来为第一请求分配目标数目的计算资源包括:确定至少一个可用资源组中是否包括具有目标数目的计算资源的可用匹配资源组;响应于至少一个可用资源组中包括可用匹配资源组,回收可用匹配资源组中已经被分配的计算资源;以及为第一请求分配可用匹配资源组中的计算资源。
在一些实现中,利用计算资源集中的可用计算资源来为第一请求分配目标数目的计算资源包括:响应于至少一个可用资源组中不包括可用匹配资源组,确定至少一个可用资源组中是否包括可用冗余资源组,可用冗余资源组中的资源数目大于目标数目;以及响应于确定至少一个可用资源组中包括可用冗余资源组,通过拆分可用冗余资源组来为第一请求分配目标数目的计算资源。
在一些实现中,该方法还包括:确定与第一请求相关联的第一租户已经使用的资源组中的计算资源的第一数目;以及响应于确定目标数目和第一数目的总和超过与第一租户相对应的计算资源数目上限,将第一请求的优先级设置为低于优先级阈值。
在一些实现中,与第一租户相对应的计算资源数目上限等于为第一租户预分配的计算资源的第二数目和租户通过与第二租户交换获得的计算资源的第三数目的总和。
在第二方面,提供了一种设备。该设备包括:处理单元;以及
存储器,耦合至处理单元并且包含存储于其上的指令,指令在由处理单元执行时使设备执行以下动作:接收用于使用计算资源集中的目标数目的计算资源的第一请求,计算资源集中的至少一个空闲计算资源被组织为至少一个空闲资源组;确定至少一个空闲资源组中是否包括具有目标数目的计算资源的空闲匹配资源组;响应于至少一个空闲资源组中不包括空闲匹配资源组,确定至少一个空闲资源组中是否包括空闲冗余资源组,空闲冗余资源组中的资源数目大于目标数目;以及响应于至少一个空闲资源组中包括空闲冗余资源组,通过拆分空闲冗余资源组来为第一请求分配目标数目的计算资源。
在一些实现中,动作还包括:基于计算资源集对应的多级拓扑结构,将至少一个空闲计算资源组织为至少一个空闲资源组,以使得每个空闲资源组包括与多级拓扑结构中的同一节点相关联的全部计算资源,多级拓扑结构中的节点对应于计算资源集中的相应计算资源或计算资源集中多个计算资源的连接组件。
在一些实现中,计算资源包括图形处理单元,多级拓扑结构包括以下中的至少两项:第一层级,第一层级包括与个体图形处理单元对应的节点;第二层级,第二层级包括与将多个图形处理单元连接的PCIe交换机对应的节点;第三层级,第三层级包括与将多个PCIe交换机连接的CPU插槽对应的节点;以及第四层级,第四层级包括与将多个CPU插槽连接的计算设备对应的节点。
在一些实现中,通过拆分空闲冗余资源组来为第一请求分配目标数目的计算资源包括:将空闲冗余资源组拆分为第一资源组和至少一个第二资源组,第一资源组具有目标数目的计算资源;以及为第一请求分配第一资源组中的计算资源。
在一些实现中,动作还包括:响应于第一请求执行完成,将第一资源组标记为空闲;以及响应于确定至少一个第二资源组中包括的计算资源均为空闲,将第一资源组和至少一个第二资源组中包括的计算资源合并为新的空闲资源组。
在一些实现中,动作还包括:响应于确定至少一个空闲资源组中不包括空闲冗余资源组,确定第一请求的优先级是否高于优先级阈值;以及响应于优先级高于优先级阈值,利用计算资源集中的至少一个可用计算资源来为第一请求分配目标数目的计算资源,可用计算资源包括空闲计算资源和候选计算资源,候选计算资源已经分配给优先级小于或等于优先级阈值的第二请求。
在一些实现中,至少一个可用计算资源被组织为至少一个可用资源组,其中利用计算资源集中的可用计算资源来为第一请求分配目标数目的计算资源包括:确定至少一个可用资源组中是否包括具有目标数目的计算资源的可用匹配资源组;响应于至少一个可用资源组中包括可用匹配资源组,回收可用匹配资源组中已经被分配的计算资源;以及为第一请求分配可用匹配资源组中的计算资源。
在一些实现中,其中利用计算资源集中的可用计算资源来为第一请求分配目标数目的计算资源包括:响应于至少一个可用资源组中不包括可用匹配资源组,确定至少一个可用资源组中是否包括可用冗余资源组,可用冗余资源组中的资源数目大于目标数目;以及响应于确定至少一个可用资源组中包括可用冗余资源组,通过拆分可用冗余资源组来为第一请求分配目标数目的计算资源。
在一些实现中,动作还包括:确定与第一请求相关联的第一租户已经使用的资源组中的计算资源的第一数目;以及响应于确定目标数目和第一数目的总和超过与第一租户相对应的计算资源数目上限,将第一请求的优先级设置为低于优先级阈值。
在一些实现中,与第一租户相对应的计算资源数目上限等于为第一租户预分配的计算资源的第二数目和租户通过与第二租户交换获得的计算资源的第三数目的总和。
在第三方面,本公开提供了一种计算机程序产品,所述计算机程序产品被有形地存储在非瞬态计算机存储介质中并且包括机器可执行指令,所述机器可执行指令在由设备执行根据第一方面的方法。
在第四方面,本公开提供了一种计算机可读介质,其上存储有机器可执行指令,机器可执行指令在由设备执行时使设备执行上述第一方面的方法。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)等等。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
此外,虽然采用特定次序描绘了各操作,但是这应当理解为要求这样操作以所示出的特定次序或以顺序次序执行,或者要求所有图示的操作应被执行以取得期望的结果。在一定环境下,多任务和并行处理可能是有利的。同样地,虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本公开的范围的限制。在单独的实现的上下文中描述的某些特征还可以组合地实现在单个实现中。相反地,在单个实现的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实现中。
尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。

Claims (20)

1.一种管理计算资源的方法,包括:
接收用于使用计算资源集中的目标数目的计算资源的第一请求,所述计算资源集中的至少一个空闲计算资源被组织为至少一个空闲资源组;
确定所述至少一个空闲资源组中是否包括具有所述目标数目的计算资源的空闲匹配资源组;
响应于所述至少一个空闲资源组中不包括所述空闲匹配资源组,确定所述至少一个空闲资源组中是否包括空闲冗余资源组,所述空闲冗余资源组中的资源数目大于所述目标数目;以及
响应于所述至少一个空闲资源组中包括所述空闲冗余资源组,通过拆分所述空闲冗余资源组来为所述第一请求分配所述目标数目的计算资源。
2.根据权利要求1所述的方法,还包括:
基于所述计算资源集对应的多级拓扑结构,将所述至少一个空闲计算资源组织为所述至少一个空闲资源组,以使得每个空闲资源组包括与所示多级拓扑结构中的同一节点相关联的全部计算资源,所述多级拓扑结构中的节点对应于所述计算资源集中的相应计算资源或所述计算资源集中多个计算资源的连接组件。
3.根据权利要求2所述的方法,其中所述计算资源包括图形处理单元,所述多级拓扑结构包括以下中的至少两项:
第一层级,所述第一层级包括与个体图形处理单元对应的节点;
第二层级,所述第二层级包括与将多个图形处理单元连接的PCIe交换机对应的节点;
第三层级,所述第三层级包括与将多个PCIe交换机连接的CPU插槽对应的节点;以及
第四层级,所述第四层级包括与将多个CPU插槽连接的计算设备对应的节点。
4.根据权利要求1所述的方法,其中通过拆分所述空闲冗余资源组来为所述第一请求分配所述目标数目的计算资源包括:
将所述空闲冗余资源组拆分为第一资源组和至少一个第二资源组,所述第一资源组具有所述目标数目的计算资源;以及
为所述第一请求分配所述第一资源组中的计算资源。
5.根据权利要求4所述的方法,还包括:
响应于所述第一请求执行完成,将所述第一资源组标记为空闲;以及
响应于确定所述至少一个第二资源组中包括的计算资源均为空闲,将所述第一资源组和至少一个第二资源组中包括的计算资源合并为新的空闲资源组。
6.根据权利要求1所述的方法,还包括:
响应于确定所述至少一个空闲资源组中不包括所述空闲冗余资源组,确定所述第一请求的优先级是否高于优先级阈值;以及
响应于所述优先级高于所述优先级阈值,利用所述计算资源集中的至少一个可用计算资源来为所述第一请求分配所述目标数目的计算资源,所述可用计算资源包括空闲计算资源和候选计算资源,所述候选计算资源已经分配给优先级小于或等于所述优先级阈值的第二请求。
7.根据权利要求6所述的方法,其中所述至少一个可用计算资源被组织为至少一个可用资源组,其中利用所述计算资源集中的可用计算资源来为所述第一请求分配所述目标数目的计算资源包括:
确定所述至少一个可用资源组中是否包括具有所述目标数目的计算资源的可用匹配资源组;
响应于所述至少一个可用资源组中包括所述可用匹配资源组,回收所述可用匹配资源组中已经被分配的计算资源;以及
为所述第一请求分配所述可用匹配资源组中的计算资源。
8.根据权利要求7所述的方法,其中利用所述计算资源集中的可用计算资源来为所述第一请求分配所述目标数目的计算资源包括:
响应于所述至少一个可用资源组中不包括所述可用匹配资源组,确定所述至少一个可用资源组中是否包括可用冗余资源组,所述可用冗余资源组中的资源数目大于所述目标数目;以及
响应于确定所述至少一个可用资源组中包括所述可用冗余资源组,通过拆分所述可用冗余资源组来为所述第一请求分配所述目标数目的计算资源。
9.根据权利要求1所述的方法,还包括:
确定与所述第一请求相关联的第一租户已经使用的资源组中的计算资源的第一数目;以及
响应于确定所述目标数目和所述第一数目的总和超过与所述第一租户相对应的计算资源数目上限,将所述第一请求的优先级设置为低于优先级阈值。
10.根据权利要求9所述的方法,其中与所述第一租户相对应的所述计算资源数目上限等于为所述第一租户预分配的计算资源的第二数目和所述租户通过与第二租户交换获得的计算资源的第三数目的总和。
11.一种设备,包括:
处理单元;以及
存储器,耦合至所述处理单元并且包含存储于其上的指令,所述指令在由所述处理单元执行时使所述设备执行以下动作:
接收用于使用计算资源集中的目标数目的计算资源的第一请求,所述计算资源集中的至少一个空闲计算资源被组织为至少一个空闲资源组;
确定所述至少一个空闲资源组中是否包括具有所述目标数目的计算资源的空闲匹配资源组;
响应于所述至少一个空闲资源组中不包括所述空闲匹配资源组,确定所述至少一个空闲资源组中是否包括空闲冗余资源组,所述空闲冗余资源组中的资源数目大于所述目标数目;以及
响应于所述至少一个空闲资源组中包括所述空闲冗余资源组,通过拆分所述空闲冗余资源组来为所述第一请求分配所述目标数目的计算资源。
12.根据权利要求11所述的设备,所述动作还包括:
基于所述计算资源集对应的多级拓扑结构,将所述至少一个空闲计算资源组织为所述至少一个空闲资源组,以使得每个空闲资源组包括与所述多级拓扑结构中的同一节点相关联的全部计算资源,所述多级拓扑结构中的节点对应于所述计算资源集中的相应计算资源或所述计算资源集中多个计算资源的连接组件。
13.根据权利要求12所述的设备,其中所述计算资源包括图形处理单元,所述多级拓扑结构包括以下中的至少两项:
第一层级,所述第一层级包括与个体图形处理单元对应的节点;
第二层级,所述第二层级包括与将多个图形处理单元连接的PCIe交换机对应的节点;
第三层级,所述第三层级包括与将多个PCIe交换机连接的CPU插槽对应的节点;以及
第四层级,所述第四层级包括与将多个CPU插槽连接的计算设备对应的节点。
14.根据权利要求11所述的设备,其中通过拆分所述空闲冗余资源组来为所述第一请求分配所述目标数目的计算资源包括:
将所述空闲冗余资源组拆分为第一资源组和至少一个第二资源组,所述第一资源组具有所述目标数目的计算资源;以及
为所述第一请求分配所述第一资源组中的计算资源。
15.根据权利要求14所述的设备,所述动作还包括:
响应于所述第一请求执行完成,将所述第一资源组标记为空闲;以及
响应于确定所述至少一个第二资源组中包括的计算资源均为空闲,将所述第一资源组和至少一个第二资源组中包括的计算资源合并为新的空闲资源组。
16.根据权利要求11所述的设备,所述动作还包括:
响应于确定所述至少一个空闲资源组中不包括所述空闲冗余资源组,确定所述第一请求的优先级是否高于优先级阈值;以及
响应于所述优先级高于所述优先级阈值,利用所述计算资源集中的至少一个可用计算资源来为所述第一请求分配所述目标数目的计算资源,所述可用计算资源包括空闲计算资源和候选计算资源,所述候选计算资源已经分配给优先级小于或等于所述优先级阈值的第二请求。
17.根据权利要求16所述的设备,其中所述至少一个可用计算资源被组织为至少一个可用资源组,其中利用所述计算资源集中的可用计算资源来为所述第一请求分配所述目标数目的计算资源包括:
确定所述至少一个可用资源组中是否包括具有所述目标数目的计算资源的可用匹配资源组;
响应于所述至少一个可用资源组中包括所述可用匹配资源组,回收所述可用匹配资源组中已经被分配的计算资源;以及
为所述第一请求分配所述可用匹配资源组中的计算资源。
18.根据权利要求17所述的设备,其中利用所述计算资源集中的可用计算资源来为所述第一请求分配所述目标数目的计算资源包括:
响应于所述至少一个可用资源组中不包括所述可用匹配资源组,确定所述至少一个可用资源组中是否包括可用冗余资源组,所述可用冗余资源组中的资源数目大于所述目标数目;以及
响应于确定所述至少一个可用资源组中包括所述可用冗余资源组,通过拆分所述可用冗余资源组来为所述第一请求分配所述目标数目的计算资源。
19.根据权利要求11所述的设备,所述动作还包括:
确定与所述第一请求相关联的第一租户已经使用的资源组中的计算资源的第一数目;以及
响应于确定所述目标数目和所述第一数目的总和超过与所述第一租户相对应的计算资源数目上限,将所述第一请求的优先级设置为低于优先级阈值。
20.一种计算机程序产品,所述计算机程序产品被有形地存储在非瞬态计算机存储介质中并且包括机器可执行指令,所述机器可执行指令在由设备执行时使所述设备执行根据权利要求1至10中任一项所述的方法。
CN201910578411.1A 2019-06-28 2019-06-28 计算资源的动态分配 Pending CN112148467A (zh)

Priority Applications (9)

Application Number Priority Date Filing Date Title
CN201910578411.1A CN112148467A (zh) 2019-06-28 2019-06-28 计算资源的动态分配
BR112021021732A BR112021021732A2 (pt) 2019-06-28 2020-05-04 Alocação dinâmica de recursos de computação
CA3139693A CA3139693A1 (en) 2019-06-28 2020-05-04 Dynamic allocation of computing resources
JP2021568246A JP7506096B2 (ja) 2019-06-28 2020-05-04 計算資源の動的割り当て
AU2020308941A AU2020308941A1 (en) 2019-06-28 2020-05-04 Dynamic allocation of computing resources
PCT/US2020/031250 WO2020263414A1 (en) 2019-06-28 2020-05-04 Dynamic allocation of computing resources
KR1020217042559A KR20220025746A (ko) 2019-06-28 2020-05-04 컴퓨팅 자원의 동적 할당
EP20729307.7A EP3991042A1 (en) 2019-06-28 2020-05-04 Dynamic allocation of computing resources
US17/609,700 US20220229701A1 (en) 2019-06-28 2020-05-04 Dynamic allocation of computing resources

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910578411.1A CN112148467A (zh) 2019-06-28 2019-06-28 计算资源的动态分配

Publications (1)

Publication Number Publication Date
CN112148467A true CN112148467A (zh) 2020-12-29

Family

ID=70919001

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910578411.1A Pending CN112148467A (zh) 2019-06-28 2019-06-28 计算资源的动态分配

Country Status (9)

Country Link
US (1) US20220229701A1 (zh)
EP (1) EP3991042A1 (zh)
JP (1) JP7506096B2 (zh)
KR (1) KR20220025746A (zh)
CN (1) CN112148467A (zh)
AU (1) AU2020308941A1 (zh)
BR (1) BR112021021732A2 (zh)
CA (1) CA3139693A1 (zh)
WO (1) WO2020263414A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024138482A1 (zh) * 2022-12-29 2024-07-04 华为技术有限公司 一种资源管理方法及相应装置

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210089467A1 (en) * 2020-10-01 2021-03-25 Intel Corporation Page allocation for contiguity-aware translation lookaside buffers
US20230004786A1 (en) * 2021-06-30 2023-01-05 Micron Technology, Inc. Artificial neural networks on a deep learning accelerator
CN114385370B (zh) * 2022-01-18 2022-10-25 重庆紫光华山智安科技有限公司 内存分配方法、系统、设备及介质
CN116701001B (zh) * 2023-08-08 2023-10-20 国网浙江省电力有限公司信息通信分公司 目标任务分配方法、装置、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1075769A1 (en) * 1998-04-29 2001-02-14 TELEFONAKTIEBOLAGET L M ERICSSON (publ) Resource allocation
US8468251B1 (en) * 2011-12-29 2013-06-18 Joyent, Inc. Dynamic throttling of access to computing resources in multi-tenant systems
CN106708622A (zh) * 2016-07-18 2017-05-24 腾讯科技(深圳)有限公司 集群资源处理方法和系统、资源处理集群
US20170250918A1 (en) * 2016-02-29 2017-08-31 International Business Machines Corporation Optimized resource provisioning
CN108363623A (zh) * 2018-02-27 2018-08-03 郑州云海信息技术有限公司 Gpu资源调度方法、装置、设备及计算机可读存储介质

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6333936B1 (en) * 1998-04-29 2001-12-25 Telefonaktiebolaget Lm Ericsson (Publ) Method and apparatus for allocating processing resources
US7580146B2 (en) * 2005-03-22 2009-08-25 Xerox Corporation Hierarchical architecture for a distributed and scalable network printing system
US8380959B2 (en) * 2008-09-05 2013-02-19 Apple Inc. Memory management system and method
CN103269282A (zh) * 2013-04-25 2013-08-28 杭州华三通信技术有限公司 网络配置自动部署方法和装置
US9674042B2 (en) 2013-11-25 2017-06-06 Amazon Technologies, Inc. Centralized resource usage visualization service for large-scale network topologies
JP6287261B2 (ja) * 2014-01-27 2018-03-07 日本電気株式会社 システム制御装置、制御方法、及びプログラム
CN108123980B (zh) 2016-11-30 2020-12-08 中移(苏州)软件技术有限公司 一种资源调度方法及系统
JP6853678B2 (ja) * 2017-01-27 2021-03-31 キヤノン株式会社 データ処理装置、画像再構成装置、データ処理方法、及びプログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1075769A1 (en) * 1998-04-29 2001-02-14 TELEFONAKTIEBOLAGET L M ERICSSON (publ) Resource allocation
US8468251B1 (en) * 2011-12-29 2013-06-18 Joyent, Inc. Dynamic throttling of access to computing resources in multi-tenant systems
US20170250918A1 (en) * 2016-02-29 2017-08-31 International Business Machines Corporation Optimized resource provisioning
CN106708622A (zh) * 2016-07-18 2017-05-24 腾讯科技(深圳)有限公司 集群资源处理方法和系统、资源处理集群
CN108363623A (zh) * 2018-02-27 2018-08-03 郑州云海信息技术有限公司 Gpu资源调度方法、装置、设备及计算机可读存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024138482A1 (zh) * 2022-12-29 2024-07-04 华为技术有限公司 一种资源管理方法及相应装置

Also Published As

Publication number Publication date
KR20220025746A (ko) 2022-03-03
JP2022539291A (ja) 2022-09-08
CA3139693A1 (en) 2020-12-30
BR112021021732A2 (pt) 2022-01-04
AU2020308941A1 (en) 2021-12-23
JP7506096B2 (ja) 2024-06-25
US20220229701A1 (en) 2022-07-21
WO2020263414A1 (en) 2020-12-30
EP3991042A1 (en) 2022-05-04

Similar Documents

Publication Publication Date Title
CN109783229B (zh) 线程资源分配的方法及装置
CN112148467A (zh) 计算资源的动态分配
CN109684065B (zh) 一种资源调度方法、装置及系统
CN109684074B (zh) 物理机资源分配方法及终端设备
US9471391B1 (en) Aggregating resource requests
CN114416352A (zh) 算力资源分配方法、装置、电子设备及储存介质
CN103414657A (zh) 一种跨数据中心的资源调度方法、超级调度中心和系统
CN114924751A (zh) 一种业务访问请求流量分配的方法和装置
CN112905342A (zh) 资源调度方法、装置、设备及计算机可读存储介质
US9069621B2 (en) Submitting operations to a shared resource based on busy-to-success ratios
CN111163186B (zh) 一种id生成方法、装置、设备和存储介质
CN114860387A (zh) 一种面向虚拟化存储应用的hba控制器i/o虚拟化方法
CN110162395B (zh) 一种内存分配的方法及装置
US20190065270A1 (en) Methods and modules relating to allocation of host machines
CN113419856A (zh) 智能限流方法、装置、电子设备及存储介质
CN111382178A (zh) 一种网络任务分配方法、系统、设备和存储介质
CN115878333A (zh) 进程组间的一致性判断方法、装置及设备
CN110705884B (zh) 清单处理方法、装置、设备及存储介质
CN115809015A (zh) 分布式系统中数据处理的方法以及相关系统
US9176910B2 (en) Sending a next request to a resource before a completion interrupt for a previous request
US9251101B2 (en) Bitmap locking using a nodal lock
CN112181604B (zh) 一种缩容目标选择方法及装置
CN117311910B (zh) 一种高性能虚拟密码机运行方法
US12056372B2 (en) Collecting quality of service statistics for in-use child physical functions of multiple physical function non-volatile memory devices
WO2024138482A1 (zh) 一种资源管理方法及相应装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination