CN111433745B - 共享计算资源的动态容量优化 - Google Patents
共享计算资源的动态容量优化 Download PDFInfo
- Publication number
- CN111433745B CN111433745B CN201780091056.4A CN201780091056A CN111433745B CN 111433745 B CN111433745 B CN 111433745B CN 201780091056 A CN201780091056 A CN 201780091056A CN 111433745 B CN111433745 B CN 111433745B
- Authority
- CN
- China
- Prior art keywords
- presentity
- capacity
- computing resource
- shared
- presentities
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000005457 optimization Methods 0.000 title claims description 24
- 238000000034 method Methods 0.000 claims abstract description 53
- 230000000694 effects Effects 0.000 claims description 92
- 230000015654 memory Effects 0.000 claims description 40
- 238000012545 processing Methods 0.000 claims description 10
- 230000004044 response Effects 0.000 claims description 10
- 239000010410 layer Substances 0.000 description 69
- 238000004891 communication Methods 0.000 description 19
- 238000007726 management method Methods 0.000 description 19
- 230000008569 process Effects 0.000 description 12
- 238000004590 computer program Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 230000008520 organization Effects 0.000 description 7
- 230000008901 benefit Effects 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000003068 static effect Effects 0.000 description 3
- 230000003993 interaction Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 239000002356 single layer Substances 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000000246 remedial effect Effects 0.000 description 1
- 238000013468 resource allocation Methods 0.000 description 1
- 238000012502 risk assessment Methods 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 239000010409 thin film Substances 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5061—Partitioning or combining of resources
- G06F9/5077—Logical partitioning of resources; Management or configuration of virtualized resources
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5061—Partitioning or combining of resources
- G06F9/5072—Grid computing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2209/00—Indexing scheme relating to G06F9/00
- G06F2209/50—Indexing scheme relating to G06F9/50
- G06F2209/5014—Reservation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2209/00—Indexing scheme relating to G06F9/00
- G06F2209/50—Indexing scheme relating to G06F9/50
- G06F2209/5021—Priority
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2209/00—Indexing scheme relating to G06F9/00
- G06F2209/50—Indexing scheme relating to G06F9/50
- G06F2209/504—Resource capping
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
用于管理由一组在线实体共享的计算资源的系统,方法,设备和其他技术。系统可以从第一在线实体接收预留计算资源的容量的请求。该系统确定第一在线实体的相对优先级,并识别与第一在线实体的相对优先级相对应的预留区域。系统基于比较(i)所述计算资源的请求容量以及(ii)允许具有相对优先级等于或低于所述第一在线实体的所述相对优先级的在线实体预留的、由所述预留区域指定的所述计算资源的所述未使用容量的一部分,来确定是否满足所述请求。
Description
技术领域
本发明涉及用于管理共享计算资源的容量分配的系统、方法。
背景技术
云计算平台向在线实体提供对共享计算资源的访问。云平台可以包括一组计算机,这些计算机通常通过因特网为客户(有时称为云平台的“租户”)或更广泛的为在线实体,提供共享的计算资源和服务。例如,云平台可以提供网络,存储,硬件和其他计算资源的池,这些池允许实体大规模开发和执行在线应用,而无需实体维护自己的复杂信息技术(IT)基础结构。
在某些情况下,云平台被配置为将共享资源的容量分配给各个在线实体。例如,组织可以请求在云平台上运行应用,并且平台可以分配足够的容量以实例化可以将应用作为客户程序在平台上运行的虚拟机。尽管大型云平台可能具有可在许多租户之间共享的大量资源,但实际上,资源的容量是有限的。有时会为租户分配配额,该配额限制他们可能消耗的容量。配额可以是静态的,例如通过策略或云提供商与租户之间的协议来固定。但是,应用此类配额可能会导致云平台中的系统容量的整体使用效率低下,或者可能导致超出云平台容量的需求。例如,一个组织(或多个组织)可能被拒绝超出其配额的资源,即使云平台在组织需要特定资源的特定时间具有过剩的容量。在另一种情况下,组织(或多个组织)可能希望在特定时间使用其配额内的资源,但由于云平台已达到其最大容量,因此无法为其提供此类资源。
发明内容
本说明书描述了用于管理共享计算资源的容量分配的系统,方法,设备和其他技术,所述共享计算资源诸如是提供给云计算平台的租户的资源。代替发布租户静态使用配额,这里描述的技术动态地确定租户可以在其中预留共享资源的容量的区域,共享资源的容量取决于对应于租户的相对优先级的量。共享资源的“区域”(也称为“预留区域”)指的是共享资源的未使用容量,其可用于给定优先级层之内或之下的租户或其他实体。因此,较高优先级的租户可以比较低优先级的租户预留更多的容量,但是可以基于使用量预测,预计的容量可用性和其他标准来动态更新区域的边界/大小,从而可以跨一系列租户有效且更充分地利用资源。
本文描述的主题的一些实施方式包括计算系统。该系统可以包括具有存储器的一个或多个计算机和至少一个数据处理装置,该数据处理装置被配置为实现:在一组在线实体之间共享的计算资源,该计算资源具有用于执行该组在线实体的活动的有限容量;在线实体管理器,在线实体管理器基于优先标准,确定所述多个在线实体的相对优先级;优化引擎,其确定用于所述多个在线实体的一组预留区域,每个预留区域指定所述计算资源的未使用容量的一部分,允许具有相对优先级等于或低于所述预留区域的对应阈值优先级的在线实体预留所述未使用容量的一部分;资源管理器,所述资源管理器管理对所述多个在线实体分配所述计算资源的所述有限容量,包括响应于来自所述在线实体的请求,基于请求的容量是否小于由所述在线实体的所述对应预留区域指定的所述计算资源的所述未使用容量的一部分,来确定是否为在线实体预留所述计算资源的容量。
这些和其他实施方式可以可选地包括以下特征中的一个或多个。
在所述多个在线实体之中共享的所述计算资源包括在基于云的平台中的共享网络资源、共享服务器资源、共享存储资源、共享应用资源、或共享服务资源中的至少一个。
所述在线实体管理器通过以下方式确定所述多个在线实体的所述相对优先级:为所述多个在线实体中的每一个分配优先级分数,所述优先级分数表示所述在线实体的重要性的度量;和基于所述优先级分数,将所述多个在线实体分类为多个在线实体组,其中,每个在线实体组被赋予代表所述在线实体组的重要性的度量的相对优先级。所述多个在线实体的所述相对优先级可以对应于被分配了所述多个在线实体的相应在线实体组的所述相对优先级。
优化引擎确定用于所述在线实体组的相应预留区域,并且,除了被赋予最低相对优先级的组之外,用于每个特定的在线实体组的所述相应预留区域指定了允许所述特定组预留的所述计算资源的所述未使用容量的一部分,包括(i)允许具有比所述特定组低的相对优先级的组预留所述计算资源的所有未使用容量,以及(ii)所述计算资源的所述未使用容量的另一部分。
在线实体管理器基于所述优先标准,确定标准来确定分配给所述多个在线实体中的每一个的所述优先级分数,并且所述优先标准包括所述在线实体的账户的状态、所述在线实体使用所述计算资源或其他共享计算资源的历史频率、所述在线实体使用所述计算资源或其他共享计算资源的预测频率、所述在线实体使用所述计算资源或其他共享计算资源的历史水平、所述在线实体使用所述计算资源或其他共享计算资源的预测水平,或所述在线实体在所述计算资源或其他共享计算资源上发起的活动的类型中的至少一个。
优化引擎还被配置为基于(i)所述多个在线实体中的在线实体使用上述计算资源的预测水平、以及(ii)所述在线实体的所述相对优先级,来确定区域限制,所述区域限制定义了在所述一组预留区域中的预留区域之间的边界。
资源管理器可以配置为,响应于确定所请求的容量小于由所述对应预留区域为所述在线实体指定的所述计算资源的所述未使用容量的一部分,分配所述计算资源的容量供所述在线实体使用,而不会有意地延迟,或者预先预留要在将来分配给所述在线实体使用的所述计算资源的容量。
本文描述的主题的一些实现包括第一计算机实现的方法。该方法可以包括:由管理多个在线实体共享的计算资源的计算系统,从所述多个在线实体中的第一在线实体,接收预留所述计算资源的容量的请求;确定所述第一在线实体相对于所述多个在线实体中的其他在线实体的相对优先级。可以识别与第一在线实体的所述相对优先级相对应的预留区域,所述预留区域指定所述计算资源的未使用容量的一部分,允许具有相对优先级等于或低于所述第一在线实体的所述相对优先级的在线实体预留所述未使用容量的一部分。基于比较(i)所述计算资源的请求容量以及(ii)允许具有相对优先级等于或低于所述第一在线实体的所述相对优先级的在线实体预留的、由所述预留区域指定的所述计算资源的所述未使用容量的一部分,来确定是否满足所述请求。响应于确定所述计算资源的所述请求容量小于允许具有相对优先级等于或低于所述第一在线实体的所述相对优先级的在线实体预留的、由所述预留区域指定的所述计算资源的所述未使用容量的一部分,满足所述请求,系统为所述第一在线实体预留所述计算资源的容量。
这些和其他实施方式可以可选地包括以下特征中的一个或多个。
在所述多个在线实体之中共享的所述计算资源包括在基于云的平台中的共享网络资源、共享服务器资源、共享存储资源、共享应用资源、或共享服务资源中的至少一个。
该系统可以进一步执行为所述多个在线实体中的每一个分配优先级分数,所述优先级分数表示所述在线实体的重要性的度量;和基于所述优先级分数,将所述多个在线实体分类为多个在线实体组,其中,每个在线实体组被赋予代表所述在线实体组的重要性的度量的相对优先级。确定所述第一在线实体相对于所述多个在线实体中的其他在线实体的所述相对优先级可以包括,识别所述第一在线实体所属的所述在线实体组的相对优先级。
基于所述在线实体的账户的状态、所述在线实体使用所述计算资源或其他共享计算资源的历史频率、所述在线实体使用所述计算资源或其他共享计算资源的预测频率、所述在线实体使用所述计算资源或其他共享计算资源的历史水平、所述在线实体使用所述计算资源或其他共享计算资源的预测水平,或所述在线实体在所述计算资源或其他共享计算资源上发起的活动的类型中的至少一个,确定一组在线实体中的每个在线实体的优先级分数。
所述预留区域指定为允许具有相对优先级等于或低于所述第一在线实体的所述相对优先级的在线实体预留的所述计算资源的所述未使用容量的一部分包括(i)允许具有相对优先级低于所述第一在线实体的所述相对优先级的在线实体预留的所述计算资源的所有未使用容量、以及(ii)所述计算资源的所述未使用容量的其他部分。
系统还包括基于(i)所述多个在线实体中的在线实体对所述计算资源的使用的预测水平以及(ii)所述在线实体的所述相对优先级,来确定所述预留区域的限制。
为所述第一在线实体预留所述计算资源的容量包括对将在将来分配给所述第一在线实体使用的所述计算资源的容量进行预先预留。
本文所述主题的一些实施方式包括第二计算机实现的方法。该方法可以包括:由管理多个实体共享的计算资源的计算系统,接收多个实体中的第一实体需要访问计算资源的第一部分以供第一实体使用的指示。多个实体中的每个实体相对于其他实体可以具有相对优先级。该方法可以进一步包括确定计算资源的可用容量;以及确定分配给优先级高于第一实体的实体或由其使用的计算资源的第二部分;并且如果第一部分小于或等于计算资源的可用容量减去确定的计算资源的第二部分,则将计算资源的第一部分分配给第一实体。
这些和其他实施方式可以可选地包括以下特征中的一个或多个。
分配计算资源可以将计算资源的独占使用提供给第一实体。
如果第一部分大于可用容量减去所确定的计算资源的第二部分,则可以不将计算资源的第一部分分配给第一实体。
如果确定第一部分大于可用容量减去确定的资源的第二部分,则系统可以将计算资源的第三部分分配给第一实体而不是第一部分。第三部分可以小于第一部分,并且第三部分可以等于或小于可用容量减去所确定的第二部分。
确定计算资源的第二部分可以包括预测优先级高于第一实体的实体对计算资源的未来使用量。
可以对于需要访问计算资源的第二部分的第二实体重复该方法的步骤。
该指示可以是来自第一实体的使用量或被分配计算资源的第一部分的请求。
作为前述技术的示例,如果价值X1的客户或实体请求使用资源Z的Y1单位(unit)进行操作,则如果资源Z的当前可用容量超过价值>X1的客户的高置信度预测使用量(或使用中的容量)至少Y1,则系统可以批准该请求。可以对所有客户重复此过程,最好从更高优先级的客户开始,直到分配了所有容量为止。每当实体请求额外的计算资源时,也可以重复该过程。
租户或其他实体的优先级水平可以是动态的并且基于相对规模(例如,高优先级的租户可以比具有离散或滑动规模优先级的低优先级租户具有更高的优先级)。优先级的水平可以基于一组标准或加权标准。例如,这样的标准可以包括:实体成为租户的时间;一段时期内消耗的资源量;一段时间内使用的资源量的一致性或变化;租户消耗资源的行为(例如,他们多久请求额外的资源或违反或请求更改限制或资源分配);和/或使用资源的组织类型(例如政府,零售商,私人,制造商,服务提供商,高价值客户等)。
系统提供的资源可以是任何计算资源,例如,包括存储器,处理能力,处理线程,CPU周期,CPU内核,存储和通信带宽中的任何一个或多个,或这些的组合。
本文描述的方法可以被实现为包括程序指令的计算机程序,以操作包括一个或多个处理器的计算机。该计算机程序可以存储在一个或多个计算机可读介质上。
在某些情况下,本文描述的主题的一些实施方式可以实现以下优点中的一个或多个。首先,通过基于使用量预测和租户优先级来动态调整预留区域的限制,系统可以提高自然界中有限的共享计算资源的利用率。例如,与其他容量分配方法相比,可以消除或减少缺货的风险。因为资源的全部容量已被消耗,所以当没有共享资源的附加容量可以分配给租户时,出现缺货。由于超额预订(例如,分配给所有租户的总容量超过资源的物理容量)时,所以可能会发生缺货。云平台提供商有时会基于并非所有租户都将同时使用其全部容量配额的假设来超额预定容量,但是在高峰时段,这种假设可能无法成立,并且可能导致缺货。然而,在与本文描述的技术一致的实施方式中,可以通过动态调整租户组的计算资源的可预留容量来减少或消除缺货的风险。例如,如果当前或预测的使用量很高,则系统可能会减少提供给租户组的可预留容量。可替代地,如果共享资源的当前或预测的使用量相对较低,则系统可以动态地增加可供租户组使用的可预留容量。在这些情况下(当全局使用量相对较低时,增加可预留容量),共享资源的利用率可能会提高,因为租户能够预留和消耗比静态使用量配额所允许的容量更多的容量(例如,尽管当前资源可能未得到充分利用并且当前可能存在未使用的容量,但配额是限制性的)。因此,由于在有足够的可用容量时不会阻止租户预留容量,因此可以提高容量利用率。另外,在一些实施方式中,由于系统扩展了针对较高优先级租户的预留区域以包括不可用于较低优先级租户的容量,因此可以降低较高优先级租户不可用的容量的风险。
在一些实施方式中,由于可以更有效地向租户提供(或分配)资源,并且可以向租户提供改进的预测或资源可用性,租户可以更有效管理他们的要求,因此本文所述的技术可以减少云平台中的低效率。
具体实施方式的细节在以下附图和详细描述中阐明。对于本主题所属领域的普通技术人员而言,其他特征和优点将是显而易见的。
附图说明
图1描绘了用于管理共享计算资源的容量的环境的概念图。
图2描绘了示例系统的框图,该示例系统用于优化预留区域限制并为在线实体的优先层实施限制。
图3描绘了用于基于活动请求来预留或拒绝共享计算资源的容量的示例处理的流程图。
图4描绘了一组预留区域的概念图,每个预留区域均具有超出预留区域限制的相关平台施加的容量限制和可选的平台施加的限制。
图5描绘了用于为一组预留区域生成优化限制的示例处理的流程图。
图6描绘了可用于实现本文描述的特定技术的计算设备和移动计算设备的示例。
具体实施方式
本说明书描述了用于管理共享计算资源(例如提供给云计算平台的租户的资源)的容量分配的系统,方法,设备和其他技术。相对于以下附图描述了该技术的示例实施方式的细节。
参照图1,示出了用于管理共享计算资源106的容量的环境100的概念图。环境100包括容量管理系统102,共享资源106和可以访问共享资源106的在线实体104的集合。通常,容量管理系统102被配置为确定并强制执行用于共享资源106的一组预留区域,该一组预留区域具有向各种不同实体提供计算服务的有限能力。预留区域定义了共享资源106的未使用容量的段,允许不同组的实体104预留以用于立即使用或将来使用。通过监视共享资源106的当前和预测的容量使用量,容量管理系统102可以优化预留区域以有效地利用资源的未使用容量,同时考虑实体104可能尝试预留资源106的已使用容量的任何部分的相对优先级的差异。如贯穿本文使用的,术语“最佳”,“优化”及其变体是指通过使用此处讨论的技术来提高系统的性能,并不意味着获得的性能必须可达到的最佳性能。
容量管理系统102可以包括在一个或多个位置的一个或多个计算机。在一些实施方式中,系统102是云平台的一部分,该云平台为多个租户(例如,在线实体104)提供计算资源池,并允许租户通过互联网或其他网络从一个或多个位置访问资源。例如,云平台可以实施允许租户将文件存储在由云平台的运营商拥有和/或维护的物理驱动器上的远程存储服务。在该示例中,共享资源106可以是具有大的但最终有限的存储容量的存储资源。作为另一个示例,云平台可以实施虚拟化服务,该虚拟化服务允许租户在由云平台的运营商拥有和/或维护的服务器上执行虚拟机。在该示例中,共享资源106可以表示具有足够的计算能力以彼此并行地执行多个虚拟机,但是最终具有有限的计算能力的服务器。在一些实施方式中,系统102在组织的私有现场服务器中提供,该组织为组织成员提供共享资源的可用容量。
容量管理系统102管理对共享资源106的访问。希望利用共享资源106的在线实体(例如,租户)可以向容量管理系统102发出请求,并且系统102基于请求的参数和由请求资源106的一组预留区域定义的规则,来决定是否批准或拒绝该请求。
在图1中示出了系统102使用针对请求资源106的预留区域来执行请求的示例。具体而言,系统102从在线实体104之一接收活动请求108。活动请求108向容量管理系统102指示请求实体要预留共享资源106的容量。请求108可以指示当前对容量的需求,以便如果得到批准,则立即将容量分配给请求实体,或者请求108可以指示将来的容量需求,以便如果请求得到批准,则可以在将来的指定时间提出对容量的预先预留。
对容量的请求可以涉及被请求至少部分地使用共享计算资源106来执行的一个或多个活动。活动通常是指由在线实体104(例如,与云平台的运营商分开的云租户)发起的任何计算处理,以及哪个处理完全或部分依赖共享计算资源来执行该活动。作为示例,请求实体可以请求在云平台运营商的物理机上执行专有应用。实体可以请求在云平台运营商的物理机上运行应用的能力。如果请求被批准,则云平台可以在物理机上实例化虚拟机,并以访客身份运行请求实体的应用。诸如活动请求108之类的请求可以或可以不明确指示要以请求的容量执行的类型或特定活动。例如,活动请求108可以指示在特定时间段内请求了指定量的容量,而没有识别针对其请求容量的一个或多个活动。备选地,活动请求108可以具体地识别为其请求能力的一个或多个活动。在这些情况下,请求108指定所请求的一个或多个活动,并且容量管理系统102可以推断执行所请求的活动所需的容量,或者系统102可以从请求108本身中识别所请求的容量。在图1的示例中,活动请求108明确识别该请求针对共享资源106的23个容量单位。
容量管理系统102在接收到请求108后,确定是否批准所请求的容量。可以基于所请求容量的量和请求实体的相对优先级两者来确定是否批准活动请求108。如图1的表中所示,容量管理系统102可以维护指示一组在线实体104的相应优先级的数据。在线实体104的优先级代表实体104相对于彼此的相对重要性。因为共享资源106的容量是有限的,所以不能将无限容量批准给所有实体104,并且为实体分配优先级提供了一种以改善资源106利用率的方式在实体之间分配容量的基础。
分配给在线实体104的优先级分数可以基于一个或多个优先级标准。在一些实施方式中,优先级标准被构造为促进在共享资源106上执行活动的实体,该实体补充由其他实体104执行的活动,从而提高共享资源106的全局性能。例如,可以为在共享资源106上执行不与来自其他实体104的活动竞争资源106的子资源(例如,外围设备,处理核心等)的活动的第一实体分配比第二实体更高的优先级分数,第二实体在共享资源106上执行竞争同时在资源106上执行的其他实体104的活动相同的子资源的活动。因此,以这种方式对实体进行优先级排序可以带来更好的共享资源106的技术利用。
在一些实施方式中,实体104的优先级分数可以基于其他或附加因素,例如,实体104在过去的一段时间内使用资源106和/或其他共享资源的频率,预测实体104在将来的一段时间内将使用资源106和/或其他共享资源的频率,在过去的一段时间内实体104对资源106和/或其他共享资源的历史使用量水平(例如,消耗的容量),实体104在未来一段时间内对资源106和/或其他共享资源的预测使用量水平,在线实体104在资源和/或其他共享计算资源上发起的活动类型,在线实体104的帐户状态(例如,代表实体104与共享资源106的运营商之间的合同义务),实体104与共享资源106的运营商(例如,云平台运营商)之间的账户规模,实体104的风险评估,实体104对共享资源106的运营商的估计值,或者这些的组合。
在一些实施方式中,容量管理系统102基于优先级分数将在线实体104的集合分类为实体的层或其他组。然后,系统102可以将实体104的层或组用作实体104的相对优先级,以便确定是否批准或拒绝活动请求108。或者,除了实体104的层或组之外系统102还可以使用优先级分数本身作为实体104的相对优先级,或者系统102可以使用优先级分数本身,而不是实体104的层或组,作为实体104的相对优先级,以便确定是批准还是拒绝活动请求108。可以通过基于优先级分数对实体104进行排名,确定每个层的阈值分数,并基于其分数将每个实体104分配给适当的层,来生成在线实体104的层。例如,可以将优先级分数为7的实体104分配给具有包含优先级分数为7的阈值的相应层。在其他实施方式中,可以为每个层规定实体的总数,并为这些层相应地分配实体104。例如,如图1所示,层1-5中的每个层被分配了三个实体104。此外,这些层表示在线实体104的相对优先级,因为一些层与比其他层相比具有带有更好优先级分数的实体。例如,层1可能由最高优先级的实体组成,而层5可能由最低优先级的实体组成(在五层的集合中)。层的总数可以被调整或设置为任何数目,但是通常对应于可用于共享资源106的预留区域的数量。例如,系统102可以将实体分类为五个可用预留区域的五个层,但是如果确定了更多的粒度预留区域,则可能会增加层数,或者如果确定了更少且更宽的预留区域,则可能会减少层数。
图1右侧的竖线被分段以代表共享资源106的容量的不同部分。如图所示,资源106的总容量由C表示。总容量C可以是资源106的真实容量限制,例如,它完全或主要受到实施共享资源102的系统的物理大小的限制(例如,物理存储限制,最大处理速度,服务器或处理核的数量)。然而,在其他实施方式中,总容量C可能由于资源106的物理限制而被人为地降低。例如,共享资源106的管理员可以将底层系统容量的一部分专用于维护例程或私人活动,而容量的剩余部分专用于与在线实体104共享的目的。这里,C可以表示专用于与在线实体104共享的公共用途的一部分物理容量的虚拟容量。在其他实施方式中,总容量C可以表示可预留容量,该可预留容量实际上切除了提供共享资源106的系统的真实/物理容量。假设很少有预留或分配了容量的所有实体实际上都会使用其全部配给的情况,系统可以例如增加C以超过真实/物理容量,以允许“超额预订”。
除了代表资源106的总容量C,图1还示出了资源106的已使用容量和和未使用容量的边界,以及资源106的未使用容量内的相应预留去的极限。从条形底部到极限U表示的资源106容量的阴影部分表示资源106的当前使用量。在某些实施方式中,当前使用的容量部分不能被来自任何实体104的其他活动消耗,直到当前消耗此能力的活动已完成或停止,然后释放了该容量。
在容量的未使用部分(从下限U延伸到上限C)内,定义了一系列预留区域。例如,图1中显示了五个预留区域。预留区域定义了资源106的未使用容量的一部分,允许特定类别的在线实体104进行预留。根据图1中表示的方案,五个预留区域中的每一个对应于在线实体104的五层中的不同层。与较低优先级层中的实体104相比,较高优先级层中的实体104被提供更多的可预留容量。具体地,用于给定层的预留区域包括紧接在前的预留区域的所有可预留容量,以及对应于紧接在前的预留区域的在线实体104的层不可用的可预留容量的附加部分。例如,容量管理系统102允许最低优先级实体(层5)预留从U到L4的共享资源106的容量范围(预留区域5)。次高优先级实体(层4)被允许预留从U到L3的容量范围(预留区域4)。次高优先级实体(层3)被允许预留从U到L2的容量范围(预留区域3)。次高优先级实体(层2)被允许预留从U到L1的容量范围(预留区域2)。最后,允许最高优先级实体(层1)预留从U到C的资源106的所有未使用容量范围(预留区域1)。
在一些实施方式中,在线实体104可以预留共享资源106的容量以执行一个或多个活动,直到由与该实体的相对优先级相对应的预留区域所指定的资源106的未使用容量的全部部分为止。例如,将允许单个层1实体预留由预留区域1指定的资源106的全部未使用容量(从U扩展到C)。同样,将允许单个层2实体预留由预留区域2指定的资源106的全部未使用容量(从U扩展到L1)。当然,所请求的容量的总和可能超过资源106的未使用容量的总量,在这种情况下,系统102可能会采取补救措施,例如拒绝将导致预留量超过资源106的总容量的请求,推迟分配请求的容量,或限制现有预留量以为请求的容量腾出空间。但是,预留区域被布置为使得确保较高优先级实体104不会被较低优先级实体完全阻止。系统102通过针对实体的层(例如,而不是针对各个实体)实施使用量配额,来确保较低优先级的实体不会阻止较高优先级的实体104在共享资源106上执行活动。例如,层2-5中所有实体的预留容量的总和不能超过L1(因此,容量C–L1的部分专门用于层1实体),层3-5中所有实体的预留容量之和不能超过L2(因此,将容量C–L2的一部分留给层1和层2实体),依此类推。如将关于图4进一步讨论的,在一些实施方式中,可以规定和执行附加的使用约束,其限制了允许(或启用)层中的单个实体104预留多少容量(例如,为同一层中的其他实体留一些容量),另外,附加的各个实体104可以规定其自己的使用约束(例如,防止实体的任何一项活动消耗该实体容量的全部配给)。
考虑到活动请求108的参数,在线实体104的优先级以及资源106的未使用容量的预留区域限制,容量管理系统102可以确定是否批准或拒绝请求106。系统102将请求预留的容量(请求是预留将要立即分配或预留给将来时间的容量)与由对应于请求实体的相对优先级(例如,请求实体的优先级层)的预留区域定义的资源106的可预留容量进行比较。如果请求的容量在对应的预留区域定义的资源106的可预留容量之内(例如,小于,或小于等于),系统102可以相应地批准该请求并预留容量。但是,如果所请求的容量超出(例如,大于,或大于等于)由对应的预留区域所定义的资源106的可预留容量,则系统102拒绝该请求并采取措施,例如拒绝预留请求的容量,提示请求实体的代理是否预留少于请求的容量以符合预留区域限制,或者提示请求实体增加会提高请求实体的相对优先级,并允许批准该请求。
图2是示例系统200的框图,该示例系统200用于定义预留区域限制并为在线实体的优先层实施限制。系统200可以在一个或多个位置包括一个或多个计算机。在一些实施方式中,系统200是容量管理系统,例如容量管理系统102(在图1中示出)。特别地,系统200可以动态地调整预留区域限制,以优化共享计算资源202的利用率,最大化对资源202的运营商(例如,云平台运营商)的利用率的值,向在线实体的层提供可预留容量的适当分配,或这些的组合。在一些实施方式中,这些技术可以通过减少缺货的风险来提高共享计算资源202的性能,并允许任何在线实体更多地利用资源202,只要其他实体的预测使用量相对较小即可。
系统200包括各种组件,包括共享计算资源202,共享资源使用量预测引擎204,区域限制优化引擎206,共享资源管理器208,在线实体数据库210,预留数据库212,和容量政策数据库214。系统200的这些各种组件202-214可以在单个计算机上或在多个计算机上,诸如在一个或多个位置中的数据中心或计算机来实施。尽管在本文的示例实施方式中描述了每个组件的功能,但是系统200的组件之中的功能的其他划分也可能是合适的。本主题的一些实施方式可以包括少于系统200中所示的所有组件,或者可以包括图2中未显示的其他组件。如本文所使用的,“数据库”通常是指适于存储和使本文描述的数据可访问的数据的任何结构化表示,例如但不限于关系数据库,非关系数据库,键值数据库,集中式数据库,分布式数据库或其他。术语“引擎”和“管理器”是指可以基于单独的硬件或硬件和软件(例如,执行启用本文所述功能的指令的一个或多个计算机处理器)的组合来实现的计算系统的组件。
共享资源使用预测引擎204被配置为预测各个计算实体或实体组将在指定的未来时间段内使用的共享计算资源202的容量水平。在一些实施方式中,预测引擎204预测被注册为预留共享计算资源202的容量的每个在线实体104的相应使用量,或者预测引擎204可以直接预测仅注册实体的子集的相应使用量,并推断对于未直接确定使用量预测的位置相似的实体的预测。在一些实施方式中,预测引擎204预测一组实体(例如,一组优先实体的每一层)将使用的容量的总量。预测引擎204可以包括基于过去的使用量(由使用量历史数据216指示),现有的预留(由现有的预留数据218指示)或两者来预测未来的使用量的模型。例如,对于给定的在线实体,预测引擎204可以访问来自在线实体数据库210的使用量历史数据216,该数据库210存储关于各个实体的信息。使用量历史数据216可以指示诸如在线实体在过去的各个时间使用了资源202的多少容量,在线实体在过去的各个时间已请求了多少容量,在过去已批准或拒绝了多少该实体请求的容量,过去在执行该实体的活动期间实际已经使用了多少该实体的已批准/预留的容量,或者是这些的组合。另外,预测引擎212可以在预留数据库212中查找在线实体的任何现有预留。基于现有的预留数据218和在线实体的使用量历史数据216,预测引擎生成使用量预测数据220。可以使用回归模型,机器学习模型(例如,人工神经网络)或其他合适的技术来生成预测。在一些实施方式中,使用量预测数据220提供概率密度函数,该概率密度函数指示使用量或请求使用共享计算资源202的容量的不同水平范围的在线实体的可能性(例如,概率)。
区域限制优化引擎206被配置为针对在线实体的不同组或层来定义预留区域的限制。例如,优化引擎206可以为图1所示的预留区域设置L1到L4的值。在一些实施方式中,在来自共享资源202的较高层中的实体使用量的概率期望值等于将从共享资源202的紧接在较高层之下的层中的实体使用量得出的实际值的点处,优化引擎206设置预留区域之间的边界(即,预留区域的界限)。例如,优化引擎206可以在来自共享资源的层1实体的使用量的期望值等于来自共享资源202的层2实体的使用量的值的点处,设置预留区域1和2之间的边界L1。同样地,优化引擎206可以在来自共享资源的层2实体使用量的预期值等于来自共享资源202的层3实体的使用量的值的点处,设置预留区域2和3之间的边界L2。共享资源202的实体使用量的期望值可以是实体优先级和实体将实际使用量或请求使用共享资源202的给定容量水平的概率的函数(例如,它们可能彼此成比例)。可以从指示实体的相对优先级(例如,优先级层或优先级分数)的使用量预测数据220和实体数据224中得出实体使用量的期望值。因此,通常,当存在低价值机会时(例如,来自较低层实体),系统可以将该机会的值与未来出现的潜在较高价值机会的概率期望值进行比较。如果低价值机会达到或超过将来可能出现的潜在高价值机会的概率期望值,则可以批准该机会。
另外,优化引擎206解决共享资源的总容量,如资源容量数据222所示。资源202的总容量可以是资源的真实容量,其受资源202的物理约束限制,或者例如由于出于私有、不可共享的目的(例如,维护和诊断例程)而预留了系统的一些容量,因此资源202的总容量可能小于或等于真实容量。可以在容量策略数据库214中指定资源202是否已使全部真实容量可用,或者可以指定较小的量。在确定预留区域的边界中,优化引擎206使用共享资源202的总容量作为容量的上限。
在一些实施方式中,优化引擎206被配置为相对于在线实体的组来确定预留区域限制。例如,引擎206可以平均给定层中的所有实体的使用量预测220以生成平均使用量预测,并且可以平均给定层中的所有实体的优先级分数以生成该层的平均优先级分数。然后引擎206可以评估容量水平,在该容量水平处,来自较高层的实体组的使用量的期望值等于来自下一个较低层的实体组的使用量的期望值,并且可以将该点指定为这些层的对应预留区域之间的边界。优化引擎206可以生成预留区域限制数据226,其指示对于每个预留区域,除了所有较低水平区域的可预留容量之外的该区域的可预留容量的总量或可预留容量的边缘量。
在一些实施方式中,预留区域的限制是动态的。当使用量预测发生变化,进行新的预留或取消预留,在线实体的优先级或组成发生变化,可用容量发生变化,或这些因素和其他因素的组合时,预留区域的边界可能会更新以反映最新情况。以此方式,系统200可以响应于变化的条件并且可以更新预留区域限制以解决变化的条件,而不是评估针对个体实体或实体组的固定使用量配额。例如,预测引擎204可能已初步预测了层1实体在未来一段时间内将需要使用大量容量。但是,随着时间的流逝和层1实体的预留容量不如最初预测的那么大,可能会更新区域限制,以为较低层的实体分配更多的可预留容量。这样,其他实体可能有机会预留容量,从而增加了共享资源202的充分利用的可能性。可以基于任何合适的触发事件来更新预留区域限制226。在一些实施方式中,可以响应于来自实体的对容量的每个请求(例如,活动请求)来更新限制226。在一些实施方式中,在预定的定期基础上(例如,每分钟,每小时,每天或每周一次)更新限制。在一些实施方式中,在检测到某些条件(例如,活动请求或请求的容量中的阈值超出或活动请求或请求的容量中的阈值不足)时更新限制。
共享资源管理器208被配置为处理来自在线实体的活动请求228,并且对请求228做出决定230以批准或拒绝共享计算资源202的容量。在一些实施方式中,共享资源管理器308基于所请求的容量的量是否在共享计算资源202的未使用容量的量之内,来确定是否为活动请求228批准容量,共享计算资源202的未使用容量的量是为与请求实体的相对优先级相对应的预留区域指定的。例如,关于图3描述了由共享资源管理器208进行的操作的附加细节。
图3是用于响应于来自在线实体的容量请求来预留或拒绝共享计算资源的容量的示例处理300的流程图。在一些实施方式中,处理300由容量管理计算系统的共享资源管理器(诸如图2中描绘的共享资源管理器208)进行。
在阶段302,共享资源管理器从在线实体接收活动请求。活动请求可以由在线实体发出,以为一个或多个活动预留共享计算资源的容量。活动可以是全部或部分依赖共享计算资源来执行活动的任何计算处理。例如,在线实体可以请求在云平台的物理机上执行专有应用。实体可以根据应用在平台上运行所需的活动来请求容量。如果请求被批准,则可以在云平台运营商的物理机上实例化虚拟机,该物理机将请求实体的应用作为访客在虚拟机上运行。即使活动请求通常与请求执行的一个或多个活动相关联,该请求本身也可能会或可能不会明确标识该活动。例如,活动请求可以请求在特定时间预留特定量的容量,而无需实际命名要为其请求容量的一个或多个活动。备选地,活动请求可以明确地标识请求其容量的一个或多个活动。在这些情况下,该请求标识一个或所多个请求的活动,并且共享资源管理器可以推断执行请求的活动所需的容量,或者系统可以从请求本身识别请求的容量。
在阶段304,共享资源管理器确定将满足活动请求的请求容量。在一些实施方式中,活动请求指定请求容量,在这种情况下,共享资源管理器解析该请求,并从请求本身中识别该请求容量。在一些实施方式中,该请求标识一个或多个活动,但是没有明确指示执行该请求将需要多少共享计算资源的容量。在这种情况下,共享资源管理器可以间接确定执行请求的活动所需的容量。例如,共享资源管理器可以访问将在线实体的活动与活动所需的预期容量相关联的数据,并且可以使用该值或从该预期量中得出的值作为该请求的请求容量。可以基于执行活动的在线实体的过去实例以及在这些实例中使用了多少容量,来确定将活动与活动所需的预期容量相关联的数据。
在阶段306,共享资源管理器识别请求实体的相对优先级。在一些实施方式中,相对优先级由实体的优先级分数指示。在其他实施方式中,相对优先级由实体已被分配给的实体的特定层或实体组指示。请求实体的优先级可以指示该实体相对于其他在线实体的相对重要性,该其他在线实体注册为使用共享计算资源执行活动。在一些实施方式中,向实体分配优先级提供了用于在可以使用资源的一组实体之间分配共享计算资源的有限容量的基础。
在阶段308,共享资源管理器确定与在线实体的相对优先级相对应的预留区域的容量限制。对应预留区域的限制可以指示共享计算资源的最大可预留容量可用于发出活动请求的在线实体。预留区域的大小可以与请求实体的相对优先级成比例。例如,可以允许较高层的实体预留比较低层的实体更多的容量。在一些实施方式中,共享资源管理器从优化引擎确定对应预留区域的限制,该优化引擎在特定时间动态更新预留区域的限制,以便促进跨多个优先级层的实体对共享资源的充分和有效利用。
在阶段310,共享资源管理器将请求容量与请求实体的对应预留区域的限制进行比较。特别地,共享资源管理器确定所请求的容量是否在对应的预留区域内,以使得所请求的容量小于或在某些实施方式中等于由预留区域指定的共享资源的未使用容量。共享资源管理器还可以可选地将请求的容量与一个或多个其他可以容量限制进行比较,例如由请求实体自行施加的限制,该限制可能小于对应预留区域的限制。
如果请求的容量在请求实体的对应预留区域的限制之内,则共享资源管理器可以批准该请求(阶段312)。如果实体立即请求了容量,则资源管理器可以继续分配容量而没有故意的延迟,并且共享资源执行所请求的活动(阶段318)。如果活动请求是在将来的时间对容量进行预先预留,则资源管理器可以计划在将来的时间分配所请求的容量(阶段316)。到该时间时,资源管理器分配请求的容量,并且共享资源执行请求的活动。但是,如果请求的容量超出了请求实体的对应预留区域的限制,则共享资源管理器可以拒绝该请求,并阻止为请求的活动分配容量(阶段314)。
图4是一组预留区域402-410的概念性描述,每个预留区域具有相关的平台施加的容量限制,以及可选地,在平台施加的限制内的其他容量限制。如关于图1-3所描述的,容量管理系统可以定义预留区域并且动态地调整其限制,以优化共享计算资源的利用率。在一些实施方式中,系统允许给定优先级层内的实体预留容量,该容量多达可分配给该实体所属的整个层的全部可预留容量。例如,在图1所示的示例中,层1实体可以为某个活动预留容量,该活动将消耗资源的全部的未使用容量,但是这样的请求可能没有可用容量供其他实体将来的请求使用,而第一实体的活动正在进行中。此外,请求的执行可能会超出实体为共享资源上的活动预算的容量。因此,在一些实施方式中,共享资源的管理员(例如,云平台运营商),在线实体本身或两者都可以施加额外的限制,其防止过度使用资源的容量,即使在资源预留区域的限制内将另外允许这种使用。因此,在图4中表示的每个预留区域402-410下方是针对每个区域的对应层中的实体的自我施加的容量限制和平台施加的容量限制(例如,配额)。
共享资源管理器可以在确定是批准还是拒绝活动请求之前检查所有可用的限制。例如,实体可以自我施加活动专用的容量限制和总容量限制,该限制限定了该实体在一段时间内在所有活动中可能消耗的容量。共享资源管理器可以验证请求的容量是否在所有可用的限制之内,所有可用的限制包括单个活动特定的限制,自我施加的总容量限制以及请求实体的对应优先级的预留区域的限制。仅当请求满足所有可用的限制时,共享资源管理器才会为请求批准容量。在一些实施方式中,共享资源的管理员还可以施加其他限制,例如限定单个实体可以预留或可以为单个活动预留的预留区域中的容量的共享。例如,平台可以限定任何实体使用该实体在对应预留区域中超过90%的容量。也可以根据需要分配大于或小于90%的量。
图5是用于为一组预留区域生成优化限制的示例处理500的流程图。处理500可以由容量管理系统(例如分别如图1和2的系统100或200)进行。
在阶段502,系统识别触发事件以更新一组预留区域的限制。在一些实施方式中,触发事件是计时器的到期,该计时器被设置为使系统定期更新预留区域的限制。在一些实施方式中,触发事件基于检测到与接收到的活动请求有关的预定义事件以及共享计算资源的实际使用量。例如,如果在一段时间内接收到的请求容量的差异超出或比该时间段的预测容量小阈值量时,系统可以调整预留区域的限制,以解决预期条件和实际条件的差异。在一些实施方式中,可以响应于每个接收到的活动请求来生成新的限制。
在阶段504,系统确定资源使用量预测。在一些实施方式中,该阶段由共享资源使用量预测引擎(例如,预测引擎204)执行。预测引擎分析对共享资源和使用量历史数据的现有预留,以预测一组实体中的每个实体、或一组组中的每组实体有可能在未来一段时间内使用和/或请求资源的多少容量。在一些实施方式中,预测引擎确定每个实体或实体组的概率密度函数,其指示该实体或实体组将在概率密度函数覆盖的容量范围内使用或请求各种容量级别的相对可能性。
在阶段508,系统识别适用的容量计划。容量计划指示指定为可供在线实体使用的共享资源的总容量。
在阶段510,系统生成用于预留区域的预留区域限制。在一些实施方式中,该阶段由区域限制优化引擎(例如,优化引擎206)执行。优化引擎分析来自预测引擎的使用率预测,所识别的容量计划以及指示向系统注册的在线实体的相对优先级的数据,以确定预留区域限制,估计该预留区域限制以优化共享资源的利用率。然后可以将区域限制提供给共享资源管理器,例如,共享资源管理器208,其执行区域限制,并对活动请求进行操作,以确定是否应将容量分配给发出请求的实体。
在一些实施方式中,本文描述的技术可以被扩展以允许在线实体(例如,云平台的租户)预留共享资源的额外容量,而不是由其对应预留区域的限制所允许。如果实体的活动请求另外由于超过预留区域限制而被拒绝,则可以通过支付动态确定的补充费使该实体获得批准请求的机会,该补充费将使其资源使用的值提高并超过阈值(例如,以有效地将实体“提升”到更高优先级层)。类似地,该系统可以实施容量拍卖,其中实体将与活动请求一起提交投标。然后,将系统配置为基于对实体优先级和出价的总体评估来批准或拒绝请求。
在一些实施方式中,如果系统检测到对资源的需求正在增长,则可以将容量管理系统配置为订购共享资源的附加容量。例如,如果共享资源的预测使用量在一段时间内始终超过资源的总可用容量,则系统可能会自动使其他容量联机,下订单订购其他容量,和/或警告管理员:系统将受益于其他容量。
图6示出了可用于实现本文描述的技术的计算设备600和移动计算设备的示例。计算设备600旨在代表各种形式的数字计算机,例如膝上型计算机,台式计算机,工作站,个人数字助理,服务器,刀片服务器,大型机和其他适当的计算机。移动计算设备旨在代表各种形式的移动设备,例如个人数字助理,蜂窝电话,智能电话和其他类似的计算设备。此处所示的组件,它们的连接和关系以及它们的功能仅是示例性的,并不意味着限制本文中描述和/或要求保护的发明的实现。
计算设备600包括处理器602,存储器604,存储设备606,连接到存储器604和多个高速扩展端口610的高速接口608,以及连接到低速扩展端口614和存储设备606的低速接口612。处理器602,存储器604,存储设备606,高速接口608,高速扩展端口610和低速接口612各自使用各种总线互连,并且可以安装在通用主板上或其他适当方式安装。处理器602可以处理在计算设备600内执行的指令,包括存储在存储器604或存储设备606上的指令,以在外部输入/输出设备上显示GUI的图形信息,诸如耦合到高速接口608的显示器616。在其他实施方式中,可以适当地使用多个处理器和/或多个总线,以及多个存储器和存储器类型。而且,可以连接多个计算设备,每个设备提供部分必要的操作(例如,作为服务器库,一组刀片服务器或多处理器系统)。
存储器604存储计算设备600内的信息。在一些实施方式中,存储器604是一个或多个易失性存储单元。在一些实施方式中,存储器604是一个或多个非易失性存储单元。存储器604也可以是另一种形式的计算机可读介质,例如磁盘或光盘。
存储设备606能够为计算设备600提供大容量存储。在一些实施方式中,存储设备606可以是或包含计算机可读介质,诸如软盘设备,硬盘设备,光盘设备,磁带设备,闪存或其他类似的固态存储设备或设备阵列,包括存储区域网络或其他配置中的设备。该计算机程序产品还可以包含在被执行时进行一种或多种方法的指令,例如上述方法。计算机程序产品还可以有形地体现在计算机或机器可读介质中,例如存储器604,存储设备606或处理器602上的存储器。
高速接口608管理计算设备600的带宽密集型操作,而低速接口612管理较低带宽密集型操作。这种功能分配仅是示例性的。在一些实施方式中,高速接口608(例如,通过图形处理器或加速器)耦合到存储器604,显示器616,并且耦合到可以接受各种扩展卡(未示出)的高速扩展端口610。在实施方式中,低速接口612耦合到存储设备606和低速扩展端口614。可以包括各种通信端口(例如,USB,蓝牙,以太网,无线以太网)的低速扩展端口614可以例如通过网络适配器被耦合到一个或多个输入/输出设备,例如键盘,指向设备,扫描仪,或诸如交换机或路由器的联网设备。
如图所示,可以以多种不同的形式来实现计算设备600。例如,它可以被实现为标准服务器620,或者被实现为一组这样的服务器多次。另外,它可以在诸如膝上型计算机622之类的个人计算机中实现。它也可以作为机架服务器系统624的一部分实现。可替换地,来自计算设备600的组件可以与移动设备(未示出)中的其他组件组合,移动设备诸如是移动计算设备650。这样的设备中的每一个可以包含计算设备600和移动计算设备650中的一个或多个,并且整个系统可以由彼此通信的多个计算设备组成。
除了其他组件之外,移动计算设备650包括处理器652,存储器664,诸如显示器654的输入/输出设备,通信接口666和收发器668。移动计算设备650还可被提供有存储设备,例如微驱动器或其他设备,以提供附加的存储。处理器652,存储器664,显示器654,通信接口666和收发器668中的每一个使用各种总线互连,并且若干个组件可以安装在通用主板上或视情况以其他方式安装。
处理器652可以执行移动计算设备650内的指令,包括存储在存储器664中的指令。处理器652可以被实现为包括分离的以及多个模拟和数字处理器的芯片的芯片组。处理器652可以提供例如用于移动计算设备650的其他组件的协调,诸如对用户界面的控制,由移动计算设备650运行的应用以及由移动计算设备650进行的无线通信。
处理器652可以通过控制接口658和耦合到显示器654的显示接口656与用户通信。显示器654可以是例如TFT(薄膜晶体管液晶显示器)显示器或OLED(有机发光二极管)显示器或其他合适的显示技术。显示接口656可以包括用于驱动显示器654以向用户呈现图形和其他信息的适当电路。控制接口658可以从用户接收命令并且将它们转换以提交给处理器652。此外,外部接口662可以提供与处理器652的通信,以便实现移动计算设备650与其他设备的近距离通信。外部接口662可以提供例如一些实施方式中的有线通信,或其他实施方式中的无线通信,并且可以使用多个接口。
存储器664将信息存储在移动计算设备650内。存储器664可以被实现为一种或多种计算机可读介质,一个或多个易失性存储单元,或一个或多个非易失性存储单元中的一种或多种。还可以提供扩展存储器674,并通过扩展接口672将扩展存储器674连接到移动计算设备650,扩展接口672可以包括例如SIMM(单输入行存储器模块)卡接口。扩展存储器674可以为移动计算设备650提供额外的存储空间,或者还可以为移动计算设备650存储应用或其他信息。具体地,扩展存储器674可以包括用于执行或补充上述处理的指令,并且还可能包含安全信息。因此,例如,扩展存储器674可以被提供为用于移动计算设备650的安全模块,并且可以用允许安全地使用移动计算设备650的指令来编程。此外,可以经由SIMM卡以及其他信息(例如以不可入侵的方式在SIMM卡上放置识别信息)提供安全应用。
存储器可包括例如闪存和/或NVRAM存储器(非易失性随机存取存储器),如下所述。该计算机程序产品包含在执行时进行一种或多种方法的指令,例如上述方法。该计算机程序产品可以是计算机或机器可读介质,例如存储器664,扩展存储器674或处理器652上的存储器。在一些实施方式中,该计算机程序产品可以在传播的信号中接收,例如,通过收发器668或外部接口662。
移动计算设备650可以通过通信接口666进行无线通信,该通信接口在必要时可以包括数字信号处理电路。通信接口666可以提供各种模式或协议下的通信,例如GSM语音呼叫(全球移动通信系统),SMS(短消息服务),EMS(增强消息服务)或MMS消息(多媒体消息服务),CDMA(码分多址),TDMA(时分多址),PDC(个人数字蜂窝),WCDMA(宽带码分多址),CDMA2000或GPRS(通用组无线业务)等等。例如,可以使用射频通过收发器668进行这种通信。另外,可能会发生短距离通信,例如使用蓝牙,WiFi或其他此类收发器(未显示)。另外,GPS(全球定位系统)接收器模块670可以向移动计算设备650提供附加的与导航和位置有关的无线数据,其可以适当地由在移动计算设备650上运行的应用所使用。
移动计算设备650还可以使用音频编解码器660进行听觉通信,该音频编解码器660可以从用户接收语音信息并将其转换为可用的数字信息。音频编解码器660可以类似地例如通过扬声器,例如在移动计算设备650的听筒中为用户生成可听见的声音。这种声音可以包括来自语音电话呼叫的声音,可以包括记录的声音(例如语音消息,音乐文件等),并且还可以包含由在移动计算设备650上运行的应用生成的声音。
如图所示,可以以多种不同形式来实现移动计算设备650。例如,它可以被实现为蜂窝电话680。它也可以被实现为智能电话682,个人数字助理或其他类似的移动设备的一部分。
可以在数字电子电路,集成电路,专门设计的ASIC(专用集成电路),计算机硬件,固件,软件和/或其组合中实现此处描述的系统和技术的各种实施方式。这些各种实施方式可以包括在一个或多个计算机程序中的实施方式,该程序可以在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用的或通用的,其被耦合以从存储系统、至少一个输入设备和至少一个输出设备中接收数据和指令,并传输数据和指令到存储系统、至少一个输入设备和至少一个输出设备。
这些计算机程序(也称为程序,软件,软件应用或代码)包括用于可编程处理器的机器指令,并且可以以高级过程和/或面向对象的编程语言和/或以汇编/机器语言实施。如本文所使用的,术语机器可读介质和计算机可读介质是指用于提供机器指令和/或数据给可编程处理器的任何计算机程序产品,装置和/或设备(例如磁盘,光盘,存储器,可编程逻辑设备(PLD)),该可编程处理器包括接收机器指令作为机器可读信号的机器可读介质。术语机器可读信号是指用于向可编程处理器提供机器指令和/或数据的任何信号。
为了提供与用户的交互,可以在计算机上实现此处描述的系统和技术,该计算机具有显示设备(例如,CRT(阴极射线管)或LCD(液晶显示器)监视器)的,该显示设备用于向用户显示信息,该计算机还具有键盘和指向设备(例如鼠标或轨迹球),用户可通过该键盘和指向设备向计算机提供输入。其他种类的设备也可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的感觉反馈(例如,视觉反馈,听觉反馈或触觉反馈);并且可以以任何形式接收来自用户的输入,包括声音,语音或触觉输入。
这里描述的系统和技术可以在包括后端组件(例如,作为数据服务器),或者包括中间件组件(例如,应用服务器),或者包括前端的计算系统中实现。终端组件(例如,具有图形用户界面的客户端计算机或Web浏览器,用户可以通过该Web浏览器与此处描述的系统和技术的实现进行交互),或此类后端,中间件或前端组件的任意组合。系统的组件可以通过任何形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(LAN),广域网(WAN)和英特网。
计算系统可以包括客户端和服务器。客户端和服务器通常彼此远离,并且通常通过通信网络进行交互。客户端和服务器之间的关系是通过在各自计算机上运行并彼此具有客户端-服务器关系的计算机程序产生的。
如在本说明书中所使用的,“引擎”或“软件引擎”是指软件实现的输入/输出系统,其提供与输入不同的输出。引擎可以是编码的功能块,例如库,平台,软件开发工具包(“SDK”)或对象。可以在任何适当类型的计算设备(例如,服务器,移动电话,平板电脑,笔记本计算机,音乐播放器,电子书阅读器,便携式计算机或台式计算机,PDA,智能电话或其他固定或便携式设备)上实现每个引擎,包括一个或多个处理器和计算机可读介质。另外,两个以上的引擎可以在同一计算设备上或在不同的计算设备上实现。
在此处的系统,方法,设备和其他技术收集有关用户的个人信息(例如,上下文数据)或可以利用个人信息的情况下,可以为用户提供控制程序或功能是否收集的机会用户信息(例如,有关用户的社交网络,社交活动或活动,职业,用户的偏好或用户的当前位置的信息),或控制是否和/或如何从内容服务器接收可能更相关的内容给用户。另外,在存储或使用某些数据之前,可能会以一种或多种方式处理某些数据,以便删除个人身份信息。例如,可能会处理用户的身份,因此无法为该用户确定个人身份信息,或者在获得位置信息(例如到城市,邮政编码或州级别)的地方,可以概括用户的地理位置,从而无法确定用户的特定位置。因此,用户可以控制如何收集有关用户的信息以及如何由内容服务器使用。
尽管上面已经详细描述了各种实施方式,但是其他修改也是可能的。另外,附图中描绘的逻辑流程不需要所示的特定顺序或连续顺序来实现期望的结果。另外,可以从所描述的流程中提供其他步骤,或者可以从所描述的流程中去除步骤,并且可以向所描述的系统中添加其他组件或从中移除其他组件。因此,其他实施方式在所附权利要求的范围内。
Claims (18)
1.一种用于管理计算资源的容量的计算系统,其特征在于,包括:
一台或多台计算机,所述计算机具有存储器和至少一个数据处理装置,所述至少一个数据处理装置被配置为实现:
计算资源,所述计算资源在多个在线实体之中共享,所述计算资源具有用于执行所述多个在线实体的活动的有限容量;
在线实体管理器,所述在线实体管理器基于优先标准,确定所述多个在线实体的相对优先级;
优化引擎,所述优化引擎确定用于所述多个在线实体的一组预留区域,每个预留区域指定所述计算资源的未使用容量的一部分,允许具有相对优先级等于或低于所述预留区域的对应阈值优先级的在线实体预留所述未使用容量的一部分;和
资源管理器,所述资源管理器管理对所述多个在线实体分配所述计算资源的所述有限容量,包括响应于来自所述在线实体的请求,基于请求的容量是否小于由所述在线实体的对应预留区域指定的所述计算资源的所述未使用容量的一部分,来确定是否为在线实体预留所述计算资源的容量,
所述优化引擎还被配置为基于(i)所述多个在线实体中的在线实体使用上述计算资源的预测水平、以及(ii)所述在线实体的所述相对优先级,来确定区域限制,所述区域限制定义了在所述一组预留区域中的预留区域之间的边界。
2.根据权利要求1所述的计算系统,其特征在于,在所述多个在线实体之中共享的所述计算资源包括在基于云的平台中的共享网络资源、共享服务器资源、共享存储资源、共享应用资源、或共享服务资源中的至少一个。
3.根据权利要求1所述的计算系统,其特征在于,所述在线实体管理器通过以下方式确定所述多个在线实体的所述相对优先级:
为所述多个在线实体中的每一个分配优先级分数,所述优先级分数表示所述在线实体的重要性的度量;和
基于所述优先级分数,将所述多个在线实体分类为多个在线实体组,其中,每个在线实体组被赋予代表所述在线实体组的重要性的度量的相对优先级,
其中,所述多个在线实体的所述相对优先级对应于被分配了所述多个在线实体的相应在线实体组的所述相对优先级。
4.根据权利要求3所述的计算系统,其特征在于,所述优化引擎确定用于所述在线实体组的相应预留区域,并且,除了被赋予最低相对优先级的组之外,用于每个特定组的在线实体的所述相应预留区域指定了允许所述特定组预留的所述计算资源的所述未使用容量的一部分,包括(i)允许具有比所述特定组低的相对优先级的组预留所述计算资源的所有未使用容量,以及(ii)所述计算资源的所述未使用容量的另一部分。
5.根据权利要求3所述的计算系统,其特征在于,所述在线实体管理器基于所述优先标准,确定标准来确定分配给所述多个在线实体中的每一个的所述优先级分数,并且所述优先标准包括所述在线实体的账户的状态、所述在线实体使用所述计算资源或其他共享计算资源的历史频率、所述在线实体使用所述计算资源或其他共享计算资源的预测频率、所述在线实体使用所述计算资源或其他共享计算资源的历史水平、所述在线实体使用所述计算资源或其他共享计算资源的预测水平,或所述在线实体在所述计算资源或其他共享计算资源上发起的活动的类型中的至少一个。
6.根据权利要求1所述的计算系统,其特征在于,响应于确定所请求的容量小于由所述对应预留区域为所述在线实体指定的所述计算资源的所述未使用容量的一部分,分配所述计算资源的容量供所述在线实体使用,而不会有意地延迟,或者预先预留要在将来分配给所述在线实体使用的所述计算资源的容量。
7.一种用于管理计算资源的容量的方法,其特征在于,包括:
由管理多个在线实体共享的计算资源的计算系统,从所述多个在线实体中的第一在线实体,接收预留所述计算资源的容量的请求;
确定所述第一在线实体相对于所述多个在线实体中的其他在线实体的相对优先级;
识别与第一在线实体的所述相对优先级相对应的预留区域,所述预留区域指定所述计算资源的未使用容量的一部分,允许具有相对优先级等于或低于所述第一在线实体的所述相对优先级的在线实体预留所述未使用容量的一部分;
基于比较(i)所述计算资源的请求容量以及(ii)允许具有相对优先级等于或低于所述第一在线实体的所述相对优先级的在线实体预留的、由所述预留区域指定的所述计算资源的所述未使用容量的一部分,来确定是否满足所述请求;和
响应于确定所述计算资源的所述请求容量小于允许具有相对优先级等于或低于所述第一在线实体的所述相对优先级的在线实体预留的、由所述预留区域指定的所述计算资源的所述未使用容量的一部分,满足所述请求,为所述第一在线实体预留所述计算资源的容量,
还包括基于(i)所述多个在线实体中的在线实体对所述计算资源的使用的预测水平、以及(ii)所述在线实体的所述相对优先级,来确定所述预留区域的限制。
8.根据权利要求7所述的方法,其特征在于,在所述多个在线实体之中共享的所述计算资源包括在基于云的平台中的共享网络资源、共享服务器资源、共享存储资源、共享应用资源、或共享服务资源中的至少一个。
9.根据权利要求7所述的方法,其特征在于,还包括:
为所述多个在线实体中的每一个分配优先级分数,所述优先级分数表示所述在线实体的重要性的度量;和
基于所述优先级分数,将所述多个在线实体分类为多个在线实体组,其中,每个在线实体组被赋予代表所述在线实体组的重要性的度量的相对优先级,
其中,确定所述第一在线实体相对于所述多个在线实体中的其他在线实体的所述相对优先级包括,识别所述第一在线实体所属的所述在线实体组的相对优先级。
10.根据权利要求9所述的方法,其特征在于,包括基于所述在线实体的账户的状态、所述在线实体使用所述计算资源或其他共享计算资源的历史频率、所述在线实体使用所述计算资源或其他共享计算资源的预测频率、所述在线实体使用所述计算资源或其他共享计算资源的历史水平、所述在线实体使用所述计算资源或其他共享计算资源的预测水平,或所述在线实体在所述计算资源或其他共享计算资源上发起的活动的类型中的至少一个,确定所述多个在线实体中的每个在线实体的优先级分数。
11.根据权利要求7所述的方法,其特征在于,所述预留区域指定为允许具有相对优先级等于或低于所述第一在线实体的所述相对优先级的在线实体预留的所述计算资源的所述未使用容量的一部分包括(i)允许具有相对优先级低于所述第一在线实体的所述相对优先级的在线实体预留的所述计算资源的所有未使用容量、以及(ii)所述计算资源的所述未使用容量的其他部分。
12.如权利要求7所述的方法,其特征在于,为所述第一在线实体预留所述计算资源的容量包括对将在将来分配给所述第一在线实体使用的所述计算资源的容量进行预先预留。
13.一种用于管理由多个在线实体共享的计算资源的计算系统,其特征在于,包括:
一个或多个处理器;和
存储有指令的一个或多个计算机可读介质,所述指令在由所述一个或多个处理器执行时使所述一个或多个处理器进行以下操作:
从所述多个在线实体中的第一在线实体接收预留所述计算资源的容量的请求;
确定所述第一在线实体相对于所述多个在线实体中的其他在线实体的相对优先级;
识别与第一在线实体的所述相对优先级相对应的预留区域,所述预留区域指定所述计算资源的未使用容量的一部分,允许具有相对优先级等于或低于所述第一在线实体的所述相对优先级的在线实体预留所述未使用容量的一部分;
基于比较(i)所述计算资源的请求容量以及(ii)允许具有相对优先级等于或低于所述第一在线实体的所述相对优先级的在线实体预留的、由所述预留区域指定的所述计算资源的所述未使用容量的一部分,来确定是否满足所述请求;和
响应于确定所述计算资源的所述请求容量小于允许具有相对优先级等于或低于所述第一在线实体的所述相对优先级的在线实体预留的、由所述预留区域指定的所述计算资源的所述未使用容量的一部分,满足所述请求,为所述第一在线实体预留所述计算资源的容量,
还包括基于(i)所述多个在线实体中的在线实体对所述计算资源的使用的预测水平、以及(ii)所述在线实体的所述相对优先级,来确定所述预留区域的限制。
14.根据权利要求13所述的计算系统,其特征在于,在所述多个在线实体之中共享的所述计算资源包括在基于云的平台中的共享网络资源、共享服务器资源、共享存储资源、共享应用资源、或共享服务资源中的至少一个。
15.根据权利要求13所述的计算系统,其中,所述操作还包括:
为所述多个在线实体中的每一个分配优先级分数,所述优先级分数表示所述在线实体的重要性的度量;和
基于所述优先级分数,将所述多个在线实体分类为多个在线实体组,其中,每个在线实体组被赋予代表所述在线实体组的重要性的度量的相对优先级,
其中,确定所述第一在线实体相对于所述多个在线实体中的其他在线实体的所述相对优先级包括,识别所述第一在线实体所属的所述在线实体组的相对优先级。
16.根据权利要求15所述的计算系统,其特征在于,所述操作包括基于所述在线实体的账户的状态、所述在线实体使用所述计算资源或其他共享计算资源的历史频率、所述在线实体使用所述计算资源或其他共享计算资源的预测频率、所述在线实体使用所述计算资源或其他共享计算资源的历史水平、所述在线实体使用所述计算资源或其他共享计算资源的预测水平,或所述在线实体在所述计算资源或其他共享计算资源上发起的活动的类型中的至少一个,确定所述多个在线实体中的每个在线实体的优先级分数。
17.根据权利要求13所述的计算系统,其特征在于,所述预留区域指定为允许具有相对优先级等于或低于所述第一在线实体的所述相对优先级的在线实体预留的所述计算资源的所述未使用容量的一部分包括(i)允许具有相对优先级低于所述第一在线实体的所述相对优先级的在线实体预留的所述计算资源的所有未使用容量、以及(ii)所述计算资源的所述未使用容量的其他部分。
18.根据权利要求13所述的计算系统,其特征在于,为所述第一在线实体预留所述计算资源的容量包括,对将来将要分配给所述第一在线实体使用的所述计算资源的容量进行预先预留。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310907156.7A CN116860456A (zh) | 2017-12-14 | 2017-12-14 | 共享计算资源的动态容量优化 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/US2017/066426 WO2019117921A1 (en) | 2017-12-14 | 2017-12-14 | Dynamic capacity optimization for shared computing resources |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310907156.7A Division CN116860456A (zh) | 2017-12-14 | 2017-12-14 | 共享计算资源的动态容量优化 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111433745A CN111433745A (zh) | 2020-07-17 |
CN111433745B true CN111433745B (zh) | 2023-08-18 |
Family
ID=60935991
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310907156.7A Pending CN116860456A (zh) | 2017-12-14 | 2017-12-14 | 共享计算资源的动态容量优化 |
CN201780091056.4A Active CN111433745B (zh) | 2017-12-14 | 2017-12-14 | 共享计算资源的动态容量优化 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310907156.7A Pending CN116860456A (zh) | 2017-12-14 | 2017-12-14 | 共享计算资源的动态容量优化 |
Country Status (5)
Country | Link |
---|---|
US (2) | US11609796B2 (zh) |
EP (3) | EP3529698B1 (zh) |
KR (2) | KR102438621B1 (zh) |
CN (2) | CN116860456A (zh) |
WO (1) | WO2019117921A1 (zh) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102260547B1 (ko) * | 2020-09-10 | 2021-06-04 | 한국전자기술연구원 | 분산 협업형 클러스터내 최적합 클러스터 선정 스케줄링 방법 |
US12079665B2 (en) * | 2020-09-16 | 2024-09-03 | Intel Corporation | Application negotiable resource director technology for efficient platform resource management |
US11900171B2 (en) * | 2021-02-02 | 2024-02-13 | Microsoft Technology Licensing, Llc | Cloud computing capacity management system using automated fine-grained admission control |
US11714692B2 (en) | 2021-05-27 | 2023-08-01 | Red Hat, Inc. | Classical management of qubit requests |
US11379752B1 (en) | 2021-05-27 | 2022-07-05 | Red Hat, Inc. | Qubit reservation service |
EP4198726A1 (en) * | 2021-12-20 | 2023-06-21 | Juniper Networks, Inc. | Event log management |
US11960943B2 (en) | 2021-12-20 | 2024-04-16 | Juniper Networks, Inc. | Event log management |
CN115129466B (zh) * | 2022-03-31 | 2024-05-10 | 西安电子科技大学 | 云计算资源分层调度方法、系统、设备及介质 |
US20230367641A1 (en) * | 2022-05-16 | 2023-11-16 | Google Llc | Centralized Control For Computing Resource Management |
WO2024098333A1 (zh) * | 2022-11-10 | 2024-05-16 | 华为技术有限公司 | 调整计算资源的方法、装置及智能驾驶设备 |
JP2024071259A (ja) * | 2022-11-14 | 2024-05-24 | 株式会社日立製作所 | 計算機システム及びリソース割当制御方法 |
CN118152104A (zh) * | 2022-11-29 | 2024-06-07 | 华为云计算技术有限公司 | 共享资源分配方法、装置及计算设备集群 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1541004A (zh) * | 2002-11-29 | 2004-10-27 | �ƶ��Ѷ��� | 数字蜂窝通信系统中资源分配的方法和设备 |
CN1825289A (zh) * | 2005-02-22 | 2006-08-30 | 微软公司 | 用于资源管理的方法和系统 |
CN101715151A (zh) * | 2009-11-02 | 2010-05-26 | 北京科技大学 | 一种基于优先级的域间资源预留方法 |
Family Cites Families (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030061260A1 (en) * | 2001-09-25 | 2003-03-27 | Timesys Corporation | Resource reservation and priority management |
KR20040105804A (ko) * | 2002-03-28 | 2004-12-16 | 오페락스 아베 | 아이피 네트워크 내의 자원예약 방법 및 시스템 |
US7099974B2 (en) * | 2003-03-20 | 2006-08-29 | International Business Machines Corporation | Method, apparatus, and system for reducing resource contention in multiprocessor systems |
KR100705564B1 (ko) * | 2004-12-10 | 2007-04-10 | 삼성전자주식회사 | 네트워크에서의 자원 관리 장치 및 방법 |
WO2006098725A2 (en) * | 2005-03-11 | 2006-09-21 | Cluster Resources, Inc. | System and method for enforcing future policies in a compute environment |
EP3007508B1 (en) * | 2006-02-03 | 2017-10-18 | Guangdong Oppo Mobile Telecommunications Corp., Ltd. | Uplink resource allocation in a mobile communication system |
US8706858B2 (en) * | 2008-04-17 | 2014-04-22 | Alcatel Lucent | Method and apparatus for controlling flow of management tasks to management system databases |
CN101729379B (zh) * | 2008-10-15 | 2013-02-27 | 华为技术有限公司 | 一种城域网接纳控制的方法及设备与系统 |
US8495648B1 (en) * | 2011-02-28 | 2013-07-23 | Amazon Technologies, Inc. | Managing allocation of computing capacity |
JP2014525078A (ja) * | 2011-06-29 | 2014-09-25 | インターナショナル・ビジネス・マシーンズ・コーポレーション | データ処理システムのコンピューティング・リソースを予約するための方法および装置、コンピューティング環境受給権契約に対してコンピューティング・リソースの使用をモニターまたは管理するための方法および装置、コンピューティング環境受給権契約を移行するための方法および装置、ならびにこれらに関するコンピュータ・プログラム |
US9479575B2 (en) | 2012-03-27 | 2016-10-25 | International Business Machines Corporation | Managing capacity on demand in a server cloud |
US9466036B1 (en) | 2012-05-10 | 2016-10-11 | Amazon Technologies, Inc. | Automated reconfiguration of shared network resources |
US10686677B1 (en) * | 2012-05-18 | 2020-06-16 | Amazon Technologies, Inc. | Flexible capacity reservations for network-accessible resources |
US8856341B2 (en) | 2012-05-31 | 2014-10-07 | Hewlett-Packard Development Company, L.P. | Balancing management duties in a cloud system |
US10169090B2 (en) * | 2012-09-12 | 2019-01-01 | Salesforce.Com, Inc. | Facilitating tiered service model-based fair allocation of resources for application servers in multi-tenant environments |
US9953351B1 (en) * | 2013-03-13 | 2018-04-24 | Amazon Technologies, Inc. | Managing resource requests that exceed reserved resource capacity |
US9602426B2 (en) * | 2013-06-21 | 2017-03-21 | Microsoft Technology Licensing, Llc | Dynamic allocation of resources while considering resource reservations |
KR101543835B1 (ko) * | 2013-07-09 | 2015-08-12 | 인하대학교 산학협력단 | 클라우드 컴퓨팅 환경에서의 동적 자원 신뢰도 계층 기반의 자원 거래 시스템 및 방법 |
KR101491689B1 (ko) * | 2013-07-24 | 2015-02-11 | 한국과학기술정보연구원 | 다중 사용자를 위한 자원 할당 방법 및 장치 |
US10366358B1 (en) * | 2014-12-19 | 2019-07-30 | Amazon Technologies, Inc. | Backlogged computing work exchange |
WO2017010922A1 (en) | 2015-07-14 | 2017-01-19 | Telefonaktiebolaget Lm Ericsson (Publ) | Allocation of cloud computing resources |
US20170109815A1 (en) * | 2015-10-16 | 2017-04-20 | International Business Machines Corporation | On demand auctions of cloud resources (bundles) in hybrid cloud environments |
KR102433765B1 (ko) * | 2016-04-21 | 2022-08-18 | 삼성에스디에스 주식회사 | 네트워크 기능 가상화 시스템 상의 컴퓨팅 리소스 관리 장치 및 방법 |
-
2017
- 2017-12-14 CN CN202310907156.7A patent/CN116860456A/zh active Pending
- 2017-12-14 WO PCT/US2017/066426 patent/WO2019117921A1/en unknown
- 2017-12-14 EP EP17825708.5A patent/EP3529698B1/en active Active
- 2017-12-14 EP EP20197375.7A patent/EP3789876B1/en active Active
- 2017-12-14 KR KR1020217033248A patent/KR102438621B1/ko active IP Right Grant
- 2017-12-14 US US16/464,372 patent/US11609796B2/en active Active
- 2017-12-14 KR KR1020197034248A patent/KR102315784B1/ko active IP Right Grant
- 2017-12-14 EP EP23153020.5A patent/EP4187385A1/en active Pending
- 2017-12-14 CN CN201780091056.4A patent/CN111433745B/zh active Active
-
2021
- 2021-10-18 US US17/451,163 patent/US20220035682A1/en active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1541004A (zh) * | 2002-11-29 | 2004-10-27 | �ƶ��Ѷ��� | 数字蜂窝通信系统中资源分配的方法和设备 |
CN1825289A (zh) * | 2005-02-22 | 2006-08-30 | 微软公司 | 用于资源管理的方法和系统 |
CN101715151A (zh) * | 2009-11-02 | 2010-05-26 | 北京科技大学 | 一种基于优先级的域间资源预留方法 |
Also Published As
Publication number | Publication date |
---|---|
EP4187385A1 (en) | 2023-05-31 |
EP3789876B1 (en) | 2023-03-08 |
KR20210127822A (ko) | 2021-10-22 |
CN116860456A (zh) | 2023-10-10 |
WO2019117921A1 (en) | 2019-06-20 |
EP3529698B1 (en) | 2021-02-03 |
US11609796B2 (en) | 2023-03-21 |
CN111433745A (zh) | 2020-07-17 |
KR20190140985A (ko) | 2019-12-20 |
US20200334088A1 (en) | 2020-10-22 |
US20220035682A1 (en) | 2022-02-03 |
EP3789876A1 (en) | 2021-03-10 |
KR102438621B1 (ko) | 2022-08-30 |
EP3529698A1 (en) | 2019-08-28 |
KR102315784B1 (ko) | 2021-10-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111433745B (zh) | 共享计算资源的动态容量优化 | |
US20220206859A1 (en) | System and Method for a Self-Optimizing Reservation in Time of Compute Resources | |
US9886322B2 (en) | System and method for providing advanced reservations in a compute environment | |
US20200089538A1 (en) | System and methods for implementing control of use of shared resource in a multi-tenant system | |
US8312460B1 (en) | Allocating computer resources to workloads using utilization based probability distributions | |
US20170324813A1 (en) | Cloud storage platform providing performance-based service level agreements | |
EP2357561A1 (en) | System and method for providing advanced reservations in a compute environment | |
US9672072B1 (en) | System and method for managing mainframe computer system usage | |
EP3293632B1 (en) | Dynamically varying processing capacity entitlements | |
WO2021046777A1 (zh) | 资源调度、申请与定价方法、设备、系统及存储介质 | |
US10812278B2 (en) | Dynamic workload capping | |
US20160283926A1 (en) | Dynamic workload capping | |
CN107203256B (zh) | 一种网络功能虚拟化场景下的节能分配方法与装置 | |
TW201305948A (zh) | 預約管理裝置、預約管理方法、預約管理程式、及記憶其程式之電腦可讀取之記錄媒體 | |
Zhang et al. | PRMRAP: A proactive virtual resource management framework in cloud | |
US12124878B2 (en) | System and method for scheduling resources within a compute environment using a scheduler process with reservation mask function | |
US12050937B2 (en) | Preventing resource exploitation in mobile devices | |
TWI539403B (zh) | 無線電頻譜交易之技術 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |