CN106133696A - 缩放云资源时动态标识目标容量 - Google Patents

缩放云资源时动态标识目标容量 Download PDF

Info

Publication number
CN106133696A
CN106133696A CN201580017937.2A CN201580017937A CN106133696A CN 106133696 A CN106133696 A CN 106133696A CN 201580017937 A CN201580017937 A CN 201580017937A CN 106133696 A CN106133696 A CN 106133696A
Authority
CN
China
Prior art keywords
virtual machine
zoom
auto zoom
action
tolerance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201580017937.2A
Other languages
English (en)
Other versions
CN106133696B (zh
Inventor
S·西西里阿诺
C·拉曼纳
I·格雷伯诺夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Technology Licensing LLC
Original Assignee
Microsoft Technology Licensing LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Technology Licensing LLC filed Critical Microsoft Technology Licensing LLC
Publication of CN106133696A publication Critical patent/CN106133696A/zh
Application granted granted Critical
Publication of CN106133696B publication Critical patent/CN106133696B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/70Admission control; Resource allocation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • G06F9/505Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the load
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • G06F9/5072Grid computing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5083Techniques for rebalancing the load in a distributed system
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0803Configuration setting
    • H04L41/0823Configuration setting characterised by the purposes of a change of settings, e.g. optimising configuration for enhancing reliability
    • H04L41/0836Configuration setting characterised by the purposes of a change of settings, e.g. optimising configuration for enhancing reliability to enhance reliability, e.g. reduce downtime
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/70Admission control; Resource allocation
    • H04L47/83Admission control; Resource allocation based on usage prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/70Admission control; Resource allocation
    • H04L47/78Architectures of resource allocation
    • H04L47/781Centralised allocation of resources

Abstract

各实施例涉及在自动缩放云资源时避免摇摆。在一个场景中,计算机系统访问指定要在多个云资源上维持的目标运行度量的信息。计算机系统确定针对云资源中的至少一些的目标运行度量的当前测得值。计算机系统进一步基于目标运行度量和当前测得值来计算缩放因子,其中缩放因子表示目标运行度量和当前测得值之间的差异量。计算机系统还计算表示云资源的由计算得到的缩放因子修改的经修改的量的增量值,并基于计算得到的增量值确定是否要发生缩放动作。

Description

缩放云资源时动态标识目标容量
背景
云服务被广泛用户提供许多类型的功能,包括托管应用,提供对数据存储的访问,提供网站、电子邮件或其他功能。云服务通常在可位于彼此远程的各计算机系统的网络上运行。计算机网络可被配置成使用各虚拟机来提供各种服务。这些服务可通过按需添加或移除虚拟机来伸缩。例如,在峰值负载的时间,可实例化附加虚拟机,而在降低的负载的时间,可关闭各虚拟机。在某些情况下,虚拟机可能会被关闭,却由于负载增加的缘故而仅仅是立即又被重新带回。这一场景通常被称为“摇摆”(flapping)。
简要概述
本文描述的各实施例涉及在自动缩放云资源时避免摇摆。在一个实施例中,计算机系统访问指定要在多个云资源上维持的目标运行度量的信息。计算机系统确定针对云资源中的至少一些的目标运行度量的当前测得值。计算机系统进一步基于目标运行度量和当前测得值来计算缩放因子,其中缩放因子表示目标运行度量和当前测得值之间的差异量。计算机系统还计算表示云资源的由计算得到的缩放因子修改的经修改的量的增量值,并基于计算得到的增量值确定是否要发生缩放动作。
在另一实施例中,提供了一种用于在自动缩放云资源时避免摇摆的替代方法。在这一实施例中,计算机系统访问自动缩放规则,所述自动缩放规则管控指定云资源集合要被如何缩放。计算机系统随后根据自动缩放规则标识第一候选自动缩放动作,并且进一步计算该指定云资源集合的预计资源消耗量,其中预计量指示如果应用第一候选自动缩放规则的话将发生的资源消耗量。随后,在确定所预计的资源消耗不会触发第二自动缩放规则之际,计算机系统执行第一候选自动缩放动作。
提供本概述以便以简化的形式介绍以下在详细描述中进一步描述的一些概念。本概述并非旨在标识出要求保护的主题的关键特征或必要特征,亦非旨在用作辅助确定要求保护的主题的范围。
本发明的附加特征和优点将在以下描述中叙述,且其一部分根据本描述对本领域的技术人员将是显而易见的,或可通过对此处的原理的实践来获知。此处所描述的各实施例的特征和优点可通过在所附权利要求书中特别指出的工具和组合来实现和获得。通过下列描述以及所附的权利要求,,此处所描述的各实施例的特征将变得更加显而易见。
附图简述
为进一步阐明此处所描述的各实施例的上述及其它特征,将参考附图,呈现更具体的描述。应该理解,这些附图只描述了此处所描述的各实施例的示例,因此,不应该被视为限制其范围。将通过使用附图并利用附加特征和细节来描述和解释各实施例,在附图中:
图1例示出本文描述的各实施例(包括在自动缩放云资源时避免摇摆)可在其中操作的计算机体系架构。
图2例示出用于在自动缩放云资源时避免摇摆的示例方法的流程图。
图3例示出用于在自动缩放云资源时避免摇摆的替代示例方法的流程图。
图4例示出其中使用计算得到的缩放因子和增量值来避免摇摆的实施例。
图5例示出其中发生摇摆的实施例。
图6例示出其中预计资源消耗被计算以避免在使用自动缩放规则的场景中的摇摆的实施例。
详细描述
本文描述的各实施例涉及在自动缩放云资源时避免摇摆。在一个实施例中,计算机系统访问指定要在多个云资源上维持的目标运行度量的信息。计算机系统确定针对云资源中的至少一些的目标运行度量的当前测得值。计算机系统进一步基于目标运行度量和当前测得值来计算缩放因子,其中缩放因子表示目标运行度量和当前测得值之间的差异量。计算机系统还计算表示云资源的由计算得到的缩放因子修改的经修改的量的增量值,并基于计算得到的增量值确定是否要发生缩放动作。
在另一实施例中,提供了一种用于在自动缩放云资源时避免摇摆的替代方法。在这一实施例中,计算机系统访问自动缩放规则,所述自动缩放规则管理指定云资源集合要被如何缩放。计算机系统随后根据自动缩放规则标识第一候选自动缩放动作,并且进一步计算该指定云资源集合的预计资源消耗量,其中预计量指示如果应用第一候选自动缩放规则的话将发生的资源消耗量。随后,在确定所预计的资源消耗不会触发第二自动缩放规则之际,计算机系统执行第一候选自动缩放动作。
下面的讨论现在涉及可被执行的多个方法和方法动作。值得注意的是,虽然可以以某一顺序讨论或在流程图中按特定顺序发生而示出了方法动作,但是,没有特定顺序是一定需要的,除非特别声明,或者是必需的,因为在一个动作被执行之前该动作取决于另一动作被完成。
本文中描述的实施例可实现各种类型的计算系统。这些计算系统现在越来越多地采取多种多样的形式。例如,计算系统可以是手持式设备、电器、膝上型计算机、台式计算机、大型机、分布式计算系统或甚至常规上不被认为是计算系统的设备。在本说明书以及权利要求书中,术语“计算系统”被广义地定义为包括任何设备或系统(或其组合),该设备或系统包含至少一个物理且有形的处理器以及其上能具有可由处理器执行的计算机可执行指令的物理且有形的存储器。计算系统可以分布在网络环境中,并可包括多个组分计算系统。
如图1所示,计算系统101通常包括至少一个处理单元102和存储器103。存储器103可以是物理系统存储器,该物理系统存储器可以是易失性的、非易失性的、或两者的某种组合。术语“存储器”也可在此用来指示诸如物理存储介质这样的非易失性大容量存储器。如果计算系统是分布式的,则处理、存储器和/或存储能力也可以是分布式的。
如本文中所使用的,术语“可执行模块”或“可执行组件”可以指可以在计算系统上执行的软件对象、例程或方法。本文所描述的不同组件、模块、引擎以及服务可以实现为在计算系统上执行的对象或进程(例如,作为分开的线程)。
在随后的描述中,参考由一个或多个计算系统执行的动作描述了各实施例。如果这样的动作是以软件实现的,则执行动作的相关联计算系统的一个或多个处理器响应于已经执行了计算机可执行指令来引导计算系统的操作。例如,这样的计算机可执行指令可以在形成计算机程序产品的一个或多个计算机可读介质上实现。这样的操作的示例涉及对数据的操纵。计算机可执行指令(以及被操纵的数据)可以存储在计算系统101的存储器103中。计算系统101还可包含允许计算系统101通过有线或无线网络与其它消息处理器通信的通信信道。
在此描述的各实施例可包括或利用专用或通用计算机系统,该专用或通用计算机系统包括诸如例如一个或多个处理器和系统存储器等计算机硬件,如以下更详细讨论的。系统存储器可被包括在整体存储器103内。系统存储器还可被称为“主存储器”,并且包括可被至少一个处理单元102在存储器总线上被寻址的存储器位置,在这种情况下地址位置被声明在存储器总线自身上。系统存储器传统上是易失性的,但本文中描述的原理还应用于其中系统存储器部分或者甚至全部是非易失性的情况。
本发明范围内的各实施例也包括用于实现或存储计算机可执行指令和/或数据结构的实体及其它计算机可读介质。这样的计算机可读介质可以是可由通用或专用计算机系统访问的任何可用介质。存储计算机可执行指令和/或数据结构的计算机可读介质是计算机存储介质。承载计算机可执行指令和/或数据结构的计算机可读介质是传输介质。由此,作为示例而非限制,本发明的各实施例可包括至少两种显著不同的计算机可读介质:计算机存储介质和传输介质。
存储计算机可执行指令和/或数据结构的计算机存储介质是物理硬件存储介质。物理硬件存储介质包括计算机硬件,诸如RAM、ROM、EEPROM、固态驱动器(“SSD”)、闪存、相变存储器(“PCM”)、光盘存储、磁盘存储或其它磁存储设备、或可用于存储计算机可执行指令或数据结构形式的程序代码的任何其它硬件存储介质,其可由通用或专用计算机系统访问来实现本发明公开的功能。
传输介质可包括可用于携带计算机可执行指令或数据结构形式的程序代码并可由通用或专用计算机系统访问的网络和/或数据链路。“网络”被定义为使得电子数据能够在计算机系统和/或模块和/或其它电子设备之间传输的一个或多个数据链路。当信息通过网络或另一个通信连接(硬连线、无线、或者硬连线或无线的组合)传输或提供给计算机系统时,该计算机系统将该连接视为传输介质。上述的组合应当也被包括在计算机可读介质的范围内。
此外,在到达各种计算机系统组件之后,计算机可执行指令或数据结构形式的程序代码可从传输介质自动传输到计算机存储介质(或反之亦然)。例如,通过网络或数据链路接收到的计算机可执行指令或数据结构可以在网络接口模块(例如,“NIC”)内的RAM中被缓冲,然后最终被传输至计算机系统RAM和/或计算机系统处的较不易失性的计算机存储介质。因而,应当理解,计算机存储介质可被包括在还利用(或甚至主要利用)传输介质的计算机系统组件中。
计算机可执行指令例如包括,当在一个或多个处理器处执行时使通用计算机系统、专用计算机系统、或专用处理设备执行某一功能或某组功能的指令和数据。计算机可执行指令可以是例如二进制代码、诸如汇编语言之类的中间格式指令、或甚至源代码。
本领域的技术人员将理解,本文中描述的原理可以在具有许多类型的计算机系统配置的网络计算环境中实践,这些计算机系统配置包括个人计算机、台式计算机、膝上型计算机、消息处理器、手持式设备、多处理器系统、基于微处理器的或可编程消费电子设备、网络PC、小型计算机、大型计算机、移动电话、PDA、平板、寻呼机、路由器、交换机等等。本发明也可在其中通过网络链接(或者通过硬连线数据链路、无线数据链路,或者通过硬连线和无线数据链路的组合)的本地和远程计算机系统两者都执行任务的分布式系统环境中实施。如此,在分布式系统环境中,计算机系统可包括多个组成部分计算机系统。在分布式系统环境中,程序模块可以位于本地和远程存储器存储设备二者中。
本领域技术人员还将理解本发明可在云计算环境中实践。云计算环境可以是分布式的,但这不是必须的。在分布时,云计算环境可以国际性地分布在一个组织内,和/或具有跨多个组织拥有的组件。在该说明书和下面的权利要求书中,“云计算”被定义为用于允许对可配置计算资源(例如,网络、服务器、存储、应用和服务)的共享池的按需网络访问的模型。“云计算”的定义不限于可从这样的模型(在被合适地部署时)中获得的任何其它多个优点。
更进一步,此处所描述的系统架构可包括多个独立组件,每一组件都对作为整体的系统的功能有贡献。当开始考虑平台可缩放性的问题时,此模块性允许提高灵活性,为此,提供各种优点。可以通过使用带有有限的功能范围的较小规模部件,比较轻松地管理系统复杂性和增长。通过使用这些松散耦合的模块,增强平台容错。随着业务需要规定,单个组件可以增量地增长。对于新的功能,模块化开发还转换为缩短的上市时间。可以添加或减去新功能,而不会影响核心系统。
图1示出了其中可以采用至少一个实施例的计算机架构100。计算机架构100包括计算机系统101。计算机系统101可以是包括云计算系统的任何类型的本地或分布式计算机系统。计算机系统101包括用于执行各种不同的功能的模块。例如,通信模块104可被配置成于其他计算系统通信。计算模块104可包括可从其他计算系统接收数据和/或向其他计算系统传送数据的任何有线或无线通信装置。通信模块104可被配置成于数据库、移动计算设备(诸如移动电话或平板设备)、嵌入式计算系统或其他类型的计算系统交互。
在一些实施例中,计算机系统101的通信模块104可被配置成接收来自用户105的目标运行度量106。目标运行度量106指的是云资源的一个或多个运行度量,目标是该云资源要满足的级别、价值或数量。云资源(例如113)可以基本上是任何计算或网络资源,包括处理器、处理核、处理线程、处理单元(如每秒运算)或类似物的、存储器、硬盘驱动器或其他存储空间、网络带宽、网络端口、虚拟机、物理机或以上的任意组合。在一个示例中,用户可以指定一个处理器或一组处理器要保持在50%的容量。在一些情况下,50%的容量可能对于处理器使用来说是最优的,因为处理器可能仍然会遇到大的负载,并且有空间来增加处理。在其他情况下,40%、60%或某个其它百分比可能是最优的。在一些情况下,用户可以指定存储器的量(例如8Gb存储器或1.5Gbps网络带宽或至少三个并发运行的虚拟机,等等)。这些中的每一个都将是目标运行度量的示例。如将会是显而易见的,其他示例也是可能的,并且以上的只是目标运行度量的一些实例。
一旦计算机系统101有了目标运行度量106,则确定模块107能够确定云资源113要被扩展还是缩减。如果云资源目前高于所需,则云资源可被缩减。例如,如果目标运行度量106指定至少三个虚拟机要并发运行,而当前有六个虚拟机正在并发运行,则那些虚拟机中的最多三个虚拟机可被关闭,只要所指定的目标运行度量106仍然被满足。在其他情况下,如果云资源113目前低于维持目标运行度量106所需,则资源可被扩展。如本文中所使用的,术语“缩放动作”或“自动缩放动作”指的是基于当前需求自动扩展或缩减云资源(例如,当前运行以主存服务的虚拟机(VM)的数目、或者主存服务的特定VM的大小)。
如之前所指出的,如果资源被反复地扩展或缩减,则系统被称为在摇摆。因此,对于给定资源的规模变化将被计量,并在被应用之前仔细确定。计算模块109可以根据当前测得的值108(该值指示该云资源113的当前测得的值)来确定要进行缩放动作112。缩放动作可包括将云资源扩展或缩减一定的量。缩放动作的量可取决于当前和过去的条件。计算模块109可确定缩放因子110和增量值111以确定是否要应用缩放动作,并且如果是的话,确定要发生的缩放量。则将在以下接合图1和4-6来进一步阐述。
此处所描述的实施例可被配置成基于给定服务的当前总容量以及当前运行度量和目标运行度量106之间的增量来计算要添加或删除的云资源113(例如,虚拟机实例)的数量。在一些场景中,这一计算包括三个步骤:1)用户105向系统提供了与负载相关的性能度量。在一些情况下,这些度量可以按照实例的总数来归一化,得到平均负载(PCL)。2)用户可进一步提供给定性能度量中的针对他们希望每个实例处理的负载量的平均目标阈值,被称为平均目标阈值(PCTT)。3)随后采取缩放动作112,并且该缩放的大小由该度量的当前平均值和用户定义的阈值(即PCTT)之间的增量111来确定。在每个缩放动作中,系统还:a)预计该缩放动作将会对服务(例如,114)的总容量产生的影响,和b)如果预测表明(在当前负载下)服务的新的总容量不能处理负载,则系统还可降低缩放动作的幅度,直到新容量将能够服务于当前负载。
在一些情况下,用户可能不想或不知道如何定义平均目标阈值。作为替代,用户可以定义缩放规则,该规则指令系统按照固定量来扩展或缩减。在这种情况下,步骤(1)和(3)仍然会被使用,但(2)将被计算。缩放系统可被配置成周期性地(例如,每5分钟)运行,并可在每次其运行时获取两个(或更多个)输入。第一输入可以是为指定服务提供容量的虚拟机实例的数量,而第二输入可以指定对服务在该时间点正处理的工作的量(即负载)进行量化的一组当前性能度量。应当注意的是,在至少一些实施例中,缩放系统可被配置为以相同周期运行,而不管用户提供哪些输入。
图5中示出了摇摆场景。在图5中,用户可能已经采用25%的处理器使用率建立了三个实例(501)。用户的缩减规则可能指示两个实例将被移除。然而,当两个实例被移除时,只剩下一个实例,而这将增加到75%的CPU使用率(502)。这进而又触发了扩展规则,从而添加两个实例。现在,用户将再次具有25%的使用率下的三个实例。另一个缩减动作被触发,从而返回到一个实例。这一循环将无限持续下去,直到负载改变。
可使用如图4中所示的平均目标阈值(PCTT)410来避免摇摆。对于每次运行,系统首先确定自动缩放作业404的平均负载(PCL)405。PCL可通过以下来计算:1)评估表明资源的当前运行状态的每一个当前性能度量402(包括度量403A、403B和403C)、以及2)对于每个当前性能度量,除以正处理容量405的实例(n)401的总数。结果,PCL表示每个实例所承担的单位负载。
接着,计算度量缩放因子(MSF)406。至少在一些实施例中,MSF是PCL除以用户定义的PCTT。MSF表示服务的当前容量距目标容量(例如106)有多远。至少在一些实施例中,为了对资源性能区分优先级,所有MSF的最大值被使用407(但这并不是必需的——小于最大MSF的其他缩放因子也可被使用)。使用最大MSF确保如果缩减将影响性能有任何(明显的)可能性时,资源将不会被缩减。随后,计算要缩放到该度量缩放因子所需要的实例的数量(即408处的增量值)。如果增量值不等于零(即它是正值或负值)409,缩放动作将根据该增量值来执行。因此,在包括实数的示例中,如果x被设为75%的当前CPU负载,而n等于三个虚拟机(或其他资源)实例,则PCL将是每个虚拟机75/3%或25%。MSF将是25/50或1/2,并且增量可以是3-(3*1/2)或1.5。因此,在这一示例中,1.5个虚拟机是可被缩减的过量机器的增量或者。如果该数量已成为负数,则其表示要满足运行性能度量将需要添加的资源的数量。
在另一实施例中,可在不使用PCTT值的情况下避免摇摆在这一场景中,用户可定义指定他们想要他们的服务如何缩放的规则集合(也称缩放设置)。例如,他们可以表示“当CPU负载小于40%时缩减两个实例”以及“当CPU负载大于60%时增加两个实例”。为了防止摇摆的情况发生,计算系统101预测任何给定缩放动作将会对服务产生的影响。至少在某些情况下,这可通过假设线性回归来实现:该假设是两台机器处于50%负载相当于一台机器处于100%或4台机器处于25%。这一过程现在将参考图6来描述。
对于自动缩放引擎的每个执行:1)评估缩放设置602。在一些实施例中,摇摆可能仅在循环的缩减侧上被防止。这样做是使系统的性能优先于潜在的成本节省。如果扩展规则表明动作是必要的,则作业执行该动作并退出。2)评估缩减设置。如果没有缩减设置被触发,则系统处于良好状态并且不需要进一步缩放。3)如果缩减指示缩放规则被触发,则预计新的CPU负载601(或其它资源测量)。这是通过这一公式来计算的:
4)评估扩展设置,但是采用新预计的CPU百分比。如果确定该扩展设置不会被触发,则它被确定为缩减是安全的——不会发生摇摆。5)然而,如果扩展设置将被触发,则减少缩减量并且再次预计新的CPU。以此方式,步骤5允许系统缩减不会触发摇摆的最大的可能数量。它表示了一种对用户意图(缩放行动仍然执行)的紧密近似,但避免了不必要的摇摆循环。在某些场景中,这可能意味着没有任何缩放会发生,但这可能是最优的,因为系统可能会以其它方式被供给不足。
因此,在提供采用实数的其中云资源为CPU负载的示例中,该系统可以查看当前CPU负载601、用户定义的设置(例如,目标运行度量106)、以及当前虚拟机实例计数603。如果当前CPU负载大于60%(604),则系统可被配置成添加两个VM(605)。如果当前CPU负载小于40%(606),则可计算在移除两个VM实例后新的CPU负载(608)。如果当前CPU负载不小于40%(606),则没有动作会发生并且系统可退出(607)。如果计算得到的在移除两个实例后的CPU负载大于60%(609),则确定摇摆将会发生,并且在少移除一个实例的情况下重新执行608。如果计算得到的在移除两个实例后的CPU负载小于60%(609),则确定缩减是安全的,并且两个VM实例被移除(610)。将会理解的是在上面的示例中所使用的数字仅仅是许多可能的示例中的一个示例,并且CPU负载和虚拟机是可使用云资源的许多不同示例中的一些示例。以下分别结合图2和3的方法200和300描述可被用于减少摇摆的其它实施例。
鉴于上文所描述的系统和架构,参考图2和3的流程图,将更好地理解可以根据所公开的主题实现的方法。为了简洁起见,作为一系列框示出和描述了方法。然而,应了解和明白,所要求保护的主题不受方框的顺序的限制,因为某些方框可以按不同的顺序进行,和/或与此处所描绘和描述的其它方框同时进行。此外,并非所有的所示出的方框都是实现下面所描述的方法所必需的。
图2例示出用于在自动缩放云资源时避免摇摆的方法200的流程图。现在将频繁地参考环境100的组件以及数据来描述方法200。
方法200包括访问指定要在多个云资源上维持的至少一个目标运行度量的信息的动作(动作210)。例如,计算机系统101可访问指定对于一个或多个云资源113要维持的至少一个运行度量106的信息。目标运行度量106可由用户105或由某个其它实体提供。替代地,目标运行度量106可被存储在数据库(例如,115)或某个其它数据存储上。目标运行度量106可包括虚拟机或其它云资源的数目的上限和下限。例如,在一些情况下,目标运行度量106可指定一组虚拟机或指定给定服务要是50%CPU负载。其它目标运营度量106可能与服务或指定云资源的健康或性能绑定(例如,维持一定量的存储器,或维持处理指定数目的每秒请求数的能力)。
方法200接着包括确定多个云资源中的至少一些的至少一个目标运行度量的当前测得值的动作(动作220)。计算机系统101的确定模块107可确定云资源113中的一个或多个的目标运行度量106的当前测得值108。计算机系统101的计算模块109可随后基于至少一个目标运行度量106和当前测得值108来计算缩放因子110,其中缩放因子表示至少一个目标运行度量和当前测得值之间的差异量(动作230)。计算模块109可进一步计算表示云资源113的由计算得到的缩放因子修改的经修改的量的增量值111(动作240)。确定模块107可随后基于计算得到的增量值来确定是否要发生缩放动作112(动作250)。
在一些实施例中,缩放动作112可包括添加虚拟机或移除虚拟机。在其它示例中,缩放动作112可包括增大或减小虚拟机的大小。相应地,缩放动作可以增加或减小资源的物理或虚拟数量,或者可以增大或减小资源的物理或虚拟大小。因此,在虚拟机的情况中,虚拟机中的一个或多个可在处理能力、存储器、硬盘驱动器空间、网络功能、或以某种其它方式被扩展。例如,虚拟机可以被给予对更多或更少物理处理核、或更多或更少网卡的访问。在指定了多个目标运行度量的情况下,一些目标运行度量可能会优先于其它目标运行度量。例如,CPU负载可被优先于网络容量或硬盘驱动器空间。当然其他优先级场景是可能的,其中其他目标运行度量被赋予优先。
在一些情况下,虚拟机健康可被优先于成本节省。例如,当虚拟机健康优先时,每个虚拟机实例可以较低的CPU负载运行。这可能增加运行系统的成本,因为更多的物理处理器在运行来处理和运行虚拟机。然而,这可能是客户想要的以便确保他们有足够的能力来处理负载增加,或足够的处理器在运行,使得如果一个处理器变为故障或以其它方式经历阻止其运行的错误,CPU负载可以被故障转移到另一处理器。其它的优先排序也是可能的。例如,一些工作空间可能能够在夜间或周末降到零个实例。在这种情况下,性能可能会优先于健康,以在日间提供优质的服务,而在夜间提供很少或不提供服务。因此,本文中所描述的实施例可以区分不同的云资源113的优先级,或者可以指定不同的总优先次序,该优先次序转化为要应用于各种云资源的策略。
如以上提到的,计算模块109可以在确定是否执行缩放动作112时计算缩放因子,并且如果缩放动作将要发生,则确定云资源应按被扩展或缩减多少。缩放因子110表示给定服务的当前容量距目标容量有多远的测量。缩放因子110可以针对每一个目标运行度量106来计算。如果用户105或另一用户已指定了要应用的给定优先次序,则可基于该优先次序来选择一个或多个特定的缩放因子。在一些情况下,用户可使健康优先于性能。在这种情况下,指定的缩放因子将包括最大缩放因子110。最大缩放因子表示目标运行度量和每个目标运行度量的当前测得值之间的差异的最高量。使用该值将确保如果在没有该云资源的情况下最低健康水平将被维持的话,所得到的增量值111只具有高于1或低于-1的值(指示至少有一个云资源要被添加或删除)。
用户可以选择或提供要在主存服务期间要被维持的服务级协议(SLA)。如果为服务实现了这一SLA,则确定模块107可以标识至少一个运行度量,该运行度量如果被实现的话将导致至少一个SLA不再可实施。如果这一运行度量被标识为会造成SLA不再可实施,则计算机系统101可以生成通知,通知用户105所选定的运行度量106会导致SLA不再可实施。因此,例如,如果用户选择只有一个虚拟机实例用于一服务,则通知将被发送给用户,指示针对该服务的SLA在只使用一个虚拟机实例时不能被提供。用户可因此被不断告知何时/是否对目标运行度量的改变打破针对服务的现有SLA。
定制度量也可被使用。例如,用户可创建定制的目标运行度量106。用户可以指定例如可以在由一组虚拟机主存的网站上同时购物的购物者的数量,或者可以指定适用于他们个人场景的某个其他度量。当使用定制目标运行度量时,用户可进一步指定每个虚拟机针对用户数量的高值或低值是什么(用户可以提供或访问历史数据来确定这些值将是什么)。用户也可组合定制或内置度量以创建要针对一组云资源113维持的目标运行度量106的定制组合。无论使用哪个目标运行度量,如果确定模块107确定缩放动作112将发生,则针对该云资源113执行缩放操作,使得根据该缩放动作添加或删除云资源。缩放动作本身基于计算得到的增量值111。在某些情况下,计算机系统101的计算模块109可以被配置成计算缩放动作将对一个或多个虚拟机的总容量的预计影响。这一预计影响将在以下结合图3的方法300来进一步讨论。
图3例示出用于在自动缩放云资源时避免摇摆的方法300的流程图。现在将频繁地参考环境100的组件以及数据来描述方法300。
方法300包括访问一个或多个自动缩放规则的动作,该规则管控指定云资源集合要被如何缩放(动作310)。例如,计算机系统101可以访问自动缩放规则116,该规则管控一个或多个云资源113要被如何缩放。自动缩放规则可指示例如云资源要被自动扩展或缩减一定数量的实例(例如由一个或两个或三个,等等)。该规则可基于策略,或者可针对给定服务被直接指定。自动缩放规则116可包括候选自动缩放动作117。计算系统101可以根据自动缩放规则中的至少一者标识第一候选自动缩放动作(动作320)。第一候选自动缩放动作117可以是候选自动缩放动作117中的任意一个。自动缩放规则是“候选”规则,因为它们可被应用或可不被应用但都至少有资格被应用的规则。
方法300还包括为该指定云资源集合计算预计资源消耗量的动作,其中预计量指示如果第一候选自动缩放规则被应用的话将会发生的资源消耗量(动作330)。因此,计算机系统101的计算模块109可以计算云资源113的预计资源消耗量114。预计量114包括如果第一候选自动缩放动作117被应用的话将发生的资源消耗量。计算机系统101随后可以确定该预计资源消耗114不会触发另一个自动缩放规则,并继续执行第一候选自动缩放动作(动作340)。以此方式,计算机系统101可以查看给定自动缩放动作,通过预计该自动缩放动作的资源消耗来确定执行该自动缩放动作会触发其他自动缩放动作(即摇摆),以及如果不会引起摇摆则执行该动作。如果应用该自动缩放动作将引起摇摆,则该动作将被阻止。
在一些实施例中,第一自动缩放动作可包括从该指定云资源集合113中移除虚拟机,并且第二自动缩放动作可以包括向该指定云资源集合113添加虚拟机。因此,在这样的实施例中,就像第一自动缩放动作(移除虚拟机)被应用了一样来对预计资源消耗114进行预计。如果移除虚拟机不会触发另一自动缩放动作(添加虚拟机),那么第一动作可被应用。在某些情况下,自动缩放规则116被实现为使扩展规则优先于缩减规则。这样做是使系统或服务的健康优先于成本节省(例如,以较低的负载来运行多个CPU的成本)。
另外,在一些实施例中,第一自动缩放动作可被执行,但以减少的量来执行。例如,如果第一自动缩放动作指定要移除三个虚拟机,可仅移除一个虚拟机而不是三个。减少的量可以根据计算得到的如果第一自动缩放规则被完全应用的话会发生的预计资源消耗量114来确定。以减少的量来执行第一自动缩放动作可因此包括使用较少的虚拟机来进行第一自动缩放,或使用尺寸较小的缩减虚拟机。以此方式,可使用基于规则的缩放系统,但仍可通过预计应用给定规则的资源消耗并且如果该规则将触发摇摆则避免应用该规则来避免摇摆。相反,如果自动缩放规则不会触发其它自动缩放规则,则该自动缩放规则可被应用,且摇摆不会发生。因此,提供了防止自动缩放云资源时摇摆的方法、系统和计算机程序产品。
本文中描述的概念和特征可以其他具体形式来具体化,而不背离其精神或描述性特征。所描述的实施例在所有方面都应被认为仅是说明性而非限制性的。从而,本发明的范围由所附权利要求书而非前述描述指示。落入权利要求书的等效方案的含义和范围内的所有改变应被权利要求书的范围所涵盖。

Claims (10)

1.一种用于计算机体系架构中的用于通过或者减少或者增加作为资源被分配以满足特定云用户的当前计算需求的虚拟机实例的数量来周期性地缩放作为云计算环境中的资源来被分配的虚拟机实例的数量以满足所述特定云用户的计算需求的计算机实现的方法,所述计算机架构包括存储器,所述存储器包含在由一个或多个处理器执行时执行所述计算机实现的方法的计算机可执行指令,所述方法包括:
在所述计算机体系架构的存储器中存储时间周期,所述时间周期定义针对作为满足特定云用户的计算需求所需的资源来被分配的虚拟机实例的数量的自动缩放何时将被周期性地更新;
对于每一个时间周期,在所述一个或多个处理器处确定自动缩放更新以确定作为资源被分配的虚拟机实例的数量是否需要被增加或减少一缩放因子来满足所述特定用户的当前计算需求,其中所述自动缩放更新包括:
基于所述特定云用户的当前计算需求,确定每一个虚拟机实例的当前CPU使用率;
确定应当采取自动缩放动作以应用所述缩放因子以便添加或移除一个或多个虚拟机实例以处理所述特定云用户的当前计算需求,其中所确定的自动缩放动作以将不会导致虚拟机实例摇摆的方式来进行,所述摇摆因使虚拟机实例进入交替地移除并随后添加相同数量的虚拟机实例的不合乎需要的循环直到当前计算需求改变而导致;以及
基于所述自动缩放动作,通过如根据至少一个时间周期的更新所得到的自动缩放动作所确定的添加或移除一个或多个虚拟机实例来改变作为资源被分配以用于满足所述特定用户的当前需求的虚拟机实例的数量,来改变为所述特定用户的当前计算需求分配的资源。
2.如权利要求1所述的计算机实现的方法,其特征在于,确定应当以不会导致虚拟机实例摇摆的方式来采取自动缩放动作是由所述一个或多个处理器通过以下步骤来执行的:
访问所述存储器处的指定要在被分配来满足特定用户的计算需求的多个云资源上维持的至少一个目标运行度量的信息;
基于所述特定用户的当前计算需求,所述一个或多个处理器确定所述多个云资源中的至少一些的至少一个目标运行度量的当前测得值;
所述一个或多个处理器基于所述至少一个目标运行度量和所述当前测得值来计算所述缩放因子,所述缩放因子表示所述至少一个目标运行度量和所述当前测得值之间的差异量;
所述一个或多个处理器基于计算得到的缩放因子计算表示云资源的经修改的量的增量值;以及
所述一个或多个处理器基于计算得到的增量值确定是否要发生缩放动作。
3.如权利要求2所述的计算机实现的方法,其特征在于,多个目标运行度量被指定,所述目标运行度量中的至少一个的优先级高于至少一个其它目标运行度量。
4.如权利要求3所述的计算机实现的方法,其特征在于,为所述多个目标运行度量中的每一个计算所述缩放因子,并且其中基于优先次序来选择指定缩放因子。
5.如权利要求4所述的计算机实现的方法,其特征在于,所述指定缩放因子包括最大缩放因子,所述最大缩放因子表示所述目标运行度量和每一个目标运行度量的当前测得值之间的差异的最高量。
6.如权利要求1所述的计算机实现的方法,其特征在于,确定应当以不会导致虚拟机实例摇摆的方式来采取自动缩放动作是由所述一个或多个处理器通过以下步骤来执行的:
访问一个或多个自动缩放规则,所述自动缩放规则管控指定云资源集合要被如何缩放;
根据所述自动缩放规则中的至少一者标识第一候选自动缩放动作;
为所述指定云资源集合计算预计资源消耗量,所述预计量指示如果应用所述第一候选自动缩放规则的话将会发生的资源消耗量;以及
在确定所述预计资源消耗不会触发至少一个第二自动缩放规则之际,执行所述第一候选自动缩放动作。
7.如权利要求6所述的计算机实现的方法,其特征在于,所述第一自动缩放动作包括从所述指定云资源集合中移除至少一个虚拟机实例,并且所述第二自动缩放动作包括向所述指定云资源集合添加至少一个虚拟机实例。
8.如权利要求6所述的计算机实现的方法,其特征在于,所述自动缩放规则被实现为使扩展规则优先于缩减规则。
9.如权利要求1所述的计算机实现的方法,其特征在于,所述缩放动作包括增加或减小针对一个虚拟机实例的至少一个虚拟机的大小。
10.如权利要求1所述的计算机实现的方法,其特征在于,所述缩放动作包括添加或移除针对一个虚拟机实例的至少一个虚拟机。
CN201580017937.2A 2014-03-31 2015-03-26 缩放云资源时动态标识目标容量 Active CN106133696B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201461972706P 2014-03-31 2014-03-31
US61/972,706 2014-03-31
US14/307,745 US9722945B2 (en) 2014-03-31 2014-06-18 Dynamically identifying target capacity when scaling cloud resources
US14/307,745 2014-06-18
PCT/US2015/022604 WO2015153242A1 (en) 2014-03-31 2015-03-26 Dynamically identifying target capacity when scaling cloud resources

Publications (2)

Publication Number Publication Date
CN106133696A true CN106133696A (zh) 2016-11-16
CN106133696B CN106133696B (zh) 2019-05-14

Family

ID=54191963

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580017937.2A Active CN106133696B (zh) 2014-03-31 2015-03-26 缩放云资源时动态标识目标容量

Country Status (4)

Country Link
US (1) US9722945B2 (zh)
EP (1) EP3126975B1 (zh)
CN (1) CN106133696B (zh)
WO (1) WO2015153242A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108093062A (zh) * 2017-12-26 2018-05-29 北京星河星云信息技术有限公司 云资源管理方法及装置
WO2018188405A1 (zh) * 2017-04-11 2018-10-18 中兴通讯股份有限公司 云应用资源的配置方法及装置
CN110389817A (zh) * 2018-04-20 2019-10-29 伊姆西Ip控股有限责任公司 多云系统的调度方法、装置和计算机程序产品
CN111459649A (zh) * 2019-01-21 2020-07-28 伊姆西Ip控股有限责任公司 管理计算资源的存储器的方法、设备和计算机程序产品
CN111611084A (zh) * 2020-05-26 2020-09-01 杭州海康威视系统技术有限公司 一种流媒体服务实例调整方法、装置及电子设备

Families Citing this family (93)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9736065B2 (en) 2011-06-24 2017-08-15 Cisco Technology, Inc. Level of hierarchy in MST for traffic localization and load balancing
US8908698B2 (en) 2012-01-13 2014-12-09 Cisco Technology, Inc. System and method for managing site-to-site VPNs of a cloud managed network
US9043439B2 (en) 2013-03-14 2015-05-26 Cisco Technology, Inc. Method for streaming packet captures from network access devices to a cloud server over HTTP
GB2517195A (en) * 2013-08-15 2015-02-18 Ibm Computer system productivity monitoring
US9842039B2 (en) 2014-03-31 2017-12-12 Microsoft Technology Licensing, Llc Predictive load scaling for services
US20150286374A1 (en) * 2014-04-04 2015-10-08 Altia, Inc. Embedded System User Interface Design Validator
US9755858B2 (en) 2014-04-15 2017-09-05 Cisco Technology, Inc. Programmable infrastructure gateway for enabling hybrid cloud services in a network environment
US9473365B2 (en) 2014-05-08 2016-10-18 Cisco Technology, Inc. Collaborative inter-service scheduling of logical resources in cloud platforms
US10122605B2 (en) 2014-07-09 2018-11-06 Cisco Technology, Inc Annotation of network activity through different phases of execution
US11138537B2 (en) * 2014-09-17 2021-10-05 International Business Machines Corporation Data volume-based server hardware sizing using edge case analysis
US9825878B2 (en) 2014-09-26 2017-11-21 Cisco Technology, Inc. Distributed application framework for prioritizing network traffic using application priority awareness
US9513935B2 (en) 2014-10-28 2016-12-06 International Business Machines Corporation Auto-scaling thresholds in elastic computing environments
US11303539B2 (en) * 2014-12-05 2022-04-12 Accenture Global Services Limited Network component placement architecture
US10050862B2 (en) 2015-02-09 2018-08-14 Cisco Technology, Inc. Distributed application framework that uses network and application awareness for placing data
US9959148B2 (en) * 2015-02-11 2018-05-01 Wipro Limited Method and device for estimating optimal resources for server virtualization
US10037617B2 (en) 2015-02-27 2018-07-31 Cisco Technology, Inc. Enhanced user interface systems including dynamic context selection for cloud-based networks
US10708342B2 (en) 2015-02-27 2020-07-07 Cisco Technology, Inc. Dynamic troubleshooting workspaces for cloud and network management systems
WO2016155835A1 (en) * 2015-04-02 2016-10-06 Telefonaktiebolaget Lm Ericsson (Publ) Technique for scaling an application having a set of virtual machines
US10382534B1 (en) 2015-04-04 2019-08-13 Cisco Technology, Inc. Selective load balancing of network traffic
US9848041B2 (en) 2015-05-01 2017-12-19 Amazon Technologies, Inc. Automatic scaling of resource instance groups within compute clusters
US10476982B2 (en) 2015-05-15 2019-11-12 Cisco Technology, Inc. Multi-datacenter message queue
US10034201B2 (en) 2015-07-09 2018-07-24 Cisco Technology, Inc. Stateless load-balancing across multiple tunnels
US11005682B2 (en) 2015-10-06 2021-05-11 Cisco Technology, Inc. Policy-driven switch overlay bypass in a hybrid cloud network environment
US10067780B2 (en) 2015-10-06 2018-09-04 Cisco Technology, Inc. Performance-based public cloud selection for a hybrid cloud environment
US10462136B2 (en) 2015-10-13 2019-10-29 Cisco Technology, Inc. Hybrid cloud security groups
US10523657B2 (en) 2015-11-16 2019-12-31 Cisco Technology, Inc. Endpoint privacy preservation with cloud conferencing
US10205677B2 (en) 2015-11-24 2019-02-12 Cisco Technology, Inc. Cloud resource placement optimization and migration execution in federated clouds
US10084703B2 (en) 2015-12-04 2018-09-25 Cisco Technology, Inc. Infrastructure-exclusive service forwarding
CN106933673B (zh) * 2015-12-30 2020-11-27 阿里巴巴集团控股有限公司 调整组件逻辑线程数量的方法及装置
US10367914B2 (en) 2016-01-12 2019-07-30 Cisco Technology, Inc. Attaching service level agreements to application containers and enabling service assurance
EP3338410A4 (en) * 2016-01-18 2018-08-01 Huawei Technologies Co., Ltd. System and method for cloud workload provisioning
US9940156B2 (en) * 2016-01-29 2018-04-10 Lenovo Enterprise Solutions (Singapore) Pte. Ltd. Decreasing hardware resource amount assigned to virtual machine as utilization of hardware resource decreases below a threshold
US10135712B2 (en) 2016-04-07 2018-11-20 At&T Intellectual Property I, L.P. Auto-scaling software-defined monitoring platform for software-defined networking service assurance
US10250456B2 (en) 2016-05-17 2019-04-02 Microsoft Technology Licensing, Llc Operational management in cloud computing systems
US20170337275A1 (en) * 2016-05-17 2017-11-23 International Business Machines Corporation Allocating computing resources
US10129177B2 (en) 2016-05-23 2018-11-13 Cisco Technology, Inc. Inter-cloud broker for hybrid cloud networks
WO2017214986A1 (zh) * 2016-06-17 2017-12-21 华为技术有限公司 一种云应用伸缩方法及装置
US20180013636A1 (en) * 2016-07-07 2018-01-11 Cisco Technology, Inc. System and method for scaling application containers in cloud environments
US10659283B2 (en) 2016-07-08 2020-05-19 Cisco Technology, Inc. Reducing ARP/ND flooding in cloud environment
CN106227578A (zh) * 2016-07-12 2016-12-14 腾讯科技(深圳)有限公司 一种虚拟机热迁移的方法、设备及系统
US10432532B2 (en) 2016-07-12 2019-10-01 Cisco Technology, Inc. Dynamically pinning micro-service to uplink port
US10263898B2 (en) 2016-07-20 2019-04-16 Cisco Technology, Inc. System and method for implementing universal cloud classification (UCC) as a service (UCCaaS)
US10382597B2 (en) 2016-07-20 2019-08-13 Cisco Technology, Inc. System and method for transport-layer level identification and isolation of container traffic
US10142346B2 (en) 2016-07-28 2018-11-27 Cisco Technology, Inc. Extension of a private cloud end-point group to a public cloud
US9996915B2 (en) 2016-08-04 2018-06-12 Altia, Inc. Automated forensic artifact reconstruction and replay of captured and recorded display interface streams
US10567344B2 (en) 2016-08-23 2020-02-18 Cisco Technology, Inc. Automatic firewall configuration based on aggregated cloud managed information
US10157083B2 (en) 2016-09-14 2018-12-18 Microsoft Technology Licensing, Llc Outage detection and compute resource protection in a computer service environment
US10411969B2 (en) * 2016-10-03 2019-09-10 Microsoft Technology Licensing, Llc Backend resource costs for online service offerings
US10523592B2 (en) 2016-10-10 2019-12-31 Cisco Technology, Inc. Orchestration system for migrating user data and services based on user information
US11044162B2 (en) 2016-12-06 2021-06-22 Cisco Technology, Inc. Orchestration of cloud and fog interactions
US10326817B2 (en) 2016-12-20 2019-06-18 Cisco Technology, Inc. System and method for quality-aware recording in large scale collaborate clouds
US10334029B2 (en) 2017-01-10 2019-06-25 Cisco Technology, Inc. Forming neighborhood groups from disperse cloud providers
US10552191B2 (en) 2017-01-26 2020-02-04 Cisco Technology, Inc. Distributed hybrid cloud orchestration model
US10320683B2 (en) 2017-01-30 2019-06-11 Cisco Technology, Inc. Reliable load-balancer using segment routing and real-time application monitoring
US10671571B2 (en) 2017-01-31 2020-06-02 Cisco Technology, Inc. Fast network performance in containerized environments for network function virtualization
EP3580894A1 (en) * 2017-02-10 2019-12-18 Intel IP Corporation Systems, methods and devices for virtual resource metric management
US10834182B2 (en) 2017-03-29 2020-11-10 International Business Machines Corporation Managing idle and active servers in cloud data centers
US11005731B2 (en) 2017-04-05 2021-05-11 Cisco Technology, Inc. Estimating model parameters for automatic deployment of scalable micro services
US10547672B2 (en) * 2017-04-27 2020-01-28 Microsoft Technology Licensing, Llc Anti-flapping system for autoscaling resources in cloud networks
US10567232B2 (en) 2017-05-19 2020-02-18 Microsoft Technology Licensing, Llc System and method for mapping a connectivity state of a network
US11124046B2 (en) 2017-05-24 2021-09-21 Mitsubishi Electric Corporation System for adjusting secured computer resources to handle data transmission from appliances mounted in a vehicle
US10439877B2 (en) 2017-06-26 2019-10-08 Cisco Technology, Inc. Systems and methods for enabling wide area multicast domain name system
US10382274B2 (en) 2017-06-26 2019-08-13 Cisco Technology, Inc. System and method for wide area zero-configuration network auto configuration
US10585707B2 (en) 2017-06-27 2020-03-10 International Business Machines Corporation Database resource scaling
US10567359B2 (en) * 2017-07-18 2020-02-18 International Business Machines Corporation Cluster of secure execution platforms
US10425288B2 (en) 2017-07-21 2019-09-24 Cisco Technology, Inc. Container telemetry in data center environments with blade servers and switches
US10892940B2 (en) 2017-07-21 2021-01-12 Cisco Technology, Inc. Scalable statistics and analytics mechanisms in cloud networking
US10601693B2 (en) 2017-07-24 2020-03-24 Cisco Technology, Inc. System and method for providing scalable flow monitoring in a data center fabric
US10541866B2 (en) 2017-07-25 2020-01-21 Cisco Technology, Inc. Detecting and resolving multicast traffic performance issues
US10353800B2 (en) 2017-10-18 2019-07-16 Cisco Technology, Inc. System and method for graph based monitoring and management of distributed systems
US11481362B2 (en) 2017-11-13 2022-10-25 Cisco Technology, Inc. Using persistent memory to enable restartability of bulk load transactions in cloud databases
US10705882B2 (en) 2017-12-21 2020-07-07 Cisco Technology, Inc. System and method for resource placement across clouds for data intensive workloads
US11595474B2 (en) 2017-12-28 2023-02-28 Cisco Technology, Inc. Accelerating data replication using multicast and non-volatile memory enabled nodes
US10511534B2 (en) 2018-04-06 2019-12-17 Cisco Technology, Inc. Stateless distributed load-balancing
EP3557418B1 (en) * 2018-04-17 2022-03-16 Nokia Solutions and Networks Oy Resource management of resource-controlled system
US10728361B2 (en) 2018-05-29 2020-07-28 Cisco Technology, Inc. System for association of customer information across subscribers
US11321139B2 (en) * 2018-05-31 2022-05-03 Salesforce.Com, Inc. Streaming traffic pattern for public cloud auto scaling
US10904303B2 (en) 2018-05-31 2021-01-26 Salesforce.Com, Inc. Control message from streaming source to facilitate scaling
US10904322B2 (en) 2018-06-15 2021-01-26 Cisco Technology, Inc. Systems and methods for scaling down cloud-based servers handling secure connections
US10764266B2 (en) 2018-06-19 2020-09-01 Cisco Technology, Inc. Distributed authentication and authorization for rapid scaling of containerized services
US11019083B2 (en) 2018-06-20 2021-05-25 Cisco Technology, Inc. System for coordinating distributed website analysis
US10819571B2 (en) 2018-06-29 2020-10-27 Cisco Technology, Inc. Network traffic optimization using in-situ notification system
US10904342B2 (en) 2018-07-30 2021-01-26 Cisco Technology, Inc. Container networking using communication tunnels
US11379254B1 (en) * 2018-11-18 2022-07-05 Pure Storage, Inc. Dynamic configuration of a cloud-based storage system
US11340947B2 (en) * 2018-12-11 2022-05-24 Palantir Technologies Inc. Systems and methods for autoscaling instance groups of computing platforms
US11121943B2 (en) * 2018-12-13 2021-09-14 Sap Se Amplifying scaling elasticity of microservice meshes
US10826789B2 (en) * 2018-12-27 2020-11-03 At&T Intellectual Property I, L.P. Adjusting triggers for automatic scaling of virtual network functions
US11113120B1 (en) * 2019-05-08 2021-09-07 Amazon Technologies, Inc. Intent-based auto scaling of virtual computing resources
US11228643B2 (en) * 2019-06-04 2022-01-18 Capital One Services, Llc System and method for fast application auto-scaling
EP3832464A1 (en) * 2019-12-06 2021-06-09 Tata Consultancy Services Limited System and method for selection of cloud service providers in a multi-cloud
US20220188295A1 (en) * 2020-12-14 2022-06-16 International Business Machines Corporation Dynamic management of blockchain resources
CN113434256B (zh) * 2021-07-05 2023-06-30 云宏信息科技股份有限公司 一种云资源横向扩展方法、可读存储介质
US11868802B2 (en) 2021-07-09 2024-01-09 Red Hat, Inc. Application lifecycle management based on real-time resource usage

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110099403A1 (en) * 2009-10-26 2011-04-28 Hitachi, Ltd. Server management apparatus and server management method
US20120254443A1 (en) * 2011-03-30 2012-10-04 International Business Machines Corporation Information processing system, information processing apparatus, method of scaling, program, and recording medium
CN103430150A (zh) * 2010-11-22 2013-12-04 瑞典爱立信有限公司 在云计算系统中创建资源的技术

Family Cites Families (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4071668B2 (ja) 2003-04-16 2008-04-02 富士通株式会社 システムの使用資源を調整する装置および方法
US7877754B2 (en) 2003-08-21 2011-01-25 International Business Machines Corporation Methods, systems, and media to expand resources available to a logical partition
US7072805B2 (en) 2003-10-17 2006-07-04 International Business Machines Corporation Mechanism for on-line prediction of future performance measurements in a computer system
US8589549B1 (en) 2005-06-21 2013-11-19 Amazon Technologies, Inc. Method and system for customer incentive-based management of computing resource utilization
US7743001B1 (en) 2005-06-21 2010-06-22 Amazon Technologies, Inc. Method and system for dynamic pricing of web services utilization
US20080172671A1 (en) 2007-01-11 2008-07-17 International Business Machines Corporation Method and system for efficient management of resource utilization data in on-demand computing
US8380880B2 (en) 2007-02-02 2013-02-19 The Mathworks, Inc. Scalable architecture
US9207984B2 (en) 2009-03-31 2015-12-08 Amazon Technologies, Inc. Monitoring and automatic scaling of data volumes
US8296434B1 (en) 2009-05-28 2012-10-23 Amazon Technologies, Inc. Providing dynamically scaling computing load balancing
US8140668B2 (en) 2009-06-24 2012-03-20 Red Hat Israel, Ltd. Pre-scheduling the timelines of virtual machines
US20110078303A1 (en) 2009-09-30 2011-03-31 Alcatel-Lucent Usa Inc. Dynamic load balancing and scaling of allocated cloud resources in an enterprise network
US8806501B2 (en) 2010-03-31 2014-08-12 International Business Machines Corporation Predictive dynamic system scheduling
US8572612B2 (en) 2010-04-14 2013-10-29 International Business Machines Corporation Autonomic scaling of virtual machines in a cloud computing environment
US8627426B2 (en) 2010-04-26 2014-01-07 Vmware, Inc. Cloud platform architecture
US8606897B2 (en) 2010-05-28 2013-12-10 Red Hat, Inc. Systems and methods for exporting usage history data as input to a management platform of a target cloud-based network
JP5653151B2 (ja) * 2010-09-17 2015-01-14 キヤノン株式会社 クラウドコンピューティングシステム、クラウドコンピューティングシステムの制御方法、および管理アプリケーション
US8499066B1 (en) 2010-11-19 2013-07-30 Amazon Technologies, Inc. Predicting long-term computing resource usage
US20120173709A1 (en) 2011-01-05 2012-07-05 Li Li Seamless scaling of enterprise applications
US20120204186A1 (en) 2011-02-09 2012-08-09 International Business Machines Corporation Processor resource capacity management in an information handling system
US8978030B2 (en) 2011-04-07 2015-03-10 Infosys Limited Elastic provisioning of resources via distributed virtualization
US8661182B2 (en) * 2011-05-26 2014-02-25 Vmware, Inc. Capacity and load analysis using storage attributes
US8806003B2 (en) 2011-06-14 2014-08-12 International Business Machines Corporation Forecasting capacity available for processing workloads in a networked computing environment
US8997107B2 (en) 2011-06-28 2015-03-31 Microsoft Technology Licensing, Llc Elastic scaling for cloud-hosted batch applications
JP5342615B2 (ja) 2011-08-15 2013-11-13 株式会社日立システムズ 仮想サーバ制御システム及びプログラム
EP2764436A4 (en) 2011-10-04 2015-12-09 Tier 3 Inc PREDICTIVE TWO-DIMENSIONAL AUTOSCALING
US8756609B2 (en) 2011-12-30 2014-06-17 International Business Machines Corporation Dynamically scaling multi-tier applications vertically and horizontally in a cloud environment
US9110728B2 (en) * 2012-01-31 2015-08-18 Vmware, Inc. Elastic allocation of computing resources to software applications
US9069606B2 (en) 2012-05-08 2015-06-30 Adobe Systems Incorporated Autonomous application-level auto-scaling in a cloud
US8793381B2 (en) 2012-06-26 2014-07-29 International Business Machines Corporation Workload adaptive cloud computing resource allocation
US9306870B1 (en) 2012-06-28 2016-04-05 Amazon Technologies, Inc. Emulating circuit switching in cloud networking environments
US9858095B2 (en) * 2012-09-17 2018-01-02 International Business Machines Corporation Dynamic virtual machine resizing in a cloud computing infrastructure
IN2015DN02823A (zh) 2012-09-20 2015-09-11 Amazon Tech Inc
US9323577B2 (en) 2012-09-20 2016-04-26 Amazon Technologies, Inc. Automated profiling of resource usage
US9363154B2 (en) * 2012-09-26 2016-06-07 International Business Machines Corporaion Prediction-based provisioning planning for cloud environments
US9251115B2 (en) * 2013-03-07 2016-02-02 Citrix Systems, Inc. Dynamic configuration in cloud computing environments
US9081622B2 (en) * 2013-05-13 2015-07-14 Vmware, Inc. Automated scaling of applications in virtual data centers
TW201447763A (zh) * 2013-06-06 2014-12-16 Hon Hai Prec Ind Co Ltd 虛擬主機控制系統及方法
US9292354B2 (en) * 2013-10-18 2016-03-22 Microsoft Technology Licensing, Llc Self-adjusting framework for managing device capacity
US10552745B2 (en) 2013-10-18 2020-02-04 Netflix, Inc. Predictive auto scaling engine
US9842039B2 (en) 2014-03-31 2017-12-12 Microsoft Technology Licensing, Llc Predictive load scaling for services

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110099403A1 (en) * 2009-10-26 2011-04-28 Hitachi, Ltd. Server management apparatus and server management method
CN103430150A (zh) * 2010-11-22 2013-12-04 瑞典爱立信有限公司 在云计算系统中创建资源的技术
US20120254443A1 (en) * 2011-03-30 2012-10-04 International Business Machines Corporation Information processing system, information processing apparatus, method of scaling, program, and recording medium

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018188405A1 (zh) * 2017-04-11 2018-10-18 中兴通讯股份有限公司 云应用资源的配置方法及装置
CN108696556A (zh) * 2017-04-11 2018-10-23 中兴通讯股份有限公司 云应用资源的配置方法及装置
CN108093062A (zh) * 2017-12-26 2018-05-29 北京星河星云信息技术有限公司 云资源管理方法及装置
CN108093062B (zh) * 2017-12-26 2021-01-26 北京微网通联股份有限公司 云资源管理方法及装置
CN110389817A (zh) * 2018-04-20 2019-10-29 伊姆西Ip控股有限责任公司 多云系统的调度方法、装置和计算机程序产品
CN110389817B (zh) * 2018-04-20 2023-05-23 伊姆西Ip控股有限责任公司 多云系统的调度方法、装置和计算机可读介质
CN111459649A (zh) * 2019-01-21 2020-07-28 伊姆西Ip控股有限责任公司 管理计算资源的存储器的方法、设备和计算机程序产品
CN111459649B (zh) * 2019-01-21 2023-08-25 伊姆西Ip控股有限责任公司 管理计算资源的存储器的方法、设备和计算机可读介质
CN111611084A (zh) * 2020-05-26 2020-09-01 杭州海康威视系统技术有限公司 一种流媒体服务实例调整方法、装置及电子设备

Also Published As

Publication number Publication date
CN106133696B (zh) 2019-05-14
WO2015153242A1 (en) 2015-10-08
US20150281113A1 (en) 2015-10-01
US9722945B2 (en) 2017-08-01
EP3126975A1 (en) 2017-02-08
EP3126975B1 (en) 2019-03-06

Similar Documents

Publication Publication Date Title
CN106133696A (zh) 缩放云资源时动态标识目标容量
CN108009016B (zh) 一种资源负载均衡控制方法及集群调度器
Heilig et al. A cloud brokerage approach for solving the resource management problem in multi-cloud environments
Li et al. Cost-optimal cloud service placement under dynamic pricing schemes
Andrikopoulos et al. Supporting the migration of applications to the cloud through a decision support system
CN108833580A (zh) 一种云数据处理方法、装置及云计算系统
CN105912396A (zh) 用于动态地分配可配置计算资源的资源的技术
Kang et al. Cost adaptive workflow scheduling in cloud computing
Kochovski et al. Formal quality of service assurances, ranking and verification of cloud deployment options with a probabilistic model checking method
CN109542512A (zh) 一种数据处理方法、装置和存储介质
Sheeja et al. Cost effective load balancing based on honey bee behaviour in cloud environment
CN109189572B (zh) 一种资源预估方法及系统、电子设备和存储介质
CN111859027A (zh) 图计算方法及装置
de C. Coutinho et al. Optimization of a cloud resource management problem from a consumer perspective
CN113037800A (zh) 作业调度方法以及作业调度装置
Thai et al. Budget constrained execution of multiple bag-of-tasks applications on the cloud
US20150089501A1 (en) Systems and methods for colocating virtual machines on one or more physical infrastructure
Kumar et al. Application of Min-min and Max-min algorithm for task scheduling in cloud environment under time shared and space shared vm models
Thai et al. Task scheduling on the cloud with hard constraints
Koehler et al. Design of an adaptive framework for utility-based optimization of scientific applications in the cloud
Naskos et al. Cost-aware horizontal scaling of NoSQL databases using probabilistic model checking
CN106598699B (zh) 一种虚拟机的管理方法及装置
Roy et al. Multi-cloud scenario based QoS enhancing virtual resource brokering
CN114466014B (zh) 一种服务调度方法、装置、电子设备及存储介质
Rawat et al. Quality of service evaluation of SaaS modeler (Cloudlet) running on virtual cloud computing environment using CloudSim

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant