CN106164864A - 服务的预测负载伸缩 - Google Patents

服务的预测负载伸缩 Download PDF

Info

Publication number
CN106164864A
CN106164864A CN201580017765.9A CN201580017765A CN106164864A CN 106164864 A CN106164864 A CN 106164864A CN 201580017765 A CN201580017765 A CN 201580017765A CN 106164864 A CN106164864 A CN 106164864A
Authority
CN
China
Prior art keywords
time period
measurement
operational readiness
computer
cloud resource
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201580017765.9A
Other languages
English (en)
Other versions
CN106164864B (zh
Inventor
S·西西里阿诺
C·拉曼纳
I·格雷伯诺夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Technology Licensing LLC
Original Assignee
Microsoft Technology Licensing LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Technology Licensing LLC filed Critical Microsoft Technology Licensing LLC
Publication of CN106164864A publication Critical patent/CN106164864A/zh
Application granted granted Critical
Publication of CN106164864B publication Critical patent/CN106164864B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3034Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a storage system, e.g. DASD based or network based
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
    • G06F11/3419Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment by assessing time
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • G06F9/5072Grid computing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5083Techniques for rebalancing the load in a distributed system
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/147Network analysis or design for predicting network behaviour
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/50Network service management, e.g. ensuring proper service fulfilment according to agreements
    • H04L41/5041Network service management, e.g. ensuring proper service fulfilment according to agreements characterised by the time relationship between creation and deployment of a service
    • H04L41/5054Automatic deployment of services triggered by the service manager, e.g. service implementation by automatic configuration of network components
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/70Admission control; Resource allocation
    • H04L47/76Admission control; Resource allocation using dynamic resource allocation, e.g. in-call renegotiation requested by the user or requested by the network in response to changing network conditions
    • H04L47/762Admission control; Resource allocation using dynamic resource allocation, e.g. in-call renegotiation requested by the user or requested by the network in response to changing network conditions triggered by the network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/70Admission control; Resource allocation
    • H04L47/83Admission control; Resource allocation based on usage prediction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/4557Distribution of virtual machine instances; Migration and load balancing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/50Indexing scheme relating to G06F9/50
    • G06F2209/5019Workload prediction

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Computing Systems (AREA)
  • Computer Hardware Design (AREA)
  • Environmental & Geological Engineering (AREA)
  • Debugging And Monitoring (AREA)
  • Stored Programmes (AREA)

Abstract

各实施例涉及确定并发运行的云资源实例的最优数目,并提供示出预计的操作度量测量的交互界面。在一个场景中,计算机系统访问标识操作度量测量的度量信息,并且还访问标识各云资源实例在第二时间段内的操作度量测量的度量信息的第二部分。计算机系统随后基于标识出的在第一时间段内的操作度量测量(例如,用于反应性调谐)并进一步基于标识出的在第二时间段内的操作度量测量(例如,用于预测性调谐)来计算预计的操作度量测量。计算机系统随后基于预计的操作度量测量来确定在特定的将来时间点将并发运行的云资源实例的数目。

Description

服务的预测负载伸缩
背景
云服务被广泛用于提供许多类型的功能,包括托管应用,提供对数据存储的访问,提供网站、电子邮件或其他功能。云服务通常在可位于彼此远程的各计算机系统的网络上运行。计算机网络可被配置成使用各虚拟机来提供各种服务。这些服务可通过按需添加或移除虚拟机来伸缩。例如,在峰值负载的时间,可实例化附加虚拟机,而在降低负载的时间,可关闭各虚拟机。这些虚拟机通常以反应式形式(即,对当前负载作出反应)被调出或卸下,或者基于历史负载数据来管理。
简要概述
本文中描述的各实施例涉及确定并发运行的云资源实例的最优数目,并提供示出预计的操作度量测量的交互界面。在一个实施例中,计算机系统访问标识各云资源实例在当前时间之前的第一时间段内的操作度量测量的度量信息。计算机系统随后访问标识各云资源实例在第二时间段内的操作度量测量的度量信息的第二部分,其中第二时间段是在过去发生但对应于指定的将来时间段的时间段。计算机系统随后基于在第一时间段内标识出的操作度量测量(例如,用于反应性调谐)并进一步基于在第二时间段内标识出的操作度量测量(例如,用于预测性调谐)来计算预计的操作度量测量。计算机系统随后基于预计的操作度量测量来确定在指定的将来时间点将并发运行的云资源实例的数目。
在另一实施例中,计算机系统提供示出预计的操作度量测量的交互界面。计算机系统访问在指定的时间段内的操作度量测量数据。计算机系统基于所访问的操作度量测量来计算预计的操作度量测量,并基于预计的操作度量测量来确定在指定的将来时间点将并发运行的云资源实例的数目。计算机系统随后提供一交互界面,该交互界面显示所确定的在指定的时间点将并发运行的云资源实例的数目。交互界面还允许改变操作度量设置以及动态地更新并发运行的云资源实例的所确定的数目的输入。
提供本概述以便以简化的形式介绍以下在详细描述中进一步描述的一些概念。本概述并非旨在标识出要求保护的主题的关键特征或必要特征,亦非旨在用作辅助确定要求保护的主题的范围。
本发明的附加特征和优点将在以下描述中叙述,且其一部分根据本描述对本领域的技术人员将是显而易见的,或可通过对此处的原理的实践来获知。此处所描述的各实施例的特征和优点可通过在所附权利要求书中特别指出的工具和组合来实现和获得。通过下列描述以及所附的权利要求,,此处所描述的各实施例的特征将变得更加显而易见。
附图简述
为进一步阐明此处所描述的各实施例的上述及其它特征,将参考附图,呈现更具体的描述。应该理解,这些附图只描述了此处所描述的各实施例的示例,因此,不应该被视为限制其范围。将通过使用附图并利用附加特征和细节来描述和解释各实施例,在附图中:
图1示出其中可操作本文中描述的各实施例(包括确定并发运行的云资源实例的最优数目)的计算机体系结构。
图2示出用于确定并发运行的云资源实例的最优数目的示例方法的流程图。
图3示出用于提供示出预计的操作度量测量的交互界面的示例方法的流程图。
图4示出用于扩展评估的时间窗口的实施例。
图5示出显示预计的实例计数的交互界面的实施例。
图6示出显示影响预览的交互界面的实施例。
详细描述
本文中描述的各实施例涉及确定并发运行的云资源实例的最优数目,并提供示出预计的操作度量测量的交互式界面。在一个实施例中,计算机系统访问标识各云资源实例在当前时间之前的第一时间段内的操作度量测量的度量信息。计算机系统随后访问标识各云资源实例在第二时间段内的操作度量测量的度量信息的第二部分,其中第二时间段是在过去发生但对应于指定的将来时间段的时间段。计算机系统随后基于在第一时间段内标识出的操作度量测量(例如,用于反应性调谐)并进一步基于在第二时间段内标识出的操作度量测量(例如,用于预测性调谐)来计算预计的操作度量测量。计算机系统随后基于预计的操作度量测量来确定在指定的将来时间点将并发运行的云资源实例的数目。
在另一实施例中,计算机系统提供示出预计的操作度量测量的交互界面。计算机系统访问在指定的时间段内的操作度量测量数据。计算机系统基于所访问的操作度量测量来计算预计的操作度量测量,并基于预计的操作度量测量来确定在指定的将来时间点将并发运行的云资源实例的数目。计算机系统随后提供一交互界面,该交互界面显示所确定的在指定的时间点将并发运行的云资源实例的数目。交互界面还允许改变操作度量设置以及动态地更新并发运行的云资源实例的所确定的数目的输入。
下面的讨论现在涉及可被执行的多个方法和方法动作。值得注意的是,虽然可以以某一顺序讨论或在流程图中按特定顺序发生而示出了方法动作,但是,没有特定顺序是一定需要的,除非特别声明,或者是必需的,因为在一个动作被执行之前该动作取决于另一动作被完成。
本文中描述的实施例可实现各种类型的计算系统。这些计算系统现在越来越多地采取多种多样的形式。例如,计算系统可以是手持式设备、电器、膝上型计算机、台式计算机、大型机、分布式计算系统或甚至常规上不被认为是计算系统的设备。在本说明书以及权利要求书中,术语“计算系统”被广义地定义为包括任何设备或系统(或其组合),该设备或系统包含至少一个物理且有形的处理器以及其上能具有可由处理器执行的计算机可执行指令的物理且有形的存储器。计算系统可以分布在网络环境中,并可包括多个组分计算系统。
如图1所示,计算系统101通常包括至少一个处理单元102和存储器103。存储器103可以是物理系统存储器,该物理系统存储器可以是易失性的、非易失性的、或两者的某种组合。术语“存储器”也可在此用来指示诸如物理存储介质这样的非易失性大容量存储器。如果计算系统是分布式的,则处理、存储器和/或存储能力也可以是分布式的。
如本文中所使用的,术语“可执行模块”或“可执行组件”可以指可以在计算系统上执行的软件对象、例程或方法。此处所描述的不同组件、模块、引擎以及服务可以实现为在计算系统上执行的对象或进程(例如,作为分开的线程)。
在随后的描述中,参考由一个或多个计算系统执行的动作描述了各实施例。如果这样的动作是以软件实现的,则执行动作的相关联计算系统的一个或多个处理器响应于已经执行了计算机可执行指令来引导计算系统的操作。例如,这样的计算机可执行指令可以在形成计算机程序产品的一个或多个计算机可读介质上实现。这样的操作的示例涉及对数据的操纵。计算机可执行指令(以及被操纵的数据)可以存储在计算系统101的存储器103中。计算系统101还可包含允许计算系统101通过有线或无线网络与其它消息处理器通信的通信信道。
在此描述的各实施例可包括或利用专用或通用计算机系统,该专用或通用计算机系统包括诸如例如一个或多个处理器和系统存储器等计算机硬件,如以下更详细讨论的。系统存储器可被包括在整体存储器103内。系统存储器还可被称为“主存储器”,并且包括可被至少一个处理单元102在存储器总线上被寻址的存储器位置,在这种情况下地址位置被声明在存储器总线自身上。系统存储器传统上是易失性的,但本文中描述的原理还应用于其中系统存储器部分或者甚至全部是非易失性的情况。
本发明范围内的各实施例也包括用于实现或存储计算机可执行指令和/或数据结构的实体及其它计算机可读介质。这样的计算机可读介质可以是可由通用或专用计算机系统访问的任何可用介质。存储计算机可执行指令和/或数据结构的计算机可读介质是计算机存储介质。承载计算机可执行指令和/或数据结构的计算机可读介质是传输介质。由此,作为示例而非限制,本发明的各实施例可包括至少两种显著不同的计算机可读介质:计算机存储介质和传输介质。
存储计算机可执行指令和/或数据结构的计算机存储介质是物理硬件存储介质。物理硬件存储介质包括计算机硬件,诸如RAM、ROM、EEPROM、固态驱动器(“SSD”)、闪存、相变存储器(“PCM”)、光盘存储、磁盘存储或其它磁存储设备、或可用于存储计算机可执行指令或数据结构形式的程序代码的任何其它硬件存储介质,其可由通用或专用计算机系统访问来实现本发明公开的功能。
传输介质可包括可用于携带计算机可执行指令或数据结构形式的程序代码并可由通用或专用计算机系统访问的网络和/或数据链路。“网络”被定义为使得电子数据能够在计算机系统和/或模块和/或其它电子设备之间传输的一个或多个数据链路。当信息通过网络或另一个通信连接(硬连线、无线、或者硬连线或无线的组合)传输或提供给计算机系统时,该计算机系统将该连接视为传输介质。上述的组合应当也被包括在计算机可读介质的范围内。
此外,在到达各种计算机系统组件之后,计算机可执行指令或数据结构形式的程序代码可从传输介质自动传输到计算机存储介质(或反之亦然)。例如,通过网络或数据链路接收到的计算机可执行指令或数据结构可以在网络接口模块(例如,“NIC”)内的RAM中被缓冲,然后最终被传输至计算机系统RAM和/或计算机系统处的较不易失性的计算机存储介质。因而,应当理解,计算机存储介质可被包括在还利用(或甚至主要利用)传输介质的计算机系统组件中。
计算机可执行指令例如包括,当在一个或多个处理器处执行时使通用计算机系统、专用计算机系统、或专用处理设备执行某一功能或某组功能的指令和数据。计算机可执行指令可以是例如二进制代码、诸如汇编语言之类的中间格式指令、或甚至源代码。
本领域的技术人员将理解,本文中描述的原理可以在具有许多类型的计算机系统配置的网络计算环境中实践,这些计算机系统配置包括个人计算机、台式计算机、膝上型计算机、消息处理器、手持式设备、多处理器系统、基于微处理器的或可编程消费电子设备、网络PC、小型计算机、大型计算机、移动电话、PDA、平板、寻呼机、路由器、交换机等等。本发明也可在其中通过网络链接(或者通过硬连线数据链路、无线数据链路,或者通过硬连线和无线数据链路的组合)的本地和远程计算机系统两者都执行任务的分布式系统环境中实施。如此,在分布式系统环境中,计算机系统可包括多个组成部分计算机系统。在分布式系统环境中,程序模块可以位于本地和远程存储器存储设备二者中。
本领域技术人员还将理解本发明可在云计算环境中实践。云计算环境可以是分布式的,但这不是必须的。在分布时,云计算环境可以国际性地分布在一个组织内,和/或具有跨多个组织拥有的组件。在该说明书和下面的权利要求书中,“云计算”被定义为用于允许对可配置计算资源(例如,网络、服务器、存储、应用和服务)的共享池的按需网络访问的模型。“云计算”的定义不限于可从这样的模型(在被合适地部署时)中获得的任何其它多个优点。
更进一步,此处所描述的系统架构可包括多个独立组件,每一组件都对作为整体的系统的功能有贡献。当开始考虑平台可伸缩性的问题时,此模块性允许提高灵活性,为此,提供各种优点。可以通过使用带有有限的功能范围的较小规模部件,比较轻松地管理系统复杂性和增长。通过使用这些松散耦合的模块,增强平台容错。随着业务需要规定,单个组件可以增量地增长。对于新的功能,模块化开发还转换为缩短的上市时间。可以添加或减去新功能,而不会影响核心系统。
图1示出了其中可以采用至少一个实施例的计算机架构100。计算机架构100包括计算机系统101。计算机系统101可以是包括云计算系统的任何类型的本地或分布式计算机系统。计算机系统101包括用于执行各种不同的功能的模块。例如,通信模块104可被配置成与其他计算系统通信。计算模块104可包括可从其他计算系统接收数据和/或向其他计算系统传送数据的任何有线或无线通信装置。通信模块104可被配置成与数据库、移动计算设备(诸如移动电话或平板设备)、嵌入式计算系统或其他类型的计算系统交互。
在一些实施例中,计算机系统101的通信模块104可被配置成接收来自数据库111的度量信息。数据库111可以是任何类型的本地或分布式数据库,并且存储在数据库内的数据可根据基本上任何开放或专用数据存储标准被存储。度量信息112可包括针对不同云资源的各种操作度量测量113。例如,度量信息可包括在某时间段内的中央处理单元(CPU)负载。这可以是通用CPU负载或专用于给定服务或虚拟机的托管的CPU负载。其他度量信息可与存储器、网络带宽、并发运行的虚拟机的数目、CPU内核的数目或任何其他云资源有关。这些云资源114可由计算机系统101随时间监视,并且通过该监视标识出的信息可作为度量信息112被存储。
计算机系统101的访问模块105可被配置成使用到数据库111的有线或无线连接(应注意,在一些情况下,数据库111可在计算机系统101本地)来访问度量信息。一旦度量信息112已被访问,计算机系统101的计算模块可计算预计的操作测量107。预计的值可以是对在将来的某个时间点将消耗什么CPU负载或其他资源的近似或预计。这样的预计可用于确定在给定的某天或某星期或某月等有多少硬件可用于伸缩。例如,许多网站在十一月和十二月的假期或其附近遭遇大量访客。在这样的情况下,可期望知道有多少硬件可用于扩展以能够处理用户的增加。在本文中的实施例中,该预计的操作测量107可基于在某些时间段内的过去负载。这将在以下进行更详细地解释。
计算机系统101的确定模块108可使用该预计的操作测量107来确定云操作实例114(其包括虚拟资源(例如,VM实例)和/或物理资源(例如,CPU或网络端口))的最优数目109。该确定的最优实例数109可被提供给实例化交互界面115的界面实例化模块110。交互界面115显示针对给定时间段的最优实例数109。用户116可能能够在具有其他设置(诸如管控将如何托管服务的设置)的上下文中查看实例数109。用户可与界面115交互以改变某些托管设置,并查看在这些托管设置被使用的情况下应当可用的云资源的经更新的预计107。通过这种方式,用户116可能能够对应用的托管设置作出虚拟改变,并查看在那些改变实际上被应用的情况下对现有云资源114的影响。
在本文中描述的一些实施例中,计算系统101被设计为确定在任何给定时间点用户116应当具有的云实例(例如,并发运行的虚拟机)的最优或理想数目。该确定可基于诸如每天模式(例如,该星期中的前几天在当天的类似时间可具有类似的负载)、每星期模式(例如,在前一星期的同一天和时间具有类似的负载特性)或每年模式(例如,可存在一些更宽泛的模式,诸如学年或节日季节)之类的已知循环模式,通过察看云资源上的负载的先前几个时间窗口(或许与给定服务有关)来作出。
随着关于最优云资源的确定被作出,在历史数据变得越来越旧时对该历史数据进行打折可能是有益的。在一个月之前的云资源或服务的负载可与上星期的负载非常不同。交互界面115可被配置成向用户116示出服务、应用、特定云资源、或其任意组合的性能的时间序列数据。该数据可包括托管服务的实例的数目,并可进一步包括关于服务或云资源的聚集负载。由此,不像典型度量,这不是跨所有云资源实例求平均,而是跨系统中的所有实例对负载度量求和或聚集负载度量。该数据进一步包括基于聚集负载、用户定义的托管设置和任何预测逻辑预计的实例计数(即,109)。
预计实例计数109可按多种方式使用。在用户116查看交互式界面115时,该交互界面115向其示出在给定时间点应当已完成什么伸缩。此外,随着用户116改变其服务的托管设置,用户可看见服务上将有的改变的实况预览,而无须提交并等待那些改变生效。该实况预览基于历史数据(即,该逻辑的预测方面),因为将来数据显然尚不可用。附加地,该信息连同新的用户定义的设置的总影响一起可被呈现给用户116作为聚集统计。
在一些实施例中,云资源实例114的最优数目可通过察看使用模式并具体地察看与每月或每日模式相对的每星期模式来确定或预测。这些每星期模式可能是最普通的模式,并且可跨所有(或大多数)服务通用。也就是说,相同的逻辑可被应用于不同的时间段(例如,每月或每年)。该时间段甚至可以是用户可自定义的,使得用户可选择用于查看云资源负载的特定小时、天、星期等。
如本文中所使用的,术语“自动伸缩”指基于当前需求自动扩展或收缩云资源(例如,当前运行以托管服务的VM的数目、或者托管服务的特定VM的尺寸)。在自动伸缩作业被发起时,它最初可察看前一小时的负载。这是自动伸缩的反应性方面,并且至少在一些情况下,通过察看最近一小时作出的扩展判定的优先级可被排定为在任何其他判定之上。这可被进行以侧重于更好的性能而不是成本节省,因为相比于成本节省方面的小差异,用户通常受坏性能的影响更大。
由此,如图4所示,在确定或预测将来使用时考虑的第一时间窗口可以是前一时间401。接着,系统可察看什么预计使用是针对下一小时的。这通过察看先前几星期中在接下来的60分钟内都发生了什么来计算,随着越往前退,折扣越增加。例如,如果当前时间为下午1点(402),则前一小时401将是中午到下午1点,而下一小时403将是一星期之前、两星期之前、三星期之前等下午1点和下午2点之间的使用。每一个前一星期可以以不同的级别被评级。例如,过去的一周可被加权0.5,两星期之前可被加权0.25,三星期之前可被加权0.125并以此类推。通过将这些值组合在一起,该系统可确定即将到来的小时的单个预计CPU值。如果云资源负载高于用户已定义的阈值,则扩展动作可发生。
接着,收缩条件可被评估。对于收缩,计算机系统101可被配置成仅察看前一小时(或其他时间增量)。这确保不会仅仅因为上星期的那个时间不存在负载而错误地收缩。在一个实施例中,该系统可仅在当前使用和历史使用两者都足够低的情况下才收缩。这是将性能保持为高并使性能相比于成本节省最优的更激进的方法。
在其他实施例中,可示出指示将会发生的什么事情使得自动伸缩特征被启用的时间线。最初,两个不同时间序列的数据可被存储:实例计数和自动伸缩状态。两者都可通过具有在特定时间增量(例如,每五分钟)发出该系统的状态的规律作业来完成。如图5的预计实例计数501中示出的,该信息可随后用于计算两条分开的线:经自动伸缩的实例计数和未经自动伸缩的实例计数。虚线在自动伸缩被关闭的情况下,对所有数据点都为零,并在自动伸缩打开的情况下,等于实例计数。另一条线(实线)相反:即在自动伸缩打开时,为零,并在自动伸缩关闭时,为实例计数。
聚集负载也基于从用户的系统报告的度量的时间序列数据。在一些实施例中,默认度量是CPU使用,但它可以是用户选择或定义的任何度量。存在两者类型的度量:百分数和绝对值。对于每一百分数数据点,该系统获取该聚集度量,并乘以在那个时间点运行的实例的数目。绝对值数据点被稍微不同地对待,因为它们不被标准化到特定阈值(例如,100%)。因此,在这样的情况下,该系统首先除以用户已定义的最大目标,并随后乘以实例数。预计的实例计数可通过在每一数据点处的实例计数上运行自动伸缩引擎来计算。例如,如果用户116已指示在CPU高于60%时他应当扩展,则预计实例计数将是聚集CPU负载除以0.6。由此,该线随着用户调整自动伸缩设置而改变。这允许用户预览新选项集合将对性能具有的影响,并示出应用这些设置的成本。
此外,交互界面115可被配置成向用户示出关于主动式自动伸缩的整体成功的经积累的统计数据。聚集统计数据可包括两个值:没有自动伸缩的成本和有自动伸缩的成本。没有自动伸缩的成本通过将未经自动伸缩的实例计数乘以虚拟机的每单位成本来计算。如果不存在针对非自动伸缩实例成本的数据点,则实例计数线的最大值被用于填充该数据。具有自动伸缩的成本通过将预计的实例计数乘以虚拟机的每单位成本来计算。下面将分别进一步参考图2和3的方法200和300来说明这些概念。
鉴于上文所描述的系统和架构,参考图2和3的流程图,将更好地理解可以根据所公开的主题实现的方法。为了简洁起见,作为一系列框示出和描述了方法。然而,应了解和明白,所要求保护的主题不受方框的顺序的限制,因为某些方框可以按不同的顺序进行,和/或与此处所描绘和描述的其它方框同时进行。此外,并非所有的所示出的方框都是实现下面所描述的方法所必需的。
图2示出了用于确定并发运行的云资源实例的最优数目的方法200的流程图。现在将频繁地参考环境100的组件以及数据来描述方法200。
方法200包括访问标识一个或多个云资源实例在当前时间之前的第一时间段内的操作度量测量的度量信息的第一部分的动作(动作210)。例如,计算机系统101的访问模块105可访问包括各云资源实例114的操作度量测量113的度量信息112。度量信息112可包括例如针对前一小时的度量信息。由此,如图4所示,度量信息可对应于在先前小时401内的CPU负载或其他测量。
方法200包括访问标识该一个或多个云资源实例在至少第二时间段内的操作度量测量的度量信息的第二部分的动作(动作220),该第二时间段包括在过去发生但对应于指定的将来时间段的时间段。计算机系统101的访问模块105可访问示出一个或多个云资源实例在一时间段内的操作特性的度量信息的另一部分112。该时间段可对应于在过去发生但对应于将来时间段的时段。由此,如果当前时间为4月8日星期二上午10点(例如,图4中的402),则前一小时(401)将会是上午9点到上午10点,而下一小时403将对应于从上午10点到上午11点的小时,但移位了一个星期(或者两个或三个星期)。由此,该时间段被称为已在过去(例如,4月1日星期二从上午10点到上午11点)发生,但对应于将来时间段4月8日星期二从上午10点到上午11点。
这第二一时间段可由用户选择或自定义。第二时间段(403)用于预测将来负载(或其他测量),而第一时间段(401)用于对于过去负载作出反应(在大多数情况下,在非常近的过去)。如所指示的,第二时间段可由用户116指定,并且可以是一天、一星期、一个月、一年、或某个其他指定时间范围(例如,一周末、六个月、一小时又十二分钟等等)。相比于较新的操作度量测量,较旧的操作度量测量可被较不激进地加权。由此,对应于在过去发生的时间但还与将来时间对应的第二时间段403可各自针对每一较旧的操作测量被较不激进地加权。由此,在一些实施例中,在计算预计的操作度量测量107时,在第一时间段401内标识出的那些操作度量测量113的优先级被排定在第二时间段403的标识出的操作度量测量之上。该优先级排定可导致托管服务的性能的优先级被排定在潜在成本节省之上,潜在成本节省可在某一数目的云资源(例如,VM)在自动伸缩操作中被收缩的情况下被实现。
方法200接着包括基于在第一时间段内标识出的操作度量测量并进一步基于在第二时间段内标识出的操作度量测量(预测性调谐)来计算一个或多个预计的操作度量测量的动作(动作230)。例如,计算机系统101的计算模块106可基于在第一时间段(例如401)内标识出的操作度量测量113(反应性调谐)并进一步基于在第二时间段(例如403)内标识出的操作度量测量(预测性调谐)来计算预计的操作度量测量107。在一些情况下,当前操作度量测量也可被纳入考虑(例如,在402)。在第一时间段(即,最近的过去)内的测量可用于反应性调谐或反应性自动伸缩,其扩展或收缩各云资源实例以匹配需求。如果需求在过去一小时内已经为高,则可能那个需求(至少在工作日期间)在下一小时内仍为高。类似地,如果需求已经为低,则多半可能(至少在晚上时间期间)下一小时将保持在低需求处。
然而,转变可更快速地发生,例如如果网站正提供午夜交易,则需求可从在先前的下午11点到上午12点内看见的负载大大改变。类似地,对于提供由工作者使用的应用的服务,话务可增加。需求在上午可显著上升,而在晚上在工作者回家时可显著下降。因此,计算模块106可不仅看新近的过去,而且还察看过去在下一小时(或其他时间范围)发生了什么(例如,一天前或一星期前在下一小时发生了什么)。通过这种方式,计算模块106可提供包括反应性测量和预测性测量在内的预计的操作测量107。
确定模块108可随后基于预计的操作度量测量107来确定在一个或多个指定的将来时间点将并发运行的云资源实例的数目109(动作240)。确定的实例数109可指定有多少虚拟机、或有多少CPU内核、或有多少网络端口、或有多少其他云资源实例114将运行,以处理在预计的操作测量107中预测的负载。预计的操作测量107可比其他方法更准确,因为它包括在第一时间段内标识出的操作度量测量(即,反应性测量)和在第二时间段内标识出的操作度量测量(即,预测性测量)。在一些情况下,在过去一个小时的测量(其可以是高的)和一个或两个星期之前的接下来的一小时的测量(其可指示负载将是低的)之间可存在冲突数据。在这样的情况下,云资源伸缩动作可给予在先前小时(401)内测量出的负载的尊重高于在更往前的时间段内测量出的负载的尊重。然而,至少在一些情况下,这可以是可配置的设置,并且用户或管理员可建立用于确定给予哪些测量尊重的策略。
如果确定模块108确定指定数目的虚拟机实例将并发运行,并且并发运行的虚拟机实例的数目(显著地)低于或高于所确定的数目109,则确定模块可触发自动伸缩动作。由此,如果所确定的实例数109为例如5,并且并发运行的VM实例的数目为8,则可发生将并发运行的VM实例的数目减少到5的自动伸缩动作。自动伸缩动作可包括添加或移除VM实例,并且随着被确定模块109确定并随着估计的操作测量107改变,可被重复执行。
在一些实施例中,虚拟机实例可仅在确定移除不会触发其他自动伸缩动作之际才被移除,从而防止摆动(其中一个自动伸缩规则指示各实例将被添加,并且一旦被添加,第二自动伸缩规则指示新添加的实例将被移除)。可实现指定防止自动伸缩动作移除VM实例的策略。这将健康的优先级排定在资源节省之上,因为即使在降低的负载的时间内,也不收缩VM实例。自动伸缩动作可进一步被配置成增加或减小一个或多个并发运行的虚拟机实例的尺寸,而不是使新实例断电或通电。增加尺寸可包括增加可用CPU、CPU内核、存储器、存储、联网容量的数目或增加其他资源的量。由计算模块106作出的预计可被显示在交互界面115中,如以下结合图3的方法300将进一步解释的。
图3示出用于提供示出预计的操作度量测量的交互界面的方法300的流程图。现在将频繁地参考环境100的组件以及数据来描述方法300。
方法300包括访问至少在一个时间段内的操作度量测量数据的一个或多个部分的动作(动作310)。例如,计算机系统101的访问模块105可访问包括一个或多个云资源在某时间段内的度量数据的操作度量测量数据113。计算机系统101的计算模块106可随后基于访问的操作度量测量来计算一个或多个预计的操作度量测量107(动作320)。在该计算中,反应性和/或预测性计算可被使用。确定模块108可随后基于预计的操作度量测量107来确定在一个或多个指定的将来时间点将并发运行的云资源实例的数目(动作330)。界面实例化模块110可随后实例化交互界面115,该交互界面1115显示在一个或多个指定的时间点将并发运行的云资源实例的所确定的数目109。交互界面进一步允许(例如,来自用户116的)改变操作度量托管或自动伸缩设置以及动态地更新并发运行的云资源实例的所确定的数目的输入(动作340)。
例如,如图6所示,用户可指定将发生的不同动作604或者在托管服务或以其他方式使用云资源时将维护的不同度量设置。用户可指定将为每一CPU维护的目标CPU负载范围601,或者可以指定目标队列602或在扩展或收缩之后要等待的时间。用户可使用开关605打开或关闭自动伸缩,并且可查看603处的预计的统计数据或测量。该统计数据可包括在自动伸缩打开和自动伸缩关闭时运行云资源的成本的指示。
交互界面还可示出指定时间段的历史操作度量测量数据(即,在那个时间范围期间实际上发生了什么),并且进一步示出对在该时间段期间自动伸缩已被应用的情况下将会并发运行的虚拟机实例的数目的指示(如图5所示,其中虚线示出自动伸缩被打开的情况下的数目,而实线示出实际测量)。因此,在图5中,可看出,在自动伸缩在下午6点到下午9点的时段之间已被打开的情况下,并发运行的实例的数目将会下降,从而导致成本节省。因此,用户可使用交互界面来查看实际上发生了什么、在自动伸缩被打开的情况下将发生什么、以及在某些设置被应用于(诸)云资源的情况下将发生什么。
在一些实施例中,交互界面115提供自动伸缩动作已基于所确定的将并发运行的虚拟机实例的数目被触发的指示。如以上所提出的,这些自动伸缩动作可在确定模块108确定某些数目的虚拟机实例109将并发运行时发生。如果比所确定的数目更多或更少的虚拟机实例正运行,则计算机系统101触发自动伸缩动作。每当这些自动伸缩动作之一发生时,可在交互界面115中通知用户116。如果例如自动伸缩动作发生得太频繁,则用户可使用该信息来改变设置。交互界面可进一步提供用于选择在自动伸缩动作期间移除哪些虚拟机实例的选项。可存在其中用户希望某些VM实例在收缩时被移除或者某些VM实例在扩展时被添加的情况。因此,用户可使用交互界面来作出这样的指定。还可提供允许用户为在自动伸缩动作期间将改变的那些虚拟机实例选择新尺寸的选项。
因此,提供了用于确定在任何给定时间点应当并发运行的云资源实例的最优数目的方法、系统和计算机程序产品。此外,提供了用于提供示出当前和预计的操作度量测量的交互界面的方法、系统和计算机程序产品。
此处所描述的概念和特征可以以其它特定形式实现,而不背离其精神或描述性的特征。所描述的实施例在所有方面都应被认为仅是说明性而非限制性的。从而,本发明的范围由所附权利要求书而非前述描述指示。落入权利要求书的等效方案的含义和范围内的所有改变应被权利要求书的范围所涵盖。

Claims (10)

1.一种在计算机架构中使用的计算机实现的方法,所述方法用于确定被分配为云计算环境中的资源以满足特定用户的计算需求的并发运行的虚拟机实例(VM实例)的最优数目,所述计算机架构包括数据库、一个或多个处理器以及包含计算机可执行指令的存储器,所述计算机可执行指令在被所述一个或多个处理器执行时,执行所述计算机实现的方法,所述方法包括:
访问所述数据库中标识一个或多个云资源实例在当前时间之前的第一时间段内的操作度量测量的度量信息的第一部分;
访问所述数据库中标识所述一个或多个云资源实例在至少第二时间段内的操作度量测量的度量信息的第二部分,所述第二时间段包括在过去发生但对应于指定的将来时间段的时间段;
所述一个或多个处理器执行从存储器检索到的计算机可执行指令以基于标识出的在所述第一时间段内的操作度量测量并进一步基于标识出的在所述第二时间段内的操作度量测量来计算一个或多个预计的操作度量测量;以及
所述一个或多个处理器执行从所述存储器检索到的计算机可执行指令以基于所述一个或多个预计的操作度量测量来确定在一个或多个指定的将来时间点将并发运行的云资源实例的数目。
2.如权利要求1所述的计算机实现的方法,其特征在于,在计算所述一个或多个预计的操作度量测量时,在所述第一时间段内标识出的操作度量测量的优先级被排定在所述第二时间段内标识出的操作度量测量之上。
3.如权利要求1所述的计算机实现的方法,其特征在于,所述第二时间段由用户指定,并且包括一天、一星期、一个月或一年中的至少一者。
4.如权利要求3所述的计算机实现的方法,其特征在于,相比于较新的操作度量测量,较旧的操作度量测量被更不激进地加权。
5.一种用于在计算机架构中实现一种方法的计算机程序产品,所述方法用于提供示出预计的操作度量测量的交互界面,所述计算机程序产品包括其上存储有计算机可执行指令的一个或多个计算机可读存储介质,所述指令在被计算系统的一个或多个处理器执行时,致使所述计算系统执行所述方法,所述方法包括:
从数据库访问在至少一个时间段内的操作度量测量数据的一个或多个部分;
一个或多个处理器执行从存储器检索到的计算机可执行指令以基于所访问的操作度量测量来计算一个或多个预计的操作度量测量;
所述一个或多个处理器执行从存储器检索到的计算机可执行指令以基于所述一个或多个预计的操作度量测量来确定在一个或多个指定的将来时间点将并发运行的云资源实例的数目;以及
提供所述交互界面,所述交互界面显示所确定的在所述一个或多个指定的时间点将并发运行的云资源实例的数目,所述交互界面进一步允许改变操作度量设置并动态地更新并发运行的云资源实例的所确定的数目的输入。
6.如权利要求5所述的计算机程序产品,其特征在于,所述交互界面示出针对一时间段的历史操作度量测量数据,以及对在所述时间段期间自动伸缩已被应用的情况下将会并发运行的虚拟机实例的数目的指示。
7.如权利要求6所述的计算机程序产品,其特征在于,所述交互界面进一步示出在所述时间段期间自动伸缩已被应用的情况下,针对所述时间段的成本节省。
8.一种计算机系统,包括下列各项:
一个或多个处理器;
系统存储器;
其上存储有计算机可执行指令的一个或多个计算机可读存储介质,所述计算机可执行指令在由所述一个或多个处理器执行时,致使所述计算系统执行一种用于确定并发运行的虚拟机实例的最优数目的方法,所述方法包括以下动作:
访问数据库中标识一个或多个云资源实例在当前时间之前的第一时间段内的操作度量测量的度量信息的第一部分;
访问所述数据库中标识所述一个或多个云资源实例在至少第二时间段内的操作度量测量的度量信息的第二部分,所述第二时间段包括在过去发生但对应于指定的将来时间段的时间段;
所述一个或多个处理器执行从存储器检索到的计算机可执行指令以基于在所述第一时间段内标识出的操作度量测量并进一步基于在所述第二时间段内标识出的操作度量测量来计算一个或多个预计的操作度量测量;以及
所述一个或多个处理器执行从所述存储器检索到的计算机可执行指令以基于所述一个或多个预计的操作度量测量来确定在一个或多个指定的将来时间点将并发运行的云资源实例的数目。
9.如权利要求8所述的计算机系统,其特征在于,如果并发运行的虚拟机实例的数目大于或小于所确定的数目,则确定将并发运行的虚拟机实例的数目触发自动伸缩动作。
10.如权利要求8所述的计算机系统,其特征在于,在确定第二不同的自动伸缩动作不会被触发之际,所述自动伸缩动作被自动执行。
CN201580017765.9A 2014-03-31 2015-03-26 服务的预测负载伸缩 Active CN106164864B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201461972703P 2014-03-31 2014-03-31
US61/972,703 2014-03-31
US14/307,759 US9842039B2 (en) 2014-03-31 2014-06-18 Predictive load scaling for services
US14/307,759 2014-06-18
PCT/US2015/022605 WO2015153243A1 (en) 2014-03-31 2015-03-26 Predictive load scaling for services

Publications (2)

Publication Number Publication Date
CN106164864A true CN106164864A (zh) 2016-11-23
CN106164864B CN106164864B (zh) 2020-03-10

Family

ID=54190548

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580017765.9A Active CN106164864B (zh) 2014-03-31 2015-03-26 服务的预测负载伸缩

Country Status (5)

Country Link
US (1) US9842039B2 (zh)
EP (1) EP3126976A1 (zh)
CN (1) CN106164864B (zh)
BR (1) BR112016020592A8 (zh)
WO (1) WO2015153243A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109446041A (zh) * 2018-09-25 2019-03-08 平安普惠企业管理有限公司 一种服务器压力预警方法、系统及终端设备
CN113190329A (zh) * 2021-05-24 2021-07-30 青岛聚看云科技有限公司 服务器及容器云集群资源自动伸缩的方法

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9722945B2 (en) 2014-03-31 2017-08-01 Microsoft Technology Licensing, Llc Dynamically identifying target capacity when scaling cloud resources
US10432699B2 (en) 2014-06-26 2019-10-01 Vmware, Inc. Crowd-sourced operational metric analysis of virtual appliances
JP6394455B2 (ja) * 2015-03-24 2018-09-26 富士通株式会社 情報処理システム、管理装置およびプログラム
US11283697B1 (en) 2015-03-24 2022-03-22 Vmware, Inc. Scalable real time metrics management
US10594562B1 (en) * 2015-08-25 2020-03-17 Vmware, Inc. Intelligent autoscale of services
US10097437B2 (en) * 2015-10-30 2018-10-09 Citrix Systems, Inc. Efficient management of virtualized session resources
US20170337275A1 (en) * 2016-05-17 2017-11-23 International Business Machines Corporation Allocating computing resources
US10411969B2 (en) * 2016-10-03 2019-09-10 Microsoft Technology Licensing, Llc Backend resource costs for online service offerings
US11277483B2 (en) * 2017-03-31 2022-03-15 Microsoft Technology Licensing, Llc Assessing user activity using dynamic windowed forecasting on historical usage
US10445208B2 (en) * 2017-06-23 2019-10-15 Microsoft Technology Licensing, Llc Tunable, efficient monitoring of capacity usage in distributed storage systems
US10445209B2 (en) * 2017-09-08 2019-10-15 Accenture Global Solutions Limited Prescriptive analytics based activation timetable stack for cloud computing resource scheduling
JP6962138B2 (ja) * 2017-11-06 2021-11-05 富士通株式会社 情報処理装置、情報処理システム及びプログラム
US10671621B2 (en) 2017-12-08 2020-06-02 Microsoft Technology Licensing, Llc Predictive scaling for cloud applications
US10922141B2 (en) 2017-12-11 2021-02-16 Accenture Global Solutions Limited Prescriptive analytics based committed compute reservation stack for cloud computing resource scheduling
US10719344B2 (en) * 2018-01-03 2020-07-21 Acceture Global Solutions Limited Prescriptive analytics based compute sizing correction stack for cloud computing resource scheduling
US10896069B2 (en) 2018-03-16 2021-01-19 Citrix Systems, Inc. Dynamically provisioning virtual machines from remote, multi-tier pool
US10621004B2 (en) * 2018-03-19 2020-04-14 Accenture Global Solutions Limited Resource control stack based system for multiple domain presentation of cloud computing resource control
US10819584B2 (en) * 2018-05-03 2020-10-27 Servicenow, Inc. System and method for performing actions based on future predicted metric values generated from time-series data
US10862774B2 (en) 2018-05-29 2020-12-08 Capital One Services, Llc Utilizing machine learning to proactively scale cloud instances in a cloud computing environment
EP3591526A1 (de) * 2018-07-05 2020-01-08 Siemens Aktiengesellschaft Verfahren zum skalieren einer applikation in einer platform as a service, paas, -plattform
WO2020086956A1 (en) 2018-10-26 2020-04-30 Vmware, Inc. Collecting samples hierarchically in a datacenter
FR3093842B1 (fr) * 2019-03-14 2021-09-10 Amadeus Procédé et système pour optimiser des groupements de machines virtuelles d’une plateforme informatique en nuage
US10459757B1 (en) 2019-05-13 2019-10-29 Accenture Global Solutions Limited Prescriptive cloud computing resource sizing based on multi-stream data sources
US11582120B2 (en) 2019-05-30 2023-02-14 Vmware, Inc. Partitioning health monitoring in a global server load balancing system
US11036608B2 (en) 2019-09-27 2021-06-15 Appnomic Systems Private Limited Identifying differences in resource usage across different versions of a software application
US11960913B2 (en) * 2021-03-16 2024-04-16 Nerdio, Inc. Systems and methods of auto-scaling a virtual desktop environment
US11811861B2 (en) 2021-05-17 2023-11-07 Vmware, Inc. Dynamically updating load balancing criteria
US11792155B2 (en) 2021-06-14 2023-10-17 Vmware, Inc. Method and apparatus for enhanced client persistence in multi-site GSLB deployments
US20230232195A1 (en) 2022-01-19 2023-07-20 Vmware, Inc. Collective scaling of applications

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1538297A (zh) * 2003-04-16 2004-10-20 ��ʿͨ��ʽ���� 用于调节系统资源的使用的装置及其方法
CN101695050A (zh) * 2009-10-19 2010-04-14 浪潮电子信息产业股份有限公司 一种基于网络流量自适应预测的动态负载均衡方法
US20100332643A1 (en) * 2009-06-24 2010-12-30 Red Hat Israel, Ltd. Pre-Scheduling the Timelines of Virtual Machines
CN102111284A (zh) * 2009-12-28 2011-06-29 北京亿阳信通软件研究院有限公司 电信业务量预测方法和装置
CN102711177A (zh) * 2012-04-26 2012-10-03 北京邮电大学 基于业务预测的负载均衡方法
US20130174146A1 (en) * 2011-12-30 2013-07-04 International Business Machines Corporation Dynamically scaling multi-tier applications in a cloud environment
US20130198319A1 (en) * 2012-01-31 2013-08-01 Vmware, Inc. Elastic allocation of computing resources to software applications
CN103299274A (zh) * 2011-01-11 2013-09-11 国际商业机器公司 确定运行图像的最佳计算环境
CN103425535A (zh) * 2013-06-05 2013-12-04 浙江大学 云环境下的敏捷弹性伸缩方法
CN103477323A (zh) * 2011-01-05 2013-12-25 阿尔卡特朗讯 企业应用的无缝缩放
CN103559089A (zh) * 2013-10-30 2014-02-05 南京邮电大学 一种基于服务等级协议约束的虚拟机需求预测实现方法
US20140082165A1 (en) * 2012-09-20 2014-03-20 Michael David Marr Automated profiling of resource usage

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7877754B2 (en) 2003-08-21 2011-01-25 International Business Machines Corporation Methods, systems, and media to expand resources available to a logical partition
US7072805B2 (en) 2003-10-17 2006-07-04 International Business Machines Corporation Mechanism for on-line prediction of future performance measurements in a computer system
US7743001B1 (en) * 2005-06-21 2010-06-22 Amazon Technologies, Inc. Method and system for dynamic pricing of web services utilization
US8589549B1 (en) * 2005-06-21 2013-11-19 Amazon Technologies, Inc. Method and system for customer incentive-based management of computing resource utilization
US20080172671A1 (en) * 2007-01-11 2008-07-17 International Business Machines Corporation Method and system for efficient management of resource utilization data in on-demand computing
US8380880B2 (en) * 2007-02-02 2013-02-19 The Mathworks, Inc. Scalable architecture
US9207984B2 (en) * 2009-03-31 2015-12-08 Amazon Technologies, Inc. Monitoring and automatic scaling of data volumes
US8296434B1 (en) 2009-05-28 2012-10-23 Amazon Technologies, Inc. Providing dynamically scaling computing load balancing
US20110078303A1 (en) 2009-09-30 2011-03-31 Alcatel-Lucent Usa Inc. Dynamic load balancing and scaling of allocated cloud resources in an enterprise network
JP5378946B2 (ja) 2009-10-26 2013-12-25 株式会社日立製作所 サーバ管理装置およびサーバ管理方法
US8806501B2 (en) * 2010-03-31 2014-08-12 International Business Machines Corporation Predictive dynamic system scheduling
US8572612B2 (en) 2010-04-14 2013-10-29 International Business Machines Corporation Autonomic scaling of virtual machines in a cloud computing environment
US8627426B2 (en) 2010-04-26 2014-01-07 Vmware, Inc. Cloud platform architecture
US8606897B2 (en) * 2010-05-28 2013-12-10 Red Hat, Inc. Systems and methods for exporting usage history data as input to a management platform of a target cloud-based network
US8499066B1 (en) 2010-11-19 2013-07-30 Amazon Technologies, Inc. Predicting long-term computing resource usage
US20120204186A1 (en) * 2011-02-09 2012-08-09 International Business Machines Corporation Processor resource capacity management in an information handling system
JP5843459B2 (ja) 2011-03-30 2016-01-13 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 情報処理システム、情報処理装置、スケーリング方法、プログラムおよび記録媒体
US8978030B2 (en) 2011-04-07 2015-03-10 Infosys Limited Elastic provisioning of resources via distributed virtualization
US8661182B2 (en) 2011-05-26 2014-02-25 Vmware, Inc. Capacity and load analysis using storage attributes
US8806003B2 (en) 2011-06-14 2014-08-12 International Business Machines Corporation Forecasting capacity available for processing workloads in a networked computing environment
US8997107B2 (en) 2011-06-28 2015-03-31 Microsoft Technology Licensing, Llc Elastic scaling for cloud-hosted batch applications
WO2013006157A1 (en) 2011-07-01 2013-01-10 Hewlett-Packard Development Company, L.P. Method of and system for managing computing resources
JP5342615B2 (ja) * 2011-08-15 2013-11-13 株式会社日立システムズ 仮想サーバ制御システム及びプログラム
US9329904B2 (en) 2011-10-04 2016-05-03 Tier 3, Inc. Predictive two-dimensional autoscaling
US9069606B2 (en) 2012-05-08 2015-06-30 Adobe Systems Incorporated Autonomous application-level auto-scaling in a cloud
US8793381B2 (en) 2012-06-26 2014-07-29 International Business Machines Corporation Workload adaptive cloud computing resource allocation
US9306870B1 (en) * 2012-06-28 2016-04-05 Amazon Technologies, Inc. Emulating circuit switching in cloud networking environments
JP6049887B2 (ja) 2012-09-20 2016-12-21 アマゾン テクノロジーズ インコーポレイテッド リソース使用の自動プロファイル化
US10552745B2 (en) * 2013-10-18 2020-02-04 Netflix, Inc. Predictive auto scaling engine
US9722945B2 (en) 2014-03-31 2017-08-01 Microsoft Technology Licensing, Llc Dynamically identifying target capacity when scaling cloud resources

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1538297A (zh) * 2003-04-16 2004-10-20 ��ʿͨ��ʽ���� 用于调节系统资源的使用的装置及其方法
US20100332643A1 (en) * 2009-06-24 2010-12-30 Red Hat Israel, Ltd. Pre-Scheduling the Timelines of Virtual Machines
CN101695050A (zh) * 2009-10-19 2010-04-14 浪潮电子信息产业股份有限公司 一种基于网络流量自适应预测的动态负载均衡方法
CN102111284A (zh) * 2009-12-28 2011-06-29 北京亿阳信通软件研究院有限公司 电信业务量预测方法和装置
CN103477323A (zh) * 2011-01-05 2013-12-25 阿尔卡特朗讯 企业应用的无缝缩放
CN103299274A (zh) * 2011-01-11 2013-09-11 国际商业机器公司 确定运行图像的最佳计算环境
US20130174146A1 (en) * 2011-12-30 2013-07-04 International Business Machines Corporation Dynamically scaling multi-tier applications in a cloud environment
US20130198319A1 (en) * 2012-01-31 2013-08-01 Vmware, Inc. Elastic allocation of computing resources to software applications
CN102711177A (zh) * 2012-04-26 2012-10-03 北京邮电大学 基于业务预测的负载均衡方法
US20140082165A1 (en) * 2012-09-20 2014-03-20 Michael David Marr Automated profiling of resource usage
CN103425535A (zh) * 2013-06-05 2013-12-04 浙江大学 云环境下的敏捷弹性伸缩方法
CN103559089A (zh) * 2013-10-30 2014-02-05 南京邮电大学 一种基于服务等级协议约束的虚拟机需求预测实现方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109446041A (zh) * 2018-09-25 2019-03-08 平安普惠企业管理有限公司 一种服务器压力预警方法、系统及终端设备
CN113190329A (zh) * 2021-05-24 2021-07-30 青岛聚看云科技有限公司 服务器及容器云集群资源自动伸缩的方法

Also Published As

Publication number Publication date
BR112016020592A8 (pt) 2021-06-15
US20150278061A1 (en) 2015-10-01
BR112016020592A2 (pt) 2017-08-15
US9842039B2 (en) 2017-12-12
CN106164864B (zh) 2020-03-10
EP3126976A1 (en) 2017-02-08
WO2015153243A1 (en) 2015-10-08

Similar Documents

Publication Publication Date Title
CN106164864A (zh) 服务的预测负载伸缩
US10897497B2 (en) Automated infrastructure updates in a cluster environment that includes containers
US9513967B2 (en) Data-aware workload scheduling and execution in heterogeneous environments
CN106133696B (zh) 缩放云资源时动态标识目标容量
CN205176828U (zh) 条件分支预测器逻辑单元
US9031826B2 (en) Method and apparatus for simulating operation in a data processing system
Caviglione et al. Deep reinforcement learning for multi-objective placement of virtual machines in cloud datacenters
US20150378807A1 (en) Predicting process failures using analytics
US10782949B2 (en) Risk aware application placement modeling and optimization in high turnover DevOps environments
US10558552B2 (en) Configurable code fingerprint
CN111047140A (zh) 一种处理方法、装置及设备
CN115098257A (zh) 一种资源调度方法、装置、设备以及存储介质
US11164086B2 (en) Real time ensemble scoring optimization
US9626293B2 (en) Single-thread cache miss rate estimation
US10423398B1 (en) Automated firmware settings management
US9471784B1 (en) Automated firmware settings verification
US20200371831A1 (en) Virtual network functions allocation in a datacenter
Nguyen Managing Cold-start in The Serverless Cloud with Temporal Convolutional Networks
US11568058B2 (en) Environmental risk management system
US20170061380A1 (en) Computerized system and method for controlling electronic distribution of compensation
US11397591B2 (en) Determining disorder in technological system architectures for computer systems
Jou The decision model of task allocation for constrained stochastic distributed systems
Souza et al. Maintenance Operations on Cloud, Edge, and IoT Environments: Taxonomy, Survey, and Research Challenges
CN110837937A (zh) 预测方法、装置、计算设备以及介质
CN116848536A (zh) 自动时间序列预测管线排序

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant