CN105007287B - 公共云资源动态配置方法及系统 - Google Patents

公共云资源动态配置方法及系统 Download PDF

Info

Publication number
CN105007287B
CN105007287B CN201410244947.7A CN201410244947A CN105007287B CN 105007287 B CN105007287 B CN 105007287B CN 201410244947 A CN201410244947 A CN 201410244947A CN 105007287 B CN105007287 B CN 105007287B
Authority
CN
China
Prior art keywords
server
region
rank
servers
extension
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410244947.7A
Other languages
English (en)
Other versions
CN105007287A (zh
Inventor
丁韦智
王濬哲
陈家旻
黄俊龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial Technology Research Institute ITRI
Original Assignee
Industrial Technology Research Institute ITRI
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial Technology Research Institute ITRI filed Critical Industrial Technology Research Institute ITRI
Publication of CN105007287A publication Critical patent/CN105007287A/zh
Application granted granted Critical
Publication of CN105007287B publication Critical patent/CN105007287B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • H04L67/1031Controlling of the operation of servers by a load balancer, e.g. adding or removing servers that serve requests
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/51Discovery or management thereof, e.g. service location protocol [SLP] or web services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5083Techniques for rebalancing the load in a distributed system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0283Price estimation or determination
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/50Network service management, e.g. ensuring proper service fulfilment according to agreements
    • H04L41/5041Network service management, e.g. ensuring proper service fulfilment according to agreements characterised by the time relationship between creation and deployment of a service
    • H04L41/5054Automatic deployment of services triggered by the service manager, e.g. service implementation by automatic configuration of network components
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/4557Distribution of virtual machine instances; Migration and load balancing

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Human Resources & Organizations (AREA)
  • General Engineering & Computer Science (AREA)
  • Marketing (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Educational Administration (AREA)
  • Computer And Data Communications (AREA)

Abstract

一种公共云资源动态配置方法及系统。根据一实施例,一种公共云资源动态配置方法中,藉由一负载监视器,取得一当前服务器配置,此当前服务器配置至少包括多台服务器的各服务器的身份信息,以及该多台服务器的各服务器的一当前连接数、一服务器级别、以及一所在区域;藉由一扩展与缩减引擎,判断该多台服务器中是否有符合至少一触发条件的至少一服务器,将符合该至少一触发条件的该至少一服务器加入一服务器候选者集合,以及接收一性价比信息,并且根据此服务器候选者集合,对至少一区域执行一服务器扩展或缩减程序。

Description

公共云资源动态配置方法及系统
技术领域
本公开涉及一种公共云(public cloud)资源动态配置方法及系统。
背景技术
网络直播服务如雨后春笋般发展,用户可以经由网络即时观赏影片直播,例如游戏类、娱乐类、新闻类、体育节目类、科技类等。随着普及的网络直播串流,即时串流服务需要大量且稳定的带宽。同侪网络的串流影音技术利用网络中各节点间互相分享数据的方法,来增加串流传输的效率。在同侪网络中,用户数目的波动、用户设备的不良、用户设备的带宽的不足、用户设备距离机房太远等因素,可能使得即时串流服务网提供的串流质量不稳定。结合服务器与同侪网络的架构利用分散式服务器提供稳定的串流输出来维持用户的观看质量。
随着普及的移动装置,例如手持式摄像装置,用户可以是串流提供者。不论是播放者或是观看者,都可以随时随地的播放与观看。此趋势下,串流平台对于服务器需求量的负担将不断增加,服务业者搭配公共云业者在公共云建置分散式服务器,利用服务器做为中继站(relay),来符合弹性化的需求。例如,预先评估使用网络直播服务的可容纳的最大上线人数,以及事先建立数量足够的虚拟机器(virtual Machines,VM)如云端服务器。
即使能够预估网络直播服务的用户的数量与行为,要满足如尖峰时段时的用户的观看质量,需要建立庞大数量的服务器来进行待命。在不确定影响范围的情境下,例如在离峰时段,难以预估用户数量以及观看行为的状况下,需要人员密切注意云端服务器的连接情形,也不适合将闲置的服务器贸然关闭。在转播工作中,也会发现一些云端服务器连接数不多,形同空转的状况。此类因服务器闲置所造成的巨额维运成本也日渐扩大。因此,如何建立自动维运机制才能兼顾用户观看质量以及所耗成本最小的弹性服务器扩充及关闭,已成为一个重要的议题。
云端服务器的扩展可以通过垂直扩展(Vertical scaling)以及水平扩展(Horizontal scaling)。垂直扩展是更改服务器的硬件资源,例如提高中央处理单元(CPU)/内存/带宽等的级别,而服务器的数量不变。水平扩展是增减服务器的数量,而规格不变,例如通过租户预先设定好的范本、服务器映像文件、或是预设指令脚本,建立许多与标的物同样规格的虚拟服务器。当前有些业者需要由租户预先将服务器设为自动扩展(auto-scaling)群组,只有在群组内的服务器拥有自动扩展功能。有的业者提供服务业者针对不同级别的云端进行效能评测(benchmarking)。实现方法可采用测量服务的完成时间,来厘清性价比(performance cost ratio)最佳的服务器级别(instance type),再藉由订定政策(policy)实现自动扩展,其政策可基于阈值触发、或是固定时间触发。
现有的服务器动态增减技术可分成两类。一类是公共云业者提供以基础架构层次(infrastructure-level)为主的反应式(reactive)动态增减,来服务广大租户。此类技术测量当前服务器的/内存/网络使用状况等,并且有多种指标供租户自由选择。达到阈值来判断增减,阈值可以由用户(公共云租户)自行设定,或采用预设最佳实务设定。一旦达到其阈值,通过负载均衡器(load balancer)调配每一服务器的服务量。另一类是租户基于其自身应用的特性,判断应用层级别(application-level)的服务压力,通过公共云业者的编程接口(Application Programming Interface,API)设定企业逻辑,此类大部分是主动式(proactive)技术。技术的参考指标可以是队列(queue)中待处理数据的数量、平均回应时间、用户连接数量(number of connections)等。
有一技术提供紧密整合的自动化管理,包括跨云自动化管理,让用户设定各种范本、宏(或称之为“巨集”)、脚本等,观察指标可以排入一阵列,对于增减的逻辑则由租户自行判断。有一技术提出主动式的人工神经网络训练的二维矩阵,判断是否增减服务器。有一技术认为网页文件存取有其固定的导览路线,要找出当中压力最重的路线进行服务器扩展。有一技术解决两层式应用服务,此技术通过一链结系统(linkage system)去观察第一层的反应效能,以决定第二层是否开始扩展(scale-up)。有一技术根据当前虚拟机器(VMs)的总体流量状态,控制负载均衡器调配负载至其他服务器。有些技术指出可以根据计费周期来关闭机器。
有一技术考虑违反服务层级协议(Service Level Agreement,SLA)付出的代价与节省经费两者之间的最佳平衡点。此技术用在多层(multi-tier)的应用,并且基于应用的容量做扩展以及预测系统所需的容量,同时考虑成本模型(cost model)与资源模型(resource model),所有的要求(requests)都会经由网关与负载均衡器。大部分的虚拟机器(VM)具有相同的一般资源配置,其中一部分的虚拟机器具有较低的资源配置。当应用的容量需要扩展(scale up)时,将较低配置的虚拟机器垂直扩展至一般资源配置。当应用的容量需要缩减(scale down)时,进行垂直扩展或水平扩展至较低的资源配置。
在上述现行的服务器动态增减技术中,有的技术未评估关闭服务器后,对于服务提供商的冲击。有的技术只根据前一台服务器的状态,从一群机器中任意选一台关闭。有的技术无法通过负载均衡器来完全控制用户向谁取得数据。有的技术未充分利用公共云的特性于节省费用,例如未充分利用不同数据中心的位置与价格并不相同、公共云的租用计费周期不足1小时仍以1小时计算、串流服务商可以利用多个公共云服务商的云端服务器等特性。因此,如何建立公共云的自动维运机制来兼顾服务质量以及所耗成本最小的弹性服务器扩充与缩减,是值得研究的议题。
发明内容
本公开的实施例可提供一种公共云资源动态配置方法及系统。
本公开的一实施例是关于一种公共云资源动态配置方法。此方法可包含:藉由一负载监视器(Load Monitor),取得一当前服务器配置,该当前服务器配置至少包括多台服务器的各服务器的身份信息(Identity Information),以及该多台服务器的各服务器的一当前连接数(current number of connections)、一服务器级别(level)、以及一所在区域(located area);藉由一扩展与缩减引擎(Scaling Engine),判断该多台服务器中是否有符合至少一触发条件(trigger condition)的至少一服务器;藉由该扩展与缩减引擎,将符合该至少一触发条件的该至少一服务器加入一服务器候选者集合(server candidateset);以及藉由该扩展与缩减引擎,接收一性价比信息,并且根据该服务器候选者集合,对至少一区域执行一服务器扩展或缩减程序。
本公开的另一实施例是关于一种公共云资源动态配置系统。此系统包含一负载监视器、以及一扩展与缩减引擎。此负载监视器取得一当前服务器配置,该当前服务器配置至少包括多台服务器的各台服务器的身份信息,以及该多台服务器的各服务器的一当前连接数、一服务器级别、以及一所在区域。此扩展与缩减引擎判断该多台服务器中是否有符合至少一触发条件的至少一服务器;将符合该至少一触发条件的该至少一服务器加入一服务器候选者集合;以及接收一性价比信息,并且根据该服务器候选者集合,对至少一区域执行一服务器扩展或缩减程序。
现在配合下列图示、实施例的详细说明及权利要求书,将上述及本发明的其他优点详述于后。
附图说明
图1是根据本公开的一实施例,定义公共云的租赁费用率的一范例。
图2是根据本公开的一实施例,说明服务器缩减的触发时机的一示意图。
图3是根据本公开的一实施例,说明一种公共云资源动态配置方法。
图4A是根据本公开的一实施例,说明一种公共云资源动态配置系统。
图4B是根据本公开的一实施例,说明图4A的系统的一应用情境的范例。
图4C是根据本公开的一实施例,说明以分组的往返时间来划分区域的一范例。
图5A是根据本公开的一实施例,说明一区域的各服务器级别对应的每条连接的单位价格的信息的一范例。
图5B是根据本公开的一实施例,说明一区域的各服务器级别对应的最大连接数的信息的一范例。
图6是根据本公开的一实施例,说明至少一区域的各区域内的服务器扩展或缩减的运作流程。
图7是根据本公开的一实施例,说明如何计算一目标配置的运作。
图8A与图8B是根据本公开的一实施例,举一范例说明一区域内的服务器扩展或缩减,其中,图8A是调整前,该区域内各服务器的状态信息;图8B是调整后,该区域内各服务器的状态信息。
图9将是根据本公开的一实施例,说明跨区域的服务器缩减的运作流程。
图10是根据本公开的一实施例,说明t值的选择、与跨区域百分比、节省费用比,之间的关系。
【符号说明】
S、M、L、XL、CC2.8XL服务器级别
t 阈值 210 一计费周期
A、C、D 候选者服务器
310 藉由一负载监视器,取得一当前服务器配置,该当前服务器配置至少包括多台服务器的各服务器的身份信息,以及该多台服务器的各服务器的一当前连接数、一服务器级别、以及一所在区域
320 藉由一扩展与缩减引擎,判断该多台服务器中是否有符合至少一触发条件的至少一服务器
330 藉由该扩展与缩减引擎,将符合该至少一触发条件的该至少一服务器加入一服务器候选者集合
340 藉由该扩展与缩减引擎,接收一性价比信息,并且根据该服务器候选者集合,对至少一区域执行一服务器扩展或缩减程序
400 公共云资源动态配置系统
410 负载监视器 420 扩展与缩减引擎
422 服务器候选者集合 424 性价比信息
426 服务器扩展或缩减程序 412 当前服务器配置
430 服务器扩展或缩减指令
610 接收性价比信息,此性价比信息至少包含该至少一区域的各区域内各服务器级别各自对应的每条连接的单位价格的信息、以及该区域内各服务器级别各自对应的最大连接数的信息
620 根据此性价比信息,计算一目标配置,从而产生该至少一区域的各区域内各服务器级别各自对应的一服务器数量
630 发出一或多个服务器扩展或缩减指令,调整该至少一区域的各区域中各服务器级别对应的服务器数量至该目标配置中各服务器级别各自对应的服务器数量
710 将该服务器候选者集合中该区域中所有服务器的当前连接数的总和做为一未分派连接数
720 根据该区域内各服务器级别各自对应的每条连接的单位价格、该区域内各服务器级别各自对应的最大连接数、以及该未分派连接数,分配该区域内各服务器级别各自对应的一目标服务器数量
910 计算一服务容量与一当前总连接数,其中服务容量=该服务器候选者集合中所有服务器的服务器级别对应的最大连接数的总和,当前总连接数=该服务器候选者集合中所有服务器的当前连接数的总和
920 依照该服务器候选者集合中所有服务器的闲置率由高至低排序
930 从闲置率最高的服务器开始,当该服务容量与该服务器的服务器级别对应的最大连接数相减后的差大于等于该当前总连接数时,判定关闭该服务器
940 当该服务容量与该服务器的服务器级别对应的最大连接数相减后的差小于该当前总连接数时,判定不关闭该服务器
1010 曲线,代表原始方法所产生的跨区域百分比
1020 曲线,代表考虑t值的跨区域百分比
1030 曲线,代表原始方法的节省费用比
1040 曲线,代表考虑t值的节省费用比
具体实施方式
以下,参考伴随的图式,详细说明依据本公开的实施例,从而使本领域技术人员易于了解。所述的发明创意可以采用多种变化的实施方式,当不能只限定于这些实施例。本公开省略本领域技术人员已熟知部分(well-known part)的描述,并且相同的参考号于本公开中代表相同的元件。
依据本公开的实施例,提供一种公共云资源动态配置方法及系统。其技术搜集当前服务在一或多个公共云所有服务器的配置状态,考虑对租户(向公共云业者租赁机器者)的服务在公共云上进行效能测量,从而了解如各级别的服务器的连接数、以及所在区域等,而一公共云有至少一服务器。图1是根据本公开的一实施例,定义公共云的租赁费用率的一范例。在图1的范例中,可依服务器级别(instance type)定义五种级别(即小、中、大、超大、CPU增强,分别记为级别S、级别M、级别L、级别XL、级别CC2.8XL)的租赁费用率。例如,级别S的租赁费用率为每小时0.060元,级别M的租赁费用率为每小时0.120元,级别L的租赁费用率为每小时0.240元,级别XL的性价比为每小时0.480元,级别CC2.8XL的性价比为每小时1.920元。
租户根据这些服务器的连接数,可计算各级别的服务器的性价比。租户可根据其服务的需求,设定至少一触发条件,依据本公开的一实施例,符合触发条件的服务器可被加入于一服务器候选者集合;当符合该触发条件的情况发生时,可根据输入的性价比信息、以及该服务器候选者集合,对至少一区域执行一服务器扩展或缩减程序。
依据本公开的实施例,此至少一触发条件可被设定为有一服务器的一或多种运行状态已达到一阈值时触发、以一调度方式在一整点时触发、有一服务器已达到距离一计费周期的一结尾的一时间区间内时触发、一固定时段周期性地触发,之前述一种或一种以上的触发条件任意组合。例如,此至少一触发条件可设定有一服务器的CPU、内存、带宽等的所谓的闲置率或资源利用率已达到阈值时触发,或是以调度方式在整点触发,或是有一服务器接近一计费周期的结尾时触发,或是每分钟触发。而闲置率一般可定义为数值1减去资源利用率。
在本公开中,根据一实施范例,性价比的定义是平均每条连接所需的单位价格(unit price)。图5A是根据本公开的一实施例,定义性价比的一应用范例。在图5A的范例中,可依服务器级别(instance type)定义五种级别(即小、中、大、超大、CPU增强,分别记为级别S、级别M、级别L、级别XL、级别CC2.8XL)的性价比,其每条连接的单位价格。例如,级别S的性价比为每小时0.0012元,级别M的性价比为每小时0.0010元,级别L的性价比为每小时0.0008元,级别XL的性价比为每小时0.0006元,级别CC2.8XL的性价比为每小时0.0024元。在图5B的范例中,其中级别S的最大连接数为50台服务器,级别M的最大连接数为120台服务器,级别L的最大连接量为300台服务器,级别XL的最大连接数为800台服务器,级别CC2.8XL的最大连接数为800台服务器。服务器例如可以是虚拟机器、主机等的其中一种或一种以上的组合。对于租户,各级别的服务器的性价比需要做效能评测,性价比越高越好。
如之前所述,当判断出有已符合至少一触发条件的服务器时,可根据输入的性价比信息,以及服务器候选者集合进行至少一区域的扩展或缩减程序。扩展服务器的范例,譬如可以在某一区域增加一台高性价比的服务器、或是增加一台级别最小的服务器、或是增加一台级别最大的服务器、或是增加一台各级别中最大连接数最大的服务器,然后等待下一次的触发。缩减服务器的范例,譬如可将资源利用率较低的服务器关闭,或是将低性价比的服务器关闭,让用户分散到其他高性价比的服务器去。
当用户随时间的经过而逐渐减少,闲置的服务器将因而增加。根据本公开一实施例,可将低性价比的服务器关闭,让用户分散到其他高性价比的服务器去,以节省多余的服务器的成本花费。扩展或缩减服务器的触发的时间点,譬如可以采用如CPU、内存、带宽等的闲置率已达到阈值(例如,以CPU的闲置率(idle rate)为80%与20%分别作为上限阈值与下限阈值)时触发,或是以调度方式在整点触发,或是有任何一台服务器接近计费周期结尾时触发,或是每分钟触发。触发时可以考虑将当前所有的服务器全部列入服务器候选者集合、或是考虑将该服务器是否已接近其计费周期的结尾才列入服务器候选者集合。图2是根据本公开的一实施例,说明服务器缩减的触发时机的一示意图,其中一服务器的一计费周期如标号210所示。
在图2中,考虑将一或多台使用中已接近其计费周期(billing cycle)结尾的服务器列入要被关闭的候选者(reducing candidate)集合,其实施方式例如可设定一阈值t,并且将离计费周期t分钟内即将完成一计费周期的一或多台服务器列入服务器候选者集合。在图2的范例中,根据此阈值t,服务器A、服务器C、以及服务器D都是接近其计费周期结尾的服务器候选者。因此,服务器A、服务器C、以及服务器D也可以触发服务器缩减(serverreduction)。也就是说,根据本公开的实施例,可采用条件式触发来产生服务器扩展或缩减程序。
图3是根据本公开的一实施例,说明一种公共云资源动态配置方法。参考图3,此方法可包含:藉由一负载监视器,取得一当前服务器配置,该当前服务器配置至少包括多台服务器的各服务器的身份信息,以及该多台服务器的各服务器的一当前连接数、一服务器级别、以及一所在区域(步骤310);藉由一扩展与缩减引擎,判断该多台服务器中是否有符合至少一触发条件的至少一服务器(步骤320);藉由该扩展与缩减引擎,将符合该至少一触发条件的该至少一服务器加入一服务器候选者集合(步骤330);以及藉由该扩展与缩减引擎,接收一性价比信息,并且根据该服务器候选者集合,对至少一区域执行一服务器扩展或缩减程序(步骤340)。挑选自该当前服务器配置中的该至少一服务器的该服务器候选者集合,其中也包括了每一服务器的身份信息、一当前连接数、一服务器级别、以及一所在区域等信息。
依此,根据本公开的一实施例,一种公共云资源动态配置系统400可如图4A所示。系统400可包含一负载监视器410、以及一扩展与缩减引擎420。此负载监视器410取得一当前服务器配置412,该当前服务器配置至少包括多台服务器的各服务器的身份信息,以及该多台服务器的各服务器的一当前连接数、一服务器级别、以及一所在区域。此扩展与缩减引擎420判断该至少一服务器中是否有符合至少一触发条件的至少一服务器;将符合该至少一触发条件的该至少一服务器加入一服务器候选者集合422;以及接收一性价比信息424,并且根据该服务器候选者集合,对至少一区域执行一服务器扩展或缩减程序426。挑选自该当前服务器配置中的该至少一的服务器候选者集合,此其中也包括了每一服务器的身份信息、一当前连接数、一服务器级别、以及一所在区域等信息。
图4B是根据本公开的一实施例,说明图4A的系统的一应用情境的范例。在图4B的范例中,负载监视器410可取得一或多个公共云上的一当前服务器配置,此当前服务器配置例如是位于多个不同区域(例如新加坡、日本、美国、巴西、…)的多台服务器的当前状态信息,此状态信息包括至少此多台服务器的每一服务器的身份信息、当前连接数、服务器级别、以及所在区域等的状态信息。身份信息可为例如是一服务器代号,用以区分不同的服务器。扩展与缩减引擎420从负载监视器410取得这些状态信息,当此多台服务器中有符合触发条件者(例如位于新加坡的服务器),扩展与缩减引擎420可对位于此区域(新加坡)的服务器可藉由,但不限定是发出一或多个服务器扩展或缩减指令(scaling commands)430,以执行服务器扩展或缩减程序426,将成本效益较低的服务器关闭,令用户分散到其他成本效益较高的服务器去。其中缩减指令例如是「aws ec2 terminate-instances」。其中扩展指令例如是「aws ec2run-instances」、「aws ec2 terminate-instances」、「aws ec2modify-instance-attribute」这三种的其中之一或二或三种的任意组合。根据本公开的实施例,公共云资源动态配置系统400可在单一公共云上运行,也可以跨越在多个公共云上运行。
本公开所谓的「区域(area)」,可以是以地理位置(geographical location)来划分的区域、或是以分组的往返时间(Round Trip Time,RTT)来划分的区域。图4C是根据本公开的一实施例,说明以分组的往返时间来划分区域的一范例。在图4C的范例中,有六个在不同所在位置的数据中心(记为数据中心431~数据中心436),其中数据中心431~数据中心433的各数据中心的分组的往返时间皆小于等于120毫秒(即RTT≦120ms),而数据中心434~数据中心436的各数据中心的分组的往返时间皆小于等于500毫秒且大于等于120毫秒(即120ms<RTT≦500ms),依此,数据中心431~数据中心433被划分在区域441,而数据中心434~数据中心436被划分在区域442。
根据本公开的实施例,性价比信息至少包含该至少一区域的各区域的各服务器级别对应的每条连接的单位价格的信息、以及该至少一区域的各区域的各服务器级别对应的最大连接数的信息。图5A是根据本公开的一实施例,说明一区域的各服务器级别对应的每条连接的单位价格的信息的一范例。图5A的范例说明了并非越高级别的服务器的单位成本越便宜,可由租户自行进行各级别的效能评测,例如租用最贵的丛集CPU级别的服务器可能对于多媒体的应用毫无帮助,其性价比会非常低。一般而言,因为带宽的关系会在较高服务器级别如L、XL级别得到较高的性价比。某些服务消耗内存非常大,此时可以选针对内存优化的服务器级别的性价比较高。图5B是根据本公开的一实施例,说明该区域的各服务器级别对应的最大连接数的信息的一范例。
根据本公开的一实施例,服务器扩展或缩减程序可以分为两阶段,第一阶段是区域内(inter-area)的服务器扩展或缩减,第二阶段是跨区域(intra-area)的服务器缩减。也就是说,当有符合至少一触发条件的服务器时,先对该至少一区域的各区域内执行一服务器扩展或缩减后,再执行一跨区域的服务器缩减。根据本公开的实施例,此两阶段的服务器扩展或缩减程序,第一阶段在不造成跨区域连接的前提之下,先把所有区域的每一区域内各自的服务器运行成本缩减到最低,以减少大部分的跨区域连接,让大部分的用户都能经由同区域的服务器提供连接,第二阶段的服务器缩减可能造成少部分的用户必须由跨区域的服务器提供连接。此服务器扩展或缩减程序从而能够在节省服务器成本以及满足用户质量(减少跨区域连接)上达成平衡。
图6是根据本公开的一实施例,说明至少一区域的各区域内的服务器扩展或缩减的运作流程。参考图6,扩展与缩减引擎420接收一性价比信息,此性价比信息至少包含该至少一区域的各区域内各服务器级别各自对应的每条连接的单位价格的信息、以及该至少一区域的各区域内各服务器级别各自对应的最大连接数的信息(步骤610);根据此性价比信息,计算一目标配置,从而产生该至少一区域的各区域内各服务器级别各自对应的一服务器数量(步骤620);以及发出一或多个服务器扩展或缩减指令,调整该至少一区域的各区域中各服务器级别对应的服务器数量至该目标配置中各服务器级别各自对应的服务器数量(步骤630)。当需要从多个相同级别的服务器中关闭其中至少一服务器时,可优先考虑,但不限定是,关闭该多个相同级别的服务器中当前连接数最少的服务器。
图7是根据本公开的一实施例,说明如何计算一区域的一目标配置的运作。参考图7,扩展与缩减引擎420将该服务器候选者集合中该区域中所有服务器的当前连接数的总和做为一未分派连接数(步骤710);并且根据该区域内各服务器级别各自对应的每条连接的单位价格、该区域内各服务器级别各自对应的最大连接数、以及该未分派连接数,分配该区域内各服务器级别各自对应的一目标服务器数量(步骤720)。一服务器级别对应的每条连接单位价格越低,其性价比越高。计算一服务器级别对应的该目标服务器数量有多种方式,以下的公式是其中的一个范例。
一服务器级别对应的目标服务器数量
=该未分派连接数/该服务器级别对应的最大连接数;
以及,更新该未分派连接数如下:
该未分派连接数
=该未分派连接数Mod该服务器级别对应的最大连接数;
其中,Mod是一模运算(也称之为“模数运算”)。
在步骤720中,有多种实施方式可分配该区域内各服务器级别各自对应的该目标服务器数量。例如根据一实施例,可由该区域内多台服务器级别对应的一最低的单位价格至一最高的单位价格高,依序地分配该区域内各服务器级别各自对应的该目标服务器数量。假设将距离一计费周期(60分钟)结束t分钟内的服务器加入一服务器候选者集合,或将所有服务器皆加入关闭的服务器候选者集合(即t=60)。则一区域内的服务器扩展或缩减程序可运作如下。加总该服务器候选者集合内所有服务器的连接数做为一未分派连接数。依序从性价比高(服务器级别对应的每条连接单位价格最低)的服务器级别开始分配连接数。例如,XL级别的服务器其性价比最高并且假设最多可以支持800条连接,则先分配[未分派连接数/800]台XL级别的服务器。分配后,将该未分派连接数更新为[未分派连接数Mod800]。当更新后的未分派连接数尚未归零时,再继续分配下一级别服务器的目标服务器数量,直到该未分派连接数成为零。若该未分派连接数小于该服务器级别对应的最大连接数,该目标服务器数量加1。欲积极节费的租户可调整公式为放弃该未分派连接数,使用该目标服务器数量。有多种实施方式可在此进行微调,仍不违背由性价比高的服务器开始分配的精神。此时已完成一区域的目标配置(包含该区域内各服务器级别对应的服务器数量)。根据该目标配置与该区域内当前的服务器配置数量上的差异进行调整,此时可能会增加或减少各种级别的服务器。当需要增加服务器时,可直接增加;当需要关闭服务器时,可采用,但不限定于,一最小编辑距离(minimum edit distance;Levenshtein)为原则来进行服务器数量的调整,其依据为当前使用该服务器的连接数。举例来说,若有两台同样是XL级别的服务器要关闭其中一台服务器,此时可选择当前连接数较少的那台服务器。
依据上述的实施例,图8A与图8B举一范例说明一区域内的服务器扩展或缩减程序,其中,假设一服务器候选者集合中一区域内总共有1628用户的连接。图8A是调整前,该区域内各服务器的状态信息。租户经过效能评测后,认为XL级别服务器的性价比较高,优先将连接数分派给XL级别的服务器,并且根据上述目标配置的运作流程及求得目标服务器数量的公式范例,计算出该区域内的目标配置是2台XL级别的服务器、以及1台S级别的服务器。
根据此目标配置与该区域内当前的服务器配置数量上的差异,因此,应关闭一台XL级别的服务器、一台L级别的服务器、以及一台S级别的服务器。缩减服务器时,可考虑同级别服务器中具有最小编辑距离者,例如,当前的XL级别的服务器共有三台可选,可从中选择关闭当前连接人数最低的XL级别的服务器,因而关闭服务器代号为i-PSRHEDNF的XL级别的服务器(XL级别的服务器中当前连接数最低者)、服务器代号为i-PHAQQQYT的L级别的服务器、以及服务器代号为i-KGMUCWEE的S级别的服务器(S级别的服务器中当前连接数最低者),如图8B所示的调整后,该区域内各服务器的状态信息,其中删除线表示关闭该服务器。
根据本公开的一实施例,第二阶段的跨区域的服务器缩减依据服务器候选者集合422中所有服务器的闲置率或资源利用率以进行缩减,譬如可依照这些服务器的闲置率由高至低排序或资源利用率由低至高排序,依序进行缩减。一服务器的资源利用率计算方法,其中的一个范例如以下的公式:
资源利用率=该服务器的当前连接数与该服务器对应的服务器级别所对应的最大连接数的比值。
图9将是根据本公开的一实施例,说明跨区域的服务器缩减的运作流程。
参考图9,扩展与缩减引擎420计算一服务容量与一当前总连接数,其中服务容量=该服务器候选者集合中所有服务器的服务器级别对应的最大连接数的总和,当前总连接数=该服务器候选者集合中所有服务器的当前连接数的总和(步骤910);依照该服务器候选者集合中所有服务器的闲置率由高至低排序(步骤920);然后,从闲置率最高的一服务器开始依次进行判定,当该服务容量与该服务器的服务器级别对应的最大连接数相减后的差大于等于该当前总连接数时,扩展与缩减引擎420判定关闭该服务器(步骤930)。当该服务容量与该服务器的服务器级别对应的最大连接数相减后的差小于该当前总连接数时,扩展与缩减引擎420判定不关闭该服务器(步骤940)。直到该服务器候选者集合中不再有服务器可以被关闭。
也就是说,跨区域的服务器缩减可依据该服务器候选者集合中所有服务器的服务器级别对应的最大连接数的总和、该服务器候选者集合中所有服务器的当前连接数的总和、以及各服务器级别所对应的最大连接数,判定是否关闭该服务器。
根据本公开实施例的公共云资源动态配置技术,在第二阶段经过跨区域缩减后才会产生跨区域连接,若租户不希望产生任何跨区域连接,可以设定扩展与缩减引擎420不执行跨区域的服务器缩减阶段,但是获得较差的节费效果。图10是根据本公开的一实施例,说明t值的选择、与跨区域百分比、节省费用比,之间的关系。其中,横轴代表t值(单位:分钟),横轴代表百分比。曲线1010代表触发时不考虑t值而将所有服务器全部列入服务器候选者集合的一种原始方法所产生的跨区域百分比,曲线1020代表只将距离计费周期结尾t分钟内的服务器列入服务器候选者集合的跨区域百分比,曲线1030代表该原始方法的节省费用比,曲线1040代表考虑t值时的节省费用比。
参考图10,从曲线1040可以看出,t值的选择越高,跨区域的服务器缩减所产生的节省费用效果越强;其代价是所产生的跨区域连接数也越高。若t值设为60分钟表示所有服务器都被列入考虑关闭的服务器候选者集合即等同于该原始方法。假如t值选择为5分钟,则节省费用效果很差,若t值增加为10分钟,则节省费用效果很明显提升近1倍。当t值选择为35分钟以上开始出现节省费用的边际效益递减。
综上所述,依据本公开的实施例提供一种公共云资源动态配置方法及系统。其技术利用一负载监视器,取得公共云上的一当前服务器配置,提供给一扩展与缩减引擎。此扩展与缩减引擎采用条件触发式产生服务器缩减事件,并且可动态调整各级别服务器的目标服务器数量,从而降低服务器的运行成本并维持租户的服务质量。此技术可在单一公共云上运行,也可以跨越在多个公共云上运行。
以上所述仅为依据本公开的实施范例,当不能依此限定本公开实施的范围。即大凡发明权利要求所作的均等变化与修饰,皆应仍属本公开专利涵盖的范围。

Claims (15)

1.一种公共云资源动态配置方法,包含:
藉由负载监视器,取得当前服务器配置,该当前服务器配置至少包括多台服务器的各服务器的身份信息,以及该多台服务器的各服务器的当前连接数、服务器级别、以及所在区域;
藉由扩展与缩减引擎,判断该多台服务器中是否有符合至少一触发条件的至少一服务器;
藉由该扩展与缩减引擎,将符合该至少一触发条件的该至少一服务器加入服务器候选者集合;以及
藉由该扩展与缩减引擎,接收性价比信息,并且根据该服务器候选者集合,对至少一区域执行服务器扩展或缩减程序以调整该多台服务器的数量,其中该性价比信息至少包括该至少一区域的各区域内各服务器级别各自对应的每条连接的单位价格的信息、以及该至少一区域的各区域内各服务器级别各自对应的最大连接数的信息,其中执行该服务器扩展或缩减程序是先对该至少一区域的各区域内执行一服务器扩展或缩减后,再执行一跨区域的服务器缩减。
2.如权利要求1所述的方法,其中该至少一触发条件被设定为有服务器的一或多种运行状态已达到阈值时触发、以一调度方式在整点时触发、有服务器已达到距离计费周期的结尾的时间区间内时触发、固定时段周期性地触发,之前述一种或一种以上的触发条件任意组合。
3.如权利要求1所述的方法,其中该方法还包括:
根据该性价比信息,计算目标配置,从而产生该至少一区域的各区域内各服务器级别各自对应的一服务器数量;以及
发出一或多个服务器扩展或缩减指令,调整当前该至少一区域的各区域中各服务器级别对应的服务器数量至该目标配置中各服务器级别各自对应的服务器数量。
4.如权利要求3所述的方法,其中计算该目标配置还包括:
将该服务器候选者集合中该至少一区域的各区域中所有服务器的当前连接数的总和做为未分派连接数;以及
根据该至少一区域的各区域内各服务器级别各自对应的每条连接的单位价格、该至少一区域的各区域内各服务器级别各自对应的最大连接数、以及该未分派连接数,分配该至少一区域的各区域内各服务器级别各自对应的目标服务器数量。
5.如权利要求4所述的方法,其中该方法由该至少一区域的各区域内各服务器级别各自对应的一最低的每条连接的单位价格至一最高的每条连接的单位价格,依序地分配该至少一区域的各区域内各服务器级别各自对应的该目标服务器数量。
6.如权利要求1所述的方法,其中当需要从多个相同级别的服务器中关闭其中至少一服务器时,被关闭的该至少一服务器是该多个相同级别的服务器中当前连接数最少的服务器。
7.如权利要求1所述的方法,其中该跨区域的服务器缩减是将该服务器候选者集合中所有服务器依据这些服务器的闲置率或资源利用率以进行缩减。
8.如权利要求7所述的方法,其中该闲置率是数值1减去该资源利用率,该资源利用率是该服务器的当前连接数与该服务器对应的一服务器级别所对应的最大连接数的比值。
9.如权利要求1所述的方法,其中该跨区域的服务器缩减依据该服务器候选者集合中所有服务器的服务器级别各自对应的最大连接数的总和、该服务器候选者集合中所有服务器的当前连接数的总和、以及服务器的服务器级别所对应的最大连接数,判定是否关闭该服务器。
10.一种公共云资源动态配置系统,包含:
负载监视器,取得当前服务器配置,该当前服务器配置至少包括多台服务器的各服务器的身份信息,以及该多台服务器的各服务器的当前连接数、服务器级别、以及所在区域;以及
扩展与缩减引擎,判断该多台服务器中是否有符合至少一触发条件的至少一服务器,将符合该至少一触发条件的该至少一服务器加入服务器候选者集合;以及接收性价比信息,并且根据该服务器候选者集合,对至少一区域执行服务器扩展或缩减程序以调整该多台服务器的数量,其中该性价比信息至少包括该至少一区域的各区域内各服务器级别各自对应的每条连接的单位价格的信息、以及该至少一区域的各区域内各服务器级别各自对应的最大连接数的信息,其中该服务器扩展或缩减程序分为两阶段,其中第一阶段是区域内的服务器扩展或缩减,第二阶段是跨区域的服务器缩减。
11.如权利要求10所述的系统,其中当该至少一服务器中有符合该至少一触发条件的该至少一服务器时,该扩展与缩减引擎对位于该至少一区域的该至少一服务器发出一或多个服务器扩展或缩减指令,以执行该服务器扩展或缩减程序。
12.如权利要求10所述的系统,其中该至少一触发条件被设定为有一服务器的一或多种运行状态已达到一阈值时触发、以调度方式在整点时触发、有服务器已达到距离计费周期的结尾的时间区间内时触发、固定时段周期性地触发,的前述一种或一种以上的触发条件任意组合。
13.如权利要求10所述的系统,其中该扩展与缩减引擎从该负载监视器取得该当前服务器配置的信息。
14.如权利要求10所述的系统,其中该至少一服务器是至少一虚拟机器以及至少一主机,的其中一种或一种以上的组合。
15.如权利要求10所述的系统,其中该系统在一或多个公共云上运行。
CN201410244947.7A 2014-04-22 2014-06-04 公共云资源动态配置方法及系统 Active CN105007287B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
TW103114547A TWI552002B (zh) 2014-04-22 2014-04-22 公共雲資源動態配置方法及系統
TW103114547 2014-04-22

Publications (2)

Publication Number Publication Date
CN105007287A CN105007287A (zh) 2015-10-28
CN105007287B true CN105007287B (zh) 2018-11-06

Family

ID=54322939

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410244947.7A Active CN105007287B (zh) 2014-04-22 2014-06-04 公共云资源动态配置方法及系统

Country Status (3)

Country Link
US (1) US20150304176A1 (zh)
CN (1) CN105007287B (zh)
TW (1) TWI552002B (zh)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9606826B2 (en) * 2014-08-21 2017-03-28 International Business Machines Corporation Selecting virtual machines to be migrated to public cloud during cloud bursting based on resource usage and scaling policies
JP2016081119A (ja) * 2014-10-10 2016-05-16 富士通株式会社 情報処理システム、情報処理システムの制御方法および制御装置の制御プログラム
US9848041B2 (en) * 2015-05-01 2017-12-19 Amazon Technologies, Inc. Automatic scaling of resource instance groups within compute clusters
TWI579710B (zh) * 2015-12-03 2017-04-21 Chunghwa Telecom Co Ltd Dynamic Load Balancing Service System Based on Dynamic Behavior of Customers
US10069869B2 (en) * 2016-05-17 2018-09-04 Amazon Technologies, Inc. Versatile autoscaling
US10693732B2 (en) 2016-08-03 2020-06-23 Oracle International Corporation Transforming data based on a virtual topology
US10389628B2 (en) 2016-09-02 2019-08-20 Oracle International Corporation Exposing a subset of hosts on an overlay network to components external to the overlay network without exposing another subset of hosts on the overlay network
US10412022B1 (en) 2016-10-19 2019-09-10 Amazon Technologies, Inc. On-premises scaling using a versatile scaling service and an application programming interface management service
CN108063784B (zh) * 2016-11-08 2022-01-25 阿里巴巴集团控股有限公司 一种云环境下应用集群资源分配的方法、装置和系统
US10409642B1 (en) 2016-11-22 2019-09-10 Amazon Technologies, Inc. Customer resource monitoring for versatile scaling service scaling policy recommendations
JP6885067B2 (ja) * 2017-01-16 2021-06-09 富士フイルムビジネスイノベーション株式会社 情報処理装置及び情報処理システム
US10462013B2 (en) 2017-02-13 2019-10-29 Oracle International Corporation Implementing a single-addressable virtual topology element in a virtual topology
US10291507B2 (en) 2017-02-13 2019-05-14 Oracle International Corporation Implementing a virtual tap in a virtual topology
TWI615712B (zh) * 2017-05-25 2018-02-21 Matsushita Electric Taiwan Co Ltd 系統記憶體優化方法、能優化系統記憶體的電子裝置及電腦可讀取的記錄媒體
CN107911419A (zh) * 2017-10-26 2018-04-13 广州市雷军游乐设备有限公司 服务器组内扩容的方法、装置、存储介质和系统
US10635501B2 (en) 2017-11-21 2020-04-28 International Business Machines Corporation Adaptive scaling of workloads in a distributed computing environment
US10812407B2 (en) 2017-11-21 2020-10-20 International Business Machines Corporation Automatic diagonal scaling of workloads in a distributed computing environment
US10893000B2 (en) * 2017-11-21 2021-01-12 International Business Machines Corporation Diagonal scaling of resource allocations and application instances in a distributed computing environment
US10733015B2 (en) 2017-11-21 2020-08-04 International Business Machines Corporation Prioritizing applications for diagonal scaling in a distributed computing environment
US10887250B2 (en) 2017-11-21 2021-01-05 International Business Machines Corporation Reducing resource allocations and application instances in diagonal scaling in a distributed computing environment
US10721179B2 (en) 2017-11-21 2020-07-21 International Business Machines Corporation Adaptive resource allocation operations based on historical data in a distributed computing environment
US10664324B2 (en) * 2018-05-30 2020-05-26 Oracle International Corporation Intelligent workload migration to optimize power supply efficiencies in computer data centers
JP6962295B2 (ja) * 2018-08-23 2021-11-05 日本電信電話株式会社 ネットワーク管理装置、および、ネットワーク管理方法
US11256696B2 (en) * 2018-10-15 2022-02-22 Ocient Holdings LLC Data set compression within a database system
US11153375B2 (en) * 2019-09-30 2021-10-19 Adobe Inc. Using reinforcement learning to scale queue-based services
US10915379B1 (en) * 2020-05-13 2021-02-09 Microsoft Technology Licensing, Llc Predictable distribution of program instructions
CN111405072B (zh) * 2020-06-03 2021-04-02 杭州朗澈科技有限公司 一种基于云厂家成本调度的混合云优化方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102550004A (zh) * 2009-09-30 2012-07-04 阿尔卡特朗讯公司 企业网络中分配的云资源的动态负载平衡和调配
CN103248626A (zh) * 2013-05-07 2013-08-14 中国科学技术大学 一种信息传播方法及系统

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6449739B1 (en) * 1999-09-01 2002-09-10 Mercury Interactive Corporation Post-deployment monitoring of server performance
US7085837B2 (en) * 2001-12-04 2006-08-01 International Business Machines Corporation Dynamic resource allocation using known future benefits
US8429630B2 (en) * 2005-09-15 2013-04-23 Ca, Inc. Globally distributed utility computing cloud
US8244827B2 (en) * 2007-12-19 2012-08-14 International Business Machines Corporation Transferring a logical partition (‘LPAR’) between two server computing devices based on LPAR customer requirements
US8909784B2 (en) * 2010-11-23 2014-12-09 Red Hat, Inc. Migrating subscribed services from a set of clouds to a second set of clouds
CN102855171A (zh) * 2012-08-09 2013-01-02 浪潮电子信息产业股份有限公司 一种基于linux系统的CPI实时监测的方法
US9473572B2 (en) * 2013-10-14 2016-10-18 International Business Machines Corporation Selecting a target server for a workload with a lowest adjusted cost based on component values
US10069906B2 (en) * 2014-04-29 2018-09-04 Hitachi, Ltd. Method and apparatus to deploy applications in cloud environments

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102550004A (zh) * 2009-09-30 2012-07-04 阿尔卡特朗讯公司 企业网络中分配的云资源的动态负载平衡和调配
CN103248626A (zh) * 2013-05-07 2013-08-14 中国科学技术大学 一种信息传播方法及系统

Also Published As

Publication number Publication date
CN105007287A (zh) 2015-10-28
US20150304176A1 (en) 2015-10-22
TWI552002B (zh) 2016-10-01
TW201541260A (zh) 2015-11-01

Similar Documents

Publication Publication Date Title
CN105007287B (zh) 公共云资源动态配置方法及系统
CN104796422B (zh) 一种在线客服均衡分配的方法及装置
US20170142177A1 (en) Method and system for network dispatching
CN104798356B (zh) 用于控制水平扩展软件应用中的利用率的方法和装置
Niu et al. Cost-effective cloud HPC resource provisioning by building semi-elastic virtual clusters
CN104038540B (zh) 一种应用代理服务器自动选择方法及系统
CN107465708A (zh) 一种cdn带宽调度系统及方法
US20140229210A1 (en) System and Method for Network Resource Allocation Considering User Experience, Satisfaction and Operator Interest
CN103699445A (zh) 一种任务调度方法、装置及系统
CN108776934A (zh) 分布式数据计算方法、装置、计算机设备及可读存储介质
CN109992422A (zh) 一种面向gpu资源的任务调度方法、装置和系统
Anselmi et al. The economics of the cloud
CN113230658A (zh) 资源分配方法、装置、计算机可读介质及电子设备
US20160000900A1 (en) Oligomeric influenza immunogenic compositions
CN109697637A (zh) 对象类别确定方法、装置、电子设备及计算机存储介质
Khan et al. The utility model for adaptive multimedia systems
CN110111214A (zh) 一种基于优先级的用户用能管理方法及系统
CN104994150A (zh) 一种面向云视频服务的请求分配方法
CN113554354A (zh) 一种考虑用户多元响应特性的负荷聚合商最优调度方法
Chi et al. A fairness-aware pricing methodology for revenue enhancement in service cloud infrastructure
Wanis et al. Efficient modeling and demand allocation for differentiated cloud virtual-network as-a service offerings
CN106502790A (zh) 一种基于数据分布的任务分配优化方法
Zhou et al. Comparative analysis of metaheuristic load balancing algorithms for efficient load balancing in cloud computing
CN104994149A (zh) 一种面向云视频服务的资源提供方法
Chhetri et al. Towards resource and contract heterogeneity aware rescaling for cloud-hosted applications

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant