CN107026877B - 云平台中管理资源的方法和装置 - Google Patents

云平台中管理资源的方法和装置 Download PDF

Info

Publication number
CN107026877B
CN107026877B CN201610067172.XA CN201610067172A CN107026877B CN 107026877 B CN107026877 B CN 107026877B CN 201610067172 A CN201610067172 A CN 201610067172A CN 107026877 B CN107026877 B CN 107026877B
Authority
CN
China
Prior art keywords
cloud platform
application
health degree
resources
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610067172.XA
Other languages
English (en)
Other versions
CN107026877A (zh
Inventor
张琦
牛杰
吴佳青
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201610067172.XA priority Critical patent/CN107026877B/zh
Priority to PCT/CN2017/071274 priority patent/WO2017128980A1/zh
Priority to EP17743595.5A priority patent/EP3402163B1/en
Publication of CN107026877A publication Critical patent/CN107026877A/zh
Priority to US16/047,789 priority patent/US10805385B2/en
Application granted granted Critical
Publication of CN107026877B publication Critical patent/CN107026877B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • H04L67/1031Controlling of the operation of servers by a load balancer, e.g. adding or removing servers that serve requests
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • G06F9/5077Logical partitioning of resources; Management or configuration of virtualized resources
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0893Assignment of logical groups to network elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0894Policy-based network configuration management
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/40Support for services or applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • H04L67/1034Reaction to server failures by a load balancer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/34Network arrangements or protocols for supporting network services or applications involving the movement of software or configuration parameters 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/51Discovery or management thereof, e.g. service location protocol [SLP] or web services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/60Scheduling or organising the servicing of application requests, e.g. requests for application data transmissions using the analysis and optimisation of the required network resources
    • H04L67/61Scheduling or organising the servicing of application requests, e.g. requests for application data transmissions using the analysis and optimisation of the required network resources taking into account QoS or priority requirements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/45591Monitoring or debugging support
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/45595Network integration; Enabling network access in virtual machine instances
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0895Configuration of virtualised networks or elements, e.g. virtualised network function or OpenFlow elements

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Environmental & Geological Engineering (AREA)
  • Multimedia (AREA)
  • Debugging And Monitoring (AREA)
  • Stored Programmes (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种云平台中管理资源的方法和装置,该方法包括:根据该云平台的第一状态信息,确定资源调整策略,该资源调整策略用于调整分配给该应用的资源的数量;根据该云平台的第二状态信息,确定智能滑窗ISW的大小,该ISW用于指示单位时间内该应用被允许的最大综合访问量PV;其中,该第一状态信息和该第二状态信息指示该云平台为该应用提供服务时的运行状况;根据该资源调整策略,调整分配给该应用的资源的数量,并根据确定的该ISW的大小调整该ISW。因此,本发明实施例的云平台中管理资源的方法和装置,在用户访问量骤增时,能够通过调整分配给应用的资源的数量和ISW的大小提供稳定而高可用的服务。

Description

云平台中管理资源的方法和装置
技术领域
本发明涉及信息技术领域,并且更具体地,涉及一种云平台中管理资源的方法和装置。
背景技术
在云计算时代,大量的应用都被托管在云平台上。云平台除了要保证自身的高可用,还要对托管在其上的应用提供高可用的保证。当应用程序(英文全称:Application,简称:App)的用户访问量骤增时,例如,该App的促销和推广活动由社交平台发出,一次推广50万用户,用户的并发访问量在活动信息发出后的一分钟内突然从2千/秒(2k/s)突然剧增到5万/秒(5w/s);或者,该App突然在社交平台上得到某位知名人士推荐,可能在毫无预兆的情况下突然用户访问量大增,在一天内并发访问量可能从2千/秒增加到10万/秒。
面对访问量剧增的情况,为了保持应用稳定可用,现有技术有两种方案,一种是使用负载均衡(英文全称:Load Blance,简称:LB)系统,例如,设置一个App服务性能上限,在综合浏览量(英文全称:Page View,简称:PV)达到这个上限值时,只处理上限值范围内的请求,对于超限的请求进行等待或类似拒绝服务。采用这种负载均衡系统来应对访问量骤增的情况,会导致应用无法满足所有用户的访问需求,即对部分用户不可用。现有技术的另一种解决方案是采用弹性伸缩系统监控App的运行状态等信息,当应用的访问量增加时,进行动态增容,例如,根据应用的访问量的增加量,增加提供App服务的虚拟机(英文全称:Virtual Machine,简称:VM)或服务器的数量。但是当访问量骤增时,增容速度往往赶不上并发访问量增加的速度,从而会导致在增容完成之前已经有虚拟机或服务器崩溃,而新增容的虚拟机或服务器立刻就承受巨大的访问压力进而宕机。因此,在用户访问量骤增时,两种方案都难以确保为用户提供稳定而高可用的服务。
发明内容
本发明实施例提供一种云平台中管理资源的方法和装置,能够在保证现有服务稳定可用的情况下,实现快速、有效的动态增容以应对应用访问量短时间内增大的状况。
第一方面,本发明实施例提供了一种云平台中管理资源的方法,该云平台用于为部署在其上的应用提供运行所需资源,包括:根据所述云平台的第一状态信息,确定资源调整策略,所述资源调整策略用于调整分配给所述应用的资源的数量;根据所述云平台的第二状态信息,确定智能滑窗ISW的大小,所述ISW用于指示单位时间内所述应用被允许的最大综合访问量PV;其中,所述第一状态信息和所述第二状态信息指示所述云平台为所述应用提供服务时的运行状况;根据所述资源调整策略,调整分配给所述应用的资源的数量,并根据确定的所述ISW的大小调整所述ISW。
本发明实施例的执行主体为云平台中管理资源的装置,它可以为独立的装置,也可以集成在云平台中的LB系统中或弹性伸缩系统中等,在第一方面所述的实现方式中,该管理资源的装置通过根据云平台的状态信息,调整分配给应用的资源的数量以及智能滑窗的大小,通过动态调整ISW的大小,在应用的访问量骤增时,能够保证为该应用提供稳定而高可用的服务,同时通过动态调整分配给应用的资源数量实现有节奏的按需逐步增容。
结合第一方面,在第一方面的第一种实现方式中,所述根据所述云平台的第一状态信息,确定资源调整策略,包括:根据所述第一状态信息,确定所述云平台的健康度,所述云平台的健康度指示所述云平台为所述应用提供服务时的性能状况。在该实现方式中,云平台中管理资源的装置可以根据云平台的运行状态信息,确定云平台的健康度,然后根据云平台的健康度确定针对该健康度的资源调整策略,从而根据该资源调整策略调整分配给应用的资源的数量。
结合第一方面及其上述实现方式,在第一方面的第二种实现方式中,所述根据所述云平台的健康度,确定所述资源调整策略,包括:确定多个健康度等级中所述云平台的健康度对应的健康度等级;根据所述云平台预配置的多个资源调整策略与所述多个健康度等级的对应关系,确定所述健康度等级对应的资源调整策略。在该实现方式中,云平台中管理资源的装置可以针对不同的健康度等级预配置不同的资源调整策略,在获取云平台的健康度后,可以根据该健康度对应的健康度等级,采用相应的资源调整策略调整分配给应用的资源的数量。因此,能够根据不同的健康度,采用差异化的资源调整策略,从而能根据云平台的健康度配置合理的资源量,同时提高了云平台的资源的利用率。
结合第一方面及其上述实现方式,在第一方面的第三种实现方式中,所述方法还包括:根据应用的PV的波动量和/或所述云平台的剩余资源的数量,确定所述云平台当前的运行状态属于紧急状态;确定所述云平台的预案库中与所述云平台当前的运行状态匹配的紧急预案;根据所述紧急预案的解决方案,调整分配给所述应用的资源的数量和所述ISW。在该实现方式中,云平台中管理资源的装置在根据应用的波动量和/或云平台的剩余资源的数量,确定云平台处于紧急状态时,可以快速匹配预案库中的紧急预案,根据该紧急预案的解决方案,快速分配给所述应用的资源的数量和ISW的大小,因此,通过匹配紧急预案的方法获取解决方案提高了对于紧急事件的决策速度,因此,在面对骤增的访问量时,也能及时作出反应。
结合第一方面及其上述实现方式,在第一方面的第四种实现方式中,所述确定所述云平台的预案库中与所述云平台当前的运行状态匹配的紧急预案,包括:根据所述应用的PV、所述应用的服务类型、所述云平台的剩余资源的数量和所述应用的响应时间中的至少一项来确定所述云平台当前的运行状态和所述紧急预案匹配。
结合第一方面及其上述实现方式,在第一方面的第五种实现方式中,所述根据所述云平台的健康度,确定所述资源调整策略,包括:若所述云平台的健康度小于第一健康度阈值大于第二健康度阈值,确定所述云平台的健康度属于第一健康度等级,所述第一健康度等级对应的资源调整策略为根据所述云平台的健康度,调整智能滑窗ISW的大小;若所述云平台的健康度小于第二健康度阈值大于第三健康度阈值,确定所述云平台的健康度属于第二健康度等级,所述第二健康度等级对应的资源调整策略为根据所述云平台的健康度,制定资源调整建议,向弹性伸缩系统发送所述资源调整建议,以便于所述弹性伸缩系统根据所述资源调整建议调整分配给应用的资源的数量;若所述云平台的健康度小于第三健康度阈值,确定所述云平台的健康度属于第三健康度等级,所述第三健康度等级对应的资源调整策略为从所述云平台的预案库确定跟所述云平台的健康度匹配的预案,根据处理所述预案采用的解决方案调整分配给应用的资源的数量;其中,所述第二健康度阈值小于所述第一健康度阈值,所述第三健康度阈值小于所述第二健康度阈值。在该实现方式中,该云平台中管理资源的装置可以建立不同的健康度和健康度等级的对应关系,以便于在获取健康度信息后,根据该健康度确定对应的健康度等级,从而确定该健康度等级对应的资源调整策略。
结合第一方面及其上述实现方式,在第一方面的第六种实现方式中,所述云平台的第一状态信息包括以下中的至少一项:所述应用的PV的波动量、所述云平台的剩余资源的数量、所述应用的平均应答时间和所述应用的服务健康系数β,所述β为弹性伸缩系统反馈的所述云平台的性能指标;所述云平台的第二状态信息包括以下中的至少一项:单位时间内所述应用被允许的最大PV、所述云平台的剩余的资源的数量和为应用提供服务的服务器从启动到加载入服的时间。
第二方面,提供了一种云平台中管理资源的装置,该装置包括用于执行第一方面或第一方面的任一种实现方式中的方法的各模块。
第三方面,提供了一种云平台中管理资源的装置,包括收发器件、软件器件以及硬件器件部分;
在本发明实施例中,通过软件器件和/或硬件器件实现第一方面或第一方面的任一种实现方式中的方法。
第四方面,提供了一种云平台中管理资源的装置,包括输入设备、输出设备、处理器、存储器和总线系统。其中,输入设备、输出设备、处理器、存储器通过总线系统相连,处理器通过调用存储器存储的操作指令执行该存储器存储的指令,并且对该存储器中存储的操作指令的执行使得该处理器执行第一方面或第一方面的任一种实现方式中的方法。
基于上述技术方案,本发明实施例的云平台中管理资源的方法和装置,能够根据云平台的状态信息,调整分配给应用的资源的数量以及智能滑窗的大小,因此,在用户访问量骤增时,能够通过调整分配给应用的资源的数量和ISW的大小提供稳定而高可用的服务。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单地介绍,显而易见地,下面所描述的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例所适用的云计算系统的示意图。
图2是根据本发明实施例所适用的Paas平台的示意图。
图3是根据本发明实施例的云平台中管理资源的装置的原理图。
图4是根据本发明实施例的云平台中管理资源的方法的示意性流程图。
图5是根据本发明另一实施例的云平台中管理资源的方法的示意性流程图。
图6是根据本发明实施例的云平台中管理资源的装置的一种逻辑图。
图7是根据本发明实施例的云平台中管理资源的装置的示意性框图。
图8是根据本发明另一实施例的云平台中管理资源的装置的示意性框图。
图9是根据本发明再一实施例的云平台中管理资源的装置的示意性框图。
图10是根据本发明再一实施例的云平台中管理资源的装置的示意性框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例的方法可以典型地应用于如图1所示的云计算系统中,如图1所示,云计算系统包括:云基础设施,以及运行于云基础设施之上的操作系统;其中,云基础设施可以包括由众多物理机(如服务器)所提供的硬件资源,例如中央处理器(英文全称:Central Processing Unit,简称:CPU),内存,硬盘,网络带宽等资源,还可以包括安全、供电或制冷等方面的资源。云计算系统中的操作系统通常称为云操作系统,用于实现硬件资源的抽象、管理和调度等功能。应用程序(Application,本发明实施例简称为应用)由开发者开发完成之后,被部署到云平台上,云平台作为应用与底层操作系统之间的桥梁,能为应用提供运行所需的部署环境、执行环境,以及运算、存储等系统资源,进一步地,云平台中的云管理系统可以通过负载均衡系统和/或弹性伸缩系统动态调整为应用分配的资源量。例如,在应用访问量增大时,可以给该应用分配较多的系统资源。
云计算系统中的云平台可以作为一种服务提供给用户或开发者,这种模式通常称为平台即服务(英文全称:Platform-as-a-Service,简称:PaaS),因此,云计算系统中的云平台通常也称为PaaS云平台或PaaS平台。图2为本发明实施例提供的一个PaaS平台的示意图,按照云计算逻辑结构来划分,该PaaS平台在云计算系统中位于中间层,其上层是软件即服务(英文全称:Software-as-a-Service,简称:SaaS),SaaS负责维护和管理云平台中的软硬件设施,同时以免费或者按需使用的方式向用户收费。其下层是基础设施即服务(英文全称:Infrastructure-as-a-Service,简称:IaaS),用于提供虚拟计算、存储、数据库等基础设施服务,用户可以从供应商那里获得需要的计算或者存储等资源来装载相关应用,并只需为其所租用的那部分资源付费。
本发明实施例的执行主体为云平台中管理资源的装置,在云平台中该管理资源的装置可以为多个,用于管理云平台中不同种类,不同服务类型的应用。可选地,每一个管理资源的装置都可以为独立的装置,也可以集成于云平台中的LB系统中,或者还可以集成于弹性伸缩系统中,本发明实施例对此不作限制。例如,该管理资源的装置可以为图2中的缓冲器(Bumper),它可以为该PaaS平台中的独立的模块,也可以集成在该PaaS平台中的LB系统中,或者该Bumper还可以集成于该PaaS平台中的弹性伸缩系统(即图2中的HA/伸缩)中,或者本发明实施例的云平台中管理资源的方法也可以通过该Bumper与弹性伸缩系统的结合来完成。本发明实施例对此不作限制。
应理解,本发明实施例的执行主体管理资源的装置可以简称为图2中的Bumper,当然也可以为其他的名称,本发明实施例对执行主体的名称不作限制,该Bumper可以为独立的装置,或者也可以为弹性伸缩系统,或LB系统,或者也可以集成在该弹性伸缩系统或LB系统中等,本发明实施例对此不作限制,为了简洁,本发明实施例以执行主体为Bumper来描述。
如图3所示,该Bumper可以包括状态分析模块310,预案管理模块320,资源管理模块330,其中,该状态分析模块310用于对云平台的运行状态进行分析和预测,确定云平台的健康度和智能滑窗(英文全称:Intelligent SlidingWindow,简称:ISW)的大小(ISW的大小为单位时间内应用被允许的最大综合访问量),以便于资源管理模块330根据确定的智能滑窗的大小调整ISW以疏缓访问请求骤增带来的冲击,或根据该云平台的健康度做出资源调整方案,例如,通过启动虚拟机增加给应用分配的资源量等;给应用分配的资源量指的是云平台分配给应用提供服务的资源(比如CPU、Memory)的数量;该预案管理模块320用于管理历史预案,因为云平台中的应用的种类繁多,服务类型多样化,该预案管理模块320可以抽取各类有效的历史预案,以形成针对不同服务的预案库,方便为后续的案例提供解决方案。例如,若云平台发生紧急事件,可以快速从预案库匹配跟当前事件类似的预案,例如,可以根据App的访问请求数或App的响应时间等因素来匹配跟当前事件类似的预案,然后可以根据匹配出来的预案的解决方案对ISW进行调整或增加VM等;该资源管理模块330可以用于根据匹配的预案的解决方案调整ISW或分配给应用的资源量,或根据该云平台的健康度确定相应的资源调整建议,然后根据该资源调整建议调整分配给应用的资源量,或者也可以根据该状态分析模块310确定的ISW的大小调整ISW。例如,该状态分析模块310可以根据App的PV、响应时间(英文全称:Response Time,简称:RT)以及历史的健康度数据和历史的智能滑窗的数据中的一种或几种数据,确定当前云平台的健康度和ISW的大小。该状态分析模块310还可以将确定的健康度数据和ISW数据推送给预案管理模块320,该预案管理模块320可以根据健康度数据和ISW数据跟云平台预案库中的历史预案进行匹配,确定针对该健康度数据和ISW数据的解决方案。可选地,该预案管理模块320还可以将该解决方案推送到资源管理模块330,以便于该资源管理模块330根据该解决方案调制ISW或分配给应用的资源量。该状态分析模块310也可以将确定的健康度数据和ISW数据推送到资源管理模块330,以便于该资源管理模块330可以根据健康度数据和ISW数据制定相应的解决方案。可选地,该资源管理模块330还可以将制定的该解决方案推送到预案管理模块320,作为后期的系统预案制定时的参考预案。可选地,该资源管理模块330还可以将该制定的解决方案推送给弹性伸缩系统,以便于该弹性伸缩系统根据该解决方案调整ISW或分配给应用的资源量。可选地,该状态分析模块310也可以将确定的健康度数据和ISW数据推送到弹性伸缩系统,以便于该弹性伸缩系统根据该健康度数据和ISW数据制定相应的资源调整策略,然后根据该资源调整策略调整ISW和分配给应用的资源量。
应理解,Bumper调整分配给应用的资源量主要包括两个方面:增加分配给应用的资源量(简称为“增容”),例如,增加给App提供服务的虚拟机服务器的数量等,或减少分配给应用的资源量(简称为“缩容”),例如,减少给App提供服务的VM的数量等。
图4示出了根据本发明实施例的云平台中管理资源的方法400的示意性流程图,如图4所示,该方法400包括:
S410,根据该云平台的第一状态信息,确定资源调整策略,该资源调整策略用于调整分配给该应用的资源的数量;
S420,根据该云平台的第二状态信息,确定智能滑窗ISW的大小,该ISW用于指示单位时间内该应用被允许的最大综合访问量PV;其中,该第一状态信息和该第二状态信息指示该云平台为该应用提供服务时的运行状况;
S430,根据该资源调整策略,调整分配给该应用的资源的数量,并根据确定的该ISW的大小调整该ISW。
具体而言,该方法400的执行主体为可以为图3中的缓冲器,也可以为弹性伸缩系统,或者也可以由该缓冲器结合弹性伸缩系统来完成,本发明实施例对此不作限制。首先,缓冲器根据提供云平台的第一状态信息,确定资源调整策略,该资源调整策略用于调整分配给应用的资源的数量。该缓冲器还可以根据该云平台的第二状态信息,确定ISW的大小,通过调整该ISW的大小,从而调整单位时间内应用被允许的最大访问量。该第一状态信息和该第二状态信息都指示该云平台为应用提供服务时的运行状态,该第一状态信息和该第二状态信息可以为相同的信息或不同的信息,本发明实施例对此不作限制。可选地,该云平台的第一状态信息可以包括以下中的至少一项:该应用的PV的波动量、该云平台的剩余资源的数量、该应用的平均应答时间和该应用的服务健康系数β,该β为弹性伸缩系统反馈的该云平台的性能指标;该云平台的第二状态信息包括以下中的至少一项:单位时间内该应用被允许的最大PV、该云平台的剩余的资源的数量和为应用提供服务的服务器从启动到加载入服的时间。
例如,该Bumper可以根据当前时间段内该应用的PV的波动量,预测未来一段时间内,用户访问量有持续增长的趋势,如果继续运行下去,系统的性能可能变差,此时,该Bumper根据该波动量,确定分配给应用的资源量以及ISW的大小,可选地,该Bumper可以在该PV的波动量为40%时,确定增容1台VM,调整智能滑窗大小为原来的80%,或者在该PV的波动量为80%时,确定增容4台VM,调整智能滑窗大小为原来的40%等。
因此,本发明实施例的云平台中管理资源的方法,能够根据云平台的状态信息,调整分配给应用的资源的数量以及智能滑窗的大小,因此,在用户访问量骤增时,能够保证在增容的同时,通过调整ISW的大小提供稳定而高可用的服务。
可选地,作为一个实施例,该根据该云平台的第一状态信息,确定资源调整策略,包括:
根据该第一状态信息,确定该云平台的健康度,该云平台的健康度指示该云平台给该应用提供服务时的性能状况;
根据该云平台的健康度,确定该资源调整策略。
具体地,该Bumper可以首先根据该云平台的第一状态信息,确定云平台的健康度,然后可以根据该云平台的健康度,确定针对该云平台的健康度的资源调整策略,从而根据该资源调整策略,调整分配给应用的资源的数量。可选地,因为该云平台的第一状态信息可以包括以下中的至少一项:该应用的PV的波动量、该云平台的剩余资源的数量、该应用的平均应答时间和该应用的服务健康系数β,该β为弹性伸缩系统反馈的该云平台的性能指标。该云平台的健康度可以根据该第一状态信息确定,那么该健康度也可以根据上述状态信息中的一项或几项确定,例如,可以设置云平台的剩余资源的数量越大,云平台的健康度越高,或PV的正向波动量越大,云平台的健康度越低,或者也可以设置App的响应时间越长,云平台的健康度越低等。
可选地,该云平台的健康度可以用分值表示,例如,云平台的健康度可以用0~100分来表示,可以设置100分表示云平台运行在最佳状态,分值越高,表示云平台的运行状态越好,或者也可以设置0分表示云平台运行在最佳状态,分值越高,表示云平台的运行状态越差等,本发明实施例对此不作限制。
可选地,该云平台的健康度也可以用健康度等级来表示,例如,可以设置云平台的健康度可以分为四个健康度等级:健康、亚健康、低风险和高风险,健康等级表示云平台运行状态良好,可以提供高性能的服务,亚健康等级表示云平台虽然一段时间内可以提供高性能的服务,但是如果遇到骤增的用户访问量,有可能引起云平台系统性能的下降,也就是说此时云平台系统的性能有变坏的趋势;云平台系统处于高风险等级时,表示云平台系统运行状态很差,需要采取紧急措施,例如,增大分配给应用的资源的数量。
可选地,该Bumper可以在云平台的健康度满足预设条件的情况下,调整分配给应用的资源的数量,例如,若该云平台的健康度用分值表示(0~100),并且,分值越高表示系统性能越好时,该云平台的健康度满足预设条件可以为云平台的健康度低于某个阈值,例如,该阈值可以为70分,或者若该云平台的健康度用上述四个健康度等级表示,那么云平台的健康度满足预设条件可以为云平台的健康度低于某个健康度等级。该云平台的健康度满足预设条件表示该云平台系统的运行状况有变差的趋势,如果遇到骤增的用户访问量,可能会引起系统性能的下降。可选地,该Bumper可以根据云平台的第二状态信息调整ISW的大小以疏缓访问请求骤增的冲击。例如,若当前云平台的健康度略低于第一阈值,也就是系统的运行状态还不是很差,只是不能支持骤增的用户访问量的情况的话,那么,该缓冲器可以选择调整ISW的大小来疏缓用户访问量的骤增带来的冲击,例如,可以将ISW的大小由15k/s调整到10k/s,以使得单位时间内应用被允许的用户的访问量减少,从而减轻系统的负荷。
上述解决方案往往适用于用户访问量不会持续增多的情况,如果用户的访问量有持续增多的趋势,可选地,该缓冲器可以根据未来一段时间内的用户访问量的波动量选择增加1台或多台VM,以保证云平台系统持续提供稳定高性能的服务。若当前云平台的健康度指示当前云平台系统的运行状态很差,如果不迅速增加分配给应用的资源量,应用的访问有可能面临崩溃的风险,可选地,该Bumper可以通过匹配预案库中的跟云平台的当前运行状况匹配的紧急预案,然后根据该紧急预案的解决方案调整分配给应用的资源的数量和ISW的大小,例如,若系统预案中的解决方案为增加4台VM,那么该Bumper可以根据该解决方案有节奏的增加4台VM,或者该Bumper也可以将该解决方案发送给弹性伸缩系统,然后弹性伸缩系统可以根据该解决方案,紧急增加4台VM;或者该Bumper本身可以根据当前云平台的运行状态制定资源调整策略,从而根据该资源调整策略调整分配给应用的资源的数量和ISW的大小,或者该Bumper还可以将制定的资源调整策略存储到预案库,以便于后期案例的学习和参考。
因此,本发明实施例的云平台中管理资源的方法,能够根据云平台系统的运行状态信息,调整分配给应用的资源的数量以及智能滑窗的大小,因此,在用户访问量骤增时,能够保证在增容的同时,通过调整ISW的大小提供稳定而高可用的服务。
应理解,以上举例仅为示例不作限定,Bumper确定的资源调整策略,还可以根据应用的实际应用场景、服务类型或用户需求的不同而不同,本发明实施例不对具体场景下的资源调整策略做出限制。
可选地,作为一个实施例,该云平台的第二状态信息包括以下中的至少一项:
单位时间内该应用被允许的最大PV、该云平台的剩余的资源的数量和为应用提供服务的服务器从启动到加载入服的时间。
具体地,该Bumper可以该云平台系统的第二状态信息,确定ISW的大小,该Bumper可以根据上述信息中的一项或几项确定ISW的大小。例如,该ISW的大小可以根据云平台的剩余的资源的数量和为应用提供服务的服务器从启动到加载入服的时间确定,可选地,该ISW的大小可以根据以下公式确定:
ISW=Min(Size,(Ctotal-CUsed)/Trun)
其中,Size为单位时间内应用被允许的最大的PV,Ctotal表示云平台总的资源的数量,CUsed表示已使用的资源的数量,Ctotal-CUsed表示剩余的资源的数量,该Trun为服务器从启动到加载入服务的时间,(Ctotal-CUsed)/Trun表示剩余的资源的数量能支持的用户访问量,Min表示取较小值。
也就是说,该ISW可以根据单位时间内应用被允许的最大的PV即Size和剩余的资源的数量能支持的用户访问量(Ctotal-CUsed)/Trun来确定,若该Size大于(Ctotal-CUsed)/Trun,ISW取(Ctotal-CUsed)/Trun,否则,ISW取Size的值。
可选地,作为一个实施例,该根据该云平台的健康度,确定该资源调整策略,包括:
确定多个健康度等级中该云平台的健康度对应的健康度等级;
根据该云平台预配置的多个资源调整策略与该多个健康度等级的对应关系,确定该健康度等级对应的资源调整策略。
具体地,该Bumper可以根据该云平台的健康度,确定针对该健康度的资源调整策略,然后根据该资源调整策略调整分配给应用的资源的数量。例如,可以在云平台的健康度为A时,确定增加的资源的数量为M,云平台的健康度为B时,确定增加的资源的数量为N,若系统运行在健康度A时的性能优于系统运行在健康度B时的性能,可以设置N>M,也就是说要缓解健康度为B的状态下的App的访问压力需要增加更多的资源量。可选地,该云平台的健康度可以对应多个健康度等级,每个健康度等级可以分别配置不同的资源调整策略,那么在该管理资源的装置获取该云平台的健康度以后,可以根据该云平台的健康度确定该健康度对应的健康度等级,然后确定该健康度等级对应的资源调整策略。例如,若该云平台的健康度分为四个健康度等级:健康、亚健康、低风险和高风险,可以为该四个健康度等级分别配置4种不同的资源调整策略,可选地,该四个健康度等级还可以分别对应云平台的健康度的四个分值段(以0~100分为例)。例如,该健康度等级、健康度分值和资源调整策略的对应关系可以如表1所示。其中,M1、M2、M3为大于0的整数,且M1<M2<M3。M1、M2、M3值的大小可以根据具体的应用场景确定,本发明实施例对此不作限制,表1中的数据仅为示例而非限定。例如,若确定的云平台的健康度为70,可以对照表1中该健康度等级和健康度分值的对应关系,确定当前的云平台的健康度对应的健康度等级为亚健康等级。然后Bumper可以根据该健康度等级确定该健康度等级对应的资源调整策略,通过查看表1中健康度等级与资源调整策略的对应关系,可以确定亚健康等级对应的资源调整策略为增容M1台VM。在确定相应的资源调整策略后,该Bumper可以根据该资源调整策略调整分配给应用的资源的数量,例如,若该资源调整策略为增容M1台VM,该Bumper可以调整启动M1台VM为应用提供服务。可选地,在每台VM加入服务后,该Bumper可以重新确定该云平台的健康度,以便于根据云平台的健康度的实时变化,确定针对最新的健康度数据的资源调整策略。可选地,在该每台VM加入服务的过程中,能够为应用提供服务的资源的数量在增大,系统的性能在变好,也就是说,可以满足更多的用户访问量,可选地,该Bumper可以同步调整ISW的大小,以满足更多用户的访问需求。因此,Bumper可以根据云平台的健康度的变化,逐步有节奏的进行增容,而不是等到系统面临崩溃的时候再紧急增容,从而导致增容速度赶不上并发压力增加的速度,而刚增容的服务器立即面临巨大的访问压力而立即崩溃。因此,本发明实施例的云平台中管理资源的方法,能够在保证系统提供稳定的服务的情况下,进行有节奏的增容,同时在增容的过程中,还可以通过调整ISW的大小,提供稳定而高可用的服务。例如,在逐步增容过程中,健康度迅速提高,可以增大ISW的大小,以保证更多的用户享受到服务,或者在逐步增容过程中,用户的访问量持续骤增,可以通过减小ISW的大小以舒缓用户访问量骤增带来的压力。
表1
健康度等级 健康度分值 资源调整策略
健康 71~100 0
亚健康 66~70 M<sub>1</sub>
低风险 51~65 M<sub>2</sub>
高风险 0~50 M<sub>3</sub>
应理解,表1中的健康度分值和健康度等级的对应关系仅仅是为了示例,并不对本发明实施例构成任何限定,本发明实施例还可以采用81~100、71~80、61~70、0~60分别对应健康、亚健康、低风险和高风险四个健康度等级等,本发明实施例还可以采用0~200分或0~10分等来评估云平台的健康度,还应理解,本发明实施例还可以将云平台的健康度等级分为5级或3级等。表1中的资源调整策略也仅仅是为了示例,具体应用中,需要增加的资源量跟实际的应用场景和用户需求的不同而不同,本发明实施例对此不作限制。
因此,本发明实施例的云平台中管理资源的方法,能够根据云平台系统的运行状态信息,调整分配给应用的资源的数量和智能滑窗的大小,从而能够为用户提供稳定而高可用的服务。
可选地,作为一个实施例,该方法400还包括:
根据应用的PV的波动量和/或该云平台的剩余资源的数量,确定该云平台当前的运行状态属于紧急状态;
确定该云平台的预案库中与该云平台当前的运行状态匹配的紧急预案;
根据该紧急预案的解决方案,调整分配给该应用的资源的数量和该ISW。
具体地,该Bumper根据当前的应用的PV的波动量和/或云平台系统的剩余资源的数量,确定系统处于紧急状态,例如,该Bumper根据当前的PV的波动量分析当前PV的波动量下需要新增的资源的数量远大于云平台系统的剩余资源的数量时,确定云平台系统处于紧急状态,需要紧急增容。可选地,该Bumper可以从预案库中查找跟云平台系统当前的运行状态匹配的紧急预案,例如,该Bumper可以根据当前的用户访问量以及该应用的服务类型等因素确定当前云平台系统的运行状态与该紧急预案匹配。然后该Bumper可以根据预案库中该紧急预案的解决方案,管理分配给应用的资源的数量和ISW的大小。例如,若该预案库中该紧急预案的解决方案为增容4台VM,调整ISW为原来的2倍,那么该Bumper可以根据该解决方案对云平台系统的资源作出相应的调整。
可选地,作为一个实施例,该确定该云平台的预案库中与该云平台当前的运行状态匹配的紧急预案,包括:
根据该应用的PV、该应用的服务类型、该云平台的剩余资源的数量和该应用的响应时间中的至少一项来确定该云平台当前的运行状态和该紧急预案匹配。
具体地,该Bumper可以根据该应用的PV、该应用的服务类型、云平台系统的剩余资源的数量和该应用的响应时间中的一项或几项确定该系统当前的运行状态和预案库中的紧急预案的状态匹配。例如,该Bumper可以在确定应用的服务类型一致,且应用的PV和紧急预案的应用的访问量匹配时,确定云平台系统的运行状态和该紧急预案匹配,从而可以确定该紧急预案的解决方案为当前系统的运行状态下的资源调整策略,然后可以根据该解决方案管理系统的资源和ISW的大小。
可选地,作为另一个实施例,该根据该云平台的健康度,确定云平台的健康度资源调整策略,还可以包括:
若该云平台的健康度小于第一健康度阈值大于第二健康度阈值,确定该云平台的健康度属于第一健康度等级,该第一健康度等级对应的资源调整策略为根据该云平台的健康度,调整智能滑窗ISW的大小;
若该云平台的健康度小于第二健康度阈值大于第三健康度阈值,确定该云平台的健康度属于第二健康度等级,该第二健康度等级对应的资源调整策略为根据该云平台的健康度,制定资源调整建议,向弹性伸缩系统发送该资源调整建议,以便于该弹性伸缩系统根据该资源调整建议调整分配给应用的资源的数量;
若该云平台的健康度小于第三健康度阈值,确定该云平台的健康度属于第三健康度等级,该第三健康度等级对应的资源调整策略为从该系统的预案库确定跟该云平台的健康度匹配的预案,根据处理该预案采用的解决方案调整分配给应用的资源的数量;
其中,该第二健康度阈值小于该第一健康度阈值,该第三健康度阈值小于该第二健康度阈值。
具体地,若该云平台的健康度小于第一健康度阈值大于第二健康度阈值,确定该云平台的健康度属于第一健康度等级,可选地,若该云平台的健康度分为健康、亚健康、低风险和高风险四个健康度等级区分,此时该云平台的健康度可以认为处于亚健康等级,若该云平台的健康度以100分值来划分,该第一健康度阈值可以为70分,该第二健康度阈值可以为65分。在这种状态下,系统虽然一段时间内能够提供高性能服务,但是如果PV持续增长,可能会引起系统性能的不足。可选地,该Bumper可以通过调整ISW的大小来疏缓访问请求骤增的冲击,例如,可以将当前的ISW调小一些,也就是降低该系统单位时间内允许的最大的用户访问数,换句话说,若系统的性能不是很差,此时可以通过调整ISW的大小来提高系统的性能;或者该缓冲器也可以向弹性伸缩系统发送该云平台的健康度信息,然后该弹性伸缩系统可以根据该云平台的健康度信息,制定相应的资源调整方案,从而调整分配给应用的资源的数量,例如,该弹性伸缩系统可以根据该健康度信息决定增容1台VM,以应对当前的系统状况。
若该云平台的健康度小于第二健康度阈值大于第三健康度阈值,确定该云平台的健康度属于第二健康度等级,可选地,若该云平台的健康度分为健康、亚健康、低风险和高风险四个健康度等级区分,此时该云平台的健康度等级可以认为处于低风险等级,若该云平台的健康度以100分值来划分,该第二健康度阈值可以为65分,该第三健康度阈值可以为50分。在这种状况下,可选地,该Bumper可以向弹性伸缩系统发送该云平台的健康度信息,然后该弹性伸缩系统可以根据该云平台的健康度信息,制定相应的资源调整方案,调整分配给应用的资源的数量,例如,该弹性伸缩系统根据当前的云平台的健康度信息,确定需要增容1台VM;或者该Bumper也可以将该云平台的健康度信息跟预案库中的案例的健康度信息或服务类型等信息对比,确定出跟当前的系统的状态相匹配的预案,然后将该预案的解决方案作为资源调整策略,从而根据该资源调整策略调整分配给应用的资源的数量。换句话说,若系统的运行状态有变差的风险,通过调整ISW的大小,已经不能维持系统的高性能,此时,可以通过增加分配给应用的资源的数量和调整ISW大小的解决方案来保证系统的高性能,增容的数量可以根据云平台的健康度来确定,而不是一味增大分配给应用的资源的数量,造成部分系统的资源的闲置,而用户还需为这些增加的系统的资源支付大量费用,因此,本发明实施例的云平台中管理资源的方法,也提高了系统资源的利用率。
若云平台的健康度小于第三健康度阈值,确定该云平台的健康度属于第三健康度等级,可选地,若该云平台的健康度分为健康、亚健康、低风险和高风险四个健康度等级区分,此时该云平台的健康度可以认为处于高风险等级,若该云平台的健康度以100分值来划分,该第三健康度阈值可以为50分。在这种状况下,可选地,该Bumper可以将该云平台的健康度信息跟预案库中的案例的健康度信息对比,确定跟当前的系统的运行状态相匹配的预案,然后将该预案的解决方案作为资源调整策略,从而根据该资源调整策略调整分配给应用的资源的数量。可选地,该Bumper可以将该资源调整策略通过紧急通道发送给弹性伸缩系统,然后弹性伸缩系统可以根据该资源调整策略进行紧急增容。
应理解,调整ISW大小、增加VM数量等解决方案不是孤立的,可以结合起来执行,例如,可以先增加VM数量,再调整ISW大小;或者可以边增加VM数量,边调整ISW大小,或者也可以先调整ISW大小,再增加VM数量等,本发明实施例对此不作限制。
还应理解,以上示例仅表示三种可能的实现方式,并不对执行上述三种实现方式的条件作出限制,例如,在该健康度小于第一健康度阈值大于第二健康度阈值时,也可以通过匹配预案库中的紧急预案来调整分配给应用的资源的数量或ISW的大小。另外,本发明实施例仅以健康度越大,性能越优作为示例,而非限定,也可以设置健康度越大,系统性能越差,也就是健康度也可以和系统性能成反比等。还需要说明的是,以上实施例中的健康度阈值仅为示例,而非限定,各阈值的取值还可以根据实际应用场景或需求的不同而不同。
可选地,作为一个实施例,该云平台的第一状态信息可以包括以下中的至少一项:
该应用的PV的波动量、该云平台的剩余资源的数量、该应用的平均应答时间和该应用的服务健康系数β,该β为弹性伸缩系统反馈的该云平台的性能指标。
因为该云平台的健康度由该系统的第一状态信息确定,也就是说,该云平台的健康度也可以根据以下中的至少一项确定:
该应用的PV的波动量、该云平台的剩余资源的数量、该应用的平均应答时间和该应用的服务健康系数β,该β为弹性伸缩系统反馈的该系统的性能指标。
例如,该云平台的健康度可以用oH表示,该oH可以根据以下公式确定:
oH=SUM(o×(1-Wcur),
p×Ctotal(1-(CUsed+CIncreasing)/Ctotal),
q×((RTavg-RTstd)/RTavg),
r×β)
其中,该o、该p、该q,该r皆大于或等于0且小于1,SUM(o,p,q,r)=1,SUM表示求和,也就是说o、p、q、r的和为1,该Wcur表示当前时间段内该应用的PV的波动量,该Ctotal为云平台总的资源的数量,该CUsed为已使用的资源的数量,该CIncreasing为下一时间段内需要增加的资源的数量,该RTavg为应用的平均应答时间,该RTstd为该应用的最大应答时间。β包括App系统、App所部署的服务器的中央处理器(英文全称:central processing unit简称:CPU)、存储器(memory)、磁盘(disk)等影响系统扩容的其他因素,该指标主要从弹性伸缩的监控系统或其他类似系统中获取。
具体地,若o=60%,p=30%,q=10%,r=0,那么该云平台的健康度可以根据以下公式确定:
oH=SUM(60%×(1-Wcur),
30%×Ctotal(1-(CUsed+CIncreasing)/Ctotal),
10%×((RTavg-RTstd)/RTavg))
其中,若RTavg-RTstd<0,该项取0,oH∈[0,100],oH小于0时,oH取值为0。
本发明实施例确定健康度采用的是631原则,也就是当前时间段内该App的PV的波动量占的权重为6,云平台剩余的资源的数量占的权重为3,App的平均应答时间占的权重为1。需要说明的是,本发明实施例以确定健康度采用631原则为例进行介绍仅仅是为了示例,而不应对本发明实施例构成任何限定,本发明实施例还可以采用811原则等,本发明实施例对此不作限制。
可选地,作为一个实施例,当前时间段内该App的PV的波动量Wcur可以根据以下公式(1)确定:
Wcur=(PVcur-PVprev)/max(PVcur,PVprev) (1)
其中,PVcur为当前时间段内应用的PV,PVprev为前一时间段内应用的PV。
可选地,作为一个实施例,单位时间段内该App的PV的平均波动量Wavg可以根据以下公式(2)确定:
Wavg=Avg(W1,W2,…,Wn) (2)
其中,该W1,W2,…,Wn为n个时间段的PV波动量,Avg表示求平均值。
可选地,作为一个实施例,下一个时间段内的PV可以根据以下公式(3)预测:
PVnext=Sum(50%×|PVcur|,10%×|PVprev1|,10%×|PVprev2|,10%×|PVprev3|,10%×|PVprev4|,10%×|PVprev5|) (3)
其中,PVnext为该下一个时间段内的PV,|PVprev1|、|PVprev2|、|PVprev3|、|PVprev4|和|PVprev5|为当前时间段前的5个时间段内应用的PV的绝对值;
本发明实施例预测PVnext采用的是515原则,也就是采集6个采样点的PV数据,给前5个采样点的权重设置1,给最近的采样点也就是当前采样点的权重设置5,需要说明的是,本发明实施例以预测PVnext采用515原则为例进行介绍仅仅是为了示例,而不应对本发明实施例构成任何限定,本发明实施例还可以采用811原则,也就是采集3个点,前两个点的权重为1,最近的采样点权重为8等,本发明实施例对此不作限制。
可选地,作为一个实施例,未来一段时间内该App的PV的增长量PVincreasing根据以下公式(4)确定:
PVincreasing=(Wavg×PVnext)×Trun (4)
其中,该Wavg为单位时间段内该App的PV的平均波动量,该Trun为服务器从启动到加入服务的时间。
可选地,作为一个实施例,该单位时间段内App的平均应答时间RTavg可以根据以下公式(5)确定:
RTavg=Sum(80%×RTcur,10%×RTprev1,10%×RTprev2) (5)
其中,该RTcur表示当前时间段内的该App的应答时间,该RTprev1和该RTprev2表示当前时间段前的2个时间段内该App的应答时间。
本发明实施例确定RTavg采用的是811原则,也就是采集3个采样点的RT数据,给前2个采样点的权重设置1,给最近的采样点也就是当前采样点的权重设置8,需要说明的是,本发明实施例以确定RTavg采用811原则为例进行介绍仅仅是为了示例,而不应对本发明实施例构成任何限定,本发明实施例还可以采用515原则,也就是采集6个点,前5个采样点的权重为1,最近的采样点权重为5等,本发明实施例对此不作限制。
图5示出了根据本发明一个具体实施例的云平台中管理资源的方法500的示意图,该方法500可以由图6中的各模块配合来执行。
如图6所示为简约的LB-Bumper的实现方案,LB-Bumper可以作为LB系统的一个模块单元进行工作,也可以与弹性伸缩系统对接,向该弹性伸缩系统发送健康度数据,以便于该弹性伸缩系统做出增容或缩容决策。可选地,该LB-Bumper还可以通过Keep-alive链路与弹性伸缩系统保持连接,例如,若云平台的健康度处于亚健康等级,该LB-Bumper可以通过普通通道和弹性伸缩系统进行通信,若遇到紧急情况,该LB-Bumper还可以通过紧急通道和弹性伸缩系统进行通信。
下面结合图5所示的具体实施例详细介绍根据本发明实施例的云平台中管理资源的方法,在该实施例中,设置云平台的健康度达到75时,停止增容。
S501,此时的PV较低,Bumper根据当前的应用的PV情况分析云平台的健康度为95,确定系统运行状态良好。可选地,该Bumper此时通过普通通道与弹性伸缩系统进行通信;
S502,开始有用户访问接入,但是此时的PV较低(2k/s),也就是1s内的用户访问数为2k;
S503,Bumper根据当前的PV情况,确定当前云平台的健康度和ISW的大小,根据分析结果,确定当前系统的健康状态良好,当前的ISW大小为1w,也就是此时一次允许接入的用户访问数为1万;
S504,经过一段时间的运行,PV从2k/s骤增至10w/s,Bumper根据应用的PV的波动量分析这种状态可能会持续一段时间;
S505,Bumper根据应用的PV的波动量确定当前云平台的健康度分值为40,此时当前系统处于高风险状态,可选地,Bumper从预案库查找跟系统当前的运行状态匹配的紧急预案,将该紧急预案的解决方案作为当前系统的运行状况下的解决方案。例如,该解决方案为紧急增容4台VM。可选地,该Bumper可以将该解决方案通过紧急通道通知弹性伸缩系统;
S506,该弹性伸缩系统根据该解决方案,紧急增容4台VM;
在S507、S509、S510、S512中,4台VM不断加入服务,随着4台VM的不断入服,系统的性能越来越好,可选地,在4台VM不断加入服务的过程中,该Bumper还可以根据系统的实际运行状况调整ISW的大小(例如,从1w/s→5k/s→3k/s→4.5k/s→1w/s)。
S508,处理一段时间后,云平台的健康度变为75,系统性能变好,到了S411,PV稳定在2w/s,云平台的健康度达到了80,也就是健康度大于75,因此不需要继续增容了;
S513,在之后的某个时间点,PV突然由2w/s骤增到5w/s;
S514,Bumper根据当前系统的运行状况分析,接下来的一段时间内,系统可能有超负荷或性能下降的风险;
S515,Bumper将当前的健康度信息发送给弹性伸缩系统,由于此时系统的运行状态还不是很差,因此,该Bumper可以通过普通通道向该弹性伸缩系统发送健康度信息;
S516,弹性伸缩系统根据该健康度信息确定增容1台VM;
S517、在增容1台VM后经过一段时间,PV稳定在3w/s;
S518、Bumper根据该系统的运行状况,调整ISW为1w/s;
S519、云平台的健康度为75,停止增容。
以上示例主要包括了两种场景下(一种是PV骤增的场景,另一种是PV小幅增加的场景)的云平台中管理资源的方法的实现方式,当PV骤增时,该Bumper可以根据通过匹配紧急预案,通知该弹性伸缩系统紧急增容,还可以在紧急增容的过程中不断调整ISW的大小,以疏缓PV骤然增大带来的系统冲击;当PV增幅不是很大时,该Bumper可以根据该云平台的健康度信息,确定增容数量,或者可以将该云平台的健康度信息推送到弹性伸缩系统,以便于该弹性伸缩系统根据该健康度信息确定增容策略,在增容的同时可以根据该系统的实时运行状况调整ISW的大小。
因此,本发明实施例的云平台中管理资源的方法,能够根据云平台系统的运行状态信息,调整分配给应用的资源的数量以及智能滑窗的大小,因此,在用户访问量骤增时,能够保证在增容的同时,通过调整ISW的大小提供稳定而高可用的服务。
图7示出了根据本发明实施例的云平台中管理资源的装置700的示意性框图,如图7所示,该装置700包括:
确定模块710,用于根据该云平台的第一状态信息,确定资源调整策略,该资源调整策略用于调整分配给该应用的资源的数量;
该确定模块710还用于根据该云平台的第二状态信息,确定智能滑窗ISW的大小,该ISW用于指示单位时间内该应用被允许的最大综合访问量PV;其中,该第一状态信息和该第二状态信息指示该云平台为该应用提供服务时的运行状况;
管理模块720,用于根据该资源调整策略,调整分配给该应用的资源的数量,并根据确定的该ISW的大小该调整该ISW。
具体地,该确定模块710与图3中的状态分析模块310的功能等同,该确定模块710的功能可以由软件程序实现,例如,该软件程序可以放在一个进程中实现,也可以由硬件芯片上的软件模块来实现,或者由硬件和软件模块的组合来实现等。可选地,该确定模块710可以集成在LB系统或弹性伸缩系统中,或者可以为独立的模块等。可选地,在Pass云平台中,可以为每个应用配置一个该确定模块710,也就是说该确定模块710可以是以应用为单位的,或者也可以几个应用共用一个确定模块710等,本发明实施例对此不作限制。该管理模块720与图2中的预案管理模块320和资源管理模块330的功能等同,该管理模块720的功能可以由软件程序实现,例如,该软件程序可以放在一个进程中实现,也可以由硬件芯片上的软件模块来实现,或者由硬件和软件模块的组合来实现等。可选地,该管理模块720可以集成在LB系统或弹性伸缩系统中,为LB系统或弹性伸缩系统推送资源调整策略,或者可以为独立的模块等。可选地,在Pass云平台中,可以为每个应用配置一个管理模块720,也就是说管理模块720可以是以应用为单位的,或者也可以几个应用共用一个管理模块720等,本发明实施例对此不作限制。
因此,本发明实施例的云平台中管理资源的装置,能够根据系统的运行状态信息,调整提供应用服务的资源的数量以及智能滑窗的大小,因此,在用户访问量骤增时,能够保证在增容的同时,通过调整ISW的大小提供稳定而高可用的服务。
根据本发明实施例的云平台中管理资源的装置700可对应于根据本发明实施例的云平台中管理资源的方法400中的Bumper,并且装置700中的各个模块的上述和其它操作和/或功能分别为了实现前述各个方法的相应流程,为了简洁,在此不再赘述。
如图8所示,本发明实施例还提供了一种云平台中管理资源的装置800的示意性框图,该装置800包括:
收发器件、软件器件以及硬件器件部分;
收发器件为用于完成包收发的硬件电路;
硬件器件也可称“硬件处理模块”,或者更简单的,也可简称为“硬件”,硬件器件主要包括基于FPGA、ASIC之类专用硬件电路(也会配合其他配套器件,如存储器)来实现某些特定功能的硬件电路,其处理速度相比通用处理器往往要快很多,但功能一经定制,便很难更改,因此,实现起来并不灵活,通常用来处理一些固定的功能。需要说明的是,硬件器件在实际应用中,也可以包括MCU(微处理器,如单片机)、或者CPU等处理器,但这些处理器的主要功能并不是完成大数据的处理,而主要用于进行一些控制,在这种应用场景下,由这些器件搭配的系统为硬件器件。
软件器件(或者也简单“软件”)主要包括通用的处理器(例如CPU)及其一些配套的器件(如内存、硬盘等存储设备),可以通过编程来让处理器具备相应的处理功能,用软件来实现时,可以根据业务需求灵活配置,但往往速度相比硬件器件来说要慢。软件处理完后,可以通过硬件器件将处理完的数据通过收发器件进行发送,也可以通过一个与收发器件相连的接口向收发器件发送处理完的数据。
在本发明实施例中,软件器件或者硬件器件用于进行上述实施例中提到的确定资源调整策略和ISW的大小,以及调整分配给应用的资源的数量和ISW。
通过本实施例软硬结合的方法,既保证了处理的速度,又具有灵活性。
因此,本发明实施例的云平台中管理资源的装置,能够根据云平台系统的运行状态信息,调整分配给应用的资源的数量以及智能滑窗的大小,因此,在用户访问量骤增时,能够保证在增容的同时,通过调整ISW的大小提供稳定而高可用的服务。
根据本发明实施例的云平台中管理资源的装置800可对应于根据本发明实施例的云平台中管理资源的方法400中的Bumper,并且装置800中的各个模块的上述和其它操作和/或功能分别为了实现前述各个方法的相应流程,为了简洁,在此不再赘述。
需要说明的是,本发明实施例提供的云平台中管理资源的装置,具体可以为云计算系统中的一台云主机,该云主机可以为运行在物理机上的虚拟机。如图9所示,物理机900包括硬件层910,运行在硬件层910之上的VMM(Virtual Machine Monitor,虚拟机监视器)920,以及运行在VMM 920之上的宿主机Host 901和若干虚拟机(VM,Virtual Machine),其中,硬件层包括但不限于:I/O设备、CPU和memory。本发明实施例提供的云平台中管理资源的装置具体可以为物理机900中的一台虚拟机,比如VM 940,VM 940上运行有一个或多个云应用,其中,每一个云应用都用于实现相应的业务功能,比如数据库应用、地图应用等等,这些云应用可以由开发者开发然后部署到云计算系统中。此外VM940还运行有可以执行程序,VM 940通过运行该可执行程序,并在程序运行的过程中通过宿主机Host 930来调用硬件层910的硬件资源,以实现云平台中的云平台中管理资源的装置的确定模块和管理模块的功能,具体而言,确定模块和管理模块可以以软件模块或函数的形式被包含在上述可执行程序中,比如该可执行程序可以包括:确定模块和管理模块,VM940通过调用硬件层910中的CPU、Memory等资源,以运行该可执行程序,从而实现确定模块和管理模块的功能,为了简洁,这里不再赘述。
如图10所示,本发明实施例还提供了一种管理资源的装置1000的示意性框图,该管理资源的装置1000包括处理器1010、存储器1020、总线系统1030、输入设备1040和输出设备1050。
存储器1020可以包括只读存储器和随机存取存储器,并向处理器1010提供指令和数据。存储器1020的一部分还可以包括非易失性随机存取存储器(NVRAM)。
存储器1020存储了如下的元素,可执行模块或者数据结构,或者它们的子集,或者它们的扩展集:
操作指令:包括各种操作指令,用于实现各种操作。
操作系统:包括各种系统程序,用于实现各种基础业务以及处理基于硬件的任务。
在本发明实施例中,处理器1010通过调用存储器1020存储的操作指令(该操作指令可存储在操作系统中),执行如下操作:
根据该云平台的第一状态信息,确定资源调整策略,该资源调整策略用于调整分配给该应用的资源的数量;根据该云平台的第二状态信息,确定智能滑窗ISW的大小,该ISW用于指示单位时间内该应用被允许的最大综合访问量PV;其中,该第一状态信息和该第二状态信息指示该云平台为该应用提供服务时的运行状况;根据该资源调整策略,调整分配给该应用的资源的数量,并根据确定的该ISW的大小该调整该ISW。
处理器1010控制装置1000的操作,处理器1010还可以称为CPU(CentralProcessing Unit,中央处理单元)。存储器1020可以包括只读存储器和随机存取存储器,并向处理器1010提供指令和数据。存储器1020的一部分还可以包括非易失性随机存取存储器(NVRAM)。具体的应用中,装置1000的各个组件通过总线系统1030耦合在一起,其中总线系统1030除包括数据总线之外,还可以包括电源总线、控制总线和状态信号总线等。但是为了清楚说明起见,在图中将各种总线都标为总线系统1030。为便于表示,图10中仅用一条粗线表示,但并不表示总线系统1030仅有一根总线或一种类型的总线。
上述本发明实施例揭示的方法可以应用于处理器1010中,或者由处理器1010实现。处理器1010可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器1010中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器1010可以是通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器1020,处理器1010读取存储器1020中的信息,结合其硬件完成上述方法的步骤。
因此,本发明实施例的云平台中管理资源的装置,能够根据系统的运行状态信息,调整提供应用服务的资源的数量以及智能滑窗的大小,因此,在用户访问量骤增时,能够保证在增容的同时,通过调整ISW的大小提供稳定而高可用的服务。
根据本发明实施例的云平台中管理资源的装置1000可对应于根据本发明实施例的云平台中管理资源的方法400中的Bumper,并且装置1000中的各个模块的上述和其它操作和/或功能分别为了实现前述各个方法的相应流程,为了简洁,在此不再赘述。
应理解,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
应理解,在本发明的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (10)

1.一种云平台中管理资源的方法,其特征在于,所述云平台用于为部署在其上的应用提供运行所需的资源,包括:
根据所述云平台的第一状态信息,确定资源调整策略,所述资源调整策略用于调整分配给所述应用的资源的数量;
根据所述云平台的第二状态信息,确定智能滑窗ISW的大小,所述ISW用于指示单位时间内所述应用被允许的最大综合访问量PV;其中,所述第一状态信息和所述第二状态信息指示所述云平台为所述应用提供服务时的运行状况;
根据所述资源调整策略,调整分配给所述应用的资源的数量,并根据确定的所述ISW的大小调整所述ISW;
所述云平台的第一状态信息包括以下中的至少一项:
所述应用的PV的波动量、所述云平台的剩余资源的数量、所述应用的平均应答时间和所述应用的服务健康系数β,所述β为弹性伸缩系统反馈的所述云平台的性能指标;
所述云平台的第二状态信息包括以下中的至少一项:
单位时间内所述应用被允许的最大PV、所述云平台的剩余的资源的数量和为所述应用提供服务的服务器从启动到加载入服的时间。
2.根据权利要求1所述的方法,其特征在于,所述根据所述云平台的第一状态信息,确定资源调整策略,包括:
根据所述第一状态信息,确定所述云平台的健康度,所述云平台的健康度指示所述云平台为所述应用提供服务时的性能状况;
根据所述云平台的健康度,确定所述资源调整策略。
3.根据权利要求2所述的方法,其特征在于,所述根据所述云平台的健康度,确定所述资源调整策略,包括:
确定多个健康度等级中所述云平台的健康度对应的健康度等级;
根据所述云平台预配置的多个资源调整策略与所述多个健康度等级的对应关系,确定所述健康度等级对应的资源调整策略。
4.根据权利要求1至3中任一项所述的方法,其特征在于,所述方法还包括:
根据应用的PV的波动量和/或所述云平台剩余资源的数量,确定所述云平台当前的运行状态属于紧急状态;
确定所述云平台的预案库中与所述云平台当前的运行状态匹配的紧急预案;
根据所述紧急预案的解决方案,调整分配给所述应用的资源的数量和所述ISW。
5.根据权利要求4所述的方法,其特征在于,所述确定所述云平台的预案库中与所述云平台当前的运行状态匹配的紧急预案,包括:
根据所述应用的PV、所述应用的服务类型、所述云平台的剩余资源的数量和所述应用的响应时间中的至少一项来确定所述云平台当前的运行状态和所述紧急预案匹配。
6.一种云平台中管理资源的装置,其特征在于,所述云平台用于为部署在其上的应用提供运行所需的资源,所述装置包括:
确定模块,用于根据所述云平台的第一状态信息,确定资源调整策略,所述资源调整策略用于调整分配给所述应用的资源的数量;
所述确定模块还用于根据所述云平台的第二状态信息,确定智能滑窗ISW的大小,所述ISW用于指示单位时间内所述应用被允许的最大综合访问量PV;其中,所述第一状态信息和所述第二状态信息指示所述云平台为所述应用提供服务时的运行状况;
管理模块,用于根据所述资源调整策略,调整分配给所述应用的资源的数量,并根据确定的所述ISW的大小调整所述ISW;
所述云平台的第一状态信息包括以下中的至少一项:
所述应用的PV的波动量、所述云平台的剩余资源的数量、所述应用的平均应答时间和所述应用的服务健康系数β,所述β为弹性伸缩系统反馈的所述云平台的性能指标;
所述云平台的第二状态信息包括以下中的至少一项:
单位时间内所述应用被允许的最大PV、所述云平台的剩余的资源的数量和为应用提供服务的服务器从启动到加载入服的时间。
7.根据权利要求6所述的装置,其特征在于,所述确定模块具体用于:
根据所述第一状态信息,确定所述云平台的健康度,所述云平台的健康度指示所述云平台为所述应用提供服务时的性能状况;
根据所述云平台的健康度,确定所述资源调整策略。
8.根据权利要求7所述的装置,其特征在于,所述确定模块还用于:
确定多个健康度等级中所述云平台的健康度对应的健康度等级;
根据所述云平台预配置的多个资源调整策略与所述多个健康度等级的对应关系,确定所述健康度等级对应的资源调整策略。
9.根据权利要求6至8中任一项所述的装置,其特征在于,所述确定模块还用于:
根据应用的PV的波动量和/或所述云平台的剩余资源的数量,确定所述云平台当前的运行状态属于紧急状态;
确定所述云平台的预案库中与所述云平台当前的运行状态匹配的紧急预案;
根据所述紧急预案的解决方案,调整分配给所述应用的资源的数量和所述ISW。
10.根据权利要求9所述的装置,其特征在于,所述确定模块还用于:
根据所述应用的PV、所述应用的服务类型、所述云平台的剩余资源的数量和所述应用的响应时间中的至少一项来确定所述云平台当前的运行状态和所述紧急预案匹配。
CN201610067172.XA 2016-01-29 2016-01-29 云平台中管理资源的方法和装置 Active CN107026877B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201610067172.XA CN107026877B (zh) 2016-01-29 2016-01-29 云平台中管理资源的方法和装置
PCT/CN2017/071274 WO2017128980A1 (zh) 2016-01-29 2017-01-16 云平台中管理资源的方法和装置
EP17743595.5A EP3402163B1 (en) 2016-01-29 2017-01-16 Method and device for managing resources in cloud platform
US16/047,789 US10805385B2 (en) 2016-01-29 2018-07-27 Method and apparatus for managing resource on cloud platform

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610067172.XA CN107026877B (zh) 2016-01-29 2016-01-29 云平台中管理资源的方法和装置

Publications (2)

Publication Number Publication Date
CN107026877A CN107026877A (zh) 2017-08-08
CN107026877B true CN107026877B (zh) 2020-07-07

Family

ID=59397384

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610067172.XA Active CN107026877B (zh) 2016-01-29 2016-01-29 云平台中管理资源的方法和装置

Country Status (4)

Country Link
US (1) US10805385B2 (zh)
EP (1) EP3402163B1 (zh)
CN (1) CN107026877B (zh)
WO (1) WO2017128980A1 (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109936592A (zh) * 2017-12-15 2019-06-25 中国移动通信集团浙江有限公司 服务处理的方法、装置、电子设备和存储介质
CN109213451B (zh) * 2018-09-11 2021-11-26 郑州云海信息技术有限公司 云数据系统中存储资源的管理方法和装置
US10768996B2 (en) * 2018-10-23 2020-09-08 Vmware, Inc. Anticipating future resource consumption based on user sessions
CN111381959A (zh) * 2018-12-29 2020-07-07 中兴通讯股份有限公司 扩容方法及装置
KR20200133478A (ko) * 2019-05-20 2020-11-30 삼성전자주식회사 클라우드 시스템에서 자원을 조정하기 위한 장치 및 방법
CN110221917B (zh) * 2019-05-23 2023-02-28 创新先进技术有限公司 用于分配流式数据的方法及装置
CN112346846A (zh) * 2019-08-06 2021-02-09 陆明 对云资源进行分析和编排的方法、装置以及存储介质
CN112328367B (zh) * 2020-11-11 2023-08-04 中国电子科技集团公司第十五研究所 一种云平台计算资源调度方法及系统
CN113760528A (zh) * 2020-12-24 2021-12-07 北京沃东天骏信息技术有限公司 基于多云平台的资源处理方法和装置
CN113448728B (zh) * 2021-06-22 2022-03-15 腾讯科技(深圳)有限公司 一种云资源调度方法、装置、设备及存储介质
CN115460217B (zh) * 2022-11-10 2023-07-14 军事科学院系统工程研究院网络信息研究所 一种基于强化学习的云服务高可用决策方法
CN116760832B (zh) * 2023-06-01 2024-02-13 兴容(上海)信息技术股份有限公司 一种基于多源节点的云平台资源管理系统及方法
CN117112236B (zh) * 2023-10-23 2024-02-20 山东曙光照信息技术股份有限公司 基于数据涌流及波动性预测的辖区服务器配置方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102427475A (zh) * 2011-12-08 2012-04-25 曙光信息产业(北京)有限公司 一种云计算环境中负载均衡调度的系统
CN103425535A (zh) * 2013-06-05 2013-12-04 浙江大学 云环境下的敏捷弹性伸缩方法
CN104168133A (zh) * 2014-07-11 2014-11-26 广州联智信息科技有限公司 一种动态配置api访问量的方法和网关及系统

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9015324B2 (en) * 2005-03-16 2015-04-21 Adaptive Computing Enterprises, Inc. System and method of brokering cloud computing resources
US9071609B2 (en) * 2012-10-08 2015-06-30 Google Technology Holdings LLC Methods and apparatus for performing dynamic load balancing of processing resources
CN103780646B (zh) * 2012-10-22 2017-04-12 中国长城计算机深圳股份有限公司 一种云资源的调度方法及系统
US20150341230A1 (en) * 2013-03-15 2015-11-26 Gravitant, Inc Advanced discovery of cloud resources
US9363190B2 (en) * 2013-07-31 2016-06-07 Manjrasoft Pty. Ltd. System, method and computer program product for energy-efficient and service level agreement (SLA)-based management of data centers for cloud computing
US11386442B2 (en) * 2014-03-31 2022-07-12 Liveperson, Inc. Online behavioral predictor
CN105208111B (zh) * 2015-08-31 2019-04-26 联想(北京)有限公司 一种信息处理的方法及物理机

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102427475A (zh) * 2011-12-08 2012-04-25 曙光信息产业(北京)有限公司 一种云计算环境中负载均衡调度的系统
CN103425535A (zh) * 2013-06-05 2013-12-04 浙江大学 云环境下的敏捷弹性伸缩方法
CN104168133A (zh) * 2014-07-11 2014-11-26 广州联智信息科技有限公司 一种动态配置api访问量的方法和网关及系统

Also Published As

Publication number Publication date
EP3402163A1 (en) 2018-11-14
EP3402163A4 (en) 2018-11-14
US10805385B2 (en) 2020-10-13
WO2017128980A1 (zh) 2017-08-03
US20180337984A1 (en) 2018-11-22
CN107026877A (zh) 2017-08-08
EP3402163B1 (en) 2020-07-29

Similar Documents

Publication Publication Date Title
CN107026877B (zh) 云平台中管理资源的方法和装置
US10182018B2 (en) Resource management based on device-specific or user-specific resource usage profiles
US11182213B2 (en) Application program management method and device
US8510747B2 (en) Method and device for implementing load balance of data center resources
US20170201574A1 (en) Method, system, and device for allocating resources in a server
US20190319844A1 (en) Service deployment method and apparatus
US20200218579A1 (en) Selecting a cloud service provider
US10169102B2 (en) Load calculation method, load calculation program, and load calculation apparatus
US10862992B2 (en) Resource cache management method and system and apparatus
US20120221730A1 (en) Resource control system and resource control method
JPWO2008102739A1 (ja) 仮想サーバシステム及び物理サーバ選択方法
CN110704177B (zh) 计算任务处理方法、装置、计算机设备和存储介质
US9110696B2 (en) Thin client system, connection management server, connection management method and connection management program
US9535492B2 (en) Information processing apparatus, control method, and computer-readable recording medium
CN113760516A (zh) 一种多云环境下的弹性伸缩方法、装置、设备及介质
CN106664259B (zh) 虚拟网络功能扩容的方法和装置
US9501321B1 (en) Weighted service requests throttling
Zhang et al. PRMRAP: A proactive virtual resource management framework in cloud
EP3046029B1 (en) Method and device for determining program performance interference model
US9742687B2 (en) Management system and method for execution of virtual machines
CN114003374B (zh) 基于云平台的节点调度方法、装置及电子设备和存储介质
US9354812B1 (en) Dynamic memory utilization in a system on a chip
WO2021014556A1 (ja) リソース割当装置、リソース割当方法、および、リソース割当プログラム
US9461933B2 (en) Virtual server system, management server device, and system managing method
JP6491995B2 (ja) システム設計支援装置およびシステム設計支援方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant