WO2016058415A1 - 一种应用伸缩管理方法及装置 - Google Patents

一种应用伸缩管理方法及装置 Download PDF

Info

Publication number
WO2016058415A1
WO2016058415A1 PCT/CN2015/083381 CN2015083381W WO2016058415A1 WO 2016058415 A1 WO2016058415 A1 WO 2016058415A1 CN 2015083381 W CN2015083381 W CN 2015083381W WO 2016058415 A1 WO2016058415 A1 WO 2016058415A1
Authority
WO
WIPO (PCT)
Prior art keywords
data center
application
virtual machine
expansion
capacity
Prior art date
Application number
PCT/CN2015/083381
Other languages
English (en)
French (fr)
Inventor
李新笼
Original Assignee
华为技术有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 华为技术有限公司 filed Critical 华为技术有限公司
Priority to EP15851132.9A priority Critical patent/EP3128422A4/en
Publication of WO2016058415A1 publication Critical patent/WO2016058415A1/zh
Priority to US15/336,184 priority patent/US10133606B2/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/445Program loading or initiating
    • G06F9/44505Configuring for program initiating, e.g. using registry, configuration files
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • G06F9/505Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the load
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • G06F9/5077Logical partitioning of resources; Management or configuration of virtualized resources
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5083Techniques for rebalancing the load in a distributed system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5083Techniques for rebalancing the load in a distributed system
    • G06F9/5088Techniques for rebalancing the load in a distributed system involving task migration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/45562Creating, deleting, cloning virtual machine instances
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/4557Distribution of virtual machine instances; Migration and load balancing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/50Indexing scheme relating to G06F9/50
    • G06F2209/503Resource availability

Definitions

  • the present invention relates to the field of communications technologies, and in particular, to an application scalability management method and apparatus.
  • each data center may be uneven. For example, data center A's resources are exhausted, and there is still a large amount of remaining resources in data center B.
  • the present invention provides an application scalability management method and device, which is used to expand the application by using the remaining resources of other data centers to improve resource utilization and capacity expansion when the application needs to be expanded and the remaining resources of the data center where the application is located are insufficient. effectiveness.
  • the first aspect provides an application scalability management method, including:
  • the load metric of the application running in the first data center is obtained, and when the load metric exceeds a preset expansion threshold, the resource capacity required for the application expansion is calculated;
  • selecting a second data center from the candidate data centers includes:
  • the second data center is selected from the candidate data centers.
  • the distance from the first data center to each of the candidate data centers, and the first data center and each Describe the bandwidth of the network between the candidate data centers, and select the second data center from the candidate data centers including:
  • a candidate data center corresponding to the largest sum value of the sum values is determined as the second data center.
  • establishing a network connection between the virtual machine and the first data center includes:
  • Creating a virtual router in the second data center creating a subnet in the virtual router, connecting the virtual machine to the subnet, and the first data center passing the virtual router and the virtual machine Establish a network connection.
  • the method further includes:
  • the method further includes:
  • the virtual machine required for the application to move back is created in the first data center, and the master node of the application registers the Apply the virtual machine required for the migration;
  • the second data center deletes the virtual machine.
  • an application scalability management apparatus including:
  • a determining module configured to acquire a load indicator of an application running in the first data center, and determine a resource capacity required for the application expansion when the load indicator exceeds a preset capacity expansion threshold;
  • a selection module configured to acquire a remaining resource capacity of the first data center, and determine a second data from the candidate data center when the remaining resource capacity of the first data center is not greater than the resource capacity required for the expansion The remaining resource capacity of the second data center is greater than the resource capacity required for the expansion;
  • a capacity expansion module configured to create a virtual machine required for the application expansion on the second data center, establish a network connection between the virtual machine and the first data center, and register at a control node of the application. Describe the virtual machine.
  • the selecting module is specifically configured to:
  • the second data center is selected from the candidate data centers.
  • the selecting module is specifically configured to:
  • a candidate data center corresponding to the largest sum value of the sum values is determined as the second data center.
  • the expansion module is specifically configured to:
  • Creating a virtual router in the second data center creating a subnet in the virtual router, connecting the virtual machine to the subnet, and the first data center passing the virtual router and the virtual machine Establish a network connection.
  • the sending module is further configured to:
  • the data center sends a resource reservation request, and the resource reservation application includes resource capacity, resource attribute, and resource location information of resources required for capacity expansion.
  • a backhaul module is further included,
  • the virtual machine required for the application to move back is created in the first data center, and the master node of the application registers the Apply the virtual machine required for the migration;
  • the second data center deletes the virtual machine.
  • the candidate data when determining that the load indicator of the application running in the first data center exceeds the capacity expansion threshold, and the remaining resource capacity of the first data center is not greater than the resource capacity required for capacity expansion, the candidate data is obtained. Selecting a second data center in the center, creating a virtual machine required for the application expansion in the second data center, establishing a network connection between the virtual machine and the first data center, and The main control node of the application registers the virtual machine to implement the expansion of the application in the second data center, thereby expanding the application of the first data center by using the remaining resources of other data centers, thereby improving resource utilization and capacity expansion. .
  • FIG. 1 is a schematic flowchart of a method for applying extension management in an embodiment of the present invention
  • FIG. 2 is a schematic diagram of a process of expanding a capacity in an embodiment of the present invention
  • FIG. 3 is a schematic diagram of a communication path between a master control node and a expanded virtual machine according to an embodiment of the present invention
  • FIG. 4 is a schematic diagram of a process of virtual machine relocation in an embodiment of the present invention.
  • FIG. 5 is a schematic structural diagram of an application extension management apparatus according to an embodiment of the present invention.
  • FIG. 6 is a schematic structural diagram of an application extension management device according to an embodiment of the present invention.
  • Step 101 Acquire a load indicator of the application running in the first data center, and determine the resource capacity required for the application expansion when the load indicator exceeds a preset capacity expansion threshold.
  • the load indicator of the application includes CPU resources, memory resources, and storage resources occupied by the application.
  • the expansion strategy of the application scaling group the number of virtual machines that need to be expanded and the hardware specifications of the virtual machine are determined, and the computing, storage, and network resource capacity requirements are calculated.
  • expansion requires four virtual central processing units (VCPUs), 4G of memory, 1T of capacity storage, and two internal network addresses (IP).
  • VPUs virtual central processing units
  • 4G 4G of memory
  • 1T 1T of capacity storage
  • IP internal network addresses
  • Step 102 Obtain a remaining resource capacity of the first data center, and determine that a second data is selected from the candidate data centers when the remaining resource capacity of the first data center is not greater than the resource capacity required for the capacity expansion.
  • the center, the remaining resource capacity of the second data center is greater than the resource capacity required for the expansion.
  • the candidate data center meets the remaining resource capacity of the data center that is greater than the resource capacity required for application expansion in the first data center.
  • determining the second data center has the following two situations, specifically:
  • the specific one is as follows:
  • the second data center when determining that the data center used by the application history expansion does not exist in the candidate data center, according to the distance between the first data center and each of the candidate data centers, and the first data center and each The bandwidth of the network between the candidate data centers, and the second data center is selected from the candidate data centers.
  • the candidate data center is used as the first data center. Two data centers.
  • the second data center is selected from the candidate data centers according to the distance between the first data center and each candidate data center, and the bandwidth of the network between the first data center and each candidate data center. for:
  • the resource reservation request is sent to the second data center, where the resource reservation request includes resource capacity, resource attribute, and resource location information of resources required for capacity expansion.
  • Step 103 Create a virtual machine required for application expansion on the second data center, establish a network connection between the virtual machine and the first data center, and register the virtual machine with the control node of the application.
  • the network connection between the virtual machine and the first data center required for the application expansion created on the second data center is established, specifically:
  • the remaining resource changes of the first data center are monitored in real time, and when the remaining resource capacity of the first data center exceeds the application's fallback threshold, the application needs to be created in the first data center.
  • a virtual machine and register the virtual machine required for the application to move back at the application's master node;
  • Step 201 Calculate the number of virtual machines to be expanded, the hardware specifications of the virtual machine, and the requirements for computing, storage, and network resource capacity according to the expansion policy of the application scaling group.
  • Step 202 Query whether the remaining capacity of the data center DCx of the application can meet the resource demand of the application expansion, if yes, go to step 203, otherwise, go to step 204;
  • Step 203 Perform capacity expansion in the data center DCx where the application is located;
  • Step 204 Calculate the remaining resource capacity of each data center except DCx, and determine a data center that can calculate, store, and network resources to meet the capacity expansion requirement;
  • Step 205 If the number of other data centers that meet the application capacity expansion requirement is zero, the capacity expansion fails. If one is one, step 207 is performed, and if it is greater than one, step 206 is performed;
  • Step 206 When the number of other data centers that meet the application expansion requirement is greater than one, select a data center according to the following policy, and identify the selected data center as DCy.
  • the specificity is:
  • the policy a is selected if the application has previously expanded in a data center in another data center that satisfies the application expansion requirement in step 206, otherwise the data center is selected according to the policy b;
  • Strategy b for each data center DCn in other data centers that meet the expansion demand, calculate a sum value according to the following formula: the distance between DCx and DCn ⁇ the network bandwidth between M+DCx and DCn ⁇ N, where M is a preset weight coefficient, and N is also a preset weight coefficient; the data center corresponding to the maximum value of each sum value is selected to be DCy.
  • Step 207 Initiate a resource reservation application to the DCy.
  • the content of the reservation application includes information such as calculation, storage, network resource capacity, resource quality level, and resource location.
  • the DCy reserves the application for the expansion. Resources, reserved resources are not allowed to be used by applications other than the application.
  • Step 208 Create a network required by the application-expanded virtual machine through the northbound interface of the DCy to establish network interworking between the DCx and the DCy.
  • the DCy is a multi-tenant data center
  • the network between the tenants is isolated.
  • a virtual router (vRouter) needs to be created to isolate the network from other tenants in the data center DCy. Create a subnet under the vRouter of the DCy, and connect the virtual machine that is expanded on the DCy to the subnet.
  • the vRouter in the DCx and DCy implements network communication across the data center through the virtual private network (VPN).
  • VPN virtual private network
  • Step 209 Create a virtual machine of the specification and number required for application expansion by using the northbound interface of the DCy.
  • the NIC of the virtual machine is connected to the subnet created by the application under DCy, and obtains the IP from the subnet. Address to have the ability to communicate with the virtual machine of the application on the DCx.
  • Step 210 Register the virtual machine created in step 209 at the master node to notify the master node that there is a new virtual machine in the scaling group, and send the service of the application to the newly added virtual machine for processing.
  • the virtual machine of the application in the other data center may be moved back when the remaining resources of the data center in the application are sent, and the remaining resource capacity reaches the preset threshold.
  • the specific process of returning is as follows:
  • Step 401 Collect the remaining resource capacity information of the DCx in real time. If the remaining resource capacity of the DCx exceeds the threshold of the relocation and the application of the data center across the DCx, continue to perform the step of performing the fetching, otherwise the process ends.
  • Step 402 If there are multiple applications across the data center in the DCx, select an application (such as an application identified as vAPPx) to perform the fetching.
  • an application such as an application identified as vAPPx
  • Step 403 Expand the virtual machine VMx to the application for relocating in the DCx, and add the virtual machine to the scaling group of the application.
  • Step 404 Register the virtual machine VMx expanded in step 403 at the master node of the vAPPx, so that the virtual machine can receive the service distributed by the master node.
  • Step 405 Select the virtual machine VMy of the vAPPx in the other data center DCy, and notify the master node that the service is no longer distributed to the VMy.
  • Step 406 Query whether the VMy has completed the service distributed by the master node. If yes, go to step 407. Otherwise, wait for the set duration (n seconds) to continue the query.
  • Step 407 Delete VMy from DCy.
  • Step 408 Check whether the vAPPx has a virtual machine located in another data center other than the DCx. If yes, perform the relocation process of steps 403-407. Otherwise, the process ends.
  • an embodiment of the present invention also provides an application of the telescopic management device.
  • the device mainly includes:
  • the determining module 501 is configured to obtain a load indicator of the application running in the first data center, and determine a resource capacity required for the application expansion when the load indicator exceeds a preset capacity expansion threshold;
  • the selecting module 502 is configured to acquire the remaining resource capacity of the first data center, and determine that the remaining resource capacity of the first data center is not greater than the resource capacity required for the expansion, and select a second from the candidate data centers. a data center, where a remaining resource capacity of the second data center is greater than a resource capacity required for the capacity expansion;
  • the expansion module 503 is configured to create a virtual machine required for the application expansion on the second data center, establish a network connection between the virtual machine and the first data center, and register at a control node of the application.
  • the virtual machine is configured to create a virtual machine required for the application expansion on the second data center, establish a network connection between the virtual machine and the first data center, and register at a control node of the application. The virtual machine.
  • the selection module 502 is specifically configured to:
  • the selecting module 502 is configured according to a distance between the first data center and each of the candidate data centers, and a bandwidth of a network between the first data center and each of the candidate data centers. Selecting the second data center in the candidate data center is as follows:
  • a candidate data center corresponding to the largest sum value of the sum values is determined as the second data center.
  • the expansion module 503 is specifically configured to:
  • Creating a virtual router in the second data center creating a subnet in the virtual router, connecting the virtual machine to the subnet, the first data center passing through the virtual router and the group The virtual machine establishes a network connection.
  • the method further includes a sending module 504, configured to:
  • the selection module selects the second data center from the candidate data center, before the expansion module creates a virtual machine required for application expansion on the second data center, to the second
  • the data center sends a resource reservation request, and the resource reservation application includes resource capacity, resource attribute, and resource location information of resources required for capacity expansion.
  • the relocation module 505 is further configured to: after the expansion module succeeds in the second data center, monitor the remaining resource capacity of the first data center to change, and the remaining resource capacity in the first data center exceeds The virtual machine required for the application to move back is created in the first data center, and the virtual machine required for the application to be moved back is registered in the control node of the application;
  • the second data center deletes the virtual machine.
  • an embodiment of the present invention further provides an application of a telescopic management device.
  • the device mainly includes A bus-connected processor 601 and a memory 602, wherein the processor 601 is configured to read a program in the memory 602 and perform the following steps in accordance with the program:
  • the load metric of the application running in the first data center is obtained, and when the load metric exceeds a preset expansion threshold, the resource capacity required for the application expansion is calculated;
  • the processor 601 selects a second data center from the candidate data centers, specifically:
  • the processor 601 is configured according to a distance between the first data center and each of the candidate data centers, and a bandwidth of a network between the first data center and each of the candidate data centers. Selecting the second data center in the candidate data center, specifically:
  • a candidate data center corresponding to the largest sum value of the sum values is determined as the second data center.
  • the processor 601 establishes a network connection between the virtual machine required for application expansion created in the second data center and the first data center, as follows:
  • Creating a virtual router in the second data center creating a subnet in the virtual router, connecting the virtual machine to the subnet, and the first data center passing the virtual router and the virtual machine Establish a network connection.
  • the server 603 is further configured to send a resource reservation request to the second data center, where the resource reservation request includes resource capacity, resource attribute, and resource location information of resources required for capacity expansion.
  • the processor 601 monitors a change in the remaining resource capacity of the first data center, and when the remaining resource capacity of the first data center exceeds a threshold of the application, The first data center creates a virtual machine required for the application to move back, and registers the virtual machine required for the application to move back at the master node of the application;
  • the second data center deletes the virtual machine.
  • the candidate data when determining that the load indicator of the application running in the first data center exceeds the capacity expansion threshold, and the remaining resource capacity of the first data center is not greater than the resource capacity required for capacity expansion, the candidate data is obtained.
  • a second data center is selected in the center, a virtual machine required for the application expansion is created on the second data center, a network connection between the virtual machine and the first data center is established, and the virtual machine is registered in the application control node of the application.
  • the remaining resources of other data centers can be used to expand the application of the first data center, thereby improving resource utilization and capacity expansion.

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

一种应用伸缩管理方法及装置,用于在应用需要扩容且应用所在的数据中心剩余资源不足的情况下,利用其它数据中心的剩余资源对该应用扩容,以提高资源利用率以及扩容效率。该方法为:获取第一数据中心中运行的应用的负载指标,确定该负载指标超过预设的扩容阈值时,计算该应用扩容所需的资源容量(101);获取第一数据中心的剩余资源容量,确定第一数据中心的剩余资源容量不大于扩容所需的资源容量时,从候选数据中心中选择一个第二数据中心,该第二数据中心的剩余资源容量大于所述扩容所需的资源容量(102),在所述第二数据中心上创建所述应用扩容所需的虚拟机,建立该虚拟机与第一数据中心的网络连接,在该应用的主控节点注册该虚拟机(103)。

Description

一种应用伸缩管理方法及装置
本申请要求于2014年10月17日提交中国专利局、申请号为201410554672.7、发明名称为“一种应用伸缩管理方法及装置”的中国专利申请的优先权,其全部内容通过引用结合在本申请中。
技术领域
本发明涉及通信技术领域,尤其涉及一种应用伸缩管理方法及装置。
背景技术
目前,随着信息化的普遍发展,一个企业可能会拥有多个云数据中心,并且,每个数据中心(DC)的资源消耗可能是不均衡的。例如,数据中心A的资源已经耗尽,数据中心B中仍有大量剩余资源。
假设数据中心A中运行了某应用,且该应用占用的资源具有弹性伸缩能力,若该应用需要扩充容量,而此时数据中心A中的资源已经耗尽,无法为该应用提供扩充容量所需的资源,这就导致了该应用无法扩充容量。
若在数据中心A资源耗尽且有应用有扩容需求时,对数据中心A进行容量扩充,则需要购买新的计算、存储和网络设备,扩容过程耗时,也无法及时为应用提供扩容所需的资源。并且,无法利用数据中心B中的大量剩余资源,资源利用率较低。
发明内容
本发明提供一种应用伸缩管理方法及装置,用于在应用需要扩容且应用所在的数据中心剩余资源不足的情况下,利用其它数据中心的剩余资源对该应用扩容,以提高资源利用率以及扩容效率。
本发明实施例提供的具体技术方案如下:
第一方面,提供了一种应用伸缩管理方法,包括:
获取第一数据中心中运行的应用的负载指标,确定所述负载指标超过预设的扩容阈值时,计算所述应用扩容所需的资源容量;
获取所述第一数据中心的剩余资源容量,确定所述第一数据中心的剩余资源容量不大于所述扩容所需的资源容量时,从候选数据中心中选择一个第二数据中心,所述第二数据中心的剩余资源容量大于所述扩容所需的资源容量;
在所述第二数据中心上创建所述应用扩容所需的虚拟机,建立所述虚拟机与所述第一数据中心的网络连接,在所述应用的主控节点注册所述虚拟机。
结合第一方面,在第一种可能的实现中,从候选数据中心中选择一个第二数据中心,包括:
确定所述候选数据中心存在所述应用历史扩容使用的数据中心时,将所述历史扩容使用的数据中心确定为所述第二数据中心;或者,根据所述第一数据中心与每个所述候选数据中心的距离,以及所述第一数据中心与每个所述候选数据中心之间的网络的带宽,从所述候选数据中心中选择所述第二数据中心。
结合第一方面的第一种可能的实现,在第二种可能的实现中,根据所述第一数据中心与每个所述候选数据中心的距离,以及所述第一数据中心与每个所述候选数据中心之间的网络的带宽,从所述候选数据中心中选择所述第二数据中心,包括:
将所述第一数据中心与每个所述候选数据中心的距离乘以第一系数得到的第一结果,与所述第一数据中心与每个所述候选数据中心之间的网络的带宽乘以第二系数得到的第二结果相加得到每个所述候选数据中心的和值;
将所述和值中最大和值对应的候选数据中心确定为所述第二数据中心。
结合第一方面,在第三种可能的实现中,建立所述虚拟机与所述第一数据中心的网络连接,包括:
在所述第二数据中心创建虚拟路由器,并在所述虚拟路由器中创建子网,将所述虚拟机连接至所述子网,所述第一数据中心通过所述虚拟路由器与所述虚拟机建立网络连接。
结合第一方面,在第四种可能的实现中,从所述候选数据中心中选择所述 第二数据中心后,在所述第二数据中心上创建所述应用扩容所需的虚拟机之前,所述方法还包括:
向所述第二数据中心发送资源预约申请,所述资源预约申请中包括扩容所需的资源的资源容量、资源属性和资源位置信息。
结合第一方面至第四种可能的实现中的任意一种,在第五种可能的实现中,所述方法还包括:
在所述第一数据中心的剩余资源容量超过所述应用的回迁阈值时,在所述第一数据中心创建所述应用回迁所需的虚拟机,并在所述应用的主控节点注册所述应用回迁所需的虚拟机;
通知所述应用的主控节点不再向所述第二数据中心的虚拟机发送业务数据,并在确定所述第二数据中心的虚拟机处理完所述主控节点分发的任务后,在所述第二数据中心删除所述虚拟机。
第二方面,提供了一种应用伸缩管理装置,包括:
确定模块,用于获取第一数据中心中运行的应用的负载指标,确定所述负载指标超过预设的扩容阈值时,计算所述应用扩容所需的资源容量;
选择模块,用于获取所述第一数据中心的剩余资源容量,确定所述第一数据中心的剩余资源容量不大于所述扩容所需的资源容量时,从候选数据中心中选择一个第二数据中心,所述第二数据中心的剩余资源容量大于所述扩容所需的资源容量;
扩容模块,用于在所述第二数据中心上创建所述应用扩容所需的虚拟机,建立所述虚拟机与所述第一数据中心的网络连接,在所述应用的主控节点注册所述虚拟机。
结合第二方面,在第一种可能的实现中,所述选择模块具体用于:
确定所述候选数据中心存在所述应用历史扩容使用的数据中心时,将所述历史扩容使用的数据中心确定为所述第二数据中心;或者,根据所述第一数据中心与每个所述候选数据中心的距离,以及所述第一数据中心与每个所述候选数据中心之间的网络的带宽,从所述候选数据中心中选择所述第二数据中心。
结合第二方面的第一种可能的实现,在第二种可能的实现中,所述选择模块具体用于:
将所述第一数据中心与每个所述候选数据中心的距离乘以第一系数得到的第一结果,与所述第一数据中心与每个所述候选数据中心之间的网络的带宽乘以第二系数得到的第二结果相加得到每个所述候选数据中心的和值;
将所述和值中最大和值对应的候选数据中心确定为所述第二数据中心。
结合第二方面,在第三种可能的实现中,所述扩容模块具体用于:
在所述第二数据中心创建虚拟路由器,并在所述虚拟路由器中创建子网,将所述虚拟机连接至所述子网,所述第一数据中心通过所述虚拟路由器与所述虚拟机建立网络连接。
结合第二方面,在第四种可能的实现中,还包括发送模块,用于:
在所述选择模块从所述候选数据中心中选择所述第二数据中心后,在所述扩容模块在所述第二数据中心上创建所述应用扩容所需的虚拟机之前,向所述第二数据中心发送资源预约申请,所述资源预约申请中包括扩容所需的资源的资源容量、资源属性和资源位置信息。
结合第二方面至第四种可能的实现中的任意一种,在第五种可能的实现中,还包括回迁模块,用于:
在所述第一数据中心的剩余资源容量超过所述应用的回迁阈值时,在所述第一数据中心创建所述应用回迁所需的虚拟机,并在所述应用的主控节点注册所述应用回迁所需的虚拟机;
通知所述应用的主控节点不再向所述第二数据中心的虚拟机发送业务数据,并在确定所述第二数据中心的虚拟机处理完所述主控节点分发的任务后,在所述第二数据中心删除所述虚拟机。
基于上述技术方案,本发明实施例中,在确定第一数据中心中运行的应用的负载指标超过扩容阈值,且第一数据中心的剩余资源容量不大于扩容所需的资源容量时,从候选数据中心中选择一个第二数据中心,在第二数据中心上创建该应用扩容所需的虚拟机,建立该虚拟机与第一数据中心的网络连接,并在 该应用的主控节点注册该虚拟机,实现在第二数据中心进行该应用的扩容,从而能够利用其它数据中心的剩余资源对第一数据中心的应用进行扩容,提高了资源利用率以及扩容效率。
附图说明
图1为本发明实施例中应用伸缩管理的方法流程示意图;
图2为本发明实施例中应用扩容过程示意图;
图3为本发明实施例中主控节点与扩容的虚拟机的通信路径示意图;
图4为本发明实施例中虚拟机回迁的过程示意图;
图5为本发明实施例中应用伸缩管理装置的结构示意图;
图6为本发明实施例中应用伸缩管理设备的结构示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
本发明实施例中,如图1所示,进行应用伸缩管理的详细方法流程如下:
步骤101:获取第一数据中心中运行的应用的负载指标,确定该负载指标超过预设的扩容阈值时,计算该应用扩容所需的资源容量。
其中,应用的负载指标包括应用占用的CPU资源、内存资源、存储资源等。
具体地,根据应用伸缩组的扩容策略,确定该应用需要扩容的虚拟机的个数以及虚拟机的硬件规格,计算获得该计算、存储、网络资源容量的需求。
例如,扩容需要4个虚拟中央处理器(VCPU)、4G内存、1T容量存储,两个内部网络地址(IP)。
步骤102:获取第一数据中心的剩余资源容量,确定第一数据中心的剩余资源容量不大于扩容所需的资源容量时,从候选数据中心中选择一个第二数据 中心,该第二数据中心的剩余资源容量大于该扩容所需的资源容量。
其中,候选数据中心满足该数据中心的剩余资源容量大于第一数据中心中的应用扩容所需的资源容量。
具体实施中,确定第二数据中心有以下两种情况,具体为:
第一种情况中,除第一数据中心之外的其它数据中心中剩余资源容量满足该应用扩容所需的资源容量的候选数据中心大于一个时,具体为:
确定候选数据中心存在应用历史扩容使用的数据中心时,将所述历史扩容使用的数据中心确定为所述第二数据中心;
或者,
若确定候选数据中心不存在所述应用历史扩容使用的数据中心时,根据所述第一数据中心与每个所述候选数据中心的距离,以及所述第一数据中心与每个所述候选数据中心之间的网络的带宽,从所述候选数据中心中选择第二数据中心。
具体实施中,在确定候选数据中心不存在所述应用历史扩容使用的数据中心时,根据所述第一数据中心与每个所述候选数据中心的距离,以及所述第一数据中心与每个所述候选数据中心之间的网络的带宽,从所述候选数据中心中选择第二数据中心。
第二种情况中,若除第一数据中心之外的其它数据中心中剩余资源容量满足该应用扩容所需的资源容量的候选数据中心的个数为一个,将该候选数据中心作为所述第二数据中心。
在一个具体实施中,根据第一数据中心与每个候选数据中心的距离,以及第一数据中心与每个候选数据中心之间的网络的带宽,从候选数据中心中选择第二数据中心,具体为:
针对每个候选数据中心,计算第一数据中心与该候选数据中心的距离乘以第一系数得到的第一结果,与第一数据中心与该候选数据中心之间的网络的带宽乘以第二系数得到的第二结果相加得到该候选数据中心的和值;
从针对每个候选数据中心计算得到的各和值中选择最大和值,将该最大和 值对应的候选数据中心确定为第二数据中心。
优选地,在确定第二数据中心之后,向该第二数据中心发送资源预约申请,该资源预约申请中包括扩容所需的资源的资源容量、资源属性和资源位置信息。
步骤103:在第二数据中心上创建应用扩容所需的虚拟机,建立该虚拟机与第一数据中心的网络连接,在该应用的主控节点注册该虚拟机。
优选地,建立第二数据中心上创建的该应用扩容所需的虚拟机与第一数据中心的网络连接,具体为:
在第二数据中心创建虚拟路由器,并在该虚拟路由器中创建子网,将第二数据中心上创建的该应用扩容所需的该虚拟机连接至该子网,该第一数据中心通过虚拟路由器与第二数据中心上创建的该应用扩容所需的该虚拟机建立网络连接。
优选地,在第二数据中心扩容后,实时监测第一数据中心的剩余资源变化情况,在第一数据中心的剩余资源容量超过应用的回迁阈值时,在第一数据中心创建该应用回迁所需的虚拟机,并在该应用的主控节点注册该应用回迁所需的虚拟机;
通知该应用的主控节点不再向第二数据中心的虚拟机发送业务数据,并在确定第二数据中心中的虚拟机处理完主控节点分发的任务后,在该第二数据中心删除该虚拟机。
以下通过一个具体实施例对某一应用进行扩容的详细过程进行说明,如图2所示,当某应用中伸缩组内的虚拟机负载加重,监控指标超过扩容阈值时,扩容的具体过程为:
步骤201:根据应用伸缩组的扩容策略,计算需要扩容的虚拟机的数目、虚拟机的硬件规格以及对计算、存储、网络资源容量的需求。
步骤202:查询该应用所在的数据中心DCx的资源剩余容量是否能够满足该应用扩容对资源的需求,如果能够满足,则执行步骤203,否则,执行步骤204;
步骤203:在该应用所在的数据中心DCx下进行扩容;
步骤204:分别计算除DCx之外的每个数据中心的剩余资源容量,确定计算、存储、网络资源能够满足扩容需求的数据中心;
步骤205:若满足该应用扩容需求的其它数据中心的个数为零则扩容失败,若为1个则执行步骤207,若大于1个则执行步骤206;
步骤206:当满足该应用扩容需求的其它数据中心大于一个时,按照下面的策略选择一个数据中心,将选择的数据中心标识为DCy,该策略具体为:
策略a、若该应用之前已经在满足步骤206中满足该应用扩容需求的其它数据中心中的某一数据中心中扩容,则选择该数据中心,否则按照策略b选择数据中心;
策略b、针对满足扩容需求的其它数据中心中的每个数据中心DCn,按照以下公式计算得到一个和值:DCx与DCn之间的距离×M+DCx与DCn之间的网络带宽×N,其中M为一个预设的权重系数,N也为一预设的权重系数;选择得到各和值中的最大值对应的数据中心为DCy。
步骤207:向DCy发起资源预约申请,预约申请额内容包括所需的计算、存储、网络资源容量、资源质量等级、资源位置等信息,DCy接收到资源预约申请后,预留应用扩容所需的资源,被预留资源不允许该应用之外的其它应用使用。
步骤208:通过DCy的北向接口创建该应用扩容的虚拟机所需要的网络,以建立DCx与DCy之间的网络互通。
其中,若DCy为一个多租户数据中心,由于租户之间的网络是隔离的,对于应用所属租户最少需要创建一个虚拟路由器(vRouter),用于与数据中心DCy的其它租户的网络隔离,同时需要在DCy的vRouter下创建一个子网,将应用在DCy上扩容的虚拟机接入该子网,DCx与DCy中的vRouter通过虚拟专用网(VPN)实现跨数据中心的网络通信,主控节点与扩容的虚拟机之间通过VPN进行通信的路径如图3所示。
步骤209:通过DCy的北向接口创建应用扩容所需的规格和数目的虚拟机,该虚拟机的网卡接入到应用在DCy下所创建的子网,并从该子网下获取到IP 地址,以具备与DCx上的该应用的虚拟机通信的能力。
步骤210:在主控节点注册步骤209创建的虚拟机,以通知主控节点伸缩组中有新增虚拟机,可将该应用的业务发送至该新增虚拟机进行处理。
以下通过另一个具体实施例,在应用所在的数据中心的剩余资源发送变化,且剩余资源容量达到预设的回迁阈值时,可将位于其他数据中心的该应用的虚拟机回迁,如图4所示,回迁的具体过程如下:
步骤401:实时收集DCx的剩余资源容量信息,如果DCx的剩余资源容量超过回迁阈值并且DCx中的某跨数据中心的应用时,继续执行步骤进行回迁,否则流程结束。
步骤402:如果DCx中有多个跨数据中心的应用,选择一个应用(如标识为vAPPx的应用)进行回迁。
步骤403:在DCx中给进行回迁的应用扩容虚拟机VMx,并将该虚拟机加入该应用的伸缩组。
步骤404:在vAPPx的主控节点注册步骤403扩容的虚拟机VMx,使该虚拟机能够接收主控节点分发的业务。
步骤405:选择vAPPx在其它数据中心DCy下的虚拟机VMy,通知主控节点不再分发业务到VMy。
步骤406:查询VMy是否已经完成主控节点分发的业务,若已完成,执行步骤407,否则等待设定时长(n秒)后,继续查询。
步骤407:将VMy从DCy删除。
步骤408:检查vAPPx是否还有位于DCx之外的其它数据中心的虚拟机,若有,执行步骤403-步骤407的回迁流程,否则,结束流程。
基于同一发明构思,本发明实施例中还提供了一种应用伸缩管理装置,该装置的具体实施可参见方法部分的描述,重复之处不再赘述,如图5所示,该装置主要包括:
确定模块501,用于获取第一数据中心中运行的应用的负载指标,确定所述负载指标超过预设的扩容阈值时,计算所述应用扩容所需的资源容量;
选择模块502,用于获取所述第一数据中心的剩余资源容量,确定所述第一数据中心的剩余资源容量不大于所述扩容所需的资源容量时,从候选数据中心中选择一个第二数据中心,所述第二数据中心的剩余资源容量大于所述扩容所需的资源容量;
扩容模块503,用于在所述第二数据中心上创建所述应用扩容所需的虚拟机,建立所述虚拟机与所述第一数据中心的网络连接,在所述应用的主控节点注册所述虚拟机。
优选地,所述选择模块502具体用于:
确定所述候选数据中心存在所述应用历史扩容使用的数据中心时,将所述历史扩容使用的数据中心确定为所述第二数据中心;
或者,根据所述第一数据中心与每个所述候选数据中心的距离,以及所述第一数据中心与每个所述候选数据中心之间的网络的带宽,从所述候选数据中心中选择所述第二数据中心。
优选地,所述选择模块502根据所述第一数据中心与每个所述候选数据中心的距离,以及所述第一数据中心与每个所述候选数据中心之间的网络的带宽,从所述候选数据中心中选择所述第二数据中心,具体如下:
将所述第一数据中心与每个所述候选数据中心的距离乘以第一系数得到的第一结果,与所述第一数据中心与每个所述候选数据中心之间的网络的带宽乘以第二系数得到的第二结果相加得到每个所述候选数据中心的和值;
将所述和值中最大和值对应的候选数据中心确定为所述第二数据中心。
优选地,所述扩容模块503具体用于:
在所述第二数据中心创建虚拟路由器,并在所述虚拟路由器中创建子网,将所述虚拟机连接至所述子网,所述第一数据中心通过所述虚拟路由器与所述一组虚拟机建立网络连接。
优选地,还包括发送模块504,用于:
在所述选择模块从所述候选数据中心中选择所述第二数据中心后,在所述扩容模块在所述第二数据中心上创建应用扩容所需的虚拟机之前,向所述第二 数据中心发送资源预约申请,所述资源预约申请中包括扩容所需的资源的资源容量、资源属性和资源位置信息。
优选地,还包括回迁模块505,用于:在扩容模块在第二数据中心扩容成功后,监测所述第一数据中心的剩余资源容量发生变化,在所述第一数据中心的剩余资源容量超过所述应用的回迁阈值时,在所述第一数据中心创建所述应用回迁所需的虚拟机,在所述应用的主控节点注册所述应用回迁所需的虚拟机;
通知所述应用的主控节点不再向所述第二数据中心的虚拟机发送业务数据,并在确定所述第二数据中心的虚拟机处理完所述主控节点分发的任务后,在所述第二数据中心删除所述虚拟机。
基于同一发明构思,本发明实施例中还提供了一种应用伸缩管理设备,该设备的具体实施可参见方法部分的描述,重复之处不再赘述,如图6所示,该设备主要包括通过总线连接的处理器601和存储器602,其中,处理器601用于读取存储器602中的程序,并按照程序执行下述步骤:
获取第一数据中心中运行的应用的负载指标,确定所述负载指标超过预设的扩容阈值时,计算所述应用扩容所需的资源容量;
获取所述第一数据中心的剩余资源容量,确定所述第一数据中心的剩余资源容量不大于所述扩容所需的资源容量时,从候选数据中心中选择一个第二数据中心,所述第二数据中心的剩余资源容量大于所述扩容所需的资源容量;
在所述第二数据中心上创建所述应用扩容所需的虚拟机,建立所述虚拟机与所述第一数据中心的网络连接,在所述应用的主控节点注册所述虚拟机。
优选地,处理器601从所述候选数据中心中选择一个第二数据中心,具体为:
确定所述候选数据中心存在所述应用历史扩容使用的数据中心时,将所述历史扩容使用的数据中心确定为所述第二数据中心;
或者,根据所述第一数据中心与每个所述候选数据中心的距离,以及所述第一数据中心与每个所述候选数据中心之间的网络的带宽,从所述候选数据中心中选择所述第二数据中心。
一个具体实施中,处理器601根据所述第一数据中心与每个所述候选数据中心的距离,以及所述第一数据中心与每个所述候选数据中心之间的网络的带宽,从所述候选数据中心中选择所述第二数据中心,具体为:
将所述第一数据中心与每个所述候选数据中心的距离乘以第一系数得到的第一结果,与所述第一数据中心与每个所述候选数据中心之间的网络的带宽乘以第二系数得到的第二结相加得到每个所述候选数据中心的和值;
将所述和值中最大和值对应的候选数据中心确定为所述第二数据中心。
优选地,处理器601建立所述第二数据中心上创建的应用扩容所需的虚拟机与所述第一数据中心的网络连接,具体如下:
在所述第二数据中心创建虚拟路由器,并在所述虚拟路由器中创建子网,将所述虚拟机连接至所述子网,所述第一数据中心通过所述虚拟路由器与所述虚拟机建立网络连接。
优选地,还包括发送器603,用于向所述第二数据中心发送资源预约申请,所述资源预约申请中包括扩容所需的资源的资源容量、资源属性和资源位置信息。
优选地,处理器601在第二数据中心扩容成功后,监测所述第一数据中心的剩余资源容量发生变化,在所述第一数据中心的剩余资源容量超过所述应用的回迁阈值时,在所述第一数据中心创建所述应用回迁所需的虚拟机,并在所述应用的主控节点注册所述应用回迁所需的虚拟机;
通知所述应用的主控节点不再向所述第二数据中心的虚拟机发送业务数据,并在确定所述第二数据中心的虚拟机处理完所述主控节点分发的任务后,在所述第二数据中心删除所述虚拟机。
基于上述技术方案,本发明实施例中,在确定第一数据中心中运行的应用的负载指标超过扩容阈值,且第一数据中心的剩余资源容量不大于扩容所需的资源容量时,从候选数据中心中选择一个第二数据中心,在第二数据中心上创建该应用扩容所需的虚拟机,建立该虚拟机与第一数据中心的网络连接,并在该应用的主控节点注册该虚拟机,实现在第二数据中心进行该应用的扩容,从 而能够利用其它数据中心的剩余资源对第一数据中心的应用进行扩容,提高了资源利用率以及扩容效率。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (12)

  1. 一种应用伸缩管理方法,其特征在于,包括:
    获取第一数据中心中运行的应用的负载指标,确定所述负载指标超过预设的扩容阈值时,计算所述应用扩容所需的资源容量;
    获取所述第一数据中心的剩余资源容量,确定所述第一数据中心的剩余资源容量不大于所述扩容所需的资源容量时,从候选数据中心中选择一个第二数据中心,所述第二数据中心的剩余资源容量大于所述扩容所需的资源容量;
    在所述第二数据中心上创建所述应用扩容所需的虚拟机,建立所述虚拟机与所述第一数据中心的网络连接,在所述应用的主控节点注册所述虚拟机。
  2. 如权利要求1所述的方法,其特征在于,从候选数据中心中选择一个第二数据中心,包括:
    确定所述候选数据中心存在所述应用历史扩容使用的数据中心时,将所述历史扩容使用的数据中心确定为所述第二数据中心;或者,根据所述第一数据中心与每个所述候选数据中心的距离,以及所述第一数据中心与每个所述候选数据中心之间的网络的带宽,从所述候选数据中心中选择所述第二数据中心。
  3. 如权利要求2所述的方法,其特征在于,根据所述第一数据中心与每个所述候选数据中心的距离,以及所述第一数据中心与每个所述候选数据中心之间的网络的带宽,从所述候选数据中心中选择所述第二数据中心,包括:
    将所述第一数据中心与每个所述候选数据中心的距离乘以第一系数得到的第一结果,与所述第一数据中心与每个所述候选数据中心之间的网络的带宽乘以第二系数得到的第二结果相加得到每个所述候选数据中心的和值;
    将所述和值中最大和值对应的候选数据中心确定为所述第二数据中心。
  4. 如权利要求1所述的方法,其特征在于,建立所述虚拟机与所述第一数据中心的网络连接,包括:
    在所述第二数据中心创建虚拟路由器,并在所述虚拟路由器中创建子网,将所述虚拟机连接至所述子网,所述第一数据中心通过所述虚拟路由器与所述 虚拟机建立网络连接。
  5. 如权利要求1所述的方法,其特征在于,从所述候选数据中心中选择所述第二数据中心后,在所述第二数据中心上创建所述应用扩容所需的虚拟机之前,所述方法还包括:
    向所述第二数据中心发送资源预约申请,所述资源预约申请中包括扩容所需的资源的资源容量、资源属性和资源位置信息。
  6. 如权利要求1-5任一项所述的方法,其特征在于,所述方法还包括:
    在所述第一数据中心的剩余资源容量超过所述应用的回迁阈值时,在所述第一数据中心创建所述应用回迁所需的虚拟机,并在所述应用的主控节点注册所述应用回迁所需的虚拟机;
    通知所述应用的主控节点不再向所述第二数据中心的虚拟机发送业务数据,并在确定所述第二数据中心的虚拟机处理完所述主控节点分发的任务后,在所述第二数据中心删除所述虚拟机。
  7. 一种应用伸缩管理装置,其特征在于,包括:
    确定模块,用于获取第一数据中心中运行的应用的负载指标,确定所述负载指标超过预设的扩容阈值时,计算所述应用扩容所需的资源容量;
    选择模块,用于获取所述第一数据中心的剩余资源容量,确定所述第一数据中心的剩余资源容量不大于所述扩容所需的资源容量时,从候选数据中心中选择一个第二数据中心,所述第二数据中心的剩余资源容量大于所述扩容所需的资源容量;
    扩容模块,用于在所述第二数据中心上创建所述应用扩容所需的虚拟机,建立所述虚拟机与所述第一数据中心的网络连接,在所述应用的主控节点注册所述虚拟机。
  8. 如权利要求7所述的装置,其特征在于,所述选择模块具体用于:
    确定所述候选数据中心存在所述应用历史扩容使用的数据中心时,将所述历史扩容使用的数据中心确定为所述第二数据中心;或者,根据所述第一数据中心与每个所述候选数据中心的距离,以及所述第一数据中心与每个所述候选 数据中心之间的网络的带宽,从所述候选数据中心中选择所述第二数据中心。
  9. 如权利要求8所述的装置,其特征在于,所述选择模块具体用于:
    将所述第一数据中心与每个所述候选数据中心的距离乘以第一系数得到的第一结果,与所述第一数据中心与每个所述候选数据中心之间的网络的带宽乘以第二系数得到的第二结果相加得到每个所述候选数据中心的和值;
    将所述和值中最大和值对应的候选数据中心确定为所述第二数据中心。
  10. 如权利要求7所述的装置,其特征在于,所述扩容模块具体用于:
    在所述第二数据中心创建虚拟路由器,并在所述虚拟路由器中创建子网,将所述虚拟机连接至所述子网,所述第一数据中心通过所述虚拟路由器与所述虚拟机建立网络连接。
  11. 如权利要求7所述的装置,其特征在于,还包括发送模块,用于:
    在所述选择模块从所述候选数据中心中选择所述第二数据中心后,在所述扩容模块在所述第二数据中心上创建所述应用扩容所需的虚拟机之前,向所述第二数据中心发送资源预约申请,所述资源预约申请中包括扩容所需的资源的资源容量、资源属性和资源位置信息。
  12. 如权利要求7-11任一项所述的装置,其特征在于,还包括回迁模块,用于:
    在所述第一数据中心的剩余资源容量超过所述应用的回迁阈值时,在所述第一数据中心创建所述应用回迁所需的虚拟机,并在所述应用的主控节点注册所述应用回迁所需的虚拟机;
    通知所述应用的主控节点不再向所述第二数据中心的虚拟机发送业务数据,并在确定所述第二数据中心的虚拟机处理完所述主控节点分发的任务后,在所述第二数据中心删除所述虚拟机。
PCT/CN2015/083381 2014-10-17 2015-07-06 一种应用伸缩管理方法及装置 WO2016058415A1 (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
EP15851132.9A EP3128422A4 (en) 2014-10-17 2015-07-06 Application scaling management method and apparatus
US15/336,184 US10133606B2 (en) 2014-10-17 2016-10-27 Application scaling management method and apparatus that uses distances between data centers and network resources of data centers to select a data center for expansion

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201410554672.7A CN104317638A (zh) 2014-10-17 2014-10-17 一种应用伸缩管理方法及装置
CN201410554672.7 2014-10-17

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US15/336,184 Continuation US10133606B2 (en) 2014-10-17 2016-10-27 Application scaling management method and apparatus that uses distances between data centers and network resources of data centers to select a data center for expansion

Publications (1)

Publication Number Publication Date
WO2016058415A1 true WO2016058415A1 (zh) 2016-04-21

Family

ID=52372873

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2015/083381 WO2016058415A1 (zh) 2014-10-17 2015-07-06 一种应用伸缩管理方法及装置

Country Status (4)

Country Link
US (1) US10133606B2 (zh)
EP (1) EP3128422A4 (zh)
CN (1) CN104317638A (zh)
WO (1) WO2016058415A1 (zh)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104317638A (zh) 2014-10-17 2015-01-28 华为技术有限公司 一种应用伸缩管理方法及装置
CN106227582B (zh) * 2016-08-10 2019-06-11 华为技术有限公司 弹性伸缩方法及系统
CN108023742B (zh) * 2016-10-31 2021-08-27 阿里巴巴集团控股有限公司 一种应用的扩容方法、装置和系统
CN108616366A (zh) * 2016-12-09 2018-10-02 华为技术有限公司 业务处理单元管理方法及装置
US10382565B2 (en) * 2017-01-27 2019-08-13 Red Hat, Inc. Capacity scaling of network resources
CN108664321B (zh) * 2017-03-29 2021-05-18 阿里巴巴(中国)有限公司 系统资源分配调整方法及装置
CN109324868A (zh) * 2017-07-31 2019-02-12 华为技术有限公司 一种虚拟机资源的扩缩容方法、装置及服务器
CN107959588A (zh) * 2017-12-07 2018-04-24 郑州云海信息技术有限公司 数据中心的云资源管理方法、云资源管理平台和管理系统
CN108847956B (zh) * 2018-05-08 2021-08-17 国家计算机网络与信息安全管理中心 一种电信网安全业务vnf的多维智能扩缩容方法和系统
CN109408242B (zh) * 2018-11-13 2020-08-04 郑州云海信息技术有限公司 一种服务器资源上下线方法与装置
CN111093099B (zh) * 2019-02-15 2023-04-18 杭州海康威视系统技术有限公司 一种流媒体服务调度方法、装置及系统
CN109947531B (zh) * 2019-02-27 2021-05-07 广东唯一网络科技有限公司 超融合一体机的存储容量扩展方法、装置及存储介质
US11113120B1 (en) * 2019-05-08 2021-09-07 Amazon Technologies, Inc. Intent-based auto scaling of virtual computing resources
CN110096339B (zh) * 2019-05-10 2020-08-04 重庆八戒电子商务有限公司 一种基于系统负载实现的扩缩容配置推荐系统及方法
CN110377228A (zh) * 2019-06-19 2019-10-25 深圳壹账通智能科技有限公司 区块链节点的自动扩容方法、装置、运维终端及存储介质
CN110597623A (zh) * 2019-08-13 2019-12-20 平安普惠企业管理有限公司 容器资源分配方法、装置、计算机设备和存储介质
CN110753112A (zh) * 2019-10-23 2020-02-04 北京百度网讯科技有限公司 云服务的弹性伸缩方法和装置
CN112445573A (zh) * 2020-11-04 2021-03-05 许继集团有限公司 一种基于备用机制的边缘物联代理资源调度方法及装置
CN113395178B (zh) * 2021-06-11 2022-12-09 聚好看科技股份有限公司 一种容器云弹性伸缩的方法及装置
US12009997B2 (en) * 2022-03-31 2024-06-11 Cisco Technology, Inc. Cell-based architecture for an extensibility platform
US11924115B2 (en) * 2022-05-20 2024-03-05 Ipco 2012 Limited Systems and methods for use in balancing network resources

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2570922A1 (en) * 2011-09-13 2013-03-20 Alcatel Lucent Method and system for managing an elastic server farm
CN103309723A (zh) * 2012-03-16 2013-09-18 鸿富锦精密工业(深圳)有限公司 虚拟机资源整合系统及方法
CN103547994A (zh) * 2011-05-20 2014-01-29 微软公司 用于容量管理和灾难恢复的跨云计算
CN104317638A (zh) * 2014-10-17 2015-01-28 华为技术有限公司 一种应用伸缩管理方法及装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7933983B2 (en) * 2002-12-17 2011-04-26 Hewlett-Packard Development Company, L.P. Method and system for performing load balancing across control planes in a data center
US8619771B2 (en) * 2009-09-30 2013-12-31 Vmware, Inc. Private allocated networks over shared communications infrastructure
US7801994B2 (en) * 2007-11-29 2010-09-21 Hitachi, Ltd. Method and apparatus for locating candidate data centers for application migration
US9286100B2 (en) * 2011-12-29 2016-03-15 Telefonaktiebolaget L M Ericsson (Publ) Virtual machine migration using 3GPP MCIM
US9184981B2 (en) * 2012-03-09 2015-11-10 Futurewei Technologies, Inc. System and apparatus for distributed mobility management based network layer virtual machine mobility protocol
CN103051564B (zh) * 2013-01-07 2016-03-30 杭州华三通信技术有限公司 资源动态调配的方法和装置
WO2014110743A1 (zh) * 2013-01-16 2014-07-24 华为技术有限公司 一种数据中心间资源调度方法和设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103547994A (zh) * 2011-05-20 2014-01-29 微软公司 用于容量管理和灾难恢复的跨云计算
EP2570922A1 (en) * 2011-09-13 2013-03-20 Alcatel Lucent Method and system for managing an elastic server farm
CN103309723A (zh) * 2012-03-16 2013-09-18 鸿富锦精密工业(深圳)有限公司 虚拟机资源整合系统及方法
CN104317638A (zh) * 2014-10-17 2015-01-28 华为技术有限公司 一种应用伸缩管理方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP3128422A4 *

Also Published As

Publication number Publication date
US20170046204A1 (en) 2017-02-16
EP3128422A4 (en) 2017-06-21
EP3128422A1 (en) 2017-02-08
US10133606B2 (en) 2018-11-20
CN104317638A (zh) 2015-01-28

Similar Documents

Publication Publication Date Title
WO2016058415A1 (zh) 一种应用伸缩管理方法及装置
EP3375141B1 (en) Systems and methods for distributed network-aware service placement
US8732267B2 (en) Placement of a cloud service using network topology and infrastructure performance
CN110865867B (zh) 应用拓扑关系发现的方法、装置和系统
US9229778B2 (en) Method and system for dynamic scaling in a cloud environment
US20150058486A1 (en) Instantiating incompatible virtual compute requests in a heterogeneous cloud environment
US9563453B2 (en) Decentralized management of virtualized hosts
US20160105391A1 (en) Client-driven load balancing of dynamic ip address allocation
JP2015536603A5 (zh)
WO2016058318A1 (zh) 虚拟机vm资源弹性伸缩处理方法、装置及系统
CN106991008B (zh) 一种资源锁管理方法、相关设备及系统
US20150277959A1 (en) Capture point determination method and capture point determination system
WO2015081717A1 (zh) 一种虚拟机迁移管理方法、装置及系统
CN103269364B (zh) 一种分布式云计算数据迁移方法
US10938688B2 (en) Network costs for hyper-converged infrastructures
Grover et al. Agent based dynamic load balancing in Cloud Computing
US20160048407A1 (en) Flow migration between virtual network appliances in a cloud computing network
US20150350055A1 (en) Shared resource contention
TW201409357A (zh) 虛擬機資源負載平衡系統及方法
JP2017507415A (ja) クラウド環境におけるitインフラ管理のための方法とその装置
CN106685784A (zh) 虚拟化网络功能vnf实例的伸缩方法及装置
Bhatt et al. Enhance load balancing using Flexible load sharing in cloud computing
IL268670A (en) Automatic detection of server clusters
KR101256918B1 (ko) 클라우드 서비스의 확장성과 가용성을 향상시키는 방법 및 그 시스템
US20140222896A1 (en) Distributed processing system and management method of distributed processing system

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 15851132

Country of ref document: EP

Kind code of ref document: A1

REEP Request for entry into the european phase

Ref document number: 2015851132

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 2015851132

Country of ref document: EP

NENP Non-entry into the national phase

Ref country code: DE