CN104011685B - 一种虚拟机系统的资源管理方法、虚拟机系统和装置 - Google Patents

一种虚拟机系统的资源管理方法、虚拟机系统和装置 Download PDF

Info

Publication number
CN104011685B
CN104011685B CN201280026359.5A CN201280026359A CN104011685B CN 104011685 B CN104011685 B CN 104011685B CN 201280026359 A CN201280026359 A CN 201280026359A CN 104011685 B CN104011685 B CN 104011685B
Authority
CN
China
Prior art keywords
virtual machine
cluster virtual
resource
machine
physical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201280026359.5A
Other languages
English (en)
Other versions
CN104011685A (zh
Inventor
王烽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of CN104011685A publication Critical patent/CN104011685A/zh
Application granted granted Critical
Publication of CN104011685B publication Critical patent/CN104011685B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5011Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resources being hardware resources other than CPUs, Servers and Terminals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • G06F9/5072Grid computing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5083Techniques for rebalancing the load in a distributed system

Abstract

本发明实施例提供一种虚拟机系统的资源管理方法,包括:虚拟资源管理平台可以获取所述虚拟机集群的QoS约束参数以及所述虚拟机集群的当前运行状况统计指标,根据所述虚拟机集群的QoS约束参数和所述虚拟机集群的当前运行状况统计指标,调整所述物理设备平台的物理资源调度策略或者进行所述物理设备平台上的物理资源调度。该方法可以保障云应用的QoS。

Description

一种虚拟机系统的资源管理方法、虚拟机系统和装置
技术领域
本发明实施例涉及IT技术领域,尤其涉及一种虚拟机系统的资源管理方法、虚拟机系统和装置。
背景技术
云计算的应用环境可以分为三层,分别是云应用、虚拟资源管理平台和物理设备管理平台。云应用指运行在云应用层上的程序,运行时包含一个或多个进程,可能分布在一个或多个虚拟机(VirtualMachine,VM)上。虚拟资源管理平台将物理资源虚拟化,对外提供VM、VM集群、虚拟卷、虚拟网络等虚拟资源。随着云计算的发展,对云应用的服务质量(QualityofService,QoS)的保证越来越受到重视。现有技术中,QoS的调度靠虚拟资源管理平台的调度模块来完成。调度模块可以分为从云应用到虚拟资源管理平台的上层调度模块和从虚拟资源管理平台到物理设备管理平台的下层调度模块。现有技术中,上层调度模块根据云应用的实际状态信息对VM集群的虚拟资源进行调整,例如,上层调度模块基于云应用的业务量及吞吐情况等实时状态信息确定云应用需要使用的虚拟资源,并决定需要增加或减少用来处理该云应用的VM的数量或者决定为已经创建的VM进行虚拟资源扩容或减容,上层调度模块将增加或减少VM的指令或者调整VM资源配置的指令发送给下层调度模块,下层调度模块根据所述指令通过调度物理资源来增加或减少VM,或者为VM扩容或减容。
可见,现有技术中,对VM集群的QoS的保障主要靠上层调度模块根据云应用的实时状态作出决策并指令下层进行调整;另外一方面,提供VM集群的物理资源的物理设备平台上也会有基于能耗管理和节省目的的物理资源调度策略或者物理资源的调度,例如,设定物理设备平台的物理机减容阈值为物理资源平均利用率30%,当物理设备平台的物理资源平均利用率小于30%时,就对物理设备平台上的物理机进行迁空或者下电操作,以节约能耗。
然而,上述的物理设备平台上的独立的物理资源调度策略或者物理资源的调度有可能造成以下冲突:
当上层调度模块根据云应用的实时状况决定对VM进行扩容或者增加VM数量的时候,物理设备平台上却在进行物理机的下电操作,这样就会导致为了创建新的VM或者为VM扩容时,临时上电某台物理机,因此而使得虚拟机创建或扩容操作的时延比较长,导致云应用的QoS无法保障,或者使得物理设备平台上的物理机反复上下电,并不节约能耗。
发明内容
本发明提出了一种虚拟机系统的资源管理方法、虚拟机系统和装置,用以解决物理设备平台的物理资源调度导致的无法保障云应用的QoS的问题。
第一方面,本发明实施例提供了一种虚拟机系统的资源管理方法,所述虚拟机系统为至少一个云应用提供服务,所述系统包括虚拟资源管理平台和物理设备平台,所述物理设备平台包括至少一个物理机,所述虚拟资源管理平台根据所述物理设备平台提供的物理资源为每个云应用创建至少一台虚拟机;所述方法包括:
获取所述虚拟机集群的QoS约束参数,其中,所述每个云应用对应的至少两台虚拟机组成一个虚拟机集群,所述虚拟机集群的QoS约束参数包括以下参数的任意之一或任意组合:所述虚拟机集群的资源平均利用率约束参数、所述虚拟机集群的平均通信时延的约束参数或所述虚拟机集群的占用的总资源约束参数;
获取所述虚拟机集群的当前运行状况统计指标;
根据所述虚拟机集群的QoS约束参数和所述虚拟机集群的当前运行状况统计指标,调整所述物理设备平台的物理资源调度策略或者进行所述物理设备平台上的物理资源调度。
在第一种可能的实现方式中,在所述虚拟机集群的创建过程中,接收创建所述虚拟机集群的创建请求,或者在所述虚拟机集群的运行过程中,接收所述虚拟机集群资源的更新请求,所述创建请求或者更新请求携带所述虚拟机集群的QoS约束参数;以及,记录所述虚拟机集群的QoS约束参数;
则所述获取所述虚拟机集群的QoS约束参数包括:
获取在所述虚拟机集群的创建过程中或者在所述虚拟机集群的运行过程中所记录的所述虚拟机集群的QoS约束参数。
结合第一方面的第一种可能的实现方式,在第二种可能的实现方式中,所述虚拟机集群的QoS约束参数包括:所述虚拟机集群的资源平均利用率约束参数;获取所述虚拟机集群的当前资源平均利用率的统计值;比较所述虚拟机集群的当前资源平均利用率的统计值与所述虚拟机集群的资源平均利用率约束参数,如果所述虚拟机集群的当前资源平均利用率的统计值小于所述虚拟机集群的资源平均利用率约束参数且两者之差小于设定容忍阈值,抑制所述物理设备平台上的物理机减容操作,和/或,上电所述物理设备平台上的至少一台物理机。
具体地,所述所述抑制所述物理设备平台上的物理机减容操作包括:提高所述物理设备平台上的物理机减容阈值,或者,在预定期限内不发起所述物理设备平台上的物理机迁空或下电操作。
结合第一方面的第二种可能的实现方式,在第三种可能的实现方式中,所述虚拟机集群的QoS约束参数还包括:所述虚拟机集群的占用的总资源的上限或下限;所述获取虚拟机集群的当前运行状况统计指标还包括:获取所述虚拟机集群的当前占用的总资源的统计值;所述上电至少一台所述物理设备平台上的物理机具体包括:获得所述虚拟机集群的当前占用的总资源的统计值与所述虚拟机集群的占用的总资源上限之间的差值,根据所述差值选择相应规格的物理机进行上电操作。
结合第一方面的第二种可能的实现方式,在第四种可能的实现方式中,如果所述虚拟机集群的当前资源平均利用率的统计值大于所述虚拟机集群的资源平均利用率约束参数,提高所述虚拟机集群的物理资源调度的优先级级别。
结合第一方面的第一种可能的实现方式,在第五种可能的实现方式中,所述虚拟机集群的QoS约束参数包括:所述虚拟机集群的平均通信时延的约束参数;所述获取虚拟机集群的当前运行状况统计指标包括:获取所述虚拟机集群的当前平均通信时延的统计值;比较所述虚拟机集群的当前平均通信时延的统计值与所述虚拟机集群的平均通信时延的约束参数,如果所述虚拟机集群的当前平均通信时延的统计值大于所述虚拟机集群的平均通信时延的约束参数,或者两者之差小于设定容忍阈值,集中部署所述虚拟机集群的虚拟机到相同的物理机上。
第二方面,本发明实施例还提供了一种虚拟机系统,所述虚拟机系统为至少一个云应用提供服务,所述系统包括虚拟资源管理平台和物理设备平台;所述物理设备平台包括至少一个物理机,用于提供物理资源;所述虚拟资源管理平台用于根据所述物理设备平台提供的物理资源为每个云应用创建至少一台虚拟机,所述每个云应用对应的至少两台虚拟机组成一个虚拟机集群,监控云应用的运行状况,根据所述云应用的运行状况确定是否对所述云应用对应的虚拟机集群的资源进行更新,以及调度所述物理设备平台上的物理资源以实现所述虚拟机集群的创建或者资源的更新;
所述虚拟资源管理平台还用于获取所述虚拟机集群的QoS约束参数以及所述虚拟机集群的当前运行状况统计指标,根据所述虚拟机集群的QoS约束参数和所述虚拟机集群的当前运行状况统计指标,调整所述物理设备平台的物理资源调度策略或者进行所述物理设备平台上的物理资源调度,所述虚拟机集群的QoS约束参数包括以下参数的任意之一或任意组合:所述虚拟机集群的资源平均利用率约束参数、所述虚拟机集群的平均通信时延的约束参数或所述虚拟机集群的占用的总资源约束参数。
在第一种可能的实现方式中,所述虚拟资源管理平台还用于在所述虚拟机集群的创建过程中,接收所述虚拟机集群的创建请求,或者在所述虚拟机集群的运行过程中,接收所述虚拟机集群资源的更新请求,所述创建请求或者更新请求携带所述虚拟机集群的QoS约束参数,以及,记录所述虚拟机集群的QoS约束参数。
结合第二方面的第一种可能的实现方式,在第二种可能的实现方式中,所述虚拟机集群的QoS约束参数包括:所述虚拟机集群的资源平均利用率约束参数;所述虚拟机集群的当前运行状况统计指标包括:所述虚拟机集群的当前资源平均利用率的统计值;
所述虚拟资源管理平台具体用于比较所述虚拟机集群的当前资源平均利用率的统计值与所述虚拟机集群的资源平均利用率约束参数,如果所述虚拟机集群的当前资源平均利用率的统计值小于所述虚拟机集群的资源平均利用率约束参数且两者之差小于设定容忍阈值,抑制所述物理设备平台上的物理机减容操作,和/或,上电所述物理设备平台上的至少一台物理机。
结合第二方面的第二种可能的实现方式,在第三种可能的实现方式中,所述虚拟机集群的QoS约束参数还包括:所述虚拟机集群的占用的总资源的上限或下限;所述虚拟机集群的当前运行状况统计指标包括:所述虚拟机集群的当前占用的总资源的统计值;所述虚拟资源管理平台还用于获得所述虚拟机集群的当前占用的总资源的统计值与所述虚拟机集群的占用的总资源上限之间的差值,根据所述差值选择相应规格的物理机进行上电操作。
结合第二方面的第二种可能的实现方式,在第四种可能的实现方式中,所述虚拟资源管理平台还用于在所述虚拟机集群的当前资源平均利用率的统计值大于所述虚拟机集群的资源平均利用率约束参数时,提高所述虚拟机集群的物理资源调度的优先级级别。
结合第二方面的第一种可能的实现方式,在第五种可能的实现方式中,所述虚拟机集群的QoS约束参数包括::所述虚拟机集群的平均通信时延的约束参数;所述虚拟机集群的当前运行状况统计指标包括:所述虚拟机集群的当前平均通信时延的统计值;所述虚拟资源管理平台用于比较所述虚拟机集群的当前平均通信时延的统计值与所述虚拟机集群的平均通信时延的约束参数,如果所述虚拟机集群的当前平均通信时延的统计值大于所述虚拟机集群的平均通信时延的约束参数,或者两者之差小于设定容忍阈值,集中部署所述虚拟机集群的虚拟机到相同的物理机上。
第三方面,本发明实施例还提供了一种虚拟机系统资源管理装置,所述虚拟机系统为至少一个云应用提供服务,所述系统包括虚拟资源管理平台和物理设备平台,所述物理设备平台包括至少一个物理机,所述虚拟资源管理平台根据所述物理设备平台提供的物理资源为每个云应用创建至少两台虚拟机,所述每个云应用对应的至少一台虚拟机组成一个虚拟机集群;
所述装置包括:
约束参数获取模块,用于获取所述虚拟机集群的QoS约束参数,所述虚拟机集群的QoS约束参数包括以下参数的任意之一或任意组合:所述虚拟机集群的资源平均利用率约束参数、所述虚拟机集群的平均通信时延的约束参数或所述虚拟机集群的占用的总资源约束参数;
统计指标获取模块,用于获取所述虚拟机集群的当前运行状况统计指标;
管理模块,用于根据所述虚拟机集群的QoS约束参数和所述虚拟机集群的当前运行状况统计指标,调整所述物理设备平台的物理资源调度策略或者进行所述物理设备平台上的物理资源调度。
本发明实施例由于考虑了虚拟机集群实际运行状况与虚拟机集群的QoS约束参数来进行物理资源的调度,避免资源管理平台不考虑虚拟机集群的运行状况而只根据物理机集群的资源状况进行虚拟机的创建或者独立的物理资源调度,并因此规避了临时上电物理机造成的虚拟机创建、更新的时间延迟,因而可以解决物理设备平台的物理资源调度导致的无法保障云应用的QoS的问题。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例一提供的虚拟机系统的组成示意图;
图2为本发明实施例二中云应用部署过程流程示意图;
图3为本为本发明实施例三中云应用运行过程资源更新流程示意图;
图4为本发明实施例四提供的虚拟机系统资源管理流程示意图;
图5为为本发明实施例五提供的虚拟机系统资源管理流程示意图;
图6为为本发明实施例六提供的虚拟机系统资源管理装置示意图;
图7为为本发明实施例七提供的虚拟机系统资源管理装置示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
虚拟机系统
为了更好的理解本发明实施例,需要介绍一下本发明实施例的系统架构,系统架构可分为云应用层、虚拟机集群、物理设备平台、虚拟资源管理平台:
云应用层,用于提供云应用程序给用户,其中云应用程序可以包含多个进程,进程需要在虚拟机上创建,可以是一个进程对应一台虚拟机,也可以是多个进程对应一台虚拟机;
虚拟机集群,由虚拟机组成,服务于一个相同的云应用的虚拟机组成一个虚拟机集群。其中,虚拟机的资源又是由物理设备平台上的物理机提供的,可以是一台虚拟机对应一台物理机,也可以是多台虚拟机对应一台物理机;
物理设备平台,包括至少一台物理机,用于提供虚拟机所需要使用的物理资源,为云应用提供物理实体。
虚拟资源管理平台,根据所述物理设备平台提供的物理资源为每个云应用创建至少一台虚拟机,同时负责虚拟机集群的调度,监控云应用的运行状况,也即监控所述虚拟机集群的运行状况,当云应用层的云应用的QoS无法保障时,为虚拟机集群调度新的虚拟机或者为已有的虚拟机扩容,以保障云应用程序的QoS;另外,还根据物理资源使用状况对集群中的物理机进行能耗管理或物理资源的调度。如图1所示,为本发明实施例一提供的虚拟机系统架构图的一种示例,该示例中的云应用层11包括云应用1和云应用2,每个云应用示例性地包括一个控制进程和多个工作进程,本实施例仅以两个云应用为例,本领域技术人员完全可以理解,系统根据实际工作情况还可以支持更多的云应用或者仅有一个云应用在系统中运行。具体地说,云应用的种类可以包含桌面云VDI业务、数据分析业务或者网站业务等。
虚拟资源管理平台12,可以由一个或多个软件组件或模块来实现,用于为云应用层11中的各种云应用创建虚拟机VM,虚拟资源管理平台12在创建VM的时候还将物理设备平台13中的物理资源配置给每台VM,其中,对应于一个云应用的所有VM组成一个虚拟机集群(VMCluster)。本实施例中,相应于云应用层11包含的云应用1和云应用2,虚拟资源管理平台创建了VMCluster1和VMCluster2,VMCluster1对应于云应用1,VMCluster1中包含多台虚拟机,VMCluster2对应于云应用2,VMCluster2中包含多台虚拟机。虚拟资源管理平台12在为云应用创建VMCluster之后,还会监控云应用的运行状况信息,并进行VMCluster中的VM的数量或者配置的调度,以及获取所述VMCluster的QoS约束参数以及所述VMCluster的当前运行状况统计指标,根据所述VMCluster的QoS约束参数和所述VMCluster的当前运行状况统计指标,调整所述物理设备平台的物理资源调度策略或者进行所述物理设备平台上的物理资源调度。
物理设备平台13上的物理机集群包含一台或多台物理机,本实施例以物理机集群包含三台物理机示例。物理机集群提供的物理资源可以包括CPU资源、内存资源、存储资源以及网络资源中的一种或者多种,物理设备平台13提供的物理资源被虚拟资源管理平台12抽象成多台虚拟机,并分配到VMCluster中为相应的云应用服务。
本实施例作为本发明实施例之一,其中的虚拟资源管理平台12可以具体包括上层调度模块121和下层调度模块122,在以下的本说明书中的后续实施例中会具体阐述所述的上层调度模块121或下层调度模块122如何执行调度工作的。
虚拟机集群的QoS约束参数
一个VMCluster可以视为一个虚拟资源池,该资源池中的物理资源用于为同一个云应用进行服务,因此,要保障云应用的QoS,本发明实施例中的虚拟资源管理平台还需要考虑该云应用所对应的VMCluster的QoS约束参数。
本发明实施例所提到的VMCluster的QoS约束参数可以包括VMCluster占用的总资源的约束参数、VMCluster的资源平均利用率的约束参数、VMCluster的平均通信时延的约束参数中的一种或者多种,所述的约束参数可以是具体的范围值,例如上下限,也可以是最小值或者最大值的任意一种,例如上限或者下限。举例来说,所述的VMCluster占用的总资源的约束参数可以为VMCluster中的所有VM能够允许占用的总内存的上下限,或者是VMCluster中的所有VM能够允许占用的总虚拟中央处理器(VirtualCentralProcessingUnit,VCPU)数量的上下限,或者是VMCluster中能够创建的VM的总个数的上下限,所述的VMCluster的资源平均利用率的约束参数可以是VMCluster中的所有VM占用的内存的平均利用率的上下限,或者是VMCluster中的所有VM占用的CPU的平均利用率的上下限,所述的VMCluster的平均通信时延的约束参数可以是VMCluster中的所有VM的平均通信时延能够允许的上下限。
应当可以理解,上述对VMCluster的QoS约束参数的描述仅仅是作为示例性的,资源也只是示例性地以内存或CPU为例,本领域技术人员完全可以根据上述描述,将本发明所提到的VMCluster的QoS约束参数理解到所有能够影响到VMCluster的QoS的具有集群性质的参数上。另外,本实施例采用VCPU表示VM的CPU的度量单位,一个VCPU的具体大小可以指代本领域技术中通用的任何一种CPU计算能力的单位,例如MIPS(每秒百万指令数)或者MHz(百万赫兹)。
虚拟机的QoS策略
虚拟机的QoS策略包括VM区域性约束参数、VM驻留性约束参数、VM关联性约束参数或VM互斥性约束参数中的一种或几种。VM区域性约束参数表示指定的虚拟机只能在指定范围的物理机上创建和迁移,用以保证云应用的安全或者资源。VM驻留性约束参数表示指定的虚拟机很重要,不可自动迁移,如需迁移则通知管理员,由人工决定。VM关联性约束参数表示指定的多个虚拟机需要放置在同一物理机上,以提高通信QoS。VM互斥性约束参数指定的多个虚拟机不能放置在同一物理机上,以提高应用的可靠性。
本发明实施例的资源管理策略
基于上述提及的虚拟机集群的QoS约束参数和虚拟机的QoS策略,本发明实施例为解决物理设备平台的物理资源调度导致的无法保障云应用的QoS的问题,资源管理平台需要获取QoS约束参数和虚拟机的QoS策略两者或者两者任一,并据此创建或者更新虚拟机的资源,或者调整物理设备平台的物理资源调度策略,或者进行物理设备平台上的物理资源调度。
如上述图1所示的虚拟机系统,其中的虚拟资源管理平台可以获取所述虚拟机集群的QoS约束参数以及所述虚拟机集群的当前运行状况统计指标,根据所述虚拟机集群的QoS约束参数和所述虚拟机集群的当前运行状况统计指标,调整所述物理设备平台的物理资源调度策略或者进行所述物理设备平台上的物理资源调度。
一个具体的实施例中,资源管理平台中的上层调度模块可以将虚拟机集群的QoS约束参数和虚拟机的QoS策略两者或者两者任一提供给下层调度模块,以使得下层调度模块在创建虚拟机,或者在更新虚拟机,或者在进行以能耗管理为目的的物理资源调度时以其作为考量因素,同时考虑虚拟机集群的当前运行状况统计指标,并在比较统计指标与考量因素的基础上,创建或者更新虚拟机的资源,或者调整物理设备平台的物理资源调度策略,或者进行物理设备平台上的物理资源调度。
本发明实施例的资源管理策略,由于考虑了虚拟机集群的QoS约束参数来进行物理资源的调度,避免资源管理平台不考虑虚拟机集群的运行状况而只根据物理机集群的资源状况进行虚拟机的创建或者独立的物理资源调度,并因此规避了临时上电物理机造成的虚拟机创建、更新的时间延迟,因而可以解决物理设备平台的物理资源调度导致的无法保障云应用的QoS的问题,同时,物理机的资源管理更加优化,避免了反复上下电物理机造成的能耗浪费。
另外一个方面,由于虚拟机的QoS策略也成为物理资源调动的考量因素,保证了虚拟机在正确的物理机上进行创建,保证云应用的安全或者资源,以及提高通信QoS。
以下将分别介绍在云应用的部署过程、更新过程以及运行过程中的自动监控过程中本发明实施例的资源管理的方法。
云应用部署过程中的虚拟机集群创建
在本发明的一个实施例中,如图2所示,云应用的部署过程中上层调度模块和下层调度模块的资源调度工作流程可以包括:
步骤201:接收创建云应用的请求,获取为所述云应用服务的VMCluster的属性信息和该VMCluster中的各个VM的属性信息,所述VMCluster的属性信息包含该VMCluster的标识信息、该VMCluster中所包含的VM的数量、各个VM之间的网络拓扑关系和该VMCluster的QoS约束参数,所述各个VM的属性信息包括各个VM的规格(即VM的资源配置情况,例如VM的内存大小或者VCPU的个数)和VM的QoS策略;
具体地,本实施例中的VMCluster的QoS约束参数可以包括以下参数中的任意一种或者多种:VMCluster可占用的总内存的上限值和下限值、VMCluster的CPU平均利用率的上限值和VMCluster的平均通信时延上限值。
例如,待创建的云应用1的VMCluster的属性信息如下:
VM集群标识:VMCluster1;
VM数量:3;
VM镜像:image1;
VMCluster的QoS约束参数:
(1)VMCluster占用的总内存:上限500G,下限100G;
(2)VMCluster的CPU平均利用率:VMCluster1的平均CPU利用率小于20%;
(3)VMCluster的平均通信时延:小于1s。
各个VM的属性信息如下:
VM规格:VM1(2VCPU、60G内存);
VM2(2VCPU、60G内存);
VM3(2VCPU、40G内存);
VM的QoS策略:
(1)VM区域性约束参数:所有VM必须在剩余内存大于20G的物理机上运行;
(2)VM驻留性约束参数:所有VM可迁移;
(3)VM关联性约束参数:VM1和VM2需要在同一物理机上运行;
(4)VM互斥性约束参数:VM3和VM1需要在不同一物理机上运行。
上述所获取的VMCluster的属性信息和各个VM的属性信息可以是用户创建的云应用模板中直接指定的,也可以是根据待创建的云应用的信息以及预置的策略共同确定的,本发明实施例对此不做限定。
步骤202:上层调度模块根据预先配置的VM部署策略(本实施例中可选项,若无该策略配置可以不作为参考项)、所述VMCluster的属性信息和各个VM的属性信息,确定所述云应用的进程在VMCluster上的部署方案。
例如,云应用的进程在VMCluster上的部署方案(即应用进程拓扑信息):
控制进程组CtrlGroup,成员:CtrlProc;
工作进程组WorkerGroup,成员:WorkerProc#;表示成员进程名为WorkerProc1,WorkerProc2,WorkerProc3;
CtrlProc所在VM:VMCluster1.VM1;
WorkerProc1所在VM:VMCluster1.VM2;
WorkerProc2所在VM:VMCluster1.VM2;
WorkerProc3所在VM:VMCluster1.VM3。
步骤203:上层调度模块向下层调度模块提交VMCluster的创建请求,该VMCluster的创建请求包含所述VMCluster的属性信息和该VMCluster中包含的各个VM的属性信息。
步骤204:下层调度模块记录VMCluster的属性信息和/或该VMCluster中包含的各个VM的属性信息;
步骤205:下层调度模块查询当前物理设备平台上的物理资源的状态信息(可以包含各物理机的资源利用率、拓扑关系或者可用资源数量等),根据当前物理设备平台上的物理资源的状态信息、VMCluster的属性信息和各个VM的属性信息,确定该VMCluster是否能够在该物理设备平台上创建,如果否,向上层调度模块返回失败响应消息,如果是,执行步骤206;
具体地,本发明实施例中,由于上层调度模块传递到下层调度模块的VMCluster的属性信息中包含VMCluster的QoS约束参数,因此,在本步骤中,下层调度模块还可以进一步确定该VMCluster是否能够在该物理机集群上创建,例如,如果物理机集群当前的剩余内存量小于或等于该VMCluster可占用的总内存的下限值,下层调度模块据此可判断在该物理机集群上创建该VMCluster不可能满足云应用的QoS,因此确定该VMCluster不能够在该物理机集群上创建。
具体实践中,本步骤205是可选执行的,大多数情况下,物理机集群的剩余资源和能力都能够满足VMCluster的初始部署的要求,当VMCluster的属性信息中包含VMCluster可占用的总资源的下限值,则本步骤被有条件的执行,以进一步优化调度模块的性能,保障其所创建的VMCluster所服务的云应用的QoS。
步骤206:下层调度模块根据当前物理设备平台上的物理资源的状态信息和各个VM的属性信息,确定VMCluster上的各VM在物理机集群上的部署方案。
具体地,例如物理机集群包含的物理机当前的资源利用情况分别如下:
PM1:总内存:150G,已用内存:10G;总VCPU:50个,已用VCPU:5个;
PM2:总内存:150G,已用内存:20G;总VCPU:50个,已用VCPU:10个;
PM3:总内存:150G,已用内存:0G;总VCPU:50个,已用VCPU:0个。
根据VMCluster的属性信息以及上述物理机的情况,确定的VMCluster上的各VM在物理机集群上的部署方案如下:
VM1:规格(2VCPU,60G内存),所在PM(PM1);
VM2:规格(2VCPU,40G内存),所在PM(PM1);
VM3:规格(2VCPU,60G内存),所在PM(PM2)。
即根据VM关联性约束参数,将VM1和VM2部署在同一物理机PM1上运行,根据VM互斥性约束参数,将VM3和VM1分别部署在不同的物理机PM1和PM2上运行。
步骤207:下层调度模块根据确定的VMCluster上的各VM在物理机集群上的部署方案,利用该物理机集群上的资源创建该VMCluster中的各VM。
步骤208:下层调度模块通知上层调度模块该VMCluster中的各VM已创建成功,上层调度模块安装云业务组件到各VM上,根据步骤202确定的云应用的进程在VMCluster上的部署方案在各VM上加载相应的进程。
至此,云应用的部署过程完成,该云应用的各个进程在相应的VM上运行。在云应用的部署过程中,资源管理平台获取所述VMCluster的属性信息和该VMCluster中的各个VM的属性信息中包含的VMCluster的QoS约束参数和VM的QoS策略两者或者两者任一,并可用以后续资源监控过程中的调度考量因素,同时,根据VMCluster的QoS约束参数确定待创建的VMCluster是否能在物理设备平台上创建,避免了不必要的流程浪费,提高虚拟机集群创建的时延,对QoS的保障起到促进作用。
云应用运行过程中的虚拟机集群更新
在云应用部署完毕之后,上下层调度模块都会启动相应的资源调度工作,具体地说,上层调度模块启动监控云应用的进程信息,获得为云应用服务的VMCluster的运行信息,并根据预置的策略决定对VMCluster中的VM的数量或者资源配置进行调度,如增加或者减少VM,为已有VM扩容或者减容;下层调度模块根据上层调度模块的指令调度物理资源,以增加或者删除VM,或者为已有的VM扩容或者减容。
如图3所示,在本发明的一个实施例中,云应用的运行过程中上层调度模块资源调度工作流程可以包括:
步骤301:上层调度模块实时监控云应用的进程信息以获取云应用的运行信息;
例如,获取到云应用的如下运行信息:
应用名称:App1;
应用所在的VM集群:VMCluster1;
应用进程拓扑信息:
控制进程组CtrlGroup,成员:CtrlProc;
工作进程组WorkerGroup,成员:WorkerProc#;表示成员进程名为WorkerProc1,WorkerProc2,WorkerProc3;
CtrlProc所在VM:VMCluster1.VM1;
WorkerProc1所在VM:VMCluster1.VM2;
WorkerProc2所在VM:VMCluster1.VM2;
WorkerProc3所在VM:VMCluster1.VM3;
应用资源占用信息:
WorkerProc1当前物理内存:10G;
WorkerProc2当前物理内存:20G;
WorkerProc3当前物理内存:30G;
VM1内存余量:30G;
VM2内存余量:30G;
VM3内存余量:10G;
应用资源需求量:WorkerGroup的总内存需求量大于100G。
步骤302:上层调度模块根据获取的云应用的运行信息和预置的资源调度策略,确定需要在所述VMCluster中创建新的VM,并确定所增加的VM的属性信息;
例如,上层调度模块确定当前云应用的资源需求量(100G)远大于当前为WorkerProc1-3的工作内存(10G+20G+30G=60G),于是决定增加1个进程WorkerProc4,要求WorkerProc4能够占用40G以上内存,然而上层调度模块查询发现目前没有空闲内存大于40G的VM,因此决定创建一个新的VM。
新增加的VM的属性信息如下:
VM名称:VM4;
VM规格:VM4(2VCPU、40G内存);
VM的QoS策略:
(1)VM区域性约束参数:VM4必须在剩余内存大于20G的物理机上运行;
(2)VM驻留性约束参数:VM4可迁移;
(3)VM关联性约束参数:VM4和VM3需要在同一物理机上运行;
(4)VM互斥性约束参数:VM4和VM1需要在不同一物理机上运行;
进一步地,在本步骤中,上层调度模块进一步还根据待增加的VM4的属性信息更新VMCluster1的属性信息,例如:
VM集群标识:VMCluster1;
VM数量:4;
VM镜像:image1;
VMCluster的QoS约束参数:
(1)VMCluster占用的总内存:上限500G,下限100G;
(2)VMCluster的CPU平均利用率:VMCluster1的平均CPU利用率小于20%;
(3)VMCluster的平均通信时延:小于1s。
步骤303:上层调度模块向下层调度模块提交创建VM4的请求,即VMCluster的更新请求(由于执行该创建VM4的请求后,其所在的VMCluster的资源配置将会有所更新,因此创建VM4的请求在本发明实施例中可以理解成VMCluster的更新请求),该更新请求中包含待创建的VM4的属性信息和待创建的VM4所在的VMCluster的属性信息,即更新后的VMCluster1的属性信息。
上述实施例以增加VM的数量为例,在其它的实施例中,上层调度模块的资源调度还可以包括减少VM的数量、为已有VM扩容或者减容,具体实现方式在此不赘述。
步骤304:下层调度模块记录所述待创建的VM4的属性信息和待创建的VM4所在的VMCluster的属性信息;
进一步地,下层调度模块还可以进一步获取当前物理设备平台上的物理资源的状态信息和待创建VM所在的VMCluster1的运行信息;
具体地,下层调度模块可以在部署了VMCluster1之后,即可定期统计VMCluster1的运行信息,也可以在接收到创建VM4的请求之后,才开始统计VMCluster1的运行信息,本发明实施例对并不对下层调度模块何时以及如何获取VMCluster1的运行信息的具体实现方式进行限定,本领域技术人员可以通过多种方式实现。
下层调度模块获取的VMCluster1的运行信息举例如下:
成员VM:VM1、VM2、VM3;
VM信息:VM1(2VCPU、60G内存),所在PM(PM1);
VM2(2VCPU、60G内存),所在PM(PM1);
VM3(2VCPU、40G内存),所在PM(PM2);
下层调度模块获取的当前物理设备平台上的物理资源的状态信息举例如下:
PM1:总内存:150G,已用内存:130G;总VCPU:50个,已用VCPU:9个;
PM2:总内存:150G,已用内存:60G;总VCPU:50个,已用VCPU:12个;
PM3:总内存:150G,已用内存:0G;总VCPU:50个,已用VCPU:0个。
步骤305:下层调度模块根据当前物理设备平台上的物理资源的状态信息、VMCluster1的运行信息、更新的VMCluster1的属性信息和待创建VM4的属性信息,确定该VM4是否能够在该物理设备平台上创建,如果否,向上层调度模块返回失败响应消息,如果是,执行步骤306;
具体地,本发明实施例中,由于上层调度模块传递到下层调度模块的VMCluster1的属性信息中包含VMCluster1的QoS约束参数,因此,在本步骤中,下层调度模块还可以进一步确定该VM4是否能够在该物理机集群上创建,例如,如果创建VM4之后该VMCluster占用的总内存超出了VMCluster的QoS约束参数中的VMCluster占用的总内存的上限值,下层调度模块据此可判断在该物理机集群上不能创建该VM4。
具体实践中,本步骤305是可选执行的。
步骤306:下层调度模块根据当前物理设备平台上的物理资源的状态信息、VMCluster1的运行信息、更新的VMCluster1的属性信息和待创建VM4的属性信息,确定VM4在物理设备平台上的部署方案。
具体地,根据VM4区域性约束参数,VM4需要部署在剩余内存大于20G的物理机上,根据VM4关联性约束参数,将VM4和VM3部署在同一物理机PM2上运行,根据VM4互斥性约束参数,将VM4和VM1分别部署在不同的物理机PM2和PM1上运行。
步骤307:下层调度模块根据确定的VM4在物理机集群上的部署方案,创建VM4;
步骤308:下层调度模块通知上层调度模块该VM4已创建成功,上层调度模块安装云业务组件到VM4上,在VM4上加载相应的进程。
至此,云应用的运行过程中的虚拟机集群的更新过程完成,在云应用的虚拟集群的更新过程中,资源管理平台获取更新后的所述VMCluster的属性信息和该VMCluster中的各个VM的属性信息中包含的更新的VMCluster的QoS约束参数和更新的VM的QoS策略两者或者两者任一,并可用以后续资源监控过程中的调度考量因素;同时,根据更新的VMCluster的QoS约束参数确定待创建的VMCluster是否能在物理设备平台上创建,避免了不必要的流程浪费,提高虚拟机集群创建的时延,对QoS的保障起到促进作用。
云应用运行过程中的资源管理
在上述的云应用部署时的虚拟机集群创建过程和云应用运行时的虚拟机集群更新过程中,虚拟资源管理平台(具体实施例为其中的下层调度模块)获取并记录了虚拟机集群的QoS约束参数,那么在为云应用部署了VMCluster之后,虚拟资源管理平台即可定期或者随时统计VMCluster1的运行信息,也可以在接收到其它管理模块的资源监控触发消息之后,开始统计VMCluster的运行信息,本发明实施例对并不对虚拟资源管理平台何时获取VMCluster的运行信息的具体实现方式进行限定,本领域技术人员可以通过多种方式实现。并可根据统计得到的信息以及记录的虚拟机集群的QoS约束参数,进行物理资源的调度或者修改物理资源调度策略。
本发明实施例中,如图4所示,具体实施方式可包括:
步骤401:获取所述虚拟机集群的QoS约束参数;
步骤402:获取所述虚拟机集群的当前运行状况统计指标;
步骤403:根据所述虚拟机集群的QoS约束参数和所述虚拟机集群的当前运行状况统计指标,调整所述物理设备平台的物理资源调度策略或者进行所述物理设备平台上的物理资源调度。
本发明实施例的资源管理方法,由于考虑了虚拟机集群的QoS约束参数来进行物理资源的调度,避免资源管理平台不考虑虚拟机集群的运行状况而只根据物理机集群的资源状况进行虚拟机的创建,或者避免了资源管理平台进行独立的物理资源调度,并因此规避了临时上电物理机造成的虚拟机创建、更新的延迟,因而可以解决物理设备平台的物理资源调度导致的无法保障云应用的QoS的问题,同时,物理机的资源管理更加优化,避免了反复上下电物理机造成的能耗浪费。
当虚拟资源管理平台的虚拟机资源管理和物理机资源管理的功能可以不细分为不同的模块处理时,上述实施例可以由资源管理平台执行,当虚拟资源管理平台划分为上层调度模块进行虚拟机资源管理,下层调度模块进行物理机资源管理的架构中,上述实施例的执行主体是下层调度模块。
如上实施例,在虚拟资源管理平台划分上下层调度模块的架构中,如图5所示,一种可实现的实施例的具体实施方式包括如下步骤:
步骤501:获取在所述虚拟机集群的创建过程中或者在所述虚拟机集群的运行过程中所记录的所述虚拟机集群的QoS约束参数;
例如获取上述步骤204或304中记录的VMCluster1的QoS约束参数。
步骤502:下层调度模块获取云应用的运行信息,即获取已创建的VMCluster的运行信息,例如如果对于上述实施例中所提到的云应用1,即获取VMCluster1的运行信息;
下层调度模块可以在部署了VMCluster1之后,可定期获取VMCluster1的运行信息,也可以根据相关消息的触发才开始获取VMCluster1的运行信息,也可使实时获取,本发明实施例并不对下层调度模块何时获取VMCluster1的运行信息的具体实现方式进行限定,本领域技术人员可以通过多种方式实现。
进一步地,下层调度模块还可以在获取已创建的VMCluster的运行信息的时候,也获取当前物理设备平台上的物理资源的使用状态信息。
步骤503:下层调度模块根据获取的已创建的VMCluster的运行信息,获取所述VMCluster的当前运行状况统计指标;
该运行状况统计指标可以包括统计参数的和、最大值、最小值、平均值和方差中的一种或者任意几种,具体地,可以包括:
(1)虚拟机集群的的当前资源平均利用率的统计值,例如VMCluster的所有VM当前占用的内存的平均利用率,或者统计VMCluster的所有VM当前占用的CPU的平均利用率;
(2)虚拟机集群的占用的总资源的统计值,例如VMCluster的所有VM当前占用的内存或者CPU的和值;
(3)虚拟机集群的当前平均通信时延的统计值,例如可以统计VMCluster中所有任意两个VM之间的通信时延,再根据统计得到的时延求的通信时延的平均值。
步骤504:下层调度模块根据所述虚拟机集群的QoS约束参数和所述虚拟机集群的当前运行状况统计指标,调整所述物理设备平台的物理资源调度策略或者进行所述物理设备平台上的物理资源调度;
本步骤中根据虚拟机集群的QoS约束参数和所述虚拟机集群的当前运行状况统计指标,来进行物理资源的调度或者物理资源调度策略的修改可以确保VMCluster的QoS。
具体地,进行物理资源的调度或者物理资源调度策略的修改可以包括以下几种方式:
(1)抑制所述物理设备平台上的物理机减容操作;
物理机减容是下层调度模块根据获取的物理机集群的物理资源的使用状态信息作出的能耗管理的调度工作,例如物理机减容阈值设置为CPU使用率30%,那么下层调度模块根据获取的物理机设备平台的物理资源的使用状态信息统计得到物理机集群的CPU平均使用率为28%,则下层调度模块确定物理机集群当前的使用并不饱和,可以进行能耗节省,即进行虚拟机的迁移,将某台物理机迁空并进行下电操作,以节约能耗。
然而,下层调度模块仅根据物理机集群的实际资源使用情况进行物理机的减容操作,却不考虑上层应用对物理资源的需求变化可能会引起资源调度的冲突,例如当上层调度模块需要增加使用物理资源的时候,下层调度模块却进行物理机的减容操作,这些资源调度的冲突会影响到云应用的QoS,因此本发明实施例中下层调度模块根据根据所述虚拟机集群的QoS约束参数和所述虚拟机集群的当前运行状况统计指标,如果确定上层调度模块即将开始对该VMCluster进行扩容或者增加新的虚拟机的资源调度,那么下层调度模块需要为此作好物理资源的准备,因此物理机的减容的能耗管理需要暂缓,因此抑制所述物理设备平台上的物理机减容操作。
具体地,若所述虚拟机集群的QoS约束参数包括所述虚拟机集群的资源平均利用率约束参数;所述步骤503中获取虚拟机集群的当前运行状况统计指标包括:获取所述虚拟机集群的当前资源平均利用率的统计值;相应地,在本步骤504中,下层调度模块比较所述虚拟机集群的当前资源平均利用率的统计值与所述虚拟机集群的资源平均利用率约束参数,如果所述虚拟机集群的当前资源平均利用率的统计值小于所述虚拟机集群的资源平均利用率约束参数且两者之差小于设定容忍阈值,抑制所述物理设备平台上的物理机减容操作。
其中的容忍阈值可以是预先设定的。
再进一步地,抑制所述物理设备平台上的物理机减容操作可以包括两种具体的实现方式,一种是调整所述物理设备平台的物理资源调度策略,如提高所述物理设备平台上的物理机减容阈值,例如,VMCluster1的所有VM的当前CPU平均利用率统计值是18%,而VMCluster的CPU平均利用率QoS约束参数为20%,容忍阈值为5%,此时当前CPU平均利用率统计值与所述VMCluster的CPU平均利用率QoS约束参数之差小于容忍阈值,因此,可以所述将物理机的减容阈值由CPU平均利用率30%提高为40%。另外一种方式是在预定期限内不发起所述物理设备平台上的物理机迁空或下电操作,例如,启动一个定时器,在预定时间内不执行物理机的减容操作,直到所述虚拟机集群的扩容操作完成。
(2)上电所述物理设备平台上的至少一台物理机;
如果所述虚拟机集群的当前资源平均利用率的统计值小于所述虚拟机集群的资源平均利用率约束参数且两者之差小于设定容忍阈值,下层调度模块还可以直接上电所述物理设备平台上的至少一台物理机,以为虚拟机集群的扩容做好物理资源的准备。
例如,上述实施例中,PM1和PM2的内存占用分别达到了130G(总资源150G),物理机集群的内存平均利用率57%,已经大于50%,则决定将PM3进行上电,这样,当下层调度模块后续接收到上层调度模块的指令需要进行扩容操作时,不需要再去启动PM3,下层调度模块的资源调度时延得到降低,云应用的QoS相应得到保障。
当所述步骤501中获取的虚拟机集群的QoS约束参数还包括:所述虚拟机集群的占用的总资源的上限或下限;步骤503中获取的虚拟机集群的当前运行状况统计指标还包括:获取所述虚拟机集群的当前占用的总资源的统计值;一个进一步的实施例中,下层调度模块还获得所述虚拟机集群的当前占用的总资源的统计值与所述虚拟机集群的占用的总资源上限之间的差值,根据所述差值选择相应规格的物理机进行上电操作。例如,如果所述虚拟机集群的当前占用的内存的统计值是950G,其与虚拟机集群的内存约束参数1000G,那么可以选择内存规格100G的物理机进行上电操作,而不选择内存规格200G的物理机。
另一个进一步的实施例中,下层调度模块还可以获取所述物理设备平台上的物理资源当前使用状态信息,在当前在使用的物理机的剩余物理资源不充分时,才执行所述上电至少一台所述物理设备平台上的物理机的操作。
(3)提高虚拟机集群的物理资源调度的优先级级别;
如果所述虚拟机集群的当前资源平均利用率的统计值大于所述虚拟机集群的资源平均利用率约束参数,此时,需要加快为所述虚拟机集群增加虚拟机或者未虚拟机扩容的操作的速度,减小该操作的时延才能保障云应用的QoS,此时下层调度模块还可以提高所述虚拟机集群的物理资源调度的优先级级别,以保障下层调度模块在接收到所述虚拟机集群的资源更新请求时,优先处理该资源更新请求,以保障云应用的QoS。
(4)集中部署虚拟机集群的虚拟机到相同的物理机上;
当步骤501中获取的所述虚拟机集群的QoS约束参数包括:所述虚拟机集群的平均通信时延的约束参数;相应地,步骤503中获取的虚拟机集群的当前运行状况统计指标包括:获取所述虚拟机集群的当前平均通信时延的统计值。
此时下层调度模块比较所述虚拟机集群的当前平均通信时延的统计值与所述虚拟机集群的平均通信时延的约束参数,如果所述虚拟机集群的当前平均通信时延的统计值大于所述虚拟机集群的平均通信时延的约束参数,或者两者之差小于设定容忍阈值,集中部署所述虚拟机集群的虚拟机到相同的物理机上,以降低虚拟机集群的通信时延,从而保障云应用的QoS。
图6为本发明实施例的虚拟机系统资源管理装置的结构组成示意图。本发明实施例的虚拟机系统资源管理装置部署在虚拟机系统中,所述虚拟机系统为至少一个云应用提供服务,所述系统包括虚拟资源管理平台和物理设备平台,所述物理设备平台包括至少一个物理机,所述虚拟资源管理平台根据所述物理设备平台提供的物理资源为每个云应用创建至少一台虚拟机,所述每个云应用对应的至少一台虚拟机组成一个虚拟机集群;
该虚拟机系统资源管理装置可包括:
约束参数获取模块601,用于获取所述虚拟机集群的QoS约束参数;
统计指标获取模块602,用于获取所述虚拟机集群的当前运行状况统计指标;
管理模块603,用于根据所述虚拟机集群的QoS约束参数和所述虚拟机集群的当前运行状况统计指标,调整所述物理设备平台的物理资源调度策略或者进行所述物理设备平台上的物理资源调度。
具体地,约束参数获取模块601,还用于在所述虚拟机集群的创建过程中,接收创建所述虚拟机集群的创建请求,或者在所述虚拟机集群的运行过程中,接收所述虚拟机集群资源的更新请求,所述创建请求或者更新请求携带所述虚拟机集群的QoS约束参数;以及,记录所述虚拟机集群的QoS约束参数。
具体地,所述约束参数获取模块601具体用于获取所述虚拟机集群的资源平均利用率约束参数;所述统计指标获取模块602,具体用于获取所述虚拟机集群的当前资源平均利用率的统计值;所述管理模块603具体用于比较所述虚拟机集群的当前资源平均利用率的统计值与所述虚拟机集群的资源平均利用率约束参数,如果所述虚拟机集群的当前资源平均利用率的统计值小于所述虚拟机集群的资源平均利用率约束参数且两者之差小于设定容忍阈值,抑制所述物理设备平台上的物理机减容操作,和/或,上电所述物理设备平台上的至少一台物理机。
具体地,所述抑制所述物理设备平台上的物理机减容操作可以是所述管理模块603提高所述物理设备平台上的物理机减容阈值,或者,在预定期限内不发起所述物理设备平台上的物理机迁空或下电操作。
具体地,所述约束参数获取模块601还用于获取所述虚拟机集群的占用的总资源的上限或下限;所述统计指标获取模块602还用于获取所述虚拟机集群的当前占用的总资源的统计值;所述管理模块603具体用于获得所述虚拟机集群的当前占用的总资源的统计值与所述虚拟机集群的占用的总资源上限之间的差值,根据所述差值选择相应规格的物理机进行上电操作。
具体地,所述管理模块603还用于在所述虚拟机集群的当前资源平均利用率的统计值大于所述虚拟机集群的资源平均利用率约束参数时,提高所述虚拟机集群的物理资源调度的优先级级别。
具体地,所述约束参数获取模块601具体用于获取所述虚拟机集群的平均通信时延的约束参数;所述统计指标获取模块602,具体用于获取获取所述虚拟机集群的当前平均通信时延的统计值;所述管理模块603具体用于比较所述虚拟机集群的当前平均通信时延的统计值与所述虚拟机集群的平均通信时延的约束参数,如果所述虚拟机集群的当前平均通信时延的统计值大于所述虚拟机集群的平均通信时延的约束参数,或者两者之差小于设定容忍阈值,集中部署所述虚拟机集群的虚拟机到相同的物理机上。
具体地,所述虚拟机集群的QoS约束参数包括:所述虚拟机集群的占用的总资源约束参数;所述装置还包括:处理模块604还用于获取所述物理设备平台上剩余物理资源信息,根据所述虚拟机集群的占用的总资源约束参数,确定待创建的虚拟机集群或者待更新的虚拟机集群是否能够在所述物理设备平台上执行,如果是,执行虚拟机集群的创建或者资源的更新。
图7为本发明实施例的虚拟机系统资源管理装置的结构组成示意图。本发明实施例的虚拟机系统资源管理装置部署在虚拟机系统中,所述虚拟机系统为至少一个云应用提供服务,所述系统包括虚拟资源管理平台和物理设备平台,所述物理设备平台包括至少一个物理机,所述虚拟资源管理平台根据所述物理设备平台提供的物理资源为每个云应用创建至少一台虚拟机,所述每个云应用对应的至少一台虚拟机组成一个虚拟机集群;
该虚拟机系统资源管理装置可包括:
处理器701、存储器702、系统总线703和通信接口704。处理器701、存储器702和通信接口704之间通过系统总线703连接并完成相互间的通信。
处理器701可能为单核或多核中央处理单元(CentralProcessingUnit,CPU),或者为特定集成电路(ApplicationSpecificIntegratedCircuit,ASIC),或者为被配置成实施本发明实施例的一个或多个集成电路。
存储器702可以为高速RAM存储器,也可以为非易失性存储器(non-volatilememory),例如至少一个磁盘存储器。
存储器702用于存放程序705。具体的,程序705中可以包括程序代码,所述程序代码包括计算机执行指令。
当虚拟机系统资源管理装置运行时,处理器701运行程序705,以执行以下指令:
获取所述虚拟机集群的QoS约束参数;
获取所述虚拟机集群的当前运行状况统计指标;
根据所述虚拟机集群的QoS约束参数和所述虚拟机集群的当前运行状况统计指标,调整所述物理设备平台的物理资源调度策略或者进行所述物理设备平台上的物理资源调度。
具体地,虚拟机系统资源管理装置还根据所述指令执行上述图5所示的资源管理方法,具体在此不再赘述。
本发明实施例本发明实施例的资源管理策略,由于考虑了虚拟机集群的QoS约束参数来进行物理资源的调度,避免资源管理平台不考虑虚拟机集群的运行状况而只根据物理机集群的资源状况进行虚拟机的创建或者独立的物理资源调度,并因此规避了临时上电物理机造成的虚拟机创建、更新的延迟,因而可以解决物理设备平台的物理资源调度导致的无法保障云应用的QoS的问题,同时,物理机的资源管理更加优化,避免了反复上下电物理机造成的能耗浪费。
另外一个方面,由于虚拟机的QoS策略也成为物理资源调动的考量因素,保证了虚拟机在正确的物理机上进行创建,保证云应用的安全或者资源,以及提高通信QoS。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,设备和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本领域普通技术人员可以理解:附图只是一个实施例的示意图,附图中的单元或流程并不一定是实施本发明所必须的。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,设备和方法,可以通过其它的方式实现。例如,以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,简称ROM)、随机存取存储器(RandomAccessMemory,简称RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (30)

1.一种虚拟机系统的资源管理方法,其特征在于,所述虚拟机系统为至少一个云应用提供服务,所述系统包括虚拟资源管理平台和物理设备平台,所述物理设备平台包括至少一个物理机,所述虚拟资源管理平台根据所述物理设备平台提供的物理资源为每个云应用创建至少一台虚拟机;所述方法包括:
获取虚拟机集群的QoS约束参数,其中,所述每个云应用对应的至少两台虚拟机组成一个虚拟机集群,所述虚拟机集群的QoS约束参数包括以下参数的任意之一或任意组合:所述虚拟机集群的资源平均利用率约束参数、所述虚拟机集群的平均通信时延的约束参数或所述虚拟机集群的占用的总资源约束参数;
获取所述虚拟机集群的当前运行状况统计指标;
根据所述虚拟机集群的QoS约束参数和所述虚拟机集群的当前运行状况统计指标,调整所述物理设备平台的物理资源调度策略或者进行所述物理设备平台上的物理资源调度。
2.如权利要求1所述的方法,其特征在于,所述获取所述虚拟机集群的QoS约束参数之前,还包括:
在所述虚拟机集群的创建过程中,接收创建所述虚拟机集群的创建请求,或者在所述虚拟机集群的运行过程中,接收所述虚拟机集群的资源的更新请求,所述创建请求或者更新请求携带所述虚拟机集群的QoS约束参数;以及,记录所述虚拟机集群的QoS约束参数;
所述获取所述虚拟机集群的QoS约束参数包括:
获取在所述虚拟机集群的创建过程中或者在所述虚拟机集群的运行过程中所记录的所述虚拟机集群的QoS约束参数。
3.如权利要求1或2所述的方法,其特征在于,所述虚拟机集群的QoS约束参数包括:所述虚拟机集群的资源平均利用率约束参数;
相应地,所述获取虚拟机集群的当前运行状况统计指标包括:获取所述虚拟机集群的当前资源平均利用率的统计值;
相应地,根据所述虚拟机集群的QoS约束参数和所述虚拟机集群的当前运行状况统计指标,调整所述物理设备平台的物理资源调度策略或者进行所述物理设备平台上的物理资源调度,包括:
比较所述虚拟机集群的当前资源平均利用率的统计值与所述虚拟机集群的资源平均利用率约束参数,如果所述虚拟机集群的当前资源平均利用率的统计值小于所述虚拟机集群的资源平均利用率约束参数且两者之差小于设定容忍阈值,抑制所述物理设备平台上的物理机减容操作,和/或,上电所述物理设备平台上的至少一台物理机。
4.如权利要求3所述的方法,其特征在于,所述抑制所述物理设备平台上的物理机减容操作包括:
提高所述物理设备平台上的物理机减容阈值,或者,在预定期限内不发起所述物理设备平台上的物理机迁空或下电操作。
5.如权利要求3所述的方法,其特征在于,所述虚拟机集群的QoS约束参数还包括:所述虚拟机集群的占用的总资源的上限或下限;
所述获取虚拟机集群的当前运行状况统计指标还包括:获取所述虚拟机集群的当前占用的总资源的统计值;
所述上电至少一台所述物理设备平台上的物理机具体包括:
获得所述虚拟机集群的当前占用的总资源的统计值与所述虚拟机集群的占用的总资源上限之间的差值,根据所述差值选择相应规格的物理机进行上电操作。
6.如权利要求3所述的方法,其特征在于,在上电至少一台所述物理设备平台上的物理机之前,还包括:
获取所述物理设备平台上的物理资源当前使用状态信息,若当前在使用的物理机的剩余物理资源不充分,执行所述上电至少一台所述物理设备平台上的物理机的步骤。
7.如权利要求3所述的方法,其特征在于,所述方法还包括:
如果所述虚拟机集群的当前资源平均利用率的统计值大于所述虚拟机集群的资源平均利用率约束参数,提高所述虚拟机集群的物理资源调度的优先级级别。
8.如权利要求1或2所述的方法,其特征在于,所述虚拟机集群的QoS约束参数包括:所述虚拟机集群的平均通信时延的约束参数;
相应地,所述获取虚拟机集群的当前运行状况统计指标包括:获取所述虚拟机集群的当前平均通信时延的统计值;
相应地,根据所述虚拟机集群的QoS约束参数和所述虚拟机集群的当前运行状况统计指标,调整所述物理设备平台的物理资源调度策略或者进行所述物理设备平台上的物理资源调度,包括:
比较所述虚拟机集群的当前平均通信时延的统计值与所述虚拟机集群的平均通信时延的约束参数,如果所述虚拟机集群的当前平均通信时延的统计值大于所述虚拟机集群的平均通信时延的约束参数,或者两者之差小于设定容忍阈值,集中部署所述虚拟机集群的虚拟机到相同的物理机上。
9.如权利要求2所述的方法,其特征在于,所述虚拟资源管理平台包括上层调度模块和下层调度模块,所述方法还包括:
在所述虚拟机集群的创建过程中,所述上层调度模块接收所述虚拟机集群的创建请求,或者在所述虚拟机集群的运行过程中,接收所述虚拟机集群的资源的更新请求,所述创建请求或者更新请求携带所述虚拟机集群的QoS约束参数;
所述上层调度模块将所述创建请求或者更新请求转发给所述下层调度模块,以使得所述下层调度模块接收并记录所述创建请求或者更新请求中携带的所述虚拟机集群的QoS约束参数。
10.如权利要求2所述的方法,其特征在于,所述方法还包括:
接收到所述创建请求或者更新请求之后,根据所述创建请求或者更新请求,调度所述物理设备平台上的物理资源以实现所述虚拟机集群的创建或者资源的更新。
11.如权利要求10所述的方法,其特征在于,所述虚拟机集群的QoS约束参数包括:所述虚拟机集群的占用的总资源约束参数;
所述调度所述物理设备平台上的物理资源以实现所述虚拟机集群的创建或者资源的更新之前,还包括:
获取所述物理设备平台上剩余物理资源信息,根据所述虚拟机集群的占用的总资源约束参数,确定待创建的虚拟机集群或者待更新的虚拟机集群是否能够在所述物理设备平台上执行,如果是,执行所述调度所述物理设备平台上的物理资源的步骤。
12.一种虚拟机系统,其特征在于,所述虚拟机系统为至少一个云应用提供服务,所述系统包括虚拟资源管理平台和物理设备平台;
所述物理设备平台包括至少一个物理机,用于提供物理资源;
所述虚拟资源管理平台用于根据所述物理设备平台提供的物理资源为每个云应用创建至少一台虚拟机,所述每个云应用对应的至少两台虚拟机组成一个虚拟机集群,监控云应用的运行状况,根据所述云应用的运行状况确定是否对所述云应用对应的虚拟机集群的资源进行更新,以及调度所述物理设备平台上的物理资源以实现所述虚拟机集群的创建或者资源的更新;
所述虚拟资源管理平台还用于获取所述虚拟机集群的QoS约束参数以及所述虚拟机集群的当前运行状况统计指标,根据所述虚拟机集群的QoS约束参数和所述虚拟机集群的当前运行状况统计指标,调整所述物理设备平台的物理资源调度策略或者进行所述物理设备平台上的物理资源调度,所述虚拟机集群的QoS约束参数包括以下参数的任意之一或任意组合:所述虚拟机集群的资源平均利用率约束参数、所述虚拟机集群的平均通信时延的约束参数或所述虚拟机集群的占用的总资源约束参数。
13.如权利要求12所述的系统,其特征在于,所述虚拟资源管理平台还用于在所述虚拟机集群的创建过程中,接收所述虚拟机集群的创建请求,或者在所述虚拟机集群的运行过程中,接收所述虚拟机集群的资源的更新请求,所述创建请求或者更新请求携带所述虚拟机集群的QoS约束参数,以及,记录所述虚拟机集群的QoS约束参数。
14.如权利要求12或13所述的系统,其特征在于,所述虚拟机集群的QoS约束参数包括:所述虚拟机集群的资源平均利用率约束参数;所述虚拟机集群的当前运行状况统计指标包括:所述虚拟机集群的当前资源平均利用率的统计值;
所述虚拟资源管理平台具体用于比较所述虚拟机集群的当前资源平均利用率的统计值与所述虚拟机集群的资源平均利用率约束参数,如果所述虚拟机集群的当前资源平均利用率的统计值小于所述虚拟机集群的资源平均利用率约束参数且两者之差小于设定容忍阈值,抑制所述物理设备平台上的物理机减容操作,和/或,上电所述物理设备平台上的至少一台物理机。
15.如权利要求14所述的系统,其特征在于,如果所述虚拟机集群的当前资源平均利用率的统计值小于所述虚拟机集群的资源平均利用率约束参数且两者之差小于设定容忍阈值,所述虚拟资源管理平台具体用于提高所述物理设备平台上的物理机减容阈值,或者,在预定期限内不发起所述物理设备平台上的物理机迁空或下电操作。
16.如权利要求14所述的系统,其特征在于,所述虚拟机集群的QoS约束参数还包括:所述虚拟机集群的占用的总资源的上限或下限;所述虚拟机集群的当前运行状况统计指标包括:所述虚拟机集群的当前占用的总资源的统计值;
所述虚拟资源管理平台还用于获得所述虚拟机集群的当前占用的总资源的统计值与所述虚拟机集群的占用的总资源上限之间的差值,根据所述差值选择相应规格的物理机进行上电操作。
17.如权利要求14所述的系统,其特征在于,所述虚拟资源管理平台还用于在所述虚拟机集群的当前资源平均利用率的统计值大于所述虚拟机集群的资源平均利用率约束参数时,提高所述虚拟机集群的物理资源调度的优先级级别。
18.如权利要求12或13所述的系统,其特征在于,所述虚拟机集群的QoS约束参数包括:所述虚拟机集群的平均通信时延的约束参数;
所述虚拟机集群的当前运行状况统计指标包括:所述虚拟机集群的当前平均通信时延的统计值;
所述虚拟资源管理平台用于比较所述虚拟机集群的当前平均通信时延的统计值与所述虚拟机集群的平均通信时延的约束参数,如果所述虚拟机集群的当前平均通信时延的统计值大于所述虚拟机集群的平均通信时延的约束参数,或者两者之差小于设定容忍阈值,集中部署所述虚拟机集群的虚拟机到相同的物理机上。
19.如权利要求12或13所述的系统,其特征在于,所述虚拟资源管理平台包括上层调度模块和下层调度模块;
所述上层调度模块用于根据所述物理设备平台提供的物理资源为每个云应用创建至少一台虚拟机,所述每个云应用对应的至少一台虚拟机组成一个虚拟机集群,监控所述虚拟机集群的运行状况,根据所述虚拟机集群的运行状况确定是否对所述虚拟机集群的资源进行更新,向所述下层调度模块发送所述虚拟机集群的创建请求或者资源的更新请求;
所述下层调度模块用于根据所述上层调度模块的创建请求或者更新请求,调度所述物理设备平台上的物理资源以实现所述虚拟机集群的创建或者资源更新;以及获取所述虚拟机集群的QoS约束参数以及所述虚拟机集群的当前运行状况统计指标,根据所述虚拟机集群的QoS约束参数和所述虚拟机集群的当前运行状况统计指标,调整所述物理设备平台的物理资源调度策略或者进行所述物理设备平台上的物理资源调度。
20.如权利要求19所述的系统,其特征在于,所述上层调度模块还用于在所述虚拟机集群的创建过程中,接收所述虚拟机集群的创建请求,或者在所述虚拟机集群的运行过程中,接收所述虚拟机集群的资源的更新请求,所述创建请求或者更新请求携带所述虚拟机集群的QoS约束参数,以及将所述创建请求或者更新请求转发给所述下层调度模块;
所述下层调度模块还用于接收所述创建请求或者更新请求,记录携带在所述创建请求或者更新请求中的所述虚拟机集群的QoS约束参数。
21.如权利要求20所述的系统,其特征在于,所述虚拟机集群的QoS约束参数包括:所述虚拟机集群的占用的总资源约束参数;
所述下层调度模块还用于在接收到所述创建请求或者更新请求时,获取所述物理设备平台上剩余物理资源信息,根据所述虚拟机集群的占用的总资源约束参数,确定待创建的虚拟机集群或者待更新的虚拟机集群是否能够在所述物理设备平台上执行,如果是,调度所述物理设备平台上的物理资源以实现所述虚拟机集群的创建或者资源更新。
22.一种虚拟机系统资源管理装置,其特征在于,所述虚拟机系统为至少一个云应用提供服务,所述系统包括虚拟资源管理平台和物理设备平台,所述物理设备平台包括至少一个物理机,所述虚拟资源管理平台根据所述物理设备平台提供的物理资源为每个云应用创建至少一台虚拟机,所述每个云应用对应的至少两台虚拟机组成一个虚拟机集群;
所述装置包括:
约束参数获取模块,用于获取所述虚拟机集群的QoS约束参数,所述虚拟机集群的QoS约束参数包括以下参数的任意之一或任意组合:所述虚拟机集群的资源平均利用率约束参数、所述虚拟机集群的平均通信时延的约束参数或所述虚拟机集群的占用的总资源约束参数;
统计指标获取模块,用于获取所述虚拟机集群的当前运行状况统计指标;
管理模块,用于根据所述虚拟机集群的QoS约束参数和所述虚拟机集群的当前运行状况统计指标,调整所述物理设备平台的物理资源调度策略或者进行所述物理设备平台上的物理资源调度。
23.如权利要求22所述的装置,其特征在于,所述约束参数获取模块,还用于在所述虚拟机集群的创建过程中,接收创建所述虚拟机集群的创建请求,或者在所述虚拟机集群的运行过程中,接收所述虚拟机集群的资源的更新请求,所述创建请求或者更新请求携带所述虚拟机集群的QoS约束参数;以及,记录所述虚拟机集群的QoS约束参数。
24.如权利要求22或23所述的装置,其特征在于,所述约束参数获取模块具体用于获取所述虚拟机集群的资源平均利用率约束参数;所述统计指标获取模块,具体用于获取所述虚拟机集群的当前资源平均利用率的统计值;
所述管理模块具体用于比较所述虚拟机集群的当前资源平均利用率的统计值与所述虚拟机集群的资源平均利用率约束参数,如果所述虚拟机集群的当前资源平均利用率的统计值小于所述虚拟机集群的资源平均利用率约束参数且两者之差小于设定容忍阈值,抑制所述物理设备平台上的物理机减容操作,和/或,上电所述物理设备平台上的至少一台物理机。
25.如权利要求24所述的装置,其特征在于,所述管理模块具体用于在所述虚拟机集群的当前资源平均利用率的统计值小于所述虚拟机集群的资源平均利用率约束参数且两者之差小于设定容忍阈值时,提高所述物理设备平台上的物理机减容阈值,或者,在预定期限内不发起所述物理设备平台上的物理机迁空或下电操作。
26.如权利要求24所述的装置,其特征在于,所述约束参数获取模块还用于获取所述虚拟机集群的占用的总资源的上限或下限;所述统计指标获取模块还用于获取所述虚拟机集群的当前占用的总资源的统计值;
所述管理模块具体用于获得所述虚拟机集群的当前占用的总资源的统计值与所述虚拟机集群的占用的总资源上限之间的差值,根据所述差值选择相应规格的物理机进行上电操作。
27.如权利要求24所述的装置,其特征在于,所述管理模块还用于在所述虚拟机集群的当前资源平均利用率的统计值大于所述虚拟机集群的资源平均利用率约束参数时,提高所述虚拟机集群的物理资源调度的优先级级别。
28.如权利要求22或23所述的装置,其特征在于,所述约束参数获取模块具体用于获取所述虚拟机集群的平均通信时延的约束参数;所述统计指标获取模块,具体用于获取所述虚拟机集群的当前平均通信时延的统计值;
所述管理模块具体用于比较所述虚拟机集群的当前平均通信时延的统计值与所述虚拟机集群的平均通信时延的约束参数,如果所述虚拟机集群的当前平均通信时延的统计值大于所述虚拟机集群的平均通信时延的约束参数,或者两者之差小于设定容忍阈值,集中部署所述虚拟机集群的虚拟机到相同的物理机上。
29.如权利要求23所述的装置,其特征在于,所述装置还包括:
处理模块:用于在接收到所述创建请求或者更新请求之后,根据所述创建请求或者更新请求,调度所述物理设备平台上的物理资源以实现所述虚拟机集群的创建或者资源的更新。
30.如权利要求29所述的装置,其特征在于,所述虚拟机集群的QoS约束参数包括:所述虚拟机集群的占用的总资源约束参数;
所述处理模块还用于获取所述物理设备平台上剩余物理资源信息,根据所述虚拟机集群的占用的总资源约束参数,确定待创建的虚拟机集群或者待更新的虚拟机集群是否能够在所述物理设备平台上执行,如果是,执行虚拟机集群的创建或者资源的更新。
CN201280026359.5A 2012-12-26 2012-12-26 一种虚拟机系统的资源管理方法、虚拟机系统和装置 Active CN104011685B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2012/087558 WO2014101010A1 (zh) 2012-12-26 2012-12-26 一种虚拟机系统的资源管理方法、虚拟机系统和装置

Publications (2)

Publication Number Publication Date
CN104011685A CN104011685A (zh) 2014-08-27
CN104011685B true CN104011685B (zh) 2016-05-25

Family

ID=51019673

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201280026359.5A Active CN104011685B (zh) 2012-12-26 2012-12-26 一种虚拟机系统的资源管理方法、虚拟机系统和装置

Country Status (4)

Country Link
US (2) US9367340B2 (zh)
EP (1) EP2775399A4 (zh)
CN (1) CN104011685B (zh)
WO (1) WO2014101010A1 (zh)

Families Citing this family (66)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140080058A (ko) * 2012-12-20 2014-06-30 삼성전자주식회사 멀티코어를 위한 로드 밸런싱 방법 및 휴대 단말
KR102012259B1 (ko) * 2013-08-21 2019-08-21 한국전자통신연구원 클라우드 가상 기지국의 자원을 제어하는 방법 및 장치
US9052938B1 (en) * 2014-04-15 2015-06-09 Splunk Inc. Correlation and associated display of virtual machine data and storage performance data
US9423957B2 (en) * 2014-05-02 2016-08-23 Ca, Inc. Adaptive system provisioning
US9483299B2 (en) * 2014-06-30 2016-11-01 Bmc Software, Inc. Capacity risk management for virtual machines
CN105357097A (zh) * 2014-08-19 2016-02-24 中兴通讯股份有限公司 虚拟网络的调节方法及系统
EP2988451A1 (en) * 2014-08-22 2016-02-24 Vodafone IP Licensing limited Method and system for mapping different layouts
CN104184819B (zh) * 2014-08-29 2017-12-05 城云科技(中国)有限公司 多层级负载均衡云资源监控方法
US10867264B2 (en) * 2014-10-31 2020-12-15 Xerox Corporation Methods and systems for estimating lag times in a cloud computing infrastructure
US9923954B2 (en) * 2014-12-16 2018-03-20 International Business Machines Corporation Virtual fencing gradient to incrementally validate deployed applications directly in production cloud computing environment
CN106170767B (zh) * 2014-12-18 2020-05-15 上海朋邦实业有限公司 一种确定虚拟机数量调整操作的装置和方法
JP2016119583A (ja) * 2014-12-22 2016-06-30 株式会社東芝 Ip電話ネットワークシステムとサーバ装置、ip交換機及びリソース容量拡張方法
WO2016146494A1 (en) * 2015-03-13 2016-09-22 Koninklijke Kpn N.V. Method and control system for controlling provisioning of a service in a network
US10951473B1 (en) * 2015-03-25 2021-03-16 Amazon Technologies, Inc. Asynchronous fleet configuration service
CN104881325B (zh) * 2015-05-05 2018-09-21 中国联合网络通信集团有限公司 一种资源调度方法和资源调度系统
US10057187B1 (en) 2015-05-27 2018-08-21 Amazon Technologies, Inc. Dynamic resource creation to connect client resources in a distributed system
US9983857B2 (en) 2015-06-16 2018-05-29 Architecture Technology Corporation Dynamic computational acceleration using a heterogeneous hardware infrastructure
CN106326002B (zh) 2015-07-10 2020-10-20 阿里巴巴集团控股有限公司 资源调度方法、装置及设备
US9860569B1 (en) * 2015-10-05 2018-01-02 Amazon Technologies, Inc. Video file processing
CN106959889A (zh) * 2016-01-11 2017-07-18 阿里巴巴集团控股有限公司 一种服务器资源调整的方法和装置
US9940156B2 (en) * 2016-01-29 2018-04-10 Lenovo Enterprise Solutions (Singapore) Pte. Ltd. Decreasing hardware resource amount assigned to virtual machine as utilization of hardware resource decreases below a threshold
US10152357B1 (en) * 2016-05-02 2018-12-11 EMC IP Holding Company LLC Monitoring application workloads scheduled on heterogeneous elements of information technology infrastructure
CN105975343B (zh) * 2016-05-10 2019-10-15 广东睿江云计算股份有限公司 一种云主机系统中服务质量的控制方法及装置
CN105824708A (zh) * 2016-05-10 2016-08-03 广东睿江云计算股份有限公司 云主机系统中的cpu调度方法及装置
CN105912408A (zh) * 2016-05-10 2016-08-31 广东睿江云计算股份有限公司 云主机系统中的cpu调度方法及装置
CN106027328B (zh) * 2016-05-13 2020-02-07 深圳市中润四方信息技术有限公司 一种基于应用容器部署的集群监控的方法及系统
US10146563B2 (en) * 2016-08-03 2018-12-04 International Business Machines Corporation Predictive layer pre-provisioning in container-based virtualization
CN107977264B (zh) * 2016-10-24 2022-06-10 阿里巴巴集团控股有限公司 一种虚拟机内存资源的调度方法以及装置
CN106970841A (zh) * 2017-03-09 2017-07-21 北京西普阳光教育科技股份有限公司 一种基于云计算的资源限制及动态调整方法
CN108632049B (zh) * 2017-03-15 2020-08-25 华为机器有限公司 用于虚拟网络功能扩容的方法和装置
CN108667859A (zh) * 2017-03-27 2018-10-16 中兴通讯股份有限公司 一种实现资源调度的方法及装置
CN107273182B (zh) * 2017-06-06 2020-05-15 武汉纺织大学 一种虚拟机资源动态扩充方法及系统
CN109032751B (zh) * 2017-06-12 2022-02-11 华为技术有限公司 一种虚拟机部署方法及omm虚拟机
CN109548160A (zh) * 2017-08-08 2019-03-29 中国移动通信有限公司研究院 数据传输方法、装置、相关设备及计算机可读存储介质
CN108306780B (zh) * 2017-09-07 2021-07-20 上海金融期货信息技术有限公司 一种基于云环境的虚拟机通信质量自优化的系统和方法
US10445209B2 (en) * 2017-09-08 2019-10-15 Accenture Global Solutions Limited Prescriptive analytics based activation timetable stack for cloud computing resource scheduling
CN109753338B (zh) * 2017-11-06 2023-03-21 阿里巴巴集团控股有限公司 虚拟gpu使用率的检测方法和装置
CN108039962A (zh) * 2017-12-05 2018-05-15 三盟科技股份有限公司 一种基于大数据环境下的云计算业务资源计算方法及系统
US10922141B2 (en) 2017-12-11 2021-02-16 Accenture Global Solutions Limited Prescriptive analytics based committed compute reservation stack for cloud computing resource scheduling
CN108183824A (zh) * 2017-12-28 2018-06-19 国电南瑞科技股份有限公司 一种云平台的轨道交通综合监控系统双融合的实现方法
US10719344B2 (en) 2018-01-03 2020-07-21 Acceture Global Solutions Limited Prescriptive analytics based compute sizing correction stack for cloud computing resource scheduling
CN108255431B (zh) * 2018-01-11 2020-11-13 中国人民解放军国防科技大学 一种统一管理的、基于策略的低功耗归档分析系统
CN110347473B (zh) * 2018-04-02 2021-11-19 中国移动通信有限公司研究院 一种跨数据中心分布的虚拟化网元虚拟机分配方法及装置
CN110362398B (zh) 2018-04-09 2023-09-12 阿里巴巴集团控股有限公司 虚拟机的调度方法和系统
CN108667654B (zh) * 2018-04-19 2021-04-20 北京奇艺世纪科技有限公司 服务器集群自动扩容方法及相关设备
US11140032B2 (en) * 2018-05-04 2021-10-05 Oracle International Corporation System and method for building idempotent configuration management modules for a cloud Infrastructure Service
CN109885377B (zh) * 2018-11-23 2023-04-28 中国银联股份有限公司 统一资源调度协调器及其创建虚拟机和/或容器的方法、统一资源调度系统
US10459757B1 (en) 2019-05-13 2019-10-29 Accenture Global Solutions Limited Prescriptive cloud computing resource sizing based on multi-stream data sources
KR20200133478A (ko) 2019-05-20 2020-11-30 삼성전자주식회사 클라우드 시스템에서 자원을 조정하기 위한 장치 및 방법
CN111796994B (zh) * 2019-11-20 2022-07-12 华为云计算技术有限公司 时延保证方法、系统及装置、计算设备、存储介质
CN111078362A (zh) * 2019-12-17 2020-04-28 联想(北京)有限公司 一种基于容器平台的设备管理方法及装置
CN111209118A (zh) * 2020-01-14 2020-05-29 北京三快在线科技有限公司 确定资源余量的方法、装置、存储介质和电子设备
US11005924B1 (en) 2020-04-01 2021-05-11 Netapp, Inc. Disparity of quality of service (QoS) settings of volumes across a cluster
US11140219B1 (en) * 2020-04-07 2021-10-05 Netapp, Inc. Quality of service (QoS) setting recommendations for volumes across a cluster
CN113742009B (zh) * 2020-05-28 2024-04-09 深信服科技股份有限公司 桌面云环境资源调度方法、装置、设备及存储介质
CN111786830B (zh) * 2020-07-01 2023-06-13 浪潮云信息技术股份公司 一种云计算环境下的网络质量仿真方法
US20220156124A1 (en) * 2020-08-31 2022-05-19 Turbonomic, Inc. Systems and methods for managing resources in a virtual desktop infrastructure
CN112463357B (zh) * 2020-10-29 2022-07-05 苏州浪潮智能科技有限公司 一种服务器带内数据安全交互的方法和设备
CN112667356B (zh) * 2020-12-30 2023-01-31 上海交通大学 时延可预测的NVMe存储虚拟化方法和系统
CN112667999A (zh) * 2020-12-31 2021-04-16 中电长城网际安全技术研究院(北京)有限公司 虚拟机的执行时间调整方法和装置
US11693563B2 (en) 2021-04-22 2023-07-04 Netapp, Inc. Automated tuning of a quality of service setting for a distributed storage system based on internal monitoring
CN113220400A (zh) * 2021-05-25 2021-08-06 江苏赞奇科技股份有限公司 基于软件定义的云桌面系统质量控制方法
US11941444B2 (en) * 2021-08-27 2024-03-26 Hewlett Packard Enterprise Development Lp Facilitating scheduling of storage system pods on nodes of a cluster based on discovery of local block devices associated with the nodes
US20230362234A1 (en) * 2022-05-04 2023-11-09 Microsoft Technology Licensing, Llc Method and system of managing resources in a cloud computing environment
CN115129484B (zh) * 2022-09-02 2022-11-29 浙江大华技术股份有限公司 集群的扩缩容方法、装置、存储介质及电子装置
CN116893903B (zh) * 2023-09-11 2023-12-08 北京格尔国信科技有限公司 一种加密资源分配方法、系统、设备及存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102317917A (zh) * 2011-06-30 2012-01-11 华为技术有限公司 热点域虚拟机cpu调度方法及虚拟机系统

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8584128B1 (en) * 2007-09-10 2013-11-12 Emc Corporation Techniques for adjusting priorities associated with servicing requests
US20090119673A1 (en) * 2007-11-06 2009-05-07 Credit Suisse Securities (Usa) Llc Predicting and managing resource allocation according to service level agreements
US8433749B2 (en) 2009-04-15 2013-04-30 Accenture Global Services Limited Method and system for client-side scaling of web server farm architectures in a cloud data center
US8261266B2 (en) * 2009-04-30 2012-09-04 Microsoft Corporation Deploying a virtual machine having a virtual hardware configuration matching an improved hardware profile with respect to execution of an application
US8694638B2 (en) * 2009-06-29 2014-04-08 Red Hat Israel Selecting a host from a host cluster to run a virtual machine
US8930731B2 (en) 2009-07-21 2015-01-06 Oracle International Corporation Reducing power consumption in data centers having nodes for hosting virtual machines
CN101719082B (zh) * 2009-12-24 2013-01-02 中国科学院计算技术研究所 虚拟化计算平台中应用请求调度的方法及其系统
US8589555B2 (en) * 2010-01-11 2013-11-19 Nec Laboratories America, Inc. Virtualization and consolidation analysis engine for enterprise data centers
US8433802B2 (en) * 2010-01-26 2013-04-30 International Business Machines Corporation System and method for fair and economical resource partitioning using virtual hypervisor
US8606667B2 (en) * 2010-02-26 2013-12-10 Red Hat, Inc. Systems and methods for managing a software subscription in a cloud network
US8464255B2 (en) * 2010-03-12 2013-06-11 Microsoft Corporation Managing performance interference effects on cloud computing servers
US8572612B2 (en) * 2010-04-14 2013-10-29 International Business Machines Corporation Autonomic scaling of virtual machines in a cloud computing environment
US8645529B2 (en) * 2010-10-06 2014-02-04 Infosys Limited Automated service level management of applications in cloud computing environment
CN102307224A (zh) * 2011-05-17 2012-01-04 华为软件技术有限公司 云计算系统中业务隔离的实现方法及装置、云服务器
US8769531B2 (en) * 2011-05-25 2014-07-01 International Business Machines Corporation Optimizing the configuration of virtual machine instances in a networked computing environment
CN102419718A (zh) * 2011-10-28 2012-04-18 浪潮(北京)电子信息产业有限公司 资源调度方法
US9038065B2 (en) * 2012-01-30 2015-05-19 International Business Machines Corporation Integrated virtual infrastructure system
US8881149B2 (en) * 2012-04-11 2014-11-04 International Business Machines Corporation Control of java resource runtime usage

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102317917A (zh) * 2011-06-30 2012-01-11 华为技术有限公司 热点域虚拟机cpu调度方法及虚拟机系统

Also Published As

Publication number Publication date
US9405563B2 (en) 2016-08-02
US20150324232A1 (en) 2015-11-12
US9367340B2 (en) 2016-06-14
US20140344810A1 (en) 2014-11-20
CN104011685A (zh) 2014-08-27
WO2014101010A1 (zh) 2014-07-03
EP2775399A4 (en) 2015-04-29
EP2775399A1 (en) 2014-09-10

Similar Documents

Publication Publication Date Title
CN104011685B (zh) 一种虚拟机系统的资源管理方法、虚拟机系统和装置
US10120668B2 (en) Optimizing resource usage and automating a development and operations deployment pipeline
CN102103516B (zh) 基于虚拟cpu的频率和电压调节
CN105740074B (zh) 一种基于云计算的虚拟机负载均衡方法
CN102301370B (zh) 用于集成容量规划和工作负荷管理的系统和方法
CN103180830B (zh) 中央处理器资源分配方法和计算节点
EP2524277B1 (en) Methods and apparatus for coordinated energy management in virtualized data centers
CN103064746B (zh) 基于当前credit进行预测调度的处理器资源精确分配方法
CN104641313A (zh) 管理和撤销通过总线接口分配的功率
CN102385541A (zh) 受控的数据中心服务的自动复原
US20170017511A1 (en) Method for memory management in virtual machines, and corresponding system and computer program product
CN103116473A (zh) 使用盘驱动器模拟模型来对盘i/o扼流
US20150058844A1 (en) Virtual computing resource orchestration
WO2015009318A1 (en) Virtual machine resource management system and method thereof
US9953276B2 (en) Method and system that measures and reports computational-resource usage in a data center
CN103399781A (zh) 云服务器及其虚拟机管理方法
CN103077079A (zh) 虚拟机迁移控制方法和装置
CN107864211A (zh) 集群资源调度方法及系统
CN106815067A (zh) 带i/o虚拟化的虚拟机在线迁移方法、装置
US10394612B2 (en) Methods and systems to evaluate data center performance and prioritize data center objects and anomalies for remedial actions
CN107992351A (zh) 一种硬件资源分配方法及装置、电子设备
CN107203256A (zh) 一种网络功能虚拟化场景下的节能分配方法与装置
CN106126319A (zh) 中央处理器资源分配方法和计算节点
US10275284B2 (en) Datacenter resource allocation based on estimated capacity metric
CN104040477A (zh) 一种存储资源调度方法及终端

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant